CN114036398B - 内容推荐和排序模型训练方法、装置、设备以及存储介质 - Google Patents

内容推荐和排序模型训练方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN114036398B
CN114036398B CN202111443352.0A CN202111443352A CN114036398B CN 114036398 B CN114036398 B CN 114036398B CN 202111443352 A CN202111443352 A CN 202111443352A CN 114036398 B CN114036398 B CN 114036398B
Authority
CN
China
Prior art keywords
model
sub
feature data
dimension
scene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111443352.0A
Other languages
English (en)
Other versions
CN114036398A (zh
Inventor
夏晓玲
徐伟
曹丞泰
陈坤斌
何伯磊
和为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202111443352.0A priority Critical patent/CN114036398B/zh
Publication of CN114036398A publication Critical patent/CN114036398A/zh
Priority to KR1020220144752A priority patent/KR20220154062A/ko
Priority to JP2022177444A priority patent/JP2023017921A/ja
Priority to EP22210615.5A priority patent/EP4134900A3/en
Application granted granted Critical
Publication of CN114036398B publication Critical patent/CN114036398B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/045Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute

Abstract

本公开提供了内容推荐和排序模型训练方法、装置、设备以及存储介质,涉及计算机技术领域,尤其涉及大数据、深度学习、智能搜索技术领域。具体实现方案为:确定待推荐场景;从至少两个子模型中选择待推荐场景对应的目标子模型;其中,至少两个子模型包括至少两个维度的子模型,针对至少两个维度,至少两个维度的子模型是基于通用特征数据和至少两个维度的特征数据训练得到的;通用特征数据和至少两个维度的特征数据是基于行为信息构建的;行为信息包括至少两个场景的行为信息;利用各个目标子模型的组合,针对待推荐场景进行内容推荐。本公开不需要针对每个场景都构建一个排序模型,简化模型训练及推荐过程。

Description

内容推荐和排序模型训练方法、装置、设备以及存储介质
技术领域
本公开涉及计算机技术领域,尤其涉及大数据、深度学习、智能搜索技术领域。
背景技术
随着计算机技术的飞速发展,越来越多的内容需要通过计算机处理来获取,在处理完后再通过网络进行传输;而且越来越多的场景下需要对用户进行内容推荐,比如新闻、视频或者广告的推荐等。
发明内容
本公开提供了一种内容推荐和排序模型训练方法、装置、设备以及存储介质。
根据本公开的第一方面,提供了一种内容推荐方法,包括:
确定待推荐场景;
从至少两个子模型中选择所述待推荐场景对应的目标子模型;其中,所述至少两个子模型包括至少两个维度的子模型,针对至少两个维度,所述至少两个维度的子模型是基于通用特征数据和所述至少两个维度的特征数据训练得到的;所述通用特征数据和至少两个维度的特征数据是基于行为信息构建的;行为信息包括至少两个场景的行为信息;
利用各个目标子模型的组合,针对所述待推荐场景进行内容推荐。
根据本公开的第二方面,提供了一种排序模型训练方法,包括:
获取至少两个场景的行为信息;
基于所述行为信息构建特征数据,所述特征数据包括通用特征数据和至少两个维度的特征数据;
针对至少两个维度,基于所述通用特征数据和所述至少两个维度的特征数据训练所述至少两个维度的子模型。
根据本公开的第三方面,提供了一种内容推荐装置,包括:
确定模块,用于确定待推荐场景;
选择模块,用于从至少两个子模型中选择所述待推荐场景对应的目标子模型;其中,所述至少两个子模型包括至少两个维度的子模型,针对至少两个维度,所述至少两个维度的子模型是基于通用特征数据和所述至少两个维度的特征数据训练得到的;所述通用特征数据和至少两个维度的特征数据是基于行为信息构建的;行为信息包括至少两个场景的行为信息;
推荐模块,用于利用各个目标子模型的组合,针对所述待推荐场景进行内容推荐。
根据本公开的第四方面,提供了一种排序模型训练装置,包括:
获取模块,用于获取至少两个场景的行为信息;
特征构建模块,用于基于所述行为信息构建特征数据,所述特征数据包括通用特征数据和至少两个维度的特征数据;
子模型训练模块,用于针对至少两个维度,基于所述通用特征数据和所述至少两个维度的特征数据训练所述至少两个维度的子模型。
根据本公开的第五方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
根据本公开的第六方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第二方面所述的方法。
根据本公开的第七方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面所述的方法。
根据本公开的第八方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第二方面所述的方法。
根据本公开的第九方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面所述的方法。
根据本公开的第十方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第二方面所述的方法。
本公开可以基于多个子模型进行灵活地组合,以实现对各场景有针对性地进行推荐,不需要每个场景单独构造排序模型。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开实施例提供的内容推荐方法的一种流程图;
图2是本公开实施例提供的内容推荐方法的另一种流程图;
图3是本公开实施例提供的内容推荐方法的又一种流程图;
图4是本公开实施例提供的排序模型训练方法的流程图;
图5是应用本公开实施例提供的排序模型训练方法的示意图;
图6是本公开实施例提供的内容推荐装置的一种结构示意图;
图7是本公开实施例提供的内容推荐装置的另一种结构示意图;
图8是本公开实施例提供的内容推荐装置的又一种结构示意图;
图9是本公开实施例提供的排序模型训练装置的一种结构示意图;
图10是本公开实施例提供的排序模型训练装置的另一种结构示意图;
图11是用来实现本公开实施例的内容推荐方法的电子设备的框图;
图12是用来实现本公开实施例的排序模型训练方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
可以直接使用同一个推荐模型进行内容推荐或各个推荐场景构建单独的推荐模型进行内容推荐。但是,所有推荐场景均直接使用同一个推荐模型无法适应各个场景中用户兴趣偏好、物料类型等的不同,推荐效果不佳。而各场景分别构建推荐模型,构建过程中,针对一场景推荐模型的构建,仅能利用该产场景下产生的历史用户行为数据作为训练数据进行训练,各独立场景下用户行为数据较少,训练数据较少不利于模型学习,且无法利用不同场景中的共通点。
基于所有推荐场景均直接使用同一个推荐模型无法适应各个场景中用户兴趣偏好、物料类型等的不同,推荐效果不佳的问题,以及各个场景独立训练推荐模型难以学习到鲁棒的深度学习模型的问题,本公开实施例中考虑到:若把不同场景的数据融合在一起学习,能构建更大的训练数据集,帮助模型学习,且能利用不同模型的共通点,更全面地刻画用户兴趣。
基于此,本公开实施例中使用多场景的用户行为数据一次性训练层次化模型,即至少两个维度的至少两个子模型,在不同场景通过灵活配置得到不同侧重点的排序模型,即基于多个子模型进行灵活地组合,以实现对各场景有针对性地进行推荐,如可以得到与场景匹配的排序模型,如此,不需要每个场景单独构造排序模型。另外,使用多个场景数据,能够更全面地刻画用户,挖掘深层次用户特点,可以提高推荐的效果。
下面对本公开实施例提供的内容推荐方法进行详细说明。
本公开实施例提供的内容推荐方法可以应用于电子设备,具体地,电子设备可以包括服务器、终端等等。
本公开实施例提供了一种内容推荐方法,可以包括:
确定待推荐场景;
从至少两个子模型中选择待推荐场景对应的目标子模型;其中,至少两个子模型包括至少两个维度的子模型,针对至少两个维度,至少两个维度的子模型是基于通用特征数据和至少两个维度的特征数据训练得到的;通用特征数据和至少两个维度的特征数据是基于行为信息构建的;行为信息包括至少两个场景的行为信息;
利用各个目标子模型的组合,针对待推荐场景进行内容推荐。
本公开实施例中,在确定待推荐场景后,可以从至少两个预先训练好的子模型中选择待推荐场景对应的目标子模型,利用各个目标子模型的组合,针对待推荐场景进行内容推荐,即可以基于多个子模型进行组合以针对该待推荐场景进行推荐,如此,不需要针对每个场景都构建一个排序模型,可以简化推荐过程。
同时,还可以避免各个场景使用相同的排序模型,无法适应各个场景中用户兴趣偏好、物料类型等的不同,推荐效果不佳的问题,提高推荐效果。
另外,利用多个场景的行为信息构建特征数据,并基于这些特征数据训练得到不同维度的子模型,可以利用数量较多的训练数据进行模型训练,充分利用各个场景下的行为信息进行模型的训练,提高模型的学习能力,使得训练得到的模型性能更好,进而使得排序及推荐性能更好。
图1是本公开实施例提供的内容推荐方法的流程图。参见图1,本公开实施例提供的内容推荐方法可以包括:
S101,确定待推荐场景。
简单理解,待推荐场景可以表示待向何种场景下的用户推荐内容。
一种可实现方式中,可以预先保存各个推荐场景的场景信息,在获取到当前推荐所处场景的场景信息后,将该场景信息与已经保存的各个推荐的场景信息进行比对,若该场景信息与某一推荐场景的场景信息的匹配度大于预设匹配度阈值,则可以确定当前待推荐场景为与该场景信息的匹配度大于预设匹配度阈值的场景信息所对应的推荐场景。
待推荐场景可以是任意需要推荐的场景。例如,可以包括办公领域下的推荐场景,如内部学习视频的推荐场景、论坛帖子推荐场景、同事动态推荐场景等等。
S102,从至少两个子模型中选择待推荐场景对应的目标子模型。
其中,至少两个子模型包括至少两个维度的子模型。
针对至少两个维度,至少两个维度的子模型是基于通用特征数据和至少两个维度的特征数据训练得到的。
简单理解,针对每一维度的子模型,该维度的子模型是基于通用特征数据和该维度的特征数据训练得到的。
通用特征数据和至少两个维度的特征数据是基于行为信息构建的;行为信息包括至少两个场景的行为信息。
行为信息可以表示多个用户针对多个物料的行为信息。
例如,子模型包括子模型1、子模型2、子模型3和子模型4,针对该待推荐场景,选择目标子模型:子模型1、子模型2和子模型3作为该待推荐场景的目标子模型。
不同子模型的侧重点不同,可以根据实际应用中待推荐场景与各个子模型的相关度选择待推荐场景的目标子模型。其中,不同场景需要推荐的数据的类型(视频、图片、文字)不同、需要推荐数据的主题不同、用户有不同的偏好等,可以基于待推荐场景需要推荐的数据的类型、需要推荐数据的主题不同、用户的偏好等确定推荐场景与不同子模型的相关度。
一种可实现方式中,本公开实施例中预先训练得到的子模型包括:社交子模型、技能子模型、兴趣子模型和时效子模型。其中,训练得到社交子模型、技能子模型、兴趣子模型和时效子模型的过程可以包括:获取多个场景的行为信息;基于行为信息构建特征数据,特征数据包括通用特征数据和至少两个维度的特征数据,其中,通用特征数据包括行为信息中用户和物料的标识信息;基于通用特征数据和社交特征数据训练社交子模型。基于通用特征数据和技能特征数据训练技能子模型。基于通用特征数据和兴趣特征数据训练兴趣子模型。基于通用特征数据和时效特征数据训练时效子模型。
不同场景需要推荐的数据的类型(视频、图片、文字)不同、需要推荐数据的主题不同、用户有不同的偏好等,例如,针对内部学习视频的推荐场景,需要推荐数据的主题一般是技术学习类数据,该场景下用户的偏好与用户职位关系强。针对论坛帖子推荐场景,需要推荐数据的主题,一般是生活、产品等讨论类数据,改后藏镜下用户的偏好与用户的生活兴趣关联强;针对同事动态推荐场景,一般需要推荐的数据的类型是短文本、图片、小视频,需要推荐数据的主题,一般是用户主动分享的生活工作相关数据,该场景下用户的偏好与用户社交关系管关联强。
可以基于待推荐场景需要推荐的数据的类型、需要推荐数据的主题、用户的偏好等确定推荐场景与不同子模型的相关度,进而,可以基于待推荐场景与不同子模型的相关度选择待推荐场景的目标子模型。例如,同事动态场景与社交维度、兴趣维度和时效维度相关度比较高,则可以选择社交维度对应的社交子模型、兴趣维度对应的兴趣子模型和时效维度对应时效子模型作为同事动态场景对应的目标子模型。例如,学习视频推荐场景与社交维度、技能维度、兴趣维度和时效维度相关度均比较高,则可以选择社交维度对应的社交子模型、技能维度对应的技能子模型、兴趣维度对应的兴趣子模型和时效维度对应时效子模型作为学习视频推荐场景对应的目标子模型。
S103,利用各个目标子模型的组合,针对待推荐场景进行内容推荐。
可以选择所有子模型作为目标子模型,基于所有子模型进行组合,并利用所有子模型的组合进行推荐;或者,也可以选择子模型中的部分子模型作为目标子模型,基于部分子模型进行组合,并利用部分子模型的组合进行推荐。
例如,针对各个物料,将该物料分别输入各个目标子模型,然后,基于各个目标子模型的输出计算预测用户对物料的行为,例如,每个目标子模型均可以输出一个预测分数,基于所有目标子模型的预测分数最终计算出一个预测分数作为用户针对该物料的分数。对各个物料的该分数进行排序,基于排序结果进行内容推荐,例如,选择分数最高的物料推荐给用户。
在进行组合的过程中,不同的目标子模型的比例不同,具体地可以通过目标子模型的权重来体现,具体地,可以针对各个物料,结合各个目标子模型的模型权重计算所有目标子模型的预测分数的加权得分,例如,每一目标子模型输出的预测分数与该目标子模型的模型权乘积之和。对各个物料的加权得分进行排序,并基于排序结果进行推荐,例如,将加权得分最高的物料推荐给用户。
其中,模型权重可以在选择目标子模型后为各个目标子模型配置对应的模型权重。或者,可以在选择目标子模型的过程中配置模型权重。目标子模型的模型权重可以基于待推荐场景与目标子模型的相关度的高低程度确定,例如,待推荐场景与目标子模型的相关度越高,则该目标子模型的模型权重越大,待推荐场景与目标子模型的相关度越低,则该目标子模型的模型权重越小。
一种可选的实施例中,本公开实施例中利用各个目标子模型的组合得到该待推荐场景对应的排序模型,然后,利用该排序模型针对该待推荐场景进行内容推荐。简单理解,基于目标子模型先构建排序模型,然后利用该排序模型针对该待推荐场景进行内容推荐。
例如,针对同事动态场景选择社交维度对应的社交子模型、兴趣维度对应的兴趣子模型和时效维度对应时效子模型进行组合得到同事动态场景最终的排序模型,利用该排序模型针对同事动态场景进行内容推荐。
例如,针对学习视频推荐场景选择社交维度对应的社交子模型、技能维度对应的技能子模型、兴趣维度对应的兴趣子模型和时效维度对应时效子模型进行组合得到学习视频推荐场景最终的排序模型,利用该排序模型针对学习视频推荐场景进行内容推荐。
一种可实现方式中,可以针对各个用户,利用排序模型对该用户针对多个物料的行为预测分数,选择分数较高的物料推荐给该用户,如选择最高分数所对应的物料推荐给该用户。
另一种可实现方式中,可以为目标子模型配置不同的模型权重,基于各个目标子模型以及该目标子模型的模型权重构建待推荐场景对应的排序模型。即可以基于目标子模型以及目标子模型的模型权重构建排序模型,并利用排序模型针对待推荐场景进行内容推荐。
可以针对多个物料,将该物料分别输入待推荐场景对应的目标子模型,各个子模型分别输出针对该物料的预测分数,该预测分数可以表示用户可能对物料进行行为操作的概率,该排序模型用于计算各个目标子模型输出的预测分数的加权得分。
本公开实施例中,从多个场景的行为信息构建特征数据,基于这些特征数据构建至少两个子模型,在不同场景下可以选择子模型进行组合,以进行排序并推荐,如此,不需要针对每个场景都构建一个排序模型,简化推荐过程。另外,使用各个场景的数据作为训练数据,训练各子模型,可以更全面地刻画用户,如此,基于这些子模型进行推荐可以提高推荐效果。
一种可选的实施例中,如图2所示,本公开实施例提供的用户推荐方法还可以包括:
S201,接收各个子模型的模型权重。
例如,可以提供输入界面;接收利用输入界面输入的各个子模型的模型权重。
一种可实现方式中,输入界面中可以包括各个子模型对应的模型权重输入框,内容提供方后台,例如,后台工作人员可以在输入框输入该待推荐场景下各个子模型的模型权重,如此,电子设备可以接收到利用输入界面输入的各个子模型的模型权重。
不同场景的侧重点不同,即可以理解为不同场景与不同子模型的相关度是不同的,可以根据场景与不同子模型的相关度为子模型配置对应的模型权重。为了便于理解,方便计算,一般情况下,模型权重的范围在【0,1),且各个子模型的模型权重的和为1。其中,当子模型的权重为0,则表示待推荐场景与该子模型不相关,可以理解针对该待推荐场景,未选择该子模型作为该待推荐场景的目标子模型。换句话说,本公开实施例中,将子模型权重不为零的子模型作为该待推荐场景对应的目标子模型。
S102可以包括:
针对各个子模型,响应于子模型的模型权重不为零,将子模型作为目标子模型。
选择得到目标子模型后,可以基于目标子模型以及目标子模型的模型权重的组合,针对该待推荐场景进行内容推荐。
针对多个物料,将该物料分别输入各个目标子模型,各个目标子模型分别输出针对该物料的预测分数,该预测分数可以表示用户可能对物料进行行为操作的概率,然后,计算每一目标子模型与该目标子模型的模型权重的乘积,并将各个目标子模型对应的乘积相加,即得到各个目标子模型输出的预测分数的加权得分,每一物料分别计算得到其对应的加权得分,对所有物料的加权得分进行排序,可以依据排序结果进行推荐,如选择加权得分最高的物料推荐给用户。
一种可实现方式中,可以基于目标子模型以及目标子模型的模型权重,构建排序模型。
接收到利用输入界面输入的各个子模型的模型权重后,可以先判断各个子模型的模型权重是否为零,选择模型权重不为零的子模型作为待推荐场景的目标子模型,然后,基于模型权重,将各个目标子模型进行组合得到待推荐场景对应的排序模型。
这种情况下,可以针对待推荐场景灵活地配置各个子模型的模型权重,进而确定出待推荐场景对应的目标子模型,基于子模型以及模型权重组合得到待推荐场景对应的排序模型,不需要针对各个场景单独训练排序模型,简化模型训练以及推荐过程。且基于目标子模型以及目标子模型的模型权重组合可以得到与待推荐场景匹配的排序模型,使得基于该排序模型进行推荐可以更适合该待推荐场景,提高推荐效果。
另一种可选的实施例中,如图3所示,本公开实施例提供的内容推荐方法还可以包括:
S301,获取预先训练得到的各个子模型的通用模型权重。
其中,各个子模型的通用模型权重可以是基于各个子模型以及训练子模型时用到的所有特征数据进行训练得到的,具体地训练得到通用模型权重的过程在下述实施例中会进行详细说明,这里先不赘述。
S302,针对待推荐场景,调整预先训练得到的各个子模型的通用模型权重,得到待推荐场景对应的各个目标子模型的模型权重。
可以在通用模型权重的基础上进行调整,可以依据各个子模型的通用模型权重的大小比例关系,利用各待推荐场景与各个子模型的相关度对通用模型权重进行调整,得到待推荐场景对应的各模型权重。例如,包括3个子模型,3个子模型分别对应的通用模型权重为0.1、0.3和0.6,针对一待推荐场景,基于待推荐场景需要推荐的数据的类型、需要推荐数据的主题、用户的偏好等确定推荐场景与子模型2的相关度的较低,则可以将子模型2的模型权重调高,例如,调整为0.2、0.2和0.6。
如此,可以基于目标子模型以及目标子模型的模型权重的组合,针对该待推荐场景进行内容推荐。
一种可实现方式中,可以基于目标子模型以及目标子模型的模型权重,构建排序模型。
本公开实施例中,可以参考预先训练得到的各个子模型的通用模型权重而针对待推荐场景,调整得到待推荐场景对应的各个目标子模型的模型权重。
本公开实施例提供了一种排序模型训练方法,可以包括:
获取至少两个场景的行为信息;
基于行为信息构建特征数据,特征数据包括通用特征数据和至少两个维度的特征数据;
针对至少两个维度,基于通用特征数据和至少两个维度的特征数据训练至少两个维度的子模型。
本公开实施例中,可以利用至少两个场景的行为信息构建特征数据,并基于这些特征数据训练得到至少两个维度的至少两个子模型,可以训练得到通用的子模型,如此,可以使得在待推荐过程中,可以针对不同推荐场景灵活地选择子模型进行组合并进行推荐,无需针对各个推荐场景再分别训练排序模型,简化排序及推荐过程。
另外,待选择的各个子模型是基于多个场景的行为信息构建的特征数据进行训练得到的,可以利用数量较多的训练数据进行模型训练,充分利用各个场景下的行为信息进行模型的训练,提高模型的学习能力,使得训练得到的模型性能更好,进而使得排序及推荐性能更好。同时,还可以避免各个场景使用相同的排序模型,无法适应各个场景中用户兴趣偏好、物料类型等的不同,推荐效果不佳的问题,提高推荐效果。
图4是本公开实施例提供的排序模型训练方法的流程图。参见图4,本公开实施例提供的排序模型训练方法,可以包括:
S401,获取至少两个场景的行为信息。
其中,行为信息表示用户针对物料的行为信息。
针对每一场景,均可以获取多个行为信息。一个行为信息可以理解为表示一用户针对一物料的行为信息,多个行为信息可以表示多个用户针对多个物料的行为信息。
至少两个场景的行为信息也可以理解为训练数据,即可以使用多场景埋点日志进行训练数据的构建。
可以针对各个场景,收集该场景的行为日志,也可以理解为收集该场景下的行为信息。
至少两个场景的行为信息可以包括:针对各个场景,该场景下用户的id(标识)、物料的id、画像、物料的特征、对应的场景id、行为的时间、以及具体行为如点击、点赞、评论、收藏等。
S402,基于行为信息构建特征数据。
特征数据包括通用特征数据和至少两个维度的特征数据。
其中,通用特征数据包括行为信息中用户和物料的标识信息。
针对各个行为信息,该行为信息可以理解为包含通用特征数据和至少两个维度的特征数据,其中,可以从不同角度进行维度的划分。例如,维度可以包括用户维度和物料维度,或者,也可以包括社交维度、技能维度、时效维度、兴趣维度等。
基于行为信息构建特征数据,具体地,可以是针对各个行为信息,从通用角度以及至少两个维度,提取该行为信息中该维度下的特征数据。也可以理解为,针对每一行为信息,将该行为信息划分为包括通用特征数据和至少两个维度的特征数据。
通用特征数据包括从多个行为信息中提取出的通用特征数据,至少两个维度的特征数据也是包括从多个行为信息中分别提取出的该维度下的特征数据。
S403,针对至少两个维度,基于通用特征数据和至少两个维度的特征数据训练至少两个维度的子模型。
可以是针对每一维度,基于通用特征数据和该维度的特征数据训练该维度的子模型,如此,可以训练得到至少两个维度中各个维度的子模型。
子模型可以用于预测用户对物料的行为。例如,子模型可以输出用户针对物料进行行为的预测分数。
例如,包括维度一、维度二和维度三,则针对维度一,基于通用特征数据和维度一的特征数据训练维度一的子模型,即基于通用特征数据和从多个行为信息中分别提取出的维度一下的特征数据,训练维度一的子模型,该子模型可以称之为维度一子模型;针对维度二,基于通用特征数据和维度二的特征数据训练维度二的子模型,即基于通用特征数据和从多个行为信息中分别提取出的维度二下的特征数据,训练维度二的子模型,该子模型可以称之为维度二子模型;针对维度三,基于通用特征数据和维度三的特征数据训练维度三的子模型,即基于通用特征数据和从多个行为信息中分别提取出的维度三下的特征数据,训练维度三的子模型,该子模型可以称之为维度三子模型,如此,可以训练得到三个维度分别对应的子模型:维度一子模型、维度二子模型和维度三子模型。
如此,在推荐过程中,在确定待推荐场景后,可以从至少两个子模型中选择待推荐场景对应的目标子模型,如从维度一子模型、维度二子模型和维度三子模型选择待推荐场景对应的目标子模型,并基于目标子模型构建待推荐场景对应的排序模型,并利用排序模型针对待推荐场景进行内容推荐。具体地,从至少两个子模型中选择目标子模型构建待推荐场景对应的排序模型并进行推荐的过程在上述实施例中已经进行了详述,这里不再赘述。
子模型可以是深度学习模型,本公开实施例不对子模型的结构等进行限制。一种可实现方式中,子模型可以为wide&deep模型,是由单层的wide部分和多层的deep部分组成的混合模型。其中,wide部分的主要作用是让模型具有较强的“记忆能力”;deep部分的主要作用是让模型具有“泛化能力”,正是这样的结构特点,使模型兼具了逻辑回归和深度神经网络的优点。本公开实施例中子模型采用这种结构,即可以使得子模型能够兼具逻辑回归和深度神经网络。
一种可实现方式中,可以对特征数据进行标注,例如,针对各个维度的特征数据,标注针对该维度的特征数据的用户行为,将标注的针对该维度的特征数据的用户行为理解为真值。
具体地,针对某一维度,先选择一深度学习模型作为初始模型,将通用特征数据和该维度的特征数据以及对应的真值输入该初始模型,通过调整模型参数,使得初始模型的输出与该真值之间的差异小于预设差异值,针对该维度下的多个特征数据分别执行上述调整模型参数的过程,针对该维度下的一个特征数据执行上述调整模型参数的过程可以理解为一次迭代,当迭代次数到达预设次数,具体地预设次数根据实际需求或经验等确定,如1000次、2000次等,或者,模型的输出与真值之间的差异收敛,多次迭代下模型的输出与真值之间的差异不再变化,则结束训练过程,得到训练好的该维度下的子模型。
这里的针对某一维度下的子模型的训练过程仅是示例性说明,本公开实施例中可以采用任意可以实现的模型的训练过程,本公开实施例不对具体的训练方式进行限制。每一维度对应的子模型的训练过程均可以参考上述模型训练过程,或者,不同的维度训练其对应的子模型的训练过程可以采用不同的训练方式均是可以的。
如此,可以基于多个场景下的行为信息训练得到不同维度的子模型,每个子模型的训练过程中都考虑了多个场景下的行为信息,使得模型训练过程中所依赖的训练数据更丰富,提高了模型的学习能力,提升了训练得到的模型的性能。且综合考虑了多个场景下的行为信息,可以更加丰富地刻画用户,考虑了多个场景下行为信息之间的共同点和联系,能够使得模型训练的更加准确,进而提升依据这些子模型进行推荐时的推荐效果。
办公领域下,各推荐场景之间存在不同,不同场景需要推荐的数据的类型(视频、图片、文字)不同、需要推荐数据的主题不同、用户有不同的偏好等。例如,针对内部学习视频的推荐场景,需要推荐数据的主题一般是技术学习类数据,该场景下用户的偏好与用户职位关系强。针对论坛帖子推荐场景,需要推荐数据的主题,一般是生活、产品等讨论类数据,改后藏镜下用户的偏好与用户的生活兴趣关联强;针对同事动态推荐场景,一般需要推荐的数据的类型是短文本、图片、小视频,需要推荐数据的主题,一般是用户主动分享的生活工作相关数据,该场景下用户的偏好与用户社交关系管关联强。同时,各推荐场景也存在联系,例如,各推荐场景的用户的集合一致,都为公司内部员工;且不同推荐场景的兴趣有交集和深层联系。基于此,一种可选的实施例中,本公开实施例提供的排序模型训练方法可以应用于办公领域,场景可以包括办公领域下的内部学习视频的推荐场景、论坛帖子推荐场景、同事动态推荐场景等等。
本公开实施例中获取多个场景的行为信息可以包括获取内部学习视频的推荐场景、论坛帖子推荐场景、同事动态推荐场景等的行为信息,并基于这些场景下的行为信息训练子模型。
S402可以包括:
针对各个行为信息,提取行为信息中的标识信息,作为行为信息对应的通用特征数据;分别从至少两个维度中提取行为信息中与至少两个维度一一对应的特征数据。
其中,至少两个维度包括以下至少两项:社交维度、技能维度、兴趣维度、时效维度。
具体地,可以针对各个行为信息,提取行为信息中的用户标识信息、物料标识信息、物料作者标识信息和场景标识信息,并将行为信息中的用户标识信息、物料标识信息、物料作者标识信息和场景标识信息,作为行为信息对应的通用特征数据。
例如,通用特征:用户的唯一标识;物料的唯一标识;物料作者的唯一标识;场景id。
社交特征:通过同部门用户集合、亲密用户集合,以及用户对物料的(发布、点赞、评论)行为进行计算;同部门用户权重为1,亲密用户权重为亲密度(0~1),亲密用户数据可从聊天数据等进行挖掘;最终特征为物料发布人的权重,点赞人的数量、权重之和,评论人的数量、权重之和等。
技能特征:职位信息,部门技能标签,个人技能标签,物料部门标签,物料技能标签。
兴趣特征:用户兴趣标签,物料兴趣标签,标签分为多个角度的描述标签,例如粗粒度标签、细粒度标签等。
时效特征:行为时间,物料发布时间,物料被评论和/或点赞时间。
S403可以包括:
针对社交维度,基于通用特征数据和社交特征数据训练社交子模型。
针对技能维度,基于通用特征数据和技能特征数据训练技能子模型。
针对兴趣维度,基于通用特征数据和兴趣特征数据训练兴趣子模型。
针对时效维度,基于通用特征数据和时效特征数据训练时效子模型。
具体地针对各个维度进行训练得到该维度对应的子模型的过程在上述实施例中已经进行了详述,针对社交维度训练社交子模型,针对技能维度,训练技能子模型,针对兴趣维度,训练兴趣子模型,以及针对时效维度训练时效子模型过程中可以参照上述针对各个维度进行训练得到该维度对应的子模型的过程,这里不再赘述。
针对社交维度,基于通用特征数据和社交特征数据训练社交子模型,只需要维度具体为社交维度;并将训练过程中所使用的维度对应的特征数据,具体为社交特征数据,并基于通用特征数据和社交特征数据即可训练得到社交子模型。
针对技能维度,基于通用特征数据和技能特征数据训练技能子模型,只需要维度具体为技能维度;并将训练过程中所使用的维度对应的特征数据,具体为技能特征数据,并基于通用特征数据和技能特征数据即可训练得到技能子模型。
针对兴趣维度,基于通用特征数据和兴趣特征数据训练兴趣子模型,只需要维度具体为兴趣维度;并将训练过程中所使用的维度对应的特征数据,具体为兴趣特征数据,并基于通用特征数据和兴趣特征数据即可训练得到兴趣子模型。
针对时效维度,基于通用特征数据和时效特征数据训练时效子模型,只需要维度具体为时效维度;并将训练过程中所使用的维度对应的特征数据,具体为时效特征数据,并基于通用特征数据和时效特征数据即可训练得到时效子模型。
可以从多个物料中选择物料向内容推荐,物料即可以理解为待向用户推荐的内容。例如,可以是视频、文字、音频等等。
针对一物料,该物料的物料标识信息用于区分该物料与其他物料。物料作者标识信息可以是创作、上传物料的用户的信息。
分别从社交维度、技能维度、兴趣维度和时效维度,提取行为信息中社交维度对应的社交特征数据、技能维度对应的技能特征数据、兴趣维度对应的兴趣特征数据和时效维度对应的时效特征数据。
社交维度即从用户的社交属性考虑的维度。例如,考虑与该用户交互频繁的用户的行为、与该用户同部门的用户的行为等信息的维度。
基于通用特征数据和社交特征数据训练得到的社交子模型可以理解为社交维度对应的社交子模型,侧重从社交属性预测用户对物料的行为,也可以理解为侧重利用社交特征数据向用户推荐内容。
技能维度指的是考虑用户的技能信息的维度,例如,考虑用户的技能、用户所处部门的技能如视频生成部门所涉及的视频处理的技能等信息的维度。
基于通用特征数据和技能特征数据训练得到的技能子模型可以理解为技能维度对应的技能子模型,侧重从技能信息的维度预测用户对物料的行为,也可以理解为侧重利用技能特征数据向用户推荐内容。
时效维度指的是考虑用户行为时间、物料相关时间如物料发布时间、被点赞或/或评论的时间等信息的维度。
基于通用特征数据和时效特征数据训练得到的技能子模型可以理解为时效维度对应的时效子模型,侧重从时间的维度预测用户对物料的行为,也可以理解为侧重利用时效特征数据向用户推荐内容。
兴趣维度指的是考虑用户兴趣的维度,例如,用户点击频繁的物料等等。
基于通用特征数据和兴趣特征数据训练得到的兴趣子模型可以理解为兴趣维度对应的兴趣子模型,侧重从感兴趣的角度预测用户对物料的行为,也可以理解为侧重利用兴趣特征数据向用户推荐内容。
如图5所示,通过多个场景的行为信息,构建的用户和物料的特征包括:社交特征、技能特征、兴趣特征、时效特征和通用特征,基于社交特征和通用特征训练得到社交子模型,基于技能特征和通用特征训练得到技能子模型,基于兴趣特征和通用特征训练得到兴趣子模型,基于时效特征和通用特征训练得到时效子模型。
可以利用办公领域下多个推荐场景的不同以及联系,训练得到适用于办公领域的子模型社交子模型、技能子模型、兴趣子模型和时效子模型,针对办公领域下的推荐场景,可以针对各个推荐场景,灵活地选择子模型进行组合,以针对办公领域下的推荐场景进行更加匹配的推荐,提高推荐效果,且可以避免针对各个推荐场景都训练一个排序模型,简化训练过程,进而简化推荐过程。另外,每个子模型的训练过程中都考虑了办公领域下多个场景下的行为信息,使得模型训练过程中所依赖的训练数据更丰富,提高了模型的学习能力,提升了训练得到的模型的性能。且综合考虑了多个场景下的行为信息,可以更加丰富地刻画用户,考虑了多个场景下行为信息之间的共同点和联系,能够使得模型训练的更加准确,进而提升依据这些子模型进行推荐时的推荐效果。
在具体的推荐过程中可以依据各个子模型的全部或者部分的组合进行推荐。
简单理解,各个子模型可以理解为低层次模型,进一步可以训练一个高层次模型。本公开实施例中排序模型可以理解为层次化模型。其中,训练高层次模型的过程可以理解为各个子模型训练一组通用模型权重,该高层次模型可以由各个子模型以及各个子模型分别对应的模型权重组成。
如图5所示,可以利用社交子模型、技能子模型、兴趣子模型和时效子模型计算加权得分。例如,可以针对各个物料,将该物料分别输入社交子模型、技能子模型、兴趣子模型和时效子模型,社交子模型、技能子模型、兴趣子模型和时效子模型可以分别输出一个预测分数,然后,基于社交子模型、技能子模型、兴趣子模型和时效子模型最终计算出一个预测分数作为用户针对该物料的分数。对各个物料的该分数进行排序,基于排序结果进行内容推荐,例如,选择分数最高的物料推荐给用户。
一种可选的实施例中,本公开实施例提供的排序模型的训练方法还可以包括:
基于至少两个维度的子模型以及通用特征数据、至少两个维度的特征数据,训练各个子模型的通用模型权重。
具体地,在训练得到各个子模型之后,基于各个维度的子模型以及通用特征数据、各个维度的特征数据,训练各个子模型的通用模型权重。
各个子模型的通用模型权重以及各个子模型共同组成一高层次的排序模型。高层次模型,即该高层次的排序模型可以理解为为加权所有子模型得分的总模型。
一种可实现方式中,可以分别将各个子模型的模型权重理解为该子模型的模型参数。
训练通用模型权重的过程类似于调整模型参数的过程。
具体地,可以针对各个特征数据,将特征数据分别输入各个维度的子模型,调整各个子模型的通用模型权重,当到达预设迭代条件时,得到训练好的各个子模型的通用模型权重。
在训练通用模型权重的过程综合了通用特征数据和各个维度的特征数据,所有的这些数据组成训练通用模型权重的训练数据。
例如,针对每一特征数据(包括通用特征数据和各个维度的特征数据),将该特征数据分别输入各个子模型,调整各个子模型的模型权重,使得特征数据的物料真值所对应的最终的各个子模型的加权得分最高。
如此,可以训练得到包括各个子模型的通用模型权重的一组模型权重,可以将这组模型权重保存下来,在推荐过程中,可以获取这组模型权重,并针对不同的场景,基于这组模型权重进行调整,得到不同场景对应的模型权重,进而基于各个子模型以及模型权重进行针对该场景的推荐。
本公开实施例中可以提供一种用于办公领域下支持多场景排序模型的构建方式,在办公领域的推荐场景下,可以训练得到统一的子模型,也可以理解为低层次化模型,然后针对各个推荐场景,灵活地配置不同侧重点的、与推荐场景匹配的排序模型进行推荐。具体地,可一次为多场景排序模型构建训练数据,并利用深度学习模型构建统一层次化排序模型,在多场景中通过灵活配置底层模型构造适应不同场景不同特点的高层次排序模型进行推荐。
本公开实施例还提供了一种内容推荐装置,如图6所示,可以包括:
确定模块601,用于确定待推荐场景;
选择模块602,用于从至少两个子模型中选择待推荐场景对应的目标子模型;其中,至少两个子模型包括至少两个维度的子模型,针对至少两个维度,至少两个维度的子模型是基于通用特征数据和至少两个维度的特征数据训练得到的;通用特征数据和至少两个维度的特征数据是基于行为信息构建的;行为信息包括至少两个场景的行为信息;
推荐模块603,用于利用各个目标子模型的组合,针对待推荐场景进行内容推荐。
可选的,如图7,该内容推荐装置还包括:
接收模块701,用于接收各个子模型的模型权重;
选择模块602,具体用于针对各个子模型,响应于子模型的模型权重不为零,将子模型作为目标子模型;
推荐模块603,具体用于基于目标子模型以及目标子模型的模型权重的组合,针对待推荐场景进行内容推荐。
可选的,如图8所示,该内容推荐装置还包括:
获取模块801,用于获取预先训练得到的各个子模型的通用模型权重;
调整模块802,用于针对待推荐场景,调整预先训练得到的各个子模型的通用模型权重,得到待推荐场景对应的各个目标子模型的模型权重;
推荐模块603,具体用于基于目标子模型以及目标子模型的模型权重的组合,针对待推荐场景进行内容推荐。
本公开实施例还提供了一种排序模型训练装置,如图9所示,可以包括:
获取模块901,用于获取至少两个场景的行为信息;
特征构建模块902,用于基于行为信息构建特征数据,特征数据包括通用特征数据和至少两个维度的特征数据;
子模型训练模块903,用于针对至少两个维度,基于通用特征数据和至少两个维度的特征数据训练至少两个维度的子模型。
可选的,特征构建模块902,具体用于:针对各个行为信息,提取行为信息中的标识信息,作为行为信息对应的通用特征数据;分别从至少两个维度中提取行为信息中与至少两个维度一一对应的特征数据,其中,至少两个维度包括以下至少两项:社交维度、技能维度、兴趣维度、时效维度。
可选的,如图10所示,该排序模型训练装置还包括:
模型权重训练模块1001,用于基于至少两个维度的子模型以及通用特征数据、至少两个维度的特征数据,训练各个子模型的通用模型权重。
本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,设备1100包括计算单元1101,其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序,来执行各种适当的动作和处理。在RAM 1103中,还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
设备1100中的多个部件连接至I/O接口1105,包括:输入单元1106,例如键盘、鼠标等;输出单元1107,例如各种类型的显示器、扬声器等;存储单元1108,例如磁盘、光盘等;以及通信单元1109,例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理,例如内容推荐方法。例如,在一些实施例中,内容推荐方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1108。在一些实施例中,计算机程序的部分或者全部可以经由ROM1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM 1103并由计算单元1101执行时,可以执行上文描述的内容推荐方法的一个或多个步骤。备选地,在其他实施例中,计算单元1101可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行内容推荐方法。
图12示出了可以用来实施本公开的实施例的示例电子设备1200的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图12所示,设备1200包括计算单元1201,其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(RAM)1203中的计算机程序,来执行各种适当的动作和处理。在RAM 1203中,还可存储设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。
设备1200中的多个部件连接至I/O接口1205,包括:输入单元1206,例如键盘、鼠标等;输出单元1207,例如各种类型的显示器、扬声器等;存储单元1208,例如磁盘、光盘等;以及通信单元1209,例如网卡、调制解调器、无线通信收发机等。通信单元1209允许设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理,例如排序模型训练方法。例如,在一些实施例中,排序模型训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1208。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到设备1200上。当计算机程序加载到RAM 1203并由计算单元1201执行时,可以执行上文描述的排序模型训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元1201可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行排序模型训练方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (16)

1.一种内容推荐方法,应用于办公领域,包括:
确定待推荐场景;
基于所述待推荐场景与至少两个子模型的相关度,从至少两个子模型中选择所述待推荐场景对应的目标子模型;其中,所述至少两个子模型包括至少两个维度的子模型,针对每一维度,所述维度的子模型是基于通用特征数据和所述维度的特征数据训练得到的;所述通用特征数据和至少两个维度的特征数据是基于多个行为信息构建的,是针对每一行为信息,将所述行为信息划分为包括通用特征数据和至少两个维度的特征数据;多个行为信息包括至少两个场景的多个行为信息,其中,所述至少两个维度包括以下至少两项:社交维度、技能维度、兴趣维度、时效维度;
利用各个目标子模型的组合,针对所述待推荐场景进行内容推荐。
2.根据权利要求1所述的方法,还包括:
接收各个子模型的模型权重;
所述从至少两个子模型中选择所述待推荐场景对应的目标子模型,包括:
针对各个子模型,响应于所述子模型的模型权重不为零,将所述子模型作为目标子模型;
所述利用各个目标子模型的组合,针对所述待推荐场景进行内容推荐,包括:
基于所述目标子模型以及所述目标子模型的模型权重的组合,针对所述待推荐场景进行内容推荐。
3.根据权利要求1所述的方法,还包括:
获取预先训练得到的各个子模型的通用模型权重;
针对所述待推荐场景,调整预先训练得到的各个子模型的通用模型权重,得到所述待推荐场景对应的各个目标子模型的模型权重;
所述利用各个目标子模型的组合,针对所述待推荐场景进行内容推荐,包括:
基于所述目标子模型以及所述目标子模型的模型权重的组合,针对所述待推荐场景进行内容推荐。
4.一种排序模型训练方法,应用于办公领域,包括:
获取至少两个场景的多个行为信息;
基于所述多个行为信息构建特征数据,所述特征数据包括通用特征数据和至少两个维度的特征数据;
针对每一维度,基于所述通用特征数据和所述维度的特征数据训练所述维度的子模型,其中,所述至少两个维度包括以下至少两项:社交维度、技能维度、兴趣维度、时效维度;
其中,所述基于所述多个行为信息构建特征数据,包括:
针对每一行为信息,将所述行为信息划分为包括通用特征数据和至少两个维度的特征数据。
5.根据权利要求4所述的方法,其中,所述基于所述多个行为信息构建特征数据,包括:
针对各个行为信息,提取所述行为信息中的标识信息,作为所述行为信息对应的通用特征数据;
分别从至少两个维度中提取所述行为信息中与所述至少两个维度一一对应的特征数据。
6.根据权利要求4所述的方法,还包括:
基于至少两个维度的子模型以及所述通用特征数据、至少两个维度的特征数据,训练各个子模型的通用模型权重。
7.一种内容推荐装置,应用于办公领域,包括:
确定模块,用于确定待推荐场景;
选择模块,用于基于所述待推荐场景与至少两个子模型的相关度,从至少两个子模型中选择所述待推荐场景对应的目标子模型;其中,所述至少两个子模型包括至少两个维度的子模型,针对每一维度,所述维度的子模型是基于通用特征数据和所述维度的特征数据训练得到的;所述通用特征数据和至少两个维度的特征数据是基于多个行为信息构建的,是针对每一行为信息,将所述行为信息划分为包括通用特征数据和至少两个维度的特征数据;多个行为信息包括多个场景的多个行为信息,其中,所述至少两个维度包括以下至少两项:社交维度、技能维度、兴趣维度、时效维度;
推荐模块,用于利用各个目标子模型的组合,针对所述待推荐场景进行内容推荐。
8.根据权利要求7所述的装置,还包括:
接收模块,用于接收各个子模型的模型权重;
所述选择模块,具体用于针对各个子模型,响应于所述子模型的模型权重不为零,将所述子模型作为目标子模型;
所述推荐模块,具体用于基于所述目标子模型以及所述目标子模型的模型权重的组合,针对所述待推荐场景进行内容推荐。
9.根据权利要求7所述的装置,还包括:
获取模块,用于获取预先训练得到的各个子模型的通用模型权重;
调整模块,用于针对所述待推荐场景,调整预先训练得到的各个子模型的通用模型权重,得到所述待推荐场景对应的各个目标子模型的模型权重;
所述推荐模块,具体用于基于所述目标子模型以及所述目标子模型的模型权重的组合,针对所述待推荐场景进行内容推荐。
10.一种排序模型训练装置,应用于办公领域,包括:
获取模块,用于获取至少两个场景的多个行为信息;
特征构建模块,用于基于所述多个行为信息构建特征数据,所述特征数据包括通用特征数据和至少两个维度的特征数据;
子模型训练模块,用于针对每一维度,基于所述通用特征数据和所述维度的特征数据训练所述维度的子模型,其中,所述至少两个维度包括以下至少两项:社交维度、技能维度、兴趣维度、时效维度;
其中,所述基于所述多个行为信息构建特征数据,包括:
针对每一行为信息,将所述行为信息划分为包括通用特征数据和至少两个维度的特征数据。
11.根据权利要求10所述的装置,其中,所述特征构建模块,具体用于:针对各个行为信息,提取所述行为信息中的标识信息,作为所述行为信息对应的通用特征数据;分别从至少两个维度中提取所述行为信息中与所述至少两个维度一一对应的特征数据。
12.根据权利要求11所述的装置,还包括:
模型权重训练模块,用于基于至少两个维度的子模型以及所述通用特征数据、至少两个维度的特征数据,训练各个子模型的通用模型权重。
13.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-3中任一项所述的方法。
14.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求4-6中任一项所述的方法。
15.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-3中任一项所述的方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求4-6中任一项所述的方法。
CN202111443352.0A 2021-11-30 2021-11-30 内容推荐和排序模型训练方法、装置、设备以及存储介质 Active CN114036398B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202111443352.0A CN114036398B (zh) 2021-11-30 2021-11-30 内容推荐和排序模型训练方法、装置、设备以及存储介质
KR1020220144752A KR20220154062A (ko) 2021-11-30 2022-11-02 내용 추천 및 정렬 모델 훈련 방법, 장치, 기기, 저장 매체 및 컴퓨터 프로그램
JP2022177444A JP2023017921A (ja) 2021-11-30 2022-11-04 コンテンツ推薦とソートモデルトレーニング方法、装置、機器、記憶媒体及びコンピュータプログラム
EP22210615.5A EP4134900A3 (en) 2021-11-30 2022-11-30 Method and apparatus for recommending content, method and apparatus for training ranking model, device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111443352.0A CN114036398B (zh) 2021-11-30 2021-11-30 内容推荐和排序模型训练方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN114036398A CN114036398A (zh) 2022-02-11
CN114036398B true CN114036398B (zh) 2024-02-13

Family

ID=80139245

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111443352.0A Active CN114036398B (zh) 2021-11-30 2021-11-30 内容推荐和排序模型训练方法、装置、设备以及存储介质

Country Status (4)

Country Link
EP (1) EP4134900A3 (zh)
JP (1) JP2023017921A (zh)
KR (1) KR20220154062A (zh)
CN (1) CN114036398B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116204700A (zh) * 2022-08-03 2023-06-02 北京百度网讯科技有限公司 目标排序模型的训练方法、目标排序方法及装置
CN115293291B (zh) * 2022-08-31 2023-09-12 北京百度网讯科技有限公司 排序模型的训练方法、排序方法、装置、电子设备及介质
CN115423559A (zh) * 2022-09-06 2022-12-02 武汉美立森家居有限公司 一种基于虚拟vr技术的家居产品线上展览展示方法
CN116610745B (zh) * 2023-06-08 2023-12-26 深圳市巨灵数字有限公司 应用数字孪生技术的ai场景信息推送处理方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783539A (zh) * 2019-01-07 2019-05-21 腾讯科技(深圳)有限公司 用户挖掘及其模型构建方法、装置及计算机设备
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质
CN112950328A (zh) * 2021-03-24 2021-06-11 第四范式(北京)技术有限公司 一种组合对象推荐方法、装置、系统和存储介质
CN113536105A (zh) * 2020-11-05 2021-10-22 腾讯科技(深圳)有限公司 推荐模型训练方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101324948B (zh) * 2008-07-24 2015-11-25 阿里巴巴集团控股有限公司 一种信息推荐的方法及装置
JP5409268B2 (ja) * 2009-10-30 2014-02-05 株式会社日立ソリューションズ 情報提示装置及び携帯端末
CN111008332B (zh) * 2019-12-03 2023-04-07 深圳市雅阅科技有限公司 内容项推荐方法、装置、服务器以及存储介质
CN111950593A (zh) * 2020-07-13 2020-11-17 华为技术有限公司 一种推荐模型训练的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109783539A (zh) * 2019-01-07 2019-05-21 腾讯科技(深圳)有限公司 用户挖掘及其模型构建方法、装置及计算机设备
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质
CN113536105A (zh) * 2020-11-05 2021-10-22 腾讯科技(深圳)有限公司 推荐模型训练方法和装置
CN112950328A (zh) * 2021-03-24 2021-06-11 第四范式(北京)技术有限公司 一种组合对象推荐方法、装置、系统和存储介质

Also Published As

Publication number Publication date
EP4134900A2 (en) 2023-02-15
EP4134900A3 (en) 2023-05-24
JP2023017921A (ja) 2023-02-07
KR20220154062A (ko) 2022-11-21
CN114036398A (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
CN114036398B (zh) 内容推荐和排序模型训练方法、装置、设备以及存储介质
KR102240662B1 (ko) 광역 및 심층 기계 학습 모델들
US11657371B2 (en) Machine-learning-based application for improving digital content delivery
EP3547155A1 (en) Entity representation learning for improving digital content recommendations
CN114265979B (zh) 确定融合参数的方法、信息推荐方法和模型训练方法
CN113301442B (zh) 确定直播资源的方法、设备、介质及程序产品
CN113569129A (zh) 点击率预测模型处理方法、内容推荐方法、装置及设备
CN112328889A (zh) 推荐搜索词确定方法、装置、可读介质及电子设备
CN112381236A (zh) 联邦迁移学习的数据处理方法、装置、设备及存储介质
CN110992127A (zh) 一种物品推荐方法及装置
CN116521832A (zh) 对话交互方法、装置及系统、电子设备和存储介质
CN114036397B (zh) 数据推荐方法、装置、电子设备和介质
US20220358347A1 (en) Computerized system and method for distilled deep prediction for personalized stream ranking
WO2022235599A1 (en) Generation and implementation of dedicated feature-based techniques to optimize inference performance in neural networks
CN116205686A (zh) 一种多媒体资源推荐的方法、装置、设备和存储介质
CN114970494A (zh) 一种评论生成方法、装置、电子设备和存储介质
CN114756753A (zh) 一种产品推荐方法、装置、电子设备及存储介质
CN114722268A (zh) 媒体资源的处理方法和装置、存储介质及电子设备
CN114547417A (zh) 一种媒体资源排序方法及电子设备
CN116956204A (zh) 多任务模型的网络结构确定方法、数据预测方法及装置
CN115129968A (zh) 信息推荐方法、装置、设备及存储介质
CN116932913A (zh) 一种信息推送方法、装置、设备及存储介质
CN117573973A (zh) 资源推荐方法、装置、电子设备以及存储介质
CN115456085A (zh) 模型训练方法、资源预估方法、装置、电子设备和介质
CN112905885A (zh) 向用户推荐资源的方法、装置、设备、介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant