CN113158020A - 视频的推荐方法及装置 - Google Patents

视频的推荐方法及装置 Download PDF

Info

Publication number
CN113158020A
CN113158020A CN202010074374.3A CN202010074374A CN113158020A CN 113158020 A CN113158020 A CN 113158020A CN 202010074374 A CN202010074374 A CN 202010074374A CN 113158020 A CN113158020 A CN 113158020A
Authority
CN
China
Prior art keywords
video
sample
videos
candidate
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010074374.3A
Other languages
English (en)
Inventor
陈振宏
洪立印
王君
王宝慷
江鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202010074374.3A priority Critical patent/CN113158020A/zh
Publication of CN113158020A publication Critical patent/CN113158020A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/738Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Abstract

本公开关于一种视频的推荐方法及装置,该方法包括:获取目标用户的用户特征和各候选视频的视频特征;将目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果;根据各候选视频的第一排序结果和第二排序结果确定各候选视频的融合排序结果,并在各候选视频中选取第一预设数目个候选视频,作为目标用户的目标视频;将目标用户的用户特征和该目标视频的视频特征输入至第三排序模型,得到该目标视频的第三排序结果;根据各目标视频的第三排序结果,向目标用户推荐视频。采用本公开可以提高为用户推荐的目标视频的准确率。

Description

视频的推荐方法及装置
技术领域
本公开涉及计算机技术领域,尤其涉及一种视频的推荐方法及装置。
背景技术
目前,传统的视频推荐流程可以分为召回阶段、粗排阶段、精排阶段和策略阶段。其中,召回阶段是从视频库存储的海量视频中,筛选出用户可能感兴趣的第一候选视频;粗排阶段是根据预设的粗排模型,对第一候选视频进行粗略评分,并按照评分由高到低的顺序,从第一候选视频中筛选出第二候选视频;精排阶段是根据预设的精排模型,对第二候选视频进行精确评分,并按照评分由高到低的顺序,从第二候选视频中筛选出第三候选视频;策略阶段是根据预设的推荐策略,从第三候选视频中选取目标视频,并将目标视频推荐给用户。
然而,由于粗排模型和精排模型的训练过程相互独立,且使用相同的样本数据进行训练,从而导致粗排阶段会将第一候选视频中在精排阶段评分较高的视频过滤掉,进而导致为用户推荐的目标视频的准确率较低。
发明内容
本公开提供一种视频的推荐方法及装置,以至少解决相关技术中为用户推荐的目标视频的准确率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频的推荐方法,所述方法包括:
获取目标用户的用户特征和各候选视频的视频特征;
针对所述各候选视频中的每个候选视频,将所述目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果,其中,所述第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,所述第三排序模型的排序精度高于所述第一排序模型和所述第二排序模型的排序精度;
根据所述各候选视频的第一排序结果和第二排序结果,确定所述各候选视频的融合排序结果,并按照所述融合排序结果由高到低的顺序,在所述各候选视频中,选取第一预设数目个候选视频,作为所述目标用户的目标视频;
针对各目标视频中的每个目标视频,将所述目标用户的用户特征和该目标视频的视频特征输入至所述第三排序模型,得到该目标视频的第三排序结果;
根据所述各目标视频的第三排序结果,向所述目标用户推荐视频。
根据本公开实施例的第二方面,提供一种视频的粗排装置,所述装置包括:
第一获取模块,被配置为执行获取目标用户的用户特征和各候选视频的视频特征;
第一输入模块,被配置为执行针对所述各候选视频中的每个候选视频,将所述目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果,其中,所述第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,所述第三排序模型的排序精度高于所述第一排序模型和所述第二排序模型的排序精度;
选取模块,被配置为执行根据所述各候选视频的第一排序结果和第二排序结果,确定所述各候选视频的融合排序结果,并按照所述融合排序结果由高到低的顺序,在所述各候选视频中,选取第一预设数目个候选视频,作为所述目标用户的目标视频;
第二输入模块,被配置为执行针对各目标视频中的每个目标视频,将所述目标用户的用户特征和该目标视频的视频特征输入至所述第三排序模型,得到该目标视频的第三排序结果;
推荐模块,被配置为执行根据所述各目标视频的第三排序结果,向所述目标用户推荐视频。
根据本公开实施例的第三方面,提供一种视频服务器,所述视频服务器包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现第一方面中任一项所述的视频的粗排方法。
根据本公开实施例的第四方面,提供一种存储介质,当所述存储介质中的指令由视频服务器的处理器执行时,使得视频服务器能够执行第一方面中任一项所述的视频的推荐方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,当其在计算机上运行时,使得计算机执行第一方面中任一所述的视频的推荐方法。
本公开的实施例提供的技术方案至少带来以下有益效果:本公开实施例提供了一种视频的推荐方法及装置。视频服务器获取目标用户的用户特征和各候选视频的视频特征。然后,针对视频的推荐各候选视频中的每个候选视频,视频服务器将视频的推荐目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果。其中,视频的推荐第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,视频的推荐第三排序模型的排序精度高于视频的推荐第一排序模型和视频的推荐第二排序模型的排序精度。之后,视频服务器根据视频的推荐各候选视频的第一排序结果和第二排序结果,确定视频的推荐各候选视频的融合排序结果,并按照视频的推荐融合排序结果由高到低的顺序,在视频的推荐各候选视频中,选取第一预设数目个候选视频,作为视频的推荐目标用户的目标视频。最后,针对各目标视频中的每个目标视频,视频服务器将视频的推荐目标用户的用户特征和该目标视频的视频特征输入至视频的推荐第三排序模型,得到该目标视频的第三排序结果,并根据视频的推荐各目标视频的第三排序结果,向视频的推荐目标用户推荐视频。这样,由于第二排序模型和第三排序模型的训练过程相互关联,且第二排序模型使用的正负训练样本是由第三排序模型确定的,从而保证粗排阶段不会将候选视频中在精排阶段评分较高的视频过滤掉,进而提高为用户推荐的目标视频的准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种视频的推荐方法的流程图;
图2是根据一示例性实施例示出的一种第二排序模型的训练方法的流程图;
图3是根据一示例性实施例示出的一种视频的推荐装置的框图;
图4是根据一示例性实施例示出的一种视频的推荐装置的框图;
图5是根据一示例性实施例示出的一种视频服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种视频的推荐方法的流程图,如图1所示,该方法可以包括以下步骤。
步骤101,获取目标用户的用户特征和各候选视频的视频特征。
在实施中,当某一用户(即目标用户)通过安装在终端设备上的视频客户端登录到视频服务器时,视频服务器可以获取该目标用户的用户特征。其中,用户特征可以包括用户标识、点击率、点赞率和关注率、以及浏览的视频的标识、作者的标识、点击率、点赞率和关注率。然后,视频服务器可以根据该目标用户的用户特征,在视频库中筛选该目标用户感兴趣的视频(即候选视频),并进一步获取各候选视频的视频特征。其中,视频特征可以包括视频的标识、作者的标识、点击率、点赞率和关注率、以及浏览该视频的用户的用户标识、点击率、点赞率和关注率。可选的,用户的标识、浏览的视频的标识、浏览的视频的作者的标识可以为视频服务器通过因子分解机(Factor Machine,FM)算法得到的嵌入(embedding)向量。另外,视频服务器还可以根据该目标用户的用户终端的型号、网络类型等信息在视频库中筛选该目标用户感兴趣的候选视频。
步骤102,针对各候选视频中的每个候选视频,将目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果。
其中,第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,第三排序模型的排序精度高于第一排序模型和第二排序模型的排序精度。
在实施中,视频服务器中可以存储有预先训练的第一排序模型和第二排序模型。其中,第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的;第三排序模型的排序精度高于第一排序模型和第二排序模型的排序精度。视频服务器获取到目标用户的用户特征和各候选视频的视频特征后,针对各候选视频中的每个候选视频,视频服务器可以将目标用户的用户特征、以及该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型。相应的,第一排序模型则会输出该候选视频的第一排序结果,第二排序模型则会输出该候选视频的第二排序结果。可选的,第二排序模型的训练方法后续会进行详细介绍。
步骤103,根据各候选视频的第一排序结果和第二排序结果,确定各候选视频的融合排序结果,并按照融合排序结果由高到低的顺序,在各候选视频中,选取第一预设数目个候选视频,作为目标用户的目标视频。
在实施中,视频服务器中可以预先存储有第一排序模型的权重和第二排序模型的权重。其中,第一排序模型的权重和第二排序模型的权重可以由技术人员根据经验进行设置。视频服务器得到该候选视频的第一排序结果和第二排序结果后,可以计算该候选视频的第一排序结果和第二排序结果的加权和值,并将该加权和值作为该候选视频的融合排序结果。例如,该候选视频的第一排序结果为6,第二排序结果为8,第一排序模型的权重为0.4,第二排序模型的权重为0.6,则该候选视频的融合排序结果为6*0.4+8*0.6=7.2。
视频服务器中可以预先存储有第一预设数目,该第一预设数目可以由技术人员根据经验进行设置。视频服务器得到各候选视频的融合排序结果后,可以按照融合排序结果由高到低的顺序,在各候选视频中,选取第一预设数目个候选视频,作为目标用户的目标视频。
步骤104,针对各目标视频中的每个目标视频,将目标用户的用户特征和该目标视频的视频特征输入至第三排序模型,得到该目标视频的第三排序结果。
在实施中,视频服务器中可以存储有预先训练的第三排序模型。视频服务器得到目标用户的目标视频后,针对各目标视频中的每个目标视频,视频服务器可以将目标用户的用户特征、以及该目标视频的视频特征分别输入至预先训练的第三排序模型。相应的,第三排序模型则会输出该目标视频的第三排序结果。
步骤105,根据各目标视频的第三排序结果,向目标用户推荐视频。
在实施中,视频服务器得到各目标视频的第三排序结果后,可以按照预设的视频推荐算法向目标用户推荐视频。这样,由于粗排模型和精排模型的训练过程相互关联,且第二排序模型使用的正负训练样本是由第三排序模型确定的,从而保证粗排阶段不会将候选视频中在精排阶段评分较高的视频过滤掉,进而提高为用户推荐的目标视频的准确率。
图2是根据一示例性实施例示出的一种第二排序模型的训练方法的流程图,如图2所示,该方法可以包括以下步骤。
步骤201,获取多个训练样本。其中,训练样本包括样本用户的用户特征和样本视频的视频特征。
在实施中,视频服务器可以预先存储有待训练的第二排序模型和多个训练样本。其中,训练样本包括样本用户的用户特征和样本视频的视频特征。当视频服务器需要对第二排序模型进行训练时,该视频服务器可以获取预先存储的多个训练样本。可选的,样本用户的用户特征还可以包括通过第一排序模型得到的该样本用户的预估的点击率、点赞率和关注率;样本视频的视频特征还可以包括第一排序模型得到的该样本视频的预估的点击率、点赞率和关注率。
步骤202,针对每个训练样本,将该训练样本包含的样本用户的用户特征和样本视频的视频特征输入至预先训练的第三排序模型,得到该训练样本中样本视频的第四排序结果。
在实施中,视频服务器可以存储有预先训练的第三排序模型。视频服务器获取到多个训练样本后,针对每个训练样本,视频服务器可以将该训练样本包含的样本用户的用户特征和样本视频的视频特征输入至预先训练的第三排序模型。相应的,第三排序模型则会输出该训练样本中样本视频的第四排序结果。
步骤203,根据各训练样本中样本视频的第四排序结果,确定正训练样本和负训练样本。
在实施中,视频服务器得到各训练样本中样本视频的第四排序结果后,可以根据各训练样本中样本视频的第四排序结果,确定正训练样本和负训练样本。
可选的,视频服务器根据各训练样本中样本视频的第四排序结果,确定正训练样本和负训练样本的方式可以是多种多样的,本公开实施例提供了两种可行的实施方式,具体处理过程如下。
实施方式一,视频服务器可以按照第四排序结果由高到低的顺序,在各训练样本中,选取第二预设数目个第一训练样本,作为正训练样本,并将各训练样本中除第一训练样本外的第二训练样本,作为负训练样本。
在实施中,视频服务器中可以预先存储有第二预设数目。其中,该第二预设数目可以由技术人员根据经验进行设置。视频服务器得到各训练样本中样本视频的第四排序结果后,针对每个样本用户,视频服务器可以按照第四排序结果由高到低的顺序,在该样本用户对应的各训练样本中,选取第二预设数目个第一训练样本,作为正训练样本,并将各训练样本中除第一训练样本外的第二训练样本,作为负训练样本。这样,视频服务器通过第三排序模型确定各训练样本的第四排序结果。然后,视频服务器根据各训练样本的第四排序结果选取第二排序模型使用的正负训练样本,从而保证粗排阶段不会将候选视频中在精排阶段评分较高的视频过滤掉。
实施方式二,视频服务器根据各训练样本的第四排序结果,确定正训练样本和负训练样本的处理过程如下。
步骤一,根据预设的推荐排序算法和各训练样本中样本视频的第四排序结果,确定各训练样本中样本视频的推荐排序结果。
在实施中,视频服务器中可以预先存储有策略阶段对应的推荐排序算法。该推荐排序算法可以由技术人员根据需要进行设置。视频服务器得到各训练样本中样本视频的第四排序结果后,针对每个样本用户,视频服务器可以根据预设的推荐排序算法和该样本用户对应的各训练样本中样本视频的第四排序结果,确定该样本用户对应的各训练样本中样本视频的推荐排序结果。
步骤二,按照第四排序结果由高到低的顺序,在各训练样本中,选取第三预设数目个第三训练样本,按照推荐排序结果由高到低的顺序,在各训练样本中,选取第四预设数目个第四训练样本,并将第三训练样本和第四训练样本的并集,确定为正训练样本。
在实施中,视频服务器中可以预先存储有第三预设数目和第四预设数目。其中,该第三预设数目和第四预设数目可以由技术人员根据经验进行设置。针对每个样本用户,视频服务器得到该样本用户对应的各训练样本中样本视频的第四排序结果和推荐排序结果后,可以进一步按照第四排序结果由高到低的顺序,在该样本用户对应的各训练样本中,选取第三预设数目个(比如10个)第三训练样本。同理,视频服务器可以按照推荐排序结果由高到低的顺序,在该样本用户对应的各训练样本中,选取第四预设数目个(比如10个)第四训练样本。然后,视频服务器可以将该样本用户对应的第三训练样本和第四训练样本的并集,确定为该样本用户对应的正训练样本。
步骤三,按照第四排序结果由低到高的顺序,在各训练样本中,选取第五预设数目第五训练样本,按照推荐排序结果由低到高的顺序,在各训练样本中,选取第六预设数目个第六训练样本,并将第五训练样本和第六训练样本的并集,确定为候选负训练样本。
在实施中,视频服务器中可以预先存储有第五预设数目和第六预设数目。其中,该第五预设数目和第六预设数目可以由技术人员根据经验进行设置。针对每个样本用户,视频服务器得到该样本用户对应的各训练样本中样本视频的第四排序结果和推荐排序结果后,可以进一步按照第四排序结果由低到高的顺序,在该样本用户对应的各训练样本中,选取第五预设数目第五训练样本。同理,视频服务器可以按照推荐排序结果由低到高的顺序,在该样本用户对应的各训练样本中,选取第六预设数目个第六训练样本。然后,视频服务器可以将该样本用户对应的第五训练样本和该样本用户对应的第六训练样本的并集,确定为该样本用户对应的候选负训练样本。
步骤四,在候选负训练样本中,将除选取为正训练样本的第一候选负训练样本以外的预设比例个第二候选负训练样本,作为负训练样本。
在实施中,视频服务器中可以预先存储有预设比例。其中,该预设比例可以由技术人员根据经验进行设置。针对每个样本用户,视频服务器得到该样本用户对应的候选负训练样本后,可以在候选负训练样本中,将除已被选取为正训练样本的第一候选负训练样本以外的预设比例个(比如5%)第二候选负训练样本,作为负训练样本。这样,视频服务器通过第三排序模型确定各训练样本的第四排序结果。然后,视频服务器根据推荐排序算法和各训练样本中样本视频的第四排序结果,确定各训练样本中样本视频的推荐排序结果。之后,视频服务器根据各训练样本的第四排序结果和推荐排序结果选取第二排序模型使用的正负训练样本,从而保证粗排阶段不会将候选视频中在精排阶段以及策略阶段中评分较高的视频过滤掉。
步骤204,根据正训练样本和负训练样本,对待训练的第二排序模型进行训练,得到训练后的第二排序模型。
在实施中,视频服务器得到正训练样本和负训练样本后,可以根据正训练样本和负训练样本,对待训练的第二排序模型进行训练,得到训练后的第二排序模型。这样,视频服务器通过第三排序模型确定各训练样本的第四排序结果。然后,视频服务器根据各训练样本的第四排序结果选取第二排序模型使用的正负训练样本,从而保证粗排阶段不会将候选视频中在精排阶段评分较高的视频过滤掉。
本公开实施例提供了一种视频的推荐方法。视频服务器获取目标用户的用户特征和各候选视频的视频特征。然后,针对视频的推荐各候选视频中的每个候选视频,视频服务器将视频的推荐目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果。其中,视频的推荐第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,视频的推荐第三排序模型的排序精度高于视频的推荐第一排序模型和视频的推荐第二排序模型的排序精度。之后,视频服务器根据视频的推荐各候选视频的第一排序结果和第二排序结果,确定视频的推荐各候选视频的融合排序结果,并按照视频的推荐融合排序结果由高到低的顺序,在视频的推荐各候选视频中,选取第一预设数目个候选视频,作为视频的推荐目标用户的目标视频。最后,针对各目标视频中的每个目标视频,视频服务器将视频的推荐目标用户的用户特征和该目标视频的视频特征输入至视频的推荐第三排序模型,得到该目标视频的第三排序结果,并根据视频的推荐各目标视频的第三排序结果,向视频的推荐目标用户推荐视频。这样,由于第二排序模型和第三排序模型的训练过程相互关联,且第二排序模型使用的正负训练样本是由第三排序模型确定的,从而保证粗排阶段不会将候选视频中在精排阶段评分较高的视频过滤掉,进而提高为用户推荐的目标视频的准确率。
图3是根据一示例性实施例示出的一种视频的推荐装置的框图。参照图3,该装置包括:
第一获取模块310,被配置为执行获取目标用户的用户特征和各候选视频的视频特征;
第一输入模块320,被配置为执行针对各候选视频中的每个候选视频,将目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果,其中,第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,第三排序模型的排序精度高于第一排序模型和第二排序模型的排序精度;
选取模块330,被配置为执行根据各候选视频的第一排序结果和第二排序结果,确定各候选视频的融合排序结果,并按照融合排序结果由高到低的顺序,在各候选视频中,选取第一预设数目个候选视频,作为目标用户的目标视频;
第二输入模块340,被配置为执行针对各目标视频中的每个目标视频,将目标用户的用户特征和该目标视频的视频特征输入至第三排序模型,得到该目标视频的第三排序结果;
推荐模块350,被配置为执行根据各目标视频的第三排序结果,向目标用户推荐视频。
作为一种可选的实施方式,如图4所示,该装置还包括:
第二获取模块360,被配置为执行获取多个训练样本,训练样本包括样本用户的用户特征和样本视频的视频特征;
第三输入模块370,被配置为执行针对每个训练样本,将该训练样本包含的样本用户的用户特征和样本视频的视频特征输入至预先训练的第三排序模型,得到该训练样本中样本视频的第四排序结果;
确定模块380,被配置为执行根据各训练样本中样本视频的第四排序结果,确定正训练样本和负训练样本;
训练模块380,被配置为执行根据正训练样本和负训练样本,对待训练的第二排序模型进行训练,得到训练后的第二排序模型。
作为一种可选的实施方式,确定模块380,具体用于:
按照第四排序结果由高到低的顺序,在各训练样本中,选取第二预设数目个第一训练样本,作为正训练样本,并将各训练样本中除第一训练样本外的第二训练样本,作为负训练样本。
作为一种可选的实施方式,确定模块380,具体用于:
根据预设的推荐排序算法和各训练样本中样本视频的第四排序结果,确定各训练样本中样本视频的推荐排序结果;
按照第四排序结果由高到低的顺序,在各训练样本中,选取第三预设数目个第三训练样本,按照推荐排序结果由高到低的顺序,在各训练样本中,选取第四预设数目个第四训练样本,并将第三训练样本和第四训练样本的并集,确定为正训练样本;
按照第四排序结果由低到高的顺序,在各训练样本中,选取第五预设数目第五训练样本,按照推荐排序结果由低到高的顺序,在各训练样本中,选取第六预设数目个第六训练样本,并将第五训练样本和第六训练样本的并集,确定为候选负训练样本;
在候选负训练样本中,将除选取为正训练样本的第一候选负训练样本以外的预设比例个第二候选负训练样本,作为负训练样本。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开实施例提供了一种视频的推荐装置。视频服务器获取目标用户的用户特征和各候选视频的视频特征。然后,针对视频的推荐各候选视频中的每个候选视频,视频服务器将视频的推荐目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果。其中,视频的推荐第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,视频的推荐第三排序模型的排序精度高于视频的推荐第一排序模型和视频的推荐第二排序模型的排序精度。之后,视频服务器根据视频的推荐各候选视频的第一排序结果和第二排序结果,确定视频的推荐各候选视频的融合排序结果,并按照视频的推荐融合排序结果由高到低的顺序,在视频的推荐各候选视频中,选取第一预设数目个候选视频,作为视频的推荐目标用户的目标视频。最后,针对各目标视频中的每个目标视频,视频服务器将视频的推荐目标用户的用户特征和该目标视频的视频特征输入至视频的推荐第三排序模型,得到该目标视频的第三排序结果,并根据视频的推荐各目标视频的第三排序结果,向视频的推荐目标用户推荐视频。这样,由于第二排序模型和第三排序模型的训练过程相互关联,且第二排序模型使用的正负训练样本是由第三排序模型确定的,从而保证粗排阶段不会将候选视频中在精排阶段评分较高的视频过滤掉,进而提高为用户推荐的目标视频的准确率。
图5是根据一示例性实施例示出的一种视频服务器的框图。所述视频服务器包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现上述视频的推荐方法。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器,上述指令可由视频服务器的处理器执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种视频的推荐方法,其特征在于,所述方法包括:
获取目标用户的用户特征和各候选视频的视频特征;
针对所述各候选视频中的每个候选视频,将所述目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果,其中,所述第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,所述第三排序模型的排序精度高于所述第一排序模型和所述第二排序模型的排序精度;
根据所述各候选视频的第一排序结果和第二排序结果,确定所述各候选视频的融合排序结果,并按照所述融合排序结果由高到低的顺序,在所述各候选视频中,选取第一预设数目个候选视频,作为所述目标用户的目标视频;
针对各目标视频中的每个目标视频,将所述目标用户的用户特征和该目标视频的视频特征输入至所述第三排序模型,得到该目标视频的第三排序结果;
根据所述各目标视频的第三排序结果,向所述目标用户推荐视频。
2.根据权利要求1所述的方法,其特征在于,所述获取目标用户的用户特征和各候选视频的视频特征之前,所述方法还包括:
获取多个训练样本,所述训练样本包括样本用户的用户特征和样本视频的视频特征;
针对每个训练样本,将该训练样本包含的样本用户的用户特征和样本视频的视频特征输入至预先训练的第三排序模型,得到该训练样本中样本视频的第四排序结果;
根据各训练样本中样本视频的第四排序结果,确定正训练样本和负训练样本;
根据所述正训练样本和所述负训练样本,对待训练的第二排序模型进行训练,得到训练后的第二排序模型。
3.根据权利要求2所述的方法,其特征在于,所述根据各训练样本中样本视频的第四排序结果,确定正训练样本和负训练样本,包括:
按照第四排序结果由高到低的顺序,在各训练样本中,选取第二预设数目个第一训练样本,作为正训练样本,并将所述各训练样本中除所述第一训练样本外的第二训练样本,作为负训练样本。
4.根据权利要求2所述的方法,其特征在于,所述根据各训练样本中样本视频的第四排序结果,确定正训练样本和负训练样本,包括:
根据预设的推荐排序算法和各训练样本中样本视频的第四排序结果,确定各训练样本中样本视频的推荐排序结果;
按照第四排序结果由高到低的顺序,在各训练样本中,选取第三预设数目个第三训练样本,按照推荐排序结果由高到低的顺序,在所述各训练样本中,选取第四预设数目个第四训练样本,并将所述第三训练样本和所述第四训练样本的并集,确定为正训练样本;
按照第四排序结果由低到高的顺序,在所述各训练样本中,选取第五预设数目第五训练样本,按照推荐排序结果由低到高的顺序,在所述各训练样本中,选取第六预设数目个第六训练样本,并将所述第五训练样本和所述第六训练样本的并集,确定为候选负训练样本;
在所述候选负训练样本中,将除选取为所述正训练样本的第一候选负训练样本以外的预设比例个第二候选负训练样本,作为负训练样本。
5.一种视频的粗排装置,其特征在于,所述装置包括:
第一获取模块,被配置为执行获取目标用户的用户特征和各候选视频的视频特征;
第一输入模块,被配置为执行针对所述各候选视频中的每个候选视频,将所述目标用户的用户特征和该候选视频的视频特征分别输入至预先训练的第一排序模型和第二排序模型,得到该候选视频的第一排序结果和第二排序结果,其中,所述第二排序模型的正负训练样本是根据预先训练的第三排序模型确定的,所述第三排序模型的排序精度高于所述第一排序模型和所述第二排序模型的排序精度;
选取模块,被配置为执行根据所述各候选视频的第一排序结果和第二排序结果,确定所述各候选视频的融合排序结果,并按照所述融合排序结果由高到低的顺序,在所述各候选视频中,选取第一预设数目个候选视频,作为所述目标用户的目标视频;
第二输入模块,被配置为执行针对各目标视频中的每个目标视频,将所述目标用户的用户特征和该目标视频的视频特征输入至所述第三排序模型,得到该目标视频的第三排序结果;
推荐模块,被配置为执行根据所述各目标视频的第三排序结果,向所述目标用户推荐视频。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第二获取模块,被配置为执行获取多个训练样本,所述训练样本包括样本用户的用户特征和样本视频的视频特征;
第三输入模块,被配置为执行针对每个训练样本,将该训练样本包含的样本用户的用户特征和样本视频的视频特征输入至预先训练的第三排序模型,得到该训练样本中样本视频的第四排序结果;
确定模块,被配置为执行根据各训练样本中样本视频的第四排序结果,确定正训练样本和负训练样本;
训练模块,被配置为执行根据所述正训练样本和所述负训练样本,对待训练的第二排序模型进行训练,得到训练后的第二排序模型。
7.根据权利要求6所述的装置,其特征在于,所述确定模块,具体用于:
按照第四排序结果由高到低的顺序,在各训练样本中,选取第二预设数目个第一训练样本,作为正训练样本,并将所述各训练样本中除所述第一训练样本外的第二训练样本,作为负训练样本。
8.根据权利要求6所述的装置,其特征在于,所述确定模块,具体用于:
根据预设的推荐排序算法和各训练样本中样本视频的第四排序结果,确定各训练样本中样本视频的推荐排序结果;
按照第四排序结果由高到低的顺序,在各训练样本中,选取第三预设数目个第三训练样本,按照推荐排序结果由高到低的顺序,在所述各训练样本中,选取第四预设数目个第四训练样本,并将所述第三训练样本和所述第四训练样本的并集,确定为正训练样本;
按照第四排序结果由低到高的顺序,在所述各训练样本中,选取第五预设数目第五训练样本,按照推荐排序结果由低到高的顺序,在所述各训练样本中,选取第六预设数目个第六训练样本,并将所述第五训练样本和所述第六训练样本的并集,确定为候选负训练样本;
在所述候选负训练样本中,将除选取为所述正训练样本的第一候选负训练样本以外的预设比例个第二候选负训练样本,作为负训练样本。
9.一种视频服务器,其特征在于,所述视频服务器包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至4中任一项所述的视频的粗排方法。
10.一种存储介质,当所述存储介质中的指令由视频服务器的处理器执行时,使得视频服务器能够执行如权利要求1至4中任一项所述的视频的粗排方法。
CN202010074374.3A 2020-01-22 2020-01-22 视频的推荐方法及装置 Pending CN113158020A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010074374.3A CN113158020A (zh) 2020-01-22 2020-01-22 视频的推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010074374.3A CN113158020A (zh) 2020-01-22 2020-01-22 视频的推荐方法及装置

Publications (1)

Publication Number Publication Date
CN113158020A true CN113158020A (zh) 2021-07-23

Family

ID=76881629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010074374.3A Pending CN113158020A (zh) 2020-01-22 2020-01-22 视频的推荐方法及装置

Country Status (1)

Country Link
CN (1) CN113158020A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113987260A (zh) * 2021-09-14 2022-01-28 北京百度网讯科技有限公司 一种视频推送方法、装置、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107563500A (zh) * 2017-09-14 2018-01-09 北京奇艺世纪科技有限公司 一种基于用户头像的视频推荐方法及系统
CN108228824A (zh) * 2017-12-29 2018-06-29 暴风集团股份有限公司 一种视频的推荐方法、装置、电子设备、介质和程序
CN109299327A (zh) * 2018-11-16 2019-02-01 广州市百果园信息技术有限公司 视频推荐方法、装置、设备及存储介质
CN109543069A (zh) * 2018-10-31 2019-03-29 北京达佳互联信息技术有限公司 视频推荐方法、装置和计算机可读存储介质
CN109547814A (zh) * 2018-12-13 2019-03-29 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN109684510A (zh) * 2018-10-31 2019-04-26 北京达佳互联信息技术有限公司 视频排序方法、装置、电子设备及存储介质
CN109753601A (zh) * 2018-11-28 2019-05-14 北京奇艺世纪科技有限公司 推荐信息点击率确定方法、装置及电子设备
CN109874053A (zh) * 2019-02-21 2019-06-11 南京航空航天大学 基于视频内容理解和用户动态兴趣的短视频推荐方法
CN110019943A (zh) * 2017-09-11 2019-07-16 中国移动通信集团浙江有限公司 视频推荐方法、装置、电子设备和存储介质
CN110446065A (zh) * 2019-08-02 2019-11-12 腾讯科技(武汉)有限公司 一种视频召回方法、装置及存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110019943A (zh) * 2017-09-11 2019-07-16 中国移动通信集团浙江有限公司 视频推荐方法、装置、电子设备和存储介质
CN107563500A (zh) * 2017-09-14 2018-01-09 北京奇艺世纪科技有限公司 一种基于用户头像的视频推荐方法及系统
CN108228824A (zh) * 2017-12-29 2018-06-29 暴风集团股份有限公司 一种视频的推荐方法、装置、电子设备、介质和程序
CN109543069A (zh) * 2018-10-31 2019-03-29 北京达佳互联信息技术有限公司 视频推荐方法、装置和计算机可读存储介质
CN109684510A (zh) * 2018-10-31 2019-04-26 北京达佳互联信息技术有限公司 视频排序方法、装置、电子设备及存储介质
CN109299327A (zh) * 2018-11-16 2019-02-01 广州市百果园信息技术有限公司 视频推荐方法、装置、设备及存储介质
CN109753601A (zh) * 2018-11-28 2019-05-14 北京奇艺世纪科技有限公司 推荐信息点击率确定方法、装置及电子设备
CN109547814A (zh) * 2018-12-13 2019-03-29 北京达佳互联信息技术有限公司 视频推荐方法、装置、服务器及存储介质
CN109874053A (zh) * 2019-02-21 2019-06-11 南京航空航天大学 基于视频内容理解和用户动态兴趣的短视频推荐方法
CN110446065A (zh) * 2019-08-02 2019-11-12 腾讯科技(武汉)有限公司 一种视频召回方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113987260A (zh) * 2021-09-14 2022-01-28 北京百度网讯科技有限公司 一种视频推送方法、装置、电子设备及存储介质
WO2023040220A1 (zh) * 2021-09-14 2023-03-23 北京百度网讯科技有限公司 一种视频推送方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN106685933B (zh) 一种授权策略推荐及装置
US20230043174A1 (en) Method for pushing anchor information, computer device, and storage medium
CN107463698B (zh) 基于人工智能推送信息的方法和装置
CN110019943B (zh) 视频推荐方法、装置、电子设备和存储介质
CN110222233B (zh) 视频推荐方法、装置、服务器及存储介质
CN109478142B (zh) 呈现为预测的用户活动定制的用户界面的方法、系统和介质
CN102073699A (zh) 用于基于用户行为来改善搜索结果的方法、装置和设备
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
US20140074828A1 (en) Systems and methods for cataloging consumer preferences in creative content
CN106776701B (zh) 用于物品推荐的问题确定方法和装置
CN111259192A (zh) 音频推荐方法和装置
CN112765484B (zh) 短视频推送方法、装置、电子设备及存储介质
CN107257972A (zh) 用于提供搜索建议的方法、系统和介质
CN106649696A (zh) 信息分类方法及装置
KR101708254B1 (ko) 협업적 필터링과 캐릭터 넷을 이용한 스토리 기반의 영화 추전 시스템 및 방법.
CN106227870A (zh) 一种视频网站推荐方法及装置
CN111191133B (zh) 业务搜索处理方法、装置及设备
CN109636530B (zh) 产品确定方法、装置、电子设备及计算机可读存储介质
CN113742578A (zh) 一种数据推荐方法、装置、电子设备及存储介质
CN113158020A (zh) 视频的推荐方法及装置
CN107644094B (zh) 构建精品资源库的方法、装置、服务器及存储介质
KR101516329B1 (ko) 소셜 네트워크 환경에서의 그룹 추천 시스템 및 방법
CN111581435A (zh) 一种视频封面图像生成方法、装置、电子设备及存储介质
CN113127720A (zh) 一种热搜词确定方法及装置
CN111177564A (zh) 一种产品推荐方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination