CN112364202B - 视频推荐方法、装置及电子设备 - Google Patents

视频推荐方法、装置及电子设备 Download PDF

Info

Publication number
CN112364202B
CN112364202B CN202011232897.2A CN202011232897A CN112364202B CN 112364202 B CN112364202 B CN 112364202B CN 202011232897 A CN202011232897 A CN 202011232897A CN 112364202 B CN112364202 B CN 112364202B
Authority
CN
China
Prior art keywords
video
publisher
target
videos
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011232897.2A
Other languages
English (en)
Other versions
CN112364202A (zh
Inventor
朱园园
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhongyuan Network Co ltd
Original Assignee
Shanghai Zhongyuan Network Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhongyuan Network Co ltd filed Critical Shanghai Zhongyuan Network Co ltd
Priority to CN202011232897.2A priority Critical patent/CN112364202B/zh
Publication of CN112364202A publication Critical patent/CN112364202A/zh
Application granted granted Critical
Publication of CN112364202B publication Critical patent/CN112364202B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种视频推荐方法、装置及电子设备,该方法包括:根据多个视频发布者的特征信息、多个视频的视频特征以及用户观看行为日志,确定至少一个目标发布者并生成目标发布者集合;根据视频推送关系将视频库中的视频进行组合,根据用户观看行为日志和视频推送关系获取各视频组合中第二视频的点击率生成点击率列表,针对目标发布者集合中的每个目标发布者,在播放第一目标视频时,获取第一目标视频对应的视频推荐清单,根据点击率列表对视频推荐清单中的待推荐视频进行排序并筛选出第一预设数目个第二目标视频进行推荐。本发明可以提升发布者推荐场景下用户的体验效果,同时可以根据视频播放情况进行推荐,保证用户的观看体验。

Description

视频推荐方法、装置及电子设备
技术领域
本发明涉及计算机技术领域,尤其涉及一种视频推荐方法、装置及电子设备。
背景技术
在视频落地页相关推荐中,可以采用多种策略基于不同维度的相关性进行推荐,比如类别相同、标签相似、标题相似、视频内容相关等。这种推荐方式在与源视频的相关性评估和体验上没有问题,但是有这样一个问题存在:用户在观看了优质视频发布者发布的视频之后,想要观看当前视频发布者所发布的其他视频,这种情况下,通常是针对当前视频发布者,根据其发布视频的时间或者所发布的视频对应的点击量进行视频推荐,虽然整体相关性体验较好,但是无法根据当前视频与其他视频之间的播放关联进行准确、高效率且适配性的推荐。且若对于某些关注用户较少的视频发布者基于该策略进行视频推荐,由于各视频的点击量低,很可能会造成不必要的推荐,进而造成推荐资源的浪费。
由此可见,现有的基于视频发布者进行视频推荐的方案,存在易造成推荐资源浪费以及无法根据当前视频与其他视频之间的播放关联进行准确、高效率且适配性的推荐的问题。
发明内容
本发明实施例提供一种视频推荐方法、装置及电子设备,以解决现有技术中在基于视频发布者进行视频推荐时,存在易造成推荐资源浪费以及无法根据当前视频与其他视频之间的播放关联进行准确、高效率且适配性的推荐的问题。
在本发明实施例的第一方面,提供了一种视频推荐方法,所述方法包括:
根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,并生成目标发布者集合,所述视频库中包括每个所述视频发布者所发布的全部视频,所述用户观看行为日志包括预设时长内多个用户的视频观看记录;
根据基于预设策略确定的视频推送关系,将所述视频库中的视频进行组合获取多个视频组合,并根据所述用户观看行为日志和所述视频推送关系获取各所述视频组合中第二视频的点击率,其中每个所述视频组合包括第一视频和基于所述第一视频所推送的一个所述第二视频;
汇总每个所述视频组合对应的点击率生成点击率列表,所述点击率列表包括所述第一视频、所述第二视频和所述第二视频的点击率之间的对应关系;
针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐;
其中,所述特征信息包括发布者ID,所述第一目标视频和所述视频推荐清单中的待推荐视频为同一个所述目标发布者发布,所述第一目标视频对应于所述第一视频,所述第二目标视频对应于所述第二视频。
在本发明实施例的第二方面,提供了一种视频推荐装置,所述装置包括:
筛选模块,用于根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,并生成目标发布者集合,所述视频库中包括每个所述视频发布者所发布的全部视频,所述用户观看行为日志包括预设时长内多个用户的视频观看记录;
获取模块,用于根据基于预设策略确定的视频推送关系,将所述视频库中的视频进行组合获取多个视频组合,并根据所述用户观看行为日志和所述视频推送关系获取各所述视频组合中第二视频的点击率,其中每个所述视频组合包括第一视频和基于所述第一视频所推送的一个所述第二视频;
生成模块,用于汇总每个所述视频组合对应的点击率生成点击率列表,所述点击率列表包括所述第一视频、所述第二视频和所述第二视频的点击率之间的对应关系;
处理模块,用于针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐;
其中,所述特征信息包括发布者ID,所述第一目标视频和所述视频推荐清单中的待推荐视频为同一个所述目标发布者发布,所述第一目标视频对应于所述第一视频,所述第二目标视频对应于所述第二视频。
在本发明实施例的第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述的视频推荐方法。
在本发明实施的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的视频推荐方法。
在本发明实施的第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述的视频推荐方法。
本发明实施例至少包括以下技术效果:
通过在多个视频发布者中筛选出至少一个优质的视频发布者作为目标发布者,根据筛选出的至少一个目标发布者生成目标发布者集合,基于视频推送关系进行视频组合,根据用户观看行为日志和视频推送关系获取各视频组合中推荐视频的点击率,并生成点击率列表,针对目标发布者集合中的每个目标发布者,在播放当前目标发布者所发布的第一目标视频的情况下,基于点击率列表对当前目标发布者发布的其他视频进行排序,筛选出点击率高的第二目标视频,并将所筛选出的第二目标视频进行推荐,可以实现基于发布者以及用户观看行为进行视频推荐,提升发布者推荐场景下用户的体验效果,增加用户关注度和粘性,也更有利于私域流量的建设,同时可以根据点击率列表中视频组合的点击量确定关联视频对应的用户关注程度,根据用户关注程度实现准确、高效率且适配性的推荐,以合理利用推荐资源并保证用户的视频观看体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的视频推荐方法的示意图;
图2为本发明实施例提供的视频推荐方法对应的实施框图;
图3为本发明实施例提供的视频推荐装置的示意图;
图4为本发明实施例提供的电子设备的框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。
本发明实施例提供一种视频推荐方法,如图1所示,该方法包括:
步骤101、根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,并生成目标发布者集合,所述视频库中包括每个所述视频发布者所发布的全部视频,所述用户观看行为日志包括预设时长内多个用户的视频观看记录。
本发明实施例提供的视频推荐方法应用于推荐系统,首先由推荐系统在视频发布者对应的数据库中获取多个视频发布者分别对应的特征信息,在视频库中获取每个视频发布者所发布的每个视频所对应的视频特征,其中,视频库中包括每个视频发布者所发布的全部视频,可以在视频库中提取每个视频对应的视频特征。还可以获取包括预设时长内多个用户的视频观看记录的用户观看行为日志,基于所获取的多个视频发布者分别对应的特征信息、每个视频发布者所发布的每个视频所对应的视频特征以及用户观看行为日志,在多个视频发布者中进行筛选,获取至少一个目标发布者。这里的目标发布者可以具备用户关注程度高、所发布的视频质量高等特征。在获取至少一个目标发布者之后,可以针对所获取的至少一个目标发布者生成目标发布者集合。
步骤102、根据基于预设策略确定的视频推送关系,将所述视频库中的视频进行组合获取多个视频组合,并根据所述用户观看行为日志和所述视频推送关系获取各所述视频组合中第二视频的点击率,其中每个所述视频组合包括第一视频和基于所述第一视频所推送的一个所述第二视频。
推荐系统可以根据预设策略确定视频推送关系,然后根据视频推送关系,将视频库中的视频进行两两组合获取多个视频组合,且每一个组合中包括两个视频,分别为第一视频和第二视频,这里的第一视频相较于第二视频而言,可理解为原生视频,第二视频相较于第一视频而言,可以理解为基于第一视频所推荐的视频。其中,在一个视频组合中的第二视频可以作为另一个视频组合中的第一视频。需要说明的是,预设策略包括但不限于同类型推荐策略、同标题推荐策略、相似标题推荐策略等。
在根据用户观看行为日志和视频推送关系获取各视频组合中第二视频的点击率时,具体为:针对每一个视频组合,根据视频推送关系确定原生视频以及推荐视频,根据用户观看行为日志以及视频推送关系,获取推荐视频在基于原生视频推荐时所对应的点击率,获取点击率时可以根据播放次数与推荐次数确定,推荐次数与原生视频的播放次数相同。以此类推,确定多个视频组合,并统计推荐视频的点击率。
例如,根据视频推送关系确定视频组合AB、视频组合AC以及视频组合AD,在预设时长内,100个用户观看了视频A,在观看视频A的同时推荐系统推送了视频B、视频C以及视频D,即视频B、视频C以及视频D在视频A播放的情况下被推送的次数均为100次,在这100次推送当中,视频B被点击了30次,视频C被点击了20次,视频C被点击了40次,则针对视频组合AB而言,B对应的点击率为30%,针对视频组合AC而言,C对应的点击率为20%,针对视频组合AD而言,D对应的点击率为40%。
根据视频推送关系确定视频组合BA、视频组合BE,在预设时长内,200个用户观看了视频B,在观看视频B的同时推荐系统推送了视频A和视频E,即视频A以及视频E在视频B播放的情况下被推送的次数均为200次,在这200次推送当中,视频A被点击了40次,视频E被点击了50次,则针对视频组合BA而言,A对应的点击率为20%,针对视频组合BE而言,E对应的点击率为25%。其中,针对不同的组合情况,同一个视频可以作为原生视频,也可以作为被推荐的视频。
在针对每个视频组合,获取第二视频对应的点击率之后,可执行步骤103。
步骤103、汇总每个所述视频组合对应的点击率生成点击率列表,所述点击率列表包括所述第一视频、所述第二视频和所述第二视频的点击率之间的对应关系。
在针对每个视频组合,获取第二视频对应的点击率之后,可以汇总各视频组合对应的点击率,并根据汇总结果生成点击率列表,点击率列表中包括第一视频、第二视频以及第二视频的点击率之间的对应关系,便于清晰的呈现各视频组合对应的点击率。其中,点击率列表中视频组合和对应的点击率的形式可以为:视频组合AB,原生视频A,推荐视频B,视频B在该组合下对应的点击率30%,通过此种方式进行显示呈现,便于用户清晰的了解视频组合中两个视频之间的关系以及点击率信息。
步骤104、针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识号ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐;其中,所述特征信息包括发布者ID,所述第一目标视频和所述视频推荐清单中的待推荐视频为同一个所述目标发布者发布,所述第一目标视频对应于所述第一视频,所述第二目标视频对应于所述第二视频。
视频发布者的特征信息可以包括发布者ID(Identity document,身份标识号),视频库中的每个视频可以携带对应的视频发布者的ID。在生成目标发布者集合并生成点击率列表之后,可以针对目标发布者集合中的每个目标发布者,在播放其发布的第一目标视频的情况下,根据当前目标发布者的ID获取对应的视频推荐清单,其中视频推荐清单中包括至少一个待推荐视频,且这里的待推荐视频为该目标发布者所发布的区别于第一目标视频的其他视频。针对所获取的至少一个待推荐视频,可以将每个待推荐视频与第一目标视频进行组合,其中第一目标视频作为原生视频,对应于第一视频,待推荐视频对应于第二视频。根据所形成的组合,在点击率列表中进行查找,获取与所形成的组合匹配的视频组合,在查找到匹配的视频组合之后,获取对应的点击率,将获取的点击率作为该组合中的待推荐视频的点击率。针对每个待推荐视频均执行上述操作获取点击率之后,可以依据点击率进行排序,然后根据排序结果筛选出第一预设数目个第二目标视频进行推荐。其中在依据点击率进行排序获取第二目标视频时,可以按照点击率由高到低的顺序进行排序,然后截取排序靠前的待推荐视频作为第二目标视频,也可以依据点击率由低到高的顺序进行排序,然后截取排序靠后的待推荐视频作为第二目标视频。
上述实施过程,可以在多个视频发布者中筛选出至少一个目标发布者生成目标发布者集合,并基于视频推送关系进行视频组合,根据用户观看行为日志和视频推送关系获取各视频组合中推荐视频的点击率,并生成点击率列表,针对目标发布者集合中的每个目标发布者,在播放其所发布的第一目标视频的情况下,基于点击率列表对当前目标发布者发布的其他视频进行排序,筛选出点击率高的第二目标视频,并将所筛选出的第二目标视频进行推荐,可以实现基于发布者进行视频推荐,提升发布者推荐场景下用户的体验效果,增加用户关注度和粘性,也更有利于私域流量的建设,同时可以根据点击率列表中视频组合的点击量确定关联视频对应的用户关注程度,根据用户关注程度实现准确、高效率且适配性的推荐,以合理利用推荐资源并保证用户的视频观看体验。
在本发明一可选实施例中,所述根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,包括:
针对每个所述视频发布者,根据当前视频发布者的所述特征信息、当前视频发布者所发布的视频对应的所述视频特征和所述用户观看行为日志进行计算,生成特征集合;
在多个所述特征集合中筛选出第二预设数目个所述特征集合生成训练数据集,基于逻辑回归LR模型和所述训练数据集进行二分类模型训练,生成二分类模型,所述训练数据集中的每个所述特征集合对应有是否属于所述目标发布者的标识;
根据所述二分类模型对每个所述视频发布者进行检测,在多个所述视频发布者中筛选出至少一个所述目标发布者。
在筛选至少一个目标发布者时,可以针对每个视频发布者,基于视频发布者本身的特征信息、视频发布者发布的视频对应的视频特征以及用户观看行为日志进行计算,生成特征集合。在针对每个视频发布者生成特征集合之后,可以根据多个特征集合筛选出第二预设数目个特征集合,根据筛选出的特征集合生成训练数据集,并针对训练数据集中的每个特征集合,由人工标注是否属于目标发布者,推荐系统可以针对训练数据集中的每个特征集合,根据标注的标识确定特征集合是否对应于目标发布者。例如,特征集合的数量有1000个,可以在1000个特征集合中筛选出500个作为训练数据并生成训练数据集,并针对500个特征集合中的每个特征集合由人工标注是否属于目标发布者,推荐系统可以根据标注的标识确定各特征集合是否对应于目标发布者。
然后基于LR(Logistic Regression,逻辑回归)模型和训练数据集进行二分类模型训练,以构建二分类模型,其中LR模型属于现有模型,基于LR模型进行二分类模型训练的过程可以为:将训练数据集中的特征集合输入LR模型,分别针对每个特征集合输出一个概率结果(是否属于目标发布者的概率结果,且概率结果大于特定值时确定为目标发布者),将所得到的概率结果与实际结果(是否属于目标发布者)进行比对,根据多个比对结果验证准确率,在准确率小于特定值时调整模型参数重新训练,直至准确率大于特定值时完成模型训练,构建出二分类模型。在完成二分类模型的构建之后,可以采用所构建的二分类模型进行计算,即根据二分类模型对每个视频发布者进行检测,以实现在多个视频发布者中筛选出至少一个目标发布者。
其中,在根据二分类模型对每个视频发布者进行检测时,可以针对每个视频发布者,将视频发布者所对应的特征集合输入二分类模型中,然后获取输出结果,基于输出结果确定当前视频发布者是否属于用户关注程度高、所发布的视频质量高的目标发布者。通过对每个视频发布者进行检测,来筛选出至少一个目标发布者。
上述实施过程,可以针对每个视频发布者确定对应的特征集合,在所确定的多个特征集合中筛选出训练数据,采用LR模型和训练数据进行二分类模型训练,生成二分类模型,基于所生成的二分类模型对视频发布者进行检测,以筛选出至少一个目标发布者,实现在多个视频发布者中确定具备用户关注程度高、所发布的视频质量高的特征的目标发布者。
在本发明一可选实施例中,所述针对每个所述视频发布者,根据当前视频发布者的所述特征信息、当前视频发布者所发布的视频对应的所述视频特征和所述用户观看行为日志进行计算,生成特征集合,包括:
针对每个所述视频发布者,获取当前视频发布者对应的所述特征信息和当前视频发布者发布的每个视频对应的所述视频特征,所述特征信息还包括:关注当前视频发布者的第一用户的数量、当前视频发布者发布的视频对应的发布数量,所述视频特征至少包括:视频ID、所对应的视频发布者、类别标签和时长信息;
针对每个所述视频发布者,根据所述用户观看行为日志获取当前视频发布者所发布的全部视频所对应的播放特征,所述播放特征至少包括:在所述预设时长内对应的第一播放量、在所述预设时长内对应的第一播放时长、在所述预设时长内关注当前视频发布者的第一用户对应的第二播放量和在所述预设时长内关注当前视频发布者的第一用户对应的第二播放时长;
针对每个所述视频发布者,根据当前视频发布者对应的所述特征信息、所发布的每个视频对应的所述视频特征以及所发布的全部视频对应的所述播放特征,生成所述特征集合。
在针对每个视频发布者生成特征集合时,需要获取当前视频发布者对应的特征信息、当前视频发布者发布的每个视频对应的视频特征,还需要获取当前视频发布者所发布的全部视频在预设时长内对应的播放特征。
当前视频发布者对应的特征信息可以包括发布者ID、关注当前视频发布者的第一用户对应的数量、当前视频发布者发布视频的数量。发布者ID用于标识视频发布者,属于视频发布者的有效身份标识。关注当前发布者的第一用户的数量,即为当前视频发布者的粉丝数,如当前视频发布者发布了视频之后,用户A通过观看视频对当前视频发布者进行了关注,则可以确定用户A为当前视频发布者的粉丝,每个用户可对应于一用户ID,用于标识用户身份。当前视频发布者发布的视频的数量即为当前视频发布者通过推荐系统所发布的视频的总数量,可以表征当前视频发布者的活跃度。
当前视频发布者发布的每个视频对应的视频特征可以包括视频ID、所对应的视频发布者、类别标签和时长信息。视频ID用于标识视频,属于视频的有效身份标识;类别标签即为视频所归属的类别,如美食、风景、搞笑等等;时长信息即为视频所对应的时间长度。其中针对每个视频发布者而言,其所发布的视频可以与其形成关联关系。
用户观看行为日志可以至少包括用户信息(如用户ID,用户属于哪些视频发布者的粉丝)、用户所观看的视频的相关信息(如视频类型、视频ID、视频时长、视频所对应的发布者)、用户的观看信息(所观看每个视频对应的观看次数、观看时长、观看时刻等)、视频发布者的信息(如视频发布者ID、视频发布者对应的用户关注数量、视频发布者发布视频的数量)。
在针对每个视频发布者,基于用户观看行为日志获取当前视频发布者所发布的全部视频所对应的播放特征时,可以根据发布者ID进行视频发布者的区分,然后根据用户观看行为日志,确定当前视频发布者所发布的视频在预设时长内对应的第一播放量和第一播放时长,根据用户观看行为日志,确定关注当前视频发布者的第一用户在预设时长内对应的第二播放量和第二播放时长。其中第二播放量即为关注当前视频发布者的粉丝所对应的播放量,第二播放时长即为关注当前视频发布者的粉丝所对应的播放时长。这里的播放量即为播放次数。
在针对每个视频发布者均获取特征信息、所发布的每个视频对应的视频特征以及所发布的全部视频对应的播放特征之后,可以针对每个视频发布者生成特征集合。
上述实施过程,可以根据基于视频发布者本身的特征信息、所发布视频的视频特征以及所发布的全部视频在预设时长内对应的播放特征,生成特征集合,可以保证特征的多样性,进而可以基于多个维度的数据为后续的模型训练提供数据来源。
在本发明一可选实施例中,所述根据当前视频发布者对应的所述特征信息、所发布的每个视频对应的所述视频特征以及所发布的全部视频对应的所述播放特征,生成所述特征集合,包括:
根据当前视频发布者所发布的每个视频的所述视频ID、所述时长信息以及每个视频在所述预设时长内对应的播放量,统计当前视频发布者在所述预设时长内对应的第一视频总时长,计算所述第一播放时长与所述第一视频总时长的比值,确定所述预设时长内对应的完播率,其中每个视频在所述预设时长内对应的播放量基于所述视频ID在所述第一播放量中提取;
根据当前视频发布者对应的所述第二播放量与所述第一播放量的比值,确定所述预设时长内对应的播放量粉阅率;
根据当前视频发布者对应的所述第二播放时长与所述第一播放时长的比值,确定所述预设时长内对应的时长粉阅率;
根据当前视频发布者所发布的每个视频的类别标签,确定视频垂直度;
根据所述第一播放量、所述第一播放时长、所述完播率、所述播放量粉阅率、所述时长粉阅率、所述视频垂直度、当前视频发布者对应的第一用户的数量以及当前视频发布者发布的视频对应的发布数量中的至少一项,生成所述特征集合。
在针对当前视频发布者,根据特征信息、所发布的每个视频对应的视频特征以及所发布的全部视频对应的播放特征,生成特征集合时,可以提取当前视频发布者的特征信息中包含的发布者ID、关注当前视频发布者的第一用户的数量、当前视频发布者发布的视频的数量,提取当前视频发布者对应的视频特征中包括的视频ID、所对应的视频发布者、类别标签和时长信息,提取当前视频发布者所发布的全部视频在预设时长内对应的第一播放量和第一播放时长,以及在预设时长内关注当前视频发布者的第一用户对应的第二播放量和第一用户对应的第二播放时长。还可以基于视频ID在第一播放量中提取每个视频在预设时长内对应的播放量。
在完成信息提取之后,可以根据当前视频发布者所发布的每个视频的视频ID、时长信息、每个视频在预设时长内对应的播放量,统计当前视频发布者所发布的全部视频在预设时长内对应的第一视频总时长,然后计算当前视频发布者所发布的全部视频在预设时长内对应的第一播放时长与第一视频总时长的比值,确定预设时长内对应的完播率。
例如,当前视频发布者总共发布了5个视频,分别为视频1、视频2、视频3、视频4以及视频5,视频1的时长为5分钟,视频2的时长为10分钟,视频3的时长为30分钟,视频4的时长为15分钟,视频5的时长为20分钟,在预设时长内视频1播放了3次,视频2播放了3次,视频3、视频4以及视频5均播放了一次,则当前视频发布者所发布的全部视频在预设时长内对应的第一视频总时长即为:5*3+10*3+30*1+15*1+20*1=110分钟。视频1在预设时长内第一次播放时播放了3分钟,第二次播放时播放了2分钟,第三次播放时播放了5分钟,视频2在预设时长内第一次播放时播放了5分钟,第二次播放时播放了10分钟,第三次播放时播放了10分钟,视频3在预设时长内播放了20分钟,视频4在预设时长内播放了10分钟,视频5在预设时长内播放了20分钟,则第一播放时长为:3+2+5+5+10+10+20+10+20=85分钟,则预设时长内对应的完播率为85与110的比值,约为77.3%。通过计算完播率可以体现当前视频发布者所发布的视频受欢迎的程度。
在完成信息提取之后,还可以针对当前视频发布者,计算对应的第二播放量与第一播放量的比值,获取预设时长内对应的播放量粉阅率,这里的播放量粉阅率为关注当前视频发布者的粉丝在预设时长内所对应的播放量与预设时长内总播放量的比值,通过计算播放量粉阅率可以体现当前发布者所发布的视频受粉丝的喜爱程度。
在完成信息提取之后,还可以针对当前视频发布者,计算对应的第二播放时长与第一播放时长的比值,确定预设时长内对应的时长粉阅率,这里的时长粉阅率为关注当前视频发布者的粉丝在预设时长内所对应的播放时长与预设时长内总播放时长的比值,通过计算时长粉阅率可以从另一角度体现当前发布者所发布的视频受粉丝的喜爱程度。
在完成信息提取之后,可以针对当前视频发布者确定视频垂直度,在确定视频垂直度时,可以获取当前视频发布者所发布的每个视频的类别标签,然后统计每个类别标签所对应的视频数量,将对应的视频数量最多的类别标签确定为当前视频发布者的视频垂直度。例如,当前视频发布者发布了30个视频,其中20个视频对应的类别标签为美食,6个视频对应的类别标签为风景,4个视频对应的类别标签为教育,则可以确定当前视频发布者的视频垂直度为美食。
在针对当前视频发布者获取完播率、播放量粉阅率、时长粉阅率、视频垂直度之后,可以针对当前视频发布者,根据对应的第一播放量、第一播放时长、完播率、播放量粉阅率、时长粉阅率、视频垂直度、当前视频发布者对应的第一用户的数量以及当前视频发布者发布的视频对应的发布数量中的至少一项,生成特征集合。
需要说明的是,完播率、播放量粉阅率、时长粉阅率、第一播放量、第一播放时长均与预设时长相关,视频垂直度、当前视频发布者对应的第一用户的数量以及当前视频发布者发布的视频对应的发布数量均与当前视频发布者本身以及当前视频发布者发布的视频相关。
在生成特征集合时,可以根据上述特征中的至少一项生成特征集合,丰富了特征集合的生成方式,便于根据需求选择对应的特征生成特征集合。其中,在根据上述特征中的一项生成特征集合时,由于所生成的特征集合中特征少,所构建的二分类模型在筛选目标发布者时,筛选标准较为单一,可能导致所筛选出的目标发布者不符合要求。因此可以根据至少两个特征生成特征集合,以从至少两个维度筛选目标发布者。优选的,可以根据上述全部特征构成特征集合,进而实现从多个维度筛选目标发布者。需要说明的是,针对每个视频发布者均执行上述过程后,可以获取每个视频发布者分别对应的特征集合。
上述实施过程,在确定完播率、播放量粉阅率、时长粉阅率、视频垂直度之后,可以根据多个特征中的至少一项构成特征集合,丰富了特征集合的生成方式,便于根据需求选择对应的特征生成特征集合,且通过采用多个特征构成特征集合,可以实现从多个维度筛选目标发布者,保证了筛选的准确度。
在本发明一可选实施例中,所述根据所述二分类模型对每个所述视频发布者进行检测,在多个所述视频发布者中筛选出至少一个所述目标发布者,包括:
将每个所述视频发布者对应的所述特征集合分别输入所述二分类模型,针对每个所述视频发布者输出第一检测数值;
将所述第一检测数值大于预设阈值的所述视频发布者确定为所述目标发布者。
在根据二分类模型对每个视频发布者进行检测以筛选出至少一个目标发布者时,可以针对每个视频发布者,将对应的特征集合输入二分类模型中,输出第一检测数值,其中所输出的第一检测数值位于0到1之间。然后将第一检测数值与预设阈值进行比较,根据比较结果确定当前视频发布者是否为目标发布者。具体为:在第一检测数值大于预设阈值时,确定当前视频发布者为目标发布者,在第一检测数值小于或者等于预设阈值时,确定当前视频发布者不属于目标发布者。由于第一检测数值位于0到1之间,可以设定预设阈值为0.5,在第一检测数值大于0.5时确定当前视频发布者为目标发布者,否则确定当前视频发布者不属于目标发布者。通过对每个视频发布者进行检测,可以在多个视频发布者中筛选出至少一个目标发布者。
上述实施过程,通过将视频发布者对应的特征集合输入二分类模型中,可以根据检测结果判定视频发布者是否属于目标发布者,实现基于模型进行有效判断。
在本发明一可选实施例中,所述针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识号ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐,包括:
针对每个所述目标发布者,在播放的所述第一目标视频时,根据当前目标发布者对应的发布者ID,获取与所述第一目标视频归属于同一所述目标发布者的至少一个所述待推荐视频,并生成所述视频推荐清单;
根据所述第一目标视频和所述视频推荐清单中的至少一个所述待推荐视频,确定至少一个目标视频组合,每个所述待推荐视频对应于一所述目标视频组合;
根据所述点击率列表,获取每个所述目标视频组合对应的点击率;
根据每个所述目标视频组合对应的点击率,按照点击率由高到低的顺序在所述视频推荐清单中筛选出第一预设数目个第二目标视频,将第一预设数目个所述第二目标视频推荐至客户端。
针对目标发布者集合中的每个目标发布者而言,在播放当前目标发布者所发布的第一目标视频的情况下,可以根据当前目标发布者的ID获取当前目标发布者发布的其他视频作为待推荐视频,且所获取的待推荐视频的数量至少为一个,根据所获取的至少一个待推荐视频生成视频推荐清单。在生成视频推荐清单之后,可以将第一目标视频和视频推荐清单中的每一个待推荐视频进行组合,以生成至少一个目标视频组合。其中,目标视频组合中第一目标视频对应于第一视频,待推荐视频对应于第二视频。
然后针对每一个目标视频组合,基于点击率列表,获取对应的点击率,具体为将每一个目标视频组合与点击率列表中的视频组合进行匹配,在匹配成功的情况下,根据匹配成功结果确定目标视频组合对应的点击率。若匹配失败,即点击率列表中不包含与目标视频组合相匹配的视频组合,则可以将目标视频组合对应的点击率设定为预设值,若未匹配成功的目标视频组合的数量有至少两个,则可以确定至少两个目标视频组合对应的点击率相同。
进一步而言,针对匹配失败的情况,可以针对当前目标视频组合,获取其他至少两个目标视频组合(与当前目标视频组合的第一目标视频相同,待推荐视频不同)对应的点击率的均值,将获取的均值确定为预设值。若其他目标视频组合的数量为一个,则可以将当前目标视频组合对应的点击率设定为默认值。
在获取每个目标视频组合对应的点击率之后,可以根据每个目标视频组合对应的点击率,按照点击率由高到低的顺序在视频推荐清单中筛选出第一预设数目个第二目标视频,将第一预设数目个第二目标视频推荐至客户端,以实现推荐高点击率的视频。
上述实施过程,针对每个目标发布者,在播放第一目标视频时获取目标发布者发布的其他视频,并生成至少一个目标视频组合,根据目标视频组合对应的点击率由高到低的顺序,在目标发布者发布的其他视频中筛选出第一预设数目个第二目标视频进行推荐,可以实现基于视频组合对应的点击率进行视频推荐,对于用户而言,体验会更好,可以增加用户的关注度和粘性,也更有利于私域流量的建设。
在本发明一可选实施例中,所述根据每个所述目标视频组合对应的点击率,按照点击率由高到低的顺序在所述视频推荐清单中筛选出第一预设数目个第二目标视频,将第一预设数目个所述第二目标视频推荐至客户端,包括:
根据每个所述目标视频组合对应的点击率,按照点击率由高到低的顺序,对所述视频推荐清单中的至少一个所述待推荐视频进行优先级排序,其中优先级与点击率正相关;
根据优先级由高到低的排序结果,筛选出排序靠前的第一预设数目个所述待推荐视频,将筛选出的所述待推荐视频分别确定为所述第二目标视频;
根据第一预设数目个所述第二目标视频对应的优先级由高到低的次序,依次向所述客户端推荐所述第二目标视频。
在基于点击率筛选第二目标视频进行推荐时,可以针对当前目标发布者对应的每个目标视频组合,根据所获取的点击率信息,按照点击率由高到低的顺序,对视频推荐清单中的至少一个待推荐视频进行优先级排序,其中对至少一个待推荐视频进行优先级排序的过程可以体现为对至少一个目标视频组合进行排序。其中点击率越高,则优先级越高。
在基于点击率由高到低的顺序完成优先级由高到低的排序之后,可以根据优先级由高到低的排序结果,筛选出排序靠前的第一预设数目个待推荐视频,将筛选出的第一预设数目个待推荐视频分别确定为第二目标视频,以实现确定第一预设数目个第二目标视频。在确定第一预设数目个第二目标视频之后,在推荐第二目标视频时,可以按照优先级由高到低的顺序依次进行推荐,即首先推荐优先级最高的第二目标视频,然后推荐优先级次之的第二目标视频,体现在客户端上,即优先级最高的第二目标视频优先显示或者是显示在首位。
例如,针对当前目标发布者而言,在播放第一目标视频(视频A)时,获取当前目标发布者所发布的其他视频(视频L、视频M以及视频N),这里的视频L、视频M以及视频N作为待推荐视频,针对视频A,将其分别与视频L、视频M以及视频N进行组合,形成目标视频组合AL、AM、AN,针对每个目标视频组合,基于点击率列表获取对应的点击率,即获取视频A作为第一视频,视频L、视频M以及视频N分别作为第二视频时,视频L、视频M以及视频N分别所对应的点击率。在获取点击率之后,可以按照点击率由高到低的顺序,对视频L、视频M以及视频N进行优先级由高到低的排序,获取优先级排序结果:视频M、视频N以及视频L的优先级依次降低。然后将视频M、视频N以及视频L依次(如间隔0.1秒)推荐至客户端。
上述实施过程,可以基于点击率确定优先级,根据优先级由高到低的顺序依次进行视频推荐,可以实现推出点击率高的质优视频,从而提升用户体验和消费指标,提升用户粘性。
本发明实施例的视频推荐方法对应的实施框图可参见图2,包括筛选目标发布者和视频推荐两部分。在筛选目标发布者时,需要获取包括预设时长内多个用户的视频观看记录的用户观看行为日志、多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征。针对每个视频发布者,根据当前视频发布者的特征信息、当前视频发布者发布的各视频对应的视频特征和用户观看行为日志进行计算,生成当前视频发布者对应的特征集合,针对每个视频发布者,将特征集合输入二分类模型进行检测,在多个视频发布者中筛选出至少一个目标发布者,并根据至少一个目标发布者生成目标发布者集合。
在进行视频推荐时,首先需要根据视频推送关系,将视频库中的视频进行组合,并根据用户观看行为日志和视频推送关系获取各视频组合中第二视频的点击率,生成点击率列表。
针对目标发布者集合中的每个目标发布者,在播放第一目标视频时,在视频库中提取当前目标发布者所发布的其他视频,作为待推荐视频,然后将第一目标视频与各待推荐视频分别形成组合,生成目标视频组合,针对每一个目标视频组合,基于点击率列表确定对应的点击率,并按照点击率由高到低的顺序进行排序,筛选出排序靠前的第一预设数目个目标视频组合,将筛选出的目标视频组合中的待推荐视频作为第二目标视频进行推荐,生成推荐结果。
上述实施过程,首先提出了目标发布者的概念,融合视频发布者本身特征、视频发布者所发布的视频特征以及用户的观看信息,对视频发布者进行区分,筛选出目标发布者,在进行视频推荐时,可以针对目标发布者,根据视频组合对应的点击率尽可能的推出点击率高的优质视频,从而提升用户体验、消费指标以及用户粘性,也可以在对视频发布者扶持业务中提供参考指标。
以上为本发明实施例的视频推荐方法的整体实施流程,通过在多个视频发布者中筛选出目标发布者,根据筛选出的至少一个目标发布者生成目标发布者集合,基于视频推送关系进行视频组合,根据用户观看行为日志和视频推送关系获取各视频组合中推荐视频的点击率,并生成点击率列表,针对目标发布者集合中的每个目标发布者,在播放当前目标发布者发布的第一目标视频时,获取第一目标视频对应的视频推荐清单,根据点击率列表对视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐,可以实现基于发布者以及用户观看行为进行视频推荐,提升发布者推荐场景下用户的体验效果,增加用户关注度和粘性,也更有利于私域流量的建设,同时可以根据点击率列表中视频组合的点击量确定关联视频对应的用户关注程度,根据用户关注程度实现准确、高效率且适配性的推荐,以合理利用推荐资源并保证用户的视频观看体验。
本发明实施例还提供一种视频推荐装置,如图3所示,包括:
筛选模块301,用于根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,并生成目标发布者集合,所述视频库中包括每个所述视频发布者所发布的全部视频,所述用户观看行为日志包括预设时长内多个用户的视频观看记录;
获取模块302,用于根据基于预设策略确定的视频推送关系,将所述视频库中的视频进行组合获取多个视频组合,并根据所述用户观看行为日志和所述视频推送关系获取各所述视频组合中第二视频的点击率,其中每个所述视频组合包括第一视频和基于所述第一视频所推送的一个所述第二视频;
生成模块303,用于汇总每个所述视频组合对应的点击率生成点击率列表,所述点击率列表包括所述第一视频、所述第二视频和所述第二视频的点击率之间的对应关系;
处理模块304,用于针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识号ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐;
其中,所述特征信息包括发布者ID,所述第一目标视频和所述视频推荐清单中的待推荐视频为同一个所述目标发布者发布,所述第一目标视频对应于所述第一视频,所述第二目标视频对应于所述第二视频。
可选的,所述筛选模块包括:
第一生成子模块,用于针对每个所述视频发布者,根据当前视频发布者的所述特征信息、当前视频发布者所发布的视频对应的所述视频特征和所述用户观看行为日志进行计算,生成特征集合;
第二生成子模块,用于在多个所述特征集合中筛选出第二预设数目个所述特征集合生成训练数据集,基于逻辑回归LR模型和所述训练数据集进行二分类模型训练,生成二分类模型,所述训练数据集中的每个所述特征集合对应有是否属于所述目标发布者的标识;
筛选子模块,用于根据所述二分类模型对每个所述视频发布者进行检测,在多个所述视频发布者中筛选出至少一个所述目标发布者。
可选的,所述第一生成子模块包括:
获取单元,针对每个所述视频发布者,获取当前视频发布者对应的所述特征信息和当前视频发布者发布的每个视频对应的所述视频特征,所述特征信息还包括:关注当前视频发布者的第一用户的数量、当前视频发布者发布的视频对应的发布数量,所述视频特征至少包括:视频ID、所对应的视频发布者、类别标签和时长信息;
提取单元,用于针对每个所述视频发布者,根据所述用户观看行为日志获取当前视频发布者所发布的全部视频所对应的播放特征,所述播放特征至少包括:在所述预设时长内对应的第一播放量、在所述预设时长内对应的第一播放时长、在所述预设时长内关注当前视频发布者的第一用户对应的第二播放量和在所述预设时长内关注当前视频发布者的第一用户对应的第二播放时长;
生成单元,用于针对每个所述视频发布者,根据当前视频发布者对应的所述特征信息、所发布的每个视频对应的所述视频特征以及所发布的全部视频对应的所述播放特征,生成所述特征集合。
可选的,所述生成单元包括:
第一确定子单元,用于根据当前视频发布者所发布的每个视频的所述视频ID、所述时长信息以及每个视频在所述预设时长内对应的播放量,统计当前视频发布者在所述预设时长内对应的第一视频总时长,计算所述第一播放时长与所述第一视频总时长的比值,确定所述预设时长内对应的完播率,其中每个视频在所述预设时长内对应的播放量基于所述视频ID在所述第一播放量中提取;
第二确定子单元,用于根据当前视频发布者对应的所述第二播放量与所述第一播放量的比值,确定所述预设时长内对应的播放量粉阅率;
第三确定子单元,用于根据当前视频发布者对应的所述第二播放时长与所述第一播放时长的比值,确定所述预设时长内对应的时长粉阅率;
第四确定子单元,用于根据当前视频发布者所发布的每个视频的类别标签,确定视频垂直度;
生成子单元,用于根据所述第一播放量、所述第一播放时长、所述完播率、所述播放量粉阅率、所述时长粉阅率、所述视频垂直度、当前视频发布者对应的第一用户的数量以及当前视频发布者发布的视频对应的发布数量中的至少一项,生成所述特征集合。
可选的,所述筛选子模块包括:
第一处理单元,用于将每个所述视频发布者对应的所述特征集合分别输入所述二分类模型,针对每个所述视频发布者输出第一检测数值;
确定单元,用于将所述第一检测数值大于预设阈值的所述视频发布者确定为所述目标发布者。
可选的,所述处理模块包括:
第一处理子模块,用于针对每个所述目标发布者,在播放的所述第一目标视频时,根据当前目标发布者对应的发布者ID,获取与所述第一目标视频归属于同一所述目标发布者的至少一个所述待推荐视频,并生成所述视频推荐清单;
确定子模块,用于根据所述第一目标视频和所述视频推荐清单中的至少一个所述待推荐视频,确定至少一个目标视频组合,每个所述待推荐视频对应于一所述目标视频组合;
获取子模块,用于根据所述点击率列表,获取每个所述目标视频组合对应的点击率;
第二处理子模块,用于根据每个所述目标视频组合对应的点击率,按照点击率由高到低的顺序在所述视频推荐清单中筛选出第一预设数目个第二目标视频,将第一预设数目个所述第二目标视频推荐至客户端。
可选的,所述第二处理子模块包括:
排序单元,用于根据每个所述目标视频组合对应的点击率,按照点击率由高到低的顺序,对所述视频推荐清单中的至少一个所述待推荐视频进行优先级排序,其中优先级与点击率正相关;
第二处理单元,用于根据优先级由高到低的排序结果,筛选出排序靠前的第一预设数目个所述待推荐视频,将筛选出的所述待推荐视频分别确定为所述第二目标视频;
推荐单元,用于根据第一预设数目个所述第二目标视频对应的优先级由高到低的次序,依次向所述客户端推荐所述第二目标视频。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例还提供了一种电子设备,如图4所示,包括处理器41、通信接口42、存储器43和通信总线44,其中,处理器41,通信接口42,存储器43通过通信总线44完成相互间的通信,存储器43,用于存放计算机程序;所述处理器41,用于执行存储器43上所存放的程序时,实现如下步骤:根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,并生成目标发布者集合,所述视频库中包括每个所述视频发布者所发布的全部视频,所述用户观看行为日志包括预设时长内多个用户的视频观看记录;根据基于预设策略确定的视频推送关系,将所述视频库中的视频进行组合获取多个视频组合,并根据所述用户观看行为日志和所述视频推送关系获取各所述视频组合中第二视频的点击率,其中每个所述视频组合包括第一视频和基于所述第一视频所推送的一个所述第二视频;汇总每个所述视频组合对应的点击率生成点击率列表,所述点击率列表包括所述第一视频、所述第二视频和所述第二视频的点击率之间的对应关系;针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐;其中,所述特征信息包括发布者ID,所述第一目标视频和所述视频推荐清单中的待推荐视频为同一个所述目标发布者发布,所述第一目标视频对应于所述第一视频,所述第二目标视频对应于所述第二视频。处理器,在执行存储器上所存放的程序时,还可以实现本发明实施例中的其他步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中所述的视频推荐方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中所述视频推荐方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种视频推荐方法,其特征在于,所述方法包括:
根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,并生成目标发布者集合,所述视频库中包括每个所述视频发布者所发布的全部视频,所述用户观看行为日志包括预设时长内多个用户的视频观看记录;
根据基于预设策略确定的视频推送关系,将所述视频库中的视频进行组合获取多个视频组合,并根据所述用户观看行为日志和所述视频推送关系获取各所述视频组合中第二视频的点击率,其中每个所述视频组合包括第一视频和基于所述第一视频所推送的一个所述第二视频;
汇总每个所述视频组合对应的点击率生成点击率列表,所述点击率列表包括所述第一视频、所述第二视频和所述第二视频的点击率之间的对应关系;
针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识号ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐;
其中,所述特征信息包括发布者ID,所述第一目标视频和所述视频推荐清单中的待推荐视频为同一个所述目标发布者发布,所述第一目标视频对应于所述第一视频,所述第二目标视频对应于所述第二视频。
2.根据权利要求1所述的视频推荐方法,其特征在于,所述根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,包括:
针对每个所述视频发布者,根据当前视频发布者的所述特征信息、当前视频发布者所发布的视频对应的所述视频特征和所述用户观看行为日志进行计算,生成特征集合;
在多个所述特征集合中筛选出第二预设数目个所述特征集合生成训练数据集,基于逻辑回归LR模型和所述训练数据集进行二分类模型训练,生成二分类模型,所述训练数据集中的每个所述特征集合对应有是否属于所述目标发布者的标识;
根据所述二分类模型对每个所述视频发布者进行检测,在多个所述视频发布者中筛选出至少一个所述目标发布者。
3.根据权利要求2所述的视频推荐方法,其特征在于,所述针对每个所述视频发布者,根据当前视频发布者的所述特征信息、当前视频发布者所发布的视频对应的所述视频特征和所述用户观看行为日志进行计算,生成特征集合,包括:
针对每个所述视频发布者,获取当前视频发布者对应的所述特征信息和当前视频发布者发布的每个视频对应的所述视频特征,所述特征信息还包括:关注当前视频发布者的第一用户的数量、当前视频发布者发布的视频对应的发布数量,所述视频特征至少包括:视频ID、所对应的视频发布者、类别标签和时长信息;
针对每个所述视频发布者,根据所述用户观看行为日志获取当前视频发布者所发布的全部视频所对应的播放特征,所述播放特征至少包括:在所述预设时长内对应的第一播放量、在所述预设时长内对应的第一播放时长、在所述预设时长内关注当前视频发布者的第一用户对应的第二播放量和在所述预设时长内关注当前视频发布者的第一用户对应的第二播放时长;
针对每个所述视频发布者,根据当前视频发布者对应的所述特征信息、所发布的每个视频对应的所述视频特征以及所发布的全部视频对应的所述播放特征,生成所述特征集合。
4.根据权利要求3所述的视频推荐方法,其特征在于,所述根据当前视频发布者对应的所述特征信息、所发布的每个视频对应的所述视频特征以及所发布的全部视频对应的所述播放特征,生成所述特征集合,包括:
根据当前视频发布者所发布的每个视频的所述视频ID、所述时长信息以及每个视频在所述预设时长内对应的播放量,统计当前视频发布者在所述预设时长内对应的第一视频总时长,计算所述第一播放时长与所述第一视频总时长的比值,确定所述预设时长内对应的完播率,其中每个视频在所述预设时长内对应的播放量基于所述视频ID在所述第一播放量中提取;
根据当前视频发布者对应的所述第二播放量与所述第一播放量的比值,确定所述预设时长内对应的播放量粉阅率;
根据当前视频发布者对应的所述第二播放时长与所述第一播放时长的比值,确定所述预设时长内对应的时长粉阅率;
根据当前视频发布者所发布的每个视频的类别标签,确定视频垂直度;
根据所述第一播放量、所述第一播放时长、所述完播率、所述播放量粉阅率、所述时长粉阅率、所述视频垂直度、当前视频发布者对应的第一用户的数量以及当前视频发布者发布的视频对应的发布数量中的至少一项,生成所述特征集合。
5.根据权利要求2所述的视频推荐方法,其特征在于,所述根据所述二分类模型对每个所述视频发布者进行检测,在多个所述视频发布者中筛选出至少一个所述目标发布者,包括:
将每个所述视频发布者对应的所述特征集合分别输入所述二分类模型,针对每个所述视频发布者输出第一检测数值;
将所述第一检测数值大于预设阈值的所述视频发布者确定为所述目标发布者。
6.根据权利要求1所述的视频推荐方法,其特征在于,所述针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识号ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐,包括:
针对每个所述目标发布者,在播放的所述第一目标视频时,根据当前目标发布者对应的发布者ID,获取与所述第一目标视频归属于同一所述目标发布者的至少一个所述待推荐视频,并生成所述视频推荐清单;
根据所述第一目标视频和所述视频推荐清单中的至少一个所述待推荐视频,确定至少一个目标视频组合,每个所述待推荐视频对应于一所述目标视频组合;
根据所述点击率列表,获取每个所述目标视频组合对应的点击率;
根据每个所述目标视频组合对应的点击率,按照点击率由高到低的顺序在所述视频推荐清单中筛选出第一预设数目个第二目标视频,将第一预设数目个所述第二目标视频推荐至客户端。
7.根据权利要求6所述的视频推荐方法,其特征在于,所述根据每个所述目标视频组合对应的点击率,按照点击率由高到低的顺序在所述视频推荐清单中筛选出第一预设数目个第二目标视频,将第一预设数目个所述第二目标视频推荐至客户端,包括:
根据每个所述目标视频组合对应的点击率,按照点击率由高到低的顺序,对所述视频推荐清单中的至少一个所述待推荐视频进行优先级排序,其中优先级与点击率正相关;
根据优先级由高到低的排序结果,筛选出排序靠前的第一预设数目个所述待推荐视频,将筛选出的所述待推荐视频分别确定为所述第二目标视频;
根据第一预设数目个所述第二目标视频对应的优先级由高到低的次序,依次向所述客户端推荐所述第二目标视频。
8.一种视频推荐装置,其特征在于,所述装置包括:
筛选模块,用于根据多个视频发布者分别对应的特征信息、视频库中的每个视频对应的视频特征以及用户观看行为日志,在多个所述视频发布者中筛选出至少一个目标发布者,并生成目标发布者集合,所述视频库中包括每个所述视频发布者所发布的全部视频,所述用户观看行为日志包括预设时长内多个用户的视频观看记录;
获取模块,用于根据基于预设策略确定的视频推送关系,将所述视频库中的视频进行组合获取多个视频组合,并根据所述用户观看行为日志和所述视频推送关系获取各所述视频组合中第二视频的点击率,其中每个所述视频组合包括第一视频和基于所述第一视频所推送的一个所述第二视频;
生成模块,用于汇总每个所述视频组合对应的点击率生成点击率列表,所述点击率列表包括所述第一视频、所述第二视频和所述第二视频的点击率之间的对应关系;
处理模块,用于针对所述目标发布者集合中的每个所述目标发布者,在播放第一目标视频的情况下,根据当前目标发布者对应的发布者身份标识ID获取所述第一目标视频对应的视频推荐清单,根据所述点击率列表对所述视频推荐清单中的待推荐视频进行排序,根据排序结果筛选出第一预设数目个第二目标视频进行推荐;
其中,所述特征信息包括发布者ID,所述第一目标视频和所述视频推荐清单中的待推荐视频为同一个所述目标发布者发布,所述第一目标视频对应于所述第一视频,所述第二目标视频对应于所述第二视频。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一项所述的视频推荐方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7中任一项所述的视频推荐方法中的步骤。
CN202011232897.2A 2020-11-06 2020-11-06 视频推荐方法、装置及电子设备 Active CN112364202B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011232897.2A CN112364202B (zh) 2020-11-06 2020-11-06 视频推荐方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011232897.2A CN112364202B (zh) 2020-11-06 2020-11-06 视频推荐方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN112364202A CN112364202A (zh) 2021-02-12
CN112364202B true CN112364202B (zh) 2023-11-14

Family

ID=74509738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011232897.2A Active CN112364202B (zh) 2020-11-06 2020-11-06 视频推荐方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN112364202B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109698858A (zh) * 2018-11-01 2019-04-30 百度在线网络技术(北京)有限公司 用于智能设备的资源推送方法、设备和存储介质
JP6978630B1 (ja) * 2021-07-28 2021-12-08 株式会社ドワンゴ 動画配信装置、動画配信方法、および、動画配信プログラム
CN113111217B (zh) * 2021-04-22 2024-02-27 北京达佳互联信息技术有限公司 播放时长预测模型的训练方法、视频推荐方法及装置
CN113449147A (zh) * 2021-07-06 2021-09-28 乐视云计算有限公司 基于主题的视频推荐方法和装置
CN113378068B (zh) * 2021-07-14 2023-07-18 聚好看科技股份有限公司 一种内容推荐方法及服务器
CN113259728B (zh) * 2021-07-15 2021-10-01 北京达佳互联信息技术有限公司 推荐视频的方法、装置、电子设备及存储介质
CN113901241A (zh) * 2021-11-22 2022-01-07 北京达佳互联信息技术有限公司 页面展示方法、装置、电子设备及存储介质
CN114268839A (zh) * 2021-12-17 2022-04-01 北京达佳互联信息技术有限公司 视频发布账户筛选方法、装置、电子设备及存储介质
CN114926771A (zh) * 2022-06-01 2022-08-19 北京字节跳动网络技术有限公司 一种视频识别方法及装置

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045867A (zh) * 2015-07-14 2015-11-11 杭州东信北邮信息技术有限公司 一种基于图书评分的图书作家推荐方法
CN106250499A (zh) * 2016-08-02 2016-12-21 合网络技术(北京)有限公司 一种视频对挖掘方法及装置
CN106294564A (zh) * 2016-07-27 2017-01-04 乐视控股(北京)有限公司 一种视频推荐方法及装置
CN106528813A (zh) * 2016-11-18 2017-03-22 腾讯科技(深圳)有限公司 一种多媒体推荐方法和装置
CN107766467A (zh) * 2017-09-29 2018-03-06 北京金山安全软件有限公司 一种信息检测方法、装置、电子设备及存储介质
CN107968952A (zh) * 2017-12-19 2018-04-27 聚好看科技股份有限公司 一种推荐视频的方法、装置、服务器和计算机存储介质
CN108614856A (zh) * 2018-03-21 2018-10-02 北京奇艺世纪科技有限公司 一种视频排序校准方法和装置
CN109241346A (zh) * 2018-08-30 2019-01-18 武汉斗鱼网络科技有限公司 一种视频推荐方法和装置
CN110060090A (zh) * 2019-03-12 2019-07-26 北京三快在线科技有限公司 推荐商品组合的方法、装置、电子设备及可读存储介质
CN111385659A (zh) * 2018-12-29 2020-07-07 广州市百果园信息技术有限公司 一种视频推荐方法、装置、设备及存储介质
CN111651692A (zh) * 2020-06-02 2020-09-11 腾讯科技(北京)有限公司 基于人工智能的信息推荐方法、装置及电子设备
CN111698564A (zh) * 2020-07-27 2020-09-22 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及存储介质
CN111858971A (zh) * 2020-07-23 2020-10-30 北京达佳互联信息技术有限公司 多媒体资源推荐方法、装置、终端及服务器

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170046768A1 (en) * 2015-08-10 2017-02-16 SVG Media Pvt Ltd Hybrid recommendation system for recommending product advertisements
US9898466B2 (en) * 2016-07-22 2018-02-20 Rhapsody International Inc. Media preference affinity recommendation systems and methods

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045867A (zh) * 2015-07-14 2015-11-11 杭州东信北邮信息技术有限公司 一种基于图书评分的图书作家推荐方法
CN106294564A (zh) * 2016-07-27 2017-01-04 乐视控股(北京)有限公司 一种视频推荐方法及装置
CN106250499A (zh) * 2016-08-02 2016-12-21 合网络技术(北京)有限公司 一种视频对挖掘方法及装置
CN106528813A (zh) * 2016-11-18 2017-03-22 腾讯科技(深圳)有限公司 一种多媒体推荐方法和装置
CN107766467A (zh) * 2017-09-29 2018-03-06 北京金山安全软件有限公司 一种信息检测方法、装置、电子设备及存储介质
CN107968952A (zh) * 2017-12-19 2018-04-27 聚好看科技股份有限公司 一种推荐视频的方法、装置、服务器和计算机存储介质
CN108614856A (zh) * 2018-03-21 2018-10-02 北京奇艺世纪科技有限公司 一种视频排序校准方法和装置
CN109241346A (zh) * 2018-08-30 2019-01-18 武汉斗鱼网络科技有限公司 一种视频推荐方法和装置
CN111385659A (zh) * 2018-12-29 2020-07-07 广州市百果园信息技术有限公司 一种视频推荐方法、装置、设备及存储介质
CN110060090A (zh) * 2019-03-12 2019-07-26 北京三快在线科技有限公司 推荐商品组合的方法、装置、电子设备及可读存储介质
CN111651692A (zh) * 2020-06-02 2020-09-11 腾讯科技(北京)有限公司 基于人工智能的信息推荐方法、装置及电子设备
CN111858971A (zh) * 2020-07-23 2020-10-30 北京达佳互联信息技术有限公司 多媒体资源推荐方法、装置、终端及服务器
CN111698564A (zh) * 2020-07-27 2020-09-22 腾讯科技(深圳)有限公司 信息推荐方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Social group based video recommendation addressing the cold-start problem;Chunfeng Yang等;《Advances in knowledge discovery and data mining》;515-527 *
大规模在线内容推荐系统关键算法的设计与实现;李勇宏;《中国优秀硕士学位论文全文数据库 信息科技辑》;I138-5014 *

Also Published As

Publication number Publication date
CN112364202A (zh) 2021-02-12

Similar Documents

Publication Publication Date Title
CN112364202B (zh) 视频推荐方法、装置及电子设备
CN108875022B (zh) 一种视频推荐方法及装置
US9215243B2 (en) Identifying and ranking pirated media content
CN109189951B (zh) 一种多媒体资源推荐方法、设备及存储介质
WO2017096877A1 (zh) 一种推荐方法和装置
Benevenuto et al. Identifying video spammers in online social networks
Chen et al. Sheepdog: group and tag recommendation for flickr photos by automatic search-based learning
CN110929052A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
US11973819B1 (en) Image recommendations for thumbnails for online media items based on user activity
CN109684513B (zh) 一种低质量视频识别方法及装置
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
US20160055164A1 (en) News alert system and method
CN104469508A (zh) 基于弹幕信息内容进行视频定位的方法、服务器和系统
CN104008139B (zh) 视频索引表的创建方法和装置,视频的推荐方法和装置
CN110941738B (zh) 推荐方法、装置、电子设备及计算机可读存储介质
CN107153656B (zh) 一种信息搜索方法和装置
CN110287372A (zh) 用于负反馈的标签确定方法、视频推荐方法及其装置
US20150066897A1 (en) Systems and methods for conveying passive interest classified media content
Pichl et al. Combining Spotify and Twitter Data for Generating a Recent and Public Dataset for Music Recommendation.
JP2012129979A (ja) 区間作成装置、区間作成方法、及び区間作成プログラム
CN112579913A (zh) 一种视频推荐方法、装置、设备和计算机可读存储介质
CN110674345A (zh) 一种视频搜索方法、装置及服务器
CN106354867A (zh) 多媒体资源的推荐方法及装置
CN109033443B (zh) 推荐对象确定方法、装置、存储介质及计算机设备
Bulakh et al. Identifying fraudulently promoted online videos

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant