WO2021042826A1 - 一种视频播放完整度预测方法及装置 - Google Patents

一种视频播放完整度预测方法及装置 Download PDF

Info

Publication number
WO2021042826A1
WO2021042826A1 PCT/CN2020/097861 CN2020097861W WO2021042826A1 WO 2021042826 A1 WO2021042826 A1 WO 2021042826A1 CN 2020097861 W CN2020097861 W CN 2020097861W WO 2021042826 A1 WO2021042826 A1 WO 2021042826A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
video
video playback
data
playback
Prior art date
Application number
PCT/CN2020/097861
Other languages
English (en)
French (fr)
Inventor
许良武
Original Assignee
苏宁云计算有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 苏宁云计算有限公司 filed Critical 苏宁云计算有限公司
Priority to CA3153598A priority Critical patent/CA3153598A1/en
Publication of WO2021042826A1 publication Critical patent/WO2021042826A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/74Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/732Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content

Definitions

  • the invention relates to the technical field of big data and deep learning, in particular to a method and device for predicting the completeness of video playback.
  • the video recommendation system is based on a large number of users and videos, relying on big data analysis and artificial intelligence technology to build a video recommendation system by studying users’ interest preferences, recommending high-quality videos that users are interested in to target users, and solving the problem of information overload , To achieve the effect of thousands of people, improve user stay time and satisfaction.
  • Video recommendation systems usually include two stages: recall and sorting.
  • the recall stage is to select a part of the candidate set from a large number of videos.
  • the sorting stage is to perform a more accurate and unified calculation on the candidate set in the recall stage, and to screen out the most interested users from the candidate set. A small number of high-quality videos.
  • the click-based model may contribute to the title party, which does not increase the user’s stay time, and affects the user’s viewing time and satisfaction. Watching time is an important optimization goal of information flow. Therefore, it is urgent to introduce playback completeness optimization in the short video ranking model to improve the true relevance of recommendations to achieve user viewing time and satisfaction.
  • the embodiments of the present invention provide a method and device for predicting the completeness of video playback.
  • the user's video playback completeness is predicted, in terms of viewing time, which is an important information stream.
  • the user's interest data closer to the real is obtained, the recognition accuracy of the user's interest is improved, the true relevance of the recommendation is improved, and the user's viewing time and satisfaction are greatly improved.
  • a method for predicting the completeness of video playback includes:
  • the preset video playback completeness prediction model is obtained through user video playback training data training, and the user video playback feature vector includes at least a user feature vector and a video feature vector.
  • the method further includes:
  • collecting the user video playback information data includes: obtaining the user video playback information data including user information, user playback history information, video information, and user client information; and/or,
  • Filtering the user video playback information data to obtain the screening results includes: using a multi-channel recall method including user collaboration, user search, theme models, popular recommendations, user portraits, and video tags to play information data on the user video Perform screening and obtain screening results; and/or,
  • Performing feature extraction on the screening result to generate the data to be tested for the user video playback feature vector includes: using word2vec model and IDF weight training to train the word vector obtained from a preset massive corpus to compare the screening result Perform word segmentation on the video title and video classification tag of the video to generate a video word vector, and then calculate the word vector according to the user playback history information combined with time attenuation to generate a user word vector.
  • the preset video playback completeness prediction model includes three hidden layer DNNs.
  • the preset video playback completeness prediction model is obtained by inputting the user video playback training data into training, wherein the user video playback training data is an independent variable, and the user viewing history video playback completeness The value is a dependent variable, and the user video playback training data is a feature vector of a combination of historical user vectors and historical video vectors constructed according to user playback history information.
  • the method further includes:
  • a device for predicting the completeness of video playback includes a model calculation module for:
  • User video playback training data is obtained through training, and the user video playback feature vector includes at least a user feature vector and a video feature vector.
  • the device further includes a data collection module, a data screening module, and a vector generation module.
  • the data collection module collects the user video playback information data; the data screening module screens the user video playback information data, Obtain the screening result; the vector generation module performs feature extraction on the screening result, and generates the data to be tested of the user video playback feature vector.
  • the data collection module obtains the user video playback information data including user information, user playback history information, video information, and user client information; and/or,
  • the data screening module uses a multi-channel recall method including user collaboration, user search, topic models, popular recommendations, user portraits, and video tags to filter the user video playback information data to obtain screening results; and/or,
  • the vector generation module performs feature extraction on the screening results to generate the data to be tested for the user video playback feature vector, including: using word2vec model and IDF weight training to train the word vector obtained from a preset massive corpus, and correct
  • the video title and the video classification tag in the screening result are segmented to generate a video word vector, and then the word vector is calculated according to the user playback history information combined with time attenuation to generate a user word vector.
  • the device further includes a data recommendation module configured to perform a sorting operation from high to low on the video playback integrity value of the data to be tested, obtain top N video sorting results, and compare all The video ranking result is recommended to the corresponding user according to the priority level, where N is an integer greater than 1.
  • the TF-IDF algorithm is used in the field of video recommendation, which effectively highlights the key information of the video through the IDF value;
  • FIG. 1 is a flowchart of a method for predicting the completeness of video playback according to an embodiment of the present invention
  • FIG. 2 is a flowchart of a method for predicting the integrity of video playback according to another embodiment of the present invention
  • FIG. 3 is a demonstration diagram of a preferred embodiment of feature engineering construction in step 203;
  • FIG. 4 is a demonstration diagram of a preferred implementation manner of a preset video playback completeness prediction model provided by an embodiment of the present invention
  • FIG. 5 is a schematic structural diagram of a device for predicting the integrity of video playback provided by an embodiment of the present invention.
  • Fig. 6 is a schematic structural diagram of an apparatus for predicting the integrity of video playback provided by another embodiment of the present invention.
  • the video playback integrity prediction method and device provided by the embodiments of the present invention change the traditional CTR estimation method, introduce video playback integrity indicators, and use a trained preset video playback integrity prediction model for video playback for different users.
  • Completeness prediction through the prediction result of video playback completeness, the user's interest data closer to the real is obtained in terms of the important information stream of viewing time, which improves the accuracy of identifying user interests, thereby improving the real relevance of recommendations
  • the user’s viewing time and satisfaction have been greatly improved. Therefore, the method and device for predicting the completeness of video playback can be widely used in a variety of network video application scenarios involving user interest mining, user demand matching, or user recommendation.
  • FIG. 1 is a flowchart of a method for predicting the completeness of video playback according to an embodiment of the present invention. As shown in Fig. 1, the method for predicting the completeness of frequency playback includes the following steps:
  • the user video playback feature vector here includes at least user feature vector and video feature vector, and user features include user portraits and user history. Playback records or other user-related information. Video features include video category, video duration, video time, video playback completeness records, or other other information related to the published video. In addition to the user feature vector and the video feature vector, the user video playback feature vector may also include user client classification information and other information related to video playback.
  • the preset video playback integrity prediction model is obtained through user video playback training data training. The specific video playback integrity prediction model used can be obtained by designing and constructing a corresponding deep learning model for training as needed, or using existing There are any possible deep learning models obtained by training in the technology, which are not particularly limited in the embodiment of the present invention.
  • Fig. 2 is a flowchart of a method for predicting the completeness of video playback according to another embodiment of the present invention. As shown in Figure 2, the method for predicting the completeness of video playback includes the following steps:
  • user video playback information data including user information, user playback history information, video information, and user client information are acquired.
  • User video playback information mainly includes user information, user playback history information, video information, and user client information.
  • User information mainly refers to user portrait information, including user basics. Attribute information (gender, age, etc.), user playback history information includes the percentage of users playing in each hour of history, the percentage of users watching various videos, etc., and the client information includes user equipment type, operator type, etc.
  • the user video playback information can also collect contextual information secondary to the video played by the user, such as the time the user watches each video, and user location information.
  • step 201 may be implemented in other ways in addition to the manner described in the foregoing steps, and the embodiment of the present invention does not limit the specific manner.
  • screening user video playback information data to obtain screening results includes: using multi-channel recall methods including user collaboration, user search, topic models, popular recommendations, user portraits, and video tags to perform user video playback information data Screening, get the screening results.
  • This process is the recall stage of the coarse screening of the user's video playback information data.
  • it is mainly to screen the video information in the user's video playback information data.
  • the scale of the video is huge, it may reach the order of millions.
  • the cost of directly inputting the model for data preprocessing is too high, and the time will be very slow, so you can roughly filter out some of the higher quality or more likely to meet user preferences through the recall stage.
  • Video information. Recall usually uses multi-channel recall, such as user collaboration, user search, topic models, popular recommendations, user portraits and video tags, etc., so as to select a part of the expected candidate set from a large number of videos.
  • step 202 may be implemented in other ways in addition to the manner described in the foregoing steps, and the embodiment of the present invention does not limit the specific manner.
  • feature extraction of the screening results to generate the data to be tested for the user video playback feature vector including: using word2vec model and IDF weight training to train the word vector obtained from the preset massive corpus, and the video title in the screening result Perform word segmentation with the video classification label to generate a video word vector, and then calculate the word vector based on the user's playback history information and time attenuation to generate a user word vector.
  • the user word vector and video word vector here correspond to the aforementioned user feature vector and video feature vector.
  • This process is the feature engineering stage, as shown in Figure 3.
  • word segmentation and word2vec model a 200-dimensional word vector for each word is trained to represent the potential meaning of the word in a vectorized form.
  • the relationship between words is expressed, and the video title is processed by word segmentation and the IDF obtained by training is combined to calculate the word vector representation of the video.
  • the user's word vector representation is calculated.
  • the user’s top3 tag videos are counted according to the video tag category and the proportion exceeds 10%.
  • the video corresponding to the relatively low video tag is not the user's potential point of interest. This part of the playback is often a hot video or a user's misoperation, which can be discarded through feature extraction.
  • step 203 the process of performing feature extraction on the screening results to generate user video playback feature vectors can also be implemented in other ways in addition to the manner described in the above steps. Not limited.
  • the preset video playback completeness prediction model is obtained by inputting user video playback training data into training, where the user video playback training data is the independent variable, the user viewing history video playback integrity value is the dependent variable, and the user video playback training data is The feature vector of the combination of historical user vector and historical video vector constructed according to the user's playing history information is used for training to obtain a desired preset video playing completeness prediction model.
  • the preset video playback completeness prediction model includes three hidden layers of DNN, and the input information of the input layer includes the user's word vector representation (the video word vector is calculated from the user's history playing video and combined with IDF weights to obtain each video word vector, and then integrated
  • the 200-dimensional word vector calculated by considering the time attenuation), the user’s basic portrait (gender, age, etc.), the proportion of videos played in each period (by hour), the proportion of each category of video, etc.; the word vector of the video (200 dimensions), Video quality (average playback integrity, video popularity, etc.), video release time, video category; device type, operator type; region; current time period, etc.
  • step 204 the data content and form of the data to be tested for the user video playback feature vector are input.
  • the process can also be implemented in other ways. Not limited.
  • step 206 the following steps are further included:
  • the steps of ordering the video playback integrity value can also be designed in the preset video playback integrity prediction model calculation process, as shown in FIG. 4, which is not particularly limited in the embodiment of the present invention.
  • FIG. 5 is a schematic structural diagram of a video playback integrity prediction device provided by an embodiment of the present invention.
  • the video playback integrity prediction device includes a model calculation module 1.
  • the model calculation module 1 is used to: input user video playback characteristics
  • the data to be tested of the vector is calculated by the preset video playback integrity prediction model, and the video playback integrity value of the data to be tested is output.
  • the preset video playback integrity prediction model is obtained by training the user video playback training data.
  • the user video playback feature vector includes at least a user feature vector and a video feature vector.
  • Fig. 6 is a schematic structural diagram of an apparatus for predicting the integrity of video playback provided by another embodiment of the present invention.
  • the video playback completeness prediction device 2 includes a data collection module 21, a data screening module 22, a vector generation module 23, a model calculation module 24 and a data recommendation module 25.
  • the data collection module 21 collects user video playback information data. Specifically, the data collection module 21 obtains user video playback information data including user information, user playback history information, video information, and user client information.
  • the data screening module 22 screens the user's video playback information data and obtains the screening result. Specifically, the data screening module 22 uses a multi-channel recall method including user collaboration, user search, topic models, popular recommendations, user portraits, and video tags to filter user video playback information data and obtain screening results.
  • a multi-channel recall method including user collaboration, user search, topic models, popular recommendations, user portraits, and video tags to filter user video playback information data and obtain screening results.
  • the vector generation module 23 performs feature extraction on the screening results, and generates a user video playback feature vector. Specifically, the vector generation module 23 performs feature extraction on the screening results to generate the data to be tested for the user video playback feature vector, including: using word2vec model and IDF weight training to train the word vectors obtained from the preset massive corpus, and compare the screening results.
  • the video title and the video classification tag in the video segmentation are performed to generate the video word vector, and then the word vector is calculated according to the user's playback history information and the time attenuation to generate the user word vector.
  • the user word vector and video word vector here correspond to the following user feature vector and video feature vector.
  • the model calculation module 24 inputs the data to be tested for the user’s video playback feature vector, calculates it through the preset video playback integrity prediction model, and outputs the video playback integrity value of the data to be tested.
  • the preset video playback integrity prediction model is passed User video playback training data is obtained through training, and the user video playback feature vector includes at least a user feature vector and a video feature vector.
  • the data recommendation module 25 performs a sorting operation from high to low on the video playback integrity value of the data to be tested, obtains the topN video sorting result, and recommends the video sorting result to the corresponding user according to the priority level, where N is an integer greater than 1.
  • the word segmentation tool of this embodiment has its own thesaurus, and adds entertainment stars, movie and TV series names, sports stars, team information, etc. as supplementary thesaurus, which are composed of Netease News, Baidu Encyclopedia, Wikipedia, etc. obtained in the crawler system Mass corpus, word segmentation and word vector training are performed on the corpus, and finally the word vector representation of each word is obtained (the word vector dimension is 200 dimensions, which is determined by the experimental effect, and then the vector is normalized).
  • TF-IDF training is performed to obtain the IDF value, which is normalized, and then the weight of the supplementary lexicon is increased to 1, similar to the attention mechanism, which puts more attention on these words.
  • the video information table is shown in Table 1 below, which carries video id, video title information, classification tag, video tag information, release time, and so on.
  • the video information is segmented, the word vector table of the word is checked, and the IDF value table is combined with the weighted calculation to obtain the word vector representation of the current video (normalized).
  • User portrait acquisition stage that is, the calculation process of user word vector
  • the target user group is active users, that is, there is a certain amount of playback (such as playing more than 10 videos) in the most recent period (such as the last 30 days) and relatively active recently Of users (such as playing records in the last 7 days).
  • the calculation of the user’s word vector is refined according to the tag category. For example, the number of videos played by the user in the last cycle is 100, including 60 sports, 20 finance, 15 funny, 4 social, and 1 healthy; in the process of user portrait User portraits in the tag categories that accounted for TOP3 and accounted for more than 10% were performed in the TOP3 category.
  • This method can obtain the user's main points of interest, and eliminate a small amount of misoperations and hot videos that do not represent the user's points of interest.
  • sports accounted for 60%
  • finance accounted for 20%
  • funny accounted for 15%
  • society accounted for 4%
  • health accounted for 1%; therefore, it is necessary to profile the user in the three dimensions of sports, finance, and funny for the current user, and calculate The word vector representation of the user's corresponding dimension.
  • the user's playback record in the most recent period (such as the most recent 30 days)
  • the above-mentioned characteristics are constructed, and the deep learning model is trained in combination with the user's playback integrity of the video.
  • the model predicts the possible playback integrity of the target user for the unplayed video, and the final recommendation result set is generated by inverting the playback integrity according to the playback integrity.
  • the video playback integrity prediction device provided in the above embodiment triggers the video playback integrity prediction service, it only uses the division of the above functional modules for illustration. In actual applications, the above functions can be allocated according to needs. It is completed by different functional modules, that is, the internal structure of the device is divided into different functional modules to complete all or part of the functions described above.
  • the video playback completeness prediction device provided in the above-mentioned embodiment belongs to the same concept as the video playback completeness prediction method embodiment. For the specific implementation process, please refer to the method embodiment, which will not be repeated here.
  • the video playback completeness prediction method and device provided by the embodiments of the present invention have the following beneficial effects compared with the prior art:
  • the TF-IDF algorithm is used in the field of video recommendation, which effectively highlights the key information of the video through the IDF value;
  • the program can be stored in a computer-readable storage medium.
  • the storage medium mentioned can be a read-only memory, a magnetic disk or an optical disk, etc.
  • These computer program instructions can be provided to the processor of a general-purpose computer, a special-purpose computer, an embedded processor, or other programmable data processing equipment to produce a machine, so that the instructions executed by the processor of the computer or other programmable data processing equipment can be used to generate It is a device that realizes the functions specified in one process or multiple processes in the flowchart and/or one block or multiple blocks in the block diagram.
  • These computer program instructions can also be stored in a computer-readable memory that can guide a computer or other programmable data processing equipment to work in a specific manner, so that the instructions stored in the computer-readable memory produce an article of manufacture including the instruction device.
  • the device implements the functions specified in one process or multiple processes in the flowchart and/or one block or multiple blocks in the block diagram.
  • These computer program instructions can also be loaded on a computer or other programmable data processing equipment, so that a series of operation steps are executed on the computer or other programmable equipment to produce computer-implemented processing, so as to execute on the computer or other programmable equipment.
  • the instructions provide steps for implementing the functions specified in one process or multiple processes in the flowchart and/or one block or multiple blocks in the block diagram.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

一种视频播放完整度预测方法及装置,属于大数据及深度学习技术领域。所述方法包括:输入用户视频播放特征向量的待测数据(101);通过预设视频播放完整度预测模型进行计算(102);输出所述待测数据的视频播放完整度值(103),其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。该方法通过引入播放完整度改进策略,对用户视频播放完整度预测,在观看时长这一重要信息流方面获取了用户更贴近真实的兴趣数据,提升了对用户兴趣的识别准确度,从而提升了推荐的真实相关度,实现了用户观看时长和满意度的较大提升。

Description

一种视频播放完整度预测方法及装置 技术领域
本发明涉及大数据及深度学习技术领域,特别涉及一种视频播放完整度预测方法及装置。
背景技术
视频推荐系统就是在海量用户和视频的基础上,依托大数据分析和人工智能技术,通过研究用户的兴趣偏好构建视频推荐系统,将用户感兴趣的高质量视频推荐给目标用户,解决信息过载问题,达到千人千面的效果,提升用户停留时长和满意度。视频推荐系统通常包括召回和排序两个阶段,召回阶段就是从海量视频里选出一部分候选集,排序阶段就是对召回阶段的候选集进行更精准的统一计算,从候选集中筛选出用户最感兴趣的少量优质视频。
目前有些视频播放平台注册用户数达数亿,日均UV(UniqueVisitor,独立访问用户数)超过千万,移动端日均播放量则更高。为了使得用户在海量视频中发现自己感兴趣的内容。通过收集多个维度的数据(包含用户的基本信息、用户的播放历史、视频的属性、环境的属性等),构建推荐系统,将用户和潜在喜欢的视频联系起来。短视频推荐可以使用的信息较少,一般只有标题和视频类别等信息,目前常用的排序模型采用CTR(Click-Through-Rate,点击通过率)预估的方法。基于点击模型可能助长了标题党,这样并不能带来用户停留时长的提升,影响用户观看时长和满意度的提升。而观看时长作为信息流的重要优化目标,因此在短视频排序模型迫切需要引入播放完整度优化,提升推荐的真实相关度,以达到用户观看时长和满意度的提升。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种视频播放完整度预测方法及装置,通过引入播放完整度改进策略,对用户视频播放完整度预测,在观看时长这一重要信息流方面获取了用户更贴近真实的兴趣数据,提升了对用户兴趣的识别准确度,从而提升了推荐的真实相关度,实现了用户观看时长和满意度的较大提升。
所述技术方案如下:
一方面,提供了一种视频播放完整度预测方法,所述方法包括:
输入用户视频播放特征向量的待测数据;
通过预设视频播放完整度预测模型进行计算;
输出所述待测数据的视频播放完整度值,
其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。
进一步地,所述方法还包括:
收集用户视频播放信息数据;
对所述用户视频播放信息数据进行筛选,获取筛选结果;
对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据。
进一步地,收集所述用户视频播放信息数据,包括:获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的所述用户视频播放信息数据;和/或,
对所述用户视频播放信息数据进行筛选,获取筛选结果,包括:利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对所述用户视频播放信息数据进行筛选,获取筛选结果;和/或,
对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到 的词向量,对所述筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据所述用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。
进一步地,所述预设视频播放完整度预测模型包含三个隐藏层的DNN。
进一步地,所述预设视频播放完整度预测模型是通过将所述用户视频播放训练数据输入训练得到的,其中,所述用户视频播放训练数据为自变量,所述用户观看历史视频播放完整度值为因变量,所述用户视频播放训练数据是根据用户播放历史信息构建的历史用户向量、历史视频向量组合的特征向量。
进一步地,所述方法还包括:
对所述待测数据的视频播放完整度值进行由高到低的排序操作,获取top N的视频排序结果,将所述视频排序结果根据优先级别推荐给对应用户,其中N为大于1的整数。
另一方面,提供了一种视频播放完整度预测装置,所述装置包括模型计算模块,所述模型计算模块用于:
输入用户视频播放特征向量的待测数据,通过预设视频播放完整度预测模型进行计算,输出所述待测数据的视频播放完整度值,其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。
进一步地,所述装置还包括数据收集模块、数据筛选模块和向量生成模块,所述数据收集模块收集所述用户视频播放信息数据;所述数据筛选模块对所述用户视频播放信息数据进行筛选,获取筛选结果;所述向量生成模块对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据。
进一步地,所述数据收集模块获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的所述用户视频播放信息数据;和/或,
所述数据筛选模块利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对所述用户视频播放信息数据进行筛选, 获取筛选结果;和/或,
所述向量生成模块对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到的词向量,对所述筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据所述用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。
进一步地,所述装置还包括数据推荐模块,所述数据推荐模块用于对所述待测数据的视频播放完整度值进行由高到低的排序操作,获取top N的视频排序结果,将所述视频排序结果根据优先级别推荐给对应用户,其中N为大于1的整数。
本发明实施例提供的技术方案带来的有益效果是:
1、通过一改传统的CTR预估方法,引入视频播放完整度指标,通过训练好的预设视频播放完整度预测模型针对不同用户的视频播放完整度进行预测,通过视频播放完整度的预测结果,在观看时长这一重要信息流方面获取了用户更贴近真实的兴趣数据,提升了对用户兴趣的识别准确度,从而提升了推荐的真实相关度,实现了用户观看时长和满意度的较大提升;
2、通过用户画像向量化表示,结合用户行为的时间衰减体现用户的兴趣转移,并且用户画像过程中,过滤掉热点视频和误点视频,避免对用户真实兴趣的影响,用户画像更准确;
3、通过收集用户行为数据、视频质量、视频信息等相关数据,有效地进行了用户特征、视频属性等进行向量化表示,各时段播放视频占比,各类别占比,以及其他环境信息等,通过深度学习建模并针对用户未观看视频预测可能的播放完整度,在短视频推荐排序模型的应用,将不同特征和不同数据源融合,取得不错的效果,提升了用户的平均观看时长;
4、通过构建用户特征、视频特征、上下文特征以及客户端分类等特征,采用深度学习建模,通过AB Test,在随机选择的10%的用户群体应用播放完整度 预估方式,通过最终报表对比CTR、日均播放量、用户平均播放完整度等指标。最终在CTR微降的情况下,带来用户平均播放完整度和日均播放量较大程度的提升;
5、在视频推荐领域采用TF-IDF算法,通过IDF值有效地突出了视频的关键信息;
6、通过短视频播放完整度的预测来提升推荐的真实相关性,寻求在用户停留时长的增长。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的视频播放完整度预测方法流程图;
图2是本发明另一实施例提供的视频播放完整度预测方法流程图;
图3是203步骤中进行特征工程构建的优选实施方式演示图;
图4是本发明实施例提供的预设视频播放完整度预测模型的优选实施方式演示图;
图5是本发明一实施例提供的视频播放完整度预测装置结构示意图;
图6是本发明另一实施例提供的视频播放完整度预测装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施 例,都属于本发明保护的范围。需要说明的是,在本发明的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
本发明实施例提供的视频播放完整度预测方法及装置,通过一改传统的CTR预估方法,引入视频播放完整度指标,通过训练好的预设视频播放完整度预测模型针对不同用户的视频播放完整度进行预测,通过视频播放完整度的预测结果,在观看时长这一重要信息流方面获取了用户更贴近真实的兴趣数据,提升了对用户兴趣的识别准确度,从而提升了推荐的真实相关度,实现了用户观看时长和满意度的较大提升。因此该视频播放完整度预测方法及装置可广泛应用于涉及用户兴趣挖掘、用户需求匹配或用户推荐的多种网络视频应用场景。
下面结合具体实施例及附图,对本发明实施例提供的视频播放完整度预测方法及装置详细说明。
图1是本发明一实施例提供的视频播放完整度预测方法流程图。如图1所示,该频播放完整度预测方法包括以下步骤:
101、输入用户视频播放特征向量的待测数据;
102、通过预设视频播放完整度预测模型进行计算;
103、输出待测数据的视频播放完整度值。
其中,有别于传统用户技术中仅采用标题、视频类别或视频点击率等较少收集信息,这里的用户视频播放特征向量至少包括用户特征向量和视频特征向量,用户特征包括用户画像、用户历史播放记录或用户相关的其他信息,视频特征包括视频类别、视频时长、视频时间、视频播放完整度记录或其他与发布视频有关的其他信息。除用户特征向量和视频特征向量之外,用户视频播放特征向量还可以包括用户客户端分类信息等其他与视频播放相关的信息。另外,预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,具体采用的视频播放完整度预测模型,可以根据需要进行自己设计构建相应深度学习模型进行训练得到,也可以采用现有技术中任何可能的深度学习模型训练得到,本发明实施例不对其加以特别限定。
图2是本发明另一实施例提供的视频播放完整度预测方法流程图。如图2所示,该视频播放完整度预测方法包括以下步骤:
201收集用户视频播放信息数据。
具体地,获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的用户视频播放信息数据。
此过程为进行用户视频播放信息的数据收集阶段,用户视频播放信息主要包括用户信息、用户播放历史信息、视频信息及用户客户端信息几类,用户信息主要是指用户画像信息,包括用户的基本属性信息(性别、年龄等),用户播放历史信息包括用户历史播放各小时占比、用户观看各类视频占比等,客户端信息包括用户设备类型、运营商类型等。除此之外,根据需要,用户视频播放信息还可以收集用户观看每个视频的时间、用户位置信息等与用户播放视频次级关联的上下文信息。
值得注意的是,步骤201收集用户视频播放信息数据的过程,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
202、对用户视频播放信息数据进行筛选,获取筛选结果。
具体地,对用户视频播放信息数据进行筛选,获取筛选结果,包括:利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对用户视频播放信息数据进行筛选,获取筛选结果。
此过程为用户视频播放信息数据粗筛的召回阶段,优选地,主要是对用户视频播放信息数据中的视频信息进行筛选。因为视频规模庞大,可能达到数百万量级,直接输入模型进行数据预处理成本太高,时间也会非常慢,所以可以通过召回阶段粗略筛选出一些质量较高或者说更可能符合用户喜好的视频信息。召回通常采用多通道召回,如用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签等,从而从海量视频里选出一部分期望候选集。
值得注意的是,步骤202对用户视频播放信息数据进行筛选的过程,除了 上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
203、对筛选结果进行特征提取,生成用户视频播放特征向量的待测数据。
具体地,对筛选结果进行特征提取,生成用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到的词向量,对筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。这里的用户词向量和视频词向量对应上述的用户特征向量和视频特征向量。
该过程为特征工程阶段,如图3所示,优选地,在大量语料库上,通过分词以及word2vec模型,训练出每个词200维的词向量,通过向量化的形式来表征词的潜在含义,以此来表示词与词之间的关系,将视频标题分词处理并结合训练得到的IDF等信息,计算获得视频的词向量表示。根据用户历史播放视频的词向量表示,结合时间衰减,计算用户的词向量表示,在计算用户向量的过程中,按照视频标签类别统计用户top3标签的视频且占比超过10%。根据对用户的播放历史分析发现,占比较低的视频标签对应的视频并非用户潜在兴趣点,这部分的播放往往是热点视频或者是用户的误点操作,通过特征提取可将其丢弃。
值得注意的是,步骤203对筛选结果进行特征提取,生成用户视频播放特征向量的过程,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
204、输入用户视频播放特征向量的待测数据。
预设视频播放完整度预测模型是通过将用户视频播放训练数据输入训练得到的,其中,用户视频播放训练数据为自变量,用户观看历史视频播放完整度值为因变量,用户视频播放训练数据是根据用户播放历史信息构建的历史用户向量、历史视频向量组合的特征向量,用于训练得到期望的预设视频播放完整度预测模型。
优选地,预设视频播放完整度预测模型包含三个隐藏层的DNN,输入层的 输入信息包括用户的词向量表示(由用户历史播放视频分词并结合IDF权重计算得到各视频词向量,再综合考虑时间衰减计算得到的200维词向量)、用户的基础画像(性别、年龄等)、各时段播放视频占比(按小时)、各类别视频占比等;视频的词向量(200维)、视频的质量(平均播放完整度、视频热度等)、视频发布时间、视频类别;设备类型、运营商类型;地区;当前时间段等。
值得注意的是,步骤204输入用户视频播放特征向量的待测数据的数据内容和形式,除了上述步骤所述的方式之外,还可以通过其他方式实现该过程,本发明实施例对具体的方式不加以限定。
205、通过预设视频播放完整度预测模型进行计算。
206、输出待测数据的视频播放完整度值。
优选地,206步骤之后,还包括以下步骤:
对待测数据的视频播放完整度值进行由高到低的排序操作,获取topN的视频排序结果,将视频排序结果根据优先级别推荐给对应用户,其中N为大于1的整数。需要注意的是,根据需要也可将视频播放完整度值排序操作的步骤,设计在预设视频播放完整度预测模型计算流程中,正如图4所示,本发明实施例不对其加以特别限定。
图5是本发明一实施例提供的视频播放完整度预测装置结构示意图,如图5所示,该视频播放完整度预测装置包括模型计算模块1,模型计算模块1用于:输入用户视频播放特征向量的待测数据,通过预设视频播放完整度预测模型进行计算,输出待测数据的视频播放完整度值,其中,预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,用户视频播放特征向量至少包括用户特征向量和视频特征向量。
图6是本发明另一实施例提供的视频播放完整度预测装置结构示意图。如图6所示,该视频播放完整度预测装置2包括数据收集模块21、数据筛选模块22、向量生成模块23、模型计算模块24和数据推荐模块25。
其中,数据收集模块21收集用户视频播放信息数据。具体地,数据收集模 块21获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的用户视频播放信息数据。
数据筛选模块22对用户视频播放信息数据进行筛选,获取筛选结果。具体地,数据筛选模块22利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对用户视频播放信息数据进行筛选,获取筛选结果。
向量生成模块23对筛选结果进行特征提取,生成用户视频播放特征向量。具体地,向量生成模块23对筛选结果进行特征提取,生成用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到的词向量,对筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。这里的用户词向量和视频词向量对应下述的用户特征向量和视频特征向量。
模型计算模块24输入用户视频播放特征向量的待测数据,通过预设视频播放完整度预测模型进行计算,输出待测数据的视频播放完整度值,其中,预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,用户视频播放特征向量至少包括用户特征向量和视频特征向量。
数据推荐模块25,对待测数据的视频播放完整度值进行由高到低的排序操作,获取topN的视频排序结果,将视频排序结果根据优先级别推荐给对应用户,其中N为大于1的整数。
下面介绍本发明实施例提供的视频播放完整度预测方法及装置的一优选实施方式。
首先,本实施例的分词工具自带词库,另外增加娱乐明星、影视剧名称、体育明星、球队信息等作为补充词库,在爬虫系统获取的网易新闻、百度百科、维基百科等构成的海量语料库,针对语料库进行分词并进行词向量训练,最终得到每个词的词向量表示(词向量维度为200维,由实验效果确定,然后对向量进行 归一化)。
在上述语料库下,进行TF-IDF训练得到IDF值,进行归一化,然后将补充词库进行权重提升为1,类似于attention机制,对这些词语投入更多的专注度。
视频信息表如下表1所示,其携带有视频id、视频标题信息、分类标签、视频标签信息、发布时间等。将视频信息进行分词,并查词语的词向量表,结合IDF值表加权计算得到当前视频的词向量表示(进行归一化)。
Figure PCTCN2020097861-appb-000001
表1视频信息表
用户画像获取阶段,即用户词向量的计算过程,针对的目标用户群为活跃用户,也就是最近一个周期内(如最近30天)有一定播放量(如播放超过10个视频)且近期较为活跃的用户(如最近7天有播放记录)。用户的词向量计算按照标签类别进行细化,例如用户近一个周期内播放视频数为100个,其中体育60个,财经20个,搞笑15个,社会4个,健康1个;在用户画像过程中分别针对占比TOP3且占比超过10%的标签类别下进行用户画像,通过该方法可以获取用户的主要兴趣点,剔除掉少量的误点操作以及并不能代表用户兴趣点的热点视频。在本例中,体育占60%,财经占20%,搞笑占15%,社会占4%,健康占1%;因此需要针对当前用户在体育、财经、搞笑三个维度对用户进行画像,计算用户相应维度的词向量表示。
在用户不同的标签类别下进行用户词向量计算的过程中,结合时间衰减因素(如衰减周期5天,衰减系数0.95,例如当前日期之前第12天播放的视频,跨越两个衰减周期,需要衰减0.95^2)计算用户的词向量表示。
在特征工程构建阶段,用户词向量(200维)、视频词向量(200维)、用户观看该类别占比、用户历史播放各小时占比、用户性别、用户年龄(按照20岁 以上、20~30岁、30~40岁、40~50岁、50岁以上进行划分,on-hot编码)、当前视频分类标签、视频时长(单位秒)、视频发布时间(距离当前时间的天数)、视频平均播放完整度(最近24小时被用户播放的平均播放完整度)、热度等级(按播放次数划分为5个等级,one-hot编码)、用户观看视频时间(星期几、当前的时段,进行one-hot编码)、位置信息(按照省份进行one-hot编码)、终端类型(one-hot编码)、运营商类型(one-hot编码)。
根据最近一个周期内(如最近30天),用户的播放记录构建上述特征,结合用户对视频的播放完整度,训练深度学习模型。
针对召回阶段给用户的推荐结果集,通过模型预测目标用户对于未播放视频的可能的播放完整度,根据播放完整度进行倒排生成最终的推荐结果集。
需要说明的是:上述实施例提供的视频播放完整度预测装置在触发视频播放完整度预测业务时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的视频播放完整度预测装置与视频播放完整度预测方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
综上所述,本发明实施例提供的视频播放完整度预测方法及装置,相比现有技术,具有以下有益效果:
1、通过一改传统的CTR预估方法,引入视频播放完整度指标,通过训练好的预设视频播放完整度预测模型针对不同用户的视频播放完整度进行预测,通过视频播放完整度的预测结果,在观看时长这一重要信息流方面获取了用户更贴近真实的兴趣数据,提升了对用户兴趣的识别准确度,从而提升了推荐的真实相关度,实现了用户观看时长和满意度的较大提升;
2、通过用户画像向量化表示,结合用户行为的时间衰减体现用户的兴趣转 移,并且用户画像过程中,过滤掉热点视频和误点视频,避免对用户真实兴趣的影响,用户画像更准确;
3、通过收集用户行为数据、视频质量、视频信息等相关数据,有效地进行了用户特征、视频属性等进行向量化表示,各时段播放视频占比,各类别占比,以及其他环境信息等,通过深度学习建模并针对用户未观看视频预测可能的播放完整度,在短视频推荐排序模型的应用,将不同特征和不同数据源融合,取得不错的效果,提升了用户的平均观看时长;
4、通过构建用户特征、视频特征、上下文特征以及客户端分类等特征,采用深度学习建模,通过AB Test,在随机选择的10%的用户群体应用播放完整度预估方式,通过最终报表对比CTR、日均播放量、用户平均播放完整度等指标。最终在CTR微降的情况下,带来用户平均播放完整度和日均播放量较大程度的提升;
5、在视频推荐领域采用TF-IDF算法,通过IDF值有效地突出了视频的关键信息;
6、通过短视频播放完整度的预测来提升推荐的真实相关性,寻求在用户停留时长的增长。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一 个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

  1. 一种视频播放完整度预测方法,其特征在于,所述方法包括:
    输入用户视频播放特征向量的待测数据;
    通过预设视频播放完整度预测模型进行计算;
    输出所述待测数据的视频播放完整度值,
    其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。
  2. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    收集用户视频播放信息数据;
    对所述用户视频播放信息数据进行筛选,获取筛选结果;
    对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据。
  3. 根据权利要求2所述的方法,其特征在于,
    收集所述用户视频播放信息数据,包括:获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的所述用户视频播放信息数据;和/或,
    对所述用户视频播放信息数据进行筛选,获取筛选结果,包括:利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对所述用户视频播放信息数据进行筛选,获取筛选结果;和/或,
    对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到的词向量,对所述筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据所述用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。
  4. 根据权利要求1所述的方法,其特征在于,所述预设视频播放完整度预测模型包含三个隐藏层的DNN。
  5. 根据权利要求4所述的方法,其特征在于,所述预设视频播放完整度预测模型是通过将所述用户视频播放训练数据输入训练得到的,其中,所述用户视频播放训练数据为自变量,所述用户观看历史视频播放完整度值为因变量,所述用户视频播放训练数据是根据用户播放历史信息构建的历史用户向量、历史视频向量组合的特征向量。
  6. 根据权利要求1所述的方法,其特征在于,所述方法还包括:
    对所述待测数据的视频播放完整度值进行由高到低的排序操作,获取topN的视频排序结果,将所述视频排序结果根据优先级别推荐给对应用户,其中N为大于1的整数。
  7. 一种视频播放完整度预测装置,其特征在于,所述装置包括模型计算模块,所述模型计算模块用于:
    输入用户视频播放特征向量的待测数据,通过预设视频播放完整度预测模型进行计算,输出所述待测数据的视频播放完整度值,其中,所述预设视频播放完整度预测模型是通过用户视频播放训练数据训练得到的,所述用户视频播放特征向量至少包括用户特征向量和视频特征向量。
  8. 根据权利要求7所述的装置,其特征在于,所述装置还包括数据收集模块、数据筛选模块和向量生成模块,所述数据收集模块收集用户视频播放信息数据;所述数据筛选模块对所述用户视频播放信息数据进行筛选,获取筛选结果;所述向量生成模块对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据。
  9. 根据权利要求8所述的装置,其特征在于,
    所述数据收集模块获取包括用户信息、用户播放历史信息、视频信息及用户客户端信息在内的所述用户视频播放信息数据;和/或,
    所述数据筛选模块利用包括用户协同、用户搜索、主题模型、热门推荐、用户画像和视频标签的多通道召回方式,对所述用户视频播放信息数据进行筛选,获取筛选结果;和/或,
    所述向量生成模块对所述筛选结果进行特征提取,生成所述用户视频播放特征向量的待测数据,包括:利用通过word2vec模型和IDF权值训练对预设海量语料库训练得到的词向量,对所述筛选结果中的视频标题和视频分类标签进行分词,生成视频词向量,然后根据所述用户播放历史信息结合时间衰减进行词向量计算,生成用户词向量。
  10. 根据权利要求7所述的装置,其特征在于,所述装置还包括数据推荐模块,所述数据推荐模块用于对所述待测数据的视频播放完整度值进行由高到低的排序操作,获取topN的视频排序结果,将所述视频排序结果根据优先级别推荐给对应用户,其中N为大于1的整数。
PCT/CN2020/097861 2019-09-05 2020-06-24 一种视频播放完整度预测方法及装置 WO2021042826A1 (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CA3153598A CA3153598A1 (en) 2019-09-05 2020-06-24 Method of and device for predicting video playback integrity

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201910845413.2 2019-09-05
CN201910845413.2A CN110704674B (zh) 2019-09-05 2019-09-05 一种视频播放完整度预测方法及装置

Publications (1)

Publication Number Publication Date
WO2021042826A1 true WO2021042826A1 (zh) 2021-03-11

Family

ID=69195102

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2020/097861 WO2021042826A1 (zh) 2019-09-05 2020-06-24 一种视频播放完整度预测方法及装置

Country Status (3)

Country Link
CN (1) CN110704674B (zh)
CA (1) CA3153598A1 (zh)
WO (1) WO2021042826A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220936A (zh) * 2021-06-04 2021-08-06 黑龙江广播电视台 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110704674B (zh) * 2019-09-05 2022-11-25 苏宁云计算有限公司 一种视频播放完整度预测方法及装置
CN111918136B (zh) * 2020-07-04 2022-07-01 中信银行股份有限公司 一种兴趣的分析方法及装置、存储介质、电子设备
CN111538912B (zh) * 2020-07-07 2020-12-25 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN111565316B (zh) * 2020-07-15 2020-10-23 腾讯科技(深圳)有限公司 视频处理方法、装置、计算机设备及存储介质
CN112887795B (zh) * 2021-01-26 2023-04-21 脸萌有限公司 视频播放方法、装置、设备和介质
CN115086705A (zh) * 2021-03-12 2022-09-20 北京字跳网络技术有限公司 一种资源预加载方法、装置、设备和存储介质
CN113132803B (zh) * 2021-04-23 2022-09-16 Oppo广东移动通信有限公司 视频观看时长预测方法、装置、存储介质以及终端
CN113312512B (zh) * 2021-06-10 2023-10-31 北京百度网讯科技有限公司 训练方法、推荐方法、装置、电子设备以及存储介质
CN113873330B (zh) * 2021-08-31 2023-03-10 武汉卓尔数字传媒科技有限公司 视频推荐方法、装置、计算机设备和存储介质
CN114339417B (zh) * 2021-12-30 2024-05-10 未来电视有限公司 一种视频推荐的方法、终端设备和可读存储介质
CN114339402A (zh) * 2021-12-31 2022-04-12 北京字节跳动网络技术有限公司 视频播放完成率预测方法、装置、介质及电子设备
CN115082301B (zh) * 2022-08-22 2022-12-02 中关村科学城城市大脑股份有限公司 定制视频生成方法、装置、设备和计算机可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100165A (zh) * 2014-05-20 2015-11-25 深圳市腾讯计算机系统有限公司 网络服务推荐方法和装置
CN106028071A (zh) * 2016-05-17 2016-10-12 Tcl集团股份有限公司 一种视频推荐方法及系统
CN106446052A (zh) * 2016-08-31 2017-02-22 北京魔力互动科技有限公司 一种基于用户集合的视频点播节目推荐方法
CN108260008A (zh) * 2018-02-11 2018-07-06 北京未来媒体科技股份有限公司 一种视频推荐方法、装置及电子设备
CN108460085A (zh) * 2018-01-19 2018-08-28 北京奇艺世纪科技有限公司 一种基于用户日志的视频搜索排序训练集构建方法及装置
CN110704674A (zh) * 2019-09-05 2020-01-17 苏宁云计算有限公司 一种视频播放完整度预测方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10516906B2 (en) * 2015-09-18 2019-12-24 Spotify Ab Systems, methods, and computer products for recommending media suitable for a designated style of use
US10827221B2 (en) * 2016-06-24 2020-11-03 Sourse Pty Ltd Selectively playing videos
CN106227883B (zh) * 2016-08-05 2019-09-13 北京数码视讯科技股份有限公司 一种多媒体内容的热度分析方法和装置
CN107832437B (zh) * 2017-11-16 2021-03-02 北京小米移动软件有限公司 音/视频推送方法、装置、设备及存储介质
CN107948761B (zh) * 2017-12-12 2021-01-01 上海哔哩哔哩科技有限公司 弹幕播放控制方法、服务器及弹幕播放控制系统
CN110059221B (zh) * 2019-03-11 2023-10-20 咪咕视讯科技有限公司 视频推荐方法、电子设备及计算机可读存储介质
CN110012356B (zh) * 2019-04-16 2020-07-10 腾讯科技(深圳)有限公司 视频推荐方法、装置和设备及计算机存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100165A (zh) * 2014-05-20 2015-11-25 深圳市腾讯计算机系统有限公司 网络服务推荐方法和装置
CN106028071A (zh) * 2016-05-17 2016-10-12 Tcl集团股份有限公司 一种视频推荐方法及系统
CN106446052A (zh) * 2016-08-31 2017-02-22 北京魔力互动科技有限公司 一种基于用户集合的视频点播节目推荐方法
CN108460085A (zh) * 2018-01-19 2018-08-28 北京奇艺世纪科技有限公司 一种基于用户日志的视频搜索排序训练集构建方法及装置
CN108260008A (zh) * 2018-02-11 2018-07-06 北京未来媒体科技股份有限公司 一种视频推荐方法、装置及电子设备
CN110704674A (zh) * 2019-09-05 2020-01-17 苏宁云计算有限公司 一种视频播放完整度预测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220936A (zh) * 2021-06-04 2021-08-06 黑龙江广播电视台 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质
CN113220936B (zh) * 2021-06-04 2023-08-15 黑龙江广播电视台 基于随机矩阵编码和简化卷积网络的视频智能推荐方法、装置及存储介质

Also Published As

Publication number Publication date
CN110704674B (zh) 2022-11-25
CA3153598A1 (en) 2021-03-11
CN110704674A (zh) 2020-01-17

Similar Documents

Publication Publication Date Title
WO2021042826A1 (zh) 一种视频播放完整度预测方法及装置
CN111241311B (zh) 媒体信息推荐方法、装置、电子设备及存储介质
US11386137B2 (en) Dynamic feedback in a recommendation system
CN110781321B (zh) 一种多媒体内容推荐方法及装置
CN103559206B (zh) 一种信息推荐方法及系统
CN107832437B (zh) 音/视频推送方法、装置、设备及存储介质
WO2017096877A1 (zh) 一种推荐方法和装置
CN106294830A (zh) 多媒体资源的推荐方法及装置
CN109189990B (zh) 一种搜索词的生成方法、装置及电子设备
EP3510496A1 (en) Compiling documents into a timeline per event
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
CN111708901A (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CN112052387B (zh) 一种内容推荐方法、装置和计算机可读存储介质
CN111241394B (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
CN107341272A (zh) 一种推送方法、装置和电子设备
CN111597446B (zh) 基于人工智能的内容推送方法、装置、服务器和存储介质
CN110019943A (zh) 视频推荐方法、装置、电子设备和存储介质
CN112464100B (zh) 信息推荐模型训练方法、信息推荐方法、装置及设备
CN112507163A (zh) 时长预测模型训练方法、推荐方法、装置、设备及介质
CN112131456A (zh) 一种信息推送方法、装置、设备及存储介质
Vilakone et al. Movie recommendation system based on users’ personal information and movies rated using the method of k-clique and normalized discounted cumulative gain
CN114186130A (zh) 一种基于大数据的体育资讯推荐方法
CN110781377B (zh) 一种文章推荐方法、装置
CN112364184A (zh) 多媒体数据的排序方法、装置、服务器及存储介质
CN107707940A (zh) 视频排序方法、装置、服务器及系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20861635

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 3153598

Country of ref document: CA

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20861635

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 20861635

Country of ref document: EP

Kind code of ref document: A1