CN108416446B - 一种视频满意度确定方法及装置 - Google Patents

一种视频满意度确定方法及装置 Download PDF

Info

Publication number
CN108416446B
CN108416446B CN201810215682.6A CN201810215682A CN108416446B CN 108416446 B CN108416446 B CN 108416446B CN 201810215682 A CN201810215682 A CN 201810215682A CN 108416446 B CN108416446 B CN 108416446B
Authority
CN
China
Prior art keywords
sample
video
playing
target
playing operation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810215682.6A
Other languages
English (en)
Other versions
CN108416446A (zh
Inventor
赵晓萌
胡军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201810215682.6A priority Critical patent/CN108416446B/zh
Publication of CN108416446A publication Critical patent/CN108416446A/zh
Application granted granted Critical
Publication of CN108416446B publication Critical patent/CN108416446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种视频满意度确定方法及装置,属于计算机技术领域。本发明中,会先获取目标视频在播放操作中的播放特征以及目标视频的属性特征,得到目标特征,然后将目标特征作为预设的满意度确定模型的输入,通过预设的满意度确定模型确定在该播放操作中,用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,不同的目标视频的目标特征可能不同,以目标特征作为预设的满意度确定模型的输入,即就是作为判断依据,来确定用户对目标视频是否满意的方式,可以保证不同的目标视频的判断依据是根据自身情况确定的,进而提高确定视频满意度的准确度。

Description

一种视频满意度确定方法及装置
技术领域
本发明属于计算机技术领域,特别是涉及一种视频满意度确定方法及装置。
背景技术
随着计算机技术的不断发展,视频平台中的视频越来越多,视频搜索也得到了更加广泛的应用。在视频搜索中,移动终端经常会基于用户对搜索结果中各个视频的满意度,对搜索结果进行排序。作为视频排序的重要参数,如何确定用户对视频的满意度成为人们广泛关注的问题。
现有技术中,通常是基于固定时长阈值30秒(second,s)来确定用户对该视频是否满意。具体的,在用户对视频的点击时长大于30s时,确定用户对该视频满意。
但是,由于每个视频的时长不同,相对于时长较长的视频点击时长很容易达到30s,但是对于此类视频观看30s并不能说明用户对视频满意,进而会出现将用户不满意的视频确定为用户满意的视频,相应地,对于时长较短的视频,有可能视频时长都没有达到30s,对于此类视频用户的点击时长很难达到固定时长阈值,进而会将用户满意的视频确定为用户不满意的视频,因此,现有技术中的视频满意度确定方法准确度较低,确定效果较差。
发明内容
本发明提供一种视频满意度确定方法及装置,以便解决基于固定时长阈值判断用户对视频的满意度,导致的准确度较低,确定效果较差的问题。
依据本发明的第一方面,提供了一种视频满意度确定方法,该方法包括:
获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征;
将所述目标特征作为预设的满意度确定模型的输入,通过所述预设的满意度确定模型确定在所述播放操作中,用户对所述目标视频是否满意;
其中,所述目标视频的属性特征至少包括所述目标视频的时长,所述目标视频的播放特征至少包括所述目标视频在所述播放操作中的时长参数,所述时长参数包括播放时长和/或点击时长;所述预设的满意度确定模型是基于样本视频对应的样本特征以及标注值确定的。
可选的,在所述获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征的步骤之前,所述方法还包括:
根据样本视频确定预设的满意度确定模型。
可选的,所述根据样本视频确定预设的满意度确定模型的步骤,包括:
获取每个样本视频对应的样本日志;
基于每个样本视频对应的样本日志,确定每个样本视频在每次历史播放操作中对应的样本特征以及标注值,得到多个训练样本对;
基于所述多个训练样本对进行训练,得到预设的满意度确定模型;
其中,所述样本特征包括所述样本视频的属性特征以及所述样本视频在所述历史播放操作中对应的播放特征,所述样本视频的属性特征至少包括样本视频的时长,所述样本视频在所述历史播放操作中对应的播放特征至少包括:样本视频在所述历史播放操作中的历史时长参数,所述历史时长参数包括历史播放时长和/或历史点击时长。
可选的,所述获取每个样本视频对应的样本日志的步骤,包括:
获取每个样本视频在预设时间段内的备选日志;
对于每个样本视频,将所述样本视频对应的备选日志中包含同一用户标识的备选日志划分至同一类别;
将包含的备选日志的条数不大于预设条数阈值的类别确定为样本类别;
将所述样本类别中的备选日志,确定为所述样本视频对应的样本日志。
可选的,所述样本视频的属性特征还包括样本视频的类型以及所属的频道;
所述样本视频在所述历史播放操作中对应的播放特征还包括:样本视频在所述历史播放操作中的播放端类型、样本视频在所述历史播放操作中播放时间点的日期属性、历史播放操作对应的样本搜索关键词的类型、样本搜索关键词在预设时长内被搜索的次数以及样本视频在所述历史播放操作中的新鲜度。
可选的,所述目标视频的属性特征还包括所述目标视频的类型以及所属的频道;
所述目标视频的播放特征还包括所述目标视频在所述播放操作中的播放端类型、所述目标视频在所述播放操作中播放时间点的日期属性、所述播放操作对应的搜索关键词的类型、所述搜索关键词在预设时长内被搜索的次数以及所述目标视频在所述播放操作中的新鲜度。
可选的,所述基于每个样本视频对应的样本日志,确定每个样本视频在每次历史播放操作中对应的样本特征以及标注值,得到多个训练样本对的步骤,包括:
根据每个样本视频对应的样本日志中的关键字段,确定每个样本视频的属性特征、每个样本视频在每次历史播放操作中对应的播放特征以及对应的标注值;
对于每个样本视频,将所述样本视频在每次历史播放操作中对应的播放特征分别与所述样本视频的属性特征组合,得到所述样本视频在每次历史播放操作中对应的样本特征;
将每个样本视频在每次历史播放操作中对应的样本特征以及对应的标注值组合,得到多个训练样本对。
可选的,所述基于所述多个训练样本对进行训练,得到预设的满意度确定模型的步骤,包括:
将每个训练样本对代入初始学习器中,计算每个训练样本对相对所述初始学习器的负梯度;
利用每个训练样本对中的样本特征和每个训练样本对的负梯度组成第二样本对,并进行拟合,得到回归树函数;
计算所述回归树函数的损失值;
若所述损失值在预设范围内,则将所述初始学习器确定为预设的满意度确定模型;
若所述损失值不在预设范围内,则利用所述回归树函数对所述初始学习器进行更新,将更新后的学习器确定为初始学习器,继续进行训练,直至所述损失值在预设范围内。
依据本发明的第二方面,提供了一种视频满意度确定装置,该装置包括:
获取模块,用于获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征;
第一确定模块,用于将所述目标特征作为预设的满意度确定模型的输入,通过所述预设的满意度确定模型确定在所述播放操作中,用户对所述目标视频是否满意;
其中,所述目标视频的属性特征至少包括所述目标视频的时长,所述目标视频的播放特征至少包括所述目标视频在所述播放操作中的时长参数,所述时长参数包括播放时长和/或点击时长;所述预设的满意度确定模型是基于样本视频对应的样本特征以及标注值确定的。
可选的,所述装置还包括:
第二确定模块,用于根据样本视频确定预设的满意度确定模型。
可选的,所述第二确定模块,包括:
获取子模块,用于获取每个样本视频对应的样本日志;
确定子模块,用于基于每个样本视频对应的样本日志,确定每个样本视频在每次历史播放操作中对应的样本特征以及标注值,得到多个训练样本对;
训练子模块,用于基于所述多个训练样本对进行训练,得到预设的满意度确定模型;
其中,所述样本特征包括所述样本视频的属性特征以及所述样本视频在所述历史播放操作中对应的播放特征,所述样本视频的属性特征至少包括样本视频的时长,所述样本视频在所述历史播放操作中对应的播放特征至少包括:样本视频在所述历史播放操作中的历史时长参数,所述历史时长参数包括历史播放时长和/或历史点击时长。
可选的,所述获取子模块,用于:
获取每个样本视频在预设时间段内的备选日志;
对于每个样本视频,将所述样本视频对应的备选日志中包含同一用户标识的备选日志划分至同一类别;
将包含的备选日志的条数不大于预设条数阈值的类别确定为样本类别;
将所述样本类别中的备选日志,确定为所述样本视频对应的样本日志。
可选的,所述样本视频的属性特征还包括样本视频的类型以及所属的频道;
所述样本视频在所述历史播放操作中对应的播放特征还包括:样本视频在所述历史播放操作中的播放端类型、样本视频在所述历史播放操作中播放时间点的日期属性、历史播放操作对应的样本搜索关键词的类型、样本搜索关键词在预设时长内被搜索的次数以及样本视频在所述历史播放操作中的新鲜度。
可选的,所述目标视频的属性特征还包括所述目标视频的类型以及所属的频道;
所述目标视频的播放特征还包括所述目标视频在所述播放操作中的播放端类型、所述目标视频在所述播放操作中播放时间点的日期属性、所述播放操作对应的搜索关键词的类型、所述搜索关键词在预设时长内被搜索的次数以及所述目标视频在所述播放操作中的新鲜度。
可选的,所述确定子模块,用于:
根据每个样本视频对应的样本日志中的关键字段,确定每个样本视频的属性特征、每个样本视频在每次历史播放操作中对应的播放特征以及对应的标注值;
对于每个样本视频,将所述样本视频在每次历史播放操作中对应的播放特征分别与所述样本视频的属性特征组合,得到所述样本视频在每次历史播放操作中对应的样本特征;
将每个样本视频在每次历史播放操作中对应的样本特征以及对应的标注值组合,得到多个训练样本对。
可选的,所述训练子模块,用于:
将每个训练样本对代入初始学习器中,计算每个训练样本对相对所述初始学习器的负梯度;
利用每个训练样本对中的样本特征和每个训练样本对的负梯度组成第二样本对,并进行拟合,得到回归树函数;
计算所述回归树函数的损失值;
若所述损失值在预设范围内,则将所述初始学习器确定为预设的满意度确定模型;
若所述损失值不在预设范围内,则利用所述回归树函数对所述初始学习器进行更新,将更新后的学习器确定为初始学习器,继续进行训练,直至所述损失值在预设范围内。
针对在先技术,本发明具备如下优点:
本发明实施例中,会先获取目标视频在播放操作中的播放特征以及目标视频的属性特征,得到目标特征,然后将目标特征作为预设的满意度确定模型的输入,通过预设的满意度确定模型确定在该播放操作中,用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,不同的目标视频的目标特征可能不同,以目标特征作为预设的满意度确定模型的输入,即就是作为判断依据,来确定用户对目标视频是否满意的方式,可以保证不同的目标视频的判断依据是根据自身情况确定的,进而提高确定视频满意度的准确度。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例一提供的一种视频满意度确定方法的步骤流程图;
图2是本发明实施例二提供的一种视频满意度确定方法的步骤流程图;
图3是本发明实施例三提供的一种视频满意度确定装置的框图;
图4是本发明实施例四提供的一种视频满意度确定装置的框图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
实施例一
图1是本发明实施例一提供的一种视频满意度确定方法的步骤流程图,如图1所示,该方法可以包括:
步骤101、获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征。
本发明实施例中,目标视频在播放操作中的播放特征至少可以包括目标视频在播放操作中的时长参数,目标视频的属性特征至少可以包括目标视频的时长。该时长参数可以包括播放时长和/或点击时长。其中,播放时长是指目标视频被目标用户打开的时间点与目标视频被目标用户关闭的时间点之间的时长,点击时长是指目标视频被目标用户打开的时间点与目标用户的下一次行为的时间点之间的时长,具体的,该行为可以是目标用户点击下一个结果,或者利用新的关键词重新搜索视频,或者退出视频搜索,等等。
示例的,假设用户“张三”在2018年2月1日的8:00打开视频A,开始播放,之后,张三又在2018年2月1日的8:20打开了视频B,同时播放视频A和视频B,直到2018年2月1日的8:22关闭视频A,那么可以确定视频A的点击时长为20分钟,播放时长为22分钟。
具体的,在获取播放时长时,可以从视频应用的后台获取目标用户打开目标视频时,生成的行为日志,提取该行为日志中的时间戳,进而得到目标视频被目标用户打开的时间点,获取目标用户关闭目标视频时,生成的行为日志,提取该行为日志中的时间戳,进而得到目标视频被目标用户关闭的时间点,计算打开的时间点和关闭的时间点之间的时长,进而得到播放时长;相应地,在获取点击时长时,可以从视频应用的后台获取目标用户打开目标视频时,生成的行为日志,提取该行为日志中的时间戳,进而得到目标视频被目标用户打开的时间点,获取目标用户的下一次行为,生成的行为日志,提取该行为日志中的时间戳,进而得到目标用户执行下一次行为的时间点,计算打开的时间点和执行下一次行为的时间点之间的时长,进而得到点击时长,实际应用中,可以根据实际需求选择以点击时长,或者以播放时长,或者以点击时长和播放时长作为时长参数,本发明实施例对此不作限定。
步骤102、将所述目标特征作为预设的满意度确定模型的输入,通过所述预设的满意度确定模型确定在所述播放操作中,用户对所述目标视频是否满意。
本发明实施例中,该预设的满意度确定模型可以是基于样本视频对应的样本特征以及标注值确定的。其中,样本特征可以是样本视频在历史播放操作中的播放特征以及样本视频的属性特征,标注值可以是按照用户对样本视频是否满意设置的,示例的,可以在用户对样本视频满意时,设置标注值为“1”,在用户对样本视频不满意时,设置标注值为“0”。这样,训练出来的预设的满意度确定模型,就可以根据输入的目标特征,来确定用户对目标视频是否满意。示例的,可以在预设的满意度确定模型输出为1时,确定用户对目标视频满意,在预设的满意度确定模型输出为0时,确定用户对目标视频不满意。
综上所述,本发明实施例一提供的视频满意度确定方法,会先获取目标视频在播放操作中的播放特征以及目标视频的属性特征,得到目标特征,然后将目标特征作为预设的满意度确定模型的输入,通过预设的满意度确定模型确定在该播放操作中,用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,不同的目标视频的目标特征可能不同,以目标特征作为预设的满意度确定模型的输入,即就是作为判断依据,来确定用户对目标视频是否满意的方式,可以保证不同的目标视频的判断依据是根据自身情况确定的,进而提高确定视频满意度的准确度。
实施例二
图2是本发明实施例二提供的一种视频满意度确定方法的步骤流程图,如图2所示,该方法可以包括:
步骤201、根据样本视频确定预设的满意度确定模型。
具体的,步骤201可以包括:
步骤2011、获取每个样本视频对应的样本日志。
本发明实施例中,步骤2011可以通过下述步骤2011a~步骤2011d来实现:
步骤2011a、获取每个样本视频在预设时间段内的备选日志。
本步骤中,样本视频可以是由开发人员选取的,示例的,可以将最近一周在视频平台内被搜索的视频作为样本视频,当然,也可以将视频平台内的所有视频作为样本视频,本发明实施例对此不作限定。进一步地,可以从视频平台的后台获取在预设时间段内,根据用户对这些样本视频的行为产生的行为日志,得到备选日志,该预设时间段可以是由开发人员根据实际需求来确定的,本发明实施例对此不作限定,示例的,该预设时间段的时长可以是一周,也可以是一个月,等等。
一般,用户针对视频的每个行为都会产生的行为日志,行为日志中可以包括被点击视频的视频标识(video_id),本发明实施例中,从视频平台的后台中获取备选日志时,可以将在预设时间段内产生,且包含样本视频的标识的行为日志,确定为该样本视频的备选日志。示例的,假设预设时间段为2018年2月5日至2018年2月11日,样本视频为样本视频a,那么,可以在视频平台的后台获取这7天内,包含样本视频a的标识的行为日志,进而得到视频a在预设时间段内的备选日志。
步骤2011b、对于每个样本视频,将所述样本视频对应的备选日志中包含同一用户标识的备选日志划分至同一类别。
实际的应用场景中,用户针对视频的行为所产生的行为日志中,还可以包括点击该视频的用户的用户标识(user_id),因此,包含同一用户标识的备选日志的条数,可以体现该用户标识所表示的用户对该样本视频进行操作的次数。本步骤中,可以将备选日志中包含相同的用户标识的备选日志划分至同一类别,每个类别代表一个用户对该样本视频在预设时间段内进行操作的次数,进而统计出同一个人对该视频进行操作,比如,搜索、点击或评价的次数。
步骤2011c、将包含的备选日志的条数不大于预设条数阈值的类别确定为样本类别。
本步骤中,该预设条数阈值可以是开发人员预先定义的,该预设条数阈值可以是开发人员预先针对视频的作弊行为进行分析,确定出来的。示例的,可以将在预设时间段内,针对样本视频的作弊行为会产生的行为日志条数确定为预设条数阈值。实际的应用场景中,部分视频为了提高视频流量,会在短时间内操控用户反复对该视频进行操作,这样的作弊行为产生的行为日志与视频本身的质量无关,会给样本视频带来大量不真实的日志数据,如果以作弊行为产生的行为日志作为样本日志,就会导致后续的模型训练结果出现偏差,进而降低视频满意度确定的准确性。为了避免作弊行为带来的影响,本发明实施例中,以能够体现作弊行为特性的预设条数阈值对样本视频的备选日志进行筛选,可以避免作弊行为带来的问题。
假设样本视频a的备选日志被划分至60个类别中,其中,有56个类别包含的备选日志的条数不大于预设条数阈值,那么可以将这56个类别确定为样本类别。
步骤2011d、将所述样本类别中的备选日志,确定为所述样本视频对应的样本日志。
示例的,可以将这56个类别中包含的备选日志,确定为样本视频a对应的样本日志。本发明实施例中,通过将包含的条数不大于预设条数阈值的样本类别中备选日志作为样本日志,可以将针对样本视频的作弊行为产生的备选日志过滤掉,进而保证样本日志的真实准确性。
需要说明的是,行为日志中还可以包括搜索事件标识(event_id),视频平台会为每次搜索操作分配一个event_id,基于该次搜索操作的其他操作产生的行为日志中,也会包含该分配的event_id,比如,点击该次搜索操作返回的内容产生的行为日志中会包含该次搜索操作的event_id,相应地,在对作弊行为进行过滤时,可以在包含同一event_id的行为日志的条数大于预设条数阈值时,过滤掉这些行为日志。
步骤2012、基于每个样本视频对应的样本日志,确定每个样本视频在每次历史播放操作中对应的样本特征以及标注值,得到多个训练样本对。
本步骤中,样本特征包括样本视频的属性特征以及样本视频在历史播放操作中对应的播放特征。其中,样本视频的属性特征至少可以包括样本视频的时长,样本视频在历史播放操作中对应的播放特征至少可以包括:样本视频在历史播放操作中的历史时长参数,该历史时长参数可以包括历史播放时长和/或历史点击时长。
进一步地,样本视频的属性特征还可以包括样本视频的类型以及所属的频道,样本视频在历史播放操作中对应的播放特征还可以包括:样本视频在历史播放操作中的播放端类型、样本视频在历史播放操作中播放时间点的日期属性、历史播放操作对应的样本搜索关键词的类型、样本搜索关键词在预设时长内被搜索的次数以及样本视频在历史播放操作中的新鲜度,其中,该新鲜度与样本视频进入视频系统的时间点和样本视频在所述历史播放操作中播放时间点的差值正相关。本发明实施例中,通过丰富样本特征包含的参数,可以提高后续训练出来的满意度确定模型的识别能力,进而提高根据该满意度确定模型判断用户对目标视频是否满意的准确性。
具体的,步骤2012可以通过下述步骤2012a~步骤2012c来实现:
步骤2012a、根据每个样本视频对应的样本日志中的关键字段,确定每个样本视频的属性特征、每个样本视频在每次历史播放操作中对应的播放特征以及对应的标注值。
具体的,步骤2012a可以通过下述子步骤(1)~子步骤(3)来实现:
子步骤(1):提取每个样本视频对应的样本日志中的关键字段,根据所述关键字段所指示的内容确定每个样本视频在对应的每次历史播放操作中对应的播放端类型、历史时长参数、样本搜索关键词、样本搜索关键词的类型、样本搜索关键词在预设时长内被搜索的次数以及样本视频在历史播放操作中的新鲜度,得到每个样本视频在每次历史播放操作中的播放特征。
本步骤中,该关键字段可以是样本日志中包含的播放端类型标识(platform_id)、时间戳(ts)以及搜索关键词字段(query)。每个样本视频对应的样本日志可能是多个用户在预设时间段内对样本视频进行多次的历史播放操作产生的,本发明实施例中,可以提取样本视频对应的样本日志中的播放端类型标识,得到每次历史播放操作中样本视频的播放端类型;根据每次历史播放操作的开始播放操作时产生的样本日志中的时间戳,以及结束播放时的产生的样本日志中的时间戳,计算时间差,进而得到该次历史播放操作中的播放时长,或者,根据每次历史播放操作的开始播放操作时产生的样本日志中的时间戳,以及进行下一次行为时产生的样本日志中的时间戳,计算时间差,进而得到该历史播放操作中的点击时长;提取样本日志中的搜索关键词字段,得到每次历史播放操作中对应的样本搜索关键词。
进一步地,可以根据预设的搜索关键词特征库,确定每个样本搜索关键词的类型;接着,可以根据每个样本搜索关键词所在的样本日志的时间戳,统计每个样本搜索关键词在预设时长内被搜索的次数,该预设时长可以是以当前时间点为起点的过去七天。进一步地,可以将该样本视频进入视频系统的时间点和样本视频在该次历史播放操作中的播放时间点的差值,确定为样本视频在该历史播放操作中的新鲜度。
子步骤(2):根据每个样本视频对应的样本日志中的视频标识,获取每个样本视频的时长、类型以及所属的频道,得到每个样本视频的属性特征。
本步骤中,可以根据视频标识在视频平台提供的视频元数据库中进行查询,得到样本视频的时长、类型以及所属的频道。示例的,样本视频的类型可以包括:预告片,正片或花絮,等等,样本视频的所属的频道可以包括体育、娱乐或游戏,等等,本发明实施例对此不作限定。
需要说明的是,在本发明的另一可选实施例中,在获取样本视频的时长时,也可以是通过提取样本日志中的duration字段,得到样本视频的时长。
子步骤(3):根据每个样本视频对应的样本日志中的标签字段,确定每个样本视频在对应的每次历史播放操作中对应的标注值。
示例的,该标签字段可以表示为label,该标签字段可以是根据用户在每次历史播放操作中对样本视频的评价生成的,实际应用场景中,用户在观看完视频后,可能会对视频进行评价,示例的,当用户在本次播放操作中对视频满意时,会“顶”该视频,当用户在本次播放操作中对视频不满意时,会“踩”该视频,相应地,可以在用户“顶”视频的时候,生成标签字段“1”,在用户“踩”视频的时候,生成标签字段“0”。本步骤中,可以直接提取该次历史播放操作对应的样本日志中的标签字段的具体值,作为样本视频在该次历史播放操作中对应的标注值。
进一步地,用户也可能没有在历史播放操作中对样本视频进行评价,即就是,样本日志中不存在标签字段,此时,可以根据样本视频在该次历史播放操作中对应的样本特征,人工确定标注值,本发明实施例对此不作限定。
步骤2012b、对于每个样本视频,将所述样本视频在每次历史播放操作中对应的播放特征分别与所述样本视频的属性特征组合,得到所述样本视频在每次历史播放操作中对应的样本特征。
示例的,以样本视频a为例,假设样本视频a对应了3次历史播放操作,样本视频a在历史播放操作1,历史播放操作2以及历史播放操作3中的播放特征分别为x1、x2、x3,样本视频a的属性特征为y,那么可以分别将x1与y组合,将x2与y组合,将x3与y组合,得到样本视频a在每次历史播放操作中对应的样本特征w1、w2、w3,其中,w1=<x1,y>、W2=<x2,y>、W3=<x3,y>。
步骤2012c、将每个样本视频在每次历史播放操作中对应的样本特征以及对应的标注值组合,得到多个训练样本对。
示例的,假设样本视频a在历史播放操作1,历史播放操作2以及历史播放操作3中对应的标注值分别为z1、z2、z3,那么,可以将w1与z1组合,将w2与z2组合,将w3与z3组合,得到样本视频a对应的训练样本对分别为<w1,z1>、<w2,z2>以及<w3,z3>。进一步地,通过对剩余的每个样本视频执行相同的操作,可以得到每个样本视频对应的训练样本对,进而得到所有的训练样本对。
需要说明的是,实际的应用场景中,经常会存在搜索次数特别高的热搜词,这样,会导致训练样本对中出现大量由热搜词产生的训练样本对,为了降低这类数据在总的训练样本对中占据的比重,保证训练样本对整体的均衡性,本发明实施例中,还可以对包含相同搜索关键词的训练样本对进行过滤,保证包含相同搜索关键词的训练样本对的个数小于第一预设数量阈值MAX_COUNT_PER_QUERY,相应地,还可以限制来自同一用户的训练样本对在总的训练样本对中占据的比重,具体的,可以对包含相同用户标识的训练样本对进行过滤,保证包含相同用户标识的训练样本对的个数小于第二预设数量阈值MAX_COUNT_PER_USER。
步骤2013、基于所述多个训练样本对进行训练,得到预设的满意度确定模型。
子步骤(7):将每个训练样本对代入初始学习器中,计算每个训练样本对相对所述初始学习器的负梯度。
本步骤中,假设包括q个训练样本对,以A1表示这q个训练样本对,可以得到:
A1={(W1,Z1),(W2,Z2)…(Wq,Zq)}
该初始学习器可以是预先利用A1中的每个训练样本对进行初始化得到的,该初始学习器可以表示为:
Figure BDA0001598529030000141
其中,argmin(F(X))表示的是今F(X)等于最小值时,自变量X的取值,L(*)表示损失函数(英文:Loss function),它是一个非负实值函数。
具体的,可以通过下述公式分别计算每个训练样本对相对初始学习器的负梯度:
Figure BDA0001598529030000151
由于本发明实施例中,是需要通过预设的满意度确定模型来确定用户对目标视频是否满意,确定出来的结果可以是用户对目标视频满意,或者是用户对目标视频不满意,因此,实现过程相当于通过目标特征进行二分类,二分类的结果可以是用户对目标视频满意,或者用户对目标视频不满意,因此,本发明实施例中,可以选取类似于逻辑回归的对数似然函数作为损失函数,示例的,该损失函数可以表示为:
L(z,f(w))=log(1+exp(-zf(w)))
其中,log(*)表示对数函数。
相应地,将损失函数代入负梯度计算公式后,可以得到:
rti=Zi/(1+exp(Zif(wi)))
示例的,可以将训练样本对i的样本特征wi代入上述计算公式中,进而得到负梯度rti
子步骤(8):利用每个训练样本对中的样本特征和每个训练样本对的负梯度组成第二样本对,并进行拟合,得到回归树函数。
示例的,通过将每个训练样本对的样本特征和对应的负梯度进行组合,可以得到q对第二样本对(w1,rt1),...,(wi,rti),...,(wq,rtq)。
利用(w1,rt1),...,(wi,rti),...,(wq,rtq)进行拟合,可以得到一个包括G个叶子节点的回归树函数:
Figure BDA0001598529030000161
其中,ctg表示每个叶子节点的输出值。
子步骤(9):计算所述回归树函数的损失值。
本步骤中,假设该回归树函数对应的叶子节点区域可以表示为:Rtg,其中,g=1,2,...,G,通过下述公式可以针对每一个叶子节点里的样本特征进行拟合,计算每个叶子节点的最佳残差拟合值,进而得到回归树函数的损失值:
Figure BDA0001598529030000162
子步骤(10):若所述损失值在预设范围内,则将所述初始学习器确定为预设的满意度确定模型。
本步骤中,该预设范围可以是开发人员根据实际需求预先定义的,本发明实施例对此不作限定。假设损失函数的损失值在该预设范围内,那么可以将本次训练过程中使用的初始学习器f(wi)确定为预设的满意度确定模型。
子步骤(11):若所述损失值不在预设范围内,则利用所述回归树函数对所述初始学习器进行更新,将更新后的学习器确定为初始学习器,继续进行训练,直至所述损失值在预设范围内。
本步骤中,如果损失值不在预设范围内,那么可以利用回归树函数进行对初始学习器进行更新,得到新的初始学习器:
Figure BDA0001598529030000163
然后利用更新的初始学习器从子步骤(7)开始,继续进行训练,直至损失函数的损失值在预设范围内,则将本轮训练过程中使用的初始学习器确定为预设的满意度确定模型。
步骤202、获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征。
本步骤中,目标视频的属性特征至少包括目标视频的时长,目标视频的播放特征至少包括目标视频在所述播放操作中的时长参数。进一步地,目标视频的属性特征还可以包括目标视频的类型以及所属的频道,目标视频的播放特征还可以包括目标视频在播放操作中的播放端类型、目标视频在播放操作中播放时间点的日期属性、播放操作对应的搜索关键词的类型、搜索关键词在预设时长内被搜索的次数以及目标视频在所述播放操作中的新鲜度。其中,该新鲜度与目标视频进入视频系统的时间点和目标视频在播放操作中播放时间点的差值正相关,本发明实施例对于目标特征包含的具体参数不作限定,需要说明的是,目标特征包含的参数越多,后续步骤中,基于目标特征判断用户对目标视频是否满意的准确性就会越高。
步骤203、将所述目标特征作为预设的满意度确定模型的输入,通过所述预设的满意度确定模型确定在所述播放操作中,用户对所述目标视频是否满意。
具体的,本步骤的实现方式可以参考上述步骤102,本发明实施例在此不作赘述。
综上所述,本发明实施例二提供的视频满意度确定方法,会先根据样本视频确定预设的满意度确定模型,然后,获取目标视频在播放操作中的播放特征以及目标视频的属性特征,得到目标特征,然后将目标特征作为预设的满意度确定模型的输入,通过预设的满意度确定模型确定在该播放操作中,用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,不同的目标视频的目标特征可能不同,以目标特征作为预设的满意度确定模型的输入,即就是作为判断依据,来确定用户对目标视频是否满意的方式,可以保证不同的目标视频的判断依据是根据自身情况确定的,进而提高确定视频满意度的准确度。
实施例三
图3是本发明实施例三提供的一种视频满意度确定装置的框图,如图3所示,该装置30可以包括:
获取模块301,用于获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征。
第一确定模块302,用于将所述目标特征作为预设的满意度确定模型的输入,通过所述预设的满意度确定模型确定在所述播放操作中,用户对所述目标视频是否满意。
其中,所述目标视频的属性特征至少包括所述目标视频的时长,所述目标视频的播放特征至少包括所述目标视频在所述播放操作中的时长参数,所述时长参数包括播放时长和/或点击时长;所述预设的满意度确定模型是基于样本视频对应的样本特征以及标注值确定的。
综上所述,本发明实施例三提供的视频满意度确定装置,获取模块会先获取目标视频在播放操作中的播放特征以及目标视频的属性特征,得到目标特征,然后第一确定模块可以将目标特征作为预设的满意度确定模型的输入,通过预设的满意度确定模型确定在该播放操作中,用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,不同的目标视频的目标特征可能不同,以目标特征作为预设的满意度确定模型的输入,即就是作为判断依据,来确定用户对目标视频是否满意的方式,可以保证不同的目标视频的判断依据是根据自身情况确定的,进而提高确定视频满意度的准确度。
实施例四
图4是本发明实施例四提供的一种视频满意度确定装置的框图,如图4所示,该装置40可以包括:
获取模块401,用于获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征。
第一确定模块402,用于将所述目标特征作为预设的满意度确定模型的输入,通过所述预设的满意度确定模型确定在所述播放操作中,用户对所述目标视频是否满意。
其中,所述目标视频的属性特征至少包括所述目标视频的时长,所述目标视频的播放特征至少包括所述目标视频在所述播放操作中的时长参数,所述时长参数包括播放时长和/或点击时长;所述预设的满意度确定模型是基于样本视频对应的样本特征以及标注值确定的。
可选的,所述目标视频的属性特征还包括所述目标视频的类型以及所属的频道。
所述目标视频的播放特征还包括所述目标视频在所述播放操作中的播放端类型、所述目标视频在所述播放操作中播放时间点的日期属性、所述播放操作对应的搜索关键词的类型、所述搜索关键词在预设时长内被搜索的次数以及所述目标视频在所述播放操作中的新鲜度。
所述新鲜度与所述目标视频进入视频系统的时间点和所述目标视频在所述播放操作中播放时间点的差值正相关。
可选的,所述装置还包括:
第二确定模块403,用于根据样本视频确定预设的满意度确定模型。
可选的,所述第二确定模块403,包括:
获取子模块,用于获取每个样本视频对应的样本日志。
确定子模块,用于基于每个样本视频对应的样本日志,确定每个样本视频在每次历史播放操作中对应的样本特征以及标注值,得到多个训练样本对。
训练子模块,用于基于所述多个训练样本对进行训练,得到预设的满意度确定模型。
其中,所述样本特征包括所述样本视频的属性特征以及所述样本视频在所述历史播放操作中对应的播放特征,所述样本视频的属性特征至少包括样本视频的时长,所述样本视频在所述历史播放操作中对应的播放特征至少包括:样本视频在所述历史播放操作中的历史时长参数,所述历史时长参数包括历史播放时长和/或历史点击时长。
可选的,所述获取子模块,用于:
获取每个样本视频在预设时间段内的备选日志。
对于每个样本视频,将所述样本视频对应的备选日志中包含同一用户标识的备选日志划分至同一类别。
将包含的备选日志的条数不大于预设条数阈值的类别确定为样本类别。
将所述样本类别中的备选日志,确定为所述样本视频对应的样本日志。
可选的,所述样本视频的属性特征还包括样本视频的类型以及所属的频道。
所述样本视频在所述历史播放操作中对应的播放特征还包括:样本视频在所述历史播放操作中的播放端类型、样本视频在所述历史播放操作中播放时间点的日期属性、历史播放操作对应的样本搜索关键词的类型、样本搜索关键词在预设时长内被搜索的次数以及样本视频在所述历史播放操作中的新鲜度。
可选的,所述确定子模块,用于:
根据每个样本视频对应的样本日志中的关键字段,确定每个样本视频的属性特征、每个样本视频在每次历史播放操作中对应的播放特征以及对应的标注值。
对于每个样本视频,将所述样本视频在每次历史播放操作中对应的播放特征分别与所述样本视频的属性特征组合,得到所述样本视频在每次历史播放操作中对应的样本特征。
将每个样本视频在每次历史播放操作中对应的样本特征以及对应的标注值组合,得到多个训练样本对。
可选的,所述训练子模块,用于:
将每个训练样本对代入初始学习器中,计算每个训练样本对相对所述初始学习器的负梯度。
利用每个训练样本对中的样本特征和每个训练样本对的负梯度组成第二样本对,并进行拟合,得到回归树函数。
计算所述回归树函数的损失值。
若所述损失值在预设范围内,则将所述初始学习器确定为预设的满意度确定模型。
若所述损失值不在预设范围内,则利用所述回归树函数对所述初始学习器进行更新,将更新后的学习器确定为初始学习器,继续进行训练,直至所述损失值在预设范围内。
综上所述,本发明实施例四提供的视频满意度确定装置,第二确定模块会先根据样本视频确定预设的满意度确定模型,接着,获取模块会获取目标视频在播放操作中的播放特征以及目标视频的属性特征,得到目标特征,然后第一确定模块会将目标特征作为预设的满意度确定模型的输入,通过预设的满意度确定模型确定在该播放操作中,用户对目标视频是否满意,相较于现有技术中对所有视频均采用相同的固定时长阈值作为判断依据的方式,本发明实施例中,不同的目标视频的目标特征可能不同,以目标特征作为预设的满意度确定模型的输入,即就是作为判断依据,来确定用户对目标视频是否满意的方式,可以保证不同的目标视频的判断依据是根据自身情况确定的,进而提高确定视频满意度的准确度。
对于上述装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域技术人员易于想到的是:上述各个实施例的任意组合应用都是可行的,故上述各个实施例之间的任意组合都是本发明的实施方案,但是由于篇幅限制,本说明书在此就不一一详述了。
在此提供的视频满意度确定方法不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造具有本发明方案的系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的视频中背景音乐的识别方法中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims (16)

1.一种视频满意度确定方法,其特征在于,所述方法包括:
获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征;
将所述目标特征作为预设的满意度确定模型的输入,通过所述预设的满意度确定模型确定在所述播放操作中,用户对所述目标视频是否满意;
其中,所述目标视频的属性特征至少包括所述目标视频的时长,所述目标视频的播放特征至少包括所述目标视频在所述播放操作中的时长参数,所述时长参数包括点击时长,或者,点击时长和播放时长;所述预设的满意度确定模型是基于样本视频对应的样本特征以及标注值确定的;
其中,所述目标视频的播放特征还包括所述目标视频在所述播放操作中的播放端类型、所述目标视频在所述播放操作中播放时间点的日期属性、所述播放操作对应的搜索关键词的类型、所述搜索关键词在预设时长内被搜索的次数以及所述目标视频在所述播放操作中的新鲜度;
其中,所述新鲜度与所述目标视频进入视频系统的时间点和所述目标视频在所述播放操作中播放时间点的差值正相关;
其中,所述获取目标视频在播放操作中的播放特征,包括:
获取用户打开目标视频时生成的行为日志,并提取行为日志中的时间戳,得到所述用户打开所述目标视频的时间点;
获取所述用户的下一次行为生成的行为日志,并提取行为日志中的时间戳,得到所述用户执行下一次行为的时间点;
计算用户打开所述目标视频的时间点与用户执行下一次行为的时间点之间的时长,得到所述点击时长。
2.根据权利要求1所述的方法,其特征在于,在所述获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征的步骤之前,所述方法还包括:
根据样本视频确定预设的满意度确定模型。
3.根据权利要求2所述的方法,其特征在于,所述根据样本视频确定预设的满意度确定模型的步骤,包括:
获取每个样本视频对应的样本日志;
基于每个样本视频对应的样本日志,确定每个样本视频在每次历史播放操作中对应的样本特征以及标注值,得到多个训练样本对;
基于所述多个训练样本对进行训练,得到预设的满意度确定模型;
其中,所述样本特征包括所述样本视频的属性特征以及所述样本视频在所述历史播放操作中对应的播放特征,所述样本视频的属性特征至少包括样本视频的时长,所述样本视频在所述历史播放操作中对应的播放特征至少包括:样本视频在所述历史播放操作中的历史时长参数,所述历史时长参数包括历史点击时长,或者,历史点击时长和历史播放时长。
4.根据权利要求3所述的方法,其特征在于,所述获取每个样本视频对应的样本日志的步骤,包括:
获取每个样本视频在预设时间段内的备选日志;
对于每个样本视频,将所述样本视频对应的备选日志中包含同一用户标识的备选日志划分至同一类别;
将包含的备选日志的条数不大于预设条数阈值的类别确定为样本类别;
将所述样本类别中的备选日志,确定为所述样本视频对应的样本日志。
5.根据权利要求4所述的方法,其特征在于,所述样本视频的属性特征还包括样本视频的类型以及所属的频道;
所述样本视频在所述历史播放操作中对应的播放特征还包括:样本视频在所述历史播放操作中的播放端类型、样本视频在所述历史播放操作中播放时间点的日期属性、历史播放操作对应的样本搜索关键词的类型、样本搜索关键词在预设时长内被搜索的次数以及样本视频在所述历史播放操作中的新鲜度。
6.根据权利要求5所述的方法,其特征在于,所述目标视频的属性特征还包括所述目标视频的类型以及所属的频道。
7.根据权利要求6所述的方法,其特征在于,所述基于每个样本视频对应的样本日志,确定每个样本视频在每次历史播放操作中对应的样本特征以及标注值,得到多个训练样本对的步骤,包括:
根据每个样本视频对应的样本日志中的关键字段,确定每个样本视频的属性特征、每个样本视频在每次历史播放操作中对应的播放特征以及对应的标注值;
对于每个样本视频,将所述样本视频在每次历史播放操作中对应的播放特征分别与所述样本视频的属性特征组合,得到所述样本视频在每次历史播放操作中对应的样本特征;
将每个样本视频在每次历史播放操作中对应的样本特征以及对应的标注值组合,得到多个训练样本对。
8.根据权利要求7所述的方法,其特征在于,所述基于所述多个训练样本对进行训练,得到预设的满意度确定模型的步骤,包括:
将每个训练样本对代入初始学习器中,计算每个训练样本对相对所述初始学习器的负梯度;
利用每个训练样本对中的样本特征和每个训练样本对的负梯度组成第二样本对,并进行拟合,得到回归树函数;
计算所述回归树函数的损失值;
若所述损失值在预设范围内,则将所述初始学习器确定为预设的满意度确定模型;
若所述损失值不在预设范围内,则利用所述回归树函数对所述初始学习器进行更新,将更新后的学习器确定为初始学习器,继续进行训练,直至所述损失值在预设范围内。
9.一种视频满意度确定装置,其特征在于,所述装置包括:
获取模块,用于获取目标视频在播放操作中的播放特征,以及获取所述目标视频的属性特征,得到目标特征;
第一确定模块,用于将所述目标特征作为预设的满意度确定模型的输入,通过所述预设的满意度确定模型确定在所述播放操作中,用户对所述目标视频是否满意;
其中,所述目标视频的属性特征至少包括所述目标视频的时长,所述目标视频的播放特征至少包括所述目标视频在所述播放操作中的时长参数,所述时长参数包括点击时长,或者,点击时长和播放时长;所述预设的满意度确定模型是基于样本视频对应的样本特征以及标注值确定的;
其中,所述目标视频的播放特征还包括所述目标视频在所述播放操作中的播放端类型、所述目标视频在所述播放操作中播放时间点的日期属性、所述播放操作对应的搜索关键词的类型、所述搜索关键词在预设时长内被搜索的次数以及所述目标视频在所述播放操作中的新鲜度;
其中,所述新鲜度与所述目标视频进入视频系统的时间点和所述目标视频在所述播放操作中播放时间点的差值正相关;
其中,所述获取模块,具体用于:
获取用户打开目标视频时生成的行为日志,并提取行为日志中的时间戳,得到所述用户打开所述目标视频的时间点;
获取所述用户的下一次行为生成的行为日志,并提取行为日志中的时间戳,得到所述用户执行下一次行为的时间点;
计算用户打开所述目标视频的时间点与用户执行下一次行为的时间点之间的时长,得到所述点击时长。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于根据样本视频确定预设的满意度确定模型。
11.根据权利要求10所述的装置,其特征在于,所述第二确定模块,包括:
获取子模块,用于获取每个样本视频对应的样本日志;
确定子模块,用于基于每个样本视频对应的样本日志,确定每个样本视频在每次历史播放操作中对应的样本特征以及标注值,得到多个训练样本对;
训练子模块,用于基于所述多个训练样本对进行训练,得到预设的满意度确定模型;
其中,所述样本特征包括所述样本视频的属性特征以及所述样本视频在所述历史播放操作中对应的播放特征,所述样本视频的属性特征至少包括样本视频的时长,所述样本视频在所述历史播放操作中对应的播放特征至少包括:样本视频在所述历史播放操作中的历史时长参数,所述历史时长参数包括历史点击时长,或者,历史点击时长和历史播放时长。
12.根据权利要求11所述的装置,其特征在于,所述获取子模块,用于:
获取每个样本视频在预设时间段内的备选日志;
对于每个样本视频,将所述样本视频对应的备选日志中包含同一用户标识的备选日志划分至同一类别;
将包含的备选日志的条数不大于预设条数阈值的类别确定为样本类别;
将所述样本类别中的备选日志,确定为所述样本视频对应的样本日志。
13.根据权利要求11所述的装置,其特征在于,所述样本视频的属性特征还包括样本视频的类型以及所属的频道;
所述样本视频在所述历史播放操作中对应的播放特征还包括:样本视频在所述历史播放操作中的播放端类型、样本视频在所述历史播放操作中播放时间点的日期属性、历史播放操作对应的样本搜索关键词的类型、样本搜索关键词在预设时长内被搜索的次数以及样本视频在所述历史播放操作中的新鲜度。
14.根据权利要求13所述的装置,其特征在于,所述目标视频的属性特征还包括所述目标视频的类型以及所属的频道。
15.根据权利要求13所述的装置,其特征在于,所述确定子模块,用于:
根据每个样本视频对应的样本日志中的关键字段,确定每个样本视频的属性特征、每个样本视频在每次历史播放操作中对应的播放特征以及对应的标注值;
对于每个样本视频,将所述样本视频在每次历史播放操作中对应的播放特征分别与所述样本视频的属性特征组合,得到所述样本视频在每次历史播放操作中对应的样本特征;
将每个样本视频在每次历史播放操作中对应的样本特征以及对应的标注值组合,得到多个训练样本对。
16.根据权利要求15所述的装置,其特征在于,所述训练子模块,用于:
将每个训练样本对代入初始学习器中,计算每个训练样本对相对所述初始学习器的负梯度;
利用每个训练样本对中的样本特征和每个训练样本对的负梯度组成第二样本对,并进行拟合,得到回归树函数;
计算所述回归树函数的损失值;
若所述损失值在预设范围内,则将所述初始学习器确定为预设的满意度确定模型;
若所述损失值不在预设范围内,则利用所述回归树函数对所述初始学习器进行更新,将更新后的学习器确定为初始学习器,继续进行训练,直至所述损失值在预设范围内。
CN201810215682.6A 2018-03-15 2018-03-15 一种视频满意度确定方法及装置 Active CN108416446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810215682.6A CN108416446B (zh) 2018-03-15 2018-03-15 一种视频满意度确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810215682.6A CN108416446B (zh) 2018-03-15 2018-03-15 一种视频满意度确定方法及装置

Publications (2)

Publication Number Publication Date
CN108416446A CN108416446A (zh) 2018-08-17
CN108416446B true CN108416446B (zh) 2021-07-06

Family

ID=63131733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810215682.6A Active CN108416446B (zh) 2018-03-15 2018-03-15 一种视频满意度确定方法及装置

Country Status (1)

Country Link
CN (1) CN108416446B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045931A (zh) * 2015-09-02 2015-11-11 南京邮电大学 一种基于Web挖掘的视频推荐方法和系统
CN105282565A (zh) * 2015-09-29 2016-01-27 北京奇艺世纪科技有限公司 一种视频推荐方法和装置
CN105718545A (zh) * 2016-01-18 2016-06-29 合一网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN105898426A (zh) * 2015-12-14 2016-08-24 乐视网信息技术(北京)股份有限公司 多媒体内容处理方法、装置及服务器

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100088726A1 (en) * 2008-10-08 2010-04-08 Concert Technology Corporation Automatic one-click bookmarks and bookmark headings for user-generated videos
CN103096139B (zh) * 2013-01-23 2016-06-29 深圳市龙视传媒有限公司 一种视频关联推荐的方法及服务器
KR101549183B1 (ko) * 2014-04-30 2015-09-02 서울대학교산학협력단 내용 기반 tv 프로그램 추천 시스템, 장치 및 방법
CN104216960A (zh) * 2014-08-21 2014-12-17 北京奇艺世纪科技有限公司 一种视频推荐方法和装置
CN105721944A (zh) * 2016-01-29 2016-06-29 四川长虹电器股份有限公司 智能电视的新闻资讯推荐方法
US10515116B2 (en) * 2016-02-08 2019-12-24 Hulu, LLC Generation of video recommendations using connection networks
CN106326391B (zh) * 2016-08-17 2020-02-14 合一智能科技(深圳)有限公司 多媒体资源推荐方法及装置
CN106572390B (zh) * 2016-11-09 2020-03-13 咪咕音乐有限公司 一种音视频推荐方法及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105045931A (zh) * 2015-09-02 2015-11-11 南京邮电大学 一种基于Web挖掘的视频推荐方法和系统
CN105282565A (zh) * 2015-09-29 2016-01-27 北京奇艺世纪科技有限公司 一种视频推荐方法和装置
CN105898426A (zh) * 2015-12-14 2016-08-24 乐视网信息技术(北京)股份有限公司 多媒体内容处理方法、装置及服务器
CN105718545A (zh) * 2016-01-18 2016-06-29 合一网络技术(北京)有限公司 多媒体资源的推荐方法和装置

Also Published As

Publication number Publication date
CN108416446A (zh) 2018-08-17

Similar Documents

Publication Publication Date Title
CN107832437B (zh) 音/视频推送方法、装置、设备及存储介质
CN110909205B (zh) 一种视频封面确定方法、装置、电子设备及可读存储介质
CN107341268B (zh) 一种热搜榜排序方法及系统
CN105653705B (zh) 一种热门事件搜索方法和装置
CN110941738B (zh) 推荐方法、装置、电子设备及计算机可读存储介质
CN109511015B (zh) 多媒体资源推荐方法、装置、存储介质及设备
US20170243136A1 (en) Method and system for artificial intelligence learning using messaging service and method and system for relaying answer using artificial intelligence
CA3153598A1 (en) Method of and device for predicting video playback integrity
CN109189990B (zh) 一种搜索词的生成方法、装置及电子设备
CN107967280B (zh) 一种标签推荐歌曲的方法及系统
WO2015120798A1 (en) Method for processing network media information and related system
CN109753601B (zh) 推荐信息点击率确定方法、装置及电子设备
CN106446078A (zh) 一种信息的推荐方法和推荐装置
CN111126495B (zh) 模型训练方法、信息预测方法、装置、存储介质及设备
CN107526846B (zh) 频道排序模型的生成、排序方法、装置、服务器和介质
CA3150500A1 (en) UPLOADING DEVICE PAIRING METHOD AND DEVICE
CN109615009B (zh) 一种学习内容推荐方法及电子设备
CN105574199B (zh) 搜索引擎的虚假搜索行为的识别方法和装置
CN110334356A (zh) 文章质量的确定方法、文章筛选方法、以及相应的装置
CN110765348B (zh) 一种热词的推荐方法、装置、电子设备及存储介质
CN106874335A (zh) 行为数据处理方法、装置及服务器
CN111611781B (zh) 数据标注方法、问答方法、装置及电子设备
CN108416446B (zh) 一种视频满意度确定方法及装置
CN107577707B (zh) 一种目标数据集生成方法、装置及电子设备
CN112507214B (zh) 基于用户名的数据处理方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant