CN113794900A - 视频处理方法和装置 - Google Patents

视频处理方法和装置 Download PDF

Info

Publication number
CN113794900A
CN113794900A CN202111015935.3A CN202111015935A CN113794900A CN 113794900 A CN113794900 A CN 113794900A CN 202111015935 A CN202111015935 A CN 202111015935A CN 113794900 A CN113794900 A CN 113794900A
Authority
CN
China
Prior art keywords
features
video
importance parameters
parameters corresponding
importance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111015935.3A
Other languages
English (en)
Other versions
CN113794900B (zh
Inventor
仇辉
江鹏
李志伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202111015935.3A priority Critical patent/CN113794900B/zh
Publication of CN113794900A publication Critical patent/CN113794900A/zh
Application granted granted Critical
Publication of CN113794900B publication Critical patent/CN113794900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4662Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
    • H04N21/4666Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms using neural networks, e.g. processing the feedback provided by the user
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种视频处理方法和装置。该方法包括:获取待预测的目标视频;提取目标视频的多个特征;采用注意力层预测多个特征分别对应的重要性参数,其中,多个特征分别对应的重要性参数满足预定参数条件;将多个特征分别对应的重要性参数分别作用于对应的多个特征上,得到作用后的多个特征;基于作用后的多个特征,预测目标视频的推荐程度。解决了相关技术中预测结果准确性低的问题。

Description

视频处理方法和装置
技术领域
本发明涉及计算机领域,具体而言,涉及一种视频处理方法和装置。
背景技术
在相关技术中,在对视频进行预测时,例如,预测视频的推荐程度,一般会采用人工智能的深度学习模型来实现。在采用人工智能的深度学习模型来对视频的推荐程度进行预测时,一般需要选择视频的相关特征。在相关技术中,在进行特征选择时,一般采用人工的方式进行选择,比如,一般是人为地根据经验或者依据对一定数据的统计来进行选择的。但这样的选择方式,缺点非常明显,不但效率低,准确率也不高,进而导致深度学习模型对视频的预测不准确。
发明内容
本发明的主要目的在于提供一种视频处理方法和装置,以解决相关技术中预测结果准确性低的问题。
根据本公开实施例的第一方面,提供一种视频处理方法,包括:获取待预测的目标视频;提取所述目标视频的多个特征;采用注意力层预测所述多个特征分别对应的重要性参数,其中,所述多个特征分别对应的重要性参数满足预定参数条件;将所述多个特征分别对应的重要性参数分别作用于对应的所述多个特征上,得到作用后的多个特征;基于作用后的多个特征,预测所述目标视频的推荐程度。
可选地,所述采用注意力层预测所述多个特征分别对应的重要性参数,包括:对所述多个特征进行平均池化,得到平均池后的特征向量,其中,所述特征向量的维度为所述多个特征的个数;将所述特征向量作为所述注意力层的输入,输出得到用于表征所述多个特征分别对应的重要性参数的权重向量,其中,所述权重向量的维度也为所述多个特征的个数。
可选地,所述将所述多个特征分别对应的重要性参数分别作用于对应的所述多个特征上,得到作用后的多个特征,包括:将所述多个特征分别对应的重要性参数分别与对应的所述多个特征进行按位运算处理,得到按位运算处理后的多个特征。
可选地,所述多个特征分别对应的重要性参数满足预定参数条件,包括:在所述多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定所述多个特征分别对应的重要性参数满足所述预定参数条件。
根据本公开实施例的第二方面,提供一种视频处理方法,包括:采用样本视频的样本数据,提取所述样本数据的多个特征,采用注意力层输出所述多个特征分别对应的重要性参数,基于多个特征、以及所述多个特征分别对应的重要性参数对第一预测模型进行训练;在对所述第一预测模型进行训练达到预定训练条件的情况下,得到第二预测模型,提取所述注意力层输出的所述多个特征分别对应的重要性参数;确定所述多个特征分别对应的重要性参数是否满足预定参数条件,在所述多个特征分别对应的重要性参数不满足所述预定参数条件的情况下,从所述多个特征中删除重要性参数小于预定参数阈值的特征,得到剩余特征;采用上述对第一预测模型进行训练的方式,基于剩余特征对所述第二预测模型以及后续得到的预测模型进行训练,直到最终提取的剩余特征的重要性参数满足所述预定参数条件,其中,最终得到的剩余特征为目标特征,基于所述目标特征训练得到的模型为目标预测模型。
可选地,所述对所述第一预测模型进行训练达到预定训练条件包括:在将所述样本视频的样本数据中的多个数据输入所述第一预测模型,得到所述样本视频的推荐程度在预定阈值范围内的情况下,确定对所述第一预测模型进行训练达到预定训练条件。
可选地,所述确定所述多个特征分别对应的重要性参数是否满足预定参数条件,包括:在所述多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定所述多个特征分别对应的重要性参数满足所述预定参数条件。
可选地,在得到所述目标预测模型之后,还包括:获取目标视频;采用所述目标预测模型对所述目标视频进行预测,得到所述目标视频的推荐程度。
根据本公开实施例的第三方面,提供一种视频处理装置,包括:第一获取模块,用于获取待预测的目标视频;第一提取模块,用于提取所述目标视频的多个特征;注意力层模块,用于采用注意力层预测所述多个特征分别对应的重要性参数,其中,所述多个特征分别对应的重要性参数满足预定参数条件;应用层模块,用于将所述多个特征分别对应的重要性参数分别作用于对应的所述多个特征上,得到作用后的多个特征;第一预测模块,用于基于作用后的多个特征,预测所述目标视频的推荐程度。
可选地,所述注意力层模块包括:平均池化单元,用于对所述多个特征进行平均池化,得到平均池后的特征向量,其中,所述特征向量的维度为所述多个特征的个数;第一处理单元,用于将所述特征向量作为所述注意力层的输入,输出得到用于表征所述多个特征分别对应的重要性参数的权重向量,其中,所述权重向量的维度也为所述多个特征的个数。
可选地,所述应用层模块包括:运算单元,用于将所述多个特征分别对应的重要性参数分别与对应的所述多个特征进行按位运算处理,得到按位运算处理后的多个特征。
可选地,所述注意力层模块包括:第一确定单元,用于在所述多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定所述多个特征分别对应的重要性参数满足所述预定参数条件。
根据本公开实施例的第四方面,提供一种视频处理装置,包括:训练模块,用于采用样本视频的样本数据,提取所述样本数据的多个特征,采用注意力层输出所述多个特征分别对应的重要性参数,基于多个特征,以及所述多个特征分别对应的重要性参数对第一预测模型进行训练;第二提取模块,用于在对所述第一预测模型进行训练达到预定训练条件的情况下,得到第二预测模型,提取所述注意力层输出的所述多个特征分别对应的重要性参数;第一处理模块,用于确定所述多个特征分别对应的重要性参数是否满足预定参数条件,在所述多个特征分别对应的重要性参数不满足所述预定参数条件的情况下,从所述多个特征中删除重要性参数小于预定参数阈值的特征,得到剩余特征;第二处理模块,用于采用上述对第一预测模型进行训练的方式,基于剩余特征对所述第二预测模型以及后续得到的预测模型进行训练,直到最终提取的剩余特征的重要性参数满足所述预定参数条件,其中,最终得到的剩余特征为目标特征,基于所述目标特征训练得到的模型为目标预测模型。
可选地,所述第二提取模块包括:第二确定单元,用于在将所述样本视频的样本数据中的多个数据输入所述第一预测模型,得到所述样本视频的推荐程度在预定阈值范围内的情况下,确定对所述第一预测模型进行训练达到预定训练条件。
可选地,所述第一处理模块包括:第三确定单元,用于在所述多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定所述多个特征分别对应的重要性参数满足所述预定参数条件。
可选地,所述装置还包括:第二获取模块,用于获取目标视频;第二预测模块,用于采用所述目标预测模型对所述目标视频进行预测,得到所述目标视频的推荐程度。
根据本公开实施例的第五方面,提供一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现任一项所述的视频处理方法。
根据本公开实施例的第六方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行任一项所述的视频处理方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现任一项所述的视频处理方法。
本发明通过提取待预测的目标视频的多个特征,并将注意力层预测得到的多个特征分别对应的重要性参数作用于对应的多个特征之上,其中,该多个特征的重要性参数满足预定参数条件,达到了对特征进行选择的目的,进而实现了准确地预测目标视频的推荐程度的效果。解决了相关技术中预测结果准确性低的问题。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的视频处理方法一的流程图;
图2是根据本发明实施例的视频处理方法二的流程图;
图3是根据本发明可选实施方式的神经网络结构的示意图;
图4是根据本发明可选实施方式的特征选择的流程图;
图5是根据本发明实施例的视频处理装置一的示意图;
图6是根据本发明实施例的视频处理装置二的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1是根据本发明实施例的视频处理方法一的流程图,如图1所示,该方法包括以下步骤:
步骤S102,获取待预测的目标视频;
步骤S104,提取目标视频的多个特征;
步骤S106,采用注意力层预测多个特征分别对应的重要性参数,其中,多个特征分别对应的重要性参数满足预定参数条件;
步骤S108,将多个特征分别对应的重要性参数分别作用于对应的多个特征上,得到作用后的多个特征;
步骤S110,基于作用后的多个特征,预测目标视频的推荐程度。
通过上述步骤,提取待预测的目标视频的多个特征,并将注意力层预测得到的多个特征分别对应的重要性参数作用于对应的多个特征之上,而且重要性参数满足预定参数条件,达到了对特征进行选择的目的,进而实现了准确地预测目标视频的推荐程度的效果。解决了相关技术中预测视频中预测结果准确性低的问题。
作为一种可选的实施例,上述视频处理方法一的执行主体可以是用于进行视频预测处理的电子设备,例如,可以是终端,可以是服务器,还可以是其它用于对视频预测执行并行计算的计算机集群等。
作为一种可选的实施例,此处所指的重要性参数是用于描述多个特征的重要性程度,例如,可以采用权重来表示,比如,该多个特征为5个特征,分别为第一特征(权重为0.3),第二特征(0.2),第三特征(0.2),第四特征(0.2)和第五特征(0.1),其中的0.3,0.2,0.2,0.2,0.1即是这些特征分别对应的重要性参数。此处的“多个特征分别对应的重要性参数满足预定参数条件”用于确定该多个特征是数量从多的特征中重要的特征,其中,该预定参数条件的表示方式可以多种,例如,对数量众多的特征的重要性参数按照重要性程度从大到小进行排序,可以直接将排序靠前的数个重要性参数对应的特征为满足该预定参数条件的特征。在对数量众多的特征的重要性参数按照重要性程度从大到小进行排序后,在排序靠前的数个重要性参数的标准差小于预定阈值的情况下,确定该数个重要性参数分别对应的特征为重要性参数满足预定参数条件的特征。需要说明的是,此处的“多个特征分别对应的重要性参数满足预定参数条件”可以是该多个特征的全部特征对应的重要性参数满足该预定参数条件,也可以是该多个特征中的剖分特征对应的重要性参数满足该预定参数条件(即只要包括重要性参数满足该预定参数条件的特征即可)。
作为一种可选的实施例,将多个特征分别对应的重要性参数分别作用于对应的多个特征上,得到作用后的多个特征,其中,该“作用于”即是将该重要性参数分别作用于对应特征的取值上。例如,将对应特征的取值与该重要性参数进行乘法运算,求得的积为作用后的特征的取值。以上述重要性参数为权重为例,该多个特征为5个特征,分别为第一特征(权重为0.3),第二特征(0.2),第三特征(0.2),第四特征(0.2)和第五特征(0.1),其中,针对一个目标视频而言,第一特征的取值为20,第二特征的取值为10,第三特征的取值为10,第四特征的取值为5以及第五特征的取值为5,则将特征的取值与对应的权重进行按位乘法,即第一特征作用后的取值即为20*0.3=6,第二特征作用后的取值即为10*0.2=2,第一特征作用后的取值即为10*0.2=2,第二特征作用后的取值即为5*0.2=1,第二特征作用后的取值即为5*0.1=0.5。
作为一种可选的实施例,获取待预测的目标视频,其中,目标视频可以为多种类型的视频,该目标视频可以是需要预测推荐程度的视频,基于该推荐程度可以知晓是否对该视频进行推荐,以及执行其他处理,等等。另外,该推荐程度可以采用多种方式表示,比如,可以采用概率值来表示。例如,该目标视频可以是时长超过预定时长阈值的长视频,也可以是时长小于或等于预定时长阈值的短视频。又例如,该目标视频可以是预定时间段内最新发布的视频,也可以是发布超过该预定时间段的视频,等等。根据需要,实现对多种不同类型的目标视频的推荐程度进行预测的效果。目标视频可以基于多种平台进行发布,例如,移动终端,网页端,等等,在对视频进行预测时,可以对在多种平台进行发布的同一目标视频分别进行预测。
作为一种可选的实施例,目标视频的多个特征可以包括,视频本身的特征,有关目标视频的用户的特征,即也可以描述为视频与用户之间的交叉特征,等等,上述目标视频的特征不做具体设定,可以根据实际应用的需求自主选择设定。举例说明,视频本身的特征可以包括:视频ID、视频作者ID、视频标签ID、视频聚类ID、视频时长、对于已发布过的视频,还可以包括:视频统计点击率、视频统计点赞率,等等;有关目标视频的用户的特征,其实也可以描述为对目标视频进行操作过的用户特征,其中,用户的特征可以分为静态特征与动态特征,可以依据用户的画像特征进行设计,其中用户的静态特征可以是包括用户自身的属性特征的,包括用户的ID、设备ID、年龄段、性别、地域、城市等特征;动态特征可以是包括用户的历史行为的,包括用户的观看视频ID列表、观看视频作者ID列表、点赞视频ID列表、点赞视频作者ID列表、评论视频ID列表、评论视频作者ID列表、长播视频ID列表、长播视频作者ID列表、举报视频ID列表、举报视频作者ID列表,等等;交叉特征可以包括:用户年龄段与视频标签的交叉特征、用户关注列表是否包括该视频作者、用户举报列表是否包括该视频作者,等等。需要说明的是,视频的特征包括视频本身的特征,与视频相关的用户的特征,以及视频与用户的关联特征,而该交叉特征即是视频与用户的关联特征,是用于描述视频与用户之间的特征。如上,交叉特征包括用户年龄段与视频标签之间的特征,即与某一视频相关的用户年龄段之间的关联特征,比如,表征为该视频点赞的用户年龄段为20-30岁,这一特征即可以认为是一种交叉特征。另外,在获取该交叉特征时,可以采用多种方式,例如,可以依据对视频的用户的特征进行统计得到,比如,统计对该视频进行点赞的用户的年龄分别进行统计得到。通过提取目标视频的多个特征,能够广泛的获取到与目标视频相关的各种信息,避免遗漏或错过重要特征。
作为一种可选的实施例,采用注意力层预测多个特征分别对应的重要性参数,其中,多个特征分别对应的重要性参数满足预定参数条件。通过预测多个特征分别对应的重要性参数,即能够预测得到多个特征对应的重要程度,因为特征种类繁多,涉猎甚广,每个特征赋予进行同等程度的计算,不仅加大了计算量,而且还会使得预测结果不精确,因此,将不同的特征赋予不同的重要性参数,使得不同特征具有不同的重要性,不仅减少了计算量,因为由于预测是基于特征的重要性程度进行预测的,会使得预测结果更加精准。而且重要性参数需要满足设定的预定参数条件,可以达到对特征进行选择的效果,使得推荐更加可靠,其中,预定参数条件的设定可以为多种,例如,在多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定多个特征分别对应的重要性参数满足预定参数条件。该预定参数条件可以根据样本数据进行设定,例如,获取样本数据,其中,样本数据包括预设时段内目标视频的特征数据;将样本数据输入到预设的神经网络模型中进行计算,得到预定参数条件。通过设定一定的条件,可以对特征重要性小的特征进行过滤,可以达到减少特征数量、减少过拟合、提高训练和预估效率、提高预估准确率的目的,能够更好地对基于特征的重要性参数进行预测。
作为一种可选的实施例,采用注意力层预测多个特征分别对应的重要性参数,可以采用多种方式,例如:对多个特征进行平均池化处理,得到平均池化处理后的特征向量,其中,特征向量的维度为多个特征的个数,需要说明的是,平均池化为池化的一种,池化还有最大池化和随机池化,其中,最大池化是对局部的值取最大;平均池化是对局部的值取平均;随机池化是根据概率对局部的值进行采样,采样结果便是池化结果。在此处对多个特征进行平均池化,可以是先对多个特征划分位置,以划分的位置为局部,对局部的值取平均,得到该位置特征的平均池化后的特征向量;将特征向量作为注意力层的输入,输出得到用于表征多个特征分别对应的重要性参数的权重向量,其中,权重向量的维度也为多个特征的个数。即获取的目标视频的多个特征,在神经网络中的注意力层进行预测,预测得到多个特征分别对应的重要性参数。将目标视频的多个特征进行平均池化,得到平均池化后的特征向量,再将特征向量作为注意力层的输入,输出权重向量。其中,输入的特征的个数等于特征向量的维度,也等于权重向量的维度。根据预定训练目标训练学习到权重参数,具有自适应优化目标的能力。而且通过注意力层,赋予多个特征中的重要性参数一定的权重值,使得每个特征对应的重要性参数的重要程度不同,能够根据特征的重要性进行有效地学习。
作为一种可选的实施例,将多个特征分别对应的重要性参数分别作用于对应的多个特征上,得到作用后的多个特征。即在赋予多个特征对应的重要性参数一定的权重后,需要将该重要性参数作用到对应的特征上,以赋予特征一定的权重值,不同的特征具备不同的重要程度,能够清楚明白地看到不同特征在视频处理过程中的重要性。
作为一种可选的实施例,将多个特征分别对应的重要性参数分别作用于对应的多个特征上,得到作用后的多个特征的方式有很多,如上,可以将多个特征分别对应的重要性参数分别与对应的多个特征进行按位运算处理,得到按位运算处理后的多个特征。即可以将注意力层学习到的每个特征分别对应的重要性参数与特征进行按位乘法,以达到将特征按照其重要性进行放缩的目的。
本实施例的技术方案可以作为一种高效且准确的深度学习特征选择的视频处理方法,通过过滤掉低重要性特征,实现深度学习模型特征选择的作用,减少噪音特征,进而实现更高效更准确的预估视频的推荐程度。可以应用在视频播放应用中,通过获取视频特征、用户特征、用户与视频之间的交叉特征,例如,参照用户的行为历史数据和当前页面的上下文数据,按照权重对其中的一些特征进行滤除,例如可以过滤掉低权重的特征类别,根据剩余的类别的特征来进行个性化视频推荐,可以实现对用户真正感兴趣的内容进行推荐,提高向用户推荐视频的准确性。
图2是根据本发明实施例的视频处理方法二的流程图,如图2所示,该方法包括以下步骤:
步骤S202,采用样本视频的样本数据,提取样本数据的多个特征,采用注意力层输出多个特征分别对应的重要性参数,基于多个特征、以及多个特征分别对应的重要性参数对第一预测模型进行训练;
步骤S204,在对第一预测模型进行训练达到预定训练条件的情况下,得到第二预测模型,提取注意力层输出的多个特征分别对应的重要性参数;
步骤S206,确定多个特征分别对应的重要性参数是否满足预定参数条件,在多个特征分别对应的重要性参数不满足预定参数条件的情况下,从多个特征中删除重要性参数小于预定参数阈值的特征,得到剩余特征;
步骤S208,采用上述对第一预测模型进行训练的方式,基于剩余特征对第二预测模型以及后续得到的预测模型进行训练,直到最终提取的剩余特征的重要性参数满足预定参数条件,其中,最终得到的剩余特征为目标特征,基于目标特征训练得到的模型为目标预测模型。
通过上述步骤,通过样本视频的样本数据对第一预测模型进行训练,在对第一预测模型进行训练达到预定训练条件的情况下,提取训练采用的特征分别对应的重要性参数,并在重要性参数不满足预定参数条件的情况下,继续执行模型的训练,直到提取的特征的重要性参数满足该预定参数条件,从而最终得到目标预测模型。在模型训练满足预定训练条件,模型所采用的特征的重要性参数满足预定参数条件的前提下,才确定得到最终的目标预测模型,由于训练得到的目标预测模型所采用的特征的重要性参数满足预定参数条件,因此,对模型所采用的参数进行了一定的选择,例如,可以考虑重要性程度较大的参数为目标预测模型的特征,使得训练得到的目标预测模型更符合需要,便于后续采用目标预测模型对目标视频进行预测时,得到目标视频的推荐程度也更为准确。
作为一种可选的实施例,上述视频处理方法二的执行主体可以是对模型进行训练的电子设备,该电子设备对第一预测模型进行训练,直到得到用于对视频的推荐程度进行预测的目标预测模型。即在采用该电子设备进行机器训练得到目标预测模型后,采用该目标预测模型执行上述视频处理方法一,以实现对目标视频进行推荐程度的预测。需要说明的是,该电子设备与执行上述视频处理方法一的电子设备为执行不同功能的电子设备,两者可以采用相同的设备,也可以为不同的设备,只要分别实现不同的计算处理即可。
作为一种可选的实施例,采用样本视频的样本数据,提取样本数据的多个特征,采用注意力层输出多个特征分别对应的重要性参数,基于多个特征、以及多个特征分别对应的重要性参数对第一预测模型进行训练。通过获取样本视频的样本数据,以及提取样本数据的多个特征,并基于多个特征,以及多个特征分别对应的重要性参数对作为初始模型的第一预测模型进行训练,通过对初始模型结构的建立,为后续训练得到满足训练目标的目标预测模型提供基础。
作为一种可选的实施例,在对第一预测模型进行训练达到预定训练条件的情况下,得到第二预测模型,提取注意力层输出的多个特征分别对应的重要性参数预定参数条件。提取出训练后得到的重要性参数,即得到了更准确的预测得到多个特征对应的重要程度,将不同的特征赋予不同的重要性参数,使得不同特征具有不同的重要性,因而在对特征进行选择时,可以选择重要性高的特征来作为预测模型所采用的特征,相对于现有技术中由于不能准确地知晓各个特征的重要性程度,在训练预测模型时,需要对全部特征进行计算而言,有效地减少了模型训练过程中的计算量。
作为一种可选的实施例,对第一预测模型进行训练达到预定训练条件包括:在将样本视频的样本数据中的多个数据输入第一预测模型,得到样本视频的推荐程度在预定阈值范围内的情况下,确定对第一预测模型进行训练达到预定训练条件。在得到样本视频的推荐程度在预定阈值范围内时,确定该第一预测模型收敛,即对第一预测模型的训练达到预定的训练目标,因此,可以输出此时模型训练所采用的特征,便于后续对特征的选择。
作为一种可选的实施例,确定多个特征分别对应的重要性参数是否满足预定参数条件,在多个特征分别对应的重要性参数不满足预定参数条件的情况下,从多个特征中删除重要性参数小于预定参数阈值的特征,得到剩余特征。即重要性参数需要满足设定的预定参数条件,其中,预定参数条件的设定可以为多种,例如,在多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定多个特征分别对应的重要性参数满足预定参数条件。该预定参数条件可以根据样本数据进行设定,例如,获取样本数据,其中,样本数据包括预设时段内样本视频的特征数据;将样本数据输入到预设的神经网络模型中进行计算,得到预定参数条件。通过设定一定的条件,可以对特征重要性小的特征进行过滤,达到减少特征数量、减少过拟合、提高训练和预估效率、提高预估准确率的目的。能够更好地对基于特征的重要性参数对特征进行选择,使得最后选择得到的特征即是得到最优目标预测模型所采用的特征。
作为一种可选的实施例,采用上述对第一预测模型进行训练的方式,基于剩余特征对第二预测模型以及后续得到的预测模型进行训练,直到最终提取的剩余特征的重要性参数满足预定参数条件,其中,最终得到的剩余特征为目标特征,基于目标特征训练得到的模型为目标预测模型。通过过滤掉低重要性的特征,实现了深度学习模型特征选择的作用,减少噪音特征,得到满足预定目标的目标预测模型,进而在采用该目标预测模型对目标视频进行预测时,使得预测得到的目标视频的推荐程度更为准确。
作为一种可选的实施例,在得到目标预测模型之后,还包括:获取目标视频;采用目标预测模型对目标视频进行预测,得到目标视频的推荐程度。通过获取目标视频,采用目标预测模型对目标视频进行预测,即在采用目标预测模型对目标视频进行预测时,所采用的特征是权重高的特征,即重要性程度高的特征,采用这样的处理,不仅能够有效节省预测的计算量,而且也能够使得得到的目标视频的推荐程度更为准确,提升用户体验。
基于上述实施例及可选实施例,还提供一种可选实施方式。在该可选实施方式中,以预测视频的推荐概率作为视频的推荐程度为例进行说明,其中,视频的推荐程度越高表明向用户推荐的概率越高,反之则越低。
在相关技术中,在深度学习视频处理领域,例如,采用深度学习模型对视频进行预测时,能够采用的特征的种类繁多,少则数以百计,多则数以千计。不同种类特征具有不同的维度,比如,用户ID具有亿级维度,视频ID具有千万级维度等,深度学习将通过拟合用户行为,学习各种特征的参数,最终预测用户推荐视频的概率。而特征种类越多,特征参数就越多,耗时就随之升高,则会导致深度学习视频预测模型越来越复杂;而且某些特征的质量较差,输入到模型中,会导致模型过拟合,则会导致深度学习预测模型效果变差,这无疑限制了深度学习在视频领域的发展。
例如,在相关技术中,特征选择的方法一般是基于先验的人工特征选择方法,即通过人工判定某些特征的重要程度,将低重要性的特征进行删除过滤,最终实现特征选择的目的。该特征选择方法的缺点非常明显,依赖于人工的先验知识,维护性差,耗时高。
例如,还有一种常用的特征选择方法是根据信息熵判定,利用树模型在拟合推荐程度目标(例如,推荐概率,比如,具体可以为点击率)的过程中,将特征按照信息熵减少的方向进行分裂,从而使得拟合损失达到最小,从而根据特征分裂次数判定特征的重要性,将低重要性的特征进行删除过滤,最终实现特征选择的目的。该技术方案的缺点是树模型不能适用于大规模深度学习场景,尤其是对于稀疏特征,比如用户ID、设备ID、视频ID、作者ID等维度巨大的特征;而且树模型在样本数据规模巨大的场景下,树中特征的分裂节点变化很小,不能很好的拟合最新数据,不能用于在线学习场景。所以该方案不能很好地迁移到深度学习视频推荐程度预测场景中来。
鉴于此,本可选实施方式提供了一种预测视频推荐程度的方法,本可选实施方式通过注意力网络学习到每个特征的重要性参数,利用该参数过滤掉低重要性特征,从而实现深度学习模型特征选择的作用,减少噪音特征,减少过拟合,进而实现更高效更准确地预估视频推荐程度。该方法特别适合于大规模视频推荐的场景,既提升了效率也提升了实现效果。
下面对本可选实施方式所用的术语进行说明。
用户特征:即用户画像特征,包括用户的静态和动态,其中用户的静态特征包括用户自身的属性特征,包括用户的ID、设备ID、年龄段、性别、地域、城市等特征;动态特征包括用户的历史行为,包括用户的动态特征包含用户的观看视频ID列表、观看视频作者ID列表、点赞视频ID列表、点赞视频作者ID列表、评论视频ID列表、评论视频作者ID列表、长播视频ID列表、长播视频作者ID列表、举报视频ID列表、举报视频作者ID列表等特征。
视频特征:包括视频ID、视频作者ID、视频标签ID、视频聚类ID、视频时长、视频统计点击率、视频统计点赞率等特征。
交叉特征:即用户侧和视频侧特征的交叉特征,包括用户年龄段与视频标签的交叉特征、用户关注列表是否包括该视频作者、用户举报列表是否包括该视频作者等特征。
正负样本:负样本为给用户展现了但是没有被点击的视频,正样本是用户点击了的视频。
神经网络:图3是根据本发明可选实施方式的神经网络结构的示意图,如图3所示,该网络结构包括:
输入层(Input Layer):输入各种特征,包括标识(Identity,简称为ID)类稀疏特征和统计类离散化特征,每种特征以位置(Slot)编号区分。输入层的数据是一次浏览行为里的样本。例如,用户标识(User ID,简称为UID),用于标识用户,作者标识(Author ID,简称为AID),用于视频作者。在本层中,可以根据实际应用需求输入不同的标识。
嵌入层(Embedding Layer):将稀疏特征映射到稠密型特征,每个特征都有一个固定维度的特征向量,比如32维向量,即特征嵌入映射过程。
连接层(Concate Layer):将所有Slot稠密向量串联成一个长向量,其维度为所有Slot向量维度之和,例如,将嵌入层中的Slot稠密向量,即特征向量,串联成一个长向量。
注意力层(也即特征权重抽取层Slot Attention Layer):该层是本神经网络的核心,由一个三层深度神经网络(Deep Neural Networks,简称DNN)网络组成,其输入为连接层串联后按照每个Slot进行平均池化后的向量,该向量的维度即为特征个数;该注意力网络的输出为权重向量,该向量的维度同为特征个数,其目的为学习到每个特征的重要性。通过Sigmoid函数将向量归一化到0-1之间的值。需要说明的是,该Sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的激活函数,将变量映射到0,1之间,例如,将连接层串联后按照每个Slot平均池化后的特征向量赋予相应的权重。
权重应用层(Attention Apply Layer):将注意力层学习到的每个特征的权重与串联层的特征进行按位乘法(Slot element Product),其中先要将每个Slot权重值广播为向量,该向量的维度为对应Slot特征维度,该层的目的是将特征向量按照其重要性进行放缩,例如,按照注意力层为特征向量赋予的权重进行放缩。
全连接层:该层的输入为权重应用层放缩后的向量,从而经过多层神经网络的学习,最终预测出视频点击率,在本可选实施方式中,预测出的点击率表征视频的推荐程度。
需要说明的是,上述神经网络的结构并不唯一,神经网络可以包括多个层,包括输入层、嵌入层、连接层、特征权重抽取层、权重应用层、全连接层等,每个层也可以进一步包括多个层,前一层的输出作为后一层的输入,本实施例的核心在于增加了特征权重抽取层,能够抽取其中符合条件的重要特征,对于不重要的特征则可以滤除,以减少杂项干扰。其中,特征权重抽取层由三层DNN网络组成,第一层DNN网络和第二层DNN网络都包括线性变换层和线性整流函数(Rectified Linear Unit,简称为Relu)处理层,第三层DNN网络包括线性变换层和Sigmoid函数处理层,向量权重为0到1之间的数值。通常情况下,每层DNN网络具有两个层,分别是线性变换层和Relu处理层,本实施例中对于第三层将其中的Relu函数处理层替换成了Sigmoid函数处理层,这样可以得到0到1之间的权重值。另外,在神经网络预测的视频点击率出现周期性波动后,可以认为神经网络已经收敛,将特征权重抽取层的输出向量作为特征的重要性向量。
特征选择:图4是根据本发明可选实施方式的特征选择的流程图,如图4所示,经过上面的神经网络,即采用样本视频的样本数据,提取样本数据的多个特征,采用神经网络的注意力层输出多个特征分别对应的重要性参数(即重要性向量),基于多个特征、以及多个特征分别对应的重要性参数对第一预测模型(即此处的神经网络)进行训练。当神经网络预测的视频点击率出现周期性波动后,可以认为神经网络已收敛,此时将神经网络中注意力层的输出向量作为特征的重要性,即a=<a1,a2,a3,…,an>向量。即对应上述在对第一预测模型进行训练达到预定训练条件的情况下,得到第二预测模型(收敛的神经网络),提取注意力层输出的多个特征分别对应的重要性参数。将该向量按照大小排序,选择特征重要性最小的进行删除过滤,即对应上述步骤:确定多个特征分别对应的重要性参数是否满足预定参数条件(例如,此处可以设置为多个特征分别对应的重要性参数的标准差小于0.5),在多个特征分别对应的重要性参数不满足预定参数条件的情况下,从多个特征中删除重要性参数小于预定参数阈值的特征,得到剩余特征。过滤后,重新训练该网络,直到权重a向量的标准差小于0.5(向量的标准差小于一个值,说明波动较小,把不重要的特征已经删完了),即达到特征选择的作用,上述处理对应于步骤:采用上述对第一预测模型进行训练的方式,基于剩余特征对第二预测模型以及后续得到的预测模型进行训练,直到最终提取的剩余特征的重要性参数满足预定参数条件,其中,最终得到的剩余特征为目标特征,基于目标特征训练得到的模型为目标预测模型。
本实施例相对于普通的特征选择方法,通过注意力网络的应用,能够根据优化目标自动学习出特征的重要性,排除了人工的干扰。将特征选择作为一个重要特征预处理方式,解决了特征维度爆炸的问题,将不重要性的特征进行过滤,实际上过滤了噪音,可以减少模型过拟合。除了视频领域,也可以应用到其他领域。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例提供了视频处理装置,该装置可以用于执行本发明实施例的视频处理方法。
图5是根据本发明实施例的视频处理装置一的示意图,如图5所示,该装置包括:
第一获取模块502,用于获取待预测的目标视频;第一提取模块504,连接于上述第一获取模块502,用于提取目标视频的多个特征;注意力层模块506,连接于上述第一提取模块504,用于采用注意力层预测多个特征分别对应的重要性参数,其中,多个特征分别对应的重要性参数满足预定参数条件;应用层模块508,连接于上述注意力层模块506,用于将多个特征分别对应的重要性参数分别作用于对应的多个特征上,得到作用后的多个特征;第一预测模块510,连接于上述应用层模块508,用于基于作用后的多个特征,预测目标视频的推荐程度。
在一个可选的实施例中,该注意力层模块506,还可以包括平均池化单元,用于对多个特征进行平均池化,得到平均池后的特征向量,其中,特征向量的维度为多个特征的个数;第一处理单元,用于将特征向量作为注意力层的输入,输出得到用于表征多个特征分别对应的重要性参数的权重向量,其中,权重向量的维度也为多个特征的个数。注意力层模块506,还包括:第一确定单元,用于在多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定多个特征分别对应的重要性参数满足预定参数条件。
在一个可选的实施例中,该应用层模块508,还可以包括:运算单元,用于将多个特征分别对应的重要性参数分别与对应的多个特征进行按位运算处理,得到按位运算处理后的多个特征。
在一个可选的实施例中,该注意力层模块还可以包括:第一确定单元,用于在多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定多个特征分别对应的重要性参数满足预定参数条件。
图6是根据本发明实施例的视频处理装置二的示意图,如图6所示,该装置包括
训练模块602,用于采用样本视频的样本数据,提取样本数据的多个特征,采用注意力层输出多个特征分别对应的重要性参数,基于多个特征,以及多个特征分别对应的重要性参数对第一预测模型进行训练;第二提取模块604,连接于上述训练模块602,用于在对第一预测模型进行训练达到预定训练条件的情况下,得到第二预测模型,提取注意力层输出的多个特征分别对应的重要性参数;第一处理模块606,连接于上述第二提取模块604,用于确定多个特征分别对应的重要性参数是否满足预定参数条件,在多个特征分别对应的重要性参数不满足预定参数条件的情况下,从多个特征中删除重要性参数小于预定参数阈值的特征,得到剩余特征;第二处理模块608,连接于上述第一处理模块606,用于采用上述对第一预测模型进行训练的方式,基于剩余特征对第二预测模型以及后续得到的预测模型进行训练,直到最终提取的剩余特征的重要性参数满足预定参数条件,其中,最终得到的剩余特征为目标特征,基于目标特征训练得到的模型为目标预测模型。
在一个可选的实施例中,该第二提取模块604,还可以包括:第二确定单元,用于在将样本视频的样本数据中的多个数据输入第一预测模型,得到样本视频的推荐程度在预定阈值范围内的情况下,确定对第一预测模型进行训练达到预定训练条件。
在一个可选的实施例中,该第一处理模块606,还可以包括:第三确定单元,用于在多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定多个特征分别对应的重要性参数满足预定参数条件。
在一个可选的实施例中,该装置还可以包括:第二获取模块,用于获取目标视频;第二预测模块,用于采用目标预测模型对目标视频进行预测,得到目标视频的推荐程度。
视频处理装置包括处理器和存储器,上述模块和单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来提高视频推荐准确度。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现视频处理方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行视频处理方法。
本发明实施例提供了一种电子设备,该电子设备包括至少一个处理器、以及与处理器连接的至少一个存储器、总线;其中,处理器、存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,以执行上述的视频处理方法。本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取待预测的目标视频;提取目标视频的多个特征;采用注意力层预测多个特征分别对应的重要性参数,其中,多个特征分别对应的重要性参数满足预定参数条件;将多个特征分别对应的重要性参数分别作用于对应的多个特征上,得到作用后的多个特征;基于作用后的多个特征,预测目标视频的推荐程度。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种视频处理方法,其特征在于,包括:
获取待预测的目标视频;
提取所述目标视频的多个特征;
采用注意力层预测所述多个特征分别对应的重要性参数,其中,所述多个特征分别对应的重要性参数满足预定参数条件;
将所述多个特征分别对应的重要性参数分别作用于对应的所述多个特征上,得到作用后的多个特征;
基于作用后的多个特征,预测所述目标视频的推荐程度。
2.根据权利要求1所述的方法,其特征在于,所述采用注意力层预测所述多个特征分别对应的重要性参数,包括:
对所述多个特征进行平均池化,得到平均池后的特征向量,其中,所述特征向量的维度为所述多个特征的个数;
将所述特征向量作为所述注意力层的输入,输出得到用于表征所述多个特征分别对应的重要性参数的权重向量,其中,所述权重向量的维度也为所述多个特征的个数。
3.根据权利要求1所述的方法,其特征在于,所述将所述多个特征分别对应的重要性参数分别作用于对应的所述多个特征上,得到作用后的多个特征,包括:
将所述多个特征分别对应的重要性参数分别与对应的所述多个特征进行按位运算处理,得到按位运算处理后的多个特征。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述多个特征分别对应的重要性参数满足预定参数条件,包括:
在所述多个特征分别对应的重要性参数的标准差小于预定阈值的情况下,确定所述多个特征分别对应的重要性参数满足所述预定参数条件。
5.一种视频处理方法,其特征在于,包括:
采用样本视频的样本数据,提取所述样本数据的多个特征,采用注意力层输出所述多个特征分别对应的重要性参数,基于多个特征、以及所述多个特征分别对应的重要性参数对第一预测模型进行训练;
在对所述第一预测模型进行训练达到预定训练条件的情况下,得到第二预测模型,提取所述注意力层输出的所述多个特征分别对应的重要性参数;
确定所述多个特征分别对应的重要性参数是否满足预定参数条件,在所述多个特征分别对应的重要性参数不满足所述预定参数条件的情况下,从所述多个特征中删除重要性参数小于预定参数阈值的特征,得到剩余特征;
采用上述对第一预测模型进行训练的方式,基于剩余特征对所述第二预测模型以及后续得到的预测模型进行训练,直到最终提取的剩余特征的重要性参数满足所述预定参数条件,其中,最终得到的剩余特征为目标特征,基于所述目标特征训练得到的模型为目标预测模型。
6.一种视频处理装置,其特征在于,包括:
第一获取模块,用于获取待预测的目标视频;
第一提取模块,用于提取所述目标视频的多个特征;
注意力层模块,用于采用注意力层预测所述多个特征分别对应的重要性参数,其中,所述多个特征分别对应的重要性参数满足预定参数条件;
应用层模块,用于将所述多个特征分别对应的重要性参数分别作用于对应的所述多个特征上,得到作用后的多个特征;
第一预测模块,用于基于作用后的多个特征,预测所述目标视频的推荐程度。
7.一种视频处理装置,其特征在于,包括:
训练模块,用于采用样本视频的样本数据,提取所述样本数据的多个特征,采用注意力层输出所述多个特征分别对应的重要性参数,基于多个特征,以及所述多个特征分别对应的重要性参数对第一预测模型进行训练;
第二提取模块,用于在对所述第一预测模型进行训练达到预定训练条件的情况下,得到第二预测模型,提取所述注意力层输出的所述多个特征分别对应的重要性参数;
第一处理模块,用于确定所述多个特征分别对应的重要性参数是否满足预定参数条件,在所述多个特征分别对应的重要性参数不满足所述预定参数条件的情况下,从所述多个特征中删除重要性参数小于预定参数阈值的特征,得到剩余特征;
第二处理模块,用于采用上述对第一预测模型进行训练的方式,基于剩余特征对所述第二预测模型以及后续得到的预测模型进行训练,直到最终提取的剩余特征的重要性参数满足所述预定参数条件,其中,最终得到的剩余特征为目标特征,基于所述目标特征训练得到的模型为目标预测模型。
8.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至5中任一项所述的视频处理方法。
9.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至5中任一项所述的视频处理方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的视频处理方法。
CN202111015935.3A 2021-08-31 2021-08-31 视频处理方法和装置 Active CN113794900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111015935.3A CN113794900B (zh) 2021-08-31 2021-08-31 视频处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111015935.3A CN113794900B (zh) 2021-08-31 2021-08-31 视频处理方法和装置

Publications (2)

Publication Number Publication Date
CN113794900A true CN113794900A (zh) 2021-12-14
CN113794900B CN113794900B (zh) 2023-04-07

Family

ID=79182482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111015935.3A Active CN113794900B (zh) 2021-08-31 2021-08-31 视频处理方法和装置

Country Status (1)

Country Link
CN (1) CN113794900B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014215685A (ja) * 2013-04-23 2014-11-17 株式会社Nttドコモ レコメンドサーバおよびレコメンドコンテンツ決定方法
CN106940703A (zh) * 2016-01-04 2017-07-11 腾讯科技(北京)有限公司 推送信息粗选排序方法及装置
CN109359592A (zh) * 2018-10-16 2019-02-19 北京达佳互联信息技术有限公司 视频帧的处理方法、装置、电子设备及存储介质
CN109408731A (zh) * 2018-12-27 2019-03-01 网易(杭州)网络有限公司 一种多目标推荐方法、多目标推荐模型生成方法以及装置
US20190102706A1 (en) * 2011-10-20 2019-04-04 Affectomatics Ltd. Affective response based recommendations
CN109992710A (zh) * 2019-02-13 2019-07-09 网易传媒科技(北京)有限公司 点击率预估方法、系统、介质和计算设备
CN110825966A (zh) * 2019-10-31 2020-02-21 广州市百果园信息技术有限公司 一种信息推荐的方法、装置、推荐服务器和存储介质
CN111209970A (zh) * 2020-01-08 2020-05-29 Oppo(重庆)智能科技有限公司 视频分类方法、装置、存储介质及服务器
CN111246256A (zh) * 2020-02-21 2020-06-05 华南理工大学 基于多模态视频内容和多任务学习的视频推荐方法
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
US20200288205A1 (en) * 2019-05-27 2020-09-10 Beijing Dajia Internet Information Technology Co., Ltd. Method, apparatus, electronic device, and storage medium for recommending multimedia resource
WO2020221278A1 (zh) * 2019-04-29 2020-11-05 北京金山云网络技术有限公司 视频分类方法及其模型的训练方法、装置和电子设备

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190102706A1 (en) * 2011-10-20 2019-04-04 Affectomatics Ltd. Affective response based recommendations
JP2014215685A (ja) * 2013-04-23 2014-11-17 株式会社Nttドコモ レコメンドサーバおよびレコメンドコンテンツ決定方法
CN106940703A (zh) * 2016-01-04 2017-07-11 腾讯科技(北京)有限公司 推送信息粗选排序方法及装置
CN109359592A (zh) * 2018-10-16 2019-02-19 北京达佳互联信息技术有限公司 视频帧的处理方法、装置、电子设备及存储介质
CN109408731A (zh) * 2018-12-27 2019-03-01 网易(杭州)网络有限公司 一种多目标推荐方法、多目标推荐模型生成方法以及装置
CN109992710A (zh) * 2019-02-13 2019-07-09 网易传媒科技(北京)有限公司 点击率预估方法、系统、介质和计算设备
WO2020221278A1 (zh) * 2019-04-29 2020-11-05 北京金山云网络技术有限公司 视频分类方法及其模型的训练方法、装置和电子设备
US20200288205A1 (en) * 2019-05-27 2020-09-10 Beijing Dajia Internet Information Technology Co., Ltd. Method, apparatus, electronic device, and storage medium for recommending multimedia resource
CN110825966A (zh) * 2019-10-31 2020-02-21 广州市百果园信息技术有限公司 一种信息推荐的方法、装置、推荐服务器和存储介质
CN111209970A (zh) * 2020-01-08 2020-05-29 Oppo(重庆)智能科技有限公司 视频分类方法、装置、存储介质及服务器
CN111291266A (zh) * 2020-02-13 2020-06-16 腾讯科技(北京)有限公司 基于人工智能的推荐方法、装置、电子设备及存储介质
CN111246256A (zh) * 2020-02-21 2020-06-05 华南理工大学 基于多模态视频内容和多任务学习的视频推荐方法

Also Published As

Publication number Publication date
CN113794900B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN109582793B (zh) 模型训练方法、客服系统及数据标注系统、可读存储介质
CN111144937A (zh) 广告素材确定方法、装置、设备及存储介质
CN113254649B (zh) 敏感内容识别模型的训练方法、文本识别方法及相关装置
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
WO2024114034A1 (zh) 内容推荐方法、装置、设备、介质和程序产品
CN112905876A (zh) 基于深度学习的信息推送方法、装置和计算机设备
CN115456043A (zh) 分类模型处理、意图识别方法、装置和计算机设备
CN111209105A (zh) 扩容处理方法、装置、设备及可读存储介质
CN110852103A (zh) 一种命名实体识别方法及装置
CN113794900B (zh) 视频处理方法和装置
CN114741592B (zh) 一种基于多模型融合的产品推荐方法、设备及介质
CN111091198A (zh) 一种数据处理方法及装置
CN113610215B (zh) 任务处理网络生成、任务处理方法、装置及电子设备
CN117312549A (zh) 工单的处理方法、装置及电子设备
CN114580533A (zh) 特征提取模型的训练方法、装置、设备、介质及程序产品
CN115186098A (zh) 语义增强的知识图谱周期性推理方法和装置
CN110210518B (zh) 提取降维特征的方法和装置
CN114443904A (zh) 视频查询方法、装置、计算机设备及计算机可读存储介质
CN114513578A (zh) 外呼方法、装置、计算机设备及存储介质
CN113792163B (zh) 多媒体推荐方法、装置、电子设备及存储介质
CN114385892B (zh) 一种文章等级识别方法、装置、服务器及存储介质
CN110059219A (zh) 一种视频偏好预测方法、装置、设备及可读存储介质
CN114417944B (zh) 识别模型训练方法及装置、用户异常行为识别方法及装置
CN118798626A (zh) 风险数据识别方法、装置及电子设备
CN118195672A (zh) 基于大模型的获取多目标预测模型、产品数据预测的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant