CN109729348B - 一种确定视频质量的方法、装置及设备 - Google Patents
一种确定视频质量的方法、装置及设备 Download PDFInfo
- Publication number
- CN109729348B CN109729348B CN201910177920.3A CN201910177920A CN109729348B CN 109729348 B CN109729348 B CN 109729348B CN 201910177920 A CN201910177920 A CN 201910177920A CN 109729348 B CN109729348 B CN 109729348B
- Authority
- CN
- China
- Prior art keywords
- information
- video
- quality
- resource
- title
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种确定视频质量的方法及系统,通过根据视频的标题信息确定资源标题质量信息;根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息;根据视频的画质信息确定资源画质质量信息;基于所述资源标题质量信息、资源内容质量信息和资源画质质量信息,确定所述视频的第一视频质量信息,解决了视频质量确认不准确和占用处理资源较多的问题,提高了对视频质量确认的效率和准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种确定视频质量的方法、装置及设备。
背景技术
视频作为获取信息的形式已经越来越受人们关注了,但是视频质量良莠不齐,如何确定视频质量成了业界热议的话题。目前,人工标注获取视频质量的方法较为普遍,人力、财力、时间成本较高。
但是,现有的非人工标注方式的视频质量确定方法也存在诸多问题。有的根据视频播放频次确定视频质量,但一些标题党的存在可能会导致播放次数的增加,使得视频标题对视频播放次数有直接影响。有的根据视频播放时长确定视频质量,由于现有技术是针对所有类型视频而言,其中包括长视频与短视频,而原则上,同等视频质量的长视频的播放时长会大于短视频,但不代表短视频的质量不佳
鉴于现有关于视频质量的确定方法常常是片面的,因此需要考虑更为全面的视频质量确定方案。
发明内容
本发明提出了一种确定视频质量的方法、装置及设备,提供了一种新的视频质量确定方案,对视频业的发展具有重要意义。本发明具体是以如下技术方案实现的:
一方面,本发明提供了一种确定视频质量的方法,包括:
根据视频的标题信息确定资源标题质量信息;
根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息;
根据视频的画质信息确定资源画质质量信息;
基于所述资源标题质量信息、资源内容质量信息和资源画质质量信息,确定所述视频的第一视频质量信息。
另一方面,本发明提供了一种确定视频质量的装置,包括:
资源标题质量信息确定模块,用于根据视频的标题信息确定资源标题质量信息;
资源内容质量信息确定模块,用于根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息;
资源画质质量信息确定模块,用于根据视频的画质信息确定资源画质质量信息;
第一视频质量信息确定模块,用于基于所述资源标题质量信息、资源内容质量信息和资源画质质量信息,确定所述视频的第一视频质量信息。
进一步的,所述装置还包括:
接收模块,用于接收视频搜索请求,所述视频搜索请求包括搜索内容信息;
第一获取模块,用于获取多个视频所对应标题信息中的关键词和标签信息;
资源标题匹配信息确定模块,用于根据所述搜索内容信息与所述关键词和/或标签信息间的匹配程度分别确定所述多个视频的资源标题匹配信息;
第二视频质量信息确定模块,用于基于所述资源标题匹配信息和所述资源标题质量信息、资源内容质量信息和资源画质质量信息分别确定所述多个视频的第二视频质量信息;
搜索结果确定模块,用于基于所述第二视频质量信息确定所述视频搜索请求的搜索结果。
进一步的,所述搜索结果确定模块还包括:
排序模块,用于根据所述第二视频质量信息的数值大小由大到小对所述多个视频排序;
视频选取模块,用于从排序后的视频中选取排序靠前的预设数量个视频作为所述视频搜索结果。
进一步的,所述装置还包括:
第二显示模块,用于显示所述搜索结果中的视频和所述视频的第二视频质量信息。
进一步的,所述装置还包括:
第一显示模块,用于显示包含有所述第一视频质量信息的视频。
进一步的,所述资源标题质量信息确定模块,包括:
第二获取模块,用于获取所述视频的标题信息;
分词模块,用于对所述标题信息进行分词,得到标题分词信息;
问题解决意图信息确定模块,用于根据标题分词信息中含有的问题解决意图词的个数确定所述问题解决意图信息;
和/或,标题精炼度确定模块,用于根据视频的标题分词信息中冗余词的个数确定标题精炼度。
进一步的,所述资源内容质量信息确定模块,包括:
内容属性质量确定模块,用于根据所述内容属性信息中的内容时长和内容标签确定所述视频的内容属性质量;
内容反馈质量确定模块,用于根据所述内容反馈信息中的用户接受度和用户互动信息确定所述视频的内容反馈质量;
内容来源质量确定模块,用于根据所述内容来源信息中资源发布方的权威性确定所述视频的内容来源质量;
所述资源内容质量信息确定模块,还用于根据所述内容属性质量、所述内容反馈质量和所述内容来源质量确定所述视频的资源内容质量信息。
进一步的,所述资源画质质量信息确定模块,包括:
第三获取模块,用于获取所述画质信息中的播放画质信息和/或封面图清晰度信息;
所述资源画质质量信息确定模块,还用于根据所述播放画质信息和/或封面图清晰度信息确定资源画质质量信息。
另一方面,本发明提供了一种确定视频质量的设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如所述第一方面所述的确定视频质量的方法。
本发明提供了一种定视频质量的方法、装置及设备,具有如下技术效果:
本发明利用可获取的客观变量对资源标题质量、资源内容质量和资源画质质量三个方面共同确定视频的质量。经检验,根据提出方法得到的视频质量确认结果与人工主观确认结果相近。本发明提高了对视频质量确认的效率和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本发明实施例提供的一种确定视频质量的方法的流程示意图;
图2是本发明实施例提供的一种基于问题导向型短视频的质量评分方法的框架示意图;
图3是本发明实施例提供的另一种确定视频质量的方法的流程示意图;
图4是本发明实施例提供的一种基于视频垂直搜索的后置推荐结果示意图;
图5是本发明实施例提供的一种基于视频垂直搜索的后置推荐编号及打分示意图;
图6是本发明实施例提供的一种基于视频垂直搜索的后置推荐降序排列示意图;
图7是本发明实施例提供的一种基于视频垂直搜索方法的应用场景示意图;
图8是本发明实施例提供的一种基于视频搜索直达的前置推荐的原搜索结果示意图;
图9是本发明实施例提供的一种基于视频搜索直达的前置推荐的直达结果示意图;
图10是本发明实施例提供的一种基于视频搜索直达的前置推荐的原视频播放界面示意图;
图11是本发明实施例提供的一种基于视频搜索直达的前置推荐新的播放界面示意图;
图12是本发明实施例提供的一种基于视频搜索直达方法的应用场景示意图;
图13是本发明实施例提供的一种确定视频质量的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下介绍本发明确定视频质量的方法,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或服务器产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
图1是本发明实施例提供的一种确定视频质量的方法的流程示意图,如图1所示,所述方法具体包括:
S101:根据视频的标题信息确定资源标题质量信息。
具体的,所述资源标题质量信息包括:问题解决意图信息和/或标题精炼度。所述问题解决意图信息可以是体现问题解决意图的词。所述根据视频的标题信息确定资源标题质量信息包括如下步骤:获取所述视频的标题信息;对所述标题信息进行分词,得到标题分词信息;根据标题分词信息中含有的问题解决意图词的个数确定所述问题解决意图信息;和/或,根据视频的标题分词信息中冗余词的个数确定标题精炼度。
资源标题是用户选择资源时判断资源内容是否契合用户意图的重要评判标准,也是用户对视频类资源最直观的“第一印象”,因此衡量标题质量可以作为判断视频质量的重要标准。
高质量的标题往往是视频资源核心内容的精炼概括,冗余词不宜过多,且与用户query高度匹配。
目前视频质量的评估方法大多数没有针对特定视频类型,都是一概而论。而不同类型的视频的特点不同,已有的方法只能进行初步的筛选,难以完成精确的质量评估,因此需要针对特定类型设计质量评估方法。据统计,问题导向型短视频是具有明确意图短视频搜索中最重要的品类,而目前未有针对该类视频的研究和发明。
由于短视频近年兴起,但关于短视频的发明主要集中于视频的制作、运行、标志和搜索等方面。短视频的特点是时长短,需要在短时间内浓缩内容精华,因此对内容质量的评分尤为重要。下面的方法主要针对问题导向型短视频(内容为解决特定问题的具有教学性质的短视频),因为短视频有明确时长限制,对视频质量要求较高,因此问题导向型短视频需要在短时间内描述解决问题的方法,让观看者能快速理解视频内容。
针对问题导向型的短视频而言,视频标题还应含有明显的问题解决意图(solution-oriented)信息,如“教”、“怎么”、“如何”、“方法”等。
基于上述考虑,本说明书还提供了基于问题导向型短视频的质量评分方法。基于问题导向型短视频的质量评分方法由资源标题质量模块、资源内容质量模块、资源画质质量模块组成,具体框架图参见图2。
所述根据视频的标题信息确定资源标题质量信息使用的具体评判指标如下:
Title匹配分数(T1):对短视频标题(Title)的核心动名词短语(Title_kw)与用户query和短视频标签(tag)的匹配程度进行打分。
Solve词分数(T2):对短视频标题中含有的问题解决意图相关词语(Solve_words)个数进行统计并打分。
Title精炼度(T3):对短视频标题中无实际意义的冗余词(Redundant_words)进行统计并打分。
具体资源标题质量的评分细则示例参见下表:
S103:根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息。
其中,所述内容属性信息可以包括完整系数、tag匹配分数等,所述内容反馈信息可以包括合格系数、用户正反馈分数等,所述内容来源信息可以包括来源权威分数等。
具体的,所述根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息包括如下步骤:根据所述内容属性信息中的内容时长和内容标签确定所述视频的内容属性质量;根据所述内容反馈信息中的用户接受度和用户互动信息确定所述视频的内容反馈质量;根据所述内容来源信息中资源发布方的权威性确定所述视频的内容来源质量;根据所述内容属性质量、所述内容反馈质量和所述内容来源质量确定所述视频的资源内容质量信息。
视频内容质量的好坏本质上取决于用户在观看过程中需求是否得到满足,且不同用户间对同一资源质量内容判断存在一定的主观差异。而直接要求用户观看资源后进行打分有碍于用户体验,且收集到的数据易出现稀疏性、冷启动等缺陷,难以得到用户在观看资源后的直接感受。通过提取用户在平台上留下的反馈数据,如“点赞数”、“分享数”、“点踩数”、“收藏数”等作为用户对视频内容质量主观评价的映射,加入视频质量评价中,建立资源内容质量的评价规则,丰富了资源质量的维度。
内容质量直接决定了用户对视频质量的判断。
问题导向型的短视频旨在提供一种直观的呈现方式帮助用户快速解决问题,能否达到这一根本目的可以从短视频的标签契合程度、用户的正负反馈进行建模。利用短视频特有的标签属性,匹配解决问题导向的标签(如“妙招”、“生活小妙招”等),可以过滤掉与问题导向型短视频无关的资源。用户的反馈中,点赞数和收藏数属于明显的正向反馈,暗示了用户对视频内容质量的认可;评论数反映了视频的曝光度,一定程度上可以代表视频的热度;点踩数属于明显的负向反馈,点踩数过高的视频资源可以视为劣质资源。
除此之外,视频的完整性、权威程度对其内容质量也有一定影响。问题导向型短视频不宜过短,发布者为PGC(Professionally-generated Content,专业生产内容,可以理解为已认证的号)或人气UGC(User-generated Content,用户生产内容,可以理解为未认证的一般号)的短视频权威度更高,用户对其的信赖程度也更高。
所述根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息使用的具体包括:
完整系数(C1):对资源内容的完整性进行判断,若视频时长(Runtime)太短,则资源不完整,可不予上线。
合格系数(C2):对资源的用户接受度进行判断,若用户对视频提供的负反馈(ThumbsDown)多于正反馈(ThumbsUp),则暗示该视频质量较差,可不予上线。
tag匹配分数(C3):对短视频标签中属于问题解决导向类型的个数(Tag_solve)进行统计并对tag的匹配度进行打分。
用户正反馈分数(C4):使用视频的点赞数(ThumsUp)、评论数(Comment)、收藏数(Save)、分享数(Share)对用户提供的正向反馈程度进行打分。
来源权威分数(C5):对资源来源的权威程度进行打分,若资源发布者为PGC或粉丝数(Fans_Cnt)较多的UGC,则该资源的权威程度较高;若资源发布者为粉丝数较少的UGC,则该资源的权威程度较低。
具体资源内容质量确定的具体示例参见下表:
S105:根据视频的画质信息确定资源画质质量信息。
具体的,所述根据视频的画质信息确定资源画质质量信息包括:获取所述画质信息中的播放画质信息和/或封面图清晰度信息;根据所述播放画质信息和/或封面图清晰度信息确定资源画质质量信息。
本说明书中视频的标题信息、内容属性信息、内容反馈信息、内容来源信息、画质信息等均是直接采集或进行简单识别即可获得,不需要进行计算。
问题导向的短视频提供给用户的观感体验好坏也会影响视频质量的评估。视频的清晰度和视频封面的质量数据易于获取,且会影响用户在选择视频和观看视频时的动作。在极端条件下,一些对用户体验要求较高的用户甚至不会选择内容质量较高但画质较差的资源。
所述根据视频的画质信息确定资源画质质量信息具体包括:用户观感体验(UserE):对视频提供给用户的观感体验舒适度进行打分,包括视频的画质(U1)和封面图的清晰度(U2)两方面。
具体资源画质质量确定的具体示例参见下表:
S107:基于所述资源标题质量信息、资源内容质量信息和资源画质质量信息,确定所述视频的第一视频质量信息。
所述基于所述资源标题质量信息、资源内容质量信息和资源画质质量信息,确定所述视频的第一视频质量信息,可以是根据预先设定的算法进行确定。
根据以上对问题导向性短视频质量评分模型的描述,构建预设算法如下。
Scorei=TitleQi×ContentQi×UserEi (1)
TitleQi=α+β×log36(T1i×T2i×T3i) (2)
ContentQi=C1i×C2i×[χ+δ×log30(C3i×C4i×C5i)] (3)
VideoEi=γ+μ×log4(Vi) (5)
Vi=λ×V1i+ζ×V2i (6)
α+β=1 (7)
χ+δ=1 (8)
ω+ε+η=1 (9)
γ+μ=1 (10)
λ+ζ=1 (11)
Scorei表示第i条问题导向型短视频的质量总分数,Scorei∈[0,1]。
TitleQi表示第i条问题导向型短视频的资源标题质量分数,TitleQi∈[0,1]。
ContentQi表示第i条问题导向型短视频的资源内容质量分数,ContentQi∈[0,1]。
UserEi表示第i条问题导向型短视频的用户体验分数,UserEi∈[0,1]。
T1i表示第i条问题导向型短视频的Title匹配分数,T1i∈{1,2,3,4}。
T2i表示第i条问题导向型短视频的solve词分数,T2i∈{1,2,3}。
T3i表示第i条问题导向型短视频的title精炼度分数,T3i∈{1,2,3}。
C1i表示第i条问题导向型短视频完整系数,C1i∈{0,1}。
C2i表示第i条问题导向型短视频合格系数,C2i∈{0,1}。
C3i表示第i条问题导向型短视频的tag匹配分数,C3i∈{1,2,3}。
C4i表示第i条问题导向型短视频的用户正反馈分数,C4i∈[0,5]。
C5i表示第i条问题导向型短视频的来源权威分数,C5i∈{1,2}。
ω表示点赞正反馈系数,ω∈[0,1]。
ε表示评论正反馈系数,ε∈[0,1]。
η表示保存于分享正反馈系数,η∈[0,1]。
ThumbsUi表示第i条问题导向型短视频的点赞正反馈分数,ThumbsUi∈{1,2,3,4,5}。
Commenti表示第i条问题导向型短视频的评论正反馈分数,Commenti∈{1,2,3,4,5}。
Savei表示第i条问题导向型短视频的收藏正反馈分数,Savei∈{1,2,3,4,5}。
Sharei表示第i条问题导向型短视频的转发正反馈分数,Sharei∈{1,2,3,4,5}。
Vi表示第i条问题导向型短视频的资源画质分数,Vi∈[0,1]。
V1i表示第i条问题导向型短视频的视频播放画质分数,V1i∈{1,2,3,4}。
V2i表示第i条问题导向型短视频的封面图清晰度分数,V2i∈{1,2,3,4}。
α表示资源标题质量分数补偿系数,α∈[0,1]。
β表示资源标题质量分数比重系数,β∈[0,1]。
χ表示资源内容质量分数补偿系数,χ∈[0,1]。
δ表示资源内容质量分数比重系数,δ∈[0,1]。
γ表示用户体验分数补偿系数,γ∈[0,1]。
μ表示用户体验分数比重系数,μ∈[0,1]。
λ表示视频画质分数系数,λ∈[0,1]。
ζ表示封面图清晰度分数系数,ζ∈[0,1]。
S109:显示包含有所述第一视频质量信息的视频。
所述显示包含有所述第一视频质量信息的视频中的第一视频质量信息具体可以通过数字、文字或图标的方式体现,例如,通过打分的方式体现。
本发明利用可获取的客观变量对资源标题质量、资源内容质量和资源画质质量三个方面共同确定视频的质量,从而可以基于视频质量进行打分和分类,不需要对参数进行大量复杂的计算,提高了对视频质量确认的效率和准确性。
图3是本发明实施例提供的另一种确定视频质量的方法的流程示意图,如图3所示,具体包括:
S301-S305与所述S101-S105相同,在此不再赘述。
S307:接收视频搜索请求,所述视频搜索请求包括搜索内容信息。
当用户需要获取想要的问题导向型短视频时,用户在搜索框中输入搜搜内容,并触发搜索请求。
所述步骤S307之后,所述方法还包括:根据所述搜索内容信息确定第一视频搜索结果,所述第一视频搜索结果包括多个视频。
S309:获取多个视频所对应标题信息中的关键词和标签信息。
对视频标题进行分词,以获取其中的关键词。
S311:根据所述搜索内容信息与所述关键词和/或标签信息间的匹配程度分别确定所述多个视频的资源标题匹配信息。
S313:基于所述资源标题匹配信息和所述资源标题质量信息、资源内容质量信息和资源画质质量信息分别确定所述多个视频的第二视频质量信息。
S315:基于所述第二视频质量信息确定所述视频搜索请求的搜索结果。
具体的,可以直接显示所述搜索结果中的视频和所述视频的第二视频质量信息。
基于所述第二视频质量信息确定所述视频搜索请求的搜索结果还可以根据所述第二视频质量信息的数值大小由大到小对所述多个视频排序;从排序后的视频中选取排序靠前的预设数量个视频作为所述视频搜索结果。
根据用户的搜索请求向用户推荐基于视频质量打分并排序的搜索结果。
本发明可以进行视频的质量评估,从而为视频筛选提供参考指标,有助于在海量视频中快速准确找出符合用户需求的视频,可以有效改善用户体验。
本说明书的方案可以用于浏览器或APP等中的短视频推荐。具体应用于视频垂直搜索的后置推荐与搜索直达的前置推荐。以某浏览器中的应用为例:
1)视频垂直搜索的后置推荐
垂直搜索是指先选择目标资源类型再输入query进行搜索。如在某浏览器中先选择目标资源类型为“视频”,再输入“如何开榴莲”,会得到视频垂直搜索的后置结果如图4。
对上述结果中的五个视频进行编号,根据本方案计算短视频质量分数并进行标准化,如图5。由于推荐算法是由多个因子组成,共同影响推荐效果,并且权重是可调的。短视频质量分数是其中一个影响因子。因此根据推荐算法得出的结果可能如图6所示,即使4号短视频的质量分数低于5号短视频,但由于其他因子的分数较高,导致4号短视频其前置于5号短视频。
若视频质量分数的权重在推荐算法中较高,则可以质量最好的短视频置顶推荐给用户,并且可以优化外观设计,将其明显区分于其他质量一般的短视频,如图6。
如图7,是通过某浏览器中,垂搜“如何开榴莲”的具体描述用户使用场景流程。
具体流程描述如下。
(1)点击搜索框
(2)选择“视频”,进入垂搜。
(3)输入query“如何开榴莲”,点击搜索。
(4)获取推荐结果(最佳回答置顶且美化),进入视频播放器。
(5)播放短视频。
2)搜索直达的前置推荐
搜索直达,简称“直达”,是指在搜索框中输入query在未点击“搜索”按钮时,页面显示的内容。直接搜索,简称“直搜”,是指点击搜索按钮后显示的内容。对于某浏览器产品而言,直搜会进入搜狗搜索界面,而直达是由某浏览器自主研发。由于两者是由不同部门负责,“直达”具有可控、搜索便捷的优点,因此本方案可以在搜索直达中前置推荐符合用户需求的高质量短视频。
如输入query“如何开榴莲”,目前“直达”中推荐内容如图8所示。采用本方案对短视频质量进行评分后,并且综合考虑其他推荐因子的影响,可以在直达中前置推荐评分最高的问题导向型短视频,并进行一定的美化设计,如图9。
此外,可以对推荐的最佳问题导向型短视频的播放界面进行美化设计。目前点击视频后,播放界面如图10所示。播放界面除播放该视频以外,下方可以推荐其他类似视频,如图11。
如图12,是通过某浏览器中,直达“如何开榴莲”的具体描述用户使用场景流程。
具体流程描述如下。
(1)点击搜索框
(2)输入query“如何开榴莲”,不点击搜索。
(3)直达界面跳出,获取推荐结果(最佳回答置顶且美化),进入视频播放器。
(4)播放短视频。
本发明实施例还提供了一种确定视频质量的装置,如图13所示,所述装置包括:
资源标题质量信息确定模块1301,用于根据视频的标题信息确定资源标题质量信息;
资源内容质量信息确定模块1303,用于根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息;
资源画质质量信息确定模块1305,用于根据视频的画质信息确定资源画质质量信息;
第一视频质量信息确定模块1307,用于基于所述资源标题质量信息、资源内容质量信息和资源画质质量信息,确定所述视频的第一视频质量信息。
进一步的,所述装置还包括:
接收模块1309,用于接收视频搜索请求,所述视频搜索请求包括搜索内容信息;
第一获取模块1311,用于获取多个视频所对应标题信息中的关键词和标签信息;
资源标题匹配信息确定模块1313,用于根据所述搜索内容信息与所述关键词和/或标签信息间的匹配程度分别确定所述多个视频的资源标题匹配信息;
第二视频质量信息确定模块1315,用于基于所述资源标题匹配信息和所述资源标题质量信息、资源内容质量信息和资源画质质量信息分别确定所述多个视频的第二视频质量信息;
搜索结果确定模块1317,用于基于所述第二视频质量信息确定所述视频搜索请求的搜索结果。
进一步的,所述搜索结果确定模块还包括:
排序模块,用于根据所述第二视频质量信息的数值大小由大到小对所述多个视频排序;
视频选取模块,用于从排序后的视频中选取排序靠前的预设数量个视频作为所述视频搜索结果。
进一步的,所述装置还包括:
第二显示模块,用于显示所述搜索结果中的视频和所述视频的第二视频质量信息。
进一步的,所述装置还包括:
第一显示模块,用于显示包含有所述第一视频质量信息的视频。
进一步的,所述资源标题质量信息确定模块,包括:
第二获取模块,用于获取所述视频的标题信息;
分词模块,用于对所述标题信息进行分词,得到标题分词信息;
问题解决意图信息确定模块,用于根据标题分词信息中含有的问题解决意图词的个数确定所述问题解决意图信息;
和/或,标题精炼度确定模块,用于根据视频的标题分词信息中冗余词的个数确定标题精炼度。
进一步的,所述资源内容质量信息确定模块,包括:
内容属性质量确定模块,用于根据所述内容属性信息中的内容时长和内容标签确定所述视频的内容属性质量;
内容反馈质量确定模块,用于根据所述内容反馈信息中的用户接受度和用户互动信息确定所述视频的内容反馈质量;
内容来源质量确定模块,用于根据所述内容来源信息中资源发布方的权威性确定所述视频的内容来源质量;
所述资源内容质量信息确定模块,还用于根据所述内容属性质量、所述内容反馈质量和所述内容来源质量确定所述视频的资源内容质量信息。
进一步的,所述资源画质质量信息确定模块,包括:
第三获取模块,用于获取所述画质信息中的播放画质信息和/或封面图清晰度信息;
所述资源画质质量信息确定模块,还用于根据所述播放画质信息和/或封面图清晰度信息确定资源画质质量信息。
所述的装置实施例中的装置与方法实施例基于同样的发明构思。
本发明还提供了一种确定视频质量的设备,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如前述的确定视频质量的方法。
本说明书实施例中,所述存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、功能所需的应用程序等;存储数据区可存储根据所述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器,以提供处理器对存储器的访问。
由上述本发明提供的确定视频质量的方法、装置及设备的实施例可见,本说明书的方案通过分析问题导向短视频特征,利用可获取的客观变量对标题质量、资源内容质量和用户体验三个方面设计评分规则与计算公式,从而得到短视频的质量评分。
首先,通过计算得出的视频质量分数可以对短视频进行清洗,并定向筛选出满足用户需求的问题导向类短视频。
其次,本方案较为完整,日后可以进行组件化,封装成接口,在公司内的有关工作上推广使用,如:搜索引擎中短视频的前置推荐和后置推荐中使用。
再次,本方案可以减少人工标注成本。目前人工标注获取视频质量的方法较为普遍,且成本较高。假设需要标注10万条视频数据,人工标注速度约每条2分钟,则需要20万分钟,每天工作8小时则完成需要约1.1年。但采用本方案进行机器标注,约1秒即能完成,效率是人工的1200万倍。根据人工标注样本检验本方案,可以达到82%与人工主观评分相近。方案误差在可接受范围,且与人工标注误差相近,因此有理由认为本方案具有可行性。
最后,对行业与社会而言,目前短视频的推荐主要采用广告点击率预测(PredictClick-Through Rate,pCTR)的方法,主要根据点击率进行推荐,即认为点击率高的视频为质量好的视频,从而导致推荐视频质量层次不齐,影响用户体验。本方案基于问题导向短视频的特征,对其进行质量评分,日后可以将优质资源推荐给用户,有助于推动短视频行业的健康发展。
由上述本发明提供的确定视频质量的方法、装置及设备的实施例可见,本发明适用于对海量视频特别是近几年具有很高热度的短视频进行质量评估,通过对资源标题、内容、画质等几方面的有机结合,对视频的质量进行数字化确定,对用户搜索、观看视频、以及服务端分析视频可以起到良好的参考作用。本发明还可以进行问题导向型短视频的质量评分,从而为短视频筛选提供参考指标,有助于在海量短视频中快速准确找出高质量的问题导向短视频。利用本说明书实施例提供的技术方案可以快速准确的确定视频的质量,解决现有技术中视频质量确认不准确和占用较多处理资源的问题,提高了对视频质量确认的效率和准确性。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、系统和服务器实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种确定视频质量的方法,其特征在于,所述方法包括:
根据视频的标题信息确定资源标题质量信息,所述资源标题质量信息包括:问题解决意图信息;所述根据视频的标题信息确定资源标题质量信息包括:获取所述视频的标题信息;对所述标题信息进行分词,得到标题分词信息;根据标题分词信息中含有的问题解决意图词的个数确定所述问题解决意图信息;
根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息;
根据视频的画质信息确定资源画质质量信息;
基于所述资源标题质量信息、资源内容质量信息和资源画质质量信息,确定所述视频的第一视频质量信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收视频搜索请求,所述视频搜索请求包括搜索内容信息;
获取多个视频所对应标题信息中的关键词和标签信息;
根据所述搜索内容信息与所述关键词和/或标签信息间的匹配程度分别确定所述多个视频的资源标题匹配信息;
基于所述资源标题匹配信息和所述资源标题质量信息、资源内容质量信息和资源画质质量信息分别确定所述多个视频的第二视频质量信息;
基于所述第二视频质量信息确定所述视频搜索请求的搜索结果。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第二视频质量信息确定所述视频搜索请求的搜索结果包括:
根据所述第二视频质量信息的数值大小由大到小对所述多个视频排序;
从排序后的视频中选取排序靠前的预设数量个视频作为所述视频搜索结果。
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
显示所述搜索结果中的视频和所述视频的第二视频质量信息。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
显示包含有所述第一视频质量信息的视频。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述资源标题质量信息还包括标题精炼度;
所述根据视频的标题信息确定资源标题质量信息还包括:
获取所述视频的标题信息;
对所述标题信息进行分词,得到标题分词信息;
根据视频的标题分词信息中冗余词的个数确定标题精炼度。
7.根据权利要求1-5任一项所述的方法,其特征在于,所述根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息包括:
根据所述内容属性信息中的内容时长和内容标签确定所述视频的内容属性质量;
根据所述内容反馈信息中的用户接受度和用户互动信息确定所述视频的内容反馈质量;
根据所述内容来源信息中资源发布方的权威性确定所述视频的内容来源质量;
根据所述内容属性质量、所述内容反馈质量和所述内容来源质量确定所述视频的资源内容质量信息。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述根据视频的画质信息确定资源画质质量信息包括:
获取所述画质信息中的播放画质信息和/或封面图清晰度信息;
根据所述播放画质信息和/或封面图清晰度信息确定资源画质质量信息。
9.一种确定视频质量的装置,其特征在于,所述装置包括:
资源标题质量信息确定模块,用于根据视频的标题信息确定资源标题质量信息,所述资源标题质量信息包括:问题解决意图信息;所述资源标题质量信息确定模块,包括:第二获取模块,用于获取所述视频的标题信息;分词模块,用于对所述标题信息进行分词,得到标题分词信息;问题解决意图信息确定模块,用于根据标题分词信息中含有的问题解决意图词的个数确定所述问题解决意图信息;
资源内容质量信息确定模块,用于根据视频的内容属性信息、内容反馈信息和内容来源信息确定资源内容质量信息;
资源画质质量信息确定模块,用于根据视频的画质信息确定资源画质质量信息;
第一视频质量信息确定模块,用于基于所述资源标题质量信息、资源内容质量信息和资源画质质量信息,确定所述视频的第一视频质量信息。
10.一种确定视频质量的设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至8中任一权利要求所述的确定视频质量的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910177920.3A CN109729348B (zh) | 2019-03-07 | 2019-03-07 | 一种确定视频质量的方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910177920.3A CN109729348B (zh) | 2019-03-07 | 2019-03-07 | 一种确定视频质量的方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109729348A CN109729348A (zh) | 2019-05-07 |
CN109729348B true CN109729348B (zh) | 2020-06-02 |
Family
ID=66302176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910177920.3A Active CN109729348B (zh) | 2019-03-07 | 2019-03-07 | 一种确定视频质量的方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109729348B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110248249A (zh) * | 2019-06-26 | 2019-09-17 | 深圳市轱辘汽车维修技术有限公司 | 一种视频推荐方法、视频推荐设备及服务器 |
CN110366043B (zh) * | 2019-08-20 | 2022-02-18 | 北京字节跳动网络技术有限公司 | 视频处理方法、装置、电子设备及可读介质 |
CN112584341B (zh) * | 2019-09-30 | 2022-12-27 | 华为云计算技术有限公司 | 一种通信方法及装置 |
CN114219233A (zh) * | 2021-11-27 | 2022-03-22 | 作业帮教育科技(北京)有限公司 | 直播课系统直播质量的评价方法、评价装置及存储介质 |
CN114390344B (zh) * | 2022-01-11 | 2024-07-05 | 北京达佳互联信息技术有限公司 | 视频分发方法、装置、电子设备和计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1540520A (zh) * | 2003-04-24 | 2004-10-27 | 株式会社康耐克 | 问题解决辅助装置和辅助方法、辅助系统以及程序 |
CN107729917A (zh) * | 2017-09-14 | 2018-02-23 | 北京奇艺世纪科技有限公司 | 一种标题的分类方法及装置 |
CN108664470A (zh) * | 2018-05-04 | 2018-10-16 | 武汉斗鱼网络科技有限公司 | 视频标题信息量的度量方法、可读存储介质及电子设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007104312A (ja) * | 2005-10-04 | 2007-04-19 | Toshiba Corp | 電子ガイド情報を用いた情報処理方法およびその装置 |
US7657879B1 (en) * | 2008-06-13 | 2010-02-02 | Sony Computer Entertainment America Inc. | System and method for cross-platform quality control |
CN103383697B (zh) * | 2013-06-26 | 2017-02-15 | 百度在线网络技术(北京)有限公司 | 确定对象标题的对象表征信息的方法与设备 |
CN108009293B (zh) * | 2017-12-26 | 2022-08-23 | 北京百度网讯科技有限公司 | 视频标签生成方法、装置、计算机设备和存储介质 |
CN108280155B (zh) * | 2018-01-11 | 2022-04-08 | 百度在线网络技术(北京)有限公司 | 基于短视频的问题检索反馈方法、装置及其设备 |
-
2019
- 2019-03-07 CN CN201910177920.3A patent/CN109729348B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1540520A (zh) * | 2003-04-24 | 2004-10-27 | 株式会社康耐克 | 问题解决辅助装置和辅助方法、辅助系统以及程序 |
CN107729917A (zh) * | 2017-09-14 | 2018-02-23 | 北京奇艺世纪科技有限公司 | 一种标题的分类方法及装置 |
CN108664470A (zh) * | 2018-05-04 | 2018-10-16 | 武汉斗鱼网络科技有限公司 | 视频标题信息量的度量方法、可读存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109729348A (zh) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109729348B (zh) | 一种确定视频质量的方法、装置及设备 | |
US10296640B1 (en) | Video segments for a video related to a task | |
Shmueli et al. | Care to comment? Recommendations for commenting on news stories | |
US9646079B2 (en) | Method and apparatus for identifiying similar questions in a consultation system | |
JP5358442B2 (ja) | 共同タギング環境内での用語の収束化 | |
US9336496B2 (en) | Computer-implemented system and method for generating a reference set via clustering | |
US9116985B2 (en) | Computer-implemented systems and methods for taxonomy development | |
AU2014318392B2 (en) | Systems, methods, and software for manuscript recommendations and submissions | |
US8463648B1 (en) | Method and apparatus for automated topic extraction used for the creation and promotion of new categories in a consultation system | |
John et al. | What makes a high-quality user-generated answer? | |
EP2192500A2 (en) | System and method for providing robust topic identification in social indexes | |
CN108829652B (zh) | 一种基于众包的图片标注系统 | |
CN109582875A (zh) | 一种在线医疗教育资源的个性化推荐方法及系统 | |
CN110990695A (zh) | 推荐系统内容召回方法及装置 | |
CN110347701B (zh) | 一种面向实体检索查询的目标类型标识方法 | |
CN105989056A (zh) | 一种汉语新闻推荐系统 | |
CN116257694B (zh) | 一种基于在线学习课程的智能化搜索推荐方法和系统 | |
JP2009157899A (ja) | 情報処理装置および方法、プログラム、並びに記録媒体 | |
CN108009194A (zh) | 一种图书推送方法、电子设备、存储介质及装置 | |
Li et al. | A personalized requirement identifying model for design improvement based on user profiling | |
Imhof et al. | Multimodal social book search | |
Perea-Ortega et al. | Semantic tagging of video ASR transcripts using the web as a source of knowledge | |
KR102211075B1 (ko) | 교육 자료를 수집하는 방법 및 장치 | |
Wang et al. | Design of front-end for recommendation systems: Towards a hybrid architecture | |
Ko et al. | Moviecommenter: Aspect-based collaborative filtering by utilizing user comments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20221116 Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518100 Patentee after: Shenzhen Yayue Technology Co.,Ltd. Address before: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |
|
TR01 | Transfer of patent right |