CN111767796B - 一种视频关联方法、装置、服务器和可读存储介质 - Google Patents

一种视频关联方法、装置、服务器和可读存储介质 Download PDF

Info

Publication number
CN111767796B
CN111767796B CN202010474072.5A CN202010474072A CN111767796B CN 111767796 B CN111767796 B CN 111767796B CN 202010474072 A CN202010474072 A CN 202010474072A CN 111767796 B CN111767796 B CN 111767796B
Authority
CN
China
Prior art keywords
video
long
text information
target short
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010474072.5A
Other languages
English (en)
Other versions
CN111767796A (zh
Inventor
陈博
韩立伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010474072.5A priority Critical patent/CN111767796B/zh
Publication of CN111767796A publication Critical patent/CN111767796A/zh
Application granted granted Critical
Publication of CN111767796B publication Critical patent/CN111767796B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请提供了一种视频关联方法、装置、服务器和可读存储介质,属于计算机技术领域。本申请通过获取目标短视频对应的第一描述文本信息;获取预设长视频库中与目标短视频相匹配的多个长视频;其中,预设长视频库中的长视频有对应的第二描述文本信息,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频;基于目标短视频与多个长视频之间的视频相似度,从多个长视频中获得与目标短视频相关联的目标长视频。通过本方案,可以先通过描述文本信息匹配出与目标短视频相关联的多个长视频,再通过AI关联分析算法在这些长视频中匹配出与目标短视频关联度高的目标长视频,可以有效的减少AI处理量,从而节约AI资源。

Description

一种视频关联方法、装置、服务器和可读存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种视频关联方法、装置、服务器和可读存储介质。
背景技术
随着网络视频的快速发展,不论是长视频还是短视频,其生产量都是与日俱增,为了打通长短视频关系,实现“长找短”、“短带长”的视频互通生态,充分发挥长视频和短视频两个领域的优势,急需找到一种快速高效的将短视频和长视频建立关系的方法。
相关技术中,长短视频关联的方法通常为:基于视频相似检索和视频特征的AI(Artificial Intelligence,人工智能)关联分析,AI关联分析过程为抽取短视频的视频关键帧,生成短视频向量,抽取所有长视频的视频关键帧,提取关键帧特征向量,生成长视频向量,使用短视频向量匹配所有长视频向量,获得目标长视频。
然而,巨大的处理量造成了AI积压和负担,大量与短视频无关联关系的长视频占用了AI的处理时间,导致AI资源的浪费。
发明内容
为了解决上述技术问题,本申请提供了一种视频关联方法、装置、服务器和可读存储介质。
第一方面,提供了一种视频关联方法,所述方法包括:
获取目标短视频对应的第一描述文本信息;
获取预设长视频库中与所述目标短视频相匹配的多个长视频;其中,所述预设长视频库中的长视频有对应的第二描述文本信息,基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频;
基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频。
可选的,所述基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频,包括:
基于所述第一描述文本信息生成所述目标短视频的视频标签;
获取包含所述视频标签的第二描述文本信息对应的长视频。
可选的,所述基于所述第一描述文本信息生成所述目标短视频的视频标签,包括:
基于所述目标短视频的标题文本生成第一特征向量;
基于所述目标短视频的第一描述文本信息提取多个候选标签,并生成每个所述候选标签的第二特征向量;
基于预设的语义相似度算法,分别计算各所述第二特征向量和所述第一特征向量的语义相似度;
将语义相似度大于预设第一阈值的候选标签确定为所述目标短视频的视频标签。
可选的,所述基于所述目标短视频的第一描述文本信息提取多个候选标签,包括:
将所述目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出所述目标短视频对应的多个候选标签。
可选的,所述基于所述目标短视频的第一描述文本信息提取多个候选标签,包括:
对所述目标短视频的第一描述文本信息进行分词处理,得到所述第一描述文本信息包含的分词;
基于预设的词语联想规则,在预设的词语库中确定与所述第一描述文本信息包含的分词相关联的目标分词,作为所述目标短视频的候选标签。
可选的,所述基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频,包括:
基于所述目标短视频包含的视频关键帧,生成短视频向量;
基于所述多个长视频包含的视频关键帧,分别生成各自的长视频向量;
使用所述短视频向量与多个所述长视频向量进行向量相似度分析,得到所述目标短视频与各长视频的相似分数;
获取相似分数大于预设相似度阈值的长视频,作为目标长视频。
第二方面,提供了一种视频关联装置,所述装置包括:
第一获取模块,用于获取目标短视频对应的第一描述文本信息;
第二获取模块,用于获取预设长视频库中与所述目标短视频相匹配的多个长视频;其中,所述预设长视频库中的长视频有对应的第二描述文本信息,基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频;
获得模块,用于基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频。
可选的,所述第二获取模块,具体用于:
基于所述第一描述文本信息生成所述目标短视频的视频标签;
获取包含所述视频标签的第二描述文本信息对应的长视频。
可选的,所述第二获取模块,具体用于:
基于所述目标短视频的标题文本生成第一特征向量;
基于所述目标短视频的第一描述文本信息提取多个候选标签,并生成每个所述候选标签的第二特征向量;
基于预设的语义相似度算法,分别计算各所述第二特征向量和所述第一特征向量的语义相似度;
将语义相似度大于预设第一阈值的候选标签确定为所述目标短视频的视频标签。
可选的,所述第二获取模块,具体用于:
将所述目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出所述目标短视频对应的多个候选标签。
可选的,所述第二获取模块,具体用于:
对所述目标短视频的第一描述文本信息进行分词处理,得到所述第一描述文本信息包含的分词;
基于预设的词语联想规则,在预设的词语库中确定与所述第一描述文本信息包含的分词相关联的目标分词,作为所述目标短视频的候选标签。
可选的,所述获得模块,具体用于:
基于所述目标短视频包含的视频关键帧,生成短视频向量;
基于所述多个长视频包含的视频关键帧,分别生成各自的长视频向量;
使用所述短视频向量与多个所述长视频向量进行向量相似度分析,得到所述目标短视频与各长视频的相似分数;
获取相似分数大于预设相似度阈值的长视频,作为目标长视频。
第三方面,提供了一种服务器,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的方法步骤。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的视频关联方法。
本申请实施例有益效果:
本申请实施例提供了一种视频关联方法,获取目标短视频对应的第一描述文本信息;获取预设长视频库中与目标短视频相匹配的多个长视频;其中,预设长视频库中的长视频有对应的第二描述文本信息,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频;基于目标短视频与多个长视频之间的视频相似度,从多个长视频中获得与目标短视频相关联的目标长视频。通过本方案,可以先通过描述文本信息匹配出与目标短视频相关联的多个长视频,再通过AI关联分析算法在这些长视频中匹配出与目标短视频关联度高的目标长视频,可以有效的减少AI处理量,从而节约AI资源。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种视频关联方法的流程图;
图2为本申请实施例提供的一种视频标签生成方法的流程图;
图3为本申请实施例提供的一种AI关联分析方法的流程图;
图4为本申请实施例提供的一种视频关联方法示例的流程图;
图5为本申请实施例提供的一种视频关联装置的结构示意图;
图6为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种视频关联方法,可以应用于服务器。其中,该服务器可以是用于提供视频关联分析的后台服务器。
下面将结合具体实施方式,对本申请实施例提供的一种视频关联方法进行详细的说明,如图1所示,具体步骤如下:
步骤101,获取目标短视频对应的第一描述文本信息。
本申请实施例中,服务器可以获取目标短视频对应的第一描述文本信息。目标短视频即短片视频,是一种互联网内容传播方式,一般是在互联网新媒体上传播的时长在5分钟以内的视频,主要包括原创短片视频和通过长视频剪辑得到的短片视频。第一描述文本信息可以是用于描述短视频的内容信息的文本信息,至少包括短视频的标题文本信息、简介文本信息、推荐文本信息等文本信息中一种或多种。
步骤102,获取预设长视频库中与目标短视频相匹配的多个长视频;其中,预设长视频库中的长视频有对应的第二描述文本信息,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频。
本申请实施例中,服务器可以获取预设长视频库中与目标短视频相匹配的多个长视频;其中,预设长视频库中的长视频有对应的第二描述文本信息,第二描述文本信息可以是用于描述长视频的内容信息的文本信息,例如:长视频标题文本信息,长视频简介文本信息等,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频。
可选的,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频,具体过程为:基于第一描述文本信息生成目标短视频的视频标签;获取包含视频标签的第二描述文本信息对应的长视频。
本申请实施例中,服务器中可以存储有标签提取算法,基于目标短视频的第一描述文本信息,通过标签提取算法生成目标短视频对应的视频标签。其中,标签提取算法可以采用基于NLP(Natural Language Processing,自然语言处理)技术的标签提取算法。视频标签的具体生成过程后续会进行详细说明。服务器可以使用目标短视频的视频标签在长视频对应的第二描述文本信息中进行检索,获取包含该视频标签的第二描述文本信息对应的长视频。
步骤103,基于目标短视频与多个长视频之间的视频相似度,从多个长视频中获得与目标短视频相关联的目标长视频。
本申请实施例中,服务器中可以存储有AI关联分析算法,通过AI关联分析算法,将目标短视频与经过描述文本信息匹配到的多个长视频进行关联分析,获得与目标短视频相关联的目标长视频,具体关联分析过程后续会进行详细说明。
本申请实施例中,获取目标短视频对应的第一描述文本信息;获取预设长视频库中与目标短视频相匹配的多个长视频;其中,预设长视频库中的长视频有对应的第二描述文本信息,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频;基于目标短视频与多个长视频之间的视频相似度,从多个长视频中获得与目标短视频相关联的目标长视频。通过本方案,可以先通过描述文本信息匹配出与目标短视频相关联的多个长视频,再通过AI关联分析算法在这些长视频中匹配出与目标短视频关联度高的目标长视频,可以有效减少AI处理量,从而节约AI资源。
可选的,本申请实施例还提供了视频标签的生成过程,如图2所示,具体步骤如下。
步骤201,基于目标短视频的标题文本生成第一特征向量。
本申请实施例中,服务器中可以存储有注意力模型,比如通道注意力机制、残差注意力机制、递归注意力机制等模型。服务器可以将目标短视频的标题文本输入到预设的注意力模型中,生成第一特征向量。
步骤202,基于目标短视频的第一描述文本信息提取多个候选标签,并生成每个候选标签的第二特征向量。
本申请实施例中,服务器中可以存储有候选标签提取算法,通过候选标签提取算法可以在目标短视频的第一描述文本信息中提取多个候选标签,再将候选标签向量化,得到第二特征向量。
可选的,提取候选标签的方式可以是多种多样的,本申请实施例提供了几种可行的实现方式,具体如下:
方式一,将目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出目标短视频对应的多个候选标签。
本申请实施例中,服务器中可以存储有标签提取模型,比如CRF(ConditionalRandom Field,条件随机场)模型,MEMM(Maximum Entropy Markov Model,最大熵马尔可夫模型),服务器可以将目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出目标短视频对应的多个候选标签。
本申请实施例中,通过将目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出目标短视频对应的多个候选标签。通过标签提取模型提取候选标签,准确度较高。
方式二,对目标短视频的第一描述文本信息进行分词处理,得到第一描述文本信息包含的分词;基于预设的词语联想规则,在预设的词语库中确定与第一描述文本信息包含的分词相关联的目标分词,作为目标短视频的候选标签。
本申请实施例中,服务器可以将目标短视频的第一描述文本信息进行分词处理,得到第一描述文本信息包含的分词;通过预设的词语联想规则,在预设的词语库中确定与第一描述文本信息包含的分词相关联的目标分词,作为目标短视频的候选标签。词语联想规则主要包括同义词联想、别名联想、实体联想及上位概念联想等。具体的,服务器可以将分词输入到包含预设的词语库的同义词联想模型中,从而查找到词语库中与该分词对应的同义词,例如:将分词“成长”输入到同义词联想模型中可以查找到“生长”;服务器可以将分词输入到包含预设的词语库的别名联想模型中,从而查找到词语库中与该分词对应的别名联想词,,例如:将分词“魔都”输入到别名联想模型中可以查找到“上海”;服务器可以将分词输入到包含预设的词语库的实体联想模型中,从而查找到词语库中与该分词对应的实体联想词,例如:将分词“露娜”输入到实体联想模型中可以查找到“王者荣耀”;服务器可以将分词输入到包含预设的词语库的上位概念联想模型中,包含预设的词语库的上位概念联想词,例如:将分词“戚风”输入到上位概念联想模型中可以查找到“甜品”。
本申请实施例中,通过对目标短视频的第一描述文本信息进行分词处理,得到第一描述文本信息包含的分词;基于预设的词语联想规则,在预设的词语库中确定与第一描述文本信息包含的分词相关联的目标分词,作为目标短视频的候选标签。通过同义词联想、别名联想、实体联想及上位概念联想等联想规则,可以查找到没有直接出现在第一描述文本信息中的候选标签,并且查找出的候选标签准确度较高。
步骤203,基于预设的语义相似度算法,分别计算各第二特征向量和第一特征向量的语义相似度。
本申请实施例中,服务器中可以存储有语义相似度算法,比如DSSM(DeepStructured Semantic Models,深度结构化语义模型),CLSM(convolutional latentsemantic model,卷积潜在语义模型)。语义相似度是通过计算词语之间的距离,再转换为相似度。基于语义相似度算法,分别计算每个候选标签对应的第二特征向量和第一特征向量之间的距离,将距离转换为相似度,得到每个候选标签对应的语义相似度。
步骤204,将语义相似度大于预设第一阈值的候选标签确定为目标短视频的视频标签。
本申请实施例中,服务器可以将计算出的语义相似度与预设的第一阈值进行比较,若语义相似度大于第一阈值,则将与该语义相似度对应的候选标签确定为目标短视频的视频标签,若语义相似度不大于第一阈值,则将与该语义相似度对应的候选标签确定为无效标签。在一个示例中,第一阈值设为0.6,候选标签一对应的第二特征向量和第一特征向量的语义相似度为0.7,候选标签二对应的第二特征向量和第一特征向量的语义相似度为0.5,则候选标签一确定为目标短视频的视频标签。
本申请实施例中,基于目标短视频的标题文本生成第一特征向量;基于目标短视频的第一描述文本信息提取多个候选标签,并生成每个候选标签的第二特征向量;基于预设的语义相似度算法,分别计算各第二特征向量和第一特征向量的语义相似度;将语义相似度大于预设第一阈值的候选标签确定为候选短视频的视频标签。这样可以将不准确甚至错误的无效候选标签过滤掉,筛选出准确度较高的候选标签作为目标短视频的视频标签,根据准确度较高的视频标签,进行后续关联分析时确定出的目标短视频的准确度也会比较高。
可选的,本申请实施例还提供了AI关联分析的过程,如图3所示,具体步骤如下:
步骤301,基于目标短视频包含的视频关键帧,生成短视频向量。
本申请实施例中,服务器可以存储有视频向量生成模型,比如xception(一种深度可分离卷积)模型、ResNet(残差神经网络)模型、Inception(卷积神经网络)模型。通过服务器抽取目标短视频包含的视频关键帧,将视频关键帧输入到视频向量生成模型中,以得到目标短视频的短视频向量。
步骤302,基于多个长视频包含的视频关键帧,分别生成各自的长视频向量。
本申请实施例中,针对经过文本信息匹配到的多个长视频,通过服务器抽取每个长视频包含的视频关键帧,将视频关键帧输入到视频向量生成模型中,得到每个长视频的长视频向量。
步骤303,使用短视频向量与多个长视频向量进行向量相似度分析,得到目标短视频与各长视频的相似分数。
本申请实施例中,服务器可以将短视频向量与多个长视频向量进行向量相似度分析,得到目标短视频与各长视频的相似分数。
步骤304,获取相似分数大于预设相似度阈值的长视频,作为目标长视频。
本申请实施例中,服务器可以将计算出的相似分数与预设的相似度阈值进行比较,若目标短视频与长视频的相似分数大于相似度阈值,则确定该长视频为目标长视频,若目标短视频与长视频的相似分数不大于相似度阈值,则确定该长视频为无效长视频。在一个示例中,相似度阈值设为0.3,长视频一与目标短视频的相似分数为0.2,长视频二与目标短视频的相似分数为0.6,则确定长视频二为目标长视频。
本申请实施例中,基于目标短视频包含的视频关键帧,生成短视频向量;基于多个长视频包含的视频关键帧,分别生成各自的长视频向量;使用短视频向量与多个长视频向量进行向量相似度分析,得到目标短视频与各长视频的相似分数;获取相似分数大于预设相似度阈值的长视频,作为目标长视频。通过本方案,经过AI关联分析,可以获取与目标短视频相似分数较高的长视频,当用户观看一个短视频时,为用户推送相似度较高的相关长视频,可以提高用户体验。
本申请实施例还提供了一种视频关联方法的处理流程,如图4所示,具体步骤如下。
步骤401,获取目标短视频对应的第一描述文本信息。
步骤402,基于目标短视频的标题文本生成第一特征向量。
步骤403,基于目标短视频的第一描述文本信息提取多个候选标签,并生成每个候选标签的第二特征向量。
步骤404,基于预设的语义相似度算法,分别计算各第二特征向量和第一特征向量的语义相似度。
步骤405,将语义相似度大于预设第一阈值的候选标签确定为目标短视频的视频标签。
步骤406,获取包含该视频标签的第二描述文本信息对应的长视频。
步骤407,基于目标短视频包含的视频关键帧,生成短视频向量。
步骤408,基于多个长视频包含的视频关键帧,分别生成各自的长视频向量。
步骤409,使用短视频向量与多个长视频向量进行向量相似度分析,得到目标短视频与各长视频的相似分数。
步骤410,获取相似分数大于预设相似度阈值的长视频,作为目标长视频。
本申请实施例中,获取目标短视频对应的第一描述文本信息;获取预设长视频库中与目标短视频相匹配的多个长视频;其中,预设长视频库中的长视频有对应的第二描述文本信息,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频;基于目标短视频与多个长视频之间的视频相似度,从多个长视频中获得与目标短视频相关联的目标长视频。通过本方案,可以先通过描述文本信息匹配出与目标短视频相关联的多个长视频,再通过AI关联分析算法在这些长视频中匹配出与目标短视频关联度高的目标长视频,可以有效减少AI处理量,从而节约AI资源。
基于相同的技术构思,本申请实施例还提供了一种视频关联装置,如图5所示,该装置包括:
第一获取模块501,用于获取目标短视频对应的第一描述文本信息;
第二获取模块502,用于获取预设长视频库中与所述目标短视频相匹配的多个长视频;其中,所述预设长视频库中的长视频有对应的第二描述文本信息,基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频;
获得模块503,用于基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频。
可选的,所述第二获取模块502,具体用于:
基于所述第一描述文本信息生成所述目标短视频的视频标签;
获取包含所述视频标签的第二描述文本信息对应的长视频。
可选的,所述第二获取模块502,具体用于:
基于所述目标短视频的标题文本生成第一特征向量;
基于所述目标短视频的第一描述文本信息提取多个候选标签,并生成每个所述候选标签的第二特征向量;
基于预设的语义相似度算法,分别计算各所述第二特征向量和所述第一特征向量的语义相似度;
将语义相似度大于预设第一阈值的候选标签确定为所述目标短视频的视频标签。
可选的,所述第二获取模块502,具体用于:
将所述目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出所述目标短视频对应的多个候选标签。
可选的,所述第二获取模块502,具体用于:
对所述目标短视频的第一描述文本信息进行分词处理,得到所述第一描述文本信息包含的分词;
基于预设的词语联想规则,在预设的词语库中确定与所述第一描述文本信息包含的分词相关联的目标分词,作为所述目标短视频的候选标签。
可选的,所述获得模块503,具体用于:
基于所述目标短视频包含的视频关键帧,生成短视频向量;
基于所述多个长视频包含的视频关键帧,分别生成各自的长视频向量;
使用所述短视频向量与多个所述长视频向量进行向量相似度分析,得到所述目标短视频与各长视频的相似分数;
获取相似分数大于预设相似度阈值的长视频,作为目标长视频。
本申请实施例中,获取目标短视频对应的第一描述文本信息;获取预设长视频库中与目标短视频相匹配的多个长视频;其中,预设长视频库中的长视频有对应的第二描述文本信息,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频;基于目标短视频与多个长视频之间的视频相似度,从多个长视频中获得与目标短视频相关联的目标长视频。通过本方案,可以先通过描述文本信息匹配出与目标短视频相关联的多个长视频,再通过AI关联分析算法在这些长视频中匹配出与目标短视频关联度高的目标长视频,可以有效减少AI处理量,从而节约AI资源。
基于相同的技术构思,本发明实施例还提供了一种服务器,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:
获取目标短视频对应的第一描述文本信息;
获取预设长视频库中与所述目标短视频相匹配的多个长视频;其中,所述预设长视频库中的长视频有对应的第二描述文本信息,基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频;
基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频。
可选的,所述基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频,包括:
基于所述第一描述文本信息生成所述目标短视频的视频标签;
获取包含所述视频标签的第二描述文本信息对应的长视频。
可选的,所述基于所述第一描述文本信息生成所述目标短视频的视频标签,包括:
基于所述目标短视频的标题文本生成第一特征向量;
基于所述目标短视频的第一描述文本信息提取多个候选标签,并生成每个所述候选标签的第二特征向量;
基于预设的语义相似度算法,分别计算各所述第二特征向量和所述第一特征向量的语义相似度;
将语义相似度大于预设第一阈值的候选标签确定为所述目标短视频的视频标签。
可选的,所述基于所述目标短视频的第一描述文本信息提取多个候选标签,包括:
将所述目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出所述目标短视频对应的多个候选标签。
可选的,所述基于所述目标短视频的第一描述文本信息提取多个候选标签,包括:
对所述目标短视频的第一描述文本信息进行分词处理,得到所述第一描述文本信息包含的分词;
基于预设的词语联想规则,在预设的词语库中确定与所述第一描述文本信息包含的分词相关联的目标分词,作为所述目标短视频的候选标签。
可选的,所述基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频,包括:
基于所述目标短视频包含的视频关键帧,生成短视频向量;
基于所述多个长视频包含的视频关键帧,分别生成各自的长视频向量;
使用所述短视频向量与多个所述长视频向量进行向量相似度分析,得到所述目标短视频与各长视频的相似分数;
获取相似分数大于预设相似度阈值的长视频,作为目标长视频。
本申请实施例中,获取目标短视频对应的第一描述文本信息;获取预设长视频库中与目标短视频相匹配的多个长视频;其中,预设长视频库中的长视频有对应的第二描述文本信息,基于第一描述文本信息和第二描述文本信息得到目标短视频相匹配的多个长视频;基于目标短视频与多个长视频之间的视频相似度,从多个长视频中获得与目标短视频相关联的目标长视频。通过本方案,可以先通过描述文本信息匹配出与目标短视频相关联的多个长视频,再通过AI关联分析算法在这些长视频中匹配出与目标短视频关联度高的目标长视频,可以有效减少AI处理量,从而节约AI资源。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的视频关联方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的视频关联方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种视频关联方法,其特征在于,所述方法包括:
获取目标短视频对应的第一描述文本信息;
获取预设长视频库中与所述目标短视频相匹配的多个长视频;其中,所述预设长视频库中的长视频有对应的第二描述文本信息,基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频;
基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频;
其中,所述基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频,包括:
基于所述第一描述文本信息生成所述目标短视频的视频标签;
获取包含所述视频标签的第二描述文本信息对应的长视频;
其中,所述基于所述第一描述文本信息生成所述目标短视频的视频标签,包括:
基于所述目标短视频的标题文本生成第一特征向量;
基于所述目标短视频的第一描述文本信息提取多个候选标签,并生成每个所述候选标签的第二特征向量;
基于预设的语义相似度算法,分别计算各所述第二特征向量和所述第一特征向量的语义相似度;
将语义相似度大于预设第一阈值的候选标签确定为所述目标短视频的视频标签。
2.根据权利要求1所述的方法,其特征在于,所述基于所述目标短视频的第一描述文本信息提取多个候选标签,包括:
将所述目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出所述目标短视频对应的多个候选标签。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标短视频的第一描述文本信息提取多个候选标签,包括:
对所述目标短视频的第一描述文本信息进行分词处理,得到所述第一描述文本信息包含的分词;
基于预设的词语联想规则,在预设的词语库中确定与所述第一描述文本信息包含的分词相关联的目标分词,作为所述目标短视频的候选标签。
4.根据权利要求1所述的方法,其特征在于,所述基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频,包括:
基于所述目标短视频包含的视频关键帧,生成短视频向量;
基于所述多个长视频包含的视频关键帧,分别生成各自的长视频向量;
使用所述短视频向量与多个所述长视频向量进行向量相似度分析,得到所述目标短视频与各长视频的相似分数;
获取相似分数大于预设相似度阈值的长视频,作为目标长视频。
5.一种视频关联装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标短视频对应的第一描述文本信息;
第二获取模块,用于获取预设长视频库中与所述目标短视频相匹配的多个长视频;其中,所述预设长视频库中的长视频有对应的第二描述文本信息,基于所述第一描述文本信息和所述第二描述文本信息得到所述目标短视频相匹配的多个长视频;
获得模块,用于基于所述目标短视频与所述多个长视频之间的视频相似度,从所述多个长视频中获得与所述目标短视频相关联的目标长视频;
其中,所述第二获取模块,具体用于:
基于所述第一描述文本信息生成所述目标短视频的视频标签;
获取包含所述视频标签的第二描述文本信息对应的长视频;
其中,所述第二获取模块,具体用于:
基于所述目标短视频的标题文本生成第一特征向量;
基于所述目标短视频的第一描述文本信息提取多个候选标签,并生成每个所述候选标签的第二特征向量;
基于预设的语义相似度算法,分别计算各所述第二特征向量和所述第一特征向量的语义相似度;
将语义相似度大于预设第一阈值的候选标签确定为所述目标短视频的视频标签。
6.根据权利要求5所述的装置,其特征在于,所述第二获取模块,具体用于:
将所述目标短视频的第一描述文本信息输入到预设的标签提取模型中,输出所述目标短视频对应的多个候选标签。
7.根据权利要求5所述的装置,其特征在于,所述第二获取模块,具体用于:
对所述目标短视频的第一描述文本信息进行分词处理,得到所述第一描述文本信息包含的分词;
基于预设的词语联想规则,在预设的词语库中确定与所述第一描述文本信息包含的分词相关联的目标分词,作为所述目标短视频的候选标签。
8.根据权利要求5所述的装置,其特征在于,所述获得模块,具体用于:
基于所述目标短视频包含的视频关键帧,生成短视频向量;
基于所述多个长视频包含的视频关键帧,分别生成各自的长视频向量;
使用所述短视频向量与多个所述长视频向量进行向量相似度分析,得到所述目标短视频与各长视频的相似分数;
获取相似分数大于预设相似度阈值的长视频,作为目标长视频。
9.一种服务器,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
CN202010474072.5A 2020-05-29 2020-05-29 一种视频关联方法、装置、服务器和可读存储介质 Active CN111767796B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010474072.5A CN111767796B (zh) 2020-05-29 2020-05-29 一种视频关联方法、装置、服务器和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010474072.5A CN111767796B (zh) 2020-05-29 2020-05-29 一种视频关联方法、装置、服务器和可读存储介质

Publications (2)

Publication Number Publication Date
CN111767796A CN111767796A (zh) 2020-10-13
CN111767796B true CN111767796B (zh) 2023-12-15

Family

ID=72719791

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010474072.5A Active CN111767796B (zh) 2020-05-29 2020-05-29 一种视频关联方法、装置、服务器和可读存储介质

Country Status (1)

Country Link
CN (1) CN111767796B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112235625A (zh) * 2020-10-14 2021-01-15 广州欢网科技有限责任公司 电视端的短视频正片溯源方法、系统及电视终端
CN112487239B (zh) * 2020-11-27 2024-04-05 北京百度网讯科技有限公司 视频检索方法、模型训练方法、装置、设备及存储介质
CN112565875B (zh) * 2020-11-30 2023-03-03 北京百度网讯科技有限公司 自动生成视频的方法、装置、设备和计算机可读存储介质
CN112507167A (zh) * 2020-12-10 2021-03-16 北京达佳互联信息技术有限公司 一种识别视频合集的方法、装置、电子设备及存储介质
CN112612918A (zh) * 2020-12-16 2021-04-06 北京字节跳动网络技术有限公司 一种视频资源的映射方法、装置、设备及介质
CN114286198B (zh) * 2021-12-30 2023-11-10 北京爱奇艺科技有限公司 一种视频关联方法、装置、电子设备和存储介质
CN117082309B (zh) * 2023-07-24 2024-05-03 北京天译科技有限公司 基于人工智能的气象服务短视频加工方法及平台系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8842965B1 (en) * 2011-11-02 2014-09-23 Google Inc. Large scale video event classification
CN107066621A (zh) * 2017-05-11 2017-08-18 腾讯科技(深圳)有限公司 一种相似视频的检索方法、装置和存储介质
CN108989875A (zh) * 2018-07-04 2018-12-11 北京奇艺世纪科技有限公司 一种生成弹幕文件的方法及装置
CN109040775A (zh) * 2018-08-24 2018-12-18 深圳创维-Rgb电子有限公司 视频关联方法、装置及计算机可读存储介质
CN109325148A (zh) * 2018-08-03 2019-02-12 百度在线网络技术(北京)有限公司 生成信息的方法和装置
CN109508406A (zh) * 2018-12-12 2019-03-22 北京奇艺世纪科技有限公司 一种信息处理方法、装置及计算机可读存储介质
CN109840292A (zh) * 2018-12-17 2019-06-04 北京百度网讯科技有限公司 视频标签的生成方法及其装置
CN109885726A (zh) * 2019-02-28 2019-06-14 北京奇艺世纪科技有限公司 一种生成视频元信息的方法和装置
CN110278449A (zh) * 2019-06-26 2019-09-24 腾讯科技(深圳)有限公司 一种视频检测方法、装置、设备及介质
CN110290419A (zh) * 2019-06-25 2019-09-27 北京奇艺世纪科技有限公司 视频播放方法、装置及电子设备
CN110582025A (zh) * 2018-06-08 2019-12-17 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN110781347A (zh) * 2019-10-23 2020-02-11 腾讯科技(深圳)有限公司 一种视频处理方法、装置、设备以及可读存储介质
CN110929098A (zh) * 2019-11-14 2020-03-27 腾讯科技(深圳)有限公司 视频数据的处理方法、装置、电子设备及存储介质
CN111125435A (zh) * 2019-12-17 2020-05-08 北京百度网讯科技有限公司 视频标签的确定方法、装置和计算机设备

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8842965B1 (en) * 2011-11-02 2014-09-23 Google Inc. Large scale video event classification
CN107066621A (zh) * 2017-05-11 2017-08-18 腾讯科技(深圳)有限公司 一种相似视频的检索方法、装置和存储介质
WO2018205838A1 (zh) * 2017-05-11 2018-11-15 腾讯科技(深圳)有限公司 一种相似视频的检索方法、装置和存储介质
CN110582025A (zh) * 2018-06-08 2019-12-17 北京百度网讯科技有限公司 用于处理视频的方法和装置
CN108989875A (zh) * 2018-07-04 2018-12-11 北京奇艺世纪科技有限公司 一种生成弹幕文件的方法及装置
CN109325148A (zh) * 2018-08-03 2019-02-12 百度在线网络技术(北京)有限公司 生成信息的方法和装置
CN109040775A (zh) * 2018-08-24 2018-12-18 深圳创维-Rgb电子有限公司 视频关联方法、装置及计算机可读存储介质
CN109508406A (zh) * 2018-12-12 2019-03-22 北京奇艺世纪科技有限公司 一种信息处理方法、装置及计算机可读存储介质
CN109840292A (zh) * 2018-12-17 2019-06-04 北京百度网讯科技有限公司 视频标签的生成方法及其装置
CN109885726A (zh) * 2019-02-28 2019-06-14 北京奇艺世纪科技有限公司 一种生成视频元信息的方法和装置
CN110290419A (zh) * 2019-06-25 2019-09-27 北京奇艺世纪科技有限公司 视频播放方法、装置及电子设备
CN110278449A (zh) * 2019-06-26 2019-09-24 腾讯科技(深圳)有限公司 一种视频检测方法、装置、设备及介质
CN110781347A (zh) * 2019-10-23 2020-02-11 腾讯科技(深圳)有限公司 一种视频处理方法、装置、设备以及可读存储介质
CN110929098A (zh) * 2019-11-14 2020-03-27 腾讯科技(深圳)有限公司 视频数据的处理方法、装置、电子设备及存储介质
CN111125435A (zh) * 2019-12-17 2020-05-08 北京百度网讯科技有限公司 视频标签的确定方法、装置和计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于标签分布学习的视频摘要算法;刘玉杰等;《计算机辅助设计与图形学学报》;第31卷(第1期);第104-110页 *

Also Published As

Publication number Publication date
CN111767796A (zh) 2020-10-13

Similar Documents

Publication Publication Date Title
CN111767796B (zh) 一种视频关联方法、装置、服务器和可读存储介质
US11544474B2 (en) Generation of text from structured data
CN110069709B (zh) 意图识别方法、装置、计算机可读介质及电子设备
CN108121700B (zh) 一种关键词提取方法、装置及电子设备
WO2022095374A1 (zh) 关键词抽取方法、装置、终端设备及存储介质
CN110019732B (zh) 一种智能问答方法以及相关装置
CN111539197B (zh) 文本匹配方法和装置以及计算机系统和可读存储介质
US20190188277A1 (en) Method and device for processing an electronic document
CN110968725B (zh) 图像内容描述信息生成方法、电子设备及存储介质
CN112101031B (zh) 一种实体识别方法、终端设备及存储介质
CN115495555A (zh) 一种基于深度学习的文献检索方法和系统
CN116450867B (zh) 一种基于对比学习和大语言模型的图数据语义搜索方法
CN112667780A (zh) 一种评论信息的生成方法、装置、电子设备及存储介质
CN110717038B (zh) 对象分类方法及装置
CN116542297A (zh) 基于文本数据训练生成对抗网络的方法及装置
CN116150306A (zh) 问答机器人的训练方法、问答方法及装置
CN113590811A (zh) 文本摘要生成方法、装置、电子设备及存储介质
CN116383412B (zh) 基于知识图谱的功能点扩增方法和系统
CN115357720B (zh) 基于bert的多任务新闻分类方法及装置
CN113254586B (zh) 一种基于深度学习的无监督文本检索方法
JP7121819B2 (ja) 画像処理方法及び装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
CN113255319B (zh) 模型训练方法、文本分段方法、摘要抽取方法及装置
CN114492390A (zh) 基于关键词识别的数据扩充方法、装置、设备及介质
CN112528653B (zh) 短文本实体识别方法和系统
CN114266247A (zh) 一种敏感词过滤方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant