CN114302227A

CN114302227A - 基于容器采集的网络视频采集与解析的方法和系统

Info

Publication number: CN114302227A
Application number: CN202111623339.3A
Authority: CN
Inventors: 苏长君; 曾祥禄
Original assignee: Beijing Zhimei Internet Technology Co ltd
Current assignee: Beijing Zhimei Internet Technology Co ltd
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2022-04-08
Anticipated expiration: 2041-12-28
Also published as: CN114302227B

Abstract

本发明提供一种基于容器采集的网络视频采集与解析的方法和系统，通过获取多个不同平台的视频数据流，提取其中的特征向量和热度信息，确定特征向量中感兴趣的语义项，使用语义项的上下文来断句，没有使用语法断句，在断句处采集视频数据流，进而语义分析其词含义，可以更快地确定视频源的描述是否正确，从而可以根据判断结果来更新热度信息。

Description

基于容器采集的网络视频采集与解析的方法和系统

技术领域

本申请涉及网络多媒体领域，尤其涉及一种基于容器采集的网络视频采集与解析的方法和系统。

背景技术

网络视频的结构不同于传统文本的结构，现有数据采集的方法难以提取网络视频中的文本信息，尤其是其中包含的词含义信息。如何快速、自动化地采集和解析，成为摆在本领域技术人员面前的难题。

因此，急需一种针对性的基于容器采集的网络视频采集与解析的方法和系统。

发明内容

本发明的目的在于提供一种基于容器采集的网络视频采集与解析的方法和系统，通过获取多个不同平台的视频数据流，提取其中的特征向量和热度信息，确定特征向量中感兴趣的语义项，使用语义项的上下文来断句，没有使用语法断句，在断句处采集视频数据流，进而语义分析其词含义，可以更快地确定视频源的描述是否正确，从而可以根据判断结果来更新热度信息。

第一方面，本申请提供一种基于容器采集的网络视频采集与解析的方法，所述方法包括：

根据对应的获取策略，获取多个不同平台的视频数据流，提取其中携带的特征向量和热度信息，所述热度信息是各个平台根据视频点击播放量设置的，所述特征向量包括了所述视频数据流携带的标识、关键词、以及视频概要；

将获取的特征向量和热度信息，按照所述标识聚类，对应存储到不同的缓冲区域；

语义分析所述特征向量，根据所述关键词和视频概要的语义结果，确定感兴趣的语义项，根据所述语义项的上下文来确定断句点；

在所述断句点处采集所述视频数据流，得到第一数据，将所述第一数据输入语义分析模型，分析所述第一数据流的词含义是否包含指定的第二关键词，所述第二关键词是由所述特征向量中的关键词和视频概要生成；

如果所述第一数据流的词含义包含了所述第二关键词，则认为所述第一数据流对应的视频数据流是符合视频源描述的，反之则认为不符合视频源描述；

根据是否符合视频源描述的语义分析结果，更新所述视频数据流的热度信息，将更新后的热度信息反馈给平台。

结合第一方面，在第一方面第一种可能的实现方式中，不同的平台预先设置不同的获取策略，所述获取策略是根据所述视频特征和热度信息的修正记录更新的。

结合第一方面，在第一方面第二种可能的实现方式中，所述获取多个不同平台的视频数据流包括对所述视频数据流的编解码。

结合第一方面，在第一方面第三种可能的实现方式中，所述语义分析模型内核使用了神经网络模型。

第二方面，本申请提供一种基于容器采集的网络视频采集与解析的系统，所述系统包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。

第三方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面四种可能中任一项所述的方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明方法的流程图。

具体实施方式

下面结合附图对本发明的优选实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

图1为本申请提供的基于容器采集的网络视频采集与解析的方法的流程图，包括：

在一些优选实施例中，不同的平台预先设置不同的获取策略，所述获取策略是根据所述视频特征和热度信息的修正记录更新的。

在一些优选实施例中，所述获取多个不同平台的视频数据流包括对所述视频数据流的编解码。

在一些优选实施例中，所述语义分析模型内核使用了神经网络模型。

本申请提供一种基于容器采集的网络视频采集与解析的系统，所述系统包括：所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。

本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面所有实施例中任一项所述的方法。

具体实现中，本发明还提供一种计算机存储介质，其中，该计算机存储介质可以存储有程序，该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称：ROM)或随机存储记忆体(简称：RAM)等。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书各个实施例之间相同相似的部分互相参见即可。尤其，对于实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims

1.一种基于容器采集的网络视频采集与解析的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于：不同的平台预先设置不同的获取策略，所述获取策略是根据所述视频特征和热度信息的修正记录更新的。

3.根据权利要求1-2任一项所述的方法，其特征在于：所述获取多个不同平台的视频数据流包括对所述视频数据流的编解码。

4.根据权利要求1-3任一项所述的方法，其特征在于：所述语义分析模型内核使用了神经网络模型。

5.一种基于容器采集的网络视频采集与解析的系统，其特征在于，所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行实现权利要求1-4任一项所述的方法。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行实现权利要求1-4任一项所述的方法。