CN113129924A

CN113129924A - 一种基于计算机视觉的音视频内容自动标签提取方法

Info

Publication number: CN113129924A
Application number: CN202110343367.3A
Authority: CN
Inventors: 赵郑; 段小霞; 时梅; 于言言
Original assignee: Beijing Zeqiao Media Technology Co ltd
Current assignee: Beijing Zeqiao Media Technology Co ltd
Priority date: 2021-03-30
Filing date: 2021-03-30
Publication date: 2021-07-16

Abstract

本发明公开了一种基于计算机视觉的音视频内容自动标签提取方法，包括以下步骤：S1：音视频播放：对音视频进行播放，设置播放倍数；S2：音频内容存储：对播放内容的音频信息进行识别，识别完成后进行提取，将提取的信息进行存储；S3：视频内容标注：对视频内容信息进行标注；S4：关键提取：对音频信息中的关键内容进行提取，设定标签；S5：标签选择：对设定的标签进行选择，选择一个设定的标签；S6：标签点缀：对设定的标签进行点缀处理，设定好文库，对文库中各个单元信息设置不同点缀。本发明音视频内容自动标签提取准确性较高，提取的结果误差较小，并且观赏性较好，能够对含有不健康内容的视频进行剔除。

Description

一种基于计算机视觉的音视频内容自动标签提取方法

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于计算机视觉的音视频内容自动标签提取方法。

背景技术

随着互联网和教育云的蓬勃发展，教育教学类资源玲琅满目、参差不齐。对于教师、学生而言，可以通过少量的元数据，如标题等来判断资源是否是自身所需，这种方式较依赖于元数据，标题中的错别字可能都会影响用户的判断；也可能需要完整浏览整个音视频才能确定此资源的内容是否为所需的资源，而完整浏览整个音视频会比较耗时。可见，传统的这种音视频获取方式已经无法满足当前从海量互联网资源中快速获取满足自身要求资源的需求。

目前对音视频内容自动标签提取准确性较差，提取的结果误差较大，并且观赏性较差，不能够对含有不健康内容的视频进行剔除。

发明内容

基于背景技术存在的音视频内容自动标签提取准确性较差，提取的结果误差较大，并且观赏性较差，不能够对含有不健康内容的视频进行剔除的技术问题，本发明提出了一种基于计算机视觉的音视频内容自动标签提取方法。

本发明提出的一种基于计算机视觉的音视频内容自动标签提取方法，包括以下步骤：

S1：音视频播放：对音视频进行播放，设置播放倍数；

S2：音频内容存储：对播放内容的音频信息进行识别，识别完成后进行提取，将提取的信息进行存储；

S3：视频内容标注：对视频内容信息进行标注；

S4：关键提取：对音频信息中的关键内容进行提取，设定标签；

S5：标签选择：对设定的标签进行选择，选择一个设定的标签；

S6：标签点缀：对设定的标签进行点缀处理。

优选地，所述S1中，播放倍数设置为0.25-1。

优选地，所述S2中，提取的次数为2-6次，并删去低于平均值的提取结果。

优选地，所述S3中，提前输入违禁视频信息，将需要提取的视频与违禁视频信息进行对比，实现对视频信息进行标注。

优选地，所述S3中，在标注不合格时需要提交的后台，让后台工作人员进行进一步审核。

优选地，所述S4中，设定标签数量为2-5个。

优选地，所述S5中，人工对设定的标签进行选择。

优选地，所述S6中，设定好文库，对文库中各个单元信息设置不同点缀，设定的标签输入到文库中，标签与文库中的信息进行匹配，根据匹配结果完成点缀。

本发明的有益效果:首先对音视频进行播放，设置播放倍数，然后对音频信息进行识别提取，提取完成后对提取的内容进行存储，能够进行多次提取，提高提取音频准确性，然后对视频内容进行审核标注，确保视频内容满足播放条件，能够对含有不健康内容的视频进行剔除，将存储的内容进行多个关键提取，通过人员进行选择合适的关键标签，最后对选择的关键标签进行点缀，提高观赏性。

本发明音视频内容自动标签提取准确性较高，提取的结果误差较小，并且观赏性较好，能够对含有不健康内容的视频进行剔除。

具体实施方式

下面结合具体实施例对本发明作进一步解说。

实施例一

本实施例中提出了一种基于计算机视觉的音视频内容自动标签提取方法，包括以下步骤：

S1：音视频播放：对音视频进行播放，设置播放倍数；

S3：视频内容标注：对视频内容信息进行标注；

S6：标签点缀：对设定的标签进行点缀处理。

本实施例中，S1中，播放倍数设置为0.25，S2中，提取的次数为2次，并删去低于平均值的提取结果，S3中，提前输入违禁视频信息，将需要提取的视频与违禁视频信息进行对比，实现对视频信息进行标注，S3中，在标注不合格时需要提交的后台，让后台工作人员进行进一步审核，S4中，设定标签数量为2个，S5中，人工对设定的标签进行选择，S6中，设定好文库，对文库中各个单元信息设置不同点缀，设定的标签输入到文库中，标签与文库中的信息进行匹配，根据匹配结果完成点缀。

实施例二

S1：音视频播放：对音视频进行播放，设置播放倍数；

S3：视频内容标注：对视频内容信息进行标注；

S6：标签点缀：对设定的标签进行点缀处理。

本实施例中，S1中，播放倍数设置为0.5，S2中，提取的次数为3次，并删去低于平均值的提取结果，S3中，提前输入违禁视频信息，将需要提取的视频与违禁视频信息进行对比，实现对视频信息进行标注，S3中，在标注不合格时需要提交的后台，让后台工作人员进行进一步审核，S4中，设定标签数量为3个，S5中，人工对设定的标签进行选择，S6中，设定好文库，对文库中各个单元信息设置不同点缀，设定的标签输入到文库中，标签与文库中的信息进行匹配，根据匹配结果完成点缀。

实施例三

S1：音视频播放：对音视频进行播放，设置播放倍数；

S3：视频内容标注：对视频内容信息进行标注；

S6：标签点缀：对设定的标签进行点缀处理。

本实施例中，S1中，播放倍数设置为0.5，S2中，提取的次数为4次，并删去低于平均值的提取结果，S3中，提前输入违禁视频信息，将需要提取的视频与违禁视频信息进行对比，实现对视频信息进行标注，S3中，在标注不合格时需要提交的后台，让后台工作人员进行进一步审核，S4中，设定标签数量为4个，S5中，人工对设定的标签进行选择，S6中，设定好文库，对文库中各个单元信息设置不同点缀，设定的标签输入到文库中，标签与文库中的信息进行匹配，根据匹配结果完成点缀。

实施例四

S1：音视频播放：对音视频进行播放，设置播放倍数；

S3：视频内容标注：对视频内容信息进行标注；

S6：标签点缀：对设定的标签进行点缀处理。

本实施例中，S1中，播放倍数设置为0.75，S2中，提取的次数为5次，并删去低于平均值的提取结果，S3中，提前输入违禁视频信息，将需要提取的视频与违禁视频信息进行对比，实现对视频信息进行标注，S3中，在标注不合格时需要提交的后台，让后台工作人员进行进一步审核，S4中，设定标签数量为4个，S5中，人工对设定的标签进行选择，S6中，设定好文库，对文库中各个单元信息设置不同点缀，设定的标签输入到文库中，标签与文库中的信息进行匹配，根据匹配结果完成点缀。

实施例五

S1：音视频播放：对音视频进行播放，设置播放倍数；

S3：视频内容标注：对视频内容信息进行标注；

S6：标签点缀：对设定的标签进行点缀处理。

本实施例中，S1中，播放倍数设置为1，S2中，提取的次数为6次，并删去低于平均值的提取结果，S3中，提前输入违禁视频信息，将需要提取的视频与违禁视频信息进行对比，实现对视频信息进行标注，S3中，在标注不合格时需要提交的后台，让后台工作人员进行进一步审核，S4中，设定标签数量为5个，S5中，人工对设定的标签进行选择，S6中，设定好文库，对文库中各个单元信息设置不同点缀，设定的标签输入到文库中，标签与文库中的信息进行匹配，根据匹配结果完成点缀。

对提取标签准确性的研究：

选取五个音视频，然后采用实施例一和实施例五对五个音视频进行标签提取：

结果表明，采用本发明对标签提取的准确性较高，误差较小，并且实施例三为最佳实施例。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。

Claims

1.一种基于计算机视觉的音视频内容自动标签提取方法，其特征在于，包括以下步骤：

S1：音视频播放：对音视频进行播放，设置播放倍数；

S3：视频内容标注：对视频内容信息进行标注；

S6：标签点缀：对设定的标签进行点缀处理。

2.根据权利要求1所述的一种基于计算机视觉的音视频内容自动标签提取方法，其特征在于，所述S1中，播放倍数设置为0.25-1。

3.根据权利要求1所述的一种基于计算机视觉的音视频内容自动标签提取方法，其特征在于，所述S2中，提取的次数为2-6次，并删去低于平均值的提取结果。

4.根据权利要求1所述的一种基于计算机视觉的音视频内容自动标签提取方法，其特征在于，所述S3中，提前输入违禁视频信息，将需要提取的视频与违禁视频信息进行对比，实现对视频信息进行标注。

5.根据权利要求1所述的一种基于计算机视觉的音视频内容自动标签提取方法，其特征在于，所述S3中，在标注不合格时需要提交的后台，让后台工作人员进行进一步审核。

6.根据权利要求1所述的一种基于计算机视觉的音视频内容自动标签提取方法，其特征在于，所述S4中，设定标签数量为2-5个。

7.根据权利要求1所述的一种基于计算机视觉的音视频内容自动标签提取方法，其特征在于，所述S5中，人工对设定的标签进行选择。

8.根据权利要求1所述的一种基于计算机视觉的音视频内容自动标签提取方法，其特征在于，所述S6中，设定好文库，对文库中各个单元信息设置不同点缀，设定的标签输入到文库中，标签与文库中的信息进行匹配，根据匹配结果完成点缀。