CN102984553A

CN102984553A - 音视频的检测识别方法及系统

Info

Publication number: CN102984553A
Application number: CN2012104334619A
Authority: CN
Inventors: 杨睿尘; 黄
Original assignee: Beijing Haiyi Huaqing Technology Development Co Ltd
Current assignee: Beijing Haiyi Huaqing Technology Development Co Ltd
Priority date: 2012-10-29
Filing date: 2012-10-29
Publication date: 2013-03-20

Abstract

本发明提出一种音视频的检测识别方法及系统。其中，方法包括以下步骤：输入需要检测的音频或视频并对其进行分类，其中，所述类别为离线或在线中的一种；对所述在线或离线的音频、视频进行分析识别确定所述音频或视频中的样本片段，其中，所述样本片段为用户指定的多个音频或视频片段；以及将识别结果上报给用户。根据本发明实施例的方法，通过对输入的音频或视频的特征信息和样品片段的特征信息识别输入视频中的样品片段并上报给用户，因此可以对用户指定的音频或视频片段进行识别，同时获得与样品片段相关的信息方便用户使用。

Description

音视频的检测识别方法及系统

技术领域

本发明涉及音视频技术领域，特别涉及一种音视频的检测识别方法及系统。

背景技术

监测系统工作是广播电视行业行政管理的重要手段，是广播电视事业建设基础性的工作，也是广播电视行业四大平台之一。

目前普遍采用的方法是音视频流的二级分割方法。二级分割方法的思想是，首先大尺度的对音视频进行粗分割，然后定义分割点评价函数，在边界区域中进一步精确定位分割点。

二级分割方法存在如下缺陷：

(1)分割定位点不精确，漏报率高。

(2)不同的编码格式没有统一，由此对检测的准备率有很大影响。

(3)色彩和频率特征的提取效率低，直接影响检测的时间。

发明内容

本发明的目的旨在至少解决上述的技术缺陷之一。

为达到上述目的，本发明一方面的实施例提出一种音视频的检测识别方法，包括以下步骤：S1：输入需要检测的音频或视频并对其进行分类，其中，所述类别为离线或在线中的一种；S2：对所述在线或离线的音频、视频进行分析识别确定所述音频或视频中的样本片段，其中，所述样本片段为用户指定的多个音频或视频片段；以及S3：将识别结果上报给用户。

根据本发明实施例的方法，通过对输入的音频或视频的特征信息和样品片段的特征信息识别输入视频中的样品片段并上报给用户，因此可以对用户指定的音频或视频片段进行识别，同时获得与样品片段相关的信息方便用户使用。

在本发明的一个实施例中，所述方法还包括：S4：清空剩余数据，其中，所述剩余数据为所述输入视频分析识别所生成的数据。

在本发明的一个实施例中，所述步骤S2具体包括：S21：指定样品片段并分析所述样品片段的特征信息；S22：对所述在线或离线的音频、视频进行分析识别获得相应的特征信息；S23：根据所述特征信息从所述在线或离线音频、视频中识别与所述样品片段相同的视频片段；以及S24：将所述样品视频在输入视频中的相关信息进行记录保存，其中，所述相关信息包括开始时间、结束时间、重复次数。

在本发明的一个实施例中，所述步骤S3具体包括：S31：当发现与所述样品片段一致的音频或视频片段时将所述样品信息在输入视频中的相关信息上报给用户；以及S32：当未发现与所述样品片段一致的音频或视频片段时将未发现的提示信息。

为达到上述目的，本发明的实施例另一方面提出一种音视频的检测识别系统，包括：输入模块，用于输入需要检测的音频或视频并对其进行分类，其中，所述类别为离线或在线中的一种；识别模块，用于对所述在线或离线的音频、视频进行分析识别确定所述音频或视频中的样本片段，其中，所述样本片段为用户指定的多个音频或视频片段；以及上报模块，用于将识别结果上报给用户。

根据本发明实施例的系统，通过对输入的音频或视频的特征信息和样品片段的特征信息识别输入视频中的样品片段并上报给用户，因此可以对用户指定的音频或视频片段进行识别，同时获得与样品片段相关的信息方便用户使用。

本发明的一个实施例中，所述系统还包括：清除模块，用于清空剩余数据，其中，所述剩余数据为所述输入视频分析识别所生成的数据。

本发明的一个实施例中，所述识别模块具体包括：获取单元，用于对所述在线或离线的音频、视频进行分析识别获得相应的特征信息；识别单元，用于根据所述特征信息从所述在线或离线音频、视频中识别与所述样品片段相同的视频片段；以及保存单元，用于将所述样品视频在输入视频中的相关信息进行记录保存，其中，所述相关信息包括开始时间、结束时间、重复次数。

本发明的一个实施例中，所述上报模块具体包括：第一上报单元，用于当发现与所述样品片段一致的音频或视频片段时将所述样品信息在输入视频中的相关信息上报给用户；以及第二上报单元，用于当未发现与所述样品片段一致的音频或视频片段时将未发现的提示信息。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本发明一个实施例的音视频的检测识别方法的流程图；

图2为根据本发明另一个实施例的音视频的检测识别方法的流程图；

图3为根据本发明一个实施例的音视频的检测识别系统的框架图；

图4为根据本发明一个实施例的识别模块的框架图；以及

图5为根据本发明另一个实施例的音视频的检测识别系统的框架图。

具体实施方式

下面详细描述本发明的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。

在本发明的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

图1为本发明实施例的音视频的检测识别方法的流程图。如图1所示，根据本发明实施例的音视频的检测识别方法，包括以下步骤：

步骤S101，输入需要检测的音频或视频并对其进行分类，其中，类别为离线或在线中的一种。

具体地，在输入检测视频时，可以直接将在线播放的音频或视频直接进行输入，也可以将已经获取的音频或视频，即离线音频或视频进行输入。其中，不是在线的音频或视频将视为离线音频或视频。

在本发明的一个实施例中，由于离线音频或视频是完整的所以在输入过程中就可以获取整个音频或视频信息，因此可以判断出离线音频或视频。与此相反，在线音频或视频只能按顺序边获取边播放无法在输入阶段获取完整的视频。

步骤S102，对在线或离线的音频、视频进行分析识别确定音频或视频中的样本片段，其中，样本片段为用户指定的多个音频或视频片段。

具体地，指定样品片段将样品片段的音频或视频特征信息进行提取。特征信息中音频的特征信息为音频的频率、振幅、相位和音频内容等，视频的特征信息为视频流的关键帧信息等。同样的获取输入音频或视频的特征信息，然后根据音频或视频的特征信息从在线或离线音频、视频中识别与样品片段相同的音频或视频片段。由于数据处理的误差只要相差小于一定的阈值则认为输入音频或视频与样品片段一致。最后将与样品片段一致的音频或视频在输入视频的相关信息进行记录保存，其中，相关信息包括开始时间、结束时间、重复次数等。

在本发明的一个实施例中，可以支持TS和MP3等多种音频或视频的多媒体数据，并且能够分辨视频文件还是音频文件。

步骤S103，将识别结果上报给用户。

具体地，当发现与样品片段一致的音频或视频片段时将样品信息在输入视频中的相关信息上报给用户。例如，用户输入的是一段广告视频，通过分析识别在输入视频中发现该广告视频出现了3次，并且在该输入视频中广告视频的开始时刻和结束时刻分别为A1和B1、A2和B2、A3和B3。然后，对该信息以文件的形式进行保存并备份到日志文件中。

在本发明的一个实施例中，当未发现与样品片段一致的音频或视频片段时将发出未发现的提示信息，例如，提出未发现与样品片段相同的音频或视频。

图2为根据本发明另一个实施例的音视频的检测识别方法的流程图。如图2所示，根据本发明实施例的音视频的检测识别方法，包括以下步骤：

步骤S201，输入需要检测的音频或视频并对其进行分类，其中，类别为离线或在线中的一种。

步骤S202，对在线或离线的音频、视频进行分析识别确定音频或视频中的样本片段，其中，样本片段为用户指定的多个音频或视频片段。

步骤S203，将识别结果上报给用户。

步骤S204，清空剩余数据，其中，剩余数据为输入视频分析识别所生成的数据。

具体地，删除离线检索出的结果文件、样品片段的特征信息文件以及输入的音频或视频的特征信息文件。

在本发明的一个实施例中，将定期的对记录了整个过程的日志文件以及保存在日志文件的数据进行清空。

根据本发明实施例的方法，通过对日志文件的清空避免了大量数据的沉积，同时调用日志文件方便了调试和维护。

图3为本发明实施例的音视频的检测识别系统的结构框图，如图3所示，根据本发明实施例的音视频的检测识别系统包括输入模块100、识别模块200和上报模块300。

具体地，输入模块100用于输入需要检测的音频或视频并对其进行分类，其中，类别为离线或在线中的一种。

在输入检测视频时，可以直接将在线播放的音频或视频直接进行输入，也可以将已经获取的音频或视频，即离线音频或视频进行输入。其中，不是在线的音频或视频将视为离线音频或视频。

在本发明的一个实施例中，由于离线音频或视频是完整的所以在输入过程中就可以获取整个音频或视频信息，因此可以判断出离线音频或视频。与此相反，在线音频或视频只能按顺序边获取边播放无法输入阶段获取完整的视频。

识别模块200用于对在线或离线的音频、视频进行分析识别确定音频或视频中的样本片段，其中，样本片段为用户指定的多个音频或视频片段。

图4为根据本发明一个实施例的识别模块的框架图。如图4所示，根据本发明实施例的音视频的检测识别系统具体包括样品单元210、获取单元220、识别单元230和保存单元240。

更具体地，样品单元210用于指定样品片段并分析样品片段的特征信息；

获取单元220用于对在线或离线的音频、视频进行分析识别获得相应的特征信息。

识别单元230用于根据特征信息从在线或离线音频、视频中识别与样品片段相同的视频片段。

保存单元240用于将样品视频在输入视频中的相关信息进行记录保存，其中，相关信息包括开始时间、结束时间、重复次数。

上报模块300用于将识别结果上报给用户。

在本发明的一个实施例中，上报模块300具体包括第一上报单元和第二上报单元。

第一上报单元用于当发现与样品片段一致的视频片段时将样品信息在输入视频中的相关信息上报给用户。

第二上报单元用于当未发现与样品片段一致的视频片段时将未发现的提示信息。

根据本发明实施例的系统，通过对处理后数据库信息的删除，提高了数据交互的速度，进而提高了效率。

统计模块300将抓取数据进行统计生成统计数据。

图5为根据本发明另一个实施例的音视频的检测识别系统的框架图，如图5所示，根据本发明实施例的音视频的检测识别系统还包括清除模块400用于清空剩余数据，其中，所述剩余数据为所述输入视频分析识别所生成的数据。具体地，删除离线检索出的结果文件、样品片段的特征信息文件以及输入的音频或视频的特征信息文件。

根据本发明实施例的系统，通过对日志文件的清空避免了大量数据的沉积，同时调用日志文件方便了调试和维护。

应当理解，本发明的系统实施例中的各个模块和单元的具体操作过程可与方法实施例中的描述相同，此处不再详细描述。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种音视频的检测识别方法，其特征在于，包括以下步骤：

S1：输入需要检测的音频或视频并对其进行分类，其中，所述类别为离线或在线中的一种；

S2：对所述在线或离线的音频、视频进行分析识别确定所述音频或视频中的样本片段，其中，所述样本片段为用户指定的多个音频或视频片段；以及

S3：将识别结果上报给用户。

2.根据权利要求1所述的网络舆情信息统计方法，其特征在于，还包括：

S4：清空剩余数据，其中，所述剩余数据为所述输入视频分析识别所生成的数据。

3.根据权利要求1所述的音视频的检测识别方法，其特征在于，所述步骤S2具体包括：

S21：指定样品片段并分析所述样品片段的特征信息；

S22：对所述在线或离线的音频、视频进行分析识别获得相应的特征信息；

S23：根据所述特征信息从所述在线或离线音频、视频中识别与所述样品片段相同的视频片段；以及

S24：将所述样品视频在输入视频中的相关信息进行记录保存，其中，所述相关信息包括开始时间、结束时间、重复次数。

4.根据权利要求1所述的音视频的检测识别方法，其特征在于，步骤S3具体包括：

S31：当发现与所述样品片段一致的音频或视频片段时将所述样品信息在输入视频中的相关信息上报给用户；以及

S32：当未发现与所述样品片段一致的音频或视频片段时将未发现的提示信息。

5.一种音视频的检测识别系统，其特征在于，包括：

输入模块，用于输入需要检测的音频或视频并对其进行分类，其中，所述类别为离线或在线中的一种；

识别模块，用于对所述在线或离线的音频、视频进行分析识别确定所述音频或视频中的样本片段，其中，所述样本片段为用户指定的多个音频或视频片段；以及

上报模块，用于将识别结果上报给用户。

6.根据权利要求6所述的音视频的检测识别系统，其特征在于，还包括：

清除模块，用于清空剩余数据，其中，所述剩余数据为所述输入视频分析识别所生成的数据。

7.根据权利要求6所述的音视频的检测识别系统，其特征在于，所述识别模块具体包括：

样品单元，用于指定样品片段并分析所述样品片段的特征信息；

获取单元，用于对所述在线或离线的音频、视频进行分析识别获得相应的特征信息；

识别单元，用于根据所述特征信息从所述在线或离线音频、视频中识别与所述样品片段相同的视频片段；以及

保存单元，用于将所述样品视频在输入视频中的相关信息进行记录保存，其中，所述相关信息包括开始时间、结束时间、重复次数。

8.根据权利要求5所述的音视频的检测识别系统，其特征在于，所述上报模块具体包括：

第一上报单元，用于当发现与所述样品片段一致的音频或视频片段时将所述样品信息在输入视频中的相关信息上报给用户；以及

第二上报单元，用于当未发现与所述样品片段一致的音频或视频片段时将未发现的提示信息。