CN104754374A

CN104754374A - 音视频文件检测管理方法及装置

Info

Publication number: CN104754374A
Application number: CN201510159599.8A
Authority: CN
Inventors: 陈超; 杨银波; 孙全刚; 王宁
Original assignee: Beijing Qihoo Technology Co Ltd; Qizhi Software Beijing Co Ltd
Current assignee: Beijing Qihoo Technology Co Ltd
Priority date: 2015-04-03
Filing date: 2015-04-03
Publication date: 2015-07-01
Anticipated expiration: 2035-04-03
Also published as: CN104754374B

Abstract

本发明提供了一种音视频文件检测管理方法及装置。该方法包括：从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据；根据预设规则对所述音视频元数据进行初步筛选，以对所述音视频文件进行分类；依据分类结果对所述音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果；根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件。采用本发明能够提高互联网安全。

Description

音视频文件检测管理方法及装置

技术领域

本发明涉及互联网应用领域，特别是涉及一种音视频文件检测管理方法及装置。

背景技术

互联网带来信息的爆炸，与此同时，人们越来越多的参与到互联网的使用当中。

随着互联网被越来越频繁的使用，催生了互联网存储模式，例如各种云盘存储应用，视频网站的流行等等。云盘存储应用或者视频网站都会存在大量的数据存储，尤其是信息量较大且简单易懂易于被用户理解的音视频类数据存储。相应地，由用户产生的音视频文件也越来越多，这些文件被保存在提供相关服务(例如上文提及的云盘存储应用和/或视频网站)的服务器上，并与用户账户相关联。

音视频文件的互联网存储虽然为用户其提供大信息量、简单易懂的数据，但是，相对于简单的文字文件，音视频文件因其音视频的信息复杂性存在难以检测的问题，进而可能会为用户以及整个互联网时代带来一定的安全隐患。例如，用户可能将包含木马/病毒/不当的宣传资料等的音视频文件上传至云盘存储应用，随后，将账号告知其他人，其他人就可以利用账号查看、下载等方式获取到包含木马/病毒/不当的宣传资料的音视频文件，进而对互联网安全造成威胁。或者，用户可以将上述文件直接发到视频网站，供他人观看，均会对互联网安全造成一定的威胁。

目前各网站采用人工审核的方式对互联网存储的音视频文件进行检测。图1示出了现有技术的人工审核视频的流程示意图。由图1可以看出，注册用户上传视频之后，网站将其转入人工审核系统进行安全性判别，在此同时，该视频可以继续传播，由其他用户获取。仅仅在人工审核系统判别出其安全性确实有问题时，才对该视频进行相应处置。

但是，考虑到互联网的大数据性，云盘存储应用或者视频网站每天都会接收到用户上传的大量音视频资源，完全靠人工审核费时费力，并且会造成大量遗漏。另外，人工审核使得每个网站的审核系统均自成体系，没有一个统一的标准，标准的不完善也进一步会对互联网安全造成影响。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的音视频文件检测管理方法和相应的装置。

基于本发明的一个方面，本发明实施例提供了一种音视频文件检测管理方法，包括：

从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据；

根据预设规则对所述音视频元数据进行初步筛选，以对所述音视频文件进行分类；

依据分类结果对所述音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果；

根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件。

可选地，所述依据分类结果对所述音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果的步骤进一步包括：

根据所述分类结果获取所述被分析音视频文件；

提取所述被分析音视频文件的至少一个特征数据；

对提取的特征数据进行信息识别操作，以判断所述提取的特征数据中是否包含特定类型的信息；

依据所述信息识别操作的结果，得到所述判别结果。

可选地，所述从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据的步骤进一步包括：

通过网站数据上传接口向各网站发送元数据获取请求，并通过各网站数据上传接口接收各网站应答所述元数据获取请求所上传的音视频元数据；

或者

通过与各网站对应的网站数据上传接口接收各网站主动上传的音视频元数据。

可选地，在一定的时间段内，各网站所更新的音视频资源在其数据库中所占存储比达到一定的百分比时主动上传音视频元数据；

或者，

在一定的时间段内，各网站所更新的音视频资源的总量达到一定的数值时主动上传音视频元数据；

或者

每隔固定或不定时间段，各网站主动上传音视频元数据。

可选地，所述网站数据上传接口的数量为一个或多个，

当所述网站数据上传接口为一个时，通过该网站数据上传接口接收各网站上传的音视频元数据；

当所述各网站数据上传接口为多个时，根据包括网站数据上传接口与各网站绑定关系的预配置信息，通过各网站数据上传接口分别接收与各网站数据上传接口绑定的各网站上传的音视频元数据。

可选地，所述根据预设规则对所述音视频元数据进行初步筛选的步骤进一步包括：

根据预设的黑白名单规则对所述音视频元数据进行初步筛选对比；

若所述音视频元数据与黑名单规则匹配，则筛选其为不可信任数据；

若所述音视频元数据与白名单规则匹配，则筛选其为可信任数据；

若所述音视频元数据与黑白名单规则均不匹配，则筛选其为需进一步深度分析的未识别数据。

可选地，设置所述黑白名单规则的参数包括下列至少之一：

所述音视频元数据的IP地址；

所述音视频元数据的email来源；

所述音视频元数据的MD5标识；

所述音视频元数据的后缀名；

所述音视频元数据的下载地址；

所述音视频元数据的文件摘要。

可选地，所述提取所述被分析音视频文件的至少一个特征数据的步骤进一步包括：

对于视频文件，提取其中的至少一帧画面和/或至少一个语音片段作为特征数据；和/或

对于音频文件，提取其中的至少一个语音片段作为特征数据。

可选地，所述对于视频文件，提取其中的至少一帧画面作为特征数据的步骤进一步包括：

根据视频文件的时间轴走向，在至少一个时间点提取对应帧的画面作为特征数据。

可选地，根据视频文件的时间轴走向，在至少一个时间点提取对应帧的画面的步骤进一步包括下列至少之一：

在所述时间轴上随机选择任意时间点，提取对应帧的画面；

集中在所述时间轴的某个时间段内进行提取若干帧的画面；

每隔固定时间在对应时间点提取对应帧的画面以生成规则样本选集；

间隔不固定时间在对应时间点提取对应帧的画面以生成不规则样本选集。

可选地，所述对提取的特征数据进行信息识别操作，以判断所述提取的特征数据中是否包含特定类型的信息的步骤进一步包括：

对作为特征数据的帧画面进行信息识别，得到所述帧画面的表达信息，其中，所述表达信息包括所述帧画面上的文字信息和/或所述帧画面的图形信息；

对所述表达信息进行识别操作，以判断出该帧画面上是否以文字和/或图形的方式包含特定类型的信息。

可选地，所述表达信息包括徽标LOGO。

可选地，所述对于音频文件和/或视频文件，提取其中的至少一个语音片段作为特征数据的步骤进一步包括：

根据音频文件和/或视频文件的时间轴走向，提取至少一个时间段的语音片段作为特征数据。

可选地，所述根据音频文件和/或视频文件的时间轴走向，提取至少一个时间段的语音片段的步骤进一步包括：

在所述时间轴上随机选择任意时间段，提取对应的语音片段；

集中在所述时间轴的某个时间段内进行提取若干语音片段；

每隔固定时间段提取固定时长的语音片段以生成规则样本选集，；

间隔不固定时间段提取固定时长或可变时长的语音片段以生成不规则样本选集；

若视频文件提取了至少一帧画面作为特征数据时，提取与所述至少一帧画面对应的语音片段。

所述对提取的特征数据进行信息识别操作，以判断所述提取的特征数据中是否包含特定类型的信息的步骤进一步包括：

对作为特征数据的语音片段进行解析，得到语音片段的语音信息；

对所述语音信息进行识别操作，以判断该语音片段中是否包含特定类型的信息。

可选地，所述对作为特征数据的语音片段进行解析，得到语音片段的语音信息的步骤进一步包括：

对所述语音片段进行语音与文本间的转换，得到语音信息；或者

对所述语音片段进行语音提取识别，得到其中的语音信息。

可选地，所述依据所述信息识别操作的结果，得到所述判别结果的步骤进一步包括：

对每个特征数据的识别结果赋予对应权值并设定在判别结果中的比值；

对当前被分析音视频文件的各识别结果进行加权处理，得到最终权值；

比较所述权值与权值阈值，得到所述判别结果。

对当前被分析音视频文件的各特征数据的识别结果分别进行计数；

比较识别结果为包含特定类型的信息的特征数量和识别结果为不包含特征类型的信息的特征数量，以得到所述判别结果。

可选地，所述根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件之后，还包括：根据检测结果更新所述用于对音视频元数据进行初步筛选的预设规则。

可选地，所述根据检测结果更新所述用于对音视频元数据进行初步筛选的预设规则的步骤进一步包括：

对检测结果为包含特定类型的信息的音视频文件进行解析，得到与所述特定类型相关的关键参数；

将所述关键参数更新至所述预设规则中。

可选地，所述根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件之后，还包括：

若检测出所述被分析音视频文件为所述特定类型的音视频文件，则将其拦截；

若检测出所述被分析音视频文件并非为所述特定类型的音视频文件，则将其放行。

跟踪上传识别为所述特定类型的音视频的用户在网站上的账户信息；

根据所述账户信息查找所述用户的真实身份信息。

可选地，所述跟踪上传识别为所述特定类型的音视频的用户在网站上的账户信息之后，还包括：

对该账户信息发送提醒消息；和/或

锁定或冻结该网站上的该账户。

可选地，依据分类结果对所述音视频文件中的至少一部分进行深度分析之后，还包括：

若根据所述判别结果仍无法检测所述被分析音视频文件是否为特定类型的音视频文件，则将被分析音视频文件转入人工审核机制处理。

基于本发明的另一个方面，本发明实施例还提供了一种音视频文件检测管理装置，包括：

网站数据上传接口，用于从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据；

分流器，用于根据预设规则对所述音视频元数据进行初步筛选，以对所述音视频文件进行分类；

数据判别器，用于依据分类结果对所述音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果；

检测器，用于根据所述判别结果检测所述被分析音视频文件是否为所述特定类型的音视频。

可选地，所述数据判别器还用于：

根据所述分类结果获取所述被分析音视频文件；

提取所述被分析音视频文件的至少一个特征数据；

依据所述信息识别操作的结果，得到所述判别结果。

可选地，音视频文件检测管理装置还包括：

数据输出器，用于通过各网站数据上传接口向各网站发送元数据获取请求；

所述网站数据上传接口，还用于在所述数据输出器输出所述元数据获取请求之后，接收各网站应答所述元数据获取请求所上传的音视频元数据；或者，还用于接收各网站主动上传的音视频元数据。

或者，

或者

每隔固定或不定时间段，各网站主动上传音视频元数据。

可选地，所述网站数据上传接口的数量为一个或多个，

当所述各网站数据上传接口为一个时，通过该网站数据上传接口接收各网站上传的音视频元数据；

可选地，所述分流器还用于：

可选地，设置所述黑白名单规则的参数包括下列至少之一：

所述音视频元数据的IP地址；

所述音视频元数据的email来源；

所述音视频元数据的MD5标识；

所述音视频元数据的后缀名；

所述音视频元数据的下载地址；

所述音视频元数据的文件摘要。

可选地，所述分流器包括：

视频提取单元，用于对于视频文件，提取其中的至少一帧画面和/或至少一个语音片段作为特征数据；和/或

音频提取单元，用于对于音频文件，提取其中的至少一个语音片段作为特征数据。

可选地，所述视频提取单元还用于：根据视频文件的时间轴走向，在至少一个时间点提取对应帧的画面作为特征数据。

可选地，所述视频提取单元还用于采用下列至少之一的提取方式：

在所述时间轴上随机选择任意时间点，提取对应帧的画面；

集中在所述时间轴的某个时间段内进行提取若干帧的画面；

可选地，所述数据判别器还用于：

可选地，所述表达信息包括徽标LOGO。

可选地，所述音频提取单元还用于：根据音频文件和/或视频文件的时间轴走向，提取至少一个时间段的语音片段作为特征数据。

可选地，所述音频提取单元还用于：

集中在所述时间轴的某个时间段内进行提取若干语音片段；

每隔固定时间段提取固定时长的语音片段以生成规则样本选集；

可选地，所述数据判别器还用于：

对所述语音信息进行识别操作，以判断识别出该语音片段中是否包含特定类型的信息。

可选地，所述数据判别器还用于：

对所述语音片段进行语音提取识别，得到其中的语音信息。

可选地，所述数据判别器还用于：

比较所述权值与权值阈值，得到所述判别结果。

可选地，所述数据判别器还用于：

可选地，音视频文件检测管理装置还包括：

规则更新器，用于根据检测结果更新所述用于对音视频元数据进行初步筛选的预设规则。

可选地，所述规则更新器还用于：

将所述关键参数更新至所述预设规则中。

可选地，音视频文件检测管理装置还包括：

文件拦截器，用于若检测出被分析音视频文件为所述特定类型的音视频，则将其拦截；

文件放行器，用于若检测出被分析音视频文件并非为所述特定类型的音视频，则将其放行。

可选地，音视频文件检测管理装置还包括：

身份确认器，用于跟踪上传识别为所述特定类型的音视频的用户在网站上的账户信息；根据所述账户信息查找所述用户的真实身份信息。

可选地，音视频文件检测管理装置还包括：

账户信息处理器，用于对所述身份确认器识别出的账户信息发送提醒消息；和/或，锁定或冻结该网站上的该账户信息。

可选地，音视频文件检测管理装置还包括：

文件转发器，用于若根据所述判别结果仍无法检测所述被分析音视频文件是否为特定类型的音视频文件，则将被分析音视频文件转入人工审核机制处理。

在本发明实施例中采用如下手段对音视频文件进行检测管理：在获取到音视频文件对应的音视频元数据之后，首先，对音视频元数据进行初步筛选，以对音视频文件进行分类；随后，依据分类结果中音视频文件中的至少一部分(例如分类为无法识别的部分音视频文件)进行深度分析，得到针对被分析音视频文件的差别结果，进而可以根据差别结果检测被分析音视频文件是否为特定类型的音视频文件，以完成音视频文件的检测管理。在初步筛选的过程中，部分音视频文件就已经能够判断其类型，并进而确定其安全性。而在初步筛选中无法识别的部分音视频文件，因其未知性导致不可知的威胁性，因此，本发明实施例结合了初步筛选步骤和进一步的深度分析步骤，最终，根据综合的识别结果得到的判断结果检测出被分析音视频文件是否为特定类型的音视频文件。由此可见，本发明实施例能够对网站存储的音视频文件进行筛选辨别检测，以提高音视频文件的可检测性，进而提高音视频文件的安全性、可靠性，避免因音视频文件的难以检测为用户以及整个互联网时代带来一定的安全隐患。进一步，本发明实施例利用对数据的提取分析等自动管理手段替代了现有技术的人工审核机制，能够更好更快地发现、控制以及管理某些特定类型的音视频，及时有效地发现相关的音视频，及时处理，加速大数据的处理过程，节省审核时间，降低互联网安全可能面临的危机。并且，自动管理手段的标准相对于人工审核标准较为统一完善，可更新性强，进一步降低了对互联网安全的影响。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

根据下文结合附图对本发明具体实施例的详细描述，本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了现有技术的人工审核视频的流程示意图；

图2示出了根据本发明一个实施例的音视频文件检测管理方法的处理流程图；

图3示出了根据本发明一个实施例的根据提取的至少一个特征数据综合判断未识别数据是否为特定类型的数据的第一种流程图；

图4示出了根据本发明一个实施例的根据提取的至少一个特征数据综合判断未识别数据是否为特定类型的数据的第二种流程图；

图5示出了根据本发明一个实施例的音视频元数据的总处理流程的简单示意图；

图6示出了根据本发明一个实施例的三步处理方式的详细处理流程；

图7示出了根据本发明一个实施例的音视频文件检测管理装置的一种结构示意图；

图8示出了根据本发明一个实施例的音视频文件检测管理装置的另一种结构示意图；以及

图9示出了根据本发明一个实施例的多网络数据上传接口接收网站上传数据的示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为解决上述技术问题，本发明实施例提供了一种音视频文件检测管理方法。图2示出了根据本发明一个实施例的音视频文件检测管理方法的处理流程图。参见图2，该方法至少包括以下步骤：

步骤S202、从存储有音视频文件的网站获取音视频文件对应的音视频元数据。

步骤S204、根据预设规则对步骤S202获取的音视频元数据进行初步筛选，以对音视频元数据对应的音视频文件进行分类。

步骤S206、依据分类结果对音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果。步骤S208、根据步骤S206得到的、针对被分析音视频文件的判别结果检测被分析音视频文件是否为特定类型的音视频文件。

在本发明实施例中采用如下手段对音视频文件进行检测管理：在获取到音视频文件对应的音视频元数据之后，首先，对音视频元数据进行初步筛选，以对音视频文件进行分类；随后，依据分类结果中音视频文件中的至少一部分(例如分类为无法识别的部分音视频文件)进行深度分析，得到针对被分析音视频文件的判别结果，进而可以根据判别结果检测被分析音视频文件是否为特定类型的音视频文件，以完成音视频文件的检测管理。在初步筛选的过程中，部分音视频文件就已经能够判断其类型，并进而确定其安全性。而在初步筛选中无法识别的部分音视频文件，因其未知性导致不可知的威胁性，因此，本发明实施例结合了初步筛选步骤和进一步的深度分析步骤，最终，根据综合的识别结果得到的判断结果检测出被分析音视频文件是否为特定类型的音视频文件。由此可见，本发明实施例能够对网站存储的音视频文件进行筛选辨别检测，以提高音视频文件的可检测性，进而提高音视频文件的安全性、可靠性，避免因音视频文件的难以检测为用户以及整个互联网时代带来一定的安全隐患。进一步，本发明实施例利用对数据的提取分析等自动管理手段替代了现有技术的人工审核机制，能够更好更快地发现、控制以及管理某些特定类型的音视频，及时有效地发现相关的音视频，及时处理，加速大数据的处理过程，节省审核时间，降低互联网安全可能面临的危机。并且，自动管理手段的标准相对于人工审核标准较为统一完善，可更新性强，进一步降低了对互联网安全的影响。

本发明实施例可以应用任何互联网存储资源的检测，特别是对于包含木马/病毒/不当的宣传资料等的音视频文件，对于可能存在的恐怖宣传起到了极大的防御效果。并且，本发明实施例能够根据互联网的可追溯性追踪到宣传者，对互联网本身的安全以及网络下的安全均能够起到很大的保障。

为实施本发明实施例所提供的音视频文件检测管理方法，可以设置一个独立的控制主体，也可以在服务器等类似管理设备中设置能够提供这一管理方法功能的控制部件或设备，后文提及的相关处理平台即是控制主体的具相化，具体应用由实际情况限定，在此不做赘述。

在本发明的一个优选实施例中，步骤S206所提及的深度分析过程具体可以包括如下步骤：

步骤1、根据分类结果获取被分析音视频文件；

步骤2、提取被分析音视频文件的至少一个特征数据；

步骤3、对提取的特征数据进行信息识别操作，以判断提取的特征数据中是否包含特定类型的信息；

步骤4、依据信息识别操作的结果，得到判别结果。

在本发明一个优选地实施例中，步骤S202所提及的从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据的步骤，至少可以包括如下两种方式。

方式一、被动上传方式，即，通过各网站数据上传接口向各网站发送元数据获取请求，当各网站接收到元数据获取请求之后，对元数据获取请求进行答应，进而可以通过网站数据上传接口将音视频元数据上传，从而使得本方式可以通过各网站数据上传接口接收到各网站上传的音视频元数据。即，由下发的元数据获取请求触发各网站上传数据。这一方式时间及应用等方面均较为灵活，适用于各类网站，例如，可以是控制主体发现网站已存储的音视频资源达到指定容量时发出元数据获取请求，也可以是控制主体发现其中某个或某几个网站已存储的音视频文件达到指定容量时针对这个或这几个网站发出元数据获取请求。

方式二、主动上传方式，通过与各网站对应的网站数据上传接口接收各网站主动上传的音视频元数据。在这一种上传方式中，各网站检测自身的音视频资源，确定是否需要上传。具体地，例如，在一定的时间段内，各网站所更新的音视频资源在其数据库中所占存储比达到一定的百分比时主动上传音视频元数据，此处需要说明地是，其中的任意个网站检测到自身的音视频资源达到一定百分比即可上传。再例如，在一定的时间段内，各网站所更新的音视频资源的总量达到一定的数值时主动上传音视频元数据。或者，每隔固定或不定时间段，各网站主动上传音视频元数据。主动上传方式由网站侧主动发起，能够灵活地根据各网站的独立运行存储状态确定是否需要上传音视频资源，准确度高。

实施时，各网站数据上传接口的数量可以是一个，也可以是多个。当控制主体仅设置一个网站数据上传接口时，通过该网站数据上传接口接收各网站上传的音视频元数据。此时传输过程可以设置队列机制，先进先出，也可以设置其他上传机制，例如优先上传较小的数据包，以防较大的数据包堵塞网络甚至造成系统崩溃。采用队列机制时，若后续同时有多个网站需要通过网站数据上传接口向控制主体上传音视频资源，则将除正在上传的网站之外的其他网站加入等待队列，待前一个网站数据传输结束后，即进行下一网站的数据传输。

因音视频文件通过较大，仅仅一个接口容易造成网络上传缓慢，进而造成网络堵塞，因此，优选地，可以在控制主体上设置多个网络数据上传接口，以缓解数据上传所造成的网络压力，此时，各网络数据上传接口可以根据预配置信息接收与自身绑定的各网站上传的音视频元数据，此处的预配置信息记录了每个网络数据上传接口所匹配的网站的标识。举一个具体的实例，例如，在控制主体上设置了标号为1-4的网络数据上传接口，其中，根据预配置信息，网络数据上传接口1与网站1、2对应，网络数据上传接口2与网站3对应，网络数据上传接口3与网站4、5、6对应，网络上传接口4与网络7、8、9对应。在实际应用中，网络1、2通过网络上传接口1上传音视频元数据，网站3通过网络上传接口2上传音视频元数据，网络4-6通过网络数据上传接口3上传音视频元数据，网络7-9通过网络数据上传接口4上传音视频元数据。当然，仅从上传操作的角度而言，最优选的，可以根据网站的数量在控制主体上设置1V1的网络数据上传接口，即，每个网站均在控制主体上具备对应的唯一的网络数据上传接口，这样可以避免数据传输的排队或延时，避免数据包之间的混淆，提高数据传输的即时性以及准确性。

进一步，步骤S204中提及根据预设规则对音视频元数据进行初步筛选。其中，预设规则通常设置为黑白名单规则，黑名单中存储有不可信任数据的特征，白名单中存储有可信任数据的特征。在筛选过程中，将音视频数据与黑白名单规则进行匹配，根据匹配结果确定该音视频数据属于黑名单或者白名单。若音视频元数据与黑名单规则匹配，则筛选其为不可信任数据，若音视频元数据与白名单规则匹配，则筛选其为可信任数据。其中，设置黑白名单规则的参数包括下列至少之一：音视频元数据的IP(Internet Protocol，互联网协议)地址；音视频元数据的电子邮件(email)来源；音视频元数据的MD5(MessageDigest Algorithm 5，消息摘要算法第五版)标识；音视频元数据的后缀名；音视频元数据的下载地址；音视频元数据的文件摘要。若匹配结果为音视频元数据与黑白名单规则均不匹配，则筛选其为需进一步深度分析的未识别数据。后续步骤S206可以对未识别数据所对应的音视频文件进行具体的深度分析，具体的深度分析过程前文步骤1-4已提及。

步骤2中提及，首先，需要在被分析音视频文件中提取至少一个特征数据。考虑到音频文件和视频文件本身的特性，音频文件仅仅具备语音数据，而视频文件同时具备语音数据和图片数据，相应的，对于视频文件，可以选择提取其中的至少一帧画面作为特征数据，也可以选择提取其中的至少一个语音片段作为特征数据，进一步也可以选择提取其中的至少一帧画面和至少一个语音片段同时作为特征数据。优选地，可以选择与画面对应的语音片段，两者对应同时作为特征数据。而对于音频文件，可以选择提取其中的至少一个语音片段作为特征数据。

对于视频文件，若提取其中的至少一帧画面作为特征数据，考虑到视频本身是随着时间轴运行，因此可以根据视频文件的时间轴走向，在至少一个时间点提取对应帧的画面作为特征数据。具体地，本发明实施例可以在时间轴上随机选择任意时间点，提取对应帧的画面，例如，在时间轴上选择第5s的画面、第10s的画面、第22s的画面。本发明实施例也可以集中在时间轴的某个时间段内进行提取若干帧的画面，例如，在时间轴第3分钟内提取15帧画面。进一步，本发明实施例也可以使用规则样本选集的提取方式，即每隔固定时间在对应时间点提取对应帧的画面，例如，在时间轴上每隔10s在对应时间点提取对应帧的画面。另外，本发明实施例还可以使用不规则样本选集的提取方式，即，间隔不固定时间在对应时间点提取对应帧的画面，例如，在时间轴上依次分别间隔1s、2s、3s在对应时间点提取对应帧的画面，例如在第0s提取第1帧，在第1s提取第2帧，在第3s提取第3帧，在第6s提取第4帧等等。

提取到特征数据之后，继续执行步骤3，对提取的各特征数据进行信息识别操作，以判断各特征数据中是否包含特定类型的信息。具体地，对于提取到的帧画面进行信息识别操作，得到帧画面的表达信息，其中，表达信息包括帧画面上的文字信息和/或帧画面的图形信息。进而对识别得到的表达信息再次进行识别，以识别出该帧画面上是否以文字和/或图形的方式包含特定类型的信息。因文字和/或图形具备信息呈现特性，因此，将对视频资源的识别转换为对表达信息进行识别，简单方便快捷。典型的文字或图形包括徽标(LOGO)，当用户看到一个LOGO时可以在短时间内获取与LOGO相关的大量信息。例如，看到LV，用户会明确了解到这是一个皮包的品牌，历史悠久，并容易了解到LV的特性，例如牢固、大方，甚至能够在脑海中得到经典款的图形等等。

前文提及，对于音频文件和/或视频文件，因其均具备语音数据，因此也可以选择提取其中的至少一个语音片段作为特征数据。前文提及视频本身是随着时间轴运行的，音频与视频同理也是随着时间轴运行的，因此，提取语音片段时，也可以根据音频文件和/或视频文件的时间轴走向，提取至少一个时间段的语音片段作为特征数据。具体地，本发明实施例可以在时间轴上随机选择任意时间段，提取对应的语音片段，例如提取前5s的语音片段，第10s至第20s的语音片段，第60s至第95s的语音片段。本发明实施例也可以集中在时间轴的某个时间段内进行提取若干语音片段，例如在前5分钟内提取6个5s的语音片段。进一步，本发明实施例也可以使用规则样本选集的提取方式，即每隔固定时间段提取固定时长的语音片段，例如每隔10s提取15s的语音片段。另外，本发明实施例还可以使用不规则样本选集的提取方式，即间隔不固定时间段提取固定时长或可变时长的语音片段，例如，第1个语音片段时长为5s，间隔10s后提取第2个语音片段，时长为10s，再间隔20s后提取第3个语音片段，时长为30s，再间隔30s后提取第4个语音片段，时长为40s。

作为特征数据的语音片段被提取之后，对作为特征数据的语音片段进行解析，得到语音片段的语音信息，进而对语音信息进行识别，以识别出该语音片段中是否包含特定类型的信息。其中，语音片段的语音信息的提取过程中，可以直接对语音本身进行提取识别，得到其中的语音信息，也可以对语音片段进行转换，将其由语音转换为文字，再从文字中获取语音片段所表达出的语音信息。

本发明实施例依次对从被分析音视频文件中提取的各特征数据进行识别，直至所有特征数据均被识别结束，与每个特征数据相对应的存在一个独立的判别结果。例如，若从一个未识别数据中提取了3个特征数据，特征数据1的判别结果为该特征数据包括前文提及的特定类型的信息，特征数据2的判别结果为该特征数据不包括上述特定类型的信息，而特征数据3的判别结果为该特征数据包括上述特定类型的信息。此时，本发明实施例需要根据3个特征数据的判别结果进行综合处理，以判断出其来源的未识别数据是否为特定类型的数据。为解决这一技术问题，本发明实施例提供了不同的解决方式。

图3示出了根据本发明一个实施例的根据提取的至少一个特征数据综合判断未识别数据是否为特定类型的数据的第一种流程图。参见图3，该解决方式包括：

步骤S302、对每个特征数据的识别结果赋予对应权值并设定在判别结果中的比值；

步骤S304、对当前被分析音视频文件的各特征数据的识别结果进行加权处理，得到最终权值；

步骤S306、比较权值与权值阈值，得到判别结果。

例如，设置特征数据1的识别结果的权值为1，其在判别结果中的比值为10％，设置特征数据2的识别结果的权值为-1，其在判别结果中的比值为60％，设置特征数据3的识别结果的权值为1，其在判别结果中的比值为30％。被分析音视频文件的最终权值＝1*10％+(-1)*60％+1*30％＝-0.2。本实施例的的权值阈值为0，最终权值(-0.2)<0，因此判断出该未识别数据并非是特定类型的数据。需要说明地是，本实施例中的权值、比值以及权项阈值的设置均由本领域技术人员根据具体应用场景而定。本实施例中的数据仅仅是例举，对本发明的保护范围并不造成任何限定。

图4示出了根据本发明一个实施例的根据提取的至少一个特征数据综合判断未识别数据是否为特定类型的数据的第二种流程图。参见图4，该解决方式包括：

步骤S402、对当前被分析音视频文件的各特征数据的识别结果分别进行计数；

步骤S404、比较识别结果为包含特定类型的信息的特征数量和识别结果为不包含特征类型的信息的特征数量，以得到判别结果。

仍以上文提及的三个特征数据为例，包含特定类型的信息的特征数据为1、3，计数包含特定类型的信息的特征数据得到的数量(简称为特征数量)＝1+1＝2，而不包含特定类型的信息的特征数据为2，即，对应的特征数量＝1。比较可知，包含特定类型的信息的特征数量多于不包含特征类型的信息的特征数量，因此判断出该被分析音视频文件为特定类型的数据。

计数结果的比较方式简单易行，在具体实现时可以为每类设置计数器，每次特征数据的判断结束就对其相应的计数器加1，直至特征数据均判断结束。进而对不同类的计数器的数值进行比较，即可以得到最终的判别结果。

图3及图4所示的仅仅是根据提取的至少一个特征数据综合判断被分析音视频文件是否为特定类型的数据的解决方式的两种具体例举方式，在实际应用中，本领域技术人员可以根据实际情况选择不同的解决方式，而不仅限于上述两种。

本发明实施例采用初步筛选、深度分析等方式对音视频文件进行分析，检测其中是否包括特定类型的信息，相对于相关技术的完全靠人工审核的方式，节省了时间和精力，提高审核效率。并且，因人工误差较大，本发明进一步能够提高审核的精确度。进一步，因平台所形成的审核机制是可复制的，因此可以设立统一的标准，使得整个互联网存储资源的审核机制具备同一标准、可复制、可同步实时更新等多种特性，进一步提高互联网安全性能。

当然，若采用上述实施例对音视频文件检测结束后，仍有部分音视频文件无法被检测出来是否包括特定类型的信息，那么这部分音视频文件可以再次转入人工审核机制处理，由人工复查，以保证所有的音视频资源均被审核到。

本发明实施例中，可以称控制主体为音视频监测处置平台。图5示出了根据本发明一个实施例的音视频资源的总处理流程的简单示意图。参见图5，多个互联网网站向音视频监测处置平台上传音视频元数据(为直接形象，也可直接称为音视频文件)。音视频监测处置平台对接收的音视频文件进行检测。在第一个阶段，通过现有的特征数据库进行快速对比，对受检测的音视频文件进行分流。待快速对比结束后，下载未识别的视频文件，对其送入深度识别引擎利用独有的识别技术(见上文步骤1-4)进行深度分析，以识别出疑似特定类型的音视频文件。经快速对比、深度分析之后，若仍有音视频文件无法判断其具体属性，此时进入人工审核系统，由人工处理，得到人工审核结果(也称人工复查)。最终，可以将经快速对比、深度分析、人工复查的检测结果上传至相关管理部门，以供管理参考。

在本发明实施例中，采用上述方式或手段检测出被分析音视频文件是否为特定类型的音视频之后，可以对音视频文件进行标识、划分、处理等操作，例如根据检测结果将音视频文件划归黑白名单，如此，下一次再需要对同一音视频文件进行检测时，可以将本次检测出的音视频文件直接分流，节省大量人力物力。基于上述理论，本发明实施例可以根据检测结果更新用于对音视频元数据进行初步筛选的预设规则，例如，可以对检测结果为包含特定类型的信息的音视频文件进行解析，得到与特定类型相关的关键参数，进而将关键参数更新至预设规则中。具体地，音视频文件中的LOGO可作为关键参数更新至用于初步筛选的预设规则中，当检测到这一LOGO时，根据之前对该LOGO的检测结果选择对其所在文件的具体操作。采用这一更新步骤能够用以实现音视频元数据检测的去重去复杂化，使得检测具备更高的实时性和准确性，提高检测效率，节省人力物力。另外，对音视频文件所执行的操作有很多，例如，当根据判别结果检测被分析音视频元数据是否为特定类型的音视频之后，若检测出被分析音视频文件为特定类型的音视频文件，则将其拦截；若检测出被分析音视频文件并非为特定类型的音视频文件，则将其放行。也可以根据判断结果对被分析音视频文件执行复制、粘贴、写入、读取、删除等相应操作，在此不做限定。

采用上述实施例对音视频文件检测结束后，为提高互联网安全性能，可以通过跟踪上传识别为特定类型的音视频的音视频文件的用户在网站上的账户信息，以查找到识别为特定类型的音视频文件的用户的真实身份信息。查找到用户账户之后，进一步，可以对对该账户信息发送提醒消息，和/或，选择锁定或冻结该网站上的该账户信息，以避免有人恶意利用该账户传播不良信息，进而用以提高互联网安全性。当然，对于特定类型的音视频文件以及上传该音视频文件的账户信息，网站也会对其进行相应处理，例如提交至相关部门、从原存储地址删除、保留账户信息用于以后核查同类账户等。

图6示出了根据本发明一个实施例的三步处理方式的详细处理流程，其中，三步处理方式指图5中的快速对比、深度分析以及最终的人工复查。本实施例提供的某些具体的平台、实现手段仅用于将本发明陈述地更清楚更仔细。

首先是第1步，初筛。网站把音视频数据接入音视频监测处置平台后利用平台对音视频数据信息进行快速筛查识别出特定类型的音视频。初筛的作用是把平台已经识别过的文件快速识别出来。音视频监测处置平台已经分析完成的视频文件都会进入搜索引擎，初筛会把音视频文件的特征(例如MD5值，使用其唯一性)提取出来，利用搜索引擎进行查询，引擎根据存储的数据把结果返回，从而快速识别出该文件是否为特定类型的音视频等信息，即图6中的MD5对比。

随后执行第2步，初筛结束后，如果文件没有被处理过(没有处理过是指音视频监测处置平台以前没有遇见过的新文件)，那么将会进入下载调度，文件进入下载队列，下载调度部件会根据下载集群的运行情况分配下载资源，实时反馈下载进度。下载调度把文件送入下载集群进行下载，下载完成后可以存储到集群(Cassandra)存储系统中。

进一步，执行第3步，深度识别。下载完成后，把下载后的文件送入深度识别引擎。首先会对视频文件进行抽帧(抽取关键图片)，然后进入图像识别分析，根据图片特征(标志，语言等信息)识别是否有疑似内容(指通过深度识别不能完全确认的部分)，被认定为疑似的音视频文件后续会被识别引擎送入审核系统进行人工审核，具体见第4步。

以特定组织的LOGO为例，深度识别分为以下步骤：

1、抽取关键帧

2、根据图片进行LOGO识别(LOGO是已经被认定为特定组织的标志)

3、与特定组织所在国家或区域的文字识别(例如英文、葡萄牙文、阿拉伯文、中文等)

前文例举了每次识别的帧选择策略，在实际应用中，每一次识别需要至少重复6次上述帧选择及抽取的步骤，抽取6张以上的图来进行判定，以降低误判率。

然后，执行第4步，人工审核。依顺序把仍未能识别的视频文件截图(就是之前的抽取图片)展现给审核人员，审核人员根据视频截图的情况进行人工识别，疑似文件在审核后会被确认称暴恐或者正常文件进入搜索引擎。或者，在人手充足的情况下，可以将完整的音视频文件下载播放以通过人工方式进行审核。可以预期的是，无论是针对抽取图片还是文件全部，人工审核都能够增加审核准确性。

前四步的审核结果最终均会送入样本管理系统，作为统计样本，以供后续再次对新的音视频元数据进行检测作为数据库使用。

基于同一发明构思，本发明实施例还提供了一种音视频文件检测管理装置，用以支持上述任意一个实施例或其组合所提供的音视频文件检测管理方法。图7示出了根据本发明一个实施例的音视频文件检测管理装置的一种结构示意图，图7与图5、6中所示的音视频监测处置平台仅仅是功能以及模块划分不同。参见图7，该装置至少包括：

网站数据上传接口710，用于从存储有音视频文件的网站获取音视频文件对应的音视频元数据；

分流器720，与网站数据上传接口710耦合，用于根据预设规则对音视频元数据进行初步筛选，以对音视频文件进行分类；

数据判别器730，与分流器720耦合，用于依据分类结果对音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果；

检测器740，与数据判别器730耦合，用于根据判别结果检测被分析音视频文件是否为特定类型的音视频。

在一个优选的实施例中，数据判别器730还可以用于：

根据分类结果获取被分析音视频文件；

提取被分析音视频文件的至少一个特征数据；

对提取的特征数据进行信息识别操作，以判断提取的特征数据中是否包含特定类型的信息；

依据信息识别操作的结果，得到判别结果。

在一个优选的实施例中，参见图8，音视频文件检测管理装置还可以包括：

数据输出器750，与网站数据上传接口710耦合，用于通过各网站数据上传接口710向各网站发送元数据获取请求；

网站数据上传接口710，还用于在数据输出器750输出元数据获取请求之后，接收各网站应答元数据获取请求所上传的音视频元数据；或者

网站数据上传接口710，还用于接收各网站主动上传的音视频元数据。

其中，需要说明地是，在一定的时间段内，各网站所更新的音视频资源在其数据库中所占存储比达到一定的百分比时主动上传音视频元数据；

或者，

或者

每隔固定或不定时间段，各网站主动上传音视频元数据。

在一个优选的实施例中，网站数据上传接口710的数量为一个或多个。当网站数据上传接口710为一个时，通过该网站数据上传接口710接收各网站上传的音视频元数据；当各网站数据上传接口710为多个时，根据包括网站数据上传接口与各网站绑定关系的预配置信息，通过各网站数据上传接口分别接收与各网站数据上传接口绑定的各网站上传的音视频元数据。图9示出了根据本发明一个实施例的多网络数据上传接口接收网站上传数据的示意图。图9中第一个网络数据上传接口能够接收三个网站上传的数据，第二个网络数据上传接口能够接收两个网站上传的数据，第三个网络数据上传接口能够接收一个网站上传的数据。图9仅仅是一个例举的示意图，实际应用中，每个网络数据上传接口能够对接的网站数是由接口容量、带宽、稳定性、丢包率等多种因素决定的，本领域技术人员能够根据实际情况对其进行确定，在此不做赘述。

在一个优选的实施例中，分流器720还可以用于：根据预设的黑白名单规则对音视频元数据进行初步筛选对比；

若音视频元数据与黑名单规则匹配，则筛选其为不可信任数据；

若音视频元数据与白名单规则匹配，则筛选其为可信任数据；

其中，设置黑白名单规则的参数包括下列至少之一：

音视频元数据的IP地址；

音视频元数据的email来源；

音视频元数据的MD5标识；

音视频元数据的后缀名；

音视频元数据的下载地址；

音视频元数据的文件摘要。

在一个优选的实施例中，参见图8，分流器720可以包括：

视频提取单元721，用于对于视频文件，提取其中的至少一帧画面和/或至少一个语音片段作为特征数据；和/或

音频提取单元722，用于对于音频文件，提取其中的至少一个语音片段作为特征数据。

在一个优选的实施例中，视频提取单元721还可以用于：根据视频文件的时间轴走向，在至少一个时间点提取对应帧的画面作为特征数据。

在一个优选的实施例中，视频提取单元721还可以用于采用下列至少之一的提取方式：

在时间轴上随机选择任意时间点，提取对应帧的画面；

集中在时间轴的某个时间段内进行提取若干帧的画面；

在一个优选的实施例中，数据判别器730还用于：

对作为特征数据的帧画面进行信息识别，得到帧画面的表达信息，其中，表达信息包括帧画面上的文字信息和/或帧画面的图形信息；

对表达信息进行识别操作，以判断出该帧画面上是否以文字和/或图形的方式包含特定类型的信息。

在一个优选的实施例中，表达信息可以包括LOGO。

在一个选选的实施例中，音频提取单元722还可以用于：根据音频文件和/或视频文件的时间轴走向，提取至少一个时间段的语音片段作为特征数据。

在一个选选的实施例中，音频提取单元722还可以用于：在时间轴上随机选择任意时间段，提取对应的语音片段；

集中在时间轴的某个时间段内进行提取若干语音片段；

规则样本选集，每隔固定时间段提取固定时长的语音片段；

在一个优选的实施例中，数据判别器730还可以用于：

对语音信息进行识别操作，以判断出该语音片段中是否包含特定类型的信息。

在一个优选的实施例中，数据判别器730还可以用于：

对语音片段进行语音与文本间的转换，得到语音信息；或者

对语音片段进行语音提取识别，得到其中的语音信息。

在一个优选的实施例中，数据判别器730还可以用于：

对当前被分析音视频文件的各特征数据的识别结果进行加权处理，得到最终权值；

比较权值与权值阈值，以判断出该未识别数据是否为特定类型的数据，得到判别结果。

在一个优选的实施例中，数据判别器730还可以用于：

比较识别结果为包含特定类型的信息的特征数量和识别结果为不包含特征类型的信息的特征数量，以判断出该未识别数据是否为特定类型的数据，得到判别结果。

规则更新器760，与检测器740耦合，用于根据检测结果更新用于对音视频元数据进行初步筛选的预设规则。

在一个优选的实施例中，规则更新器760还可以用于：

对检测结果为包含特定类型的信息的音视频文件进行解析，得到与特定类型相关的关键参数；

将关键参数更新至预设规则中。

文件拦截器770，与检测器740耦合，用于若检测出被分析音视频文件为特定类型的音视频，则将其拦截；

文件放行器780，与检测器740耦合，用于若检测出被分析音视频文件并非为特定类型的音视频，则将其放行。

身份确认器790，与检测器740耦合，用于跟踪上传识别为特定类型的音视频的用户在网站上的账户信息；根据账户信息查找该用户的真实身份信息。

账户信息处理器7100，与身份确认器790耦合，用于对身份确认器790识别出的账户信息发送提醒消息；和/或，锁定或冻结该网站上的该账户信息。

文件转发器7110，与检测器740耦合，用于若根据检测器740得到的判别结果仍无法检测被分析音视频文件是否为特定类型的音视频文件，则将被分析音视频文件转入人工审核机制处理。

综上，采用本发明实施例提供的音视频文件检测管理方法及装置可以达到如下有益效果：

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的音视频文件检测管理装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”或“包括”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

至此，本领域技术人员应认识到，虽然本文已详尽示出和描述了本发明的多个示例性实施例，但是，在不脱离本发明精神和范围的情况下，仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此，本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

本发明公开了A1、一种音视频文件检测管理方法，包括：

A2、根据权利要求A1所述的方法，其中，所述依据分类结果对所述音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果的步骤进一步包括：

根据所述分类结果获取所述被分析音视频文件；

提取所述被分析音视频文件的至少一个特征数据；

依据所述信息识别操作的结果，得到所述判别结果。

A3、根据权利要求A1所述的方法，其中，所述从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据的步骤进一步包括：

或者

A4、根据权利要求A3所述的方法，其中，在一定的时间段内，各网站所更新的音视频资源在其数据库中所占存储比达到一定的百分比时主动上传音视频元数据；

或者，

或者

每隔固定或不定时间段，各网站主动上传音视频元数据。

A5、根据权利要求A3或A4所述的方法，其中，所述网站数据上传接口的数量为一个或多个，

A6、根据权利要求A1至A5任一项所述的方法，其中，所述根据预设规则对所述音视频元数据进行初步筛选的步骤进一步包括：

A7、根据权利要求A6所述的方法，其中，设置所述黑白名单规则的参数包括下列至少之一：

所述音视频元数据的IP地址；

所述音视频元数据的email来源；

所述音视频元数据的MD5标识；

所述音视频元数据的后缀名；

所述音视频元数据的下载地址；

所述音视频元数据的文件摘要。

A8、根据权利要求A2至A7任一项所述的方法，其中，所述提取所述被分析音视频文件的至少一个特征数据的步骤进一步包括：

A9、根据权利要求A8所述的方法，其中，所述对于视频文件，提取其中的至少一帧画面作为特征数据的步骤进一步包括：

A10、根据权利要求A9所述的方法，其中，所述根据视频文件的时间轴走向，在至少一个时间点提取对应帧的画面的步骤进一步包括下列至少之一：

在所述时间轴上随机选择任意时间点，提取对应帧的画面；

集中在所述时间轴的某个时间段内进行提取若干帧的画面；

A11、根据权利要求A8至A10任一项所述的方法，其中，所述对提取的特征数据进行信息识别操作，以判断所述提取的特征数据中是否包含特定类型的信息的步骤进一步包括：

对所述表达信息进行识别操作，以判断该帧画面上是否以文字和/或图形的方式包含特定类型的信息。

A12、根据权利要求A11所述的方法，其中，所述表达信息包括徽标LOGO。

A13、根据权利要求A8所述的方法，其中，所述对于音频文件和/或视频文件，提取其中的至少一个语音片段作为特征数据的步骤进一步包括：

A14、根据权利要求A13所述的方法，其中，所述根据音频文件和/或视频文件的时间轴走向，提取至少一个时间段的语音片段的步骤进一步包括：

集中在所述时间轴的某个时间段内进行提取若干语音片段；

A15、根据权利要求A13或A14所述的方法，其中，所述对提取的特征数据进行信息识别操作，以判断所述提取的特征数据中是否包含特定类型的信息的步骤进一步包括：

A16、根据权利要求A15所述的方法，其中，所述对作为特征数据的语音片段进行解析，得到语音片段的语音信息的步骤进一步包括：

对所述语音片段进行语音提取识别，得到其中的语音信息。

A17、根据权利要求A2至A16任一项所述的方法，其中，所述依据所述信息识别操作的结果，得到所述判别结果的步骤进一步包括：

比较所述权值与权值阈值，得到所述判别结果。

A18、根据权利要求A2至A16任一项所述的方法，其中，所述依据所述信息识别操作的结果，得到所述判别结果的步骤进一步包括：

A19、根据权利要求A1至A18任一项所述的方法，其中，所述根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件之后，还包括：

根据检测结果更新所述用于对音视频元数据进行初步筛选的预设规则。

A20、根据权利要求A19所述的方法，其中，所述根据检测结果更新所述用于对音视频元数据进行初步筛选的预设规则的步骤进一步包括：

将所述关键参数更新至所述预设规则中。

A21、根据权利要求A1至A20任一项所述的方法，其中，所述根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件之后，还包括：

A22、根据权利要求A1至A21任一项所述的方法，其中，所述根据所述判别结果检测所述被分析音视频文件是否为特定类型的音视频文件之后，还包括：

跟踪上传识别为所述特定类型的音视频文件的用户在网站上的账户信息；

根据所述账户信息查找所述用户的真实身份信息。

A23、根据权利要求A22所述的方法，其中，所述跟踪上传识别为所述特定类型的音视频的用户在网站上的账户信息之后，还包括：

对该账户信息发送提醒消息；和/或

锁定或冻结该网站上的该账户。

A24、根据权利要求A1至A23任一项所述的方法，还包括：

本发明还公开了B25、一种音视频文件检测管理装置，包括：

B26、根据权利要求B25所述的装置，其中，所述数据判别器还用于：

根据所述分类结果获取所述被分析音视频文件；

提取所述被分析音视频文件的至少一个特征数据；

依据所述信息识别操作的结果，得到所述判别结果。

B27、根据权利要求B25所述的装置，其中，还包括：

所述网站数据上传接口，还用于在所述数据输出器输出所述元数据获取请求之后，接收各网站应答所述元数据获取请求所上传的音视频元数据；

或者，

所述网站数据上传接口还用于接收各网站主动上传的音视频元数据。

B28、根据权利要求B27所述的装置，其中，在一定的时间段内，各网站所更新的音视频资源在其数据库中所占存储比达到一定的百分比时主动上传音视频元数据；

或者，

每隔固定或不定时间段，各网站主动上传音视频元数据。

B29、根据权利要求B27或B28所述的装置，其中，所述网站数据上传接口的数量为一个或多个，

B30、根据权利要求B25至B29任一项所述的装置，其中，所述分流器还用于：

B31、根据权利要求B30所述的装置，其中，设置所述黑白名单规则的参数包括下列至少之一：

所述音视频元数据的IP地址；

所述音视频元数据的email来源；

所述音视频元数据的MD5标识；

所述音视频元数据的后缀名；

所述音视频元数据的下载地址；

所述音视频元数据的文件摘要。

B32、根据权利要求B26至B31任一项所述的装置，其中，所述分流器包括：

B33、根据权利要求B32所述的装置，其中，所述视频提取单元还用于：根据视频文件的时间轴走向，在至少一个时间点提取对应帧的画面作为特征数据。

B34、根据权利要求B33所述的装置，其中，所述视频提取单元还用于采用下列至少之一的提取方式：

在所述时间轴上随机选择任意时间点，提取对应帧的画面；

集中在所述时间轴的某个时间段内进行提取若干帧的画面；

B35、根据权利要求B32至B34任一项所述的装置，其中，所述数据判别器还用于：

B36、根据权利要求B35所述的装置，其中，所述表达信息包括徽标LOGO。

B37、根据权利要求B36所述的装置，其中，所述音频提取单元还用于：根据音频文件和/或视频文件的时间轴走向，提取至少一个时间段的语音片段作为特征数据。

B38、根据权利要求B37所述的装置，其中，所述音频提取单元还用于：

集中在所述时间轴的某个时间段内进行提取若干语音片段；

B39、根据权利要求B37或38所述的装置，其中，所述数据判别器还用于：

B40、根据权利要求B39所述的装置，其中，所述数据判别器还用于：

对所述语音片段进行语音提取识别，得到其中的语音信息。

B41、根据权利要求B26至B40任一项所述的装置，其中，所述数据判别器还用于：

比较所述权值与权值阈值，得到所述判别结果。

B42、根据权利要求B26至B40任一项所述的装置，其中，所述数据判别器还用于：

B43、根据权利要求B25至B42任一项所述的装置，其中，还包括：

B44、根据权利要求B43所述的装置，其中，所述规则更新器还用于：

将所述关键参数更新至所述预设规则中。

B45、根据权利要求B25至B44任一项所述的装置，其中，还包括：

B46、根据权利要求B25至B42任一项所述的装置，其中，还包括：

B47、根据权利要求B46所述的装置，其中，还包括：

B48、根据权利要求B25至B47任一项所述的装置，其中，还包括：

Claims

1.一种音视频文件检测管理方法，包括：

2.根据权利要求1所述的方法，其中，所述依据分类结果对所述音视频文件中的至少一部分进行深度分析，得到针对被分析音视频文件的判别结果的步骤进一步包括：

根据所述分类结果获取所述被分析音视频文件；

提取所述被分析音视频文件的至少一个特征数据；

依据所述信息识别操作的结果，得到所述判别结果。

3.根据权利要求1所述的方法，其中，所述从存储有音视频文件的网站获取所述音视频文件对应的音视频元数据的步骤进一步包括：

或者

4.根据权利要求3所述的方法，其中，在一定的时间段内，各网站所更新的音视频资源在其数据库中所占存储比达到一定的百分比时主动上传音视频元数据；

或者，

或者

每隔固定或不定时间段，各网站主动上传音视频元数据。

5.根据权利要求3或4所述的方法，其中，所述网站数据上传接口的数量为一个或多个，

6.根据权利要求1至5任一项所述的方法，其中，所述根据预设规则对所述音视频元数据进行初步筛选的步骤进一步包括：

7.根据权利要求6所述的方法，其中，设置所述黑白名单规则的参数包括下列至少之一：

所述音视频元数据的IP地址；

所述音视频元数据的email来源；

所述音视频元数据的MD5标识；

所述音视频元数据的后缀名；

所述音视频元数据的下载地址；

所述音视频元数据的文件摘要。

8.根据权利要求2至7任一项所述的方法，其中，所述提取所述被分析音视频文件的至少一个特征数据的步骤进一步包括：

9.根据权利要求8所述的方法，其中，所述对于视频文件，提取其中的至少一帧画面作为特征数据的步骤进一步包括：

10.一种音视频文件检测管理装置，包括：