CN114722970B

CN114722970B - 一种多媒体检测方法、装置及存储介质

Info

Publication number: CN114722970B
Application number: CN202210512243.8A
Authority: CN
Inventors: 不公告发明人
Original assignee: Beijing Real AI Technology Co Ltd
Current assignee: Beijing Real AI Technology Co Ltd
Priority date: 2022-05-12
Filing date: 2022-05-12
Publication date: 2022-08-26
Anticipated expiration: 2042-05-12
Also published as: CN114722970A

Abstract

本申请实施例涉及多媒体检测领域，并提供一种多媒体检测方法、装置及存储介质，从多媒体数据流中获取第一多媒体数据，对第一多媒体数据进行检测得到第一检测结果，从第一多媒体数据中确定异常数据，对异常数据进行去重，得到第二多媒体数据，获取第二多媒体数据中各多媒体的类型对应的多个目标引擎，按照多媒体类型，通过对应的目标引擎分别对第二多媒体数据中的各多媒体进行检测，得到第二检测结果。本方案从多媒体数据流中获取第一多媒体数据，对异常数据进行去重，可避免对内容相同的多媒体数据进行重复检测；采用梯度检测方式对多媒体数据进行检测，可适用于不同类型的多媒体数据对应的检测深度，提高了对多媒体数据进行检测的效率及可靠性。

Description

一种多媒体检测方法、装置及存储介质

技术领域

本申请实施例涉及多媒体检测技术领域，尤其涉及一种多媒体检测方法、装置及存储介质。

背景技术

目前，需要审核各互联网平台中的多媒体数据是否符合监管规定，主要通过人工智能对互联网平台中存储的多媒体数据进行智能检测，以判断多媒体数据是否符合监管规定。

现有对多媒体数据进行检测，均是直接对接收的多媒体数据进行检测，由于不同来源的多媒体数据的实质内容可能完全一样，导致对内容相同但来源不同的多媒体数据进行重复检测处理，浪费系统资源。由此可见，目前的多媒体检测方式中存在检测效率不高的问题。

发明内容

本申请实施例提供了一种多媒体检测方法、装置及存储介质，采用通用引擎对第一多媒体数据进行检测得到第一检测结果，根据第一检测结果从第一多媒体数据中确定异常数据，并去重得到第二多媒体数据，通过与第二多媒体数据中多媒体的类型对应的多个目标引擎，对第二多媒体数据中的各多媒体进行检测，得到第二检测结果，从多媒体数据流中获取第一多媒体数据，并对异常数据进行去重，可避免对内容相同的多媒体数据进行重复检测；采用梯度检测方式对多媒体数据进行检测，可适用于不同类型的多媒体数据对应的检测深度，从而提高了对多媒体数据进行检测的效率及可靠性。

第一方面中，从节点角度介绍本申请实施例提供的一种多媒体检测方法，其中，所述方法包括：

从多媒体数据流中获取第一多媒体数据，所述多媒体数据流从至少一个数据源方获取；

对所述第一多媒体数据进行检测得到第一检测结果；所述第一检测结果为采用通用引擎对第一多媒体数据进行检测的结果；

从所述第一多媒体数据中确定异常数据；

对所述异常数据进行去重，得到第二多媒体数据；

获取所述第二多媒体数据中各多媒体的类型对应的多个目标引擎；

按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果；所述第二检测结果包括所述第二多媒体数据中各多媒体与对应的多个目标引擎的检测信息。

第二方面中，本申请实施例提供一种多媒体检测装置，其中，所述装置包括收发模块及处理模块；

所述收发模块用于接收所输入的多媒体数据流；所述多媒体数据流从至少一个数据源方获取；

所述处理模块，用于从多媒体数据流中获取第一多媒体数据；对所述第一多媒体数据进行检测得到第一检测结果；所述第一检测结果为采用通用引擎对第一多媒体数据进行检测的结果；从所述第一多媒体数据中确定异常数据；对所述异常数据进行去重，得到第二多媒体数据；

所述处理模块，还用于获取所述第二多媒体数据中各多媒体的类型对应的多个目标引擎；按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果；所述第二检测结果包括所述第二多媒体数据中各多媒体与对应的多个目标引擎的检测信息。

第三方面中，本申请实施例提供一种多媒体检测装置，其中，所述装置包括：至少一个处理器、存储器和收发器；其中，所述存储器用于存储计算机程序，所述处理器用于调用所述存储器中存储的计算机程序来执行如上述第一方面、第一方面中的各种可能的设计所提供的方法。

第四方面中，本申请实施例提供一种计算机可读存储介质，其包括指令，当其在计算机上运行时，使得计算机执行上述第一方面、第一方面中的各种可能的设计所提供的方法。

本申请实施例又一方面提供了一种计算机设备，其包括至少一个连接的处理器、存储器和收发器，其中，所述存储器用于存储计算机程序，所述处理器用于调用所述存储器中的计算机程序来执行上述第一方面、第一方面中的各种可能的设计所提供的方法。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面、第一方面中的各种可能的设计所提供的方法。

相较于现有技术，本申请实施例提供的方案中，在智慧网络监控、智慧城市、智慧教育等场景中，一方面，通过先对多媒体数据流进行筛选得到第一多媒体数据，再对第一多媒体数据进行检测确定异常数据，又对异常数据进行去重得到第二多媒体数据，即通过筛选和去重处理的双重机制，可避免或减少对内容相同的多媒体数据进行重复检测，从而提高对多媒体数据流的检测效率。另一方面，采用梯度检测方式进行检测，即首先对第一多媒体数据进行检测得到第一检测结果，对第一检测结果中异常数据进行去重得到需要更深入检测的第二多媒体数据；然后，基于各多媒体类型确定对应的目标引擎对第二多媒体数据进行检测得到第二检测结果，由于各多媒体类型对应的目标引擎是基于对异常数据去重得到的第二多媒体数据确定，所以各目标引擎与待检测的第二多媒体数据的多媒体类型更匹配，进而基于这些目标引擎得到的第二检测结果比第一检测结果的检测深度更大，且基于这些目标引擎能够对第二多媒体数据更有针对性的检测。可见采用这一梯度检测方式对多媒体数据进行检测，能够对需要更深入检测的各类型的多媒体数据进一步进行深度检测，通过与各多媒体类型更相符的目标引擎检测进行检测，还能够提高检测的针对性，因此采用上述梯度检测方式能够提高对多媒体数据进行检测的可靠性。

附图说明

图1为本申请实施例中多媒体检测方法的应用场景示意图；

图2为本申请实施例中多媒体检测方法的一种流程示意图；

图3为本申请实施例中多媒体检测方法的另一流程示意图；

图4为本申请实施例中多媒体检测方法的又一流程示意图；

图5为本申请实施例中多媒体检测方法的另一应用场景示意图；

图6为本申请实施例中多媒体检测装置的一种结构示意图；

图7为本申请实施例中服务器的一种结构示意图；

图8为本申请实施例中服务器的一种结构示意图；

图9为本申请实施例中服务终端的一种结构示意图。

具体实施方式

本申请实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块，本申请实施例中所出现的模块的划分，仅仅是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式，例如多个模块可以结合成或集成在另一个装置中，或一些特征可以忽略，或不执行，另外，所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，模块之间的间接耦合或通信连接可以是电性或其他类似的形式，本申请实施例中均不作限定。并且，作为分离部件说明的模块或子模块可以是也可以不是物理上的分离，可以是也可以不是物理模块，或者可以分布到多个电路模块中，可以根据实际的需要选择其中的部分或全部模块来实现本申请实施例方案的目的。

本申请实施例供了一种多媒体检测方法、装置、计算机设备及存储介质，可用于服务器，服务器可用于执行多媒体检测，如短视频平台、即时聊天软件、自媒体平台等互联网平台上均可存储、发布多媒体数据，服务器可获取上述互联网平台上存储、发布的多媒体数据并进行多媒体检测，得到相应检测结果。

本申请实施例的方案可基于云技术实现，具体来说涉及云技术中的云计算、云存储和数据库等技术领域，下面将分别进行介绍。

云技术（Cloud technology）是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来，实现数据的计算、储存、处理和共享的一种托管技术。云技术（Cloudtechnology）基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。本申请实施例可通过云技术对终端下发提示信息，发送目标会话的页面等，以及从终端获取会话记录。

云存储(cloud storage)是在云计算概念上延伸和发展出来的一个新的概念，分布式云存储系统 (以下简称存储系统）是指通过集群应用、网格技术以及分布存储文件系统等功能，将网络中大量各种不同类型的存储设备（存储设备也称之为存储节点）通过应用软件或应用接口集合起来协同工作，共同对外提供数据存储和业务访问功能的一个存储系统。在本申请实施例中，可将网络配置、配置实例、配置模型、转换模板、划分的网络区域等信息均保存在该数据库中，便于服务器调取。

目前，存储系统的存储方法为：创建逻辑卷，在创建逻辑卷时，就为每个逻辑卷分配物理存储空间，该物理存储空间可能是某个存储设备或者某几个存储设备的磁盘组成。客户端在某一逻辑卷上存储数据，也就是将数据存储在文件系统上，文件系统将数据分成许多部分，每一部分是一个对象，对象不仅包含数据而且还包含数据标识（ID，ID entity)等额外的信息，文件系统将每个对象分别写入该逻辑卷的物理存储空间，且文件系统会记录每个对象的存储位置信息，从而当客户端请求访问数据时，文件系统能够根据每个对象的存储位置信息让客户端对数据进行访问。

存储系统为逻辑卷分配物理存储空间的过程，具体为：按照对存储于逻辑卷的对象的容量估量（该估量往往相对于实际要存储的对象的容量有很大余量）和独立冗余磁盘阵列（RAID，Redundant Array of Independent Disk)的组别，预先将物理存储空间划分成分条，一个逻辑卷可以理解为一个分条，从而为逻辑卷分配了物理存储空间。

数据库(Database)，简而言之可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

数据库管理系统（英语：Database Management System，简称DBMS）是为管理数据库而设计的电脑软件系统，一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类，例如关系式、XML（Extensible MarkupLanguage,即可扩展标记语言）；或依据所支持的计算机类型来作分类，例如服务器群集、移动电话；或依据所用查询语言来作分类，例如SQL（结构化查询语言(Structured QueryLanguage)、XQuery；或依据性能冲量重点来作分类，例如最大规模、最高运行速度；亦或其他的分类方式。不论使用哪种分类方式，一些DBMS能够跨类别，例如，同时支持多种查询语言。在本申请实施例中，可将多媒体数据存储在该数据库中，便于服务器调取。

其中，需要特别说明的是，本申请实施例涉及的服务终端，可以是指向服务终端提供语音和/或数据连通性的设备，具有无线连接功能的手持式设备、或连接到无线调制解调器的其他处理设备。例如移动电话（或称为“蜂窝”电话）和具有移动终端的计算机，例如，可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置，它们与无线接入网交换语音和/或数据。例如，个人通信业务（英文全称：Personal Communication Service，英文简称：PCS）电话、无绳电话、会话发起协议（SIP）话机、无线本地环路（Wireless LocalLoop，英文简称：WLL）站、个人数字助理（英文全称：Personal Digital Assistant，英文简称：PDA）等设备。

服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请在此不做限制。

本申请实施例中，服务器是先获取互联网平台中的多媒体数据流，从多媒体数据流中获取所需进行检测的多媒体数据，并对所获取的多媒体数据进行检测得到相应检测结果。

一些实施方式中，本申请实施例可应用于如图1所示的应用场景中，为实现对多媒体数据流进行检测，该应用场景中至少包括一个节点10（也可以理解为服务器）、至少一个数据发送装置20，数据发送装置20可以是互联网平台，所述节点10与所述数据发送终端20之间可以进行数据交互。本实施例中的节点10可以是部设在短视频平台、即时聊天软件、自媒体平台等数据发送装置20内部的服务器，也可以是独立部设于短视频平台、即时聊天软件、自媒体平台等数据发送装置20的服务器。

本申请实施例中，所述数据发送装置20用于输入多媒体数据流至节点10，所述节点10用于执行多媒体检测并得到对应检测结果，

所述节点10接收所述数据发送装置20中的至少一个数据源方的多媒体数据流，并从多媒体数据流中获取第一多媒体数据，对第一多媒体数据进行检测得到第一检测结果，从第一多媒体数据中确定异常数据，对异常数据进行去重，得到第二多媒体数据，获取第二多媒体数据中各多媒体的类型对应的多个目标引擎，按照多媒体类型，通过对应的目标引擎分别对第二多媒体数据中的各多媒体进行检测，得到第二检测结果。可选地，所述节点10可以是诸如服务器、云服务器等终端设备，本申请实施例对此不作限定。所述节点10中可以安装应用程序的客户端。其中，该应用程序是指任意能够为所述节点10及所述数据发送装置20之间提供交互平台的计算机程序。

其中，需要特别说明的是，本申请涉及的服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式装置，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

本申请实施例涉及的服务终端，该服务终端可以包括：智能手机、平板电脑、笔记本电脑、桌上型电脑、智能电视、智能音箱、个人数字助理（英文全称：Personal DigitalAssistant，英文简称：PDA）、台式计算机、智能手表等携带多媒体数据处理功能（例如，视频数据播放功能、音乐数据播放功能）的智能终端，但并不局限于此。

在本实施例中，服务器为分布式处理服务器，可通过分布式处理服务器中配置的子服务器对多媒体数据流进行检测，如通过分布式处理服务器中配置的子服务器对多媒体数据进行过滤，以提高对多媒体数据流进行过滤处理的效率。

本申请实施例主要提供以下技术方案：

从多媒体数据流中获取第一多媒体数据，对第一多媒体数据进行检测得到第一检测结果，从第一多媒体数据中确定异常数据，对异常数据进行去重，得到第二多媒体数据，获取第二多媒体数据中各多媒体的类型对应的多个目标引擎，按照多媒体类型，通过对应的目标引擎分别对第二多媒体数据中的各多媒体进行检测，得到第二检测结果。

下面，将结合几个实施例对本申请技术方案进行详细的介绍说明。

参照图2，以下介绍本申请实施例所提供的一种多媒体检测方法，本申请实施例包括：

201、从多媒体数据流中获取第一多媒体数据。

其中，所述多媒体数据流从至少一个数据源方获取。

在本实施例中，为实现对互联网平台中的多媒体数据流进行检测，服务器可接收互联网平台输入的多媒体数据流，其中，互联网平台的多媒体数据流可采用专线接口接入的方式输入至服务器，数据接入接口可以是一个或多个，一个数据接入接口即对应一个数据源方，也即服务器所接收的多媒体数据流可从至少一个数据源方获取；还可以通过服务器中配置的爬虫等程序从互联网平台中的一个或多个数据接入接口爬取相关多媒体数据流，从而实现多媒体数据流的输入。多媒体数据流由连续性输入的多媒体形成，多媒体数据流可以是在短视频平台、自媒体平台上采用瀑布流式发布的多媒体，或者是在即时聊天软件中随时间线发布的多媒体，其中，多媒体数据流中包含的多媒体可以是视频、图片、音频等。

为对多媒体数据流进行筛选，以避免对重复的多媒体数据进行检测，一些实施方式中，所述从多媒体数据流中获取第一多媒体数据，具体包括：

从所述多媒体数据流中获取结构化数据，以及将所述结构化数据与历史结构化数据进行匹配；

将所述结构化数据的特征标识与所述历史结构化数据不相同的结构化数据对应的多媒体确定为所述第一多媒体数据。

为实现对多媒体数据流中已检测的多媒体数据进行去除，服务器可对多媒体数据流中的多媒体进行过滤，以从多媒体数据流中获取第一多媒体数据，第一多媒体数据即为多媒体数据流中待检测的多媒体数据，具体的，本实施例可通过服务器中配置的去重数据库对多媒体数据流进行过滤，如将去重数据库配置于所述服务器中的多个子服务器中，通过子服务器中各自配置的去重数据库对该多媒体进行过滤，子服务器配置的去重数据库中存储的信息互相之间不共享。其中，去重数据库中存储有历史结构化数据，可判断所述多媒体数据流中的多媒体是否与去重数据库中的历史结构化数据相同，以从中过滤得到与去重数据库中历史结构化数据不相同的第一多媒体数据。其中，历史结构化数据中存储有多媒体的特征标识，特征标识可以是多媒体的MD5值（MD5信息摘要值，MD5 Message-DigestAlgorithm），或者其他能够用于对多媒体进行唯一标识的其它信息。

具体的，多媒体数据流中的各多媒体包括结构化数据及非结构化数据，其中非结构化数据也即是多媒体中所包含的多媒体内容，如视频内容、图像内容或音频内容等，结构化数据即是与非结构化数据对应的数据，结构化数据可以是用于对非结构数据的特征进行记载的数据，例如，结构化数据包括非结构化数据的大小、封装格式、编码格式、数据源地址、特征标识等，大小也即非结构化数据所占用的物理存储空间的大小，封装格式也即非结构化数据进行封装的具体格式信息，封装格式可以是图片、音频、视频等，编码格式也即是非结构化数据进行编码的具体格式信息，例如对于图片而言，编码格式可以是jpg、png、bmp等，封装格式及编码格式可通过非结构化数据的文件后缀确定，数据源地址也即是互联网平台中对多媒体进行存储的具体地址信息，如URL地址等。

由于互联网平台中可能包含来源不同但内容相同的多媒体，获取的多媒体数据流可包含来源不同但内容相同的多媒体，若多媒体中包含的内容相同，则基于多媒体的具体内容所计算得到的特征标识也相同。

具体来说，可以通过判断多媒体的特征标识是否与历史结构化数据中任一特征标识相同，来决定是否对多媒体数据进行后续检测处理，具体判断结果可包含以下两种情况：

若某一多媒体的特征标识与历史结构化数据中某一多媒体的特征标识相同，则表明该多媒体的特征标识已存在于历史结构化数据中，将该多媒体进行滤除，无需对该多媒体进行后续检测处理，也即无需对内容相同而来源不同的多媒体进行重复检测，减少对后端计算资源的浪费。

若多媒体的特征标识与历史结构化数据中任一特征标识均不相同，则表明该多媒体的特征标识不存在于历史结构化数据中，可对该多媒体保留并进行后续检测处理，获取所有保留的多媒体即可得到第一多媒体数据。

202、服务器对所述第一多媒体数据进行检测得到第一检测结果。

其中，所述第一检测结果为采用通用引擎对第一多媒体数据进行检测的结果。

由于第一多媒体数据中包含多个多媒体，因此服务器可依次获取第一多媒体数据中的各多媒体进行检测并得到第一检测结果。在更具体的实施例中，为提高从第一多媒体数据中获取多媒体进行检测的顺序性，服务器可将得到的第一多媒体数据的结构化数据添加至第一消息队列中，第一消息队列可用于对第一多媒体数据的结构化数据进行暂存，第一消息队列中多媒体的结构化数据遵循先进先出原则。将多媒体的结构化数据添加至第一消息队列后，即可依次从第一消息队列中获取多媒体的结构化数据，以及多媒体结构化数据对应的非结构化数据进行初始检测，其中，从而得到多媒体的初始检测结果，第一检测结果中也即包含第一多媒体数据各多媒体的初始检测结果。

具体的，可依次获取第一消息队列中的多媒体并请求引擎服务，以调用通用引擎对多媒体进行检测得到是否疑似异常的初始检测结果。上述对多媒体是否异常的检测，可以是深伪异常检测、对抗样本检测、涉黄异常检测、涉暴异常检测、文本检测（如非法言论检测）等，具体检测方式在此不做限定。在申请实施例中，可针对检测方式的不同，灵活调用对应的通用引擎进行检测处理。

在本实施例中，服务器可使用gRPC对引擎使用进行调用，以减少网络延迟，增加引擎检测的效率。其中，RPC（Remote Procedure Call，远程过程调用）可调用部署于其它服务器上的检测引擎对服务器中的待处理多媒体数据进行检测处理，gRPC是在RPC基础上开发的一种高性能、通用的RPC框架，g RPC基于HTTP/2协议标准设计。

为实现对第一多媒体数据中各多媒体进行检测，一些实施方式中，所述对所述第一多媒体数据进行检测得到第一检测结果，具体包括：

获取所述第一多媒体数据中各多媒体的非结构化数据的基础特征信息；

根据所述多媒体的基础特征信息确定每一所述多媒体的提取规则；

根据所述提取规则从每一所述多媒体的非结构化数据中提取检测特征信息；

采用所述通用引擎对每一所述多媒体的检测特征信息进行检测，得到第一检测结果。

可见，一方面中，由于使用通用引擎对第一多媒体数据中各多媒体进行检测，且通用引擎可对任意类型的多媒体进行检测的一个检测引擎，当通过一个通用引擎对第一多媒体数据中各多媒体进行一次初始检测时，可提高检测效率。另一方面中，若得到初始检测结果不为疑似异常的多媒体，则认为是正常的多媒体数据，则无需进行后续的检测处理，由于无需进行后续检测处理，即可提高服务器的资源利用率。

为实现获取各多媒体的基础特征信息的目的地，可首先获取第一消息队列中多媒体的非结构化数据，再从非结构化数据中获取与多媒体对应的基础特征信息，其中，基础特征信息也即是用于对多媒体的非结构化数据的基础特征进行描述的信息，基础特征信息至少包含非结构化数据的封装格式及编码格式，例如，多媒体为图片，对应的基础特征信息还可以包括图片尺寸等；多媒体为视频，对应的基础特征信息还可以包括视频长度、视频清晰度等；多媒体为音频，对应的基础特征信息还可以包括音频长度等。

本申请实施例的技术方法中，针对不同类型的多媒体可使用不同的提取规则，例如，获取视频的检测特征信息需要对视频进行抽帧处理，并通过通用引擎中图像内容识别检测的逻辑对抽帧处理得到的图像信息进行检测；获取音频的检测特征信息需要将音频转换为对应的文本内容，并通过通用引擎中文本内容识别检测的逻辑对得到的文本内容进行检测。可根据基础特征信息确定每一多媒体的提取规则，并根据每一多媒体的提取规则从多媒体的非结构化数据中提取对应的检测特征信息，检测特征信息即是可用于对非结构数据的内容特征进行体现的特征信息，检测特征信息可用于后续检测过程，如根据视频的封装格式及编码格式确定提取规则，并根据提取规则对视频进行抽帧处理，抽帧获取到的图像信息即为与该视频对应的检测特征信息。

通过请求引擎服务，以调用通用引擎对多媒体的检测特征信息进行检测，从而得到多媒体的初始检测结果。获取各多媒体的初始检测结果得到第一多媒体数据的第一检测结果。

203、服务器从所述第一多媒体数据中确定异常数据。

可从第一多媒体数据中确定异常数据，具体的，可从第一多媒体数据中获取初始检测结果为疑似异常的多媒体，得到异常数据。

204、服务器对所述异常数据进行去重，得到第二多媒体数据。

可对获取的异常数据进行去重，经过上述步骤处理后得到异常数据中多媒体的数量大幅减小，此时可通过少量子服务器对异常数据进行去重，如设置多个子服务器共用的组合去重数据库，并将异常数据中包含的多媒体输入至任一子服务器中进行去重，去重处理基于组合去重数据库实现，组合去重数据库中存储有多媒体的历史结构化数据；进行去重后即可得到第二多媒体数据。与上述筛选过程不同的是，去重处理时，多个子服务器可共享组合去重数据库中存储的多媒体的特征标识，能够彻底排除重复的多媒体。

205、服务器获取所述第二多媒体数据中各多媒体的类型对应的多个目标引擎。

其中，目标引擎是根据不同构建方法所构建得到的多媒体检测引擎，例如针对多媒体类型为视频的情况，可采用卷积神经网络（convolutional neural network, CNN）及Transformer模型构建得到第一视频检测引擎，采用卷积神经网络、多头自注意力（(Multi-Head Self-Attention）神经网络及Transformer模型构建得到第二视频检测引擎，采用卷积神经网络（convolutional neural network, CNN）及循环神经网络（Recurrent NeuralNetwork, RNN）构建得到第三视频检测引擎。

服务器可根据第二多媒体数据中各多媒体的类型，获取与其中各多媒体对应的多个目标引擎。可使用多个目标引擎同时对第二多媒体数据中各多媒体进行检测，也即是通过多个目标引擎对第二多媒体数据中各多媒体进行组合检测，检测时使用与多媒体类型对应的多个目标引擎进行同时检测，可大幅提高检测的准确率。

一些实施方式中，所述根据第二多媒体数据中各多媒体的类型，获取与其中各多媒体对应的多个目标引擎，具体包括：

获取所述第二多媒体数据中各多媒体的非结构化数据的基础特征信息；

根据所述多媒体的基础特征信息确定每一所述多媒体的类型；

根据所述多媒体的类型确定与每一所述多媒体的类型对应的多个目标引擎。

可获取第二多媒体数据中各多媒体的非结构化数据的基础特征信息，其中，基础特征信息也即是用于对待精检多媒体数据的非结构化数据的基础特征进行描述的信息，基础特征信息至少包含非结构化数据的封装格式及编码格式。

根据基础特征信息及某一具体检测类型请求引擎服务，以调用与基础特征信息及具体检测类型对应的多个精检引擎对检测特征信息进行检测，获取每一精检引擎对检测特征信息进行检测所得到的检测结果，作为与该检测特征信息对应的组合引擎检测信息。

根据基础特征信息确定多媒体的类型，并根据多媒体的类型及某一具体检测方式请求引擎服务，以调用与多媒体的类型及具体检测方式对应的多个目标引擎。

206、服务器按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果。

其中，所述第二检测结果包括所述第二多媒体数据中各多媒体与对应的多个目标引擎的检测信息，例如，针对某一多媒体的类型为视频的情况，可确定与视频对应的三个目标引擎：第一视频检测引擎、第二视频检测引擎及第三视频检测引擎；并通过三个目标引擎分别对该视频多媒体进行检测，得到第一视频检测引擎的检测信息、第二视频检测引擎的检测信息及第三视频检测引擎的检测信息。

由于第二多媒体数据中包含多个多媒体，因此服务器可依次获取第二多媒体数据中的各多媒体进行检测并得到第二检测结果。在更具体的实施例中，为提高从第二多媒体数据中获取多媒体进行检测的顺序性，服务器可将第二多媒体数据中各多媒体添加至第二消息队列中，并遵循先进先出原则依次获取第二消息队列中的多媒体，通过与多媒体相对应的多个目标引擎对各多媒体进行检测，得到第二检测结果，第二检测结果包括第二多媒体数据中各多媒体与对应的多个目标引擎的检测信息。从第二消息队列中获取的多媒体可使用与该多媒体对应的多个目标引擎同时进行检测，得到多媒体与对应的多个目标引擎的检测信息，获取每一多媒体的检测信息即可得到第二检测结果。

具体的，可获取第二消息队列中的一个多媒体的非结构化数据，以及与该多媒体对应的基础特征信息，其中，基础特征信息也即是用于对多媒体的非结构化数据的基础特征进行描述的信息，基础特征信息至少包含非结构化数据的封装格式及编码格式。

本申请实施例的技术方法中，可根据多媒体的基础特征信息确定每一多媒体的提取规则，根据多媒体的提取规则从多媒体的非结构化数据中提取对应的检测特征信息，检测特征信息即是可用于对非结构数据的内容特征进行体现的特征信息，检测特征信息可用于后续检测过程。

通过请求引擎服务，以调用与多媒体对应的多个目标引擎对多媒体的检测特征信息进行检测，从而得到多媒体与对应的多个目标引擎的检测信息。

在本实施例的方法中，还可根据不同类型的多媒体的检测结果，采取后续措施，如对于某一类型的多媒体的检测结果中出现大量深伪，可针对这一类型的多媒体进行管控，如封禁同一类型的多媒体。

在本实施例的方法中，还可配置监控模块，通过监控模块对服务器运行情况进行监控，对检测服务进行监控，以及对数据处理流进行监控；获取监控数据后可对各监控数据进行可视化展示，以方便服务器的使用者进行察看并掌握服务器进行多媒体检测的整体情况，如对检测结果为异常的多媒体的来源进行归总监控、对各类型多媒体的检测数量进行统计监控，对所检测的多媒体的类型进行统计监控等。此外，还可配置日志模块，对服务日志进行收集、分析，并对日志内容进行查询及展示，从而方便对服务器的运行情况进行记录。

可见，通过本方案，在智慧网络监控、智慧城市、智慧教育等场景中，从多媒体数据流中获取第一多媒体数据，对第一多媒体数据进行检测得到第一检测结果，从第一多媒体数据中确定异常数据，对异常数据进行去重，得到第二多媒体数据，获取第二多媒体数据中各多媒体的类型对应的多个目标引擎，按照多媒体类型，通过对应的目标引擎分别对第二多媒体数据中的各多媒体进行检测，得到第二检测结果。本方案从多媒体数据流中获取第一多媒体数据，对异常数据进行去重，可避免对内容相同的多媒体数据进行重复检测；采用梯度检测方式对多媒体数据进行检测，可适用于不同类型的多媒体数据对应的检测深度，从而提高了对多媒体数据进行检测的效率及可靠性。

为保持对所输入的多媒体数据进行筛选的可靠性，在一些实施方式中，所述按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果之后，还包括：

207、将所述第二多媒体数据的结构化数据添加至所述历史结构化数据中。

参照图3所示，为保持对所输入的多媒体数据量进行筛选的可靠性，可对所存储的历史结构化数据进行更新。具体的，可获取第二多媒体数据中各多媒体的结构化数据，并将结构化数据添加至历史结构化数据中，从而实现对所存储的历史结构化数据进行更新，通过更新历史所存储的历史结构化数据以保持对持续不断输入的多媒体数据量进行筛选的可靠性。由于已经获取到与第二多媒体数据对应的第二检测结果，也即第二多媒体数据中各多媒体已完成检测，为避免对与第二多媒体数据中各多媒体的特征标识相同的其它多媒体进行重复检测，可将第二多媒体数据的结构化数据添加至历史结构化数据中，基于更新后的历史结构化数据对多媒体数据流进行筛选，即可避免对相同特征标识的多媒体进行重复检测。

此外，还可对多媒体数据流中特征标识与所述历史结构化数据相同的结构化数据进行存储，由于多媒体的结构化数据相比非结构化数据占用空间小，且结构化数据中包含多媒体的数据源地址，因此可将多媒体数据流中特征标识与所述历史结构化数据相同的结构化数据进行存储，并舍弃多媒体数据流中特征标识与所述历史结构化数据相同的多媒体的非结构化数据，从而实现对重复的多媒体进行轻量化存储。

在本实施例的方法中，从多媒体数据流中获取第一多媒体数据，对第一多媒体数据进行检测得到第一检测结果，从第一多媒体数据中确定异常数据，对异常数据进行去重，得到第二多媒体数据，获取第二多媒体数据中各多媒体的类型对应的多个目标引擎，按照多媒体类型，通过对应的目标引擎分别对第二多媒体数据中的各多媒体进行检测，得到第二检测结果。通过将第二多媒体数据的结构化数据存储至历史结构化数据中，使不断更新的历史结构化数据能够对新输入的多媒体数据流进行有效筛选，从而保持对所输入的多媒体数据进行筛选的可靠性。

图2中所对应的实施例中所提及的任一技术特征也同样适用于本申请实施例中的图3所对应的实施例，后续类似之处不再赘述。

为进一步获取第二多媒体数据中各多媒体更准确的检测结果，在一些实施方式中，所述按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果之后，还包括：

217、对所述第二检测结果中各所述多媒体对应的多个目标引擎的检测信息进行融合，得到第三检测结果。

参照图4所示，为对各多媒体对应的多个目标引擎的检测信息进行综合，从而得到更准确的检测结果，可对第二检测结果中各所述多媒体对应的多个目标引擎的检测信息进行融合，得到第二多媒体数据中各多媒体的最终检测结果，最终检测结果也即是多媒体是否异常的信息。

为实现对多个目标引擎的检测信息进行融合得到更准确的检测结果，一些实施方式中，所述对所述第二检测结果中各所述多媒体对应的多个目标引擎的检测信息进行融合，得到第三检测结果，具体包括：

根据与所述第二多媒体数据中各多媒体的基础特征信息确定与每一所述多媒体对应的融合权重信息；

根据所述融合权重信息对所述第二检测结果中各所述多媒体的检测信息进行加权计算，得到计算值；

对所述计算值是否大于预置的检测阈值进行判断，得到第三检测结果。

在本实施例的方法中，为实现对不同类型的多媒体的检测结果更有针对性进行融合，针对不同基础特征信息的多媒体可使用不同的融合策略，服务器中存储有与每一类型对应的融合权重信息，则可根据多媒体的基础特征信息确定多媒体的类型，并根据多媒体的类型确定每一多媒体对应的融合权重信息。如针对图片、视频、音频等不同类型的多媒体，可分别获取每一类型的多媒体对应的融合权重信息进行使用。

具体的，可将多媒体的融合权重信息与多媒体的检测信息进行加权计算，从而得到该多媒体的计算值。例如，加权计算可采用公式（1）进行表示：

C=a₁×S₁+a₂×S₂+…a_n×S_n （1）；

其中，C为计算得到的计算值，a₁、a₂…a_n为与某一多媒体的类型相匹配的融合权重信息，S₁、S₂…S_n为该多媒体的检测信息（检测信息中某一目标引擎的结果为异常，则相应S值为1，目标引擎的结果为非异常，则相应S值为0），n为目标引擎的总数量。

计算得到计算值后，可判断计算值是否大于预置的检测阈值，若多媒体的计算值大于检测阈值则得到该多媒体的最终检测结果为异常，若多媒体的计算值不大于检测阈值则得到该多媒体的最终检测结果为不异常。

在本实施例的方法中，采用梯度检测方式进行检测，在第一检测梯度，对第一多媒体数据进行检测得到第一检测结果，通过确定第一检测结果中异常数据并进行去重得到需要更深入检测的第二多媒体数据；在第二检测梯度，通过各多媒体类型确定对应的目标引擎，并通过各多媒体对应的多个目标引擎对第二多媒体数据进行检测得到第二检测结果，能够得到相比第一检测结果深度更大的第二检测结果；在第三检测梯度，通过对第二检测结果中各多媒体对应的多个目标引擎的检测信息进行融合，能够得到融合多个目标引擎的检测信息的第三检测结果。由于第三检测结果融合了多个目标引擎的检测信息，因此能够克服其中个别目标引擎检测存在的偏差，使多个目标引擎的整体结果不会偏离正确方向，最终使得到的第三检测结果能够更加准确。因此采用上述梯度检测方法进一步提高了对多媒体数据进行检测的可靠性。

从多媒体数据流中获取第一多媒体数据，对第一多媒体数据进行检测得到第一检测结果，从第一多媒体数据中确定异常数据，对异常数据进行去重，得到第二多媒体数据，获取第二多媒体数据中各多媒体的类型对应的多个目标引擎，按照多媒体类型，通过对应的目标引擎分别对第二多媒体数据中的各多媒体进行检测，得到第二检测结果，对第二检测结果中各所述多媒体对应的多个目标引擎的检测信息进行融合，得到第三检测结果。

本方案从多媒体数据流中获取第一多媒体数据，对异常数据进行去重，可避免对内容相同的多媒体数据进行重复检测；采用梯度检测方式对多媒体数据进行检测，并对每一多媒体对应的多个目标引擎的检测结果进行融合，得到准确的第三检测结果，可适用于不同类型的多媒体数据对应的检测深度，从而提高了对多媒体数据进行检测的效率及可靠性。

图2中所对应的实施例中所提及的任一技术特征也同样适用于本申请实施例中的图4所对应的实施例，后续类似之处不再赘述。

图2至图4中任一项所对应的实施例中所提及的任一技术特征均可以适用于本申请实施例中图5所示的应用场景，图2至图4中任一项所对应的实施例中的数据处理流向即与图5中箭头所示方向相对应。

图2至图4中任一项所对应的实施例中所提及的任一技术特征也同样适用于在本申请实施例中的图6至图9所对应的实施例，后续类似之处不再赘述。

以上对本申请实施例中一种多媒体检测的方法进行说明，以下对执行上述多媒体检测的方法的多媒体检测装置（例如服务器）进行介绍。

参阅图6，如图6所示的一种多媒体检测装置1的结构示意图，其可应用于服务器中，用于先获取互联网平台中的多媒体数据流，进行过滤并初始检测得到初始检测结果，若初始检测结果为疑似异常则进行精检去重后，通过多个精检引擎分别进行检测得到组合引擎检测信息，对组合引擎检测信息进入融合得到精检结果。在本申请实施例中的多媒体检测装置能够实现对应于上述图2至图4中任一所对应的实施例中所执行的多媒体检测的方法的步骤。多媒体检测装置实现的功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块，所述模块可以是软件和/或硬件。所述多媒体检测装置1可包括处理模块11及收发模块12，所述多媒体检测装置1还可以包括显示模块（图6中未标识出），所述处理模块11、所述收发模块12的功能实现可参考图2至图4所对应的实施例中所执行的操作，此处不作赘述。例如，所述处理模块11可用于控制所述收发模块12的收发、获取等操作，以及控制所述显示模块的显示预设空间等操作。

一些实施方式中，所述收发模块12，用于接收所输入的多媒体数据流；所述多媒体数据流从至少一个数据源方获取；

所述处理模块11，用于从多媒体数据流中获取第一多媒体数据；对所述第一多媒体数据进行检测得到第一检测结果；所述第一检测结果为采用通用引擎对第一多媒体数据进行检测的结果；从所述第一多媒体数据中确定异常数据；对所述异常数据进行去重，得到第二多媒体数据；

所述处理模块11，还用于获取所述第二多媒体数据中各多媒体的类型对应的多个目标引擎；按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果；所述第二检测结果包括所述第二多媒体数据中各多媒体与对应的多个目标引擎的检测信息。

一些实施方式中，所述处理模块11，还用于：

将所述第二多媒体数据的结构化数据添加至所述历史结构化数据中。

一些实施方式中，所述处理模块11，还用于：

对所述第二检测结果中各所述多媒体对应的多个目标引擎的检测信息进行融合，得到第三检测结果。

一些实施方式中，所述处理模块11，还用于：

上面从模块化功能实体的角度对本申请实施例中的多媒体检测装置进行了描述，下面从硬件处理的角度分别对本申请实施例中的执行多媒体检测的方法的多媒体检测的装置（例如服务器）进行描述。需要说明的是，在本申请实施例图6任一所示的实施例中的收发模块对应的实体设备可以为收发器、输入/输出单元、射频电路、通信模块和输出接口等，处理模块对应的实体设备可以为处理器。例如，图6所示的多媒体检测装置1可以具有如图7所示的结构，当图6所示的多媒体检测装置1具有如图7所示的结构时，图7中的处理器和收发器能够实现前述对应该多媒体检测装置1的装置实施例提供的处理模块11和收发模块12相同或相似的功能，图7中的存储器存储处理器执行上述多媒体检测的方法时需要调用的计算机程序。

图8是本申请实施例提供的一种服务器的结构示意图，该服务器820可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器（英文全称：centralprocessing units，英文简称：CPU）822（例如，一个或一个以上处理器）和存储器832，一个或一个以上存储应用程序842或数据844的存储介质830（例如一个或一个以上海量存储设备）。其中，存储器832和存储介质830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块（图示没标出），每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器822可以设置为与存储介质830通信，在服务器820上执行存储介质830中的一系列指令操作。

服务器820还可以包括一个或一个以上电源826，一个或一个以上有线或无线网络接口850，一个或一个以上输入输出接口858，和/或，一个或一个以上操作系统841，例如Windows Server，Mac OS X，Unix, Linux，FreeBSD等等。

上述实施例中由服务器所执行的步骤可以基于该图8所示的服务器820的结构。例如上述实施例中由图6所示的多媒体检测装置1所执行的步骤可以基于该图8所示的服务器结构。例如，所述处理器822通过调用存储器832中的指令，执行以下操作：

通过输入输出接口858获取从互联网平台所输入的多媒体数据流；

通过处理器822对多媒体数据流进行检测，具体的，处理器822用于从多媒体数据流中获取第一多媒体数据；对所述第一多媒体数据进行检测得到第一检测结果；所述第一检测结果为采用通用引擎对第一多媒体数据进行检测的结果；从所述第一多媒体数据中确定异常数据；对所述异常数据进行去重，得到第二多媒体数据；处理器822还用于获取所述第二多媒体数据中各多媒体的类型对应的多个目标引擎；按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果；所述第二检测结果包括所述第二多媒体数据中各多媒体与对应的多个目标引擎的检测信息。

本申请实施例还提供了另一种服务终端，如图9所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该服务终端可以为包括手机、平板电脑、个人数字助理（英文全称：Personal Digital Assistant，英文简称：PDA）、销售终端（英文全称：Point of Sales，英文简称：POS）、车载电脑等任意终端设备，以终端为手机为例：

图9示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图9，手机包括：射频（英文全称：Radio Frequency，英文简称：RF）电路914、存储器920、输入单元930、显示单元940、传感器950、音频电路960、无线保真（英文全称：wirelessfidelity，英文简称：WiFi）模块970、处理器980、以及电源990等部件。本领域技术人员可以理解，图9中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图9对手机的各个构成部件进行具体的介绍：

RF电路914可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器980处理；另外，将设计上行的数据发送给基站。通常，RF电路914包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器（英文全称：LowNoise Amplifier，英文简称：LNA）、双工器等。此外，RF电路914还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统（英文全称：Global System of Mobile communication，英文简称：GSM）、通用分组无线服务（英文全称：General Packet Radio Service，英文简称：GPRS）、码分多址（英文全称：Code Division Multiple Access，英文简称：CDMA）、宽带码分多址（英文全称：Wideband Code Division Multiple Access, 英文简称：WCDMA）、长期演进（英文全称：Long Term Evolution，英文简称：LTE）、电子邮件、短消息服务（英文全称：ShortMessaging Service，英文简称：SMS）等。

存储器920可用于存储软件程序以及模块，处理器980通过运行存储在存储器920的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器920可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序（比如声音播放功能、图像播放功能等）等；存储数据区可存储根据手机的使用所创建的数据（比如音频数据、电话本等）等。此外，存储器920可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元930可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元930可包括触控面板931以及其他输入设备932。触控面板931，也称为触摸屏，可收集用户在其上或附近的触摸操作（比如用户使用手指、触笔等任何适合的物体或附件在触控面板931上或在触控面板931附近的操作），并根据预先设定的程式驱动相应的连接装置。可选的，触控面板931可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器980，并能接收处理器980发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板931。除了触控面板931，输入单元930还可以包括其他输入设备932。具体地，其他输入设备932可以包括但不限于物理键盘、功能键（比如音量控制按键、开关按键等）、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元940可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元940可包括显示面板941，可选的，可以采用液晶显示器（英文全称：LiquidCrystal Display，英文简称：LCD）、有机发光二极管（英文全称：Organic Light-EmittingDiode, 英文简称：OLED）等形式来配置显示面板941。进一步的，触控面板931可覆盖显示面板941，当触控面板931检测到在其上或附近的触摸操作后，传送给处理器980以确定触摸事件的类型，随后处理器980根据触摸事件的类型在显示面板941上提供相应的视觉输出。虽然在图9中，触控面板931与显示面板941是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板931与显示面板941集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器950，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板941的亮度，接近传感器可在手机移动到耳边时，关闭显示面板941和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上（一般为三轴）加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用（比如横竖屏切换、相关游戏、磁力计姿态校准）、振动识别相关功能（比如计步器、敲击）等; 至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路960、扬声器961，传声器962可提供用户与手机之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号，传输到扬声器961，由扬声器961转换为声音信号输出；另一方面，传声器962将收集的声音信号转换为电信号，由音频电路960接收后转换为音频数据，再将音频数据输出处理器980处理后，经RF电路914以发送给比如另一手机，或者将音频数据输出至存储器920以便进一步处理。

Wi-Fi属于短距离无线传输技术，手机通过Wi-Fi模块970可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图9示出了W-iFi模块970，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变申请的本质的范围内而省略。

处理器980是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器920内的软件程序和/或模块，以及调用存储在存储器920内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器980可包括一个或多个处理单元；优选的，处理器980可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器980中。

手机还包括给各个部件供电的电源990（比如电池），电源可以通过电源管理系统与处理器980逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在在本申请实施例中，该手机所包括的处理器980还具有控制执行以上由图5所示的多媒体检测装置1执行的方法流程。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请实施例所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理模块，即可以位于一个地方，或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外，在本申请实施例各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。

所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机计算机程序时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线（例如同轴电缆、光纤、数字用户线（DSL））或无线（例如红外、无线、微波等）方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，（例如，软盘、硬盘、磁带）、光介质（例如，DVD）、或者半导体介质（例如固态硬盘Solid State Disk(SSD)）等。

以上对本申请实施例所提供的技术方案进行了详细介绍，在本申请实施例中应用了具体个例对本申请实施例的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请实施例的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请实施例的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请实施例的限制。

Claims

1.一种多媒体检测方法，其特征在于，所述方法包括：

从所述第一多媒体数据中确定异常数据；

对所述异常数据进行去重，得到第二多媒体数据；

按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果；所述第二检测结果包括所述第二多媒体数据中各多媒体与对应的多个目标引擎的检测信息；

所述对所述第一多媒体数据进行检测得到第一检测结果，包括：

采用所述通用引擎对每一所述多媒体的检测特征信息进行检测，得到第一检测结果；

所述获取所述第二多媒体数据中各多媒体的类型对应的多个目标引擎，包括：

2.根据权利要求1所述的方法，其特征在于，所述从多媒体数据流中获取第一多媒体数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述得到第二检测结果之后，所述方法还包括：

4.根据权利要求1-2任一项所述的方法，其特征在于，所述得到第二检测结果之后，所述方法还包括：

对所述第二检测结果中各所述多媒体对应的多个目标引擎的检测信息进行融合，第三检测结果。

5.根据权利要求4所述的方法，其特征在于，所述对所述第二检测结果中各所述多媒体对应的多个目标引擎的检测信息进行融合，第三检测结果，包括：

6.一种多媒体检测装置，其特征在于，所述装置包括收发模块及处理模块；

所述处理模块，还用于获取所述第二多媒体数据中各多媒体的类型对应的多个目标引擎；按照多媒体类型，通过对应的目标引擎分别对所述第二多媒体数据中的各多媒体进行检测，得到第二检测结果；所述第二检测结果包括所述第二多媒体数据中各多媒体与对应的多个目标引擎的检测信息；

所述处理模块，还用于：获取所述第一多媒体数据中各多媒体的非结构化数据的基础特征信息；根据所述多媒体的基础特征信息确定每一所述多媒体的提取规则；根据所述提取规则从每一所述多媒体的非结构化数据中提取检测特征信息；采用所述通用引擎对每一所述多媒体的检测特征信息进行检测，得到第一检测结果；

所述处理模块，还用于：获取所述第二多媒体数据中各多媒体的非结构化数据的基础特征信息；根据所述多媒体的基础特征信息确定每一所述多媒体的类型；根据所述多媒体的类型确定与每一所述多媒体的类型对应的多个目标引擎。

7.一种多媒体检测装置，其特征在于，所述装置包括：

至少一个处理器、存储器和收发器；

其中，所述存储器用于存储计算机程序，所述处理器用于调用所述存储器中存储的计算机程序来执行如权利要求1-5中任一项所述的方法。

8.一种计算机可读存储介质，其特征在于，其包括指令，当其在计算机上运行时，使得计算机执行如权利要求1-5中任一项所述的方法。