CN111416996B

CN111416996B - 多媒体文件检测方法、播放方法、装置、设备及存储介质

Info

Publication number: CN111416996B
Application number: CN202010221988.XA
Authority: CN
Inventors: 田植良
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2021-06-22
Anticipated expiration: 2040-03-26
Also published as: CN111416996A

Abstract

本申请公开了一种多媒体文件检测方法、播放方法、装置、设备及存储介质，属于视频处理技术领域。该方法包括：响应于播放指令，确定播放指令指示的目标多媒体文件，在目标多媒体文件中，确定至少一个目标片段，在播放目标多媒体文件的过程中，跳过至少一个目标片段。本申请实施例中，考虑了参考用户在观看多媒体文件时基于内容的不同会有不同的操作行为，因此，可以基于对片段的历史操作行为，预测出片段为不符合内容条件的片段的可能性，从而检测出目标多媒体文件中至少一个目标片段，进而在播放时跳过该目标片段，实现了对多媒体文件的自动化检测，提高了检测效率，达到了播放时跳过不符合内容条件的片段的效果。

Description

多媒体文件检测方法、播放方法、装置、设备及存储介质

技术领域

本申请涉及视频处理技术领域，特别涉及一种多媒体文件检测方法、播放方法、装置、设备及存储介质。

背景技术

随着互联网的不断发展，人们可以通过互联网发布多媒体文件，该多媒体文件可以为视频。但是，个别用户或平台却利用互联网发布不合规的多媒体文件，例如，不雅视频。不合规的多媒体文件的传播，严重影响了互联网的秩序。为净化互联网环境，需要对多媒体文件进行检测，检测出多媒体文件中不合规的片段，为用户播放删除后的多媒体文件，从而达到净化互联网环境的目的。

目前，多媒体文件检测方法通常为：多媒体平台可以有审核人员，可以通过观看多媒体文件的方式，来对多媒体文件的内容进行人工审核，确定出包含不合规内容的多媒体文件，以便对多媒体文件进行拒绝发布等处理。

上述技术中通过人为审核的方式来对多媒体文件进行检测，人力成本高，多媒体文件检测效率低。

发明内容

本申请实施例提供了一种多媒体文件检测方法、播放方法、装置、设备及存储介质，能够降低人力成本，提升多媒体文件的处理效率。所述多媒体文件检测方法、播放方法、装置、设备及存储介质的技术方案如下：

一方面，提供了一种多媒体文件播放方法，所述方法包括：

响应于播放指令，确定所述播放指令指示的目标多媒体文件；

在所述目标多媒体文件中，确定至少一个目标片段，所述目标片段为基于所述目标多媒体文件的历史操作行为信息所确定的不符合内容条件的片段；

在播放所述目标多媒体文件的过程中，跳过所述至少一个目标片段。

一方面，提供了一种多媒体文件检测方法，所述方法包括：

获取目标多媒体文件的历史操作行为信息，所述历史操作行为信息用于表示至少一个参考用户在播放所述目标多媒体文件的至少一个片段时所执行的操作行为；

根据所述历史操作行为信息，获取所述至少一个片段对应的历史操作特征，所述历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况；

基于所述至少一个片段对应的历史操作特征，确定所述目标多媒体文件中至少一个目标片段，所述目标片段为不符合内容条件的概率大于目标概率的片段。

在一种可能实现方式中，所述第一卷积神经网络的确定过程包括：

获取样本操作特征和所述样本操作特征的片段标签；

基于所述样本操作特征和所述片段标签，进行模型训练，得到所述第一卷积神经网络。

在一种可能实现方式中，所述第二卷积神经网络的确定过程包括：

获取样本操作特征、所述样本操作特征所对应的样本片段和所述样本片段的片段标签；

基于所述样本操作特征、所述样本片段和所述片段标签，进行模型训练，得到所述第二卷积神经网络。

一方面，提供了一种多媒体文件播放装置，所述装置包括：

响应模块，用于响应于播放指令，确定所述播放指令指示的目标多媒体文件；

确定模块，用于在所述目标多媒体文件中，确定至少一个目标片段，所述目标片段为基于所述目标多媒体文件的历史操作行为信息所确定的不符合内容条件的片段；

播放模块，用于在播放所述目标多媒体文件的过程中，跳过所述至少一个目标片段。

在一种可能实现方式中，所述确定模块，用于：

向服务器发送播放请求，所述播放请求携带所述目标多媒体文件的文件标识，接收所述至少一个目标片段的片段标识；或，

从目标存储空间中获取所述目标多媒体文件的至少一个目标片段的片段标识。

在一种可能实现方式中，所述播放模块，用于：

在播放所述目标多媒体文件的过程中，检测待播放的片段的片段标识，若所述至少一个目标片段的片段标识中包括所述片段的片段标识，则播放所述片段，若所述至少一个目标片段的片段标识中不包括所述片段的片段标识，则跳过所述片段。

一方面，提供了一种多媒体文件检测装置，所述装置包括：

行为信息获取模块，用于获取目标多媒体文件的历史操作行为信息，所述历史操作行为信息用于表示至少一个参考用户在播放所述目标多媒体文件的至少一个片段时所执行的操作行为；

操作特征获取模块，用于根据所述历史操作行为信息，获取所述至少一个片段对应的历史操作特征，所述历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况；

确定模块，用于基于所述至少一个片段对应的历史操作特征，确定所述目标多媒体文件中至少一个目标片段，所述目标片段为不符合内容条件的概率大于目标概率的片段。

在一种可能实现方式中，所述装置还包括执行模块，用于：

接收终端发送的播放请求，执行目标多媒体文件的检测步骤，所述播放请求携带所述目标多媒体文件的文件标识。

在一种可能实现方式中，所述确定模块，用于：

将所述至少一个片段对应的历史操作特征输入第一卷积神经网络，通过所述第一卷积神经网络根据所述历史操作特征对所述至少一个片段进行预测，得到所述至少一个片段不符合内容条件的概率。

在一种可能实现方式中，所述确定模块，用于：

通过所述第一卷积神经网络的融合层将所述历史操作特征分别与对应的权重相乘，将得到的特征进行拼接，得到目标操作特征；

将所述目标操作特征输入所述第一卷积神经网络的全连接层，得到所述历史操作特征的类型特征；

基于所述类型特征，得到所述至少一个片段不符合内容条件的概率。

在一种可能实现方式中，所述确定模块，用于：

获取样本操作特征和所述样本操作特征的片段标签；

在一种可能实现方式中，所述确定模块，用于：

基于所述至少一个片段和所述至少一个片段对应的历史操作特征，确定所述目标多媒体文件中至少一个片段不符合内容条件的概率。

在一种可能实现方式中，所述确定模块，用于：

将所述至少一个片段和所述至少一个片段对应的历史操作特征输入第二卷积神经网络，通过所述第二卷积神经网络根据所述至少一个片段的片段内容和所述至少一个片段对应的历史操作特征，对所述至少一个片段进行预测，得到所述至少一个片段不符合内容条件的概率。

在一种可能实现方式中，所述确定模块，用于：

通过所述第二卷积神经网络的特征提取层，对所述至少一个片段进行特征提取，得到所述至少一个片段的视频内容特征；

通过所述第二卷积神经网络的融合层将所述至少一个片段对应的历史操作特征分别与对应的权重相乘，将得到的特征进行拼接，得到目标操作特征；

将所述目标操作特征输入所述第二卷积神经网络的第一全连接层，得到所述历史操作特征的第一类型特征；

将所述第一类型特征和所述至少一个片段的视频内容特征进行拼接，得到视频特征，将所述视频特征输入所述第二卷积神经网络的第二全连接层，得到第二类型特征；

基于所述第二类型特征，得到所述至少一个片段不符合内容条件的概率。

在一种可能实现方式中，所述确定模块，用于：

在一种可能实现方式中，所述行为信息获取模块，用于：

基于所述目标多媒体文件的文件标识，在用户行为记录中查询，得到至少一个参考用户在播放所述目标多媒体文件时的历史操作行为信息。

一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现上述的多媒体文件检测方法、播放方法所执行的操作。

一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现上述的多媒体文件检测方法、播放方法所执行的操作。

本申请实施例提供的技术方案，考虑了参考用户在观看多媒体文件时基于内容的不同会有不同的操作行为，因此，可以基于对片段的历史操作行为，预测出片段为不符合内容条件的片段的可能性，从而检测出目标多媒体文件中至少一个目标片段，进而在播放时跳过该目标片段，实现对多媒体文件的自动化检测，提高了检测效率，达到了播放时跳过不符合内容条件的片段的效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种多媒体文件检测方法的实施环境示意图；

图2是本申请实施例提供的一种多媒体文件检测方法的流程图；

图3是本申请实施例提供的一种第一卷积神经网络的示意图；

图4是本申请实施例提供的一种多媒体文件检测方法的流程图；

图5是本申请实施例提供的一种第二卷积神经网络的示意图；

图6是本申请实施例提供的一种多媒体文件播放方法的流程图；

图7是本申请实施例提供的一种多媒体文件播放方法的流程图；

图8是本申请实施例提供的一种多媒体文件播放方法的流程图；

图9是本申请实施例提供的一种多媒体文件播放方法的流程图；

图10是本申请实施例提供的一种多媒体文件检测装置的结构示意图；

图11是本申请实施例提供的一种多媒体文件播放装置的结构示意图；

图12是本申请实施例提供的一种终端的结构示意图；

图13是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

图1是本申请实施例提供的一种多媒体文件检测方法的实施环境示意图，参见图1，该实施环境中可以包括终端101和服务器102。

终端101通过无线网络或有线网络与服务器102相连。终端101可以是智能手机、平板电脑、智能电视、台式计算机，车载计算机以及便携计算机等设备。终端101安装和运行有支持多媒体文件分享的应用程序。

可选地，服务器102可以为一台服务器、也可以为多台服务器、云计算平台或虚拟化中心等。服务器102用于提供多媒体文件分享有关的后台服务。

终端101可以泛指多个终端中的一个，本申请实施例仅以终端101来举例说明。

本领域技术人员可以知晓，上述终端的数量可以更多或更少。比如上述终端可以仅为一个，或者上述终端为几十个或几百个，或者更多数量，此时上述实施环境中还包括其他终端。本申请实施例对终端的数量和设备类型不加以限定。

在一种可能实现方式中，本申请实施例提供的多媒体文件检测过程可以由终端在需要播放目标多媒体文件时触发，下面以一个播放场景为例对该应用场景进行介绍：

终端可以在应用程序界面上显示有目标多媒体文件的播放选项，当用户想要进行播放时，可以对该播放选项实施点击操作，以触发终端向服务器发送播放请求，服务器接收到该播放请求后，会响应于该播放请求，执行本申请实施例提供的目标多媒体文件的检测步骤，以确定出目标多媒体文件中的目标片段，该目标片段为不符合内容条件的片段，从而可以控制终端在播放该目标多媒体文件的过程中，可以跳过目标片段，仅播放目标多媒体文件中不属于目标片段的片段，从而实现对目标多媒体文件的删减。

在一种可能实现方式中，本申请实施例提供的多媒体文件的检测过程可以时服务器定期进行，下面一个播放场景为例对该应用场景进行介绍：

服务器可以定期对服务器上已发布的多媒体文件执行本申请实施例提供的多媒体文件的检测步骤，以确定出多媒体文件中的目标片段，该目标片段为不符合内容条件的片段，并将目标片段记录下来，以便在接收到任一终端对多媒体文件的播放请求时，可以控制终端在播放该目标多媒体文件的过程中，跳过目标片段，仅播放目标多媒体文件中不属于目标片段的片段，从而实现对目标多媒体文件的删减。

而基于上述的可能应用场景，基于目标多媒体文件是在线播放还是离线播放的不同，在其播放过程中还可以具有不同的处理过程，例如，对于在线播放的目标多媒体文件来说，终端在缓存目标多媒体文件的数据时，可以仅缓存除目标片段以外的片段，进而在播放时就会实现跳过目标片段的效果，而对于离线播放的目标多媒体文件来说，终端已经缓存有目标多媒体文件的多个片段，其中包括有目标片段，则在播放时，可以不对目标片段进行解析，而仅解析除目标片段以外的片段，也能够实现跳过目标片段的效果。其具体处理方式在后续的实施例中会进行详细描述。

在本申请实施例中，可以由服务器或终端作为执行主体来实施本申请实施例提供的技术方案，也可以通过终端和服务器之间的交互来实施本申请提供的技术方法，本申请实施例对此不作限定。下面将以执行主体为服务器为例对多媒体文件检测方法进行说明。图2是本申请实施例提供的一种多媒体文件检测方法的流程图。该实施例以执行主体为服务器为例进行说明，参见图2，该实施例包括：

201、服务器获取目标多媒体文件的历史操作行为信息，历史操作行为信息用于表示至少一个参考用户在播放目标多媒体文件的至少一个片段时所执行的操作行为。

在本申请实施例中，目标多媒体文件可以为多种类型，例如视频、图片、音频等。一个目标多媒体文件可以包含多个片段，各个片段的片段时长相同，例如，每个片段可以为5s。每个片段可以用片段标识来标识。历史操作行为信息可以包括操作行为的操作标识和时间戳，操作行为可以包括音量调大、音量调小、从不使用耳机变为使用耳机、从使用耳机变为不使用耳机、从本片段开始加速、从本片段开始快进、本片段被反复观看等，该时间戳用于表示操作行为发生的时间。参考用户是指历史时间段内播放过该目标多媒体文件的用户，基于参考用户的操作行为可以一定程度上反映目标多媒体文件的内容，因此，通过在步骤201中对参考用户的数据进行收集，可以为后续对目标多媒体文件进行检测提供数据基础。

在一种可能实现方式中，上述步骤201可以是在服务器接收到终端发送的播放请求后，响应于该播放请求来进行目标多媒体文件的检测步骤。可选的，该播放请求可以携带有目标多媒体文件的文件标识，服务器根据该文件标识，可以获取到目标多媒体文件，并根据目标多媒体文件的文件标识，在用户行为记录中查询，得到目标多媒体文件的历史操作行为信息，再进行后续历史操作特征确定过程。

其中，用户行为记录可以基于用户所进行的操作行为来生成。例如，终端可以在多媒体文件的播放过程中，检测用户对多媒体文件进行的操作行为，得到操作行为信息，将该操作行为信息发送至服务器，则服务器将该操作行为信息记录在用户行为记录中。

202、服务器根据历史操作行为信息，获取至少一个片段对应的历史操作特征，历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况。

在本申请实施例中，历史操作特征可以基于对历史操作行为信息的统计和分析确定。在一种可能实现方式中，服务器获取到至少一个片段对应的历史操作行为信息后，基于该历史操作行为信息，可以确定出在播放目标多媒体文件的至少一个片段时发生每一类操作行为的频率，进而得到该片段对应的操作行为的频率描述信息，根据该频率描述信息，可以确定出至少一个片段的历史操作特征。需要说明的是，在确定上述片段的历史操作特征时，可以一个片段一个片段的串行确定，还可以是多个片段并行确定，本申请实施例对此不作限定。

对于上述如何得到频率描述信息的过程，可以采用下述步骤实现：对于目标多媒体文件中播放任一个片段所发生的每一类操作行为，统计执行了该操作行为的参考用户数量，基于该类操作行为的参考用户数量与参考用户总数量，得到该类操作行为的参考用户数量占参考用户总数量的比例，作为该类操作行为的频率。根据该类操作行为的频率，将该频率映射至该频率对应的数值区间，基于数值区间，以及数值区间与频率描述信息的对应关系，可以确定出该类操作行为的频率描述信息，对于每个片段，基于该片段对应的各类操作行为的频率描述信息，生成该片段的各个历史操作特征。需要说明的是，历史操作特征的表现形式可以为向量。

本申请实施例对数值区间的划分以及频率描述信息的划分不作限定。可选的，技术人员可以预先设定各个频率描述信息对应的数值区间，并根据实际情况对该数值区间进行调整。例如，数值区间与频率描述信息的对应关系可以为表格的表现形式，如表1所示,表1中P表示频率。

表1

数值区间	频率描述信息
		P＞20％	极高频
10％＜P≤20％	高频
		3％＜P≤10％	中频
1％＜P≤3％	低频
		P≤0.1％	极低频

其中，对于每个片段，生成该片段的历史操作特征的过程可以包括：将一个片段的各类操作行为的频率描述信息分别转换为对应数值，得到各类操作行为的频率描述信息对应的向量形式的历史操作特征。可选的，向量中可以包括与操作行为对应的元素，操作行为可以对应不同的数值，如音量调大、音量调小、从不使用耳机变为使用耳机、从使用耳机变为不使用耳机、从本片段开始加速、从本片段开始快进、本片段被反复观看可以依次对应数值10、11、12、13、14、15、16。频率描述信息可以对应不同的数值，如极高频、高频、中频、低频、极低频可以依次对应数值5、4、3、2、1。

例如，目标多媒体文件的某一片段对应于两类操作行为，一类操作行为可以为音量调大操作行为，其对应的参考用户数量可以为10，另一类操作行为可以为从本片段开始快进，其对应的参考用户数量可以为20。对于该片段来说，参考用户总数量可以为50，则经过计算可以得到音量调大操作行为的频率P为10/50＝20％，其对应的数值区间为10％＜P≤20％，而从本片段开始快进操作行为的频率P为20/50＝40％，其对应的数值区间为P≥20％，根据表1中的对应关系，可以得到音量调大操作行为的频率描述信息为高频，从本片段开始快进操作行为的频率描述信息为极高频，则该片段的历史操作特征包括音量调大-高频和从本片段开始快进-极高频，其具体向量标识可以为向量(10，4)和(15，5)，向量(10，4)中10表示音量调大操作行为，4表示音量调大操作行为的频率描述信息为高频。

203、服务器基于至少一个片段对应的历史操作特征，确定目标多媒体文件中至少一个目标片段，目标片段为不符合内容条件的概率大于目标概率的片段。

在本申请实施例中，不符合内容条件的概率是指包含有指定内容的概率，例如，包含有敏感内容的概率。目标概率可以为技术人员预设的固定概率，如50％，当概率大于50％时，确定该片段为不符合内容条件的片段。

在一种可能实现方式中，服务器可以基于卷积神经网络(Convolutional NeuralNetworks,CNN)来对历史操作特征进行预测，以获知片段不符合内容条件的概率，进而确定出目标多媒体文件中至少一个目标片段，也即是，对于目标多媒体文件的每个片段，服务器可以将该片段对应的历史操作特征输入第一卷积神经网络，通过第一卷积神经网络根据该片段对应的历史操作特征对该片段进行预测，得到该片段不符合内容条件的概率，当该概率大于目标概率时，将该片段确定为目标片段，从而得到目标多媒体文件中至少一个目标片段。

其中，第一卷积神经网络是指基于历史操作特征进行预测的卷积神经网络，第一卷积神经网络可以包括输入层、融合层、全连接层及输出层。卷积神经网络是一类包含卷积计算且具有深度结构的神经网络。输入层可以对输入特征进行去均值、归一化等预处理，使输入特征标准化。融合层包括每个输入特征对应的权重参数，可以基于该权重参数对输入特征进行进一步处理。全连接层可以对输入特征进行非线性组合以得到输出特征。输出层的上一层通常为全连接层，输出层可以基于连接层的输出特征，输出分类结果，该分类结果可以为不符合内容条件的概率。

相应的，上述服务器基于第一卷积神经网络确定片段不符合内容条件的概率的具体过程可以包括：对于目标多媒体文件的每个片段，服务器将该片段对应的历史操作特征输入第一卷积神经网络的输入层后，输入层可以对该历史操作特征进行去均值预处理或归一化预处理。通过第一卷积神经网络的融合层将该历史操作特征分别与对应的权重相乘，得到相乘后的特征，将得到的特征进行拼接，得到目标操作特征。将目标操作特征输入第一卷积神经网络的全连接层，全连接层基于目标操作特征和全连接层的参数，进行非线性组合，得到至少一个历史操作特征的类型特征，该类型特征可以为向量的形式。第一卷积神经网络的输出层可以基于连接层的类型特征，使用逻辑函数将类型特征进行转化，得到至少一个片段不符合内容条件的概率。

例如，一个片段可以对应有N个历史操作特征，分别为历史操作特征1、历史操作特征2……历史操作特征N。如图3所示，图3为本申请实施例提供的一种第一卷积神经网络的示意图，第一卷积神经网络可以包括输入层301、融合层302、全连接层303及输出层304。在输入层301输入该片段的历史操作特征，对输入的历史操作特征进行去均值、归一化等预处理，再通过融合层302将N个历史操作特征与其对应的权重相乘，得到相乘后的N个特征，将相乘后的N个特征拼接，得到拼接后的特征。将拼接后的特征输入全连接层303，全连接层303根据历史操作特征进行分类，输出类型特征。输出层304将类型特征转化为概率的形式，得到片段的分类结果，进而得到片段不符合内容条件的概率。其中，N为正整数，且N大于1。

上述第一卷积神经网络可以事先通过训练得到。在一种可能实现方式中，技术人员可以通过人工标注的方式，标注出多个多媒体文件中不符合内容条件的片段，得到每个片段的片段标签。将该多个多媒体文件的至少一个片段对应的历史操作特征作为样本操作特征，服务器可以获取到样本操作特征和样本操作特征的片段标签，基于样本操作特征和片段标签，进行模型训练，可以得到第一卷积神经网络。

其中，样本操作特征可以为任一片段的至少一个历史操作特征，片段标签用于表示片段是否为不符合内容条件的片段。具体的，上述第一卷积神经网络的训练过程可以包括：在第一次迭代过程中，将样本操作特征，输入初始模型，得到第一次迭代过程的分类结果。基于第一次迭代过程的分类结果与片段标签，确定损失函数，基于损失函数，对初始模型中的模型参数进行调整。将第一次迭代调整后的模型参数作为第二次迭代的模型参数，再进行第二次迭代。重复多次上述迭代过程，在第N次过程中，以第N-1次迭代调整后的模型参数作为新的模型参数，进行模型训练，直到训练满足目标条件，则将满足目标条件的迭代过程所对应的模型获取为第一卷积神经网络。其中，模型参数包括融合层的权重参数以及全连接层的各个参数。可选的，训练满足的目标条件可以为初始模型的训练迭代次数达到目标次数，技术人员可以预先设定训练迭代次数。或者，训练满足的目标条件可以为损失值满足目标阈值条件，如损失值小于0.00001。本申请实施例对此不作限定。

本申请实施例提供的技术方案，考虑了参考用户在观看多媒体文件时基于内容的不同会有不同的操作行为，因此，可以基于对片段的历史操作行为，预测出片段为不符合内容条件的片段的可能性，从而检测出目标多媒体文件中不符合内容条件的片段，可以实现对多媒体文件的自动化检测，提高了检测效率。

图4是本申请实施例提供的一种多媒体文件检测方法的流程图。该实施例仅以服务器为执行主体进行说明，参见图4，该实施例包括：

401、服务器获取目标多媒体文件的至少一个片段。

在本申请实施例中，目标多媒体文件可以为多种类型，例如视频、图片、音频等。一个目标多媒体文件可以包含多个片段，各个片段的片段时长相同，例如，每个片段可以为5s。每个片段可以用片段标识来标识。

在一种可能实现方式中，上述服务器获取至少一个片段的过程可以包括：服务器接收到终端发送的播放请求后，响应于该播放请求来进行目标多媒体文件的检测步骤。可选的，该播放请求携带有目标多媒体文件的文件标识，服务器根据该文件标识，可以获取到目标多媒体文件，对目标多媒体文件进行分割处理，可以得到目标多媒体文件的至少一个片段。

402、服务器获取目标多媒体文件的历史操作行为信息，历史操作行为信息用于表示至少一个参考用户在播放目标多媒体文件的至少一个片段时所执行的操作行为。

403、服务器根据历史操作行为信息，获取至少一个片段对应的历史操作特征，历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况。

步骤402至步骤403与上述步骤201至步骤202同理，在此不多做赘述。

404、服务器基于至少一个片段和至少一个片段对应的历史操作特征，确定目标多媒体文件中至少一个目标片段，目标片段为不符合内容条件的概率大于目标概率的片段。

在一种可能实现方式中，服务器可以基于卷积神经网络来对片段和历史操作特征进行预测，以获知片段不符合内容条件的概率，进而确定出目标多媒体文件中至少一个目标片段，也即是，对于目标多媒体文件的每个片段，服务器可以将该片段和该片段对应的历史操作特征输入第二卷积神经网络，通过第二卷积神经网络根据该片段的片段内容和该片段对应的历史操作特征，对该片段进行预测，得到该片段不符合内容条件的概率，当该概率大于目标概率时，将该片段确定为目标片段，从而得到目标多媒体文件中至少一个目标片段。

其中，第二卷积神经网络是指基于片段和历史操作特征进行预测的卷积神经网络，第二卷积神经网络可以包括输入层、特征提取层、融合层、全连接层及输出层。卷积神经网络是一类包含卷积计算且具有深度结构的神经网络。输入层可以对输入特征进行去均值、归一化等预处理，使输入特征标准化。特征提取层用于提取视频内容特征。融合层包括每个输入特征对应的权重参数，可以基于该权重参数对输入特征进行进一步处理。全连接层可以对输入特征进行非线性组合以得到输出特征。输出层的上一层通常为全连接层，输出层可以基于连接层的输出特征，输出分类结果，该分类结果可以为不符合内容条件的概率。

相应的，步骤404的具体过程可以包括下述步骤：

404A、对于目标多媒体文件的每个片段，服务器将该片段和该片段对应的历史操作特征输入第二卷积神经网络后，通过第二卷积神经网络的特征提取层，对该片段进行特征提取，得到该片段的视频内容特征，视频内容特征为用于表示片段的视频内容的特征向量。

404B、通过第二卷积神经网络的融合层将该片段对应的历史操作特征分别与对应的权重相乘，将得到的特征进行拼接，得到目标操作特征，将目标操作特征输入第二卷积神经网络的第一全连接层，得到该历史操作特征的第一类型特征，该第一类型特征可以为向量的形式。

404C、将第一类型特征和至少一个片段的视频内容特征进行拼接，得到视频特征，将视频特征输入第二卷积神经网络的第二全连接层，得到第二类型特征，该第二类型特征可以为向量的形式。

404D、通过第二卷积神经网络的输出层，可以基于连接层的类型特征，使用逻辑函数将类型特征进行转化，得到该片段不符合内容条件的概率。

405E、当该片段不符合内容条件的概率大于目标概率时，将该片段确定为目标片段，从而得到目标多媒体文件中至少一个目标片段。

例如，一个片段可以对应有N个历史操作特征，分别为历史操作特征1、历史操作特征2……历史操作特征N。如图5所示，图5为本申请实施例提供的一种第二卷积神经网络的示意图，第二卷积神经网络可以包括输入层501、特征提取层502、融合层503、第一全连接层504、第二全连接层505及输出层506。首先，在输入层501分别输入一个片段，以及该片段对应历史操作特征。然后，该片段通过特征提取层502，也即是3D-CNN，得到该片段的视频内容特征。同时，该片段的N个历史操作特征通过融合层503将历史操作特征与其对应的权重相乘，得到相乘后的N个特征，将相乘后的N个特征拼接，得到拼接后的特征，再将拼接后的特征输入第一全连接层504，第一全连接层504根据历史操作特征进行分类，输出第一类型特征。最后，该片段的视频内容特征和第一类型特征进行拼接，将拼接后的向量作为第二全连接层505的输入，则第二全连接层505根据历史操作特征和视频片段的视频内容特征进行分类，输出第二类型特征，输出层506将第二类型特征转化为概率的形式，得到片段的分类结果，进而得到片段不符合内容条件的概率。其中，N为正整数，且N大于1。

上述第二卷积神经网络可以事先通过训练得到。在一种可能实现方式中，技术人员可以通过人工标注的方式，标注出多个多媒体文件中不符合内容条件的片段，得到每个片段的片段标签。将该多个多媒体文件的至少一个片段对应的历史操作特征作为样本操作特征，将该多个多媒体文件中至少一个片段作为样本片段。服务器可以获取到样本操作特征、样本操作特征所对应的样本片段和样本片段的片段标签，基于样本操作特征、样本片段和片段标签，进行模型训练，得到第二卷积神经网络。其中，样本操作特征可以为任一片段的至少一个历史操作特征，片段标签用于表示片段是否为不符合内容条件的片段。具体的，上述第二卷积神经网络的训练过程可以包括：在第一次迭代过程中，将样本片段及样本片段对应的样本操作特征，输入初始模型，得到第一次迭代过程的分类结果。基于第一次迭代过程的分类结果与片段标签，确定损失函数，基于损失函数，对初始模型中的模型参数进行调整。将第一次迭代调整后的模型参数作为第二次迭代的模型参数，再进行第二次迭代。重复多次上述迭代过程，在第N次过程中，以第N-1次迭代调整后的模型参数作为新的模型参数，进行模型训练，直到训练满足目标条件，则将满足目标条件的迭代过程所对应的模型获取为第二卷积神经网络。其中，模型参数包括融合层的权重参数以及全连接层的各个参数。N为正整数，且N大于1。可选的，训练满足的目标条件可以为初始模型的训练迭代次数达到目标次数，技术人员可以预先设定训练迭代次数。或者，训练满足的目标条件可以为损失值满足目标阈值条件，如损失值小于0.00001。本申请实施例对此不作限定。

图6是本申请实施例提供的一种多媒体文件播放方法的流程图。该实施例以终端为执行主体进行说明，参见图6，该实施例包括：

601、终端响应于播放指令，确定播放指令指示的目标多媒体文件。

602、终端在目标多媒体文件中，确定至少一个目标片段，目标片段为基于目标多媒体文件的历史操作行为信息所确定的不符合内容条件的片段。

603、终端在播放目标多媒体文件的过程中，跳过至少一个目标片段。

本申请实施例提供的技术方案，终端在播放目标多媒体文件时，可以先确定出目标多媒体文件中不符合内容条件的至少一个目标片段，在播放目标多媒体文件时，跳过该至少一个目标片段，进而达到跳过不符合内容条件的片段的效果，能够有效避免不符合内容条件的片段的传播，起到了净化互联网环境的作用。

在一种可能实现方式中，目标多媒体资源可以为在线播放的多媒体资源，下面以目标多媒体文件在线播放为例，对多媒体文件播放方法进行说明。图7是本申请实施例提供的一种多媒体文件播放方法的流程图。参见图7，该实施例包括：

701、终端响应于播放指令，确定该播放指令指示的目标多媒体文件。

在一种可能实现方式中，当用户想要播放目标多媒体文件时，可以在应用程序界面上点击目标多媒体文件的播放选项，触发播放指令，终端接收到该播放指令后，根据该播放指令，可以确定目标多媒体文件。

702、终端向服务器发送播放请求，该播放请求携带目标多媒体文件的文件标识。

在一种可能实现方式中，终端确定目标多媒体文件后，可以根据目标多媒体文件的文件标识，生成携带有目标多媒体文件的文件标识的播放请求，向服务器发送该播放请求。

703、服务器接收到该播放请求，基于该目标多媒体文件的历史操作行为信息，确定该目标多媒体文件的至少一个目标片段。

在一种可能实现方式中，服务器接收到播放请求后，触发执行步骤201至步骤203或步骤401至步骤404的目标多媒体文件的检测步骤。具体的，根据该播放请求中携带的文件标识，可以确定目标多媒体文件，以及目标多媒体文件的历史操作行为信息，再利用本申请实施例提供的多媒体文件检测方法，可以确定出目标多媒体文件的至少一个目标片段，该目标片段为不符合内容条件的片段。

704、服务器向终端发送该目标多媒体文件中除该至少一个目标片段以外的片段。

在一种可能实现方式中，服务器确定出目标多媒体文件的至少一个目标片段后，可以向终端发送该目标多媒体文件中除该至少一个目标片段以外的片段，再进行后续终端缓存并播放的操作。

705、终端响应于播放请求，对接收到的片段进行播放。

在一种可能实现方式中，终端接收到该目标多媒体文件中除该至少一个目标片段以外的片段后，缓存并播放除该至少一个目标片段以外的片段，进而在播放时可以产生跳过目标片段的效果。

在本申请实施例中，由于终端对目标多媒体文件在线播放，可以实时获取目标多媒体文件的播放数据，因此，终端在接收到该播放指令后，可以先由服务器确定目标多媒体文件中的至少一个目标片段，再向终端发送除该至少一个目标片段以外的片段，不向终端发送该至少一个目标片段，则终端就不会播放目标片段，进而在终端播放目标多媒体文件时可以体现一种跳过目标片段的效果。

上述步骤701至步骤705中，以目标多媒体文件实时播放、实时检测为例进行说明。在另一种可能实现方式中，服务器可以提前对目标多媒体文件进行多媒体文件检测，以确定出该目标多媒体文件中的至少一个目标片段，并将至少一个目标片段的片段标识进行记录。当服务器接收到终端对目标多媒体文件的播放请求后，基于该播放请求中携带的文件标识进行查询，得到目标多媒体文件中的至少一个目标片段的片段标识，服务器根据至少一个目标片段的片段标识，确定出目标多媒体文件的至少一个目标片段，向终端发送该目标多媒体文件中除该至少一个目标片段以外的片段，则终端接收到该目标多媒体文件中除该至少一个目标片段以外的片段后，进行播放，进而在播放时实现跳过目标片段的效果。

上述的提前检测过程可以是指服务器对上传但未发布的多媒体资源，或者，已发布的多媒体资源进行周期性检测。当多媒体文件为上传但未发布的多媒体资源时，服务器进行多媒体文件检测的过程可以包括：服务器在接收到多媒体文件发布请求后，触发执行多媒体文件的检测步骤。

本申请实施例提供的技术方案，终端在线播放目标多媒体文件时，可以由服务器先确定目标多媒体文件中的目标片段，再向终端发送除该至少一个目标片段以外的片段，终端根据该至少一个目标片段以外的片段进行播放，由于服务器不向终端发送目标片段，因此终端无法缓存更无法播放目标片段，进而达到跳过目标片段的效果，能够有效避免不符合内容条件的片段的传播，起到了净化互联网环境的作用。

在一种可能实现方式中，目标多媒体资源可以为离线播放的多媒体资源，下面以目标多媒体文件下载及离线播放的一种情况为例，对多媒体文件播放方法进行说明。图8是本申请实施例提供的一种多媒体文件播放方法的流程图。

参见图8，该实施例包括：

801、终端响应于下载指令，确定下载指令指示的目标多媒体文件。

在一种可能实现方式中，当用户想要下载目标多媒体文件时，可以在应用程序界面上点击目标多媒体文件的下载选项，触发下载指令，终端接收到该下载指令后，根据该下载指令，可以确定目标多媒体文件。

802、终端向服务器发送下载请求，该下载请求携带目标多媒体文件的文件标识。

在一种可能实现方式中，终端确定目标多媒体文件后，可以根据目标多媒体文件的文件标识，生成携带有目标多媒体文件的文件标识的下载请求，向服务器发送该下载请求。

803、服务器接收到该下载请求，基于该目标多媒体文件的历史操作行为信息，确定该目标多媒体文件的至少一个目标片段。

在一种可能实现方式中，服务器接收到下载请求后，触发执行目标多媒体文件的检测步骤。具体的，根据该下载请求中携带的文件标识，可以确定目标多媒体文件，以及目标多媒体文件的历史操作行为信息，再利用本申请实施例提供的多媒体文件检测方法，可以确定出目标多媒体文件的至少一个目标片段，该目标片段为不符合内容条件的片段。

804、服务器向终端发送该目标多媒体文件中除该至少一个目标片段以外的片段。

在一种可能实现方式中，服务器确定出目标多媒体文件的至少一个目标片段后，可以向终端发送该目标多媒体文件中除该至少一个目标片段以外的片段，再进行后续终端下载并存储的操作。

805、终端对接收到的片段进行存储，响应于对该目标多媒体文件的播放指令，基于已存储的片段进行播放。

在一种可能实现方式中，终端接收到该目标多媒体文件中除该至少一个目标片段以外的片段后，将除该至少一个目标片段以外的片段进行存储。当终端接收到对该目标多媒体文件的播放指令后，可以根据该播放指令所指示的目标多媒体文件的文件标识查询，得到除该至少一个目标片段以外的片段，再进行播放，进而在播放时实现跳过目标片段的效果。

在本申请实施例中，由于终端对目标多媒体文件进行下载，可以获取目标多媒体文件的下载数据，因此，终端在接收到该下载指令后，可以先由服务器确定目标多媒体文件中的至少一个目标片段，再向终端发送除该至少一个目标片段以外的片段，不向终端发送该至少一个目标片段，则终端就不会下载目标片段，进而在终端播放目标多媒体文件时可以体现一种跳过目标片段的效果。

本申请实施例提供的技术方案，终端在下载目标多媒体文件时，可以由服务器先确定目标多媒体文件中的目标片段，再向终端发送除该至少一个目标片段以外的片段，终端根据该至少一个目标片段以外的片段进行下载并存储，由于服务器不向终端发送目标片段，因此终端无法下载更无法存储目标片段，进而在播放目标多媒体文件时可以达到跳过目标片段的效果，能够有效避免不符合内容条件的片段的传播，起到了净化互联网环境的作用。

下面以目标多媒体文件下载及离线播放的另一种情况为例，对多媒体文件播放方法进行说明。图9是本申请实施例提供的一种多媒体文件播放方法的流程图。参见图9，该实施例包括：

901、终端对下载到的目标多媒体文件进行存储。

在一种可能实现方式中，终端接收到下载指令后，向服务器发送下载请求，服务器接收到下载请求后，根据该下载请求中携带的文件标识，确定目标多媒体文件，向终端发送该目标多媒体文件，终端接收到该目标多媒体文件后，可以将该目标多媒体文件存储至目标存储空间中，该目标存储空间中可以存储有多个多媒体文件。

902、终端响应于播放指令，向服务器发送目标片段确定请求，该目标片段确定请求携带该目标多媒体文件的文件标识。

在一种可能实现方式中，当终端接收到播放指令后，根据该播放指令，可以确定目标多媒体文件，根据目标多媒体文件的文件标识，生成携带有该目标多媒体文件的文件标识的目标片段确定请求，并向服务器发送目标片段确定请求。

903、服务器响应于该目标片段确定请求，确定该目标多媒体文件的该至少一个目标片段的片段标识。

在一种可能实现方式中，服务器接收到目标片段确定请求后，可以根据该目标片段确定请求中携带的文件标识，确定该目标多媒体文件的该至少一个目标片段的片段标识。

需要说明的是，该确定过程可以是实时对目标多媒体文件检测的过程，还可以是基于目标多媒体文件已经确定好的目标片段的获取过程，本申请实施例对此不作限定。

904、服务器将该至少一个目标片段的片段标识发送给终端。

在一种可能实现方式中，服务器确定出该目标多媒体文件的该至少一个目标片段的片段标识后，向终端发送该至少一个目标片段的片段标识。

需要说明的是，在本申请实施例中，上述至少一个目标片段的片段标识还可以在步骤901下载目标多媒体文件时一并下载到终端并存储至本地的目标存储空间中，相应的，该步骤902至904可以替换为下述步骤：终端响应于播放指令，从终端本地的目标存储空间中获取已存储的该至少一个目标片段的片段标识，以便执行后续的播放过程。

905、终端响应于该播放指令和该至少一个目标片段的片段标识，在播放该目标多媒体文件时，跳过该至少一个目标片段。

在一种可能实现方式中，终端接收到至少一个目标片段的片段标识后，在播放目标多媒体文件时，可以根据该目标多媒体文件的至少一个目标片段的片段标识，在目标多媒体文件中，确定出该至少一个目标片段，在播放时跳过该至少一个目标片段。可选的，终端在播放目标多媒体文件的过程中，可以解析待播放的片段的片段标识，将该待播放的片段的片段标识与至少一个目标片段的片段标识进行对比，若至少一个目标片段的片段标识中不包括片段的片段标识，则解析片段，并进行播放。若至少一个目标片段的片段标识中包括片段的片段标识，则不解析该片段，在播放时达到跳过片段的效果。

本申请实施例提供的技术方案，终端可以下载并存储目标多媒体文件，在播放该目标多媒体文件时，可以根据目标片段的片段标识，解析除至少一个目标片段以外的片段，再进行播放，进而在播放目标多媒体文件时可以达到跳过目标片段的效果，能够有效避免不符合内容条件的片段的传播，起到了净化互联网环境的作用。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

图10是本申请实施例提供的一种多媒体文件检测装置的结构示意图，参见图10，该装置包括：

行为信息获取模块1001，用于获取目标多媒体文件的历史操作行为信息，历史操作行为信息用于表示至少一个参考用户在播放目标多媒体文件的至少一个片段时所执行的操作行为；

操作特征获取模块1002，用于根据历史操作行为信息，获取至少一个片段对应的历史操作特征，历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况；

确定模块1003，用于基于至少一个片段对应的历史操作特征，确定目标多媒体文件中至少一个目标片段，目标片段为不符合内容条件的概率大于目标概率的片段。

在一种可能实现方式中，装置还包括执行模块，用于：

接收终端发送的播放请求，执行目标多媒体文件的检测步骤，播放请求携带目标多媒体文件的文件标识。

在一种可能实现方式中，确定模块1003，用于：

将至少一个片段对应的历史操作特征输入第一卷积神经网络，通过第一卷积神经网络根据至少一个历史操作特征对至少一个片段进行预测，得到至少一个片段不符合内容条件的概率。

在一种可能实现方式中，确定模块1003，用于：

通过第一卷积神经网络的融合层将历史操作特征分别与对应的权重相乘，将得到的特征进行拼接，得到目标操作特征；

将目标操作特征输入第一卷积神经网络的全连接层，得到历史操作特征的类型特征；

基于类型特征，得到至少一个片段不符合内容条件的概率。

在一种可能实现方式中，确定模块1003，用于：

获取样本操作特征和样本操作特征的片段标签；

基于样本操作特征和片段标签，进行模型训练，得到第一卷积神经网络。

在一种可能实现方式中，确定模块1003，用于：

基于至少一个片段和至少一个片段对应的历史操作特征，确定目标多媒体文件中至少一个片段不符合内容条件的概率。

在一种可能实现方式中，确定模块1003，用于：

将至少一个片段和至少一个片段对应的历史操作特征输入第二卷积神经网络，通过第二卷积神经网络根据至少一个片段的片段内容和至少一个片段对应的历史操作特征，对至少一个片段进行预测，得到至少一个片段不符合内容条件的概率。

在一种可能实现方式中，确定模块1003，用于：

通过第二卷积神经网络的特征提取层，对至少一个片段进行特征提取，得到至少一个片段的视频内容特征；

通过第二卷积神经网络的融合层将至少一个片段对应的历史操作特征分别与对应的权重相乘，将得到的特征进行拼接，得到目标操作特征；

将目标操作特征输入第二卷积神经网络的第一全连接层，得到历史操作特征的第一类型特征；

将第一类型特征和至少一个片段的视频内容特征进行拼接，得到视频特征，将视频特征输入第二卷积神经网络的第二全连接层，得到第二类型特征；

基于第二类型特征，得到至少一个片段不符合内容条件的概率。

在一种可能实现方式中，确定模块1003，用于：

获取样本操作特征、样本操作特征所对应的样本片段和样本片段的片段标签；

基于样本操作特征、样本片段和片段标签，进行模型训练，得到第二卷积神经网络。

在一种可能实现方式中，行为信息获取模块1001，用于：

基于目标多媒体文件的文件标识，在用户行为记录中查询，得到至少一个参考用户在播放目标多媒体文件时的历史操作行为信息。

需要说明的是：上述实施例提供的多媒体文件检测装置在多媒体文件检测时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的多媒体文件检测装置与多媒体文件检测方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图11是本申请实施例提供的一种多媒体文件播放装置的结构示意图，参见图11，该装置包括：

响应模块1101，用于响应于播放指令，确定播放指令指示的目标多媒体文件；

确定模块1102，用于在目标多媒体文件中，确定至少一个目标片段，目标片段为基于目标多媒体文件的历史操作行为信息所确定的不符合内容条件的片段；

播放模块1103，用于在播放目标多媒体文件的过程中，跳过至少一个目标片段。

在一种可能实现方式中，确定模块1102，用于：

向服务器发送播放请求，播放请求携带目标多媒体文件的文件标识，接收至少一个目标片段的片段标识；或，

从目标存储空间中获取目标多媒体文件的至少一个目标片段的片段标识。

在一种可能实现方式中，播放模块1103，用于：

在播放目标多媒体文件的过程中，检测待播放的片段的片段标识，若至少一个目标片段的片段标识中包括片段的片段标识，则播放片段，若至少一个目标片段的片段标识中不包括片段的片段标识，则跳过片段。

需要说明的是：上述实施例提供的多媒体文件播放装置在多媒体文件播放时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的多媒体文件处播放装置与多媒体文件播放方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本申请实施例提供的计算机设备，可以提供为一种终端，图12是本申请实施例提供的一种终端的结构示意图。该终端1200可以是：智能手机、平板电脑、MP3播放器(MovingPicture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。终端1200还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端1200包括有：处理器1201和存储器1202。

处理器1201可以包括一个或多个处理核心，比如4核心处理器、12核心处理器等。处理器1201可以采用DSP(Digital Signal Processing，数字信号处理)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)、PLA(Programmable Logic Array，可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU(Central ProcessingUnit，中央处理器)；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器1201可以在集成有GPU(Graphics Processing Unit，图像处理器)，GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器1201还可以包括AI(Artificial Intelligence，人工智能)处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器1202可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器1202中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器1201所执行以实现本申请中方法实施例提供的弹性伸缩服务方法。

在一些实施例中，终端1200还可选包括有：外围设备接口1203和至少一个外围设备。处理器1201、存储器1202和外围设备接口1203之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口1203相连。具体地，外围设备包括：射频电路1204、触摸显示屏1205、摄像头1206、音频电路12012、定位组件1208和电源12012中的至少一种。

外围设备接口1203可被用于将I/O(Input/Output，输入/输出)相关的至少一个外围设备连接到处理器1201和存储器1202。在一些实施例中，处理器1201、存储器1202和外围设备接口1203被集成在同一芯片或电路板上；在一些其他实施例中，处理器1201、存储器1202和外围设备接口1203中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路1204用于接收和发射RF(Radio Frequency，射频)信号，也称电磁信号。射频电路1204通过电磁信号与通信网络以及其他通信设备进行通信。射频电路1204将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路1204包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路1204可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：城域网、各代移动通信网络(2G、3G、4G及12G)、无线局域网和/或WiFi(Wireless Fidelity，无线保真)网络。在一些实施例中，射频电路1204还可以包括NFC(Near Field Communication，近距离无线通信)有关的电路，本申请对此不加以限定。

显示屏1205用于显示UI(User Interface，用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏1205是触摸显示屏时，显示屏1205还具有采集在显示屏1205的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器1201进行处理。此时，显示屏1205还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏1205可以为一个，设置终端1200的前面板；在另一些实施例中，显示屏1205可以为至少两个，分别设置在终端1200的不同表面或呈折叠设计；在再一些实施例中，显示屏1205可以是柔性显示屏，设置在终端1200的弯曲表面上或折叠面上。甚至，显示屏1205还可以设置成非矩形的不规则图形，也即异形屏。显示屏1205可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。

摄像头组件1206用于采集图像或视频。可选地，摄像头组件1206包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality，虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件1206还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路1207可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器1201进行处理，或者输入至射频电路1204以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端1200的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器1201或射频电路1204的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路1207还可以包括耳机插孔。

定位组件1208用于定位终端1200的当前地理位置，以实现导航或LBS(LocationBased Service，基于位置的服务)。定位组件1208可以是基于美国的GPS(GlobalPositioning System，全球定位系统)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。

电源1209用于为终端1200中的各个组件进行供电。电源1209可以是交流电、直流电、一次性电池或可充电电池。当电源1209包括可充电电池时，该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端1200还包括有一个或多个传感器1210。该一个或多个传感器1210包括但不限于：加速度传感器1211、陀螺仪传感器1212、压力传感器1213、指纹传感器1214、光学传感器1215以及接近传感器1216。

加速度传感器1211可以检测以终端1200建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器1211可以用于检测重力加速度在三个坐标轴上的分量。处理器1201可以根据加速度传感器1211采集的重力加速度信号，控制触摸显示屏1206以横向视图或纵向视图进行用户界面的显示。加速度传感器1211还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器1212可以检测终端1200的机体方向及转动角度，陀螺仪传感器1212可以与加速度传感器1211协同采集用户对终端1200的3D动作。处理器1201根据陀螺仪传感器1212采集的数据，可以实现如下功能：动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器1213可以设置在终端1200的侧边框和/或触摸显示屏1206的下层。当压力传感器1213设置在终端1200的侧边框时，可以检测用户对终端1200的握持信号，由处理器1201根据压力传感器1213采集的握持信号进行左右手识别或快捷操作。当压力传感器1213设置在触摸显示屏1205的下层时，由处理器1201根据用户对触摸显示屏1205的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器1214用于采集用户的指纹，由处理器1201根据指纹传感器1214采集到的指纹识别用户的身份，或者，由指纹传感器1214根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器1201授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器1214可以被设置终端1200的正面、背面或侧面。当终端1200上设置有物理按键或厂商Logo时，指纹传感器1214可以与物理按键或厂商Logo集成在一起。

光学传感器1215用于采集环境光强度。在一个实施例中，处理器1201可以根据光学传感器1215采集的环境光强度，控制触摸显示屏1206的显示亮度。具体地，当环境光强度较高时，调高触摸显示屏1206的显示亮度；当环境光强度较低时，调低触摸显示屏1205的显示亮度。在另一个实施例中，处理器1201还可以根据光学传感器1215采集的环境光强度，动态调整摄像头组件1206的拍摄参数。

接近传感器1216，也称距离传感器，通常设置在终端1200的前面板。接近传感器1216用于采集用户与终端1200的正面之间的距离。在一个实施例中，当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变小时，由处理器1201控制触摸显示屏1205从亮屏状态切换为息屏状态；当接近传感器1216检测到用户与终端1200的正面之间的距离逐渐变大时，由处理器1201控制触摸显示屏1205从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图12中示出的结构并不构成对终端1200的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

本申请实施例提供的计算机设备，可以提供为一种服务器，图13是本申请实施例提供的一种服务器的结构示意图，该计算机设备1300可因配置或性能不同而产生比较大的差异，可以包括一个或多个处理器(central processing units，CPU)1301和一个或多个的存储器1302，其中，所述一个或多个存储器1302中存储有至少一条指令，所述至少一条指令由所述一个或多个处理器1301加载并执行以实现上述各个方法实施例提供的方法。当然，该计算机设备1300还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该计算机设备1300还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由终端中的处理器执行以完成上述实施例中多媒体文件检测方法和多媒体文件播放方法。例如，所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的较佳实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种多媒体文件播放方法，其特征在于，所述方法包括：

在所述目标多媒体文件中，确定至少一个目标片段，所述目标片段为基于所述目标多媒体文件的历史操作行为信息所确定的不符合内容条件的片段，所述目标片段基于所述目标多媒体文件的至少一个片段不符合内容条件的概率确定，所述至少一个片段不符合内容条件的概率的确定过程包括：根据所述历史操作行为信息，确定在播放所述目标多媒体文件的至少一个片段时发生每一类操作行为的频率，基于所述每一类操作行为的频率，确定所述每一类操作行为的频率描述信息，根据所述频率描述信息，获取所述至少一个片段对应的历史操作特征，所述历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况，将所述至少一个片段和所述至少一个片段对应的历史操作特征输入第二卷积神经网络，通过所述第二卷积神经网络根据所述至少一个片段的片段内容和所述至少一个片段对应的历史操作特征，对所述至少一个片段进行预测，得到所述至少一个片段不符合内容条件的概率，所述第二卷积神经网络为基于片段内容和对应的历史操作特征进行预测的卷积神经网络；

2.根据权利要求1所述的方法，其特征在于，所述在所述目标多媒体文件中，确定至少一个目标片段包括：

3.根据权利要求1所述的方法，其特征在于，在播放所述目标多媒体文件的过程中，跳过所述至少一个目标片段包括：

在播放所述目标多媒体文件的过程中，检测待播放的片段的片段标识，若所述至少一个目标片段的片段标识中不包括所述片段的片段标识，则播放所述片段，若所述至少一个目标片段的片段标识中包括所述片段的片段标识，则跳过所述片段。

4.一种多媒体文件检测方法，其特征在于，所述方法包括：

根据所述历史操作行为信息，确定在播放所述目标多媒体文件的至少一个片段时发生每一类操作行为的频率，基于所述每一类操作行为的频率，确定所述每一类操作行为的频率描述信息，根据所述频率描述信息，获取所述至少一个片段对应的历史操作特征，所述历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况；

基于所述至少一个片段对应的历史操作特征，确定所述目标多媒体文件中至少一个目标片段，所述目标片段为不符合内容条件的概率大于目标概率的片段，所述至少一个片段不符合内容条件的概率的确定过程包括：将所述至少一个片段和所述至少一个片段对应的历史操作特征输入第二卷积神经网络，通过所述第二卷积神经网络根据所述至少一个片段的片段内容和所述至少一个片段对应的历史操作特征，对所述至少一个片段进行预测，得到所述至少一个片段不符合内容条件的概率，所述第二卷积神经网络为基于片段内容和对应的历史操作特征进行预测的卷积神经网络。

5.根据权利要求4所述的方法，其特征在于，所述获取目标多媒体文件的历史操作行为信息之前，所述方法还包括：

接收终端发送的播放请求，执行所述目标多媒体文件的检测步骤，所述播放请求携带所述目标多媒体文件的文件标识。

6.根据权利要求4所述的方法，其特征在于，所述至少一个片段不符合内容条件的概率的确定过程还包括：

7.根据权利要求6所述的方法，其特征在于，所述通过所述第一卷积神经网络根据所述历史操作特征对所述至少一个片段进行预测，得到所述至少一个片段不符合内容条件的概率，包括：

8.根据权利要求4所述的方法，其特征在于，所述通过所述第二卷积神经网络根据所述至少一个片段的片段内容和所述至少一个片段对应的历史操作特征，对所述至少一个片段进行预测，包括：

9.根据权利要求4所述的方法，其特征在于，所述获取目标多媒体文件的历史操作行为信息，包括：

10.一种多媒体文件播放装置，其特征在于，所述装置包括：

确定模块，用于在所述目标多媒体文件中，确定至少一个目标片段，所述目标片段为基于所述目标多媒体文件的历史操作行为信息所确定的不符合内容条件的片段，所述目标片段基于所述目标多媒体文件的至少一个片段不符合内容条件的概率确定，所述至少一个片段不符合内容条件的概率的确定过程包括：根据所述历史操作行为信息，确定在播放所述目标多媒体文件的至少一个片段时发生每一类操作行为的频率，基于所述每一类操作行为的频率，确定所述每一类操作行为的频率描述信息，根据所述频率描述信息，获取所述至少一个片段对应的历史操作特征，所述历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况，将所述至少一个片段和所述至少一个片段对应的历史操作特征输入第二卷积神经网络，通过所述第二卷积神经网络根据所述至少一个片段的片段内容和所述至少一个片段对应的历史操作特征，对所述至少一个片段进行预测，得到所述至少一个片段不符合内容条件的概率，所述第二卷积神经网络为基于片段内容和对应的历史操作特征进行预测的卷积神经网络；

11.一种多媒体文件检测装置，其特征在于，所述装置包括：

操作特征获取模块，用于根据所述历史操作行为信息，确定在播放所述目标多媒体文件的至少一个片段时发生每一类操作行为的频率，基于所述每一类操作行为的频率，确定所述每一类操作行为的频率描述信息，根据所述频率描述信息，获取所述至少一个片段对应的历史操作特征，所述历史操作特征用于表示播放对应片段时至少一类操作行为的发生情况；

确定模块，用于基于所述至少一个片段对应的历史操作特征，确定所述目标多媒体文件中至少一个目标片段，所述目标片段为不符合内容条件的概率大于目标概率的片段，所述至少一个片段不符合内容条件的概率的确定过程包括：将所述至少一个片段和所述至少一个片段对应的历史操作特征输入第二卷积神经网络，通过所述第二卷积神经网络根据所述至少一个片段的片段内容和所述至少一个片段对应的历史操作特征，对所述至少一个片段进行预测，得到所述至少一个片段不符合内容条件的概率，所述第二卷积神经网络为基于片段内容和对应的历史操作特征进行预测的卷积神经网络。

12.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如权利要求1至权利要求9任一项所述的多媒体文件检测方法、播放方法所执行的操作。

13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有至少一条指令，所述至少一条指令由处理器加载并执行以实现如权利要求1至权利要求9任一项所述的多媒体文件检测方法、播放方法所执行的操作。