CN118138798A

CN118138798A - 视频处理方法、装置、电子设备及可读存储介质

Info

Publication number: CN118138798A
Application number: CN202410256111.2A
Authority: CN
Inventors: 赵瑞书
Original assignee: Beijing IQIYI Science and Technology Co Ltd
Current assignee: Beijing IQIYI Science and Technology Co Ltd
Priority date: 2024-03-06
Filing date: 2024-03-06
Publication date: 2024-06-04

Abstract

本发明实施例提供了一种视频处理方法、装置、电子设备及可读存储介质。该方法包括：对待处理视频进行划分，得到多个待选视频段；对于任一所述待选视频段，获取所述待选视频段的目标评估结果；所述目标评估结果是根据所述待选视频段的精彩度以及用户对所述待选视频段的偏好度确定的；从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，并输出所述特征视频。无需通过人工方式对视频进行截取进行视频推荐，而是通过对待处理视频进行划分，并按照各个待选视频段的目标评估结果选取特征视频，从而提高了视频处理的效率。

Description

视频处理方法、装置、电子设备及可读存储介质

技术领域

本发明涉及视频技术领域，特别是涉及一种视频处理方法、装置、电子设备及可读存储介质。

背景技术

随着视频技术的发展，出现了越来越多的视频平台，使用视频平台进行视频播放的用户越来越多，用户对视频平台的要求也越来越高。目前，为了向用户提供更好的视频服务，大部分视频平台往往会生成短视频为用户进行视频推荐，短视频中的视频内容通常是对用户具有吸引力的内容。

现有技术中，通常是由相关人员从整个长视频中手动截取具有较高吸引力的内容，作为短视频向用户进行视频推荐，但这种处理方式的效率较低。

发明内容

本发明实施例的目的在于提供一种视频处理方法、装置、电子设备及可读存储介质，以实现提高视频处理效率的技术目的。具体技术方案如下：

在本发明实施的第一方面，首先提供了一种视频处理方法，包括：

对待处理视频进行划分，得到多个待选视频段；

对于任一所述待选视频段，获取所述待选视频段的目标评估结果；所述目标评估结果是根据所述待选视频段的精彩度以及用户对所述待选视频段的偏好度确定的；

从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，并输出所述特征视频。

在本发明实施的第二方面，还提供了一种视频处理装置，包括：

划分模块，用于对待处理视频进行划分，得到多个待选视频段；

评估结果获取模块，用于对于任一所述待选视频段，获取所述待选视频段的目标评估结果；所述目标评估结果是根据所述待选视频段的精彩度以及用户对所述待选视频段的偏好度确定的；

第一选取模块，用于从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，并输出所述特征视频。

在本发明实施的第三方面，还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述第一方面所述的方法。

在本发明实施的第四方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面所述的方法。

在本发明实施的第五方面，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得所述计算机执行上述第一方面所述的方法。

本发明实施例提供的视频处理方法，通过对待处理视频进行划分，得到多个待选视频段；对于任一所述待选视频段，获取所述待选视频段的目标评估结果；所述目标评估结果是根据所述待选视频段的精彩度以及用户对所述待选视频段的偏好度确定的；从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，并输出所述特征视频。本发明实施例中，无需通过人工方式对视频进行截取进行视频推荐，而是通过对待处理视频进行划分，并按照各个待选视频段的目标评估结果选取特征视频，从而提高了视频处理的效率。同时，由于目标评估结果是根据待选视频段的精彩度以及用户对其的偏好度确定的，因此目标评估结果可以从视频本身以及用户喜好多维度表征待选视频段的评估结果，提高了对待选视频段进行评估的准确性，保证了视频处理的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例中的一种视频处理方法的步骤流程图；

图2为本发明实施例中的一种视频处理装置的结构示意图；

图3为本发明实施例中的一种电子设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

图1为本发明实施例中的一种视频处理方法的步骤流程图，如图1所示，该方法包括：

步骤101、对待处理视频进行划分，得到多个待选视频段。

步骤102、对于任一所述待选视频段，获取所述待选视频段的目标评估结果；所述目标评估结果是根据所述待选视频段的精彩度以及用户对所述待选视频段的偏好度确定的。

步骤103、从所述多个待选视频段中选取目标评估结果满足预设选取条件的待选视频段，作为所述待处理视频的特征视频，并输出所述特征视频。

本发明实施例可以应用于任一视频平台。其中，上述待处理视频可以是通过接收视频处理请求确定的，视频处理请求中可以携带待处理视频的视频本身或视频标识，从而可以基于视频处理请求直接获取待处理视频，或者基于其携带的视频标识从视频库中获取与视频标识相对应的待处理视频。当然，上述待处理视频也可以是通过接收需求方的视频上传请求确定的，将视频上传请求中所携带的视频确定为待处理视频即可，本发明实施例对待处理视频的确定方式不作限定。

其中，上述步骤101中可以是随机划分的，也可以是按照预设的划分规则进行划分，本发明实施例对此不作限制。例如，可以是按照指定数量对上述待处理视频进行均分，划分为时长相同的多个待选视频段。

其中，上述目标评估结果是根据视频的精彩度以及用户的偏好度确定的，从而目标评估结果可以从视频本身以及用户喜好多个维度表征待选视频段。具体的，精彩度用于表征视频内容的精彩程度，其与视频内容相关。具体的，上述精彩度可以是采用精彩度打分算法为待选视频段生成的，精彩度打分算法可以对待选视频段的每个时间点(例如，1s)均进行精彩度打分，从而可以将待选视频段所有时间点的精彩度打分的均值作为该待选视频段的精彩度，或者也可以选取部分时间点的精彩度打分的均值作为该待选视频段的精彩度，本发明实施例对此不作限制。其中，精彩度的分值可以是0.0～1.0的离散分布。

其中，上述偏好度指的是用户对其的喜好程度，偏好度可以根据该待选视频段的历史播放数据确定。其中，本发明实施例中的用户指的是使用视频平台的所有用户。具体的，历史播放数据指的是视频的统计数据，可以包括用户对待选视频段的历史观看行为以及历史截取数据，其中，历史观看行为可以包括用户对视频平台内每个视频的快进、倍速、重复观看、弹幕数量以及切出等统计数据，历史截取数据可以包括待选视频段的被截取次数。可以理解的，历史观看行为以及历史截取数据均与用户对其的喜好程度强相关，例如，在大量用户对待选视频段进行快进、倍速、切出等负行为时，表明大部分用户对待选视频段的偏好度较低，相应地，在大量用户对待选视频段进行重复观看、弹幕数量较多，或者待选视频段的被截取次数较多时，表明大部分用户对待选视频段的偏好度较高。其中，上述历史播放数据可以通过视频平台的播放日志获取，其中包含了每个视频的播放数据记录。

具体的，可以通过视频平台的不同用户的历史观看行为，对视频平台的用户的观影习惯进行拟合，得到视频平台内每个视频的绿镜分数。该绿镜分数可以是一个在视频时长的基础上，0-100分的连续分数分布。其中分数越高表示观影的行为越正向。进一步地，可以将绿镜分数归一化到0.0～1.0。同时，为了保证分数的均匀分布，可以对分数分布以秒为单位进行统计，最终保证在任何一个分数段内的视频时长是相同的。如0.0～0.1分数段内的视频时长与0.1～0.2分数段内的视频时长相同。对落入相同分数段内的视频，如落入0.0～0.1分数段内的视频，进行分数的平均分配，使所有落入该分数段内的点位的平均数控制在0.05左右。

相应的，历史截取数据可以是以秒为单位的统计数据，通过历史截取数据可以生成截取分数，可以使截取次数最高的点位对应1.0分，截取次数最低的点位对应0.0分，实现归一化。为保证归一化分数均匀分布，因此对截取次数以秒为单位进行统计，最终保证在任何一个分数段内的视频时长是相同的。如0.0～0.1分数段内的视频时长与0.1～0.2分数段内的视频时长相同。如落入0.0～0.1分数段内的视频，进行分数的平均分配，使所有落入该分数段内的点位的平均数控制在0.05左右。

进一步地，可以通过上述绿镜分数以及截取分数得到上述偏好度。具体的，可以直接将绿镜分数以及截取分数的平均值作为偏好度，也可以是分别为绿镜分数、截取分数分配权重，基于所分配的权重对两者进行加权融合得到偏好度，或者，还可以是将两者之和作为偏好度，可以按照实际需求自行设置，本发明实施例对此不作限制。

其中，本发明实施例可以预先对待处理视频的每个时间点分别进行精彩度以及偏好度评估，得到每个时间点对应的评估结果集，从而可以从评估结果集中获取与待选视频段对应的多个时间点的评估结果，生成上述目标评估结果。或者，也可以是在划分操作完成后，先对各待选视频段对应的精彩度以及偏好度进行评估，再基于各待选视频段对应的精彩度以及偏好度生成目标评估结果，本发明实施例对此不作限制。

其中，上述第一条件可以是预先设置的，上述所选取的待选视频段可以为多个，当然也可以为一个，本发明实施例对此不作限制。具体的，经过上述步骤，各个待选视频段的目标评估结果可以表征其精彩度以及偏好度，而精彩度与偏好度越高，表明该段视频内容越精彩，以及对用户的吸引力越大，因此可以设置上述第一条件为目标评估结果不小于目标阈值，或者，可以设置上述第一条件为目标评估结果最大，或者，也可以设置上述第一条件为目标评估结果较高的前40％、50％等，本发明实施例对此不作限制。进一步地，在得到多个待选视频段各自对应的目标评估结果后，本发明实施例可以按照目标评估结果对其进行筛选，选取目标评估结果满足第一条件的待选视频段进行输出。

其中，上述特征视频指的是用于向用户推荐待处理视频的视频，其视频长度通常小于待处理视频的视频长度，可以输出至视频平台的推荐页面或者其他平台用于进行视频推荐。

综上所述，本发明实施例提供的视频处理方法，通过对待处理视频进行划分，得到多个待选视频段；对于任一所述待选视频段，获取所述待选视频段的目标评估结果；所述目标评估结果是根据所述待选视频段的精彩度以及用户对所述待选视频段的偏好度确定的；从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，并输出所述特征视频。本发明实施例中，无需通过人工方式对视频进行截取进行视频推荐，而是通过对待处理视频进行划分，并按照各个待选视频段的目标评估结果选取特征视频，从而提高了视频处理的效率。同时，由于目标评估结果是根据待选视频段的精彩度以及用户对其的偏好度确定的，因此目标评估结果可以从视频本身以及用户喜好多维度表征待选视频段的评估结果，避免人工截取的主观性，提高了对待选视频段进行评估的准确性，保证了视频处理的准确性。

可选的，上述步骤101中对待处理视频进行划分之前，本发明实施例具体可以包括下述步骤：

S21、获取所述待处理视频的第一评估结果以及第二评估结果；所述第一评估结果中包含所述待处理视频对应于各个时间点的视频内容的精彩度，所述第二评估结果中包含用户对所述待处理视频中的各个时间点的偏好度。

S22、基于所述第一评估结果以及所述第二评估结果生成所述待处理视频的各个时间点对应的待选评估结果。

上述步骤102中获取所述待选视频段的目标评估结果的操作，本发明实施例具体可以包括：

S23、基于所述各个时间点对应的待选评估结果获取所述待选视频段的目标评估结果。

其中，上述第一评估结果中包含待处理视频的各个时间点的视频内容的精彩度。具体的，可以采用精彩度打分算法对待处理视频的每个时间点(通常为每1s)均进行打分。具体的，精彩度打分算法所得到的精彩度的取值范围通常为0.0～1.0，其分值越高表明精彩程度越高，当然，精彩度的打分方式也可以为其他分制，例如，可以使精彩度的取值范围为0.0～10.0，或者，0.0～100.0等，不同的精彩度打分算法可以采用不同的打分方式。

其中，上述第二评估结果中包含用户对待处理视频的各个时间点的偏好度，具体的，可以通过待处理视频的历史播放数据确定，历史播放数据中可以包括正行为(例如反复观看次数、弹幕数量以及被截取次数等)以及负行为(例如快进次数、倍速次数以及切出次数等)，进而可以通过各个时间点的正行为与负行为生成偏好度，偏好度与正行为发生次数呈正相关，与负行为发生次数呈负相关。

可选地，上述步骤S22中基于所述第一评估结果以及所述第二评估结果生成所述待处理视频的各个时间点对应的待选评估结果的操作，可以包括：

S221、分别对所述第一评估结果中的精彩度以及所述第二评估结果中的偏好度进行归一化，得到归一化后的精彩度以及归一化后的偏好度；

S222、针对所述待处理视频的每个时间点，对所述时间点对应的归一化后的精彩度以及归一化后的偏好度进行加权融合，得到所述待处理视频的每个时间点对应的待选评估结果。

具体的，上述待选评估结果可以通过对精彩度以及偏好度进行融合得到。进一步地，为了保证融合得到的待选评估结果的准确性，可以使所生成的偏好度的取值范围与上述精彩度的取值范围相同，可以通过归一化的方式将偏好度与精彩度的取值范围调整为相同。示例性地，在上述精彩度打分算法所得到的精彩度分布为[0.0，1.0]，偏好度分布为[0，100]时，可以将属于[0，10]的偏好度归一化为[0.0，0.1]，相应地，将属于[10，20]的偏好度归一化为[0.1，0.2]，…，将属于[90，100]的偏好度归一化为[0.9，1.0]。或者，为了保证归一化后的分数的均匀分布，还可以对每个时间点的偏好度按照由高到低进行排序，将前10％的偏好度归一化为[0.9，1.0]，前10％-20％的分数归一化到[0.8，0.9]等，本发明实施例对此不作限制。

进一步地，本发明实施例针对每个时间点的偏好度以及精彩度，可以对其进行加权融合得到每个时间点的待选评估结果。具体的，可以为偏好度以及精彩度分别分配权重，通过加权运算生成待选评估结果，其中，偏好度的权重可以为第一权重，精彩度的权重可以为第二权重，从而对于任一时间点，其对应的待选评估结果为偏好度*第一权重+精彩度*第二权重。其中，上述第一权重、第二权重可以按照实际需求自行设置。例如，一种情况下，为了使对视频的评估更加客观，可以设置较高的第二权重，例如0.8、0.9等，相应地，可以设置第一权重为0.2、0.1。另一种情况下，为了使对视频的评估更符合用户的观看喜好，可以设置较高的第一权重，例如0.8、0.9等，相应地，可以设置第二权重为0.2、0.1。

可选地，上述偏好度可以包括第一偏好度与第二偏好度，第一偏好度可以对应上述通过用户的历史观看行为确定的绿镜分数，第二偏好度可以对应上述基于待选视频段的历史截取数据所确定的截取分数。相应地，上述对偏好度进行归一化的操作可以是对第一偏好度以及第二偏好度分别进行归一化，得到归一化后的第一偏好度以及归一化后的第二偏好度。进一步地，上述第一权重还可以包括对应第一偏好度的第一子权重以及对应第二偏好度的第二子权重。相应地，对于任一时间点，其对应的待选评估结果可以为第一偏好度*第一子权重+第二偏好度*第二子权重+精彩度*第二权重。上述第一权重可以为第一子权重与第二子权重之和。示例性地，上述第一子权重以及第二子权重可以均为0.1，第二权重可以为0.8。

进一步地，在得到各个时间点对应的待选评估结果后，可以按照不同待选视频段对应的时间段为其生成目标评估结果。

可选地，上述S23具体可以包括：

S231、获取所述待选视频段包含的时间点所对应的多个待选评估结果。

S232、从所述多个待选评估结果中选取满足第二条件的待选评估结果，并基于所述满足第二条件的待选评估结果生成所述待选视频段的目标评估结果；所述第二条件包括待选评估结果在结果序列中的位置比例不低于第一比例阈值，所述结果序列中所述多个待选评估结果按照由低到高的顺序依次排布。

其中，上述待选视频段包含的时间点指的是，待选视频段在待处理视频中所处的时间段所包含的时间点。示例性地，以上述时间点为秒级，且待选视频段在待处理视频中所处的时间段为08分16秒～09分17秒为例，则该待选视频段包含的时间点为08分16秒～09分17秒之间的每一秒。

进一步地，上述S23中的各个时间点对应的待选评估结果可以采用时间点作为标识，从而本发明实施例中可以将待选视频段包含的时间点作为键值，从各个时间点对应的待选评估结果中获取标识与键值相对应的待选评估结果。可以理解的，所获取的待选视频段对应的待选评估结果的数量与待选视频段包含的时间点的数量相同。

其中，上述第二条件可以为按照实际需求预先设置的。具体的，由于一段视频中的各个时间点的待选评估结果均不同，且可能差异较大，同时不同段的视频中都可能会存在待选评估结果较低的时间点，若对每个待选视频段均采取全部时间点的待选评估结果生成目标评估结果，会导致不同的待选视频段的目标评估结果较为接近，无法更好地区分不同待选视频段的可观看性。因此，本发明实施例中可以设置第二条件对待选评估结果进行筛选，只选取满足第二条件的待选评估结果生成目标评估结果。在此基础上，上述第二条件可以是在结果序列中的位置比例不低于第一比例阈值，其中，结果序列指的是将多个待选评估结果按照由低到高的顺序依次排布所得到的序列，位置比例指的是在序列中的位置编号与序列中的待选评估结果的总数量的比值。可以理解的，序列中各数据的位置编号往往是依次增大的连续自然数，在此基础上，在结果序列中靠前的待选评估结果的位置比例较小，靠后的待选评估结果的位置比例较大，因而本发明实施例可以通过设置第一比例阈值，仅选取靠后的待选评估结果生成目标评估结果，剔除较低的待选评估结果。

其中，第一比例阈值可以按照实际需求自行设置，可以是60％、50％等。

可选地，还可以进一步设置第二比例阈值，上述第二条件可以为待选评估结果在结果序列中的位置比例不低于第一比例阈值，且不高于第二比例阈值。其中，第一比例阈值小于第二比例阈值。示例性地，可以设置第一比例阈值为10％，第二比例阈值为90％，则所选择的待选评估结果既不属于较高的10％，也不属于较低的10％，仅选取位于第一比例阈值与第二比例阈值之间的待选评估结果生成目标评估结果。

进一步地，可以将满足第二条件的待选评估结果的平均值作为待选视频段的目标评估结果。

示例性地，以第一比例阈值为60％为例，则第二条件为待选评估结果在结果序列中位于后40％，若待选视频段包含10个时间点，各个时间点的待选评估结果依次为1.0、0.9、0.8、…、0.1为例，可以得到结果序列为0.1、0.2、0.3、…、1.0，则可以得到满足第二条件的待选评估结果包括：1.0、0.9、0.8、0.7，则可以进一步得到该待选视频段的目标评估结果为(1.0+0.9+0.8+0.7)/4，即0.85。这样，可以避免不同的待选视频段的目标评估结果较为接近，可以更好地区分不同待选视频段的可观看性。

本发明实施例中，通过为待处理视频的各个时间点先生成对应的待选评估结果，根据待选评估结果确定待选视频段的目标评估结果，可以便捷地获取不同待选视频段的目标评估结果，无需对多个待选视频段执行多次评估，可以在一定程度上提高视频处理的效率。

可选的，上述步骤103中从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频的操作，本发明实施例具体可以包括：

S31、将目标评估结果满足所述第一条件的待选视频段确定为目标视频段，并对所述目标视频段进行镜头检测，以按照识别到的镜头对所述目标视频段进行划分，得到多个子视频；一个子视频对应一个镜头。

S32、按照所述多个子视频在所述目标视频段中的播放顺序，将所述播放顺序中的第一个子视频确定为起始子视频，并对所述起始子视频进行人物检测，得到人物检测结果。

S33、在所述人物检测结果表征所述起始子视频的预设播放时长对应的视频内容中存在指定人物的情况下，将所述起始子视频的起始时间点确定为所述特征视频的起始时间点。

S34、将所述播放顺序中的最后一个子视频确定为终止子视频，并将所述终止子视频的终止时间点确定为所述特征视频的终止时间点，以基于所述特征视频的起始时间点以及所述特征视频的终止时间点获取所述特征视频。

其中，上述镜头检测可以通过镜头转场点算法实现。具体的，同一个镜头中的画面对象通常是固定的，画面对象可以包括人物对象以及背景对象，镜头切换表征画面对象也发生了变化。具体的，镜头转场点算法可以对目标视频段中的各个视频帧进行检测，识别各个视频帧中包含的对象，将对象发生变化的两个视频帧划分为不同的子视频。

其中，上述播放顺序指的是各个子视频在目标视频段中分布的时间顺序，相当于在待处理视频中分布的时间顺序，目标视频段相当于由多个子视频构成的视频序列。上述第一个子视频指的是目标视频段中第一个播放的镜头。

其中，上述人物检测可以通过人物检测算法实现，人物检测算法可以对子视频中的每个视频帧进行人物检测识别，得到包括存在人物的视频帧以及人物名称的人物检测结果。其中，人物名称可以是人物的姓名或者标识。具体的，由于视频中存在的人物往往为演员等公众人物，从而人物检测算法可以将识别到的人物与人物库中的人物进行匹配，确定出每个人物的名称。

其中，上述预设播放时长可以自行设置，可以设置为该子视频的总时长的一半，或者直接设置该预设播放时长为5s或7s、8s等。具体的，上述指定人物可以预先确定，一种情况下，可以通过接收用户的输入信息来确定指定人物，或者也可以预先对整个待处理视频进行人物检测，统计不同人物出现的频率，将出现频率不低于预设频率阈值的人物，或者将出现频率为前4名或前5名的人物作为待处理视频的主体人物，也就是待处理视频的主角。

具体的，上述指定人物通常为用户较想观看的人物，从而为了避免所生成的特征视频在较长时间内未出现指定人物，可以对子视频进行人物检测，在起始子视频的预设播放时长内出现该指定人物的情况下，则可以保留该子视频，将该子视频的起始时间点确定为特征视频的起始时间点。

可选地，在所述人物检测结果表征所述起始子视频的预设播放时长对应的视频内容中不存在所述指定人物的情况下，将所述起始子视频更新为所述播放顺序中的下一个子视频，并重新执行所述对所述起始子视频进行人物检测的操作。

其中，上述播放顺序中的下一个子视频指的是播放顺序中当前的起始子视频的下一个子视频。示例性地，以存在三个子视频按照播放顺序依次为A、B、C为例，上述步骤S32中所确定的起始子视频为第一个子视频：A，若A中不存在指定人物，则可以将起始子视频更新为B。

进一步地，在起始子视频的预设播放时长内未出现该指定人物的情况下，可以不在特征视频中保留该子视频，可以对起始子视频进行更新，将其更新为当前的起始子视频的下一个子视频，并再次对其进行人物检测，直至确定出预设播放时长内出现该指定人物的起始子视频时，将当前的起始子视频的起始时间点确定为特征视频的起始时间点。

可选地，对于目标视频段中的多个子视频，若直至最后一个子视频的预设播放时长内不存在上述指定人物，则可以删除该目标视频段。

进一步地，可以将播放顺序中的最后一个子视频确定为终止子视频，并将终止子视频的终止时间点确定为特征视频的终止时间点，也就是结束点位。进一步地，在得到特征视频的起始时间点以及终止时间点后，可以从待处理视频中截取这两个时间点对应的视频片段，也就是从起始时间点至终止时间点的视频片段，作为特征视频。

可选的，在确定起始时间点后，可以先获取起始时间点至最后一个子视频的终止时间点之间的时长，在该时长未达到预设的时长阈值时，可以将下一个待选视频段与当前的目标视频段合并，作为特征视频，以避免所确定的特征视频的时长过短。其中，上述下一个待选视频段指的是在待处理视频中，播放顺序与当前的目标视频段连续且位于当前的目标视频段的后面的待选视频段。

本发明实施例中，通过将目标评估结果满足所述第一条件的待选视频段确定为目标视频段，并对所述目标视频段进行镜头检测，以按照识别到的镜头对所述目标视频段进行划分，得到多个子视频；一个子视频对应一个镜头；按照所述多个子视频在所述目标视频段中的播放顺序，将所述播放顺序中的第一个子视频确定为起始子视频，并对所述起始子视频进行人物检测，得到人物检测结果；在所述人物检测结果表征所述起始子视频的预设播放时长对应的视频内容中存在指定人物的情况下，将所述起始子视频的起始时间点确定为所述特征视频的起始时间点；将所述播放顺序中的最后一个子视频确定为终止子视频，并将所述终止子视频的终止时间点确定为所述特征视频的终止时间点，以基于所述特征视频的起始时间点以及所述特征视频的终止时间点获取所述特征视频。这样，通过镜头检测，可以保证每个子视频的镜头内容完整性，避免所获取的特征视频中存在不完整的镜头。同时，通过人物检测，将预设播放时长对应的视频内容中存在指定人物的起始子视频的起始时间点确定为特征视频的起始时间点，可以保证所生成的特征视频在播放过程中，在预设播放时长内出现指定人物，提高特征视频的片头的吸引力，在一定程度上保证特征视频的可观看性。

可选的，所述输出所述特征视频之前，本发明实施例具体还可以包括下述步骤：

S41、基于所述特征视频的起始时间点以及所述特征视频的终止时间点，获取所述特征视频的视频时长。

S42、在所述视频时长大于第一时长阈值的情况下，按照所述播放顺序的倒序依次删除所述特征视频中包含的子视频，直至当前的特征视频的视频时长不大于所述第一时长阈值的情况下，将当前的特征视频确定为待输出的所述特征视频。

其中，上述视频时长可以通过终止时间点以及起始时间点的差值得到。上述第一时长阈值可以为预先设置的特征片段的时长上限值。可以理解的，用于进行视频推荐的特征视频的时长过长时，会降低对用户的吸引力，导致部分用户在特征视频的播放过程中退出观看，影响视频推荐的效果，因而本发明实施例可以设置第一时长阈值对特征视频的时长进行调整。示例性地，上述第一时长阈值可以设置为30s、60s或者180s等等，本发明实施例对此不作限制。

具体的，上述播放顺序的倒序指的是播放顺序从后往前的顺序，相应地，上述删除操作指的是从后往前依次删除，也就是先删除最后播放的子视频，再往前依次删除，直至特征视频的视频时长不大于上述第一时长阈值。

本发明实施例中，基于所述特征视频的起始时间点以及所述特征视频的终止时间点，获取所述特征视频的视频时长；在所述视频时长大于第一时长阈值的情况下，按照所述播放顺序的倒序依次删除所述特征视频中包含的子视频，直至当前的特征视频的视频时长不大于所述第一时长阈值的情况下，将当前的特征视频确定为待输出的所述特征视频。这样，通过设置第一时长阈值，并基于第一时长阈值对特征视频的时长进行调整，可以避免所生成的特征视频的时长过长，保证所生成的特征视频的可观看性。同时，通过按照播放顺序的倒序进行删除，可以在一定程度上避免特征视频的片头不完整的情况。

可选的，上述将当前的特征视频确定为待输出的所述特征视频的操作，本发明实施例具体可以包括下述步骤：

S51、获取所述当前的特征视频中包含的最后一个子视频的语言结束时间点。

S52、在所述最后一个子视频的语言结束时间点与所述最后一个子视频的终止时间点的差值不小于第二时长阈值的情况下，将所述当前的特征视频确定为待输出的所述特征视频。

其中，上述语言结束时间点指的是台词结束点。具体的，视频中往往存在人物对话的场景，且不同人物之间的对话往往会伴随着镜头的切换，为了保证特征视频中对话的完整性，本发明实施例可以获取特征视频中包含的最后一个子视频的语言结束时间点。具体的，可以通过台词跟踪算法获取，台词跟踪算法可以对视频中的台词信息进行检测，检测结果可以包含每句台词的起止时间点以及台词内容。

其中，上述第二时长阈值可以为按照实际需求预先设置的，可以根据待处理视频中的对话场景进行设置，也可以设置经验值，例如可以设置为2s、3s等。具体的，由于一段对话结束后，通常会间隔一段时间再进行下一段对话，因此，在上述语言结束时间点与终止时间点的差值不小于第二时长阈值时，表明该子视频中的对话已经结束，因而可以直接将当前的特征视频确定为待输出的特征视频。

可选地，在上述语言结束时间点与终止时间点的差值小于上述第二时长阈值时，表明该子视频中的对话可能还未结束，也就是当前的特征视频中的最后一个子视频在对话场景下是不完整的，此时可以删除当前的最后一个子视频得到新的特征视频，并对该新的特征视频重新执行上述步骤S51。

本发明实施例中，通过获取所述当前的特征视频中包含的最后一个子视频的语言结束时间点；在所述最后一个子视频的语言结束时间点与所述最后一个子视频的终止时间点的差值不小于第二时长阈值的情况下，将所述当前的特征视频确定为待输出的所述特征视频。通过对语言结束时间点与终止时间点的差值与第二时长阈值进行比对，可以在一定程度上保证最终输出的特征视频的对话完整性，提高特征视频的视频效果。

可选的，上述输出所述特征视频的操作之前，本发明实施例具体还可以包括下述步骤：

在所述特征视频的数量未达到第一数量阈值的情况下，从其他待选视频段中再次选取目标评估结果满足第三条件的待选视频段，作为所述特征视频；所述其他待选视频段为所述多个待选视频段中与所述特征视频不同的待选视频段。

具体的，实际场景中，针对同一个待处理视频可以生成多个特征视频进行视频推荐，上述第一数量阈值指的是针对待处理视频将要生成的特征视频数量的最小值，其可以预先设置，可以设置为1、2、5、10等，本发明实施例对此不作限制。

其中，上述第三条件可以与上述第一条件相同，也可以不同。具体的，在上述第一条件为目标评估结果不小于目标阈值，可以设置第三条件为目标评估结果不小于第二目标阈值，可以理解的，此时可以降低筛选条件，可以设置小于目标阈值的第二目标阈值。另一种情况下，在上述第一条件为目标评估结果最大，或者，上述第一条件为目标评估结果较高的前40％、50％等时，可以设置第三条件与第一条件相同。

具体的，在特征视频的数量未达到第一数量阈值的情况下，表明当前确定的特征视频较少，此时可以从剩余的待选视频段中重新选取特征视频。

本发明实施例中，通过在所述特征视频的数量未达到第一数量阈值的情况下，从其他待选视频段中再次选取目标评估结果满足第三条件的待选视频段，作为所述特征视频；所述其他待选视频段为所述多个待选视频段中与所述特征视频不同的待选视频段。这样，通过设置第一数量阈值，可以保证所生成的特征视频的数量，针对一个待处理视频生成第一数量阈值的特征视频，提高特征视频的生成效率，以及提高对待处理视频的视频推荐效果。

可选地，上述输出所述特征视频的操作，本发明实施例具体可以包括：

S61、基于各所述特征视频对应的目标评估结果的高低，按照由高到低对各所述特征视频进行排序，得到排序结果。

S62、按照所述排序结果选取第二数量阈值的特征视频进行输出。

其中，上述第二数量阈值不大于上述第一数量阈值，其可以是预先设置的，也可以是在输出前，通过接收用户的输入信息确定的。具体的，本发明实施例在得到特征视频之后，可以获取各特征视频对应的目标评估结果，并按照目标评估结果的高低对特征视频进行排序，从中选取第二预设数量的特征视频输出。

可选地，在特征视频是基于目标视频段得到的情况下，由于特征视频的起始点位与终止点位进行了调整，其视频内容也发生了变化，此时可以针对特征视频的时间点，重新获取特征视频当前的目标评估结果。

可选的，上述对待处理视频进行划分，得到多个待选视频段的操作，本发明实施例具体可以包括下述步骤：

对所述待处理视频进行场景识别，并按照识别到的视频场景对所述待处理视频进行划分，得到所述多个待选视频段；一个待选视频段对应一个视频场景。

其中，上述场景识别可以通过场景转场点算法实现。上述视频场景指的是一段完整独立的视频内容，其通常与人物、背景、情节相关，视频往往是由若干个场景构成，而不同场景之间的切换称为场景转场。具体的，场景转场点算法可以识别出每个场景的起止时间点，将场景发生变化的时间点前后的视频划分为不同的待选视频段。

本发明实施例中，通过对所述待处理视频进行场景识别，并按照识别到的视频场景对所述待处理视频进行划分，得到所述多个待选视频段；一个待选视频段对应一个视频场景。这样，可以保证所划分的待选视频段的视频场景完整性，保证待选视频段的视频效果，进一步保证特征视频的视频效果。

图2为本发明实施例中的一种视频处理装置的结构示意图，如图2所示，该装置20可以包括：

划分模块201，用于对待处理视频进行划分，得到多个待选视频段；

评估结果获取模块202，用于对于任一所述待选视频段，获取所述待选视频段的目标评估结果；所述目标评估结果是根据所述待选视频段的精彩度以及用户对所述待选视频段的偏好度确定的；

第一选取模块203，用于从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，并输出所述特征视频。

可选的，所述装置20还包括：

第一获取模块，用于获取所述待处理视频的第一评估结果以及第二评估结果；所述第一评估结果中包含所述待处理视频对应于各个时间点的视频内容的精彩度，所述第二评估结果中包含用户对所述待处理视频中的各个时间点的偏好度；

待选生成模块，用于基于所述第一评估结果以及所述第二评估结果生成所述待处理视频的各个时间点对应的待选评估结果；

所述评估结果获取模块202，具体用于：

基于所述各个时间点对应的待选评估结果获取所述待选视频段的目标评估结果。

可选的，所述评估结果获取模块202，具体用于：

获取所述待选视频段包含的时间点所对应的多个待选评估结果；

从所述多个待选评估结果中选取满足第二条件的待选评估结果，并基于所述满足第二条件的待选评估结果生成所述待选视频段的目标评估结果；所述第二条件包括待选评估结果在结果序列中的位置比例不低于第一比例阈值，所述结果序列中所述多个待选评估结果按照由低到高的顺序依次排布。

可选的，所述第一选取模块203，包括：

镜头检测子模块，用于将目标评估结果满足所述第一条件的待选视频段确定为目标视频段，并对所述目标视频段进行镜头检测，以按照识别到的镜头对所述目标视频段进行划分，得到多个子视频；一个子视频对应一个镜头；

人物检测子模块，用于按照所述多个子视频在所述目标视频段中的播放顺序，将所述播放顺序中的第一个子视频确定为起始子视频，并对所述起始子视频进行人物检测，得到人物检测结果；

起始确定子模块，用于在所述人物检测结果表征所述起始子视频的预设播放时长对应的视频内容中存在指定人物的情况下，将所述起始子视频的起始时间点确定为所述特征视频的起始时间点；

终止确定子模块，用于将所述播放顺序中的最后一个子视频确定为终止子视频，并将所述终止子视频的终止时间点确定为所述特征视频的终止时间点，以基于所述特征视频的起始时间点以及所述特征视频的终止时间点获取所述特征视频。

可选的，所述装置20还包括：

更新模块，用于在所述人物检测结果表征所述起始子视频的预设播放时长对应的视频内容中不存在所述指定人物的情况下，将所述起始子视频更新为所述播放顺序中的下一个子视频，并重新执行所述对所述起始子视频进行人物检测的操作。

可选的，所述装置20还包括：

时长获取模块，用于基于所述特征视频的起始时间点以及所述特征视频的终止时间点，获取所述特征视频的视频时长；

删除模块，用于在所述视频时长大于第一时长阈值的情况下，按照所述播放顺序的倒序依次删除所述特征视频中包含的子视频，直至当前的特征视频的视频时长不大于所述第一时长阈值的情况下，将当前的特征视频确定为待输出的所述特征视频。

可选的，所述删除模块，具体用于：

获取所述当前的特征视频中包含的最后一个子视频的语言结束时间点；

在所述最后一个子视频的语言结束时间点与所述最后一个子视频的终止时间点的差值不小于第二时长阈值的情况下，将所述当前的特征视频确定为待输出的所述特征视频。

可选的，所述装置20还包括：

第二选取模块，用于在所述特征视频的数量未达到第一数量阈值的情况下，从其他待选视频段中再次选取目标评估结果满足第三条件的待选视频段，作为所述特征视频；所述其他待选视频段为所述多个待选视频段中与所述特征视频不同的待选视频段。

可选的，所述第一选取模块203，包括：

排序子模块，用于基于各所述特征视频对应的目标评估结果的高低，按照由高到低对各所述特征视频进行排序，得到排序结果；

输出子模块，用于按照所述排序结果选取第二数量阈值的特征视频进行输出。

可选的，所述评估结果获取模块202，具体还用于：

分别对所述第一评估结果中的精彩度以及所述第二评估结果中的偏好度进行归一化，得到归一化后的精彩度以及归一化后的偏好度；

针对所述待处理视频的每个时间点，对所述时间点对应的归一化后的精彩度以及归一化后的偏好度进行加权融合，得到所述待处理视频的每个时间点对应的待选评估结果。

可选的，所述划分模块201，具体用于：

综上所述，本发明实施例提供的视频处理装置，通过对待处理视频进行划分，得到多个待选视频段；对于任一所述待选视频段，获取所述待选视频段的目标评估结果；所述目标评估结果是根据所述待选视频段的精彩度以及用户对所述待选视频段的偏好度确定的；从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，并输出所述特征视频。本发明实施例中，无需通过人工方式对视频进行截取进行视频推荐，而是通过对待处理视频进行划分，并按照各个待选视频段的目标评估结果选取特征视频，从而提高了视频处理的效率。同时，由于目标评估结果是根据待选视频段的精彩度以及用户对其的偏好度确定的，因此目标评估结果可以从视频本身以及用户喜好多维度表征待选视频段的评估结果，提高了对待选视频段进行评估的准确性，保证了视频处理的准确性。

本发明实施例还提供了一种电子设备，如图3所示，包括处理器9001、通信接口9002、存储器9003和通信总线9004，其中，处理器9001，通信接口9002，存储器9003通过通信总线9004完成相互间的通信，

存储器9003，用于存放计算机程序；

处理器9001，用于执行存储器9003上所存放的程序时，实现如下步骤：

对待处理视频进行划分，得到多个待选视频段；

可选的，所述对待处理视频进行划分之前，所述方法还包括：

获取所述待处理视频的第一评估结果以及第二评估结果；所述第一评估结果中包含所述待处理视频对应于各个时间点的视频内容的精彩度，所述第二评估结果中包含用户对所述待处理视频中的各个时间点的偏好度；

基于所述第一评估结果以及所述第二评估结果生成所述待处理视频的各个时间点对应的待选评估结果；

所述获取所述待选视频段的目标评估结果，包括：

可选的，所述基于所述各个时间点对应的待选评估结果获取所述待选视频段的目标评估结果，包括：

可选的，所述从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，包括：

将目标评估结果满足所述第一条件的待选视频段确定为目标视频段，并对所述目标视频段进行镜头检测，以按照识别到的镜头对所述目标视频段进行划分，得到多个子视频；一个子视频对应一个镜头；

按照所述多个子视频在所述目标视频段中的播放顺序，将所述播放顺序中的第一个子视频确定为起始子视频，并对所述起始子视频进行人物检测，得到人物检测结果；

在所述人物检测结果表征所述起始子视频的预设播放时长对应的视频内容中存在指定人物的情况下，将所述起始子视频的起始时间点确定为所述特征视频的起始时间点；

将所述播放顺序中的最后一个子视频确定为终止子视频，并将所述终止子视频的终止时间点确定为所述特征视频的终止时间点，以基于所述特征视频的起始时间点以及所述特征视频的终止时间点获取所述特征视频。

可选的，所述方法还包括：

在所述人物检测结果表征所述起始子视频的预设播放时长对应的视频内容中不存在所述指定人物的情况下，将所述起始子视频更新为所述播放顺序中的下一个子视频，并重新执行所述对所述起始子视频进行人物检测的操作。

可选的，所述输出所述特征视频之前，所述方法还包括：

基于所述特征视频的起始时间点以及所述特征视频的终止时间点，获取所述特征视频的视频时长；

在所述视频时长大于第一时长阈值的情况下，按照所述播放顺序的倒序依次删除所述特征视频中包含的子视频，直至当前的特征视频的视频时长不大于所述第一时长阈值的情况下，将当前的特征视频确定为待输出的所述特征视频。

可选的，所述将当前的特征视频确定为待输出的所述特征视频，包括：

所述输出所述特征视频之前，所述方法还包括：

可选的，所述输出所述特征视频，包括：

基于各所述特征视频对应的目标评估结果的高低，按照由高到低对各所述特征视频进行排序，得到排序结果；

按照所述排序结果选取第二数量阈值的特征视频进行输出。

可选的，所述基于所述第一评估结果以及所述第二评估结果生成所述待处理视频的各个时间点对应的待选评估结果，包括：

可选的，所述对待处理视频进行划分，得到多个待选视频段，包括：

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的视频处理方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的视频处理方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

需要说明的是，本申请实施例中获取各种数据相关过程，都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种视频处理方法，其特征在于，所述方法包括：

对待处理视频进行划分，得到多个待选视频段；

2.根据权利要求1所述的方法，其特征在于，所述对待处理视频进行划分之前，所述方法还包括：

所述获取所述待选视频段的目标评估结果，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述各个时间点对应的待选评估结果获取所述待选视频段的目标评估结果，包括：

4.根据权利要求1所述的方法，其特征在于，所述从所述多个待选视频段中选取目标评估结果满足第一条件的待选视频段，作为所述待处理视频的特征视频，包括：

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：

6.根据权利要求4所述的方法，其特征在于，所述输出所述特征视频之前，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述将当前的特征视频确定为待输出的所述特征视频，包括：

8.根据权利要求1所述的方法，其特征在于，所述输出所述特征视频之前，所述方法还包括：

9.根据权利要求8所述的方法，其特征在于，所述输出所述特征视频，包括：

按照所述排序结果选取第二数量阈值的特征视频进行输出。

10.根据权利要求2所述的方法，其特征在于，所述基于所述第一评估结果以及所述第二评估结果生成所述待处理视频的各个时间点对应的待选评估结果，包括：

11.根据权利要求1-10任一所述的方法，其特征在于，所述对待处理视频进行划分，得到多个待选视频段，包括：

12.一种视频处理装置，其特征在于，所述装置包括：

13.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-11任一所述的方法。

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-11中任一所述的方法。

15.一种计算机程序，其特征在于，所述计算机程序被计算机运行时实现如权利要求1-11中任一项所述的方法。