CN114666649A

CN114666649A - 字幕被裁视频的识别方法、装置、电子设备及存储介质

Info

Publication number: CN114666649A
Application number: CN202210336353.3A
Authority: CN
Inventors: 唐欢
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2022-06-24
Anticipated expiration: 2042-03-31
Also published as: CN114666649B

Abstract

本申请提供的一种字幕被裁视频的识别方法、装置、电子设备及存储介质，应用于图像处理技术领域，所述方法包括：获取待处理视频帧，所述待处理视频帧至少包括：内容画面和非内容画面；识别所述非内容画面中的字幕像素点和非字幕像素点；在所述字幕像素点和所述非字幕像素点的分布参数符合字幕被裁像素分布要求时，确认所述待处理视频帧为字幕被裁的目标视频帧。本方案通过对待处理视频帧中已被部分裁剪的非内容画面中的字幕像素点和非字幕像素点的分布参数进行分析，以准确地的对待处理视频帧中部分字幕被裁的情况进行识别，避免了部分字幕被裁影响视频观感的情况，提升了视频质量。

Description

字幕被裁视频的识别方法、装置、电子设备及存储介质

技术领域

本申请属于图像处理技术领域，特别是涉及一种字幕被裁视频的识别方法、装置、电子设备及存储介质。

背景技术

在视频生产过程中，通常会对视频中存在的多余黑边等非内容画面进行剪裁以适应固定的码流画幅比例。而一些非内容画面中会存在字幕，这在老片中非常常见，常发的错误是在首帧没有台词的时候检出非内容画面的尺寸直接进行裁剪导致字幕被裁掉一半或是多半。还有一些多素材拼接视频，需要都剪裁为一样的尺寸进行拼接，而有的视频素材存在字幕剪裁时没有完全裁掉，这样也会出现裁掉半截的字幕，给用户带来不会的观感，甚至会导致用户的投诉，影响极其恶劣。

发明内容

有鉴于此，本申请提供一种字幕被裁视频的识别方法、装置、电子设备及存储介质，以尽可能解决相关技术中无法识别出由于视频裁剪导致视频帧中部分字幕被裁，导致视频观感下降，影响视频质量的问题。

本申请第一方面提供一种字幕被裁视频的识别方法，所述方法包括：

获取待处理视频帧，所述待处理视频帧至少包括：内容画面和非内容画面；

识别所述非内容画面中的字幕像素点和非字幕像素点；

在所述字幕像素点和所述非字幕像素点的分布参数符合字幕被裁像素分布要求时，确认所述待处理视频帧为字幕被裁的目标视频帧。

可选地，所述分布参数至少包括：所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数，所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数；

所述在所述字幕像素点和所述非字幕像素点的分布参数符合字幕被裁像素分布要求时，确认所述待处理视频帧为字幕被裁的目标视频帧，包括：

判断所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数是否符合字幕被裁像素分布要求；

在确认所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求的情况下，判断所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数是否符合字幕被裁像素分布要求；

在确认所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求的情况下，确认所述待处理视频帧为字幕被裁的目标视频帧。

可选地，所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数包括：位于所述非内容画面底部位置的第一数量个像素行的，第一字幕像素点数量和非字幕像素点占比；

所述确认所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求，包括：

在所述第一字幕像素点数量大于第一字幕像素点数量阈值，且所述非字幕像素点占比大于非字幕像素点占比阈值的情况下，确认所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求。

可选地，所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数包括：位于所述非内容画面底部位置的第二数量个像素行中第三数量个像素列的，第二字幕像素点数量和非字幕像素点数量，所述第一数量大于第二数量；

所述确认所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求，包括：

在所述第二字幕像素点数量大于第二字幕像素点数量阈值，且所述非字幕像素点数量大于非字幕像素点数量阈值的情况下，确认所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求。

可选地，所述在所述字幕像素点和所述非字幕像素点的分布参数符合字幕被裁像素分布要求时，确认所述待处理视频帧为字幕被裁的目标视频帧，包括：

所述字幕像素点和所述非字幕像素点的分布参数计算所述待处理视频帧的字幕高度；

在所述字幕高度符合字幕被裁高度要求时，确认所述待处理视频为字幕被裁的目标视频帧。

可选地，所述在所述字幕高度符合字幕被裁高度要求时，确认所述待处理视频为字幕被裁的目标视频帧，包括：

在所述字幕高度小于字幕高度阈值时，确认所述待处理视频帧为字幕被裁的目标视频帧。

可选地，在所述确认所述待处理视频帧为字幕被裁的目标视频帧之后，所述方法还包括：

根据所述目标视频帧在目标视频中的时间戳，计算所述目标视频的字幕被裁持续时长；

在所述字幕被裁持续时长大于持续时长阈值时，对所述目标视频中的目标视频帧执行修复操作。

依据本申请的第二方面，提供的一种字幕被裁视频的识别装置，所述装置包括：

获取模块，用于获取待处理视频帧，所述待处理视频帧至少包括：内容画面和非内容画面；

识别模块，用于识别所述非内容画面中的字幕像素点和非字幕像素点；

所述识别模块，还用于：

可选地，所述识别模块，还用于：

可选地，所述装置还包括：

修复模块，用于根据所述目标视频帧在目标视频中的时间戳，计算所述目标视频的字幕被裁持续时长；

依据本申请第三方面，提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述任一方面所述的字幕被裁视频的识别方法。

依据本申请第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现上述任一方面所述的字幕被裁视频的识别方法。

针对现有技术，本申请具备如下优点：

本申请提供的一种字幕被裁视频的识别方法、装置、电子设备及存储介质，通过对待处理视频帧中已被部分裁剪的非内容画面中的字幕像素点和非字幕像素点的分布参数进行分析，以准确地的对待处理视频帧中部分字幕被裁的情况进行识别，避免了部分字幕被裁影响视频观感的情况，提升了视频质量。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1是本申请实施例提供的一种字幕被裁视频的识别方法的步骤流程图；

图2是本申请实施例提供的另一种字幕被裁视频的识别方法的步骤流程图之一；

图3是本申请实施例提供的另一种字幕被裁视频的识别方法的步骤流程图之二；

图4是本申请实施例提供的另一种字幕被裁视频的识别方法的步骤流程图之三；

图5是本申请实施例提供的一种字幕被裁视频的识别装置的结构框图；

图6是本申请实施例提供的一种电子设备的结构框图。

具体实施方式

下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例，然而应当理解，可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本申请，并且能够将本申请的范围完整的传达给本领域的技术人员。

图1是本申请实施例提供的一种字幕被裁视频的识别方法的步骤流程图，所述方法包括：

步骤101，获取待处理视频帧，所述待处理视频帧至少包括：内容画面和非内容画面。

需要说明，待处理视频帧是指已对画面中的部分黑边进行裁剪的视频帧，则该待处理视频帧中的视频内容的画面是内容画面，剩余未被裁剪的黑边的画面则是非内容画面。

在本申请实施例中，由于通常原始视频帧的尺寸与显示器的显示尺寸不相符，因此会在原始视频帧的侧边通过添加黑边来将原始视频帧的尺寸进行调整，并且添加黑边后的视频帧通常会将字幕添加在黑边中，以避免字幕遮盖视频内容。但是若对视频帧中的部分黑边再次进行裁剪的话就可能会将部分字幕一并裁剪掉，本申请的方案正是用于识别已被裁剪部分黑边的视频帧是否存在字幕被裁剪的情况。

步骤102，识别所述非内容画面中的字幕像素点和非字幕像素点。

在本申请实施例中，由于为便于观众识别，通常非内容画面中的非字幕像素点通常是黑色等同一颜色，而字幕像素点通常也是白色等同一颜色，即字幕像素点和非字幕像素点分别是两种不同的颜色，当然非字幕像素点和字幕像素点还可以是其他两种不同的颜色。因此电子设备在获取到待处理视频帧后，可以通过对非内容画面进行颜色识别，从而识别非内容画面中的字幕像素点和非字幕像素点。具体可以通过对多像素点的RGB(red、green、blue，红绿蓝)、YUV(亮度色度)格式的像素值进行分析来进行颜色识别。

步骤103，在所述字幕像素点和所述非字幕像素点的分布参数符合字幕被裁像素分布要求时，确认所述待处理视频帧为字幕被裁的目标视频帧。

在本申请实施例中，由于通常对于非内容画面的裁剪通常是从视频帧的画面外侧向内进行裁剪，因此若字幕被裁剪掉，剩余未被裁剪的字幕像素点则会处于非内容画面的外侧，那么即可通过非内容画面中各个位置的字幕像素点和非字幕像素点的分布参数进行分析，通过判断分布参数是否满足字幕被裁像素分布要求来确认待处理视频的字幕是否已被裁剪。例如该字幕被裁像素分布要求可以是处于非内容画面远离内容画面的外侧字幕像素点的像素点数量大于预设数量阈值，则说明非内容画面外侧存在字幕像素点，并且非内容画面外侧的字幕像素点的像素点占比大于预设占比阈值，则说明非内容画面外侧大部分是字幕像素点，此时则可认定待处理视频的字幕已被裁剪。或者该目标要求可以是处于非内容画面远离内容画面的外侧的非字幕像素点的像素点数量小于预设数量阈值，则说明非内容画面外侧的非字幕像素点较少，存在较多的字幕像素点，并且内容画面外侧的非字幕像素点的像素点占比小于预设占比阈值，则说明非内容画面外侧小部分是非字幕像素点，大部分是字幕像素点，此时则可认定待处理视频的字幕已被裁剪。当然此处仅是示例性说明，具体目标要求的设置方式可以根据实际需求进行设置，此处不做限定。

本申请实施例通过对待处理视频帧中已被部分裁剪的非内容画面中的字幕像素点和非字幕像素点的分布参数进行分析，以准确地的对待处理视频帧中部分字幕被裁的情况进行识别，避免了部分字幕被裁影响视频观感的情况，提升了视频质量。

可选地，所述分布参数至少包括：所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数，所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数，参照图2，所述步骤103，包括：

步骤201，判断所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数是否符合字幕被裁像素分布要求。

在本申请实施例中，考虑到字幕通常是添加在视频帧中尽量远离内容画面的非内容画面外侧，因此本申请中的底部区域是字幕所的外侧区域，可以是待处理视频帧的上下左右外侧位置，具体可以根据实际字幕所处区域确定底部区域。具体的，本申请首先对包含有字幕的非内容画面中的底部的像素点进行统计得到的字幕像素点和非字幕像素点的分布参数进行分析，即确认该底部区域中整体的字幕像素点和非字幕像素点的分布参数是否符合被裁像素分布要求，该被裁像素分布要求可参照步骤103中的相关描述，此处不再赘述。

步骤202，在确认所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求的情况下，判断所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数是否符合字幕被裁像素分布要求。

在本申请实施例中，由于底部区域的范围过大，而字幕实际所处区域可能只是底部区域的局部范围，可能导致由于非字幕像素点的数量过大导致所判别的结果不准确。因此本申请子对底部的字幕像素点和非字幕像素点的分布参数进行整体比对之后，进一步对底部区域中的底部部分区域进一步进行判别。需要说明的是，该底部部分区域是底部区域中字幕像素点出现相较于底部区域的整体概率更高的区域，因此底部部分区域中的像素点分布参数可以更加准确地反映视频帧的字幕是否被裁的特点。

步骤203，在确认所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求的情况下，确认所述待处理视频帧为字幕被裁的目标视频帧。

在本申请实施例中，在进一步验证底部部分区域的字幕像素点和非字幕像素点的额分布参数符合字幕被裁像素分布要求后，即可确认该待处理视频帧存在字幕被裁的情况。需要说明的是，底部部分区域和底部区域所使用的字幕被裁像素点分布参数要求可以相同，也可以不同，例如底部部分区域的字幕被裁像素点分布参数可以相较于底部区域的范围更小，要求根严格，或者是范围和要求相同，具体可以根据实际需求设置，此处不做限定。

本申请实施例首先通过对待处理视频帧中的底部区域的像素点分布参数进行整体验证之后进一步在对底部区域中的底部部分区域进一步验证通过后才确定待处理视频帧的字幕被裁，保证了视频帧字幕被裁情况识别的准确性。

可选地，所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数包括：位于所述非内容画面底部位置的第一数量个像素行的，第一字幕像素点数量和非字幕像素点占比，所述步骤202，包括：在所述第一字幕像素点数量大于第一字幕像素点数量阈值，且所述非字幕像素点占比大于非字幕像素点占比阈值的情况下，确认所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求。

在本申请实施例中，第一数量个像素行是指非内容画面中像素点阵列中的一个或多个特定像素点行，该第一数量个像素行可以是从内到外排序的最后一行或者倒数第二行或者倒数第三行，或者若干行，具体可以根据实际需求设置，此处不做限定。考虑到非字幕像素点占比越高，待处理视频帧的字幕被裁的概率越高，第一字幕像素点数量越小，待处理视频帧的字幕被裁的概率越高，因此本申请通过针对非字幕像素点占比设置非字幕像素点要求，对第一字幕像素点数量设置字幕像素点要求来对待处理视频帧的字幕是否被裁情况进行识别。例如，在非字幕像素点占比大于或等于非字幕像素点占比阈值时确定非字幕像素点占比符合字幕像素点要求，或者在非字幕像素点占比处于非字幕像素点占比范围时确定非字幕像素点占比符合非字幕像素点要求；在第一字幕像素点数量小于或等于第一字幕像素点数量阈值，或者第一字幕像素点数量处于第一字幕像素点数量范围时，确定第一字幕像素点数量符合字幕像素点要求。当然此处只是示例性描述，具体可以根据实际需求进行设置，此处不做限定。

本申请实施例通过对通过针对非字幕像素点占比设置非字幕像素点要求，对第一字幕像素点数量设置字幕像素点要求来对待处理视频帧的字幕是否被裁情况进行识别，提高了视频帧部分字幕被裁情况识别的准确性。

在本申请实施例中，非字幕像素点占比阈值和第一字幕像素点数量阈值可以是通过对已被裁剪部分字幕的样本视频帧进行统计分析得到。由于虑到非字幕像素点占比越高，待处理视频帧的字幕被裁的概率越高，第一字幕像素点数量越大，待处理视频帧的字幕被裁的概率越高，因此通过预先设置非字幕像素点占比阈值和第一字幕像素点数量阈值来对字幕被裁情况下待处理识别的字幕像素点占比和非字幕像素点数量进行界定，从而可以尽可能大概率地对视频帧的部分字幕被裁情况进行识别，提高了视频帧部分字幕被裁情况识别的准确性。

可选地，所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数包括：位于所述非内容画面底部位置的第二数量个像素行中第三数量个像素列的，第二字幕像素点数量和非字幕像素点数量，所述第一数量大于第二数量，所述步骤203，包括：在所述第二字幕像素点数量大于第二字幕像素点数量阈值，且所述非字幕像素点数量大于非字幕像素点数量阈值的情况下，确认所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数符合字幕被裁像素分布要求。

需要说明是的，第二数量个像素行是非内容画面的像素点阵列外侧的一个或多个特定像素点行，由于第二数量行统计的预设中间位置的列的像素点数量，因此相对于第一数量个像素行中统计行的像素点数量而言，相同数量行下行像素点的数据量明显大于列像素点的数据量，例如对于分辨率为960*1024的视频帧画面，对于底部40行的像素点数量是40*1024个，而预设中间位置像素点40行中40列的像素点数据量仅为40*40个，预设中间位置像素点的像素点数量明显过少，因此为保证所统计到预设中间位置的像素点的数据指标的充分性，第二数量行的行数需要大于第一数量个像素行的行数。第二数量行预设中间位置是指位于第二数量行中间预设数量列像素点所在的位置。

在本申请实施例中，考虑到通常字幕是添加在非内容画面的中间位置，因此字幕像素点通常会出现在非内容画面的像素点阵列中的中间位置。通过对像素点中间数量设置字幕像素点要求和非字幕像素点中间数量设置非字幕像素点要求即可分析确认待处理视频帧的字幕是否被裁剪。

在本申请实施例中，考虑到预设中间位置的中间第二字幕像素点数量越大，待处理视频帧的部分字幕被裁的概率越大，预设中间位置的非字幕像素点数量越少，待处理视频帧的部分字幕被裁的概率越大，因此通过设置非字幕像素点数量阈值和第二字幕像素点数量阈值来对非字幕像素点数量和第二字幕像素点数量进行界定，可以尽可能大概率地对视频帧的部分字幕被裁情况进行识别，提高了视频帧部分字幕被裁情况识别的准确性。

可选地，参照图3，所述步骤103，包括：

步骤301，所述字幕像素点和所述非字幕像素点的分布参数计算所述待处理视频帧的字幕高度。

在本申请实施例中，字幕高度就是指纵向字幕像素点距离视频帧的底部往内侧方向的长度。考虑到若待处理视频的部分字幕被裁，其被字幕像素点将会出现在非内容画面的底部。

步骤302，在所述字幕高度符合字幕被裁高度要求时，确认所述待处理视频为字幕被裁的目标视频帧。

在本申请实施例中，可对字幕像素点的字幕高度进行统计，从而依据字幕高度是否符合字幕被裁高度要求，即可尽可能大概率地对视频的部分字幕被裁情况进行识别，提高了视频帧的部分字幕被裁情况识别的准确性。

可选地，所述步骤302，包括：在所述字幕高度小于字幕高度阈值时，确认所述待处理视频帧为字幕被裁的目标视频帧。

在本申请实施例中，字幕阈值可以是通过对已被裁剪部分字幕的样本视频帧进行统计分析得到。考虑到若待处理视频的部分字幕被裁，其被字幕像素点将会出现在非内容画面的底部。因此设置用于表征字幕被裁情况下字幕像素点出现的最高高度的字幕高度阈值来对字幕像素点的字幕高度进行界定，从而在该持续高度小于小字幕高度阈值时确定待处理视频帧的字幕已被裁，否则待处理视频帧的字幕未被裁。

本申请实施例通过依据字幕像素点的在非内容画面中的持续高度来确定待处理视频帧的字幕是否被裁，尽可能大概率地对视频帧的部分字幕被裁情况进行识别，提高了视频部分字幕被裁情况识别的准确性。

可选地，参照图4，在所述步骤103之后，所述方法还包括：

步骤104，根据所述目标视频帧在目标视频中的时间戳，计算所述目标视频的字幕被裁持续时长。

在本申请实施例中，字幕被裁持续时长是指已被裁剪部分字幕的目标视频帧的时间戳组成连续时长。考虑到待处理视频中的极少数视频帧的部分字幕被裁对于视频质量的影响几乎可以忽略，若只要存在字幕被裁剪的少量目标视频帧就重新裁剪目标视频的全部或者部分字幕显然会浪费处理资源，因此本申请实施例在对目标视频中的被裁剪部分字幕的目标视频帧进行识别的过程中，还对目标视频帧的时间戳进行统计来得到目标视频的字幕被裁持续时长。

步骤105，在所述字幕被裁持续时长大于持续时长阈值时，对所述目标视频中的目标视频帧执行修复操作。

在本申请实施例中，持续时长阈值可以是对由于字幕被裁影响视频观感的样本视频的字幕被裁视频帧的时间戳组成的持续时长进行分析统计得到。在字幕被裁持续时长大于持续时长阈值时，即可确认目标视频由于字幕被裁剪已经影响到视频观感，此时即可对目标视频的初始视频重新进行字幕裁剪过程以修复目标视频，或者是对目标视频中的字幕被裁的目标视频帧进行修复操作即可，具体视频的字幕修复方式可以根据实际需求设置，此处不做限定。

本申请实施例通过仅对字幕被裁持续时长超过持续时长阈值导致影响视频观感的视频执行修复操作，节省了对极少部分字幕被裁视频执行修复操作所需的处理资源。

图5是本申请实施例提供的一种字幕被裁视频的识别装置30的结构示意图，所述装置包括：

获取模块401，用于获取待处理视频帧，所述待处理视频帧至少包括：内容画面和非内容画面；

识别模块402，用于识别所述非内容画面中的字幕像素点和非字幕像素点；

所述识别模块402，还用于：

可选地，所述识别模块402，还用于：

可选地，所述装置还包括：

对于上述服务器的实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本申请实施例还提供了一种电子设备，如图6所示，包括处理器501、通信接口502、存储器503和通信总线504，其中，处理器501，通信接口502，存储器503通过通信总线504完成相互间的通信，

存储器503，用于存放计算机程序；

处理器501，用于执行存储器503上所存放的程序时，实现上述任一字幕被裁视频的识别方法的步骤。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选地，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本申请提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的字幕被裁视频的识别方法。

在本申请提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的字幕被裁视频的识别方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本申请的保护范围内。

Claims

1.一种字幕被裁视频的识别方法，其特征在于，所述方法包括：

识别所述非内容画面中的字幕像素点和非字幕像素点；

2.根据权利要求1所述的方法，其特征在于，所述分布参数至少包括：所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数，所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数；

3.根据权利要求2所述的方法，其特征在于，所述非内容画面中底部区域的字幕像素点和非字幕像素点的分布参数包括：位于所述非内容画面底部位置的第一数量个像素行的，第一字幕像素点数量和非字幕像素点占比；

4.根据权利要求3所述的方法，其特征在于，所述底部区域中的底部部分区域的字幕像素点和非字幕像素点的分布参数包括：位于所述非内容画面底部位置的第二数量个像素行中第三数量个像素列的，第二字幕像素点数量和非字幕像素点数量，所述第一数量大于第二数量；

5.根据权利要求1所述的方法，其特征在于，所述在所述字幕像素点和所述非字幕像素点的分布参数符合字幕被裁像素分布要求时，确认所述待处理视频帧为字幕被裁的目标视频帧，包括：

6.根据权利要求5所述的方法，其特征在于，所述在所述字幕高度符合字幕被裁高度要求时，确认所述待处理视频为字幕被裁的目标视频帧，包括：

7.根据权利要求1所述的方法，其特征在于，在所述确认所述待处理视频帧为字幕被裁的目标视频帧之后，所述方法还包括：

8.一种字幕被裁视频的识别装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现权利要求1至7中任一所述的字幕被裁视频的识别方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现权利要求1至7中任一所述的字幕被裁视频的识别方法。