WO2018036481A1

WO2018036481A1 - 一种检测场景切换帧的方法、装置和系统

Info

Publication number: WO2018036481A1
Application number: PCT/CN2017/098483
Authority: WO
Inventors: 熊婕; 杨友庆; 黄一宏
Original assignee: 华为技术有限公司
Priority date: 2016-08-23
Filing date: 2017-08-22
Publication date: 2018-03-01
Also published as: CN107770538A; KR20190039265A; EP3499460A4; US20190260999A1; CN107770538B; US10917643B2; EP3499460A1; JP2019528643A

Abstract

本发明公开了一种检测视频中的场景切换帧的方法、装置和系统。在检测视频中的场景切换帧时，根据所述视频的GOP的所有P帧中最大的P帧Pmax的大小P_ｋ ^max与Pmax和Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或平均值的相对大小关系、以及P_ｋ ^max与该GOP中的多个P帧的大小的中值或平均值的相对大小关系判断Pmax是否为场景切换帧，以检测P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

Description

一种检测场景切换帧的方法、装置和系统

技术领域

本发明涉及视频技术领域，尤其涉及一种检测场景切换帧的方法、装置及系统。

背景技术

随着通信技术的发展，IPTV(Internet Protocol Television，因特网协议电视)、OTT等视频业务，已经进入大规模商用阶段。为了保证视频业务的质量，必须对视频质量进行评估，以便及时采取相应的措施进行调整，以保证视频业务的正常运行。因此，如何对视频质量进行准确的评估，便成为一个迫切需要解决的重要问题。

一段视频由多个连续的视频帧序列组成，通常包括不止一个场景，如一段视频包括4个场景，场景1和场景3对应的是拍摄的足球场的视频，场景2和场景4对应的是拍摄的观众席的视频。

在对视频质量进行评估时，需要先检测出场景发生切换的位置，即场景切换帧的位置，进而基于场景评估视频质量。如，对视频进行编码带来的视频编码损伤不仅和视频编码类型、帧率、分辨率和码率相关，还和场景的复杂度有关，因此，在评估视频编码损伤时，需要先检测出场景发生切换的位置。所以，在对视频质量进行评估时，场景切换检测必须非常准确。

在对视频中的各视频帧进行编码时会将各视频帧编码成不同类型的帧，如I帧、P帧、B帧。其中，I帧为帧内预测编码帧，在编码时只参考帧内的数据；P帧为前向预测编码帧，即单向差别帧，记录的是本帧跟之前的一个I帧(或P帧)的差别；B帧为双向预测内插编码帧，即双向差别帧，记录的是本帧与前一帧和后一帧的差别。

标准ITU-T P1201.2所提供的IPTV监控方案提供了一种检测场景切换帧的方法，然而，该现有技术只检测I帧中的场景切换帧，但实际上很多场景切换帧为P帧，因此，根据该现有技术检测场景切换帧会导致漏检。

发明内容

本发明实施例提供一种检测场景切换帧的方法和装置，用于解决现有技术中存在的漏检场景切换帧的问题。

第一方面，提供了一种检测场景切换帧的方法，所述视频包括N个图像组GOP，N为大于等于2的整数，所述方法包括：

确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为

其中K为变量且取值依次从M至N，1≤M≤N；

在确定

和

的相对大小大于或等于第一阈值，且

和

的相对大小大于或等于第二阈值的情况下，确定Pmax为场景切换帧，其中

为Pmax与Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或平均值，

为所述第K个GOP中的多个P帧的大小的中值或平均值；所述第一阈值大于0且小于1，所述第二阈值大于1。

根据本发明第一方面提供的方法，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

在第一方面的第一种可能的实现方式中，

和

的相对大小

具体可以根据公式

或者

计算。

公式

或

可以简单有效地反映出

和

的相对大小关系。

在一种实现方式中，根据公式

计算

相应地，可以根据公式

计算所述第一阈值。

在另一种实现方式中，根据公式

计算

相应地，可以根据公式

计算所述第一阈值。

其中，I_threshold为所述第一阈值，I_median为所述视频中的所有I帧的大小的中值或平均值，P_median为所述视频中的所有P帧的大小的中值或平均值。

因为I_median为所述视频中的所有I帧的大小的中值或平均值，P_median为所述视频中的所有P帧的大小的中值或平均值，所以，通过公式

或

可以准确地计算出有效阈值，从而精确地检测出P帧中的场景切换帧。

结合第一方面或第一方面的第一种可能的实现方式，在第二种可能的实现方式中，

和

的相对大小

具体可以根据公式

计算。公式

可以简单有效地反映出

和

的相对大小关系。

具体可以根据如下公式计算

其中，P-m，…，P-1表示第K个GOP中Pmax之前的P帧，P1，…，Pn表示第K个GOP中Pmax之后的P帧，F用于求P-m，…，P-1，P1，…，Pn的大小的中值或平均值；

m＝min(num_before_P_frames，max_num)

n＝min(num_after_P_frames，max_num)

其中，num_before_P_frames为第K个GOP中Pmax之前的P帧数，num_after_P_frames为第K个GOP中Pmax之后的P帧数，max_num表示预设的需要考虑的帧数。

通过该公式计算

考虑了所述第一视频帧所在GOP中离所述第一视频帧最近的一些视频帧，从而进一步提升了检测P帧中的场景切换帧的准确率。

第二方面，提供了一种实现视频质量评估的方法，所述视频包括N个图像组GOP，N为大于等于2的整数，所述方法包括：

确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为

其中K为变量且取值依次从M至N，1≤M≤N；

在确定

和

的相对大小大于或等于第一阈值，

和

的相对大小大于或等于第二阈值，且所述第K个GOP中没有B帧的情况下，或者在确定

和

的相对大小大于或等于第一阈值，

和

的相对大小大于或等于第二阈值，所述第K个GOP中有B帧，且

和

的相对大小大于或等于第三阈值的情况下，确定Pmax为场景切换帧，其中

为Pmax与Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或均值，

为所述第K个GOP中的多个P帧的大小的中值或平均值，

为Pmax与Pmax之前离Pmax最近的场景切换帧之间的所有B帧的大小的中值或平均值；所述第一阈值大于0且小于1，所述第二阈值大于1，所述第三阈值大于1。

根据本发明第二方面提供的方法，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题，并且，在检测P帧中的场景切换帧时，不仅考虑了I帧和P帧的大小，还考虑了B帧的大小，从而进一步提升了检测P帧中的场景切换帧的准确率。

在第二方面的第一种可能的实现方式中，

和

的相对大小

具体可以根据公式

或者

计算。

公式

或

可以简单有效地反映出

和

的相对大小关系。

在一种实现方式中，可以根据公式

计算

相应地，可以根据公式

计算所述第一阈值。

在另一种实现方式中，可以根据公式

计算

相应地，可以根据公式

计算所述第一阈值。

或

结合第二方面或第二方面的第一种可能的实现方式，在第二种可能的实现方式中，

和

的相对大小

具体可以根据公式

计算。公式

可以简单有效地反映出

和

的相对大小关系。

具体可以根据如下公式计算

m＝min(num_before_P_frames，max_num)

n＝min(num_after_P_frames，max_num)

其中，num_before_P_frames为第K个GOP中Pmax之前的P帧数，num_after_P_frames 为第K个GOP中Pmax之后的P帧数，max_num表示预设的需要考虑的帧数。

通过该公式计算

结合第二方面或第二方面的第一种或第二种可能的实现方式，在第三种可能的实现方式中，

和

的相对大小

具体可以根据公式

或者

计算。

公式

或者

可以简单有效地反映出

和

的相对大小关系。

在一种实现方式中，根据公式

计算

相应地，可以根据公式

计算所述第三阈值。

在另一种实现方式中，根据公式

计算

相应地，可以根据公式

计算所述第三阈值。

其中，B_threshold为所述第三阈值，P_median为所述视频中的所有P帧的大小的中值或平均值，B_median为所述视频中的所有B帧的大小的中值或平均值。

因为P_median为所述视频中的所有P帧的大小的中值或平均值，B_median为所述视频中的所有B帧的大小的中值或平均值，所以，通过公式

或

结合第二方面的第三种可能的实现方式，在第四种可能的实现方式中，在确定第K个GOP的Pmax为场景切换帧后，将所述视频中除去已确定为场景切换帧的P帧之外的其它P 帧的大小的中值或平均值作为新的P_median，并根据公式

或

计算新的B_theeshold，所述新的B_threshold用于判断下一个GOP的Pmax是否为场景切换帧。

根据第二方面的第四种可能的实现方式，第三阈值Bthreshold可以实时更新，及时排除了已经确定为场景切换帧的P帧的影响，因此，可以进一步提升检测P帧中的场景切换帧的准确率。

第三方面，提供了一种用于检测视频中的场景切换帧的检测装置，所述视频包括N个GOP，N为大于等于2的整数，所述检测装置包括：第一确定单元和第二确定单元；

所述第一确定单元，用于确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为

其中K为变量且取值依次从M至N，1≤M≤N；

所述第二确定单元，用于在确定

和

的相对大小大于或等于第一阈值，且

和

根据本发明第三方面提供的检测装置，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

在第三方面的第一种可能的实现方式中，所述第二确定单元，具体可以根据公式

或者

计算

和

的相对大小

公式

或

可以简单有效地反映出

和

的相对大小关系。

在一种实现方式中，所述第二确定单元根据公式

计算

相应地，所述第二确定单元可以根据公式

计算所述第一阈值。

在另一种实现方式中，所述第二确定单元根据公式

计算

相应地，所述第二确定单元可以根据公式

计算所述第一阈值。

或

结合第三方面或第三方面的第一种可能的实现方式，在第二种可能的实现方式中，所述第二确定单元具体可以根据公式

计算

和

的相对大小

公式

可以简单有效地反映出

和

的相对大小关系。

所述第二确定单元具体可以根据如下公式计算

其中，P_m，…，P-1表示第K个GOP中Pmax之前的P帧，P1，…，Pn表示第K个GOP中Pmax之后的P帧，F用于求P_m，…，P-1，P1，…，Pn的大小的中值或平均值；

m＝min(num_before_P_frames，max_num)

n＝min(num_after_P_frames，max_num)

通过该公式计算

第四方面，提供了一种检测视频中的场景切换帧的检测装置，所述视频包括N个图像组GOP，N为大于等于2的整数，所述检测装置包括：第一确定单元和第二确定单元；

其中K为变量且取值依次从M至N，1≤M≤N；

所述第二确定单元，用于在确定

和

的相对大小大于或等于第一阈值，

和

的相对大小大于或等于第一阈值，

和

的相对大小大于或等于第二阈值，所述第K个GOP中有B帧，且

和

为所述第K个GOP中的多个P帧的大小的中值或平均值，

根据本发明第四方面提供的检测装置，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题，并且，在检测P帧中的场景切换帧时，不仅考虑了I帧和P帧的大小，还考虑了B帧的大小，从而进一步提升了检测P帧中的场景切换帧的准确率。

在第四方面的第一种可能的实现方式中，所述第二确定单元，具体可以根据公式

或者

计算

和

的相对大小

公式

或

可以简单有效地反映出

和

的相对大小关系。

在一种实现方式中，所述第二确定单元根据公式

计算

相应地，所述第二确定单元可以根据公式

计算所述第一阈值。

在另一种实现方式中，所述第二确定单元根据公式

计算

相应地，所述第二确定单元可以根据公式

计算所述第一阈值。

或

结合第四方面或第四方面的第一种可能的实现方式，在第二种可能的实现方式中，所述第二确定单元具体可以根据公式

计算

和

的相对大小

公式

可以简单有效地反映出

和

的相对大小关系。

所述第二确定单元具体可以根据如下公式计算

m＝min(num_before_P_frames，max_num)

n＝min(num_after_P_frames，max_num)

通过该公式计算

结合第四方面或第四方面的第一种或第二种可能的实现方式，在第三种可能的实现方式中，所述第二确定单元具体可以根据公式

或者

计算

和

的相对大小

公式

或者

可以简单有效地反映出

和

的相对大小关系。

在一种实现方式中，所述第二确定单元根据公式

计算

相应地，所述第二确定单元可以根据公式

计算所述第一阈值。

在另一种实现方式中，所述第二确定单元根据公式

计算

相应地，所述第二确定单元可以根据公式

计算所述第一阈值。

其中，I_threshold为所述第一阈值，I_median为所述视频中的所有I帧的大小的中值或平均值，B_median为所述视频中的所有B帧的大小的中值或平均值。

因为I_median为所述视频中的所有I帧的大小的中值或平均值，B_median为所述视频中的所有B帧的大小的中值或平均值，所以，通过公式

或

结合第四方面的第三种可能的实现方式，在第四种可能的实现方式中，在确定第K个GOP的Pmax为场景切换帧后，将所述视频中除去已确定为场景切换帧的P帧之外的其它P帧的大小的中值或平均值作为新的P_median，并根据公式

或

计算新的B_threshold，所述新的B_threshold用于判断下一个GOP的Pmax是否为场景切换帧。

根据第四方面的第四种可能的实现方式，第三阈值Bthreshold可以实时更新，及时排除了已经确定为场景切换帧的P帧的影响，因此，可以进一步提升检测P帧中的场景切换帧的准确率。

第五方面，提供了一种检测视频中的场景切换帧的检测装置，所述检测装置包括处理器和存储器；

所述存储器，用于存放计算机操作指令；

所述处理器，用于执行所述存储器中存放的计算机操作指令使得所述检测装置执行本发明第一方面或第一方面的任一可能的实现方式、第二方面或第二方面的任一可能的实现方式所提供的方法。

根据本发明的第五方面提供的检测装置，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

第六方面，提供了一种检测设备，所述检测设备包括媒体单元和检测装置；

所述媒体单元，用于获取所述视频，并将所述视频传输给所述检测装置；

所述检测装置，用于从所述媒体单元获取所述视频，并执行本发明第三方面或第三方面的任一可能的实现方式、第四方面或第四方面的任一可能的实现方式、第五方面或第五方面的任一可能的实现方式所提供的检测装置所执行的操作。

根据本发明的第六方面提供的检测设备，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

第七方面，提供了一种实现视频质量评估的系统，所述系统包括视频服务器、传输设备和视频终端，其中，所述视频服务器发送的视频流经由所述传输设备传输到所述视频终端；

所述传输设备或所述视频终端具体可以包括本发明第三方面或第三方面的任一可能的实现方式、第四方面或第四方面的任一可能的实现方式、第五方面或第五方面的任一可能的实现方式所提供的检测装置；或者，

所述系统还包括第一检测装置，所述第一检测装置具体可以为本发明第三方面或第三方面的任一可能的实现方式、第四方面或第四方面的任一可能的实现方式、第五方面或第五方面的任一可能的实现方式所提供的检测装置，所述传输设备2020或所述视频终端2030与所述第一检测装置相连，并且所述第一检测装置通过与第一检测装置连接的所述传输设备或所述视频终端获取所述视频流。

根据本发明的第七方面提供的系统，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1A和1B是本发明实施例1提供的视频系统100的组网结构示意图；

图2A、2B和2C是本发明实施例1提供的GOP示意图；

图3A、3B和3C是本发明实施例1的实施方式A提供的方法流程示意图；

图4A、4B和4C是本发明实施例1的实施方式B提供的方法流程示意图；

图5A、5B和5C是本发明实施例1提供的GOP示例的示意图；

图6是本发明实施例2提供的检测装置200的结构示意图；

图7是本发明实施例3提供的检测装置1000的结构示意图；

图8是本发明实施例4提供的检测设备400的结构示意图；

图9A-9C是本发明实施例5提供的系统2000的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1A为本发明实施例提供的一种视频系统100的组网结构示意图，视频系统100包括视频服务器110、一个或多个传输设备120和视频终端130，其中，视频服务器110发送的视频流经由所述传输设备120传输到视频终端130。

视频系统100具体可以是如图1B所示的IPTV系统。在该IPTV系统中，视频服务器110具体为视频头端(video headEnd，video HE)，传输设备120具体包括核心路由器(Core Router，CR)、宽带网络网关(Broadband Network Gateway，BNG)、光线路终端(Optical Line Terminal，OLT)等网络设备，视频终端130具体为机顶盒(Set Top Box，STB)。

在如图1A、1B所示的视频系统中，当视频流从视频服务器传送到视频终端时，由于所经过的网络状态的变化，会导致视频流出现丢包、时延、抖动、乱序等异常现象。这些异常现象会造成视频终端屏幕上所播放的视频画面出现花屏、卡顿等缺陷，导致用户的视频观看体验下降。因此，需要通过视频质量评估对用户的视频体验进行监控。

在对视频质量进行评估时，往往需要先检测出场景发生切换的位置，即场景切换帧的位置，进而基于场景评估视频质量。

如，对视频进行编码带来的视频编码损伤不仅和视频编码类型、帧率、分辨率和码率相关，还和场景的复杂度有关，因此，在评估视频编码损伤时，需要先检测出场景发生切换的位置。

又如，当视频传输过程中发生丢包时，视频终端的解码器通常会将受损帧的前一帧中对应区域的视频内容作为受损帧中受损区域的内容来对受损帧进行错误补偿，因此受损帧与前一帧的内容差距越小，补偿效果越好，而当受损帧为场景切换帧时，由于场景切换帧与其前一帧的内容几乎完全不同，此时的补偿效果是最差的，因此，在对丢包所导致的视频质量造成的影响时，需要考虑受损帧是否为场景切换帧。

再如，编码后的视频帧序列由多个图像组(Group of Picture，GOP)组成，如图2A所示，每个GOP由I帧开始，随后是一些P帧和B帧，到下一个I帧的前一帧结束。I帧为帧内编码帧，P帧为前向参考帧，B帧为双向参考帧。当一个GOP中的某一帧发生丢包时时，丢包导致的解码错误会在后面的视频帧中持续扩散，通常认为扩散直至该GOP的最后一帧。如图2B所示，GOP1中第四帧受损时，通常认为错误会一直扩散至该GOP的最后一帧。但是当GOP中有场景切换帧时，由于场景切换帧与其前面的帧的内容几乎完全不同，编码时多采用帧内预测编码(该场景切换帧中的宏块大多采用帧内预测编码)，因此，如果该GOP内的且位于该场景切换帧之前的某一帧受损，错误扩散会在场景切换帧截止，如图2C所示，GOP1中第六帧为场景切换帧，当第四帧受损时，错误扩散至第六帧就截止了。所以，在对丢包所导致的视频质量造成的影响时，需要检测场景切换帧。

需要说明的是，在本发明实施例中所说的各个帧之间的前后顺序，指的是所指代的帧在视频中的时间上的前后，如，一个时长为T(如10秒)的视频包括一个时刻t1处的视频帧1和一个时刻t2处的视频帧2，如果t1小于t2，如t1为1秒30毫秒，t2为5秒40毫秒，则认为视频帧1在视频帧2的前面。

在具体实现时，可以在视频系统中部署用于实现场景切换帧检测的检测装置。该检测装置可以部署在视频流所经过的任一设备(如传输设备120、视频终端130)上，也可以旁挂到视频流所经过的任一设备上并通过镜像的方式获取视频流。

图3A和3B是本发明实施例1提供的方法流程示意图，本发明实施例1的方法可以应用于图1A、1B所示的视频系统100，由检测装置执行。

在本发明实施例1中，对视频(后续称为待检视频)中的场景切换帧进行检测。所述待检视频可以是从视频文件中读取的，也可以是从获取的视频流中获取的。所述待检视频具体可以是一个完整的视频，也可以是一个视频中的一个视频段。对于较长的视频，通常会设置测量时间窗口，对该测量时间窗口中的视频段进行检测，如，在对一个视频进行检测时，将测量时间窗口的长度设置为10秒，则先对该视频的0-10秒的视频段作为待检视频进行检测，再对10-20秒的视频段作为待检视频进行检测，依次类推。

在检测之前，检测模块可以先确定所述待检视频中的各视频帧的类型(如I帧、P帧、B帧)和大小。

如，实时获取视频流，从对应测量时间窗口(如10-20秒)的视频流的分组报文中提取视频帧的信息，计算视频帧的大小(单位为字节)。具体计算视频帧的大小的过程是循环该测量时间窗口内所有的分组报文，先从分组报文的头中找到当前视频帧的开始标识，然后将包括该开始标识的报文的负载长度以及后续的各分组报文的负载长度累加起来，直至发现下一个视频帧的开始标识，累加和便是当前视频帧的大小。计算视频帧的大小的具体实现方式可参见标准ITU-T P1201.2。

然后确定测量时间窗口内的所有视频帧的类型。具体可以根据分组报文的报文头中的字段random_access_indicator确定视频帧的类型。针对I帧，无论加密与否，都可以通过random_access_indicator确定帧的类型。针对非I帧，当视频没有加密时，可直接从视频帧的帧头中获取帧类型，当视频加密时，或视频帧的帧头丢失时，可先根据帧大小或帧的显示时间戳(Present Time Stamp，PTS)估计GOP模式，GOP模式一般是P B B P B B或P B B B P B B B。当前PTS值和上一个PTS值之间的差值能够描述GOP的模式。一旦GOP模式确定了，所有丢失或被加密的视频帧的模式即可被确定。确定视频帧的类型的具体实现方式可参见标准ITU-T P1201.2。

通过上述两步，便可将待检视频分成若干个GOP。一个待检视频通常包括多个GOP，假定为N个，N为大于等于2的整数，如图5A所示的示例。在如图5A所示的示例中，纯色阴影填充的视频帧为I帧，斜线阴影填充的视频帧为P帧，无填充色的视频帧为B帧。

一个视频帧为一幅图像，在对视频中的各视频帧进行编码时会将各视频帧编码成不同类型的帧，如I帧、P帧、B帧。其中，I帧为帧内预测编码帧，在编码时只参考帧内的数据，因此包含完整的图像数据；P帧为前向预测编码帧，即单向差别帧，记录的是本帧跟之前的一个I帧(或P帧)的差别；B帧为双向预测内插编码帧，即双向差别帧，记录的是本帧与前一帧和后一帧的差别。

I帧普遍大于P帧，P帧普遍大于B帧。通常I帧大小是P帧大小的2-5倍，P帧大小是B帧大小的2-5倍。

由于场景切换帧与其前一帧的内容差异较大，因此场景切换帧即便被编码为P帧，该场景切换帧中的宏块也大多采用帧内预测编码方式参考本帧内的其它宏块进行编码，所以，会比较大。如果P帧的大小超过I帧的一半，那么该P帧很可能就是场景切换帧，因此，在检测P帧类型的场景切换帧时，P帧与I帧的相对大小关系可以参考。

然而，当视频中的画面内容变化比较快时，如拍摄的激烈的足球赛事等运动比较剧烈的场面，由于前后视频帧之间的相关性小，在对非场景切换帧进行编码时，即便参考前一视频帧将其编码为P帧，压缩率也会比较低，此时P帧的大小也会比较大，甚至会超过I帧大小的一半。在这种情况下，不是场景切换帧的相邻P帧之间的大小差距并不大，而是场景切换帧的P帧和其相邻的不是场景切换帧的P帧的大小差距则比较大，因此，在检测P帧类型的场景切换帧时，相邻P帧之间大小的比值也可以参考。

基于上述分析，下面结合图3A对本发明实施例1的实施方式A详加阐述，以检测待检视频中的场景切换帧，所述视频包括N个GOP，N为大于等于2的整数。

所述待检视频，可以是视频文件中的一段视频，也可以是视频流中的一段视频，如视频服务器发送给视频终端的视频流中的一段视频，相应地，所述检测装置，可以内置于所述视频流所经过的任一设备(如传输设备120、视频终端130)上，也可以旁挂到所述视频流所经过的任一设备上并通过镜像的方式获取所述视频流。

如图3A所示，本发明实施例1的实施方式A提供的方法包括：

所述检测装置从所述N个GOP中的第M个GOP开始依次对每个GOP执行如下操作以判断每个GOP中的所有P帧中最大的P帧Pmax是否为场景切换帧，其中M大于等于1且小于等于N。

具体可以从第一个GOP开始检测，即M等于1。也可以从第一个GOP后面的某个GOP开始检测，例如，待检视频是一个视频流中开始的一段视频，由于前两个GOP中的帧大小一般不太具有可参考性，通常从第三个GOP开始检测，则M等于3。

步骤102：确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为

其中K为变量且取值依次从M至N，1≤M≤N。

步骤103：在确定

和

的相对大小大于或等于第一阈值，且

和

另外，在确定

和

的相对大小小于第一阈值，或

和

的相对大小小于第二阈值的情况下，确定Pmax不为场景切换帧。

如图5B所示，第K个GOP中的第二个P帧为Pmax，第K个GOP的I帧不是场景切换帧，第K-1个GOP中没有场景切换帧，第K-2个GOP的第三个P帧(后续称为P’max)为场景切换帧，则Pmax之前离Pmax最近的场景切换帧为P’max。

在具体实现时，在步骤102之前还可以将第一个GOP的I帧确定为场景切换帧，则当第K个GOP的Pmax和第一个GOP的I帧之间没有场景切换帧时，Pmax之前离Pmax最近的场景切换帧即为第一个GOP的I帧。如果所述待检视频是一个视频中的视频片段且待检视频之前有已经检测过场景切换帧的视频片段(后续称为前一视频片段)，则Pmax之前离Pmax最近的场景切换帧可能位于所述前一视频片段中。

在计算

时，可以利用Pmax与Pmax之前离Pmax最近的场景切换帧之间的所有或部分I帧的大小的中值或平均值。如图5B所示，第K个GOP中的第二个P帧为Pmax，Pmax之前离Pmax最近的场景切换帧为P’max，Pmax和P’max之间包含两个I帧I_k和I_k-1，

指的就是I_k和I_k-1的大小的平均值。

可以为所述第K个GOP中的所有或部分P帧的大小的中值或平均值。一种优选的实施方式如下：

根据如下公式计算

m＝min(num_before_P_frames，max_num)

n＝min(num_after_P_frames，max_num)

其中，num_before_P_frames为第K个GOP中Pmax之前的P帧数，num_after_P_frames为第K个GOP中Pmax之后的P帧数，max_num表示预设的需要考虑的帧数。如图5C所示，num_before_P_frames等于7，num_after_P_frames等于4，max_num设置为6，此时m等于6，n等于4。

通过该公式计算

在具体实现时，可以根据如下公式计算

和

的相对大小

或者，

公式

可以简单有效地反映出

和

的相对大小关系。

所述第一阈值可以预先设置，同一待检视频中不同GOP可以采用相同的第一阈值。如当根据公式

计算

时，将所述第一阈值设置为0.53，如当根据公式

计算

时，将所述第一阈值设置为0.47。

所述第一阈值也可以是计算出来并可以进行动态调整的，从而进一步提高检测的准确性。计算并动态调整的过程如下：

在对该待检视频的第M个GOP进行检测之前先根据如下公式计算第一阈值：

或者，

其中，I_median为所述待检视频中的所有I帧的大小的中值或平均值，P_median为所述待检视频中的所有P帧的大小的中值或平均值。以中值为例，如，所述待检视频中包括9个P帧，大小分别为3 5 3 6 4 7 3 5 4，按照大小顺序排列为3 3 3 4 4 5 5 6 7，则P_median为4；所述待检视频中包括3个P帧，大小分别为15 12 18，按照大小顺序排列为12 15 18，则I_median为15。

或

然后，在每次确定出一个新的类型为P帧的场景切换帧后，如确定第K个GOP的Pmax为场景切换帧后，可以将所述待检视频中除去已确定为场景切换帧的P帧之外的其它P帧的大小的中值或平均值作为新的P_median，并公式

或

计算新的I_threshold，并利用所述新的I_threshold判断后续GOP(如所述第K个GOP的下一个GOP)的Pmax是否为场景切换帧。

由于第一阈值I_threshold可以实时更新，及时排除了已经确定为场景切换帧的P帧的影响，因此，可以进一步提升检测P帧中的场景切换帧的准确率。

具体实现方式可以是，若所述第一阈值根据公式

获得，所述

和

的相对大小

为：

若所述第一阈值根据公式

获得，所述

和

的相对大小

为：

在具体实现时，可以根据如下公式计算

和

的相对大小

公式

可以简单有效地反映出

和

的相对大小关系。

所述第二阈值通常可以预先设置，同一待检视频中不同GOP可以采用相同的第二阈值，如设置为1.51。

本发明实施例1的实施方式A还可以包括步骤101。

步骤101：从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧。

在步骤101中，在判断第K个GOP的I帧是否为场景切换帧时，具体可以根据所述第K个GOP的I帧的大小与第K-1个GOP的I帧的大小的比值、第K-1个GOP内的所有P帧的大小的平均值与所述第K个GOP内的所有P帧的大小的平均帧的比值、以及第K-1个GOP内的所有B帧的大小的平均值与所述第K个GOP内的所有B帧的大小的平均帧的比值判断所述第K个GOP的I帧是否为场景切换帧。具体实现方式如下：

1、计算第K个GOP的I帧的大小与第K-1个GOP的I帧的大小的比值r_I；

2、计算第K-1个GOP内的所有P帧的大小的平均值与第K个GOP内的所有P帧的大小的平均帧的比值r_P；

3、计算第K-1个GOP的所有B帧的大小的平均值与第K个GOP内的所有B帧的大小的平均帧的比值r_B；

4、如果比值r_I大于第一阈值或小于第二阈值，则进一步判断下列条件(1)和条件(2)，否则，确定第K个GOP的I帧不是场景切换帧。

条件(1)r_P小于阈值第三阈值或r_P大于第四阈值

条件(2)r_B小于阈值第五阈值或r_B大于第六阈值

如果条件(1)和条件(2)均满足，确定第K个GOP的I帧为场景切换帧，否则，确定第K个GOP的I帧不是场景切换帧。

上述实现方式的具体细节可参见标准ITU-T P1201.2。

在具体实现时，可以直接将第一个GOP的I帧确定为场景切换帧，并在K不等于1时利用上述方法判断第K个GOP的I帧是否为场景切换帧。

在具体实现时，如图3B所示，可以采用实现方式J实现实施方式A：先执行步骤101再执行步骤102-103，即，先检测出第M个GOP至第N个GOP的I帧中的场景切换帧再检测第M个GOP至第N个GOP的P帧中的场景切换帧。如，先将GOP1的I帧确定为场景切换帧，再判断GOPM(如GOP1)至GOPN中的I帧是否为场景切换帧，然后依次判断GOPM(如GOP1)至GOPN中的Pmax是否为场景切换帧。

在具体实现时，如图3C所示，也可以采用实现方式K实现实施方式A：将步骤101贯穿到步骤102-103中，按照视频帧的顺序依次检测场景切换帧，即，从第M个(如第一个)GOP开始根据GOP的顺序逐个GOP检测当前GOP中的场景切换帧，并在检测当前GOP中的场景切换帧时先判断当前GOP中的I帧是否为场景切换帧再判断当前GOP中的Pmax是否为场景切换帧。如，先将GOP1的I帧确定为场景切换帧，然后依次判断GOP1的Pmax、GOP2的I帧、GOP2的Pmax、GOP3的I帧、GOP3的Pmax、……、GOPN的I帧、GOPN的Pmax是否为场景切换帧。简而言之，即是在K小于N时，在判断第K个GOP的Pmax是否为场景切换帧之后判断第K+1个GOP的I帧是否为场景切换帧。

如果采用实现方式K来实现实施方式A，由于场景在短时间内连续发生切换的几率较低，所以，在判断某个I帧是否为场景切换帧前，还可以先计算该I帧与前一个场景切换帧之间的距离(后续称为第一距离)，如果所述第一距离小于或等于距离阈值，则确定该I帧不是场景切换帧，否则，可以进一步根据标准ITU-T P1201.2提供的方法判断该I帧是否为场景切换帧。具体实现方式为：当K小于N时，在判断第K个GOP的Pmax是否为场景切换帧之后，在确定所述第K+1个GOP的I帧(后续称为当前I帧)和所述当前I帧之前离所述当前I帧最近的场景切换帧之间的距离小于或等于距离阈值时，确定所述当前I帧不是场景切换帧，否则，可以进一步根据标准ITU-T P1201.2提供的方法判断所述当前I帧是否为场景切换帧。

本发明所说的两个视频帧之间的距离，指的是两个视频帧之间相差多少个视频帧，第X个视频帧和第Y个视频帧之间的距离为Y-N，两个相邻视频帧之间的距离为1。

所述距离阈值可以预先设置，同一待检视频中不同GOP可以采用相同的距离阈值。

所述距离阈值也可以是确定出来并进行动态调整的，从而进一步提高检测的准确性。确定并动态调整距离阈值的过程如下：

在从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧之前，先确定初始距离阈值，确定的初始距离阈值可以为如下三个长度中的其中一个：

(1)所述N个GOP中长度最长的GOP的长度；

(2)所述N个GOP的长度的平均值；

(3)长度L，其中，所述N个GOP中长度为L的GOP的数量最多。

本发明所说的GOP的长度指的是GOP所包括的视频帧的数量。

如，所述待检视频包括8个GOP，长度依次为10 6 8 7 8 7 9 8，根据方式(1)确定的初始距离阈值为10；根据方式(2)确定的初始距离阈值为8；根据方式(3)确定的初始距离阈值为8，因为长度为8的GOP的数量最多。

当采用固定GOP长度编码时，每个GOP的长度是相同的，则通过上述三种方式算出的初始距离阈值是一样的。

然后，在确定出一个新的场景切换帧时，如果所述新的场景切换帧与所述新的场景切换帧之前离所述新的场景切换帧最近的场景切换帧的距离(后续称为第二距离)小于所述距离阈值，将所述距离阈值更新为所述第二距离。

根据本发明的实施例1的实施方式A，在检测视频中的场景切换帧时，根据所述视频的GOP的所有P帧中最大的P帧Pmax的大小

与Pmax和Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或平均值的相对大小关系、以及

与该GOP中的多个P帧的大小的中值或平均值的相对大小关系判断Pmax是否为场景切换帧，以检测P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

另外，在视频编码时，P帧普遍大于B帧，通常P帧大小是B帧大小的2-5倍。由于场景切换帧与其前一帧的内容差异较大，因此场景切换帧即便被编码为P帧，该场景切换帧中的宏块也大多采用帧内预测编码，所以，会比较大。如果P帧大小小于B帧的2倍，那么该P帧有可能是场景切换帧，因此，在检测P帧类型的场景切换帧时，P帧与B帧的相对大小关系可以参考。

基于上述分析，下面结合图4A对本发明实施例1的实施方式B详加阐述，以检测待检视频中的场景切换帧，所述视频包括N个GOP，N为大于等于2的整数。

如图4A所示，本发明实施例1的实施方式B提供的方法包括：

步骤202：同步骤102，不再赘述。

步骤203：在确定

和

的相对大小大于或等于第一阈值，

和

的相对大小大于或等于第一阈值，

和

的相对大小大于或等于第二阈值，所述第K个 GOP中有B帧，且

和

为Pmax与Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的均值，

为所述第K个GOP中的多个P帧的大小的中值或平均值，

另外，还可以在确定

和

的相对大小小于第一阈值，或

和

的相对大小小于第二阈值、或

和

的相对大小小于第三阈值的情况下，确定Pmax不为场景切换帧。

其中，确定

和

的相对大小大于或等于第一阈值的方法、

和

的相对大小大于或等于第二阈值的方法，同步骤102，不再赘述。

在具体实现时，可以根据如下公式计算

和

的相对大小

或者，

公式

或

可以简单有效地反映出

和

的相对大小关系。

所述第三阈值可以预先设置，同一待检视频中不同GOP可以采用相同的第三阈值。如当根据公式

计算

时，将所述第一阈值设置为2.87，如当根据公式

计算

时，将所述第一阈值设置为1.87。

所述第三阈值也可以是计算出来并进行动态调整的，从而进一步提高检测的准确性。计算并动态调整的过程如下：

在对该待检视频的第M个GOP进行检测之前先根据如下公式计算第三阈值：

或者，

其中，B_threshold为所述第三阈值，P_median为所述视频中的所有P帧的大小的中值或平均值，Bmedian为所述待检视频中的所有B帧的大小的中值或平均值。

或

然后，在每次确定出一个新的类型为P帧的场景切换帧后，如确定第K个GOP的Pmax为场景切换帧后，可以将所述待检视频中除去已确定为场景切换帧的P帧之外的其它P帧的大小的中值或平均值作为新的P_median，并根据据公式

或

计算新的B_threshold，所述新的B_threshpld用于判断下一个GOP的Pmax是否为场景切换帧。

由于第三阈值Bthreshold可以实时更新，及时排除了已经确定为场景切换帧的P帧的影响，因此，可以进一步提升检测P帧中的场景切换帧的准确率。

本发明实施例1的实施方式B还可以包括步骤201，同步骤101，不再赘述。

在具体实现时，也可以采用与实施方式A的两种实现方式(实现方式J和实现方式K)类似的实现方式来实现实施方式B，分别如图4B和4C所示。

根据本发明的实施例1的实施方式B，在检测视频中的场景切换帧时，根据所述视频的GOP的所有P帧中最大的P帧Pmax的大小

与Pmax和Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或平均值的相对大小关系、

与该GOP中的多个P 帧的大小的中值或平均值的相对大小关系、以及

与Pmax和Pmax之前离Pmax最近的场景切换帧之间的所有B帧的大小的中值或平均值的相对大小关系判断Pmax是否为场景切换帧，以检测P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题，并且，在检测P帧中的场景切换帧时，不仅考虑了I帧和P帧的大小，还考虑了B帧的大小，从而进一步提升了检测P帧中的场景切换帧的准确率。

根据本发明实施例1，本发明实施例2提供了一种用于检测视频中的场景切换帧的检测装置200，所述视频包括N个GOP，N为大于等于2的整数。如图6所示，检测装置200包括第一确定单元210和第二确定单元220。

实施例2的第一种实施方式对应实施例1的实施方式A，如下：

所述第一确定单元210，用于确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为

其中K为变量且取值依次从M至N，1≤M≤N。

所述第二确定单元220，用于在确定

和

的相对大小大于或等于第一阈值，且

和

具体地，所述第一确定单元210具体可以用于执行上述实施例1的实施方式A所述的方法的步骤102，所述第二确定单元220具体可以用于执行上述实施例1的实施方式A所述的方法的步骤103。

进一步地，所述第二确定单元220还可以用于从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧，具体可以用于执行上述实施例1的实施方式A所述的方法的步骤101。

实施例2的第二种实施方式对应实施例1的实施方式B，如下：

其中K为变量且取值依次从M至N，1≤M≤N。

所述第二确定单元220，用于在确定

和

的相对大小大于或等于第一阈值，

和

的相对大小大于或等于第一阈值，

和

的相对大小大于或等于第二阈值，所述第K个GOP中有B帧，且

和

为所述第K个GOP中的多个P帧的大小的中值或平均值，

具体地，所述第一确定单元210具体可以用于执行上述实施例1的实施方式B所述的方法的步骤202，所述第二确定单元220具体可以用于执行上述实施例1的实施方式B所述的方法的步骤203。

进一步地，所述第二确定单元220还可以用于从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧，具体可以用于执行上述实施例1的实施方式B所述的方法的步骤201。

根据本发明的实施例2，在检测视频中的场景切换帧时，不仅检测I帧中的场景切换帧，还根据所述视频的GOP的所有P帧中最大的P帧Pmax的大小

与该GOP中的多个P帧的大小的中值或平均值的相对大小关系判断Pmax是否为场景切换帧，以实现检测P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。根据本发明的实施例2的实施方式B，在检测P帧中的场景切换帧时，不仅考虑了I帧和P帧的大小，还考虑了B帧的大小，从而进一步提升了检测P帧中的场景切换帧的准确率。

根据本发明实施例1，本发明实施例3提供了一种检测装置1000，如图7所示，检测装置1000包括处理器1010和存储器1020，其中，处理器1010和存储器1020之间通过总线完成相互间的通信。

存储器1020，用于存放计算机操作指令。存储器1020可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。

处理器1010，用于执行存储器1020中存放的计算机操作指令。处理器1010具体可以是中央处理器(CPU，central processing unit)，是计算机核心单元。

其中，处理器1010执行所述计算机操作指令使得检测装置1000执行上述实施例1所述的方法。

根据本发明的实施例3，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

根据本发明实施例1-3，本发明实施例4提供了一种检测设备400。如图8所示，所述检测设备400包括媒体单元4010和检测装置4020。

所述媒体单元4010，用于获取所述视频(后续称为待检视频)，并将所述视频传输给所述检测装置4020。所述媒体单元4010具体可以从视频文件中读取所述待检视频，也可以是从接收的视频服务器发送的媒体流中获取所述待检视频。所述待检视频具体可以是一个完整的视频，也可以是一个视频中的一个视频段，如果是视频段，所述媒体单元4010可以将所述视频段所在的视频(即包括所述视频段的视频)传输给所述检测装置4020并由所述检测装置4020对接收的视频中的视频段进行检测以检测出所述待检视频中的场景切换帧。

所述检测装置4020，具体可以为实施例2提供的检测装置200或实施例3提供的检测装置1000，用于从所述媒体单元4010获取所述待检视频并执行实施例2提供的检测装置200或实施例3提供的检测装置1000所执行的操作。

所述检测装置4020还可以进一步根据检测出的场景切换帧对所述待检视频或所述待检视频所在的视频的质量进行评估。

根据本发明的实施例4，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

根据本发明实施例1-3，本发明实施例5提供了一种实现视频质量评估的系统2000。如图9A所示，系统2000包括视频服务器2010、传输设备2020和视频终端2030，其中，所述视频服务器2010发送的视频流经由所述传输设备2020传输到所述视频终端2030。

在一种具体实现方式中，所述传输设备2020或所述视频终端2030具体可以包括实施例2提供的检测装置200或实施例3提供的检测装置1000。在具体实现时，所述传输设备2020和所述视频终端2030可以均包括实施例2提供的检测装置200或实施例3提供的检测装置1000。所述传输设备2020或所述视频终端2030具体可以为实施例4提供的检测设备400。

在另一种具体实现方式中，所述系统还包括检测装置2040，如图9B和9C所示，所述检测装置2040具体可以为实施例2提供的检测装置200或实施例3提供的检测装置1000，所述传输设备2020或所述视频终端2030与所述检测装置2040相连，并且所述检测装置2040通过与所述检测装置2040连接的所述传输设备2020或所述视频终端2030获取所述视频流。在具体实现时，所述传输设备2020和所述视频终端2030可以分别与一个检测装置2040相连。

根据本发明的实施例5，在检测视频中的场景切换帧时，可以检测出P帧中的场景切换帧，从而有效减少了漏检场景切换帧的问题。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

一种检测视频中的场景切换帧的方法，其特征在于，所述视频包括N个图像组GOP，N为大于等于2的整数，所述方法包括：

确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为
其中K为变量且取值依次从M至N，1≤M≤N；

在确定
和
的相对大小大于或等于第一阈值，且
和
的相对大小大于或等于第二阈值的情况下，确定Pmax为场景切换帧，其中
为Pmax与Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或平均值，
为所述第K个GOP中的多个P帧的大小的中值或平均值；所述第一阈值大于0且小于1，所述第二阈值大于1。
如权利要求1所述的方法，其特征在于，所述方法还包括：

根据公式
计算所述第一阈值；或者，

根据公式
计算所述第一阈值；

其中，I_threshold为所述第一阈值，I_median为所述视频中的所有I帧的大小的中值或平均值，P_median为所述视频中的所有P帧的大小的中值或平均值。
如权利要求2所述的方法，其特征在于，

若所述第一阈值根据公式
获得，所述
和
的相对大小
为：

若所述第一阈值根据公式
获得，所述
和
的相对大小
为：
如权利要求2或3所述的方法，其特征在于，所述方法还包括：

在确定第K个GOP的Pmax为场景切换帧后，将所述视频中除去已确定为场景切换帧的P帧之外的其它P帧的大小的中值或平均值作为新的P_median，并根据公式
或
计算新的I_threshold，所述新的I_threshold用于判断下一个GOP的Pmax是否为场景切换帧。
如权利要求1-4任一所述的方法，其特征在于，所述方法还包括：从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧；

其中，在K小于N时，在判断第K个GOP的Pmax是否为场景切换帧之后判断第K+1个GOP的I帧是否为场景切换帧；

所述从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧具体包括：在确定第一距离小于或等于距离阈值时，确定所述第K+1个GOP的I帧不是场景切换帧，所述第一距离为所述第K+1个GOP的I帧和所述第K+1个GOP的I帧之前离所述第K+1个GOP的I帧最近的场景切换帧之间的距离。
如权利要求5所述的方法，其特征在于，所述方法还包括：

设置所述距离阈值，所述距离阈值为如下三个长度中的其中一个：

所述N个GOP中长度最长的GOP的长度；

所述N个GOP的长度的中值或平均值；

长度L，其中，所述N个GOP中长度为L的GOP的数量最多。
如权利要求5或6所述的方法，其特征在于，在确定出一个新的场景切换帧时，如果第二距离小于所述距离阈值，将所述距离阈值更新为所述第二距离，其中，所述第二距离具体为所述新的场景切换帧与所述新的场景切换帧之前离所述新的场景切换帧最近的场景切换帧之间的距离。
一种检测视频中的场景切换帧的方法，其特征在于，所述视频包括N个图像组GOP，N为大于等于2的整数，所述方法包括：

确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为
其中K为变量且取值依次从M至N，1≤M≤N；

在确定
和
的相对大小大于或等于第一阈值，
和
的相对大小大于或等于第二阈值，且所述第K个GOP中没有B帧的情况下，或者在确定
和
的相对大小大于或等于第一阈值，
和
的相对大小大于或等于第二阈值，所述第K个GOP中有B帧，且
和
的相对大小大于或等于第三阈值的情况下，确定Pmax为场景切换帧，其中
为Pmax与Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或均值，
为所述第K个GOP中的多个P帧的大小的中值或平均值，
为Pmax与Pmax之前离Pmax最近的场景切换帧之间的所有B帧的大小的中值或平均值；

所述第一阈值大于0且小于1，所述第二阈值大于1，所述第三阈值大于1。
如权利要求8所述的方法，其特征在于，所述方法还包括：

根据公式
计算所述第一阈值；或者，

根据公式
计算所述第一阈值；

其中，I_threshold为所述第一阈值，I_median为所述视频中的所有I帧的大小的中值或平均值，P_median为所述视频中的所有P帧的大小的中值或平均值。
如权利要求8或9所述的方法，其特征在于，所述方法还包括

根据公式
计算所述第三阈值；或者，

根据公式
计算所述第三阈值；

其中，B_threshold为所述第三阈值，P_median为所述视频中的所有P帧的大小的中值或平均值，B_median为所述视频中的所有B帧的大小的中值或平均值。
如权利要求8-10任一所述的方法，其特征在于，所述方法还包括：

在确定第K个GOP的Pmax为场景切换帧后，将所述视频中除去已确定为场景切换帧的P帧之外的其它P帧的大小的中值或平均值作为新的P_median，并根据公式
或
计算新的I_threshold，所述新的I_threshold用于判断下一个GOP的Pmax是否为场景切换帧。
如权利要求8-11任一所述的方法，其特征在于，所述方法还包括：从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧；

其中，在K小于N时，在判断第K个GOP的Pmax是否为场景切换帧之后判断第K+1个GOP的I帧是否为场景切换帧；

所述从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧具体包括：在确定第一距离小于或等于距离阈值时，确定所述第K+1个GOP的I帧不是场景切换帧，所述第一距离为所述第K+1个GOP的I帧和所述第K+1个GOP的I帧之前离所述第K+1个GOP的I帧最近的场景切换帧之间的距离。
如权利要求12所述的方法，其特征在于，所述方法还包括：

设置所述距离阈值，所述距离阈值为如下三个长度中的其中一个：

所述N个GOP中长度最长的GOP的长度；

所述N个GOP的长度的中值或平均值；

长度L，其中，所述N个GOP中长度为L的GOP的数量最多。
如权利要求13所述的方法，其特征在于，在确定出一个新的场景切换帧时，如果第二距离小于所述距离阈值，将所述距离阈值更新为所述第二距离，其中，所述第二距离具体为所述新的场景切换帧与所述新的场景切换帧之前离所述新的场景切换帧最近的场景切换帧之间的距离。
一种用于检测视频中的场景切换帧的检测装置，其特征在于，所述视频包括N个GOP，N为大于等于2的整数，所述检测装置包括：第一确定单元和第二确定单元；

所述第一确定单元，用于确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为
其中K为变量且取值依次从M至N，1≤M≤N；

所述第二确定单元，用于在确定
和
的相对大小大于或等于第一阈值，且
和
的相对大小大于或等于第二阈值的情况下，确定Pmax为场景切换帧，其中
为Pmax与Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或平均值，
为所述第K个GOP中的多个P帧的大小的中值或平均值；所述第一阈值大于0且小于1，所述第二阈值大于1。
如权利要求15所述的检测装置，其特征在于，

所述第二确定单元，还用于根据公式
计算所述第一阈值；或者，根据公式
计算所述第一阈值；

其中，I_threshold为所述第一阈值，I_median为所述视频中的所有I帧的大小的中值或平均值， P_median为所述视频中的所有P帧的大小的中值或平均值。
如权利要求16所述的检测装置，其特征在于

若所述第一阈值根据公式
获得，所述
和
的相对大小
为：

若所述第一阈值根据公式
获得，所述
和
的相对大小
为：
如权利要求16或17所述的方法，其特征在于，

所述第二确定单元，还用于在确定第K个GOP的Pmax为场景切换帧后，将所述视频中除去已确定为场景切换帧的P帧之外的其它P帧的大小的中值或平均值作为新的P_median，并根据公式
或
计算新的I_threshold，所述新的I_threshold用于判断下一个GOP的Pmax是否为场景切换帧。
如权利要求15-18任一所述的检测装置，其特征在于，所述第二确定单元，还用于从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧；

其中，在K小于N时，所述第二确定单元在判断第K个GOP的Pmax是否为场景切换帧之后判断第K+1个GOP的I帧是否为场景切换帧；

所述第二确定单元用于从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧，具体包括：用于在确定第一距离小于或等于距离阈值时，确定所述第K+1个GOP的I帧不是场景切换帧，所述第一距离为所述第K+1个GOP的I帧和所述第K+1个GOP的I帧之前离所述第K+1个GOP的I帧最近的场景切换帧之间的距离。
如权利要求19所述的检测装置，其特征在于，所述第二确定单元，还用于设置所述距离阈值，所述距离阈值为如下三个长度中的其中一个：

所述N个GOP中长度最长的GOP的长度；

所述N个GOP的长度的中值或平均值；

长度L，其中，所述N个GOP中长度为L的GOP的数量最多。
如权利要求19或20所述的检测装置，其特征在于，所述第二确定单元，还用于：在确定出一个新的场景切换帧时，如果第二距离小于所述距离阈值，将所述距离阈值更新为所述第二距离，其中，所述第二距离具体为所述新的场景切换帧与所述新的场景切换帧之前离所述新的场景切换帧最近的场景切换帧之间的距离。
一种检测视频中的场景切换帧的检测装置，其特征在于，所述视频包括N个图像组GOP，N为大于等于2的整数，所述检测装置包括：第一确定单元和第二确定单元；

所述第一确定单元，用于确定第K个GOP的所有P帧中最大的P帧Pmax，其中Pmax的大小为
其中K为变量且取值依次从M至N，1≤M≤N；

所述第二确定单元，用于在确定
和
的相对大小大于或等于第一阈值，
和
的相对大小大于或等于第二阈值，且所述第K个GOP中没有B帧的情况下，或者在确定
和
的相对大小大于或等于第一阈值，
和
的相对大小大于或等于第二阈值，所述第K个GOP中有B帧，且
和
的相对大小大于或等于第三阈值的情况下，确定Pmax为场景切换帧，其中
为Pmax与Pmax之前离Pmax最近的场景切换帧之间的多个I帧的大小的中值或均值，
为所述第K个GOP中的多个P帧的大小的中值或平均值，
为Pmax与Pmax之前离Pmax最近的场景切换帧之间的所有B帧的大小的中值或平均值；所述第一阈值大于0且小于1，所述第二阈值大于1，所述第三阈值大于1。
如权利要求22所述的检测装置，其特征在于，所述第二确定单元，还用于：

根据公式
计算所述第一阈值；或者，

根据公式
计算所述第一阈值；

其中，I_threshold为所述第一阈值，I_median为所述视频中的所有I帧的大小的中值或平均值，P_median为所述视频中的所有P帧的大小的中值或平均值。
如权利要求22或23所述的检测装置，其特征在于，所述第二确定单元，还用于：

根据公式
计算所述第三阈值；或者，

根据公式
计算所述第三阈值；

其中，I_threshold为所述第一阈值，I_median为所述视频中的所有I帧的大小的中值或平均值，Bmedian为所述视频中的所有B帧的大小的中值或平均值。
如权利要求22-24任一所述的检测装置，其特征在于，所述第二确定单元，还用于在确定第K个GOP的Pmax为场景切换帧后，将所述视频中除去已确定为场景切换帧的P帧之外的其它P帧的大小的中值或平均值作为新的P_median，并根据公式
或
计算新的I_threshold，所述新的I_threshold用于判断下一个GOP的Pmax是否为场景切换帧。
如权利要求22-25任一所述的检测装置，其特征在于，所述第二确定单元，还用于从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧；

其中，在K小于N时，在判断第K个GOP的Pmax是否为场景切换帧之后判断第K+1个GOP的I帧是否为场景切换帧；

所述第二确定单元用于从所述N个GOP中的第M个至第N个GOP的I帧中检测场景切换帧，具体包括：用于在确定第一距离小于或等于距离阈值时，确定所述第K+1个GOP的I帧不是场景切换帧，所述第一距离为所述第K+1个GOP的I帧和所述第K+1个GOP的I帧之前离所述第K+1个GOP的I帧最近的场景切换帧之间的距离。
如权利要求26所述的检测装置，其特征在于，所述第二确定单元，还用于设置所述距离阈值，所述距离阈值为如下三个长度中的其中一个：

所述N个GOP中长度最长的GOP的长度；

所述N个GOP的长度的中值或平均值；

长度L，其中，所述N个GOP中长度为L的GOP的数量最多。
如权利要求27所述的检测装置，其特征在于，所述第二确定单元，还用于：在确定出一个新的场景切换帧时，如果第二距离小于所述距离阈值，将所述距离阈值更新为所述第二距离，其中，所述第二距离具体为所述新的场景切换帧与所述新的场景切换帧之前离所述新的场景切换帧最近的场景切换帧之间的距离。