CN105898106A - 场景切换帧判断方法及装置 - Google Patents

场景切换帧判断方法及装置 Download PDF

Info

Publication number
CN105898106A
CN105898106A CN201510918385.4A CN201510918385A CN105898106A CN 105898106 A CN105898106 A CN 105898106A CN 201510918385 A CN201510918385 A CN 201510918385A CN 105898106 A CN105898106 A CN 105898106A
Authority
CN
China
Prior art keywords
frame
time
prediction
outcome
current encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510918385.4A
Other languages
English (en)
Inventor
蔡砚刚
白茂生
刘阳
杨帆
魏伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LeTV Cloud Computing Co Ltd
Original Assignee
LeTV Cloud Computing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LeTV Cloud Computing Co Ltd filed Critical LeTV Cloud Computing Co Ltd
Priority to CN201510918385.4A priority Critical patent/CN105898106A/zh
Publication of CN105898106A publication Critical patent/CN105898106A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明实施例提供一种场景切换帧判断方法及装置。计算当前需要搜索的最远编码帧的远帧号;以所述当前编码帧的前向的非B帧为基础,对所述非B帧的每一后续编码帧进行第一次编码预测得到第一次预测结果;以所述最远编码帧为基础,对所述非B帧的每一后续编码帧进行第二次编码预测,以所述编码预测的结果更新所述第一次预测结果得到第二次预测结果;从所述第二次预测结果中获取所述当前编码帧的最终编码预测结果从而实现场景切换帧的判断。从而实现了场景切换帧的快速准确判断。

Description

场景切换帧判断方法及装置
技术领域
本发明实施例涉及视频技术领域,尤其涉及一种场景切换帧判断方法及装置。
背景技术
一些电影、电视视频序列中,场景切换时不可避免的。如果编码过程中没有考虑场景切换的影响,在场景切换处的码率控制可能会失效,造成图像质量急剧下降,因此编码过程中需要对场景切换进行检测。
目前常用的场景切换检测算法有基于灰度值检测、基于运动搜索检测和基于边缘轮廓检测。其中,基于运动搜索检测和基于边缘轮廓检测算法的检测效果虽然很好,但是算法的复杂度较高,在实时性要求较高的场合下,常常采用灰度值检测或图像直方图法进行检测。然而,基于灰度值检测算法的检测效果相对较差。
因此,一种新的场景切换帧判断方式亟待提出。
发明内容
本发明实施例提供一种场景切换帧判断方法及装置,用以解决现有技术中场景切换检测效率低以及检测效果差的缺陷。
本发明实施例提供一种场景切换帧判断方法,包括:
计算当前需要搜索的最远编码帧的远帧号;
以所述当前编码帧的前向的非B帧为基础,对所述非B帧的每一后续编码帧进行第一次编码预测得到第一次预测结果;
以所述最远编码帧为基础,对所述非B帧的每一后续编码帧进行第二次编码预测,以所述编码预测的结果更新所述第一次预测结果得到第二次预测结果;
从所述第二次预测结果中获取所述当前编码帧的最终编码预测结果从而实现场景切换帧的判断。
本发明实施例提供一种场景切换帧判断装置,包括:
计算模块,用于计算当前需要搜索的最远编码帧的远帧号;
第一预测模块,用于以所述当前编码帧的前向的非B帧为基础,对所述非B帧的每一后续编码帧进行第一次编码预测得到第一次预测结果;
第二预测模块,用于以所述最远编码帧为基础,对所述非B帧的每一后续编码帧进行第二次编码预测,以所述编码预测的结果更新所述第一次预测结果得到第二次预测结果;
判断模块,用于从所述第二次预测结果中获取所述当前编码帧的最终编码预测结果从而实现场景切换帧的判断。
本发明实施例提供的场景切换帧判断方法及装置,通过以待判断帧的前向非B帧以及搜索到的最远编码帧为基础计算当前编码帧是否以I帧编码更优,从而快速确定场景切换帧,并且检测效果更优。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一的技术流程图;
图2为本发明实施例远帧号的计算示意图;
图3为本发明实施例二的技术流程图;
图4为本发明实施例三的技术流程图。
图5为本发明实施例四的装置结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中涉及到的I帧是帧内预测编码帧,属于帧内压缩,I解码时只需要本帧数据就可以完成(因为只依赖于相邻位置的宏块编码信息)。P帧为向前预测编码帧,属于帧间编码。P帧表示的是这一帧跟之前一个参考帧的差别,残差数据加上通过前向运动补偿得到的预测数据来重构当前P帧。B帧是双向差别帧,也就是B帧记录的是本帧与前后参考帧的差别,解码时既需要前向参考帧又需要后向参考帧,通过残差数据加上通过前-后向运动补偿得到的预测数据来重构当前B帧。以下涉及到I、B、P处,均参考上述说明,不再重复解释。
实施例一
图1是本发明实施例一的技术流程图,结合图1,本发明实施例一种场景切换帧判断方法,其特征在于,包括如下的步骤:
步骤110:计算当前需要搜索的最远编码帧的远帧号;
具体地,采用如下公式计算所述远帧号:
远帧号=P0+1+B-frames
其中,P0为所述当前编码帧的前向的非B帧(I帧或B帧)的帧号,B-frames为预设的连续B帧的最大个数。本实施例中,设B-frames=3,当然本发明实施例包括并不限制于此。
例如,如图2所示,待判断的当前帧的帧号为1,1号帧的前向非B帧为P帧,P帧对应的帧号P0=0,则远帧号n=0+1+3=4,表示当前场景帧的判断过程最远搜索到4号帧的位置。
步骤120:以所述当前编码帧的前向的非B帧为基础,对所述非B帧的每一后续编码帧进行第一次编码预测得到第一次预测结果;
在进行第一次编码预测之前,为当前编码帧的预测状态值进行初始赋值,即假设当前编码帧的最优编码方式是以I帧进行编码。通过第一次预测,从正向开始计算所述当前编码帧与前向非B帧的关联度,从判断初始假设的正确性。
步骤130:以所述最远编码帧为基础,对所述非B帧的每一后续编码帧进行第二次编码预测,以所述编码预测的结果更新所述第一次预测结果得到第二次预测结果;
第二次编码预测从逆向开始计算所述当前编码帧与后向帧的关联度,从而实现对第一次编码预测的进一步修正。
步骤140:从所述第二次预测结果中获取所述当前编码帧的最终编码预测结果从而实现场景切换帧的判断。
如果当前编码帧是场景切换处,说明当前编码帧的与前后帧的关联度相对较低,编码I帧比较合适,如果不是场景切换处,则当前编码帧编码为为B帧比较合适,这样可以节省更少的比特数目。因此本发明实施例通过判断待编码的视频帧是否以I帧编码更优来检测待编码的视频帧是否为场景切换帧,检测效果更优,效率更高。
实施例二
图3是本发明实施例二的技术流程图,以下部分将结合图3,进一步阐述本发明实施例第一次编码预测和第二次编码预测的具体实现过程。
步骤310:记所述当前编码帧为P1,所述最远编码帧为Pn,初始化预测结果为:P1~Pn区间包含的每一帧都以I帧编码;
本发明实施例中,对第一次预测结果进行初始化,若以I帧编码,则相应的帧号赋值true,否则赋值false,即初始化的结果为:
P1:true P2:true P3:true……..Pn:true
其中,true表示预测状态为以I帧编码更优,反之,false表示预测状态为以非I帧编码更优。
步骤320:以P0为基准,计算Pi是否编码I帧更优,其中,Pi∈[P1,Pn],i∈[1,n],若为是,则以I帧编码Pi;若为否,则否定[P1,Pi]中的每一编码帧的所述初始化预测结果。
具体地,本发明实施例通过ISrelevance(P0,Pi)的返回值,判断Pi是否编码I帧更优,若ISrelevance(P0,Pi)返回值为true,则表示Pi以I帧编码更优;若ISrelevance(P0,Pi)返回值为false,则表示Pi以非I帧编码更优,且修改P1~Pi之间所有的编码帧的预测状态值为false。
例如,第一次编码可以有如下的计算结果:
1)ISrelevance(P0,P1)返回值为true,第一次预测结果的初始化值不作任何改变:
当期结果为:P1:true P2:true P3:true P4:true
2)ISrelevance(P0,P2)返回值为false,则将P1~P2区间的预测状态值置为false,其余预测状态值不变:
当期结果为:P1:false P2:false P3:true P4:true
3)ISrelevance(P0,P3)返回值为true,则保持上一次的计算结果不作任何改变:
当期结果为:P1:false P2:false P3:true P4:true
4)ISrelevance(P0,P4)返回值为true,保持上一次的计算结果不作任何改变:
当期结果为:P1:false P2:false P3:true P4:true
步骤330:以Pn为基准,计算Pi是否编码I帧更优,其中,Pi∈[P1,Pn],i∈[1,n],若为是,则以I帧编码Pi;若为否,则否定Pi的所述第一次预测结果。
具体地,本发明实施例通过ISrelevance(Pi,Pn)的返回值,判断Pi是否编码I帧更优,若ISrelevance(Pi,Pn)返回值为true,则表示Pi以I帧编码更优,若ISrelevance(Pi,Pn)返回值为false,则表示Pi以非I帧编码更优,仅修改当前Pi的编码帧的预测状态值为false。
例如,承接上一步骤的例子,在第一以预测结果的基础上,第二次编码预测可以有如下的计算结果:
1)ISrelevance(P1,Pn)返回值为true,第一次预测结果的预测状态值不作任何改变:
当期结果为:P1:false P2:false P3:true P4:true
2)ISrelevance(P2,Pn)返回值为true,第一次预测结果的预测状态值不作任何改变:
当期结果为:P1:false P2:false P3:true P4:true
3)ISrelevance(P3,Pn)返回值为false,则修改P3的预测状态值为false:
当期结果为:P1:false P2:false P3:false P4:true
4)ISrelevance(P4,Pn)返回值为true,保持上一次的预测状态值不作任何改变:
当期结果为:P1:false P2:false P3:false P4:true
步骤340:根据所述第二次预测结果,当所述当前编码帧以I帧编码更优时,判定所述当前编码帧为场景切换帧。
具体地,本步骤根据所述当前编码帧的预测状态值的返回值判断所述当前编码帧是否以I帧编码更优,例如,P1的预测状态值返回true时,判断P1以I帧编码更优,此时也就可以判断所述当前编码帧为场景切换帧。
实施例三
图4是本发明实施例三的技术流程图,以下部分将结合图4,进一步阐述本发明实施例以P0为基准,计算Pi是否编码I帧更优的实现过程。
第一次编码预测的实现过程主要包括如下的几个步骤:
步骤410:计算P0与Pi之间的偏离率bias。
具体计算公式如下:
b i a s = t h r e s h M i n n i f g o p S i z e &le; k e y f r a m e M i n / n t h r e s h M i n * g o p S i z e k e y f r a m e M i n i f g o p S i z e < = k e y f r a m e M i n t h r e s h M i n + ( t h r e s h M a x - t h r e s h M i n ) * ( g o p S i z e - k e y f r a m e M i n ) k e y f r a m e M a x - k e y f r a m e M i n e l s e
其中,n为所述远帧号,gopSize为所述当前编码帧与上一个IDR帧之间的距离,keyframeMin为预设的最小关键帧长度,keyframeMax为预设的最大关键帧长度;其中,threshMin为keyframeMin的最小阈值,threshMax为keyframeMax的最大阈值,threshMin=threshMax/n;
步骤420:计算所述当前编码帧以I帧编码的编码代价Icost;
具体地,Icost=FramecostI(P0)。其计算方式如下:
首先计算P0的自身残差R(x,y),对于,以P0(x,y)表示P0帧中的每个像素点,以h表示P0的高度,以w表示P0的宽度,则
R ( x , y ) = P 0 ( x , y ) - P 0 ( x - 1 , y - 1 ) x - 1 &GreaterEqual; 0 , y - 1 &GreaterEqual; 0 P 0 ( x , y ) - 128 x - 1 < 0 , x - 1 < 0
F r a m e cos t I = &Sigma; i = 0 n cos t ( R i )
步骤430:计算所述当前编码帧以P帧编码的编码代价Pcost。
具体地,Pcost=FramecostP(P0,P1)。其计算方式如下:
首先计算P1与P0的残差R(x,y),以P0(x,y)、P1(x,y),表示P0帧和P1帧每个像素点,以h表示P0、P1的高度,以w表示P0、P1的宽度,则
R(x,y)=P1(x,y)-P0(x,y)
例如,得到的R(x,y)可以为:
- 1 - 5 - 2 - 3 - 7 - 4 - 3 - 8 - 4 - 4 - 1 - 2 - 6 - 8 - 9 - 5 - 2 - 3 - 5 - 4 - 5 - 8 - 7 - 4 2 - 3 - 2 - 3 - 6 - 2 0 1 1 - 1 - 5 - 7 - 5 - 6 - 4 - 3 0 - 5 - 8 - 3 - 5 - 1 - 1 - 5 - 3 - 9 - 3 - 5 - 5 - 5 - 8 - 7 - 10 - 2 2 - 3 - 5 - 7 - 6 1
其次,计算R(x,y)的哈达玛变换的值:HAD(R)。哈达玛变换是利用哈达玛矩阵作为变换矩阵新实施的遥感多光谱域变换。哈达玛矩阵为一个对称的正交矩阵。哈达变换实际是将坐标轴旋转45°的正交变换。
具体做法是,将R(x,y)分为n个4x4块:Ri,i∈[0,3]:
- 1 - 5 - 2 - 3 - 4 - 4 - 1 - 2 - 2 - 3 - 5 - 4 2 - 3 - 2 - 3 - 7 - 4 - 3 - 8 - 6 - 8 - 9 - 5 - 5 - 8 - 7 - 4 - 6 - 2 0 1 1 - 1 - 5 - 7 0 - 5 - 8 - 3 - 3 - 9 - 3 - 5 - 10 - 2 2 - 3 - 5 - 6 - 4 - 3 - 5 - 1 - 1 - 5 - 5 - 5 - 8 - 7 - 5 - 7 - 6 1
对每个Ri作哈达玛变换:
H A D ( R i ) = 1 1 1 1 1 1 - 1 - 1 1 - 1 - 1 1 1 - 1 1 - 1 R i 1 1 1 1 1 1 - 1 - 1 1 - 1 - 1 1 1 - 1 1 - 1
例如:
H A D ( R 0 ) = 1 1 1 1 1 1 - 1 - 1 1 - 1 - 1 1 1 - 1 1 - 1 * - 1 - 5 - 2 - 3 - 4 - 4 - 1 - 2 - 2 - 3 - 5 - 4 2 - 3 - 2 - 3 * 1 1 1 1 1 1 - 1 - 1 1 - 1 - 1 1 1 - 1 1 - 1 = - 42 2 8 12 - 2 - 14 - 4 0 8 4 6 10 - 8 4 2 - 2
则计算得当前编码块的cost为:
cos t ( ( R 0 ) ) = &Sigma; x = 0 , y = 0 x < 4 , y < 4 a b s ( H A D ( R 0 ) ) = 128
F r a m e cos t P = &Sigma; i = 0 n cos t ( R i )
步骤440:若Pcost>=(1.0-bias)*Icost,则预测所述当前编码帧编码为I帧最优。
上述步骤410~步骤440实现了第一次编码预测时,以P0为基准,计算Pi是否编码I帧更优的过程,第二次编码预测的实现过程与之相类似,不同之处在于计算所述当前编码帧以P帧编码的编码代价Pcost时,Pcost=FramecostP(P1,Pn),将相应的计算参数进行替代即可。
本实施例中,通过分别以P0和Pn为基准,计算Pi是否编码I帧更优,进行两次预测,进一步提高了场景帧判别的精确度。
实施例四
图5是本发明实施例四的装置结构示意图,结合图5,本发明实施例一种场景切换帧判断装置,主要包括如下的模块:计算模块510、第一预测模块520、第二预测模块530、判断模块540。
所述计算模块510,用于计算当前需要搜索的最远编码帧的远帧号;
所述第一预测模块520,用于以所述当前编码帧的前向的非B帧为基础,对所述非B帧的每一后续编码帧进行第一次编码预测得到第一次预测结果;
所述第二预测模块530,用于以所述最远编码帧为基础,对所述非B帧的每一后续编码帧进行第二次编码预测,以所述编码预测的结果更新所述第一次预测结果得到第二次预测结果;
所述判断模块540,用于从所述第二次预测结果中获取所述当前编码帧的最终编码预测结果从而实现场景切换帧的判断。
所述计算模块510具体用于:采用如下公式计算所述远帧号:
远帧号=P0+1+B-frames
其中,P0为所述当前编码帧的前向的非B帧的帧号,B-frames为预设的连续B帧的最大个数。
所述第一预测模520具体用于执行如下步骤:
步骤a1:记所述当前编码帧为P1,所述最远编码帧为Pn,初始化预测结果为:P1~Pn区间包含的每一帧都以I帧编码;
步骤a2:以P0为基准,计算Pi是否编码I帧更优,其中,Pi∈[P1,Pn],i∈[1,n],若为是,则以I帧编码Pi;若为否,则否定[P1,Pi]中的每一编码帧的所述初始化预测结果。
所述第二预测模块530具体用于执行如下步骤:
以Pn为基准,计算Pi是否编码I帧更优,其中,Pi∈[P1,Pn],i∈[1,n],若为是,则以I帧编码Pi;若为否,则否定Pi的所述第一次预测结果;
根据所述第二次预测结果,当所述当前编码帧以I帧编码更优时,判定所述当前编码帧为场景切换帧。
所述第一预测模块520具体还用于执行如下步骤:
步骤b1:采用如下公式计算P0与Pi之间的偏离率bias:
b i a s = t h r e s h M i n n i f g o p S i z e &le; k e y f r a m e M i n / n t h r e s h M i n * g o p S i z e k e y f r a m e M i n i f g o p S i z e < = k e y f r a m e M i n t h r e s h M i n + ( t h r e s h M a x - t h r e s h M i n ) * ( g o p S i z e - k e y f r a m e M i n ) k e y f r a m e M a x - k e y f r a m e M i n e l s e
其中,n为所述远帧号,gopSize为所述当前编码帧与上一个IDR帧之间的距离,keyframeMin为预设的最小关键帧长度,keyframeMax为预设的最大关键帧长度;其中,threshMin为keyframeMin的最小阈值,threshMax为keyframeMax的最大阈值,threshMin=threshMax/n;
步骤b2:计算所述当前编码帧以P帧编码的编码代价Pcost以及所述当前编码帧以I帧编码的编码代价Icost,若Pcost>=(1.0-bias)*Icost,则预测所述当前编码帧编码为I帧最优。
图5所示装置可以执行图1~图4所示实施例的方法,实现原理和技术效果参考图1~图4所示实施例,不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种场景切换帧判断方法,其特征在于,包括如下的步骤:
计算当前需要搜索的最远编码帧的远帧号;
以所述当前编码帧的前向的非B帧为基础,对所述非B帧的每一后续编码帧进行第一次编码预测得到第一次预测结果;
以所述最远编码帧为基础,对所述非B帧的每一后续编码帧进行第二次编码预测,以所述编码预测的结果更新所述第一次预测结果得到第二次预测结果;
从所述第二次预测结果中获取所述当前编码帧的最终编码预测结果从而实现场景切换帧的判断。
2.根据权利要求1所述的方法,其特征在于,计算当前需要搜索的最远编码帧的远帧号,进一步包括:
采用如下公式计算所述远帧号:
远帧号=P0+1+B-frames
其中,P0为所述当前编码帧的前向的非B帧的帧号,B-frames为预设的连续B帧的最大个数。
3.根据权利要求1所述的方法,其特征在于,对所述非B帧的每一后续编码帧进行第一次编码预测得到第一次预测结果,进一步包括如下步骤:
步骤a1:记所述当前编码帧为P1,所述最远编码帧为Pn,初始化预测结果为:P1~Pn区间包含的每一帧都以I帧编码;
步骤a2:以P0为基准,计算Pi是否编码I帧更优,其中,Pi∈[P1,Pn],i∈[1,n],若为是,则以I帧编码Pi;若为否,则否定[P1,Pi]中的每一编码帧的所述初始化预测结果。
4.根据权利要求1或3所述的方法,其特征在于,对所述非B帧的每一后续编码帧进行第二次编码预测,以所述编码预测的结果更新所述第一次预测结果得到第二次预测结果,进一步包括:
以Pn为基准,计算Pi是否编码I帧更优,其中,Pi∈[P1,Pn],i∈[1,n],若为是,则以I帧编码Pi;若为否,则否定Pi的所述第一次预测结果;
根据所述第二次预测结果,当所述当前编码帧以I帧编码更优时,判定所述当前编码帧为场景切换帧。
5.根据权利要求3所述的方法,其特征在于,以P0为基准,计算Pi是否编码I帧更优,进一步包括如下步骤:
步骤b1:采用如下公式计算P0与Pi之间的偏离率bias:
b i a s = t h r e s h M i n n i f g o p S i z e &le; k e y f r a m e M i n / n t h r e s h M i n * g o p S i z e k e y f r a m e M i n i f g o p S i z e < = k e y f r a m e M i n t h r e s h M i n + ( t h r e s h M a x - t h r e s h M i n ) * ( g o p S i z e - k e y f r a m e M i n ) k e y f r a m e M a x - k e y f r a m e M i n e l s e
其中,n为所述远帧号,gopSize为所述当前编码帧与上一个IDR帧之间的距离,keyframeMin为预设的最小关键帧长度,keyframeMax为预设的最大关键帧长度;其中,threshMin为keyframeMin的最小阈值,threshMax为keyframeMax的最大阈值,threshMin=threshMax/n;
步骤b2:计算所述当前编码帧以P帧编码的编码代价Pcost以及所述当前编码帧以I帧编码的编码代价Icost,若Pcost>=(1.0-bias)*Icost,则预测所述当前编码帧编码为I帧最优。
6.一种场景切换帧判断装置,其特征在于,包括如下的模块:
计算模块,用于计算当前需要搜索的最远编码帧的远帧号;
第一预测模块,用于以所述当前编码帧的前向的非B帧为基础,对所述非B帧的每一后续编码帧进行第一次编码预测得到第一次预测结果;
第二预测模块,用于以所述最远编码帧为基础,对所述非B帧的每一后续编码帧进行第二次编码预测,以所述编码预测的结果更新所述第一次预测结果得到第二次预测结果;
判断模块,用于从所述第二次预测结果中获取所述当前编码帧的最终编码预测结果从而实现场景切换帧的判断。
7.根据权利要求6所述的方法,其特征在于,所述计算模块具体用于:
采用如下公式计算所述远帧号:
远帧号=P0+1+B-frames
其中,P0为所述当前编码帧的前向的非B帧的帧号,B-frames为预设的连续B帧的最大个数。
8.根据权利要求6所述的方法,其特征在于,所述第一预测模块具体用于执行如下步骤:
步骤a1:记所述当前编码帧为P1,所述最远编码帧为Pn,初始化预测结果为:P1~Pn区间包含的每一帧都以I帧编码;
步骤a2:以P0为基准,计算Pi是否编码I帧更优,其中,Pi∈[P1,Pn],i∈[1,n],若为是,则以I帧编码Pi;若为否,则否定[P1,Pi]中的每一编码帧的所述初始化预测结果。
9.根据权利要求6或8所述的方法,其特征在于,所述第二预测模块具体用于执行如下步骤:
以Pn为基准,计算Pi是否编码I帧更优,其中,Pi∈[P1,Pn],i∈[1,n],若为是,则以I帧编码Pi;若为否,则否定Pi的所述第一次预测结果;
根据所述第二次预测结果,当所述当前编码帧以I帧编码更优时,判定所述当前编码帧为场景切换帧。
10.根据权利要求8所述的方法,其特征在于,所述第一预测模块具体还用于执行如下步骤:
步骤b1:采用如下公式计算P0与Pi之间的偏离率bias:
b i a s = t h r e s h M i n n i f g o p S i z e &le; k e y f r a m e M i n / n t h r e s h M i n * g o p S i z e k e y f r a m e M i n i f g o p S i z e < = k e y f r a m e M i n t h r e s h M i n + ( t h r e s h M a x - t h r e s h M i n ) * ( g o p S i z e - k e y f r a m e M i n ) k e y f r a m e M a x - k e y f r a m e M i n e l s e
其中,n为所述远帧号,gopSize为所述当前编码帧与上一个IDR帧之间的距离,keyframeMin为预设的最小关键帧长度,keyframeMax为预设的最大关键帧长度;其中,threshMin为keyframeMin的最小阈值,threshMax为keyframeMax的最大阈值,threshMin=threshMax/n;
步骤b2:计算所述当前编码帧以P帧编码的编码代价Pcost以及所述当前编码帧以I帧编码的编码代价Icost,若Pcost>=(1.0-bias)*Icost,则预测所述当前编码帧编码为I帧最优。
CN201510918385.4A 2015-12-11 2015-12-11 场景切换帧判断方法及装置 Pending CN105898106A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510918385.4A CN105898106A (zh) 2015-12-11 2015-12-11 场景切换帧判断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510918385.4A CN105898106A (zh) 2015-12-11 2015-12-11 场景切换帧判断方法及装置

Publications (1)

Publication Number Publication Date
CN105898106A true CN105898106A (zh) 2016-08-24

Family

ID=57002457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510918385.4A Pending CN105898106A (zh) 2015-12-11 2015-12-11 场景切换帧判断方法及装置

Country Status (1)

Country Link
CN (1) CN105898106A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101494726A (zh) * 2008-01-25 2009-07-29 索尼株式会社 场景切换点检测器、记录和重现装置、事件生成器和方法
US20090268097A1 (en) * 2008-04-28 2009-10-29 Siou-Shen Lin Scene change detection method and related apparatus according to summation results of block matching costs associated with at least two frames
CN102196291A (zh) * 2011-05-20 2011-09-21 四川长虹电器股份有限公司 一种双目立体视频编码方法
CN103124354A (zh) * 2007-09-28 2013-05-29 杜比实验室特许公司 处理视频信息

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103124354A (zh) * 2007-09-28 2013-05-29 杜比实验室特许公司 处理视频信息
CN101494726A (zh) * 2008-01-25 2009-07-29 索尼株式会社 场景切换点检测器、记录和重现装置、事件生成器和方法
US20090268097A1 (en) * 2008-04-28 2009-10-29 Siou-Shen Lin Scene change detection method and related apparatus according to summation results of block matching costs associated with at least two frames
CN102196291A (zh) * 2011-05-20 2011-09-21 四川长虹电器股份有限公司 一种双目立体视频编码方法

Similar Documents

Publication Publication Date Title
CN104661031B (zh) 用于视频图像编码和解码的方法、编码设备和解码设备
CN102067601B (zh) 视频编码和解码中模板匹配预测(tmp)的方法和装置
CN101600108B (zh) 一种多视点视频编码中的运动和视差联合估计方法
Liu et al. Image compression with edge-based inpainting
CN100463527C (zh) 一种多视点视频图像视差估计的方法
CN110521205A (zh) 用于视频编解码的子预测单元时间运动向量预测
CN101552924B (zh) 一种用于视频编码的空间预测方法
CN108781284A (zh) 具有仿射运动补偿的视频编解码的方法及装置
CN109272509A (zh) 一种连续图像的目标检测方法、装置、设备及存储介质
CN106713910A (zh) 对图像进行解码的方法和设备
CN107087200A (zh) 针对高效率视频编码标准的跳过编码模式提前判决方法
CN106028047B (zh) 一种基于Hadamard变换的帧内预测的快速模式选择和PU划分的方法
CN108989799A (zh) 一种编码单元参考帧的选择方法、装置及电子设备
CN103108188A (zh) 基于局部代价非最优统计的视频隐写分析方法
CN106131546A (zh) 一种提前确定hevc合并和跳过编码模式的方法
CN108134939A (zh) 一种运动估计方法及装置
CN113298789A (zh) 绝缘子缺陷检测方法、系统、电子设备及可读存储介质
CN107623848B (zh) 一种视频编码方法及装置
CN106162176A (zh) 帧内预测模式选择方法和装置
CN107404653A (zh) 一种hevc码流的停车事件快速检测方法
JP2008271217A (ja) 多視点映像符号化装置
US11704840B2 (en) Attribute information prediction method, encoder, decoder and storage medium
CN103533349A (zh) 基于支持向量机的b帧快速帧间预测宏块模式选择方法
TWI655860B (zh) 幀間預測編碼方法及裝置
Shi et al. Reinforced bit allocation under task-driven semantic distortion metrics

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160824