CN101014125A - 用于判定帧内预测模式的方法和设备 - Google Patents

用于判定帧内预测模式的方法和设备 Download PDF

Info

Publication number
CN101014125A
CN101014125A CNA2007100065222A CN200710006522A CN101014125A CN 101014125 A CN101014125 A CN 101014125A CN A2007100065222 A CNA2007100065222 A CN A2007100065222A CN 200710006522 A CN200710006522 A CN 200710006522A CN 101014125 A CN101014125 A CN 101014125A
Authority
CN
China
Prior art keywords
intra prediction
input block
pixel
prediction mode
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007100065222A
Other languages
English (en)
Other versions
CN101014125B (zh
Inventor
朴民奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN101014125A publication Critical patent/CN101014125A/zh
Application granted granted Critical
Publication of CN101014125B publication Critical patent/CN101014125B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10CPIANOS, HARPSICHORDS, SPINETS OR SIMILAR STRINGED MUSICAL INSTRUMENTS WITH ONE OR MORE KEYBOARDS
    • G10C3/00Details or accessories
    • G10C3/12Keyboards; Keys
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B15/00Teaching music
    • G09B15/001Boards or like means for providing an indication of chords
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B15/00Teaching music
    • G09B15/08Practice keyboards
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10GREPRESENTATION OF MUSIC; RECORDING MUSIC IN NOTATION FORM; ACCESSORIES FOR MUSIC OR MUSICAL INSTRUMENTS NOT OTHERWISE PROVIDED FOR, e.g. SUPPORTS
    • G10G1/00Means for the representation of music
    • G10G1/02Chord or note indicators, fixed or adjustable, for keyboard of fingerboards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2220/00Input/output interfacing specifically adapted for electrophonic musical tools or instruments
    • G10H2220/021Indicator, i.e. non-screen output user interfacing, e.g. visual or tactile instrument status or guidance information using lights, LEDs, seven segments displays
    • G10H2220/026Indicator, i.e. non-screen output user interfacing, e.g. visual or tactile instrument status or guidance information using lights, LEDs, seven segments displays associated with a key or other user input device, e.g. key indicator lights
    • G10H2220/061LED, i.e. using a light-emitting diode as indicator

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Educational Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供了一种用于判定帧内预测模式的方法和设备,其中,根据输入块的像素的像素值标注所述输入块的像素并从具有相同标签的像素提取方向性,从而判定帧内预测模式。所述方法包括:根据像素的像素值为输入块的像素分配标签;根据扫描表扫描标注的输入块,如果在根据帧内预测模式的方向的预定位置的像素被分配相同的标签,则通过对帧内预测模式计数来计算帧内预测模式的模式计数;和使用计算的模式计数判定用于输入块的帧内预测模式。

Description

用于判定帧内预测模式的方法和设备
本申请要求于2006年2月2日在韩国知识产权局提交的第10-2006-0010180号韩国专利申请的优先权,该申请公开于此,以资参考。
技术领域
本发明涉及一种判定视频的帧内预测中的预测模式的方法和设备,更具体地说,涉及这样一种判定帧内预测模式的方法和设备,其中,输入块的像素根据它们的像素值被标注,并且从具有相同标签的像素中提取方向性,以判定所述帧内预测模式。
背景技术
根据H.264/运动画面专家组(MPEG-4)高级视频编码(AVC),画面被分为宏块以进行视频编码。在按照所有的帧间预测和帧内预测编码模式将每个宏块编码之后,根据对宏块编码所需的比特率以及原始宏块和解码的宏块之间允许的失真来选择合适的编码模式。随后,按照选择的编码模式对宏块进行编码。
在帧内预测中,使用在空间上与将被编码的宏块相邻的像素值来计算将被编码的宏块的预测值,并且当对当前画面的宏块编码时预测值和像素值之间的差被编码。帧内预测模式可被粗略地分为4×4帧内预测模式和16×16帧内预测模式。
图1示出了根据H.264标准的16×16帧内预测模式,图2示出了根据H.264标准的4×4帧内预测模式。
参照图1,有4种16×16帧内预测模式,即:垂直模式、水平模式、直流(DC)模式和平面模式。参照图2,有9种4×4帧内预测模式,即:垂直模式、水平模式、DC模式、左下对角模式、右下对角模式、垂直向右模式、垂直向左模式、水平向上模式和水平向下模式。
例如,当4×4的当前块按照模式0(即,图2的垂直模式)被预测编码时,上邻于4×4的当前块像素的像素A到D的像素值将被预测为4×4的当前块的像素值。换句话说,像素A的像素值被预测为4×4的当前块的第一列的4个像素的像素值,像素B的像素值被预测为4×4的当前块的第二列的4个像素的像素值,像素C的像素值被预测为4×4的当前块的第三列的4个像素的像素值,像素D的像素值被预测为4×4的当前块的第四列的4个像素的像素值。接下来,获得使用像素A到D预测的4×4的当前块的像素的像素值与包括在原始4×4的当前块中的像素的实际像素值之差,并对该差进行编码。
在根据H.264/AVC的视频编码中,使用率失真优化(RDO)以判定最优预测模式。换句话说,为了判定编码的最优预测模式,按照所有的预测模式执行帧内预测,并判定展示最佳RDO性能的预测模式。根据现有技术,按照所有的预测模式执行帧内预测以判定最优预测模式,导致了大的计算量。例如,如果对720×480的图像的每个4×4的输入块以30帧每秒(fps)执行帧内预测,并且每秒帧内预测的I帧的数量是10,则每秒使用9种帧内预测模式,导致了一共1,944,000((740/4)×(480/4)×9×10)次帧内预测的计算。这样,根据现有技术,帧内预测需要大的计算量,并且这使得难以实现实时视频编码器。
发明内容
本发明提供一种用于判定帧内预测模式的方法和设备,其中,使用帧内预测中的输入块内的像素信息提取方向性,并且减少了判定帧内预测模式中的计算复杂度。
根据本发明的一方面,提供了一种用于判定视频的帧内预测模式的方法。所述方法包括:(a)根据像素的像素值为输入块的像素分配标签;(b)根据扫描表扫描标注的输入块,并且如果在根据帧内预测模式的方向的预定位置的像素被分配相同的标签,则通过对帧内预测模式计数来计算帧内预测模式的模式计数;和(c)使用计算的模式计数来判定用于输入块的帧内预测模式。
根据本发明的另一方面,提供了一种用于判定视频的帧内预测模式的设备。所述设备包括:标注单元、扫描单元和预测模式判定单元。所述标注单元根据像素的像素值为输入块的像素分配标签。所述扫描单元根据扫描表扫描标注的输入块,并且如果在根据帧内预测模式的方向的预定位置的像素被分配相同的标签,则通过对帧内预测模式计数来计算帧内预测模式的模式计数。所述预测模式判定单元使用计算的模式计数来判定用于输入块的帧内预测模式。
附图说明
通过参照附图对本发明实施例进行详细描述,本发明的以上和其他方面将变得更加清楚,其中:
图1示出了根据H.264标准的16×16帧内预测模式;
图2示出了根据H.264标准的4×4帧内预测模式;
图3是示出了根据本发明示例性实施例的判定帧内预测模式的方法的流程图;
图4是示出图3的操作310的详细流程图;
图5示出了根据本发明示例性实施例的像素值的划分;
图6A和图6B示出了根据本发明示例性实施例的标注输入块的每个像素的处理;
图7是示出图3的操作320的详细流程图;
图8示出了在本发明示例性实施例中使用的输入块的像素的位置;
图9示出了根据本发明示例性实施例的帧内预测的方向;
图10和图11是解释根据本发明示例性实施例的帧内预测模式计数的处理的示图;
图12是图3的操作330的详细流程图;
图13是应用了根据本发明示例性实施例的用于判定帧内预测模式的设备的视频编码器的框图;和
图14是根据本发明示例性实施例的用于判定帧内预测模式的设备的框图。
具体实施方式
以下,将参照附图详细描述本发明的示例性实施例。
图3是示出了根据本发明示例性实施例的判定帧内预测模式的方法的流程图。
所述判定帧内预测模式的方法的特征在于:根据输入块的像素值的大小标注所述输入块的像素,通过根据输入块中可用的帧内预测模式的方向确定分配给预定位置的像素的标签是否相同来检测输入块中的方向性,和使用检测到的方向性判定最优的帧内预测模式。具体来说,在本发明示例性实施例中,不是使用全部帧内预测模式产生预测块并使用预测块与原始块之间的差来判定具有最小代价的最优帧内预测模式,而是通过使用输入块的像素值来判定最优帧内预测模式,从而减少计算量。为了便于解释,假设输入块的大小是4×4或者5×5。尽管H.264标准中没有关于5×5的输入块的规定,但是基于在4×4的输入块的预测中使用相邻像素的事实,可使用通过添加位于4×4的输入块上侧和左侧的相邻像素而形成的5×5的输入块有效地预测输入块中的方向性。但是,除了4×4或者5×5的输入块之外,本发明还可被应用于各种大小的块的预测。
参照图3,在操作310中,根据输入块的像素值的大小来标注输入块的像素。在操作320中,标注的块被扫描并且为每个帧内预测模式计算模式计数。在操作330中,使用计算的每个帧内预测模式的模式计数判定最优帧内预测模式。以下,将详细描述每个操作。
图4是示出图3的操作310的详细流程图。
参照图4,在操作312中,设置标注步长以标注输入块的像素。例如,YUV格式图像中的亮度(Y)范围是0-255。在这种情况下,如果标注步长被设置为10,则可使用一共25个标签来表示所述亮度。如果需要,所述标注步长可被改变。但是如果标注步长太大,则分配给输入块的像素的标签的精度就会降低,从而导致很有可能将相似的标签分配给输入块的像素,并且因此判定DC模式为最优帧内预测模式。如果标注步长太小,则难以从输入块检测方向性。
在操作314中,输入块的像素值根据设置的标注步长被分为多个范围,并且为所述范围指定标签。参照图5,当标注步长被设置为10时,像素值0-255被分为一共25个范围,并且为每个范围指定标签。所述标签被分配给输入块的像素,以在输入块的像素中检测相似区域,以及通过扫描具有相同标签的像素来检测输入块中的方向性。对于不与标注步长匹配的范围(即,像素值240-255的范围)来说,这样的范围可被进一步划分或者该像素值的最后范围可与设置的标注步长不同。
在操作316中,确定输入块的每个像素的像素值所属的范围,并为每个像素分配为确定的范围而指定的标签。
图6A和图6B示出了根据本发明示例性实施例的标注输入块的每个像素的处理。这里,图6A示出了为4×4的输入块分配标签的处理,图6B示出了为5×5的输入块分配标签的处理。
参照图6A和图6B,如果标注步长是10,并且输入块的像素值由P表示,则标签1被分配给满足P<10的像素,标签2被分配给满足10<=P<20的像素……,以及标签25被分配给满足240<=P<=255的像素。以这种方式,根据像素的像素值所属的范围来标注原始输入块61和65的像素,并且因此,产生被标注的块64和68。
图7是示出图3的操作320的详细流程图。
参照图7,在操作310中将标签分配给输入块的像素之后,在操作322中,被分配给输入块的像素的标签根据预定的扫描表被扫描。所述扫描表基于帧内预测模式的方向指定了输入块中扫描的开始点和结束点。所述开始点位于包括在输入块的第一列第一行中的像素之一,并且所述结束点位于输入块的最后一列最后亦行中的像素之一。如果如图8所示,位于输入块的第x列第y行的像素的位置由P(x,y)来表示,并且帧内预测模式的方向如图9中所示,则根据扫描表(诸如,表1或者表2)为每个帧内预测模式扫描分配给输入块的像素的标签。这里,表1是用于5×5的输入块的扫描表,并且表2是用于4×4的输入块的扫描表。表1和表2仅为扫描表的示例,并且可根据帧内预测模式的方向被改变。
[表1]
模式0 模式1 模式3 模式4
开始 结束 开始 结束 开始 结束 开始 结束
P(0,0) P(0,4) P(0,0) P(4,0) P(2,0) P(0,2) P(0,0) P(4,4)
P(1,0) P(1,4) P(1,0) P(4,0) P(3,0) P(0,3) P(1,0) P(4,3)
P(2,0) P(2,4) P(2,0) P(4,0) P(4,0) P(0,4) P(2,0) P(4,2)
P(3,0) P(3,4) P(0,1) P(4,1) P(3,0) P(4,1)
P(4,0) P(4,4) P(0,2) P(4,2) P(0,1) P(3,4)
P(0,1) P(0,4) P(0,3) P(4,3) P(0,2) P(2,4)
P(0,2) P(0,4) P(0,4) P(4,4) P(0,3) P(1,4)
[表2]
模式0 模式1 模式3 模式4
开始 结束 开始 结束 开始 结束 开始 结束
P(0,0) P(0,3) P(0,0) P(3,0) P(2,0) P(0,2) P(0,0) P(3,3)
P(1,0) P(1,3) P(1,0) P(3,0) P(3,0) P(0,3) P(1,0) P(3,2)
P(2,0) P(2,3) P(0,1) P(3,1) P(0,1) P(2,3)
P(3,0) P(3,3) P(0,2) P(3,2) P(0,2) P(1,3)
P(0,1) P(0,3) P(0,3) P(3,3)
在本发明示例性实施例中,按照图9中所示的9种帧内预测模式中的水平模式(模式0)、垂直模式(模式1)、左下对角模式(模式3)和右下对角模式(模式4)执行扫描。为了提高预测的精确性,一旦判定了最优帧内预测模式,与判定的帧内预测模式相邻的模式可被附加地选择。
接下来,分配给与开始点和结束点相应的两个像素的标签根据扫描表被读取,并且如果读取的标签相同,则在操作324中具有与连接所述两个像素的方向相同的方向的帧内预测模式被计数。
图10和图11是用于说明在根据预定的扫描表扫描分配给像素的标签时对帧内预测模式进行计数的处理的示图。在图10和图11中,标注的输入块100和110分别与图6A和图6B的标注的块64和68相对应。
参照图10,分配给4×4的输入块中的预定位置的像素的标签根据扫描表(例如,表2)被扫描,并且如果扫描的两个像素具有相同的标签,则相应的帧内预测模式被计数。在图10中,在在标注的输入块100的像素中与根据表2的开始点和结束点相应的像素的情况下,在P(0,0)和P(3,3)的像素被分配相同的标签6,在P(1,0)和P(3,2)的像素被分配相同的标签1,在P(0,1)和P(2,3)的像素被分配相同的标签1,以及在P(0,1)和P(3,1)的像素被分配相同的标签1。在这种情况下,由于连接在P(0,0)和P(3,3)的像素的直线的方向、连接在P(1,0)和P(3,2)的像素的直线的方向以及连接在P(0,1)和P(2,3)的像素的直线的方向与模式4的方向相同,所以模式4的模式计数Mode CountMode4是3。此外,由于连接在P(1,0)和P(1,3)的像素的直线的方向以及连接在P(2,0)和P(2,3)的像素的直线的方向与模式0的方向相同,所以模式0的模式计数ModeCountMode0是2。由于连接在P(0,1)和P(3,1)的像素的直线的方向与模式1的方向相同,所以模式1的模式计数Mode CountMode1是1。
相似地,参照图11,分配给在5×5的输入块中的预定位置的像素的标签根据扫描表(例如,表1)被扫描,并且如果扫描的两个像素具有相同的标签,则相应的帧内预测模式被计数。在图11中,在在标注的输入块110的像素中与根据表1的开始点和结束点相应的像素的情况下,在P(0,0)和P(4,4)的像素被分配相同的标签6,在P(2,0)和P(2,4)的像素被分配相同的标签1,在P(3,0)和P(3,4)的像素被分配相同的标签1。在这种情况下,由于连接在P(0,0)和P(4,4)的像素的直线的方向与模式4的方向相同,所以模式4的模式计数ModeCountMode4是1。此外,由于连接在P(2,0)和P(2,4)的像素的直线的方向以及连接在P(3,0)和P(3,4)的像素的直线的方向与模式0的方向相同,所以模式0的模式计数Mode CountMode0是2。
因此,在本发明示例性实施例中,通过根据预定的扫描表确定相同的标签是否分配给每种帧内预测模式的方向上的预定位置的像素,来计算每种帧内预测模式的模式计数。
图12是图3的操作330的详细流程图。
操作330的目的是使用在操作320计算的每种帧内预测模式的模式计数来判定将被实际应用于帧内预测的预测模式。为此,在本发明示例性实施例中,预定的权重被应用到每种帧内预测模式的计算的模式计数,以计算每种帧内预测模式的方向因子(DF),并且计算的帧内预测模式的DF被比较,以选择具有最大DF的帧内预测模式。
作为预定的权重,在计算每个帧内预测模式的模式计数中使用的标签的比率可以被使用。换句话说,在操作332中,使用具有相同标签的像素的数量来计算每个标签的比率。这是因为可通过将高权重应用到分配给较多数量的像素的标签并将低权重应用到分配给较少数量的像素的标签,来提高判定最优帧内预测模式的精确度。例如,参照图11,被分配了在标注的输入块110中的模式计计算数中使用的标签1的像素的比率是(11/25)×100=44%。被分配了标签6的像素的比率是(7/25)×100=28%。
接下来,在操作334,每种帧内预测模式的模式计数乘以每个标签的比率,以计算每种帧内预测模式的DF。帧内预测模式Mode N的DF DFModeN如下:
DFModeN=Mode CountModeN×W    ………………(1)
其中,W是权重,每个标签的比率被用作上述的权重。例如,在图11中,模式0的模式计数Mode CountMode0是从被分配了标签1的像素计算得来的2,和被分配了标签1的像素的比率是44%。在这种情况下,模式0的DFDFMode0如下:
DFMode0=2×44=88    ………………(2)
在图11中,模式4的模式计数Mode CountMode4是由从被分配了标签6的像素计算得来的1,从被分配了标签6的像素的比率是28%。在这种情况下,模式4的DF DFMode4如下:
DFMode4=1×28=28    ………………(3)
接下来,在操作336,计算的帧内预测模式的DF被比较,并且最终选择具有最大DF的帧内预测模式。在图11中,由于模式0的DF DFMode0是88并且模式4的DF DFMode4是28,所以模式0被选为用于图11的标注的输入块110的最优帧内预测模式。
虽然在模式计数的计算中帧内预测模式被计数为相同的帧内预测模式,但是它们可使用被分配了不同标签的像素。参照图10,在模式4的模式计数的计算中使用被分配了标签1的像素和分配了标签6的像素。在这种情况下,通过将每种帧内预测模式的模式计数与每个标签的比率相乘来计算DF,并且具有相同帧内预测模式的DF被累加。考虑从图10的标注的输入块100计算模式4的DF的情况,在图10的标注的输入块100中,被分配了标签1的像素的比率是(9/16)×100=56.25%,并且被分配了标签6的像素的比率是(4/16)×100=25%。模式4的模式计数是3,即,来自被分配了标签1的像素的2和来自被分配了标签6的像素的1的和。在这种情况下,模式4的DF DFMode4如下:
DFMode4=DFLabel1,Mode4+DFLabel6,Mode4=2×56.25+1×25=137.5(4),
其中,DFLabel1,Mode4表示基于被分配了标签1的像素的模式4的DF,以及DFLabel6,Mode4表示基于被分配了标签6的像素的模式4的DF。以这种方式,在使用被分配了不同标签的的像素将所述帧内预测模式计数为相同的帧内预测模式的情况下,每种帧内预测模式的DF被计算,并且所述帧内预测模式的DF被累加,从而计算相应的帧内预测模式的DF。例如,在图10中,由于模式1的DF DFMode1是56.25,模式0的DF DFMode0是112.5,模式4的DF DFMode4是137.5,所以模式4被选为图10的标注的输入块100的帧内预测模式。
为了更加精确地预测,相邻于所选的具有最大DF的帧内预测模式的模式可被附加地选择。在这种情况下,当与现有技术相比较时,通过仅应用9种帧内预测模式中的3种帧内预测模式,可减少帧内预测所需的计算量。例如,参照图9,如果模式4被判定为具有最大DF的最优帧内预测模式,则与模式4相邻的模式5和模式6也可被选为将被实际应用于输入块的帧内预测模式,从而提高预测的精确度。
在本发明示例性实施例中,在根据预定的扫描表从标注的输入块计算每种帧内预测模式的模式计数之后,如果所有的模式计数是0或者标注的输入块的像素被分配了相同的标签,则将DC模式选为将被实际应用于输入块的帧内预测模式。
图13是应用了根据本发明示例性实施例的用于判定帧内预测模式的设备的视频编码器的框图。
参照图13,视频编码器包括预测单元1410、变换和量化单元1420以及熵编码单元1430。
预测单元1410执行帧间预测和帧内预测。在帧间预测中,使用已被编码、重构并存储在预定缓冲器中的参考画面来预测当前画面的块。帧间预测由运动估计单元1411和运动补偿单元1412来执行。帧内预测由帧内预测单元1413来执行。帧内预测模式判定单元1500(即,根据本发明示例性实施例的用于判定帧内预测模式的设备)位于帧内预测单元1413之前。帧内预测模式判定单元1500通过使用基于输入块的信息判定帧内预测模式的方法来判定将被实际应用于输入块的帧内预测模式,并将关于判定的帧内预测模式的信息输出到帧内预测单元1413。不是应用所有的帧内预测模式,帧内预测单元1413仅应用通过帧内预测模式判定单元1500判定的帧内预测模式,以执行帧内预测。
变换和量化单元1420对从预测单元1410输出的预测块和原始块之间的残差(residue)执行变换和量化,并且熵编码单元1430对量化的残差执行可变长编码,以进行压缩。
图14是根据本发明示例性实施例的用于判定帧内预测模式的设备(图13中所示的帧内预测模式判定单元1500)的框图。帧内预测模式判定单元1500包括:标注单元1510,根据输入块的像素的像素值标注输入块的像素;扫描单元1520,在扫描标注的输入块时计算每种帧内预测模式的模式计数;和预测模式判定单元1530,使用计算的每种帧内预测模式的模式计数来判定输入块的帧内预测模式。
标注单元1510包括标注步长设置单元1511和标签指定单元1512。标注步长设置单元1511为了给输入块的像素分配标签而设置标注步长,并且,标签指定单元1512根据设置的标注步长将输入块的像素的像素值划分为多个范围,并将标签指定到划分的范围。
扫描单元1520包括扫描执行单元1521和计数单元1522。扫描执行单元1521根据预定的扫描表扫描分配给与开始点和结束点相应的两个像素的标签,并且如果分配给所述两个像素的标签彼此相同,则计数单元1522对具有与连接所述两个像素的方向的相同方向的帧内预测模式进行计数。
预测模式判定单元1530包括:标签比率计算单元1531、方向因子计算单元1532和比较单元1533。标签比率计算单元1531将每个标签的比率计算为用于计算每种帧内预测模式的方向因子的权重。方向因子计算单元1532将每个标签的比率乘以每种帧内预测模式的模式计数,以计算每种帧内预测模式的方向因子。比较单元1533比较计算的方向因子,判定具有最大方向因子的帧内预测模式,并输出关于判定的帧内预测模式的信息。
在本发明示例性实施例中,在根据预定的扫描表从标注的输入块计算每种帧内预测模式的模式计数之后,如果全部的模式计数是0或者标注的输入块的像素被分配了相同的标签,则预测模式判定单元1530将DC模式选为将被实际应用于输入块的帧内预测模式。
如上所述,根据本发明示例性实施例,不是应用所有的帧内预测模式,而是基于输入块的方向性使用输入块的像素信息仅将所有帧内预测模式中的一些应用于帧内预测,从而降低了计算复杂度并减少了编码所需的时间,因此使得容易实现实时视频编码。
同时,本发明还可被实施为计算机可读记录介质的计算机可读代码。所述计算机可读记录介质为任何可存储其后能由计算机系统读取的数据的数据存储装置。所述计算机可读记录介质的例子包括:只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置和载波。所述计算机可读记录介质也可分布于网络连接的计算机系统上,以便所述计算机可读代码以分散方式被存储并被执行。
尽管已参照本发明示例性实施例对本发明进行了详细地示出和描述,但是本领域普通技术人员应当理解在不脱离由权利要求限定的本发明的精神和范围的情况下,可在形式和细节上做出各种改变。

Claims (21)

1、一种判定视频的帧内预测模式的方法,所述方法包括:
(a)根据像素的像素值为输入块的像素分配标签;
(b)根据扫描表扫描标注的输入块,并且如果在根据帧内预测模式的方向的预定位置的像素被分配相同的标签,则通过对帧内预测模式计数来计算帧内预测模式的模式计数;和
(c)使用计算的模式计数来判定用于输入块的帧内预测模式。
2、如权利要求1所述的方法,其中,所述分配步骤包括:
(a1)设置用于将像素分为多个范围的标注步长;
(a2)根据设置的标注步长将像素值分为多个范围,并将所述标签指定到所述范围;和
(a3)根据输入块的像素的像素值所属的范围为输入块的像素分配标签。
3、如权利要求1所述的方法,其中,所述扫描和计算步骤包括:
(b1)根据帧内预测模式的方向,扫描分配给与输入块中的开始点相应的像素的标签和分配给与输入块中的结束点相应的像素的标签;和
(b2)如果分配给与开始点和结束点相应的两个像素的标签彼此相同,则通过对具有与连接所述两个像素的方向相同的方向的帧内预测模式计数,来计算帧内预测模式的模式计数。
4、如权利要求3所述的方法,其中,所述与开始点相应的像素位于输入块的第一列第一行,所述与结束点相应的像素位于输入块的最后一列最后一行。
5、如权利要求1所述的方法,其中,根据输入块的帧内预测中可用的帧内预测模式,所述扫描表包括与输入块中的扫描的开始点相应的像素的位置和与输入块中的扫描的结束点相应的像素的位置。
6、如权利要求1所述的方法,其中,所述判定步骤包括:
(c1)通过将计算的模式计数乘以权重来计算帧内预测模式的方向因子;和
(c2)比较计算的方向因子,以选择具有最大方向因子的帧内预测模式。
7、如权利要求6所述的方法,还包括:使用被分配了相同标签的像素的数量计算每个标签的比率,其中,计算的每个标签的比率被用作权重。
8、如权利要求6所述的方法,其中,所述比较步骤包括:附加地选择与所选的具有最大方向因子的帧内预测模式相邻的帧内预测模式。
9、如权利要求1所述的方法,其中,所述判定步骤包括:如果帧内预测模式的模式计数全部是0或者标注的输入块的像素被分配了相同的标签,则选择直流模式作为用于输入块的帧内预测模式。
10、如权利要求1所述的方法,其中,根据垂直模式(模式0)、水平模式(模式1)、左下对角模式(模式3)和右下对角模式(模式4)的方向扫描所述标注的输入块。
11、一种用于判定视频的帧内预测模式的设备,所述设备包括:
标注单元,根据像素的像素值为输入块的像素分配标签;
扫描单元,根据扫描表扫描标注的输入块,并且如果在根据帧内预测模式的方向的预定位置的像素被分配相同的标签,则通过对帧内预测模式计数来计算帧内预测模式的模式计数;和
预测模式判定单元,使用计算的模式计数来判定用于输入块的帧内预测模式。
12、如权利要求11所述的设备,其中,所述标注单元包括:
标注步长设置单元,设置用于将像素分为多个范围的标注步长;
标签指定单元,根据设置的标注步长将像素值分为多个范围并将所述标签指定到所述范围,并且根据输入块的像素的像素值所属的范围为输入块的像素分配标签。
13、如权利要求11所述的设备,其中,所述扫描单元包括:
扫描执行单元,根据帧内预测模式的方向,扫描分配给与输入块中的开始点相应的像素的标签和分配给与输入块中的结束点相应的像素的标签;和
计数单元,如果分配给与开始点和结束点相应的两个像素的标签彼此相同,则通过对具有与连接所述两个像素的方向相同的方向的帧内预测模式计数,来计算帧内预测模式的模式计数。
14、如权利要求13所述的设备,其中,所述与开始点相应的像素位于输入块的第一列第一行,所述与结束点相应的像素位于输入块的最后一列最后一行。
15、如权利要求11所述的设备,其中,根据输入块的帧内预测中可用的帧内预测模式,所述扫描表包括与输入块中的扫描的开始点相应的像素的位置和与输入块中的扫描的结束点相应的像素的位置。
16、如权利要求11所述的设备,其中,所述预测模式判定单元包括:
方向因子计算单元,通过将计算的模式计数乘以权重来计算帧内预测模式的方向因子;和
比较单元,比较计算的方向因子,以选择具有最大方向因子的帧内预测模式。
17、如权利要求16所述的设备,所述预测模式判定单元还包括:标签比率计算单元,使用被分配了相同标签的像素的数量计算每个标签的比率;
并且方向因子计算单元将由标签比率计算单元计算的每个标签的比率用作权重。
18、如权利要求16所述的设备,其中,所述比较单元附加地选择与所选的具有最大方向因子的帧内预测模式相邻的帧内预测模式。
19、如权利要求11所述的设备,其中,如果帧内预测模式的模式计数全部是0或者标注的输入块的像素被分配了相同的标签,则所述预测模式判定单元选择直流模式作为用于输入块的帧内预测模式。
20、如权利要求11所述的设备,其中,根据垂直模式(模式0)、水平模式(模式1)、左下对角模式(模式3)和右下对角模式(模式4)的方向扫描所述标注的输入块。
21、一种存储有用于执行判定视频的帧内预测模式的方法的计算机程序的计算机可读记录介质,所述方法包括:
根据像素的像素值为输入块的像素分配标签;
根据扫描表扫描标注的输入块,并且如果在根据帧内预测模式的方向的预定位置的像素被分配相同的标签,则通过对帧内预测模式计数来计算帧内预测模式的模式计数;和
使用计算的模式计数来判定用于输入块的帧内预测模式。
CN2007100065222A 2006-02-02 2007-02-01 用于判定帧内预测模式的方法和设备 Expired - Fee Related CN101014125B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR10-2006-0010180 2006-02-02
KR1020060010180 2006-02-02
KR20060010180A KR100739790B1 (ko) 2006-02-02 2006-02-02 인트라 예측 모드 결정 방법 및 장치

Publications (2)

Publication Number Publication Date
CN101014125A true CN101014125A (zh) 2007-08-08
CN101014125B CN101014125B (zh) 2010-07-28

Family

ID=38322083

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007100065222A Expired - Fee Related CN101014125B (zh) 2006-02-02 2007-02-01 用于判定帧内预测模式的方法和设备

Country Status (4)

Country Link
US (1) US20070177668A1 (zh)
JP (1) JP2007208989A (zh)
KR (1) KR100739790B1 (zh)
CN (1) CN101014125B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105100804A (zh) * 2014-05-20 2015-11-25 炬芯(珠海)科技有限公司 一种视频解码的方法及装置
US9628811B2 (en) 2007-12-17 2017-04-18 Qualcomm Incorporated Adaptive group of pictures (AGOP) structure determination
CN106851285A (zh) * 2010-08-17 2017-06-13 M&K控股株式会社 用于编码图像的装置
CN107105255A (zh) * 2016-02-23 2017-08-29 阿里巴巴集团控股有限公司 视频文件中添加标签的方法和装置
CN107197309A (zh) * 2011-10-07 2017-09-22 英迪股份有限公司 对视频信号进行解码的方法
WO2021114100A1 (zh) * 2019-12-10 2021-06-17 中国科学院深圳先进技术研究院 帧内预测方法、视频编码、解码方法及相关设备

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9648325B2 (en) 2007-06-30 2017-05-09 Microsoft Technology Licensing, Llc Video decoding implementations for a graphics processing unit
US20100034268A1 (en) * 2007-09-21 2010-02-11 Toshihiko Kusakabe Image coding device and image decoding device
US9706214B2 (en) 2010-12-24 2017-07-11 Microsoft Technology Licensing, Llc Image and video decoding implementations
CN107071411B (zh) * 2011-04-25 2020-08-28 Lg电子株式会社 一种由解码设备和编码设备执行的帧内预测方法
US9819949B2 (en) 2011-12-16 2017-11-14 Microsoft Technology Licensing, Llc Hardware-accelerated decoding of scalable video bitstreams
CN103379163B (zh) * 2012-04-25 2016-04-06 阿里巴巴集团控股有限公司 一种业务对象的确定方法以及确定装置
US10003792B2 (en) 2013-05-27 2018-06-19 Microsoft Technology Licensing, Llc Video encoder for images
CN105359531B (zh) 2014-03-17 2019-08-06 微软技术许可有限责任公司 用于针对屏幕内容编码的编码器侧判定的方法和系统
WO2016123792A1 (en) 2015-02-06 2016-08-11 Microsoft Technology Licensing, Llc Skipping evaluation stages during media encoding
US10038917B2 (en) 2015-06-12 2018-07-31 Microsoft Technology Licensing, Llc Search strategies for intra-picture prediction modes
US10136132B2 (en) 2015-07-21 2018-11-20 Microsoft Technology Licensing, Llc Adaptive skip or zero block detection combined with transform size decision
US10812795B2 (en) * 2016-09-30 2020-10-20 Lg Electronic Inc. Method for processing picture based on intra-prediction mode and apparatus for same

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100207426B1 (ko) * 1996-05-08 1999-07-15 전주범 무늬의 크기와 방향성을 이용한 텍스쳐 분류 장치
US6167162A (en) * 1998-10-23 2000-12-26 Lucent Technologies Inc. Rate-distortion optimized coding mode selection for video coders
US7555044B2 (en) * 2002-10-04 2009-06-30 General Instrument Corporation Frequency coefficient scanning paths for coding digital video content
BRPI0408087A (pt) 2003-03-03 2006-02-14 Agency Science Tech & Res método de intrapredição de codificação de vìdeo avançada (avc) para codificar vìdeo digital, aparelho que utiliza essa intrapredição e produto de programa de computador
JP2004320437A (ja) * 2003-04-16 2004-11-11 Sony Corp データ処理装置、符号化装置およびそれらの方法
EP1605706A2 (en) * 2004-06-09 2005-12-14 Broadcom Corporation Advanced video coding (AVC) intra prediction scheme
KR20060008523A (ko) * 2004-07-21 2006-01-27 삼성전자주식회사 영상의 인트라 예측 방법 및 그 장치
KR100643126B1 (ko) * 2004-07-21 2006-11-10 학교법인연세대학교 Dct 계수를 기초로 인트라 예측 모드를 결정하는트랜스코더 및 트랜스코딩 방법
JP4050754B2 (ja) * 2005-03-23 2008-02-20 株式会社東芝 ビデオエンコーダ及び動画像信号の符号化方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9628811B2 (en) 2007-12-17 2017-04-18 Qualcomm Incorporated Adaptive group of pictures (AGOP) structure determination
CN106851285A (zh) * 2010-08-17 2017-06-13 M&K控股株式会社 用于编码图像的装置
CN106851285B (zh) * 2010-08-17 2019-10-11 M&K控股株式会社 用于编码图像的装置
CN107197309A (zh) * 2011-10-07 2017-09-22 英迪股份有限公司 对视频信号进行解码的方法
CN107197309B (zh) * 2011-10-07 2020-02-18 英迪股份有限公司 对视频信号进行解码的方法
US10986346B2 (en) 2011-10-07 2021-04-20 Dolby Laboratories Licensing Corporation Methods and apparatuses of encoding/decoding intra prediction mode using candidate intra prediction modes
US11363278B2 (en) 2011-10-07 2022-06-14 Dolby Laboratories Licensing Corporation Methods and apparatuses of encoding/decoding intra prediction mode using candidate intra prediction modes
CN105100804A (zh) * 2014-05-20 2015-11-25 炬芯(珠海)科技有限公司 一种视频解码的方法及装置
CN107105255A (zh) * 2016-02-23 2017-08-29 阿里巴巴集团控股有限公司 视频文件中添加标签的方法和装置
CN107105255B (zh) * 2016-02-23 2020-03-03 阿里巴巴集团控股有限公司 视频文件中添加标签的方法和装置
WO2021114100A1 (zh) * 2019-12-10 2021-06-17 中国科学院深圳先进技术研究院 帧内预测方法、视频编码、解码方法及相关设备

Also Published As

Publication number Publication date
CN101014125B (zh) 2010-07-28
KR100739790B1 (ko) 2007-07-13
JP2007208989A (ja) 2007-08-16
US20070177668A1 (en) 2007-08-02

Similar Documents

Publication Publication Date Title
CN101014125B (zh) 用于判定帧内预测模式的方法和设备
CN101945280B (zh) 对编码视频数据选择编码类型和预测模式的方法和设备
US9743089B1 (en) Moving picture coding device, moving picture coding method, and moving picture coding program, and moving picture decoding device, moving picture decoding method, and moving picture decoding program
CN101682781B (zh) 图像编码方法以及图像解码方法
CN106060547B (zh) 解码高分辨率图像的方法和装置
CN101584218B (zh) 基于帧内预测的编码和解码方法及设备
CN1809161B (zh) 对编码视频数据选择编码类型和预测模式
US8385628B2 (en) Image encoding and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
CN101283600B (zh) 参考图像选择方法以及装置
US11570428B2 (en) Intra prediction mode encoding/decoding method and device, and recording medium in which bitstream is stored
CN104969552A (zh) 存储减少的帧内预测模式决策
CN101867814B (zh) 图像编码设备和图像编码方法
CN103096055A (zh) 一种图像信号帧内预测及解码的方法和装置
CN101309408B (zh) 一种亮度块帧内预测模式选择方法
JP5913283B2 (ja) 動き予測方法
US20060039476A1 (en) Methods for efficient implementation of skip/direct modes in digital video compression algorithms
CN101815215A (zh) 编码模式选择的方法和装置
CN102656889A (zh) 图像编码装置、图像解码装置、图像编码方法及图像解码方法
CN103188493A (zh) 图像编码装置及图像编码方法
CN103067704A (zh) 一种基于编码单元层次提前跳过的视频编码方法和系统
CN102572424A (zh) 图像处理设备、方法和程序
US20110001839A1 (en) Picture coding apparatus, picture coding method and video camera
KR20140005232A (ko) 예측 값을 형성하기 위한 방법들 및 디바이스들
CN103051896B (zh) 一种基于模式跳过的视频编码方法和系统
JP2005244749A (ja) 動画像符号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100728

Termination date: 20120201