JP2021516504A - 符号化単位の符号化コストの決定方法並びにその装置、コンピュータ可読記憶媒体、端末、及びコンピュータプログラム - Google Patents

符号化単位の符号化コストの決定方法並びにその装置、コンピュータ可読記憶媒体、端末、及びコンピュータプログラム Download PDF

Info

Publication number
JP2021516504A
JP2021516504A JP2020547348A JP2020547348A JP2021516504A JP 2021516504 A JP2021516504 A JP 2021516504A JP 2020547348 A JP2020547348 A JP 2020547348A JP 2020547348 A JP2020547348 A JP 2020547348A JP 2021516504 A JP2021516504 A JP 2021516504A
Authority
JP
Japan
Prior art keywords
coding
coding unit
unit
cost
pixel gradient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020547348A
Other languages
English (en)
Other versions
JP7080542B2 (ja
Inventor
煦楠 毛
煦楠 毛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Publication of JP2021516504A publication Critical patent/JP2021516504A/ja
Application granted granted Critical
Publication of JP7080542B2 publication Critical patent/JP7080542B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本願は、符号化単位の符号化コストの決定方法及び装置を開示している。前記方法は、フレーム内予測モードで予測符号化を行う符号化単位を決定するステップと、符号化単位に対応する画素勾配情報を決定するステップであって、画素勾配情報には、画素勾配分散が含まれ、画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である、ステップと、画素勾配情報に基づいて、符号化単位に対して分割事前判定を行うステップと、符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを符号化単位の第2符号化コストとして決定するステップであって、第2符号化コストが、符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、第1符号化コストが、符号化単位の現在のサイズを予測単位のサイズとして符号化単位を予測符号化することにより取得された符号化コストである、ステップと、を含む。

Description

本願は、2018年4月2日に中国特許庁に提出された、出願番号が第201810287548.7号であり、発明の名称が「符号化単位の符号化コストの決定方法及び関連装置」である中国特許出願に基づく優先権を主張し、その全ての内容は参照により本願に組み込まれる。
本願は、コンピュータ技術分野に関し、特に符号化単位の符号化コストの決定方法、装置、及びコンピュータ可読記憶媒体に関する。
高効率ビデオ符号化(HEVC:High Efficiency Video Coding)は、国際電気通信連合の電気通信標準化部門(ITU−T:International Telecommunications Union−Telecommunication Standardization Sector)及び国際標準化機構(ISO:International Standard Organized)が共同で策定した次世代高効率ビデオ符号化標準である。HEVCは、H.265とも呼ばれる。H.264/AVC(Advanced Video Coding)標準に比べると、HEVCでは、より多くの、より新しい、より柔軟な符号化技術が使用されている。同じビデオ品質条件下で、HEVCは、符号化のビットレートをさらに低減させることができる。
HEVC標準では、H.264/AVC標準におけるブロックに基づくビデオ圧縮符号化フレームワークが継続されている。H.264/AVC標準で使用されるマクロブロック(MB:Macroblock)に比べて、HEVC標準では、より柔軟なブロック構成が用いられる。H.264/AVC標準では、MBのサイズが一定であり、その一定のサイズが16×16画素であるが、HEVC標準では、符号化単位(CU:Coding Unit)は、ぞれぞれ、64×64画素、32×32画素、16×16画素、及び8×8画素である4種類のサイズであってもよい。HEVC標準では、ツリー構造の符号化単位アルゴリズムで符号化単位の具体的なサイズを決定することにより、1フレームの画像の分割を完了する。具体的には、まず、1フレームの画像を複数の符号化ツリー単位(CTU:Coding Tree Unit)に分割し、次に、各CTUに対して、再帰的走査方式を用いて、層ごとにZ字状にCUを走査し、各CUの符号化コストをそれぞれ決定し、各CUの符号化コストに基づいて、該CTUの符号化に対応する符号化コストを最小にする分割ポリシーを決定し、該分割ポリシーに従ってCTUの分割を決定し、CUの分割を実現する。ツリー構造におけるいずれのCUに対しても、CUの符号化コストを決定し、かつCUの分割の要否を決定するために、予測符号化、符号化コスト計算などの計算を行う必要があるので、該アルゴリズムは、大量の計算を行う必要があり、かかる時間が多く、符号化速度が低い。
本願は、CUの分割を繰り上げて終了することにより、計算量を削減し、符号化の複雑さを低減し、符号化速度を向上させることができる符号化単位の符号化コストの決定方法及び関連装置を提供することを主な目的とする。
本願の実施態様の第1態様では、サーバが実行する、符号化単位の符号化コストの決定方法が提供されている。前記方法は、
フレーム内予測モードで予測符号化を行う符号化単位を決定するステップと、
前記符号化単位に対応する画素勾配情報を決定するステップであって、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である、ステップと、
前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行うステップと、
前記符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを前記符号化単位の第2符号化コストとして決定するステップであって、前記第2符号化コストが、前記符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである、ステップと、を含んでもよい。
本願の実施態様の第2態様では、符号化単位の符号化コストの決定装置が提供されている。前記装置は、
フレーム内予測モードで予測符号化を行う符号化単位を決定する符号化単位決定モジュールと、
前記符号化単位に対応する画素勾配情報を決定し、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である、勾配情報決定モジュールと、
前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う事前判定モジュールと、
前記事前判定モジュールによる前記符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを前記符号化単位の第2符号化コストとして決定し、前記第2符号化コストが、前記符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである、コスト決定モジュールと、を含んでもよい。
上記の目的を達成するために、本願の実施態様の第3態様では、コンピュータ可読記憶媒体が提供されている。前記コンピュータ可読記憶媒体には、コンピュータプログラムが記憶され、前記コンピュータプログラムは、プロセッサによって実行されると、本願の第1態様で提供された符号化単位の符号化コストの決定方法の各ステップを実現させる。
上記の目的を達成するために、本願の実施態様の第4態様では、端末機器が提供されている。前記端末機器は、メモリと、プロセッサと、前記メモリに記憶されて前記プロセッサで実行されるコンピュータプログラムと、を含み、前記プロセッサは、前記コンピュータプログラムを実行すると、本願の実施態様の第1態様で提供された符号化単位の符号化コストの決定方法の各ステップを実現する。
本願の実施態様では、符号化単位に対してフレーム内予測モードで予測符号化を行うと決定した後、該符号化単位の画素勾配情報を決定し、該符号化単位の画素勾配情報に基づいて、符号化単位に対して分割事前判定を行い、分割事前判定の結果が「分割しない」である場合、符号化単位の現在のサイズを予測単位のサイズとして符号化単位を予測符号化することにより取得された符号化コストを、符号化単位の最終的な符号化コストとして決定する。これにより、符号化単位の分割が必要でないと決定し、該符号化単位の分割を繰り上げて終了することができ、符号化単位をサブ符号化単位に分割してから、サブ符号化単位を新たな符号化単位として予測符号化を行って符号化コストを計算する計算過程が省かれ、計算量が削減され、符号化速度が向上する。
本願の実施形態の構成をより明確に説明するために、以下、実施形態に必要な図面を簡単的に紹介する。明らかなように、以下の説明における図面は本願のいくつかの実施形態を示しているにすぎず、当業者にとって、創造的な労働をせずに、これらの図面から他の図面を得ることもできる。
本願の実施形態で提供された1フレームの画像をいくつかのCTUに分割する場合の例示的な模式図である。 本願の実施形態で提供されたCTUの分割ポリシーの表現形式の例示的な模式図である。 本願の実施形態で提供されたCTUの分割ポリシーの表現形式の例示的な模式図である。 完全な再帰的走査アルゴリズムでCTUの分割ポリシーを決定するフローの模式図である。 完全な再帰的走査アルゴリズムでCTUの分割ポリシーを決定するフローの模式図である。 完全な再帰的走査アルゴリズムでCTUの分割ポリシーを決定するフローの模式図である。 完全な再帰的走査アルゴリズムでCTUの分割ポリシーを決定するフローの模式図である。 完全な再帰的走査アルゴリズムでCTUの分割ポリシーを決定するフローの模式図である。 本願の実施形態で提供されたCTUの最終的な符号化コストに基づいて、CTUの分割方式を決定する例示的な模式図である。 本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。 本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。 本願の実施形態で提供されたCTUの分割ポリシーを決定する過程の例示的な模式図である。 本願の実施形態で提供されたCTUの分割ポリシーを決定する過程の例示的な模式図である。 本願の実施形態で提供されたCTUの分割ポリシーを決定する過程の例示的な模式図である。 本願の実施形態で提供されたCTUの分割ポリシーを決定する過程の例示的な模式図である。 本願の実施形態で提供されたCTUの分割ポリシーを決定する過程の例示的な模式図である。 本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。 本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。 本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。 本願の実施形態で提供された隣接符号化単位の例示的な模式図である。 本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。 本願の実施形態で提供された符号化単位の符号化コストの決定装置の構成の模式図である。 本願の実施形態で提供された事前判定モジュールの構成の模式図である。 本願の実施形態で提供された符号化単位の符号化コストの決定装置の構成の模式図である。 本願の実施形態で提供された端末の構成の模式図である。
以下、本願の実施形態の図面を参照しながら、本願の実施形態の構成を明確かつ十分に説明するが、明らかなように、説明する実施形態は、本願の一部の実施形態にすぎず、全部の実施形態ではない。当業者が創造的な労働をせずに本願の実施形態から得る全ての他の実施形態は、本願の保護範囲に属する。
本願の実施形態の構成を紹介する前に、本願の実施形態の構成を理解しやすくするために、まず、HEVC標準において、本願の実施形態に関するいくつかの定義を紹介する。
1.CTU。CTUとは、1フレームの画像を分割する際の基本単位である。1フレームの画像を符号化する前に、1フレームの画像を分割する必要がある。ここで、画像を分割する過程では、まず、画像をいくつかのCTUに分割する。一般的に、CTUのサイズは、64×64画素である。任意選択的に、CTUのサイズは、32×32画素であってもよく、さらに、16×16画素又は8×8画素であってもよい。例えば、1つのIフレームの画像の画素は、640×480画素であり、図1に示すように、このフレームの画像を70個の64×64画素のCTUに分割した後に、残っている画像が、64×64画素のCTUに分割されるには不十分である場合、残っている画像を20個の32×32画素のCTUに分割する。
2.CU。CUとは、HEVC標準における符号化単位であり、H.264/AVC標準におけるMBの概念に類似する。ある1フレームの画像に対してビデオ符号化を行う際に、この1フレームの画像における各CUを1つずつ符号化することにより、連続的なビデオビットストリームを形成する。CUは、CTUの分割により取得され、CUのサイズは、CTUのサイズ以下である。画像における各CTUの分割状況が決定されると、フレーム全体の画像の分割状況を決定することができる。
CTUに対応する分割ポリシーに従って、CTUを分割することにより、CTUにおけるCUの分割状況を決定することができる。CTUに対応する分割ポリシーは、ツリー構造で表すことができ、ツリー構造に従って、CTUのCUの分割状況を決定することができる。例えば、CTUの分割ポリシーは、図2Aに示すように、ツリー構造で表され、ここで、ツリー構造における根ノードは、CTUを表し、ツリー構造における葉ノードは、CTUにおけるCUを表す。ツリー構造におけるノードの下に子ノードがある場合は、該ノードに対応するCUをさらに分割する必要があることを表し、ツリー構造におけるノードの下に子ノードがない場合は、該ノードをさらに分割する必要がないことを表す。図2Aに示すツリー構造に従って決定されるCTUにおけるCUの分割状況は、図2Bに示すとおりである。
CTUに対してフレーム内予測モードで予測符号化を行う場合、CTUの分割ポリシーは、完全な再帰的走査の符号化アルゴリズムで決定することができ、該アルゴリズムの模式図は、図3A〜3Eに示すようなものであってもよく、CTUのサイズが64×64の画素である場合を例とする。
走査過程は、図3A及び図3Bに示すようなものであってもよい。
まず、図3Aに示すように、サイズが64×64画素のCTUについて、CTUを4つの32×32画素のCUに分割して、CTUのサブCUとする。さらに、各32×32画素のCUを、4つの16×16画素のCUに分割して、32×32画素のCUのサブCUとする。さらに、各16×16画素のCUを、4つの8×8画素のCUに分割して、16×16画素のCUのサブCUとする。4層のCUにより、領域4分木(いかなる子ノードもない最後の1層を除いて、各層の全てのノードの下に4つの子ノードがある)が形成される。
領域4分木が形成されると、図3Bに示すように、64×64画素を予測単位(PU:Prediction Unit)のサイズとして、CTUを予測符号化することにより、最適な予測モードを決定し、CTUの最適な予測モードでの符号化コスト(C1)を決定する。該符号化コストは、CTUの、PU分割方式が2N×2Nである場合での最小符号化コストである。32×32画素を予測単位のサイズとして、第2層の各CUをそれぞれ予測符号化することにより、第2層の各CUの最適な予測モードを決定し、第2層の各CUの最適な予測モードでの符号化コスト(C21、C22、C22、C24)を決定し、該符号化コストが、第2層の各CUの、PU分割方式が2N×2Nである場合での最小符号化コストである。16×16画素を予測単位のサイズとして、第3層の各CUをそれぞれ予測符号化することにより、第3層の各CUの最適な予測モードを決定し、第3層の各CUの最適な予測モードでの符号化コスト(C31、…、C34;C35、…、C38;C39、…、C312;C313、…、C316)を決定し、該符号化コストが、第3層の各CUの、PU分割方式が2N×2Nである場合での最小符号化コストである。8×8画素を予測単位のサイズとして、第4層の各CUをそれぞれ予測符号化することにより、第4層の各CUの最適な予測モードを決定し、第4層の各CUの最適な予測モードでの符号化コスト(c1、…、c4;c5、…、c6;…;c57、…、c60;c61、…、c64)を決定し、該符号化コストが、第4層の各CUの、PU分割方式が2N×2Nである場合での最小符号化コストである。
ここで、最適な予測モードは、あるサイズの予測単位に対応する複数種類の予測モードのうち、CUを予測符号化することにより取得された符号化コストを最小にすることが可能な予測モードである。例えば、サイズが64×64である予測単位は、4種類の予測モードに対応し、これらの4種類の予測モードのそれぞれでCUを予測符号化することにより取得された符号化コストがそれぞれc1、c2、c3、c4であり、かつc1<c2<c3<c4である場合、c1に対応する予測モードが最適な予測モードである。
符号化コストは、レート歪みコストとも呼ばれ、ある予測モードでCUを予測符号化する際に予測された予測値と参照値との差を示すものである。ここで、符号化コストが小さいほど、予測値と参照値との差が小さくなるため、符号化に必要なビット数が少なくなり、ビットレートが低くなる。具体的な実現では、差分絶対値和(SAD:Sum of Absolute Difference)アルゴリズム、変換差分絶対値和(SATD:Sum of Absolute Transformed Difference)アルゴリズム、差分二乗和(SSD:Sum of Squared Difference)アルゴリズムなどのアルゴリズムによって、ある予測モードでCUを予測符号化する際の符号化コストを決定してもよい。
走査過程の次は、再帰過程である。再帰過程は、図3C、図3D、及び図3Eに示すとおりである。
まず、図3Cに示すように、第3層の各CUの4つのサブCUの最小符号化コスト(例えば、c1、c2、c3、c4)をそれぞれ加算することにより、第3層の各CUの他の符号化コストを取得する。該符号化コストは、第3層の各CUの、PU分割方式がN×Nである場合での最小符号化コストである。第3層の各CUの、PU分割方式が2N×2Nである場合での最小符号化コストと、PU分割方式がN×Nである場合での最小符号化コストとを比較し(例えば、C31とc1+c2+c3+c4とを比較する)、2つの最小符号化コストのうちの小さい最小符号化コストを第3層の各CUの最小符号化コストとして選択し、この最小符号化コストが第3層の各CUの最終的な符号化コスト(c31、c32、…、c316)である。
そして、図3Dに示すように、第2層の各CUの4つのサブCUの最小符号化コスト(例えば、c31、c32、c33、c34)をそれぞれ加算することにより、第2層の各CUの他の符号化コストを取得する。該符号化コストは、第2層の各CUの、PU分割方式がN×Nである場合での最小符号化コストである。第2層の各CUの、PU分割方式が2N×2Nである場合での最小符号化コストと、PU分割方式がN×Nである場合での最小符号化コストとを比較し(例えば、C21とc31+c32+c33+c34とを比較する)、2つの最小符号化コストのうちの小さい最小符号化コストを第2層の各CUの最小符号化コストとして選択し、この最小符号化コストが第3層の各CUの最終的な符号化コスト(c21、c22、c23、c24)である。
次に、図3Eに示すように、第1層のCTUの4つのCUの最小符号化コスト(c21、c22、c23、c24)を加算することにより、CTUの他の符号化コストを取得する。該符号化コストは、CTUの、PU分割方式がN×Nである場合での最小符号化コストである。CTUの、PU分割方式が2N×2Nである場合での最小符号化コスト(C1)と、PU分割方式がN×Nである場合での最小符号化コスト(c21+c22+c23+c24)とを比較し、2つの最小符号化コストのうちの小さい最小符号化コストをCTUの最小符号化コスト(c0)として選択し、この符号化コストがCTUの最終的な符号化コストである。
再帰過程の後に、各層のCUの最小符号化コストに基づいて、CTUの分割方式を決定することができる。CTUの最小符号化コストが、PU分割方式が2N×2Nである場合での最小符号化コストであると(c0=C1)、CTUを分割しないと決定し、CTUのツリー構造に1層だけ、即ち根ノードのみがあると決定する。その対応する分割状況は、図4におけるAに示すとおりである。CTUの最小符号化コストが、PU分割方式がN×Nである場合での最小符号化コストであると(c0=c21+c22+c23+c24)、CTUを分割する必要があると決定し、図4におけるBに示すように、CTUを4つのCUに分割すると決定する。さらに、第2層の各CUの最小符号化コストに基づいて、第2層の各CUの分割の要否をそれぞれ順次に決定し、該最小符号化コストが、PU分割方式が2N×2Nである場合での最小符号化コストであると、分割が必要ではなく、該最小符号化コストが、PU分割方式がN×Nである場合での最小符号化コストであると、分割が必要である。同様に、第3層の各CUの最小符号化コストに基づいて、第3層の各CUの分割の要否を決定する。各CUの分割状況は、図2Aに示すようなツリー構造で示すことができる。
図3A〜図3Eに示す過程から分かるように、完全な再帰的走査アルゴリズムに係る過程は、CTUの符号化コストを最小にする分割ポリシーを見つける過程であり、再帰過程で決定される各符号化単位の最終的な符号化コストがいずれも該分割ポリシーの決定に用いられ、該分割ポリシーに従って、CTUの分割を完了することができ、さらに、CTUにおける分割されたCUに基づいて、該CTUを符号化することができる。
3.PU。PUとは、CUを予測符号化する際に用いられる基本単位であり、異なる予測モードに対して、異なるPU分割方式がある。例えば、フレーム内予測モードの場合、PU分割方式に2N×2NとN×Nとの2種類があり、ここで、2N×2Nの方式は、CUを1つのPUに分割して予測符号化し、即ち1つのCUに1つのPUが含まれることを意味し、N×Nの方式は、CUを4つの同じ大きさのPUに分割して予測符号化し、即ち1つのCUに4つのPUが含まれることを意味する。
図3A〜図3Eに示す過程から分かるように、ツリー構造の符号化アルゴリズムで決定される分割ポリシーは、CTUの符号化コストをできるだけ小さくすることができ、即ち、できるだけ少ないビットでCTUを符号化して、ビットレートを低減することができる。ビットレートが低減されるが、係る計算過程が複雑であり、計算量が多く、複雑さが高く、かかる時間が多く、符号化速度が遅い。計算過程は、具体的に、領域4分木における各CUに対して、異なるPU分割方式での、及び、異なる予測モードでの符号化コスト計算を行い、計算された複数の符号化コストを比較することにより、各CUの最小符号化コストを取得する、ことを含む。
そこで、本願の実施形態は、符号化単位の符号化コストの決定方法と、それに関連する装置とを提供することにより、CTUの分割ポリシーを決定する過程において計算の複雑さが高いという問題を解決する。
以下、図5〜図12を参照しながら、本願の実施形態で提供された符号化単位の符号化コストの決定方法について詳細に説明する。
図5を参照すると、図5は、本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。本願の実施形態では、該方法は、一般的に、ビデオ符号化サーバによって実行されてもよい。図5に示すように、本願の実施形態における前記方法は、以下のステップS101〜S104を含んでもよい。
S101で、フレーム内予測モードで予測符号化を行う符号化単位を決定する。
理解できるように、符号化単位がCTUの分割により取得され、符号化単位のサイズが、8×8画素、16×16画素、32×32画素、64×64画素のいずれかであってもよい。
本願の実施形態では、フレーム内予測モードで予測符号化を行うことは、現在フレームの符号化単位を参照符号化単位として予測符号化を行うことを意味し、ここで、参照符号化単位は、符号化済みの符号化単位を意味する。
具体的な実現では、符号化単位がIフレーム(I frame)における符号化単位である場合、Iフレームにフレーム内予測符号化のみが用いられるため、該符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位であると直接に決定することができる。符号化単位が非Iフレーム(例えば、Pフレーム又はBフレーム)における符号化単位である場合、H.264/AVC標準におけるフレーム内モード判定アルゴリズムを参照して、フレーム内予測モードで予測符号化を行う符号化単位を決定することができる。具体的には、符号化単位に対してフレーム間予測符号化を行って最適フレーム間モードを選択した後に、符号化単位の平均ビットレート及び平均境界誤差を決定し、符号化単位の平均ビットレートが符号化単位の平均境界誤差以上である場合、符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位であると決定してもよい。当然のことながら、符号化単位が非Iフレームにおける符号化単位である場合、フレーム内予測モードで予測符号化を行う符号化単位を他の方式で決定してもよいが、本願の実施形態はこれを限定しない。
理解できるように、前記符号化単位のサイズが最小符号化単位(SCU:Small Coding Unit)のサイズ、即ち8×8画素に等しく、符号化単位のさらなる分割ができない場合、ステップS102〜S103をスキップし、ステップS104を実行して、第1符号化コストを符号化単位の第2符号化コストとして決定する。
S102で、前記符号化単位に対応する画素勾配情報を決定し、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である。
本願の実施形態では、符号化単位に対応する画素勾配情報は、該符号化単位における画素の画像勾配に基づいて取得された情報である。画素勾配情報は、符号化単位における一部の画素の画像勾配に基づいて取得された情報であってもよい。画素勾配情報は、符号化単位における全部の画素の画像勾配に基づいて取得された情報であってもよい。
画素勾配分散に加えて、画素勾配情報には、画素勾配平均値、画素勾配平均二乗誤差などの、画像の滑らかさ、テクスチャの複雑さをはかるためのパラメータが含まれてもよい。ここで、画素勾配平均値は、符号化単位における一部の画素又は全部の画素の画像勾配の平均値を意味する。画素勾配平均二乗誤差は、符号化単位における一部の画素又は全部の画素の画像勾配の平均二乗誤差を意味する。
具体的な実現では、画像勾配アルゴリズムで符号化単位における各画素の画素勾配情報を決定してもよい。これにより、符号化単位における一部の画素又は全部の画素の画像勾配を決定し、さらに、符号化単位における一部の画素の画像勾配又は全部の画素の画像勾配に基づいて、符号化単位に対応する画素勾配情報を決定することができる。
画像勾配アルゴリズムは、一次導関数に基づく画像勾配アルゴリズム、例えば、ロバーツ(Roberts)演算子、ソーベル(Sobel)演算子、又はPrewitt演算子などであってもよい。画像勾配アルゴリズムは、二次導関数に基づく画像勾配アルゴリズム、例えば、ラプラス(Laplace)演算子などであってもよい。
本願の実施形態では、画素勾配情報が、符号化単位における一部の画素の画像勾配に基づいて取得された情報である場合、該一部の画素は、符号化単位の全部の画素の中からランダムに選択された一部の画素であってもよい。該一部の画素は、一定の選択ルールで符号化単位の全部の画素の中から選択された一部の画素であってもよく、例えば、符号化単位における一部の画素は、所定のサンプリングレートで選択された一部の画素であってもよい。例えば、所定のサンプリングレートが90%であり、符号化単位のサイズが64×64画素、即ち4096個の画素である場合、符号化単位における一部の画素は、4096個の画素のうちの3687個の画素である。左から右へ、上から下への順序で、符号化単位における全部の画素をサンプリングすることにより、3687個の画素を取得してもよい。
S103で、前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う。
理解できるように、画素勾配情報が画素勾配分散である場合、画素勾配分散に基づいて、符号化単位に対して分割事前判定を行ってもよい。画素勾配情報には、画素勾配平均値がさらに含まれる場合、画素勾配分散及び画素勾配平均値に基づいて、符号化単位に対して分割事前判定を行ってもよい。画素勾配情報には、画素勾配平均二乗誤差がさらに含まれる場合、画素勾配分散及び画素勾配平均二乗誤差に基づいて、符号化単位に対して分割事前判定を行ってもよい。ここで、画素勾配情報に基づいて、符号化単位に対して分割事前判定を行う具体的な実現形態については、図8〜図12に示す実施形態で具体的に説明されており、図8〜図12に示す実施形態における説明を参照すればよい。
S104で、前記符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを前記符号化単位の第2符号化コストとして決定し、前記第2符号化コストが、前記符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである。
本願の実施形態では、第1符号化コストは、符号化単位の、PU分割方式が2N×2Nである場合での符号化コストである。予測単位のサイズが符号化単位の現在のサイズであることに対応する予測モードが1種類だけある場合、第1符号化コストは、該予測モードで前記符号化単位を予測符号化することにより取得された符号化コスト、即ち、該予測モードに対応する符号化コストである。予測単位のサイズが符号化単位の現在のサイズであることに対応する予測モードが複数種類ある場合、第1符号化コストは、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された最小符号化コストである。
例を挙げて説明すると、例えば、符号化単位のサイズが32×32画素であり、サイズが32×32画素である予測単位に対応する予測モードが、予測モード1である1種類だけある場合、第1符号化コストは、予測モード1で符号化単位を予測符号化することにより取得された符号化コストである。サイズが32×32画素の予測単位に対応する予測モードが、それぞれ、予測モード1、予測モード2、予測モード3、及び予測モード4である計4種類ある場合、これらの4種類の予測モードのそれぞれで符号化単位を予測符号化することにより取得された符号化コストは、それぞれ、c11、c12、c13、c14であり、かつc11<c12<c13<c14であると、第1符号化コストは、c11である。
本願の実施形態では、第2符号化コストは、符号化単位の最終的な符号化コストを意味する。該符号化単位がCTUである場合、CTUの第2符号化コストは、上記の図3Eに示す過程における再帰過程で決定されたCTUの最小符号化コスト(c0)と同じであるとみなしてもよい。該第2符号化コストが第1符号化コストであるため、図4に示す分割状況によれば、該CTUの分割ポリシーが「分割しない」であり、即ち、CTUの現在のサイズで直接に符号化を行うと決定することができる。該符号化単位がCTUではなく、かつ第4層のCUではない場合、符号化単位の第2符号化コストは、上記の図3C又は図3Dに示す過程における、CUの、PU分割方式が2N×2Nである場合での最小符号化コストと、PU分割方式がN×Nである場合での最小符号化コストとを比較することにより決定されたCUの最小符号化コスト(c21、c31など)と同じであるとみなしてもよい。該第2符号化コストは、該符号化単位の上位層のCUの、PU分割方式がN×Nである場合での最小符号化コストの計算に用いられる。さらに、再帰方式でCTUの第2符号化コストを決定し、次にCTUの分割ポリシーを決定することができる。
本願の実施形態では、符号化単位をフレーム内予測モードで予測符号化する必要があると決定した後、該符号化単位の画素勾配情報を決定し、該符号化単位の画素勾配情報に基づいて、符号化単位に対して分割事前判定を行い、分割事前判定の結果が「分割しない」である場合、符号化単位の現在のサイズを予測単位のサイズとして符号化単位を予測符号化することにより取得された符号化コストを、符号化単位の最終的な符号化コストとして決定する。これにより、符号化単位の分割が必要でないと決定し、該符号化単位の分割を繰り上げて終了することができ、符号化単位をサブ符号化単位に分割してから、サブ符号化単位を新たな符号化単位として予測符号化、符号化コスト計算などを行う計算過程が省かれ、計算量が削減され、符号化速度が向上する。
図6を参照すると、図6は、本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。本願の実施形態では、該方法は、一般的に、ビデオ符号化サーバによって実行されてもよい。図6に示すように、本願の実施形態における前記方法は、以下のステップS201〜S208を含んでもよい。
S201で、フレーム内予測モードで予測符号化を行う符号化単位を決定する。
理解できるように、符号化単位がCTUの分割により取得され、符号化単位のサイズが、8×8画素、16×16画素、32×32画素、64×64画素のいずれかであってもよい。
本願の実施形態では、フレーム内予測モードで予測符号化を行うことは、現在フレームの符号化単位を参照符号化単位として予測符号化を行うことを意味し、ここで、参照符号化単位は、符号化済みの符号化単位を意味する。
具体的な実現では、符号化単位がIフレーム(I frame)における符号化単位である場合、Iフレームにフレーム内予測符号化のみが用いられるため、該符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位であると直接に決定することができる。符号化単位が非Iフレーム(例えば、Pフレーム又はBフレーム)における符号化単位である場合、H.264/AVC標準におけるフレーム内モード判定アルゴリズムを参照して、フレーム内予測モードで予測符号化を行う符号化単位を決定することができる。具体的には、符号化単位に対してフレーム間予測符号化を行って最適フレーム間モードを選択した後に、符号化単位の平均ビットレート及び平均境界誤差を決定し、符号化単位の平均ビットレートが符号化単位の平均境界誤差以上である場合、符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位であると決定してもよい。当然のことながら、符号化単位が非Iフレームにおける符号化単位である場合、フレーム内予測モードで予測符号化を行う符号化単位を他の方式で決定してもよいが、本願の実施形態はこれを限定しない。
理解できるように、前記符号化単位のサイズがSCUのサイズ、即ち8×8画素に等しく、符号化単位のさらなる分割ができない場合、ステップS202〜S206をスキップし、ステップS207を実行して、第1符号化コストを符号化単位の第2符号化コストとして決定する。
S202で、前記符号化単位に対応する画素勾配情報を決定し、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である。
本願の実施形態では、符号化単位に対応する画素勾配情報は、該符号化単位における画素の画像勾配に基づいて取得された情報である。画素勾配情報は、符号化単位における一部の画素の画像勾配に基づいて取得された情報であってもよい。画素勾配情報は、符号化単位における全部の画素の画像勾配に基づいて取得された情報であってもよい。
画素勾配分散に加えて、画素勾配情報には、画素勾配平均値、画素勾配平均二乗誤差などの、画像の滑らかさ、テクスチャの複雑さをはかるためのパラメータが含まれてもよい。ここで、画素勾配平均値は、符号化単位における一部の画素又は全部の画素の画像勾配の平均値を意味する。画素勾配平均二乗誤差は、符号化単位における一部の画素又は全部の画素の画像勾配の平均二乗誤差を意味する。
具体的な実現では、画像勾配アルゴリズムで符号化単位における各画素の画素勾配情報を決定してもよい。これにより、符号化単位における一部の画素又は全部の画素の画像勾配を決定し、さらに、符号化単位における一部の画素の画像勾配又は全部の画素の画像勾配に基づいて、符号化単位に対応する画素勾配情報を決定することができる。
画像勾配アルゴリズムは、一次導関数に基づく画像勾配アルゴリズム、例えば、ロバーツ(Roberts)演算子、ソーベル(Sobel)演算子、又はPrewitt演算子などであってもよい。画像勾配アルゴリズムは、二次導関数に基づく画像勾配アルゴリズム、例えば、ラプラス(Laplace)演算子などであってもよい。
本願の実施形態では、画素勾配情報が、符号化単位における一部の画素の画像勾配に基づいて取得された情報である場合、該一部の画素は、符号化単位の全部の画素の中からランダムに選択された一部の画素であってもよい。該一部の画素は、一定の選択ルールで符号化単位の全部の画素の中から選択された一部の画素であってもよく、例えば、符号化単位における一部の画素は、所定のサンプリングレートで選択された一部の画素であってもよい。例えば、所定のサンプリングレートが90%であり、符号化単位のサイズが64×64画素、即ち4096個の画素である場合、符号化単位における一部の画素は、4096個の画素のうちの3687個の画素である。左から右へ、上から下への順序で、符号化単位における全部の画素をサンプリングすることにより、3687個の画素を取得してもよい。
S203で、前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う。
理解できるように、画素勾配情報が画素勾配分散である場合、画素勾配分散に基づいて、符号化単位に対して分割事前判定を行ってもよい。画素勾配情報には、画素勾配平均値がさらに含まれる場合、画素勾配分散及び画素勾配平均値に基づいて、符号化単位に対して分割事前判定を行ってもよい。画素勾配情報には、画素勾配平均二乗誤差がさらに含まれる場合、画素勾配分散及び画素勾配平均二乗誤差に基づいて、符号化単位に対して分割事前判定を行ってもよい。ここで、画素勾配情報に基づいて、符号化単位に対して分割事前判定を行う具体的な実現形態については、図8〜図12に示す実施形態で具体的に説明されており、図8〜図12に示す実施形態における説明を参照すればよい。
前記符号化単位の分割事前判定の結果が「分割しない」である場合、ステップS207を実行し、前記符号化単位の分割事前判定の結果が「分割する」である場合、ステップS204を実行する。
S204で、前記符号化単位を少なくとも2つのサブ符号化単位に分割する。
具体的な実現では、従来技術における領域4分木の方式を参照して、符号化単位を4つのサブ符号化単位に分割してもよい。当然のことながら、符号化単位を他の数のサブ符号化単位に分割してもよいが、本願の実施形態は限定しない。
S205で、前記少なくとも2つのサブ符号化単位の符号化コストをそれぞれ決定する。
本願の実施形態では、少なくとも2つのサブ符号化単位を、フレーム内予測モードで予測符号化を行う新たな符号化単位として決定し、ステップS201〜S208を実行することにより、サブ符号化単位の符号化コストをそれぞれ決定してもよい。
S206で、前記少なくとも2つのサブ符号化単位の符号化コストの和と第1符号化コストとを比較し、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである。
本願の実施形態では、第1符号化コストは、符号化単位の、PU分割方式が2N×2Nである場合での符号化コストである。予測単位のサイズが符号化単位の現在のサイズであることに対応する予測モードが1種類だけある場合、第1符号化コストは、該予測モードで前記符号化単位を予測符号化することにより取得された符号化コスト、即ち、該予測モードに対応する符号化コストである。予測単位のサイズが符号化単位の現在のサイズであることに対応する予測モードが複数種類ある場合、第1符号化コストは、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された最小符号化コストである。
例を挙げて説明すると、例えば、符号化単位のサイズが32×32画素であり、サイズが32×32画素である予測単位に対応する予測モードが、予測モード1である1種類だけある場合、第1符号化コストは、予測モード1で符号化単位を予測符号化することにより取得された符号化コストである。サイズが32×32画素の予測単位に対応する予測モードが、それぞれ、予測モード1、予測モード2、予測モード3、及び予測モード4である計4種類ある場合、これらの4種類の予測モードのそれぞれで符号化単位を予測符号化することにより取得された符号化コストは、それぞれ、c11、c12、c13、c14であり、かつc11<c12<c13<c14であると、第1符号化コストは、c11である。
前記少なくとも2つのサブ符号化単位の符号化コストの和が第1符号化コスト以上である場合、ステップS207を実行する。前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コストよりも小さい場合、ステップS208を実行する。
S207で、前記第1符号化コストを前記符号化単位の第2符号化コストとして決定する。
S208で、前記少なくとも2つのサブ符号化単位の符号化コストの和を前記符号化単位の第2符号化コストとして決定する。
本願の実施形態では、第2符号化コストは、符号化単位の最終的な符号化コストを意味する。該符号化単位がCTUである場合、CTUの第2符号化コストは、上記の図3Eに示す過程における再帰過程で決定されたCTUの最小符号化コスト(c0)と同じであるとみなしてもよい。該第2符号化コストが第1符号化コストであるため、図4に示す分割状況によれば、該CTUの分割ポリシーが「分割しない」であり、即ち、CTUの現在のサイズで直接に符号化を行うと決定することができる。該符号化単位がCTUではなく、かつ第4層のCUではない場合、符号化単位の第2符号化コストは、上記の図3C又は図3Dに示す過程における、CUの、PU分割方式が2N×2Nである場合での最小符号化コストと、PU分割方式がN×Nである場合での最小符号化コストとを比較することにより決定されたCUの最小符号化コスト(c21、c31など)と同じであるとみなしてもよい。該第2符号化コストは、該符号化単位の上位層のCUの、PU分割方式がN×Nである場合での最小符号化コストの計算に用いられる。さらに、再帰方式でCTUの第2符号化コストを決定し、次にCTUの分割ポリシーを決定することができる。
本願の実施形態では、符号化単位をフレーム内予測モードで予測符号化する必要があると決定した後、該符号化単位の画素勾配情報を決定し、該符号化単位の画素勾配情報に基づいて、符号化単位に対して分割事前判定を行い、分割事前判定の結果が「分割しない」である場合、符号化単位の現在のサイズを予測単位のサイズとして符号化単位を予測符号化することにより取得された符号化コストを、符号化単位の最終的な符号化コストとして決定する。これにより、符号化単位の分割が必要でないと決定し、該符号化単位の分割を繰り上げて終了することができる。分割事前判定の結果が「分割する」である場合にのみ、符号化単位を分割し、次に符号化単位に対応するサブ符号化単位の符号化コストの和と第1符号化コストとの大きさを比較する。サブ符号化単位の符号化コストの決定にも同様な符号化コスト決定方法が用いられるため、サブ符号化単位のさらなる分割を繰り上げて終了することができる。符号化単位の分割をできるだけ繰り上げて終了することにより、符号化コストの大量の計算過程が省かれ、計算量が削減され、CTUの分割ポリシーがなるべく早く決定され、符号化速度が向上する。
以下、符号化単位を4つのサブ符号化単位に分割する場合を例として、本願の実施形態の構成を用いてCTUの分割ポリシーを決定する過程を紹介する。依然としてCTUのサイズが64×64画素である場合を例として、図7A〜7Eを参照する。
まず、図7Aに示すように、CTUをCUとして決定し、64×64画素を予測単位のサイズとしてCTUを予測符号化することにより、CTUの最適予測モードを決定し、CTUの最適予測モードでの符号化コスト、即ちC1を決定し、該符号化コストがCTUの第1符号化コストである。CTUの画素勾配情報に基づいて、CTUに対して分割判定を行う。
CTUの分割判定の結果が「分割しない」である場合、第1符号化コストC1をCTUの第2符号化コストとして決定し、即ちc0=C1にする。このとき、CTUの第2符号化コストが決定されるため、図4から分かるように、CTUの分割ポリシーが決定され、即ち、CTUの分割が必要でなく、分割が終了する。CTUの分割ポリシーが決定されるため、図3Bに示す過程と同様に、第2層のCU、第3層のCU、第4層のCUの符号化コストを順次に計算する必要がなく、図3C〜図3Eの過程を実行する必要もなく、大量の計算が省かれ、符号化速度が向上する。
CTUの分割判定の結果が「分割する」である場合、CTUを4つの32×32画素のCU、即ち第2層のCUに分割する。
そして、図7Bに示すように、32×32画素を予測単位のサイズとして第2層の各CUをそれぞれ予測符号化することにより、各CUの最適な予測モードを決定し、第2層の各CUの最適な予測モードでの符号化コストを決定し、該符号化コストが、第2層の各CUの第1符号化コスト、即ちC21、C22、C23、C24である。第2層の各CUの画素勾配情報に基づいて、第2層の各CUに対して分割事前判定をそれぞれ行う。
第2層のターゲットCUの分割判定の結果が「分割しない」である場合、第1符号化コストを第2層のターゲットCUの第2符号化コストとして決定する。このとき、第2層のターゲットCUの第2符号化コストが決定されるため、第2層のターゲットCUの分割が終了する。図3Bに示す過程と同様に該ターゲットCUの下位の第3層のCU、第4層のCUの符号化コストを順次に計算する必要がなく、同様に大量の計算が省かれ、符号化速度が向上する。
第2層のターゲットCUの分割判定の結果が「分割する」である場合、第2層のターゲットCUを4つの16×16画素のサブCU、即ち第3層のCUに分割する。
図7Cに示すように、16×16画素を予測単位のサイズとして第3層の各CUをそれぞれ予測符号化することにより、第3層の各CUの最適な予測モードを決定し、第3層の各CUの最適な予測モードでの符号化コストを決定し、該符号化コストが、第3層の各CUの第1符号化コストである。第3層の各CUの画素勾配情報に基づいて、第2層の各CUに対して分割事前判定をそれぞれ行う。
第3層のターゲットCUの分割判定の結果が「分割しない」である場合、第3層のターゲットCUの第1符号化コストを第3層のターゲットCUの第2符号化コストとして決定する。このとき、第3層のターゲットCUの第2符号化コストが決定されるため、第3層のターゲットCUの分割が終了する。ターゲットCUを分割しないことが決定されるため、図3Bに示す過程と同様に該ターゲットCUの下位の第4層のCUを順次に計算する必要がなく、大量の計算も省かれ、符号化速度が向上する。
第3層のターゲットCUの分割判定の結果が「分割する」である場合、第3層のターゲットCUを4つの8×8画素のCU、即ち第3層のCUに分割する。
図7Cに示すように、8×8画素を予測単位のサイズとして第4層の各CUをそれぞれ予測符号化することにより、第4層の各CUの最適な予測モードを決定し、第4層の各CUの最適な予測モードでの符号化コストを決定し、該符号化コストが、第4層の各CUの第1符号化コストである。
ツリー構造が形成されると、下から上へ、第3層、第2層、及び第1層のCUのうち、第2符号化コストが決定されていないCUの第2符号化コストを順次に決定し、CUの2つの符号化コスト(CUの4つのサブCUの第2符号化コストの和、及びCUの第1符号化コスト)のうちの小さい方をCUの第2符号化コストとして決定する。
例えば、図7A〜7Cの過程によって決定されたツリー構造は、図7Dに示すとおりである。ここで、図7Aの過程によって、番号が1のCU(即ちCTU)の分割が必要であると決定される。図7Bの過程によって、番号が3と4のCUの分割が必要であり、番号が2と5のCUの分割が必要でないと決定されるため、番号が2と5のCUの第2符号化コストがそれらの第1符号化コストであると決定され、番号が3と4のCUの第2符号化コストが決定されていない。図7Cの過程によって、番号が7〜13のCUの分割が必要でなく、番号が6のCUの分割が必要であると決定されるため、番号が7〜13のCUの第2符号化コストがそれらの第1符号化コストであると決定され、番号が6のCUの第2符号化コストが決定されていない。
そして、下から上へ、第2符号化単位が決定されていないCUの第2符号化コストを順次に決定し、つまり、番号が6、3、4、1のCUの第2符号化コストを決定する。図7Eに示すように、まず、第3層のCUのうち、番号が6のCUの第2符号化コストを決定し、次に、第2層のCUのうち、番号が3と4のCUの第2符号化コストを決定し、最後に、番号が1のCU、即ちCTUの第2符号化コストを決定する。
各層のCUの第2符号化コストを決定した後、各層のCUの最小符号化コストに基づいて、CTUの分割方式を決定する。CTUの第2符号化コストがCTUの第1符号化コストである場合、CTUを分割しないと決定し、CTUのツリー構造に1層だけ、即ち根ノードのみがあると決定する。その対応する分割状況は、図4におけるAに示すとおりである。CTUの第2符号化コストが第2層のCUの第2符号化コストの和である場合、CTUの分割が必要であると決定し、図4におけるBに示すようにCTUを4つのCUに分割すると決定する。CTUを4つのCUに分割すると決定した場合、さらに、第2層のCUの第2符号化コストに基づいて、第2層の分割方式を決定することができ、順次に類推すると、CTUの最終的な分割状況を決定することができる。
図7A〜7Eから分かるように、最極端な場合にのみ、即ち、上位3層(第1層、第2層、及び第3層)の各CUの分割事前判定の結果がいずれも「分割する」である場合にのみ、CTUの分割ポリシーを決定するために、図3に示す方式で走査及び再帰を行う必要がある。上位3層に分割事前判定の結果が「分割しない」であるCUが1つでもある限り、該CUの最小符号化コストを計算しなくてもよい。1つでものCUの最小符号化コストの決定に複雑な計算が必要であるため、本願の実施形態の構成によれば、大量の計算を省き、計算時間を節約し、符号化速度を向上させることができる。
図8を参照すると、図8は、本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。図8に示すように、本願の実施形態における前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う前記ステップは、以下のステップS301〜S303を含んでもよい。
S301で、前記符号化単位に対応する分散閾値を決定する。
本願の実施形態では、符号化単位に対応する分散閾値には、2つの場合がある。1つは、該分散閾値が固定閾値である。他の1つは、該分散閾値と、符号化単位に対応する量子化パラメータとの間に正の相関があり、即ち、符号化単位に対応する量子化パラメータが大きいほど、分散閾値が大きくなる。
量子化パラメータは、空間の細部の圧縮状況を反映したものである。量子化パラメータが小さいと、大部分の細部が保持され、量子化パラメータが増大すると、細部が失われ、ビットレートが低下する。即ち、量子化パラメータとビットレートとの間に負の相関があり、つまり、分散閾値とビットレートとの間に負の相関がある。量子化パラメータの値は、エンコーダにより決定されてもよい。量子化パラメータの値の範囲は0〜52であり、量子化パラメータが0よりも大きい場合、符号化単位に対応する分散閾値は、符号化単位に対応する量子化パラメータにXを乗じたものに等しくてもよい。Xは、1以上の数値である。
S302で、前記符号化単位に対応する画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する。
符号化単位に対応する画素勾配分散は、符号化単位における画像のテクスチャ及び物体境界状況を反映するためのものである。符号化単位の画素勾配分散が小さい場合は、符号化単位の画像のテクスチャが乱雑である可能性があり、符号化単位をさらに分割することが画質の向上に大きな助けにならないことを表す。テクスチャが乱雑であり、人の目が該符号化単位に敏感ではないため、さらなる分割が必要でない。
S303で、前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定する。
画素勾配分散が大きい場合は、符号化単位に物体境界が含まれる可能性があり、さらなる分割が画質の向上の助けになる可能性があり、さらなる分割後に該符号化単位に対応するサブ符号化単位の類似性がより高くなり、圧縮効率の向上の助けになることを表す。
本願の実施形態では、符号化単位の画素勾配分散に基づいて、符号化単位を分割するか否かの事前判定を完了し、符号化単位の画素勾配分散が符号化単位における画像のテクスチャ及び境界などの状況を反映しているため、符号化単位の画素勾配分散に基づいて、符号化単位の分割を繰り上げて終了し、計算量を削減することができるとともに、圧縮効率と画質とを両立させることができる。
他の可能な実現形態では、本願の実施形態における前記画素勾配情報には、画素勾配平均値がさらに含まれてもよい。図9を参照すると、図9は、本願の実施形態で提供された符号化単位の符号化コストの決定方法のフローの模式図である。図9に示すように、本願の実施形態における前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う前記ステップは、以下のステップS401〜S406を含んでもよい。
S401で、前記符号化単位に対応する第1閾値、前記符号化単位に対応する第2閾値、及び前記符号化単位に対応する分散閾値を決定し、前記第2閾値が前記第1閾値よりも大きい。
本願の実施形態では、符号化単位に対応する分散閾値には、2つの場合がある。1つは、該分散閾値が固定閾値である。他の1つは、該分散閾値と、符号化単位に対応する量子化パラメータとの間に正の相関があり、即ち、符号化単位に対応する量子化パラメータが大きいほど、分散閾値が大きくなる。
量子化パラメータは、空間の細部の圧縮状況を反映したものである。量子化パラメータが小さいと、大部分の細部が保持され、量子化パラメータが増大すると、細部が失われ、ビットレートが低下する。即ち、量子化パラメータとビットレートとの間に負の相関があり、つまり、分散閾値とビットレートとの間に負の相関がある。量子化パラメータの値は、エンコーダにより決定されてもよい。量子化パラメータの値の範囲は0〜52であり、量子化パラメータが0よりも大きい場合、符号化単位に対応する分散閾値は、符号化単位に対応する量子化パラメータにXを乗じたものに等しくてもよい。Xは、1以上の数値である。
本願の実施形態では、第1閾値及び第2閾値は、いずれも平均値閾値である。符号化単位に対応する第1閾値がゼロでない場合、符号化単位に対応する第2閾値は、符号化単位に対応する第1閾値の一定の倍数であってもよい。即ち、符号化単位に対応する第2閾値は、符号化単位に対応する第1閾値と第2係数との積であり、第2係数は1よりも大きい。符号化単位に対応する第1閾値がゼロである場合、符号化単位に対応する第2閾値は、符号化単位に対応する閾値と目標平均値閾値との和であってもよく、目標平均値閾値は、固定閾値である。
1つの可能な実現形態で、該符号化単位に対応する第1閾値は、固定閾値であってもよい。符号化単位に対応する第1閾値が固定閾値である場合、第1閾値と符号化単位のサイズとの間に負の相関がある。
別の可能な実現形態では、符号化単位に対応する第1閾値は、符号化単位の周囲の符号化単位の画素勾配の平均値と相関してもよい。具体的な実現では、図10に示すように、前記符号化単位に対応する第1閾値を決定する前記ステップは、以下のステップS501〜S503を含む。
S501で、前記符号化単位の複数の隣接符号化単位を決定し、前記隣接符号化単位のエッジと前記符号化単位のエッジに重なるところがあり、又は前記隣接符号化単位の頂点と前記符号化単位の頂点に重なるところがあるが、前記隣接符号化単位における画像と前記符号化単位における画像とが重ならない。
理解できるように、隣接符号化単位は、符号化単位の周囲の、符号化単位に接する符号化単位である。該隣接符号化単位は、予測符号化済みの符号化単位であってもよい。隣接符号化単位のサイズは、符号化単位のサイズと同じであってもよく、隣接符号化単位のサイズは、符号化単位のサイズと異なってもよい。
以下、例を挙げて、隣接符号化単位を説明する。図11に示すように、符号化単位が、図11に示すCU1である場合、CU7、CU17、CU19、CU20、CU23には、CU1のエッジと重なるエッジがあり、CU6、CU10、CU22、及びCU24の頂点とCU1の頂点に重なるところがある。このため、CU6、CU7、CU10、CU17、CU19、CU20、CU22、CU23、及びCU24は、いずれもCU1の隣接符号化単位である。残りのCUには、CU1と重なるエッジ又は頂点がないため、残りのCUは、符号化単位の隣接符号化単位ではない。
さらに、隣接符号化単位は、符号化単位の周囲の、特定の方向及び位置にある符号化単位であってもよい。例えば、隣接符号化単位は、符号化単位の周囲の、左上の位置、真上の位置、右上の位置、及び真左の位置にある隣接符号化単位であり、即ち、図11において、CU6、CU7、CU10、CU17、CU19がCU1の隣接符号化単位である。
隣接符号化単位を符号化単位と同じサイズの符号化単位に限定し、依然としてCU1が符号化単位である場合を例にすると、CU1の隣接符号化単位は、CU3、CU4、CU5、CU6を組み合わせた符号化単位、CU7、CU8、CU9、CU10、CU11を組み合わせた符号化単位、CU16、CU17、CU18、CU19を組み合わせた符号化単位、CU20、CU22、CU23、CU3、CU24、CU25、CU26を組み合わせた符号化単位であってもよい。
説明すべきものとして、上記の隣接符号化単位の例は、例示にすぎず、本願の実施形態を限定するものではない。
S502で、前記複数の隣接符号化単位のうち、第1隣接符号化単位の数が目標数以上である場合、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位の画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定し、前記第1隣接符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位である。
具体的な実現では、目標数は、4、5、6などの値に設定してもよい。
本願の実施形態では、符号化単位がIフレームにおける符号化単位である場合、ステップS501で決定された隣接符号化単位は、いずれも第1隣接符号化単位である。符号化単位が非Iフレームにおける符号化単位である場合、ステップS101で説明した方式で、複数の隣接符号化単位の中から、第1隣接符号化単位を決定してもよい。
1つの具体的な実現では、図12に示すように、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位の画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定する前記ステップは、以下のステップS601〜S603を含む。
S601で、前記第1隣接符号化単位の中から第2隣接符号化単位を検索し、前記第2隣接符号化単位のサイズが、前記符号化単位のサイズ以上である。
例えば、図11に示す隣接符号化単位のうち、CU7、CU10、CU17、CU20、CU22、及びCU23は、いずれもフレーム内予測モードで予測符号化を行う符号化単位であり、かつ、CU7、CU20、CU22、及びCU23のサイズは、いずれもCU1のサイズに等しい場合、CU7、CU20、CU22、及びCU23は、いずれも第2隣接符号化単位である。
S602で、前記第2隣接符号化単位が存在する場合、第1係数と目標平均値との積を、前記符号化単位に対応する第1閾値として決定し、前記目標平均値が、各第2隣接符号化単位に対応する画素勾配平均値の総和と前記第2隣接符号化単位の数との商である。
第1係数は、1よりも大きい係数であってもよい。
具体的な実現では、上記ステップS102で紹介した、符号化単位に対応する画素勾配情報を決定する方式に基づいて、各隣接符号化単位に対応する画素勾配平均値を決定してもよい。
例えば、第2隣接符号化単位は、符号化単位2、符号化単位3、符号化単位4、符号化単位5であり、それらに対応する画素勾配平均値は、それぞれ画素勾配平均値1、画素勾配平均値2、画素勾配平均値3、画素勾配平均値4である場合、目標平均値は、(画素勾配平均値1+画素勾配平均値2+画素勾配平均値3+画素勾配平均値4)/4である。
S603で、前記第2隣接単位が存在しない場合、前記符号化単位に対応する第1閾値がゼロであると決定する。
理解できるように、ゼロである第1閾値は、勾配計算で取得可能な最小値である。
説明すべきものとして、ステップS502の方式は、隣接符号化単位のサイズが符号化単位のサイズと同じであってもよく、隣接符号化単位のサイズが符号化単位のサイズと異なってもよい場合に対して設計された、前記符号化単位に対応する第1閾値を決定する方式である。他の可能な実現形態では、隣接符号化単位が、特にサイズが符号化単位のサイズと同じである符号化単位を指すと、ステップS502は、前記複数の隣接符号化単位のうち、第1隣接符号化単位の数が目標数以上である場合、前記第1隣接符号化単位の分割状況と、前記第1隣接符号化単位の画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定するステップであって、前記第1隣接符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位である、ステップに置き換えられてもよい。
具体的な実現では、前記第1隣接符号化単位の分割状況と、前記第1隣接符号化単位の画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定する前記ステップは、前記第1隣接符号化単位の中から第3隣接符号化単位を検索するステップであって、前記第3隣接符号化単位が、分割されていない第1隣接符号化単位である、ステップと、前記第3隣接符号化単位が存在する場合、第1係数と目標平均値との積を前記符号化単位に対応する第1閾値として決定するステップであって、前記目標平均値が、各第2隣接符号化単位に対応する画素勾配平均値の総和と前記第2隣接符号化単位の数との商である、ステップと、を含む。
S503で、前記複数の隣接符号化単位のうち、前記第1隣接符号化単位の数が前記目標数よりも小さい場合、前記符号化単位のサイズに対応する平均値閾値を、符号化単位に対応する第1閾値として決定する。
符号化単位のサイズに対応する平均値閾値は、固定閾値である。ここで、符号化単位のサイズが大きいほど、符号化単位のサイズに対応する平均値閾値が小さくなる。具体的な実現では、サイズが16×16画素の符号化単位、サイズが32×32画素の符号化単位、及びサイズが64×64画素の符号化単位にそれぞれ対応するための3つの平均値閾値を設計してもよい。
S402で、前記符号化単位に対応する画素勾配平均値と前記第1閾値とを比較する。
画素勾配平均値が第1閾値よりも小さい場合、ステップS405を実行する。画素勾配平均値が第1閾値以上である場合、ステップS403を実行する。
符号化単位に対応する画素勾配平均値は、符号化単位における画像内容の滑らかさの状況を反映するためのものである。符号化単位の画素勾配平均値が小さい場合は、符号化単位における画像内容が比較的滑らかであり、さらなる分割が必要でないことを表す。
S403で、前記画素勾配平均値と前記第2閾値とを比較する。
画素勾配平均値が第2閾値よりも小さい場合、ステップS404を実行する。画素勾配平均値が第2閾値以上である場合、ステップS406を実行する。
画素勾配平均値が大きい場合は、符号化単位における画像の内容が滑らかでなく、さらなる分割が必要である可能性が大きいことを表す。
S404で、前記符号化単位に対応する画素勾配分散と前記分散閾値とを比較する。
画素勾配分散が分散閾値よりも小さい場合、ステップS405を実行する。画素勾配分散値が前記分散閾値以上である場合、ステップS406を実行する。
符号化単位に対応する画素勾配分散は、符号化単位における画像のテクスチャ及び物体境界状況を反映するためのものである。符号化単位の画素勾配分散が小さい場合は、符号化単位の画像のテクスチャが乱雑である可能性があり、符号化単位をさらに分割することが画質の向上に大きな助けにならないことを表す。テクスチャが乱雑であり、人の目が該符号化単位に敏感ではないため、さらなる分割が必要でない。画素勾配分散が大きい場合は、符号化単位に物体境界が含まれる可能性があり、さらなる分割が画質の向上の助けになる可能性があり、さらなる分割後に該符号化単位に対応するサブ符号化単位の類似性がより高くなり、圧縮効率の向上の助けになることを表す。
S405で、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する。
S406で、前記符号化単位の分割事前判定の結果が「分割する」であると決定する。
本願の実施形態では、符号化単位の画素勾配分散と画素勾配平均値とを組み合わせて考えることで、符号化単位を分割するか否かの事前判定を完了する。符号化単位の画素勾配分散は、符号化単位における画像のテクスチャ及び境界などの状況を反映している。符号化単位の画素勾配平均値は、符号化単位における画像内容の滑らかさの状況を反映している。符号化単位における画像内容を総合的に分析することにより、符号化単位を分割するか否かの正確な判定を実現することができ、計算量を削減するとともに、圧縮効率と画質とを両立させる。
以下、図13〜図16を参照しながら、本願の実施形態で提供された符号化単位の符号化コストの決定装置について詳細に紹介する。符号化単位の符号化コストの前記決定装置は、計算処理機能を有する端末であってもよい。説明すべきものとして、図13〜図16に示す装置は、本願の図5〜図12に示す実施形態の方法を実行するためのものであり、説明の便宜上、本願の実施形態に関する部分だけを示しており、掲示されていない具体的な技術の細部については、本願の図5〜図12に示す実施形態を参照されたい。
図13を参照すると、図13は、本願の実施形態で提供された符号化単位の符号化コストの決定装置の構成の模式図である。図13に示すように、本願の実施形態で提供された符号化単位の符号化コストの前記決定装置70は、符号化単位決定モジュール71と、勾配情報決定モジュール72と、事前判定モジュール73と、コスト決定モジュール74と、を含んでもよい。
符号化単位決定モジュール71は、フレーム内予測モードで予測符号化を行う符号化単位を決定する。
理解できるように、符号化単位がCTUの分割により取得され、符号化単位のサイズが、8×8画素、16×16画素、32×32画素、64×64画素のいずれかであってもよい。
本願の実施形態では、フレーム内予測モードで予測符号化を行うことは、現在フレームの符号化単位を参照符号化単位として予測符号化を行うことを意味し、ここで、参照符号化単位は、符号化済みの符号化単位を意味する。
具体的な実現では、符号化単位がIフレーム(I frame)における符号化単位である場合、Iフレームにフレーム内予測符号化のみが用いられるため、符号化単位決定モジュール71は、該符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位であると直接に決定することができる。符号化単位が非Iフレーム(例えば、Pフレーム又はBフレーム)における符号化単位である場合、H.264/AVC標準におけるフレーム内モード判定アルゴリズムを参照して、フレーム内予測モードで予測符号化を行う符号化単位を決定することができる。具体的には、符号化単位決定モジュール71は、符号化単位に対してフレーム間予測符号化を行って最適フレーム間モードを選択した後に、符号化単位の平均ビットレート及び平均境界誤差を決定し、符号化単位の平均ビットレートが符号化単位の平均境界誤差以上である場合、符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位であると決定してもよい。当然のことながら、符号化単位が非Iフレームにおける符号化単位である場合、符号化単位決定モジュール71は、フレーム内予測モードで予測符号化を行う符号化単位を他の方式で決定してもよいが、本願の実施形態はこれを限定しない。
理解できるように、前記符号化単位のサイズがSCUのサイズ、即ち8×8画素に等しく、符号化単位のさらなる分割ができない場合、コスト決定モジュール74は、第1符号化コストを符号化単位の第2符号化コストとして直接に決定する。
勾配情報決定モジュール72は、前記符号化単位に対応する画素勾配情報を決定し、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である。
本願の実施形態では、符号化単位に対応する画素勾配情報は、勾配情報決定モジュール72によって、該符号化単位における画素の画像勾配に基づいて取得された情報である。画素勾配情報は、勾配情報決定モジュール72によって、符号化単位における一部の画素の画像勾配に基づいて取得された情報であってもよい。画素勾配情報は、勾配情報決定モジュール72によって、符号化単位における全部の画素の画像勾配に基づいて取得された情報であってもよい。
画素勾配分散に加えて、画素勾配情報には、画素勾配平均値、画素勾配平均二乗誤差などの、画像の滑らかさ、テクスチャの複雑さをはかるためのパラメータが含まれてもよい。ここで、画素勾配平均値は、符号化単位における一部の画素又は全部の画素の画像勾配の平均値を意味する。画素勾配平均二乗誤差は、符号化単位における一部の画素又は全部の画素の画像勾配の平均二乗誤差を意味する。
具体的な実現では、勾配情報決定モジュール72は、画像勾配アルゴリズムで符号化単位における各画素の画素勾配情報を決定してもよい。これにより、符号化単位における一部の画素の画像勾配を決定し、又は符号化単位における全部の画素の画像勾配を決定し、さらに、符号化単位における一部の画素の画像勾配又は全部の画素の画像勾配に基づいて、符号化単位に対応する画素勾配情報を決定することができる。
画像勾配アルゴリズムは、一次導関数に基づく画像勾配アルゴリズム、例えば、ロバーツ(Roberts)演算子、ソーベル(Sobel)演算子、又はPrewitt演算子などであってもよい。画像勾配アルゴリズムは、二次導関数に基づく画像勾配アルゴリズム、例えば、ラプラス(Laplace)演算子などであってもよい。
本願の実施形態では、画素勾配情報が、符号化単位における一部の画素の画像勾配に基づいて取得された情報である場合、該一部の画素は、勾配情報決定モジュール72によって、符号化単位の全部の画素の中からランダムに選択された一部の画素であってもよい。符号化単位における一部の画素は、勾配情報決定モジュール72によって、一定の選択ルールで符号化単位の全部の画素の中から選択された一部の画素であってもよく、例えば、符号化単位における一部の画素は、所定のサンプリングレートで選択された一部の画素であってもよい。例えば、所定のサンプリングレートが90%であり、符号化単位のサイズが64×64画素、即ち4096個の画素である場合、符号化単位における一部の画素は、4096個の画素のうちの3687個の画素である。勾配情報決定モジュール72は、左から右へ、上から下への順序で、符号化単位における全部の画素をサンプリングすることにより、3687個の画素を取得してもよい。
事前判定モジュール73は、前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う。
理解できるように、画素勾配情報が画素勾配分散である場合、事前判定モジュール73は、画素勾配分散に基づいて、符号化単位に対して分割事前判定を行ってもよい。画素勾配情報には、画素勾配平均値がさらに含まれる場合、事前判定モジュール73は、画素勾配分散及び画素勾配平均値に基づいて、符号化単位に対して分割事前判定を行ってもよい。画素勾配情報には、画素勾配平均二乗誤差がさらに含まれる場合、事前判定モジュール73は、画素勾配分散及び画素勾配平均二乗誤差に基づいて、符号化単位に対して分割事前判定を行ってもよい。
任意選択的に、図14に示すように、前記事前判定モジュール73は、閾値決定ユニット731と、結果決定ユニット732と、を含んでもよい。
1つの具体的な実現形態では、閾値決定ユニット731は、前記符号化単位に対応する分散閾値を決定する。結果決定ユニット732は、前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する。前記結果決定ユニット732は、さらに、前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定する。
他の具体的な実現形態では、前記画素勾配情報には、画素勾配平均値がさらに含まれ、閾値決定ユニット731は、前記符号化単位に対応する第1閾値、前記符号化単位に対応する第2閾値、及び前記符号化単位に対応する分散閾値を決定し、前記第2閾値が前記第1閾値よりも大きい。結果決定ユニット732は、前記画素勾配平均値が前記第1閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する。又は、前記結果決定ユニット732は、さらに、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する。又は、前記結果決定ユニット732は、さらに、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定する。又は、前記結果決定ユニット732は、さらに、前記画素勾配平均値が前記第2閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定する。
本願の実施形態では、符号化単位に対応する分散閾値には、2つの場合がある。1つは、該分散閾値が固定閾値である。他の1つは、該分散閾値と、符号化単位に対応する量子化パラメータとの間に正の相関があり、即ち、符号化単位に対応する量子化パラメータが大きいほど、分散閾値が大きくなる。
量子化パラメータは、空間の細部の圧縮状況を反映したものである。量子化パラメータが小さいと、大部分の細部が保持され、量子化パラメータが増大すると、細部が失われ、ビットレートが低下する。即ち、量子化パラメータとビットレートとの間に負の相関があり、つまり、分散閾値とビットレートとの間に負の相関がある。量子化パラメータの値は、エンコーダにより決定されてもよい。量子化パラメータの値の範囲は0〜52であり、量子化パラメータが0よりも大きい場合、閾値決定ユニット731は、符号化単位に対応する量子化パラメータにXを乗じたものを、符号化単位に対応する分散閾値として決定してもよい。Xは、1以上の数値である。閾値決定ユニット731は、固定の分散閾値を、符号化単位に対応する分散閾値として決定してもよい。
本願の実施形態では、第1閾値及び第2閾値は、いずれも平均値閾値である。符号化単位に対応する第1閾値がゼロでない場合、符号化単位に対応する第2閾値は、符号化単位に対応する第1閾値の一定の倍数であってもよい。即ち、閾値決定ユニット731は、符号化単位に対応する第2閾値が、符号化単位に対応する第1閾値と第2係数との積であるように決定してもよく、第2係数は1よりも大きい。符号化単位に対応する第1閾値がゼロである場合、閾値決定ユニット731は、符号化単位に対応する第2閾値が、符号化単位に対応する閾値と目標平均値閾値との和であるように決定してもよく、目標平均値閾値は、固定閾値である。
1つの可能な実現形態で、該符号化単位に対応する第1閾値は、固定閾値であってもよい。閾値決定ユニット731は、該符号化単位のサイズに対応する平均値閾値を、符号化単位に対応する第1閾値として決定してもよい。符号化単位に対応する第1閾値が固定閾値である場合、第1閾値と符号化単位のサイズとの間に負の相関がある。
別の可能な実施形態で、符号化単位に対応する第1閾値は、符号化単位の周囲の符号化単位の画素勾配の平均値と相関してもよい。前記符号化単位に対応する第1閾値を決定する際に、前記閾値決定ユニット731は、具体的に、
前記符号化単位の複数の隣接符号化単位を決定し、前記複数の隣接符号化単位のうち、第1隣接符号化単位の数が目標数以上である場合、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位に対応する画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定し、前記複数の隣接符号化単位のうち、前記第1隣接符号化単位の数が前記目標数よりも小さい場合、前記符号化単位のサイズに対応する平均値閾値を、符号化単位に対応する第1閾値として決定する、ようにしてもよく、前記隣接符号化単位のエッジと前記符号化単位のエッジに重なるところがあり、又は前記隣接符号化単位の頂点と前記符号化単位の頂点に重なるところがあるが、前記隣接符号化単位における画像と前記符号化単位における画像とが重ならなく、前記第1隣接符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位である。
本願の実施形態では、隣接符号化単位は、符号化単位の周囲の、符号化単位に接する符号化単位であってもよい。該隣接符号化単位は、予測符号化済みの符号化単位であってもよい。隣接符号化単位のサイズは、符号化単位のサイズと同じであってもよく、隣接符号化単位のサイズは、符号化単位のサイズと異なってもよい。
以下、例を挙げて、隣接符号化単位を説明する。図11に示すように、符号化単位が、図11に示すCU1である場合、CU7、CU17、CU19、CU20、CU23には、CU1のエッジと重なるエッジがあり、CU6、CU10、CU22、及びCU24の頂点とCU1の頂点に重なるところがある。このため、閾値決定ユニット731は、CU6、CU7、CU10、CU17、CU19、CU20、CU22、CU23、及びCU24が、いずれもCU1の隣接符号化単位であると決定する。残りのCUには、CU1と重なるエッジ又は頂点がないため、閾値決定ユニット731は、残りのCUが符号化単位の隣接符号化単位ではないと決定する。
さらに、隣接符号化単位は、符号化単位の周囲の、特定の方向及び位置にある符号化単位であってもよい。例えば、隣接符号化単位は、符号化単位の周囲の、左上の位置、真上の位置、右上の位置、及び真左の位置にある隣接符号化単位である。この場合、閾値決定ユニット731は、CU6、CU7、CU10、CU17、CU19がCUの隣接符号化単位であると決定する。
隣接符号化単位を符号化単位と同じサイズの符号化単位に限定し、依然としてCU1が符号化単位である場合を例にすると、閾値決定ユニット731は、CU3、CU4、CU5、CU6を組み合わせた符号化単位、CU7、CU8、CU9、CU10、CU11を組み合わせた符号化単位、CU16、CU17、CU18、CU19を組み合わせた符号化単位、CU20、CU22、CU23、CU3、CU24、CU25、CU26を組み合わせた符号化単位を隣接符号化単位として決定する。
具体的な実現では、目標数は、4、5、6などの値に設定してもよい。
符号化単位のサイズに対応する平均値閾値は、固定閾値である。ここで、符号化単位のサイズが大きいほど、符号化単位のサイズに対応する平均値閾値が小さくなる。具体的な実現では、サイズが16×16画素の符号化単位、サイズが32×32画素の符号化単位、及びサイズが64×64画素の符号化単位にそれぞれ対応するための3つの平均値閾値を設計してもよい。
本願の実施形態では、符号化単位がIフレームにおける符号化単位である場合、閾値決定ユニット731は、全ての隣接符号化単位がいずれも第1隣接符号化単位であると決定する。符号化単位が非Iフレームにおける符号化単位である場合、閾値決定ユニット731は、符号化単位決定モジュール71によって、複数の隣接符号化単位の中から第1隣接符号化単位を決定する。
具体的な実現では、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位の画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定する際に、前記閾値決定ユニット731は、具体的に、前記第1隣接符号化単位の中から第2隣接符号化単位を検索し、前記第2隣接符号化単位が存在する場合、第1係数と目標平均値との積を、前記符号化単位に対応する第1閾値として決定し、前記第2隣接単位が存在しない場合、前記符号化単位に対応する第1閾値がゼロであると決定する、ようにしてもよく、前記第2隣接符号化単位のサイズが、前記符号化単位のサイズ以上であり、前記目標平均値が、各第2隣接符号化単位に対応する画素勾配平均値の総和と前記第2隣接符号化単位の数との商である。
例えば、図11に示す隣接符号化単位のうち、CU7、CU10、CU17、CU20、CU22、及びCU23は、いずれもフレーム内予測モードで予測符号化を行う符号化単位であり、かつ、CU7、CU20、CU22、及びCU23のサイズは、いずれもCU1のサイズに等しい場合、閾値決定ユニット731は、CU7、CU20、CU22、及びCU23がいずれも第2隣接符号化単位であると決定する。
具体的な実現では、閾値決定ユニット731は、勾配情報決定モジュール72によって、各隣接符号化単位に対応する画素勾配平均値を決定し、さらに、目標平均値を決定してもよい。
例えば、第2隣接符号化単位は、符号化単位2、符号化単位3、符号化単位4、符号化単位5であり、それらに対応する画素勾配平均値は、それぞれ画素勾配平均値1、画素勾配平均値2、画素勾配平均値3、画素勾配平均値4である場合、閾値決定ユニット731は、目標平均値が(画素勾配平均値1+画素勾配平均値2+画素勾配平均値3+画素勾配平均値4)/4であると決定する。
理解できるように、ゼロである第1閾値は、勾配計算で取得可能な最小値である。
任意選択的に、前記符号化単位に対応する第1閾値を決定する際に、閾値決定ユニット731は、具体的に、前記符号化単位の複数の隣接符号化単位を決定し、前記複数の隣接符号化単位のうち、第1隣接符号化単位の数が目標数以上である場合、前記第1隣接符号化単位の分割状況と、前記第1隣接符号化単位の画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定する、ようにしてもよく、前記隣接符号化単位のエッジと前記符号化単位のエッジに重なるところがあり、又は前記隣接符号化単位の頂点と前記符号化単位の頂点に重なるところがあるが、前記隣接符号化単位における画像と前記符号化単位における画像とが重ならなく、前記第1隣接符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位である。
具体的な実現では、閾値決定ユニット731は、具体的に、前記第1隣接符号化単位の中から第3隣接符号化単位を検索し、前記第3隣接符号化単位が存在する場合、第1係数と目標平均値との積を前記符号化単位に対応する第1閾値として決定する、ようにしてもよく、前記第3隣接符号化単位が、分割されていない第1隣接符号化単位であり、前記目標平均値が、各第2隣接符号化単位に対応する画素勾配平均値の総和と前記第2隣接符号化単位の数との商である。
コスト決定モジュール74は、前記事前判定モジュール73による前記符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを前記符号化単位の第2符号化コストとして決定し、前記第2符号化コストが、前記符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである。
本願の実施形態では、第1符号化コストは、符号化単位の、PU分割方式が2N×2Nである場合での符号化コストである。予測単位のサイズが符号化単位の現在のサイズであることに対応する予測モードが1種類だけある場合、第1符号化コストは、該予測モードで前記符号化単位を予測符号化することにより取得された符号化コスト、即ち、該予測モードに対応する符号化コストである。予測単位のサイズが符号化単位の現在のサイズであることに対応する予測モードが複数種類ある場合、第1符号化コストは、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された最小符号化コストである。
例を挙げて説明すると、例えば、符号化単位のサイズが32×32画素であり、サイズが32×32画素である予測単位に対応する予測モードが、予測モード1である1種類だけある場合、第1符号化コストは、予測モード1で符号化単位を予測符号化することにより取得された符号化コストである。サイズが32×32画素の予測単位に対応する予測モードが、それぞれ、予測モード1、予測モード2、予測モード3、及び予測モード4である計4種類ある場合、コスト決定モジュール74がこれらの4種類の予測モードのそれぞれで符号化単位を予測符号化することにより取得された符号化コストは、それぞれ、c11、c12、c13、c14であり、かつc11<c12<c13<c14であると、コスト決定モジュール74は、第1符号化コストがc11であると決定する。
本願の実施形態では、第2符号化コストは、符号化単位の最終的な符号化コストを意味する。該符号化単位がCTUである場合、CTUの第2符号化コストは、上記の図3Eに示す過程における再帰過程で決定されたCTUの最小符号化コスト(c0)と同じであるとみなしてもよい。該第2符号化コストが第1符号化コストであるため、上記におけるCTUの最小符号化コストに基づいて分割ポリシーを決定することについての紹介によれば、該CTUの分割ポリシーが「分割しない」であり、即ち、CTUの現在のサイズで直接に符号化を行うと決定することができる。該符号化単位がCTUではなく、かつ第4層のCUではない場合、符号化単位の第2符号化コストは、上記の図3C又は図3Dに示す過程における、CUの、PU分割方式が2N×2Nである場合での最小符号化コストと、PU分割方式がN×Nである場合での最小符号化コストとを比較することにより決定されたCUの最小符号化コスト(c21、c31など)と同じであるとみなしてもよい。該第2符号化コストは、該符号化単位の上位層ノードの、PU分割方式がN×Nである場合での最小符号化コストの計算に用いられる。さらに、再帰方式でCTUの第2符号化コストを決定し、次にCTUの分割ポリシーを決定することができる。
本願の実施形態では、符号化単位をフレーム内予測モードで予測符号化する必要があると決定した後、該符号化単位の画素勾配情報を決定し、該符号化単位の画素勾配情報に基づいて、符号化単位に対して分割事前判定を行い、分割事前判定の結果が「分割しない」である場合、符号化単位の現在のサイズを予測単位のサイズとして符号化単位を予測符号化することにより取得された符号化コストを、符号化単位の最終的な符号化コストとして決定する。これにより、符号化単位の分割が必要でないと決定し、該符号化単位の分割を繰り上げて終了することができ、符号化単位をサブ符号化単位に分割してから、サブ符号化単位を新たな符号化単位として予測符号化、符号化コスト計算などを行う計算過程が省かれ、計算量が削減され、符号化速度が向上する。
図15を参照すると、図15は、本願の実施形態で提供された符号化単位の符号化コストの決定装置の構成の模式図である。前記装置は、上記図13に対応する実施形態における符号化単位決定モジュール71と、勾配情報決定モジュール72と、事前判定モジュール73と、コスト決定モジュール74と、を含んでもよい。さらに、前記装置は、分割モジュール75を含んでもよい。ここで、
分割モジュール75は、前記事前判定モジュールによる前記符号化単位の分割事前判定の結果が「分割する」である場合、前記符号化単位を少なくとも2つのサブ符号化単位に分割する。
具体的な実現では、従来技術における領域4分木の方式を参照して、分割モジュール75は、符号化単位を4つのサブ符号化単位に分割してもよい。当然のことながら、分割モジュール75は、符号化単位を他の数のサブ符号化単位に分割してもよいが、本願の実施形態は限定しない。
前記符号化単位決定モジュール71は、さらに、前記少なくとも2つのサブ符号化単位を、フレーム内予測モードで予測符号化を行う新たな符号化単位とし、前記勾配情報決定モジュール72は、さらに、前記少なくとも2つのサブ符号化単位に対応する画素勾配情報をそれぞれ決定し、前記事前判定モジュール73は、さらに、前記画素勾配情報に基づいて、前記少なくとも2つのサブ符号化単位のそれぞれに対して分割事前判定を行い、前記コスト決定モジュール74は、さらに、前記少なくとも2つのサブ符号化単位の符号化コストをそれぞれ決定する。
具体的な実現では、勾配情報決定モジュール72は、符号化単位に対応する画素勾配情報を決定する方式で、前記少なくとも2つのサブ符号化単位のそれぞれに対応する画素勾配情報を決定してもよい。事前判定モジュール73は、符号化単位に対応する画素勾配情報に基づいて、符号化単位に対して分割事前判定を行う方式で、前記少なくとも2つのサブ符号化単位のそれぞれに対して分割事前判定を行ってもよい。コスト決定モジュール74は、符号化単位の符号化コストを決定する方式で、前記少なくとも2つのサブ符号化単位の符号化コストをそれぞれ決定してもよい。具体的には、前述の図13に対応する実施形態における関連説明を参照すればよい。
前記コスト決定モジュール74は、さらに、前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コスト以上である場合、前記第1符号化コストを前記符号化単位の第2符号化コストとして決定する。
前記コスト決定モジュール74は、さらに、前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コストよりも大きい場合、前記少なくとも2つのサブ符号化単位の符号化コストの和を前記符号化単位の第2符号化コストとして決定する。
本願の実施形態では、符号化単位をフレーム内予測モードで予測符号化する必要があると決定した後、該符号化単位の画素勾配情報を決定し、該符号化単位の画素勾配情報に基づいて、符号化単位に対して分割事前判定を行い、分割事前判定の結果が「分割しない」である場合、符号化単位の現在のサイズを予測単位のサイズとして符号化単位を予測符号化することにより取得された符号化コストを、符号化単位の最終的な符号化コストとして決定する。これにより、符号化単位の分割が必要でないと決定し、該符号化単位の分割を繰り上げて終了することができる。分割事前判定の結果が「分割する」である場合にのみ、符号化単位を分割し、次に符号化単位に対応するサブ符号化単位の符号化コストの和と第1符号化コストとの大きさを比較する。サブ符号化単位の符号化コストの決定にも同様な符号化コスト決定方法が用いられるため、サブ符号化単位のさらなる分割を繰り上げて終了することができる。符号化単位の分割をできるだけ繰り上げて終了することにより、符号化コストの大量の計算過程が省かれ、計算量が削減され、CTUの分割ポリシーがなるべく早く決定され、符号化速度が向上する。
図16を参照すると、図16は、本願の実施形態で提供された端末の構成の模式図である。図16に示すように、前記端末80は、少なくとも1つのプロセッサ801(例えば、CPU)と、入出力インタフェース803と、メモリ804と、少なくとも1つの通信バス802と、を含んでもよい。ここで、通信バス802は、これらの構成要素間の接続通信を実現する。ここで、入出力インタフェース803は、標準的な有線インタフェース(例えば、USBインタフェース)、無線インタフェース(例えば、WI−FIインタフェース)を含んでもよい。任意選択的に、入出力インタフェース803は、ユーザインタフェース(例えば、ディスプレイ、キーボード、マウスなど)を含んでもよい。メモリ804は、高速RAMメモリであってもよいし、不揮発性メモリ(non−volatile memory)であってもよく、例えば、少なくとも1つの磁気ディスクメモリであってもよい。任意選択的に、メモリ804は、前記プロセッサ801から離れた少なくとも1つの記憶装置であってもよい。図15に示すように、コンピュータ可読記憶媒体であるメモリ804には、オペレーティングシステム、ネットワーク通信モジュール、ユーザインタフェースモジュール、符号化コスト決定プログラム、及び画像が含まれてもよい。
図15に示す端末80において、入出力インタフェース803は、画像を取得して端末に送信する。任意選択的に、入出力インタフェースは、さらに、プロセッサが処理した画像を出力するために用いられてもよい。プロセッサ801は、画像を分割することにより、符号化単位を取得することができる。さらに、プロセッサ801は、メモリ804に記憶されている符号化コスト決定プログラムを呼び出し、具体的に、
フレーム内予測モードで予測符号化を行う符号化単位を決定するステップと、
前記符号化単位に対応する画素勾配情報を決定するステップであって、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である、ステップと、
前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行うステップと、
前記符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを前記符号化単位の第2符号化コストとして決定するステップであって、前記第2符号化コストが、前記符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである、ステップと、を実行するために用いられてもよい。
一実施形態では、前記プロセッサ801は、メモリ804に記憶されている符号化コスト決定プログラムを呼び出すことにより、
前記符号化単位の分割事前判定の結果が「分割する」である場合、前記符号化単位を少なくとも2つのサブ符号化単位に分割するステップと、
前記少なくとも2つのサブ符号化単位を、フレーム内予測モードで予測符号化を行う新たな符号化単位として、符号化単位の符号化コストの前記決定方法を実行することにより、前記少なくとも2つのサブ符号化単位の符号化コストをそれぞれ決定するステップと、
前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コスト以上である場合、前記第1符号化コストを前記符号化単位の第2符号化コストとして決定するステップと、
前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コストよりも小さい場合、前記少なくとも2つのサブ符号化単位の符号化コストの和を前記符号化単位の第2符号化コストとして決定するステップと、を実行してもよい。
一実施形態では、前記プロセッサ801は、前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行うステップを実行する際に、具体的に、
前記符号化単位に対応する分散閾値を決定するステップと、
前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定するステップと、
前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定するステップと、を実行する。
一実施形態では、前記画素勾配情報には、画素勾配平均値がさらに含まれ、前記画素勾配平均値が、符号化単位における少なくとも一部の画素の画像勾配の平均値であり、前記プロセッサ801は、前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行うステップを実行する際に、具体的に、
前記符号化単位に対応する第1閾値、前記符号化単位に対応する第2閾値、及び前記符号化単位に対応する分散閾値を決定するステップであって、前記第2閾値が前記第1閾値よりも大きい、ステップと、
前記画素勾配平均値が前記第1閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定し、又は、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定し、又は、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定し、又は、前記画素勾配平均値が前記第2閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定するステップと、を実行する。
一実施形態では、前記プロセッサ801は、前記符号化単位に対応する第1閾値を決定するステップを実行する際に、具体的に、
前記符号化単位の複数の隣接符号化単位を決定するステップであって、前記隣接符号化単位のエッジと前記符号化単位のエッジに重なるところがあり、又は前記隣接符号化単位の頂点と前記符号化単位の頂点に重なるところがあるが、前記隣接符号化単位における画像と前記符号化単位における画像とが重ならない、ステップと、
前記複数の隣接符号化単位のうち、第1隣接符号化単位の数が目標数以上である場合、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位に対応する画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定するステップであって、前記第1隣接符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位である、ステップと、
前記複数の隣接符号化単位のうち、前記第1隣接符号化単位の数が前記目標数よりも小さい場合、前記符号化単位のサイズに対応する平均値閾値を、符号化単位に対応する第1閾値として決定するステップと、を実行する。
一実施形態では、前記プロセッサ801は、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位に対応する画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定するステップを実行する際に、具体的に、
前記第1隣接符号化単位の中から第2隣接符号化単位を検索するステップであって、前記第2隣接符号化単位のサイズが、前記符号化単位のサイズ以上である、ステップと、
前記第2隣接符号化単位が存在する場合、第1係数と目標平均値との積を、前記符号化単位に対応する第1閾値として決定するステップであって、前記目標平均値が、各第2隣接符号化単位に対応する画素勾配平均値の総和と前記第2隣接符号化単位の数との商である、ステップと、
前記第2隣接単位が存在しない場合、前記符号化単位に対応する第1閾値がゼロであると決定するステップと、を実行する。
一実施形態では、前記符号化単位に対応する第2閾値は、前記符号化単位に対応する第1閾値と第2係数との積である。
一実施形態では、前記符号化単位に対応する分散閾値と、前記符号化単位に対応する量子化パラメータとの間に正の相関がある。
本願の実施形態では、符号化単位をフレーム内予測モードで予測符号化する必要があると決定した後、該符号化単位の画素勾配情報を決定し、該符号化単位の画素勾配情報に基づいて、符号化単位に対して分割事前判定を行い、分割事前判定の結果が「分割しない」である場合、符号化単位の現在のサイズを予測単位のサイズとして符号化単位を予測符号化することにより取得された符号化コストを、符号化単位の最終的な符号化コストとして決定する。これにより、符号化単位の分割が必要でないと決定し、該符号化単位の分割を繰り上げて終了することができる。分割事前判定の結果が「分割する」である場合にのみ、符号化単位を分割し、次に符号化単位に対応するサブ符号化単位の符号化コストの和と第1符号化コストとの大きさを比較する。サブ符号化単位の符号化コストの決定にも同様な符号化コスト決定方法が用いられるため、サブ符号化単位のさらなる分割を繰り上げて終了することができる。符号化単位の分割をできるだけ繰り上げて終了することにより、符号化コストの大量の計算過程が省かれ、計算量が削減され、CTUの分割ポリシーがなるべく早く決定され、符号化速度が向上する。
当業者であれば理解できるように、上記実施形態を実現するための方法のフローの全部又は一部は、コンピュータプログラムによって関連ハードウェアに指示することにより実行されてもよい。前記プログラムは、コンピュータ可読記憶媒体に記憶されてもよく、該プログラムは、実行されるとき、上述した各方法の実施形態のフローを含んでもよい。ここで、前記記憶媒体は、磁気ディスク、光ディスク、読み出し専用メモリ(ROM:Read−Only Memory)、又はランダムアクセスメモリ(RAM:Random Access Memory)などであってもよい。
上記に掲示された内容は、本発明の好ましい実施形態にすぎず、これで本願の特許請求の範囲を限定する意図はないことは言うまでもない。それゆえ、本願の特許請求の範囲に基づいて行われた均等な変更も本願の保護範囲に属する。
70 符号化単位の符号化コストの決定装置
71 符号化単位決定モジュール
72 勾配情報決定モジュール
73 事前判定モジュール
731 閾値決定ユニット
732 結果決定ユニット
74 コスト決定モジュール
75 分割モジュール
80 端末
801 プロセッサ
802 通信バス
803 入出力インタフェース
804 メモリ
領域4分木が形成されると、図3Bに示すように、64×64画素を予測単位(PU:Prediction Unit)のサイズとして、CTUを予測符号化することにより、最適な予測モードを決定し、CTUの最適な予測モードでの符号化コスト(C1)を決定する。該符号化コストは、CTUの、PU分割方式が2N×2Nである場合での最小符号化コストである。32×32画素を予測単位のサイズとして、第2層の各CUをそれぞれ予測符号化することにより、第2層の各CUの最適な予測モードを決定し、第2層の各CUの最適な予測モードでの符号化コスト(C21、C22、C2、C24)を決定し、該符号化コストが、第2層の各CUの、PU分割方式が2N×2Nである場合での最小符号化コストである。16×16画素を予測単位のサイズとして、第3層の各CUをそれぞれ予測符号化することにより、第3層の各CUの最適な予測モードを決定し、第3層の各CUの最適な予測モードでの符号化コスト(C31、…、C34;C35、…、C38;C39、…、C312;C313、…、C316)を決定し、該符号化コストが、第3層の各CUの、PU分割方式が2N×2Nである場合での最小符号化コストである。8×8画素を予測単位のサイズとして、第4層の各CUをそれぞれ予測符号化することにより、第4層の各CUの最適な予測モードを決定し、第4層の各CUの最適な予測モードでの符号化コスト(c1、…、c4;c5、…、c;…;c57、…、c60;c61、…、c64)を決定し、該符号化コストが、第4層の各CUの、PU分割方式が2N×2Nである場合での最小符号化コストである。
まず、図7Aに示すように、CTUをCUとして決定し、64×64画素を予測単位のサイズとしてCTUを予測符号化することにより、CTUの最適予測モードを決定し、CTUの最適予測モードでの符号化コスト、即ちC1を決定し、該符号化コストがCTUの第1符号化コストである。CTUの画素勾配情報に基づいて、CTUに対して分割事前判定を行う。
CTUの分割事前判定の結果が「分割しない」である場合、第1符号化コストC1をCTUの第2符号化コストとして決定し、即ちc0=C1にする。このとき、CTUの第2符号化コストが決定されるため、図4から分かるように、CTUの分割ポリシーが決定され、即ち、CTUの分割が必要でなく、分割が終了する。CTUの分割ポリシーが決定されるため、図3Bに示す過程と同様に、第2層のCU、第3層のCU、第4層のCUの符号化コストを順次に計算する必要がなく、図3C〜図3Eの過程を実行する必要もなく、大量の計算が省かれ、符号化速度が向上する。
CTUの分割事前判定の結果が「分割する」である場合、CTUを4つの32×32画素のCU、即ち第2層のCUに分割する。
第2層のターゲットCUの分割事前判定の結果が「分割しない」である場合、第1符号化コストを第2層のターゲットCUの第2符号化コストとして決定する。このとき、第2層のターゲットCUの第2符号化コストが決定されるため、第2層のターゲットCUの分割が終了する。図3Bに示す過程と同様に該ターゲットCUの下位の第3層のCU、第4層のCUの符号化コストを順次に計算する必要がなく、同様に大量の計算が省かれ、符号化速度が向上する。
第2層のターゲットCUの分割事前判定の結果が「分割する」である場合、第2層のターゲットCUを4つの16×16画素のサブCU、即ち第3層のCUに分割する。
図7Cに示すように、16×16画素を予測単位のサイズとして第3層の各CUをそれぞれ予測符号化することにより、第3層の各CUの最適な予測モードを決定し、第3層の各CUの最適な予測モードでの符号化コストを決定し、該符号化コストが、第3層の各CUの第1符号化コストである。第3層の各CUの画素勾配情報に基づいて、第層の各CUに対して分割事前判定をそれぞれ行う。
第3層のターゲットCUの分割事前判定の結果が「分割しない」である場合、第3層のターゲットCUの第1符号化コストを第3層のターゲットCUの第2符号化コストとして決定する。このとき、第3層のターゲットCUの第2符号化コストが決定されるため、第3層のターゲットCUの分割が終了する。ターゲットCUを分割しないことが決定されるため、図3Bに示す過程と同様に該ターゲットCUの下位の第4層のCUを順次に計算する必要がなく、大量の計算も省かれ、符号化速度が向上する。
第3層のターゲットCUの分割事前判定の結果が「分割する」である場合、第3層のターゲットCUを4つの8×8画素のCU、即ち第層のCUに分割する。
本願の実施形態では、第1閾値及び第2閾値は、いずれも平均値閾値である。符号化単位に対応する第1閾値がゼロでない場合、符号化単位に対応する第2閾値は、符号化単位に対応する第1閾値の一定の倍数であってもよい。即ち、符号化単位に対応する第2閾値は、符号化単位に対応する第1閾値と第2係数との積であり、第2係数は1よりも大きい。符号化単位に対応する第1閾値がゼロである場合、符号化単位に対応する第2閾値は、符号化単位に対応する第1閾値と目標平均値閾値との和であってもよく、目標平均値閾値は、固定閾値である。
隣接符号化単位を符号化単位と同じサイズの符号化単位に限定し、依然としてCU1が符号化単位である場合を例にすると、CU1の隣接符号化単位は、CU3、CU4、CU5、CU6を組み合わせた符号化単位、CU7、CU8、CU9、CU10、CU11を組み合わせた符号化単位、CU16、CU17、CU18、CU19を組み合わせた符号化単位、CU20、CU22、CU23、CU24、CU25、CU26、CU27を組み合わせた符号化単位であってもよい。
S603で、前記第2隣接符号化単位が存在しない場合、前記符号化単位に対応する第1閾値がゼロであると決定する。
具体的な実現では、前記第1隣接符号化単位の分割状況と、前記第1隣接符号化単位の画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定する前記ステップは、前記第1隣接符号化単位の中から第3隣接符号化単位を検索するステップであって、前記第3隣接符号化単位が、分割されていない第1隣接符号化単位である、ステップと、前記第3隣接符号化単位が存在する場合、第1係数と目標平均値との積を前記符号化単位に対応する第1閾値として決定するステップであって、前記目標平均値が、各第隣接符号化単位に対応する画素勾配平均値の総和と前記第隣接符号化単位の数との商である、ステップと、を含む。
他の具体的な実現形態では、前記画素勾配情報には、画素勾配平均値がさらに含まれ、閾値決定ユニット731は、前記符号化単位に対応する第1閾値、前記符号化単位に対応する第2閾値、及び前記符号化単位に対応する分散閾値を決定し、前記第2閾値が前記第1閾値よりも大きい。結果決定ユニット732は、前記画素勾配平均値が前記第1閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する。前記結果決定ユニット732は、さらに、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する。前記結果決定ユニット732は、さらに、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定する。前記結果決定ユニット732は、さらに、前記画素勾配平均値が前記第2閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定する。
本願の実施形態では、第1閾値及び第2閾値は、いずれも平均値閾値である。符号化単位に対応する第1閾値がゼロでない場合、符号化単位に対応する第2閾値は、符号化単位に対応する第1閾値の一定の倍数であってもよい。即ち、閾値決定ユニット731は、符号化単位に対応する第2閾値が、符号化単位に対応する第1閾値と第2係数との積であるように決定してもよく、第2係数は1よりも大きい。符号化単位に対応する第1閾値がゼロである場合、閾値決定ユニット731は、符号化単位に対応する第2閾値が、符号化単位に対応する第1閾値と目標平均値閾値との和であるように決定してもよく、目標平均値閾値は、固定閾値である。
さらに、隣接符号化単位は、符号化単位の周囲の、特定の方向及び位置にある符号化単位であってもよい。例えば、隣接符号化単位は、符号化単位の周囲の、左上の位置、真上の位置、右上の位置、及び真左の位置にある隣接符号化単位である。この場合、閾値決定ユニット731は、CU6、CU7、CU10、CU17、CU19がCUの隣接符号化単位であると決定する。
隣接符号化単位を符号化単位と同じサイズの符号化単位に限定し、依然としてCU1が符号化単位である場合を例にすると、閾値決定ユニット731は、CU3、CU4、CU5、CU6を組み合わせた符号化単位、CU7、CU8、CU9、CU10、CU11を組み合わせた符号化単位、CU16、CU17、CU18、CU19を組み合わせた符号化単位、CU20、CU22、CU23、CU24、CU25、CU26、CU27を組み合わせた符号化単位を隣接符号化単位として決定する。
具体的な実現では、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位の画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定する際に、前記閾値決定ユニット731は、具体的に、前記第1隣接符号化単位の中から第2隣接符号化単位を検索し、前記第2隣接符号化単位が存在する場合、第1係数と目標平均値との積を、前記符号化単位に対応する第1閾値として決定し、前記第2隣接符号化単位が存在しない場合、前記符号化単位に対応する第1閾値がゼロであると決定する、ようにしてもよく、前記第2隣接符号化単位のサイズが、前記符号化単位のサイズ以上であり、前記目標平均値が、各第2隣接符号化単位に対応する画素勾配平均値の総和と前記第2隣接符号化単位の数との商である。
図16を参照すると、図16は、本願の実施形態で提供された端末の構成の模式図である。図16に示すように、前記端末80は、少なくとも1つのプロセッサ801(例えば、CPU)と、入出力インタフェース803と、メモリ804と、少なくとも1つの通信バス802と、を含んでもよい。ここで、通信バス802は、これらの構成要素間の接続通信を実現する。ここで、入出力インタフェース803は、標準的な有線インタフェース(例えば、USBインタフェース)、無線インタフェース(例えば、WI−FIインタフェース)を含んでもよい。任意選択的に、入出力インタフェース803は、ユーザインタフェース(例えば、ディスプレイ、キーボード、マウスなど)を含んでもよい。メモリ804は、高速RAMメモリであってもよいし、不揮発性メモリ(non−volatile memory)であってもよく、例えば、少なくとも1つの磁気ディスクメモリであってもよい。任意選択的に、メモリ804は、前記プロセッサ801から離れた少なくとも1つの記憶装置であってもよい。図1に示すように、コンピュータ可読記憶媒体であるメモリ804には、オペレーティングシステム、ネットワーク通信モジュール、ユーザインタフェースモジュール、符号化コスト決定プログラム、及び画像が含まれてもよい。
図1に示す端末80において、入出力インタフェース803は、画像を取得して端末に送信する。任意選択的に、入出力インタフェースは、さらに、プロセッサが処理した画像を出力するために用いられてもよい。プロセッサ801は、画像を分割することにより、符号化単位を取得することができる。さらに、プロセッサ801は、メモリ804に記憶されている符号化コスト決定プログラムを呼び出し、具体的に、
フレーム内予測モードで予測符号化を行う符号化単位を決定するステップと、
前記符号化単位に対応する画素勾配情報を決定するステップであって、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である、ステップと、
前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行うステップと、
前記符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを前記符号化単位の第2符号化コストとして決定するステップであって、前記第2符号化コストが、前記符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである、ステップと、を実行するために用いられてもよい。
一実施形態では、前記プロセッサ801は、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位に対応する画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定するステップを実行する際に、具体的に、
前記第1隣接符号化単位の中から第2隣接符号化単位を検索するステップであって、前記第2隣接符号化単位のサイズが、前記符号化単位のサイズ以上である、ステップと、
前記第2隣接符号化単位が存在する場合、第1係数と目標平均値との積を、前記符号化単位に対応する第1閾値として決定するステップであって、前記目標平均値が、各第2隣接符号化単位に対応する画素勾配平均値の総和と前記第2隣接符号化単位の数との商である、ステップと、
前記第2隣接符号化単位が存在しない場合、前記符号化単位に対応する第1閾値がゼロであると決定するステップと、を実行する。

Claims (15)

  1. サーバが実行する、符号化単位の符号化コストの決定方法であって、
    フレーム内予測モードで予測符号化を行う符号化単位を決定するステップと、
    前記符号化単位に対応する画素勾配情報を決定するステップであって、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である、ステップと、
    前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行うステップと、
    前記符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを前記符号化単位の第2符号化コストとして決定するステップであって、前記第2符号化コストが、前記符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである、ステップと、
    を含むことを特徴とする方法。
  2. 前記符号化単位の分割事前判定の結果が「分割する」である場合、前記符号化単位を少なくとも2つのサブ符号化単位に分割するステップと、
    前記少なくとも2つのサブ符号化単位を、フレーム内予測モードで予測符号化を行う新たな符号化単位として、符号化単位の符号化コストの前記決定方法を実行することにより、前記少なくとも2つのサブ符号化単位の符号化コストをそれぞれ決定するステップと、
    前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コスト以上である場合、前記第1符号化コストを前記符号化単位の第2符号化コストとして決定するステップと、
    前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コストよりも小さい場合、前記少なくとも2つのサブ符号化単位の符号化コストの和を前記符号化単位の第2符号化コストとして決定するステップと、
    をさらに含むことを特徴とする請求項1に記載の方法。
  3. 前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う前記ステップは、
    前記符号化単位に対応する分散閾値を決定するステップと、
    前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定するステップと、
    前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  4. 前記画素勾配情報には、画素勾配平均値がさらに含まれ、前記画素勾配平均値が、符号化単位における少なくとも一部の画素の画像勾配の平均値であり、
    前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う前記ステップは、
    前記符号化単位に対応する第1閾値、前記符号化単位に対応する第2閾値、及び前記符号化単位に対応する分散閾値を決定するステップであって、前記第2閾値が前記第1閾値よりも大きい、ステップと、
    前記画素勾配平均値が前記第1閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定し、又は、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定し、又は、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定し、又は、前記画素勾配平均値が前記第2閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  5. 前記符号化単位に対応する第1閾値を決定する前記ステップは、
    前記符号化単位の複数の隣接符号化単位を決定するステップであって、前記隣接符号化単位のエッジと前記符号化単位のエッジに重なるところがあり、又は前記隣接符号化単位の頂点と前記符号化単位の頂点に重なるところがあるが、前記隣接符号化単位における画像と前記符号化単位における画像とが重ならない、ステップと、
    前記複数の隣接符号化単位のうち、第1隣接符号化単位の数が目標数以上である場合、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位に対応する画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定するステップであって、前記第1隣接符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位である、ステップと、
    前記複数の隣接符号化単位のうち、前記第1隣接符号化単位の数が前記目標数よりも小さい場合、前記符号化単位のサイズに対応する平均値閾値を、符号化単位に対応する第1閾値として決定するステップと、
    を含むことを特徴とする請求項4に記載の方法。
  6. 前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位に対応する画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定する前記ステップは、
    前記第1隣接符号化単位の中から第2隣接符号化単位を検索するステップであって、前記第2隣接符号化単位のサイズが、前記符号化単位のサイズ以上である、ステップと、
    前記第2隣接符号化単位が存在する場合、第1係数と目標平均値との積を、前記符号化単位に対応する第1閾値として決定するステップであって、前記目標平均値が、各第2隣接符号化単位に対応する画素勾配平均値の総和と前記第2隣接符号化単位の数との商である、ステップと、
    前記第2隣接単位が存在しない場合、前記符号化単位に対応する第1閾値がゼロであると決定するステップと、
    を含むことを特徴とする請求項5に記載の方法。
  7. 前記符号化単位に対応する第2閾値は、前記符号化単位に対応する第1閾値と第2係数との積である、
    ことを特徴とする請求項4から6のいずれか一項に記載の方法。
  8. 前記符号化単位に対応する分散閾値と、前記符号化単位に対応する量子化パラメータとの間に正の相関がある、
    ことを特徴とする請求項3又は4に記載の方法。
  9. 符号化単位の符号化コストの決定装置であって、
    フレーム内予測モードで予測符号化を行う符号化単位を決定する符号化単位決定モジュールと、
    前記符号化単位に対応する画素勾配情報を決定し、前記画素勾配情報には、画素勾配分散が含まれ、前記画素勾配分散が、符号化単位における少なくとも一部の画素の画像勾配の分散である、勾配情報決定モジュールと、
    前記画素勾配情報に基づいて、前記符号化単位に対して分割事前判定を行う事前判定モジュールと、
    前記事前判定モジュールによる前記符号化単位の分割事前判定の結果が「分割しない」である場合、第1符号化コストを前記符号化単位の第2符号化コストとして決定し、前記第2符号化コストが、前記符号化単位に対応する符号化ツリー単位の分割ポリシーの決定に用いられ、前記第1符号化コストが、前記符号化単位の現在のサイズを予測単位のサイズとして前記符号化単位を予測符号化することにより取得された符号化コストである、コスト決定モジュールと、
    を含むことを特徴とする装置。
  10. 前記事前判定モジュールによる前記符号化単位の分割事前判定の結果が「分割する」である場合、前記符号化単位を少なくとも2つのサブ符号化単位に分割する分割モジュールをさらに含み、
    前記符号化単位決定モジュールは、さらに、前記少なくとも2つのサブ符号化単位を、フレーム内予測モードで予測符号化を行う新たな符号化単位とし、前記勾配情報決定モジュールは、さらに、前記少なくとも2つのサブ符号化単位に対応する画素勾配情報をそれぞれ決定し、前記事前判定モジュールは、さらに、前記画素勾配情報に基づいて、前記少なくとも2つのサブ符号化単位のそれぞれに対して分割事前判定を行い、前記コスト決定モジュールは、さらに、前記少なくとも2つのサブ符号化単位の符号化コストをそれぞれ決定し、
    前記コスト決定モジュールは、さらに、前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コスト以上である場合、前記第1符号化コストを前記符号化単位の第2符号化コストとして決定し、
    前記コスト決定モジュールは、さらに、前記少なくとも2つのサブ符号化単位の符号化コストの和が前記第1符号化コストよりも大きい場合、前記少なくとも2つのサブ符号化単位の符号化コストの和を前記符号化単位の第2符号化コストとして決定する、
    ことを特徴とする請求項9に記載の装置。
  11. 前記判定モジュールは、
    前記符号化単位に対応する分散閾値を決定する閾値決定ユニットと、
    前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する結果決定ユニットと、を含み、
    前記結果決定ユニットは、さらに、前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定する、
    ことを特徴とする請求項9に記載の装置。
  12. 前記画素勾配情報には、画素勾配平均値がさらに含まれ、前記画素勾配平均値が、符号化単位における少なくとも一部の画素の画像勾配の平均値であり、
    前記事前判定モジュールは、
    前記符号化単位に対応する第1閾値、前記符号化単位に対応する第2閾値、及び前記符号化単位に対応する分散閾値を決定し、前記第2閾値が前記第1閾値よりも大きい、閾値決定ユニットと、
    前記画素勾配平均値が前記第1閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定する結果決定ユニットと、を含み、又は、
    前記結果決定ユニットは、さらに、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値よりも小さい場合、前記符号化単位の分割事前判定の結果が「分割しない」であると決定し、又は、
    前記結果決定ユニットは、さらに、前記画素勾配平均値が前記第1閾値以上であり、かつ前記画素勾配平均値が前記第2閾値よりも小さく、かつ前記画素勾配分散が前記分散閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定し、又は、
    前記結果決定ユニットは、さらに、前記画素勾配平均値が前記第2閾値以上である場合、前記符号化単位の分割事前判定の結果が「分割する」であると決定する、
    ことを特徴とする請求項9に記載の装置。
  13. 前記閾値決定ユニットは、具体的に、
    前記符号化単位の複数の隣接符号化単位を決定し、前記隣接符号化単位のエッジと前記符号化単位のエッジに重なるところがあり、又は前記隣接符号化単位の頂点と前記符号化単位の頂点に重なるところがあるが、前記隣接符号化単位における画像と前記符号化単位における画像とが重ならなく、
    前記複数の隣接符号化単位のうち、第1隣接符号化単位の数が目標数以上である場合、前記第1隣接符号化単位のサイズと、前記第1隣接符号化単位に対応する画素勾配平均値とに基づいて、前記符号化単位に対応する第1閾値を決定し、前記第1隣接符号化単位が、フレーム内予測モードで予測符号化を行う符号化単位であり、
    前記複数の隣接符号化単位のうち、前記第1隣接符号化単位の数が前記目標数よりも小さい場合、前記符号化単位のサイズに対応する平均値閾値を、符号化単位に対応する第1閾値として決定する、
    ことを特徴とする請求項12に記載の装置。
  14. コンピュータ可動記憶媒体であって、複数の命令が記憶され、前記複数の命令は、プロセッサによりロードされて、前記プロセッサに請求項1から8のいずれか一項に記載の方法のステップを実行させるように構成される、ことを特徴とするコンピュータ可読記憶媒体。
  15. 端末であって、プロセッサ及びメモリを備え、前記メモリには、コンピュータプログラムが記憶され、前記コンピュータプログラムは、前記プロセッサによりロードされて、前記プロセッサに請求項1から8のいずれか一項に記載の方法のステップを実行させるように構成される、ことを特徴とする端末。
JP2020547348A 2018-04-02 2019-03-15 符号化単位の符号化コストの決定方法並びにその装置、コンピュータ可読記憶媒体、端末、及びコンピュータプログラム Active JP7080542B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810287548.7A CN110351556B (zh) 2018-04-02 2018-04-02 确定编码单元的编码代价的方法及相关装置
CN201810287548.7 2018-04-02
PCT/CN2019/078300 WO2019192309A1 (zh) 2018-04-02 2019-03-15 确定编码单元的编码代价的方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
JP2021516504A true JP2021516504A (ja) 2021-07-01
JP7080542B2 JP7080542B2 (ja) 2022-06-06

Family

ID=68100114

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020547348A Active JP7080542B2 (ja) 2018-04-02 2019-03-15 符号化単位の符号化コストの決定方法並びにその装置、コンピュータ可読記憶媒体、端末、及びコンピュータプログラム

Country Status (5)

Country Link
US (1) US11070803B2 (ja)
EP (1) EP3780611A4 (ja)
JP (1) JP7080542B2 (ja)
CN (1) CN110351556B (ja)
WO (1) WO2019192309A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112702603A (zh) 2019-10-22 2021-04-23 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机设备和存储介质
CN110708551A (zh) * 2019-10-22 2020-01-17 腾讯科技(深圳)有限公司 视频编码方法、装置、计算机可读存储介质和计算机设备
CN111372079B (zh) * 2020-03-11 2021-01-22 南华大学 一种vvc帧间cu深度快速划分方法
CN111294591B (zh) * 2020-05-09 2020-09-25 腾讯科技(深圳)有限公司 视频信息处理方法、多媒体信息处理方法、装置
CN111770340B (zh) * 2020-07-23 2022-03-15 腾讯科技(深圳)有限公司 视频编码方法、装置、设备以及存储介质
CN112437310B (zh) * 2020-12-18 2022-07-08 重庆邮电大学 一种基于随机森林的vvc帧内编码快速cu划分决策方法
US11490090B2 (en) * 2020-12-30 2022-11-01 Ati Technologies Ulc Text and line detection in video encode by using co-sited gradient and variance values
CN112929657B (zh) * 2021-01-22 2022-09-27 郑州轻工业大学 基于梯度与方差的h.266/vvc快速cu划分决策方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140140395A1 (en) * 2012-11-19 2014-05-22 Texas Instruments Incorporated Adaptive Coding Unit (CU) Partitioning Based on Image Statistics
JP2015027022A (ja) * 2013-07-29 2015-02-05 Kddi株式会社 動画像符号化装置、動画像符号化方法、およびプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2557795A4 (en) * 2010-04-06 2015-07-08 Samsung Electronics Co Ltd METHOD AND APPARATUS FOR ENCODING A VIDEO AND METHOD AND APPARATUS FOR DECODING A VIDEO
US10154257B2 (en) * 2012-04-13 2018-12-11 Sun Patent Trust Image coding method in which offset is applied when an image is coded, and image decoding method in which offset is applied when an image is decoded
US20150350671A1 (en) * 2013-01-04 2015-12-03 Samsung Electronics Co., Ltd. Motion compensation method and device for encoding and decoding scalable video
KR102169610B1 (ko) * 2013-08-21 2020-10-23 삼성전자주식회사 인트라 예측 모드 결정 방법 및 장치
CN104539949B (zh) * 2014-12-12 2018-02-06 北方工业大学 Hevc屏幕编码中基于边缘方向的快速分块的方法及装置
CN104883566B (zh) * 2015-05-27 2018-06-12 复旦大学 一种适用于hevc标准的帧内预测块大小划分的快速算法
US10171819B2 (en) * 2015-08-03 2019-01-01 Arris Enterprises Llc Intra prediction mode selection in video coding
CN105391999B (zh) * 2015-10-30 2018-08-17 北京奇艺世纪科技有限公司 一种编码模式判断方法和装置
CN107071418B (zh) * 2017-05-05 2020-03-17 上海应用技术大学 一种基于决策树的hevc帧内编码单元快速划分方法
CN107105297B (zh) * 2017-05-19 2019-08-30 华侨大学 一种针对3d-hevc深度图帧内预测编码的快速优化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140140395A1 (en) * 2012-11-19 2014-05-22 Texas Instruments Incorporated Adaptive Coding Unit (CU) Partitioning Based on Image Statistics
JP2015027022A (ja) * 2013-07-29 2015-02-05 Kddi株式会社 動画像符号化装置、動画像符号化方法、およびプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BAI, CAIXIA AND YUAN, CHUN: "Fast coding tree unit decision for HEVC intra coding", 2013 IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS - CHINA, JPN6021039924, 31 March 2014 (2014-03-31), pages 1 - 4, ISSN: 0004617092 *
LOKKOJU, SATISH AND REDDY, DINESH: "Fast coding unit partition search", 2012 IEEE INTERNATIONAL SYMPOSIUM ON SIGNAL PROCESSING AND INFORMATION TECHNOLOGY (ISSPIT), JPN6021039921, 8 October 2013 (2013-10-08), pages 000315 - 000319, ISSN: 0004617090 *
ZHANG, YONGFEI ET AL.: "Gradient-based fast decision for intra prediction in HEVC", 2012 VISUAL COMMUNICATIONS AND IMAGE PROCESSING, JPN6021039914, 17 January 2013 (2013-01-17), pages 1 - 6, ISSN: 0004617091 *

Also Published As

Publication number Publication date
CN110351556B (zh) 2021-03-02
EP3780611A4 (en) 2021-06-02
US20200382778A1 (en) 2020-12-03
WO2019192309A1 (zh) 2019-10-10
CN110351556A (zh) 2019-10-18
US11070803B2 (en) 2021-07-20
JP7080542B2 (ja) 2022-06-06
EP3780611A1 (en) 2021-02-17

Similar Documents

Publication Publication Date Title
JP7080542B2 (ja) 符号化単位の符号化コストの決定方法並びにその装置、コンピュータ可読記憶媒体、端末、及びコンピュータプログラム
JP6568242B2 (ja) 参照ピクチャリスト管理方法及びその方法を使用する装置
JP6276336B2 (ja) 映像復号化方法及び映像復号化装置
EP3253060B1 (en) Image coding apparatus, method for coding image, program therefor, image decoding apparatus, method for decoding image, and program therefor
JP5616984B2 (ja) 画像復号化装置
KR102214937B1 (ko) 디블로킹 필터 방법 및 장치
JP6953067B2 (ja) 符号化単位分割決定方法及び装置、コンピューティングデバイス及び読み取り可能な記憶媒体
IL281625B1 (en) A method for encoding/decoding image signals and a device therefor
KR20220016266A (ko) 글로벌 모션 벡터에 기초한 병합 후보 재정렬기
BR112021014671A2 (pt) Transformada discreta de cosseno de formato adaptativo para particionamento geométrico com um número adaptativo de regiões
BR112021014667A2 (pt) Interprevisão em particionamento exponencial
JP7481332B2 (ja) デコードのための予測方法及びその装置、並びにコンピュータ記憶媒体
Park CU encoding depth prediction, early CU splitting termination and fast mode decision for fast HEVC intra-coding
BR112021014788A2 (pt) Interpredição em divisão geométrica com um número adaptativo de regiões
JP6191609B2 (ja) 映像符号化装置、映像符号化方法および映像符号化プログラム
BR112021006138A2 (pt) método de predição de componente de imagem aplicado a um decodificador, dispositivo de predição de componente de vídeo, aplicado a um decodificador, e mídia de armazenamento legível por computador
JP2017126829A (ja) 動画像符号化装置、動画像符号化方法、及びプログラム
CN109905713B (zh) 针对hevc的编码加速方法、相关装置和设备
KR20220024020A (ko) 모션 보상 처리 방법, 인코더, 디코더 및 저장 매체
JP2017050744A (ja) 画像符号化装置、画像符号化方法、及びプログラム
RU2781240C1 (ru) Способ и устройство предсказания для декодирования и компьютерный носитель данных

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200910

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211006

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220113

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220519

R150 Certificate of patent or registration of utility model

Ref document number: 7080542

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150