JP6914722B2 - 動画像符号化装置、動画像符号化方法及びプログラム - Google Patents

動画像符号化装置、動画像符号化方法及びプログラム Download PDF

Info

Publication number
JP6914722B2
JP6914722B2 JP2017094784A JP2017094784A JP6914722B2 JP 6914722 B2 JP6914722 B2 JP 6914722B2 JP 2017094784 A JP2017094784 A JP 2017094784A JP 2017094784 A JP2017094784 A JP 2017094784A JP 6914722 B2 JP6914722 B2 JP 6914722B2
Authority
JP
Japan
Prior art keywords
block
size
prediction
coding
feature amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017094784A
Other languages
English (en)
Other versions
JP2018191246A (ja
Inventor
木村 真琴
真琴 木村
藤野 玲子
玲子 藤野
内藤 聡
聡 内藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2017094784A priority Critical patent/JP6914722B2/ja
Priority to US15/973,138 priority patent/US10595038B2/en
Publication of JP2018191246A publication Critical patent/JP2018191246A/ja
Application granted granted Critical
Publication of JP6914722B2 publication Critical patent/JP6914722B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動画像符号化装置、動画像符号化方法及びプログラムに関する。
従来、動画像符号化方法の国際標準としてH.264やHEVC(High Efficiency Video Coding)が存在する。これらの動画符号化技術では、動画像を構成する画像(フレーム)は所定のサイズのブロックに分割され、このブロック単位で符号化処理が行われる。
H.264では画像はMB(Macro Block)と呼ばれるブロックに分割され、MB単位でインター予測、イントラ予測を選択することが可能であった。一方、HEVCでは画像はCTU(Coding Tree Unit)と呼ばれる最大符号化ブロック単位に分割され、CTUはさらにCU(Coding Unit)と呼ばれる符号化ブロックに階層的に分割される。CTUのブロックサイズは、64×64、32×32、16×16ブロックの中から選択可能である。また、CUは64×64、32×32、16×16、8×8ブロックをCTU内で任意に組み合わせて選択可能となっている。このため、HEVCでは従来のH.264等よりも豊富なブロック分割を適用することができ、かつより細かい単位(CU単位)でインター予測、イントラ予測を選択することが可能となっている。
HEVCにおいて、適切なブロック分割と予測方式を決定するためには、取り得る複数のブロックサイズについて、イントラ予測した場合とインター予測した場合との符号化コストを各々算出する必要があり、演算量の増加が問題であった。これに対し、特許文献1には、インター予測で決定したブロックサイズをもとに、イントラ予測で符号化コストを算出するブロックサイズを制限する技術が開示されている。これにより、イントラ・インター判定に必要なイントラ予測の符号化コスト演算量を削減することができる。
特開2007−184846号公報
しかしながら、一般的にイントラフレームでは画素値の変動が小さい平坦な領域は大きいブロックサイズのイントラ予測を使う方が効率的である。一方、画素の変動が大きい領域は小さいブロックサイズのイントラ予測を使う方が効率的であるといえる。対してインターフレームでは、画素値の変動が大きい領域であっても、動き探索で類似領域が見つかれば予測残差が小さくなるので、大きいブロックサイズのインター予測が効率的なこともある。このようにイントラ、インターの各々の予測に適した(符号化効率の良い)ブロックサイズは、画像特性に応じて変化する。すなわちインター予測の観点では大きいブロックサイズを用いた符号化が効率的であるが、小さいブロックサイズのイントラ予測を用いた符号化の方がより効率的である場合が存在する。
これに対し、特許文献1の技術においては、インター予測において大きいブロックサイズが選択されると、より小さいブロックサイズのイントラ予測は選択されないことになる。このため、結果として符号化効率が向上しない場合があるという問題があった。
本発明はこのような問題点に鑑みなされたもので、演算量の増加を抑えつつ、動画像符号化における符号化効率を向上させることを目的とする。
そこで、本発明は、動画像を構成するフレームを予め定められたブロック単位に分割し、インター予測による符号化又はイントラ予測による符号化を選択的に行う動画像符号化装置であって、前記動画像を構成するフレームの処理対象となる対象フレームに含まれる前記ブロック単位よりも小さい基準サイズのブロックと、前記対象フレームと異なる参照フレームにおける当該基準サイズに対応するサイズのブロックと、の差分を示す特徴量を導出する特徴量導出手段と、前記基準サイズのブロックについて前記特徴量導出手段により導出された特徴量が閾値よりも大きい場合に、前記基準サイズを前記インター予測のブロックサイズとして決定し、前記基準サイズ以下のサイズを前記イントラ予測のブロックサイズとして決定する決定手段と、前記決定手段により決定されたブロックサイズのブロックに対する予測方法として、前記インター予測及び前記イントラ予測のうち符号化コストが小さい方を選択する選択手段とを有することを特徴とする。
本発明によれば、演算量の増加を抑えつつ、動画像符号化における符号化効率を向上させることができる。
動画像符号化装置を示す図である。 予測処理部の機能構成図である。 8×8SADの一例を示す図である。 SAD算出処理の説明図である。 サイズ決定処理を示すフローチャートである。 サイズ決定処理の説明図である。 S502の処理を示すフローチャートである。 S503の処理を示すフローチャートである。 S504の処理を示すフローチャートである。 分割判定処理の説明図である。 分割判定処理のタイミングチャートを示す図である。 分割判定処理のタイミングチャートを示す図である。 分割判定処理のタイミングチャートを示す図である。 第2の実施形態に係る予測処理部の機能構成図である。 制御フラグ設定処理を示すフローチャートである。 MVヒストグラムの一例を示す図である。 S502の処理を示すフローチャートである。 動画符号化装置のハードウェア構成図である。
以下、本発明の実施形態について図面に基づいて説明する。
(第1の実施形態)
図1は、第1の実施形態に係る動画像符号化装置を示す図である。本実施形態の動画像符号化装置は、動画像を構成するフレームを、予め定められたブロック単位で分割し、ブロック単位でインター予測符号化又はイントラ予測符号化を選択的に行う。動画像符号化装置100は、全体制御部101と、直交変換部102と、量子化部103と、エントロピー符号化部104と、を有している。動画像符号化装置100はさらに、逆量子化部105と、逆直交変換部106と、フィルタ部107と、インター予測部108と、イントラ予測部109と、判定部110と、加算器111と、を有している。
動画像符号化装置100に入力された入力画像(入力フレーム)は、インター予測部108とイントラ予測部109に入力される。インター予測部108は、入力画像に対して参照画像(参照フレーム)を用いたインター予測処理を行い、その予測結果(予測残差、動きベクトル情報、ブロックサイズ、符号化コスト等)を判定部110に出力する。イントラ予測部109は、入力画像(入力フレーム)に対してイントラ予測処理を行い、その予測結果(予測残差、予測モード、ブロックサイズ、符号化コスト等)を判定部110に出力する。
判定部110は、インター予測の符号化コストとイントラ予測の符号化コストとを比較し、符号化コストの小さい方の予測方法を選択する。そして、判定部110は、選択した予測方法における予測残差とブロックサイズの情報を直交変換部102へと出力する。なお、判定部110は、所定の評価により、インター予測とイントラ予測の何れか一方を選択すればよく、そのための具体的な処理は実施形態に限定されるものではない。判定部110はさらに、インター予測を選択した場合は動きベクトル情報をエントロピー符号化部104へ、インター予測画像を加算器111へと出力する。判定部110は、イントラ予測を選択した場合は、予測モード情報をエントロピー符号化部104へ、イントラ予測画像を加算器111へと出力する。直交変換部102は予測残差に対して直交変換を行い、変換係数を量子化部103に出力する。
量子化部103は、変換係数を量子化し、変換量子化係数をエントロピー符号化部104に出力する。エントロピー符号化部104は、判定部110から入力される予測モード、動きベクトル、変換量子化係数を各々符号化し、符号化ストリームとして出力する。さらに変換量子化係数は逆量子化部105で逆量子化、逆直交変換部106で逆直交変換を施されることで予測残差として復元される。復元された予測残差は加算器111に入力される。加算器111は復元された予測残差と予測処理部112からの予測画像とを加算することで再構成画像を生成し、フィルタ部107とイントラ予測部109に出力する。フィルタ部107は、加算器111からの再構成画像にフィルタ処理を行い、インター予測に用いる再構成画像として出力し、不図示の記憶部に記憶する。なお、各部の制御は全体制御部101からの制御信号(不図示)を通して行う。
図2は、予測処理部112の機能構成図である。図2を参照しつつ予測処理部112の基本動作を説明する。なお、本実施形態においては、HEVCにおいて64×64CTUとする例について説明する。すなわち、ここで、64×64CTUは、予め定められたブロック単位の一例である。インター予測部108は、インター予測制御部201と、SAD(Sum of Absolute Difference)算出部202と、SAD記憶部203と、インター符号化コスト算出部204と、サイズ決定部205と、を有している。イントラ予測部109は、イントラ符号化コスト算出部206を含む。SADとは、符号化対象ブロックと参照画像内の同じ形状のブロックとの画素毎の差分値の絶対値の総和を取った値である。8×8SADと表記した場合、符号化対象の8×8ブロックと参照画像中の8×8ブロックとの画素間差分の絶対値の総和を表す。SADはSAD算出部202で動き探索を行うことで算出される。
SAD算出部202は、符号化対象画像の各8×8ブロックについて動き探索を行い、参照画像中の複数の8×8領域とのSAD(8×8SAD)を算出する。図3は、SAD算出部202で算出される8×8SADの一例を示す図である。図3に示すように、SAD算出部202は、符号化対象画像(64×64CTU)300に含まれる8×8ブロック301について、参照画像310に含まれる8×8ブロックAから8×8ブロックIまでの各ブロックとのSADを算出する。さらに、SAD算出部202は、8×8ブロック302については、参照画像310に含まれる8×8ブロックDからブロックLまでの各ブロックとのSADを算出する。なお、図3において、太線で示される参照画像310内の8×8ブロックE、Hが各々符号化対象画像300内の8×8ブロック301、302と同一位置に該当するブロックを表している。本実施形態においては、SAD算出部202は、9点の8×8SADを算出し、各8×8SADをSAD記憶部203に記録する。
なお、算出対象のブロック数(点の数)は実施形態に限定されるものではない。SAD算出部202は、任意のN点(N:1以上の整数)の動き探索を実施し、その各8×8SADをSAD記憶部203へと出力すればよい。また、8×8ブロックは、基準サイズのブロックの一例である。なお、基準サイズは、ブロック単位よりも小さいサイズで、予め定められたサイズであればよく、実施形態に限定されるものではない。また、SADは、ブロックの特徴量の一例であり、また処理対象のフレームと参照フレームの差分に関する指標値の一例でもある。SAD算出部202の処理は、基準サイズのブロックの特徴量を導出する特徴量導出処理の一例である。
図2に戻り、SAD記憶部203は、SAD算出部202にて算出された複数の8×8SADを保持し、インター符号化コスト算出部204からの要求に応じてこれを出力する。インター符号化コスト算出部204は、SAD記憶部203に保持されている8×8SADと対応する動きベクトルの符号量とを用いて、ブロックサイズ毎の符号化コストを算出する。符号化コストは、動きベクトルの推定符号量と重み付け係数の乗算結果とSADの加算結果に基づき算出するが、これに限定されるものではない。また、本実施例ではインター符号化コスト算出部204は、基準となる小さいブロックサイズ(8×8)から大きいブロックサイズ(64×64)の順に符号化コストを算出していくものとするが、これに限定されるものではない。インター符号化コスト算出部204では、8×8SADを用いてより大きいサイズのSADを算出する。
図4は、SAD算出処理の説明図である。図4に示すように、インター符号化コスト算出部204は、動きベクトルが等しい4つの8×8ブロックのSAD(8×8SAD_A〜8×8SAD_D)を加算することで、16×16SADを算出する。また、インター符号化コスト算出部204は、動きベクトルが等しい2つの8×8ブロックのSAD(8×8SAD_Aと8×8SAD_B)を加算することで8×16SADを算出する。また、インター符号化コスト算出部204は、動きベクトルが等しい2つの8×8ブロックのSAD(8×8SAD_Aと8×8SAD_C)を加算することで16×8SADを算出する。
このように、インター符号化コスト算出部204は、動きベクトルが等しい複数の8×8ブロックのSAD(SAD1)を加算することで、より大きい8m×8n(m、nは1以上の整数)のブロックのSAD(SAD2)を算出する。すなわち、インター符号化コスト算出部204は、SAD記憶部203に保持されたN点の動き探索結果(8×8SAD)を用いて、8m×8nのブロックに対するN点の探索結果(SAD)を算出する。これにより、動画像符号化装置100は、8×8以外のブロックに対する動き探索を実施しないことになるので、その分の演算量を削減することが可能となる。本処理は、基準サイズのブロック(8×8ブロック)の特徴量(SAD)に基づいて、導出対象のブロックの特徴量(SAD)を算出する処理であり、特徴量導出処理の一例である。
インター符号化コスト算出部204は、算出したSADと、対応する動きベクトル符号量とを用いて、ブロックサイズ毎にN個の符号化コストを算出する。そして、インター符号化コスト算出部204は、各ブロックサイズについて、最小の符号化コストと、対応する動きベクトル及びSADを含む情報をサイズ決定部205へと出力する。サイズ決定部205は、インター符号化コスト算出部204が出力するブロックサイズ毎の最小の符号化コストと対応する動きベクトル及びSAD情報を用いて、64×64CTUのブロックサイズ(ブロック分割方法)を決定する。
図5は、サイズ決定部205によるサイズ決定処理を示すフローチャートである。図6は、サイズ決定処理の説明図である。S501において、サイズ決定部205は、処理に用いる変数の初期化を行う。具体的には、サイズ決定部205は、flag32×32[i](i=0、1、2、3)及びflag32×32の値を0にする。次に、S502において、サイズ決定部205は、16×16ブロックの分割判定処理を行う。次に、S503において、サイズ決定部205は、32×32ブロックの分割判定処理を行う。次に、S504において、サイズ決定部205は、64×64ブロックの分割判定処理を行う。次に、S505において、サイズ決定部205は、これらの結果に応じて、インター予測のブロックサイズ(PUサイズ)と符号化ブロックサイズ(CUサイズ)を決定する。以下、S502〜S504の処理について詳述する。
図7は、S502における詳細な処理を示すフローチャートである。S701において、サイズ決定部205は、iに0を設定し、図6(a)に示す16×16ブロック0を処理対象として選択する。そして、サイズ決定部205は、処理対象の16×16ブロック0に含まれる4つの8×8ブロックについて、各々符号化コストが最小となる8×8SADをインター符号化コスト算出部204から取得する。次に、S702において、サイズ決定部205は、S701において取得した各8×8SADと閾値Tとを比較する。ここで、閾値Tは、動画像符号化装置100において予め設定されているものとする。サイズ決定部205は、1以上の8×8SADが閾値Tよりも大きい場合には(S702でYes)、処理をS703へ進める。サイズ決定部205は、1以上の8×8SADが閾値T以下の場合には(S702でNo)、処理をS705へ進める。一般的に、SADが大きいほど符号化効率が低下することとなる。
S703において、サイズ決定部205は、他のブロックサイズ(16×8、16×8、16×16)のブロックの符号化コストに関わらず、8×8ブロックサイズを選択する。次に、S704において、サイズ決定部205は、flag32×32[i>>2]に1を設定する。ここでi>>2は変数iを右に2ビットシフトする演算(変数iを4で割り、余りを切り捨てる演算)を表す。サイズ決定部205は、S704の処理の後、処理をS706へ進める。なお、S702及びS703の処理は、8×8SADが閾値Tよりも大きいという予め設定された第1の条件に合致する場合に、基準サイズである8×8ブロックサイズをインター予測のブロックサイズとして決定する決定処理の一例である。
一方、S705において、サイズ決定部205は、16×16ブロックの各分割ブロックサイズ(8×8、8×16、16×8ブロック)の符号化コストと、分割しない16×16ブロックの符号化コストとを求める。本処理は、符号化コストを特定(導出)する符号化コスト特定処理(符号化コスト導出処理)の一例である。そして、サイズ決定部205は、これらのブロックサイズの中から、符号化コストが最小となるブロックサイズを選択する。サイズ決定部205は、S705の処理の後、処理をS706へ進める。S706において、サイズ決定部205は、図6(a)に示す16個の16×16ブロック(16×16ブロック0〜16×16ブロック15)のすべてについて処理が終了したか否かを判定する。サイズ決定部205は、未処理の16×16ブロックブロックが残っている場合には(S706でNo)、処理をS707へ進める。S707において、サイズ決定部205は、変数iをインクリメントし、その後処理をS702へ進める。サイズ決定部205は、すべてのブロックに対する処理が終了すると(S706でYes)、S502の処理を終了する。
図8は、S503における詳細な処理を示すフローチャートである。S801において、サイズ決定部205は、iに0を設定し、図6(b)に示す32×32ブロック0を処理対象として選択する。次に、S802において、サイズ決定部205は、処理対象の32×32ブロックiのflag32×32[i]の値を確認する。サイズ決定部205は、flag32×32[i]が1の場合には(S802でYes)、処理をS803へ進める。サイズ決定部205は、flag32×32[i]が0の場合には(S802でYes)、処理をS803へ進める。S803において、サイズ決定部205は、他のブロックサイズ(16×32、32×16、32×32)のブロックの符号化コストに関わらず、S502の処理で選択されたブロックサイズを選択する。すなわち、閾値Tを超える8×8SADが含まれる16×16ブロックについては8×8ブロックサイズが選択される。次に、S804において、サイズ決定部205は、flag64×64に1を設定し、その後処理をS806へ進める。
一方、S805において、サイズ決定部205は、S502の処理で選択されたブロックサイズの符号化コストと、16×32、32×16ブロックの符号化コストと、分割しない32×32ブロックの符号化コストと、を求める。そして、サイズ決定部205は、これらのブロックサイズの中から、符号化コストが最小となるブロックサイズを選択する。サイズ決定部205は、S805の処理の後、処理をS806へ進める。S806において、サイズ決定部205は、図9(b)に示す4個の32×32ブロック(32×32ブロック0〜32×32ブロック3)のすべてについて処理が終了したか否かを判定する。サイズ決定部205は、未処理の32×32ブロックが残っている場合には(S806でNo)、処理をS807へ進める。S807において、サイズ決定部205は、変数iをインクリメントし、その後処理をS802へ進める。サイズ決定部205は、すべてのブロックに対する処理が終了すると(S806でYes)、S503の処理を終了する。
図9は、S504における詳細な処理を示すフローチャートである。S901において、サイズ決定部205は、図6(c)に示す64×64ブロックを処理対象として選択する。そして、サイズ決定部205は、64×64ブロックのflag64×64の値を確認する。サイズ決定部205は、flag64×64が1の場合には(S901でYes)、処理をS902へ進める。サイズ決定部205は、flag64×64が0の場合には(S901でNo)、処理をS903へ進める。S902において、サイズ決定部205は、他のブロックサイズ(32×64、64×32、64×64)の符号化コストに関わらず、S502及びS503の処理で選択されたブロックサイズを選択する。すなわち、閾値Tを超える8×8SADが含まれる16×16ブロックについては8×8ブロックサイズが選択される。以上で、S504の処理が終了する。一方、S903において、サイズ決定部205は、S502及びS503の処理で選択されたブロックサイズの符号化コスト、32×64、64×32ブロックの符号化コストと、分割しない64×64ブロックの符号化コストと、を求める。そして、サイズ決定部205は、これらのブロックサイズの中から、符号化コストが最小となるブロックサイズをインター予測のブロックサイズとして選択する。以上で、S504の処理が終了する。なお、S705、S805、S903の処理は、ブロック単位以下(64×64CTU以下)の、異なる複数のサイズのブロックそれぞれの符号化コストに基づいて、複数のサイズの中から、インター予測のブロックサイズを決定する決定処理の一例である。
図10は、分割判定処理(S502、S503、S504)の説明図である。図10(a)〜(c)において、灰色で示した8×8ブロックは、SADが閾値を超えているブロックである。図10(a)に示すように、左上の16×16ブロックにSADが閾値を超える8×8ブロックが含まれるとする。この場合、S502の処理において、左上の16×16ブロックに対しては、8×8ブロック分割が選択される。その他の16×16ブロックについては、符号化コストが最も小さくなるブロックサイズが選択される。
さらに、S503の処理においては、左上の32×32ブロックにSADが閾値を超える8×8ブロックが含まれることから、図10(b)に示すように、このブロックに対して16×16ブロックまでの分割結果がそのまま選択される。その他の32×32ブロックについては、符号化コストが最も小さくなるブロックサイズが選択される。さらに、S504の処理においては、図10(c)に示すように、32×32ブロックまでの分割判定結果がそのまま64×64ブロック内のPUサイズ(予測ブロックサイズ)として選択される。64×64ブロック内に既にSADが閾値を超える8×8ブロックが含まれているためである。なお、図10(d)は、図10(c)のPU分割に対応したCU分割を示している。
サイズ決定部205は、以上の処理により決定したインター予測のブロックサイズ情報と対応する符号化コストを判定部110へ出力する。サイズ決定部205はさらに、インター予測のブロックサイズ情報をイントラ予測部109のイントラ符号化コスト算出部206へ出力する。
図11A〜図11Cは、インター符号化コスト算出部204およびサイズ決定部205における16×16、32×32、64×64ブロックに対する分割判定処理(S502、S503、S504)のタイミングチャートを示す図である。まず、図11Aを参照しつつ、16×16ブロックの分割判定のタイミングチャートについて説明する。インター符号化コスト算出部204は、16×16ブロック0に対応する4つの8×8ブロックのSAD情報をSAD記憶部203から読み出す(t0からt1)。本実施形態の動画像符号化装置100においては、前述の通り、8×8ブロック1つにつき、9個のSADが算出されており、図中の8×8SAD0は9個の8×8SADを表す。
次に、インター符号化コスト算出部204は、分割しない場合(16×16)の符号化コスト、分割する場合(8×16、16×8、8×8)の各々について、符号化コストが最小となる動きベクトルとSAD値を算出する(t1からt2)。各ブロックサイズの最小符号化コストはサイズ決定部205に出力される。サイズ決定部205は、8×8ブロックのSADを閾値Tと比較する。サイズ決定部205は、SADが閾値Tよりも大きい場合は、16×16ブロック0に対して、8×8ブロック分割を選択する。サイズ決定部205は、SADが閾値T以下の場合は4つの分割方法(8×16、16×8、8×8、16×16)のうち符号化コストが最も小さくなるブロック分割を選択する(t2からt3)。t0からt1の処理が図7に示すS702〜S705の処理に対応する。動画像符号化装置100は、同様の処理を16×16ブロック1(t3〜t4)から16×16ブロック15(t5〜t6)まで繰り返し行う。
次に、図11Bを参照しつつ、32×32ブロックの分割判定のタイミングチャートについて説明する。インター符号化コスト算出部204は、32×32ブロック0に対応する16個の8×8ブロックのSAD情報をSAD記憶部203から読み出す(t7からt8)。次に、インター符号化コスト算出部204は、分割しない場合(32×32)の符号化コスト、分割する場合(32×16、16×32)の各々について、最も符号化コストが小さくなる動きベクトルと、その時のSAD値を算出する(t8からt9)。
サイズ決定部205は、32×32ブロック内に閾値よりも大きい8×8SADのブロックが存在する場合は、t6までの分割結果(16×16ブロックの分割結果)をそのまま選択する。サイズ決定部205は、閾値よりも大きい8×8SADのブロックが存在しない場合は、4つの分割方法(t6までの分割結果、32×16、16×32、32×32)のうち、符号化コストが最小となるブロック分割方法を選択する(t9からt10)。t7からt10の処理が図8のS802〜からS805の処理に対応する。動画像符号化装置100は、同様の処理を32×32ブロック1から32×32ブロック3(t10〜t12)まで繰り返し行う。
次に、図11Cを参照しつつ、64×64ブロックの分割判定のタイミングチャートについて説明する。インター符号化コスト算出部204は、64個の8×8ブロックのSAD情報をSAD記憶部203から読み出す(t13からt14)。インター符号化コスト算出部204は、分割しない場合(64×64)、分割する場合(64×32、32×64)の各々について、最も符号化コストが小さくなる動きベクトルと、その時のSAD値を算出する(t14からt15)。
サイズ決定部205は、64×64ブロック内に閾値よりも大きい8×8SADのブロックが存在する場合は、t13までの分割結果(32×32ブロックまでの分割結果)をそのまま選択する。サイズ決定部205は、閾値よりも大きい8×8SADのブロックが存在しない場合は、4つの分割方法(t13までの分割結果、64×32、32×64、64×64)のうち、符号化コストが最小となるブロック分割方法を選択する(t15からt16)。t13からt16の処理が図9の処理に対応する。
図2に戻り、イントラ予測部109について説明する。インター予測部108が出力するインターブロックサイズ情報は、イントラ予測部109内のイントラ符号化コスト算出部206に入力される。イントラ符号化コスト算出部206は、インターブロックサイズ情報に基づきイントラ予測のブロックサイズを決定する。例えば、図10(d)に示すようなインターブロックサイズが決定された場合には、同一のサイズがイントラ予測のブロックサイズ(イントラブロックサイズ)として決定される。すなわち、イントラ符号化コスト算出部206は、インターブロックサイズをイントラブロックサイズとして決定する。イントラ符号化コスト算出部206は、決定したイントラブロックサイズについて予測モードの探索を行い、最も符号化コストが小さくなる予測モードを選択する。
なお、他の例としては、イントラ符号化コスト算出部206は、インターブロックサイズ以下のサイズをイントラブロックサイズとして決定してもよい。イントラ予測では4×4PUが利用可能である。そこで、インター予測において8×8CUが選択された場合は、イントラ符号化コスト算出部206は、8×8CU以下のサイズである4×4PUに対しても予測モード探索を行う。そして、イントラ符号化コスト算出部206は、インターブロックサイズ以下のサイズのうち、符号化コストが最小となるサイズをイントラブロックサイズとして決定すればよい。イントラ符号化コスト算出部206は、インターブロックサイズ情報に従いイントラ予測のブロックサイズを決定するので、イントラ予測のブロックサイズの決定に要する演算量を削減することができる。
以上のように、第1の実施形態に係る動画像符号化装置100は、インター予測部108において決定されたブロックサイズに基づきイントラ予測のブロックサイズを決定する。これにより、イントラブロックサイズ決定に要する演算量を削減することができる。さらに、動画像符号化装置100は、インター予測において8×8SADが閾値Tを超える場合は、符号化コストに関わりなく8×8ブロックをインター予測のブロックとして選択する。これにより、動画像符号化装置100は、イントラ予測においても8×8ブロックを選択することが可能となる。
これにより、インター予測のブロックサイズに基づいてイントラ予測のブロックサイズを決定する場合において、演算量の増加を抑えつつ、動画像符号化における符号化効率を向上させることができる。特に、インター予測の観点では大きいブロックサイズを用いた符号化が効率的であるが、小さいブロックサイズのイントラ予測を用いた符号化の方がより効率的となる画像において、符号化効率が向上することとなる。
第1の実施形態の第1の変形例としては、8×8ブロックをインター予測のブロックサイズとして選択するか否かを判定する際の判定基準となるパラメータはSADに限定されるものではない。動画像符号化装置100は、8×8ブロックの任意の特徴量(例えば入力画像のアクティビティなど)を閾値と比較すればよい。任意の特徴量としては、例えばアクティビティ等入力画像内(処理対象のフレーム内)の画素の分布に関する指標値が挙げられる。このように、特徴量は、インター予測を用いた際の符号化効率に影響がある特徴量であればよい。
第2の変形例としては、8×8SADが閾値より大きい場合に選択されるブロックサイズは、予め設定された、CTUに比べて小さいサイズであればよく、8×8ブロックサイズに限定されるものではない。また、他の例としては、動画像符号化装置100は、8×8SADが閾値以下の場合に8×8ブロックサイズを選択してもよく、他のブロックサイズを選択してもよい。また、動画像符号化装置100は、8×8以外のサイズのSADを判定基準として用いることとし、8×8以外のサイズのSADと閾値とを比較することとしてもよい。判定基準となるサイズはCTUに比べて小さいサイズであればよく、実施形態に限定されるものではない。閾値より小さい場合に8×8ブロックサイズを選択するようにもできるし、他のブロックサイズを選択するように制御してもよい。
(第2の実施形態)
次に、第2の実施形態に係る動画像符号化装置100について、第1の実施形態に係る動画像符号化装置100と異なる点を説明する。第2の実施形態に係る動画像符号化装置100は、制御信号に基づいて8×8SADと閾値との比較処理を適応的に実行し、さらに符号化パラメータに応じて、8×8SADに対する閾値を適応的に選択する。
図12は、第2の実施形態に係る動画像符号化装置100の予測処理部112の機能構成図である。第2の実施形態においては、全体制御部101は、直前のフレームの符号化結果に基づき、フレーム単位での比較処理の制御フラグ(フレーム単位制御情報)を設定する。また、第2の実施形態においては、インター予測制御部1201は、フレーム単位制御フラグの値に基づき、CTU単位制御フラグの設定を行う。本実施形態のインター予測制御部1201は、制御フラグが1に設定されている場合はCTU単位制御フラグを1に、それ以外の場合は0に設定するものとする。
図13は、全体制御部101による制御フラグ設定処理を示すフローチャートである。ここで、フレーム単位制御フラグは、図5を参照しつつ説明した16×16ブロックの分割判定処理(S502)において参照される。S1301において、全体制御部101は、フレーム単位制御フラグを0に初期化する。次に、S1302において、全体制御部101は、1フレームの符号化を行うよう制御する。全体制御部101は、符号化の対象がPフレームの場合には、1フレーム分の動きベクトルヒストグラム(以下、MVヒストグラムと称する)を作成する。ヒストグラムについては後述する。次に、S1303において、全体制御部101は、処理対象の動画像に含まれるすべてのフレームを符号化したか否かを確認する。全体制御部101は、すべてのフレームの符号化が終了した場合には(S1303でYes)、制御フラグ設定処理を終了する。全体制御部101は、未処理のフレームが存在する場合には(S1303でNo)、処理をS1304へ進める。
S1304において、全体制御部101は、直前に符号化が行われたフレームがIフレームであったか否かを判定する。全体制御部101は、Iフレームであった場合には(S1304のYes)、フレーム単位制御フラグを更新することなく処理時点におけるフレーム単位制御フラグの値を保持し、処理をS1302へ進める。この場合、S1302において、全体制御部101は、次のフレームの符号化を行うよう制御する。全体制御部101は、符号化が行われたフレームがIフレーム以外の場合には(S1304でNo)、処理をS1305へ進める。S1305において、全体制御部101は、フレーム単位制御フラグに0を設定する。全体制御部101はさらに、ループ制御変数iに0を設定する。そして、全体制御部101は、直前のP/Bフレームの符号化時に取得した動きベクトルヒストグラムの判定を開始する。
全体制御部101は、同一の動画像に含まれるフレームで、サイズ決定処理の対象のフレーム(対象フレーム)に対する処理の直前に符号化されたP/Bフレームを処理対象として、符号化情報としての動きベクトルのヒストグラム情報を生成する。図14は、MVヒストグラム1400の一例を示す図である。MVヒストグラムの階級4は、ゼロ動きベクトル(以降、ZMVと記載する)に対応し、その度数は、対象フレームにおけるZVMの発生回数(XMVの数)に対応する。その他の階級の度数は、非ゼロ動きベクトル(MV)の発生回数に対応する。ここで、ヒストグラムは、動きベクトルのx、y方向(縦、横方向)それぞれに別個に用意される。
図13に戻り、S1305の処理の後、全体制御部101は、処理をS1306へ進める。S1306において、全体制御部101は、階級iとヒストグラムの階級数Nとを比較する。全体制御部101は、階級iが階級数Nよりも小さい場合には(S1306でYes)、処理をS1307へ進める。全体制御部101は、階級iが階級数N以上の場合には(S1306でNo)、本フレームに対する処理を終了し、処理をS1302へ進める。S1307において、全体制御部101は、階級iがZMVの階級か否かを確認する。全体制御部101は、ZMVの階級の場合には(S1307でYes)、処理をS1310へ進める。全体制御部101は、ZMV以外のMVの階級の場合には(S1307でNo)、処理をS1308へ進める。
S1308において、全体制御部101は、階級iの度数と予め設定された閾値T1とを比較する。全体制御部101は、級数iの度数が閾値T1よりも大きい場合には(S1308でYes)、処理をS1309へ進める。全体制御部101は、級数iの度数が閾値T1以下の場合には(S1308でNo)、処理をS1312へ進める。S1312において、全体制御部101は、次の階級の処理を行うべく、iをインクリメントし、その後処理をS1306へ進める。S1309において、全体制御部101は、フレーム単位制御フラグに1を設定し、その後処理をS1312へ進める。
また、S1310において、全体制御部101は、階級iの度数と予め設定された閾値T2とを比較する。全体制御部101は、級数iの度数が閾値T2よりも大きい場合には(S1310でYes)、処理をS1311へ進める。全体制御部101は、級数iの度数が閾値T2以下の場合には(S1310でNo)、処理をS1312へ進める。S1311において、全体制御部101は、階級(i−1)、階級(i+1)の度数と閾値T1とを比較する。全体制御部101は、階級(i−1)、階級(i+1)のうち少なくとも一方の階級の度数が閾値T1よりも大きい場合には(S1311でYes)、処理をS1309へ進める。全体制御部101は、いずれの階級の度数も閾値T1以下の場合には(S1311でNo)、処理をS1312へ進める。
図15は、図5のS502における詳細な処理を示すフローチャートである。なお、図15に示す各処理のうち、図5を参照しつつ説明した第1の実施形態に係る各処理と同一の処理には、同一の番号を付している。サイズ決定部1202は、S701の処理の後、処理をS1501へ進める。S1501において、サイズ決定部1202は、CTU単位制御フラグを確認する。サイズ決定部1202は、CTU単位制御フラグが1に設定されている場合には(S1501でYes)、処理をS1502へ進める。サイズ決定部1202は、CTU単位制御フラグが0に設定されている場合には(S1501でNo)、処理をS705へ進める。S1502において、サイズ決定部1202は、量子化パラメータQPに応じて閾値T3を設定する。サイズ決定部1202は、その後処理をS702へ進める。なお、S1307、S1308、S1310、S1311の判断条件は、既に符号化済みのフレームの動きベクトルに関する第2の条件の一例である。また、符号化済みのフレームの動きベクトルは、符号化情報の一例である。
ここで、説明のため、図15を参照しつつ説明した基準サイズのSADが閾値より大きい場合に基準サイズをインター予測のブロックサイズとして決定する処理(S1502〜S704)を第1の処理と称する。また、符号化コストが最小となるブロックサイズをインター予測のブロックサイズとして決定する処理(S705)を第2の処理と称する。図15の処理は、処理対象のフレームと同一の動画像のフレームで、既に符号化済みのフレームの符号化情報が予め設定された動きベクトルに関する条件に合致する場合には、第1の処理を行うよう制御する処理(決定処理)の一例である。なお、図15の処理はまた、符号化済みのフレームの符号化情報が動きベクトルに関する条件に合致しない場合には、第2の処理を行うよう制御する処理(決定処理)の一例である。なお、第2の実施形態に係る動画像符号化装置100のこれ以外の構成及び処理は、第1の実施形態に係る動画像符号化装置100の構成及び処理と同様である。
以上のように、第2の実施形態に係る動画像符号化装置100は、8×8SADと閾値との比較結果に応じたブロックサイズ選択方法をフレーム単位で適応的に制御することができる。これにより、符号化効率をさらに向上させることができる。
第2の実施形態の第1の変形例としては、動画像符号化装置100は、非ゼロ動きベクトルの度数とゼロ動きベクトルの度数を閾値と比較しているが、符号化情報は、動きベクトルの度数に限定されるものではない。任意の符号化情報(例えば量子化パラメータ、イントラCUとインターCUの比率、入力画像の特徴量)を利用可能であることは言うまでもない。
また、第2の変形例としては、ヒストグラムの値が閾値より大きい場合に、制御フラグに1を設定する、実施形態の処理に限定されるものではない。動画像符号化装置100は、閾値より小さい場合に同様の処理を実施してもよい。
また、第3の変形例としては、第2の実施形態においては、全体制御部101は、S1306〜S1311の閾値判定においては、x、y方向両方のヒストグラムを行うこととするがこれに限定されるものではない。他の例としては、全体制御部101は、x方向のヒストグラムの閾値判定を実施した後、y方向のヒストグラムの閾値判定を実施するようにしてもよい。また、全体制御部101は、制御フラグに1を設定したら、残りの階級の判定処理をスキップするようにしてもよい。
また、第4の変形例としては、S1311において、階級(i+1)と階級(i−1)を処理対象としているが、ここで処理対象となるのは階級iを基準として定まる階級であればよく、実施形態に限定されるものではない。他の例としては、S1311における処理対象は階級(i+k)と階級(i−k)(k:1以上の整数)としてもよい。
第5の変形例について説明する。制御フラグ設定処理において参照される、制御フラグ設定処理の処理時点において既に符号化済みのフレームは、制御フラグ設定処理の対象フレームと同一の動画像に含まれるP/Bフレームであればよく、直前のP/Bフレームに限定されるものではない。
第6の変形例について説明する。第1の処理を行うか否かの制御単位はフレームに限定されるものではない。他の例としては、図15の処理の開始時点までに、制御フラグ設定処理において、フレーム単位制御フラグが設定された対象フレームにおいて、既に符号化済みのブロックが存在するとする。この場合、サイズ決定部1202は、対象フレームにおいて既に符号化済みのブロックを対象として、実施形態において説明したように動きベクトルのヒストグラムを作成する。そして、サイズ決定部1202は、図13のS1307〜S1311に相当する、ヒストグラムの度数に関する閾値処理により、処理対象のブロックに対するCTU単位制御フラグを設定してもよい。これにより、CTU単位で第1の処理を行うか否かを適応的に制御することができる。
また、上記実施形態においては、動画像符号化装置100は、HEVCに適用する場合を例に説明したが、動画像符号化装置100の対象は、HEVCに限定されるものではない。
図16は、上記実施形態に係る動画像符号化装置100のハードウェア構成図である。動画像符号化装置100は、CPU1601と、ROM1602と、RAM1603と、HDD1604と、表示部1605と、入力部1606と、通信部1607とを有している。CPU1601は、ROM1602に記憶された制御プログラムを読み出して、上述の処理を含む、各種処理を実行する。RAM1603は、CPU1601の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD1604は、各種データや各種プログラム等を記憶する。表示部1605は、各種情報を表示する。入力部1606は、キーボードやマウスを有し、ユーザによる各種操作を受け付ける。通信部1607は、ネットワークを介して外部装置との通信処理を行う。
なお、後述する動画像符号化装置100の機能や処理は、CPU1601がROM1602又はHDD1604に格納されているプログラムを読み出し、このプログラムを実行することにより実現されるものである。また、他の例としては、CPU1601は、ROM1602等に替えて、SDカード等の記録媒体に格納されているプログラムを読み出してもよい。
また、他の例としては、動画像符号化装置100の機能や処理の少なくとも一部は、例えば複数のCPU、RAM、ROM、及びストレージを協働させることにより実現してもよい。また、他の例としては、動画像符号化装置100の機能や処理の少なくとも一部は、ハードウェア回路を用いて実現してもよい。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
100 動画像符号化装置
101 全体制御部
108 インター予測部
109 イントラ予測部
110 判定部

Claims (9)

  1. 動画像を構成するフレームを予め定められたブロック単位に分割し、インター予測による符号化又はイントラ予測による符号化を選択的に行う動画像符号化装置であって、
    前記動画像を構成するフレームの処理対象となる対象フレームに含まれる前記ブロック単位よりも小さい基準サイズのブロックと、前記対象フレームと異なる参照フレームにおける当該基準サイズに対応するサイズのブロックと、の差分を示す特徴量を導出する特徴量導出手段と、
    前記基準サイズのブロックについて前記特徴量導出手段により導出された特徴量が閾値よりも大きい場合に、前記基準サイズを前記インター予測のブロックサイズとして決定し、前記基準サイズ以下のサイズを前記イントラ予測のブロックサイズとして決定する決定手段と、
    前記決定手段により決定されたブロックサイズのブロックに対する予測方法として、前記インター予測及び前記イントラ予測のうち符号化コストが小さい方を選択する選択手段と
    を有することを特徴とする動画像符号化装置。
  2. 前記決定手段は、前記基準サイズのブロックについて前記特徴量導出手段により導出された特徴量が前記閾値よりも大きい場合に、前記インター予測のブロックサイズと等しいサイズを前記イントラ予測のブロックサイズとして決定することを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記特徴量は、前記対象フレームにおける前記基準サイズのブロック、前記参照フレームにおける当該基準サイズに対応するサイズのブロックとの間のSAD(Sum of Absolute Difference)であり、
    前記決定手段は、前記基準サイズのブロックにおける前記SADが前記閾値よりも大きい場合に、前記基準サイズを前記インター予測のブロックサイズとして決定し、前記基準サイズ以下のサイズを前記イントラ予測のブロックサイズとして決定することを特徴とする請求項1に記載の動画像符号化装置。
  4. 前記特徴量導出手段は、前記ブロック単位以下の複数のサイズのブロックについて前記特徴量を導出し、
    前記特徴量に基づいて、前記複数のサイズのブロックの前記インター予測の符号化コストを導出する符号化コスト導出手段をさらに有し、
    前記決定手段は、前記基準サイズのブロックの特徴量が前記閾値よりも小さい場合に、前記複数のサイズのブロックそれぞれの符号化コストに基づいて、前記複数のサイズの中から、前記インター予測のブロックサイズを決定することを特徴とする請求項1乃至の何れか1項に記載の動画像符号化装置。
  5. 前記特徴量導出手段は、特徴量の導出対象のブロックに含まれる前記基準サイズのブロックの特徴量に基づいて、前記導出対象のブロックの特徴量を導出することを特徴とする請求項に記載の動画像符号化装置。
  6. 前記決定手段は、前記基準サイズのブロックについて前記特徴量導出手段により導出された特徴量が前記閾値よりも大きい場合に、前記基準サイズを前記インター予測および前記イントラ予測のブロックサイズとして決定することを特徴とする請求項1乃至5の何れか1項に記載の動画像符号化装置。
  7. 前記基準サイズは、8×8のサイズであることを特徴とする請求項1乃至の何れか1項に記載の動画像符号化装置。
  8. 動画像を構成するフレームを予め定められたブロック単位に分割し、インター予測による符号化又はイントラ予測による符号化を選択的に行う動画像符号化装置が実行する動画像符号化方法であって、
    前記動画像を構成するフレームの処理対象となる対象フレームに含まれる前記ブロック単位よりも小さい基準サイズのブロックと、前記対象フレームと異なる参照フレームにおける当該基準サイズに対応するサイズのブロックと、の差分を示す特徴量を導出する特徴量導出ステップと、
    前記基準サイズのブロックについて前記特徴量導出ステップにより導出された特徴量が閾値よりも大きい場合に、前記基準サイズを前記インター予測のブロックサイズとして決定し、前記基準サイズ以下のサイズを前記イントラ予測のブロックサイズとして決定する決定ステップと、
    前記決定ステップにおいて決定されたブロックサイズのブロックに対する予測方法として、前記インター予測及び前記イントラ予測のうち符号化コストが小さい方を選択する選択ステップと
    を含むことを特徴とする動画像符号化方法。
  9. 動画像を構成するフレームを予め定められたブロック単位に分割し、インター予測による符号化又はイントラ予測による符号化を選択的に行う動画像符号化装置のコンピュータを、
    前記動画像を構成するフレームの処理対象となる対象フレームに含まれる前記ブロック単位よりも小さい基準サイズのブロックと、前記対象フレームと異なる参照フレームにおける当該基準サイズに対応するサイズのブロックと、の差分を示す特徴量を導出する特徴量導出手段と、
    前記基準サイズのブロックについて前記特徴量導出手段により導出された特徴量が閾値よりも大きい場合に、前記基準サイズを前記インター予測のブロックサイズとして決定し、前記基準サイズ以下のサイズを前記イントラ予測のブロックサイズとして決定する決定手段と、
    前記決定手段により決定されたブロックサイズのブロックに対する予測方法として、前記インター予測及び前記イントラ予測のうち符号化コストが小さい方を選択する選択手段と
    して機能させるためのプログラム。
JP2017094784A 2017-05-11 2017-05-11 動画像符号化装置、動画像符号化方法及びプログラム Active JP6914722B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017094784A JP6914722B2 (ja) 2017-05-11 2017-05-11 動画像符号化装置、動画像符号化方法及びプログラム
US15/973,138 US10595038B2 (en) 2017-05-11 2018-05-07 Moving image coding apparatus, moving image coding method and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017094784A JP6914722B2 (ja) 2017-05-11 2017-05-11 動画像符号化装置、動画像符号化方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018191246A JP2018191246A (ja) 2018-11-29
JP6914722B2 true JP6914722B2 (ja) 2021-08-04

Family

ID=64097507

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017094784A Active JP6914722B2 (ja) 2017-05-11 2017-05-11 動画像符号化装置、動画像符号化方法及びプログラム

Country Status (2)

Country Link
US (1) US10595038B2 (ja)
JP (1) JP6914722B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3125904A1 (en) 2019-01-08 2020-07-16 Huawei Technologies Co., Ltd. Image prediction method, apparatus, system, device, and storage medium for processing performance and speed
EP3833028B1 (en) * 2019-12-03 2022-02-09 Axis AB Method and system for calculating a cost of encoding a motion vector
CN113453020B (zh) * 2020-03-26 2023-12-19 瑞昱半导体股份有限公司 位元率控制方法与视频处理装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007184846A (ja) * 2006-01-10 2007-07-19 Toshiba Corp 動画像符号化装置
JP2008017305A (ja) * 2006-07-07 2008-01-24 Canon Inc 画像処理装置及び画像処理方法
JP4908180B2 (ja) * 2006-12-20 2012-04-04 株式会社東芝 動画像符号化装置
WO2011083573A1 (ja) * 2010-01-07 2011-07-14 株式会社 東芝 動画像符号化装置及び動画像復号化装置
RU2571538C2 (ru) * 2011-03-09 2015-12-20 Кабусики Кайся Тосиба Способ кодирования изображений и способ декодирования изображений
JP6569677B2 (ja) * 2014-08-28 2019-09-04 日本電気株式会社 ブロックサイズ決定方法及びプログラム
JP2016181799A (ja) * 2015-03-24 2016-10-13 日本電気株式会社 動画像符号化システム、動画像符号化方法、および動画像符号化用プログラム
US10574999B2 (en) * 2016-05-05 2020-02-25 Intel Corporation Method and system of video coding with a multi-pass prediction mode decision pipeline

Also Published As

Publication number Publication date
JP2018191246A (ja) 2018-11-29
US10595038B2 (en) 2020-03-17
US20180332299A1 (en) 2018-11-15

Similar Documents

Publication Publication Date Title
EP3389276B1 (en) Hash-based encoder decisions for video coding
KR101737861B1 (ko) 변환 깊이 기반 dct 사이즈 결정 장치 및 방법
JP6914722B2 (ja) 動画像符号化装置、動画像符号化方法及びプログラム
WO2014190468A1 (en) Video encoder for images
JP4764136B2 (ja) 動画像符号化装置、及びフェードシーン検出装置
EP4152752A1 (en) Method and apparatus for encoding or decoding video data with sub-pixel motion vector refinement
CN109936742B (zh) 对视频序列进行编码的方法、编码装置和存储介质
JP6501532B2 (ja) 画像符号化装置、画像符号化方法及びプログラム
JP6962193B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体
CN108924551B (zh) 视频图像编码模式的预测方法及相关设备
JP4833309B2 (ja) 動画像圧縮符号化装置
JP6652068B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP2007228519A (ja) 画像符号化装置及び画像符号化方法
JP5111128B2 (ja) 符号化装置、符号化装置の制御方法及びコンピュータプログラム
US20160057429A1 (en) Coding apparatus, method, computer product, and computer system
JP6946979B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
US9165380B2 (en) Image encoding method using binary partition tree
JP6248783B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
JP6992815B2 (ja) 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
JP7027044B2 (ja) 画像符号化装置、画像符号化方法及びプログラム
JP2017050744A (ja) 画像符号化装置、画像符号化方法、及びプログラム
JP6080077B2 (ja) 画像符号化方法及び画像符号化装置
CN117294861B (zh) 一种基于帧间预测的编码块划分方法及编码器
EP3136725B1 (en) Video coding apparatus
JP2008072608A (ja) 画像符号化装置及び画像符号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210330

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210615

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210714

R151 Written notification of patent or utility model registration

Ref document number: 6914722

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151