JP5970507B2 - 映像符号化装置及び映像符号化プログラム - Google Patents

映像符号化装置及び映像符号化プログラム Download PDF

Info

Publication number
JP5970507B2
JP5970507B2 JP2014162522A JP2014162522A JP5970507B2 JP 5970507 B2 JP5970507 B2 JP 5970507B2 JP 2014162522 A JP2014162522 A JP 2014162522A JP 2014162522 A JP2014162522 A JP 2014162522A JP 5970507 B2 JP5970507 B2 JP 5970507B2
Authority
JP
Japan
Prior art keywords
search
reduction ratio
motion
picture
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014162522A
Other languages
English (en)
Other versions
JP2016039535A (ja
Inventor
卓 佐野
卓 佐野
大西 隆之
隆之 大西
清水 淳
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014162522A priority Critical patent/JP5970507B2/ja
Publication of JP2016039535A publication Critical patent/JP2016039535A/ja
Application granted granted Critical
Publication of JP5970507B2 publication Critical patent/JP5970507B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、動き予測を用いて映像符号化を行う映像符号化装置及び映像符号化プログラムに関する。
映像符号化技術は、MPEG−2、MPEG−4、MPEG−4/AVCが多く用いられており、最近では次世代の映像符号化規格であるHEVC(High Efficiency Video Coding)の規格化が進められている。映像符号化規格では、1つのピクチャ内に閉じた情報を用いて符号化を行う画面内符号化と、時間的に連続した複数のピクチャを用いて符号化を行う画面間符号化が用いられている。画面間符号化には画面間の差分値を削減するために動き予測処理を行い、差分値と動きベクトル情報を符号化することで情報量を削減している。ただし、映像の正しい動きを捉えて符号化すべき差分値を小さくするためには、動き予測処理に膨大な演算量を必要とする。
また、近年HD(high definition;1920画素×1080ライン)の4倍の解像度を持つ4K映像(3840画素×2160ライン)や、そのさらに4倍の解像度を持つ8K映像(7680画素×4320ライン)などの高精細映像が扱われるようになってきている。図13は、HD映像と4K映像における動き予測範囲を示す図である。高精細映像の場合は物体の動きが相対的に大きくなるため、より広い動き予測範囲(図13に示す矩形領域)が必要になり、動き予測処理量はさらに増大してしまう。
この膨大な演算量を削減するためにはいくつかの方法が考えられる。1つ目は予測ベクトルの周辺を探索する方法である。これは符号化ブロックの動き予測結果と周囲の符号化ブロックの動き予測結果には相関が高いという傾向に基づいたものである。MPEG−4/AVCや次世代符号化規格であるHEVCでは予測ベクトルの算出方法が定められており、ブロックの動きベクトルは予測ベクトルからの差分値のみを符号化することで符号量の削減を行っている。この予測ベクトルを利用し、ブロック周辺の既出の動きベクトルから予測ベクトルを算出し、予測ベクトルが指し示す位置を探索の中心として周辺を探索するという方法である。
2つ目は探索点を効率良く削減し探索する方法である。ステップサーチに代表されるように、ある探索範囲の探索点全てを評価するのではなく、まず広く離散的な数点を評価しその中で最も適した点を中心に近傍点の探索を行うことで少ない演算量で動きベクトルを決定する方法である。近年ではEPZS(Enhanced Predictive Zonal Search)と呼ばれるステップサーチと全探索を組み合わせた探索手法が使われており、少ない演算量で全探索とほぼ同等の探索精度を実現している。
3つ目は縮小画像による探索方法である。探索処理の前に入力映像信号のピクチャと復号映像信号の参照画像を同じ比率で縮小し探索を行う。これにより探索点の数と探索点を評価するための演算量の両方が削減されるため、大幅な演算量の削減が可能となる。この探索方法は演算性能が限られているソフトウェアコーデックや、広い探索範囲を必要とするプロ向けのハードウェアコーデック等で有効な方法である。しかし、一方で画像の縮小比率を上げていくと物体の細かい動きを正確に予測することが難しくなるため、動きベクトルの精度は悪くなってしまうという問題がある。
このような問題を解決するために、広い探索範囲と高い動きベクトルの精度を両立させる手法としては、複数の探索領域を設定し第一の領域の動き探索後に評価値の閾値判定を行い、第二の領域の動き探索を行うか否かを決定する手法がある(例えば、特許文献1参照)。
特開平11−75192号公報
しかしながら、特許文献1に記載の映像符号化装置では対象符号化ブロックに対する探索演算量が均一にならないため、ソフトウェアでの実装では問題無いがハードウェアへの実装においては制御が難しくなるという問題がある。
このような問題を解決する方法の一つとして、入力映像信号ピクチャと参照画像との時間的距離や隣接したピクチャの差分絶対値和、直前に符号化を行った動きベクトル情報を用いて入力映像信号ピクチャの縮小比率を決定する手法が考えられる。この手法では、物体の動きの大小や過去に探索した動きベクトルの方向が揃っているか否かで縮小比率を適応的に切り替えることができる。しかし、物体がどちらの方向にどのくらい動いているかという正確な情報が得られないため、動きを正確に捉えることができないという問題がある。
本発明は、このような事情に鑑みてなされたもので、少ない演算量で広い探索範囲の探索を行うことができる映像符号化装置及び映像符号化プログラムを提供することを目的とする。
本発明は、入力映像信号のピクチャの時間的相関を利用し、該ピクチャについて符号化ブロック単位に動き予測を行いその差分の符号化処理を行う映像符号化装置であって、過去に符号化を行ったピクチャの動きベクトルの統計情報を取得する統計情報収集手段と、前記統計情報に基づいて前記ピクチャの所定の探索領域についての動き探索処理に用いる縮小画像の縮小比率と探索中心点とを決定する縮小比率・探索中心決定手段と、前記入力映像信号のピクチャと動き予測先の復号映像信号の参照画像を前記縮小比率で縮小する縮小手段と、縮小した前記入力映像信号のピクチャの符号化ブロックと復号映像信号の参照画像の探索領域とを用いて動き予測処理を行い、動きベクトルを決定するベクトル決定手段と、決定した前記動きベクトルを前記縮小比率に基づきスケーリングを行うスケーリング手段とを備え、前記縮小比率・探索中心決定手段は、前記動きベクトルから算出される位置を探索中心点として決定するとともに、前記動きベクトルのヒストグラムの偏りが大きいほど前記縮小比率をより小さい値に決定し、前記動きベクトルのヒストグラムの偏りが小さいほど前記縮小比率をより大きな値に決定することを特徴とする。
本発明は、入力映像信号のピクチャの時間的相関を利用し、該ピクチャについて符号化ブロック単位に動き予測を行いその差分の符号化処理を行う映像符号化装置であって、過去に符号化を行ったピクチャの動きベクトルの統計情報を取得する統計情報収集手段と、前記統計情報に基づいて前記ピクチャの所定の探索領域についての動き探索処理に用いる縮小画像の縮小比率と探索中心点とを決定する縮小比率・探索中心決定手段と、前記入力映像信号のピクチャと動き予測先の復号映像信号の参照画像を前記縮小比率で縮小する縮小手段と、縮小した前記入力映像信号のピクチャの符号化ブロックと復号映像信号の参照画像の探索領域とを用いて動き予測処理を行い、動きベクトルを決定するベクトル決定手段と、決定した前記動きベクトルを前記縮小比率に基づきスケーリングを行うスケーリング手段とを備え、前記縮小比率・探索中心決定手段は、最も検出される確率が高い動きベクトルと、段階的な縮小比率それぞれの探索範囲とを比較し、前記動きベクトルが前記探索範囲内に収まるか否かに基づいて、前記縮小比率及び前記探索中心点を決定することを特徴とする。
本発明は、前記縮小比率・探索中心決定手段は、ヒストグラムを収集したピクチャ内のイントラブロックの数が所定に閾値より多い場合に、縮小比率を1段階大きくすることを特徴とする。
本発明は、決定された前記縮小比率に応じて、前記符号化ブロックの動き探索に要する演算量が一定になるように動き探索範囲を適応的に決定する探索範囲決定手段をさらに備えることを特徴とする。
本発明は、コンピュータを、前記映像符号化装置として機能させるための映像符号化プログラムである。
本発明によれば、動き予測を用いて符号化を行う映像符号化方式において、事前に行った動き探索処理で探索された動きベクトルの統計情報より物体の動き及びカメラパンの動き量を正確に検出し、当該ピクチャの動き探索中心点を適応的に設定することにより、少ない演算量で広い探索範囲の探索を行うことができるという効果が得られる。また、動き予測を用いて符号化を行う映像符号化方式において、動き探索を行う際の縮小比率を適応的に切り替えることにより演算量の削減と動きベクトルの精度向上を両立することができる効果も得られる。
本発明の一実施形態の構成を示すブロック図である。 図1に示すインター予測処理部102の構成を示すブロック図である。 図2に示す統計情報収集部203で集計する2次元の動きベクトルのヒストグラムの一例を示す図である。 図2に示す統計情報収集部203で集計する1次元の動きベクトルのヒストグラムの一例を示す図である。 H.264/AVCで代表的な符号化ピクチャ構造の一例を示す図である。 HEVC代表的な符号化ピクチャ構造の一例を示す図である。 当該ピクチャのピクチャ間距離の一例を示す図である。 縮小比率及び探索中心点の決定手順を示すフローチャートである。 ある動きベクトルのヒストグラムの一例を示す図である。 ある動きベクトルのヒストグラムの一例を示す図である。 ある動きベクトルのヒストグラムの一例を示す図である。 図8に示す方法に加えてヒストグラムを収集したピクチャのイントラブロックの比率に応じて縮小比率を調整する手順を示すフローチャートである。 HD映像と4K映像における動き予測範囲を示す図である。
以下、図面を参照して、本発明の一実施形態による映像符号化装置を説明する。図1は同実施形態の構成を示すブロック図である。以下に示す「符号化ブロック」についてはMPEG−2やH.264/AVC規格ではマクロブロックのことを示し、HEVCについてはコーディングユニット(CU)又はプレディクションユニット(PU)のことを指し示す。図1に示す映像符号化装置100において、インター予測処理部102の中の処理が従来技術と異なる構成であり、他の部分はH.264/AVCやHEVC等の映像符号化装置として用いられている従来の一般的な構成と同様である。
映像符号化装置100は、符号化対象の入力映像信号を入力し、入力映像信号のピクチャをブロックに分割してブロックごとに符号化し、そのビットストリームを符号化ストリームとして出力する。この符号化のため、予測残差信号生成部103は、入力映像信号とイントラ予測処理部101あるいはインター予測処理部102の出力である予測信号との差分を求め、それを予測残差信号として出力する。変換・量子化処理部104は、予測残差信号に対して離散コサイン変換等の直交変換を行い、変換係数を量子化し、その量子化された変換係数を出力する。エントロピー符号化処理部105は、量子化された変換係数をエントロピー符号化し、符号化ストリームとして出力する。
一方、量子化された変換係数は、逆量子化・逆変換処理部106にも入力され、ここで逆量子化と逆直交変換され、予測残差信号を出力する。復号映像信号生成部107では、予測残差信号とイントラ予測処理部101あるいはインター予測処理部102の出力である予測信号とを加算し、符号化した符号化対象ブロックの復号映像信号を生成する。この復号映像信号は、インター予測処理部102で参照画像として用いるために、ループフィルタ処理部108に対して出力される。ループフィルタ処理部108では符号化歪みを低減するフィルタリング処理を行い、このフィルタリング処理後の画像を復号映像信号としてインター予測処理部102に対して出力する。
次に、図2を参照して、図1に示すインター予測処理部102の構成を説明する。図2は、図1に示すインター予測処理部102の構成を示すブロック図である。インター予測処理部102は、縮小画像生成部201、プレ探索処理部202、統計情報収集部203、第一モード判定部204、整数画素探索処理部205、第二モード判定部206、小数画素探索処理部207、小数画像生成部208を備える。
縮小画像生成部201は、入力映像信号(原画像)と復号信号(ループフィルタ処理部108の出力)を入力し、統計情報収集部203から出力する縮小比率に基づき縮小処理を行って出力する(縮小手段)。プレ探索処理部202は、縮小画像生成部201から縮小された入力映像信号(原画像)及び復号映像信号(復号信号)を入力し、縮小された映像データ上で動き探索処理を行う(探索範囲決定手段と動きベクトル決定手段とスケーリング手段)。
統計情報収集部203は、プレ探索処理部202で探索した動きベクトルを入力し、1ピクチャ分あるいは複数ピクチャ分の統計情報を収集し(統計情報収集手段)、次のピクチャで実施するプレ探索の縮小比率と探索中心点を決定する(縮小比率決定手段と探索中心決定手段)。決定した縮小比率は縮小画像生成部201へ出力し、探索中心点はプレ探索処理部202へ出力する。第一モード判定部204は、プレ探索処理部202で探索した結果の符号化モード情報1を入力し、次の整数画素探索で行う符号化モードを決定し整数画素探索処理部205へ出力する。
整数画素探索処理部205は、プレ探索処理部202と第一モード判定部204でそれぞれ指定された動きベクトル及び符号化モードで整数画素の探索処理を行う。第二モード判定部206は、整数画素探索処理部205で探索した結果の符号化モード情報2を入力し、次の小数画素探索で行う符号化モードを決定し小数画素探索処理部207へ出力する。
小数画素探索処理部207は、整数画素探索処理部205と第二モード判定部206でそれぞれ指定された動きベクトル及び符号化モードで小数画素の探索処理を行う。小数画像生成部208は、該当する復号映像信号位置の小数画素補間画像を生成し、小数画素探索処理部207に対して出力する。小数画素探索処理部207において探索された結果の予測残差画像と動きベクトル情報は予測残差信号生成部103に対して出力する。
本実施形態は、図2に示す統計情報収集部203において、プレ探索処理部202で行った過去の動きベクトル情報から当該ピクチャで実施する縮小比率と探索中心点を決定し、少ない演算量で物体の動きやカメラパンを的確に探索することで高い符号化効率を実現するものである。
ここで、縮小画像による動き予測処理の必要性について説明する。動き予測処理は物体の動きを正確に追随することで高い符号化効率を実現できるため、探索範囲は広ければ広いほど符号化効率が向上する。しかし、探索範囲を広くすればするほど動き予測に必要な演算量が増大するため、ハードウェア・ソフトウェアの処理能力やアプリケーション用途に応じて適切な探索範囲を設定している。
少ない演算量で広い探索範囲をカバーする方法の1つとして縮小画像による探索方法がある。例として、符号化ブロックのサイズを16×16、探索範囲を±8、単画素精度による全探索の動き探索処理部とすると、1ブロックの動き探索処理を行うのに必要な差分処理回数は、16×16×(8×2+1)2=73984となる。
入力映像信号と復号映像信号をそれぞれ1/2に縮小し同様の探索範囲を探索した場合、符号化ブロックのサイズと探索範囲がそれぞれ縦横半分になるため、差分演算回数は8×8×(4×2+1)2=5184となり、約7%の演算量で処理画可能となる。
また、単画素精度の探索処理で必要であった演算回数と同等の演算を1/2縮小画像上で行うと、±16画素の探索範囲をカバーできる。縮小比率を1/2、1/4、1/8と大きくすればするほど少ない演算量で広い探索範囲をカバーすることができるが、細かいテクスチャがつぶれてしまうために動きベクトルの精度が低下するという問題点もある。縮小画像探索による探索範囲と動きベクトルの精度についてはトレードオフの関係があるため、入力映像信号や復号映像信号の特性や、過去の動きベクトルの情報に応じて適応的に設定する必要がある。
次に、図2に示す統計情報収集部203における動きベクトル情報の収集方法の一例について説明する。ここでは動きベクトルのヒストグラムを作成する例について説明する。プレ探索処理部202で探索された動きベクトルを1ピクチャ分収集し、動きベクトルのヒストグラムを生成する。
図3は、図2に示す統計情報収集部203で集計する2次元の動きベクトルのヒストグラムの一例を示す図である。図3では、プレ探索処理部の探索範囲が±64、ヒストグラムの区分単位が8の場合のヒストグラムを示している。プレ探索部処理部の探索範囲及びヒストグラムの区分単位については任意に設定できる。図3を用いて動きベクトルのヒストグラムを生成することで物体の動きやカメラパンの方向や大きさを捉えることが可能になる。
探索範囲やヒストグラムの区分単位によっては2次元のヒストグラムでは膨大なメモリ量が必要になる場合がある。その場合は、1次元のヒストグラムを縦横それぞれ用意し、ヒストグラムを生成することでヒストグラムに要するメモリ量を削減することが可能である。図4は、図2に示す統計情報収集部203で集計する1次元の動きベクトルのヒストグラムの一例を示す図である。図4では、探索範囲が±64、ヒストグラムの区分単位が8の場合の1次元のヒストグラムを示している。
次に、動きベクトルのヒストグラムを生成するピクチャについて説明する。物体の動きやカメラパンの大きさをより正確に捉えるためには、ピクチャ間距離の短いピクチャの動き探索の際に生成することが望ましい。代表的な符号化ピクチャ構造におけるヒストグラム生成のタイミングについて図5及び図6に示す。図5は、H.264/AVCで代表的な符号化ピクチャ構造の一例を示す図である。図6は、HEVC代表的な符号化ピクチャ構造の一例を示す図である。図5は主にMPEG−2やH.264/AVCで用いられ、図6はHEVCで主に用いられている符号化ピクチャ構造である。
図6においては、ピクチャ間距離の短いピクチャ時であると共に、より精度を上げるために階層の低いピクチャとの動き探索の際にヒストグラムを生成する方が望ましい。ただし、ヒストグラムを生成するタイミングについては任意のタイミングで生成することが可能であり、上記のピクチャタイミングに限定するものではない。
次に、図2に示す統計情報収集部203における縮小比率決定方法及び探索中心点決定方法について説明する。
<第1の方法>
始めに、第1の方法について説明する。ここでは、動きベクトルのヒストグラムの最頻値が示すベクトルの水平成分をMV_histとし、決定する縮小比率は1/2、1/4、1/8の3種、縮小比率それぞれの場合の探索範囲をSR_1/2、SR_1/4、SR_1/8とする。また、符号化ピクチャのピクチャ間距離をDpic、ヒストグラムを取得したピクチャのピクチャ間距離をDhistとする。
図7は、当該ピクチャのピクチャ間距離の一例を示す図である。図中の数字はPOC(Picture Order Count)番号を示しており、縦線は1枚のフレームを表している。この場合、Dpic=8、Dhist=1となる。まず、(1)式に示すように最頻値ベクトル成分をピクチャ間距離に応じてスケーリングを行い、このピクチャで最も検出される確率が高いベクトルMV_candを求める。
MV_cand=MV_hist ×(Dpic−Dhist+1)・・・(1)
(1)式で求めたMV_candとSR_1/2、SR_1/4、SR_1/8とを順次比較し、MV_candが探索範囲内に収まっている場合はその縮小比率に決定し、探索中心点は0とする。MV_candがSR_1/8よりも大きい場合、すなわち最も大きい縮小比率でも動きが捉えられない場合、(2)式に示す様にSR_1/8とMV_candの差分値をMV_moveとし、探索中心点とする。
MV_move=SR_1/8−MV_cand・・・(2)
図8は、縮小比率及び探索中心点の決定手順を示すフローチャートである。まず、統計情報収集部203は、MV_hist×(Dpic−Dhist+1)を求め、MV_candに代入する(ステップS1)。そして、統計情報収集部203は、MV_cand<SR_1/2であるか否かを判定する(ステップS2)。この判定の結果、MV_cand<SR_1/2を満たせば、統計情報収集部203は、縮小比率を1/2とし、探索中心点を0とする(ステップS3)。
次に、MV_cand<SR_1/2を満たさなければ、統計情報収集部203は、MV_cand<SR_1/4であるか否かを判定する(ステップS4)。この判定の結果、MV_cand<SR_1/4を満たせば、統計情報収集部203は、縮小比率を1/4とし、探索中心点を0とする(ステップS5)。
次に、MV_cand<SR_1/4を満たさなければ、統計情報収集部203は、MV_cand<SR_1/8であるか否かを判定する(ステップS6)。この判定の結果、MV_cand<SR_1/8を満たせば、統計情報収集部203は、縮小比率を1/8とし、探索中心点を0とする(ステップS7)。
次に、MV_cand<SR_1/8を満たさなければ、統計情報収集部203は、SR_1/8−MV_candを求め、MV_moveに代入する(ステップS8)。そして、統計情報収集部203は、縮小比率を1/8とし、探索中心点をMV_moveとする(ステップS9)。
上記の処理を水平方向、垂直方向それぞれ行い、縮小比率と探索中心点を決定する。この例では、1ピクチャの動きベクトルヒストグラムの最頻値を定数倍して縮小比率と探索中心点を決定している。これは物体やカメラパンの動きが一定の速度であることを想定している。ピクチャ毎に集計した動きベクトルのヒストグラムを複数ピクチャ分用いることで、加速して動いている物体やカメラパンの動きも捉えることが可能となる。
<第2の方法>
次に、第2の方法を説明する。第2の方法は、動きベクトルのヒストグラムの偏りによって縮小比率や探索中心点を決定するものである。図9、図10、図11は動きベクトルのヒストグラムの一例を示す図である。横軸は動きベクトルの成分に基づくヒストグラムの図9のようにある1つの位置に動きベクトルが集中している場合は、その動きベクトルから算出される位置を探索中心点とし、縮小比率を低く設定することで精度の高い探索を行うことができる。
また、図10に示すように広範囲に動きベクトルが分布している場合は、物体が様々な方向へ動いていると想定されるため、縮小比率を高く設定し広い範囲の動き探索を行うことで符号化効率を向上させることが考えられる。
また、図11に示すように2つの位置に動きベクトルが集中している場合等も考えられる。これはある動く被写体をカメラで追っているような場合に起こる。すなわち物体部分の動きベクトルと動いている背景部分の動きベクトルの2種である。この様な場合は2つの動きベクトルの中間点を探索中心点とし、2つのヒストグラムが指す動きベクトル点を包含するような縮小比率及び探索範囲を設定することで両者の動きを捉えることができる。
<第3の方法>
次に、第3の方法を説明する。第3の方法は、図8に示した手法に加えてヒストグラムを収集したピクチャの符号化結果を用いるものである。ヒストグラムを収集したピクチャ内のイントラブロックの数をINTRAnumとすると、INTRAnumが閾値THよりも多くなった場合、縮小比率を1段階大きくしてより広い範囲の動き探索を行う。ヒストグラムを収集したピクチャの符号化結果の中で画面内予測を用いたイントラブロックの比率が大きくなったということは、動きベクトルの信頼性が低いと考えられるため、当該ピクチャの符号化時は縮小比率を大きくして広く探索することで動きベクトルの信頼性を高める動作が考えられる。
図12は、図8に示す方法に加えてヒストグラムを収集したピクチャのイントラブロックの比率に応じて縮小比率を調整する手順を示すフローチャートである。図12においては、図8に示す処理と同じ処理に同じ符号を付けてある。まず、統計情報収集部203は、MV_hist×(Dpic−Dhist+1)を求め、MV_candに代入する(ステップS1)。そして、統計情報収集部203は、MV_cand<SR_1/2であるか否かを判定する(ステップS2)。この判定の結果、MV_cand<SR_1/2を満たせば、統計情報収集部203は、INTRAnum>THを満たすか否かを判定する(ステップS10)。この判定の結果、INTRAnum>THを満たさなければ、統計情報収集部203は、縮小比率を1/2とし、探索中心点を0とする(ステップS3)。一方、INTRAnum>THを満たせば、統計情報収集部203は、縮小比率を1/4とし、探索中心点を0とする(ステップS5)。
次に、MV_cand<SR_1/2を満たさなければ、統計情報収集部203は、MV_cand<SR_1/4であるか否かを判定する(ステップS4)。この判定の結果、MV_cand<SR_1/4を満たせば、統計情報収集部203は、INTRAnum>THを満たすか否かを判定する(ステップS11)。この判定の結果、INTRAnum>THを満たさなければ、統計情報収集部203は、縮小比率を1/4とし、探索中心点を0とする(ステップS5)。一方、INTRAnum>THを満たせば、統計情報収集部203は、縮小比率を1/8とし、探索中心点を0とする(ステップS7)。
次に、MV_cand<SR_1/4を満たさなければ、統計情報収集部203は、MV_cand<SR_1/8であるか否かを判定する(ステップS6)。この判定の結果、MV_cand<SR_1/8を満たせば、統計情報収集部203は、縮小比率を1/8とし、探索中心点を0とする(ステップS7)。
次に、MV_cand<SR_1/8を満たさなければ、統計情報収集部203は、SR_1/8−MV_candを求め、MV_moveに代入する(ステップS8)。そして、統計情報収集部203は、縮小比率を1/8とし、探索中心点をMV_moveとする(ステップS9)。
このように、過去の動きベクトルの統計情報や符号化情報等から入力映像信号のピクチャと復号映像信号の参照画像の縮小比率と探索中心点を適応的に設定することによって、物体の動きやカメラパンの動きを的確に捉えて精度の高い動き探索を行うことが可能となり、全体の符号化効率を向上させることができる。縮小画像を生成するための手法としては、画素を間引く手法や、画素の平均値を用いる手法、縮小フィルタを用いる手法等があるが、本実施形態では縮小画像生成方法は任意の手法が適用可能である。
以上説明したように、事前に行った動き探索処理で探索された動きベクトルの統計情報より物体の動き及びカメラパンの動き量を正確に検出し、当該ピクチャの動き探索中心点を適応的に設定することで、広い探索範囲を少ない演算量でカバーすることができる。また、探索処理よりも前段階で入力映像信号と復号映像信号の縮小比率と探索範囲を決定し探索を行うことで、当該符号化ブロックに対する探索演算量が均一になり、ハードウェア実装が可能になる。
前述した実施形態における映像符号化装置100をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。
動き探索処理に要する演算量が限られている映像符号化装置又は動き探索処理に要する演算量を均一にする必要のある映像符号化装置及び映像符号化プログラムに適用できる。
100・・・映像符号化装置、101・・・イントラ予測処理部、102・・・インター予測処理部、103・・・予測残差信号生成部、104・・・変換・量子化処理部、105・・・エントロピー符号化部、106・・・逆量子化・逆変換処理部、107・・・復号信号生成部、108・・・ループフィルタ処理部、201・・・縮小画像生成部、202・・・プレ探索処理部、203・・・統計情報収集部、204・・・第一モード判定部、205・・・整数画素探索処理部、206・・・第二モード判定部、207・・・少数画素探索処理部、208・・・少数画像生成部

Claims (5)

  1. 入力映像信号のピクチャの時間的相関を利用し、該ピクチャについて符号化ブロック単位に動き予測を行いその差分の符号化処理を行う映像符号化装置であって、
    過去に符号化を行ったピクチャの動きベクトルの統計情報を取得する統計情報収集手段と、
    前記統計情報に基づいて前記ピクチャの所定の探索領域についての動き探索処理に用いる縮小画像の縮小比率と探索中心点とを決定する縮小比率・探索中心決定手段と
    前記入力映像信号のピクチャと動き予測先の復号映像信号の参照画像を前記縮小比率で縮小する縮小手段と、
    縮小した前記入力映像信号のピクチャの符号化ブロックと復号映像信号の参照画像の探索領域とを用いて動き予測処理を行い、動きベクトルを決定するベクトル決定手段と、
    決定した前記動きベクトルを前記縮小比率に基づきスケーリングを行うスケーリング手段と
    を備え
    前記縮小比率・探索中心決定手段は、
    前記動きベクトルから算出される位置を探索中心点として決定するとともに、前記動きベクトルのヒストグラムの偏りが大きいほど前記縮小比率をより小さい値に決定し、前記動きベクトルのヒストグラムの偏りが小さいほど前記縮小比率をより大きな値に決定することを特徴とする映像符号化装置。
  2. 入力映像信号のピクチャの時間的相関を利用し、該ピクチャについて符号化ブロック単位に動き予測を行いその差分の符号化処理を行う映像符号化装置であって、
    過去に符号化を行ったピクチャの動きベクトルの統計情報を取得する統計情報収集手段と、
    前記統計情報に基づいて前記ピクチャの所定の探索領域についての動き探索処理に用いる縮小画像の縮小比率と探索中心点とを決定する縮小比率・探索中心決定手段と、
    前記入力映像信号のピクチャと動き予測先の復号映像信号の参照画像を前記縮小比率で縮小する縮小手段と、
    縮小した前記入力映像信号のピクチャの符号化ブロックと復号映像信号の参照画像の探索領域とを用いて動き予測処理を行い、動きベクトルを決定するベクトル決定手段と、
    決定した前記動きベクトルを前記縮小比率に基づきスケーリングを行うスケーリング手段と
    を備え、
    前記縮小比率・探索中心決定手段は、
    最も検出される確率が高い動きベクトルと、段階的な縮小比率それぞれの探索範囲とを比較し、前記動きベクトルが前記探索範囲内に収まるか否かに基づいて、前記縮小比率及び前記探索中心点を決定することを特徴とする映像符号化装置。
  3. 前記縮小比率・探索中心決定手段は、
    ヒストグラムを収集したピクチャ内のイントラブロックの数が所定に閾値より多い場合に、縮小比率を1段階大きくすることを特徴とする請求項に記載の映像符号化装置。
  4. 定された前記縮小比率に応じて、前記符号化ブロックの動き探索に要する演算量が一定になるように動き探索範囲を適応的に決定する探索範囲決定手段をさらに備えることを特徴とする請求項1から3のいずれか一項に記載の映像符号化装置。
  5. コンピュータを、請求項1からのいずれか1項に記載の映像符号化装置として機能させるための映像符号化プログラム。
JP2014162522A 2014-08-08 2014-08-08 映像符号化装置及び映像符号化プログラム Active JP5970507B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014162522A JP5970507B2 (ja) 2014-08-08 2014-08-08 映像符号化装置及び映像符号化プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014162522A JP5970507B2 (ja) 2014-08-08 2014-08-08 映像符号化装置及び映像符号化プログラム

Publications (2)

Publication Number Publication Date
JP2016039535A JP2016039535A (ja) 2016-03-22
JP5970507B2 true JP5970507B2 (ja) 2016-08-17

Family

ID=55530282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014162522A Active JP5970507B2 (ja) 2014-08-08 2014-08-08 映像符号化装置及び映像符号化プログラム

Country Status (1)

Country Link
JP (1) JP5970507B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6549516B2 (ja) * 2016-04-27 2019-07-24 日本電信電話株式会社 映像符号化装置、映像符号化方法及び映像符号化プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05328333A (ja) * 1992-05-15 1993-12-10 Toshiba Corp 動きベクトル検出装置
JP3226020B2 (ja) * 1997-05-28 2001-11-05 日本電気株式会社 動きベクトル検出装置
US7526028B2 (en) * 2003-07-25 2009-04-28 Taiwan Imaging-Tek Corp. Motion estimation method and apparatus for video data compression
JP4366571B2 (ja) * 2003-09-18 2009-11-18 日本電気株式会社 動画像符号化装置及び方法
KR101540138B1 (ko) * 2007-12-20 2015-07-28 퀄컴 인코포레이티드 적응적 조사영역을 갖는 모션추정 장치 및 방법

Also Published As

Publication number Publication date
JP2016039535A (ja) 2016-03-22

Similar Documents

Publication Publication Date Title
JP4047879B2 (ja) 動きベクトル検出装置および動きベクトル検出方法
Shen et al. Efficient intra mode selection for depth-map coding utilizing spatiotemporal, inter-component and inter-view correlations in 3D-HEVC
CN107852500B (zh) 运动矢量场编码方法和解码方法、编码和解码装置
JP2009147807A (ja) 画像処理装置
Santamaria et al. A comparison of block-matching motion estimation algorithms
US20150264357A1 (en) Method and system for encoding digital images, corresponding apparatus and computer program product
JP2012034225A (ja) 動きベクトル検出装置及び動きベクトル検出方法、コンピュータプログラム
JP2006523069A (ja) ビデオ符号器で適応動きベクトルの探索領域を決定する方法および装置
US20150062371A1 (en) Encoding apparatus and method
JP6435029B2 (ja) 映像符号化装置及び映像符号化プログラム
Lan et al. Exploiting non-local correlation via signal-dependent transform (SDT)
JP6339977B2 (ja) 映像符号化装置及び映像符号化プログラム
JP5970507B2 (ja) 映像符号化装置及び映像符号化プログラム
JP4874578B2 (ja) 画像符号化装置
JP6259272B2 (ja) 映像符号化装置及び映像符号化プログラム
JP2010258576A (ja) シーンチェンジ検出装置および映像記録装置
Bachu et al. Adaptive order search and tangent-weighted trade-off for motion estimation in H. 264
Fischer et al. Evaluation of video coding for machines without ground truth
US11528485B2 (en) Encoding apparatus and program
JP4537136B2 (ja) 動き推定方法及び動き推定装置、並びにプログラム
JP2007151062A (ja) 画像符号化装置、画像復号装置及び画像処理システム
Nang et al. Classifying Useful Motion Vectors for Efficient Frame Rate Up Conversion of MC-DCT Encoded Video Streams.
De Praeter et al. Moving object detection in the HEVC compressed domain for ultra-high-resolution interactive video
JP2015073192A (ja) 映像符号化装置及び映像符号化プログラム
JP5913911B2 (ja) 画像符号化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160412

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160705

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160711

R150 Certificate of patent or registration of utility model

Ref document number: 5970507

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150