JP2019149721A - 動画像符号化装置、動画像符号化装置の制御方法及びプログラム - Google Patents

動画像符号化装置、動画像符号化装置の制御方法及びプログラム Download PDF

Info

Publication number
JP2019149721A
JP2019149721A JP2018033676A JP2018033676A JP2019149721A JP 2019149721 A JP2019149721 A JP 2019149721A JP 2018033676 A JP2018033676 A JP 2018033676A JP 2018033676 A JP2018033676 A JP 2018033676A JP 2019149721 A JP2019149721 A JP 2019149721A
Authority
JP
Japan
Prior art keywords
moving image
block
region
motion information
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2018033676A
Other languages
English (en)
Inventor
翔悟 山崎
Shogo Yamazaki
翔悟 山崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018033676A priority Critical patent/JP2019149721A/ja
Priority to US16/285,466 priority patent/US20190268606A1/en
Publication of JP2019149721A publication Critical patent/JP2019149721A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Abstract

【課題】着目領域の誤検出を減らして、効率よくビットレートを削減する技術を提供する。【解決手段】動画像符号化装置であって、動画像から第1のサイズのブロック単位で第1の動き情報を検出する第1の検出部と、第1の動き情報に基づいて動画像から着目領域を判定する判定部と、着目領域であると判定されたブロックの量子化値を、着目領域ではないと判定されたブロックの量子化値よりも低い値に設定するように制御する制御部と、第1の動き情報に基づいて、動画像から第1のサイズよりも小さい第2のサイズのブロック単位で第2の動き情報を検出する第2の検出部と、第2の動き情報と、設定された量子化値とに基づいて、動画像を圧縮符号化する符号化部とを備える。【選択図】 図2

Description

本発明は、動画像符号化装置、動画像符号化装置の制御方法及びプログラムに関し、特に、動画像内の着目すべき領域である着目領域の画質を相対的に向上させ、その他の領域の符号量を抑える技術に関する。
動画像の伝送や蓄積再生を行うために、動画像信号の符号化技術が用いられる。そのような動画像の符号化技術としてはISO/IEC International Standard 14496−2(MPEG‐4 Visual)などの国際標準化符号化方式が知られている。また、他の国際標準符号化方式として ITU−TとISO/IECによる、H.264や、その後継規格であるH.265等が知られている。本明細書においては、ITU−T Rec. H.264 Advanced Video Coding | ISO/IEC International Standard 14496−10 (MPEG−4 AVC)を単にH.264と呼ぶ。また、H.265 (ISO/IEC 23008―2 HEVC)を単にH.265と呼ぶ。これらの技術はビデオカメラやレコーダ等の分野にも用いられており、特に近年では監視用ビデオカメラ(以下、監視カメラと呼ぶ)への適用が積極的に行われている。監視カメラ用途においては、長時間の録画を行う必要性から比較的低ビットレートで符号化して符号化データのサイズを抑えるケースが多い。しかし、低ビットレートで符号化することにより多くの情報が失われて画質が劣化するために、人物の顔の特定、自動車のナンバープレートの特定等本来の機能が損なわれることがある。そこでフレーム全体を一様には符号化せず、着目領域は画質を落とさないように符号化し、非着目領域は符号量を抑えるように符号化する技術が一般的に用いられている。例えば、動いている物体や人物など等着目すべき領域を着目領域として検出し、フレームを着目領域と非着目領域とに分けている。
特許文献1では、本来動画像の圧縮符号化に用いられる動きベクトルの発生に基づいて入力動画像の各ブロックが主要部分であるか否かを判定し、主要部分の画質を精細にするように圧縮率を制御する技術が開示されている。これにより、例えば監視カメラの動画像において人物の顔や動きを精細にとらえつつ、長時間録画のために全体を低ビットレートに記録することを可能にしている。
特開平6―30402号公報
しかしながら、従来技術では、符号化に使われる動きベクトルは実際の動き情報と必ずしも相関性があるわけではなく、センサノイズや揺らぎなど重要ではない画素の動きも着目すべき動きとして判定してしまうことがある。そのため、着目領域の誤検出が増えてしまうという課題がある。
本発明は、上記の課題に鑑みてなされたものであり、着目領域の誤検出を減らして、効率よくビットレートを削減する技術を提供することを目的とする。
上記の目的を達成する本発明に係る動画像符号化装置は、
動画像から第1のサイズのブロック単位で第1の動き情報を検出する第1の検出手段と、
前記第1の動き情報に基づいて前記動画像から着目領域を判定する判定手段と、
前記着目領域であると判定されたブロックの量子化値を、前記着目領域ではないと判定されたブロックの量子化値よりも低い値に設定するように制御する制御手段と、
前記第1の動き情報に基づいて、前記動画像から前記第1のサイズよりも小さい第2のサイズのブロック単位で第2の動き情報を検出する第2の検出手段と、
前記第2の動き情報と、前記制御手段により設定された量子化値とに基づいて、前記動画像を圧縮符号化する符号化手段と、
を備えることを特徴とする。
本発明によれば、着目領域の誤検出を減らすことで、効率よくビットレートを削減することができる。
本発明の一実施形態に係る動画像符号化装置の機能ブロック図。 本発明の一実施形態に係る動画像符号化装置が実施する処理の手順を示すフローチャート。 本発明の一実施形態に係る大ブロックの動き検出を行う範囲の例を示す図。 本発明の一実施形態に係る大ブロックの動き検出方法と出力される動きベクトルの例を示す図。 本発明の一実施形態に係る小ブロックの動き検出を行う範囲と出力される動きベクトルの例を示す図。 本発明の一実施形態に係る入力動画像の例を示す図。 本発明の一実施形態に係る小ブロックの動きベクトルを使った着目領域判定処理の例を示す図。 本発明の一実施形態に係る大ブロックの動きベクトルを使った着目領域判定処理の例を示す図。 本発明の一実施形態に係るSADを算出する際の下位ビットのマスク処理の例を示す図。 本発明の一実施形態に係る動画像符号化装置のハードウェア構成の一例を示す図。
以下、図面を参照しながら実施形態を説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
(第1実施形態)
本実施形態では、動画像から大ブロック単位で検出された動きベクトルに基づいて、これから符号化を行う動画像中の着目領域の位置を判定することで、誤検出を抑えて着目領域を推定する例を説明する。なお、着目領域は、ROI(Region of interest )とも呼ばれる領域であり、監視の際などに着目すべき領域である。例えば、着目領域は、映像解析を行う認識部や動体検出部によって、検出された物体に対応する領域である。また、ユーザによって任意の位置を着目領域として指定するようにしてもよい。
<装置構成>
図1は、本実施形態に係る動画像符号化装置の機能ブロック図である。動画像符号化装置10はフレーム単位の入力動画像(撮像動画像)を圧縮・符号化し、H.265形式の符号化ストリームを出力する。なお、本実施形態では出力するストリームをH.265形式とするが、本発明はこれに限定されるものではない。例えばH.264形式やMPEG−4形式の符号化ストリームであってもよい。動画像符号化装置10は、符号化対象となる撮像動画像をH.265形式におけるCoding Tree Unit(以下CTU)単位に圧縮・符号化を行う。なお、本実施形態ではCTU単位に動画像を分割するが、本発明はこれに限定されるものではなく、例えばH.264におけるマクロブロック単位に分割してもよい。また、本実施形態ではCTUのサイズを64×64とするが、本発明はこれに限定されるものではなく、32×32や16×16であってもよい。さらに、動画像符号化装置10は、CTU単位に画質を調整するための画質パラメータ(量子化値)を設定することで、動画像内の非着目領域に対しては符号量を抑えるように符号化し、着目領域に対しては画質を落とさないように符号化する。量子化値とは、量子化パラメータとも呼ばれ、量子化ステップを規定するものである。一例として、量子化値とは、その値が小さいほど、量子化ステップが小さくなり、その結果、高画質となる値である。
本実施形態に係る動画像符号化装置10は、大ブロック動き検出部101と、小ブロック動き検出部102と、符号化部103と、着目領域判定部104と、領域別画質制御部105とを備えている。
大ブロック動き検出部101は、撮像動画像においてCTU単位で動き探索を行い、1画素単位の精度の動きベクトルを算出する。本実施形態ではCTU単位に動き探索を行うが、本発明はこれに限定されるものではなく、CTUより大きなサイズで探索してもよいし、マクロブロック単位に探索してもよい。本実施形態では算出される動きベクトルを1画素単位としたが、本発明はこれに限定されるものではなく、算出される動きベクトルの単位は、1画素より小さくても1画素より大きくてもよい。1画素より小さい場合は少数精度の動きベクトルとなる。大ブロック動き検出部101で算出された動きベクトルは、小ブロック動き検出部102と着目領域判定部104とに出力される。
小ブロック動き検出部102は、大ブロック動き検出部101で算出された動きベクトルに基づいて、更に小さなブロック単位で動きベクトルを算出する。そして、これに基づいてCTUをH.265形式におけるPrediction Unit(以下、PU)に分割する。小ブロック動き検出部102により算出された動きベクトルは符号化部103に出力される。
符号化部103は、小ブロック動き検出部102から出力された動きベクトルと、後述する着目領域判定部104から出力された量子化値とに基づいて、動き補償、量子化、エントロピー符号化を行い、H.265形式の符号化ストリームを出力する。
着目領域判定部104は、大ブロック動き検出部101から出力された動きベクトルに基づいて撮像動画像内で着目すべき領域を判定し、着目領域判定情報を出力する。本実施形態では、動きベクトルの大きさが0でなかった場合はそのブロックを着目領域として判定する。
領域別画質制御部105は、着目領域判定部104から出力された着目領域判定情報に基づいて、符号化するブロックが着目領域と判定された場合、当該ブロックの量子化値を、着目領域でないと判定されたブロックよりも高画質になるように設定する。また、一方、符号化するブロックが着目領域ではないと判定された場合、当該ブロックの量子化値を、着目領域であると判定されたブロックよりも低画質になるように設定する。
ここで、図10を参照して、第1実施形態に係る動画像符号化装置のハードウェア構成の一例を説明する。動画像符号化装置10は、CPU1001、ROM1002、RAM1003、記憶装置1004、バス1005を備え、入力装置1006及び表示装置1007と接続されている。
CPU1001は、本実施形態に係る動画像符号化装置10の上述の機能ブロックによる各種動作を制御する。その制御内容は、後述するROM1002やRAM1003上のプログラムによって指示される。また、CPU1001は、複数の計算機プログラムを並列に動作させることもできる。ROM1002は、CPU1001による制御の手順を記憶させた計算機プログラムやデータを格納している。RAM1003は、CPU1001が処理するための制御プログラムを格納するとともに、CPU1001が各種制御を実行する際の様々なデータの作業領域を提供する。ROM1002やRAM1003などの記録媒体に格納されたプログラムコードの機能は、CPU1001が読み出して実行することによって実現されるが、記録媒体の種類は問われない。
記憶装置1004は、さまざまなデータ等を記憶することができる。記憶装置1004は、ハードディスクやフロッピーディスク、光ディスク、磁気ディスク、光磁気ディスク、磁気テープ、不揮発性のメモリカード等の記録媒体と、当該記録媒体を駆動して情報を記録するドライブとを有する。保管された計算機プログラムやデータはキーボード等の指示や、各種計算機プログラムの指示により、必要な時にRAM1003上に呼び出される。
バス1005は、各構成要素と接続されているデータバスなどであり、各構成要素間の通信を実現し、情報のやり取りを高速に実現するためのものである。入力装置1006は、ユーザによる各種入力環境を提供する。各種入力操作環境を提供するものとして、キーボードやマウス等が考えられるが、タッチパネル、スタイラスペン等であってもよい。表示装置1007は、LEDディスプレイなどで構成され、各種入力操作の状態やそれに応じた計算結果などをユーザに対して表示する。なお、以上述べてきた構成は一例であり、説明した構成に限定されるものでない。
<処理>
次に、図2のフローチャートを参照して、本実施形態に係る動画像符号化装置が実施する処理の手順を説明する。
ステップS201において、大ブロック動き検出部101は、CTU単位(第1のサイズのブロック単位)で動き探索を行い、1画素単位精度(整数精度)の動き情報(第1の動きベクトル)を算出する。また、算出結果を小ブロック動き検出部102及び着目領域判定部104へ出力する。
ステップS202において、着目領域判定部104は、大ブロック動き検出部101から出力された動き情報(第1の動きベクトル)に基づいて撮像動画像内で着目すべき領域を判定する。本実施形態では、第1の動きベクトルの大きさがゼロでなかった場合、符号化するブロックを着目領域として判定し、ステップS204へ進む。一方、第1の動きベクトルの大きさがゼロである場合、符号化するブロックを非着目領域として判定し、ステップS204へ進む。但し、本発明はこれに限定されるものではない。例えば、第1の動きベクトルの大きさがあらかじめ設定された閾値を超過する場合にそのブロックを着目領域として判定してもよい。
ステップS203において、領域別画質制御部105は、着目領域判定部104により着目領域であると判定されているブロックについて、着目領域でないと判定されたブロックよりも高画質になるように量子化値を低い値に設定する。また、領域別画質制御部105は、設定した量子化値を符号化部103へ出力する。
ステップS204において、小ブロック動き検出部102は、大ブロック動き検出部101で算出された動き情報(第1の動きベクトル)に基づいて、更に小さなブロック単位(第1のサイズよりも小さい第2のサイズのブロック単位)で動き探索を行う。そして、少数精度の動き情報(第2の動きベクトル)を算出する。また、小ブロック動き検出部102は、算出した第2の動きベクトルを符号化部103へ出力する。なお、第1の動きベクトルの大きさが0である場合(S202;Yes)、符号化するブロックは非着目領域として判定されるので、量子化値の変更は行われないままステップS204の処理が実行される。
ステップS205において、符号化部103は、小ブロック動き検出部102から出力された第2の動きベクトルと、領域別画質制御部105から出力された量子化値とに基づいて、動き補償、量子化、エントロピー符号化を行う。そして、H.265形式の符号化ストリームを出力する。なお、第1の動きベクトルの大きさが0である場合(S202;Yes)、符号化するブロックは非着目領域として判定されるので、量子化値の変更は行われず、所定の量子化値が領域別画質制御部105から符号化部103へ出力されている。以上で図2の一連の処理が終了する。
なお、本実施形態では、大ブロック動き検出部101が整数精度の第1の動きベクトルを算出し、小ブロック動き検出部102が少数精度の第2の動きベクトルを算出する例を説明したが、本発明はこれに限定されない。大ブロックのサイズ(第1のサイズ)が小ブロックのサイズ(第2のサイズ)よりも大きければどのような精度の動きベクトルを算出してもよい。
<動き検出処理>
続いて、本実施形態における大ブロックの動き検出の処理と、小ブロックの動き検出の処理とについて詳細に説明する。図3は、ある動画像のフレームを表しており、点線で囲まれた範囲301が大ブロック(本実施形態ではCTU302)の動き検出を行う範囲である。この点線の内側にあるCTU302よりも更に小さなブロックは動き予測の最小単位であり(以下、小ブロック)、小ブロックの動き検出処理は小ブロック単位で行われる。本実施形態の小ブロックのサイズは8×8であるものとするが、本発明はこれに限定されるもではなく、例えば16×16や4×4であってもよい。
まず、大ブロックの動き検出の処理を説明する。符号化する対象のフレームのCTU302に類似しているブロックを、参照する他のフレームの点線で囲まれた範囲から探す。なお、本実施形態では、CTUサイズで探索を行っているが、本発明はこれに限定されるものではない。例えば、フレームの解像度や画素の空間周波数によって大ブロックのサイズを決定してもよい。この時、図4に示すようにCTU401を大ブロックの動き検出を行う範囲の中で移動させながら順番に画素値を比較し、CTUと同じブロックサイズ毎に絶対値誤差和を意味するSum of Absolute Difference(SAD)を算出する。SADは以下の式で定義される。
Figure 2019149721
Diff(x、y)は動画像内の画素の座標(x、y)における、符号化する対象のフレームの画素値と参照する他のフレームの画素値との差を示している。図中、例えばブロック402〜406について、それぞれ対応する動きベクトル407〜410が求まる。SADが最小となるブロックの位置を特定した結果、それがブロック404である場合、ブロック404を類似ブロックとする。そして、現在のCTUと類似ブロックとの座標の関係の情報が、大ブロック動き検出部101が出力する動きベクトル409(第1の動きベクトル)となる。すなわち、大ブロック動き検出部101は、動画像を構成する第1フレームの第1のサイズのブロックに類似する第2フレームのブロックを検出し、ブロック間の第1の動きベクトルを動き情報として検出している。
なお、本実施形態ではSADを用いて大ブロックの動きベクトルを算出する例を説明したが、本発明はこれに限定されるものではない。例えばSADに加えて動きベクトルのビット量を加味したコストを用いて動きベクトルを算出してもよい。
続いて、図5を参照して、小ブロックの動き検出処理について説明する。現在のCTU501において、大ブロック動き検出部101が出力した動きベクトル502に基づいて、点線の範囲503内(大ブロック動き検出部101が出力した動きベクトルが指す座標から±X画素)で、小ブロック(例えば504)の動き検出を行う。小ブロックの動き検出では、この点線の範囲503内の小ブロック単位で第2の動きベクトル(例えば動きベクトル504)を算出する。すなわち、大ブロック動き検出部101が出力した動きベクトルにより示される座標から所定範囲に対して、第1フレームにおける第1のサイズのブロックを分割した第2のサイズのブロックに類似する第2フレームのブロックを検出する。そして、ブロック間の動きベクトルを動き情報として検出する。
なお、大ブロックと同様に、フレームの解像度や画素の空間周波数によって小ブロックのサイズを決定してもよい。小ブロックの動き検出は、探索範囲の中で移動させながら順番に画素値を比較し、動きベクトル毎にSADを算出する。次に、周囲の8×8ブロックの動きベクトルと、動きベクトルのビット量、SADを加味した上で、最小のコストとなるようにPU(Prediction Unit)のサイズ及びそのPUの動きベクトルを決定する。決定された動きベクトルは、小ブロック動き検出部102から出力される。なお、小ブロック動き検出部102から出力される動きベクトルは小数精度である。
このように、まず大ブロックで広い範囲の動き探索を行い、続いて小ブロックで狭い範囲の動き探索を行うことで、動き探索にかかる処理時間を抑制することができる。更に、処理を分割することで、パイプライン化が容易になり、スループットの向上に繋がるという効果がある。
本実施形態では、大ブロック動き検出部101から出力される動きベクトルを用いて着目領域を判定しているが、以下では、動きベクトルを探索する際のブロックサイズを大きくすることで着目領域の誤検出が減少する理由を説明する。
まず、小ブロックの動きベクトルに基づいて着目領域の判定を行う場合について説明する。図6の画像601と画像と602の間には時間的相関があり、上の動画像の1フレーム後に下の動画像が撮像されたものとする。画像601には自動車603が含まれ、画像602には自動車604が含まれている。
また、図7の画像701は図6の画像602に対応しており、現在符号化を行うフレームで、小ブロック702についてこれから符号化が行われる。
画像703及び画像701を含む動画像内の自動車は右から左へ移動しており、動きベクトルが発生するため、着目領域判定部104により着目領域として判定される。しかし、小ブロック702が属するCTUでは大ブロックの動きベクトルが(0,0)であったとする。この後、小ブロックによる詳細な動き探索が行われる。画像703の小ブロック704と小ブロック705とが類似ブロックの候補となった場合、SADの小さい小ブロック705が類似ブロックとして選ばれる(ここでは小ブロック704のSADは50、小ブロック705のSADは20である)。すると、小ブロックの動きベクトル706が発生する。動きを探索するブロックが小さいと、センサノイズの影響で画素値が変わってしまう影響を受けやすいからである。その結果、画像707に示す通り、得られた小ブロックの動きベクトル706を用いて着目領域/非着目領域708が判別され、本来は必要のない無駄な着目領域が多くなり、着目領域の誤検出に繋がりやすくなる。
画像707は、CTU単位で量子化値を設定する例を示しており、小ブロック動きベクトルがCTU内に一つでも発生するとそのブロックを着目領域と判定している。なお、CTU内にどの程度の割合で着目領域の小ブロックが発生したかに応じて判定を行ってもよい。
画像709は、小ブロックごとに着目領域の判定を行う例を示している。CTU内の小ブロック動きベクトルの有無、PUサイズに従って着目領域を判定している。画像707では省略したが、PU710に加えてPU711−713のように小ブロックの動きベクトルが発生したとすると、画像709のように着目領域を判別する大きさを小さくしても、ノイズの影響により本来は必要のない無駄な着目領域が発生してしまう。PU711は32×32、713は16×16、CTUと同じ大きさのPUは64×64の画素サイズにPUが決定された例を示している。
これに対して、本実施形態では、大ブロックの動きベクトルに基づいて重要用域の判定を行っている。大きなブロックを用いて動きベクトル探索を行い、得られた動きベクトルを用いて着目領域と非着目領域とが判定される動画像の処理の例を図8に示す。
図8の画像801は図6の画像602に対応しており、現在符号化を行うフレームであって、CTU802についてこれから符号化が行われる。画像801及び画像803のフレーム内で類似ブロックを探索する。探索ブロックのサイズが大きくなったことにより、ノイズによってそれぞれの画素が変動しても、比較する画素が多くなる。
画像803の大ブロック804と大ブロック805とが類似ブロックの候補となった場合、SADの小さい大ブロック804が類似ブロックとして選ばれる(ここでは大ブロック804のSADは500、大ブロック805のSADは1000である)。
このように、符号化を行うCUTと異なる座標に、類似するブロックが存在する可能性は低くなる。即ち、動いている物体が存在しない領域で、センサノイズによって類似ブロックと判定されてしまうブロックの数が減少することになる。その結果、画像807のCTU808のように動きベクトルが発生しにくくなるため、画像807のように本来必要のない無駄な着目領域が抽出されることを低減することができる。
以上説明したように、本実施形態に係る動画像符号化装置10は、動画像から第1のサイズのブロック単位(大ブロック単位)で第1の動き情報(動きベクトル)を検出する第1の検出部(大ブロック動き検出部101)と、第1の動き情報に基づいて動画像から着目領域を判定する判定部(着目領域判定部104)と、着目領域であると判定されたブロックの量子化値を、着目領域ではないと判定されたブロックの量子化値よりも低い値に設定するように制御する制御部(領域別画質制御部105)と、第1の動き情報に基づいて、動画像から第1のサイズよりも小さい第2のサイズのブロック単位(小ブロック単位)で第2の動き情報(動きベクトル)を検出する第2の検出部(小ブロック動き検出部102)と、第2の動き情報と、制御部により設定された量子化値とに基づいて、前記動画像を圧縮符号化する符号化部(符号化部103)とを備える。
本実施形態によれば、大ブロック単位で検出された動きベクトルに基づいて、これから符号化を行う撮像動画像中の着目領域の位置を判定することで、誤検出を抑えて着目領域を推定することができる。そのため、着目領域となるべき場所を適切に高画質にすることが可能となる。また、符号化の動き補償の際に符号化される動きベクトルと、着目領域を判定するために使用する動きベクトルとは異なるものであるが、途中まで処理を共通化させることにより、回路規模の削減や省電力化が期待できる。さらに、推定に使用する動きベクトルは符号化する撮像動画と同じフレームのものを利用することができ、追加のバッファメモリを必要としないという効果も奏する。
このように、本実施形態によれば、センサノイズや揺らぎ等に起因する重要でない動き情報により着目領域として誤判定してしまう可能性を低減でき、高画質となるべき領域の画質を保ちながら効率よくビットレートを削減することができる。
(第2実施形態)
第1実施形態では、大ブロック動き検出部101から出力された動きベクトルに基づいて撮像動画像内の着目領域を判定することで、着目領域の誤検出を低減する例を説明した。
しかし、符号化部に入力される動画像がセンサノイズを多く含む動画である場合、動き予測を行う際に、動きのないCTUでも動きベクトルを探索する範囲内で類似するCTUが発見され、大ブロックの動きベクトルが発生してしまうことがある。そのようにして大ブロックの動きベクトルが発生すると、着目領域判定部104により着目領域と誤判定され、領域別画質制御部105により高画質になるように設定が行われる。よって、不必要な領域を高画質化してしまい、ビットレートの増大を引き起こしてしまうことがある。
これに対して、本実施形態では、大ブロック動き検出部101により下位ビットのマスク処理を実施し、所定の上位ビットの画素値で類似ブロックの検出を行う例を説明する。
なお、本実施形態に係る動画像符号化装置の構成は、第1実施形態と同様であるため、詳細な説明は省略する。また、動画像符号化装置が備える大ブロック動き検出部101の処理内容が異なる以外は、各処理部の処理内容も第1実施形態と同様であるため、詳細な説明は省略する。
大ブロック動き検出部101による動き探索では、既に図4に示したように、探索範囲で画素値を比較していき、類似しているブロックを発見する処理が行われる。ここで、本実施形態に係る大ブロック動き検出部101は、図9に示すような、参照するフレームの8×8ブロック901の画素902と、符号化を行う対象のフレームの8×8ブロック903の画素904との画素値を比較する。画素902の画素値が11110110であり、画素904の画素値が11111110だったとする。画素値8ビットの内、所定ビット(例えば下位4ビット)をマスクする処理を行うことにより、所定ビット(例えば上位4ビット)のみの比較が行われることになる。
この場合、0から15の差異を無視できることになるため、よりセンサノイズへの耐性を強くすることができる。なお、本実施形態では下位4ビットを比較する例を説明しているが、本発明はこの限りではない。上記の処理を施した結果、参照するフレームの8×8ブロック905の画素906の画素値は11110000となり、符号化を行う対象のフレームの8×8ブロック907の画素908の画素値も11110000となり、両者の画素値が一致する。
以上説明したように、本実施形態では、大ブロック動き検出部101により、動画像を構成する第1フレームの第1のサイズのブロックに類似する第2フレームのブロックを検出する際に、画素値の所定の上位ビット同士で画素値同士の比較を行って検出を行う。このように、下位ビットのマスク処理を実施することで、所定の上位ビットの画素値のみの比較が行われることから、よりセンサノイズへの耐性を強くすることができる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
10:動画像符号化装置、101:大ブロック動き検出部、102:小ブロック動き検出部、103:符号化部、104:着目領域判定部、105:領域別画質制御部105

Claims (11)

  1. 動画像から第1のサイズのブロック単位で第1の動き情報を検出する第1の検出手段と、
    前記第1の動き情報に基づいて前記動画像から着目領域を判定する判定手段と、
    前記着目領域であると判定されたブロックの量子化値を、前記着目領域ではないと判定されたブロックの量子化値よりも低い値に設定するように制御する制御手段と、
    前記第1の動き情報に基づいて、前記動画像から前記第1のサイズよりも小さい第2のサイズのブロック単位で第2の動き情報を検出する第2の検出手段と、
    前記第2の動き情報と、前記制御手段により設定された量子化値とに基づいて、前記動画像を圧縮符号化する符号化手段と、
    を備えることを特徴とする動画像符号化装置。
  2. 前記第1の検出手段は、前記第1の動き情報として、整数の精度の第1の動きベクトルを算出することを特徴とする請求項1に記載の動画像符号化装置。
  3. 前記第2の検出手段は、前記第2の動き情報として、小数の精度の第2の動きベクトルを算出することを特徴とする請求項1又は2に記載の動画像符号化装置。
  4. 前記第1の検出手段は、前記動画像を構成する第1フレームの前記第1のサイズのブロックに類似する第2フレームのブロックを検出し、ブロック間の第1の動きベクトルを前記第1の動き情報として検出することを特徴とする請求項1乃至3の何れか1項に記載の動画像符号化装置。
  5. 前記第2の検出手段は、前記第1の動きベクトルにより示される座標から所定範囲に対して、前記第1フレームにおける前記第1のサイズのブロックを分割した前記第2のサイズのブロックに類似する前記第2フレームのブロックを検出し、ブロック間の第2の動きベクトルを前記第2の動き情報として検出することを特徴とする請求項4に記載の動画像符号化装置。
  6. 前記判定手段は、前記第1の動きベクトルの大きさが閾値を超過する場合に、前記第1の検出手段により検出された前記ブロックを前記着目領域として判定することを特徴とする請求項4又は5に記載の動画像符号化装置。
  7. 前記閾値はゼロであることを特徴とする請求項6に記載の動画像符号化装置。
  8. 前記第1の検出手段は、前記動画像を構成する第1フレームの前記第1のサイズのブロックに類似する第2フレームのブロックを検出する際に、画素値の所定の上位ビット同士で画素値同士の比較を行って検出を行うことを特徴とする請求項1乃至7の何れか1項に記載の動画像符号化装置。
  9. 前記第1のサイズ及び前記第2のサイズは、前記動画像の画素の空間周波数に基づいて決定されることを特徴とする請求項1乃至8の何れか1項に記載の動画像符号化装置。
  10. 動画像符号化装置の制御方法であって、
    第1の検出手段が、動画像から第1のサイズのブロック単位で第1の動き情報を検出する工程と、
    判定手段が、前記第1の動き情報に基づいて前記動画像から着目領域を判定する工程と、
    制御手段が、前記着目領域であると判定されたブロックの量子化値を、前記着目領域ではないと判定されたブロックの量子化値よりも低い値に設定するように制御する工程と、
    第2の検出手段が、前記第1の動き情報に基づいて、前記動画像から前記第1のサイズよりも小さい第2のサイズのブロック単位で第2の動き情報を検出する工程と、
    符号化手段が、前記第2の動き情報と、前記設定された量子化値とに基づいて、前記動画像を圧縮符号化する工程と、
    を有することを特徴とする動画像符号化装置の制御方法。
  11. 請求項1乃至9の何れか1項に記載の動画像符号化装置の各手段としてコンピュータを動作させるためのプログラム。
JP2018033676A 2018-02-27 2018-02-27 動画像符号化装置、動画像符号化装置の制御方法及びプログラム Withdrawn JP2019149721A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018033676A JP2019149721A (ja) 2018-02-27 2018-02-27 動画像符号化装置、動画像符号化装置の制御方法及びプログラム
US16/285,466 US20190268606A1 (en) 2018-02-27 2019-02-26 Moving image encoding apparatus, control method for moving image encoding apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018033676A JP2019149721A (ja) 2018-02-27 2018-02-27 動画像符号化装置、動画像符号化装置の制御方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2019149721A true JP2019149721A (ja) 2019-09-05

Family

ID=67686209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018033676A Withdrawn JP2019149721A (ja) 2018-02-27 2018-02-27 動画像符号化装置、動画像符号化装置の制御方法及びプログラム

Country Status (2)

Country Link
US (1) US20190268606A1 (ja)
JP (1) JP2019149721A (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3611507B2 (ja) * 2000-05-30 2005-01-19 松下電器産業株式会社 動きベクトル検出装置
JP2008072608A (ja) * 2006-09-15 2008-03-27 Oki Electric Ind Co Ltd 画像符号化装置及び画像符号化方法
JP5026092B2 (ja) * 2007-01-12 2012-09-12 三菱電機株式会社 動画像復号装置および動画像復号方法

Also Published As

Publication number Publication date
US20190268606A1 (en) 2019-08-29

Similar Documents

Publication Publication Date Title
CN112534818B (zh) 使用运动和对象检测的用于视频编码的译码参数的基于机器学习的自适应
AU2020207860B2 (en) Image encoding method and apparatus, and image decoding method and apparatus
KR101054543B1 (ko) 영상 코딩에서의 인터 예측을 위한 모드 선택
US8204127B2 (en) Method and apparatus for encoding and decoding image by using multiple reference-based motion prediction
KR100739790B1 (ko) 인트라 예측 모드 결정 방법 및 장치
JP5216710B2 (ja) 復号化処理方法
JP4195057B2 (ja) 適応動きベクトルの探索領域を決定する方法、および適応動きベクトルの探索領域を決定する画像圧縮装置。
JP2013532926A (ja) 複数のプロセッサを使用してビデオフレームを符号化するための方法およびシステム
US9712828B2 (en) Foreground motion detection in compressed video data
US10034016B2 (en) Coding apparatus, computer system, coding method, and computer product
KR20210094664A (ko) 비디오 인코딩/디코딩 시스템의 사이드 모션 정교화
JP5748225B2 (ja) 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
JP7072401B2 (ja) 動画像符号化装置、動画像符号化装置の制御方法及びプログラム
US11164328B2 (en) Object region detection method, object region detection apparatus, and non-transitory computer-readable medium thereof
JP2010258576A (ja) シーンチェンジ検出装置および映像記録装置
JP3812808B2 (ja) スキップ領域検出型動画像符号化装置および記録媒体
JP2019149721A (ja) 動画像符号化装置、動画像符号化装置の制御方法及びプログラム
KR102345258B1 (ko) 객체영역 검출방법, 장치 및 이에 대한 컴퓨터 프로그램
JP4537136B2 (ja) 動き推定方法及び動き推定装置、並びにプログラム
US6788741B1 (en) Device and method of retrieving high-speed motion
Fan et al. Spatiotemporal segmentation based on two-dimensional spatiotemporal entropic thresholding
JP2021013145A (ja) 動画像伝送装置、動画像伝送方法
KR20040027047A (ko) 예측 스캐닝을 이용한 영상 부호화/복호화 방법 및 장치
KR101319916B1 (ko) 움직임 추정방법 및 장치, 및 이를 이용한 영상 부호화방법및 장치
JP2014022787A (ja) 画像符号化装置、画像符号化方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210203

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20211013