JP6373033B2 - 符号化装置及び符号化方法 - Google Patents

符号化装置及び符号化方法 Download PDF

Info

Publication number
JP6373033B2
JP6373033B2 JP2014069856A JP2014069856A JP6373033B2 JP 6373033 B2 JP6373033 B2 JP 6373033B2 JP 2014069856 A JP2014069856 A JP 2014069856A JP 2014069856 A JP2014069856 A JP 2014069856A JP 6373033 B2 JP6373033 B2 JP 6373033B2
Authority
JP
Japan
Prior art keywords
picture
block
quantization parameter
encoding
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014069856A
Other languages
English (en)
Other versions
JP2015192403A (ja
Inventor
大川 浩司
浩司 大川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014069856A priority Critical patent/JP6373033B2/ja
Priority to US14/670,229 priority patent/US9832469B2/en
Publication of JP2015192403A publication Critical patent/JP2015192403A/ja
Application granted granted Critical
Publication of JP6373033B2 publication Critical patent/JP6373033B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は符号化装置及び符号化方法に関し、特に、ピクチャ内の量子化パラメータを適応的に制御するために用いて好適な技術に関する。
動画像の圧縮記録に用いられる符号化方式として、H.264/MPEG−4 AVC(以下H.264)が知られている(非特許文献1)。また、H.264の後継としてさらに高効率な符号化方式として、H.265 High Efficiency Video Coding符号化方式(以下、HEVC)の標準化に関する提案が行われた(非特許文献2)。
H.264やHEVCにおいては、ピクチャ毎にピクチャタイプを切り替えて符号化することができる。ピクチャタイプには、ピクチャ内の情報のみを用いて符号化を行うイントラピクチャ(以下、Iピクチャ)と、ピクチャ内の情報に加えて他のピクチャ(以下、参照ピクチャ)の情報を用いて符号化を行うインターピクチャがある。
インターピクチャは、更に、再生順で前のピクチャの情報のみを用いて符号化を行うPピクチャと、再生順で後のピクチャの情報も用いて符号化を行うBピクチャの二種類のピクチャタイプがある。インターピクチャは、ピクチャ内でブロック毎にブロックタイプを適応的に切り替えて符号化することができる。ブロックタイプには、参照ピクチャの情報を用いて符号化を行うインターブロックと、ピクチャ内の情報を用いて符号化を行うイントラブロックがある。
インターピクチャは、参照ピクチャの情報を用いて符号化できるため、Iピクチャに比べてデータの圧縮効率が優れている。
一方、Iピクチャは、ピクチャ内の情報のみで符号化されているため、動画像の先頭のピクチャからだけでなく、任意のIピクチャから再生したり、編集して切り出したりといった処理を行うランダムアクセスが可能となる。
エンコーダは、前述したピクチャタイプ毎に符号量を割当てて符号化することが一般的である。インターピクチャは、参照ピクチャを用いて符号化されるため、Iピクチャにより多くの符号量を割り当てて画質を向上させることで、Iピクチャを参照ピクチャとする後続のインターピクチャの画質も向上させることが可能となる。該後続のインターピクチャの画質が向上することで、それを参照ピクチャとする後続のインターピクチャの画質も向上する。
しかし、動きが非常に激しい動画像においては、参照ピクチャと符号化対象のピクチャの差分が大きくなるため、Iピクチャの画質を向上させることによる後続のピクチャの画質向上の効果は限定的である。それにも関わらず、Iピクチャに非常に大きい符号量を割当ててしまうと、後続のインターピクチャに割り当てる符号量が減少するため、後続のピクチャの画質を劣化させてしまう。
前述の課題を解決する手法として、例えば特許文献1が挙げられる。特許文献1では、ピクチャタイプ毎の複雑度を算出し、複雑度に応じて各ピクチャタイプに割り当てる符号量を適応的に制御している。動きの少ない映像では、インターピクチャの複雑度がIピクチャに比べて相対的に小さくなるため、Iピクチャに多くの符号量を割当てている。
米国特許第6982762号明細書
ITU−T H.264 (03/2010) Advanced video coding for generic audiovisual services ITU−T H.265 (04/2013) High efficiency video coding
しかしながら、特許文献1に示した技術は、インターピクチャ内のブロックタイプを考慮していない。インターブロックの画質は参照ピクチャの画質を引き継ぐため、参照ピクチャの画質が高い程高くなるが、イントラブロックはピクチャ内の情報を用いて符号化されるため参照ピクチャの画質を引き継がない。
そのため、Iピクチャに多くの符号量を割当てたことによる画質向上の効果は、インターピクチャ内のインターブロックでは引き継がれるものの、イントラブロックでは失われて画質が劣化してしまう。
インターピクチャ内のイントラブロックの画質が劣化してしまうと、そのインターピクチャを参照ピクチャとするインターピクチャも、画質が劣化したイントラブロックを参照するため画質が劣化してしまう問題点があった。
本発明は前述の問題点に鑑み、イントラピクチャに多くの符号量を割当てたことによる画質向上の効果が、インターピクチャ内のイントラブロックで失われて画質が劣化してしまう不都合を防止できるようにすることを目的とする。
本発明の符号化装置は、入力されたピクチャを符号化する符号化装置であって、前記入力されたピクチャのピクチャタイプが、イントラピクチャもしくはインターピクチャのどちらのピクチャであるかを決定するピクチャタイプ決定手段と、前記ピクチャタイプ毎の符号化難易度を算出する難易度算出手段と、前記難易度算出手段により算出された符号化難易度に基づいて、前記ピクチャタイプ毎の目標符号量を決定する目標符号量決定手段と、前記目標符号量決定手段により決定された目標符号量から、各ピクチャの基準量子化パラメータを決定する基準量子化パラメータ決定手段と、前記インターピクチャの各ブロックのブロックタイプを決定するブロックタイプ制御手段と、前記基準量子化パラメータ及び前記ブロックタイプに基づいて、前記ピクチャの各ブロックの量子化パラメータであるブロック量子化パラメータを制御するブロック量子化パラメータ制御手段と、前記ブロックを前記ブロック量子化パラメータに基づいて量子化する量子化手段と、を有し、前記ブロック量子化パラメータ制御手段は、前記イントラピクチャの基準量子化パラメータと、前記インターピクチャの基準量子化パラメータの差分の大きさに基づいて、前記インターピクチャのブロック量子化パラメータを制御することを特徴とする。
本発明によれば、インターピクチャ内のイントラブロックに割り当てる符号量を適応的に制御することで、イントラブロックを高画質に符号化し、イントラピクチャに多くの符号量を割当てた高画質化効果を継続させることができる。
第1の実施形態における符号化装置の構成例を示すブロック図である。 本発明の実施形態におけるピクチャ符号化のフローチャートである。 第1の実施形態における基準量子化パラメータ計算の手順を説明するフローチャートである。 第1の実施形態におけるブロック符号化の手順の一例を示すフローチャートである。 第1の実施形態における量子化調整値QDと符号量調整係数αの関係を示す図である。 第2の実施形態における符号化装置の構成例を示すブロック図である。 第2の実施形態におけるブロック符号化の手順の一例を示すフローチャートである。
以下、添付の図面を参照して、本願発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。また、以下の実施形態は、ブロックのサイズとして水平16画素、垂直16画素を使用して符号化するH.264で符号化を行う例について述べる。しかし本発明はH.264に限定されず、ブロックのサイズとして最大で水平64画素、垂直64画素を使用することが可能なHEVCで符号化を行う場合も容易に適用することが可能である。
[第1の実施形態]
以下、本発明の第1の実施形態を、図面を用いて説明する。
図1は、本実施形態の符号化装置100の構成例を示すブロック図である。
図1において、101は、ピクチャタイプ決定部であり、入力されたピクチャのピクチャタイプ(イントラピクチャもしくはインターピクチャ)を決定する。
102は、符号量制御部であり、入力されたピクチャの目標符号量を決定する。符号量制御部102は、後述する難易度算出部104によって算出される各ピクチャタイプの符号化難易度及びピクチャタイプに応じてピクチャの目標符号量を決定する。符号量制御部102は、ピクチャタイプに応じて目標符号量を制御するが、一定周期におけるビットレートが一定に保たれるように目標符号量を制御する。
103は、基準量子化パラメータ制御部であり、ピクチャの目標符号量を符号量制御部102より受け取り、ピクチャの基準となる量子化パラメータ(以下、基準量子化パラメータ)を決定する。
104は、難易度算出部であり、基準量子化パラメータ制御部103より基準量子化パラメータを、後述するエントロピー符号化部111よりピクチャの符号量を受け取り、各ピクチャタイプの符号化難易度を算出する。
105は、ブロック量子化パラメータ制御部であり、基準量子化パラメータ制御部103より基準量子化パラメータを、後述するブロックタイプ制御部108より処理対象ブロックのブロックタイプを受け取り、処理対象ブロックの量子化パラメータを決定する。以下、処理対象ブロックの量子化パラメータを、ブロック量子化パラメータと記す。
106の破線部は、入力されたピクチャをブロック単位で符号化する符号化部である。
107は、予測部であり、処理対象ブロックの周辺の画素による予測(イントラ予測)または他のピクチャの参照による動き補償(インター予測)を実施して予測誤差を生成する。
108は、ブロックタイプ制御部であり、予測部107よりイントラ予測、インター予測時の予測誤差を受け取って、処理対象のブロックをイントラブロックまたはインターブロックのいずれのブロックタイプで符号化するかを決定する。なお、入力されたピクチャがイントラピクチャである場合には、全てのブロックがイントラブロックであるため本処理の内容は実行されない。
109は、周波数変換部であり、ブロックタイプ制御部108によって決定されたブロックタイプに従って、予測誤差を周波数変換係数に変換する。
110は、量子化部であり、周波数変換部109によって生成された周波数変換係数を、ブロック量子化パラメータ制御部105で決定されたブロック量子化パラメータに従って量子化し、量子化係数を生成する。
111は、エントロピー符号化部であり、量子化部110で生成された量子化係数を可変長符号化し、符号化ストリームを生成する。尚、可変長符号化方式としては、例えば次のような方式が適応される。即ち、Context−based Adaptive VariableLength Coding(CAVLC)又はContext−based AdaptiveBinary Arithmetic Coding(CABAC)等が適用される。
本実施形態の符号化装置100の動作を、図2のフローチャートを用いて詳細に説明する。本実施形態では、動画像データはピクチャ単位に入力され、符号化部106においてブロックに分割されてラスタ順に処理される。
本実施形態におけるブロックのサイズは、H.264のブロックサイズと同じ16×16画素とするが、本発明はこれに限定されるものではない。例えば、HEVCで用いられる最大のブロックサイズである64×64画素や8×8画素、32×32画素でもよく、32×16画素のように非対称でもよい。本実施形態において、符号化部106はH.264のストリームを生成するが、本発明はこれに限定されるものではなく、例えばHEVCのストリームを生成してもよい。
図2のフローチャートにおいて、まずS201では、ピクチャタイプ決定部101が、入力されたピクチャのピクチャタイプを決定する。本実施形態では、動画像データの最初のピクチャをIピクチャに決定し、以降15ピクチャ毎にIピクチャとして符号化するものとして、残りのピクチャは全てPピクチャとして符号化するものとする。しかし、本発明はこれに限定されるものではなく、Iピクチャの間隔は15ピクチャ毎でなくてもよいし、Pピクチャに加えてBピクチャを交えてもよい。
次に、S202の処理では、基準量子化パラメータが計算される。基準量子化パラメータの計算方法に関して、図3のフローチャートを用いて詳細に説明する。
図3のフローチャートにおいて、S301の処理は難易度算出部104で、S302〜S310の目標符号量決定処理は符号量制御部102で、S311の処理は基準量子化パラメータ制御部103で夫々行われる。
S301の処理では、難易度算出部104において、ピクチャタイプ毎の符号化難易度が、過去に符号化された個々のピクチャの符号化難易度の平均値を取ることで計算される。ここで、ピクチャタイプがIピクチャの符号化難易度をXi、Pピクチャの符号化難易度をXpとする。
本実施形態では、個々のピクチャが実際に符号化された結果得られた符号量R(以下、実符号量と記載)と、そのピクチャに用いられた基準量子化ステップQを掛け合わせることで個々のピクチャの符号化難易度を算出する。ここで、基準量子化ステップとは、基準量子化パラメータに対応する量子化ステップのことを示す。量子化パラメータと量子化ステップの関係は、H.264に規定されている関係に準拠するものとする。実符号量R及び基準量子化ステップQは、エントロピー符号化部111及び基準量子化パラメータ制御部103の出力より得られる。
次に、難易度算出部104は、ピクチャタイプ毎の過去複数ピクチャの符号化難易度の平均値を算出し、ピクチャタイプの符号化難易度とする。本実施形態では、Iピクチャは過去2ピクチャの平均値、Pピクチャは過去5ピクチャの平均値を、ピクチャタイプの符号化難易度とする。
本実施形態では、ピクチャの実符号量と基準量子化ステップを用いて個々のピクチャの符号化難易度を計算したが、本発明はこれに限定されるものではない。例えば、基準量子化ステップではなく、後述するブロック量子化パラメータもしくはそれに対応するブロック量子化ステップを用いて計算してもよい。あるいは、入力されたピクチャの分散値や予測部107によって得られる画素の差分を絶対値化して積算した値(Sum of Absolute Value,以下SAD)等の指標を用いて符号化難易度を計算してもよい。
また、本実施形態ではピクチャタイプの符号化難易度を、過去の複数ピクチャの平均値として求めているが、本発明はこれに限定されるものではなく、過去に符号化されたピクチャの符号化難易度に基づいて算出される値であれば構わない。例えば、過去の符号化難易度の中央値をとってもよいし、直前または所定数前に符号化されたピクチャの符号化難易度をそのままピクチャタイプの符号化難易度としてもよい。
次に、S302の処理では、符号量制御部102において、次に符号化するピクチャがIピクチャか否かが判定される。次に符号化されるピクチャがIピクチャの場合は、S303の処理に進み、IピクチャとPピクチャの目標符号量の割合を計算し、Iピクチャでない場合はS311の処理に進む。
次に、S303の処理では、Iピクチャの符号化難易度Xi及びPピクチャの符号化難易度Xpの比であるXratioが計算される。
次に、S304の処理では、符号化難易度の比Xratioの値と閾値T1の値が比較される。これは、Iピクチャの符号化難易度が、Pピクチャの符号化難易度に比べて相対的に(閾値T1以上に)難しいか否かを比較している。符号化難易度の比Xratioの値が閾値T1より大きい場合(Iピクチャの符号化難易度が高い場合)はS305の処理に進み、そうでない場合はS306の処理に進む。
次に、S305の処理では、量子化調整値QDの値に1を足す。量子化調整値QDは、IピクチャとPピクチャの基準量子化パラメータの差の大きさを示す変数である。Iピクチャと、その直後のPピクチャの基準量子化パラメータは、与えられた量子化調整値QDの値に基づいて後述のS310において下記の関係を満たすように符号量の割り当てが計算される。
Pピクチャの基準量子化パラメータ=Iピクチャの基準量子化パラメータ+量子化調整値QD。
これは、量子化調整値QDの値が大きくなればなるほど、Iピクチャの基準量子化パラメータが相対的に小さくなり、Iピクチャに多くの符号量が割り当てられることを意味する。IピクチャがPピクチャよりも相対的に符号化難易度が高い時は、Pピクチャの動き予測が当たり易い(インター予測による予測誤差が小さい)ことを示している。そのため、Iピクチャに多くの符号量を割当てて画質を向上させることで、後続のPピクチャの画質も向上させることができる。本実施形態では、量子化調整値QDの値に1を足したが、本発明はこれに限定されるものではない。例えば2以上の正数を足してもよい。
次に、S306の処理では、符号化難易度の比Xratioの値と閾値T2の値が比較される。これは、Pピクチャの符号化難易度が、Iピクチャの符号化難易度に比べて相対的に難しいか否かを比較している。符号化難易度の比Xratioの値が閾値T2より小さい場合(Pピクチャの符号化難易度が高い場合)はS307の処理に進み、そうでない場合はS308の処理に進む。
S307の処理では、量子化調整値QDの値に1を減じている。PピクチャがIピクチャよりも相対的に符号化難易度が高い時は、Pピクチャの動き予測が当たり難い(インター予測による予測誤差が大きい)ことを示している。そのため、Iピクチャの符号量を増やして画質を向上させても、後続のPピクチャに画質向上の効果が引き継がれない。
一定周期におけるビットレートは一定なので、Iピクチャに多く符号量を割当てると、その分Pピクチャの符号量は減少し、却ってPピクチャの画質劣化を招いてしまう。Pピクチャの画質劣化を防ぐために、Pピクチャの符号化難易度が高い時は量子化調整値QDの値を減少させ、Pピクチャに割り当てる符号量を増やしている。本実施形態では、量子化調整値QDの値に1を減じたが、本発明はこれに限定されるものではない。例えば2以上の正数を減じてもよい。
次に、S308の処理では、量子化調整値QDの値を更新しない。すなわち、IピクチャとPピクチャの基準パラメータの関係を変更しないことを意味する。
次に、S309の処理では、量子化調整値QDの値より符号量調整係数αの値が図5のテーブルを基に決定される。量子化調整値QDと符号量調整係数αの関係は、H.264形式における量子化パラメータと量子化ステップの関係と同一である。符号量調整係数αは、後述のS310の目標符号量の計算に使用される。
次に、S310の処理では、α及びXi、Xpの値を基に、Iピクチャの目標符号量Ti、Pピクチャの目標符号量Tpを下記の式(1)及び式(2)に従い計算する。
Ti=(Ta×α×Xi)/(Xi+14×Xp)・・・ 式(1)
Tp=(Ta−Ti)/14 ・・・ 式(2)
ここで、Taは、1枚のIピクチャ及び14枚のPピクチャの計15ピクチャに割り当てられる合計の目標符号量である。符号量調整係数αの値が大きくなるほど(量子化調整値QDの値が大きくなるほど)、Iピクチャの目標符号量Tiは大きくなり、反対にPピクチャの目標符号量Tpは小さくなる。
次に、S311の処理では、基準量子化パラメータ制御部103において、ピクチャ毎の基準量子化パラメータを決定する。まず、Iピクチャの量子化ステップQi及びPピクチャの量子化ステップQpを、下記の式(3)及び式(4)に従い計算する。
Qi=Xi/Ti・・・ 式(3)
Qp=Xp/Tp・・・ 式(4)
基準量子化ステップを計算した後、対応する量子化パラメータを基準量子化パラメータとして決定し、基準量子化パラメータ決定処理を終了する。
図2のフローチャートに戻り、S203のブロック符号化処理に関して、図4のフローチャートを用いて詳細に説明する。図4のフローチャートでは、S401の処理は予測部107で、S402の処理はブロックタイプ制御部108で、S403の処理は周波数変換部109で行われる。
S404〜S408の処理はブロック量子化パラメータ制御部105で行われる処理である。ブロック量子化パラメータ制御部105は、イントラピクチャのブロック量子化パラメータと、インターピクチャ内のイントラブロックのブロック量子化パラメータがほぼ等しくなるように、ブロック量子化パラメータを決定する。また、S409の処理は量子化部110で行われ、S410の処理はエントロピー符号化部111で行われる。
まず、S401の処理では、予測部107において入力された画像ブロックに対してブロック周辺の画素を利用したイントラ予測もしくは、参照ピクチャを利用したインター予測が行われ、イントラ予測誤差及びインター予測誤差が生成される。
次に、S402の処理では、ブロックタイプ制御部108により、前述したイントラ予測誤差及びインター予測誤差を基にブロックタイプが決定される。本実施形態では、各予測誤差のSADを計算し、SADが小さいブロックタイプを選択する。なお、本実施形態ではSADを用いてブロックタイプを決定するが、本発明はこれに限定されるものではない。例えば、動きベクトルのビット数を考慮して決めてもよいし、R−D最適化手法を用いてブロックタイプを決定してもよい。
次に、S403の処理では、周波数変換部109において、決定されたブロックタイプに基づいて、前述した予測誤差に対して直交変換が行われ、変換係数が生成される。
次に、S404の処理では、ブロック量子化パラメータ制御部105において、処理対象のピクチャがIピクチャか否かが判定される。Iピクチャの場合は、S406の処理に進み、そうでない場合はS405の処理に進む。
次に、S405の処理では、処理対象のブロックがイントラブロックか否かの判定が、ブロックタイプ制御部108から受け取るブロックタイプの情報に基づいて行われる。イントラブロックの場合はS408の処理に進み、そうでない場合はS407の処理に進む。
次に、S406の処理(処理対象ピクチャがIピクチャの場合)では、ブロック量子化パラメータQbとして、処理対象のIピクチャの基準量子化パラメータであるQipの値が設定される。
次に、S407の処理(処理対象ピクチャがPピクチャかつインターブロックの場合)では、Qbとして処理対象のPピクチャの基準量子化パラメータであるQppの値が設定される。
次に、S408の処理(処理対象ピクチャがPピクチャかつイントラブロックの場合)では、QbとしてQppから前述の量子化調整値QDの値を減じた値が設定される。量子化調整値QDは、Iピクチャとその直後のPピクチャの量子化パラメータの差を示す変数である。
Qppから量子化調整値QDの値を減じることで、IピクチャとPピクチャの目標符号量の割り当てを行った際に設定した、IピクチャとPピクチャの画質差の関係を、Pピクチャ内のイントラブロックとインターブロックにも適用することができる。すなわち、Iピクチャに多くの符号量を割当てることで後続のPピクチャの高画質化を狙った際に、Pピクチャ内のイントラブロックでその効果が失われてしまうことを防ぐことができ、画像全体を高画質化することができる。
また、Pピクチャの符号化難易度が高く、インター予測において多くの予測誤差が発生する映像に関しては、量子化調整値QDの値は小さくなる。これにより、Pピクチャ内のイントラブロックに大きい符号量を割り当てることで発生するインターブロックの画質劣化を防ぐことができる。本実施形態では、インターピクチャ内のイントラブロックのブロック量子化パラメータを、Qpp−QDとしたが、本発明はこれに限定されるものではない。
例えば、Iピクチャの基準量子化パラメータであるQipをそのままブロック量子化パラメータとしてもよい。
次に、S409の処理では、量子化部110においてブロック量子化パラメータQbを基に、S403の処理で生成された変換係数が量子化され、量子化係数が生成される。
次に、S410の処理では、エントロピー符号化部111において前記変換係数がエントロピー符号化され、H.264の符号化ストリームが生成される。本実施形態では、生成する符号化ストリームの形式をH.264としているが、本発明はこれに限定されるものではなく、例えばHEVCの符号化ストリームを生成してもよい。
図2のフローチャートに戻り、S204の処理では、ピクチャ内の全てのブロックを符号化したか否かが判定される。符号化していない場合はS203の処理に戻り、後続のブロックを符号化する。全てのブロックを符号化した場合はピクチャ符号化処理を終了する。
以上の構成と動作を行うことにより、IピクチャとPピクチャの符号化難易度に応じて適応的に目標符号量を設定した上で、符号化難易度に応じてPピクチャ内のイントラブロックの符号量も適応的に制御することが可能となる。そしてそれは、インター予測が当たり易い映像に関しては、Pピクチャ内のイントラブロックでIピクチャの画質向上効果が失われることを防ぐことができる。
また、インター予測において、少ない予測誤差しか発生しない映像に関しては、イントラブロックに不要な符号量を割り当てることを防ぐことができる。
なお、前述の実施形態は、一定周期におけるビットレートが一定に保たれるように目標符号量を制御する際の実施形態について述べたものであるが、本発明は前述の実施形態に限定されない。すなわち、一定周期におけるビットレートが可変の場合にも、Iピクチャの基準量子化パラメータをPピクチャ内のイントラブロックに適用することにより、同様の効果を得ることが可能である。
[第2の実施形態]
以下、本発明の第2の実施形態を、図面を用いて説明する。
図6は、本実施形態の符号化装置600の構成例を示すブロック図である。図6の601〜604及び606〜611の構成は、図1の101〜104及び106〜111の構成と同一であるため説明を省略する。
図6において、605は、ブロック量子化パラメータ制御部であり、図1のブロック量子化パラメータ制御部105に加えて、後述する特徴量解析部612より、入力されたピクチャの特徴量を受け取り、それに基づいてブロック量子化パラメータを補正する。612は、特徴量解析部であり、入力されたピクチャの特徴量を解析する。
図2のフローチャートを用いて本実施形態の動作を説明する。本実施形態の動作は、図2のS203のブロック符号化処理を除いて第1の実施形態の動作と同一であるため説明を省略する。
図2において、本実施形態のS203で行うブロック符号化処理について、図7のフローチャートを用いて詳細に説明する。図7のS701〜S708及びS711〜S712の処理は、図4のS401〜S408及びS409〜S410と同一であるため説明を省略する。
S709の処理では、特徴量解析部612において、入力されたブロックの輝度のアクティビティ及び輝度の平均値が特徴量として解析される。これらの指標は、人間の視覚特性と相関が深いため、これらの指標を用いて後段のS710でブロック量子化パラメータを補正する。本実施形態におけるアクティビティの算出方法について具体的に説明する。
まず、ブロックを複数の4×4画素単位のサブブロックに分割し、サブブロックに属する各画素の輝度値と該サブブロックの輝度の平均値との差分の大きさ(絶対値)の合計値をサブブロックのアクティビティとして算出する。ブロック内の全てのサブブロックのアクティビティを算出した後、最も小さなものをブロックのアクティビティとして算出する。しかし、本発明における特徴量はアクティビティ及び輝度の平均値に限定されるものではなく、人間の視覚に与える度合いを判定できる特徴量であればよい。
例えば、輝度の分散、色差の平均値、アクティビティ、分散等を算出してもよいし、動きベクトル、予測誤差等の符号化結果を指標として用いてもよい。アクティビティの計算に4×4のサブブロックの最小値を使用したが、8×8画素のサブブロックを用いても、16×16画素のブロックをそのまま用いてもよいし、最小値ではなく平均値や最大値を用いてもよい。また、算出されるブロック評価値の数は2種類に限定されるものではなく、輝度の平均値とアクティビティに加えて、色差の平均値等、他の特徴量を算出することも可能である。
次に、S710の処理では、ブロック量子化パラメータ制御部605において、前記特徴量を基にブロック量子化パラメータが補正される。本実施形態では、特徴量解析部612で解析された、ブロックのアクティビティ及び輝度の平均値に基づいて、各ブロックをクラス分けする。そして、各クラスには予め量子化パラメータの補正値が定められていて、各クラスに属したブロックにはその補正値が適用されるものとする。該補正値は、S706〜708で計算されたブロック量子化パラメータQbに、単純に加算されるものとする。
例えば、あるブロックが所属するクラスの補正値が+3であったとき、該ブロックがPピクチャ内のイントラブロックの時はQb=Qpp−QD+3となる。該ブロックがPピクチャ内のインターブロックの時はQb=Qpp+3となる。Iピクチャ内(イントラピクチャ内)のブロックの時はQb=Qip+3となる。
前述の構成と動作により、本実施形態においては、第1の実施形態に加えて更に人間の視覚特性を考慮したブロック量子化パラメータの制御が可能となる。これにより、更に人間の主観画質を高めることが可能となる。
本実施形態では、人間の視覚特性を考慮してブロック量子化パラメータを補正したが、本発明はこれに限定されるものではなく他の量子化パラメータの補正方法と組み合わせてもよい。即ち、人体検知又は物体検知又は動体検知等の検知情報のうち少なくとも一つを用いて量子化パラメータを制御する処理と本実施形態とを組み合わせてもよい。尚、検知情報には、人の顔や物体等の認識情報も含まれる。ここで、検知情報及び認識情報を用いた量子化パラメータ制御では、検知及び認識された領域の量子化パラメータを小さくする。また、ピクチャ内の予め指定された領域を重要な領域として、当該領域の量子化パラメータを小さくする処理と組み合わせてもよい。
(その他の実施形態)
また、本発明は、以下の処理を実行することによっても実現される。すなわち、前述した実施形態の機能を実現するソフトウェア(コンピュータプログラム)を、ネットワーク又は各種のコンピュータ読み取り可能な記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
101 ピクチャタイプ制御部
102 符号量制御部
103 基準量子化パラメータ制御部
104 難易度算出部
105 ブロック量子化パラメータ制御部
106 符号化部
107 予測部
108 ブロックタイプ制御部
109 周波数変換部
110 量子化部
111 エントロピー符号化部
612 特徴量解析部

Claims (7)

  1. 入力されたピクチャを符号化する符号化装置であって、
    前記入力されたピクチャのピクチャタイプが、イントラピクチャもしくはインターピクチャのどちらのピクチャであるかを決定するピクチャタイプ決定手段と、
    前記ピクチャタイプ毎の符号化難易度を算出する難易度算出手段と、
    前記難易度算出手段により算出された符号化難易度に基づいて、前記ピクチャタイプ毎の目標符号量を決定する目標符号量決定手段と、
    前記目標符号量決定手段により決定された目標符号量から、各ピクチャの基準量子化パラメータを決定する基準量子化パラメータ決定手段と、
    前記インターピクチャの各ブロックのブロックタイプを決定するブロックタイプ制御手段と、
    前記基準量子化パラメータ及び前記ブロックタイプに基づいて、前記ピクチャの各ブロックの量子化パラメータであるブロック量子化パラメータを制御するブロック量子化パラメータ制御手段と、
    前記ブロックを前記ブロック量子化パラメータに基づいて量子化する量子化手段と、を有し、
    前記ブロック量子化パラメータ制御手段は、
    前記イントラピクチャの基準量子化パラメータと、前記インターピクチャの基準量子化パラメータの差分の大きさに基づいて、前記インターピクチャのブロック量子化パラメータを制御することを特徴とする符号化装置。
  2. 前記ブロック量子化パラメータ制御手段は、
    前記インターピクチャ内のインターブロックのブロック量子化パラメータから、前記差分を引いた値を、インターピクチャ内のイントラブロックのブロック量子化パラメータとすることを特徴とする請求項に記載の符号化装置。
  3. 前記ブロック量子化パラメータ制御手段は、
    人間の視覚特性に基づいて前記ブロック量子化パラメータを補正することを特徴とする請求項またはに記載の符号化装置。
  4. 前記ブロック量子化パラメータ制御手段は、
    人体検知又は物体検知又は動体検知に関する検知情報のうち少なくとも一つに基づいて前記ブロック量子化パラメータを補正することを特徴とする請求項の何れか1項に記載の符号化装置。
  5. 入力されたピクチャを符号化する符号化方法であって、
    前記入力されたピクチャのピクチャタイプが、イントラピクチャもしくはインターピクチャのどちらのピクチャであるかを決定するピクチャタイプ決定工程と、
    前記ピクチャタイプ毎の符号化難易度を算出する難易度算出工程と、
    前記難易度算出工程において算出された符号化難易度に基づいて、前記ピクチャタイプ毎の目標符号量を決定する目標符号量決定工程と、
    前記目標符号量決定工程において決定された目標符号量から、各ピクチャの基準量子化パラメータを決定する基準量子化パラメータ決定工程と、
    前記インターピクチャの各ブロックのブロックタイプを制御するブロックタイプ制御工程と、
    前記基準量子化パラメータ及び前記ブロックタイプに基づいて、前記ピクチャの各ブロックの量子化パラメータであるブロック量子化パラメータを制御するブロック量子化パラメータ制御工程と、
    前記ブロックを前記ブロック量子化パラメータに基づいて量子化する量子化工程と、を有し、 前記ブロック量子化パラメータ制御工程は、
    前記イントラピクチャの基準量子化パラメータと、前記インターピクチャの基準量子化パラメータの差分の大きさに基づいて、前記インターピクチャのブロック量子化パラメータを制御することを特徴とする符号化方法。
  6. 入力されたピクチャを符号化する符号化方法をコンピュータに実行させるプログラムであって、
    前記入力されたピクチャのピクチャタイプが、イントラピクチャもしくはインターピクチャのどちらのピクチャであるかを決定するピクチャタイプ決定工程と、
    前記ピクチャタイプ毎の符号化難易度を算出する難易度算出工程と、
    前記難易度算出工程において算出された符号化難易度に基づいて、前記ピクチャタイプ毎の目標符号量を決定する目標符号量決定工程と、
    前記目標符号量決定工程において決定された目標符号量から、各ピクチャの基準量子化パラメータを決定する基準量子化パラメータ決定工程と、
    前記インターピクチャの各ブロックのブロックタイプを制御するブロックタイプ制御工程と、
    前記基準量子化パラメータ及び前記ブロックタイプに基づいて、前記ピクチャの各ブロックの量子化パラメータであるブロック量子化パラメータを制御するブロック量子化パラメータ制御工程と、
    前記ブロックを前記ブロック量子化パラメータに基づいて量子化する量子化工程と、をコンピュータに実行させ、
    前記ブロック量子化パラメータ制御工程は、
    前記イントラピクチャの基準量子化パラメータと、前記インターピクチャの基準量子化パラメータの差分の大きさに基づいて、前記インターピクチャのブロック量子化パラメータを制御するようコンピュータを制御することを特徴とするプログラム。
  7. 請求項に記載のプログラムを記憶したことを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2014069856A 2014-03-28 2014-03-28 符号化装置及び符号化方法 Active JP6373033B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014069856A JP6373033B2 (ja) 2014-03-28 2014-03-28 符号化装置及び符号化方法
US14/670,229 US9832469B2 (en) 2014-03-28 2015-03-26 Coding apparatus, coding method, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014069856A JP6373033B2 (ja) 2014-03-28 2014-03-28 符号化装置及び符号化方法

Publications (2)

Publication Number Publication Date
JP2015192403A JP2015192403A (ja) 2015-11-02
JP6373033B2 true JP6373033B2 (ja) 2018-08-15

Family

ID=54192236

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014069856A Active JP6373033B2 (ja) 2014-03-28 2014-03-28 符号化装置及び符号化方法

Country Status (2)

Country Link
US (1) US9832469B2 (ja)
JP (1) JP6373033B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017093188A1 (en) * 2015-11-30 2017-06-08 Telefonaktiebolaget Lm Ericsson (Publ) Encoding and decoding of pictures in a video
US11206401B2 (en) * 2016-02-11 2021-12-21 Samsung Electronics Co., Ltd. Video encoding method and device and video decoding method and device
JP7020068B2 (ja) * 2017-11-16 2022-02-16 日本電気株式会社 映像符号化装置、映像符号化方法、及びプログラム
EP3888366B1 (en) * 2018-11-27 2024-04-10 OP Solutions, LLC Block-based picture fusion for contextual segmentation and processing
GB2623002A (en) * 2019-07-05 2024-04-03 V Nova Int Ltd Quantization of residuals in video coding
CN111787322B (zh) * 2020-08-04 2022-05-13 北京百度网讯科技有限公司 视频编码的方法、装置、电子设备及计算机可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06292020A (ja) * 1993-04-07 1994-10-18 Hitachi Ltd 画像符号復号方法ならびに装置
JP3711573B2 (ja) * 1994-09-30 2005-11-02 ソニー株式会社 画像符号化装置及び画像符号化方法
WO1999063760A1 (en) 1998-05-30 1999-12-09 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Sequence adaptive bit allocation for pictures encoding
JP4243218B2 (ja) * 2004-05-11 2009-03-25 日本放送協会 量子化制御装置、その方法及びそのプログラム、並びに、適応量子化符号化装置
JP2007318617A (ja) * 2006-05-29 2007-12-06 Renesas Technology Corp 画像符号化装置、及び画像符号化プログラム
JP2008022405A (ja) * 2006-07-14 2008-01-31 Sony Corp 画像処理装置および方法、並びに、プログラム
WO2008111458A1 (ja) * 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 符号化ビットレート制御方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
US8331438B2 (en) * 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
EP2191651A1 (en) * 2007-09-28 2010-06-02 Dolby Laboratories Licensing Corporation Video compression and tranmission techniques
RU2597510C2 (ru) * 2010-06-10 2016-09-10 Томсон Лайсенсинг Способы и устройство для определения предсказателей параметров квантования по множеству соседних параметров квантования
JPWO2014091943A1 (ja) * 2012-12-14 2017-01-05 ソニー株式会社 画像処理装置および方法

Also Published As

Publication number Publication date
US20150281693A1 (en) 2015-10-01
JP2015192403A (ja) 2015-11-02
US9832469B2 (en) 2017-11-28

Similar Documents

Publication Publication Date Title
JP6373033B2 (ja) 符号化装置及び符号化方法
TWI650995B (zh) 視訊解碼裝置、視訊編碼方法及非暫態電腦可讀記錄媒體
JP5215951B2 (ja) 符号化装置及びその制御方法、コンピュータプログラム
KR101621854B1 (ko) Tsm 율-왜곡 최적화 방법, 그를 이용한 인코딩 방법 및 장치, 그리고 영상 처리 장치
US9955168B2 (en) Constraining number of bits generated relative to VBV buffer
WO2019104862A1 (en) System and method for reducing video coding fluctuation
EP3545677A1 (en) Methods and apparatuses for encoding and decoding video based on perceptual metric classification
WO2019104635A1 (en) System and method for controlling video coding at frame level
US20170374361A1 (en) Method and System Of Controlling A Video Content System
TWI394462B (zh) 基於視覺感知的位元-失真最佳化位元分配的位元率控制方法
JP7343817B2 (ja) 符号化装置、符号化方法、及び符号化プログラム
WO2019104611A1 (en) System and method for controlling video coding within image frame
CN108989818B (zh) 一种图像编码参数调整方法及装置
JP2011172137A (ja) 符号化装置、符号化方法、およびプログラム
JP5078837B2 (ja) 符号化装置、符号化装置の制御方法及びコンピュータプログラム
JP4736619B2 (ja) 画像処理装置および画像処理方法
JP5410638B2 (ja) 量子化制御装置及び方法、及び量子化制御プログラム
JP4942208B2 (ja) 符号化装置
WO2015046431A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
JP2013138502A (ja) 符号化装置及びその制御方法、コンピュータプログラム
JP6200220B2 (ja) 画像処理装置、符号化装置、復号装置、及びプログラム
JP6239838B2 (ja) 動画像符号化装置、その制御方法、及び撮像装置
JP2009177443A (ja) 符号化装置
JP6757599B2 (ja) 符号化装置及びプログラム
Guan et al. A Novel Video Compression Algorithm Based on Wireless Sensor Network.

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170328

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180326

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180403

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180530

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180619

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180717

R151 Written notification of patent or utility model registration

Ref document number: 6373033

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151