JP2012182831A - 画像符号化装置及びその制御方法、コンピュータプログラム - Google Patents

画像符号化装置及びその制御方法、コンピュータプログラム Download PDF

Info

Publication number
JP2012182831A
JP2012182831A JP2012116979A JP2012116979A JP2012182831A JP 2012182831 A JP2012182831 A JP 2012182831A JP 2012116979 A JP2012116979 A JP 2012116979A JP 2012116979 A JP2012116979 A JP 2012116979A JP 2012182831 A JP2012182831 A JP 2012182831A
Authority
JP
Japan
Prior art keywords
ratio
image
encoding
target
motion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012116979A
Other languages
English (en)
Other versions
JP5409842B2 (ja
Inventor
Akihiro Oishi
晃弘 大石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2012116979A priority Critical patent/JP5409842B2/ja
Publication of JP2012182831A publication Critical patent/JP2012182831A/ja
Application granted granted Critical
Publication of JP5409842B2 publication Critical patent/JP5409842B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】人間の視覚特性に応じた符号量の設定が行って、良好な画質の復号画像を得る。
【解決手段】画像データを符号化する画像符号化装置であって、符号化手段と、復号手段と、動き検出手段と、符号化対象画像の符号化手段による符号化結果を復号手段が復号した復号結果とを用いてSN比を算出するSN比算出手段と、符号化対象画像において目標とされるSN比の値を示す目標SN比を設定する設定手段と、目標SN比と算出されたSN比との差分の大きさに応じて、符号化手段から出力される符号化データのビットレートを調整するレート制御手段と、を備え、設定手段は、動き情報によって示される画像間の動き量が所定の閾値以下の状態が所定の複数枚数の画像で続いている場合には、動き量が所定の閾値以下の状態が所定の複数枚数の画像で続いていない場合よりも、目標SN比を大きく設定する。
【選択図】図1

Description

本発明は、画像符号化装置及びその制御方法、コンピュータプログラムに関する。
近年のマルティメディアの発展に伴い様々な動画像圧縮符号化方式が提案されている。その代表的なものに、MPEG−1,2,4やH.264といったものがある。これらの圧縮符号化の処理は、動画像に含まれる原画像(画像)をブロックと呼ばれる所定の領域に分割し、この分割したブロックを単位にして動き補償予測やDCT変換処理を施すものである。また、動き補償予測を行う場合、既に符号化済みの画像データを局所復号化して得られた画像を参照画像としていることで、符号化を行う際にも復号化処理が必要となる。
また、MPEG方式に準拠して画像の圧縮、符号化を行う場合、その符号量は、画像自体の特性である空間周波数特性やシーン及び量子化スケール値に応じて大きく異なる場合が多い。このような符号化特性を有する符号化装置を実現する上で良好な画質の復号画像を得ることができるようにするための重要な技術が符号量制御である。
この符号量制御アルゴリズムの1つとして、TM5(Test Model 5)が一般的に使用されている。このTM5による符号量制御アルゴリズムは、以下に説明する3つのステップから構成され、GOP(Group Of Picture)毎にビットレートが一定になるように以下に挙げる3ステップで符号量が制御される。
(STEP1)
今から符号化を行うピクチャの目標符号量を決定する。現在のGOPにおいて利用可能な符号量であるRgopが以下の(1)式により演算される。
Rgop = (ni+np+nb)*(bits_rate/picture_rate) ・・・(1)
ここで、ni,np,nbはそれぞれI、P、Bピクチャの現GOPにおける残りのピクチャ数であり、bits_rateは目標ビットレート、picture_rateはピクチャレートを表す。
更に、I、P、Bピクチャ毎に符号化結果からピクチャの複雑度を以下の(2)式で求めている。
Xi = Ri*Qi
Xp = Rp*Qp ・・・(2)
Xb = Rb*Qb
ここで、Xi、Xp、Xbはコンプレキシティ(Complexity)とも呼ばれる。また、Ri、Rp及びRbはそれぞれI、P、Bピクチャを符号化した結果得られる符号量である。さらに、Qi、Qp及びQbはそれぞれI、P、Bピクチャ内のすべてのマクロブロックにおけるQスケールの平均値である。式(1)及び式(2)から、I、P、Bピクチャそれぞれについての目標符号量Ti、Tp及びTbは、以下の(3)式で求めることができる。
Ti= max{(Rgop/(1+ ((Np*Xp)/(Xi*Kp)) + ((Nb*Xb)/(Xi*Kb)))) , (bit_rat
e/(8*picture_rate))}
Tp=max{(Rgop/(Np+ (Nb*Kp*Xb)/(Kb*Xp))) , (bit_rate/(8*picture_rate))}
Tb=max{(Rgop/(Nb+ (Np*Kb*Xp)/(Kp*Xb))) , (bit_rate/(8*picture_rate))}
・・・(3)
ただし、Np及びNbは現GOP内のそれぞれP及びBピクチャの残りの枚数、また定数Kp=1.0及びKb=1.4である。
(STEP2)
I、P及びBピクチャ毎に3つの仮想バッファを使用し、式(3)で求めた目標符号量と発生符号量との差分を管理する。仮想バッファのデータ蓄積量をフィードバックし、そのデータ蓄積量に基づいて実際の発生符号量が目標符号量に近づくように、次にエンコードするマクロブロックについて、Qスケールの参照値が設定される。例えば、現在のピクチャタイプがPピクチャの場合には、目標符号量と発生符号量との差分は、次の(4)式に従う演算処理により求めることができる。
dp,j = dp,0 + Bp,j-1 −((Tp*(j-1))/MB_cnt) ・・・(4)
ここで、添字jはピクチャ内のマクロブロックの番号である。dp,0は仮想バッファの初期フルネスを示し、Bp,jはj番目のマクロブロックまでの総符号量、MB_cntはピクチャ内のマクロブロック数を示す。Bp,jはj番目のマクロブロックまでの総符号量、MB_cntはピクチャ内のマクロブロック数を示す。
次にdp,j(以後、「dj」と記載する。) を用いて、j番目のマクロブロックにおけるQスケールの参照値を求めると、(5)式のようになる。
Qj = (dj*31) / r ・・・(5)
ここで、r = 2*bits_rate/picture_rate ・・・(6)
である。
(STEP3)
視覚特性、即ち、復号画像の画質が良好になるように、エンコード対象のマクロブロックの空間アクティビティに基づいて、量子化スケールを最終的に決定する処理を実行する。
ACTj = 1+ min(vblk1, vblk2,……,vblk8) ・・・(7)
(7)式中において、vblk1〜vblk4はフレーム構造のマクロブロックにおける8x8のサブブロックにおける空間アクティビティを示す。また、vblk5〜vblk8はフィールド構造のマクロブロックにおける8x8サブブロックの空間アクティビティを示す。ここで、空間アクティビチィの演算は次の(8)、(9)式により求めることが可能である。
vblk = Σ(Pi−Pbar)2 ・・・(8)
Pbar = (1/64 )* ΣPi ・・・(9)
ここで、Piはi番目のマクロブロックにおける画素値であり、式(8)、(9)中のΣはi=1〜64の演算である。次に(7)式で求めたACTjを以下の(10)式によって正規化を行う。
N_ACTj = (2*ACTj +AVG_ACT)/ (ACTj + AVG_ACT) ・・・(10)
ここで、AVG_ACTは以前に符号化したピクチャにおけるACTjの参照値であり、最終的に量子化スケール(Qスケール値)MQUANTjは以下の(11)式により求められる。
MQUANTj = Qj * N_ACTj ・・・(11)
以上のTM5のアルゴリズムによれば、STEP1の処理によりIピクチャに対して多くの符号量を割り当ており、更にピクチャ内においては視覚的に劣化の目立ちやすい平坦部(空間アクティビティが低い)に符号量が多く配分されるようになる。
このようなTM5方式を応用した符号化方式として、画像信号と局所復号画像のSN比がある一定の値となるように目標符号量を決定する方式が提案されている(特許文献1を参照)。この提案手法では、SN比を一定に保つような目標符号量を設定することですべてのピクチャに対する画質を安定させる効果がある。
また、上記提案方式の改良方式として、Iピクチャ,Pピクチャ,Bピクチャ各ピクチャの符号量を最適な値に設定する方式が提案されている(特許文献2を参照)。この改良方式では、IピクチャのSN比がBピクチャのSN比より大きくなるように、各フレーム(Iピクチャ・Pピクチャ・Bピクチャ)の符号量が配分制御される。つまり、Iピクチャの符号化誤差がBピクチャの符号化誤差より小さくなるように各フレーム(Iピクチャ・Pピクチャ・Bピクチャ)の符号量を制御することで、GOPの原点となるIピクチャの画質を向上させる効果がある。
特開平02−219388号公報 特開平08−070458号公報
しかしながら、特許文献1、特許文献2に係る提案方式では、以下のような課題が存在する。
まず、特許文献1に係る提案方式では各ピクチャでのSN比を一定に保つことで、一定の画質を保つことは可能であり、特許文献2に係る提案方式でも、SN比と各ピクチャの符号配分を考慮することで同様に一定の画質を保つことは可能である。
しかし、これらの手法では、SN比を目標符号量決定の判断情報としているため、画質の定量的な劣化具合や人間の視覚特性が十分に考慮されていない。つまり、SN比と画質の関係が必ずしも比例関係にならないことが考えられる。
よって、例えば、高速なパンのような高周波成分の少ない信号で構成される画像は画質劣化を受けてもSN比の大幅な低下は起こりにくいが、ブロックノイズのような視覚的に目立ちやすいノイズは発生しやすい。また、静止した画像の場合、他の画像と同じSN比であっても静止しているためにノイズが目立ってしまい画質を同等と見なせない。従って、SN比を一定とし目標符号量を決定することも人間の視覚特性に合致した符号量を設定するという点では困難である。
このように、提案方式では、人間の視覚特性に応じた符号量の設定が行うことができず、良好な画質の復号画像を得ることができなかった。そこで、本発明では、人間の視覚特性に応じた符号量の設定が行って、良好な画質の復号画像を得ることを目的とする。
上記課題を解決するための本発明は、
画像データを符号化する画像符号化装置であって、
符号化対象画像を直交変換し、量子化処理して符号化する符号化手段と、
前記符号化された画像を逆量子化し、逆直交変換して復号する復号手段と、
前記符号化対象画像と、該符号化対象画像の直前の画像との間の動き情報を検出する動き検出手段と、
前記符号化対象画像と、該符号化対象画像の前記符号化手段による符号化結果を前記復号手段が復号した復号結果とを用いてSN比を算出するSN比算出手段と、
前記符号化対象画像において目標とされるSN比の値を示す目標SN比を設定する設定手段と、
設定された前記目標SN比と前記算出されたSN比との差分の大きさに応じて、前記符号化手段から出力される符号化データのビットレートを調整するレート制御手段と、
を備え、
前記設定手段は、前記動き情報によって示される画像間の動き量が所定の閾値以下の状態が所定の複数枚数の画像で続いている場合には、前記動き量が前記所定の閾値以下の状態が所定の複数枚数の画像で続いていない場合よりも、前記目標SN比を大きく設定することを特徴とする。
本発明によれば、画像の動きに応じて目標SN比を変更して、人間の視覚特性に応じた符号量の設定が行い、良好な画質の復号画像を得ることができる。
発明の実施形態に対応する符号化方法を実現する符号化装置の構成例を示す図である。 発明の実施形態に対応する、画像並び替えの一例を示す図である。 発明の実施形態に対応する、図1の符号化装置の点線120で囲まれた各処理部により実行される処理の一例を示すフローチャートである。 発明の第1の実施形態に対応する、レート制御部116における、ビットレートを決定するための処理の一例を示すフローチャートである。 発明の第2の実施形態に対応する、レート制御部116における、ビットレートを決定するための処理の一例を示すフローチャートである。
以下、添付する図面を参照して、発明の実施形態を説明する。
[第1の実施形態]
発明の第1の実施形態について図1乃至図4を参照して説明する。図1は、発明の実施形態に対応する符号化方法を実現する符号化装置の構成例を示す図である。符号化方式として、具体的にはMPEG(Moving Pictures of Experts Group)やH.264/AVC(Advanced Video Coding)に対応する。よって、該符号化装置は、例えばディジタルビデオカメラのような映像音声信号記録装置として実現できる。図2は、画像並び替えの一例を示す図である。図3は、図1の符号化装置の点線120で囲まれた各処理部により実行される処理の一例を示すフローチャートである。また、図4は、発明の実施形態に対応するレート制御処理の一例を示すフローチャートである。
まず、図1において、入力信号101は本符号化装置への入力信号であり、符号化装置が備える撮像素子(CCDやCMOS等)、或いは、ライン入力端子からの映像信号がこれに該当する。また、入力信号101は、所定のブロックに分割された状態で入力される。該ブロックは、例えばMPEGでは16×16、8×8を始めとしたブロックであり、符号化方式に応じてサイズが決まる。なお、本明細書では当該ブロックのことを「マクロブロック」と呼んでいる。
画像並べ替え部102は、入力される画像の順序を入れ替えて後段の処理部に出力する処理部である。画像並べ替え部102は、内部にメモリを備え、図2に示すような#1,#2,#3,・・・の順で入力される画像を、#3,#1,#2,・・・の順で出力されるように、該メモリを管理する。
スイッチ103は、符号化対象画像のピクチャタイプに応じて、画像並べ替え部102からの出力と減算器114からの出力とを切り替えるスイッチである。DCT部104は、直交変換(DCT)を行う処理部である。量子化部105は、DCT部104から出力された直交変換出力係数を量子化処理する処理部である。可変長符号化部106は、量子化部105から出力された量子化結果に可変長符号化処理を施す処理部である。
バッファ107は、可変長符号化部106から出力された符号化データを一時保存するバッファであって、出力端子118とレート制御部116に該符号化データを出力する。逆量子化部108は、量子化部105における量子化結果に逆量子化処理を施す処理部である。IDCT部109は、逆量子化処理結果に対して逆直交変換(IDCT)を施す処理部である。加算器110は、逆直交変換により復号結果として得られた復号データと、動き補償予測部112から出力される予測画像データとを加算して、ローカルデコード画像を出力する演算部である。
スイッチ111は、符号化対象画像のピクチャタイプに応じて、動き補償予測部112からの予測画像データを加算器110に供給するためのスイッチである。動き補償予測部112は、画像並べ替え部102からの出力と、加算器110からの出力とに基づき、動き補償予測を行って予測画像データを生成する処理部である。SN比算出部113は、加算器110から出力と、画像並べ替え部102からの出力とを利用して、SN比を算出する処理部である。
減算器114は、画像並べ替え部102からの出力と、動き補償予測部112からの予測画像データとの間で減算処理を行う演算部である。フレーム動き検出部115は、入力信号101に基づきフレーム動きを検出する処理部である。レート制御部116は、符号化するGOPの目標ビットレートならびに、ピクチャの目標符号量を決定する処理部である。量子化制御部117は、レート制御部116で決定されたピクチャの目標符号量を元に、マクロブロックの量子化係数を決定する処理部である。出力端子118は、バッファ107に一時保存されている符号化データを出力する出力端子である。
なお、点線領域120は、スイッチ103、DCT部104、量子化部105、逆量子化部108、IDCT部109、加算器110、スイッチ111、動き補償予測部112、SN比算出部113、減算器114を含む。
次に、図3を参照して、図1の点線領域120内の各ブロックによる動作を説明する。
まず、ステップS301において、ピクチャタイプの判定を行い、ピクチャタイプがIピクチャの場合(ステップS301において「YES」)、ステップS302に進み、スイッチ103をA側とし、スイッチ111をOFFとする。その後、ステップS305に移行する。
一方、ピクチャタイプがIピクチャ以外のBピクチャ又はPピクチャの場合(ステップS301において「NO」)、ステップS303に進み、スイッチ103をB側とし、スイッチ111をONとする。続くステップS304では、動き補償予測部112で動き探索を行って予測画像データを生成し、該予測画像データと入力画像との減算処理を減算器114にて行って差分値信号を生成する。
次に、ステップS305では、入力信号のマクロブロック単位にDCT部104で直交変換を行い、量子化制御部117で決定された量子化スケールを用いて量子化部105にて直交変換出力係数の量子化を行って、符号化データを生成する。ここで、量子化パラメータである量子化スケールは、TM5のSTEP2に相当する処理を行うことで算出できるので、ここでの説明は省略する。
続くステップS306では、ステップS305において生成された量子化データに逆量子化部108、IDCT部109により逆変換を施して復号結果としての復号データを生成する。Iピクチャの場合、この逆変換によりローカルデコード画像を得ることができる。
続くステップS307では、ステップS301同様にピクチャタイプの判定を行う。ピクチャタイプがIピクチャの場合は(ステップS307において「YES」)、ステップS310へ移行する。一方、ピクチャタイプがIピクチャ以外のBピクチャ又はPピクチャの場合は(ステップS307において「NO」)、ステップS308に移行する。ステップS308では、減算器114にて減算した予測画像データと、逆変換により得られた復号データとの加算処理を加算器110にて行って、Pピクチャ又はBピクチャのローカルデコード画像を生成する。
次に、ステップS309では、ピクチャタイプがPピクチャか否かを判定する。もし、Pピクチャの場合は(ステップS309において「YES」)、ステップS310へ移行する。一方、Bピクチャの場合は(ステップS309において「NO」)、ステップS311へ移行する。
続くステップS310では、生成したローカルデコード画像を参照画像とするために、動き補償予測部112に記憶する。更にステップS311では、SN比算出部113にて、入力画像とローカルデコード画像とのSN比を算出する。次に、ステップS312に進み、全てのピクチャについて符号化処理が完了したか否かを判定する。完了した場合は(ステップS312において「YES」)、本処理を終了する。一方、まだ符号化すべきピクチャがある場合は(ステップS312において「YES」)、ステップS301に戻って処理を続ける。
図1に戻り、点線領域120以外の処理ブロックの動作を説明する。量子化部105より出力されたデータは、可変長符号化部106に入力され、可変長符号化が行われる。可変長符号化されたデータは、バッファ107に入力され、出力端子118より出力される。また、バッファ107から、符号化されたピクチャの発生符号量や量子化係数等の情報およびSN比算出部113で算出したSN比がレート制御部116に入力される。
また、フレーム動き検出部115は、符号化処理対象画像とその直前の画像との間で何画素分の動きが生じたかを表すフレーム動き情報を生成する。フレーム動き検出部115は、画像符号化装置自体の揺れを検知するジャイロセンサ(加速度センサ)119からの揺れ情報と、動き補償予測部112からの動きベクトル情報が入力される。ジャイロセンサ119は、符号化装置の角速度を検知して、揺れ情報としてフレーム動き検出部に出力する。ジャイロセンサ119の揺れ情報によれば、画面全体がどの程度動いたのかが判断できる。また、動きベクトル情報を利用する場合は、マクロブロック毎の動きベクトル情報の平均ベクトルを求め、該平均ベクトルを画面全体の動きとする。これらの情報からフレーム動き情報を生成し、レート制御部116に入力する。
レート制御部116では、入力されたフレーム動き情報を元に視覚特性を考慮した目標SN比を決定し、1GOPの平均SN比がその視覚特性を考慮した目標SN比以上になるようにビットレートを決定する。レート制御部116における処理の詳細を、図4のフローチャートを参照して以下に説明する。図4は、レート制御部116における、ビットレートを決定するための処理の一例を示すフローチャートである。
まず、ステップS401において初期目標SN比(Tsnr)を設定し、さらにフレーム動き検出部115より入力されたフレーム動き情報(Move)を設定する。このフレーム動き情報(Move)は、ピクチャ間で何画素移動したかを示す値である。
次にステップS402では、フレーム動き情報(Move)が第3の閾値ThM1より大きいか否かを判定する。もし、フレーム動き情報(Move)が第3の閾値ThM1より大きい場合には(ステップS402において「YES」)、ステップS403に移行する。一方、フレーム動き情報(Move)が第3の閾値ThM1より大きくない場合には(ステップS402において「NO」)、ステップS404に移行する。
ステップS403では、初期目標SN比(Tsnr)に、所定値Nを加算し、視覚特性を考慮した目標SN比を算出し、ステップS404に移行する。フレーム動き情報(Move)が第3の閾値ThM1より大きい場合、画面全体が動くために高周波成分の少ない信号で画像が構成され、画質劣化を受けてもSN比の大幅な低下は起こりにくい。その一方で、ブロックノイズのような視覚的に目立ちやすいノイズは発生しやすくなる。そこで、本実施形態では、係るノイズを防止するために、目標SN比を上げている。
例えば、第3の閾値ThM1を「32画素」とすることができる。この場合に、フレーム動き情報が「40画素」であり、第3の閾値ThM1の「32画素」より大きく動いた場合は、初期目標SN比(Tsnr)の補正を行ってもよい。この場合、初期目標SN比に加算する所定値Nの値は、動きの大きさによって画質劣化を受けてもSN比が下がらないことから、N=Move/ThM1(dB)とする。
次に、ステップS404では、1GOPの平均SN比(Asnr)を算出する。この平均SN比(Asnr)は、例えば、SN比算出部113で求められた1GOP分のSN比の平均として計算することができる。また、各ピクチャタイプについてSN比算出部113で求められたSN比に基づいて、該SN比の平均により1GOPの平均SN比(Asnr)を予測することもできる。なお、平均SN比の算出方法自体は、発明の本質的特徴ではなく、従って上述した2通りの方法に算出方法が限定されるものではない。よって、1GOPの平均SN比を求める方法として利用可能な他の方法があれば、それを利用することもできる。
続くステップS405では、目標SN比(Tsnr)と、平均SN比(Asnr)との大きさを比較する。もし、目標SN比(Tsnr)よりも平均SN比(Asnr)の方が大きい場合(ステップS405において「YES」)は、ステップS406へ移行する。一方、目標SN比(Tsnr)が平均SN比(Asnr)以上の場合は(ステップS405において「NO」)、ステップS408へ移行する。
ステップS406では、平均SN比(Asnr)が目標SN比(Tsnr)を、第1の閾値Th1より上回っているか否かを更に判定する。もし、平均SN比(Asnr)が目標SN比(Tsnr)を第1の閾値Th1より上回っている場合は(ステップS406において「YES」)、ステップS407に移行する。一方、平均SN比(Asnr)が目標SN比(Tsnr)を第1の閾値Th1より上回っていない場合は(ステップS406において「NO」)、本処理を終了する。
ステップS407では、現在のレート(Rate)から(Asnr−Tsnr)×αを減算し、新レート(Rate-)を算出し、処理を終了する。ここで、αは、VBR(可変ビットレート)において平均ビットレートより算出される任意の係数である。平均SN比(Asnr)が目標SN比(Tsnr)を大きく上回っている場合は、符号量の与え過ぎであってレートを下げても目標SN比を上回る。そこで、ステップS407では、レートを下げる処理を行っている。
例えば、数値としてAsnr = 45.0dB, Tsnr = 40.0dB, Th1 = 2, Rate = 7000000bps, α=200000とした場合を考える。この場合、平均SN比(Asnr)は目標SN比(Tsnr)を、5dB上回っており、この量は第1の閾値Th1よりも大きい。そこで、上記の演算によりレートを下げる処理を行って、新レート(Rate-)を6000000bpsとする。
次に、ステップS408以降の処理を説明する。ステップS408では、目標SN比(Tsnr)が平均SN比(Asnr)を第2の閾値Th2より上回っているか否かを更に判定する。もし、目標SN比(Tsnr)が平均SN比(Asnr)を第2の閾値Th2より上回っている場合は(ステップS408において「YES」)、ステップS409に移行する。一方、目標SN比(Tsnr)が平均SN比(Asnr)を第2の閾値Th2より上回っていない場合は(ステップS408において「NO」)、処理を終了する。
ステップS409では、現在のレート(Rate)に(Tsnr−Asnr)×βを加算し、新レート(Rate+)を算出し、処理を終了する。ここで、βは、VBR(可変ビットレート)において平均ビットレートより算出される任意の係数である。目標SN比(Tsnr)が平均SN比(Asnr)を大きく上回っている場合は、符号量の不足であってレートを上げないと目標SN比を上回ることができない。そこで、ステップS409では、レートを上げる処理を行っている。
例えば、数値としてAsnr = 35.0dB, Tsnr = 40.0dB, Th1 = 2, Rate = 7000000bps, β=200000とした場合を考える。この場合、目標SN比(Tsnr)は平均SN比(Asnr)を、5dB上回っており、この量は第2の閾値Th2よりも大きい。そこで、上記の演算によりレートを上げる処理を行って、新レート(Rate+)を8000000bpsとする。
上記によりビットレートが算出され、それを前述のTM5のSTEP1より目標符号量を算出できる。その目標符号量は量子化制御部117に入力され、TM5のSTEP2およびSTEP3を行うことで、量子化部105の制御を行う。
なお、上述したレート算出式は、あくまで一例であって、レートの増減方法は上記の式に限定されるものではない。平均SN比(Asnr)や目標SN比(Tsnr)、或いはフレーム動き情報(Move)を用いて、他の演算式によりレートを制御することができる。また、フレーム動き検出部115をジャイロセンサ119と動き補償予測部112からの情報を用いたが、いずれか一方のみを用いてもよいし、それ以外の情報を更に利用してもよい。
以上の処理を行うことで、高速なパン等を行った場合のように、SN比の大幅な低下は起こりにくいがノイズが発生しやすい状況下であっても、視覚特性を考慮した目標符号量の設定が可能となり、画質の向上を行うことができる。
[第2の実施形態]
次に、発明の第2の実施形態を図5を参照して説明する。本実施形態に対応する符号化装置は図1に示す構成と同様であり、点線領域120における処理も図3に示したフローチャートと同様である。但し、レート制御部116における処理は、図5に示すフローチャートに従う。以下、図5を参照して、本実施形態に対応するレート制御部116における処理の詳細を説明する。
まず、ステップS501では、初期目標SN比(Tsnr)を設定し、さらにフレーム動き検出部115より入力したフレーム動き情報(Move)を設定する。
次にステップS502では、フレーム動き情報(Move)に基づいて、処理対象のピクチャがピクチャ間での動きが多いピクチャ(動的なピクチャ)であるのか、動きが少ないピクチャ(静的なピクチャ)であるのかを判定する。この判定は、例えば、フレーム動き情報(Move)の値を所定の第4の閾値ThM2と比較し、該第4の閾値ThM2より大きい場合には動的なピクチャと判定し、第4の閾値ThM2以下の場合には静的なピクチャと判定することができる。
当該判定において、静的なピクチャであると判定された場合(ステップS502において「YES」)、ステップS503に移行する。一方、動的なピクチャであると判定された場合(ステップS502において「NO」)、ステップS504に移行する。ステップS503では、静的なピクチャと判定さたピクチャ枚数の計数値であるstill_count値が、所定の閾値Vより大きいか否かを判定する。ここで、still_count値は、符号化対象の動画像について符号化を開始する際に「0」に初期化され、静的なピクチャと判定されると1枚ずつ係数され、係数値として保持される。
もし、still_count値が閾値Vより大きい場合は(ステップS503において「YES」)、ステップS507へ移行する。一方、still_count値が閾値V以下の場合は(ステップS503において「NO」)、ステップS505に移行する。ステップS505では、still_count値に1を加算して増加方向に更新する。次いでステップS507へ移行する。
また、動的なピクチャと判定されステップS504に移行した場合、ステップS504では、still_count値が0か否かを判定する。もし、still_count値が0の場合(ステップS504において「YES」)、ステップS507へ移行する。一方、still_count値が0でない場合(ステップS504において「NO」)、ステップS506に移行して、still_count値から1を減算して減少方向に更新を行う。次いで、ステップS507へ移行する。
ステップS507では、初期目標SN比(Tsnr)を視覚特性を考慮した目標SN比とするために、初期目標SN比(Tsnr)にstill_count値×Wを加算して、目標SN比(Tsnr)の大きさを調整する。
符号化対象のピクチャが静止状態或いは静止に近い状態のピクチャであると判定された場合、他のピクチャとSN比が同等であっても、静的な画像であるため同じ画像を繰り返し見ることにより、ノイズが目立ちやすくなってしまう。これは、ステップS507において目標SN比を引き上げることで防止することが可能となる。
ただし、目標SN比を所望の値に一気に上げると、急に画質が良くなり、画質に違和感が生じてしまう。このため本実施形態では、still_count値により段階をつけることにより、違和感を生じさせないようにしている。例えば、閾値V=9, W=0.4とすると、still_count値は0から10までの値をとることとなり、Tsnrの増加量は0.4dB単位で、最大4dBまで段階的に上げることができる。
ステップS507の処理の後は、第1の実施形態における図4のステップS404以降の処理と同様であり、対応する参照番号を付してある。よって、本実施形態では説明を省略する。
以上により本実施形態では、静止および静止に近い画像でノイズが目立つような場合でも、視覚特性を考慮した目標符号量の設定が可能となり画質の向上を行うことができる。
なお、上述したレート算出式は、あくまで一例であって、レートの増減方法は上記の式に限定されるものではない。平均SN比(Asnr)や目標SN比(Tsnr)、或いはフレーム動き情報(Move)を用いて、他の演算式によりレートを制御することができる。また、フレーム動き検出部115をジャイロセンサ119と動き補償予測部112からの情報を用いたが、いずれか一方のみを用いてもよいし、それ以外の情報を更に利用してもよい。
[その他の実施形態]
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
また、本発明の目的は、前述した機能を実現するコンピュータプログラムのコードを記録した記憶媒体を、システムに供給し、そのシステムがコンピュータプログラムのコードを読み出し実行することによっても達成される。この場合、記憶媒体から読み出されたコンピュータプログラムのコード自体が前述した実施形態の機能を実現し、そのコンピュータプログラムのコードを記憶した記憶媒体は本発明を構成する。また、そのプログラムのコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した機能が実現される場合も含まれる。
さらに、以下の形態で実現しても構わない。すなわち、記憶媒体から読み出されたコンピュータプログラムコードを、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込む。そして、そのコンピュータプログラムのコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行って、前述した機能が実現される場合も含まれる。
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するコンピュータプログラムのコードが格納されることになる。
101・・・入力端子、
102・・・画像並び替え部、
103・・・スイッチ、
104・・・DCT部、
105・・・量子化部、
106・・・可変長符号化部、
107・・・バッファ、
108・・・逆量子化部、
109・・・IDCT部、
110・・・加算器、
111・・・スイッチ、
112・・・動き補償予測部、
113・・・SN比算出部、
114・・・減算器、
115・・・フレーム動き検出部、
116・・・レート制御部、
117・・・量子化制御部、
118・・・出力端子
119・・・ジャイロセンサ

Claims (7)

  1. 画像データを符号化する画像符号化装置であって、
    符号化対象画像を直交変換し、量子化処理して符号化する符号化手段と、
    前記符号化された画像を逆量子化し、逆直交変換して復号する復号手段と、
    前記符号化対象画像と、該符号化対象画像の直前の画像との間の動き情報を検出する動き検出手段と、
    前記符号化対象画像と、該符号化対象画像の前記符号化手段による符号化結果を前記復号手段が復号した復号結果とを用いてSN比を算出するSN比算出手段と、
    前記符号化対象画像において目標とされるSN比の値を示す目標SN比を設定する設定手段と、
    設定された前記目標SN比と前記算出されたSN比との差分の大きさに応じて、前記符号化手段から出力される符号化データのビットレートを調整するレート制御手段と、
    を備え、
    前記設定手段は、前記動き情報によって示される画像間の動き量が所定の閾値以下の状態が所定の複数枚数の画像で続いている場合には、前記動き量が前記所定の閾値以下の状態が所定の複数枚数の画像で続いていない場合よりも、前記目標SN比を大きく設定することを特徴とする画像符号化装置。
  2. 前記レート制御手段は、
    前記算出されたSN比が前記目標SN比よりも大きい場合に、前記算出されたSN比と前記目標SN比との差分を第1の閾値と比較し、該差分が該第1の閾値より大きい場合は、前記ビットレートを下げ、
    前記算出されたSN比が前記目標SN比より大きくない場合に、前記目標SN比と前記算出されたSN比との差分を第2の閾値と比較し、該差分が該第2の閾値より大きい場合は、前記ビットレートを上げる
    ことを特徴とする請求項1に記載の画像符号化装置。
  3. 前記設定手段は、
    前記動き量を前記所定の閾値と比較して、前記動き量が前記所定の閾値以下の場合に前記符号化対象画像が静的な画像であると判定する判定手段を備え、
    前記判定手段により前記静的な画像と判定された枚数を計数した計数値を用いて、前記目標SN比の大きさを調整することを特徴とする請求項1又は2に記載の画像符号化装置。
  4. 前記判定手段は、各画像について、前記静的な画像と判定した場合に、前記計数値を増加方向に更新し、前記静的な画像でないと判定した場合に、前記計数値を減少方向に更新することを特徴とする請求項に記載の画像符号化装置。
  5. 前記符号化対象画像と参照画像との間の動きベクトルを検出する動き補償予測手段と、
    画像を撮像する撮像素子を含む前記画像符号化装置自体の揺れを検出して揺れ情報を生成する揺れ検出手段と
    の少なくともいずれかを更に備え、
    前記動き検出手段は、前記動きベクトルと前記揺れ情報との少なくともいずれかに基づいて前記動き情報を検出することを特徴とする請求項1乃至4のいずれか1項に記載の画像符号化装置。
  6. 画像データを符号化する画像符号化装置の制御方法であって、
    符号化手段が、符号化対象画像を直交変換し、量子化処理して符号化する符号化工程と、
    復号手段が、前記符号化された画像を逆量子化し、逆直交変換して復号する復号工程と、
    動き検出手段が、前記符号化対象画像と、直前の符号化対象画像との間の動き情報を検出する動き検出工程と、
    SN比算出手段が、前記符号化対象画像と、該符号化対象画像の前記符号化工程における符号化結果を前記復号工程において復号した復号結果とを用いてSN比を算出するSN比算出工程と、
    設定手段が、前記符号化対象画像において目標とされるSN比の値を示す目標SN比を設定する設定工程と、
    レート制御手段が、設定された前記目標SN比と前記算出されたSN比との差分の大きさに応じて、前記符号化手段から出力される符号化データのビットレートを調整するレート制御工程と、
    を備え、
    前記設定工程は、前記動き情報によって示される画像間の動き量が所定の閾値以下の状態が所定の複数枚数の画像で続いている場合には、前記動き量が前記所定の閾値以下の状態が所定の複数枚数の画像で続いていない場合よりも、前記目標SN比を大きく設定することを特徴とする画像符号化装置の制御方法。
  7. コンピュータを請求項1乃至のいずれか1項に記載の画像符号化装置として機能させるための、コンピュータプログラム。
JP2012116979A 2012-05-22 2012-05-22 画像符号化装置及びその制御方法、コンピュータプログラム Expired - Fee Related JP5409842B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012116979A JP5409842B2 (ja) 2012-05-22 2012-05-22 画像符号化装置及びその制御方法、コンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012116979A JP5409842B2 (ja) 2012-05-22 2012-05-22 画像符号化装置及びその制御方法、コンピュータプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007287852A Division JP5006763B2 (ja) 2007-11-05 2007-11-05 画像符号化装置及びその制御方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2012182831A true JP2012182831A (ja) 2012-09-20
JP5409842B2 JP5409842B2 (ja) 2014-02-05

Family

ID=47013586

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012116979A Expired - Fee Related JP5409842B2 (ja) 2012-05-22 2012-05-22 画像符号化装置及びその制御方法、コンピュータプログラム

Country Status (1)

Country Link
JP (1) JP5409842B2 (ja)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03124143A (ja) * 1989-10-09 1991-05-27 Oki Electric Ind Co Ltd 動画像パケット符号化・復号化方式
JPH0541859A (ja) * 1991-08-05 1993-02-19 Oki Electric Ind Co Ltd 画像圧縮符号化装置
JPH0965200A (ja) * 1995-08-18 1997-03-07 Sony Corp 信号処理装置及びその方法
JPH09191458A (ja) * 1996-01-10 1997-07-22 Nippon Columbia Co Ltd 動画像圧縮符号化方法及びその装置
JPH1013249A (ja) * 1996-06-20 1998-01-16 Matsushita Electric Ind Co Ltd 画像情報圧縮装置
JP2002044621A (ja) * 2000-07-26 2002-02-08 Mitsubishi Electric Corp 画像伝送装置
JP2005269428A (ja) * 2004-03-19 2005-09-29 Oki Electric Ind Co Ltd 動画像符号化装置
WO2006099082A2 (en) * 2005-03-10 2006-09-21 Qualcomm Incorporated Content adaptive multimedia processing
JP2007053620A (ja) * 2005-08-18 2007-03-01 Oki Electric Ind Co Ltd 画像処理装置および画像処理方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03124143A (ja) * 1989-10-09 1991-05-27 Oki Electric Ind Co Ltd 動画像パケット符号化・復号化方式
JPH0541859A (ja) * 1991-08-05 1993-02-19 Oki Electric Ind Co Ltd 画像圧縮符号化装置
JPH0965200A (ja) * 1995-08-18 1997-03-07 Sony Corp 信号処理装置及びその方法
JPH09191458A (ja) * 1996-01-10 1997-07-22 Nippon Columbia Co Ltd 動画像圧縮符号化方法及びその装置
JPH1013249A (ja) * 1996-06-20 1998-01-16 Matsushita Electric Ind Co Ltd 画像情報圧縮装置
JP2002044621A (ja) * 2000-07-26 2002-02-08 Mitsubishi Electric Corp 画像伝送装置
JP2005269428A (ja) * 2004-03-19 2005-09-29 Oki Electric Ind Co Ltd 動画像符号化装置
WO2006099082A2 (en) * 2005-03-10 2006-09-21 Qualcomm Incorporated Content adaptive multimedia processing
JP2007053620A (ja) * 2005-08-18 2007-03-01 Oki Electric Ind Co Ltd 画像処理装置および画像処理方法

Also Published As

Publication number Publication date
JP5409842B2 (ja) 2014-02-05

Similar Documents

Publication Publication Date Title
JP4221655B2 (ja) 符号化装置および符号化方法、プログラム、並びに記録媒体
JPWO2010106670A1 (ja) 画像符号化装置、画像符号化制御方法および画像符号化プログラム
US9615095B2 (en) Coding device, imaging device, coding transmission system, and coding method
JP4485996B2 (ja) 画像符号化装置及び画像符号化プログラム
JP5078837B2 (ja) 符号化装置、符号化装置の制御方法及びコンピュータプログラム
KR20180056382A (ko) 비디오를 인코딩하기 위한 방법 및 인코더 시스템
JP2007318617A (ja) 画像符号化装置、及び画像符号化プログラム
JP5006763B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP5410638B2 (ja) 量子化制御装置及び方法、及び量子化制御プログラム
JP5943733B2 (ja) 画像符号化装置およびその制御方法ならびにプログラム
JP5111128B2 (ja) 符号化装置、符号化装置の制御方法及びコンピュータプログラム
JP4857243B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP2004328150A (ja) 動画像符号化装置及び方法
JP4942208B2 (ja) 符号化装置
JP5409842B2 (ja) 画像符号化装置及びその制御方法、コンピュータプログラム
JP4343667B2 (ja) 画像符号化装置及び画像符号化方法
JP4936557B2 (ja) 符号化装置
JP2005045736A (ja) 画像信号符号化方法及び装置、符号化制御装置並びにプログラム
JP4823150B2 (ja) 符号化装置並びに符号化方法
US8761530B2 (en) Apparatus and method to control target code amount
JP5419560B2 (ja) 撮像装置
JP6239838B2 (ja) 動画像符号化装置、その制御方法、及び撮像装置
JP2007300557A (ja) 画像符号化装置及び画像符号化方法
JP2012105128A (ja) 画像符号化装置
JP2010118912A (ja) 画像符号化装置、制御方法、及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130716

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130719

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131105

LAPS Cancellation because of no payment of annual fees