JP2007235377A - 画像符号化方法 - Google Patents
画像符号化方法 Download PDFInfo
- Publication number
- JP2007235377A JP2007235377A JP2006052669A JP2006052669A JP2007235377A JP 2007235377 A JP2007235377 A JP 2007235377A JP 2006052669 A JP2006052669 A JP 2006052669A JP 2006052669 A JP2006052669 A JP 2006052669A JP 2007235377 A JP2007235377 A JP 2007235377A
- Authority
- JP
- Japan
- Prior art keywords
- pixel value
- image
- correction
- conversion
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】色の変化が乏しく、比較的広い領域は、量子化による画質低下が目立つ。
【解決手段】画像補正部70は予め、画素値があまり変化せず、比較的大きな面積を占める画像領域に対して表現上の階調を上げておく。その結果、量子化部30で量子化されたときであっても、表現上の階調、すなわちビット数が十分に残るため、量子化による画質低下が軽減される。逆に、量子化で画質の低下が問題になりにくい画像領域については、一層のデータ削減が実現する。
【選択図】図1
【解決手段】画像補正部70は予め、画素値があまり変化せず、比較的大きな面積を占める画像領域に対して表現上の階調を上げておく。その結果、量子化部30で量子化されたときであっても、表現上の階調、すなわちビット数が十分に残るため、量子化による画質低下が軽減される。逆に、量子化で画質の低下が問題になりにくい画像領域については、一層のデータ削減が実現する。
【選択図】図1
Description
本発明は、画像を符号化する方法に関し、とくに静止画像または動画像に含まれるピクチャを符号化する方法に関する。
ブロードバンドネットワークが急速に発展しており、高品質な動画像を利用したサービスに期待が集まっている。また、DVDなど大容量の記録媒体が利用されており、高画質の画像を楽しむユーザ層が広がっている。動画像を通信回線で伝送したり、記録媒体に蓄積するために不可欠な技術として圧縮符号化がある。動画像圧縮符号化技術の国際標準として、MPEG4の規格やH.264/AVC規格がある。また、1つのストリームにおいて高画質のストリームと低画質のストリームを併せもつSVC(Scalable Video Coding)のような次世代画像圧縮技術がある。
高解像度の動画像をストリーム配信したり、記録媒体に蓄積する場合、通信帯域を圧迫しないように、あるいは、記憶容量が大きくならないように、動画ストリームの圧縮率を高める必要がある。そのため、符号化プロセスにて行われる量子化の段階でデータを大幅に削減する方法は有効である。
特開2005−260902号公報
しかし、量子化によるデータの削減と画質はトレードオフの関係にある。とくに、画像に含まれる、比較的変化の少ない、例えば空や壁のようなオブジェクトは、大幅な量子化によって画素値の変化が階段状になり、好ましくない縞模様が出現するなど、画質低下が目立ちやすい。
本発明はこうした状況に鑑みてなされたもので、その目的は、画質の低下を抑止しつつ符号量を削減する画像符号化技術を提供することにある。
本発明のある態様は画像符号化方法であり、ピクチャの領域ごとに、所定の画素値付近を強調する補正を実行するとともに、その補正に関する情報を前記ピクチャの符号化データに含める。所定の画素値は、その領域の画像の全体的な性質に依存して定まるものであってもよい。
「ピクチャ」は、符号化の単位であり、その概念にはフレーム、フィールド、VOP(Video Object Plane)などを含む。「領域」は任意であるが、例えば後述のMPEGでいうマクロブロック、スライス、ピクチャ、ROI(注目領域)などの処理単位である。「所定の画素値付近」は所定の画素値を含み、かつ幅をもつ画素値の範囲であればよい。
本発明の別の態様も画像符号化方法であり、所定の画素値付近の階調を高める補正を実行するとともに、その補正に関する情報を前記ピクチャの符号化データに含める。前記所定の画素値は、ピクチャの画素値の分布に依存して定まるものであってもよい。また、対象とする領域の代表値であってもよい。その場合、複雑な演算を利用しなくても代表値が容易に定まる。
補正に関する情報は、補正として画素値を変換ないし逆変換する際の規則を複数の規則群の中から特定する識別情報を含んでもよい。その場合、識別情報だけを符号化すれば足りるため、追加の符号量が少なくて済む。補正に関する情報は、補正として画素値を変換ないし逆変換する際の規則を記述するテーブルを含んでもよい。その場合、変換規則を詳細に記述できる。補正に関する情報は、補正として画素値を変換ないし逆変換する際の変換式を示す情報を含んでもよい。その場合も変換規則を詳細に記述できる。補正に関する情報は代表値を示す情報を含んでもよい。以上の任意の組合せを含んでもよい。
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、コンピュータプログラム、記録媒体などの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、画質を保ちながら画像の符号量を削減することができる。
図1は、実施の形態に係る符号化装置100の構成図である。これらの構成は、ハードウエア的には、任意のコンピュータのCPU、メモリ、その他のLSIで実現でき、ソフトウエア的にはメモリにロードされた画像符号化機能のあるプログラムなどによって実現されるが、ここではそれらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックがハードウエアのみ、ソフトウエアのみ、またはそれらの組み合わせによっていろいろな形で実現できることは、当業者には理解されるところである。
本実施の形態の符号化装置100は、国際標準化機関であるISO(International Organization for Standardization)/IEC(International Electrotechnical Commission)によって標準化されたMPEG(Moving Picture Experts Group)シリーズの規格(MPEG−1、MPEG−2およびMPEG−4)、電気通信に関する国際標準機関であるITU−T(International Telecommunication Union-Telecommunication Standardization Sector)によって標準化されたH.26xシリーズの規格(H.261、H.262およびH.263)、もしくは両方の標準化機関によって合同で標準化された最新の動画像圧縮符号化標準規格であるH.264/AVC(両機関における正式勧告名はそれぞれMPEG-4 Part 10: Advanced Video CodingとH.264)に準拠して動画像の符号化を行う。
MPEGシリーズの規格では、フレーム内符号化を行う画像フレームをI(Intra)フレーム、過去のフレームを参照画像として順方向のフレーム間予測符号化を行う画像フレームをP(Predictive)フレーム、過去と未来のフレームを参照画像として双方向のフレーム間予測符号化を行う画像フレームをBフレームという。
一方、H.264/AVCでは、参照画像として利用できるフレームは、時間の先後を問わず、過去の2枚のフレームを参照画像としてもよく、未来の2枚のフレームを参照画像としてもよい。また、参照画像として利用できるフレームの枚数も問わず、3枚以上のフレームを参照画像として用いることもできる。したがって、MPEG−1/2/4では、Bフレームは双方向予測(Bi-directional prediction)フレームのことを指していたが、H.264/AVCでは、Bフレームは、参照画像の時間の先後は問わないため、双予測(Bi-predictive prediction)フレームのことを指すことに留意する。
なお、実施の形態では、符号化の単位としてフレームを例に挙げて説明するが、符号化の単位はフィールドであってもよい。また、符号化の単位はMPEG−4におけるVOPであってもよい。また、Iフレーム、Pフレーム、Bフレームに対応して、1フレームを水平方向に分割したスライス単位で予測符号化を行う場合は、それらのスライスをそれぞれ、Iスライス、Pスライス、Bスライスと呼ぶ。
符号化装置100は、入力ストリームとしてフレーム単位で動画像の入力を受け取り、動画像を符号化し、符号化ストリームを出力する。入力された動画フレームはフレームメモリ80に格納される。
画像補正部70は、フレームメモリ80に格納された動画フレームを読み出し、後述の方法で画素値を変換し、変換後の動画フレームのデータ(以下これを単に「補正後データ」と呼ぶ)を再度フレームメモリ80へ書き戻す。画像補正部70は変換に際し、変換支援情報保持部72に予め記憶された情報を参照する。画像補正部70は変換に関するID(後述)を可変長符号化部90へ通知する。
動き補償部60は、補正後データとしてフレームメモリ80に格納されている過去または未来の画像フレームを参照画像として利用し、PフレームまたはBフレームのマクロブロック毎に動き補償を行い、動きベクトルと予測画像を生成する。動き補償部60は、符号化対象のPフレームまたはBフレームの画像と予測画像の差分を取り、差分画像をDCT部20に供給する。また、動き補償部60は、生成した動きベクトルを可変長符号化部90に供給する。
PフレームもしくはBフレームの符号化処理の場合は、上述のように動き補償部60が動作するが、Iフレームの符号化処理の場合は、動き補償部60は動作せず、ここでは図示しないが、Iフレームはフレーム内予測が行われた後、DCT部20に供給される。
動きベクトルは、符号化対象のフレームを所定の画素数で分割したマクロブロックの動きを示すベクトルであり、マクロブロックのそれぞれに対し、最も誤差の小さい予測マクロブロックを参照画像から検出することによって得られる。動きベクトルの検出は、対象マクロブロックとマッチングする参照画像における参照マクロブロックを1画素単位または小数画素単位で探索ことにより行われる。
DCT部20は、動き補償部60から供給された画像を離散コサイン変換(DCT)し、得られたDCT係数を量子化部30に与える。
量子化部30は、DCT係数を量子化し、可変長符号化部90に与える。可変長符号化部90は、画像補正部70からのIDと、差分画像の量子化されたDCT係数と、動き補償部60から与えられた動きベクトルとを可変長符号化し、多重化部92に与える。多重化部92は、可変長符号化部90から与えられた符号化後のIDとDCT係数と動きベクトルとを多重化し、符号化ストリームを生成する。多重化部92は、符号化ストリームを生成する際、符号化されたフレームを時間順序に並べ替える処理を行う。
図2は画像補正部70と変換支援情報保持部72の内部構成を示す。パターン決定部102は、動画フレームの領域ごとに画素値の分布がパターン記憶部110に予め記憶されたいずれのパターンに近いかを決定する。パターン記憶部110には、分布のパターンがいくつか記憶されている。「領域」はどのようなものでもよいが、一例としてマクロブロックを採用できる。
パターンが決定されれば、変換テーブル決定部104はそのパターンに対応して予め定められた変換テーブルを変換テーブル記憶部112から決定し、変換テーブルのIDを可変長符号化部90へ通知する。変換テーブル記憶部112には、パターンごとに変換テーブルが対応づけられて予め記憶されている。変換テーブルは変換前の画素値と変換後の画素値の対応を記述する。
ここで画素値の変換は、領域ごとに、その領域の画像の全体的な性質に依存して定まる所定の画素値(以下「注目画素値」と呼ぶ)付近を強調するように実行される。注目画素値として、各領域の画像において代表値を採用する。代表値として、その領域の画素値の平均値、最頻値、中央値を採用する。以下、注目画素値といえば、最頻値、平均値、中央値のいずれでもよいものとする。
例えば、領域内にいろいろなオブジェクトが含まれ、その中に「空」のような変化の乏しいオブジェクトがあるとする。その場合、空の部分のデータを量子化によって削減すると、前述のごとく階段状のノイズが目立つ。そのため本実施の形態では、予め空の部分に強調処理を施す。具体的には、後述のごとく空の部分により多くの表現ビットを与え、階調を上げておく。そうすれば、量子化が施されても有効な表現ビット数が比較的多めに残るため、階段状のノイズが軽減できる。ノイズが目立つ空のような部分は、
1.画素値があまり変化しない、または低周波成分が多い、
2.比較的大きな面積を占める、
という性質をもつため、1からは最頻値を、一方、2からは平均値や中央値を注目画素値にすると効果的である。本実施の形態では、注目画素値付近に表現ビットをより多く割り当てる。変換テーブルはその趣旨で作成されている。
1.画素値があまり変化しない、または低周波成分が多い、
2.比較的大きな面積を占める、
という性質をもつため、1からは最頻値を、一方、2からは平均値や中央値を注目画素値にすると効果的である。本実施の形態では、注目画素値付近に表現ビットをより多く割り当てる。変換テーブルはその趣旨で作成されている。
変換部106は、変換テーブル決定部104が領域ごとに決定した変換テーブルに従い、動画フレームの画素値を領域ごとに変換し、補正後データを作成してこれをフレームメモリ80へ書き戻す。
図3(a)から図3(e)はパターン記憶部110に記憶されるパターンの例である。横軸Pは画素値、縦軸fは出現回数、すなわち頻度を示す。パターン決定部102は入力した動画フレームの領域ごとに分布を作成した後、そのパターンが図3(a)から図3(e)のいずれに近いかを既知のパターンマッチングにより決定する。
図4は、決定されたパターンが図3(a)である場合にそれを拡大して示し、図5(a)はそのパターンに対応して予め定められた変換規則を示す。図5(a)で横軸Pxは変換前、縦軸Pyは変換後の画素値を示す。ここでは注目画素値の値自体は無視し、単にパターンマッチングで図4のパターンが定まり、図5(a)においても注目画素値は便宜的に定めている。この例では、画素値が取り得る範囲の中心値Pcを注目画素値としている。実際には、この変換規則を画素値各点について記述することで変換テーブルが定まるが、以下、変換規則と変換テーブルは特に区別せずに説明する。
図5(b)は変換後の画素値の表現密度を模式的に示す。同図のごとく、注目画素値Pc付近が密に分割され、注目画素値付近の表現上の階調が上がる。同図では、変換後最も密に表現される画素値もPcとしている。
図5(a)の変換テーブルは変換テーブル記憶部112に予め記憶される変換テーブルのいずれかであるから、このテーブルは単に識別用のIDで特定できる。たとえば、変換テーブル決定部104から「ID=1」などのIDが可変長符号化部90へ通知される。なお、復号側は符号化側の変換テーブルではなく、その逆変換テーブルが必要になる。そのため、符号化側の変換テーブルと復号側の逆変換テーブルは予め組として同じIDを与えておく。したがって、符号化側から復号側へ通知するIDは、「変換テーブルのID」と把握してもよいし、「逆変換テーブルのID}と把握してもよい。
以上、実施の形態を説明した。この実施の形態によれば、量子化によって階段状のノイズが目立つ領域に対し、予め表現上の階調を上げることで量子化による画質低下を抑制できる。一方、ノイズがあまり目立たない領域、例えばもともと画素値の変化が大きいか、面積の小さい領域については、逆に表現上の階調を下げることにより、画質低下を抑制しつつデータ量の低減が可能となる。以下、変形例を挙げる。
実施の形態では、符号化側と復号側が予め変換テーブルの組を把握していたが、符号化側が新たな変換テーブルを採用する場合、IDでは通知ができない。その場合、変換テーブルないし逆変換テーブル自体を符号化して送ればよい。具体的には、変換テーブル決定部104は変換テーブル記憶部112から復号側が知らないか、または、知らない可能性のある変換テーブルを特定し、そのIDに替えて、変換テーブル自体を可変長符号化部90へ送ればよい。図5(a)では、注目画素値を便宜的に定めたが、変換テーブル自体を送る場合、実際に最頻値、平均値ないし中央値であった画素値を注目画素値として変換テーブルに反映した上でこのテーブルを通知することができる。したがって、より的確な画像補正が実現する。
実施の形態では、変換テーブルを利用したが、変換式を利用してもよい。その場合、変換テーブル記憶部112は変換テーブルに替えて変換式を保持し、変換テーブル決定部104は変換テーブルに替えてパターン決定部102で決定されたパターンに対応する変換式を変換テーブル記憶部112において決定する。決定した変換式はIDの形で可変長符号化部90へ通知され、符号化データへ組み込まれる。
この変形例についても、もちろんIDではなく、変換式自体を復号側へ通知してもよい。変換式自体を送る場合、現実の注目画素値を反映できる。現実の注目画素値は内在的な形で符号化データに組み込まれることになる。図6は変換式が二次関数である場合の表現例を説明するもので、横軸Pxは変換前、縦軸Pyは変換後の画素値を示す。ここで、以下の記号を定める。
Px: 変換前の画素値
Py: 変換後の画素値
Tx: 変換前の注目画素値
Ty: 変換後の注目画素値
Mx: 変換前の画素値の最大値
rate: 変換時に使用される倍率
Py: 変換後の画素値
Tx: 変換前の注目画素値
Ty: 変換後の注目画素値
Mx: 変換前の画素値の最大値
rate: 変換時に使用される倍率
このとき、以下のように定めれば図6の変換式が表現できる。
Ty=Tx*rate
Py≦Txの場合
Py=Px2/Tx*rate
Py>Txの場合
Py={Mx−(Mx−Px)2/(Mx−Tx)}*rate
Ty=Tx*rate
Py≦Txの場合
Py=Px2/Tx*rate
Py>Txの場合
Py={Mx−(Mx−Px)2/(Mx−Tx)}*rate
実施の形態では、図3(a)のパターンを説明した。図3(b)から図3(d)まではその調整で対応できるが、複数個所で頻度が極大になる図3(e)の場合、新たな考察が必要となる。この場合、図7に示すごとく、複数個所に注目画素値P1、P2をもつ変換テーブルを準備すればよい。この例でも、ふたつの注目画素値も区間毎の最頻値と見なすことができるので、最頻値の概念に包括される。
実施の形態では符号化側を説明した。復号側は符号化側と逆の処理を行えばよいため、図示しないが、一般的なMPEGのデコーダのあとに、画素値を逆変換する画像補正部を置けばよい。
実施の形態では動画像の符号化を説明した。しかし、本発明は静止画像の符号化にも適用でき、画質低下を抑制しつつデータ量を低減する効果が得られる。
20 DCT部、 30 量子化部、 60 動き補償部、 70 画像補正部、 72 変換支援情報保持部、 80 フレームメモリ、 90 可変長符号化部、 92 多重化部、 100 符号化装置、 102 パターン決定部、 104 変換テーブル決定部、 110 パターン記憶部、 112 変換テーブル記憶部。
Claims (7)
- ピクチャの領域ごとに、所定の画素値付近を強調する補正を実行するとともに、その補正に関する情報を前記ピクチャの符号化データに含めることを特徴とする画像符号化方法。
- 所定の画素値付近の階調を高める補正を実行するとともに、その補正に関する情報を前記ピクチャの符号化データに含めることを特徴とする画像符号化方法。
- 請求項1または2に記載の方法において、前記所定の画素値は、対象とする領域の代表値であることを特徴とする画像符号化方法。
- 請求項1から3のいずれかに記載の方法において、前記補正に関する情報は、前記補正として画素値を変換ないし逆変換する際の規則を複数の規則群の中から特定する識別情報を含むことを特徴とする画像符号化方法。
- 請求項1から3のいずれかに記載の方法において、前記補正に関する情報は、前記補正として画素値を変換ないし逆変換する際の規則を記述するテーブルを含むことを特徴とする画像符号化方法。
- 請求項1から3のいずれかに記載の方法において、前記補正に関する情報は、前記補正として画素値を変換ないし逆変換する際の変換式を示す情報を含むことを特徴とする画像符号化方法。
- 請求項3に記載の方法において、前記補正に関する情報は、前記代表値を示す情報を含むことを特徴とする画像符号化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006052669A JP2007235377A (ja) | 2006-02-28 | 2006-02-28 | 画像符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006052669A JP2007235377A (ja) | 2006-02-28 | 2006-02-28 | 画像符号化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007235377A true JP2007235377A (ja) | 2007-09-13 |
Family
ID=38555541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006052669A Pending JP2007235377A (ja) | 2006-02-28 | 2006-02-28 | 画像符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007235377A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0965252A (ja) * | 1995-06-16 | 1997-03-07 | Mitsubishi Electric Corp | 階調補正装置 |
JP2000134631A (ja) * | 1998-10-23 | 2000-05-12 | Canon Inc | 画像符号化装置、方法、画像復号化装置、方法及びコンピュータ読み取り可能な記憶媒体 |
JP2002010104A (ja) * | 2000-06-21 | 2002-01-11 | Pioneer Electronic Corp | 映像信号の輝度レベル補正装置 |
-
2006
- 2006-02-28 JP JP2006052669A patent/JP2007235377A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0965252A (ja) * | 1995-06-16 | 1997-03-07 | Mitsubishi Electric Corp | 階調補正装置 |
JP2000134631A (ja) * | 1998-10-23 | 2000-05-12 | Canon Inc | 画像符号化装置、方法、画像復号化装置、方法及びコンピュータ読み取り可能な記憶媒体 |
JP2002010104A (ja) * | 2000-06-21 | 2002-01-11 | Pioneer Electronic Corp | 映像信号の輝度レベル補正装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7792193B2 (en) | Image encoding/decoding method and apparatus therefor | |
US9420279B2 (en) | Rate control method for multi-layered video coding, and video encoding apparatus and video signal processing apparatus using the rate control method | |
US20070025442A1 (en) | Coding method for coding moving images | |
JP4703449B2 (ja) | 符号化方法 | |
US11743475B2 (en) | Advanced video coding method, system, apparatus, and storage medium | |
US20150312575A1 (en) | Advanced video coding method, system, apparatus, and storage medium | |
US20030095603A1 (en) | Reduced-complexity video decoding using larger pixel-grid motion compensation | |
JP2006521771A (ja) | ハイブリッドレートコントローラーを備えるデジタルストリームトランスコーダー | |
JP2008011455A (ja) | 符号化方法 | |
JP2006279573A (ja) | 符号化装置と方法、ならびに復号装置と方法 | |
Nguyen et al. | Adaptive downsampling/upsampling for better video compression at low bit rate | |
JP2007174568A (ja) | 符号化方法 | |
JP2007266749A (ja) | 符号化方法 | |
JP2007235314A (ja) | 符号化方法 | |
US20050135486A1 (en) | Transcoding method, medium, and apparatus | |
JP7343817B2 (ja) | 符号化装置、符号化方法、及び符号化プログラム | |
JP2007036888A (ja) | 符号化方法 | |
JP4660408B2 (ja) | 符号化方法 | |
JP2007036889A (ja) | 符号化方法 | |
JP4401341B2 (ja) | 符号化方法 | |
JP4209134B2 (ja) | 圧縮ビットストリームをアップサンプリングする方法および装置 | |
JP2007266750A (ja) | 符号化方法 | |
JP4169767B2 (ja) | 符号化方法 | |
JP4243286B2 (ja) | 符号化方法 | |
JP4697561B2 (ja) | 復号装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101013 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101019 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110301 |