JP4128604B2 - 画像信号の符号化方法 - Google Patents
画像信号の符号化方法 Download PDFInfo
- Publication number
- JP4128604B2 JP4128604B2 JP2007052344A JP2007052344A JP4128604B2 JP 4128604 B2 JP4128604 B2 JP 4128604B2 JP 2007052344 A JP2007052344 A JP 2007052344A JP 2007052344 A JP2007052344 A JP 2007052344A JP 4128604 B2 JP4128604 B2 JP 4128604B2
- Authority
- JP
- Japan
- Prior art keywords
- block
- edge
- frame
- blocks
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明における符号化方法は、入力画像の1フレーム上でエッジを抽出し、前記フレームを、前記抽出エッジが存在するブロックと存在しないブロックに分類し、前記抽出エッジが存在する前記ブロックについて、エッジの方向とDCT係数の分布との間の相関性に基き最適な走査順序を定めてその走査順序で符号化するステップを含む。
図1に従来の典形的な適応型DCT符号化方式のブロック図を示す。
ブロック1で実施される離散コサイン変換(DCT)は、ペルの値のブロック(a block of pel values)を水平及び垂直空間周波数係数のマトリクスに変換する。M×Mの2次元DCTが次の様に定義される。
本発明のアルゴリズムの概念を図5にブロック図で示す。これは、ブロック分類過程が、エッジ情報を用いて一意的に履行されると云う新しい考えを特徴としている。普通、従来の適応型DCT符号化では、ブロックの分類が最初のパス(path)で実施され、その後2番目のパスで実際の符号化が行なわれる。これに対して、ここで提案する方式は、最初に全体の像の中のエッジを抽出し、その後各々のブロックを符号化する。
前に述べた様に、エッジの方向と対応するDCT係数の分布との間には相関性がある。従って、この性質を利用することにより、ブロック内の符号化される最後の係数までの走査パスを最短にする1組の適当な走査順序を定めることができる。言い換えれば、ブロック内の伝送される最後の係数までの合計ランは、走査順序をブロック毎に適応型で変えることによって減少することができる。この為、適応型走査方式は、画質に影響を与えずに、変換係数に対するコードワードの合計の長さを短縮することができる。これは、復号器に於ける逆走査動作の後の係数は、非適応型符号化と完全に同一でなけばならないからである。
入力画像上のエッジを線近似方式により抽出する(図5のブロック10)。この方式は、階層型エッジ検出(hierarchical edge detection)と呼ばれる。オーバヘッドを減らす為、減数した像(decimated image)に対してエッジの抽出を適用する。これは、エッジのデータ、計算の複雑さ並びに、ブロック分類の為メモリ空間が減少すると云う利点がある。その結果行なわれるブロックの分類が主符号化過程、即ち、適応型DCT符号化にとって適切であることを保証するくらいに、エッジの場所が精密でなければならないから、1/4のサイズの像(水平方向も垂直方向も1/2)を使う。ブロックの分類は若干変更するが、その違いによっては、全体的な符号化性能の低下は殆ど起こらない。使う減数フィルタは符号器の選択に任される。これは、フィルタがその後に続く過程、即ち、エッジの抽出に余り影響しないからである。エッジ抽出過程の詳細は後述する。
ブロック分類が行なわれた後、各々のブロックが、類に関連する走査順序で符号化される(図5のブロック12)が、詳細には、先ず、入力ブロックに対して可変ブロックサイズDCTの処理が行われる(図6のブロック13)。可変ブロックサイズDCTは数式(1)のMの値をブロックサイズ(例えば、16×16ブロックDCTの場合はM=16)とすることで実現できる。ブロックサイズの分類はエッジの有無により行われ、16×16のブロック内にエッジが存在すれば4分割して8×8ブロックDCTとして処理し、エッジが存在しなければ16×16ブロックDCTとして処理する。次に量子化が実施されるが(ブロック4)、この動作は図1で説明された量子化(ブロック2)の動作と基本的には同一であるが、本実施例ではブロックの類に依らず、図3の量子化マトリックスを用いている。適切な数の類は像の形式、即ち、ブロックDCT係数の分布に関係するものでなければならない。その為、像順序を符号化する前に、何組かの走査順序が限定される融通性を持った制御機構を採用し、その後、フレーム毎に、その中で各々の類に対する最適の走査順序を選ぶ(図6のブロック15)。シミュレーションでは、5組の走査順序Si,i=0,1…,S−1(S=5)が決められている。S0及びS4が夫々図10及び11に示されており、S2は図2のジグザグ型走査と同一である。S1はS0とS2の中間であり、S3もS4とS2の中間である。続いて可変長符号化が行われる(ブロック16)が、この動作は図1で説明したVLC(ブロック3)の動作と同じである。
ここでs=0,1…S−1,及びk=0,1…K−1であり、path[s][i][j]は走査sの(i,j)に於ける順序、cnt[k][i][j]は類kの(i,j)に於ける係数の数を表わす。
エッジの抽出(図5のブロック10)に関して図13を用いて詳述する。
図13はエッジの抽出のブロック図を示す。この過程の各部分を次に説明する。
エッジの場所を突き止める為、最初に、周知のラプラース演算子を入力像に適応し(ブロック17)、その後、強度変動が大きい位置、即ち、エッジを表わす2進像(バイナリ・イメージ)が、μ+K・σを用いた閾値作用によって求められる。ここで、μ,σ及びKはそれぞれ、平均、微分空間の標準偏差及び係数である。8方向の小さいセグメント・パターンの一例が図14に示されており、これらが、n=0,1…7として、テンプレートTnによって表わされており、(j,k)に於ける各々の入口がtn(j,n)によって表わされる。
Λ(x,y)を、j,k=0,1,2,3,4として、λ(x+j,y+k)で表わされる、5×5画素領域で構成された2進像内の部分領域とする。テンプレートTn及びΛ(x,y)の間の相互相関Rn(x,y)が次の式によって計算される。
単位エッジを抽出した後、図15に示す様に、マクロエッジの検出が実施される。単位エッジが接続されてマクロエッジになる。このマクロエッジは、16の方向に、即ち11.25°間隔で定められる。検出の出発点は、8個の内の任意のビット平面のフラグが作用している画素と定めることができる。こう云う点は、ラスター走査式に求めて、出発点の下方に接続する探索区域を局限することができる。
表3はマクロエッジ当たりの符号化されるメッセージである。出発点に関するメッセージは、適正な符号化方式を使うことによって更に圧縮することができる。
本発明に係るブロック分類に基づいて、各々の類に対する伝送されるDCT係数の分布を解明する為の予備実験を実施した。
基準モデルとしてMPEG−1のI映像符号化を用い、比較を公平にする為、シュミレーション実験を繰り返して実行して、ビットの合計数が基準モデル、即ち、MPEG−1のそれとなるべく近くなる様にした。表4は、この実験で得られた統計結果を示す。
本発明におけるアルゴリズムがブロック分類の為のビットをかなり節約することができることが認められる。表に示した幾何学的なエッジ表示に対するデータ速度は常に1,320×log25である。ここで、1,320は、352×240サイズの像内にある8×8ブロックの数に対応し、log25は各々のブロックに対して5つの候補の間の走査順序を示す為に必要である。
画像信号に対し効率の良い圧縮符号化を達成する。
11 ブロック分類ステップ
12 適応型DCT符号化ステップ
13 可変ブロックサイズDCTステップ
14 量子化ステップ
15 走査順序制御ステップ
16 可変長符号化ステップ
Claims (5)
- 映像信号の各フレームをコーディングする方法であって、
フレーム全体でエッジ抽出を実行するステップと、
抽出エッジを出発座標、所定の複数の方向の1つ、及び長さでコーディングするステップと、
上記フレームを複数のブロックに分割するステップと、
上記複数のブロックの各々を複数のカテゴリーの1つに分類するステップであって、その複数のカテゴリーが、抽出エッジを含まないブロックの第1のカテゴリー、1つの抽出エッジと上記所定の複数の方向の対応する1つとを含むブロックの第2のカテゴリー、及び1より多い抽出エッジを含むブロックの第3のカテゴリーを含むステップと、
上記第1のカテゴリーとして分類されたブロックが隣接する場合にそれら隣接するブロックを統合するステップと、
各ブロックを空間ドメイン画素からDCT係数へDCTにより変換するステップと、
デフォルトのジグザグ走査順序と複数の方向走査順序とを含むDTC係数走査順序を提供するステップであって、各方向走査順序が、上記所定の複数の方向の1つに対応すると共に上記対応する方向のためのDCT係数の予測分布に対応する順序を有するステップと、
上記DCT係数走査順序の対応する1つを使用する各ブロックの上記DCT係数を可変長コーディングするステップであって、それにより、上記第1及び第3のカテゴリーに分類されたブロックを上記デフォルトのジグザグ走査順序で走査し、上記第2のカテゴリーの1つに分類されたブロックを上記対応する方向のための方向走査順序で走査するステップと、
を有する方法。 - 上記分類するステップの上記所定の複数の方向が16である請求項1に記載の映像信号の各フレームをコーディングする方法。
- 上記フレーム全体でエッジ抽出を実行するステップが、
上記フレームよりも小さい間引きされたフレームを形成するステップと、
上記間引きされたフレームでエッジ抽出を実行するステップと、
を含む請求項1又は2に記載の映像信号の各フレームをコーディングする方法。 - 間引きされたフレームを形成するステップが、水平方向に半分に、垂直方向に半分に、上記フレームを間引く請求項3に記載の映像信号の各フレームをコーディングする方法。
- 4つの隣接する第1のカテゴリーに分類されたブロック毎に統合がなされる請求項1乃至4の何れかに記載の映像信号の各フレームをコーディングする方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007052344A JP4128604B2 (ja) | 2007-03-02 | 2007-03-02 | 画像信号の符号化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007052344A JP4128604B2 (ja) | 2007-03-02 | 2007-03-02 | 画像信号の符号化方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP26887796A Division JP3967405B2 (ja) | 1996-10-09 | 1996-10-09 | 画像信号の符号化方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007202179A JP2007202179A (ja) | 2007-08-09 |
JP4128604B2 true JP4128604B2 (ja) | 2008-07-30 |
Family
ID=38456219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007052344A Expired - Fee Related JP4128604B2 (ja) | 2007-03-02 | 2007-03-02 | 画像信号の符号化方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4128604B2 (ja) |
-
2007
- 2007-03-02 JP JP2007052344A patent/JP4128604B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007202179A (ja) | 2007-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3967405B2 (ja) | 画像信号の符号化方法 | |
US9698823B2 (en) | Method and arrangement for coding transform coefficients in picture and/or video coders and decoders and a corresponding computer program and a corresponding computer-readable storage medium | |
JP6524118B2 (ja) | 改良されたパレットテーブル及びインデックスマップ符号化方法を用いた先進的スクリーンコンテンツ符号化 | |
EP0850540B1 (en) | Transmission and reception of encoded video pictures | |
RU2567988C2 (ru) | Кодер, способ кодирования данных, декодер, способ декодирования данных, система передачи данных, способ передачи данных и программный продукт | |
JP2006502604A (ja) | 任意形状オブジェクトの画像圧縮方法 | |
Zanuttigh et al. | Compression of depth information for 3D rendering | |
CN1539239A (zh) | 帧间编码的方法和装置 | |
CN112565793B (zh) | 一种基于预测差值分类熵编码的图像无损压缩方法 | |
CN107682699A (zh) | 一种近无损图像压缩方法 | |
JP4128604B2 (ja) | 画像信号の符号化方法 | |
Kuroki et al. | Adaptive arithmetic coding for image prediction errors | |
George et al. | A novel approach for image compression using zero tree coding | |
Liaghati et al. | An efficient method for lossless compression of bi-level ROI maps of hyperspectral images | |
KR20220045920A (ko) | 머신비전을 위한 영상의 처리 방법 및 장치 | |
Kale et al. | Visually improved image compression by combining EZW encoding with texture modeling using Huffman Encoder | |
Ding et al. | Context-based adaptive zigzag scanning for image coding | |
Shanmathi et al. | Comparative study of predictors used in lossless image compression | |
KR20010069018A (ko) | 영상 압축 부호화를 위한 변형 이중 스캔방법 | |
Sathappan et al. | Block based prediction with Modified Hierarchical Prediction image coding scheme for Lossless color image compression | |
JP3708218B2 (ja) | 画像の符号化方法 | |
Itoh | An adaptive DCT coding with geometrical edge representation | |
JP2008109195A (ja) | 画像処理装置 | |
Subramanyan et al. | Analysis of Adaptive, Entropy and Wavelet based Coding Techniques-A Survey | |
Ali et al. | Lossless image coding using binary tree decomposition of prediction residuals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070727 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070801 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070827 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070830 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070927 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20071002 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080418 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080514 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110523 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120523 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130523 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |