JP2007522708A - Roiを支援する映像コーディング方法及び装置 - Google Patents

Roiを支援する映像コーディング方法及び装置 Download PDF

Info

Publication number
JP2007522708A
JP2007522708A JP2006549102A JP2006549102A JP2007522708A JP 2007522708 A JP2007522708 A JP 2007522708A JP 2006549102 A JP2006549102 A JP 2006549102A JP 2006549102 A JP2006549102 A JP 2006549102A JP 2007522708 A JP2007522708 A JP 2007522708A
Authority
JP
Japan
Prior art keywords
wavelet
video
block
image
wavelet coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006549102A
Other languages
English (en)
Inventor
リー,ベ−グン
ハン,ウ−ジン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2007522708A publication Critical patent/JP2007522708A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65DCONTAINERS FOR STORAGE OR TRANSPORT OF ARTICLES OR MATERIALS, e.g. BAGS, BARRELS, BOTTLES, BOXES, CANS, CARTONS, CRATES, DRUMS, JARS, TANKS, HOPPERS, FORWARDING CONTAINERS; ACCESSORIES, CLOSURES, OR FITTINGS THEREFOR; PACKAGING ELEMENTS; PACKAGES
    • B65D19/00Pallets or like platforms, with or without side walls, for supporting loads to be lifted or lowered
    • B65D19/0004Rigid pallets without side walls
    • B65D19/0053Rigid pallets without side walls the load supporting surface being made of more than one element
    • B65D19/0077Rigid pallets without side walls the load supporting surface being made of more than one element forming discontinuous or non-planar contact surfaces
    • B65D19/0089Rigid pallets without side walls the load supporting surface being made of more than one element forming discontinuous or non-planar contact surfaces the base surface being made of more than one element
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/645Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65DCONTAINERS FOR STORAGE OR TRANSPORT OF ARTICLES OR MATERIALS, e.g. BAGS, BARRELS, BOTTLES, BOXES, CANS, CARTONS, CRATES, DRUMS, JARS, TANKS, HOPPERS, FORWARDING CONTAINERS; ACCESSORIES, CLOSURES, OR FITTINGS THEREFOR; PACKAGING ELEMENTS; PACKAGES
    • B65D2519/00Pallets or like platforms, with or without side walls, for supporting loads to be lifted or lowered
    • B65D2519/00004Details relating to pallets
    • B65D2519/00009Materials
    • B65D2519/00014Materials for the load supporting surface
    • B65D2519/00034Plastic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65DCONTAINERS FOR STORAGE OR TRANSPORT OF ARTICLES OR MATERIALS, e.g. BAGS, BARRELS, BOTTLES, BOXES, CANS, CARTONS, CRATES, DRUMS, JARS, TANKS, HOPPERS, FORWARDING CONTAINERS; ACCESSORIES, CLOSURES, OR FITTINGS THEREFOR; PACKAGING ELEMENTS; PACKAGES
    • B65D2519/00Pallets or like platforms, with or without side walls, for supporting loads to be lifted or lowered
    • B65D2519/00004Details relating to pallets
    • B65D2519/00009Materials
    • B65D2519/00049Materials for the base surface
    • B65D2519/00069Plastic
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65DCONTAINERS FOR STORAGE OR TRANSPORT OF ARTICLES OR MATERIALS, e.g. BAGS, BARRELS, BOTTLES, BOXES, CANS, CARTONS, CRATES, DRUMS, JARS, TANKS, HOPPERS, FORWARDING CONTAINERS; ACCESSORIES, CLOSURES, OR FITTINGS THEREFOR; PACKAGING ELEMENTS; PACKAGES
    • B65D2519/00Pallets or like platforms, with or without side walls, for supporting loads to be lifted or lowered
    • B65D2519/00004Details relating to pallets
    • B65D2519/00547Connections
    • B65D2519/00552Structures connecting the constitutive elements of the pallet to each other, i.e. load supporting surface, base surface and/or separate spacer
    • B65D2519/00557Structures connecting the constitutive elements of the pallet to each other, i.e. load supporting surface, base surface and/or separate spacer without separate auxiliary elements
    • B65D2519/00562Structures connecting the constitutive elements of the pallet to each other, i.e. load supporting surface, base surface and/or separate spacer without separate auxiliary elements chemical connection, e.g. glued, welded, sealed
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65DCONTAINERS FOR STORAGE OR TRANSPORT OF ARTICLES OR MATERIALS, e.g. BAGS, BARRELS, BOTTLES, BOXES, CANS, CARTONS, CRATES, DRUMS, JARS, TANKS, HOPPERS, FORWARDING CONTAINERS; ACCESSORIES, CLOSURES, OR FITTINGS THEREFOR; PACKAGING ELEMENTS; PACKAGES
    • B65D2519/00Pallets or like platforms, with or without side walls, for supporting loads to be lifted or lowered
    • B65D2519/00004Details relating to pallets
    • B65D2519/00736Details
    • B65D2519/00825Finishing of the external surfaces
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mechanical Engineering (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本発明は、一般的にビデオ圧縮に係り、さらに詳細には、ウェーブレット基盤のスケーラブルイメージ/ビデオコーディングで1フレーム内の特定領域のみを強調させるROI(Region−Of−Interest)方法に関する。本発明による映像圧縮方法は、所定の入力されたイメージに対してウェーブレット変換を行うことによって、ウェーブレット係数を生成する段階と、ウェーブレット係数が有する空間的連関性によってウェーブレットブロック別に前記ウェーブレット係数を再配列する段階と、ウェーブレットブロック別に前記ウェーブレット係数を量子化する段階からなる。本発明によれば、イメージをブロック別に分割してROIを適用する場合に発生するブロック境界現象を相当減少させうる。

Description

本発明は、一般的にビデオ圧縮に係り、より詳細には、ウェーブレット基盤のスケーラブルイメージ/ビデオコーディングで一フレーム内の特定領域のみを強調するROI(Region−of−interest)方法に関する。
インターネットを含む情報通信技術の発達につれて、文字、音声だけでなく、画像通信が増加している。既存の文字中心の通信方式では、消費者の多様なニーズを充足できず、これにより、文字、映像、音楽など多様な形態の情報を受け取れるマルチメディアサービスが増加している。マルチメディアデータは、その量がぼう大で大容量の記録媒体を必要とし、伝送時に広い帯域幅を必要とする。したがって、文字、映像、オーディオを含むマルチメディアデータを伝送するためには、圧縮コーディング技法を使用することが必須である。
データを圧縮する基本的な原理は、データの重複(redundancy)をなくす過程である。イメージにおいて同じ色や客体が反復されるような空間的重複や、動映像フレームにおいて隣接フレームがほとんど変化しない場合や、オーディオにおいて同じ音が続けて反復されるような時間的重複、または人間の視覚及び知覚能力の高い周波数に鈍感であることを考慮した心理視覚重複をなくすことによってデータを圧縮しうる。
現在、大部分のビデオコーディング標準は、モーション補償予測コーディング法に基づいているが、時間的重複はモーション補償に基づいた時間的フィルタリング(temporal filtering)により除去し、空間的重複は空間的変換(spatial transform)により除去する。
データの重複を除去した後で生成されるマルチメディアを伝送するためには、伝送媒体が必要であるが、その性能は伝送媒体別に差がある。現在使われている伝送媒体は、秒当たり数十Mbitのデータを伝送できる超高速通信網から秒当たり384kbitの伝送速度を有する移動通信網のように多様な伝送速度を有する。
このような環境で、多様な速度の伝送媒体を支援するか、または伝送環境によってこれに適した伝送率でマルチメディアを伝送可能にする、すなわち、スケーラビリティー(scalability)を有するデータコーディング方法がマルチメディア環境にさらに適していると言える。
このようなスケーラビリティーとは、1つの圧縮されたビットストリームに対してビットレート、エラー率、システム資源などの条件によってデコーダまたはプリデコーダ端で部分的なデコーディングを可能にする符号化方式である。デコーダまたはプリデコーダは、このようなスケーラビリティーを有するコーディング方式で符号化されたビットストリームの一部のみを取って異なる画質、解像度、またはフレームレートを有するマルチメディアシーケンスを復元しうる。
既に、MPEG−21(Moving Picture Experts Group−21) PART−13でスケーラブルビデオコーディングに関する標準化を進行しているが、そのうち、空間的変換方法でウェーブレット基盤の方式が有力な方法と認識されている。そして、静止映像(以下、‘イメージ’と称する)に対しては、ウェーブレット基盤のスケーラブルイメージコーディングであるJPEG−2000(Joint Photographiccoding Experts Group−2000)方式が既に実用化されている状態である。
従来には、このようなウェーブレット基盤のビデオ/イメージコーディングにおいてROI(Region−Of−Interest)機能を支援する例がさほど多くなかった。しかし、JPEG−2000のようなウェーブレット基盤のイメージコーディング(wavelet−based imagecoding)では、タイリング(tiling)技法を用いてROI機能を支援している。したがって、空間的変換(spatial transform)において、JPEG−2000での方式を利用するビデオコーダ(videocoder)は、ROI機能を支援すると言える。
図1は、スケーラブルビデオ/イメージコーディングシステムの全体構造を簡略に示す図面である。ここで、エンコーダは映像圧縮装置と、デコーダは映像圧縮解除装置と理解されうる。
まず、エンコーダ100は、入力ビデオ/イメージ10を符号化して1つのビットストリーム20を生成する。
そして、プリデコーダ150は、デコーダ200との通信環境またはデコーダ200端での機器性能などを考慮した条件、例えば、ビットレート、解像度またはフレームレートを抽出条件として、エンコーダ100から受信したビットストリーム20を切り取って多様なビットストリーム25を抽出しうる。
デコーダ200は、前記抽出したビットストリーム25から出力ビデオ/イメージ30を復元する。もちろん、前記抽出条件によるビットストリームの抽出は必ずしもプリデコーダ150で行われるものではなく、デコーダ200で行われうる。また、プリデコーダ150及びデコーダ200の両方で行われうる。
図2は、従来のJPEG−2000でのタイリング技法を示す図面である。
図2から分かるように、入力イメージは、所定数(本実施形態では、5×4)のタイルに分解、すなわち、タイル化過程を経た後、それぞれのタイルに対してウェーブレット変換を行う。そして、ウェーブレット変換を通じて求めたウェーブレット係数をエンベデッド量子化することによって圧縮されたビットストリームを生成する。前記エンベデッド量子化方式には、後述するEZW(Embedded Zerotrees Wavelet Algorithm)、SPIHT(Set Partitioning in Hierarchical Trees)、EZBC(Embedded Zero Block Coding)などがある。
図3は、図2でのタイリング技法を用いてモーション補償差分フレームを圧縮することによって、ウェーブレット基盤のスケーラブルビデオエンコーディング過程を示すフローチャートである。
エンコーディング過程を参照すれば、まず、入力ビデオ10からモーション推定を行い(S110)、これより求められるモーションベクトルを用いて時間的フィルタリング(S120)を行う。時間的フィルタリング(S120)を経つつ、生成されるモーション補償差分値を空間的ドメイン、すなわち、原イメージの領域を複数個のタイルないしブロック(T,T,...,Tn−1,Tn)に分割する(S130)。
次いで、それぞれのタイルに対してウェーブレット変換を行う(S140ないしS143)。そして、前記変換結果で生成されたウェーブレット係数を量子化し、それぞれのタイルに対するビットストリームを生成する(S150ないしS153)。最後に、生成されたそれぞれのビットストリームを結合して1つのビットストリーム20にする(S160)。
次いで、エンコーディング過程で分けたタイル別に生成されるビットストリーム各々に対して適切なビットを割り当てうる。これはイメージコンテンツに適応的にビットを割り当てることによって、全体的な性能を向上させる結果をもたらす。のみならず、特定タイルに対してさらに多くのビットを割り当てることによってROI、すなわち、関心領域の品質をさらに向上させうる。
このような従来のタイリング方式の問題点は、大きく3つに分けられる。
第1に、各タイルが独立してエンコーディングされるので、復元時にタイルの境界部分でブロック境界現象(blocking artifact)が多く現れる。第2に、各タイル間に存在する類似性を活用できないために、全体的な性能(overall performance)が下落する。第3に、ウェーブレット変換は、小さなタイルに対しては効果的でないために、タイルが小さな場合には、性能低下が発生する問題点がある。
本発明は、前記問題点を考慮して創案されたものであって、従来の空間的ドメインでのタイリング方式を改善し、入力されたイメージに対するウェーブレット基盤のコーディング技法において、ウェーブレットドメインでROIを具現する方法及び装置を提供することをその目的とする。
また、本発明は、ROIを具現しつつも境界部分のブロック境界現象を緩和しうる方法及び装置を提供することをその目的とする。
前記目的を達成するための本発明による映像圧縮方法は、所定の入力されたイメージに対してウェーブレット変換を行うことによって、ウェーブレット係数を生成する(a)段階と、前記ウェーブレット係数が有する空間的連関性によってウェーブレットブロック別に前記ウェーブレット係数を再配列する(b)段階と、及び前記ウェーブレットブロック別に前記ウェーブレット係数を量子化する(c)段階と、を含むことを特徴とする。
前記目的を達成するための本発明による映像圧縮解除方法は、入力ビットストリームから、ウェーブレットブロック別に空間的連関性によって配列されたウェーブレット係数を求める(a)段階と、前記ウェーブレットブロック別に配列されているウェーブレット係数を再配列して1つの全体イメージに対するウェーブレット係数に還元する(b)段階と、前記再配列されたウェーブレット係数を変換して空間的ドメインでのイメージを復元する(c)段階と、を含むことを特徴とする。
前記目的を達成するための本発明による映像圧縮装置は、所定の入力されたイメージに対してウェーブレット変換を行うことによって、ウェーブレット係数を生成するウェーブレット変換部と、前記ウェーブレット係数が有する空間的連関性によってウェーブレットブロック別に前記ウェーブレット係数を再配列するピクセルグループ化部と、前記ウェーブレットブロック別に前記ウェーブレット係数を量子化するエンベデッド量子化部と、を含むことを特徴とする。
前記目的を達成するために本発明による映像圧縮解除装置は、入力ビットストリームを用いてウェーブレットブロック別に空間的連関性によって配列されたウェーブレット係数を求める逆エンベデッド量子化部と、ウェーブレットブロック別に配列されたウェーブレット係数を再配列して1つの全体イメージに対するウェーブレット係数に還元する逆ピクセルグループ化部と、再配列されたウェーブレット係数を変換して空間的ドメインでのイメージを復元する逆ウェーブレット変換部と、を含むことを特徴とする。
本明細書において、‘ビデオ(video)’は動映像(moving picture)を、‘イメージ(image)’は静止映像(still picture)を意味する。そして、ビデオとイメージとを通称して‘映像’と表現しうる。
以下、添付された図面を参照して本発明の望ましい実施形態を詳細に説明する。しかし、本発明は以下に開示される実施形態に限定されず、相異なる多様な形で具現され、単に本実施形態は本発明の開示を完全にし、当業者に発明の範ちゅうを完全に報せるために提供されるものであり、本発明は、特許請求の範囲によってのみ定義される。明細書全体に亙って同じ参照符号は同じ構成要素を示す。
図4は、本発明によるエンコーダの構成を示すブロック図である。本発明によるエンコーダ300は、パーティション部301と、モーション推定部302と、時間的フィルタリング部303と、ウェーブレット変換部304と、ピクセルグループ化部305と、エンベデッド量子化部306と、ビットストリーム結合部307とを備えて構成されうる。
まず、パーティション部301は、入力ビデオ10をエンコーディングの基本単位であるGOP(Group of Pictures)に分ける。
モーション推定部302は、それぞれのGOPに存在するフレームに関するモーション推定を行ってモーションベクトルを選定する。前記モーション推定方法として、階層的可変サイズブロックマッチング法(Hierarchical Variable Size Block Matching:HVSBM)による階層的な方法を使用しうる。
時間的フィルタリング部303は、モーション推定部302によって求められたモーションベクトルを用いて時間軸方向にフレームを低周波及び高周波フレームに分解することによって、時間的重複性を減少させる。
例えば、フレームの平均を低周波成分とし、二フレームの差の半分を高周波成分とすることができる。フレームの分解時は、GOP別に分解する。モーションベクトルを用いず、単純にフレーム間の同じ位置に存在するピクセルを比較することによって、高周波成分のフレームと低周波成分のフレームとに分解できるが、これはモーションベクトルを用いる場合に比べて前記時間的重複性を減少させるに当って、さほど効率的ではない。
すなわち、第1フレームと第2フレームとを比較する時、第1フレームの一定領域が第2フレームから移動した場合、移動の程度はモーションベクトルと代表されることができ、両者を比較する時、第1フレームの一定領域と第2フレームの同一位置がモーションベクトルに該当する大きさほど移動した領域とを比較し、すなわち、時間的移動部分だけを補償した後で、第1及び第2フレームを低周波及び高周波フレームに分解する。
時間的フィルタリング方法では、例えば、MCTF(Motion Compensated Temporal Filtering)を使用しうる。
ウェーブレット変換部304は、時間的フィルタリング部303によって時間的重複性が除去されたフレームに対して、ウェーブレット変換を使用することによって、1つのフレームを分解して低周波数サブバンドと高周波数サブバンドとに区分し、各々に対するウェーブレット係数を求める。
図5は、入力イメージまたはフレームをウェーブレット変換によってサブバンドに分解する過程の例を示す図面であり、2段階レベルに分割したものである。
ここには3つの高周波数サブバンド、すなわち、水平、垂直、及び対角位置のサブバンドがある。低周波数サブバンド、すなわち、水平及び垂直方向いずれにも、低周波数であるサブバンドは‘LL’と表記する。前記高周波数サブバンドは‘LH’、‘HL’、‘HH’と表記するが、これは各々水平方向高周波数、垂直方向高周波数、そして水平及び垂直方向高周波数サブバンドを意味する。そして、低周波数サブバンドは反復的にさらに分解されうる。図5において、括弧内の数字はウェーブレット変換レベルを示す。
また図4を参照すれば、ピクセルグループ化部305は、図6から分かるように、ウェーブレット変換を通じて空間的重複性が除去されたウェーブレット係数(ないしピクセル)をその空間的連関性によって再配列して所定数を有するウェーブレットブロックを生成する。
JPEG−2000のような従来技術では、入力されたイメージを空間的ドメインから分割するのに対し、本発明では、まず、入力されたイメージに対してウェーブレット変換を行った後、ウェーブレットドメイン(wavelet−domain)で表現される各ピクセルの空間的関係を用いて関係されたピクセルを1つにまとめる。このように関係されたピクセルをまとめて再配列する過程は、実際にはそれぞれのピクセルに対応するウェーブレット係数を再配列する過程によって行われる。
このように互いに関係されたピクセルがまとめられた単位をウェーブレットブロック(waveletblock:WB)と称し、これはウェーブレット基盤のビデオコーディングで空間的スケーラビリティーを具現するために使われている。
図7は、前記ピクセルグループ化過程の一実施形態を示す図面である。ウェーブレットブロック(WBと表記)は、基本的にウェーブレット変換時、Lバンド(例えば、LL(3))に存在するピクセル1個に対して関連した他のバンドのピクセルをまとめて構成するものである。ウェーブレットレベルがnとする時、ROI領域は2×2ピクセルサイズとなる。
このように、ROI領域を小さく取れば、細密にROIコントロールを行えるという長所があるが、総ウェーブレットブロックの数が過度に多くなって、処理速度で不利でありえる。したがって、これを拡張して、ウェーブレットブロックをLバンドの複数個のピクセルをまとめて構成しても良い。
すなわち、Lバンドにある複数個のピクセル(通常2x2、4x4、8x8などの大きさを使用する)に対して関連ピクセルを全てまとめて、やはりウェーブレットブロックのような形態を構成しうる。この場合、Lバンドのピクセル1つと関連した他のバンドのピクセルをまとめてウェーブレットブロックを構成する場合に比べて、相対的にROI領域を細密には指定できない。しかし、全体ウェーブレットブロックの数を減らせるので、応用分野によって適切にウェーブレットブロックの数を決定しうる。
以下では、空間的連関性のあるピクセルを探すのに基準となるLバンドに存在する1つ以上のピクセルを‘基礎ユニット’と定義する。このような基礎ユニットの大きさを異ならせることによって、ウェーブレットブロックの大きさを可変的に調節しうる。
このようなウェーブレットブロックは、空間的ドメインでの1つのタイル(またはブロック)に対応する。但し、これは正確な対応ではなく、ウェーブレットブロックはタイル境界付近に位置するピクセル間の空間的類似性を考慮してウェーブレット変換したような意味を有する。
言い換えれば、ウェーブレット変換は空間的ドメインに比べて空間的にスムーズな係数を有するので、この領域で各ウェーブレットブロック別に相異なるビットを割り当てることで生じるブロック境界現象はタイリング方式とは異なってウェーブレットドメインで現れる。したがって、デコーダで最終的に逆ウェーブレット変換をして復元されたイメージはブロック境界現象を有さず、リング境界現象(ringing artifact)の形で現れるが、このようなリング境界現象は主観的画質面でブロック境界現象に比べて相対的に有利である。
再び図7を参照すれば、Lバンドの基礎ユニットと空間的連関性のある部分は、それぞれのサブバンドで相対的位置が同じ部分である。図7では、このような部分を斜線、またはチェック紋で表示した。WBは、基礎ユニットと空間的連関性のある部分をまとめて再配列したものである。したがって、もしWBをウェーブレット逆変換するならば、空間的ドメインで該当位置(空間的フレームの左上端1/16面積部分)に該当するイメージを生成できるであろう。
再び図4を参照すれば、エンベデッド量子化部306は、ピクセルグループ化部305によって再配列されたウェーブレット係数をそれぞれのウェーブレットブロック別にエンベデッド量子化する。
このように、ウェーブレットブロック別にウェーブレット係数をエンベデッド量子化する方法としては、EZW(Embedded Zerotrees Wavelet Algorithm)、SPIHT(Set Partitioning in Hierarchical Trees)、EZBC(Embedded Zero Block Coding)などを使用しうる。この方法は、本発明で用いたウェーブレットドメインでのピクセル間の空間的関係をよく活用できて、本発明でのエンベデッド量子化過程に使用するのに適している。
前記ピクセル間空間的関係は、ツリー(tree)の形で現れるが、ツリーのルートが0である場合、その子(children)も0の値を有する確率が高いということを利用することによって、効果的に符号化を行える。このようなアルゴリズムは、内部的にLバンドのピクセル1つに対して互いに関連したピクセルをスキャンしつつ処理を行う。
一方、スケーラビリティーを具現するためには、所定のスレショルド値を定め、前記スレショルド値より大きい値を有するピクセルのみエンコーディングして、あらゆるピクセルに対する処理が終われば、スレショルド値を低め、再び反復する過程を通じてエンベデッド量子化を行う。
最後に、ビットストリーム結合部307は、エンベデッド量子化部306によってそれぞれのウェーブレットブロック別に生成されるそれぞれのビットストリームを1つのビットストリーム20に結合する。
本発明はこのような動映像(ビデオ)だけでなく、静止映像(イメージ)に対しても適用しうる。入力イメージ15は、ウェーブレット変換部304、ピクセルグループ化部305、エンベデッド量子化部306、及びビットストリーム結合部307で動映像の場合と同じ過程を経てビットストリーム20として生成しうる。
図8は、本発明によるプリデコーダの構成を示すブロック図である。
エンコーダ300端では、ROIを考慮せず、エンコーディングされたとしても、プリデコーダ350、またはトランスコーダ端で任意の関心領域を指定して相対的にさらに多くのビットを割り当てることによって新たなビットストリームを生成しうる。実際に、この生成過程は、それぞれのウェーブレットブロックに対するビットストリームを切り取る(truncation)過程によって行われる。
このような本発明によるプリデコーダ350は、ビットストリーム分解部351と、ビットレート割当部352と、ビットストリーム抽出部353と、ビットストリーム結合部354を含んで構成されうる。
まず、ビットストリーム分解部351は、エンコーダ300から受信したビットストリーム20をそれぞれのウェーブレットブロック別に分解する。
そして、ビットレート割当部352は、前記分解されたビットストリームの各々に対して各々ビットレートを割り当てる。まず、フレーム全体に対する目標ビットレートを先に決定した後、重要であると判断される部分に相対的に多くのビットレートを割り当て、あまり重要でない部分に相対的に少ないビットレートを割り当て、割り当てた全体ビットレートの和を目標ビットレートにする。
また、ビットストリーム抽出部353は、前記各々割り当てたビットレートによってそれぞれのビットストリームを切り取ってそれぞれの新たなビットストリームを抽出する。
そして、ビットストリーム結合部354は、ビットストリーム抽出部353で各々抽出された複数のビットストリームを1つのビットストリーム25に結合する。
図9は、本発明によるデコーダの構成を示すブロック図である。本発明によるデコーダ400は、ビットストリーム分解部410と、逆エンベデッド量子化部420と、ピクセルグループ化部430と、逆ウェーブレット変換部440と、逆時間的フィルタリング部450とを備えて構成されうる。
デコーダ400での動作は、大体エンコーダ300での動作の逆順で行われる。但し、モーションベクトルを求めるモーション推定過程は、エンコーダ300のモーション推定部302でのみ行われ、デコーダ400では前記モーションベクトルを伝達されて、これを利用すればいいので、モーション追跡過程の逆順に該当する過程は存在していない。
まず、ビットストリーム分解部410は、プリデコーダ350から受信したビットストリーム25をそれぞれのウェーブレットブロック別に分解する。前記ビットストリーム25がプリデコーダ350でROIのためのビット割当過程を経ず、エンコーダから直接受信されたビットストリーム20である場合にもデコーダ400端では同じ過程を経て動作する。
逆エンベデッド量子化部420は、エンコーダ300でのエンベデッド量子化部306での動作を逆順で行う。すなわち、前記分解された各々ビットストリームから、ウェーブレットブロック別に再配列されたウェーブレット係数を求める。
逆ピクセルグループ化部430は、エンコーダ300でのピクセルグループ化部305での動作を逆順で行う。すなわち、前記ウェーブレットブロック別に配列されているウェーブレット係数を再配列して1つの全体イメージに対するウェーブレット係数になるように還元する。この過程は、図6での再配列過程の逆順で進む。
そして、逆ウェーブレット変換部440は、前記再配列されたウェーブレット係数を変換して空間的ドメインでのイメージを復元する。この過程でそれぞれのGOPに相応するウェーブレット係数は逆ウェーブレット変換によって変換され、時間的フィルタリングがなされているフレームが生成される。
最後に、逆時間的フィルタリング部450は、前記生成されたフレームとエンコーダ300とで生成されたモーションベクトルを用いて前記時間的フィルタリング過程を逆に行うことによって、最終出力ビデオ30を生成する。
エンコーダ300で説明したように、本発明はこのようなビデオだけでなく、イメージに対しても適用しうる。プリデコーダ350から入力されるビットストリーム25は、ビットストリーム分解部410、逆エンベデッド量子化部420、逆ピクセルグループ化部430、及び逆ウェーブレット変換部440でビデオの場合と同じ過程を経て出力イメージ35として生成されうる。
また、図4、図8及び図9の実施形態では、エンコーダ300、プリデコーダ350、デコーダ400をいずれも別途の機器であると説明したが、これに限定されず、エンコーダ300にプリデコーダ350が含まれた構成としても、デコーダ400にプリデコーダ350が含まれた構成としても良いということは当業者に自明である。
図10は、本発明によるエンコーディング方法を説明するフローチャートである。
まず、受信された入力ビデオ10に対してモーション推定部302を通じてモーション推定を行い、モーションベクトルを選定する(S210)。
前記モーションベクトルを用いて時間軸方向にフレームを低周波及び高周波フレームに分解することによって、時間的重複性を除去する時間的フィルタリング過程を行う(S220)。
次いで、前記時間的重複性が除去されたフレームに対して低周波数サブバンドと高周波数サブバンドとに区分し、各々に対するウェーブレット係数を求めるウェーブレット変換過程を行う(S230)。
前記ウェーブレット変換を通じて空間的重複性が除去されたウェーブレット係数を、その空間的連関性によってウェーブレットブロック別に再配列するピクセルグループ化過程を行う(S240)。
前記生成されたウェーブレットブロック各々に対してエンベデッド量子化を行い、各ウェーブレットブロック別にビットストリームを生成する(S250ないしS253)。前記エンベデッド量子化についてのさらに詳細な説明は、図14の説明で後述する。
最後に、前記各ウェーブレット別に生成されたビットストリームを1つのビットストリームに結合する(S260)。
図10での過程は、動映像(ビデオ)に限定されず、入力静止映像(イメージ)に対してS230以後の段階を行うことによって、静止映像に対するビットストリーム20を生成できるという点に注目せねばならない。
図11は、本発明によるプリデコーダ端でROIを適用する方法を説明するフローチャートである。
まず、エンコーダ300から受信したビットストリーム20をそれぞれのウェーブレットブロック別に分解する(S310)。
前記分解されたビットストリーム、すなわち、ウェーブレットブロック(WB)各々に対して各々ビットレートを割り当てる(S320ないしS323)。ここで、ビットレートの割当て時に目標ビットレートをさきに決定した後、重要であると判断される部分に相対的に多くのビットレートを割り当て、あまり重要でない部分には、相対的に少ないビットレートを割り当て、割り当てた全体ビットレートを目標ビットレートにする。
前記各々割り当てたビットレートによってそれぞれのビットストリームを切り取ってそれぞれの新たなビットストリームを抽出する(S330ないしS333)。
そして、前記各々抽出された複数のビットストリームを1つのビットストリーム25に結合する(S340)。
図12は、本発明によるデコーディング方法を説明するフローチャートである。
プリデコーダ350から受信したビットストリーム25をそれぞれのウェーブレットブロック別に分解する(S410)。
前記分解されたそれぞれのビットストリームから、ウェーブレットブロック別(WB)に再配列されたウェーブレット係数を求める逆エンベデッド量子化過程を行う(S420ないしS423)。
前記ウェーブレットブロック別に配列されたウェーブレット係数を再配列して1つの全体イメージに対するウェーブレット係数に還元する逆ピクセルグループ化過程を行う(S430)。
前記還元されたウェーブレット係数を変換して空間的ドメインでのフレームを復元する逆ウェーブレット変換過程を行う(S440)。
そして、前記復元されたフレームとエンコーダ300で生成されたモーションベクトルを用いて前記時間的フィルタリング過程を逆に行うことによって、最終出力ビデオ30を生成する(S450)。
一方、入力されたビットストリーム25がイメージ情報に関するものである時には、S410、S420ないしS423、S430、及びS440過程を経ることによって、出力イメージ35が生成される。
図13は、従来のエンベデッド量子化過程を説明するフローチャートである。従来のエンベデッド量子化方式には、EZW、SPIHT、EZBCなどがある。これらはゼロツリーまたはゼロブロックを用いて量子化する方法である。
まず、初期のスレショルド値を決定する(S11)。次いで、Lバンドのピクセル1つに対して空間的に関連したあらゆるピクセルをスキャンしつつ、スレショルド値より大きいピクセル値を有するピクセルのみをエンコーディングする(S12)。ウェーブレットドメインでのピクセルが有するピクセル値は、ウェーブレット係数を意味するという点に注目せねばならない。
次いで、Lバンドの次のピクセル1つに空間的に関連したあらゆるピクセルに対してもS12のような過程を反復する。このように、あらゆるピクセルが処理されるまで、S12過程を反復して行う(S13)。次いで、前記スレショルド値を2で割り、再びS12ないしS14段階を反復する(S14)。もし、スレショルド値が0になれば(S14のはい)、終了する。
図14は、本発明によるエンベデッド量子化過程(図10のS250ないしS253)を説明するフローチャートである。
本発明によるエンベデッド量子化方法においても、図7から分かるように、Lバンドのピクセルが有する空間的関連性を利用するので、このようなアルゴリズムを非常に容易に適用しうる。すなわち、基礎ユニットと空間的関連性のあるグループ化されたピクセルに対してスレショルド値を減らしつつ、エンコーディングし、スレショルド値が0になれば、他のウェーブレットブロックを処理するように変えるものである。これにより、EZW、EZBC、SPIHTなどのエンベデッド量子化方法を本発明に適用することによって、イメージコーディング技法にROI機能を追加できるようになる。
本発明によって、図13のような従来のエンベデッド量子化方法と異なる点は、図14に示されたようである。まず、初期スレショルド値を決定する(S21)。次いで、1つのウェーブレットブロックに存在するピクセル、すなわち、Lバンドの基礎ユニットと空間的に関連したあらゆるピクセルをスキャンしつつ、スレショルド値より大きいピクセル値を有するピクセルのみをエンコーディングする(S22)。次いで、前記スレショルド値を2で割り、再びS22段階を反復する(S24)。もし、前記反復過程中にスレショルド値が0になる前まで(S23のいいえ)、次のウェーブレットブロックに対してS22ないしS24過程を反復する。このようにあらゆるウェーブレットブロックが処理されるまで、S22ないしS24過程を反復して行う(S25)。
図15は、本発明によるエンコーディング、プリデコーディングまたはデコーディング方法を行うためのシステムの構成図である。前記システムは、TV、セットトップボックス、デスクトップ、ラップトップコンピュータ、パームトップ(palm top)コンピュータ、PDA(Personal Digital Assistant)、ビデオまたはイメージ保存装置(例えば、VCR(Video Cassette Recorder)、DVR(Digital Video Recorder)など)を表すものでありうる。のみならず、前記システムは、前記した装置を組合わせたものであるか、または前記装置が他の装置の一部に含まれたものを表すものでもありうる。前記システムは、少なくとも1つ以上のビデオ/イメージソース510、1つ以上の入出力装置520、プロセッサー540、メモリ550、そしてディスプレイ装置530を含んで構成されうる。
ビデオ/イメージソース510は、TVレシーバー、VCR、または他のビデオ/イメージ貯蔵装置を表すものでありうる。また、前記ソース510は、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、地上波放送システム(terrestrial broadcast system)、ケーブルネットワーク、衛星通信ネットワーク、無線ネットワーク、電話ネットワークなどを用いてサーバーからビデオ/イメージを受信するための1つ以上のネットワーク連結を表すものでありうる。のみならず、前記ソースは、前記ネットワークを組合わせたもの、または前記ネットワークが他のネットワークの一部として含まれたものでありうる。
入出力装置520、プロセッサー540、そしてメモリ550は、通信媒体560を通じて通信する。前記通信媒体560には、通信バス、通信ネットワーク、または1つ以上の内部連結回路を表すものでありうる。前記ソース510から受信される入力ビデオ/イメージデータはメモリ550に保存された1つ以上のソフトウェアプログラムによってプロセッサー540によって処理されることができ、ディスプレイ装置530に提供される出力ビデオ/イメージを生成するためにプロセッサー540によって実行されうる。
特に、メモリ550に保存されたソフトウェアプログラムは、本発明による方法を行うスケーラブルウェーブレット基盤のコーデックを含む。前記コーデックは、メモリ550に保存されていてもよく、CD−ROMやフロッピディスクのような記録媒体から読み込むか、各種ネットワークを通じて所定のサーバーからダウンロードしたものでありうる。前記ソフトウェアによってハードウェア回路によって代替されるか、ソフトウェアとハードウェア回路との組合わせによって代替されうる。
本発明によれば、イメージをブロック別に分割してROIを適用する場合に発生するブロック境界現象を相当減少させうる。
また本発明によれば、ウェーブレット変換が有する特徴の1つである空間的類似性をよく活用できて、ROI具現による性能の損失を最小化しうる。
そして、本発明によれば、イメージ全体に対して、まずウェーブレット変換を行った後で分割してROIを具現するので、分割するブロックの大きさが小さくなってウェーブレット変換の効率が減少する問題も解決しうる。
以上、添付された図面を参照して本発明の実施形態を説明したが、本発明が属する技術分野で当業者は、本発明がその技術的思想や必須な特徴を変更せず、他の具体的な形で実施されうるということを理解できるであろう。したがって、前述した実施形態はあらゆる面で例示的なものであり、限定的でないということを理解せねばならない。
従来のスケーラブルビデオ/イメージコーディングシステムの全体構造を簡略に示す概念図である。 従来のJPEG−2000でのタイリング技法を示す図である。 従来のタイリング技法を用いてモーション補償差分値を圧縮することによって、ウェーブレット基盤のスケーラブルビデオエンコーディング過程を示すフローチャートである。 本発明によるエンコーダの構成を示すブロック図である。 入力イメージまたはフレームをウェーブレット変換によってサブバンドに分解する過程の例を示す図である。 本発明によるタイリング過程を概略的に説明する概念図である。 ピクセルグループ化過程の一実施形態を示す図である。 本発明によるプリデコーダの構成を示すブロック図である。 本発明によるデコーダの構成を示すブロック図である。 本発明によるエンコーディング方法を説明するフローチャートである。 本発明によるROI適用方法を説明するフローチャートである。 本発明によるデコーディング方法を説明するフローチャートである。 従来のエンベデッド量子化過程を説明するフローチャートである。 本発明によるエンベデッド量子化過程(図10のS250ないしS253)を説明するフローチャートである。 本発明によるエンコーディング、プリデコーディングまたはデコーディング方法を行うためのシステムの構成図である。

Claims (28)

  1. 所定の入力されたイメージに対してウェーブレット変換を行うことによってウェーブレット係数を生成する段階と、
    前記ウェーブレット係数が有する空間的連関性によってウェーブレットブロック別に前記ウェーブレット係数を再配列する段階と、
    前記ウェーブレットブロック別に前記ウェーブレット係数を量子化する段階と、を含む映像圧縮方法。
  2. 前記映像は、静止映像である請求項1に記載の映像圧縮方法。
  3. 前記所定の入力されたイメージは、入力されたビデオから時間的重複性が除去されたフレームである請求項1に記載の映像圧縮方法。
  4. 前記映像は、動映像である請求項1または3に記載の映像圧縮方法。
  5. 前記ウェーブレットブロック別に重要度によって相異なるビットレートを割り当てる段階をさらに含む請求項1に記載の映像圧縮方法。
  6. 前記相異なるビットレートを割り当てることは、前記ウェーブレットブロック別に割当てられたビットレートの和が目標ビットレートになるように割り当てる請求項5に記載の映像圧縮方法。
  7. 前記重要度は、各ウェーブレットブロックに対応するイメージが有する複雑度を基準とする請求項5に記載の映像圧縮方法。
  8. 前記ウェーブレット係数を再配列する段階は、ウェーブレット変換後に生成されるサブバンドのうち、最下位Lバンドで所定数のピクセルを基礎ユニットに選定する段階と、
    前記基礎ユニットと空間的連関性を有するウェーブレット係数を前記ウェーブレットブロック別に再配列する段階と、を含む請求項1に記載の映像圧縮方法。
  9. 前記所定数のピクセルは、1つのピクセルである請求項1に記載の映像圧縮方法。
  10. 前記量子化は、エンベデッド量子化である請求項1に記載の映像圧縮方法。
  11. 前記量子化段階は、
    初期スレショルド値を決定する段階と、
    所定のウェーブレットブロック内のあらゆるウェーブレット係数をスキャンして前記初期スレショルド値より大きいウェーブレット係数をエンコーディングする段階と、を含む 請求項10に記載の映像圧縮方法。
  12. 前記量子化段階は、前記スレショルド値を2で割った値を新たなスレショルド値として前記段階を行う段階をさらに含む請求項11に記載の映像圧縮方法。
  13. 入力ビットストリームを用いて、ウェーブレットブロック別に空間的連関性によって配列されたウェーブレット係数を求める段階と、
    前記ウェーブレットブロック別に配列されたウェーブレット係数を再配列して1つの全体イメージに対するウェーブレット係数に還元する段階と、
    前記再配列されたウェーブレット係数を変換して空間的ドメインでのイメージを復元する段階と、を含む映像圧縮解除方法。
  14. 前記復元されたイメージとモーションベクトルを用いて時間的フィルタリングを逆に行って出力動映像を生成する段階を含む請求項13に記載の映像圧縮解除方法。
  15. 前記映像は、静止映像である請求項13に記載の映像圧縮解除方法。
  16. 前記映像は、動映像である請求項13または14に記載の映像圧縮解除方法。
  17. 前記ウェーブレット係数を求める段階以前に、所定のビットストリームから前記ウェーブレットブロック別に重要度によって相異なるビットレートを割り当てることによって、前記入力ビットストリームを生成する段階をさらに含む請求項13に記載の映像圧縮解除方法。
  18. 所定の入力されたイメージに対してウェーブレット変換を行うことによって、ウェーブレット係数を生成するウェーブレット変換部と、
    前記ウェーブレット係数が有する空間的連関性によってウェーブレットブロック別に前記ウェーブレット係数を再配列するピクセルグループ化部と、
    前記ウェーブレットブロック別に前記ウェーブレット係数を量子化するエンベデッド量子化部と、を備える映像圧縮装置。
  19. 前記所定の入力されたイメージは、入力されたビデオから時間的重複性が除去されたフレームである請求項18に記載の映像圧縮装置。
  20. 前記ウェーブレットブロック別に重要度によって相異なるビットレートを割り当てるビットレート割当部をさらに含む請求項18に記載の映像圧縮装置。
  21. 前記ビットレートは、前記ウェーブレットブロック別に割当てられたビットレートの和が目標ビットレートになるように割り当てる請求項20に記載の映像圧縮装置。
  22. 前記重要度は、各ウェーブレットブロックに対応するイメージが有する複雑度を基準とする請求項20に記載の映像圧縮装置。
  23. 前記ピクセルグループ化部は、ウェーブレット変換後生成されるサブバンドのうち、最下位Lバンドで所定数のピクセルを基礎ユニットに選定し、前記基礎ユニットと空間的連関性を有するウェーブレット係数をウェーブレットブロック別に再配列する請求項18に記載の映像圧縮装置。
  24. 前記量子化部は、初期スレショルド値を決定し、所定のウェーブレットブロック内のあらゆるウェーブレット係数をスキャンしてスレショルド値より大きいウェーブレット係数をエンコーディングする請求項18に記載の映像圧縮装置。
  25. 入力ビットストリームを用いて、ウェーブレットブロック別に空間的連関性によって配列されたウェーブレット係数を求める逆エンベデッド量子化部と、
    前記ウェーブレットブロック別に配列されたウェーブレット係数を再配列して1つの全体イメージに対するウェーブレット係数に還元する逆ピクセルグループ化部と、
    前記再配列されたウェーブレット係数を変換して空間的ドメインでのイメージを復元する逆ウェーブレット変換部と、を備える映像圧縮解除装置。
  26. 前記復元されたイメージとモーションベクトルとを用いて時間的フィルタリングを逆に行って出力動映像を生成する逆時間的フィルタリング部をさらに備える請求項25に記載の映像圧縮解除装置。
  27. 所定のビットストリームから前記ウェーブレットブロック別に重要度によって相異なるビットレートを割り当てることによって、前記入力ビットストリームを生成するビットレート割当部をさらに備える請求項25に記載の映像圧縮解除装置。
  28. 映像圧縮方法を実行するためのコンピュータで読取り可能なプログラムを含む記録媒体において、前記方法は、
    所定の入力されたイメージに対してウェーブレット変換を行うことによって、ウェーブレット係数を生成する段階と、
    前記ウェーブレット係数が有する空間的連関性によってウェーブレットブロック別に前記ウェーブレット係数を再配列する段階と、
    前記ウェーブレットブロック別に前記ウェーブレット係数を量子化する段階と、を含む記録媒体。
JP2006549102A 2004-01-13 2004-12-11 Roiを支援する映像コーディング方法及び装置 Pending JP2007522708A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020040002378A KR100643269B1 (ko) 2004-01-13 2004-01-13 Roi를 지원하는 영상 코딩 방법 및 장치
PCT/KR2004/003260 WO2005069634A1 (en) 2004-01-13 2004-12-11 Video/image coding method and system enabling region-of-interest

Publications (1)

Publication Number Publication Date
JP2007522708A true JP2007522708A (ja) 2007-08-09

Family

ID=36702898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006549102A Pending JP2007522708A (ja) 2004-01-13 2004-12-11 Roiを支援する映像コーディング方法及び装置

Country Status (9)

Country Link
US (1) US20050152611A1 (ja)
EP (1) EP1555829A1 (ja)
JP (1) JP2007522708A (ja)
KR (1) KR100643269B1 (ja)
CN (1) CN1926883A (ja)
AU (1) AU2004314092B2 (ja)
BR (1) BRPI0418392A (ja)
CA (1) CA2552800A1 (ja)
WO (1) WO2005069634A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011509003A (ja) * 2007-12-20 2011-03-17 トムソン ライセンシング 画像取り込み支援装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100776822B1 (ko) * 2006-04-11 2007-11-19 고려대학교 산학협력단 스테레오 잔여 영상 부호화 방법 및 그 장치
US9516346B2 (en) 2009-09-01 2016-12-06 Manipal Institute Of Technology Image processing system and method
US8428364B2 (en) 2010-01-15 2013-04-23 Dolby Laboratories Licensing Corporation Edge enhancement for temporal scaling with metadata
CN101867809A (zh) * 2010-04-09 2010-10-20 中国科学院光电技术研究所 基于脉动阵列的高速图像压缩vlsi编码方法及编码器
US20120128076A1 (en) * 2010-11-23 2012-05-24 Sony Corporation Apparatus and method for reducing blocking artifacts
CN102129698A (zh) * 2011-03-08 2011-07-20 华中科技大学 一种基于感兴趣区域的图像编码方法
US9325999B2 (en) * 2011-03-10 2016-04-26 Sharp Kabushiki Kaisha Video decoder for slices
CN102637302B (zh) * 2011-10-24 2013-06-19 北京航空航天大学 一种图像编码方法
CN102970541B (zh) * 2012-11-22 2015-05-27 深圳市海思半导体有限公司 图像滤波方法及装置
CN103179405B (zh) * 2013-03-26 2016-02-24 天津大学 一种基于多级感兴趣区域的多视点视频编码方法
CN104486631B (zh) * 2014-12-31 2017-06-06 哈尔滨工业大学 一种基于人眼视觉与自适应扫描的遥感图像压缩方法
CN108134653B (zh) * 2017-12-22 2020-09-01 西安烽火电子科技有限责任公司 一种基于辅助序列不等差错保护的信息传输方法
CN111711970B (zh) * 2020-03-27 2022-04-01 同济大学 一种超长线状环形无线网络数据压缩方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6483946B1 (en) * 1995-10-25 2002-11-19 Sarnoff Corporation Apparatus and method for encoding zerotrees generated by a wavelet-based coding technique
US5748116A (en) * 1996-11-27 1998-05-05 Teralogic, Incorporated System and method for nested split coding of sparse data sets
AUPO472897A0 (en) * 1997-01-22 1997-02-20 Canon Information Systems Research Australia Pty Ltd A method for digital image compression
US6269192B1 (en) * 1997-07-11 2001-07-31 Sarnoff Corporation Apparatus and method for multiscale zerotree entropy encoding
US6606416B1 (en) * 1998-10-30 2003-08-12 Canon Kabushiki Kaisha Encoding method and apparatus for representing a digital image
US6661927B1 (en) * 2000-07-27 2003-12-09 Motorola, Inc. System and method for efficiently encoding an image by prioritizing groups of spatially correlated coefficients based on an activity measure
AU2003264804A1 (en) * 2002-10-16 2004-05-04 Koninklijke Philips Electronics N.V. Fully scalable 3-d overcomplete wavelet video coding using adaptive motion compensated temporal filtering

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011509003A (ja) * 2007-12-20 2011-03-17 トムソン ライセンシング 画像取り込み支援装置

Also Published As

Publication number Publication date
KR100643269B1 (ko) 2006-11-10
WO2005069634A1 (en) 2005-07-28
AU2004314092A1 (en) 2005-07-28
AU2004314092B2 (en) 2008-03-06
CA2552800A1 (en) 2005-07-28
US20050152611A1 (en) 2005-07-14
EP1555829A1 (en) 2005-07-20
CN1926883A (zh) 2007-03-07
KR20050074150A (ko) 2005-07-18
BRPI0418392A (pt) 2007-06-05

Similar Documents

Publication Publication Date Title
KR100664928B1 (ko) 비디오 코딩 방법 및 장치
KR100679011B1 (ko) 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치
JP5026965B2 (ja) ベースレイヤを含むビットストリームをプリデコーディング、デコーディングする方法及び装置
KR100703760B1 (ko) 시간적 레벨간 모션 벡터 예측을 이용한 비디오인코딩/디코딩 방법 및 장치
KR100714696B1 (ko) 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치
US20050152611A1 (en) Video/image coding method and system enabling region-of-interest
US20050169379A1 (en) Apparatus and method for scalable video coding providing scalability in encoder part
US20050157794A1 (en) Scalable video encoding method and apparatus supporting closed-loop optimization
KR20060135992A (ko) 다계층 기반의 가중 예측을 이용한 비디오 코딩 방법 및장치
US20050163224A1 (en) Device and method for playing back scalable video streams
US20050158026A1 (en) Method and apparatus for reproducing scalable video streams
US20060013311A1 (en) Video decoding method using smoothing filter and video decoder therefor
KR20050028019A (ko) 하나 및 다수의 기준 프레임을 기반으로 한 움직임 보상필터링을 사용한 웨이블릿 기반 코딩
JP2007503750A (ja) 適応型フレーム間ウェーブレットのビデオコーディング方法、前記方法のためのコンピュータで読取り可能な記録媒体、及び装置
US20060088100A1 (en) Video coding method and apparatus supporting temporal scalability
KR20050074151A (ko) 스케일러블 비디오 코딩에서 모션 벡터를 선정하는 방법및 그 방법을 이용한 비디오 압축 장치
JP2009531941A (ja) ビットストリームのビット率の調節のための優先権の割当て方法、ビットストリームのビット率の調節方法、ビデオデコーディング方法およびその方法を用いた装置
WO2006098586A1 (en) Video encoding/decoding method and apparatus using motion prediction between temporal levels
WO2006080665A1 (en) Video coding method and apparatus
WO2006043750A1 (en) Video coding method and apparatus
WO2006043754A1 (en) Video coding method and apparatus supporting temporal scalability

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090901

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100216