JP2006166413A - スケーラブルな画像トランスコーディング方法 - Google Patents

スケーラブルな画像トランスコーディング方法 Download PDF

Info

Publication number
JP2006166413A
JP2006166413A JP2005290007A JP2005290007A JP2006166413A JP 2006166413 A JP2006166413 A JP 2006166413A JP 2005290007 A JP2005290007 A JP 2005290007A JP 2005290007 A JP2005290007 A JP 2005290007A JP 2006166413 A JP2006166413 A JP 2006166413A
Authority
JP
Japan
Prior art keywords
packet
encoded
image
region
bitstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005290007A
Other languages
English (en)
Other versions
JP4606987B2 (ja
Inventor
Hao-Song Kong
ハオ−ソン・コン
Vetro Anthony
アンソニー・ヴェトロ
Toshihiko Hata
淑彦 秦
Naoki Kuwabara
直樹 桑原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Research Laboratories Inc
Original Assignee
Mitsubishi Electric Research Laboratories Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Research Laboratories Inc filed Critical Mitsubishi Electric Research Laboratories Inc
Publication of JP2006166413A publication Critical patent/JP2006166413A/ja
Application granted granted Critical
Publication of JP4606987B2 publication Critical patent/JP4606987B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234345Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/188Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Abstract

【課題】符号化入力ビットストリームの形態の画像をトランスコードする方法を得る。
【解決手段】入力ビットストリームは画質レイヤを含み、各画質レイヤは解像度レベルを含み、各解像度レベルはコンポーネントを含み、各コンポーネントはプレシンクトを含み、各プレシンクトはパケット分割位置、ヘッダ長、及び本文の長さを含む。入力ビットストリームは部分的に復号化されて、符号化入力ビットストリーム構造が得られる。画像中の関心領域の座標が指定されて、プログレッシブパラメータが規定される。部分的に復号化された入力ビットストリームは次に、構造、座標、及びプログレッシブパラメータに従って符号化され、符号化出力ビットストリームが得られる。
【選択図】図1

Description

本発明は、包括的には画像及びビデオの符号化に関し、特に関心領域を含む画像のトランスコーディングに関する。
ビデオ監視、携帯電話、デジタルカメラ、プリンタ、スキャナ、ファクシミリ、コピー機、医用画像、衛星画像、インターネット、及び複合文書により、画像及びビデオの用途に対する要求が高まった。しかし、帯域幅、記憶装置及びプロセッサのような資源には限りがあるため、高画質の画像は不可能である場合が多い。画像の画質は、画像の画素数と、各画素に割り当てられるビット数とに依存する。例えば、1画素が24ビットで表される1024×1024画素の画像は25Mbの高画質カラー画像となり、1画素が1ビットで表される10×10画素の画像は100ビットの低画質の白黒「サムネイル」画像となる。
1つの解決策は、画像中の関心領域(ROI)を背景(BG)と区別する。ROIの符号化にはBGよりも多くのビットが用いられる。ROIにBGよりも多くのビットを割り当てることにより、符号化画像中のROIの知覚される解像度及び画質を低下させることなく、画像の符号化に用いられる総ビット数を減らすことができる。ビット数が少なくなれば必要な資源が削減される。
1つのROI符号化方法は、ROIのウェーブレット変換係数を選択的に増大させる。Atsumi等著「階層木における集合分割法(SPIHT)に基づく有損失/無損失の関心領域の画像符号化(Lossy/lossless region-of-interest image coding based on set partitioning in hierarchical trees)」IEEE Proceeding of ICIP, October 1998。ROIはまた、より高い優先度で転送される。しかし、スケーリング値によっては、ROIがBGに溶け込んで見える可能性がある。したがって、デコーダは、ROIをBGと区別するために形状情報も必要とする。
JPEG2000規格は、ROI符号化のためのmax−shift法を規定する。ISO/IEC 15444-1「情報技術−JPEG2000画像符号化方式−パート1:基本符号化方式(Information technology - JPEG 2000 image coding system - Part 1: Core coding system)」1st Ed., 2000。JPEG2000規格は、色変換、量子化、ウェーブレット変換、プログレッシブなビットプレーン符号化、及びエントロピー符号化を用いる。符号化画像は、階層パケットストリームとして転送される。JPEG2000では、符号化中に出力画像のサイズ及び画質が選択される。max−shift法は、ROIを重複のないビットプレーンにスケーリングすることによって、ROIを背景から分離する。Skodras等著「JPEG2000の静止画圧縮規格(The JPEG 2000 still image compression standard)」IEEE Signal Processing Magazine, September, 2001。スケーリング値は、ROIに関連する最小係数が背景の最大係数よりも確実に大きくなるように十分に大きい。デコーダは、スケーリング値を受け取ると、ROI係数をその大きさで識別する。max−shift法により、ROIの形状情報をデコーダに明示的に送信することなく、任意形状のROIの符号化が可能になる。しかし、max−shift符号化では、ROIの境界の画定に必要な余分な符号ブロックによりオーバーヘッドが増加する。
別の方法は、ROIの相対的な重要度に合わせてプレーン毎にビットをシフトする。Wang等著「ビットプレーン毎のシフト(BbBShift)−JPEG2000における関心領域の画像符号化に対する提案(Bitplane-by-bitplane shift (BbBShift) - A suggestion for JPEG 2000 Region of Interest image coding」IEEE Signal Processing Letters, Vol. 9, No. 5, May 2002。しかし、BbBShift法はJPEG2000規格に準拠していない。
別の方法は「部分的な上位ビットプレーンシフト(partial significant bit-planes shift)」(PSBShift)と呼ばれる。Liu等著「JPEG2000における関心領域の新たな画像符号化方法:部分的な上位ビットプレーンシフト(A new JPEG 2000 region-of-interest image coding method: partial significant bitplanes shift)」IEEE Signal Processing Letters, Vol. 10, No. 2, February 2003。PSBShift法は、ROIの高画質を維持しようとする。PSBShift法もやはりJPEG2000規格に準拠していない。
上記のROI符号化方法はすべて静的符号化を用いる。すなわち、ROIは「符号化」中に規定される。これは、ROI情報が「復号化」中にしか利用できない場合に問題となる。例えば、閲覧者がROIを指定することを望む。これもまた、ROI情報が外部ソースによって動的に供給される場合に問題となる。例えば、オブジェクト追跡のような外部プロセスは、画像を復号化前に解析してROIを判定する。
動的なROI符号化方法が、Rosenbaum等著「JPEG2000におけるフレキシブルで、動的で、且つコンプライアントな関心領域の符号化(Flexible, dynamic and compliant region of interest coding in JPEG 2000)」IEEE Proceeding of ICIP, Rochester, New York, September, 2002に記載されている。この方法は、インタラクティブ環境における動的なROI情報に対処する。この方法は、JPEG2000規格によって規定されるプレシンクト/レイヤ構造を用いて、各レイヤにおけるプレシンクトの優先度を決める。この方法はレイヤを動的に挿入する。ROIパケットは同じレイヤに残り、他のパケットは1つ上のレイヤにシフトされる。しかし、動的なレイヤ挿入にはパケットヘッダの再符号化が必要になる。これはレート−歪みの再計算を必要とするが、この特徴はリアルタイム画像伝送用途には望ましくない。さらに、この方法はJPEG2000規格に準拠している。
したがって、従来技術による符号化方法の問題のために、パケットヘッダの再符号化を回避するとともに、ROIの符号化をフレキシブルで、動的で、且つ計算の複雑度が低いものにする新たな符号化機構を提供することが望ましい。
1つの方法では、符号化入力ビットストリームの形態の画像又はビデオをトランスコードする。パケットの形態の入力ビットストリームは画質レイヤ(quality layer)を含み、各画質レイヤは解像度レベルを含み、各解像度レベルはコンポーネントを含み、各コンポーネントはプレシンクトを含み、各プレシンクトはパケット分割位置、ヘッダ長、及び本文の長さを含む。
入力ビットストリームは部分的に復号化されて、インデックス付きの符号化入力ビットストリーム構造が得られる。画像中の関心領域の座標が指定されて、プログレッシブパラメータが規定される。
部分的に復号化された入力ビットストリームは次に、構造、座標、及びプログレッシブパラメータに従って符号化され、符号化出力ビットストリームが得られる。
トランスコーディング中、入力ビットストリームの関心領域パケット及び背景パケットがプログレッシブパラメータに従って出力ビットストリームに選択的に変換される。例えば、出力ビットストリームに背景パケットは含まれないか、関心領域と、低画質レイヤからの背景パケットのみが含まれる。
本発明は、符号化ビットストリームからの画像の復元を任意数の異なる方法において任意の所望の空間解像度及び画質で可能にする。本発明によるトランスコーディングは適応的且つスケーラブルである。本発明は、関心領域の高画質及び高解像度を維持することができる。画像の残りの部分は、画質を落とすか、又は完全に削除して、所望の帯域幅を達成することができる。本発明による方法は、従来技術の方法に比べて複雑度が低く効率が高い。
従来技術と異なり、本発明はパケットの完全な復号化及び再符号化を行わない。その代わりに、本発明は、パケットを選択的に削除するか、又は、空パケットを用いて、ROIの優先度を効果的に上げる。これにより、リアルタイムでのトランスコーディング用途が可能になる。
図1は、本発明による、関心領域(ROI)を含む画像をトランスコードするシステム及び方法を示す。ROIは画像中の矩形領域である。本発明のシステムに対する入力は、符号化ビットストリーム101、例えばJPEG2000ビットストリームである。このビットストリームはデータパケットシーケンスの形態である。画像は、有損失技法又は無損失技法を用いて圧縮することができる。
ビットストリーム101の符号化中、JPEG2000規格においてウェーブレット変換を使用して、画像を4つのサブバンド画像として解析する。サブバンド画像は、それらの異なる空間周波数特性を記述する係数を含む。周波数の最も低いサブバンド画像をさらに4つのより小さなサブバンドに分解する。このプロセスは、所望の画像解像度に対して必要に応じて繰り返すことができる。各サブバンド画像は、「符号ブロック」と呼ばれる重複のない矩形ブロックに分割される。各符号ブロックは個別に符号化されて、最終的な符号化ビットストリーム101が生成される。
ビットストリームを効率的に編成するために、符号ブロックを各解像度レベル内で「プレシンクト」にグループ分けする。プレシンクト分割は、画像の特定の空間領域に対応するウェーブレット係数へのアクセスを容易にする。各プレシンクトはビットストリーム中の1パケットを生成する。SNR−プログレッシブ精緻化を可能にするために、1つのパケットに含まれる情報を複数のレイヤに分散させる。各レイヤは検討されるプレシンクトからの一定量のデータを含む。
ビットストリーム中の各画質レイヤ及び各解像度レベルから所望のパケットを抽出するために、本発明は、符号ブロックの算術的復号化を行わずにパケットヘッダ情報を部分的に復号化するパーサ110を提供する。こうして、ROIトランスコーディング120により、最小の計算複雑度で符号化出力ビットストリーム104を生成することが可能になる。
図2に示すように、パーサ110は、タグツリーデコーダを用いて、入力ビットストリームの階層データ構造200を得る。
ビットストリーム101中のパケットを部分的に復号化110して構造200を得る。階層構造は画質レイヤ(Qレイヤn)201を含み、各レイヤは解像度レベル(Rレベルm)202を含み、各解像度レベルはコンポーネント203を含み、各コンポーネントはプレシンクト204を含み、各プレシンクトはパケット分割位置205、ヘッダ長206、及び本文の長さ207を含む。インデックス番号により、プレシンクト情報205〜207に直接アクセスすることができる。
JPEG2000ビットストリームの複雑なアーキテクチャにより、全てのプレシンクトにアクセスすることは高くつく。したがって、本発明ではデータ構造200を、インデックス番号によりランダムに直接アクセスできるように設計する。
図1に示すように、ROI座標112及びプログレッシブパラメータ113も例えばユーザ又は外部ソースによって指定及び規定される。
構造200、ROI座標112、及びプログレッシブパラメータ113はトランスコーダ120に渡される。従来技術とは対照的に、ROI座標112は、符号化中ではなくトランスコーディング中に指定される。例えば、ユーザがROIをマーク付けするか、又は、オブジェクト認識又はパターン認識等の他の技法によって座標が供給される。認識器は、画像中のオブジェクト又はパターンを見つけ、そのオブジェクトの周囲にROIを当てはめて座標を得る。
ROI座標はプレシンクト位置と一致しない場合がある。その場合、トランスコーディング120は、ROI座標を外側の最も近いプレシンクト境界に丸める。すなわち、矩形のROIを、プレシンクトによって規定される境界に合わせて大きくする。プログレッシブパラメータは、ユーザがトランスコーディングの前に規定して、背景(BG)を削除できるかを指示するか、又は、BG及びROIについてトランスコードする必要のある画質レベル数を指示することもできる。プログレッシブパラメータの使用については後述する。
トランスコーダは、構造情報200及び座標112を用いて、入力ビットストリーム101中のBGパケット及びROIパケットを識別する。パケットをROI座標112及びプログレッシブパラメータ113に従って、符号化出力ビットストリーム104のパケットに再編成する。最終的な符号化出力ビットストリーム104は、JPEG2000規格に完全準拠する。
図3は、ROI302と、残りの背景(BG)303とを含む例示的な画像301を示す。ROIの座標は、原点(O)並びにX軸及びY軸に対して規定される。
図4に示すように、画像301は、ビットストリーム101の5つの「画質」レイヤ411〜415からなるBGパケット401及びROIパケット402に符号化される。
図5は、ビットストリーム101の5つのレイヤ411〜415におけるROIパケット及びBGパケットの、いわゆる「レイヤ−解像度−コンポーネント−位置(LRCP)」プログレッションを用いた配置を1つの解像度レベル及び1つのコンポーネントについて示す。
図6は、3つのレベル601〜603を有する解像度マップ600を示す。プレシンクトは、特定の解像度レベルにおける画像中の空間領域を記述する。JPEG2000による分解では、各方向におけるプレシンクトのサイズは2のべき乗である。高解像度レベルの画像領域は、2で割ることでその下の解像度レベルに伝わる。この手順は解像度レベル毎に繰り返される。
図7は、LRCPプログレッションを用いた対応するビットストリーム700を示す。図7から、結果として得られるパケットは、所定の解像度レベルでの画像の特定の領域に関する情報を含むことが分かる。
所望のROIを抽出し、BGとROIに対してスケーラブルな画質を指定するために、トランスコーダ120は2つのプログレッシブパラメータm及びnを用いる。パラメータmはBG303の所望の「画質」を指定し、パラメータnはROI302の所望の画質を指定する。パラメータm及びnは以下の制約を有する。
ROIの場合、
0≦m<n≦最大画質とし、さもなければ、
背景の場合、
0≦m≦最大画質とし、
背景なしの場合、
m=0とする。
最後の制約の下では、背景全体が空パケットに変換され、ROIパケットのみがトランスコードされる。1つの空パケットは1バイトのパケットヘッダを有し、1番目のビットがゼロに設定され、ペイロードがなくなる。この場合、トランスコードされた出力ビットストリームに対する帯域幅要件が大幅に削減される。
ROIパケットの場合、トランスコーダ120は、入力ビットストリームから、最も低い画質レイヤ1から画質レイヤnまでのROIパケットのみを抽出し、これらのパケットを符号化して出力ビットストリームを生成する。nより高いレイヤからのROIパケットは、符号化出力ビットストリームにおいて空パケットに変換される。
BGパケットの場合、m=0であれば、全てのBGパケットを空パケットに変換する。m>0であれば、トランスコーダ120が入力ビットストリームの最も低い画質レイヤ1から画質レイヤmまでのBGパケットを抽出し、これらのパケットを符号化して出力ビットストリームを生成する。mより高いレイヤのBGパケットは全て、出力ビットストリームにおいて空パケットに変換される。
パラメータm及びnの組み合わせを変えることで、ROI及びBGについてさまざまな画質のプログレッシブな結果を得ることができる。ユーザは、この特徴を利用して、視覚要件と通信帯域容量の間で調整を行うことができる。
図8は、プログレッシブパラメータをm=1及びn=4としてトランスコードする例示的な画像800を示す。画像800は、空パケット801と、ROIパケット802と、BGパケット803とを有する。
図9は、対応する出力ビットストリーム900のパケットを示す。
本発明を好ましい実施形態の例として説明してきたが、本発明の精神及び範囲内でさまざまな他の適応及び変更を行うことができることが理解される。したがって、添付の特許請求の範囲の目的は、本発明の真の精神及び範囲に入るそのような変形及び変更をすべて網羅することである。
本発明による、画像をトランスコードするシステム及び方法のブロック図である。 本発明による階層ビットストリームの構造のブロック図である。 本発明による、関心領域を含む画像のブロック図である。 本発明による、トランスコードする階層パケットのブロック図である。 本発明による入力ビットストリームのブロック図である。 本発明による解像度レベルのブロック図である。 図6の解像度レベルに対応するビットストリームのブロック図である。 本発明による、トランスコードする画像のブロック図である。 本発明による出力ビットストリームのブロック図である。

Claims (19)

  1. 画像の符号化入力ビットストリームを部分的に復号化して、前記符号化入力ビットストリームの構造を得ること、
    前記画像の関心領域の座標を指定すること、
    プログレッシブパラメータを規定すること、
    及び
    部分的に復号化された入力ビットストリームを前記構造、前記座標、及び前記プログレッシブパラメータに従って、符号化出力ビットストリームとして符号化すること
    を含む、スケーラブルな画像トランスコーディング方法。
  2. 前記符号化入力ビットストリーム及び前記符号化出力ビットストリームは、ともにJPEG2000ビットストリームである
    請求項1記載の方法。
  3. 前記符号化入力ビットストリームは、複数の画質レイヤを含み、各画質レイヤは複数の解像度レベルを含み、各解像度レベルは複数のコンポーネントを含み、各コンポーネントは複数のプレシンクトを含み、各プレシンクトはパケット分割位置、ヘッダ長、及び本文の長さを含む
    請求項1記載の方法。
  4. インデックス番号を用いて前記プレシンクトをインデックス付けすることをさらに含む
    請求項3記載の方法。
  5. 符号化中に前記インデックス番号を用いて前記構造にランダムにアクセスすることをさらに含む
    請求項4記載の方法。
  6. 符号化中に前記インデックス番号を用いて前記構造に直接アクセスすることをさらに含む
    請求項4記載の方法。
  7. トランスコーディング中にユーザによって前記座標を規定することをさらに含む
    請求項1記載の方法。
  8. トランスコーディング中に外部ソースによって前記座標を規定することをさらに含む
    請求項1記載の方法。
  9. 前記外部ソースは、オブジェクト認識を用いて前記関心領域の前記パラメータを求める
    請求項8記載の方法。
  10. 前記外部ソースは、パターン認識を用いて前記関心領域の前記パラメータを求める
    請求項8記載の方法。
  11. 前記パラメータを外側の、前記複数のプレシンクトの最も近い境界に丸めることをさらに含む
    請求項3記載の方法。
  12. トランスコーディング中にユーザによって前記プログレッシブパラメータを指定することをさらに含む
    請求項1記載の方法。
  13. プログレッシブパラメータmが前記画像の背景の画質を指定し、パラメータnが前記関心領域の画質を指定する
    請求項3記載の方法。
  14. 前記プログレッシブパラメータm及びnを、
    前記関心領域の場合、
    0≦m<n≦最大画質とし、さもなければ
    前記背景の場合、
    0≦m≦最大画質とし、
    背景なしの場合、
    m=0とする
    に従って制約することをさらに含む
    請求項13記載の方法。
  15. 前記符号化入力ビットストリームは、関心領域パケットと背景パケットを含み、
    m=0の場合に全ての背景パケットを前記符号化出力ビットストリームにおいて空パケットに変換することをさらに含み、1つの空パケットは1バイトのパケットヘッダを有し、1番目のビットがゼロに設定され、ペイロードがなくなる
    請求項14記載の方法。
  16. 前記関心領域パケットの場合に、最も低い画質レイヤ1から画質レイヤnまでの関心領域パケットのみを抽出し、前記抽出した関心領域パケットを前記符号化出力ビットストリームにおいて符号化するとともに、他の全ての関心領域パケットを前記符号化出力ビットストリームにおいて空パケットに変換すること、
    及び、
    前記背景パケットの場合に、前記最も低い画質レイヤ1から画質レイヤmまでの背景パケットのみを抽出し、前記抽出した背景パケットを前記符号化出力ビットストリームにおいて符号化するとともに、他の全ての背景パケットを前記符号化出力ビットストリームにおいて空パケットに変換することをさらに含む
    請求項15記載の方法。
  17. 前記符号化入力ビットストリームは、複数の画像を含むビデオであり、前記復号化するステップと、前記指定するステップと、前記規定するステップと、前記符号化するステップとは画像毎に実行される
    請求項1記載の方法。
  18. 前記符号化入力ビットストリームは、複数のパケットを含み、前記復号化することは前記パケットのヘッダのみに適用される
    請求項1記載の方法。
  19. 前記プログレッシブパラメータは、所望の画質及び帯域幅使用率に合わせて指定される
    請求項1記載の方法。
JP2005290007A 2004-12-02 2005-10-03 スケーラブルな画像トランスコーディング方法 Expired - Fee Related JP4606987B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/002,817 US7440626B2 (en) 2004-12-02 2004-12-02 Image transcoding

Publications (2)

Publication Number Publication Date
JP2006166413A true JP2006166413A (ja) 2006-06-22
JP4606987B2 JP4606987B2 (ja) 2011-01-05

Family

ID=35664919

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005290007A Expired - Fee Related JP4606987B2 (ja) 2004-12-02 2005-10-03 スケーラブルな画像トランスコーディング方法

Country Status (4)

Country Link
US (1) US7440626B2 (ja)
EP (1) EP1667460B1 (ja)
JP (1) JP4606987B2 (ja)
CN (1) CN100527845C (ja)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6950213B1 (en) * 2000-12-20 2005-09-27 Cisco Systems, Inc. Fast method for fax encoded data conversion
US20050232497A1 (en) * 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
US20080140722A1 (en) * 2006-11-20 2008-06-12 Vivalog Llc Interactive viewing, asynchronous retrieval, and annotation of medical images
US7675549B1 (en) * 2006-12-08 2010-03-09 Itt Manufacturing Enterprises, Inc. Imaging architecture for region and time of interest collection and dissemination
CN101653004A (zh) 2007-04-04 2010-02-17 Nxp股份有限公司 从编码比特流选择性地解码预定数据单元的解码器
US20090003270A1 (en) * 2007-06-29 2009-01-01 Schwenke Derek L Server-Driven Progressive Image Transmission
US8654139B2 (en) 2007-08-29 2014-02-18 Mckesson Technologies Inc. Methods and systems to transmit, view, and manipulate medical images in a general purpose viewing agent
US8520978B2 (en) * 2007-10-31 2013-08-27 Mckesson Technologies Inc. Methods, computer program products, apparatuses, and systems for facilitating viewing and manipulation of an image on a client device
CN101842811B (zh) * 2007-11-02 2012-05-23 高等技术学校 用于预测经过通过缩放以及质量控制参数的改变而转换的图像的文件大小的系统和方法
US8270739B2 (en) 2007-12-03 2012-09-18 Ecole De Technologie Superieure System and method for quality-aware selection of parameters in transcoding of digital images
US8457958B2 (en) * 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
CN101547351B (zh) * 2008-03-24 2013-05-15 展讯通信(上海)有限公司 视频数据流生成、处理方法及其设备
JP5167944B2 (ja) * 2008-05-15 2013-03-21 株式会社リコー 情報処理装置、情報処理方法、プログラム及び記録媒体
US20090300692A1 (en) * 2008-06-02 2009-12-03 Mavlankar Aditya A Systems and methods for video streaming and display
JP4656190B2 (ja) * 2008-06-10 2011-03-23 ソニー株式会社 情報処理装置および方法
US8300961B2 (en) * 2008-12-12 2012-10-30 Ecole De Technologie Superieure Method and system for low complexity transcoding of images with near optimal quality
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8345749B2 (en) * 2009-08-31 2013-01-01 IAD Gesellschaft für Informatik, Automatisierung und Datenverarbeitung mbH Method and system for transcoding regions of interests in video surveillance
CN101888542B (zh) * 2010-06-11 2013-01-09 北京数码视讯科技股份有限公司 视频转码的帧级码率控制方法及转码器
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
JP5569206B2 (ja) * 2010-07-15 2014-08-13 ソニー株式会社 画像処理装置および方法
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
EP3174295B1 (en) 2012-04-13 2018-12-12 GE Video Compression, LLC Low delay picture coding
CN115442626A (zh) 2012-06-29 2022-12-06 Ge视频压缩有限责任公司 视频数据流、编码器、编码视频内容的方法以及解码器
US9338450B2 (en) 2013-03-18 2016-05-10 Ecole De Technologie Superieure Method and apparatus for signal encoding producing encoded signals of high fidelity at minimal sizes
US10609405B2 (en) 2013-03-18 2020-03-31 Ecole De Technologie Superieure Optimal signal encoding based on experimental data
US9661331B2 (en) 2013-03-18 2017-05-23 Vantrix Corporation Method and apparatus for signal encoding realizing optimal fidelity
CN103179405B (zh) * 2013-03-26 2016-02-24 天津大学 一种基于多级感兴趣区域的多视点视频编码方法
EP3562170A1 (en) 2013-07-29 2019-10-30 Koninklijke KPN N.V. Providing tile video streams to a client
US10284858B2 (en) * 2013-10-15 2019-05-07 Qualcomm Incorporated Support of multi-mode extraction for multi-layer video codecs
JP6440747B2 (ja) * 2014-06-27 2018-12-19 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ Hevcでタイル化されたビデオ・ストリームに基づく関心領域の決定
US10694192B2 (en) 2014-06-27 2020-06-23 Koninklijke Kpn N.V. HEVC-tiled video streaming
WO2017029400A1 (en) 2015-08-20 2017-02-23 Koninklijke Kpn N.V. Forming one or more tile streams on the basis of one or more video streams
JP6879479B2 (ja) * 2015-09-02 2021-06-02 インターディジタル・シーイー・パテント・ホールディングス・ソシエテ・パ・アクシオンス・シンプリフィエ 拡張されたシーンでナビゲーションを容易にする方法、装置及びシステム
US10674185B2 (en) 2015-10-08 2020-06-02 Koninklijke Kpn N.V. Enhancing a region of interest in video frames of a video stream
US11146608B2 (en) * 2017-07-20 2021-10-12 Disney Enterprises, Inc. Frame-accurate video seeking via web browsers
US10771163B2 (en) * 2017-10-24 2020-09-08 Mediatek Inc. Apparatus and method for decoding ROI regions in image
US11523185B2 (en) 2019-06-19 2022-12-06 Koninklijke Kpn N.V. Rendering video stream in sub-area of visible display area
EP4144093A4 (en) 2020-05-22 2023-08-23 ByteDance Inc. SIGNALING OF IMAGE INFORMATION IN ACCESS UNITS

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001218062A (ja) * 1999-11-11 2001-08-10 Canon Inc 画像処理装置及び方法と記憶媒体
JP2001313944A (ja) * 2000-04-28 2001-11-09 Canon Inc 画像処理装置、画像入力装置、システム、及び画像処理方法並びに記憶媒体
JP2004072655A (ja) * 2002-08-09 2004-03-04 Ricoh Co Ltd Roi領域設定装置、電子カメラ装置、roi領域設定方法、プログラム、記録媒体
JP2004134938A (ja) * 2002-10-09 2004-04-30 Minolta Co Ltd 画像処理装置
JP2004242287A (ja) * 2003-01-14 2004-08-26 Canon Inc 情報処理方法及び装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2004282345A (ja) * 2003-03-14 2004-10-07 Canon Inc 画像処理装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6553150B1 (en) * 2000-04-25 2003-04-22 Hewlett-Packard Development Co., Lp Image sequence compression featuring independently coded regions
US6661927B1 (en) * 2000-07-27 2003-12-09 Motorola, Inc. System and method for efficiently encoding an image by prioritizing groups of spatially correlated coefficients based on an activity measure
US7206804B1 (en) * 2000-11-10 2007-04-17 Sharp Laboratories Of America, Inc. Methods and systems for transmitting digital images
US6898323B2 (en) * 2001-02-15 2005-05-24 Ricoh Company, Ltd. Memory usage scheme for performing wavelet processing
DE10138532A1 (de) * 2001-08-06 2003-02-27 Siemens Ag Verfahren zum dynamischen, priorisierbaren und wahlfreien Zugriff auf Bildbereiche in JPEG2000-komprimierten Bildern sowie darauf aufbauende Client-Server-Architektur
US7116833B2 (en) * 2002-12-23 2006-10-03 Eastman Kodak Company Method of transmitting selected regions of interest of digital video data at selected resolutions

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001218062A (ja) * 1999-11-11 2001-08-10 Canon Inc 画像処理装置及び方法と記憶媒体
JP2001313944A (ja) * 2000-04-28 2001-11-09 Canon Inc 画像処理装置、画像入力装置、システム、及び画像処理方法並びに記憶媒体
JP2004072655A (ja) * 2002-08-09 2004-03-04 Ricoh Co Ltd Roi領域設定装置、電子カメラ装置、roi領域設定方法、プログラム、記録媒体
JP2004134938A (ja) * 2002-10-09 2004-04-30 Minolta Co Ltd 画像処理装置
JP2004242287A (ja) * 2003-01-14 2004-08-26 Canon Inc 情報処理方法及び装置、並びにコンピュータプログラム及びコンピュータ可読記憶媒体
JP2004282345A (ja) * 2003-03-14 2004-10-07 Canon Inc 画像処理装置

Also Published As

Publication number Publication date
EP1667460B1 (en) 2012-12-19
US7440626B2 (en) 2008-10-21
EP1667460A3 (en) 2009-02-11
CN1784014A (zh) 2006-06-07
CN100527845C (zh) 2009-08-12
JP4606987B2 (ja) 2011-01-05
EP1667460A2 (en) 2006-06-07
US20060120610A1 (en) 2006-06-08

Similar Documents

Publication Publication Date Title
JP4606987B2 (ja) スケーラブルな画像トランスコーディング方法
Marcellin et al. An overview of JPEG-2000
Taubman et al. JPEG2000: Standard for interactive imaging
Sanchez et al. Prioritized region of interest coding in JPEG2000
US7672524B2 (en) Quality control for image transcoding
US20050152611A1 (en) Video/image coding method and system enabling region-of-interest
US20050157794A1 (en) Scalable video encoding method and apparatus supporting closed-loop optimization
JP2007166625A (ja) ビデオデータ符号化装置、ビデオデータ符号化方法、ビデオデータ復号化装置およびビデオデータ復号化方法
US11533497B2 (en) Encoder, a decoder and corresponding methods of signaling and semantics in parameter sets
US20180302650A1 (en) Moving image decoding apparatus, moving image decoding method, moving image encoding apparatus, moving image encoding method and computer-readable storage medium
US20090003270A1 (en) Server-Driven Progressive Image Transmission
US9264736B2 (en) Encoding method, decoding method, encoding device, and decoding device
Kong et al. Fast region-of-interest transcoding for JPEG 2000 images
Taubman et al. FBCOT: a fast block coding option for JPEG 2000
KR20050013376A (ko) 블록별 에너지를 기초로 정지 영상을 적응적으로 부호화할수 있는 이산 웨이블렛 변환 장치 및 방법
WO2023110642A1 (en) Methods and apparatuses for converting film grain metadata
CN115362679A (zh) 用于视频编码和解码的方法和装置
CN114762339A (zh) 基于变换跳过和调色板编码相关高级语法元素的图像或视频编码
Nguyen et al. Importance prioritization coding in JPEG 2000 for interpretability with application to surveillance imagery
Kong et al. ROI-based SNR scalable JPEG2000 image transcoding
Skodras The JPEG2000 image compression standard in mobile health
JP2024522138A (ja) ビデオを符号化/復号するための方法及び装置
CN118235413A (zh) 不可分离初级变换设计方法和装置
Borer Low complexity video coding using SMPTE VC-2
CN118214869A (zh) 解码和编码设备及发送用于图像的数据的设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080808

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101005

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101006

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131015

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees