JP2013507084A - 画像処理のための方法およびシステム - Google Patents

画像処理のための方法およびシステム Download PDF

Info

Publication number
JP2013507084A
JP2013507084A JP2012532715A JP2012532715A JP2013507084A JP 2013507084 A JP2013507084 A JP 2013507084A JP 2012532715 A JP2012532715 A JP 2012532715A JP 2012532715 A JP2012532715 A JP 2012532715A JP 2013507084 A JP2013507084 A JP 2013507084A
Authority
JP
Japan
Prior art keywords
image
encoding
discrete
input
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012532715A
Other languages
English (en)
Inventor
カルメル,シャロン
ギル,ドローア
ショハム,タマル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beamr Imaging Ltd
Original Assignee
ICVT Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ICVT Ltd filed Critical ICVT Ltd
Publication of JP2013507084A publication Critical patent/JP2013507084A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

本発明の一態様により、離散的入力画像を、縮小サイズの離散的出力画像に処理するための方法およびシステムが提供される。いくつかの実施形態によれば、システムは、インタフェース、品質パラメーターコントローラーおよびイントラ予測エンコーダーを含み得る。品質コントローラーは、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連している。イントラ予測エンコーダーは、入力画像を再符号化するように構成され、再符号化はイントラ画像予測を含み、エンコーダーはその符号化品質パラメーターに従って構成される。
【選択図】図4

Description

関連出願の相互参照
本願は、2009年10月5日に出願された米国仮出願第61/248,521号、および2009年10月22日に出願された米国仮出願第61/253,872号、および2010年2月8日に出願された米国仮出願第61/302,193号からの優先権を主張し、その開示内容全体が参照により本明細書に組み込まれる。
本発明は、画像処理の分野に関連する。より詳細には、本発明は、非可逆画像処理の分野に関する。
参考文献一覧
以下の参考文献は、本発明の背景理解の目的のために適切であると考えられる:
[1]S.Cho、Z.Bojkovic、D.Milovanovic、J.Lee、およびJ.Hwang、「Image quality evaluation:JPEG2000 versus Intra−only H.264/AVC High Profile」、FACTA UNIVERSITATIS Elec.Energ.、vol.20、no.1,71〜83(2007年4月)
[2]F.De Simone、M.Ouaret、F.Dufaux、A.G.Tescher、およびT.Ebrahimi、「A comparative study of JPEG 2000,AVC/H.264,and HD Photo」、Applications of Digital Image Processing XXX、Proceedings of SPIE、vol.6696、San Diego,CA USA,28〜30、2007年8月。
[3]Ismail Dalgic、Fouad A.Tobagi、「Constant Quality Video Encoding」、Proc.of IEEEE ICC‘95、Seattle,Washinton、1995年6月。
[4]I.Matsuda、Y.Nomoto、K.WakabayashiおよびS.Itoh、「Lossless Re−encoding of JPEG Images Using Block−Adaptive Intra Prediction」Proc.of 16th European Signal Processing Conference(EUSIPCO 2008)、Lausanne,Switzerland、L3〜6、2008年8月25日〜29日。
[5]Anthony J Maeder、Birgit M Planitz、「Medical Image Watermarking for Multiple Modalities」、aipr,pp.158〜165、34th Applied Imagery and Pattern Recognition Workship(AIPR‘05)、2005年。
[6]Z.Wang、A.C.Bovik、H.R.Sheikh、E.P.Simoncelli、「Image Quality Assessment:From Error Visibility to Structural Similarity」、IEEE Transactions on Image Processing、Vol.13、No.4、pp.600〜612、2004年4月。
[7]M.Martinez−Rach、O.Lopez、P.Pinol、M.P.MalumbresおよびJ.Oliver、「A Study of Objective Quality Assessment Metrics for Video Codec Design and Evaluation」、IEEE International Symposium on Multimedia、pp.517〜524、2006年12月(ISM‘06)
Choら[1]は、イントラのみのH.264/AVC High Profile(HP)規格対JPEG2000規格に対する画像品質評価を開示する。特に、主観的および客観的評価との関連で、2つの規格の構造および符号化アルゴリズムが提供される。また、モノクロおよびカラー画像のテストセットについて実行されたシミュレーションも開示されている。Choらは、H.264/AVCの主観的および客観的な画像品質が、画像全体の変換ではなくブロック変換から構成されるため、内在するブロッキングアーチファクト(blocking artifact)を除き、JPEG2000よりも優れているという観測に基づいて判断する。
Simoneら[2]は、JPEG 2000、AVC/H.264 High 4:4:4イントラおよびHD Photo間のレート歪み性能を評価する研究を報告する。評価用に、異なる空間分解能を有する10個の高解像度カラー画像の組が使用されている。PSNRおよび知覚的MSSIM指標の両方が、歪みの測定基準と見なされた。Simoneらによると、実験の実行に使用された材料について、全体的な性能は、圧縮効率の観点から、3つの符号化方式について全く同程度であり、ビットレート変動において±10%の平均範囲内で従来型JPEGより効率が良いということが、結果から示されている。
Matsudaら[3]は、既存のJPEGファイルを、品質を損なうことなく圧縮するトランスコーディング(transcoding)方式を提案する。この方式では、JPEGファイルに格納されている量子化されたDCT係数のブロック間相関関係を利用するために、H.264のようなブロック適応イントラ予測が採用されている。この予測は、8×8画素から構成される各ブロックの空間領域で実行されるが、元の係数の可逆復元を確実にするため、対応する予測残差がDCT領域で計算される。さらに、予測残差の確率密度関数(PDF)の正確なモデリングを可能するために、ブロックベースの分類が実行される。マルチシンボル算術符号器が、各DCT係数の予測残差のエントロピー符号化のために、PDFモデルと共に使用される。
DalgicおよびTobagi[4]は、符号化ビデオの品質を一定レベルで維持するビデオ符号化方式を提案する。この方式は、定量的ビデオ品質尺度に基づいており、エンコーダーのパラメーターを制御するためにフィードバック制御機構を使用する。
本発明の一態様により、離散的入力画像を、縮小サイズの離散的出力画像に処理するための方法およびシステムが提供される。いくつかの実施形態によれば、システムは、インタフェース、品質パラメーターコントローラーおよびイントラ予測エンコーダーを含み得る。品質コントローラーは、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連している。イントラ予測エンコーダーは、入力画像を再符号化するように構成され、再符号化はイントラ画像予測を含み、エンコーダーは符号化品質パラメーターによって構成される。
いくつかの実施形態によれば、目標とする定量的類似性尺度は、出力画像と入力画像との間の許容差を表す。別の実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の最小限の類似性要件を表す。
いくつかの実施形態では、符号化品質パラメーターは、固定の事前定義値によって設定される。別の実施形態では、符号化品質パラメーターは、事前定義した公式によって計算される。さらに別の実施形態では、符号化品質パラメーターは、事前生成したルックアップテーブルから選択される。さらにまた別の実施形態では、符号化品質パラメーターは、事前定義した検索基準に基づく事前定義した反復検索プロセスによって決定される。
いくつかの実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の類似性に対する最小閾値を表す最小類似値によって示される。別の実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の差異に対する最大閾値を表す最大差分値によって示される。さらに別の実施形態では、目標とする定量的類似性尺度は、それぞれ差異または類似性の範囲をもたらす、最小差分値または最大類似値によっても示される。
いくつかの実施形態では、最小類似値および/または最大差分値は、知覚的に同一の定量的類似性(または定量的差異)を示す。別の実施形態では、最小類似値(または最大差分値)は、特定の構造的類似性(SSIM)指標値および関連するパラメーターの特定値によって示される。さらに別の実施形態では、最小類似値(または最大差分値)は、以下のパラメーターをもつ約0.95の構造的類似性(SSIM)指標値に対応するか、または実質的に等しい:つまり、シグマ=1.5の11×11ガウシアンフィルター、およびSSIM定数のデフォルト値−[0.01,0.03]。本発明のさらにまた別の実施形態では、品質パラメーターコントローラーは、以下のパラメーターまたはその相当物をもつ0.95以上のSSIM指標値を提供し、入力画像に対して実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成される。
さらに別の実施形態では、最小類似値(または最大差分値)は、修正されたSSIM品質尺度を用いて決定される。SSIM品質尺度は、画像の特定領域にペナルティを適用することにより適合され、修正されたSSIM品質尺度を生じる。これらの領域に対して計算されたSSIMスコアは、それぞれのペナルティに従ってペナルティを科される。一例では、ペナルティは、例えば、滑らかな領域で取得したSSIM値の二乗を含み得る。さらに例として、滑らかな領域は、元の画像で局所的画像変動を計算し、その変動が閾値を下回る領域を滑らかと分類することにより、識別される。他のペナルティは、各領域に対するSSIM値について、異なる方法で使用および適用され得る。領域ペナルティ手順(regional penalty procedure)は、SSIMスコアリングプロセスと統合され得るか、またはSSIMスコアリングプロセスが完了した後に実施される追加のステップとして実施され得る。その上、他の種類の領域が存在し得、その識別は、局所的画像変動に加えて、さらなる技術を含み得る。
さらにまた別の実施形態では、SSIM品質尺度が修正され、局所的SSIMスコア全てを平均化する代わりに、事前定義した閾値によって決定された最小SSIMをもつ領域に対して平均化が実行されるようになる。さらに別の実施形態では、画像がブロックに分割され、SSIM品質尺度が、各ブロックについて別々に計算された後、ブロックスコアに基づき全体の品質スコアが計算され、システムによって使用される最小類似値が、ブロック単位全体品質スコア(block−wise global quality score)に対応する。
別の実施形態では、SSIM品質尺度の計算は、その計算を画像全体に対して実行する代わりに、入力画像の選択部分のピクセルおよび出力画像の対応するピクセルに対して実行することにより最適化され得る。
別の実施形態では、最小類似値(または最大差分値)は、特定のピーク信号対雑音比(PSNR)指標値および関連するパラメーターの特定値によって示される。本発明のさらに別の実施形態では、品質パラメーターコントローラーは、約45dBのピーク信号対雑音比値に等しい符号化品質パラメーターを提供するように構成される。
別の実施形態では、最小類似値(または最大差分値)は、入力画像に対して出力画像のブロッキネスの有無を定量化するブロッキネス尺度、出力画像と入力画像との間のテクスチャ類似性を定量化するテクスチャ尺度、および出力画像と入力画像との間の局所類似性を定量化する局所類似性尺度を含む品質尺度によって示される。かかる品質尺度のさらなる詳細については、2010年1月6日に出願された「Recompression of Digital Images Using a Robust Measure of Perceptual Quality Including Improved Quantization Matrix Computation」という名称の同時係属の米国仮出願第61/292,622号に記載されており、その内容が「付録A」として本願に組み込まれる。
本発明の別の実施形態では、最小類似値(または最大差分値)は、特定の視覚情報忠実度(VIF:visual information fidelity)値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定の画質評価尺度(PQS:picture quality scale)指標値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定のビデオ品質メトリック(VQM:video quality metric)指標値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定の視覚的品質の知覚評価(PEVQ:perceptual evaluation of visual quality)指標値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定のモスクワ大学(MSU:Moscow State University)ブロッキネス指標値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定のモスクワ大学(MSU)ぼかし(bluriness)指標値および関連するパラメーターの特定値によって示される。
いくつかの実施形態では、品質パラメーターコントローラーは、入力画像の定量的尺度に関連する入力画像品質パラメーターを取得するように構成される。品質パラメーターコントローラーは、入力画像の品質を特徴付けるために入力画像品質パラメーターを使用し得る。いくつかの実施形態では、入力画像品質パラメーターには、次のうちの1つまたは複数が含まれ得る:つまり、ビット/ピクセル、画像の品質表示、解像度、ファイルサイズ、および/または最小非ゼロDCT係数である。いくつかの実施形態によれば、より高品質の入力画像に対して知覚的に可逆な圧縮を獲得するため、実質的により低値の符号化品質パラメーターが提供され得る。さらに別の実施形態では、入力画像品質パラメーターは、符号化品質パラメーター検索の一部として使用され得る。さらに別の実施形態では、入力画像品質パラメーターは、反復符号化品質パラメーター検索プロセスの初期化に使用され得る。さらにまた別の実施形態では、入力画像品質パラメーターは、符号化プロセスがそもそも実行されるべきか否かを判断するために使用され得る。
別の実施形態では、品質コントローラーは、既に高度に圧縮されている入力画像を識別し、それらを再圧縮しないように構成され得る。いくつかの実施形態では、入力画像は、高度に圧縮されているか否かを識別するために分析され、高度に圧縮されている場合、符号化プロセスが個別の画像に対して無効にされる。別の実施形態では、入力画像が高度に圧縮されているか否かの識別は、逆量子化後に入力画像のDCT係数値を分析し、最小非ゼロDCT係数値を決定することにより実行される。さらに別の実施形態では、最小非ゼロDCT係数値が閾値と比較される。いくつかの実施形態では、閾値は、再圧縮率が低い(例えば、10%未満)全て(または一部)の再圧縮画像を評価し、それらの非ゼロDCT値の統計値を調べることにより決定される。例えば、後述するように、輝度(Luma)に対して閾値の3が使用され得る。いくつかの実施形態では、かかる分析が、画像の輝度および色差(Chroma)成分について別々に実行される。別の実施形態では、最小非ゼロDCT係数が閾値より大きい場合、符号化プロセスは、個別の画像に対して実行されない。さらに別の実施形態では、閾値が輝度成分と色差成分とで異なり、最終的な決定は、輝度および色差成分の閾値の組み合わせによって決まる。前述のとおり、ここでも、閾値は、再圧縮率が非常に低い画像におけるDCT値の統計値を評価することにより、経験的に決定され得る。いくつかの実施形態では、輝度成分の最小非ゼロDCT成分に対する閾値は3である。
本発明のいくつかの実施形態では、品質コントローラーは、目標とする定量的類似性尺度により、出力画像と入力画像との間の類似性を維持しながら、離散的出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを提供するように構成される。別の実施形態では、品質コントローラーが、出力画像と入力画像との間の類似性を最小類似値以上に維持しながら、離散的出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを提供するように構成される。さらに別の実施形態では、品質コントローラーが、出力画像と入力画像との間の差異を最大差分値以上に維持しながら、離散的出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを提供するように構成される。
別の実施形態では、品質コントローラーは、出力画像と入力画像との間の類似性(または差異)を事前定義した類似性(または差異)の範囲内に維持しながら、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成される。
いくつかの実施形態によれば、品質コントローラーは、類似性評価モジュールを含み得る。類似性評価モジュールは、イントラ予測エンコーダーと連携して、符号化品質パラメーターの反復検索を実施するように構成され得、検索の各繰返しにおいて、収束基準が満足されるまで、符号化品質パラメーターが増分(減少)される。別の実施形態によれば、収束基準は、1つまたは複数の以前の符号化品質パラメーターに関連するサイズ縮小と比較した現在の符号化品質パラメーターに関連するサイズ縮小の観点から、改善に関連する。別の実施形態では、収束基準は、1つまたは複数の以前の符号化品質パラメーターに関連するサイズ縮小と比較した現在の符号化品質パラメーターに関連するサイズ縮小の観点から、改善率に関連する。さらに別の実施形態では、符号化品質パラメーターの検索は、出力画像と入力画像との間の最小類似閾値(または最大差分閾値)によって制約される。
別の実施形態によれば、類似性評価モジュールは、イントラ予測エンコーダーと連携して、反復符号化品質パラメーター検索を実施するように構成され得、各繰返しにおいて、入力画像の少なくとも1つのセグメントが、現在の繰返しに対して提供されている暫定符号化品質パラメーターを用いて圧縮された後、結果として生じた暫定圧縮出力画像と入力画像との間の類似性が評価される。いくつかの実施形態では、暫定圧縮出力画像と入力画像との間の類似性が基準を満足していると判断される場合、品質コントローラーは、出力として現在の暫定出力画像を提供するようにエンコーダーに指示し得る。いくつかの実施形態では、暫定圧縮出力画像と入力画像との間の類似性が類似性基準を満足していないと判断される場合、類似性評価モジュールは、調整された暫定符号化品質パラメーターを用いて入力画像の再圧縮を繰り返した後に、結果として生じた暫定圧縮出力画像と入力画像との間の類似性が評価されるように構成され得る。暫定符号化品質パラメーターの調整およびその調整済み暫定パラメーターを用いた入力画像の再圧縮の評価は、暫定圧縮出力画像と入力画像との間の類似性が類似性基準を満足するまで繰り返され得る。さらに別の実施形態では、検索基準も、暫定符号化品質パラメーターによって可能になるサイズ縮小に関連し得る。
いくつかの実施形態では、暫定符号化品質パラメーターは、符号化品質パラメーターの制限範囲について2等分を実行することにより更新される。別の実施形態では、暫定符号化品質パラメーターの範囲は、ルックアップテーブルに指定されている符号化品質パラメーターの各値について2等分を実行することにより更新される。
いくつかの実施形態では、暫定符号化品質パラメーターは、繰返し回数および目標とする類似性尺度からの距離によって決まる適応ステップ幅を用いて更新される。かかる一更新スキームは、例えば、
Figure 2013507084
(公式f1)
であり得、式中、QPnew、QPoldは、それぞれ、次の繰返しおよび最後の繰返しに対する符号化品質パラメーター値であり、Δsimilarityは、公式f2に見られるとおりで、stepnumIterは、ルックアップテーブルから取得したステップ幅であって、繰返しカウントに応じて減少し、Cはある定数で、恐らく200であり、また、
Figure 2013507084
(公式f2)
である。
式中、currSimilarityは、最後の繰返しで作成された画像で評価された類似性であり、ThresholdSimilarityは、目標とする類似性尺度であり、Δsimilarityはそれらの間の差異である。
いくつかの実施形態によれば、システムは、少なくとも一部は入力画像の解像度に基づき出力画像の解像度を制御するように構成されている解像度制御モジュールをさらに含み得る。別の実施形態では、解像度制御モジュールは、入力画像の解像度に関連するパラメーターを取得するように構成され得る。入力画像の解像度は、第1画素数に対する第2画素数によって示され得る。本発明の別の実施形態では、解像度制御モジュールは、入力画像の解像度と実質的に等しい解像度を有する画像を出力として提供するようにエンコーダーを構成するように構成され得る。
本発明のいくつかの実施形態では、エンコーダーは、1つもしくはかなり少数の画素行および/または列を出力画像に埋め込むか、または出力画像から取り去るように構成される。エンコーダーは、出力画像と入力画像のピクセル寸法間のパリティを達成するために比較的少ない画素数を追加し得る。別の実施形態では、イントラ予測エンコーダーは、入力画像の解像度パラメーターによって、出力画像の埋め込み(出力画像からの取り去り)が必要か否か、ならびに埋め込む行数および/もしくは列数(または取り去る行数および/もしくは列数)を決定し得る。本発明のさらに別の実施形態では、入力画像が奇数の画素行および/または奇数の画素列を有する場合、イントラ画像予測エンコーダーは、奇数の画素行および/または画素列を、出力画像に埋め込むか、または出力画像から取り去り、その結果、出力画像の画素行数および/または画素列数を偶数にするように構成され得る。
別の実施形態では、イントラ予測エンコーダーは、出力画像の解像度を、入力画像の解像度とはかなり異なる数に設定するように構成され得る。さらに別の実施形態では、イントラ予測エンコーダーは、出力画像の解像度を、入力画像の解像度に一部基づき、また、入力画像の解像度とは無関係の追加のパラメーターに基づき、設定するように構成され得る。さらに別の実施形態では、イントラ予測エンコーダーは、出力画像の解像度を、入力画像の解像度とは無関係に設定するように構成され得る。
別の実施形態によれば、イントラ予測エンコーダーは、出力画像を複数(2つ以上)のサブ画像に分割するように構成され得、前記サブ画像の各々の解像度は、H.264規格でサポートされる最大解像度以下である。さらに別の実施形態では、サブ画像は、出力画像を長方形領域に分割することによって作成され得る。各サブ画像に関連付けられた領域の順序は、サブ画像の事前定義した順序によって示され得るか、またはサブ画像内に指定されるか、もしくはサブ画像に関連付けられ得る。例えば、各サブ画像の座標または列行位置を示すメタタグが、エンコーダーにより、各サブ画像に埋め込まれ得る。さらに別の実施形態では、サブ画像は、単一のH.264ストリーム内の別個のフレームとして、単一のMP4ファイル内の別個のH.264トラックとして、または別個のH.264ファイルとして格納され得る。サブ画像は、元の出力画像を再作成するためにデコーダーによって再構築され得る。いくつかの実施形態では、複数のサブ画像の結合は、各サブ画像内に埋め込まれているか、もしくは各サブ画像に関連付けられている順序付け情報によるか、または事前定義した順序スキームによる、サブ画像の順序付けを伴い得る。
さらに別の実施形態では、サブ画像は、出力画像のダウンサンプリング、例えば、出力画像でN個毎に1個の画素を選択して出力画像をN個の画像に分割することにより作成され得る。ダウンサンプリングされたサブ画像は、単一のH.264ストリーム内の別個のフレームとして、単一のMP4ファイル内の別個のH.264トラックとして、または別個のH.264ファイルとして格納され得る。元の出力画像でダウンサンプリングされた画像での画素位置は、事前定義したダウンサンプリングスキームによって決定され得るか、またはサブ画像内に指定されるかもしくは関連付けられ得る。例えば、各サブ画像の元の出力画像のエッジに対するピクセル単位のオフセットを示すメタタグが、エンコーダーによって各サブ画像に埋め込まれ得る。元の出力画像を再構築するために、デコーダーはダウンサンプリングされた画像のピクセルを読み取り、(元の出力画像と同じサイズをもつ)再構築された出力画像の、それら(ピクセル)が元の出力画像で配置されていた位置に、それらを書き込む。
いくつかの実施形態によれば、エンコーダーは、入力画像の再符号化の一部として、量子化操作を実施するように構成される。別の実施形態では、量子化操作は、符号化品質パラメーターによって構成される。さらに別の実施形態では、エンコーダーは、符号化品質パラメーターによって量子化操作を構成するように構成される。さらに別の実施形態では、符号化品質パラメーターは、量子化操作の一部として使用される量子化パラメーターである。さらにまた別の実施形態では、量子化パラメーターは、約15〜25の間である。さらに別の実施形態では、量子化パラメーターは、約14〜32の間である。量子化操作は、エンコーダーの一部として実施されている専用量子化モジュールによって実行され得る。
本発明のいくつかの実施形態によれば、入力画像の再符号化は、イントラ画像予測に基づく残差表現の計算を含む。残差画像の計算は、エンコーダーの一部として実施されている専用残差計算モジュールによって実行され得る。
別の実施形態では、入力画像の再符号化は、ブロックの残差表現から周波数領域表現への変換をさらに含む。ブロックの残差表現から周波数領域表現への変換は、エンコーダーの一部として実施されている専用変換モジュールによって実行され得る。さらに別の実施形態では、変換モジュールは、整数変換モジュールであり、その変換は、整数変換である。
さらに別の実施形態では、入力画像の再符号化は、符号化品質パラメーターによる周波数領域表現行列の量子化をさらに含む。
さらにまた別の実施形態では、入力画像の再符号化は、可変長符号化または算術符号化を用いる、量子化された周波数領域表現行列の並べ替えおよび符号化をさらに含む。量子化された周波数領域表現行列の並べ替えおよび符号化は、エンコーダーの一部として実施されている専用エントロピー符号化モジュールによって実行され得る。
別の実施形態によれば、入力画像の再符号化は、入力画像色空間のRGBからYCbCrへの変換をさらに含む。さらに別の実施形態によれば、入力画像の再符号化は、CbおよびCr成分の空間分解能の減少をさらに含む。入力画像色空間の変換および変換された入力画像の特定色成分の空間分解能の減少は、エンコーダーの一部として実施されている専用フォーマット変換モジュールによって実行され得る。別の実施形態では、専用フォーマット変換モジュールは、デコーダーの外部で実施され得、エンコーダーへの入力の前処理を実施し得る。
いくつかの実施形態では、入力画像は、標準的JPEG画像である。さらに別の実施形態では、入力画像は、各撮像装置によってキャプチャーされたraw(生の)データの圧縮バージョンである標準的JPEG画像である。さらに別の実施形態では、入力画像は、高品質JPEG画像である。本発明のさらに別の実施形態によれば、入力画像の解像度は、2メガピクセルより大きい。
別の実施形態では、エンコーダーは、標準的H.264または標準的MPEG−4 part 10エンコーダーである。さらに別の実施形態では、エンコーダーは、インターフレーム(またはインター画像)予測を無効にし、符号化品質パラメーターによって量子化操作を実施するように構成される。さらにまた別の実施形態では、標準的H.264またはMPEG−4 part 10エンコーダーは、インループ非ブロック化フィルター(in−loop deblocking filter)を無効にするように構成される。いくつかの実施形態では、エンコーダーは、インループ非ブロック化フィルターを有効にするように構成され得る。また別の実施形態では、エンコーダーは、入力画像の品質に関連するパラメーターによって、インループ非ブロック化フィルターを有効にするかまたは無効にするかを決定し得る。また別の実施形態では、エンコーダーは、品質パラメーターコントローラーで提供される符号化品質パラメーターによって、インループ非ブロック化フィルターを有効にするかまたは無効にするかを決定し得る。例えば、エンコーダーは、比較的低品質によって特徴付けられる入力画像に対して、インループ非ブロック化フィルターを有効にするように構成され得る。
いくつかの実施形態によれば、エンコーダーは、離散的出力画像を含む標準的H.264またはMPEG−4 part 10ストリームを出力として提供するように構成される。さらに別の実施形態では、エンコーダーは、複数の離散的画像を含む標準的H.264またはMPEG−4 part 10ストリームを出力として提供するように構成される。さらにまた別の実施形態では、エンコーダーは、MPEG−4ファイルフォーマットに従ってフォーマットされた標準的MP4ファイルを出力として提供するように構成される。
別の実施形態によれば、システムは、ビットストリームパッキングモジュールを含み得る。ビットストリームパッキングモジュールは、イントラ予測エンコーダーで提供された符号化周波数領域表現を事前定義した出力フォーマットにパックするように構成され得る。ビットストリームパッキングモジュールは、事前定義したフォーマットに符号化されている離散的出力画像を出力として提供するように構成される。さらに別の実施形態では、ビットストリームパッキングモジュールは、イントラ予測エンコーダーで提供された符号化周波数領域表現を入力画像の元のフォーマットにパックするように構成され得る。さらに別の実施形態では、ビットストリームパッキングモジュールは、入力画像に対応する離散的画像を含む標準的JPEGファイルを出力として提供するように構成される。
本発明のさらに別の態様によれば、離散的入力画像を、縮小サイズの離散的出力画像に処理するためのシステムは、インタフェース、品質パラメーターコントローラーおよびエンコーダーを含み得、そのインタフェースは、可逆または非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットによって圧縮された離散的入力画像を受信するように構成される。品質コントローラーは、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連する。イントラ予測エンコーダーは、入力画像を再符号化するように構成され、再符号化はイントラ画像予測を含み、エンコーダーは、符号化品質パラメーターによって構成される。
本発明の別の実施形態によれば、入力画像は標準的JPEG 2000である。
本発明のさらにまた別の態様によれば、離散的入力画像を、縮小サイズの離散的出力画像に処理するためのシステムは、インタフェース、品質パラメーターコントローラーおよびエンコーダーを含み得、そのインタフェースは、入力画像の1つまたは複数のセグメントについて周波数領域変換を利用する圧縮フォーマットによって圧縮された離散的入力画像を受信するように構成される。品質コントローラーは、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連する。エンコーダーは、符号化品質パラメーターによって実施されるイントラ画像予測を使用する入力画像を再符号化するように構成される。
本発明のさらに別の態様によれば、離散的入力画像を縮小サイズの離散的出力画像に処理するための方法が提供され、その方法は、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信することと、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、出力画像と入力画像との間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、入力画像を再符号化することであって、その再符号化がイントラ画像予測、および符号化品質パラメーターによって構成されている量子化ステップを含む、再符号化することとを含む。
本発明のさらに別の態様によれば、離散的入力画像を縮小サイズの離散的出力画像に処理するための方法が提供され、その方法は、可逆または非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信することと、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、出力画像と入力画像との間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、入力画像を再符号化することであって、その再符号化がイントラ画像予測、および符号化品質パラメーターによって構成されている量子化ステップを含む、再符号化することとを含む。
本発明の別の態様によれば、離散的入力画像を縮小サイズの離散的出力画像に処理するための方法が提供され、その方法は、イントラ予測符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信することと、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、出力画像と入力画像との間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、入力画像を再符号化することであって、その再符号化がイントラ画像予測、および符号化品質パラメーターによって構成されている量子化ステップを含む、再符号化することとを含む。
本発明のさらにまた別の実施形態によれば、複数の入力画像を処理して、それぞれ複数の縮小サイズの出力画像を提供するシステムが提供され、そのシステムは、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の離散的入力画像を受信するように構成されたインタフェースと、その複数の入力画像の各々に対して、各離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連するパラメーターを提供するように構成された品質パラメーターコントローラーと、複数の入力画像の各々を再符号化するように構成されたイントラ予測符号化コントローラーであって、再符号化がイントラ画像予測を含み、エンコーダーが、複数の入力画像の各々に対して提供された各符号化品質パラメーターによって構成されている、イントラ予測符号化コントローラーとを含む。
いくつかの実施形態によれば、システムは、前記品質パラメーターコントローラーで制御された複数の品質パラメーター制御インスタンスをさらに含み得、その複数の品質パラメーター制御インスタンスの各々が複数の入力画像の1つまたは複数に割り当てられ、それらに割り当てられた入力画像の各々に対して、各離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連する。
いくつかの実施形態によれば、そのシステムは、イントラ予測エンコーダーの複数のインスタンスをさらに含み得、イントラ予測エンコーダーの複数のインスタンスの各々が、複数の入力画像の1つまたは複数に割り当てられ、それらに割り当てられた入力画像の各々を再符号化し、その再符号化がイントラ画像予測を含み、そのエンコーダーは、そのエンコーダーのインスタンスに割り当てられた入力画像の各々に対して提供される各符号化品質パラメーターによって構成されている。
本発明のさらに別の態様によれば、複数の入力画像を処理するためのシステムが提供され、そのシステムは、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の離散的入力画像を受信するように構成されたインタフェースと、その複数の入力画像の各々に対して、各離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連するパラメーターを提供するように構成された品質コントローラーと、複数の入力画像の各々を再符号化するように構成されたイントラ予測エンコーダーであって、その再符号化がイントラ画像予測を含み、複数の入力画像の各々に対して提供された各符号化品質パラメーターによって構成されているエンコーダーと、複数の入力画像に対して単一の出力ファイルを提供するように構成されているビットストリームパッキングモジュールであって、出力ファイルが、複数の離散的入力画像に対応する複数のインデックス付き離散的オブジェクトを含む、ビットストリームパッキングモジュールとを含む。
いくつかの実施形態によれば、各オブジェクトは、複数の離散的入力画像のそれぞれ1つに対応する離散的画像を含む。別の実施形態によれば、出力ファイルは、MP4ファイルである。
本発明のさらに別の態様によれば、複数の入力画像を処理して、それぞれ複数の縮小サイズの出力画像を提供する方法が提供され、その方法は、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の離散的入力画像を受信することと、その複数の入力画像の各々に対して、各離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、複数の入力画像の各々を再符号化することであって、その再符号化がイントラ画像予測を含み、量子化ステップが、複数の入力画像の各々に対して提供された各符号化品質パラメーターによって構成されている、再符号化することとを含む。いくつかの実施形態では、複数の入力画像の中の少なくともいくつかの画像が、連続して処理される。さらに別の実施形態では、複数の入力画像の1つに対する最初の符号化品質パラメーターが、以前の画像の符号化品質パラメーター値によって順番に設定される。さらに別の実施形態では、入力画像に対する最初の符号化品質パラメーターが、以前の画像に対する符号化品質パラメーター値が順番に収束された符号化品質パラメーターによって設定される。
本発明のさらに別の態様によれば、複数の入力画像を処理する方法が提供され、その方法は、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮されたか、またはイントラ予測符号化を利用する圧縮フォーマットで圧縮された、複数の離散的入力画像を受信することと、その複数の入力画像の各々に対して、各離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターであって、各出力画像と入力画像対間の目標とする定量的類似性尺度に関連するパラメーターを提供することと、複数の入力画像の各々を再符号化することであって、再符号化がイントラ画像予測を含み、量子化ステップが、複数の入力画像の各々に対して提供された各符号化品質パラメーターによって構成されている、再符号化することと、複数の入力画像に対して、複数の離散的入力画像に対応する複数のインデックス付き離散的オブジェクトを含む、単一の出力ファイルを提供することとを含む。
本発明を理解し、それが実際にどのように実行され得るかを理解するために、好ましい実施形態が、限定されない例として、以下に示す添付の図を参照しながら、ここで説明される。
本発明のいくつかの実施形態による、画像処理システムの高レベルブロック図である。 本発明のいくつかの実施形態による、離散的入力画像を処理するための方法の流れ図である。 本発明のいくつかの実施形態の一部として実施され得る反復符号化品質パラメーター検索プロセスの一例の流れ図である。 本発明のいくつかの実施形態による、図1のシステムをさらに詳細に示すブロック図である。 本発明のいくつかの実施形態による、離散的入力画像の再符号化プロセスの一部として実施されるH.264規格のイントラ画像予測および残差画像計算プロセスの特定態様を説明する一連の画像である。 本発明のいくつかの実施形態による、JPEG 2000画像の処理に適した画像処理システムのブロック図である。 本発明のいくつかの実施形態による、複数の入力画像の処理に適した画像処理システムのブロック図である。 本発明のいくつかの実施形態による、複数の入力画像処理、および複数の入力画像の、複数の離散的セグメントを含む離散的出力ファイルへの再圧縮に適した画像処理システムのブロック図である。
図を単純かつ明瞭にするため、図に示す要素は、必ずしも正確な縮尺で描かれていないことが理解されるであろう。例えば、いくつかの要素の寸法は、明確にするため、他の要素に比較して拡大され得る。さらに、適切と考えられる場合には、対応する要素または類似した要素を示すために、各図間で参照数字が繰り返され得る。
以下の詳細な説明で、本発明の完全な理解を提供するために、多数の具体的詳細が説明される。しかし、当業者には、本発明は、これらの具体的詳細がなくても実施し得ることが理解されよう。他の例では、本発明を分かり難くしないように、周知の方法、手順およびコンポーネントは、詳細に説明されていない。
特に断りのない限り、以下の説明から明らかなように、本明細書の説明の全体に渡り、「処理(processing)」、「演算(computing)」、「計算(calculating)」、「決定(determining)」、「生成(generating)」、「割当て(assigning)」、「符号化(encoding)」、「復号(decoding)」、「圧縮(compressing)」または同様の用語などの使用は、コンピューティングシステムのレジスタおよび/またはメモリ内の物理的(例えば、電子的)量として表現されるデータを、コンピューティングシステムのメモリ、レジスタまたは他のかかる情報ストレージ、送信もしくは表示装置内の物理量として同様に表現される他のデータに操作および/または転送する、コンピューターもしくはコンピューティングシステム、または同様の電子コンピューティング装置の動作および/または処理を指すことを理解されたい。
本発明の実施形態は、本明細書での操作を実行するための装置を含み得る。この装置は、所望の目的専用に構成され得るか、またはコンピューター内に格納されているコンピュータープログラムによって選択的に起動もしくは再構成される汎用コンピューターを含み得る。かかるコンピュータープログラムは、フロッピィディスク、光ディスク、CD−ROM、光磁気ディスク、読取り専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、電子的プログラマブル読取り専用メモリ(EPROM)、電子的消去可能プログラマブル読取り専用メモリ(EEPROM)、磁気もしくは光カード、または電子命令の格納に適し、コンピューターシステムバスに結合可能な他の任意の種類の媒体を含む任意の種類のディスクなどを含むがそれらに限定されない、コンピューター可読記憶媒体に格納され得る。
本明細書で提示されるプロセスおよび表示は、どの特定のコンピューターまたは他の装置にも本質的に関連していない。様々な汎用システムが、本明細書の教示内容に従って、プログラムと共に使用され得るか、または所望の方法を実行するために、より特殊化した装置を構築するのが便利であると分かり得る。これら種々のシステムに対する所望の構成は、後述の説明に現れるであろう。さらに、本発明の実施形態は、いずれか特定のプログラミング言語に関連して説明されない。本明細書で説明のとおり、様々なプログラミング言語が、本発明の教示内容を実施するために使用され得る。
本発明の説明の全体に渡って、用語「H.264」または用語「H.264規格」、および「H.264」または「H.264規格」を指す同様の用語への参照が行われる。当技術分野に精通した者であれば、本明細書で使用されている「H.264」または「H.264規格」は、ビデオ圧縮用の規格でもあるMPEG−4 part 10に相当することが理解されるであろう。さらに、用語「アドバンスドビデオコーディング」または略語の「AVC」もH.264およびMPEG−4 part 10と置き換え可能な用語であり、用語H.264、MPEG−4 part 10、AVCまたは同様な用語に対して本明細書で行われるどの参照も、他の対応する用語のいずれか1つと置き換え可能である。
本発明の一態様に従って、離散的入力画像を縮小サイズの離散的出力画像に処理するための方法およびシステムが提供される。いくつかの実施形態によれば、そのシステムは、インタフェース、品質パラメーターコントローラーおよびイントラ予測エンコーダーを含み得る。そのインタフェースは、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信するように構成される。品質コントローラーは、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連する。イントラ予測エンコーダーは、入力画像を再符号化するように構成され、再符号化はイントラ画像予測を含み、エンコーダーは、符号化品質パラメーターによって構成される。
ここで図1を参照すると、これは、本発明のいくつかの実施形態による、離散的入力画像処理システムの高レベルブロック図である。便宜上、図1に示す実施形態、および本明細書で提供するその説明では、参照は、JPEG画像の再圧縮に対して行われる。いくつかの実施形態では、システム10は、入力インタフェース20、品質パラメーターコントローラー30およびH.264エンコーダー40を含み得る。
さらに図2を参照すると、これは、本発明のいくつかの実施形態による、離散的入力画像の処理方法の流れ図である。プロセスは、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された離散的入力画像の受信から始まる。インタフェース20は、図1に例として示すような、JPEG規格に従って圧縮された離散的JPEG画像12などの、素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信する(ブロック210)ように構成される。いくつかの実施形態では、離散的入力画像は高品質JPEG画像である。
入力画像に対して可能な種々のソースには、デジタルカメラ51、パーソナルコンピューター52、モバイル通信装置54またはデータセンター56など、システム10にネットワーク50を介して接続されているリモート装置、およびローカルの記憶装置58(例えば、ハードドライブディスク)などのローカル装置が含まれるが、それらに限定されない。
いくつかの実施形態では、インタフェース20は、離散的入力画像をRAW画像フォーマットまたは可逆画像フォーマットに復号する(ブロック220)ように構成されたデコーダーを含み得る。例えば、デコーダーは、圧縮画像を次のフォーマットのいずれか1つ:すなわち、YUV、RGB、BMP、PNGおよびTIFFに復号し得る。図1に示す実施形態では、デコーダーは、入力JPEG画像をRAW画像に復号するように構成されているJPEGデコーダー22である。別の実施形態では、デコーダーは、入力画像の部分復号を実行するように構成され得、圧縮画像をピクセル領域での表現に変換し得る。さらに別の実施形態では、デコーダーは、入力画像の部分復号を実行するように構成され得、圧縮画像を周波数領域での表現に変換し得る。さらにまた別の実施形態では、デコーダーは、前述のとおりJPEGデコーダー22であり、JPEGデコーダー22は、入力JPEG画像の部分復号を実行するように構成される。さらにまた別の実施形態では、JPEGデコーダー22は、JPEG復号プロセスの一部として作成されたYUV 4:2:0サンプルを直接取り出し得る。
品質パラメーターコントローラー30は、インタフェース20に動作可能なように接続され得る。raw画像は、品質パラメーターコントローラー30への入力として供給され得る。前述のとおり、品質パラメーターコントローラー30は、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、パラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連する(ブロック230)。いくつかの実施形態によれば、目標とする定量的類似性尺度は、そのシステムの出力画像と入力画像との間の許容差を表す。別の実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の最小類似要件を表す。
いくつかの実施形態では、品質パラメーターコントローラー30は、固定の事前定義値によって符号化品質パラメーターを設定する(ブロック231)ように構成され得る。別の実施形態では、品質パラメーターコントローラー30は、事前定義した公式に従って、符号化品質パラメーターを計算する(ブロック232)ように構成され得る。さらに別の実施形態では、品質パラメーターコントローラー30は、事前定義した検索基準に従って符号化品質パラメーターを選択するための事前定義した反復検索プロセスを実施し得る(ブロック233)。さらにまた別の実施形態では、品質パラメーターコントローラー30は、符号化品質パラメーターを事前生成したルックアップテーブルから選択する(ブロック234)ように構成され得る。前述した各選択肢に関する詳細については、後述する。
図1および本発明のいくつかの実施形態によれば、例として、事前構成されたH.264エンコーダー40は、イントラ予測エンコーダーとして使用される。いくつかの実施形態では、H.264エンコーダー40は、イントラ画像予測を有効にし、インター画像(またはインターフレーム)予測を無効にする方法で事前構成され得る。
別の実施形態では、H.264エンコーダー40は、インループ非ブロック化フィルターを無効にする方法で事前構成され得る。いくつかの実施形態では、H.264エンコーダー40は、インループ非ブロック化フィルターを有効にする方法で事前構成され得る。さらに別の実施形態では、H.264エンコーダー40は、入力画像の品質に関連するパラメーターによって、インループ非ブロック化フィルターを有効または無効のいずれにするかを判断するように構成され得る。さらにまた別の実施形態では、エンコーダーは、品質パラメーターコントローラーで提供される符号化品質パラメーターによって、インループ非ブロック化フィルターを有効または無効のいずれにするかを判断し得る。例えば、H.264エンコーダー40は、比較的低品質によって特徴付けられる入力画像に対してインループ非ブロック化フィルターを有効にするように構成され得る。ある場合には、H.264非ブロック化の利用により、H.264エンコーダー40で再符号化された出力画像の知覚品質を改善し得る一方、非ブロック化の効果により、出力画像と入力画像との間の知覚類似性が減少し得ることを理解されたい。
図2の説明に戻ると、H.264エンコーダー40は、品質パラメーターコントローラー30に動作可能なように接続され得、符号化品質パラメーターがH.264エンコーダー40に供給され得る。H.264エンコーダー40は、符号化品質パラメーターで構成され得る(ブロック240)。H.264エンコーダー40は、インタフェース20にも動作可能なように接続され得、JPEGデコーダー22などのデコーダーによって生成されるような入力画像の表現を追加の入力として受信し得る。H.264 40は、イントラ画像予測プロセスを使用して入力画像を再符号化するように構成され得、再符号化プロセスの少なくとも一部が、符号化品質パラメーターによって構成され得る(ブロック250)。再符号化プロセスに関する詳細について、以下で詳述する。
ここで、符号化品質パラメーターおよび品質パラメーターコントローラー30の操作に関連する本発明の別の実施形態について説明する。いくつかの実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の類似性に対する最小閾値を表す最小類似値によって示される。別の実施形態では、目標とする定量的類似性尺度は、出力画像と入力画像との間の差異に対する最大閾値を表す最大差分値によって示される。品質パラメーターコントローラー30は、かかる最小類似値またはかかる最大差分値により、符号化品質パラメーターを選択、計算または他の方法で決定し得る。さらにまた別の実施形態では、目標とする定量的類似性尺度は、最大および最小の類似値または差分値を含む、差異または差分範囲によっても示される。
いくつかの実施形態では、品質パラメーターコントローラー30によって使用される最小類似値および/または最大差分値は、定量的類似性(または定量的差分)の要求レベルを示し得る。別の実施形態では、品質パラメーターコントローラー30によって要求される定量的類似性レベルは、知覚的識別に対応する。本明細書で説明するとおり、提案されている符号化プロセスは、符号化品質パラメーターに敏感である。それ故、例えば、いくつかの実施形態では、品質パラメーターコントローラー30は、再符号化出力画像と入力画像との間の類似性尺度が、最小目標の定量的類似性尺度、例えば、知覚的識別を表す(または可逆と認識される)最小目標の定量的類似性尺度以上になるように、符号化品質パラメーターが設定されることを必要とし得る。同じような方法で、さらに別の態様によれば、品質パラメーターコントローラー30は、再符号化出力画像と入力画像との間の差分尺度が、最大定量的差分尺度未満になるように、符号化品質パラメーターが設定されることを必要とし得る。
いくつかの実施形態では、最小類似値または最大差分値は、品質パラメーターコントローラー30に対してハードコードされ得る。別の実施形態では、最小類似値または最大差分値は、システム10のオペレーターによって手動で設定され得る。
別の実施形態では、最小類似値(または最大差分値)は、特定の構造的類似性(SSIM)指標値および関連するパラメーターの特定値によって示される。さらに別の実施形態では、最小類似値(または最大差分値)は、以下のパラメーターをもつ約0.95の構造的類似性(SSIM)指標値に対応するか、または実質的に等しい:つまり、シグマ=1.5の11×11ガウシアンフィルター、およびSSIM定数のデフォルト値−[0.01,0.03]。前述のパラメーターをもつ0.95以上のSSIM値は、知覚的に等しい画像を表す(例えば出版物[5]を参照)と認められている。それ故、いくつかの実施形態によれば、類似性の定量的尺度に関連する出力画像と入力画像の対は、パラメーターがシグマ=1.5の11×11ガウシアンフィルターである場合に測定された、0.95のSSIM値以上であり、知覚的に可逆と考えられる。異なる組のパラメーターを使用すると、知覚的に可逆な出力画像と入力画像の対に対応する異なるSSIM値が提供され得、本発明の別の実施形態は同等なSSIM値および関連するパラメーターの任意のかかる組み合わせに適用できることが理解されるであろう。
当技術分野に精通した者には、SSIMが構造的情報内の変更の検出に使用でき、従って、画像内のエッジに沿った変更に対して高度に敏感であるが、滑らかな領域における軽度の歪みに対しては、人間視覚システムよりも敏感ではないことが理解されるであろう。それ故、別の実施形態では、最小類似値(または最大差分値)は、修正されたSSIM品質尺度を用いて決定される。SSIM品質尺度は、画像の特定領域にペナルティを適用することにより適合されて、修正されたSSIM品質尺度を生じる。それらの領域用に計算されたSSIMスコアは、それぞれのペナルティに従ってペナルティを科される。一例では、ペナルティは、滑らかな領域で取得したSSIM値の二乗を含み得る。さらに例として、滑らかな領域は元の画像で局所的画像変動を計算し、その変動が閾値未満の領域を滑らかと分類することによって識別される。さらにまた別の例として、ダイナミックレンジが[0,255]の画像に対する閾値が10であり得る。さらにまた別の実施形態では、閾値は、画像毎に計算される。他のペナルティが、各領域に対するSSIM値について、異なる方法で使用および適用され得る。領域ペナルティ手順は、SSIMスコアリングプロセスと統合され得るか、またはSSIMスコアリングプロセスが完了した後に実施される追加のステップとして実施され得る。
その上、品質パラメーターコントローラー30は、他の種類の領域を識別するように構成され得、かかる領域の識別は、局所的画像変動に加えて、追加の技術を伴い得る。一旦識別されると、かかる追加の種類の領域に対するSSIMスコアリングは、様々な修正を受け得る。修正は、SSIMスコアリングプロセスの一部として、また、SSIMスコアリングプロセスの前または後の補完的手順として実施できる。
さらにまた別の実施形態では、SSIM品質尺度が修正されて、局所的SSIMスコア全てを平均化する代わりに、事前定義した閾値によって決定されたとおり(例えば、5%の最小外れ値を捨てて、次の10%の最小スコアを平均化することにより)、最小SSIMをもつ領域に対して平均化が実行されるようになる。別の実施形態では、恐らくは入力画像の解像度に基づいて、画像がブロックに分割され、SSIM品質尺度が各ブロックについて別々に計算された後、全体の品質スコアが最小ブロックSSIM値として計算され、ブロックSSIM値のRMS(二乗平均平方根)または最小ブロックSSIM値とブロックSSIM値の平均との間の平均値が使用され得る。例として、32×32ブロック分割が、0.25メガピクセル未満の画像に対して実施され、64×64ブロック分割が、0.25メガピクセル〜1メガピクセルの間の画像に対して実施され、128×128ブロック分割が、1メガピクセルを超える画像に対して実施される。
別の実施形態では、SSIM品質尺度の計算が、画像全体についてその計算を実行する代わりに、第1画像のピクセルの選択した部分および第2画像の対応するピクセルについてその計算を実行することにより適合される。別の実施形態では、対応する選択したピクセル間の差異が、それらの平均値を計算することにより、単一の差分値に結合される。別の実施形態では、対応する選択したピクセル間の差異が、それらのRMS(二乗平均平方根)を計算することにより、単一の差分値に結合される。別の実施形態では、選択したピクセルの位置が画像領域に渡って均等に分散される。さらに別の実施形態では、選択したピクセルの位置がランダムに選択される。さらにまた別の実施形態では、画像が実質的に均等な長方形領域に分割され、測定用のピクセルの相対部分が、各長方形領域からランダムに選択される。
本発明のいくつかの実施形態では、最小類似値(または最大差分値)が、特定の視覚情報忠実度(VIF)値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定の画質評価尺度(PQS)指標値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定のビデオ品質メトリック(VQM)指標値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定の視覚的品質の知覚評価(PEVQ)指標値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定のモスクワ大学(MSU)ブロッキネス指標値および関連するパラメーターの特定値によって示される。本発明の別の実施形態では、最小類似値(または最大差分値)は、特定のモスクワ大学(MSU)ぼかし指標値および関連するパラメーターの特定値によって示される。
本発明のさらにまた別の実施形態では、品質パラメーターコントローラー30は、符号化プロセスの構成が、前述のパラメーターもしくはそれらと同等物を使用して、0.95以上のSSIM指標値によって入力画像に対する類似性が測定され、または入力画像に対して実質的にサイズが縮小された、出力画像を獲得できるようにする、符号化品質パラメーターを提供するように構成される。
別の実施形態では、最小類似値(または最大差分値)は、特定のピーク信号対雑音比(PSNR)指標値および関連するパラメーターの特定値によって示される。いくつかの実施形態では、PSNR品質尺度は、符号化品質パラメーターの反復検索と併せて使用される。プロセスの一部として、異なるQPの各繰返しが使用され、PSNRが閾値PSNRレベルに対して検査される。QPは、結果として生じる画像がPSNR閾値を超えるまで減らされる。本発明のさらに別の実施形態では、品質パラメーターコントローラーは、約45dBのピーク信号対雑音比値となる、符号化品質パラメーターを提供するように構成される。
本発明のさらに別の実施形態では、符号化品質パラメーターが関連する、出力画像と入力画像との間の目標とする定量的類似性尺度が、入力画像に対して出力画像のブロッキネスの有無を定量化するブロッキネス尺度、出力画像と入力画像との間のテクスチャ類似性を定量化するテクスチャ尺度、および出力画像と入力画像との間の局所類似性を定量化する局所類似性尺度に関連付けられる。品質尺度に関する詳細については、2010年1月6日に出願された「Recompression of Digital Images Using a Robust Measure of Perceptual Quality Including Improved Quantization Matrix Computation」という名称の同時係属の米国仮出願第61/292,622号に記載されており、その内容が「付録A」として本願に組み込まれる。
本発明のいくつかの実施形態では、品質パラメーターコントローラー30は、目標とする定量的類似性尺度に従って、出力画像と入力画像との間の類似性を維持しながら、離散的出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを決定および提供するように構成される。別の実施形態では、品質パラメーターコントローラー30は、出力画像と入力画像との間の類似性を最小類似値以上に維持しながら、離散的出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを提供するように構成される。さらに別の実施形態では、品質パラメーターコントローラー30は、出力画像と入力画像との間の差異を最大差分値以上に維持しながら、離散的出力画像のサイズ縮小を(入力画像に比べて)最大限にする符号化品質パラメーターを提供するように構成される。
別の実施形態では、品質パラメーターコントローラー30は、事前定義した類似性(または差異)の範囲内で、出力画像と入力画像との間の類似性(または差異)を維持しながら、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを決定および提供するように構成される。
別の実施形態では、品質パラメーターコントローラー30は、出力画像と入力画像との間の類似性(または差異)および離散的出力画像のサイズ縮小を最適化する符号化品質パラメーターを決定および提供するように構成される。別の実施形態では、品質パラメーターコントローラー30は、例えば、最適化プロセスの現在の繰返しでの出力画像のサイズの差異が、1つまたは複数の以前の繰返しでの出力画像のサイズに比較して特定値未満の場合、例えば、最適化プロセスの終了条件を示す収束基準を含む、符号化品質パラメーターの最適化における他の要因を考慮に入れるように構成され得る。別の例によれば、符号化品質パラメーターの最適化は、反復の最大数によって制約され得る。反復の最大数は、収束率または最適化プロセスに関連する他のパラメーターにより、事前定義され得るか、または決定され得る。いくつかの実施形態では、符号化品質パラメーターの最適化プロセスは、出力画像と入力画像との間の類似性(または差異)の特定範囲に関して実施され得、符号化品質パラメーターは、類似性(または差異)の事前定義した範囲内で、サイズ縮小を最適化しようとする。
例えば、いくつかの実施形態によれば、品質パラメーターコントローラー30は、類似性評価モジュール32を含み得る。類似性評価モジュール32は、H.264エンコーダー40と連携して、符号化品質パラメーターの反復検索を実施するように構成され得る。
ここで図3を参照すると、これは、本発明のいくつかの実施形態の一部として実施され得る反復符号化品質パラメーター検索プロセスの一例の流れ図である。検索プロセスの各繰返しで、類似性評価モジュール32は、H.264エンコーダー40に対する入力として提供される(ブロック320)暫定符号化品質パラメーターを生成し得る(ブロック310)。
いくつかの実施形態によれば、初期の暫定符号化品質パラメーターが事前定義され得る。例えば、初期の暫定符号化品質パラメーターは、H.264量子化パラメーター値22に対応する値に事前設定され得る。別の実施形態では、初期の暫定符号化品質パラメーターは、システム10のオペレーターによって選択され得る。例えば、システム10のオペレーターは、2つ以上の選択肢を提示され得、各選択肢は、類似性と圧縮との間の異なるトレードオフを表し、それに応じて、各選択肢は、異なるH.264量子化パラメーター値に関連する。別の実施形態では、ユーザーの選択肢は、14と32の間のH.264量子化パラメーター値に対応する範囲をカバーする。さらに別の実施形態では、初期の暫定符号化品質パラメーターは、計算され得るか、または他の方法で決定され得る。例えば、初期の暫定符号化品質パラメーターは、入力画像の品質/解像度に関連するパラメーター、外部ユーザー選択パラメーターなどに基づき決定され得る。その上、例として、初期の暫定符号化品質パラメーターに対して可能な選択肢は、例えば、14と32の間のH.264量子化パラメーター値に対応する値のみが考慮され得る、事前定義した範囲によって制約され得る。
いくつかの実施形態では、暫定符号化品質パラメーターは、符号化品質パラメーターの制限範囲について2等分を実行することにより更新される。別の実施形態では、暫定符号化品質パラメーターの範囲は、ルックアップテーブルに指定されている符号化品質パラメーターの各値について2等分を実行することにより更新される。
いくつかの実施形態では、暫定符号化品質パラメーターは、繰返し回数および目標とする類似性尺度からの距離によって決まる適応ステップ幅を用いて更新され得る。かかる一更新スキームは、例えば、
Figure 2013507084
(公式f1)
であり得、式中、QPnew、QPoldは、それぞれ、次の繰返しおよび最後の繰返しに対する符号化品質パラメーター値であり、Δsimilarityは、公式f2に見られるとおりで、stepnumIterは、ルックアップテーブルから取得したステップ幅であって、繰返しカウントに応じて減少し、Cはある定数で、恐らく200であり、また、
Figure 2013507084
(公式f2)
であり、式中、currSimilarityは、最後の繰返しで作成された画像で評価された類似性であり、ThresholdSimilarityは、目標とする類似性尺度であり、Δsimilarityはそれらの間の差異である。
H.264エンコーダー40は、暫定符号化品質パラメーターを用いて符号化プロセスを構成するための暫定符号化品質パラメーターの受信(ブロック330)、および入力画像(JPEGデコーダー22によって生成されたとおり)の復号表現を符号化するための符号化品質パラメーターにより構成された再符号化プロセスの開始に応答し得、その再符号化プロセスはイントラ画像予測ステップを含み、暫定出力画像を生じる(ブロック340)。
いくつかの実施形態では、一例として、H.264エンコーダー40は、統合デコーダー45を含み得、従って、そのエンコーダーは、暫定出力画像を復号する(ブロック350)ように構成され得る。いくつかの実施形態では、暫定出力画像に対応する、復号されたH.264ビットストリームは、YCbCrからのフォーマット変換モジュール60によって、出力画像のYCbCr表現からRAWへのフォーマット変換を受け得る。フォーマット変換モジュール60は、動作可能なように評価モジュール32に接続され得、復号およびフォーマット変換されたビットストリームを入力として評価モジュール32に供給し得る(ブロック360)。
評価モジュール32は、H.264エンコーダー40によって生成された暫定出力画像が検索終了基準を満足する(ブロック370)か否かを判断するために、検索プロセスの現在の繰返しの結果を評価し得る。本発明のいくつかの実施形態によれば、終了基準は、暫定出力画像と入力画像との間の類似性に少なくとも関連し得る。例えば、検索終了基準の実施の一部として、評価モジュール32は、現在の暫定出力画像と入力画像との間の類似性の定量的尺度を計算し得る。例として、評価モジュール32は、現在の暫定出力画像と入力画像との間の類似性を表すSSIM値を計算し得る。さらに例として、評価モジュール32は、以下のパラメーターをもつSSIM値を計算し得る:つまり、シグマ=1.5の11×11ガウシアンフィルター、およびSSIM定数のデフォルト値−[0.01,0.03]。
さらに例として、評価モジュール32は、例えば、滑らかな領域において、取得した値を二乗することにより、SSIM品質尺度にペナルティを科し得る。さらにまた別の例として、滑らかな領域は、元の画像で局所的画像変動を計算し、その変動が閾値未満の領域を滑らかと分類することによって識別され得る。さらに例として、評価モジュール32は、[0,255]のダイナミックレンジが10までの画像に対して変動閾値を設定し得る。
さらに例として、評価モジュール32は、局所的SSIMスコア全てを平均化する代わりに、最小SSIMをもつ領域に対して平均化が実行されている、修正されたSSIM品質尺度を、例えば、5%の最小外れ値を捨てて、次の10%の最小スコアを平均化することにより、計算し得る。別の実施形態では、評価モジュール32は、恐らくは入力画像の解像度に基づいて、画像をブロックに分割し得、評価モジュール32は、各ブロックについて別々にSSIMスコアを計算し得、その後、全体の品質スコアを最小ブロックSSIM値、ブロックSSIM値のRMS(二乗平均平方根)または最小ブロックSSIM値とブロックSSIM値の平均との間の平均値として計算し得る。例として、32×32ブロック分割が、0.25メガピクセル未満の画像に対して実施され、64×64ブロック分割が、0.25メガピクセル〜1メガピクセルの間の画像に対して実施され、128×128ブロック分割が、1メガピクセルを超える画像に対して実施される。
さらに例として、評価モジュール32は、SSIM品質尺度の計算を、画像全体について実行する代わりに、第1画像のピクセルの選択した部分および第2画像の対応するピクセルについて実行することにより適合し得る。さらに例として、評価モジュール32は、対応する選択したピクセル間の差異を、それらの平均値を計算することにより、単一の差分値に結合し得る。さらに例として、評価モジュール32は、対応する選択したピクセル間の差異を、それらのRMS(二乗平均平方根)を計算することにより、単一の差分値に結合し得る。さらに例として、評価モジュール32は、選択したピクセルの位置を画像領域に渡って均等に分散し得る。さらに例として、評価モジュール32は、選択したピクセルの位置をランダムに選択し得る。さらに例として、評価モジュール32は、画像を実質的に均等な長方形領域に分割し、測定用のピクセルの相対部分を、各長方形領域からランダムに選択し得る。
構造的類似性(SSIM)指標方法についての詳細は、出版物[6]に記載されており、また、画像間の類似性を測定するためのSSIMの信頼性の比較分析については出版物[7]に記載されている。出版物[6]は、その内容全体が本明細書に組み込まれる。
いくつかの実施形態では、検索終了基準は、最適化基準を含み得る。別の実施形態では、最適化基準に従い、暫定出力画像が、出力画像と入力画像との間の類似性(または差異)および離散的出力画像のサイズ縮小を最適化する場合に、評価モジュール32は、符号化品質パラメーター検索を終了するように構成され得る。
別の実施形態では、例として、最適化基準は収束基準を考慮に入れ得、最適な出力画像は、その収束基準に従って、検索の現在の繰返しでの出力画像サイズの、1つまたは複数の以前の繰返しでの出力画像サイズとの比較による差異にも関連する。さらに例として、評価モジュール32によって実施される収束基準は、1つまたは複数の以前の暫定符号化品質パラメーターに関連するサイズ縮小と比較した現在の暫定符号化品質パラメーターに関連するサイズ縮小の観点から、改善率に関連する。さらに別の実施形態では、符号化品質パラメーターの検索は、出力画像と入力画像との間の最小類似閾値によって(または最大差分閾値によって)制約され得る。
いくつかの実施形態によれば、現在の暫定出力画像が検索終了基準を満足すると判断される場合、類似性評価モジュール32は、H.264エンコーダー40に、現在の暫定出力画像に対応するH.264ビットストリームを再符号化プロセスの出力として提供するように指示し得る(ブロック380)。
前述の説明では、符号化品質パラメーターに対する提案した検索が、複数の再符号化暫定出力画像の各1つに関して実施される。ここで、符号化品質パラメーターの検索プロセスの代替実施態様が提供されるが、それは、本発明のいくつかの実施形態により、画像のセグメント化およびその画像のセグメント(および、恐らくは各セグメント)での符号化品質パラメーターの実施に基づく。
いくつかの実施形態では、現在の暫定出力画像が検索終了基準を満足しないと判断される場合、類似性評価モジュール32は、調整した暫定符号化品質パラメーターを用いて入力画像の再圧縮を繰り返した(ブロック310〜370)後、結果として生じた暫定圧縮出力画像と入力画像との間の類似性を評価するように構成され得る。暫定符号化品質パラメーターの調整および調整した暫定パラメーターを用いた入力画像の再圧縮の評価は、暫定圧縮出力画像と入力画像との間の類似性が類似性基準を満足するまで繰り返され得る。
いくつかの実施形態では、符号化品質パラメーターの検索を含む、符号化品質パラメーター評価プロセスは、符号化プロセスと統合され得る。エンコーダー統合品質評価プロセスの一部として、符号化されている画像の一部について符号化品質が評価され得、画像の評価された部分に対して局所的符号化品質パラメーターを適合させるために、目標とする定量的類似性尺度からの距離が使用され得る。別の実施形態によれば、符号化プロセスの一部として、各画像がセグメント化され得、各セグメントに対して符号化品質が評価され得、そして、符号化セグメントが目標(例えば、目標とする定量的類似性尺度)を満足していない場合は、符号化プロセスの追加の繰返しが、各セグメントに関して更新した符号化品質パラメーターを用いて開始され得る。さらに例として、符号化プロセスの追加の繰返しが、符号化品質が目標とする閾値を著しく上回っている符号化セグメントに対して開始され得、従って、目標とする閾値を超えることなく各セグメントをさらに圧縮することができ得る。さらに例として、画像が、実質的に同じサイズの長方形のブロックにセグメント化され得、そのブロックサイズは入力画像の解像度によって決まり得る。さらに例として、画像が(例えば、入力画像のテクスチャまたはエッジに基づき)関心領域にセグメント化され得、その場合、各領域のブロックのサブセットのみが符号化品質パラメーターに対して評価されて、その領域の残りのブロックに対する符号化品質パラメーターは、ブロックのサブセットでの符号化品質パラメーターと同じ値に設定される。
別の実施形態では、符号化品質評価モジュールは、セグメント毎の検索プロセス中に見つかった定数の(画像全体に対して)符号化品質パラメーターを用いて画像全体を符号化するため、画像についてイントラ予測エンコーダーの追加パスを開始するように構成され得る。画像全体の符号化に使用され得る定数の符号化品質パラメーターは、次の、限定されず、包括的でないリストからの1つまたは複数に対応し得る:つまり、平均符号化品質パラメーター、または検索アルゴリズムが収束された最終値である。
符号化品質パラメーターの初期化および適合が、基本的に前述と同じ方法で、または反復符号化品質検索プロセスに全般的に関連して後述する方法で実行される。しかし、いくつかの実施形態によれば、セグメント検索は、1マクロブロック毎またはNマクロブロック毎(ここで、Nは、固定値である得るか、または、例えば、画像幅もしくは画像全体サイズに従って設定され得る)など、画像符号化における所定の評価ポイントでより頻繁に実行され得、そして、例えば、QP適応アルゴリズム(本明細書では反復符号化品質パラメーター検索プロセスとも呼ぶ)の収束率に従って変更され得ることを理解されたい。また、いくつかの実施形態では、品質パラメーターコントローラーは、イントラ予測エンコーダーと完全に統合され得、符号化品質評価プロセスは、画像符号化プロセスの一部として直接実施され得ることも理解されたい。
反復符号化品質パラメーター検索プロセスに関する本発明の様々な実施態様および実施形態について長々と説明してきたが、ここで、出力画像の符号化に使用される符号化品質パラメーターを決定するか、または決定を容易にするために使用され得る、本発明の追加の実施形態および実施態様について説明する。これら追加の実施形態および実施態様は、符号化品質パラメーター検索プロセスに対する追加または代替として使用され得る。
別の実施形態によれば、品質パラメーターコントローラー30は、入力画像のある特性に関連するパラメーターにより、符号化品質パラメーター(または暫定符号化品質パラメーター)を提供し得る1つまたは複数のルックアップテーブル(LUT)を含み得る。例として、LUTは、様々なH.264量子化パラメーター係数(この例では、符号化品質パラメーター)を次の1つまたは複数に従って提供し得る:つまり、ビット/ピクセル、解像度およびJPEG品質係数である。例えば、以下の表t1では、所与のJPEG品質係数に対して、対応するH.264量子化パラメーターが提供される:
Figure 2013507084
前述のとおり、前述のルックアップテーブルの提案された実施態様案のいずれも、いくつかの実施形態では、例えば、初期の暫定符号化品質パラメーターを決定するために、符号化品質パラメーター選択のための検索プロセスの一部として、使用され得る。別の実施形態では、前述の実施態様に対する追加または代替として、提案されたルックアップテーブルは、所与の画像に対して検討されるべき符号化品質パラメーターの範囲を決定または絞り込むために使用され得、そして、その符号化品質パラメーターの範囲内から、特定の1つの符号化品質パラメーターが、例えば、反復検索を用いて、選択され得る。以下に、例として、LUT(表t2)を示すが、これは、入力画像のビット/ピクセルパラメーターにより、符号化品質パラメーター範囲および推奨QPを提供するLUTの一例である:
Figure 2013507084
別の実施形態では、品質パラメーターコントローラー30は、公式を用いて符号化品質パラメーター(または、暫定符号化品質パラメーター)を計算するための、1つまたは複数の公式を実施するように構成され得る。いくつかの実施形態によれば、公式は、入力画像のある特性に関連するパラメーターによって、符号化品質パラメーターを提供し得る。例として、公式は、様々なH.264量子化パラメーター係数を、次の1つまたは複数に従って返し得る:つまり、ビット/ピクセル、解像度およびJPEG品質係数である。例えば、以下の公式f3では、所与のJPEG品質係数に対して、対応するH.264量子化パラメーターが提供される:
QF<87に対してQP=27;
Figure 2013507084
に対してQP=round(−0.681QF+86.45);
(公式f3)
式中、QFはJPEG品質係数であり、QPはH.264量子化パラメーターである。
f3はここでは一例として提供されることを理解されたい。その上、前述のとおり、公式は、例えば、初期の暫定符号化品質パラメーターを決定するために、符号化品質パラメーター選択のための検索プロセスの一部として、使用され得る。別の実施形態では、前述の実施態様に対する追加または代替として、公式は、所与の画像に対して検討されるべき符号化品質パラメーターの範囲を決定または絞り込むために使用され得、そして、その符号化品質パラメーターの範囲内から、特定の1つの符号化品質パラメーターが、例えば、反復検索を用いて、選択され得る。
さらに別の実施形態では、品質パラメーターコントローラー30は、固定の符号化品質パラメーターで事前プログラムされ得る。その固定の符号化品質パラメーターは、最小閾値の定量的類似性を超える類似性を達成しながら、入力画像と比較して、出力画像の実質的なサイズ縮小を達成するのに適し得る。事前プログラムされた固定の符号化品質パラメーターは、事前定義した入力画像モデルまたはプロファイルに従い、かつ、所望のサイズ縮小に関連して事前定義したパラメーターに従って、選択され得る。入力画像モデルまたはプロファイルは、以下のパラメーターの1つまたは複数に対する値を含み得る:つまり、入力画像の定量的品質尺度、入力画像の解像度、入力画像の圧縮レベル、入力画像の品質レベル表示(例えば、JPEG品質値)、入力画像の最小非ゼロDCT値、入力画像のビット/ピクセル、入力画像のサイズなどである。いくつかの実施形態によれば、固定の符号化品質パラメーターは、約15〜25の範囲内の量子化パラメーターに対応し得る。さらにまた別の実施形態では、固定の符号化品質パラメーターは、約14〜32の範囲内の量子化パラメーターに対応し得る。量子化および量子化パラメーターの使用については、以下で詳細に説明する。
別の実施形態では、既に高度に圧縮されている入力画像を識別して、それらを再圧縮しないようにするために、予備プロセスが実施され得る。高度に圧縮されている入力画像を再圧縮しようとすると、出力画像ファイルでのわずかなサイズ縮小、および/または出力画像の低い知覚品質という結果になり得ることを理解されたい。いくつかの実施形態では、入力画像は、それが高度に圧縮されているか否かを識別するために分析され得、高度に圧縮されている場合は、符号化プロセスが個別の画像に対して無効にされ得る。別の実施形態では、入力画像が高度に圧縮されているか否かの識別は、逆量子化の後に、入力画像のDCT係数値を分析して、最小非ゼロDCT係数を決定することにより実行される。さらに別の実施形態では、最小非ゼロDCT係数は、閾値と比較される。いくつかの実施形態では、閾値は、再圧縮率が低い(例えば、10%未満)全ての(または一部の)再圧縮画像を評価し、それらの非ゼロDCT値の統計値を検査することにより、決定される。例えば、輝度に対する閾値3は、以下のように使用され得る。いくつかの実施形態では、かかる分析は、画像の輝度および色差成分について、別々に実行される。別の実施形態では、最小非ゼロDCT係数が閾値より大きい場合、符号化プロセスは、その個別の画像に対して実行されない。さらにまた別の実施形態では、閾値は、輝度成分および色差成分で異なっており、最終決定は、輝度および色差成分の閾値の組み合わせによる。前述のとおり、ここでもまた、閾値は、再圧縮率が非常に低い画像におけるDCT値の統計値を評価することにより、経験的に決定され得る。いくつかの実施形態では、輝度成分の最小非ゼロDCT成分に対する閾値は3である。別の実施形態では、最小非ゼロDCT係数が閾値より大きい場合、符号化プロセスは、その個別の画像に対して実行されない。さらにまた別の実施形態では、閾値は、輝度成分および色差成分で異なっており、最終決定は、輝度および色差成分の閾値の組み合わせによる。
図1および図2の説明を続けると、いくつかの実施形態によれば、インタフェース20は、任意で解像度制御モジュール24を含み得る。離散的入力画像(図1の場合はJPEG画像)を受信すると、解像度制御モジュール24は、入力画像の解像度に関連するパラメーターを取得する(ブロック215)ように構成され得る。例えば、解像度制御モジュール24は、入力画像の解像度を、離散的入力画像の一部として保管されているか、またはそれに関連して含められている特定のメタデータから取り出すように構成され得る。JPEG入力画像12(および他のサポートフォーマット)の場合、解像度情報は通常、JPEG入力画像内に埋め込まれているExif(exhangeable image file format)メタデータから入手可能である。入力画像の解像度は、第1画素数に対する第2画素数によって示され得る。別の実施形態では、インタフェース20は、入力画像に関連する追加のメタデータ情報を取得するように構成され得、これらの情報には、例えば、ビット/ピクセル、画像品質表示(例えば、JPEG品質値)、ファイルサイズなどが含まれるが、これらに限定されない。
いくつかの実施形態によれば、解像度制御モジュール24は、H.264エンコーダー40に入力画像解像度パラメーターを提供するように構成され得る。H.264エンコーダー40は、少なくとも一部は入力画像解像度パラメーターに基づき出力画像の解像度を制御する(ブロック235)ように構成され得る。いくつかの実施形態では、H.264エンコーダー40は、入力画像の解像度と実質的に等しい解像度を有する画像を出力として提供するように構成され得る。
いくつかの実施形態では、H.264エンコーダー40は、出力画像を(入力画像の行および列解像度と比較して)1またはかなり小さい数の画素行および/もしくは画素列でパディングするように構成され得るか、かつ/または、H.264エンコーダー40は、出力画像から(入力画像の行および列解像度と比較して)1またはかなり小さい数の画素行および/もしくは画素列を取り去るように構成され得る(この操作は、時々、画像の「トリミング」と呼ばれる)。別の実施形態では、イントラ予測エンコーダー40は、入力画像解像度パラメーターにより、出力画像のパディング(またはトリミング)が必要か否か、ならびにパディングする行および/もしくは列(または取り去る行および/もしくは列)の数を判断し得る。
当技術分野に精通した者には、H.264規格に従って、偶数にするために(画素数は、行および列で必ずしも等しい必要はないが)その画素行および列の数が必要であることが、理解されるであろう。いくつかの実施形態によれば、奇数の画素行および/または奇数の画素列を有する入力画像の場合、イントラ予測エンコーダー40は、出力画像での画素行および列の数が偶数になるように、画素行および/または画素列の追加または削除を行い得る。
別の実施形態では、イントラ予測エンコーダー40は、出力画像の解像度を決定するように別の方法で構成され得、出力画像の解像度を入力画像の解像度とかなり異なる数に設定し得る。出力画像の解像度は、少なくとも一部は、入力画像の解像度と関連し得るが、入力画像の解像度とかなり異なり得る。さらに別の実施形態では、イントラ予測エンコーダー40は、出力画像の解像度を、入力画像の解像度とは無関係に設定するように構成され得る。例えば、出力画像の解像度は、ユーザーにより手動で設定され得るか、またはストレージシステムの要件もしくはシステム10が関連するソフトウェアアプリケーションの要件に従って、自動的に構成され得る。
いくつかの実施形態では、H.264エンコーダー40は、出力画像を複数(2つ以上)のサブ画像に分割するように構成され得、サブ画像の各々の解像度は、H.264規格でサポートされる最大解像度以下である。さらに別の実施形態では、H.264エンコーダー40は、出力画像を長方形領域に分割することによってサブ画像を作成し得る。サブ画像の各々に関連付けられた領域の順序は、サブ画像の事前定義した順序によって示され得るか、またはサブ画像内に指定され得るか、またはサブ画像に関連して指定され得る。例えば、各サブ画像の座標または列行位置を示すメタタグが、エンコーダーにより、各サブ画像に埋め込まれ得る。さらに別の実施形態では、サブ画像は、単一のH.264ストリーム内の別個のフレームとして、単一のMP4ファイル内の別個のH.264トラックとして、または別個のH.264ファイルとして格納され得る。サブ画像は、元の出力画像を再作成するためにデコーダーによって再構築され得る。いくつかの実施形態では、複数のサブ画像の結合は、各サブ画像内に埋め込まれているか、もしくは各サブ画像に関連付けられている順序付け情報によるか、または事前定義した順序スキームによる、サブ画像の順序付けを伴い得る。
さらに別の実施形態では、サブ画像は、出力画像のダウンサンプリング、例えば、出力画像でN個毎に1個の画素を選択してN個の画像に分割することにより作成され得る。ダウンサンプリングされたサブ画像は、単一のH.264ストリーム内の別個のフレームとして、単一のMP4ファイル内の別個のH.264トラックとして、または別個のH.264ファイルとして格納され得る。元の出力画像でダウンサンプリングされた画像での画素位置は、事前定義したダウンサンプリングスキームに従って決定され得るか、またはサブ画像内に指定されるかもしくは関連付けられ得る。例えば、各サブ画像の元の出力画像のエッジに対するピクセル単位のオフセットを示すメタタグが、エンコーダーによって各サブ画像に埋め込まれ得る。元の出力画像を再構築するために、デコーダーはダウンサンプリングされた画像のピクセルを読み取り、(元の出力画像と同じサイズをもつ)出力画像を再構築するために、それら(ピクセル)が元の出力画像で配置されていた位置に、それらを書き込む。
当技術分野に精通した者には、H.264フォーマットでサポートされる画像の最大解像度が(例えば、9.4メガピクセルに)制限されることを理解されるであろう。いくつかの実施形態によれば、H.264フォーマットでサポートされる最大解像度を超える解像度を有する入力画像の場合、イントラ予測エンコーダー40は、出力画像を、解像度がH.264フォーマットでサポートされる最大解像度以下である2つ以上のサブ画像に分割し得る。
ここで、図4を参照すると、これは、本発明のいくつかの実施形態による、図1のシステムをさらに詳細に示すブロック図である。前述のとおり、本発明のいくつかの実施形態では、イントラ予測エンコーダーは、H.264(またはMPEG−4 part 10)エンコーダー440であり得る。いくつかの実施形態よれば、H.264エンコーダー440は、システム400で受信した入力画像(または入力画像の表現)の再符号化の開始および再符号化された再圧縮出力画像の提供のため、品質パラメーターコントローラー30からの(暫定符号化品質パラメーターを含む)符号化品質パラメーターの受信に応答し得る。
前述のとおり、H.264エンコーダー440で実施される再符号化プロセスは、品質パラメーターコントローラー30によって提供された符号化品質パラメーターに従って構成される。また、前述したように、H.264エンコーダー440で実施される再符号化プロセスは、イントラ画像予測ステップを含む。ここで、H.264エンコーダー440で実施され得る再符号化プロセスの一可能な実施態様例が提供される。
品質パラメーターコントローラー30から受信した符号化品質パラメーターに加えて、H.264エンコーダー440は、再符号化される入力画像(またはその表現)を受信し得る。例えば、H.264エンコーダー440は、JPEGデコーダー22からの入力画像を、その入力画像のRAWフォーマット表現として受信し得る。
いくつかの実施形態では、JPEGデコーダー22は、入力JPEG画像を、その入力画像のRAWフォーマット表現に復号し得る。画像処理システム410は、JPEGデコーダー22によって提供されたRAWフォーマット表現をYCbCrフォーマット表現に変換するように構成され得る、YCbCrへのフォーマット変換モジュール441を含み得る。さらに別の実施形態によれば、YCbCrへのフォーマット変換モジュール441は、Cb成分およびCr成分の空間分解能を修正するようにも構成され得る。例として、YCbCrへのフォーマット変換モジュール441は、Cb成分およびCr成分の空間分解能を水平および垂直方向に2の倍数で縮小するために、4:2:0の色差サンプリングスキームを実施し得る。他の色差サンプリングスキームが、本発明の別の実施形態の一部として使用され得ることが理解されるであろう。JPEGビットストリームのYCbCrへのフォーマット変換は、標準JPEG復号に欠かせないプロセスであり、従って、YCbCrへのフォーマット変換モジュールは任意選択で、YCbCr表現がJPEGデコーダーから直接取得され得ることが理解されよう。
H.264エンコーダー440は、H.264イントラ予測機能を有効にし、インター予測機能を無効にするように構成され得る。H.264エンコーダー440は、ダウンサンプリングされたYCbCr値をイントラ画像予測モジュール442への入力として提供し得る。いくつかの実施形態によれば、イントラ画像予測モジュール442は、入力画像の変換表現を複数のマクロブロックに分割するように構成され得る。H.264の場合、マクロブロック分割は、規格によって定められる。H.264規格によれば、入力画像の変換表現は、16×16マクロブロックに分割される。
しかし、本発明の別の実施形態では、イントラ予測エンコーダーによって実施されるマクロブロック分割方法は、標準的H.264分割方法から離れ得るか、または異なり得る。例えば、イントラ画像エンコーダーは、H.264規格のイントラ予測と同様であるが8×8ブロックに適合されている概念を使用するイントラ予測で、JPEG画像を8×8ブロックに分割するように構成され得る。例として、この構成は、適切なエンコーダー(H.264規格に準拠していない)によって達成され得る。
図4の説明を続けると、イントラ画像予測モジュール442は、入力画像の変換表現内の1つまたは複数の16×16マクロブロックを、現在のマクロブロックを囲むマクロブロックの隣接するサンプルから予測するように構成され得る。H.264規格によれば、16×16マクロブロックが、予測されるブロックの左側および/または上側にある既に符号化されたマクロブロックの隣接するサンプルから予測できる。さらにH.264規格によれば、予測がブロック全体について実行され得るか、または予測が各4×4ブロックについて別々に実行され得る。
他のブロックサイズの分割スキームを実施および使用し、異なるパターンに従ってブロックまたはサブブロックを予測する(例えば、現在のマクロブロック/ブロックの左側または上側にあるマクロブロック/ブロックからの予測に限定されない)イントラ予測エンコーダーの考案および実施が可能であることが理解されよう。
いくつかの実施形態によれば、イントラブロック予測に基づいてイントラ予測画像が決定され得、H.264エンコーダー440の一部として実施されている、残差計算モジュール443が、イントラ予測画像および入力画像(またはエンコーダーで受信された入力画像の表現)に基づいて残差画像を計算するように構成され得る。
ここで図5を参照すると、これは、本発明のいくつかの実施形態による、離散的入力画像を再符号化プロセスの一部として実施されるH.264規格イントラ画像予測および残差画像計算プロセスの特定態様を説明する一連の画像である。図5では、元の画像510、イントラ予測画像520および残差画像530が、本発明のいくつかの実施形態の一部として示されている。
元の画像510は、再圧縮のためにシステムへの入力として提供された離散的JPEG入力画像である。イントラ予測画像520は、隣接するマクロブロックからマクロブロックまたはサブブロックを予測する(この場合は、H.264規格イントラ画像予測に従って)ことにより入力画像510から生成された画像データの表現である。元の入力画像510からイントラ予測画像520を取り去ることにより、結果の、「差分」または残差画像510が生成される。理解できるように、予測の高精度により、特に高解像度画像に関して、イントラ予測画像520は、元の入力画像510と極めて良く似ており、それ故、残差画像530は比較的サイズがコンパクトである。
図4の説明を続けると、予測および残差画像計算に続いて、H.264エンコーダー440内に実施されている整数変換モジュール444は、残差画像のピクセルの各4×4ブロックの各色成分を周波数領域に変換するために利用される。いくつかの実施形態によれば、H.264規格に従って、整数変換モジュール444が、整数変換を実施するように構成され得る。他の変換技術を実施および使用するイントラ予測エンコーダーの考案および実施が可能であることが理解されよう。
変換された残差画像はその後、H.264エンコーダー440の一部として統合されている量子化モジュール446に渡される。本発明のいくつかの実施形態によれば、量子化モジュール446は、品質パラメーターコントローラー30によって提供された符号化品質パラメーターに従い、H.264エンコーダー440によって構成され得る。いくつかの実施形態によれば、H.264エンコーダー440は、品質パラメーターコントローラー30によって提供された符号化品質パラメーターに従い、量子化モジュール446によって使用される量子化パラメーター指標値を構成し得る。従って、量子化モジュール446は、品質パラメーターコントローラー30によって提供された符号化品質パラメーターに従い、残差データを量子化するように構成され得る。
量子化周波数領域表現行列が、エントロピー符号化モジュール448に供給され得る。エントロピー符号化モジュール448は、量子化変換係数を順序付けるよう構成され得る。例えば、量子化変換係数の行列について、ジグザグ走査が実行され得る。一度順序付けられると、エントロピー符号化モジュール448は、エントロピー符号化を実行するように構成され得る。例として、エントロピー符号化モジュール448は、H.264規格によって規定されるエントロピー符号化技術の1つを実施するように構成され得る:つまり、コンテキスト適応型可変長符号化(CAVLC)またはコンテキスト適応型2進算術符号化(CABAC)である。
いくつかの実施形態によれば、H.264エンコーダー440によって生成された出力画像の符号化ビットストリーム表現は、離散的入力画像に関して知覚的に可逆な再圧縮された離散的出力画像を提供するために使用され得る。
いくつかの実施形態によれば、H.264エンコーダー440は、バッファー451を含み得る。バッファー451は、揮発性記憶装置または不揮発性記憶装置を含み得、大体は、符号化H.264ビットストリームの一時的な保管のために利用され得る。例として、バッファー451は、符号化品質パラメーターの反復検索の一部として生成される暫定出力画像の符号化ビットストリーム表現をH.264エンコーダー440内に一時的に保管するために使用され得る。いくつかの実施形態では、符号化品質パラメーター検索プロセスの各繰返しで、バッファー451が更新され得、現在の暫定出力画像の符号化ビットストリーム表現がその中に保管され得る。恐らく、検索プロセスの各繰返しで、以前の暫定出力画像が、現在の暫定出力画像を表現する符号化ビットストリームで上書きされ得る。別の実施形態では、検索終了基準が満足されたという指示が(例えば、品質評価モジュール32から)受信されると、H.264エンコーダー440は、現在の暫定出力画像の符号化ビットストリーム表現(満足される検索終了基準となる)をバッファー451から引出し得る。H.264エンコーダー440は、その後、引き出された符号化ビットストリーム表現を離散的出力画像として提供し得る。
前述のとおり、いくつかの実施形態によれば、H.264エンコーダー440は、出力として、出力画像の(エントロピー符号化の後)符号化ビットストリーム表現を提供し得る。別の実施形態では、出力画像の符号化ビットストリーム表現は、ソースの入力画像と関連して、出力画像の表現として格納される。入力画像と出力画像のビットストリーム表現との間の関連は、様々な方法および技術を用いて維持され得る。一例では、入力画像もしくは入力画像の識別子と実質的に一意に関連付けられた実質的に一意のGUID文字列またはハッシュ値、およびGUID文字列またはハッシュ値が、出力画像のビットストリーム表現に関連して順序付けられ得る。
いくつかの実施形態によれば、出力画像を引き出す依頼を受信すると、例えば、入力画像の識別子を参照することにより、出力画像のビットストリーム表現がパッキングおよび形成プロセスを経て、離散的出力画像のファイルが返され得る。いくつかの実施形態では、そのファイルはH.264規格に準拠し得る。別の実施形態では、そのファイルは、JPEG規格に準拠し得る。H.264符号化ビットストリームのH.264互換ファイルへのパッキング、およびH.264符号化ビットストリームのJPEG互換ファイルへのパッキングについて、以下で詳細に説明する。
別の実施形態によれば、H.264ファイルまたはH.264規格に準拠した他のフォーマットの他のファイルとしての再符号化画像のパッキングは、再符号化プロセスの不可欠な部分であり得、H.264エンコーダー440は、出力としてH.264互換ファイルを提供し得る。
いくつかの実施形態によれば、H.264エンコーダー440は、ビットストリームパッキングモジュール449を含み得る。ビットストリームパッキングモジュール449は、入力として、エントロピー符号化モジュール448によって提供された符号化ビットストリームを受信するように構成される。ビットストリームパッキングモジュール449は、符号化ビットストリームをH.264互換ファイルにパックし得る。いくつかの実施形態では、ビットストリームパッキングモジュール449は、再符号化された離散的出力画像の様々なパラメーターおよび/またはプロパティに関連する、特定のメタデータ情報および/またはヘッダーを追加するように構成され得る。例として、ビットストリームパッキングモジュール449は、出力画像の解像度、出力画像のファイル拡張子などに関する情報を追加するように構成され得る。別の実施形態によれば、ビットストリームパッキングモジュール449は、符号化ビットストリームに、入力画像の属性またはメタデータに関連する特定メタデータ(このデータも出力画像に関連し得る)を追加するように構成され得る。例えば、ビットストリームパッキングモジュール449は、入力画像の元の解像度(例えば、パディング、トリミング前の解像度)、入力画像のビット/ピクセル値、入力画像の品質係数などに関するメタデータを追加するように構成され得る。
複数のファイルフォーマットがサポートし、次のファイルフォーマットおよびファイル拡張子を含むが、それらに限定されることなく、H.264ビットストリームと互換性があることが理解されよう:つまり、MPEG−4(.mp4)、Audio/Video Interleaved(.avi)、Windows Media Video(.wmv)、Advanced Streaming Format(.asf)、Apple QuickTime(.mov)、Adobe Flash(.flv)である。
パックH.264互換ファイルは、画像処理システム410の出力として提供され得る。本発明のいくつかの実施形態によれば、再符号化および再圧縮された出力画像がH.264互換ファイルとして提供されるため、その出力画像は任意のH.264互換デコーダーによって復号できることが理解されよう。今日、広く使用されている人気のあるソフトウェアアプリケーションには、H.264互換デコーダーまたは(例えば、適切なソフトウェアまたはプラグイン拡張を介した)H.264サポートが組み込まれており、それ故、いかなる修正または追加のソフトウェアなしで、再符号化および再圧縮された出力画像を表示できることがさらに理解されよう。例として、H.264互換デコーダーを組み込んでいるソフトウェアアプリケーションには、次が含まれ得る:つまり、Apple Inc.(米国カリフォルニア州クパチーノ)によるApple Quick−timeマルチメディアフレームワークおよびSafariウェブブラウザー、Microsoft Corporation(米国ワシントン州レッドモンド)によるInternet ExplorerウェブブラウザーおよびMedia Playerマルチメディアフレームワーク、Adobe Systems Inc.(米国カリフォルニア州サンノゼ)によるAdobe Media Player、America Online LLC(米国ニューヨーク州ニューヨーク市)によるWimAmpおよびMozilla Corporation(米国カリフォルニア州マウンテンビュー)によるFireFoxウェブブラウザーである。
本発明の考案者は、H.264再符号化プロセスの構成のために適切な量子化パラメーターを使用すると、離散的JPEG入力画像に基づいている符号化H.264ビットストリームの生成、およびそのH.264ビットストリームに基づき、離散的JPEG入力画像に比べて知覚的に可逆(または知覚的に同一)な離散的出力画像の(例えば、H.264互換ファイルを介した)提供が可能であり、そして、離散的出力画像は、離散的JPEG入力画像に比べて実質的に縮小されたフットプリントによってさらに特徴付けられることが分かった。
ここで、入力JPEG画像の再圧縮および再符号化のための本発明のいくつかの実施形態により、システムを利用して達成され得る効果の一部のリストを提供する。以下のリストは、完全に網羅されておらず、拘束力がないこと、および本発明の別の実施形態で、以下の1つもしくは複数を達成しうるか、またはそのいずれも達成し得ず、以下に挙げられていない考えられる他の利点が、本発明の特定の実施形態を通じて達成され得ることが理解されよう:
ユーザーが自分の写真をオンライン写真共有サイトにより速くアップロードできるようにする。
ユーザーが写真をウェブ(例えば、オンライン写真共有サイト)からより速くダウンロードできるようにする。
オンライン情報源(例えば、写真共有サイト)によって使用される帯域幅量を削減する。
ユーザーがもっと多くの写真を自分の電子メールメッセージに添付できるようにする(現在のところ、場合によっては最大メッセージサイズ制限のために、ユーザーは通常、2~3のフル解像度の写真のみの添付に制限される)。
ユーザー間で送信される電子メールのサイズを削減し、その結果として、インターネット上の様々なノードにおける電子メールのトラフィック量を削減する。
ウェブページのロード時間を削減する。
ウェブサイトによって使用される帯域幅を削減する。
カメラのメモリーカード上、または任意の他の記憶装置、特に携帯型記憶装置上に保管できる写真の数を増加する。
写真をカメラからユーザーのPCに転送するのに必要な時間を削減する。
ユーザーの写真のバックアップに必要な時間を削減する。
ユーザーの写真をオンラインフォトおよびアルバムプリントサービスに転送するのに必要な時間を削減する。
本発明のいくつかの実施形態によれば、システム410は、JPEGエンコーダー(図示せず)をさらに含み得る。別の実施形態では、JPEGエンコーダーは、H.264エンコーダー440に動作可能なように接続され得、H.264エンコーダー440は、JPEGエンコーダーに離散的出力画像を表すRAWフォーマットビットストリームを供給するように構成され得る。前述のとおり、H.264エンコーダー440は、統合デコーダー45を含み、従って、エンコーダー440は、復号されたRAWフォーマットビットストリームを出力として提供することができ得る。
いくつかの実施形態によれば、JPEGエンコーダーは、離散的出力画像のrawフォーマット表現を受信し得る。JPEGエンコーダーは、JPEG符号化プロセスの実施のため、離散的出力画像に相当するrawデータの受信に対応し得、それ自体公知であるが、それにより、離散的出力画像を表す符号化H.264ビットストリームのJPEGフォーマット表現を生じる。
本発明の考案者は、H.264再符号化プロセスの構成のために適切な量子化パラメーターを使用すると、符号化H.264ビットストリームの生成が可能であり、それは、元のJPEGフォーマットに符号化して戻された場合に、離散的JPEG入力画像に比べて知覚的に可逆(または知覚的に同一)な離散的JPEG出力画像を提供し、そして、離散的JPEG出力画像は、離散的JPEG入力画像に比べて実質的に縮小されたフットプリントによってさらに特徴付けられることが分かった。
図1〜図5に示す実施形態および本明細書で提供されている説明で、JPEG画像の再圧縮について言及されている。図1〜図5および本明細書での説明では、提案されたシステムの一実施態様例を提供することを理解されたい。本発明の別の実施形態がJPEG画像の再圧縮に限定されず、図1〜図5に示すシステムに類似したシステムが、JPEG以外のフォーマット、および、特に、素ブロックの独立符号化を利用する圧縮フォーマットを用いて符号化された入力画像を再圧縮するため、当技術分野に精通した者によって容易に考案され得ることをさらに理解されたい。
その上、図1〜図5に示すいくつかの実施形態および本明細書で提供されている説明で、H.264エンコーダーを使用する離散的入力画像の再圧縮について言及されている。図1〜図5および本明細書で提供されている説明では、提案されたシステムの一実施態様例を提供することを理解されたい。本発明の別の実施形態がH.264フォーマット(または、MPEG−4 part 10フォーマット)を使用する離散的入力画像の再圧縮に限定されず、図1〜図5に示すシステムに類似したシステムが、H.264以外のフォーマット、および、特に、イントラ画像予測および制御可能な量子化プロセスを利用する圧縮フォーマットに基づくイントラ予測エンコーダーを用いて入力画像を再圧縮するため、当技術分野に精通した者によって容易に考案され得ることをさらに理解されたい。
本発明のさらに別の態様によれば、離散的入力画像を縮小サイズの離散的出力画像に処理するためのシステムは、インタフェース、品質パラメーターコントローラーおよびエンコーダーを含み得、そのインタフェースは、ウェーブレット変換を利用する圧縮フォーマットによって圧縮された離散的入力画像を受信するように構成され得る。品質コントローラーは、離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、そのパラメーターは、出力画像と入力画像との間の目標とする定量的類似性尺度に関連している。エンコーダーは、符号化品質パラメーターに従って実施されているイントラ画像予測を用いて、入力画像を再符号化するように構成されている。
ここで図6を参照すると、これは、本発明のいくつかの実施形態による、JPEG 2000画像の処理に適した画像処理システムのブロック図である。図6に示すシステム610は、図4に示すシステムといくつか類似したコンポーネントを共有する。JPEG入力画像に関して実施される再符号化プロセス(図4に関して前述)は、JPEG 2000など、ウェーブレット変換を利用する圧縮フォーマットを用いて符号化された離散的入力画像に関して同様の方法で実施され得ることを理解されたい。
図6に示すように、本発明のいくつかの実施形態によれば、離散的JPEG 2000入力画像は、画像処理システム610で受信され得る。JPEG 2000入力画像は、処理システム610のインタフェース620コンポーネントを介して受信され得る。インタフェース620は、離散的入力画像をRAW画像フォーマットまたは事前定義した可逆画像フォーマットに復号するように構成されるJPEG 2000デコーダー622を含み得る。一旦、RAWフォーマットに変換されると、画像データは、品質パラメーターコントローラー30、および図1〜図5に関して前述したのと同様の方法で処理されるイントラ予測エンコーダー40に供給できる。当技術分野に精通した者には、RAW画像データを処理する場合、RAW画像が生成された元の符号化フォーマットは、実際には重要でないことを理解されたい。
いくつかの実施形態によれば、図6に示す画像処理システム610は、出力として、出力画像の(エントロピー符号化の後)符号化ビットストリーム表現、入力画像の符号化ビットストリーム表現を含むH.264互換ファイル、および出力画像のH.264のRAWデータ表現に基づいて(または出力画像の符号化ビットストリーム表現に基づいて)符号化されるJPEG 2000画像ファイルを提供し得る。
本発明の考案者は、H.264再符号化プロセスの構成のために適切な量子化パラメーターを使用すると、離散的JPEG 2000入力画像に基づいている符号化H.264ビットストリームの生成、およびそのH.264ビットストリームに基づき、離散的JPEG 2000入力画像に比べて知覚的に可逆(または知覚的に同一)な離散的出力画像の(例えば、H.264互換ファイルを介した)提供が可能であり、そして、離散的出力画像は、離散的JPEG 2000入力画像に比べて実質的に縮小されたフットプリントによってさらに特徴付けられることが分かった。
本発明の考案者は、H.264再符号化プロセスの構成のために適切な量子化パラメーターを使用すると、離散的JPEG 2000入力画像に基づいている符号化H.264ビットストリームの生成が可能であり、H.264ビットストリームは、JPEG 2000フォーマットに符号化して戻された場合に、離散的JPEG 2000入力画像に比べて知覚的に可逆(または知覚的に同一)な離散的JPEG 2000出力画像を提供し、その離散的JPEG 2000出力画像は、離散的JPEG 2000入力画像に比べて実質的に縮小されたフットプリントによってさらに特徴付けられることが分かった。
本発明の別の実施形態がJPEG 2000画像の再圧縮に限定されず、図6に示すシステムに類似したシステムが、JPEG 2000以外のフォーマット、および、特に、ウェーブレット変換を利用する圧縮フォーマットを用いて符号化された入力画像を再圧縮するため、当技術分野に精通した者によって容易に考案され得ることを理解されたい。
離散的入力画像処理に関連し、出力が離散的出力画像である本発明の特定態様について説明してきたが、ここで、複数の入力画像の処理に関連する本発明のさらに別の態様について説明する。ここで図7を参照すると、これは、本発明のいくつかの実施形態による、複数の入力画像の処理に適した画像処理システムのブロック図である。
いくつかの実施形態によれば、画像処理システム710は、複数の画像が格納されている大容量記憶システム(図示せず)に動作可能なように接続され得る。いくつかの実施形態によれば、大容量記憶システムからの複数の画像が、画像処理システム710への入力として提供され得る。いくつかの実施形態によれば、複数の入力画像は圧縮画像であり得る。入力画像の圧縮/符号化に使用される圧縮/符号化フォーマットは、イントラ予測を含まない非可逆圧縮フォーマットであり得る。例えば、入力画像は、素ブロックの独立符号化を用いて圧縮された画像および/またはウェーブレット変換を用いて圧縮された画像および/またはイントラ予測符号化を用いて圧縮された画像を含み得る。さらに例として、入力画像は、JPEG画像および/またはJPEG 2000画像および/またはH.264画像を含み得る。
図7に示すシステム710は、図4および図6に示すシステムといくつか類似したコンポーネントを共有する。離散的JPEG入力画像に関して実施される再符号化プロセスおよび離散的JPEG 2000入力画像に関して実施される再符号化プロセス(図4および図6に関して前述)は、複数の入力画像のバッチ処理と同様の方法で実施され得ることを理解されたい。
図7に示すとおり、本発明のいくつかの実施形態によれば、複数のJPEGおよび/またはJPEG 2000入力画像は、画像処理システム710で受信され得る。いくつかの実施形態によれば、複数の入力画像を処理するためのシステム710のインタフェース720は、システムコンポーネントのいずれかが処理のために追加の画像の受信ができないか、または受信を拒否する場合に備えて、システム710の内部で負荷のバランスを取るために使用され得るバッファー721を含み得る。
図7および本発明のいくつかの実施形態によれば、品質パラメーターコントローラー735は、複数の品質パラメーター制御インスタンス730を起動および制御するように構成されているマルチスレッド管理モジュールとして実施され得る。いくつかの実施形態によれば、各品質パラメーター制御インスタンス730は、図1および図4に示す品質パラメーターコントローラー30に機能的に類似している。いくつかの実施形態によれば、品質パラメーターコントローラー735は、品質パラメーターコントローラー735内の負荷を内部で制御するために品質パラメーターコントローラー735によって使用され得る品質パラメーターコントローラーバッファー736を含み得る。
図7および本発明のいくつかの実施形態によれば、システム710は、イントラ予測符号化コントローラー770を含み得る。イントラ予測符号化コントローラー770は、イントラ予測エンコーダー740の複数のインスタンスを起動および制御するように構成されているマルチスレッド管理モジュールとして実施され得る。いくつかの実施形態によれば、イントラ予測エンコーダー740の各インスタンスは、図4に示しかつ前述したイントラ予測エンコーダー440に機能的に類似している。いくつかの実施形態によれば、イントラ予測符号化コントローラー770は、エンコーダー上の負荷を内部で制御するためにイントラ予測符号化コントローラー770によって使用され得る符号化待ち行列バッファー772を含み得る。
YCbCrからのフォーマット変換モジュール760は、YCbCrからのフォーマット変換モジュール760の各スレッドが、イントラ予測エンコーダー740の複数のインスタンスによって提供された復号H.264ビットストリームをRAW画像データに変換するために使用され得るマルチスレッドモジュールまたはプロセスとしても実施される。変換モジュール760は、内部負荷分散に使用され得るバッファー762を含み得る。
いくつかの実施形態では、インタフェース720は、品質パラメーターコントローラー735およびイントラ予測符号化コントローラー770の各々に動作可能なように接続され得、システム710のコンポーネントの操作パラメーターをモニタリングし得る。いくつかの実施形態では、インタフェース720は、品質パラメーターコントローラー735およびイントラ予測符号化コントローラー770の各々内で、ならびに恐らくは、任意選択の変換モジュール760内でも、負荷状態をモニタリングし得る。別の実施形態では、インタフェース720は、1つまたは複数の品質パラメーターコントローラー735およびイントラ予測符号化コントローラー770の負荷状態、ならびに恐らくは、任意選択の変換モジュール760にも従って、インタフェースバッファー721を制御し得る。
いくつかの実施形態によれば、図7に示す画像処理システム710は、出力として複数の出力画像を提供し得、複数の出力画像の各々が、画像処理システム710で受信された複数の入力画像からの各入力画像に対応する。いくつかの実施形態によれば、1つまたは複数の出力画像は、(エントロピー符号化の後に)符号化されたH.264ビットストリーム表現として提供され得る。別の実施形態では、1つまたは複数の出力画像は、出力画像の符号化ビットストリーム表現を含むH.264互換ファイルである。さらに別の実施形態では、1つまたは複数の入力画像は、出力画像のH.264のRAWデータ表現に基づき(または出力画像の符号化ビットストリーム表現に基づき)符号化されるJPEGまたはJPEG 2000画像ファイルである。
本発明のいくつかの実施形態では、複数の再符号化および再圧縮された画像は、それらが受信された元の大容量記憶システムに返され得、複数の再符号化および再圧縮された画像は、複数の入力画像として使用された元の画像の置換として格納され得る。
本発明の考案者は、H.264再符号化プロセスの構成のために適切な量子化パラメーターを使用すると、各JPEGまたはJPEG 2000入力画像に基づいている符号化H.264ビットストリームの生成、およびそのH.264ビットストリームに基づき、各JPEGまたはJPEG 2000入力画像に比べて知覚的に可逆(または知覚的に同一)な複数の離散的出力画像の(例えば、H.264互換ファイルを介した)提供が可能であり、そして、複数の出力画像は、複数のJPEGまたはJPEG 2000入力画像に比べて実質的に縮小されたフットプリントによってさらに特徴付けられることが分かった。
当技術分野に精通した者には、図7に示すシステム710の多数の機能コンポーネントが、分散コンポーネントとして実施され得ることを理解されたい。例えば、品質パラメーター制御インスタンス730は、複数のコンピューター上で分散および実施され得る。品質パラメーターコントローラー735は、各リモート品質パラメーター制御インスタンス730の操作を制御する中央制御装置として実施され得る。品質パラメーターコントローラー735は、リモート品質パラメーター制御インスタンス730上に実施される抽象化レイヤーを提供し得、複数のリモート品質パラメーター制御インスタンス730の制御および構成を中央位置から可能にし得る。同様の方法で、インタフェース720およびそのサブコンポーネントならびにイントラ予測符号化コントローラー770およびそのサブコンポーネントが分散され得る。
複数の入力画像を処理して対応する複数の再圧縮出力画像を提供するためのシステムについて説明してきたが、ここで、本発明のさらに別の態様の説明を提供し、それは、複数の入力画像を処理するためのシステムに関連する。ここで、図8を参照すると、これは、本発明のいくつかの実施形態による、複数の入力画像の処理、および複数の入力画像の、複数の離散的セグメントを含む離散的出力ファイルへの再圧縮に適した画像処理システムのブロック図である。
いくつかの実施形態によれば、複数の入力画像は圧縮画像であり得る。入力画像の圧縮/符号化に使用される圧縮/符号化フォーマットは、イントラ予測を含まない非可逆圧縮フォーマットであり得る。例えば、入力画像は、素ブロックの独立符号化を用いて圧縮された画像および/またはウェーブレット変換を用いて圧縮された画像および/またはイントラ予測符号化を用いて圧縮された画像を含み得る。さらに例として、入力画像は、JPEG画像および/またはJPEG 2000画像および/またはH.264画像を含み得る。
図8に示すシステム810は、図7に示すシステム710といくつか類似したコンポーネントを共有する。いくつかの実施形態では、図7に関して前述した、複数のJPEGまたはJPEG 2000入力画像に関して実施される再符号化プロセスは、図8に示すシステム810によって同様の方法で実施され得ることを理解されたい。しかし、図8に示すシステム810の1つまたは複数のコンポーネントは、図7に示すシステム710と異なり得、図8に示すシステム810によって提供される出力は、図7に示すシステム710の出力と異なり得る。
いくつかの実施形態によれば、インタフェース720は、例えば、JPEGまたはJPEG 2000入力画像など、複数の入力画像を受信し得る。品質パラメーターコントローラー735は、複数の入力画像の各々に対して符号化品質パラメーターを提供し得る。いくつかの実施形態では、品質パラメーターコントローラー735は、例えば、複数の入力画像の各々に対して実施された符号化品質パラメーターの反復検索結果に基づき、複数の入力画像の各々に対して特定の符号化品質パラメーターを提供し得る。反復検索については、詳細に前述されている。
入力画像の各々に対して、入力画像の対応するRAW表現がイントラ予測エンコーダー740に供給され得る。イントラ予測エンコーダー740は、1つの入力画像に対してそれぞれの符号化品質パラメーターも受信し得る。イントラ予測エンコーダー740は、複数の画像の各々を符号化するように構成され得る。イントラ予測エンコーダー740は、各符号化品質パラメーターにより、複数の画像の各々の符号化プロセスを構成し得る。複数の画像の各々の符号化プロセスは、イントラ画像予測を含み得る。
いくつかの実施形態によれば、イントラ予測符号化コントローラー770は、イントラ予測エンコーダー740の操作の制御に使用され得る。イントラ予測符号化コントローラー770は、複数の入力画像に対して単一の出力ファイルを生成するように構成され得る。別の実施形態では、複数の画像の各々の符号化プロセスは、それぞれの符号化ビットストリームを生じ得、イントラ予測符号化コントローラー770は、入力画像の各符号化ビットストリームに基づき複数の入力画像の各々に対する単一の出力ファイル内でオブジェクトを生成し得る。
いくつかの実施形態では、入力画像は、マルチスレッドエンコーダー740によって同時に符号化され得、単一の出力ファイルがオンザフライで生成され得る。代替として、本発明の別の実施形態によれば、1つまたは複数の入力画像が、連続して符号化され得、複数の入力画像の1つに対して符号化ビットストリームが生成されるとすぐに、その符号化ビットストリームまたはその符号化ビットストリームに基づいて生成された出力ファイルオブジェクトが、出力バッファー874内に一時的に格納される。
いくつかの実施形態によれば、一旦、複数の入力画像の1つに対して符号化ビットストリームが生成されると、ビットストリームパッキングモジュール849が、複数の離散的オブジェクトを含む単一のファイルを生成するよう構成され得、複数の離散的オブジェクトの各々が、複数の入力画像の各1つに関連する。より詳細には、複数の離散的オブジェクトの各々が、各入力画像に対して生成された符号化ビットストリームに基づき作成される。いくつかの実施形態では、単一の出力ファイル内の各オブジェクトが、複数の入力画像の各1つに対応する離散的画像を含む。
いくつかの実施形態によれば、ビットストリームパッキングモジュール849は、出力画像に対応する各オブジェクトにインデックスを付けるように構成され得る。メディアオブジェクトは、ファイル内の特定オブジェクトへの迅速なアクセスを可能にするため、ファイルの先頭にインデックスが付けられる。インデックスは、離散的画像をマルチオブジェクトファイルから引き出すために使用され得る。ビットストリームパッキングモジュール849は、出力ファイルのヘッダー内にインデックスを含み得、従って、出力ファイルに含まれているオブジェクトの各々に素早くランダムにアクセス可能であり得る。
当技術分野に精通した者には、例えば、MP4ファイルフォーマットなどの拡張メディアファイルフォーマットは、単一ファイル内への複数の異なるメディアオブジェクトの包含を可能にすることを理解されたい。単一ファイル内の各オブジェクトは、一意のメディア特性(サイズ、解像度、コーデックなど)を持ち得、そのメディア特性を指定するメタデータを含み得る。出力ファイル内のオブジェクトの特性は、インタフェース720によって提供され得、各入力画像の特性に対応し得る。追加または代替として、出力ファイル内のオブジェクトの特性は、品質パラメーターコントローラー735によって提供され得、品質パラメーターコントローラー735によって提供された符号化品質パラメーターに対応し得る。さらに追加または代替として、出力ファイル内のオブジェクトの特性は、イントラ予測エンコーダー740によって提供され得、入力画像(または、入力画像の表現)の符号化と関連し得る。
いくつかの実施形態によれば、図8に示す画像処理システム810は、出力として、複数の(マルチメディア)オブジェクトを含む単一の出力ファイルを提供し得、各オブジェクトが出力画像を含み、各出力画像は複数の入力画像の1つに対応する。別の実施形態によれば、各オブジェクトは、各入力画像に対して生成された再圧縮ビットストリームに対応する。さらに別の実施形態では、単一の出力ファイルはMP4マルチメディアファイルである。
当技術分野に精通した者には、本発明のいくつかの実施形態によれば、複数画像の単一ファイル(例えば、ユーザーのフォトアルバム全体)へのクラスタリングは、少なくとも特定の状況下では、有利であり得ることを理解されよう。以下は、前述した単一出力ファイルの実施態様のいくつかの利点を記述する包括的でないリストである:
管理されるファイル数が大幅に削減され得るため、画像のマッピングがより簡略および容易になり得る。
一旦、ファイルが引き出されてオープンされると、記憶媒体に再度アクセスすることなく、後続の画像がアクセスされ得るため、個々の画像へのアクセス時間が短縮され得る。
複数の画像に対するメタデータが削減され得る。画像に対して別個のファイルを割り当てると、各画像に対して大きなメタデータオーバーヘッドを作成するが、それは非効率であり、複数の画像の処理を伴う様々な操作およびシステムに悪影響を及ぼす。例えば、メタデータの入出力操作でボトルネックが生じる。複数の画像を含む単一ファイルから一旦メタデータを読み取ると、画像毎の入出力操作が著しく減少し得、より効率的であり得る。
しかし、図8に示し、本明細書で前述した画像処理システム810の他に、システム810を操作する方法(これについても前述)も、単一の入力画像について、変更すべきところは変更して実施し得ることも理解されたい。従って、画像処理システム810は、単一画像の再符号化および再圧縮ため、ならびに入力画像に対応するマルチメディアオブジェクトを含む単一の出力ファイル内への再符号化画像のパッキングのために使用され得る。別の実施形態によれば、各オブジェクトは、各入力画像に対して生成された再圧縮ビットストリームに対応する。さらに別の実施形態では、単一の出力ファイルはMP4マルチメディアファイルである。
本明細書で本発明の特定機能を例示および説明してきたが、当業者には、多数の修正、置換、変更、および相当物に気が付くであろう。それ故、添付の特許請求の範囲は、かかる全ての修正および変更が本発明の本当の範囲内に含まれるよう及ぶことを意図する。

Claims (21)

  1. 離散的入力画像を縮小サイズの離散的出力画像に処理するためのシステムであって、
    素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信するように構成されたインタフェースと、
    前記離散的出力画像の実質的なサイズ縮小を可能にし、前記出力画像と前記入力画像との間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供するように構成された品質パラメーターコントローラーと、
    前記入力画像を再符号化するように構成されたイントラ予測エンコーダーであって、再符号化がイントラ画像予測を含み、前記符号化品質パラメーターに従って構成されているエンコーダーとを備えるシステム。
  2. 前記離散的入力画像が標準的JPEG画像である、請求項1に記載のシステム。
  3. 前記出力画像が標準的H.264フォーマットで提供される、請求項1に記載のシステム。
  4. 離散的入力画像を縮小サイズの離散的出力画像に処理するためのシステムであって、
    可逆または非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信するように構成されたインタフェースと、
    前記離散的出力画像の実質的なサイズ縮小を可能にし、前記出力画像と前記入力画像との間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供するように構成された品質パラメーターコントローラーと、
    前記入力画像を再符号化するように構成されたイントラ予測エンコーダーであって、再符号化がイントラ画像予測を含み、前記符号化品質パラメーターに従って構成されているエンコーダーとを備えるシステム。
  5. 前記離散的入力画像が標準的JPEG 2000画像である、請求項4に記載のシステム。
  6. 前記出力画像が標準的H.264フォーマットで提供される、請求項4に記載のシステム。
  7. 離散的入力画像を縮小サイズの離散的出力画像に処理するための方法であって、
    素ブロックの独立符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信することと、
    前記離散的出力画像の実質的なサイズ縮小を可能にし、前記出力画像と前記入力画像との間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供することと、
    前記入力画像を再符号化することであって、再符号化がイントラ画像予測、および前記符号化品質パラメーターに従って構成されている量子化ステップを含む、再符号化することとを含む方法。
  8. 離散的入力画像を縮小サイズの離散的出力画像に処理するための方法であって、
    可逆または非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信することと、
    前記離散的出力画像の実質的なサイズ縮小を可能にし、前記出力画像と前記入力画像との間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供することと、
    前記入力画像を再符号化することであって、再符号化がイントラ画像予測、および前記符号化品質パラメーターに従って構成されている量子化ステップを含む、再符号化することとを含む方法。
  9. 複数の入力画像を処理してそれぞれ複数の縮小サイズの出力画像を提供するためのシステムであって、
    素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の離散的入力画像を受信するように構成されたインタフェースと、
    前記複数の入力画像の各々に対して、前記各離散的出力画像の実質的なサイズ縮小を可能にし、前記各出力画像と入力画像対間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供するように構成された品質パラメーターコントローラーと、
    前記複数の入力画像の各々を再符号化するように構成されたイントラ予測符号化コントローラーであって、再符号化がイントラ画像予測を含み、前記エンコーダーが前記複数の入力画像の各々に対して提供された前記各符号化品質パラメーターに従って構成されている、イントラ予測符号化コントローラーとを備えるシステム。
  10. 前記品質パラメーターコントローラーの制御下にある複数の品質パラメーター制御インスタンスをさらに備え、前記複数の品質パラメーター制御インスタンスの各々が、前記複数の入力画像の1つまたは複数に割り当てられ、それに割り当てられた前記入力画像の各々に対して、前記各離散的出力画像の実質的なサイズ縮小を可能にする符号化品質パラメーターを提供するように構成され、前記パラメーターが前記各出力画像と入力画像対間の目標とする定量的類似性尺度に関連する、請求項9のシステム。
  11. イントラ予測エンコーダーの複数のインスタンスをさらに含み、前記イントラ予測エンコーダーの前記複数のインスタンスの各々が前記複数の入力画像の1つまたは複数に割り当てられて、それに割り当てられた前記入力画像の各々を再符号化し、再符号化がイントラ画像予測を含み、前記エンコーダーが、前記エンコーダーインスタンスに割り当てられた前記入力画像の各々に対して提供された前記各符号化品質パラメーターに従って構成されている、請求項9のシステム。
  12. 複数の入力画像を処理するためのシステムであって、
    素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の離散的入力画像を受信するように構成されたインタフェースと、
    前記複数の入力画像の各々に対して、前記各離散的出力画像の実質的なサイズ縮小を可能にし、前記各出力画像と入力画像対間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供するように構成された品質コントローラーと、
    前記複数の入力画像の各々を再符号化するように構成されているイントラ予測エンコーダーであって、再符号化がイントラ画像予測を含み、前記複数の入力画像の各々に対して提供された前記各符号化品質パラメーターに従って構成されているエンコーダーと、
    前記複数の入力画像に対して単一の出力ファイルを提供するように構成されたビットストリームパッキングモジュールであって、前記出力ファイルが、前記複数の離散的入力画像に対応する複数のインデックス付き離散的オブジェクトを含む、ビットストリームパッキングモジュールとを備えるシステム。
  13. 前記オブジェクトの各々が、前記複数の離散的入力画像の各1つに対応する離散的画像を含む、請求項12に記載のシステム。
  14. 前記出力ファイルがMP4ファイルである、請求項12に記載のシステム。
  15. 複数の入力画像を処理してそれぞれ複数の縮小サイズの出力画像を提供するための方法であって、
    素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の離散的入力画像を受信することと、
    前記複数の入力画像の各々に対して、前記各離散的出力画像の実質的なサイズ縮小を可能にし、前記各出力画像と入力画像対間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供することと、
    前記複数の入力画像の各々を再符号化することであって、再符号化がイントラ画像予測を含み、量子化ステップが前記複数の入力画像の各々に対して提供された前記各符号化品質パラメーターに従って構成されている、再符号化することとを含む方法。
  16. 複数の入力画像を処理するための方法であって、
    素ブロックの独立符号化を利用する圧縮フォーマットで圧縮されたか、または可逆もしくは非可逆量子化を有するウェーブレットおよびブロック毎のビットプレーンエントロピー符号化を利用する圧縮フォーマットで圧縮された、複数の離散的入力画像を受信することと、
    前記複数の入力画像の各々に対して、前記各離散的出力画像の実質的なサイズ縮小を可能にし、前記各出力画像と入力画像対間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供することと、
    前記複数の入力画像の各々を再符号化することであって、再符号化がイントラ画像予測を含み、量子化ステップが、前記複数の入力画像の各々に対して提供された前記各符号化品質パラメーターに従って構成されている、再符号化することと、
    前記複数の入力画像に対して、前記複数の離散的入力画像に対応する複数のインデックス付き離散的オブジェクトを含む、単一の出力ファイルを提供することとを含む方法。
  17. 離散的入力画像を縮小サイズの離散的出力画像に処理するためのシステムであって、
    イントラ予測符号化を利用する圧縮フォーマットで圧縮された離散的入力画像を受信するように構成されたインタフェースと、
    前記離散的出力画像の実質的なサイズ縮小を可能にし、前記出力画像と前記入力画像との間の目標とする定量的類似性尺度に関連する、符号化品質パラメーターを提供するように構成された品質パラメーターコントローラーと、
    前記入力画像を再符号化するように構成されたイントラ予測エンコーダーであって、再符号化がイントラ画像予測を含み、前記符号化品質パラメーターに従って構成されているエンコーダーとを備えるシステム。
  18. 前記離散的入力画像が標準的H.264フォーマットで提供される、請求項17に記載のシステム。
  19. 前記出力画像が標準的H.264フォーマットで提供される、請求項17に記載のシステム。
  20. 前記出力画像が2つ以上のサブ画像に分割され、前記サブ画像の各々の前記解像度が、前記H.264フォーマットでサポートされる最大画像解像度以下である、請求項3に記載のシステム。
  21. 前記出力画像が2つ以上のサブ画像に分割され、前記サブ画像の各々の前記解像度が、前記H.264フォーマットでサポートされる最大画像解像度以下である、請求項6に記載のシステム。
JP2012532715A 2009-10-05 2010-10-05 画像処理のための方法およびシステム Pending JP2013507084A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US24852109P 2009-10-05 2009-10-05
US61/248,521 2009-10-05
US25387209P 2009-10-22 2009-10-22
US61/253,872 2009-10-22
US30219310P 2010-02-08 2010-02-08
US61/302,193 2010-02-08
PCT/IL2010/000811 WO2011042900A1 (en) 2009-10-05 2010-10-05 A method and system for processing an image

Publications (1)

Publication Number Publication Date
JP2013507084A true JP2013507084A (ja) 2013-02-28

Family

ID=43856424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012532715A Pending JP2013507084A (ja) 2009-10-05 2010-10-05 画像処理のための方法およびシステム

Country Status (4)

Country Link
US (1) US20120201475A1 (ja)
EP (1) EP2486727A4 (ja)
JP (1) JP2013507084A (ja)
WO (1) WO2011042900A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11308647B2 (en) 2019-01-30 2022-04-19 Snow Corporation Method and system for improving compression ratio by difference between blocks of image file
US11539955B2 (en) 2019-01-30 2022-12-27 Snow Corporation Method and system for improving compression ratio through pixel conversion of image file

Families Citing this family (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1999883A4 (en) 2006-03-14 2013-03-06 Divx Llc FEDERATED DIGITAL RIGHTS MANAGEMENT SYSTEM COMPRISING CONFIDENCE SYSTEMS
US8311347B2 (en) * 2006-11-10 2012-11-13 Microsoft Corporation Image compression based on parameter-assisted inpainting
US10298834B2 (en) 2006-12-01 2019-05-21 Google Llc Video refocusing
US8510303B2 (en) 2009-01-07 2013-08-13 Divx, Llc Singular, collective and automated creation of a media guide for online content
CN102308586B (zh) * 2009-02-06 2015-03-25 汤姆森特许公司 用于视频编码器和解码器隐式和半隐式帧内模式信令的方法和装置
EP2486517A4 (en) 2009-10-05 2014-06-11 Icvt Ltd APPARATUS AND METHODS FOR RECOMPRINTING DIGITAL IMAGES
CA2782825C (en) 2009-12-04 2016-04-26 Divx, Llc Elementary bitstream cryptographic material transport systems and methods
CN102823242B (zh) 2010-01-22 2016-08-10 汤姆森特许公司 基于取样超分辨率视频编码和解码的方法和装置
WO2011090798A1 (en) * 2010-01-22 2011-07-28 Thomson Licensing Data pruning for video compression using example-based super-resolution
WO2012033971A1 (en) 2010-09-10 2012-03-15 Thomson Licensing Recovering a pruned version of a picture in a video sequence for example - based data pruning using intra- frame patch similarity
WO2012033972A1 (en) 2010-09-10 2012-03-15 Thomson Licensing Methods and apparatus for pruning decision optimization in example-based data pruning compression
US20120072524A1 (en) * 2010-09-20 2012-03-22 Cisco Technology, Inc. System and method for recording data in a network environment
WO2012050832A1 (en) 2010-09-28 2012-04-19 Google Inc. Systems and methods utilizing efficient video compression techniques for providing static image data
US9247312B2 (en) 2011-01-05 2016-01-26 Sonic Ip, Inc. Systems and methods for encoding source media in matroska container files for adaptive bitrate streaming using hypertext transfer protocol
US8768102B1 (en) * 2011-02-09 2014-07-01 Lytro, Inc. Downsampling light field images
US9467708B2 (en) 2011-08-30 2016-10-11 Sonic Ip, Inc. Selection of resolutions for seamless resolution switching of multimedia content
US8964977B2 (en) 2011-09-01 2015-02-24 Sonic Ip, Inc. Systems and methods for saving encoded media streamed using adaptive bitrate streaming
US8909922B2 (en) 2011-09-01 2014-12-09 Sonic Ip, Inc. Systems and methods for playing back alternative streams of protected content protected using common cryptographic information
US9390752B1 (en) * 2011-09-06 2016-07-12 Avid Technology, Inc. Multi-channel video editing
US9338463B2 (en) * 2011-10-06 2016-05-10 Synopsys, Inc. Visual quality measure for real-time video processing
US9781449B2 (en) 2011-10-06 2017-10-03 Synopsys, Inc. Rate distortion optimization in image and video encoding
JP5977498B2 (ja) * 2011-10-14 2016-08-24 キヤノン株式会社 撮像装置、撮像装置の制御方法
US9247257B1 (en) 2011-11-30 2016-01-26 Google Inc. Segmentation based entropy encoding and decoding
US9094681B1 (en) 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
US9858649B2 (en) 2015-09-30 2018-01-02 Lytro, Inc. Depth-based image blurring
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US10230956B2 (en) 2012-09-26 2019-03-12 Integrated Device Technology, Inc. Apparatuses and methods for optimizing rate-distortion of syntax elements
RU2616548C2 (ru) * 2012-10-19 2017-04-17 КОЛЕН, Жан-Клод Обратимый способ преобразования файла, закодированного первым кодированием, в файл, закодированный вторым кодированием
US10277907B2 (en) 2012-10-25 2019-04-30 Integrated Device Technology, Inc. Rate-distortion optimizers and optimization techniques including joint optimization of multiple color components
CN103810694B (zh) * 2012-11-15 2017-08-01 腾讯科技(深圳)有限公司 图片压缩中质量因子的获取方法及装置
US9264475B2 (en) 2012-12-31 2016-02-16 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US9191457B2 (en) 2012-12-31 2015-11-17 Sonic Ip, Inc. Systems, methods, and media for controlling delivery of content
US9313510B2 (en) 2012-12-31 2016-04-12 Sonic Ip, Inc. Use of objective quality measures of streamed content to reduce streaming bandwidth
US9924164B2 (en) * 2013-01-03 2018-03-20 Disney Enterprises, Inc. Efficient re-transcoding of key-frame-aligned unencrypted assets
WO2014138633A2 (en) * 2013-03-08 2014-09-12 Board Of Regents, The University Of Texas System Systems and methods for digital media compression and recompression
US20140254659A1 (en) 2013-03-11 2014-09-11 Mediatek Inc. Video coding method using at least evaluated visual quality and related video coding apparatus
US9906785B2 (en) 2013-03-15 2018-02-27 Sonic Ip, Inc. Systems, methods, and media for transcoding video data according to encoding parameters indicated by received metadata
US10397292B2 (en) 2013-03-15 2019-08-27 Divx, Llc Systems, methods, and media for delivery of content
US9661331B2 (en) * 2013-03-18 2017-05-23 Vantrix Corporation Method and apparatus for signal encoding realizing optimal fidelity
US9338450B2 (en) 2013-03-18 2016-05-10 Ecole De Technologie Superieure Method and apparatus for signal encoding producing encoded signals of high fidelity at minimal sizes
US10609405B2 (en) 2013-03-18 2020-03-31 Ecole De Technologie Superieure Optimal signal encoding based on experimental data
US10334151B2 (en) 2013-04-22 2019-06-25 Google Llc Phase detection autofocus using subaperture images
US9094737B2 (en) 2013-05-30 2015-07-28 Sonic Ip, Inc. Network video streaming with trick play based on separate trick play files
US9967305B2 (en) 2013-06-28 2018-05-08 Divx, Llc Systems, methods, and media for streaming media content
CN104301703A (zh) * 2013-07-16 2015-01-21 联咏科技股份有限公司 匹配搜寻方法与匹配搜寻系统
US9560160B1 (en) * 2014-01-17 2017-01-31 Instar Logic, Inc. Prioritization of the delivery of different portions of an image file
US9866878B2 (en) 2014-04-05 2018-01-09 Sonic Ip, Inc. Systems and methods for encoding and playing back video at different frame rates using enhancement layers
US10013625B1 (en) * 2014-04-16 2018-07-03 Instart Logic, Inc. QoE-driven unsupervised image categorization for optimized web delivery
FR3033114A1 (fr) * 2015-02-19 2016-08-26 Orange Procede de codage et decodage d'images, dispositif de codage et decodage et programmes d'ordinateur correspondants
US10540818B2 (en) 2015-04-15 2020-01-21 Google Llc Stereo image generation and interactive playback
US10440407B2 (en) 2017-05-09 2019-10-08 Google Llc Adaptive control for immersive experience delivery
US10567464B2 (en) 2015-04-15 2020-02-18 Google Llc Video compression with adaptive view-dependent lighting removal
US10546424B2 (en) 2015-04-15 2020-01-28 Google Llc Layered content delivery for virtual and augmented reality experiences
US11328446B2 (en) 2015-04-15 2022-05-10 Google Llc Combining light-field data with active depth data for depth map generation
US10341632B2 (en) 2015-04-15 2019-07-02 Google Llc. Spatial random access enabled video system with a three-dimensional viewing volume
US10275898B1 (en) 2015-04-15 2019-04-30 Google Llc Wedge-based light-field video capture
US10469873B2 (en) 2015-04-15 2019-11-05 Google Llc Encoding and decoding virtual reality video
US10565734B2 (en) 2015-04-15 2020-02-18 Google Llc Video capture, processing, calibration, computational fiber artifact removal, and light-field pipeline
US10419737B2 (en) 2015-04-15 2019-09-17 Google Llc Data structures and delivery methods for expediting virtual reality playback
US10412373B2 (en) 2015-04-15 2019-09-10 Google Llc Image capture for virtual reality displays
US10444931B2 (en) 2017-05-09 2019-10-15 Google Llc Vantage generation and interactive playback
US20160345009A1 (en) * 2015-05-19 2016-11-24 ScaleFlux Accelerating image analysis and machine learning through in-flash image preparation and pre-processing
US9979909B2 (en) 2015-07-24 2018-05-22 Lytro, Inc. Automatic lens flare detection and correction for light-field images
US10015503B1 (en) 2015-09-24 2018-07-03 Instart Logic, Inc. Fast, real-time, estimation of content-sensitive encoding quality for optimized web delivery of images
US10437918B1 (en) * 2015-10-07 2019-10-08 Google Llc Progressive image rendering using pan and zoom
US10275892B2 (en) 2016-06-09 2019-04-30 Google Llc Multi-view scene segmentation and propagation
US9712830B1 (en) * 2016-09-15 2017-07-18 Dropbox, Inc. Techniques for image recompression
US10679361B2 (en) 2016-12-05 2020-06-09 Google Llc Multi-view rotoscope contour propagation
US10498795B2 (en) 2017-02-17 2019-12-03 Divx, Llc Systems and methods for adaptive switching between multiple content delivery networks during adaptive bitrate streaming
US10594945B2 (en) 2017-04-03 2020-03-17 Google Llc Generating dolly zoom effect using light field image data
TWI669954B (zh) * 2017-04-21 2019-08-21 美商時美媒體公司 用於編碼器導引自適應性品質演現的系統及方法
US10474227B2 (en) 2017-05-09 2019-11-12 Google Llc Generation of virtual reality with 6 degrees of freedom from limited viewer data
US10354399B2 (en) 2017-05-25 2019-07-16 Google Llc Multi-view back-projection to a light-field
US10545215B2 (en) 2017-09-13 2020-01-28 Google Llc 4D camera tracking and optical stabilization
US10542277B2 (en) * 2017-10-24 2020-01-21 Arm Limited Video encoding
US10965862B2 (en) 2018-01-18 2021-03-30 Google Llc Multi-camera navigation interface
WO2019148320A1 (en) * 2018-01-30 2019-08-08 SZ DJI Technology Co., Ltd. Video data encoding
CN108537220A (zh) * 2018-03-21 2018-09-14 李荣陆 一种使原平面设计在新尺寸下自动适配的装置
CN109815012B (zh) * 2018-12-29 2023-08-18 深圳市创梦天地科技有限公司 一种图像可见质量值搜索方法和相关装置
EP4085622A1 (en) * 2019-12-31 2022-11-09 Koninklijke KPN N.V. Partial output of a decoded picture buffer in video coding
TWI749676B (zh) * 2020-08-03 2021-12-11 緯創資通股份有限公司 影像品質評估裝置及其影像品質評估方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004343592A (ja) * 2003-05-19 2004-12-02 Mitsubishi Electric Corp トランスコーダ
JP2005176069A (ja) * 2003-12-12 2005-06-30 Ntt Data Corp 分散並列トランスコーダシステム及び分散並列トランスコード方法
JPWO2005074291A1 (ja) * 2004-01-28 2007-09-13 日本電気株式会社 コンテンツの符号化、配信及び受信方法と装置とシステムならびにプログラム
JP2007526507A (ja) * 2004-02-13 2007-09-13 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. スケーラブルメディアを記述するデータを生成するための方法
JP2008244993A (ja) * 2007-03-28 2008-10-09 Renesas Technology Corp トランスコーディングのための装置および方法
WO2009055899A1 (en) * 2007-11-02 2009-05-07 Ecole De Technologie Superieure System and method for quality-aware selection of parameters in transcoding of digital images
WO2009113276A1 (ja) * 2008-03-12 2009-09-17 三菱電機株式会社 画像符号化方式変換装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167155A (en) * 1997-07-28 2000-12-26 Physical Optics Corporation Method of isomorphic singular manifold projection and still/video imagery compression
US6895122B2 (en) * 2001-06-25 2005-05-17 Eastman Kodak Company Method and system for determining DCT block boundaries
US7092578B2 (en) * 2001-10-23 2006-08-15 Agilent Technologies, Inc. Signaling adaptive-quantization matrices in JPEG using end-of-block codes
US7664184B2 (en) * 2004-07-21 2010-02-16 Amimon Ltd. Interpolation image compression
DE102004059993B4 (de) * 2004-10-15 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Bewegungsdaten-Prädiktion sowie Computerprogramm und computerlesbares Medium
US7502514B2 (en) * 2004-11-15 2009-03-10 Smith Micro Software, Inc. System and method for lossless compression of already compressed files
US20060193527A1 (en) * 2005-01-11 2006-08-31 Florida Atlantic University System and methods of mode determination for video compression
US8073275B2 (en) * 2005-02-09 2011-12-06 Mobixell Networks Ltd. Image adaptation with target size, quality and resolution constraints
EP1872590B1 (en) * 2005-04-19 2014-10-22 Telecom Italia S.p.A. Method and apparatus for digital image coding
JP2008199587A (ja) * 2007-01-18 2008-08-28 Matsushita Electric Ind Co Ltd 画像符号化装置、画像復号化装置および方法
US8295624B2 (en) * 2007-12-03 2012-10-23 Ecole De Technologie Superieure Method and system for generating a quality prediction table for quality-aware transcoding of digital images
EP2486517A4 (en) * 2009-10-05 2014-06-11 Icvt Ltd APPARATUS AND METHODS FOR RECOMPRINTING DIGITAL IMAGES
EP2534611A4 (en) * 2010-03-10 2016-08-24 Ibm RECOMPRESSION WITHOUT LOSS MULTIBLOC IN REAL TIME

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004343592A (ja) * 2003-05-19 2004-12-02 Mitsubishi Electric Corp トランスコーダ
JP2005176069A (ja) * 2003-12-12 2005-06-30 Ntt Data Corp 分散並列トランスコーダシステム及び分散並列トランスコード方法
JPWO2005074291A1 (ja) * 2004-01-28 2007-09-13 日本電気株式会社 コンテンツの符号化、配信及び受信方法と装置とシステムならびにプログラム
JP2007526507A (ja) * 2004-02-13 2007-09-13 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. スケーラブルメディアを記述するデータを生成するための方法
JP2008244993A (ja) * 2007-03-28 2008-10-09 Renesas Technology Corp トランスコーディングのための装置および方法
WO2009055899A1 (en) * 2007-11-02 2009-05-07 Ecole De Technologie Superieure System and method for quality-aware selection of parameters in transcoding of digital images
WO2009113276A1 (ja) * 2008-03-12 2009-09-17 三菱電機株式会社 画像符号化方式変換装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11308647B2 (en) 2019-01-30 2022-04-19 Snow Corporation Method and system for improving compression ratio by difference between blocks of image file
US11539955B2 (en) 2019-01-30 2022-12-27 Snow Corporation Method and system for improving compression ratio through pixel conversion of image file
US11823418B2 (en) 2019-01-30 2023-11-21 Snow Corporation Method and system for improving compression ratio by difference between blocks of image file

Also Published As

Publication number Publication date
EP2486727A4 (en) 2014-03-12
US20120201475A1 (en) 2012-08-09
WO2011042900A1 (en) 2011-04-14
EP2486727A1 (en) 2012-08-15

Similar Documents

Publication Publication Date Title
JP2013507084A (ja) 画像処理のための方法およびシステム
US10701357B2 (en) Video encoding method using in-loop filter parameter prediction and apparatus therefor, and video decoding method and apparatus therefor
US8213498B2 (en) Bitrate reduction techniques for image transcoding
JP5844263B2 (ja) デジタル画像を再圧縮するための装置および方法
JP5470405B2 (ja) 画像符号化装置および方法
JP5513740B2 (ja) 画像復号化装置、画像符号化装置、画像復号化方法、画像符号化方法、プログラムおよび集積回路
JP6134650B2 (ja) シーンに基づく適用性のあるビットレート制御
US9047669B1 (en) Bit rate control for data compression
US20160234496A1 (en) Near visually lossless video recompression
US20170374387A1 (en) Region-of-interest encoding enhancements for variable-bitrate mezzanine compression
JP2005523658A (ja) 複雑さの軽減された復号化に適したシングルレイヤビデオ符号化されたビットストリームを供給するシステム及び方法
JP2009027698A (ja) 画像フレームの非フレームエッジブロックの表現における改良された圧縮
JP2017537518A (ja) グラフテンプレートから誘導された変換を用いてビデオ信号をデコーディング/エンコーディングする方法及び装置
KR101703330B1 (ko) 이미지 재부호화 방법 및 그 장치
WO2012118569A1 (en) Visually optimized quantization
KR20150096353A (ko) 이미지 인코딩 시스템, 디코딩 시스템 및 그 제공방법
Cassidy An Analysis of VP8, a new video codec for the web
WO2023127940A1 (ja) 画像処理装置および画像処理方法
KR20070081663A (ko) 동일한 손실 압축 적용이 가능한 영상 처리 장치 및 그장치가 탑재된 이동통신 단말기에서 실행 가능한 영상 처리방법
TW202341739A (zh) 圖像解碼方法、圖像編碼方法及相應的裝置
JP2023070055A (ja) 画像符号化装置及びその制御方法及びプログラム
KR20150029398A (ko) 이미지 인코딩 시스템, 디코딩 시스템 및 그 제공방법
CN116074531A (zh) 解码方法、编码方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140902

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150217