JP2004289374A - 画像処理装置、画像処理方法、プログラム、及び記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラム、及び記録媒体 Download PDF

Info

Publication number
JP2004289374A
JP2004289374A JP2003077393A JP2003077393A JP2004289374A JP 2004289374 A JP2004289374 A JP 2004289374A JP 2003077393 A JP2003077393 A JP 2003077393A JP 2003077393 A JP2003077393 A JP 2003077393A JP 2004289374 A JP2004289374 A JP 2004289374A
Authority
JP
Japan
Prior art keywords
image
information
thumbnail
image processing
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003077393A
Other languages
English (en)
Inventor
Ikuko Kusatsu
郁子 草津
Taku Kodama
児玉  卓
Takashi Maki
牧  隆史
Keiichi Suzuki
啓一 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003077393A priority Critical patent/JP2004289374A/ja
Priority to US10/783,632 priority patent/US7526144B2/en
Priority to CNB2004100330648A priority patent/CN100531292C/zh
Publication of JP2004289374A publication Critical patent/JP2004289374A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

【課題】静止画像の連続としての動画像に対し、動画としてのサムネイルを高速に出力することが可能な動画像データを生成する画像処理装置を提供する。
【解決手段】画像処理装置20は、複数の画像データ(或いはそれらからなる動画データ)を画像読込部21で読み込み、サムネイル設定部22でサムネイル情報を設定する。続いて画質圧縮部23にて画像を圧縮する。次にサムネイル情報付加部24にて設定に応じたサムネイル情報を付加する。次に動画用サムネイル設定部25では、複数の静止画像の中から動画像のサムネイルとして使用する静止画像を動画用サムネイル情報として設定する。そして動画用サムネイル情報付加部26にて動画用サムネイル設定部25で設定された動画用サムネイル情報を、画像データの纏まりとしてのファイルのヘッダ部分に付加する。最後に、このファイルに対し符号生成部27にて符号データを生成する。
【選択図】 図12

Description

【0001】
【発明の属する技術分野】
本発明は、画像処理装置、画像伸張装置、画像出力装置、画像処理方法、画像伸張方法、画像出力方法、プログラム、及び記録媒体に関する。
【0002】
【従来の技術】
近年、高精細画像の普及が著しい。これは、デジタルスチルカメラ,デジタルビデオカメラやスキャナ等の入力デバイス、インクジェットプリンタやディスプレイ等の出力デバイスにおける高精細化に拠るところが大きい。そして、こうした高精細静止画像(或いはその連続としての動画像)を扱う画像圧縮伸張アルゴリズムとして、現在のところ、JPEG(Joint Photographic Experts Group)が最も広く使われている。JPEGでは、空間領域の冗長度を除去するために、二次元離散コサイン変換を用いている。
【0003】
この方式の基本機能は「静止画像を圧縮し伸張する」ことだけである。圧縮ファイルの状態で画像を操作したり、伸張する時に特定領域だけを見たりすることはできない。また、階層を持たない「フラットな構造」として画像を扱っている。従って、画像に新たな処理を加えるためには、符号データは必ず完全に復号化される必要がある。
【0004】
JPEGアルゴリズムにおいては、画像の高精細化や大規模化に伴い、すなわち原画像の画素数が増えるに従い、符号化された画像データを伸張し画像値を表示デバイス上に画像として表示させるのに必要な時間も、並行して増えていく。最近は、入力デバイスの高性能化によって原画像の高精細化や大面積化が進み、無視できないレベルになりつつある。また、衛星・航空写真や医療・科学分野の画像、そして文化財を記録した画像を扱う分野においては、既に解決すべき不具合として認識されている。なお、JPEG圧縮画像を伸張する際には、それに要する時間が、縮小率とは無関係に一定の値をとるという特徴があるが、この理由は、上述したように、JPEG方式で符号化されたデータは縮小率に関わり無く必ず完全に復号化されるからである。
【0005】
通常、こうした大きい画像の全画素をディスプレイに表示することは、表示デバイスの表示可能画素数に制約があるので難しい。実際には、画面上に縮小して表示することにより対処している。しかし、従来のJPEGアルゴリズムでは、縮小画像を表示させる場合においても、原画像全てを伸張し全画素値を求め、そこから間引き処理を行ってディスプレイ上に表示していた。原画像の全画素値を求めるために要する伸張処理時間は、画像のピクセル数に比例して増大する。MPUの性能やメモリの容量にも依るが、例えば、画像が表示されるまでに、数分から数十分の時間を要している。
【0006】
また、JPEGアルゴリズムにおいては、完全な復号処理を行わなくても使い手にとって十分な情報を得られる場合でも、従来のJPEG方式では復号処理を全て行わなければならず、伸張時に伸張する画像領域や色成分或いは伸張動作順序を指定できない。例えば、カラー画像をグレイスケールの画像で表示したい、或る特定領域の画像だけを見たい、サムネイルの大きさで見たい、画像コンテンツを高速に閲覧したい、Motion静止画像の早送り表示を見たい、等々の要求に応えることは、従来のJPEGアルゴリズムでは困難である。従来のJPEGアルゴリズムでは、まず原画像を圧縮した符号データに対し、完全な伸張を行った画像データを生成する。その後、その画像データをグレイスケール表示用の画像データ、特定領域表示用の画像データ、サムネイル表示用の画像データなどに変換することにより、所望の表示画像を得る。
【0007】
一方、画像表示装置においては、画像のサムネイルを表示することがよくある。従来技術によるサムネイルの表示においては、画像全体を伸張し、必要解像度に落とし、表示する方法や、サムネイル画像を別に保持しておく方法などがある。いずれの場合も、JPEGの規格に基づいて、その基本機能や場合によっては拡張機能を用いた画像の圧縮・伸張が行われる。
【0008】
【発明が解決しようとする課題】
しかしながら、サムネイル表示に限らず、サムネイルの印刷,伝送等、サムネイルの出力を、画像全体を伸張し必要解像度に落としてから行う方法を採用すると、サムネイル画像が出力されるまでにかなりの時間を要する。
【0009】
また、サムネイル画像を別に保存しておき、出力する際にその保存した画像を読み出して行う方法では、Exif(Exchangeable image file format)などで標準化されているように、保存するサムネイル画像(小画像)のデータそのものを主画像の圧縮データのヘッダ部分に格納しておくことが一般的であり、出力速度は速くなるが、圧縮データの容量が大きくなってしまう。
【0010】
以上のことは、静止画像の連続としての動画像を取り扱う際に、さらに顕著な問題として現われる。
【0011】
本発明は、上述のごとき実情に鑑みてなされたものであり、静止画像の連続としての動画像に対し、動画としてのサムネイルを高速に出力することが可能な動画像データを生成する、画像処理装置、画像処理方法、コンピュータ読み取り可能なプログラム、並びに、そのプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することをその目的とする。
【0012】
また、本発明は、静止画像の連続としての動画像に対し、個々の圧縮画像データのデータ容量を大きくすることなく、個々の画像データのサムネイルの連続としてのサムネイル動画を高速に出力することが可能な、画像出力装置及び画像伸張装置、画像出力方法及び画像伸張方法、コンピュータ読み取り可能なプログラム、並びに、そのプログラムを記録したコンピュータ読み取り可能な記録媒体を提供することを他の目的とする。
【0013】
【課題を解決するための手段】
本発明においては、JPEGの次世代の画像符号化方式として提案されているJPEG2000方式(ISO/IEC FCD 15444−1)が、画像を高精細な状態で保存しておき、その画像符号データから特定の解像度の画像や特定の画質を持つ画像を取り出すことなどが可能であることを利用して、サムネイル画像の出力(表示,印刷,伝送)、さらにはサムネイル動画の出力を高速にしている。
【0014】
請求項1の発明は、複数の静止画像から1つの動画像ファイルを生成する画像処理装置であって、複数の静止画像の再生順序を設定する画像順序設定手段と、該設定された順序に従って個々の静止画像の格納位置などを示したデータを前記ファイルのヘッダ部分に付加するデータ付加手段と、を有することを特徴としたものである。
【0015】
請求項2の発明は、請求項1の発明において、前記画像順序設定手段は、前記複数の静止画像の中から動画像のサムネイルとして使用する静止画像を、動画用サムネイル情報として設定する動画用サムネイル設定手段を有し、前記データ付加手段は、前記動画用サムネイル設定手段で設定された動画用サムネイル情報を、前記ファイルのヘッダ部分に付加する動画用サムネイル情報付加手段を有することを特徴としたものである。
【0016】
請求項3の発明は、請求項1又は2の発明において、当該画像処理装置は、静止画像の圧縮符号データを生成する画像圧縮手段を有し、前記データ付加手段は、個々の静止画像のサムネイル情報を、1又は複数形態設定するサムネイル設定手段と、該設定された形態のサムネイル情報を、個々の静止画像の符号データ形成時にヘッダ部分に付加するサムネイル情報付加手段と、を有することを特徴としたものである。
【0017】
請求項4の発明は、請求項3の発明において、前記サムネイル情報として、画像の解像度情報を用いることを特徴としたものである。
【0018】
請求項5の発明は、請求項4の発明において、前記解像度情報として、画像のデコンポジションレベル情報を用いることを特徴としたものである。
【0019】
請求項6の発明は、請求項3乃至5のいずれか1の発明において、前記サムネイル情報として、画像の位置情報を用いることを特徴としたものである。
【0020】
請求項7の発明は、請求項6の発明において、前記位置情報として、タイル情報,プレシンクト情報,コードブロック情報,画素位置情報のうち、いずれか1又は複数を用いることを特徴としたものである。
【0021】
請求項8の発明は、請求項3乃至7のいずれか1の発明において、前記サムネイル情報として、画像のコンポーネント情報を用いることを特徴としたものである。
【0022】
請求項9の発明は、請求項3乃至8のいずれか1の発明において、前記サムネイル情報として、画像の画質情報を用いることを特徴としたものである。
【0023】
請求項10の発明は、請求項9の発明において、前記画質情報として、レイヤ情報及び/又はビットプレーン情報を用いることを特徴としたものである。
【0024】
請求項11の発明は、請求項3乃至10のいずれか1の発明において、前記サムネイル情報として、画像のサブバンド情報を用いることを特徴としたものである。
【0025】
請求項12の発明は、画像のサムネイルを出力する画像伸張装置であって、請求項3乃至11のいずれか1記載の画像処理装置で生成した一連の圧縮符号データから、各圧縮符号データのサムネイル情報を元に、符号データからサムネイル部分のみを伸張し出力する手段を有することを特徴としたものである。
【0026】
請求項13の発明は、画像のサムネイルを取り出す画像出力装置であって、請求項3乃至11のいずれか1記載の画像処理装置で生成した一連の圧縮符号データから、各圧縮符号データのサムネイル情報を元に、符号データの一部を切り出す手段を有することを特徴としたものである。
【0027】
請求項14の発明は、請求項1乃至11のいずれか1記載の画像処理装置で生成されたファイルを、前記再生順序に従って出力する画像出力装置である。
【0028】
請求項15の発明は、請求項2記載の画像処理装置で生成されたファイルを、前記動画用サムネイル情報に基づき、サムネイル動画像を出力する画像出力装置である。
【0029】
請求項16の発明は、複数の静止画像から1つの動画像ファイルを生成する画像処理方法であって、複数の静止画像の再生順序を設定する画像順序設定ステップと、該設定された順序に従って個々の静止画像の格納位置などを示したデータを前記ファイルのヘッダ部分に付加するデータ付加ステップと、を有することを特徴としたものである。
【0030】
請求項17の発明は、請求項16の発明において、前記画像順序設定ステップは、前記複数の静止画像の中から動画像のサムネイルとして使用する静止画像を、動画用サムネイル情報として設定する動画用サムネイル設定ステップを有し、前記データ付加ステップは、前記動画用サムネイル設定ステップで設定された動画用サムネイル情報を、前記ファイルのヘッダ部分に付加する動画用サムネイル情報付加ステップを有することを特徴としたものである。
【0031】
請求項18の発明は、請求項16又は17の発明において、当該画像処理方法は、静止画像の圧縮符号データを生成する画像圧縮ステップを有し、前記データ付加ステップは、個々の静止画像のサムネイル情報を、1又は複数形態設定するサムネイル設定ステップと、該設定された形態のサムネイル情報を、個々の静止画像の符号データ形成時にヘッダ部分に付加するサムネイル情報付加ステップと、を有することを特徴としたものである。
【0032】
請求項19の発明は、請求項18の発明において、前記サムネイル情報として、画像の解像度情報を用いることを特徴としたものである。
【0033】
請求項20の発明は、請求項19の発明において、前記解像度情報として、画像のデコンポジションレベル情報を用いることを特徴としたものである。
【0034】
請求項21の発明は、請求項18乃至20のいずれか1の発明において、前記サムネイル情報として、画像の位置情報を用いることを特徴としたものである。
【0035】
請求項22の発明は、請求項21の発明において、前記位置情報として、タイル情報,プレシンクト情報,コードブロック情報,画素位置情報のうち、いずれか1又は複数を用いることを特徴としたものである。
【0036】
請求項23の発明は、請求項18乃至22のいずれか1の発明において、前記サムネイル情報として、画像のコンポーネント情報を用いることを特徴としたものである。
【0037】
請求項24の発明は、請求項18乃至23のいずれか1の発明において、前記サムネイル情報として、画像の画質情報を用いることを特徴としたものである。
【0038】
請求項25の発明は、請求項24の発明において、前記画質情報として、レイヤ情報及び/又はビットプレーン情報を用いることを特徴としたものである。
【0039】
請求項26の発明は、請求項18乃至25のいずれか1の発明において、前記サムネイル情報として、画像のサブバンド情報を用いることを特徴としたものである。
【0040】
請求項27の発明は、画像のサムネイルを出力する画像伸張方法であって、請求項18乃至26のいずれか1記載の画像処理方法で生成した一連の圧縮符号データから、各圧縮符号データのサムネイル情報を元に、符号データからサムネイル部分のみを伸張し出力するステップを有することを特徴としたものである。
【0041】
請求項28の発明は、画像のサムネイルを取り出す画像出力方法であって、請求項18乃至26のいずれか1記載の画像処理方法で生成した一連の圧縮符号データから、各圧縮符号データのサムネイル情報を元に、符号データの一部を切り出すステップを有することを特徴としたものである。
【0042】
請求項29の発明は、請求項16乃至26のいずれか1記載の画像処理方法で生成されたファイルを、前記再生順序に従って出力する画像出力方法である。
【0043】
請求項30の発明は、請求項17記載の画像処理方法で生成されたファイルを、前記動画用サムネイル情報に基づき、サムネイル動画像を出力する画像出力方法である。
【0044】
請求項31の発明は、請求項1乃至11のいずれか1記載の画像処理装置として、或いは請求項12記載の画像伸張装置として、或いは請求項13乃至15のいずれか1記載の画像出力装置として、コンピュータを機能させるためのプログラムである。
【0045】
請求項32の発明は、請求項16乃至26のいずれか1記載の画像処理方法、或いは請求項27記載の画像伸張方法、或いは請求項28乃至30のいずれか1記載の画像出力方法、をコンピュータに実行させるためのプログラムである。
【0046】
請求項33の発明は、請求項31又は32記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
【0047】
【発明の実施の形態】
以下、本発明の各実施形態において処理される符号化データ(以下、圧縮符号データとも呼ぶ)が、JPEG2000(ISO/IEC FCD 15444−1)の静止画像の符号化データと、Motion−JPEG2000(ISO/IEC FCD 15444−3)の動画像の符号化データであるとして説明を行う。Motion−JPEG2000は、連続した複数の静止画像のそれぞれをフレームとして動画像を扱い、各フレームの符号化データはJPEG2000に準拠しており、ファイルフォーマットがJPEG2000と一部異なるのみである。
【0048】
JPEG2000は、2001年に国際標準になったJPEG後継の画像圧縮伸張方式であり、そのアルゴリズムについては、例えば書籍「次世代画像符号化方式 JPEG2000」(野水泰之著、株式会社トリケップス)などに詳しいが、以下の実施の形態の説明に必要な範囲でJPEG2000のアルゴリズムについて説明する。
【0049】
図1は、JPEG2000の基本となる階層符号化・復号化アルゴリズムを説明するためのブロック図で、本発明の一実施形態に係る画像処理装置を説明するためのブロック図でもある。
JPEG2000の基本となる階層符号化・復号化アルゴリズムは、2次元ウェーブレット変換・逆変換部2、量子化・逆量子化部3、エントロピー符号化・復号化部4、タグ処理部5で構成されている。色空間変換・逆変換部(色変換・逆変換部)1からの入力又は色空間変換・逆変換部1への出力として、さらにはタグ処理部5からの入力又はタグ処理部5への出力として、2次元ウェーブレット変換・逆変換部2,量子化・逆量子化部3,エントロピー符号化・復号化部4のそれぞれが備えられている。各部は正逆方向で別構成としても良いことは言及するまでもないが、各部における処理はコンポーネント毎に実行するような構成としてもよい。
【0050】
図2は、JPEG2000のアルゴリズムを説明するための簡略化されたフロー図である。
図1に示すJPEG2000での圧縮・伸張の処理の概要としては、圧縮時には、ステップS1,S2において色空間変換がなされた各コンポーネントをウェーブレット変換してウェーブレット係数を求め(ステップS3)、プログレッシブサブビットプレーン符号化(ステップS4)、エントロピー符号化(ステップS5)が施される。一方、伸張時には、ステップS5,S6においてエントロピー復号、逆量子化を経て得られたコンポーネント毎のウェーブレット係数に対して、逆ウェーブレット変換が施され(ステップS3)、その後逆色変換がなされて(ステップS2)、原画像のRGB画素値に戻る(ステップS1)といった流れになる。
【0051】
以下、JPEG2000アルゴリズムの特徴について、詳細に説明する。
JPEG2000アルゴリズムが、JPEGアルゴリズムと比較して最も大きく異なる点の一つは、変換方法である。JPEGでは離散コサイン変換(DCT:Discrete Cosine Transform)を、JPEG2000の階層符号化圧縮伸張アルゴリズムでは離散ウェーブレット変換(DWT:Discrete Wavelet Transform)を、各々用いている。DWTはDCTに比べて、高圧縮領域における画質が良いという長所が、JPEGの後継アルゴリズムであるJPEG2000で採用された大きな理由の一つとなっている。また、他の大きな相違点は、後者では、最終段に符号形成をおこなうために、タグ処理部5と呼ばれる機能ブロックが追加されていることである。この部分で、圧縮動作時には圧縮データがコードストリームとして生成され、伸張動作時には伸張に必要なコードストリームの解釈が行われる。そして、コードストリームによって、JPEG2000は様々な便利な機能を実現できるようになった。JPEG2000のアルゴリズムは高圧縮率(低ビットレート)での画質が良好であるほか、多くの特徴を有する。
【0052】
その1つが、符号化データの符号の削除(トランケーション)によるポスト量子化によって、再圧縮を行うことなく全体の符号量を調整できることである。この符号削除は、タイルやプレシンクトなどの領域、コンポーネント、デコンポジションレベル(もしくは解像度レベル)、ビットプレーン、サブビットプレーン、パケット、マルチレイヤ構成の場合にはレイヤなど、多様な単位で行うことができる。
【0053】
例えば、図3はデコンポジションレベル数が3の場合の、各デコンポジションレベルにおけるサブバンドを示す図であるが、図3に示したブロックベースでのDWTにおけるオクターブ分割の階層に対応した任意の階層で、静止画像の圧縮伸張処理を停止させることができる。なお、デコンポジションレベルと解像度レベルとの関係であるが、各サブバンドに対し、3LLの解像度レベルが0、3HL,3LH,3HHの解像度レベルが1、2HL,2LH,2HHの解像度レベルが2、1HL,1LH,1HHの解像度レベルが3となっている。また、ここでの「デコンポジション」に関し、JPEG2000 PartI FDIS(Final Draft international Standard)には、以下のように定義されている。
【0054】
decomposition level:
A collection of wavelet subbands where each coefficient has the same spatial impact or span with respect to the source component samples. These include the HL,LH,and HH subbands of the same two dimensional subband decomposition. For the last decomposition level the LL subband is also included.
【0055】
もう1つは、符号化データのレイヤの再構成を符号状態のままで行うことができることである。もう1つは、あるプログレッション順序の符号化コードを、符号状態のままで別のプログレッション順序の符号化データに再構成することが可能であることである。もう1つは、マルチレイヤの符号化データを、符号状態のまま、レイヤ単位で2以上の符号化コードに分割可能であることである。
【0056】
以下、JPEG2000アルゴリズムについて、順を追って詳細に説明する。
原画像の入出力部分には、図1のように色空間変換部1が接続されることが多い。例えば、原色系のR(赤)/G(緑)/B(青)の各コンポーネントからなるRGB表色系や、補色系のY(黄)/M(マゼンタ)/C(シアン)の各コンポーネントからなるYMC表色系から、YUV或いはYCbCr表色系への変換又は逆の変換を行う部分がこれに相当する。
【0057】
図4は、タイル分割されたカラー画像の各コンポーネントの例を示す図である。
カラー画像は、一般に図4に示すように、原画像の各コンポーネント7,7,7(ここではRGB原色系)が、矩形をした領域(タイル)7Rt,7Gt,7Btによって分割される。そして、個々のタイル、例えば、R00,R01,...,R15/G00,G01,...,G15/B00,B01,...,B15が、圧縮伸張プロセスを実行する際の基本単位となる。このように、圧縮処理の対象となる画像データ(動画を扱う場合には各フレームの画像データ)は、コンポーネント毎にタイルと呼ばれる重複しない矩形領域に分割され、コンポーネント毎にタイルを単位として処理される。すなわち、圧縮伸張動作は、コンポーネント毎、そしてタイル毎に、独立に行なわれる。ただし、タイルサイズを画像サイズと同一にすること、つまりタイル分割を行わないことも可能である。
【0058】
このように、符号化時には、各コンポーネントの各タイルのデータが、圧縮率の向上を目的として図1の色空間変換部1に入力され、RGBデータやCMYデータからYCrCbデータへの色空間変換を施されたのち、色空間変換後の各コンポーネントの各タイル画像に対し2次元ウェーブレット変換部2で2次元ウェーブレット変換(順変換)が適用されて周波数帯に空間分割される。なお、この色空間変換が省かれる場合もある。
【0059】
図3を参照して、デコンポジションレベル数が3の場合の、2次元ウェーブレット変換部2での処理を説明する。2次元ウェーブレット変換部2では、まず、原画像のタイル分割によって得られた原画像タイル(0LL)(デコンポジションレベル0(6))に対して2次元ウェーブレット変換を施し、デコンポジションレベル1(6)に示すサブバンド1LL,1HL,1LH,1HHを分離する。すなわち、原画像タイル(6)がデコンポジションレベル1(6)に示すサブバンドに分割される。そして引き続き、この階層における低周波成分1LLに対して、2次元ウェーブレット変換を施し、デコンポジションレベル2(6)に示すサブバンド2LL,2HL,2LH,2HHを分離する。順次同様に、低周波成分2LLに対しても、2次元可逆ウェーブレット変換を施し、デコンポジションレベル3(6)に示すサブバンド3LL,3HL,3LH,3HHを分離する。ここで、各デコンポジションレベルにおいて符号化の対象となるサブバンドは、例えば、デコンポジションレベル数を3とした時、サブバンド3HL,3LH,3HH,2HL,2LH,2HH,1HL,1LH,1HHが符号化対象となり、3LLサブバンドは符号化されない。
【0060】
次いで、指定した符号化の順番で符号化の対象となるビットが定められ、図1の量子化部3で対象ビット周辺のビットからコンテキストが生成される。つまり、上述したような低周波成分(LLサブバンド係数)の再帰的分割(オクターブ分割)により得られたウェーブレット係数は、サブバンド毎に量子化・逆量子化部3にて量子化されることとなる。JPEG2000ではロスレス(可逆)圧縮とロッシー(非可逆)圧縮のいずれも可能であり、ロスレス圧縮の場合には量子化ステップ幅は常に1であり、この段階では量子化されない。量子化の処理が終わったウェーブレット係数は、例えば8bitの原画像に対し12bitに増える。
【0061】
続いて、エントロピー符号化部4では、コンテキストと対象ビットから確率推定によって、各コンポーネントのタイルに対する符号化を行う。こうして、原画像の全てのコンポーネントについて、タイル単位で符号化処理が行われる。量子化後の各サブバンド係数に対するこのエントロピー符号化には、ブロック分割、係数モデリング及び2値算術符号化からなるEBCOT(Embedded Block Coding with Optimized Truncation)と呼ばれる符号化方式が用いられ、量子化後の各サブバンド係数のビットプレーンが上位プレーンから下位プレーンへ向かって、コードブロックと呼ばれるブロック毎に符号化される。
【0062】
最後にタグ処理部5は、符号形成プロセスを行う。タグ処理部5で行う符号形成プロセスにおいては、エントロピー符号化部4からの全符号化データを1本のコードストリームに結合するとともに、それにタグを付加する処理を行う。タブ処理部5では、まず、エントロピー符号化部4で生成されたコードブロックの符号をまとめてパケットが生成され、ここで生成されたパケットがプログレッション順序に従って並べられるとともに必要なタグ情報が付加されることにより、所定のフォーマットの符号化データが作成される。なお、JPEG2000では、符号順序制御に関して、解像度レベル、プレシンクト(position)、レイヤ、コンポーネント(色成分)の組み合わせによる5種類のプログレッション順序が定義されている。
【0063】
ここで、エントロピー符号化部4におけるエントロピー符号化、及びタグ処理部5における符号形成プロセスの詳細を例を挙げて説明する。
量子化の処理が終わったウェーブレット係数は、個々のサブバンド毎に、「プレシンクト」と呼ばれる重複しない矩形に分割される。これは、インプリメンテーションでメモリを効率的に使うために導入されたものである。更に、個々のプレシンクトは、重複しない矩形の「コードブロック」に分けられる。
【0064】
ここで、プレシンクト、コードブロック、パケット、レイヤについて簡単に説明する。画像≧タイル≧サブバンド≧プレシンクト≧コードブロックの大きさ関係がある。
プレシンクトとは、サブバンドの矩形領域で、同じデコンポジションレベルのHL,LH,HHサブバンドの空間的に同じ位置にある3つの領域の組が1つのプレシンクトとして扱われる。ただし、LLサブバンドでは、1つの領域が1つのプレシンクトとして扱われる。プレシンクトのサイズをサブバンドと同じサイズにすることも可能である。また、プレシンクトを分割した矩形領域がコードブロックである。プレシンクトに含まれる全てのコードブロックの符号の一部(例えば最上位から3ビット目までの3枚のビットプレーンの符号)を取り出して集めたものがパケットである。符号が空(から)のパケットも許される。コードブロックの符号をまとめてパケットを生成し、所望のプログレッション順序に従ってパケットを並べることにより符号データを形成する。なお、後述するが、図9の各タイルに関するSOD以下の部分がパケットの集合である。全てのプレシンクト(つまり、全てのコードブロック、全てのサブバンド)のパケットを集めると、画像全域の符号の一部(例えば、画像全域のウェーブレット係数の最上位のビットプレーンから3枚目までのビットプレーンの符号)ができるが、これがレイヤである(ただし、次に示す例のように、必ずしも全てのプレシンクトのパケットをレイヤに含めなくともよい)。したがって、伸張時に復号されるレイヤ数が多いほど再生画像の画質は向上する。つまり、レイヤは画質の単位とも言える。全てのレイヤを集めると、画像全域の全てのビットプレーンの符号になる。
【0065】
図5は、プレシンクトとコードブロックの関係を説明するための図である。また、図6乃至図8は、デコンポジションレベル数が2(解像度レベル数=3)の場合のパケットとレイヤの一例を示す図で、図6は一般的なレイヤ構成例を、図7は複数の機器のそれぞれに応じたサムネイル出力が可能なレイヤ構成例を、図8は伝送路容量に応じたサムネイル出力が可能なレイヤ構成例を、それぞれ示している。
【0066】
量子化の処理が終わったウェーブレット係数は、個々のサブバンド毎にプレシンクトに分割されるが、図5に示したように、一つのプレシンクト(例えばプレシンクト8p4)は、空間的に一致した3つの矩形領域からなっている。プレシンクト8p6も同様である。すなわち、図5中のプレシンクトと記された空間的に同じ位置にある3つの領域の組が1つのプレシンクトとして扱われる。なお、ここで原画像8はデコンポジションレベル1でタイル8t0,8t1,8t2,8t3の4つのタイルに分割されている。更に、個々のプレシンクトは、重複しない矩形の「コードブロック」(プレシンクト8p4に対してはコードブロック84b0,84b1,...)に分けられる。これは、エントロピー符号化部4にてエントロピーコーディングを行う際の基本単位となる。
【0067】
符号化効率を上げるために、図6乃至図8で後に例示するように、係数値をビットプレーン単位に分解し、画素或いはコードブロック毎にビットプレーンに順序付けを行い、1又は複数のビットプレーンからなる層(レイヤ)を構成することもある。すなわち係数値のビットプレーンから、その有意性に基づいた層(レイヤ)を構成し、そのレイヤごとに符号化を行う。最も有意なレイヤである最上位レイヤ(MSB)とその下位レイヤを数レイヤだけ符号化し、最も有意でないレイヤ(MLB)を含んだそれ以外のレイヤをトランケートすることもある。
【0068】
図6を参照して、デコンポジションレベル数=2(解像度レベル数=3)の場合のパケットとレイヤの構成例(レイヤ数=10)を示す。図中の縦長の小さな矩形がパケットであり、その内部に示した数字はパケット番号である。レイヤを濃淡を付けた横長矩形領域として図示してある。すなわち、この例では、パケット番号0〜51のパケットの符号からなるレイヤ0、パケット番号52〜72のパケットの符号からなるレイヤ1、パケット番号73〜93のパケットの符号からなるレイヤ2、パケット番号94〜114のパケットの符号からなるレイヤ3、パケット番号115〜135のパケットの符号からなるレイヤ4、パケット番号136〜156のパケットの符号からなるレイヤ5、パケット番号157〜177のパケットの符号からなるレイヤ6、パケット番号178〜198のパケットの符号からなるレイヤ7、パケット番号199〜215のパケットの符号からなるレイヤ8、及び、残りのパケット番号216〜228のパケットの符号からなるレイヤ9の10レイヤに分割されている。なお、パケットとプレシンクトとの対応関係などは、プログレッション順序の違いやレイヤ分割数等により様々に変化するものであり、上に示したレイヤ構成はあくまで一例である。
【0069】
図7を参照して、複数の機器のそれぞれに応じたサムネイル出力が可能なレイヤ構成例を説明する。この例では、図6の構成例と同様のレイヤ構成をとるが、本発明の特徴部分であるヘッダ部分に、同一の濃淡で示したパケット番号2,10,18,26,54,75のパケットの符号からなるサムネイル情報(パケット番号2,10,18,26,54,75)を、例えばデジタルカメラのサムネイル出力用に記録しておく。同様に、画像ビューワソフトのサムネイル表示用のサムネイル情報として、情報「パケット番号96,117」をヘッダ部分に記録しておく。また、同様に、携帯電話における表示用のサムネイル情報として、情報「2LL」をヘッダ部分に記録しておく。
【0070】
図8を参照して、デコンポジションレベル数=2(解像度レベル数=3)の場合のパケットとレイヤの構成例として、伝送路容量に応じたサムネイル出力が可能なレイヤ構成例(レイヤ数=13)を説明する。この例では、同一の濃淡で示したパケット番号0〜3のパケットの符号からなるレイヤ0、同一の濃淡で示したパケット番号4〜11のパケットの符号からなるレイヤ1、同一の濃淡で示したパケット番号4〜7,12〜19のパケットの符号からなるレイヤ2、同一の濃淡で示したパケット番号12〜15,20〜51のパケットの符号からなるレイヤ3、同一の濃淡で示したパケット番号52〜72のパケットの符号からなるレイヤ4、同一の濃淡で示したパケット番号73〜93のパケットの符号からなるレイヤ5、同一の濃淡で示したパケット番号94〜114のパケットの符号からなるレイヤ6、同一の濃淡で示したパケット番号115〜135のパケットの符号からなるレイヤ7、同一の濃淡で示したパケット番号136〜156のパケットの符号からなるレイヤ8、同一の濃淡で示したパケット番号157〜177のパケットの符号からなるレイヤ9、同一の濃淡で示したパケット番号178〜198のパケットの符号からなるレイヤ10、同一の濃淡で示したパケット番号199〜215のパケットの符号からなるレイヤ11、及び、同一の濃淡で示した残りのパケット番号216〜228のパケットの符号からなるレイヤ12の13レイヤに分割されている。なお、パケットとプレシンクトとの対応関係などは、プログレッション順序の違いやレイヤ分割数等により様々に変化するものであり、上に示したレイヤ構成はあくまで一例である。
【0071】
図6乃至図8のいずれのレイヤ構成例も、パケットとして、符号データを分割しておき、パケット番号の小さいものから順番に所定サイズになるまでパケットを追加していき、所定サイズになったところまでを1レイヤとしている。また、ここで示したレイヤ構成例では、サブビットプレーンとして1bitをRefinement,Significant,Cleanupの3つに分割した例を示しているが、サブビットプレーンでさらに細かく分割しておけば、より細かい制御が可能である。さらに、パケットの優先度の順番を入れ替えることにより、解像度を重視した順番、画質を重視した順番、位置を重視した順番などに変更可能となる。なお、図6乃至図8で示したレイヤ構成例は、図2のステップS5と共に図示したものに対応している。
【0072】
図9には、符号形成プロセスにて生成されるJPEG2000の符号化データのフォーマット(コードストリームの構造)を簡単に示している。この符号化データは、各種のタグ情報が付加されている。すなわち、図9に見られるように、符号化データは、コードストリームの始まりを示すSOCマーカ9で始まり、その後に符号化パラメータや量子化パラメータ等を記述したメインヘッダ(Main Header)9が続き、その後に各タイル毎の符号データが続く。各タイル毎の符号データは、SOTマーカ9stで始まり、タイルヘッダ(Tile Header)9th、SODマーカ9sd、タイルデータ(Tile Data;符号化データ(ビットストリーム9))で構成される。そして、コードストリームの終端(最後のタイルデータの後)には、再び、終了を示すタグ(EOCタグ9)が置かれる。
【0073】
図10は、図9のメインヘッダの構成を示す図である。
図10に示すように、図9のメインヘッダ9は、画像とタイルのサイズ(SIZ)に続いて、デフォルト符号スタイル(COD;必須)、符号スタイル成分(COC)、デフォルト量子化(QCD;必須)、量子化成分(QCC)、ROI(RGN)、デフォルトプログレッシブ順序(POC)、集約パケット(PPM)、タイル長(TLM)、パケット長(PLM)、色定義(CRG)、コメント(COM)から構成される。SIZ及び必須と示したマーカセグメント(COD,QCD)以外は、オプションとなる。
【0074】
図11は、JPEG2000の基本方式のファイルフォーマットの構成を示す図である。
JPEG2000の基本方式のファイルフォーマットはJP2ファイルフォーマットと称し、図9で説明したJPEG2000符号フォーマットを包含するものであり、画像データやメタデータ、階調数や色空間等の画像の性質を表す情報、知的所有権情報等の情報を含むことを目的としたフォーマットである。JP2ファイルフォーマットで構成されたJP2ファイルの情報構造は、boxと称する情報の区切りから構成され、metadataと称するアプリケーションに特化した情報を含む。JP2ファイルの情報構造は、図11に実線(必須)と破線(オプション)で示すように、JPEG2000 Signature box,File Type box,JP2 Header box,Contiguous Codestream boxからなる。詳細は図示の通りである。
【0075】
一方、復号化時には、符号化時とは逆に、各コンポーネントの各タイルのコードストリームから画像データを生成する。図1を用いて簡単に説明する。この場合、タグ処理部5は、外部より入力したコードストリームに付加されたタグ情報を解釈し、コードストリームを各コンポーネントの各タイルのコードストリームに分解し、その各コンポーネントの各タイルのコードストリーム毎に復号化処理が行われる。コードストリーム内のタグ情報に基づく順番で復号化の対象となるビットの位置が定められるとともに、逆量子化部3で、その対象ビット位置の周辺ビット(既に復号化を終えている)の並びからコンテキストが生成される。エントロピー復号化部4で、このコンテキストとコードストリームから確率推定によって復号化を行い対象ビットを生成し、それを対象ビットの位置に書き込む。
【0076】
このようにして復号化されたデータは各周波数帯域毎に空間分割されているため、これを2次元ウェーブレット逆変換部2で2次元ウェーブレット逆変換を行うことにより、画像データの各コンポーネントの各タイルが復元される。復元されたデータは色空間逆変換部1によって元の表色系のデータに変換される。
【0077】
以下、本発明の実施の形態について詳細に説明する。
図12は、本発明の一実施形態に係る画像処理装置の構成例を説明するための機能ブロック図で、図13は、図12における画像処理方法を説明するためのフロー図である。なお、図13は、本発明の一実施形態に係る画像処理方法の手順例を説明するためのフロー図でもある。
【0078】
本発明に係る画像処理装置は、複数の静止画像から1つの動画像ファイルを生成する画像処理装置であり、複数の静止画像の再生順序を設定する画像順序設定手段と、該設定された順序に従って個々の静止画像の格納位置などを示したデータをファイルのヘッダ部分に付加するデータ付加手段と、を有するものとする。ここで、再生順序としての表示順序と共に、各静止画像の表示間隔を設定することも可能とすることで1枚当りの表示時間を設定できる。ここで、画像順序設定手段は、複数の静止画像の中から動画像のサムネイルとして使用する静止画像を、動画用サムネイル情報として設定する動画用サムネイル設定手段を有し、さらに、データ付加手段は、動画用サムネイル設定手段で設定された動画用サムネイル情報を、ファイルのヘッダ部分に付加する動画用サムネイル情報付加手段を有するようにするとよい。
【0079】
本実施形態で説明するより好適な例では、画像処理装置20が、静止画像の圧縮符号データを生成する画像圧縮手段を有するものとする。さらに、データ付加手段は、サムネイル設定手段及びサムネイル情報付加手段を含むものとする。サムネイル設定手段では、個々の静止画像のサムネイル情報を、1又は複数形態設定する。また、サムネイル情報付加手段では、設定された形態のサムネイル情報を、個々の静止画像の符号データ形成時にヘッダ部分に付加する。ここで付加するサムネイル情報は、例えば、図7で例示したような情報である。図12では、画像処理装置20が、画像読込部21、サムネイル情報設定手段をもつサムネイル設定部22、画質圧縮部23、サムネイル情報付加手段をもつサムネイル情報付加部24、画像順序設定手段をもつ動画用サムネイル設定部25、動画用サムネイル情報付加手段をもつ動画用サムネイル情報付加部26、及び、符号生成部27より構成されているものとして説明する。
【0080】
画像処理装置20は、複数の画像データ(或いはそれらからなる動画データ)を画像読込部21で読み込み(ステップS11)、サムネイル設定部22でサムネイル情報を設定する(ステップS12)。勿論、サムネイル設定部22にて予め設定するサムネイル情報を設定しておいてもよい。続いて、画質圧縮部23にて画像を圧縮する(ステップS13)。次に、サムネイル情報付加部24にて設定に応じたサムネイル情報を付加する(ステップS14)。次に、動画用サムネイル設定部25では、複数の静止画像の中から動画像のサムネイルとして使用する静止画像を、動画用サムネイル情報として設定(ユーザ設定でもよい)する(ステップS15)。そして、動画用サムネイル情報付加部26にて動画用サムネイル設定部25で設定された動画用サムネイル情報を、画像データの纏まりとしてのファイルのヘッダ部分(パケットヘッダ)に付加する(ステップS16)。最後に、このファイルに対し、符号生成部27にて符号データを生成する(ステップS17)。ステップS14,S15は任意のタイミングで行なってもよく、例えば、ステップS11の後で行なってサムネイル設定の際の制限(動画用サムネイルで使用する静止画像に対してのみサムネイルを作成しておく等の制限)などを与えてもよい。なお、ここでは、サムネイル情報付加手段がサムネイル情報付加部24にあり、サムネイル情報を付加した後に、符号生成部27にて符号を生成するような構成例を説明するが、符号生成中にサムネイル情報を付加してもよい。これらにより、動画のサムネイル表示を結果的に高速に行なうことができるだけでなく、実施の形態によっては、カメラの液晶などの表示画面などの1つのビューワで、動画と静止画を同時にサムネイル表示することも可能である。さらに、撮影画像のサムネイルは静止画である場合が多いが、動画を撮影した場合は動画でサムネイルされていれば、どのような映像であったかを確かめることもできる。
【0081】
また、個々の静止画像に対するサムネイル情報の記録場所の候補例としては、図10におけるCOMマーカ、図11におけるファイルフォーマットXMLboxes、同じくファイルフォーマットUUIDboxesなどが挙げられるが、他の記録場所を採用してもよい。XMLの記述例を以下に示す。
【0082】
Figure 2004289374
【0083】
図14は、図12の画像処理装置において設定するサムネイル情報の一例を示す図である。
画像処理装置20では、個々の静止画像のサムネイル情報として、画像の解像度情報、画像の位置情報、画像のコンポーネント情報、画像の画質情報、画像のサブバンド情報のうちいずれかを用いるようにするとよい。また、いずれか1ではなく、複数の情報を組み合わせて用いてもよい。
【0084】
解像度情報としては、例えば、画像のデコンポジションレベル情報を用いればよい。また、位置情報としては、例えば、タイル情報,プレシンクト情報,コードブロック情報,画素位置情報のうち、いずれか1又は複数を用いるようにすればよい。さらに、画質情報としては、例えば、レイヤ情報及び/又はビットプレーン情報を用いるようにすればよい。図14では、表示装置(処理速度bps)31に対応するサムネイル32の対応表30を例示しているが、例えば、デジタルカメラに対しては、中心部タイル及び/又はレイヤ3を設定しておけばよい。同様に、画像ビューワソフトに対してはデコンポジションレベル3及び/又はレイヤ5を設定し、携帯電話に対してはデコンポジションレベル5を設定し、デジタルビデオカメラに対してはフレーム番号2N+1及び/又はデコンポジションレベル3を設定し、TV放送に対しては全フレーム、タイル6,7,10,11、デコンポジションレベル3のうちいずれか1又は複数を設定し、ハイビジョン放送に対しては全フレーム及び/又はデコンポジションレベル3を設定しておけばよい。ここで示した例の組み合わせは、単なる一例でありその他の組み合わせも適宜行われるべきである。例えば、表示装置(或いは印刷装置や伝送装置)の処理速度の進化により適宜変更されるべきものである。
【0085】
図15及び図16は、本発明の一実施形態に係る画像出力装置又は画像伸張装置における処理結果を示すための図である。図15は、原画像の一例を示し、図16は図15の原画像を本発明に係る画像処理装置で圧縮し、画像出力装置又は画像伸張装置で出力した結果の1枚の静止画像を示している。
【0086】
図15の原画像40に対し、サムネイルとして低解像度画像を指定した場合、図16(A)の画像41のように出力される。同様に、例えば、サムネイルとして1コンポーネントを指定した場合には図16(B)の画像42が出力され、サムネイルとしてレイヤ0のみを指定した場合には図16(C)の画像43が出力され、サムネイルとして中心部タイルを指定した場合には図16(D)の画像44が出力される。
【0087】
本実施形態に係る画像処理装置によれば、各静止画像に対し、圧縮された画像データのデータ容量を大きくすることなく、画像データのサムネイルを高速に出力する可能な圧縮画像データを生成することが可能となる。さらに、ヘッダ情報に複数の形態のサムネイル情報を記録しておくことで、複数の形態のサムネイルを出力可能な一連の圧縮符号データを生成することが可能となる。また、本発明に係る画像出力装置又は画像伸張装置によれば、各静止画像に対し、入力する圧縮画像データのデータ容量を大きくすることなく、画像データのサムネイルを高速に出力することが可能となる。これらの装置はネットワークを介して画像を配信する画像配信システムなどに適用できる。
【0088】
図17は、本発明の他の実施形態に係る画像処理装置を説明するための概略図で、図17(A)は画像ビューワでの表示例を、図17(B)は本発明に係る動画像データのデータ構造を、図17(C)は図17(B)の個々の静止画像のデータ構造を、それぞれ示している。
【0089】
また、図12で例示した画像処理装置20において生成した動画像データ51は、画像のサムネイルを取り出す画像出力装置でサムネイルを取り出すようにすればよい。動画像データ(動画ファイル)51は、そのヘッダ部分51hに動画像サムネイルの情報を含み、その後に、個々の一連の静止画像データ51,51,51,...が続く。各静止画像データ(1枚目の静止画像データ51,2枚目の静止画像データ51,3枚目の静止画像データ51,)は、それぞれ、ヘッダ情報51a,51b,51cと、画像データ51A,51B,51Cとからなっている。図17(C)に示すように、個々の静止画像データは、ヘッダ情報(JP2 Header),JPEG2000符号情報(静止画)の他に、映像表示用のメタデータ(moov),moovの補足データ(moof),映像・音声の符号情報(mdat)からなっている。
【0090】
この本発明の一実施形態に係る画像出力装置は、画像処理装置で生成した一連の圧縮符号データから、各圧縮符号データのヘッダ部分に記録されたサムネイル情報を元に、符号データの一部を切り出す手段を有するようにしておくとよい。この手段は、サムネイル情報に基づいたサムネイルを伸張して出力するだけでなく、原画像又はサムネイル以外の縮小画像や拡大画像なども伸張して出力することを可能とした手段であり、上述のヘッダ部分を解釈可能なよう構成すればよい。なお、サムネイル情報が複数の形態で記録されている圧縮符号データを出力する際にはユーザ側で選択可能にしておけばよい。
【0091】
さらに、図12で例示した画像処理装置20において生成した動画像データは、画像のサムネイルを出力する画像伸張装置でサムネイルを出力するようにしてもよい。この本発明の一実施形態に係る画像伸張装置は、画像処理装置で生成した一連の圧縮符号データから、各圧縮符号データのヘッダ部分に記録されたサムネイル情報を元に、符号データからサムネイル部分のみを伸張し出力する手段を有するようにしておくとよい。この手段は、上述のヘッダ部分を解釈可能なよう構成すればよい。なお、サムネイル情報が複数の形態で記録されている圧縮符号データを出力する際にはユーザ側で選択可能にしておけばよい。
【0092】
また、本発明は、画像処理装置20の圧縮機能の有無に拘らず、そこで生成されたファイルを、その再生順序に従って出力する画像出力装置としての形態も採用可能である。さらに、画像処理装置20の圧縮機能の有無に拘らず、そこで生成されたファイルを、動画用サムネイル情報に基づき、サムネイル動画像を出力する画像出力装置としての形態も採用可能である。
【0093】
いずれの形態でも、動画としてのサムネイル(サムネイル動画)も出力(表示等)することが可能となる。サムネイル動画としては、所定の場所の複数枚の静止画像からなってもよいし、一部又は全部の静止画像サムネイルからなってもよい。後者の場合には、上述した画像圧縮手段を兼ね備えることでより高速に出力が可能となる。このように高速なサムネイル動画の表示が可能となるので、図17(A)の表示例で示す画像ビューワのように、動画データ51,54と静止画データ52,53との同時表示も見栄えよくできる。
【0094】
以上、本発明の画像処理装置、画像出力装置(画像表示装置を含む)、及び画像伸張装置を中心に各実施形態を説明してきたが、本発明は、一部フロー図としても説明したように、それらの装置における処理手順を含んでなる画像処理方法、画像出力方法(画像表示方法を含む)、画像伸張方法としても、或いは、コンピュータをそれら装置として又はそれらの装置の各手段として機能させるための、又はコンピュータにそれら方法を実行させるためのプログラム(それらの処理内容が実装されているコンピュータプログラム)としても、或いは、そのプログラムを記録したコンピュータ読み取り可能な記録媒体(それらの処理内容が記録されているコンピュータ読み取り可能な情報記録媒体)としての形態も可能である。また、このプログラムや記録媒体により、上述の各実施形態に対応した処理によって、上述した装置と同様の効果を持ったシステムを提供することができる。これらのプログラムや記録媒体は、上述した実施形態に加え、後述する実施例を元に容易に実施できることは明らかである。
【0095】
本発明による画像処理又は画像出力又は画像伸張の機能を実現するためのプログラムやデータを記憶した記録媒体の実施形態を説明する。記録媒体としては、具体的には、CD−ROM、光磁気ディスク、DVD−ROM、FD、フラッシュメモリ、及びその他各種ROMやRAM等が想定でき、これら記録媒体に上述した本発明の各実施形態に係る機能をコンピュータに実行させ、画像の処理,出力,伸張のいずれか1又は複数の機能を実現するためのプログラムを記録して流通させることにより、当該機能の実現を容易にする。そしてコンピュータ(汎用コンピュータやその他の機器)等の情報処理装置に上記のごとくの記録媒体を装着して情報処理装置によりプログラムを読み出し、そのまま起動させるか機器に伝送するか、若しくは情報処理装置が備えている記憶媒体に当該プログラムを記憶させておき、必要に応じて読み出すことにより、本発明に関わる機能を実行することができる。
【0096】
ここで上述した各実施形態に適用可能な装置の構成例を説明する。
図18は、本発明に係る画像処理装置の一構成例を示す図である。
ここで例示する本発明に係る画像処理装置は、データバス63を介して、RAM61,CPU62,HDD64が接続された構成となっており、以下の流れで、原画像の画像データ(ここでは動画像データを例示)から、サムネイル情報及び動画サムネイル情報が付加された圧縮画像データが生成され、HDD64に保存されることとなる。
【0097】
HDD64上に記録された原画像の画像データ(又は圧縮された画像データ;ここでは静止画の連続としての動画像データ)が、CPU62からの命令によってRAM61上に読み込まれる(i)。次に、CPU62はRAM61上の画像データを読み込み、ウェーブレット係数を求め、本発明に係る動画又は動画及び静止画のサムネイル情報付加処理を適用して圧縮画像データを生成する(ii)。CPU62は、生成された圧縮画像データをRAM61上の別の領域に書き込む(iii)。CPU62からの命令によって、圧縮画像データ(動画又は動画及び静止画のサムネイル情報付きのMJ2データ)がHDD64上に記録される(iv)。画像出力装置又は画像伸張装置側では、この圧縮画像データを表示,印刷,伝送など出力する際にヘッダ部分に記載されたサムネイル情報からサムネイル出力が可能となる。図18で例示した画像処理装置は、画像出力装置又は画像伸張装置を兼ねてもよいし、また、画像出力装置又は画像伸張装置は図18で例示した画像処理装置と同様の構成を持つものでもよい。
【0098】
【発明の効果】
本発明によれば、静止画像の連続としての動画像に対し、動画としてのサムネイルを高速に出力することが可能な動画像データを生成することが可能となる。
【0099】
また、本発明によれば、静止画像の連続としての動画像に対し、個々の圧縮画像データのデータ容量を大きくすることなく、個々の画像データのサムネイルの連続としてのサムネイル動画を高速に出力することが可能となる。
【図面の簡単な説明】
【図1】JPEG2000の基本となる階層符号化・復号化アルゴリズムを説明するためのブロック図である。
【図2】JPEG2000のアルゴリズムを説明するための簡略化されたフロー図である。
【図3】デコンポジションレベル数が3の場合の、各デコンポジションレベルにおけるサブバンドを示す図である。
【図4】タイル分割されたカラー画像の各コンポーネントの例を示す図である。
【図5】プレシンクトとコードブロックの関係を説明するための図である。
【図6】デコンポジションレベル数が2(解像度レベル数=3)の場合のパケットとレイヤの一例を示す図で、一般的なレイヤ構成例を示す図である。
【図7】デコンポジションレベル数が2(解像度レベル数=3)の場合のパケットとレイヤの一例を示す図で、複数の機器のそれぞれに応じたサムネイル出力が可能なレイヤ構成例を示す図である。
【図8】デコンポジションレベル数が2(解像度レベル数=3)の場合のパケットとレイヤの一例を示す図で、伝送路容量に応じたサムネイル出力が可能なレイヤ構成例を示す図である。
【図9】符号形成プロセスにて生成されるJPEG2000の符号化データのフォーマット(コードストリームの構造)を簡単に示す図である。
【図10】図9のメインヘッダの構成を示す図である。
【図11】JPEG2000の基本方式のファイルフォーマットの構成を示す図である。
【図12】本発明の一実施形態に係る画像処理装置の構成例を説明するための機能ブロック図である。
【図13】図12における画像処理方法を説明するためのフロー図で、本発明の一実施形態に係る画像処理方法の手順例を説明するためのフロー図でもある。
【図14】図12の画像処理装置において設定するサムネイル情報の一例を示す図である。
【図15】原画像の一例を示す図である。
【図16】図15の原画像を本発明に係る画像処理装置で圧縮し、画像出力装置又は画像伸張装置で出力した結果の1枚の静止画像を示す図である。
【図17】本発明の他の実施形態に係る画像処理装置を説明するための概略図である。
【図18】本発明に係る画像処理装置の一構成例を示す図である。
【符号の説明】
1…色空間変換・逆変換部、2…2次元ウェーブレット変換・逆変換部、3…量子化・逆量子化部、4…エントロピー符号化・復号化部、5…タグ処理部、20…画像処理装置、21…画像読込部、22…サムネイル設定部、23…画質圧縮部、24…サムネイル情報付加部、25…動画用サムネイル設定部、26…動画用サムネイル情報付加部、27…符号生成部、61…RAM、62…CPU、63…データバス、64…HDD。

Claims (33)

  1. 複数の静止画像から1つの動画像ファイルを生成する画像処理装置であって、複数の静止画像の再生順序を設定する画像順序設定手段と、該設定された順序に従って個々の静止画像の格納位置などを示したデータを前記ファイルのヘッダ部分に付加するデータ付加手段と、を有することを特徴とする画像処理装置。
  2. 前記画像順序設定手段は、前記複数の静止画像の中から動画像のサムネイルとして使用する静止画像を、動画用サムネイル情報として設定する動画用サムネイル設定手段を有し、前記データ付加手段は、前記動画用サムネイル設定手段で設定された動画用サムネイル情報を、前記ファイルのヘッダ部分に付加する動画用サムネイル情報付加手段を有することを特徴とする請求項1記載の画像処理装置。
  3. 当該画像処理装置は、静止画像の圧縮符号データを生成する画像圧縮手段を有し、前記データ付加手段は、個々の静止画像のサムネイル情報を、1又は複数形態設定するサムネイル設定手段と、該設定された形態のサムネイル情報を、個々の静止画像の符号データ形成時にヘッダ部分に付加するサムネイル情報付加手段と、を有することを特徴とする請求項1又は2記載の画像処理装置。
  4. 前記サムネイル情報として、画像の解像度情報を用いることを特徴とする請求項3記載の画像処理装置。
  5. 前記解像度情報として、画像のデコンポジションレベル情報を用いることを特徴とする請求項4記載の画像処理装置。
  6. 前記サムネイル情報として、画像の位置情報を用いることを特徴とする請求項3乃至5のいずれか1記載の画像処理装置。
  7. 前記位置情報として、タイル情報,プレシンクト情報,コードブロック情報,画素位置情報のうち、いずれか1又は複数を用いることを特徴とする請求項6記載の画像処理装置。
  8. 前記サムネイル情報として、画像のコンポーネント情報を用いることを特徴とする請求項3乃至7のいずれか1記載の画像処理装置。
  9. 前記サムネイル情報として、画像の画質情報を用いることを特徴とする請求項3乃至8のいずれか1記載の画像処理装置。
  10. 前記画質情報として、レイヤ情報及び/又はビットプレーン情報を用いることを特徴とする請求項9記載の画像処理装置。
  11. 前記サムネイル情報として、画像のサブバンド情報を用いることを特徴とする請求項3乃至10のいずれか1記載の画像処理装置。
  12. 画像のサムネイルを出力する画像伸張装置であって、請求項3乃至11のいずれか1記載の画像処理装置で生成した一連の圧縮符号データから、各圧縮符号データのサムネイル情報を元に、符号データからサムネイル部分のみを伸張し出力する手段を有することを特徴とする画像伸張装置。
  13. 画像のサムネイルを取り出す画像出力装置であって、請求項3乃至11のいずれか1記載の画像処理装置で生成した一連の圧縮符号データから、各圧縮符号データのサムネイル情報を元に、符号データの一部を切り出す手段を有することを特徴とする画像出力装置。
  14. 請求項1乃至11のいずれか1記載の画像処理装置で生成されたファイルを、前記再生順序に従って出力する画像出力装置。
  15. 請求項2記載の画像処理装置で生成されたファイルを、前記動画用サムネイル情報に基づき、サムネイル動画像を出力する画像出力装置。
  16. 複数の静止画像から1つの動画像ファイルを生成する画像処理方法であって、複数の静止画像の再生順序を設定する画像順序設定ステップと、該設定された順序に従って個々の静止画像の格納位置などを示したデータを前記ファイルのヘッダ部分に付加するデータ付加ステップと、を有することを特徴とする画像処理方法。
  17. 前記画像順序設定ステップは、前記複数の静止画像の中から動画像のサムネイルとして使用する静止画像を、動画用サムネイル情報として設定する動画用サムネイル設定ステップを有し、前記データ付加ステップは、前記動画用サムネイル設定ステップで設定された動画用サムネイル情報を、前記ファイルのヘッダ部分に付加する動画用サムネイル情報付加ステップを有することを特徴とする請求項16記載の画像処理方法。
  18. 当該画像処理方法は、静止画像の圧縮符号データを生成する画像圧縮ステップを有し、前記データ付加ステップは、個々の静止画像のサムネイル情報を、1又は複数形態設定するサムネイル設定ステップと、該設定された形態のサムネイル情報を、個々の静止画像の符号データ形成時にヘッダ部分に付加するサムネイル情報付加ステップと、を有することを特徴とする請求項16又は17記載の画像処理方法。
  19. 前記サムネイル情報として、画像の解像度情報を用いることを特徴とする請求項18記載の画像処理方法。
  20. 前記解像度情報として、画像のデコンポジションレベル情報を用いることを特徴とする請求項19記載の画像処理方法。
  21. 前記サムネイル情報として、画像の位置情報を用いることを特徴とする請求項18乃至20のいずれか1記載の画像処理方法。
  22. 前記位置情報として、タイル情報,プレシンクト情報,コードブロック情報,画素位置情報のうち、いずれか1又は複数を用いることを特徴とする請求項21記載の画像処理方法。
  23. 前記サムネイル情報として、画像のコンポーネント情報を用いることを特徴とする請求項18乃至22のいずれか1記載の画像処理方法。
  24. 前記サムネイル情報として、画像の画質情報を用いることを特徴とする請求項18乃至23のいずれか1記載の画像処理方法。
  25. 前記画質情報として、レイヤ情報及び/又はビットプレーン情報を用いることを特徴とする請求項24記載の画像処理方法。
  26. 前記サムネイル情報として、画像のサブバンド情報を用いることを特徴とする請求項18乃至25のいずれか1記載の画像処理方法。
  27. 画像のサムネイルを出力する画像伸張方法であって、請求項18乃至26のいずれか1記載の画像処理方法で生成した一連の圧縮符号データから、各圧縮符号データのサムネイル情報を元に、符号データからサムネイル部分のみを伸張し出力するステップを有することを特徴とする画像伸張方法。
  28. 画像のサムネイルを取り出す画像出力方法であって、請求項18乃至26のいずれか1記載の画像処理方法で生成した一連の圧縮符号データから、各圧縮符号データのサムネイル情報を元に、符号データの一部を切り出すステップを有することを特徴とする画像出力方法。
  29. 請求項16乃至26のいずれか1記載の画像処理方法で生成されたファイルを、前記再生順序に従って出力する画像出力方法。
  30. 請求項17記載の画像処理方法で生成されたファイルを、前記動画用サムネイル情報に基づき、サムネイル動画像を出力する画像出力方法。
  31. 請求項1乃至11のいずれか1記載の画像処理装置として、或いは請求項12記載の画像伸張装置として、或いは請求項13乃至15のいずれか1記載の画像出力装置として、コンピュータを機能させるためのプログラム。
  32. 請求項16乃至26のいずれか1記載の画像処理方法、或いは請求項27記載の画像伸張方法、或いは請求項28乃至30のいずれか1記載の画像出力方法、をコンピュータに実行させるためのプログラム。
  33. 請求項31又は32記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2003077393A 2003-02-20 2003-03-20 画像処理装置、画像処理方法、プログラム、及び記録媒体 Pending JP2004289374A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2003077393A JP2004289374A (ja) 2003-03-20 2003-03-20 画像処理装置、画像処理方法、プログラム、及び記録媒体
US10/783,632 US7526144B2 (en) 2003-02-20 2004-02-20 Image processing method, image expansion method, image output method, image conversion method, image processing apparatus, image expansion apparatus, image output apparatus, image conversion apparatus, and computer-readable storage medium
CNB2004100330648A CN100531292C (zh) 2003-02-20 2004-02-20 图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003077393A JP2004289374A (ja) 2003-03-20 2003-03-20 画像処理装置、画像処理方法、プログラム、及び記録媒体

Publications (1)

Publication Number Publication Date
JP2004289374A true JP2004289374A (ja) 2004-10-14

Family

ID=33292154

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003077393A Pending JP2004289374A (ja) 2003-02-20 2003-03-20 画像処理装置、画像処理方法、プログラム、及び記録媒体

Country Status (1)

Country Link
JP (1) JP2004289374A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006115407A (ja) * 2004-10-18 2006-04-27 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記憶媒体
JP7483091B2 (ja) 2013-07-22 2024-05-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 再生方法および再生装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006115407A (ja) * 2004-10-18 2006-04-27 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記憶媒体
JP7483091B2 (ja) 2013-07-22 2024-05-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 再生方法および再生装置

Similar Documents

Publication Publication Date Title
JP2004248152A (ja) 画像圧縮装置、画像伸張装置、画像圧縮方法、画像伸張方法、プログラム、及び記録媒体
JP4349816B2 (ja) 画像処理装置、画像圧縮装置、画像処理方法、画像圧縮方法、プログラム、及び記録媒体
JP4111926B2 (ja) 画像処理装置、プログラム、記憶媒体及び画像送信方法
JP4148462B2 (ja) 画像処理装置、電子カメラ装置及び画像処理方法
TWI436286B (zh) 畫像解碼方法及裝置
US7526144B2 (en) Image processing method, image expansion method, image output method, image conversion method, image processing apparatus, image expansion apparatus, image output apparatus, image conversion apparatus, and computer-readable storage medium
JP3922919B2 (ja) 静止画像伸長装置及び静止画像伸長方法
JP2004088425A (ja) 符号変換装置、符号変換方法、プログラム及び記憶媒体
JP4898513B2 (ja) クライアント・サーバシステム
US20030068089A1 (en) Image processing system processing code data
JP2004254298A (ja) 画像処理装置、プログラム及び記憶媒体
JP5950157B2 (ja) 画像処理装置および方法、並びに、プログラム
US7492951B2 (en) Image processing method and apparatus, and computer-readable storage medium
JP4073333B2 (ja) 画像圧縮装置及び画像圧縮方法
JP2005092007A (ja) 画像処理システム、画像処理方法、プログラム及び情報記録媒体
JP4208122B2 (ja) データ処理装置及びデータ処理方法
JP3914197B2 (ja) 情報処理装置、情報処理方法、プログラム及びコンピュータ読取り可能な記録媒体
JP2004289374A (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP2004247891A (ja) 画像圧縮装置、画像処理装置、画像伸張装置、画像圧縮方法、画像処理方法、画像伸張方法、プログラム、及び記録媒体
JP2004254101A (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP4124436B2 (ja) 動き量推定装置、プログラム、記憶媒体および動き量推定方法
JP3961966B2 (ja) 不要部除去装置、画像処理装置、プログラム、記憶媒体及び不要部除去方法
JP2004254035A (ja) 撮影リスト情報記録装置、画像入力装置、撮影リスト情報記録方法、画像入力方法、プログラム、及び記録媒体
JP4374063B2 (ja) 画像処理装置、プログラム及び記憶媒体
JP4093870B2 (ja) 画像処理装置、プログラムおよび記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050928

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090609