JP4164268B2 - 符号化装置、符号化方法、プログラム、記憶媒体 - Google Patents

符号化装置、符号化方法、プログラム、記憶媒体 Download PDF

Info

Publication number
JP4164268B2
JP4164268B2 JP2002063555A JP2002063555A JP4164268B2 JP 4164268 B2 JP4164268 B2 JP 4164268B2 JP 2002063555 A JP2002063555 A JP 2002063555A JP 2002063555 A JP2002063555 A JP 2002063555A JP 4164268 B2 JP4164268 B2 JP 4164268B2
Authority
JP
Japan
Prior art keywords
image
encoding
tiles
data
dividing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002063555A
Other languages
English (en)
Other versions
JP2003264834A (ja
JP2003264834A5 (ja
Inventor
崇 荒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002063555A priority Critical patent/JP4164268B2/ja
Publication of JP2003264834A publication Critical patent/JP2003264834A/ja
Publication of JP2003264834A5 publication Critical patent/JP2003264834A5/ja
Application granted granted Critical
Publication of JP4164268B2 publication Critical patent/JP4164268B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、静止画、動画の両方を符号化する符号化装置、符号化方法、プログラム、記憶媒体に関するものである。
【0002】
【従来の技術】
従来のデジタルカメラ、ビデオカメラには、静止画像、動画像共にDCT(離散コサイン変換)ベースの圧縮処理(所謂JPEG)が用いられている。これについて、図20のブロック図を用いて説明する。
【0003】
図20は従来のディジタルカメラ、ビデオカメラにおいて、撮像された画像に対して符号化を行う符号化部の構成を示すブロック図である。131は撮像した画像を8×8画素のサイズのブロック(DCT(離散コサイン変換)ブロック)に分割するブロック化処理回路、133は各ブロックに直交変換を施すDCT処理回路、134は直交変換後のデータに対して量子化を施す量子化処理回路、135は低い周波数から高い周波数へ量子化されたデータをスキャンするジグザグスキャン回路、136はジグザグスキャン回路135によりスキャンされたデータに対して2次元ハフマン符号を行うハフマン符号化処理回路、137は量子化の係数を決定する係数設定回路、138は上記各処理回路を制御するシステムコントローラである。
【0004】
撮像され、カメラに入力された画像信号は不図示のY/C分離回路によって輝度と色差信号に分離される。色差信号に対してはサブサンプリング処理を施す。輝度信号と色差信号はブロック化処理回路131に入力され、各々8×8画素から成るブロックに分割される。ブロック分割された輝度信号と色差信号はDCT処理回路133によりDCT変換を施され、周波数係数データに変換される。DCT処理回路133から出力された各々の周波数係数データは量子化処理回路134に入力され、量子化処理回路134は周波数成分毎のデータ係数の集合を係数設定回路137から生成した適当な数値にて除算することで、量子化処理を行う。量子化されたデータはジグザグスキャン回路135に入力され、ジグザグスキャン回路135は低い周波数から高い周波数へデータをスキャンし2次元データを1次元データに変換する。
【0005】
ハフマン符号化処理回路136はこの1次元データに対してハフマン符号処理を施し(可変長符号化)、不図示の記録部に出力する。この様な圧縮処理により元データに比べ5分の1から10分の1程度に圧縮することを可能としていた。
【0006】
【発明が解決しようとする課題】
しかしながら上記従来例においては、次のような問題があった。つまり、上記圧縮処理は基本的に動画像に関しても同一であり、動画/静止画両対応カメラにおいて、動画モード/静止画モードでそれぞれの特徴に沿った圧縮処理を行っていなかった。
【0007】
本発明は上記問題に鑑みてなされたものであり、画像をタイル分割して符号化する処理において、さまざまな画像(動画/静止画)に対して効率よく符号化することができる符号化装置、符号化方法、プログラム及びそのプログラムを記憶した記憶媒体を提供することを目的とする。
【0008】
【課題を解決するための手段】
本発明の目的を達成するために、例えば本発明の符号化装置は以下の構成を備える。すなわち、画像に対して符号化を行う符号化装置であって、
画像を複数のタイルに分割する分割手段と、
前記分割手段による各タイルに対して周波数変換を施し、周波数帯域毎の変換係数を生成する周波数変換手段と、
前記周波数変換手段による変換係数、もしくはその量子化値に対してエントロピ符号化を施すエントロピ符号化手段と、
前記エントロピ符号化手段による符号化結果に基づいて符号列を生成し、出力する符号列生成手段とを備え
前記分割手段は、符号化対象に応じて分割するタイルの数を変更し、
符号化対象が静止画の場合には、符号化対象が動画の場合よりもタイルの数が多くなるように分割を行うことを特徴とする。
【0009】
本発明の目的を達成するために、例えば本発明の符号化方法は以下の構成を備える。すなわち、画像に対して符号化を行う符号化方法であって、
画像を複数のタイルに分割する分割工程と、
前記分割工程による各タイルに対して周波数変換を施し、周波数帯域毎の変換係数を生成する周波数変換工程と、
前記周波数変換工程による変換係数、もしくはその量子化値に対してエントロピ符号化を施すエントロピ符号化工程と、
前記エントロピ符号化工程による符号化結果に基づいて符号列を生成し、出力する符号列生成工程とを備え
前記分割工程では、符号化対象に応じて分割するタイルの数を変更し、
符号化対象が静止画の場合には、符号化対象が動画の場合よりもタイルの数が多くなるように分割を行うことを特徴とする。
【0010】
【発明の実施の形態】
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。尚、以下の実施形態では、本発明の符号化装置を符号化、復号を行う機能を有するデジタルスチル&ムービーカメラに適用した場合について説明するが、適用する対象はこれに限定されるものではない。
【0011】
[第1の実施形態]
まず始めに、本実施形態におけるデジタルスチル&ムービーカメラが行う符号化、復号処理について説明する。図1は符号化処理を行う符号化器の機能構成を示すブロック図である。
【0012】
コンポーネント変換部1では本符号化器に入力された符号化対象の画像の有する色空間に対して色空間変換を施し、画像の色成分を変換する。変換された各色成分のデータは、必要に応じて所定の間引き処理が行われて出力される。なお、画像データがモノクログレースケールの画像である場合は、コンポーネント変換を行う必要は無い。後述の説明は上述の方法にて得られた各色成分毎に対して行われる処理を説明するものである。
【0013】
タイル分割部2は、入力した画像データを複数個の所定の大きさの矩形タイルに分割し出力する。このタイルの大きさは所定の大きさに設定することができる。なお、後述の説明は、分割された各タイルの色成分毎に行われる処理を説明するものである。
【0014】
図4A、4Bは画像を矩形タイルに分割した様子を示す図である。詳しくは図4Aは動画モード時に、図4Bは静止画モード時に画像(動画の場合は1フレームの画像)を分割した様子を示す図であり、それぞれ30分割、120分割に設定されている。ここで、分割数設定については、後ほど説明する。
【0015】
離散ウェーブレット変換部3は入力した各タイルの画像データに対して2次元の離散ウェーブレット変換を施して周波数成分に分解し、複数の周波数帯域のそれぞれに属する変換係数群(以降サブバンド)を出力する。図2は離散ウェーブレット変換部3により出力されるサブバンドの構成を示したものであり、2次元のウェーブレット変換を低周波帯域に対して再帰的に2レベル行ったものである。なお、離散ウェーブレット変換部3では非可逆符号化を行いたい場合にはウェーブレット変換後の係数が実数になる実数型のフィルタを、可逆符号化を行いたい場合にはウェーブレット変換後の係数が整数になる整数型のフィルタを用いる。
【0016】
量子化部4は入力したサブバンド毎に、所定の方法により設定された量子化ステップを用いて量子化を行い、量子化インデックスを生成して出力する。なお可逆符号化を行いたい場合には量子化部4では量子化を行わず、入力した変換係数そのものが出力される。
【0017】
エントロピ符号化部5は、図3に示すように、入力したサブバンドをさらに複数の矩形ブロック(以降コードブロックと呼ぶ)に分割(サブバンドと矩形ブロックが同サイズの時は分割しない)し、このコードブロックを単位として独立にエントロピ符号化を行い、符号化データを生成する。この時、量子化インデックスを表すビットは、上位ビットプレーンから順に算術符号化され、符号化データが生成される。
【0018】
符号列形成部6は、所定の方法により設定されたプログレッシブ形態に基づいて符号列を形成し出力する。この符号列形成において、符号列形成部6は、採用するプログレッシブ形態に合わせて、各コードブロックの符号化データの上位ビットプレーンから順に適量の符号化データを選択して1つ以上のレイヤを構成する。
【0019】
例えば、設定されたプログレッシブ形態がSNRスケーラブルである場合、符号列形成部6は図5に示すように、レイヤを単位として上位レイヤから順に下位レイヤに向かい符号化データを配置する。図5は、符号化データが符号列形成部6により生成される様子を図示したものである。なおこの時、後半のレイヤを省略して下位ビットプレーンに係る符号化データを破棄することもできる。このようにすることにより符号列を復号し、再生される画像の画質を変化させることができる。
【0020】
一方、設定されたプログレッシブ形態が空間解像度スケーラブルである場合、符号列形成部6は図6に示すように低周波サブバンドから高周波サブバンドに向かい符号化データを配置する。図6は符号化データが符号列形成部6により生成される様子を図示したものである。この時、後半のサブバンドの符号化データ(HL1,LH1,HH1)を符号列に含めないように選択することもできる。このようにすることにより、符号列を復号し、再生された画像の解像度を変化させることができる。さらに符号列形成部6は上述のように設定された各プログレッシブ形態に応じて形成された符号列に各種マーカから構成されるヘッダを追加した最終的な符号列を出力する。
【0021】
図7は最終的な符号列の構成を図示したものである。同図において、メインヘッダMHは圧縮符号化対象となる画像の解像度、色成分数、各成分のビット精度(各成分を表現するビット数)、画像を構成するタイルのサイズ、離散ウェーブレット変換のフィルタのタイプ、量子化ステップ等の圧縮符号化に関するパラメータおよびプログレッシブ形態等の符号列構成に関する情報を指定するマーカを含んでいる。
【0022】
また、タイルヘッダTH_iはi番目のタイルの開始を表すマーカを含んでいる。更に、当該タイルにおいて符号化に関するパラメータをその以前に符号化されたタイルから変更した場合には、そのパラメータを指定するマーカも含んでいる。BS_iはi番目のタイルの符号化データであり、その配列は先に述べたプログレッシブ形態に基づいて構成されている。
【0023】
図8は上記符号化器にて得られた符号列を復号する復号器の機能構成を示すブロック図である。符号列入力部7は符号列を入力し、画像やタイルのサイズ、プログレッシブ形態や量子化ステップ等の、後続の復号処理に必要なパラメータを抽出し、後述の各部に必要に応じて出力する。実際の符号列はエントロピ復号部8に出力される。なお、復号対象となる全体の符号列には、上述した図7の形態を持つ複数タイル分の符号列が、上述したコンポーネント変換部1にて得られた色成分の数だけ含まれる。本実施形態では復号処理は各色成分毎に独立して行うこととし、復号対象となる色成分を構成する各タイルの符号列を順に復号してゆく。
【0024】
エントロピ復号部8は入力した符号列に対して復号処理を行い、量子化インデックスを出力する。この復号処理ではコードブロック内の量子化インデックスが上位ビットプレーンから順に復号される。
【0025】
例えば、この時、符号列のプログレッシブ形態がSNRスケーラブルとなっており、所定数の上位レイヤのみが入力されている場合には、復号処理は入力されたレイヤで打ち切られ、その時点での復元値が量子化インデックスとして出力される。逆量子化部9は入力した量子化インデックスを、先に符号列から読み込まれた量子化ステップを用いて逆量子化を行い、変換係数を復元して出力する。
【0026】
逆離散ウェーブレット変換部10は、入力した変換係数に対して2次元の逆離散ウェーブレット変換を施し、これに対応する色成分データ(符号化対象画像がモノクロ画像の時は画像濃度データ)を復元して出力する。なおこの時、符号列のプログレッシブ形態が空間解像度スケーラブルであり、前半に符号化されるレベル(例えばLLのみや、LL、HL2、LH2、HH2のみ)のサブバンドのみが復元されている場合は、復元された色成分データの解像度はその復元されたサブバンドのレベルに応じて変化する。
【0027】
図9はこの様子を示しており、同図においてサブバンドLLの係数のみが復号された場合は、逆離散ウェーブレット変換は実質的には行われず、LLの係数が元のデータレンジに収まるように調節された後に出力される。この場合復元された色成分データは、同図r=0に示すように元の解像度に対して水平および垂直方向に1/4の解像度となっている。
【0028】
さらに、LL、HL2、LH2、HH2のサブバンドまで復号された場合、逆変換を1レベル行うことで同図r=1に示すように、元の解像度に対して水平及び垂直方向に1/2の解像度の色成分データが復元される。さらに、LL、HL2、LH2、HH2、HL1、LH1、HH1のサブバンドまで復号された場合、逆変換を2レベル行うことで同図r=2に示すように、元の解像度に等しい解像度の色成分データが復元される。
【0029】
以上の処理は各タイル単位で行われ、画像構成部11は復元された各タイルの各色成分データを再度、元の1枚の符号化対象画像を構成する色成分データとして構成してコンポーネント逆変換部12に出力する。
【0030】
コンポーネント逆変換部12は、入力した各色成分データに所定の変換を施すことにより、元の符号化対象画像の色空間を持つ画像データを復元して出力する。この時、元の色成分データがコンポーネント変換部1にて間引き処理されている場合は、逆変換を行う前に必要な解像度に変換(データ補間)される。
【0031】
以上の説明において、プログレッシブ形態が空間解像度スケーラブルの場合には、復号するレイヤを制限することで、復元される画像の画質を制御することが出来る。また、SNRスケーラブルの場合には、逆離散ウェーブレット変換するサブバンドのレベル数を制限することで復元される画像の解像度を制御することが出来る。
【0032】
次に、本実施形態におけるデジタルスチル&ムービーカメラの構成について説明する。図10Aは本実施形態におけるデジタルスチル&ムービーカメラを正面から見た外観図で、図10Bは背面から見た外観図である。また、図11は本実施形態におけるデジタルスチル&ムービーカメラの構成図である。なお、図10A、10B、11において同じ部分には同じ番号を付けている。
【0033】
図11において、100は画像処理装置である。13は撮影レンズ、14は絞り機能を備えるシャッター、15は光学像を電気信号(アナログ信号)に変換する撮像素子、16は撮像素子14から出力されたアナログ信号をディジタル信号に変換するA/D変換器である。18は撮像素子15、A/D変換器16、D/A変換器26にクロック信号や制御信号を供給するタイミング発生回路であり、メモリ制御回路22及びシステム制御回路50により制御される。20は画像処理回路であり、A/D変換器16からのデータ或いはメモリ制御回路22からのデータに対して所定の画素補間処理や色変換処理を行う。
【0034】
また、画像処理回路20は撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてシステム制御回路50は露光制御回路40、測距制御回路41に対して制御信号を出力し、露光制御回路40,測距制御回路41は、TTL(スルー・ザ・レンズ)方式のAF(オートフォーカス)処理、AE(自動露出)処理、EF(フラッシュプリ発光)処理を行う。さらに、画像処理回路20は撮像した画像データを用いて所定の演算処理を行い、得られた演算結果に基づいてTTL方式のAWB(オートホワイトバランス)処理も行っている。
【0035】
22はメモリ制御回路であり、A/D変換器16、タイミング発生回路18、画像処理回路20、画像表示メモリ24、D/A変換器26、メモリ30、圧縮・伸長回路32を制御する。A/D変換器16から出力されたデータが画像処理回路20、メモリ制御回路22を介して、或いはA/D変換器16のデータが直接メモリ制御回路22を介して、画像表示メモリ24或いはメモリ30に書き込まれる。24は画像表示メモリ、26はD/A変換器、28はTFT LCD等から成る画像表示部であり、画像表示メモリ24に書き込まれた表示用の画像データはD/A変換器26を介して画像表示部28により表示される。また、画像表示部28は、システム制御回路50の指示により表示をON/OFFすることが可能である。
【0036】
また、301は音声を取り込むためのマイク、302はA/D変換器、303は音声処理回路であり、A/D変換器302のデータが音声処理回路303、メモリ制御回路22を介して、或いはA/D変換器302のデータが直接メモリ制御回路22を介して、メモリ30に書き込まれる。
【0037】
30は撮影した静止画像、動画像/音声を格納するためのメモリであり、所定枚数の静止画像、所定時間の動画像/音声を格納するのに十分な記憶量を備えている。これにより、複数枚の静止画像を連続して撮影する動画像やパノラマ撮影の場合にも、高速かつ大量の画像書き込みをメモリ30に対して行うことが可能となる。また、メモリ30はシステム制御回路50の作業領域としても使用することが可能である。
【0038】
32は画像データ、音声データを圧縮伸長する圧縮・伸長回路であり、メモリ30に格納された画像、音声データを読み込んで圧縮処理或いは伸長処理を行い、処理を終えたデータをメモリ30に書き込む。なお、圧縮・伸長回路32の機能構成は、図1乃至9を用いて説明した上記説明に従ったものである。
【0039】
40は絞り機能を備えるシャッター12を制御する露光制御回路であり、フラッシュ48と連携することによりフラッシュ調光機能も有するものである。41は撮影レンズ13のフォーカシングを制御する測距制御回路、44は撮影レンズ13のズーミングを制御するズーム制御回路、46はバリアである保護部102の動作を制御するバリア制御回路である。48はフラッシュであり、AF補助光の投光機能、フラッシュ調光機能も有する。露光制御回路40、測距制御回路41はTTL方式を用いて制御されており、撮像した画像データを画像処理回路20によって演算した演算結果に基づき、システム制御回路50が露光制御回路40、測距制御回路41に対して制御を行う。
【0040】
50は画像処理装置100全体を制御するシステム制御回路、52はシステム制御回路50の動作用の定数、変数、プログラム等を記憶するメモリである。54はシステム制御回路50でのプログラムの実行に応じて、動作状態やメッセージ等を表示する液晶表示装置である。液晶表示装置54に表示するものとしては、シングルショット/連写撮影表示、動画撮影表示、セルフタイマー表示、圧縮率表示、記録画素数表示、記録枚数表示、残撮影可能枚数/撮影時間表示、動画像再生/早送り/停止表示、電池残量表示、記録媒体200の着脱状態表示、通信I/F動作表示、日付け・時刻表示等がある。56は電気的に消去・記録可能な不揮発性メモリであり、例えばEEPROM等が用いられる。
【0041】
60、62、66、68及び70は、システム制御回路50の各種の動作指示を入力するための操作部であり、スイッチやダイアル、タッチパネル、視線検知によるポインティング、音声認識装置等の単数或いは複数の組み合わせで構成される。ここで、これら操作部の具体的な説明を行う。
【0042】
60はモードダイアルスイッチで、電源オフ、静止画モード、再生モード、消去モード、動画モードの各機能モードを切り替え設定することが出来る。62はシャッタースイッチで、静止画モード時にシャッターボタン62の操作途中(ボタンが押下可能な位置の途中まで押すこと)で信号SW1がONとなり、AF(オートフォーカス)処理、AE(自動露出)処理、AWB(オートホワイトバランス)処理、EF(フラッシュプリ発光)処理等の動作開始をシステム制御回路50に指示する。
【0043】
また、シャッターボタン62の操作完了(ボタンが押下可能な位置まで押されたこと)で信号SW2がONとなり、撮像素子12から読み出した信号をA/D変換器16、メモリ制御回路22を介してメモリ30に書き込む露光処理、画像処理回路20やメモリ制御回路22での演算を用いた現像処理、メモリ30から画像データを読み出し、圧縮・伸長回路32で圧縮を行い、記録媒体200に画像データを書き込む記録処理という一連の処理の動作開始をシステム制御回路50に指示する。
【0044】
なお、動画モード時は、AF(オートフォーカス)処理、AE(自動露出)処理、AWB(オートホワイトバランス)処理機能が撮影しながら動作するため、信号SW1は無視されるとともに、マイク301から取り込まれた音声信号も、画像と同様のプロセスにて記録媒体200の中に、音声データとして画像データとともに記録される。
【0045】
66は画像表示ON/OFFスイッチで、画像表示部28のON/OFFを設定することが出来る。68はクイックレビューON/OFFスイッチで、撮影直後に撮影した画像データを自動再生するクイックレビュー機能を設定する。なお、本実施形態では特に、画像表示部28をOFFとした場合におけるクイックレビュー機能の設定をする機能を備えるものとする。
【0046】
70は各種ボタンやタッチパネル等からなる操作部で、メニューボタン、セットボタン、マクロボタン、マルチ画面再生改ページボタン、フラッシュ設定ボタン、単写/連写/セルフタイマー切り替えボタン、メニュー移動+(プラス)ボタン、メニュー移動−(マイナス)ボタン、再生画像移動(動画時は早送り)+(プラス)ボタン、再生画像−(マイナス)ボタン、撮影画質選択ボタン、露出補正ボタン、日付/時間設定ボタン等がある。
【0047】
80は電源制御回路で、電池検出回路、DC−DCコンバータ、通電するブロックを切り替えるスイッチ回路等により構成されており、電池の装着の有無、電池の種類、電池残量の検出を行い、検出結果及びシステム制御回路50の指示に基づいてDC−DCコンバータを制御し、必要な電圧を必要な期間、記録媒体を含む各部へ供給する。82はコネクタ、84はコネクタ、86はアルカリ電池やリチウム電池等の一次電池やNiCd電池やNiMH電池、Li電池等の二次電池、ACアダプター等からなる電源である。
【0048】
90はメモリカードやハードディスク等の記録媒体とのインタフェース、92はメモリカードやハードディスク等の記録媒体と接続を行うコネクタ、98はコネクタ92は記録媒体200が装着されているか否かを検知する記録媒体着脱検知回路である。102は、画像処理装置100のレンズ13を含む撮像部を覆う事により、撮像部の汚れや破損を防止するバリアである保護部である。104は光学ファインダであり、画像表示部28による電子ファインダー機能を使用すること無しに、光学ファインダのみを用いて撮影を行うことが可能である。また、光学ファインダー104内には、液晶表示装置54の一部の機能、例えば、合焦表示、手振れ警告表示、フラッシュ充電表示、シャッタースピード表示、絞り値表示、露出補正表示等を行う機能が備えられている。
【0049】
110は通信部で、RS232CやUSB、IEEE1394、P1284、SCSI、モデム、LAN、無線通信、等の各種通信機能を有する。112は通信部110により画像処理装置100を他の機器と接続するコネクタである。或いは無線通信の場合はアンテナである。
【0050】
200はメモリカードやハードディスク等の記録媒体である。記録媒体200は、半導体メモリや磁気ディスク等から構成される記録部202、画像処理装置100とのインタフェース204、画像処理装置100と接続を行うコネクタ206を備えている。
【0051】
次に上記構成を備える本実施形態におけるデジタルスチル&ムービーカメラが動画像を撮像し、撮像した動画像を圧縮符号化することで生成する動画ファイルの構成について説明する。
【0052】
図19は上記動画ファイルの構成を示す図である。図19に示すように、動画ファイルは、ヘッダエリア401、画像、音声の付帯情報に関する付帯情報エリア402、データエリア403、インデックスエリア404から構成される。ヘッダエリア401には、ファイル全体に関する情報が記録され、フレームレート(1秒当りのフレーム数)や画像データのフォーマット情報(例えばJPEG2000、JPEG、ビットマップ)や音声データのフォーマット情報(例えばPCM、MP3)などが記録されている。
【0053】
付帯情報エリア402には、画像データの付帯情報として、画像のサイズ(例えば720×480、1440×960)や画像データの縦横の比率を示すアスペクト比等、音声データの付帯情報として、サンプリングレート、チャンネル数、ビット数等が記録されている。
【0054】
データエリア403には複数の静止画からなる画像データと、それに対応する音声データがインターリーブされて記録されている。なお、本実施形態においては画像データと音声データを一つのファイルとした構造を取っているが、画像データと音声データは別のファイルとして記録しても良い。インデックスエリア404には、データエリア内の任意の画像データおよび音声データにアクセス可能なアドレス情報等が記録されている。
【0055】
次に、画像データ圧縮時のタイル分割設定動作について説明する。図12は、撮像された画像に対して上記デジタルスチル&ムービーカメラが行う圧縮符号化処理のフローチャートである。また、図13はモードダイヤル60の詳細図であり、モードダイヤル60は、回転させることによって、OFF/静止画/動画/再生/消去のいずれかのモードに切り替えることができ、同図矢印が指す位置に設定されたモードが選択される。また、前述したように、図4A、4Bは画像をタイル分割した図であり、図4Aは動画モード時、図4Bは静止画モード時であり、それぞれ30分割、120分割に設定されている。
【0056】
図12におけるフローを説明する。まず信号SW2がONになっているかどうかを判断し(ステップS121)、ONになっていた場合、モードダイヤル60により動画モードが選択されているか否かを判断する(ステップS122)。ここで動画モードが選択されていない場合(静止画モードの場合)は、分割タイル数を120にて画像圧縮を行い(ステップS125)、記録部のメモリへ圧縮符号化された画像を転送する(ステップS126)。一方、モードダイヤル60により動画モードが選択されている場合、分割タイル数を30にて画像圧縮を行い(ステップS123)、記録部のメモリへ圧縮符号化された画像を転送する(ステップS124)。
【0057】
以上の動作によって、撮像データを圧縮記録する際、静止画/動画モード切り替え動作に連動して、画像圧縮時のタイル分割数を切り替えることができる。つまり、静止画モード時はタイル数を多く、動画モード時はタイル数を少なく設定した。以上の説明では静止画、動画を圧縮符号化する場合に、分割数を夫々120,30として説明したが、これに限定されるものではなく、一般に夫々x、y(x>y)であればよい。
【0058】
これにより、静止画の際はタイル数が多いため、画像の切り出しや合成時、画像の微小な部分を劣化なく画像処理可能となるとともに、プリンターなど速度が遅い画像伝送時は、画像処理単位あたりのデータが少ないため効率よく伝送できる。更に、静止画でよく用いられる縦横画像変換処理の際も同様に、画像処理単位あたりのデータが少ないため効率よく画像変換できる。
【0059】
また、動画像の際はタイル数が少ないため、一画面における画像処理の時間が減り、高速で画像を伝送でき、なめらかな動画が実現できる。更に、動画像のタイル数を、動画の1フレーム周期時間レート内に収まる最大データ量から決定すると、より最適なシステムとなる。
【0060】
[第2の実施形態]
図14は、撮像された画像に対して本実施形態におけるデジタルスチル&ムービーカメラが行う圧縮符号化処理のフローチャートである。また図15はモードダイヤル60の詳細図であり、モードダイヤル60は回転させることによって、OFF/静止画/動画/プログレッシブ動画/再生/消去のいずれかのモードに切り替えることができ、同図矢印が指す位置に設定されたモードが選択される。また、図16A、16B、16Cは夫々各モードにおいてタイル分割した画像を示す図であり、図16Aは動画モード時、図16Bはプログレッシブ動画モード時、図16Cは静止画モード時であり、それぞれ30分割、56分割、120分割に設定されている。
【0061】
ここで、プログレッシブ動画モードについて説明する。一般的に動画像は転送速度を速め、ちらつきを押さえるために撮像素子をインターレース転送している。具体的には、撮像素子の垂直ライン2ライン分を混合して1ライン分の信号を形成し、シーンごとに混合する隣接画素をずらしている。しかしながら2ライン混合のため、1シーンを切り出して静止画を取り出そうとすると、画素数が1/2となってしまい、画質の悪い静止画となってしまう。そこで、2ライン混合をやめ、常に全画素を読み込むことにより、1シーンを切り出して静止画を取り出す際、高画質の静止画を得られる方式(プログレッシブ動画モード)が一般的に採用されている。ただし、このとき1画面の転送速度は遅くなってしまうので、動画像のちらつきが発生するという欠点がある。
【0062】
次に、図14におけるフローを説明する。まず信号SW2がONになっているかどうかを判断し(ステップS141)、ONになっていた場合、モードダイヤル60により動画モードが選択されているか否かを判断する(ステップS142)。ここで動画モードが選択されていない場合(静止画モードの場合)は、モードダイヤル60によりプログレッシブ動画モードが選択されているか否かを判断する(ステップS145)。ここでプログレッシブ動画モードになっていない場合は、分割タイル数を120にて画像圧縮を行い(ステップS148)、記録部のメモリへ圧縮符号化された画像を転送する(ステップS149)。
【0063】
一方、モードダイヤル60によりプログレッシブ動画モードが選択されている場合、分割タイル数を56にて画像圧縮を行い(ステップS146)、記録部のメモリへ圧縮符号化された画像を転送する(ステップS147)。また、モードダイヤル60により動画モードが選択されてる場合、分割タイル数を30にて画像圧縮を行い(ステップS143)、記録部のメモリへ圧縮符号化された画像を転送する(ステップS144)。
【0064】
以上の動作によって、撮像データを圧縮記録する際、静止画/動画/プログレッシブ動画モード切り替え動作に連動して、画像圧縮時のタイル分割数を切り替えることができる。つまり、静止画モード時、プログレッシブ動画モード時、動画モード時、の順に、タイル数を少なく設定した。以上の説明では静止画モード、プログレッシブ動画モード、動画モードにおいて圧縮符号化する場合に、分割数を夫々120,56,30として説明したが、これに限定されるものではなく、一般に夫々x、y、z(x>y>z)であればよい。
【0065】
これにより、静止画の際はタイル数が多いため、画像の切り出しや合成時、画像の微小な部分を劣化なく画像処理可能となるとともに、プリンターなど速度が遅い画像伝送時は、画像処理単位あたりのデータが少ないため効率よく伝送できる。
【0066】
また、動画像の際はタイル数が少ないため、一画面における画像処理の時間が減り、高速で画像を伝送でき、なめらかな動画が実現できる。更にプログレッシブ動画の際は、タイル数を前記静止画と動画の中間に設定されるため、動画像として扱う場合、動画像からの切り出し静止画として扱う場合、両方のメリットをバランス良く活用できる。
【0067】
[第3の実施形態]
一般的に、静止画、動画の両方撮像可能な撮像装置において、静止画の画質を上げるため比較的多い画素数の撮像素子を用いることがある。このとき静止画モード時はそのまま画像圧縮を行う。一方動画モード時は、転送レートの速度を上げる必要があること、画質を静止画ほど上げる必要のないことの理由から、画素変換処理を行い、総画素数を少なくする処理を行う。
【0068】
本実施形態は、上記方法に適用したものであり、以下の説明では100万画素の撮像素子を用いた場合について説明するが、これに限定されるものではない。ここで、静止画モード時は100万画素をフルに記録し、動画モード時は34万画素相当に画素変換してから記録するものとする。
【0069】
図17は撮像された画像に対して本実施形態におけるデジタルスチル&ムービーカメラが行う圧縮符号化処理のフローチャートである。図17において図12に示したフローチャート(第1の実施形態)と同じ番号を付けているステップは同じ処理を示すものであるので、説明を省略する。第1の実施形態と異なる動作は、モードダイヤルが動画モードになっていたとき、100万画素から34万画素に画素変換を行った(ステップS170)後、分割タイル数30にて画像圧縮を行うところである。なお画素変換処理は公知の方法を用いる。
【0070】
図18A、18Bは上記圧縮符号化を図示したものであり、夫々動画モード時、静止画モード時におけるものである。静止画モード時は、100万画素をそのまま分割タイル数120で圧縮を行う。一方動画モード時は、100万画素を一旦34万画素に画素変換を行った後、分割タイル数12で圧縮を行っている。
【0071】
ここで、動画の分割タイル数を、動画の1フレーム周期時間レート内に収まる最大データ量から決定すると、最適なシステムとなる。以上の説明では静止画、動画を圧縮符号化する場合に、分割数を夫々120,12として説明したが、これに限定されるものではなく、一般に夫々x、y(x>y)であればよい。
【0072】
また、静止画の際はタイル数が多いため、画像の切り出しや合成時、画像の微小な部分を劣化なく画像処理可能となるとともに、プリンターなど速度が遅い画像伝送時は、画像処理単位あたりのデータが少ないため効率よく伝送できる。更に、静止画でよく用いられる縦横画像変換処理の際も同様に、画像処理単位あたりのデータが少ないため効率よく画像変換できる。
【0073】
[他の実施形態]
本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0074】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0075】
【発明の効果】
以上の説明により、本発明によれば、画像を複数のタイルに分割して符号化する処理において、符号化対象が動画か静止画かに応じて分割するタイル数を変更するので、それぞれの目的にあった効率的な符号化処理を実行することができる。
【図面の簡単な説明】
【図1】符号化処理を行う符号化器の機能構成を示すブロック図である。
【図2】離散ウェーブレット変換部3により出力されるサブバンドの構成を示す図である。
【図3】サブバンドをコードブロックに分割した様子を示す図である。
【図4A】動画モード時に画像を分割した様子を示す図である。
【図4B】静止画モード時に画像を分割した様子を示す図である。
【図5】プログレッシブ形態がSNRスケーラブルである場合に、符号化データが符号列形成部6により生成される様子を示す図である。
【図6】プログレッシブ形態が空間解像度スケーラブルである場合に、符号化データが符号列形成部6により生成される様子を示す図である。
【図7】最終的な符号列の構成を示す図である。
【図8】復号を行う復号器の機能構成を示すブロック図である。
【図9】復号されたサブバンドに対する画像を示す図である。
【図10A】本発明の実施形態におけるデジタルスチル&ムービーカメラを正面から見た外観図である。
【図10B】本発明の実施形態におけるデジタルスチル&ムービーカメラを背面から見た外観図である。
【図11】本発明の実施形態におけるデジタルスチル&ムービーカメラの構成図である。
【図12】撮像された画像に対して本発明の第1の実施形態におけるデジタルスチル&ムービーカメラが行う圧縮符号化処理のフローチャートである。
【図13】本発明の第1の実施形態におけるモードダイヤル60の詳細図である。
【図14】撮像された画像に対して本発明の第2の実施形態におけるデジタルスチル&ムービーカメラが行う圧縮符号化処理のフローチャートである。
【図15】本発明の第2の実施形態におけるモードダイヤル60の詳細図である。
【図16A】動画モードにおいてタイル分割した画像を示す図である。
【図16B】プログレッシブ動画モードにおいてタイル分割した画像を示す図である。
【図16C】静止画モードにおいてタイル分割した画像を示す図である。
【図17】撮像された画像に対して本発明の第3の実施形態におけるデジタルスチル&ムービーカメラが行う圧縮符号化処理のフローチャートである。
【図18A】動画モード時における圧縮符号化の様子を示す図である。
【図18B】静止画モード時における圧縮符号化の様子を示す図である。
【図19】動画ファイルの構成を示す図である。
【図20】従来のデジタルスチル&ムービーカメラにおいて、撮像された画像に対して符号化を行う符号化部の構成を示すブロック図である。

Claims (6)

  1. 画像に対して符号化を行う符号化装置であって、
    画像を複数のタイルに分割する分割手段と、
    前記分割手段による各タイルに対して周波数変換を施し、周波数帯域毎の変換係数を生成する周波数変換手段と、
    前記周波数変換手段による変換係数、もしくはその量子化値に対してエントロピ符号化を施すエントロピ符号化手段と、
    前記エントロピ符号化手段による符号化結果に基づいて符号列を生成し、出力する符号列生成手段とを備え
    前記分割手段は、符号化対象に応じて分割するタイルの数を変更し、
    符号化対象が静止画の場合には、符号化対象が動画の場合よりもタイルの数が多くなるように分割を行うことを特徴とする符号化装置。
  2. 前記符号列生成手段は前記エントロピ符号化手段による符号化結果に対してプログレッシブ形態に従って符号列を生成し、出力することを特徴とする請求項1に記載の符号化装置。
  3. 前記分割手段は、画像を複数のタイルに分割するにあたり、符号化対象がインターレース動画の場合のタイル数をx、符号化対象がプログレッシブ動画である場合のタイル数をy、符号化対象が静止画である場合のタイル数をzとした場合、z>y>xとなるように分割することを特徴とする請求項に記載の符号化装置。
  4. 画像に対して符号化を行う符号化方法であって、
    画像を複数のタイルに分割する分割工程と、
    前記分割工程による各タイルに対して周波数変換を施し、周波数帯域毎の変換係数を生成する周波数変換工程と、
    前記周波数変換工程による変換係数、もしくはその量子化値に対してエントロピ符号化を施すエントロピ符号化工程と、
    前記エントロピ符号化工程による符号化結果に基づいて符号列を生成し、出力する符号列生成工程とを備え
    前記分割工程では、符号化対象に応じて分割するタイルの数を変更し、
    符号化対象が静止画の場合には、符号化対象が動画の場合よりもタイルの数が多くなるように分割を行うことを特徴とする符号化方法。
  5. コンピュータに請求項に記載の符号化方法を実行させるためのプログラム。
  6. 請求項に記載のプログラムを格納し、コンピュータが読み取り可能な記憶媒体。
JP2002063555A 2002-03-08 2002-03-08 符号化装置、符号化方法、プログラム、記憶媒体 Expired - Fee Related JP4164268B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002063555A JP4164268B2 (ja) 2002-03-08 2002-03-08 符号化装置、符号化方法、プログラム、記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002063555A JP4164268B2 (ja) 2002-03-08 2002-03-08 符号化装置、符号化方法、プログラム、記憶媒体

Publications (3)

Publication Number Publication Date
JP2003264834A JP2003264834A (ja) 2003-09-19
JP2003264834A5 JP2003264834A5 (ja) 2005-04-07
JP4164268B2 true JP4164268B2 (ja) 2008-10-15

Family

ID=29196769

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002063555A Expired - Fee Related JP4164268B2 (ja) 2002-03-08 2002-03-08 符号化装置、符号化方法、プログラム、記憶媒体

Country Status (1)

Country Link
JP (1) JP4164268B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4898589B2 (ja) 2007-07-26 2012-03-14 株式会社日立製作所 画像圧縮方法、および、画像処理装置
JP5128963B2 (ja) * 2008-01-08 2013-01-23 日本電信電話株式会社 動画像の多重化方法とファイル読み込み方法及び装置,並びにそのプログラムとコンピュータ読み取り可能な記録媒体
JP2015050688A (ja) * 2013-09-03 2015-03-16 キヤノン株式会社 撮像装置、撮像装置の制御方法、プログラム

Also Published As

Publication number Publication date
JP2003264834A (ja) 2003-09-19

Similar Documents

Publication Publication Date Title
US6917384B1 (en) Image sensing apparatus, method and recording medium storing program for method of setting plural photographic modes and variable specific region of image sensing, and providing mode specific compression of image data in the specific region
US8615140B2 (en) Compression of image data in accordance with depth information of pixels
US20040212843A1 (en) Image processing method, image processing apparatus, electronic camera and computer-readable storage medium
TW201907722A (zh) 圖像處理裝置及方法
JP2004128583A (ja) 撮像装置、画像処理方法、プログラム及び記録媒体
JP4067281B2 (ja) 画像処理方法とその方法を利用可能な画像符号化装置および画像復号装置
CN107079131B (zh) 图像处理设备和图像处理方法
JP4639965B2 (ja) 撮像装置、画像処理方法及びプログラム
JP3814592B2 (ja) 撮像装置及びその制御方法
CN107079130B (zh) 图像处理设备和图像处理方法
JP4164268B2 (ja) 符号化装置、符号化方法、プログラム、記憶媒体
JP2001333430A (ja) 画像処理装置、方法、及びコンピュータ読み取り可能な記憶媒体
US8948573B2 (en) Image processing apparatus
JP4027196B2 (ja) 画像表示装置及びその制御方法
KR101022470B1 (ko) 영상신호를 기록 및 재생할 수 있는 디지털 카메라
JP2001359117A (ja) 画像処理装置及び該装置における画像処理方法
US8953055B2 (en) Image pickup apparatus
JP2003125331A (ja) 画像記録方法及び装置、並びに画像再生方法及び装置
JP4154178B2 (ja) ビデオカメラ
KR100792247B1 (ko) 이미지 데이터 처리 시스템 및 그 방법
JP2021118403A (ja) 画像処理装置、その制御方法、プログラム並びに画像処理システム
JP6452362B2 (ja) 撮像装置及び撮像方法
JP2000333130A (ja) 動画データの記録方法及び装置
JP2004235990A (ja) 画像選択装置
JP2010103706A (ja) 撮像装置及びその制御方法及びプログラム及び画像処理装置及び画像処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040601

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040601

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070626

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080714

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080728

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4164268

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees