JP2004241906A - カムコーダ - Google Patents
カムコーダ Download PDFInfo
- Publication number
- JP2004241906A JP2004241906A JP2003027168A JP2003027168A JP2004241906A JP 2004241906 A JP2004241906 A JP 2004241906A JP 2003027168 A JP2003027168 A JP 2003027168A JP 2003027168 A JP2003027168 A JP 2003027168A JP 2004241906 A JP2004241906 A JP 2004241906A
- Authority
- JP
- Japan
- Prior art keywords
- data
- frame
- encoded data
- encoded
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Management Or Editing Of Information On Record Carriers (AREA)
- Television Signal Processing For Recording (AREA)
- Studio Devices (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【課題】カムコーダ等による動画像の撮影において、撮像者が望む撮影開始時間からの確実な録画を可能とする、動画像符号化データの生成/格納方法を提供する。
【解決手段】撮像装置は、撮像者の撮像の指示に先立ち、撮像(プレ撮像)を開始する。
・プレ撮像中の動画像データは、固定長/可変長符号化された上で、ディスク上の所定の領域に繰り返し書き込まれる。
・プレ撮像中の動画像符号化データと、プレ撮像後の動画像符号化データは同一領域に並べて書き込まれる。
【選択図】 図1
【解決手段】撮像装置は、撮像者の撮像の指示に先立ち、撮像(プレ撮像)を開始する。
・プレ撮像中の動画像データは、固定長/可変長符号化された上で、ディスク上の所定の領域に繰り返し書き込まれる。
・プレ撮像中の動画像符号化データと、プレ撮像後の動画像符号化データは同一領域に並べて書き込まれる。
【選択図】 図1
Description
【0001】
【発明の属する技術分野】
本発明は、動画像を符号化する動画像符号化装置、動画像符号化データに対して再生処理を施す動画像再生装置及びその方法並びに記憶媒体に関するものである。
【0002】
【従来の技術】
昨今、デジカメやカムコーダの低価格化に伴い、これらの撮像装置により動画像を撮像する機会が増えてきた。また、それに伴い、これらの撮像装置を使用するユーザーが要求するスペックは、ますます向上するばかりである。
【0003】
これらのユーザーの要求にこたえるため、メーカーはより高性能な撮像装置の開発に取り組んでいる。特に、企業は、ユーザーに対して商品価値の高さをアピールできる高画素化を最も重要な開発項目のひとつとしている傾向にある。
【0004】
【発明が解決しようとする課題】
このような開発競争により、一部のユーザーにとって、画素数に関しては十分満足される製品が揃ってきた。またこれに伴い、ユーザーは様々な機能上の不十分さにも目を向けるようになった。この機能上の不十分さのひとつに、撮影のディレイがある。このディレイとは、撮像者が所望とする撮像の開始時刻(希望開始時刻)と、実際に撮像が開始される時刻(実開始時刻)が異なることである。当問題は、撮像者が撮像を思い立ってから、撮像を撮像装置に指示するまで、タイムラグがあることに起因する。
【0005】
【課題を解決するための手段】
そこで本発明が目的とするところは、デジカメやカムコーダ等による動画像の撮像において、希望開始時刻からの確実な動画像データの録画と再生を可能とする、動画像の取得方法と、当該動画像データを符号化する方法と、この符号化により得られた動画像符号化データを格納する方法を提供することである。
【0006】
【発明の実施の形態】
(第1の実施の形態)
本発明における動画像は、図1に示されているように、画像と音声から構成され、さらに画像は瞬間瞬間の情報を表すフレームから構成されている。
【0007】
このような動画像の撮像において、図32に示されているように、撮像者が撮像を決めてから撮像の開始を命じるまでタイムラグが生じるため、動画像撮像装置が希望開始時刻から動画像データの取得を行えないことがある。そこで本実施の形態においては、希望開始時刻からの動画像データの取得を行う録画モード(確実録画モード)が設定されると、撮像者が撮像開始指示部により撮像の開始を命じなくても、本撮像装置は撮像を行う。また、本撮像装置は、この撮像を開始するにあたり、図33に示されているように、確実録画モードが設定されてから、撮像開始の指示が与えられるまでの時刻に取得するフレーム(プレフレーム)のデータ(プレフレームデータ)を繰り返し書き換えていくための、ディスク上の領域(プレフレーム用領域)を確保する。なお、本実施の形態においては、プレフレーム符号化データによる再生時間は常に一定になるように、プレフレームデータは固定長符号化されるので、プレフレーム用領域として、(1プレフレームの符号量)x(整数)の領域が確保される。同時に、このプレフレームの先頭アドレス(先頭アドレス1)と終了アドレス、それと1フレームあたりの符号量が不図示のRAM上に格納される。
【0008】
さらに、撮像者から撮像の指示が与えられ、撮像(本撮像)を開始すると、プレフレームの内、最も時間的に早いプレフレームの先頭アドレス(先頭アドレス2)を不図示のRAM上に格納する。
【0009】
その後、撮像装置は、本撮像で得られるフレームデータ(本フレームデータ)を符号化し、ディスクに書き込む。また、本撮像が終了し、全ての符号化された本フレームデータが格納されると、上述3つのアドレスをディスク上に書き込む。
【0010】
このように本実施の形態は、これらのプレフレームデータをディスク上へ格納することと、上述3つのアドレスの保持により、希望開始時刻のフレームからの再生を可能とする。
【0011】
以下の説明では、まず本撮像における動画像符号化装置の処理を説明し、それに続いて確実録画モードが設定された場合における撮像(プレ撮像)の説明を行う。
【0012】
(本撮像の説明)
図2に本実施の形態における動画像符号化装置のブロック図を示すと共に、当該動画像符号化装置における本撮像の処理のフローチャートを図3に示す。
【0013】
まず、本撮像開始/終了指示部209から本撮像の開始の指示がされると、動画像撮像装置は、画像データと音声データを、画像データ取得部201と音声データ取得部203から入力する(ステップS401)。この画像データ取得部201と音声データ取得部203は、例えばデジタルビデオカメラ、デジタルスチルカメラ等の撮像装置、或いはCCDなどの撮像デバイス、或いはネットワーク回線のインターフェース等が用いられる。また、画像データ取得部201と音声データ取得部203はRAM、ROM、ハードディスク、CD−ROM等の記録媒体であっても良い。
【0014】
画像データ取得部201から取得された画像データは、フレームのデータ(フレームデータ)毎、フレームデータ符号化部202に入力され、音声データ取得部203から取得された音声データは、音声データ符号化部204に入力される。フレームデータ符号化部202,音声データ符号化部204に入力されたフレームデータと音声データは符号化されて(ステップS402)、データ統合部205に出力される。このフレームデータ符号化部202の動作については、後程詳述する。また、音声データの符号化方法として、MPEG4で規定される様々な音声データの符号化方式(AAC,MP3,など)を使用するものとし、音声データ符号化部203の動作については、省略する。
【0015】
データ統合部205に音声符号化データとフレーム符号化データが入力されると、図34に示されているように、フレーム符号化データと音声符号化データが所定の規則に基づき並べられる。この統合されたフレーム符号化データと音声符号化データは、出力部206から記憶媒体208に出力され、当該記憶媒体に格納される(ステップS403)。なお本実施の形態においては、記憶媒体208として、CDやDVD−R/+RW/−RW/RAMなどの光ディスク,MOなどの光磁気ディスク,HDDやZIPなどの磁気ディスクを想定する。
【0016】
統合されたフレーム符号化データと音声符号化データの記憶媒体208への格納が終了すると、本撮像開始/終了指示部209から本撮像の終了の指示がされたか否かが判断される(ステップS404)。もし終了の指示がなされていない場合(ステップS404でNo)、処理はステップS401に戻される。一方、終了の指示がされていた場合(ステップS404でYes)、図35に示されているように、復号に必要となるデータを格納したヘッダをディスク上に書き込む(ステップS405)。これにより、ディスク上に動画像符号化データが形成され、処理が終了となる。
【0017】
<フレームデータ符号化部202における処理>
次に、フレームデータ符号化部202のブロック図を図3に示し、当該処理部の処理のフローチャートを図5に示し、これらの図を用いて、フレームデータの符号化の処理を説明する。
【0018】
本実施の形態におけるフレーム中の符号化対象となるフレームデータは、8ビットのモノクロフレームデータとする。しかしながら、各画素4ビット、10ビット、12ビットといった具合に8ビット以外のビット数で表すモノクロ画像、或いは各画素における各色成分(RGB/Lab/YCrCb)を8ビットで表現するカラーの多値フレームデータである場合に適用することも可能である。また、画像を構成する各画素の状態等を表す多値情報である場合、例えば各画素の色を表す多値のインデックス値である場合にも適用できる。これらに応用する場合には、各種類の多値情報を後述するモノクロフレームデータとすればよい。
【0019】
まず、フレームデータ取得部201から、フレームデータ入力部301へ、符号化対象となるフレームデータを構成する画素データがラスタースキャン順に入力され、タイル分割部302に出力される。このフレームデータ入力部301は、例えばスキャナ、デジタルカメラ等の撮像装置、或いはCCDなどの撮像デバイス、或いはネットワーク回線のインターフェース等が用いられる。また、フレームデータ入力部301はRAM、ROM、ハードディスク、CD−ROM等の記録媒体であっても良い。
【0020】
タイル分割部302は、フレームデータ入力部301から入力される1枚の画像をN枚のタイルに分割し(ステップS501)、各タイルを識別するためにラスタースキャン順にタイルナンバーi=0, 1, 2, ...,N−1を割り振るものとする。なお、本実施の形態では、図16に示されているように、画像を横8,縦6に分割し、48枚のタイルを作り出すものとする。
【0021】
ここで、各タイルを表すデータをタイルデータと呼ぶことにする。これら生成されたタイルデータは、順に離散ウェーブレット変換部303に送られる。なお、離散ウェーブレット変換部303以降の処理において、タイルは独立に符号化されるものとする。また、ここで、当該フレームデータ符号化部202が処理しているタイルを認識するための不図示のカウンタがi=0に設定される(ステップS502)。
【0022】
離散ウェーブレット変換部303は、タイル分割部302から入力される、1つの静止画像中の1つのタイルデータx(n)における複数の画素(参照画素)のデータ(参照画素データ)を用いて離散ウェーブレット変換を行う(ステップS503)。
【0023】
以下に、離散ウェーブレット変換後のフレームデータ(離散ウェーブレット変換係数)を示す。
【0024】
Y(2n) = X(2n)+floor{ (Y(2n−1)+Y(2n+1)+2)/4 }
Y(2n+1) = X(2n+1)−floor{ (X(2n)+X(2n+2))/2 }
Y(2n),Y(2n+1)は離散ウェーブレット変換係数列であり、Y(2n)は低周波サブバンド、Y(2n+1)は高周波サブバンドである。また、上式においてfloor{X}はXを超えない最大の整数値を表す。この離散ウェーブレット変換を模式的に表わしたのが図6である。
【0025】
本変換式は一次元のデータに対するものであるが、この変換を水平方向、垂直方向の順に適用して二次元の変換を行うことにより、図7(a)の様なLL,HL,LH,HHの4つのサブバンドに分割することができる。ここで、Lは低周波サブバンド、Hは高周波サブバンドを示している。次にLLサブバンドを、同じ様に4つのサブバンドに分け(図7(b))、その中のLLサブバンドをまた4サブバンドに分ける(図7(c))。合計10サブバンドを作る。10個のサブバンドそれぞれに対して、図7(c)の様にHH1,HL1,…と呼ぶことにする。ここで、各サブバンドの名称における数字を、それぞれのサブバンドのレベルとする。つまり、レベル1のサブバンドは、HL1,HH1,LH1、レベル2のサブバンドは、HL2,HH2,LH2である。なおLLサブバンドは、レベル0のサブバンドとする。LLサブバンドはひとつしかないので添字を付けない。またレベル0からレベルnまでのサブバンドを復号することで得られる復号画像を、レベルnの復号画像と呼ぶ。復号画像は、そのレベルが高い程解像度は高い。
【0026】
10個のサブバンドの変換係数は、いったんバッファ304に格納されLL,HL1,LH1,HH1,HL2,LH2,HH2,HL3,LH3,HH3の順に、つまり、レベルが低いサブバンドからレベルが高いサブバンドの順に、係数量子化部305へ出力される。
【0027】
係数量子化部305では、バッファ304から出力される各サブバンドの変換係数を各周波数成分毎に定めた量子化ステップで量子化し、量子化後の値(係数量子化値)をエントロピー符号化部306へ出力する(ステップS504)。係数値をX、この係数の属する周波数成分に対する量子化ステップの値をqとするとき、量子化後の係数値Q(X)は次式によって求めるものとする。
【0028】
Q(X)=floor{(X/q)+0.5}
本実施の形態における各周波数成分と量子化ステップとの対応を図8に示す。同図に示す様に、よりレベルが高いサブバンドの方に、大きい量子化ステップを与えている。なお、各サブバンド毎の量子化ステップは予め不図示のRAMやROMなどのメモリに格納されているものとする。そして、一つのサブバンドにおける全ての変換係数を量子化した後、それら係数量子化値をエントロピー符号化部306へ出力する。
【0029】
エントロピー符号化部306では、入力された係数量子化値がエントロピー符号化される(ステップS505)。ここでは、まず、図9に示されているように、入力された係数量子化値の集まりである各サブバンドが矩形(コードブロックと呼ぶ)に分割される。なお、このコードブロックの大きさには、2m×2n(m、nは2以上の整数)等が設定される。さらにこのコードブロックは、図10に示されているように、ビットプレーンに分割される。その上で、図11に示されているように、あるビットプレーンにおける各ビットは、ある分類規則に基づいて3種類に分けられて、同じ種類のビットを集めたコーディングパスが3種類生成される。入力された係数量子化値は、ここで得られたコーディングパスを単位として、エントロピー符号化である二値算術符号化が行われ、エントロピー符号化値が生成される。
【0030】
なお、ここでエントロピー符号化の具体的な処理順序は、1つのコードブロックに注目すると上位ビットプレーンから下位ビットプレーンの順に符号化され、その1コードブロックのあるビットプレーンに注目すると、図11にある3種類のパスを上から順に符号化する様になっている。
【0031】
エントロピー符号化されたコーディングパスは、タイル符号化データ生成部307に出力される。
【0032】
タイル符号化データ生成部307では、入力された複数のコーディングパスから、単一もしくは複数のレイヤーが構成され、それらレイヤーをデータの単位としてタイル符号化データが生成される(ステップS506)。以下にレイヤーの構成に関する説明を行う。
【0033】
当該処理部は、図12に示されているように、複数のサブバンドにおける複数のコードブロックから、エントロピー符号化されたコーディングパスを集めた上で、レイヤーを構成する。なお、図13に示されているように、あるコードブロックからコーディングパスを取得する際、常に該コードブロックにおいて最上位に存在するコーディングパスが選ばれる。その後、タイル符号化データ生成部307は、図14に示されているように、生成したレイヤーを、上位に位置するレイヤーから順に並べた上で、その先頭にタイルヘッダを付加してタイル符号化データを生成する。このヘッダには、タイルを識別する情報や、当該タイル符号化データの符号長や、圧縮に使用した様々なパラメータ等が格納される。このように生成されたタイル符号化データは、フレーム符号化データ生成部308に出力される。
【0034】
ここで、符号化すべきタイルデータが残っている場合は、処理をステップS503に戻し、符号化すべきタイルデータが残っていない場合は、処理をステップS508に進める(ステップS507)。
【0035】
フレーム符号化データ生成部308では、図15に示されているように、タイル符号化データを所定の順番で並べた上で、先頭にヘッダを付加してフレーム符号化データを生成する(ステップS508)。このヘッダには、入力画像やタイルの縦横のサイズ、圧縮に使用した様々なパラメータ,フレーム符号化データの符号長等が格納される。このように生成されたフレーム符号化データは、フレーム符号化データ出力部309からデータ統合部205に出力される(ステップS509)。
【0036】
(プレ撮像の説明)
図17にプレ撮像の処理のフローチャートを示す。
【0037】
まず、動画像撮像装置が、撮像者から確実録画モード指示部207より確実録画の指示を受けると(ステップS1701)、記憶媒体208上にプレフレーム用領域を確保する(ステップS1702)。これには、図33に示されているように、ディスク上のプレフレーム用に使うための領域の一部もしくは全部を使う。このプレフレーム用領域は、プレフレーム1枚あたりに割り当てられる符号量を格納する区画に分割される。本実施の形態においては、プレフレーム用領域には、M枚のフレームが格納されるものとして、プレフレーム用領域はM個の区画に分割され、それぞれ、区画0,区画1,...,区画M−1と番号付けられる。なお以降の説明では、任意の区画を区画iと表現するものとする。また、各プレフレームは固定長符号化されるので、各区画の長さは一定である。なおこの区画に、ディスク上のデータが管理される単位であるセクタを適用することは好適である。
【0038】
続いて、動画像撮像装置は、この確保された領域の先頭アドレス(先頭アドレス1)と終了アドレス,1フレームあたりの符号量を不図示のRAM上に格納し(ステップS1703)、これより符号化するフレームと音声データを格納する区画として区画0を設定する(ステップS1704)。
【0039】
次に、画像データ取得部201と音声データ取得部203により、プレフレームデータとそれに付随する音声データの取得を行い(ステップS1706)、当該2つのデータをフレームデータ符号化部202と音声データ符号化部204により固定長符号化を行う。このフレームデータの符号化方法は、固定長化を図ること以外、本撮像におけるフレームデータの符号化方法と同様である。なお固定長化は、ステップS504の量子化の調整や、S508のタイル符号化データの生成においてタイル符号化データに組み込むコーディングパスの枚数の調整により、実現させることが可能である。また、適宜復号器が復号時に読み飛ばすデータ(コメントデータ)をフレーム符号化データ中に挿入することで実現させることも可能である。さらには、上述2つの調整とコメントデータを組み合わせることで、固定長化を実現することも可能である。
【0040】
なお、音声符号化データの固定長化については、ここでは論じない。
【0041】
固定長符号化により生成されたプレフレーム符号化データと音声符号化データは、データ統合部205により統合され、記憶媒体208に出力される。記憶媒体208に出力されたプレフレーム符号化データと音声符号化データは、区画iに書き込まれる(ステップS1707)。この書き込みが終ると、まず、本撮像開始/終了指示部209から本撮像の指示がなされているかどうかが検証される(ステップS1708)。もし、本撮像の指示がなされている場合(ステップS1708でYes)、動画像撮像装置は、プレ撮像を終了する(ステップS1709)。さらに、時間的に最も早い時間を担持するプレフレーム符号化データが格納されている区画i+1のアドレス(先頭アドレス2)が不図示のRAM上に格納される(ステップS1710)。これをもって、プレ撮像は終了する。
【0042】
なお、本撮像が終了した際には、図35中のヘッダに、プレ撮像が行われたことを示す情報と、先頭アドレス1,2と終了アドレス,1フレームあたりの符号量,各プレフレーム符号化データは固定長化されていることを示す情報が格納される。これらの情報が格納されるヘッダ中の領域として、通常の復号装置は読み飛ばす領域(フリースペース)などが考えられる。
【0043】
もし、本撮像の指示がなされていない場合(ステップS1710でNo)、現在の書き込み区画の検証が行われる(ステップS1711)。もしi=M−1であるならば(ステップS1711でYes)、i=0に設定した上で(ステップS1712)、処理をS1705に戻す。また、i=M−1でなければ(ステップS1711でNo)、i=i+1とした上で(ステップS1713)、処理をS1705に戻す。
【0044】
以上、本実施の形態では、希望開始時刻からの動画像データの確実な取得/再生を行うための方法を示した。なお、プレフレーム符号化データによる再生時間は常に一定になるように、プレフレームデータは固定長符号化された。
【0045】
(第2の実施の形態)
第1の実施の形態においては、プレフレーム符号化データを固定長化した上で、希望開始時刻からの動画像データの確実な取得/再生を行うための方法を示した。しかし、このプレフレーム符号化データの固定長化は、プレフレーム符号化データ毎に復号画質の大幅な変動を招く可能性がある。
【0046】
そこで本実施の形態では、プレフレームデータを可変長符号化することで、プレフレーム符号化データの復号画質をほぼ一定とする方法を示す。
【0047】
なお本実施の形態における動画像符号化装置の動作は、プレ撮像以外、第1の実施の形態における動作と同じであるので、以下では、プレ撮像のみが説明される。
【0048】
図18に本実施の形態における動画像符号化装置のブロック図を示す。同図は、図2におけるフレームデータ符号化部202と音声データ符号化部204を、フレームデータ符号化部1801と音声データ符号化部1802に置換したものである。
【0049】
また、図19にフレームデータ符号化部1801のブロック図を示す。同図は、図3におけるフレーム符号化データ生成部308をフレーム符号化データ生成部1901に置換したものである。
【0050】
(プレ撮像)
図20,21,22を用いて、プレ撮像の動作を説明する。
【0051】
図20に示されているように、各プレフレームの符号化と格納と、それに付随する音声データの符号化と格納は同時に行われる。以下では、プレフレームデータの符号化と格納方法のみが説明される。音声データの符号化方法としては公知な方法を用いることにするので、当該処理の説明は割愛される。また、音声データの格納方法は、プレフレーム符号化データの格納方法と同様であるので、当該処理の説明を割愛される。
【0052】
まず、撮像者が確実録画モード指示部207から確実録画モードの設定を指示すると(ステップS2101)、動画像撮像装置は記憶媒体208上にプレフレーム用領域を確保する(ステップS2102)。これには、図33に示されているように、ディスク上のプレフレーム用に使うための領域の一部もしくは全部を使う。また、同時に、図23に示されているように、この確保された領域の先頭アドレス(先頭アドレス1)と終了アドレス,プレフレーム用領域の全容量A(バイト)を、不図示のRAM上のインデックス領域に書き込む(ステップS2103)。さらに、図28(a)に示されているように、プレフレーム符号化データを書き込むアドレスから終了アドレスまでのデータ量を格納する、不図示のRAM上のカウンタ(カウンタR)をR=A(バイト)に設定する。
【0053】
上述処理が終了すると、動画像符号化装置は1枚のプレフレームデータの取得を行い(ステップS2105)、当該プレフレームデータの可変長符号化を行う(ステップS2206)。この可変長符号化は、フレーム符号化データ生成部1901がコーディングパスの破棄をしないことで達成する。
【0054】
符号化終了後、生成されたプレフレーム符号化データのデータサイズSが、不図示のRAM上に格納される(ステップS2107)。その後、図23に示されているように、当該プレフレーム符号化データを書き込む領域の先頭のアドレス(先頭アドレス3)を、インデックス領域に書き込む(ステップS2108)。
【0055】
続いて、図24に示されるD=R−Sが算出され、その大きさが0より大きいかどうかが判断される(ステップS2109)。もしD>=0であれば(ステップS2109でYes)、図25に示されているように、プレフレーム符号化データを全て書き込む(ステップS2210)。また、図28(b)に示されているように、カウンタRをR=Dに変更する(ステップS2111)。そして、処理をステップS2116に進める。
【0056】
一方、もしD<0であれば、図27に示されているように、プレフレーム符号化データの先頭Rバイトを先頭アドレス3から書き込み(ステップS2112)、続くS−Rバイトのデータを先頭アドレス1から書き込む(ステップS2113)。その上で、カウンタRをR=A−(S−R)に設定し(図28(c),ステップS2114)、処理をステップS2015に進める。
【0057】
ステップS2115では、インデックス領域に示されているプレフレーム符号化データの並び換えが行われる。この処理のフローは図22に示されている。
【0058】
同図において、当該プレフレーム符号化データの書き込みより以前に書き込まれているプレフレーム符号化データの内、当該プレフレーム符号化データに上書きされてしまったプレフレームが存在するかどうかが判断される(ステップS2201,図29(a)−(c))。もし上書きされたデータがない場合(ステップS2201でNo)、処理を戻す。一方、もし上書きされたデータが存在する場合(ステップS2201でYes)、図30に示されているように、上書きされたプレフレーム符号化データの先頭アドレス3を消去し、残っているプレフレーム符号化データの先頭アドレス3の格納を変更する(ステップS2202)。その後、処理を戻す。
【0059】
ステップS2016では、本撮像開始/終了指示部209から本撮像の指示がなされているかどうかが検証される。もし、本撮像の指示がなされている場合(ステップS2117でYes)、動画像撮像装置は、プレ撮像を終了する(ステップS2017)。
【0060】
なお、本撮像が終了した際には、図35中のヘッダに、プレ撮像が行われたことを示す情報と、先頭アドレス1,2と終了アドレス,1フレームあたりの符号量,各プレフレーム符号化データは可変長符号化されていることを示す情報が格納される(ステップS2118)。これらの情報が格納されるヘッダ中の領域として、通常の復号装置は読み飛ばす領域(フリースペース)などが考えられる。
【0061】
もし、本撮像の指示がなされていない場合(ステップS2117でNo)、処理をS2105に戻す。
【0062】
なおプレフレーム符号化データの復号時においては、先頭アドレス2からデータの取得/復号を開始する。なお、各プレフレーム符号化データの取得/復号においては、プレフレーム符号化データの先頭にあるヘッダ内に書き込まれている、データ長が参照される。
【0063】
以上、本実施の形態では、希望開始時刻からの動画像データの確実な取得/再生を行うための方法を示した。なお、各プレフレーム符号化データの画質が大きく変動することのないように、各プレフレームデータは可変長符号化された。
【0064】
(第3の実施の形態)
一般的に、標準方式により符号化された動画像データは、様々なメーカーが提供する再生装置により再生される。しかし、第1,2の実施の形態において、フレームデータと音声データを符号化する方式が標準方式であるとしても、かならずしも多くのメーカーが提供する再生装置が、プレフレーム符号化データとそれに付随する音声符号化データを再生できるわけではない。なぜならば、プレフレーム符号化データとそれに付随する音声符号化データは、本撮像により得られた動画像符号化データが格納されているディスク上の領域とは異なる領域に格納されているからである。
【0065】
そこで、本実施の形態においては、プレフレーム符号化データとそれに付随する音声符号化データが、多くのメーカーが提供する再生装置で再生されるような、データの格納方法が示される。
【0066】
なお本実施の形態における動画像符号化装置の動作は、プレフレーム符号化データとそれに付随する音声符号化データのディスクへの書き込み以外、第1の実施の形態における動作と同じであるので、以下では、当該ディスクへの書き込みのみが説明される。
【0067】
本実施の形態における動画像符号化装置のブロック図を図31に示す。同図は、図2における記憶媒体208を記憶媒体3101に置換したものである。
【0068】
本実施の形態における記憶媒体3101は、プレ撮像中、所定のディスク上の領域にプレフレーム符号化データとそれに付随する音声符号化データを書き込む。
【0069】
撮像者からの本撮像の開始の指示があると、記憶媒体3101は、動画像符号化データを書き込むべき領域に、プレフレーム符号化データとそれに付随する音声符号化データを時間順にコピーする。その上で、本撮像により得られたフレーム符号化データとそれに付随する音声符号化データを、当該プレフレーム符号化データとそれに付随する音声符号化データに後続させて書き込む。
【0070】
なお、動画像符号化データの先頭に付されるヘッダは、プレフレーム符号化データの前に書き込まれる。
【0071】
以上、本実施の形態では、希望開始時刻からの動画像データの確実な取得/再生を行うための方法を示した。なお、プレフレーム符号化データとそれに付随する音声符号化データは、多くのメーカーが提供する再生装置で再生されるように、ディスク上に書き込まれた。
【0072】
(その他の実施形態)
プレフレームデータとそれに付随する音声データは、符号化された上でプレフレームデータ用領域に書き換えられなくてもよい。本撮影の開始後、プレフレームデータ用領域に格納されているプレフレームデータを符号化してもよい。これにより、取得したプレフレームデータを逐次符号化する方法と比較して、省電力化が達成される。
【0073】
データを格納するメディアは、ディスクに限られない。テープ,フラッシュメモリなどが使用されても構わない。
【0074】
格納するデータの全てを、一つのメディアに格納する必要はない。例えば、動画像符号化データをディスクに格納し、プレデータに係るデータをフラッシュメモリに格納するという格納方法も、本発明の範疇である。
【0075】
画像データの系列変換の方式はDWTに限られるものではない。系列変換として、DCT等を使用する方法も、本発明の範疇に入る。
【0076】
第3の実施の形態において、プレフレームデータとそれに付随する音声データを可変長符号化しても構わない。
【0077】
第2の実施の形態において、視覚的に重要でないコーディングパスの破棄を行った上で、可変長符号化を達成しても構わない。
【0078】
第3の実施の形態における動画像符号化装置は、第2の実施の形態のような可変長符号化されたプレフレーム符号化データとそれに付随する音声符号化データを扱ってもよい。
【0079】
(変形例)
なお、本発明は複数の機器(例えばホストコンピュ−タ、インタ−フェ−ス機器、リ−ダ、プリンタ等)から構成されるシステムの一部として適用しても、1つの機器(例えば複写機、デジタルカメラ等)からなる装置の1部に適用しても良い。
【0080】
また、本発明は上記実施の形態を実現するための装置及び方法のみに限定されるものではなく、上記システム又は装置内のコンピュ−タ(CPU或いはMPU)に、上記実施の形態を実現するためのソフトウエアのプログラムコ−ドを供給し、このプログラムコ−ドに従って上記システム或いは装置のコンピュ−タが上記各種デバイスを動作させることにより上記実施の形態を実現する場合も本発明の範疇に含まれる。
【0081】
またこの場合、前記ソフトウエアに関するプログラムコ−ド自体が上記実施の形態の機能を実現することになり、そのプログラムコ−ド自体、及びそのプログラムコ−ドをコンピュ−タに供給するための手段、具体的には上記プログラムコ−ドを格納した記憶媒体は本発明の範疇に含まれる。
【0082】
この様なプログラムコ−ドを格納する記憶媒体としては、例えばフロッピー(登録商標)ディスク、ハ−ドディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テ−プ、不揮発性のメモリカ−ド、ROM等を用いることができる。
【0083】
また、上記コンピュ−タが、供給されたプログラムコ−ドのみに従って各種デバイスを制御することにより、上記実施の形態の機能が実現される場合だけではなく、上記プログラムコ−ドがコンピュ−タ上で稼動しているOS(オペレ−ティングシステム)、或いは他のアプリケ−ションソフト等と共同して上記実施の形態が実現される場合にもかかるプログラムコ−ドは本発明の範疇に含まれる。
【0084】
更に、この供給されたプログラムコ−ドが、コンピュ−タの機能拡張ボ−ドやコンピュ−タに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコ−ドの指示に基づいてその機能拡張ボ−ドや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上記実施の形態が実現される場合も本発明の範疇に含まれる。
【0085】
【発明の効果】
以上の説明により、本発明によれば、希望開始時刻からの動画像データの確実な取得/再生を行うことが可能となる。
【図面の簡単な説明】
【図1】動画像データの説明図である。
【図2】本発明の第1の実施形態における動画像符号化装置の概略構成を示すブロック図である。
【図3】本発明の第1の実施形態におけるフレームデータ符号化部202の概略構成を示すブロック図である。
【図4】本発明の第1の実施形態における動画像符号化装置が行う動画像データの、本撮像における符号化処理のフローチャートである。
【図5】本発明の第1の実施形態におけるフレームデータ符号化部202が行うフレームデータの符号化処理のフローチャートである。
【図6】1次元離散ウェーブレット変換の説明図である。
【図7】(a)は4つのサブバンドに分解する図、(b)は(a)のLLサブバンドを更に4つのサブバンドに分解する図、(c)は(b)のLLサブバンドを更に4つのサブバンドに分解する図である。
【図8】量子化ステップの説明図である。
【図9】コードブロック分割の説明図である。
【図10】ビットプレーン分割の説明図である。
【図11】コーディングパスの説明図である。
【図12】レイヤー生成の説明図である。
【図13】レイヤー生成の説明図である。
【図14】タイル符号化データの構成の説明図である。
【図15】フレーム符号化データの構成の説明図である。
【図16】タイル分割の説明図である。
【図17】プレフレームデータの符号化処理のフローチャートである。
【図18】本発明の第2の実施形態における動画像符号化装置の概略構成を示すブロック図である。
【図19】本発明の第2の実施形態におけるフレームデータ符号化部1801の概略構成を示すブロック図である。
【図20】本発明の第2の実施形態におけるプレ撮像のフローチャートである。
【図21】本発明の第2の実施形態におけるプレ撮像のフローチャートである。
【図22】本発明の第2の実施形態におけるプレ撮像のフローチャートである。
【図23】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図24】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図25】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図26】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図27】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図28】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図29】(a)−(c)は本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図30】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図31】本発明の第3の実施形態における動画像再生装置の概略構成を示すブロック図である。
【図32】希望開始時刻と実開始時刻の説明図である。
【図33】プレフレーム用領域の確保の説明図である。
【図34】動画像符号化データの構成の説明図である。
【図35】動画像符号化データの構成の説明図である。
【発明の属する技術分野】
本発明は、動画像を符号化する動画像符号化装置、動画像符号化データに対して再生処理を施す動画像再生装置及びその方法並びに記憶媒体に関するものである。
【0002】
【従来の技術】
昨今、デジカメやカムコーダの低価格化に伴い、これらの撮像装置により動画像を撮像する機会が増えてきた。また、それに伴い、これらの撮像装置を使用するユーザーが要求するスペックは、ますます向上するばかりである。
【0003】
これらのユーザーの要求にこたえるため、メーカーはより高性能な撮像装置の開発に取り組んでいる。特に、企業は、ユーザーに対して商品価値の高さをアピールできる高画素化を最も重要な開発項目のひとつとしている傾向にある。
【0004】
【発明が解決しようとする課題】
このような開発競争により、一部のユーザーにとって、画素数に関しては十分満足される製品が揃ってきた。またこれに伴い、ユーザーは様々な機能上の不十分さにも目を向けるようになった。この機能上の不十分さのひとつに、撮影のディレイがある。このディレイとは、撮像者が所望とする撮像の開始時刻(希望開始時刻)と、実際に撮像が開始される時刻(実開始時刻)が異なることである。当問題は、撮像者が撮像を思い立ってから、撮像を撮像装置に指示するまで、タイムラグがあることに起因する。
【0005】
【課題を解決するための手段】
そこで本発明が目的とするところは、デジカメやカムコーダ等による動画像の撮像において、希望開始時刻からの確実な動画像データの録画と再生を可能とする、動画像の取得方法と、当該動画像データを符号化する方法と、この符号化により得られた動画像符号化データを格納する方法を提供することである。
【0006】
【発明の実施の形態】
(第1の実施の形態)
本発明における動画像は、図1に示されているように、画像と音声から構成され、さらに画像は瞬間瞬間の情報を表すフレームから構成されている。
【0007】
このような動画像の撮像において、図32に示されているように、撮像者が撮像を決めてから撮像の開始を命じるまでタイムラグが生じるため、動画像撮像装置が希望開始時刻から動画像データの取得を行えないことがある。そこで本実施の形態においては、希望開始時刻からの動画像データの取得を行う録画モード(確実録画モード)が設定されると、撮像者が撮像開始指示部により撮像の開始を命じなくても、本撮像装置は撮像を行う。また、本撮像装置は、この撮像を開始するにあたり、図33に示されているように、確実録画モードが設定されてから、撮像開始の指示が与えられるまでの時刻に取得するフレーム(プレフレーム)のデータ(プレフレームデータ)を繰り返し書き換えていくための、ディスク上の領域(プレフレーム用領域)を確保する。なお、本実施の形態においては、プレフレーム符号化データによる再生時間は常に一定になるように、プレフレームデータは固定長符号化されるので、プレフレーム用領域として、(1プレフレームの符号量)x(整数)の領域が確保される。同時に、このプレフレームの先頭アドレス(先頭アドレス1)と終了アドレス、それと1フレームあたりの符号量が不図示のRAM上に格納される。
【0008】
さらに、撮像者から撮像の指示が与えられ、撮像(本撮像)を開始すると、プレフレームの内、最も時間的に早いプレフレームの先頭アドレス(先頭アドレス2)を不図示のRAM上に格納する。
【0009】
その後、撮像装置は、本撮像で得られるフレームデータ(本フレームデータ)を符号化し、ディスクに書き込む。また、本撮像が終了し、全ての符号化された本フレームデータが格納されると、上述3つのアドレスをディスク上に書き込む。
【0010】
このように本実施の形態は、これらのプレフレームデータをディスク上へ格納することと、上述3つのアドレスの保持により、希望開始時刻のフレームからの再生を可能とする。
【0011】
以下の説明では、まず本撮像における動画像符号化装置の処理を説明し、それに続いて確実録画モードが設定された場合における撮像(プレ撮像)の説明を行う。
【0012】
(本撮像の説明)
図2に本実施の形態における動画像符号化装置のブロック図を示すと共に、当該動画像符号化装置における本撮像の処理のフローチャートを図3に示す。
【0013】
まず、本撮像開始/終了指示部209から本撮像の開始の指示がされると、動画像撮像装置は、画像データと音声データを、画像データ取得部201と音声データ取得部203から入力する(ステップS401)。この画像データ取得部201と音声データ取得部203は、例えばデジタルビデオカメラ、デジタルスチルカメラ等の撮像装置、或いはCCDなどの撮像デバイス、或いはネットワーク回線のインターフェース等が用いられる。また、画像データ取得部201と音声データ取得部203はRAM、ROM、ハードディスク、CD−ROM等の記録媒体であっても良い。
【0014】
画像データ取得部201から取得された画像データは、フレームのデータ(フレームデータ)毎、フレームデータ符号化部202に入力され、音声データ取得部203から取得された音声データは、音声データ符号化部204に入力される。フレームデータ符号化部202,音声データ符号化部204に入力されたフレームデータと音声データは符号化されて(ステップS402)、データ統合部205に出力される。このフレームデータ符号化部202の動作については、後程詳述する。また、音声データの符号化方法として、MPEG4で規定される様々な音声データの符号化方式(AAC,MP3,など)を使用するものとし、音声データ符号化部203の動作については、省略する。
【0015】
データ統合部205に音声符号化データとフレーム符号化データが入力されると、図34に示されているように、フレーム符号化データと音声符号化データが所定の規則に基づき並べられる。この統合されたフレーム符号化データと音声符号化データは、出力部206から記憶媒体208に出力され、当該記憶媒体に格納される(ステップS403)。なお本実施の形態においては、記憶媒体208として、CDやDVD−R/+RW/−RW/RAMなどの光ディスク,MOなどの光磁気ディスク,HDDやZIPなどの磁気ディスクを想定する。
【0016】
統合されたフレーム符号化データと音声符号化データの記憶媒体208への格納が終了すると、本撮像開始/終了指示部209から本撮像の終了の指示がされたか否かが判断される(ステップS404)。もし終了の指示がなされていない場合(ステップS404でNo)、処理はステップS401に戻される。一方、終了の指示がされていた場合(ステップS404でYes)、図35に示されているように、復号に必要となるデータを格納したヘッダをディスク上に書き込む(ステップS405)。これにより、ディスク上に動画像符号化データが形成され、処理が終了となる。
【0017】
<フレームデータ符号化部202における処理>
次に、フレームデータ符号化部202のブロック図を図3に示し、当該処理部の処理のフローチャートを図5に示し、これらの図を用いて、フレームデータの符号化の処理を説明する。
【0018】
本実施の形態におけるフレーム中の符号化対象となるフレームデータは、8ビットのモノクロフレームデータとする。しかしながら、各画素4ビット、10ビット、12ビットといった具合に8ビット以外のビット数で表すモノクロ画像、或いは各画素における各色成分(RGB/Lab/YCrCb)を8ビットで表現するカラーの多値フレームデータである場合に適用することも可能である。また、画像を構成する各画素の状態等を表す多値情報である場合、例えば各画素の色を表す多値のインデックス値である場合にも適用できる。これらに応用する場合には、各種類の多値情報を後述するモノクロフレームデータとすればよい。
【0019】
まず、フレームデータ取得部201から、フレームデータ入力部301へ、符号化対象となるフレームデータを構成する画素データがラスタースキャン順に入力され、タイル分割部302に出力される。このフレームデータ入力部301は、例えばスキャナ、デジタルカメラ等の撮像装置、或いはCCDなどの撮像デバイス、或いはネットワーク回線のインターフェース等が用いられる。また、フレームデータ入力部301はRAM、ROM、ハードディスク、CD−ROM等の記録媒体であっても良い。
【0020】
タイル分割部302は、フレームデータ入力部301から入力される1枚の画像をN枚のタイルに分割し(ステップS501)、各タイルを識別するためにラスタースキャン順にタイルナンバーi=0, 1, 2, ...,N−1を割り振るものとする。なお、本実施の形態では、図16に示されているように、画像を横8,縦6に分割し、48枚のタイルを作り出すものとする。
【0021】
ここで、各タイルを表すデータをタイルデータと呼ぶことにする。これら生成されたタイルデータは、順に離散ウェーブレット変換部303に送られる。なお、離散ウェーブレット変換部303以降の処理において、タイルは独立に符号化されるものとする。また、ここで、当該フレームデータ符号化部202が処理しているタイルを認識するための不図示のカウンタがi=0に設定される(ステップS502)。
【0022】
離散ウェーブレット変換部303は、タイル分割部302から入力される、1つの静止画像中の1つのタイルデータx(n)における複数の画素(参照画素)のデータ(参照画素データ)を用いて離散ウェーブレット変換を行う(ステップS503)。
【0023】
以下に、離散ウェーブレット変換後のフレームデータ(離散ウェーブレット変換係数)を示す。
【0024】
Y(2n) = X(2n)+floor{ (Y(2n−1)+Y(2n+1)+2)/4 }
Y(2n+1) = X(2n+1)−floor{ (X(2n)+X(2n+2))/2 }
Y(2n),Y(2n+1)は離散ウェーブレット変換係数列であり、Y(2n)は低周波サブバンド、Y(2n+1)は高周波サブバンドである。また、上式においてfloor{X}はXを超えない最大の整数値を表す。この離散ウェーブレット変換を模式的に表わしたのが図6である。
【0025】
本変換式は一次元のデータに対するものであるが、この変換を水平方向、垂直方向の順に適用して二次元の変換を行うことにより、図7(a)の様なLL,HL,LH,HHの4つのサブバンドに分割することができる。ここで、Lは低周波サブバンド、Hは高周波サブバンドを示している。次にLLサブバンドを、同じ様に4つのサブバンドに分け(図7(b))、その中のLLサブバンドをまた4サブバンドに分ける(図7(c))。合計10サブバンドを作る。10個のサブバンドそれぞれに対して、図7(c)の様にHH1,HL1,…と呼ぶことにする。ここで、各サブバンドの名称における数字を、それぞれのサブバンドのレベルとする。つまり、レベル1のサブバンドは、HL1,HH1,LH1、レベル2のサブバンドは、HL2,HH2,LH2である。なおLLサブバンドは、レベル0のサブバンドとする。LLサブバンドはひとつしかないので添字を付けない。またレベル0からレベルnまでのサブバンドを復号することで得られる復号画像を、レベルnの復号画像と呼ぶ。復号画像は、そのレベルが高い程解像度は高い。
【0026】
10個のサブバンドの変換係数は、いったんバッファ304に格納されLL,HL1,LH1,HH1,HL2,LH2,HH2,HL3,LH3,HH3の順に、つまり、レベルが低いサブバンドからレベルが高いサブバンドの順に、係数量子化部305へ出力される。
【0027】
係数量子化部305では、バッファ304から出力される各サブバンドの変換係数を各周波数成分毎に定めた量子化ステップで量子化し、量子化後の値(係数量子化値)をエントロピー符号化部306へ出力する(ステップS504)。係数値をX、この係数の属する周波数成分に対する量子化ステップの値をqとするとき、量子化後の係数値Q(X)は次式によって求めるものとする。
【0028】
Q(X)=floor{(X/q)+0.5}
本実施の形態における各周波数成分と量子化ステップとの対応を図8に示す。同図に示す様に、よりレベルが高いサブバンドの方に、大きい量子化ステップを与えている。なお、各サブバンド毎の量子化ステップは予め不図示のRAMやROMなどのメモリに格納されているものとする。そして、一つのサブバンドにおける全ての変換係数を量子化した後、それら係数量子化値をエントロピー符号化部306へ出力する。
【0029】
エントロピー符号化部306では、入力された係数量子化値がエントロピー符号化される(ステップS505)。ここでは、まず、図9に示されているように、入力された係数量子化値の集まりである各サブバンドが矩形(コードブロックと呼ぶ)に分割される。なお、このコードブロックの大きさには、2m×2n(m、nは2以上の整数)等が設定される。さらにこのコードブロックは、図10に示されているように、ビットプレーンに分割される。その上で、図11に示されているように、あるビットプレーンにおける各ビットは、ある分類規則に基づいて3種類に分けられて、同じ種類のビットを集めたコーディングパスが3種類生成される。入力された係数量子化値は、ここで得られたコーディングパスを単位として、エントロピー符号化である二値算術符号化が行われ、エントロピー符号化値が生成される。
【0030】
なお、ここでエントロピー符号化の具体的な処理順序は、1つのコードブロックに注目すると上位ビットプレーンから下位ビットプレーンの順に符号化され、その1コードブロックのあるビットプレーンに注目すると、図11にある3種類のパスを上から順に符号化する様になっている。
【0031】
エントロピー符号化されたコーディングパスは、タイル符号化データ生成部307に出力される。
【0032】
タイル符号化データ生成部307では、入力された複数のコーディングパスから、単一もしくは複数のレイヤーが構成され、それらレイヤーをデータの単位としてタイル符号化データが生成される(ステップS506)。以下にレイヤーの構成に関する説明を行う。
【0033】
当該処理部は、図12に示されているように、複数のサブバンドにおける複数のコードブロックから、エントロピー符号化されたコーディングパスを集めた上で、レイヤーを構成する。なお、図13に示されているように、あるコードブロックからコーディングパスを取得する際、常に該コードブロックにおいて最上位に存在するコーディングパスが選ばれる。その後、タイル符号化データ生成部307は、図14に示されているように、生成したレイヤーを、上位に位置するレイヤーから順に並べた上で、その先頭にタイルヘッダを付加してタイル符号化データを生成する。このヘッダには、タイルを識別する情報や、当該タイル符号化データの符号長や、圧縮に使用した様々なパラメータ等が格納される。このように生成されたタイル符号化データは、フレーム符号化データ生成部308に出力される。
【0034】
ここで、符号化すべきタイルデータが残っている場合は、処理をステップS503に戻し、符号化すべきタイルデータが残っていない場合は、処理をステップS508に進める(ステップS507)。
【0035】
フレーム符号化データ生成部308では、図15に示されているように、タイル符号化データを所定の順番で並べた上で、先頭にヘッダを付加してフレーム符号化データを生成する(ステップS508)。このヘッダには、入力画像やタイルの縦横のサイズ、圧縮に使用した様々なパラメータ,フレーム符号化データの符号長等が格納される。このように生成されたフレーム符号化データは、フレーム符号化データ出力部309からデータ統合部205に出力される(ステップS509)。
【0036】
(プレ撮像の説明)
図17にプレ撮像の処理のフローチャートを示す。
【0037】
まず、動画像撮像装置が、撮像者から確実録画モード指示部207より確実録画の指示を受けると(ステップS1701)、記憶媒体208上にプレフレーム用領域を確保する(ステップS1702)。これには、図33に示されているように、ディスク上のプレフレーム用に使うための領域の一部もしくは全部を使う。このプレフレーム用領域は、プレフレーム1枚あたりに割り当てられる符号量を格納する区画に分割される。本実施の形態においては、プレフレーム用領域には、M枚のフレームが格納されるものとして、プレフレーム用領域はM個の区画に分割され、それぞれ、区画0,区画1,...,区画M−1と番号付けられる。なお以降の説明では、任意の区画を区画iと表現するものとする。また、各プレフレームは固定長符号化されるので、各区画の長さは一定である。なおこの区画に、ディスク上のデータが管理される単位であるセクタを適用することは好適である。
【0038】
続いて、動画像撮像装置は、この確保された領域の先頭アドレス(先頭アドレス1)と終了アドレス,1フレームあたりの符号量を不図示のRAM上に格納し(ステップS1703)、これより符号化するフレームと音声データを格納する区画として区画0を設定する(ステップS1704)。
【0039】
次に、画像データ取得部201と音声データ取得部203により、プレフレームデータとそれに付随する音声データの取得を行い(ステップS1706)、当該2つのデータをフレームデータ符号化部202と音声データ符号化部204により固定長符号化を行う。このフレームデータの符号化方法は、固定長化を図ること以外、本撮像におけるフレームデータの符号化方法と同様である。なお固定長化は、ステップS504の量子化の調整や、S508のタイル符号化データの生成においてタイル符号化データに組み込むコーディングパスの枚数の調整により、実現させることが可能である。また、適宜復号器が復号時に読み飛ばすデータ(コメントデータ)をフレーム符号化データ中に挿入することで実現させることも可能である。さらには、上述2つの調整とコメントデータを組み合わせることで、固定長化を実現することも可能である。
【0040】
なお、音声符号化データの固定長化については、ここでは論じない。
【0041】
固定長符号化により生成されたプレフレーム符号化データと音声符号化データは、データ統合部205により統合され、記憶媒体208に出力される。記憶媒体208に出力されたプレフレーム符号化データと音声符号化データは、区画iに書き込まれる(ステップS1707)。この書き込みが終ると、まず、本撮像開始/終了指示部209から本撮像の指示がなされているかどうかが検証される(ステップS1708)。もし、本撮像の指示がなされている場合(ステップS1708でYes)、動画像撮像装置は、プレ撮像を終了する(ステップS1709)。さらに、時間的に最も早い時間を担持するプレフレーム符号化データが格納されている区画i+1のアドレス(先頭アドレス2)が不図示のRAM上に格納される(ステップS1710)。これをもって、プレ撮像は終了する。
【0042】
なお、本撮像が終了した際には、図35中のヘッダに、プレ撮像が行われたことを示す情報と、先頭アドレス1,2と終了アドレス,1フレームあたりの符号量,各プレフレーム符号化データは固定長化されていることを示す情報が格納される。これらの情報が格納されるヘッダ中の領域として、通常の復号装置は読み飛ばす領域(フリースペース)などが考えられる。
【0043】
もし、本撮像の指示がなされていない場合(ステップS1710でNo)、現在の書き込み区画の検証が行われる(ステップS1711)。もしi=M−1であるならば(ステップS1711でYes)、i=0に設定した上で(ステップS1712)、処理をS1705に戻す。また、i=M−1でなければ(ステップS1711でNo)、i=i+1とした上で(ステップS1713)、処理をS1705に戻す。
【0044】
以上、本実施の形態では、希望開始時刻からの動画像データの確実な取得/再生を行うための方法を示した。なお、プレフレーム符号化データによる再生時間は常に一定になるように、プレフレームデータは固定長符号化された。
【0045】
(第2の実施の形態)
第1の実施の形態においては、プレフレーム符号化データを固定長化した上で、希望開始時刻からの動画像データの確実な取得/再生を行うための方法を示した。しかし、このプレフレーム符号化データの固定長化は、プレフレーム符号化データ毎に復号画質の大幅な変動を招く可能性がある。
【0046】
そこで本実施の形態では、プレフレームデータを可変長符号化することで、プレフレーム符号化データの復号画質をほぼ一定とする方法を示す。
【0047】
なお本実施の形態における動画像符号化装置の動作は、プレ撮像以外、第1の実施の形態における動作と同じであるので、以下では、プレ撮像のみが説明される。
【0048】
図18に本実施の形態における動画像符号化装置のブロック図を示す。同図は、図2におけるフレームデータ符号化部202と音声データ符号化部204を、フレームデータ符号化部1801と音声データ符号化部1802に置換したものである。
【0049】
また、図19にフレームデータ符号化部1801のブロック図を示す。同図は、図3におけるフレーム符号化データ生成部308をフレーム符号化データ生成部1901に置換したものである。
【0050】
(プレ撮像)
図20,21,22を用いて、プレ撮像の動作を説明する。
【0051】
図20に示されているように、各プレフレームの符号化と格納と、それに付随する音声データの符号化と格納は同時に行われる。以下では、プレフレームデータの符号化と格納方法のみが説明される。音声データの符号化方法としては公知な方法を用いることにするので、当該処理の説明は割愛される。また、音声データの格納方法は、プレフレーム符号化データの格納方法と同様であるので、当該処理の説明を割愛される。
【0052】
まず、撮像者が確実録画モード指示部207から確実録画モードの設定を指示すると(ステップS2101)、動画像撮像装置は記憶媒体208上にプレフレーム用領域を確保する(ステップS2102)。これには、図33に示されているように、ディスク上のプレフレーム用に使うための領域の一部もしくは全部を使う。また、同時に、図23に示されているように、この確保された領域の先頭アドレス(先頭アドレス1)と終了アドレス,プレフレーム用領域の全容量A(バイト)を、不図示のRAM上のインデックス領域に書き込む(ステップS2103)。さらに、図28(a)に示されているように、プレフレーム符号化データを書き込むアドレスから終了アドレスまでのデータ量を格納する、不図示のRAM上のカウンタ(カウンタR)をR=A(バイト)に設定する。
【0053】
上述処理が終了すると、動画像符号化装置は1枚のプレフレームデータの取得を行い(ステップS2105)、当該プレフレームデータの可変長符号化を行う(ステップS2206)。この可変長符号化は、フレーム符号化データ生成部1901がコーディングパスの破棄をしないことで達成する。
【0054】
符号化終了後、生成されたプレフレーム符号化データのデータサイズSが、不図示のRAM上に格納される(ステップS2107)。その後、図23に示されているように、当該プレフレーム符号化データを書き込む領域の先頭のアドレス(先頭アドレス3)を、インデックス領域に書き込む(ステップS2108)。
【0055】
続いて、図24に示されるD=R−Sが算出され、その大きさが0より大きいかどうかが判断される(ステップS2109)。もしD>=0であれば(ステップS2109でYes)、図25に示されているように、プレフレーム符号化データを全て書き込む(ステップS2210)。また、図28(b)に示されているように、カウンタRをR=Dに変更する(ステップS2111)。そして、処理をステップS2116に進める。
【0056】
一方、もしD<0であれば、図27に示されているように、プレフレーム符号化データの先頭Rバイトを先頭アドレス3から書き込み(ステップS2112)、続くS−Rバイトのデータを先頭アドレス1から書き込む(ステップS2113)。その上で、カウンタRをR=A−(S−R)に設定し(図28(c),ステップS2114)、処理をステップS2015に進める。
【0057】
ステップS2115では、インデックス領域に示されているプレフレーム符号化データの並び換えが行われる。この処理のフローは図22に示されている。
【0058】
同図において、当該プレフレーム符号化データの書き込みより以前に書き込まれているプレフレーム符号化データの内、当該プレフレーム符号化データに上書きされてしまったプレフレームが存在するかどうかが判断される(ステップS2201,図29(a)−(c))。もし上書きされたデータがない場合(ステップS2201でNo)、処理を戻す。一方、もし上書きされたデータが存在する場合(ステップS2201でYes)、図30に示されているように、上書きされたプレフレーム符号化データの先頭アドレス3を消去し、残っているプレフレーム符号化データの先頭アドレス3の格納を変更する(ステップS2202)。その後、処理を戻す。
【0059】
ステップS2016では、本撮像開始/終了指示部209から本撮像の指示がなされているかどうかが検証される。もし、本撮像の指示がなされている場合(ステップS2117でYes)、動画像撮像装置は、プレ撮像を終了する(ステップS2017)。
【0060】
なお、本撮像が終了した際には、図35中のヘッダに、プレ撮像が行われたことを示す情報と、先頭アドレス1,2と終了アドレス,1フレームあたりの符号量,各プレフレーム符号化データは可変長符号化されていることを示す情報が格納される(ステップS2118)。これらの情報が格納されるヘッダ中の領域として、通常の復号装置は読み飛ばす領域(フリースペース)などが考えられる。
【0061】
もし、本撮像の指示がなされていない場合(ステップS2117でNo)、処理をS2105に戻す。
【0062】
なおプレフレーム符号化データの復号時においては、先頭アドレス2からデータの取得/復号を開始する。なお、各プレフレーム符号化データの取得/復号においては、プレフレーム符号化データの先頭にあるヘッダ内に書き込まれている、データ長が参照される。
【0063】
以上、本実施の形態では、希望開始時刻からの動画像データの確実な取得/再生を行うための方法を示した。なお、各プレフレーム符号化データの画質が大きく変動することのないように、各プレフレームデータは可変長符号化された。
【0064】
(第3の実施の形態)
一般的に、標準方式により符号化された動画像データは、様々なメーカーが提供する再生装置により再生される。しかし、第1,2の実施の形態において、フレームデータと音声データを符号化する方式が標準方式であるとしても、かならずしも多くのメーカーが提供する再生装置が、プレフレーム符号化データとそれに付随する音声符号化データを再生できるわけではない。なぜならば、プレフレーム符号化データとそれに付随する音声符号化データは、本撮像により得られた動画像符号化データが格納されているディスク上の領域とは異なる領域に格納されているからである。
【0065】
そこで、本実施の形態においては、プレフレーム符号化データとそれに付随する音声符号化データが、多くのメーカーが提供する再生装置で再生されるような、データの格納方法が示される。
【0066】
なお本実施の形態における動画像符号化装置の動作は、プレフレーム符号化データとそれに付随する音声符号化データのディスクへの書き込み以外、第1の実施の形態における動作と同じであるので、以下では、当該ディスクへの書き込みのみが説明される。
【0067】
本実施の形態における動画像符号化装置のブロック図を図31に示す。同図は、図2における記憶媒体208を記憶媒体3101に置換したものである。
【0068】
本実施の形態における記憶媒体3101は、プレ撮像中、所定のディスク上の領域にプレフレーム符号化データとそれに付随する音声符号化データを書き込む。
【0069】
撮像者からの本撮像の開始の指示があると、記憶媒体3101は、動画像符号化データを書き込むべき領域に、プレフレーム符号化データとそれに付随する音声符号化データを時間順にコピーする。その上で、本撮像により得られたフレーム符号化データとそれに付随する音声符号化データを、当該プレフレーム符号化データとそれに付随する音声符号化データに後続させて書き込む。
【0070】
なお、動画像符号化データの先頭に付されるヘッダは、プレフレーム符号化データの前に書き込まれる。
【0071】
以上、本実施の形態では、希望開始時刻からの動画像データの確実な取得/再生を行うための方法を示した。なお、プレフレーム符号化データとそれに付随する音声符号化データは、多くのメーカーが提供する再生装置で再生されるように、ディスク上に書き込まれた。
【0072】
(その他の実施形態)
プレフレームデータとそれに付随する音声データは、符号化された上でプレフレームデータ用領域に書き換えられなくてもよい。本撮影の開始後、プレフレームデータ用領域に格納されているプレフレームデータを符号化してもよい。これにより、取得したプレフレームデータを逐次符号化する方法と比較して、省電力化が達成される。
【0073】
データを格納するメディアは、ディスクに限られない。テープ,フラッシュメモリなどが使用されても構わない。
【0074】
格納するデータの全てを、一つのメディアに格納する必要はない。例えば、動画像符号化データをディスクに格納し、プレデータに係るデータをフラッシュメモリに格納するという格納方法も、本発明の範疇である。
【0075】
画像データの系列変換の方式はDWTに限られるものではない。系列変換として、DCT等を使用する方法も、本発明の範疇に入る。
【0076】
第3の実施の形態において、プレフレームデータとそれに付随する音声データを可変長符号化しても構わない。
【0077】
第2の実施の形態において、視覚的に重要でないコーディングパスの破棄を行った上で、可変長符号化を達成しても構わない。
【0078】
第3の実施の形態における動画像符号化装置は、第2の実施の形態のような可変長符号化されたプレフレーム符号化データとそれに付随する音声符号化データを扱ってもよい。
【0079】
(変形例)
なお、本発明は複数の機器(例えばホストコンピュ−タ、インタ−フェ−ス機器、リ−ダ、プリンタ等)から構成されるシステムの一部として適用しても、1つの機器(例えば複写機、デジタルカメラ等)からなる装置の1部に適用しても良い。
【0080】
また、本発明は上記実施の形態を実現するための装置及び方法のみに限定されるものではなく、上記システム又は装置内のコンピュ−タ(CPU或いはMPU)に、上記実施の形態を実現するためのソフトウエアのプログラムコ−ドを供給し、このプログラムコ−ドに従って上記システム或いは装置のコンピュ−タが上記各種デバイスを動作させることにより上記実施の形態を実現する場合も本発明の範疇に含まれる。
【0081】
またこの場合、前記ソフトウエアに関するプログラムコ−ド自体が上記実施の形態の機能を実現することになり、そのプログラムコ−ド自体、及びそのプログラムコ−ドをコンピュ−タに供給するための手段、具体的には上記プログラムコ−ドを格納した記憶媒体は本発明の範疇に含まれる。
【0082】
この様なプログラムコ−ドを格納する記憶媒体としては、例えばフロッピー(登録商標)ディスク、ハ−ドディスク、光ディスク、光磁気ディスク、CD−ROM、磁気テ−プ、不揮発性のメモリカ−ド、ROM等を用いることができる。
【0083】
また、上記コンピュ−タが、供給されたプログラムコ−ドのみに従って各種デバイスを制御することにより、上記実施の形態の機能が実現される場合だけではなく、上記プログラムコ−ドがコンピュ−タ上で稼動しているOS(オペレ−ティングシステム)、或いは他のアプリケ−ションソフト等と共同して上記実施の形態が実現される場合にもかかるプログラムコ−ドは本発明の範疇に含まれる。
【0084】
更に、この供給されたプログラムコ−ドが、コンピュ−タの機能拡張ボ−ドやコンピュ−タに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコ−ドの指示に基づいてその機能拡張ボ−ドや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上記実施の形態が実現される場合も本発明の範疇に含まれる。
【0085】
【発明の効果】
以上の説明により、本発明によれば、希望開始時刻からの動画像データの確実な取得/再生を行うことが可能となる。
【図面の簡単な説明】
【図1】動画像データの説明図である。
【図2】本発明の第1の実施形態における動画像符号化装置の概略構成を示すブロック図である。
【図3】本発明の第1の実施形態におけるフレームデータ符号化部202の概略構成を示すブロック図である。
【図4】本発明の第1の実施形態における動画像符号化装置が行う動画像データの、本撮像における符号化処理のフローチャートである。
【図5】本発明の第1の実施形態におけるフレームデータ符号化部202が行うフレームデータの符号化処理のフローチャートである。
【図6】1次元離散ウェーブレット変換の説明図である。
【図7】(a)は4つのサブバンドに分解する図、(b)は(a)のLLサブバンドを更に4つのサブバンドに分解する図、(c)は(b)のLLサブバンドを更に4つのサブバンドに分解する図である。
【図8】量子化ステップの説明図である。
【図9】コードブロック分割の説明図である。
【図10】ビットプレーン分割の説明図である。
【図11】コーディングパスの説明図である。
【図12】レイヤー生成の説明図である。
【図13】レイヤー生成の説明図である。
【図14】タイル符号化データの構成の説明図である。
【図15】フレーム符号化データの構成の説明図である。
【図16】タイル分割の説明図である。
【図17】プレフレームデータの符号化処理のフローチャートである。
【図18】本発明の第2の実施形態における動画像符号化装置の概略構成を示すブロック図である。
【図19】本発明の第2の実施形態におけるフレームデータ符号化部1801の概略構成を示すブロック図である。
【図20】本発明の第2の実施形態におけるプレ撮像のフローチャートである。
【図21】本発明の第2の実施形態におけるプレ撮像のフローチャートである。
【図22】本発明の第2の実施形態におけるプレ撮像のフローチャートである。
【図23】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図24】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図25】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図26】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図27】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図28】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図29】(a)−(c)は本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図30】本発明の第2の実施形態におけるプレフレーム符号化データの格納方法の説明図である。
【図31】本発明の第3の実施形態における動画像再生装置の概略構成を示すブロック図である。
【図32】希望開始時刻と実開始時刻の説明図である。
【図33】プレフレーム用領域の確保の説明図である。
【図34】動画像符号化データの構成の説明図である。
【図35】動画像符号化データの構成の説明図である。
Claims (6)
- 動画像を符号化して記録する記録装置であって、
画像の撮像手段と、
撮像された動画像をフレーム単位のデータに分割する分割手段と、
フレーム単位のデータを1つもしくは1つ以上の所定の大きさのタイルに分割し、タイル単位のタイルデータを生成するタイルデータ生成手段と、
前記タイルデータに対して離散ウェーブレット変換を行い、変換係数を生成する変換手段と、
前記変換係数を量子化して量子化係数を生成する量子化手段と、
前記量子化係数に対してエントロピー符号化を行い、エントロピー符号化値を生成するエントロピー符号化手段と、
前記エントロピー符号化値に対して、復号に必要となるヘッダ等の情報を付加してタイル符号化データを生成するタイル符号化データ生成手段と、
1つもしくは複数あるタイル符号化データを並べて、さらに並べられた複数のタイルに対して復号に必要となるヘッダ等の情報を付加してフレーム符号化データを生成するフレーム符号化データ生成手段と、
前記フレーム符号化データを記録する記録手段とを有し、
前記記録手段が本撮像に先立ってプレ撮像の開始を指示されたとき、前記記録手段は記憶媒体上にプレ撮像により得られたフレーム符号化データを繰り返し書き込むための領域を確保し、プレ撮像中は前記領域に画像を繰り返し記録する記録することを特徴とする記録装置。 - 請求項1において、前記フレーム符号化データ生成手段は、1つもしくはそれ以上のエントロピー符号化値における、視覚上重要でないデータを破棄することでプレフレーム符号化データの固定長化を図ることを特徴とする記録装置。
- 請求項1において、前記フレーム符号化データ生成手段は、エントロピー符号化値のデータの破棄を行わないで、プレフレーム符号化データの可変長化を図ることを特徴とする記録装置。
- 請求項1において、前記フレーム符号化データ生成手段は、1つもしくはそれ以上のエントロピー符号化値における、視覚上重要でないデータを破棄した上で、プレフレーム符号化データの可変長化を図ることを特徴とする記録装置。
- 請求項1において、前記記録手段は本撮像の開始とともに、前記領域に記録されたプレフレーム符号化データを、前記記録媒体上の別の領域に移動させることを特徴とする記録装置。
- 請求項5において、前記領域は、前記記録媒体に記録されるデータを管理する為の管理用情報を記録する領域内にあって、前記別の領域とは本撮像による画像を記録する為の領域内にあることを特徴とする記録装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003027168A JP2004241906A (ja) | 2003-02-04 | 2003-02-04 | カムコーダ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003027168A JP2004241906A (ja) | 2003-02-04 | 2003-02-04 | カムコーダ |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004241906A true JP2004241906A (ja) | 2004-08-26 |
Family
ID=32954986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003027168A Withdrawn JP2004241906A (ja) | 2003-02-04 | 2003-02-04 | カムコーダ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004241906A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006311510A (ja) * | 2005-03-28 | 2006-11-09 | Casio Hitachi Mobile Communications Co Ltd | 画像処理装置及びプログラム |
US7551337B2 (en) | 2005-08-04 | 2009-06-23 | Ricoh Company, Ltd. | Optical scanning apparatus and image forming apparatus |
-
2003
- 2003-02-04 JP JP2003027168A patent/JP2004241906A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006311510A (ja) * | 2005-03-28 | 2006-11-09 | Casio Hitachi Mobile Communications Co Ltd | 画像処理装置及びプログラム |
US7551337B2 (en) | 2005-08-04 | 2009-06-23 | Ricoh Company, Ltd. | Optical scanning apparatus and image forming apparatus |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6722995B2 (ja) | 符号化方法及び符号化装置、撮像装置及びプログラム | |
JP4702928B2 (ja) | 動画像符号化装置及び復号装置及びその制御方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 | |
US7359549B2 (en) | Imaging device, image processing method, and recording medium | |
JP4545980B2 (ja) | 符号化装置及び符号化方法並びに記憶媒体 | |
JP4208378B2 (ja) | 画像処理装置及び方法及び記録媒体 | |
JP2002016925A (ja) | 符号化装置及び符号化方法 | |
US7120306B2 (en) | Image processing method and image coding apparatus utilizing the image processing method | |
JP4471337B2 (ja) | 画像処理装置及び方法、並びにコンピュータプログラム及びコンピュータ可読記憶媒体 | |
WO2006001490A1 (en) | Moving image encoding apparatus and moving image encoding method | |
JP3789836B2 (ja) | 画像符号化装置および方法 | |
JP7033013B2 (ja) | 画像符号化装置、画像復号装置、及び、それらの制御方法、並びに、プログラム | |
JP4155566B2 (ja) | 画像再生装置及び方法 | |
US20040057514A1 (en) | Image processing apparatus and method thereof | |
JP2004241906A (ja) | カムコーダ | |
JP4251610B2 (ja) | 画像処理装置 | |
JP2004282306A (ja) | 画像処理装置 | |
JP4678814B2 (ja) | 画像処理方法及び装置 | |
JP2006086579A (ja) | 画像処理装置、プログラム、及び記憶媒体 | |
JP4280613B2 (ja) | 動画像再生装置及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP4194311B2 (ja) | 動画像符号化装置及び動画像復号装置並びにそれらの方法 | |
JPH11331612A (ja) | 画像処理装置及び方法及び記憶媒体 | |
JP2005151018A (ja) | 画像符号化装置及び画像復号化装置 | |
JP2004297323A (ja) | 画像処理装置 | |
JP4174254B2 (ja) | 動画像符号化装置及び動画像復号装置並びにそれらの方法 | |
JP2021069094A (ja) | 画像符号化装置及びその制御方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060404 |