JP4320738B2

JP4320738B2 - オーディオビデオ信号記録装置、オーディオビデオ信号記録方法

Info

Publication number: JP4320738B2
Application number: JP2005007646A
Authority: JP
Inventors: 隆幸菅原; 孝司栗山; 輝美大原
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2005-01-14
Filing date: 2005-01-14
Publication date: 2009-08-26
Anticipated expiration: 2025-01-14
Also published as: JP2006197337A

Description

本発明は、オーディオビデオ信号記録装置、オーディオビデオ信号記録方法に関するもので、特に動画静止画データ同時記録再生において、２つの撮像素子からの画像データを画素をずらして使用するモード、２つの撮像素子からの画像データを画素をずらさずに使用し、一方に減光用のＮＤフィルタを配置し輝度レンジを異ならせて合成し、１つの信号の画像よりも広ダイナミックレンジの静止画像、もしくは動画像を形成するモード、２つの撮像素子からの画像データを独立して動画と静止画同時撮影するモードの３モードを選択的に使用することを好適に実現する装置、方法に関するものである。

従来のカムコーダでは動画と静止画とを一つのＣＣＤを用いて同時記録していた。しかし静止画像の画素数を上げるために画素数の多いＣＣＤを使用すると動画のＳ／Ｎ比が低下するので、解像度の高い静止画とＳ／Ｎ比の優れた動画とを同時記録することが困難であった。

そこで、特開平５−２９２４４５においては、広角レンズによる撮像信号と、ズームレンズによる撮像信号とを、同一の記録媒体に同時記録して、２種類の映像を２つの光学系にて記録する技術が開示されている。

また、特開２００４−７２１４８においては、入射光をプリズム分岐させて動画撮影用ＣＣＤと静止画撮影用ＣＣＤに受光させ、１つの光学系で、２つのＣＣＤを用いて、動画像はＭＰＥＧ圧縮されて記録し、静止画はＪＰＥＧ圧縮してメモリカードに同時に記録される技術が開示されている。

また、同じように特開２０００−２３０９４では、動画像を記録し、所望の場面を静止画像としても記録可能の画像情報の記録又は再生装置を提供する目的で、入力手段により入力された記録データを、エンコーダで動画像用データとして圧縮し、操作ボタンから信号の入力時には、その信号が入力された時点における場面を静止画像用データとしても圧縮してメモリへ出力し、同期信号生成回路からの同期信号に同期して動画像用データと静止画像用データとを記録するためのタイミング信号を生成し、動画像用データと静止画像用データとを光磁気記録媒体に同時記録する技術が開示されている。

また、特開平１１−７６１５９には、対物光学系の光路を二つに分離するハーフミラーの二つの分離光路を用いて、異なる画素位置のデータからなる画像信号を形成するように配置された２つのＣＣＤから、設定された画素以外の欠落画素を周囲の画素信号から演算し、高解像度の画像を生成する技術が開示されている。

また、ここで使用されているMPEGについて説明する。
MPEGは1988年、ISO/IEC JTC1/SC2（国際標準化機構/国際電気標準化会合同技術委員会1/専門部会2、現在のSC29）に設立された動画像符号化標準を検討する組織の名称（Moving Pictures Expert Group）の略称である。MPEG1（MPEGフェーズ1）は1.5Mbps程度の蓄積メディアを対象とした標準で、静止画符号化を目的としたJPEGと、ISDNのテレビ会議やテレビ電話の低転送レート用の動画像圧縮を目的としたH.261（CCITT SGXV、現在のITU-T SG15で標準化）の基本的な技術を受け継ぎ、蓄積メディア用に新しい技術を導入したものである。これらは1993年8月、ISO/IEC 11172 として成立している。

MPEG２（MPEGフェーズ２）は通信や放送などの多様なアプリケーションに対応できるように汎用標準を目的として、１９９４年１１月ISO/IEC １３８１８、H.２６２として成立している。

MPEGは幾つかの技術を組み合わせて作成されている。入力画像は動き補償器で復号化した画像と、入力画像の差分を取ることで時間冗長部分を削減する。予測の方向は、過去、未来、両方からの３モード存在する。またこれらは16画素×16画素のMB（マクロブロック）ごとに切り替えて使用できる。予測方向は入力画像に与えられたピクチャタイプによって決定される。過去からの予測と、予測をしないでそのMBを独立で符号化する２モード存在するのがPピクチャーである。また未来からの予測、過去からの予測、両方からの予測、独立で符号化する４モード存在するのがBピクチャーである。そして全てのMBが独立で符号化するのがIピクチャーである。動き補償は、動き領域をMBごとにパターンマッチングを行ってハーフペル精度で動きベクトルを検出し、動き分だけシフトしてから予測する。動きベクトルは水平方向と垂直方向が存在し、何処からの予測かを示すMC(Motion Compensation)モードとともにMBの付加情報として伝送される。Iピクチャから次のIピクチャの前のピクチャまでをGOP(Group Of Picture)といい、蓄積メディアなどで使用される場合には、一般に約１５ピクチャ程度が使用される。

差分画像はDCT器において直交変換が行われる。DCT（Discrete Cosine Transform)とは余弦関数を積分核とした積分変換を有限空間への離散変換する直交変換である。MPEGではMBを４分割し8×8のDCTブロックに対して、２次元DCTを行う。一般にビデオ信号は低域成分が多く高域成分が少ないため、DCTを行うと係数が低域に集中する。

DCTされた画像データ（DCT係数）は量子化器で量子化が行われる。量子化は量子化マトリックスという8×8の２次元周波数を視覚特性で重み付けした値と、その全体をスカラー倍する量子化スケールという値で乗算した値を量子化値として、ＤＣＴ係数をその量子化値で叙算する。デコーダーで逆量子化するときは量子化値で乗算することにより、元のＤＣＴ係数に近似している値を得ることになる。

量子化されたデータはVLC器で可変長符号化される。量子化された値のうち直流（ＤＣ）成分は予測符号化のひとつであるＤＰＣＭ（differential pulse code modulation )を使用する。また交流（ＡＣ）成分は低域から高域にzigzag scanを行い、ゼロのラン長および有効係数値を１つの事象とし、出現確率の高いものから符号長の短い符号を割り当てていくハフマン符号化が行われる。

可変長符号化されたデータは一時バッファに蓄えられ、所定の転送レートで符号化データとして出力される。また、その出力されるデータのマクロブロック毎の発生符号量は、符号量制御器に送信され、目標符号量に対する発生符号量との誤差符号量を量子化器にフィードバックして量子化スケールを調整することで符号量制御される。量子化された画像データは逆量子化器にて逆量子化、逆DCT器にて逆DCTされ一時、画像メモリーに蓄えられたのち、動き補償予測器において、差分画像を計算するためのリファレンスの復号化画像として使用される。これら全体の符号化構成例を第１０図に示す。

符号化されたストリームはバッファリングされ、バッファからのデータはVLD器に入力される。VLD器では可変長復号化され、直流（ＤＣ）成分および交流（ＡＣ）成分を得る。交流（ＡＣ）成分データは低域から高域にzigzag scanの順で８ｘ８のマトリックスに配置する。このデータは逆量子化器に入力され、量子化マトリックスにて逆量子化される。逆量子化されたデータは逆DCT器に入力され、逆DCTされ一時、画像データ（復号化データ）として出力される。また、復号化データは一時、画像メモリーに蓄えられたのち、動き補償予測器において、差分画像を計算するためのリファレンスの復号化画像として使用される。復号化構成例を第１１図に示す。

また、近年開発された記録容量が従来のCD等の媒体の数倍から十数倍になる、次世代のディスク媒体のフォーマット技術について説明する。一つはDVD-ROMディスク（DVD Specifications for Read-Only Discに準拠した読み出し専用光ディスク）であり、記録再生が可能なディスクとしてはDVD-RWディスク（DVD Specifications for Re-recordable Discに準拠した再記録可能なディスク）及びDVD-RAMディスク（DVD Specifications for Rewritable Discに準拠した再書き込み可能なディスク）がある。DVD-RWまたはDVD-RAMディスク上にビデオデータを収録する規格も策定されており、その大容量を活かして高画質な動画及び静止画を記録し、様々な編集を経て再生する手法が提供される。

DVD-RWまたはDVD-RAMディスク上（以下、DVD-RW/RAMディスクと略す）にビデオデータを収録する規格、VIDEO RECORDING規格（以下DVD-VRと略す）では、ビデオデータはVOB（Video Object）として記録され、VOB群を記録した順序で全て再生するためのオリジナル管理データ、オリジナルPGC （Original Program Chain）と、ユーザーが選択したVOBの全部又は一部分を任意の順序で再生するためのユーザー定義管理データ、ユーザー定義PGC （User Defined PGC）が定義される。ディスク上に、オリジナルPGCはただ一つ存在し、ユーザー定義PGCは複数存在しうる。従って、ユーザーは、好みに応じて編集したユーザー定義PGCを使って、好みの再生を行うことが出来る。
"DVD Specifications for Rewritable/Re-recordable Discs、 Part3 VIDEO RECORDING、 Version 1.0"で示されるように、DVD-VRでは、DVD-RW/RAM上のファイルとして複数のファイルを記録する。図１０にその構成を示す。ルートディレクトリ下にDVD＿RTAVディレクトリがあり、その下にオリジナルPGC、ユーザー定義PGCなど、全ての記録再生管理データを収録するためのVR＿MANGER.IFOファイルを収録する。また、ビデオデータはVR＿MOVIE.VROファイル中に、静止画データはVR＿STILL.VROファイル中に、静止画に付随する追加オーディオデータはVR＿AUDIO.VROファイル中に記録される。このように、実際の再生データと、記録再生管理データは分離して記録されるので、再生データを変更することなく、ユーザー定義PGCによって任意の再生手順を構築することが出来る。なお、VR＿STILL.VRO中の各静止画は、MPEG Video規格に準拠したMPEGイントラ画像として記録される。

図１１にオリジナルPGCの構造概念図を示す。DVD-VRディスクにビデオデータを記録する場合、例えば１つのテレビ番組を録画する場合、その一続きのビデオデータは、１つのプログラム（Program）として記録され、プログラムは１つまたは複数のセル（Cell）から構成される。一般的には、録画の途中でポーズした場合や、録画後に番組の途中部分を編集で削除した場合などに、プログラムは複数のセルから構成される。各セルは１つのVOBと関連づけられている。各VOBは、MPEG-2システムに準拠したプログラムストリームとして記録され、連続的に再生される単位である。プログラムおよびセルの構造がオリジナルPGCの記録再生管理データであり、VOB群がビデオデータそのものである。ディスク上に最初に記録されたプログラムがProgram1であり、プログラムを追加記録する毎に、Program2、 3、 ...と記録順に追加されていく。オリジナルPGCの再生は、ディスクに記録された全プログラムをプログラム番号順、つまり記録順に再生することに相当する。また、オリジナルPGC上の特定のプログラムを指定して再生することも可能である。

一方、図１２にはユーザー定義PGCの構造概念図を示す。オリジナルPGCとして記録されたVOB群の任意の部分をユーザー定義PGC用のセルとして登録し、ユーザー定義PGCを構成する。各セルは任意のVOBの全部または一部分を参照する。例えば、オリジナルPGCとして記録されたVOBのコマーシャルや不要な場面をカットしたり、２つ以上の番組（Program）の一部分を繋いで再生したりする用途等に適している。新しく定義したユーザー定義PGCを再生することは、そのPGC中の全セルを連続して再生することに相当する。ユーザー定義PGC中にはプログラムの階層は存在しない。つまり、ユーザー定義PGC自体が、オリジナルPGCで言う１つのプログラムに相当する、と解釈できる。

表５には、オリジナル及びユーザー定義PGC情報（PGCI）の具体的定義内容を示す。PGCIはPGCの一般情報を示すPGC＿GI、各プログラムの付属情報を定義する１つ以上のPGI（オリジナルPGCの場合。ユーザー定義PGCでは定義しない。）、PGC中の各セル情報の検索ポインタCI＿SRP、及び各セル情報M＿CI（動画セルの場合。静止画セルの場合S＿CI。）から成る。

次に、表５中の各要素の内容を説明する。PGC＿GI内には、PGC内のプログラム数を収納するPG＿Ns及びCI＿SRPの数を収納するCI＿SRP＿Nsが定義される。ユーザー定義PGCの場合、プログラムを持たないのでPG＿Nsはゼロである。

PGIは、PG＿Nsで示される個数存在する。各PGI内には、プログラム中のセル数を示すC＿Ns、プログラムに関するテキスト情報を収録するプライマリテキスト情報（PRM＿TXTI）、プログラムに関連するアイテムテキスト情報（PGCIではなく、VR＿MANGR.IFO内の別のデータ構造として別途収録されている）の検索ポインタ番号（IT＿TXT＿SRPN）、プログラムを代表する静止画像の位置を指定する代表静止画情報（REP＿PICTI）、等が定義される。

CI＿SRPは、CI＿SRP＿Nsで示される個数存在する。各CI＿SRPはセル情報CIの先頭アドレスCI＿SAから成る。
M＿CIは、セル一般情報M＿C＿GIと０個以上のセルエントリーポイント情報M＿C＿EPIから成る。M＿C＿GI内には、セルのタイプC＿TY、セルエントリーポイント数C＿EPI、等が定義される。M＿C＿EPI内には、エントリーポイントのタイプEP＿TY（AとB、AはPRM＿TXTIなし、BはPRM＿TXTIあり）、エントリーポイントの再生時刻EP＿PTM、及びエントリーポイントに関するプライマリテキスト情報（PRM＿TXTI）が定義される。

ここで、エントリーポイントとはセル内の任意の時刻を指定し、プログラムやセルの任意の中間地点へのアクセスを可能にする構造である。図１１および図１２中に、セル内に指定されるエントリーポイントの例（EPと示される矢印）を示す。

なお、静止画のセルを再生する場合には、M＿CIの代わりにS＿CIが用いられる。（S＿CIの内容はここでは省略する。）従って、オリジナルPGC上に動画と静止画を記録する場合はセル毎に混在することになる。ユーザー定義PGC上も、セル毎に動画用セルと静止画用セルを混在させることが出来る。
特開平５−２９２４４５特開２００４−７２１４８特開２０００−２３０９４特開平１１−７６１５９

解決しようとする問題点は、動画静止画データ同時記録装置において、２つの撮像素子を用いて単に動画と静止画を同時に記録するだけでなく、２つの撮像素子を動画のときのみ、あるいは静止画のときのみでもっと有効に活用する記録再生が望まれていた。

そこで、上記課題を解決するために本発明は、以下のオーディオビデオ信号記録装置、オーディオビデオ信号記録方法を提供するものである。
（１)撮像レンズと、前記撮像レンズから入射された光線を分離する光路分離器と、前記光路分離器で分離された２つの光をそれぞれ受光して、画像信号として出力する２つの受光素子と、前記画像信号を動画として記録媒体に記録する動画像信号記録器と、前記画像信号を静止画像として記録媒体に記録する静止画信号記録器とを備えたオーディオビデオデータ同時記録装置において、受光素子からの２つの信号を用いて、双方を異なる画素位置のデータとして画像信号を合成し、１つの信号の画素数よりも大きい画素数の静止画、もしくは動画像を形成する第一のモードと、受光素子からの２つの信号を用いて、双方を同じ画素位置のデータとして画像信号を合成するにあたり、一方に減光用のＮＤフィルタを配置し輝度レンジを異ならせて合成し、１つの信号の画像よりも広ダイナミックレンジの静止画像、もしくは動画像を形成する第二のモードと、受光素子からの１つの信号を動画像として形成し、もうひとつを静止画像として形成する第三のモードとの３モードの機能を持つことを特徴とするオーディオビデオ信号記録装置。
（２）撮像レンズから入射された光線を２つに分離し、分離された２つの光をそれぞれ受光して、画像信号を入力するステップと、前記画像信号を動画として記録媒体に記録する動画像信号記録ステップと、前記画像信号を静止画像として記録媒体に記録する静止画信号記録ステップとを備えたオーディオビデオデータ同時記録方法において、受光素子からの２つの信号を用いて、双方を異なる画素位置のデータとして画像信号を合成し、１つの信号の画素数よりも大きい画素数の静止画、もしくは動画像を形成する第一のモードと、受光素子からの２つの信号を用いて、双方を同じ画素位置のデータとして画像信号を合成するにあたり、一方に減光用のＮＤフィルタを配置し輝度レンジを異ならせて合成し、１つの信号の画像よりも広ダイナミックレンジの静止画像、もしくは動画像を形成する第二のモードと、受光素子からの１つの信号を動画像として形成し、もうひとつを静止画像として形成する第三のモードとの３モードの機能を持つことを特徴とするオーディオビデオ信号記録方法。

本発明は撮像レンズと、前記撮像レンズから入射された光線を分離する光路分離器と、前記光路分離器で分離された２つの光をそれぞれ受光して、画像信号として出力する２つの受光素子と、前記画像信号を動画として記録媒体に記録する動画像信号記録器と、前記画像信号を静止画像として記録媒体に記録する静止画信号記録器とを備えたオーディオビデオデータ同時記録装置において、（１）受光素子からの２つの信号を用いて、双方を異なる画素位置のデータとして画像信号を合成し、１つの信号の画素数よりも大きい画素数の静止画、もしくは動画像を形成するモード、（２）受光素子からの２つの信号を用いて、双方を同じ画素位置のデータとして画像信号を合成し、１つの信号の画像よりも明るい静止画像、もしくは動画像を形成するモード、（３）受光素子からの１つの信号を動画像として形成し、もうひとつを静止画像として形成するモード、の３モードの機能を持つようにしたので、２つの撮像素子からの画像データを画素をずらして使用するモード、２つの撮像素子からの画像データを画素をずらさずに使用し、一方に減光用のＮＤフィルタを配置し輝度レンジを異ならせて合成し、１つの信号の画像よりも広ダイナミックレンジの静止画像、もしくは動画像を形成するモード、２つの撮像素子からの画像データを独立して動画と静止画同時撮影するモードの３モードを選択的に使用することができ、動画だけ、あるいは静止画だけを撮影しているモードのときにも２つの撮像素子を有効に活用できるシステムを好適に実現することができる。

以下、図面を参照しながら発明を実施するための最良の形態を説明する。
図１は本発明の実施例の好適なオーディオビデオ記録器のブロック図である。本実施例では動画をムービーで撮影中に、ユーザーからのタイミング情報により、動画録画を中断することなく、デジカメ静止画データを記録するものである。また、動画や静止画のみの場合には２つの撮像素子を有効につかって、画素ずらし処理をつかって解像度を向上したり、画素加算を行って感度を向上したりするものである。

以下のこのブロック図を説明する。入力されたビデオ光はレンズ１０１を通して、光路分離器１０２に入力される。レンズ１０１と光路分離器１０２は、図５のようにレンズ群と、例えばプリズムを用いて２つの光路に分離される。プリズムでなくてもハーフミラーでも構わない。２つに分離された光は動画用受光素子１０４と、静止画用１０５に入光される。受光素子は例えばＣＣＤやＣＭＯＳなどである。受光素子１０４からのデータはＡ／Ｄ変換１０６においてＡ／Ｄ変換されて、デジタルデータとしてスイッチ１０９に入力される。受光素子１０５からのデータは、スイッチ１２６のaを経由してＡ／Ｄ変換１０７においてＡ／Ｄ変換されて、デジタルデータとしてスイッチ１１０に入力される。またスイッチのbを経由して、ＮＤフィルタ１２７に入力される。ＮＤフィルタ１２７の出力はＡ／Ｄ変換１０７においてＡ／Ｄ変換されて、デジタルデータとしてスイッチ１１０に入力される。このＮＤフィルターは減光用のフィルタであり、輝度レンジをもう一方と異ならせ、２つの信号を合成することでダイナミックレンジの広い信号をえることができる。この原理を図７を用いて説明する。図７の（１）は撮像する画像の輝度を横軸に、ＣＣＤの出力を縦軸にして、なにもフィルタのないＣＣＤの出力を７１、ＮＤフィルタの出力を７２として示したものである。ＮＤフィルタをつけたＣＣＤは同じ輝度でもＣＣＤの出力が低い。したがって、輝度飽和度の高い画像がきてもＣＣＤの出力が飽和せずに明るい輝度領域の画像の表現力が高い。一方なにもないＣＣＤ７１は輝度の低い領域で表現力が高い。そこで図７の（２）のように切り替え値Ｓにおいて高い輝度の領域をＮＤフィルターＣＣＤの出力７４で、切り替え値Ｓより低い輝度の領域では何もないＣＣＤの出力７３を用いて、双方の出力に所定のノンリニアのテーブルを介して、合成画像特性７５を計算で求めると、輝度の高い領域も低い領域も表現力の高い、高ダイナミックレンジの画像が得られる。スイッチ１０９とスイッチ１１０のaの出力端子はそれぞれ画素ずらし画像生成器１１１に入力される。画素ずらしとは図４の（３）のように画素を水平垂直に半画素ずらして擬似的に解像度を水平垂直に２倍に向上させる手法である。画素ずらし生成器１１１の出力はスイッチ１１３及びスイッチ１１４のaに入力される。またスイッチ１０９とスイッチ１１０のbの出力端子はそれぞれ画素加算画像生成器１１２に入力される。画素加算とは図４の（２）のように２つの画素を画素ずらしのようにずらさないで対応する位置の画素を加算して感度を向上させる手法である。スイッチ１２７をaにした場合には、そもそもレンズから２光路に分解しているので光強度は半分弱になっているため２つの光は加算することでほぼもとの感度に戻すことができる。またスイッチ１２７をbにした場合には、前述のようにダイナミックレンジの広い画像データをえることができる。画素加算生成器１１２の出力はスイッチ１１３及びスイッチ１１４のｂに入力される。またスイッチ１０９の出力端子cはスイッチ１１３のcに入力される。またスイッチ１１０の出力端子cはスイッチ１１４のcに入力される。スイッチ１０９、１１０、１１３、１１４は静止画と動画を同時録画する場合にはcに切り替えられる。動画と静止画が独立に記録される場合で、静止画に画素ずらしを用いて画素数を向上する場合にはスイッチ１０９、１１３、１２７はaに切り替えられる。静止画に画素加算を用いて感度を向上する場合にはスイッチ１０９、１１３、１２７はbに切り替えられる。動画と静止画が独立に記録される場合で、動画に画素ずらしを用いて画素数を向上する場合にはスイッチ１１０、１１４、１２７はaに切り替えられる。動画に画素加算を用いて感度を向上する場合にはスイッチ１１０、１１４、１２７はbに切り替えられる。スイッチ１１３の出力は静止画符号化器１１９に伝送される。スイッチ１１４の出力は動画符号化器１２０に伝送される。一方、オーディオ入力器１０３にからのオーディオデータはＡ／Ｄ変換器１０８にてデジタルデータに変換され、音声符号化器１１８に入力される。音声符号化器１１８は例えばドルビーＡＣ３、静止画符号化器１１９は例えばＪＰＥＧ、動画符号化器１２０は例えばＭＰＥＧ２での圧縮を行うものである。それぞれの符号化された符号化データは、多重化器１２２にて、１つのデータに多重化される。多重化されたデータはディスクフォーマット器１２４にて、後述するディスクフォーマットにてフォーマット化され、記録媒体書き込み器１２３へ入力される。

一方、ユーザーインターフェース１１５においては、動画をムービーで記録している途中において、ユーザーから、ボタンなどを押す動作に連携して、押したときのタイミング情報を入力してもらう。ＣＰＵ１１６を介して、静止画撮影タイミング信号発生器１１７において、静止画録画開始信号と、同時に録画されているリンクされているビデオのプログラムナンバーと、リンクされているビデオのピクチャータイムコードを、静止画符号化器１１９に送信する。

ビデオのプログラムナンバーは表３のLinked＿video＿programの領域に、表１のV＿PR＿IFOの２番目のPR＿numberの値である。ビデオのピクチャータイムコードは同時に録画されているリンクされているビデオの所謂タイムコードであり、ＭＰＥＧなどでもＧＯＰ単位にＧＯＰヘッダーとして時分秒フレーム数で記述されているタイムコードと同じもので良い。また、この情報は動画データのなかのピクチャーを特定できる情報（動画像のピクチャーの位置情報）であればタイムコードでなくても、先頭からのフレーム数であったり、先頭からのアドレス（バイト数）であっても良い。
また、同時に静止画録画開始信号と、静止画の識別情報（後述するS＿PRN）を、動画符号化器１２０にも送信し、動画符号化データの１ピクチャー毎に記録できるＭＰＥＧのユーザーデータ領域に、そのタイミングに同期して符号化される静止画の識別情報（後述するS＿PRN）を記述する。これは表３の静止画の情報のうち、静止画１枚ずつに記述される静止画プログラムのナンバーである。この情報があると、動画再生中に、一次停止した動画フレームと同じタイミングで撮影した静止画像を特定できる。動画中へのデータの書き込みは図２のようにＭＰＥＧのピクチャーデータのなかのユーザーデータの領域に記述する。ユーザーデータは表３のＭＰＥＧ２のビデオレーヤのシンタックスにおけるUser＿data()を使用する。user＿data（）は、user＿start＿codeという一意い決定できるバイトアラインされたスタートコードから始まり、次に0x000001の３バイトを受信するまで、user＿dataを続けることができる。ここに静止画の識別情報（後述するS＿PRN）を記述する。その際、他のアプリケーションでuser＿data()を使用している可能性もあるので、user＿data()のuser＿start＿codeのあとに、本方式のデータであることを示す、４バイト程度のユニークコード0x22220204を記述する。これにより他の用途で使用するユーザーデータとの混同は防げる。

さらにＣＰＵ１１６は管理データメモリー１２１に、静止画の識別情報（後述するS＿PRN）の書き込みなどの制御信号を送信する。また、静止画撮影タイミング信号発生器１１７からは、その制御信号に従って管理データメモリー１２１に静止画の識別情報（後述するS＿PRN）を書き込む。管理データ１２１に記録されているデータはディスクフォーマット器１２４からの多重化されたオーディオビデオ信号データとともに、ＣＰＵ１１６からの制御信号に従って、記録媒体１２５に記録される。

図３は本発明の実施例の好適なオーディオビデオ再生器のブロック図である。まず記録媒体２０１からＣＰＵ２０４からの制御信号により記録媒体読み出し器２０２によって、オーディオビデオデータと、管理データが読み込まれる。管理データは管理データメモリー２０６に記録される。オーディオビデオデータはディスクフォーマットデコーダー器２０５に入力される。ディスクフォーマットデコーダー器２０５では、後述するディスクフォーマットをフォーマットデコード化して多重化分離器２０７に入力される。多重化分離器２０７では、各要素のデータが多重化されている状態から、各要素データへと分離し、音声データは音声復号器２０９、静止画データは静止画復号器２１０、動画データは動画復号器２１１へ入力される。静止画と動画は復号されるとフレームバッファ２１２にバッファされる。一方、ユーザーインターフェース（Ｕ／Ｉ）２０３によって動画再生中に、ピクチャー毎に規則されている静止画の記録されている時刻にて一時停止をして、高解像度の静止画を表示する場合には表示を行うトリガー信号が入力されて、その信号はＣＰＵ２０４に伝送される。ＣＰＵ２０４ではそのトリガー信号を受けて、再生制御器２０８へ制御信号を伝送する。再生制御器２０８では記録媒体読み出し器に読み出しを一時停止する信号を伝送すると同時に、再生していづ動画の符号化データのピクチャー毎に記録されているユーザーデータを観測し、そこに図２に示した識別コード０ｘ２２２２０２０４のあとS＿PRNという静止画のプログラムナンバーを検出する。

高解像度表示するために一時停止する場合には、そのプログラムナンバーに対応するS＿PR＿IFOのなかのS＿ATRのLinked＿video＿programの値が０でない信号であるピクチャーのところで一時停止する。この信号は動画のピクチャーを時間方向に並べた場合、対応した静止画が記録されているのが仮に１秒に１枚、即ち３０フレームに１枚であれば、最大３０枚観測すれば１枚は見つかるはずで、その場合には最大１秒程度一時停止が遅れる。普通の一時停止は動画上のどこのフレームでも一時停止可能である。一時停止したら、再生制御器は記録媒体読み出し器に、その動画の対応する静止画データ(S＿PRNのプログラムナンバーのついている静止画データ)をアクセスして、ディスクフォーマットデコーダー器２０５と多重化分離器２０７を経由して、静止画復号器２１１にて静止画を復号し、フレームバッファに、動画の一時停止しているデータと交換して、静止画データをバッファリングする。図４の（１）のように、動画撮影中にシャッターボタンを押して静止画を記録した画像が真ん中の画像だとすると、その動画一時停止した画像が（２）のように高解像度の画像にて表示される。この画像はＣＣＤの能力によるが１つのＣＣＤの画素解像度の２倍の解像度をもつ。従ってたとえばズームした場合でも動画の表示解像度を基準に考えれば、静止画の解像度は劣化しない。例えば１６００ｘ１２００の画素のうち７２０ｘ４８０を切り出すような画郭であれば解像度は劣化しない。それ以上小さいウインドウを７２０ｘ４８０まで拡大するということになれば、従来の技術にあるフィルターによるオーバーサンプル（フィルター処理で補間する）をおこなって表示することも可能で、これと組み合わせることで、連続的な拡大機能を持たせることができる。また、動画から静止画のバッファの切り替えにより、ユーザーに表示させる画像が大きく変化しないようすることもできる。フレームバッファ２１２は前記の説明のように、動画像あるいは、静止画像を受信して、バッファすると同時に、再生制御器２０８の信号にてバッファを動画データと静止画データを、適切に切り替えて画像出力器２１４に伝送する。一方、音声復号器２０９では音声データを音声出力器２１３（例えばスピーカ）などで出力する。

次にディスクフォーマット化器１２４でフォーマット化、及び、ディスクフォーマットデコーダー器２０５でフォーマットデコードされるデータ構造について説明する。
本発明の実施形態に関わるディレクトリ、ファイル構造の例を図１５に示す。ディレクトリ名やファイル名は本発明の実施形態を説明する目的で使われており、これ以外の名称を否定するものではない。ルートディレクトリ（図示しない）の下にJVC＿HDVD＿SYSTEMディレクトリがあり、その下に、本発明に関わる全ての管理データ及びオーディオ、ビデオ、静止画データが保存される。

TMG.ifo（Total Manager Information）は、オリジナル管理データ（以下、プログラムセットとも呼ぶ）及びユーザー定義管理データ（以下、プレイリストとも呼ぶ）を記録する為のファイルである。構造を図１６に示す。詳細は後述する。

V＿PR＿SETは、ビデオのプログラムをビデオオブジェクトとして記録する為のディレクトリであり、その中にビデオの各プログラムがV＿PRn.dat （ここで、nは1から開始されるプログラム番号）として記録される。プログラムにはビデオオブジェクトが、MPEG-2システム規格のプログラムストリームまたは、トランスポートストリームとして記録される。
A＿PR＿SETは、オーディオのプログラムをオーディオオブジェクトとして記録する為のディレクトリであり、その中にオーディオの各プログラムがA＿PRn.dat （ここで、nは1から開始されるプログラム番号）として記録される。プログラムにはオーディオオブジェクトが、MPEG-2システム規格のプログラムストリームまたは、トランスポートストリームとして記録される。

ビデオまたはオーディオオブジェクトをプログラムストリームとして記録する場合には図９のように、ＭＰＥＧ多重化規格のフォーマットに従い、要素データ毎にパック化を行う。オブジェクトはパックの集合として記録され、各パックにはパックヘッダがあり、その後にパケットが記録される。パケット内にはパケットヘッダと、ビデオ又はオーディオデータが少なくとも記録され、必要に応じてプライベートヘッダがパケットヘッダの直後に記録される場合がある。

S＿PR＿SETは、静止画のプログラムを静止画オブジェクトとして記録する為のディレクトリであり、その中に静止画の各プログラムがS＿PRn.jpg （ここで、nは1から開始されるプログラム番号）として記録される。ここではJPEG形式の静止画記録を想定している。各JPEGファイルが一つの静止画オブジェクトに対応する。

なお、図１５ではビデオ、オーディオ、静止画のプログラムに関するファイル群をそれぞれ異なるディレクトリ下に記録する例を示したが、３種全てのファイル群を同一ディレクトリ、例えばAVS＿PR＿SETなど、の下に記録するようにしても、本発明の趣旨と相違しない。さらには、ビデオのプログラムをそれぞれ一つのファイルV＿PRn.datとして記録する例、及びオーディオのプログラムをそれぞれ一つのファイルA＿PRn.datとして記録する例を示したが、全てのビデオプログラムを同一のファイル、例えばV＿PR.dat内に連続して記録し、V＿PR.dat内のどの部分がどのプログラムデータに相当するかを別途の情報として保持するようにしても良い。A＿PR.datについても同様である。

次に、TMG.ifoのデータ構造例を図１６に示す。TOTAL＿MAN＿IFO（Total Manager Information）は、GENERAL＿IFO（General Information）、CNTNT＿IFO（Content Information）及びSTATUS＿IFO（Status Information）からなる。

GENERAL＿IFOは、System IDやVersion number、及びCNTNT＿IFOとSTATUS＿IFOの先頭アドレスなど、TOTAL＿MAN＿IFOの一般情報を含み得る。詳細を表６に記述する。STATUS＿IFOは、最後に再生したプログラムの種類や番号など、ステータスに関する情報を含み得る。
CNTNT＿IFOは、ビデオプログラム情報テーブルV＿PR＿IFOT（Video Program Information Table）、オーディオプログラム情報テーブルA＿PR＿IFOT（Audio Program Information Table）、静止画プログラム情報テーブルS＿PR＿IFOT（Still picture Program Information Table）、及びユーザー定義管理データに相当するプレイリスト情報テーブルPL＿IFOT（Play List Information Table）から成る。V＿PR＿IFOT、A＿PR＿IFOT及びS＿PR＿IFOTの３つが（従来例の）オリジナル管理データに相当する。

更に、V＿PR＿IFOTは、各ビデオプログラムのビデオプログラム情報V＿PR＿IFO＿i（iは1からnまでの整数）を含む。
A＿PR＿IFOTは、各オーディオプログラムのオーディオプログラム情報A＿PR＿IFO＿j（jは1からmまでの整数）を含む。S＿PR＿IFOTは、各静止画プログラムの静止画プログラム情報S＿PR＿IFO＿k（kは1からqまでの整数）を含む。PL＿IFOTは、各プレイリストの情報PL＿IFO＿p（pは1からrまでの整数）を含む。なお、以下では上述のi、 j、 k、 pをそれぞれPR＿IFO番号と呼ぶことにする。

表１にV＿PR＿IFO＿iのデータフィールドと内容の例を示す。データフィールドの中で、PR number （V＿PRN）はこのビデオプログラムの番号を示し、V＿PR＿IFO番号と等しい。Video Group number (V＿GRN)は、このプログラムが属するビデオグループの番号を示す（後述）。V＿ATRには表１の下の表にあるようなシンタックスを記述する。ここには、ビデオの画像がどんな圧縮方式で記録されているのかを示す、Video＿compression＿modeや、ＰＡＬやＮＴＳＣのＴＶシステムを識別するTV＿system情報、アスペクト情報、それに水平、垂直の画素数、が記録される。その他のデータフィールドについてはここでは説明を省略する。なお、V＿PR＿IFOはビデオプログラムの再生に必要なアドレス情報や属性情報、テキスト等の付随情報を収める為のものであり、表１の例以外にも様々な情報構造をとり得ることに注意されたい。

表２にはA＿PR＿IFO＿jのデータフィールドと内容の例を示す。データフィールドの中で、PR number （A＿PRN）はこのオーディオプログラムの番号を示し、A＿PR＿IFO番号と等しい。Audio Group number (A＿GRN)は、このプログラムが属するオーディオグループの番号を示す（後述）。Track number (TKN)はオーディオグループ内のトラック番号を示す。その他のデータフィールドについてはここでは説明を省略する。なお、A＿PR＿IFOはオーディオプログラムの再生に必要なアドレス情報や属性情報、テキスト等の付随情報を収める為のものであり、表２の例以外にも様々な情報構造をとり得ることに注意されたい。

表３には、S＿PR＿IFO＿kのデータフィールドと内容の例を示す。データフィールドの中で、PR number （S＿PRN）はこの静止画プログラムの番号を示し、S＿PR＿IFO番号と等しい。Still picture Group number (S＿GRN)は、このプログラムが属する静止画グループの番号を示す（後述）。Linked＿video＿program＿numberには、この静止画とリンクされているビデオのPR＿numberを記述する。なお、リンクされていない場合には０を記述する。また、Linked＿video＿entry＿timeにはリンクされているビデオのピクチャーのタイムコードを記述する。S＿ATRは表３の下の表のシンタックスに示したように、ビデオの画像がどんな圧縮方式で記録されているのかを示す、Video＿compression＿modeや、ＰＡＬやＮＴＳＣのＴＶシステムを識別するTV＿system情報、アスペクト情報、静止画像の水平画素数を示すHorizontal＿video＿resolution情報、静止画像の垂直画素数を示すVertical＿video＿resolution情報などがある。その他のデータフィールドについてはここでは説明を省略する。なお、S＿PR＿IFOは静止画プログラムの再生に必要な属性情報、テキスト等の付随情報を収める為のものであり、表３の例以外にも様々な情報構造をとり得ることに注意されたい。

表４には、PL＿IFO＿pのデータフィールドと内容の例を示す。データフィールドの中で、PL numberはこのプレイリストの番号を示す。num＿of＿ud＿programsは、このプレイリストに含まれるユーザー定義プログラム数を示す。一つのユーザー定義プログラムUD＿PR（User Defined Program）内には、一つ以上のビデオプログラム、一つ以上のオーディオプログラムまたは一つ以上の静止画プログラムが収録される。または、一つ以上のオーディオプログラムと、それと同時に再生すべき一つ以上の静止画プログラムが収録される場合もある（後述）。UD＿PR＿modeは、再生すべきUD＿PRがビデオ、オーディオ、静止画のいずれのプログラムを含むかを示す。その他のデータフィールドについてはここでは説明を省略する。各プログラムの機能、プログラムとユーザー定義プログラム、プレイリストの関係などについては後述する。なお、PL＿IFOは各プログラムを関連付けて再生するのに必要な情報を収める為のものであり、表４の例以外にも様々な情報構造をとり得ることに注意されたい。

次に、本発明の記録方法について図６のフローチャートを用いて説明する。まずステップ６０１において記録のスタートをする。次にステップ６０２において記録モードの設定を行う。次にステップ６０３で静止画動画同時記録であるかどうかを判定する。静止画動画同時記録を行う（ＹＥＳ）の場合には、例えばユーザーから静止画記録を指示するボタンなどのユーザーインターフェースにて行う。ボタンはたとえば１回押すと動画記録がスタートし、同じボタンを２度目におすと静止画が１ピクチャー（フレームであってもフィールドであっても良い）を記録するなど、ユーザーが使いやすいようなボタン操作インターフェースを実装するのが好ましい。次にステップ６０４にて動画音声データを録画開始をする。次にステップ６０５において静止画記録を所定のタイミングで行うかどうかを判定する。静止画記録をする場合（ＹＥＳ）にはステップ６０６において図１におけるスイッチ１０９、１１０、１１３、１１４をcに切り替える。静止画記録をしない場合（ＮＯ）には後述するステップ６０９に進む。次にステップ６０７において静止画データの録画をする。次にステップ６０８にて静止画撮像タイミング信号と予め設定してある静止画サイズ情報を発生する。次にステップ６０９にて入力データの蓄積符号化を行う。動画データは一時メモリーして、ＭＰＥＧ２圧縮符号化を行う。静止画は１枚ごとにメモリーをしてＪＰＥＧ圧縮符号化を行う。またオーディオデータは動画とともに連続して、所定の単位時間メモリーしたあとドルビーＡＣ３やＭＰＥＧ音声符号化などの圧縮符号化を行う。次にステップ６１０において符号化されたデータを要素データ（ビデオやオーディオなどの要素）をパック化して、識別ヘッダーやタイムスタンプなどを付加して多重化を行う。次にステップ６１１において動画データのピクチャー毎のユーザーデータ領域に、静止画の識別信号を記録する。これは前述のように、そのタイミングに同期して符号化される静止画の識別情報（後述するS＿PRN）である。これは表３の静止画の情報のうち、静止画１枚ずつに記述される静止画プログラムのナンバーである。その次にステップ６１２において、多重化されたデータと前記ユーザーデータを、図１５のフォーマットにしたがってフォーマット化し、バッファリングする。バッファにある程度のデータ量が蓄積されたら、記録媒体に記録する。次にステップ６１３において記録が全部終了したかどうかを判定し、終了（ＹＥＳ）であればステップ６１４に進み、記録結果に基づいて管理データ（ＩＦＯ）を図１６のフォーマットにしたがってフォーマット化し、記録媒体に記録する。次にステップ６１５に進み終了する。またステップ６１３で終了でない（ＮＯ）であればステップ６０５へ戻る。

一方、ステップ６０３で静止画動画同時記録でない場合（ＮＯ）には、ステップ６１６に進み静止画記録かどうかを判定する。静止画記録の場合にはステップ６１７において静止画を画素ずらしするか、画素加算をするかを判定する。画素ずらしの場合にはステップ６１８に進み、スイッチ１０９、１１３、１２７をaに切り替える。画素加算の場合にはステップ６１９に進みスイッチ１０９、１１３、１２７をbに切り替える。その後ステップ６２０に進み、静止画データを録画する。次にステップ６２５に進み入力データの蓄積符号化を行う。次にステップ６２７においてフォーマット化し記録媒体に記録する。次にステップ６１４に進む。一方ステップ６１６において静止画記録でない（ＮＯ）の場合、動画記録と判定してステップ６２１に進む。ステップ６２１では動画を画素ずらしするか、画素加算するかを判定する画素ずらしの場合にはステップ６２２に進み、スイッチ１１０、１１４をaに切り替える。画素加算の場合にはステップ６２３に進みスイッチ１１０、１１４をbに切り替える。その後ステップ６２４に進み、動画データを録画する。次にステップ６２５に進み入力データの蓄積符号化を行う。次にステップ６２６において、画像、音声の符号化データの多重化を行う。次にステップ６２７においてフォーマット化し記録媒体に記録する。次にステップ６１４に進む。

次に図８のフローチャートを用いて、本発明の再生方法について説明する。まずステップ８０１において再生のスタートをする。次にステップ８０２において記録媒体から管理データ（ＩＦＯ）を読み取り、メモリーに展開する。次にステップ８０３において、動画像の再生を行う。次にステップ８０４において高解像度静止画表示ための一時停止をするかどうかを判定する。しない（ＮＯ）場合にはステップ８０３へ戻る。する（ＹＥＳ）の場合にはステップ８０５において高精細静止画表示可能なピクチャーで一時停止をする。次にステップ８０６において、一時停止した動画像のピクチャーユーザーデータのS＿PRNを読み出す。次にステップ８０７においてS＿PRNに対応する静止画を再生する。次にステップ８０８においては動画再生が終了かどうかを判定する。終了しない（ＮＯ）の場合にはステップ８０３に戻る。終了する場合（ＹＥＳ）にはステップ８０９に進み終了する。

なお、本実施例では、記録媒体を特定していないが、ランダムアクセスできる記録媒体、例えばハードディスクや光ディスクなどであればどんな記録媒体であっても良い。
また、記録媒体にデータを記録しなくても、通信、放送などあらゆる伝送媒体を経由してデータを送信することが可能で、その場合には、記録装置は伝送装置として使用することもできる。また再生装置は受信装置として使用することも可能である。

また、本発明の信号データを記録した記録媒体は、図１５、図１６、表１、表２、表３、表４、表６に示したフォーマット構造が記録されていると同時に、動画データのなかに静止画を特定できる識別信号を記録してあり、動画と静止画の相互の関連付けができるデータ構造をもっているという媒体特有の効果があり、（１）受光素子からの２つの信号を用いて、双方を異なる画素位置のデータとして画像信号を合成し、１つの信号の画素数よりも大きい画素数の静止画、もしくは動画像を形成するモード、（２）受光素子からの２つの信号を用いて、双方を同じ画素位置のデータとして画像信号を合成するにあたり、一方に減光用のＮＤフィルタを配置し輝度レンジを異ならせて合成し、１つの信号の画像よりも広ダイナミックレンジの静止画像、もしくは動画像を形成するモード、（３）受光素子からの１つの信号を動画像として形成し、もうひとつを静止画像として形成するモード、の３モードの機能を持つようにしたので、２つの撮像素子からの画像データを画素をずらして使用するモード、２つの撮像素子からの画像データを画素をずらさずに使用し、片方をＮＤフィルタにより広ダイナミックレンジを得るモード、２つの撮像素子からの画像データを独立して動画と静止画同時撮影するモードの３モードを選択的に使用することができ、動画だけ、あるいは静止画だけを撮影しているモードのときにも２つの撮像素子を有効に活用できるシステムを好適に実現することができる。

また、記録媒体は、媒体という定義はデータを記録できる媒体という、狭義な媒体というものだけでなく、信号データを伝送するための電磁波、光などを含む。また、記録媒体に記録されている情報は、記録されていない状態での、電子ファイルなどのデータ自身を含むものとする。

本発明記録装置の実施例を示すブロック図である。本発明に関連するＭＰＥＧのユーザーデータ中に記録するデータ構造の説明図である。本発明再生装置の実施例を示すブロック図である。本発明に関連する動画と静止画の関係及び画素加算、画素ずらしの方法を示す説明図である。本発明装置を構成する光学系部分の一実施例を示す構成図である。本発明装置の動作を説明するためのフローチャートである。本発明装置に関連するＮＤフィルタＣＣＤを用いた高ダイナミック画像合成の説明図である。本発明装置の動作を説明するためのフローチャートである。従来技術におけるＭＰＥＧ規格のデータパック構造を示す説明図である。従来技術におけるMPEG符号化器のブロック図である。従来技術におけるMPEG復号化器のブロック図である。従来技術におけるディレクトリ、ファイル構造例の説明図である。従来技術におけるオリジナルPGCの構造を示す説明図である。従来技術におけるユーザー定義PGCの構造を示す説明図である。本発明に関連するディレクトリ、ファイル構造の例を示す図である。本発明に関連するTMG.ifoのデータ構造例を示す図である。

符号の説明

１０１レンズ
１０２光路分離機
１０３オーディオ入力器
１０４受光素子
１０５受光素子
１０６Ａ／Ｄ変換器
１０７Ａ／Ｄ変換器
１０８Ａ／Ｄ変換器
１０９スイッチ
１１０スイッチ
１１１画素ずらし画像生成器
１１２画素加算画像生成器
１１３スイッチ
１１４スイッチ
１１５Ｕ／Ｉ
１１６ＣＰＵ
１１７静止画撮像タイミング信号発生器
１１８音声符号化器
１１９静止画符号化器
１２０動画符号化器
１２１管理データメモリ
１２２多重化器
１２３記録媒体書き込み器
１２４ディスクフォーマット器
１２５記録媒体
１２６スイッチ
１２７ＮＤフィルタ

Claims

撮像レンズと、前記撮像レンズから入射された光線を分離する光路分離器と、前記光路分離器で分離された２つの光をそれぞれ受光して、画像信号として出力する２つの受光素子と、前記画像信号を動画として記録媒体に記録する動画像信号記録器と、前記画像信号を静止画像として記録媒体に記録する静止画信号記録器とを備えたオーディオビデオデータ同時記録装置において、受光素子からの２つの信号を用いて、双方を異なる画素位置のデータとして画像信号を合成し、１つの信号の画素数よりも大きい画素数の静止画、もしくは動画像を形成する第一のモードと、受光素子からの２つの信号を用いて、双方を同じ画素位置のデータとして画像信号を合成するにあたり、一方に減光用のＮＤフィルタを配置し輝度レンジを異ならせて合成し、１つの信号の画像よりも広ダイナミックレンジの静止画像、もしくは動画像を形成する第二のモードと、受光素子からの１つの信号を動画像として形成し、もうひとつを静止画像として形成する第三のモードとの３モードの機能を持つことを特徴とするオーディオビデオ信号記録装置。
撮像レンズから入射された光線を２つに分離し、分離された２つの光をそれぞれ受光して、画像信号を入力するステップと、前記画像信号を動画として記録媒体に記録する動画像信号記録ステップと、前記画像信号を静止画像として記録媒体に記録する静止画信号記録ステップとを備えたオーディオビデオデータ同時記録方法において、受光素子からの２つの信号を用いて、双方を異なる画素位置のデータとして画像信号を合成し、１つの信号の画素数よりも大きい画素数の静止画、もしくは動画像を形成する第一のモードと、受光素子からの２つの信号を用いて、双方を同じ画素位置のデータとして画像信号を合成するにあたり、一方に減光用のＮＤフィルタを配置し輝度レンジを異ならせて合成し、１つの信号の画像よりも広ダイナミックレンジの静止画像、もしくは動画像を形成する第二のモードと、受光素子からの１つの信号を動画像として形成し、もうひとつを静止画像として形成する第三のモードとの３モードの機能を持つことを特徴とするオーディオビデオ信号記録方法。