本発明の実施例においては、少なくともスクイーズモードまたはレターボックスモードなどのアスペクト比の補正に関する補正情報を、圧縮し、かつ、アスペクト比を補正したデジタル画像データに多重化して伝送(記録)される。そこで、最初に、この補正情報、その他の映像信号に付加する付加情報の伝送方法について説明する。
付加情報を伝送する規格として、EIAJ(日本電子機械工業会)においては、CPX−1202,CPX−1204を規定している。
「アスペクト比の異なる映像信号の識別信号とその伝送方法」として規定されているCPX−1202によれば、ビデオ信号を出力するS端子に、識別信号として、所定のレベルの直流電圧を重畳する方法が規定されている。従って、例えば、この重畳する直流電圧の値を、伝送するデジタル画像データの補正情報に対応して、適宜変化させる(例えばレターボックスモードのとき、重畳する直流電圧の値を3Vとし、スクイーズモードのとき5Vとし、それ以外のときは0Vとする)ことで、その画像データがレターボックスモードでアスペクト比を補正されたのか、あるいはスクイーズモードでアスペクト比を補正されたのかを特定することができる。受信、再生側においては、このS端子に重畳されている直流電圧の値に対応して、アスペクト比の補正制御を行う。
一方、「アスペクト比の異なる映像信号の識別信号とその伝送方法(II)」として規定されているCPX−1204(通称ID−1,ビデオID)においては、NTSC方式の輝度信号の垂直ブランキング期間の第20ラインおよび第283ラインに、図1に示すような信号波形の20ビットの識別信号をコード化して伝送することが規定されている。すなわち、水平同期信号の立下りエッジから、11.2μs±0.6μsの位置には、基準となるRef信号が、2.232μs±20nsの幅で配置され、さらに同一の幅の間隔をおいて、同一の幅のビット(bit)1乃至ビット(bit)20の20ビットのデータが、同一の幅で配置されている。
この20ビットのデータは、図2に示すように、6ビットのWORD0、4ビットのWORD1、4ビットのWORD2、および6ビットのCRCで構成されている。そして、WORD0は、さらに3ビットのWORD0−Aと、3ビットのWORD0−Bにより構成されている。
WORD0には、受信機側の自動制御を主目的とする基本パラメータが設定され、WORD0−Aには、映像信号伝送形式に関する識別情報が、図3に示すように配置される。
すなわち、WORD0−Aのビット1には、伝送する画像データのアスペクト比が16:9であるとき(フルモードであるとき)1がセットされ、4:3であるとき0がセットされる。またビット2には、画像表示形式がレターボックスであるとき1が設定され、ノーマルであるとき0が設定される。
WORD0−Bには、映像および映像に付随して同時に伝送される他の信号(例えば音声信号など)に関する識別情報を配置することができるとされる。
WORD1には、WORD0に従属する識別信号が、また、WORD2には、WORD0に従属する識別信号、情報などが、それぞれ配置されるようになされている。CRCコードは、エラーチェックコードであり、生成他項式G(X)は、X6+X+1とされ、プリセットは、全て1とされている。
CPX−1204は、NTSC方式、すなわち525ラインシステムのテレビジョン用の識別信号として定義されているが、欧州においても、同様に、ETSI(European Telecommunication Standards Institute)において、625ライ ンシステムのPALテレビジョン方式およびSECAMテレビジョン方式の識別信号のためのWSS(Wide Screen Signaling)規格が制定されようとしている。
このWSSにおいては、図4に示すように、PAL信号の第23ライン目に、14ビットの識別信号がコード化して伝送されるように規定されている。同図に示すように、第23ラインの最初には、クロックを生成するためのRun−inが、その次には、コードの開始を表すStart Codeが、そして、その次には、833kHzの14ビットのデータが配置されている。
図5に示すように、14ビットのうちの最初の4ビットで構成されるグループ1のビットには、アスペクト比情報が、次の4ビットのグループ2には、PAL plus関連情報が、次の3ビットのグループ3のビットには、サブタイトル情報が、それぞれ配置されるようになされており、そして、最後の3ビットのグループ4は未定義とされている。
グループ1のb3乃至b0の4ビットが、所定の値を取ることにより、図6に詳細を示すように、アスペクト比情報が設定される。例えば、4ビットが1000であるとき、これは、アスペクト比が4:3で、ノーマル(フルフォーマット)の画像であることを表している。また、0001は、14:9のアスペクト比のレターボックスの画像であり、その有効画像領域の位置は、中央(センタ)であることを表している。
また0010は、14:9のアスペクト比のレターボックスの画像が、トップの位置に表示されるものであることを表している。
なお、レターボックスのセンタの表示とは、図7(A)(図49(A))に示すように、実質的な画像(有効画像領域)が画面の中央に配置され、その上下の端部に黒味部分(無画像部分)を表示することを表し、トップの表示とは、同図(B)(図49(B))に示すように、実質的な画像(有効画像領域)を画面の上部(top)に表示し、画面の下部には、黒味部分を表示することを意味している。
図8は、図6のアスペクト比のより詳細な範囲を表している。すなわち、図6の4ビットの1000は、4:3のアスペクト比を、0001は14:9のアスペクト比を、1011は16:9のアスペクト比を、1101は16:9より大きな(>16:9)アスペクト比を、それぞれ表しているが、4:3のアスペクト比とは、図8に示すように、A:Bのアスペクト比をa(=A/B)で表すとき、その値aが1.46以下である場合を意味するものとされている。また、14:9のアスペクト比は、aが1.46より大きく1.66以下である場合を意味し、16:9のアスペクト比とは、aが1.66より大きく1.90以下であることを意味し、16:9より大きなアスペクト比とは、aが1.90より大きな値である場合を意味している。
また、図5のグループ2の4ビットのうち、ビット4は、それが0であるときカメラモードを表し、1であるときフィルムモードであることを表す。すなわち、0は通常のテレビカメラから取り込まれた画像である場合を表し、1はテレシネなどフィルムなどから変換された画像であることを表している。
図5のグループ2のビット5乃至ビット7は、未使用とされている。
グループ3のビット8は、図10に示すように、0がテレテキストに字幕がないことを表し、1がテレテキストに字幕があることを表している。
さらに、グループ3のビット9とビット10は、図11に示すように、それが00であるとき、字幕がないことを表し、10であるとき、画面(有効画像領域)内に字幕があることを表し、01であるとき、黒味部分に字幕があることが表している。11は、未使用とされている。
字幕が画面(有効画像領域)内に位置する場合と、黒味部分に位置する場合の表示例は、図7に示されている。
なお、図6に示したWSSのアスペクト比情報に対応して、図3に示したCPX−1204のWORD0−Aのビット1とビット2を自動的に設定することができる。例えば、図6において、0111であるとき、図3のビット1が1とされ、図6のそれ以外とき、図3のビット1は0とされる。また、図6の4ビットが、0001,0010,1011,0100または1101であるとき、図3のビット2が1とされ、図6の4ビットが、1000,1110,または0111であるとき、図3のビット2は0とされる。
なお、上記したCPX−1204については、その拡張が、最近協議されている(以下、これを拡張CPX−1204と称する)。この拡張CPX−1204においては、例えば図12に示すように、20ビットのうちの最初の2ビットがWORD0、次の4ビットがWORD1、次の8ビットがWORD2、そして、最後の6ビットがCRCとされる。
WORD0には、図13に示すように、映像信号伝送形式に関する識別情報が配置される。WORD0のビット1が1であるとき、アスペクト比が16:9のフルモード(スクイーズモード)であることを意味し、0はアスペクト比が4:3であることを意味している。また、WORD0のビット2の1は、画像表示形式がレターボックスであることを意味し、0はノーマルであることを意味している。
このように、図12におけるWORD0は、図2におけるWORD0−Aのbit1および2の部分と互換性を保つように定義される。
さらに、WORD1は、図14に示すように、WORD2で伝送される情報を指定するヘッダを表しており、例えば、そのビット3乃至ビット6の4ビットが0000であるとき、WORD2はデジタルコピー情報であることを表し、0001は、画像形式に関する情報であることを表し、0010は、字幕位置情報であることを表している。
WORD2は、WORD1のヘッダで指定されたデータを表し、WORD1が0000であり、デジタルコピー情報を表しているとき、WORD2のビット7乃至ビット14の8ビットにより、図15に示すような内容が規定される。すなわち、この実施例においては、ビット7とビット8のみが実質的に規定され、ビット7とビット8が、1であるか0であるかにより、図16に示すCGMS−A(Copy Generation Management System−Analogue Interface)のテーブルが規定されている。ビット7と8の値が00であるとき、これはコピーフリーを表し、01は未使用とされ、10は1回のみのコピーの許容を、11はコピーの禁止を、それぞれ表している。
さらに、WORD1が0001である画像形式に関する情報である場合、WORD2は、図17に示すように規定される。すなわち、ビット7と8により、図18に示す画面サイズが規定され、ビット9と10より、図19に示す画面位置が規定される。
また、WORD2のビット11は、それが1であるとき無画部(黒味部分)に字幕があることを表し、0は字幕がないことを表している。
図18に示すように、画面サイズは、ビット7とビット8が00であるとき4:3とされ、01であるとき14:9のレターボックスとされ、10であるとき16:9のレターボックスとされ、11であるときシネスコレターボックスとされる。
さらに、図19に示すように、画面位置は、ビット9と10が00であるときセンタとされ、01または10であるとき、それぞれ、上または下とされる。11は、未使用とされる。
さらに、WORD1が0010の字幕を含む有効画像領域位置情報である場合、図20に示すように、WORD2のビット7は、ビット8乃至ビット14に示す字幕を含む有効画像領域の表示位置が、画面の上端についての情報であるのか、画面の下端についての情報であるのかを表しており、1は上端であることを表し、0は下端であることを表している。
また、WORD2のビット8乃至ビット14の7ビットにより表される0乃至127の値は、図22に示すように、字幕を含む有効画像領域の最上端(または最下端)の画面の上端からのライン数を表している。例えば、ビット7が1であり、ビット8乃至14により表される値が0であるとき、その字幕を含む有効画像領域の最上端は、画面の上端から第22番目のラインに表示され、ビット8乃至14により表される値が2であるときは、画面の上端から第24番目のラインに表示されることを表している。また、ビット7が0であり、ビット8乃至14により表される値が0であるとき、その字幕を含む有効画像領域の最上端のラインは、第262ラインであり、ビット8乃至14により表される値が2であるとき、その字幕を含む有効画像領域の最上端のラインは、第260ラインであることを表している。
なお、このWORD1(=0010)を伝送する場合、少なくとも、2秒間に2回以上伝送される。
また、米国においては、CPX−1204と同様の方式の他に、EIA−608で規定されている、XDS(Extended Data Services)(旧略称EDS)でも、画像のアスペクト比情報などの付加情報を伝送することができる。このXDSにおいては、NTSCテレビジョン信号の第21ラインおよび第284ラインに、パリティ付きで16ビットの信号が挿入されるようになされており、これにより、例えば図23に示すように、有効画像領域の位置と、スクイーズモードまたはノーマルモードの識別を伝送することができるようになされている。図23に示すS0乃至S5の5ビットにより、有効画像領域のスタートラインを表し、E0乃至E5の5ビットにより、有効画像領域の終了ラインを表している。また、スクイーズモードのとき、Q0が1とされ、ノーマルモードとき、Q0が0とされる。
図24と図25は、このような字幕位置情報とその使用方法を模式的に表している。例えば、図24に示すように、有効画像領域の先頭ラインは、S0乃至S5により表され、終了ラインは、E0乃至E5により表される。そして、字幕(ABC)の最下行のラインが判っている場合には、有効画面領域の最上行から字幕の最下行までのラインを垂直フィルタなどで切り出し、表示するようにすることができる。
また、図25に示すように、有効画像領域の上側と下側の両方に黒味部分が付加されており、それぞれ黒味部分に、字幕が表示されている状態において、上側の字幕の最上行と、下側の字幕の最下行が判っている場合においては、上側の字幕の最上行から下側の字幕の最下行までの範囲を垂直フィルタで切り出し、表示するようにすることができる。このようにすれば、有効画像領域はもとより、字幕も欠落することなく、完全に表示することが可能となる。
本実施例においては、以上のような規格により定められている識別信号を、データをMPEG方式で圧縮し、アスペクト比を補正したデジタル画像データに多重化して伝送し、受信側においてこれを受信したり、記録媒体に記録し、再生装置においてこれを再生するようにするのであるが、次に、伝送(記録)のフォーマットについて説明する。
図26は、プログラムストリーム(MPEG2システムストリーム)のフォーマット(Syntax)を図解したものを表している。同図に示すように、プログラムストリームは、n個のパック(pack)から構成され、各パックの先頭には、パックヘッダ(pack header)が配置されている。各パックは、pack start code,SCR,program mux rate,pack stuffing length,packstuffing byteなどが配置される他、さらにsystem headerに続いて、PES packetが順次配置されている。
system headerには、system header start code,header length,rate boundなどが配置されている。
さらにまた、stream id,P_STD,buffer bound scale,P_STD,buffer size boundなどが配置されている。
図26に示したSyntaxに従って多重化を行ったビットストリームの例を図27(A)に示す。すなわち、図27(A)に示すように、ビデオパケット、サブタイトルパケット、オーディオパケットなどが、パケットを単位として伝送されるようになされている。そして、ディスクに記録される場合には、セクタを単位として記録されるようになされている。
各パケットは、図27(B)に示すように、パケットヘッダとパケットデータにより構成されている。このパケットデータには、例えば、そのパケットがビデオパケットであれば、図27(C)に示すように、ピクチャヘッダとピクチャコーディングエクステンション、並びにピクチャデータおよび図27(C)には例として示さないが、グループピクチャーズヘッダやシーケンスヘッダやシーケンスエンドコードなどが含まれることになる。
このピクチャデータのうち、Iピクチャのデータを含むビデオパケットのセクタは、エントリセクタとされる。そして、このエントリセクタには、パックヘッダ、PSD(Program Stream Directory)およびPSM(Program Stream Map)が配置される。すなわち、Iピクチャの直前には、プログラムストリームマップ(PSM)が配置される。
エントリセクタの構成をまとめて表すと、図28に示すようになる。すなわち、エントリセクタには、pack headerが、その先頭に配置され、ここには、オプションとして、system headerが配置される。そして、その次にPSD、PSMが配置され、さらにその次に他のパケットが配置される。
図29は、プログラムストリームマップ(PSM)のフォーマット(Syntax)を図解したものを表している。その先頭には、24バイトのpacket start code prefixが配置され、さらにその次には、8バイトのmap stream idが配置され、さらにその次に、program stream map lengthが配置される。さらにその次には、current next indicatorなどが配置されている。
図30は、図29に示したPSMのSyntaxを表している。図中、bslbfは、bit string left bit firstを表し、uimsbfは、unsinged interger msb firstを表している。また、rpchofは、remainder polynomial coefficients highest order firstを表している。
この図30のPSM Syntaxにおけるglobal_descriptors()のSyntaxが、図31に示されている。また、図30におけるelementary stream descriptorsのSyntaxが、図32に示されている。
この図32に示すelementary stream descriptors Syntaxにおけるdvd_video_descriptor()に、図34を参照して後述するように、各種の識別記号が記述されるのであるが、このdvd_video_descriptor()のdesriptor_tagとしては、0xdfが図33で定義されるように付加されている。図33には、この他、各種のdescriptorのTagが表されている。各descriptorは、このTagにより識別されることになる。
また、図33に示すように、dvd_video_descriptor()は、DVD(Digital Video Disk)の規格で独自に規定されるものである。
図34は、dvd_video_descriptor()のSyntaxを表している。
図34において、descriptor_tagは、このdvd_video_descriptorを識別するためのtagであり、図33を参照して説明したように、ここには、0xdfが記述される。
descriptor_lengthは、このdvd_video_descriptorの長さを表す。
horizontal_sizeと、vertical_sizeは、それぞれ符号化され、記録(伝送)されている画像データの水平方向と垂直方向のサイズを画素数の単位で表している。
また、display_horizontal_sizeと、display_vertical_sizeは、表示しようとする長方形の領域の水平方向の長さと垂直方向の長さを、それぞれ表している。この長方形の領域が符号化されている画像の領域より小さい場合は、表示処理において、符号化画像の一部分が表示されるようになされる。逆に、この長方形の領域が符号化されている画像の領域より大きい場合、表示処理において、表示装置の一部分に再生画像が表示される(残りの領域には、黒味部分が付加される)。
film_or_camera_flagは、図9を参照して説明したように、WSSの場合において、その画像がカメラより取り込んだものであるのか、フィルムの画像をビデオ信号に変換したものであるのかを表すフラグである。
closed_gop_flagは、そのGOP(Group of Picture)が、直前のGOPを参照していなければ1とされ、参照していれば0とされる。
still_picture_flagは、所定の期間静止画を表示するような場合において、最初の静止画と最後の静止画の間の画像であるか否かを表すフラグである。
edge_crop_flagは、エッジクロップモード(図44を参照して後述する)の表示を禁止するか否かを表すフラグである。
aspect_ratio_codeは、図35に示すように規定される。すなわち、その値の0000は、その使用が禁止されている。また、その値の0001は、画像を構成する各画素のアスペクト比が1:1であることを表し、0010は、表示アスペクト比が4:3、0011は16:9、0100は2.21:1であることを表している。
frame_rate_codeは、図36に示すように規定されている。すなわち、その値の0000は使用が禁止され、0001はビデオ信号のフレームレート(フレーム周波数)が23.976Hzであることを表している。また、0010は24Hz、0011は25Hz、0100は29.97Hzを表している。さらに、0101は30Hz、0110は50Hz、0111は59.94Hz、1000は60Hzを、それぞれ表している。
wss_aspect_ratio_codeは、図5に示したグループ1の4ビットのアスペクト比情報を表しており、wss_subtitles_within_teletext_flagは、図5のグループ3の3ビットのサブタイトル情報のうちの、ビット8のテレテキスト字幕の有無を表すフラグ(すなわち、図10に示すフラグ)を表している。
なお、CPX−1204,WSS,拡張CPX−1204などを生成する際に、wss_aspect_ratio_codeの代わりに、図35に示す、aspect_ratio_codeを用いるようにすることも可能である。
また、wss_subtitling_modeは、図5のグループ3の3ビットのサブタイトル情報のうちの、ビット9とビット10で表される、字幕位置のモード(すなわち図11に示すモード)を表している。
cgms_a_codeは、拡張CPX−1204(図14)におけるデジタルコピー情報、すなわち図15と図16におけるビット7とビット8のデータが記述される。
ext1204_screen_size_codeは、図18のWORD2のビット7とビット8により規定される画面サイズが記述される。
ext1204_screen_position_codeは、図17と図19に示すWORD2のビット9とビット10により規定される画面位置の値が記述される。
ext1204_subtitle_position_upperと、ext1204_subtitle_position_lowerは、それぞれ図22の上端または下端の字幕の最上端または最下端のライン位置を表すものである。
以上の第1の実施例においては、図34に示す各種の識別信号(付加情報)をPSMに記録するようにしたが、PSMではなく、Video_LayerのUser Dataに記録するようにすることもできる。
すなわち、図37に示すように、MPEG2で規定されているVideo Syntaxにおいては、picture_header(),picture_coding_extension()に続いて、extensions_and_user_data(2)が設けられている。このextensions_and_user_dataのSyntaxに沿って、例えば、次のように、必要な識別信号を符号化して記述することができる。
すなわち、MPEGで規定されているUser_dataのSyntaxにおいては、図38に示すようにして、user_dataを規定することができるようになされている。そこで、この規定に従って、図39に示すように、user_dataを記述する。ここで記述する内容は、実質的に図34に示したdvd_video_descriptorに記述した内容と同様である。
なお、図39において、marker_bit()は、11111111の8ビットでデータであり、前後のデータが組み合わされた場合において、user_data_start_codeなどの特異なデータが生成される(エミュレーションを起こす)ことを防止するために挿入されるものである。
次に、以上のようにして、識別信号(付加情報)を、MPEG方式で圧縮され、かつ、アスペクト比の補正がなされた画像のデジタルビデオ画像データに多重化して伝送する装置の実施例として、その多重化データを記録媒体としてのディスクに記録する記録装置の実施例について、図40を参照して説明する。
この記録装置においては、オーディオエンコーダ102が、オーディオ入力に入力されたオーディオ信号をMPEG方式で圧縮符号化し、多重化装置113に出力している。また、ビデオエンコーダ101は、ビデオ入力に入力されたビデオ信号をMPEG方式で圧縮符号化し、多重化装置113に出力している。この場合、オーディオエンコーダ102から出力されるストリームは、MPEG2オーディオストリーム(オーディオレイヤー)とされ、ビデオエンコーダ101から出力されるストリームは、図27(C)に示すMPEG2ビデオストリーム(ビデオレイヤー)とされる。
また、ビデオエンコーダ101は、基本的に、4:3のアスペクト比の画像をエンコードするようになされており、16:9,14:9,2:1などのワイドなアスペクト比の画像は、図46を参照して説明したように、レターボックスモードまたはスクイーズモードで、アスペクト比補正の処理を行った後、ビデオエンコーダ101に入力されるとする。
多重化装置113は、MPEGビデオストリームとMPEGオーディオストリームをパケット化し、図27(A)に示すように、時分割多重化する。
なお、図示はされていないが、サブタイトルストリームを多重化装置113に供給し、ビデオストリーム、オーディオストリームとともに多重化するようにすることができる。この場合、多重化装置113から出力されるMPEG2システムストリームは、図27(A)に示すように、ビデオパケットとオーディオパケットの他、サブタイトルパケットを含むことになる。
なお、多重化装置113は、PSMの領域を形成(確保)するが、そこはさし当たって空白にして多重化を行うことになる(実際のデータ(付加情報)はPSMデータ上書回路155で書き込まれる)。
エントリポイントデータ記憶回路133には、エントリポイント検出回路131の出力が供給されている。エントリポイントデータ記憶回路133は、エントリポイント検出回路131が検出、出力するエントリポイントの情報(Iピクチャの発生ポイントの情報)を受け取り、これを記憶する。
TOCデータ発生回路156は、エントリポイントデータ記憶回路133の記憶内容を見て、TOC(Table Of Contents)情報を発生するが、TOC情報に は、ディスクの名称、各チャプタの名称、各チャプタのディスク上の開始アドレス、ディスクの再生所要時間、各チャプタの再生所要時間、各エントリセクタの開始アドレスなども含まれている。
多重化回路113から出力された多重化ストリームは、DSM(Digital Storage Media)110に一旦記憶された後、DSM110から読み出され、TOC 付加回路150に供給される。TOC付加回路150は、TOCデータ発生回路156が発生したTOC情報を、DSM110から供給される多重化ストリームに付加し、PSMデータ上書回路155に出力する。
発生回路157は、ビデオエンコーダ101の出力から上述した図34に示すPSMデータ(dvd_video_descriptor)を発生し、これをPSMデータ上書回路155に出力する。PSMデータ上書回路155は、多重化装置113で確保されている多重化ストリーム中のPSMデータを書き込むためのエントリセクタの領域にPSMデータを上書きする。
PSMデータ上書回路155の出力は、セクタヘッダ付加回路151に供給され、そこにおいてセクタ毎に多重化ストリームが区切られて、セクタ毎にセクタヘッダが付加される。セクタヘッダ付加回路151により、セクタヘッダが付加されたデータは、ECC(誤り検出訂正)エンコーダ152に入力され、誤り検出訂正のためのエンコード処理が実行される。
ECCエンコーダ152より出力されたデータは、変調回路153に入力され、EFM(Eight to Fourteen Modulation)変調され、その変調出力が伝送路に伝送される。この実施例においては、カッティングマシーン154に供給される。
カッティングマシーン154においては、変調回路153から入力されたデータに対応して、ディスク160にピットを形成することで、多重化ストリームデータを記録する。そして、このディスク160を原盤として、多数のレプリカとしてのDVD(Digital Video Disk)が製造される。
図41は、以上のようにして生成されたDVDとしての光ディスク1を再生する再生装置の構成例を表している。光ディスク1は、図示しないスピンドルモータにより、所定の回転数で回転するよう制御されており、ピックアップ2から光ディスク1のトラックにレーザ光を照射することにより、トラックに記録されているMPEG方式により圧縮処理されたデジタルデータが読み出される。このデジタルデータは、復調回路3に入力され、EFM復調された後、セクタ検出回路4に供給される。また、ピックアップ2の出力は、フェイズロックドループ(PLL)回路9に入力され、クロックが再生される。この再生クロックは、復調回路3、セクタ検出回路4などに供給される。
光ディスク1には、固定長のセクタを単位として多重化ストリームが図27(A)に示すように記録されているが、各セクタの先頭には、セクタヘッダが配置されており、このセクタヘッダにはセクタシンクが付加されている。セクタ検出回路4は、このセクタシンクを検出することで、セクタの区切りを検出する。また、セクタ検出回路4は、セクタアドレスを検出し、制御回路6とトラックジャンプ判定回路7に供給する。
また、復調回路3が出力するデータは、セクタ検出回路4を介して、ECC(誤り検出訂正)回路33に入力され、誤りの検出訂正処理が行われる。誤り検出訂正の処理が行われたデータは、制御回路6の制御の下にリングバッファメモリ5に書き込まれる。
ECC回路33の出力はまた、PSM検出回路40に入力されている。PSM検出回路40は、入力されたストリームデータからエントリセクタ内のPSM情報(付加情報)を検出し、検出したPSM情報を制御回路6に出力する。制御回路6は、このPSM情報に対応して、信号発生器51を制御する。信号発生器51は、この制御に対応して、例えば、16:9のアスペクト比のディスプレイ18に供給する識別信号を発生させる。D/A変換器17は、この識別信号を、例えば、図1を参照して説明したように、NTSC方式のアナログビデオ信号の垂直ブランキング期間の第20ラインおよび第283ラインに挿入して、ディスプレイ18に出力する。
制御回路6は、セクタ検出回路4より供給された各セクタのセクタアドレスに基づいて、そのセクタのデータをリングバッファ5へ書き込む書き込みアドレスをライトポインタWPにより指定する。さらに、制御回路6は、後段のビデオコードバッファ10からのコードをリクエスト信号に基づき、リングバッファ5からデータを読み出す読み出しアドレスをリードポインタRPにより指定する。リードポインタRPの位置から読み出されたデータは、デマルチプレクサ32に供給されるようになされている。
フォーカスサーボ回路25は、ピックアップ2の出力からフォーカスエラー信号を生成し、このフォーカスエラー信号に対応して、フォーカスサーボを実行するようになされている。同様に、トラッキングサーボ回路8は、ピックアップ2が出力するトラッキングエラー信号に対応して、ピックアップ2を制御し、トラッキングサーボを行うようになされている。
トラックジャンプ判定回路7は、制御回路6からの指令に対応して、所定のタイミングでトラックジャンプ指令信号をトラッキングサーボ回路8に供給し、ピックアップ2を所定のトラックに高速移動(ジャンプ)させるようになされている。
ユーザインタフェース31は、ユーザが所定の指令を入力するとき操作され、制御回路6に、その操作に対応する指令が入力されるようになされている。
デマルチプレクサ32は、光ディスク1に記録されているデータがビデオデータ、オーディオデータ、サブタイトルデータなどを多重化した符号化データとされているため、リングバッファ5より供給されたデータからこれらのデータを分離し、オーディオデータとサブタイトルデータを図示せぬオーディオデコーダとサブタイトルデコーダに供給し、ビデオデータをビデオデコーダ20のビデオコードバッファ10に供給する。
ビデオコードバッファ10に記憶されたデータは、その一部が、ピクチャヘッダ検出器34に供給される。ピクチャヘッダ検出器34は、入力されたデータからピクチャヘッダを検出し、このピクチャヘッダからさらにピクチャのI,P,Bのタイプを示すタイプ情報、およびGOP内の画面順を示すテンポラルリファランス(TR)の情報を検出する。検出されたピクチャタイプ情報は、さらにピクチャデータ選別回路35に供給される。ピクチャデータ選別回路35は、特殊再生時、IピクチャおよびPピクチャのみを選別して、ビデオコードバッファ10から逆VLC回路11に供給されるように制御する。
通常再生時においては、ピクチャデータ選別回路35は、ピクチャタイプによりピクチャを選別することなく、全てのタイプのピクチャをビデオコードバッファ10から逆VLC回路11に供給するように制御する。
逆VLC回路11に供給されたデータは、そこで逆VLC処理が行われた後、逆量子化回路12に供給される。また、このとき、逆VLC回路11は、コードリクエスト信号をビデオコードバッファ10に送り、ビデオコードバッファ10から新たなデータの転送を受ける。
また逆VLC回路11は、量子化ステップサイズを逆量子化回路12に出力するとともに、動きベクトル情報を動き補償回路15に出力する。逆量子化回路12は、逆VLC回路11より供給された量子化ステップサイズに対応して、逆VLC回路11より供給されたデータを逆量子化し、逆DCT回路13に供給する。逆DCT回路13は、入力されたデータを逆DCT処理した後、加算回路14に出力する。
加算回路14は、逆DCT回路13の出力と動き補償回路15の出力とをピクチャのタイプ(I,P,B)に応じて加算し、フレームメモリバンク16に出力する。
フレームメモリバンク16は、3つのフレームメモリ16a,16b,16cと、その入出力を切り換えるスイッチ16d,16eを備え、スイッチ16dでデータを書き込むメモリを16a,16b,16cのいずれかに選択し、スイッチ16eを切り換えることで、読み出すメモリを16a,16b,16cのいずれかに切り換えるようにする。これにより、デコード処理した各フレームの画像が元のフレームの順序に戻された後、D/A変換器17に供給されるようになされている。また、フレームメモリバンク16a,16b,16cより読み出されたデータは、適宜、動き補償回路15に供給され、動き予測データとして、加算回路14に供給されるようになされている。
D/A変換器17は、NTSCエンコーダまたはPALエンコーダを内蔵しており、スイッチ16eより供給されたデジタル画像データを、NTSC方式またはPAL方式のアナログビデオ信号に変換して、ディスプレイ18に出力するようになされている。
次に、検出したPSM情報に対応して、アスペクト比補正状態を制御する動作について説明する。ピックアップ2は、光ディスク1に記録されているデータを再生し、復調回路3に出力する。復調回路3は、入力された再生データをEFM復調し、セクタ検出回路4を介してECC回路33に出力する。ECC回路33は、入力されたデータの誤り検出訂正処理を行った後、リングバッファ5に供給し、記録する。
リングバッファ5より読み出されたデータは、デマルチプレクサ32に入力され、デマルチプレクサ32は、入力されたデータからサブタイトルデータとオーディオデータを分離し、それぞれサブタイトルデコーダとオーディオデコーダへ出力する。また、ビデオデータを分離し、ビデオコードバッファ10に出力する。
ビデオコードバッファ10に記憶されたデータは、さらに逆VLC回路11に供給され、逆VLC処理された後、逆量子化回路12で逆量子化され、さらに逆DCT回路13で逆DCT処理される。逆DCT回路13より出力されたデータは、加算回路14で動き補償回路15が出力するデータで動き保証された後、スイッチ16dを介して、フレームメモリ16a乃至16cのいずれかに書き込まれる。
フレームメモリ16a乃至16cに書き込まれたデータは、スイッチ16eを介して元のフレームの順番で読み出され、D/A変換器17においてNTSC方式のアナログビデオ信号に変換された後、16:9のアスペクト比のディスプレイ18に出力され、表示される。
一方、PSM検出回路40は、ECC回路33が出力するデータからPSM情報を検出し、制御回路6に出力する。制御回路6は、入力されたPSM情報に対応する制御信号を信号発生器51に出力する。信号発生器51は、この制御信号に対応して所定の識別信号を発生し、D/A変換器17に出力する。この信号は、上述した図34に示す、dvd_video_descriptorの内容に対応する信号である。
ディスプレイ18として、図47に示したような、16:9のアスペクト比のCRT85を有するワイドテレビジョン受像機80が接続されているような場合、このテレビジョン受像機80の内部には、水平方向フィルタ82と垂直方向フィルタ83が設けられている。そこで、信号発生器51がPSM情報をD/A変換器17に出力すると、D/A変換器17は、このPSM情報を、例えば、図1を参照して説明したように、第20ラインおよび第283ライン上に(図1)挿入する。そして、この信号が、テレビジョン受像機80に供給される。
テレビジョン受像機80においては、図47に示すように、テレビジョン信号復調回路81で、ビデオ信号と識別信号とを分離し、ビデオ信号を水平方向フィルタ82、垂直方向フィルタ83を介して、CRT85に出力し、表示する。また、識別信号は、抽出されてコントローラ84に供給される。コントローラ84は、この抽出された識別信号に対応して、水平方向フィルタ82と垂直方向フィルタ83を制御する。
従って、例えば、補正情報の中には、画枠情報として、レターボックスモードでアスペクト補正処理されたデータであるのかを表す識別信号、あるいはアスペクト比情報として、スクイーズモードでアスペクト補正処理されたデータであるのかを表す識別信号が含まれている。コントローラ84は、レターボックスモードでもなく、スクイーズモードでもない他の識別信号(すなわちノーマルモードの識別信号)が供給されたとき、水平方向フィルタ82をオンし、垂直方向フィルタ83をオフさせる。これにより、図48(A)と(D)に示したように、4:3のアスペクト比の画面の左右に黒味部分を付加して、全体として16:9のアスペクト比の画面が、16:9のアスペクト比のCRT85に表示される。
また、レターボックスモードの画像である場合おいては、コントローラ84は、水平方向フィルタ82をオフし、垂直方向フィルタ83をオンする。これにより、図48(B)と(E)に示すように、有効画像領域のみが垂直方向フィルタ83で抽出され、16:9のアスペクト比の画面として、CRT85に表示される。
また、スクイーズモードである場合においては、コントローラ84は、水平方向フィルタ82と垂直方向フィルタ83の両方をオフする。その結果、図48(C)と(F)に示すように、水平方向に圧縮されて4:3のアスペクト比とされた画像は、16:9のアスペクト比のCRT85において水平方向に伸長され、16:9のアスペクト比の通常の画像として表示される。
また、例えば、PSM情報に図17乃至図22に示すような、有効画像領域の位置や字幕位置を規定する信号が含まれるとき、テレビジョン受像機が、字幕が欠落しないように、表示すべきラインを抽出できるように、信号を発生する。
例えば、図24に示すように、画面の上下に黒味部分が付加されており、そのうちの下側の黒味部分に字幕が配置されているものとする。このような場合に、ディスプレイ18に対して上下の字幕を含んだ黒味部分を除いて表示させるようにすると、その字幕の全部または一部が欠落してしまうような場合、有効画面領域の最上端のラインから字幕の最下端のラインまでの範囲をテレビジョン受像機の垂直フィルタ83で抽出できるように、信号発生器51で範囲情報を含む信号を発生し、D/A変換器17でテレビジョン受像機に伝送する。
あるいはまた、図25に示すように、上下の黒味部分の両方に字幕が存在するような場合においては、上側の字幕の最上端のラインから下側の字幕の下端のラインまでの範囲を垂直フィルタ83で抽出できるように、信号発生器51で範囲情報を含む信号を発生し、D/A変換器17でテレビジョン受像機に伝送するようにする。このようにすれば、画像の一部が欠落するようなことが実質的に抑制される。
以上のようにして、圧縮され、かつ、アスペクトの補正がなされた画像をデジタル的に記録した光ディスク1を再生して、アナログ記録した場合と同様に表示させることができる。
図41の実施例においては、水平方向フィルタと垂直方向フィルタが、光ディスク再生装置50に内蔵されていない構成としたが、再生装置に通常の4:3ディスプレイを接続することを考慮に入れて、同様のフィルタを内蔵させる構成とすることができる。すなわち、図42に示すように、デマルチプレサ32より出力されたビデオ信号をビデオデコーダ20に供給し、ビデオデコーダ20より出力されたビデオデータを水平方向フィルタ61と垂直方向フィルタ62を介してディスプレイ18に出力させるようにする。そして、PSM検出回路40が検出したPSM情報を制御回路6に供給し、制御回路6に、このPSM情報に対応して、水平方向フィルタ61と垂直方向フィルタ62を制御させるようにする。
この場合、ディスプレイ18としては、16:9のアスペクト比を有するワイドなテレビジョン受像機(すなわち、図47に示したテレビジョン受像機80)のようなディスプレイ18Aを接続することもできるし、あるいはまた、4:3のアスペクト比を有する通常のNTSC方式のテレビジョン受像機のディスプレイ18Bを接続するようにすることもできる。
図43は、この場合におけるより詳細な構成例を表している。同図に示すように、この実施例においては、フレームメモリバンク16より出力されたビデオデータが、水平方向フィルタ61と垂直方向フィルタ62を介してD/A変換器17に供給されるようになされている。そして、水平方向フィルタ61と垂直方向フィルタ62は、制御回路6から出力された制御信号に対応して制御されるようになされている。その他の構成は、図41における場合と同様である。
この実施例においては、使用者が、光ディスク再生装置50に接続したディスプレイ(テレビジョン受像機)18が、16:9のアスペクト比のものであるのか、4:3のアスペクト比のものであるのかを、ユーザインタフェース31から制御回路6に指令する。この指令は、予め設定されている所定のスイッチ(ユーザインタフェース31として設けられている)を切り換えるなどして行われる。
この光ディスク再生装置50に接続されているディスプレイ18が、16:9のアスペクト比のディスプレイ18Aである時、制御回路6は、水平方向フィルタ61と垂直方向フィルタ62をオフする。従って、この場合においては、実質的に、図41に示した実施例と同様の構成となり、図41に示した実施例と同様の動作が行われる。
4:3のアスペクト比を有するディスプレイ18Bは、水平方向フィルタや垂直方向フィルタを有していない。そこで、制御回路6は、ディスプレイ18として、4:3のアスペクト比を有するディスプレイ18Bが接続されている場合においては、内蔵する水平方向フィルタ61と垂直方向フィルタ62を次のように制御する。
すなわち、ノーマルモードの画像である場合においては、水平方向フィルタ61と垂直方向フィルタ62の両方ともオフされる。その結果、4:3のアスペクト比のディスプレイ18Bには、正常な画像が表示される。
レターボックスモードの画像である場合においても、制御回路6は、水平方向フィルタ61と垂直方向フィルタ62を両方ともオフする。その結果、上下に黒味部分が付加されて、全体が4:3のアスペクト比に調整された画像が、ディスプレイ18Bに表示される。
また、再生されたのがスクイーズモードの画像である場合においては、制御回路6は、図44に示すように、水平方向フィルタ61と垂直方向フィルタ62を制御する。すなわち、制御回路6は、基本的には、水平方向フィルタ61をオンし、垂直方向フィルタ62をオフさせる。その結果、水平方向フィルタ61により水平方向に圧縮されている画像の一部が切り出されて水平方向に伸長され、4:3のアスペクト比のディスプレイ18Bには、エッジクロップモードで画像が表示される。
このエッジクロップモードにおいては、図44に示すように、有効画像領域の一部の画像(左右端部の画像)が欠落することになる。このため、著作権などの観点からエッジクロップモードの表示が禁止される場合がある。edge_crop_flagとして、このエッジクロップモードの表示の禁止が指定されている場合においては、制御回路6は、水平方向フィルタ61をオフし、垂直方向フィルタ62をオンする。
垂直方向フィルタ62は、水平方向に圧縮されているスクイーズモードの画像を垂直方向に圧縮し、正常な比率の画像に変換し、さらに、その有効画像領域の上下の端部に黒味部分を付加して、全体的に4:3のアスペクト比の画像とする。すなわち、レターボックスモードの画像を生成する。そして、このレターボックスモードの画像を4:3のアスペクト比のディスプレイ18Bに出力し、表示させる。
レターボックスモードの表示が行われている状態において、使用者が、手動操作することで、エッジクロップモードの指令を入力した場合においては、制御回路6は、垂直方向フィルタ62をオフし、水平方向フィルタ61をオンして、エッジクロップモードの表示を実行させる。但し、上述したように、このエッジクロップモードの表示が禁止されている場合においては、制御回路6は、この手動指令を受け付けないようにする。
エッジクロップモードからレターボックスへの手動操作による切り換えも同様に可能である。
上記再生装置内で水平垂直フィルタを用いて画像のアスペクト比を変更する場合には、信号発生器51で発生される情報は、各フィルタ通過後の画像のアスペクト比の状態を表すように制御回路6がコントロールを行う。このようにすることにより、再生装置に4:3のディスプレイが接続されていることをユーザインタフェース31により指示されているにもかかわらず、実際には16:9のディスプレイが接続されているような場合においても、少なくとも、結果として正しいアスペクト比で表示を行うことが可能となる。
以上の実施例においては、付加情報を識別信号の一部としてSystem layerのPSMに符号化するようにしたが、MPEG System layerで定義されているPrivate Packetとして符号化するようにすることもできる。あるいはまた、Sequence毎にまとめて、Sequence_headerに続く、extensions_and_user_data(0)の一部として符号化したり、Group of Picture毎にまとめて、Group of Picture_headerに続く、extensions_and_user_data(1)の一部として符号化するようにしたり、Picture毎に、extensions_and_user_data(2)の一部として符号化するようにしてもよい。さらにまた、記録媒体(光ディスク)毎にまとめて、特願平7−61411に先に開示したように、ディスクの特定の位置に配置されているTOC領域に記録するようにすることもできる。
上記再生装置の実施例ではNTSCについて述べたが、PAL方式についても前述したWSS信号をCPX−1204およびその拡張版に代わって使用することで、同様の効果を得ることができる。
図45は、特願平7−6902に先に開示したように、XDSがMPEG System layerで定義されている、Private Streamに記録されている場合における光ディスク再生装置の構成例を表している。同図に示すように、この実施例においては、デマルチプレクサ32によりプライベートストリームが分離され、プライベートストリーム(XDS信号)デコーダ71に供給される。
プライベートストリームデコーダ71は、入力されたプライベートストリームからXDS信号をデコードし、XDS信号変更装置72に出力する。ディスプレイ18が図47に示すように水平方向フィルタ82と垂直方向フィルタ83を有する場合、上述したように、光ディスク再生装置50の水平方向フィルタ61と垂直方向フィルタ62における処理は不要となる。しかしながら、水平垂直フィルタ61,62によりアスペクト比を変更する場合には、XDS信号変更装置72は、制御回路6からの指令に対応して、両フィルタからの出力画像のアスペクト比に応じて、このXDS信号を変更し、変更した結果をXDS信号発生器73に出力する。XDS信号発生器73は、XDS信号変更装置72からの入力に対応するXDS信号を発生し、D/A変換器17に出力する。D/A変換器17は、入力されたXDS信号を第21ラインおよび第284ラインに挿入し、ディスプレイ18に出力する。
このように、この実施例においても、識別信号をPSMに配置した場合と同様の処理を実行することができる。
また、信号発生器51およびD/A変換器17をCPX−1202用にすることにより、上記再生装置実施例と同様にCPX−1202信号を発生することもできる。また、これら補正情報が有効となる時刻を示すタイミング情報を補正情報と共に記録し、その時刻に基づいてディスプレイ18に伝送するようにすることもできる。このタイミング情報としては、例えば、MPEGで規定されるPTS(Presentation Time Stamp),DTS(Decoding Time Stamp)を記録するとしてもよいし、PSMを使用する場合には、PSMの直前におかれるパックヘッダ内のSCR(System Clock Reference)を用いるとする。
なお、上記実施例においては、多重化されたデータを記録媒体に記録し、再生装置でこれを再生するようにしたが、ネットワークを介して、遠隔地に伝送し、これを受信して、用いるようにすることも可能である。
以上のように、本発明によれば、出力した装置が、垂直方向または水平方向の処理を行うフィルタを有する場合においても、正しい状態で画像を見ることが可能になる。