JP3920921B2 - テレシネ変換されたビデオデータのシームレス接続エンコード方法及びその装置 - Google Patents
テレシネ変換されたビデオデータのシームレス接続エンコード方法及びその装置 Download PDFInfo
- Publication number
- JP3920921B2 JP3920921B2 JP51414497A JP51414497A JP3920921B2 JP 3920921 B2 JP3920921 B2 JP 3920921B2 JP 51414497 A JP51414497 A JP 51414497A JP 51414497 A JP51414497 A JP 51414497A JP 3920921 B2 JP3920921 B2 JP 3920921B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- video
- vob
- stream
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title description 123
- 238000006243 chemical reaction Methods 0.000 claims description 76
- 230000003111 delayed effect Effects 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 8
- 238000012217 deletion Methods 0.000 claims description 7
- 230000037430 deletion Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 3
- 239000000872 buffer Substances 0.000 description 143
- 230000008569 process Effects 0.000 description 62
- 238000012545 processing Methods 0.000 description 53
- 238000010586 diagram Methods 0.000 description 47
- 102100037812 Medium-wave-sensitive opsin 1 Human genes 0.000 description 44
- 239000010410 layer Substances 0.000 description 29
- 239000000463 material Substances 0.000 description 28
- 230000015654 memory Effects 0.000 description 21
- 230000003287 optical effect Effects 0.000 description 20
- 230000002093 peripheral effect Effects 0.000 description 18
- 239000010408 film Substances 0.000 description 16
- 239000000758 substrate Substances 0.000 description 15
- 238000007906 compression Methods 0.000 description 11
- 230000006835 compression Effects 0.000 description 11
- 239000002356 single layer Substances 0.000 description 11
- 238000004804 winding Methods 0.000 description 11
- 239000002355 dual-layer Substances 0.000 description 10
- AGGKEGLBGGJEBZ-UHFFFAOYSA-N tetramethylenedisulfotetramine Chemical compound C1N(S2(=O)=O)CN3S(=O)(=O)N1CN2C3 AGGKEGLBGGJEBZ-UHFFFAOYSA-N 0.000 description 8
- 101150073618 ST13 gene Proteins 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 230000001276 controlling effect Effects 0.000 description 7
- 238000011161 development Methods 0.000 description 7
- 101000969688 Homo sapiens Macrophage-expressed gene 1 protein Proteins 0.000 description 6
- 102100021285 Macrophage-expressed gene 1 protein Human genes 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 230000003014 reinforcing effect Effects 0.000 description 5
- 230000001360 synchronised effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 239000010409 thin film Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 238000003822 preparative gas chromatography Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 239000011241 protective layer Substances 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000001678 irradiating effect Effects 0.000 description 2
- 238000005304 joining Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 1
- 206010010071 Coma Diseases 0.000 description 1
- 101001123331 Homo sapiens Peroxisome proliferator-activated receptor gamma coactivator 1-alpha Proteins 0.000 description 1
- 102100028960 Peroxisome proliferator-activated receptor gamma coactivator 1-alpha Human genes 0.000 description 1
- 239000012790 adhesive layer Substances 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- PUIBPGHAXSCVRF-QHFGJBOXSA-N prostaglandin C1 Chemical compound CCCCC[C@H](O)\C=C\C1=CCC(=O)[C@@H]1CCCCCCC(O)=O PUIBPGHAXSCVRF-QHFGJBOXSA-N 0.000 description 1
- CMBOTAQMTNMTBD-KLASNZEFSA-N prostaglandin C2 Chemical compound CCCCC[C@H](O)\C=C\C1=CCC(=O)[C@@H]1C\C=C/CCCC(O)=O CMBOTAQMTNMTBD-KLASNZEFSA-N 0.000 description 1
- 238000001454 recorded image Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
- H04N5/92—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/30—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
- G11B27/3027—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/32—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
- G11B27/327—Table of contents
- G11B27/329—Table of contents on a disc [VTOC]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/8042—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2562—DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/84—Television signal recording using optical recording
- H04N5/85—Television signal recording using optical recording on discs or drums
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/804—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
- H04N9/806—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
- H04N9/8063—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N9/00—Details of colour television systems
- H04N9/79—Processing of colour television signals in connection with recording
- H04N9/80—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
- H04N9/82—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
- H04N9/8205—Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Television Signal Processing For Recording (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
Description
この発明は、一連の関連付けられた内容を有する各タイトルを構成する動画像データ、オーディオデータ、副映像データの情報を搬送するビットストリームに様々な処理を施して、ユーザーの要望に応じた内容を有するタイトルを構成するべくビットストリームを生成し、その生成されたビットストリームを所定の記録媒体に効率的に記録する記録装置と記録媒体、及び再生する再生装置及びオーサリングシステムに用いられる、フィルムで撮影された映画素材をテレシネ変換と呼ばれるフレームレート変換手法によってレート変換によって生成されるビデオデータををエンコードーヂ媒体に記録再生する方法及びその装置に関する。
背景技術
近年、レーザーディスクやビデオCD等を利用したシステムに於いて、動画像、オーディオ、副映像などのマルチメディアデータをデジタル処理して、一連の関連付けられた内容を有するタイトルを構成するオーサリングシステムが実用化されている。
特に、ビデオCDを用いたシステムに於いては、約600Mバイトの記憶容量を持ち本来ディジタルオーディオの記録用であったCD媒体上に、MPEGと呼ばれる高圧縮率の動画像圧縮手法により、動画像データの記録を実現している。カラオケをはじめ従来のレーザーディスクのタイトルがビデオCDに置き替わりつつある。
年々、各タイトルの内容及び再生品質に対するユーザーの要望は、より複雑及び高度になって来ている。このようなユーザーの要望に応えるには、従来より深い階層構造を有するビットストリームにて各タイトルを構成する必要がある。このようにより深い階層構造を有するビットストリームにより、構成されるマルチメディアデータのデータ量は、従来の十数倍以上になる。更に、タイトルの細部に対する内容を、きめこまかく編集する必要があり、それには、ビットストリームをより下位の階層データ単位でデータ処理及び制御する必要がある。
このように、多階層構造を有する大量のデジタルビットストリームを、各階層レベルで効率的な制御を可能とする、ビットストリーム構造及び、記録再生を含む高度なデジタル処理方法の確立が必要である。更に、このようなデジタル処理を行う装置、この装置でデジタル処理されたビットストリーム情報を効率的に記録保存し、記録された情報を迅速に再生することが可能な記録媒体も必要である。
このような状況に鑑みて、記録媒体に関して言えば、従来用いられている光ディスクの記憶容量を高める検討が盛んに行われている。光ディスクの記憶容量を高めるには光ビームのスポット径Dを小さくする必要があるが、レーザの波長をλ、対物レンズの開口数をNAとすると、前記スポット径Dは、λ/NAに比例し、λが小さくNAが大きいほど記憶容量を高めるのに好適である。
ところが、NAが大きいレンズを用いた場合、例えば米国特許5、235、581に記載の如く、チルトと呼ばれるディスク面と光ビームの光軸の相対的な傾きにより生じるコマ収差が大きくなり、これを防止するためには透明基板の厚さを薄くする必要がある。透明基板を薄くした場合は機械的強度が弱くなると言う問題がある。
また、データ処理に関しては、動画像、オーディオ、グラフィックスなどの信号データを記録再生する方式として従来のMPEG1より、大容量データを高速転送が可能なMPEG2が開発され、実用されている。MPEG2では、MPEG1と多少異なる圧縮方式、データ形式が採用されている。MPEG1とMPEG2の内容及びその違いについては、ISO11172、及びISO13818のMPEG規格書に詳述されているので説明を省く。
MPEG2に於いても、ビデオエンコードストリームの構造に付いては、規定しているが、システムストリームの階層構造及び下位の階層レベルの処理方法を明らかにしていない。
上述の如く、従来のオーサリングシステムに於いては、ユーザーの種々の要求を満たすに十分な情報を持った大量のデータストリームを処理することができない。さらに、処理技術が確立したとしても、大容量のデータストリームを効率的に記録、再生に十分用いることが出来る大容量記録媒体がないので、処理されたデータを有効に繰り返し利用することができない。
言い換えれば、タイトルより小さい単位で、ビットストリームを処理するには、記録媒体の大容量化、デジタル処理の高速化と言うハードウェア、及び洗練されたデータ構造を含む高度なデジタル処理方法の考案と言うソフトウェアに対する過大な要求を解消する必要があった。
本発明は、このように、ハードウェア及びソフトウェアに対して高度な要求を有する、タイトル以下の単位で、マルチメディアデータのビットストリームを制御して、よりユーザーの要望に合致した効果的なオーサリングシステムを提供することを目的とする。
このようなマルチメディアデータから構成されるタイトル内容を再生するプレーヤは、テレビ受像機に接続して、再生情報をユーザが容易に利用できることが望ましい。また、タイトルとしてフィルムで撮影された映画を素材として利用されることが多いであろう。このような場合、記録ビットストリームを作成する際に、編集の容易さから、記録信号作成装置への素材の供給にはデジタルのVTRが使用される。そのために、フィルムで撮影された映画素材は、テレシネ変換と呼ばれるフレームレート変換手法によってレート変換を行って後、記録信号が作成される。
テレシネ変換は基本的には、周期的に同一パリティのフィールドをコピーした冗長フィールドを挿入することによって、フレームレートの変換が実現される。フィルムのフレームレートとビデオのフレームレートとは簡単な整数比の関係になっていないため、周期的な処理の合間に通常と異なる変換パターンが挟まれることになる。このようにして得られたテレシネ画像を圧縮符号化する際に、ビデオのフレームレートそのままで圧縮符号化を行ったのではコピーされた冗長フィールドまでも符号化することになり、効率が悪くなる。従って、コピーされた冗長フィールドを検出削除する逆テレシネ変換した後に圧縮符号化を行い、各フレームについて冗長フィールドを削除したかどうかを示すフラグと、フレームの2つのフィールドの表示順を示すフラグとを付加して記録する。
しかしながら、逆テレシネ変換を行った複数のタイトル編集単位のVOBを、連続して再生しようとした場合に、連続再生するVOB同士のつなぎ目でトップフィールドが連続してしまう。このような場合のMPEGデコーダの振る舞いは一般に保証されておらず、DVDプレーヤに於いては、フィールドが1つ挿入されたり削除されたりして再生画像のつじつま合わせが行われるか、最悪の場合、無関係なフィールドが挿入されることになる。前者の場合であっても、音声との同期ずれが発生する恐れがある。従って、完全なシームレスの再生が実現できないことになる。
本発明に於いては、VOB同士を連続して再生しても、ボトムフィールド同士、或いはトップフィールド同士が連続することなく、セルの境界に於いてもシームレス再生を実現することが出来るデータ構造を有するシステムストリームの生成方法、記録装置、再生装置、及びその様なシステムストリームが記録する媒体を提供することを目的とするデータ構造をもつ光ディスクおよび光ディスク記録方法を提供することを目的とする。なお、本出願は日本国特許出願番号H7−252733(1995年9月29日出願)に基づいて出願されるものであって、該明細書による開示事項はすべて本発明の開示の一部となすものである。
発明の開示
特定のフィールドを複数回繰り返すことにより信号源のフレームレートより大きなフレームレートに変換されたビデオ信号を、この繰り返された冗長フィールドを除去して元の信号源のフレームレートにほぼ等しいフレームレートをもつ中間信号に変換し、さらにこの中間信号を圧縮符号化して記録信号を得、該フィールドを除去したことを示すフラグ及び結果として得られた各ビデオフレームの2つのフィールドのどちらが時間的に先行しているかを示すフラグと共に、記録媒体に記録する信号記録方法において、同一の記録媒体に複数の論理的な記録区間を設ける際に、各記録区間の先頭及び終端での前記フラグが所定の値を持つように前記ビデオ信号から前記録再信号への変換を行う信号変換記録方法。
【図面の簡単な説明】
図1は、マルチメディアビットストリームのデータ構造を示す図であり、図2は、オーサリングエンコーダを示す図であり、
図3は、オーサリングデコーダを示す図であり、
図4は、単一の記録面を有するDVD記録媒体の断面を示す図であり、
図5は、単一の記録面を有するDVD記録媒体の断面を示す図であり、
図6は、単一の記録面を有するDVD記録媒体の断面を示す図であり、
図7は、複数の記録面(片面2層型)を有するDVD記録媒体の断面を示す図であり、
図8は、複数の記録面(両面1層型)を有するDVD記録媒体の断面を示す図であり、
図9は、DVD記録媒体の平面図であり、
図10は、DVD記録媒体の平面図であり、
図11は、片面2層型DVD記録媒体の展開図であり、
図12は、片面2層型DVD記録媒体の展開図であり、
図13は、両面一層型DVD記録媒体の展開図であり、
図14は、両面一層型DVD記録媒体の展開図であり、
図15は、マルチレイティッドタイトルストリームの一例を示す図であり、
図16は、VTSのデータ構造を示す図であり、
図17は、システムストリームのデータ構造を示す図であり、
図18は、システムストリームのデータ構造を示す図であり、
図19は、システムストリームのパックデータ構造を示す図であり、
図20は、ナブパックNVのデータ構造を示す図であり、
図21は、DVDマルチシーンのシナリオ例を示す図であり、
図22は、DVDのデータ構造を示す図であり、
図23は、マルチアングル制御のシステムストリームの接続を示す図であり、
図24は、マルチシーンに対応するVOBの例を示す図であり、
図25は、DVDオーサリングエンコーダを示す図であり、
図26は、DVDオーサリングデコーダを示す図であり、
図27は、VOBセットデータ列を示す図であり、
図28は、VOBデータ列を示す図であり、
図29は、エンコードパラメータを示す図であり、
図30は、DVDマルチシーンのプログラムチェーン構成例を示す図であり、
図31は、DVDマルチシーンのVOB構成例を示す図であり、
図32は、テレシネ変換と逆テレシネ変換の様子を示す図であり、
図33は、マルチアングル制御の概念を示す図であり、
図34は、エンコード制御フローチャートを示す図であり、
図35は、非シームレス切り替えマルチアングルのエンコードパラメータ生成フローチャートを示す図であり、
図36は、エンコードパラメータ生成の共通フローチャートを示す図であり、
図37は、シームレス切り替えマルチアングルのエンコードパラメータ生成フローチャートを示す図であり、
図38は、パレンタル制御のエンコードパラメータ生成フローチャートを示す図であり、
図39は、逆テレシネ変換器のブロック図であり、
図40は、パレンタル接続例を示す図であり、
図41は、テレシネ変換と逆テレシネ変換の様子を示す図であり、
図42は、逆テレシネ変換器のタイミングチャートを示す。
図43は、パレンタル接続例を示す図であり、
図44は、テレシネ変換と逆テレシネ変換の様子を示す図であり、
図45は、逆テレシネ変換器のブロック図であり、
図46は、逆テレシネ変換器のタイミングチャートを示す。
図47は、デコードシステムテーブルを示す図であり、
図48は、デコードテーブルを示す図であり、
図49は、デコーダのフローチャートを示す図であり、
図50は、PGC再生のフローチャートを示す図であり、
図51は、ストリームバッファ内のデータデコード処理フローチャートを示す図であり、
図52は、各デコーダの同期処理フローチャートを示す図であり、
図53は、単一シーンのエンコードパラメータ生成フローチャートを示す図であり、
図54は、インターリーブブロック構成例を示す図であり、
図55は、VTSのVOBブロック構成例を示す図であり、
図56は、連続ブロック内のデータ構造を示す図であり、
図57は、インターリーブブロック内のデータ構造を示す図である。
発明を実施するための最良の形態
本発明をより詳細に説明するために、添付の図面に従ってこれを説明する。
オーサリングシステムのデータ構造
先ず、図1を参照して、本発明に於ける記録装置、記録媒体、再生装置および、それらの機能を含むオーサリングシステムに於いて処理の対象されるマルチメディアデータのビットストリームの論理構造を説明する。ユーザが内容を認識し、理解し、或いは楽しむことができる画像及び音声情報を1タイトルとする。このタイトルとは、映画でいえば、最大では一本の映画の完全な内容を、そして最小では、各シーンの内容を表す情報量に相当する。
所定数のタイトル分の情報を含むビットストリームデータから、ビデオタイトルセットVTSが構成される。以降、簡便化の為に、ビデオタイトルセットをVTSと呼称する。VTSは、上述の各タイトルの中身自体を表す映像、オーディオなどの再生データと、それらを制御する制御データを含んでいる。
所定数のVTSから、オーサリングシステムに於ける一ビデオデータ単位であるビデオゾーンVZが形成される。以降、簡便化の為にビデオゾーンをVZと呼称する。一つのVZに、K+1個のVTS#0〜VTS#K(Kは、0を含む正の整数)が直線的に連続して配列される。そしてその内一つ、好ましくは先頭のVTS#0が、各VTSに含まれるタイトルの中身情報を表すビデオマネージャとして用いられる。この様に構成された、所定数のVZから、オーサリングシステムに於ける、マルチメディアデータのビットストリームの最大管理単位であるマルチメディアビットストリームMBSが形成される。
オーサリングエンコーダEC
図2に、ユーザーの要望に応じた任意のシナリオに従い、オリジナルのマルチメディアビットストリームをエンコードして、新たなマルチメディアビットストリームMBSを生成する本発明に基づくオーサリングエンコーダECの一実施形態を示す。なお、オリジナルのマルチメディアビットストリームは、映像情報を運ぶビデオストリームSt1、キャプション等の補助映像情報を運ぶサブピクチャストリームSt3、及び音声情報を運ぶオーディオストリームSt5から構成されている。ビデオストリーム及びオーディオストリームは、所定の時間の間に対象から得られる画像及び音声の情報を含むストリームである。
一方、サブピクチャストリームは一画面分、つまり瞬間の映像情報を含むストリームである。必要であれば、一画面分のサブピクチャをビデオメモリ等にキャプチャして、そのキャプチャされたサブピクチャ画面を継続的に表示することができる。
これらのマルチメディアソースデータSt1、St3、及びSt5は、実況中継の場合には、ビデオカメラ等の手段から映像及び音声信号がリアルタイムで供給される。また、ビデオテープ等の記録媒体から再生された非リアルタイムな映像及び音声信号であったりする。尚、同図に於ては、簡便化のために、3種類のマルチメディアソースストリームとして、3種類以上で、それぞれが異なるタイトル内容を表すソースデータが入力されても良いことは言うまでもない。このような複数のタイトルの音声、映像、補助映像情報を有するマルチメディアソースデータを、マルチタイトルストリームと呼称する。
オーサリングエンコーダECは、編集情報作成部100、エンコードシステム制御部200、ビデオエンコーダ300、ビデオストリームバッファ400、サブピクチャエンコーダ500、サブピクチャストリームバッファ600、オーディオエンコーダ700、オーディオストリームバッファ800、システムエンコーダ900、ビデオゾーンフォーマッタ1300、記録部1200、及び記録媒体Mから構成されている。
同図に於いて、本発明のエンコーダによってエンコードされたビットストリームは、一例として光ディスク媒体に記録される。
オーサリングエンコーダECは、オリジナルのマルチメディアタイトルの映像、サブピクチャ、及び音声に関するユーザの要望に応じてマルチメディアビットストリームMBSの該当部分の編集を指示するシナリオデータとして出力できる編集情報生成部100を備えている。編集情報作成部100は、好ましくは、ディスプレイ部、スピーカ部、キーボード、CPU、及び、ソースストリームバッファ部等で構成される。編集情報作成部100は、上述の外部マルチメディアストリーム源に接続されており、マルチメディアソースデータSt1、St3、及びSt5の供給を受ける。
ユーザーは、マルチメディアソースデータをディスプレイ部及びスピーカを用いて映像及び音声を再生し、タイトルの内容を認識することができる。更に、ユーザは再生された内容を確認しながら、所望のシナリオに沿った内容の編集指示を、キーボード部を用いて入力する。編集指示内容とは、複数のタイトル内容を含む各ソースデータの全部或いは、其々に対して、所定時間毎に各ソースデータの内容を一つ以上選択し、それらの選択された内容を、所定の方法で接続再生するような情報を言う。
CPUは、キーボード入力に基づいて、マルチメディアソースデータのそれぞれのストリームSt1、St3、及びSt5の編集対象部分の位置、長さ、及び各編集部分間の時間的相互関係等の情報をコード化したシリオデータ(Scenario data)St7を生成する。
ソースストリームバッファは所定の容量を有し、マルチメディアソースデータの各ストリームSt1、St3、及びSt5を所定の時間Td遅延させた後に、出力する。
これは、ユーザーがシナリオデータSt7を作成するのと同時にエンコードを行う場合、つまり逐次エンコード処理の場合には、後述するようにシナリオデータSt7に基づいて、マルチメディアソースデータの編集処理内容を決定するのに若干の時間Tdを要するので、実際に編集エンコードを行う場合には、この時間Tdだけマルチメディアソースデータを遅延させて、編集エンコードと同期する必要があるからである。このような、逐次編集処理の場合、遅延時間Tdは、システム内の各要素間での同期調整に必要な程度であるので、通常ソースストリームバッファは半導体メモリ等の高速記録媒体で構成される。
しかしながら、タイトルの全体を通してシナリオデータSt7を完成させた後に、マルチメディアソースデータを一気にエンコードする、いわゆるバッチ編集時に於いては、遅延時間Tdは、一タイトル分或いはそれ以上の時間必要である。このような場合には、ソースストリームバッファは、ビデオテープ、磁気ディスク、光ディスク等の低速大容量記録媒体を利用して構成できる。つまり、ソースストリームバッファは遅延時間Td及び製造コストに応じて、適当な記憶媒体を用いて構成すれば良い。
エンコードシステム制御部200は、編集情報作成部100に接続されており、シナリオデータSt7を編集情報作成部100から受け取る。エンコードシステム制御部200は、シナリオデータSt7に含まれる編集対象部の時間的位置及び長さに関する情報に基づいて、マルチメディアソースデータの編集対象分をエンコードするためのそれぞれのエンコードパラメータデータ及びエンコード開始、終了のタイミング信号St9、St11、及びSt13をそれぞれ生成する。なお、上述のように、各マルチメディアソースデータSt1、St3、及びSt5は、ソースストリームバッファによって、時間Td遅延して出力されるので、各タイミングSt9、St11、及びSt13と同期している。
つまり、信号St9はビデオストリームSt1からエンコード対象部分を抽出して、ビデオエンコード単位を生成するために、ビデオストリームSt1をエンコードするタイミングを指示するビデオエンコード信号である。同様に、信号St11は、サブピクチャエンコード単位を生成するために、サブピクチャストリームSt3をエンコードするタイミングを指示するサブピクチャストリームエンコード信号である。また、信号St13は、オーディオエンコード単位を生成するために、オーディオストリームSt5をエンコードするタイミングを指示するオーディオエンコード信号である。
エンコードシステム制御部200は、更に、シナリオデータSt7に含まれるマルチメディアソースデータのそれぞれのストリームSt1、St3、及びSt5のエンコード対象部分間の時間的相互関係等の情報に基づいて、エンコードされたマルチメディアエンコードストリームを、所定の相互関係になるように配列するためのタイミング信号St21、St23、及びSt25を生成する。
エンコードシステム制御部200は、1ビデオゾーンVZ分の各タイトルのタイトル編集単位(VOB)に付いて、そのタイトル編集単位(VOB)の再生時間を示す再生時間情報ITおよびビデオ、オーディオ、サブピクチャのマルチメディアエンコードストリームを多重化(マルチプレクス)するシステムエンコードのためのエンコードパラメータを示すストリームエンコードデータSt33を生成する。
エンコードシステム制御部200は、所定の相互的時間関係にある各ストリームのタイトル編集単位(VOB)から、マルチメディアビットストリームMBSの各タイトルのタイトル編集単位(VOB)の接続または、各タイトル編集単位を重畳しているインターリーブタイトル編集単位(VOBs)を生成するための、各タイトル編集単位(VOB)をマルチメディアビットストリームMBSとして、フォーマットするためのフォーマットパラメータを規定する配列指示信号St39を生成する。
ビデオエンコーダ300は、編集情報作成部100のソースストリームバッファ及び、エンコードシステム制御部200に接続されており、ビデオストリームSt1とビデオエンコードのためのエンコードパラメータデータ及びエンコード開始終了のタイミング信号のSt9、例えば、エンコードの開始終了タイミング、ビットレート、エンコード開始終了時にエンコード条件、素材の種類として、NTSC信号またはPAL信号あるいはテレシネ素材であるかなどのパラメータがそれぞれ入力される。ビデオエンコーダ300は、ビデオエンコード信号St9に基づいて、ビデオストリームSt1の所定の部分をエンコードして、ビデオエンコードストリームSt15を生成する。
同様に、サブピクチャエンコーダ500は、編集情報作成部100のソースバッファ及び、エンコードシステム制御部200に接続されており、サブピクチャストリームSt3とサブピクチャストリームエンコード信号St11がそれぞれ入力される。サブピクチャエンコーダ500は、サブピクチャストリームエンコードのためのパラメータ信号St11に基づいて、サブピクチャストリームSt3の所定の部分をエンコードして、サブピクチャエンコードストリームSt17を生成する。
オーディオエンコーダ700は、編集情報作成部100のソースバッファ及び、エンコードシステム制御部200に接続されており、オーディオストリームSt5とオーディオエンコード信号St13がそれぞれ入力される。オーディオエンコーダ700は、オーディオエンコードのためのパラメータデータ及びエンコード開始終了タイミングの信号St13に基づいて、オーディオストリームSt5の所定の部分をエンコードして、オーディオエンコードストリームSt19を生成する。
ビデオストリームバッファ400は、ビデオエンコーダ300に接続されており、ビデオエンコーダ300から出力されるビデオエンコードストリームSt15を保存する。ビデオストリームバッファ400は更に、エンコードシステム制御部200に接続されて、タイミング信号St21の入力に基づいて、保存しているビデオエンコードストリームSt15を、調時ビデオエンコードストリームSt27として出力する。
同様に、サブピクチャストリームバッファ600は、サブピクチャエンコーダ500に接続されており、サブピクチャエンコーダ500から出力されるサブピクチャエンコードストリームSt17を保存する。サブピクチャストリームバッファ600は更に、エンコードシステム制御部200に接続されて、タイミング信号St23の入力に基づいて、保存しているサブピクチャエンコードストリームSt17を、調時サブピクチャエンコードストリームSt29として出力する。
また、オーディオストリームバッファ800は、オーディオエンコーダ700に接続されており、オーディオエンコーダ700から出力されるオーディオエンコードストリームSt19を保存する。オーディオストリームバッファ800は更に、エンコードシステム制御部200に接続されて、タイミング信号St25の入力に基づいて、保存しているオーディオエンコードストリームSt19を、調時オーディオエンコードストリームSt31として出力する。
システムエンコーダ900は、ビデオストリームバッファ400、サブピクチャストリームバッファ600、及びオーディオストリームバッファ800に接続されており、調時ビデオエンコードストリームSt27、調時サブピクチャエンコードストリームSt29、及び調時オーディオエンコードSt31が入力される。システムエンコーダ900は、またエンコードシステム制御部200に接続されており、ストリームエンコードデータSt33が入力される。
システムエンコーダ900は、システムエンコードのエンコードパラメータデータ及びエンコード開始終了タイミングの信号St33に基づいて、各調時ストリームSt27、St29、及びSt31に多重化処理を施して、タイトル編集単位(VOB)St35を生成する。
ビデオゾーンフォーマッタ1300は、システムエンコーダ900に接続されて、タイトル編集単位St35を入力される。ビデオゾーンフォーマッタ1300は更に、エンコードシステム制御部200に接続されて、マルチメディアビットストリームMBSをフォーマットするためのフォーマットパラメータデータ及びフォーマット開始終タイミングの信号St39を入力される。ビデオゾーンフォーマッタ1300は、タイトル編集単位St39に基づいて、1ビデオゾーンVZ分のタイトル編集単位St35を、ユーザの要望シナリオに沿う順番に、並べ替えて、編集済みマルチメディアビットストリームSt43を生成する。
このユーザの要望シナリオの内容に編集された、マルチメディアビットストリームSt43は、記録部1200に転送される。記録部1200は、編集マルチメディアビットストリームMBSを記録媒体Mに応じた形式のデータSt43に加工して、記録媒体Mに記録する。この場合、マルチメディアビットストリームMBSには、予め、ビデオゾーンフォーマッタ1300によって生成された媒体上の物理アドレスを示すボリュームファイルストラクチャVFSが含まれる。
また、エンコードされたマルチメディアビットストリームSt35を、以下に述べるようなデコーダに直接出力して、編集されたタイトル内容を再生するようにしても良い。この場合は、マルチメディアビットストリームMBSには、ボリュームファイルストラクチャVFSは含まれないことは言うまでもない。
オーサリングデコーダDC
次に、図3を参照して、本発明にかかるオーサリングエンコーダECによって、編集されたマルチメディアビットストリームMBSをデコードして、ユーザの要望のシナリオに沿って各タイトルの内容を展開する、オーサリングデコーダDCの一実施形態について説明する。なお、本実施形態に於いては、記録媒体Mに記録されたオーサリングエンコーダECによってエンコードされたマルチメディアビットストリームSt45は、記録媒体Mに記録されている。
オーサリングデコーダDCは、マルチメディアビットストリーム再生部2000、シナリオ選択部2100、デコードシステム制御部2300、ストリームバッファ2400、システムデコーダ2500、ビデオバッファ2600、サブピクチャバッファ2700、オーディオバッファ2800、同期制御部2900、ビデオデコーダ3800、サブピクチャデコーダ3100、オーディオデコーダ3200、合成部3500、ビデオデータ出力端子3600、及びオーディオデータ出力端子3700から構成されている。
マルチメディアビットストリーム再生部2000は、記録媒体Mを駆動させる記録媒体駆動ユニット2004、記録媒体Mに記録されている情報を読み取り二値の読み取り信号St57を生成する読取ヘッドユニット2006、読み取り信号ST57に種々の処理を施して再生ビットストリームSt61を生成する信号処理部2008、及び機構制御部2002から構成される。機構制御部2002は、デコードシステム制御部2300に接続されて、マルチメディアビットストリーム再生指示信号St53を受けて、それぞれ記録媒体駆動ユニット(モータ)2004及び信号処理部2008をそれぞれ制御する再生制御信号St55及びSt59を生成する。
デコーダDCは、オーサリングエンコーダECで編集されたマルチメディアタイトルの映像、サブピクチャ、及び音声に関する、ユーザの所望の部分が再生されるように、対応するシナリオを選択して再生するように、オーサリングデコーダDCに指示を与えるシナリオデータとして出力できるシナリオ選択部2100を備えている。
シナリオ選択部2100は、好ましくは、キーボード及びCPU等で構成される。ユーザーは、オーサリングエンコーダECで入力されたシナリオの内容に基づいて、所望のシナリオをキーボード部を操作して入力する。CPUは、キーボード入力に基づいて、選択されたシナリオを指示するシナリオ選択データSt51を生成する。シナリオ選択部2100は、例えば、赤外線通信装置等によって、デコードシステム制御部2300に接続されている。デコードシステム制御部2300は、St51に基づいてマルチメディアビットストリーム再生部2000の動作を制御する再生指示信号St53を生成する。
ストリームバッファ2400は所定のバッファ容量を有し、マルチメディアビットストリーム再生部2000から入力される再生信号ビットストリームSt61を一時的に保存すると共に、及び各ストリームのアドレス情報及び同期初期値データを抽出してストリーム制御データSt63を生成する。ストリームバッファ2400は、デコードシステム制御部2300に接続されており、生成したストリーム制御データSt63をデコードシステム制御部2300に供給する。
同期制御部2900は、デコードシステム制御部2300に接続されて、同期制御データSt81に含まれる同期初期値データ(SCR)を受け取り、内部のシステムクロック(STC)セットし、リセットされたシステムクロックSt79をデコードシステム制御部2300に供給する。
デコードシステム制御部2300は、システムクロックSt79に基づいて、所定の間隔でストリーム読出信号St65を生成し、ストリームバッファ2400に入力する。
ストリームバッファ2400は、読出信号St65に基づいて、再生ビットストリームSt61を所定の間隔で出力する。
デコードシステム制御部2300は、更に、シナリオ選択データSt51に基づき、選択されたシナリオに対応するビデオ、サブピクチャ、オーディオの各ストリームのIDを示すデコードストリーム指示信号St69を生成して、システムデコーダ2500に出力する。
システムデコーダ2500は、ストリームバッファ2400から入力されてくるビデオ、サブピクチャ、及びオーディオのストリームを、デコード指示信号St69の指示に基づいて、それぞれ、ビデオエンコードストリームSt71としてビデオバッファ2600に、サブピクチャエンコードストリームSt73としてサブピクチャバッファ2700に、及びオーディオエンコードストリームSt75としてオーディオバッファ2800に出力する。
システムデコーダ2500は、各ストリームSt67の各最小制御単位での再生開始時間(PTS)及びデコード開始時間(DTS)を検出し、時間情報信号St77を生成する。この時間情報信号St77は、デコードシステム制御部2300を経由して、同期制御データSt81として同期制御部2900に入力される。
同期制御部2900は、同期制御データSt81として、各ストリームについて、それぞれがデコード後に所定の順番になるようなデコード開始タイミングを決定する。同期制御部2900は、このデコードタイミングに基づいて、ビデオストリームデコード開始信号St89を生成し、ビデオデコーダ3800に入力する。同様に、同期制御部2900は、サブピクチャデコード開始信号St91及びオーディオデコード開始信号t93を生成し、サブピクチャデコーダ3100及びオーディオデコーダ3200にそれぞれ入力する。
ビデオデコーダ3800は、ビデオストリームデコード開始信号St89に基づいて、ビデオ出力要求信号St84を生成して、ビデオバッファ2600に対して出力する。ビデオバッファ2600はビデオ出力要求信号St84を受けて、ビデオストリームSt83をビデオデコーダ3800に出力する。ビデオデコーダ3800は、ビデオストリームSt83に含まれる再生時間情報を検出し、再生時間に相当する量のビデオストリームSt83の入力を受けた時点で、ビデオ出力要求信号St84を無効(disable)にする。このようにして、所定再生時間に相当するビデオストリームがビデオデコーダ3800でデコードされて、再生されたビデオ信号St104が合成部3500に出力される。
同様に、サブピクチャデコーダ3100は、サブピクチャデコード開始信号St91に基づいて、サブピクチャ出力要求信号St86を生成し、サブピクチャバッファ2700に供給する。サブピクチャバッファ2700は、サブピクチャ出力要求信号St86を受けて、サブピクチャストリームSt85をサブピクチャデコーダ3100に出力する。サブピクチャデコーダ3100は、サブピクチャストリームSt85に含まれる再生時間情報に基づいて、所定の再生時間に相当する量のサブピクチャストリームSt85をデコードして、サブピクチャ信号St99を再生して、合成部3500に出力される。
合成部3500は、ビデオ信号St104及びサブピクチャ信号St99を重畳させて、マルチピクチャビデオ信号St105を生成し、ビデオ出力端子3600に出力する。
オーディオデコーダ3200は、オーディオデコード開始信号St93に基づいて、オーディオ出力要求信号St88を生成し、オーディオバッファ2800に供給する。オーディオバッファ2800は、オーディオ出力要求信号St88を受けて、オーディオストリームSt87をオーディオデコーダ3200に出力する。オーディオデコーダ3200は、オーディオストリームSt87に含まれる再生時間情報に基づいて、所定の再生時間に相当する量のオーディオストリームSt87をデコードして、オーディオ出力端子3700に出力する。
このようにして、ユーザのシナリオ選択に応答して、リアルタイムにユーザの要望するマルチメディアビットストリームMBSを再生する事ができる。つまり、ユーザが異なるシナリオを選択する度に、オーサリングデコーダDCはその選択されたシナリオに対応するマルチメディアビットストリームMBSを再生することによって、ユーザの要望するタイトル内容を再生することができる。
以上述べたように、本発明のオーサリングシステムに於いては、基本のタイトル内容に対して、各内容を表す最小編集単位の複数の分岐可能なサブストリームを所定の時間的相関関係に配列するべく、マルチメディアソースデータをリアルタイム或いは一括してエンコードして、複数の任意のシナリオに従うマルチメディアビットストリームを生成する事ができる。
また、このようにエンコードされたマルチメディアビットストリームを、複数のシナリオの内の任意のシナリオに従って再生できる。そして、再生中であっても、選択したシナリオから別のシナリオを選択し(切り替えて)も、その新たな選択されたシナリオに応じた(動的に)マルチメディアビットストリームを再生できる。また、任意のシナリオに従ってタイトル内容を再生中に、更に、複数のシーンの内の任意のシーンを動的に選択して再生することができる。
このように、本発明に於けるオーサリングシステムに於いては、エンコードしてマルチメディアビットストリームMBSをリアルタイムに再生するだけでなく、繰り返し再生することができる。尚、オーサリングシステムの詳細に関しては、本特許出願と同一出願人による1996年9月27日付けの日本国特許出願に開示されている。
DVD
図4に、単一の記録面を有するDVDの一例を示す。本例に於けるDVD記録媒体RC1は、レーザー光線LSを照射し情報の書込及び読出を行う情報記録面RS1と、これを覆う保護層PL1からなる。更に、記録面RS1の裏側には、補強層BL1が設けられている。このように、保護層PL1側の面を表面SA、補強層BL1側の面を裏面SBとする。この媒体RC1のように、片面に単一の記録層RS1を有するDVD媒体を、片面一層ディスクと呼ぶ。
図5に、図4のC1部の詳細を示す。記録面RS1は、金属薄膜等の反射膜を付着した情報層4109によって形成されている。その上に、所定の厚さT1を有する第1の透明基板4108によって保護層PL1が形成される。所定の厚さT2を有する第二の透明基板4111によって補強層BL1が形成される。第一及び第二の透明基盤4108及び4111は、その間に設けられた接着層4110によって、互いに接着されている。
さらに、必要に応じて第2の透明基板4111の上にラベル印刷用の印刷層4112が設けられる。印刷層4112は補強層BL1の基板4111上の全領域ではなく、文字や絵の表示に必要な部分のみ印刷され、他の部分は透明基板4111を剥き出しにしてもよい。その場合、裏面SB側から見ると、印刷されていない部分では記録面RS1を形成する金属薄膜4109の反射する光が直接見えることになり、例えば、金属薄膜がアルミニウム薄膜である場合には背景が銀白色に見え、その上に印刷文字や図形が浮き上がって見える。印刷層4112は、補強層BL1の全面に設ける必要はなく、用途に応じて部分的に設けてもよい。
図6に、更に図5のC2部の詳細を示す。光ビームLSが入射し情報が取り出される表面SAに於いて、第1の透明基板4108と情報層4109の接する面は、成形技術により凹凸のピットが形成され、このピットの長さと間隔を変えることにより情報が記録される。つまり、情報層4109には第1の透明基板4108の凹凸のピット形状が転写される。このピットの長さや間隔はCDの場合に比べ短くなり、ピット列で形成する情報トラックもピッチも狭く構成されている。その結果、面記録密度が大幅に向上している。
また、第1の透明基板4108のピットが形成されていない表面SA側は、平坦な面となっている。第2の透明基板4111は、補強用であり、第1の透明基板4108と同じ材質で構成される両面が平坦な透明基板である。そして所定の厚さT1及びT2は、共に同じく、例えば0.6mmが好ましいが、それに限定されるものでは無い。
情報の取り出しは、CDの場合と同様に、光ビームLSが照射されることにより光スポットの反射率変化として取り出される。DVDシステムに於いては、対物レンズの開口数NAを大きく、そして光ビームの波長λ小さすることができるため、使用する光スポットLsの直径を、CDでの光スポットの約1/1.6に絞り込むことができる。これは、CDシステムに比べて、約1.6倍の解像度を有することを意味する。
DVDからのデータ読み出しには、波長の短い650nmの赤色半導体レーザと対物レンズのNA(開口数)を0.6mmまで大きくした光学系とが用いれらる。これと透明基板の厚さTを0.6mmに薄くしたこととがあいまって、直径120mmの光ディスクの片面に記録できる情報容量が5Gバイトを越える。
DVDシステムは、上述のように、単一の記録面RS1を有する片側一層ディスクRC1に於いても、CDに比べて記録可能な情報量が10倍近いため、単位あたりのデータサイズが非常に大きい動画像を、その画質を損なわずに取り扱うことができる。その結果、従来のCDシステムでは、動画像の画質を犠牲にしても、再生時間が74分であるのに比べて、DVDでは、高画質動画像を2時間以上に渡って記録再生可能である。このようにDVDは、動画像の記録媒体に適しているという特徴がある。
図7及び図8に、上述の記録面RSを複数有するDVD記録媒体の例を示す。図7のDVD記録媒体RC2は、同一側、つまり表側SAに、二層に配された第一及び半透明の第二の記録面RS1及びRS2を有している。第一の記録面RS1及び第二の記録面RS2に対して、それぞれ異なる光ビームLS1及びLS2を用いることにより、同時に二面からの記録再生が可能である。また、光ビームLS1或いはLS2の一方にて、両記録面RS1及びRS2に対応させても良い。このように構成されたDVD記録媒体を片面二層ディスクと呼ぶ。この例では、2枚の記録層RS1及びRS2を配したが、必要に応じて、2枚以上の記録層RSを配したDVD記録媒体を構成できることは、言うまでもない。このようなディスクを、片面多層ディスクと呼ぶ。
一方、図8のDVD記録媒体RC3は、反対側、つまり表側SA側には第一の記録面RS1が、そして裏側SBには第二の記録面RS2、それぞ設けれている。これらの例に於いては、一枚のDVDに記録面を二層もうけた例を示したが、二層以上の多層の記録面を有するように構成できることは言うまでもない。図7の場合と同様に、光ビームLS1及びLS2を個別に設けても良いし、一つの光ビームで両方の記録面RS1及びRS2の記録再生に用いることもできる。このように構成されたDVD記録媒体を両面一層ディスクと呼ぶ。また、片面に2枚以上の記録層RSを配したDVD記録媒体を構成できることは、言うまでもない。このようなディスクを、両面多層ディスクと呼ぶ。
図9及び図10に、DVD記録媒体RCの記録面RSを光ビームLSの照射側から見た平面図をそれぞれ示す。DVDには、内周から外周方向に向けて、情報を記録するトラックTRが螺旋状に連続して設けられている。トラックTRは、所定のデータ単位毎に、複数のセクターに分割されている。尚、図9では、見易くするために、トラック1周あたり3つ以上のセクターに分割されているように表されている。
通常、トラックTRは、図9に示すように、ディスクRCAの内周の端点IAから外周の端点OAに向けて時計回り方向DrAに巻回されている。このようなディスクRCAを時計回りディスク、そのトラックを時計回りトラックTRAと呼ぶ。また、用途によっては、図10に示すように、ディスクRCBの外周の端点OBから内周の端点IBに向けて、時計周り方向DrBに、トラックTRBが巻回されている。この方向DrBは、内周から外周に向かって見れば、反時計周り方向であるので、図9のディスクRCAと区別するために、反時計回りディスクRCB及び反時計回りトラックTRBと呼ぶ。上述のトラック巻回方向DrA及びDrBは、光ビームが記録再生の為にトラックをスキャンする動き、つまりトラックパスである。トラック巻回方向DrAの反対方向RdAが、ディスクRCAを回転させる方向である。トラック巻回方向DrBの反対方向RdBが、ディスクRCBを回転させる方向である。
図11に、図7に示す片側二層ディスクRC2の一例であるディスクRC2oの展開図を模式的に示す。下側の第一の記録面RS1は、図9に示すように時計回りトラックTRAが時計回り方向DrAに設けられている。上側の第二の記録面RS2には、図12に示すように反時計回りトラックTRBが反時計回り方向DrBに設けられている。この場合、上下側のトラック外周端部OB及びOAは、ディスクRC2oの中心線に平行な同一線上に位置している。上述のトラックTRの巻回方向DrA及びDrBは、共に、ディスクRCに対するデータの読み書きの方向でもある。この場合、上下のトラックの巻回方向は反対、つまり、上下の記録層のトラックパスDrA及びDrBが対向している。
対向トラックパスタイプの片側二層ディスクRC2oは、第一記録面RS1に対応してRdA方向に回転されて、光ビームLSがトラックパスDrAに沿って、第一記録面RS1のトラックをトレースして、外周端部OAに到達した時点で、光ビームLSを第二の記録面RS2の外周端部OBに焦点を結ぶように調節することで、光ビームLSは連続的に第二の記録面RS2のトラックをトレースすることができる。このようにして、第一及び第二の記録面RS1及びRS2のトラックTRAとTRBとの物理的距離は、光ビームLSの焦点を調整することで、瞬間的に解消できる。その結果、対向トラックパスタイプの片側二層ディスクRCoに於いては、上下二層上のトラックを一つの連続したトラックTRとして処理することが容易である。故に、図1を参照して述べた、オーサリングシステムに於ける、マルチメディアデータの最大管理単位であるマルチメディアビットストリームMBSを、一つの媒体RC2oの二層の記録層RS1及びRS2に連続的に記録することができる。
尚、記録面RS1及びRS2のトラックの巻回方向を、本例で述べたのと反対に、つまり第一記録面RS1に反時計回りトラックTRBを、第二記録面に時計回りトラックTRAを設け場合は、ディスクの回転方向をRdBに変えることを除けば、上述の例と同様に、両記録面を一つの連続したトラックTRを有するものとして用いる。よって、簡便化の為にそのような例に付いての図示等の説明は省く。このように、DVDを構成することによって、長大なタイトルのマルチメディアビットストリームMBSを一枚の対向トラックパスタイプ片面二層ディスクRC2oに収録できる。このようなDVD媒体を、片面二層対向トラックパス型ディスクと呼ぶ。
図12に、図7に示す片側二層ディスクRC2の更なる例RC2pの展開図を模式に示す。第一及び第二の記録面RS1及びRS2は、図9に示すように、共に時計回りトラックTRAが設けられている。この場合、片側二層、ディスクRC2pは、RdA方向に回転されて、光ビームの移動方向はトラックの巻回方向と同じ、つまり、上下の記録層のトラックパスが互いに平行である(Parallel trackpath)。この場合に於いても、好ましくは、上下側のトラック外周端部OA及びOAは、ディスクRC2pの中心線に平行な同一線上に位置している。それ故に、外周端部OAに於いて、光ビームLSの焦点を調節することで、図11で述べた媒体RC2oと同様に、第一記録面RS1のトラックTRAの外周端部OAから第二記録面RS2のトラックTRAの外周端部OAへ瞬間的に、アクセス先を変えることができる。
しかしながら、光ビームLSによって、第二の記録面RS2のトラックTRAを時間的に連続してアクセスするには、媒体RC2pを逆(反RdA方向に)回転させれば良い。しかし、光りビームの位置に応じて、媒体の回転方向を変えるのは効率が良くないので、図中で矢印で示されているように、光ビームLSが第一記録面RS1のトラック外周端部OAに達した後に、光ビームを第二記録面RS2のトラック内周端部IAに、移動させることで、論理的に連続した一つのトラックとして用いることができ。また、必要であれば、上下の記録面のトラックを一つの連続したトラックとして扱わずに、それぞれ別のトラックとして、各トラックにマルチメディアビットストリームMBSを一タイトルづつ記録してもよい。このようなDVD媒体を、片面二層平行トラックパス型ディスクと呼ぶ。
尚、両記録面RS1及びRS2のトラックの巻回方向を本例で述べたのと反対に、つまり反時計回りトラックTRBを設けても、ディスクの回転方向をRdBにすることを除けば同様である。この片面二層平行トラックパス型ディスクは、百科事典のような頻繁にランダムアクセスが要求される複数のタイトルを一枚の媒体RC2pに収録する用途に適している。
図13に、図8に示す片面にそれぞれ一層の記録面RS1及びRS2を有する両面一層型のDVD媒体RC3の一例RC3sの展開図を示す。一方の記録面RS1は、時計回りトラックTRAが設けられ、他方の記録面RS2には、反時計回りトラックTRBが設けられている。この場合に於いても、好ましくは、両記録面のトラック外周端部OA及びOBは、ディスクRC3sの中心線に平行な同一線上に位置している。これらの記録面RS1とRS2は、トラックの巻回方向は反対であるが、トラックパスが互いに面対称の関係にある。このようなディスクRC3sを両面一層対称トラックパス型ディスクと呼ぶ。この両面一層対称トラックパス型ディスクRC3sは、第一の記録媒体RS1に対応してRdA方向に回転される。その結果、反対側の第二の記録媒体RS2のトラックパスは、そのトラック巻回方向DrBと反対の方向、つまりDrAである。この場合、連続、非連続的に関わらず、本質的に二つの記録面RS1及びRS2に同一の光ビームLSでアクセスする事は実際的ではない。それ故に、表裏の記録面のそれぞれに、マルチメディアビットストリームMSBを記録する。
図14に、図8に示す両面一層DVD媒体RC3の更なる例RC3aの展開図を示す。両記録面RS1及びRS2には、共に、図9に示すように時計回りトラックTRAが設けられている。この場合に於いても、好ましくは、両記録面側RS1及びRS2のトラック外周端部OA及びOAは、ディスクRC3aの中心線に平行な同一線上に位置している。但し、本例に於いては、先に述べた両面一層対象トラックパス型ディスクRC3sと違って、これらの記録面RS1とRS2上のトラックは非対称の関係にある。このようなディスクRC3aを両面一層非対象トラックパス型ディスクと呼ぶ。この両面一層非対象トラックパス型ディスクRC3sは、第一の記録媒体RS1に対応してRdA方向に回転される。その結果、反対側の第二の記録面RS2のトラックパスは、そのトラック巻回方向DrAと反対の方向、つまりDrB方向である。
故に、単一の光ビームLSを第一記録面RS1の内周から外周へ、そして第二記録面RS2の外周から内周へと、連続的に移動させれば記録面毎に異なる光ビーム源を用意しなくても、媒体PC3aを表裏反転させずに両面の記録再生が可能である。また、この両面一層非対象トラックパス型ディスクでは、両記録面RS1及びRS2のトラックパスが同一である。それ故に、媒体PC3aの表裏を反転することにより、記録面毎に異なる光ビーム源を用意しなくても、単一の光ビームLSで両面の記録再生が可能であり、その結果、装置を経済的に製造することができる。尚、両記録面RS1及びRS2に、トラックTRAの代わりにトラックTRBを設けても、本例と基本的に同様である。
上述の如く、記録面の多層化によって、記録容量の倍増化が容易なDVDシステムによって、1枚のディスク上に記録された複数の動画像データ、複数のオーディオデータ、複数のグラフィックスデータなどをユーザとの対話操作を通じて再生するマルチメディアの領域に於いてその真価を発揮する。つまり、従来ソフト提供者の夢であった、ひとつの映画を製作した映画の品質をそのまま記録で、多数の異なる言語圏及び多数の異なる世代に対して、一つの媒体により提供することを可能とする。
パレンタル
従来は、映画タイトルのソフト提供者は、同一のタイトルに関して、全世界の多数の言語、及び欧米各国で規制化されているパレンタルロックに対応した個別のパッケージとしてマルチレイティッドタイトルを制作、供給、管理しないといけなかった。この手間は、たいへん大きなものであった。また、これは、高画質もさることながら、意図した通りに再生できることが重要である。このような願いの解決に一歩近づく記録媒体がDVDである。
マルチアングル
また、対話操作の典型的な例として、1つのシーンを再生中に、別の視点からのシーンに切替えるというマルチアングルという機能が要求されている。これは、例えば、野球のシーンであれば、バックネット側から見た投手、捕手、打者を中心としたアングル、バックネット側から見た内野を中心としたアングル、センター側から見た投手、捕手、打者を中心としたアングルなどいくつかのアングルの中から、ユーザが好きなものをあたかもカメラを切り替えているように、自由に選ぶというようなアプリケーションの要求がある。
DVDでは、このような要求に応えるべく動画像、オーディオ、グラフィックスなどの信号データを記録する方式としてビデオCDと同様のMPEGが使用されている。ビデオCDとDVDとでは、その容量と転送速度および再生装置内の信号処理性能の差から同じMPEG形式といっても、MPEG1とMPEG2という多少異なる圧縮方式、データ形式が採用されている。ただし、MPEG1とMPEG2の内容及びその違いについては、本発明の趣旨とは直接関係しないため説明を省略する(例えば、ISO11172、ISO13818のMPEG規格書参照)。
本発明に掛かるDVDシステムのデータ構造に付いて、図16、図17、図18、図19、及び図20を参照して、後で説明する。
マルチシーン
上述の、パレンタルロック再生及びマルチアングル再生の要求を満たすために、各要求通りの内容のタイトルを其々に用意していれば、ほんの一部分の異なるシーンデータを有する概ね同一内容のタイトルを要求数だけ用意して、記録媒体に記録しておかなければならない。これは、記録媒体の大部分の領域に同一のデータを繰り返し記録することになるので、記録媒体の記憶容量の利用効率を著しく疎外する。さらに、DVDの様な大容量の記録媒体をもってしても、全ての要求に対応するタイトルを記録することは不可能である。この様な問題は、基本的に記録媒体の容量を増やせれば解決するとも言えるが、システムリソースの有効利用の観点から非常に望ましくない。
DVDシステムに於いては、以下にその概略を説明するマルチシーン制御を用いて、多種のバリエーションを有するタイトルを最低必要限度のデータでもって構成し、記録媒体等のシステムリソースの有効活用を可能としている。つまり、様々なバリエーションを有するタイトルを、各タイトル間での共通のデータからなる基本シーン区間と、其々の要求に即した異なるシーン群からなるマルチシーン区間とで構成する。そして、再生時に、ユーザが各マルチシーン区間での特定のシーンを自由、且つ随時に選択できる様にしておく。なお、パレンタルロック再生及びマルチアングル再生を含むマルチシーン制御に関して、後で、図21を参照して説明する。
DVDシステムのデータ構造
図22に、本発明に掛かるDVDシステムに於ける、オーサリングデータのデータ構造を示す。DVDシステムでは、マルチメディアビットストリームMBSを記録する為に、リードイン領域LI、ボリューム領域VSと、リードアウト領域LOに3つに大別される記録領域を備える。
リードイン領域LIは、光ディスクの最内周部に、例えば、図9及び図10で説明したディスクに於いては、そのトラックの内周端部IA及びIBに位置している。リードイン領域LIには、再生装置の読み出し開始時の動作安定用のデータ等が記録される。
リードアウト領域LOは、光ディスクの最外周に、つまり図9及び図10で説明したトラックの外周端部OA及びOBに位置している。このリードアウト領域LOには、ボリューム領域VSが終了したことを示すデータ等が記録される。
ボリューム領域VSは、リードイン領域LIとリードアウト領域LOの間に位置し、2048バイトの論理セクタLSが、n+1個(nは0を含む正の整数)一次元配列として記録される。各論理セクタLSはセクタナンバー(#0、#1、#2、・・#n)で区別される。更に、ボリューム領域VSは、m+1個の論理セクタLS#0〜LS#m(mはnより小さい0を含む正の整数)から形成されるボリューム/ファイル管理領域VFSと、n−m個の論理セクタLS#m+1〜LS#nから形成されるファイルデータ領域FDSに分別される。このファイルデータ領域FDSは、図1に示すマルチメディアビットストリームMBSに相当する。
ボリューム/ファイル管理領域VFSは、ボリューム領域VSのデータをファイルとして管理する為のファイルシステムであり、ディスク全体の管理に必要なデータの収納に必要なセクタ数m(mはnより小さい自然数)の論理セクタLS#0からLS#mによって形成されている。このボリューム/ファイル管理領域VFSには、例えば、ISO9660、及びISO13346などの規格に従って、ファイルデータ領域FDS内のファイルの情報が記録される。
ファイルデータ領域FDSは、n−m個の論理セクタLS#m+1〜LS#nから構成されており、それぞれ、論理セクタの整数倍(2048×I、Iは所定の整数)のサイズを有するビデオマネージャVMGと、及びk個のビデオタイトルセットVTS#1〜VTS#k(kは、100より小さい自然数)を含む。
ビデオマネージャVMGは、ディスク全体のタイトル管理情報を表す情報を保持すると共に、ボリューム全体の再生制御の設定/変更を行うためのメニューであるボリュームメニューを表す情報を有する。ビデオタイトルセットVTS#k‘は、単にビデオファイルとも呼び、動画、オーディオ、静止画などのデータからなるタイトルを表す。
図16は、図22のビデオタイトルセットVTSの内部構造を示す。ビデオタイトルセットVTSは、ディスク全体の管理情報を表すVTS情報(VTSI)と、マルチメディアビットストリームのシステムストリームであるVTSタイトル用VOBS(VTSTT_VOBS)に大別される。先ず、以下にVTS情報について説明した後に、VTSタイトル用VOBSについて説明する。
VTS情報は、主に、VTSI管理テーブル(VTSI_MAT)及びVTSPGC情報テーブル(VTS_PGCIT)を含む。
VTSI管理テーブルは、ビデオタイトルセットVTSの内部構成及び、ビデオタイトルセットVTS中に含まれる選択可能なオーディオストリームの数、サブピクチャの数およびビデオタイトルセットVTSの格納場所等が記述される。
VTSPGC情報管理テーブルは、再生順を制御するプログラムチェーン(PGC)を表すi個(iは自然数)のPGC情報VTS_PGCI#1〜VTS_PGCI#Iを記録したテーブルである。各エントリーのPGC情報VTS_PGCI#Iは、プログラムチェーンを表す情報であり、j個(jは自然数)のセル再生情報C_PBI#1〜C_PBI#jから成る。各セル再生情報C_PBI#jは、セルの再生順序や再生に関する制御情報を含む。
また、プログラムチェーンPGCとは、タイトルのストーリーを記述する概念であり、セル(後述)の再生順を記述することでタイトルを形成する。上記VTS情報は、例えば、メニューに関する情報の場合には、再生開始時に再生装置内のバッファに格納され、再生の途中でリモコンの「メニュー」キーが押下された時点で再生装置により参照され、例えば#1のトップメニューが表示される。階層メニューの場合は、例えば、プログラムチェーン情報VTS_PGCI#1が「メニュー」キー押下により表示されるメインメニューであり、#2から#9がリモコンの「テンキー」の数字に対応するサブメニュー、#10以降がさらに下位層のサブメニューというように構成される。また例えば、#1が「メニュー」キー押下により表示されるトップメニュー、#2以降が「テン」キーの数字に対応して再生される音声ガイダンスというように構成される。
メニュー自体は、このテーブルに指定される複数のプログラムチェーンで表されるので、階層メニューであろうが、音声ガイダンスを含むメニューであろうが、任意の形態のメニューを構成することを可能にしている。
また例えば、映画の場合には、再生開始時に再生装置内のバッファに格納され、PGC内に記述しているセル再生順序を再生装置が参照し、システムストリームを再生する。
ここで言うセルとは、システムストリームの全部または一部であり、再生時のアクセスポイントとして使用される。たとえば、映画の場合は、タイトルを途中で区切っているチャプターとして使用する事ができる。
尚、エントリーされたPGC情報C_PBI#jの各々は、セル再生処理情報及び、セル情報テーブルを含む。再生処理情報は、再生時間、繰り返し回数などのセルの再生に必要な処理情報から構成される。ブロックモード(CBM)、セルブロックタイプ(CBT)、シームレス再生フラグ(SPF)、インターリーブブロック配置フラグ(IAF)、STC再設定フラグ(STCDF)、セル再生時間(C_PBTM)、シームレスアングル切替フラグ(SACF)、セル先頭VOBU開始アドレス(C_FVOBU_SA)、及びセル終端VOBU開始アドレス(C_LVOBU_SA)から成る。
ここで言う、シームレス再生とは、DVDシステムに於いて、映像、音声、副映像等のマルチメディアデータを、各データ及び情報を中断する事無く再生することであり、詳しくは、図23及び図24参照して後で説明する。
ブロックモードCBMは複数のセルが1つの機能ブロックを構成しているか否かを示し、機能ブロックを構成する各セルのセル再生情報は、連続的にPGC情報内に配置され、その先頭に配置されるセル再生情報のCBMには、“ブロックの先頭セル”を示す値、その最後に配置されるセル再生情報のCBMには、“ブロックの最後のセル”を示す値、その間に配置されるセル再生情報のCBMには、“ブロック内のセル”を示す値を示す。
セルブロックタイプCBTは、ブロックモードCBMで示したブロックの種類を示すものである。例えばマルチアングル機能を設定する場合には、各アングルの再生に対応するセル情報を、前述したような機能ブロックとして設定し、さらにそのブロックの種類として、各セルのセル再生情報のCBTに“アングル”を示す値を設定する。
シームレス再生フラグSPFは、該セルが前に再生されるセルまたはセルブロックとシームレスに接続して再生するか否かを示すフラグであり、前セルまたは前セルブロックとシームレスに接続して再生する場合には、該セルのセル再生情報のSPFにはフラグ値1を設定する。そうでない場合には、フラグ値0を設定する。
インターリーブアロケーションフラグIAFは、該セルがインターリーブ領域に配置されているか否かを示すフラグであり、インターリーブ領域に配置されている場合には、該セルのインターリーブアロケーションフラグIAFにはフラグ値1を設定する。そうでない場合には、フラグ値0を設定する。
STC再設定フラグSTCDFは、同期をとる際に使用するSTCをセルの再生時に再設定する必要があるかないかの情報であり、再設定が必要な場合にはフラグ値1を設定する。そうでない場合には、フラグ値0を設定する。
シームレスアングルチェンジフラグSACFは、該セルがアングル区間に属しかつ、シームレスに切替える場合、該セルのシームレスアングルチェンジフラグSACFにはフラグ値1を設定する。そうでない場合には、フラグ値0を設定する。
セル再生時間(C_PBTM)はセルの再生時間をビデオのフレーム数精度で示している。
C_LVOBU_SAは、セル終端VOBU開始アドレスを示し、その値はVTSタイトル用VOBS(VTSTT_VOBS)の先頭セルの論理セクタからの距離をセクタ数で示している。C_FVOBU_SAはセル先頭VOBU開始アドレスを示し、VTSタイトル用VOBS(VTSTT_VOBS)の先頭セルの論理セクタから距離をセクタ数で示している。
次に、VTSタイトル用VOBS、つまり、1マルチメディアシステムストリームデータVTSTT_VOBSに付いて説明する。システムストリームデータVTSTT_VOBSは、ビデオオブジェクトVOBと呼ばれるi個(iは自然数)のシステムストリームSSからなる。各ビデオオブジェクトVOB#1〜VOB#iは、少なくとも1つのビデオデータで構成され、場合によっては最大8つのオーディオデータ、最大32の副映像データまでがインターリーブされて構成される。
各ビデオオブジェクトVOBは、q個(qは自然数)のセルC#1〜C#qから成る。各セルCは、r個(rは自然数)のビデオオブジェクトユニットVOBU#1〜VOBU#rから形成される。
各VOBUは、ビデオエンコードのリフレッシュ周期であるGOPの複数個及び、それに相当する時間のオーディオおよびサブピクチャからなる。また、各VOBUの先頭には、該VOBUの管理情報であるナブパックNVを含む。ナブパックNVの構成については、図19を参照して後述する。
図17に、ビデオゾーンVZ(図22)の内部構造を示す。同図に於いて、ビデオエンコードストリームSt15は、ビデオエンコーダ300によってエンコードされた、圧縮された一次元のビデオデータ列である。オーディオエンコードストリームSt19も、同様に、オーディオエンコーダ700によってエンコードされた、ステレオの左右の各データが圧縮、及び統合された一次元のオーディオデータ列である。また、オーディオデータとしてサラウンド等のマルチチャネルでもよい。
システムストリームSt35は、図22で説明した、2048バイトの容量を有する論理セクタLS#nに相当するバイト数を有するパックが一次元に配列された構造を有している。システムストリームSt35の先頭、つまりVOBUの先頭には、ナビゲーションパックNVと呼ばれる、システムストリーム内のデータ配列等の管理情報を記録した、ストリーム管理パックが配置される。
ビデオエンコードストリームSt15及びオーディオエンコードストリームSt19は、それぞれ、システムストリームのパックに対応するバイト数毎にパケット化される。これらパケットは、図中で、V1、V2、V3、V4、・・、及びA1、A2、・・と表現されている。これらパケットは、ビデオ、オーディオ各データ伸長用のデコーダの処理時間及びデコーダのバッファサイズを考慮して適切な順番に図中のシステムストリームSt35としてインターリーブされ、パケットの配列をなす。例えば、本例ではV1、V2、A1、V3、V4、A2の順番に配列されている。
図17では、一つの動画像データと一つのオーディオデータがインターリーブされた例を示している。しかし、DVDシステムに於いては、記録再生容量が大幅に拡大され、高速の記録再生が実現され、信号処理用LSIの性能向上が図られた結果、一つの動画像データに複数のオーディオデータや複数のグラフィックスデータである副映像データが、一つのMPEGシステムストリームとしてインターリーブされた形態で記録され、再生時に複数のオーディオデータや複数の副映像データから選択的な再生を行うことが可能となる。図18に、このようなDVDシステムで利用されるシステムストリームの構造を表す。
図18に於いても、図17と同様に、パケット化されたビデオエンコードストリームSt15は、V1、V2、V3、V4、・・・と表されている。但し、この例では、オーディオエンコードストリームSt19は、一つでは無く、St19A、St19B、及びSt19Cと3列のオーディオデータ列がソースとして入力されている。更に、副画像データ列であるサブピクチャエンコードストリームSt17も、St17A及びSt17Bと二列のデータがソースとして入力されている。これら、合計6列の圧縮データ列が、一つのシステムストリームSt35にインターリーブされる。
ビデオデータはMPEG方式で符号化されており、GOPという単位が圧縮の単位になっており、GOP単位は、標準的にはNTSCの場合、15フレームで1GOPを構成するが、そのフレーム数は可変になっている。インターリーブされたデータ相互の関連などの情報をもつ管理用のデータを表すストリーム管理パックも、ビデオデータを基準とするGOPを単位とする間隔で、インターリーブされる事になり、GOPを構成するフレーム数が変われば、その間隔も変動する事になる。DVDでは、その間隔を再生時間長で、0.4秒から1.0秒の範囲内として、その境界はGOP単位としている。もし、連続する複数のGOPの再生時間が1秒以下であれば、その複数GOPのビデオデータに対して、管理用のデータパックが1つのストリーム中にインターリーブされる事になる。
DVDではこのような、管理用データパックをナブパックNVと呼び、このナブパックNVから、次のナブパックNV直前のパックまでをビデオオブジェクトユニット(以下VOBUと呼ぶ)と呼び、一般的に1つのシーンと定義できる1つの連続した再生単位をビデオオブジェクトと呼び(以下VOBと呼ぶ)、1つ以上のVOBUから構成される事になる。また、VOBが複数集まったデータの集合をVOBセット(以下VOBSと呼ぶ)と呼ぶ。これらは、DVDに於いて初めて採用されたデータ形式である。
このように複数のデータ列がインターリーブされる場合、インターリーブされたデータ相互の関連を示す管理用のデータを表すナビゲーションパックNVも、所定のパック数単位と呼ばれる単位でインターリーブされる必要がある。GOPは、通常12から15フレームの再生時間に相当する約0.5秒のビデオデータをまとめた単位であり、この時間の再生に要するデータパケット数に一つのストリーム管理パケットがインターリーブされると考えられる。
図19は、システムストリームを構成する、インターリーブされたビデオデータ、オーディオデータ、副映像データのパックに含まれるストリーム管理情報を示す説明図である。同図のようにシステムストリーム中の各データは、MPEG2に準拠するパケット化およびパック化された形式で記録される。ビデオ、オーディオ、及び副画像データ共、パケットの構造は、基本的に同じである。DVDシステムに於いては、1パックは、前述の如く2048バイトの容量を有し、PESパケットと呼ばれる1パケットを含み、パックヘッダPKH、パケットヘッダPTH、及びデータ領域から成る。
パックヘッダPKH中には、そのパックが図26におけるストリームバッファ2400からシステムデコーダ2500に転送されるべき時刻、つまりAV同期再生のための基準時刻情報を示すSCRが記録されている。MPEGに於いては、このSCRをデコーダ全体の基準クロックとすることを想定しているが、DVDなどのディスクメディアの場合には、個々のプレーヤに於いて閉じた時刻管理で良い為、別途にデコーダ全体の時刻の基準となるクロックを設けている。また、パケットヘッダPTH中には、そのパケットに含まれるビデオデータ或はオーディオデータがデコードされた後に再生出力として出力されるべき時刻を示すPTSや、ビデオストリームがデコードされるべき時刻を示すDTSなどが記録されているPTSおよびDTSは、パケット内にデコード単位であるアクセスユニットの先頭がある場合に置かれ、PTSはアクセスユニットの表示開始時刻を示し、DTSはアクセスユニットのデコード開始時刻を示している。また、PTSとDTSが同時刻の場合、DTSは省略される。
更に、パケットヘッダPTHには、ビデオデータ列を表すビデオパケットであるか、プライベートパケットであるか、MPEGオーディオパケットであるかを示す8ビット長のフィールドであるストリームIDが含まれている。
ここで、プライベートパケットとは、MPEG2の規格上その内容を自由に定義してよいデータであり、本実施形態では、プライベートパケット1を使用してオーディオデータ(MPEGオーディオ以外)および副映像データを搬送し、プライベートパケット2を使用してPCIパケットおよびDSIパケットを搬送している。
プライベートパケット1およびプライベートパケット2はパケットヘッダ、プライベートデータ領域およびデータ領域からなる。プライベートデータ領域には、記録されているデータがオーディオデータであるか副映像データであるかを示す、8ビット長のフィールドを有するサブストリームIDが含まれる。プライベートパケット2で定義されるオーディオデータは、リニアPCM方式、AC−3方式それぞれについて#0〜#7まで最大8種類が設定可能である。また副映像データは、#0〜#31までの最大32種類が設定可能である。
データ領域は、ビデオデータの場合はMPEG2形式の圧縮データ、オーディオデータの場合はリニアPCM方式、AC−3方式又はMPEG方式のデータ、副映像データの場合はランレングス符号化により圧縮されたグラフィックスデータなどが記録されるフィールドである。
また、MPEG2ビデオデータは、その圧縮方法として、固定ビットレート方式(以下「CBR」とも記す)と可変ビットレート方式(以下「VBR」とも記す)が存在する。固定ビットレート方式とは、ビデオストリームが一定レートで連続してビデオバッファへ入力される方式である。これに対して、可変ビットレート方式とは、ビデオストリームが間欠して(断続的に)ビデオバッファへ入力される方式であり、これにより不要な符号量の発生を抑えることが可能である。DVDでは、固定ビットレート方式および可変ビットレート方式とも使用が可能である。
MPEGでは、動画像データは、可変長符号化方式で圧縮されるために、GOPのデータ量が一定でない。さらに、動画像とオーディオのデコード時間が異なり、光ディスクから読み出した動画像データとオーディオデータの時間関係とデコーダから出力される動画像データとオーディオデータの時間関係が一致しなくなる。このため、動画像とオーディオの時間的な同期をとる方法を、図26を参照して、後程、詳述するが、一先ず、簡便のため固定ビットレート方式を基に説明をする。
図20に、ナブパックNVの構造を示す。ナブパックNVは、PCIパケットとDSIパケットからなり、先頭にパックヘッダPKHを設けている。PKHには、前述したとおり、そのパックが図26におけるストリームバッファ2400からシステムデコーダ2500に転送されるべき時刻、つまりAV同期再生のための基準時刻情報、を示すSCRが記録されている。
PCIパケットは、PCI情報(PCI_GI)と非シームレスマルチアングル情報(NSML_AGLI)を有している。
PCI情報(PCI_GI)には、該VOBUに含まれるビデオデータの先頭ビデオフレーム表示時刻(VOBU_S_PTM)及び最終ビデオフレーム表示時刻(VOBU_E_PTM)をシステムクロック精度(90KHz)で記述する。
非シームレスマルチアングル情報(NSML_AGLI)には、アングルを切り替えた場合の読み出し開始アドレスをVOB先頭からのセクタ数として記述する。この場合、アングル数は9以下であるため、領域として9アングル分のアドレス記述領域(NSML_AGL_C1_DSTA〜NSML_AGL_C9_DSTA)を有す。
DSIパケットにはDSI情報(DSI_GI)、シームレス再生情報(SML_PBI)およびシームレスマルチアングル再生情報(SML_AGLI)を有している。
DSI情報(DSI_GI)として該VOBU内の最終パックアドレス(VOBU_EA)をVOBU先頭からのセクタ数として記述する。
シームレス再生に関しては後述するが、分岐あるいは結合するタイトルをシームレスに再生するために、連続読み出し単位をILVU(Interleaved Unit)として、システムストリームレベルでインターリーブ(多重化)する必要がある。複数のシステムストリームがILVUを最小単位としてインターリーブ処理されている区間をインターリーブブロックと定義する。
このようにILVUを最小単位としてインターリーブされたストリームをシームレスに再生するために、シームレス再生情報:Seamless Playback Information(SML_PBI)を記述する。シームレス再生情報(SML_PBI)には、該VOBUがインターリーブブロックかどうかを示すインターリーブユニットフラグ(ILVU flag)を記述する。このフラグはインターリーブ領域に(後述)に存在するかを示すものであり、インターリーブ領域に存在する場合"1"を設定する。そうでない場合には、フラグ値0を設定する。
また、該VOBUがインターリーブ領域に存在する場合、該VOBUがILVUの最終VOBUかを示すユニットエンドフラグ(UNIT END Flag)を記述する。ILVUは、連続読み出し単位であるので、現在読み出しているVOBUが、ILVUの最後のVOBUであれば"1"を設定する。そうでない場合には、フラグ値0を設定する。
該VOBUがインターリーブ領域に存在する場合、該VOBUが属するILVUの最終パックのアドレスを示すILVU最終パックアドレス(ILVU_EA)を記述する。ここでアドレスとして、該VOBUのNVからのセクタ数で記述する。
また、該VOBUがインターリーブ領域に存在する場合、次のILVUの開始アドレス(NT_ILVU_SA)を記述する。ここでアドレスとして、該VOBUのNVからのセクタ数で記述する。
また、2つのシステムストリームをシームレスに接続する場合に於いて、特に接続前と接続後のオーディオが連続していない場合(異なるオーディオの場合等)、接続後のビデオとオーディオの同期をとるためにオーディオを一時停止(ポーズ)する必要がある。例えば、NTSCの場合、ビデオのフレーム周期は約33.33msecであり、オーディオAC3のフレーム周期は32msecである。
このためにオーディオを停止する時間および期間情報を示すオーディオ再生停止時刻1(VOBU_A_STP_PTM1)、オーディオ再生停止時刻2(VOBU_A_STP_PTM2)、オーディオ再生停止期間1(VOB_A_GAP_LEN1)、オーディオ再生停止期間2:Audio Gap Length 2 inVOB(VOB_A_GAP_LEN2)を記述する。この時間情報はシステムクロック精度(90KHz)で記述される。
また、シームレスマルチアングル再生情報(SML_AGLI)として、アングルを切り替えた場合の読み出し開始アドレスを記述する。このフィールドはシームレスマルチアングルの場合に有効なフィールドである。このアドレスは該VOBUのNVからのセクタ数で記述される。また、アングル数は9以下であるため、領域として9アングル分のアドレス記述領域:(SML_AGL_C1_DSTA〜SML_AGL_C9_DSTA)を有す。
DVDエンコーダ
図25に、本発明に掛かるマルチメディアビットストリームオーサリングシステムを上述のDVDシステムに適用した場合の、オーサリングエンコーダECDの一実施形態を示す。DVDシステムに適用したオーサリングエンコーダECD(以降、DVDエンコーダと呼称する)は、図2に示したオーサリングエンコーダECに、非常に類似した構成になっている。
DVDオーサリングエンコーダECDは、基本的には、オーサリングエンコーダECのビデオゾーンフォーマッタ1300が、VOBバッファ1000とフォーマッタ1100にとって変わられた構造を有している。言うまでもなく、本発明のエンコーダによってエンコードされたビットストリームは、DVD媒体Mに記録される。以下に、DVDオーサリングエンコーダECDの動作をオーサリングエンコーダECと比較しながら説明する。
DVDオーサリングエンコーダECDに於いても、オーサリングエンコーダECと同様に、編集情報作成部100から入力されたユーザーの編集指示内容を表すシナリオデータSt7に基づいて、エンコードシステム制御部200が、各制御信号St9、St11、St13、St21、St23、St25、St33、及びSt39を生成して、ビデオエンコーダ300、サブピクチャエンコーダ500、及びオーディオエンコーダ700を制御する。
尚、DVDシステムに於ける編集指示内容とは、図25を参照して説明したオーサリングシステムに於ける編集指示内容と同様に、複数のタイトル内容を含む各ソースデータの全部或いは、其々に対して、所定時間毎に各ソースデータの内容を一つ以上選択し、それらの選択された内容を、所定の方法で接続再生するような情報を含無と共に、更に、以下の情報を含む。つまり、マルチタイトルソースストリームを、所定時間単位毎に分割した編集単位に含まれるストリーム数、各ストリーム内のオーディオ数やサブピクチャ数及びその表示期間等のデータ、パレンタルあるいはマルチアングルなど複数ストリームから選択するか否か、設定されたマルチアングル区間でのシーン間の切り替え接続方法などの情報を含む。
尚、DVDシステムに於いては、シナリオデータSt7には、メディアソースストリームをエンコードするために必要な、VOB単位での制御内容、つまり、マルチアングルであるかどうか、パレンタル制御を可能とするマルチレイティッドタイトルの生成であるか、後述するマルチアングルやパレンタル制御の場合のインターリーブとディスク容量を考慮した各ストリームのエンコード時のビットレート、各制御の開始時間と終了時間、前後のストリームとシームレス接続するか否かの内容が含まれる。エンコードシステム制御部200は、シナリオデータSt7から情報を抽出して、エンコード制御に必要な、エンコード情報テーブル及びエンコードパラメータを生成する。エンコード情報テーブル及びエンコードパラメータについては、後程、図27、図28、及び図29を参照して詳述する。
システムストリームエンコードパラメータデータ及びシステムエンコード開始終了タイミングの信号St33には上述の情報をDVDシステムに適用してVOB生成情報を含む。VOB生成情報として、前後の接続条件、オーディオ数、オーディオのエンコード情報、オーディオID、サブピクチャ数、サブピクチャID、ビデオ表示を開始する時刻情報(VPTS)、オーディオ再生を開始する時刻情報(APTS)等がある。更に、マルチメディア尾ビットストリームMBSのフォーマットパラメータデータ及びフォーマット開始終了タイミングの信号St39は、再生制御情報及びインターリーブ情報を含む。
ビデオエンコーダ300は、ビデオエンコードのためのエンコードパラメータ信号及びエンコード開始終了タイミングの信号St9に基づいて、ビデオストリームSt1の所定の部分をエンコードして、ISO13818に規定されるMPEG2ビデオ規格に準ずるエレメンタリーストリームを生成する。そして、このエレメンタリーストリームをビデオエンコードストリームSt15として、ビデオストリームバッファ400に出力する。
ここで、ビデオエンコーダ300に於いてISO13818に規定されるMPEG2ビデオ規格に準ずるエレメンタリストリームを生成するが、ビデオエンコードパラメータデータを含む信号St9に基に、エンコードパラメータとして、エンコード開始終了タイミング、ビットレート、エンコード開始終了時にエンコード条件、素材の種類として、NTSC信号またはPAL信号あるいはテレシネ素材であるかなどのパラメータ及びオープンGOP或いはクローズドGOPのエンコードモードの設定がエンコードパラメータとしてそれぞれ入力される。
MPEG2の符号化方式は、基本的にフレーム間の相関を利用する符号化である。つまり、符号化対象フレームの前後のフレームを参照して符号化を行う。しかし、エラー伝播およびストリーム途中からのアクセス性の面で、他のフレームを参照しない(イントラフレーム)フレームを挿入する。このイントラフレームを少なくとも1フレームを有する符号化処理単位をGOPと呼ぶ。
このGOPに於いて、完全に該GOP内で符号化が閉じているGOPがクローズドGOPであり、前のGOP内のフレームを参照するフレームが該GOP内に存在する場合、該GOPをオープンGOPと呼ぶ。
従って、クローズドGOPを再生する場合は、該GOPのみで再生できるが、オープンGOPを再生する場合は、一般的に1つ前のGOPが必要である。
また、GOPの単位は、アクセス単位として使用する場合が多い。例えば、タイトルの途中からの再生する場合の再生開始点、映像の切り替わり点、あるいは早送りなどの特殊再生時には、GOP内のフレーム内符号化フレームであるいフレームのみをGOP単位で再生する事により、高速再生を実現する。
サブピクチャエンコーダ500は、サブピクチャストリームエンコード信号St11に基づいて、サブピクチャストリームSt3の所定の部分をエンコードして、ビットマップデータの可変長符号化データを生成する。そして、この可変長符号化データをサブピクチャエンコードストリームSt17として、サブピクチャストリームバッファ600に出力する。
オーディオエンコーダ700は、オーディオエンコード信号St13に基づいて、オーディオストリームSt5の所定の部分をエンコードして、オーディオエンコードデータを生成する。このオーディオエンコードデータとしては、ISO11172に規定されるMPEG1オーディオ規格及びISO13818に規定されるMPEG2オーディオ規格に基づくデータ、また、AC−3オーディオデータ、及びPCM(LPCM)データ等がある。これらのオーディオデータをエンコードする方法及び装置は公知である。
ビデオストリームバッファ400は、ビデオエンコーダ300に接続されており、ビデオエンコーダ300から出力されるビデオエンコードストリームSt15を保存する。ビデオストリームバッファ400は更に、エンコードシステム制御部200に接続されて、タイミング信号St21の入力に基づいて、保存しているビデオエンコードストリームSt15を、調時ビデオエンコードストリームSt27として出力する。
同様に、サブピクチャストリームバッファ600は、サブピクチャエンコーダ500に接続されており、サブピクチャエンコーダ500から出力されるサブピクチャエンコードストリームSt17を保存する。サブピクチャストリームバッファ600は更に、エンコードシステム制御部200に接続されて、タイミング信号St23の入力に基づいて、保存しているサブピクチャエンコードストリームSt17を、調時サブピクチャエンコードストリームSt29として出力する。
また、オーディオストリームバッファ800は、オーディオエンコーダ700に接続されており、オーディオエンコーダ700から出力されるオーディオエンコードストリームSt19を保存する。オーディオストリームバッファ800は更に、エンコードシステム制御部200に接続されて、タイミング信号St25の入力に基づいて、保存しているオーディオエンコードストリームSt19を、調時オーディオエンコードストリームSt31として出力する。
システムエンコーダ900は、ビデオストリームバッファ400、サブピクチャストリームバッファ600、及びオーディオストリームバッファ800に接続されており、調時ビデオエンコードストリームSt27、調時サブピクチャエンコードストリームSt29、及び調時オーディオエンコードSt31が入力される。システムエンコーダ900は、またエンコードシステム制御部200に接続されており、システムエンコードのためのエンコードパラメータデータを含むSt33が入力される。
システムエンコーダ900は、エンコードパラメータデータ及びエンコード開始終了タイミング信号St33に基づいて、各調時ストリームSt27、St29、及びSt31に多重化(マルチプレクス)処理を施して、最小タイトル編集単位(VOBs)St35を生成する。
VOBバッファ1000はシステムエンコーダ900に於いて生成されたVOBを一時格納するバッファ領域であり、フォーマッタ1100では、St39に従ってVOBバッファ1100から調時必要なVOBを読み出し1ビデオゾーンVZを生成する。また、同フォーマッタ1100に於いてはファイルシステム(VFS)を付加してSt43を生成する。
このユーザの要望シナリオの内容に編集された、ストリームSt43は、記録部1200に転送される。記録部1200は、編集マルチメディアビットストリームMBSを記録媒体Mに応じた形式のデータSt43に加工して、記録媒体Mに記録する。
DVDデコーダ
次に、図26を参照して、本発明に掛かるマルチメディアビットストリームオーサリングシステムを上述のDVDシステムに適用した場合の、オーサリングデコーダDCの一実施形態を示す。DVDシステムに適用したオーサリングエンコーダDCD(以降、DVDデコーダと呼称する)は、本発明にかかるDVDエンコーダECDによって、編集されたマルチメディアビットストリームMBSをデコードして、ユーザの要望のシナリオに沿って各タイトルの内容を展開する。
なお、本実施形態に於いては、DVDエンコーダECDによってエンコードされたマルチメディアビットストリームSt45は、記録媒体Mに記録されている。DVDオーサリングデコーダDCDの基本的な構成は図3に示すオーサリングデコーダDCと同一であり、ビデオデコーダ3800がビデオデコーダ3801に替わると共に、ビデオデコーダ3801と合成部3500の間にリオーダバッファ3300と切替器3400が挿入されている。なお、切替器3400は同期制御部2900に接続されて、切替指示信号St5103の入力を受けている。
DVDオーサリングデコーダDCDは、マルチメディアビットストリーム再生部2000、シナリオ選択部2100、デコードシステム制御部2300、ストリームバッファ2400、システムデコーダ2500、ビデオバッファ2600、サブピクチャバッファ2700、オーディオバッファ2800、同期制御部2900、ビデオデコーダ3801、リオーダバッファ3300、サブピクチャデコーダ3100、オーディオデコーダ3200、セレクタ3400、合成部3500、ビデオデータ出力端子3600、及びオーディオデータ出力端子3700から構成されている。
マルチメディアビットストリーム再生部2000は、記録媒体Mを駆動させる記録媒体駆動ユニット2004、記録媒体Mに記録されている情報を読み取り二値の読み取り信号St57を生成する読取ヘッドユニット2006、読み取り信号ST57に種々の処理を施して再生ビットストリームSt61を生成する信号処理部2008、及び機構制御部2002から構成される。機構制御部2002は、デコードシステム制御部2300に接続されて、マルチメディアビットストリーム再生指示信号St53を受けて、それぞれ記録媒体駆動ユニット(モータ)2004及び信号処理部2008をそれぞれ制御する再生制御信号St55及びSt59を生成する。
デコーダDCは、オーサリングエンコーダECで編集されたマルチメディアタイトルの映像、サブピクチャ、及び音声に関する、ユーザの所望の部分が再生されるように、対応するシナリオを選択して再生するように、オーサリングデコーダDCに指示を与えるシナリオデータとして出力できるシナリオ選択部2100を備えている。
シナリオ選択部2100は、好ましくは、キーボード及びCPU等で構成される。ユーザーは、オーサリングエンコーダECで入力されたシナリオの内容に基づいて、所望のシナリオをキーボード部を操作して入力する。CPUは、キーボード入力に基づいて、選択されたシナリオを指示するシナリオ選択データSt51を生成する。シナリオ選択部2100は、例えば、赤外線通信装置等によって、デコードシステム制御部2300に接続されて、生成したシナリオ選択信号St51をデコードシステム制御部2300に入力する。
ストリームバッファ2400は所定のバッファ容量を有し、マルチメディアビットストリーム再生部2000から入力される再生信号ビットストリームSt61を一時的に保存すると共に、ボリュームファイルストラクチャVFS、各パックに存在する同期初期値データ(SCR)、及びナブパックNV存在するVOBU制御情報(DSI)を抽出してストリーム制御データSt63を生成する。
デコードシステム制御部2300は、デコードシステム制御部2300で生成されたシナリオ選択データSt51に基づいてマルチメディアビットストリーム再生部2000の動作を制御する再生指示信号St53を生成する。デコードシステム制御部2300は、更に、シナリオデータSt53からユーザの再生指示情報を抽出して、デコード制御に必要な、デコード情報テーブルを生成する。デコード情報テーブルについては、後程、図47、及び図48を参照して詳述する。更に、デコードシステム制御部2300は、ストリーム再生データSt63中のファイルデータ領域FDS情報から、ビデオマネージャVMG、VTS情報VTSI、PGC情報C_PBI#j、セル再生時間C_PBTM等の光ディスクMに記録されたタイトル情報を抽出してタイトル情報St200を生成する。
ここで、ストリーム制御データSt63は図19におけるパック単位に生成される。ストリームバッファ2400は、デコードシステム制御部2300に接続されており、生成したストリーム制御データSt63をデコードシステム制御部2300に供給する。
同期制御部2900は、デコードシステム制御部2300に接続されて、同期再生データSt81に含まれる同期初期値データ(SCR)を受け取り、内部のシステムクロック(STC)セットし、リセットされたシステムクロックSt79をデコードシステム制御部2300に供給する。
デコードシステム制御部2300は、システムクロックSt79に基づいて、所定の間隔でストリーム読出信号St65を生成し、ストリームバッファ2400に入力する。この場合の読み出し単位はパックである。
ここでストリーム読み出し信号St65の生成方法について説明する。デコードシステム制御部2300では、ストリームバッファ2400から抽出したストリーム制御データ中のSCRと、同期制御部2900からのシステムクロックSt79を比較し、St63中のSCRよりもシステムクロックSt79が大きくなった時点で読み出し要求信号St65を生成する。このような制御をパック単位に行うことで、パック転送を制御する。
デコードシステム制御部2300は、更に、シナリオ選択データSt51に基づき、選択されたシナリオに対応するビデオ、サブピクチャ、オーディオの各ストリームのIDを示すデコードストリーム指示信号St69を生成して、システムデコーダ2500に出力する。
タイトル中に、例えば日本語、英語、フランス語等、言語別のオーディオ等の複数のオーディオデータ、及び、日本語字幕、英語字幕、フランス語字幕等、言語別の字幕等の複数のサブピクチャデータが存在する場合、それぞれにIDが付与されている。つまり、図19を参照して説明したように、ビデオデータ及び、MPEGオーディオデータには、ストリームIDが付与され、サブピクチャデータ、AC3方式のオーディオデータ、リニアPCM及びナブパックNV情報には、サブストリームIDが付与されている。
ユーザはIDを意識することはないが、どの言語のオーディオあるいは字幕を選択するかをシナリオ選択部2100で選択する。英語のオーディオを選択すれば、シナリオ選択データSt51として英語のオーディオに対応するIDがデーコードシステム制御部2300に搬送される。さらに、デコードシステム制御部2300はシステムデコーダ2500にそのIDをSt69上に搬送して渡す。
システムデコーダ2500は、ストリームバッファ2400から入力されてくるビデオ、サブピクチャ、及びオーディオのストリームを、デコード指示信号St69の指示に基づいて、それぞれ、ビデオエンコードストリームSt71としてビデオバッファ2600に、サブピクチャエンコードストリームSt73としてサブピクチャバッファ2700に、及びオーディオエンコードストリームSt75としてオーディオバッファ2800に出力する。つまり、システムデコーダ2500は、シナリオ選択部2100より入力される、ストリームのIDと、ストリームバッファ2400から転送されるパックのIDが一致した場合にそれぞれのバッファ(ビデオバッファ2600、サブピクチャバッファ2700、オーディオバッファ2800)に該パックを転送する。
システムデコーダ2500は、各ストリームSt67の各最小制御単位での再生開始時間(PTS)及び再生終了時間(DTS)を検出し、時間情報信号St77を生成する。この時間情報信号St77は、デコードシステム制御部2300を経由して、St81として同期制御部2900に入力される。
同期制御部2900は、この時間情報信号St81に基づいて、各ストリームについて、それぞれがデコード後に所定の順番になるようなデコード開始タイミングを決定する。同期制御部2900は、このデコードタイミングに基づいて、ビデオストリームデコード開始信号St89を生成し、ビデオデコーダ3801に入力する。同様に、同期制御部2900は、サブピクチャデコード開始信号St91及びオーディオエンコード開始信号St93を生成し、サブピクチャデコーダ3100及びオーディオデコーダ3200にそれぞれ入力する。
ビデオデコーダ3801は、ビデオストリームデコード開始信号St89に基づいて、ビデオ出力要求信号St84を生成して、ビデオバッファ2600に対して出力する。ビデオバッファ2600はビデオ出力要求信号St84を受けて、ビデオストリームSt83をビデオデコーダ3801に出力する。ビデオデコーダ3801は、ビデオストリームSt83に含まれる再生時間情報を検出し、再生時間に相当する量のビデオストリームSt83の入力を受けた時点で、ビデオ出力要求信号St84を無効にする。このようにして、所定再生時間に相当するビデオストリームがビデオデコーダ3801でデコードされて、再生されたビデオ信号St95がリオーダーバッファ3300と切替器3400に出力される。
ビデオエンコードストリームは、フレーム間相関を利用した符号化であるため、フレーム単位でみた場合、表示順と符号化ストリーム順が一致していない。従って、デコード順に表示できるわけではない。そのため、デコードを終了したクレームを一時リオーダバッファ3300に格納する。同期制御部2900に於いて表示順になるようにSt103を制御しビデオデコーダ3801の出力St95と、リオーダバッファSt97の出力を切り替え、合成部3500に出力する。
同様に、サブピクチャデコーダ3100は、サブピクチャデコード開始信号St91に基づいて、サブピクチャ出力要求信号St86を生成し、サブピクチャバッファ2700に供給する。サブピクチャバッファ2700は、ビデオ出力要求信号St84を受けて、サブピクチャストリームSt85をサブピクチャデコーダ3100に出力する。サブピクチャデコーダ3100は、サブピクチャストリームSt85に含まれる再生時間情報に基づいて、所定の再生時間に相当する量のサブピクチャストリームSt85をデコードして、サブピクチャ信号St99を再生して、合成部3500に出力する。
合成部3500は、セレクタ3400の出力及びサブピクチャ信号St99を重畳させて、映像信号St105を生成し、ビデオ出力端子3600に出力する。
オーディオデコーダ3200は、オーディオデコード開始信号St93に基づいて、オーディオ出力要求信号St88を生成し、オーディオバッファ2800に供給する。オーディオバッファ2800は、オーディオ出力要求信号St88を受けて、オーディオストリームSt87をオーディオデコーダ3200に出力する。オーディオデコーダ3200は、オーディオストリームSt87に含まれる再生時間情報に基づいて、所定の再生時間に相当する量のオーディオストリームSt87をデコードして、オーディオ出力端子3700に出力する。
このようにして、ユーザのシナリオ選択に応答して、リアルタイムにユーザの要望するマルチメディアビットストリームMBSを再生する事ができる。つまり、ユーザが異なるシナリオを選択する度に、オーサリングデコーダDCDはその選択されたシナリオに対応するマルチメディアビットストリームMBSを再生することによって、ユーザの要望するタイトル内容を再生することができる。
尚、デコードシステム制御部2300は、前述の赤外線通信装置等を経由して、シナリオ選択部2100にタイトル情報信号St200を供給してもよい。シナリオ選択部2100は、タイトル情報信号St200に含まれるストリーム再生データSt63中のファイルデータ領域FDS情報から、光ディスクMに記録されたタイトル情報を抽出して、内蔵ディスプレイに表示することにより、インタラクティブなユーザによるシナリオ選択を可能とする。
また、上述の例では、ストリームバッファ2400、ビデオバッファ2600、サブピクチャバッファ2700、及びオーディオバッファ2800、及びリオーダバッファ3300は、機能的に異なるので、それぞれ別のバッファとして表されている。しかし、これらのバッファに於いて要求される読込み及び読み出し速度の数倍の動作速度を有するバッファメモリを時分割で使用することにより、一つのバッファメモリをこれら個別のバッファとして機能させることができる。
マルチシーン
図21を用いて、本発明に於けるマルチシーン制御の概念を説明する。既に、上述したように、各タイトル間での共通のデータからなる基本シーン区間と、其々の要求に即した異なるシーン群からなるマルチシーン区間とで構成される。同図に於いて、シーン1、シーン5、及びシーン8が共通シーンである。共通シーン1とシーン5の間のアングルシーン及び、共通シーン5とシーン8の間のパレンタルシーンがマルチシーン区間である。マルチアングル区間に於いては、異なるアングル、つまりアングル1、アングル2、及びアングル3、から撮影されたシーンの何れかを、再生中に動的に選択再生できる。パレンタル区間に於いては、異なる内容のデータに対応するシーン6及びシーン7の何れかをあらかじめ静的に選択再生できる。
このようなマルチシーン区間のどのシーンを選択して再生するかというシナリオ内容を、ユーザはシナリオ選択部2100にて入力してシナリオ選択データSt51として生成する。図中に於いて、シナリオ1では、任意のアングルシーンを自由に選択し、パレンタル区間では予め選択したシーン6を再生することを表している。同様に、シナリオ2では、アングル区間では、自由にシーンを選択でき、パレンタル区間では、シーン7が予め選択されていることを表している。
以下に、図21で示したマルチシーンをDVDのデータ構造を用いた場合の、PGC情報VTS_PGCIについて、図30、及び図31を参照して説明する。
図30には、図21に示したユーザ指示のシナリオを図16のDVDデータ構造内のビデオタイトルセットの内部構造を表すVTSIデータ構造で記述した場合について示す。図において、図21のシナリオ1、シナリオ2は、図16のVTSI中のプログラムチェーン情報VTS_PGCIT内の2つプログラムチェーンVTS_PGCI#1とVTS_PGCI#2として記述される。すなわち、シナリオ1を記述するVTS_PGCI#1は、シーン1に相当するセル再生情報C_PBI#1、マルチアングルシーンに相当するマルチアングルセルブロック内のセル再生情報C_PBI#2,セル再生情報C_PBI#3,セル再生情報C_PBI#4、シーン5に相当するセル再生情報C_PBI#5、シーン6に相当するセル再生情報C_PBI#6、シーン8に相当するC_PBI#7からなる。
また、シナリオ2を記述するVTS_PGC#2は、シーン1に相当するセル再生情報C_PBI#1、マルチアングルシーンに相当するマルチアングルセルブロック内のセル再生情報C_PBI#2,セル再生情報C_PBI#3,セル再生情報C_PBI#4、シーン5に相当するセル再生情報C_PBI#5、シーン7に相当するセル再生情報C_PBI#6、シーン8に相当するC_PBI#7からなる。DVDデータ構造では、シナリオの1つの再生制御の単位であるシーンをセルというDVDデータ構造上の単位に置き換えて記述し、ユーザの指示するシナリオをDVD上で実現している。
図31には、図21に示したユーザ指示のシナリオを図16のDVDデータ構造内のビデオタイトルセット用のマルチメディアビットストリームであるVOBデータ構造VTSTT_VOBSで記述した場合について示す。
図において、図21のシナリオ1とシナリオ2の2つのシナリオは、1つのタイトル用VOBデータを共通に使用する事になる。各シナリオで共有する単独のシーンはシーン1に相当するVOB#1、シーン5に相当するVOB#5、シーン8に相当するVOB#8は、単独のVOBとして、インターリーブブロックではない部分、すなわち連続ブロックに配置される。
シナリオ1とシナリオ2で共有するマルチアングルシーンにおいて、それぞれアングル1はVOB#2、アングル2はVOB#3、アングル3はVOB#4で構成、つまり1アングルを1VOBで構成し、さらに各アングル間の切り替えと各アングルのシームレス再生のために、インターリーブブロックとする。
また、シナリオ1とシナリオ2で固有なシーンであるシーン6とシーン7は、各シーンのシームレス再生はもちろんの事、前後の共通シーンとシームレスに接続再生するために、インターリーブブロックとする。
以上のように、図21で示したユーザ指示のシナリオは、DVDデータ構造において、図30に示すビデオタイトルセットの再生制御情報と図31に示すタイトル再生用VOBデータ構造で実現できる。
シームレス
上述のDVDシステムのデータ構造に関連して述べたシームレス再生について説明する。シームレス再生とは、共通シーン区間同士で、共通シーン区間とマルチシーン区間とで、及びマルチシーン区間同士で、映像、音声、副映像等のマルチメディアデータを、接続して再生する際に、各データ及び情報を中断する事無く再生することである。このデータ及び情報再生の中断の要因としては、ハードウェアに関連するものとして、デコーダに於いて、ソースデータ入力される速度と、入力されたソースデータをデコードする速度のバランスがくずれる、いわゆるデコーダのアンダーフローと呼ばれるものがある。
更に、再生されるデータの特質に関するものとして、再生データが音声のように、その内容或いは情報をユーザが理解する為には、一定時間単位以上の連続再生を要求されるデータの再生に関して、その要求される連続再生時間を確保出来ない場合に情報の連続性が失われるものがある。このような情報の連続性を確保して再生する事を連続情報再生と、更にシームレス情報再生と呼ぶ。また、情報の連続性を確保出来ない再生を非連続情報再生と呼び、更に非シームレス情報再生と呼ぶ。尚、言うまでまでもなく連続情報再生と非連続情報再生は、それぞれシームレス及び非シームレス再生である。
上述の如く、シームレス再生には、バッファのアンダーフロー等によって物理的にデータ再生に空白あるいは中断の発生を防ぐシームレスデータ再生と、データ再生自体には中断は無いものの、ユーザーが再生データから情報を認識する際に情報の中断を感じるのを防ぐシームレス情報再生と定義する。
シームレスの詳細
なお、このようにシームレス再生を可能にする具体的な方法については、図23及び図24参照して後で詳しく説明する。
インターリーブ
上述のDVDデータのシステムストリームをオーサリングエンコーダECを用いて、DVD媒体上の映画のようなタイトルを記録する。しかし、同一の映画を複数の異なる文化圏或いは国に於いても利用できるような形態で提供するには、台詞を各国の言語毎に記録するのは当然として、さらに各文化圏の倫理的要求に応じて内容を編集して記録する必要がある。このような場合、元のタイトルから編集された複数のタイトルを1枚の媒体に記録するには、DVDという大容量システムに於いてさえも、ビットレートを落とさなければならず、高画質という要求が満たせなくなってしまう。そこで、共通部分を複数のタイトルで共有し、異なる部分のみをそれぞれのタイトル毎に記録するという方法をとる。これにより、ビットレートをおとさず、1枚の光ディスクに、国別あるいは文化圏別の複数のタイトルを記録する事ができる。
1枚の光ディスクに記録されるタイトルは、図21に示したように、パレンタルロック制御やマルチアングル制御を可能にするために、共通部分(シーン)と非共通部分(シーン)のを有するマルチシーン区間を有する。
パレンタルロック制御の場合は、一つのタイトル中に、性的シーン、暴力的シーン等の子供に相応しくない所謂成人向けシーンが含まれている場合、このタイトルは共通のシーンと、成人向けシーンと、未成年向けシーンから構成される。このようなタイトルストリームは、成人向けシーンと非成人向けシーンを、共通シーン間に、設けたマルチシーン区間として配置して実現する。
また、マルチアングル制御を通常の単一アングルタイトル内に実現する場合には、それぞれ所定のカメラアングルで対象物を撮影して得られる複数のマルチメディアシーンをマルチシーン区間として、共通シーン間に配置する事で実現する。ここで、各シーンは異なるアングルで撮影されたシーンの例を上げている、同一のアングルであるが、異なる時間に撮影されたシーンであっても良いし、またコンピュータグラフィックス等のデータであっても良い。
複数のタイトルでデータを共有すると、必然的に、データの共有部分から非共有部分への光ビームLSを移動させるために、光学ピックアップを光ディスク(RC1)上の異なる位置に移動することになる。この移動に要する時間が原因となって音や映像を途切れずに再生する事、すなわちシームレス再生が困難であるという問題が生じる。このような問題点を解決するするには、理論的には最悪のアクセス時間に相当する時間分のトラックバッファ(ストリームバッファ2400)を備えれば良い。
一般に、光ディスクに記録されているデータは、光ピックアップにより読み取られ、所定の信号処理が施された後、データとしてトラックバッファに一旦蓄積される。蓄積されたデータは、その後デコードされて、ビデオデータあるいはオーディオデータとして再生される。
インターリーブの定義
前述のような、あるシーンをカットする事や、複数のシーンから選択を可能にするには、記録媒体のトラック上に、各シーンに属するデータ単位で、互いに連続した配置で記録されるため、共通シーンデータと選択シーンデータとの間に非選択シーンのデータが割り込んで記録される事態が必然的におこる。
このような場合、記録されている順序にデータを読むと、選択したシーンのデータにアクセスしてデコードする前に、非選択シーンのデータにアクセスせざるを得ないので、選択したシーンへのシームレス接続が困難である。しかしながら、DVDシステムに於いては、その記録媒体に対する優れたランダムアクセス性能を活かして、このような複数シーン間でのシームレス接続が可能である。つまり、各シーンに属するデータを、所定のデータ量を有する複数の単位に分割し、これらの異なるシーンの属する複数の分割データ単位を、互いに所定の順番に配置することで、ジャンプ性能範囲に配置する事で、それぞれ選択されたシーンの属するデータを分割単位毎に、断続的にアクセスしてデコードすることによって、その選択されたシーンをデータが途切れる事なく再生する事ができる。つまり、シームレスデータ再生が保証される。
インターリーブブロック、ユニット構造
図24及び図54を参照して、シームレスデータ再生を可能にするインターリーブ方式を説明する。図24では、1つのVOB(VOB−A)から複数のVOB(VOB−B、VOB−D、VOB−C)へ分岐再生し、その後1つのVOB(VOB−E)に結合する場合を示している。図54では、これらのデータをディスク上のトラックTRに実際に配置した場合を示している。
図54に於ける、VOB−AとVOB−Eは再生の開始点と終了点が単独なビデオオブジェクトであり、原則として連続領域に配置する。また、図24に示すように、VOB−B、VOB−C、VOB−Dについては、再生の開始点、終了点を一致させて、インターリーブ処理を行う。そして、そのインターリーブ処理された領域をディスク上の連続領域にインターリーブ領域として配置する。さらに、上記連続領域とインターリーブ領域を再生の順番に、つまりトラックパスDrの方向に、配置している。複数のVOB、すなわちVOBSをトラックTR上に配置した状態を図54に示す。
図54では、データが連続的に配置されたデータ領域をブロックとし、そのブロックは、前述の開始点と終了点が単独で完結しているVOBを連続して配置している連続ブロック、開始点と終了点を一致させて、その複数のVOBをインターリーブしたインターリーブブロックの2種類である。それらのブロックが再生順に、図38に示すように、ブロック1、ブロック2、ブロック3、・・・、ブロック7と配置されている構造をもつ。
図55に於いて、VTSTT_VOBSは、ブロック1、2、3、4、5、6、及び7から構成されている。ブロック1には、VOB1が単独で配置されている。同様に、ブロック2、3、5、及び7には、それぞれ、VOB2、3、6、及び10が単独で配置されている。つまり、これらのブロック2、3、5、及び7は、連続ブロックである。
一方、ブロック4には、VOB4とVOB5がインターリーブされて配置されている。同様に、ブロック6には、VOB7、VOB8、及びVOB9の三つのVOBがインターリーブされて配置されている。つまり、これらのブロック4及び6は、インターリーブブロックである。
図56に連続ブロック内のデータ構造を示す。同図に於いて、VOBSにVOB−i、VOB−jが連続ブロックとして、配置されている。連続ブロック内のVOB−i及びVOB−jは、図16を参照して説明したように、更に論理的な再生単位であるセルに分割されている。図ではVOB−i及びVOB−jのそれぞれが、3つのセルCELL#1、CELL#2、CELL#3で構成されている事を示している。セルは1つ以上のVOBUで構成されており、VOBUの単位で、その境界が定義されている。セルはDVDの再生制御情報であるプログラムチェーン(以下PGCと呼ぶ)には、図16に示すように、その位置情報が記述される。つまり、セル開始のVOBUと終了のVOBUのアドレスが記述されている。図56に明示されるように、連続ブロックは、連続的に再生されるように、VOBもその中で定義されるセルも連続領域に記録される。そのため、連続ブロックの再生は問題はない。
次に、図57にインターリーブブロック内のデータ構造を示す。インターリーブブロックでは、各VOBがインターリーブユニットILVU単立に分割され、各VOBに属するインターリーブユニットが交互に配置される。そして、そのインターリーブユニットとは独立して、セル境界が定義される。同図に於いて、VOB−kは四つのインターリーブユニットILVUk1、ILVUk2、ILVUk3、及びILVUk4に分割されると共に、二つのセルCELL#1k、及びCELL#2kが定義されている。同様に、VOB−mはILVUm1、ILVUm2、ILVUm3、及びILVUm4に分割されると共に、二つのセルCELL#1m、及びCELL#2mが定義されている。つまり、インターリーブユニットILVUには、ビデオデータとオーディオデータが含まれている。
図57の例では、二つの異なるVOB−kとVOB−mの各インターリーブユニットILVUk1、ILVUk2、ILVUk3、及びILVUk4とILVUm1、ILVUm2、ILVUm3、及びILVUm4がインターリーブブロック内に交互に配置されている。二つのVOBの各インターリーブユニットILVUを、このような配列にインターリーブする事で、単独のシーンから複数のシーンの1つへ分岐、さらにそれらの複数シーンの1つから単独のシーンへのシームレスな再生が実現できる。このようにインターリーブすることで、多くの場合の分岐結合のあるシーンのシームレス再生可能な接続を行う事ができる。
マルチシーン
ここで、本発明に基づく、マルチシーン制御の概念を説明すると共にマルチシーン区間に付いて説明する。
異なるアングルで撮影されたシーンから構成される例が挙げている。しかし、マルチシーンの各シーンは、同一のアングルであるが、異なる時間に撮影されたシーンであっても良いし、またコンピュータグラフィックス等のデータであっても良い。言い換えれば、マルチアングルシーン区間は、マルチシーン区間である。
パレンタル
図15を参照して、パレンタルロックおよびディレクターズカットなどの複数タイトルの概念を説明する。
図15にパレンタルロックに基づくマルチレイティッドタイトルストリームの一例を示す。一つのタイトル中に、性的シーン、暴力的シーン等の子供に相応しくない所謂成人向けシーンが含まれている場合、このタイトルは共通のシステムストリームSSa、SSb、及びSSeと、成人向けシーンを含む成人向けシステムストリームSScと、未成年向けシーンのみを含む非成人向けシステムストリームSSdから構成される。このようなタイトルストリームは、成人向けシステムストリームSScと非成人向けシステムストリームSSdを、共通システムストリームSSbとSSeの間に、設けたマルチシーン区間にマルチシーンシステムストリームとして配置する。
上述の用に構成されたタイトルストリームのプログラムチェーンPGCに記述されるシステムストリームと各タイトルとの関係を説明する。成人向タイトルのプログラムチェーンPGC1には、共通のシステムストリームSSa、SSb、成人向けシステムストリームSSc及び、共通システムストリームSSeが順番に記述される。未成年向タイトルのプログラムチェーンPGC2には、共通のシステムストリームSSa、SSb、未成年向けシステムストリームSSd及び、共通システムストリームSSeが順番に記述される。
このように、成人向けシステムストリームSScと未成年向けシステムストリームSSdをマルチシーンとして配列することにより、各PGCの記述に基づき、上述のデコーディング方法で、共通のシステムストリームSSa及びSSbを再生したのち、マルチシーン区間で成人向けSScを選択して再生し、更に、共通のシステムストリームSSeを再生することで、成人向けの内容を有するタイトルを再生できる。
また、一方、マルチシーン区間で、未成年向けシステムストリームSSdを選択して再生することで、成人向けシーンを含まない、未成年向けのタイトルを再生することができる。このように、タイトルストリームに、複数の代替えシーンからなるマルチシーン区間を用意しておき、事前に該マルチ区間のシーンのうちで再生するシーンを選択しておき、その選択内容に従って、基本的に同一のタイトルシーンから異なるシーンを有する複数のタイトルを生成する方法を、パレンタルロックという。
なお、パレンタルロックは、未成年保護と言う観点からの要求に基づいて、パレンタルロックと呼ばれるが、システムストリーム処理の観点は、上述の如く、マルチシーン区間での特定のシーンをユーザが予め選択することにより、静的に異なるタイトルストリーム生成する技術である。一方、マルチアングルは、タイトル再生中に、ユーザが随時且つ自由に、マルチシーン区間のシーンを選択することにより、同一のタイトルの内容を動的に変化させる技術である。
また、パレンタルロック技術を用いて、いわゆるディレクターズカットと呼ばれるタイトルストリーム編集も可能である。ディレクターズカットとは、映画等で再生時間の長いタイトルを、飛行機内で供さる場合には、劇場での再生と異なり、飛行時間によっては、タイトルを最後まで再生できない。このような事態にさけて、予めタイトル制作責任者、つまりディレクターの判断で、タイトル再生時間短縮の為に、カットしても良いシーンを定めておき、そのようなカットシーンを含むシステムストリームと、シーンカットされていないシステムストリームをマルチシーン区間に配置しておくことによって、制作者の意志に沿っシーンカット編集が可能となる。このようなパレンタル制御では、システムストリームからシステムストリームへのつなぎ目に於いて、再生画像をなめらかに矛盾なくつなぐ事、すなわちビデオ、オーディオなどバッファがアンダーフローしないシームレスデータ再生と再生映像、再生オーディオが視聴覚上、不自然でなくまた中断する事なく再生するシームレス情報再生が必要になる。
マルチアングル
図33を参照して、本発明に於けるマルチアングル制御の概念を説明する。通常、マルチメディアタイトルは、対象物を時間Tの経過と共に録音及び撮影(以降、単に撮影と言う)して得られる。#SC1、#SM1、#SM2、#SM3、及び#SC3の各ブロックは、それぞれ所定のカメラアングルで対象物を撮影して得られる撮影単位時間T1、T2、及びT3に得られるマルチメディアシーンを代表している。シーン#SM1、#SM2、及び#SM3は、撮影単位時間T2にそれぞれ異なる複数(第一、第二、及び第三)のカメラアングルで撮影されたシーンであり、以降、第一、第二、及び第三マルチアングルシーンと呼ぶ。
ここでは、マルチシーンが、異なるアングルで撮影されたシーンから構成される例が挙げられている。しかし、マルチシーンの各シーンは、同一のアングルであるが、異なる時間に撮影されたシーンであっても良いし、またコンピュータグラフィックス等のデータであっても良い。言い換えれば、マルチアングルシーン区間は、マルチシーン区間であり、その区間のデータは、実際に異なるカメラアングルで得られたシーンデータに限るものでは無く、その表示時間が同一の期間にある複数のシーンを選択的に再生できるようなデータから成る区間である。
シーン#SC1と#SC3は、それぞれ、撮影単位時間T1及びT3に、つまりマルチアングルシーンの前後に、同一の基本のカメラアングルで撮影されたシーンあり、以降、基本アングルシーンと呼ぶ。通常、マルチアングルの内一つは、基本カメラアングルと同一である。
これらのアングルシーンの関係を分かりやすくするために、野球の中継放送を例に説明する。基本アングルシーン#SC1及び#SC3は、センター側から見た投手、捕手、打者を中心とした基本カメラアングルにて撮影されたものである。第一マルチアングルシーン#SM1は、バックネット側から見た投手、捕手、打者を中心とした第一マルチカメラアングルにて撮影されたものである。第二マルチアングルシーン#SM2は、センター側から見た投手、捕手、打者を中心とした第二マルチカメラアングル、つまり基本カメラアングルにて撮影されたものである。この意味で、第二マルチアングルシーン#SM2は、撮影単位時間T2に於ける基本アングルシーン#SC2である。第三マルチアングルシーン#SM3は、バックネット側から見た内野を中心とした第三マルチカメラアングルにて撮影されたものである。
マルチアングルシーン#SM1、#SM2、及び#SM3は、撮影単位時間T2に関して、表示時間が重複しており、この期間をマルチアングル区間と呼ぶ。視聴者は、マルチアングル区間に於いて、このマルチアングルシーン#SM1、#SM2、及び#SM3を自由に選択することによって、基本アングルシーンから、好みのアングルシーン映像をあたかもカメラを切り替えているように楽しむことができる。なお、図中では、基本アングルシーン#SC1及び#SC3と、各マルチアングルシーン#SM1、#SM2、及び#SM3間に、時間的ギャップがあるように見えるが、これはマルチアングルシーンのどれを選択するかによって、再生されるシーンの経路がどのようになるかを分かりやすく、矢印を用いて示すためであって、実際には時間的ギャップが無いことは言うまでもない。
図23に、本発明に基づくシステムストリームのマルチアングル制御を、データの接続の観点から説明する。基本アングルシーン#SCに対応するマルチメディアデータを、基本アングルデータBAとし、撮影単位時間T1及びT3に於ける基本アングルデータBAをそれぞれBA1及びBA3とする。マルチアングルシーン#SM1、#SM2、及び#SM3に対応するマルチアングルデータを、それぞれ、第一、第二、及び第三マルチアングルデータMA1、MA2、及びMA3と表している。先に、図33を参照して、説明したように、マルチアングルシーンデータMA1、MA2、及びMA3の何れかを選択することによって、好みのアングルシーン映像を切り替えて楽しむことができる。また、同様に、基本アングルシーンデータBA1及びBA3と、各マルチアングルシーンデータMA1、MA2、及びMA3との間には、時間的ギャップは無い。
しかしながら、MPEGシステムストリームの場合、各マルチアングルデータMA1、MA2、及びMA3の内の任意のデータと、先行基本アングルデータBA1からの接続と、または後続基本アングルデータBA3への接続時は、接続されるアングルデータの内容によっては、再生されるデータ間で、再生情報に不連続が生じて、一本のタイトルとして自然に再生できない場合がある。つまり、この場合、シームレスデータ再生であるが、非シームレス情報再生である。
以下に、図23をDVDシステムに於けるマルチシーン区間内での、複数のシーンを選択的に再生して、前後のシーンに接続するシームレス情報再生であるマルチアングル切替について説明する。
アングルシーン映像の切り替え、つまりマルチアングルシーンデータMA1、MA2、及びMA3の内一つを選択することが、先行する基本アングルデータBA1の再生終了前までに完了されてなけらばならない。例えば、アングルシーンデータBA1の再生中に別のマルチアングルシーンデータMA2に切り替えることは、非常に困難である。これは、マルチメディアデータは、可変長符号化方式のMPEGのデータ構造を有するので、切り替え先のデータの途中で、データの切れ目を見つけるのが困難であり、また、符号化処理にフレーム間相関を利用しているためアングルの切換時に映像が乱れる可能性がある。MPEGに於いては、少なくとも1フレームのリフレッシュフレームを有する処理単位としてGOPが定義されている。このGOPという処理単位に於いては他のGOPに属するフレームを参照しないクローズドな処理が可能である。
言い換えれば、再生がマルチアングル区間に達する前には、遅くとも、先行基本アングルデータBA1の再生が終わった時点で、任意のマルチアングルデータ、例えばMA3、を選択すれば、この選択されたマルチアングルデータはシームレスに再生できる。しかし、マルチアングルデータの再生の途中に、他のマルチアングルシーンデータをシームレスに再生することは非常に困難である。このため、マルチアングル期間中には、カメラを切り替えるような自由な視点を得ることは困難である。
フローチャート:エンコーダ
図27を参照して前述の、シナリオデータSt7に基づいてエンコードシステム制御部200が生成するエンコード情報テーブルについて説明する。エンコード情報テーブルはシーンの分岐点・結合点を区切りとしたシーン区間に対応し、複数のVOBが含まれるVOBセットデータ列と各シーン毎に対応するVOBデータ列からなる。図27に示されているVOBセットデータ列は、後に詳述する。
図34のステップ#100で、ユーザが指示するタイトル内容に基づき、DVDのマルチメディアストリーム生成のためにエンコードシステム制御部200内で作成するエンコード情報テーブルである。ユーザ指示のシナリオでは、共通なシーンから複数のシーンへの分岐点、あるいは共通なシーン5への結合点がある。その分岐点・結合点を区切りとしたシーン区間に相当するVwOBをVOBセットとし、VOBセットをエンコードするために作成するデータをVOBセットデータ列としている。また、VOBセットデータ列では、マルチシーン区間を含む場合、示されているタイトル数をVOBセットデータ列のタイトル数(TITLE_NO)に示す。
図27のVOBセットデータ構造は、VOBセットデータ列の1つのVOBセットをエンコードするためのデータの内容を示す。VOBセットデータ構造は、VOBセット番号(VOBS_NO)、VOBセット内のVOB番号(VOB_NO)、先行VOBシームレス接続フラグ(VOB_Fsb)、後続VOBシームレス接続フラグ(VOB_Fsf)、マルチシーンフラグ(VOB_Fp)、インターリーブフラグ(VOB_Fi)、マルチアングル(VOB_Fm)、マルチアングルシームレス切り替えフラグ(VOB_FsV)、インターリーブVOBの最大ビットレート(ILV_BR)、インターリーブVOBの分割数(ILV_DIV)、最小インターリーブユニット再生時間(ILV_MT)からなる。
VOBセット番号VOBS_NOは、例えばタイトルシナリオ再生順を目安につけるVOBセットを識別するための番号である。
VOBセット内のVOB番号VOB_NOは、例えばタイトルシナリオ再生順を目安に、タイトルシナリオ全体にわたって、VOBを識別するための番号である。
先行VOBシームレス接続フラグVOB_Fsbは、シナリオ再生で先行のVOBとシームレスに接続するか否かを示すフラグである。
後続VOBシームレス接続フラグVOB_Fsfは、シナリオ再生で後続のVOBとシームレスに接続するか否かを示すフラグである。
マルチシーンフラグVOB_Fpは、VOBセットが複数のVOBで構成しているか否かを示すフラグである。
インターリーブフラグVOB_Fiは、VOBセット内のVOBがインターリーブ配置するか否かを示すフラグである。
マルチアングルフラグVOB_Fmは、VOBセットがマルチアングルであるか否かを示すフラグである。
マルチアングルシームレス切り替えフラグVOB_FsVは、マルチアングル内の切り替えがシームレスであるか否かを示すフラグである。
インターリーブVOB最大ビットレートILV_BRは、インターリーブするVOBの最大ビットレートの値を示す。
インターリーブVOB分割数ILV_DIVは、インターリーブするVOBのインターリーブユニット数を示す。
最小インターリーブユニット再生時間ILVU_MTは、インターリーブブロック再生時に、トラックバッファのアンダーフローしない最小のインターリーブユニットに於いて、そのVOBのビットレートがILV_BRの時に再生できる時間を示す。
図28を参照して前述の、シナリオデータSt7に基づいてエンコードシステム制御部200が生成するVOB毎に対応するエンコード情報テーブルについて説明する。このエンコード情報テーブルを基に、ビデオエンコーダ300、サブピクチャエンコーダ500、オーディオエンコーダ700、システムエンコーダ900へ、後述する各VOBに対応するエンコードパラメータデータを生成する。図28に示されているVOBデータ列は、図34のステップ#100で、ユーザが指示するタイトル内容に基づき、DVDのマルチメディアストリーム生成のためにエンコードシステム制御内で作成するVOB毎のエンコード情報テーブルである。1つのエンコード単位をVOBとし、そのVOBをエンコードするために作成するデータをVOBデータ列としている。例えば、3つのアングルシーンで構成されるVOBセットは、3つのVOBから構成される事になる。図28のVOBデータ構造はVOBデータ列の1つのVOBをエンコードするためのデータの内容を示す。
VOBデータ構造は、ビデオ素材の開始時刻(VOB_VST)、ビデオ素材の終了時刻(VOB_VEND)、ビデオ素材の種類(VOB_V_KIND)、ビデオのエンコードビットレート(V_BR)、オーディオ素材の開始時刻(VOB_AST)、オーディオ素材の終了時刻(VOB_AEND)、オーディオエンコード方式(VOB_A_KIND)、オーディオのビットレート(A_BR)からなる。
ビデオ素材の開始時刻VOB_VSTは、ビデオ素材の時刻に対応するビデオエンコードの開始時刻である。
ビデオ素材の終了時刻VOB_VENDは、ビデオ素材の時刻に対応するビデオエンコードの終了時刻である。
ビデオ素材の種類VOB_V_KINDは、エンコード素材がNTSC形式かPAL形式のいづれかであるか、またはビデオ素材がテレシネ変換処理された素材であるか否かを示すものである。
ビデオのビットレートV_BRは、ビデオのエンコードビットレートである。
オーディオ素材の開始時刻VOB_ASTは、オーディオ素材の時刻に対応するオーディオエンコード開始時刻である。
オーディオ素材の終了時刻VOB_AENDは、オーディオ素材の時刻に対応するオーディオエンコード終了時刻である。
オーディオエンコード方式VOB_A_KINDは、オーディオのエンコード方式を示すものであり、エンコード方式にはAC−3方式、MPEG方式、リニアPCM方式などがある。
オーディオのビットレートA_BRは、オーディオのエンコードビットレートである。
図29に、VOBをエンコードするためのビデオ、オーディオ、システムの各エンコーダ300、500、及び900へのエンコードパラメータを示す。エンコードパラメータは、VOB番号(VOB_NO)、ビデオエンコード開始時刻(V_STTM)、ビデオエンコード終了時刻(V_ENDTM)、エンコードモード(V_ENCMD)、ビデオエンコードビットレート(V_RATE)、ビデオエンコード最大ビットレート(V_MRATE)、GOP構造固定フラグ(GOP_FXflag)、ビデオエンコードGOP構造(GOPST)、ビデオエンコード初期データ(V_INTST)、ビデオエンコード終了データ(V_ENDST)、オーディオエンコード開始時刻(A_STTM)、オーディオエンコード終了時刻(A_ENDTM)、オーディオエンコードビットレート(A_RATE)、オーディオエンコード方式(A_ENCMD)、オーディオ開始時ギャップ(A_STGAP)、オーディオ終了時ギャップ(A_ENDGAP)、先行VOB番号(B_VOB_NO)、後続VOB番号(F_VOB_NO)からなる。
VOB番号VOB_NOは、例えばタイトルシナリオ再生順を目安に、タイトルシナリオ全体にわたって番号づける、VOBを識別するための番号である。
ビデオエンコード開始時刻V_STTMは、ビデオ素材上のビデオエンコード開始時刻である。
ビデオエンコード終了時刻V_STTMは、ビデオ素材上のビデオエンコード終了時刻である。
エンコードモードV_ENCMDは、ビデオ素材がテレシネ変換された素材の場合には、効率よいエンコードができるようにビデオエンコード時に逆テレシネ変換処理を行うか否かなどを設定するためのエンコードモードである。
ビデオエンコードビットレートV_RATEは、ビデオエンコード時の平均ビットレートである。
ビデオエンコード最大ビットレートはV_MRATEは、ビデオエンコード時の最大ビットレートである。
GOP構造固定フラグGOP_FXflagは、ビデオエンコード時に途中で、GOP構造を変えることなくエンコードを行うか否かを示すものである。マルチアングルシーン中にシームレスに切り替え可能にする場合に有効なパラメータである。
ビデオエンコードGOP構造GOPSTは、エンコード時のGOP構造データである。
ビデオエンコード初期データV_INSTは、ビデオエンコード開始時のVBVバッファ(復号バッファ)の初期値などを設定する、先行のビデオエンコードストリームとシームレス再生する場合に有効なパラメータである。
ビデオエンコード終了データV_ENDSTは、ビデオエンコード終了時のVBVバッファ(復号バッファ)の終了値などを設定する。後続のビデオエンコードストリームとシームレス再生する場合に有効なパラメータである。
オーディオエンコーダ開始時刻A_STTMは、オーディオ素材上のオーディオエンコード開始時刻である。
オーディオエンコーダ終了時刻A_ENDTMは、オーディオ素材上のオーディオエンコード終了時刻である。
オーディオエンコードビットレートA_RATEは、オーディオエンコード時のビットレートである。
オーディオエンコード方式A_ENCMDは、オーディオのエンコード方式であり、AC−3方式、MPEG方式、リニアPCM方式などがある。
オーディオ開始時ギャップA_STGAPは、VOB開始時のビデオとオーディオの開始のずれ時間である。先行のシステムエンコードストリームとシームレス再生する場合に有効なパラメータである。
オーディオ終了時ギャップA_ENDGAPは、VOB終了時のビデオとオーディオの終了のずれ時間である。後続のシステムエンコードストリームとシームレス再生する場合に有効なパラメータである。
先行VOB番号B_VOB_NOは、シームレス接続の先行VOBが存在する場合にそのVOB番号を示すものである。
後続VOB番号F_VOB_NOは、シームレス接続の後続VOBが存在する場合にそのVOB番号を示すものである。
図34に示すフローチャートを参照しながら、本発明に係るDVDエンコーダECDの動作を説明する。なお、同図に於いて二重線で囲まれたブロックはそれぞれサブルーチンを示す。本実施形態は、DVDシステムについて説明するが、言うまでなくオーサリングエンコーダECについても同様に構成することができる。
ステップ#100に於いて、ユーザーは、編集情報作成部100でマルチメディアソースデータSt1、St2、及びSt3の内容を確認しながら、所望のシナリオに添った内容の編集指示を入力する。
ステップ#200で、編集情報作成部100はユーザの編集指示に応じて、上述の編集指示情報を含むシナリオデータSt7を生成する。
ステップ#200での、シナリオデータSt7の生成時に、ユーザの編集指示内容の内、インターリーブする事を想定しているマルチアングル、パレンタルのマルチシーン区間でのインターリーブ時の編集指示は、以下の条件を満たすように入力する。
まず画質的に十分な画質が得られるようなVOBの最大ビットレートを決定し、さらにDVDエンコードデータの再生装置として想定するDVDデコーダDCDのトラックバッファ量及びジャンプ性能、ジャンプ時間とジャンプ距離の値を決定する。上記値をもとに、式3、式4より、最小インターリーブユニットの再生時間を得る。
次に、マルチシーン区間に含まれる各シーンの再生時間をもとに式5及び式6が満たされるかどうか検証する。満たされなければ後続シーン一部シーンをマルチシーン区間の各シーン接続するなどの処理を行い式5及び式6を満たすようにユーザは指示の変更入力する。
さらに、マルチアングルの編集指示の場合、シームレス切り替え時には式7を満たすと同時に、アングルの各シーンの再生時間、オーディオは同一とする編集指示を入力する。また非シームレス切り替え時には式8を満たすようにユーザは編集指示を入力する。
ステップ#300で、エンコードシステム制御部200は、シナリオデータSt7に基づいて、先ず、対象シーンを先行シーンに対して、シームレスに接続するのか否かを判断する。シームレス接続とは、先行シーン区間が複数のシーンからなるマルチシーン区間である場合に、その先行マルチシーン区間に含まれる全シーンの内の任意の1シーンを、現時点の接続対象である共通シーンとシームレスに接続する。同様に、現時点の接続対象シーンがマールチシーン区間である場合には、マルチシーン区間の任意の1シーンを接続出来ると言うことを意味する。ステップ#300で、NO、つまり、非シームレス接続と判断された場合にはステップ#400へ進む。
ステップ#400で、エンコードシステム制御部200は、対象シーンが先行シーンとシームレス接続されることを示す、先行シーンシームレス接続フラグVOB_Fsbをリセットして、ステップ#600に進む。
一方、ステップ#300で、YES、つまり先行シートとシームレス接続すると判断された時には、ステップ#500に進む。
ステップ#500で、先行シーンシームレス接続フラグVOB_Fsbをセットして、ステップ#600に進む。
ステップ#600で、エンコードシステム制御部200は、シナリオデータSt7に基づいて、対象シーンを後続するシーンとシームレス接続するのか否かを判断する。ステップ#600で、NO、つまり非シームレス接続と判断された場合にはステップ#700へ進む。
ステップ#700で、エンコードシステム制御部200は、シーンを後続シーンとシームレス接続することを示す、後続シーンシームレス接続フラグVOB_Fsfをリセットして、ステップ#900に進む。
一方、ステップ#600で、YES、つまり後続シートとシームレス接続すると判断された時には、ステップ#800に進む。
ステップ#800で、エンコードシステム制御部200は、後続シーンシームレス接続フラグVOB_Fsfをセットして、ステップ#900に進む。
ステップ#900で、エンコードシステム制御部200は、シナリオデータSt7に基づいて、接続対象のシーンが一つ以上、つまり、マルチシーンであるか否かを判断する。マルチシーンには、マルチシーンで構成できる複数の再生経路の内、1つの再生経路のみを再生するパレンタル制御と再生経路がマルチシーン区間の間、切り替え可能なマルチアングル制御がある。
シナリオステップ#900で、NO、つまり非マルチシーン接続であると判断されて時は、ステップ#1000に進む。
ステップ#1000で、マルチシーン接続であることを示すマルチシーンフラグVOB_Fpをリセットして、エンコードパラメータ生成ステップ#1800に進む。ステップ#1800の動作については、あとで述べる。
一方、ステップ#900で、YES、つまりマルチシーン接続と判断された時には、ステップ#1100に進む。
ステップ#1100で、マルチシーンフラグVOB_Fpをセットして、マルチアングル接続かどうかを判断するステップ#1200に進む。
ステップ#1200で、マルチシーン区間中の複数シーン間での切り替えをするかどうか、すなわち、マルチアングルの区間であるか否かを判断する。ステップ#1200で、NO、つまり、マルチシーン区間の途中で切り替えずに、1つの再生経路のみを再生するパレンタル制御と判断された時には、ステップ#1300に進む。
ステップ#1300で、接続対象シーンがマルチアングルであること示すマルチアングルフラグVOB_Fmをリセットしてステップ#1302に進む。
ステップ#1302で、先行シーンシームレス接続フラグVOB_Fsb及び後続シーンシームレス接続フラグVOB_Fsfの何れかがセットされているか否かを判断する。ステップ#1300で、YES、つまり接続対象シーンは先行あるいは後続のシーンの何れかあるいは、両方とシームレス接続すると判断された時には、ステップ#1304に進む。
ステップ#1304では、対象シーンのエンコードデータであるVOBをインターリーブすることを示すインターリーブフラグVOB_Fiをセットして、ステップ#1800に進む。
一方、ステップ#1302で、NO、つまり、対象シーンは先行シーン及び後続シーンの何れともシームレス接続しない場合には、ステップ#1306に進む。
ステップ#1306でインターリーブフラッグVOB_Fiをリセットしてステップ#1800に進む。
一方、ステップ#1200で、YES、つまりマルチアングルであると判断された場合には、ステップ#1400に進む。
ステップ#1400では、マルチアングルフラッグVOB_Fm及びインターリーブフラッグVOB_Fiをセットした後ステップ#1500に進む。
ステップ#1500で、エンコードシステム制御部200はシナリオデータSt7に基づいて、マルチアングルシーン区間で、つまりVOBよりも小さな再生単位で、映像やオーディオを途切れることなく、いわゆるシームレスに切替られるのかを判断する。ステップ#1500で、NO、つまり、非シームレス切替と判断された時には、ステップ#1600に進む。
ステップ#1600で、対象シーンがシームレス切替であることを示すシームレス切替フラッグVOB_FsVをリセットして、ステップ#1800に進む。
一方、ステップ#1500、YES、つまりシームレス切替と判断された時には、ステップ#1700に進む。
ステップ#1700で、シームレス切替フラッグVOB_FsVをセットしてステップ#1800に進む。このように、本発明では、編集意思を反映したシナリオデータSt7から、編集情報が上述の各フラグのセット状態として検出されて後に、ステップ#1800に進む。
ステップ#1800で、上述の如く各フラグのセット状態として検出されたユーザの編集意思に基づいて、ソースストリームをエンコードするための、それぞれ図27及び図28に示されるVOBセット単位及びVOB単位毎のエンコード情報テーブルへの情報付加と、図29に示されるVOBデータ単位でのエンコードパラメータを作成する。次に、ステップ#1900に進む。このエンコードパラメータ作成ステップの詳細については、図35、図36、図37、図38を参照して後で説明する。
ステップ#1900で、ステップ#1800で作成してエンコードパラメータに基づいて、ビデオデータ及びオーディオデータのエンコードを行った後にステップ#2000に進む。尚、サブピクチャデータは、本来必要に応じて、ビデオ再生中に、随時挿入して利用する目的から、前後のシーン等との連続性は本来不要である。更に、サプピクチャは、およそ、1画面分の映像情報であるので、時間軸上に延在するビデオデータ及びオーディオデータと異なり、表示上は静止の場合が多く、常に連続して再生されるものではない。よって、シームレス及び非シームレスと言う連続再生に関する本実施形態に於いては、簡便化のために、サブピクチャデータのエンコードについては説明を省く。
ステップ#2000では、VOBセットの数だけステップ#300からステップ#1900までの各ステップから構成されるループをまわし、図16のタイトルの各VOBの再生順などの再生情報を自身のデータ構造にもつ、プログラムチェーン(VTS_PGC#I)情報をフォーマットし、マルチルチシーン区間のVOBをインターリーブ配置を作成し、そしてシステムエンコードするために必要なVOBセットデータ列及びVOBデータ列を完成させる。次に、ステップ#2100に進む。
ステップ#2100で、ステップ#2000までのループの結果として得られる全VOBセット数VOBS_NUMを得て、VOBセットデータ列に追加し、さらにシナリオデータSt7に於いて、シナリオ再生経路の数をタイトル数とした場合の、タイトル数TITLE_NOを設定して、エンコード情報テーブルとしてのVOBセットデータ列を完成した後、ステップ#2200に進む。
ステップ#2200で、ステップ#1900でエンコードしたビデオエンコードストリーム、オーディオエンコードストリーム、図29のエンコードパラメータに基づいて、図16のVTSTT_VOBS内のVOB(VOB#i)データを作成するためのシステムエンコードを行う。次に、ステップ#2300に進む。
ステップ#2300で、図16のVTS情報、VTSIに含まれるVTSI管理テーブル(VTSI_MAT)、VTSPGC情報テーブル(VTSPGCIT)及び、VOBデータの再生順を制御するプログラムチェーン情報(VTS_PGCI#I)のデータ作成及びマルチシーン区間に含めれるVOBのインターリーブ配置などの処理を含むフォーマットを行う。
図35、図36、及び図37を参照して、図34に示すフローチャートのステップ#1800のエンコードパラメータ生成サブルーチンに於ける、マルチアングル制御時のエンコードパラメータ生成の動作を説明する。
先ず、図35を参照して、図34のステップ#1500で、NOと判断された時、つまり各フラグはそれぞれVOB_Fsb=1またはVOB_Fsf=1、VOB_Fp=1、VOB_Fi=1、VOB_Fm=1、FsV=0である場合、すなわちマルチアングル制御時の非シームレス切り替えストリームのエンコードパラメータ生成動作を説明する。以下の動作で、図27、図28に示すエンコード情報テーブル、図29に示すエンコードパラメータを作成する。
ステップ#1812では、シナリオデータSt7に含まれているシナリオ再生順を抽出し、VOBセット番号VOBS_NOを設定し、さらにVOBセット内の1つ以上のVOBに対して、VOB番号VOB_NOを設定する。
ステップ#1814では、シナリオデータSt7より、インターリーブVOBの最大ビットレートILV_BRを抽出、インターリーブフラグVOB_Fi=1に基づき、エンコードパラメータのビデオエンコード最大ビットレートV_MRATEに設定。
ステップ#1816では、シナリオデータSt7より、最小インターリーブユニット再生時間ILVU_MTを抽出。
ステップ#1818では、マルチアングルフラグVOB_Fp=1に基づき、ビデオエンコードGOP構造GOPSTのN=15、M=3の値とGOP構造固定フラグGOPFXflag=“1”に設定。
ステップ#1820は、VOBデータ設定の共通のルーチンである。図36に、ステップ#1820のVOBデータ共通設定ルーチンを示す。以下の動作フローで、図27、図28に示すエンコード情報テーブル、図29に示すエンコードパラメータを作成する。
ステップ#1822では、シナリオデータSt7より、各VOBのビデオ素材の開始時刻VOB_VST、終了時刻VOB_VENDを抽出し、ビデオエンコード開始時刻V_STTMとエンコード終了時刻V_ENDTMをビデオエンコードのパラメータとする。
ステップ#1824では、シナリオデータSt7より、各VOBのオーディオ素材の開始時刻VOB_ASTを抽出し、オーディオエンコード開始時刻A_STTMをオーディオエンコードのパラメータとする。
ステップ#1826では、シナリオデータSt7より、各VOBのオーディオ素材の終了時刻VOB_AENDを抽出し、VOB_AENDを超えない時刻で、オーディオエンコード方式できめられるオーディオアクセスユニット(以下AAUと記述する)単位の時刻を、オーディオエンコードのパラメータである、エンコード終了時刻A_ENDTMとする。
ステップ#1828は、ビデオエンコード開始時刻V_STTMとオーディオエンコード開始時刻A_STTMの差より、オーディオ開始時ギャップA_STGAPをシステムエンコードのパラメータとする。
ステップ#1830では、ビデオエンコード終了時刻V_ENDTMとオーディオエンコード終了時刻A_ENDTMの差より、オーディオ終了時ギャップA_ENDGAPをシステムエンコードのパラメータとする。
ステップ#1832では、シナリオデータSt7より、ビデオのビットレートV_BRを抽出し、ビデオエンコードの平均ビットレートとして、ビデオエンコードビットレートV_RATEをビデオエンコードのパラメータとする。
ステップ#1834では、シナリオデータSt7より、オーディオのビットレートA_BRを抽出し、オーディオエンコードビットレートA_RATEをオーディオエンコードのパラメータとする。
ステップ#1836では、シナリオデータSt7より、ビデオ素材の種類VOB_V_KINDを抽出し、フィルム素材、すなわちテレシネ変換された素材であれば、ビデオエンコードモードV_ENCMDに逆テレシネ変換を設定し、ビデオエンコードのパラメータとする。
ステップ#1838では、シナリオデータSt7より、オーディオのエンコード方式VOB_A_KINDを抽出し、オーディオエンコードモードA_ENCMDにエンコード方式を設定し、オーディオエンコードのパラメータとする。
ステップ#1840では、ビデオエンコード初期データV_INSTのVBVバッファ初期値が、ビデオエンコード終了データV_ENDSTのVBVバッファ終了値以下の値になるように設定し、ビデオエンコードのパラメータとする。
ステップ#1842では、先行VOBシームレス接続フラグVOB_Fsb=1に基づき、先行接続のVOB番号VOB_NOを先行接続のVOB番号B_VOB_NOに設定し、システムエンコードのパラメータとする。
ステップ#1844では、後続VOBシームレス接続フラグVOB_Fsf=1に基づき、後続接続のVOB番号VOB_NOを後続接続のVOB番号F_VOB_NOに設定し、システムエンコードのパラメータとする。
以上のように、マルチアングルのVOBセットであり、非シームレスマルチアングル切り替えの制御の場合のエンコード情報テーブル及びエンコードパラメータが生成できる。
次に、図37を参照して、図34に於いて、ステップ#1500で、Yesと判断された時、つまり各フラグはそれぞれVOB_Fsb=1またはVOB_Fsf=1、VOB_Fp=1、VOB_Fi=1、VOB_Fm=1、VOB_FsV=1である場合の、マルチアングル制御時のシームレス切り替えストリームのエンコードパラメータ生成動作を説明する。
以下の動作で、図27、図28に示すエンコード情報テーブル、及び図29に示すエンコードパラメータを作成する。
ステップ#1850では、シナリオデータSt7に含まれているシナリオ再生順を抽出し、VOBセット番号VOBS_NOを設定し、さらにVOBセット内の1つ以上のVOBに対して、VOB番号VOB_NOを設定する。
ステップ#1852では、シナリオデータSt7より、インターリーブVOBの最大ビットレートいLV_BRを抽出、インターリーブフラグVOB_Fi=1に基づき、ビデオエンコード最大ビットレートV_RATEに設定。
ステップ#1854では、シナリオデータSt7より、最小インターリーブユニット再生時間ILVU_MTを抽出。
ステップ#1856では、マルチアングルフラグVOB_Fp=1に基づき、ビデオエンコードGOP構造GOPSTのN=15、M=3の値とGOP構造固定フラグGOPFXflag=“1”に設定。
ステップ#1858では、シームレス切り替えフラグVOB_FsV=1に基づいて、ビデオエンコードGOP構造GOPSTにクローズドGOPを設定、ビデオエンコードのパラメータとする。
ステップ#1860は、VOBデータ設定の共通のルーチンである。この共通のルーチンは図35に示しているルーチンであり、既に説明しているので省略する。
以上のようにマルチアングルのVOBセットで、シームレス切り替え制御の場合のエンコードパラメータが生成できる。
次に、図38を参照して、図34に於いて、ステップ#1200で、NOと判断され、ステップ1304でYESと判断された時、つまり各フラグはそれぞれVOB_Fsb=1またはVOB_Fsf=1、VOB_Fp=1、VOB_Fi=1、VOB_Fm=0である場合の、パレンタル制御時のエンコードパラメータ生成動作を説明する。以下の動作で、図27、図28に示すエンコード情報テーブル、及び図29に示すエンコードパラメータを作成する。
ステップ#1870では、シナリオデータSt7に含まれているシナリオ再生順を抽出し、VOBセット番号VOBS_NOを設定し、さらにVOBセット内の1つ以上のVOBに対して、VOB番号VOB_NOを設定する。
ステップ#1872では、シナリオデータSt7より、インターリーブVOBの最大ビットレートILV_BRを抽出、インターリーブフラグVOB_Fi=1に基づき、ビデオエンコード最大ビットレートV_RATEに設定する。
ステップ#1874では、シナリオデータSt7より、VOBインターリーブユニット分割数ILV_DIVを抽出する。
ステップ#1876は、VOBデータ設定の共通のルーチンである。この共通のルーチンは図35に示しているルーチンであり、既に説明しているので省略する。
以上のようにマルチシーンのVOBセットで、パレンタル制御の場合のエンコードパラメータが生成できる。
次に、図53を参照して、図34に於いて、ステップ#900で、NOと判断された時、つまり各フラグはそれぞれVOB_Fp=0である場合の、すなわち単一シーンのエンコードパラメータ生成動作を説明する。以下の動作で、図27、図28に示すエンコード情報テーブル、及び図29に示すエンコードパラメータを作成する。
ステップ#1880では、シナリオデータSt7に含まれているシナリオ再生順を抽出し、VOBセット番号VOBS_NOを設定し、さらにVOBセット内の1つ以上のVOBに対して、VOB番号VOB_NOを設定する。
ステップ#1882では、シナリオデータSt7より、インターリーブVOBの最大ビットレートILV_BRを抽出、インターリーブフラグVOB_Fi=1に基づき、ビデオエンコード最大ビットレートV_MRATEに設定。
ステップ#1884は、VOBデータ設定の共通のルーチンである。この共通のルーチンは図35に示しているルーチンであり、既に説明しているので省略する。
上記ようなエンコード情報テーブル作成、エンコードパラメータ作成フローによって、DVDのビデオ、オーディオ、システムエンコード、DVDのフォーマッタのためのエンコードパラメータは生成できる。
デコーダのフローチャート
ディスクからストリームバッファ転送フロー
以下に、図47および図48を参照して、シナリオ選択データSt51に基づいてデコードシステム制御部2300が生成するデコード情報テーブルについて説明する。デコード情報テーブルは、図47に示すデコードシステムテーブルと、図48に示すデコードテーブルから構成される。
図47に示すようにデコードシステムテーブルは、シナリオ情報レジスタ部とセル情報レジスタ部からなる。シナリオ情報レジスタ部は、シナリオ選択データSt51に含まれるユーザの選択した、タイトル番号等の再生シナリオ情報を抽出して記録する。セル情報レジスタ部は、シナリオ情報レジスタ部は抽出されたユーザの選択したシナリオ情報に基いてプログラムチェーンを構成する各セル情報を再生に必要な情報を抽出して記録する。
更に、シナリオ情報レジスタ部は、アングル番号レジスタANGLE_NO_reg、VTS番号レジスタVTS_NO_reg、PGC番号レジスタVTS_PGCI_NO_reg、オーディオIDレジスタAUDIO_ID_reg、副映像IDレジスタSP_ID_reg、及びSCR用バッファレジスタSCR_bufferを含む。
アングル番号レジスタANGLE_NO_regは、再生するPGCにマルチアングルが存在する場合、どのアングルを再生するかの情報を記録する。VTS番号レジスタVTS_NO_regは、ディスク上に存在する複数のVTSのうち、次に再生するVTSの番号を記録する。PGC番号レジスタVTS_PGCI_NO_regは、パレンタル等の用途でVTS中存在する複数のPGCのうち、どのPGCを再生するかを指示する情報を記録する。オーディオIDレジスタAUDIO_ID_regは、VTS中存在する複数のオーディオストリームの、どれを再生するかを指示する情報を記録する。副映像IDレジスタSP_ID_regは、VTS中に複数の副映像ストリームが存在する場合は、どの副映像ストリームを再生するか指示する情報を記録する。SCR用バッファSCR_bufferは、図19に示すように、パックヘッダに記述されるSCRを一時記憶するバッファである。この一時記憶されたSCRは、図26を参照して説明したように、ストリーム再生データSt63としてデコードシステム制御部2300に出力される。
セル情報レジスタ部は、セルブロックモードレジスタCBM_reg、セルブロックタイプレジスタCBT_reg、シームレス再生フラグレジスタSPB_reg、インターリーブアロケーションフラグレジスタIAF_reg、STC再設定フラグレジスタSTCDF_reg、シームレスアングル切り替えフラグレジスタSACF_reg、セル最初のVOBU開始アドレスレジスタC_FVOBU_SA_reg、セル最後のVOBU開始アドレスレジスタC_LVOBU_SA_regを含む。
セルブロックモードレジスタCBM_regは複数のセルが1つの機能ブロックを構成しているか否かを示し、構成していない場合は値として“N_BLOCK”を記録する。また、セルが1つの機能ブロックを構成している場合、その機能ブロックの先頭のセルの場合“F_CELL”を、最後のセルの場合“L_CELL”を、その間のセルの場合“BLOCK”を値として記録する。
セルブロックタイプレジスタCBT_regは、セルブロックモードレジスタCBM_regで示したブロックの種類を記録するレジスタであり、マルチアングルの場合“A_BLOCK”を、マルチアングルでない場合“N_BLOCK”を記録する。
シームレス再生フラグレジスタSPF_regは、該セルが前に再生されるセルまたはセルブロックとシームレスに接続して再生するか否かを示す情報を記録する。前セルまたは前セルブロックとシームレスに接続して再生する場合には、値として“SML”を、シームレス接続でない場合は値として“NSML”を記録する。
インターリーブアロケーションフラグレジスタIAF_regは、該セルがインターリーブ領域に配置されているか否かの情報を記録する。インターリーブ領域に配置されている場合には値として“ILVB”を、インターリーブ領域に配置されていない場合は“N_ILVB”を記録する。
STC再設定フラグレジスタSTCDF_regは、同期をとる際に使用するSTC(System Time Clock)をセルの再生時に再設定する必要があるかないかの情報を記録する。再設定が必要な場合には値として“STC_RESET”を、再設定が不要な場合には値として、“STC_NRESET”を記録する。
シームレスアングルチェンジフラグレジスタSACF_regは、該セルがアングル区間に属しかつ、シームレスに切替えるかどうかを示す情報を記録する。アングル区間でかつシームレスに切替える場合には値としで“SML”を、そうでない場合は“NSML”を記録する。
セル最初のVOBU開始アドレスレジスタC_FVOBU_SA_regは、セル先頭VOBU開始アドレスを記録する。その値はVTSタイトル用VOBS(VTSTT_VOBS)の先頭セルの論理セクタからの距離をセクタ数で示し、該セクタ数を記録する。
セル最後のVOBU開始アドレスレジスタC_LVOBU_SA_regは、セル最終VOBU開始アドレスを記録する。その値は、VTSタイトル用VOBS(VTSTT_VOBS)の先頭セルの論理セクタから距離をセクタ数で示し、該セクタ数を記録する。
次に、図48のデコードテーブルについて説明する。同図に示すようにデコードテーブルは、非シームレスマルチアングル情報レジスタ部、シームレスマルチアングル情報レジスタ部、VOBU情報レジスタ部、シームレス再生レジスタ部からなる。
非シームレスマルチアングル情報レジスタ部は、NSML_AGL_C1_DSTA_reg〜NSML_AGL_C9_DSTA_regを含む。
NSML_AGL_C1_DSTA_reg〜NSML_AGL_C9_DSTA_regには、図20に示すPCIパケット中のNSML_AGL_C1_DSTA〜NSML_AGL_C9_DSTAを記録する。
シームレスマルチアングル情報レジスタ部は、SML_AGL_C1_DSTA_reg〜SML_AGL_C9_DSTA_regを含む。
SML_AGL_C1_DSTA_reg〜SML_AGL_C9_DSTA_regには、図20に示すDSIパケット中のSML_AGL_C1_DSTA〜SML_AGL_C9_DSTAを記録する。
VOBU情報レジスタ部は、VOBU最終アドレスレジスタVOBU_EA_regを含む。
VOBU情報レジスタVOBU_EA_regには、図20に示すDSIパケット中のVOBU_EAを記録する。
シームレス再生レジスタ部は、インターリーブユニットフラグレジスタILVU_flag_reg、ユニットエンドフラグレジスタUNIT_END_flag_reg、ILVU最終パックアドレスレジスタILVU_EA_reg、次のインターリーブユニット開始アドレスNT_ILVU_SA_reg、VOB内先頭ビデオフレーム表示開始時刻レジスタVOB_V_SPTM_reg、VOB内最終ビデオフレーム表示終了時刻レジスタVOB_V_EPTM_reg、オーディオ再生停止時刻1レジスタVOB_A_GAP_PTM1_reg、オーディオ再生停止時刻2レジスタVOB_A_GAP_PTM2_reg、オーディオ再生停止期間1レジスタVOB_A_GAP_LEN1、オーディオ再生停止期間2レジスタVOB_A_GAP_LEN2を含む。
インターリーブユニットフラグレジスタILVU_flag_regはVOBUが、インターリーブ領域に存在するかを示すものであり、インターリーブ領域に存在する場合“ILVU”を、インターリーブ領域に存在しない場合“N_ILVU”を記録する。
ユニットエンドフラグレジスタUNIT_END_flag_regは、VOBUがインターリーブ領域に存在する場合、該VOBUがILVUの最終VOBUかを示す情報を記録する。ILVUは、連続読み出し単位であるので、現在読み出しているVOBUが、ILVUの最後のVOBUであれば“END”を、最後のVOBUでなければ“N_END”を記録する。
ILVU最終パックアドレスレジスタILVU_EA_regは、VOBUがインターリーブ領域に存在する場合、該VOBUが属するILVUの最終パックのアドレスを記録する。ここでアドレスは、該VOBUのNVからのセクタ数である。
次のILVU開始アドレスレジスタNT_ILVU_SA_regは、VOBUがインターリーブ領域に存在する場合、次のILVUの開始アドレスを記録する。ここでアドレスは、該VOBUのNVからのセクタ数である。
VOB内先頭ビデオフレーム表示開始時刻レジスタVOB_V_SPTM_regは、VOBの先頭ビデオフレームの表示を開始する時刻を記録する。
VOB内最終ビデオフレーム表示終了時刻レジスタVOB_V_EPTM_regは、VOBの最終ビデオフレームの表示が終了する時刻を記録する。
オーディオ再生停止時刻1レジスタVOB_A_GAP_PTM1_regは、オーディオ再生を停止させる時間を、オーディオ再生停止期間1レジスタVOB_A_GAP_LEN1_regはオーディオ再生を停止させる期間を記録する。
オーディオ再生停止時刻2レジスタVOB_A_GAP_PTM2_regおよび、オーディオ再生停止期間2レジスタVOB_A_GAP_LEN2に関しても同様である。
次に図49示すDVDデコーダフローを参照しながら、図26にブロック図を示した本発明に係るDVDデコーダDCDの動作を説明する。
ステップ#310202はディスクが挿入されたかを評価するステップであり、ディスクがセットされればステップ#310204へ進む。
ステップ#310204に於いて、図22のボリュームファイル情報VFSを読み出した後に、ステップ#310206に進む。
ステップ#310206では、図22に示すビデオマネージャVMGを読み出し、再生するVTSを抽出して、ステップ#310208に進む。
ステップ#310208では、VTSの管理テーブルVTSIより、ビデオタイトルセットメニューアドレス情報VTSM_C_ADTを抽出して、ステップ#310210に進む。
ステップ#310210では、VTSM_C_ADT情報に基づき、ビデオタイトルセットメニューVTSM_VOBSをディスクから読み出し、タイトル選択メニューを表示する。このメニューに従ってユーザーはタイトルを選択する。この場合、タイトルだけではなく、オーディオ番号、副映像番号、マルチアングルを含むタイトルであれば、アングル番号を入力する。ユーザーの入力が終われば、次のステップ#310214へ進む。
ステップ#310214で、ユーザーの選択したタイトル番号に対応するVTS_PGCI#Jを管理テーブルより抽出した後に、ステップ#310216に進む。
次のステップ#310216で、PGCの再生を開始する。PGCの再生が終了すれば、デコード処理は終了する。以降、別のタイトルを再生する場合は、シナリオ選択部でユーザーのキー入力があればステップ#310210のタイトルメニュー表示に戻る等の制御で実現できる。
次に、図50を参照して、先に述べたステップ#310216のPGCの再生について、更に詳しく説明する。PGC再生ステップ#310216は、図示の如く、ステップ#31030、#31032、#31034、及び#31035よりなる。
ステップ#31030では、図47に示したデコードシステムテーブルの設定を行う。アングル番号レジスタANGLE_NO_reg、VTS番号レジスタVTS_NO_reg、PGC番号レジスタPGC_NO_reg、オーディオIDレジスタAUDIO_ID_reg、副映像IDレジスタSP_ID_regは、シナリオ選択部2100でのユーザー操作によって設定する。
ユーザーがタイトルを選択することで、再生するPGCが一意に決まると、該当するセル情報(C_PBI)を抽出し、セル情報レジスタに設定する。設定するレジスタは、CBM_reg、CBT_reg、SPF_reg、IAF_reg、STCDF_reg、SACF_reg、C_FVOBU_SA_reg、C_LVOBU_SA_regである。
デコードシステムテーブルの設定後、ステップ#31032のストリームバッファへのデータ転送処理と、ステップ#31034のストリームバッファ内のデータデコード処理を並列に起動する。
ここで、ステップ#31032のストリームバッファへのデータ転送処理は、図26に於いて、ディスクMからストリームバッファ2400へのデータ転送に関するものである。すなわち、ユーザーの選択したタイトル情報、およびストリーム中に記述されている再生制御情報(ナブパックNV)に従って、必要なデータをディスクMから読み出し、ストリームバッファ2400に転送する処理である。
一方、ステップ#31034は、図26に於いて、ストリームバッファ2400内のデータをデコードし、ビデオ出力3600およびオーディオ出力3700へ出力する処理を行う部分である。すなわち、ストリームバッファ2400に蓄えられたデータをデコードして再生する処理である。
このステップ#31032と、ステップ#31034は並列に動作する。
ステップ#31032について以下、更に詳しく説明する。
ステップ#31032の処理はセル単位であり、1つのセルの処理が終了すると次のステップ#31035でPGCの処理が終了したかを評価する。PGCの処理が終了していなければ、ステップ#31030で次のセルに対応するデコードシステムテーブルの設定を行う。この処理をPGCが終了するまで行う。
ストリームバッファからのデコードフロー
次に図51を参照して、図50に示したステップ#31034のストリームバッファ内のデコード処理について説明する。
ステップ#31034は、図示の如くステップ#31110、ステップ#31112、ステップ#31114、ステップ#31116からなる。
ステップ#31110は、図26に示すストリームバッファ2400からシステムデコーダ2500へのパック単位でのデータ転送を行い、ステップ#31112へ進む。
ステップ#31112は、ストリームバッファ2400から転送されるパックデータを各バッファ、すなわち、ビデオバッファ2600、サブピクチャバッファ2700、オーディオバッファ2800へのデータ転送を行う。
ステップ#31112では、ユーザの選択したオーディオおよび副映像のID、すなわち図47に示すシナリオ情報レジスタに含まれるオーディオIDレジスタAUDIO_ID_reg、副映像IDレジスタSP_ID_regと、図19に示すパケットヘッダ中の、ストリームIDおよびサブストリームIDを比較して、一致するパケットをそれぞれのバッファ(ビデオバッファ2600、オーディオバッファ2700、サブピクチャバッファ2800)へ振り分け、ステップ#31114へ進む。
ステップ#31114は、各デコーダ(ビデオデコーダ、サブピクチャデコーダ、オーディオデコーダ)のデコードタイミングを制御する、つまり、各デコーダ間の同期処理を行い、ステップ#31116へ進む。
ステップ#31114の各デコーダの同期処理の詳細は後述する。
ステップ#31116は、各エレメンタリのデコード処理を行う。つまり、ビデオデコーダはビデオバッファからデータを読み出しデコード処理を行う。サブピクチャデコーダも同様に、サブピクチャバッファからデータを読み出しデコード処理を行う。オーディオデコーダも同様にオーディオデコーダバッファからデータを読み出しデコード処理を行う。デコード処理が終われば、ステップ#31034を終了する。
次に、図52を参照して、先に述べたステップ#31114について更に詳しく説明する。
ステップ#31114は、図示の如く、ステップ#31120、ステップ#31122、ステップ#31124からなる。
ステップ#31120は、先行するセルと該セルがシームレス接続かを評価するステップであり、シームレス接続であればステップ#31122へ進み、そうでなければステップ#31124へ進む。
ステップ#31122は、シームレス用の同期処理を行う。
一方、ステップ#31124は、非シームレス用の同期処理を行う。
ビデオエンコーダ
図25のビデオエンコーダ300に入力するビデオデータSt1の素材としては、フィルムで撮影された映画などがあるがDVDなどに記録されるマルチメディアビットストリームは、家庭用のテレビ受像機に接続されることを前提としている。また、マルチメディアビットストリームのエンコードの際に、ビデオソースの編集の容易さから、図25のオーサリングエンコーダへの素材の供給にはデジタルのVTRが一般的に使用される。フィルムのフレームレートは毎秒24フレームであり、NTSCの家庭用のテレビ受像機やデジタルVTRに於いては、ビデオのフレームレートは毎秒29.97フレームであるので、フィルムで撮影された映画素材を、テレシネ変換と呼ばれるフレームレート変換手法によってレート変換を行って後、ディジタルVTRに記録される映像信号が作成される。
図39を参照して、本発明に於ける逆テレシネ変換回路の1実施形態を説明する。図39は、本発明に於ける逆テレシネ変換回路を図25のビデオエンコーダ300に組み込こまれたビデオエンコーダ300Aの詳細な構造を示す。ビデオエンコーダ300Aは、フレームメモリ304、306、フィールド間差分器308、閾値判定器310、テレシネ周期判定器312、セレクタ314、符号化装置316から構成される。
入力制御器302は、図25に示す編集情報作成部100及びエンコードシステム制御部200に接続されて、それぞれビデオ信号St1及びタイミング信号St9の供給を受ける。そのビデオ信号St1がテレシネ画像である場合には、ビデオエンコーダへの制御データとして用いられる逆テレシネ変換を指示する情報を含んでいる。
テレシネ画像RT1はフレームメモリ304で、1フレーム分だけ保持された後に、1フレーム遅延テレシネ画像RT2としてフレームメモリ306、セレクタ314、及びフィールド差分器308に入力される。
フィールド差分器308では、1フレーム遅延テレシネ画像RT2と[入力制御器302から入力された]現フレームのテレシネ画像RT1の同一パリティのフィールド間差分が集計される。集計された結果は、差分値RT3として、閾値判定器310に入力される。
閾値判定器310では、差分値RT3を所定の閾値と比較し、その比較結果を示す比較結果信号RT5をテレシネ周期判定回路312に入力する。
テレシネ周期判定回路312は、比較結果信号RT5に基づいて、内部で周期情報RT6を生成して、その周期情報RT6に基づいて、テレシネ周期にあった出力画像を出力するようセレクタ314を制御するセレクタ制御信号RT7をセレクタ314に出力する。テレシネ周期判定回路312は、各フレームについて冗長フィールドを削除したかどうかを示すリピートファーストフィールドフラグRFFと、フレームの2つのフィールドの表示順を示すトップフィールドファーストフラグTFFと、符号化装置316に入力されるフレームをエンコードするか否かを示す出力画像有効フラグIEFを符号化装置に出力する。
フレームメモリ304からの出力された1フレーム遅延テレシネ画像RT2は、フレームメモリ306で更に、もう1フレーム保持されて、2フレーム遅延テレシネ画像RT4が生成される。この画像RT4は、セレクタ314に入力される。
セレクタ314は、フレームメモリ304から入力された1フレーム遅延テレシネ画像RT2、フレームメモリ306から入力された2フレーム遅延テレシネ画像RT4、及びテレシネ周期判定器312から入力されてたセレクタ制御信号RT7に基づいて、1フレーム遅延テレシネ画像RT2と2フレーム遅延テレシネ画像RT4のいずれかから、トップフィールド及びボトムフィールドを選択して逆テレシネ画像RT8を生成する。この逆テレシネ画像RT8は符号化装置316に出力される。
符号化装置316は、セレクタ314から入力された逆テレシネ画像RT8と、テレシネ周期判定回路312から入力されたフラグTFF、RFF、及びIEFを圧縮符号化する。
図32に、フィルム素材、フィルム素材からテレシネ変換によって作成されるNTSCビデオ信号であるテレシネ画像と、上述の逆テレシネ変換回路を組み込んだビデオエンコーダ300Aによって、エンコードつまり、逆テレシネ変換された逆テレシネ画像、そのエンコードデータからデコードされる再生映像を示す。
第1段目には、毎秒24フレームのフィルム画像IFを示す。
第2段目には、第1段目のフィルム画像からテレシネ変換したNTSC信号であるテレシネ画像RT1を示す。
第3段目には、第2段目のテレシネ画像をビデオエンコード時に、冗長なフィールドを検出し、削除する逆テレシネ変換をおこなった逆テレシネ画像RT8とビデオエンコード時のフラグデータであるリピートファーストフィールドフラグRFFと、トップフィールドファーストフラグTFFとを示す。RFFは、フレームを構成する時間的に先のフィールドを次の再生フレームの1つのフィールドとして使用する事を示したものであり、TFFは、フレームを構成する時間的に先のフィールドはトップフィールドである事を示す。
第4段目には、第3段目の逆テレシネ画像のエンコードデータをビデオデコードした時に得られる再生画像IRのNTSC信号を示す。
テレシネ変換は基本的には図32に示すように、周期的に同一パリティのフィールドをコピーした冗長フィールドを挿入することによって、フレームレートの変換が実現される。フィルム画像IFは、毎秒24フレームのフィルム画像であり、このフレームF1のトップフィールドF1tがコピーされ、また、フレームF3のボトムフィールドF3bがコピーされて、フレームF1からフレームF4までの4フレームが、テレシネ画像RT1のフレームF‘1からフレームF’5の5フレームに変換される。
このようにして得られたテレシネ後のビデオ信号であるテレシネ画像RT1を圧縮符号化する際に、ビデオのフレームレートそのままで圧縮符号化を行ったのではコピーされた冗長フィールドまでも符号化することになり、効率が悪くなる。従って、通常、コピーされた冗長フィールドを検出し、削除、つまり逆テレシネ変換した後に圧縮符号化を行い、各フレームについて冗長フィールドを削除したかどうかを示すリピートファーストフィールドフラグRFFと、フレームの2つのフィールドの表示順を示すトップフィールドファーストフラグTFFとを付加して記録する。
フィルムのフレームレートとビデオのフレームレートとは簡単な整数比の関係になっていないため、周期的な処理の合間に通常と異なる変換パターンが挟まれることになる。図に示すように、テレシネ変換はフィルムの4フレーム相当分を5フレームに変換して、毎秒24フレームレートから毎秒約30フレームレートにしている。テレシネ画像は、このように基本的にはテレシネ画像の5フレームの周期で、規則的な変換処理が施され、そのフレーム毎の周期をテレシネ周期とする。それぞれのテレシネ周期で、テレシネ画像から逆テレシネ画像を得る処理が変わる。
図42に示すタイミングチャートを参照して、上記の逆テレシネ変換回路300Aの動作を説明する。
第1段目に、テレシネ画像入力RT1、1フレーム遅延テレシネ画像RT2、差分値RT3、及び2フレーム遅延テレシネ画像RT4を順番に示す。
第2段目に、比較結果信号RT5の出力タイミングを示す。
第3段目に、テレシネ画像の周期情報RT6を示す。同図に於いて、周期情報はステート(state)として表示されている。
第4段目に、セレクタ制御信号RT7を示す。第5段目に、逆テレシネ画像RT8出力を示す。第6段目に、トップフィールドファーストフラグTFF、リピートファーストフィールドフラグRFF及び出力画像有効フラグIEFを示す。
最初の周期であるステート0では、テレシネ画像RT1のフレームF1‘とF2’のフレームメモリ304、306への入力が完了した時点で開始され、テレシネ画像のフレームF1‘を構成するフィールドF1tとF1bで逆テレシネ画像RT8を構成し、TFF=1を設定し、F2’のトップフィールドがF1tと同様であるので、次フレームの再生時に、フィールドを複製(コピー)するので、RFF=1を設定する。
ステート1では、テレシネ画像RT1のフレームF2‘とF3’のフレームメモリ304、306への入力が完了した時点で開始され、テレシネ画像RT1のF2‘のボトムフィールドであるF2bとF3’のトップフィールドであるF2tで逆テレシネ画像RT8を構成し、ボトムフィールドが時間的に先になるフレーム構成になるので、TFF=0を設定、フィールドの複製がないのでRFF=0を設定する。
ステート2では、テレシネ画像RT1のフレームF3‘とF4’のフレームメモリ304、306への入力が完了した時点で開始され、テレシネ画像のF3‘のボトムフィールドであるF3bとF4’のトップフィールドであるF3tで逆テレシネ画像RT8を構成し、ボトムフィールドが時間的に先になるフレーム構成になるので、TFF=0を設定、F4‘のボトムフィールドがF3bと同様であるので、次フレームの再生時に、フィールドを複製(コピー)するので、RFF=1を設定する。
ステート3では、テレシネ画像RT1のフレームF4‘とF5’のフレームメモリ304、306への入力が完了した時点で開始され、テレシネ画像のF5‘のF4tとF4bで逆テレシネ画像RT8を構成し、トップフィールドが時間的に先になるフレーム構成になるので、TFF=1を設定、次フレームの再生時に、フィールドを複製(コピー)しないので、RFF=0を設定する。
ステート4では、テレシネ画像RT1のフレームF5‘と次の周期のF1’のフレームメモリ304、306への入力が完了した時点で開始されるが、この周期では、逆テレシネ画像RT8を生成しない。
以上のようなステート0からステート4を繰り返して、逆テレシネ画像RT8を生成し、エンコードをおこなっている。
先に、図32に示したテレシネ画像RT1から逆テレシネ画像RT8への変換が逆テレシネ変換であり、連続するトップフィールド同士、ボトムフィールド同士のフィールド間の差分を予め決められた閾値と比較し、これより小さい場合にはコピーフィールドと判断し、該当のフィールドを削除する。同時に前述のRFF、TFFのフラグを図に示すように生成する。
再生時には、これらのフラグにより再生画像IRに示すように簡単にもとのテレシネ画像が再現できることになる。即ち、逆テレシネ画像RT8のフレームF1では、TFF=1であるので、F1のトップフィールドF1tを先に出力し、次にF1のボトムフィールドF1bを出力する。そして、RFF=1であるので、ファーストフィールド、即ちF1tをもう一度出力する。
フレームF2については、TFF=0であるので、F2のボトムフィールドF2bを先に出力し、次にF2のトップフィールドF2tを出力する。2度目に出力されたF1tとF2bが新たに1つのフレームF2‘を構成することになる。フレームF3ではTFF=0であるので、ボトムフィールドF3bが先に、トップフィールドF3tが後で出力され、RFF=1であるので、再度ボトムフィールドF3bが出力される。フレームF4ではTFF=1であるので、トップフィールドF4tが先に、ボトムフィールドF4bが後で出力される。このようにして、テレシネ画像RT1がフラグにより再生できる。
図42に於いて、テレシネ入力画像RT1と1フレーム遅れの図39上のフレームメモリ304の出力である1フレーム遅延テレシネ画像RT2と比較され、図32のF1tとF1t‘がコピーフィールドであるので、閾値判定器310はHiを出力する。図32のF1bとF2bとはコピーフィールドではないので、閾値判定器310の出力である比較結果信号RT5はLoとなり、この時点で、テレシネ周期判定回路312はテレシネ周期のあるステート、ここでは、ステート0とするが、このステート0であると判断し、図32のF1t、F1bを順に出力するよう出力選択信号をLoに制御し、同時にTFF=1、RFF=1を出力する。セレクタ314はテレシネ周期判定器からの出力であるセレクタ制御信号RT7により、図39上のフレームメモリ306の出力である2フレーム遅延テレシネ画像RT4を選択して出力する。これによって、逆テレシネ画像RT8として、図32のF1t、F1bが順に出力される。
次のフレームでは、図32に示すF1t‘とF2t、F2bとF3bがともにコピーフィールドではないので、テレシネ周期判定回路312は次のステート1へと移行し、図32のF2t、F2bを順に出力するようセレクタ制御信号RT7によりセレクタ314を切り替える。このフレームについてはボトムフィールド先行であるので、TFF=0を出力し、第一フィールドを1度しか表示しないので、RFF=0を出力する。
同様に図32のF4t、F4bまで出力し、フレームレートの違いのためにこの逆テレシネ回路300Aは1フレーム間出力を休止する。この休止期間を示すためにテレシネ周期判定回路312は、出力画像有効フラグIEFをこの期間ネゲート(無効状態)する。
休止期間のない逆テレシネ画像が必要な場合、すなわち逆テレシネ変換後のフレームレートで、エンコードする場合には、この後にフレームレート変換のためのFIFOメモリ等が用いられ、逆テレシネ変換後のフレームレートで、このメモリの読み出しを行いエンコードする事になる。
しかしながら、このようにそれぞれ逆テレシネ変換を行った複数のVOBを、連続して再生しようとした場合に、そのつなぎ目でのシームレス情報再生に問題が生じる。このような問題をより分かり易く説明するために、以下にパレンタル制御の例に基づいて説明する。
図40及び図41を参照して、パレンタル制御時のテレシネ変換、符号化画像、及び再生画像の状態を説明する。図40は、3つのVOBa、VOBb、及びVOBc間のパレンタル接続の例を示している。図41の第1段目は、ビデオエンコーダ300Aに入力されるテレシネ画像RT1を示す。同じく、第2段目は、第1段目で示したテレシネ画像RT1を、逆テレシネ変換して得られる逆テレシネ画像RT8をビデオエンコーダ300Aで符号化した信号St15を示す。図面上は、逆テレシネ画像を表示している。第3段目は、ビデオエンコードストリームSt15からデコードされる再生画像IRを示す。
この例では元のテレシネ画像のフレームF18で終わるVOBa、元のテレシネ画像のフレームF19で始まりフレームF44で終わるVOBb、元のテレシネ画像のフレームF45で始まるVOBcが、第1段目の元々連続したテレシネ画像RT1に逆テレシネ変換及び圧縮符号化を行ったものであり、対象とする視聴者によっては、VOBbを飛ばして、VOBaからVOBcへとシームレスで連続再生を行う必要がある。この場合に、第3段目の逆テレシネ変換を行った記録画像のVOBaの終わりがRFF=0、TFF=0で終わっており、VOBcの始まりが、RFF=0、TFF=1で始まっているために、これを連続して再生すると、第1段目は、3段目に示すように、VOBaとVOBcのつなぎ目でトップフィールドが連続してしまう。
このような場合のMPEGデコーダの振る舞いは一般に保証されておらず、DVDデコーダに於いては、フィールドが1つ挿入されたり削除されたりして再生画像のつじつま合わせが行われるか、最悪の場合、無関係なフィールドが挿入されることになる。前者の場合であっても、音声との同期ずれが発生する恐れがある。従って、完全なシームレスの再生が実現できないことになる。
このような問題に対応して、本発明では、同一の記録媒体に複数の論理的な記録区間即ちVOBを設ける際に、各VOBの先頭及び終端でのRFF、TFFの値が所定の値となるように逆テレシネ変換を行う。更に、その逆テレシネ変換の方法についても、図43及び図44を参照して後で詳しく説明するが、その概念を以下に簡単に説明する。
VOBの先頭に於いて、前記フラグRFF、TFFを所定の値に固定しかつ冗長フィールドの除去を禁止した状態から逆テレシネ変換を開始し、実際の冗長フィールドの検出結果により生成される前記フラグRFF、TFFが所定の値となったところから、冗長フィールドの除去と前記フラグRFF、TFFの値を出力し、VOBの先頭での前記フラグRFF、TFFが所定の値を持つように逆テレシネ変換を行う。
更に、各VOBの終端でのこれらのフラグRFF、TFFを所定の値とするために、予めVOBに相当するテレシネ画像RT1の冗長フィールドの位置を検査しその結果によって前記フラグRFF、TFFを生成する手段を有し、実際に逆テレシネ変換と圧縮符号化を行う際に、該VOBの終端部での前記フラグRFF、TFFが所定の値になる逆テレシネ変換後のフレームの内、VOBの終端の近傍に位置するフレームに於いてコピーされた冗長フィールドの除去操作を中止して、該VOBの終端での前記フラグRFF、TFFが所定の値を持つように逆テレシネ変換を行う。
或いは、VOBに相当するテレシネ画像RT1の終端に近づいたことを検出する手段を有し、該VOBの終端に近づいたと判断した場合に、冗長フィールドの除去を制限することにより該VOBの終端での前記フラグRFF、TFFが所定の値を持つように逆テレシネ変換を行う。
このような手段により逆テレシネ変換を行うことにより、VOBの先頭と終端でのフラグRFF、TFFの値が所定の値に揃い、VOB同士を連続して再生しても、ボトムフィールド同士、或いはトップフィールド同士が連続することが無くなり、従って、複数のVOBを連続して再生する場合に、VOBの境界に於いてもシームレス再生を実現することが出来るようになる。
図45を参照して、上記にその概念を説明した本発明に於ける逆テレシネ変換回路の更なる実施形態を説明する。図45は本発明に於ける逆テレシネ変換回路を図25のビデオエンコーダ300に組み込こまれたビデオエンコーダ300Bの詳細な構造を示す。本実施形態に於けるビデオエンコーダ300Bは、図39に示したビデオエンコーダ300Aと同様の構造に、フレームメモリ304、306、フィールド間差分器308、閾値判定器310、テレシネ周期判定器312、セレクタ314、符号化装置316から構成されている。しかし、ビデオエンコーダ300Aと比べて、VOB終端検出器318、及び制御信号固定回路322が図示の如く追加されている。
VOB終端検出器318は、DVDエンコーダECDの編集情報作成部100に接続されて、ビデオストリームSt1に含まれるビデオストリームに同期して入力されるタイムコードの供給を受ける。また、VOB終端検出器318は、エンコードシステム制御部200が生成するエンコードパラメータであるビデオエンコード終了時刻V_ENDTM(図29参照)に基づいてVOB終端のタイムコードより少なくとも数フレーム前に「ハイ」になるVOB終端信号RT9を出力する。
本実施形態では、VOB内のテレシネ周期ステート3の最後のフレームのタイムコードを設定し、そのフレームが入力した時点でVOB終端信号RT9を出力するようにしている。テレシネ周期と対応するタイムコードが不明である場合には、1周期分すなわち、VOBの終端タイムコードの5フレーム前にVOB終端信号RT9の出力を行うする事でも構わない。
制御信号固定回路322は、VOB終端検出器318に接続されてVOB終端信号RT9の供給を受けると共に、テレシネ周期判定器312に接続されてセレクタ制御信号RT7、トップフィールドファーストフラグTFF、リピートファーストフィールドフラグRFF、及び出力画像有効フラグIEFの供給を受ける。制御信号固定回路322は、VOB終端信号RT9に基づいて、セレクタ制御信号RT7、トップフィールドファーストフラグTFF、リピートファーストフィールドフラグRFF、及び出力画像有効フラグIEFを其々を制御して、第二セレクタ制御信号RT7‘、第二トップフィールドファーストフラグTFF’、第二リピートファーストフィールドフラグRFF‘、及び第二出力画像有効フラグIEF’を出力する。
セレクタ314は、制御信号固定回路322に接続されて第二セレクタ制御信号RT7‘の供給をうける。同様に、符号化装置316も制御信号固定回路322に接続されて第二トップフィールドファーストフラグTFF’、第二リピートファーストフィールドフラグRFF‘、及び第二出力画像有効フラグIEF’の供給を受ける。
制御信号固定回路322は、VOB終端信号がHiになって以降、TFF=1、RFF=0の状態、を検出すると、その後のエンコード前の画像については、TFF=1、RFF=0の状態、入力されるテレシネ画像RT1のフレームをそのままエンコード処理を行うように制御する。すなわち、TFF‘=1、RFF’=0、IEF‘=1、RT7’=1と固定して、それ以降の冗長フィールドの削除を禁止する。なお、RT7、IEFの変化は、RFF、TFFと同期しているので、RFF、TFFの変化の検出するだけで十分である。
つまり、本実施形態に於けるビデオエンコーダ300Bでは、セレクタ314及び符号化装置316は、ビデオエンコーダ300Aと違って、エンコードシステム制御部200からのエンコードパラメータを含むSt9とビデオストリームSt1中のタイムコードに基づいて、VOB終端検出器318と制御信号固定回路322によって、ビデオストリームSt1中のVOB終端を検知することにより、冗長フィールドの削除をより精密に制御できるので、より効率的且つ正確な逆テレシネ変換処理を可能としている。
図43及び2104Bを参照して、ビデオエンコーダ300Bによる逆テレシネ変換の方法について説明する。図43及び図44の第1段目から第53段目までは、既に説明した逆テレシネ変換のタイミングを示す図40及び図41の其々と同様であるので説明を省く。但し、第5段目には、VOBの終端の検出信号RT9が表されている。枠体GF1は、VOBaの終端期間、枠体GF2は、VOBbの先頭期間、枠体GF3は、VOBbの終端期間を示す。
先ず、テレシネ画像RT1の逆テレシネ変換を考える。元のテレシネ画像RT1のフレームF18で終わるVOBaの終端に着目する。予め、冗長フィールドの検査を行い、冗長フィールドが含まれていることがわかっているとする。このテレシネ画像RT1をそのまま逆テレシネ変換すると、図40に示すようなRFF‘、TFF‘を生成する事になる。ここで、VOBaのフレームの内、TFF‘=1、RFF‘=0でかつ終端に最も近いフレームは、図41ではフレームF12’であるので、以降の枠体GF1に示す区間での冗長フィールドの削除を禁止すると、図43の再生画像IRに示すような必ずボトムフィールドで終了するVOBaとなる。
次に、VOBbの先頭に注目する。VOBbの先頭では、実際の冗長フィールドの削除は禁止してTFF‘=1、RFF‘=0の状態からフラグを出力し、冗長フィールドの検査の結果初めてフラグがTFF‘=1、RFF‘=0の状態になってから冗長フィールドの削除を開始する。枠体GF2内の区間がその冗長フィールド除去の禁止期間である。
VOBbの終端では、VOBaの終端と同様の処理を行う。即ち、枠体GF3で示す期間では冗長フィールドの削除を行わない。
VOBcの先頭は、もともとTFF‘=1、RFF‘=0であるので、すぐさま冗長フィールド削除のモードに入る。
以上のように各VOBセルを生成すると、VOBaの終端、VOBbの先頭及び終端、VOBcの先頭の何れもがTFF‘=1、RFF‘=0の状態であり、VOBa→VOBb→VOBcと連続再生した場合も、また、VOBa→VOBcと連続再生した場合にも、フィールドの不連続はなくなり、シームレス再生が保証できることになる。
図46に示すタイミングチャートを参照して、本発明にかかる逆テレシネ変換回路の実施形態2のビデオエンコーダ300Bの動作をより詳しく説明する。本実施形態に於けるタイミングチャートは、図42に示すビデオエンコーダ300Aとタイミングチャートに、VOB終端信号RT9、第二セレクタ制御信号RT7‘、第二トップフィールドファーストフラグTFF’、第二リピートファーストフィールドフラグRFF‘、及び第二出力画像有効フラグIEF’の動作を追加して表した構成になっている。既に、図43を参照して説明した、VOB終端信号RT9に基づく、元のフラグと各第二フラグとの関係が明確に示されている。
同図に於いて、テレシネ画像入力のF4tのタイミングでタイムコードなどによる逆テレシネ停止信号であるVOB終端信号RT9が入力した場合を示している。逆テレシネ停止信号RT9が入力するまでの動作は、図42で説明した場合と同様である。
逆テレシネ停止信号RT9が入力してから最初にTFF‘=1、RFF‘=0を出力するステート3のフレーム以降、逆テレシネ操作を停止し、入力のテレシネ画像をそのまま出力している。これにより、どの位置で符号化を停止させても、トップフィールドが先行するフレームでセルが終了することとなり、複数のVOBを連続再生した場合のシームレス再生を保証出来ることになる。
図43、図44、図45、図46を参照してVOB終端検出器318及び制御信号固定回路322についての上述の開示は、当業技術に熟練したものであれば、このような動作が可能なVOB終端検出器318及び制御信号固定回路322を、プログラム等のソフトウェアによって、あるいは電気回路によって構成するに十分であるので、具体的な構成についての説明を省く。
本実施形態では、タイムコードによりVOB終端を検出したが、フレーム数を数えるなどの方法によって実現しても、本発明の効果はいぜんとして有効である。また、TFF‘=1、RFF‘=0の状態でVOBを終了する例をしめしたが、他の状態であっても複数のVOBの境界でテレシネ周期に問題が起きないように制限すれば良い。
以上説明した実施形態では、1度のテレシネ画像の入力によって、順次逆テレシネ変換処理を行い、ビデオエンコード処理を行う方法を示した。次第2の実施形態として、1度目の入力で、テレシネ変換周期及びTFF,RFFを検出し、2度目の入力で図43に示すように、TFF‘,RFF’を生成し、ビデオエンコード処理を行う方法について説明する。この場合の処理は、図39に示すビデオエンコードブロックにおいて、テレシネ周期判定器312にエンコードを行うVOBのテレシネ周期情報を格納するメモリを加える事で実現できる。
つまり、1度目のテレシネ画像入力により、順次逆テレシネ変換処理を行う、その結果、すなわちテレシネ周期情報をテレシネ周期判定器312に蓄積し、1度目の処理を終了する。次にテレシネ周期判定器312では、エンコード終了時刻のフレームより、時間をさかのぼり、それぞれの逆テレシネ変換画像のTFF,RFFを評価し、TFF=1、RFF=0の状態を検出したら、そのフレームからVOB終端までのフレームのTFF、RFFが、TFF‘=1,RFF’=0となるように設定する。
以上に説明した第2の実施形態の別の実施形態として、エンコードするテレシネ変換画像のテレシネ周期情報がわかっている場合、エンコード処理前に、そのテレシネ周期情報をテレシネ周期判定器312に入力し、前述した、TFF,RFFの変換処理及び2度目の処理をテレシネ周期判定器312で行う事により、同様に実現できる。また、テレシネ周期判定器に、TFF、RFFの変換処理を施したTFF‘,RFF’を入力する事でも同様な効果を得る事ができる。
以上に示した逆テレシネ変換回路を含むビデオエンコードは、図25のビデオエンコーダ300に相当し、図34のエンコーダフローチャートのサブルーチンであるステップ#1800で設定されたエンコードパラメータ、すなわち図29で示したエンコードパラメータのビデオエンコードモードV_ENCMD設定の逆テレシネ変換処理をおこなうか否かに基づいて、さらにビデオエンコード開始時刻V_STTM、ビデオエンコード終了時刻V_ENDTMに基づき、図34Bのステップ#1900でのビデオエンコード処理をおこなう。
以上説明したように、本発明によれば、セル同士を連続して再生しても、ボトムフィールド同士、或いはトップフィールド同士が連続することなく、セルの境界に於いてもシームレス再生を実現することが出来る。
産業上の利用可能性
以上のように、本発明にかかるビットストリームのインターリーブて媒体に記録再生する方法及びその装置は、様々な情報を搬送するビットストリームから構成されるタイトルをユーザーの要望に応じて編集して新たなタイトルを構成することができるオーサリングシステムに用いるのに適しており、更に言えば、近年開発されたデジタルビデオディスクシステム、いわゆるDVDシステムに適している。
Claims (2)
- テレシネ変換されたビデオ信号から冗長フィールドを除去する逆テレシネ変換を施した中間信号を、冗長フィールドを除去したことを示す第1フラグ(RFF)及びビデオフレームを構成するトップフィールドとボトムフィールドの内どちらのフィールドが時間的に先行しているかを示す第2フラグ(TFF)と共に圧縮符号化したシステムストリーム(VOB)を生成し、記録媒体に記録する信号記録装置であって、
ビデオ信号の第1ビデオフレームと前記第1ビデオフレームから1フレーム遅延する第2ビデオフレームとを記憶する記憶手段(304、306)と、
前記記録手段からの出力を選択する選択手段(314)と、
記憶された前記第1ビデオフレームを構成するフィールドと前記第2ビデオフレーム構成するフィールドとを比較しビデオ信号のテレシネ周期と冗長フィールドを判定する判定手段(308、310、312)と、
判定したテレシネ周期と冗長フィールドに基づき、ビデオ信号中の冗長フィールドを除去した中間信号(RT8)を前記選択手段を制御し出力させると供に、前記第1フラグ、前記第2フラグを生成し出力する制御手段(312、322)と、
前記中間信号(RT8)、前記第1フラグ、前記第2フラグを符号化した1つ以上のシステムストリーム(VOB)を生成する符号化手段(316)とを備え、
前記信号記録装置は、さらに、入力されるビデオ信号から生成される1つ以上のシステムストリーム(VOB)の各終端を検出する検出手段(318)を備え、
前記制御手段は、
各システムストリーム(VOB)の終端で冗長フィールドの削除を禁止することにより、前記第1、第2フラグが所定の値を持つように前記ビデオ信号から前記記録信号への変換を行うことを特徴とする、信号記録装置。 - 前記第2フラグ(TFF)は、所定の値として、システムストリームの先端ではトップフィールドで始まり、終端はボトムフィールドで終わる値を示す、請求の範囲1記載の信号記録装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP25273395 | 1995-09-29 | ||
PCT/JP1996/002799 WO1997013362A1 (en) | 1995-09-29 | 1996-09-27 | Method and device for encoding seamless-connection of telecine-converted video data |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002146424A Division JP3437565B2 (ja) | 1995-09-29 | 2002-05-21 | 再生方法、再生装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP3920921B2 true JP3920921B2 (ja) | 2007-05-30 |
Family
ID=17241513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP51414497A Expired - Lifetime JP3920921B2 (ja) | 1995-09-29 | 1996-09-27 | テレシネ変換されたビデオデータのシームレス接続エンコード方法及びその装置 |
Country Status (8)
Country | Link |
---|---|
EP (1) | EP0920202A3 (ja) |
JP (1) | JP3920921B2 (ja) |
KR (1) | KR100386873B1 (ja) |
CN (2) | CN1309253C (ja) |
DE (1) | DE69602274T2 (ja) |
HK (2) | HK1011909A1 (ja) |
MX (1) | MX9801213A (ja) |
TW (1) | TW303569B (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040090554A1 (en) * | 2002-10-23 | 2004-05-13 | Takahiro Nishi | Picture coding method |
US9560367B2 (en) | 2004-09-03 | 2017-01-31 | Nokia Technologies Oy | Parameter set and picture header in video coding |
KR20080016999A (ko) | 2005-04-26 | 2008-02-25 | 톰슨 라이센싱 | 동기화된 스트림 패킹 |
US8233048B2 (en) * | 2006-09-19 | 2012-07-31 | Mavs Lab. Inc. | Method for indexing a sports video program carried by a video stream |
KR101268987B1 (ko) * | 2007-09-11 | 2013-05-29 | 삼성전자주식회사 | 메타데이터를 자동적으로 생성/갱신하는 멀티미디어 데이터기록 방법 및 장치 |
KR101662141B1 (ko) * | 2015-08-10 | 2016-10-05 | 주식회사 인팩 | 다이아프램 진동 구동 장치 및 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2664817B2 (ja) * | 1991-05-31 | 1997-10-22 | インターナショナル・ビジネス・マシーンズ・コーポレイション | フレーム列画像圧縮方法及びシステム並びにフレーム再構成方法及びシステム |
JPH06153069A (ja) * | 1992-10-30 | 1994-05-31 | Sony Corp | 画像の変換装置、複製装置、再生装置、および表示装置 |
JP3255308B2 (ja) * | 1992-12-18 | 2002-02-12 | ソニー株式会社 | データ再生装置 |
US5463565A (en) * | 1993-10-29 | 1995-10-31 | Time Warner Entertainment Co., L.P. | Data block format for software carrier and player therefor |
-
1996
- 1996-09-26 TW TW85111842A patent/TW303569B/zh not_active IP Right Cessation
- 1996-09-27 CN CNB031309054A patent/CN1309253C/zh not_active Expired - Lifetime
- 1996-09-27 MX MX9801213A patent/MX9801213A/es unknown
- 1996-09-27 CN CN96197226A patent/CN1115047C/zh not_active Expired - Lifetime
- 1996-09-27 DE DE69602274T patent/DE69602274T2/de not_active Expired - Lifetime
- 1996-09-27 KR KR10-1998-0702166A patent/KR100386873B1/ko not_active IP Right Cessation
- 1996-09-27 JP JP51414497A patent/JP3920921B2/ja not_active Expired - Lifetime
- 1996-09-27 EP EP19990102251 patent/EP0920202A3/en not_active Ceased
-
1998
- 1998-12-10 HK HK98113149A patent/HK1011909A1/xx not_active IP Right Cessation
-
1999
- 1999-04-22 HK HK99101788A patent/HK1016793A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
MX9801213A (es) | 1998-04-30 |
HK1016793A1 (en) | 1999-11-05 |
DE69602274T2 (de) | 1999-12-16 |
DE69602274D1 (de) | 1999-06-02 |
CN1516162A (zh) | 2004-07-28 |
CN1115047C (zh) | 2003-07-16 |
CN1309253C (zh) | 2007-04-04 |
CN1197576A (zh) | 1998-10-28 |
EP0920202A3 (en) | 1999-06-09 |
TW303569B (ja) | 1997-04-21 |
EP0920202A2 (en) | 1999-06-02 |
KR19990063699A (ko) | 1999-07-26 |
HK1011909A1 (en) | 1999-07-23 |
KR100386873B1 (ko) | 2003-08-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3922592B2 (ja) | 記録方法 | |
JP3827096B2 (ja) | 情報記録媒体の記録方法 | |
JP3827097B2 (ja) | 情報記録方法 | |
JP3769507B2 (ja) | 再生装置 | |
JP3325581B2 (ja) | 再生方法及び再生装置 | |
JP3963478B2 (ja) | ビットストリームのシームレス接続エンコード方法及びその装置 | |
US5745645A (en) | Method and an apparatus for encoding telecine-converted video data for seamless connection | |
JP3338039B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP2003087744A (ja) | ビットストリーム生成方法及び情報記録方法 | |
JP3920921B2 (ja) | テレシネ変換されたビデオデータのシームレス接続エンコード方法及びその装置 | |
JP3813070B2 (ja) | 光ディスクを再生する再生装置 | |
JP3327917B2 (ja) | 記録方法、記録装置、及び光ディスク | |
JP3350542B1 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3437565B2 (ja) | 再生方法、再生装置 | |
JP3338042B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338033B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338036B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338037B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338041B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3350545B1 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338034B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338038B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338035B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338032B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク | |
JP3338040B2 (ja) | 再生方法、再生装置、記録方法、記録装置、光ディスク |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061124 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070216 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100223 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110223 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120223 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130223 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140223 Year of fee payment: 7 |
|
EXPY | Cancellation because of completion of term |