WO2006064838A1 - 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法 - Google Patents

高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法 Download PDF

Info

Publication number
WO2006064838A1
WO2006064838A1 PCT/JP2005/022945 JP2005022945W WO2006064838A1 WO 2006064838 A1 WO2006064838 A1 WO 2006064838A1 JP 2005022945 W JP2005022945 W JP 2005022945W WO 2006064838 A1 WO2006064838 A1 WO 2006064838A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
format
stream
packet
video
Prior art date
Application number
PCT/JP2005/022945
Other languages
English (en)
French (fr)
Inventor
Hiroshi Yahata
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Publication of WO2006064838A1 publication Critical patent/WO2006064838A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1262Formatting, e.g. arrangement of data block or words on the record carriers with more than one format/standard, e.g. conversion from CD-audio format to R-DAT format
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/216Rewritable discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
    • G11B2220/2575DVD-RAMs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2583Optical discs wherein two standards are used on a single disc, e.g. one DVD section and one CD section

Definitions

  • Information recording medium on which high-speed convertible stream is recorded its recording apparatus and recording method
  • the present invention is an information recording medium that can be recorded and reproduced, and is an information recording medium on which multimedia data including data in various formats such as moving images, still images, audio, and data broadcasting is recorded.
  • the present invention relates to an information recording medium for recording data in a limited format that enables high-speed conversion of multimedia data into a format different from the recorded format.
  • the present invention also relates to an apparatus and method for recording information on such an information recording medium.
  • phase change disk DVD-RAM having a capacity of several GB has appeared.
  • MPEG MPEG2
  • AV audio video
  • MPEG-TS MPEG transport stream
  • BD standard Blu-ray Disc standard
  • Next-generation digital broadcast recorders (Blu-ray Disc recorders) conforming to the BD standard are mainly adapted to the form of digital broadcasting, and the MPEG-TS that has been broadcast is not converted and is converted as it is. Record in format.
  • the next-generation digital broadcast recorder also records the AV stream in the MP EG-TS format even when AV data from an external input is self-recorded. This is to prevent both the MPEG program stream (hereinafter referred to as “MPEG_PS”) and MPEG-TS from being handled in the recorder. is there.
  • MPEG-PS format for AV stream recording.
  • MPEG-TS format such as the next-generation digital broadcast compatible recorder
  • MPEG-TS format to MPEG-PS format Conversion hereinafter referred to as “TS2PS conversion”.
  • Patent Document 1 Japanese Patent Laid-Open No. 2003-228922
  • Patent Document 2 US Pat. No. 5,923,869
  • Patent Document 3 US Patent Application Publication 2002—0090197
  • the present invention has been made to solve the above-mentioned problems, and the object of the present invention is to limit the MPEG-TS that can convert the content recorded in the MP EG-TS format into the MPEG-PS format.
  • An information recording medium for recording an AV stream in a format is to provide an information recording medium that enables format conversion to a seamlessly connected stream while maintaining a seamless playback function.
  • Another object of the present invention is to provide an apparatus and method for recording data on such an information recording medium. Means for solving the problem
  • an information recording medium on which video information and audio information encoded in a system stream are recorded together with management information thereof.
  • the system stream is allowed to have the first format (TS) and the second format (PS).
  • the first format (TS) has a bucket structure that stores data divided into packets
  • the second format (PS) has a pack structure that stores data divided into packs.
  • the first format (TS) allows a restricted format to convert the system stream from the first format (TS) to the second format (PS).
  • a predetermined number of packets are grouped and managed as a multiplexing unit corresponding to the pack of the second format, and further, in a data management unit (Capsule) including a plurality of multiplexing units.
  • System stream is managed.
  • the information recording medium is a stream for seamlessly connecting the first system stream, the second system stream, the first system stream, and the second system stream, the seamlessly connected system stream.
  • the management information includes information indicating whether or not the recording format of the first and second system streams is a restricted format and each system stream included in the third system stream. Information indicating that the encoding was performed under the same encoding condition as that of the original system stream.
  • an information recording apparatus that encodes video information and audio information into a system stream and records the information together with the management information on an information recording medium.
  • 1 format (TS) and 2nd format (PS) are allowed.
  • the 1st format (TS) has a packet structure for storing data divided into packets, and the 2nd format (PS) Has a pack structure in which data is divided and stored in packs.
  • the first format (TS) allows a restricted format to convert the system stream from the first format (TS) force to the second format (PS).
  • a predetermined number of the packets are grouped together to form a second format. It is managed as a multiplexing unit corresponding to a pack of one mat, and the system stream is managed in a data management unit (Capsule) including a plurality of multiplexing units.
  • Capsule data management unit
  • the information recording apparatus includes: a first encoding unit configured to perform a predetermined encoding process on the video information and the audio information based on the first format (TS) to generate a video elementary stream and an audio elementary stream; A second encoding means for performing system encoding to multiplex a video elementary stream and an audio elementary stream to generate a system stream based on the first format (TS); and the first and second encodings Control means for controlling the means.
  • a first encoding unit configured to perform a predetermined encoding process on the video information and the audio information based on the first format (TS) to generate a video elementary stream and an audio elementary stream
  • a second encoding means for performing system encoding to multiplex a video elementary stream and an audio elementary stream to generate a system stream based on the first format (TS)
  • the first and second encodings Control means for controlling the means.
  • the control means includes a third system stream (Bridge_V0B) configured by a partial force of each of the first and second system streams. )
  • the control means provides, as management information, information indicating whether or not the recording format of the first and second system streams is a restricted format, and each of the information included in the third system stream.
  • the first and second encoding means are controlled so as to generate information (encode_condition) indicating that the system stream is encoded with the same encoding condition as those of the original system stream.
  • a method for recording video information and audio information encoded in a system stream together with management information thereof on an information recording medium is allowed to have a first format (TS) and a second format (PS).
  • the first format (TS) has a packet structure in which data is divided into packets and stored.
  • the format (PS) 2 has a pack structure in which data is divided and stored in packs.
  • the first format (TS) allows a limited format to convert the system stream to the first format (TS) power and the second format (PS).
  • a predetermined number of packets are grouped and managed as a multiplexing unit corresponding to the pack of the second format, and further, the system is a data management unit (Capsule) including a plurality of multiplexing units. Streams are managed.
  • Capsule data management unit
  • the information recording method is based on the first format (TS) and performs predetermined encoding processing on the video information and the audio information so that the video elementary stream and the audio elementary list are recorded. Based on the first format (TS) to generate a system stream by multiplexing the video elementary stream and the audio elementary stream.
  • TS first format
  • a third system stream (Bridge-VOB) composed of a part of each of the first and second system streams
  • information indicating whether the recording format of the first and second system streams is a restricted format and each system stream included in the third system stream are Information (encode_condition) indicating that the encoding is performed under the same encoding condition as those of the original system stream is generated.
  • a computer-readable program for causing a computer to execute the above information recording method.
  • FIG. 1 is a diagram for explaining an example of an external appearance of a DVD recorder device and an interface with related devices.
  • FIG. 2 is a block diagram of a drive device of a DVD recorder.
  • FIG. 20 is a block diagram showing the configuration of the information recording / reproducing apparatus of the present invention.
  • FIG. 21 is a diagram for explaining the structure of a self-recording stream
  • FIG. 28 is a diagram for explaining an MPEG-TS encoding method that can be easily converted into MPEG-PS.
  • Block diagram showing the encoder of the information recording apparatus of the present invention [Figure 34] Diagram explaining differences in processing when converting from self-encoding MPEG-TS to DVD format due to differences in system encoding methods
  • FIG.45 Diagram showing an example of MPEG-TS self-encoded so as not to satisfy the T-STD model
  • FIG.53 Diagram showing the structure of NV—PCK DSI data
  • FIG. 58 is a flowchart of TS packet (RD_PCK) conversion processing.
  • FIG. 59 is a flowchart of TS packet (V_PCK :, A_PCK) conversion processing.
  • FIG. 60 is a diagram for explaining a part of the pack header data structure of an MPEG2_PS pack.
  • FIG.63 A diagram illustrating part of the data structure of the packet header of an MPEG2_PS packet.
  • FIG.64 Structure of the DVD format AC-3 standard private header.
  • FIG.67 A diagram showing the correspondence between the bit rate of each audio allowed by Constrained SESF and the maximum payload length stored in one audio PES packet when AC-3 and MPEG1 Audio are stored
  • FIG. 69 Flow chart of initialization processing of TS2PS conversion processing
  • FIG. 70 Flow chart of capsule unit processing of TS2PS conversion processing
  • FIG. 73 is a flowchart of pack header processing.
  • FIG. 74 is a flowchart of packet header processing.
  • FIG.78 Audio PES packet head processing flowchart
  • FIG.79 Flow chart of audio PES packet non-head processing
  • FIG. 81 is a flowchart of padding packet processing.
  • FIG.85 An illustration of an efficient multiplexing method using plexing units aligned with PES packets including audio.
  • FIG.86 An illustration of an efficient multiplexing method using Multiplexing Units aligned with PES packets containing one picture
  • FIG.103 (a) Diagram explaining the relationship between seamlessly connected VB and Bridge_VOB, (b) Diagram explaining the relationship between each value of encode_condition and VOB
  • DVD format conversion from an MPEG transport stream (MPEG-TS) to an MPEG program stream (MPEG-PS) is referred to as “TS2PS conversion”.
  • MPEG-TS MPEG transport stream
  • MPEG-PS MPEG program stream
  • DVD-Video standard format and DVD-Video Recording standard format which are MPEG-PS formats, are collectively referred to as "DVD format”.
  • FIG. 1 is a diagram for explaining an example of the external appearance of a DVD recorder device and an interface between related devices.
  • the DVD recorder is loaded with a DVD, which is an optical disk, and records and reproduces video information.
  • the operation is generally performed with a remote controller.
  • Video information input to a DVD recorder includes both analog and digital signals.
  • analog broadcasting as analog signals and digital broadcasting as digital signals.
  • analog broadcasting is received and demodulated by a receiver built in the television device and input to a DVD recorder as an analog video signal such as NTSC.
  • Digital broadcasting is a receiver STB (Set Top Box). ) Is demodulated into a digital signal and input to a DVD recorder for recording.
  • a DVD disc on which video information is recorded is reproduced by a DVD recorder and output to the outside. Similar to the input, both the analog and digital signals are output. If the signal is an analog signal, it is input directly to the television device. If the signal is a digital signal, it is converted to an analog signal via the STB and then converted to an analog signal. The video is displayed on the television device.
  • video information is recorded on and reproduced from a DVD disc by a DVD camcorder other than a DVD recorder or a personal computer. Even if a DVD disc contains video information outside the DVD recorder, the DVD recorder will play it back if it is loaded in the DVD recorder.
  • audio information is usually attached to the video information of the analog broadcast and digital broadcast described above.
  • the accompanying audio information is also recorded and reproduced by a DVD recorder.
  • video information is generally a power still image that is a moving image. This is the case, for example, when still images are recorded with the photo function of a DVD camcorder.
  • the digital interface between the STB and the DVD recorder can be IEEE1394, ATAPI, SCSI, or the like.
  • NTSC which is a composite video signal
  • a component signal that individually transmits a luminance signal and a color difference signal may be used.
  • video transmission I / F between AV equipment and television equipment is being researched and developed to replace analog I / F with digital I / F, for example, DVI.
  • I / F connections are also expected.
  • FIG. 2 is a block diagram showing functions of the DVD recorder device.
  • the drive unit is an optical pickup 101 that reads data from a DVD —RAM disk 100, ECC (Error Correc ting Code) processing unit 102, track buffer 103, switch 104 for switching the input / output of 103 to the track buffer, encoder unit 105, and decoder unit 106.
  • ECC Error Correc ting Code
  • the DVD recorder device may include a semiconductor memory card or a hard disk drive device as a data storage medium in addition to the DVD disk.
  • Figure 4 shows a block diagram of a DVD recorder with a semiconductor memory device and a hard disk drive.
  • One sector may be 512B, or 8KB or the like.
  • ECC blocks can be 1 sector, 16 sectors, 32 sectors, etc. As the information capacity that can be recorded increases, the sector size and the number of sectors that make up the ECC block are expected to increase.
  • the track buffer 103 is a buffer for recording AV data at a variable bit rate (VBR) in order to record AV data on the DVD-RAM disk 100 more efficiently.
  • VBR variable bit rate
  • D VD Because the read / write rate (Va) to RAM100 is a fixed rate, the bit rate (Vb) of AV data changes according to the complexity of its contents (image if video). This is a buffer for absorbing this bit rate difference.
  • AV data can be discretely arranged on the disc 100. This will be explained with reference to FIG.
  • FIG. 3 (a) shows the address space on the disk.
  • Fig. 3 (a) when AV data is recorded separately in [al, a2] continuous area and [a3, a4] continuous area, while seeking from a2 to a3, The AV data can be continuously reproduced by supplying the data stored in the track buffer to the decoder unit 106.
  • Figure 3 (b) shows the state at this time.
  • AV data that has been read out at position al is input to the track buffer 103 from time tl, and data output from the track buffer 103 is started.
  • data is accumulated in the track buffer by the rate difference (V a – Vb) between the input rate (Va) to the track buffer and the output rate (Vb) from the track buffer.
  • V a – Vb rate difference between the input rate (Va) to the track buffer
  • Vb output rate
  • N_ecc The size of the continuous area in which AV data can be continuously supplied is expressed by the following equation when converted into the number of ECC blocks (N_ecc).
  • N_sec is the number of sectors that make up the ECC block
  • S_size is the sector size
  • Tj is the seek performance (maximum seek time).
  • N_ecc Vb * Tj / ((N_sec * 8 * S_size) * (l_Vb / Va))
  • a defective sector may occur in the continuous area.
  • the continuous region is given by the following equation.
  • dN_ecc is the size of the defective sector to accept
  • Ts is the time required to skip the defective sector in the continuous area. This size is also expressed in ECC blocks.
  • N— ecc dN— ecc + Vb * Tj / ((N— sec * 8 * S—size) * (l— Vb / Va))
  • DVD-RAM can perform continuous playback / recording even if AV data is distributedly recorded on a disc as long as a certain amount or more of data is continuously recorded.
  • this continuous area is called CDA.
  • Figures 5 (a) and 5 (b) show the appearance and physical structure of a DVD-RAM disk, which is a recordable optical disk.
  • DVD-RAM is generally loaded into a DVD recorder in a cartridge. The purpose is to protect the recording surface. However, if the recording surface is protected in a different configuration or is acceptable, it is of course possible that the recording surface can be directly loaded into the DVD recorder without being stored in the cartridge.
  • DVD—RAM discs record data by the phase change method.
  • the recorded data on the disc is managed in units of sectors and accompanied with an access address. 16 sectors are incorrect It becomes a unit of correction, is given an error correction code, and is called ECC block.
  • FIG. 5 (a) shows a recording area of a DVD-RAM disc, which is a recordable optical disc.
  • the DVD-RAM disc has a lead-in area on the innermost periphery, a lead-out area on the outermost periphery, and a data area between them.
  • the lead-in area the reference signal necessary to stabilize the servo when accessing the optical pickup and the identification signal for other media are recorded.
  • the lead-out area records the same reference signal as the lead-in area.
  • the data area is divided into sectors (2048 bytes) which are the minimum access unit.
  • DVD-RAM has a data area divided into a plurality of zone areas in order to realize rotation control called Z_CLV (Zone Constant Linear Velocity) during recording and playback.
  • Z_CLV Zero Constant Linear Velocity
  • FIG. 5 (a) is a diagram showing a plurality of zone areas provided concentrically on the DVD-RAM. As shown in the figure, DVD-RAM is divided into 24 zone areas, zone 0 to zone 23. The rotation speed of DVD-RAM is set for each zone area so that the inner zone is faster, and is kept constant while the optical pickup accesses within one zone. This increases the recording density of DVD-RAM and facilitates rotation control during recording and playback.
  • FIG. 5B is an explanatory diagram in which the lead-in region, the lead-out region, and the zone regions 0 to 23 shown concentrically in FIG. 5A are arranged in the horizontal direction.
  • the lead-in area and lead-out area have a defect management area (DMA).
  • the defect management area is recorded with position information indicating the position of the sector where the defect has occurred, and replacement position information indicating the force in which the sector that replaces the defective sector exists in the replacement area. Let's check the area.
  • Each zone area has a user area inside thereof, and also has an alternative area and an unused area at the boundary.
  • the user area is an area that the file system can use as a recording area.
  • the replacement area is an area used as a replacement when a defective sector exists.
  • the unused area is an area that is not used for data recording. Unused areas will be provided for about two tracks. The unused area is provided because the sector address is recorded at the same position on the adjacent track in the zone. This is to prevent sector address misidentification due to different sector address recording positions in tracks adjacent to the boundary.
  • DVD-RAM assigns logical sector numbers (LSNs) to physical sectors in the user area in order from the internal power, so that only the sectors used for data recording are shown continuously.
  • LSNs logical sector numbers
  • FIG. 6 shows a logical data space of DVD-RAM configured by logical sectors.
  • the logical data space is called a volume space and records user data.
  • the volume area manages recording data with a file system.
  • volume structure information that manages a group of sectors for storing data as a file and a group of files as a directory is recorded at the beginning and end of the volume area.
  • the file system in this form is called UDF and is compliant with the ISO 13346 standard.
  • the file system manages a group of sectors that are continuously arranged in the volume space as an extent, and manages a file as a set of related extents.
  • FIG. 7 shows the structure of directories and files recorded in the DVD-RAM. Below the root is a VIDEO-RT directory, and below this, various object files that are data for reproduction, and VIDEO Manager files are stored as management information indicating their reproduction order and various attributes.
  • the object is data conforming to the MPEG standard.
  • PS V ⁇ B
  • TS1 VOB
  • T S2_V ⁇ B A ⁇ B
  • POB POB
  • MNF Manufacturer's Priv
  • PS_VOB, A0B, and POB are MPEG program streams (PS), and TS1_V0B and TS2_V0B are transport streams (TS).
  • the program stream has a data structure that allows for storing AV information in a package medium, while the transport stream has a data structure that allows for communication media.
  • PS VOB, TSl VOB, and TS2 V0B all share both video information and audio information. It is an object that mainly has video information.
  • TS1-VOB is an object that is encoded by Harajiki IJ and a DVD recorder, and the internal picture structure is managed in detail.
  • TS2-VOB is an object encoded outside the DVD recorder. An object whose data structure such as an internal picture structure is partially unknown.
  • TSl_VOB is an object in which an analog video signal input from the outside is encoded into a transport stream by a DVD recorder, and TS2_V0B encodes a digital video signal input from the outside. It is an object recorded directly on the disc without any problems. In other words, when a DVD recorder records a digital broadcast, it is generally TS2_VOB.
  • A0B and P0B are MPEG program streams
  • A0B is an object mainly composed of audio information
  • P0B is an object mainly composed of a still image.
  • MNF Manufacturing's Private Data
  • MNF Manufacturing's Private Data
  • VOB is used for applications such as movies
  • AOB is used for music applications.
  • FIG. 8 shows the structure of MPEG data recorded as various AV objects on a DVD disc.
  • the video stream and the audio stream are each divided and multiplexed.
  • the multiplexed stream is called a system stream.
  • a system stream in which DVD-specific information is set is called a VOB (Video Object).
  • the unit of division is called a pack'packet and has a data amount of about 2KByte.
  • the video stream is encoded according to the MPEG standard, compressed at a variable bit rate, and the bit rate is high for complex video such as intense motion.
  • each picture in a video is encoded by being classified into an I picture, a P picture, and a B picture.
  • I pictures are subjected to spatial compression coding that is completed within a frame.
  • the P picture and B picture are temporally compressed and encoded using the correlation between frames.
  • a section including at least an I picture is managed as a GOP (Group of Pictures). GOP becomes an access point for special playback such as fast-forward playback
  • V0BU Video Object Unit
  • information for managing the moving image segment is included as header information.
  • the system stream described in FIG. 8 includes a program stream (PS) and a transport stream (TS).
  • PS program stream
  • TS transport stream
  • the former has a data structure considering the package media
  • the latter has a data structure considering the communication media.
  • FIG. 9 is a diagram for explaining the outline of the data structure of the program stream and the transport stream.
  • the transport stream transmission and multiplexing unit is composed of fixed-length TS packets.
  • the TS packet size is 188B, which is consistent with ATM transmission, which is a communication standard.
  • One or more TS packets gather to form a PES packet.
  • the PES packet is a concept common to the program stream and the transport stream, and has a common data structure. Packets stored in a program stream pack directly constitute a PES packet, and one or more transport stream TS packets constitute a PES packet.
  • the PES packet is the minimum unit of codeh, and video information, Each one-dio information is stored. That is, video information and audio information with different encoding methods are not mixedly stored in one PES packet. However, with the same encoding method, picture boundaries and audio frame boundaries are not guaranteed. As shown in Figure 9, one PES packet can store one frame, or one PES packet can store multiple frames.
  • FIGS. 10 (&) to (() and FIGS. 11 (&) to (0) show the individual data structures of the transport stream and the program stream.
  • a TS packet is composed of a TS packet header, an application field, and a payload portion.
  • the TS packet header stores a PID (Packet Identifier), which identifies various streams such as a video stream or an audio stream to which the TS packet belongs.
  • PID Packet Identifier
  • PCR Program Clock Reference
  • STC standard clock
  • DTS Decoding Time Stamp
  • PTS Presentation Time Stamp
  • a random access display flag is stored in addition to PCR, and the video's audio frame head is stored in the corresponding payload portion by the flag. Whether or not data that can be used as an access point is stored.
  • the unit start display flag that indicates the start of the PES packet and the application field that indicates whether or not the application field follows in the header of the TS packet. Control information is also stored. The unit start display flag indicates the start of a new PES packet, and the PID indicates the type and attribute of the stream.
  • FIGS. 11 (a) to 11 (c) show the structure of packs constituting a program stream.
  • the pack has SCR in the pack header and stream_id in the packet header of the packet to be stored.
  • SCR is the PCR of the transport stream, and stream_id is substantially the same as the PID. Since the data structure of the PES packet is the same as that of the transport stream, PTS and DTS are stored in the PES header.
  • One of the major differences between a program stream and a transport stream is that multiple programs are allowed in the transport stream. In other words, it is assumed that only one program can be transmitted in the unit of program, but the transport stream is used to transmit multiple programs simultaneously. For this reason, in the transport stream, it is necessary for the playback device to identify one of the video stream and the audio stream constituting the program for each program.
  • FIGS. 13 (a) to (c2) show a PAT table and a PMAP table for transmitting the configuration information of the audio stream and video stream constituting the program.
  • the PMAP table stores information related to the combination of the video stream and audio stream used for each program
  • the PAT table stores information related to the combination of the program and the PMAP table.
  • the playback device can detect the video stream and audio stream that make up the program whose output is requested by the PAT table and PMAP table.
  • 16 sectors constitute an ECC block.
  • PS Pack is arranged at the sector boundary as shown in FIG. 14 (b). This is because the pack size and sector size are both 2KB.
  • a video object (TS1—VOB / TS2) that takes the form of a transport stream.
  • -VOB is a unit having a size of 8KB and is placed in the ECC block. This 8KB single TS packet with 18B header area and ATS information added to the data area.
  • ATS information is information that is generated and added by the DVD recorder, and is information indicating the timing at which the packet is transmitted from the outside to the DVD recorder.
  • FIG. 14 (c) there may be an MPEG-TS storage format in which a fixed byte ATS and an MPEG-TS packet are continuously recorded.
  • FIGS. 15A, 15B, 16A, and 16B are diagrams showing the data structure of a file called video management information (Video Manager) shown in FIG.
  • the video management information includes object information indicating management information such as recording positions of various objects on the disc, and reproduction control information indicating a reproduction order outside the object.
  • Figures 15 (a) and 15 (b) show PS—VOB # 1 to PS _V as objects recorded on the disc.
  • the PS-VOB information table, the TS1-VOB information table, and the TS2-VOB information table are individually provided according to the types of these objects.
  • Each information table contains VOB information for each object.
  • Each VOB information includes general information of the corresponding object, attribute information of the object, an access map for converting the playback time of the object into an address on the disk, and management information of the access map. is doing.
  • the general information includes the identification information of the corresponding object, the recording time of the object, etc.
  • the attribute information includes video stream information (V_ATR) including the coding mode of the video stream and the number of audio streams (AST_Ns). And audio stream information (A_ATR) including the audio stream coding mode.
  • the first is to prevent the playback path information from indirectly referring to the recording position of the object on the disc by the sector address, etc., and indirectly referring to the playback time of the object. .
  • the recording position of the object may be changed by editing, etc., but the playback path information is This is because when the recording position of an object is directly referred to by a sector address or the like, playback path information to be updated increases.
  • the playback path information when referring indirectly by the playback time, it is not necessary to update the playback path information, and only the access map needs to be updated.
  • an AV stream generally has two criteria of a time axis and a data (bit string) axis, and there is no perfect correlation between the two criteria.
  • the object information has an access map for performing conversion between the time axis and the data (bit string) axis.
  • the playback control information includes a user-defined playback path information table, an original playback path information table, and a title search pointer.
  • the playback path includes original defined playback path information automatically generated so that the DVD recorder shows all objects recorded during object recording, and the user can freely play back the playback sequence.
  • the playback path is collectively called PGC information (Program Chain Information) in DVD
  • user-defined playback path information is called U-PGC information
  • original playback path information is called O PGC information.
  • PGC information and U—PGC information are information that lists cell information, which is information indicating cells that are playback sections of objects, in a table format.
  • the playback section of the object indicated by PGC information is called the original cell (OCELL), and the playback section of the object indicated by U-PGC information is called the user cell (U_CELL).
  • the cell indicates the object playback section by the playback start time and playback end time of the object, and the playback start time and playback end time are converted into the actual recording position information of the object on the disc by the access map described above.
  • FIG. 17 is a diagram specifically explaining the relationship among objects, cells, PGCs, and access maps.
  • the original PGC information 50 includes at least one cell information 60, 61, 62, 63.
  • Cell information 60 ... specifies the object to be played, and specifies the object type and the playback section of the object.
  • the recording order of the cell information in the PGC information 50 indicates the reproduction order when the object specified by each cell is reproduced.
  • One cell information 60 includes type information (Type) 60a indicating the type of object specified by the cell information, an object ID (Object ID) 60b which is object identification information, and an object on the time axis. Start time information (Start_PTM) 60c and end time information (End_PTM) 60d in the object on the time axis.
  • Type type information
  • Object ID object ID
  • Start time information Start_PTM
  • End_PTM end time information
  • the cell information 60 in the PCG information 50 is sequentially read, and the object specified by each cell is reproduced for the reproduction section specified by the cell.
  • the access map 80c converts the start time information and the end time information indicated by the cell information into position information on the disk of the object.
  • PS_VOB and TS-VOB1 are generated mainly when the DVD recorder encodes the received analog broadcast into an MPEG stream as described in FIG. For this reason, I-picture and various time stamp information is generated by itself, the data structure inside the stream is clear for DVD recorders, and there is no problem in generating map information.
  • the TS2-VOB power mainly records the received digital broadcast directly on the disc without being encoded by the DVD recorder.
  • the DVD recorder detects an I picture and time stamp as follows for the map information of TS2-VOB recording a stream encoded outside the recorder.
  • the I picture is detected by detecting the random access display information in the application field of the TS packet shown in Figs. 12 (a) to 12 (d).
  • the time stamp is detected by detecting the PTS in the PES header.
  • PCR in the applicable field or ATS which is the arrival timing when the TS packet is transmitted to the DVD recorder, may be used instead.
  • the DVD recorder detects the position of the I picture from the information in the system layer, which is the upper layer, without analyzing the data structure of the video layer of the MPEG stream. This is because the load on the system is high because the analysis of the video layer is performed to generate map information.
  • the map management information includes map validity information and a self-encoding flag.
  • the self-encoding flag indicates that the DVD recorder is an object encoded by itself, the internal picture structure is clear, and the time stamp information of map information and the position information of the I picture are correct.
  • the map validity information indicates the presence or absence of a valid access map.
  • examples where the system layer cannot be detected include cases where the application field is not set and cases where the digital stream is not an MPEG transport stream. Since digital broadcasting can take place in various countries around the world, it is naturally expected that DVD recorders will record objects that cannot generate maps. For example, if a DVD recorder that assumes Japanese digital broadcasting is used in the United States and US digital broadcasting is recorded, an object that cannot generate a map may be recorded. [0118] However, the DVD recorder can also sequentially play back objects from which no map information is generated from the beginning. In this case, the recorded digital stream can be played back by outputting it to the STB corresponding to the stream via the digital I / F.
  • the player temporarily stores the optical pickup 201 that reads data from the optical disc 100, the ECC processing unit 202 that performs error correction of the read data, and the read data after error correction.
  • Track buffer 203 to store, PS decoder 205 that plays back program streams such as video objects (PS_VB), TS decoder 206 that plays back transport streams such as digital broadcast objects (TS2_VOB), and audio 'objects Audio decoder 207 for reproducing (AOB), still picture decoder 208 for decoding still image object data (POB), switching means 210 for switching data input to each decoder 205, 206... And a control unit 21 1 for controlling.
  • PS_VB video objects
  • TS decoder 206 that plays back transport streams
  • AOB audio 'objects Audio decoder 207 for reproducing
  • still picture decoder 208 for decoding still image object data (POB)
  • switching means 210 for switching data input to each decoder 205, 206...
  • a control unit 21 1 for controlling.
  • Data recorded on the optical disc 100 is read from the optical pickup 201 and stored in the track buffer 203 through the ECC processing unit 202.
  • the data stored in the track buffer 203 is input to any of the PS decoder 205, TS decoder 206, audio decoder 207, and still picture decoder 208, and is decoded and output.
  • the controller 211 determines the data to be read based on the reproduction sequence indicated by the reproduction path information (PGC) shown in FIG. That is, in the example of FIG. 16, the control unit 21 1 first reproduces the VOB # 1 partial section (CELL # 1) and then plays the VOB # 3 partial section (CELL # 2). Play back and control to play VOB # 2 (CELL # 3) at the end.
  • PPC reproduction path information
  • control unit 21 1 determines the type of cell to be played, the corresponding object, the playback start time of the object “1”, and the playback end time based on the cell information of the playback path information (PGC) shown in FIG. Can be earned.
  • the control unit 211 inputs the data of the object interval specified by the cell information to a suitable decoder. [0124] At this time, the control unit 211 specifies the object to be reproduced by the Object ID of the cell information. Further, the control unit 211 identifies the cell that is the playback section of the identified object by converting the StartPTM and EndPTM of the cell information into the address of the disk information using the corresponding VOB information access map.
  • the player of the present embodiment further has a digital interface 204 for supplying the AV stream to the outside.
  • a communication means such as IEEE1394 or IEC958. This is especially true for TS2-VOBs that have not been encoded, since there may be no corresponding decoder inside the player, so output directly to the external STB through the digital interface 204 without decoding. Can be played back on that STB.
  • the control unit 211 determines whether or not random access reproduction is possible based on the map management information in Fig. 15 (b). If the access point information flag is valid, the access map has I picture position information. Therefore, if there is a request for fast-forward playback or the like from an external device, the control unit 211 can output digital data including an I picture to the external device via the digital I / F. If the time access information flag is valid, time access is possible. Therefore, in response to a time access request from an external device, the control unit 211 outputs digital data including picture data corresponding to the designated playback time to an external device via the digital I / F. Can do.
  • the DVD recorder receives a user interface unit 222 that accepts display to the user and requests from the user, a system control unit 212 that manages and controls the entire DVD recorder, and VHF and UHF.
  • the decoder 218 includes the first and second decoders shown in FIG.
  • the DVD recorder includes a digital interface unit 219, a track buffer 220 for temporarily storing write data, and a drive 221 for writing data to the DVD-RAM 100.
  • the digital interface unit 219 is an interface for outputting data to an external device by communication means such as IEEE1394.
  • the user interface unit 222 first receives a request from the user.
  • the user interface unit 222 transmits a request from the user to the system control unit 212, and the system control unit 212 interprets the request from the user and makes a processing request to each module.
  • the system control unit 212 requests reception to the analog broadcast tuner 213 and encoding to the encoder unit 214.
  • the encoder unit 214 video-encodes, audio-encodes and system-encodes the AV data sent from the analog broadcast tuner 213 and sends it to the track buffer 220.
  • the encoder unit 214 sends the time stamp information included in the head data of the encoded MPEG program stream to the system control unit 212 as the playback start time (PS_VOB_V_S_PTM), and then creates an access map. Information necessary for this is sent to the system control unit 212 in parallel with the encoding process. This value is set in Start_PTM of cell information shown in FIG.
  • the time stamp information is generally PTS, but SCR can be used instead.
  • the system control unit 212 issues a recording request to the drive 221, and the drive 221
  • the data stored in the track buffer 220 is taken out and recorded on the DVD—RAM disk 100.
  • the above-mentioned continuous area (CDA) is searched from the recordable area on the disc, and data is recorded in the searched continuous area.
  • the recording end is instructed by a stop request from the user.
  • the recording stop request from the user is transmitted to the system control unit 212 through the user interface unit 222, and the system control unit 212 issues a stop request to the analog broadcast tuner 213 and the encoder unit 214.
  • Encoder 214 stops the encoding process upon receiving an encoding stop request from system control unit 212, and uses the time stamp information included in the end data of the MPEG program stream that was encoded last as the playback end time (PS_VOB_V_E_PTM). The data is sent to the control unit 212. This value is set in End_PTM of cell information shown in FIG. The time stamp information may be replaced with a power SCR that is normally set with a PTS.
  • system control unit 212 After the encoding process is completed, system control unit 212 generates PS-VOB VOB information (PS-VOBI) and playback control information shown in Fig. 15 based on the information received from encoder 214.
  • PS-VOB VOB information PS-VOBI
  • playback control information shown in Fig. 15 based on the information received from encoder 214.
  • the generated VOB information includes an access map suitable for the object type and map management information.
  • the system control unit 212 sets the map validity information of the map management information to be valid, and turns on the self-encoding flag.
  • an original playback path shown in Fig. 16 is generated, in which the object to be recorded is one of the playback targets.
  • the generated O—PGC information is added to the original playback path table.
  • the original playback path ( ⁇ PGC information) has cell information. “PS_V0B” is set in the cell information type information.
  • the system control unit 212 finishes recording the data stored in the track buffer 220 with respect to the drive 221 and outputs the V-B information (PS_V-BI) and playback control information for PS-VOB. Recording is requested, the drive 221 records the remaining data in the track buffer 220 and these pieces of information on the DVD-RAM disk 100, and the recording process ends.
  • PS_V-BI V-B information
  • the drive 221 records the remaining data in the track buffer 220 and these pieces of information on the DVD-RAM disk 100, and the recording process ends.
  • the encoder 214 converts the analog signal into a digital signal and converts it into an MPEG transport stream.
  • the encoder needs to encode, and the type information in the cell information is set to “TS1 -vo B”.
  • Start—PTM and End—PTM can be PTS or PCR.
  • the recording by outside encoding and the operation to record digital broadcasting will be explained in detail below.
  • the type of object to be recorded is TS 2-VB.
  • the digital broadcast recording request by the user is transmitted to the system control unit 212 through the user interface unit 222.
  • the system control unit 212 requests reception to the digital broadcast tuner 215 and data analysis to the analysis unit 216.
  • the MPEG transport stream sent from the digital broadcast tuner 215 is transferred to the track buffer 220 through the analysis unit 216.
  • the analysis unit 216 first transmits the transport stream as information necessary for generating the VOB information (TS2-VOBI) of the encoded MPEG transport stream (TS2-VOB) received as a digital broadcast first.
  • the time stamp information included in the head data is extracted as start time information (TS2-VOB-V-S-PTM) and sent to the system control unit 212.
  • the start time information is set in Start-PTM of the cell information shown in FIG. 17 generated later.
  • This time stamp information is PCR or PTS.
  • ATS which is the timing when the object is transmitted to the DVD recorder, may be used instead.
  • the analysis unit 216 further analyzes the system layer of the MPEG transport stream and detects information necessary for creating an access map. As described above, the position of the I picture in the object is detected based on the data (randam access indicator) in the adaptation field in the TS packet header.
  • the drive 221 takes out the data stored in the track buffer 220 and records it on the DVD-RAM disk 100. At this time, the system control unit 212 uses the file system allocation information to record on the disk. Instruct the drive 221 where to record, as described above.
  • the continuous area (CDA) is searched for the recordable area on the disc, and data is recorded in the searched continuous area.
  • the end of recording is instructed by a stop request from the user.
  • the recording stop request from the user is transmitted to the system control unit 212 through the user interface unit 222, and the system control unit 212 issues a stop request to the digital tuner 215 and the analysis unit 216.
  • the analysis unit 216 receives the analysis stop request from the system control unit 212, stops the analysis process, and displays the time stamp information included in the data of the end section of the MPEG transport stream that was analyzed last (TS2_VOB_V_E_PTM) To the system control unit 212. This value is set in End_PTM of the cell information shown in FIG. This time stamp information is PCR or PTS. Alternatively, ATS, which is the timing when the object is transmitted to the DVD recorder, may be used instead.
  • the system control unit 212 After receiving the digital broadcast, the system control unit 212 generates the TS 2-VOB VOB information (TS2-VOBI) and playback control information shown in FIG. 15 based on the information received from the analysis unit 216. To do.
  • TS2-VOBI TS 2-VOB VOB information
  • the generated VOB information includes an access map suitable for the object type and map management information.
  • the system control unit 212 sets the map validity information of the map management information to be valid.
  • the self-encoding flag is set to OFF. If a valid access map cannot be generated, the map validity information is set to invalid. Note that there are cases where a valid access map cannot be generated, such as when an unsupported digital broadcast is received or when there is no random access information in the applicable field. Also, when input directly from the digital I / F, there may be cases where it is not an MPEG transport stream, and in this case as well, the map validity information is set to invalid.
  • an original playback path (0-PGC information) shown in Fig. 16 is generated, in which an object to be recorded is one of playback targets.
  • the generated 0—PGC information is added to the original playback path table.
  • the original playback path (O_PGC information) has cell information. “TS2_V0B” is set in the cell information type information.
  • the system control unit 212 stores the drive 221 in the track buffer 220.
  • the recording of the recorded data, TS2—VOB information for VOB (TS 2—VOBI) and playback control information are requested to be recorded, and the drive 221 stores the remaining data in the track buffer 220 and these information on the DVD. — Record to the RAM disk 100 and finish the recording process.
  • the system control unit automatically replaces the user. It only issues a recording start and end request, and the operation of the DVD recorder is not essentially different.
  • the basic operation at the time of recording / reproducing of the information recording / reproducing apparatus of the present invention is almost the same as described above, only the basic operation at the time of analog external input recording will be specifically described below with reference to FIG. To do.
  • the type of object to be recorded is TS1 VOB.
  • the external input recording request by the user is transmitted to the system control unit 212 through the user interface unit 222.
  • the system control unit 212 requests reception to the external input unit 223 and data encoding to the encoder 214.
  • the MPEG transport stream sent from the encoder 214 is transferred to the track buffer 220.
  • the encoder 214 uses the time stamp information included in the first data of the transport stream as information necessary for generating the VOB information (TS1-VOBI) of the MPEG transport stream (TS1-VOB) that has been encoded first. It is set as start time information (TS1-VOB-V_S_PTM) and sent to the system control unit 212.
  • the start time information is set in Start_PTM of the cell information shown in FIG. 17 that is generated later.
  • This time stamp information is PCR or PTS.
  • the encoder 214 further generates information necessary for creating an access map while generating an MPEG transport stream.
  • the adaptation field should be included, the random access indicator bit should be set, and the VOBU start Is transferred to the system control unit 212.
  • the system control unit 212 outputs a recording request to the drive 221, and the drive 221 extracts the data stored in the track buffer 220 and records it on the DVD-RAM disk 100. At this time, the system control unit 212 instructs the drive 221 where to record on the disk from the allocation information of the file system. At this time, the above-mentioned continuous area (CDA) is searched from the recordable area on the disc, and data is recorded in the searched continuous area.
  • CDA continuous area
  • the end of recording is instructed by a stop request from the user.
  • the recording stop request from the user is transmitted to the system control unit 212 through the user interface unit 222, and the system control unit 212 issues a stop request to the encoder 214.
  • Encoder 214 stops the encoding process in response to a recording stop request from system control unit 212, and displays the time stamp information included in the end section data of the MPEG transport stream that has been encoded last. (TS1-VOB-VE-PTM) is sent to the system control unit 212. This value is set in End-PTM of the cell information shown in FIG. This time stamp information is PCR or PTS.
  • the system control unit 212 After completion of the recording process, the system control unit 212 generates TS1-VOB VOB information (TS1-VOBI) and playback control information shown in Fig. 15 based on the information received from the encoder 214.
  • TS1-VOBI TS1-VOB VOB information
  • the generated VOB information includes an access map suitable for the object type and map management information.
  • the system control unit 212 sets the map validity information of the map management information to be valid.
  • the self-encoding flag is set to ON.
  • the original playback path (0-PGC information) shown in Fig. 16 is generated in which the object to be recorded is one of the playback targets.
  • the generated 0—PGC information is added to the original playback path table.
  • the original playback path (O_PGC information) has cell information. “TS1_V0B” is set in the type information of the cell information.
  • the system control unit 212 finishes recording the data stored in the track buffer 220 for the drive 221, and V1B information (TS1_V0BI) and playback control information for TS1-VOB.
  • Drive 221 and the remaining data in track buffer 220 are recorded on the DVD—RAM disk 100, and the recording process is terminated.
  • Fig. 21 (a) shows the structure of a self-encoding MPEG transport stream.
  • the MPEG transport stream of self-encoding is divided into V0BU units, and PAT packets and PMT packets as well as user private packets with embedded stream-specific information at the beginning of each VOBU ( This is referred to as “UP packet” below).
  • PAT packets and PMT packets are placed at least at the beginning of V0B.
  • each packet is given ATS which is decoder input time information, and each packet is transferred to the decoder at the time intended by the corresponding ATS.
  • the self-encoding program information (such as PMT packet PID) is stored in the PAT packet of the first packet, and is input to the decoder at the time of ATS1.
  • the PMT packet of the second packet stores the PID and the like for each elementary stream making up the program.
  • PIDs of video, audio, data broadcast ("Data" in the figure), and user private (“private” in the figure) packets are stored.
  • Additional information to the stream is stored in the UP packet of the third packet.
  • stream title information such as stream encoding information (bit rate, video resolution, frame rate, aspect ratio, encoding method, etc.)
  • stream encoding information such as stream encoding information (bit rate, video resolution, frame rate, aspect ratio, encoding method, etc.)
  • external input is analog or digital Input source identification information such as, information that specifies the encoding method of input AV data if it is digital
  • copyright protection information such as copy permission / non-permission, VBI (Vertical Blanking Interval) )
  • VBI Very Blanking Interval
  • Fig. 22 (a) is a block diagram showing the configuration of a basic decoder called the transport stream system target decoder (T-STD), which analyzes PSI packets not mentioned above.
  • FIG. 5 is a diagram additionally showing a system decoder 235 for controlling the decoder.
  • PAT and PMT packets which are PSI packets
  • T-STD When PAT and PMT packets, which are PSI packets, are input to T-STD, they are discriminated by demultiplexer 232 according to the packet type, and PSI packets related to system control are instantly transferred to transport buffer 233 .
  • the PSI data becomes valid when the necessary PSI data is available in the system buffer 234.
  • the MPEG T-STD model specifies the operation model of the decoder
  • T_STD interprets and validates the PID of UP packet specified in PMT packet.
  • the last byte (m bytes) needs to be stored in the system buffer 234.
  • n is the byte length of the adaption_field of the PMT packet.
  • the minimum time interval between ATS1 and ATS2 and the time interval between ATS2 and ATS3 is 4536 and 5616, respectively.
  • FIG. 23 shows the UP packet storage method when the UP packet is defined as a User Private stream.
  • the PMT stream_type corresponding to the UP packet is assigned an identification number greater than or equal to 0x80 and less than or equal to OxFF, a unique PID is assigned to the UP packet, and the data structure inside the UP packet is outside the MPEG standard.
  • the UP packet has a DVD_attribute_section () and a section structure.
  • the UP packet has a private-section structure and a unique PID is given.
  • the data structure of private-section is slightly different.
  • the unique data of UP packet is stored in private_data_byte of private_section. In this case, an identification number of 0x05 is assigned to stream_type.
  • FIG. 25 shows a method of storing an UP packet as a packet having the same PID as that of PMT.
  • the data structure of the UP packet follows the private_section structure.
  • stream_type is not defined, and the PID of the PMT packet is assigned to the UP packet.
  • FIG. 26 shows a method of enclosing a PMT packet without providing an UP packet individually.
  • the unique data corresponding to the UP packet has a private_section structure, and the private one section is described following the TS one program one map one section. That is, store both TS-program-map-section and private-section in the PMT bucket.
  • the unique data includes RDI-GI (Rea ⁇ time Data Information General Information) of the RDI Unit of the DVD Video Recording standard.
  • DCI ⁇ Has CCI (Display Control Information and Copy Control Information).
  • RDI—GI stores the start playback start time (VOBU—S—PMT) and recording date / time information of the VOBU
  • DCI_CCI stores aspect ratio information, subtitle mode information, film in the VOBU.
  • 'Information related to display control such as camera mode information, copy generation management information, APS information, input source information, etc. are stored.
  • V_ATR includes video bit rate information, resolution information, frame rate M blueprint (or video_format information such as NTSC / PAL), aspect ratio information, encoding method (MPEG2_Video, MPEG1-Video, etc.) Information) is stored.
  • A—ATR also contains information such as the audio bit rate, encoding method, number of channels, number of quantization bits, dynamic range control, etc., depending on the number of audios. Stored.
  • CC data may be stored in advance in extension_and_user_data (l) (method for storing user data in the GOP layer) format.
  • C data may be described in a separate description method.
  • MPEG is described in a format that stores CC data in GOP layer user data.
  • the PS conversion efficiency is increased because the DVD-Video and DVD Video Recording standards do so.
  • C_SE describes information on several problems that will be a problem during TS2PS conversion of the VOBU (or VB).
  • CC / WSS / Teletext data storage location information whether the CC data is in the UP bucket or the data described as user data in each picture header or this VOBU (V0B) This information identifies whether there is no CC data.
  • the WSS storage location information is information indicating whether it is stored in the UP packet as unique data or is described in the user data of each picture header.
  • the Teletext storage position information is information indicating the power stored in the TS packet storing Teletext, whether it is described in the user data of each picture header, and the like.
  • Multiplexed block structure Concerning transfer information, the multiplexed block shown in Fig. 27 (only one elementary stream S, data block stored without being mixed with other elementary streams) is configured. Whether the TS packet to be used is a fixed number or a variable number ⁇ If it is a fixed number, information indicating the fixed number, information indicating whether PTS / DTS is attached to the first TS packet of the multiplexed block, Information about the transfer rate in the same multiplexed block is described. In MPEG_TS encoding, which does not impose conditions on conventional multiplexing, the multiplexed block has a fixed length size consisting of only one TS packet. Can also be described.
  • Each decoder buffer control information includes information indicating video buffer margin such as vbv—delay and vbv—buffer—size, which are video verification buffer parameters (this Information can be used to determine how far ahead the video data can be read from the ATS input time), and the input completion time of the frame in the VOBU whose buffer input time is closest to the decoding time of that frame And the time difference information between the decoding time and the decoding time (this information can be used to determine how much video audio data can be read after the ATS input time).
  • video buffer margin such as vbv—delay and vbv—buffer—size
  • DVD_Compatibility information is information indicating how much load there is when transcoding the MPEG-TS to MPEG-PS conforming to each DVD standard.
  • the level 1 indicator, CC, WSS, and Teletext data exist because the multiplexed block is configured with 2 KB or less
  • CC and WSS data are stored in the UP packet
  • Teletext is the video data. If it is stored as a Teletext packet in the multiplexed block that stores the data, there is no need to consider buffer management when storing the level 2 indicator, CC, WSS, and Teletext data in the area defined by each DVD standard. If you do not need to consider buffer management when replacing the ATS of the multiplex block's first TS packet with the SCR, level 4 indicators, etc., and the MPEG-TS into each DVD format This information indicates the convertibility of whether or not it can be easily converted.
  • This DVD-compatibility information is an information group indicating ease of conversion corresponding to each DVD format, such as DVD-Video, DVD-Audio, DVD Video Recording, DVD Stream Recording, and the like.
  • Fig. 27 shows a structure diagram of MPEG-TS using multiplexed blocks and a data structure diagram when it is converted into DVD-Video and DVD Video Recording formats.
  • the self-recording TS stream shown in Fig. 27 (a) is composed of V0 BU (unit of playback * decoding) of the self-recording TS stream shown in Fig. 27 (b).
  • V0 BU unit of playback * decoding
  • Fig. 27 (c) one VOBU is composed of multiple multiplexed blocks (corresponding to the MPEG-PS pack).
  • each Multiplexed blocks may be divided into fixed-length data sizes as shown in Fig. 27 (d) (this simplifies implementation on equipment), or as shown in Fig. 27 (e).
  • the data may be divided into variable length data sizes (in this case, the capacity of the recording medium is not wasted).
  • a non-elementary stream such as a PSI / SI packet or UP packet and an elementary stream are separated from each other to form a multiplexed block.
  • non-elementary streams such as PSI / SI packets and UP packets may be stored together with elementary streams in the multiplexed block.
  • multiplexed block # 1 and multiplexed block # 2 are one multiplexed block.
  • the stream can be easily converted into the DVD-Video format shown in Fig. 27 (g) or the DVD Video Recording format shown in Fig. 27 (h).
  • MPEG-PS packs are formed according to the sequence of multiplexed blocks, and one multiplexed block is a unit that stores one pack of data. This is important for easy TS2PS conversion. It is.
  • Fig. 27 the capsule header and ATS are omitted because they are not related to the present invention.
  • the converted MPEG-PS packs shown in Figs. 27 (g) and 27 (h) are stuffed and padded according to the byte length of the stored elementary and VOBU alignment.
  • FIG. 28 is a diagram for explaining multiplexing in the present invention in correspondence with the conventional stream multiplexing method shown in FIG.
  • the final format is a format compliant with the MPEG-TS in FIG. 28 (g).
  • a video stream (Fig. 28 (a)) has multiple GOP forces (Fig. 28 (a)).
  • Each GOP consists of predetermined picture data, and a TS packet group having a data amount equivalent to the data amount of one pack when converted to MPEG-PS is defined as one multiplexed block (see Fig. 28 (c)). ). That is, one multiplexed block is divided into a plurality of TS packets corresponding to the data amount of one pack as shown in FIG. 28 (d).
  • V0BU is configured by multiplexing in units of multiplexed blocks. As described above, according to the present invention, it corresponds to the data amount of one pack of MPEG-PS. (See Fig. 28 (e).) Point This is the biggest difference from the conventional example shown in Fig. 8.
  • ATSi 0, l, 2, ...) satisfies the relationship of the following equation.
  • the multiplex block has a fixed length, the number of TS packets included in one multiplex block is constant, so the boundary of the multiplex block can be easily known.
  • the multiplex block has a variable length, the number of TS packets included in one multiplex block is indeterminate, making it difficult to know the boundaries of the multiplex blocks. Therefore, in this case, the ATS value increment (A ATS) at the boundary of the multiplexed block is set to a predetermined value different from the increment (constant value) in the multiplexed block.
  • the difference ( ⁇ ATS) between the ATS value of the last packet in the previous multiplex block and the ATS value of the first packet in the immediately following multiplex block is set to a predetermined value different from the constant value.
  • the ATSi assigned to the first packet of the multiplexed block in MPEG-TS corresponds to the SCRi assigned to each converted MPEG-PS pack.
  • character information such as Closed Caption and DSI may be stored in the UP packet.
  • the DSI in the UP packet is used to generate the converted NV_PCK data, and the Closed Caption is stored in the video pack.
  • a packet storing teletext data in a multiplexed block may be inserted between packets storing video data.
  • Tel Packets storing etext data are placed immediately before the picture with the PTS displayed at the same time.
  • Teletext data is stored in the video pack after conversion.
  • Figure 31 shows the data structure of the UP packet that stores DSI, etc. as described above.
  • the additional information of the UP packet may include information (such as the relative number of the VOBU head force) that identifies the TS packet that stores the last byte of the VOBU head I picture. Good special reproduction can be realized.
  • information such as the relative number of the VOBU head force
  • picture coding type information of all pictures for example, information specifying a TS packet including the last byte
  • data length information of the pictures for example, information specifying a TS packet including the last byte
  • the TS packets forming the multiplexed block may be appropriately stuffed so that the data stored in the pack does not overflow in consideration of conversion to MPEG-PS.
  • the necessary number of stuffing bytes may be inserted from the last TS packet of the multiplexed block.
  • MPEG-PS converted streams may be recorded on the same or different recording media.
  • the force UP packet for recording the PAT, PMT, and UP packet may be omitted.
  • the PAT, PMT, and UP packet placement is fixed at the head.
  • the present invention is not limited to this.
  • a packet storing NuU packets or the like is inserted between them. May be recorded.
  • the self-encoding stream starts with a PAT packet.
  • the system transfer rate may be set to a fixed rate by appropriately inserting a null packet into a self-encoding stream.
  • a data area for storing manufacturer-specific information is provided, and MPE is stored there.
  • FIG. 33 shows the configuration of the encoder of the information recording apparatus according to the present invention.
  • the encoder 214 is powered by the elementary encoders 230a, 230b, and 230c and the system encoder 232.
  • the encoder 214 receives a control signal from the system control unit 212, and performs encoding processing while switching to elementary encoding or system encoding by the elementary encoders 230a, 230b, 230c and the system encoder 232. Do.
  • Each of the elementary encoders 230a, 230b, and 230c receives and encodes video, audio, and VBI (Vertical Blanking Interval) signals.
  • VBI Very Blanking Interval
  • the video encoder 230a receives the control signal from the system control unit 212, and encodes the attributes such as the bit rate, resolution, and aspect ratio of the video stream within a predetermined range according to the control signal. Specifically, at the start of encoding, the video encoder 230a selects one of the operation modes of “DVD—Video compatible mode”, “DVD Video Recording compatible mode”, or “normal mode” from the system control unit 212. Receives the specified control signal. If the mode specified by the control signal is “DVD_Video compatible mode”, a video stream conforming to the video attribute of the DVD —Video standard can be generated. If it is “DVD Video Recording compatible mode”, DVD Video Recording (hereinafter “DVD VR” ) If the video stream conforms to the standard video attribute and “normal mode”, the video stream conforms to an attribute of a certain predetermined category.
  • DVD VR DVD Video Recording
  • the audio encoder 230b receives the control signal from the system control unit 212, and encodes the audio stream bit rate, the number of quantization bits, the number of channels, and the like within a predetermined range according to the control signal.
  • the video encoder 230a specifically, when the control signal indicating the operation mode is received from the system control unit 212 and the mode indicated by the control signal is “DVD—Video compatible mode”, the audio of the DVD—Video standard is used. If the audio stream conforming to the attribute is “DVD Video Recording compatible mode”, the audio stream conforming to the audio attribute of the DVD VR standard is conforming to the attribute of a predetermined category if it is “normal mode”. Audio stream.
  • the VBI encoder 230c also receives a control signal designating an operation mode from the system control unit 212, and encodes VBI data according to this control signal. Specifically, when the elementary stream encoding control signal input from the system control unit 212 to the VBI encoder specifies “DVD_Video compatible mode” or “DVD Video Recording compatible mode”, the VBI encoder 230c According to the VBI data storage method specified in each standard, VBI data is additionally encoded. The additional encoding means that the method of storing VBI data may be determined separately even in the original normal mode, meaning that it is stored in the elementary stream in duplicate. [0239] The encoded elementary streams are multiplexed into the MPEG-TS system stream by the system encoder 232 as described above.
  • the system encoder 232 also receives an encoding control signal from the system control unit 212 in the same manner as the elementary stream encoders 230a, 230b, and 23 Oc, and performs encoding according to this.
  • the control signal from the system control unit 212 to the system encoder 232 adds MP EG -PS (especially a DVD specific format) to the system encoding control signal power to normal MPEG _TS, normal MPEG—TS.
  • MPEG -PS especially a DVD specific format
  • System encoding control signal DVD—Video mode power ⁇ DVD Video Recording mode
  • system ender 232 is connected to each elementary streamer 230a, 230b, 230c force, and so on.
  • System encoding is performed while buffer management is performed so that the stream does not fail with the decoder model (hereinafter referred to as “T-STD”), which is the standard for MPEG-TS system streams.
  • T-STD decoder model
  • the self-encoding MPEG-TS system stream generated in this way is output from the encoder 214.
  • the information recording apparatus of the present invention is characterized in that the encoding mode is individually switched between the elementary stream and the system stream level.
  • Fig. 34 shows a table that summarizes the processing when converting to DVD format for each encoding mode by switching the encoding mode.
  • elementary stream encoders 230a, 230b, 230c and system stream encoder 232 can be converted to MPEG-PS easily by encoding on the premise of conversion to MPEG-PS.
  • MPEG-TS is created.
  • information representing the coding condition of the stream is stored in VOBI that stores attribute information and the like in units of MPEG-TS streams. Whether or not the stream can be easily converted to the DVD-Video or DVD VR format without analyzing the stream by storing the information indicating the sign key condition in the management information in the stream. It becomes possible to perform the determination quickly. Note that the information indicating the code condition of this stream may be stored in the Tip packet described later.
  • MPEG—TS Constrained SESF
  • the encode_condition 00b indicating normal MPEG-TS has no meaning in the stream (in the Tip packet described later).
  • the use of encode_condition may be different outside the Z in the stream, as reserved and prohibited.
  • FIG 80 shows the overall stream structure of Constrained SESF.
  • Constrained S ESF consists of multiple SESF capsules.
  • the SESF capsule includes a predetermined Multiplexing Unit, and has a Tip packet (details will be described later) at the beginning.
  • the playback time information (PTS) of each SESF capsule and the address information of the Tip packet are associated by the access map 80c. As will be described later, in TS2PS conversion, conversion processing is performed for each SESF capsule.
  • Fig. 32 shows the correspondence between each packet in one SESF capsule and the MPEG-PS pack.
  • a TS packet (hereinafter referred to as “Tip packet”) in which the stream specific information is stored is inserted into the Constrained SESF.
  • Tip packet TS packet
  • the Tip packet embedded in the Constrained SESF is described below with reference to FIGS. 35 to 41.
  • FIG 35 shows the overall structure of the Tip packet.
  • the Tip packet corresponds to the Data-ID for identifying that the packet is a Tip packet and the DCI-CCI field of DVD VR, and includes display control and copy control information.
  • Figure 37 shows the structure of Data_ID.
  • Data_ID includes Data_Identifier to identify that the packet is a Tip packet.
  • Data_Identifier is a 3-byte field with a value of “0x544950” that represents “TIP” in ASCII code. The playback device decoder can determine the value of this field and identify it as a Tip packet.
  • Figure 38 shows the structure of display—and—copy—info. By making this display—and—copy—info have the same structure and information as the DCI—CCI of the DVD VR RDI Unit, the RDI pack can be generated when converting the Constrained SESF to the DVD VR format. Making it easy.
  • Figure 39 shows the structure of encode_info.
  • the video_resolution field describes the resolution information of the video stream that follows the Tip socket.
  • the encode_info value is shown below.
  • 0000b 720x480 (NTSC), 720x576 (PAL)
  • 0100b 544x480 (NTSC), 544x576 (PAL)
  • 0101b 480x480 (NTSC), 480x576 (PAL)
  • the resolution power during one continuous recording may be variable.
  • streams with different resolutions are managed as separate VOBs, and seamless connection during playback is guaranteed depending on the recorder. Therefore, if the resolution changes during Constrained SES F recording, this field is used to determine which point force VB should be separated when converted to DVD VR format.
  • the encode condition field is the value stored in VOBI (except when it is 00b) ) Are the same.
  • the encode-condition field is embedded in the stream as well as the stream management information, even if the stream is copied via a digital interface represented by IEEE1394. This is because the recording device can easily determine whether it can be converted to the DV D format by checking the encode_condition field in the Tip packet.
  • DVD VR standard VOBU_S_PTM is recorded in the FVFPST field.
  • the video stream encoded following the Tip packet is analyzed and the playback time of the video field displayed first is calculated. This is to omit the processing to be performed.
  • the FVFPST field represents the display time of the video field with 90 KHz accuracy.
  • FIG 40 shows the structure of PES-info.
  • PES_info is essential information for converting Constrained SESF into DVD-Video format without analyzing elementary streams. This information is necessary to generate information stored in a pack that supports special playback called NV-PCK that is inserted into the DVD-Video stream.
  • PES-info can store information of PES packets storing a total of 136 video data and audio data. Each PES packet is assigned 4 bits of data so that NV-PCK information can be generated without analyzing the inside of the PES packet. If there is a PES packet that does not store video or audio data, the PES packet is ignored.
  • PES_existence_flag indicates whether or not the jth PES packet exists in the corresponding SESF Capsule. Flag.
  • the value of PES_existence_flag is set as follows.
  • the PES-payload-identifier is information for identifying whether the data is video data or audio data stored in the PES packet.
  • PES_existence_flag and PES_payload_identifier are fields describing all target PES packets.
  • 01b A frame-encoded I picture, a pair of field-encoded I pictures, or a pair of field-encoded I pictures and field-encoded P pictures
  • the 01b or 10b picture is a reference picture defined in the DVD-Video standard.
  • the above is additional information for PES packets that store video.
  • the PES packet is followed by the PES packet.
  • sync_presentation_flag which is a flag for determining whether or not it contains an audio frame that starts playing immediately after.
  • the identification of the first audio stream power and the second audio stream can also be determined by the PID setting rule, the order of the elementary stream declarations in the PMT, and the like.
  • sync_presentation_flag The value of sync_presentation_flag is set as follows.
  • the audio PES packet contains an audio frame that starts playing at the same time as or immediately after FVFPST.
  • the audio PES packet contains an audio frame that starts playing immediately after or immediately after FVFPST.
  • PES—info is a field for extracting and storing information for each individual PES packet following the Tip packet.
  • FIG 41 shows MakersPrivateData.
  • MakersPrivateData provides a maker—ID that identifies the manufacturer that generated the Constrained SESF, and a maker—private—data that describes the manufacturer's unique additional information.
  • Figures 42 (a) and (b) show an example of the PID of the Tip packet and the stream_type value indicating the stream type. Since both PID and stream_type have reserved values in MPEG and other standards, the above values were selected taking into account that they are private data that does not interfere with them and are outside the MPEG standard.
  • a TS packet that stores an elementary stream in Constrained SESF consists of a multiplexing unit, which is a unit that collects data stored in a 2 KB pack in DVD format.
  • This multiplexing unit corresponds to the multiplexed block of the first embodiment.
  • One Multiplexing Unit is composed of 11 consecutive TS packets, and the elementary stream (payload data) in each Multiplexing Unit is completely stored in one corresponding pack. This also limits the relevance of the pack.
  • TS packet payload data of 184 X 11 2024B. This is to make it possible to transfer the stream with maximum efficiency and to execute it easily at the time of STS2PS conversion with TS packet unit sequential processing power. If the data amount of the Multiplexing Unit other than the last is recognized as 2024B or less, the value of PES_packet_length stored in the packet header of each MPEG-PS pack when converting the first TS packet of the Multiplexing Unit during TS2PS conversion is easy. Can not be determined.
  • the first complete audio frame data starting in the Multiplexing Unit must be the first audio frame in the PES packet payload.
  • PES packets storing audio streams are stored in multiple Multiplexing Units. Assuming that one audio PES packet is divided and arranged in multiple Multiplexing Units, when converting the second and subsequent Multiplexing Units into MPEG-PS packs, the PTS is specified to generate a packet header. It is necessary to determine the number of audio frames stored in one pack. For this reason, internal analysis of the audio stream is required during TS2PS conversion, and the conversion process is avoided.
  • the above is the definition of Multiplexing Unit.
  • the encoder that generates the Constrained SESF performs system encoding within the restrictions of the Multiplexing Unit.
  • the value of PES-packet-legnth may be allowed to be 0 in the case of a video stream stored in MPEG-TS.
  • PTS-DTS-flags is a flag indicating whether or not PTS and DTS are described.
  • PTS_DTS_flags is set to 10b (or l ib if DTS is present).
  • PES_extension_flag and PES_header_data_legnth have restrictions for performing sequential processing in units of TS packets during TS2PS conversion. This is shown in FIG.
  • each value is defined by the type of elementary stream, the position of the PES packet, and the value of the encode condition.
  • the VPD in FIG. 44 is the byte length obtained by adding the PTS field and the DTS field of the PES packet. That is,
  • the decoder input time indicated by the ATS (ATS1) of the Tip packet, and the decoder input time indicated by the ATS (ATS2) of the TS packet that stores the video or audio stream that is input to the decoder first following the Tip packet. Must have the following relationship:
  • T is the minimum transfer period of the PS pack. This minimum transfer period is the minimum period from the start of input of the PS pack to the system decoder until completion. That is, the above equation shows that the ATS interval of each TS packet needs to be at least larger than the interval at which the converted PS pack can be input to the system decoder.
  • the value of T is calculated as follows.
  • PS_pack_size is the MPEG-PS 1-pack byte length generated by TS2PS conversion
  • system_clock_frequency is the MPEG-PS decoder reference time frequency
  • PSrate is the MPEG-2 PS stream generated by TS2PS conversion. Is the multiplexing rate.
  • the DVD format takes the following values, so the relationship between ATS1 and ATS2 is as follows.
  • PSrate 10080000 bits / second
  • ATS1 + 43886 ATS2 is the minimum value of ATS2.
  • S the force to convert a Tip packet into a pack with 2KB size of NV_PCK (DVD-Video conversion) or RDI_PCK (DVD VR conversion) in TS2PS conversion described later, S satisfies the above formula. If not, the transfer time of the subsequent elementary stream will be advanced and the DVD system transfer rate will exceed the upper limit of 10.08 Mbps.
  • the time width on the playback time axis of video data stored in one SESF capsule must be not less than 0.4 seconds and not more than 1.0 seconds.
  • encode— condition 11 b (DVD—Video mode).
  • each Tip packet should be pointed one-to-one with an access map that performs time-to-address translation.
  • DSI Data Search Information
  • the access map stores the playback time (part or all of the AV playback time information immediately after the tip packet according to FVFPST) and the recording address of the tip packet for each tip packet, and between two consecutive tip packets. It is only necessary to know how many Multiplexing Units are stored. This is achieved by the following constraints.
  • tip packets need to be pointed from the access map.
  • AV data following the last tip packet in the strained SESF has the playback time length and the next tip packet.
  • the handling is different because it is in a different state from other Tip packets. In such a case, even if the last tip packet is not registered in the access map, there is no particular problem in playback and conversion.
  • a total of 32 packets that do not belong to the Multiplexing Unit are inserted between two consecutive Tip packets. This is necessary to specify how many packs of VOBU will be when converting to DVD format using the access map during TS2PS conversion. (The number of packets need not be limited to 32, but it must be a certain number. Since the number of TS packets that follow the tip packet can be identified from the address information of the tip packet in the access map, Multiplexing If you know how many packets are not Units, when you convert to DVD format, you can specify whether the VOBU contains a pack of shoes.This is important, and this information is the MakersPrivateDa in the MNF and each Tip packet. It may be described in ta.)
  • the reason for 32 is that PAT and PMT packets indicating MPEG-TS program configuration information are embedded at least once in 100 msec, and SIT packets storing unique information for each program are at least 1
  • Each Multiplexing Unit is loaded with one or more times per second, a PCR packet that stores a PCR (Program Clock Reference) that generates the decoder reference time is loaded at least once in 100 msec.
  • PCR Program Clock Reference
  • the insertion interval of Tip packets is 1.0 seconds or less on the AV data playback time axis, at least 31 packets between two consecutive Tip packets If you have PAT, PMT, PCR, and SIT packets, you can do that. Therefore, by inserting PAT, PMT, PCR, SIT packets according to the time between two consecutive Tip packets, and adding NULL packets to 32 packets, the number of VOBU packs can be calculated as an access Can be identified from the list.
  • this number of packs and playback start time information for each V OBU it is possible to generate NV-PCK DSI packets necessary for conversion to DVD Video very quickly.
  • Constrained SESF needs to be created to meet the standards of T-STD, the MPEG-TS standard decoder model. This means that even STBs equipped with T STD-compliant decoders can decode Constrained SESF as long as the stream type matches.
  • MPEG-TS standard decoder model T-STD and MPEG-PS standard decoder model P-STD have almost the same processing capability, but input to the audio stream decoder.
  • the rate is different.
  • the transfer rate from the transport buffer before the audio decoder to the audio buffer is fixed at 2 Mbps, excluding AAC.
  • P—STD With a system rate, that is, a DVD, a stream of 10 ⁇ 08 Mbps can be used to power various streams to the decoder.
  • the Constrained SESF of the present invention is T-STD compliant and encoded in advance so as to ensure that it is compliant with MPEG-PS power S and P-STD generated by the conversion method described later. Need to be done.
  • Constrained SESF is a stream encoded in MPEG-TS so that it becomes P-STD compliant even if converted to MPEG-PS.
  • FIG. 45 shows an example of MPEG-TS that is self-encoded so as not to satisfy the power T STD model that can be converted into MPEG-PS.
  • Stream TS1 is an MPEG transport stream that is system-encoded to comply with the T-STD model.
  • Stream TS2 is an MPEG transport stream that does not conform to the T-STD model. That is, in stream TS2, the values of ATS [47] to ATS [57] are set so as to exceed the transfer rate allowed for audio data in MPEG-TS. This causes the transport buffer (see Figure 18) to overflow, and does not satisfy the T_STD model.
  • the stream TS1 is set so that the values of ATS [47] to ATS [57] satisfy the transfer rate allowed for audio data in MPEG-TS.
  • This stream can be correctly converted to P-STD-compliant MPEG program stream PS 1 using the SCR conversion formula described below.
  • stream TS2 does not satisfy T-STD, but if it is converted using the SCR conversion formula described later, PS1 is generated.
  • the audio packet transfer time interval specified in ATS [47] to ATS [57] should be extended to prevent the transport buffer from overflowing. is required.
  • FIGS. 46 (a) and 46 (b) show an example in which the MPEG-TS force that T-STD satisfies and the converted MPEG-PS does not satisfy the P_STD model.
  • Stream TS3 is an MPEG transport stream
  • stream PS3 is an MPEG program stream converted from MPEG transport stream TS3.
  • Figure 46 (b) shows the change in the state of the video data buffer when each stream is decoded.
  • the decoding time of the PES # 1 picture is SCR [2]
  • the decoding time of the PES # 2 picture is between SCR [4] and SCR [5].
  • the stream of Constrained SESF has the structure shown in Fig. 14 (c).
  • a PCR packet storing reference time information (PCR) is appropriately inserted, and this is used to reset the STC (System Time Clock), which is the decoder reference time, at certain time intervals.
  • STC System Time Clock
  • Each TS packet is preceded by an ATS that stores relative transmission time information between TS packets. Therefore, TS packets sent after the TS packet storing the PCR are input to the decoder at a timing obtained from the PCR value and ATS which is the relative sending time information between TS packets.
  • the decoder input time of each TS packet (hereinafter referred to as “calculated_PCR”) can be generated for TS packets after the TS packet storing the PCR. Even if there is no TS packet storing PCR, it is possible to extract information corresponding to PCR as management information.
  • FIG. 47 is a diagram showing the relationship between calculated_PCR and SCR when converted from Constrained SESF to MPEG-PS, and is the head of the Capsule shown in FIG.
  • the ATS assigned to each TS packet in ascending order from the beginning of the stream is denoted as ATS [k].
  • the SCR of the converted pack is also written as SCR [i] in the order of appearance.
  • the maximum transfer rate for video stream transfer is 15Mbps (in the case of MP @ ML, the transfer rate from the multiplexer buffer to the video buffer does not exceed 15Mbps).
  • the audio stream input rate has a lower rate limit than video. (Transport buffer power and audio buffer transfer rate does not exceed 2Mbps except AAC) Therefore, the Multiplexing Unit that stores the audio data has a low rate unlike the Multiplexing Unit that stores the video data. Forwarded.
  • PCR_tip and ATS_tip are the PCR value described in the Tip packet immediately before the Multiplexing Unit to be converted and the ATS value of the Tip packet, respectively.
  • WA indicates how many digits overflowed in ATS between ATS (ATS [n]) and ATS_tip given to the first TS packet in the i-th multiplex unit.
  • BS Represents the amount of one-time overflow of the ATS.
  • Max (a, b) is a function that selects the larger value of a and b.
  • PS-pack-size is MPEG-PS pack 1 generated by TS2PS conversion. It is the length of bytes.
  • the sy stem-clock-frequency is the frequency of the MPEG-PS decoder reference time, and P Srate is the multiplexing rate of the MPEG-PS stream generated by TS2PS conversion.
  • PSrate 10080000 bits / second.
  • PTS (DVD- Video) PTS (Constrained SESF)-calculated— PCR [0]
  • DTS (DVD— Video) DTS (Constrained SESF)-calculated— PCR [0] ATS [n]
  • WA is as above, i This is the ATS value of the first TS packet of the second Multiplexing Unit and the number of overflows from the ATS-tip.
  • the Constrained SESF described here is a force that excludes LPCM S, in order to avoid the risk of re-encoding elementary streams in the case of LPCM with 20 or more quantization bits. This is also to facilitate buffer management by reducing the amount of audio data for which the transfer rate cannot be increased. However, if it is a 16-bit LPCM, there is no need to exclude it.
  • the following two streams are allowed for Constrained S ESF: MPEG2-Video for video, AC-3 for audio, and MPEG1-Audio.
  • the encoding of audio data is not limited to this, and an encoding scheme such as Advanced Audio Coding (AAC) used in BS digital broadcasting may be used. .
  • AAC Advanced Audio Coding
  • This attribute can be changed in the TS packet that stores the first elementary stream following the Tip packet. In other words, it can only be changed in the first video or audio TS packet in the SESF Capsule.
  • This attribute may vary within the same VOB as long as it is between mono, stereo, and dual mono.
  • Fig. 50 shows the stream structure of the DVD-Video standard format.
  • each stream contains multiple VOBs, and each V0B consists of an integer number of VOBU forces.
  • VOB U consists of an integer number of pack powers, with video pack (V PCK) Nyao starting from NV PCK. This is followed by a one-pack (A-PCK).
  • A-PCK video pack
  • NV—PCK has two packets. Each packet is called a PCI (Presentation Control Information) packet or a DSI (Data Search Information) packet, and the PCI packet stores playback control information for the VOBU, and the DSI packet contains the VOBU.
  • PCI Presentation Control Information
  • DSI Data Search Information
  • PCI data includes PCI_GI (PCI General Information) for storing general PCI information, NSML_AGLI for non-seamless angle information, HLI for highlighting menu buttons, and ISRC ( It consists of RECI that stores (International Standard Recording Code).
  • PCI_GI PCI General Information
  • NSML_AGLI for non-seamless angle information
  • HLI for highlighting menu buttons
  • ISRC It consists of RECI that stores (International Standard Recording Code).
  • NSML— AGLI and HLI are described as invalid if converted from Constrained SESF.
  • ISRC In ISRC, data indicating invalidity may be described, and the ISRC code may be described correctly. However, since it is not related to conversion from Constrained SESF, explanation here is omitted. Therefore, only PCI-GI is a problem when creating PCI data from Constrained SESF.
  • Figure 52 shows the PCI-GI structure of NV-PCK. In the following, the calculation method is explained only for the fields that require calculation when converting from the Constrained SESF force.
  • NV_PCK_LBN (the NV_PCK relative address in the VOBS file) can be generated by counting the number of packs of the information recording device during conversion.
  • V 0 BU_CAT (information on analog copy protection status) can be obtained from display_and_copy_info of the Tip packet corresponding to NV_PCK.
  • VOBU_S_PTM (the playback time information of the video field first displayed in VOBU) can be calculated from the FVFPST of the Tip packet corresponding to NV_PCK.
  • VOBU_E_PTM time information when video data in VOBU completes playback
  • VOBU_E_PTM is the power obtained from the playback time information described in the next entry in the access map. It can be generated by analyzing the corresponding video stream and calculating the time when video playback ends.
  • V ⁇ BU-SE-E-PTM time information when playback ends with sequence-end-code in video data in VOBU is because sequence_end_code is only allowed at the end of VOB (Fig. 48). (See), VOBU in the middle of the stream is filled with “0x00000000” that sequence_end_code does. Only NV_PCK with Sequence_end_code in the last VOBU has the same value as V ⁇ BU_E_PTM.
  • C_ELTM time difference information between the playback time of the first video frame displayed in the CELL in which the NV_PCK is stored and the first video frame displayed in the VOBU; frame accuracy is required
  • NV-PCK PCI data can be generated in units of VOBU at any time during conversion.
  • FIG. 53 shows the structure of the NV—PCK DSI.
  • DSI data stores DSI—GI (Data Search Information General Information), which stores DSI general information, and recording addresses, playback information, etc. necessary for seamless playback between VOBs.
  • SML—AGLI (Angle Information for seamless) that stores arrangement information for seamless playback between different angles, and recording address information of VOBUs in the vicinity of the VOBU VOBU — Consists of SRI (VOB Unit Search Information) and SYNCI (Synchronous Information), which is information for synchronized playback of video and audio / sub-picture.
  • SRI Voice Unit Search Information
  • SYNCI Synchronous Information
  • SML_AGLI describes data indicating invalidity when converted by Constrained SESF force.
  • FIG. 54 shows the DSI_GI structure of NV_PCK. Constrained
  • NV PCK SCR (SCR value of NV PCK) is constrained by the calculation method described later.
  • the SCR is derived from the SESF ATS and derived from the SCR.
  • NV_PCK_LBN (NV_PCK relative address in VOBS file) is the same as PCI data and its request.
  • ⁇ 811_ £ 8 (1 ⁇ ⁇ _? ⁇ 1: to ⁇ 081; relative address from the last pack in) can be calculated from the access map.
  • the number of TS packets from the access map to the next entry is calculated. It is possible to calculate how many packs are formed following NV_PCK by subtracting the number of TS packets that do not belong to the Multiplexing Unit in the TS packet and dividing the result by 11. For NV_PCK derived from the last Tip packet: or for all NV_PCK, the number of packs generated after conversion may be counted and described.
  • V ⁇ BU_lSTREF_EA in VOBU, relative address from NV_PCK to the last pack of the first reference picture
  • VOBU— 2NDREF—EA in V ⁇ BU, the second reference picture from NV—PCK Relative address up to the last pack of VOBU—3 RDREF—EA
  • TS2P S conversion can be derived without the need to analyze the video stream layer.
  • PES—info describes the PES packet of each video that does not describe the encoded picture.
  • a PES packet with picture-coding-type 01b, 10b contains a reference picture as defined in the DVD-Video standard.
  • PTS_DTS_flags l ib
  • PTS_DTS_flags 10b
  • VOBU_VOB_IDN (the ID number of VB to which the VOBU belongs) should be able to be obtained during conversion by the information recording device.
  • VOBU_C_IDN ID number of the CELL to which the VOBU belongs
  • ID number of the CELL to which the VOBU belongs is also a number set by the information recording device during conversion, just like VOBU_V0B_IDN, and is not related to the stream.
  • management information such as PGC information of Constrained SESF
  • C—ELTM Time difference information between the playback time of the first video frame displayed in the CELL where NV—PCK is stored and the first video frame displayed in VOBU. Frame accuracy is required.
  • each field of NV-PCK DSI-GI can be generated at any time in units of VOBU during conversion.
  • Figure 55 shows the SML-PBI structure of NV-PCK. In the following, the calculation method is explained only for the fields that need to be calculated when converting from Constrained SES F.
  • VOB_V_S_PTM time information of the video frame displayed at the beginning of VB to which NV_PCK belongs
  • FVFPST time information of the video frame displayed at the beginning of VB to which NV_PCK belongs
  • VOB_V_E_PTM video playback end time information of the VOB to which NV_PCK belongs
  • VOB_V_E_PTM video playback end time information of the VOB to which NV_PCK belongs
  • VOB_V_E_PTM video playback end time information of the VOB to which NV_PCK belongs
  • Finding the playback end time It can be set at any time.
  • the NV-PCK SML-PBI fields can be calculated before conversion, and the values may be used during the conversion.
  • V 0 BU_SRI can be calculated using the access map as described above, the explanation here is omitted.
  • VOBU_SRI is described completely for each cell, it cannot be calculated unless the cell is defined. Therefore, in a recorder that records in DVD-Video format in real time, the cell cannot be cut in an arbitrary section, and power that lacks editability and reproducibility is used when converting from Constrained SESF force. Therefore, since the section specified by the user can be defined and converted as a cell, chapters can be created as intended by the user, and the playlist that starts playback from the point specified by the user is in the DVD-Video format. Can be realized.
  • Figure 56 shows the SYNCI structure of NV—PCK. In the following, the calculation method is explained only for the fields that need to be calculated when converting from the Constrained SESF force.
  • A—SYNCA0 (the relative address of the pack that stores the primary audio and the pack that stores the audio frame that is played immediately after or immediately after the VOBU—S—PTM) uses the PES—info in the Tip packet. Thus, it can be acquired during TS2PS conversion without stream analysis.
  • the PES—info stream—identifier it is possible to determine whether the PES packet contains primary audio.
  • sync_presentation_flag is not guaranteed to be lb in one audio pack in VOBU. If the encoder multiplexes the audio first, a certain VOBU An audio pack that is played at the same time or immediately after a VOBU-S-PTM can be stored in the previous VOBU, and vice versa.
  • the Constrained SESF is placed in the SESF capsule in advance.
  • the system encoding may be performed so that audio data to be played back at the same time as or immediately after the FVFPST described in the tip packet of the SESF capsule is stored.
  • VVOBU_S_PTM exceeds VOBU (SESF capsule)
  • A_SYNCA1 (the relative address of the pack that stores the secondary audio and the pack that stores the audio frame that is played immediately after VOBU_S_PTM) can be set in the same way as A—SYNCA0.
  • NV-PCK DSI data can be generated and converted at any time in units of VOBU, except for A-SYNCA, during conversion.
  • Figure 84 summarizes an example of NV—PCK generation method.
  • a DVD VR stream will be briefly described below.
  • the DVD VR stream format details are described in “DVD Specifications for Rewritable / Re- recordable Discs Part 3 VIDEO REC RDING”.
  • Fig. 57 shows a stream structure in the DVD VR format.
  • each stream contains multiple VOBs, and each VOB consists of an integer number of VOBUs.
  • VOBU consists of an integer number of pack powers, followed by video pack (V_PCK) and audio pack (A_PCK) with RDI_PCK at the head.
  • V_PCK video pack
  • A_PCK audio pack
  • RDI_PCK stores display and copy control information and manufacturer-specific information.
  • RDI—PCK payload data (RDI Unit) is RDI general information R RDI-one GI (Real-time Data Information ueneral Information) and display and copy It consists of DCI_CCI (Display Control Information and Copy Control Information) that stores information for control and MNFI (Manufacturer's Information) that stores manufacturer-specific information.
  • R RDI-one GI Real-time Data Information ueneral Information
  • DCI_CCI Display Control Information and Copy Control Information
  • MNFI Manufacturing's Information
  • RDI_GI contains a V 0 BU_S_PTM field inside it, only this field is variable, and other fields are filled with fixed values.
  • V0BU_S_PTM has exactly the same format as FVFPST described in the corresponding Tip packet in the transport stream before conversion, so the value of FVFPST can be copied as it is.
  • DCI_CCI has exactly the same format as the display_and_copy_info of the Tip packet, the value of display- and-copy-info can be copied as it is.
  • MNFI a unique manufacturer ID is assigned only when the manufacturer ID described in the Tip packet is the same as the manufacturer ID of this information recording device, and the manufacturer specific information is described (copied). . However, if the maker—ID power in the Tip packet is the ID of another manufacturer, or if it is an invalid maker—ID value, an invalid data is written in the MNFI to generate an RDI pack. May be.
  • the RDI PCK starts from the corresponding Tip packet (and its ATS) only. You can create next.
  • Fig. 58 shows a flowchart for generating the RDI-PCK.
  • RDI In the case of PCK (or NV_PCK), the system header consists of a fixed value field. Details of the system header are shown in Figure 61. The packet header and private header stored in RDI_PCK are shown in Figure 62 (a) and (b), respectively. As shown, these headers are also composed of fixed value fields, so they are easy to generate.
  • Fig. 59 shows a flow chart for generating PS packet packs with TS packet (lMultiplexing Unit) power storing AV data.
  • the Constrained SESF TS packet that stores AV data is
  • Step S4200 Read only one TS packet from the conversion start point force of the Constrained SESF stream.
  • Step S4201 It is determined whether or not the read TS packet stores AV data and is the first TS packet of the Multiplexing Unit. AV data storage decision is made by referring to the PID value of the TS packet declared to store AV data in the PMT. Regarding the determination of whether or not it is the head of the Multiplexing Unit, if the preceding TS packet is a Tip packet, PSI / SI packet, or PCR packet, the TS packet that stores the AV data immediately after it is stored. Judged as the beginning of the Multiplexing Unit.
  • the conversion start point is expected to be a Tip packet, it is possible to determine whether or not it is the head of the Multiplexing Unit by reading TS packets in order (that is, the TS packet storing AV data immediately after the Tip packet is Must be at the beginning of Multiplexing Unit.) As a result of determination, if the packet is not at the beginning of the Multiplexing Unit, TS packet, or if conversion has not started from the Tip packet and determination cannot be made, the process returns to S4200 to read the next TS packet. . If it is confirmed that the Multiplexing Unit is at the head, the process proceeds to the next process.
  • Step S4202 The ATS attached to the first TS packet of the Multiplexing Unit Used to calculate the time (calculated-PCR) when the MPEG-PS pack into which the TS packet is converted is input to the decoder. This calculation method is as described above. Once the PCR is calculated, the SCR can be calculated by the above calculation method, and the pack header shown in FIG. 60 is completely determined. This is because the pack header can only accept a fixed value except for the SCR.
  • Step S4203 A packet header and a private header are created.
  • the packet header is created based on the PES packet header of Constrained SESF.
  • the created packet header must be in a format that satisfies the field values shown in Figure 63. This is because if the value of a field that changes the header length is not determined, conversion from the Constrained SESF is not uniquely determined, which may affect buffer management.
  • the fields listed here are not listed because they are fixed values.
  • Constrained SESF determines the individual field values of the PES packet header in detail because the processing required for conversion from the PES packet header (MPEG-TS) to the packet header (MPEG-PS) is minimized. It is to make it.
  • the size of the PES packet is larger than the size of one pack, one PES packet is converted into multiple packs.
  • the packet headers of the second and subsequent packs set PTS-DTS-flags to "0 ObJ and PES-extension-flags to" 0b "in the first packet header generated from the PES packet.
  • the correction points are to adjust the stuffing-byte length and to correct the PES-header-data-length.
  • the private header is required when storing a non-MPEG standard stream, so it is required for packs storing NV_PCK, RDI_PCK: AC-3, LPCM, etc.
  • Figure 64 shows the AC-3 private header.
  • the value of the field will be that for a fixed rate AC-3, the byte length of one audio frame will be the bitrate. Since it can be calculated from the data rate and the value is a fixed length, it can be easily calculated from PES-packet-length etc.
  • the first packet header is partially modified from the header of the PES packet, the second and subsequent packet headers are partially modified, and the private header is defined by the MPEG standard. It is possible to generate a packet header and a private header by inserting it only for the outer stream.
  • Step S4204 Once the private header is created, the payload part of the TS packet is simply packed in order from the beginning of the payload part of the PS pack and copied.
  • Step S4208 Next, when the copy of the Multiplexing Unit payload data is completed, the byte length of the formed pack is calculated, and it is confirmed whether it is 2048B. If it is already 2048B, the generation of the pack ends. If it is still 2048, the process proceeds to S4209.
  • Step S4209 If the pack is not 2048B, the node will be Add an inbound packet to the end of the payload.
  • the conversion process is performed from the Multiplexing Unit storing AV data.
  • the above processing should be repeated only when Multiplexing Unit is detected until the processing of the specified conversion part of Constrained SESF is completed.
  • Figures 65 (a) and 65 (b) illustrate the conversion from Constained SESF to MPEG-PS. As shown in Fig. 65 (a), since one video PES packet is usually larger than 2KB, it is generally divided into multiple Multiplexing Units and multiplexed into Constrained SESF.
  • the last Multiplexing Unit that stores the data of one video PES packet can make up one complete Multiplexing Unit by making up the extra data amount with the Adaptation field and the NULL packet.
  • the Multiplexing Units constituting one video PES packet can be classified into the following three types. [0437] The first Multiplexing Unit (MU # 1 in the figure) that stores the first data of the PES packet and the Multiplexing Unit (MU #n in the figure) that stores the data in the middle of the PES packet
  • MU # N Multiplexing Unit
  • each pack of MPEG-2 PS stream converted to TS2PS is
  • Packs converted from MU # 1 always have a space of 10 bytes or more when the pack is generated, so the padding packet is inserted last.
  • stuffing bytes (the last field of the packet header) are added to 2048 bytes when the pack has 7 bytes or less, and padding packets are added when 8 bytes or more are available. This is because it has become a rule to purchase.
  • MU # n force converted packs are composed by adding 1 byte of stuffing.
  • a pack converted from MU # N usually has a free space larger than 8 bytes in the pack configuration, and a padding packet is inserted.
  • Figures 66 (a) and (b) illustrate the conversion from Constained SESF to MPEG-PS. As shown in Fig. 66 (a), one audio PES packet (which stores one or more audio frames) is smaller than one Multiplexing Unit.
  • stream_id is set appropriately when converting MPEG1-Audio, and a private header for AC_3 is generated. It is only a simple process to the extent that it does.
  • transferring an audio Multiplexing Unit in a short time means increasing the audio transfer rate, which is a major difference between T-STD and P-STD. This reduces the difference in the allowable input rate.
  • it has the great advantage of facilitating the generation of a Constrained SESF that must conform to the two decoder models.
  • Figure 67 shows the bit rate of each audio allowed by Constrained SESF, and the maximum payload length stored in one audio PES packet when AC-3 and MPEG1-Audio are stored for each. . Data capacity greater than the byte length shown here Audio PES packets are not stored, so padding packets are always inserted.
  • An integer number of PES packets including an integer number of audio frames may be stored in an integer number of Multiplexing Units to increase the amount of data stored in the converted MPEG-PS pack and be multiplexed efficiently. . In this case, however, the PTS operation at the time of conversion becomes a problem.
  • the DVD standard stipulates that the PTS of the first audio frame starting in the PES packet is described as the PTS in the audio PES packet header.
  • the first complete audio frame in the Multplexing Unit is the first audio frame in the payload of the PES packet in the Multplexing Unit (that is, the audio frame in which the PTS is always described). It is effective. Therefore, the Constrained SESF according to the present invention stipulates that “the complete audio frame that starts first in the Multplexing Unit is the first audio frame in the payload of the PES packet in the Multplexing Unit”. . Note that this rule may be that “the audio frame that starts with the first byte in the Multplexing Unit is the first audio frame in the payload of the PES packet in the Mult iplexing Unit”. Since the restriction by this specification is one of the restrictions of Constrained SESF, it can be determined whether or not the above specification is satisfied by referring to the encode_condition flag.
  • Figure 85 shows MPEG-T formatted with Constrained SESF that satisfies the above requirements.
  • the PES packet headers of PES sockets 41 1, 412, and 413 respectively include the first audio frame in the audio frames included in each PES packet 41 1, 412, and 413 (
  • PTS # 1, PTS # 5, PTS # 8 Contains PTS values (PTS # 1, PTS # 5, PTS # 8) for AF # 1, AF # 5, AF # 8).
  • the first Multplexing Unit (401) includes all the data of the PES packet 41 1 and the data up to the middle of the PES packet 412.
  • the first complete audio frame in that Multplexing Unit (401) is audio frame # 1, which is the first audio frame in the payload of PES socket 41 1 It meets the above requirements.
  • the first complete audio frame in the Multplexing Unit (402) is Audio Frame # 8, which is the first in the payload of the PES packet 413. It is an audio frame and meets the above requirements.
  • the Multplexing Unit (402) is a force S that contains the second half of audio frame # 7 immediately after the PES packet header, Since it is part of the frame and not a complete audio frame, it is not a condition for considering the above provisions.
  • the PES packet header of the PES packet 411 included in the first Multplexing Unit (401) contains the PTS value (PTS value of the first complete audio frame # 1 in the following audio frame (AF)). # 1) is included.
  • the second Multplexing Unit (402) contains the PTS value (PTS # 8) of the first complete audio frame # 8 in the following audio frame (AF).
  • the PES packet header in the destination MPEG-PS is stored in the PES packet header included in the Multplexing Unit (402)
  • the PTS value (PTS # 8) to be used is copied as it is. In this way, the process of simply copying the PTS value as it is during PS2TS conversion is simplified.
  • Fig. 86 shows an example satisfying the above rules.
  • a PES packet 416 includes an I picture, and a PTS value (PTS # 2) of an I picture is stored in the PES packet header.
  • the PES packet 416 is arranged at the head of the Multplexing Unit (404).
  • the PTS value (PTS # 2) stored in the PES packet header 421 indicates the I picture immediately after that.
  • the Multplexing Unit (403) stores the P picture contained in the payload of the PES packet 415 and inserts a NULL packet into the remaining part to align the I picture to the next Multplexing Unit (404). ing.
  • FIG. 68 is a flowchart showing the main processing of TS2PS conversion. This process is started when the user makes a TS2PS conversion request. First, seek the first SESF Capsule to start conversion (S11). Then, it is determined whether there is a SESF Capsule to be processed (S12). If there is a SESF Capsule, the process is terminated. If there is a SESF Capsule, initialization processing (S13) and capsule unit processing (S14) are performed.
  • the initialization process (S13) will be described using the flowchart of FIG.
  • the variables used for the subsequent processing are set and initialized.
  • the variable MU—num that specifies the number of the Multiplexing Unit being processed is set to 0 (S25).
  • a variable WA indicating the number of times the ATS is changed is set to 0 (S26).
  • Capsule unit processing (S14) will be described using the flowchart of FIG.
  • One TS packet is read (S31). It is determined whether the read TS palette is a Tip packet (S32). If it is a Tip packet, the process ends. If it is not a Tip packet, it is determined whether the read TS packet is an audio packet or a video packet (S33). If the read TS packet is not an audio packet or video packet, the process returns to step S31, and the TS packets are read sequentially until the read TS packet becomes an audio packet or video packet (S31 to S33). If the read TS packet is an audio packet or a video packet, the next 10 TS packets are read (S34).
  • MU_num is incremented (S35).
  • the ATS value of the first TS packet of the Multiplexing Unit is stored in the variable ATS [MU_num] (S36).
  • the byte length of the payload data of the PES packet stored in the Multiplexing Unit is set to payload_len (S37). Then, pack unit processing is performed (S38).
  • the SCR value of the pack is obtained.
  • MU_num it is determined whether or not it is the first Multiplexing Unit in the Cup sule. If it is the first, the value of variable ATSTip is set to variable ATS [0], and variable SCR [0] The value of the variable PCRTip is substituted for (S51 to S53).
  • ATS [MU_num] is compared with ATS [MU_num_1] (S55).
  • ATS “i” stores the ATS value of the first packet of the Multiplexing Unit, and this ATS value is a value indicating the relative transfer timing based on a certain packet. Therefore, normally, the ATS value of the later packet is larger than the ATS value of the previous packet. However, since the ATS value is generally a finite value represented by 30 bits, it may cause overflow. In this case, the ATS value of the subsequent packet is smaller than the ATS value of the previous packet.
  • step S54 the reversal of this ATS value is observed, and it is determined whether or not an overflow has occurred. If ATS [MU—num] is less than or equal to ATS [MU—num—1], that is, if an overflow occurs, the variable WA is incremented (S55).
  • pack header data having the data structure shown in FIG. 60 is edited.
  • the remainder of SCR divided by 300 is substituted for SCR_extension (S61).
  • the Multiplexing Unit destination It is determined whether or not the first TS packet includes a PES packet header (S73). If the TS packet at the beginning of the Multiplexing Unit includes a PES packet header, the video PES packet head processing is performed (S74). Otherwise, the PES packet non-head processing is performed (S75). Whether the TS packet at the head of the Multiplexing Unit includes a PES packet header is determined by referring to the payload_unit_start_indicator in the TS packet header or directly referring to whether the start code in the PES packet header is stored. To do.
  • the value of the stream_id field is set. If the type of stream being processed is “MPEG2—video”, “OxEO” is set to stream-id (S81, S82). If the type of stream being processed is “AC3—audio”, “OxBD” is set to stream—id (S83, S84). When the type of stream being processed is “MPEG1-audio” and “Primary audio”, “OxCO” is set to stream-id (S85, S86, S87). If the type of stream being processed is' MPEGl-audio 'and' Secondary audio ', set "OxCl' to stream-id (S85, S88, S89).
  • Fig. 83 is a diagram showing in detail the structure of the PES packet in the MPEG standard. In this process, each field is edited according to the structure of the figure.
  • a temporary value (“0x000001E007EC800001FF" is set in the PES packet header (S111). (2025—payload one len) value force S 1 and 8 force half-IJ is determined (S 112).
  • step S 116 it is determined whether or not the value of (2025—payload—len) is 8 or more. If it is equal to or greater than 8, PES-header-data-length is set to 0 (S117), and PES-packet-length is set to the value calculated by the following equation (SI18).
  • PES_extension_flag force is 1 "(S183).
  • PES_extension_flag force is ⁇
  • P_STD_buffer_flag is set to 1 (S184). If the audio data is AC-3 audio? (S 185) If AC_3 audio, set 2 bytes following PES extension flag_ 2 to a predetermined value ("0x603A") (S186). If it is not AC-3 audio, 2 bytes following PES-extension-flag-2 are set to a predetermined value ("0x4020”) (S187).
  • Audio PES packet non-head processing will be described with reference to FIG.
  • stream_id is “OxBDx”, ie, whether the audio data is AC-3 audio or not is determined (S191). If stream_id is “OxBD ⁇ ”, a temporary value “0x000001BD0000800004FFFFFF” is set in the PES packet header. Set (S192). Then, the value calculated by the following equation is set in P ES_packet_length (S193).
  • the stream_id force is not ⁇ OxBD ⁇
  • PES_packet_length 2028 (S131). If PES_packet_lenghth is not 2028, ⁇ (2028-PES_packet_length) —6 ⁇ is set in PES_packet_length of the padding packet (S132). A padding packet is added after the payload (S133).
  • the PTS described in the converted MPEG-2 PES packet is Multiple. It can be set by referring to the PES packet header that appears first in the xing unit. (See Fig. 85 and Fig. 86)
  • the pack header (SCR) is described to be generated at the time of TS2PS conversion.
  • the pack header may be stored in advance in the PES packet header stored in MPEG-TS.
  • pack_header_field_flag lb in the PES packet header
  • the pack header after TS2PS conversion is stored in the PES packet header
  • the data stored in the same pack as the pack header is a predetermined rule from the TS packet. Even if data stored in TS packets (for example, a predetermined number) is stored in the pack, it is acceptable.
  • the video field (P1) that is the top field and is displayed last in the last complete SESF Capsule may be the bottom field.
  • Figure 87 (b) shows a case where this rule is not satisfied.
  • the video picture (Pf) displayed first in the first complete SESF Capsule is the bottom field, and the last complete SESF Capsule.
  • the above constraint is one of the limitations of Constrained SESF, so encode conditio
  • n flag it can be determined whether or not the above constraints are satisfied. That is, by referring to this flag, the first displayed video picture in the first complete SES F Capsule is the top field and the last complete SESF Capsule in one continuous STC interval. It can be determined whether or not the video picture to be displayed last is the bottom field.
  • Figure 88 is a flowchart of the recording process in Constrained SESF with the above restrictions.
  • time map information is sequentially added each time a SESF Capsule is completed (S205). It is determined whether or not the recording is finished (S206). If the recording is finished, a recording end process is performed (S207). Steps S203 and S205 are repeated until finished.
  • encode-condition force ⁇ l lb "Power I / O force is cut in half (S211).
  • encode_coiiditioii force S" l ib " the last picture displayed in the last complete SESF Capsule is the bottom picture. If it is not the bottom picture, a new SESF is created or the currently encoded SESF is completed and encoded so that the last ends with the bottom picture (S213).
  • generate the last SESF Capsule that satisfies the requirements of encode one condition force S ⁇ l lb ⁇ and satisfies encode one condition force S ⁇ 01b ⁇ (stops encoding) (S 214 ).
  • FIG. 90 shows a case where VOB # 1 and VOB # 2 specified by Cell # 1 and Cell # 2 are seamlessly connected.
  • Various techniques have been proposed for seamless connection (see, for example, US Pat. No. 5,923,869).
  • the BD (Blue-ray Disc) standard which is the next-generation recording medium standard, describes the connection relationship between the cells that make up the PGC and the cells that are played back before that cell. is doing.
  • Cell # 2 shown in FIG. 90 includes information (hereinafter referred to as “connection information”) indicating the connection relationship with Cell # 1 reproduced before that.
  • This connection information is connection-condition and is stored in the VOB management information (VOBI).
  • connection The value of condition is set as follows:
  • connection_condition 3 forces and 4
  • connection_condition of Cell #l since the connection_condition of Cell #l is 1, it means that Cell # 1 is not seamlessly connected to the immediately preceding Cell, while ⁇ 611 # 2 00 11 ⁇ 2 1 ⁇ _ (0 01 Since ⁇ 1011 is 4, it means that Cell # 2 is seamlessly connected to the immediately preceding Cell # 1.
  • the TS2PS conversion target section including the seamless connection point is completely SESF.
  • Capsule It must be composed of Capsule. In other words, at least immediately after the seamless connection point, it is necessary to be at the head of the SESF Capsule. In other words, as shown in FIG. 90, immediately after the seamless connection point X, it is necessary to start with a Tip packet 303 which is a packet indicating the head of the Capsule. In this way, by starting at the beginning of the Capsule immediately after the seamless connection point, video playback from immediately after the seamless connection point becomes possible. Another requirement is that a complete SESF Capsule must end immediately before the seamless connection point.
  • the bridge VOB is a VOB that is generated by extracting the first half and the second half of the bridge VOB from the preceding VOB and the subsequent VOB that are seamlessly connected and re-encoding them so that they can be played back continuously.
  • Seamless connection via a bridge VOB is disclosed in, for example, US Patent Publication No. 2002-90197.
  • PGC # 1 reproduces VOB #l and VOB # 2 through the following reproduction path. Play from Start—SPN1 of VOB # 1 (301) to exit—to—Bridge—SPN, then play bridge VOB (304) from start to finish, and finally turn_from_Bridge_SPN force of VOB # 2 (302) , END_SPN2 (the position that becomes End_PTM2 by the time map) is played. Note that Start_SPNl, exit_to_Bridge_SPN, return_from_Bridge_SPN,... Indicate the address of the TS packet. This information is recorded in VOBI, which is VB management information.
  • VOB # 1 (301) is Capsulel _ :! ⁇ Consists of four Capsule of Capsulel_4,
  • VOB # 2 (302) is composed of four Capsules of Capsule2 _ :! ⁇ Capsule2_4.
  • the bridge VOB 304 includes Capsulel_3, Capsulel-4 ', Cap sule2_l', and Capsule2_2 '.
  • the first half of the bridge VOB 304 that is, Capsulel-3 and Capsulel-4 'are generated from Capsulel-3 and 1-4 of the front VOB 301 to be seamlessly connected.
  • the latter half of the bridge VOB 304 that is, Capsule2-l and Capsule2-2, is generated from Capsule2-l, 2-2 of the rear VOB 302 that is seamlessly connected.
  • a VOB is composed of units called "aligned units".
  • One aligned unit contains 32 source packets that are a combination of ATS and TS packets, and its size is 6 KB.
  • VOB # l ( 301) Capsulel-3 and Capsulel-4 belonging to VOB # 2 (302), and Capsule 2-1 and Capsule2-2-2 belonging to VOB # 2 (302).
  • VOB304 is composed of Capsule 1-4 'and Capsule2-1' There is a discontinuity between STC time axis and ATS time axis.
  • the last Capsule2_2 'of the bridge VOB304 is 0.4 to: 1.2 seconds as the last complete SESF Capsule Have a playback time of
  • Capsule2—2 ′ to the DVD standard format
  • after converting it on V0 B of the DVD converted from Capsule2_l ′, 2_2 ′, 2—3, 2—4 Capsule2—2 'playback time exceeding 1.0 seconds requires re-encoding, which is inconsistent with the DVD standard.
  • the playback time of the last Capsule 2—2 ′ (that is, the Capsule including the last TS packet of the bridge VOB 304) in the bridge VOB 304 must be not less than 0.4 seconds and not more than 1 second. This is true even if the last Capsule is not a complete Capsule in Bridge VOB304.
  • the last Capsule2—2 'at the end of the bridge VOB304 is a complete Capsule
  • the last Capsule recorded in the bridge VOB304 is the first half
  • the Capsule recorded in VOB # 2 (302) starting from the second half is stored in a separate file, but the video playback time of one logically complete Capsule must be at least 0.4 seconds and within 1 second.
  • the playback time of the first Capsulel—3 of the bridge VOB304 (that is, the Capsule including the first TS packet of the bridge VOB304) is 0.4 seconds or more in order to be compatible with the DVD standard. Must be within 1 second.
  • the last Capsulel_2 of VOB # 1 on the front side in the seamless connection needs to be a complete Capsule. This is a high-speed conversion that eliminates the loss of AV information in the vicinity of seamless connection when TS2 PS conversion is performed on the front side V ⁇ B that is seamlessly connected. This is to make it possible.
  • a Capsule starts with a Tip packet (ie, the presence of a Tip packet means the beginning of a Capsule).
  • Capsule contains one or more GOPs.
  • Each audio stream and video stream is completed in Capsule.
  • Each stream begins with the first byte of the access unit in the Capsule and ends with the last byte of the access unit.
  • the transfer end time of the Nth VOBU converted from the Nth Capsule is N + converted from the N + 1 Capsule. (This is a restriction to ensure that it is before the first VOBU transfer start time.)
  • the difference in arrival time between the Tip packet and the subsequent and first packet containing the audio or video stream must be at least 43886/27 Msec.
  • Navi Pack (DVD-Video) or RDI Pack (DVD_VR) can be attached at the beginning of the VOBU. Power Guarantee that there is enough time to insert this Pack. It is a restriction to do.)
  • the playback time of Capsule video data is between 0.4 seconds and 1.0 seconds.
  • the playback time of the last complete SESF Capsule video data in a continuous STC sequence is within 1.0 seconds when the encode_condition is 01b, and 0.4 seconds when the encode_condition is l ib. 1. Within 2 seconds.
  • the playback time of Capsule2_2 'including the last TS packet of bridge VOB304 is a complete Cap sule in order to realize fast conversion to DVD-VR. Regardless of whether it is 0.4 or more, it must be within 1 second.
  • the playback time of Capsulel-3 including the first TS packet of Bridge VOB304 must also be 0.4 seconds or more and within 1 second in order to realize high-speed conversion to DVD-VR. .
  • Capsulel _4 immediately before the seamless connection point (the video playback time is 1.0 seconds or less because it is the last complete Capsule of the STC sequence) and Capsule2_l 'immediately after the seamless connection point must be complete Capsule. Is required. If these conditions are satisfied, the DVD standard can be satisfied without re-encoding when converting the format to C-SESF M PEG2-PS.
  • each audio sample having the playback time of the seamless playback time tc is the power of each of the two VOBs to be connected. It must be encoded so that it is included (ie, there is no audio gap).
  • the audio gap including the seamless playback time tc must be encoded.
  • the overlapping audio frames a6 and a7 are deleted, and the audio frame a5 is continuous so that there is no audio gap.
  • the playback time of audio frame a8 and subsequent audio frames is uniformly shifted, it is necessary to separately process all the PTSs of the audio packs including those audio frames by (t4_t3).
  • the PTS of the audio pack may be appropriately shifted so as to eliminate the overlap without deleting the overlapping audio frames.
  • Audio frames are handled as described above when converting the format from the BD standard to the DVD standard (TS2PS conversion), but conversely, when converting the format from the DVD standard to the BD standard, close to the seamless connection point. Existing audio gaps need to be converted to overlap.
  • VOB audio data that is seamlessly connected during video seamless connection lj (in Fig. 94, Ijtc) (for example, audio frames a6 and a7 in Fig. 94).
  • the added audio frame may be an audio frame that gives silence.
  • the number of audio frames added is limited to a maximum of one frame for both the preceding VOB and the succeeding VOB. This is because the audio gap in the DVD standard has a time length of one frame or less, so adding one frame ensures that both VOBs that are seamlessly connected have audio data at seamless connection time tc. This is because it can be guaranteed. If VB already has audio data at time tc, there is no need to add an audio frame to that VOB.
  • NV_PCK (Navipack) at the beginning of each V0B sets SCR to 0. It has been forced. This is because each VOB always starts to be supplied to the decoder (system target decoder) from the value 0 on the MPEG STC time axis. In recording standards where editing such as partial deletion of the front is assumed, there is no such guarantee, so a predetermined amount of offset is added to the MPEG time stamp (SCR / PCR, PTS, DTS) during stream conversion. Can be used to start the SCR of the first pack of the converted VOB from 0.
  • FIG. 96 illustrates an example in which a front stream including Capsulel and Capsule2 (corresponding to VOB) and a rear stream including Capsule3 and Capsule4 are seamlessly connected.
  • Capsulel and Cap sule2 correspond to VOBU1 and VOBU2, respectively
  • Capsule3 and Capsule4 correspond to VOBU3 and VOBU4, respectively.
  • offset 2 (offset2) used when converting from two VOBs (MPEG2_TS) to one VOB (DVD-Video MPEG2-PS) is set.
  • offset 2 (offset2) is an offset for connecting VOBU3 temporally after VOBU2.
  • Offset 1 may be any other value (eg, 0).
  • offset2 FVFPST3-(FVFPST2-of f set 1 + playback time of all video frames in VOBU2)
  • offset 1 is indispensable when converting to MPEG2-PS of DVD-Video, but not essential when converting to MPEG2-PS of DVD-VR.
  • offset 2 is mandatory for VOB in the latter half of the conversion of two VOBs into one VOB.
  • connection_condition 4
  • the presence of an audio frame that overlaps is determined, and if there is an overlap force S, it is deleted (S301). For example, as shown in FIG. 94, audio frames a6 and a7 are deleted. Details of this processing will be described below. [0559]
  • the determination for deleting the overlap is preferable because it is easy to perform with the conversion of the stream S.
  • the playback end time (t2) of the audio data of the VOB before the seamless connection point tc is obtained.
  • the playback end time (t2) is the PTS value (PTSp) of the last audio PES packet of the front VOB that is seamlessly connected, the audio data size (Lpes bit) stored in the payload of the PES packet, It is calculated as follows from the data size (Lfrm bits) of one frame stored in it and the playback time length (Df rm clock in 90KHz units).
  • the playback start time (tl) of the VB audio data behind the seamless connection point tc is obtained.
  • the playback start time (tl) is the PTS value (PTSs) of the first audio PES packet of the subsequent VB.
  • the times tl and t2 are obtained, and if the relationship between t2 and tc and tl is satisfied, it is determined that there is an audio gap, that is, there is no overlap. In this case, an additional process of audio gap is unnecessary, and the conversion process as described above may be performed.
  • the two converted VOBs are registered in the management information (PGC) so that they are seamlessly connected (S306).
  • PPC management information
  • the VOBI connection condition (connection—code) of the VOB on the back side that is seamlessly connected is set to 4, which is seamless connection.
  • step S302 if the two VOBs are not separated after conversion (NO in S302), offsets 1 and 2 are derived, and TS2PS conversion is performed while correcting the time stamps using offsets 1 and 2 ( S309).
  • TS2PS conversion is completed for two VBs (YES in S310)
  • the two converted VOBs are concatenated and registered as one VOB in the management information (PGC) (
  • the converted VB is recorded in the continuous area (CDA) of the information recording medium so that it can be continuously reproduced together with the management information (S308), and the process is terminated.
  • step S322 the three VOBs including two VOBs that are seamlessly connected and the bridge VOB are separately generated after conversion, or connected to form one VOB. It is determined whether to generate (S329). If the three VOBs are created separately after conversion (YES in S329), the process moves to the process shown in Figure 99. If three VOBs are to be concatenated after conversion (NO in S329), the processing moves to the processing shown in FIG.
  • DVD When converting to the video standard (YES in S351), if the VOB to be converted is not a bridge VOB (NO in S352), the offset 1 is derived and the time stamp is corrected with the offset 1. TS2PS conversion of the VOB is performed (S354). If the VOB to be converted is a bridge VOB (YES in S352), offsets 1 and 2 are derived, and the TS2PS conversion of the entire bridge VOB is performed while correcting the time stamp with the offsets 1 and 2 (S353).
  • VOB Three VOBs are connected to one VOB (S356). Finally, the converted VB is registered in the management information (PGC) (S357).
  • PPC management information
  • System stream TS2PS conversion including seamless connection can be executed by the method as described above.
  • the user iZF unit 222 in FIG. 20 specifies the conversion section by the user, and the system control unit 212 uses the information of the conversion section to drive 221. Are controlled and executed on the stream on the recording medium 100.
  • Figure 101 is a diagram showing an example of connecting two VOBs with different encode_conditions using Bridge-VB.
  • Capusle l-4 In order to generate VB, Capusle l-4 must be divided into two Capsules, each containing a GOP of 0 ⁇ 6 seconds (for the DVD VR standard, , Because all Capsule needs to be under 1.0 seconds.) In this case, in fact, it is necessary to create a new Tip packet that stores values that require analysis of elementary streams such as FVFPST, and generation of Bridge-VOB becomes very difficult.
  • FIG. 102 shows the TS2PS conversion flow in the section including the Bridge—VOB. 811 (1 ⁇ 6 _ ⁇ 08 and conversion source ⁇ 08 are shown in Fig. 103 (&) as shown in Figure 103, and VOB # 1 and V ⁇ B # 2 replace Bridge _V ⁇ B. Connected through.
  • the encode_condition of the Bridge—VOB is 10b, indicating that the first half of the Bridge—VB has been encoded with the same encode_condition as the VOB # 1 of the connection destination. Therefore, if the encode—condition force of the Bridge—VOB is 0b, the encoder_condition of the connected V0B is used, but the connected V0B # 1 and the first half of the Bridge—VOB are It can be recognized as one continuous C—SESF or SESF, which can be converted to PS.
  • the encode_condition of the two connected VOBs (VOB # 1 and VOB # 2) can be different. Connected VOB, generate Bridge _V0B with appropriate encoding regardless of encode_condition of V0B # 1 and V0B # 2, and connect VOB # 1 and VOB # 2 It becomes possible.
  • Bridge Do not use 10b as the value of encode_condition in a normal VOB that is not a VOB.
  • the encode_condition value 10b can only be used by Bridge-VB.
  • encode condition 10b This means that the partial stream of the first half and the second half of the Bridge—VOB, which does not represent a fixed encoding feature, is encoded using the same encode-condition as the VOB of each connection destination (Fig. 103). (See (b)).
  • MPEG-TS recorded on an information recording medium is multiplexed in units of blocks of 2 KB or less so as to have high compatibility with MPEG-PS, including seamless connection points.
  • the ability to convert MPEG-TS to MPEG-PS can be realized very easily without considering buffer management.
  • the reverse conversion from MPEG-PS to MPEG-TS is not described, but it can be similarly considered as the reverse of TS2PS conversion.
  • an IPS pack is converted into a plurality of consecutive TS packets, the ATS increment of a plurality of consecutive TS packets generated at that time is fixed, and the information is stored on the disk or in the stream. It can also be stored.
  • the MPEG-PS clip name program information indicating the contents of the content, etc.
  • the menu of the original program name is displayed on the decoder such as STB. And so on.
  • the present invention enables easy and high-speed format conversion from the first stream to the second stream. In particular, even for seamlessly connected streams, format conversion is possible while maintaining the seamless playback function. And Therefore, the present invention can be applied to an information recording apparatus having a function of converting a format from a first stream (for example, MPEG transport stream) to a second stream (for example, MPE G program stream).
  • a first stream for example, MPEG transport stream
  • a second stream for example, MPE G program stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

 第1のフォーマット(例えば、MPEG-TS)から第2のフォーマット(例えば、MPEG-PS)へのフォーマット変換を可能とする制限フォーマットで記録され、シームレス接続されたストリームの第2のフォーマットへの変換を可能とする情報記録媒体と、その情報記録媒体に対して情報を記録する装置、方法を提供する。第1のフォーマットを第2のフォーマットへ変換可能とする制限フォーマットを設ける。2つのシステムストリーム(VOB#1, VOB#2)をシームレス接続するために、各システムストリームの一部から構成される第3のシステムストリーム(Bridge-VOB)を生成する。管理情報として、2つのシステムストリームに対して、それらの記録フォーマットが制限フォーマットであるか否かを示すフラグ情報と、第3のシステムストリームに含まれる各システムストリームがそれらの元のシステムストリーム(VOB#1, VOB#2)と同じ符号化条件で符号化されたことを示す情報(encode_condition)とを生成する。

Description

明 細 書
高速変換可能なストリームを記録した情報記録媒体並びにその記録装置 及び記録方法
技術分野
[0001] 本発明は、記録再生可能な情報記録媒体であって、動画像、静止画、オーディオ およびデータ放送等の種々のフォーマットのデータを含むマルチメディアデータが記 録される情報記録媒体であって、特に、マルチメディアデータを記録されたフォーマ ットと異なるフォーマットに高速変換可能とする制限されたフォーマットで、データを記 録する報記録媒体に関する。また、本発明はそのような情報記録媒体に情報を記録 する装置及び方法に関する。
背景技術
[0002] 650MB程度が上限であった書き換え型光ディスクの分野で数 GBの容量を有する 相変化型ディスク DVD— RAMが出現した。ディジタル AVデータの符号ィ匕規格であ る MPEG (MPEG2)の実用化とあいまって DVD— RAMは、コンピュータ用途だけ でなくオーディオ 'ビデオ (AV)技術分野における記録 ·再生メディアとして期待され ている。
[0003] 昨今、 日本においてもデジタル放送が開始され、 MPEGトランスポートストリーム( 以下「MPEG— TS」と称す。 )にのせて、複数番組の映像、音声、データを同時に多 重化して送出することが可能となり、 HDDや DVDを利用したデジタル放送記録装置 が普及しつつある。このようなデジタル放送の記録に適した次世代の情報記録媒体 の規格として、 Blu— ray Disc規格(以下「BD規格」という。)がある。
[0004] BD規格に準拠した次世代型のデジタル放送レコーダ(Blu— ray Discレコーダ) は、主として、デジタル放送の形態に合わせて、放送された MPEG— TSを変換せず にそのままの MPEG— TS形式で記録する。また、次世代型のデジタル放送レコーダ は、外部入力からの AVデータを自己記録する場合においても、 AVストリームを MP EG— TS形式で記録する。これは、レコーダ内部で MPEGプログラムストリーム(以 下「MPEG_PS」と称す。)と MPEG—TSの両者を扱う必要がないようにするためで ある。
[0005] 一方、現行の DVD規格(DVD— Video規格、 DVD— Audio規格、 DVD Video
Recording規格、 DVD Stream Recording規格等)では、 AVストリームの記録 方式に MPEG— PS形式を用いている。このため、上記の次世代のデジタル放送対 応レコーダのように MPEG—TS形式で記録を行ったコンテンツを、例えば DVD—V ideo形式に変換する場合には、 MPEG—TS形式から MPEG— PS形式への変換( 以下「TS2PS変換」という。)が必須となる。
[0006] しかしながら、 MPEG—TSで多重化されたストリームを MPEG— PSへ変換するに は、デコーダの複雑なバッファ 'マネジメントを再計算する必要があり、 TS2PS変換 に処理時間を要する。また、エレメンタリーストリームを再エンコードする必要があるた め、画質や音質に劣化を生じる場合があった。
[0007] これらの問題に対して、レ、くつかの方法が提案されている(例えば、特許文献 1参照
。)。
[0008] また、従来より 2つの AVストリームを接続し連続再生を可能とするためのシームレス 接続の技術がある(特許文献 2、 3参照)。
特許文献 1 :特開 2003— 228922号公報
特許文献 2:米国特許第 5923869号明細書
特許文献 3 :米国特許出願公開 2002— 0090197
発明の開示
発明が解決しょうとする課題
[0009] 今後、シームレス接続点を含んで変換しつつ MPEG—TS形式力 MPEG— PS 形式への高速かつ容易な変換を可能とする技術が期待されている。
[0010] 本発明は上記課題を解決すべくなされたものであり、その目的とするところは、 MP EG— TS形式で記録したコンテンツを MPEG— PS形式に変換可能とする制限され た MPEG— TS形式で AVストリームを記録する情報記録媒体において、シームレス 接続されたストリームに対し、シームレス再生機能を維持したままフォーマット変換を 可能とする情報記録媒体を提供することにある。また、本発明は、そのような情報記 録媒体に対してデータの記録を行なう装置及び方法を提供することを目的とする。 課題を解決するための手段
[0011] 本発明の第 1の態様において、システムストリームにエンコードされた映像情報と音 声情報を、その管理情報と共に記録した情報記録媒体が提供される。情報記録媒体 においては、システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS) と力 s許される。第 1のフォーマット(TS)は、データをパケットで分割して格納するバケツ ト構造を有し、第 2のフォーマット(PS)は、データをパックで分割して格納するパック 構造を有する。第 1のフォーマット(TS)には、第 1のフォーマット(TS)から第 2のフォ 一マット(PS)へシステムストリームを変換するための制限フォーマットが許される。 その制限フォーマットによれば、所定数のパケットがグループ化されて、第 2のフォ 一マットのパックに対応する多重化ユニットとして管理され、さらに、多重化ユニットを 複数含むデータ管理単位 (Capsule)でシステムストリームが管理される。
情報記録媒体は、第 1のシステムストリームと、第 2のシステムストリームと、第 1のシ ステムストリーム及び第 2のシステムストリームをシームレス接続するためのストリーム であって、シームレス接続される前記システムストリームのそれぞれの一部から構成さ れる第 3のシステムストリーム(Bridge-VOB)を格納する。
[0012] 管理情報は、第 1及び第 2のシステムストリームに対して、それらの記録フォーマット が制限フォーマットであるか否かを示す情報と、第 3のシステムストリームに含まれる 各システムストリームが、それらの元のシステムストリームと同じ符号ィ匕条件で符号ィ匕 されたことを示す情報とを含む。
[0013] 本発明の第 2の態様において、映像情報と音声情報とをシステムストリームにェンコ ードして、その管理情報と共に情報記録媒体に記録する情報記録装置が提供される システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS)とが許され、 第 1のフォーマット (TS)は、データをパケットで分割して格納するパケット構造を有し、 第 2のフォーマット(PS)は、データをパックで分割して格納するパック構造を有する。 第 1のフォーマット(TS)には、第 1のフォーマット(TS)力ら第 2のフォーマット(PS)ヘシ ステムストリームを変換するための制限フォーマットが許される。
制限フォーマットによれば、所定数の前記パケットがグループィ匕されて、第 2のフォ 一マットのパックに対応する多重化ユニットとして管理され、さらに、多重化ユニットを 複数含むデータ管理単位 (Capsule)でシステムストリームが管理される。
[0014] 情報記録装置は、第 1のフォーマット (TS)に基づき、映像情報と音声情報に所定の エンコード処理を施しビデオエレメンタリストリームとオーディオエレメンタリストリームと を生成する第 1のエンコード手段と、第 1のフォーマット(TS)に基づき、ビデオエレメ ンタリストリームとオーディオエレメンタリストリームとをマルチプレタスしシステムストリ ームを生成するシステムエンコードを行なう第 2のエンコード手段と、第 1及び第 2の エンコード手段を制御する制御手段とを備える。
[0015] 制御手段は、第 1及び第 2のシステムストリームをシームレス接続するために、第 1 及び第 2のシステムストリームのそれぞれの一部力 構成される第 3のシステムストリ ーム(Bridge_V〇B)を生成するよう、第 1及び第 2のエンコード手段を制御する。それ とともに、制御手段は、管理情報として、第 1及び第 2のシステムストリームに対して、 それらの記録フォーマットが制限フォーマットであるか否かを示す情報と、第 3のシス テムストリームに含まれる各システムストリームがそれらの元のシステムストリームと同じ 符号化条件で符号化されたことを示す情報 (encode_condition)とを生成するよう、第 1 及び第 2のエンコード手段を制御する。
[0016] 本発明の第 3の態様において、システムストリームにエンコードされた映像情報と音 声情報を、その管理情報と共に情報記録媒体に記録する方法が提供される。システ ムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS)とが許され、第 1の フォーマット(TS)は、データをパケットで分割して格納するパケット構造を有し、第 2の フォーマット(PS)は、データをパックで分割して格納するパック構造を有する。
第 1のフォーマット(TS)には、第 1のフォーマット(TS)力、ら第 2のフォーマット(PS)へ システムストリームを変換するための制限フォーマットが許される。
制限フォーマットによれば、所定数のパケットがグループ化されて、第 2のフォーマ ットのパックに対応する多重化ユニットとして管理され、さらに、多重化ユニットを複数 含むデータ管理単位 (Capsule)でシステムストリームが管理される。
[0017] 情報記録方法は、第 1のフォーマット (TS)に基づき、映像情報と音声情報に所定の エンコード処理を施して、ビデオエレメンタリストリームとオーディオエレメンタリストリー ムとを生成し、第 1のフォーマット(TS)に基づき、ビデオエレメンタリストリームと前記ォ 一ディォエレメンタリストリームとをマルチプレタスして、システムストリームを生成する
[0018] エンコード処理において、第 1及び第 2のシステムストリームをシームレス接続する ために、第 1及び第 2のシステムストリームのそれぞれの一部から構成される第 3のシ ステムストリーム(Bridge-VOB)を生成するとともに、管理情報として、第 1及び第 2の システムストリームに対して、それらの記録フォーマットが制限フォーマットであるか否 かを示す情報と、第 3のシステムストリームに含まれる各システムストリームがそれらの 元のシステムストリームと同じ符号ィ匕条件で符号ィ匕されたことを示す情報(encode_con dition)とを生成する。
[0019] 本発明の第 4の態様において、上記の情報記録方法をコンピュータに実行させるた めの、コンピュータ読み取り可能なプログラムが提供される。
発明の効果
[0020] 本発明によって開示される制限のある符号化方法を用いることで、 MPEG— TS形 式の多重化処理がなされたコンテンツを、 MPEG— PS形式の多重化処理がなされ たコンテンツに高速に変換可能となる。また、 MPEG—TS形式のコンテンツをシー ムレス再生可能なように編集する場合、そのシームレス編集処理自体が容易であり、 その編集結果通りのシームレス再生可能な MPEG— PS形式のコンテンツへ高速に 変換することが可能となる。
図面の簡単な説明
[0021] [図 1]DVDレコーダ装置の外観と関連機器とのインタフェースの一例を説明した図 [図 2]DVDレコーダのドライブ装置のブロック図
[図 3]ディスク上の連続領域及びトラックバッファ内データ蓄積量を説明した図
[図 4]半導体メモリカードとハードディスクドライブ装置を備える場合の DVDレコーダ のブロック図
[図 5]ディスクの外観と物理構造を説明した図
[図 6]ディスクの論理的なデータ空間を説明した図
[図 7]ディスクのディレクトリとファイル構造を説明した図 園 8]ビデオオブジェクトの構成を示す図
[図 9]MPEGシステムストリームを説明した図
[図 10]MPEG—TSストリームを説明した図
[図 11]MPEG_PSストリームを説明した図
園 12]TSパケットを説明した図
[図 13]PATテーブルを説明した図
園 14]ビデオオブジェクトのディスク上への配置を説明した図
園 15]ビデオ管理情報のデータ構造を説明した図
園 16]ビデオ管理情報のデータ構造を説明した図
園 17]ビデオ管理情報の PGC情報とオブジェクト情報とオブジェクトとの関係を説明 した図
園 18]再生装置の機能の構成を示すブロック図
園 19]記録装置の機能の構成を示すブロック図
[図 20]本発明の情報記録/再生装置の構成を示すブロック図
[図 21]自己記録ストリームの構成を説明する図
園 22]パケット転送時間間隔を説明する図
[図 23]User Privateパケットの格納方法を説明する図
[図 24]User Privateパケットの格納方法を説明する図
[図 25]User Privateパケットの格納方法を説明する図
[図 26]User Privateパケットの格納方法を説明する図
[図 27]MPEG— TSから MPEG— PSへの変換を説明する図
[図 28]MPEG— PSへの変換が容易な MPEG— TSの符号化方法を説明する図
[図 29]DVD_Videoフォーマットへの変換(NTSC)を説明する図
[図 30]DVD_ Videoフォーマットへの変換(PAL)を説明する図
[図 31]User Privateパケットの内部データ構造を説明する図
[図 32]MPEG_PSへ容易に変換可能にエンコードされた MPEG—TSと、変換後 の MPEG— PSとの対応関係を説明した図
園 33]本発明の情報記録装置のエンコーダを示すブロック図 [図 34]システムエンコード方法の違いによる、セルフエンコーディング MPEG— TSか ら DVDフォーマットへ変換する際の処理の違いを説明した図
園 35]Tipパケットのデータ構造を説明した図
[図 36]adaptation_fieldのデータ構造を説明した図
園 37]Data— IDのデータ構造を説明した図
[図 38]display— and_copy_infoのデータ構造を説明した図
[図 39]encode_infoのデータ構造を説明した図
[図 40]PES— infoの構造を示した図
[図 41]MakersPrivateDataのデータ構造を説明した図
[図 42]Tipパケットの PID (a)、 stream— type (b)を説明した図
[図 43]Constrained SESFストリーム内での PESパケットヘッダのフィールド値を説 明した図
[図 44]Constrained SESFストリーム内での PES_extension_flagと PES_hea der— data— lengthを説明した図
[図 45]T—STDモデルを満たさないようにセルフエンコードされた MPEG— TSの例 を示した図
[図 46]MPEG—TSから変換された MPEG— PSがP— STDモデルを満たさなぃ場 合の例を示した図
[図 47]SCRの計算を説明した図
[図 48]encode—condition= l ib の場合の Constrained SESFのエレメンタリ 一ストリーム属性を説明した図
[図 49]encode_condition= "01b"の場合の Constrained SESFのエレメンタリ 一ストリーム属性を説明した図
[図 50]DVD— Video規格のフォーマットのストリーム構造を示した図
[図 51]NV— PCKの PCIデータの構造を示した図
[図 52]NV— PCKの PCI_GIデータの構造を示した図
[図 53]NV— PCKの DSIデータの構造を示した図
[図 54]NV PCKの DSI GIデータの構造を示した図 [図 55]NV— PCKの SML— PBIデータの構造を示した図
[図 56]NV— PCKの SYNCIデータの構造を示した図
[図 57]DVD—Video Recording規格のフォーマットのストリーム構造を示した図
[図 58]TSパケット(RD_PCK)の変換処理のフローチャート
[図 59]TSパケット(V_PCK:、 A_PCK)の変換処理のフローチャート
[図 60]MPEG2_PSのパックのパックヘッダのデータ構造の一部を説明した図
[図 61]DVDフォーマットのシステムヘッダの構造図
[図 62]RDI_PCKに格納される、パケットヘッダ(a)、プライベートヘッダ(b)の構造 図
[図 63]MPEG2_PSのパケットのパケットヘッダのデータ構造の一部を説明した図 [図 64]DVDフォーマットの AC— 3規格のプライベートヘッダの構造図
[図 65]Constained SESFから MPEG— PSへの変換(ビデオパック)を説明した図 [図 66]Constained SESFから MPEG— PSへの変換(オーディオパック)を説明し た図
[図 67]Constrained SESFで許される各音声のビットレートと、 AC— 3とMPEG1 Audioを格納する場合の 1オーディオ PESパケットに格納される最大ペイロード長 との対応を示した図
[図 68]TS2PS変換処理全体のフローチャート
[図 69]TS2PS変換処理の初期化処理のフローチャート
[図 70]TS2PS変換処理のカプセル単位処理のフローチャート
[図 71]パック単位処理のフローチャート
[図 72]SCR演算処理のフローチャート
[図 73]パックヘッダ処理のフローチャート
[図 74]パケットヘッダ処理のフローチャート
[図 75]ストリーム ID処理のフローチャート
[図 76]ビデオ PESパケット先頭処理のフローチャート
[図 77]ビデオ PESパケット非先頭処理のフローチャート
[図 78]オーディオ PESパケット先頭処理のフローチャート [図 79]オーディオ PESパケット非先頭処理のフローチャート
[図 80]ペイロード処理のフローチャート
[図 81]パディングパケット処理のフローチャート
[図 82]Constrained SESFのストリームフォーマットを示した図
[図 83]MPEG規格による PESパケットのデータ構造図
[図 84]NV_PCKデータの生成方法を説明した図
[図 85]オーディオを含む PESパケットでァライメントされてレ、なレ、Multiplexing Uni tを用いた効率的な多重化方法を説明した図
[図 86]1ピクチャを含む PESパケットでァライメントした Multiplexing Unitを用いた 効率的な多重化方法を説明した図
[図 87]Constrained SESF (encode一 condition = 1 lb)におけるビデオ表示フィ 一ルド順に関する符号化条件を説明する図
[図 88]Constrained SESFの記録処理のフローチャート
[図 89]Constrained SESFの記録終了処理のフローチャート
[図 90]シームレス接続される Constrained SESFの構造を説明する図
[図 91]シームレス接続される Constrained SESFの構造を説明する図(connectio n― conaition= 3)
[図 92]シームレス接続される Constrained SESFの構造を説明する図(connectio n― condition = 3、 encode― condition = l ib)
[図 93]シームレス接続される Constrained SESFの構造を説明する図(connectio n― condition = 3、 encode― condition = 01 b)
[図 94] (a) BD規格における、シームレス接続点でのオーディオデータの関係を説明 した図、(b) DVD規格の 1V〇Bへの変換後のオーディオデータの関係を説明した図 [図 95] (a) BD規格における、シームレス接続点でのオーディオデータの関係を説明 した図、(b) DVD規格の 1V〇Bへの変換後のオーディオデータの関係を説明した図 [図 96]DVDの 1VOBへ変換する際のタイムスタンプのオフセット量を説明する図 [図 97]シームレス接続される Constrained SESFを DVDに変換する際のフローチ ャ' ~ト connection― condition =4) [図 98]シームレス接続される Constrained SESFを DVDに変換する際のフローチ ャ' ~~ト ^connection― condition = ύ)
[図 99]シームレス接続される Constrained SESFを DVDに変換する際のフローチ ヤート(図 98のつづき)
[図 100]シームレス接続される Constrained SESFを DVDに変換する際のフローチ ヤート(図 98のつづき)
[図 101]シームレス接続される Constrained SESFの構造を説明する図
[図 102]Bridge— VOBの TS2PS変換処理のフローチャート
[図 103] (a)シームレス接続される V〇Bと Bridge _VOBとの関係を説明した図、 (b) encode_conditionの各値と VOBとの関係を説明した図
符号の説明
100 DVDディスク
101、 201 光ピックアップ
102、 202 ECC処理部
103、 203、 220 トラックノ ッファ
104、 210 スィッチ
105、 214 エンコーダ
106、 205、 206、 218 デコーダ
207 オーディオデコーダ
208 静止画デコーダ
211 制御部
212 システム制御部
213 アナログ放送チューナ
215 デジタル放送チューナ
216 解析部
217 表示部
219 デジタル I/F部
221 ドライブ 222 ユーザ I/F部
223 外部入力部
230 User Privateパケット
231 トランスポートストリームシステムターゲットデコーダ
発明を実施するための最良の形態
[0023] 以下、添付の図面を用いて本発明に係る情報記録媒体、記録装置及び再生装置 の実施形態である DVDディスク、 DVDレコーダ及び DVDプレーヤについて下記の 順序で説明する。
[0024] 特に、発明のポイントは「8.詳細な実施形態」で説明する。なお、関連の度合いは 異なるが、全て本発明の実施形態である。
1. DVDレコーダ装置のシステム概要
2. DVDレコーダ装置の機能概要
3. DVDディスクの概要
4.再生される AV情報の概要
5. AV情報の管理情報と再生制御の概要
6.再生機能の基本動作
7.記録機能の基本動作
8.詳細な実施形態
[0025] なお、以下では、説明の便宜上、 MPEGトランスポートストリーム(MPEG—TS)か ら MPEGプログラムストリーム(MPEG— PS)への変換を「TS2PS変換」と称する。ま た、 MPEG— PS形式である、 DVD— Video規格フォーマット、 DVD-Video Rec oriding規格フォーマットを総称して「DVDフォーマット」と称する。
[0026] (1. DVDレコーダ装置のシステム概要)
図 1は、 DVDレコーダ装置の外観と関連機器とのインターフェースの一例を説明す る図である。
[0027] 図 1に示すように、 DVDレコーダには光ディスクである DVDが装填され、ビデオ情 報の記録再生を行う。操作は一般的にはリモコンで行われる。
[0028] DVDレコーダに入力されるビデオ情報にはアナログ信号とデジタル信号の両者が あり、アナログ信号としてはアナログ放送があり、デジタル信号としてデジタル放送が ある。一般的にはアナログ放送は、テレビジョン装置に内蔵された受信機により受信 、復調され、 NTSC等のアナログビデオ信号として DVDレコーダに入力され、デジタ ル放送は、受信機である STB (Set Top Box)でデジタル信号に復調され、 DVD レコーダに入力され記録される。
[0029] 一方、ビデオ情報が記録された DVDディスクは DVDレコーダにより再生され外部 に出力される。出力も入力同様に、アナログ信号とデジタル信号の両者があり、アナ ログ信号であれば直接テレビジョン装置に入力され、デジタル信号であれば STBを 経由し、アナログ信号に変換された後にテレビジョン装置に入力されテレビジョン装 置で映像表示される。
[0030] また、 DVDディスクには DVDレコーダ以外の DVDカムコーダや、パーソナルコン ピュータでビデオ情報が記録再生される場合がある。 DVDレコーダ外でビデオ情報 が記録された DVDディスクであっても、 DVDレコーダに装填されれば、 DVDレコー ダはこれを再生する。
[0031] なお、上述したアナログ放送やデジタル放送のビデオ情報には通常、音声情報が 付随している。付随している音声情報も同様に DVDレコーダで記録再生される。ま たビデオ情報は一般的には動画である力 静止画の場合もある。例えば、 DVDカム コーダの写真機能で静止画が記録される場合がそうなる。
[0032] なお、 STBと DVDレコーダの間のデジタノレ I/Fは IEEE1394、 ATAPI、 SCSI等 がありうる。
[0033] なお、 DVDレコーダとテレビジョン装置との間はコンポジットビデオ信号である NTS Cと例示したが、輝度信号と色差信号を個別に伝送するコンポーネント信号でもよい 。さらには、 AV機器とテレビジョン装置の間の映像伝送 I/Fはアナログ I/Fをデジ タル I/F、例えば、 DVIに置きかえる研究開発が進められており、 DVDレコーダとテ レビジョン装置がデジタル I/Fで接続されることも当然予想される。
[0034] (2. DVDレコーダ装置の機能概要)
図 2は、 DVDレコーダ装置の機能を示すブロック図である。ドライブ装置は、 DVD —RAMディスク 100のデータを読み出す光ピックアップ 101、 ECC (Error Correc ting Code)処理部 102、トラックバッファ 103、トラックバッファへ 103の入出力を切 り替えるスィッチ 104、エンコーダ部 105及びデコーダ部 106を備える。
[0035] 図に示すように、 DVD— RAMディスク 100には、 1セクタ = 2KBを最小単位として データが記録される。 また、 16セクタ = 1ECCブロックとして、 ECCブロックを単位と して ECC処理部 102でエラー訂正処理が施される。
[0036] なお、 DVDレコーダ装置はデータの蓄積媒体として、 DVDディスクに加え、半導 体メモリカードやハードディスクドライブ装置を備えても良い。図 4は、半導体メモリ力 ードとハードディスクドライブ装置を備える場合の DVDレコーダのブロック図を示す。
[0037] なお、 1セクタは 512Bでも良いし、 8KB等でも良レ、。また、 ECCブロックも 1セクタ、 16セクタ、 32セクタ等でも良レ、。記録できる情報容量の増大に伴レ、、セクタサイズ及 び ECCブロックを構成するセクタ数は増大すると予想される。
[0038] トラックバッファ 103は、 DVD— RAMディスク 100に AVデータをより効率良く記録 するため、 AVデータを可変ビットレート(VBR)で記録するためのバッファである。 D VD— RAM100への読み書きレート(Va)が固定レートであるのに対して、 AVデー タはその内容(ビデオであれば画像)の持つ複雑さに応じてビットレート (Vb)が変化 するため、このビットレートの差を吸収するためのバッファである。
[0039] このトラックバッファ 103を更に有効利用すると、ディスク 100上に AVデータを離散 配置することが可能になる。図 3を用いてこれを説明する。
[0040] 図 3 (a)は、ディスク上のアドレス空間を示す図である。図 3 (a)に示す様に AVデー タが [al、 a2]の連続領域と [a3、 a4]の連続領域に分かれて記録されている場合、 a 2から a3へシークを行っている間、トラックバッファに蓄積してあるデータをデコーダ部 106へ供給することで AVデータの連続再生が可能になる。この時の状態を示したの が図 3 (b)である。
[0041] 位置 alで読み出しを開始した AVデータは、時刻 tlからトラックバッファへ 103入力 されるとともに、トラックバッファ 103からデータの出力が開始される。これにより、トラッ クバッファへの入力レート(Va)とトラックバッファからの出力レート(Vb)のレート差 (V a— Vb)の分だけトラックバッファへデータが蓄積されていく。この状態が、検索領域 が a2に達するまで、すなわち、時刻 t2に達するまで継続する。この間にトラックバッフ ァ 103に蓄積されたデータ量を B (t2)とすると、時間 t2から、領域 a3のデータの読み 出しを開始する時刻 t3までの間、トラックバッファ 103に蓄積されている B (t2)を消費 してデコーダ 106へ供給しつづけられれば良レ、。
[0042] 言い方を変えれば、シーク前に読み出すデータ量([al、 a2] )がー定量以上確保 されていれば、シークが発生した場合でも、 AVデータの連続供給が可能である。
[0043] AVデータの連続供給が可能な連続領域のサイズは ECCブロック数 (N_ecc)に 換算すると次の式で示される。式において、 N_secは ECCブロックを構成するセクタ 数であり、 S_sizeはセクタサイズ、 Tjはシーク性能(最大シーク時間)である。
[0044] N_ecc = Vb*Tj/((N_sec*8*S_size)*(l_Vb/Va))
また、連続領域の中には欠陥セクタが生じる場合がある。この場合も考慮すると連 続領域は次の式で示される。式において、 dN_eccは容認する欠陥セクタのサイズ であり、 Tsは連続領域の中で欠陥セクタをスキップするのに要する時間である。この サイズも ECCブロック数で表される。
[0045] N— ecc = dN— ecc+Vb*Tj/((N— sec*8*S— size)*(l— Vb/Va))
なお、ここでは、 DVD— RAMからデータを読み出す、即ち再生の場合の例を説明 したが、 DVD— RAMへのデータの書き込み、即ち録画の場合も同様に考えること ができる。
[0046] 上述したように、 DVD— RAMでは一定量以上のデータが連続記録さえされてい ればディスク上に AVデータを分散記録しても連続再生/録画が可能である。 DVD では、この連続領域を CDAと称する。
[0047] (3. DVDディスクの概要)
図 5 (a)、 (b)は、記録可能な光ディスクである DVD— RAMディスクの外観と物理 構造を表した図である。なお、 DVD— RAMは一般的にはカートリッジに収納された 状態で DVDレコーダに装填される。記録面を保護するのが目的である。但し、記録 面の保護が別の構成で行われたり、容認できる場合にはカートリッジに収納せずに、 DVDレコーダに直接装填できるようにしてももちろん良い。
[0048] DVD— RAMディスクは相変化方式によりデータを記録する。ディスク上の記録デ ータはセクタ単位で管理され、アクセス用のアドレスが付随する。 16個のセクタは誤り 訂正の単位となり、誤り訂正コードが付与され、 ECCブロックと呼称される。
[0049] 図 5 (a)は、記録可能な光ディスクである DVD— RAMディスクの記録領域を表した 図である。同図のように、 DVD— RAMディスクは、最内周にリードイン領域を、最外 周にリードアウト領域を、その間にデータ領域を配置している。リードイン領域は、光 ピックアップのアクセス時においてサーボを安定させるために必要な基準信号や他 のメディアとの識別信号などが記録されている。リードアウト領域もリードイン領域と同 様の基準信号などが記録される。データ領域は、最小のアクセス単位であるセクタ(2 048バイトとする)に分割されている。 また、 DVD— RAMは、記録'再生時におい て Z_CLV (Zone Constant Linear Velocity)と呼ばれる回転制御を実現する ために、データ領域が複数のゾーン領域に分割されてレ、る。
[0050] 図 5 (a)は、 DVD— RAMに同心円状に設けられた複数のゾーン領域を示す図で ある。同図のように、 DVD— RAMは、ゾーン 0〜ゾーン 23の 24個のゾーン領域に 分割されている。 DVD— RAMの回転角速度は、内周側のゾーン程速くなるようにゾ ーン領域毎に設定され、光ピックアップが 1つのゾーン内でアクセスする間は一定に 保たれる。これにより、 DVD— RAMの記録密度を高めるとともに、記録'再生時にお ける回転制御を容易にしている。
[0051] 図 5 (b)は、図 5 (a)において同心円状に示したリードイン領域と、リードアウト領域と 、ゾーン領域 0〜23を横方向に配置した説明図である。
[0052] リードイン領域とリードアウト領域は、その内部に欠陥管理領域(DMA: Defect M anagement Area)を有する。欠陥管理領域とは、欠陥が生じたセクタの位置を示 す位置情報と、その欠陥セクタを代替するセクタが上記代替領域の何れに存在する 力、を示す代替位置情報とが記録されてレ、る領域をレ、う。
[0053] 各ゾーン領域はその内部にユーザ領域を有すると共に、境界部に代替領域及び 未使用領域を有している。ユーザ領域は、ファイルシステムが記録用領域として利用 することができる領域をいう。代替領域は、欠陥セクタが存在する場合に代替使用さ れる領域である。未使用領域は、データ記録に使用されない領域である。未使用領 域は、 2トラック分程度設けられる。未使用領域を設けているのは、ゾーン内では隣接 するトラックの同じ位置にセクタアドレスが記録されている力 Z— CLVではゾーン境 界に隣接するトラックではセクタアドレスの記録位置が異なるため、それに起因するセ クタアドレス誤判別を防止するためである。
[0054] このようにゾーン境界にはデータ記録に使用されないセクタが存在する。そのため データ記録に使用されるセクタのみを連続的に示すように、 DVD— RAMは、内周 力、ら順に論理セクタ番号(LSN : Logical Sector Number)をユーザ領域の物理 セクタに割り当てている。
[0055] 図 6は、論理セクタにより構成される DVD— RAMの論理的なデータ空間を示す。
論理的なデータ空間はボリューム空間と呼称され、ユーザデータを記録する。
[0056] ボリューム領域は、記録データをファイルシステムで管理する。すなわち、データを 格納する 1群のセクタをファイルとして、さらには 1群のファイルをディレクトリとして管 理するボリューム構造情報がボリューム領域の先頭と終端に記録される。本実施の形 態のファイルシステムは UDFと呼称され、 ISO 13346規格に準拠してレヽる。
[0057] なお、上記 1群のセクタはボリューム空間で必ずしも連続的には配置されず、部分 的に離散配置される。このため、ファイルシステムは、ファイルを構成するセクタ群のう ち、ボリューム空間で連続的に配置される 1群のセクタをエクステントとして管理し、フ アイルを関連のあるエクステントの集合として管理する。
[0058] 図 7は、 DVD— RAMに記録されるディレクトリとファイルの構造を示す。ルートの下 に、 VIDEO— RTディレクトリがあり、この下に、再生用のデータである各種オブジェ タトのファイルと、これらの再生順序や各種属性を示す管理情報として VIDEO Ma nagerファイルが格納される。
[0059] オブジェクトは MPEG規格に準拠したデータであり、 PS— V〇B、 TS1— VOB、 T S2_V〇B、 A〇B、 POB、 MNF (Manufacturer's Priv
ate Data)力 sある。
[0060] PS_VOB、 A〇B、 POBは MPEGのプログラムストリーム(PS)であり、 TS1_V〇 B及び TS2_V〇Bはトランスポートストリーム(TS)である。プログラムストリームは、パ ッケージメディアに AV情報を格納することを考慮されたデータ構造を有し、一方、ト ランスポートストリームは通信メディアを考慮したデータ構造を有する。
[0061] PS VOB、TSl VOB、 TS2 V〇Bは、いずれも映像情報と音声情報を共に 有し映像情報が主体となるオブジェクトである。このうち、 TS1— VOBは原貝 IJ、 DVD レコーダによりエンコードが行われ、内部のピクチャ構造が詳細に管理されているォ ブジェクトであり、 TS2—VOBは DVDレコーダ外でエンコードされたオブジェクトで あり、内部のピクチャ構造等のデータ構造が一部不明なオブジェクトである。
[0062] 典型的には、 TSl_VOBは外部から入力されるアナログビデオ信号を DVDレコ ーダがトランスポートストリームにエンコードしたオブジェクトであり、 TS2_V〇Bは外 部から入力されるデジタルビデオ信号をエンコードすることなく直接ディスクに記録し たオブジェクトである。つまりデジタル放送を DVDレコーダが記録する際には、一般 的に TS2_VOBである。
[0063] A〇B、 P〇Bは MPEGのプログラムストリームであり、 A〇Bは音声情報が主体となる オブジェクトであり、 P〇Bは静止画が主体となるオブジェクトである。
[0064] MNF (Manufacturer's Private Data)は製造者固有の情報を格納するため のデータ領域である。
[0065] 上述した、映像情報主体、音声情報主体とは、ビットレートの割り当てが大きいこと を意味する。 VOBは映画等のアプリケーションに用いられ、 AOBは音楽アプリケー シヨンに用いられる。
[0066] (4.再生される AV情報の概要)
図 8は、 DVDディスクに各種 AVオブジェクトとして記録される MPEGデータの構造 を示す図である。
[0067] 図 8が示すようにビデオストリーム及びオーディオストリームは、それぞれ分割され多 重される。 MPEG規格においては、多重化後のストリームをシステムストリームと呼称 する。 DVDの場合、 DVD固有の情報が設定されたシステムストリームを VOB (Vide o Object)と呼称している。分割の単位は、パック'パケットと称され、約 2KByteの データ量を有する。
[0068] ビデオストリームは MPEG規格で符号化されており、可変ビットレートで圧縮されて おり、動きが激しい等の複雑な映像であればビットレートが高くなつている。 MPEG規 格では、映像の各ピクチャは、 Iピクチャ、 Pピクチャ、 Bピクチャに種類分けして符号 化される。このうち、 Iピクチャはフレーム内で完結する空間的な圧縮符号化が施され おり、 Pピクチャ、 Bピクチャはフレーム間の相関を利用した時間的な圧縮符号化が施 されている。 MPEGでは少なくとも Iピクチャを含む区間を GOP (Group of Pictur e)として管理する。 GOPは早送り再生等の特殊再生におけるアクセスポイントになる
。フレーム内圧縮された Iピクチャを有するためである。
[0069] 一方、音声ストリームの符号化には、 DVDの場合、 MPEGオーディオに加え、 AC 一 3や LPCMの符号化が用いられる。
[0070] 図 8が示すように、 G〇Pを構成するビデオ情報とそれに付随する音声情報とを含む 多重化後のデータ単位は V〇BU (Video Object Unit)と称される。 VOBUには
、当該動画区間の管理用の情報をヘッダ情報として含ませる場合がある。
[0071] 図 8で説明したシステムストリームには、プログラムストリーム(PS)とトランスポートス トリーム (TS)がある。前者はパッケージメディアを考慮したデータ構造を有し、後者 は通信メディアを考慮したデータ構造を有する。
[0072] 図 9は、プログラムストリームとトランスポートストリームのデータ構造の概要を説明す る図である。
[0073] プログラムストリームは、伝送及び多重化の最小単位である固定長のパックからなり 、パックはさらに、 1つ以上のパケットを有する。パックもパケットもヘッダ部とデータ部 を有する。 MPEGではデータ部をペイロードと称する。 DVDの場合はパックの固定 長はセクタサイズと整合性をとり 2KBになる。パックは複数のパケットを有することがで きるが、 DVDの映像や音声を格納するパックは 1パケットのみを有するため、特別な 場合を除いて 1パック = 1パケットになる。
[0074] 一方、トランスポートストリームの伝送及び多重化の単位は固定長の TSパケットから なる。 TSパケットのサイズは 188Bであり、通信用規格である ATM伝送との整合性を とっている。 TSパケットは 1つ以上が集まり PESパケットを構成する。
[0075] PESパケットはプログラムストリームとトランスポートストリームで共通する概念であり 、データ構造は共通である。プログラムストリームのパックに格納されるパケットは PES パケットを直接構成し、トランスポートストリームの TSパケットは 1つ以上が集まり PES パケットを構成する。
[0076] また、 PESパケットは符号ィヒの最小単位であり、符号化が共通するビデオ情報、ォ 一ディォ情報をそれぞれ格納する。すなわち、一つの PESパケット内に符号ィ匕方式 の異なるビデオ情報、オーディオ情報が混在して格納されることはない。但し、同じ 符号化方式であればピクチャバウンダリやオーディオフレームのバウンダリは保証せ ずとも良レ、。図 9に示すように複数の PESパケットで 1つのフレームを格納したり、 1つ の PESパケットに複数のフレームを格納するケースもありうる。
[0077] 図 10 (&)〜(()と図11 (&)〜(0)に、トランスポートストリームとプログラムストリームの 個別のデータ構造を示す。
[0078] 図 10 (a)〜(c)、図 12 (a)〜(d)に示すように、 TSパケットは、 TSパケットヘッダと、 適用フィールドと、ペイロード部から構成される。 TSパケットヘッダには PID (Packet Identifier)が格納され、これにより、 TSパケットが所属するビデオストリームまたは オーディオストリーム等の各種ストリームが識別される。
[0079] 適用フィールドには PCR (Program Clock Reference)が格納される。 PCRは ストリームをデコードする機器の基準クロック(STC)の参照値である。機器は典型的 には PCRのタイミングでシステムストリームをデマルチプレタスし、ビデオストリーム等 の各種ストリームに再構築する。
[0080] PESヘッダには、 DTS (Decoding Time Stamp)と PTS (Presentation Tim e Stamp)が格納される。 DTSは当該 PESパケットに格納されるピクチャ/オーディ オフレームのデコードタイミングを示し、 PTSは映像音声出力等のプレゼンテーショ ンタイミングを示す。
[0081] なお、全ての PESパケットヘッダに PTS、 DTSを有する必要はなぐ Iピクチャの先 頭データが格納開始される PESパケットのヘッダに PTS、 DTSがあればデコード及 び出力に支障はない。
[0082] TSパケットの構造の詳細は図 12 (a)〜(d)に示される。
[0083] 図 12 (a)〜(d)に示すように、適用フィールドには PCRに加えて、ランダムアクセス 表示フラグが格納され、当該フラグにより、対応するペイロード部にビデオ'オーディ ォのフレーム先頭であってアクセスポイントとなりうるデータを格納するか否かを示す 。また、 TSパケットのヘッダ部には前述した PIDに加えて、 PESパケットの開始を示 すユニット開始表示フラグ、適用フィールドが後続するか否かを示す適用フィールド 制御情報も格納される。ユニット開始表示フラグは新たな PESパケットの開始を示し、 PIDはストリームの種類及び属性を示す。
[0084] 図 11 (a)〜(c)には、プログラムストリームを構成するパックの構造を示す。パックは 、パックヘッダに SCRを有し、格納するパケットのパケットヘッダに stream_idを有し ている。 SCRはトランスポートストリームの PCRと、 stream_idは PIDと実質同じであ る。また PESパケットのデータ構造はトランスポートストリームと共通なため、 PESへッ ダに PTSと DTSが格納される。
[0085] プログラムストリームとトランスポートストリームの大きな違いの 1つに、トランスポート ストリームではマルチプログラムが許される点がある。すなわち、番組という単位では 1 つの番組しかプログラムストリームは伝送できなレ、が、トランスポートストリームは複数 の番組を同時に伝送することを想定している。このため、トランスポートストリームでは 、番組毎に番組を構成するビデオストリームとオーディオストリームがいずれかを再生 装置が識別することが必要になる。
[0086] 図 13 (a)〜(c2)に、番組を構成するオーディオストリームとビデオストリームの構成 情報を伝送する PATテーブル、 PMAPテーブルを示す。これらの図に示すように、 番組毎に使用されるビデオストリームとオーディオストリームの組み合わせに関する情 報を PMAPテーブルが格納し、番組と PMAPテーブルの組み合わせに関する情報 を PATテーブルが格納する。再生装置は、 PATテーブル、 PMAPテーブルにより 出力が要求された番組を構成するビデオストリームとオーディオストリームを検出する こと力 Sできる。
[0087] 次に上述してきたプログラムストリームのパックと、トランスポートストリームの TSパケ ットのディスク上の配置に関して、図 14 (a)〜(c)を用いて説明する。
[0088] 図 14 (a)に示すように、 16個のセクタは ECCブロックを構成する。
[0089] プログラムストリームの形式をとるビデオオブジェクト(PS_V〇B)を構成するパック
(PS Pack)は、図 14 (b)が示すように、セクタバウンダリで配置される。パックサイズ もセクタサイズも 2KBだからである。
[0090] 一方、トランスポートストリームの形式をとるビデオオブジェクト(TS1—VOB/TS2
-VOB)は 8KBのサイズを有する単位で ECCブロック内に配置される。この 8KB単 位で 18Bのヘッダ領域を有し、データ領域には ATS情報が付加された TSパケットが
43個配置される。 ATS情報(Arrival Time Stamp Information)は、 DVDレコ ーダにより生成し付加される情報であって、当該パケットが DVDレコーダに外部より 伝送されてきたタイミングを示す情報である。
[0091] 尚、図 14 (c)に示したように、固定バイトの ATSと MPEG—TSパケットとの組で連 続して記録した MPEG—TSの蓄積フォーマットも有り得る。
[0092] (5. AV情報の管理情報と再生制御の概要)
図 15 (a)、 (b)、図 16 (a)、(b)は図 7が示すところのビデオ管理情報 (Video Manager)と称されるファイルのデータ構造を示す図である。
[0093] ビデオ管理情報は、各種オブジェクトのディスク上の記録位置等の管理情報を示す オブジェクト情報と、オブジェ外の再生順序等を示す再生制御情報とを有する。
[0094] 図 15 (a)、 (b)はディスクに記録されるオブジェクトとして、 PS—VOB # 1〜PS _V
OB # n、 TS 1 -VOB # 1〜TS 1 VOB # n、 TS2— V〇B # 1〜TS2— VOB # n 力 Sある場合を示す。
[0095] 図 15 (a)が示すように、これらオブジェクトの種類に応じて、 PS—VOB用の情報テ 一ブルと、 TS1— VOB用の情報テーブルと、 TS2— VOB用の情報テーブルが個別 に存在すると共に、各情報テーブルは各オブジェクト毎の VOB情報を有してレ、る。
[0096] VOB情報は、それぞれ、対応するオブジェクトの一般情報と、オブジェクトの属性 情報と、オブジェクトの再生時刻をディスク上のアドレスに変換するためのアクセスマ ップ、当該アクセスマップの管理情報を有している。一般情報は、対応するオブジェ タトの識別情報、オブジェクトの記録時刻等を有し、属性情報は、ビデオストリームの コーディングモードをはじめとするビデオストリーム情報 (V_ATR)と、オーディオスト リームの本数(AST_Ns)と、オーディオストリームのコーディングモードをはじめとす るオーディオストリーム情報 (A_ATR)とから構成される。
[0097] アクセスマップを必要とする理由は 2つある。まず 1つは、再生経路情報がオブジェ タトのディスク上での記録位置をセクタアドレス等で直接的に参照するのを避け、ォブ ジヱタトの再生時刻で間接的に参照できるようにするためである。 RAM媒体の場合、 オブジェクトの記録位置が編集等で変更される場合がおこりうるが、再生経路情報が セクタアドレス等で直接的にオブジェクトの記録位置を参照している場合、更新すベ き再生経路情報が多くなるためである。一方、再生時刻で間接的に参照している場 合は、再生経路情報の更新は不要で、アクセスマップの更新のみ行えば良い。
[0098] 2つ目の理由は、 AVストリームが一般に時間軸とデータ(ビット列)軸の二つの基準 を有しており、この二つの基準間には完全な相関性がないためである。
[0099] 例えば、ビデオストリームの国際標準規格である MPEG— 2ビデオの場合、可変ビ ットレート(画質の複雑さに応じてビットレートを変える方式)を用いることが主流になり つつあり、この場合、先頭からのデータ量と再生時間との間に比例関係がないため、 時間軸を基準にしたランダムアクセスができなレ、。この問題を解決するため、オブジェ タト情報は、時間軸とデータ(ビット列)軸との間の変換を行なうためのアクセスマップ を有している。
[0100] 図 15 (a)が示すように再生制御情報は、ユーザ定義再生経路情報テーブル、オリ ジナル再生経路情報テーブル、タイトルサーチポインタを有する。
[0101] 図 16 (a)が示すように、再生経路には、 DVDレコーダがオブジェクト記録時に記録 された全てのオブジェクトを示すように自動生成するオリジナル定義再生経路情報と 、ユーザが自由に再生シーケンスを定義できるユーザ定義再生経路情報の 2種類が ある。再生経路は DVDでは PGC情報(Program Chain Information)と統一的 呼称され、また、ユーザ定義再生経路情報は U— PGC情報、オリジナル再生経路情 報は〇 PGC情報と呼称される。〇 PGC情報、 U— PGC情報はそれぞれ、ォブ ジェタトの再生区間であるセルを示す情報であるセル情報をテーブル形式で列挙す る情報である。〇 PGC情報で示されるオブジェクトの再生区間はオリジナルセル( O CELL)と呼称され、 U— PGC情報で示されるオブジェクトの再生区間はユーザ セル(U_ CELL)と呼称される。
[0102] セルは、オブジェクトの再生開始時刻と再生終了時刻でオブジェクトの再生区間を 示し、再生開始時刻と再生終了時刻は前述したアクセスマップにより、オブジェクトの 実際のディスク上の記録位置情報に変換される。
[0103] 図 16 (b)が示すように、 PGC情報により示されるセル群は、テーブルのエントリ一順 序に従って順次再生される一連の再生シーケンスを構成する。 [0104] 図 17は、オブジェクト、セル、 PGC、アクセスマップの関係を具体的に説明する図 である。
[0105] 図 17に示すように、オリジナル PGC情報 50は少なくとも 1つのセル情報 60、 61、 6 2、 63を含む。セル情報 60…は再生するオブジェクトを指定し、かつ、そのオブジェ タトタイプ、オブジェクトの再生区間を指定する。 PGC情報 50におけるセル情報の記 録順序は、各セルが指定するオブジェクトが再生されるときの再生順序を示す。
[0106] 一のセル情報 60には、それが指定するオブジェクトの種類を示すタイプ情報 (Typ e) 60aと、オブジェクトの識別情報であるオブジェクト ID (Object ID) 60bと、時間 軸上でのオブジェクト内の開始時刻情報(Start_PTM) 60cと、時間軸上でのォブ ジヱタト内の終了時刻情報(End_PTM) 60dとが含まれる。
[0107] データ再生時は、 PCG情報 50内のセル情報 60が順次読み出され、各セルにより 指定されるオブジェクトが、セルにより指定される再生区間分再生されることになる。
[0108] アクセスマップ 80cは、セル情報が示す開始時刻情報と終了時刻情報とをオブジェ タトのディスク上での位置情報に変換する。
[0109] 上述したマップ情報である力 オブジェクトの記録時にともに生成され記録される。
マップを生成するためには、オブジェクトのデータ内のピクチャ構造を解析する必要 がある。具体的には図 9で示す Iピクチャの位置の検出と、図 10 (a)〜(c)、図 11 (a) 〜(c)に示す当該 Iピクチャの再生時刻である PTS等のタイムスタンプ情報の検出が 必要になる。
[0110] ここで、 PS— VOBと TS1— VOBと TS2— VOBのマップ情報を生成する際に生じ る問題について以下説明する。
[0111] PS _VOB、 TS—VOB1は、図 1で説明したように主として、受信されたアナログ放 送を DVDレコーダが MPEGストリームにエンコードすることにより生成される。このた め、 Iピクチャや各種タイムスタンプの情報は自らが生成しており、 DVDレコーダにと つてストリーム内部のデータ構造は明確であり、マップ情報の生成になんの問題も生 じない。
[0112] 次に、 TS2—VOBである力 図 1で説明したように主として、受信されたデジタル放 送を DVDレコーダがエンコードすることなく直接ディスクに記録する。このため、 PS V〇Bのように Iピクチャの位置とタイムスタンプ情報を自ら生成するわけではないた め、 DVDレコーダにとってストリーム内部のデータ構造は明確ではなぐ記録するデ ジタルストリームからこれら情報を検出することが必要になる。
[0113] このため、 DVDレコーダは、レコーダ外部にてエンコードされたストリームを記録し ている TS2—VOBのマップ情報については下記のように Iピクチャとタイムスタンプを 検出する。
[0114] まず、 Iピクチャの検出は、図 12 (a)〜(d)に示す TSパケットの適用フィールドのラ ンダムアクセス表示情報を検出することにより行う。また、タイムスタンプの検出につい ては、 PESヘッダの PTSを検出することにより行う。タイムスタンプについては、 PTSの代わりに、適用フィールドの PCRや、 TSパケットが DVDレコーダに伝送され てきた到着タイミングである ATSで代用することもある。いずれにせよ、 DVDレコーダ は MPEGストリームのビデオ層のデータ構造を解析することなぐその上位層である システム層の情報により、 Iピクチャの位置を検出する。これは、マップ情報を生成す るためにビデオ層の解析まで行うのはシステムの負荷が大きいためである。
[0115] また、システム層の検出が不可能な場合もありうる力 この場合は、マップ情報が生 成できないため、有効なマップ情報が無いことを示すことが必要になる。 DVDレコー ダでは図 15 (b)に示すマップ管理情報によりこれらが示される。
[0116] 図 15 (b)に示すようにマップ管理情報は、マップ有効性情報と自己ェンコ一ディン グフラグとを有する。 自己エンコーディングフラグは、 DVDレコーダ自らがエンコード したオブジェクトであることを示し、内部のピクチャ構造が明確であり、マップ情報のタ ィムスタンプ情報や Iピクチャの位置情報等が正確であることを示している。また、マツ プ有効性情報は、有効なアクセスマップの有無を示す。
[0117] なお、システム層の検出が不可能な例としては、適用フィールドが設定されていな い場合や、そもそも MPEGトランスポートストリームで無いデジタルストリームの場合が 考えうる。デジタル放送が世界各国で各種方式が成立しうるため、 DVDレコーダが マップを生成できないオブジェクトを記録するケースも当然予想される。例えば、 日本 のデジタル放送を想定した DVDレコーダを米国で使用し、米国のデジタル放送を記 録した場合、マップを生成できないオブジェクトを記録するケースが出てくる。 [0118] 但し、 DVDレコーダはマップ情報が生成されないオブジェクトについても、先頭か ら順次再生することは可能である。この場合、記録されたデジタルストリームをデジタ ノレ I/Fを介して、当該ストリームに対応した STBに出力することでこれを映像再生す ること力 Sできる。
[0119] (6.再生機能の基本動作)
次に、図 18を用いて上記光ディスクを再生する DVDレコーダプレーヤの再生動作 について説明する。
[0120] 図 18に示すように、プレーヤは、光ディスク 100からデータを読み出す光ピックアツ プ 201と、読み出したデータのエラー訂正等を行なう ECC処理部 202と、エラー訂正 後の読み出しデータを一時的に格納するトラックバッファ 203と、動画オブジェクト (P S_V〇B)等のプログラムストリームを再生する PSデコーダ 205と、デジタル放送ォ ブジェクト(TS2_VOB)等のトランスポートストリームを再生する TSデコーダ 206と、 オーディオ 'オブジェクト (AOB)を再生するオーディオデコーダ 207と、静止画ォブ ジ工タト(POB)をデコードする静止画デコーダ 208と、各デコーダ 205、 206…への データ入力を切り換える切換え手段 210と、プレーヤの各部を制御する制御部 21 1 とを備える。
[0121] 光ディスク 100上に記録されているデータは、光ピックアップ 201から読み出され、 ECC処理部 202を通してトラックバッファ 203に格納される。トラックバッファ 203に格 納されたデータは、 PSデコーダ 205、 TSデコーダ 206、オーディオデコーダ 207、 静止画デコーダ 208の何れ力に入力されデコードおよび出力される。
[0122] このとき、制御部 21 1は読み出すべきデータを図 16が示す再生経路情報 (PGC) が示す再生シーケンスに基づき決定する。すなわち、図 16の例であれば、制御部 21 1は、 VOB # 1の部分区間(CELL # 1 )を最初に再生し、次レ、で、 VOB # 3の部分 区間(CELL # 2)を再生し、最後に VOB # 2 (CELL # 3)と再生する制御を行う。
[0123] また、制御部 21 1は、図 17が示す再生経路情報(PGC)のセル情報により、再生す るセルのタイプ、対応するオブジェクト、オブジェクトの再生開始時亥 1」、再生終了時刻 を獲得することができる。制御部 21 1は、セル情報により特定されるオブジェクトの区 間のデータを、適合するデコーダに入力する。 [0124] この際、制御部 211は、セル情報の Object IDにより再生対象のオブジェクトを特 定する。さらに、制御部 211は、特定したオブジェクトの再生区間であるセルの特定 を、セル情報の StartPTMと EndPTMを、対応する VOB情報のアクセスマップでデ イスク情報のアドレスに変換することにより行う。
[0125] また、本実施形態のプレーヤは、さらに、 AVストリームを外部に供給するためのデ ジタルインターフェース 204を有している。これにより、 AVストリームを IEEE1394や I EC958などの通信手段を介して外部に供給することも可能である。これは、特に、自 らがエンコードしていない TS2—VOBについては、プレーヤ内部に該当するデコー ダが存在しないケースもありうるため、デコードすることなぐ直接、デジタルインターフ エース 204を通じて外部の STBに出力し、その STBで再生させることができる。
[0126] 外部にデジタルデータを直接出力する際には、制御部 211は図 15 (b)のマップ管 理情報に基づき、ランダムアクセス再生が可能力、を否か判断する。アクセスポイント情 報フラグが有効であれば、アクセスマップは Iピクチャの位置情報を有する。このため 、制御部 211は外部機器から早送り再生等の要求があればこれに応じて、 Iピクチャ を含むデジタルデータをデジタル I/Fを介して外部機器に出力することができる。ま た、タイムアクセス情報フラグが有効であれば、タイムアクセスが可能である。このため 制御部 211は、外部の機器からのタイムアクセスの要求に応じて、指定された再生時 刻に相当するピクチャデータを含むデジタルデータをデジタル I/Fを介して外部機 器に出力することができる。
[0127] (7.記録機能の基本動作)
次に、図 19を用いて上記光ディスクに対して記録、再生を行なう本発明に係る DV Dレコーダの構成および動作について説明する。
[0128] 図 19に示すように、 DVDレコーダは、ユーザへの表示およびユーザからの要求を 受け付けるユーザインターフェース部 222、 DVDレコーダ全体の管理および制御を 司るシステム制御部 212、 VHFおよび UHFを受信するアナログ放送チューナ 213、 アナログ信号をデジタル信号に変換し MPEGプログラムストリームにエンコードする エンコーダ 214、デジタル衛星放送を受信するデジタル放送チューナ 215、デジタル 衛星で送られる MPEGトランスポートストリームを解析する解析部 216、テレビおよび スピーカなどの表示部 217、 AVストリームをデコードするデコーダ 218とを備える。デ コーダ 218は、図 18に示した第 1及び第 2のデコーダ等からなる。さらに、 DVDレコ ーダは、デジタルインターフェース部 219と、書きこみデータを一時的に格納するトラ ックバッファ 220と、 DVD— RAM100にデータを書きこむドライブ 221とを備える。デ ジタルインターフェース部 219は IEEE1394等の通信手段により外部機器にデータ を出力するインターフェースである。
[0129] このように構成される DVDレコーダにおいては、ユーザインターフェース部 222が 最初にユーザからの要求を受ける。ユーザインターフェース部 222はユーザからの要 求をシステム制御部 212に伝え、システム制御部 212はユーザからの要求を解釈す ると共に各モジュールへの処理要求を行う。
[0130] 録画には、入力されるデジタルデータを自らエンコードするセルフエンコーディング と、エンコード済みのデジタルデータをエンコードすることなくディスクに記録するァゥ トサイドエンコーディングがある。
[0131] (7. 1 セルフエンコーディングによる録画動作)
最初にセルフエンコーディングの録画について、アナログ放送を PS—VOBにェン コードして記録する動作を以下、具体的に説明する。
[0132] システム制御部 212はアナログ放送チューナ 213への受信とエンコーダ部 214へ のエンコードを要求する。
[0133] エンコーダ部 214はアナログ放送チューナ 213から送られる AVデータをビデオェ ンコード、オーディオエンコードおよびシステムエンコードしてトラックバッファ 220に 送出する。
[0134] エンコーダ部 214は、エンコード開始直後に、エンコードしている MPEGプログラム ストリームの先頭データが有するタイムスタンプ情報を再生開始時刻(PS_VOB_ V_S_PTM)としてシステム制御部 212に送り、続いてアクセスマップを作成するた めに必要な情報をエンコード処理と平行してシステム制御部 212に送る。この値は、 後に生成される図 17に示すセル情報の Start_PTMに設定される。タイムスタンプ 情報は、一般的には PTSになるが SCRで代用しても良い。
[0135] 次にシステム制御部 212は、ドライブ 221に対して記録要求を出し、ドライブ 221は トラックバッファ 220に蓄積されているデータを取り出し DVD— RAMディスク 100に 記録する。この際、前述した連続領域 (CDA)をディスク上の記録可能領域から検索 し、検索した連続領域にデータを記録していく。
[0136] 録画終了はユーザからのストップ要求によって指示される。ユーザからの録画停止 要求は、ユーザインターフェース部 222を通してシステム制御部 212に伝えられ、シ ステム制御部 212はアナログ放送チューナ 213とエンコーダ部 214に対して停止要 求を出す。
[0137] エンコーダ 214はシステム制御部 212からのエンコード停止要求を受けエンコード 処理を止め、最後にエンコードを行った MPEGプログラムストリームの終端データが 有するタイムスタンプ情報を再生終了時刻(PS_VOB_V_E_PTM)として、シス テム制御部 212に送る。この値は、図 17に示すセル情報の End_PTMに設定され る。タイムスタンプ情報は通常 PTSが設定される力 SCRで代用しても良い。
[0138] システム制御部 212は、エンコード処理終了後、エンコーダ 214から受け取った情 報に基づき、図 15に示す PS— VOB用の VOB情報 (PS-VOBI)と再生制御情報 を生成する。
[0139] ここで、生成される VOB情報はオブジェクト種類に適合したアクセスマップとマップ 管理情報とを含む。システム制御部 212は、マップ管理情報のマップ有効性情報を 有効に設定すると共に、 自己エンコーディングフラグを ONにする。
[0140] また、再生制御情報は、記録されるオブジェクトを再生対象の 1つとする図 16に示 すオリジナル再生経路(O— PGC情報)が生成される。生成された O— PGC情報は オリジナル再生経路テーブルに追記される。オリジナル再生経路(〇 PGC情報)は セル情報を有する。セル情報のタイプ情報には「PS_V〇B」が設定される。
[0141] 最後にシステム制御部 212は、ドライブ 221に対してトラックバッファ 220に蓄積さ れているデータの記録終了と、 PS—VOB用の V〇B情報(PS_V〇BI)および再生 制御情報の記録を要求し、ドライブ 221がトラックバッファ 220の残りデータと、これら の情報を DVD - RAMディスク 100に記録し、録画処理を終了する。
[0142] なお、アナログ放送を TS1—VOBにエンコードしてももちろん良レ、。この場合、ェン コーダ 214はアナログ信号をデジタル信号に変換し MPEGトランスポートストリームに エンコードするエンコーダである必要があり、セル情報内のタイプ情報は「TS1 -vo B」に設定される。
この場合の Start— PTMおよび End— PTMは、 PTSでも良いし PCRを用いても良 レ、。
[0143] (7. 2 アウトサイドエンコーディングによる録画動作)
次にアウトサイドエンコーディングによる録画にっレ、て、デジタル放送を録画する動 作を通して以下、具体的に説明する。この場合、記録されるオブジェクトの種類は TS 2— V〇Bになる。
[0144] ユーザによるデジタル放送録画要求は、ユーザインターフェース部 222を通してシ ステム制御部 212に伝えられる。システム制御部 212はデジタル放送チューナ 215 への受信と解析部 216へのデータ解析を要求する。
[0145] デジタル放送チューナ 215から送られる MPEGトランスポートストリームは解析部 2 16を通してトラックバッファ 220へ転送される。
[0146] 解析部 216は、最初にデジタル放送として受信されたエンコード済みの MPEGトラ ンスポートストリーム(TS2— VOB)の VOB情報(TS2— VOBI)の生成に必要な情 報として、トランスポートストリームの先頭データが有するタイムスタンプ情報を開始時 刻情報 (TS2— VOB— V— S— PTM)として抽出し、システム制御部 212に送る。開 始時刻情報は、後に生成される図 17に示すセル情報の Start— PTMに設定される 。このタイムスタンプ情報は、 PCR又は PTSになる。また、オブジェクトが DVDレコー ダに伝送されてくるタイミングである ATSで代用しても良い。
[0147] 解析部 216は、さらに、 MPEGトランスポートストリームのシステム層を解析し、ァク セスマップ作成に必要な情報を検出する。 Iピクチャのオブジェクト内での位置につい ては、前述したように TSパケットヘッダ中の適用フィールド(adaptation field)内の タ (randam access indicatoi もとに検出する, 次にシステム制御部 212は、ドライブ 221に対して記録要求を出力し、ドライブ 221 はトラックバッファ 220に蓄積されているデータを取り出し DVD— RAMディスク 100 に記録する。この時、システム制御部 212はファイルシステムのアロケーション情報か らディスク上のどこに記録するかをあわせてドライブ 221に指示する。この際、前述し た連続領域 (CDA)をディスク上の記録可能領域力 検索し、検索した連続領域に データを記録していく。
[0149] 録画終了はユーザからのストップ要求によって指示される。ユーザからの録画停止 要求は、ユーザインターフェース部 222を通してシステム制御部 212に伝えられ、シ ステム制御部 212はデジタルチューナ 215と解析部 216に停止要求を出す。
[0150] 解析部 216はシステム制御部 212からの解析停止要求を受け解析処理を止め、最 後に解析を行った MPEGトランスポートストリームの終了区間のデータが有するタイ ムスタンプ情報を表示終了時刻(TS2_VOB_V_E_PTM)としてシステム制御 部 212に送る。この値は、図 17に示すセル情報の End_PTMに設定される。このタ ィムスタンプ情報は、 PCR又は PTSになる。また、オブジェクトが DVDレコーダに伝 送されてくるタイミングである ATSで代用しても良い。
[0151] システム制御部 212は、デジタル放送の受信処理終了後、解析部 216から受け取 つた情報に基づき、図 15に示す TS 2— VOB用の VOB情報(TS2— VOBI)と再生 制御情報を生成する。
[0152] ここで、生成される VOB情報はオブジェクト種類に適合したアクセスマップとマップ 管理情報とを含む。システム制御部 212は、 Iピクチャのオブジェクト内での位置等を 検出でき有効なアクセスマップを生成した場合にはマップ管理情報のマップ有効性 情報を有効に設定する。また自己エンコーディングフラグは OFF設定をする。有効な アクセスマップを生成できなかった場合にはマップ有効性情報を無効に設定する。な お、有効なアクセスマップを生成できないケースとしては、対応していないデジタル放 送を受信した場合や、適用フィールドにランダムアクセス情報が無い場合等が考えら れる。また、デジタル I/Fから直接入力された場合は、 MPEGトランスポートストリー ムでないケースもありえ、この場合も当然、マップ有効性情報は無効に設定される。
[0153] また、再生制御情報は、記録されるオブジェクトを再生対象の 1つとする図 16に示 すオリジナル再生経路(0— PGC情報)が生成される。生成された 0— PGC情報は オリジナル再生経路テーブルに追記される。オリジナル再生経路(〇_PGC情報)は セル情報を有する。セル情報のタイプ情報には「TS2_V〇B」が設定される。
[0154] 最後にシステム制御部 212は、ドライブ 221に対してトラックバッファ 220に蓄積さ れているデータの記録終了と、 TS2— VOB用の VOB情報(TS 2— VOBI)および再 生制御情報の記録を要求し、ドライブ 221がトラックバッファ 220の残りデータと、これ らの情報を DVD— RAMディスク 100に記録し、録画処理を終了する。
[0155] 以上、ユーザからの録画開始および終了要求をもとに動作を説明したが、例えば、 VTRで使用されてレ、るタイマー録画の場合では、ユーザの代わりにシステム制御部 が自動的に録画開始および終了要求を発行するだけであって、本質的に DVDレコ ーダの動作が異なるものではない。
[0156] (8.詳細な実施形態)
第 1の実施例.
本発明の情報記録 Z再生装置の記録/再生時の基本動作に関しては、ほぼ前述 の説明の通りであるため、以下にアナログ外部入力記録時の基本動作に関してのみ 図 20を用いて具体的に説明する。この場合、記録されるオブジェクトの種類は TS1 VOBになる。
[0157] ユーザによる外部入力録画要求は、ユーザインターフェース部 222を通してシステ ム制御部 212に伝えられる。システム制御部 212は外部入力部 223への受信とェン コーダ 214へのデータ符号化を要求する。
[0158] エンコーダ 214から送られる MPEGトランスポートストリームはトラックバッファ 220へ 転送される。
[0159] エンコーダ 214は、最初にエンコード済みの MPEGトランスポートストリーム(TS1 — VOB)の VOB情報(TS1— VOBI)の生成に必要な情報として、トランスポートスト リームの先頭データが有するタイムスタンプ情報を開始時刻情報 (TS1—VOB—V _S_PTM)として設定し、システム制御部 212に送る。開始時刻情報は、後に生成 される図 17に示すセル情報の Start_PTMに設定される。このタイムスタンプ情報 は、 PCR又は PTSになる。
[0160] エンコーダ 214は、さらに、 MPEGトランスポートストリームを生成しながら、アクセス マップ作成に必要な情報を生成する。
[0161] 例えば、 Iピクチャの先頭 MPEGトランスポートパケットには、 adaptation fieldを 格糸内し、 random access indicatorのビットを立て、 VOBUのスタートであること をシステム制御部 212に転送する。
[0162] 次にシステム制御部 212は、ドライブ 221に対して記録要求を出力し、ドライブ 221 はトラックバッファ 220に蓄積されているデータを取り出し DVD— RAMディスク 100 に記録する。この時、システム制御部 212はファイルシステムのアロケーション情報か らディスク上のどこに記録するかをあわせてドライブ 221に指示する。この際、前述し た連続領域 (CDA)をディスク上の記録可能領域から検索し、検索した連続領域に データを記録していく。
[0163] 録画終了はユーザからのストップ要求によって指示される。ユーザからの録画停止 要求は、ユーザインターフェース部 222を通してシステム制御部 212に伝えられ、シ ステム制御部 212はエンコーダ 214に停止要求を出す。
[0164] エンコーダ 214はシステム制御部 212からの記録停止要求を受け符号化処理を止 め、最後に符号化を行った MPEGトランスポートストリームの終了区間のデータが有 するタイムスタンプ情報を表示終了時刻(TS1— VOB— V— E— PTM)としてシステ ム制御部 212に送る。この値は、図 17に示すセル情報の End— PTMに設定される。 このタイムスタンプ情報は、 PCR又は PTSになる。
[0165] システム制御部 212は、記録処理終了後、エンコーダ 214から受け取った情報に 基づき、図 15に示す TS1— VOB用の VOB情報(TS1— VOBI)と再生制御情報を 生成する。
[0166] ここで、生成される VOB情報はオブジェクト種類に適合したアクセスマップとマップ 管理情報とを含む。システム制御部 212は、マップ管理情報のマップ有効性情報を 有効に設定する。また自己エンコーディングフラグは ON設定をする。
[0167] また、再生制御情報は、記録されるオブジェクトを再生対象の 1つとする図 16に示 すオリジナル再生経路(0— PGC情報)が生成される。生成された 0— PGC情報は オリジナル再生経路テーブルに追記される。オリジナル再生経路(〇_PGC情報)は セル情報を有する。セル情報のタイプ情報には「TS1 _V〇B」が設定される。
[0168] 最後にシステム制御部 212は、ドライブ 221に対してトラックバッファ 220に蓄積さ れているデータの記録終了と、 TS1—VOB用の V〇B情報 (TS1_V〇BI)および再 生制御情報の記録を要求し、ドライブ 221がトラックバッファ 220の残りデータと、これ らの情報を DVD— RAMディスク 100に記録し、録画処理を終了する。
[0169] 以下、エンコーダ 214にて生成されるセルフエンコーディング MPEGトランスポート ストリームの詳細について説明する。
[0170] 図 21 (a)にセルフエンコーディング MPEGトランスポートストリームの構造を示す。
同図に示すように、セルフエンコーディングの MPEGトランスポートストリームは V〇B U単位に区切られ、各 VOBUの先頭には PATパケットと PMTパケットさらにはストリ ームに固有の情報を埋め込んだユーザプライベートパケット(以下「UPパケット」と称 す。)が続いている。または、少なくとも V〇Bの先頭には PATパケット、 PMTパケット が配置される。
[0171] 図 21 (b)に示したように、それぞれのパケットにはデコーダ入力時刻情報である AT Sが付与されており、個々のパケットは対応する ATSで意図された時刻にデコーダへ 転送される。
[0172] 先頭パケットの PATパケットには、セルフエンコーディングのプログラム情報(PMT パケットの PID等)が格納され、 ATS1の時刻でデコーダに入力される。
[0173] 2番目のパケットの PMTパケットには、プログラムを構成するエレメンタリーストリー ムごとの PID等が格納される。ここでは、ビデオ、オーディオ、データ放送(図中の" D ata")、ユーザプライベート(図中の〃 private")パケットの PIDを格納した例を示す。
[0174] 3番目のパケットの UPパケットには、ストリームへの付加情報が格納される。例えば 、ストリームのタイトル情報や、記録日時情報や、ストリームの符号化情報(ビットレート 、ビデオ解像度、フレームレート、アスペクト比、符号ィ匕方式等)であるストリーム属性 や、外部入力がアナログかデジタルか等の識別する入力源識別情報や、さらにはデ ジタルであった場合に入力 AVデータの符号化方式を特定する情報や、コピー許可 /不許可等の著作権保護情報や、 VBI (Vertical Blanking Interval)信号であ る、クローズドキャプション (CC)やテレテキストデータ、または表示制御を指定する W
SS (Wide - Screen Signaling)等や、システムエンコードの条件を示した情報や、 各種 DVD規格との変換性 (互換性)を示す情報や、該ストリームを記録した製造業 者の固有データ等を用いてユーザ利便性の高レ、メニュー情報や、各種 DVD規格対 応の MPEG— PSに変換する際に有用な様々なデータを格納することが考えられる。 [0175] 前述のように MPEGトランスポートストリーム内に配置され、付加情報を格納された パケットのデコーダ入力時刻について図 22 (a)、(b)を用いて詳細に説明する。
[0176] 図 22 (a)はトランスポートストリームシステムターゲットデコーダ(T—STD)と呼ばれ る基本的なデコーダの構成を示したブロック図であり、前述では触れていなかった PS Iパケットを解析し、デコーダの制御を行うシステムデコーダ 235も加えて示した図で ある。
[0177] PSIパケットである PAT、 PMTパケットは、 T—STDに入力されると、デマルチプレ クサ 232でパケット種別に応じて弁別され、システムコントロールに関する PSIパケット はトランスポートバッファ 233に瞬時に転送される。
[0178] 続いて、トランスポートバッファ 233に蓄積されたデータは随時システムバッファ 234 に 1000000ビット Z秒(=Rsys)のレートで転送される。
[0179] PSIデータが有効になるのは、システムバッファ 234に必要な PSIのデータが揃つ た瞬間である。
[0180] このように MPEGの T—STDモデルでは、デコーダの動作モデルを規定し、 MPE
Gトランスポートストリームの転送レート等の基準を定めている。
[0181] 情報記録装置は T STDにて正しく復号が可能と保証される MPEGトランスポート ストリームの形式に従いセルフエンコーディングする必要があるため、 PSIパケットの 転送にはいくつかの制限がある。以下に図 22 (b)を用いて、パケット転送レートを決 定する ATSの決定方法について説明する。
[0182] セルフエンコーディングストリームの再生時には、まずは先頭の PAT、 PMT、 UP パケットがそれぞれ ATS 1、 ATS 2, ATS3が示す時刻に T— STDに入力される。
[0183] PMTパケットと UPパケットに注目すれば、 PMTパケットで指定された UPパケット の PIDを T—STDが解釈し、有効にするためには、 TS_program_map_section
(mバイト)の最後のバイトがシステムバッファ 234に蓄えられている必要がある。
[0184] つまり、 PMTが有効になるには、 PMTパケット入力時刻である ATS2から、(m + n
+ 5) X 8/Rsys秒が経過しなければならなレ、。ここで、 nは PMTパケットの adaptati on_fieldのバイト長である。
[0185] T— STDの基準クロックである Svstem Clock Frequency (SCF)は 27000000 Hz (誤差として ± 810Hzまでの許容範囲が規定されている)であるため、 ATSを Sys tern Clock Frequencyの時刻精度で表した時刻情報だとすると、 ATS3と ATS2 の間には以下の関係が成り立つ必要がある。
[0186] ATS3≥ATS2 + ((m+n+5)*8/Rsys)*SCF
さらに、 ATS2と ATS3の最小間隔は PMTパケット内に adaptation_fieldがなく( n=0)、かつ PMTパケットには最小の TS_program_map_section (21バイト) が格納されているのみの時であるため、この場合 208ZRsys X SCFの時間間隔が 最小となる。
[0187] 同様に、 PATパケットの入力時刻 ATS1と PMTパケットの入力時刻 ATS2に関し ても、 PATハケット内の Program association
sectionのバイト長を mOとし、 PATパケットの adaptation_fieldのバイト長を ηθと すれば、以下の関係を満足する必要がある。
[0188] ATS2≥ATS1 + ((mO+nO+5)*8/Rsys)*SCF
さらに、 ATS1と ATS2の最小間隔は PATパケット内に adaptation— fieldがなく( n0 = 0)、かつ PATパケットには最小の Program association section (16バイト) が格納されているのみの時であるため、この場合 168/Rsys X SCFの時間間隔が 最小となる。
[0189] System Clock Frequency (SCF)を 27MHzとして時間を 27MHzの精度で表 現すれば、 ATS1と ATS2の時間間隔および ATS2と ATS3の時間間隔の最小値 は、それぞれ 4536と 5616となる。
[0190] 続いて、図 23、図 24、図 25、図 26を用いて、 User Privateパケット(UPパケット) のセルフエンコーディングトランスポートストリームへの格納方法について説明する。
[0191] 図 23では、 UPパケットを User Private streamとして定義した場合の UPパケッ ト格納方法を示している。この場合、 UPパケットに対応する PMTの stream_type には、 0x80以上でかつ OxFF以下の識別番号が割り振られ、 UPパケットには固有 の PIDが付与され、 UPパケット内部のデータ構造は MPEG規格外となる。また、ここ では UPパケット内に、 DVD_attribute_section ()とレ、うセクション構造を持たせ た例を示している。 [0192] また、図 24では、 UPパケットを private— section構造を持たせ、固有の PIDを付 与する場合の格系内方法を示してレ、る。 private― section内の section― syntax― in dicatorの値によって、 private— sectionのデータ構造が若干異なる力 UPパケット の固有データは private_sectionの private_data_byteに格納される。この場合 、 stream_typeには、 0x05の識別番号が割り振られる。
[0193] また、図 25では、 UPパケットを PMTと同じ PIDのパケットとして格納する方法が示 されている。この場合、 UPパケットのデータ構造は private_section構造に従う。こ の場合、 stream_typeは定義されず、 UPパケットには PMTパケットの PIDが付与 される。
[0194] また、図 26では、 UPパケットを個別に設けずに、 PMTパケットに内包する方法が 示されている。この場合も、 UPパケットに該当する固有データは private_section 構造となり、 TS一 program一 map一 sectionに続レヽて private一 section力 述 れ る。すなわち、 PMTノヽケット内に、 TS― program― map― sectionと private― sect ionの両方を格納してレ、る。
[0195] ここで、前述の方法によって MPEG— TSに格納される固有データの詳細について 、説明する。
[0196] 図 23、図 24、図 25、図 26にて記述されているように、固有データとしては、 DVD Video Recording規格の RDI Unitの RDI— GI (Rea卜 time Data Information G eneral Information)と、 DCI― CCI (Display Control Information and Copy Cont rol Information)を持つ。
[0197] RDI— GIは、該当 VOBUの先頭再生開始時刻(VOBU— S— PMT)と、記録日 時情報を格納し、 DCI_CCIは、当該 VOBU内のアスペクト比情報、サブタイトルモ ード情報、フィルム 'カメラモード情報等の表示制御に関わる情報と、コピー世代管理 情報や、 APS情報、入力ソース情報等が格納されている。 (RDI_GIと DCI_CCI の詳細については DVD Video Recording規格を参照。)
[0198] また、 V_ATRには、ビデオのビットレート情報、解像度情報、フレームレー M青報( もしくは NTSC/PAL等の video_format情報)、アスペクト比情報、符号化方式( MPEG2 _Videoや、 MPEG1—Video等の識別)の情報が格納される。 [0199] 同様に、 A— ATRにも、オーディオの本数に応じて、全部もしくは一部のオーディ ォのビットレート、符号化方式、チャンネル数、量子化ビット数、ダイナミックレンジコン トロール等の情報が格納される。
[0200] また、 CCには、当該 VOBU内の Closed Captionデータが格納される。 CCデー タの格納には、 PS変換の移植性を高めるために、予め extension_and_user_d ata (l) (GOPレイヤーでユーザデータを格納する方法)形式で記述しても良いし、 C
Cデータを別記述方式で記述しても良い。
[0201] GOPレイヤーのユーザデータに CCデータを格納する形式で記述するのが MPEG
— PS変換の効率を高めるのは、 DVD—Videoや DVD Video Recording規格が そのようにしてレ、るからである。
[0202] また、 C_SEには、当該 VOBU (もしくは V〇B)の TS2PS変換時に問題となるいく つかの問題点に対する情報が記述されている。
[0203] 例えば、 CC/WSS/Teletextデータ格納位置情報には、 CCデータが UPバケツ トにあるのか、各ピクチャヘッダのユーザデータとして記述されているのカ もしくはこ の VOBU (V〇B)に CCデータが無いのか等を識別するための情報である。
[0204] WSS格納位置情報については、固有データとして UPパケットにまとめて格納され ているのか、各ピクチャヘッダのユーザデータに記述されているのか等を示す情報で ある。
[0205] Teletext格納位置情報にっレ、ては、 Teletextを格納した TSパケットを設けて格 納されているの力、各ピクチャヘッダのユーザデータに記述されているのか等を示す 情報である。
[0206] 多重化ブロック構造 ·転送情報については、図 27に示す多重化ブロック(1つのェ レメンタリーストリームのみ力 S、他のエレメンタリーストリームと混在することなく格納さ れたデータブロック)を構成する TSパケットが固定数なのか可変数なの力 \また、固 定数ならばその固定数を表す情報や、 PTS/DTSが多重化ブロックの先頭 TSパケ ットに付与されているかを示す情報や、同一多重化ブロック内での転送レートについ ての情報等が記述されている。従来の多重化に条件を課さない MPEG _TSェンコ ード時には、多重化ブロックは 1つの TSパケットからのみ構成される固定長サイズとし て記述することも可能である。
[0207] 各デコーダバッファ制御用情報にっレ、ては、ビデオべリファイングバッファのパラメ ータである vbv— delayや、 vbv— buffer— size等のビデオバッファの余裕量を示す 情報や (この情報を用いてビデオデータを ATSの入力時刻からどれだけ先読みして 良いのか判断することができる)、当該 VOBU内のフレームでバッファ入力時刻が最 もそのフレームのデコード時刻に近いフレームの入力完了時刻とデコード時刻との時 刻差情報 (この情報を用いてビデオ'オーディオデータを ATSの入力時刻からどれ だけ後読みして良いのか判断することができる)等を記述する。
[0208] さらに、 DVD_Compatibility情報には、該 MPEG—TSを各 DVD規格に準じた MPEG— PSにトランスコードする際に、どの程度の負荷があるかを示した情報である
[0209] 例えば、多重化ブロックが 2KB以下で構成されていることでレベル 1のインジケータ 、 CC、 WSS、 Teletextデータが存在する場合に、 CC、 WSSデータが UPパケット に格納され、 Teletextがビデオデータを格納した多重化ブロック内に Teletextパケ ットとして格納されていればレベル 2のインジケータ、 CC、 WSS、 Teletextデータを 各 DVD規格で定める領域に格納した際にバッファマネージメントを考慮する必要が なければレベル 3のインジケータ、多重化ブロックの先頭 TSパケットの ATSを SCRに 置換する際に、バッファマネージメントを考慮する必要がなければレベル 4のインジケ ータ等と、該 MPEG— TSを各 DVDのフォーマットに容易に変換できるか否かの変 換性を示す情報である。
[0210] この DVD— Compatibility情報は、 DVD— Video用、 DVD— Audio用、 DVD Video Recording用、 DVD Stream Recording用等といった、 DVDフォーマツ トにそれぞれ対応した変換容易性を示す情報群である。
[0211] 図 27に多重化ブロックを利用した MPEG—TSの構造図と、それを DVD—Video 、 DVD Video Recordingフォーマットに変換した場合のデータ構成図を示した。
[0212] 図 27 (a)に示す自己録 TSストリームは、図 27 (b)に示す自己録 TSストリームの V〇 BU (再生 *復号の単位)から構成される。図 27 (c)に示すように、 1つの VOBUは複 数の多重化ブロック(MPEG— PSのパックに該当する)力 構成される。それぞれの 多重化ブロックは、図 27 (d)に示すように、固定長データサイズに分割されてもよく( これにより機器への実装が簡単になる。)、もしくは、図 27 (e)に示すように、可変長 データサイズに分割されてもよい(この場合、記録媒体の容量を浪費しない)。図 27 ( d)、図 27 (e)の場合は、 PSI/SIパケットや UPパケット等の非エレメンタリーストリー ムと、エレメンタリーストリームとをそれぞれ分離して多重化ブロックを構成しているが 、図 27 (f)に示すように、多重化ブロックにおいて、エレメンタリーストリームとともに、 PSI/SIパケットや UPパケット等の非エレメンタリーストリームが格納されてもよレ、。な お、図 27 (f)の場合、多重化ブロック # 1と多重化ブロック # 2とが 1つの多重化ブロッ クとなる。
[0213] さらに上記ストリームは、容易に図 27 (g)に示す DVD—Video形式や、図 27 (h)に 示す DVD Video Recording形式に変換されることができる。
[0214] この場合、多重化ブロックの並びの通りに MPEG— PSのパックが形成され、 1多重 化ブロックは 1パックのデータを格納した単位であること力 TS2PS変換を簡単に行 うために重要である。
[0215] なお、図 27において、カプセルヘッダや、 ATSは本発明と関連が性が低いため、 省略している。また、図 27 (g)、(h)で示した変換後の MPEG— PSの各パックは格 納されるエレメンタリのバイト長や VOBUァライメントに応じて stuffingや paddingがなさ れる。
[0216] 図 28は、図 8で示した従来のストリームの多重化方法と対応して本発明における多 重化を説明した図である。同図に示すように、最終的なフォーマットは図 28 (g)の M PEG— TSに準拠したフォーマットである。ビデオストリーム(図 28 (a) )は複数の GO P力 なる(図 28 (a) )。各 GOPは所定のピクチャデータからなり、 MPEG— PSに変 換したときの 1パックのデータ量に相当するデータ量を持つ TSパケット群を 1つの多 重化ブロックとする(図 28 (c)参照)。すなわち、 1つの多重化ブロックは図 28 (d)に 示すように 1パックのデータ量に相当する複数の TSパケットに分割される。オーディ ォストリームについても同様に複数の TSパケットをまとめて 1つの多重化ブロックとす る。そして、図 28 (e)に示すように、多重化ブロック単位で多重化することにより V〇B Uを構成する。このように、本発明では、 MPEG— PSの 1パックのデータ量に相当す るデータ量を有するデータを多重化ブロックとしてまとめて配置する(図 28 (e)参照) 点力 図 8に示す従来例に対して最大の相違点である。
[0217] また、 MPEG— TSの各パケットに付与する ATSについて、図 29に示すように、同 一多重化ブロック内にぉレ、ては、一定の増分( Δ ATS)だけ ATSを増加させながら A TSを付与してもよレ、。このことは、 TS2PSへの変換時に複雑なバッファマネージメン トを行うことを避け、単純なオフセット又はオフセットなしで ATSから SCRに置換する ために有効である。このとき、 ATSi (i=0,l,2,...)は次式の関係を満たす。
[0218] ATSi+ (多重化ブロック内のパケット数) X A ATS≤ATSi+l
多重化ブロックが固定長の場合、 1つの多重化ブロックに含まれる TSパケット数は 一定であるため、多重化ブロックの境界を容易に知ることができる。しかし、多重化ブ ロックが可変長であるとき、 1つの多重化ブロックに含まれる TSパケット数は不定であ るため、多重化ブロックの境界を知ることが困難となる。そこで、この場合は、多重化 ブロックの境界における ATS値の増分(A ATS)を、多重化ブロック内での増分(一 定値)とは異なる所定の値に設定する。つまり、前の多重化ブロック内の最後のパケ ットの ATS値と、その直後の多重化ブロックの最初のパケットの ATS値との差分( Δ ATS)を、一定値と異なる所定の値に設定する。これにより、 A ATSを監視すること により、多重化ブロックの境界を知ることができる。 MPEG— PSへ変換する際のTS パケットとパックとを一対一に対応付けることができる。このとき、 ATSiは次式の関係 を満たす。
[0219] ATSi+ (多重化ブロック内パケット数) X AATSく ATSi+1
また、図 29に示すように、 MPEG— TSにおける多重化ブロックの先頭のパケットに 付与された ATSiと、変換後の MPEG— PSのパック毎に付与される SCRiとが対応す る。
[0220] また、図 29に示すように、 UPパケット内に Closed Captionや DSI等の文字情報 を格納してもよレ、。 UPパケット内の DSIは変換後の NV_PCKのデータ生成に使用 され、 Closed Captionはビデオパックに格納される。また、欧州での PAL規格にも 対応できるように、図 30に示すように多重化ブロックにおいて Teletextデータを格納 したパケットを、ビデオデータを格納したパケットの間に挿入してもよい。このとき、 Tel etextデータを格納したパケットは、同時に表示される PTSを持つピクチヤの直前に 配置される。 Teletextデータは、変換後はビデオパックに格納される。図 31に上記 のように DSI等を格納する UPパケットのデータ構造を示す。
[0221] また、 UPパケットの付加情報に、 VOBU先頭の Iピクチャの最後のバイトを格納した TSパケットを特定する情報 (VOBU先頭力 の相対番号等)を記述してもよぐこれ により、効率良い特殊再生が実現できる。同様に、 VOBU内のいくつかの I、 Pピクチ ャゃ、全ピクチャのピクチャ符号化種別情報と、そのピクチヤのデータ長情報 (例えば 、最後のバイトを含んだ TSパケットを特定する情報等)と、各ピクチャの DTSZPTS を示す情報を記述することで、特殊再生を支援することも可能である。
[0222] 尚、前述の実施例において、 PTSZDTSを付与された TSパケットが多重化ブロッ クの先頭になるようにエンコードすれば、 TS2PS変換後のパックの先頭にアクセスュ ニットの先頭が配置されることになり、 DVD固有のヘッダ処理が簡単になる効果が期 待できる。
[0223] 尚、多重化ブロックを形成する TSパケットには MPEG— PSへの変換を考慮し、パ ックに格納されるデータがあふれることの無いように、適宜スタッフイングを入れても良 いし、多重化ブロック最後の TSパケットからスタッフイングを必要バイト数挿入しても 良い。
[0224] 尚、上記説明においては、 DVDに記録することを中心に説明を行った力 本発明 はこれに限る訳ではなぐ自己録 TSを HDDや半導体メモリー等の情報記録媒体に 記録した後、同一もしくは別の記録媒体上に MPEG— PS変換されたストリームを記 録するようにしても良い。
[0225] 尚、上記説明においては、 PAT、 PMT、 UPパケットを各 VOBUの先頭に記録す るとした力 少なくとも VOBの先頭に記録するとしても良いし、少なくとも再生管理単 位である Cellの先頭に記録するとしても良い。
[0226] 尚、上記説明においては、 PAT、 PMT、 UPパケットを記録するとした力 UPパケ ットは無くても良い。
[0227] 尚、上記説明においては、 PAT、 PMT、 UPパケットの配置を先頭に固定配置した 力 本発明はこれに限る訳ではなぐ NuUパケットを格納したパケット等を間に挿入し て記録しても良い。
[0228] 尚、上記説明においては、セルフエンコーディングのストリームは PATパケットから 始まるとした力 これに限る訳ではなぐ NuUパケットから始まっても良い。
[0229] 尚、 Nullパケットをセルフエンコーディングのストリームに適宜揷入することで、シス テム転送レートを固定レートにしても良い。
[0230] 尚、図 7のように、製造業者固有の情報を格納するデータ領域を設け、そこに MPE
G—TSシステムエンコードの条件を記述するようにしても良い。
[0231] 尚、上記説明にて UPパケットに記述した情報の全て若しくは一部を、図 15に示し た TS 1—VOB情報内に記述しても良レヽ。
[0232] 尚、 dual monoの音声チャンネルで記録されたセルフエンコーディングトランスポ 一トストリームを DVD— Videoフォーマットに変換するときには、 DVD— Videoには、 dual monoの音声が規格上存在しないため、 2本の異なる音声ストリームとして、左 右のモノラル音声をそれぞれ分割し変換しても良レ、。
[0233] また、上記説明にて UPパケットに記述されるパラメータの一部もしくは全部を管理 情報内に記述するようにしても良い。これは、 1セルフエンコーディングトランスポート ストリーム内で変化しなレ、パラメータを多数回記録することを避けることで無駄な記録 領域を発生させず、 UPパケットの出現ごとにパラメータが変化したか否力を判定する 余分なデコーダ処理を軽減する効果が得られる。
[0234] 第 2の実施例.
(エンコーダの構成)
以下、本発明の別の実施例について詳細に説明する。最初に、本発明に係る情報 記録装置のエンコーダについて、 AV入力を受けて MPEG—TSにセルフエンコード を行うエンコード処理に焦点を当てて説明する。
[0235] 図 33に、本発明に係る情報記録装置のエンコーダの構成を示す。同図に示したよ うにエンコーダ 214は、各エレメンタリーエンコーダ 230a、 230b, 230cと、システム エンコーダ 232と力らなる。エンコーダ 214はシステム制御部 212からの制御信号を 受け、エレメンタリーエンコーダ 230a、 230b, 230c及びシステムエンコーダ 232によ り、エレメンタリーエンコード又はシステムエンコードに切替えながらエンコード処理を 行なう。各エレメンタリーエンコーダ 230a、 230b, 230cは、ビデオ、オーディオ、 VB I (Vertical Blanking Interval)のそれぞれの信号を受けとり、エンコードを行う。
[0236] ビデオエンコーダ 230aは、システム制御部 212からの制御信号を受け、これに従 レ、、ビデオストリームのビットレート、解像度、アスペクト比等の属性を決められた範囲 内でエンコードする。具体的には、ビデオエンコーダ 230aは、エンコード開始時にシ ステム制御部 212力ら、「DVD— Video互換モード」、「DVD Video Recording 互換モード」または「通常モード」のレ、ずれかの動作モードを指定する制御信号を受 信する。制御信号が指定するモードが「DVD_Video互換モード」であれば、 DVD —Video規格のビデオ属性に準じたビデオストリームを、「DVD Video Recordin g互換モード」であれば、 DVD Video Recording (以下「DVD VR」と称す。)規 格のビデオ属性に準じたビデオストリームを、「通常モード」であれば、ある所定の範 疇の属性に準じたビデオストリームを生成する。
[0237] オーディオエンコーダ 230bも同様に、システム制御部 212からの制御信号を受け 、これに従い、オーディオストリームのビットレート、量子化ビット数、チャンネル数等の 属性を決められた範囲でエンコードする。ビデオエンコーダ 230aと同様に、具体的 にはシステム制御部 212から動作モードを示す制御信号を受信し、制御信号が示す モードが、「DVD— Video互換モード」であれば、 DVD— Video規格のオーディオ 属性に準じたオーディオストリームを、「DVD Video Recording互換モード」であ れば、 DVD VR規格のオーディオ属性に準じたオーディオストリームを、「通常モー ド」であれば、ある所定の範疇の属性に準じたオーディオストリームを生成する。
[0238] VBIエンコーダ 230cも、システム制御部 212から動作モードを指定する制御信号 を受け取り、これに従って、 VBIデータをエンコードする。具体的には、 VBIェンコ一 ダ 230cは、システム制御部 212から VBIエンコーダへ入力されるエレメンタリーストリ ームエンコード制御信号が、「DVD_ Video互換モード」、 「DVD Video Recordi ng互換モード」を指定する時には、夫々の規格で規定された VBIデータの格納方法 にしたがレ、 VBIデータを追加でエンコードする。追加でエンコードするとは、元々の 通常モードでも VBIデータを格納する方法が別途決められている可能性があるため 、それと重複してエレメンタリーストリーム内に格納することを意味してレ、る。 [0239] 以上のようにして、エンコードされたエレメンタリーストリームは夫々システムェンコ一 ダ 232によって MPEG— TSシステムストリームへ多重化される。
[0240] システムエンコーダ 232も、各エレメンタリーストリームエンコーダ 230a、 230b, 23 Ocと同様にシステム制御部 212からエンコードの制御信号を受け、これに従ったェン コードを行う。
[0241] システム制御部 212からシステムエンコーダ 232への制御信号は、通常の MPEG _TSへのシステムエンコード制御信号力、、通常の MPEG—TSに制限を加え、 MP EG -PS (特に DVD固有のフォーマット)に容易に変換できるシステムエンコード制 御信号(DVD—Videoモード力 \ DVD Video Recordingモード)かのどちらかで ある。
[0242] 通常の MPEG—TSへのシステムエンコード制御信号である場合には、システムェ ン ーダ 232は、各エレメンタリース卜リームェン ーダ 230a、 230b, 230c力、ら人力 されてきたエレメンタリーストリームを MPEG— TSシステムストリームの基準となるデコ ーダモデル(以下「T— STD」と称す。)で破綻を起こさないように、バッファマネージ メントしながら、システムエンコードを行う。
[0243] さらに、システム制御部 212からの制御信号力 MPEG— PSへ容易に変換できる MPEG— TSへのシステムエンコードを指定する制御信号である場合には、上記に 加えさらに特殊なシステムエンコードルールを守りながらエンコードを行う。
[0244] このようにして生成されたセルフエンコーディング MPEG— TSシステムストリームが エンコーダ 214から出力される。
[0245] 上述のように、本発明の情報記録装置は、エレメンタリーストリームとシステムストリ 一ムレベルで個々にエンコードモードを切り換えることを特徴としている。このェンコ ードモードの切り換えによって、夫々のエンコードモードに対し DVDフォーマットへ変 換する際の処理をまとめた表を図 34に示す。
[0246] このように、エレメンタリース卜リームエンコーダ 230a、 230b, 230c及び、システム ストリームエンコーダ 232に MPEG— PSへの変換を前提としたエンコードを行わせる ことで、 MPEG— PSへ容易に変換可能な MPEG—TSが作成される。
[0247] (セルフエンコードされた MPEG—TS) 以下に、本発明の情報記録装置にてセルフエンコードされた MPEG— TSのフォ 一マットの一実施例を詳細に説明し、通常の MPEG—TS (以下「SESF」と称す。)と 、 MPEG— PSに容易に変換可能なMPEG—TS (以下「Constrained SESF」と 称す。)との相違を説明する。
[0248] 以下の例では、 MPEG—TSストリーム単位で属性情報等を格納する VOBIに、そ のストリームの符号化条件を表す情報を格納する。このようにストリーム中ではなぐ 管理情報に符号ィ匕条件を表す情報を格納することにより、ストリームを解析することな くそのストリームが DVD—Videoや DVD VRのフォーマットに容易に変換可能なの か否かの判定を素早く行うことが可能となる。なお、このストリームの符号ィ匕条件を表 す情報は後述の Tipパケット中に格納されても良レ、。
[0249] このストリームの符号化条件を表す情報を" encode_condition"とレ、う 2ビットのフ ラグで表す。フラグの値の意味は以下の通りである。
00b :通常の MPEG— TS (SESF)
01b : DVD VR規格のストリームフォーマットに容易に変換可能な MPEG— TS (Constrained ¾E¾F;
10b :リザーブ
l ib : DVD Video規格のストリームフォーマットに容易に変換可能な MPEG— T S (Constrained SESF)
[0250] ストリーム管理情報内に、 00bの値を取る場合には、元々 MPEG— PSへの高速変 換を考慮せずにエンコードされている場合と、ユーザの編集作業によって、個々の M PEG— PSへの変換が容易な MPEG— PSを連結して一つのストリームとした場合が 考えられる。
[0251] また、ストリーム中にも encode_conditionを併せ持つ場合、通常の MPEG—TS を示す encode_condition=00bをストリーム内に持つ意味は無ぐストリーム中で は(後述の Tipパケット内では)、 encode_condition=00bはリザーブとして、使用 禁止とされるとして、 encode_conditionの使用方法がストリーム内 Z外で異なるこ ともあり得る。
[0252] 以上のようにフラグの値を決定することで、 VOBIの encode conditionフィールド の値から、そのストリームが DVD— Videoや VRフォーマットに容易に変換できるのか 否力を判定することができる。ここでいう容易に変換できるというのは後述の変換方法 で変換できることを意味してレ、る。
[0253] (Constrained SESFのストリーム構造)
図 80に Constrained SESFの全体的なストリーム構造を示す。 Constrained S ESFは複数の SESF capsule (SESFカプセル)からなる。 SESF capsuleは所定 の Multiplexing Unitを含み、かつ、先頭に Tipパケット(詳細は後述)を有する。 各 SESF capsuleの再生時刻情報(PTS)と、 Tipパケットのアドレス情報とはァクセ スマップ 80cにより対応付けられる。後述するように、 TS2PS変換では、この SESF capsule毎に変換処理が行なわれる。
[0254] 図 32は 1つの SESF capsule内の各パケットと MPEG— PSのパックとの対応を示 した図である。図 32に示すように、 Constrained SESF内に、ストリームの固有情報 を格納した TSパケット(以下「Tipパケット」と称す。)が挿入される。以下に、 Constra ined SESF内に埋め込まれる Tipパケットを図 35から図 41を用いて説明する。
[0255] (Tipパケット)
図 35に Tipパケットの全体構造を示す。この図にあるように Tipパケットは、そのパケ ットが Tipパケットであると特定するための Data— IDと、 DVD VRの DCI— CCIフィ 一ルドに対応し、表示制御やコピー制御情報を含む display— and— copy— infoと 、ストリームのエンコード情報を格納した encode— infoと、製造者独自の付加情報を 記述できる MakersPrivateDataとを格納する。
[0256] 図 35、 36に示したように、 Tipパケットには後述の SCR演算に必要な PCR値をァダ プテーシヨンフィールド内に記述している。このァダプテーシヨンフィールドも固定バイ ト長であるため、 Tipパケット内の各種情報へ固定アドレスでのアクセスが可能である
[0257] 図 37に Data_IDの構造を示す。 Data_IDは、そのパケットが Tipパケットである ことを識別するための Data_Identifierを備える。 Data_Identifierは、アスキーコ ードで〃 TIP〃を表す「0x544950」の値を持った 3バイトのフィールドである。再生装 置のデコーダはこのフィールドの値を判定し、 Tipパケットと特定することもできる。 [0258] 図 38に、 display— and— copy— infoの構造を示す。この display— and— copy —infoに、 DVD VR規格の RDI Unitの DCI— CCIと同一の構造および情報を持 たせることで、当該 Constrained SESFを DVD VRフォーマットへ変換する際の R DIパックの生成を容易にしている。 (なお、 DVD VR規格の DCI_CCIの詳細につ レヽては「DVD Specifications for Rewritable/ Re— recordable Disc Part 3 VIDEO RECORDING」や特許第 3162044号に開示されている。これらの文 献においては、一部フィールド名が異なっている力 各フィールドの定義は DVD V Rフォーマットへの変換時にそのままコピーを可能にするため同一である。 )
[0259] 図 39に encode_infoの構造を示す。 video_resolutionフィールドには、 Tipノ ケットに続くビデオストリームの解像度情報が記述される。 encode_infoの値を以下 に示す。
0000b: 720x480 (NTSC)、 720x576 (PAL)
0001b: 704x480 (NTSC)、 704x576 (PAL)
0010b : 352x480 (NTSC)、 352x576 (PAL)
0011b : 352x240 (NTSC)、 352x288 (PAL)
0100b : 544x480 (NTSC)、 544x576 (PAL)
0101b : 480x480 (NTSC)、 480x576 (PAL)
Others :リザーブ
[0260] DVD VRフォーマットでは 1連続記録中の解像度力 可変であっても良い。しかし ながら、この場合、解像度が異なるストリームは別個の VOBとして管理され、レコーダ によっては再生時のシームレス接続が保証される。したがって、 Constrained SES F記録中に解像度変化を起こす場合には、 DVD VRフォーマットに変換した場合に 、どの地点力 V〇Bを切り分ける必要があるのかを判定するために、このフィールド が使用される。
[0261] DVD—Videoフォーマットに変換することを考慮して記録される Constrained SE SF (encode_condition= l lb)では、解像度変化は 1ストリーム内では起こらなレヽ
[0262] encode conditionフィールドは、 VOBIに格納された値と(00bである場合を除き )同一である。ストリームの管理情報だけでなぐストリーム中にも埋め込んで encode —conditionフィールドを格納する理由は、 IEEE1394に代表されるデジタルインタ 一フェースを介してストリームがコピーされるようなことがあっても、受け手の記録装置 がこの Tipパケット内の encode_conditionフィールドを確認することで、容易に DV Dフォーマットへ変換できるか否かの判定を行うことを可能とするためである。
[0263] FVFPSTフィールドには、 DVD VR規格の VOBU_S_PTMが記録される。こ れは、 Constrained SESFを DVD— Video/VRフォーマットへ変換する際に、 Ti pパケットに続き符号化されているビデオストリームの解析を行レ、、最初に表示される ビデオフィールドの再生時刻を算出する処理を省くためである。
[0264] FVFPSTフィールドは、前記ビデオフィールドの表示時刻を 90KHz精度で表した
32ビットのフィーノレドと、これに表現されない 27MHz精度で表した 16ビットのフィー ノレドから成る。
[0265] 図 40に、 PES— infoの構造を示す。 PES_infoは、エレメンタリーストリームの解 析をすることなぐ Constrained SESFを DVD— Videoフォーマットへ変換するた めに必須となる情報である。この情報は、 DVD— Videoのストリームに挿入される N V— PCKと呼ばれる、特殊再生を支援するためのパックに格納される情報を生成す るために必要となる。
[0266] PES— infoには、合計 136個のビデオデータとオーディオデータを格納した PES パケットの情報を格納することが可能である。夫々の PESパケットに対して、 4ビットず つのデータが割り当てられ、 PESパケットの内部を解析せずとも NV—PCKの情報を 生成できるようになつている。尚、ビデオまたは、オーディオデータを格納していない PESパケットがある場合には、その PESパケットは無視される。
[0267] Tipパケットから、次の Tipパケットの一つ前のパケットまでのデータ単位である SES F Capsuleに対して、 PES_existence_flagは、 j番目の PESパケットがこの該当 の SESF Capsule内に存在するか否かのフラグである。 PES_existence_flagの 値は以下のように設定される。
Ob :j番目の PESパケットが当該 SESF Capsule内に存在しない。
lb :j番目の PESパケットが当該 SESF Capsule内に存在する。 [0268] PES— extension— flag = Ob (PESパケットが存在しない場合)である時には、当 該 PESパケットの残りのフィールドは全て Obとする。
[0269] PES— payload— identifierは、該 PESパケットに格納されたデータ力 ビデオデ ータなのか、オーディオデータなのかを識別するための情報である。 PES_payload
—identifierの値は以下のように設定される。
Ob :ビデオストリーム
lb :オーディオストリーム
[0270] PES_existence_flagと PES_payload_identifierは対象となる全ての PES パケットについて記述されるフィールドである。
[0271] さて、上記 PES_payload_identifierによってビデオかオーディオが格納されて レ、ると判明した時点で、 PESパケットが格納するストリームの種別によって、それ以降 のフィールド定義が異なる。
[0272] その PESパケットがビデオストリームを格納していた場合(PES— payload— identi fier= 0b)は、 PES— payload— identifierに続いて、その PESパケットに格納され たピクチャの種另 ljを示す picture― coding― typeが定義される。 picture― coding
—typeの値は以下のように設定される。
00b : 01b、 10b以外の符号ィ匕が施されたピクチャ
01b :フレームエンコードされた Iピクチャまたは、フィールドエンコードされた Iピク チヤの一対または、フィールドエンコードされた Iピクチャとフィールドエンコードされた Pピクチャの一対
10b :フレームエンコードされた Pピクチャまたは、フィールドエンコードされた Pピク チヤの一対
l ib :リザーブ
[0273] つまり、 01bもしくは 10bのピクチャは DVD—Video規格で定義される参照ピクチャ となるピクチャである。以上が、ビデオを格納した PESパケットに対する付加情報であ る。
[0274] 一方、 PESパケットがオーディオストリームを格納していた場合(PES_payload_i dentifier= lb)は、 PES payload identifierに続いて、その PESパケットに格 納されたオーディオストリームが第一音声ストリームなの力、第二音声ストリームなの かを識別する stream— identifierと、毎 Tipパケットに記述された FVFPST (—番最 初に表示されるビデオフィールドの再生開始時刻)と同時もしくはその直後に再生が 開始されるオーディオフレームを含んでいるか否かの判定フラグである sync_prese ntation _ flagと力ある。
[0275] stream_identifierの値は以下のように設定される。
Ob :第一音声ストリーム
lb :第二音声ストリーム
[0276] 第一音声ストリーム力、、第二音声ストリームかの識別は、 PIDの設定規則や、 PMT でのエレメンタリーストリーム宣言の順番等でも決めることができる。
[0277] sync_presentation_flagの値は、以下のように設定される。
Ob :該オーディオ PESパケットの中に、 FVFPSTと同時もしくは直後に再生開始 されるオーディオフレームが格納されてレ、なレ、。
lb :該オーディオ PESパケットの中に、 FVFPSTと同時もしくは直後に再生開始 されるオーディオフレームが格納されてレ、る。
[0278] 以上が、オーディオを格納した PESパケットに対する付カ卩情報である。 PES— info は、このように該 Tipパケットに続く個々の PESパケットごとの情報を抽出し、格納して レ、るフィールドである。
[0279] 図 41に、 MakersPrivateDataを示す。図示した通り、 MakersPrivateDataは、 該 Constrained SESFを生成した製造者を特定する maker— IDと、その製造者が 固有付加情報を記述する maker— private— dataを設ける。
[0280] 図 42 (a)、 (b)に、 Tipパケットの PIDとストリームの種別を示す stream_type値の 一例を示す。 PID、 stream_type共に MPEGや他規格にて予約されている値があ るため、それらと干渉せずかつ MPEG規格外のプライベートデータであることを加味 し、上記の値を選択した。
[0281] 以上のように、 Constrained SESFに格納される Tipパケットには、各種ストリーム の属性情報が抽出され格納されている。上記説明したフィールドが DVDフォーマット へ変換する際にどのように使用されているかの詳細については、後述する。 [0282] (システムエンコード条件)
次に、 Constrained SESFのシステムエンコード条件について詳細に説明する。 尚、以下のシステムエンコード条件は通常の SESFには適用されない。
[0283] (多重化単位(Multiplexing Unit) )
Constrained SESF内のエレメンタリーストリームを格納した TSパケットは、 DVD フォーマットの 2KBのパックに格納されるデータをまとめたユニットである多重化単位 (Multiplexing Unit)から構成される。なお、この多重化単位(Multiplexing Un it)は第 1の実施例の多重化ブロックに対応する。
[0284] 1つの Multiplexing Unit内には、 1種類のエレメンタリーストリームを格納する TS パケットだけが格納されており、他の種類のエレメンタリーストリームを格納する TSパ ケットと混在することはなレ、。また、 NULLパケットとの混在は、 1つの Multiplexing Unitを構成する際に必要となる場合があるので (例えば、ストリームの最後のパートを 格納した Multiplexing Unit)、禁止しない。これも、 Multiplexing Unitとパック の関係を明確にするために必要である。
[0285] 1つの Multiplexing Unitは 11個の連続した TSパケットから構成され、各 Multip lexing Unit内のエレメンタリーストリーム(ペイロードデータ)は対応する 1つのパッ クに完全に格納される。これも同様に、パックとの関連性を制限している。
[0286] ビデオストリームを格納した PESパケットが複数の Multiplexing Unitに分割配置 される場合には、 PESパケットの最後のバイトを含む Multiplexing Unitを除き、全 ての Multiplexing
Unitは 184 X 11 = 2024Bの TSパケットペイロードデータを格納する。これは、最 大の効率でストリームを転送することと、 TSパケット単位の逐次処理力 STS2PS変換 時に容易に実行できるようにするためである。仮に最後以外の Multiplexing Unit のデータ量を 2024B以下と認めてしまうと、 TS2PS変換時に Multiplexing Unit 最初の TSパケットを変換する際に MPEG— PSのパック毎のパケットヘッダに格納さ れる PES_packet_lengthの値を容易に決定することができなくなる。
[0287] Multiplexing Unitの中で始まる最初の完全なオーディオフレームデータは、 PE Sパケットペイロードの中で先頭のオーディオフレームでなければならなレ、。 [0288] これは、オーディオストリームを格納した PESパケットが複数の Multiplexing Uni tに格納されることを考えると分り易レ、。仮に 1つのオーディオ PESパケットが複数の Multiplexing Unitに分割配置されるとすると、 2つ目以降の Multiplexing Unit を MPEG— PSのパックに変換する際に、パケットヘッダを生成するために、 PTSを 特定し、 1つのパックに格納されるオーディオフレームの個数を決定する必要がある。 このため、 TS2PS変換時にオーディオストリームの内部解析が必要となり変換処理 が煩雑となることを避けてレ、る。
[0289] 以上が Multiplexing Unitの定義となる。 Constrained SESFを生成するェン コーダは、上記 Multiplexing Unitの制限の中でシステムエンコードを行う。
[0290] (Constrained SESF内の PESパケットヘッダの制限)
次に、 Constrained SESF内の PESパケットヘッダのフィールド値について、レヽく つかの制限を説明する。
[0291] 図 43に示したように、 PESパケットヘッダのフィールドには、固定値しか許されない ものがある。これは、 DVDフォーマットへ変換した際に余計な処理を発生させないた めである。余計な処理とは、 DVDフォーマットで定義された値と異なる値によって付 加的に発生/消滅するフィールドを処理することを意味している。言い換えれば、 TS 2PS変換時に、ヘッダに追加されるフィールドや削除されるフィールドを極力押さえる こと力 この PESパケットヘッダの制限の目的である。
[0292] PES— packet— legnthの値は MPEG— TSに格納されたビデオストリーム場合、 0が許されることがある。
[0293] PTS— DTS— flagsは、 PTS、 DTSが記述されているか否かを示すフラグである。
[0294] オーディオストリームを格納した PESパケットの場合、必ず 1つ以上のオーディオフ レームが PESパケット内で開始され、 PTS_DTS_flagsは 10b (DTSがある場合に は l ib)に設定される。
[0295] PES_extension_flagと PES_header_data_legnthには、 TS2PS変換の 際に TSパケット単位の逐次処理を行うための制限がある。これを図 44に示した。
[0296] 図 44に示した通り、エレメンタリーストリームの種別、 PESパケットの位置と encode conditionの値によって、夫々の値が定義される。 [0297] ここで、図 44にある VPDとは、 PESパケットの PTSフィールドと DTSフィールドを足 し合わせたバイト長である。即ち、
PTS— DTS— flags = 00bならば、 VPD = 0
PTS_DTS_f lags = 10bならば、 VPD = 5
PTS_DTS_flags = l lbならば、 VPD = 10
である。
[0298] 前述の通り、 DVD—Videoや VRへ変換する際に、 1パックのペイロード長が確定 してからパックを構成するのではなぐ TSパケットごとの逐次処理を容易にするため にこの制限が必要となる。
[0299] 以上が、 PESパケットヘッダの定義となる。 Constrained SESFを生成するェンコ ーダは、上記制限の中でシステムエンコードを行う。
[0300] (Tipパケットの揷入間隔に対する制限)
次に、 Constrained SESF内に挿入される Tipパケットの挿入間隔に関する制限 を説明する。
[0301] Tipパケットの ATS (ATS1)が示すデコーダ入力時刻と、 Tipパケットに続いて最 初にデコーダに入力されるビデオもしくはオーディオストリームを格納した TSパケット の ATS (ATS2)が示すデコーダ入力時刻とは、以下の関係が成り立つ必要がある。
ATS1 + T く = ATS2
Ί = Pb一 ack一 size*8*system一 clock一 frequencyノ / P rate
[0302] Tは、 PSパックの最小転送期間である。この最小転送期間は、 PSパックがシステム デコーダに入力開始されてから完了するまでの最小期間である。すなわち上記の式 は、各 TSパケットの ATS間隔は、少なくとも変換後の PSパックがシステムデコーダに入 力可能な間隔よりも大きいことが必要なことを示している。 Tの値を求めると次のように なる。
[0303] PS_pack_sizeは TS2PS変換で生成される MPEG— PSでの 1パックのバイト長 であり、 system_clock_frequencyは MPEG— PSデコーダの基準時刻の周波数 であり、 PSrateは TS2PS変換で生成される MPEG— PSストリームの多重化レート である。 [0304] DVDフォーマットの場合、それぞれ以下の値を取るため、 ATS1と ATS2の関係は 次のようになる。
PS— pack— size = 2048 バイ卜、
system― clock― frequency = 27000000 Hz、
PSrate = 10080000 ビット/秒、
ATS1 + 43885.714... <= ATS2
[0305] よって、 ATS1 + 43886 = ATS2 が ATS2の最小値となる。典型的には、後述の TS2PS変換にて Tipパケットが NV_PCK (DVD— Video変換時)もしくは RDI_P CK (DVD VR変換時)の 2KBのサイズを持つパックに変換される力 S、上記の式を 満たさない場合は、続くエレメンタリーストリームの転送時刻が早まり、 DVDのシステ ム転送レート 10. 08Mbpsの上限を超えてしまうことになる。
[0306] 一つの SESF capsuleには整数個の G〇Pがァライメントされて配置される。これは 、 DVDフォーマットの VOBUの概念を Constrained SESF上で実現するために、 SESF capsuleを、 DVDフォーマットの VOBUに対応させるためである。 DVDフォ 一マット(DVD VR)では、この VOBUは整数個の GOPから構成される必要がある
[0307] 一つの SESF capsule内に格納されるビデオデータの再生時間軸上での時間幅 は、 0. 4秒以上、 1. 0秒以下でなければならない。また、最後の SESF capsuleに 格納されるビデオデータの再生時間軸上での時間幅は、 encode— condition = 11 b (DVD— Videoモード)時には 0· 4秒以上 1 · 2秒以下であり、 encode— conditio n = 01b (DVD VRモード)時には 1 · 0秒以下でなければならなレ、。これは、 SESF capsuleが V〇BUとなり、各 DVDフォーマットに従うために必要である。
[0308] 各 Tipパケットは、通常、時間一アドレス変換を行うアクセスマップと 1対 1にポイント されること力望まれる。これは、 TS2PS変換を行う際に、 DVDフォーマットで言う所の VOBU単位で変換を即座に始められるようにすることと、変換時に DVD— Videoフ ォーマットに変換する場合に、 Tipパケットを NV_PCKへと変換してレ、く際に、 NV _PCK内に格納される近隣 VOBUへのアドレス情報である DSI (Data Search Info rmation)をアクセスマップから作成するために必要である。 DSIを計算するためには 、アクセスマップが、 Tipパケットごとにその再生時間(FVFPSTに準じた Tipパケット 直後の AV再生時刻情報の一部もしくは全部)と Tipパケットの記録アドレスとを格納 し、 2つの連続する Tipパケット間に Multiplexing Unitが何個格納されているかが 判れば良い。これは次の制約によって実現される。
[0309] 尚、全ての Tipパケットがアクセスマップからポイントされなくても良レ、、例えば、 Con strained SESF内で一番最後の Tipパケットに続く AVデータは、再生時間長や次 の Tipパケットが無い等、他の Tipパケットと異なる状態にあるため扱いが異なる。この ような場合、一番最後の Tipパケットをアクセスマップに登録せずとも特に再生や変換 に支障をきたす訳ではない為、機器の実装を鑑み、例外処理としても良い。
[0310] 連続する 2つの Tipパケット間には、 Multiplexing Unitに属さないパケットが合 計 32個揷入される。これは、 TS2PS変換時にアクセスマップを用いて DVDフォーマ ットに変換した場合、 VOBUのパック数がいくつになるのかを特定するために必要で ある。 (パケット数は 32個に限定する必要はなレ、が、ある所定の個数である必要があ る。アクセスマップの Tipパケットのアドレス情報から、 Tipパケットに続く TSパケット数 が特定できるため、 Multiplexing Unitでないパケットがいくつあるのかが判れば、 DVDフォーマットに変換した際に、 VOBUにレ、くつのパックが入るのか特定できる。 これが重要である。また、この情報は MNFや各 Tipパケット内の MakersPrivateDa ta内に記述されても良い。 )
[0311] また、 32個にする理由は、 MPEG—TSのプログラム構成情報を示すPAT、 PMT パケットが最低 100msecに一回以上埋め込まれることと、プログラムごとの固有情報 を格納した SITパケットが最低 1秒に一回以上坦め込まれることと、デコーダ基準時 刻を作り出す PCR (Program Clock Reference)を格納する PCRパケットが最低 100 msecに一回以上坦め込まれることと、何れの Multiplexing Unitにも属さない NU LLパケットが自由に付カ卩できることと、 Tipパケットの揷入間隔が AVデータ再生時間 軸で 1. 0秒以下であることから、連続する 2つの Tipパケット間には、少なくとも 31個 の PAT、 PMT、 PCR, SITパケットがあれば良い事になる。従って連続する 2つの Ti pパケット間に、その時間に応じた PAT、 PMT、 PCR, SITパケットを揷入し、 32パ ケットになるまで NULLパケットを付与することで、 VOBUのパック数をアクセスマツ プから特定することができる。
[0312] 一例として、 0. 5秒間隔で Tipパケットが挿入され、アクセスマップから特定できる該 Tipパケットに続く TSパケットの個数が 1209TSパケットである場合について変換後 のパック数を考えてみると、 PAT、 PMT、 PCRパケットを合計して 15パケット(=5+5+5 )、 SITパケットがこの Tipパケットに続けて揷入されたとして 1パケット、残りの 16パケ ットを NULLパケットとして揷入する。これを DVDフォーマットに変換する場合には、 Tipパケットが NV—PCK (DVD—Videoへ変換時)もしくは RDI_PCK (DVD V Rへ変換時)に変換されて 1パック、 1つの Multiplexing Unit (1 ITSパケット)は 1 パックに夫々変換される。従って、 VOBUのパック数は、 1 + Multiplexing Unitの 個数という式で求めることができ、 Mulitplexing Unitの個数は、(該 Tipパケットに 続く TSパケット数 _ 32) Z l lであるため、この例の場合には、 1+((1209_32)/11) = 1+107 = 108となり、該 VOBUは、トータル 108パックであることが計算できる。この V OBU毎のパック数と再生開始時刻情報があれば、 DVD Videoへ変換する際に必 要となる NV—PCKの DSIパケットを生成するのがきわめて高速に実現できる。
[0313] 以上が、 Tipパケット挿入間隔に対する制限である。 Constrained SESFを生成 するエンコーダは、上記制限の中でシステムエンコードを行う。
[0314] (デコーダ制御に関する制限)
次に、 Constrained SESFのデコーダ制御(バッファマネージメント)に関する制 限を説明する。
[0315] Constrained SESFは、 MPEG— TSの基準デコーダモデルである T—STDの 基準を満たすよう作成される必要がある。これは、 T STD準拠のデコーダを搭載し た STB等でもストリームの種別さえ合えば、 Constrained SESFのデコードが可能 であることを意味している。
[0316] MPEG—TSの基準デコーダモデルである T— STDと、 MPEG— PSの基準デコ ーダモデルである P— STDは、ほぼ同じ動作'処理能力を持つが、オーディオストリ ームのデコーダへの入力レートが異なる。具体的には、 T— STDは、図 18を用いて 説明すると、オーディオデコーダ前のトランスポートバッファからオーディオバッファへ の転送レートが AACを除いて、 2Mbps固定となっている。しかしながら、 P— STDは システムレートつまり DVDだと 10· 08Mbpsのレートで、各種ストリームをデコーダへ 人力すること力できる。
[0317] したがって、 Constrained SESFと DVDフォーマットとのバッファマネージメントは 共通化できないことになる。
[0318] このように、一般的には、 MPEG—TSと MPEG— PS間でのバッファマネージメント は共通化できないが、 Constrained SESFを DVDフォーマットへ変換する際に、 再度バッファマネージメントを考慮しながらシステムエンコード処理を行うことを避け、 各 TSパケットに付与された ATSを用いて、変換後のパックのデコーダ入力開始時刻 を示す SCR (System Clock Reference)を算出できれば、極めて高速にかつ容易に 変換が実行できる。 ATSを用いた SCRの導出方法の詳細は後述する。
[0319] また、本発明の Constrained SESFは、 T—STD準拠であると共に、後述する変 換方法によって生成された MPEG— PS力 S、 P— STD準拠であることを保証できるよ うに、予めエンコードされる必要がある。
[0320] つまり、 Constrained SESFとは、 MPEG— PSに変換しても P— STD準拠になる ように MPEG— TSにエンコードされたストリームである。
[0321] 以上が、 Constrained SESFのバッファマネージメントに関する制限である。なお 、 SESFではこれらのことを気にすることなぐ T—STDに合致するようにエンコードす るのみである。
[0322] ここで、 T— STD、 P— STDの基準モデルに準拠しない MPEG— TS、 MPEG— P Sの例を説明する。
[0323] 最初に図 45に、 MPEG— PSに変換可能だ力 T STDモデルを満たさないよう にセルフエンコードされた MPEG—TSの例を示す。ストリーム TS1は、 T— STDモ デルに準拠するようにシステムエンコードされた MPEGトランスポートストリームである 。ストリーム TS2は、 T—STDモデルに準拠していない MPEGトランスポートストリー ムである。すなわち、ストリーム TS2においては、 ATS [47]から ATS [57]の値が、 MPEG—TSにおいてオーディオデータに対して許容される転送レートを超えてしま うように設定されており、このため、オーディオのトランスポートバッファ(図 18参照)を オーバーフローさせてしまレ、T_ STDモデルを満たさなレ、ようになってレ、る。これに 対し、ストリーム TS1は、 ATS [47]から ATS[57]の値が MPEG— TSにおいてォー ディォデータに対して許容される転送レートを満たすように設定されている。このストリ ームからは、後述の SCR変換式にて P— STD準拠の MPEGプログラムストリーム PS 1に正しく変換できる。また、ストリーム TS2も、 T— STDを満たさないが、後述の SCR 変換式で変換すれば、 PS1を生成する。ストリーム TS2を T—STD準拠の MPEG— TSにするためには、 ATS [47]から ATS[57]で指定されるオーディオパケットの転 送時間間隔を広げ、トランスポートバッファをオーバーフローさせないようにすることが 必要である。
[0324] 次に、図 46 (a)、 (b)に T— STDは満たす力 MPEG—TS力、ら変換された MPEG — PSが P_ STDモデルを満たさない場合の例を示す。ストリーム TS3は MPEGトラ ンスポートストリームであり、ストリーム PS3は MPEGトランスポートストリーム TS3から 変換された MPEGプログラムストリームである。図 46 (b)は、各ストリームのデコ一ド 時のビデオデータ用バッファの状態の変化を示している。 PES # 1のピクチャのデコ 一ド時刻は S CR [ 2]であり、 PES # 2のピクチャのデコード時刻は S CR [4]と S CR [ 5 ]の間にくる。
[0325] 図 46 (b)に示すように、トランスポートストリーム TS3においては、 PES # 1、 PES # 2に含まれるピクチャデータのデコードまでに各 TSパケットのデータ転送が間に合つ ている。これに対し、プログラムストリーム PS3では PES # 1に対しては V—PCK # 1 の転送が間にあっている力 PES # 2に対しては、 V— PCK # 4の転送が間に合わ ず、その転送途中でデコードが開始されたためにバッファアンダーフローを生じる。よ つて、 P— STDモデルが満たされていなレ、。このような状態を回避するためには、 M PEG—TSにおいて PES # 2の転送が早期に完了するように、 V_PCK # 2〜V_P CK # 4に変換される各 TSパケットの ATS (ATS [14], ATS[25]、 ATS[36])の値を 時間的に早くなるようにシフトさせればよい。
[0326] (ATS— SCR変換)
次に、 Constrained SESFのストリームをプログラムストリームに変換するときの PS パケットの SCRの導出方法について説明する。なお、 SCRの計算が必要となるのは 新規にパックを生成するときであるため、 Tipパケットと、 Multiplexing Unitの先頭 の TSパケットを変換するときのみ必要となる。
[0327] Constrained SESFのストリームは、図 14 (c)に示す構造を持っている。 TSパケ ット中には基準時刻情報(PCR)を格納した PCRパケットが適宜挿入されており、これ を用いてデコーダ基準時刻である STC (System Time Clock)をある時間間隔でリセ ットすることが可能である。また、各 TSパケットには、各 TSパケット間の相対的な送出 時刻情報を格納した ATSが前置されている。そのため、 PCRを格納した TSパケット 以降に送出される TSパケットは、 PCR値と、 TSパケット間の相対的な送出時刻情報 である ATSとから得られるタイミングでデコーダに入力される。つまり、 PCRを格納し た TSパケット以降の TSパケットに対しては、各 TSパケットのデコーダ入力時刻(以 下「calculated_PCR」と称す)を生成できる。また、 PCRを格納した TSパケットが無 い場合でも、 PCRに相当する情報を管理情報に抽出しておくことも可能である。
[0328] 図 47は、 Constrained SESFから MPEG— PSへ変換した際の calculated_P CRと SCRの関係を示した図であり、図 80で示す Capsuleの先頭部である。なお、図 において、各 TSパケットにストリーム先頭から昇順で付与された ATSを ATS [k]と表 記している。また、 Multiplexing Unit先頭の TSパケットに対して、その出現順に 計算された PCR値を calculated— PCR[i] (i=0,l,2,...)と表記している。同様に変換 後のパックの SCRも出現順に SCR[i]と表記している。
[0329] 前述の通り、 T STD基準モデルでは、ビデオストリームの転送については最大転 送レート 15Mbps (MP@MLの場合、マルチプレクサバッファからビデオバッファの 転送レートは 15Mbpsを超えなレ、)の制限があり、オーディオストリームの入力レート については、ビデオよりも低いレート制限がある。 (トランスポートバッファ力らオーディ ォバッファへの転送レートは AACを除き 2Mbpsを超えなレ、)このため、オーディオデ ータを格納した Multiplexing Unitは、ビデオデータを格納した Multiplexing U nitと異なり、低レートで転送される。従って、ビデオデータの転送レートを DVDフォ 一マットの最大レートである 9. 8Mbps近くまで上げようとすれば、転送レートが低く時 間がかかるオーディオデータの転送時間を確保するために、ビデオデータの TSパケ ットは、 DVDの転送レート(10. 08Mbps)より高いレートで送出される必要がある。
[0330] 図 47に示すように、 Constrained SESFと、 DVDフォーマットとの間で、転送時 間帯が異なってレ、ること力 Sわ力る。
[0331] Tipパケットもしくは Multiplexing Unitの先頭の TSパケットのデコーダ到着時刻
(calculated— PCR)と、それらが変換された後のパックの SCRとの間には、次の関 係式が成り立つ必要がある。
[0332] SCR[0] = calculated_PCR[0]
SCR[i] = max( SCR[i— 1] + T , calculated_PCR[i] ) (i= 1,2,
3, ...)
calculated_PCR[i] = PCR_tip + (ATS[n] - ATS_tip + WA*BS) T = PS― pack― size*8*system― clock― frequency I PSrate
ここで、 PCR_tipと ATS_tipは夫々、変換する Multiplexing Unit直前の Tipパケ ットに記述された PCR値と、その Tipパケットの ATS値である。 WAは、 i番目の Multi plexing Unitの中で先頭の TSパケットに付与された ATS (ATS[n])と ATS_tipとの 間の ATSで、何回桁あふれが起きたかを表しており、 BSは、 ATSの一回の桁あふれ の量を表している。また、 max(a, b)は a, bの内で大きい方の値を選択する関数であ る。
[0333] また、 SCR[i] (i=0、 1、 2、 3. . . )に関する関係式では、前述の通り、 PS— pack —sizeは TS2PS変換で生成される MPEG— PSのパック 1個分のバイト長である。 sy stem— clock— frequencyは MPEG— PSデコーダの基準時刻の周波数であり、 P Srateは TS2PS変換で生成される MPEG— PSストリームの多重化レートである。す なわち、
PS— pack— size = 2048 バイ卜、
system― clock― frequency = 27000000 Hz、
PSrate = 10080000 ビット/秒である。
[0334] 従って、先頭以降のパックの送出については、一つ前のパックの送出時刻から転送 レートで定められる転送最小時間経過後に送出するか、そのパックを形成する最初 の TSパケットのデコーダ入力時刻にて送出される力、、の 2つのパターンがある。ビデ ォデータを DVDフォーマットへ変換した時刻よりも早い時刻に送出している時には、 前者の転送最小時間間隔をあけて送出される方が選択される。例えば、ビデオデー タを DVDフォーマットへ変換したときよりも早い時間帯に送出している場合は、一つ 前のパックの送出時刻から転送レートで定められる転送最小時間経過後に送出され る。
[0335] 尚、 Constrained SESFは編集が可能であるため、 encode_condition= 1 lb で記録した場合でも、ストリームの先頭部分を編集で消去した場合等は、 calculated
_PCR[0] = 0とならないことも考えられる。
[0336] しかしながら、 encode—condition = 1 lbでありな力 Sら、 calculated_PCR[0] =
0でない場合には、 encode_condition= l lbの場合のみ、次の変換式を定義する ことで、問題を解決することができる。
SCR[0] = 0
SCR[i] = max( SCR[i— 1] + T, calculated_PCR[i] ) - calculated_PCR[0] (i= 1,2, 3, ···)
calculated— PCR[i] = PCR_tip + (ATS[n] - ATS— tip + WA*BS) T = PS― ack― size*8*system― clock― frequency I PSrate
PTS(DVD- Video) = PTS(Constrained SESF) - calculated— PCR[0] DTS(DVD— Video) = DTS(Constrained SESF) - calculated— PCR[0] ATS[n]、 WAは上記の通り、 i番目の Multiplexing Unit先頭の TSパケットの ATS 値と、 ATS— tipからの桁あふれ回数である。
[0337] つまり、 DVD— Video規格に準拠させるために、 SCR[0] = 0とし、以降の SCRは 前述の変換式の結果に時間 calculated— PCR[0]だけオフセットされた値を用い、 DVD— Videoストリーム中の PTS、 DTSも全て、一律に時間 calculated— PCR[0] だけオフセットする。
[0338] こうして、ストリームの時刻情報を一律にオフセットすることで、 Constrained SES F (encode_condition = 1 lb)の先頭等を削除した場合でも、 encode_conditio n= l ibのまま管理され DVD—Videoフォーマットへ変換ができる。
[0339] DVD— Video規格フォーマットへの変換においては、 PTS/DTS値の変換が発 生するが、 TSパケット単位の逐次処理で容易に実現できる。
[0340] TS2PS変換する際には、上式に基づいて ATSから SCRが計算される。 TS2PS変 換により得られるプログラムストリームは前述のように P— STDモデルを準拠する必要 があり、このため SCRの値はある範囲に制限される。したがって、 Constrained SE SFの各パケットに付与される ATSの値は上述の ATS— SCR関係式を考慮して設 定される必要がある。
[0341] (エレメンタリーストリームに関する制限)
次に、 Constrained SESFのエレメンタリーストリームに関する制限を説明する。
[0342] エレメンタリーストリームの再エンコードは機器にとって非常に負荷の高レ、処理にな るため、ビデオデータについては、 MPEG2_Videoのみが許され、オーディオデー タについては、 AC— 3、 MPEG 1 -Audio, LPCM力許される。
[0343] ここで説明する Constrained SESFは、 LPCMを除外している力 S、これは 20ビット 以上の量子化ビット数を持つ LPCMの場合にエレメンタリーストリームの再エンコード を行う危険性を避けるためと、転送レートが上げられないオーディオのデータ量を削 減することで、バッファマネージメントを容易に行うためでもある。し力 ながら、 16ビッ トの LPCMであれば、特に除外する必要はない。以下に説明する Constrained S ESFに許されたストリームは、ビデオに関して MPEG2—Video、オーディオに関し て AC— 3、 MPEG1— Audioの 2種類のみとして説明する。なお、 Constrained S ESFでない通常の SESFでは、オーディオデータの符号化がこれに限らず、 BSデジ タル放送で使用されてレ、る AAC (Advanced Audio Coding)等の符号化方式が 用いられても良い。
[0344] 図 48に encode— condition="l lb"の場合のエレメンタリーストリーム属性をまと めて示した。
[0345] 同図に示された属性は、 DVD—Video又は DVD VRフォーマットに対してエレメ ンタリーストリームレベルでの互換性を保てるように設定されているため、この属性に 従った Constrained SESF (encode—condition = l ib)は、 DVD— Video又は DVD VRフォーマットへ変換する際に、エレメンタリーストリームの再エンコードを必 要とせず、高速変換が可能である。
[0346] 図 49に encode_condition="01b"時のエレメンタリーストリーム属性をまとめて 示した。 [0347] 同図に示された属性は、 DVD VRとのエレメンタリーストリームレベルでの互換性 を保てるように設定されているため、この属性に従った Constrained SESF (encod e— condition=01b)は、 DVD VRフォーマットへ変換する際に、エレメンタリースト リームの再エンコードを必要とせず、高速に変換可能である。
[0348] ここで、図 48、図 49に記述した Note:!〜 4について説明する。
Notel:この属性は、同一 VOB内で変化してはいけなレ、。
Note2:この属性は、 Tipパケットに続く最初のエレメンタリーストリームを格納した T Sパケット内で変化しても良レ、。言い換えれば、 SESF Capsuleで先頭のビデオもし くはオーディオの TSパケットでのみ変化できる。
Noted: horizontal― size、 vertical― sizeと aspect― ratio― mf ormation )51 I BJ 一で fcdsequence _ headerfHIに f 、 sequence _ end _ codeを f申入して fま zよらな レ、。
Note4 :この属性は、モノラル、ステレオ、デュアルモノの間であれば、同一 VOB内 で変化しても良い。
[0349] 以上が、 Constrained SESFのエレメンタリーストリームに関する制限である。
[0350] ここで、説明してきたエンコード条件を加えることで DVDフォーマットへ容易にかつ 高速に変換可能な Constrained SESFの生成が可能となる。
[0351] (変換後の DVD— Video/DVD VRフォーマット)
次に、 Constrained SESFが変換されるべき DVD— Video、 DVD VRのフォー マットにおけるフィールド設定について説明する。
[0352] (DVD— Videoフォーマット)
以下では、簡単に DVD—Video規格のストリームについて説明する。なお、 DVD
—Videoのストリームフォーマットの詳細については、「DVD Specifications for
Read-Only Disc Part 3 VIDEO SPECIFICATIONSJに記述されている。
[0353] 図 50に DVD—Video規格のフォーマットのストリーム構造を示す。同図に示すよう に、各ストリームは複数の VOBを含み、各 V〇Bは整数個の VOBU力 成る。 VOB Uは整数個のパック力 成り、 NV PCKを先頭としてビデオパック(V PCK)ゃォ 一ディォパック(A— PCK)がこれに続く。 NV— PCKは、通常の DVDのパックの構 造と異なり 2つのパケットを内包した形となっている。それぞれのパケットは PCI (Prese ntation Control Informationリノヽケット、 DSI (Data Search Information)ノヽケットと呼 ばれ、 PCIパケットには、当該 VOBUに対する再生制御情報が格納される。 DSIパ ケットには、当該 VOBUと周辺の VOBUとの位置関係等の特殊再生に有用な情報 が格納されている。以下では、フィールドを説明するとともに、その生成方法を合わせ て記述していく。
[0354] 図 51に NV_PCKの PCIデータの構造を示す。 PCIデータは、 PCIの全般的な情 報を格納する PCI_GI (PCI General Information)と、非シームレスのアングル情報 である NSML_AGLIと、メニューボタンなどにハイライトを当てるための情報である HLIと、 ISRC (International Standard Recording Code)を格納する RECIとから構 成される。
[0355] NSML— AGLIと HLIは、 Constrained SESFから変換された場合には、無効を 意味するデータが記述される。
[0356] ISRCには、無効を意味するデータを記述しても良いし、 ISRCコードを正しく記述 しても良いが、 Constrained SESFからの変換に関係がないため、ここでの説明は 割愛する。従って、 Constrained SESFから PCIデータを作成する際に問題となる のは、 PCI— GIのみである。
[0357] 図 52に NV— PCKの PCI— GIの構造を示す。以下では、 Constrained SESF力 ら変換する際に計算を要するフィールドについてのみその算出方法を説明する。
[0358] NV_PCK_LBN (VOBSファイル内での該 NV_PCK相対アドレス)は、情報記 録装置が変換中に何番目のパックになるか数えておくことで、生成可能である。
[0359] V〇BU_CAT (アナログコピープロテクション状態の情報)は、 NV_PCKに対応 している Tipパケットの display_and_copy_infoから取得可能である。
[0360] VOBU_S_PTM (VOBU内で最初に表示されるビデオフィールドの再生時刻情 報)は、 NV_PCKに対応している Tipパケットの FVFPSTから計算可能である。
[0361] VOBU_E_PTM (VOBU内のビデオデータが再生完了する時刻情報)は、ァク セスマップの次のエントリーに記述された再生時刻情報から取得する力 \ VOBUに 対応するビデオストリームを解析して、ビデオの再生が終了する時刻を算出すること で生成可能である。
[0362] V〇BU—SE—E—PTM (VOBU内のビデオデータで sequence— end— codeに よって再生が終了する時刻情報)は、 sequence_end_codeが VOBの最後にしか 認められていないため(図 48参照)、ストリーム途中の VOBUには、 sequence_end _codeがなぐ「0x00000000」力埋められる。最後の VOBU内に Sequence_en d_codeがある NV_PCKについてのみ、 V〇BU_E_PTMと同値となる。
[0363] C_ELTM (該 NV_PCKが格納される CELLの最初に表示されるビデオフレーム の再生時刻と該 VOBU内で最初に表示されるビデオフレームとの時間差情報。フレ ーム精度が必要)は、情報記録装置が変換中に、 CELL最初に表示されるビデオフ レームの再生時刻情報と、該当する Tipパケットの FVFPSTを用いて随時計算する ことが可能である。
[0364] 以上のようにして、 NV— PCKの PCIデータは、変換中に、 VOBU単位で随時生 成していくことが可能である。
[0365] 図 53に NV— PCKの DSIの構造を示す。図示したように、 DSIデータは、 DSIの一 般情報を格納する DSI— GI (Data Search Information General Information)と、 V OB間をシームレス再生するために必要となる記録アドレス、再生情報等を 格納した SML—PBI (Seamless Playback Information)と、異なるアングル間でシー ムレス再生するための配置情報等を格納した SML—AGLI (Angle Information for seamless)と、その VOBU近隣の VOBUの記録アドレス情報等を格納した VOBU —SRI (VOB Unit Search Information)と、ビデオとオーディオ/サブピクチヤとの 同期再生のための情報である SYNCI (Synchronous Information)と力、ら構成される。
[0366] SML_AGLIは、 Constrained SESF力、ら変換された場合には、無効を意味す るデータが記述される。
[0367] 図 54に NV_PCKの DSI_GIの構造を示す。 Constrained
SESFから変換する場合に、計算が必要なフィールドについてだけ、以下にその算 出方法を説明する。
[0368] NV PCK SCR (NV PCKの SCR値)は、後述する算出方法で Constrained SESFの ATSから SCRを導出しており、その SCRから導出される。
[0369] NV_PCK_LBN (VOBSファイル内での NV_PCK相対アドレス)は、 PCIデー タとそれを求めるのと同様である。
[0370] 〇811_£八(1^¥_?〇1:から¥081;内の最後のパックまでの相対ァドレス)は、ァ クセスマップから計算可能である。前述の通り、 2つの連続する Tipパケット間におい て、 Multiplexing Unitに属さないパケット個数が既知(固定)であるため、アクセス マップから、次のエントリー(次の Tipパケット)までの TSパケット数が計算でき、その T Sパケット内に、 Multiplexing Unitに属さなレ、 TSパケットの個数を減算し、その結 果を 11で割ることで NV_PCKに続き、何個のパックが形成されるか計算可能である 。最後の Tipパケットから派生される NV_PCK:、もしくは全ての NV_PCKについて は、変換後に生成されたパック数をカウントしておきそれを記述しても良い。
[0371] V〇BU_lSTREF_EA(VOBU内で、 NV_PCKから 1番目の参照ピクチヤの 最後のパックまでの相対アドレス)と、 VOBU— 2NDREF— EA (V〇BU内で、 NV — PCKから 2番目の参照ピクチヤの最後のパックまでの相対アドレス)と、 VOBU— 3 RDREF— EA (VOBU内で、 NV— PCKから 3番目の参照ピクチヤの最後のパック までの相対アドレス)とについては、 Tipパケットの PES— infoを参照しながら、 TS2P S変換を行えば、ビデオストリーム層まで解析する必要なく導出することが可能である
[0372] PES— infoには、各ビデオの PESパケットが、どのようなエンコードをされたピクチ ャカを不 Tpic ure― coding― type 己述され飞いる。 picture― coding― type = 01b, 10bを持つ PESパケットは、 DVD— Video規格でいう参照ピクチャを格納して いる。
[0373] 従って、 TS2PS変換を行いながら、 PES_infoを参照し、現在変換している PES パケットが、参照ピクチャを格納しているのか否かを判断し、この変換している PESパ ケットが終了したパック力 参照ピクチヤの終端のパックとなる。
[0374] このようにして、参照ピクチヤの終端のパックは、変換中に識別可能であるため、 V OBUを生成しながら、 1番目、 2番目、 3番目の参照ピクチヤがどのパックで完結して いるかを求め、 VOBU先頭の NV PCKの VOBU 1STREF EAと、 VOBU 2NDREF— EAと、 VOBU— 3RDREF— EAとに夫々の終端までの相対アドレスを 記述することが可能である。
[0375] もしくは、 SESF Capsuleを変換中にビデオを格納した PESパケットの PTS—DT S_flagsの値を参照し、 PTS_DTS_flags = l ibであれば、参照ピクチヤが格納 されており、 PTS_DTS_flags = 10bであれば、非参照ピクチヤが格納されている と逐次判断しながら、これらの値を算出しても良い。
[0376] VOBU_VOB_IDN (該 VOBUが属する V〇Bの ID番号)は、情報記録装置が 変換中に求めることができるはずである。 1つの Constrained SESFを変換してい る時には、 Constrained SESF (encode_condition= l lb)の定義により、属性 の変化等のストリームの条件で VOBが分割される可能性はなぐ同一番号が割り振 られる。
[0377] VOBU_C_IDN (VOBUが属する CELLの ID番号)も VOBU_V〇B_IDNと 同様に、情報記録装置が変換中に自ら設定する番号であり、ストリームとの関連はな レ、。 Constrained SESFの PGC情報等の管理情報から CELLを意図的に分割す る場合には、分割に応じた番号が付与されるだけである。
[0378] C— ELTM (NV—PCKが格納される CELLの最初に表示されるビデオフレームの 再生時刻と VOBU内で最初に表示されるビデオフレームとの時間差情報。フレーム 精度が必要)は、 PCIデータ内に記述された C— ELTMと同一である。
[0379] 以上のようにして、 NV— PCKの DSI— GIの各フィールドは、変換中に、 VOBU単 位で随時生成していくことが可能である。
[0380] 図 55に NV— PCKの SML— PBIの構造を示す。以下では、 Constrained SES Fから変換する場合に計算が必要となるフィールドについてのみその算出方法を説 明する。
[0381] VOB_V_S_PTM (NV_PCKが属する V〇Bの最初に表示されるビデオフレ ームの時刻情報)は、最初の Tipパケットの FVFPSTから計算可能である。
[0382] VOB_V_E_PTM (NV_PCKが属する VOBのビデオ再生終了時刻情報)は 、 TS2PS変換の前に、予め Constrained SESFの中で、変換に指定された部分で 最後の Tipパケット以降のストリームを解析しビデオの再生終了時刻を求めておくこと で、随時設定可能である。
[0383] 以上のようにして、 NV— PCKの SML— PBIの各フィールドは、変換前に、計算し ておくことが可能であり、変換中にはその値を用いれば良い。
[0384] V〇BU_SRIは、前述の通り、アクセスマップを利用し、計算することが可能である ため、ここでの説明は割愛する。
[0385] また、 VOBU_SRIはセルごとに完結して記述されるため、セルが定義されなけれ ば、計算することはできなレ、。したがって、リアルタイムに DVD— Videoフォーマット で記録するようなレコーダにおいては、任意の区間でセルを切ることができず、編集 性、再生性に欠ける力 Constrained SESF力ら変換する際には、上記方法に従 つて、ユーザが指定した区間をセルと定義し変換することが可能なため、チャプター をユーザが意図した通りに作成できることになり、ユーザ指定の地点から再生を開始 するプレイリストが DVD—Videoフォーマットで実現可能となる。
[0386] 図 56に NV— PCKの SYNCIの構造を示す。以下では、 Constrained SESF力 ら変換する場合に計算が必要なフィールドについてだけ、その算出方法を説明する
[0387] A—SYNCA0 (プライマリーオーディオを格納したパックで、 VOBU— S— PTMと 同時もしくは直後に再生されるオーディオフレームが格納されたパックの相対アドレス )は、 Tipパケット内の PES— infoを用いて、ストリーム解析することなぐ TS2PS変換 中に取得することが可能である。
[0388] PES— infoの stream— identifierを参照することで、その PESパケットがプライマ リーオーディオを格納しているか判別でき、次の sync— presentation— flagにて、 P ESパケットの中に含まれるオーディオフレームの中に、 VOBU_S_PTMと同時も しくはその直後に再生されるオーディオフレームがあるか否かが識別できる。従って、 TS2PS変換を行いながら、 PESパケットがプライマリーオーディオを含み、かつ、 sy nc_presentation_flag= lbである場合に、 NV_PCKから PESパケットが格納さ れたパックまでのアドレスを記述できる。
[0389] 尚、 sync_presentation_f lagが VOBU内の 1つのオーディオパック内で lbにな る保証はなレ、。オーディオを先に多重化しているエンコーダであれば、ある VOBUの VOBU— S— PTMと同時もしくは直後に再生されるオーディオパックが前の VOBU に格納されることも考えられるし、またその逆も考えられる。
[0390] 従って、 A— SYNCA0の値の設定において、変換中のプライマリーオーディオの P
ESパケット(その sync_presentation_flagは lb)と、以降生成される NV_PCK との順序関係を正しく理解した上で、その値を設定する必要がある。
[0391] 尚、この処理をなくすために、予め Constrained SESFは、 SESF capsule内に
、その SESF capsule先頭の Tipパケットに記述された FVFPSTと同時もしくは直後 に再生されるオーディオデータを格納するようにシステムエンコードするようにしてお いても良い。
[0392] このように定義することで、 VOBU (SESF capsule)を超えて V〇BU_S_PTM
(FVFPST)と同期したオーディオデータを検出する処理をなくすことが可能となる。
[0393] A_SYNCA1 (セカンダリーオーディオを格納したパックで、 VOBU_S_PTMと 同時もしくは直後に再生されるオーディオフレームが格納されたパックの相対アドレス )は、 A— SYNCA0と同様の方法にて設定可能である。
[0394] 以上のようにして、 NV— PCKの DSIデータは、変換中に、 A— SYNCAを除き VO BU単位で随時生成してレ、くことが可能である。
[0395] 図 84に NV— PCKの生成方法の一例をまとめる。
[0396] (DVD Video Recordingのフォーマット)
DVD Video Recording (VR)のストリームフォーマットへの変換時のフィールド 設定について説明する。
[0397] 以下、簡単に DVD VRのストリームを説明する。なお、 DVD VRのストリームフォ 一マットの詳糸田については、「DVD Specifications for Rewritable/Re— rec ordable Discs Part 3 VIDEO REC〇RDING」に記述されている。
[0398] 図 57に DVD VRフォーマットによるストリーム構造を示す。ここに示したように、各 ストリームは複数個の VOBを含み、各 VOBは整数個の VOBUから成る。 VOBUは 整数個のパック力、ら成り、 RDI_PCKを先頭としてビデオパック(V_PCK)ゃォー ディォパック (A_PCK)がこれに続く。 RDI_PCKは、通常のパックと異なり、表示 やコピーの制御情報や、製造者固有情報を格納している。以下では、 RDI PCKに 含まれる各フィールドを説明するとともに、その計算方法を合わせて説明する。
[0399] 図に示したように、 RDI— PCKのペイロードデータ(RDI Unit)は、 RDIの全般情 幸 R 格糸内した RDI一 GI (Real-time Data Information ueneral Informationノと、表 示およびコピー制御のための情報を格納した DCI_CCI (Display Control Informat ion and Copy Control Information)と、製造者固有情報を格納する MNFI (Manuf acturer's Information)と力ら構成される。
[0400] RDI_GIはその内部に V〇BU_S_PTMフィールドを含み、このフィールドだけ が可変であり、その他のフィールドは固定値が埋め込まれる。
[0401] V〇BU_S_PTMは、変換前トランスポートストリーム中の対応する Tipパケットに 記述された FVFPSTと全く同一形式であるため、 FVFPSTの値がそのままコピーで きる。
[0402] DCI_CCIは、 Tipパケットの display_and_copy_infoと全く同一形式であるた め、 display— and— copy— infoの値がそのままコピーされることが可能である。
[0403] MNFIは、 Tipパケットに記述された maker— IDが当情報記録装置の製造者 IDと 同一の場合のみ、固有の製造者 IDが割り当てられ、製造者固有情報が記述 (コピー )される。しかし、 Tipパケット内の maker— ID力 他製造業者の IDである場合や、無 効な maker— ID値である場合には、 MNFIに無効なデータを記述することで RDIパ ックを生成しても良い。
[0404] 尚、 Tipパケット内に記述されたデータが一部無効である場合が想定される。この場 合、 Tipパケット内の該当データが無効であることを意味するフラグ(無効化フラグ)が 格納されているはずであるので、その無効化フラグが ONである場合には、 Tipバケツ トの該当データを最新のデータに更新してから変更する必要がある。
[0405] 一例として、各 TSパケットごとの ATS (4B)の中に最新の CCI情報と TSパケット内 の CCIデータ無効化フラグが存在する場合等が考えられる。
[0406] この場合、 TS2PS変換する際に、無効化フラグが立っていないことを確認し、立つ ていれば、 ATS内の CCIフラグでもって display_and_copy_infoの CCI情報を 更新したデータを用いて RDI_PCKに変換する必要がある。
[0407] 以上のように、 RDI PCKは、対応する Tipパケット(及びその ATS)のみから、逐 次作成できる。
[0408] 図 58に上記の RDI— PCKの生成フローチャートを示す。
[0409] RDI— PCK (または NV_PCK)の場合、システムヘッダは固定値のフィールドから 構成されている。システムヘッダの詳細は図 61に示してある。また、 RDI_PCKに格 納される、パケットヘッダ、プライベートヘッダをそれぞれ図 62 (a)、(b)に示した。図 示した通り、これらのヘッダも固定値フィールドから構成されるため、生成が容易であ る。
[0410] 図 59に AVデータを格納した TSパケット(lMultiplexing Unit)力、ら PSのパック を生成するためのフローチャートを示す。
[0411] 同図に示したように、 AVデータを格納する Constrained SESFの TSパケットは、
1 Multiplexing Unitをその処理単位として、 AVデータを格納する MPEG— PSの
2KBのパックへと変換される。以下に、各ステップごとに処理を追って説明する。
[0412] (ステップ S4200) Constrained SESFのストリームの変換開始点力ら TSパケッ トを 1つだけ読み出す。
[0413] (ステップ S4201) 読み出した TSパケットが、 AVデータを格納し、かつ、 Multipl exing Unitの先頭の TSパケットであるか否かを判定する。 AVデータの格納の判 定は、 PMTにて AVデータを格納すると宣言された TSパケットの PID値を参照する ことによって行われる。 Multiplexing Unitの先頭か否かの判定については、その 前の TSパケットが、 Tipパケット、 PSI/SIパケット及び PCRパケットのいずれかであ る場合に、その直後に続く AVデータを格納した TSパケットが Multiplexing Unit の先頭であると判定する。変換開始点は Tipパケットであることが予想されるため、 M ultiplexing Unitの先頭か否かは順に TSパケットを読み込むことで判定可能であ る(つまり Tipパケット直後の AVデータを格納した TSパケットは必ず Multiplexing Unitの先頭である。)。判定の結果、 Multiplexing Unitの先頭でなレ、 TSパケット の場合、または、変換が Tipパケットからスタートしておらず、判定ができない場合は、 次の TSパケットを読み込むため、 S4200へ処理カ戻される。 Multiplexing Unit 先頭であることが確認できた場合は、次の処理へ進む。
[0414] (ステップ S4202) Multiplexing Unit先頭の TSパケットに付与された ATSを 用いて、その TSパケットが変換される MPEG— PSのパックがデコーダに入力される 時刻(calculated— PCR)を算出する。この算出方法については前述のとおりである 。 PCRが計算されれば、 SCRが前述の算出方法によって計算でき、図 60に示した パックヘッダが完全に決定される。これは、パックヘッダは、 SCRを除いて固定の値し か認められないためである。
[0415] (ステップ S4203) パケットヘッダ、プライベートヘッダを作成する。
[0416] パケットヘッダは、 Constrained SESFの PESパケットヘッダを基に作成される。
作成されたパケットヘッダは、図 63に示されたフィールド値を満たす形式でなければ ならない。これは、ヘッダ長を変えるようなフィールドの値は決定しておかなければ Co nstrained SESFからの変換が一意に決定されず、バッファマネージメントに影響を 及ぼす危険があるためである。ここに示されてレヽなレ、フィールドは固定値であるため 列挙していない。
[0417] Constrained SESFで PESパケットヘッダの個々のフィールド値を詳細に決定し ているのは、 PESパケットヘッダ(MPEG— TS)力らパケットヘッダ(MPEG— PS)へ の変換で要する処理を最小限にするためである。
[0418] PESパケットのサイズが 1パックのサイズに比較して大きい場合には、 1PESパケット が複数のパックに変換されることになる。この場合、 2つ目以降のパックのパケットへッ ダは、 PESパケットから生成された最初のパケットヘッダの PTS—DTS— flagsを「0 ObJに、 PES— extension— flagを「0b」に設定すること、 stuffing— byte長を調整 すること、及び、 PES— header— data— lengthを補正することが修正点となる。
[0419] プライベートヘッダは、 MPEG規格外のストリームを格納する際に必要となるため、 NV_PCKや RDI_PCK:、それに AC— 3、 LPCM等を格納したパックに必要であ る。
[0420] 図 64に AC— 3のプライベートヘッダを示す。図に示すフィールドのうち、 Constrai ned SESFの Multiplexing Unitの定義によって、 TS2PS変換時に計算を要す るものは、 number_of_frame_headersのみである。このフィーノレドはそのパック に格納される AC— 3のオーディオフレームの数を指定するため、そのフィールドの値 は、固定レートの AC— 3については、 1オーディオフレームのバイト長がそのビットレ ートから計算でき、かつその値が固定長となることから、容易に PES— packet— leng th等から計算できる。
[0421] 尚、 AC— 3のプライベートヘッダ(4B)により、 Constrained SESFの PESバケツ トヘッダの PES_header_data_length力 S4バイト分余計にスタッフイングされてい ることに注意すべきである。 (図 44参照)このように、予め変換後のヘッダ長を見積も つてペイロードの位置をずらしておくことで、 TSパケット単位の逐次処理を容易にし ているのである。
[0422] 以上のように、最初のパケットヘッダはその PESパケットのヘッダから一部修正し、 2 つ目以降のパケットヘッダは、最初のパケットヘッダを一部修正し、プライベートへッ ダは MPEG規定外ストリームの時のみ揷入することで、パケットヘッダおよびプライべ ートヘッダを生成することが可能である。
[0423] (ステップ S4204) プライベートヘッダが作成されれば、後は TSパケットのペイ口 ード部分を PSパックのペイロード部分の先頭から順に詰めてコピーしていくだけであ る。
[0424] (S4205〜S4207) これを Multiplexing Unit (11個の TSパケット)が終了する まで単純に繰り返すだけだ力 途中で NULLパケットが挿入されている可能性がある ため、 NULLパケットの PID (OxlFFF)を確認して、 TSパケットのペイロードデータ のコピーを行う。
[0425] 尚、この際、 PESパケットの最後のデータを格納する TSパケットだけがァダプテー シヨンフィールドを持つように定義しておくのが好ましレ、。これにより、 Constrained SESFの中で PESパケットの最後のデータを格納する TSパケット最後を除く TSパケ ットは、常に 184Bのペイロードデータが格納されていることになるため、ペイロードデ ータの読み出しが容易になる。
[0426] (ステップ S4208) 次に、 Multiplexing Unitのペイロードデータまで、完全にコ ピーが終了した時点で、形成されたパックのバイト長を計算し、 2048Bになっている かどうか確認する。既に 2048Bになっていれば、そのパックの生成は終了する。まだ 2048Βίこなってレヽなレヽ場合 (こ fま、 S4209へ進む。
[0427] (ステップ S4209) パックが 2048Bになっていない場合、 2048Bになるようにノ デ イングパケットをペイロードの最後に追加する。
[0428] 以上のように、 AVデータを格納した Multiplexing Unitからの変換処理を行なう 。上記の処理を、 Constrained SESFの指定された変換部分の処理が終了するま で、 Multiplexing Unitが検出された場合のみ繰り返せば良い。
[0429] 上記の変換処理について各種パック毎の変換結果を説明すると以下のようになる。
[0430] (ビデオパック(V_PCK)への変換)
図 65 (a)、 (b)に Constained SESFから MPEG— PSへの変換を図示した。図 6 5 (a)に示したように、一つのビデオ PESパケットは、通常 2KBよりも大きいため、複 数の Multiplexing Unitに分割され、 Constrained SESFに多重化されているの が一般的である。
[0431] Constrained SESFの規定により、一つのビデオ PESパケットを構成する最後の Multiplexing Unitを除き、 Multiplexing Unitには、最大にビデオ PESパケット のデータが詰め込まれる。従って、最後の Multiplexing Unitを除き、全ての Multi plexing Unitは、 2024バイト( = 184 X 11バイト)のデータが格納される。
[0432] このように規定することで、 TS2PS変換時に個々のパックの PES— packet— lengt hや、 stuffing— byteとレ、つたフィールドを予め決めておくことができる。
[0433] 一つのビデオ PESパケットのデータを格納した最後の Multiplexing Unitは、余 つたデータ量をァダプテーシヨンフィールドと、 NULLパケットで埋め合わせ、 1つの 完全な Multiplexing Unitを構成しても良レ、し、データ転送の効率化(変換した M PEG— PSパックへの格納データ量を増やす目的)のために、次の PESパケットのデ ータを格納するようにしても良レ、。
[0434] ただし、 DVDへの変換容易性を考えて、 SESF Capsule内の Iピクチャだけは、そ の SESF Capsule内で先頭のビデオデータを格納する Multiplexing Unitの先 頭 TSパケットから配置される。
[0435] Pピクチャ、 Bピクチャは、上記のように、 Multiplexing Unitの先頭から配置され なくとも良い。
[0436] 図 65 (a)、 (b)に図示したように、一つのビデオ PESパケットを構成する Multiplexi ng Unitは、以下の 3つの種類に分別が可能である。 [0437] PESパケットの先頭データを格納した最初の Multiplexing Unit (図中 MU # 1) と、 PESパケットの途中部分のデータを格納した Multiplexing Unit (図中 MU # n
、ここで、 η=2,3,·Ν-1)と、 PESパケットの最後のデ
ータを格納した Multiplexing Unit (図中 MU # N)である。
[0438] それぞれの種類に応じて、 TS2PS変換された MPEG— PSストリームの各パックは
、同図 65 (b)に示す構造になる。
[0439] MU # 1から変換されたパックは、パック生成時に必ず 10バイト以上の空きができる ため、パディングパケットが最後に揷入される。
[0440] DVDフォーマットでは、パックに 7バイト以下の空きができる時には、スタッフイング バイト(パケットヘッダの最後のフィールド)を 2048バイトになるまで追加し、 8バイト以 上の空きができる時には、パディングパケットを揷入する決まりになっているためであ る。
[0441] また、 MU # n力 変換されたパックは、スタッフイングを 1バイト足してパックを構成 する。
[0442] また、 MU # Nから変換されたパックは、通常、パック構成時の空き領域が 8バイトよ りも大きくパディングパケットが挿入されることになる。
[0443] (オーディオパック(A_PCK)への変換)
図 66 (a)、(b)に Constained SESFから MPEG— PSへの変換を図示した。図 6 6 (a)に示したように、 (1つ以上のオーディオフレームを格納する)一つのオーディオ PESパケットは、 1つの Multiplexing Unitよりも小さなサイズとなる。
[0444] —つのオーディオ PESパケットは、一つの Multiplexing Unitに収まるため、ビデ ォ PESパケットのように複雑な変換は必要なレ、。つまり、図 66 (b)に示したように、必 ずパディングパケットが揷入されるパックが生成されるはずである。
[0445] また、 PES_packet_lengthも TS2PS変換で変わることがないため、変換時に計 算するのは、 MPEGl—Audioを変換する際に stream_idを適宜設定したり、 AC _ 3用のプライベートヘッダを生成したりする程度の簡単な処理のみである。
[0446] また、図に示したように、 Constrained SESFのシステムエンコードを困難にする 大きな要素であるオーディオデータの転送時間を、最小にすることで、ノ ッファマネ ージメントを簡単にすることが可能である。
[0447] オーディオ Multiplexing Unitの転送時間分は、ビデオデータやその他の PSI/ SIパケットが転送できないため、全体の転送レートが下がってしまう課題(画質低下) と、この転送時間が長くなればなる程、その分ビデオデータを TS上では前倒しで転 送する必要が出てくる課題 (システムエンコードが複雑化)等の問題を引き起こすた め、可能な限り短い時間で転送することが理想である。
[0448] 言い換えれば、オーディオ Multiplexing Unitを短い時間で転送するということは 、オーディオの転送レートを上げるということであり、これは、 T— STDと P— STDの大 きな違いであった、オーディオの許容入力レートの差を減少させることにつながる。従 つて、 2つのデコーダモデルに合致しなければならない Constrained SESFを生成 することを容易にするという大きな利点がある。
[0449] 図 67に、 Constrained SESFで許される各音声のビットレートと、その夫々ごとに AC— 3と MPEG1— Audioを格納する場合に、 1オーディオ PESパケットに格納され る最大ペイロード長を示した。ここに示すバイト長よりも大きなデータ力 オーディオ P ESパケットに格納されることはないため、常にパディングパケットが挿入されることに なる。
[0450] (PESパケットにおける制限)
整数個のオーディオフレームを含む整数個の PESパケットを、整数個の Multiplex ing Unitに格納するようにして、変換後の MPEG— PSパックへの格納データ量を 増やし、効率的に多重化しても良い。ただし、この場合、変換時の PTSの演算が問 題となる。
[0451] DVD規格では、オーディオの PESパケットヘッダ内の PTSとして、その PESパケッ ト内で始まる最初のオーディオフレームの PTSを記述するように定められている。
[0452] TS2PS変換を行う際に、 MPEG— PS (DVD)へ変換後に PESパケットの先頭に なるオーディオフレームと、変換前の Constrained SESFで多重化された PESパケ ットの先頭になるオーディオフレームが一致しないケースがある。そこで、本発明では 、変換後の MPEG— PSのパックの PESパケット内で最初に始まるオーディオフレー ムが必ず PTSを持つように Constrained SESFで多重化する。これにより、 TS2PS 変換時に、新たに PTSを演算して求める必要がなくなる。
[0453] したがって、 Multplexing Unitの中で、最初に始まる完全なオーディオフレーム は、 Multplexing Unit内の PESパケットのペイロードの中で最初のオーディオフレ ーム(つまり必ず PTSが記述されたオーディオフレーム)とすることが有効である。そこ で、本発明に係る Constrained SESFは、「Multplexing Unitの中で最初に始 まる完全なオーディオフレームは、 Multplexing Unit内の PESパケットのペイロー ドの中で最初のオーディオフレームとする」ことを規定する。尚、この規定は「Multpl exing Unitの中でフレーム先頭バイトが最初に始まるオーディオフレームは、 Mult iplexing Unit内の PESパケットのペイロードの中で最初のオーディオフレームとす る」としてもよレ、。本規定による制約は Constrained SESFの制限の 1つであるため 、 encode_conditionフラグを参照することにより、上記の規定を満たすか否かが判 定できる。
[0454] 図 85は、上記規定を満たす Constrained SESFでフォーマットされた MPEG— T
Sと、それから変換される MPEG— PSとを説明した図である。
[0455] PESノ ケット 41 1、 412、 413の PESパケットヘッダには、それぞれ、各 PESパケッ ト 41 1、 412、 413に含まれるオーディオフレームの中の最初のオーディオフレーム(
AF # 1、 AF # 5、 AF # 8)に対する PTS値(PTS # 1、 PTS # 5、 PTS # 8)が含ま れている。
[0456] 最初の Multplexing Unit (401 )には、 PESパケット 41 1の全てのデータと PES パケット 412の途中までのデータとが含まれる。
[0457] 最初の Multplexing Unit (401 )において、その Multplexing Unit (401 )内の 最初の完全なオーディオフレームはオーディオフレーム # 1であり、これは、 PESノ ケット 41 1のペイロード内の最初のオーデオフレームとなっており、上記の規定を満 たしてレ、る。また、第 2番目の Multplexing Unit (402)に注目すると、 Multplexin g Unit (402)内の最初の完全なオーディオフレームはオーディオフレーム # 8であ り、これは、 PESパケット 413のペイロード内の最初のオーディオフレームとなってお り、上記の規定を満たしている。なお、 Multplexing Unit (402)は、 PESパケット ヘッダ直後にオーディオフレーム # 7の後半部分を含んでいる力 S、それはオーディオ フレームの一部であって完全なオーディオフレームではないため、上記規定を考慮 する際の条件とはならない。
[0458] 最初の Multplexing Unit (401)に含まれる PESパケット 411の PESパケットへッ ダには、それに続くオーディオフレーム(AF)の中の最初の完全なオーディオフレー ム # 1の PTSの値(PTS # 1)が含まれる。また、第 2番目の Multplexing Unit (40 2)には、それに続くオーディオフレーム (AF)中の最初の完全なオーディオフレーム # 8の PTSの値(PTS # 8)が含まれてレ、る。
[0459] 第 2番目の Multplexing Unit (402)を、 MPEG— PSに変換するとき、変換先の MPEG— PS内の PESパケットヘッダには、 Multplexing Unit (402)に含まれる P ESパケットヘッダに格納される PTSの値(PTS # 8)がそのままコピーされる。このよう に、 PS2TS変換時において、 PTS値をそのままコピーするだけでよぐ処理が簡略 化される。
[0460] 次に PESパケットにビデオデータが含まれる場合を説明する。 Constrained SES Fの制約の 1つとして、ビデオデータを含む PESパケットに対し、「Iピクチャを格納し た PESパケットは、 Multplexing Unitの先頭から始まる」という制約を設けてもよい
[0461] 図 86に上記規定を満たした例を示す。図 86において、 PESパケット 416は Iピクチ ャを含み、その PESパケットヘッダには、 Iピクチャの PTS値(PTS # 2)が格納されて レヽる。そして、 PESパケット 416は Multplexing Unit (404)の先頭に配置されてい る。
[0462] 変換後の MPEG— PSパックにおいて、 PESパケットヘッダ 421に格納される PTS 値(PTS # 2)はその直後の Iピクチャを指し示している。なお、 Multplexing Unit ( 403)は PESパケット 415のペイロードに含まれる Pピクチャを格納し、その残りの部 分に NULLパケットを揷入することにより、 Iピクチャを次の Multplexing Unit (404 )にァライメントしている。
[0463] Multplexing Unit (404)を MPEG— PSに変換する際には、 MPEG— PSパック の PESパケットヘッダ 421に、 Multplexing Unit (404)内の PESパケットヘッダの 値(PTS # 2)がコピーされる。このように PTS値はコピーされるだけでよいので、 PTS 値を演算して求める必要がなぐ処理を簡略化できる。
[0464] (TS2PS変換処理)
図 68から図 81のフローチャートを用いて TS2PS変換処理の詳細を説明する。
[0465] 図 68は TS2PS変換のメインの処理を示したフローチャートである。本処理はユー ザにより TS2PS変換のリクエストがあつたときに開始される。まず、変換を開始する先 頭の SESF Capsuleをシークする(S11)。そして、処理すべき SESF Capsuleが 有るか否かを判断し(S12)、なければ処理を終了し、 SESF Capsuleがあれば、初 期化処理(S13)及びカプセル単位処理(S14)を行なう。
[0466] 図 69のフローチャートを用いて初期化処理(S13)について説明する。ここでは、そ の後の処理に使用される変数等の設定、初期化を行なう。まず、 Tipパケットが読み 込まれているか否かを判断し(S21)、未だ Tipパケットが読み込まれていなければ、 Tipパケットを読み込む(S22)。変数 ATSTipに Tipパケットの ATS値を代入する(S 23)。変数 PCRTipに Tipパケットの PCR値を代入する(S24)。処理中の Multiplexi ng Unitの番号を指定する変数 MU— numを 0に設定する(S25)。 ATSの桁あふ れの回数を示す変数 WAを 0に設定する(S26)。
[0467] 図 70のフローチャートを用いてカプセル単位処理(S14)について説明する。一つ の TSパケットを読み込む(S31)。読み込んだ TSパレットが Tipパケットであるか否か を判断する(S32)。 Tipパケットであれば処理を終了する。 Tipパケットでなければ、 読み込んだ TSパケットがオーディオパケットまたはビデオパケットかを判断する(S33 )。読み込んだ TSパケットがオーディオパケットまたはビデオパケットでない場合、ス テツプ S31に戻り、読み込んだ TSパケットがオーディオパケットまたはビデオパケット になるまで順次 TSパケットを読む(S31〜S33)。読み込んだ TSパケットがオーディ ォパケットまたはビデオパケットであれば、その後に続く 10個の TSパケットを読み込 む(S34)。 MU_numをインクリメントする(S35)。 Multiplexing Unit先頭の TSパ ケットの ATS値を、変数 ATS[MU_num]に格納する(S36)。 Multiplexing Unit に格納された PESパケットのペイロードデータのバイト長を payload_lenとする(S37) 。そして、パック単位処理を行なう(S38)。
[0468] パック単位処理は図 71のフローチャートに示すように、 SCR演算処理(S41)、パッ クヘッダ処理(S42)、パケットヘッダ処理(S43)、ペイロード処理(S44)及びパディ ングパケット処理(S45)からなる。以下に各処理を詳細に説明する。
[0469] 図 72を用いて SCR演算処理を説明する。
[0470] ここでは、パックの SCR値を求めている。まず、変数 MU_numの値を参照し、 Cup suleにおいて第 1番目の Multiplexing Unitか否かを判断し、第 1番目であれば、 変数 ATS[0]に変数 ATSTipの値を、変数 SCR[0]に変数 PCRTipの値を代入する( S51〜S53)。
[0471] そして、 ATS[MU_num]と、 ATS[MU_num_ 1]とを比較する(S55)。 ATS「i」 には、 Multiplexing Unit先頭のパケットの ATS値が格納され、この ATS値は、あ るパケットを基準とした相対的な転送タイミングを示す値である。したがって、通常は、 後のパケットの ATS値は前のパケットの ATS値よりも大きな値をとる。しかし、 ATS値 は一般に 30ビットで表される有限な値であるため、桁あふれを起こす場合があり、こ のときは、後のパケットの ATS値は前のパケットの ATS値よりも小さくなる。ステップ S 54では、この ATS値の逆転を見ており、これにより、桁あふれが発生したか否かを判 断している。 ATS[MU— num]が ATS[MU— num— 1]以下であれば、すなわち、桁 あふれが発生してレ、れば、変数 WAをインクリメントする(S55)。
[0472] そして、 SCR[MU— num]に、 SCR[MU— num— 1] + T力、、 (PCRTIP+ATS[MU _num] -ATSTi +WA X BS)のレヽずれか大きレヽ方を代入する(S56)。
[0473] 図 73を用いてパックヘッダ処理を説明する。
[0474] ここでは、図 60に示すデータ構造を有するパックヘッダデータを編集する。 SCR_ extensionに SCRを 300で除算したときの余りの値を代入する(S61)。 SCR— baseに SCRを 300で除算したときの商の値を代入する(S62)。 program_mux_rateに「0x 6270」を代入する(S63)。 pack_stuffing_lengthに「000b」を代入する(S64)。そ の他のフィールドを編集し、パックヘッダデータを完成させる(S65)。
[0475] 図 74を用いてパケットヘッダ処理を説明する。
[0476] まず、ストリーム IDを設定するストリーム ID処理を行なう(S71)。その後、 Multiple xing Unitにビデオデータが含まれるか否力、を判断する(S72)。
[0477] Multiplexing Unitにビデオデータが含まれる場合は、 Multiplexing Unit先 頭の TSパケットが PESパケットヘッダを含むか否かを判定する(S73)。 Multiplexin g Unit先頭の TSパケットが PESパケットヘッダを含む場合、 Video PESパケット先 頭処理を行ない(S74)、そうでない場合は、 PESパケット非先頭処理を行なう(S75) 。尚、 Multiplexing Unit先頭の TSパケットが PESパケットヘッダを含むか否かは 、 TSパケットのヘッダの payload_unit_start_indicatorを参照したり、直接、 PE Sパケットヘッダのスタートコードが格納されているかを参照することで判定する。
[0478] 一方、 Multiplexing Unitにビデオデータが含まれない場合は、 Multiplexing Unitに PESパケットヘッダを含むか否かを判定する(S76)。 Multiplexing Unitが PESパケットヘッダを含む場合、オーディオ PESパケット先頭処理を行ない(S77)、 そうでない場合は、オーディオ PESパケット非先頭処理を行なう(S78)。
[0479] 図 75を用いてストリーム ID処理を説明する。
[0480] ここでは、 stream_idフィールドの値を設定する。処理中のストリームの種類が "M PEG2— video"であれば、 stream— idに" OxEO"を設定する(S81、 S82)。処理中 のストリームの種類が" AC3— audio"であれば、 stream— idに" OxBD"を設定する( S83、 S84)。処理中のストリームの種類が" MPEG1— audio"で且つ" Primary au dio"場合は、 stream— idに" OxCO"を設定する(S85、 S86、 S87)。処理中のストリ ームの種類力 'MPEGl— audio"で且つ〃 Secondary audio"場合は、 stream— i dに" OxCl〃を設定する(S85、 S88、 S89)。
[0481] 図 76を用いてビデオ PESパケット先頭処理を説明する。
[0482] 図 83は MPEG規格における PESパケットの構造を詳細に示した図である力 本処 理では同図の構造にしたがい各フィールドを編集する。
[0483] まず、 Multiplexing Unit先頭の TSパケットに格納された PESパケットヘッダと同 一の PESパケットヘッダを、変換後の MPEG— PSの PESパケットヘッダとして生成 する(S91)。次に、 PES_packet_lengthに次式で計算した値を設定する(S92)
[0484] PES_packet_length =
+ PLS― header― data― length) +payload― len
次に、 PES extension flag力 1"か否かを判断し(S93)、 PES extension —flag力 のときは、 PES— private— data— flagから P— STD— buffer— sizeま での 3バイトを所定値(〃0xlE60E8〃)で上書きする(S94)。
[0485] 図 77を用いてビデオ PESパケット非先頭処理を説明する。
[0486] PESパケットヘッダに仮の値("0x000001E007EC800001FF")を設定する(S 1 11)。 (2025— payload一 len)の値力 S 1と 8の間にある力否力を半 IJ定する(S 112)。
[0487] (2025— payload_len)の値が 8以上であれば、ステップ S 116に進む。
[0488] (2025 -payload_len)の値が 1と 8の間にあれば、 PES_header_data_leng thを(2025 _payload_len)に設定し(S 113)、 PES_packet_lengthに次式で 計算した値を設定する(S 114)。
[0489] PES_packet_length =
+ PLS― header― data― length) + payload― len
そして、 stuffing_byteに、(2024— payload_len)バイトのスタッフイングバイト を設定し(S 115)、ステップ S 116に進む。
[0490] ステップ S 116では、(2025— payload— len)の値が 8以上か否かを判定する。 8 以上であれば、 PES— header— data— lengthを 0に設定し(S 117)、 PES— pack et— lengthに次式で計算した値を設定する(S I 18)。
[0491] PES packet length = 3 + payload len
そして、 stuffing— byteから、 1バイトのスタッフイングバイトを削除する(S 119)。
[0492] 図 78を用いてオーディオ PESパケット先頭処理について説明する。
[0493] まず、 Multiplexing Unit内で最初に現れる PESパケットヘッダと同一の PESパ ケットヘッダを、変換後の MPEG— PSの PESパケットヘッダとして生成する(S 181) 。次に、 PES_packet_lengthに次式で計算した値を設定する(S 182)。
[0494] PES_packet_length =
+ PLS― header― data― length) + payload― len
次に、 PES_extension_flag力 1"か否かを判断し(S183)、 PES_extension _flag力 : Τのときは、 P _ STD_buffer_flagに 1を設定する(S 184)。そして、ォ 一ディォデータが AC - 3オーディオか否かを判断する(S 185)。 AC _ 3オーディオ であれば、 PES extension flag_ 2に続く 2バイトを所定値("0x603A")に設定 する(S186)。 AC— 3オーディオでなければ、 PES— extension— flag— 2に続く 2 バイトを所定値("0x4020")に設定する(S 187)。
[0495] 図 79を用いてオーディオ PESパケット非先頭処理について説明する。
[0496] stream_idが" OxBD〃か否カ すなわち、オーディオデータが AC— 3オーディオ か否かを判定する(S191)。 stream_idが" OxBD〃であれば、 PESパケットヘッダに 仮の値" 0x000001BD0000800004FFFFFFFF"を設定する(S192)。そして、 P ES_packet_lengthに次式で計算した値を設定する(S193)。
[0497] PES packet length = 7 + payload len
一方、 stream_id力 ^OxBD〃でなければ、 stream_idが" OxCO〃か否力、、すなわ ち、オーディオデータが MPEG— 1プライマリオーディオか否かを判定する(S 194) 。 MPEG— 1プライマリオーディオであれば、 PESパケットヘッダに仮の値" 0x0000 01C00000800000"を設定する(S195)。 MPEG— 1プライマリオーディオでなけ れ ίま、、 PESノ ケッ卜ヘッダ【こ仮のィ直" 0x000001C10000800000"を設定する (S1 96)。そして、 PES— packet— lengthに次式で計算した値を設定する(S197)。
[0498] PES— packet— length = 3 + payload— len
図 80を用いてペイロード処理を説明する。
[0499] 変数 iに 1を設定する(S121)。 i番目の TSパケットに格納された PESパケットのペイ ロードデータを読み込む(S122)。 i番目の TSパケットに格納された PESパケットの ペイロードデータをパックのペイロードに追加する(S 123)。変数 iをインクリメントする (S124)。上記処理を変数 iが 12を超えない範囲で繰り返す(S125)。すなわち、 1 つの Multiplexing Unitに含まれる全ての TSパケットについて上記の処理が行な われるまで、処理が繰り返される(S122〜S125)。
[0500] 図 81を用いてパディングパケット処理を説明する。
[0501] PES_packet_lengthが 2028か否かを判定する(S131)。 PES_packet_len gthが 2028でなければ、パディングパケットの PES_packet_lengthに { (2028 - PES_packet_length)—6}を設定する(S132)。ペイロードに続けてパディング パケットを追加する(S 133)。
[0502] 上述のように、変換した MPEG— 2の PESパケットに記述される PTSは、 Multiple xing Unitの中で最初に現れた PESパケットヘッダを参照して設定することが可能 である。 (図 85、図 86参照)
[0503] 尚、上記説明において、ビデオの PESパケットの長さを示す PES— packet— leng thが 0であるために、パックへ変換した後のパケットヘッダ内 PES_packet_length の算出がパックにデータが確定した後でなければ確定しない問題があった力 SES F capsule内のビデオ PESパケットごとの PES_packet_lengthを Tipパケットに 記述するようにしても良レ、。その結果、 PES_packet_lengthを TSパケット単位の 逐次処理にて決定することが可能となり、変換がさらに高速に行えるようになる。
[0504] 尚、上記説明において、パックヘッダ(SCR)を TS2PS変換時に生成するように説 明したが、 MPEG—TSに格納される PESパケットヘッダにパックヘッダを予め格納し ておいても良い。例えば、 PESパケットヘッダの pack_header_field_flag= lbと して、 PESパケットヘッダ内に TS2PS変換後のパックヘッダを格納しておき、該パッ クヘッダと同一のパックに格納されるデータは該 TSパケットから所定の規則(例えば 所定個数)までの TSパケットに格納されたデータがパックに格納されるとしても良レ、。
[0505] (一連続の STC区間内におけるビデオピクチャの制限)
図 87 (a)に示したように、一連続の STC (システムターゲットデコーダ基準時亥 lj)区 間内において、最初の完全な SESF Capsule内で最初に表示されるビデオピクチ ャ(Pf)力 Sトップフィールドであり、最後の完全な SESF Capsule内で最後に表示さ れるビデオピクチャ(P1)がボトムフィールドとなるようにしてもよい。図 87 (b)は、この ルールを満たさないケースを示した図であり、最初の完全な SESF Capsule内で最 初に表示されるビデオピクチャ(Pf)がボトムフィールドとなり、最後の完全な SESF Capsule内で最後に表示されるビデオピクチャ(PI)力 Sトップフィールドとなっている。
[0506] このように完全な SESF Capsule連続区間でビデオの表示形態に制限を設ける のは、 DVD—Videoの VOBへの変換時に(記録したストリームへの編集が無ければ )、ビデオストリームの再エンコードを防ぐことができるためである。これは DVD_Vid eo規格では、 1VOB内のビデオは、トップフィールドから再生され、ボトムフィールド の再生で終わることが要求されてレ、るためである。
[0507] 上記の制約は Constrained SESFの制限の 1つであるため、 encode conditio nフラグを参照することにより、上記の制約を満たすか否かが判定できる。すなわち、 このフラグを参照することにより、一連続の STC区間内において、最初の完全な SES F Capsule内で最初に表示されるビデオピクチャがトップフィールドであり、かつ最 後の完全な SESF Capsule内で最後に表示されるビデオピクチャがボトムフィール ドであるか否かが判定できる。
[0508] 図 88は、上記の制限を設けた Constrained SESFでの録画処理のフローチヤ一 トである。
[0509] 最初に、一連続な STCの生成を開始する(S201)。次に、事前に設定された enco de_conditionの値を取得する(S202)。 encode_conditionの値は、ユーザゃ録 画機器の初期設定等により事前に設定されている。 encode_conditionが" l ib"か 否かを判断する(S203)。 encode_conditionが" l ib" (DVD— Videoモードでの 録画)のとき、最初の完全な SESF Capsuleをエンコードしているか否かを判断する (S208)。最初の完全な SESF Capsuleをエンコードしている場合、最初の完全な SESF Capsule中の最初の表示ピクチヤがトップフィールドとなるようにエンコードす る(S209)。続いて、 encode_conditionが" l ib"のときの要求を満たす Constrain d SESFとしてデータをエンコードする(S210)。
[0510] 一方、 encode— conditionが" 01b" (DVD— Video Recordingモードでの録画 )のとき、 encode— conditionが" 01b"のときの要求を満たす Constraind SESFと してデータをエンコードする(S204)。
[0511] その後、 SESF Capsuleが完成する度にタイムマップ情報を逐次追加する(S205 )。録画終了か否かが判断され(S206)、終了であれば、録画終了処理を行う(S207 )。終了するまで、上記ステップ S203力ら S205力橾り返される。
[0512] 図 89を用いて録画終了処理を説明する。
[0513] encode—condition力 ^l lb"力否力を半 IJ断する(S211)。 encode_coiiditioii力 S "l ib"のとき、最後の完全な SESF Capsule中の最後に表示されるピクチャがボト ムピクチャか否かが判断される(S212)。ボトムピクチャでなければ、新規の SESFを 作成し、または現在エンコード中の SESFを完成させ、最後がボトムピクチャで終わる ようにエンコードする(S213)。 [0514] 一方、 encode一 condition力 S〃l lb〃でなけれ ίま、 encode一 condition力 S〃01b〃の ときの要求を満たす、最後の SESF Capsuleを生成する(エンコードを停止する) (S 214)。
[0515] その後、タイムマップ情報を完成させ、記録媒体に記録する(S215)。
[0516] (シームレス接続)
次に、 Constrained SESFにおいて 2つの VOB (システムストリーム)をシームレス 接続する場合の制限について図 90を用いて説明する。シームレス接続とは、 2つの 別々の VOB (システムストリーム)を時間的に連続して再生可能とする接続をいう。図 90は、 Cell # 1と Cell # 2のそれぞれが指定する VOB # 1と VOB # 2をシームレス 接続する場合を示す。なお、シームレス接続に関しては従来より種々の技術が提案 されている(例えば、米国特許第 5923869号参照)。
[0517] 次世代の記録媒体の規格である BD (Blue— ray Disc)規格では、 PGCを構成す る各 Cellにおいて、その Cellよりも時間的に前に再生される Cellとの接続関係を記述 している。例えば、図 90に示す、 Cell # 2は、その前に再生される Cell # 1との接続 関係を示す情報(以下「接続情報」とレ、う。)を含む。この接続情報は connection— c onditionであり、 VOBの管理情報(VOBI)内に格納される。
[0518] connection— conditionの値は以下のように設定される。
1:通常の非シームレス接続
2:通常の非シームレス接続
3:シームレス接続(ブリッジ VOB (Bridge -VOB)を介する)
4:シームレス接続(ブリッジ VOBを介さなレ、)
[0519] すなわち、 connection_conditionが 3力、 4のときは、その Cellが直前セルとの間 でシームレス接続の条件を満たしていることを意味する。図 90の例では、 Cell # lの connection_conditionが 1であるため、 Cell # 1はその直前の Cellとはシームレス 接続されないことを意味し、一方、〇611 # 2の00 1½ 1〇 _( 0 01辻1011は4でぁるた め、 Cell # 2はその直前の Cell # 1とシームレス接続されることを意味する。
[0520] encode_condition= 01b力、 l ibの場合、すなわち、 VOB # 1と VOB # 2が C— SESFの場合、 BD規格にぉレ、てシームレス再生される Cell # 1と Cell # 2力も成る P GC # 1を DVD規格のフォーマットに変換 (TS2PS変換)する場合においても、 PGC # 1をそのまま高速に変換できることが望ましい。
[0521] このためには、シームレス接続点を含む、 TS2PS変換の対象区間が完全な SESF
Capsuleで構成されていることが必要である。つまり、少なくとも、シームレス接続点 の直後は SESF Capsuleの先頭であることが必要である。言い替えると、図 90に示 すように、シームレス接続点 Xの直後は、 Capsuleの先頭を示すパケットである Tipパ ケット 303から始まることが必要である。このように、シームレス接続点の直後におい て Capsuleの先頭で開始することにより、シームレス接続点直後からの映像再生が可 能となる。さらに、もう 1つの条件として、シームレス接続点の直前は、完全な SESF Capsuleで終わることが必要である。
[0522] 図 91を参照し、 connection_condition = 3の時の C— SESFにおけるシームレ ス接続について説明する。
[0523] connection— condition= 3のシームレス接続では、時間的に前に再生される V OBと、その後に再生される VOBとを、ブリッジ VOB (Bridge— VOB)を介して接続 する。ここで、ブリッジ VOBとは、ブリッジ VOBの前半と後半とを、夫々シームレス接 続する先行の VOBと後続の VOBから抜き出し、それらを連続再生可能なように再ェ ンコードして生成する VOBである。ブリッジ VOBを介したシームレス接続にっレ、ては 、例えば米国特許公開第 2002— 90197号に開示がある。
[0524] 図 91において、 PGC # 1は次のような再生経路で VOB # lと VOB # 2を再生する 。 VOB # 1 (301)の Start— SPN1から、 exit— to— Bridge— SPNまでを再生し、 その後ブリッジ VOB (304)を最初から最後まで再生し、最後に VOB # 2 (302)の re turn_from_Bridge_SPN力、ら END_SPN2 (タイムマップにより End_PTM2 となる位置)までを再生する。なお、 Start_SPNl、 exit_to_Bridge_SPN、 ret urn_from_Bridge_SPN、…はそれぞれ TSパケットのアドレスを示す。これらの 情報は V〇Bの管理情報である VOBIに記録されている。
[0525] このようにブリッジ V〇Bを介してシームレス接続する場合も、ブリッジ VOB内部にお いて、 V〇B # 1のコンテンツが終わり且つ VOB # 2のコンテンツが女合まるシームレス 境界 Xの直後は、完全な Capsuleで始まること、すなわち、 Tipパケット 303から始ま ること力 s要求される。また、もう 1つの条件として、シームレス接続点の直前は、完全な Capsuleで終わることが要求される。
[0526] 図 92を参照し、ブリッジ VOBを用いたシームレス接続についてさらに詳細に説明 する。以下では、 encode_condition= l ibである V〇B (すなわち、 Constrained SESFに準拠した VOB)をブリッジ VOBを用いてシームレス接続し、それを DVD 規格フォーマットのデータへ変換するまでを検討する。
[0527] 図 92におレ、て、 VOB # 1 (301)は、 Capsulel _:!〜 Capsulel _4の 4つの Caps uleで構成され、 VOB # 2 (302)は、 Capsule2_:!〜 Capsule2_4の 4つの Capsu leで構成される。また、ブリッジ VOB304は、 Capsulel _ 3,、 Capsulel—4'、 Cap sule2_ l '、 Capsule2_ 2'で構成される。ブリッジ VOB304の前半部分、すなわち 、 Capsulel— 3,及び Capsulel—4'は、シームレス接続される前側の VOB301の Capsulel— 3、 1—4から生成される。ブリッジ VOB304の後半部分、すなわち、 Ca psule2— l,及び Capsule2— 2,は、シームレス接続される後側の VOB302の Caps ule2— l、 2— 2から生成される。
[0528] BD規格では、 VOBは、「ァラインドユニット(Aligned Unit)」と呼ばれる単位から 構成される。 1つのァラインドユニットは、 ATSと TSパケットを組にしたソースパケット を 32個含み、その大きさは 6KBとなる。
[0529] また、 BD規格では、ブリッジ VOBを使う場合には、前側 VOBからの抜け出し地点( exit— to— Bridge— SPN)及び後側 VOBへの飛び込み地点(return— from— Br idge— SPN)は共に、このァラインドユニットの境界でないといけなレ、とレ、う規則があ る。
[0530] SESF Capsuleの途中からブリッジ VOBを作るよりも、 SESF Capsule単位でブ リッジ V〇Bを作る方が(図 92参照)、ビデオ Zオーディオ.データがァライメントされ、 再エンコード処理の単位が明快となる。このため、 Constrained SESFでは、ブリツ ジ V〇Bとの接続性の観点から、予め SESF Capsuleの境界をァラインドユニットの 境界に合わせるのが望ましレ、。これは、 SESF Capsuleの末部をァラインドユニット 境界まで NULLパケットで坦める等として簡単に実現できる。
[0531] このようにァラインドユニットでァライメントされた SESF Capsuleのうち、 VOB # l ( 301)に属する Capsulel— 3及び Capsulel—4と、 VOB # 2 (302)に属する Caps ule2— 1及び Capsule2— 2とに基づいて生成されたブリッジ VOB304は、 Capsule 1 -4'と Capsule2— 1 'の間に STC時間軸および ATS時間軸の不連続点を持つ。
[0532] 一連続な ATSZSTC時間軸上にある SESF Capsuleの変換は前述の通り容易 なため、映像/音声情報を残さず TS2PS変換することを考えれば、ブリッジ V〇Bの シームレス接続点の直前と直後にある Capsuleは、共に完全な SESF Capsuleで あることが必要である。例えば、図 92では、シームレス接続点の直前の Capsule l— 4'と、直後の Capsule2 _ l 'は、完全な SESF Capsuleであることが必要である。
[0533] さらに、ブリッジ V〇Bの encode_condition= l lbから要求される条件によれば、 ブリッジ VOB304の最後の Capsule2 _ 2 'は、最後の完全な SESF Capsuleとして 0. 4〜: 1. 2秒の再生時間を有する。し力し、 Capsule2— 2 'を DVD規格のフォーマ ットに変換する際、 Capsule2 _ l '、 2 _ 2 '、 2— 3、 2— 4から変換された DVDの V〇 Bにおいて、変換後の Capsule2— 2 'の再生時間が 1. 0秒を超えることは DVD規格 との整合性が悪ぐ再エンコードを要する。従って、ブリッジ VOB304において最後 の Capsule2— 2 ' (すなわち、ブリッジ VOB304の最後の TSパケットを含む Capsule )の再生時間は 0· 4秒以上、 1秒以内でなければならない。これはブリッジ VOB304 で最後の Capsuleが完全な Capsuleでない場合でも同様である。
[0534] また、ブリッジ VOB304の末端の最後の Capsule2— 2 'が完全でなレ、 Capsuleで ある場合、ブリッジ VOB304内に記録された最後の Capsuleを前半とし、 return— fr om— Bridge— SPNから始まる VOB # 2 (302)に記録された Capsuleを後半とした 別ファイルに格納されるが論理的に完全な 1つの Capsuleのビデオ再生時間が 0. 4 秒以上、 1秒以内でなければならない。
[0535] また、ブリッジ VOB304の最初の Capsulel— 3, (すなわち、ブリッジ VOB304の 最初の TSパケットを含む Capsule)の再生時間も、 DVD規格との互換性をとるため に、 0. 4秒以上、 1秒以内でなければならない。
[0536] また、シームレス接続における前側の VOB # 1の最後の Capsulel _ 2は、完全な Capsuleであることが必要である。これは、シームレス接続される前側の V〇Bを TS2 PS変換した際に、シームレス接続近辺の AV情報も欠落させることなぐ高速変換で きるようにするためである。
完全な Capsuleが満たすべき条件を以下に示す。
1) Capsuleが Tipパケットで始まる(すなわち、 Tipパケットがあることは、 Capsuleの 始まりを意味する。)。
2) Capsuleが 1つ又は複数の GOPを含む。
3)各オーディオストリームとビデオストリームが Capsule内で完結する。各ストリー ムは Capsule内のアクセスユニットの最初のバイトから始まり、アクセスユニットの最後 のバイトで終わる。
4) Capsule内のヒァォストリ" ~ムは、 sequence_header_codeと group_start_codeに 続く Iピクチャで始まる。
5)先行する Capsule内の最後の Multiplexing Unitから導かれた SCR値と、後 続の Capsule内の Tipパケットの PCR値との時間差力 後続の Tipパケットが同じ ST Cシーケンス内にあるときは、 43886/27M秒以上でなレヽといけなレ、。
(N+1番目の Capsuleを N+1番目の VOBUに変換する場合、 N番目の Capsuleから変 換された N番目の VOBUの転送終了時刻が、 N+1番目の Capsuleから変換された N+1 番目の VOBUの転送開始時刻以前であることを保証するための制限である。 )
6) Tipパケットと、オーディオまたはビデオストリームを含む後続でかつ最初のパ ケットとの到着時刻の差は、 43886/27M秒以上でないといけない。
(Capsuleを VOBUに変換する場合、その VOBU先頭には、 Navi Pack(DVD-Video 時)もしくは RDI Pack(DVD_VR時)が付けられます力 この Packを入れるだけの時間的 な隙間があることを保証するための制限である。 )
7)連続した STCシーケンス内の最後の完全な Capsuleを除いて、 Capsuleのビ デォデータの再生時間は、 0. 4秒、から 1. 0秒の間である。
連続した STCシーケンス内の最後の完全な SESF Capsuleのビデオデータの再 生時間は、 encode_conditionが 01bのときは、 1. 0秒以内であり、 encode_con ditionが l ibのときは、 0. 4秒力 1. 2秒以内である。
8) Capsule内で STCが連続でなければならない。
9)トフンスホ 1 ~トノヽケット内の adaptation_field()の program_clock_reference_base (3 3ビット長)の最上位ビットは Obでなければならなレ、。
[0538] 図 93は、 connection— condition = 3でシームレス接続され、 encode— conditio n=01bの場合の例を示している。
[0539] 図 92の場合と同様に、ブリッジ VOB304の最後の TSパケットを含む Capsule2_ 2 'の再生時間は、 DVD—VRへの高速な変換は実現するために、それが完全な Cap suleであるか否かにかかわらず 0. 4秒以上、 1秒以内でなければならなレ、。また、ブ リッジ VOB304の最初の TSパケットを含む Capsulel— 3,の再生時間も、 DVD— V Rへの高速変換を実現するために、 0. 4秒以上、 1秒以内でなければならなレ、。また 、シームレス接続点の直前の Capsulel _4,(STCシーケンスの最後の完全な Caps uleであるためビデオの再生時間は 1. 0秒以下)及び直後の Capsule2_ l 'は、完 全な Capsuleであることが要求される。このような条件を満たせば、 C— SESF力 M PEG2— PSへフォーマット変換する際に再エンコードせずに DVD規格の条件を満 たすことができる。
[0540] (シームレス接続点近傍におけるオーディオフレームの処理)
次に、 BD規格から DVD規格へのフォーマット変換(TS2PS変換)時のシームレス 接続点近傍におけるオーディオフレームの取り扱いについて説明する。
[0541] BD規格によれば、図 94 (a)に示すように、シームレス接続点では、接続される 2つ の VOBのそれぞれ力 シームレス再生時刻 tcの再生時間を有するそれぞれのォー ディオサンプルを含むように(すなわち、オーディオギャップがないように)、ェンコ一 ドしなければならない。一方、 DVD規格では、図 94 (b)に示すように、シームレス接 続点では、シームレス再生時刻 tcを含むオーディオギャップができるようにエンコード しなければならない。
[0542] したがって、シームレス接続点を含む C— SESFを TS2PS変換する時には、図 94 ( a)に示すようなオーバーラップしているオーディオフレーム a6、 a7を削除し、図 94 (b )に示すようなギャップを作らなければならなレ、。このとき、オーディオフレームの削除 により、シームレス接続される後半の VOB (図 94においてハッチングされた VOB)を 変換する場合には、オーディオパックの PTSをオーディオフレーム a8に合わせて修 正する必要がある。オーバーラップするオーディオフレームを削除せずに、オーバー ラップを解消するようにオーディオパックの PTSを適宜シフトしてもよい。
[0543] または、オーディオギャップを設ける代わりに、図 95 (b)に示すように、オーバーラッ プするオーディオフレーム a6、 a7を削除し、オーディオギャップができないように、ォ 一ディオフレーム a5と連続的に再生できるように再エンコードしたオーディオフレーム a8 'を後続の VOBの先頭に配置してもよレ、。但し、この場合、オーディオフレーム a8 ,以後のオーディオフレームの再生時間が一様にずれるため、それらのオーディオフ レームを含むオーディオパックの PTSを全て、(t4_t3)だけ早める処理が別途必要 となる。また、オーディオギャップを設けない場合も、オーバーラップするオーディオ フレームを削除せずに、オーバーラップを解消するようにオーディオパックの PTSを 適宜シフトしてもよい。
[0544] BD規格から DVD規格へのフォーマット変換 (TS2PS変換)時のオーディオフレー ムの取り扱いは上記のとおりであるが、逆に DVD規格から BD規格へフォーマット変換 する場合は、シームレス接続点近辺に存在するオーディオギャップをオーバーラップ に変換する必要がある。
[0545] これは、ビデオのシームレス接続時亥 lj(図 94の時亥 Ijtc)にシームレス接続する VOB の音声データが夫々存在するように (例えば、図 94のオーディオフレーム a6,a7)、ォ 一ディオフレームを追加することで実現できる。追加されるオーディオフレームは無 音を与えるオーディオフレームであっても良い。
[0546] また、追加されるオーディオフレームの数は、先行の VOB及び後続の VOBのいず れに対しても最大 1フレーム以内とする。なぜならば、 DVD規格でのオーディオギヤッ プは 1フレーム以下の時間長であるため、 1フレーム追加することで、必ずシームレス 接続時刻 tcの音声データを、シームレス接続される両方の VOBが有することを保証 できるからである。予め時刻 tcの音声データを V〇Bが持っていた場合には、その VO Bに対しては、オーディオフレームを追加する必要はない。
[0547] (シームレス接続にぉレ、て考慮すべきタイムスタンプのオフセット)
次に、シームレス接続された VOBの TS2PS変換時にタイムスタンプの演算におい て考慮すべきオフセットについて説明する。
[0548] DVD-Video規格では、各 V〇B先頭の NV_PCK (ナビパック)は、 SCRに 0を設定する ことが強制されている。これは、各 VOBが常に MPEGの STC時間軸で値 0からデコー ダ (システムターゲットデコーダ)に供給開始されるようにするためである。前方部分削 除等の編集が想定されるような記録系の規格では、このような保証はないため、ストリ ーム変換時には MPEGのタイムスタンプ (SCR/PCR,PTS,DTS)に所定量のオフセットを 加えることで変換後の VOBの最初のパックの SCRを 0から始めることができる。
[0549] 図 96を参照し、このオフセット量を求めるための演算を説明する。なお、図 96では 、 Capsulelと Capsule2を含む前側のストリーム(VOBに対応)と、 Capsule3と Caps ule4を含む後側のストリームとをシームレス接続する例を説明する。 Capsulelと Cap sule2は VOBU1と VOBU2にそれぞれ対応し、 Capsule3と Capsule4は VOBU3 と VOBU4にそれぞれ対応する。
[0550] 1つの VOB(MPEG2-TS)を、 1つの V〇B (DVD-Videoの MPEG2-PS)に変換するに は、前述の SCR演算処理 (図 72)で得られた SCR値から、オフセット 1 (offsetl)を減じた 値を SCRとすれば良レ、。 PTS,DTSに関しても、一律に以前 (変換前)の PTS,DTSから off setlを減じた値を設定すれば良い。また、 2つの VOB(MPEG2_TS)から 1つの VOB(D VD-Videoの MPEG2-PS)に変換する際に用いる、さらなるオフセット 2 (offset2)を設定 する。図 96において、オフセット 2 (offset2)は、 VOBU3を VOBU2の後に時間的に連 続させるためのオフセットである。
[0551] なお、 DVD-Video形式の MPEG2-PSに変換しない場合 (DVD-VR形式の MPEG2-P Sに変換する場合)には、 VOBの先頭パックの SCRを 0とする必要性がないため、オフ セット 1 (offsetl)は別の任意の値(例えば 0)としても良い。
[0552] 図 96に示すように、シームレス接続点前側の VOBを TS2PS変換する際には、前 述の計算式で得られる SCR値から、オフセット 1だけシフトした SCR値を使用してもよ レ、。一方、シームレス接続点後側の V〇Bを TS2PS変換する際には、前側の VOBの ビデオフレームの再生終了時刻が、後側の V〇Bの最初のビデオフレームの再生開 始時刻と重なるようにオフセット 2を使ってシフトした SCR値を使用してもよいし、シー ムレス接続点を挟んで 2つの V〇Bに変換するならば、シームレス接続点後側の VOB に対してもオフセット 1を使用しても良レ、。オフセット 1 (offsetl)、オフセット 2 (offset 2)は以下の式で求める。 offset l = PCRtipl
offset2 = FVFPST3 - (FVFPST2 - of f set 1 + VOBU2の全ビデオフレーム の再生時間)
上述のようにオフセット 1は DVD-Videoの MPEG2-PSに変換する際には必須である が、 DVD-VRの MPEG2-PSに変換する際には必須ではなレ、。また、オフセット 2は 2つ の VOBを 1つの VOBに変換する際の後半の V〇Bに対しては必須である力 変換時 に VOBを連結しなレ、場合には必須ではなレ、。
[0553] 上式のオフセット 1を用いれば、シームレス接続される前側の V〇Bの最初の VOB U (図 96 (c)では、 VOBU1)の最初のパック(NV_PCKもしくは RDI_PCK)の SC Rを 0から開始することが可能となる。
[0554] また、上式のオフセット 2を用いれば、シームレス接続される後側の VOBの最初の VOBU (図 96 (c)では、 VOBU3)の最初のパック(NV_PCKもしくは RDI_PCK) の SCRを、前側の VOBの最後のパックから連続した STC時間軸で供給できるように なり、その結果、 1つの VOBに TS2PS変換することが可能となる。
[0555] (シームレス接続される C— SESFの TS 2PS変換処理)
図 97力ら図 100を用いて、シームレス接続される 2つの C— SESFの VOBを TS2P S変換する際の処理について説明する。
[0556] 図 97は、 connection— condition=4でシームレス接続された VOBの場合を、図 98〜図 100は、 connection— condition = 3でシームレス接続(ブリッジ VOBを用 いたシームレス接続)された VOBの場合を示している。いずれの場合も、シームレス 接続を行わない前述の TS2PS変換処理をベースにしており、さらに、オフセット量を 考慮してタイムスタンプを演算する処理、オーバーラップしてレ、るオーディオフレーム を削除する処理を含んでレ、る。
[0557] 図 97を参照し、 connection_condition=4でシームレス接続される 2つの V〇B の TS2PS変換処理を説明する。
[0558] まず、オーバーラップしてレ、るオーディオフレームの存在を判断し、オーバーラップ 力 Sある場合、それを削除する(S301)。例えば、図 94に示すように、オーディオフレ ーム a6、 a7を削除する。この処理の詳細を以下に説明する。 [0559] オーバーラップを削除するための判定は、ストリームの変換と同時に行うの力 S、容易 であり、好ましい。まず、シームレス接続点 tcより前側にある VOBの音声データの再 生終了時刻 (t2)を求める。再生終了時刻 (t2)は、シームレス接続する前側の VOBの 最後のオーディオ PESパケットの PTS値 (PTSp)と、その PESパケットのペイロードの中 に格納されているオーディオのデータサイズ (Lpesビット)と、それに格納されているォ 一ディォの 1フレームのデータサイズ (Lfrmビット)と、その再生時間長 (90KHz単位で Df rmクロック)とから、次のように計算される。
t2 = PTS + (Lpes/Lfrm) * Dfrm (単位は 90KHzクロック)
ここでは、簡単のため PESパケットには必ず整数個で固定ビットレートのオーディオフ レームが格納されるとしてレ、る。
[0560] 次に、シームレス接続点 tcより後側にある V〇Bの音声データの再生開始時刻 (tl)を 求める。再生開始時刻 (tl)は、後続の V〇Bの最初のオーディオ PESパケットの PTS値 (PTSs)である。
tl = PTSs (単位 ίま 90KHzクロック)
以上のようにして時刻 tl, t2を求め、 t2く tcく tlの関係が満たされれば、オーディ オギヤップが存在する、すなわち、オーバーラップがないと判断する。この場合、ォー ディオギヤップの追加の処理は不要であり、前述通りの変換処理を行えば良い。
[0561] しかしながら、上記の場合であっても、 tl -t2 > Dfrmであれば、オーディオギャップ 力 フレーム長以上あるため、 tl - t2く Dfrmとなるまで、オーディオフレームを追加 しても良い。
[0562] また、 t2 = tc = tlであれば、オーディオのオーバーラップもギャップもないため、一 切オーディオフレームの追加 Z削除の処理は不要であり、前述通りの変換処理を行 えば良い。
[0563] 以上のいずれのケースでもなければ、シームレス接続時にオーディオのオーバーラ ップが存在すると判断し、 tl - t2 < Dfrmを満たす範囲で、オーバーラップを解消す るため、オーディオフレームを変換時に取り除く。オーディオフレームを取り除くため、 PESパケットのデータサイズを示す PES_packet_lengthや、最初のオーディオフレーム の PTSを表す PTSフィールドの値を正しい値に設定しなおす例外処理が必要となる。 [0564] 尚、上記説明では、オーディオフレームを削除する例を説明したが、オーディオの オーバーラップを解消できれば他の処理でもよい。例えば、オーバーラップを解消す るために、後続の VOBのオーディオの PTS値を全て、(t2 - tl)以上かつ(t2 -tl + D frm)未満だけ、時間的後方にシフトする方法が考えられる。
[0565] 図 97に戻り、オーディオフレームのオーバーラップを解消後、シームレス接続され る 2つの V〇Bを、変換後に別々の VOBとして生成する力、、 1つの V〇Bに連結するか を判断する(S302)。 YESの場合、シームレス接続点の前の VOBと、シームレス接 続点の後の VOBとがそれぞれ MPEG— PSに変換され、最終的に 2つの V〇Bが生 成される。 N〇の場合、シームレス接続点の前の V〇Bと、シームレス接続点の後の V OBが MPEG— PSに変換され、連結され、最終的に 1つの V〇Bが生成される。
[0566] 変換後に 2つの V〇Bに分ける場合(S302で YES)、 DVD—Video規格または DV D -Video Recording規格のいずれに変換するか判断する(S303)。 DVD-Vid eo規格に変換する場合(S303で YES)、前述の方法でオフセット 1を導出し、そのォ フセット 1でタイムスタンプを補正しながら TS2PS変換を行う(S304)。 DVD— Vide o Recording規格に変換する場合(S303で NO)、タイムスタンプの補正は行わず に TS2PS変換を行う(S307)。
[0567] 2つの VOBについて TS2PS変換が終了すると(S305で YES)、変換後の 2つの V OBを、それらがシームレス接続されるように管理情報(PGC)に登録する(S306)。 例えば、シームレス接続される後側の VOBの VOBIの接続条件(connection— cod e)をシームレス接続である 4に設定する。
[0568] 一方、ステップ S302において、変換後に 2つの VOBに分けない場合(S302で NO )、オフセット 1、 2を導出し、そのオフセット 1、 2でタイムスタンプを補正しながら TS2P S変換を行う(S309)。 2つの V〇Bについて TS2PS変換が終了すると(S310で YE S)、変換後の 2つの VOBを連結し、 1つの VOBとして管理情報(PGC)に登録する(
[0569] その後、変換後の V〇Bを管理情報とともに、連続再生可能となるように情報記録媒 体の連続領域(CDA)に記録し (S308)、処理を終了する。
[0570] 図 98〜図 100を参照し、 connection condition= 3でシームレス接続(ブリッジ VOBを介してシームレス接続)される 2つの VOBの TS2PS変換処理を説明する。
[0571] まず、オーバーラップしてレ、るオーディオフレームの存在を判断し、オーバーラップ がある場合、それを削除する(S321)。次に、シームレス接続される 2つの VOBを、 変換後に別々の VOBとして生成する力、、 1つの V〇Bに連結するかを判断する(S32 2)。
[0572] 最終的に 2つの V〇Bに分ける場合(S322で YES)、 DVD—Video規格または DV D -Video Recording規格のいずれに変換するか判断する(S323)。 DVD-Vid eo規格に変換する場合(S323で YES)、オフセット 1を導出し、そのオフセット 1でタ ィムスタンプを補正しつつ、ブリッジ VOBを経由しながら TS2PS変換を行う(S324) 。 DVD—Video Recording規格に変換する場合(S323で NO)、タイムスタンプの 補正は行わずにブリッジ V〇Bを経由しながら TS2PS変換を行う(S327)。 2つの VO Bについて TS2PS変換が終了すると(S325で YES)、変換後の 2つの V〇Bを、それ らがシームレス接続されるように管理情報 (PGC)に登録する(S326)。変換後の VO Bを管理情報とともに、連続再生可能となるように情報記録媒体の連続領域 (CDA) に記録し(S328)、処理を終了する。
[0573] 一方、ステップ S322において NOの場合、シームレス接続される 2つの VOBと、ブ リッジ VOBとを含む 3つの VOBを、変換後にそれぞれ別々に生成する力、または、 連結して 1つの VOBとして生成するかを判断する(S329)。 3つの VOBを変換後に それぞれ別々に生成する場合(S329で YES)、図 99に示す処理に移行する。 3つ の VOBを変換後に連結する場合(S329で NO)、図 100に示す処理に移行する。
[0574] 図 99の処理を説明する。まず、 DVD— Video規格または DVD— Video Recordi ng規格のいずれに変換するか判断する(S331)。
[0575] DVD—Video規格に変換する場合(S331で YES)、変換対象の VOBがブリッジ V〇Bでなければ(S332で NO)、オフセット 1を導出し、そのオフセット 1でタイムスタ ンプを補正しながら、その VOBの TS2PS変換を行う(S334)。変換対象の V〇Bが ブリッジ VOBであれば(S332で YES)、そのオフセット 1、 2を導出し、オフセット 1、 2 でタイムスタンプを補正しながら、ブリッジ V〇B全体の TS2PS変換を行う(S333)。
[0576] 一方、 DVD_Video Recording規格に変換する場合(S331で NO)、変換対象 の VOBがブリッジ VOBでなければ(S337で NO)、その VOBの TS2PS変換を行い (S339)、変換対象の VOBがブリッジ VOBであれば(S337で YES)、オフセット 1、 2を導出し、そのオフセット 1、 2でタイムスタンプを補正しながら、ブリッジ VOB全体の TS2PS変換を行う(S338)。
[0577] 3つの VOBについて TS2PS変換が終了すると(S335、 S340で YES)、変換後の
3つの VOBを、それらがシームレス接続されるように管理情報(PGC)に登録する(S 336)。
尚、当然ながら 3つの VOBに変換する場合には、予め 3つの VOBの変換対象とな る区間が何れも Capsule単位でァライメントされている必要がある。そうでない場合に は、 S329で YESは選択できず、 NOに処理が流れる。
[0578] 図 100の処理を説明する。まず、 DVD—Video規格または DVD—Video Recor ding規格のいずれに変換するか判断する(S351)。
[0579] DVD— Video規格に変換する場合(S351で YES)、変換対象の VOBがブリッジ VOBでなければ(S352で NO)、オフセット 1を導出し、そのオフセット 1でタイムスタ ンプを補正しながら、その VOBの TS2PS変換を行う(S354)。変換対象の VOBが ブリッジ VOBであれば(S352で YES)、オフセット 1、 2を導出し、そのオフセット 1、 2 でタイムスタンプを補正しながら、ブリッジ VOB全体の TS2PS変換を行う(S353)。
[0580] 一方、 DVD— Video Recording規格に変換する場合(S351で NO)、変換対象 の VOBがブリッジ VOBでなければ(S358で NO)、その VOBの TS2PS変換を行い (S360)、変換対象の VOBがブリッジ VOBであれば(S358で YES)、オフセット 1、 2を導出し、そのオフセット 1、 2でタイムスタンプを補正しながら、ブリッジ VOB全体の TS2PS変換を行う(S359)。
[0581] 3つの VOBについて TS2PS変換が終了すると(S355、 S361で YES)、変換後の
3つの VOBを 1つの VOBに連結する(S356)。最後に、管理情報 (PGC)に変換後 の 1つの V〇Bを登録する(S357)。
上記説明においては、簡単のためフローに記載していないが、変換した 3つの VOB 力 本の V〇Bに連結されるため、 S351で YESの場合には、連結された 1つの VOB 力 SSCR = 0から始まる連続したタイムスタンプを持つようにオフセット 2と同様の手法 にてタイムスタンプにオフセットをカ卩味することが別途必要となる。また同様に S351 の NOの場合にも、連結された 1つの VOBが連続したタイムスタンプを持つようにオフ セット 2と同様の手法にてタイムスタンプにオフセットをカ卩味することが別途必要となる
[0582] 以上のような方法でシームレス接続を含むシステムストリームの TS2PS変換が実行 できる。
[0583] また、図 97から図 100までの変換処理は、図 20のユーザ iZF部 222にてユーザに より変換区間が特定され、その変換区間の情報を用いてシステム制御部 212によりド ライブ 221が制御されて記録媒体 100上のストリームに対して実行される。
[0584] また、シームレス接続時に再エンコードを行う処理も、変換処理の場合と同様に、図 20のユーザ IZF部 222にてシームレス接続させる 2つの V〇Bが特定され、システム 制御部 212によりドライブ 221が制御されて記録媒体 100上のストリームに対して実 行される。
[0585] 以上のようにしてシームレス接続する Constrained SESFの規定を定め、その変 換方法について規定することで、 TS2PS変換がシームレス接続時でも容易にかつ 高速に実行可能となる。
[0586] (異なる encode— conditionをもつ VOBのシームレス接続の制限)
図 92、図 93では、同じ encode— conditionを有する VOB間を Bridge— VOBを 介してシームレス接続する場合の C SESFの制限について説明した。以下では、 異なる encode— conditionを有する VOB間を Bridge— VOBを介してシームレスす る場合の C— SESFの制限について説明する。
[0587] 図 101は、異なる encode_conditionを持つ 2つの VOBを Bridge— V〇Bで繋ぐ 場合の例を示した図である。
[0588] この場合、 Bridge _V〇B全体で一つの encode_conditionを与えると、 Capsule の再生時間長の規定の違いなどによりエレメンタリストリームレイヤでの加工が必要に なる可能性が生じる。
[0589] 例えば、図 92の例のように Capsulel _4力 0. 6秒の GOP2つ力、ら構成され、合 計で 1. 2秒の再生時間を持つ場合、 encode condition= 01b (DVD VR規格) の Bridge— V〇Bを生成するためには、 Capusle l— 4,は、夫々 0· 6秒の GOPを 1 つずつ格納した 2つの Capsuleに分割されなければならない(なぜならば、 DVD V R規格では、全ての Capsuleは 1. 0秒以下である必要があるからである。)。この場合 、実際には、 FVFPSTなどのエレメンタリストリームの解析が必要な値を格納する Tip パケットを、新規に作成する必要があり、 Bridge—VOBの生成は非常に困難となる。
[0590] また、 Capsule l— 1、 1— 2までを encode_condition= l lb (DVD— Video規格 )の規則で DVD—Videoに変換してレ、る最中に Bridge— VOBに移った場合、 Cap sule l _ 3,、 1—4,は encode_condition = 01b (DVD VR規格)の規則で符号 化されていることから、コントローラは、 DVD—Video形式の VOBを変換し続けるた めには、 Bridge _V〇Bファイルの切れ目を認識せざるを得なくなるという問題がある 。特に、 Bridge—VOBが Capsuleの途中力、ら始まっている場合などでは、その処理 がー層煩雑になってしまう。
[0591] 以上のような、異なる encode— conditionを持つ VOB間の Bridge— VOBを用レヽ てシームレス接続に起因する問題を解決するために、図 101に示すように、 Bridge —VOBに対してのみ encode— conditionの値として" 10b"とレ、う値を割当てる。そ の場合、その Bridge— VOBの前半および後半の区間は夫々の参照元の VOBの en code _ conditionに従つ のとする。なお、 丄 Ob は encode _ conditionに对する 上記の説明においては、リザーブとされ、未定義の値である。
[0592] 以上の構成により上記の問題が解消され、 Bridge— VOBの生成と、 Bridge— VO Bを含む区間の DVDへの変換とが容易になるという利点がある。
[0593] すなわち、 encode— conditionの" 10b"は、 Bridge— VOBの前半部分及び後半 部分が、それらが参照する元の VOB (接続先の VOB)に設定された encode_cond itionの値と同じ値を用いて符号化されていることを示す。 " 10 'は8 (1§6 _ 〇8に おいてのみ使用可能とする(図 103 (b)参照)。
[0594] 図 102は、 Bridge— VOBを含む区間の TS2PS変換フローを示している。同フロ ーにぉける811(1§6 _¥08と変換元の¥08との関係は図103 (&)に示すとおりであり 、 VOB # 1と V〇B # 2が Bridge _V〇Bを介して接続される。
[0595] 図 102において、最初、 V〇B # 1、 Bridge— VOB、 VOB # 2夫々の encode co nditionを、それぞれの VOB情報(VOBI)を参照して取得する(S401)。取得した B ridge— VOBの encode— condition ( = ecb)力 S 10bであるカ または、取得した VO B # 1の encode一 conditioru = ecl)力、、取守しに Bridge— VOBの encode一 con dition ( = ecb)と等しいか否かを判断する(S402)。
[0596] Bridge— VOBの encode_conditionが 10bであることは、 Bridge— V〇Bの前半 部分が接続先の VOB # 1と同じ encode_conditionで符号化されたことを示す。よ つて、 Bridge—VOBの encode—condition力 0bであれば'、接続先の V〇Bの enc ode_conditionにしたがレ、、接続先の V〇B # 1と、 Bridge—VOBの前半部分とを 、 1つの連続した C— SESFまたは SESFとして認識でき、それを PSに変換すること が可能となる。
[0597] そこで、 Bridge— VOBの encode_coiiditioii力 S lObであれは、、又 fま eel力 Secbと 等しければ、接続先の V〇B # 1と、 Bridge _V〇Bの前半部分とを、 encode_cond ition = eclである 1つの連続した C— SESFまたは SESFとして扱い、 PSに変換する (S403)。ここで、 ecl = 00bのときは、 VOB # l及び Bridge— VOBの前半が SESF であることを示すため、従来の高速でない変換方法を用いて TSから PSへの変換を 行う。一方、 ecl = 01bまたは l ibのときは、 V〇B # 1及び Bridge—VOBの前半部 分が C— SESFであることを示すため、 TSから PSへの高速変換が可能となるので、 C— SESFに対する高速な変換方法を用いて TSから PSへの変換を行う。図 103 (a) の ί列では、 pl l力ら ρ12と ρ21力ら ρ22のストリーム力 encode一 condition = eelで ある 1本の連続した C - SESFまたは SESFとして扱われ、 PSに変換される。
[0598] 一方、 Bridge— VOBの encode— condition ( = ecb)力 S 10bでなぐ且つ、 VOB
# 1の encode一 condition、 = eel )力 Bridge _V〇Bの encode一 condition ( = ec b)と等しくないときは、 Bridge—VOBの前半部分と、接続先の VOB # lとは異なる e ncode_conditionで符号化されている。よって、この場合、接続先の V〇B # 1と Bri dge— VOBの前半部分とを、 1つの連続した C— SESFとして扱うことはできなレ、。よ つて、この場合は、接続先の V〇B # 1と Bridge—VOBの前半部分とを、 1つの連続 した SESFとして扱レヽ、 PSに変換する(S404)。つまり、 pl l力、ら pl 2と、 p21力ら p2 2のストリームが 1本の連続した SESFとして扱われ、 PSに変換される。なお、 Bridge — V〇Bと、 V〇B # 1とのいずれか一方のみが C— SESFである場合は、その一方の みを C SESFに対する高速な変換方法を用いて TSから PSへ変換を行ってもよい
[0599] 以上のように Bridge _VOBの前半部分の変換が終了すると、 Bridge _VOBの後 半部分以後の変換を開始する。 Bridge—VOBの encode_condition ( = ecb)が 1 Obである力、または、取得した V〇B # 2の encode_condition ( = ec2)が Bridge— V〇Bの encode_condition ( = ecb)と等しいか否かを判断する(S405)。取得した Bridge _VOBの encode_conditionが 10bであることは、 Bridge— VOBの後半 部分が接続先の VOB # 2と同じ encode_conditionで符号化されてレ、ることを示す
[0600] Bridge _VOBの encode_condition力 Obであれば、又は ec2力 cbと等しけれ ば、接続先の VOB # 2の encode_conditionにした力 Sい、接続先の Bridge—VOB の後半部分と VOB # 2とを 1つの連続した C— SESFまたは SESFとして扱い、 PSに 変換する(S406)。図 103 (a)の列では、 p22力ら p23と、 p32力ら p33とのストリーム 力 encode— conditionが ec2である 1本の連続した C— SESFまたは SESFとして 認識され、 encode— conditionに応じた変換方法を用いて PSに変換される。
[0601] 一方、 ecbが 10bでもなぐまた、 ec2が ecbと等しくないときは、接続先の V〇B # 2 と Bridge— VOBの後半部分とを 1つの連続した SESFとして扱い、高速でない変換 方法を用レヽて PSに変換する(S407)。つまり、 p22力ら p23と、 p32力ら p33とのストリ ームが 1本の連続した SESFとして認識され、 PSに変換される。
[0602] 以上のように encode— conditionに 10bを新たに設定することで、接続先の 2つの VOB (VOB # 1と VOB # 2)の encode_conditionが異なっていても良くなり、この ため、 Bridge—VOBで繋ぎたレ、V〇B # 1と V〇B # 2の encode_conditionに依ら ずに自由に適切な符号化がなされた Bridge _V〇Bを生成し、 VOB # 1と VOB # 2 を接続することが可能となる。
[0603] Bridge— VOBでない通常の VOBでは、 encode_conditionの値として 10bを使 用することはできないようにする。つまり、 encode_conditionの値として 10bは Brid ge—V〇Bだけが使うことができるものとする。 encode condition=10bの場合には 、固定的な符号化特徴をあらわす訳ではなぐ Bridge— VOBの前半、後半の部分ス トリームを、夫々の接続先の VOBと同じ encode— conditionで符号化したことを意 味している(図 103 (b)参照)。
[0604] (その他)
以上に示した情報記録装置 Z方法では、外部入力された AVデータを MPEGトラ ンスポートストリーム形式にセルフエンコーディングする際に、デコーダ互換を保ちな がら効率良く符号化/複号化処理を行うことが可能である。
[0605] また、情報記録媒体に記録されるストリームには、ユーザプライベート情報を格納す ることができるため、 MPEGトランスポートストリーム形式の記録コンテンツの付加価 値を高めることが可能である。
[0606] さらに、情報記録媒体に記録される MPEG—TSは、 MPEG— PSへの親和性が 高くなるように 2KB以下のブロック単位で多重化処理がなされるため、シームレス接 続点を含めて MPEG— TSを MPEG— PSに変換すること力 バッファマネージメント を考慮することなく極めて容易に実現することができる。
[0607] 尚、上記説明において MPEG— PSから MPEG— TSへの逆変換については、説 明していないが、 TS2PS変換の逆として同様に考えることができる。例えば、 IPSパ ックを複数個の連続した TSパケットに変換し、その際に生成される複数個の連続した TSパケットの ATSの増分を固定として、ディスク上もしくはストリームの内部にその情 報を格納することも考えられる。
[0608] また、 MPEG— PSのクリップの名称(コンテンツ内容を示す番組情報等)を SITパ ケット内に格納して MPEG— TSへ変換すると、 STB等のデコーダで、元の番組名を メニュー表示すること等が可能となる。
[0609] 本発明は、特定の実施形態について説明されてきたが、当業者にとっては他の多 くの変形例、修正、他の利用が明らかである。それゆえ、本発明は、ここでの特定の 開示に限定されず、添付の請求の範囲によってのみ限定され得る。なお、本出願は 日本国特許出願、特願 2004— 361190号(2004年 12月 14日提出)に関連し、そ れらの内容は参照することにより本文中に組み入れられる。
産業上の利用可能性 本発明は、第 1のストリームから第 2のストリームへのフォーマット変換を容易にかつ 高速に実現可能とし、特に、シームレス接続されたストリームに対しても、シームレス 再生機能を維持したままフォーマット変換を可能とする。よって、本発明は、第 1のスト リーム(例えば、 MPEGトランスポートストリーム)から第 2のストリーム(例えば、 MPE Gプログラムストリーム)へのフォーマット変換機能を具備する情報記録装置に適用で きる。

Claims

請求の範囲
[1] システムストリームにエンコードされた映像情報と音声情報を、その管理情報と共に 記録した情報記録媒体であって、
a)前記システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS)とが 許され、前記第 1のフォーマット (TS)は、データをパケットで分割して格納するバケツ ト構造を有し、前記第 2のフォーマット(PS)は、データをパックで分割して格納するパ ック構造を有し、
前記第 1のフォーマット(TS)には、第 1のフォーマット(TS)力ら第 2のフォーマット(P S)へシステムストリームを変換するための制限フォーマットが許され、
該制限フォーマットによれば、所定数の前記パケットがグループ化されて、前記第 2 のフォーマットのパックに対応する多重化ユニットとして管理され、さらに、前記多重 化ユニットを複数含むデータ管理単位 (Capsule)でシステムストリームが管理され、 b)前記情報記録媒体は、
第 1のシステムストリームと、
第 2のシステムストリームと、
第 1のシステムストリーム及び第 2のシステムストリームをシームレス接続するため のストリームであって、シームレス接続される前記システムストリームのそれぞれの一 部力 構成される第 3のシステムストリーム(Bridge_VOB)を格納し、
c)前記管理情報は、
前記第 1及び第 2のシステムストリームに対して、それらの記録フォーマットが前記 制限フォーマットであるか否力、を示す情報と、
前記第 3のシステムストリームに含まれる各システムストリーム力 それらの元のシ ステムストリームと同じ符号化条件で符号化されたことを示す情報とを含む ことを特徴とする情報記録媒体。
[2] 映像情報と音声情報とをシステムストリームにエンコードして、その管理情報と共に 情報記録媒体に記録する情報記録装置であって、
a)前記システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS)とが 許され、前記第 1のフォーマット (TS)は、データをパケットで分割して格納するバケツ ト構造を有し、前記第 2のフォーマット(PS)は、データをパックで分割して格納するパ ック構造を有し、
前記第 1のフォーマット(TS)には、第 1のフォーマット(TS)力ら第 2のフォーマット(P S)へシステムストリームを変換するための制限フォーマットが許され、
該制限フォーマットによれば、所定数の前記パケットがグループ化されて、前記第 2 のフォーマットのパックに対応する多重化ユニットとして管理され、さらに、前記多重 化ユニットを複数含むデータ管理単位 (Capsule)でシステムストリームが管理され、 b)前記情報記録装置は、
前記第 1のフォーマット (TS)に基づき、前記映像情報と前記音声情報に所定のェ ンコード処理を施しビデオエレメンタリストリームとオーディオエレメンタリストリームとを 生成する第 1のエンコード手段(230a,230b)と、
前記第 1のフォーマット(TS)に基づき、前記ビデオエレメンタリストリームと前記ォ 一ディォエレメンタリストリームとをマルチプレタスし前記システムストリームを生成する システムエンコードを行なう第 2のエンコード手段(232)と、
前記第 1及び第 2のエンコード手段を制御する制御手段(212)とを備え、
c)前記制御手段は、
第 1及び第 2のシステムストリームをシームレス接続するために、前記第 1及び第 2 のシステムストリームのそれぞれの一部力 構成される第 3のシステムストリーム(Bridg e-VOB)を生成するよう、前記第 1及び第 2のエンコード手段を制御するとともに、 前記管理情報として、前記第 1及び第 2のシステムストリームに対して、それらの記 録フォーマットが前記制限フォーマットであるか否かを示す情報と、前記第 3のシステ ムストリームに含まれる各システムストリームがそれらの元のシステムストリームと同じ 符号化条件で符号化されたことを示す情報 (encode_condition)とを生成するよう、前 記第 1及び第 2のエンコード手段を制御する
ことを特徴とする情報記録装置。
システムストリームにエンコードされた映像情報と音声情報を、その管理情報と共に 情報記録媒体に記録する方法であって、
a)前記システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS)とが 許され、前記第 1のフォーマット (TS)は、データをパケットで分割して格納するバケツ ト構造を有し、前記第 2のフォーマット(PS)は、データをパックで分割して格納するパ ック構造を有し、
前記第 1のフォーマット(TS)には、第 1のフォーマット(TS)力、ら第 2のフォーマット(P S)へシステムストリームを変換するための制限フォーマットが許され、
該制限フォーマットによれば、所定数の前記パケットがグループ化されて、前記第 2 のフォーマットのパックに対応する多重化ユニットとして管理され、さらに、前記多重 化ユニットを複数含むデータ管理単位 (Capsule)でシステムストリームが管理され、 b)前記情報記録方法は、
前記第 1のフォーマット (TS)に基づき、前記映像情報と前記音声情報に所定のェ ンコード処理を施して、ビデオエレメンタリストリームとオーディオエレメンタリストリーム とを生成し、
前記第 1のフォーマット(TS)に基づき、前記ビデオエレメンタリストリームと前記ォ 一ディォエレメンタリストリームとをマルチプレタスして、前記システムストリームを生成 し、
c)前記エンコード処理において、
第 1及び第 2のシステムストリームをシームレス接続するために、前記第 1及び第 2 のシステムストリームのそれぞれの一部力 構成される第 3のシステムストリーム(Bridg e-VOB)を生成するとともに、
前記管理情報として、前記第 1及び第 2のシステムストリームに対して、それらの記 録フォーマットが前記制限フォーマットであるか否かを示す情報と、前記第 3のシステ ムストリームに含まれる各システムストリームがそれらの元のシステムストリームと同じ 符号化条件で符号化されたことを示す情報(encode_condition)とを生成する ことを特徴とする情報記録方法。
請求項 3記載の方法をコンピュータに実行させる、コンピュータ読み取り可能なプロ グラム。
PCT/JP2005/022945 2004-12-14 2005-12-14 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法 WO2006064838A1 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-361190 2004-12-14
JP2004361190A JP2008052761A (ja) 2004-12-14 2004-12-14 高速変換可能なストリームを記録した情報記録媒体、ならびにその記録装置/方法、および変換装置/方法

Publications (1)

Publication Number Publication Date
WO2006064838A1 true WO2006064838A1 (ja) 2006-06-22

Family

ID=36587894

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/022945 WO2006064838A1 (ja) 2004-12-14 2005-12-14 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法

Country Status (2)

Country Link
JP (1) JP2008052761A (ja)
WO (1) WO2006064838A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002230948A (ja) * 2000-11-29 2002-08-16 Matsushita Electric Ind Co Ltd 光ディスク、記録装置、再生装置、プログラム、コンピュータ読み取り可能な記録媒体及び方法。
JP2003228922A (ja) * 2001-07-23 2003-08-15 Matsushita Electric Ind Co Ltd 情報記録媒体、情報記録媒体に情報を記録する装置及び方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002230948A (ja) * 2000-11-29 2002-08-16 Matsushita Electric Ind Co Ltd 光ディスク、記録装置、再生装置、プログラム、コンピュータ読み取り可能な記録媒体及び方法。
JP2003228922A (ja) * 2001-07-23 2003-08-15 Matsushita Electric Ind Co Ltd 情報記録媒体、情報記録媒体に情報を記録する装置及び方法

Also Published As

Publication number Publication date
JP2008052761A (ja) 2008-03-06

Similar Documents

Publication Publication Date Title
JP4648410B2 (ja) 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法
JP4180104B2 (ja) 情報記録装置及び情報記録方法
JP4586073B2 (ja) 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法
WO2004091208A1 (ja) 情報記録媒体、情報記録媒体に情報を記録する装置及び方法
JP4105223B1 (ja) 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法
JP4177442B2 (ja) 情報記録装置及び情報記録方法
WO2006064838A1 (ja) 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KN KP KR KZ LC LK LR LS LT LU LV LY MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP

122 Ep: pct application non-entry in european phase

Ref document number: 05816836

Country of ref document: EP

Kind code of ref document: A1

WWW Wipo information: withdrawn in national office

Ref document number: 5816836

Country of ref document: EP