WO2005099259A1 - 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法 - Google Patents

高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法 Download PDF

Info

Publication number
WO2005099259A1
WO2005099259A1 PCT/JP2005/006658 JP2005006658W WO2005099259A1 WO 2005099259 A1 WO2005099259 A1 WO 2005099259A1 JP 2005006658 W JP2005006658 W JP 2005006658W WO 2005099259 A1 WO2005099259 A1 WO 2005099259A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
format
packet
stream
data
Prior art date
Application number
PCT/JP2005/006658
Other languages
English (en)
French (fr)
Inventor
Hiroshi Yahata
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to US11/547,649 priority Critical patent/US8055122B2/en
Priority to JP2006512084A priority patent/JP4177408B2/ja
Priority to EP05728417A priority patent/EP1737227A4/en
Publication of WO2005099259A1 publication Critical patent/WO2005099259A1/ja
Priority to KR1020067022038A priority patent/KR101097542B1/ko

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/21Disc-shaped record carriers characterised in that the disc is of read-only, rewritable, or recordable type
    • G11B2220/215Recordable discs
    • G11B2220/216Rewritable discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2541Blu-ray discs; Blue laser DVR discs

Definitions

  • Information recording medium recording stream capable of high-speed conversion, recording apparatus and recording method thereof
  • the present invention relates to an information recording medium that can be recorded and reproduced, and is an information recording medium on which multimedia data including data of various formats such as moving images, still images, audio, and data broadcasting is recorded.
  • the present invention relates to an information recording medium for recording data in a limited format that enables high-speed conversion of multimedia data into a format different from the recorded format.
  • the present invention also relates to an apparatus and a method for recording information on such an information recording medium.
  • BD standard The Blu-ray Disc standard
  • Next-generation digital broadcast recorders (Blu-ray Disc recorders) compliant with the BD standard mainly use MPEG-TS as they are without converting the broadcasted MPEG-TS according to the form of digital broadcasting. Record in format. Also, the next-generation digital broadcast recorder records an AV stream in the MPEG-TS format even when self-recording AV data from an external input. This is so that it is not necessary to handle both MPEG program streams (hereinafter referred to as “MPEG-PS”) and MPEG-TS inside the recorder. is there.
  • MPEG-PS MPEG program streams
  • Patent Document 1 Japanese Patent Application Laid-Open No. 2003-228922
  • the present invention has been made to solve the above-described problem, and an object of the present invention is to restrict MPEG-TS that can convert content recorded in MPEG-TS format to MPEG-PS format. It is an object of the present invention to provide an information recording medium that records an AV stream in a format, and that enables format conversion of a seamlessly connected stream while maintaining a seamless reproduction function. Another object of the present invention is to provide an apparatus and a method for recording data on such an information recording medium. Means for solving the problem
  • video information and sound encoded in a system stream are provided.
  • An information recording medium in which voice information is recorded together with its management information is provided.
  • a system stream is allowed to have a first format (TS) and a second format (PS).
  • the first format (TS) has a packet structure in which data is divided into packets and stored.
  • the second format (PS) has a knock structure in which data is divided into packs and stored.
  • the first format (TS) allows a restricted format for converting the system stream to the first format (TS) and the second format (PS).
  • a predetermined number of the packets are grouped and managed as a multiplexing unit corresponding to the pack of the second format, and further, in a data management unit (Capsule) including a plurality of multiplexing units.
  • Capsule data management unit
  • the management information includes playback order information (PGC) indicating the playback order of the system stream.
  • PPC playback order information
  • the reproduction order information is described by a combination of one or a plurality of reproduction sections (cells) corresponding to one continuous system stream.
  • the management information further includes, for each playback section, connection information indicating whether seamless playback is to be performed from the playback section in the immediately preceding playback order.
  • connection_code In the information recording medium, if the connection information between playback sections indicates that seamless playback is to be performed by the restricted format, the system stream starts from the beginning of the data management unit (Capsule) immediately after the seamless connection point. The system stream is recorded.
  • an information recording apparatus that encodes video information and audio information into a system stream and records the encoded information together with management information on an information recording medium.
  • a first format (TS) and a second format (PS) are allowed for a system stream.
  • the first format (TS) has a packet structure in which data is divided into packets and stored
  • the second format (PS) has a packed structure in which data is divided and stored in packs.
  • the first format (TS) is a restricted format for converting the system stream to the first format (TS) and the second format (PS).
  • a predetermined number of the packets are grouped and managed as a multiplexing unit corresponding to the pack of the second format, and further, a system stream is performed in a data management unit (Capsule) including a plurality of multiplexing units.
  • the management information includes playback order information (PGC) indicating the playback order of the system stream. Playback order The introductory information is described by a combination of one or a plurality of playback sections (cells) corresponding to one continuous system stream.
  • the management information further includes, for each playback section, connection information (connection_code) indicating whether or not seamless playback is performed in the playback section in the immediately preceding playback order.
  • the information recording apparatus performs a predetermined encoding process on video information and audio information based on a first format (TS) to generate a video elementary stream and an audio elementary stream, and a first encoding unit. Based on the format (TS), controls the second encoding unit that performs system encoding that generates a system stream by multiplying the video elementary stream and the audio elementary stream, and controls the first and second encoding units Control means for performing the operation.
  • TS first format
  • control means When the connection information of one playback section indicates that seamless playback is to be performed, the control means performs the first and second steps so that the system stream immediately after the seamless connection point also starts at the head of the data management unit (Capsule). Control the encoding means.
  • a method of recording video information and audio information encoded in a system stream together with management information thereof on an information recording medium is allowed the first format (TS) and the second format (PS).
  • the first format (TS) has a bucket structure in which data is divided into packets and stored
  • the second format (PS) has a pack structure in which data is divided and stored in packs.
  • the first format (TS) allows a restricted format for converting a system stream from the first format (TS) to the second format (PS).
  • a predetermined number of packets are grouped and managed as a multiplexing unit corresponding to the pack of the second format, and further, a data management unit (Capsule) including a plurality of multiplexing units.
  • System streams are managed.
  • the management information includes playback order information (PGCI) indicating the playback order of the system stream.
  • the reproduction order information is described by a combination of one or a plurality of reproduction sections (cells) corresponding to one continuous system stream.
  • the management information further includes, for each playback section, connection information (connection_code) indicating whether seamless playback is to be performed from the playback section in the immediately preceding playback order.
  • the information recording method is based on the first format (TS). Encoding processing is performed to generate a video elementary stream and an audio elementary stream, and the video elementary stream and the audio elementary stream are multiplexed based on the first format (TS).
  • TS first format
  • the connection information of one playback section indicates seamless playback in the encoding process
  • the system stream immediately after the seamless connection point is encoded so that it starts from the head of the data management unit (Capsule). Is done.
  • the system stream may start with a Tip packet.
  • the content subjected to the multiplexing process of the MPEG-TS format can be rapidly converted into the content subjected to the multiplexing process of the MPEG-PS format. It is possible to do.
  • seamless editing can be easily performed, and seamless playback according to the edited content can be realized on the converted MPEG-PS format content.
  • FIG. 1 is a diagram illustrating an example of the appearance of a DVD recorder device and an interface with related devices.
  • FIG. 2 is a block diagram of a drive device of the DVD recorder.
  • FIG. 3 is a diagram illustrating a continuous area on a disk and an amount of accumulated data in a track buffer.
  • FIG. 8 Diagram showing the structure of a video object
  • FIG. 9 Diagram illustrating MPEG system stream
  • FIG. 13 is a diagram illustrating a PAT table
  • FIG. 19 is a block diagram showing the configuration of functions of a recording device.
  • FIG. 20 is a block diagram showing a configuration of an information recording Z playback apparatus of the present invention.
  • FIG. 21 A diagram for explaining the configuration of a self-recording stream
  • FIG.24 Diagram for explaining the method of storing User Private packets
  • FIG. 25 Diagram for explaining a method of storing a User Private packet
  • FIG. 26 Diagram for explaining a method for storing a User Private packet
  • FIG. 31 A diagram for explaining the internal data structure of a User Private packet
  • FIG.54 Diagram showing the structure of NV—PCK DSI—GI data
  • FIG.63 Diagram explaining a part of the data structure of the packet header of the MPEG2—PS packet.
  • FIG.64 Structure diagram of the AC-3 standard private header in DVD format.
  • FIG.65 Diagram illustrating conversion from Constained SESF to MPEG-PS (video pack)
  • FIG.66 Diagram illustrating conversion from Constained SESF to MPEG-PS (audio pack)
  • FIG. 70 Flow chart of capsule unit processing of TS2PS conversion processing
  • FIG. 75 Flow chart of stream ID processing
  • FIG. 81 Flow chart of padding packet processing
  • FIG.86 A diagram illustrating an efficient multiplexing method using a multiplexing unit aligned with a PES packet including one picture.
  • DVD format conversion from an MPEG transport stream (MPEG-TS) to an MPEG program stream (MPEG-PS) is referred to as “TS2PS conversion”.
  • MPEG-TS MPEG transport stream
  • MPEG-PS MPEG program stream
  • DVD-Video standard format and DVD-Video Rec oriding standard format which are MPEG-PS formats, are collectively referred to as “DVD format”.
  • FIG. 1 is a diagram illustrating an example of the external appearance of a DVD recorder device and an interface with related devices.
  • a DVD recorder is loaded with a DVD, which is an optical disk, and records and reproduces video information.
  • the operation is generally performed with a remote control.
  • Video information input to a DVD recorder includes both an analog signal and a digital signal.
  • An analog signal includes analog broadcasting
  • a digital signal includes digital broadcasting.
  • analog broadcasting is received and demodulated by a receiver built into a television device, and input to a DVD recorder as an analog video signal such as NTSC.
  • STB Set Top Box
  • the signal is demodulated into a digital signal by the parentheses) and input to the DVD recorder and recorded.
  • a DVD disc on which video information is recorded is reproduced by a DVD recorder and output to the outside.
  • Analog signals are directly input to the television device, and digital signals are transmitted to the STB via the STB and converted to analog signals. Input to the television The video is displayed on the display.
  • video information is recorded and reproduced on a DVD disc by a DVD camcorder other than the DVD recorder or by a personal computer. Even if it is a DVD disc on which video information is recorded outside the DVD recorder, the DVD recorder plays it if it is loaded into the DVD recorder.
  • audio information is usually attached to the above-described video information of analog broadcasting and digital broadcasting.
  • the accompanying audio information is similarly recorded and reproduced by the DVD recorder.
  • the video information may be a still image, which is generally a moving image. For example, this is the case when a still image is recorded by the photo function of a DVD camcorder.
  • the digital interface between the STB and the DVD recorder may be IEEE1394, ATAPI, SCSI, or the like.
  • NTSC which is a composite video signal
  • a component signal that separately transmits a luminance signal and a color difference signal may be used.
  • R & D is underway to replace the analog IZF with a digital IZF, such as DVI, for video transmission between AV equipment and television equipment. It is naturally expected that they will be connected.
  • FIG. 2 is a block diagram showing functions of the DVD recorder device.
  • the drive device includes an optical pickup 101 for reading data from a DVD-RAM disk 100, an ECC (Error Correcting Code) processing unit 102, a track buffer 103, a switch 104 for switching input / output of the track buffer 103, an encoder unit 105, A decoder unit 106 is provided.
  • ECC Error Correcting Code
  • the DVD recorder may include a semiconductor memory card / node disk drive as a data storage medium in addition to the DVD disk.
  • FIG. 4 shows a block diagram of a DVD recorder provided with a semiconductor memory card and a hard disk drive.
  • One sector may be 512B, 8KB or the like.
  • the ECC block also has one sector, 16 sectors, 32 sectors, etc. may be used. It is expected that the sector size and the number of sectors that make up the ECC block will increase as the recordable information capacity increases.
  • the track buffer 103 is a buffer for recording AV data at a variable bit rate (VBR) in order to more efficiently record AV data on the DVD-RAM disk 100.
  • VBR variable bit rate
  • D VD The read / write rate (Va) to RAM 100 is a fixed rate, while the AV data has a bit rate (Vb) that changes according to the complexity of its content (image if video).
  • Vb bit rate
  • FIG. 3A is a diagram showing an address space on a disk.
  • Fig. 3 (a) if the AV data is recorded separately in the continuous area [al, a2] and the continuous area [a3, a4], while seeking from a2 to a3
  • Fig. 3 (b) shows the state at this time.
  • the AV data whose reading has been started at the position al is input to the track buffer 103 at time tl, and data output from the track buffer 103 is started.
  • data is accumulated in the track buffer by the rate difference (Va-Vb) between the input rate (Va) to the track buffer and the output rate (Vb) from the track buffer.
  • Va-Vb rate difference between the input rate (Va) to the track buffer
  • Vb output rate
  • N-sec is the number of sectors constituting the ECC block
  • S-size is the sector size
  • Tj is the seek performance (maximum seek time).
  • N ecc Vb * Ti / ((N sec * 8 * S size) * (l— Vb / Va))
  • a defective sector may occur in the continuous area.
  • the continuous area is expressed by the following equation.
  • dN-ecc is the size of an acceptable defective sector
  • Ts is the time required to skip a defective sector in a continuous area. This size is also represented by the number of ECC blocks.
  • N—ecc dN—ecc + Vb * Tj / ((N—sec * 8 * S—size) * (l—Vb / Va))
  • CDA As described above, in DVD-RAM, as long as a certain amount of data or more is continuously recorded, continuous playback Z recording is possible even if AV data is dispersedly recorded on a disc. In DVD, this continuous area is called CDA.
  • FIGS. 5 (a) and 5 (b) show the appearance and physical structure of a DVD-RAM disk as a recordable optical disk.
  • DVD-RAMs are generally loaded into DVD recorders in cartridges. The purpose is to protect the recording surface. However, if the recording surface is protected in another configuration, or if acceptable, it can be directly loaded into a DVD recorder without storing it in a cartridge.
  • DVD-RAM disks record data by a phase change method. Recorded data on the disk is managed on a sector-by-sector basis and is accompanied by an access address.
  • the 16 sectors are units of error correction, are provided with error correction codes, and are called ECC blocks.
  • FIG. 5A is a diagram showing a recording area of a DVD-RAM disk which is a recordable optical disk.
  • the DVD-RAM disk has a lead-in area at the innermost circumference, a lead-out area at the outermost circumference, and a data area between them.
  • a reference signal necessary for stabilizing the servo at the time of access of the optical pickup, an identification signal with another medium, and the like are recorded.
  • the same reference signal as the lead-in area is recorded in the lead-out area.
  • the data area is divided into sectors (2,048 bytes), which are the minimum access units.
  • DVD-RAM realizes rotation control called Z-CLV (Zone Constant Linear Velocity) during recording and playback. For this purpose, the data area is divided into a plurality of zone areas.
  • FIG. 5A is a diagram showing a plurality of zone areas provided concentrically on the DVD-RAM. As shown in the figure, the DVD-RAM is divided into 24 zone areas from zone 0 to zone 23. The rotation angular velocity of the DVD-RAM is set for each zone area so as to be faster in the inner zone, and is kept constant while the optical pickup accesses in one zone. As a result, the recording density of the DVD-RAM is increased, and the rotation control during recording and reproduction is facilitated.
  • FIG. 5B is an explanatory diagram in which the lead-in area, the lead-out area, and the zone areas 0 to 23 shown concentrically in FIG. 5A are arranged in the horizontal direction.
  • the defect management area is an area in which position information indicating the position of a sector in which a defect has occurred and alternative position information indicating in which of the above-mentioned alternative areas a sector replacing the defective sector exists are recorded. ⁇ ⁇ .
  • Each zone area has a user area inside thereof, and has an alternative area and an unused area at the boundary.
  • the user area is an area that can be used as a recording area by the file system.
  • the replacement area is an area used when a defective sector exists.
  • the unused area is an area that is not used for data recording. Unused areas are provided for about two tracks. The unused area is provided because the sector address is recorded at the same position on the adjacent track in the zone.Z-CLV has a different sector address recording position on the track adjacent to the zone boundary. This is to prevent erroneous determination of the sector address.
  • the DVD-RAM assigns logical sector numbers (LSNs) to physical sectors in the user area in the order of the inner circumference so that only the sectors used for data recording are shown continuously.
  • LSNs logical sector numbers
  • FIG. 6 shows a logical data space of a DVD-RAM constituted by logical sectors.
  • the logical data space is called a volume space and records user data.
  • the volume area manages recording data by a file system. That is, the data Volume structure information for managing a group of stored sectors as a file and a group of files as a directory is recorded at the beginning and end of the volume area.
  • the file system according to the present embodiment is called UDF and conforms to the IS013346 standard.
  • the above-mentioned group of sectors is not always arranged continuously in the volume space, but is partially arranged discretely. For this reason, the file system manages, as an extent, a group of sectors that are continuously arranged in the volume space out of the sector group that constitutes the file, and manages the file as a set of related extents.
  • FIG. 7 shows the structure of directories and files recorded on the DVD-RAM. Below the root is the VIDEO-RT directory, under which are stored various object files that are data for playback, and VIDEO Manager files as management information indicating the playback order and various attributes.
  • An object is data conforming to the MPEG standard and includes PS—VOB, TS1—VOB, and T
  • PS—VOB, AOB, and POB are MPEG program streams (PS), and TS1_VOB and TS2-VOB are transport streams (TS).
  • the program stream has a data structure that considers storing AV information in a package medium, while the transport stream has a data structure that considers communication media.
  • PS-VOB, TS1-VOB, and TS2-VOB are objects that have both video information and audio information with a deviation of V and are mainly video information.
  • TS1-VOB is an object in which the encoding is performed by a DVD recorder and the internal picture structure is managed in detail
  • TS2-VOB is an object encoded outside of the DVD recorder. An object whose data structure such as a picture structure is partially unknown.
  • TS1-VOB is an object in which an analog video signal input from an external input is encoded by a DVD recorder into a transport stream
  • TS2-VOB is a digital video signal input from an external source.
  • AOB and POB are MPEG program streams
  • AOB is an object mainly composed of audio information
  • POB is an object mainly composed of still images.
  • MNF Manufacturing's Private Data
  • MNF Manufacturing's Private Data
  • the above-mentioned main subject of video information and main subject of audio information means that the bit rate is allocated to a large amount.
  • VOB is used for applications such as movies, and AOB is used for music applications.
  • FIG. 8 is a diagram showing the structure of MPEG data recorded as various AV objects on a DVD disc.
  • the video stream and the audio stream are each divided and multiplexed.
  • a stream after multiplexing is called a system stream.
  • a system stream in which DVD-specific information is set is called a VOB (Video Object).
  • the unit of division is called a pack'packet and has a data amount of about 2KByte.
  • the video stream is encoded according to the MPEG standard, is compressed at a variable bit rate, and has a higher bit rate for a complex video such as a violent motion.
  • each picture of a video is encoded by being classified into I picture, P picture and B picture.
  • the I picture is subjected to a spatial compression encoding performed within a frame
  • the P picture and the B picture are subjected to a temporal compression encoding utilizing a correlation between frames.
  • a section including at least an I picture is managed as a GOP (Group of Picture).
  • the GOP becomes an access point in trick play such as fast forward play. This is because it has an I-picture compressed in a frame.
  • a multiplexed data unit including video information constituting a GOP and accompanying audio information is referred to as a VOBU (Video Object Unit).
  • the VOBU may include information for managing the moving image section as header information.
  • the system streams described with reference to Fig. 8 include a program stream (PS) and a transport stream (TS).
  • PS program stream
  • TS transport stream
  • the former has a data structure that considers package media
  • the latter has a data structure that considers communication media.
  • FIG. 9 is a diagram for explaining the outline of the data structures of the program stream and the transport stream.
  • the unit of transmission and multiplexing of the transport stream is composed of fixed-length TS packets.
  • the size of the TS packet is 188B, which is compatible with ATM transmission, which is a communication standard.
  • One or more TS packets form a PES packet.
  • the PES packet is a concept common to the program stream and the transport stream, and has a common data structure.
  • the packets stored in the pack of the program stream directly constitute a PES packet, and one or more TS packets of the transport stream collectively constitute a PES packet.
  • the PES packet is the minimum unit of encoding, and stores video information and audio information which are commonly encoded. That is, video information and audio information of different encoding schemes are not stored together in one PES packet. However, picture boundaries and audio frame boundaries need not be guaranteed for the same encoding scheme. As shown in FIG. 9, one frame may be stored in a plurality of PES packets, or a plurality of frames may be stored in one PES packet.
  • FIGS. 10 (&) to (J) and FIGS. 11 (&) to (J) show individual data structures of the transport stream and the program stream.
  • a TS packet is composed of a TS packet header, an applicable field, and a payload portion.
  • the TS packet header contains a PID (Packet Identifier) is stored, whereby various streams such as a video stream or an audio stream to which the TS packet belongs are identified.
  • PID Packet Identifier
  • PCR Program Clock Reference
  • STC reference clock
  • the PES header stores a DTS (Decoding Time Stamp) and a PTS (Presentation Time Stamp).
  • DTS indicates the decoding timing of the picture Z audio frame stored in the PES packet
  • PTS indicates the presentation timing such as video / audio output.
  • FIGS. 1-10 Details of the structure of the TS packet are shown in FIGS.
  • a random access display flag is stored in the applicable field in addition to the PCR, and the flag is used to store a video 'audio frame in the corresponding payload portion. Indicates whether or not to store data that is the head and can be an access point.
  • the header part of the TS packet also stores a unit start indication flag indicating the start of the PES packet, and applied field control information indicating whether or not the applied field is followed by a force.
  • the unit start display flag indicates the start of a new PES packet, and the PID indicates the type and attribute of the stream.
  • FIGS. 11 (a) to 11 (c) show the structure of packs constituting a program stream.
  • the pack has an SCR in the pack header and a stream-id in the packet header of the packet to be stored.
  • the SCR is substantially the same as the PCR of the transport stream, and the stream-id is substantially the same as the PID. Since the data structure of the PES packet is the same as that of the transport stream, PTS and DTS are stored in the PES header.
  • One of the major differences between the program stream and the transport stream is that a multi-program is allowed in the transport stream. In other words, 1 Although only one program can transmit the program stream, the transport stream is assumed to transmit multiple programs simultaneously. For this reason, in the transport stream, it is necessary for the reproducing apparatus to identify whether the video stream and the audio stream constituting the program are different for each program.
  • FIGS. 13 (a) to 13 (c2) show a PAT table and a PMAP table for transmitting configuration information of an audio stream and a video stream constituting a program.
  • the PMAP table stores information on the combination of the video stream and audio stream used for each program
  • the PAT table stores the information on the combination of the program and the PMAP table.
  • the playback device can detect the video stream and the audio stream that make up the program whose output is requested by the PAT table and the PMAP table.
  • 16 sectors constitute an ECC block.
  • PS Pack is arranged at the sector boundary as shown in FIG. 14 (b). This is because both the pack size and the sector size are 2KB.
  • a video object in the form of a transport stream
  • -VOB Visit Time Stamp Information
  • This 8KB unit has an 18B header area, and 43 TS packets with ATS information added are arranged in the data area.
  • ATS information Arriv Time Stamp Information
  • Fig. 14 (c) there is also a storage format of MPEG-TS that is continuously recorded as a set of fixed-byte ATS and MPEG-TS packet.
  • FIGS. 15 (a), (b), 16 (a), and (b) are diagrams showing the data structure of a file called video management information (Video Manager) shown in FIG. [0087]
  • the video management information includes object information indicating management information such as a recording position of various objects on a disc, and reproduction control information indicating a reproduction order of the objects.
  • FIGS. 15A and 15B show PS—VOB # 1 to PS—VOB # n, TSl—VOB # 1 to TSl—VOB # n, and TS2—VOB # as objects recorded on the disc. l to TS2—shows when VOB #n is present.
  • an information table for PS—VOB, an information table for TS1—VOB, and an information table for TS2—VOB are individually set according to the types of these objects. And each information table has VOB information for each object.
  • the VOB information includes general information of the corresponding object, attribute information of the object, an access map for converting the reproduction time of the object into an address on the disk, and management information of the access map. are doing.
  • the general information includes identification information of the corresponding object, the recording time of the object, and the like, and the attribute information includes video stream information including the coding mode of the video stream (V_ATR) and the number of audio streams (AST_Ns). And audio stream information (A_ATR) including the coding mode of the audio stream.
  • the first is to prevent the playback path information from directly referring to the recording position of the object on the disk by the sector address, etc., and to be able to indirectly refer to the playback time of the object. .
  • the recording position of the object may be changed by editing etc., but if the reproduction path information directly refers to the recording position of the object with a sector address etc., it should be updated and reproduced. This is because the route information increases.
  • the reproduction time is indirectly referred to, the reproduction path information need not be updated, and only the access map needs to be updated.
  • an AV stream generally has two references, a time axis and a data (bit string) axis, and there is no perfect correlation between these two references.
  • the tat information has an access map for performing conversion between a time axis and a data (bit string) axis.
  • the reproduction control information has a user-defined reproduction path information table, an original reproduction path information table, and a title search pointer.
  • the playback path includes original definition playback path information that is automatically generated by the DVD recorder so as to indicate all the objects recorded at the time of object recording, and the playback sequence is freely set by the user.
  • the playback path is unified as PGC information (Program Chain Information) on DVD, and the user-defined playback path information is called U-PGC information, and the original playback path information is called O-PGC information.
  • the O-PGC information and the U-PGC information are information for listing cell information, which is information indicating a cell that is a reproduction section of object data, in a table format.
  • the playback section of the object indicated by the O-PGC information is called an original cell (O-CELL), and the playback section of the object indicated by the U-PGC information is called a user cell (U-CELL).
  • the cell indicates the playback section of the object by the playback start time and playback end time of the object, and the playback start time and playback end time are converted into the actual recording position information of the object on the disk by the access map described above. You.
  • the cell group indicated by the PGC information forms a series of reproduction sequences that are sequentially reproduced according to the order of the table entries.
  • FIG. 17 is a diagram specifically illustrating the relationship between an object, a cell, a PGC, and an access map.
  • the original PGC information 50 includes at least one piece of cell information 60, 61, 62, 63.
  • Cell information 60 specifies the object to be reproduced, and also specifies the object type and the reproduction section of the object.
  • the recording order of the cell information in the PGC information 50 indicates the reproduction order when the object specified by each cell is reproduced.
  • One cell information 60 includes type information (Type e) 60a indicating the type of an object designated by the cell information, an object ID (Object ID) 60b which is object identification information, and an object on the time axis. Start time information (Start PTM) 60c and the time axis End time information (End-PTM) 60d and force S in Jetato are included.
  • Type e type information
  • Object ID object ID
  • Start time information (Start PTM) 60c and the time axis End time information (End-PTM) 60d and force S in Jetato are included.
  • the cell information 60 in the PCG information 50 is sequentially read, and the object specified by each cell is reproduced for the reproduction section specified by the cell.
  • the access map 80c converts the start time information and the end time information indicated by the cell information into positional information of the object on the disk.
  • the force information which is the map information described above, is generated and recorded together with the recording.
  • time stamp information such as PTS, which is the playback time of the I picture shown in (c).
  • PS-VOB and TS-VOB1 are mainly generated by a DVD recorder encoding a received analog broadcast into an MPEG stream, as described in FIG. For this reason, the information of I-pictures and various time stamps is generated by itself, and the data structure inside the stream is clear for DVD recorders, and there is no problem in generating map information.
  • TS2-VOB mainly records the received digital broadcast directly to the disc without being encoded by the DVD recorder. For this reason, the position and timestamp information of the I picture are not generated by themselves as in PS VOB! / Therefore, the data structure inside the stream is not clear for DVD recorders, and it is necessary to detect such information even when recording digital stream power.
  • the DVD recorder records an encoded stream outside the recorder !, and detects the I-picture and time stamp of the TS2-VOB map information as described below.
  • the detection of an I picture is performed by detecting the random access display information of the applicable field of the TS packet shown in FIGS. 12 (a) to 12 (d).
  • the detection of the time stamp is performed by detecting the PTS in the PES header.
  • the PCR in the applicable field or the ATS which is the arrival timing at which the TS packet was transmitted to the DVD recorder, may be used instead.
  • the DVD recorder detects the position of the I-picture based on the information of the system layer which is the upper layer without analyzing the data structure of the video layer of the MPEG stream. This is because the load on the system is large to perform the analysis of the video layer to generate the map information.
  • the map management information has map validity information and a self-encoding flag.
  • the self-encoding flag indicates that the object is an object encoded by the DVD recorder itself, indicates that the internal picture structure is clear, and indicates that the time stamp information of the map information and the position information of the I picture are accurate.
  • the map validity information indicates whether there is a valid access map.
  • Examples of cases where the system layer cannot be detected include a case where an applicable field is not set and a case where a digital stream is not an MPEG transport stream in the first place. Because digital broadcasting can be established in various countries around the world, it is naturally expected that DVD recorders record objects for which maps cannot be created. For example, if a DVD recorder that is supposed to be a digital broadcast in Japan is used in the United States and a digital broadcast in the United States is recorded, there are cases where maps cannot be generated and objects are recorded.
  • the DVD recorder can also sequentially reproduce objects from which no map information is generated, from the beginning. In this case, by outputting the recorded digital stream to the STB corresponding to the stream via the digital IZF, the video can be reproduced.
  • the player includes an optical pickup 201 for reading data from the optical disc 100, an ECC processing unit 202 for performing error correction on the read data, and an error correction.
  • Track buffer 203 for temporarily storing read data later, PS decoder 205 for playing program streams such as video objects (PS-VOB), and transport streams for digital broadcast objects (TS2-VOB) TS decoder 206, audio decoder 207 for reproducing audio objects (AOB), still image decoder 208 for decoding still image objects (POB), and data input to each of decoders 205, 206 It comprises a switching means 210 and a control section 211 for controlling each section of the player.
  • the data recorded on the optical disc 100 is read from the optical pickup 201 and stored in the track buffer 203 through the ECC processing unit 202.
  • the data stored in the track buffer 203 is input to one of the PS decoder 205, the TS decoder 206, the audio decoder 207, and the still picture decoder 208, and is decoded and output.
  • control unit 211 determines data to be read based on the reproduction sequence indicated by the reproduction path information (PGC) shown in FIG. That is, in the example of FIG. 16, the control unit 211 reproduces the VOB # 1 partial section (CELL # 1) first, and then reproduces the VOB # 3 partial section (CELL # 2). Finally, control to play back VOB # 2 (CELL # 3).
  • PPC reproduction path information
  • control unit 211 can acquire the type of the cell to be reproduced, the corresponding object, the reproduction start time of the object, and the reproduction end time based on the cell information of the reproduction path information (PGC) shown in FIG. it can.
  • PPC reproduction path information
  • the control unit 211 inputs the data of the section of the object specified by the cell information to a suitable decoder.
  • control unit 211 specifies an object to be reproduced based on the Object ID of the cell information. Further, the control unit 211 specifies a cell that is a reproduction section of the specified object by converting the StartPTM and EndPTM of the cell information into the address of the disk information using the access map of the corresponding VOB information.
  • the player of the present embodiment further has a digital interface 204 for supplying an AV stream to the outside.
  • the AV stream can be supplied to the outside via communication means such as IEEE1394 and IEC958. This is especially true for TS2-VOBs that have not been encoded by themselves, since there may be no corresponding decoder inside the player, so there is no need to directly decode digital interfaces without decoding. It can be output to an external STB through Ace 204 and played back on that STB.
  • the control unit 211 determines whether random access reproduction is possible or not based on the map management information in FIG. 15 (b). If the access point information flag is valid, the access map has the position information of the I picture. Therefore, if there is a request for fast-forward playback or the like from the external device, the control unit 211 can output digital data including an I picture to the external device via the digital IZF in response to the request. If the time access information flag is valid, time access is possible. Accordingly, the control unit 211 can output digital data including picture data corresponding to the specified playback time to the external device via the digital IZF in response to a request for time access of the external device. .
  • the DVD recorder receives a user interface section 222 for displaying to a user and receiving a request from the user, a system control section 212 for managing and controlling the entire DVD recorder, and receives VHF and UHF.
  • Analog broadcast tuner 213, Encoder 214 that converts analog signals into digital signals and encodes them into MPEG program streams, Digital broadcast tuners 215 that receive digital satellite broadcasts, Analysis unit 216 that analyzes MPEG transport streams sent by digital satellites, TV And a display unit 217 such as a speaker, and a decoder 218 for decoding an AV stream.
  • the decoder 218 is also equivalent to the first and second decoders shown in FIG.
  • the DVD recorder further includes a digital interface unit 219, a track buffer 220 for temporarily storing write data, and a drive 221 for writing data to the DVD-RAM 100.
  • the digital interface unit 219 is an interface that outputs data to an external device by communication means such as IEEE1394.
  • the user interface unit 222 first receives a request from the user.
  • the user interface unit 222 transmits the request from the user to the system control unit 212, and the system control unit 212 interprets the request of the user.
  • a processing request is made to each module.
  • Recording includes self-encoding, which encodes input digital data by itself, and art-side encoding, which records encoded digital data on a disk without encoding it.
  • the system control unit 212 requests reception to the analog broadcast tuner 213 and encoding to the encoder unit 214.
  • the encoder unit 214 video-encodes, audio-encodes, and system-encodes the AV data sent from the analog broadcast tuner 213, and sends it to the track buffer 220.
  • the encoder 214 sends the time stamp information included in the head data of the MPEG program stream being encoded to the system controller 212 as the reproduction start time (PS-VOB-VS-PTM). Then, information necessary for creating an access map is sent to the system control unit 212 in parallel with the encoding process. This value is set in Start-PTM of the cell information shown in FIG. 17 generated later.
  • the time stamp information is generally PTS, but SCR can be used instead.
  • the system control unit 212 issues a recording request to the drive 221, and the drive 221 takes out the data stored in the track buffer 220 and records it on the DVD-RAM disk 100.
  • the continuous area (CDA) described above is searched for a recordable area on the disc, and data is recorded in the searched continuous area.
  • the end of recording is instructed by a stop request from the user.
  • the recording stop request from the user is transmitted to the system control unit 212 through the user interface unit 222, and the system control unit 212 issues a stop request to the analog broadcast tuner 213 and the encoder unit 214.
  • the encoder 214 stops the encoding process in response to the encoding stop request from the system control unit 212, and the last data of the MPEG program stream that was finally encoded is
  • the received time stamp information is sent to the system control unit 212 as the reproduction end time (PS-VOB-VE-PTM). This value is set in End-PTM of the cell information shown in FIG.
  • the time stamp information may be replaced by the SCR that normally sets the PTS.
  • the system control unit 212 After the encoding process is completed, the system control unit 212 generates VOB information (PS-VOBI) for PS-VOB and reproduction control information shown in Fig. 15 based on the information that the encoder 214 has also received.
  • PS-VOBI VOB information
  • the generated VOB information includes an access map and map management information suitable for the object type.
  • the system control unit 212 sets the map validity information of the map management information to valid, and turns on the self-encoding flag.
  • an original reproduction path (O—PGC information) shown in FIG. 16, in which the recorded object is one of the reproduction targets, is generated.
  • the generated O-PGC information is added to the original playback path table.
  • the original playback path (O—PGC information) has cell information. “PS—VOB” is set in the type information of the cell information.
  • the system control unit 212 completes the recording of the data accumulated in the track buffer 220 for the drive 221 and the recording of the VOB information (PS-VOBI) for the PS VOB and the reproduction control information. Then, the drive 221 records the remaining data in the track buffer 220 and the information on the DVD-RAM disk 100, and ends the recording process.
  • PS-VOBI VOB information
  • analog broadcasting may be encoded into TS1-VOB.
  • the encoder 214 needs to be an encoder that converts an analog signal into a digital signal and encodes the signal into an MPEG transport stream, and the type information in the cell information is set to “TSl-VO Bj”.
  • Start-PTM and End-PTM may be PTS! Or PCR.
  • the recording by outside-encoding will be specifically described below through the operation of recording a digital broadcast.
  • the type of the recorded object is TS2-VOB.
  • a digital broadcast recording request by a user is transmitted through the user The information is transmitted to the stem control unit 212.
  • the system control unit 212 requests reception to the digital broadcast tuner 215 and data analysis to the analysis unit 216.
  • the MPEG transport stream sent from digital broadcast tuner 215 is transferred to track buffer 220 through analyzer 216.
  • the analysis unit 216 outputs the transport stream as information necessary for generating VOB information (TS2-VOBI) of the encoded MPEG transport stream (TS2-VOB) received as a digital broadcast first.
  • the time stamp information included in the first data is extracted as start time information (TS2-VOB-VS-PTM) and sent to the system control unit 212.
  • the start time information is set in Start—PTM of the cell information generated later and shown in FIG. This time stamp information becomes PCR or PTS.
  • ATS which is the timing at which the object is transmitted to the DVD recorder, may be used instead.
  • the analysis unit 216 further analyzes the system layer of the MPEG transport stream, and detects information necessary for creating an access map. As described above, the position of the I picture in the object is detected based on the random access indicator in the adaptation field in the TS packet header.
  • the system control unit 212 outputs a recording request to the drive 221, and the drive 221 takes out the data stored in the track buffer 220 and records it on the DVD-RAM disk 100.
  • the system control unit 212 instructs the drive 221 as to where to record on the disc from the allocation information of the file system.
  • the above-mentioned continuous area (CDA) is searched from the recordable area on the disc, and data is recorded in the searched continuous area.
  • the end of recording is instructed by a stop request from the user.
  • the recording stop request from the user is transmitted to the system control unit 212 through the user interface unit 222, and the system control unit 212 issues a stop request to the digital tuner 215 and the analysis unit 216.
  • the analysis unit 216 stops the analysis processing in response to the analysis stop request from the system control unit 212, and displays the time stamp information included in the data of the end section of the MPEG transport stream analyzed last to the display end time (TS 2_VOB_V_E_PTM ) To the system controller 212. This value is set in End PTM of the cell information shown in FIG. This The time stamp information is PCR or PTS. Alternatively, ATS, which is the timing when the object is transmitted to the DVD recorder, may be used instead.
  • system control section 212 After the digital broadcast receiving process is completed, system control section 212 generates VOB information (TS2-VOBI) for TS2-VOB and reproduction control information shown in FIG. 15, based on the information received from analysis section 216. .
  • VOB information TS2-VOBI
  • the generated VOB information includes an access map and map management information suitable for the object type.
  • the system control unit 212 sets the map validity information of the map management information to valid when detecting a position or the like of the I picture in the object and generating a valid access map. Also, set the self-encoding flag to OFF. If it is not possible to generate a valid access map, set the map validity information to invalid. Examples of cases where a valid access map cannot be generated include a case where an unsupported digital broadcast is received, and a case where there is no random access information in the applicable field. Also, when the data is directly input from the digital I / F, there may be cases where the MPEG transport stream is not used. In this case, the map validity information is set to be invalid.
  • an original reproduction path shown in Fig. 16 in which the recorded object is one of the reproduction targets is generated.
  • the generated O-PGC information is added to the original playback path table.
  • the original playback path (O—PGC information) has cell information. “TS2-VOB” is set in the type information of the cell information.
  • the system control unit 212 finishes recording the data stored in the track buffer 220 for the drive 221 and records the TS2-VOB VOB information (TS2-VOBI) and the playback control information.
  • the drive 221 records the remaining data in the track buffer 220 and the information on the DVD-RAM disk 100, and ends the recording process.
  • the system control unit automatically starts recording on behalf of the user. And only issues a termination request, but the operation of the DVD recorder is not essentially different.
  • the external input recording request by the user is transmitted to the system control unit 212 through the user interface unit 222.
  • the system control unit 212 requests reception to the external input unit 223 and data encoding to the encoder 214.
  • the MPEG transport stream sent from the encoder 214 is transferred to the track buffer 220.
  • the encoder 214 outputs the encoded MPEG transport stream (TS1
  • the timestamp information included in the first data of the transport stream is set as start time information (TS1—VOB—V—S—PTM) as information necessary to generate VOB information (TS1—VOBI). This is sent to the system control unit 212.
  • the start time information is set in the Start—PTM of the cell information generated later and shown in FIG. This time stamp information is PCR or PTS.
  • the encoder 214 further generates information necessary for creating an access map while generating an MPEG transport stream.
  • an adaptation field is included, a random-access-indicator bit is set, and the start of the VOBU is transferred to the system control unit 212.
  • the system control section 212 outputs a recording request to the drive 221, and the drive 221 takes out the data stored in the track buffer 220 and records it on the DVD-RAM disk 100.
  • the system control unit 212 instructs the drive 221 as to where to record on the disc from the allocation information of the file system.
  • the above-mentioned continuous area (CDA) is searched from the recordable area on the disc, and data is recorded in the searched continuous area.
  • the end of recording is instructed by a stop request from the user.
  • the recording stop request from the user is transmitted to the system control unit 212 through the user interface unit 222, and the system is stopped.
  • the stem control unit 212 issues a stop request to the encoder 214.
  • the encoder 214 receives the recording stop request from the system control unit 212, stops the encoding process, and displays the time stamp information having the data of the end section of the MPEG transport stream that was encoded last. It is sent to the system control unit 212 as the end time (TS1-VOB-V-E-PTM). This value is set in End-PTM of the cell information shown in FIG. This time stamp information becomes PCR or PTS.
  • the system control unit 212 After the recording process is completed, the system control unit 212 generates VOB information (TS1-VOBI) for TS1-VOB and reproduction control information shown in FIG. 15, based on the information received from the encoder 214.
  • VOB information TS1-VOBI
  • the generated VOB information includes an access map and map management information suitable for the object type.
  • the system control unit 212 sets the map validity information of the map management information to valid. Also, set the self-encoding flag to ON.
  • an original reproduction path shown in Fig. 16 is generated, in which the recorded object is one of the reproduction targets.
  • the generated O-PGC information is added to the original playback path table.
  • the original playback path (O—PGC information) has cell information. "TS1-VOB" is set in the type information of the cell information.
  • the system control unit 212 completes the recording of the data stored in the track buffer 220 for the drive 221, the VOB information for the TS1 VOB (TS1—VOBI), and the playback control information.
  • the drive 221 records the remaining data in the track buffer 220 and the information on the DVD-RAM disk 100, and ends the recording process.
  • FIG. 21A shows the structure of a self-encoding MPEG transport stream.
  • a self-encoding MPEG transport stream is divided into VOB U units.
  • a PAT packet a PAT packet
  • PMT packet a user private packet
  • UP packet a user private packet
  • at least the PAT packet and PMT packet are placed at the beginning of the VOB.
  • each packet is provided with ATS as decoder input time information, and each packet is transferred to the decoder at the time intended by the corresponding ATS.
  • the PAT packet of the first packet stores self-encoding program information (such as the PID of the PMT packet) and is input to the decoder at the time of ATS1.
  • self-encoding program information such as the PID of the PMT packet
  • the PMT packet of the second packet stores a PID and the like for each elementary stream constituting the program.
  • PIDs of video, audio, data broadcast (“Data” in the figure), and user private (“private” in the figure) packets are stored.
  • Additional information to the stream is stored in the UP packet of the third packet.
  • stream attributes such as stream title information, recording date and time information, stream coding information (bit rate, video resolution, frame rate, aspect ratio, coding scheme, etc.), and external or analog input Input source identification information to identify the input AV data encoding method if it is digital
  • copyright protection information such as copy permission Z disapproval, VBI (Vertical Blanking Interval) signals, such as closed caption (CC) and teletext data
  • WSS Wide-Screen Signaling
  • Various data useful for converting to MPEG-PS may be stored.
  • FIG. 22 (a) is a block diagram showing the configuration of a basic decoder called a transport stream system target decoder (T-STD), which analyzes a PSI packet which was not mentioned above.
  • FIG. 3 also shows a system decoder 235 for controlling the decoder.
  • PAT and PMT packets which are PSI packets
  • they are discriminated according to the packet type by the demultiplexer 232, and PSI packets related to system control are instantaneously transferred to the transport buffer 233.
  • PSI packets related to system control are instantaneously transferred to the transport buffer 233.
  • the PSI data becomes valid at the moment when the necessary PSI data is available in the system buffer 234.
  • the first PAT, PMT, and UP packets are input to the T-STD at the times indicated by ATS1, ATS2, and ATS3, respectively.
  • n is the byte length of the adaptation-field of the PMT packet.
  • T System clock frequency (SCF) that is the reference clock of STD is 27000000
  • FIG. 23 shows a method of storing an UP packet when the UP packet is defined as a User Private stream.
  • an identification number of 0x80 or more and OxFF or less is assigned to the stream-type of the PMT corresponding to the UP packet, a unique PID is assigned to the UP packet, and the data structure inside the UP packet is outside the MPEG standard. It becomes.
  • the UP packet has a section structure of DVD-attribute-section ().
  • Fig. 24 shows a method in a case where an UP packet has a private-section structure and has a unique PID.
  • the data structure of private-section is slightly different.
  • Unique data of UP packet is stored in private-data-byte of private-section. In this case, an identification number of 0x05 is assigned to the stream-type.
  • FIG. 25 shows a method of storing an UP packet as a packet having the same PID as the PMT.
  • the data structure of the UP packet follows the private-section structure.
  • the stream-type is not defined, and the PID of the PMT packet is assigned to the UP packet.
  • FIG. 26 shows a method of including a PMT packet without separately providing an UP packet.
  • the unique data corresponding to the UP packet has a private section structure, and the private_section is described following the TS_program-map_section. That is, both the TS, the program, the map, the section, and the private section are stored in the PMT ticket!
  • the unique data includes RDI—GI (Rea time Data Information ueneral Information) of the RDI Unit of the DVD Video Recording standard, and DCI It has CCI (Display Control Information and opy Control Information).
  • RDI—GI Rea time Data Information ueneral Information
  • CCI Display Control Information and opy Control Information
  • RDI-GI stores the start playback start time (VOBU-S-PMT) of the corresponding VOBU and recording date and time information
  • DCI-CCI stores the aspect ratio information and subtitle mode information in the VOBU.
  • information related to display control such as film mode information, copy generation management information, APS information, and input source information.
  • V-ATR includes video bit rate information, resolution information, frame rate information (or video-format information such as NTSCZPAL), aspect ratio information, and coding scheme (MPEG2-Video, MPEG1-Video). Etc.) is stored.
  • ATR also includes information such as the bit rate, coding method, number of channels, number of quantization bits, and dynamic range control of all or some audio according to the number of audios. Is stored.
  • CC data storage may be described in advance in the form of extension—and—user—data (l) (a method of storing user data in the GOP layer).
  • CC data may be described in another description method.
  • the power of the CC data in the UP bucket the power of being described as user data in each picture header, or the VOBU (VOB) has no CC data! This is information for identifying whether or not.
  • the WSS storage position information is information indicating whether the WSS storage position information is collectively stored in the UP packet as unique data or described in the user data of each picture header.
  • Teletext storage location information is information indicating whether a TS packet storing Teletext is provided and stored in the user data of each picture header.
  • the TS that constitutes the multiplexed block shown in Fig. 27 data blocks stored only in one elementary stream without being mixed with other elementary streams
  • the number of packets is a fixed number or a variable number, if it is a fixed number, information indicating the fixed number, information indicating whether PTSZDTS is added to the first TS packet of the multiplexed block, the same multiplexed block It describes information about the transfer rate in the ISP.
  • the multiplexing block can be described as a fixed-length size composed of only one TS packet.
  • decoder buffer control information information indicating a video buffer margin such as vbv-delay and vbv-buffer-size, which are parameters of a video verifying buffer, and (information using this information) It is possible to judge how much the video data can be read ahead from the input time of the ATS), the input completion time and the decode time of the frame whose buffer input time is closest to the decode time of the frame in the relevant VOBU. (This information can be used to judge how good it is to read back video and audio data from the ATS input time.)
  • the MPEG-TS conforms to each DVD standard. Information indicating how much load is imposed when transcoding to MPEG-PS
  • the multiplexing block is composed of 2 KB or less and the level 1 indicator, CC, WSS, and Teletext data are present
  • the CC and WSS data are stored in the UP packet
  • the Teletext is video data.
  • the level 2 indicator, CC, WSS, and Teletext data are stored in the area specified by each DVD standard
  • buffer management is stored as a Teletext packet in the multiplex block that stores If it is not necessary to consider buffer management when replacing the ATS of the level 3 indicator and the ATS of the first TS packet of the multiplexed block with the SCR, the level 4 indicator, etc., and the MPEG-TS are converted to the format of each DVD. This is information indicating the convertibility of whether or not conversion is easy.
  • the DVD-Compatibility information is a group of information indicating the ease of conversion corresponding to the DVD format, such as for DVD-Video, for DVD-Audio, for DVD Video Recording, and for DVD Stream Recording.
  • Fig. 27 shows a structure diagram of an MPEG-TS using a multiplex block and a data configuration diagram when the structure is converted into a DVD-Video and DVD Video Recording format.
  • the self-recorded TS stream shown in FIG. 27 (a) is composed of the VO BU (reproduction / decoding unit) of the self-recorded TS stream shown in FIG. 27 (b).
  • one VOBU is composed of multiple multiplexed blocks (corresponding to MPEG-PS packs).
  • Each multiplexing block may be divided into fixed-length data sizes as shown in Fig. 27 (d) (this simplifies implementation on equipment), or as shown in Fig. 27 (e).
  • the data may be divided into variable-length data sizes (in this case, the capacity of the recording medium is not wasted).
  • a multiplexing block is configured by separating a non-elementary stream such as a PSIZSI packet or an UP packet from an elementary stream, respectively.
  • non-elementary streams such as PSIZSI packets and UP packets may be stored together with the elementary streams !.
  • multiplexing block # 1 and multiplexing block # 2 constitute one multiplexing block.
  • the stream can be easily converted to the DVD-Video format shown in Fig. 27 (g) or the DVD Video Recording format shown in Fig. 27 (h).
  • MPEG-PS packs are formed according to the arrangement of multiplexed blocks, and one multiplexed block is a unit that stores one pack of data. This is important for easy TS2PS conversion. It is.
  • Fig. 27 the capsule header and the ATS are omitted because they have low relevance to the present invention.
  • the converted MPEG-PS packs shown in Figs. 27 (g) and (h) are stuffed and padded according to the byte length of the elementary to be stored and the VOBU alignment.
  • Fig. 28 is a diagram illustrating the multiplexing in the present invention corresponding to the conventional stream multiplexing method shown in Fig. 8.
  • the final format is a format conforming to the MPEG-TS shown in FIG. 28 (g).
  • the video stream (FIG. 28 (a)) is composed of a plurality of GOPs (FIG. 28 (a)).
  • Each GOP has a predetermined picture data capacity, and a TS packet group having a data amount equivalent to the data amount of one pack when converted to MPEG-PS is defined as one multiplexed block (see Fig. 28 (c)). ). That is, one multiplexed block is divided into a plurality of TS packets corresponding to the data amount of one pack as shown in FIG.
  • FIG. 28 (d) shows that data having a data amount corresponding to the data amount of one pack of MPEG-PS is collectively arranged as a multiplexed block (see FIG. 28 (e)). This is the biggest difference from the conventional example.
  • ATSi + (number of packets in multiplexed block) X ⁇ ATS ⁇ ATSi + l
  • the multiplex block has a fixed length, the number of TS packets contained in one multiplex block is Since it is constant, the boundary of the multiplexed block can be easily known. However, when the multiplex block has a variable length, the number of TS packets included in one multiplex block is undefined, making it difficult to know the boundary of the multiplex block. Therefore, in this case, the increment ( ⁇ ATS) of the ATS value at the boundary of the multiplex block is set to a predetermined value different from the increment (fixed value) in the multiplex block.
  • the difference ( ⁇ ATS) between the ATS value of the last packet in the previous multiplexed block and the ATS value of the first packet in the immediately following multiplexed block is set to a predetermined value different from the fixed value. I do.
  • the boundary of the multiplexed block can be known.
  • TS packets and packs for conversion to MPEG-PS can be associated one-to-one.
  • ATSi satisfies the following relationship.
  • ATSi + (number of packets in multiplexed block) X ⁇ ATS ⁇ ATSi + l
  • the ATSi added to the first packet of the multiplexed block in the MPEG-TS corresponds to the SCRi added to each converted MPEG-PS pack.
  • character information such as Closed Caption and DSI may be stored in the UP packet.
  • the DSI in the UP packet is used to generate the converted NV-PCK data, and the closed caption is stored in the video pack.
  • a packet storing Teletext data in a multiplexing block may be inserted between packets storing video data in a multiplexing block as shown in FIG. 30 so as to correspond to the PAL standard in Europe. At this time, the packet storing the Teletext data is placed immediately before the picture with the PTS displayed at the same time. Teletext data is stored in a video pack after conversion.
  • Figure 31 shows the data structure of the UP packet that stores DSI and the like as described above.
  • information specifying the TS packet storing the last byte of the I picture at the head of the VOBU may be described in the additional information of the UP packet. Good special reproduction can be realized.
  • some I and P pictures in the VOBU, picture coding type information of all pictures, and data length information of the pictures (for example, information specifying a TS packet including the last byte, etc.) By describing information indicating the DTSZPTS of each picture, special playback can be supported.
  • the head of the access unit is placed at the head of the pack after TS2PS conversion. This can be expected to simplify DVD-specific header processing.
  • TS packets forming a multiplexed block may be appropriately stuffed so that data stored in the pack does not overflow. However, the necessary number of bytes may be inserted from the last TS packet of the multiplex block.
  • the present invention is not limited to this.
  • the present invention is not limited to this.
  • An MPEG-PS converted stream may be recorded on the same or another recording medium.
  • the PAT, PMT, and UP packets are recorded at the beginning of each VOBU.
  • the PAT, PMT, and UP packets may be recorded at least at the beginning of the VOB, or at least at the beginning of the playback management unit Cell It is good to record in,.
  • the PAT, PMT, and UP packets are fixedly arranged at the beginning.
  • the present invention is not limited to this. Packets storing NuU packets are inserted and recorded. Is also good.
  • the self-encoding stream is assumed to start with a PAT packet.
  • the present invention is not limited to this, and may start with a NuU packet.
  • system transfer rate may be set to a fixed rate by appropriately inserting NuU packets into a self-encoding stream.
  • a data area for storing manufacturer-specific information may be provided, and MPEG-TS system encoding conditions may be described therein.
  • an encoder of the information recording apparatus focusing on an encoding process of receiving an AV input and performing self-encoding on an MPEG-TS.
  • FIG. 33 shows the configuration of the encoder of the information recording device according to the present invention.
  • the encoder 214 works with each of the elementary encoders 230a, 230b, 230c and the system encoder 232.
  • the encoder 214 receives a control signal from the system control unit 212, and performs an encoding process while switching to elementary encoding or system encoding by the elementary encoders 230a, 230b, 230c and the system encoder 232.
  • Each of the elementary encoders 230a, 230b, 230c receives signals of video, audio, and VBI (Vertical Blanking Interval), and performs encoding.
  • VBI Very Blanking Interval
  • the video encoder 230a receives the control signal from the system control unit 212, and encodes the attributes such as the bit rate, resolution, and aspect ratio of the video stream within a predetermined range according to the control signal. Specifically, the video encoder 230a specifies an operation mode of “DVD-Video compatible mode”, “DVD Video Recording compatible mode”, or “normal mode” from the system control unit 212 at the start of encoding. Receives control signal. If the mode specified by the control signal is “DVD-Video compatible mode”, a video stream conforming to the DVD-Video standard In the “g compatible mode”, a video stream conforming to the DVD Video Recording (hereinafter referred to as “DVD VR”) standard video attribute is used. In the “normal mode”, a video stream conforming to a certain category of attribute is used. Generate a video stream.
  • the audio encoder 230b receives the control signal from the system control unit 212, and encodes the attributes of the audio stream such as the bit rate, the number of quantization bits, and the number of channels in a predetermined range according to the control signal.
  • a control signal indicating an operation mode is received from the system control unit 212, and if the mode indicated by the control signal is “DVD-Video compatible mode”, the DVD-Video standard audio If the audio stream conforming to the attribute is "DVD Video Recording compatible mode", the audio stream conforming to the DVD VR standard audio attribute is conformed to the "normal mode”. Create an audio stream.
  • VBI encoder 230c also receives a control signal designating an operation mode from system control section 212, and encodes VBI data according to the control signal. Specifically, the VBI encoder 230c specifies that the elementary stream encoding control signal input from the system control unit 212 to the VBI encoder specifies "DVD-Video compatible mode" or "DVD Video Recording compatible mode". In some cases, VBI data is additionally encoded according to the storage method of VBI data specified in each standard. The additional encoding means that the method of storing VBI data in the original normal mode may be separately determined, so that it is stored in the elementary stream in duplicate.
  • the encoded elementary streams are multiplexed into the MPEG-TS system stream by the system encoder 232, respectively.
  • the system encoder 232 also receives an encoding control signal from the system control unit 212 in the same manner as each of the elementary stream encoders 230a, 230b, and 23Oc, and performs an encode according to the control signal.
  • the control signal from the system control unit 212 to the system encoder 232 restricts the system encoding control signal power to the normal MPEG-TS, the normal MPEG-TS, and the MP EG-PS (particularly a DVD-specific format). ) Can be easily converted to a system encoding control signal (DVD-Video mode DVD Video Recording mode). is there.
  • the system encoder 232 converts the elementary stream to which each of the elementary stream encoders 230a, 230b, and 230c has also been input into the MPEG-TS system stream.
  • System encoding is performed while performing buffer management so that the decoder model (hereinafter referred to as “T-STD”), which serves as the reference for the system, does not fail.
  • T-STD the decoder model
  • control signal from the system control unit 212 is a control signal designating system encoding to MPEG-TS that can be easily converted to MPEG-PS, a more special system encoding rule in addition to the above is used. Encode while protecting.
  • the self-encoded MPEG-TS system stream generated in this way is output from the encoder 214.
  • the information recording apparatus of the present invention is characterized in that the encoding mode is individually switched between the elementary stream and the system stream level.
  • FIG. 34 shows a table summarizing the process of converting the encoding mode to the DVD format for each encoding mode by switching the encoding mode.
  • information indicating the encoding condition of the stream is stored in the VOBI storing attribute information and the like in MPEG-TS stream units.
  • information indicating the encoding conditions in the management information instead of in the stream, whether or not the stream can be easily converted to the DVD-Video or DVD VR format without analyzing the stream. Can be quickly determined. Note that the encoding conditions of this stream are shown.
  • Information may be stored in the Tip packet described below!
  • the MPEG-PS is originally encoded without considering the high-speed conversion to the PS, and the individual MPEG- It is conceivable that MPEG-PS, which can be easily converted to PS, is linked into one stream.
  • FIG 80 shows the overall stream structure of Constrained SESF.
  • Constrained S ESF consists of multiple SESF capsules.
  • the SESF capsule contains a predetermined multiplexing unit and has a Tip packet (details will be described later) at the beginning.
  • the reproduction time information (PTS) of each SESF capsule and the address information of the Tip packet are associated by the access map 80c.
  • TS2PS conversion uses this SESF Conversion processing is performed for each capsule.
  • Fig. 32 is a diagram showing the correspondence between each packet in one SESF capsule and MPEG-PS packs.
  • a TS packet (hereinafter, referred to as a “Tip packet”) that stores stream-specific information is inserted into the Constrained SESF.
  • Tip packet a TS packet that stores stream-specific information
  • the Tip packet embedded in the Constrained SESF will be described with reference to FIGS. 35 to 41.
  • FIG 35 shows the overall structure of a Tip packet.
  • the Tip packet corresponds to the Data-ID for identifying the packet as a Tip packet and the DCI-CCI field of DVD VR, and includes display control and copy control information.
  • Fig. 37 shows the structure of Data-ID.
  • Data-ID has a Data-Identifier for identifying that the packet is a Tip packet.
  • FIG. 38 shows the structure of display—and—copy—info.
  • this display—and—copy—info the same structure and information as the DCI—CCI of the DVD VR standard RDI Unit, the generation of the RDI pack when converting the Constrained SESF to the DVD VR format is performed. Easy going.
  • DCI-CCI of the DVD VR standard are disclosed in “DVD Specifications for Rewritable / Re-recordable Disc Part 3 VIDEO RECORDING” and Patent No. 3162044. In these documents, Some field names are different The definition of each field is the same so that it can be copied as it is when converting to DVD VR format.
  • Fig. 39 shows the structure of encode info.
  • the video resolution field contains a Tip The resolution information of the video stream following the packet is described.
  • encode—info values are shown below.
  • 0000b 720x480 (NTSC), 720x576 (PAL)
  • 0100b 544x480 (NTSC), 544x576 (PAL)
  • 0101b 480x480 (NTSC), 480x576 (PAL)
  • the resolution may be variable during one continuous recording.
  • streams with different resolutions are managed as separate VOBs, and some recorders guarantee seamless connection during playback. Therefore, when resolution changes occur during Constrained SESF recording, this field is used to determine which point force VOB needs to be separated when converted to DVD VR format.
  • the encode-condition field is the same as the value stored in VOBI (except when 00b).
  • the reason for storing the encode-condition field by embedding it in a stream that is not limited to stream management information is that even if the stream is copied via a digital interface represented by IEEE1394, the This is because the recording device can easily determine whether or not the data can be converted to the DVD format by checking the encode-condition field in the tip packet.
  • the VOBU-S-PTM of the DVD VR standard is recorded in the FVFPST field. This means that when converting Constrained SESF to DVD-Video / VR format, it analyzes the video stream that is encoded following the Tip packet and calculates the playback time of the video field that is displayed first. This is to omit the processing.
  • the FVFPST field is composed of a 32-bit field that represents the display time of the video field with 90 KHz precision, and a 16-bit field that is not represented with 27 MHz precision.
  • Fig. 40 shows the structure of PES-info.
  • PES-info is essential information for converting Constrained SESF to DVD-Video format without analyzing elementary streams. This information is needed to generate information called NV-PCK inserted into the DVD-Video stream and stored in a pack for supporting trick play.
  • PES-info it is possible to store information of a PES packet storing a total of 136 pieces of video data and audio data. Each PES packet is assigned four bits of data, so that NV-PCK information can be generated without analyzing the inside of the PES packet. If there is a PES packet that does not store video or audio data, the PES packet is ignored.
  • the PES—existence—flag indicates that the j-th PES packet is included in the corresponding SESF Capsule. This is a flag indicating whether or not it exists.
  • the value of PES—existence—flag is set as follows:
  • the PES-payload-identifier is information for identifying whether the data is video data or audio data stored in the PES packet.
  • the value of PES-payload-identifier is set as follows.
  • the PES—existence—flag and PES—payload—identifier are fields that describe all PES packets of interest. [0265] Now, when it is determined that video or audio is stored by the PES-payload-identifier, subsequent field definitions differ depending on the type of stream stored in the PES packet.
  • Picture_coding_type indicating I is defined.
  • the value of picture _ coding —type is set as follows.
  • 01b Frame-encoded I-picture or pair of field-encoded I-pictures, or pair of field-encoded I-pictures and field-encoded P-pictures
  • the picture 01b or 10b is a picture serving as a reference picture defined by the DVD-Video standard.
  • the above is the additional information for the PES packet storing the video.
  • the audio stream stored in the PES packet follows the PES—payload—identifier.
  • the stream identifier which identifies whether the audio stream is a second audio stream or not
  • the FVFPST the playback start time of the first displayed video field
  • the identification of the first audio stream or the second audio stream is based on the PID setting rules and PMT. And the order of the elementary stream declarations.
  • sync—presentation—flag The value of sync—presentation—flag is set as follows.
  • the audio PES packet contains an audio frame that starts playing at the same time or immediately after FVFPST !, na! / ,.
  • the audio PES packet stores an audio frame to be reproduced at the same time as or immediately after FVFPST.
  • PES-info is a field for extracting and storing information for each PES packet following the Tip packet in this way.
  • Fig. 41 shows MakersPrivateData.
  • MakersPrivateData is provided with a maker-ID for specifying a maker that has generated the Constrained SESF and maker-private-data in which the maker describes unique additional information.
  • Figs. 42 (a) and 42 (b) show an example of the PID of the Tip packet and the stream_type value indicating the stream type. Since there are values reserved for MPEG and other standards for both PID and stream-type, the above values were selected taking into account that they do not interfere with them and that they are private data outside the MPEG standard.
  • the attribute information of various streams is extracted and stored in the Tip packet stored in the Constrained SESF. Details of how the above-described fields are used when converting to the DVD format will be described later.
  • the TS packet that stores the elementary stream in the Constrained SESF is composed of a multiplexing unit (Multiplexing Unit) that is a unit that collects data stored in a 2 KB pack in DVD format.
  • This multiplexing unit (Multiplexing Unit) corresponds to the multiplexing block of the first embodiment.
  • a TS that stores one type of elementary stream in one Multiplexing Unit Only packets are stored and are not mixed with TS packets that store other types of elementary streams. Also, mixing with NULL packets is not prohibited because it may be necessary when configuring one multiplexing unit (for example, a multiplexing unit that stores the last part of a stream). This is also necessary to clarify the relationship between Multiplexing Units and packs.
  • One Multiplexing Unit is composed of eleven consecutive TS packets, and the elementary stream (payload data) in each Multiplexing Unit is completely stored in one corresponding pack. This also limits the relevance of the pack.
  • the first complete audio frame data starting in the Multiplexing Unit must be the first audio frame in the PES packet payload! /.
  • some fields of the PES packet header allow only a fixed value. This is to avoid extra processing when converting to the DVD format.
  • the extra processing means processing a field which is additionally generated by a value different from the value defined in the DVD format and disappears.
  • the purpose of restricting the PES packet header is to minimize fields added to or deleted from the header during TS 2PS conversion.
  • the value of PES-packet-legnth may be allowed to be 0.
  • PTS-DTS-flags is a flag indicating whether or not PTS and DTS are described.
  • the PES-extension-flag and the PES-header-data-legnth have restrictions for performing sequential processing in TS packet units at the time of TS2PS conversion. This is shown in FIG.
  • Each value is defined by the value of —condition.
  • the VPD in Fig. 44 has a byte length obtained by adding the PTS field and the DTS field of the PES packet. That is,
  • the decoder input time indicated by the ATS (ATS1) of the Tip packet and the decoder input time indicated by the ATS (ATS2) of the TS bucket that stores the video or audio stream that is first input to the decoder following the Tip packet Must satisfy the following relationship.
  • T is the minimum transfer period of the PS pack. This minimum transfer period is the minimum period from when the PS pack starts to be input to the system decoder to when it is completed. That is, the above formula indicates that the ATS interval of each TS packet needs to be at least longer than the interval at which the converted PS pack can be input to the system decoder.
  • the value of T is as follows.
  • PS packet—size is the byte length of one pack in MPEG-PS generated by TS2PS conversion
  • system clock—frequency is the frequency of the reference time of the MPEG—PS decoder
  • PSrate is TS2PS conversion. This is the multiplexing rate of the MPEG-PS stream generated by.
  • system-- clock-- frequency 27000000 Hz
  • ATS1 + 43886 ATS2 is the minimum value of ATS2.
  • the tip packet is converted into a 2 KB pack of NV_PCK (for DVD-Video conversion) or RDI-PCK (for DVD VR conversion). Otherwise, the transfer time of the subsequent elementary stream will be advanced, exceeding the DVD system transfer rate of 10.08 Mbps.
  • the time width on the playback time axis of video data stored in one SESF capsule must be no less than 0.4 seconds and no more than 1.0 seconds.
  • encode-condition 11b (DVD-Video mode)
  • each Tip packet be pointed one-to-one with an access map that performs time-to-address conversion.
  • VOBU units which is the so-called DVD format
  • DVD-Video format the Tip packet is converted to NV-
  • NV Necessary to create DSI (Data Search Information), which is address information for neighboring VOBUs stored in PCK, from the access map.
  • the access map stores the playback time (part or all of the AV playback time information immediately after the Tip bucket according to FVFPST) and the recording address of the Tip packet for each Tip packet, It is sufficient to know how many Multiplexing Units are stored between two consecutive Tip packets. This is achieved by the following constraints.
  • the number of packets does not need to be limited to 32, but must be a certain number.
  • the number of TS packets following the Tip packet can be specified from the address information of the Tip packet in the access map. // If you know if there are shoes in the packet, you can specify how many packs will be included in the VOBU when converting to DVD format.This is important. It may be described in MakersPrivateData.
  • the reason for setting the number to 32 is that the PAT and PMT packets indicating the program configuration information of the MPEG-TS are embedded at least once every 100 msec, and the SIT packet storing the unique information for each program is at least one. It is embedded at least once per second, the PCR packet that stores the PCR (Program Clock Reference) that creates the decoder reference time is embedded at least once every 100 msec, and it is NULL that does not belong to any Multiplexing Unit. Because packets can be freely added and the insertion interval of Tip packets is less than 1.0 second on the AV data playback time axis, at least 31 PATs, PMTs, PCRs, All you need is a SIT packet. Therefore, by inserting PAT, PMT, PCR, and SIT packets according to the time between two consecutive TiP packets and adding NULL packets until the number of packets reaches 32, the number of VOBU packs can be increased. Power can be identified.
  • the number of VOBU packs is 1 + Multiplexing Unit
  • the above is the limitation on the Tip packet insertion interval.
  • the encoder that generates Constrained SESF performs system encoding within the above restrictions.
  • the Constrained SESF needs to be created to satisfy the standards of T-STD, which is the MPEG-TS standard decoder model. This means that even a STB equipped with a T-STD compliant decoder can decode the Constrained SESF as long as the stream type matches.
  • the TS-STD which is the MPEG-TS reference decoder model
  • the P-STD which is the MPEG-PS reference decoder model
  • the T-STD is described with reference to FIG. 18, and the transport buffer capacity before the audio decoder is fixed at 2 Mbps, except for the transfer rate to the audio buffer except for AAC.
  • P-STD can send various streams to the decoder at the system rate, that is, at the rate of 10.08 Mbps for DVD.
  • the Constrained SESF of the present invention is encoded in advance so as to be compliant with T-STD and also compliant with MPEG-PS power P-STD generated by a conversion method described later. There is a need.
  • the Constrained SESF is a stream encoded in MPEG-TS so that it becomes P-STD compliant even after being converted into MPEG-PS.
  • the SESF does not care about these things, but only encodes to match T-STD.
  • Fig. 45 shows an example of a self-encoded MPEG-TS that does not satisfy the T-STD model that can be converted to MPEG-PS.
  • the stream TS1 is an MPEG transport stream system-encoded to conform to the T-STD model.
  • Stream TS2 is an MPEG transport stream that does not conform to the T-STD model. That is, in stream TS2, the ATS [47] power and the value of ATS [57] are set so as to exceed the transfer rate allowed for audio data in MPEG-TS.
  • the transport buffer (see Figure 18) overflows and does not satisfy the T-STD model!
  • stream TS1 is set so that the value of ATS [47] and ATS [57] satisfies the transfer rate allowed for audio data in MPEG-TS. From this stream, it can be correctly converted to the P-STD compliant MPEG program stream PS1 by the SCR conversion formula described later. Also, the stream TS2 does not satisfy the T-STD, but generates PS1 if it is converted by the SCR conversion formula described later. In order to convert stream TS2 to T-STD compliant MPEG-TS, the transmission time interval of audio packets specified by ATS [47] ATS [57] must be extended so that the transport buffer does not overflow. is necessary.
  • FIG. 46 (a) and 46 (b) show that T-STD satisfies MPEG-TS converted MPEG — An example where PS does not satisfy the P-STD model.
  • Stream TS3 is an MPEG transport stream
  • stream PS3 is an MPEG program stream converted from MPEG transport stream TS3.
  • FIG. 46 (b) shows a change in the state of the video data buffer when each stream is decoded.
  • the decoding time of PES # 1 picture is SCR [2]
  • the decoding time of PES # 2 picture is between SCR [4] and SCR [5].
  • the stream of Constrained SESF has the structure shown in Fig. 14 (c).
  • a PCR packet containing reference time information (PCR) is appropriately inserted in the TS packet, and this is used to reset the decoder reference time STC (System Time Clock) at a certain time interval. Is possible.
  • each TS packet is preceded by an ATS that stores relative transmission time information between the TS packets. Therefore, TS packets transmitted after the TS packet storing the PCR are input to the decoder at a timing that can be obtained with the PCR value and ATS, which is relative transmission time information between TS packets.
  • the decoder input time of each TS packet (hereinafter referred to as “the Below, called “calculated—PCR”). Even when there is no TS packet storing the PCR, it is also possible to extract information corresponding to the PCR as management information.
  • Fig. 47 is a diagram showing the relationship between calculated-PCR and SCR when converting Constrained SESF to MPEG-PS, and is the beginning of the Capsule shown in Fig. 80.
  • the ATS given to each TS packet in ascending order of the stream head power is denoted as ATS [k].
  • the SCR of the converted pack is also described as SCR [i] in the order of appearance.
  • PCR-tip and ATS-tip are the PCR value described in the Tip packet immediately before the Multiplexing Unit to be converted and the ATS value of the Tip packet.
  • WA indicates the number of overflows in the ATS (ATS [n]) assigned to the first TS packet in the ith Multiplexing Unit and the ATS between the ATS—tip and BS represents the amount of one overflow of ATS.
  • Max (a, b) is a function that selects the larger value of a and b.
  • PS—pack—size is MPEG—PS pack 1 generated by TS2PS conversion. This is the byte length for each item.
  • sy stem—clock—frequency is the frequency of the reference time of the MPEG—PS decoder, and P Srate is the multiplexing rate of the MPEG—PS stream generated by TS2PS conversion. That is,
  • system-- clock-- frequency 27000000 Hz
  • PSrate 10080000 bits Z seconds.
  • the power to be transmitted after the minimum transfer time determined by the transfer rate has elapsed from the transmission time of the immediately preceding pack, and the decoder input time of the first TS packet forming the knock There are two patterns: If the video data is transmitted earlier than the time when the video data was converted to the DVD format, the former is selected with the former minimum transmission time interval. For example, if the video data is transmitted earlier than the time when it was converted to the DVD format, it will be transmitted after the minimum transfer time specified by the transfer rate has elapsed from the transmission time of the previous pack.
  • PTS (DVD—Video) PTS (Constrained SESF)-calculated—PCR [0]
  • DTS (DVD—Video) DTS (Constrained SESF)-calculated—PCR [0] ATS [n]
  • WA is i as described above. The ATS value of the first TS packet of the multiplexing unit and the number of overflows from ATS-tip.
  • SCR [0] is set to 0, and subsequent SCRs are calculated using the values calculated by the above-mentioned conversion formula and offset by the time calculated—PCR [0]. — All PTSs and DTSs in the Video stream are uniformly calculated—Offset by PCR [0].
  • PTSZDTS value conversion occurs, but can be easily realized by sequential processing in units of TS packets.
  • the SCR is also calculated for the ATS force based on the above equation.
  • the program stream obtained by TS2PS conversion must conform to the P-STD model, so the SCR value is limited to a certain range. Therefore, the value of ATS given to each packet of Constrained SE SF needs to be set in consideration of the above ATS-SCR relational expression.
  • the streams allowed for the Constrained S ESF described below are described as only two types of video: MPEG2-Video for audio, and AC-3 and MPEG1-Audio for audio.
  • encoding of audio data is not limited to this, and an encoding method such as AAC (Advanced Audio Coding) used in BS digital broadcasting may be used.
  • This attribute may change in the TS packet that stores the first elementary stream following the Tip packet. In other words, it can be changed only in the first video or audio TS packet in the SESF Capsule.
  • Note3 The horizontal-size, vertical-size, and aspect- ratio-information; ⁇ The same sequence_headerf ⁇ must be used with the sequence_end_code.
  • This attribute may change within the same VOB as long as it is between monaural, stereo, and dual mono.
  • Fig. 50 shows a stream structure of the DVD-Video standard format.
  • each stream includes a plurality of VOBs, and each VOB includes an integer number of VOBUs.
  • VOB U consists of an integer number of packs, with NV-PCK at the beginning, followed by video packs (V-PCK) followed by audio packs (A-PCK).
  • NV—PCK differs from the structure of a normal DVD pack in that it contains two packets.
  • Each packet is called a PCI (Presentation Control Information) packet and a DSI (Data search Information) packet, and the PCI packet stores reproduction control information for the VOBU.
  • Information useful for special playback such as the positional relationship between the VOBU and the surrounding VOBUs, etc. The fields are described below, along with the generation method.
  • Fig. 51 shows the structure of PCI data of NV-PCK.
  • PCI data includes PCI GI (PCI General Information), which stores general PCI information, and non-seamless angle information. It consists of NSML—AGLI, HLI, which is information for highlighting menu buttons, etc., and RECI, which stores the International Standard Recording Code (ISRC).
  • PCI GI PCI General Information
  • HLI HLI
  • RECI which stores the International Standard Recording Code
  • NSML-AGLI and HLI are described with data meaning invalid when converted from Constrained SESF.
  • Fig. 52 shows the structure of NV-PCK PCI-GI. In the following, the method of calculating only the fields that need to be calculated when converting from the Constrained SESF force will be described.
  • the NV-PCK-LBN (relative address of the NV-PCK in the VOBS file) can be generated by counting the number of packs that the information recording device becomes during conversion.
  • the VOBU-CAT (analog copy protection status information) can be obtained from the display-and-copy-info of the Tip packet corresponding to NV-PCK.
  • VOBU—S—PTM playback time information of the video field displayed first in VOBU
  • FVFPST power of the Tip packet corresponding to NV—PCK can also calculate the FVFPST power of the Tip packet corresponding to NV—PCK.
  • VOBU-E-PTM time information of the time when the video data in the VOBU completes playback
  • it can be generated by calculating the time at which video playback ends.
  • VOBU—SE—E—PTM time information of the end of playback by sequence—end—code in the video data in VOBU
  • sequence—end—code is recognized only at the end of the VOB ( In the VOBU in the middle of the stream, “0x00000000” is filled without sequence-end-code power.
  • NV-PCK with Sequence-end-code in the last VOBU has the same value as VOBU-E-PTM.
  • C ELTM (NV—Time difference information between the playback time of the video frame displayed first in the CELL in which the PCK is stored and the video frame displayed first in the VOBU.
  • NV Time difference information between the playback time of the video frame displayed first in the CELL in which the PCK is stored and the video frame displayed first in the VOBU.
  • NV-PCK PCI data can be generated at any time in VOBU units during conversion.
  • Fig. 53 shows the structure of the DSI of NV-PCK.
  • the DSI data stores DSI—GI (Data Search Information General Information) that stores general information of the DSI, and recording addresses and playback information necessary for seamless playback between VOBs.
  • SML—AGLI (Angle Information for seamless) that stores layout information for seamless playback between different angles, and recording address information of VOBUs near the VOBU It consists of VOBU_SRI (VOB Unit Search Information) and SYNCI (Synchronous Information) which is information for synchronous playback of video and audio Z sub-pictures.
  • VOBU_SRI VB Unit Search Information
  • SYNCI Synchronous Information
  • SML-AGLI describes data that indicates invalid when converted from Constrained SESF.
  • Figure 54 shows the structure of DSI-GI of NV-PCK. Constrained
  • NV—PCK—SCR (NV—SCR value of PCK) is constrained by a calculation method described later.
  • NV_PCK_LBN (NV_PCK relative address in the VOBS file) is the same as PCI data and its calculation.
  • VOBU EA (NV—relative address from PCK to the last pack in VOBU) can also calculate access map power.
  • NV relative address from PCK to the last pack in VOBU
  • EA access map power.
  • the number of TS packets up to the next entry is calculated from the access map.
  • subtract the number of TS packets that do not belong to the Multiplexing Unit in the TS knocket and divide the result by 11 to calculate how many packs are formed following NV-PCK .
  • the number of packs generated after conversion may be counted and described.
  • VOBU—3 RDREF—EA in VOBU, relative address from NV—PCK to the last pack of the third reference picture
  • VOBU—3 RDREF—EA If you perform TS2P S conversion while referring to, it is possible to derive without having to analyze up to the video stream layer
  • PES—info describes the PES packet power of each video, what encoded picture it is, and picture_coding_type3.
  • the PES packet having picture_coding_type 01b, 10b stores a reference picture according to the DVD-Video standard.
  • the first, second, and third reference pictures are determined by which knock It is possible to determine the complete address, and to describe the relative address to the end of each of the VOBU—1STREF—EA, VOBU—2NDREF—EA, and VOBU—3RDREF—EA of the NV—PCK at the beginning of the VOBU. .
  • PTS-DTS-flags lib
  • PTS—DTS—flags 10b
  • VOBU_VOB_IDN (the ID number of the VOB to which the VOBU belongs) should be able to be obtained by the information recording device during conversion.
  • the VOBU-C-IDN (ID number of the CELL to which the VOBU belongs) is a number set by the information recording apparatus itself during conversion, and has no relation to a stream.
  • management information such as PGC information of Constrained SESF, only the number corresponding to the division is assigned.
  • C—ELTM time difference information between the playback time of the first displayed video frame of the CELL containing NV—PCK and the first displayed video frame in the VOBU; frame accuracy is required
  • the fields of DSI-GI of NV-PCK can be generated at any time in VOBU units during conversion.
  • Fig. 55 shows the structure of NV-PCK SML-PBI. The following describes how to calculate only those fields that need to be calculated when converting from Constrained SES F.
  • VOB_V_S_PTM (NV—time information of the video frame displayed first in the VOB to which the PCK belongs) can be calculated from the FVFPST of the first Tip packet.
  • VOB_V_E_PTM video playback end time information of the VOB to which NV_PCK belongs
  • VOB_V_E_PTM video playback end time information of the VOB to which NV_PCK belongs
  • VOB_V_E_PTM video playback end time information of the VOB to which NV_PCK belongs
  • the VOBU-SRI can be calculated using the access map, and thus the description thereof is omitted here.
  • Fig. 56 shows the structure of SYNCI of NV-PCK. The following describes how to calculate only those fields that need to be calculated when converting from Constrained SESF force.
  • A—SYNCA0 (Relative address of the pack that stores the primary audio, VOBU—S—the pack that stores the audio frame to be played at the same time or immediately after the PTM) uses the PES—info in the Tip packet. Therefore, it is possible to obtain during TS2PS conversion without stream analysis.
  • the Constrained SESF pre-stores the SESF capsule with audio data to be reproduced at the same time or immediately after the FVFPST described in the Tip packet at the head of the SESF capsule. It may be encoded. [0386] By defining in this way, it is possible to eliminate the process of detecting audio data synchronized with VOBU-S-PTM (FVFPST) beyond VOBU (SESF capsule).
  • A—SYNCA1 (the relative address of the pack that stores the secondary audio, VOBU—S—the relative address of the pack that contains the audio frame that is played simultaneously or immediately after the PTM) is the same as A—SYNCA0 Can be set.
  • the DSI data of NV-PCK can be generated at any time in VOBU units except for A-SYNCA during conversion.
  • Fig. 84 summarizes an example of a method of generating NV-PCK.
  • DVD VR stream is briefly described below. The details of the stream format of DVD VR are described in "DVD Specifications for Rewritable / Re-recordable Discs Part3 VIDEO RECORDING".
  • Fig. 57 shows a stream structure in the DVD VR format.
  • each stream contains a plurality of VOBs, and each VOB consists of an integer number of VOBUs.
  • a VOBU consists of an integer number of packs, followed by RDI-PCK, followed by a video pack (V-PCK) followed by an audio pack (A-PCK).
  • RDI—PCK unlike regular packs, stores display and copy control information and manufacturer-specific information.
  • each field included in RDI-PCK is explained, and the calculation method is also explained.
  • the RDI—PCK payload data (RDI Unit) is composed of the general information of RDI, the RDI-Real-time Data Information General Information (GI), and the display and copy control.
  • DCI-Display Control Information and Copy Control Information (CCI), which stores information for manufacturing, and MNF I (Manufacturer's Information), which stores manufacturer-specific information.
  • the RDI-GI contains a VOBU-S-PTM field inside, only this field is variable, and the other fields are embedded with fixed values.
  • VOBU S PTM adds the corresponding Tip packet in the transport stream before conversion. Since the format is exactly the same as the described FVFPST, the value of FVFPST can be copied as it is.
  • DCI-CCI has exactly the same format as display-and-copy-info of the Tip packet, the value of display-and-copy-info can be copied as it is.
  • a unique manufacturer ID is assigned only when the maker-ID described in the Tip packet is the same as the manufacturer ID of the information recording device, and the manufacturer-specific information is described (copied). . However, if the maker-ID power in the Tip packet is the ID of another manufacturer or an invalid maker-ID value, an RDI pack is generated by describing invalid data in MNFI. May be.
  • the RDI-PCK can be sequentially created only from the corresponding Tip packet (and its ATS).
  • Fig. 58 shows a flowchart for generating the above RDI-PCK.
  • the system header consists of fixed-value fields. Details of the system header are shown in FIG.
  • the packet header and private header stored in RDI-PCK are shown in Figures 62 (a) and (b), respectively. As shown, these headers and the fixed-value field force are also configured, so they are easy to generate.
  • FIG. 59 shows a flowchart for generating a PS pack from TS packets (lMultiplexing Unit) storing AV data.
  • a TS packet of Constrained SESF that stores AV data is converted into a 2 KB pack of MPEG-PS that stores AV data using one Multiplexing Unit as its processing unit.
  • the process will be described for each step.
  • Step S4200 Only one TS bucket is read from the conversion start point of the Constrained SESF stream.
  • Step S4201 It is determined whether or not the read TS packet stores AV data and is the first TS packet of a Multiplexing Unit.
  • the determination of storage of AV data is made by referring to the PID value of the TS packet declared to store AV data in PMT.
  • the TS packet that stores AV data immediately following that is the Multiplexing Unit Is determined to be the head of.
  • the conversion start point is expected to be a Tip packet, it can be determined whether or not it is the beginning of the Multiplexing Unit by reading TS packets in sequence (that is, the TS packet that stores AV data immediately after the Tip packet is Always the beginning of the Multiplexing Unit.) If the result of the determination is that the TS packet is not the head of the Multiplexing Unit, or if the conversion has not started from the Tip packet and cannot be determined, the processing power is returned to S4200 to read the next TS packet. If it can be confirmed that it is the head of the Multiplexing Unit, the process proceeds to the next process.
  • Step S4202 Using the ATS added to the first TS packet of the Multiplexing Unit, calculate the time (calculated-PCR) at which the MPEG-PS pack to which the TS packet is converted is input to the decoder. This calculation method is as described above. Once the PCR is calculated, the SCR can be calculated by the above calculation method, and the knock header shown in FIG. 60 is completely determined. This is because the knock header has a fixed value except SCR.
  • Step S4203 Create a packet header and a private header.
  • the packet header is created based on the PES packet header of Constrained SESF.
  • the created packet header must be in a format that satisfies the field values shown in Figure 63. This is because the value of a field that changes the header length must be determined before Co This is because conversion from nstrained SESF is not uniquely determined, and there is a risk of affecting buffer management. Fields not shown here are fixed values and are not listed.
  • Constrained SESF determines the individual field values of the PES packet header in detail! This minimizes the processing required to convert the PES packet header (MPEG-TS) to the packet header (MPEG-PS). This is to limit it.
  • one PES packet is converted into a plurality of packs.
  • the packet headers of the second and subsequent packs set the PTS—DTS—flags to “0 0b” and the PES—extension—flag to “0b” in the first packet header generated from the PES packet. Correcting stuffing, adjusting the byte length, and correcting PES_header_data_length are the points to be corrected.
  • Figure 64 shows the AC-3 private header. Of the fields shown in the figure, only the number-of-frame-headers need to be calculated at the time of TS2PS conversion according to the definition of the Multiplexing Unit of the Constrained SESF. Since this field specifies the number of AC-3 audio frames that will be stored in the pack, the value of that field is calculated for fixed-rate AC-3, where the byte length of one audio frame is calculated from its bit rate. Since it is possible and its value is fixed length, PES-packet-length equal force can be easily calculated.
  • the first packet header is partially modified from the header of the PES packet, and the second and subsequent packet headers are partially modified from the first packet header, and the private header is modified.
  • Step S4204 Once the private header is created, all that is necessary is to copy the payload portion of the TS packet with the leading strength of the payload portion of the PS pack in order.
  • Step S4208 Next, when copying is completely completed up to the payload data of the multiplexing unit, the byte length of the formed pack is calculated, and it is confirmed whether the pack length is 2048B. If it is already 2048B, the generation of the pack ends. If it is still 2048B! / ⁇ ! If it is, go to S4209.
  • Step S4209 If the pack is not at 2048 ⁇ , add a signaling packet to the end of the payload so that it becomes 2048 ⁇ .
  • the conversion process from the multiplexing unit storing the AV data is performed.
  • the above processing may be repeated only when a Multiplexing Unit is detected until the processing of the specified conversion part of the Constrained SESF ends.
  • Figure 65 (a) and (b) show the conversion from Constained SESF to MPEG-PS.
  • one video PES packet is usually larger than 2KB, so it is divided into multiple Multiplexing Units and multiplexed into Constrained SESF. Is common.
  • the last Multiplexing Unit storing the data of one video PES packet may make up one complete Multiplexing Unit by making up the surplus data amount with an adaptation field and a NULL packet.
  • the data of the next PES packet may be stored in order to increase the data transfer efficiency (to increase the amount of data stored in the converted MPEG-PS pack).
  • the P picture and the B picture need not be arranged from the beginning of the multiplexing unit.
  • Multiplexing Units constituting one video PES packet can be classified into the following three types.
  • MU #N Multiplexing Unit
  • each pack of TS2PS converted MPEG-PS stream is
  • a pack converted from MU #n forms a pack by adding one byte of stuffing.
  • Figures 66 (a) and 66 (b) illustrate the conversion from Constained SESF to MPEG-PS. As shown in FIG. 66 (a), one audio PES packet (which stores one or more audio frames) has a smaller size than one Multiplexing Unit.
  • One audio PES packet fits in one Multiplexing Unit, and thus does not require complicated conversion unlike a video PES packet.
  • a pack into which a padding packet is inserted must be generated.
  • the calculation at the time of conversion is performed by appropriately setting the stream-id when converting the MPEG1-Audio, or by setting the private for AC3. It is only a simple process of generating a header.
  • transferring the audio multiplexing unit in a short time means increasing the transfer rate of the audio, which is a major difference between the T-STD and the P-STD. To reduce the difference between the allowable input rates of the two. Obedience Thus, there is a significant advantage in facilitating the generation of a Constrained SESF that must match two decoder models.
  • Fig. 67 shows the bit rate of each audio permitted by the Constrained SESF, and the maximum payload length stored in one audio PES packet when AC-3 and MPEG1-Audio are stored for each of them. . Since data larger than the byte length shown here is not stored in one audio PES packet, a padding packet is always inserted.
  • An integer number of PES packets including an integer number of audio frames may be stored in an integer number of multiplexing units, so that the amount of data stored in the converted MPEG-PS pack may be increased for efficient multiplexing. .
  • the PTS calculation at the time of conversion becomes a problem.
  • the DVD standard defines that the PTS of the first audio frame starting in the PES bucket is described as the PTS in the audio PES packet header.
  • an audio frame that becomes the head of a PES packet after conversion to MPEG-PS (DVD) and an audio frame that becomes the head of a PES packet multiplexed with Constrained SESF before conversion are output. Some cases do not match. Therefore, according to the present invention, the audio frame starting first in the PES packet of the converted MPEG-PS pack is multiplexed with the Constrained SESF so that the audio frame always has the PTS. This eliminates the need to calculate and find a new PTS at the time of TS2PS conversion.
  • the first complete audio frame in the Multplexing Unit is the first audio frame in the payload of the PES packet in the Multplexing Unit (that is, the audio frame in which the PTS is always described). It is effective. Therefore, the Constrained SESF according to the present invention specifies that “the complete audio frame that starts first in the Multplexing Unit is the first audio frame in the payload of the PES packet in the Multplexing Unit”. . Note that this rule states that an audio frame whose frame first byte starts first in the multiplexing unit is the first audio frame in the payload of the PES packet in the multiplexing unit. May be ". Since the restriction by this rule is one of the restrictions of Constrained SESF, it can be determined whether or not the above rule is satisfied by referring to the encode-condition flag.
  • Fig. 85 shows MPEG-T formatted in Constrained SESF that satisfies the above rules.
  • FIG. 3 is a diagram for explaining S and MPEG-PS converted therefrom.
  • the PES packet header of each of the PES knockets 411, 412, and 413 includes the first audio frame (among the audio frames included in each of the PES buckets 411, 412, and 413), respectively.
  • PTS values (PTS # 1, PTS # 5, PTS # 8) for AF # 1, AF # 5, AF # 8) are included.
  • the first Multplexing Unit (401) includes all data of the PES packet 411 and data up to the middle of the PES packet 412.
  • the first complete audio frame in that Multplexing Unit (401) is audio frame # 1, which is the same as the first audio frame in the payload of PES It satisfies the above rules.
  • the first complete audio frame in the Multplexing Unit (402) is audio frame # 8, which is the first complete audio frame in the payload of PES packet 413. It is an audio frame and satisfies the above rules.
  • the Multplexing Unit (402) has the ability to include the second half of audio frame # 7 immediately after the PES packet header.It is a part of the audio frame and not a complete audio frame. It is not a condition.
  • the PES packet header of the PES packet 411 included in the first Multplexing Unit (401) includes the PTS value (PTS) of the first complete audio frame # 1 in the subsequent audio frame (AF). # 1) is included. Also, the second Multplexing Unit (402) contains the PTS value (PTS # 8) of the first complete audio frame # 8 in the following audio frame (AF)! /.
  • the PES packet header in the conversion destination MPEG-PS includes the P included in the Multplexing Unit (402).
  • the PTS value (PTS # 8) stored in the ES packet header is copied as is.
  • a PES packet containing video data may have a restriction such as "The PES packet storing the I picture starts from the top of the Multplexing Unit"! ⁇
  • Fig. 86 shows an example satisfying the above stipulations.
  • the PES packet 416 includes an I picture, and the PES packet header stores the PTS value (PTS # 2) of the I picture.
  • the PES packet 416 is located at the head of the Multplexing Unit (404).
  • the PTS value (PTS # 2) stored in the PES packet header 421 points to the I-picture immediately following it!
  • the Multplexing Unit (403) stores the P-picture included in the payload of the PES packet 415, and inserts a NULL packet in the remaining part to align the I-picture with the next Multplexing Unit (404). I have.
  • FIG. 68 is a flowchart showing main processing of TS2PS conversion. This process is started when a user requests TS2PS conversion. First, seek the SESF Capsule at the beginning of the conversion (S11). Then, it is determined whether or not there is a SESF Capsule to be processed (S12). If not, the process is terminated. If there is a SESF Capsule, the initialization process (S13) and the capsule unit process (S14) are performed.
  • the initialization process (S13) will be described with reference to the flowchart in Fig. 69.
  • the setting and initialization of variables and the like used in the subsequent processing are performed.
  • the variable MU-num specifying the number of the Multiplexing Unit being processed is set to 0 (S25).
  • the variable WA indicating the number of ATS overflows is set to 0 (S26).
  • the capsule unit process (S14) will be described with reference to the flowchart in Fig. 70.
  • One TS packet is read (S31). It is determined whether the read TS palette is a Tip packet (S32). If it is a Tip packet, the process ends. If it is not a Tip packet, it is determined whether the read TS packet is an audio packet or a video packet (S33). If the read TS packet is not an audio packet or a video packet, the process returns to step S31, and the TS packets are sequentially read until the read TS packet becomes an audio packet or a video packet (S31 to S33). If the read TS packet is an audio packet or a video packet, the subsequent ten TS packets are read (S34).
  • MU_num is incremented (S35).
  • the ATS value of the first TS packet of the Multiplexing Unit is stored in the variable ATS [MU-num] (S36).
  • the byte length of the payload data of the PES packet stored in the multiplexing unit is defined as payload-len (S37). Then, knock unit processing is performed (S38).
  • the pack unit processing includes SCR calculation processing (S41), pack header processing (S42), packet header processing (S43), payload processing (S44), and padding packet processing (S45). Consists of Hereinafter, each process will be described in detail.
  • the SCR value of the pack is obtained.
  • ATS [MU_num] is compared with ATS [MU_num-1] (S55).
  • the ATS “i” stores the ATS value of the first packet of the Multiplexing Unit, and this ATS value is Is a value indicating a relative transfer timing with respect to a given packet. Therefore, the ATS value of the subsequent packet is usually larger than the ATS value of the previous packet. However, since the ATS value is generally a finite value represented by 30 bits, overflow may occur. In this case, the ATS value of the subsequent packet is smaller than the ATS value of the previous packet.
  • step S54 the inversion of the ATS value is observed, and it is determined whether or not overflow has occurred. If ATS [MU-num-num] is less than or equal to ATS [MU-num-l], that is, if an overflow occurs, the variable WA is incremented (S55).
  • the pack header data having the data structure shown in Fig. 60 is edited.
  • SCR Substitute the value obtained by dividing SCR by 300 into extension (S61).
  • SCR Substitute the value of the quotient obtained by dividing SCR by 300 into base (S62).
  • “000b” is substituted for pack_stuffing_length (S64). Edit the other fields to complete the knock header data (S65).
  • a stream ID process for setting a stream ID is performed (S71). Thereafter, it is determined whether the Multiplexing Unit includes video data (S72).
  • the multiplexing unit includes video data, it is determined whether or not the TS packet at the beginning of the multiplexing unit includes a PES packet header (S73). If the first TS packet of the Multiplexing Unit includes a PES packet header, the first processing of the Video PES packet is performed (S74), otherwise, the non-first processing of the PES packet is performed (S75). Whether the first TS packet of the Multiplexing Unit includes the PES packet header is determined by referring to the payload-unit-start-indicator of the TS packet header or by directly storing the start code of the PES packet header. Is determined by referring to.
  • the multiplexing unit determines whether the multiplexing unit includes a PES packet header (S76). If the Multiplexing Unit includes a PES packet header, perform audio PES packet head processing (S77), If not, an audio PES packet non-leading process is performed (S78).
  • the value of the stream-id field is set. If the type of the stream being processed is “MPEG2—video”, set “OxEO” to the stream—id (S81, S82) If the type of the stream being processed is S ”AC3—audio”, Set “OxBD ⁇ ” to stream—id (S83, S84). If the type of the stream being processed is “MPEGl-audio” and “Primary audio”, set the stream-id to “OxCO” (S85, S86, S87). In the case of “MPEGl-audio” and “Secondary audio”, “OxCl ⁇ ” is set in the stream-id (S85, S88, S89).
  • FIG. 83 is a diagram showing in detail the structure of the PES packet in the MPEG standard. In this processing, each field is edited according to the structure shown in FIG.
  • step S116 it is determined whether the value of (2025-payload-len) is 8 or more. If it is 8 or more, PES-header-data-length is set to 0 (S117), and PES-packet-length is set to the value calculated by the following equation (S118).
  • a PES packet header identical to the PES packet header that first appears in the Multiplexing Unit is generated as a converted MPEG-PS PES packet header (S181).
  • the value calculated by the following equation is set to PES-packet-length (S182).
  • PES-extension-flag power is “l” (S183), and when PES-extension_flag is “1”, P-STD_buffer_flag is set to 1 (S184). It is determined whether or not the audio data is AC-3 audio (S185) If it is AC-3 audio, the two bytes following PES-extension-flag-2 are set to a predetermined value ("0x603A") (S186). If it is not AC-3 audio, the 2 bytes following PES-extension-flag-2 are set to a predetermined value ("0x4020”) (S187).
  • the stream id power is not 'OxBD ⁇
  • the stream id power is' OxCO ⁇
  • the payload processing will be described with reference to FIG.
  • the variable i is set to 1 (S121).
  • the payload data of the PES packet stored in the i-th TS packet is read (S122).
  • the payload data of the PES packet stored in the i-th TS packet is added to the payload of the pack (S123).
  • the variable i is incremented (S124).
  • the above processing is repeated within the range where the variable i does not exceed 12 (SI 25). That is, the process is repeated for all TS packets included in one Multiplexing Unit until the above process is performed (S122 to S125).
  • the padding packet processing will be described with reference to FIG.
  • PES-packet-length is 2028 (S131). If PES-packet-length is not 2028, PES-packet-length of the padding packet is set to ⁇ (2028-PES-packet-length) -6 ⁇ (SI 32). A padding packet is added following the payload (S133).
  • the PTS described in the converted MPEG-2 PES packet can be set with reference to the PES packet header that appears first in the Multiplexing Unit. (See Fig. 85 and Fig. 86)
  • the PES indicating the length of the PES packet of the video is PES-packet-length, so that the PES-packet-length in the packet header after conversion to a pack is calculated.
  • the PES-packet-length of each video PES packet in the SES F capsule may be described in the Tip packet. As a result, PES-packet-length can be determined by sequential processing in units of TS packets, and conversion can be performed even faster.
  • the pack header may be stored in advance in the PES packet header stored in the MPEG-TS.
  • the data stored in the TS packets from the TS packet to a predetermined rule (for example, a predetermined number) may be stored in the pack.
  • the video picture (Pf) displayed first in the first complete SESF Capsule in the continuous STC (System Target Decoder Reference Time) section is the top field.
  • the last video picture (P1) displayed in the last complete SESF Capsule may be the bottom field.
  • Figure 87 (b) shows a case that does not satisfy this rule.
  • the first video picture (Pf) displayed in the first complete SESF Capsule becomes the bottom field, and the last complete SESF Capsule
  • the video field (P1) that is displayed last is the top field.
  • the above constraint is one of the constraints of Constrained SESF, it can be determined whether or not the above constraint is satisfied by referring to the encode-condition flag. That is, by referring to this flag, in a continuous STC section, the video picture displayed first in the first complete SESF Capsule is the top field, and in the last complete SESF Capsule, It is possible to determine whether or not the last video picture displayed is the bottom field.
  • FIG. 88 is a flowchart of the recording process in the Constrained SESF provided with the above restrictions.
  • the encode condition value is It is set in advance by the initial setting of the graphic equipment. It is determined whether or not the encode—condition is “lib” (S203). When encode-condition is "lib” (recording in DVD-Video mode), it is determined whether or not to encode the first complete SESF Capsule! / (S208). If the first complete SESF Capsule is encoded, encode it so that the first display picture in the first complete SESF Capsule is the top field (S209). Subsequently, the data is encoded as Constrained SESF that satisfies the requirements when the encode-condition is "lib” (S210).
  • the encode-condition is S "01b" (recording in the DVD-Video Recording mode)
  • the data is encoded as a Constrained SESF that satisfies the requirements when the encode-condition is "01b" (S204 ).
  • time map information is sequentially added (S205) o It is determined whether or not the recording end power is present (S206), and if it is completed, the recording end processing is performed (S207). Steps S203 to S205 are repeated until the process is completed.
  • encode- judge whether the condition is "1 lb" or not (S211).
  • encode-condition is "lib”
  • a seamless connection is a connection that allows two separate VOBs (system streams) to be played back continuously in time.
  • Figure 90 shows a seamless connection between VOB # 1 and VOB # 2 specified by Cell # 1 and Cell # 2, respectively. Shows the connection.
  • Various techniques have been proposed for seamless connection (see, for example, US Pat. No. 5,923,869).
  • connection information is a connection_condition and is stored in the VOB management information (VOBI).
  • connection-condition is set as follows.
  • connection-condition when the connection-condition is 3 or 4, it means that the Cell satisfies the condition of seamless connection with the immediately preceding cell.
  • connection-condition of Cell # 1 since the connection-condition of Cell # 1 is 1, it means that Cell # 1 is not connected seamlessly with the immediately preceding Cell, while the connection- condition of Cell # 2 is 4. Therefore, Cell # 2 means that it is seamlessly connected to the immediately preceding Cell # 1.
  • the target section of TS2PS conversion is a complete SESF.
  • connection-condition 3
  • the bridge VOB is a VOB generated by extracting the former VOB and the succeeding VOB that are connected seamlessly from the former and latter half of the bridge VOB, and re-encoding them so that they can be played back continuously.
  • a seamless connection via a bridge VOB is disclosed, for example, in US Patent Publication No. 2002-90197.
  • PGC # 1 plays back VOB # 1 and VOB # 2 through the following playback path. Play from VOB # 1 (301) Start—SPN1 to exit—to— Bridge—SPN, then play the bridge VOB (304) to the beginning, and finally return to VOB # 2 (302) from— Bridge— SPN to END— SPN2 (End-PTM2 position on the time map). Start-SPN1, exit-to-Bridge-SPN, return-from-Bridge-SPN, ... indicate the address of the TS packet. Such information is recorded in VOBI, which is the management information of VOB.
  • VOB # 1 (301) is composed of four Capsules, Capsulel—l to Capsulel—4, and VOB # 2 (302) is Capsule2—l to Capsule2— 4, consisting of four capsules.
  • Bridge VOB304 is Capsulel-3, Capsulel-4, Capsulel-4 It consists of sule2-l 'and Capsule2-2'.
  • the first half of the bridge VOB 304 that is, Capsulel-3 and Capsulel-4, is generated from Capsulel-3 and 1-4 of the front VOB 301 to be seamlessly connected.
  • the latter half of the bridge VOB 304 that is, Capsule 2-1 and Capsule 2-2, are generated from Capsules 2-1 and 2-2 of the rear VOB 302 to be seamlessly connected.
  • a VOB is composed of units called "aligned units".
  • One aligned unit contains 32 source packets, which are a set of ATS and TS packets, and is 6KB in size.
  • the last Capsule 2-2 of the bridge VOB 304 has a playback time of 0.4-1.2 seconds as the last complete SESF Capsule.
  • the VOB of the DVD converted from Capsule2-1, 2, 2-2, 2-3, 2-4 Capsule2—If the playback time of 2 'exceeds 1.0 second, re-encoding is required, which is inconsistent with the DVD standard.
  • the playback time of the last Capsule 2-2, 2 (that is, the Capsule containing the last TS packet of the bridge VOB 304) in the bridge VOB 304 must be at least 0.4 second and within 1 second. This is true even if the last Capsule in the bridge VOB 304 is not a complete Capsule.
  • the playback time of the first Capsulel-3, 3 (that is, the Capsule containing the first TS packet of the bridge VOB304) of the bridge VOB304 is 0.4 seconds or more in order to be compatible with the DVD standard. Must be within 1 second.
  • the last Capsulel-2 of VOB # 1 on the front side in the seamless connection needs to be a complete Capsule. This is to enable high-speed conversion without loss of AV information near the seamless connection when TS2 PS conversion is performed on the VOB on the front side that is seamlessly connected.
  • the Capsule starts with a Tip packet (that is, the presence of a Tip packet indicates the start of a Capsule).
  • Capsule contains one or more GOPs.
  • Each audio stream and video stream is completed in Capsule.
  • Each stream starts with the first byte of the access unit in the Capsule and ends with the last byte of the access unit.
  • the playback time of Capsule video data is between 0.4 and 1.0 seconds.
  • the playback time of the video data of the last complete SESF Capsule in the continuous STC sequence is within 1.0 seconds when encode—condition is 01b, and when encode—condition is lib, 0.4 seconds force 1.2 seconds or less.
  • the playback time must be at least 0.4 seconds and less than 1 second, regardless of whether it is a full Capsule or not, in order to achieve fast conversion to DVD-VR.
  • the playback time of Capsulel-3 including the first TS packet of bridge VOB304, must be at least 0.4 seconds and within 1 second in order to achieve high-speed conversion to DVD-VR.
  • Capsulel-4 (the last complete Caps The playback time of the video is less than 1.0 second because it is a rule, and Capsule 2-1 'immediately after is required to be a complete Capsule. If these conditions are satisfied, the DVD standard can be satisfied without re-encoding when converting the format from C-SESF to MPEG2-PS.
  • each audio sample having a playback time of the seamless playback time tc of each of the two connected VOBs is recorded. It must be encoded to include (ie, without audio gaps).
  • encoding must be performed at a seamless connection point so that an audio gap including the seamless playback time tc is created.
  • the overlapping audio frames a6 and a7 are deleted, and the audio frame a5 is continuously connected to the audio frame a5 so that the audio gap cannot be formed.
  • the re-encoded audio frame a8 may be placed at the beginning of the subsequent VOB so that it can be played back.
  • the playback time of the audio frame a8 and the subsequent audio frames is uniformly shifted, it is necessary to separately process the PTS of the audio pack including those audio frames by (t4 ⁇ t3).
  • the PTS of the audio pack should be set to eliminate the overlap without deleting the overlapping audio frames. It may be shifted as appropriate.
  • the added audio frame may be an audio frame that provides silence.
  • the number of audio frames to be added shall be within one frame at maximum for both the preceding VOB and the succeeding VOB. Because the audio gap in the DVD standard has a time length of one frame or less, adding one frame ensures that both VOBs that are seamlessly connected have audio data at the seamless connection time tc. The power that can be guaranteed. If the VOB has audio data at time tc in advance, it is not necessary to add an audio frame to the VOB.
  • the NV_PCK (navi pack) at the head of each VOB is forced to set SCR to 0. This is so that each VOB always starts to be supplied to the decoder (system target decoder) from the value 0 on the MPEG STC time axis. There is no such guarantee in the recording system standard that assumes editing such as deletion of the front part.Therefore, a predetermined amount of offset is added to the MPEG time stamp (SCR / PCR, PTS, DTS) during stream conversion. By doing so, the SCR of the first pack of the converted VOB can start from 0.
  • FIG. 96 illustrates an example in which a front stream (corresponding to VOB) including Capsulel and Capsule2 and a rear stream including Capsule3 and Capsule4 are seamlessly connected.
  • Capsulel and Capsule2 correspond to VOBUl and VOBU2, respectively,
  • Capsule3 and Capsule4 correspond to VOBU3 And VOBU4 respectively.
  • the offset l is calculated from the SCR value obtained in the above-described SCR calculation processing (Fig. 72).
  • the value obtained by subtracting (offsetl) may be used as SCR.
  • PTS and DTS a value obtained by subtracting offsetl from the previous (before conversion) PTS and DTS may be set.
  • an additional offset 2 (offset2) used when converting two V0Bs (MPEG2-TS) into one V0B (MPEG2-PS of DVD-Video) is set.
  • offset 2 (offset2) is an offset for temporally continuing VOBU3 after VOBU2.
  • the offset 1 (offsetl) may be set to another arbitrary value (for example, 0).
  • an SCR value shifted by an offset of 1 from the SCR value obtained by the above formula may be used.
  • offset 2 is used so that the playback end time of the video frame of the front VOB overlaps with the playback start time of the first video frame of the back VOB.
  • the SCR value shifted in this way may be used, or if the conversion is made into two VOBs across a seamless connection point, offset 1 may be used for the VOB after the seamless connection point.
  • the offset 1 (offsetl) and the offset 2 (offset 2) are obtained by the following equations.
  • off set2 FVFPST3-(FVFPST2-offsetl + playback time of all video frames of VOBU2)
  • offset 1 is indispensable when converting to DVD-Video MPEG2-PS. It is not essential when converting to DVD-VR MPEG2-PS. Also, offset 2 is indispensable for the latter half of the VOB when converting two VOBs into one VOB, but not in the case where the VOBs are not concatenated during the conversion.
  • the SCR of the first pack (NV_PCK or RDI-PCK) of the first VOBU (VOBU3 in Fig. 96 (c)) of the rear VOB to be seamlessly connected is calculated.
  • the last pack power of the front VOB can be supplied on a continuous STC time axis, and as a result, TS2PS conversion into one VOB becomes possible.
  • FIG. 97 and FIG. 100 the process of converting two C-SESF VOBs that are seamlessly connected into TS2P S will be described.
  • the process is based on the above-mentioned TS2PS conversion process that does not perform seamless connection, and further includes the process of calculating the time stamp in consideration of the offset amount, and the process of deleting overlapping audio frames.
  • the process is based on the above-mentioned TS2PS conversion process that does not perform seamless connection, and further includes the process of calculating the time stamp in consideration of the offset amount, and the process of deleting overlapping audio frames.
  • the determination for removing the overlap is easy and can be performed simultaneously with the conversion of the stream, and is therefore preferable.
  • the playback end time (t2) is based on the PTS value (PTSp) of the last audio PES packet of the VOB on the front side of the seamless connection and the data size of audio (Lpes bits) stored in the payload of the PES packet. Is calculated from the data size (Lfrm bits) of one frame of data stored in it and the playback time length (Dfrm clock in units of 90 KHz) as follows.
  • the PES packet is always an integer number of fixed-bit-rate audio Assuming that the frame is stored.
  • the playback start time (tl) is the PTS value of the first audio PES packet of the subsequent VOB
  • Times tl and t2 are obtained as described above. If the relationship of t2 ⁇ tc ⁇ tl is satisfied, it is determined that an audio gap exists, that is, there is no overlap. In this case, the additional processing of the audio gap is unnecessary, and the conversion processing as described above may be performed.
  • the audio frame is converted at the time of conversion. remove.
  • exception processing is required to reset the value of the PES_packet_length indicating the data size of the PES packet and the value of the PTS field indicating the PTS of the first audio frame to the correct values.
  • VOB VOB before the seamless connection point and the VOB after the seamless connection point are respectively converted to MPEG-PS, and finally two VOBs are generated. If NO, VOB before the seamless connection point and VOB after the seamless connection point The OBs are converted to MPEG-PS, concatenated, and finally one VOB is generated.
  • connection condition (connection-code) of the VOBI of the rear VOB to be seamlessly connected is set to 4 which is a seamless connection.
  • step S302 if it is determined in step S302 that the two VOBs are not divided after the conversion (NO in S302), offsets 1 and 2 are derived, and the TS2P S conversion is performed while correcting the time stamp with the offsets 1 and 2 ( S309).
  • the TS2PS conversion is completed for two VOBs (YES in S310)
  • the two converted VOBs are connected and registered in the management information (PGC) as one VOB (S311).
  • the converted VOB is recorded in the continuous area (CDA) of the information recording medium together with the management information so as to enable continuous reproduction (S308), and the process ends.
  • the converted two VOBs are registered in the management information (PGC) so that they are seamlessly connected (S326).
  • the converted VOB is recorded in the continuous area (CDA) of the information recording medium together with the management information so as to enable continuous reproduction (S328), and the process ends.
  • step S322 if NO, three VOBs including two seamlessly connected VOBs and a bridge VOB are generated separately after conversion, or concatenated. Then, it is determined whether to generate one VOB (S329). When the three VOBs are generated separately after conversion (YES in S329), the processing shifts to the processing shown in FIG. When the three VOBs are connected after conversion (NO in S329), the processing shifts to the processing shown in FIG.
  • the TS2PS conversion of the system stream including the seamless connection can be executed by the method described above.
  • the conversion section is specified by the user in the user iZF section 222 in FIG. 20, and the drive 221 is determined by the system control section 212 using the information on the conversion section. Is executed for the stream on the recording medium 100 under the control. [0578] Also in the process of performing re-encoding at the time of seamless connection, two VOBs to be seamlessly connected are specified by the user IZF unit 222 in FIG. The control is executed for the stream on the recording medium 100.
  • the stream recorded on the information recording medium can store user private information, it is possible to increase the added value of the recorded content in the MPEG transport stream format.
  • MPEG-TS recorded on an information recording medium is multiplexed in blocks of 2 KB or less so as to have high affinity for MPEG-PS. Converting MPEG-TS to MPEG-PS can be realized very easily without considering buffer management.
  • the present invention makes it possible to easily and quickly convert the format of the first stream to the second stream, and in particular to the format conversion of seamlessly connected streams while maintaining the seamless playback function. And Therefore, the present invention can be applied to an information recording apparatus having a format conversion function from a first stream (for example, an MPEG transport stream) to a second stream (for example, an MPEG program stream).
  • a first stream for example, an MPEG transport stream
  • a second stream for example, an MPEG program stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

 第1のフォーマット(MPEG-TS)から第2のフォーマット(MPEG-PS)へのフォーマット変換を可能とする制限フォーマットで記録され、シームレス接続されたストリームの第2のストリームへの変換を可能とする情報記録媒体と、その情報記録媒体に対して情報を記録する装置、方法とを提供する。第1のフォーマット(例えば、MPEGトランスポートストリーム)を第2のフォーマット(例えば、MPEGプログラムストリーム)へ変換可能とする制限フォーマットを設ける。その制限フォーマットにしたがい、シームレス接続点の直後においてシステムストリームは、制限フォーマットにより規定される所定のデータ管理単位(Capsule)の先頭から始まる。

Description

高速変換可能なストリームを記録した情報記録媒体並びにその記録装置 及び記録方法
技術分野
[0001] 本発明は、記録再生可能な情報記録媒体であって、動画像、静止画、オーディオ およびデータ放送等の種々のフォーマットのデータを含むマルチメディアデータが記 録される情報記録媒体であって、特に、マルチメディアデータを記録されたフォーマ ットと異なるフォーマットに高速変換可能とする制限されたフォーマットで、データを記 録する報記録媒体に関する。また、本発明はそのような情報記録媒体に情報を記録 する装置及び方法に関する。
背景技術
[0002] 650MB程度が上限であった書き換え型光ディスクの分野で数 GBの容量を有する 相変化型ディスク DVD—RAMが出現した。ディジタル AVデータの符号化規格であ る MPEG (MPEG2)の実用化とあいまって DVD—RAMは、コンピュータ用途だけ でなくオーディオ ·ビデオ (AV)技術分野における記録 ·再生メディアとして期待され ている。
[0003] 昨今、日本においてもデジタル放送が開始され、 MPEGトランスポートストリーム( 以下「MPEG— TS」と称す。 )にのせて、複数番組の映像、音声、データを同時に多 重化して送出することが可能となり、 HDDや DVDを利用したデジタル放送記録装置 が普及しつつある。このようなデジタル放送の記録に適した次世代の情報記録媒体 の規格として、 Blu— ray Disc規格(以下「BD規格」と!、う。 )がある。
[0004] BD規格に準拠した次世代型のデジタル放送レコーダ(Blu— ray Discレコーダ) は、主として、デジタル放送の形態に合わせて、放送された MPEG— TSを変換せず にそのままの MPEG—TS形式で記録する。また、次世代型のデジタル放送レコーダ は、外部入力からの AVデータを自己記録する場合においても、 AVストリームを MP EG— TS形式で記録する。これは、レコーダ内部で MPEGプログラムストリーム(以 下「MPEG— PS」と称す。)と MPEG— TSの両者を扱う必要がないようにするためで ある。
[0005] 一方、現行の DVD規格(DVD— Video規格、 DVD— Audio規格、 DVD Video
Recording規格、 DVD Stream Recording規格等)では、 AVストリームの記録 方式に MPEG— PS形式を用いている。このため、上記の次世代のデジタル放送対 応レコーダのように MPEG— TS形式で記録を行ったコンテンツを、例えば DVD—V ideo形式に変換する場合には、 MPEG— TS形式から MPEG— PS形式への変換( 以下「TS2PS変換」という。)が必須となる。
[0006] しかしながら、 MPEG— TSで多重化されたストリームを MPEG— PSへ変換するに は、デコーダの複雑なバッファマネージメントを再計算する必要があり、 TS2PS変換 に処理時間を要する。また、エレメンタリーストリームを再エンコードする必要があるた め、画質や音質に劣化を生じる場合があった。
[0007] これらの問題に対して、いくつかの方法が提案されている(例えば、特許文献 1参照 。)。
特許文献 1:特開 2003 - 228922号公報
発明の開示
発明が解決しょうとする課題
[0008] し力し、 MPEG— TS形式から MPEG— PS形式への容易な変換を可能とする方法 であって、 2つの AVストリームを接続し連続再生を可能とするためのシームレス接続 にお 、てその接続点を含んで変換する場合の方法にっ 、ては、未だ提案されて!ヽ ない。
[0009] 本発明は上記課題を解決すべくなされたものであり、その目的とするところは、 MP EG—TS形式で記録したコンテンッを MPEG - PS形式に変換可能とする制限され た MPEG— TS形式で AVストリームを記録する情報記録媒体にお!、て、シームレス 接続されたストリームに対し、シームレス再生機能を維持したままフォーマット変換を 可能とする情報記録媒体を提供することにある。また、本発明は、そのような情報記 録媒体に対してデータの記録を行なう装置及び方法を提供することを目的とする。 課題を解決するための手段
[0010] 本発明の第 1の態様において、システムストリームにエンコードされた映像情報と音 声情報を、その管理情報と共に記録した情報記録媒体が提供される。
その情報記録媒体において、システムストリームには第 1のフォーマット (TS)と第 2 のフォーマット(PS)とが許され、第 1のフォーマット(TS)は、データをパケットで分割し て格納するパケット構造を有し、前記第 2のフォーマット (PS)は、データをパックで分 割して格納するノック構造を有する。第 1のフォーマット (TS)には、第 1のフォーマット (TS)力も第 2のフォーマット(PS)へシステムストリームを変換するための制限フォーマ ットが許される。その制限フォーマットによれば、所定数の前記パケットがグループィ匕 されて、第 2のフォーマットのパックに対応する多重化ユニットとして管理され、さらに 、多重化ユニットを複数含むデータ管理単位 (Capsule)でシステムストリームが管理さ れる。管理情報はシステムストリームの再生順序を示す再生順序情報 (PGC)を含む 。再生順序情報は、 1つもしくは複数の、 1連続なシステムストリームに対応する再生 区間(cell)の組み合わせで記述される。管理情報はさらに、各再生区間に対し、 1つ 前の再生順序の再生区間からシームレス再生するか否かを示す接続情報
(connection_code)を含む。情報記録媒体において、制限フォーマットにより、再生区 間の接続情報がシームレス再生することを示す場合、シームレス接続点の直後にお V、てシステムストリームはデータ管理単位 (Capsule)の先頭から始まるように、システム ストリームが記録される。
本発明の第 2の態様において、映像情報と音声情報とをシステムストリームにェンコ ードして、その管理情報と共に情報記録媒体に記録する情報記録装置が提供される 。その情報記録装置において、システムストリームには第 1のフォーマット (TS)と第 2 のフォーマット(PS)とが許される。第 1のフォーマット(TS)は、データをパケットで分割 して格納するパケット構造を有し、第 2のフォーマット(PS)は、データをパックで分割し て格納するパック構造を有する。第 1のフォーマット (TS)には、第 1のフォーマット (TS )力も第 2のフォーマット(PS)へシステムストリームを変換するための制限フォーマット が許される。制限フォーマットによれば、所定数の前記パケットがグループ化されて、 第 2のフォーマットのパックに対応する多重化ユニットとして管理され、さらに、多重化 ユニットを複数含むデータ管理単位 (Capsule)でシステムストリームが管理される。管 理情報はシステムストリームの再生順序を示す再生順序情報 (PGC)を含む。再生順 序情報は、 1つもしくは複数の、 1連続なシステムストリームに対応する再生区間(cell )の組み合わせで記述される。管理情報はさらに、各再生区間に対し、 1つ前の再生 順序の再生区間力 シームレス再生するか否かを示す接続情報 (connection_code)を 含む。
情報記録装置は、第 1のフォーマット (TS)に基づき、映像情報と音声情報に所定の エンコード処理を施しビデオエレメンタリストリームとオーディオエレメンタリストリームと を生成する第 1のエンコード手段と、第 1のフォーマット (TS)に基づき、ビデオエレメ ンタリストリームとオーディオエレメンタリストリームとをマルチプレタスしシステムストリ ームを生成するシステムエンコードを行なう第 2のエンコード手段と、第 1及び第 2の エンコード手段を制御する制御手段とを備える。
制御手段は、 1つの再生区間の接続情報がシームレス再生することを示す場合、シ ームレス接続点の直後におけるシステムストリームがデータ管理単位 (Capsule)の先 頭力も始まるように、第 1及び第 2のエンコード手段を制御する。
本発明の第 3の態様において、システムストリームにエンコードされた映像情報と音 声情報を、その管理情報と共に情報記録媒体に記録する方法が提供される。その方 法において、システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS) と力 S許される。第 1のフォーマット (TS)は、データをパケットで分割して格納するバケツ ト構造を有し、第 2のフォーマット(PS)は、データをパックで分割して格納するパック 構造を有する。第 1のフォーマット (TS)には、第 1のフォーマット (TS)から第 2のフォ 一マット(PS)へシステムストリームを変換するための制限フォーマットが許される。制 限フォーマットによれば、所定数のパケットがグループ化されて、第 2のフォーマットの パックに対応する多重化ユニットとして管理され、さら〖こ、多重化ユニットを複数含む データ管理単位 (Capsule)でシステムストリームが管理される。管理情報はシステムス トリームの再生順序を示す再生順序情報 (PGCI)を含む。再生順序情報は、 1つもし くは複数の、 1連続なシステムストリームに対応する再生区間(cell)の組み合わせで 記述される。管理情報はさらに、各再生区間に対し、 1つ前の再生順序の再生区間 からシームレス再生するか否かを示す接続情報 (connection_code)を含む。
情報記録方法は、第 1のフォーマット (TS)に基づき、映像情報と音声情報に所定の エンコード処理を施して、ビデオエレメンタリストリームとオーディオエレメンタリストリー ムとを生成し、第 1のフォーマット (TS)に基づき、ビデオエレメンタリストリームと前記ォ 一ディォエレメンタリストリームとをマルチプレタスして、システムストリームを生成し、ェ ンコード処理において、 1つの再生区間の接続情報がシームレス再生することを示す 場合、シームレス接続点の直後におけるシステムストリームは、データ管理単位 (Capsule)の先頭から始まるようエンコードされる。
[0013] シームレス接続点の直後においてシステムストリームは、 Tipパケットで始めてもよい 発明の効果
[0014] 本発明によれば、制限された符号ィ匕方法を用いることで、 MPEG— TS形式の多重 化処理がなされたコンテンツを MPEG— PS形式の多重化処理がなされたコンテンツ に高速に変換することが可能となる。特に、 MPEG— TS形式のコンテンツをシーム レス再生可能に編集する場合に、容易にシームレス編集が行え、その編集内容通り のシームレス再生を変換後の MPEG— PS形式のコンテンツ上で実現できる。
図面の簡単な説明
[0015] [図 1]DVDレコーダ装置の外観と関連機器とのインタフェースの一例を説明した図 [図 2]DVDレコーダのドライブ装置のブロック図
[図 3]ディスク上の連続領域及びトラックバッファ内データ蓄積量を説明した図
[図 4]半導体メモリカードとハードディスクドライブ装置を備える場合の DVDレコーダ のブロック図
[図 5]ディスクの外観と物理構造を説明した図
[図 6]ディスクの論理的なデータ空間を説明した図
[図 7]ディスクのディレクトリとファイル構造を説明した図
[図 8]ビデオオブジェクトの構成を示す図
[図 9]MPEGシステムストリームを説明した図
[図 10]MPEG— TSストリームを説明した図
[図 11]MPEG— PSストリームを説明した図
[図 12]TSパケットを説明した図 [図 13]PATテーブルを説明した図
[図 14]ビデオオブジェクトのディスク上への配置を説明した図
圆 15]ビデオ管理情報のデータ構造を説明した図
圆 16]ビデオ管理情報のデータ構造を説明した図
[図 17]ビデオ管理情報の PGC情報とオブジェクト情報とオブジェクトとの関係を説明 した図
圆 18]再生装置の機能の構成を示すブロック図
[図 19]記録装置の機能の構成を示すブロック図
[図 20]本発明の情報記録 Z再生装置の構成を示すブロック図
[図 21]自己記録ストリームの構成を説明する図
圆 22]パケット転送時間間隔を説明する図
[図 23]User Privateパケットの格納方法を説明する図
[図 24]User Privateパケットの格納方法を説明する図
[図 25]User Privateパケットの格納方法を説明する図
[図 26]User Privateパケットの格納方法を説明する図
[図 27]MPEG—TSから MPEG— PSへの変換を説明する図
[図 28]MPEG— PSへの変換が容易な MPEG— TSの符号化方法を説明する図
[図 29]DVD— Videoフォーマットへの変換(NTSC)を説明する図
[図 30]DVD— Videoフォーマットへの変換(PAL)を説明する図
[図 31]User Privateパケットの内部データ構造を説明する図
[図 32]MPEG— PSへ容易に変換可能にエンコードされた MPEG— TSと、変換後 の MPEG— PSとの対応関係を説明した図
圆 33]本発明の情報記録装置のエンコーダを示すブロック図
[図 34]システムエンコード方法の違いによる、セルフエンコーディング MPEG— TSか ら DVDフォーマットへ変換する際の処理の違いを説明した図
[図 35]Tipパケットのデータ構造を説明した図
[図 36]adaptation— fieldのデータ構造を説明した図
[図 37]Data IDのデータ構造を説明した図 [図 38]display— and— copy— infoのデータ構造を説明した図
[図 39]encode— infoのデータ構造を説明した図
[図 40]PES— infoの構造を示した図
[図 41]MakersPrivateDataのデータ構造を説明した図
[図 42]Tipパケットの PID (a)、 stream_type (b)を説明した図
[図 43]Constrained SESFストリーム内での PESパケットヘッダのフィールド値を説 明した図
[図 44]Constrained SESFストリーム内での PES— extension— flagと PES— hea der— data— lengthを説明した図
[図 45]T—STDモデルを満たさないようにセルフエンコードされた MPEG— TSの例 を示した図
[図 46]MPEG— TSから変換された MPEG - PS力 - STDモデルを満たさな!/、場 合の例を示した図
圆 47]SCRの計算を説明した図
[図 48]encode—condition= "l ib"の場合の Constrained SESFのエレメンタリ 一ストリーム属性を説明した図
[図 49]encode— condition = "01b"の場合の Constrained SESFのエレメンタリ 一ストリーム属性を説明した図
[図 50]DVD— Video規格のフォーマットのストリーム構造を示した図
[図 51]NV— PCKの PCIデータの構造を示した図
[図 52]NV— PCKの PCI— GIデータの構造を示した図
[図 53]NV— PCKの DSIデータの構造を示した図
[図 54]NV— PCKの DSI— GIデータの構造を示した図
[図 55]NV— PCKの SML— PBIデータの構造を示した図
[図 56]NV— PCKの SYNCIデータの構造を示した図
[図 57]DVD—Video Recording規格のフォーマットのストリーム構造を示した図
[図 58]TSパケット(RD— PCK)の変換処理のフローチャート
[図 59]TSパケット(V PCK、A PCK)の変換処理のフローチャート [図 60]MPEG2— PSのパックのパックヘッダのデータ構造の一部を説明した図 [図 61]DVDフォーマットのシステムヘッダの構造図
[図 62]RDI— PCKに格納される、パケットヘッダ(a)、プライベートヘッダ (b)の構造 図
[図 63]MPEG2— PSのパケットのパケットヘッダのデータ構造の一部を説明した図 [図 64]DVDフォーマットの AC— 3規格のプライベートヘッダの構造図
[図 65]Constained SESFから MPEG— PSへの変換(ビデオパック)を説明した図 [図 66]Constained SESFから MPEG— PSへの変換 (オーディオパック)を説明し た図
[図 67]Constrained SESFで許される各音声のビットレートと、 AC— 3と MPEG1 —Audioを格納する場合の 1オーディオ PESパケットに格納される最大ペイロード長 との対応を示した図
[図 68]TS2PS変換処理全体のフローチャート
[図 69]TS2PS変換処理の初期化処理のフローチャート
[図 70]TS2PS変換処理のカプセル単位処理のフローチャート
[図 71]パック単位処理のフローチャート
[図 72]SCR演算処理のフローチャート
[図 73]パックヘッダ処理のフローチャート
[図 74]パケットヘッダ処理のフローチャート
[図 75]ストリーム ID処理のフローチャート
[図 76]ビデオ PESパケット先頭処理のフローチャート
[図 77]ビデオ PESパケット非先頭処理のフローチャート
[図 78]オーディオ PESパケット先頭処理のフローチャート
[図 79]オーディオ PESパケット非先頭処理のフローチャート
[図 80]ペイロード処理のフローチャート
[図 81]パディングパケット処理のフローチャート
[図 82]Constrained SESFのストリームフォーマットを示した図
[図 83]MPEG規格による PESパケットのデータ構造図 [図 84]NV— PCKデータの生成方法を説明した図
[図 85]オーディオを含む PESパケットでァライメントされて!/ヽな ヽ Multiplexing Uni tを用いた効率的な多重化方法を説明した図
[図 86]1ピクチャを含む PESパケットでァライメントした Multiplexing Unitを用いた 効率的な多重化方法を説明した図
[図 87]Constrained SESF (encode— condition = 1 lb)におけるビデオ表示フィ 一ルド順に関する符号化条件を説明する図
[図 88]Constrained SESFの記録処理のフローチャート
[図 89]Constrained SESFの記録終了処理のフローチャート
[図 90]シームレス接続される Constrained SESFの構造を説明する図
[図 91]シームレス接続される Constrained SESFの構造を説明する図(connectio n― condition = 3)
[図 92]シームレス接続される Constrained SESFの構造を説明する図(connectio n― condition = 3^ encode― condition = 1 lb)
[図 93]シームレス接続される Constrained SESFの構造を説明する図(connectio n― condition = 3、 encode― condition = 0 lb)
[図 94] (a) BD規格における、シームレス接続点でのオーディオデータの関係を説明 した図、(b) DVD規格の 1VOBへの変換後のオーディオデータの関係を説明した図 [図 95] (a) BD規格における、シームレス接続点でのオーディオデータの関係を説明 した図、(b) DVD規格の 1VOBへの変換後のオーディオデータの関係を説明した図 [図 96]DVDの 1VOBへ変換する際のタイムスタンプのオフセット量を説明する図 [図 97]シームレス接続される Constrained SESFを DVDに変換する際のフローチ ャ ~~ト(^connection― condition =4)
[図 98]シームレス接続される Constrained SESFを DVDに変換する際のフローチ ャ ~~ト(^connection― condition = 3)
[図 99]シームレス接続される Constrained SESFを DVDに変換する際のフローチ ヤート(図 98のつづき)
[図 100]シームレス接続される Constrained SESFを DVDに変換する際のフローチ ヤート(図 98のつづき)
符号の説明
[0016] 100 DVDディスク
101、 201 光ピックアップ
102、 202 ECC処理部
103、 203、 220 卜ラックノ ッファ
104、 210 スィッチ
105、 214 エンコーダ
106、 205、 206、 218 デコーダ
207 オーディオデコーダ
208 静止画デコーダ
211 制御部
212 システム制御部
213 アナログ放送チューナ
215 デジタル放送チューナ
216 解析部
217 表示部
219 デジタル IZF部
221 ドライブ
222 ユーザ IZF部
223 外部入力部
230 User Privateノ ケット
231 トランスポートストリームシステムターゲットデコーダ
発明を実施するための最良の形態
[0017] 以下、添付の図面を用いて本発明に係る情報記録媒体、記録装置及び再生装置 の実施形態である DVDディスク、 DVDレコーダ及び DVDプレーヤにつレ、て下記の 順序で説明する。
[0018] 特に、発明のポイントは「8.詳細な実施形態」で説明する。なお、関連の度合いは 異なるが、全て本発明の実施形態である。
1. DVDレコーダ装置のシステム概要
2. DVDレコーダ装置の機能概要
3. DVDディスクの概要
4.再生される AV情報の概要
5. AV情報の管理情報と再生制御の概要
6.再生機能の基本動作
7.記録機能の基本動作
8.詳細な実施形態
[0019] なお、以下では、説明の便宜上、 MPEGトランスポートストリーム(MPEG—TS)か ら MPEGプログラムストリーム(MPEG— PS)への変換を「TS2PS変換」と称する。ま た、 MPEG— PS形式である、 DVD— Video規格フォーマット、 DVD-Video Rec oriding規格フォーマットを総称して「DVDフォーマット」と称する。
[0020] (1. DVDレコーダ装置のシステム概要)
図 1は、 DVDレコーダ装置の外観と関連機器とのインターフェースの一例を説明す る図である。
[0021] 図 1に示すように、 DVDレコーダには光ディスクである DVDが装填され、ビデオ情 報の記録再生を行う。操作は一般的にはリモコンで行われる。
[0022] DVDレコーダに入力されるビデオ情報にはアナログ信号とデジタル信号の両者が あり、アナログ信号としてはアナログ放送があり、デジタル信号としてデジタル放送が ある。一般的にはアナログ放送は、テレビジョン装置に内蔵された受信機により受信 、復調され、 NTSC等のアナログビデオ信号として DVDレコーダに入力され、デジタ ル放送は、受信機である STB (Set Top Box)でデジタル信号に復調され、 DVD レコーダに入力され記録される。
[0023] 一方、ビデオ情報が記録された DVDディスクは DVDレコーダにより再生され外部 に出力される。出力も入力同様に、アナログ信号とデジタル信号の両者があり、アナ ログ信号であれば直接テレビジョン装置に入力され、デジタル信号であれば STBを 経由し、アナログ信号に変換された後にテレビジョン装置に入力されテレビジョン装 置で映像表示される。
[0024] また、 DVDディスクには DVDレコーダ以外の DVDカムコーダや、パーソナルコン ピュータでビデオ情報が記録再生される場合がある。 DVDレコーダ外でビデオ情報 が記録された DVDディスクであっても、 DVDレコーダに装填されれば、 DVDレコー ダはこれを再生する。
[0025] なお、上述したアナログ放送やデジタル放送のビデオ情報には通常、音声情報が 付随している。付随している音声情報も同様に DVDレコーダで記録再生される。ま たビデオ情報は一般的には動画である力 静止画の場合もある。例えば、 DVDカム コーダの写真機能で静止画が記録される場合がそうなる。
[0026] なお、 STBと DVDレコーダの間のデジタル I/Fは IEEE1394、 ATAPI、 SCSI等 がありうる。
[0027] なお、 DVDレコーダとテレビジョン装置との間はコンポジットビデオ信号である NTS Cと例示したが、輝度信号と色差信号を個別に伝送するコンポーネント信号でもよい 。さら〖こは、 AV機器とテレビジョン装置の間の映像伝送 IZFはアナログ IZFをデジ タル IZF、例えば、 DVIに置きかえる研究開発が進められており、 DVDレコーダとテ レビジョン装置がデジタル: [ZFで接続されることも当然予想される。
[0028] (2. DVDレコーダ装置の機能概要)
図 2は、 DVDレコーダ装置の機能を示すブロック図である。ドライブ装置は、 DVD —RAMディスク 100のデータを読み出す光ピックアップ 101、 ECC (Error Correc ting Code)処理部 102、トラックバッファ 103、トラックバッファへ 103の入出力を切 り替えるスィッチ 104、エンコーダ部 105及びデコーダ部 106を備える。
[0029] 図に示すように、 DVD— RAMディスク 100には、 1セクタ = 2KBを最小単位として データが記録される。 また、 16セクタ = 1ECCブロックとして、 ECCブロックを単位と して ECC処理部 102でエラー訂正処理が施される。
[0030] なお、 DVDレコーダ装置はデータの蓄積媒体として、 DVDディスクに加え、半導 体メモリカードゃノヽードディスクドライブ装置を備えても良い。図 4は、半導体メモリ力 ードとハードディスクドライブ装置を備える場合の DVDレコーダのブロック図を示す。
[0031] なお、 1セクタは 512Bでも良いし、 8KB等でも良い。また、 ECCブロックも 1セクタ、 16セクタ、 32セクタ等でも良い。記録できる情報容量の増大に伴い、セクタサイズ及 び ECCブロックを構成するセクタ数は増大すると予想される。
[0032] トラックバッファ 103は、 DVD— RAMディスク 100に AVデータをより効率良く記録 するため、 AVデータを可変ビットレート(VBR)で記録するためのバッファである。 D VD— RAM100への読み書きレート(Va)が固定レートであるのに対して、 AVデー タはその内容 (ビデオであれば画像)の持つ複雑さに応じてビットレート (Vb)が変化 するため、このビットレートの差を吸収するためのバッファである。
[0033] このトラックバッファ 103を更に有効利用すると、ディスク 100上に AVデータを離散 配置することが可能になる。図 3を用いてこれを説明する。
[0034] 図 3 (a)は、ディスク上のアドレス空間を示す図である。図 3 (a)に示す様に AVデー タが [al、 a2]の連続領域と [a3、 a4]の連続領域に分かれて記録されている場合、 a 2から a3へシークを行っている間、トラックバッファに蓄積してあるデータをデコーダ部 106へ供給することで AVデータの連続再生が可能になる。この時の状態を示したの が図 3 (b)である。
[0035] 位置 alで読み出しを開始した AVデータは、時刻 tlからトラックバッファへ 103入力 されるとともに、トラックバッファ 103からデータの出力が開始される。これにより、トラッ クバッファへの入力レート(Va)とトラックバッファからの出力レート(Vb)のレート差 (V a— Vb)の分だけトラックバッファへデータが蓄積されていく。この状態が、検索領域 が a2に達するまで、すなわち、時刻 t2に達するまで継続する。この間にトラックバッフ ァ 103に蓄積されたデータ量を B (t2)とすると、時間 t2から、領域 a3のデータの読み 出しを開始する時刻 t3までの間、トラックバッファ 103に蓄積されている B (t2)を消費 してデコーダ 106へ供給しつづけられれば良い。
[0036] 言い方を変えれば、シーク前に読み出すデータ量([al、 a2])がー定量以上確保 されていれば、シークが発生した場合でも、 AVデータの連続供給が可能である。
[0037] AVデータの連続供給が可能な連続領域のサイズは ECCブロック数 (N— ecc)に 換算すると次の式で示される。式において、 N— secは ECCブロックを構成するセクタ 数であり、 S— sizeはセクタサイズ、 Tjはシーク性能 (最大シーク時間)である。
[0038] N ecc = Vb*Ti/((N sec*8*S size)*(l— Vb/Va)) また、連続領域の中には欠陥セクタが生じる場合がある。この場合も考慮すると連 続領域は次の式で示される。式において、 dN— eccは容認する欠陥セクタのサイズ であり、 Tsは連続領域の中で欠陥セクタをスキップするのに要する時間である。この サイズも ECCブロック数で表される。
[0039] N— ecc = dN— ecc+Vb*Tj/((N— sec*8*S— size)*(l— Vb/Va))
なお、ここでは、 DVD— RAMカゝらデータを読み出す、即ち再生の場合の例を説明 したが、 DVD— RAMへのデータの書き込み、即ち録画の場合も同様に考えること ができる。
[0040] 上述したように、 DVD— RAMでは一定量以上のデータが連続記録さえされてい ればディスク上に AVデータを分散記録しても連続再生 Z録画が可能である。 DVD では、この連続領域を CDAと称する。
[0041] (3. DVDディスクの概要)
図 5 (a)、(b)は、記録可能な光ディスクである DVD— RAMディスクの外観と物理 構造を表した図である。なお、 DVD— RAMは一般的にはカートリッジに収納された 状態で DVDレコーダに装填される。記録面を保護するのが目的である。但し、記録 面の保護が別の構成で行われたり、容認できる場合にはカートリッジに収納せずに、 DVDレコーダに直接装填できるようにしてももちろん良!、。
[0042] DVD— RAMディスクは相変化方式によりデータを記録する。ディスク上の記録デ ータはセクタ単位で管理され、アクセス用のアドレスが付随する。 16個のセクタは誤り 訂正の単位となり、誤り訂正コードが付与され、 ECCブロックと呼称される。
[0043] 図 5 (a)は、記録可能な光ディスクである DVD— RAMディスクの記録領域を表した 図である。同図のように、 DVD— RAMディスクは、最内周にリードイン領域を、最外 周にリードアウト領域を、その間にデータ領域を配置している。リードイン領域は、光 ピックアップのアクセス時にぉ 、てサーボを安定させるために必要な基準信号や他 のメディアとの識別信号などが記録されている。リードアウト領域もリードイン領域と同 様の基準信号などが記録される。データ領域は、最小のアクセス単位であるセクタ(2 048バイトとする)に分割されている。 また、 DVD— RAMは、記録'再生時におい て Z—CLV (Zone Constant Linear Velocity)と呼ばれる回転制御を実現する ために、データ領域が複数のゾーン領域に分割されている。
[0044] 図 5 (a)は、 DVD— RAMに同心円状に設けられた複数のゾーン領域を示す図で ある。同図のように、 DVD— RAMは、ゾーン 0〜ゾーン 23の 24個のゾーン領域に 分割されている。 DVD— RAMの回転角速度は、内周側のゾーン程速くなるようにゾ ーン領域毎に設定され、光ピックアップが 1つのゾーン内でアクセスする間は一定に 保たれる。これにより、 DVD— RAMの記録密度を高めるとともに、記録'再生時にお ける回転制御を容易にして 、る。
[0045] 図 5 (b)は、図 5 (a)において同心円状に示したリードイン領域と、リードアウト領域と 、ゾーン領域 0〜23を横方向に配置した説明図である。
[0046] リードイン領域とリードアウト領域は、その内部に欠陥管理領域 (DMA: Defect M anagement Area)を有する。欠陥管理領域とは、欠陥が生じたセクタの位置を示 す位置情報と、その欠陥セクタを代替するセクタが上記代替領域の何れに存在する かを示す代替位置情報とが記録されて ヽる領域を ヽぅ。
[0047] 各ゾーン領域はその内部にユーザ領域を有すると共に、境界部に代替領域及び 未使用領域を有している。ユーザ領域は、ファイルシステムが記録用領域として利用 することができる領域をいう。代替領域は、欠陥セクタが存在する場合に代替使用さ れる領域である。未使用領域は、データ記録に使用されない領域である。未使用領 域は、 2トラック分程度設けられる。未使用領域を設けているのは、ゾーン内では隣接 するトラックの同じ位置にセクタアドレスが記録されている力 Z— CLVではゾーン境 界に隣接するトラックではセクタアドレスの記録位置が異なるため、それに起因するセ クタアドレス誤判別を防止するためである。
[0048] このようにゾーン境界にはデータ記録に使用されないセクタが存在する。そのため データ記録に使用されるセクタのみを連続的に示すように、 DVD— RAMは、内周 力 順に論理セクタ番号(LSN: Logical Sector Number)をユーザ領域の物理 セクタに割り当てている。
[0049] 図 6は、論理セクタにより構成される DVD— RAMの論理的なデータ空間を示す。
論理的なデータ空間はボリューム空間と呼称され、ユーザデータを記録する。
[0050] ボリューム領域は、記録データをファイルシステムで管理する。すなわち、データを 格納する 1群のセクタをファイルとして、さらには 1群のファイルをディレクトリとして管 理するボリューム構造情報がボリューム領域の先頭と終端に記録される。本実施の形 態のファイルシステムは UDFと呼称され、 IS013346規格〖こ準拠している。
[0051] なお、上記 1群のセクタはボリューム空間で必ずしも連続的には配置されず、部分 的に離散配置される。このため、ファイルシステムは、ファイルを構成するセクタ群のう ち、ボリューム空間で連続的に配置される 1群のセクタをエクステントとして管理し、フ アイルを関連のあるエクステントの集合として管理する。
[0052] 図 7は、 DVD— RAMに記録されるディレクトリとファイルの構造を示す。ルートの下 に、 VIDEO— RTディレクトリがあり、この下に、再生用のデータである各種オブジェ タトのファイルと、これらの再生順序や各種属性を示す管理情報として VIDEO Ma nagerファイルが格納される。
[0053] オブジェクトは MPEG規格に準拠したデータであり、 PS— VOB、 TS1— VOB、 T
S2— VOB、 AOB、 POB、 MNF (Manufacturer's Priv
ate Data)力ある o
[0054] PS— VOB、 AOB、 POBは MPEGのプログラムストリーム(PS)であり、 TSl_VO B及び TS2—VOBはトランスポートストリーム(TS)である。プログラムストリームは、パ ッケージメディアに AV情報を格納することを考慮されたデータ構造を有し、一方、ト ランスポートストリームは通信メディアを考慮したデータ構造を有する。
[0055] PS— VOB、 TS1— VOB、 TS2— VOBは、 Vヽずれも映像情報と音声情報を共に 有し映像情報が主体となるオブジェクトである。このうち、 TS1— VOBは原則、 DVD レコーダによりエンコードが行われ、内部のピクチャ構造が詳細に管理されているォ ブジェクトであり、 TS2—VOBは DVDレコーダ外でエンコードされたオブジェクトで あり、内部のピクチャ構造等のデータ構造が一部不明なオブジェクトである。
[0056] 典型的には、 TS1— VOBは外部力 入力されるアナログビデオ信号を DVDレコ ーダがトランスポートストリームにエンコードしたオブジェクトであり、 TS2—VOBは外 部から入力されるデジタルビデオ信号をエンコードすることなく直接ディスクに記録し たオブジェクトである。つまりデジタル放送を DVDレコーダが記録する際には、一般 的に TS2 VOBである。 [0057] AOB、 POBは MPEGのプログラムストリームであり、 AOBは音声情報が主体となる オブジェクトであり、 POBは静止画が主体となるオブジェクトである。
[0058] MNF (Manufacturer's Private Data)は製造者固有の情報を格納するため のデータ領域である。
[0059] 上述した、映像情報主体、音声情報主体とは、ビットレートの割り当てが大きいこと を意味する。 VOBは映画等のアプリケーションに用いられ、 AOBは音楽アプリケー シヨンに用いられる。
[0060] (4.再生される AV情報の概要)
図 8は、 DVDディスクに各種 AVオブジェクトとして記録される MPEGデータの構造 を示す図である。
[0061] 図 8が示すようにビデオストリーム及びオーディオストリームは、それぞれ分割され多 重される。 MPEG規格においては、多重化後のストリームをシステムストリームと呼称 する。 DVDの場合、 DVD固有の情報が設定されたシステムストリームを VOB (Vide o Object)と呼称している。分割の単位は、パック'パケットと称され、約 2KByteの データ量を有する。
[0062] ビデオストリームは MPEG規格で符号ィ匕されており、可変ビットレートで圧縮されて おり、動きが激しい等の複雑な映像であればビットレートが高くなつている。 MPEG規 格では、映像の各ピクチャは、 Iピクチャ、 Pピクチャ、 Bピクチャに種類分けして符号 化される。このうち、 Iピクチャはフレーム内で完結する空間的な圧縮符号ィ匕が施され おり、 Pピクチャ、 Bピクチャはフレーム間の相関を利用した時間的な圧縮符号ィ匕が施 されている。 MPEGでは少なくとも Iピクチャを含む区間を GOP (Group of Pictur e)として管理する。 GOPは早送り再生等の特殊再生におけるアクセスポイントになる 。フレーム内圧縮された Iピクチャを有するためである。
[0063] 一方、音声ストリームの符号化には、 DVDの場合、 MPEGオーディオに加え、 AC 一 3や LPCMの符号化が用いられる。
[0064] 図 8が示すように、 GOPを構成するビデオ情報とそれに付随する音声情報とを含む 多重化後のデータ単位は VOBU (Video Object Unit)と称される。 VOBUには 、当該動画区間の管理用の情報をヘッダ情報として含ませる場合がある。 [0065] 図 8で説明したシステムストリームには、プログラムストリーム(PS)とトランスポートス トリーム (TS)がある。前者はパッケージメディアを考慮したデータ構造を有し、後者 は通信メディアを考慮したデータ構造を有する。
[0066] 図 9は、プログラムストリームとトランスポートストリームのデータ構造の概要を説明す る図である。
[0067] プログラムストリームは、伝送及び多重化の最小単位である固定長のパック力 なり 、 ノックはさらに、 1つ以上のパケットを有する。ノックもパケットもヘッダ部とデータ部 を有する。 MPEGではデータ部をペイロードと称する。 DVDの場合はパックの固定 長はセクタサイズと整合性をとり 2KBになる。ノックは複数のパケットを有することがで きるが、 DVDの映像や音声を格納するパックは 1パケットのみを有するため、特別な 場合を除いて 1パック = 1パケットになる。
[0068] 一方、トランスポートストリームの伝送及び多重化の単位は固定長の TSパケットから なる。 TSパケットのサイズは 188Bであり、通信用規格である ATM伝送との整合性を とっている。 TSパケットは 1つ以上が集まり PESパケットを構成する。
[0069] PESパケットはプログラムストリームとトランスポートストリームで共通する概念であり 、データ構造は共通である。プログラムストリームのパックに格納されるパケットは PES パケットを直接構成し、トランスポートストリームの TSパケットは 1つ以上が集まり PES パケットを構成する。
[0070] また、 PESパケットは符号ィ匕の最小単位であり、符号化が共通するビデオ情報、ォ 一ディォ情報をそれぞれ格納する。すなわち、一つの PESパケット内に符号ィ匕方式 の異なるビデオ情報、オーディオ情報が混在して格納されることはない。但し、同じ 符号ィ匕方式であればピクチャバウンダリやオーディオフレームのバウンダリは保証せ ずとも良い。図 9に示すように複数の PESパケットで 1つのフレームを格納したり、 1つ の PESパケットに複数のフレームを格納するケースもありうる。
[0071] 図 10 (&)〜(じ)と図11 (&)〜(じ)に、トランスポートストリームとプログラムストリームの 個別のデータ構造を示す。
[0072] 図 10 (a)〜(c)、図 12 (a)〜(d)に示すように、 TSパケットは、 TSパケットヘッダと、 適用フィールドと、ペイロード部から構成される。 TSパケットヘッダには PID (Packet Identifier)が格納され、これにより、 TSパケットが所属するビデオストリームまたは オーディオストリーム等の各種ストリームが識別される。
[0073] 適用フィールドには PCR (Program Clock Reference)が格納される。 PCRは ストリームをデコードする機器の基準クロック(STC)の参照値である。機器は典型的 には PCRのタイミングでシステムストリームをデマルチプレタスし、ビデオストリーム等 の各種ストリームに再構築する。
[0074] PESヘッダには、 DTS (Decoding Time Stamp)と PTS (Presentation Tim e Stamp)が格納される。 DTSは当該 PESパケットに格納されるピクチャ Zオーディ オフレームのデコードタイミングを示し、 PTSは映像音声出力等のプレゼンテーショ ンタイミングを示す。
[0075] なお、全ての PESパケットヘッダに PTS、 DTSを有する必要はなぐ Iピクチャの先 頭データが格納開始される PESパケットのヘッダに PTS、DTSがあればデコード及 び出力に支障はない。
[0076] TSパケットの構造の詳細は図 12 (a)〜(d)に示される。
[0077] 図 12 (a)〜(d)に示すように、適用フィールドには PCRにカ卩えて、ランダムアクセス 表示フラグが格納され、当該フラグにより、対応するペイロード部にビデオ'オーディ ォのフレーム先頭であってアクセスポイントとなりうるデータを格納するか否かを示す 。また、 TSパケットのヘッダ部には前述した PIDに加えて、 PESパケットの開始を示 すユニット開始表示フラグ、適用フィールドが後続する力否かを示す適用フィールド 制御情報も格納される。ユニット開始表示フラグは新たな PESパケットの開始を示し、 PIDはストリームの種類及び属性を示す。
[0078] 図 11 (a)〜(c)には、プログラムストリームを構成するパックの構造を示す。パックは 、パックヘッダに SCRを有し、格納するパケットのパケットヘッダに stream— idを有し ている。 SCRはトランスポートストリームの PCRと、 stream— idは PIDと実質同じであ る。また PESパケットのデータ構造はトランスポートストリームと共通なため、 PESへッ ダに PTSと DTSが格納される。
[0079] プログラムストリームとトランスポートストリームの大きな違いの 1つに、トランスポート ストリームではマルチプログラムが許される点がある。すなわち、番組という単位では 1 つの番組しかプログラムストリームは伝送できないが、トランスポートストリームは複数 の番組を同時に伝送することを想定している。このため、トランスポートストリームでは 、番組毎に番組を構成するビデオストリームとオーディオストリームカ^ヽずれかを再生 装置が識別することが必要になる。
[0080] 図 13 (a)〜(c2)に、番組を構成するオーディオストリームとビデオストリームの構成 情報を伝送する PATテーブル、 PMAPテーブルを示す。これらの図に示すように、 番組毎に使用されるビデオストリームとオーディオストリームの組み合わせに関する情 報を PMAPテーブルが格納し、番組と PMAPテーブルの組み合わせに関する情報 を PATテーブルが格納する。再生装置は、 PATテーブル、 PMAPテーブルにより 出力が要求された番組を構成するビデオストリームとオーディオストリームを検出する ことができる。
[0081] 次に上述してきたプログラムストリームのパックと、トランスポートストリームの TSパケ ットのディスク上の配置に関して、図 14 (a)〜(c)を用いて説明する。
[0082] 図 14 (a)に示すように、 16個のセクタは ECCブロックを構成する。
[0083] プログラムストリームの形式をとるビデオオブジェクト(PS— VOB)を構成するパック
(PS Pack)は、図 14 (b)が示すように、セクタバウンダリで配置される。パックサイズ もセクタサイズも 2KBだからである。
[0084] 一方、トランスポートストリームの形式をとるビデオオブジェクト(TS1—VOBZTS2
-VOB)は 8KBのサイズを有する単位で ECCブロック内に配置される。この 8KB単 位で 18Bのヘッダ領域を有し、データ領域には ATS情報が付加された TSパケットが 43個配置される。 ATS情報(Arrival Time Stamp Information)は、 DVDレコ ーダにより生成し付加される情報であって、当該バケツトが DVDレコーダに外部より 伝送されてきたタイミングを示す情報である。
[0085] 尚、図 14 (c)に示したように、固定バイトの ATSと MPEG—TSパケットとの組で連 続して記録した MPEG— TSの蓄積フォーマットも有り得る。
[0086] (5. AV情報の管理情報と再生制御の概要)
図 15 (a)、 (b)、図 16 (a)、 (b)は図 7が示すところのビデオ管理情報 (Video Manager)と称されるファイルのデータ構造を示す図である。 [0087] ビデオ管理情報は、各種オブジェクトのディスク上の記録位置等の管理情報を示す オブジェクト情報と、オブジェクトの再生順序等を示す再生制御情報とを有する。
[0088] 図 15 (a)、(b)はディスクに記録されるオブジェクトとして、 PS— VOB # 1〜PS—V OB # n、 TSl—VOB # l〜TSl—VOB # n、 TS2—VOB # l〜TS2—VOB # n がある場合を示す。
[0089] 図 15 (a)が示すように、これらオブジェクトの種類に応じて、 PS— VOB用の情報テ 一ブルと、 TS1— VOB用の情報テーブルと、 TS2— VOB用の情報テーブルが個別 に存在すると共に、各情報テーブルは各オブジェクト毎の VOB情報を有して 、る。
[0090] VOB情報は、それぞれ、対応するオブジェクトの一般情報と、オブジェクトの属性 情報と、オブジェクトの再生時刻をディスク上のアドレスに変換するためのアクセスマ ップ、当該アクセスマップの管理情報を有している。一般情報は、対応するオブジェ タトの識別情報、オブジェクトの記録時刻等を有し、属性情報は、ビデオストリームの コーディングモードをはじめとするビデオストリーム情報 (V_ATR)と、オーディオスト リームの本数 (AST_Ns)と、オーディオストリームのコーディングモードをはじめとす るオーディオストリーム情報 (A_ATR)とから構成される。
[0091] アクセスマップを必要とする理由は 2つある。まず 1つは、再生経路情報がオブジェ タトのディスク上での記録位置をセクタアドレス等で直接的に参照するのを避け、ォブ ジェタトの再生時刻で間接的に参照できるようにするためである。 RAM媒体の場合、 オブジェクトの記録位置が編集等で変更される場合がおこりうるが、再生経路情報が セクタアドレス等で直接的にオブジェクトの記録位置を参照して 、る場合、更新すベ き再生経路情報が多くなるためである。一方、再生時刻で間接的に参照している場 合は、再生経路情報の更新は不要で、アクセスマップの更新のみ行えば良い。
[0092] 2つ目の理由は、 AVストリームが一般に時間軸とデータ(ビット列)軸の二つの基準 を有しており、この二つの基準間には完全な相関性がないためである。
[0093] 例えば、ビデオストリームの国際標準規格である MPEG— 2ビデオの場合、可変ビ ットレート(画質の複雑さに応じてビットレートを変える方式)を用いることが主流になり つつあり、この場合、先頭からのデータ量と再生時間との間に比例関係がないため、 時間軸を基準にしたランダムアクセスができない。この問題を解決するため、オブジェ タト情報は、時間軸とデータ (ビット列)軸との間の変換を行なうためのアクセスマップ を有している。
[0094] 図 15 (a)が示すように再生制御情報は、ユーザ定義再生経路情報テーブル、オリ ジナル再生経路情報テーブル、タイトルサーチポインタを有する。
[0095] 図 16 (a)が示すように、再生経路には、 DVDレコーダがオブジェクト記録時に記録 された全てのオブジェクトを示すように自動生成するオリジナル定義再生経路情報と 、ユーザが自由に再生シーケンスを定義できるユーザ定義再生経路情報の 2種類が ある。再生経路は DVDでは PGC情報(Program Chain Information)と統一的 呼称され、また、ユーザ定義再生経路情報は U— PGC情報、オリジナル再生経路情 報は O— PGC情報と呼称される。 O— PGC情報、 U— PGC情報はそれぞれ、ォブ ジヱタトの再生区間であるセルを示す情報であるセル情報をテーブル形式で列挙す る情報である。 O— PGC情報で示されるオブジェクトの再生区間はオリジナルセル( O— CELL)と呼称され、 U— PGC情報で示されるオブジェクトの再生区間はユーザ セル(U— CELL)と呼称される。
[0096] セルは、オブジェクトの再生開始時刻と再生終了時刻でオブジェクトの再生区間を 示し、再生開始時刻と再生終了時刻は前述したアクセスマップにより、オブジェクトの 実際のディスク上の記録位置情報に変換される。
[0097] 図 16 (b)が示すように、 PGC情報により示されるセル群は、テーブルのエントリ一順 序に従って順次再生される一連の再生シーケンスを構成する。
[0098] 図 17は、オブジェクト、セル、 PGC、アクセスマップの関係を具体的に説明する図 である。
[0099] 図 17に示すように、オリジナル PGC情報 50は少なくとも 1つのセル情報 60、 61、 6 2、 63を含む。セル情報 60· ··は再生するオブジェクトを指定し、かつ、そのオブジェ タトタイプ、オブジェクトの再生区間を指定する。 PGC情報 50におけるセル情報の記 録順序は、各セルが指定するオブジェクトが再生されるときの再生順序を示す。
[0100] 一のセル情報 60には、それが指定するオブジェクトの種類を示すタイプ情報 (Typ e) 60aと、オブジェクトの識別情報であるオブジェクト ID (Object ID) 60bと、時間 軸上でのオブジェクト内の開始時刻情報(Start PTM) 60cと、時間軸上でのォブ ジェタト内の終了時刻情報(End— PTM) 60dと力 S含まれる。
[0101] データ再生時は、 PCG情報 50内のセル情報 60が順次読み出され、各セルにより 指定されるオブジェクトが、セルにより指定される再生区間分再生されることになる。
[0102] アクセスマップ 80cは、セル情報が示す開始時刻情報と終了時刻情報とをオブジェ タトのディスク上での位置情報に変換する。
[0103] 上述したマップ情報である力 オブジェクトの記録時にともに生成され記録される。
マップを生成するためには、オブジェクトのデータ内のピクチャ構造を解析する必要 がある。具体的には図 9で示す Iピクチャの位置の検出と、図 10 (a)〜(c)、図 11 (a)
〜(c)に示す当該 Iピクチャの再生時刻である PTS等のタイムスタンプ情報の検出が 必要になる。
[0104] ここで、 PS— VOBと TS1— VOBと TS2— VOBのマップ情報を生成する際に生じ る問題について以下説明する。
[0105] PS— VOB、 TS— VOB1は、図 1で説明したように主として、受信されたアナログ放 送を DVDレコーダが MPEGストリームにエンコードすることにより生成される。このた め、 Iピクチャや各種タイムスタンプの情報は自らが生成しており、 DVDレコーダにと つてストリーム内部のデータ構造は明確であり、マップ情報の生成になんの問題も生 じない。
[0106] 次に、 TS2— VOBであるが、図 1で説明したように主として、受信されたデジタル放 送を DVDレコーダがエンコードすることなく直接ディスクに記録する。このため、 PS VOBのように Iピクチャの位置とタイムスタンプ情報を自ら生成するわけではな!/、た め、 DVDレコーダにとってストリーム内部のデータ構造は明確ではなぐ記録するデ ジタルストリーム力もこれら情報を検出することが必要になる。
[0107] このため、 DVDレコーダは、レコーダ外部にてエンコードされたストリームを記録し て!、る TS2— VOBのマップ情報につ!ヽては下記のように Iピクチャとタイムスタンプを 検出する。
[0108] まず、 Iピクチャの検出は、図 12 (a)〜(d)に示す TSパケットの適用フィールドのラ ンダムアクセス表示情報を検出することにより行う。また、タイムスタンプの検出につい ては、 PESヘッダの PTSを検出することにより行う。タイムスタンプについては、 PTSの代わりに、適用フィールドの PCRや、 TSパケットが DVDレコーダに伝送され てきた到着タイミングである ATSで代用することもある。いずれにせよ、 DVDレコーダ は MPEGストリームのビデオ層のデータ構造を解析することなぐその上位層である システム層の情報により、 Iピクチャの位置を検出する。これは、マップ情報を生成す るためにビデオ層の解析まで行うのはシステムの負荷が大き 、ためである。
[0109] また、システム層の検出が不可能な場合もありうる力 この場合は、マップ情報が生 成できないため、有効なマップ情報が無いことを示すことが必要になる。 DVDレコー ダでは図 15 (b)に示すマップ管理情報によりこれらが示される。
[0110] 図 15 (b)に示すようにマップ管理情報は、マップ有効性情報と自己ェンコ一ディン グフラグとを有する。 自己エンコーディングフラグは、 DVDレコーダ自らがエンコード したオブジェクトであることを示し、内部のピクチャ構造が明確であり、マップ情報のタ ィムスタンプ情報や Iピクチャの位置情報等が正確であることを示している。また、マツ プ有効性情報は、有効なアクセスマップの有無を示す。
[0111] なお、システム層の検出が不可能な例としては、適用フィールドが設定されていな い場合や、そもそも MPEGトランスポートストリームで無いデジタルストリームの場合が 考えうる。デジタル放送が世界各国で各種方式が成立しうるため、 DVDレコーダが マップを生成できないオブジェクトを記録するケースも当然予想される。例えば、 日本 のデジタル放送を想定した DVDレコーダを米国で使用し、米国のデジタル放送を記 録した場合、マップを生成できな 、オブジェクトを記録するケースが出てくる。
[0112] 但し、 DVDレコーダはマップ情報が生成されないオブジェクトについても、先頭か ら順次再生することは可能である。この場合、記録されたデジタルストリームをデジタ ル IZFを介して、当該ストリームに対応した STBに出力することでこれを映像再生す ることがでさる。
[0113] (6.再生機能の基本動作)
次に、図 18を用いて上記光ディスクを再生する DVDレコーダプレーヤの再生動作 について説明する。
[0114] 図 18に示すように、プレーヤは、光ディスク 100からデータを読み出す光ピックアツ プ 201と、読み出したデータのエラー訂正等を行なう ECC処理部 202と、エラー訂正 後の読み出しデータを一時的に格納するトラックバッファ 203と、動画オブジェクト(P S— VOB)等のプログラムストリームを再生する PSデコーダ 205と、デジタル放送ォ ブジェクト(TS2— VOB)等のトランスポートストリームを再生する TSデコーダ 206と、 オーディオ 'オブジェクト (AOB)を再生するオーディオデコーダ 207と、静止画ォブ ジェタト(POB)をデコードする静止画デコーダ 208と、各デコーダ 205、 206· "への データ入力を切り換える切換え手段 210と、プレーヤの各部を制御する制御部 211 とを備える。
[0115] 光ディスク 100上に記録されているデータは、光ピックアップ 201から読み出され、 ECC処理部 202を通してトラックバッファ 203に格納される。トラックバッファ 203に格 納されたデータは、 PSデコーダ 205、 TSデコーダ 206、オーディオデコーダ 207、 静止画デコーダ 208の何れかに入力されデコードおよび出力される。
[0116] このとき、制御部 211は読み出すべきデータを図 16が示す再生経路情報 (PGC) が示す再生シーケンスに基づき決定する。すなわち、図 16の例であれば、制御部 21 1は、 VOB # 1の部分区間(CELL # 1)を最初に再生し、次 、で、 VOB # 3の部分 区間(CELL # 2)を再生し、最後に VOB # 2 (CELL # 3)と再生する制御を行う。
[0117] また、制御部 211は、図 17が示す再生経路情報 (PGC)のセル情報により、再生す るセルのタイプ、対応するオブジェクト、オブジェクトの再生開始時刻、再生終了時刻 を獲得することができる。制御部 211は、セル情報により特定されるオブジェクトの区 間のデータを、適合するデコーダに入力する。
[0118] この際、制御部 211は、セル情報の Object IDにより再生対象のオブジェクトを特 定する。さらに、制御部 211は、特定したオブジェクトの再生区間であるセルの特定 を、セル情報の StartPTMと EndPTMを、対応する VOB情報のアクセスマップでデ イスク情報のアドレスに変換することにより行う。
[0119] また、本実施形態のプレーヤは、さらに、 AVストリームを外部に供給するためのデ ジタルインターフェース 204を有している。これにより、 AVストリームを IEEE1394や I EC958などの通信手段を介して外部に供給することも可能である。これは、特に、自 らがエンコードしていない TS2—VOBについては、プレーヤ内部に該当するデコー ダが存在しないケースもありうるため、デコードすることなぐ直接、デジタルインターフ エース 204を通じて外部の STBに出力し、その STBで再生させることができる。
[0120] 外部にデジタルデータを直接出力する際には、制御部 211は図 15 (b)のマップ管 理情報に基づき、ランダムアクセス再生が可能かを否カゝ判断する。アクセスポイント情 報フラグが有効であれば、アクセスマップは Iピクチャの位置情報を有する。このため 、制御部 211は外部機器から早送り再生等の要求があればこれに応じて、 Iピクチャ を含むデジタルデータをデジタル IZFを介して外部機器に出力することができる。ま た、タイムアクセス情報フラグが有効であれば、タイムアクセスが可能である。このため 制御部 211は、外部の機器力ものタイムアクセスの要求に応じて、指定された再生時 刻に相当するピクチャデータを含むデジタルデータをデジタル IZFを介して外部機 器に出力することができる。
[0121] (7.記録機能の基本動作)
次に、図 19を用いて上記光ディスクに対して記録、再生を行なう本発明に係る DV Dレコーダの構成および動作にっ 、て説明する。
[0122] 図 19に示すように、 DVDレコーダは、ユーザへの表示およびユーザからの要求を 受け付けるユーザインターフェース部 222、 DVDレコーダ全体の管理および制御を 司るシステム制御部 212、 VHFおよび UHFを受信するアナログ放送チューナ 213、 アナログ信号をデジタル信号に変換し MPEGプログラムストリームにエンコードする エンコーダ 214、デジタル衛星放送を受信するデジタル放送チューナ 215、デジタル 衛星で送られる MPEGトランスポートストリームを解析する解析部 216、テレビおよび スピーカなどの表示部 217、 AVストリームをデコードするデコーダ 218とを備える。デ コーダ 218は、図 18に示した第 1及び第 2のデコーダ等力もなる。さらに、 DVDレコ ーダは、デジタルインターフェース部 219と、書きこみデータを一時的に格納するトラ ックバッファ 220と、 DVD— RAM100にデータを書きこむドライブ 221とを備える。デ ジタルインターフェース部 219は IEEE1394等の通信手段により外部機器にデータ を出力するインターフェースである。
[0123] このように構成される DVDレコーダにおいては、ユーザインターフェース部 222が 最初にユーザからの要求を受ける。ユーザインターフェース部 222はユーザからの要 求をシステム制御部 212に伝え、システム制御部 212はユーザ力もの要求を解釈す ると共に各モジュールへの処理要求を行う。
[0124] 録画には、入力されるデジタルデータを自らエンコードするセルフエンコーディング と、エンコード済みのデジタルデータをエンコードすることなくディスクに記録するァゥ トサイドエンコーディングがある。
[0125] (7. 1 セルフエンコーディングによる録画動作)
最初にセルフエンコーディングの録画について、アナログ放送を PS— VOBにェン コードして記録する動作を以下、具体的に説明する。
[0126] システム制御部 212はアナログ放送チューナ 213への受信とエンコーダ部 214へ のエンコードを要求する。
[0127] エンコーダ部 214はアナログ放送チューナ 213から送られる AVデータをビデオェ ンコード、オーディオエンコードおよびシステムエンコードしてトラックバッファ 220に 送出する。
[0128] エンコーダ部 214は、エンコード開始直後に、エンコードしている MPEGプログラム ストリームの先頭データが有するタイムスタンプ情報を再生開始時刻(PS—VOB— V— S— PTM)としてシステム制御部 212に送り、続いてアクセスマップを作成するた めに必要な情報をエンコード処理と平行してシステム制御部 212に送る。この値は、 後に生成される図 17に示すセル情報の Start— PTMに設定される。タイムスタンプ 情報は、一般的には PTSになるが SCRで代用しても良 、。
[0129] 次にシステム制御部 212は、ドライブ 221に対して記録要求を出し、ドライブ 221は トラックバッファ 220に蓄積されているデータを取り出し DVD— RAMディスク 100に 記録する。この際、前述した連続領域 (CDA)をディスク上の記録可能領域力 検索 し、検索した連続領域にデータを記録していく。
[0130] 録画終了はユーザからのストップ要求によって指示される。ユーザからの録画停止 要求は、ユーザインターフェース部 222を通してシステム制御部 212に伝えられ、シ ステム制御部 212はアナログ放送チューナ 213とエンコーダ部 214に対して停止要 求を出す。
[0131] エンコーダ 214はシステム制御部 212からのエンコード停止要求を受けエンコード 処理を止め、最後にエンコードを行った MPEGプログラムストリームの終端データが 有するタイムスタンプ情報を再生終了時刻(PS— VOB— V— E— PTM)として、シス テム制御部 212に送る。この値は、図 17に示すセル情報の End— PTMに設定され る。タイムスタンプ情報は通常 PTSが設定される力 SCRで代用しても良い。
[0132] システム制御部 212は、エンコード処理終了後、エンコーダ 214力も受け取った情 報に基づき、図 15に示す PS—VOB用の VOB情報(PS—VOBI)と再生制御情報 を生成する。
[0133] ここで、生成される VOB情報はオブジェクト種類に適合したアクセスマップとマップ 管理情報とを含む。システム制御部 212は、マップ管理情報のマップ有効性情報を 有効に設定すると共に、自己エンコーディングフラグを ONにする。
[0134] また、再生制御情報は、記録されるオブジェクトを再生対象の 1つとする図 16に示 すオリジナル再生経路 (O— PGC情報)が生成される。生成された O— PGC情報は オリジナル再生経路テーブルに追記される。オリジナル再生経路 (O— PGC情報)は セル情報を有する。セル情報のタイプ情報には「PS— VOB」が設定される。
[0135] 最後にシステム制御部 212は、ドライブ 221に対してトラックバッファ 220に蓄積さ れて 、るデータの記録終了と、 PS VOB用の VOB情報(PS— VOBI)および再生 制御情報の記録を要求し、ドライブ 221がトラックバッファ 220の残りデータと、これら の情報を DVD— RAMディスク 100に記録し、録画処理を終了する。
[0136] なお、アナログ放送を TS1—VOBにエンコードしてももちろん良い。この場合、ェン コーダ 214はアナログ信号をデジタル信号に変換し MPEGトランスポートストリームに エンコードするエンコーダである必要があり、セル情報内のタイプ情報は「TSl—VO Bjに設定される。
この場合の Start— PTMおよび End— PTMは、 PTSでも良!、し PCRを用いても良 い。
[0137] (7. 2 アウトサイドエンコーディングによる録画動作)
次にアウトサイドェンコーデイングによる録画にっ 、て、デジタル放送を録画する動 作を通して以下、具体的に説明する。この場合、記録されるオブジェクトの種類は TS 2— VOBになる。
[0138] ユーザによるデジタル放送録画要求は、ユーザインターフェース部 222を通してシ ステム制御部 212に伝えられる。システム制御部 212はデジタル放送チューナ 215 への受信と解析部 216へのデータ解析を要求する。
[0139] デジタル放送チューナ 215から送られる MPEGトランスポートストリームは解析部 2 16を通してトラックバッファ 220へ転送される。
[0140] 解析部 216は、最初にデジタル放送として受信されたエンコード済みの MPEGトラ ンスポートストリーム(TS2— VOB)の VOB情報(TS2— VOBI)の生成に必要な情 報として、トランスポートストリームの先頭データが有するタイムスタンプ情報を開始時 刻情報 (TS2— VOB— V— S— PTM)として抽出し、システム制御部 212に送る。開 始時刻情報は、後に生成される図 17に示すセル情報の Start— PTMに設定される 。このタイムスタンプ情報は、 PCR又は PTSになる。また、オブジェクトが DVDレコー ダに伝送されてくるタイミングである ATSで代用しても良い。
[0141] 解析部 216は、さらに、 MPEGトランスポートストリームのシステム層を解析し、ァク セスマップ作成に必要な情報を検出する。 Iピクチャのオブジェクト内での位置にっ ヽ ては、前述したように TSパケットヘッダ中の適用フィールド(adaptation field)内の ランダムアクセスインジケータ(randam— access— indicator)をもとに検出する。
[0142] 次にシステム制御部 212は、ドライブ 221に対して記録要求を出力し、ドライブ 221 はトラックバッファ 220に蓄積されているデータを取り出し DVD— RAMディスク 100 に記録する。この時、システム制御部 212はファイルシステムのアロケーション情報か らディスク上のどこに記録するかをあわせてドライブ 221に指示する。この際、前述し た連続領域 (CDA)をディスク上の記録可能領域から検索し、検索した連続領域に データを記録していく。
[0143] 録画終了はユーザからのストップ要求によって指示される。ユーザからの録画停止 要求は、ユーザインターフェース部 222を通してシステム制御部 212に伝えられ、シ ステム制御部 212はデジタルチューナ 215と解析部 216に停止要求を出す。
[0144] 解析部 216はシステム制御部 212からの解析停止要求を受け解析処理を止め、最 後に解析を行った MPEGトランスポートストリームの終了区間のデータが有するタイ ムスタンプ情報を表示終了時刻 (TS 2_VOB_V_E_PTM)としてシステム制御 部 212に送る。この値は、図 17に示すセル情報の End PTMに設定される。このタ ィムスタンプ情報は、 PCR又は PTSになる。また、オブジェクトが DVDレコーダに伝 送されてくるタイミングである ATSで代用しても良 、。
[0145] システム制御部 212は、デジタル放送の受信処理終了後、解析部 216から受け取 つた情報に基づき、図 15に示す TS2— VOB用の VOB情報(TS2— VOBI)と再生 制御情報を生成する。
[0146] ここで、生成される VOB情報はオブジェクト種類に適合したアクセスマップとマップ 管理情報とを含む。システム制御部 212は、 Iピクチャのオブジェクト内での位置等を 検出でき有効なアクセスマップを生成した場合にはマップ管理情報のマップ有効性 情報を有効に設定する。また自己エンコーディングフラグは OFF設定をする。有効な アクセスマップを生成できな力つた場合にはマップ有効性情報を無効に設定する。な お、有効なアクセスマップを生成できないケースとしては、対応していないデジタル放 送を受信した場合や、適用フィールドにランダムアクセス情報が無い場合等が考えら れる。また、デジタル I/Fから直接入力された場合は、 MPEGトランスポートストリー ムでないケースもありえ、この場合も当然、マップ有効性情報は無効に設定される。
[0147] また、再生制御情報は、記録されるオブジェクトを再生対象の 1つとする図 16に示 すオリジナル再生経路 (O— PGC情報)が生成される。生成された O— PGC情報は オリジナル再生経路テーブルに追記される。オリジナル再生経路 (O— PGC情報)は セル情報を有する。セル情報のタイプ情報には「TS2— VOB」が設定される。
[0148] 最後にシステム制御部 212は、ドライブ 221に対してトラックバッファ 220に蓄積さ れているデータの記録終了と、 TS2—VOB用の VOB情報(TS2— VOBI)および再 生制御情報の記録を要求し、ドライブ 221がトラックバッファ 220の残りデータと、これ らの情報を DVD— RAMディスク 100に記録し、録画処理を終了する。
[0149] 以上、ユーザからの録画開始および終了要求をもとに動作を説明した力 例えば、 VTRで使用されて ヽるタイマー録画の場合では、ユーザの代わりにシステム制御部 が自動的に録画開始および終了要求を発行するだけであって、本質的に DVDレコ ーダの動作が異なるものではな 、。
[0150] (8.詳細な実施形態)
第 1の実施例. 本発明の情報記録 z再生装置の記録 z再生時の基本動作に関しては、ほぼ前述 の説明の通りであるため、以下にアナログ外部入力記録時の基本動作に関してのみ 図 20を用いて具体的に説明する。この場合、記録されるオブジェクトの種類は TS1 VOBになる。
[0151] ユーザによる外部入力録画要求は、ユーザインターフェース部 222を通してシステ ム制御部 212に伝えられる。システム制御部 212は外部入力部 223への受信とェン コーダ 214へのデータ符号化を要求する。
[0152] エンコーダ 214から送られる MPEGトランスポートストリームはトラックバッファ 220へ 転送される。
[0153] エンコーダ 214は、最初にエンコード済みの MPEGトランスポートストリーム(TS1
-VOB)の VOB情報(TS1— VOBI)の生成に必要な情報として、トランスポートスト リームの先頭データが有するタイムスタンプ情報を開始時刻情報 (TS1—VOB—V — S— PTM)として設定し、システム制御部 212に送る。開始時刻情報は、後に生成 される図 17に示すセル情報の Start— PTMに設定される。このタイムスタンプ情報 は、 PCR又は PTSになる。
[0154] エンコーダ 214は、さらに、 MPEGトランスポートストリームを生成しながら、アクセス マップ作成に必要な情報を生成する。
[0155] 例えば、 Iピクチャの先頭 MPEGトランスポートパケットには、 adaptation fieldを 格糸内し、 random— access— indicatorのビットを立て、 VOBUのスタートであること をシステム制御部 212に転送する。
[0156] 次にシステム制御部 212は、ドライブ 221に対して記録要求を出力し、ドライブ 221 はトラックバッファ 220に蓄積されているデータを取り出し DVD— RAMディスク 100 に記録する。この時、システム制御部 212はファイルシステムのアロケーション情報か らディスク上のどこに記録するかをあわせてドライブ 221に指示する。この際、前述し た連続領域 (CDA)をディスク上の記録可能領域から検索し、検索した連続領域に データを記録していく。
[0157] 録画終了はユーザからのストップ要求によって指示される。ユーザからの録画停止 要求は、ユーザインターフェース部 222を通してシステム制御部 212に伝えられ、シ ステム制御部 212はエンコーダ 214に停止要求を出す。
[0158] エンコーダ 214はシステム制御部 212からの記録停止要求を受け符号ィ匕処理を止 め、最後に符号ィ匕を行った MPEGトランスポートストリームの終了区間のデータが有 するタイムスタンプ情報を表示終了時刻(TS1— VOB— V— E— PTM)としてシステ ム制御部 212に送る。この値は、図 17に示すセル情報の End— PTMに設定される。 このタイムスタンプ情報は、 PCR又は PTSになる。
[0159] システム制御部 212は、記録処理終了後、エンコーダ 214から受け取った情報に 基づき、図 15に示す TS1— VOB用の VOB情報 (TS1— VOBI)と再生制御情報を 生成する。
[0160] ここで、生成される VOB情報はオブジェクト種類に適合したアクセスマップとマップ 管理情報とを含む。システム制御部 212は、マップ管理情報のマップ有効性情報を 有効に設定する。また自己エンコーディングフラグは ON設定をする。
[0161] また、再生制御情報は、記録されるオブジェクトを再生対象の 1つとする図 16に示 すオリジナル再生経路 (O— PGC情報)が生成される。生成された O— PGC情報は オリジナル再生経路テーブルに追記される。オリジナル再生経路 (O— PGC情報)は セル情報を有する。セル情報のタイプ情報には「TS1— VOB」が設定される。
[0162] 最後にシステム制御部 212は、ドライブ 221に対してトラックバッファ 220に蓄積さ れて ヽるデータの記録終了と、 TS 1 VOB用の VOB情報 (TS 1— VOBI)および再 生制御情報の記録を要求し、ドライブ 221がトラックバッファ 220の残りデータと、これ らの情報を DVD— RAMディスク 100に記録し、録画処理を終了する。
[0163] 以下、エンコーダ 214にて生成されるセルフエンコーディング MPEGトランスポート ストリームの詳細について説明する。
[0164] 図 21 (a)にセルフエンコーディング MPEGトランスポートストリームの構造を示す。
同図に示すように、セルフエンコーディングの MPEGトランスポートストリームは VOB U単位に区切られ、各 VOBUの先頭には PATパケットと PMTパケットさらにはストリ ームに固有の情報を埋め込んだユーザプライベートパケット(以下「UPパケット」と称 す。)が続いている。または、少なくとも VOBの先頭には PATパケット、 PMTパケット が配置される。 [0165] 図 21 (b)に示したように、それぞれのパケットにはデコーダ入力時刻情報である AT Sが付与されており、個々のパケットは対応する ATSで意図された時刻にデコーダへ 転送される。
[0166] 先頭パケットの PATパケットには、セルフエンコーディングのプログラム情報(PMT パケットの PID等)が格納され、 ATS1の時刻でデコーダに入力される。
[0167] 2番目のパケットの PMTパケットには、プログラムを構成するエレメンタリーストリー ムごとの PID等が格納される。ここでは、ビデオ、オーディオ、データ放送(図中の" D ata")、ユーザプライベート(図中の〃 private")パケットの PIDを格納した例を示す。
[0168] 3番目のパケットの UPパケットには、ストリームへの付加情報が格納される。例えば 、ストリームのタイトル情報や、記録日時情報や、ストリームの符号ィ匕情報 (ビットレート 、ビデオ解像度、フレームレート、アスペクト比、符号ィ匕方式等)であるストリーム属性 や、外部入力がアナログかデジタルか等の識別する入力源識別情報や、さらにはデ ジタルであった場合に入力 AVデータの符号化方式を特定する情報や、コピー許可 Z不許可等の著作権保護情報や、 VBI (Vertical Blanking Interval)信号であ る、クローズドキャプション (CC)やテレテキストデータ、または表示制御を指定する W SS (Wide - Screen Signaling)等や、システムエンコードの条件を示した情報や、 各種 DVD規格との変換性 (互換性)を示す情報や、該ストリームを記録した製造業 者の固有データ等を用いてユーザ利便性の高 、メニュー情報や、各種 DVD規格対 応の MPEG— PSに変換する際に有用な様々なデータを格納することが考えられる。
[0169] 前述のように MPEGトランスポートストリーム内に配置され、付加情報を格納された パケットのデコーダ入力時刻について図 22 (a)、(b)を用いて詳細に説明する。
[0170] 図 22 (a)はトランスポートストリームシステムターゲットデコーダ (T—STD)と呼ばれ る基本的なデコーダの構成を示したブロック図であり、前述では触れて 、なかった PS Iパケットを解析し、デコーダの制御を行うシステムデコーダ 235も加えて示した図で ある。
[0171] PSIパケットである PAT、 PMTパケットは、 T—STDに入力されると、デマルチプレ クサ 232でパケット種別に応じて弁別され、システムコントロールに関する PSIパケット はトランスポートバッファ 233に瞬時に転送される。 [0172] 続いて、トランスポートバッファ 233に蓄積されたデータは随時システムバッファ 234 に 1000000ビット Z秒( = Rsys)のレートで転送される。
[0173] PSIデータが有効になるのは、システムバッファ 234に必要な PSIのデータが揃つ た瞬間である。
[0174] このように MPEGの T—STDモデルでは、デコーダの動作モデルを規定し、 MPE
Gトランスポートストリームの転送レート等の基準を定めている。
[0175] 情報記録装置は T STDにて正しく復号が可能と保証される MPEGトランスポート ストリームの形式に従いセルフエンコーディングする必要があるため、 PSIパケットの 転送にはいくつかの制限がある。以下に図 22 (b)を用いて、パケット転送レートを決 定する ATSの決定方法にっ 、て説明する。
[0176] セルフエンコーディングストリームの再生時には、まずは先頭の PAT、 PMT、 UP パケットがそれぞれ ATS 1、 ATS2、 ATS3が示す時刻に T—STDに入力される。
[0177] PMTパケットと UPパケットに注目すれば、 PMTパケットで指定された UPパケット の PIDを T— STDが解釈し、有効にするためには、 TS— program— map— section
(mバイト)の最後のバイトがシステムバッファ 234に蓄えられて 、る必要がある。
[0178] つまり、 PMTが有効になるには、 PMTパケット入力時刻である ATS2から、 (m+n
+ 5) X 8ZRsys秒が経過しなければならない。ここで、 nは PMTパケットの adaptati on— fieldのバイト長である。
[0179] T—STDの基準クロックである System Clock Frequency (SCF)は 27000000
Hz (誤差として ± 810Hzまでの許容範囲が規定されている)であるため、 ATSを Sys tern Clock Frequencyの時刻精度で表した時刻情報だとすると、 ATS3と ATS2 の間には以下の関係が成り立つ必要がある。
[0180] ATS3≥ATS2 + ((m+n+5)*8/Rsys)*SCF
さらに、 ATS2と ATS3の最小間隔は PMTパケット内に adaptation— fieldがなく( n=0)、かつ PMTパケットには最小の TS— program— map— section (21バイト) が格納されているのみの時であるため、この場合 208ZRsys X SCFの時間間隔が 最小となる。
[0181] 同様に、 PATパケットの入力時刻 ATS1と PMTパケットの入力時刻 ATS2に関し ても、 PATノケット内の Program association
sectionのバイト長を mOとし、 PATパケットの adaptation— fieldのバイト長を ηθと すれば、以下の関係を満足する必要がある。
[0182] ATS2≥ATS1 + ((mO+nO+5)*8/Rsys)*SCF
さらに、 ATS 1と ATS2の最小間隔は PATパケット内に adaptation— fieldがなく( n0 = 0)、かつ PATパケットには最小の Program association section (16ノイト) が格納されているのみの時であるため、この場合 168ZRsys X SCFの時間間隔が 最小となる。
[0183] System Clock Frequency (SCF)を 27MHzとして時間を 27MHzの精度で表 現すれば、 ATS 1と ATS 2の時間間隔および ATS 2と ATS 3の時間間隔の最小値 は、それぞれ 4536と 5616となる。
[0184] 続いて、図 23、図 24、図 25、図 26を用いて、 User Privateパケット(UPパケット) のセルフエンコーディングトランスポートストリームへの格納方法について説明する。
[0185] 図 23では、 UPパケットを User Private streamとして定義した場合の UPバケツ ト格納方法を示している。この場合、 UPパケットに対応する PMTの stream— type には、 0x80以上でかつ OxFF以下の識別番号が割り振られ、 UPパケットには固有 の PIDが付与され、 UPパケット内部のデータ構造は MPEG規格外となる。また、ここ では UPパケット内に、 DVD— attribute— section ()というセクション構造を持たせ た例を示している。
[0186] また、図 24では、 UPパケットを private— section構造を持たせ、固有の PIDを付 する場合の格糸内方法を示して 、る。 private _ section内の section _ syntax _ in dicatorの値によって、 private— sectionのデータ構造が若干異なる力 UPパケット の固有データは private— sectionの private— data— byteに格納される。この場合 、 stream— typeには、 0x05の識別番号が割り振られる。
[0187] また、図 25では、 UPパケットを PMTと同じ PIDのパケットとして格納する方法が示 されている。この場合、 UPパケットのデータ構造は private— section構造に従う。こ の場合、 stream— typeは定義されず、 UPパケットには PMTパケットの PIDが付与 される。 [0188] また、図 26では、 UPパケットを個別に設けずに、 PMTパケットに内包する方法が 示されている。この場合も、 UPパケットに該当する固有データは private— section 構造となり、 TS _ program一 map _ sectionに続 、て private _ section力 述 れ る。すなわち、 PMTノヽケット内に、 TS一 program一 map一 sectionと private一 sect ionの両方を格納して!/、る。
[0189] ここで、前述の方法によって MPEG— TSに格納される固有データの詳細について 、説明する。
[0190] 図 23、図 24、図 25、図 26にて記述されているように、固有データとしては、 DVD Video Recording規格の RDI Unitの RDI— GI (Rea time Data Information ueneral Information)と、 DCI一 CCI (Display Control Information and し opy Control Information)を持つ。
[0191] RDI— GIは、該当 VOBUの先頭再生開始時刻(VOBU— S— PMT)と、記録日 時情報を格納し、 DCI— CCIは、当該 VOBU内のアスペクト比情報、サブタイトルモ ード情報、フィルム 'カメラモード情報等の表示制御に関わる情報と、コピー世代管理 情報や、 APS情報、入力ソース情報等が格納されている。(RDI— GIと DCI— CCI の詳細については DVD Video Recording規格を参照。)
[0192] また、 V— ATRには、ビデオのビットレート情報、解像度情報、フレームレート情報( もしくは NTSCZPAL等の video— format情報)、アスペクト比情報、符号化方式( MPEG2— Videoや、 MPEG1— Video等の識別)の情報が格納される。
[0193] 同様に、 A— ATRにも、オーディオの本数に応じて、全部もしくは一部のオーディ ォのビットレート、符号化方式、チャンネル数、量子化ビット数、ダイナミックレンジコン トロール等の情報が格納される。
[0194] また、 CCには、当該 VOBU内の Closed Captionデータが格納される。 CCデー タの格納には、 PS変換の移植性を高めるために、予め extension— and— user— d ata (l) (GOPレイヤーでユーザデータを格納する方法)形式で記述しても良いし、 C Cデータを別記述方式で記述しても良 ヽ。
[0195] GOPレイヤーのユーザデータに CCデータを格納する形式で記述するのが MPEG — PS変換の効率を高めるのは、 DVD— Videoや DVD Video Recording規格が そのようにして!/ヽるからである。
[0196] また、 C— SEには、当該 VOBU (もしくは VOB)の TS2PS変換時に問題となるいく つかの問題点に対する情報が記述されている。
[0197] 例えば、 CCZWSSZTeletextデータ格納位置情報には、 CCデータが UPバケツ トにあるの力、各ピクチャヘッダのユーザデータとして記述されているの力 もしくはこ の VOBU (VOB)に CCデータが無!、のか等を識別するための情報である。
[0198] WSS格納位置情報については、固有データとして UPパケットにまとめて格納され ているのか、各ピクチャヘッダのユーザデータに記述されているのか等を示す情報で ある。
[0199] Teletext格納位置情報につ!、ては、 Teletextを格納した TSパケットを設けて格 納されているの力 各ピクチャヘッダのユーザデータに記述されているのか等を示す 情報である。
[0200] 多重化ブロック構造 ·転送情報については、図 27に示す多重化ブロック(1つのェ レメンタリーストリームのみ力 他のエレメンタリーストリームと混在することなく格納さ れたデータブロック)を構成する TSパケットが固定数なのか可変数なの力、また、固 定数ならばその固定数を表す情報や、 PTSZDTSが多重化ブロックの先頭 TSパケ ットに付与されているかを示す情報や、同一多重化ブロック内での転送レートについ ての情報等が記述されている。従来の多重化に条件を課さない MPEG— TSェンコ ード時には、多重化ブロックは 1つの TSパケットからのみ構成される固定長サイズとし て記述することも可能である。
[0201] 各デコーダバッファ制御用情報については、ビデオべリファイングバッファのパラメ ータである vbv— delayや、 vbv— buffer— size等のビデオバッファの余裕量を示す 情報や (この情報を用いてビデオデータを ATSの入力時刻からどれだけ先読みして 良いのか判断することができる)、当該 VOBU内のフレームでバッファ入力時刻が最 もそのフレームのデコード時刻に近いフレームの入力完了時刻とデコード時刻との時 刻差情報 (この情報を用いてビデオ'オーディオデータを ATSの入力時刻からどれ だけ後読みして良いの力判断することができる)等を記述する。
[0202] さらに、 DVD Compatibility情報には、該 MPEG—TSを各 DVD規格に準じた MPEG— PSにトランスコードする際に、どの程度の負荷があるかを示した情報である
[0203] 例えば、多重化ブロックが 2KB以下で構成されていることでレベル 1のインジケータ 、 CC、 WSS、 Teletextデータが存在する場合に、 CC、 WSSデータが UPパケット に格納され、 Teletextがビデオデータを格納した多重化ブロック内に Teletextパケ ットとして格納されていればレベル 2のインジケータ、 CC、 WSS、 Teletextデータを 各 DVD規格で定める領域に格納した際にバッファマネージメントを考慮する必要が なければレベル 3のインジケータ、多重化ブロックの先頭 TSパケットの ATSを SCRに 置換する際に、バッファマネージメントを考慮する必要がなければレベル 4のインジケ ータ等と、該 MPEG— TSを各 DVDのフォーマットに容易に変換できるか否かの変 換性を示す情報である。
[0204] この DVD— Compatibility情報は、 DVD— Video用、 DVD— Audio用、 DVD Video Recording用、 DVD Stream Recording用等といった、 DVDフォーマツ トにそれぞれ対応した変換容易性を示す情報群である。
[0205] 図 27に多重化ブロックを利用した MPEG— TSの構造図と、それを DVD— Video 、 DVD Video Recordingフォーマットに変換した場合のデータ構成図を示した。
[0206] 図 27 (a)に示す自己録 TSストリームは、図 27 (b)に示す自己録 TSストリームの VO BU (再生.復号の単位)から構成される。図 27 (c)に示すように、 1つの VOBUは複 数の多重化ブロック(MPEG— PSのパックに該当する)力 構成される。それぞれの 多重化ブロックは、図 27 (d)に示すように、固定長データサイズに分割されてもよく( これにより機器への実装が簡単になる。)、もしくは、図 27 (e)に示すように、可変長 データサイズに分割されてもよい(この場合、記録媒体の容量を浪費しない)。図 27 ( d)、図 27 (e)の場合は、 PSIZSIパケットや UPパケット等の非エレメンタリーストリー ムと、エレメンタリーストリームとをそれぞれ分離して多重化ブロックを構成して 、るが 、図 27 (f)に示すように、多重化ブロックにおいて、エレメンタリーストリームとともに、 PSIZSIパケットや UPパケット等の非エレメンタリーストリームが格納されてもよ!、。な お、図 27 (f)の場合、多重化ブロック # 1と多重化ブロック # 2とが 1つの多重化ブロッ クとなる。 [0207] さらに上記ストリームは、容易に図 27 (g)に示す DVD— Video形式や、図 27 (h)に 示す DVD Video Recording形式に変換されることができる。
[0208] この場合、多重化ブロックの並びの通りに MPEG— PSのパックが形成され、 1多重 化ブロックは 1パックのデータを格納した単位であること力 TS2PS変換を簡単に行 うために重要である。
[0209] なお、図 27において、カプセルヘッダや、 ATSは本発明と関連が性が低いため、 省略している。また、図 27 (g)、(h)で示した変換後の MPEG— PSの各パックは格 納されるエレメンタリのバイト長や VOBUァライメントに応じて stuffingや paddingがなさ れる。
[0210] 図 28は、図 8で示した従来のストリームの多重化方法と対応して本発明における多 重化を説明した図である。同図に示すように、最終的なフォーマットは図 28 (g)の M PEG— TSに準拠したフォーマットである。ビデオストリーム(図 28 (a) )は複数の GO Pからなる(図 28 (a) )。各 GOPは所定のピクチャデータ力 なり、 MPEG— PSに変 換したときの 1パックのデータ量に相当するデータ量を持つ TSパケット群を 1つの多 重化ブロックとする(図 28 (c)参照)。すなわち、 1つの多重化ブロックは図 28 (d)に 示すように 1パックのデータ量に相当する複数の TSパケットに分割される。オーディ ォストリームについても同様に複数の TSパケットをまとめて 1つの多重化ブロックとす る。そして、図 28 (e)に示すように、多重化ブロック単位で多重化することにより VOB Uを構成する。このように、本発明では、 MPEG— PSの 1パックのデータ量に相当す るデータ量を有するデータを多重化ブロックとしてまとめて配置する(図 28 (e)参照) 点が、図 8に示す従来例に対して最大の相違点である。
[0211] また、 MPEG— TSの各パケットに付与する ATSについて、図 29に示すように、同 一多重化ブロック内においては、一定の増分( Δ ATS)だけ ATSを増加させながら A TSを付与してもよい。このことは、 TS2PSへの変換時に複雑なバッファマネージメン トを行うことを避け、単純なオフセット又はオフセットなしで ATSから SCRに置換する ために有効である。このとき、 ATSi (i=0,l,2,...)は次式の関係を満たす。
[0212] ATSi+ (多重化ブロック内のパケット数) X Δ ATS≤ATSi+l
多重化ブロックが固定長の場合、 1つの多重化ブロックに含まれる TSパケット数は 一定であるため、多重化ブロックの境界を容易に知ることができる。しかし、多重化ブ ロックが可変長であるとき、 1つの多重化ブロックに含まれる TSパケット数は不定であ るため、多重化ブロックの境界を知ることが困難となる。そこで、この場合は、多重化 ブロックの境界における ATS値の増分( Δ ATS)を、多重化ブロック内での増分(一 定値)とは異なる所定の値に設定する。つまり、前の多重化ブロック内の最後のパケ ットの ATS値と、その直後の多重化ブロックの最初のパケットの ATS値との差分( Δ ATS)を、一定値と異なる所定の値に設定する。これにより、 AATSを監視すること により、多重化ブロックの境界を知ることができる。 MPEG— PSへ変換する際の TS パケットとパックとを一対一に対応付けることができる。このとき、 ATSiは次式の関係 を満たす。
[0213] ATSi+ (多重化ブロック内パケット数) X Δ ATS<ATSi+l
また、図 29に示すように、 MPEG—TSにおける多重化ブロックの先頭のパケットに 付与された ATSiと、変換後の MPEG— PSのパック毎に付与される SCRiとが対応す る。
[0214] また、図 29に示すように、 UPパケット内に Closed Captionや DSI等の文字情報 を格納してもよ 、。 UPパケット内の DSIは変換後の NV— PCKのデータ生成に使用 され、 Closed Captionはビデオパックに格納される。また、欧州での PAL規格にも 対応できるように、図 30に示すように多重化ブロックにお 、て Teletextデータを格納 したパケットを、ビデオデータを格納したパケットの間に挿入してもよい。このとき、 Tel etextデータを格納したパケットは、同時に表示される PTSを持つピクチヤの直前に 配置される。 Teletextデータは、変換後はビデオパックに格納される。図 31に上記 のように DSI等を格納する UPパケットのデータ構造を示す。
[0215] また、 UPパケットの付加情報に、 VOBU先頭の Iピクチャの最後のバイトを格納した TSパケットを特定する情報 (VOBU先頭力もの相対番号等)を記述してもよぐこれ により、効率良い特殊再生が実現できる。同様に、 VOBU内のいくつかの I、 Pピクチ ャゃ、全ピクチャのピクチャ符号ィ匕種別情報と、そのピクチヤのデータ長情報 (例えば 、最後のバイトを含んだ TSパケットを特定する情報等)と、各ピクチャの DTSZPTS を示す情報を記述することで、特殊再生を支援することも可能である。 [0216] 尚、前述の実施例において、 PTSZDTSを付与された TSパケットが多重化ブロッ クの先頭になるようにエンコードすれば、 TS2PS変換後のパックの先頭にアクセスュ ニットの先頭が配置されることになり、 DVD固有のヘッダ処理が簡単になる効果が期 待できる。
[0217] 尚、多重化ブロックを形成する TSパケットには MPEG— PSへの変換を考慮し、パ ックに格納されるデータがあふれることの無いように、適宜スタッフイングを入れても良 V、し、多重化ブロック最後の TSパケットからスタッフイングを必要バイト数挿入しても 良い。
[0218] 尚、上記説明においては、 DVDに記録することを中心に説明を行った力 本発明 はこれに限る訳ではなぐ自己録 TSを HDDや半導体メモリー等の情報記録媒体に 記録した後、同一もしくは別の記録媒体上に MPEG— PS変換されたストリームを記 録するようにしても良い。
[0219] 尚、上記説明においては、 PAT、 PMT、 UPパケットを各 VOBUの先頭に記録す るとした力 少なくとも VOBの先頭に記録するとしても良いし、少なくとも再生管理単 位である Cellの先頭に記録するとしても良 、。
[0220] 尚、上記説明においては、 PAT、 PMT、 UPパケットを記録するとした力 UPパケ ットは無くても良い。
[0221] 尚、上記説明においては、 PAT、 PMT、 UPパケットの配置を先頭に固定配置した 力 本発明はこれに限る訳ではなぐ NuUパケットを格納したパケット等を間に挿入し て記録しても良い。
[0222] 尚、上記説明においては、セルフエンコーディングのストリームは PATパケットから 始まるとした力 これに限る訳ではなぐ NuUパケットから始まっても良い。
[0223] 尚、 NuUパケットをセルフエンコーディングのストリームに適宜挿入することで、シス テム転送レートを固定レートにしても良い。
[0224] 尚、図 7のように、製造業者固有の情報を格納するデータ領域を設け、そこに MPE G—TSシステムエンコードの条件を記述するようにしても良い。
[0225] 尚、上記説明にて UPパケットに記述した情報の全て若しくは一部を、図 15に示し た TS 1— VOB情報内に記述しても良 、。 [0226] 尚、 dual monoの音声チャンネルで記録されたセルフエンコーディングトランスポ 一トストリームを DVD— Videoフォーマットに変換するときには、 DVD— Videoには、 dual monoの音声が規格上存在しないため、 2本の異なる音声ストリームとして、左 右のモノラル音声をそれぞれ分割し変換しても良い。
[0227] また、上記説明にて UPパケットに記述されるパラメータの一部もしくは全部を管理 情報内に記述するようにしても良い。これは、 1セルフエンコーディングトランスポート ストリーム内で変化しないパラメータを多数回記録することを避けることで無駄な記録 領域を発生させず、 UPパケットの出現ごとにパラメータが変化したか否かを判定する 余分なデコーダ処理を軽減する効果が得られる。
[0228] 第 2の実施例.
(エンコーダの構成)
以下、本発明の別の実施例について詳細に説明する。最初に、本発明に係る情報 記録装置のエンコーダについて、 AV入力を受けて MPEG— TSにセルフエンコード を行うエンコード処理に焦点を当てて説明する。
[0229] 図 33に、本発明に係る情報記録装置のエンコーダの構成を示す。同図に示したよ うにエンコーダ 214は、各エレメンタリーエンコーダ 230a、 230b, 230cと、システム エンコーダ 232と力 なる。エンコーダ 214はシステム制御部 212からの制御信号を 受け、エレメンタリーエンコーダ 230a、 230b, 230c及びシステムエンコーダ 232によ り、エレメンタリーエンコード又はシステムエンコードに切替えながらエンコード処理を 行なう。各エレメンタリーエンコーダ 230a、 230b, 230cは、ビデオ、オーディオ、 VB I (Vertical Blanking Interval)のそれぞれの信号を受けとり、エンコードを行う。
[0230] ビデオエンコーダ 230aは、システム制御部 212からの制御信号を受け、これに従 い、ビデオストリームのビットレート、解像度、アスペクト比等の属性を決められた範囲 内でエンコードする。具体的には、ビデオエンコーダ 230aは、エンコード開始時にシ ステム制御部 212から、「DVD— Video互換モード」、「DVD Video Recording 互換モード」または「通常モード」の 、ずれかの動作モードを指定する制御信号を受 信する。制御信号が指定するモードが「DVD— Video互換モード」であれば、 DVD —Video規格のビデオ属性に準じたビデオストリームを、「DVD Video Recordin g互換モード」であれば、 DVD Video Recording (以下「DVD VR」と称す。)規 格のビデオ属性に準じたビデオストリームを、「通常モード」であれば、ある所定の範 疇の属性に準じたビデオストリームを生成する。
[0231] オーディオエンコーダ 230bも同様に、システム制御部 212からの制御信号を受け 、これに従い、オーディオストリームのビットレート、量子化ビット数、チャンネル数等の 属性を決められた範囲でエンコードする。ビデオエンコーダ 230aと同様に、具体的 にはシステム制御部 212から動作モードを示す制御信号を受信し、制御信号が示す モードが、「DVD— Video互換モード」であれば、 DVD— Video規格のオーディオ 属性に準じたオーディオストリームを、「DVD Video Recording互換モード」であ れば、 DVD VR規格のオーディオ属性に準じたオーディオストリームを、「通常モー ド」であれば、ある所定の範疇の属性に準じたオーディオストリームを生成する。
[0232] VBIエンコーダ 230cも、システム制御部 212から動作モードを指定する制御信号 を受け取り、これに従って、 VBIデータをエンコードする。具体的には、 VBIェンコ一 ダ 230cは、システム制御部 212から VBIエンコーダへ入力されるエレメンタリーストリ ームエンコード制御信号が、「DVD— Video互換モード」、 「DVD Video Recordi ng互換モード」を指定する時には、夫々の規格で規定された VBIデータの格納方法 にしたがい VBIデータを追加でエンコードする。追加でエンコードするとは、元々の 通常モードでも VBIデータを格納する方法が別途決められている可能性があるため 、それと重複してエレメンタリーストリーム内に格納することを意味している。
[0233] 以上のようにして、エンコードされたエレメンタリーストリームは夫々システムェンコ一 ダ 232によって MPEG— TSシステムストリームへ多重化される。
[0234] システムエンコーダ 232も、各エレメンタリーストリームエンコーダ 230a、 230b, 23 Ocと同様にシステム制御部 212からエンコードの制御信号を受け、これに従ったェン コードを行う。
[0235] システム制御部 212からシステムエンコーダ 232への制御信号は、通常の MPEG —TSへのシステムエンコード制御信号力、通常の MPEG— TSに制限を加え、 MP EG -PS (特に DVD固有のフォーマット)に容易に変換できるシステムエンコード制 御信号(DVD— Videoモード力 DVD Video Recordingモード)かのどちらかで ある。
[0236] 通常の MPEG— TSへのシステムエンコード制御信号である場合には、システムェ ンコーダ 232は、各エレメンタリーストリームエンコーダ 230a、 230b, 230c力も入力 されてきたエレメンタリーストリームを MPEG— TSシステムストリームの基準となるデコ ーダモデル(以下「T— STD」と称す。)で破綻を起こさないように、ノ ッファマネージ メントしながら、システムエンコードを行う。
[0237] さらに、システム制御部 212からの制御信号力 MPEG— PSへ容易に変換できる MPEG— TSへのシステムエンコードを指定する制御信号である場合には、上記に 加えさらに特殊なシステムエンコードルールを守りながらエンコードを行う。
[0238] このようにして生成されたセルフエンコーディング MPEG— TSシステムストリームが エンコーダ 214から出力される。
[0239] 上述のように、本発明の情報記録装置は、エレメンタリーストリームとシステムストリ 一ムレベルで個々にエンコードモードを切り換えることを特徴としている。このェンコ ードモードの切り換えによって、夫々のエンコードモードに対し DVDフォーマットへ変 換する際の処理をまとめた表を図 34に示す。
[0240] このように、エレメンタリーストリームエンコーダ 230a、 230b, 230c及び、システム ストリームエンコーダ 232に MPEG— PSへの変換を前提としたエンコードを行わせる ことで、 MPEG - PSへ容易に変換可能な MPEG—TSが作成される。
[0241] (セルフエンコードされた MPEG—TS)
以下に、本発明の情報記録装置にてセルフエンコードされた MPEG— TSのフォ 一マットの一実施例を詳細に説明し、通常の MPEG— TS (以下「SESF」と称す。)と 、 MPEG— PSに容易に変換可能な MPEG— TS (以下「Constrained SESF」と 称す。)との相違を説明する。
[0242] 以下の例では、 MPEG— TSストリーム単位で属性情報等を格納する VOBIに、そ のストリームの符号ィ匕条件を表す情報を格納する。このようにストリーム中ではなく、 管理情報に符号ィ匕条件を表す情報を格納することにより、ストリームを解析することな くそのストリームが DVD— Videoや DVD VRのフォーマットに容易に変換可能なの か否かの判定を素早く行うことが可能となる。なお、このストリームの符号ィ匕条件を表 す情報は後述の Tipパケット中に格納されても良!、。
[0243] このストリームの符号化条件を表す情報を" encode— condition"という 2ビットのフ ラグで表す。フラグの値の意味は以下の通りである。
00b :通常の MPEG— TS (SESF)
01b: DVD VR規格のストリームフォーマットに容易に変換可能な MPEG— TS (Constrained SESF)
10b :リザーブ
1 lb: DVD Video規格のストリームフォーマットに容易に変換可能な MPEG— T S (Constrained SESF)
[0244] ストリーム管理情報内に、 00bの値を取る場合には、元々 MPEG— PSへの高速変 換を考慮せずにエンコードされている場合と、ユーザの編集作業によって、個々の M PEG— PSへの変換が容易な MPEG— PSを連結して一つのストリームとした場合が 考えられる。
[0245] また、ストリーム中にも encode— conditionを併せ持つ場合、通常の MPEG— TS を示す encode— condition=00bをストリーム内に持つ意味は無ぐストリーム中で は(後述の Tipパケット内では)、 encode— condition=00bはリザーブとして、使用 禁止とされるとして、 encode— conditionの使用方法がストリーム内 Z外で異なるこ とちあり得る。
[0246] 以上のようにフラグの値を決定することで、 VOBIの encode— conditionフィールド の値から、そのストリームが DVD— Videoや VRフォーマットに容易に変換できるのか 否かを判定することができる。ここで 、う容易に変換できると 、うのは後述の変換方法 で変換できることを意味して 、る。
[0247] (Constrained SESFのストリーム構造)
図 80に Constrained SESFの全体的なストリーム構造を示す。 Constrained S ESFは複数の SESF capsule (SESFカプセル)からなる。 SESF capsuleは所定 の Multiplexing Unitを含み、かつ、先頭に Tipパケット(詳細は後述)を有する。 各 SESF capsuleの再生時刻情報(PTS)と、 Tipパケットのアドレス情報とはァクセ スマップ 80cにより対応付けられる。後述するように、 TS2PS変換では、この SESF capsule毎に変換処理が行なわれる。
[0248] 図 32は 1つの SESF capsule内の各パケットと MPEG— PSのパックとの対応を示 した図である。図 32に示すように、 Constrained SESF内に、ストリームの固有情報 を格納した TSパケット(以下「Tipパケット」と称す。)が挿入される。以下に、 Constra ined SESF内に埋め込まれる Tipパケットを図 35から図 41を用いて説明する。
[0249] (Tipパケット)
図 35に Tipパケットの全体構造を示す。この図にあるように Tipパケットは、そのパケ ットが Tipパケットであると特定するための Data— IDと、 DVD VRの DCI— CCIフィ 一ルドに対応し、表示制御やコピー制御情報を含む display— and— copy— infoと 、ストリームのエンコード情報を格納した encode— infoと、製造者独自の付加情報を 記述できる MakersPrivateDataとを格納する。
[0250] 図 35、 36に示したように、 Tipパケットには後述の SCR演算に必要な PCR値をァダ プテーシヨンフィールド内に記述している。このァダプテーシヨンフィールドも固定バイ ト長であるため、 Tipパケット内の各種情報へ固定アドレスでのアクセスが可能である
[0251] 図 37に Data— IDの構造を示す。 Data— IDは、そのパケットが Tipパケットである ことを識別するための Data— Identifierを備える。 Data— Identifierは、アスキーコ ードで" TIP"を表す「0x544950」の値を持った 3バイトのフィールドである。再生装 置のデコーダはこのフィールドの値を判定し、 Tipパケットと特定することもできる。
[0252] 図 38に、 display— and— copy— infoの構造を示す。この display— and— copy —infoに、 DVD VR規格の RDI Unitの DCI— CCIと同一の構造および情報を持 たせることで、当該 Constrained SESFを DVD VRフォーマットへ変換する際の R DIパックの生成を容易にしている。(なお、 DVD VR規格の DCI— CCIの詳細につ ヽて ίま「DVD Specifications for Rewritable/ Re— recordable Disc Part 3 VIDEO RECORDINGや特許第 3162044号に開示されている。これらの文 献においては、一部フィールド名が異なっている力 各フィールドの定義は DVD V Rフォーマットへの変換時にそのままコピーを可能にするため同一である。 )
[0253] 図 39に encode infoの構造を示す。 video resolutionフィールドには、 Tipパ ケットに続くビデオストリームの解像度情報が記述される。 encode— infoの値を以下 に示す。
0000b: 720x480 (NTSC)、 720x576 (PAL)
0001b: 704x480 (NTSC)、 704x576 (PAL)
0010b: 352x480 (NTSC)、 352x576 (PAL)
0011b : 352x240 (NTSC)、 352x288 (PAL)
0100b: 544x480 (NTSC)、 544x576 (PAL)
0101b :480x480 (NTSC)、 480x576 (PAL)
Others :リザーブ
[0254] DVD VRフォーマットでは 1連続記録中の解像度力 可変であっても良い。しかし ながら、この場合、解像度が異なるストリームは別個の VOBとして管理され、レコーダ によっては再生時のシームレス接続が保証される。したがって、 Constrained SES F記録中に解像度変化を起こす場合には、 DVD VRフォーマットに変換した場合に 、どの地点力 VOBを切り分ける必要があるのかを判定するために、このフィールド が使用される。
[0255] DVD— Videoフォーマットに変換することを考慮して記録される Constrained SE SF (encode— condition = 1 lb)では、解像度変化は 1ストリーム内では起こらな!/ヽ
[0256] encode— conditionフィールドは、 VOBIに格納された値と(00bである場合を除き )同一である。ストリームの管理情報だけでなぐストリーム中にも埋め込んで encode —conditionフィールドを格納する理由は、 IEEE1394に代表されるデジタルインタ 一フェースを介してストリームがコピーされるようなことがあっても、受け手の記録装置 がこの Tipパケット内の encode— conditionフィールドを確認することで、容易に DV Dフォーマットへ変換できる力否かの判定を行うことを可能とするためである。
[0257] FVFPSTフィールドには、 DVD VR規格の VOBU— S— PTMが記録される。こ れは、 Constrained SESFを DVD— Video/VRフォーマットへ変換する際に、 Ti pパケットに続き符号ィ匕されているビデオストリームの解析を行い、最初に表示される ビデオフィールドの再生時刻を算出する処理を省くためである。 [0258] FVFPSTフィールドは、前記ビデオフィールドの表示時刻を 90KHz精度で表した 32ビットのフィールドと、これに表現されない 27MHz精度で表した 16ビットのフィー ルドから成る。
[0259] 図 40に、 PES— infoの構造を示す。 PES— infoは、エレメンタリーストリームの解 析をすることなぐ Constrained SESFを DVD— Videoフォーマットへ変換するた めに必須となる情報である。この情報は、 DVD— Videoのストリームに挿入される N V—PCKと呼ばれる、特殊再生を支援するためのパックに格納される情報を生成す るために必要となる。
[0260] PES— infoには、合計 136個のビデオデータとオーディオデータを格納した PES パケットの情報を格納することが可能である。夫々の PESパケットに対して、 4ビットず つのデータが割り当てられ、 PESパケットの内部を解析せずとも NV—PCKの情報を 生成できるようになつている。尚、ビデオまたは、オーディオデータを格納していない PESパケットがある場合には、その PESパケットは無視される。
[0261] Tipパケットから、次の Tipパケットの一つ前のパケットまでのデータ単位である SES F Capsuleに対して、 PES— existence— flagは、 j番目の PESパケットがこの該当 の SESF Capsule内に存在するか否かのフラグである。 PES— existence— flagの 値は以下のように設定される。
Ob :j番目の PESパケットが当該 SESF Capsule内に存在しない。
lb :j番目の PESパケットが当該 SESF Capsule内に存在する。
[0262] PES— extension— flag = Ob (PESパケットが存在しな!、場合)である時には、当 該 PESパケットの残りのフィールドは全て Obとする。
[0263] PES— payload— identifierは、該 PESパケットに格納されたデータ力 ビデオデ ータなのか、オーディオデータなのかを識別するための情報である。 PES— payload —identifierの値は以下のように設定される。
Ob :ビデ才ストリーム
lb :オーディオストリーム
[0264] PES— existence— flagと PES— payload— identifierは対象となる全ての PES パケットについて記述されるフィールドである。 [0265] さて、上記 PES— payload— identifierによってビデオかオーディオが格納されて いると判明した時点で、 PESパケットが格納するストリームの種別によって、それ以降 のフィールド定義が異なる。
[0266] その PESパケットがビデオストリームを格納して!/、た場合(PES— payload— identi fier=0b)は、 PES— payload— identifierに続いて、その PESパケットに格納され たピクチャの種另Iを示す picture _ coding _ typeが定義される。 picture _ coding —typeの値は以下のように設定される。
00b : 01b, 10b以外の符号化が施されたピクチャ
01b :フレームエンコードされた Iピクチャまたは、フィールドエンコードされた Iピク チヤの一対または、フィールドエンコードされた Iピクチャとフィールドエンコードされた Pピクチャの一対
10b:フレームエンコードされた Pピクチャまたは、フィールドエンコードされた Pピク チヤの一対
l ib :リザーブ
[0267] つまり、 01bもしくは 10bのピクチャは DVD— Video規格で定義される参照ピクチャ となるピクチャである。以上が、ビデオを格納した PESパケットに対する付加情報であ る。
[0268] 一方、 PESパケットがオーディオストリームを格納していた場合(PES— payload— i dentifier= lb)は、 PES— payload— identifierに続いて、その PESパケットに格 納されたオーディオストリームが第一音声ストリームなのカゝ、第二音声ストリームなの かを識別する stream— identifierと、毎 Tipパケットに記述された FVFPST (—番最 初に表示されるビデオフィールドの再生開始時刻)と同時もしくはその直後に再生が 開始されるオーディオフレームを含んでいるか否かの判定フラグである sync— prese ntation _ flagと;^ある。
[0269] stream— identifierの値は以下のように設定される。
Ob :第一音声ストリーム
lb :第二音声ストリーム
[0270] 第一音声ストリームか、第二音声ストリームかの識別は、 PIDの設定規則や、 PMT でのエレメンタリーストリーム宣言の順番等でも決めることができる。
[0271] sync— presentation— flagの値は、以下のように設定される。
Ob:該オーディオ PESパケットの中に、 FVFPSTと同時もしくは直後に再生開始 されるオーディオフレームが格納されて!、な!/、。
lb:該オーディオ PESパケットの中に、 FVFPSTと同時もしくは直後に再生開始 されるオーディオフレームが格納されて 、る。
[0272] 以上が、オーディオを格納した PESパケットに対する付加情報である。 PES— info は、このように該 Tipパケットに続く個々の PESパケットごとの情報を抽出し、格納して いるフィールドである。
[0273] 図 41に、 MakersPrivateDataを示す。図示した通り、 MakersPrivateDataは、 該 Constrained SESFを生成した製造者を特定する maker— IDと、その製造者が 固有付加情報を記述する maker— private— dataを設ける。
[0274] 図 42 (a)、 (b)に、 Tipパケットの PIDとストリームの種別を示す stream_type値の 一例を示す。 PID、 stream— type共に MPEGや他規格にて予約されている値があ るため、それらと干渉せずかつ MPEG規格外のプライベートデータであることを加味 し、上記の値を選択した。
[0275] 以上のように、 Constrained SESFに格納される Tipパケットには、各種ストリーム の属性情報が抽出され格納されて 、る。上記説明したフィールドが DVDフォーマット へ変換する際にどのように使用されて 、るかの詳細にっ 、ては、後述する。
[0276] (システムエンコード条件)
次に、 Constrained SESFのシステムエンコード条件について詳細に説明する。 尚、以下のシステムエンコード条件は通常の SESFには適用されない。
[0277] (多重化単位(Multiplexing Unit) )
Constrained SESF内のエレメンタリーストリームを格納した TSパケットは、 DVD フォーマットの 2KBのパックに格納されるデータをまとめたユニットである多重化単位 (Multiplexing Unit)から構成される。なお、この多重化単位(Multiplexing Un it)は第 1の実施例の多重化ブロックに対応する。
[0278] 1つの Multiplexing Unit内には、 1種類のエレメンタリーストリームを格納する TS パケットだけが格納されており、他の種類のエレメンタリーストリームを格納する TSパ ケットと混在することはない。また、 NULLパケットとの混在は、 1つの Multiplexing Unitを構成する際に必要となる場合があるので (例えば、ストリームの最後のパートを 格納した Multiplexing Unit)、禁止しない。これも、 Multiplexing Unitとパック の関係を明確にするために必要である。
[0279] 1つの Multiplexing Unitは 11個の連続した TSパケットから構成され、各 Multip lexing Unit内のエレメンタリーストリーム(ペイロードデータ)は対応する 1つのパッ クに完全に格納される。これも同様に、パックとの関連性を制限している。
[0280] ビデオストリームを格納した PESパケットが複数の Multiplexing Unitに分割配置 される場合には、 PESパケットの最後のバイトを含む Multiplexing Unitを除き、全 ての Multiplexing
Unitは 184 X 11 = 2024Bの TSパケットペイロードデータを格納する。これは、最 大の効率でストリームを転送することと、 TSパケット単位の逐次処理力TS2PS変換 時に容易に実行できるようにするためである。仮に最後以外の Multiplexing Unit のデータ量を 2024B以下と認めてしまうと、 TS2PS変換時に Multiplexing Unit 最初の TSパケットを変換する際に MPEG— PSのパック毎のパケットヘッダに格納さ れる PES— packet— lengthの値を容易に決定することができなくなる。
[0281] Multiplexing Unitの中で始まる最初の完全なオーディオフレームデータは、 PE Sパケットペイロードの中で先頭のオーディオフレームでなければならな!/、。
[0282] これは、オーディオストリームを格納した PESパケットが複数の Multiplexing Uni tに格納されることを考えると分り易 、。仮に 1つのオーディオ PESパケットが複数の Multiplexing Unitに分割配置されるとすると、 2つ目以降の Multiplexing Unit を MPEG— PSのパックに変換する際に、パケットヘッダを生成するために、 PTSを 特定し、 1つのパックに格納されるオーディオフレームの個数を決定する必要がある。 このため、 TS2PS変換時にオーディオストリームの内部解析が必要となり変換処理 が煩雑となることを避けて 、る。
[0283] 以上が Multiplexing Unitの定義となる。 Constrained SESFを生成するェン コーダは、上記 Multiplexing Unitの制限の中でシステムエンコードを行う。 [0284] (Constrained SESF内の PESパケットヘッダの制限)
次に、 Constrained SESF内の PESパケットヘッダのフィールド値について、いく つかの制限を説明する。
[0285] 図 43に示したように、 PESパケットヘッダのフィールドには、固定値しか許されない ものがある。これは、 DVDフォーマットへ変換した際に余計な処理を発生させないた めである。余計な処理とは、 DVDフォーマットで定義された値と異なる値によって付 加的に発生 Z消滅するフィールドを処理することを意味している。言い換えれば、 TS 2PS変換時に、ヘッダに追加されるフィールドや削除されるフィールドを極力押さえる ことが、この PESパケットヘッダの制限の目的である。
[0286] PES— packet— legnthの値は MPEG—TSに格納されたビデオストリーム場合、 0が許されることがある。
[0287] PTS— DTS— flagsは、 PTS、 DTSが記述されているか否かを示すフラグである。
[0288] オーディオストリームを格納した PESパケットの場合、必ず 1つ以上のオーディオフ レームが PESパケット内で開始され、 PTS— DTS— flagsは 10b (DTSがある場合に は l ib)に設定される。
[0289] PES— extension— flagと PES— header— data— legnthには、 TS2PS変換の 際に TSパケット単位の逐次処理を行うための制限がある。これを図 44に示した。
[0290] 図 44に示した通り、エレメンタリーストリームの種別、 PESパケットの位置と encode
—conditionの値によって、夫々の値が定義される。
[0291] ここで、図 44にある VPDとは、 PESパケットの PTSフィールドと DTSフィールドを足 し合わせたバイト長である。即ち、
PTS—DTS— flags = 00bならば、 VPD = 0
PTS— DTS— flags= 10bならば、 VPD = 5
PTS— DTS— flags = l ibならば、 VPD= 10
である。
[0292] 前述の通り、 DVD— Videoや VRへ変換する際に、 1パックのペイロード長が確定 してからパックを構成するのではなく、 TSパケットごとの逐次処理を容易にするため にこの制限が必要となる。 [0293] 以上が、 PESパケットヘッダの定義となる。 Constrained SESFを生成するェンコ ーダは、上記制限の中でシステムエンコードを行う。
[0294] (Tipパケットの挿入間隔に対する制限)
次に、 Constrained SESF内に挿入される Tipパケットの挿入間隔に関する制限 を説明する。
[0295] Tipパケットの ATS (ATS1)が示すデコーダ入力時刻と、 Tipパケットに続いて最 初にデコーダに入力されるビデオもしくはオーディオストリームを格納した TSバケツト の ATS (ATS2)が示すデコーダ入力時刻とは、以下の関係が成り立つ必要がある。
ATS1 + T <= ATS2
T = (Pb一 pack一 size*8*system一 clock一 frequency) / PSrate
[0296] Tは、 PSパックの最小転送期間である。この最小転送期間は、 PSパックがシステム デコーダに入力開始されて力 完了するまでの最小期間である。すなわち上記の式 は、各 TSパケットの ATS間隔は、少なくとも変換後の PSパックがシステムデコーダに入 力可能な間隔よりも大きいことが必要なことを示している。 Tの値を求めると次のように なる。
[0297] PS— pack— sizeは TS2PS変換で生成される MPEG - PSでの 1パックのバイト長 であり、 system— clock— frequencyは MPEG— PSデコーダの基準時刻の周波数 であり、 PSrateは TS2PS変換で生成される MPEG— PSストリームの多重化レート である。
[0298] DVDフォーマットの場合、それぞれ以下の値を取るため、 ATS1と ATS2の関係は 次のようになる。
PS— pack— size = 2048 バイト、
system― clock― frequency = 27000000 Hz、
PSrate = 10080000 ビット Z秒、
ATS1 + 43885.714... <= ATS2
[0299] よって、 ATS1 + 43886 = ATS2 が ATS2の最小値となる。典型的には、後述の TS2PS変換にて Tipパケットが NV_PCK(DVD— Video変換時)もしくは RDI— P CK(DVD VR変換時)の 2KBのサイズを持つパックに変換される力 上記の式を 満たさない場合は、続くエレメンタリーストリームの転送時刻が早まり、 DVDのシステ ム転送レート 10. 08Mbpsの上限を超えてしまうことになる。
[0300] 一つの SESF capsuleには整数個の GOPがァライメントされて配置される。これは 、 DVDフォーマットの VOBUの概念を Constrained SESF上で実現するために、 SESF capsuleを、 DVDフォーマットの VOBUに対応させるためである。 DVDフォ 一マット(DVD VR)では、この VOBUは整数個の GOPから構成される必要がある
[0301] 一つの SESF capsule内に格納されるビデオデータの再生時間軸上での時間幅 は、 0. 4秒以上、 1. 0秒以下でなければならない。また、最後の SESF capsuleに 格納されるビデオデータの再生時間軸上での時間幅は、 encode— condition= 11 b (DVD— Videoモード)時には 0. 4秒以上 1. 2秒以下であり、 encode— conditio n= 01b (DVD VRモード)時には 1. 0秒以下でなければならない。これは、 SESF capsuleが VOBUとなり、各 DVDフォーマットに従うために必要である。
[0302] 各 Tipパケットは、通常、時間一アドレス変換を行うアクセスマップと 1対 1にポイント されることが望まれる。これは、 TS2PS変換を行う際〖こ、 DVDフォーマットで言う所の VOBU単位で変換を即座に始められるようにすることと、変換時に DVD— Videoフ ォーマットに変換する場合に、 Tipパケットを NV—PCKへと変換していく際に、 NV — PCK内に格納される近隣 VOBUへのアドレス情報である DSI (Data Search Information)をアクセスマップから作成するために必要である。 DSIを計算するために は、アクセスマップが、 Tipパケットごとにその再生時間(FVFPSTに準じた Tipバケツ ト直後の AV再生時刻情報の一部もしくは全部)と Tipパケットの記録アドレスとを格納 し、 2つの連続する Tipパケット間に Multiplexing Unitが何個格納されているかが 判れば良い。これは次の制約によって実現される。
[0303] 尚、全ての Tipパケットがアクセスマップからポイントされなくても良い、例えば、 Con strained SESF内で一番最後の Tipパケットに続く AVデータは、再生時間長や次 の Tipパケットが無い等、他の Tipパケットと異なる状態にあるため扱いが異なる。この ような場合、一番最後の Tipパケットをアクセスマップに登録せずとも特に再生や変換 に支障をきたす訳ではない為、機器の実装を鑑み、例外処理としても良い。 [0304] 連続する 2つの Tipパケット間には、 Multiplexing Unitに属さないパケットが合 計 32個挿入される。これは、 TS2PS変換時にアクセスマップを用いて DVDフォーマ ットに変換した場合、 VOBUのノ¾ /ク数がいくつになるのかを特定するために必要で ある。(パケット数は 32個に限定する必要はないが、ある所定の個数である必要があ る。アクセスマップの Tipパケットのアドレス情報から、 Tipパケットに続く TSパケット数 が特定できるため、 Multiplexing Unitでな!/、パケットが 、くつあるのかが判れば、 DVDフォーマットに変換した際に、 VOBUにいくつのパックが入るのか特定できる。 これが重要である。また、この情報は MNFや各 Tipパケット内の MakersPrivateDa ta内に記述されても良い。 )
[0305] また、 32個にする理由は、 MPEG—TSのプログラム構成情報を示すPAT、 PMT パケットが最低 100msecに一回以上埋め込まれることと、プログラムごとの固有情報 を格納した SITパケットが最低 1秒に一回以上埋め込まれることと、デコーダ基準時 刻を作り出す PCR (Program Clock Reference)を格納する PCRパケットが最低 100 msecに一回以上埋め込まれることと、何れの Multiplexing Unitにも属さない NU LLパケットが自由に付加できることと、 Tipパケットの挿入間隔が AVデータ再生時間 軸で 1. 0秒以下であることから、連続する 2つの Tipパケット間には、少なくとも 31個 の PAT、 PMT、 PCR、 SITパケットがあれば良い事になる。従って連続する 2つの Ti Pパケット間に、その時間に応じた PAT、 PMT、 PCR、 SITパケットを挿入し、 32パ ケットになるまで NULLパケットを付与することで、 VOBUのパック数をアクセスマツ プ力 特定することができる。
[0306] 一例として、 0. 5秒間隔で Tipパケットが挿入され、アクセスマップから特定できる該 Tipパケットに続く TSパケットの個数が 1209TSパケットである場合について変換後 のパック数を考えてみると、 PAT、 PMT、 PCRパケットを合計して 15パケット(=5+5+5 ;)、 SITパケットがこの Tipパケットに続けて挿入されたとして 1パケット、残りの 16パケ ットを NULLパケットとして挿入する。これを DVDフォーマットに変換する場合には、 Tipパケットが NV一 PCK (DVD—Videoへ変換時)もしくは RDI— PCK (DVD V Rへ変換時)に変換されて 1パック、 1つの Multiplexing Unit (1 ITSパケット)は 1 パックに夫々変換される。従って、 VOBUのパック数は、 1 + Multiplexing Unitの 個数という式で求めることができ、 Mulitplexing Unitの個数は、(該 Tipパケットに 続く TSパケット数— 32) Z11であるため、この例の場合には、 1+((1209- 32)/11) = 1+107 = 108となり、該 VOBUは、トータル 108パックであることが計算できる。この V OBU毎のパック数と再生開始時刻情報があれば、 DVD Videoへ変換する際に必 要となる NV—PCKの DSIパケットを生成するのがきわめて高速に実現できる。
[0307] 以上力 Tipパケット挿入間隔に対する制限である。 Constrained SESFを生成 するエンコーダは、上記制限の中でシステムエンコードを行う。
[0308] (デコーダ制御に関する制限)
次に、 Constrained SESFのデコーダ制御(バッファマネージメント)に関する制 限を説明する。
[0309] Constrained SESFは、 MPEG— TSの基準デコーダモデルである T—STDの 基準を満たすよう作成される必要がある。これは、 T—STD準拠のデコーダを搭載し た STB等でもストリームの種別さえ合えば、 Constrained SESFのデコードが可能 であることを意味している。
[0310] MPEG— TSの基準デコーダモデルである T STDと、 MPEG— PSの基準デコ ーダモデルである P— STDは、ほぼ同じ動作 ·処理能力を持つ力 オーディオストリ ームのデコーダへの入力レートが異なる。具体的には、 T— STDは、図 18を用いて 説明すると、オーディオデコーダ前のトランスポートバッファ力もオーディオバッファへ の転送レートが AACを除いて、 2Mbps固定となっている。しかしながら、 P— STDは システムレートつまり DVDだと 10. 08Mbpsのレートで、各種ストリームをデコーダへ 人力することができる。
[0311] したがって、 Constrained SESFと DVDフォーマットとのバッファマネージメントは 共通化できないことになる。
[0312] このように、一般的には、 MPEG— TSと MPEG— PS間でのバッファマネージメント は共通化できないが、 Constrained SESFを DVDフォーマットへ変換する際に、 再度バッファマネージメントを考慮しながらシステムエンコード処理を行うことを避け、 各 TSパケットに付与された ATSを用いて、変換後のパックのデコーダ入力開始時刻 を示す SCR(Svstem Clock Reference)を算出できれば、極めて高速にかつ容易に 変換が実行できる。 ATSを用いた SCRの導出方法の詳細は後述する。
[0313] また、本発明の Constrained SESFは、 T—STD準拠であると共に、後述する変 換方法によって生成された MPEG— PS力 P— STD準拠であることを保証できるよ うに、予めエンコードされる必要がある。
[0314] つまり、 Constrained SESFとは、 MPEG— PSに変換しても P— STD準拠になる ように MPEG— TSにエンコードされたストリームである。
[0315] 以上が、 Constrained SESFのバッファマネージメントに関する制限である。なお
、 SESFではこれらのことを気にすることなぐ T—STDに合致するようにエンコードす るのみである。
[0316] ここで、 T— STD、 P— STDの基準モデルに準拠しない MPEG— TS、 MPEG— P Sの例を説明する。
[0317] 最初に図 45に、 MPEG— PSに変換可能だ力 T—STDモデルを満たさないよう にセルフエンコードされた MPEG— TSの例を示す。ストリーム TS1は、 T— STDモ デルに準拠するようにシステムエンコードされた MPEGトランスポートストリームである 。ストリーム TS2は、 T—STDモデルに準拠していない MPEGトランスポートストリー ムである。すなわち、ストリーム TS2においては、 ATS [47]力も ATS [57]の値が、 MPEG—TSにおいてオーディオデータに対して許容される転送レートを超えてしま うように設定されており、このため、オーディオのトランスポートバッファ(図 18参照)を オーバーフローさせてしま 、T— STDモデルを満たさな!/、ようになって!/、る。これに 対し、ストリーム TS1は、 ATS [47]力ら ATS[57]の値が MPEG— TSにおいてォー ディォデータに対して許容される転送レートを満たすように設定されている。このストリ ームからは、後述の SCR変換式にて P— STD準拠の MPEGプログラムストリーム PS 1に正しく変換できる。また、ストリーム TS 2も、 T— STDを満たさないが、後述の SCR 変換式で変換すれば、 PS1を生成する。ストリーム TS2を T—STD準拠の MPEG— TSにするためには、 ATS [47]力 ATS[57]で指定されるオーディオパケットの転 送時間間隔を広げ、トランスポートバッファをオーバーフローさせないようにすることが 必要である。
[0318] 次に、図 46 (a)、 (b)に T—STDは満たす力 MPEG—TSから変換された MPEG — PSが P— STDモデルを満たさない場合の例を示す。ストリーム TS3は MPEGトラ ンスポートストリームであり、ストリーム PS3は MPEGトランスポートストリーム TS3から 変換された MPEGプログラムストリームである。図 46 (b)は、各ストリームのデコ一ド 時のビデオデータ用バッファの状態の変化を示している。 PES # 1のピクチャのデコ ード時刻は SCR[2]であり、 PES # 2のピクチャのデコード時刻は SCR[4]と SCR[5 ]の間にくる。
[0319] 図 46 (b)に示すように、トランスポートストリーム TS3においては、 PES # 1、 PES # 2に含まれるピクチャデータのデコードまでに各 TSパケットのデータ転送が間に合つ ている。これに対し、プログラムストリーム PS3では PES # 1に対しては V— PCK # 1 の転送が間にあっているが、 PES # 2に対しては、 V— PCK# 4の転送が間に合わ ず、その転送途中でデコードが開始されたためにバッファアンダーフローを生じる。よ つて、 P— STDモデルが満たされていない。このような状態を回避するためには、 M PEG-TSにお!/、て PES # 2の転送が早期に完了するように、 V— PCK # 2〜V— P CK# 4に変換される各 TSパケットの ATS (ATS[14]、 ATS[25]、 ATS[36])の値を 時間的に早くなるようにシフトさせればよ!、。
[0320] (ATS— SCR変換)
次に、 Constrained SESFのストリームをプログラムストリームに変換するときの PS パケットの SCRの導出方法について説明する。なお、 SCRの計算が必要となるのは 新規にパックを生成するときであるため、 Tipパケットと、 Multiplexing Unitの先頭 の TSパケットを変換するときのみ必要となる。
[0321] Constrained SESFのストリームは、図 14 (c)に示す構造を持っている。 TSパケ ット中には基準時刻情報 (PCR)を格納した PCRパケットが適宜挿入されており、これ を用いてデコーダ基準時刻である STC (System Time Clock)をある時間間隔でリセ ットすることが可能である。また、各 TSパケットには、各 TSパケット間の相対的な送出 時刻情報を格納した ATSが前置されている。そのため、 PCRを格納した TSパケット 以降に送出される TSパケットは、 PCR値と、 TSパケット間の相対的な送出時刻情報 である ATSと力 得られるタイミングでデコーダに入力される。つまり、 PCRを格納し た TSパケット以降の TSパケットに対しては、各 TSパケットのデコーダ入力時刻(以 下「calculated— PCR」と称す)を生成できる。また、 PCRを格納した TSパケットが無 い場合でも、 PCRに相当する情報を管理情報に抽出しておくことも可能である。
[0322] 図 47は、 Constrained SESFから MPEG— PSへ変換した際の calculated— P CRと SCRの関係を示した図であり、図 80で示す Capsuleの先頭部である。なお、図 にお 、て、各 TSパケットにストリーム先頭力 昇順で付与された ATSを ATS [k]と表 記している。また、 Multiplexing Unit先頭の TSパケットに対して、その出現順に 計算された PCR値を calculated— PCR[i] (i=0,l,2,...)と表記している。同様に変換 後のパックの SCRも出現順に SCR[i]と表記している。
[0323] 前述の通り、 T—STD基準モデルでは、ビデオストリームの転送については最大転 送レート 15Mbps (MP@MLの場合、マルチプレクサバッファからビデオバッファの 転送レートは 15Mbpsを超えない)の制限があり、オーディオストリームの入力レート については、ビデオよりも低いレート制限がある。(トランスポートバッファ力もオーディ ォバッファへの転送レートは AACを除き 2Mbpsを超えない)このため、オーディオデ ータを格納した Multiplexing Unitは、ビデオデータを格納した Multiplexing U nitと異なり、低レートで転送される。従って、ビデオデータの転送レートを DVDフォ 一マットの最大レートである 9. 8Mbps近くまで上げようとすれば、転送レートが低く時 間がかかるオーディオデータの転送時間を確保するために、ビデオデータの TSパケ ットは、 DVDの転送レート(10. 08Mbps)より高いレートで送出される必要がある。
[0324] 図 47に示すように、 Constrained SESFと、 DVDフォーマットとの間で、転送時 間帯が異なって 、ることがわかる。
[0325] Tipパケットもしくは Multiplexing Unitの先頭の TSパケットのデコーダ到着時刻
(calculated— PCR)と、それらが変換された後のパックの SCRとの間には、次の関 係式が成り立つ必要がある。
[0326] SCR[0] = calculated— PCR[0]
SCR[i] = max( SCRD-1] + T , calculated— PCR[i] ) (i= 1,2, 3, ...)
calculated— PCR[i] = PCR— tip + (ATS[n] - ATS— tip + WA*BS) T = PS pack size*8*system clock frequency I PSrate ここで、 PCR— tipと ATS— tipは夫々、変換する Multiplexing Unit直前の Tipパケ ットに記述された PCR値と、その Tipパケットの ATS値である。 WAは、 i番目の Multi plexing Unitの中で先頭の TSパケットに付与された ATS (ATS[n])と ATS— tipとの 間の ATSで、何回桁あふれが起きたかを表しており、 BSは、 ATSの一回の桁あふれ の量を表している。また、 max(a, b)は a, bの内で大きい方の値を選択する関数であ る。
[0327] また、 SCR[i] (i=0、 1、 2、 3. . . )に関する関係式では、前述の通り、 PS— pack —sizeは TS2PS変換で生成される MPEG— PSのパック 1個分のバイト長である。 sy stem— clock— frequencyは MPEG— PSデコーダの基準時刻の周波数であり、 P Srateは TS2PS変換で生成される MPEG— PSストリームの多重化レートである。す なわち、
PS— pack— size = 2048 バイト、
system― clock― frequency = 27000000 Hz、
PSrate = 10080000 ビット Z秒である。
[0328] 従って、先頭以降のパックの送出については、一つ前のパックの送出時刻から転送 レートで定められる転送最小時間経過後に送出する力、そのノックを形成する最初 の TSパケットのデコーダ入力時刻にて送出される力、の 2つのパターンがある。ビデ ォデータを DVDフォーマットへ変換した時刻よりも早い時刻に送出している時には、 前者の転送最小時間間隔をあけて送出される方が選択される。例えば、ビデオデー タを DVDフォーマットへ変換したときよりも早い時間帯に送出している場合は、一つ 前のパックの送出時刻から転送レートで定められる転送最小時間経過後に送出され る。
[0329] 尚、 Constrained SESFは編集が可能であるため、 encode— condition= l ib で記録した場合でも、ストリームの先頭部分を編集で消去した場合等は、 calculated
_PCR[0] =0とならないことも考えられる。
[0330] しかしながら、 encode— condition= l ibでありながら、 calculated— PCR [0] =
0でない場合には、 encode— condition= l lbの場合のみ、次の変換式を定義する ことで、問題を解決することができる。 SCR[0] = 0
SCR[i] = max( SCR [ト 1] + T, calculated— PCR[i] ) - calculated— PCR[0] (i= 1,2, 3, ...)
calculated— PCR[i] = PCR— tip + (ATS[n] - ATS— tip + WA*BS) T = PS― pack― size*8*system― clock― frequency I PSrate
PTS(DVD— Video) = PTS(Constrained SESF) - calculated— PCR[0] DTS(DVD— Video) = DTS(Constrained SESF) - calculated— PCR[0] ATS[n]、 WAは上記の通り、 i番目の Multiplexing Unit先頭の TSパケットの ATS 値と、 ATS— tipからの桁あふれ回数である。
[0331] つまり、 DVD— Video規格に準拠させるために、 SCR[0] =0とし、以降の SCRは 前述の変換式の結果に時間 calculated— PCR[0]だけオフセットされた値を用い、 DVD— Videoストリーム中の PTS、 DTSも全て、一律に時間 calculated— PCR[0] だけオフセットする。
[0332] こうして、ストリームの時刻情報を一律にオフセットすることで、 Constrained SES F (encode— condition = 1 lb)の先頭等を削除した場合でも、 encode— conditio n= 1 lbのまま管理され DVD— Videoフォーマットへ変換ができる。
[0333] DVD— Video規格フォーマットへの変換においては、 PTSZDTS値の変換が発 生するが、 TSパケット単位の逐次処理で容易に実現できる。
[0334] TS2PS変換する際には、上式に基づ 、て ATS力も SCRが計算される。 TS2PS変 換により得られるプログラムストリームは前述のように P— STDモデルを準拠する必要 があり、このため SCRの値はある範囲に制限される。したがって、 Constrained SE SFの各パケットに付与される ATSの値は上述の ATS— SCR関係式を考慮して設 定される必要がある。
[0335] (エレメンタリーストリームに関する制限)
次に、 Constrained SESFのエレメンタリーストリームに関する制限を説明する。
[0336] エレメンタリーストリームの再エンコードは機器にとって非常に負荷の高 、処理にな るため、ビデオデータについては、 MPEG2— Videoのみが許され、オーディオデー タについては、 AC— 3、 MPEG 1 -Audio, LPCM力 S許される。 [0337] ここで説明する Constrained SESFは、 LPCMを除外している力 これは 20ビット 以上の量子化ビット数を持つ LPCMの場合にエレメンタリーストリームの再エンコード を行う危険性を避けるためと、転送レートが上げられな ヽオーディオのデータ量を削 減することで、ノ ッファマネージメントを容易に行うためでもある。しかしながら、 16ビッ トの LPCMであれば、特に除外する必要はない。以下に説明する Constrained S ESFに許されたストリームは、ビデオに関して MPEG2—Video、オーディオに関し て AC— 3、 MPEG1— Audioの 2種類のみとして説明する。なお、 Constrained S ESFでない通常の SESFでは、オーディオデータの符号化がこれに限らず、 BSデジ タル放送で使用されて 、る AAC (Advanced Audio Coding)等の符号化方式が 用いられても良い。
[0338] 図 48に encode— condition = " 1 lb"の場合のエレメンタリーストリーム属性をまと めて示した。
[0339] 同図に示された属性は、 DVD— Video又は DVD VRフォーマットに対してエレメ ンタリーストリームレベルでの互換性を保てるように設定されているため、この属性に 従った Constrained SESF (encode— condition = 1 lb)は、 DVD— Video又は DVD VRフォーマットへ変換する際に、エレメンタリーストリームの再エンコードを必 要とせず、高速変換が可能である。
[0340] 図 49に encode— condition="01b"時のエレメンタリーストリーム属性をまとめて 示した。
[0341] 同図に示された属性は、 DVD VRとのエレメンタリーストリームレベルでの互換性 を保てるように設定されているため、この属性に従った Constrained SESF (encod e— condition = 01b)は、 DVD VRフォーマットへ変換する際に、エレメンタリースト リームの再エンコードを必要とせず、高速に変換可能である。
[0342] ここで、図 48、図 49に記述した Notel〜4について説明する。
Notel:この属性は、同一 VOB内で変化しては!、けな!/、。
Note2 :この属性は、 Tipパケットに続く最初のエレメンタリーストリームを格納した T Sパケット内で変化しても良い。言い換えれば、 SESF Capsuleで先頭のビデオもし くはオーディオの TSパケットでのみ変化できる。 Note3: horizontal― size、 vertical― sizeと aspect― ratio― information;^同 一で teる sequence _ headerf^に【ま、 sequence _ end _ codeを揷 して ίまならな い。
Note4 :この属性は、モノラル、ステレオ、デュアルモノの間であれば、同一 VOB内 で変化しても良い。
[0343] 以上が、 Constrained SESFのエレメンタリーストリームに関する制限である。
[0344] ここで、説明してきたエンコード条件をカ卩えることで DVDフォーマットへ容易にかつ 高速に変換可能な Constrained SESFの生成が可能となる。
[0345] (変換後の DVD—VideoZDVD VRフォーマット)
次に、 Constrained SESFが変換されるべき DVD— Video、 DVD VRのフォー マットにおけるフィールド設定について説明する。
[0346] (DVD— Videoフォーマット)
以下では、簡単に DVD— Video規格のストリームについて説明する。なお、 DVD
—Videoのストリームフォーマットの詳細については、「DVD Specifications for
Read-Only Disc Part3 VIDEO SPECIFICATIONS」に記述されている。
[0347] 図 50に DVD— Video規格のフォーマットのストリーム構造を示す。同図に示すよう に、各ストリームは複数の VOBを含み、各 VOBは整数個の VOBUから成る。 VOB Uは整数個のパックから成り、 NV— PCKを先頭としてビデオパック(V— PCK)ゃォ 一ディォパック(A— PCK)がこれに続く。 NV— PCKは、通常の DVDのパックの構 造と異なり 2つのパケットを内包した形となっている。それぞれのパケットは PCI ( Presentation control Information)ノヽ ット、 DSI (Data search Informationノノヽケッ トと呼ばれ、 PCIパケットには、当該 VOBUに対する再生制御情報が格納される。 D SIパケットには、当該 VOBUと周辺の VOBUとの位置関係等の特殊再生に有用な 情報が格納されている。以下では、フィールドを説明するとともに、その生成方法を合 わせて記述していく。
[0348] 図 51に NV— PCKの PCIデータの構造を示す。 PCIデータは、 PCIの全般的な情 報を格納する PCI GI (PCI General Information)と、非シームレスのアングル情報 である NSML— AGLIと、メニューボタンなどにハイライトを当てるための情報である HLIと、 ISRC (International Standard Recording Code)を格納する RECIとから構 成される。
[0349] NSML— AGLIと HLIは、 Constrained SESFから変換された場合には、無効を 意味するデータが記述される。
[0350] ISRCには、無効を意味するデータを記述しても良いし、 ISRCコードを正しく記述 しても良いが、 Constrained SESFからの変換に関係がないため、ここでの説明は 割愛する。従って、 Constrained SESFから PCIデータを作成する際に問題となる のは、 PCI— GIのみである。
[0351] 図 52に NV— PCKの PCI— GIの構造を示す。以下では、 Constrained SESF力 ら変換する際に計算を要するフィールドについてのみその算出方法を説明する。
[0352] NV— PCK— LBN (VOBSファイル内での該 NV— PCK相対アドレス)は、情報記 録装置が変換中に何番目のパックになる力数えておくことで、生成可能である。
[0353] VOBU— CAT (アナログコピープロテクション状態の情報)は、 NV— PCKに対応 している Tipパケットの display— and— copy— infoから取得可能である。
[0354] VOBU— S— PTM (VOBU内で最初に表示されるビデオフィールドの再生時刻情 報)は、 NV— PCKに対応している Tipパケットの FVFPST力も計算可能である。
[0355] VOBU— E— PTM (VOBU内のビデオデータが再生完了する時刻情報)は、ァク セスマップの次のエントリーに記述された再生時刻情報から取得する力 VOBUに 対応するビデオストリームを解析して、ビデオの再生が終了する時刻を算出すること で生成可能である。
[0356] VOBU— SE— E— PTM (VOBU内のビデオデータで sequence— end— codeに よって再生が終了する時刻情報)は、 sequence— end— codeが VOBの最後にしか 認められていないため(図 48参照)、ストリーム途中の VOBUには、 sequence— end —code力なく、「0x00000000」力埋められる。最後の VOBU内に Sequence— en d— codeがある NV— PCKについてのみ、 VOBU— E— PTMと同値となる。
[0357] C— ELTM (該 NV— PCKが格納される CELLの最初に表示されるビデオフレーム の再生時刻と該 VOBU内で最初に表示されるビデオフレームとの時間差情報。フレ ーム精度が必要)は、情報記録装置が変換中に、 CELL最初に表示されるビデオフ レームの再生時刻情報と、該当する Tipパケットの FVFPSTを用いて随時計算する ことが可能である。
[0358] 以上のようにして、 NV— PCKの PCIデータは、変換中に、 VOBU単位で随時生 成して 、くことが可能である。
[0359] 図 53に NV— PCKの DSIの構造を示す。図示したように、 DSIデータは、 DSIの一 般情報を格納する DSI— GI (Data Search Information General Information)と、 V OB間をシームレス再生するために必要となる記録アドレス、再生情報等を 格納した SML—PBI (Seamless Playback Information)と、異なるアングル間でシー ムレス再生するための配置情報等を格納した SML—AGLI (Angle Information for seamless)と、その VOBU近隣の VOBUの記録アドレス情報等を格納した VOBU _SRI (VOB Unit Search Information)と、ビデオとオーディオ Zサブピクチヤとの 同期再生のための情報である SYNCI (Synchronous Information)とから構成される。
[0360] SML— AGLIは、 Constrained SESFから変換された場合には、無効を意味す るデータが記述される。
[0361] 図 54に NV— PCKの DSI— GIの構造を示す。 Constrained
SESF力も変換する場合に、計算が必要なフィールドについてだけ、以下にその算 出方法を説明する。
[0362] NV— PCK— SCR (NV— PCKの SCR値)は、後述する算出方法で Constrained
SESFの ATS力 SCRを導出しており、その SCRから導出される。
[0363] NV_PCK_LBN (VOBSファイル内での NV_PCK相対アドレス)は、 PCIデー タとそれを求めるのと同様である。
[0364] VOBU— EA(NV—PCKから VOBU内の最後のパックまでの相対アドレス)は、ァ クセスマップ力も計算可能である。前述の通り、 2つの連続する Tipパケット間におい て、 Multiplexing Unitに属さないパケット個数が既知(固定)であるため、アクセス マップから、次のエントリー(次の Tipパケット)までの TSパケット数が計算でき、その T Sノケット内に、 Multiplexing Unitに属さない TSパケットの個数を減算し、その結 果を 11で割ることで NV— PCKに続き、何個のパックが形成されるか計算可能である 。最後の Tipパケットから派生される NV—PCK、もしくは全ての NV—PCKについて は、変換後に生成されたパック数をカウントしておきそれを記述しても良い。
[0365] VOBU— 1STREF— EA(VOBU内で、 NV— PCKから 1番目の参照ピクチヤの 最後のパックまでの相対アドレス)と、 VOBU— 2NDREF_EA(VOBU内で、 NV — PCKから 2番目の参照ピクチヤの最後のパックまでの相対アドレス)と、 VOBU— 3 RDREF— EA(VOBU内で、 NV—PCKから 3番目の参照ピクチヤの最後のパック までの相対アドレス)とについては、 Tipパケットの PES— infoを参照しながら、 TS2P S変換を行えば、ビデオストリーム層まで解析する必要なく導出することが可能である
[0366] PES— infoには、各ビデオの PESパケット力 どのようなエンコードをされたピクチ ャカを す picture _ coding _ type3 己述 れ飞いる。 picture _ coding _ type = 01b, 10bを持つ PESパケットは、 DVD— Video規格でいう参照ピクチャを格納して いる。
[0367] 従って、 TS2PS変換を行 、ながら、 PES— infoを参照し、現在変換して!/、る PES パケットが、参照ピクチャを格納しているの力否かを判断し、この変換している PESパ ケットが終了したパック力 参照ピクチヤの終端のパックとなる。
[0368] このようにして、参照ピクチヤの終端のノ¾ /クは、変換中に識別可能であるため、 V OBUを生成しながら、 1番目、 2番目、 3番目の参照ピクチヤがどのノックで完結して いるかを求め、 VOBU先頭の NV—PCKの VOBU— 1STREF—EAと、 VOBU— 2NDREF— EAと、 VOBU— 3RDREF— EAとに夫々の終端までの相対アドレスを 記述することが可能である。
[0369] もしくは、 SESF Capsuleを変換中にビデオを格納した PESパケットの PTS—DT S— flagsの値を参照し、 PTS— DTS— flags = l ibであれば、参照ピクチヤが格納 されており、 PTS—DTS— flags = 10bであれば、非参照ピクチヤが格納されている と逐次判断しながら、これらの値を算出しても良い。
[0370] VOBU_VOB_IDN (該 VOBUが属する VOBの ID番号)は、情報記録装置が 変換中に求めることができるはずである。 1つの Constrained SESFを変換してい る時には、 Constrained SESF (encode condition= l ib)の定義により、属性 の変化等のストリームの条件で VOBが分割される可能性はなぐ同一番号が割り振 られる。
[0371] VOBU— C— IDN (VOBUが属する CELLの ID番号)も VOBU— VOB— IDNと 同様に、情報記録装置が変換中に自ら設定する番号であり、ストリームとの関連はな い。 Constrained SESFの PGC情報等の管理情報から CELLを意図的に分割す る場合には、分割に応じた番号が付与されるだけである。
[0372] C— ELTM (NV—PCKが格納される CELLの最初に表示されるビデオフレームの 再生時刻と VOBU内で最初に表示されるビデオフレームとの時間差情報。フレーム 精度が必要)は、 PCIデータ内に記述された C— ELTMと同一である。
[0373] 以上のようにして、 NV— PCKの DSI— GIの各フィールドは、変換中に、 VOBU単 位で随時生成して 、くことが可能である。
[0374] 図 55に NV— PCKの SML— PBIの構造を示す。以下では、 Constrained SES Fから変換する場合に計算が必要となるフィールドについてのみその算出方法を説 明する。
[0375] VOB_V_S_PTM (NV— PCKが属する VOBの最初に表示されるビデオフレ ームの時刻情報)は、最初の Tipパケットの FVFPSTから計算可能である。
[0376] VOB_V_E_PTM (NV_PCKが属する VOBのビデオ再生終了時刻情報)は 、 TS2PS変換の前に、予め Constrained SESFの中で、変換に指定された部分で 最後の Tipパケット以降のストリームを解析しビデオの再生終了時刻を求めておくこと で、随時設定可能である。
[0377] 以上のようにして、 NV— PCKの SML— PBIの各フィールドは、変換前に、計算し ておくことが可能であり、変換中にはその値を用いれば良!、。
[0378] VOBU— SRIは、前述の通り、アクセスマップを利用し、計算することが可能である ため、ここでの説明は割愛する。
[0379] また、 VOBU— SRIはセルごとに完結して記述されるため、セルが定義されなけれ ば、計算することはできない。したがって、リアルタイムに DVD— Videoフォーマット で記録するようなレコーダにおいては、任意の区間でセルを切ることができず、編集 性、再生性に欠ける力 Constrained SESF力も変換する際には、上記方法に従 つて、ユーザが指定した区間をセルと定義し変換することが可能なため、チャプター をユーザが意図した通りに作成できることになり、ユーザ指定の地点力 再生を開始 するプレイリストが DVD— Videoフォーマットで実現可能となる。
[0380] 図 56に NV— PCKの SYNCIの構造を示す。以下では、 Constrained SESF力 ら変換する場合に計算が必要なフィールドについてだけ、その算出方法を説明する
[0381] A—SYNCA0 (プライマリーオーディオを格納したパックで、 VOBU— S— PTMと 同時もしくは直後に再生されるオーディオフレームが格納されたパックの相対アドレス )は、 Tipパケット内の PES— infoを用いて、ストリーム解析することなぐ TS2PS変換 中に取得することが可能である。
[0382] PES— infoの stream— identifierを参照することで、その PESパケットがプライマ リーオーディオを格納しているか判別でき、次の sync— presentation— flagにて、 P ESパケットの中に含まれるオーディオフレームの中に、 VOBU— S— PTMと同時も しくはその直後に再生されるオーディオフレームがあるか否かが識別できる。従って、 TS2PS変換を行いながら、 PESパケットがプライマリーオーディオを含み、かつ、 sy nc— presentation— flag = lbである場合に、 NV— PCKから PESパケットが格納さ れたパックまでのアドレスを記述できる。
[0383] 尚、 sync— presentation— flagが VOBU内の 1つのオーディオパック内で lbにな る保証はない。オーディオを先に多重化しているエンコーダであれば、ある VOBUの VOBU— S—PTMと同時もしくは直後に再生されるオーディオパックが前の VOBU に格納されることも考えられるし、またその逆も考えられる。
[0384] 従って、 A— SYNCA0の値の設定において、変換中のプライマリーオーディオの P ESパケット(その sync— presentation— flagは lb)と、以降生成される NV— PCK との順序関係を正しく理解した上で、その値を設定する必要がある。
[0385] 尚、この処理をなくすために、予め Constrained SESFは、 SESF capsule内に 、その SESF capsule先頭の Tipパケットに記述された FVFPSTと同時もしくは直後 に再生されるオーディオデータを格納するようにシステムエンコードするようにしてお いても良い。 [0386] このように定義することで、 VOBU (SESF capsule)を超えて VOBU— S—PTM (FVFPST)と同期したオーディオデータを検出する処理をなくすことが可能となる。
[0387] A— SYNCA1 (セカンダリーオーディオを格納したパックで、 VOBU— S— PTMと 同時もしくは直後に再生されるオーディオフレームが格納されたパックの相対アドレス )は、 A— SYNCA0と同様の方法にて設定可能である。
[0388] 以上のようにして、 NV— PCKの DSIデータは、変換中に、 A— SYNCAを除き VO BU単位で随時生成して 、くことが可能である。
[0389] 図 84に NV— PCKの生成方法の一例をまとめる。
[0390] (DVD Video Recordingのフォーマット)
DVD Video Recording (VR)のストリームフォーマットへの変換時のフィールド 設定について説明する。
[0391] 以下、簡単に DVD VRのストリームを説明する。なお、 DVD VRのストリームフォ 一マットの詳細については、「DVD Specifications for Rewritable/Re - rec ordable Discs Part3 VIDEO RECORDING に記述されている。
[0392] 図 57に DVD VRフォーマットによるストリーム構造を示す。ここに示したように、各 ストリームは複数個の VOBを含み、各 VOBは整数個の VOBUから成る。 VOBUは 整数個のパックから成り、 RDI— PCKを先頭としてビデオパック(V— PCK)ゃォー ディォパック (A— PCK)がこれに続く。 RDI— PCKは、通常のパックと異なり、表示 やコピーの制御情報や、製造者固有情報を格納している。以下では、 RDI— PCKに 含まれる各フィールドを説明するとともに、その計算方法を合わせて説明する。
[0393] 図に示したように、 RDI— PCKのペイロードデータ(RDI Unit)は、 RDIの全般情 ¾ 格糸内した RDI一 GI (Real-time Data Information General Informationノと、表 示およびコピー制御のための情報を格納した DCI— CCI (Display Control Information and Copy Control Information)と、製造者固有情報を格納する MNF I (Manufacturer's Information)と力ら構成される。
[0394] RDI— GIはその内部に VOBU— S— PTMフィールドを含み、このフィールドだけ が可変であり、その他のフィールドは固定値が埋め込まれる。
[0395] VOBU S PTMは、変換前トランスポートストリーム中の対応する Tipパケットに 記述された FVFPSTと全く同一形式であるため、 FVFPSTの値がそのままコピーで きる。
[0396] DCI— CCIは、 Tipパケットの display— and— copy— infoと全く同一形式であるた め、 display— and— copy— infoの値がそのままコピーされることが可能である。
[0397] MNFIは、 Tipパケットに記述された maker— IDが当情報記録装置の製造者 IDと 同一の場合のみ、固有の製造者 IDが割り当てられ、製造者固有情報が記述 (コピー )される。しかし、 Tipパケット内の maker— ID力 他製造業者の IDである場合や、無 効な maker— ID値である場合には、 MNFIに無効なデータを記述することで RDIパ ックを生成しても良い。
[0398] 尚、 Tipパケット内に記述されたデータが一部無効である場合が想定される。この場 合、 Tipパケット内の該当データが無効であることを意味するフラグ (無効化フラグ)が 格納されているはずであるので、その無効化フラグが ONである場合には、 Tipバケツ トの該当データを最新のデータに更新して力も変更する必要がある。
[0399] 一例として、各 TSパケットごとの ATS (4B)の中に最新の CCI情報と TSパケット内 の CCIデータ無効化フラグが存在する場合等が考えられる。
[0400] この場合、 TS2PS変換する際に、無効化フラグが立って 、な 、ことを確認し、立つ て!ヽれば、 ATS内の CCIフラグでもって display— and— copy— infoの CCI情報を 更新したデータを用いて RDI—PCKに変換する必要がある。
[0401] 以上のように、 RDI— PCKは、対応する Tipパケット(及びその ATS)のみから、逐 次作成できる。
[0402] 図 58に上記の RDI— PCKの生成フローチャートを示す。
[0403] RDI— PCK (または NV— PCK)の場合、システムヘッダは固定値のフィールドから 構成されている。システムヘッダの詳細は図 61に示してある。また、 RDI— PCKに格 納される、パケットヘッダ、プライベートヘッダをそれぞれ図 62 (a)、(b)に示した。図 示した通り、これらのヘッダも固定値フィールド力も構成されるため、生成が容易であ る。
[0404] 図 59に AVデータを格納した TSパケット(lMultiplexing Unit)力ら PSのパック を生成するためのフローチャートを示す。 [0405] 同図に示したように、 AVデータを格納する Constrained SESFの TSパケットは、 1 Multiplexing Unitをその処理単位として、 AVデータを格納する MPEG— PSの 2KBのパックへと変換される。以下に、各ステップごとに処理を追って説明する。
[0406] (ステップ S4200) Constrained SESFのストリームの変換開始点から TSバケツ トを 1つだけ読み出す。
[0407] (ステップ S4201) 読み出した TSパケットが、 AVデータを格納し、かつ、 Multipl exing Unitの先頭の TSパケットであるか否かを判定する。 AVデータの格納の判 定は、 PMTにて AVデータを格納すると宣言された TSパケットの PID値を参照する ことによって行われる。 Multiplexing Unitの先頭か否かの判定については、その 前の TSパケットが、 Tipパケット、 PSIZSIパケット及び PCRパケットのいずれかであ る場合に、その直後に続く AVデータを格納した TSパケットが Multiplexing Unit の先頭であると判定する。変換開始点は Tipパケットであることが予想されるため、 M ultiplexing Unitの先頭か否かは順に TSパケットを読み込むことで判定可能であ る(つまり Tipパケット直後の AVデータを格納した TSパケットは必ず Multiplexing Unitの先頭である。 )。判定の結果、 Multiplexing Unitの先頭でない TSパケット の場合、または、変換が Tipパケットからスタートしておらず、判定ができない場合は、 次の TSパケットを読み込むため、 S4200へ処理力戻される。 Multiplexing Unit 先頭であることが確認できた場合は、次の処理へ進む。
[0408] (ステップ S4202) Multiplexing Unit先頭の TSパケットに付与された ATSを 用いて、その TSパケットが変換される MPEG— PSのパックがデコーダに入力される 時刻(calculated— PCR)を算出する。この算出方法については前述のとおりである 。 PCRが計算されれば、 SCRが前述の算出方法によって計算でき、図 60に示した ノックヘッダが完全に決定される。これは、ノックヘッダは、 SCRを除いて固定の値し か認められな 、ためである。
[0409] (ステップ S4203) パケットヘッダ、プライベートヘッダを作成する。
[0410] パケットヘッダは、 Constrained SESFの PESパケットヘッダを基に作成される。
作成されたパケットヘッダは、図 63に示されたフィールド値を満たす形式でなければ ならない。これは、ヘッダ長を変えるようなフィールドの値は決定しておかなければ Co nstrained SESFからの変換が一意に決定されず、バッファマネージメントに影響を 及ぼす危険があるためである。ここに示されていないフィールドは固定値であるため 列挙していない。
[0411] Constrained SESFで PESパケットヘッダの個々のフィールド値を詳細に決定し て!、るのは、 PESパケットヘッダ(MPEG—TS)からパケットヘッダ(MPEG— PS)へ の変換で要する処理を最小限にするためである。
[0412] PESパケットのサイズが 1パックのサイズに比較して大きい場合には、 1PESパケット が複数のパックに変換されることになる。この場合、 2つ目以降のパックのパケットへッ ダは、 PESパケットから生成された最初のパケットヘッダの PTS—DTS— flagsを「0 0b」に、 PES— extension— flagを「0b」に設定すること、 stuffing— byte長を調整 すること、及び、 PES_header_data_lengthを補正することが修正点となる。
[0413] プライベートヘッダは、 MPEG規格外のストリームを格納する際に必要となるため、 NV— PCKや RDI— PCK、それに AC— 3、 LPCM等を格納したパックに必要であ る。
[0414] 図 64に AC— 3のプライベートヘッダを示す。図に示すフィールドのうち、 Constrai ned SESFの Multiplexing Unitの定義によって、 TS2PS変換時に計算を要す るものは、 number— of— frame— headersのみである。このフィールドはそのパック に格納される AC— 3のオーディオフレームの数を指定するため、そのフィールドの値 は、固定レートの AC— 3については、 1オーディオフレームのバイト長がそのビットレ ートから計算でき、かつその値が固定長となることから、容易に PES— packet— leng th等力 計算できる。
[0415] 尚、 AC— 3のプライベートヘッダ(4B)により、 Constrained SESFの PESバケツ トヘッダの PES— header— data— length力 バイト分余計にスタッフイングされてい ることに注意すべきである。(図 44参照)このように、予め変換後のヘッダ長を見積も つてペイロードの位置をずらしておくことで、 TSパケット単位の逐次処理を容易にし ているのである。
[0416] 以上のように、最初のパケットヘッダはその PESパケットのヘッダから一部修正し、 2 つ目以降のパケットヘッダは、最初のパケットヘッダを一部修正し、プライベートへッ ダは MPEG規定外ストリームの時のみ挿入することで、パケットヘッダおよびプライべ ートヘッダを生成することが可能である。
[0417] (ステップ S4204) プライベートヘッダが作成されれば、後は TSパケットのペイ口 ード部分を PSパックのペイロード部分の先頭力も順に詰めてコピーしていくだけであ る。
[0418] (S4205〜S4207) これを Multiplexing Unit (11個の TSパケット)が終了する まで単純に繰り返すだけだ力 途中で NULLパケットが挿入されて 、る可能性がある ため、 NULLパケットの PID (OxlFFF)を確認して、 TSパケットのペイロードデータ のコピーを行う。
[0419] 尚、この際、 PESパケットの最後のデータを格納する TSパケットだけがァダプテー シヨンフィールドを持つように定義しておくのが好ましい。これにより、 Constrained SESFの中で PESパケットの最後のデータを格納する TSパケット最後を除く TSパケ ットは、常に 184Bのペイロードデータが格納されていることになるため、ペイロードデ ータの読み出しが容易になる。
[0420] (ステップ S4208) 次に、 Multiplexing Unitのペイロードデータまで、完全にコ ピーが終了した時点で、形成されたパックのバイト長を計算し、 2048Bになっている かどう力確認する。既に 2048Bになっていれば、そのパックの生成は終了する。まだ 2048Bになって!/ヽな!、場合に ίま、 S4209へ進む。
[0421] (ステップ S4209) パックが 2048Βになっていない場合、 2048Βになるようにノ デ イングパケットをペイロードの最後に追加する。
[0422] 以上のように、 AVデータを格納した Multiplexing Unitからの変換処理を行なう 。上記の処理を、 Constrained SESFの指定された変換部分の処理が終了するま で、 Multiplexing Unitが検出された場合のみ繰り返せば良い。
[0423] 上記の変換処理について各種パック毎の変換結果を説明すると以下のようになる。
[0424] (ビデオパック(V_PCK)への変換)
図 65 (a)、(b)に Constained SESFから MPEG— PSへの変換を図示した。図 6 5 (a)に示したように、一つのビデオ PESパケットは、通常 2KBよりも大きいため、複 数の Multiplexing Unitに分割され、 Constrained SESFに多重化されているの が一般的である。
[0425] Constrained SESFの規定により、一つのビデオ PESパケットを構成する最後の Multiplexing Unitを除き、 Multiplexing Unitには、最大にビデオ PESパケット のデータが詰め込まれる。従って、最後の Multiplexing Unitを除き、全ての Multi plexing Unitは、 2024バイト( = 184 X 11バイト)のデータが格納される。
[0426] このように規定することで、 TS2PS変換時に個々のパックの PES— packet— lengt hや、 stuffing— byteと!、つたフィールドを予め決めておくことができる。
[0427] 一つのビデオ PESパケットのデータを格納した最後の Multiplexing Unitは、余 つたデータ量をァダプテーシヨンフィールドと、 NULLパケットで埋め合わせ、 1つの 完全な Multiplexing Unitを構成しても良 、し、データ転送の効率化(変換した M PEG— PSパックへの格納データ量を増やす目的)のために、次の PESパケットのデ ータを格納するようにしても良 、。
[0428] ただし、 DVDへの変換容易性を考えて、 SESF Capsule内の Iピクチャだけは、そ の SESF Capsule内で先頭のビデオデータを格納する Multiplexing Unitの先 頭 TSパケットから配置される。
[0429] Pピクチャ、 Bピクチャは、上記のように、 Multiplexing Unitの先頭から配置され なくとも良い。
[0430] 図 65 (a)、 (b)に図示したように、一つのビデオ PESパケットを構成する Multiplexi ng Unitは、以下の 3つの種類に分別が可能である。
[0431] PESパケットの先頭データを格納した最初の Multiplexing Unit (図中 MU # 1) と、 PESパケットの途中部分のデータを格納した Multiplexing Unit (図中 MU # n
、ここで、 η=2,3, ·Ν- 1)と、 PESパケットの最後のデ
ータを格納した Multiplexing Unit (図中 MU # N)である。
[0432] それぞれの種類に応じて、 TS2PS変換された MPEG— PSストリームの各パックは
、同図 65 (b)に示す構造になる。
[0433] MU # 1から変換されたパックは、ノ^ク生成時に必ず 10バイト以上の空きができる ため、パディングパケットが最後に挿入される。
[0434] DVDフォーマットでは、パックに 7バイト以下の空きができる時には、スタッフイング バイト(パケットヘッダの最後のフィールド)を 2048バイトになるまで追加し、 8バイト以 上の空きができる時には、パディングパケットを挿入する決まりになっているためであ る。
[0435] また、 MU # nから変換されたパックは、スタッフイングを 1バイト足してパックを構成 する。
[0436] また、 MU # N力も変換されたパックは、通常、ノック構成時の空き領域が 8バイトよ りも大きくパディングパケットが挿入されることになる。
[0437] (オーディオパック(A_PCK)への変換)
図 66 (a)、(b)に Constained SESFから MPEG— PSへの変換を図示した。図 6 6 (a)に示したように、( 1つ以上のオーディオフレームを格納する)一つのオーディオ PESパケットは、 1つの Multiplexing Unitよりも小さなサイズとなる。
[0438] 一つのオーディオ PESパケットは、一つの Multiplexing Unitに収まるため、ビデ ォ PESパケットのように複雑な変換は必要ない。つまり、図 66 (b)に示したように、必 ずパディングパケットが挿入されるパックが生成されるはずである。
[0439] また、 PES— packet— lengthも TS2PS変換で変わることがないため、変換時に計 算するのは、 MPEG1— Audioを変換する際に stream— idを適宜設定したり、 AC 3用のプライベートヘッダを生成したりする程度の簡単な処理のみである。
[0440] また、図に示したように、 Constrained SESFのシステムエンコードを困難にする 大きな要素であるオーディオデータの転送時間を、最小にすることで、ノ ッファマネ ージメントを簡単にすることが可能である。
[0441] オーディオ Multiplexing Unitの転送時間分は、ビデオデータやその他の PSlZ SIパケットが転送できないため、全体の転送レートが下がってしまう課題 (画質低下) と、この転送時間が長くなればなる程、その分ビデオデータを TS上では前倒しで転 送する必要が出てくる課題 (システムエンコードが複雑化)等の問題を引き起こすた め、可能な限り短い時間で転送することが理想である。
[0442] 言い換えれば、オーディオ Multiplexing Unitを短い時間で転送するということは 、オーディオの転送レートを上げるということであり、これは、 T— STDと P— STDの大 きな違いであった、オーディオの許容入力レートの差を減少させることにつながる。従 つて、 2つのデコーダモデルに合致しなければならない Constrained SESFを生成 することを容易にすると 、う大きな利点がある。
[0443] 図 67に、 Constrained SESFで許される各音声のビットレートと、その夫々ごとに AC— 3と MPEG1— Audioを格納する場合に、 1オーディオ PESパケットに格納され る最大ペイロード長を示した。ここに示すバイト長よりも大きなデータが 1オーディオ P ESパケットに格納されることはないため、常にパディングパケットが挿入されることに なる。
[0444] (PESパケットにおける制限)
整数個のオーディオフレームを含む整数個の PESパケットを、整数個の Multiplex ing Unitに格納するようにして、変換後の MPEG— PSパックへの格納データ量を 増やし、効率的に多重化しても良い。ただし、この場合、変換時の PTSの演算が問 題となる。
[0445] DVD規格では、オーディオの PESパケットヘッダ内の PTSとして、その PESバケツ ト内で始まる最初のオーディオフレームの PTSを記述するように定められている。
[0446] TS2PS変換を行う際に、 MPEG— PS (DVD)へ変換後に PESパケットの先頭に なるオーディオフレームと、変換前の Constrained SESFで多重化された PESパケ ットの先頭になるオーディオフレームが一致しないケースがある。そこで、本発明では 、変換後の MPEG— PSのパックの PESパケット内で最初に始まるオーディオフレー ムが必ず PTSを持つように Constrained SESFで多重化する。これにより、 TS2PS 変換時に、新たに PTSを演算して求める必要がなくなる。
[0447] したがって、 Multplexing Unitの中で、最初に始まる完全なオーディオフレーム は、 Multplexing Unit内の PESパケットのペイロードの中で最初のオーディオフレ ーム(つまり必ず PTSが記述されたオーディオフレーム)とすることが有効である。そこ で、本発明に係る Constrained SESFは、「Multplexing Unitの中で最初に始 まる完全なオーディオフレームは、 Multplexing Unit内の PESパケットのペイロー ドの中で最初のオーディオフレームとする」ことを規定する。尚、この規定は「Multpl exing Unitの中でフレーム先頭バイトが最初に始まるオーディオフレームは、 Mult iplexing Unit内の PESパケットのペイロードの中で最初のオーディオフレームとす る」としてもよい。本規定による制約は Constrained SESFの制限の 1つであるため 、 encode— conditionフラグを参照することにより、上記の規定を満たすか否かが判 定できる。
[0448] 図 85は、上記規定を満たす Constrained SESFでフォーマットされた MPEG— T
Sと、それから変換される MPEG— PSとを説明した図である。
[0449] PESノケット 411、 412、 413の PESパケットヘッダには、それぞれ、各 PESバケツ ト 411、 412、 413に含まれるオーディオフレームの中の最初のオーディオフレーム(
AF # 1、 AF # 5、 AF # 8)に対する PTS値(PTS # 1、 PTS # 5、 PTS # 8)が含ま れている。
[0450] 最初の Multplexing Unit (401)には、 PESパケット 411の全てのデータと PES パケット 412の途中までのデータとが含まれる。
[0451] 最初の Multplexing Unit (401)において、その Multplexing Unit (401)内の 最初の完全なオーディオフレームはオーディオフレーム # 1であり、これは、 PESノ ケット 411のペイロード内の最初のオーデオフレームとなっており、上記の規定を満 たして 、る。また、第 2番目の Multplexing Unit (402)に注目すると、 Multplexin g Unit (402)内の最初の完全なオーディオフレームはオーディオフレーム # 8であ り、これは、 PESパケット 413のペイロード内の最初のオーディオフレームとなってお り、上記の規定を満たしている。なお、 Multplexing Unit (402)は、 PESパケット ヘッダ直後にオーディオフレーム # 7の後半部分を含んでいる力 それはオーディオ フレームの一部であって完全なオーディオフレームではないため、上記規定を考慮 する際の条件とはならない。
[0452] 最初の Multplexing Unit (401)に含まれる PESパケット 411の PESパケットへッ ダには、それに続くオーディオフレーム(AF)の中の最初の完全なオーディオフレー ム # 1の PTSの値(PTS # 1)が含まれる。また、第 2番目の Multplexing Unit (40 2)には、それに続くオーディオフレーム (AF)中の最初の完全なオーディオフレーム # 8の PTSの値(PTS # 8)が含まれて!/、る。
[0453] 第 2番目の Multplexing Unit (402)を、 MPEG— PSに変換するとき、変換先の MPEG— PS内の PESパケットヘッダには、 Multplexing Unit (402)に含まれる P ESパケットヘッダに格納される PTSの値(PTS # 8)がそのままコピーされる。このよう に、 PS2TS変換時において、 PTS値をそのままコピーするだけでよぐ処理が簡略 化される。
[0454] 次に PESパケットにビデオデータが含まれる場合を説明する。 Constrained SES Fの制約の 1つとして、ビデオデータを含む PESパケットに対し、「Iピクチャを格納し た PESパケットは、 Multplexing Unitの先頭から始まる」と!、う制約を設けてもよ!ヽ
[0455] 図 86に上記規定を満たした例を示す。図 86において、 PESパケット 416は Iピクチ ャを含み、その PESパケットヘッダには、 Iピクチャの PTS値(PTS # 2)が格納されて いる。そして、 PESパケット 416は Multplexing Unit (404)の先頭に配置されてい る。
[0456] 変換後の MPEG— PSパックにおいて、 PESパケットヘッダ 421に格納される PTS 値(PTS # 2)はその直後の Iピクチャを指し示して!/、る。なお、 Multplexing Unit ( 403)は PESパケット 415のペイロードに含まれる Pピクチャを格納し、その残りの部 分に NULLパケットを挿入することにより、 Iピクチャを次の Multplexing Unit (404 )にァライメントしている。
[0457] Multplexing Unit (404)を MPEG— PSに変換する際には、 MPEG— PSパック の PESパケットヘッダ 421に、 Multplexing Unit (404)内の PESパケットヘッダの 値(PTS # 2)がコピーされる。このように PTS値はコピーされるだけでよいので、 PTS 値を演算して求める必要がなぐ処理を簡略化できる。
[0458] (TS2PS変換処理)
図 68から図 81のフローチャートを用いて TS2PS変換処理の詳細を説明する。
[0459] 図 68は TS2PS変換のメインの処理を示したフローチャートである。本処理はユー ザにより TS2PS変換のリクエストがあつたときに開始される。まず、変換を開始する先 頭の SESF Capsuleをシークする(S 11)。そして、処理すべき SESF Capsuleが 有るか否かを判断し(S12)、なければ処理を終了し、 SESF Capsuleがあれば、初 期化処理(S13)及びカプセル単位処理(S14)を行なう。
[0460] 図 69のフローチャートを用いて初期化処理(S13)について説明する。ここでは、そ の後の処理に使用される変数等の設定、初期化を行なう。まず、 Tipパケットが読み 込まれているか否かを判断し (S21)、未だ Tipパケットが読み込まれていなければ、 Tipパケットを読み込む(S22)。変数 ATSTipに Tipパケットの ATS値を代入する(S 23)。変数 PCRTipに Tipパケットの PCR値を代入する(S24)。処理中の Multiplexi ng Unitの番号を指定する変数 MU— numを 0に設定する(S25)。 ATSの桁あふ れの回数を示す変数 WAを 0に設定する(S26)。
[0461] 図 70のフローチャートを用いてカプセル単位処理(S14)について説明する。一つ の TSパケットを読み込む(S31)。読み込んだ TSパレットが Tipパケットであるか否か を判断する(S32)。 Tipパケットであれば処理を終了する。 Tipパケットでなければ、 読み込んだ TSパケットがオーディオパケットまたはビデオパケットかを判断する(S33 )。読み込んだ TSパケットがオーディオパケットまたはビデオパケットでない場合、ス テツプ S31に戻り、読み込んだ TSパケットがオーディオパケットまたはビデオパケット になるまで順次 TSパケットを読む(S31〜S33)。読み込んだ TSパケットがオーディ ォパケットまたはビデオパケットであれば、その後に続く 10個の TSパケットを読み込 む(S34)。 MU_numをインクリメントする(S35)。 Multiplexing Unit先頭の TSパ ケットの ATS値を、変数 ATS[MU— num]に格納する(S36)。 Multiplexing Unit に格納された PESパケットのペイロードデータのバイト長を payload— lenとする(S37) 。そして、ノック単位処理を行なう(S38)。
[0462] パック単位処理は図 71のフローチャートに示すように、 SCR演算処理(S41)、パッ クヘッダ処理(S42)、パケットヘッダ処理(S43)、ペイロード処理(S44)及びパディ ングパケット処理 (S45)からなる。以下に各処理を詳細に説明する。
[0463] 図 72を用いて SCR演算処理を説明する。
[0464] ここでは、パックの SCR値を求めている。まず、変数 MU— numの値を参照し、 Cup suleにお!/、て第 1番目の Multiplexing Unitか否かを判断し、第 1番目であれば、 変数 ATS[0]に変数 ATSTipの値を、変数 SCR[0]に変数 PCRTipの値を代入する( S51〜S53)。
[0465] そして、 ATS[MU_num]と、 ATS[MU_num— 1]とを比較する(S55)。 ATS「i」 には、 Multiplexing Unit先頭のパケットの ATS値が格納され、この ATS値は、あ るパケットを基準とした相対的な転送タイミングを示す値である。したがって、通常は、 後のパケットの ATS値は前のパケットの ATS値よりも大きな値をとる。しかし、 ATS値 は一般に 30ビットで表される有限な値であるため、桁あふれを起こす場合があり、こ のときは、後のパケットの ATS値は前のパケットの ATS値よりも小さくなる。ステップ S 54では、この ATS値の逆転を見ており、これにより、桁あふれが発生したか否かを判 断している。 ATS[MU— num]が ATS[MU— num—l]以下であれば、すなわち、桁 あふれが発生していれば、変数 WAをインクリメントする(S55)。
[0466] そして、 SCR[MU— num]に、 SCR[MU— num— 1]+T力 (PCRTIP+ATS[MU _num] - ATSTip + WA X BS)の!ヽずれか大き!/ヽ方を代入する(S56)。
[0467] 図 73を用いてパックヘッダ処理を説明する。
[0468] ここでは、図 60に示すデータ構造を有するパックヘッダデータを編集する。 SCR— extensionに SCRを 300で除算したときの余りの値を代入する(S61)。 SCR— baseに SCRを 300で除算したときの商の値を代入する(S62)。 program— mux— rateに「0x 6270」を代入する(S63)。 pack_stuffing_lengthに「000b」を代入する(S64)。そ の他のフィールドを編集し、ノ ックヘッダデータを完成させる(S65)。
[0469] 図 74を用いてパケットヘッダ処理を説明する。
[0470] まず、ストリーム IDを設定するストリーム ID処理を行なう(S71)。その後、 Multiple xing Unitにビデオデータが含まれるか否かを判断する(S72)。
[0471] Multiplexing Unitにビデオデータが含まれる場合は、 Multiplexing Unit先 頭の TSパケットが PESパケットヘッダを含むか否かを判定する(S73)。 Multiplexin g Unit先頭の TSパケットが PESパケットヘッダを含む場合、 Video PESパケット先 頭処理を行ない(S74)、そうでない場合は、 PESパケット非先頭処理を行なう(S75) 。尚、 Multiplexing Unit先頭の TSパケットが PESパケットヘッダを含むか否かは 、 TSパケットのヘッダの payload— unit— start— indicatorを参照したり、直接、 PE Sパケットヘッダのスタートコードが格納されているかを参照することで判定する。
[0472] 一方、 Multiplexing Unitにビデオデータが含まれない場合は、 Multiplexing Unitに PESパケットヘッダを含むか否かを判定する(S76)。 Multiplexing Unitが PESパケットヘッダを含む場合、オーディオ PESパケット先頭処理を行ない(S77)、 そうでない場合は、オーディオ PESパケット非先頭処理を行なう(S78)。
[0473] 図 75を用いてストリーム ID処理を説明する。
[0474] ここでは、 stream— idフィールドの値を設定する。処理中のストリームの種類力 'M PEG2— video"であれば、 stream— idに" OxEO"を設定する(S81、 S82)。処理中 のストリームの種類力 S"AC3— audio"であれば、 stream— idに" OxBD〃を設定する( S83、 S84)。処理中のストリームの種類力 'MPEGl— audio"で且つ" Primary au dio"場合は、 stream— idに" OxCO"を設定する(S85、 S86、 S87)。処理中のストリ ームの種類力 'MPEGl— audio"で且つ" Secondary audio"場合は、 stream— i dに" OxCl〃を設定する(S85、 S88、 S89)。
[0475] 図 76を用いてビデオ PESパケット先頭処理を説明する。
[0476] 図 83は MPEG規格における PESパケットの構造を詳細に示した図である力 本処 理では同図の構造にしたがい各フィールドを編集する。
[0477] まず、 Multiplexing Unit先頭の TSパケットに格納された PESパケットヘッダと同 一の PESパケットヘッダを、変換後の MPEG— PSの PESパケットヘッダとして生成 する(S91)。次に、 PES— packet— lengthに次式で計算した値を設定する(S92)
[0478] PES一 packet一 length =
(3 + PE S― neader― data― length) + p aylo ad― len
次に、 PES— extension— flag力 'l"か否かを判断し(S93)、 PES— extension —flag力 'l"のときは、 PES— private— data— flagから P— STD— buffer— sizeま での 3バイトを所定値("0xlE60E8")で上書きする(S94)。
[0479] 図 77を用いてビデオ PESパケット非先頭処理を説明する。
[0480] PESノケットヘッダに仮の値("0x000001E007EC800001FF")を設定する(S1
11)。(2025— payload— len)の値が 1と 8の間にあるか否かを判定する(S 112)。
[0481] (2025— payload— len)の値が 8以上であれば、ステップ S116に進む。
[0482] (2025 -payload_len)の値が 1と 8の間にあれば、 PES_header_data_leng thを(2025— payload_len)に設定し(S113)、 PES_packet_lengthに次式で 計算した値を設定する(S114)。 [0483] PES一 packet一 length =
(3 + PE S― header― data― length) + p aylo ad― len
そして、 stuffing_byteに、(2024— payload_len)バイトのスタッフイングバイト を設定し(S 115)、ステップ S 116に進む。
[0484] ステップ S116では、(2025— payload— len)の値が 8以上か否かを判定する。 8 以上であれば、 PES— header— data— lengthを 0に設定し(S 117)、 PES— pack et— lengthに次式で計算した値を設定する(S118)。
[0485] PES— packet— length = 3+ payload— len
そして、 stuffing— byteから、 1バイトのスタッフイングバイトを削除する(S119)。
[0486] 図 78を用いてオーディオ PESパケット先頭処理について説明する。
[0487] まず、 Multiplexing Unit内で最初に現れる PESパケットヘッダと同一の PESパ ケットヘッダを、変換後の MPEG— PSの PESパケットヘッダとして生成する(S181) 。次に、 PES— packet— lengthに次式で計算した値を設定する(S 182)。
[0488] PES一 packet一 length =
(3 + PE S― neader― data― length) + p aylo ad― len
次に、 PES— extension— flag力 'l"か否かを判断し(S183)、 PES— extension _flagが" 1 "のときは、 P— STD_buffer_flagに 1を設定する(S184)。そして、ォ 一ディォデータが AC— 3オーディオか否かを判断する(S185)。 AC— 3オーディオ であれば、 PES— extension— flag— 2に続く 2バイトを所定値("0x603A")に設定 する(S186)。 AC— 3オーディオでなければ、 PES— extension— flag— 2に続く 2 バイトを所定値 ("0x4020")に設定する(S187)。
[0489] 図 79を用いてオーディオ PESパケット非先頭処理について説明する。
[0490] stream— idが" OxBD〃か否力、、すなわち、オーディオデータが AC— 3オーディオ か否かを判定する(S191)。 stream_idが" OxBD〃であれば、 PESパケットヘッダに 仮の値" 0x000001BD0000800004FFFFFFFF"を設定する(S192)。そして、 P ES— packet— lengthに次式で計算した値を設定する(S193)。
[0491] PES packet length = 7 + payload_len
一方、 stream id力 'OxBD〃でなければ、 stream id力 'OxCO〃か否力、、すなわ ち、オーディオデータが MPEG— 1プライマリオーディオか否かを判定する(S194) 。 MPEG— 1プライマリオーディオであれば、 PESパケットヘッダに仮の値" OxOOOO 01C00000800000"を設定する(S195)。 MPEG— 1プライマリオーディオでなけ れ ίま、 PESノケッ卜ヘッダ【こ仮の値" 0x000001C10000800000"を設定する (S1 96)。そして、 PES— packet— lengthに次式で計算した値を設定する(S 197)。
[0492] PES— packet— length = 3+ payload— len
図 80を用いてペイロード処理を説明する。
[0493] 変数 iに 1を設定する(S121)。 i番目の TSパケットに格納された PESパケットのペイ ロードデータを読み込む(S122)。 i番目の TSパケットに格納された PESパケットの ペイロードデータをパックのペイロードに追加する(S123)。変数 iをインクリメントする (S124)。上記処理を変数 iが 12を超えない範囲で繰り返す (SI 25)。すなわち、 1 つの Multiplexing Unitに含まれる全ての TSパケットにつ!/、て上記の処理が行な われるまで、処理が繰り返される(S122〜S125)。
[0494] 図 81を用いてパディングパケット処理を説明する。
[0495] PES— packet— lengthが 2028か否かを判定する(S131)。 PES— packet— len gthが 2028でなければ、パディングパケットの PES— packet— lengthに { (2028— PES— packet— length)—6}を設定する(SI 32)。ペイロードに続けてパディング パケットを追加する(S133)。
[0496] 上述のように、変換した MPEG— 2の PESパケットに記述される PTSは、 Multiple xing Unitの中で最初に現れた PESパケットヘッダを参照して設定することが可能 である。(図 85、図 86参照)
[0497] 尚、上記説明にお 、て、ビデオの PESパケットの長さを示す PES— packet— leng th力 Oであるために、パックへ変換した後のパケットヘッダ内 PES— packet— length の算出がパックにデータが確定した後でなければ確定しない問題があった力 SES F capsule内のビデオ PESパケットごとの PES— packet— lengthを Tipパケットに 記述するようにしても良い。その結果、 PES— packet— lengthを TSパケット単位の 逐次処理にて決定することが可能となり、変換がさらに高速に行えるようになる。
[0498] 尚、上記説明にお 、て、ノ^クヘッダ (SCR)を TS2PS変換時に生成するように説 明したが、 MPEG—TSに格納される PESパケットヘッダにパックヘッダを予め格納し ておいても良い。例えば、 PESパケットヘッダの pack— header— field— flag = lbと して、 PESパケットヘッダ内に TS2PS変換後のパックヘッダを格納しておき、該パッ クヘッダと同一のノックに格納されるデータは該 TSパケットから所定の規則(例えば 所定個数)までの TSパケットに格納されたデータがパックに格納されるとしても良い。
[0499] (一連続の STC区間内におけるビデオピクチャの制限)
図 87 (a)に示したように、一連続の STC (システムターゲットデコーダ基準時刻)区 間内において、最初の完全な SESF Capsule内で最初に表示されるビデオピクチ ャ(Pf)がトップフィールドであり、最後の完全な SESF Capsule内で最後に表示さ れるビデオピクチャ(P1)がボトムフィールドとなるようにしてもよい。図 87 (b)は、この ルールを満たさないケースを示した図であり、最初の完全な SESF Capsule内で最 初に表示されるビデオピクチャ(Pf)がボトムフィールドとなり、最後の完全な SESF Capsule内で最後に表示されるビデオピクチャ(P1)がトップフィールドとなっている。
[0500] このように完全な SESF Capsule連続区間でビデオの表示形態に制限を設ける のは、 DVD— Videoの VOBへの変換時に(記録したストリームへの編集が無ければ )、ビデオストリームの再エンコードを防ぐことができるためである。これは DVD— Vid eo規格では、 1VOB内のビデオは、トップフィールドから再生され、ボトムフィールド の再生で終わることが要求されて 、るためである。
[0501] 上記の制約は Constrained SESFの制限の 1つであるため、 encode— conditio nフラグを参照することにより、上記の制約を満たすか否かが判定できる。すなわち、 このフラグを参照することにより、一連続の STC区間内において、最初の完全な SES F Capsule内で最初に表示されるビデオピクチャがトップフィールドであり、かつ最 後の完全な SESF Capsule内で最後に表示されるビデオピクチャがボトムフィール ドである力否かが判定できる。
[0502] 図 88は、上記の制限を設けた Constrained SESFでの録画処理のフローチヤ一 トである。
[0503] 最初に、一連続な STCの生成を開始する(S201)。次に、事前に設定された enco de conditionの値を取得する(S202)。 encode conditionの値は、ユーザゃ録 画機器の初期設定等により事前に設定されている。 encode— conditionが" l ib"か 否かを判断する(S203)。 encode— conditionが" l ib" (DVD— Videoモードでの 録画)のとき、最初の完全な SESF Capsuleをエンコードして!/、るか否かを判断する (S208)。最初の完全な SESF Capsuleをエンコードしている場合、最初の完全な SESF Capsule中の最初の表示ピクチヤがトップフィールドとなるようにエンコードす る(S209)。続いて、 encode— conditionが" l ib"のときの要求を満たす Constrain d SESFとしてデータをエンコードする(S210)。
[0504] 一方、 encode— condition力 S"01b" (DVD— Video Recordingモードでの録画 )のとき、 encode— conditionが" 01b"のときの要求を満たす Constraind SESFと してデータをエンコードする(S204)。
[0505] その後、 SESF Capsuleが完成する度にタイムマップ情報を逐次追加する(S205 ) o録画終了力否かが判断され(S206)、終了であれば、録画終了処理を行う(S207 )。終了するまで、上記ステップ S203から S205が繰り返される。
[0506] 図 89を用いて録画終了処理を説明する。
[0507] encode— conditionが" 1 lb"か否かを判断する(S211)。 encode— conditionが "l ib"のとき、最後の完全な SESF Capsule中の最後に表示されるピクチャがボト ムピクチャ力否かが判断される(S212)。ボトムピクチャでなければ、新規の SESFを 作成し、または現在エンコード中の SESFを完成させ、最後がボトムピクチャで終わる ようにエンコードする(S213)。
[0508] 一方、 encode— condition力 V l ib"でなければ、 encode— condition力 lb"の ときの要求を満たす、最後の SESF Capsuleを生成する(エンコードを停止する) (S 214)。
[0509] その後、タイムマップ情報を完成させ、記録媒体に記録する(S215)。
[0510] (シームレス接続)
次に、 Constrained SESFにおいて 2つの VOB (システムストリーム)をシームレス 接続する場合の制限について図 90を用いて説明する。シームレス接続とは、 2つの 別々の VOB (システムストリーム)を時間的に連続して再生可能とする接続をいう。図 90は、 Cell # 1と Cell# 2のそれぞれが指定する VOB # 1と VOB # 2をシームレス 接続する場合を示す。なお、シームレス接続に関しては従来より種々の技術が提案 されている(例えば、米国特許第 5923869号参照)。
[0511] 次世代の記録媒体の規格である BD (Blue—ray Disc)規格では、 PGCを構成す る各 Cellにおいて、その Cellよりも時間的に前に再生される Cellとの接続関係を記述 している。例えば、図 90に示す、 Cell# 2は、その前に再生される Cell # 1との接続 関係を示す情報 (以下「接続情報」という。)を含む。この接続情報は connection— c onditionであり、 VOBの管理情報(VOBI)内に格納される。
[0512] connection— conditionの値は以下のように設定される。
1 :通常の非シームレス接続
2:通常の非シームレス接続
3:シームレス接続(ブリッジ VOB (Bridge -VOB)を介する)
4:シームレス接続 (ブリッジ VOBを介さな 、)
[0513] すなわち、 connection— conditionが 3力 4のときは、その Cellが直前セルとの間 でシームレス接続の条件を満たしていることを意味する。図 90の例では、 Cell # 1の connection— conditionが 1であるため、 Cell# 1はその直前の Cellとはシームレス 接続されないことを意味し、一方、 Cell # 2の connection— conditionは 4であるた め、 Cell # 2はその直前の Cell # 1とシームレス接続されることを意味する。
[0514] encode— condition=01b力 l ibの場合、すなわち、 VOB # 1と VOB # 2が C— SESFの場合、 BD規格においてシームレス再生される Cell # 1と Cell # 2から成る P GC # 1を DVD規格のフォーマットに変換 (TS2PS変換)する場合においても、 PGC # 1をそのまま高速に変換できることが望ましい。
[0515] このためには、シームレス接続点を含む、 TS2PS変換の対象区間が完全な SESF
Capsuleで構成されていることが必要である。つまり、少なくとも、シームレス接続点 の直後は SESF Capsuleの先頭であることが必要である。言い替えると、図 90に示 すように、シームレス接続点 Xの直後は、 Capsuleの先頭を示すパケットである Tipパ ケット 303から始まることが必要である。このように、シームレス接続点の直後におい て Capsuleの先頭で開始することにより、シームレス接続点直後力 の映像再生が可 能となる。さらに、もう 1つの条件として、シームレス接続点の直前は、完全な SESF Capsuleで終わることが必要である。
[0516] 図 91を参照し、 connection— condition= 3の時の C— SESFにおけるシームレ ス接続について説明する。
[0517] connection— condition= 3のシームレス接続では、時間的に前に再生される V OBと、その後に再生される VOBとを、ブリッジ VOB (Bridge— VOB)を介して接続 する。ここで、ブリッジ VOBとは、ブリッジ VOBの前半と後半とを、夫々シームレス接 続する先行の VOBと後続の VOB力 抜き出し、それらを連続再生可能なように再ェ ンコードして生成する VOBである。ブリッジ VOBを介したシームレス接続につ!、ては 、例えば米国特許公開第 2002— 90197号に開示がある。
[0518] 図 91において、 PGC # 1は次のような再生経路で VOB # 1と VOB # 2を再生する 。 VOB # 1 (301)の Start— SPN1から、 exit— to— Bridge— SPNまでを再生し、 その後ブリッジ VOB (304)を最初力 最後まで再生し、最後に VOB # 2 (302)の re turn— from— Bridge— SPNから END— SPN2 (タイムマップにより End— PTM2 となる位置)までを再生する。なお、 Start— SPN1、 exit— to— Bridge— SPN、 ret urn— from— Bridge— SPN、…はそれぞれ TSパケットのアドレスを示す。これらの 情報は VOBの管理情報である VOBIに記録されている。
[0519] このようにブリッジ VOBを介してシームレス接続する場合も、ブリッジ VOB内部にお いて、 VOB # 1のコンテンツが終わり且つ VOB # 2のコンテンツが始まるシームレス 境界 Xの直後は、完全な Capsuleで始まること、すなわち、 Tipパケット 303から始ま ることが要求される。また、もう 1つの条件として、シームレス接続点の直前は、完全な Capsuleで終わることが要求される。
[0520] 図 92を参照し、ブリッジ VOBを用いたシームレス接続についてさらに詳細に説明 する。以下では、 encode— condition= l ibである VOB (すなわち、 Constrained SESFに準拠した VOB)をブリッジ VOBを用いてシームレス接続し、それを DVD 規格フォーマットのデータへ変換するまでを検討する。
[0521] 図 92にお!/、て、 VOB # 1 (301)は、 Capsulel— l〜Capsulel—4の 4つの Caps uleで構成され、 VOB # 2 (302)は、 Capsule2— l〜Capsule2— 4の 4つの Capsu leで構成される。また、ブリッジ VOB304は、 Capsulel— 3,、 Capsulel—4,、 Cap sule2—l '、 Capsule2— 2'で構成される。ブリッジ VOB304の前半部分、すなわち 、 Capsulel— 3,及び Capsulel— 4,は、シームレス接続される前側の VOB301の Capsulel— 3、 1—4から生成される。ブリッジ VOB304の後半部分、すなわち、 Ca psule2- 1,及び Capsule2— 2,は、シームレス接続される後側の VOB302の Caps ule2— 1、 2— 2力ら生成される。
[0522] BD規格では、 VOBは、「ァラインドユニット(Aligned Unit)」と呼ばれる単位から 構成される。 1つのァラインドユニットは、 ATSと TSパケットを組にしたソースパケット を 32個含み、その大きさは 6KBとなる。
[0523] また、 BD規格では、ブリッジ VOBを使う場合には、前側 VOBからの抜け出し地点( exit— to— Bridge— SPN)及び後側 VOBへの飛び込み地点(return— from— Br idge— SPN)は共に、このァラインドユニットの境界でないといけないという規則があ る。
[0524] SESF Capsuleの途中力らブリッジ VOBを作るよりも、 SESF Capsule単位でブ リッジ VOBを作る方が(図 92参照)、ビデオ Zオーディオ ·データがァライメントされ、 再エンコード処理の単位が明快となる。このため、 Constrained SESFでは、ブリツ ジ VOBとの接続性の観点から、予め SESF Capsuleの境界をァラインドユニットの 境界に合わせるのが望ましい。これは、 SESF Capsuleの末部をァラインドユニット 境界まで NULLパケットで埋める等として簡単に実現できる。
[0525] このようにァラインドユニットでァライメントされた SESF Capsuleのうち、 VOB # 1 ( 301)に属する Capsulel— 3及び Capsulel—4と、 VOB # 2 (302)に属する Caps ule2— 1及び Capsule2— 2とに基づいて生成されたブリッジ VOB304は、 Capsule 1 4,と Capsule2— 1,の間に STC時間軸および ATS時間軸の不連続点を持つ。
[0526] 一連続な ATSZSTC時間軸上にある SESF Capsuleの変換は前述の通り容易 なため、映像 Z音声情報を残さず TS2PS変換することを考えれば、ブリッジ VOBの シームレス接続点の直前と直後にある Capsuleは、共に完全な SESF Capsuleで あることが必要である。例えば、図 92では、シームレス接続点の直前の Capsulel— 4'と、直後の Capsule2—1 'は、完全な SESF Capsuleであることが必要である。
[0527] さらに、ブリッジ VOBの encode condition= l lbから要求される条件によれば、 ブリッジ VOB304の最後の Capsule2— 2,は、最後の完全な SESF Capsuleとして 0. 4〜1. 2秒の再生時間を有する。し力し、 Capsule2— 2'を DVD規格のフォーマ ットに変換する際、 Capsule2— 1,、 2— 2'、 2— 3、 2— 4から変換された DVDの VO Bにおいて、変換後の Capsule2— 2'の再生時間が 1. 0秒を超えることは DVD規格 との整合性が悪ぐ再エンコードを要する。従って、ブリッジ VOB304において最後 の Capsule2— 2,(すなわち、ブリッジ VOB304の最後の TSパケットを含む Capsule )の再生時間は 0. 4秒以上、 1秒以内でなければならない。これはブリッジ VOB304 で最後の Capsuleが完全な Capsuleでな 、場合でも同様である。
[0528] また、ブリッジ VOB304の末端の最後の Capsule2— 2,が完全でな!、Capsuleで ある場合、ブリッジ VOB304内に記録された最後の Capsuleを前半とし、 return— fr om— Bridge— SPNから始まる VOB # 2 (302)に記録された Capsuleを後半とした 別ファイルに格納されるが論理的に完全な 1つの Capsuleのビデオ再生時間が 0. 4 秒以上、 1秒以内でなければならない。
[0529] また、ブリッジ VOB304の最初の Capsulel— 3, (すなわち、ブリッジ VOB304の 最初の TSパケットを含む Capsule)の再生時間も、 DVD規格との互換性をとるため に、 0. 4秒以上、 1秒以内でなければならない。
[0530] また、シームレス接続における前側の VOB # 1の最後の Capsulel— 2は、完全な Capsuleであることが必要である。これは、シームレス接続される前側の VOBを TS2 PS変換した際に、シームレス接続近辺の AV情報も欠落させることなぐ高速変換で きるようにするためである。
[0531] 完全な Capsuleが満たすべき条件を以下に示す。
1) Capsuleが Tipパケットで始まる(すなわち、 Tipパケットがあることは、 Capsuleの 始まりを意味する。)。
2) Capsuleが 1つ又は複数の GOPを含む。
3)各オーディオストリームとビデオストリームが Capsule内で完結する。各ストリー ムは Capsule内のアクセスユニットの最初のバイトから始まり、アクセスユニットの最後 のバイトで終わる。
4)し apsuie内のヒァォストリ ~~ムは、 sequence— header— codeと group— start— codeに 続く Iピクチャで始まる。
5)先行する Capsule内の最後の Multiplexing Unitから導かれた SCR値と、後 続の Capsule内の Tipパケットの PCR値との時間差力 後続の Tipパケットが同じ ST Cシーケンス内にあるときは、 43886/27M秒以上でな!、と!/、けな!/、。
(N+1番目の Capsuleを N+1番目の VOBUに変換する場合、 N番目の Capsuleから変 換された N番目の VOBUの転送終了時刻力 N+1番目の Capsuleから変換された N+1 番目の VOBUの転送開始時刻以前であることを保証するための制限である。 )
6) Tipパケットと、オーディオまたはビデオストリームを含む後続でかつ最初のパ ケットとの到着時刻の差は、 43886/27M秒以上でな!、と!/、けな!/、。
(Capsuleを VOBUに変換する場合、その VOBU先頭には、 Navi Pack(DVD-Video 時)もしくは RDI Pack(DVD-VR時)が付けられます力 この Packを入れるだけの時間的 な隙間があることを保証するための制限である。 )
7)連続した STCシーケンス内の最後の完全な Capsuleを除 、て、 Capsuleのビ デォデータの再生時間は、 0. 4秒から 1. 0秒の間である。
連続した STCシーケンス内の最後の完全な SESF Capsuleのビデオデータの再 生時間は、 encode— conditionが 01bのときは、 1. 0秒、以内であり、 encode— con ditionが l ibのときは、 0. 4秒力 1. 2秒以内である。
8) Capsule内で STCが連続でなければならな!/、。
9)トランスホ ~~トノヽケット内の adaptation— neldOの program— clock— reference— base d 3ビット長)の最上位ビットは Obでなければならな!/、。
[0532] 図 93は、 connection— condition= 3でシームレス接続され、 encode— conditio n= 01bの場合の例を示している。
[0533] 図 92の場合と同様に、ブリッジ VOB304の最後の TSパケットを含む Capsule2— 2
'の再生時間は、 DVD—VRへの高速な変換は実現するために、それが完全な Cap suleであるか否かにかかわらず 0. 4秒以上、 1秒以内でなければならない。また、ブ リッジ VOB304の最初の TSパケットを含む Capsulel— 3,の再生時間も、 DVD— V Rへの高速変換を実現するために、 0. 4秒以上、 1秒以内でなければならない。また 、シームレス接続点の直前の Capsulel—4,(STCシーケンスの最後の完全な Caps uleであるためビデオの再生時間は 1. 0秒以下)及び直後の Capsule2—1 'は、完 全な Capsuleであることが要求される。このような条件を満たせば、 C— SESFから M PEG2— PSへフォーマット変換する際に再エンコードせずに DVD規格の条件を満 たすことができる。
[0534] (シームレス接続点近傍におけるオーディオフレームの処理)
次に、 BD規格から DVD規格へのフォーマット変換 (TS2PS変換)時のシームレス 接続点近傍におけるオーディオフレームの取り扱いについて説明する。
[0535] BD規格によれば、図 94 (a)に示すように、シームレス接続点では、接続される 2つ の VOBのそれぞれ力 シームレス再生時刻 tcの再生時間を有するそれぞれのォー ディオサンプルを含むように(すなわち、オーディオギャップがないように)、ェンコ一 ドしなければならない。一方、 DVD規格では、図 94 (b)に示すように、シームレス接 続点では、シームレス再生時刻 tcを含むオーディオギャップができるようにエンコード しなければならない。
[0536] したがって、シームレス接続点を含む C— SESFを TS2PS変換する時には、図 94 ( a)に示すようなオーバーラップしているオーディオフレーム a6、 a7を肖 lj除し、図 94 (b )に示すようなギャップを作らなければならない。このとき、オーディオフレームの削除 により、シームレス接続される後半の VOB (図 94にお!/、てハッチングされた VOB)を 変換する場合には、オーディオパックの PTSをオーディオフレーム a8に合わせて修 正する必要がある。オーバーラップするオーディオフレームを削除せずに、オーバー ラップを解消するようにオーディオパックの PTSを適宜シフトしてもよ 、。
[0537] または、オーディオギャップを設ける代わりに、図 95 (b)に示すように、オーバーラッ プするオーディオフレーム a6、 a7を削除し、オーディオギャップができないように、ォ 一ディオフレーム a5と連続的に再生できるように再エンコードしたオーディオフレーム a8,を後続の VOBの先頭に配置してもよい。但し、この場合、オーディオフレーム a8 ,以後のオーディオフレームの再生時間が一様にずれるため、それらのオーディオフ レームを含むオーディオパックの PTSを全て、 (t4-t3)だけ早める処理が別途必要 となる。また、オーディオギャップを設けない場合も、オーバーラップするオーディオ フレームを削除せずに、オーバーラップを解消するようにオーディオパックの PTSを 適宜シフトしてもよい。
[0538] BD規格から DVD規格へのフォーマット変換 (TS2PS変換)時のオーディオフレー ムの取り扱いは上記のとおりであるが、逆に DVD規格から BD規格へフォーマット変換 する場合は、シームレス接続点近辺に存在するオーディオギャップをオーバーラップ に変換する必要がある。
[0539] これは、ビデオのシームレス接続時刻 (図 94の時刻 tc)にシームレス接続する VOB の音声データが夫々存在するように (例えば、図 94のオーディオフレーム a6,a7)、ォ 一ディオフレームを追加することで実現できる。追加されるオーディオフレームは無 音を与えるオーディオフレームであっても良い。
[0540] また、追加されるオーディオフレームの数は、先行の VOB及び後続の VOBのいず れに対しても最大 1フレーム以内とする。なぜならば、 DVD規格でのオーディオギヤッ プは 1フレーム以下の時間長であるため、 1フレーム追加することで、必ずシームレス 接続時刻 tcの音声データを、シームレス接続される両方の VOBが有することを保証 できる力もである。予め時刻 tcの音声データを VOBが持っていた場合には、その VOBに対しては、オーディオフレームを追加する必要はない。
[0541] (シームレス接続にぉ 、て考慮すべきタイムスタンプのオフセット)
次に、シームレス接続された VOBの TS2PS変換時にタイムスタンプの演算におい て考慮すべきオフセットについて説明する。
[0542] DVD-Video規格では、各 VOB先頭の NV_PCK (ナビパック)は、 SCRに 0を設定するこ とが強制されている。これは、各 VOBが常に MPEGの STC時間軸で値 0からデコーダ( システムターゲットデコーダ)に供給開始されるようにするためである。前方部分削除 等の編集が想定されるような記録系の規格では、このような保証はないため、ストリー ム変換時には MPEGのタイムスタンプ (SCR/PCR,PTS,DTS)に所定量のオフセットをカロ えることで変換後の VOBの最初のパックの SCRを 0から始めることができる。
[0543] 図 96を参照し、このオフセット量を求めるための演算を説明する。なお、図 96では 、 Capsulelと Capsule2を含む前側のストリーム(VOBに対応)と、 Capsule3と Caps ule4を含む後側のストリームとをシームレス接続する例を説明する。 Capsulelと Cap sule2は VOBUlと VOBU2にそれぞれ対応し、 Capsule3と Capsule4は VOBU3 と VOBU4にそれぞれ対応する。
[0544] 1つの VOB(MPEG2- TS)を、 1つの VOB (DVD- Videoの MPEG2- PS)に変換するには 、前述の SCR演算処理 (図 72)で得られた SCR値から、オフセット l (offsetl)を減じた 値を SCRとすれば良い。 PTS,DTSに関しても、一律に以前 (変換前)の PTS,DTSから offsetlを減じた値を設定すれば良い。また、 2つの V0B(MPEG2- TS)から 1つの V0B(DVD- Videoの MPEG2- PS)に変換する際に用いる、さらなるオフセット 2 (offset2 )を設定する。図 96において、オフセット 2 (offset2)は、 VOBU3を VOBU2の後に時間 的に連続させるためのオフセットである。
[0545] なお、 DVD- Video形式の MPEG2-PSに変換しな 、場合 (DVD- VRff 式の
MPEG2-PSに変換する場合)には、 VOBの先頭パックの SCRを 0とする必要性がない ため、オフセット 1 (offsetl)は別の任意の値 (例えば 0)としても良い。
[0546] 図 96に示すように、シームレス接続点前側の VOBを TS2PS変換する際には、前 述の計算式で得られる SCR値から、オフセット 1だけシフトした SCR値を使用してもよ い。一方、シームレス接続点後側の VOBを TS2PS変換する際には、前側の VOBの ビデオフレームの再生終了時刻力 後側の VOBの最初のビデオフレームの再生開 始時刻と重なるようにオフセット 2を使ってシフトした SCR値を使用してもよいし、シー ムレス接続点を挟んで 2つの VOBに変換するならば、シームレス接続点後側の VOB に対してもオフセット 1を使用しても良い。オフセット 1 (offsetl)、オフセット 2 (offset 2)は以下の式で求める。
offset l = PCRtipl
off set2 = FVFPST3 - (FVFPST2 - offsetl + VOBU2の全ビデオフレーム の再生時間)
上述のようにオフセット 1は DVD-Videoの MPEG2-PSに変換する際には必須である 力 DVD- VRの MPEG2- PSに変換する際には必須ではない。また、オフセット 2は 2つ の VOBを 1つの VOBに変換する際の後半の VOBに対しては必須であるが、変換時 に VOBを連結しな 、場合には必須ではな!/、。
[0547] 上式のオフセット 1を用いれば、シームレス接続される前側の VOBの最初の VOB U (図 96 (c)では、 VOBU1)の最初のパック(NV PCKもしくは RDI PCK)の SC Rを 0から開始することが可能となる。
[0548] また、上式のオフセット 2を用いれば、シームレス接続される後側の VOBの最初の VOBU (図 96 (c)では、 VOBU3)の最初のパック(NV_PCKもしくは RDI— PCK) の SCRを、前側の VOBの最後のパック力 連続した STC時間軸で供給できるように なり、その結果、 1つの VOBに TS2PS変換することが可能となる。
[0549] (シームレス接続される C SESFの TS2PS変換処理)
図 97力ら図 100を用いて、シームレス接続される 2つの C— SESFの VOBを TS2P S変換する際の処理にっ 、て説明する。
[0550] 図 97は、 connection— condition=4でシームレス接続された VOBの場合を、図 98〜図 100は、 connection— condition= 3でシームレス接続(ブリッジ VOBを用 いたシームレス接続)された VOBの場合を示している。いずれの場合も、シームレス 接続を行わない前述の TS2PS変換処理をベースにしており、さらに、オフセット量を 考慮してタイムスタンプを演算する処理、オーバーラップして 、るオーディオフレーム を削除する処理を含んで 、る。
[0551] 図 97を参照し、 connection— condition=4でシームレス接続される 2つの VOB の TS2PS変換処理を説明する。
[0552] まず、オーバーラップして!/、るオーディオフレームの存在を判断し、オーバーラップ がある場合、それを削除する(S301)。例えば、図 94に示すように、オーディオフレ ーム a6、 a7を削除する。この処理の詳細を以下に説明する。
[0553] オーバーラップを削除するための判定は、ストリームの変換と同時に行うの力 容易 であり、好ましい。まず、シームレス接続点 tcより前側にある VOBの音声データの再生 終了時刻 (t2)を求める。再生終了時刻 (t2)は、シームレス接続する前側の VOBの最 後のオーディオ PESパケットの PTS値 (PTSp)と、その PESパケットのペイロードの中に 格納されて 、るオーディオのデータサイズ (Lpesビット)と、それに格納されて 、るォ一 ディォの 1フレームのデータサイズ (Lfrmビット)と、その再生時間長 (90KHz単位で Dfrmクロック)とから、次のように計算される。
t2 = PTS + (Lpes/Lfrm) * Dfrm (単位は 90KHzクロック)
ここでは、簡単のため PESパケットには必ず整数個で固定ビットレートのオーディオフ レームが格納されるとして 、る。
[0554] 次に、シームレス接続点 tcより後側にある VOBの音声データの再生開始時刻 (tl)を 求める。再生開始時刻 (tl)は、後続の VOBの最初のオーディオ PESパケットの PTS値
(PTSs)である。
tl = PTSs (単位は 90KHzクロック)
以上のようにして時刻 tl, t2を求め、 t2 < tc < tlの関係が満たされれば、オーディ オギヤップが存在する、すなわち、オーバーラップがないと判断する。この場合、ォー ディオギヤップの追加の処理は不要であり、前述通りの変換処理を行えば良い。
[0555] しかしながら、上記の場合であっても、 tl -t2 > Dfrmであれば、オーディオギャップ 力 S1フレーム長以上あるため、 tl - t2く Dfrmとなるまで、オーディオフレームを追加 しても良い。
[0556] また、 t2 = tc = tlであれば、オーディオのオーバーラップもギャップもな 、ため、一 切オーディオフレームの追加 Z削除の処理は不要であり、前述通りの変換処理を行 えば良い。
[0557] 以上のいずれのケースでもなければ、シームレス接続時にオーディオのオーバーラ ップが存在すると判断し、 tl - t2く Dfrmを満たす範囲で、オーバーラップを解消す るため、オーディオフレームを変換時に取り除く。オーディオフレームを取り除くため、 PESパケットのデータサイズを示す PES_packet_lengthや、最初のオーディオフレーム の PTSを表す PTSフィールドの値を正しい値に設定しなおす例外処理が必要となる。
[0558] 尚、上記説明では、オーディオフレームを削除する例を説明した力 オーディオの オーバーラップを解消できれば他の処理でもよい。例えば、オーバーラップを解消す るために、後続の VOBのオーディオの PTS値を全て、(t2 - tl)以上かつ(t2 - tl + Dfrm)未満だけ、時間的後方にシフトする方法が考えられる。
[0559] 図 97に戻り、オーディオフレームのオーバーラップを解消後、シームレス接続され る 2つの VOBを、変換後に別々の VOBとして生成する力、 1つの VOBに連結するか を判断する(S302)。 YESの場合、シームレス接続点の前の VOBと、シームレス接 続点の後の VOBとがそれぞれ MPEG— PSに変換され、最終的に 2つの VOBが生 成される。 NOの場合、シームレス接続点の前の VOBと、シームレス接続点の後の V OBが MPEG— PSに変換され、連結され、最終的に 1つの VOBが生成される。
[0560] 変換後に 2つの VOBに分ける場合(S302で YES)、 DVD— Video規格または DV D— Video Recording規格のいずれに変換するか判断する(S303)。 DVD— Vid eo規格に変換する場合 (S303で YES)、前述の方法でオフセット 1を導出し、そのォ フセット 1でタイムスタンプを補正しながら TS2PS変換を行う(S304)。 DVD— Vide o Recording規格に変換する場合(S303で NO)、タイムスタンプの補正は行わず に TS2PS変換を行う(S307)。
[0561] 2つの VOBにつ!/、て TS2PS変換が終了すると(S305で YES)、変換後の 2つの V OBを、それらがシームレス接続されるように管理情報 (PGC)に登録する(S306)。 例えば、シームレス接続される後側の VOBの VOBIの接続条件(connection— cod e)をシームレス接続である 4に設定する。
[0562] 一方、ステップ S302において、変換後に 2つの VOBに分けない場合(S302で NO )、オフセット 1、 2を導出し、そのオフセット 1、 2でタイムスタンプを補正しながら TS2P S変換を行う(S309)。 2つの VOBについて TS2PS変換が終了すると(S310で YE S)、変換後の 2つの VOBを連結し、 1つの VOBとして管理情報 (PGC)に登録する( S311)。
[0563] その後、変換後の VOBを管理情報とともに、連続再生可能となるように情報記録媒 体の連続領域 (CDA)に記録し (S308)、処理を終了する。
[0564] 図 98〜図 100を参照し、 connection— condition = 3でシームレス接続(ブリッジ
VOBを介してシームレス接続)される 2つの VOBの TS2PS変換処理を説明する。
[0565] まず、オーバーラップして!/、るオーディオフレームの存在を判断し、オーバーラップ がある場合、それを削除する(S321)。次に、シームレス接続される 2つの VOBを、 変換後に別々の VOBとして生成する力、 1つの VOBに連結するかを判断する(S32
2)。
[0566] 最終的に 2つの VOBに分ける場合(S322で YES)、 DVD—Video規格または DV D— Video Recording規格のいずれに変換するか判断する(S323)。 DVD— Vid eo規格に変換する場合 (S323で YES)、オフセット 1を導出し、そのオフセット 1でタ ィムスタンプを補正しつつ、ブリッジ VOBを経由しながら TS2PS変換を行う(S324) 。 DVD— Video Recording規格に変換する場合(S323で NO)、タイムスタンプの 補正は行わずにブリッジ VOBを経由しながら TS2PS変換を行う(S327)。 2つの VO Bについて TS2PS変換が終了すると(S325で YES)、変換後の 2つの VOBを、それ らがシームレス接続されるように管理情報 (PGC)に登録する(S326)。変換後の VO Bを管理情報とともに、連続再生可能となるように情報記録媒体の連続領域 (CDA) に記録し (S328)、処理を終了する。
[0567] 一方、ステップ S322にお!/、て NOの場合、シームレス接続される 2つの VOBと、ブ リッジ VOBとを含む 3つの VOBを、変換後にそれぞれ別々に生成するカゝ、または、 連結して 1つの VOBとして生成するかを判断する(S329)。 3つの VOBを変換後に それぞれ別々に生成する場合 (S329で YES)、図 99に示す処理に移行する。 3つ の VOBを変換後に連結する場合(S329で NO)、図 100に示す処理に移行する。
[0568] 図 99の処理を説明する。まず、 DVD— Video規格または DVD— Video Recordi ng規格の 、ずれに変換するか判断する(S331)。
[0569] DVD—Video規格に変換する場合(S331で YES)、変換対象の VOBがブリッジ VOBでなければ(S332で NO)、オフセット 1を導出し、そのオフセット 1でタイムスタ ンプを補正しながら、その VOBの TS2PS変換を行う(S334)。変換対象の VOBが ブリッジ VOBであれば(S332で YES)、そのオフセット 1、 2を導出し、オフセット 1、 2 でタイムスタンプを補正しながら、ブリッジ VOB全体の TS2PS変換を行う(S333)。
[0570] 一方、 DVD— Video Recording規格に変換する場合(S331で NO)、変換対象 の VOBがブリッジ VOBでなければ(S337で NO)、その VOBの TS2PS変換を行い (S339)、変換対象の VOBがブリッジ VOBであれば(S337で YES)、オフセット 1、 2を導出し、そのオフセット 1、 2でタイムスタンプを補正しながら、ブリッジ VOB全体の TS2PS変換を行う(S338)。
[0571] 3つの VOBにつ!/、て TS2PS変換が終了すると(S335、 S340で YES)、変換後の 3つの VOBを、それらがシームレス接続されるように管理情報 (PGC)に登録する(S 336) o
尚、当然ながら 3つの VOBに変換する場合には、予め 3つの VOBの変換対象とな る区間が何れも Capsule単位でァライメントされている必要がある。そうでない場合に は、 S329で YESは選択できず、 NOに処理が流れる。
[0572] 図 100の処理を説明する。まず、 DVD— Video規格または DVD— Video Recor ding規格の 、ずれに変換する力判断する(S351)。
[0573] DVD—Video規格に変換する場合(S351で YES)、変換対象の VOBがブリッジ VOBでなければ(S352で NO)、オフセット 1を導出し、そのオフセット 1でタイムスタ ンプを補正しながら、その VOBの TS2PS変換を行う(S354)。変換対象の VOBが ブリッジ VOBであれば(S352で YES)、オフセット 1、 2を導出し、そのオフセット 1、 2 でタイムスタンプを補正しながら、ブリッジ VOB全体の TS2PS変換を行う(S353)。
[0574] 一方、 DVD— Video Recording規格に変換する場合(S351で NO)、変換対象 の VOBがブリッジ VOBでなければ(S358で NO)、その VOBの TS2PS変換を行い (S360)、変換対象の VOBがブリッジ VOBであれば(S358で YES)、オフセット 1、 2を導出し、そのオフセット 1、 2でタイムスタンプを補正しながら、ブリッジ VOB全体の TS2PS変換を行う(S359)。
[0575] 3つの VOBについて TS2PS変換が終了すると(S355、 S361で YES)、変換後の 3つの VOBを 1つの VOBに連結する(S356)。最後に、管理情報(PGC)に変換後 の 1つの VOBを登録する(S357)。
上記説明においては、簡単のためフローに記載していないが、変換した 3つの VOB 力 Si本の VOBに連結されるため、 S351で YESの場合には、連結された 1つの VOB 力 CR=0から始まる連続したタイムスタンプを持つようにオフセット 2と同様の手法 にてタイムスタンプにオフセットをカ卩味することが別途必要となる。また同様に S351 の NOの場合にも、連結された 1つの VOBが連続したタイムスタンプを持つようにオフ セット 2と同様の手法にてタイムスタンプにオフセットをカ卩味することが別途必要となる
[0576] 以上のような方法でシームレス接続を含むシステムストリームの TS2PS変換が実行 できる。
[0577] また、図 97から図 100までの変換処理は、図 20のユーザ iZF部 222にてユーザに より変換区間が特定され、その変換区間の情報を用いてシステム制御部 212によりド ライブ 221が制御されて記録媒体 100上のストリームに対して実行される。 [0578] また、シームレス接続時に再エンコードを行う処理も、変換処理の場合と同様に、図 20のユーザ IZF部 222にてシームレス接続させる 2つの VOBが特定され、システム 制御部 212によりドライブ 221が制御されて記録媒体 100上のストリームに対して実 行される。
[0579] 以上のようにしてシームレス接続する Constrained SESFの規定を定め、その変 換方法にっ 、て規定することで、 TS2PS変換がシームレス接続時でも容易にかつ 高速に実行可能となる。
[0580] 以上に示した情報記録装置 Z方法では、外部入力された AVデータを MPEGトラ ンスポートストリーム形式にセルフエンコーディングする際に、デコーダ互換を保ちな 力 効率良く符号ィ匕 Z復号ィ匕処理を行うことが可能である。
[0581] また、情報記録媒体に記録されるストリームには、ユーザプライベート情報を格納す ることができるため、 MPEGトランスポートストリーム形式の記録コンテンツの付加価 値を高めることが可能である。
[0582] さらに、情報記録媒体に記録される MPEG— TSは、 MPEG— PSへの親和性が 高くなるように 2KB以下のブロック単位で多重化処理がなされるため、シームレス接 続点を含めて MPEG—TSを MPEG - PSに変換することが、バッファマネージメント を考慮することなく極めて容易に実現することができる。
[0583] 尚、上記説明において MPEG— PSから MPEG— TSへの逆変換については、説 明していないが、 TS2PS変換の逆として同様に考えることができる。例えば、 1個の P
Sパックを複数個の連続した TSパケットに変換し、その際に生成される複数個の連続 した TSパケットの ATSの増分を固定として、ディスク上もしくはストリームの内部にそ の情報を格納する方法が考えられる。
[0584] また、 MPEG— PSのクリップの名称(コンテンツ内容を示す番組情報等)を SITパ ケット内に格納して MPEG—TSへ変換すると、 STB等のデコーダで、元の番組名を メニュー表示すること等が可能となる。
[0585] 本発明は、特定の実施形態について説明されてきたが、当業者にとっては他の多 くの変形例、修正、他の利用が明らかである。それゆえ、本発明は、ここでの特定の 開示に限定されず、添付の請求の範囲によってのみ限定され得る。なお、本出願は 日本国特許出願、特願 2004— 112962号(2004年 4月 7日提出)に関連し、それら の内容は参照することにより本文中に組み入れられる。
産業上の利用可能性
本発明は、第 1のストリーム力も第 2のストリームへのフォーマット変換を容易にかつ 高速に実現可能とし、特に、シームレス接続されたストリームに対しても、シームレス 再生機能を維持したままフォーマット変換を可能とする。よって、本発明は、第 1のスト リーム(例えば、 MPEGトランスポートストリーム)から第 2のストリーム(例えば、 MPE Gプログラムストリーム)へのフォーマット変換機能を具備する情報記録装置に適用で きる。

Claims

請求の範囲
[1] システムストリームにエンコードされた映像情報と音声情報を、その管理情報と共に 記録した情報記録媒体であって、
前記システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS)とが許 され、前記第 1のフォーマット (TS)は、データをパケットで分割して格納するパケット 構造を有し、前記第 2のフォーマット (PS)は、データをパックで分割して格納するパッ ク構造を有し、
前記第 1のフォーマット(TS)には、第 1のフォーマット(TS)力 第 2のフォーマット( PS)へシステムストリームを変換するための制限フォーマットが許され、
該制限フォーマットによれば、所定数の前記パケットがグループ化されて、前記第 2 のフォーマットのパックに対応する多重化ユニットとして管理され、さらに、前記多重 化ユニットを複数含むデータ管理単位 (Capsule)でシステムストリームが管理され、 前記管理情報はシステムストリームの再生順序を示す再生順序情報 (PGC)を含み 該再生順序情報は、 1つもしくは複数の、 1連続なシステムストリームに対応する再 生区間(cell)の組み合わせで記述されており、
前記管理情報はさらに、各再生区間に対し、 1つ前の再生順序の再生区間力 シ ームレス再生するか否かを示す接続情報 (connection_code)を含み、
前記制限フォーマットにより、再生区間の接続情報がシームレス再生することを示 す場合、シームレス接続点の直後においてシステムストリームは前記データ管理単位 (Capsule)の先頭から始まるように該システムストリームが記録される
ことを特徴とする情報記録媒体。
[2] シームレス接続点の直後において前記システムストリームは Tipパケットで始まること を特徴とする請求項 1記載の情報記録媒体。
[3] 映像情報と音声情報とをシステムストリームにエンコードして、その管理情報と共に 情報記録媒体に記録する情報記録装置であって、
前記システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS)とが許 され、前記第 1のフォーマット (TS)は、データをパケットで分割して格納するパケット 構造を有し、前記第 2のフォーマット (PS)は、データをパックで分割して格納するパッ ク構造を有し、
前記第 1のフォーマット(TS)には、第 1のフォーマット(TS)力 第 2のフォーマット( PS)へシステムストリームを変換するための制限フォーマットが許され、
該制限フォーマットによれば、所定数の前記パケットがグループ化されて、前記第 2 のフォーマットのパックに対応する多重化ユニットとして管理され、さらに、前記多重 化ユニットを複数含むデータ管理単位 (Capsule)でシステムストリームが管理され、 前記管理情報はシステムストリームの再生順序を示す再生順序情報 (PGC)を含み 該再生順序情報は、 1つもしくは複数の、 1連続なシステムストリームに対応する再 生区間(cell)の組み合わせで記述されており、
前記管理情報はさらに、各再生区間に対し、 1つ前の再生順序の再生区間力 シ ームレス再生するか否かを示す接続情報 (connection_code)を含み、
前記情報記録装置は、
前記第 1のフォーマット (TS)に基づき、前記映像情報と前記音声情報に所定のェ ンコード処理を施しビデオエレメンタリストリームとオーディオエレメンタリストリームとを 生成する第 1のエンコード手段と、
前記第 1のフォーマット (TS)に基づき、前記ビデオエレメンタリストリームと前記ォ 一ディォエレメンタリストリームとをマルチプレタスし前記システムストリームを生成する システムエンコードを行なう第 2のエンコード手段と、
前記第 1及び第 2のエンコード手段を制御する制御手段とを備え、
前記制御手段は、 1つの再生区間の接続情報がシームレス再生することを示す場 合、シームレス接続点の直後におけるシステムストリームが前記データ管理単位 (Capsule)の先頭力も始まるように、前記第 1及び第 2のエンコード手段を制御する ことを特徴とする情報記録装置。
[4] シームレス接続点の直後において前記システムストリームは Tipパケットで始まること を特徴とする請求項 3記載の情報記録装置。
[5] システムストリームにエンコードされた映像情報と音声情報を、その管理情報と共に 情報記録媒体に記録する方法であって、
前記システムストリームには第 1のフォーマット(TS)と第 2のフォーマット(PS)とが許 され、前記第 1のフォーマット (TS)は、データをパケットで分割して格納するパケット 構造を有し、前記第 2のフォーマット (PS)は、データをパックで分割して格納するパッ ク構造を有し、
前記第 1のフォーマット(TS)には、第 1のフォーマット(TS)力 第 2のフォーマット( PS)へシステムストリームを変換するための制限フォーマットが許され、
該制限フォーマットによれば、所定数の前記パケットがグループ化されて、前記第 2 のフォーマットのパックに対応する多重化ユニットとして管理され、さらに、前記多重 化ユニットを複数含むデータ管理単位 (Capsule)でシステムストリームが管理され、 前記管理情報はシステムストリームの再生順序を示す再生順序情報 (PGCI)を含み 該再生順序情報は、 1つもしくは複数の、 1連続なシステムストリームに対応する再 生区間(cell)の組み合わせで記述されており、
前記管理情報はさらに、各再生区間に対し、 1つ前の再生順序の再生区間力 シ ームレス再生するか否かを示す接続情報 (connection_code)を含み、
前記情報記録方法は、
前記第 1のフォーマット (TS)に基づき、前記映像情報と前記音声情報に所定のェ ンコード処理を施して、ビデオエレメンタリストリームとオーディオエレメンタリストリーム とを生成し、
前記第 1のフォーマット (TS)に基づき、前記ビデオエレメンタリストリームと前記ォー ディォエレメンタリストリームとをマルチプレタスして、前記システムストリームを生成し 前記エンコード処理において、 1つの再生区間の接続情報がシームレス再生するこ とを示す場合、シームレス接続点の直後におけるシステムストリームは、前記データ 管理単位 (Capsule)の先頭力も始まるようエンコードされる
ことを特徴とする情報記録方法。
シームレス接続点の直後において前記システムストリームは Tipパケットで始まること を特徴とする請求項 5記載の情報記録方法。
PCT/JP2005/006658 2004-04-07 2005-04-05 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法 WO2005099259A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US11/547,649 US8055122B2 (en) 2004-04-07 2005-04-05 Information recording medium wherein stream convertible at high-speed is recorded, and recording apparatus and recording method therefor
JP2006512084A JP4177408B2 (ja) 2004-04-07 2005-04-05 情報記録装置及び情報記録方法
EP05728417A EP1737227A4 (en) 2004-04-07 2005-04-05 INFORMATION RECORDING MEDIUM HAVING HIGH SPEED CONVERTIBLE FLOW RECORDED, RECORDING APPARATUS, AND RECORDING METHOD
KR1020067022038A KR101097542B1 (ko) 2004-04-07 2006-10-24 고속 변환 가능한 스트림을 기록한 정보기록매체, 및 그기록장치 및 기록방법

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004112962 2004-04-07
JP2004-112962 2004-04-07

Publications (1)

Publication Number Publication Date
WO2005099259A1 true WO2005099259A1 (ja) 2005-10-20

Family

ID=35125460

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/006658 WO2005099259A1 (ja) 2004-04-07 2005-04-05 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法

Country Status (6)

Country Link
US (1) US8055122B2 (ja)
EP (1) EP1737227A4 (ja)
JP (4) JP4177408B2 (ja)
KR (1) KR101097542B1 (ja)
CN (3) CN101707704B (ja)
WO (1) WO2005099259A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8000585B2 (en) * 2004-04-07 2011-08-16 Panasonic Corporation Information recording medium wherein stream convertible at high-speed is recorded, and recording apparatus and recording method therefor
WO2017019674A1 (en) 2015-07-28 2017-02-02 Dolby Laboratories Licensing Corporation Audio discontinuity detection and correction
JP6744262B2 (ja) * 2017-08-22 2020-08-19 株式会社東芝 電子装置及び方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160945A (ja) * 1999-09-20 2001-06-12 Matsushita Electric Ind Co Ltd シームレス再生に適した光ディスク記録装置、再生装置及び記録方法
JP2002230948A (ja) * 2000-11-29 2002-08-16 Matsushita Electric Ind Co Ltd 光ディスク、記録装置、再生装置、プログラム、コンピュータ読み取り可能な記録媒体及び方法。
JP2003228922A (ja) * 2001-07-23 2003-08-15 Matsushita Electric Ind Co Ltd 情報記録媒体、情報記録媒体に情報を記録する装置及び方法

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649171A (en) 1991-04-12 1997-07-15 Accom, Inc. On-line video editing system
CN1118049C (zh) * 1995-08-21 2003-08-13 松下电器产业株式会社 根据交互控制实现意外性场景展开的多媒体光盘再生装置
TW436777B (en) 1995-09-29 2001-05-28 Matsushita Electric Ind Co Ltd A method and an apparatus for reproducing bitstream having non-sequential system clock data seamlessly therebetween
CN1295702C (zh) 1997-09-17 2007-01-17 松下电器产业株式会社 一种再现方法和一种记录方法
JPH1196730A (ja) 1997-09-17 1999-04-09 Matsushita Electric Ind Co Ltd 光ディスク及びその編集装置、再生装置
JP3383587B2 (ja) 1998-07-07 2003-03-04 株式会社東芝 静止画像連続情報記録方法と光ディスクと光ディスクの情報再生装置と情報再生方法
KR100583358B1 (ko) * 1998-11-16 2006-05-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 실시간 정보를 기록하는 방법 및 장치
JP4487374B2 (ja) 1999-06-01 2010-06-23 ソニー株式会社 符号化装置及び符号化方法並びに多重化装置及び多重化方法
JP3162044B2 (ja) 1999-07-09 2001-04-25 松下電器産業株式会社 光ディスク、その記録装置、再生装置、記録方法および再生方法
US6782193B1 (en) 1999-09-20 2004-08-24 Matsushita Electric Industrial Co., Ltd. Optical disc recording apparatus, optical disc reproduction apparatus, and optical disc recording method that are all suitable for seamless reproduction
GB9930788D0 (en) * 1999-12-30 2000-02-16 Koninkl Philips Electronics Nv Method and apparatus for converting data streams
GB0007868D0 (en) 2000-03-31 2000-05-17 Koninkl Philips Electronics Nv Methods and apparatus for editing digital video recordings and recordings made by such methods
JP4599740B2 (ja) * 2000-04-21 2010-12-15 ソニー株式会社 情報処理装置および方法、記録媒体、プログラム、並びに記録媒体
US7187842B2 (en) 2000-11-29 2007-03-06 Matsushita Electric Industrial Co., Ltd. Optical disc, recording apparatus, playback apparatus, program, computer-readable recording medium, recording method and playback method
JP2002218398A (ja) 2001-01-16 2002-08-02 Matsushita Electric Ind Co Ltd 記録媒体
JP4802370B2 (ja) 2001-01-30 2011-10-26 ソニー株式会社 通信制御装置および方法、記録媒体、並びにプログラム
JP2003009086A (ja) * 2001-06-22 2003-01-10 Matsushita Electric Ind Co Ltd 映像記録装置及び記録方法
EP1422710B1 (en) 2001-07-23 2013-10-23 Panasonic Corporation Apparatus and method for recording information on information recording medium
MXPA03010390A (es) 2001-11-30 2005-03-07 Matsushita Electric Ind Co Ltd Un metodo y aparato para la conversacion de corriente, un metodo y aparato para el registro de datos y un medio de registro de datos.
CA2439048C (en) 2001-11-30 2011-10-04 Matsushita Electric Industrial Co., Ltd. A method and an apparatus for stream conversion, a method and an apparatus for data recording, and data recording medium
US7369745B2 (en) 2002-04-10 2008-05-06 Sony Corporation Data recording device and method, program storage medium, and program
JP4312151B2 (ja) 2002-06-28 2009-08-12 エルジー エレクトロニクス インコーポレーテッド 多重経路データの記録及び再生を管理するためのデータ構造を有する記録媒体と、それによって記録し、再生する方法及び装置
JP3900050B2 (ja) 2002-09-13 2007-04-04 株式会社日立製作所 データ処理装置、ビデオカメラ及びデータ処理方法
JP4105206B2 (ja) 2004-04-07 2008-06-25 松下電器産業株式会社 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法
CN101577803B (zh) 2004-04-07 2011-04-13 松下电器产业株式会社 信息记录装置和信息记录方法
US8165447B2 (en) 2004-04-07 2012-04-24 Panasonic Corporation Information recording apparatus and information converting method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160945A (ja) * 1999-09-20 2001-06-12 Matsushita Electric Ind Co Ltd シームレス再生に適した光ディスク記録装置、再生装置及び記録方法
JP2002230948A (ja) * 2000-11-29 2002-08-16 Matsushita Electric Ind Co Ltd 光ディスク、記録装置、再生装置、プログラム、コンピュータ読み取り可能な記録媒体及び方法。
JP2003228922A (ja) * 2001-07-23 2003-08-15 Matsushita Electric Ind Co Ltd 情報記録媒体、情報記録媒体に情報を記録する装置及び方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1737227A4 *

Also Published As

Publication number Publication date
US20070248329A1 (en) 2007-10-25
JP2008172804A (ja) 2008-07-24
JP2008172805A (ja) 2008-07-24
JP4177442B2 (ja) 2008-11-05
EP1737227A1 (en) 2006-12-27
CN1961576A (zh) 2007-05-09
US8055122B2 (en) 2011-11-08
KR101097542B1 (ko) 2011-12-22
JP4648411B2 (ja) 2011-03-09
JPWO2005099259A1 (ja) 2007-08-16
JP4177441B2 (ja) 2008-11-05
JP4177408B2 (ja) 2008-11-05
KR20070007352A (ko) 2007-01-15
JP2008172803A (ja) 2008-07-24
CN101707704A (zh) 2010-05-12
CN101707705B (zh) 2012-11-07
CN101707705A (zh) 2010-05-12
EP1737227A4 (en) 2008-07-02
CN100571361C (zh) 2009-12-16
CN101707704B (zh) 2012-04-04

Similar Documents

Publication Publication Date Title
JP4180104B2 (ja) 情報記録装置及び情報記録方法
JP4105224B1 (ja) 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法
JP4586073B2 (ja) 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法
WO2003010766A9 (en) Information recording medium, and apparatus and method for recording information on information recording medium
JP4105223B1 (ja) 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法
JP4177441B2 (ja) 情報記録装置及び情報記録方法
WO2006064838A1 (ja) 高速変換可能なストリームを記録した情報記録媒体並びにその記録装置及び記録方法

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2006512084

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 2005728417

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 200580010718.8

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

WWW Wipo information: withdrawn in national office

Country of ref document: DE

WWE Wipo information: entry into national phase

Ref document number: 1020067022038

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 2005728417

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 1020067022038

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 11547649

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 11547649

Country of ref document: US