WO2004030358A1 - Data processing device - Google Patents

Data processing device Download PDF

Info

Publication number
WO2004030358A1
WO2004030358A1 PCT/JP2003/012449 JP0312449W WO2004030358A1 WO 2004030358 A1 WO2004030358 A1 WO 2004030358A1 JP 0312449 W JP0312449 W JP 0312449W WO 2004030358 A1 WO2004030358 A1 WO 2004030358A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
stream
information
control
video
Prior art date
Application number
PCT/JP2003/012449
Other languages
French (fr)
Japanese (ja)
Inventor
Masanori Ito
Hiroshi Yahata
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to AU2003266691A priority Critical patent/AU2003266691A1/en
Priority to JP2004539573A priority patent/JP4566745B2/en
Publication of WO2004030358A1 publication Critical patent/WO2004030358A1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion

Definitions

  • the present invention provides a method for storing a moving image stream on a recording medium such as an optical disk.
  • the present invention relates to a data processing apparatus and method for recording data in real time.
  • Various data streams have been standardized that compress and encode video (video) and audio (audio) signals at low bit rates.
  • a system stream of the MPEG2 system standard (IS0 / IEC 13818-1) is known.
  • the system stream includes three types: a program stream (PS), a transport stream (TS), and a PES stream.
  • PS program stream
  • TS transport stream
  • PES PES stream
  • FIG. 1 shows a configuration of a functional block of a conventional data processing device 90.
  • the data processing device 90 records a data stream in real time on a phase change optical disk 131, such as a DVD-RAM disk or a Blu-ray disk (BD), and reproduces the recorded data stream.
  • a phase change optical disk 131 such as a DVD-RAM disk or a Blu-ray disk (BD)
  • BD Blu-ray disk
  • the data recording process of the data processing device 90 is performed as follows. First, a video signal input to the video signal input unit 100 is compression-encoded by the video compression unit 101. At the same time, the audio signal input to the audio signal input unit 102 is compression-encoded by the audio compression unit 103.
  • the program stream assembling section 244 multiplexes them to generate an MPEG2 program stream (hereinafter, referred to as “program stream” or “PS”). These processes are performed in the MPEG2PS encoder 170.
  • the recording unit 120 and the pickup 130 write the generated PS on the optical disk 1331. At this time, physically continuous free areas on the optical disc 13 1 are detected based on the processing of the recording control section 16 1, the continuous data area detection section 16 0, the logical block management section 16 3, etc. , PS is recorded.
  • the reproduction process of the data stream is performed as follows.
  • the program stream decomposing unit 114 separates the program stream reproduced via the pickup 130 and the reproducing unit 121 into a video signal and an audio signal.
  • the video decompression unit 1 1 1 and the audio decompression unit 1 1 3 decode video and audio signals, respectively, and display the resulting video and audio data on video. Displayed and output by the unit 110 and the audio output unit 112.
  • FIG. 2 shows an example of the data structure of the program stream 20.
  • the program stream 20 includes a plurality of video object units (VOBUs) 21.
  • the VOBU 21 includes a plurality of video packs (V-P CK) 22 storing video data and a plurality of audio packs (A-P CK) storing audio data. These are 0.4 seconds to 1 second worth of video playback time.
  • the video pack 22 includes a pack header 22a, a packet header 22b, and compressed video data 22c.
  • the audio pack includes audio data instead of the video data 22 c of the video pack 22.
  • the data size of one VOBU fluctuates within the range of the maximum recording / reproduction rate if the video data has a variable bit rate. If the video data has a fixed bit rate, the VOBU data size is almost constant.
  • a “pack” is known as one exemplary form of a packet.
  • FIG. 3 shows the relationship between the program stream 20 and the recording area of the optical disc 13 1.
  • the VOBU of the program stream 20 is recorded in the continuous data area 24 of the optical disk 1331.
  • the continuous data area 24 is composed of physically continuous logical blocks. In this area, data having a maximum rate of 17 seconds or more is recorded.
  • the data processing device 90 assigns an error correction code to each logical block.
  • the data size of the logical block is 32 kbytes. each A logical block contains 16 2 Kbyte sectors.
  • FIG. 4 shows a state where the recorded data is managed in the file system of the optical disk 13 1.
  • UDF Universal Disk Format
  • IS OZ I E C 1 3 346 Volume and file structure of write once and rewritable media using non-sequent i al recording for
  • a file system is used.
  • a continuously recorded program stream is recorded as a file name VR—MOV I E.V RO.
  • the first sector number is set as the position of the file entry that constitutes the file.
  • the file entry includes allocation descriptors a to c for managing each of the continuous data areas (CDA: Contiguous Data Area) a to c.
  • CDA Contiguous Data Area
  • the reason that one file is divided into a plurality of areas a to c is that a bad logical block, a non-writable PC file, etc. existed in the area a.
  • the UDF standard is equivalent to a subset of the IS0 / IEC 13346 standard. Also, by connecting the optical disk drive (data processing device 90) to a PC or the like via the 1394 interface and SBP (Serial Bus Protocol) -2, the recorded file can be converted from the PC to a single file. Can handle.
  • optical disk drive data processing device 90
  • SBP Serial Bus Protocol
  • FIG. 5 shows an example of a data structure of a program stream 25 conforming to the DVD-VR standard.
  • the difference between program stream 25 and program stream 20 is that each VO of program stream 25
  • An RDI pack (RDI-PCK) 27 is always added at the beginning of BU26.
  • 101 Pack 27 includes control information for controlling playback of PS, pack header 27a, system header 27b, PES header 27c, RDI data 27d, and manufacturer extension Field 27 e is included. Manufacturer-specific information (manufacturer extension information) can be described in the manufacturer extension field 27 e.
  • the data processing unit 90 records and reproduces the program streams 20 and 25, and also transmits the data stream from the IEEE1394 interface unit 140 to the D-VHS, set-top box (STB), etc. Can be output.
  • the IE EE1394 interface standard specifies only the MPEG2 transport stream (hereinafter referred to as “transport stream” or “TS”) as a video synchronous communication protocol, data
  • the processing unit 90 needs to convert PS into TS.
  • FIG. 6 shows an example of the data structure of the transport stream 28.
  • the TS 28 includes a plurality of TS OBject Units (TOBU) 29, and the TOBU 29 is composed of one or more transport packets (TS packets).
  • TS packets are, for example, video TS packets (V—TSP) 30 containing compressed video data, audio TS buckets (A_TSP) 31 containing compressed audio data, and the program 'association'.
  • Packet (PAT TSP) containing a table (PAT) 32, Program, A packet containing a map table (PMT) (PMT—TSP) 33 and a packet containing a program clock reference (PCR) (PCR—TSP) 34.
  • PMT map table
  • PCR—TSP program clock reference
  • FIGS. 7 (a) to 7 (e) show examples of the data structure of each TS packet.
  • a different packet identifier PID
  • the procedure for obtaining V—TSP 30 and A—TSP31 is as follows. First, PAT—TSP32 with PID of “0X0000” is obtained. PAT32c in PAT-TSP32 describes the PID of PMT-TSP.
  • PID (“0x0303”) of PMT_TS S33 is acquired.
  • ⁇ ⁇ PMT 33 C in TSP 33 includes V— TSP 30 PID (“0x0 0 2 0”) and A—TSP 31 PID (“0 x 0 0 2 1”). Is described. By obtaining the packets to which those PIDs are assigned, V_TSP30 and A-TSP31 are obtained.
  • the transport stream is transmitted with B while maintaining the packet structure.
  • FIG. 8A shows a video TS packet (V-TSPT) 37 and an audio TS packet (A-TSPT) 38 stored in an object unit (TTOBU) 36.
  • FIGS. 8B and 8C show the data structures of the video TS bucket 37 and the audio TS bucket 38, respectively.
  • the first four bytes are timestamps 37a and 38a, and the next 188 bytes are each received TS bucket.
  • the PS ⁇ PES converter 243 When the program stream is converted into a transport stream in the data processing device 90, the PS ⁇ PES converter 243 first converts the PS into a packetized elementary stream (PES), and then converts the PES ⁇ TS. Unit 242 converts PES to TS.
  • PES packetized elementary stream
  • FIGS. 9 (a) to 9 (c) show the stream correspondences when stream conversion of PS 39 to general TS 41 via PES 40 is performed.
  • Each PES packet of the PES 40 stores one frame of data. Further, even in the general TS 41, one frame of data is stored in one PES bucket. For simplicity of explanation, the figure shows only the processing for video data.
  • the PS 39 is a stream conforming to, for example, the DVD-VR standard.
  • Video data portions 39a to 39c are extracted. These are grouped in one frame unit of the video to constitute the pay mouth 40b of the video PES packet shown in FIG. 9 (b). When the PES header 40a is added to the payload 40b, one video PES packet of the PES 40 is obtained.
  • the video TS packet of TS 41 in FIG. 9C is configured by, for example, adding a 4-byte TS header 41 a to data 41 b obtained by dividing PES 40 in units of 184 bytes. Is done.
  • a TS packet (not shown) including a PAT, a PMT, and the like is newly generated and inserted into the TS 41.
  • the conventional device has a problem that it takes a very long time to convert a program stream into a transport stream.
  • time information program clock reference; PCR
  • T-STD coder model
  • PCR program clock reference
  • the second reason is that when one frame of data is stored in the PES packet payload of the transport stream, when converting from PS to PES, each pack of PS is scanned and the boundary for each frame is scanned. Must be searched. For example, when converting a program stream conforming to the DVD-VR standard to a general transport stream in which one frame of data is stored in one PES packet, all audio and Z video streams are scanned. It is necessary to detect the start position and the data size of each audio / video frame, and add a PES bucket header to the start position of each frame to make a PES bucket. Further, when forming a PES packet, it is necessary to add PTS and DTS which are not always added to all audio Z video frames to the PES packet header of all audio Z video frames.
  • the present invention has been made in view of the above problems, and has as its object to provide a program stream having a data structure that can be easily converted to a transport stream. Disclosure of the invention
  • a data processing apparatus includes: a signal input unit to which at least one of a video signal and an audio signal including a plurality of frames is input; When, The encoded data is divided to generate one or more packets having a certain data size, and a control packet storing control information for controlling reproduction of the encoded data is added to generate a data stream. And a stream assembly part.
  • the stream assembling unit generates position information indicating a storage position in the data stream for each frame, and describes the position information in the control bucket as the control information.
  • the stream assembling unit further generates time information indicating a display timing of each frame, and describes the time information as the control information in the control bucket.
  • the stream assembling unit further generates time information indicating the timing of decoding of each frame, and describes the time information in the control packet as the control information.
  • the stream assembling unit further generates size information indicating a data size of each frame, and describes the size information in the control packet as the control information.
  • the stream assembler describes the control information in a field in the control bucket in which arbitrary information can be described.
  • the stream assembler generates a control pack as the control bucket, and adds the control pack to generate a program stream as the data stream.
  • the data processing method includes the steps of: inputting at least one of video and audio signals including a plurality of frames; Compressing and encoding the signal to generate encoded data; dividing the encoded data to generate one or more packets having a fixed data size; The method includes a step of adding a control packet storing control information for controlling the reproduction of the encoded data to generate a data stream.
  • the step of generating a data stream includes generating, for each frame, position information indicating a storage position in the data stream, and describing the position information in the control bucket as the control information. .
  • the step of generating the data stream further includes a step of generating time information indicating a display timing of each frame and describing the time information as the control information in the control packet.
  • the step of generating the data stream further includes a step of generating time information indicating the timing of decoding each frame, and describing the control information as the control information in the control bucket. Include.
  • the step of generating the data stream further includes a step of generating size information indicating a data size of each frame and describing the size information as the control information in the control packet.
  • the step of generating the data stream describes the control information in a field in the control packet in which arbitrary information can be described.
  • the step of generating the data stream includes generating a control pack as the control bucket, adding the control pack, and generating a program stream as the data stream.
  • the data processing method is used when converting a first data stream into a second data stream.
  • the first data stream is a bucket having a first data size and includes coded data obtained by compression-coding at least one of video and audio signals including a plurality of frames. It has the above-mentioned bucket and a control packet in which control information on the reproduction of the encoded data is stored.
  • the second data stream has one or more buckets having a second data size different from the first data size.
  • the data processing method includes: a step of extracting, from the control packet, the control information including position information indicating a storage position of each frame in the data stream and time information indicating reproduction timing, and the control information.
  • Time information indicating the playback timing of the frame is added before the beginning of the frame, the encoded data is divided and stored in the packet, and if the beginning of the frame is not included, the encoded data is And storing the divided data in the bucket to generate the second data stream.
  • Another data processing apparatus includes: a signal input unit to which at least one of a video signal and an audio signal including a plurality of frames is input; and compression encoding of the received signal to generate encoded data.
  • a compression unit and a stream assembling unit that divides the encoded data to generate a packet having a fixed data size, and arranges the bucket to generate a first data stream.
  • the stream assembling section generates first time information indicating the decoding timing for all buckets, and further delays some of the buckets at a predetermined timing later than the time of the first time information. Second time information indicating time is generated, and one of the first time information and the second time information is described in each packet.
  • the stream assembler generates the second time information based on a data size of a bucket of a second data stream different from the first data stream.
  • the stream assembler includes: 10
  • the second time information is generated at a timing within 0 ms.
  • the stream assembling unit associates a plurality of buckets as one unit based on a video playback time of the data stream, and the second bucket at a timing at which a video bucket appears at the head of the unit. Generate time information.
  • the data processing device includes a recording unit that records the first data stream on a recording medium.
  • the other data processing device is as described above.
  • the first data stream recorded on the recording medium is converted into the second data stream.
  • the data processing device has a conversion unit that converts the packet into one or more packets.
  • the conversion unit inserts a control packet for specifying a bucket including the encoded data before the packet obtained by converting the bucket in which the second time information is described.
  • Still another data processing device includes a signal input unit to which at least one of a video signal and an audio signal including a plurality of frames is input, and compression-encodes the received signal to generate encoded data. And a stream assembling unit that divides the encoded data to generate a bucket having a first data size, and arranges the buckets to generate a first data stream.
  • the stream assembler provides padding packets in some of the packets, and determines a data size of the padding bucket based on a data size of a packet of a second data stream different from the first data stream. .
  • the stream assembler provides the bucket having the padding bucket at one time within 100 milliseconds.
  • the data processing device includes a recording unit that records the first data stream on a recording medium.
  • the other data processing device converts the first data stream recorded on the recording medium into the second data stream.
  • the data processing device has a conversion unit that converts the packet into one or more packets.
  • the conversion unit converts the padding bucket into a control packet for specifying a packet including the encoded data.
  • FIG. 1 is a block diagram of a conventional data processing apparatus 90.
  • FIG. 2 is a diagram showing an example of the data structure of the program stream 20.
  • FIG. 3 is a diagram showing the relationship between the program stream 20 and the recording area of the optical disc 13 1.
  • FIG. 4 is a diagram showing a state in which recorded data is managed in the file system of the optical disc 13 1.
  • FIG. 5 is a diagram showing an example of the data structure of the program stream 25 conforming to the DVD-VR standard.
  • FIG. 6 is a diagram showing an example of the data structure of the transport stream 28.
  • FIG. 7 shows the data structure of V-TSP30
  • Fig. 7 (b) shows the data structure of A-TSP31
  • Fig. 7 (c) shows the data structure of PAT-TSP32
  • FIG. 7 (d) shows the data structure of PMT-TSP33
  • FIG. 7 (e) shows the data structure of PCR-TSP34.
  • FIG. 8A is a diagram showing a video TS packet (V—TSPT) 37 and an audio TS packet (A—TSPT) 38 stored in an object unit (TTOBU) 36
  • TTOBU object unit
  • FIG. 8A is a diagram showing a video TS packet (V—TSPT) 37 and an audio TS packet (A—TSPT) 38 stored in an object unit (TTOBU) 36
  • TTOBU object unit
  • B) and (c) are diagrams illustrating the data structures of a video TS packet 37 and an audio TS packet 38, respectively.
  • FIG. 9 (a) to 9 (c) show a general TS 41 where one frame of data is stored in one PES bucket from the PS 39 conforming to the DVD-VR standard via the PES 40.
  • FIG. 4 is a diagram showing a correspondence relationship between streams when stream conversion is performed.
  • FIG. 10 is a block diagram of the data processing device 10 according to the first embodiment.
  • FIG. 11A is a block diagram of an MPEG2PS decoder 171 for decoding PS
  • FIG. 11B is a block diagram of a TS decoder model for decoding TS.
  • Fig. 12 shows the Ps generated by the PS assembly 104 of the data processor 10.
  • FIG. 10 is a diagram showing a correspondence relationship between S 50 and T S55 converted based on P S 50.
  • FIG. 13 is a diagram showing a data structure of a pack header included in each pack of the PS.
  • FIG. 14 is a diagram schematically showing the position of the SCR gap.
  • FIG. 15 is a diagram schematically showing an SCR gap repeatedly provided within 100 ms in the middle of a VOBU.
  • Figure 16 shows an SCR channel set to a PS compliant with the DVD-VR standard. It is a figure which shows a cap typically.
  • FIG. 17 is a diagram showing a processing procedure when the PS assembling unit 104 sets the SCR of the program stream.
  • FIG. 18 shows the processing executed by the conversion unit 142. It is a figure which shows the procedure of the conversion process from to.
  • FIG. 19 is a diagram showing the end SCR for each pack.
  • FIG. 20 shows a correspondence relationship between PS 59-1 generated by PS assembling section 104 of data processing apparatus 10 according to Embodiment 2 and TS 59-2 converted based on PS 59-1.
  • FIG. 20 shows a correspondence relationship between PS 59-1 generated by PS assembling section 104 of data processing apparatus 10 according to Embodiment 2 and TS 59-2 converted based on PS 59-1.
  • FIG. 21 is a diagram showing the data structure of the padding packet 61 a included in the video pack 61.
  • FIG. 22 is a diagram schematically showing video packs 65 and 66 including padding packets repeatedly provided within 100 milliseconds.
  • FIG. 23 (a) is a diagram showing a data structure of a program stream generated by the PS assembling unit 104 according to the present embodiment, and
  • FIG. 23 (b) is a diagram showing video auxiliary information 67 d.
  • FIG. 3 is a diagram showing a detailed data structure.
  • FIG. 24 is a diagram schematically showing start addresses of the I frame, the B1 frame, and the B2 frame when the start of VOBU # i is calculated as 0.
  • FIG. 25 is a diagram illustrating a procedure of a process in which the conversion unit 142 converts PS into TS.
  • Figure 26 (a) shows the size information specified in the auxiliary information field 70.
  • FIG. 26 (b) is a diagram showing a data structure of the auxiliary information field 70.
  • FIG. 10 shows a functional block configuration of the data processing device 10 according to the first embodiment of the present invention.
  • the data processor 10 records a data stream in real time on a phase-change optical disc 131, such as a DVD-RAM disc or a Blu-ray disc (BD), and records the recorded data in a stream. System can be played.
  • a phase-change optical disc 131 such as a DVD-RAM disc or a Blu-ray disc (BD)
  • BD Blu-ray disc
  • the data processor 10 further converts the generated or recorded program stream (PS) into an MPEG2 transport stream (TS), and converts the stream into an IEEE 1394 interface section. It can be output via 140.
  • PS generated or recorded program stream
  • TS MPEG2 transport stream
  • the data processing device 10 includes a video signal input unit 100, an audio signal input unit 102, an MPEG2 PS encoder 170, a recording unit 120, and a continuous data area detection unit 160. And a recording control unit 161, and a logical block management unit 163.
  • the video signal input unit 100 is a video signal input terminal, and receives a video signal representing video data.
  • Audio signal input section 102 is audio signal input terminal Child and receives audio signals representing audio data.
  • the video signal input unit 100 and the audio signal input unit 102 are respectively a video output unit and an audio output unit of a tuner unit (not shown). Connected to and receives video and audio signals from each.
  • the data processing device 10 is a movie recorder, camcorder, or the like
  • the video signal input unit 100 and the audio signal input unit 102 output from a camera CCD (not shown) and a microphone, respectively. The received video and audio signals are received.
  • MP EG 2—PS encoder 170 receives the video signal and the audio signal, performs the processing of the present invention described later, and outputs the MP EG 2 program stream shown in FIG. (PS) or a PS that conforms to the DVD-VR standard shown in Figure 5.
  • the encoder 170 has a video compression unit 101, an audio compression unit 103, and a PS assembling unit 104.
  • the video compression unit 101 and the audio compression unit 103 compress and encode the video signal and the audio signal, respectively, based on the MPEG2 standard to generate video data and audio data.
  • the PS assembling section 104 divides the video data and audio data into packs of 2 KB each, V-P CK and A-P CK, so that these two types of packs constitute one VO BU. Arrange them in order and add RDI Pack 27.
  • the recording unit 120 controls the 'pickup 130' based on the instruction of the recording control unit 161, and the logical block instructed by the recording control unit 161 '.
  • the PS video object unit (VOBU) 26 is recorded from the position of the number.
  • the recording unit 120 divides each VOBU into 32 K-byte units, adds an error correction code in each unit, and records the logical unit as one logical block on the optical disc 13 1. If the recording of one VOBU is completed in the middle of one logical block, the recording of the next VOBU is performed continuously without opening a gap.
  • the PS is stored on the optical disk 131, for example, in a form as shown in FIG.
  • the continuous data area detection section 160 checks the use status of the sectors of the optical disk 131 managed by the logical block management section 163, and detects continuous free logical block areas.
  • the recording control unit 16 1 controls the operation of the recording unit '120.
  • the recording controller 161 issues an instruction to the continuous data area detector 160 in advance to detect a continuous free logical block area.
  • the recording control unit 16 1 notifies the recording unit 120 of the logical block number each time a logical block unit is written, and when the logical block is used, the logical block management unit Notify 1 6 3
  • the recording control unit 161 may cause the continuous data area detecting unit 1660 to dynamically detect the size of a continuous free logical block area.
  • the logical block management unit 163 manages the usage status of each logical block number based on the used logical block number notified from the recording control unit 161.
  • the usage status of each sector unit that constitutes a logical block number is determined by using the UDF or the space bit descriptor area specified in the file configuration of IS0 / IEC 13346. Therefore, whether they are used or unused are recorded and managed. Then, in the final stage of the recording process, the FID and the file entry are written to the file management area on the disk.
  • the continuous data area detector 160 re-detects the next continuous data area when the remainder of one continuous data area falls below 3 seconds in terms of the maximum recording / reproducing rate. When one continuous data area becomes full, writing is performed to the next continuous data area.
  • the data processor 10 When the data processor 10 reproduces the recorded PS, it reads out the data from the optical disc 13 1 and decodes (reproduces) the read out data in parallel. At this time, control is performed so that the data read rate is faster than the maximum data read rate, and the operation is performed so that there is no shortage of data to be reproduced. As a result, if the reproduction of the PS is continued, extra data to be reproduced can be secured per unit time by the rate difference between the maximum reproduction rate and the data read rate.
  • the data processor 10 reproduces extra PS data during the period during which the pickup 130 cannot read data (for example, during a seek operation), thereby realizing seamless PS reproduction. Can be.
  • the data readout rate of the playback unit 121 is 11.08 Mb'ps
  • the maximum data playback rate of the PS decomposition unit 114 is 10.08 Mbps
  • the maximum travel time of the pickup is 1.5 seconds, in order to play the PS without interruption, while moving the pickup 130 15.2 Mbits of extra data is required.
  • the recording function of the data processing device 10 is realized by the above components. Note that the configuration and operation of the data processing device 10 relating to the playback function are the same as those of the conventional data processing device 90, and a description thereof will be omitted.
  • the data processing device 10 includes a 1394 IZF unit 140, an output timing adjustment unit 141, and a PS-TS conversion unit 142.
  • the data processor 10 has a stream conversion function from PS to TS.
  • the stream conversion is performed, for example, in the following aspects.
  • the data processing device 10 is a camcorder
  • video and audio are recorded as PS on the optical disk 1331 loaded in the camcorder.
  • the camcorder converts the PS to TS.
  • TS is transmitted from PC to PC
  • the 1394 IZF section 140 is a terminal that outputs data based on the IEEE 1394 interface standard.
  • the output timing adjusting section 14 1 adjusts the output timing of the TS and passes the signal 3 to the 1394 I / F section 140.
  • The? 3 ⁇ 3 conversion unit 142 (hereinafter, referred to as "conversion unit 142") performs format conversion from PS to TS.
  • the conversion unit 142 receives the PS reproduced through the pickup 130 and the reproduction unit 121 or the PS generated by the encoder 170, and generates T S.
  • the data structure of the generated TS is, for example, as shown in FIG.
  • the conversion unit 142 inserts PAT-TSP32, PMT-TSP33, PCR-TSP34, etc. shown in FIG. 6 to generate Ts.
  • the data structures and functions of these TS packets are as described with reference to FIG.
  • the encoder 170 that generates the PS must encode the PS that can be decoded in a general MPEG2PS decoder.
  • predetermined conditions called system encoding conditions are imposed.
  • PS has stream characteristics that can be decoded by a general MPEG2PS decoder 171. This is the same for TS.
  • FIG. 11A is a block diagram of an MPEG2PS decoder 171 for decoding PS.
  • the decoder 17 1 has a PS decomposition section 114, a video decompression section 111, and an audio decompression section 113. These configurations are almost the same as the configuration of the decoder model called Program Stream / System Target Decoder-1 (P-STD).
  • P-STD Program Stream / System Target Decoder-1
  • the PS is input to the demultiplexer 114 a of the PS decomposer 114 at an arbitrary rate described in the pack header (for example, a relatively high rate of 10.0 Mbps).
  • PS is separated into video data and audio data by the demultiplexer 1 1 4 a, a buffer B v 1 1 4 b of the video data at a constant rate Bok (peak rate 1 0. 0 8 Mb ps), for voice data Input to buffer B A 1 1 4c.
  • the pack header, the system header, the PES header, and the like that constitute the PS are removed, and an elementary stream composed of video data and audio data is input to each buffer.
  • Each of the video and evening data elementary streams is
  • the data is decoded by the decompression unit 111 and the audio decompression unit 113 and output as an uncompressed video stream and audio stream.
  • FIG. 11 (b) shows functional blocks of a TS decoder model for decoding TS.
  • This TS decoder model is called the so-called transport stream system target decoder (T-STD).
  • T-STD transport stream system target decoder
  • the conversion unit 142 of the data processing device 10 is configured based on T-STD.
  • the TS is input to the PID filter 42 of the decoder at a fixed transmission rate according to the characteristics of the transmission medium and the like.
  • the PID filter identifies the bucket assigned to the TS bucket and separates the TS into video data, audio data, system data, etc. according to the PID.Transport buffer for video data TB V 43a, for audio data Is input to the transport buffer TB A 45 a of the other.
  • Image data is then, after multiplex buffer MB v 43 b, the Jer incrementer predecoder buffer EB v 43 c, and decoded into a video stream Te to the video decompression unit 44. Meanwhile the audio data via the elementary decoder buffer EB A 4 5 b, is decoded movies picture stream by voice decompression section 46.
  • the data separated in the PID file 42 is input to each buffer at a different rate, and transmitted between the buffers.
  • video data is transmitted from buffer 42 to buffer 43a at 10.0.08 Mbps, from buffer 43a to buffer 43b at 18 Mbps, and buffer 43b From buffer 43 c to 1 Transmitted at 5Mb s or less.
  • audio data is transmitted from the buffer 45a to the buffer 45b at 2Mbps or less.
  • PS audio data is transmitted faster than TS audio data.
  • the time information when the P-STD demultiplexer 114a receives each pack of the PS is defined. This time information is defined as time information (system clock reference; SCR) in the PS pack headers 22a (FIG. 2) and 27a (FIG. 5).
  • SCR system clock reference
  • the time information at the time when the PID filter 42 of the T-STD receives each transport packet of the TS is defined in the TS.
  • This time information is recorded at a predetermined frequency in the transport packet header. For example, the time information is set in PCR-TSP at intervals of 100 ms or less.
  • the PS assembling unit 104 generates a PS assuming that it is converted into a TS, and adds time information in consideration of the difference in the transmission speed of each stream in the P-STD. That is, PS system encoding is performed so that a packet can be converted to a stream conforming to T-STD without changing the packet arrival time information.
  • the voice stream maximum 2 Mb shall be transmitted from the demultiplexer 1 1 4 a to 1 1 4 b in ps, means pursuant system encoding for PS, e.g. puffer B v l 1 4 b and B A 1 1 4 Make sure that c does not underflow.
  • SCR PS time information
  • PCR TS time information
  • the PS assembling unit 104 when generating a TS, it is necessary to insert a TS packet relating to the PAT which does not exist in the PS, a TS bucket relating to the PMT, and the like. Therefore, the PS assembling unit 104 according to the present embodiment inserts such a TS bucket and sets time information in the PS in consideration of the processing timing, so that the time information of the TS bucket at the time of TS conversion is obtained. It is not necessary to calculate the information again.
  • the PS assembly part 104 of the present embodiment is By providing the “SCR gap” described below in the time information 3-1 of 3 above,? At the time of conversion from 3 to D3, a TS packet including a PAT, a TS bucket including a PMT, and the like can be easily imported.
  • FIG. 12 shows the correspondence between the PS 50 generated by the PS assembling unit 104 and the TS 55 converted based on the PS 50.
  • the PS 50 includes video packs (V-PCK) 51 and 54 and audio packs (A-PCK) 52, and these VOBUs are constituted. It is assumed that the PS 50 is recorded on the optical disk 131, but whether or not the PS 50 is recorded does not matter.
  • the PS assembly 104 sets the SCR gap 53 between the appropriate packs (V-PCK51 and A-PCK52 in the figure).
  • the SCR gap 53 has been given the SCR # (n + 1) of A—PCK 52 It can be provided by specifying (slower) than the specified SCR value.
  • the three-length gap 53 is defined as T 1 where the SCR value added by the conventional PS assembly unit 244 (FIG. 1) is T 1 and the SCR value added by the PS assembly unit 104 is T 2 (T 2 > T 1) is the time represented by ( ⁇ 2 - ⁇ 1).
  • Figure 13 shows the structure of the pack header included in each pack of PS.
  • the value of the SCR is specified by 33 bits in a field 56 divided into three parts, indicated as field name, system-clock-reference-base, among the data specified in the pack header.
  • the SCR value T2 described above is set in the field 56 of the A-PCK 52.
  • TS packets such as TS packet 32 of PAT, TS packet 33 of PMT, TS packet 34 of PCR, and SIT are inserted in the period of SCR gap 53. This eliminates the need to recalculate the SCR value of A—PCK 52 and simplifies the stream conversion process.
  • the conversion process from PS to TS will be described later with reference to FIG.
  • the PS assembler 104 encodes each pack so that it can be decoded by the program stream system target decoder (P-STD) (Fig. 11 (a)), and recalculates most of the time information.
  • PS 50 is generated so that the converted TS 55 can be decoded by the transport stream / system target decoder (T-STD) (Fig. 11 (b)).
  • T-STD transport stream / system target decoder
  • system encoding conditions are specified when encoding. The system encoding conditions are specifically described as follows.
  • the A—P CK 52 remains It is necessary to transmit at a transmission rate of 2 Mbps by the timing indicated by (n + 2). Therefore, the time interval defined by the SCR # (n + 1) of A—PCK52 and the SCR # (n + 2) of V-PCK54 becomes A—PCK5 at a transmission rate of 2 Mb ps. It must be longer than the time required for 2 to be transmitted.
  • This time interval is V-P ⁇ and eight-? During CK, it must be longer than the time required to transmit one pack at the peak rate of PS (10.08 Mbps).
  • the SCR gap is provided immediately before the V-PCK located at the head of the VOBU, and is provided within 100 ms thereafter.
  • TS packets 32 to 34 including PAT and the like can be inserted after the completion of the TS bucketing of one VOBU.
  • it is necessary to assume an increase in the bit rate of the TS such that one or more (eg, 3 ⁇ ) TS buckets can be inserted into the SCR gap 53 every 100 milliseconds.
  • FIG. 14 schematically shows the position of the SCR gap provided at the beginning of V ⁇ BU and 100 ms after it.
  • FIG. 15 schematically shows SCR gaps repeatedly provided within 100 ms.
  • the SCR value at the beginning of the SCR gap is set to be an integral multiple of 270,000.
  • the reason for setting the value to “270 00 00 0” is that this value corresponds to 100 milliseconds in time with respect to a clock frequency of 27 MHz.
  • the SCR gap may be provided repeatedly only within 100 milliseconds, and may not necessarily be provided immediately before the V-P CK located at the head of the VO BU. Further, as long as it is within 100 ms, it may be an integral multiple of 50 ms, for example, or may be a variable length.
  • Figure 16 schematically shows the SCR gap set for a PS conforming to the DVD-VR standard. The SCR gap is provided immediately before RDI-PCK58 located at the beginning of VO BU #n. Furthermore, the next SCR gap is set within 100 ms from the SCR gap.
  • FIG. 17 shows a processing procedure when the PS assembling section 104 sets the SCR of the program stream.
  • the PS assembling unit 104 determines a temporary SCR value for each pack. This temporary SCR value is the same as the value determined by the conventional PS assembly unit 244.
  • step S101 it is determined whether the pack to be processed is the first pack of the V ⁇ BU. If the pack is not the first pack, the process proceeds to step S102. If the pack is the first pack, the process proceeds to step 104.
  • PS assembly part 10 Step 4 determines whether the SCR value is near an integral multiple of 100 ms.
  • the PS assembling unit 104 determines whether the SCR value is a multiple of 270 00 000. If the result of the determination is that the value is not around the integral multiple, the process proceeds to step S103, and in step S103, the provisionally determined SCR value is described in the pack header without being changed. On the other hand, if it is near the integral multiple, the process proceeds to step S104, and in step S104, the three-jime is shifted by a predetermined 3 CR gap.
  • FIG. 18 shows the procedure of the conversion process from PS to TS, which is executed in the conversion unit 142.
  • step S200 the insertion timing of the first PAT, PMT, and PCR is determined based on the SCR value of V--PCK located at the beginning of VOBU. For example, when a 27 MHz counter is used, the insertion timing is obtained by (SCR value div 27 00 00 00 of the first VOBU). This "div" means that the result of the division is rounded down to the nearest decimal point. Also, “270 00 00 0” corresponds to 100 milliseconds, and is a value corresponding to 1 Z 10 of the count of 27 MHz.
  • step S201 the conversion unit 142 calculates the value of the last SCR one pack before (excluding the first pack in which no pack exists before).
  • Figure 19 shows the trailing SCR for each pack. As shown in the figure, “tail SCR” indicates the earliest timing (time information) for transmitting one byte immediately after a certain pack.
  • step S202 conversion section 142 determines whether the pack to be processed is the first pack of V ⁇ BU. If the pack is not the first pack, the process proceeds to step S203, and if the pack is the first pack, the process proceeds to step S209.
  • step S203 the conversion unit 1442 determines whether or not the obtained insertion timing is included between the SCR value of the pack and the end SCR value. Proceed to 9; if not included, proceed to step S207.
  • step S209 the PAT, ⁇ , and PCR TS packets are inserted at the obtained insertion timing.
  • step S204 2700000 is added to the input timing value to obtain the next input timing value.
  • step S207 the converter 144 divides one pack into 188 bytes to generate a TS bucket. For example, as shown in FIG. 12, one video pack is divided into 11 video TS packets 30, and one audio pack is divided into 11 audio TS packets 31.
  • step S208 a time stamp is added to the TS packet.
  • step S206 the conversion unit 142 determines whether all packs in the PS have been processed. If the processing of all the packs has been completed, the processing is terminated. If not completed, the next pack is extracted in step S205, and the processing of step S201 and subsequent steps is performed again. Perform processing.
  • the conversion unit 142 can easily convert the transport stream from the program stream. In particular, there is no need to recalculate and set the PCR, PTS (Presentation Time Stamp) and DTS (Decoding Time Stamp) in V-PCK or A-PCK, and use the transformer based on the SCR value of the program stream.
  • PTS Presentation Time Stamp
  • DTS Decoding Time Stamp
  • the time information of each TS packet in the port stream can be determined, processing time is not required as in the conventional case, and the processing load during conversion can be significantly reduced.
  • the time information of the TS packet is called PCR, and defines the time at which the TS bucket should reach the virtual MPEG 2 decoder. Ding?
  • the scale value is? It can be calculated based on the scale value. For example, the value of PCR 34 in FIG. 12 may be set to a value earlier in time than the value of SCR # (n + 1) of PS. The degree is equivalent to the transmission time of one TS packet 34.
  • the recorded program stream is converted into a transport stream in order to be output from the IEEE 1394 interface unit 140.
  • the same processing can be performed when the recorded program stream is converted into a transport stream and then recorded on a recording medium such as an optical disc 131.
  • the timestamp can be selected based on the SCR of the program stream.
  • position information indicating the position where the SCR gap is provided can be defined.
  • the location information is, for example, This is the head address of the padding bucket, with the beginning of the program stream set to 0.
  • the SCR value at the head of the SCR gap may be set in the manufacturer extension fields 27 e and 67 of RDI-PCK (FIGS. 5 and 23).
  • a usable SCR value of a TS bucket including PAT, PMT, PCR, or SIT may be recorded as a candidate. Also, such information may be recorded in a file different from the file containing the video stream.
  • the data processing device 10 according to the present embodiment differs from the data processing device according to the first embodiment in that a padding packet is provided instead of the SCR gap 53 in FIG.
  • FIG. 20 shows the correspondence between the PS 59-1 generated by the PS assembling section 104 of the data processing apparatus 10 according to the present embodiment and the TS 59_2 converted based on the PS 59-1. Is shown.
  • the PS assembling unit 104 inserts the padding packet 61 a into an appropriate pack (the video pack (V—PCK) 61 in the figure) constituting the VOB U.
  • V—PCK video pack
  • a TS packet including PAT 32, PMT 33, PCR, SIT, etc. is inserted corresponding to the position of padding packet 61a.
  • One video A packet is divided into 11 video TS packets 30, and one audio pack is divided into 11 audio TS packets 31.
  • the padding packet 61a has a packet header 63 and a field 64 in which a fixed value (OxFF) padding byte is stored.
  • the data length (PES packet length) of the padding byte field 64 is indicated by 2 bytes, and thereby the length of the padding packet 61a can be specified.
  • the data length of the padding byte field 64 is related to the packet length of the TS packet, and is, for example, an integral multiple of 188 bytes (for example, 2 to 4 times). “188 bytes” corresponds to the data size of the transport packet.
  • the data length of the padding byte field 64 is twice the length of 188 bytes, two TS packets can be inserted.
  • the data length of the padding byte field 64 is four times, four TS packets can be inserted. Will be able to enter.
  • the padding packet 61a is the same as the padding bucket described in the MPEG2 system standard.
  • the arrangement of the padding bucket is the same as the DVD-VR standard.
  • the video pack 61 may contain as much normal compressed video data as possible.
  • the padding bucket 61 a of the present embodiment is provided in the video pack 61, it may be provided in the audio pack 62.
  • Figure 22 shows a padding pad that is repeatedly provided within 100 milliseconds.
  • 5 schematically shows a video pack 65, 6 6 including a bracket.
  • Video packs 65 and 66 are provided in the middle of V ⁇ BU # n.
  • the padding packet may be provided repeatedly only within 100 ms, and may not be provided immediately before V-PCK located at the head of V ⁇ BU.
  • the PS assembly 104 determines that each pack satisfies the system encode conditions of the program stream, system target decoder (P-STD), and The program stream 59-1 is generated so that the converted transport stream also satisfies the system encoding conditions of the transport stream system target decoder (T-STD).
  • the system encoding conditions are specifically described as follows.
  • the time interval defined by 30 # (n + 1) of the audio pack (A—P CK) 6 2 and the SCR # (n + 2) of the following V_P CK (not shown) is 2 Mb ps It must be longer than the time required for A__PC52 to be transmitted at this transmission rate.
  • adjacent SCRs other than SCR # (n + l) of A_P CK 62 and subsequent SCR # (n + 2) of V—P CK (not shown)
  • the time interval between them eg, the time interval between the SCRs of Video Packs 60 and 61
  • this time interval is one peak at the peak rate of the PS (10.08 Mbps). It is necessary to set each SCR value so that it is longer than the time required to transmit the pack.
  • position information indicating the position where the padding packet is provided can be defined.
  • the position information is, for example, the head address of a padding bucket with the head of the program stream being 0.
  • the SCR value at the head of the SCR gap may be provided in the RDI-PCK medium extension fields 27 e and 67 (FIGS. 5 and 23).
  • a usable SCR value of the TS bucket including PAT, PMT, PCR, or SIT may be recorded as a candidate. Also, such information may be recorded in a file different from the file containing the video stream.
  • the data processing device 10 converts a program stream conforming to the DVD-VR standard into a transport stream.
  • a program stream that can reduce the processing load and shorten the conversion processing time is generated.
  • the program stream and the transport stream have a relationship shown in FIG. 9 with each other. Therefore, as shown in (c) of FIG. 9, the PES packet of (b) is divided and stored in the data portion 41b of the TS bucket.
  • One frame of data (video data or audio data) is stored in the payload 40b of the PES packet.
  • the data for one frame is obtained from the data in the data portion 39a and 39b of the pack shown in (a) and a part of the data portion 39c.
  • One frame of video refers to, for example, a screen for two fields when displayed in an interlaced manner.
  • One frame of audio refers to, for example, AC-3 with a sampling frequency of 48 kHz and 256 kbps. In the case of audio, it means a total of 1 5 3 6 samples. Since the PS assembling unit 104 of the data processing device 10 determines the data to be stored in the data portion of each pack when generating the PS, not only the data type such as video audio, but also the It is possible to specify, for example, which data constitutes which part of which frame.
  • the PS assembling unit 104 of the present embodiment generates auxiliary information indicating the position of the frame, the PTS (playback timing information), the DTS (decode timing information), etc., for each data type constituting such a PS. I did it. Since there is a data area in the RDI pack that can be used freely by the manufacturer, auxiliary information can be recorded in this area.
  • FIG. 23 (a) is generated by the PS assembly unit 104 according to the present embodiment. 9 shows the data structure of the program stream obtained. This program stream conforms to the DVD-VR standard, and has a 2-kilobyte RDI pack (RDI-PCK) with an extension field 67.
  • RDI-PCK 2-kilobyte RDI pack
  • the maker extension field 67 has main identification information 67a, pixel number information 67b, compression mode information 67c, video auxiliary information 67d, and audio auxiliary information 67e.
  • the manufacturer identification information indicates the manufacturer of the data processing device 10 that generated the PS
  • the pixel number information 67 b indicates the number of pixels in the vertical and horizontal directions of the recorded image
  • the compression mode information 67 c corresponds to the DVD-VR standard. Indicates whether or not.
  • the manufacturer's extension field 67 can record PS fact information (4: 3, 16: 9, letterbox, etc.) and audio channel attribute information (monaural / stereo, etc.). You.
  • the video auxiliary information 67 d and the audio auxiliary information 67 e of the maker extension field 67 specify information on the data structure for each data type constituting the PS. That is, the video auxiliary information 67 d specifies the data structure of the video pack in the VOBU including RDI-PCK at the beginning, and includes video frame position information and PTS ZDTS information.
  • the audio auxiliary information 67 e specifies the data structure of the audio pack, and includes audio frame position information and PTS information.
  • FIG 23 (b) shows the detailed data structure of video auxiliary information 67d. Show.
  • the video auxiliary information 67 d specifies frame position information 68 a to 68 d and PTS / DTS information for each of I, P, and B frames specified in the MPEG standard.
  • Each frame position information 68a to 68d is the data size from the beginning of the program stream or the beginning of the VOBU to the beginning of each frame data, and is expressed in bytes.
  • FIG. 24 schematically shows the start addresses (storage positions) of the I frame, the B1 frame, and the B2 frame when the start of VOBU # i is calculated as 0.
  • the start address of the video frame includes the data length of A-PCK included from the beginning of VOBU to A-PCK.
  • the PS assembling unit 104 holds the start position of each frame, the PTS of the position, and the like, and generates the video auxiliary information 67d.
  • the PT S / DTS information described in FIG. 23 (b) indicates P-three and zero-three in frame units. DTS may be provided as needed.
  • the PTS / DTS information is provided corresponding to each frame position information 68a to 68d, and is the I-frame next to the I-frame position information 68a? D3 / 0/3 information is provided, and PTS / DTS information of the P1 frame is provided after the P1 frame position information 68b.
  • the audio auxiliary information 67 e is not shown, the data structure of the audio auxiliary information 67 e is the data of the video auxiliary information 67 d except that DTS information is not included. Same as the structure.
  • step S300 when a pack in units of 2 kbytes conforming to the DV D-VR standard is input to the conversion unit 142, in step S301, the conversion unit 142 It is determined whether or not it is an I-pack (S301). As a result of the determination, if the pack is an RDI pack, the process proceeds to step S302. If the pack is not an RDI pack, the process proceeds to step S303.
  • the processing in step S303 means that the pack is always a video pack (V_PCK) or an audio pack (A-PCK).
  • step S302 the conversion unit 142 extracts frame position information and PT SZDTS information for each of video and audio from the manufacturer extension field 67 of the RDI pack.
  • step S303 the conversion unit 142 removes the pack header and the PES header of the pack to be processed. It should be noted here that the RDI pack is always located at the beginning of the VO BU, so at the time of executing step S303, the conversion unit 142 has already received the frame position information from the preceding RDI pack. , PT SZDT S information.
  • the conversion unit 142 determines whether or not there is a frame start position in this pack by referring to the frame position information in step S304. If the frame start position is included, the process proceeds to step S305, and if not, the process proceeds to step S306.
  • step S305 the conversion unit 142 references the PT SZDT S information. Then, the corresponding PTS / DTS is extracted, and a PES header including the PTSZDTS is generated and added before the package data.
  • step S306 the conversion unit 142 divides the processed data to generate and output 11 or 12 TS packets. Thereafter, the flow advances to step S307 to process the next pack.
  • the conversion unit 142 can easily convert the PS into a TS composed of PES in which one PES packet contains one frame of data without analyzing the elementary stream in the PS. Can be converted to
  • FIG. 26 (a) shows a maker extension field 69 in which size information is specified in the auxiliary information field 70.
  • FIG. 26 (b) shows the data structure of the auxiliary information field 70.
  • the auxiliary information field 70 differs from FIG. 23 (b) in that information on the data size of the frame is specified for each frame. For example, for the I frame, PTS / DTS is described after the start address 68a, and then the frame size 71 is described. For the P1 frame, PTS / DTS is described after the start address 69a, and then the frame size 72 is described. Similarly, for the B1 frame, the B1 frame size 73, such as the address 68c and the PTS, is described.
  • the above processing does not refer to the processing of inserting TS packets including PAT / PMT.
  • these TS packets The processing of the data processing device 10 according to the first or second embodiment can be directly applied and inserted. This eliminates the need for the data processing device 10 to perform the system encoding process again.
  • the position information of the video frame is described as the data size from the start of the program stream or VOBU to the start position of each frame, the difference in the start address between adjacent frames is defined as the position information. You can also. The same applies to the position information of the audio frame.
  • the number of audio streams may be one or more. Even when there are two or more audio streams, auxiliary information (for example, Fig. 23) can be specified in the RDI pack.
  • flag information indicating whether auxiliary information is recorded is also recorded in the manufacturer extension fields 67, 69 of the RDI pack to indicate whether one or more auxiliary information is recorded. May be.
  • Video frame information and audio frame information in V ⁇ B U are Video frame information and audio frame information in V ⁇ B U
  • auxiliary information such as video frame information and audio frame information may be stored at another position in the stream.
  • auxiliary information on audio frames synchronized with the video frames in V ⁇ BU may be stored in RDI_PCK at the beginning of the VOBU.
  • the program stream according to the present embodiment stores auxiliary information for conversion into a transport stream. Therefore, the so-called reverse conversion from transport stream to program stream is performed.
  • auxiliary information for converting into a program stream may be stored in the transport stream.
  • the auxiliary information may be stored, for example, in a dedicated transport bucket for storing the auxiliary information.
  • auxiliary information for converting to a program stream or a transport stream may be stored in the PES stream.
  • each component of the data processing device described above is performed based on an instruction from a central control unit (not shown) provided in the data processing device.
  • the central control unit issues instructions based on a program arranged in a memory (not shown) of the data processing device, and controls the overall operation of the device.
  • the program performs the procedures described in Figures 17, 18, 25, etc., parses the data stream according to a predetermined data structure, or converts data that conforms to such a data structure. Generate a data stream.
  • the MPEG2 program stream has been described as an example, but the system stream of MPEG1 may be used.
  • the recording medium is a phase change optical disk, for example, optical disks such as DVD-RAM, DVD-R, DVD-RW, DVD + RW, MO, CD-R, CD_RW, and hard disk Other disk-shaped recording media can also be used. Further, it may be a semiconductor memory.
  • the read / write head is an optical disk pickup.For example, when the recording medium is MO, the pickup and the magnetic head are used. In the case of a hard disk, it becomes a magnetic head.
  • the transport stream may be in a format compliant with a digital broadcasting standard using MPEG, or may be in a format compliant with digital data broadcasting using MPEG. Good.
  • compatibility with the digital broadcast set-top box (STB) can be improved, and the functions of the STB such as a data broadcast receiving function can be utilized.
  • the data processing device 10 may be, for example, a stationary video recording device or a device that performs data conversion from a program stream to a transport stream, in addition to a camcorder.
  • the SCR gap is used for the purpose of inserting a PAT or the like at the time of transport bucket conversion. However, it may be provided to insert another pack into the program stream. For example, when only one audio stream is included in the program stream, the PS assembling unit 104 performs the system encoding process and recalculates the time information without re-calculating the second audio data stream.
  • An SCR gap may be used so that it can be inserted into the PCK.
  • auxiliary information are specified in the manufacturer extended information, but the auxiliary information may be separately collected and stored as a data file separate from the MPEG program stream. .
  • the transmission rate of PS is assumed to be 10.08 Mbps or less in accordance with the DVD-VR standard, but it may exceed 10.08 Mbps. This is because, according to the PS generated by the processing of the present embodiment, even if the bit rate is increased, the conversion to the transport stream and the conversion efficiency are not affected.
  • recording in a program stream and conversion to a transport stream are efficient and easy.
  • recording in the program stream it has high compatibility with editing application software for DVD devices and PCs.
  • since it is easy to convert to a transport stream it has high affinity with the 1394 interface.
  • Industrial applicability when a program stream of video data conforming to the DVD-VR standard is transmitted, for example, via a digital interface of IEEE1394, the program stream can be easily converted to a transport stream. can do.

Abstract

A data processing device includes: a signal input section for receiving at least one of the video and audio signal containing a plurality of frames; a compression section for compressing/encoding the received signal and generating encoded data; and a stream constructing section for dividing the encoded data to generate at least one packet having a predetermined data size and adding a control packet containing information on controlling reproduction of the encoded data so as to generate a data stream. The stream constructing section generates position information indicating the storage position of each frame in the data stream and describes it as auxiliary information in the control packet. Thus, it is possible to obtain a program stream having a data structure which can easily be converted, for example, into a transport stream.

Description

データ処理装置 技術分野  Data processing equipment Technical field
本発明は、 光ディスク等の記録媒体に動画ストリームのストリ一 明  The present invention provides a method for storing a moving image stream on a recording medium such as an optical disk.
ムデータをリアルタイムで記録す細るデータ処理装置および方法等に 関する。 背景技術 The present invention relates to a data processing apparatus and method for recording data in real time. Background art
映像 (ビデオ) 信号および音声 (オーディオ) 信号を低いビッ ト レートで圧縮し符号化する種々のデータストリームが規格化されて いる。 そのようなデータストリームの例として、 MP EG 2システ ム規格(IS0/IEC 13818- 1)のシステムストリームが知られている。 システムストリームは、 プログラムストリーム (P S) 、 トランス ポ一トストリ一ム (T S) 、 および P E Sストリームの 3種類を包 含する。  Various data streams have been standardized that compress and encode video (video) and audio (audio) signals at low bit rates. As an example of such a data stream, a system stream of the MPEG2 system standard (IS0 / IEC 13818-1) is known. The system stream includes three types: a program stream (PS), a transport stream (TS), and a PES stream.
近年、 磁気テープに代わって、 相変化光ディスク、 MO等の光デ イスクが、 データストリームを記録するための記録媒体として注目 を浴びてきている。 現在、 相変化光ディスクにデータストリームを 記録するための規格と して 「 Video Recording規格」 (DVD Specifications for Reiri table/Re - recordable Discs Par t3 VIDEO RECORDING version 1.0 September 1999) が規定されている。 図 1は、 従来のデータ処理装置 9 0の機能ブロックの構成を示す。 デ一夕処理装置 9 0は、 DVD— RAMディスク、 B l u— r a y ディスク (B D) 等の相変化光ディスク 1 3 1にリアルタイムでデ 一タストリームを記録し、 記録されたデータストリームを再生する ことができる。 In recent years, optical disks such as phase-change optical disks and MOs have been attracting attention as recording media for recording data streams in place of magnetic tapes. Currently, the “Video Recording Standard” (DVD Specifications for Reiri table / Re-recordable Discs Part 3 VIDEO RECORDING version 1.0 September 1999) is specified as a standard for recording a data stream on a phase change optical disk. FIG. 1 shows a configuration of a functional block of a conventional data processing device 90. The data processing device 90 records a data stream in real time on a phase change optical disk 131, such as a DVD-RAM disk or a Blu-ray disk (BD), and reproduces the recorded data stream. Can be.
データ処理装置 9 0のデータ記録処理は以下のように行われる。 まず、 映像信号入力部 1 0 0に入力された映像信号は、 映像圧縮部 1 0 1で圧縮符号化される。 同時に、 音声信号入力部 1 0 2に入力 された音声信号が音声圧縮部 1 0 3で圧縮符号化される。 プロダラ ムストリ一ム組立部 244は、 それらを多重化して MP E G 2プロ グラムストリーム (以下、 「プログラムストリーム」 または 「P S」 と称する) を生成する。 これらの処理は、 MP E G 2 P Sェン コーダ 1 7 0内で行われる。 次に、 記録部 1 2 0およびピックアツ プ 1 3 0は、 生成された P Sを光ディスク 1 3 1に書き込む。 この とき、 記録制御部 1 6 1、 連続データ領域検出部 1 6 0、 論理プロ ック管理部 1 6 3等の処理に基づいて光ディスク 1 3 1上の物理的 に連続する空き領域が検出され、 P Sが記録される。  The data recording process of the data processing device 90 is performed as follows. First, a video signal input to the video signal input unit 100 is compression-encoded by the video compression unit 101. At the same time, the audio signal input to the audio signal input unit 102 is compression-encoded by the audio compression unit 103. The program stream assembling section 244 multiplexes them to generate an MPEG2 program stream (hereinafter, referred to as “program stream” or “PS”). These processes are performed in the MPEG2PS encoder 170. Next, the recording unit 120 and the pickup 130 write the generated PS on the optical disk 1331. At this time, physically continuous free areas on the optical disc 13 1 are detected based on the processing of the recording control section 16 1, the continuous data area detection section 16 0, the logical block management section 16 3, etc. , PS is recorded.
データストリームの再生処理は以下のように行われる。 プロダラ ムストリーム分解部 1 1 4は、 ピックアップ 1 3 0および再生部 1 2 1を介して再生されたプログラムストリ一ムをビデオ信号および オーディオ信号に分離する。 映像伸長部 1 1 1および音声伸長部 1 1 3は、 それぞれビデオ信号およびオーディオ信号をデコードし、 その結果得られたビデオデータおよびオーディォデータを映像表示 部 1 1 0および音声出力部 1 1 2において表示し、 出力する。 The reproduction process of the data stream is performed as follows. The program stream decomposing unit 114 separates the program stream reproduced via the pickup 130 and the reproducing unit 121 into a video signal and an audio signal. The video decompression unit 1 1 1 and the audio decompression unit 1 1 3 decode video and audio signals, respectively, and display the resulting video and audio data on video. Displayed and output by the unit 110 and the audio output unit 112.
図 2は、 プログラムストリーム 2 0のデータ構造の例を示す。 プ 口グラムス トリーム 2 0は、 ビデオオブジェク トュニッ ト(Video OBject Unit; VO B U) 2 1を複数含んでいる。 VOBU 2 1は、 ビデオデータが格納されたビデオパック (V— P CK) 2 2および オーディオデータが格納されたオーディオパック (A— P CK) を 複数含む。 これらはビデオの再生時間にすると 0. 4秒から 1秒分 のデータである。 ビデオパック 2 2は、 パックヘッダ 2 2 aと、 パ ケットヘッダ 2 2 bと、 圧縮されたビデオデータ 2 2 cとを含む。 一方、 オーディオパックでは、 ビデオパック 2 2のビデオデータ 2 2 cに代えてオーディオデータが含まれる。 なお、 1つの VOBU のデータサイズは、 ビデオデータが可変ビットレートであれば最大 記録再生レ一ト以下の範囲で変動する。 ビデオデータが固定ビット レートであれば VOBUのデータサイズはほぼ一定である。 なお、 一般に 「パック」 とはパケットの 1つの例示的な形態として知られ ている。  FIG. 2 shows an example of the data structure of the program stream 20. The program stream 20 includes a plurality of video object units (VOBUs) 21. The VOBU 21 includes a plurality of video packs (V-P CK) 22 storing video data and a plurality of audio packs (A-P CK) storing audio data. These are 0.4 seconds to 1 second worth of video playback time. The video pack 22 includes a pack header 22a, a packet header 22b, and compressed video data 22c. On the other hand, the audio pack includes audio data instead of the video data 22 c of the video pack 22. Note that the data size of one VOBU fluctuates within the range of the maximum recording / reproduction rate if the video data has a variable bit rate. If the video data has a fixed bit rate, the VOBU data size is almost constant. Generally, a “pack” is known as one exemplary form of a packet.
図 3は、 プログラムストリーム 2 0と光ディスク 1 3 1の記録領 域との関係を示す。 プログラムストリーム 2 0の VOBUは、 光デ イスク 1 3 1の連続データ領域 24に記録される。 連続データ領域 24は物理的に連続する論理ブロックから構成されており、 この領 域には最大レートでの再生時間にして 1 7秒以上のデータが記録さ れる。 データ処理装置 9 0は、 論理ブロックごとに誤り訂正符号を 付与する。 論理ブロックのデータサイズは 3 2 kバイ トである。 各 論理ブロックは、 2 Kバイトのセクタを 1 6個含む。 FIG. 3 shows the relationship between the program stream 20 and the recording area of the optical disc 13 1. The VOBU of the program stream 20 is recorded in the continuous data area 24 of the optical disk 1331. The continuous data area 24 is composed of physically continuous logical blocks. In this area, data having a maximum rate of 17 seconds or more is recorded. The data processing device 90 assigns an error correction code to each logical block. The data size of the logical block is 32 kbytes. each A logical block contains 16 2 Kbyte sectors.
図 4は、 記録されたデータが光ディスク 1 3 1のファイルシステ ムにおいて管理されている状態を示す。 例えば UDF (Universal Disk Format) 規格のファイルシステム、 または I S OZ I E C 1 3 346 (Volume and file structure of write once and rewritable media using non-sequent i al recording for  FIG. 4 shows a state where the recorded data is managed in the file system of the optical disk 13 1. For example, UDF (Universal Disk Format) standard file system, or IS OZ I E C 1 3 346 (Volume and file structure of write once and rewritable media using non-sequent i al recording for
information interchange) ファイルシステムが利用される。 図 4 では、 連続して記録されたプログラムストリームがファイル名 VR —MOV I E. V R Oとして記録されている。 ファイルを構成する ファイルエントリの位置として先頭セクタ番号が設定される。 ファ ィルエントリは、 各連続デ一夕領域 (C D A : Contiguous Data Area) a〜 cを管理するァロケーションディスクリプタ a〜 cを含 む。 1つのファイルが複数の領域 a〜 cに分かれている理由は、 領 域 aの途中に不良論理ブロック、 書き込みができない P Cファイル 等が存在したからである。 information interchange) A file system is used. In FIG. 4, a continuously recorded program stream is recorded as a file name VR—MOV I E.V RO. The first sector number is set as the position of the file entry that constitutes the file. The file entry includes allocation descriptors a to c for managing each of the continuous data areas (CDA: Contiguous Data Area) a to c. The reason that one file is divided into a plurality of areas a to c is that a bad logical block, a non-writable PC file, etc. existed in the area a.
なお、 UD F規格は IS0/IEC 13346規格のサブセッ トに相当する。 また、 光ディスクドライブ (データ処理装置 9 0) を 1 3 94イン タフエースおよび S B P (Serial Bus Protocol) — 2を介して P C等と接続することにより、 記録されたファイルを P Cからも 1つ のフアイルとして扱うことができる。  The UDF standard is equivalent to a subset of the IS0 / IEC 13346 standard. Also, by connecting the optical disk drive (data processing device 90) to a PC or the like via the 1394 interface and SBP (Serial Bus Protocol) -2, the recorded file can be converted from the PC to a single file. Can handle.
図 5は、 DVD— VR規格に準拠したプログラムストリ一ム 2 5 のデ一夕構造の例を示す。 プログラムストリーム 2 5とプログラム ストリーム 2 0との相違点は、 プログラムストリーム 2 5の各 VO BU 2 6の先頭に、 必ず RD Iパック (RD I— P CK) 2 7が付 加される点である。 1 0 1パック 2 7には、 P Sの再生を制御する ための制御情報が規定され、 パックヘッダ 2 7 a、 システムヘッダ 2 7 b、 P E Sヘッダ 2 7 c、 R D Iデータ 2 7 dおよびメーカ拡 張フィールド 2 7 eが含まれる。 メーカ拡張フィールド 2 7 eには、 メーカ独自の情報 (メーカ拡張情報) を記述できる。 FIG. 5 shows an example of a data structure of a program stream 25 conforming to the DVD-VR standard. The difference between program stream 25 and program stream 20 is that each VO of program stream 25 An RDI pack (RDI-PCK) 27 is always added at the beginning of BU26. 101 Pack 27 includes control information for controlling playback of PS, pack header 27a, system header 27b, PES header 27c, RDI data 27d, and manufacturer extension Field 27 e is included. Manufacturer-specific information (manufacturer extension information) can be described in the manufacturer extension field 27 e.
データ処理装置 9 0は、 プログラムストリーム 2 0、 2 5の記録 および再生に加え、 I EE E 1 3 94インタフェース部 1 40から D— VH S、 セットトップボックス (S TB) 等へデータストリー ムを出力することができる。 ただし、 I E EE 1 3 94インタフエ ース規格では、 映像同期通信プロトコルとして MP E G 2 トランス ポートストリーム (以下、 「卜ランスポー卜ス トリーム」 または 「T S」 と称する) のみが規定されているため、 データ処理装置 9 0は P Sを T Sに変換する必要がある。  The data processing unit 90 records and reproduces the program streams 20 and 25, and also transmits the data stream from the IEEE1394 interface unit 140 to the D-VHS, set-top box (STB), etc. Can be output. However, since the IE EE1394 interface standard specifies only the MPEG2 transport stream (hereinafter referred to as “transport stream” or “TS”) as a video synchronous communication protocol, data The processing unit 90 needs to convert PS into TS.
以下、 トランスポートストリームを説明する。 図 6は、 トランス ポートストリーム 2 8のデータ構造の例を示す。 T S 2 8は複数の T Sオブジェク トユニッ ト(TS OBject Unit; T O B U) 2 9を含み、 その TOBU 2 9は 1以上のトランスポートパケット (T Sパケッ ト) から構成されている。 T Sパケットは、 例えば、 圧縮ビデオデ 一夕が格納されたビデオ T Sパケット (V— T S P) 3 0、 圧縮さ れたオーディォデ一夕が格納されたオーディォ T Sバケツト (A_ T S P) 3 1、 プログラム ' アソシエーション ' テ一ブル ( P A T) が格納されたパケット (PAT T S P) 3 2、 プログラム , マップ · テーブル (PMT) が格納されたパケット (PMT— TS P) 3 3およびプログラム · クロック · リファレンス (P C R) が 格納されたパケット (P CR— T S P) 34である。 Hereinafter, the transport stream will be described. FIG. 6 shows an example of the data structure of the transport stream 28. The TS 28 includes a plurality of TS OBject Units (TOBU) 29, and the TOBU 29 is composed of one or more transport packets (TS packets). TS packets are, for example, video TS packets (V—TSP) 30 containing compressed video data, audio TS buckets (A_TSP) 31 containing compressed audio data, and the program 'association'. Packet (PAT TSP) containing a table (PAT) 32, Program, A packet containing a map table (PMT) (PMT—TSP) 33 and a packet containing a program clock reference (PCR) (PCR—TSP) 34.
図 7 (a) 〜 (e) は、 各 T Sパケッ トのデータ構造の例を示す。 各 T Sパケット T Sパケットヘッダ 3 0 a〜 34 aに示すように、 T Sパケットの種類に応じて異なるパケット識別子 (P I D) が割 り当てられている。 トランスポートストリームでは複数の番組のデ —夕のパケット毎に異なる P I Dが与えられているので、 P I Dを 利用することにより必要な番組の T Sバケツトのみを取得できる。 例えば、 V— T S P 3 0および A— T S P 3 1を取得するための手 順は以下のとおりである。 まず、 P I Dが " 0 X 0 0 0 " の P A T — T S P 3 2が取得される。 P AT— T S P 3 2内の PAT 3 2 c には、 PMT— T S Pの P I Dが記述されている。 そこで、 PMT _T S Ρ 3 3の P I D ( " 0 x 0 0 3 0 " ) が取得される。 Ρ ΜΤ 一 T S P 3 3内の PMT 3 3 C には、 V— T S P 3 0の P I D ( " 0 x 0 0 2 0 " ) および A— T S P 3 1の P I D ( " 0 x 0 0 2 1 " ) が記述されている。 それらの P I Dが付与されたパケット を取得することにより、 V_T S P 3 0および A— T S P 3 1が得 られる。  FIGS. 7 (a) to 7 (e) show examples of the data structure of each TS packet. As shown in each TS packet TS packet header 30a to 34a, a different packet identifier (PID) is assigned according to the type of the TS packet. In the transport stream, since different PIDs are provided for each packet of a plurality of programs in the evening, it is possible to acquire only the TS bucket of the necessary programs by using the PID. For example, the procedure for obtaining V—TSP 30 and A—TSP31 is as follows. First, PAT—TSP32 with PID of “0X0000” is obtained. PAT32c in PAT-TSP32 describes the PID of PMT-TSP. Therefore, PID (“0x0303”) of PMT_TS S33 is acquired. Ρ ΜΤ PMT 33 C in TSP 33 includes V— TSP 30 PID (“0x0 0 2 0”) and A—TSP 31 PID (“0 x 0 0 2 1”). Is described. By obtaining the packets to which those PIDs are assigned, V_TSP30 and A-TSP31 are obtained.
トランスポートストリームは、 パケッ ト構造を保持した状態で B The transport stream is transmitted with B while maintaining the packet structure.
D等の記録媒体に記録される。 例えば、 国際公開第 0 1 / 048 9 3号パンフレツトには、 MP EG 2映像のトランスポートストリー ムを記録媒体に記録する技術が記載されている。 なお、 受信された トランスポートストリームに到着タイムスタンプが付加されて記録 媒体に記録される場合がある。 図 8 ( a) 〜 (c ) は、 タイムス夕 ンプつきの T S 3 5のデータ構造を示す。 図 8 (a) は、 オブジェ クトユニット (TTOBU) 3 6に格納されたビデオ T Sパケット (V— T S P T) 3 7およびオーディオ T Sパケット (A— T S P T) 3 8を示す。 図 8 (b) および ( c ) は、 それぞれビデオ T S バケツ ト 3 7およびオーディォ T Sバケツ ト 3 8のデータ構造を示 す。 先頭の 4バイ トがタイムスタンプ 3 7 aおよび 3 8 aであり、 次の 1 8 8バイトが受信した各 T Sバケツトである。 It is recorded on a recording medium such as D. For example, WO 01/04893 pamphlet describes a technique for recording a transport stream of MPEG2 video on a recording medium. In addition, received In some cases, an arrival time stamp is added to a transport stream and recorded on a recording medium. Figures 8 (a) to 8 (c) show the data structure of TS35 with a time stamp. FIG. 8A shows a video TS packet (V-TSPT) 37 and an audio TS packet (A-TSPT) 38 stored in an object unit (TTOBU) 36. FIGS. 8B and 8C show the data structures of the video TS bucket 37 and the audio TS bucket 38, respectively. The first four bytes are timestamps 37a and 38a, and the next 188 bytes are each received TS bucket.
データ処理装置 9 0においてプログラムストリームがトランスポ —トストリームに変換される際、 まず P S→P E S変換部 24 3が P Sを一旦パケット化エレメン夕リストリーム (P E S) に変換し、 その後、 P E S→T S変換部 242が P E Sを T Sに変換する。 こ のような処理は、 例えば、 日本国特開平 1 0— 243 3 94号公報 に記載されている。  When the program stream is converted into a transport stream in the data processing device 90, the PS → PES converter 243 first converts the PS into a packetized elementary stream (PES), and then converts the PES → TS. Unit 242 converts PES to TS. Such processing is described in, for example, Japanese Patent Application Laid-Open No. 10-243394.
図 9 (a) 〜 (c ) は、 P S 3 9を、 P E S 40を介して一般的 な T S 4 1にストリ一ム変換するときのストリームの対応関係を示 す。 P E S 40の各 P E Sパケットには、 1フレームのデータが格 納されている。 また、 一般的な T S 4 1でも、 1個の P E Sバケツ 卜には 1フレームのデータが格納される。 説明の簡単化のため、 図 にはビデオデータに関する処理のみを示している。 また、 P S 3 9 は、 例えば D V D— V R規格準拠に準拠したストリームである。  FIGS. 9 (a) to 9 (c) show the stream correspondences when stream conversion of PS 39 to general TS 41 via PES 40 is performed. Each PES packet of the PES 40 stores one frame of data. Further, even in the general TS 41, one frame of data is stored in one PES bucket. For simplicity of explanation, the figure shows only the processing for video data. The PS 39 is a stream conforming to, for example, the DVD-VR standard.
図 9 (a) に示すように、 まず、 P S 3 9の各ビデオパックから ビデオデータ部分 3 9 a〜 3 9 cが抽出される。 これらはビデオの 1フレーム単位でまとめられて、 図 9 (b) に示すビデオ P E Sパ ケットのペイ口一ド 40 bが構成される。 ペイロード 40 bに P E Sヘッダ 40 aが付加されると、 P E S 40の 1ビデオ P E Sパケ ットが得られる。 First, as shown in Fig. 9 (a), from each video pack of PS 39 Video data portions 39a to 39c are extracted. These are grouped in one frame unit of the video to constitute the pay mouth 40b of the video PES packet shown in FIG. 9 (b). When the PES header 40a is added to the payload 40b, one video PES packet of the PES 40 is obtained.
図 9 ( c ) の T S 4 1のビデオ T Sパケットは、 例えば、 P E S 40を 1 84バイ ト単位で分割したデ一タ 4 1 bに、 4バイ トの T Sヘッダ 4 1 aが付加されて構成される。 T S 4 1には、 PAT、 PMT等を含む T Sパケッ ト (図示せず) も新たに生成され挿入さ れる。  The video TS packet of TS 41 in FIG. 9C is configured by, for example, adding a 4-byte TS header 41 a to data 41 b obtained by dividing PES 40 in units of 184 bytes. Is done. A TS packet (not shown) including a PAT, a PMT, and the like is newly generated and inserted into the TS 41.
ところが、 従来の装置では、 プログラムストリームからトランス ポートストリームへ変換する処理に非常に時間がかかるという問題 が生じていた。  However, the conventional device has a problem that it takes a very long time to convert a program stream into a transport stream.
その第 1の理由は、 従来の変換処理では、 デコーダが動作するた めに基準とする時刻情報 (プログラムクロックリファレンス ; P C R) がトランスポートストリームに付加し直されていたからである。 すなわち、 トランスポートストリームは、 トランスポートストリー ムのシステムターゲットでコーダモデル (T— S TD) に準拠した 音声ノ映像データの多重化ストリ一ムとして構築される必要があり、 多重化のタイミングゃ順序を変更してプログラムクロックリファレ ンス (P CR) の値を算出することを要するからである。 また、 ト ランスポートストリームには、 ストリーム特有のパケット (PAT — T S P、 PMT T S P、 P C R T S P等) を例えば 1 0 0ミ リ秒以下の間隔で挿入する必要があるため、 やはり音声/映像デー 夕を多重化するタイミングゃ順序を変更する必要がある。 The first reason is that, in the conventional conversion processing, time information (program clock reference; PCR) used as a reference for the operation of the decoder is added back to the transport stream. In other words, the transport stream needs to be constructed as a multiplexing stream of audio / video data conforming to the coder model (T-STD) at the system target of the transport stream. It is necessary to calculate the value of the program clock reference (PCR) by changing. In the transport stream, stream-specific packets (PAT-TSP, PMT TSP, PCRTSP, etc.) are stored in, for example, 100 Since it is necessary to insert them at intervals of less than one second, it is necessary to change the timing and order of multiplexing audio / video data.
第 2の理由は、 トランスポートストリームの P E Sパケットのぺ ィロードに 1フレーム分のデータが格納される場合には、 P Sから P E Sへの変換時に、 P Sの各パックを走査して 1フレームごとの 境界を探索しなければならないからである。 例えば D V D— V R規 格に準拠したプログラムストリームを、 1フレームのデ一夕が 1個 の P E Sパケッ 卜に格納される一般的なトランスポートストリーム に変換するとき、 音声 Z映像ストリームを全てスキャンして各音声 /映像フレームの開始位置およびデ一夕サイズを検出し、 各フレ一 ムの開始位置に P E Sバケツトヘッダを付与して P E Sバケツト化 する必要がある。 さらに、 P E Sパケッ ト化に際しては、 全ての音 声 Z映像フレームに付与されているとは限らない P T Sおよび D T Sを、 全ての音声 Z映像フレームの P E Sパケッ トヘッダに付与す る必要がある。  The second reason is that when one frame of data is stored in the PES packet payload of the transport stream, when converting from PS to PES, each pack of PS is scanned and the boundary for each frame is scanned. Must be searched. For example, when converting a program stream conforming to the DVD-VR standard to a general transport stream in which one frame of data is stored in one PES packet, all audio and Z video streams are scanned. It is necessary to detect the start position and the data size of each audio / video frame, and add a PES bucket header to the start position of each frame to make a PES bucket. Further, when forming a PES packet, it is necessary to add PTS and DTS which are not always added to all audio Z video frames to the PES packet header of all audio Z video frames.
本発明は、 上記問題点に鑑みてなされたものであり、 その目的と するところは、 トランスポートストリームに容易に変換可能なデー 夕構造を有するプログラムストリームを提供することにある。 発明の開示  The present invention has been made in view of the above problems, and has as its object to provide a program stream having a data structure that can be easily converted to a transport stream. Disclosure of the invention
本発明によるデータ処理装置は、 複数のフレームを含む映像およ び音声の少なくとも一方の信号が入力される信号入力部と、 受け取 つた前記信号を圧縮符号化して、 符号化データを生成する圧縮部と、 前記符号化データを分割して一定のデ一夕サイズを有する 1以上の パケットを生成し、 前記符号化データの再生を制御する制御情報を 格納した制御パケッ 卜を付加して、 データストリームを生成するス トリーム組立部とを有している。 前記ストリーム組立部は、 各フレ ームについて、 前記データストリーム内の格納位置を示す位置情報 を生成して、 前記制御情報として前記制御バケツトに記述する。 A data processing apparatus according to the present invention includes: a signal input unit to which at least one of a video signal and an audio signal including a plurality of frames is input; When, The encoded data is divided to generate one or more packets having a certain data size, and a control packet storing control information for controlling reproduction of the encoded data is added to generate a data stream. And a stream assembly part. The stream assembling unit generates position information indicating a storage position in the data stream for each frame, and describes the position information in the control bucket as the control information.
ある好ましい実施形態において、 前記ストリーム組立部は、 さら に各フレームの表示のタイミングを示す時刻情報を生成して、 前記 制御情報として前記制御バケツトに記述する。  In a preferred embodiment, the stream assembling unit further generates time information indicating a display timing of each frame, and describes the time information as the control information in the control bucket.
ある好ましい実施形態において、 前記ストリーム組立部は、 さら に各フレームの復号化の夕イミングを示す時刻情報を生成して、 前 記制御情報として前記制御パケットに記述する。  In a preferred embodiment, the stream assembling unit further generates time information indicating the timing of decoding of each frame, and describes the time information in the control packet as the control information.
ある好ましい実施形態において、 前記ストリーム組立部は、 さら に各フレームのデータサイズを示すサイズ情報を生成して、 前記制 御情報として前記制御パケッ卜に記述する。  In a preferred embodiment, the stream assembling unit further generates size information indicating a data size of each frame, and describes the size information in the control packet as the control information.
ある好ましい実施形態において、 前記ストリーム組立部は、 前記 制御バケツト内の、 任意の情報を記述可能なフィールドに前記制御 情報を記述する。  In a preferred embodiment, the stream assembler describes the control information in a field in the control bucket in which arbitrary information can be described.
ある好ましい実施形態において、 前記ストリーム組立部は、 前記 制御バケツ卜として制御パックを生成し、 前記制御パックを付加し て、 前記デ一タストリームとしてプログラムストリームを生成する。 本'発明によるデータ処理方法は、 複数のフレームを含む映像およ び音声の少なくとも一方の信号を入力するステップと、 受け取った 前記信号を圧縮符号化して、 符号化データを生成するステップと、 前記符号化データを分割して一定のデータサイズを有する 1以上の パケッ トを生成するステップと、 前記 1以上のパケットに、 前記符 号化データの再生を制御する制御情報を格納した制御パケッ トを付 加して、 デ一タストリームを生成するステップを包含する。 データ ストリームを生成するステップは、 各フレームについて、 前記デー タストリーム内の格納位置を示す位置情報を生成して、 前記制御情 報として前記制御バケツトに記述する。. In a preferred embodiment, the stream assembler generates a control pack as the control bucket, and adds the control pack to generate a program stream as the data stream. The data processing method according to the present invention includes the steps of: inputting at least one of video and audio signals including a plurality of frames; Compressing and encoding the signal to generate encoded data; dividing the encoded data to generate one or more packets having a fixed data size; The method includes a step of adding a control packet storing control information for controlling the reproduction of the encoded data to generate a data stream. The step of generating a data stream includes generating, for each frame, position information indicating a storage position in the data stream, and describing the position information in the control bucket as the control information. .
ある好ましい実施形態において、 前記デ一タストリームを生成す るステツプは、 各フレームの表示のタイミングを示す時刻情報を生 成して、 前記制御情報として前記制御パケットに記述するステップ をさらに包含する。  In a preferred embodiment, the step of generating the data stream further includes a step of generating time information indicating a display timing of each frame and describing the time information as the control information in the control packet.
ある好ましい実施形態において、 前記デ一タストリームを生成す るステツプは、 各フレームの復号化の夕イミングを示す時刻情報を 生成して、 前記制御情報として前記制御バケツ 卜に記述するステツ プをさらに包含する。  In a preferred embodiment, the step of generating the data stream further includes a step of generating time information indicating the timing of decoding each frame, and describing the control information as the control information in the control bucket. Include.
ある好ましい実施形態において、 前記データストリームを生成す るステツプは、 各フレームのデータサイズを示すサイズ情報を生成 して、 前記制御情報として前記制御パケットに記述するステップを さらに包含する。  In a preferred embodiment, the step of generating the data stream further includes a step of generating size information indicating a data size of each frame and describing the size information as the control information in the control packet.
ある好ましい実施形態において、 前記データストリームを生成す るステップは、 前記制御パケット内の、 任意の情報を記述可能なフ ィールドに前記制御情報を記述する。 ある好ましい実施形態において、 前記データストリームを生成す るステップは、 前記制御バケツ卜として制御パックを生成し、 前記 制御パックを付加して、 前記データストリームとしてプログラムス トリ一ムを生成する。 In a preferred embodiment, the step of generating the data stream describes the control information in a field in the control packet in which arbitrary information can be described. In a preferred embodiment, the step of generating the data stream includes generating a control pack as the control bucket, adding the control pack, and generating a program stream as the data stream.
本発明によるデータ処理方法は、 第 1のデータストリームを第 2 のデータストリームに変換する際に使用される。 ここで、 前記第 1 のデータストリ一ムは、 第 1のデータサイズを有するバケツトであ つて、 複数のフレームを含む映像および音声の少なくとも一方の信 号を圧縮符号化した符号化データを含む 1以上のバケツトと、 前記 符号化データの再生に関する制御情報が格納された制御パケッ トと を有する。 また、 前記第 2のデ一タストリームは、 前記第 1のデー 夕サイズとは異なる第 2のデータサイズを有する 1以上のバケツ ト を有する。 このデータ処理方法は、 前記制御パケットから、 前記デ 一夕ストリームにおける各フレームの格納位置を示す位置情報およ び再生夕イミングを示す時刻情報を含む前記制御情報を取り出すス テツプと、 前記制御情報に基づいて、 各パケット内の前記符号化デ 一夕が、 フレームの先頭部分を含むか否かを判断するステツプと、 前記フレームの先頭部分を含む場合には、 前記第 2のデータストリ ームの再生タイミングを示す時刻情報を前記フレームの先頭部分の 前に付加して、 前記符号化データを分割して前記パケットに格納し、 前記フレームの先頭部分を含まない場合には、 前記符号化データを 分割して前記バケツ卜に格納して、 前記第 2のデータストリームを 生成するステップとを包含する。 本発明による他のデータ処理装置は、 複数のフレームを含む映像 および音声の少なくとも一方の信号が入力される信号入力部と、 受 け取った前記信号を圧縮符号化して、 符号化データを生成する圧縮 部と、 前記符号化データを分割して一定のデータサイズを有するパ ケッ トを生成し、 前記バケツ トを並べて第 1のデータストリーム を生成するストリーム組立部とを有する。 前記ストリーム組立部は、 全てのバケツ トに対して復号のタイミングを示す第 1の時刻情報 を生成し、 さらに一部のバケツ トに対して所定のタイミングで第 1の時刻情報の時刻よりも遅い時刻を示す第 2の時刻情報を生成し て、 前記第 1の時刻情報および前記第 2の時刻情報の一方を各パケ ッ トに記述する。 The data processing method according to the present invention is used when converting a first data stream into a second data stream. Here, the first data stream is a bucket having a first data size and includes coded data obtained by compression-coding at least one of video and audio signals including a plurality of frames. It has the above-mentioned bucket and a control packet in which control information on the reproduction of the encoded data is stored. Further, the second data stream has one or more buckets having a second data size different from the first data size. The data processing method includes: a step of extracting, from the control packet, the control information including position information indicating a storage position of each frame in the data stream and time information indicating reproduction timing, and the control information. A step of determining whether or not the encoded data in each packet includes a head portion of a frame, and if the encoded data portion includes a head portion of the frame, the second data stream. Time information indicating the playback timing of the frame is added before the beginning of the frame, the encoded data is divided and stored in the packet, and if the beginning of the frame is not included, the encoded data is And storing the divided data in the bucket to generate the second data stream. Another data processing apparatus according to the present invention includes: a signal input unit to which at least one of a video signal and an audio signal including a plurality of frames is input; and compression encoding of the received signal to generate encoded data. A compression unit; and a stream assembling unit that divides the encoded data to generate a packet having a fixed data size, and arranges the bucket to generate a first data stream. The stream assembling section generates first time information indicating the decoding timing for all buckets, and further delays some of the buckets at a predetermined timing later than the time of the first time information. Second time information indicating time is generated, and one of the first time information and the second time information is described in each packet.
ある好ましい実施形態において、 前記ストリーム組立部は、 前記 第 1のデータストリームと異なる第 2のデータストリームのバケツ トのデータサイズに基づいて第 2の時刻情報を生成する。 ある好ましい実施形態において、 前記ストリーム組立部は、 1 0In a preferred embodiment, the stream assembler generates the second time information based on a data size of a bucket of a second data stream different from the first data stream. In a preferred embodiment, the stream assembler includes: 10
0ミリ秒以内に 1回のタイミングで前記第 2の時刻情報を生成する。 ある好ましい実施形態において、 前記ストリーム組立部は、 前記 データストリームの映像再生時間に基づいて複数のバケツトを 1つ のュニットとして関連付け、 前記ュニッ 卜の先頭に映像バケツ卜が 現れるタイミングで前記第 2の時刻情報を生成する。 The second time information is generated at a timing within 0 ms. In a preferred embodiment, the stream assembling unit associates a plurality of buckets as one unit based on a video playback time of the data stream, and the second bucket at a timing at which a video bucket appears at the head of the unit. Generate time information.
ある好ましい実施形態において、 前記データ処理装置は、 前記第 1のデータストリームを記録媒体に記録する記録部を有する。  In a preferred embodiment, the data processing device includes a recording unit that records the first data stream on a recording medium.
ある好ましい実施形態において、 他のデータ処理装置は、 前記記 録媒体に記録された前記第 1のデータストリームを前記第 2のデ一 夕ストリームに変換する。 デ一夕処理装置は、 前記パケットを 1以 上の前記パケットに変換する変換部を有する。 変換部は、 前記第 2 の時刻情報が記述されたバケツ トを変換したパケットの前に、 前記 符号化データを含むバケツ トを特定するための制御パケットを揷入 する。 In a preferred embodiment, the other data processing device is as described above. The first data stream recorded on the recording medium is converted into the second data stream. The data processing device has a conversion unit that converts the packet into one or more packets. The conversion unit inserts a control packet for specifying a bucket including the encoded data before the packet obtained by converting the bucket in which the second time information is described.
本発明によるさらに他のデータ処理装置は、 複数のフレームを含 む映像および音声の少なくとも一方の信号が入力される信号入力部 と、 受け取った前記信号を圧縮符号化して、 符号化データを生成す る圧縮部と、 前記符号化データを分割して第 1のデータサイズを有 するバケツ卜を生成し、 前記バケツトを並べて第 1のデータストリ ームを生成するストリーム組立部とを有する。 前記ストリーム組立 部は、 一部のパケット内にパディングパケットを設け、 前記パディ ングバケツトのデータサイズを前記第 1のデータストリームと異な る第 2のデータストリー厶のパケットのデータサイズに基づいて決 定する。  Still another data processing device according to the present invention includes a signal input unit to which at least one of a video signal and an audio signal including a plurality of frames is input, and compression-encodes the received signal to generate encoded data. And a stream assembling unit that divides the encoded data to generate a bucket having a first data size, and arranges the buckets to generate a first data stream. The stream assembler provides padding packets in some of the packets, and determines a data size of the padding bucket based on a data size of a packet of a second data stream different from the first data stream. .
ある好ましい実施形態において、 前記ストリーム組立部は、 1 0 0ミリ秒以内に 1回の夕イミングで、 前記パディングバケツ トを有 するバケツトを設ける。  In a preferred embodiment, the stream assembler provides the bucket having the padding bucket at one time within 100 milliseconds.
ある好ましい実施形態において、 前記データ処理装置は、 前記第 1のデータストリームを記録媒体に記録する記録部を有する。  In a preferred embodiment, the data processing device includes a recording unit that records the first data stream on a recording medium.
ある好ましい実施形態において、 他のデータ処理装置は、 前記記 録媒体に記録された前記第 1のデ一タストリームを前記第 2のデー タストリームに変換する。 データ処理装置は、 前記パケットを 1以 上の前記パケットに変換する変換部を有する。 変換部は、 前記パデ ィングバケツ 卜が設けられたバケツトを変換する際に、 前記パディ ングバケツトを、 前記符号化データを含むパケットを特定するため の制御パケットに変換する。 図面の簡単な説明 In a preferred embodiment, the other data processing device converts the first data stream recorded on the recording medium into the second data stream. To stream. The data processing device has a conversion unit that converts the packet into one or more packets. When converting the bucket provided with the padding bucket, the conversion unit converts the padding bucket into a control packet for specifying a packet including the encoded data. BRIEF DESCRIPTION OF THE FIGURES
図 1は、 従来のデ一夕処理装置 9 0のブロック図である。  FIG. 1 is a block diagram of a conventional data processing apparatus 90.
図 2は、 プログラムストリーム 2 0のデータ構造の例を示す図で ある。  FIG. 2 is a diagram showing an example of the data structure of the program stream 20.
図 3は、 プログラムストリーム 2 0と光ディスク 1 3 1の記録領 域との関係を示す図である。  FIG. 3 is a diagram showing the relationship between the program stream 20 and the recording area of the optical disc 13 1.
図 4は、 記録されたデータが光ディスク 1 3 1のファイルシステ ムにおいて管理されている状態を示す図である。  FIG. 4 is a diagram showing a state in which recorded data is managed in the file system of the optical disc 13 1.
図 5は、 DVD— VR規格に準拠したプログラムストリーム 2 5 のデータ構造の例を示す図である。  FIG. 5 is a diagram showing an example of the data structure of the program stream 25 conforming to the DVD-VR standard.
図 6は、 トランスポートストリーム 2 8のデ一タ構造の例を示す 図である。  FIG. 6 is a diagram showing an example of the data structure of the transport stream 28.
図 7は、 V— T S P 3 0のデータ構造を示し、 図 7 (b) は A— T S P 3 1のデータ構造を示す図であり、 図 7 ( c ) は PAT— T S P 3 2のデータ構造を示す図であり、 図 7 (d) は PMT— TS P 3 3のデータ構造を示し、 図 7 ( e ) は P C R— T S P 34のデ 一夕構造を示す図である。 図 8は、 (a) は、 オブジェクトユニット (TTOBU) 3 6に 格納されたビデオ T Sパケット (V— TS P T) 3 7およびオーデ ィォ T Sパケット (A— T S P T) 3 8を示す図であり、 (b) お よび (c) は、 それぞれビデオ T Sパケット 3 7およびオーディオ T Sパケット 3 8のデータ構造を示す図である。 Fig. 7 shows the data structure of V-TSP30, Fig. 7 (b) shows the data structure of A-TSP31, and Fig. 7 (c) shows the data structure of PAT-TSP32. FIG. 7 (d) shows the data structure of PMT-TSP33, and FIG. 7 (e) shows the data structure of PCR-TSP34. FIG. 8A is a diagram showing a video TS packet (V—TSPT) 37 and an audio TS packet (A—TSPT) 38 stored in an object unit (TTOBU) 36, (B) and (c) are diagrams illustrating the data structures of a video TS packet 37 and an audio TS packet 38, respectively.
図 9 (a) 〜 (c) は、 D VD— VR規格準拠の P S 3 9から、 P E S 40を介して 1フレームのデ一夕が 1個の P E Sバケツトに 格納される一般的な T S 4 1にストリ一ム変換するときのストリ一 ムの対応関係を示す図である。  Figures 9 (a) to 9 (c) show a general TS 41 where one frame of data is stored in one PES bucket from the PS 39 conforming to the DVD-VR standard via the PES 40. FIG. 4 is a diagram showing a correspondence relationship between streams when stream conversion is performed.
図 1 0は、 第 1の実施形態によるデータ処理装置 1 0のブロック 図である。  FIG. 10 is a block diagram of the data processing device 10 according to the first embodiment.
図 1 1 (a) は、 P Sをデコードする MP E G 2 P Sデコーダ 1 7 1のブロック図であり、 図 1 1 (b) は、 TSをデコードする T Sデコーダモデルのブロック図である。  FIG. 11A is a block diagram of an MPEG2PS decoder 171 for decoding PS, and FIG. 11B is a block diagram of a TS decoder model for decoding TS.
図 1 2は、 データ処理装置 1 0の P S組立部 1 04が生成した P Fig. 12 shows the Ps generated by the PS assembly 104 of the data processor 10.
S 5 0と、 P S 5 0に基づいて変換された T S 5 5との対応関係を 示す図である。 FIG. 10 is a diagram showing a correspondence relationship between S 50 and T S55 converted based on P S 50.
図 1 3は、 P Sの各パックに含まれるパックヘッダのデータ構造 を示す図である。  FIG. 13 is a diagram showing a data structure of a pack header included in each pack of the PS.
図 1 4は、 S C Rギャップの位置を模式的に示す図である。 図 1 5は、 VOBUの途中に 1 0 0ミリ秒以内で繰り返し設けら れた S CRギャップを模式的に示す図である。  FIG. 14 is a diagram schematically showing the position of the SCR gap. FIG. 15 is a diagram schematically showing an SCR gap repeatedly provided within 100 ms in the middle of a VOBU.
図 1 6は、 D VD— VR規格に準拠した P Sに設定した S C Rギ ャップを模式的に示す図である。 Figure 16 shows an SCR channel set to a PS compliant with the DVD-VR standard. It is a figure which shows a cap typically.
図 1 7は、 P S組立部 1 04がプログラムストリームの S CRを 設定する際の処理の手順を示す図である。  FIG. 17 is a diagram showing a processing procedure when the PS assembling unit 104 sets the SCR of the program stream.
図 1 8は、 変換部 142において実行される、 ? から丁 への 変換処理の手順を示す図である。  FIG. 18 shows the processing executed by the conversion unit 142. It is a figure which shows the procedure of the conversion process from to.
図 1 9は、 各パックに対する末尾 S C Rを示す図である。  FIG. 19 is a diagram showing the end SCR for each pack.
図 2 0は、 実施形態 2によるデータ処理装置 1 0の P S組立部 1 04が生成した P S 5 9— 1と、 P S 5 9— 1に基づいて変換され た T S 5 9— 2との対応関係を示す図である。  FIG. 20 shows a correspondence relationship between PS 59-1 generated by PS assembling section 104 of data processing apparatus 10 according to Embodiment 2 and TS 59-2 converted based on PS 59-1. FIG.
図 2 1は、 ビデオパック 6 1に含まれるパディングパケット 6 1 aのデータ構造を示す図である。  FIG. 21 is a diagram showing the data structure of the padding packet 61 a included in the video pack 61.
図 22は、 1 0 0ミリ秒以内で繰り返し設けられたパディングパ ケットを含むビデオパック 6 5、 6 6を模式的に示す図である。 図 2 3 (a) は、 本実施形態による P S組立部 1 04により生成 されたプログラムストリームのデ一夕構造を示す図であり、 図 2 3 (b) は、 ビデオ用補助情報 6 7 dの詳細なデータ構造を示す図で ある。  FIG. 22 is a diagram schematically showing video packs 65 and 66 including padding packets repeatedly provided within 100 milliseconds. FIG. 23 (a) is a diagram showing a data structure of a program stream generated by the PS assembling unit 104 according to the present embodiment, and FIG. 23 (b) is a diagram showing video auxiliary information 67 d. FIG. 3 is a diagram showing a detailed data structure.
図 24は、 VO B U# iの先頭を 0として算出したときの、 Iフ レーム、 B 1フレームおよび B 2フレームの開始ァドレスを模式的 に示す図である。  FIG. 24 is a diagram schematically showing start addresses of the I frame, the B1 frame, and the B2 frame when the start of VOBU # i is calculated as 0.
図 2 5は、 変換部 1 42が P Sを T Sに変換する処理の手順を示 す図である。  FIG. 25 is a diagram illustrating a procedure of a process in which the conversion unit 142 converts PS into TS.
図 2 6 (a) は、 補助情報フィールド 7 0にサイズ情報を規定し たメーカ拡張フィールド 6 9を示す図であり、 図 2 6 (b) は、 補 助情報フィールド 7 0のデータ構造を示す図である。 発明を実施するための最良の形態 Figure 26 (a) shows the size information specified in the auxiliary information field 70. FIG. 26 (b) is a diagram showing a data structure of the auxiliary information field 70. FIG. BEST MODE FOR CARRYING OUT THE INVENTION
以下、 添付の図面を参照しながら、 本発明のデータ処理装置の各 実施形態を説明する。  Hereinafter, embodiments of the data processing device of the present invention will be described with reference to the accompanying drawings.
(実施形態 1 )  (Embodiment 1)
図 1 0は、 本発明の第 1の実施形態によるデータ処理装置 1 0の 機能ブロックの構成を示す。 データ処理装置 1 0は、 DVD— RA Mディスク、 B l u— r a yディスク (BD) 等の相変化光ディス ク 1 3 1にリアルタイムでデ一タストリームを記録し、 記録された デ一夕ストリ一ムを再生することができる。  FIG. 10 shows a functional block configuration of the data processing device 10 according to the first embodiment of the present invention. The data processor 10 records a data stream in real time on a phase-change optical disc 131, such as a DVD-RAM disc or a Blu-ray disc (BD), and records the recorded data in a stream. System can be played.
デ一夕処理装置 1 0はさらに、 生成し、 または記録したプロダラ ムストリ一ム (P S) を MP E G 2 トランスポ一トス卜リ一ム (T S) に変換して、 I E E E 1 3 94インタ一フェース部 1 40を介 して出力することができる。  The data processor 10 further converts the generated or recorded program stream (PS) into an MPEG2 transport stream (TS), and converts the stream into an IEEE 1394 interface section. It can be output via 140.
以下、 データ処理装置 1 0の記録機能に関する構成を説明する。 データ処理装置 1 0は、 映像信号入力部 1 0 0と、 音声信号入力部 1 0 2と、 MP EG 2 P Sエンコーダ 1 7 0と、 記録部 1 2 0と、 連続データ領域検出部 1 6 0と、 記録制御部 1 6 1と、 論理ブロッ ク管理部 1 6 3とを有する。  Hereinafter, the configuration related to the recording function of the data processing device 10 will be described. The data processing device 10 includes a video signal input unit 100, an audio signal input unit 102, an MPEG2 PS encoder 170, a recording unit 120, and a continuous data area detection unit 160. And a recording control unit 161, and a logical block management unit 163.
映像信号入力部 1 0 0は映像信号入力端子であり、 映像データを 表す映像信号を受け取る。 音声信号入力部 1 0 2は音声信号入力端 子であり、 音声データを表す音声信号を受け取る。 例えば、 データ 処理装置 1 0がポータブルビデオコーダである場合には、 映像信号 入力部 1 0 0および音声信号入力部 1 0 2は、 それぞれチューナ部 (図示せず) の映像出力部および音声出力部と接続され、 それぞれ から映像信号および音声信号を受け取る。 また、 データ処理装置 1 0がムービーレコーダ、 カムコーダ等である場合には、 映像信号入 力部 1 0 0および音声信号入力部 1 0 2は、 それぞれカメラの C C D (図示せず) およびマイクから出力された映像信号および音声信 号を受け取る。 The video signal input unit 100 is a video signal input terminal, and receives a video signal representing video data. Audio signal input section 102 is audio signal input terminal Child and receives audio signals representing audio data. For example, when the data processing device 10 is a portable video coder, the video signal input unit 100 and the audio signal input unit 102 are respectively a video output unit and an audio output unit of a tuner unit (not shown). Connected to and receives video and audio signals from each. When the data processing device 10 is a movie recorder, camcorder, or the like, the video signal input unit 100 and the audio signal input unit 102 output from a camera CCD (not shown) and a microphone, respectively. The received video and audio signals are received.
MP E G 2— P Sエンコーダ 1 7 0 (以下、 「エンコーダ 1 7 0」 と称する) は、 映像信号および音声信号を受け取り、 後述する 本発明の処理を行って、 図 2に示す MP EG 2プログラムストリー ム (P S) 、 または、 図 5に示す D VD— VR規格に準拠した P S を生成する。 エンコーダ 1 7 0は、 映像圧縮部 1 0 1と、 音声圧縮 部 1 0 3と、 P S組立部 1 04とを有する。 映像圧縮部 1 0 1およ び音声圧縮部 1 0 3は、 それぞれ映像信号および音声信号を MP E G 2規格に基づいて圧縮符号化して映像データおよび音声データを 生成する。 P S組立部 1 04は、 映像データと音声データを、 それ ぞれ 2キロバイ ト単位のパック V— P CK及び A— P CKに分割し、 この 2種類のパックが一つの VO B Uを構成するよう順番に並べる とともに、 R D Iパック 2 7を付加する。  MP EG 2—PS encoder 170 (hereinafter, referred to as “encoder 170”) receives the video signal and the audio signal, performs the processing of the present invention described later, and outputs the MP EG 2 program stream shown in FIG. (PS) or a PS that conforms to the DVD-VR standard shown in Figure 5. The encoder 170 has a video compression unit 101, an audio compression unit 103, and a PS assembling unit 104. The video compression unit 101 and the audio compression unit 103 compress and encode the video signal and the audio signal, respectively, based on the MPEG2 standard to generate video data and audio data. The PS assembling section 104 divides the video data and audio data into packs of 2 KB each, V-P CK and A-P CK, so that these two types of packs constitute one VO BU. Arrange them in order and add RDI Pack 27.
記録部 1 2 0は、 記録制御部 1 6 1の指示に基づいて'ピックアツ プ 1 3 0を制御し、 記録制御部 1 6 1から指示'された論理ブロック 番号の位置から P Sのビデオオブジェクトユニット (V O B U ) 2 6を記録する。 このとき、 記録部 1 2 0は、 各 V O B Uを 3 2 Kバ ィ ト単位に分割し、 その単位で誤り訂正符号を付加して一つの論理 プロックとして光ディスク 1 3 1上に記録する。 一つの論理ブロッ クの途中で一つの V O B Uの記録が終了した場合は、 隙間を開ける ことなく次の V O B Uの記録を連続的に行う。 P Sは、 例えば図 4 に示すような形態で光ディスク 1 3 1に格納されている。 The recording unit 120 controls the 'pickup 130' based on the instruction of the recording control unit 161, and the logical block instructed by the recording control unit 161 '. The PS video object unit (VOBU) 26 is recorded from the position of the number. At this time, the recording unit 120 divides each VOBU into 32 K-byte units, adds an error correction code in each unit, and records the logical unit as one logical block on the optical disc 13 1. If the recording of one VOBU is completed in the middle of one logical block, the recording of the next VOBU is performed continuously without opening a gap. The PS is stored on the optical disk 131, for example, in a form as shown in FIG.
連続データ領域検出部 1 6 0は、 論理ブロック管理部 1 6 3によ つて管理される光ディスク 1 3 1のセクタの使用状況を調べ、 連続 した空き論理ブロック領域を検出する。  The continuous data area detection section 160 checks the use status of the sectors of the optical disk 131 managed by the logical block management section 163, and detects continuous free logical block areas.
記録制御部 1 6 1は、 記録部' 1 2 0の動作を制御する。 記録制御 部 1 6 1は、 予め連続データ領域検出部 1 6 0に指示を出して、 連 続した空き論理ブロック領域を検出させておく。 そして、 記録制御 部 1 6 1は、 論理ブロック単位の書き込みが発生するたびに当該論 理ブロック番号を記録部 1 2 0に通知し、 論理ブロックが使用済み になった場合には論理ブロック管理部 1 6 3に通知する。 なお、 記 録制御部 1 6 1は、 連続デ一夕領域検出部 1 6 0に対して連続した 空き論理プロック領域のサイズを動的に検出させてもよい。  The recording control unit 16 1 controls the operation of the recording unit '120. The recording controller 161 issues an instruction to the continuous data area detector 160 in advance to detect a continuous free logical block area. The recording control unit 16 1 notifies the recording unit 120 of the logical block number each time a logical block unit is written, and when the logical block is used, the logical block management unit Notify 1 6 3 Note that the recording control unit 161 may cause the continuous data area detecting unit 1660 to dynamically detect the size of a continuous free logical block area.
論理ブロック管理部 1 6 3は、 記録制御部 1 6 1から通知された 使用済み論理プロック番号によって論理プロック番号ごとの使用状 況を把握して管理を行う。 すなわち、 論理ブロック番号を構成する 各セクタ単位の使用状況を、 U D Fもしくは I S0/IEC 13346のファ ィル構成で規定されているスペースビッ トディスクリプ夕領域を用 いて、 使用済みもしくは未使用であるかを記録して管理することに なる。 そして、 記録処理の最終段階において、 F I D及びファイル エントリをディスク上のファイル管理領域へ書き込む。 The logical block management unit 163 manages the usage status of each logical block number based on the used logical block number notified from the recording control unit 161. In other words, the usage status of each sector unit that constitutes a logical block number is determined by using the UDF or the space bit descriptor area specified in the file configuration of IS0 / IEC 13346. Therefore, whether they are used or unused are recorded and managed. Then, in the final stage of the recording process, the FID and the file entry are written to the file management area on the disk.
以下、 P Sを記録する際のデータ量と再生時間との関係を説明す る。 連続データ領域検出部 1 6 0は、 1つの連続データ領域の残り が最大記録再生レート換算で 3秒分を切った時点で、 次の連続デー 夕領域の再検出を行なう。 そして、 1つの連続データ領域が一杯に なると、 次の連続データ領域に書き込みを行なう。  Hereinafter, the relationship between the data amount and the reproduction time when PS is recorded will be described. The continuous data area detector 160 re-detects the next continuous data area when the remainder of one continuous data area falls below 3 seconds in terms of the maximum recording / reproducing rate. When one continuous data area becomes full, writing is performed to the next continuous data area.
データ処理装置 1 0が記録された P Sを再生するときは、 光ディ スク 1 3 1からのデ一夕の読み出しと読み出したデ一夕のデコード (再生) を並列的に行う。 このとき、 データの最大再生レートより もデータの読出レートの方が高速となるように制御して、 再生すベ きデータが不足しないように動作する。 その結果、 P Sの再生を継 続すると、 単位時間あたり、 デ一夕最大再生レートとデータ読み出 しレー卜とのレート差分だけ再生すべきデータを余分に確保できる ことになる。 デ一タ処理装置 1 0は、 ピックアップ 1 3 0がデータ を読み出しできない期間中 (例えばシーク動作中) に余分に確保し たデータを再生することにより、 途切れのない P Sの再生を実現す ることができる。  When the data processor 10 reproduces the recorded PS, it reads out the data from the optical disc 13 1 and decodes (reproduces) the read out data in parallel. At this time, control is performed so that the data read rate is faster than the maximum data read rate, and the operation is performed so that there is no shortage of data to be reproduced. As a result, if the reproduction of the PS is continued, extra data to be reproduced can be secured per unit time by the rate difference between the maximum reproduction rate and the data read rate. The data processor 10 reproduces extra PS data during the period during which the pickup 130 cannot read data (for example, during a seek operation), thereby realizing seamless PS reproduction. Can be.
例えば、 再生部 1 2 1のデ一夕読み出しレートが 1 1 . 0 8 M b ' p s 、 P S分解部 1 1 4のデータ最大再生レートが 1 0 . 0 8 M b p s、 ピックアップの最大移動時間が 1 . 5秒とすると、 途切れる ことなく P Sを再生するためには、 ピックアップ 1 3 0の移動中に 1 5. 1 2Mビットの余分なデータが必要になる。 これだけのデー 夕を確保するためには、 1 5. 1 2秒間の連続読み出しが必要にな る。 すなわち、 1 5. 1 2 Mビッ トを、 データ読み出しレート 1 1 0 8Mb p sとデータ最大記録再生レ一ト 1 0. 0 8 Mb p sの差 で除算した時間だけ連続読み出しする必要がある。 したがって、 1 5. 1 2秒間の連続データ読み出しの間に最大 1 6 7. 5 3 Mビッ ト分のデ一タ (すなわち 1 6. 6 2秒分の再生データ) を読み出す ことになるので、 1 6. 6 2秒 (約 1 7秒) 分以上の連続データ領 域を確保することにより、 連続的なデ一タ再生を保証することが可 能となる。 なお、 連続データ領域の途中には、 数個の不良論理プロ ックがあってもよい。 ただし、 この場合には、 再生時にかかる不良 論理ブロックを読み込むのに必要な読み出し時間を見越して、 連続 データ領域を再生時間にして 1 6. 6 2秒分よりも若干多く確保す る必要がある。 For example, the data readout rate of the playback unit 121 is 11.08 Mb'ps, the maximum data playback rate of the PS decomposition unit 114 is 10.08 Mbps, and the maximum travel time of the pickup is 1.5 seconds, in order to play the PS without interruption, while moving the pickup 130 15.2 Mbits of extra data is required. In order to secure this much data, it is necessary to read data continuously for 15.2 seconds. In other words, it is necessary to continuously read out 15.2 Mbits for the time obtained by dividing by the difference between the data readout rate of 1108 Mbps and the maximum data recording / reproducing rate of 10.8 Mbps. Therefore, up to 16.753 Mbits of data (ie, 16.62 seconds of reproduced data) is read during 15.2 seconds of continuous data reading. By securing a continuous data area of more than 16.62 seconds (approximately 17 seconds), continuous data reproduction can be guaranteed. Note that there may be several defective logic blocks in the middle of the continuous data area. However, in this case, it is necessary to secure a continuous data area slightly more than 16.62 seconds for the playback time in anticipation of the read time required to read the defective logical block required during playback. .
以上の各構成要素によって、 データ処理装置 1 0の記録機能が実 現される。 なおデータ処理装置 1 0の再生機能に関する構成および 動作は従来のデータ処理装置 9 0と同じであるため、 その説明は省 略する。  The recording function of the data processing device 10 is realized by the above components. Note that the configuration and operation of the data processing device 10 relating to the playback function are the same as those of the conventional data processing device 90, and a description thereof will be omitted.
次に、 データ処理装置 1 0の P Sから TSへのストリーム変換機 能およびそのための構成を説明する。 データ処理装置 1 0は、 1 3 94 I ZF部 140と、 出力タイミング調整部 1 4 1 と、 P S—T S変換部 1 42とを有する。  Next, a stream conversion function from PS to TS of the data processing device 10 and a configuration therefor will be described. The data processing device 10 includes a 1394 IZF unit 140, an output timing adjustment unit 141, and a PS-TS conversion unit 142.
I EE E 1 3 94インタ一フェース規格によって伝送可能なデー 夕形式は T Sに限られているため、 データ処理装置 1 0は P Sから TSへのストリーム変換機能を有する。 ストリーム変換は、 例えば 以下の局面で行われる。 データ処理装置 1 0がカムコーダであると き、 映像および音声は、 P Sとして、 カムコーダに装填された光デ イスク 1 3 1に記録される。 ユーザが I E E E 1 3 94ケーブルを 介してカムコーダと P Cを接続し、 記録内容を P Cに伝送するよう 指示すると、 カムコーダは P Sを T Sに変換する。 これにより、 力 ムコ一ダから P Cに対して T Sが伝送される Data that can be transmitted according to the I EE E 1 394 interface standard Since the evening format is limited to TS, the data processor 10 has a stream conversion function from PS to TS. The stream conversion is performed, for example, in the following aspects. When the data processing device 10 is a camcorder, video and audio are recorded as PS on the optical disk 1331 loaded in the camcorder. When the user connects the camcorder to the PC via the IEEE1394 cable and instructs the recorded content to be transmitted to the PC, the camcorder converts the PS to TS. As a result, TS is transmitted from PC to PC
1 3 94 I ZF部 1 40は、 I EEE 1 3 94インターフエ一ス 規格に基づいて、 デ一夕を出力する端子である。 出力タイミング調 整部 1 4 1は、 T Sの出力タイミングを調整して、 丁 3を 1 3 94 I / F部 1 40に渡す。  The 1394 IZF section 140 is a terminal that outputs data based on the IEEE 1394 interface standard. The output timing adjusting section 14 1 adjusts the output timing of the TS and passes the signal 3 to the 1394 I / F section 140.
? 3→丁3変換部 142 (以下、 「変換部 1 42」 と称する) は、 P Sから TSへのフォーマット変換を行う。 変換部 1 42は、 ピッ クアップ 1 3 0および再生部 1 2 1を介して再生された P S、 また は、 エンコーダ 1 7 0において生成された P Sを受け取って、 T S を生成する。 生成された T Sのデータ構造は、 例えば図 6に示すと おりである。 変換部 142は、 図 6に示す P AT— T S P 3 2、 P MT— T S P 3 3、 P C R— T S P 34等を挿入して、 T Sを生成 する。 これらの TSパケットのデータ構造および機能は、 図 7を参 照しながら説明したとおりである。  The? 3 → 3 conversion unit 142 (hereinafter, referred to as "conversion unit 142") performs format conversion from PS to TS. The conversion unit 142 receives the PS reproduced through the pickup 130 and the reproduction unit 121 or the PS generated by the encoder 170, and generates T S. The data structure of the generated TS is, for example, as shown in FIG. The conversion unit 142 inserts PAT-TSP32, PMT-TSP33, PCR-TSP34, etc. shown in FIG. 6 to generate Ts. The data structures and functions of these TS packets are as described with reference to FIG.
次に、 図 1 1を参照しながら P Sおよび T Sのストリーム特性を 説明し、 その後、 データ処理装置 1 0による P Sの生成処理および P Sから T Sへのデータ変換処理を説明する。 Next, the stream characteristics of the PS and the TS will be described with reference to FIG. The data conversion process from PS to TS will be described.
P Sを生成するエンコーダ 1 7 0は、 一般の MP E G 2 P Sデコ ーダにおいてデコ一ド可能な P Sにェンコ一ドしなければならない。 そのために、 システムエンコード条件と呼ばれる所定の条件が課さ れている。 システムエンコード条件を満足することにより、 P Sは、 一般の MP EG 2 P Sデコーダ 1 7 1がデコード可能なストリーム 特性を有している。 これは T Sについても同様である。  The encoder 170 that generates the PS must encode the PS that can be decoded in a general MPEG2PS decoder. For this purpose, predetermined conditions called system encoding conditions are imposed. By satisfying the system encoding conditions, PS has stream characteristics that can be decoded by a general MPEG2PS decoder 171. This is the same for TS.
図 1 1 (a) は、 P Sをデコードする MP EG 2 P Sデコーダ 1 7 1のブロック図である。 まず、 デコーダ 1 7 1は、 P S分解部 1 1 4と、 映像伸長部 1 1 1と、 音声伸長部 1 1 3とを有する。 これ らの構成は、 プログラムストリーム · システムターゲットデコーダ 一 (P— S TD) と呼ばれるデコーダモデルの構成と概ね同じであ る。  FIG. 11A is a block diagram of an MPEG2PS decoder 171 for decoding PS. First, the decoder 17 1 has a PS decomposition section 114, a video decompression section 111, and an audio decompression section 113. These configurations are almost the same as the configuration of the decoder model called Program Stream / System Target Decoder-1 (P-STD).
P Sは、 パックヘッダに記述された任意のレート (例えば 1 0. 0 8Mb p sという比較的速いレート) で P S分解部 1 1 4のデマ ルチプレクサ 1 1 4 aに入力される。 P Sはデマルチプレクサ 1 1 4 aによって映像データおよび音声データに分離され、 一定レー卜 (ピークレート 1 0. 0 8 Mb p s ) で映像データ用のバッファ B v 1 1 4 bと、 音声データ用のバッファ BA 1 1 4 cに入力される。 このとき、 P Sを構成していたパックヘッダ、 システムヘッダ、 P E Sヘッダ等は除去されて、 各バッファには、 映像データおよび音 声デ一夕からなるエレメンタリストリームが入力される。 映像デー 夕および音声データの各エレメンタリストリームはそれぞれ、 映像 伸長部 1 1 1および音声伸長部 1 1 3においてデコードされ、 非圧 縮の映像ストリームおよび音声ストリ一ムとして出力される。 The PS is input to the demultiplexer 114 a of the PS decomposer 114 at an arbitrary rate described in the pack header (for example, a relatively high rate of 10.0 Mbps). PS is separated into video data and audio data by the demultiplexer 1 1 4 a, a buffer B v 1 1 4 b of the video data at a constant rate Bok (peak rate 1 0. 0 8 Mb ps), for voice data Input to buffer B A 1 1 4c. At this time, the pack header, the system header, the PES header, and the like that constitute the PS are removed, and an elementary stream composed of video data and audio data is input to each buffer. Each of the video and evening data elementary streams is The data is decoded by the decompression unit 111 and the audio decompression unit 113 and output as an uncompressed video stream and audio stream.
一方、 図 1 1 (b) は、 T Sをデコードする T Sデコーダモデル の機能ブロックを示す。 この T Sデコーダモデルは、 いわゆるトラ ンスポートストリーム · システムターゲットデコーダ (T一 S T D) と呼ばれている。 データ処理装置 1 0の変換部 1 42は、 T一 S TDに基づいて構成されている。  On the other hand, FIG. 11 (b) shows functional blocks of a TS decoder model for decoding TS. This TS decoder model is called the so-called transport stream system target decoder (T-STD). The conversion unit 142 of the data processing device 10 is configured based on T-STD.
図 1 1 (b) において、 T Sは、 伝送媒体等の特性に応じた一定 の伝送レー卜でデコーダの P I Dフィルタ 42に入力される。 P I Dフィルタは、 T Sバケツ卜に割り当てられたバケツト識別し P I Dに応じて T Sを映像データ、 音声データ、 システムデータ等に分 離され、 映像データ用のトランスポ一トバッファ TBV43 a、 音 声データ用のトランスポートバッファ TBA4 5 a等に入力される。 映像データはその後、 マルチプレクスバッファ MB v43 b、 エレ メンタリデコーダバッファ EBv43 cを経て、 映像伸長部 44に て映像ストリームにデコードされる。 一方音声データは、 エレメン タリデコーダバッファ E BA4 5 bを経て、 音声伸長部 46にて映 像ストリームにデコードされる。 In FIG. 11B, the TS is input to the PID filter 42 of the decoder at a fixed transmission rate according to the characteristics of the transmission medium and the like. The PID filter identifies the bucket assigned to the TS bucket and separates the TS into video data, audio data, system data, etc. according to the PID.Transport buffer for video data TB V 43a, for audio data Is input to the transport buffer TB A 45 a of the other. Image data is then, after multiplex buffer MB v 43 b, the Jer incrementer predecoder buffer EB v 43 c, and decoded into a video stream Te to the video decompression unit 44. Meanwhile the audio data via the elementary decoder buffer EB A 4 5 b, is decoded movies picture stream by voice decompression section 46.
P I Dフィル夕 42において分離されたデータは、 それぞれ異な るレートで各バッファに入力され、 バッファ間を伝送される。 例え ば、 映像デー夕は、 バッファ 42からバッファ 4 3 aには 1 0. 0 8 M b p sで伝送され、 ノ ッファ 43 aからバッファ 43 bへは 1 8 M b p sで伝送され、 ノ ッファ 43 bからバッファ 43 cへは 1 5Mb s以下で伝送される。 一方、 音声データはバッファ 45 a からバッファ 45 bへ 2Mb p s以下で伝送される。 The data separated in the PID file 42 is input to each buffer at a different rate, and transmitted between the buffers. For example, video data is transmitted from buffer 42 to buffer 43a at 10.0.08 Mbps, from buffer 43a to buffer 43b at 18 Mbps, and buffer 43b From buffer 43 c to 1 Transmitted at 5Mb s or less. On the other hand, audio data is transmitted from the buffer 45a to the buffer 45b at 2Mbps or less.
P Sおよび T Sの各々について、 デコーダ内の伝送レー卜に注目 すると、 P Sの音声データは T Sの音声データよりも速く伝送され る。 また P Sには、 P— S TDのデマルチプレクサ 1 1 4 aが P S の各パックを受け取ったときの時刻情報が規定されている。 この時 刻情報は、 P Sのパックヘッダ 2 2 a (図 2) 、 2 7 a (図 5) 内 に、 時刻情報 (システムクロックリフアレンス ; S C R) として規 定される。 一方、 T Sには T— S TDの P I Dフィルタ 42が TS の各トランスポートパケットを受け取った時の時刻情報が規定され ている。 この時刻情報は、 トランスポートパケッ トヘッダ内に所定 の頻度で記録される。 例えば時刻情報は、 P CR— T S Pに 1 0 0 ミリ秒以下の間隔で設定される。  Paying attention to the transmission rate in the decoder for each of PS and TS, PS audio data is transmitted faster than TS audio data. In the PS, the time information when the P-STD demultiplexer 114a receives each pack of the PS is defined. This time information is defined as time information (system clock reference; SCR) in the PS pack headers 22a (FIG. 2) and 27a (FIG. 5). On the other hand, the time information at the time when the PID filter 42 of the T-STD receives each transport packet of the TS is defined in the TS. This time information is recorded at a predetermined frequency in the transport packet header. For example, the time information is set in PCR-TSP at intervals of 100 ms or less.
本実施形態による P S組立部 1 04は、 T Sに変換することを想 定して P Sを生成し、 P— S TDにおける各ストリームの伝送速度 の相違を考慮して時刻情報を付加する。 すなわち、 パケットの到着 時刻情報を変更しなくても T一 S TDに適合するストリームに変換 できるように、 P S用のシステムエンコードを行う。 具体的には、 音声ストリームは最大 2 Mb p sでデマルチプレクサ 1 1 4 aから 1 1 4 bへ伝送されるものとし、 P S用のシステムエンコードを行 つて、 例えばパッファ Bv l 1 4 bおよび BA 1 1 4 cがアンダー フローしないようにする。 これにより、 P Sの時刻情報 (S CR) を T Sの時刻情報 (P CR) へ変換する際に、 値をそのまま利用す ることができ、 再システムエンコードによる時刻情報 (P CR) の 再計算が不要になる。 The PS assembling unit 104 according to the present embodiment generates a PS assuming that it is converted into a TS, and adds time information in consideration of the difference in the transmission speed of each stream in the P-STD. That is, PS system encoding is performed so that a packet can be converted to a stream conforming to T-STD without changing the packet arrival time information. Specifically, the voice stream maximum 2 Mb shall be transmitted from the demultiplexer 1 1 4 a to 1 1 4 b in ps, means pursuant system encoding for PS, e.g. puffer B v l 1 4 b and B A 1 1 4 Make sure that c does not underflow. In this way, when converting the PS time information (SCR) to the TS time information (PCR), the value is used as it is. This eliminates the need to recalculate time information (PCR) by system encoding.
また、 TSを生成する際には、 P Sには存在しない PATに関す る T Sパケット、 PMTに関する T Sバケツト等を挿入する必要が ある。 そのため、 本実施形態による P S組立部 1 04は、 そのよう な T Sバケツ トを揷入し、 処理するタイミングを考慮して P Sに時 刻情報を設定することにより、 T S変換時に T Sバケツトの時刻情 報を再度計算することが不要になる。  Also, when generating a TS, it is necessary to insert a TS packet relating to the PAT which does not exist in the PS, a TS bucket relating to the PMT, and the like. Therefore, the PS assembling unit 104 according to the present embodiment inserts such a TS bucket and sets time information in the PS in consideration of the processing timing, so that the time information of the TS bucket at the time of TS conversion is obtained. It is not necessary to calculate the information again.
本実施形態の P S組立部 1 04は、 ? 3の時刻情報3じ1 に、 以 下説明する 「S CRギャップ」 を設けることにより、 ? 3から丁 3 への変換に際して、 PATを含む T Sパケット、 PMTを含む T S バケツト等を容易に揷入できるようにしている。  The PS assembly part 104 of the present embodiment is By providing the “SCR gap” described below in the time information 3-1 of 3 above,? At the time of conversion from 3 to D3, a TS packet including a PAT, a TS bucket including a PMT, and the like can be easily imported.
以下、 図 1 2、 1 3を参照しながら、 本実施形態の P S組立部 1 04の処理を具体的に説明する。 図 1 2は、 P S組立部 1 04によ つて生成された P S 5 0と、 P S 5 0に基づいて変換された T S 5 5との対応関係を示す。 P S 50は、 ビデオパック (V— P CK) 5 1、 5 4と、 オーディオパック (A— P C K) 5 2とを含んでお り、 これらによって各 VOBUが構成される。 なお、 P S 5 0は光 ディスク 1 3 1に記録されていることを想定しているが、 記録され ているか否かは特に問題ではない。  Hereinafter, the processing of the PS assembling unit 104 of the present embodiment will be specifically described with reference to FIGS. FIG. 12 shows the correspondence between the PS 50 generated by the PS assembling unit 104 and the TS 55 converted based on the PS 50. The PS 50 includes video packs (V-PCK) 51 and 54 and audio packs (A-PCK) 52, and these VOBUs are constituted. It is assumed that the PS 50 is recorded on the optical disk 131, but whether or not the PS 50 is recorded does not matter.
P S組立部 1 04は、 適当なパック (図では V— P CK 5 1と A — P CK 5 2) 間に、 S C Rギャップ 5 3を設定する。 S C Rギヤ ップ 5 3は、 A— P CK 5 2の S CR # (n + 1)を、 従来与えら れていた S C R値よりも遅く (大きく) 規定することによって設け ることができる。 具体的には、 3〇尺ギャップ5 3は、 従来の P S 組立部 244 (図 1) が付加する S C R値を T 1とし、 P S組立部 1 04が付加する S CR値を T 2 (T 2 >T 1 ) としたとき、 (Τ 2 - Τ 1 ) によって表される時間である。 The PS assembly 104 sets the SCR gap 53 between the appropriate packs (V-PCK51 and A-PCK52 in the figure). The SCR gap 53 has been given the SCR # (n + 1) of A—PCK 52 It can be provided by specifying (slower) than the specified SCR value. Specifically, the three-length gap 53 is defined as T 1 where the SCR value added by the conventional PS assembly unit 244 (FIG. 1) is T 1 and the SCR value added by the PS assembly unit 104 is T 2 (T 2 > T 1) is the time represented by (Τ 2 -Τ 1).
図 1 3は、 P Sの各パックに含まれるパックへッダのデ一夕構造 を示す。 S CRの値は、 パックヘッダに規定されるデータのうち、 フィールド名,, system— clock— reference— base,,として示される 3分 割されたフィールド 5 6に 3 3ビットで規定される。 本実施形態に よれば、 A— P CK 5 2のフィールド 5 6には、 上述の S CR値 T 2が設定される。  Figure 13 shows the structure of the pack header included in each pack of PS. The value of the SCR is specified by 33 bits in a field 56 divided into three parts, indicated as field name, system-clock-reference-base, among the data specified in the pack header. According to the present embodiment, the SCR value T2 described above is set in the field 56 of the A-PCK 52.
P Sから T Sへ変換する場合には、 S C Rギャップ 5 3の期間に、 PATの T Sパケット 3 2、 PMTのT Sパケッ卜 3 3、 P CRの TSパケット 34、 S I T等の T Sパケットを挿入する。 これによ り、 A— P C K 5 2の S C R値を再計算する必要がなくなり、 スト リームの変換処理が簡単になる。 なお、 P Sから T Sへの変換処理 は、 図 1 8を参照しながら後述する。  When converting from PS to TS, TS packets such as TS packet 32 of PAT, TS packet 33 of PMT, TS packet 34 of PCR, and SIT are inserted in the period of SCR gap 53. This eliminates the need to recalculate the SCR value of A—PCK 52 and simplifies the stream conversion process. The conversion process from PS to TS will be described later with reference to FIG.
P S組立部 1 04は各パックがプログラムストリ一ム · システム ターゲットデコーダ (P— S TD) (図 1 1 (a) ) においてデコ —ドできるようにエンコードするとともに、 時間情報をほとんど再 計算することなく変換した T S 5 5がトランスポートストリーム · システムターゲットデコーダ (T一 S TD) (図 1 1 (b) ) にお いてデコードできるように P S 5 0を生成する。 MP EG規格に従 つた一般的なデコーダが確実にデコードできるようにするために、 エンコードを行う際にシステムェンコ一ド条件が規定されている。 システムエンコード条件を具体的に説明すると以下のとおりであ る。 まず、 A— P CK 5 2の S C R# (n+ 1)を遅らせて S C R ギャップ 5 3を設けた場合であっても、 A— P CK 5 2は、 後続の V— P CK 54の S CR # (n + 2) が示すタイミングまでに 2 M b p sの伝送レートで伝送されることが必要である。 よって、 A— P CK 5 2の S CR# (n + 1 )と V一 P C K 54の S C R # (n + 2 ) とによって規定される時間間隔が、 2Mb p sの伝送レート で A— P CK 5 2が伝送される場合に要する時間以上になることが 必要である。 The PS assembler 104 encodes each pack so that it can be decoded by the program stream system target decoder (P-STD) (Fig. 11 (a)), and recalculates most of the time information. PS 50 is generated so that the converted TS 55 can be decoded by the transport stream / system target decoder (T-STD) (Fig. 11 (b)). According to MP EG standard In order to ensure that a general decoder can decode data, system encoding conditions are specified when encoding. The system encoding conditions are specifically described as follows. First, even if the SCR gap (53) is provided by delaying the SCR # (n + 1) of A—P CK 52, the A—P CK 52 remains It is necessary to transmit at a transmission rate of 2 Mbps by the timing indicated by (n + 2). Therefore, the time interval defined by the SCR # (n + 1) of A—PCK52 and the SCR # (n + 2) of V-PCK54 becomes A—PCK5 at a transmission rate of 2 Mb ps. It must be longer than the time required for 2 to be transmitted.
さらに、 A— P CK 5 2の S CR、 および、 V— P CK 54の S C R以外の隣り合う S C Rの時間間隔を決定する必要がある。 この 時間間隔は、 V— P〇 と八—? CKの間であれば P Sのピークレ ート (10.08Mbps) で 1個のパックを伝送するのに必要とされる時 間以上であることを要する。  Further, it is necessary to determine the time interval between adjacent SCRs other than the SCR of A—PCK52 and the SCR of V—PCK54. This time interval is V-P〇 and eight-? During CK, it must be longer than the time required to transmit one pack at the peak rate of PS (10.08 Mbps).
本実施形態の P S組立部 1 04は、 S CRギャップを、 VOBU の先頭に位置する V— P CKの直前に設け、 それ以後は 1 0 0ミリ 秒以内に設けている。 これにより、 T Sへの変換時には、 1つの V O B Uの T Sバケツト化が終了した後に、 P AT等を含む T Sパケ ット 3 2〜 34を挿入できる。 ただし、 TSのビットレートは、 1 0 0ミリ秒毎の S C Rギャップ 5 3中に 1以上 (例えば 3偭) の T Sバケツトを挿入できる程度の増加を想定する必要がある。 図 1 4は、 V〇 B U先頭およびその 1 0 0ms後に設ける S CR ギャップの位置を模式的に示している。 図 1 5は、 1 0 0ミリ秒以 内で繰り返し設けられた S C Rギャップを模式的に示す。 S CRギ ャップの先頭の S C R値が 2 7 0 0 0 0 0の整数倍となるように設 けられている。 「 2 7 0 0 0 0 0」 とした理由は、 この値は、 2 7 MH zのクロック周波数に対し、 時間にして 1 0 0ミリ秒に相当す るからである。 なお、 S C Rギャップは 1 0 0ミリ秒以内で繰り返 し設けるのみであってもよく、 必ずしも VO B Uの先頭に位置する V— P CKの直前に設けなくてもよい。 さらには、 1 0 0ミリ秒以 内であれば、 例えば 5 0ミリ秒の整数倍でもよいし、 または、 可変 長であってもよい。 図 1 6は、 D VD— VR規格に準拠する P Sに 設定した S C Rギャップを模式的に示す。 S CRギャップは、 VO B U # nの先頭に位置する R D I— P C K 5 8の直前に設けられて いる。 さらに、 その S CRギャップから 1 0 0ミリ秒以内に次の S C Rギャップが設けられている。 In the PS assembling section 104 of the present embodiment, the SCR gap is provided immediately before the V-PCK located at the head of the VOBU, and is provided within 100 ms thereafter. As a result, at the time of conversion into TS, TS packets 32 to 34 including PAT and the like can be inserted after the completion of the TS bucketing of one VOBU. However, it is necessary to assume an increase in the bit rate of the TS such that one or more (eg, 3 偭) TS buckets can be inserted into the SCR gap 53 every 100 milliseconds. FIG. 14 schematically shows the position of the SCR gap provided at the beginning of V〇BU and 100 ms after it. FIG. 15 schematically shows SCR gaps repeatedly provided within 100 ms. The SCR value at the beginning of the SCR gap is set to be an integral multiple of 270,000. The reason for setting the value to “270 00 00 0” is that this value corresponds to 100 milliseconds in time with respect to a clock frequency of 27 MHz. It should be noted that the SCR gap may be provided repeatedly only within 100 milliseconds, and may not necessarily be provided immediately before the V-P CK located at the head of the VO BU. Further, as long as it is within 100 ms, it may be an integral multiple of 50 ms, for example, or may be a variable length. Figure 16 schematically shows the SCR gap set for a PS conforming to the DVD-VR standard. The SCR gap is provided immediately before RDI-PCK58 located at the beginning of VO BU #n. Furthermore, the next SCR gap is set within 100 ms from the SCR gap.
図 1 7は、 P S組立部 1 04がプログラムストリームの S CRを 設定する際の処理の手順を示す。 まず、 ステップ S 1 0 0において、 P S組立部 1 04は、 各パックに対して仮の S C R値を決定する。 この仮 S CR値は、 従来の P S組立部 244が決定していた値と同 じである。 次にステップ S 1 0 1において、 処理の対象となってい るパックが V〇 B Uの先頭パックか否かを判定する。 そのパックが 先頭パックでなければステップ S 1 0 2に進み、 先頭パックであれ ばステツプ 1 04に進む。 ステップ S 1 0 2では、 P S組立部 1 0 4は、 S CR値が 1 0 0m sの整数倍付近か否かを判定する。 例え ば、 2 7 MH zのカウンタを用いている場合には、 P S組立部 1 0 4は、 S CR値が 2 7 0 0 0 0 0の倍数であるか否かを判定する。 判定の結果、 整数倍付近でなければステップ S 1 0 3に進み、 ステ ップ S 1 0 3において、 仮決定した S C R値を変更することなくそ の値をパックヘッダに記述する。 一方、 整数倍付近であればステツ プ S 1 04に進み、 ステップ S 1 04において、 3じ尺を所定の3 C Rギヤップ分だけシフトする。 FIG. 17 shows a processing procedure when the PS assembling section 104 sets the SCR of the program stream. First, in step S100, the PS assembling unit 104 determines a temporary SCR value for each pack. This temporary SCR value is the same as the value determined by the conventional PS assembly unit 244. Next, in step S101, it is determined whether the pack to be processed is the first pack of the V〇BU. If the pack is not the first pack, the process proceeds to step S102. If the pack is the first pack, the process proceeds to step 104. In step S102, PS assembly part 10 Step 4 determines whether the SCR value is near an integral multiple of 100 ms. For example, when a 27 MHz counter is used, the PS assembling unit 104 determines whether the SCR value is a multiple of 270 00 000. If the result of the determination is that the value is not around the integral multiple, the process proceeds to step S103, and in step S103, the provisionally determined SCR value is described in the pack header without being changed. On the other hand, if it is near the integral multiple, the process proceeds to step S104, and in step S104, the three-jime is shifted by a predetermined 3 CR gap.
次に、 S C Rギャップを設けた P Sから T Sを生成する手順を説 明する。 図 1 8は、 変換部 1 42において実行される、 P Sから T Sへの変換処理の手順を示す。 まず、 ステップ S 2 0 0において、 VO B Uの先頭に位置する V— P CKの S C R値に基づいて、 最初 の PAT、 PMT、 P C Rの挿入タイミングを決定する。 例えば、 2 7 MH zのカウンタを用いる場合には、 挿入タイミングは (先頭 の VOBUの S C R値 d i v 2 7 0 0 0 0 0 ) によって得られる。 この "d i v" は、 除算結果の少数点以下を切り捨てることを意味 する。 また、 " 2 7 0 0 0 0 0 " は 1 0 0ミリ秒に対応しており、 2 7 MH zのカウン夕の 1 Z 1 0に相当する値である。  Next, a procedure for generating T S from P S with the SCR gap will be described. FIG. 18 shows the procedure of the conversion process from PS to TS, which is executed in the conversion unit 142. First, in step S200, the insertion timing of the first PAT, PMT, and PCR is determined based on the SCR value of V--PCK located at the beginning of VOBU. For example, when a 27 MHz counter is used, the insertion timing is obtained by (SCR value div 27 00 00 00 of the first VOBU). This "div" means that the result of the division is rounded down to the nearest decimal point. Also, “270 00 00 0” corresponds to 100 milliseconds, and is a value corresponding to 1 Z 10 of the count of 27 MHz.
ステップ S 2 0 1において、 変換部 1 42は、 1パック前の末尾 S CRの値を算出する (ただし、 前にパックが存在しない最初のパ ックは除く) 。 図 1 9は、 各パックに対する末尾 S C Rを示す。 図 に示すように、 「末尾 S CR」 とは、 あるパックの直後の 1バイト を伝送する最も早いタイミング (時刻情報) を表す。 再び図 1 8の 各ステップを説明する。 ステップ S 2 0 2では、 変換部 1 4 2は、 処理の対象となっているパックが V〇 B Uの先頭パックか否かを判 定する。 そのパックが先頭パックでなければステップ S 2 0 3に進 み、 先頭パックであればステップ 2 0 9に進む。 ステップ S 2 0 3 において、 変換部 1 4 2は、 得られた挿入タイミングがパックの S C R値と末尾 S C R値との間に含まれるか否かを判定し、 含まれる 場合にはステップ S 2 0 9に進み、 含まれない場合にはステップ S 2 0 7に進む。 In step S201, the conversion unit 142 calculates the value of the last SCR one pack before (excluding the first pack in which no pack exists before). Figure 19 shows the trailing SCR for each pack. As shown in the figure, “tail SCR” indicates the earliest timing (time information) for transmitting one byte immediately after a certain pack. Again in Figure 18 Each step will be described. In step S202, conversion section 142 determines whether the pack to be processed is the first pack of V の BU. If the pack is not the first pack, the process proceeds to step S203, and if the pack is the first pack, the process proceeds to step S209. In step S203, the conversion unit 1442 determines whether or not the obtained insertion timing is included between the SCR value of the pack and the end SCR value. Proceed to 9; if not included, proceed to step S207.
ステップ S 2 0 9では、 得られた挿入タイミングにおいて、 P A T、 Ρ Μ Τ、 および P C Rの T Sパケットを挿入する。 次にステツ プ S 2 0 4において、 揷入タイミング値に 2 7 0 0 0 0 0を加算し て次の揷入タイミング値とする。 その後、 ステップ S 2 0 7に進む。 ステップ S 2 0 7では、 変換部 1 4 2は、 1つのパックを 1 8 8 バイ トに分割して T Sバケツトを生成する。 例えば図 1 2に示すよ うに、 1個のビデオパックは 1 1個のビデオ T Sパケット 3 0に分 割され、 1個のオーディオパックは 1 1個のオーディオ T Sバケツ ト 3 1に分割される。 T Sパケットには、 ステップ S 2 0 8におい て、 タイムスタンプが付加される。  In step S209, the PAT, {}, and PCR TS packets are inserted at the obtained insertion timing. Next, in step S204, 2700000 is added to the input timing value to obtain the next input timing value. Thereafter, the process proceeds to step S207. In step S207, the converter 144 divides one pack into 188 bytes to generate a TS bucket. For example, as shown in FIG. 12, one video pack is divided into 11 video TS packets 30, and one audio pack is divided into 11 audio TS packets 31. In step S208, a time stamp is added to the TS packet.
ステップ S 2 0 6においては、 変換部 1 4 2は、 P S内の全ての パックが処理されたか否かを判定する。 そして、 全てのパックの処 理が完了した場合には処理を終了し、 終了していない場合にはステ ップ S 2 0 5において次のパックを抽出して、 再びステップ S 2 0 1以降の処理を行う。 以上の処理により、 変換部 1 42は、 プ グラムストリームから トランスポートストリームを容易に変換することができる。 特に、 V— P C Kや A— P C K内の P C R, P T S (Presentation Time Stamp) および DT S (Decoding Time Stamp) を再計算して設定す る必要がなく、 かつ、 プログラムストリームの S C R値に基づいて トランスポートストリームの各 T Sパケットの時刻情報を決定でき るので、 従来のように処理に時間を要することがなくなり、 変換時 の処理負担を著しく軽減できる。 TSパケットの時刻情報は、 P C Rと呼ばれ、 T Sバケツ卜が仮想的な M P E G 2デコーダへ到達す べき時刻を規定する。 丁 の?じ尺値は、 ? の じ尺値を基準に して算出することができる。 例えば、 図 1 2の P C R 34の値を P Sの S CR# (n + 1 ) の値よりも時間的に早い値にすればよい。 その程度は、 1個の T Sパケット 34の伝送時間分である。 In step S206, the conversion unit 142 determines whether all packs in the PS have been processed. If the processing of all the packs has been completed, the processing is terminated. If not completed, the next pack is extracted in step S205, and the processing of step S201 and subsequent steps is performed again. Perform processing. By the above processing, the conversion unit 142 can easily convert the transport stream from the program stream. In particular, there is no need to recalculate and set the PCR, PTS (Presentation Time Stamp) and DTS (Decoding Time Stamp) in V-PCK or A-PCK, and use the transformer based on the SCR value of the program stream. Since the time information of each TS packet in the port stream can be determined, processing time is not required as in the conventional case, and the processing load during conversion can be significantly reduced. The time information of the TS packet is called PCR, and defines the time at which the TS bucket should reach the virtual MPEG 2 decoder. Ding? The scale value is? It can be calculated based on the scale value. For example, the value of PCR 34 in FIG. 12 may be set to a value earlier in time than the value of SCR # (n + 1) of PS. The degree is equivalent to the transmission time of one TS packet 34.
なお、 記録されたプログラムストリームを I EEE 1 3 94イン ターフェ一ス部 1 40から出力するために、 トランスポートストリ —ムに変換するとして説明した。 しかし、 記録されたプログラムス トリームをトランスポートストリームへ変換し、 その後、 光ディス ク 1 3 1等の記録媒体へ記録する場合も同様の処理を行うことがで きる。 トランスポ一トストリームにタイムスタンプを含める場合に は、 プログラムストリームの S CRを基準としてタイムスタンプを 選択すればよい。  It has been described that the recorded program stream is converted into a transport stream in order to be output from the IEEE 1394 interface unit 140. However, the same processing can be performed when the recorded program stream is converted into a transport stream and then recorded on a recording medium such as an optical disc 131. To include a timestamp in the transport stream, the timestamp can be selected based on the SCR of the program stream.
なお、 プログラムストリーム中に、 S CRギャップが設けられた 位置を示す位置情報を規定することができる。 位置情報は、 例えば、 プログラムストリ一ム先頭を 0としたパディングバケツトの先頭ァ ドレスである。 また、 S C Rギャップ先頭の S C R値を RD I— P CKのメーカ拡張フィールド 2 7 e、 6 7 (図 5、 図 2 3) 内に設 けてもよい。 さらに PAT, PMT, P C R、 または S I Tを含む TSバケツ卜の使用可能な S CR値を候補として記録してもよい。 また、 動画ストリームを含むファイルとは別ファイル内にこれらの 情報を記録してもよい。 In the program stream, position information indicating the position where the SCR gap is provided can be defined. The location information is, for example, This is the head address of the padding bucket, with the beginning of the program stream set to 0. Also, the SCR value at the head of the SCR gap may be set in the manufacturer extension fields 27 e and 67 of RDI-PCK (FIGS. 5 and 23). Further, a usable SCR value of a TS bucket including PAT, PMT, PCR, or SIT may be recorded as a candidate. Also, such information may be recorded in a file different from the file containing the video stream.
(実施形態 2)  (Embodiment 2)
以下、 本発明の第 2の実施形態によるデータ処理装置を説明する。 本実施形態のデータ処理装置の構成要素は図 1 0に示すデータ処理 装置 1 0 (図 1 0) と同じである。 よって、 それぞれの機能の説明 は省略し、 以下ではデ一夕処理装置の処理を説明する。  Hereinafter, a data processing device according to a second embodiment of the present invention will be described. The components of the data processing device of the present embodiment are the same as those of the data processing device 10 (FIG. 10) shown in FIG. Therefore, the description of each function is omitted, and the processing of the data processing apparatus will be described below.
本実施形態によるデータ処理装置 1 0は、 図 1 2の S C Rギヤッ プ 5 3に代えて、 パディングパケットを設ける点において、 第 1の 実施形態によるデータ処理装置と相違する。  The data processing device 10 according to the present embodiment differs from the data processing device according to the first embodiment in that a padding packet is provided instead of the SCR gap 53 in FIG.
図 2 0は、 本実施形態によるデータ処理装置 1 0の P S組立部 1 04が生成した P S 5 9— 1と、 P S 5 9— 1に基づいて変換され た T S 5 9 _ 2との対応関係を示す。 P S組立部 1 04は、 VOB Uを構成する適当なパック (図ではビデオパック (V— P CK) 6 1 ) に、 パディングパケット 6 1 aを挿入する。 プログラムストリ ームからトランスポートストリームへ変換される際には、 パディン グパケット 6 1 aの位置に対応して、 PAT 3 2, PMT 3 3, P CR、 S I T等を含む T Sパケットが揷入される。 1個のビデオパ ックは 1 1個のビデオ T Sパケッ卜 3 0に分割され、 1個のォ一デ ィォパックは 1 1個のオーディオ T Sバケツ ト 3 1に分割される。 図 2 1は、 ビデオパック 6 1に含まれるパディングバケツ ト 6 1 aのデータ構造を示す。 パディングパケット 6 1 aは、 パケットへ ッダ 6 3と、 一定値 (O x F F) のパディングバイトが格納された フィールド 6 4とを有する。 パケットヘッダ 6 3には、 パディング バイ トフィールド 64のデータ長 (P E Sパケット長) が 2バイ ト で示されており、 これによりパディングパケッ ト 6 1 aの長さを特 定できる。 パディングバイ トフィールド 64のデータ長は、 T Sパ ケットのパケット長に関連しており、 例えば、 1 8 8バイ トの整数 倍 (例えば 2倍から 4倍) である。 「 1 8 8バイト」 は、 トランス ポートパケッ トのデータサイズに対応している。 なお、 パデイング バイ トフィールド 64のデータ長が 1 8 8バイ トの 2倍のときは、 2個の T Sパケットを挿入することが可能になり、 4倍のときは、 4個の T Sパケットを揷入することが可能になる。 FIG. 20 shows the correspondence between the PS 59-1 generated by the PS assembling section 104 of the data processing apparatus 10 according to the present embodiment and the TS 59_2 converted based on the PS 59-1. Is shown. The PS assembling unit 104 inserts the padding packet 61 a into an appropriate pack (the video pack (V—PCK) 61 in the figure) constituting the VOB U. When converted from a program stream to a transport stream, a TS packet including PAT 32, PMT 33, PCR, SIT, etc. is inserted corresponding to the position of padding packet 61a. . One video A packet is divided into 11 video TS packets 30, and one audio pack is divided into 11 audio TS packets 31. FIG. 21 shows the data structure of the padding bucket 61 a included in the video pack 61. The padding packet 61a has a packet header 63 and a field 64 in which a fixed value (OxFF) padding byte is stored. In the packet header 63, the data length (PES packet length) of the padding byte field 64 is indicated by 2 bytes, and thereby the length of the padding packet 61a can be specified. The data length of the padding byte field 64 is related to the packet length of the TS packet, and is, for example, an integral multiple of 188 bytes (for example, 2 to 4 times). “188 bytes” corresponds to the data size of the transport packet. When the data length of the padding byte field 64 is twice the length of 188 bytes, two TS packets can be inserted. When the data length of the padding byte field 64 is four times, four TS packets can be inserted. Will be able to enter.
なお、 パディングパケット 6 1 aは、 MP E G 2システム規格に 記載されたパディングバケツトと同じである。 パディングバケツト の配置は DVD— VR規格と同じにしている。 ビデオパック 6 1内 には、 通常の圧縮ビデオデータを可能な限り多く含むようにしても よい。 なお、 本実施形態のパディングバケツト 6 1 aはビデオパッ ク 6 1内に設けられているが、 ォ一ディォパック 6 2に設けること もできる。  The padding packet 61a is the same as the padding bucket described in the MPEG2 system standard. The arrangement of the padding bucket is the same as the DVD-VR standard. The video pack 61 may contain as much normal compressed video data as possible. Although the padding bucket 61 a of the present embodiment is provided in the video pack 61, it may be provided in the audio pack 62.
図 2 2は、 1 0 0ミリ秒以内で繰り返し設けられたパディングパ ケットを含むビデオパック 6 5、 6 6を模式的に示す。 ビデオパッ ク 6 5、 6 6は、 V〇 BU# nの途中部分に設けられている。 この 結果、 T Sのビットレートは、 1 0 0ミリ秒毎のパディングパケッ トに 1以上の T Sパケットを余分に挿入できる程度の増加を想定す る必要がある。 なお、 パディングパケッ トは 1 0 0ミリ秒以内で繰 り返し設けるのみであってもよく、 V〇 B Uの先頭に位置する V— P C Kの直前に設けなくてもよい。 Figure 22 shows a padding pad that is repeatedly provided within 100 milliseconds. 5 schematically shows a video pack 65, 6 6 including a bracket. Video packs 65 and 66 are provided in the middle of V〇BU # n. As a result, it is necessary to assume that the bit rate of the TS increases so that one or more extra TS packets can be inserted into the padding packet every 100 milliseconds. The padding packet may be provided repeatedly only within 100 ms, and may not be provided immediately before V-PCK located at the head of V の BU.
図 1 2に関連してした説明と同様、 P S組立部 1 0 4は、 各パッ クがプログラムストリ一ム · システム夕ーゲットデコーダ (P— S TD) のシステムェンコ一ド条件を満足し、 かつ、 変換後のトラン スポートストリームがトランスポートストリーム · システムターゲ ットデコーダ (T— S TD) のシステムエンコード条件をも満たす ように、 プログラムストリーム 5 9— 1を生成する。  As in the description related to FIG. 12, the PS assembly 104 determines that each pack satisfies the system encode conditions of the program stream, system target decoder (P-STD), and The program stream 59-1 is generated so that the converted transport stream also satisfies the system encoding conditions of the transport stream system target decoder (T-STD).
システムエンコード条件を具体的に説明すると以下のとおりであ る。 オーディオパック (A— P CK) 6 2の30 # (n + 1 )と、 後続の V_P CK (図示せず) の S C R # (n + 2 ) ) とによって 規定される時間間隔が、 2 Mb p sの伝送レー卜で A__P C 5 2 が伝送される場合に要する時間以上になることが必要である。  The system encoding conditions are specifically described as follows. The time interval defined by 30 # (n + 1) of the audio pack (A—P CK) 6 2 and the SCR # (n + 2) of the following V_P CK (not shown) is 2 Mb ps It must be longer than the time required for A__PC52 to be transmitted at this transmission rate.
さらに他のシステムェンコ一ド条件として、 A_P CK 6 2の S C R # (n + l )、 および、 後続の V— P CK (図示せず) の S C R # (n + 2)以外の隣り合う S C R間の時間間隔 (例えばビデオ パック 6 0および 6 1の S C R間の時間間隔) も規定される。 すな わち、 この時間間隔は P Sのピークレート (10.08Mbps) で 1個の パックを伝送するのに要する時間以上になるように各 S C R値を設 定することが必要である。 As another system code condition, adjacent SCRs other than SCR # (n + l) of A_P CK 62 and subsequent SCR # (n + 2) of V—P CK (not shown) The time interval between them (eg, the time interval between the SCRs of Video Packs 60 and 61) is also specified. In other words, this time interval is one peak at the peak rate of the PS (10.08 Mbps). It is necessary to set each SCR value so that it is longer than the time required to transmit the pack.
なお、 プログラムストリーム中に、 パディングパケッ トが設けら れた位置を示す位置情報を規定することができる。 位置情報は、 例 えば、 プログラムストリーム先頭を 0としたパディングバケツトの 先頭アドレスである。 また、 S C Rギャップ先頭の S C R値を RD I— P C Kのメ一力拡張フィールド 2 7 e、 6 7 (図 5、 図 2 3) 内に設けてもよい。 さらに PAT, PMT, P CR、 または S I T を含む T Sバケツトの使用可能な S C R値を候補として記録しても よい。 また、 動画ストリームを含むファイルとは別ファイル内にこ れらの情報を記録してもよい。  In the program stream, position information indicating the position where the padding packet is provided can be defined. The position information is, for example, the head address of a padding bucket with the head of the program stream being 0. Also, the SCR value at the head of the SCR gap may be provided in the RDI-PCK medium extension fields 27 e and 67 (FIGS. 5 and 23). Further, a usable SCR value of the TS bucket including PAT, PMT, PCR, or SIT may be recorded as a candidate. Also, such information may be recorded in a file different from the file containing the video stream.
(実施形態 3)  (Embodiment 3)
以下、 本発明の第 3の実施形態によるデータ処理装置を説明する。 本実施形態のデータ処理装置の構成要素は図 1 0に示すデータ処理 装置 1 0 (図 1 0) と同じである。 よって、 それぞれの機能の説明 は省略し、 以下ではデータ処理装置の処理を説明する。 なお、 以下 では実施形態 1または実施形態 2によるプログラムストリ一ムが生 成されるとして説明する。 しかし、 これは必須の前提ではない。 実 施形態 1または実施形態 2によるプログラムストリームが生成され ない場合には、 P Sから T Sへ変換する場合のストリーム内の時刻 情報を別途算出する必要がある。  Hereinafter, a data processing device according to a third embodiment of the present invention will be described. The components of the data processing device of the present embodiment are the same as those of the data processing device 10 (FIG. 10) shown in FIG. Therefore, the description of each function is omitted, and the processing of the data processing device will be described below. In the following, description will be made assuming that the program stream according to the first or second embodiment is generated. However, this is not a mandatory assumption. When the program stream according to the first embodiment or the second embodiment is not generated, it is necessary to separately calculate time information in the stream when converting from PS to TS.
本実施形態のデータ処理装置 1 0は、 DVD— VR規格に準拠し たプログラムストリームをトランスポートストリームに変換する際 に、 処理負担を軽減し、 かつ、 変換処理時間を短縮することができ るプログラムストリームを生成する。 ここでいうプログラムストリ ームとトランスポートストリームとは、 互いに図 9に示す関係にあ るとする。 よって、 図 9の (c ) に記載されるように、 T Sバケツ トのデ一夕部分 4 1 bには、 (b) の P E Sパケットが分割されて 格納される。 P E Sパケットのペイロード 40 bには、 1フレーム 分のデータ (ビデオデ一夕またはオーディオデータ) が格納されて いる。 1フレーム分のデータは、 ( a) に示すパックのデ一夕部分 3 9 aおよび 3 9 bのデータと、 データ部分 3 9 cの一部のデータ から得られる。 なお、 映像の 1フレームとは、 例えばインターレー ス表示されたときの 2フィールド分の画面を表し、 音声の 1フレ一 ムとは、 例えばサンプリング周波数 48 kH z、 2 5 6 k b p sの AC— 3音声の場合であれば合計 1 5 3 6個のサンプルをいう。 データ処理装置 1 0の P S組立部 1 04は、 P Sを生成する際に 各パックのデ一タ部分に格納するデータを決定しているため、 ビデ ォゃオーディォ等のデータ種別のみならず、 そのデータがどのフレ ームのどの部分を構成するデータであるか等を特定できる。 そこで 本実施形態の P S組立部 1 04は、 そのような P Sを構成するデ一 夕種別ごとのフレームの位置、 P T S (再生タイミング情報) 、 D T S (デコードタイミング情報) 等を示す補助情報を生成するよう にした。 RD Iパック内にはメーカが自由に利用できるデータ領域 が存在するため、 この領域に補助情報を記録することができる。 図 2 3 (a) は、 本実施形態による P S組立部 1 04により生成 されたプログラムストリームのデータ構造を示す。 このプログラム ストリームは DVD— VR規格に準拠しており、 2キロバイ トの R D Iパック (RD I— P CK) にメ一力拡張フィールド 6 7が設け られている。 The data processing device 10 according to the present embodiment converts a program stream conforming to the DVD-VR standard into a transport stream. In addition, a program stream that can reduce the processing load and shorten the conversion processing time is generated. Here, it is assumed that the program stream and the transport stream have a relationship shown in FIG. 9 with each other. Therefore, as shown in (c) of FIG. 9, the PES packet of (b) is divided and stored in the data portion 41b of the TS bucket. One frame of data (video data or audio data) is stored in the payload 40b of the PES packet. The data for one frame is obtained from the data in the data portion 39a and 39b of the pack shown in (a) and a part of the data portion 39c. One frame of video refers to, for example, a screen for two fields when displayed in an interlaced manner. One frame of audio refers to, for example, AC-3 with a sampling frequency of 48 kHz and 256 kbps. In the case of audio, it means a total of 1 5 3 6 samples. Since the PS assembling unit 104 of the data processing device 10 determines the data to be stored in the data portion of each pack when generating the PS, not only the data type such as video audio, but also the It is possible to specify, for example, which data constitutes which part of which frame. Therefore, the PS assembling unit 104 of the present embodiment generates auxiliary information indicating the position of the frame, the PTS (playback timing information), the DTS (decode timing information), etc., for each data type constituting such a PS. I did it. Since there is a data area in the RDI pack that can be used freely by the manufacturer, auxiliary information can be recorded in this area. FIG. 23 (a) is generated by the PS assembly unit 104 according to the present embodiment. 9 shows the data structure of the program stream obtained. This program stream conforms to the DVD-VR standard, and has a 2-kilobyte RDI pack (RDI-PCK) with an extension field 67.
以下、 メ一力拡張フィールド 6 7の構成を説明する。 メーカ拡張 フィールド 6 7は、 メ一力識別情報 6 7 a、 画素数情報 6 7 b、 圧 縮モード情報 6 7 c、 ビデオ用補助情報 6 7 d、 オーディオ用補助 情報 6 7 eを有する。 メーカ識別情報は P Sを生成したデータ処理 装置 1 0のメーカを示し、 画素数情報 6 7 bは記録された画像の縦 横の画素数を示し、 圧縮モード情報 6 7 cは DVD— VR規格準拠 か否かを示す。 このほか、 メーカ拡張フィールド 6 7には、 P Sの ァスぺクト情報 (4 : 3、 1 6 : 9、 レターボックス等) 、 音声の チャネル属性情報 (モノラル/ステレオ等) を記録することもでき る。  The configuration of the extension field 67 will be described below. The maker extension field 67 has main identification information 67a, pixel number information 67b, compression mode information 67c, video auxiliary information 67d, and audio auxiliary information 67e. The manufacturer identification information indicates the manufacturer of the data processing device 10 that generated the PS, the pixel number information 67 b indicates the number of pixels in the vertical and horizontal directions of the recorded image, and the compression mode information 67 c corresponds to the DVD-VR standard. Indicates whether or not. In addition, the manufacturer's extension field 67 can record PS fact information (4: 3, 16: 9, letterbox, etc.) and audio channel attribute information (monaural / stereo, etc.). You.
メーカ拡張フィールド 6 7のビデオ用補助情報 6 7 dおよびォー ディォ用補助情報 6 7 eには、 P Sを構成するデータ種別ごとのデ 一夕構造に関する情報が規定される。 すなわち、 ビデオ用補助情報 6 7 dは、 RD I— P CKを先頭に含む VOBU内の映像パックに 関するデータ構造を規定しており、 映像フレーム位置情報、 P T S ZDT S情報を含んでいる。 オーディオ用補助情報 6 7 eは、 音声 パックに関するデータ構造を規定しており、 音声フレーム位置情報、 P T S情報を含んでいる。  The video auxiliary information 67 d and the audio auxiliary information 67 e of the maker extension field 67 specify information on the data structure for each data type constituting the PS. That is, the video auxiliary information 67 d specifies the data structure of the video pack in the VOBU including RDI-PCK at the beginning, and includes video frame position information and PTS ZDTS information. The audio auxiliary information 67 e specifies the data structure of the audio pack, and includes audio frame position information and PTS information.
図 2 3 (b) は、 ビデオ用補助情報 6 7 dの詳細なデータ構造を 示す。 ビデオ用補助情報 6 7 dには、 MP EG規格に規定される I、 P、 Bの各フレームについてのフレーム位置情報 6 8 a〜 6 8 dお よび P T S/DT S情報が規定されている。 Figure 23 (b) shows the detailed data structure of video auxiliary information 67d. Show. The video auxiliary information 67 d specifies frame position information 68 a to 68 d and PTS / DTS information for each of I, P, and B frames specified in the MPEG standard.
各フレーム位置情報 6 8 a〜 6 8 dは、 プログラムストリ一ム先 頭または VO BU先頭から各フレームデータの先頭位置までのデー 夕サイズであり、 バイト単位で表される。 図 24は、 VOBU# i の先頭を 0として算出したときの、 I フレーム、 B 1フレームおよ び B 2フレームの開始アドレス (格納位置) を模式的に示す。 映像 フレームの開始ァドレスには、 VOBU先頭から A— P CKまでに 含まれる A— P C Kのデータ長も含まれる。 P S組立部 1 04は、 P Sを生成するとき、 各フレームの開始位置およびその位置の P T S等を保持しておき、 ビデオ用補助情報 6 7 dを生成する。  Each frame position information 68a to 68d is the data size from the beginning of the program stream or the beginning of the VOBU to the beginning of each frame data, and is expressed in bytes. FIG. 24 schematically shows the start addresses (storage positions) of the I frame, the B1 frame, and the B2 frame when the start of VOBU # i is calculated as 0. The start address of the video frame includes the data length of A-PCK included from the beginning of VOBU to A-PCK. When generating the PS, the PS assembling unit 104 holds the start position of each frame, the PTS of the position, and the like, and generates the video auxiliary information 67d.
図 2 3 (b) に記載の PT S/DT S情報は、 フレーム単位の P 丁 3ぉょび0丁 3を示す。 D T Sは必要に応じて設ければよい。 P T S/DT S情報は、 各フレーム位置情報 6 8 a〜 6 8 dに対応し て設けられており、 Iフレームの位置情報 6 8 aの次には Iフレー ムの?丁 3/0丁 3情報が設けられ、 P 1フレームの位置情報 6 8 bの次には P 1フレームの P T S /D T S情報が設けられる。 B 1、 B 2フレーム等についても同様である。 なお、 オーディオ用補助情 報 6 7 eは特に示していないが、 D T S情報が含まれない点を除い ては、 オーディオ用補助情報 6 7 eのデータ構造はビデオ用補助情 報 6 7 dのデータ構造と同様である。  The PT S / DTS information described in FIG. 23 (b) indicates P-three and zero-three in frame units. DTS may be provided as needed. The PTS / DTS information is provided corresponding to each frame position information 68a to 68d, and is the I-frame next to the I-frame position information 68a? D3 / 0/3 information is provided, and PTS / DTS information of the P1 frame is provided after the P1 frame position information 68b. The same applies to the B1, B2 frames and the like. Although the audio auxiliary information 67 e is not shown, the data structure of the audio auxiliary information 67 e is the data of the video auxiliary information 67 d except that DTS information is not included. Same as the structure.
次に、 変換部 1 42が上述のデータ構造を有する P Sを T Sに変 換する手順を説明する。 図 2 5は、 P Sから TSへの変換処理の手 順を示す。 まず、 ステップ S 3 0 0において、 変換部 1 42に DV D— VR規格に準拠した 2 kバイト単位のパックが入力されると、 ステツプ S 3 0 1において、 変換部 1 42はそのパックが RD Iパ ックか否かを判定する (S 3 0 1 ) 。 判定の結果、 そのパックが R D Iパックであればステツプ S 3 0 2に進み、 RD Iパックでなけ ればステツプ S 3 0 3に進む。 なお、 ステップ S 3 0 3の処理は、 そのパックが必ずビデオパック (V_P CK) またはオーディオパ ック (A— P CK) であることを意味する。 Next, the conversion unit 142 converts a PS having the above data structure into a TS. The procedure for switching will be described. Fig. 25 shows the procedure of the conversion process from PS to TS. First, in step S300, when a pack in units of 2 kbytes conforming to the DV D-VR standard is input to the conversion unit 142, in step S301, the conversion unit 142 It is determined whether or not it is an I-pack (S301). As a result of the determination, if the pack is an RDI pack, the process proceeds to step S302. If the pack is not an RDI pack, the process proceeds to step S303. The processing in step S303 means that the pack is always a video pack (V_PCK) or an audio pack (A-PCK).
ステップ S 3 0 2では、 変換部 1 42は R D Iパックのメーカ拡 張フィールド 6 7から映像および音声の各々について、 フレーム位 置情報、 PT SZDTS情報を取り出す。  In step S302, the conversion unit 142 extracts frame position information and PT SZDTS information for each of video and audio from the manufacturer extension field 67 of the RDI pack.
ステツプ S 3 0 3では、 変換部 1 42は、 処理の対象となってい るパックのパックヘッダおよび P E Sヘッダを除去する。 ここで留 意すべきは、 RD Iパックは必ず VO B Uの先頭に配置されている ため、 ステップ S 3 0 3を実行する時点では、 変換部 1 42は先行 する RD Iパックから既にフレーム位置情報、 PT SZDT S情報 を取得していることである。  In step S303, the conversion unit 142 removes the pack header and the PES header of the pack to be processed. It should be noted here that the RDI pack is always located at the beginning of the VO BU, so at the time of executing step S303, the conversion unit 142 has already received the frame position information from the preceding RDI pack. , PT SZDT S information.
そこで、 変換部 1 42は、 ステップ S 3 04においてフレーム位 置情報を参照して、 このパック内にフレーム開始位置があるか否か を判定する。 フレーム開始位置が含まれていればステップ S 3 0 5 に進み、 含まれていなければステップ S 3 0 6に進む。  Therefore, the conversion unit 142 determines whether or not there is a frame start position in this pack by referring to the frame position information in step S304. If the frame start position is included, the process proceeds to step S305, and if not, the process proceeds to step S306.
ステップ S 3 0 5では、 変換部 1 42は P T SZDT S情報を参 照して該当する P T S /D T Sを抽出し、 その PTSZDT Sを含 む P E Sヘッダを生成してそのパックデ一夕の前に付加する。 次の ステップ S 3 0 6では、 変換部 1 42は、 加工したデータを分割し て 1 1個または 1 2個の TSパケットを生成して出力する。 その後、 ステップ S 3 0 7に進み、 次のパックを処理する。 In step S305, the conversion unit 142 references the PT SZDT S information. Then, the corresponding PTS / DTS is extracted, and a PES header including the PTSZDTS is generated and added before the package data. In the next step S306, the conversion unit 142 divides the processed data to generate and output 11 or 12 TS packets. Thereafter, the flow advances to step S307 to process the next pack.
以上の処理により、 変換部 1 42は P S内のエレメンタリストリ ームを解析することなく、 P Sを、 1個の P E Sパケットに 1フレ ームのデータが含まれる P E Sから構成される T Sに容易に変換で きる。  Through the above processing, the conversion unit 142 can easily convert the PS into a TS composed of PES in which one PES packet contains one frame of data without analyzing the elementary stream in the PS. Can be converted to
なお、 図 2 3 ( a) および (b) に示す補助情報 6 7 d、 6 7 e をさらに拡張することも可能である。 図 2 6 ( a) は、 補助情報フ ィールド 7 0にサイズ情報を規定したメーカ拡張フィールド 6 9を 示す。 図 2 6 (b) は、 補助情報フィールド 7 0のデータ構造を示 す。 補助情報フィールド 7 0は、 フレームごとにそのフレームのデ —タサイズに関する情報が規定されている点において、 図 2 3 (b) と異なっている。 例えば、 Iフレ一ムに対しては、 開始アド レス 6 8 aに続いて P T S /D T Sが記述され、 その後にフレーム サイズ 7 1が記述される。 P 1フレームに対しては、 開始アドレス 6 9 aに続いて P T S/DT Sが記述され、 その後にフレームサイ ズ 7 2が記述される。 B 1フレームについても同様に、 アドレス 6 8 c、 P T S等、 B 1フレームサイズ 7 3が記述される。  The auxiliary information 67 d and 67 e shown in FIGS. 23 (a) and (b) can be further extended. FIG. 26 (a) shows a maker extension field 69 in which size information is specified in the auxiliary information field 70. FIG. 26 (b) shows the data structure of the auxiliary information field 70. The auxiliary information field 70 differs from FIG. 23 (b) in that information on the data size of the frame is specified for each frame. For example, for the I frame, PTS / DTS is described after the start address 68a, and then the frame size 71 is described. For the P1 frame, PTS / DTS is described after the start address 69a, and then the frame size 72 is described. Similarly, for the B1 frame, the B1 frame size 73, such as the address 68c and the PTS, is described.
なお、 上述の処理では P AT/PMTを含む T Sパケットの挿入 処理に言及していない。 しかし、 これらの T Sパケットは、 例えば 実施形態 1または 2によるデータ処理装置 1 0の処理をそのまま適 用して挿入できる。 これにより、 データ処理装置 1 0は、 再度のシ ステムエンコード処理を行う必要がなくなる。 The above processing does not refer to the processing of inserting TS packets including PAT / PMT. However, these TS packets The processing of the data processing device 10 according to the first or second embodiment can be directly applied and inserted. This eliminates the need for the data processing device 10 to perform the system encoding process again.
なお、 映像フレームの位置情報を、 プログラムストリーム先頭も しくは VOBU先頭から、 各フレームの先頭位置までのデータサイ ズであるとして説明したが、 隣接フレーム間の開始ァドレスの差分 を位置情報として規定することもできる。 これは、 音声フレームの 位置情報も同様である。 さらに、 音声ストリームの数は 1つでも複 数でもよい。 音声ストリームが 2つ以上存在する場合であっても、 RD Iパック内に補助情報 (例えば図 2 3) を規定することができ る。  Although the position information of the video frame is described as the data size from the start of the program stream or VOBU to the start position of each frame, the difference in the start address between adjacent frames is defined as the position information. You can also. The same applies to the position information of the audio frame. Furthermore, the number of audio streams may be one or more. Even when there are two or more audio streams, auxiliary information (for example, Fig. 23) can be specified in the RDI pack.
また、 1以上の補助情報が記録されているか否かを示すために、 RD Iパックのメーカ拡張フィールド 6 7、 6 9内に、 補助情報が 記録されているかどうかを示すフラグ情報を併せて記録してもよい。  In addition, flag information indicating whether auxiliary information is recorded is also recorded in the manufacturer extension fields 67, 69 of the RDI pack to indicate whether one or more auxiliary information is recorded. May be.
V〇 B U内の映像フレーム情報および音声フレーム情報はその B Video frame information and audio frame information in V〇B U
OBU先頭の RD I _P CK内に格納されるとした。 しかし、 映像 フレーム情報および音声フレーム情報等の補助情報をストリーム中 の別の位置に格納してもよい。 また、 V〇 B U内の映像フレームに 同期する音声フレームに関する補助情報をその VO B U先頭の RD I _P C K内に格納してもよい。 It is stored in RDI_PCK at the beginning of OBU. However, auxiliary information such as video frame information and audio frame information may be stored at another position in the stream. In addition, auxiliary information on audio frames synchronized with the video frames in V〇BU may be stored in RDI_PCK at the beginning of the VOBU.
本実施の形態のプログラムストリームには、 トランスポ一トスト リームに変換するための補助情報が格納されている。 そこで、 トラ ンスポートストリームからプログラムストリームへのいわゆる逆変 換を考慮して、 トランスポ一トストリ一ム内にプログラムストリー ムに変換するための補助情報を格納してもよい。 補助情報は、 例え ばその補助情報を格納するための専用の卜ランスポ一トバケツトに 格納すればよい。 また、 P E Sストリ一ム内にプログラムストリー ムまたはトランスポートストリームに変換するための補助情報を格 納してもよい。 The program stream according to the present embodiment stores auxiliary information for conversion into a transport stream. Therefore, the so-called reverse conversion from transport stream to program stream is performed. In consideration of the conversion, auxiliary information for converting into a program stream may be stored in the transport stream. The auxiliary information may be stored, for example, in a dedicated transport bucket for storing the auxiliary information. Also, auxiliary information for converting to a program stream or a transport stream may be stored in the PES stream.
以上、 本発明の実施形態によるデータ処理装置を説明した。  The data processing device according to the embodiment of the present invention has been described above.
上述したデータ処理装置の各構成要素の動作は、 データ処理装置 に設けられた中央制御部 (図示せず) の指示に基づいて行われる。 中央制御部は、 データ処理装置のメモリ (図示せず) に配置された プログラムに基づいて指示を出し、 装置の全体的な動作を制御する。 プログラムは、 図 1 7、 1 8、 2 5等に記載された手順を実施し、 予め定められたデータ構造に応じてデータストリームを解析し、 ま たは、 そのようなデータ構造に適合するデ一タストリームを生成す る。  The operation of each component of the data processing device described above is performed based on an instruction from a central control unit (not shown) provided in the data processing device. The central control unit issues instructions based on a program arranged in a memory (not shown) of the data processing device, and controls the overall operation of the device. The program performs the procedures described in Figures 17, 18, 25, etc., parses the data stream according to a predetermined data structure, or converts data that conforms to such a data structure. Generate a data stream.
本明細書では、 MP E G 2プログラムストリームを例に説明した が、 MP E G 1のシステムストリームであってもよい。 また、 記録 媒体は相変化光ディスクであるとしたが、 例えば D VD— R AM、 DVD-R, DVD— RW、 DVD + RW、 MO、 CD-R, CD _ RW等の光ディスクや、 ハードディスク等の他のディスク形状の 記録媒体も利用できる。 また、 半導体メモリであってもよい。 これ に関連して、 読み書きへッドは光ディスク用のピックアップとした が、 例えば、 記録媒体が MOの場合にはピックアップ及び磁気へッ ドとなり、 またハードディスクの場合は磁気へッドとなる。 In the present specification, the MPEG2 program stream has been described as an example, but the system stream of MPEG1 may be used. Although the recording medium is a phase change optical disk, for example, optical disks such as DVD-RAM, DVD-R, DVD-RW, DVD + RW, MO, CD-R, CD_RW, and hard disk Other disk-shaped recording media can also be used. Further, it may be a semiconductor memory. In this connection, the read / write head is an optical disk pickup.For example, when the recording medium is MO, the pickup and the magnetic head are used. In the case of a hard disk, it becomes a magnetic head.
なお、 本発明の各実施形態において、 トランスポートストリーム は、 MP E Gを用いたデジタル放送規格に準拠した形式であっても よいし、 MP E Gを用いたデジタルデータ放送に準拠した形式であ つてもよい。 これにより、 デジタル放送用セッ 卜 トップボックス (S TB) との互換性を高めることができ、 またデータ放送受信機 能等の S TBの有する機能を活用することができる。  In each embodiment of the present invention, the transport stream may be in a format compliant with a digital broadcasting standard using MPEG, or may be in a format compliant with digital data broadcasting using MPEG. Good. As a result, compatibility with the digital broadcast set-top box (STB) can be improved, and the functions of the STB such as a data broadcast receiving function can be utilized.
本明細書では、 トランスポートストリ一ムへ変換後はわずかに転 送レートが増加する例を説明したが、 P Sの 1個のパックから 1 3 個の T Sパケットが変換されることを想定して、 変換後は 1 3Z 1 1倍の転送レートを想定して、 空きタイミングに PAT, PMT, P C Rを含む T Sパケットを揷入してもよい。 また、 1個のパック を 1 1個から 1 2個の T Sバケツトへ分割する例を挙げて説明した が、 その数を必ず 1 1個に収めるために、 1パック内のエレメン夕 リーストリ一ム部分のデータサイズを 2 0 24バイ卜以下に制限し てもよい。 2 0 24バイ ト以下にする理由は、 2 0 24バイ 卜はト ランスポートバケツ トのペイ口一ドサイズ ( 1 84バイ ト) のちよ うど 1 1個分に相当するからである。  In this specification, an example has been described in which the transfer rate slightly increases after conversion to the transport stream.However, it is assumed that 13 TS packets are converted from one pack of PS. However, after the conversion, a TS packet including PAT, PMT, and PCR may be inserted in the empty timing, assuming a transfer rate of 13Z11 times. In addition, although an example was described in which one pack was divided into 11 TS buckets from 11 packs, the element stream part in one pack was described in order to keep the number in 1 pack. Data size may be limited to 224 bytes or less. The reason why the number of bytes is equal to or less than 224 bytes is that 224 bytes is equivalent to 11 bytes, which is equal to the size of a pay bucket in a transport bucket (184 bytes).
データ処理装置 1 0は、 カムコーダの他、 例えば据え置き型の動 画記録装置、 またはプログラムストリームからトランスポートスト リームへのデータ変換を行う装置であってもよい。 ' さらに、 実施形態 1によるデータ処理装置では、 S CRギャップ はトランスポートバケツト変換時に PAT等を挿入する目的に使用 するとして説明したが、 プログラムストリーム中に別のパックを揷 入するために設けてもよい。 例えば、 プログラムストリーム中に 1 つの音声ストリームのみが含まれている場合に、 P S組立部 1 0 4 がシステムエンコード処理を行って時刻情報を再計算することなく、 第 2の音声データストリームを A—P C Kに挿入できるように、 S C Rギヤップを使用してもよい。 The data processing device 10 may be, for example, a stationary video recording device or a device that performs data conversion from a program stream to a transport stream, in addition to a camcorder. '' Furthermore, in the data processing device according to the first embodiment, the SCR gap is used for the purpose of inserting a PAT or the like at the time of transport bucket conversion. However, it may be provided to insert another pack into the program stream. For example, when only one audio stream is included in the program stream, the PS assembling unit 104 performs the system encoding process and recalculates the time information without re-calculating the second audio data stream. An SCR gap may be used so that it can be inserted into the PCK.
実施形態 3による処理で得られた P Sは、 メーカ拡張情報に各種 の補助情報が規定されているが、 補助情報を別途集めて M P E Gプ ログラムストリームとは別のデータファイルとして保持していても よい。  In the PS obtained by the processing according to the third embodiment, various types of auxiliary information are specified in the manufacturer extended information, but the auxiliary information may be separately collected and stored as a data file separate from the MPEG program stream. .
上述の説明では、 P Sの伝送レートは D V D— V R規格に準拠し て 1 0 . 0 8 M p b s以下であると想定しているが、 1 0 . 0 8 M b p sを超えてもよい。 本実施形態の処理によって生成された P S によれば、 ビットレー卜が上がってもトランスポートストリ一ムへ の変換容易性および変換効率には影響しないからである。  In the above description, the transmission rate of PS is assumed to be 10.08 Mbps or less in accordance with the DVD-VR standard, but it may exceed 10.08 Mbps. This is because, according to the PS generated by the processing of the present embodiment, even if the bit rate is increased, the conversion to the transport stream and the conversion efficiency are not affected.
以上のように本発明にかかるデータ処理装置によれば、 プロダラ ムストリ一ムで記録し、 かつトランスポートストリームへの変換が 効率的かつ容易である。 プログラムストリームで記録することより、 D V D機器や P C用の編集アプリケーシヨンソフトウエアとの親和 性が高い。 また、 トランスポートストリームへの変換が容易である ので 1 3 9 4インタフェースとの親和性も高い。 産業上の利用可能性 本発明によれば、 DVD— VR規格に準拠した映像データのプロ グラムストリームを、 例えば I E E E 1 3 94のデジタルィンタフ エース経由で伝送する場合に、 プログラムストリームをトランスポ 一卜ストリームに容易に変換することができる。 As described above, according to the data processing device of the present invention, recording in a program stream and conversion to a transport stream are efficient and easy. By recording in the program stream, it has high compatibility with editing application software for DVD devices and PCs. Also, since it is easy to convert to a transport stream, it has high affinity with the 1394 interface. Industrial applicability According to the present invention, when a program stream of video data conforming to the DVD-VR standard is transmitted, for example, via a digital interface of IEEE1394, the program stream can be easily converted to a transport stream. can do.

Claims

1 . 複数のフレームを含む映像および音声の少なくとも一方の信 号が入力される信号入力部と、 受け取った前記信号を圧縮符号化して、 符号化データを生成する 請 1. A signal input unit to which at least one of a video signal and an audio signal including a plurality of frames is input, and a compression and encoding of the received signal to generate encoded data.
圧縮部と、 A compression unit;
前記符号化データを分割して一定のデータサイズを有する 1以上 の  The encoded data is divided into at least one having a certain data size.
のパケッ トを生成し、 前記符号化データの再生を制御する制御情報 を格納した制御パケットを付加して、 データストリームを生成する 囲 And generating a data stream by adding a control packet storing control information for controlling the reproduction of the encoded data.
ストリーム組立部と を有し、 前記ストリーム組立部は、 各フレームについて、 前記デ 一タストリーム内の格納位置を示す位置情報を生成して、 前記制御 情報として前記制御バケツトに記述する、 データ処理装置。 A data processing device, comprising: a stream assembling unit, wherein the stream assembling unit generates, for each frame, position information indicating a storage position in the data stream, and describes the position information in the control bucket as the control information. .
2 . 前記ストリーム組立部は、 さらに各フレームの表示の夕イミ ングを示す時刻情報を生成して、 前記制御情報として前記制御パケ ットに記述する、 請求項 1に記載のデータ処理装置。 2. The data processing device according to claim 1, wherein the stream assembling unit further generates time information indicating evening of display of each frame and describes the time information in the control packet as the control information.
3 . .前記ストリーム組立部は、 さらに各フレームの復号化のタイ ミングを示す時刻情報を生成して、 前記制御情報として前記制御パ ケッ トに記述する、 請求項 2に記載のデータ処理装置。 3. The data processing device according to claim 2, wherein the stream assembling unit further generates time information indicating a timing of decoding of each frame, and describes the time information as the control information in the control packet.
4 . 前記ストリーム組立部は、 さらに各フレームのデ一夕サイズ を示すサイズ情報を生成して、 前記制御情報として前記制御バケツ 卜に記述する、 請求項 1に記載のデータ処理装置。 4. The stream assembling section is also the size of each frame The data processing device according to claim 1, wherein size information indicating the following is generated, and the size information is described as the control information in the control bucket.
5 . 前記ストリーム組立部は、 前記制御パケット内の、 任意の情 報を記述可能なフィールドに前記制御情報を記述する、 請求項 1か ら 4のいずれかに記載のデータ処理装置。 5. The data processing device according to claim 1, wherein the stream assembling unit describes the control information in a field in the control packet in which arbitrary information can be described.
6 . 前記ストリーム組立部は、 前記制御パケットとして制御パッ クを生成し、 前記制御パックを付加して、 前記データストリームと してプログラムストリームを生成する、 請求項 1に記載のデータ処 理装置。 6. The data processing device according to claim 1, wherein the stream assembling section generates a control pack as the control packet, adds the control pack, and generates a program stream as the data stream.
7 . 複数のフレームを含む映像および音声の少なくとも一方の信 号を入力するステツプと、 7. A step of inputting at least one of video and audio signals including a plurality of frames;
受け取った前記信号を圧縮符号化して、 符号化データを生成する ステップと、  Compression encoding the received signal to generate encoded data;
前記符号化データを分割して一定のデータサイズを有する 1以上 のパケットを生成するステップと、  Dividing the encoded data to generate one or more packets having a fixed data size;
前記 1以上のパケットに、 前記符号化データの再生を制御する制 御情報を格納した制御パケットを付加して、 データストリームを生 成するステップであって、 各フレームについて、 前記データストリ ーム内の格納位置を示す位置情報を生成して、 前記制御情報として 前記制御バケツトに記述するステップと を包含するデータ処理方法。 Adding a control packet storing control information for controlling the reproduction of the encoded data to the one or more packets to generate a data stream, wherein for each frame, the data stream is included in the data stream. Generating position information indicating the storage position of the control bucket and describing the control information in the control bucket as the control information; A data processing method including:
8 . 前記データストリームを生成するステップは、 各フレームの 表示のタイミングを示す時刻情報を生成して、 前記制御情報として 前記制御パケットに記述するステップをさらに包含する、 請求項 7 に記載のデータ処理方法。 8. The data processing according to claim 7, wherein the step of generating the data stream further includes a step of generating time information indicating a display timing of each frame and describing the control information as the control information in the control packet. Method.
9 . 前記デ一夕ストリームを生成するステップは、 各フレームの 復号化のタイミングを示す時刻情報を生成して、 前記制御情報とし て前記制御パケットに記述するステツプをさらに包含する、 請求項 8に記載のデータ処理方法。 9. The method according to claim 8, wherein the step of generating the overnight stream further includes a step of generating time information indicating a decoding timing of each frame, and describing the control information as the control information in the control packet. Data processing method described.
1 0 . 前記データストリームを生成するステップは、 各フレーム のデータサイズを示すサイズ情報を生成して、 前記制御情報として 前記制御バケツトに記述するステップをさらに包含する、 請求項 7 に記載のデータ処理方法。 10. The data processing according to claim 7, wherein the step of generating the data stream further includes a step of generating size information indicating a data size of each frame and describing the control information as the control information in the control bucket. Method.
1 1 . 前記データストリームを生成するステップは、 前記制御パ ケッ卜内の、 任意の情報を記述可能なフィールドに前記制御情報を 記述する、 請求項 6から 8のいずれかに記載のデータ処理方法。 11. The data processing method according to any one of claims 6 to 8, wherein the step of generating the data stream describes the control information in a field in the control packet in which arbitrary information can be described. .
1 2 . 前記データストリームを生成するステップは、 前記制御パ ケッ トとして制御パックを生成し、 前記制御パックを付加して、 前 2004/030358 12. The step of generating the data stream includes generating a control pack as the control packet, adding the control pack, 2004/030358
記デ—タストリームとしてプログラムストリームを生成する、 請求 項 7に記載のデータ処理方法。 The data processing method according to claim 7, wherein a program stream is generated as the data stream.
PCT/JP2003/012449 2002-09-30 2003-09-29 Data processing device WO2004030358A1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
AU2003266691A AU2003266691A1 (en) 2002-09-30 2003-09-29 Data processing device
JP2004539573A JP4566745B2 (en) 2002-09-30 2003-09-29 Data processing device

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2002/286790 2002-09-30
JP2002286790 2002-09-30
JP2003/108826 2003-04-14
JP2003108826 2003-04-14
JP2003118251 2003-04-23
JP2003/118251 2003-04-23

Publications (1)

Publication Number Publication Date
WO2004030358A1 true WO2004030358A1 (en) 2004-04-08

Family

ID=32045741

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2003/012449 WO2004030358A1 (en) 2002-09-30 2003-09-29 Data processing device

Country Status (3)

Country Link
JP (1) JP4566745B2 (en)
AU (1) AU2003266691A1 (en)
WO (1) WO2004030358A1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006157337A (en) * 2004-11-29 2006-06-15 Hitachi Kokusai Electric Inc Digital transmission system and transmission state display method
JP2007535860A (en) * 2004-04-30 2007-12-06 マイクロソフト コーポレーション Session description message extension
JP2009303231A (en) * 2009-08-07 2009-12-24 Hitachi Kokusai Electric Inc Digital transmission system
JP2012527815A (en) * 2009-05-18 2012-11-08 サムスン エレクトロニクス カンパニー リミテッド Encoder, decoder, encoding, and decoding method
JP2013512640A (en) * 2009-12-10 2013-04-11 サムスン エレクトロニクス カンパニー リミテッド Method for encoding information object and encoder using the same

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002118826A (en) * 2000-10-10 2002-04-19 Sharp Corp Data transfer method
JP2002165187A (en) * 1999-01-14 2002-06-07 Toshiba Corp Information medium and system appropriate for stream recording
JP2003519992A (en) * 1999-12-30 2003-06-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Data stream conversion method and device
JP2003228922A (en) * 2001-07-23 2003-08-15 Matsushita Electric Ind Co Ltd Information recording medium and device and method for recording information to information recording medium

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4197230B2 (en) * 2002-02-13 2008-12-17 パイオニア株式会社 FORMAT CONVERSION DEVICE, FORMAT CONVERSION METHOD, FORMAT CONVERSION PROCESSING PROGRAM, RECORDING MEDIUM CONTAINING FORMAT CONVERSION PROCESSING PROGRAM, AND INFORMATION RECORDING DEVICE, INFORMATION RECORDING METHOD, INFORMATION RECORDING PROCESSING PROGRAM, AND RECORDING MEDIUM CONTAINING INFORMATION RECORDING PROCESSING PROGRAM
JP2003317395A (en) * 2002-04-15 2003-11-07 Pioneer Electronic Corp Information recording device and information recording method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002165187A (en) * 1999-01-14 2002-06-07 Toshiba Corp Information medium and system appropriate for stream recording
JP2003519992A (en) * 1999-12-30 2003-06-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Data stream conversion method and device
JP2002118826A (en) * 2000-10-10 2002-04-19 Sharp Corp Data transfer method
JP2003228922A (en) * 2001-07-23 2003-08-15 Matsushita Electric Ind Co Ltd Information recording medium and device and method for recording information to information recording medium

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007535860A (en) * 2004-04-30 2007-12-06 マイクロソフト コーポレーション Session description message extension
US7783772B2 (en) 2004-04-30 2010-08-24 Microsoft Corporation Session description message extensions
JP2006157337A (en) * 2004-11-29 2006-06-15 Hitachi Kokusai Electric Inc Digital transmission system and transmission state display method
JP2012527815A (en) * 2009-05-18 2012-11-08 サムスン エレクトロニクス カンパニー リミテッド Encoder, decoder, encoding, and decoding method
US8737435B2 (en) 2009-05-18 2014-05-27 Samsung Electronics Co., Ltd. Encoder, decoder, encoding method, and decoding method
US9866338B2 (en) 2009-05-18 2018-01-09 Samsung Electronics., Ltd Encoding and decoding method for short-range communication using an acoustic communication channel
JP2009303231A (en) * 2009-08-07 2009-12-24 Hitachi Kokusai Electric Inc Digital transmission system
JP2013512640A (en) * 2009-12-10 2013-04-11 サムスン エレクトロニクス カンパニー リミテッド Method for encoding information object and encoder using the same
US8675646B2 (en) 2009-12-10 2014-03-18 Samsung Electronics Co., Ltd. Method for encoding information object and encoder using the same
US9438375B2 (en) 2009-12-10 2016-09-06 Samsung Electronics Co., Ltd Method for encoding information object and encoder using the same

Also Published As

Publication number Publication date
AU2003266691A1 (en) 2004-04-19
JPWO2004030358A1 (en) 2006-01-26
JP4566745B2 (en) 2010-10-20

Similar Documents

Publication Publication Date Title
US7945143B2 (en) Information recording medium, and apparatus and method for recording information on information recording medium
EP0949825B1 (en) Optical disc, optical disc recording method and apparatus
US7373079B2 (en) Method and an apparatus for stream conversion, a method and an apparatus for data recording, and data recording medium
US8290347B2 (en) Information recording medium, and apparatus and method for recording information to information recording medium
JP4951087B2 (en) Information recording medium, data reproducing apparatus and recording method
US7386223B2 (en) Method and an apparatus for stream conversion a method and an apparatus for data recording and data recording medium
JP4299836B2 (en) Data processing device
WO2001004893A1 (en) Av data recording device and method, disk recorded by the av data recording device and method, av data reproducing device and method therefor
JPWO2005015907A1 (en) Data processing device
JPWO2004080071A1 (en) Data processing device
JP4566745B2 (en) Data processing device
JP4426800B2 (en) AV data recording / reproducing apparatus and method, and recording medium recorded by the AV data recording / reproducing apparatus or method
US8081865B2 (en) AV data recording apparatus and method, recording media recorded by the same, AV data reproducing apparatus and method, and AV data recording and reproducing apparatus and method
JP3901555B2 (en) AV data recording apparatus and method, disc recorded by the AV data recording apparatus or method, and AV data reproducing apparatus and method or AV data recording / reproducing apparatus and method for reproducing the disc
JP4481929B2 (en) Data stream recording method and apparatus
JP3579386B2 (en) Format conversion apparatus and format conversion method
JP2003174622A (en) Audio/video information recording and reproducing device and method, and recording medium with information recorded thereon by using the audio/video information recording and reproducing device and method
JP2004072790A (en) Av data recording apparatus and method, disk recorded with the same av data recording apparatus or method, and av data reproducing apparatus and method
JP2004072791A (en) Av data recording apparatus and method, disk recorded with the same av data recording apparatus or method, and av data reproducing apparatus and method
WO2006064838A1 (en) Information recording medium containing a stream which can be converted at a high speed, recording device and recording method thereof

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2004539573

Country of ref document: JP

122 Ep: pct application non-entry in european phase