WO1996038843A1 - Procedes et dispositifs de codage/decodage de signaux audio - Google Patents

Procedes et dispositifs de codage/decodage de signaux audio Download PDF

Info

Publication number
WO1996038843A1
WO1996038843A1 PCT/JP1996/001490 JP9601490W WO9638843A1 WO 1996038843 A1 WO1996038843 A1 WO 1996038843A1 JP 9601490 W JP9601490 W JP 9601490W WO 9638843 A1 WO9638843 A1 WO 9638843A1
Authority
WO
WIPO (PCT)
Prior art keywords
frame
block
field
audio signal
encoded
Prior art date
Application number
PCT/JP1996/001490
Other languages
English (en)
French (fr)
Inventor
Masao Sasaki
Masahito Mori
Satoshi Takagi
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to DE69623771T priority Critical patent/DE69623771T2/de
Priority to EP96920030A priority patent/EP0829875B1/en
Publication of WO1996038843A1 publication Critical patent/WO1996038843A1/ja
Priority to US08/979,634 priority patent/US6480234B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1201Formatting, e.g. arrangement of data block or words on the record carriers on tapes
    • G11B20/1211Formatting, e.g. arrangement of data block or words on the record carriers on tapes with different data track configurations
    • G11B20/1214Formatting, e.g. arrangement of data block or words on the record carriers on tapes with different data track configurations for discontinuous data, e.g. digital information signals, computer programme data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • H04N5/602Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
    • H04N5/9265Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation with processing of the sound signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/806Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal
    • H04N9/8063Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components with processing of the sound signal using time division multiplex of the PCM audio and PCM video signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/14Digital recording or reproducing using self-clocking codes
    • G11B20/1403Digital recording or reproducing using self-clocking codes characterised by the use of two levels
    • G11B20/1423Code representation depending on subsequent bits, e.g. delay modulation, double density code, Miller code
    • G11B20/1426Code representation depending on subsequent bits, e.g. delay modulation, double density code, Miller code conversion to or from block codes or representations thereof
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/032Electronic editing of digitised analogue information signals, e.g. audio or video signals on tapes

Definitions

  • Audio signal encoding method and apparatus Audio signal encoding / decoding method, and
  • the present invention relates to an audio signal encoding method and apparatus, an audio signal encoding / decoding method and apparatus, and is applied to, for example, a recording / reproducing apparatus for encoding an audio signal in block units, transmitting the encoded audio signal together with a video signal, recording, and reproducing. It is preferable.
  • Background art
  • the audio coding system ATR AC Adaptive Transform Acoustic Coding
  • PASC Precision Adaptive Sub-band Coding
  • DCC digital compact cassette
  • quasi-instantaneous companding a coding method called quasi-instantaneous companding is used, and this coding method is also adopted in the audio standard of MPEG (Moving Pictures Expert Group).
  • MPEG Motion Pictures Expert Group
  • quasi-instantaneous compression and expansion focusing on the fact that the signal level fluctuates relatively slowly in an audio signal, the signal is divided into blocks of a predetermined number of samples, and data is compressed and expanded in block units .
  • video signals that transmit video that have a one-to-one correspondence with audio transmitted by audio signals are edited in units of frames or fields, but audio coding that uses blocks as coding units
  • the video signal The coding block length is set to a length independent of the number of samples per frame or field.
  • a system control unit provided on the reception or reproduction side decodes the video signal and the audio signal based on the time information added to the transmission data. It has been made to be.
  • an audio signal sampled at 48 kHz is encoded based on the MPEG layer I, which is the MPEG audio standard
  • a block sequence of 384 sample length per block is created.
  • the number of audio data samples corresponding to one video frame is 48 Ck. If the audio signal is sampled at (Hz), it will be 1601 or 1602 samples.
  • the coded video signal and the coded audio signal are to be decoded simultaneously, a coded audio block that spans two video frames of the video signal is generated. For this reason, when decoding an encoded audio signal after switching processing in units of frames or fields of a video signal as in editing, for example, a data loss state in which decoded data disappears in encoded blocks before and after the switching point.
  • the first audio signal has 383 samples of data before the video frame boundary and one sample of data after the video frame boundary, and one sample of data before the video frame boundary.
  • the data of 383 samples of the first audio signal and 383 samples of the second audio signal are used. Sum with sample data
  • the audio signal cannot be decoded during the period of data (ie, data for 766 samples) and the period of data for 256 samples before and after the subband coding (data for a total of 512 samples). Disclosure of the invention
  • the present invention provides a method for encoding audio data, which encodes an input audio signal in predetermined data units to form encoded audio data divided for each encoded block.
  • the audio signal is block coded to accommodate an integer number of audio coded blocks during the period corresponding to one frame or one field of the signal, thereby synchronizing with the frame or field of the video signal.
  • An encoded block sequence is formed.
  • the input audio signal is divided into blocks in a predetermined data unit and encoded to form an encoded block divided into blocks.
  • a code synchronized with the frame or field of the video signal by arranging an integer number of coding blocks within the period corresponding to one frame or one field. Forming a generalized block sequence.
  • the input audio signal is encoded in a predetermined data unit.
  • the audio signal encoding apparatus for forming encoded audio data divided for each encoding block a code divided for each block by encoding the input audio signal in units of a predetermined data unit.
  • Encoding means for forming an encoded block a phase difference between a frame or field boundary position of a video signal and an encoding block is determined, and an encoding block corresponding to the frame or field boundary position is determined based on the phase difference.
  • the detection means to be detected and the output of the coding means are input, and the block start position of the coding block corresponding to the frame or field boundary position is determined based on the detection result of the detection means.
  • Block boundary position and the frame or field boundary position Subsequent to the matched coded block, the coding synchronizes with the frame or field by arranging an integer number of coded blocks within the period corresponding to one frame or one field.
  • a memory means for outputting the block is provided.
  • the input audio signal is divided into blocks in a predetermined data unit and encoded to form an encoded block divided for each block.
  • the matched coding block by arranging the coding blocks so that an integer number of coding blocks fit within a period corresponding to one frame or one field, a frame or a field of a video signal can be obtained. Forming synchronized encoded audio data; and synthesizing the video signal.
  • Adding information representing a phase difference from the frame or field boundary position of the video signal in the encoded block before matching the block start position with the frame or field boundary position to the encoded audio data -
  • the input audio signal is encoded by the video signal encoding processing step, and the phase difference information is obtained from the encoded audio data to which the information indicating the phase difference is added.
  • Coded audio data decoding processing step comprising the steps of: detecting the information, and returning the phase relationship between the coded block and the video signal to the original state based on the detected phase difference information. To decode the encoded audio data.
  • encoding means for forming an encoded block divided into blocks by encoding an input audio signal into blocks in a predetermined data unit, and encoding a video signal frame or a field.
  • a phase difference between a boundary position and an encoding block is obtained, and a detection unit for detecting a coding block corresponding to a boundary position of a frame or a field based on the phase difference, and an output of the encoding unit are input.
  • the block start position of the coded block corresponding to the boundary position of the frame or the field is matched with the corresponding frame or field boundary position, and Following the coded block whose block start position matches the field boundary position, an integer number of periods correspond to one frame or one field
  • An audio signal encoding unit having phase difference adding means for adding to a coded block synchronized with a frame or a field, and further detecting phase difference information from encoded audio data formed by the audio signal encoding unit;
  • Coded audio data comprising: phase difference information detecting means; and memory means for returning a phase relationship between an encoded block and a video signal to an original state based on the phase difference information detected by the phase difference information detecting means. It has a decryption unit.
  • the decoding unit can also decode the encoded audio data near the switching point, and can reduce the occurrence of a period in which the decoded data disappears.
  • phase difference information between the video signal and the audio coding block detected by the detection means is added to the coded audio data, so that the audio coding block and the video signal are decoded on the decoding unit side based on the phase difference information.
  • the phase relationship with can easily be returned to the original state.
  • an integer number of encoded blocks are stored in a period corresponding to one frame or one field of a video signal, and an audio code synchronized with each frame or each field of the video signal is stored.
  • an audio code synchronized with each frame or each field of the video signal is stored.
  • phase difference information indicating the phase difference between the original coding program and the video signal used when synchronizing the coded audio data composed of the audio coding block synchronized with the frame or field of the video signal.
  • FIG. 1 is a block diagram showing the configuration of the audio signal encoding device according to the first embodiment.
  • 2 (A) to 2 (C) are schematic diagrams for explaining the input and output of the MPEG encoding circuit.
  • FIGS. 3A and 3B are schematic diagrams used to explain the operation of the phase comparator.
  • 4 (A) to 4 (D) are schematic diagrams for explaining the operation of the memory circuit in the encoding device.
  • FIG. 5 is a block diagram showing the configuration of the audio signal decoding device according to the first embodiment. is there.
  • 6 (A) to 6 (D) are schematic diagrams for explaining the operation of the memory circuit in the decoding device.
  • FIGS. 7A to 7D are schematic diagrams used to explain the operation of the memory circuit with respect to encoded data that has been subjected to switching processing in video signal frame units.
  • FIG. 8 is a schematic diagram showing an overlap state of an encoded block contained in one frame with respect to an original frame in the first embodiment.
  • FIG. 9 is a block diagram showing the configuration of the audio signal encoding device according to the second embodiment.
  • FIGS. 10A to 10D are schematic diagrams used to explain the operation of the memory circuit in the encoding device according to the second embodiment.
  • FIG. 11 is a block diagram showing the configuration of the audio signal decoding device according to the second embodiment.
  • FIGS. 12A to 12D are schematic diagrams used to explain the operation of the memory circuit in the decoding device of the second embodiment.
  • FIGS. 13 (A) to 13 (D) are schematic diagrams for explaining the operation of the memory circuit of the second embodiment with respect to encoded data which has been subjected to switching processing in video signal frame units.
  • FIG. 14 is a schematic diagram showing an overlap state of an encoded block contained in one frame with respect to an original frame in the second embodiment.
  • reference numeral 1 denotes an audio signal encoding apparatus as a whole, which is provided, for example, in an audio signal recording unit of a digital video tape recorder.
  • Sampling Input audio signal S AUD sampled at a frequency of 48 [kHz]
  • the block pulse signal SBLK which is a pulse signal that rises at every dioplock length of 384T (T represents a sampling period of 20.8 [sec] at a sampling frequency of 48 [kHz] of the audio signal)
  • the MPEG encoding circuit 2 Is input to
  • the MPEG encoding circuit 2 performs subband encoding of the input audio signal S AUD in block units synchronized with the block pulse signal S BLK based on the MPEG audio standard MPEG layer I. As a result, one sub-band coded block is formed for every 384 samples of input audio data, and the coded data S C0DE ! Is supplied to the memory circuit 3.
  • the MPEG encoding circuit 2 converts the input audio signal S AUD (FIG. 2 (B)) into data units synchronized with the block pulse signal S BLK (FIG. 2 (A)). )) Is divided into blocks, and sub-band coding is performed on each of the blocks to generate coded data S C0DE1 (FIG. 2 (C)) divided for each block.
  • the coded data S C0DE1 is output after being delayed by a time period T LG required for the encoding process.
  • the block pulse signal S BLK is input to the phase comparison circuit 4 together with the frame pulse signal S flp .
  • the frame pulse signal S FLP is a 1601 T or 1602 T pulse signal having a period that synchronizes the video signal frame frequency 29.97 [Hz] with the input audio signal S AUD sampling frequency 48 [kHz]. It consists of pulse trains that rise at time intervals.
  • the phase comparison circuit 4 has a window of 384T width over a range before and after the time position where the frame pulse signal S FLP (FIG. 3 (A)) rises.
  • the period W selected as the length of one cycle of the block pulse S BLK
  • the block pulse signal S BLK Fig. 3 (B)
  • the phase comparison circuit 4 compares the phase of the block pulse signal S BLK with the phase of the frame pulse signal S FLP, thereby obtaining the coding at the boundary position of the video frame.
  • a block is detected, a head block detection signal S2 representing the block number of the detected block is output to the memory circuit 3, and an offset amount (phase difference) from a frame boundary of the head block BK1 and the head block BK1 are detected.
  • the offset signal S 3 including the information indicating whether the block BK 1 overlaps with the immediately preceding coding block is output to the offset adding circuit 5.
  • one block pulse signal S BLK always rises in the window period W.
  • the head block detection signal S 2 representing the block starting from the block pulse S BLK (FIG. 3 (B)) which rises during this window period W can be output to the memory circuit 3.
  • the window period W having a width of 384T is set to a period from -351T to + 32T with reference to the rising position of the frame pulse S FLP .
  • the memory circuit 3 converts the input coded data S C0DE1 (FIG. 4B) from the MPEG coding circuit 2 into a frame pulse signal S FLP (FIG. (A) Store sequentially and asynchronously with the phase of).
  • the memory circuit 3 starts reading the first block BK 1 at the rise of the code frame pulse signal S CFP (FIG. 4 (C)), so that an integer number of coded blocks can be included in one frame.
  • the output encoded data S C0DE synchronized with the encoded frame pulse signal S CFP (Fig. 4 (C))
  • Code frame pulse signal S CFP is a signal indicating the output phase of the marks Goka audio data S C0DE3 output in frame units, like the frame pulse signal S FLP rises at 1601T or 1602T intervals.
  • the audio data written as encoded data SC0DE1 to the memory circuit 3 at an asynchronous timing to the video frame is synchronized with the video frame, and is transmitted from the first block to the one video frame. It is read out as coded data SC0DE2 containing audio block data for an integer number of blocks (for example, 5 blocks).
  • the memory circuit 3 is designed to store 5 blocks (1601.6 ⁇ 384) of audio data in the memory circuit 3 so that five blocks of audio data can be stored in one video frame. Read at twice the speed.
  • the value of 1601.6 represents the number of samples of audio data in one video frame, and is an average value obtained from the generation probability of the number of samples of video data (ie, 1601 samples and 1602 samples).
  • the audio data of memory circuit 3 is read only once in order to read out audio data of the same number of samples as the number of samples for one video frame from memory circuit 3 as output encoded data SC0DE2.
  • the shortage may occur, and at this time, the memory circuit 3 may not be able to provide enough audio blocks for the number of samples that are insufficient at the end of one video frame period.
  • the data of the first block (BK 1 to the fifth audio block) is read in duplicate.
  • Whether or not the audio block is read from the memory circuit 3 in an overlapping manner is determined by whether or not the phase comparison circuit 4 counts the first block of the fifth block counted from the detected first block BK 1 into the window period W. Is determined by detecting. When it is determined that the head position of the fifth block counted from the head block BK 1 has entered the window period W, the phase comparison circuit 4 determines the position of the fifth block based on the head block examination signal S 2. The memory circuit 3 is controlled so as to read the blocks redundantly. On the other hand, if the start position of the fifth audio block counted from the start block BK1 does not fall within the window period W, no duplicate reading is performed.
  • the offset addition circuit 5 forms the final encoded audio data SC0DE3 by adding the offset signal S3 as header information at the beginning of each frame (or at the beginning of each encoded block). Then, the encoded audio data SC0DE is transmitted to a recording unit of the digital VTR and recorded on a recording medium.
  • the encoded audio data SC0DE3 reproduced from the recording medium by the reproduction unit of the digital VTR is decoded in the audio signal decoding device 10 as shown in FIG.
  • the audio signal decoding device 10 transmits data from the digital VTR playback unit.
  • the transmitted encoded audio data SC0DE3 is sequentially stored in the memory circuit 11 and input to the offset extracting circuit 12.
  • Offset extracting circuit 1 based on the block pulse signal S BLK or the code frame pulse signal S CFP, the offset signal S 3 to the top (or beginning of each coded block) is added to each frame extraction Then, the offset signal S 3 is output to the phase calculation circuit 13.
  • the offset signal S 3 and the frame pulse signal S FLP synchronized with the video signal frame are input to the phase calculation circuit 13, and the phase of the first block is determined based on the frame pulse signal S FLP.
  • the head block phase signal S 4 to be represented is obtained by calculation and output to the memory circuit 11.
  • the memory circuit 11 encodes encoded audio data S C0DE3 (FIG. 6 (B)) synchronized with the code frame pulse signal S CFP (FIG. 6 (A)). Then, based on the first block phase signal S 4 given from the phase operation circuit 13, each encoding that is offset to be synchronized with the frame pulse signal S FLP (Fig. 6 (C)) at the time of encoding The block is read at the timing of offsetting by the offset amount TOFF so as to return the block to the original position, and is output as coded audio data SC0DE4 (Fig. 6 (D)). At this time, from the memory circuit 11, only one of the overlapping blocks is read out based on the overlapping information for the coding block specified by the offset signal.
  • the memory circuit 3 of the audio signal encoding apparatus 1 converts the block phase of the encoded block converted to be synchronized with the frame pulse signal S FLP into the memory circuit 11
  • encoded audio data S C0DE4 composed of the encoded block data returned to the original state at the time of reading can be obtained.
  • This encoded audio data S C0DE4 is decoded by the MPEG decoding circuit 14, and
  • the decoded audio signal S5 is output after being delayed by a fixed amount so as to synchronize with the video signal.
  • the AUD is block-coded in units of 384 samples in accordance with the audio standard MPEG layer 1 of the MPEG in the MPEG encoding circuit 2 of the audio signal encoding device 1.
  • This encoded block is temporarily stored in the memory circuit 3, and is temporarily stored in the memory circuit 3.
  • By controlling the timing and reading speed for reading out circuit 3, an integer number of audio blocks are arranged so as to fit in one video frame period, whereby encoded data SC0DE2 synchronized with the video signal frame is obtained. It is formed.
  • the encoded audio data S CODE3 thus formed is decoded by the audio signal decoding device 10 as it is or after switching processing such as editing in video signal frame units.
  • the audio signal decoding device 10 controls the reading of the memory circuit 11 according to the offset signal S3 to return the phase of the coded block shifted at the time of coding to the original state, and then performs MPEG decoding. Audio data is decoded by the conversion circuit 14 I do.
  • the encoded audio data SC0DE3 is input to the audio signal decoding device 10 in an as-is array encoded by the audio signal encoding device 1, all audio encoded blocks , Offset information, duplicate block information and audio data can be written to the memory circuit 11, and all the block codes can be decoded without loss as shown in FIGS. 6 (A) to 6 (D). Is done.
  • Encoded audio data SC0DE3 (FIG. 7 (B)) obtained by insert- editing the blocks of the audio data "A” to “D” immediately thereafter is input to the audio signal decoding device 10.
  • the offset processing for the immediately following audio data “A” to “D” is performed by the amount corresponding to the decoded offset information, so that the block of the immediately following audio data “A” to “D” is processed.
  • the first block “A” overlaps a part of the last block “5” of the immediately preceding audio data block “1” to “5”. Can not).
  • the duration of the tail block “5” is shorter than 384T, so that the data of the tail block “5” is partially lost.
  • the period in which the loss occurs is at most 383T, and the period of 766 samples and the related period before and after the period of 766 samples because information for decoding audio data is not available as before. Compared to the case where the entire block data cannot be decoded in the period of 256 samples, data loss can be reduced remarkably.
  • an integer number of codes are set within a period corresponding to one frame of a video signal.
  • the offset amount from the frame boundary of the coded block when the coded block is phase-matched to the frame during encoding is added to the encoded audio data, and the original phase relationship is referred to during decoding by referring to the offset amount.
  • reference numeral 20 denotes an audio signal encoding apparatus according to the second embodiment.
  • the memory circuit 21 is arranged as shown in FIG.
  • encoded data S C0DE2 ′ such that six audio encoded blocks fit within a period corresponding to one frame of the video signal
  • the encoded block is synchronized with the frame of the video signal.
  • the audio signal encoding device 20 sets a window period W having a length equal to the width of one encoded block including the frame pulse signal S FLP , as in the case of the first embodiment.
  • the coded block generated during the period W is defined as the first block BK1, and the audio block boundary position of the first block BK1 is aligned with the video frame boundary position.
  • the coding blocks are arranged so that six audio blocks including the head block BK1 are included within a period corresponding to one video frame.
  • the audio signal encoding device 20 writes the output of the MPEG encoding circuit 2 into the memory circuit 21, and based on the first block detection signal S 2 from the phase comparator 4, the audio signal encoding device 20 shown in FIG. As shown in), read the audio data for 6 blocks.
  • the fifth audio block from the first block is the window period If the fifth audio block does not enter the window period W, the fifth audio block is duplicated when the fifth audio block is read out. Not read.
  • the sixth block BK2 is always read in duplicate.
  • reference numeral 30 denotes an audio signal decoding apparatus according to the second embodiment, and encoded audio formed by the audio signal encoding apparatus 20.
  • the read operation of the memory circuit 31 is controlled based on the first block phase signal S 4 output from the phase operation circuit 13, whereby As shown in (A) to (D), the audio coded data S CODE4 ′ whose phase relationship with the video signal has been returned to the original state is output from the memory circuit 31.
  • the encoded audio data S C0DE3 ′ of the original array encoded by the audio signal encoding device 20 is input to the audio signal decoding device 30.
  • the audio data of all the blocks is completely decoded.
  • the encoded audio data S C0DE3 ′ which has been subjected to switching processing at the switching point SP by editing is input to the audio signal decoding apparatus 30. If the audio data "A” is offset immediately after the switching point SP, the audio data "A” is added to the tail of the audio data "10” and "11” immediately before the switching point SP. , The read data of the memory circuit 31 is not continuous, and as a result, an incomplete coded block is generated for the immediately preceding data “11” and “10” of the output SC0DE4 ′.
  • the encoded audio data S C0 DE 3 ′ formed by the audio signal encoding device 20 overlaps a plurality of video frames beyond the video frame boundary as shown in FIG. Since the coded blocks are allocated so as to fit within the period corresponding to one video frame, if the two audio signal decoding devices 30 described above are provided, FIG. 13 (B As a result, even when the encoded audio data SC 0 DE 3 ′ subjected to the switching process is received, all the encoded blocks in the frame can be decoded. Also, even in the case of one system, even if it is possible to decode all 6 blocks in the period corresponding to one video frame of 1601 T or 1602 T, similarly, almost all the coding blocks in the frame are decoded. Can be decrypted. .
  • the audio signal encoding apparatus 20 sets the encoded audio data of six blocks completely covering each video frame of the video signal within a period corresponding to one video frame.
  • encoded audio data SCODE 3 ′ in which one or a plurality of audio blocks overlap before and after the code frame pulse SCFP is formed.
  • the audio signal encoding device 20 In the second embodiment described above, the audio signal encoding device 20 thus, the entirety of the encoded audio data for six blocks is set to be within the period corresponding to one video frame, but the audio data corresponding to each video frame has the sixth block data at the rear end. Even if the coding efficiency is increased by not encoding the data at the end of the data, the same effect as that obtained by the second embodiment can be obtained.
  • the bit rate is 384 [kbps], and the total number of bits per block when the sampling frequency is 48 [kHz] is 3072 bits.
  • the breakdown of the 3072 bits is, in order from the top, header information is 32 bits, bit allocation information is 128 bits, scale factor information is up to 192 bits, and the rest is subband data .
  • the low-frequency signal portion is recorded first.
  • the data at the end of the bit stream is not stored. Is not recorded in the memory circuit 21. That is, by recording 352 bits necessary for recording header information, bit allocation information, and scale factor information and 672 bits of subband data, for example, 672 bits, the total number of recording bits becomes 1024 bits. I do. The number of bits at this time is one-third that of the original bit stream, and as a result, coding efficiency can be improved.
  • the audio signal corresponding to each video frame can be almost completely decoded from the encoded data subjected to the switching processing. become able to.
  • the range of the window period W should be selected so as to match the encoded block length. If this is the case, the same effect as that of the embodiment can be obtained.
  • the encoded data formed by the audio signal encoding device 1 is, as shown in FIG. 8, a plurality of encoded data extending beyond the boundary of a video frame having a length of 1601T or 1602T. Since the coded block data (384T X 5) having a length overlapping with the video frame is allocated so as to be included in the period corresponding to one video frame, the above-described audio signal decoding apparatus 10 is used. If two systems are provided, even if coded data that has been subjected to switching processing as shown in Figs. 7 (A) to 7 (D) is received, the period during which the encoded audio data cannot be decoded SCODES can be further reduced. If a sound quality improvement process such as a cross-feed process is performed, a decoded audio signal with higher quality can be obtained.
  • the window period W is set to a period from -351T to + 32T, but instead, it can be set from -192T to + 192T.
  • Various changes can be made.
  • the present invention can be used for a video signal processing device that transmits a video and an audio signal corresponding to the video signal together (records, reproduces, or sends the data through a transmission path).

Description

明細書 発明の名称
オーディオ信号符号化方法及び装置、 オーディオ信号符号化復号化方法及び
技術分野
本発明はオーディオ信号符号化方法及び装置、 オーディオ信号符号化復号化方 法及び装置に関し、 例えばオーディオ信号をブロック単位で符号化してビデオ信 号と共に伝送し、 記録し、 再生する記録再生装置に適用して好適なものである。 背景技術
従来、 オーディォ信号をブロック単位で符号化してデータ量を削減する方法と して、 サブバンド符号化方法や変換符号化方法がある。 例えばミニ,ディスク (
MD) で用いられているオーディオ符号化方式 ATR A C (Adaptive Transform Acoustic Coding) や、 ディジタル · コンパク ト · カセッ ト (D C C) で用いら れている符号化方式 P A S C (Precision Adaptive Sub-band Coding) では、 D C T (Discrete Cosine Transform ) 係数や帯域分割されたデータを符号化して いる。
このように従来のオーディオ符号化方式では、 準瞬時圧伸と呼ばれる符号化方 式が用いられ、 この符号化方式は MP EG (Moving Pictures Expert Group) の 音声規格にも採用されている。 準瞬時圧伸は、 オーディオ信号においては、 信号 レベルの変動速度が比較的緩やかである点に着目して、 信号を所定サンプル数の ブロックに分け、 当該ブロック単位でデータを圧縮及び伸長処理をする。
ところで、 オーディオ信号によって伝送される音声と一対一の対応関係にある 映像を伝送するビデオ信号は、 フレーム又はフィ一ルド単位で編集が行われてい るが、 ブロックを符号化単位とするオーディオ符号化方式では、 ビデオ信号のフ レーム又はフィールド当りのサンプル数とは無関係の長さに符号化ブロック長が 決められている。
このため符号化されたオーディオ信号を符号化されたビデオ信号と一緒に伝送 したり、 記録、 再生したりする場合には、 ビデオ信号及びオーディオ信号間の復 号同期をとるために、 ビデオ信号及びオーディオ信号にそれぞれ時刻情報を付加 して伝送し、 受信時又は再生時には受信又は再生側に設けられたシステム制御部 が、 伝送データに付加されている時刻情報に基づいてビデオ信号及びオーディォ 信号を復号するようになされている。
しかしながら、 このようにした場合、 ビデオ信号に同期させてオーディオ信号 を復号しょうとすると、 オーディオ信号に復号できない期間が生ずる問題がある
。 例えば 48 〔k Hz〕 でサンプリ ングしたオーディオ信号を M P E Gの音声規格で ある M P E Gレイヤ I に基づいて符号化すると、 1 ブロック 384サンプル長のブ ロック列が作られる。 一方、 ' 525/59. 94ビデオシステム (走査線数が 525本で、 フィールド周波数が 59. 94 〔Hz〕 のビデオシステム) では、 1 ビデオフレームに 相当するオーディオデータのサンプル数は、 48 C k Hz) でオーディオ信号をサン プリ ングした場合、 1601又は 1602サンプルとなる。
この結果符号化されたビデオ信号と符号化されたオーディオ信号を同時に復号 しょうとすると、 ビデオ信号の 2つのビデオフレームに跨がる符号化オーディォ ブロックが生ずる。 このため、 例えば編集のようにビデオ信号のフレーム単位又 はフィールド単位で符号化オーディオ信号をスイッチング処理した後に復号する 場合、 スイッチング点前後の符号化ブロックにおいて復号デ一夕がなくなるよう なデータ欠落状態になるおそれがある。 因に、 最悪の場合、 ビデオフレームの境 界前に 383サンプルのデータをもちかつビデオフレームの境界後に 1サンプルの データをもつ第 1のオーディオ信号と、 ビデオフレームの境界前に 1サンプルの データをもちかつビデオフレームの境界後に 383サンプルのデータをもつ第 2の オーディオ信号とを接ぐような編集をする場合には、 第 1 のオーディオ信号の 3 83サンプル分のデータと第 2のオーディオ信号の 383サンプル分のデータとの和 のデータ (すなわち 766サンプル分のデータ) の期間と、 サブバン ドコ一ディン グしているのでその前後 256サンプル分のデータ (合計 512サンプル分のデータ ) の期間についてオーディオ信号の復号ができなくなる。 発明の開示
本発明はビデオ信号のフ レーム又はフィールドに同期しないブロック単位で符 号化されたオーディォ信号を、 ビデオ信号のフレーム又はフィールド単位で復号 した場合でも、 復号デ一夕がなくなるような期間を生じさせることがないような 符号化オーディオデータを伝送し、 復号し得るオーディオ信号符号化方法及び装 置、 オーディオ信号符号化復号化方法及び装置を提案しょうとするものである。 かかる課題を解決するため本発明においては、 入力オーディオ信号を所定のデ 一夕単位で符号化することにより符号化ブロックごとに区切られた符号化オーデ ィォデータを形成するオーディオ信号符号化方法において、 ビデオ信号の 1 フレ ーム又は 1 フィ一ルドに対応する期間に整数個のオーディオ符号化ブロックを収 めるようにオーディオ信号をブロック符合化することにより、 ビデオ信号のフレ ーム又はフィールドに同期した符号化ブロック列を形成するようにする。
また本発明においては、 入力オーディォ信号を所定のデータ単位でブロック化 して符号化することによりブロックごとに区切られた符号化ブロックを形成する ステップと、 この符号化ブロックのうち、 ビデオ信号のフ レーム又はフィールド の境界位置に対応する符号化ブロックのブロック先頭位置を、 対応するビデオ信 号のフ レーム又はフィールド境界位置に一致させるステップと、 ビデオ信号のフ レーム又はフィールド境界位置にブロック先頭位置を一致させた符号化ブロック に続いて、 1 フレーム又は 1 フィ一ルドに対応する期間内に整数個の符号化プロ ックが収まるように配列することにより、 ビデオ信号のフレーム又はフィールド に同期した符号化ブロック列を形成するステップとをもつようにする。
また本発明においては、 入力オーディオ信号を所定のデータ単位で符号化する ことにより符号化ブロックごとに区切られた符号化オーディオデータを形成する オーディオ信号符号化装置において、 入力オーディオ信号を所定のデ一夕単位で ブロック化して符号化することによりブロックごとに区切られた符号化ブロック を形成する符号化手段と、 ビデオ信号のフレーム又はフィールドの境界位置と符 号化プロックとの位相差を求め、 当該位相差に基づいてフレーム又はフィールド の境界位置に対応する符号化ブロックを検出する検出手段と、 符号化手段の出力 を入力し、 検出手段の検出結果に基づいてフ レーム又はフィ一ルドの境界位置に 対応する符号化ブロックのブロック先頭位置を、 対応するフ レーム又はフィール ド境界位置に一致させ、 かつ当該フレーム又はフィールド境界位置にブロック先 頭位置を一致させた符号化ブロックに続いて、 1 フレーム又は 1 フィ一ルドに対 応する期間に整数個の符号化ブロックが収まるように配列することにより、 フ レ ーム又はフィール ドに同期した符号化ブロックを出力するメモリ手段とをもつよ うにする。
また本発明においては、 入力オーディオ信号を所定のデータ単位でブロック化 して符号化することによりブロックごとに区切られた符号化ブロックを形成する ステップと、 符号化ブロックのうち、 ビデオ信号のフ レーム又はフィール ドの境 界位置に対応する符号化ブロックのブロック先頭位置を、 対応するビデオ信号の フレーム又はフィールド境界位置に一致させるステップと、 ビデオ信号のフレ一 ム又はフィールド境界位置にブロック先頭位置を一致させた符号化プロックに続 いて、 1 フレーム又は 1 フィールドに対応する期間内に整数個の符号化ブロック が収まるように符号化ブロックを配列することにより、 ビデオ信号のフレーム又 はフィ一ルドに同期した符号化オーディオデータを形成するステップと、 ビデオ 信号のフレーム又はフィールド境界位置にブロック先頭位置を一致させる前の符 号化ブロックにおける、 ビデオ信号のフレーム又はフィールド境界位置からの位 相差を表わす情報を、 符号化オーディオデータに付加するステップとを有するォ —ディォ信号符号化処理ステップによって入力オーディオ信号を符号化すると共 に、 位相差を表わす情報が付加された符号化オーディオデー夕から当該位相差情 報を検出するステップと、 検出された位相差情報に基づいて、 符号化ブロックと ビデオ信号との間の位相関係を元の状態に戻すステップとを有する符号化オーデ ィォデータ復号化処理ステップとにより符号化されたオーディオデータを復号す るようにする。
さらに本発明においては、 入力オーディオ信号を所定のデータ単位でブロック 化して符号化することによりブロックごとに区切られた符号化ブロックを形成す る符号化手段と、 ビデオ信号のフレーム又はフィ一ルドの境界位置と符号化プロ ックとの位相差を求め、 当該位相差に基づいてフレーム又はフィ一ルドの境界位 置に対応する符号化ブロックを検出する検出手段と、 符号化手段の出力を入力し 、 検出手段の検出結果に基づいてフレーム又はフィ一ルドの境界位置に対応する 符号化ブロックのブロック先頭位置を、 対応するフレーム又はフィ一ルド境界位 置に一致させ、 かつ当該フレーム又はフィ一ルド境界位置にブロック先頭位置を 一致させた符号化ブロックに続いて、 1 フレーム又は 1 フィ一ルドに対応する期 間に整数個の符号化ブロックが収まるように配列することにより、 フレーム又は フィ一ルドに同期した符号化ブロックを出力するメモリ手段と、 検出手段によつ て検出された位相差を、 メモリ手段から出力されるフ レーム又はフィールドに同 期した符号化ブロックに付加する位相差付加手段とを有するオーディオ信号符号 化部をもっと共に、 オーディオ信号符号化部によって形成された符号化オーディ ォデータから位相差情報を検出する位相差情報検出手段と、 位相差情報検出手段 によって検出された位相差情報に基づいて、 符号化ブロックとビデオ信号との間 の位相関係を元の状態に戻すメモリ手段とを有する符号化オーディオデータ復号 化部をもつようにする。
ビデオ信号の 1 フレーム又は 1 フィールドに対応する期間内に整数個の符号化 ブロックを収めるようにすることにより、 ビデオ信号のフレーム又はフィールド に同期した符号化ブロック列を形成するようにすれば、 ビデオ信号のフ レームや フィールド単位で編集等のスイツチング処理をした場合でも、 当該スイッチング 点におけるオーディオ符号化ブロックの分断を生じさせないようにすることがで きる。 この結果復号部側では、 スイッチング点付近における符号化オーディオデ —タをも復号できるようになり、 復号データがなくなるような期間を生じさせる ことを減少させることができる。
また検出手段によって検出したビデオ信号とオーディオ符号化ブロックとの位 相差情報を符号化オーディオデータに付加するようにしたことにより、 復号部側 においてこの位相差情報に基づいてオーディオ符号化ブロックとビデオ信号との 位相関係を容易に元の状態に戻すことができる。
このように本発明によれば、 ビデオ信号の 1 フレーム又は 1 フィ一ルドに対応 する期間に整数個の符号化ブロックを収めて、 ビデオ信号の各フレーム又は各フ ィ一ルドに同期したオーディォ符号化ブロックを形成するようにしたことにより 、 ビデオ信号のフレーム単位又はフィールド単位でスイッチングした場合でも、 ほとんどの符号化オーディオデータを復号することができる。
またビデオ信号のフレーム又はフィールドに同期したオーディオ符号化ブロッ クでなる符号化オーディオデータに、 同期をとる際に用いた、 元々の符号化プロ ックとビデオ信号との位相差を表わす位相差情報を付加するようにしたことによ り、 復号の際の位相管理が容易になり、 その結果復号化装置の構成を簡易化でき る。 図面の簡単な説明
図 1 は第 1実施例によるオーディオ信号符号化装置の構成を示すブロック図で ある。
図 2 ( A ) 〜 (C ) は M P E G符号化回路の入出力の説明に供する略線図であ る。
図 3 ( A ) 及び (B ) は位相比較器の動作の説明に供する略線図である。 図 4 ( A ) ~ ( D ) は符号化装置におけるメモリ回路の動作の説明に供する略 線図である。
図 5は第 1実施例によるオーディオ信号復号化装置の構成を示すブロック図で ある。
図 6 (A) 〜 (D) は復号化装置におけるメモリ回路の動作の説明に供する略 線図である。
図 7 (A) 〜 (D) はビデオ信号のフ レーム単位でスイッチング処理された符 号化データに対するメモリ回路の動作の説明に供する略線図である。
図 8は第 1実施例において 1フレーム内に収められる符号化ブロックの元々の フレームに対するオーバ一ラップ状態を示す略線図である。
図 9は第 2実施例によるオーディオ信号符号化装置の構成を示すブロック図で ある。
図 1 0 (A) ~ (D) は第 2実施例の符号化装置におけるメモリ回路の動作の 説明に供する略線図である。
図 1 1は第 2実施例によるオーディオ信号復号化装置の構成を示すブロック図 である。
図 1 2 (A) ~ (D) は第 2実施例の復号化装置におけるメモリ回路の動作の 説明に供する略線図である。
図 1 3 (A) 〜 (D) はビデオ信号のフレーム単位でスイッチング処理された 符号化データに対する、 第 2実施例のメモリ回路の動作の説明に供する略線図で ある。
図 1 4は第 2実施例において 1フレーム内に収められる符号化ブロックの元々 のフレームに対するオーバ一ラップ状態を示す略線図である。 発明を実施するための最良の形態
以下図面について、 本発明の一実施例を詳述する。
( 1 ) 第 1実施例
図 1において、 1は全体としてオーディオ信号符号化装置を示し、 例えばディ ジ夕ルビデオテープレコーダの音声信号記録部に設けられている。 サンプリ ング 周波数 48 [kHz] でサンプリ ングされてなる入力オーディオ信号 SAUD と、 ォ一 ディオプロック長 384T (Tはオーディオ信号のサンプリ ング周波数 48[kHz] に おけるサンプリ ング周期 20.8 〔 sec 〕 を表わす) ごとに立ち上がるパルス信号 でなるブロックパルス信号 SBLK とが、 MP E G符号化回路 2に入力される。
MP E G符号化回路 2はブロックパルス信号 SBLK に同期したブロック単位で 入カオ一ディォ信号 S AUD を MP E Gの音声規格 MP E Gレイヤ Iに基づいてサ ブバン ド符号化する。 これにより、 384 サンプルの入力オーディオデータごとに 1つのサブバン ド符号化ブロックが形成され、 かく して得た符号化データ SC0DE ! がメモリ回路 3に供給される。
MP EG符号化回路 2は、 図 2 (A) 〜 (C) に示すように、 ブロックパルス 信号 SBLK (図 2 (A) ) に同期したデータ単位で入力オーディオ信号 SAUD ( 図 2 (B) ) を分割することによりブロック化し、 当該ブロック化したデータご とにサブバン ド符号化処理を施すことにより、 ブロックごとに区切られた符号化 データ SC0DE1 (図 2 (C) ) を生成する。 ここで符号化データ SC0DE1 は符号 化処理に要する時間分 TLGだけ遅延された後出力される。
ブロックパルス信号 SBLK はフレームパルス信号 S flp と共に位相比較回路 4 に入力される。 フ レームパルス信号 S FLP は、 ビデオ信号のフレーム周波数 29. 97 〔Hz〕 を入力オーディオ信号 S AUD のサンプリ ング周波数 48 [kHz] に同期さ せた周期をもつパルス信号として、 1601 T又は 1602 Tの時間間隔で立ち上がるパ ルス列でなる。
位相比較回路 4は、 図 3 (A) 及び (B) に示すように、 フレームパルス信号 S FLP (図 3 (A) ) が立上る時間位置の前後の範囲に亘つて幅 384Tのウィ ン ドウ期間 W (ブロックパルス SBLK 1周期の長さに選定されている) を設定し、 このウィン ドウ期間 W内に立上るようなブロックパルス信号 SBLK (図 3 (B) ) を検出することにより、 先頭ブロック B K 1のブロック番号及び当該先頭プロ ック B K 1のオフセッ ト量 TOFF を検出する。
かく して位相比較回路 4は、 ブロックパルス信号 S BLK とフレームパルス信号 S FLP との位相を比較することにより、 ビデオフレームの境界位置にある符号化 ブロックを検出し、 当該検出ブロックのブロック番号を表す先頭ブロック検出信 号 S 2をメモリ回路 3に出力すると共に、 先頭ブロック B K 1のフレーム境界か らのオフセッ ト量 (位相差) と、 当該先頭ブロック B K 1が直前の符号化ブロッ クと重複しているか否かを表す情報とを含むオフセッ ト信号 S 3をオフセッ 卜付 加回路 5に出力する。
このように、 ウィン ドウ期間 Wの幅をブロック長に等しい期間 384Tに設定す ることにより、 ウイン ドウ期間 W内では必ず 1つのブロックパルス信号 SBLK が 立ち上がることになるので、 位相比較回路 4は、 このウィン ドウ期間 W内に立ち 上がるブロックパルス SBLK (図 3 (B) ) から始まるブロックを表わす先頭ブ ロック検出信号 S 2をメモリ回路 3に出力することができる。
この実施例の場合、 幅 384Tのウィン ドウ期間 Wは、 フレームパルス SFLP の 立上り位置を基準と して、 -351Tから +32 Tまでの期間に設定される。
メモリ回路 3は、 図 4 (A) ~ (D) に示すように、 MP EG符号化回路 2か らの入力符号化データ SC0DE1 (図 4 (B) ) をフレームパルス信号 SFLP (図 4 (A) ) の位相とは非同期で順次格納する。 これに対してメモリ回路 3は、 符 号フレームパルス信号 SCFP (図 4 (C) ) の立上りにより先頭ブロック B K 1 の読出しを開始し、 かつ 1フレーム内に整数個の符号化ブロックが収まるような 速い読出速度で符号化データ SC0DE2 (図 4 (D) ) を読み出すことにより、 符 号フレームパルス信号 SCFP (図 4 (C) ) に同期した出力符号化データ SC0DE
2 を出力する。 符号フレームパルス信号 SCFP は、 フレーム単位で出力される符 号化オーディオデータ SC0DE3 の出力位相を示す信号であり、 フレームパルス信 号 S FLP と同様に 1601T又は 1602T間隔で立ち上がる。
このようにしてメモリ回路 3に対して、 ビデオフレームに非同期のタイ ミ ング で符号化データ SC0DE1 と して書き込まれたオーディオデータは、 ビデオフレー ムに同期し、 かつ 1 ビデオフレームに先頭ブロックから整数ブロック分 (例えば 5ブロック分) のオーディオブロックデータを収めてなる符号化データ SC0DE2 として読み出される。 この実施例の場合、 メモリ回路 3は、 1 ビデオフ レームに 5ブロック分のォー ディォデータを収めるように、 メモリ回路 3に対するオーディオデ一夕の書込速 度に対して 5 Z (1601.6ノ 384)倍の速い速度で読み出す。 ここで、 1601.6の値は 、 1 ビデオフレーム中のオーディオデータのサンプル数を表し、 ビデオデ一夕の サンプル数 (すなわち 1601サンプル及び 1602サンプル) の生成確率から求めた平 均値である。 このようにした場合、 1 ビデオフレーム分のサンプル数と同じサン プル数のオーディオデータをメモリ回路 3から出力符号化デ一夕 SC0DE2 として 読み出すために、 メモリ回路 3のオーディオデータを 1回だけ読み出しただけで は不足する状態が生ずる場合があり、 このときメモリ回路 3は 1 ビデオフ レーム 期間の終端部のタイ ミ ングで不足するサンプル数に担当するオーディオブロック 分のデ一夕 (この実施例の場合先頭ブロック B K 1から第 5番目のオーディオブ ロックのデータ) を重複して読み出す。
メモリ回路 3からオーディオブロックを重複させて読み出すか否かは、 位相比 較回路 4が、 検出した先頭ブロック B K 1から数えて第 5番目のブロックの先頭 位置がウイン ドウ期間 Wに入るか否かを検出することにより判断する。 先頭プロ ック B K 1から数えて第 5番目のブロックの先頭位置がウイン ドウ期間 Wに入つ たと判断したとき、 位相比較回路 4は、 先頭ブロック検討信号 S 2に基づいて当 該 5番目のブロックを重複して読み出すようにメモリ回路 3を制御する。 これに 対して先頭ブロック BK 1から数えて第 5番目のオーディオブロックの先頭位置 がウィンドウ期間 Wに入らなかったときには、 重複した読み出しは行われない。 オフセッ ト付加回路 5は、 各フレームの先頭 (又は各符号化ブロックの先頭で も良い) のヘッダ情報と してオフセッ ト信号 S 3を付加することにより最終的な 符号化オーディオデータ SC0DE3 を形成し、 当該符号化オーディオデータ SC0DE をディジタル VTRの記録部に伝送され記録媒体上に記録される。
ディジタル VTRの再生部によって記録媒体から再生された符号化オーディオ データ SC0DE3 は、 図 5に示すようなオーディオ信号復号化装置 1 0において復 号される。 オーディオ信号復号化装置 1 0は、 ディジタル VTRの再生部から伝 送されて来る符号化オーディオデータ SC0DE3 を順次メモリ回路 1 1に格納する と共に、 オフセッ ト抽出回路 1 2に入力する。
オフセッ ト抽出回路 1 2は、 ブロックパルス信号 SBLK 又は符号フレームパル ス信号 SCFP に基づいて、 各フレームの先頭 (又は各符号化ブロックの先頭) に 付加されているオフセッ ト信号 S 3を抽出し、 当該オフセッ ト信号 S 3を位相演 算回路 1 3に出力する。
位相演算回路 1 3には、 オフセッ ト信号 S 3が入力されると共に、 ビデオ信号 のフレームに同期したフレームパルス信号 S FLP が入力され、 フレームパルス信 号 S FLP を基準にして先頭ブロックの位相を表わす先頭ブロック位相信号 S 4を 演算によって求めてメモリ回路 1 1に出力する。
メモリ回路 1 1は、 図 6 (A) ~ (D) に示すように、 符号フレームパルス信 号 SCFP (図 6 (A) ) に同期した符号化オーディオデータ S C0DE3 (図 6 (B ) ) を取り込むと、 位相演算回路 1 3から与えられる先頭ブロック位相信号 S 4 に基づいて、 符号化時にフレームパルス信号 S FLP (図 6 (C) ) に同期するよ うにオフセッ トされている各符号化ブロックを元の位置に戻すようにオフセッ ト 量 TOFF だけオフセッ 卜させるタイ ミ ングで読み出して、 符号化オーディオデー 夕 SC0DE4 (図 6 (D) ) として出力する。 このときメモリ回路 1 1からは、 ォ フセッ ト信号によって指定された符号化ブロックについて重複情報に基いて当該 重複ブロックのうちの一方のみが読み出される。
かく して、 オーディオ信号復号化装置 1 0においては、 オーディオ信号符号化 装置 1のメモリ回路 3によってフレームパルス信号 S FLP に同期するように変換 された符号化ブロックのブロック位相を、 メモリ回路 1 1の読出し時に元の状態 に戻した符号化ブロックデータでなる符号化オーディオデータ S C0DE4 を得るこ とができ、 この符号化オーディオデータ SC0DE4 を MP E G復号化回路 1 4にお いて復号すると共に、 ビデオ信号に同期するように一定量だけ遅延させて、 復号 オーディオ信号 S 5として出力する。
以上の構成において、 48 CkHz) でサンプリ ングされた入力オーディオ信号 S AUD はオーディオ信号符号化装置 1の MP E G符号化回路 2において、 MP E G の音声規格 MP E Gレイヤ 1に従って 384サンプル単位でブロック符号化される この符号化ブロックは一旦メモリ回路 3に格納され、 メモリ回路 3を読み出す タイ ミ ング及び読出速度が制御されることにより 1 ビデオフレーム期間に整数個 のオーディオブロックが収まるように配列され、 これによりビデオ信号のフレ一 ムに同期した符号化データ SC0DE2 が形成される。 このようにして形成された符 号化オーディオデータ S CODE3 は、 そのまま、 又はビデオ信号のフレーム単位で 編集等のスイッチング処理をされた後、 オーディオ信号複号化装置 1 0によって 復号される。
かく してオーディオ信号符号化回路 1から得られる符号化オーディオデータ S
CODE3 は、 各ビデオフレームに対応する期間の間に整数個の符号化ブロックが収 められることにより、 ビデオフレームを跨がる符号化プロックがなくなる。 その 結果フレーム単位でスィッチング処理をした場合でも、 スィッチング点における 符号化ブロックの分断を回避できることにより、 スイッチング点付近において復 号データがない状態を生じさせることなくオーディオデータを復号できる。 因に、 各符号化ブロックの先頭には、 各符号化ブロックを復号するために必要 な情報 (すなわちヘッダ情報、 ビッ トアロケーション情報及びスケールファクタ 情報等) が付加されているため、 この情報がスイッチング処理によって符号化情 報と分断されると、 当該オーディオ符号化ブロックについての符号化情報全てが 復号できなくなる。 このようにオーディオ信号符号化装置 1によれば、 符号化ォ
—ディォデータ S CODES に対してフレーム単位のスイッチング処理をした場合で も、 各符号化ブロックを復号するために必要な情報と符号化情報との分断を回避 し得ることにより、 従来に比して復号データの欠落を格段的に低減し得る。 オーディォ信号復号化装置 1 0は、 オフセッ ト信号 S 3に応じてメモリ回路 1 1の読出しを制御することによって符号化時にずらした符号化ブロックの位相を 元の状態に戻した後、 MP EG復号化回路 1 4によってオーディオデータを復号 する。
ここで符号化オーディオデータ SC0DE3 がオーディオ信号符号化装置 1によつ て符号化されたそのままの配列でオーディオ信号復号化装置 1 0に入力された場 合には、 すべてのオーディオ符号化ブロックについて、 オフセッ ト情報、 重複ブ ロック情報及びオーディオデータをメモリ回路 1 1に書き込むことができると共 に、 図 6 (A) 〜 (D) に示すように、 全てのブロック符号が欠落せずに復号さ れる。
これに対して図 7 (A) 〜 (D) に示すように、 編集によりスイッチングポィ ン ト S Pにおいてブロックデータ 「 1」 、 「 2」 、 「 3」 、 「4」 、 「 5」 から ブロックデータ 「A」 、 「B」 、 「C」 ……にスイッチング処理されたことによ り、 スイッチングポイ ン ト S P直前のオーディオデータ 「 1」 〜 「 5」 のブロッ クに対して、 スイッチングポイン ト S P直後のオーディオデータ 「A」 〜 「D」 のブロックをインサー ト編集してなる符号化オーディオデータ SC0DE3 (図 7 ( B) ) が、 オーディオ信号復号装置 1 0に入力される。 その結果当該直後のォ一 ディォデータ 「A」 〜 「D」 について復号されたオフセッ ト情報の分だけオフセ ッ ト処理がされることにより、 当該直後のオーディオデータ 「A」 〜 「D」 のブ ロックのうち先頭ブロック 「A」 が直前のオーディオデ一夕 「 1」 〜 「 5」 のブ ロックのうち後尾ブロック 「 5」 の一部に重複する (オーディオデータ 「 5」 に 連続的に接ぐことができずに) 。 このとき、 折角復号するのに十分な情報が得ら れているにもかかわらず、 後尾ブロック 「 5」 の期間が 384Tより短くなること により、 当該後尾ブロック 「5」 のデ一夕が部分的に欠落するような状態になる しかしながら、 欠落が生ずる期間は高々 383T分であり、 従来のようにオーデ ィォデータを復号するための情報が得られないために 766サンプルの期間及びそ の前後の関連する 256サンプルの期間でブロックのデータ全体が復号できなく な るような場合と比較して、 格段的にデータの欠落を低減し得る。
以上の構成によれば、 ビデオ信号の 1フレームに対応する期間内に整数個の符 号化ブロックを収めて伝送するようにしたことにより、 ビデオ信号のフ レーム境 界を跨ぐようなオーディオ符号化ブロックをなくすることができ、 かく してビデ オフレ一ム単位でスィッチング処理をした場合でも、 復号時にォーディォデ一夕 がなくなるようなデータの欠落をほぼ防止できる。
また符号化時に符号化ブロックをフレームに位相合せした際の符号化ブロック のフレーム境界からのオフセッ ト量を符号化オーディオデータに付加し、 復号時 に当該オフセッ ト量を参照して元の位相関係に戻すようにしたことにより、 復号 時の位相管理を一段と容易にし得る。
( 2 ) 第 2実施例
図 1 との対応部分に同一符号を付して示す図 9において、 2 0は第 2実施例に よるオーディオ信号符号化装置を示し、 この場合メモリ回路 2 1 は、 図 1 0 (D ) に示すように、 ビデオ信号の 1 フレームに対応する期間内に 6個のオーディオ 符号化ブロックが収まるような符号化データ SC0DE2 ' を形成することにより、 ビデオ信号のフレームに同期した符号化ブロックでなる符号化データ SC0DE2 ' を得る。
このときオーディオ信号符号化装置 2 0は、 第 1実施例の場合と同様に、 フレ ームパルス信号 SFLP を含む 1符号化ブロック幅と等しい長さのウイン ドウ期間 Wを設定し、 このウィ ン ドウ期間 Wの間に生ずる符号化ブロックを先頭ブロック B K 1 とし、 当該先頭ブロック B K 1のオーディオブロック境界位置をビデオフ レーム境界位置に合わせる。 そして先頭ブロック B K 1 に続いて 1 ビデオフレー ムに対応する期間内に当該先頭ブロック B K 1を含めて 6個のオーディオブロッ クが収まるように符号化ブロックを配列する。
またオーディオ信号符号化装置 2 0は、 メモリ回路 2 1 に MP E G符号化回路 2の出力を書込み、 位相比較器 4からの先頭ブロック検出信号 S 2に基づいて図 1 0 (A) 〜 (D) に示すように、 6ブロック分のオーディオデータを読み出す 。 その際に、 先頭ブロックから第 5番目のオーディオブロックがウィン ドウ期間 Wに入ったときにはこの第 5番目のオーディオブロックを重複して読み出すのに 対して、 第 5番目のオーディオブロックがウイン ドウ期間 Wに入らなかったとき には当該第 5番目のオーディオブロックを重複しては読み出さないようにする。 これに対して、 第 6ブロック B K 2については、 常に重複して読み出すようにす る。
かく してオーディオ信号符号化装置 2 0は、 伝送したオーディオデータがビデ ォブロック単位で編集等のスィッチ処理をされたと しても各ビデオブロックに対 応するオーディオデータを欠落させることなく確実に伝送することができる。 図 5との対応部分に同一符号を付して示す図 1 1において、 3 0は第 2実施例 のオーディオ信号復号化装置を示し、 オーディオ信号符号化装置 2 0によって形 成された符号化オーディオデータ SC0DE3 ' をメモリ回路 3 1に一時記憶した後 、 位相演算回路 1 3から出力される先頭ブロック位相信号 S 4に基づいてメモリ 回路 3 1の読出動作を制御することにより、 図 1 2 (A) 〜 (D) に示すように 、 メモリ回路 3 1から、 ビデオ信号との位相関係が元の状態に戻されたオーディ ォ符号化データ S CODE4 ' を出力する。
図 1 2 (A) - (D) の場合、 オーディオ信号復号化装置 3 0に、 オーディオ 信号符号化装置 2 0によって符号化されたそのままの配列の符号化オーディオデ 一夕 SC0DE3 ' が入力され、 これにより第 1実施例の場合と同様にすベてのプロ ックのオーディオデータが完全に復号される。
これに対して図 1 3 (A) ~ (D) に示すように、 オーディオ信号復号化装置 3 0に、 編集によりスィツチングボイン ト S Pにおいてスィツチング処理された 符号化オーディオデータ SC0DE3 ' が入力された場合は、 スイッチングポイン ト S Pの直後のオーディオデ一夕 「A」 のオフセッ ト処理についてスイッチングポ イン ト S Pの直前のオーディオデータ 「 1 0」 及び 「 1 1」 の後尾部にオーディ ォデータ 「A」 が重複することにより、 メモリ回路 3 1の読出データが連続では なくなり、 この結果出力 SC0DE4 ' のうち直前のデータ 「 1 1」 及び 「 1 0」 に ついて不完全な符号化ブロックが生ずる。 またオーディオ信号符号化装置 2 0によって形成された符号化オーディオデ一 タ S C 0 DE 3 ' は、 図 1 4に示すように、 ビデオフレームの境界を越えて複数のビ デオフレームにオーバーラップする符号化ブロックを 1つのビデオフレームに対 応する期間内に収まるように割りつけられることになるので、 上述したオーディ ォ信号復号化装置 3 0を 2系統設けるようにすれば、 図 1 3 ( B ) のようにスィ ツチング処理された符号化オーディオデータ S C 0 DE 3 ' を受け取った場合でも、 フレーム内の全ての符号化ブロックを復号できるようになる。 また一系統の場合 でも、 1601 T又は 1602 Tの 1 ビデオフレームに対応する期間内に 6ブロックのす ベてを復号し得るようにしても、 同様にフレーム内のほぼすベての符号化ブロッ クを復号できるようになる。 .
ここでこの実施例においては、 第 1実施例で 1 フレーム内に 5個の符号化プロ ックを収めるようになされているのに対して、 6個の符号化ブロックを収めるよ うにしているので、 符号化ブロックのオーバーラップ量が増えた分だけ、 スイツ チング処理後に復号する場合のデータの欠落をさらに一段と防止することができ る。
以上の構成において、 オーディオ信号符号化装置 2 0は、 ビデオ信号の各ビデ オフレームに対してそのフレームを完全に覆う 6ブロック分の符号化オーディオ データを 1 ビデオフレームに対応する期間内に収めるようにしたことにより、 符 号フレームパルス S C F P の前後において 1つ又は複数のオーディオブロックが重 複するような符号化オーディオデータ S C O D E 3 ' を形成する。
その結果ィンサー ト編集時にビデオフレーム単位でオーディオブロックデ一夕 のスィツチング処理をしても、 重複しているオーディオブロックデータの 1つを 復号することにより、 復元できないオーディオブロックが生じることを減少させ るような確実な復号化処理をすることができる。
( 3 ) 他の実施例
( 3 - 1 ) 上述の第 2実施例においては、 オーディォ信号符号化装置 2 0におい て、 6ブロック分の符号化オーディオデ一夕の全部を 1 ビデオフレームに対応す る期間に収めるようにしたが、 各ビデオフレームに対応するオーディオデータに ついて後尾部にある第 6番目のブロックデータの最後部の部分のデータを符号化 しないようにすることにより、 符号化効率を高めるようにしても、 第 2実施例に よって得ることができると同様の効果を得ることができる。
因に、 M P E Gの音声規格 M P E Gレイヤ I では、 ビッ ト レ一 ト力く 384 [kbps] 、 標本化周波数が 48 [kHz] の場合の 1 ブロック当りの総ビッ ト数は 3072ビッ 卜と なる。 この 3072ビッ トの内訳は、 先頭から順に、 ヘッダ情報が 32ビッ ト、 ビッ ト 割当て情報が 128ビッ ト、 スケールファクタ情報が最大で 192ビッ トであり、 残 りがサブバン ドデ一夕である。
ところが、 このサブバン ドデ一夕は低域信号部分が先に記録される。 ここで、 高域信号は聴き取り難いという人間の聴覚特性を考慮すると、 ビッ トス ト リーム の後の方に記録される高域信号が音質に及ぼす影響は小さい。 そのためこの実施 例では、 各ビデオフレームに対応する 6ブロック分のデータのうち、 6番目のブ ロックのすベてのデータを記録するのではなく、 ビッ トス ト リームの後の方のデ —夕をメモリ回路 2 1 には記録しないようにする。 すなわち、 ヘッダ情報、 ビッ ト割当て情報及びスケールファクタ情報の記録に必要な 352ビッ トと、 サブバン ドデ一夕を例えば 672ビッ 卜だけ記録することにより、 記録ビッ ト数を合わせて 1024ビッ 卜にする。 このときのビッ ト数は、 元のビッ トス ト リームに比べて 3分 の 1 となり、 この結果符号化効率を向上し得る。
かく してこの実施例によれば、 第 6番目の符号化ブロックのビッ トス ト リ一ム の前方のデータ部分のみを伝送するようにしたことにより、 ビデオフレームに同 期した符号化ブロックを形成する際に、 伝送を省略した分符号化効率を改善し得 ると共に、 このようにして音質を低下させることなく維持できる効果を得ること ができる。
( 3 - 2 ) 上述の実施例においては、 本発明を、 M P E Gの音声規格 M P E Gレ ィャ I に基づいて形成された符号化データに適用した場合について述べたが、 本 発明はこれに限らず、 ブロック単位の符号化データを形成するようなオーディォ 符号化方式に広く適用することができる。 具体的には、 ビデオ信号のフ レーム長 がオーディオ信号の符号化ブロック長の整数倍にならないような場合に本発明を 適用すれば、 上述の実施例の場合と同様の効果を得ることができる。 また例えば
1 ブロックで符号化及び復号化を共に完結するような符号化方式に本発明を適用 すれば、 スィツチング処理が施された符号化データに対して各ビデオフレームに 対応するオーディオ信号をほぼ完全に復号できるようになる。
( 3 - 3 ) またブロック長が 384T以外の符号化ブロックを形成する符号化方式 に本発明を適用する場合には、 ウィン ドウ期間 Wの範囲を符号化ブロック長に合 わせるように選定すれば、 実施例と同様の効果を得ることができる。
( 3 — 4 ) また第 1実施例において、 オーディオ信号符号化装置 1 によって形成 された符号化データは、 図 8に示すように、 1601T又は 1602Tの長さのビデオフ レームの境界を越えて複数のビデオフレームにオーバ一ラップする長さの符号化 ブロックデータ ( 384T X 5 ) を 1つのビデオフ レームに対応する期間に収まる ように割りつけられることになるので、 上述したオーディオ信号復号化装置 1 0 を 2系統設けるようにすれば、 図 7 (A) 〜 (D) のようにスイッチング処理さ れた符号化データを受け取った場合でも、 符号化オーディオデ一夕 S CODES を復 号できない期間をさらに小さくすることができ、 クロスフエ一 ド処理等の音質改 善処理を施せば一段と高音質の復号オーディオ信号を得ることができる。
( 3— 5 ) さらに上述の実施例においては、 ビデオ信号の 1 フレームに対応する 期間に整数の符号化ブロックを収めるようにした場合について述べたが、 これに 代え、 1 フィ一ルドに対応する期間に整数の符号化ブロックを収めるようにして も、 上述の場合と同様の効果を得ることができる。
( 3 — 6 ) 上述の実施例においては、 ウィン ドウ期間 Wを- 351Tから +32Tまで の期間に設定するようにしたが、 これに代え- 192Tから +192Tまでに設定できる ようにする等、 種々変更することができる。 産業上の利用可能性
本発明は、 ビデオと、 当該ビデオ信号に対応するオーディオ信号とを、 一緒に 伝送する (記録、 再生処理したり、 伝送路を通じて送ったりする) ようなビデオ 信号処理装置に利用できる。

Claims

請求の範囲
1 . ビデオ信号に対応する入力オーディオ信号を所定のデータ単位で符号化する ことにより、 符号化ブロックごとに区切られた符号化オーディオデータを形成す るオーディォ信号符号化方法において、
上記符号化オーディオデータを順次メモリ手段に書き込むと共に、 当該書き込 まれた上記符号化オーディオデ一夕を書込速度より速い読出速度で、 かつ上記ビ デォ信号の 1 フレーム又は 1 フィールドと同期させて読み出すことにより、 上記 ビデオ信号の 1 フ レーム又は 1 フィールドに対応する期間に整数個の上記符号化 ブロックを収めてなる符号化ブロック列を形成するようにした
ことを特徴とするオーディオ信号符号化方法。
2 . 上記入力オーディオ信号を所定のデータ単位にブロック化して符号化するこ とによりブロックごとに区切られた上記符号化ブロックを形成して上記メモリ手 段に書き込むステップと、
上記符号化ブロックのうち、 上記ビデオ信号のフレーム又はフィールドの境界 位置に対応する符号化ブロックのブロック先頭位置を、 対応するビデオ信号のフ レーム又はフィールド境界位置に一致させ、 かつ上記フレーム又はフィールド境 界位置にブロック先頭位置を一致させた符号化ブロックに続いて、 1 フ レーム又 は 1 フィールドに対応する期間に整数個の上記符号化ブロックが収まるように上 記符号化ブロックを配列するように上記メモリ手段からデータを読み出すことに より、 上記ビデオ信号のフレーム又はフィールドに同期した上記符号化ブロック 列を形成するステップと
を具えることを特徴とする請求の範囲第 1項に記載のオーディオ信号符号化方 法。
3 . 上記ビデオ信号は、 1 フ レーム当りの走査線数が 525本で、 かつフィール ド 周波数が 59. 94 〔Hz〕 の信号でなり、
上記入力オーディオ信号は、 48 [ k Hz] でサンプリ ングされた信号でなり、 上記符号化ブロックは、 上記入力オーディオ信号を 384サンプルのデ一夕単位で 符号化してなる
ことを特徴とする請求の範囲第 1項に記載のオーディオ信号符号化方法。
4 . 上記フ レーム又はフィ一ルド境界位置にブロック先頭位置を一致させる前の 上記符号化ブロックの、 フ レーム又はフィールド境界位置からの位相差を表わす 情報を、 上記符号化オーディオデータに付加するようにした
ことを特徴とする請求の範囲第 2項に記載のオーディオ信号符号化方法。
5 . 上記ビデオ信号は、 1 フレーム当りの走査線数が 525本で、 かつフィールド 周波数が 59. 94 〔Hz〕 の信号でなり、
上記入力オーディオ信号は、 48 [ k Hz] でサンプリ ングされた信号でなり、 上記符号化ブロックは、 上記入力オーディオ信号を 384サンプルのデータ単位 で符号化してなり、
上記 1 フレーム又は 1 フィールドに対応する期間に収める上記符号化ブロック の個数を 5個とするようにした
ことを特徴とする請求の範囲第 2項に記載のオーディオ信号符号化方法。
6 . 上記ビデオ信号は、 1 フ レーム当りの走査線数が 525本で、 かつフィールド 周波数が 59. 94 〔Hz〕 の信号でなり、
上記入力オーディオ信号は、 48 ( k Hz] でサンプリ ングされた信号でなり、 上記符号化ブロックは、 上記入力オーディオ信号を 384サンプルのデータ単位 で符号化してなり、
上記 1 フ レーム又は 1 フィ一ル ドに対応する期間に収める上記符号化ブロック の個数を 6個とするようにした
ことを特徵とする請求の範囲第 2項に記載のオーディオ信号符号化方法。
7 . 上記 1 フ レーム又は 1 フィ一ルド内に収める符号化ブロックのうち、 少なく とも 1つの符号化ブロックについてはビッ トス ト リ一ムの一部のみを収めるよう にした
ことを特徴とする請求の範囲第 6項に記載のオーディオ信号符号化方法。
8 . ビデオ信号に対応する入カオ一ディォ信号を所定のデータ単位で符号化する ことにより符号化ブロックごとに区切られた符号化ォ一ディォデータを形成する オーディオ信号符号化装置において、
上記入カオ一ディォ信号を所定のデータ単位にブロック化して符号化すること によりブロックごとに区切られた符号化ブロックを形成してオーディオデータと して出力する符号化手段と、
上記ビデオ信号のフレーム又はフィ一ルドの境界位置と上記オーディオデ一夕 の上記符号化ブロックとの位相差を求め、 当該位相差に基づいてフレーム又はフ ィ一ルドの境界位置に対応する符号化ブロックを検出する検出手段と、
上記符号化手段の上記オーディオデータを書き込んだ後、 上記検出手段の検出 結果に基づいて上記フレーム又はフィールドの境界位置に対応する符号化ブロッ クのブロック先頭位置を、 対応するフレーム又はフィールド境界位置に一致させ 、 かつ当該フレーム又はフィールド境界位置にブロック先頭位置を一致させた符 号化ブロックに続いて、 1 フレーム又は 1 フィ一ルドに対応する期間整数個の上 記符号化ブロックが収まるように、 上記書き込んだオーディオデータを読み出す ことにより上記符号化ブロックを配列し、 当該符号化ブロック列をフレーム又は フィールドに同期させて出力するメモリ手段と
を具えることを特徴とするオーディォ信号符号化装置。
9 . 上記オーディオ信号符号化装置は、
上記検出手段によって検出された位相差を、 上記メモリ手段から出力されるフ レーム又はフィールドに同期した上記符号化ブロックに付加する位相差付加手段 を具える
ことを特徴とする請求の範囲第 8項に記載のオーディオ信号符号化装置。
1 0 . 上記ビデオ信号は、 1 フレーム当りの走査線数が 525本で、 かつフィ一ル ド周波数が 59. 94 〔Hz〕 の信号でなり、
上記入力オーディオ信号は、 48 [ k Hz) でサンプリ ングされた信号でなり、 上記符号化手段は、 上記入力オーディオ信号を 384サンプルのデータ単位で符 号化することにより上記符号化ブロックを形成する
ことを特徴とする請求の範囲第 8項に記載のオーディオ信号符号化装置。
1 1 . 上記ビデオ信号は、 1 フレーム当りの走査線数が 525 本で、 かつフィ一ル ド周波数が 59. 94 [Hz〕 の信号でなり、
上記入力オーディオ信号は、 48 [ k Hz ] でサンプリ ングされた信号でなり、 上記符号化手段は、 上記入力オーディオ信号を 384サンプルのデータ単位で符 号化することにより上記符号化ブロックを形成し、
上記メモリ手段は、 上記 1 フレーム又は 1 フィ一ルドに対応する期間に収める 上記符号化ブロックの個数を 5個とするように上記符号化ブロックを配列して出 力するようにした
ことを特徴とする請求の範囲第 8項に記載のオーディオ信号符号化装置。
1 2 . 上記ビデオ信号は、 1 フレーム当りの走査線数が 525本で、 かつフィール ド周波数が 59. 94 〔Hz〕 の信号でなり、
上記入力オーディオ信号は、 48 [ k Hz] でサンプリ ングされた信号でなり、 上記符号化手段は、 上記入力オーディオ信号を 384サンプルのデータ単位で符 号化することにより上記符号化ブロックを形成し、
上記メモリ手段は、 上記 1 フレーム又は 1 フィールドに対応する期間に収める 上記符号化ブロックの個数を 6個とするように上記符号化ブロックを配列して出 力するようにした
ことを特徴とする請求の範囲第 8項に記載のオーディオ信号符号化装置。
1 3 . 上記メモリ手段は、 上記 1 フレーム又は 1 フィールドに対応する期間に収 める符号化ブロックのうち、 少なく とも 1つの符号化ブロックについてはビッ 卜 ス ト リームの一部のみを収めるようにした
ことを特徴とする請求の範囲第 1 2項に記載のオーディオ信号符号化装置。
1 4 . ビデオ信号に対応する入力オーディオ信号を所定のデータ単位でブロック 化して符号化することによりブロックごとに区切られた符号化ブロックを形成し て第 1 のメモリ手段に書き込むステップと、 上記符号化ブロックのうち、 上記ビデオ信号のフレーム又はフィ一ルドの境界 位置に対応する符号化ブロックのブロック先頭位置を、 対応するビデオ信号のフ レーム又はフィールド境界位置に一致させ、 かつ上記フレーム又はフィールド境 界位置にブロック先頭位置を一致させた符号化ブロックに続いて、 1 フレーム又 は 1 フィールドに対応する期間に整数個の上記符号化ブロックが収まるように上 記符号化ブロックを配列するように上記第 1のメモリ手段からデータを読み出す ことにより、 上記ビデオ信号のフレーム又はフィ一ルドに同期した符号化オーデ ィォデータを形成するステップと、
上記ビデオ信号のフレーム又はフィールド境界位置にブロック先頭位置を一致 させる前の上記符号化ブロックにおける、 ビデオ信号のフレーム又はフィ一ルド 境界位置からの位相差を表わす位相差情報を、 上記符号化オーディオデ一夕に付 加するステップと
を有するオーディオ信号符号化処理ステップと、
上記符号化オーディオデータを第 2のメモリ手段に書き込むステップと、 上記位相差情報が付加された符号化オーディオデータから当該位相差情報を検 出するステップと、
検出された位相差情報に基づいて上記第 2のメモリ手段からデータを読み出す ことにより、 上記符号化ブロックと上記ビデオ信号の位相関係を元の状態に戻す ステップと
を有する符号化ォーディォデータ復号化処理ステップと、
を具えることを特徵とするオーディオ信号符号化復号化方法。
1 5 . ビデオ信号に対応する入力オーディオ信号を所定のデータ単位にブロック 化して符号化することによりブロックごとに区切られた符号化ブロックを形成し てオーディオデータとして出力する符号化手段と、
上記ビデオ信号のフレーム又はフィ一ルドの境界位置と上記オーディオデ一夕 の上記符号化ブロックとの位相差を求め、 当該位相差に基づいてフレーム又はフ ィールドの境界位置に対応する符号化ブロックを検出する検出手段と、 上記符号化手段の上記オーディオデータを書き込んだ後、 上記検出手段の検出 結果に基づいて上記フレーム又はフィールドの境界位置に対応する符号化ブロッ クのブロック先頭位置を、 対応するフ レーム又はフィ一ルド境界位置に一致させ 、 かつ当該フレーム又はフィ一ルド境界位置にブロック先頭位置を一致させた符 号化ブロックに続いて、 1 フレーム又は 1 フィ一ルド区間内に整数個の上記符号 化ブロックが収まるように、 上記書き込んだオーデォデータを読み出すことによ り符号化ブロックを配列し、 当該符号化ブロック列をフレーム又はフィ一ルドに 同期させて符号化オーディオデータとして出力する第 1 のメモリ手段と、 上記検出手段によって検出された位相差を、 上記第 1のメモリ手段から出力さ れる上記符号化デ一夕のうちフ レーム又はフィールドに同期した上記符号化ブ口 ックに、 付加する位相差付加手段と
を有するオーディオ信号符号化部と、
上記オーディオ信号符号化部の符号化オーディオデータから上記位相差情報を 検出する位相差情報検出手段と、
上記オーディオ信号符号化部の符号化オーディオデータを書き込んだ後、 上記 位相差情報検出手段によって検出された位相差情報に基づいて、 書き込んだ当該 符号化オーディオデータを読み出すことにより上記符号化ブロックと上記ビデォ 信号の位相関係を元の状態に戻す第 2のメモリ手段と
を有する符号化オーディオデータ復号化部と
を具えることを特徴とするオーディオ信号符号化復号化装置。
PCT/JP1996/001490 1995-05-31 1996-05-31 Procedes et dispositifs de codage/decodage de signaux audio WO1996038843A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE69623771T DE69623771T2 (de) 1995-05-31 1996-05-31 Verfahren und vorrichtung zur kodierung von audiosignalen und verfahren und vorrichtung zur dekodierung von audiosignalen
EP96920030A EP0829875B1 (en) 1995-05-31 1996-05-31 Method and device for encoding audio signal and method and device for decoding audio signal
US08/979,634 US6480234B1 (en) 1995-05-31 1997-11-28 Method and apparatus for synchronously encoding audio signals with corresponding video frames

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP15861795 1995-05-31
JP7/158617 1995-05-31

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US08/979,634 Continuation US6480234B1 (en) 1995-05-31 1997-11-28 Method and apparatus for synchronously encoding audio signals with corresponding video frames

Publications (1)

Publication Number Publication Date
WO1996038843A1 true WO1996038843A1 (fr) 1996-12-05

Family

ID=15675631

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1996/001490 WO1996038843A1 (fr) 1995-05-31 1996-05-31 Procedes et dispositifs de codage/decodage de signaux audio

Country Status (4)

Country Link
US (1) US6480234B1 (ja)
EP (1) EP0829875B1 (ja)
DE (1) DE69623771T2 (ja)
WO (1) WO1996038843A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002529019A (ja) * 1998-10-27 2002-09-03 コンティネンタル・テーベス・アクチエンゲゼルシヤフト・ウント・コンパニー・オッフェネ・ハンデルスゲゼルシヤフト データを符号化して伝える受信信号を処理する方法と装置
WO2003074364A1 (en) 2002-03-01 2003-09-12 Free-Flow Packaging International, Inc. Machine and method for inflating and sealing air-filled packing cushions
US7006976B2 (en) 2002-01-29 2006-02-28 Pace Micro Technology, Llp Apparatus and method for inserting data effects into a digital data stream

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6124895A (en) * 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
US5913190A (en) * 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by audio sample rate conversion
US6639878B1 (en) * 2000-03-21 2003-10-28 Microsoft Corporation Method and apparatus for characterizing and improving optical drive performance
AU2002327217A1 (en) * 2001-07-09 2003-01-29 Visible World, Inc. System and method for seamless switching of compressed audio streams
US7840412B2 (en) * 2002-01-18 2010-11-23 Koninklijke Philips Electronics N.V. Audio coding
JP4340483B2 (ja) * 2003-06-27 2009-10-07 富士通株式会社 複合コンテンツの配信方法および配信システム
JP4979355B2 (ja) * 2006-11-30 2012-07-18 パナソニック株式会社 画像符号化装置および画像符号化方法
JP4948147B2 (ja) 2006-12-15 2012-06-06 富士通株式会社 複合コンテンツファイルの編集方法および装置
DE102009030318B4 (de) * 2009-06-24 2012-09-06 Opticom Dipl.-Ing. Michael Keyhl Gmbh Vorrichtung und Verfahren zur Bestimmung eines Abtastratenunterschiedes
GB2477263B (en) * 2010-01-13 2015-09-30 British Broadcasting Corp Method and apparatus for processing transport streams
FR2987197B1 (fr) * 2012-02-20 2015-11-20 Tdf Procede de generation d'un flux de paquets numeriques en sortie d'un encodeur, dispositif apte a generer un tel flux encode et, systeme apte a utiliser un tel flux encode.

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60212874A (ja) * 1984-04-09 1985-10-25 Matsushita Electric Ind Co Ltd デイジタル信号記録再生装置
JPS6173207A (ja) * 1984-09-17 1986-04-15 Sony Corp 音声信号記録方法
JPS62219205A (ja) * 1986-03-19 1987-09-26 Victor Co Of Japan Ltd 磁気記録再生方式
JPH01119127A (ja) * 1987-10-31 1989-05-11 Sony Corp ディジタル信号伝送装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4851409A (en) * 1986-02-14 1989-07-25 Merck Frosst Canada Inc. 2-substituted quinoline dioic acids and pharmaceutical compositions
JPS63131375A (ja) * 1986-11-21 1988-06-03 Matsushita Electric Ind Co Ltd 回転ヘツド型記録再生装置
DE69321558T2 (de) * 1992-11-17 1999-04-22 Matsushita Electric Ind Co Ltd Video- und Audiosignalmultiplex- und -trennvorrichtungen
JP2630202B2 (ja) * 1993-06-16 1997-07-16 松下電器産業株式会社 記録装置
US5351092A (en) * 1993-07-23 1994-09-27 The Grass Valley Group, Inc. Synchronization of digital audio with digital video
EP0644692B2 (en) * 1993-09-16 2003-10-01 Kabushiki Kaisha Toshiba Video signal compression/decompression device for video disk recording/reproducing apparatus
JP3500671B2 (ja) * 1993-10-08 2004-02-23 ソニー株式会社 ディジタル画像信号の記録及び/又は再生方法、記録及び/又は再生装置及び記録媒体
US5483538A (en) * 1994-05-25 1996-01-09 The Grass Valley Group, Inc. Audio frame synchronization for embedded audio demultiplexers

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60212874A (ja) * 1984-04-09 1985-10-25 Matsushita Electric Ind Co Ltd デイジタル信号記録再生装置
JPS6173207A (ja) * 1984-09-17 1986-04-15 Sony Corp 音声信号記録方法
JPS62219205A (ja) * 1986-03-19 1987-09-26 Victor Co Of Japan Ltd 磁気記録再生方式
JPH01119127A (ja) * 1987-10-31 1989-05-11 Sony Corp ディジタル信号伝送装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002529019A (ja) * 1998-10-27 2002-09-03 コンティネンタル・テーベス・アクチエンゲゼルシヤフト・ウント・コンパニー・オッフェネ・ハンデルスゲゼルシヤフト データを符号化して伝える受信信号を処理する方法と装置
US7006976B2 (en) 2002-01-29 2006-02-28 Pace Micro Technology, Llp Apparatus and method for inserting data effects into a digital data stream
WO2003074364A1 (en) 2002-03-01 2003-09-12 Free-Flow Packaging International, Inc. Machine and method for inflating and sealing air-filled packing cushions

Also Published As

Publication number Publication date
EP0829875B1 (en) 2002-09-18
EP0829875A4 (en) 2000-04-19
DE69623771D1 (de) 2002-10-24
US6480234B1 (en) 2002-11-12
EP0829875A1 (en) 1998-03-18
DE69623771T2 (de) 2003-07-31

Similar Documents

Publication Publication Date Title
US5953483A (en) Apparatus for recording and reproducing an information signal comprising packets that may occur irregularly as a function of time in a serial datastream of the information signal, and a record carrier carrying the information signal
JP2585757B2 (ja) 情報信号の記録再生方法及び記録再生装置
WO1996038843A1 (fr) Procedes et dispositifs de codage/decodage de signaux audio
KR950020674A (ko) 고속 비디오 편집 시스템
EP1685565B1 (en) Frame-based audio transmission /storage with cross-fading to remove artifacts
RU2229174C2 (ru) Запись информационных сигналов в формате mpeg на носитель информации и их воспроизведение
JPH0462213B2 (ja)
JPH06165105A (ja) ディジタルビデオ信号のダビング方法
US5999905A (en) Apparatus and method for processing data to maintain continuity when subsequent data is added and an apparatus and method for recording said data
JP4248026B2 (ja) 符号化された形式と符号化されない形式のディジタル情報信号を交互に伝送する伝送装置
JPH05210894A (ja) 記録されたテープ状の磁気記録担体を得るための装置、そのような装置によって得られる記録担体、及び記録担体を再生するための再生装置
US5889917A (en) Method and apparatus for editing an audio-visual signal having audio data that is in the form of block units which are not synchronous with the fields/frames of video data
JP3646382B2 (ja) データ処理装置、データ処理方法、データ記録装置、データ記録方法、符号化装置及び符号化方法
JPH10106151A (ja) サブ情報の符号化方法、記録媒体、信号再生装置および信号再生方法
JP3430613B2 (ja) 情報信号再生方法及び装置
KR100220848B1 (ko) 디지탈 비디오 카메라의 오디오 채널 삽입 장치
RU2161377C2 (ru) Устройство и способ подготовки к записи на носителе информации кодируемого с переменным параметром сигнала, устройство и способ последовательного сигнала, способ воспроизведения шаблонов с носителя информации
JP2000341654A (ja) ディジタルデータ伝送装置
JP3060622B2 (ja) ディスク記録装置
KR100191314B1 (ko) 멀티채널 오디오신호의 재생장치
JP3383810B2 (ja) ディジタル記録再生装置およびディジタル再生装置
JP3346395B2 (ja) 光記録媒体及び音声復号装置
EP0693214A1 (en) Arrangement for recording or reproducing a digital video signal and a corresponding digital audio signal
JPH08329605A (ja) デイジタルオーデイオ信号処理方法、デイジタルオーデイオ信号処理装置及び記録再生装置
JP2002209186A (ja) Mpeg方式の映像・音声データ記録システム及びその編集システム

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): DE FI FR GB

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1996920030

Country of ref document: EP

ENP Entry into the national phase

Ref country code: US

Ref document number: 1997 979634

Date of ref document: 19971128

Kind code of ref document: A

Format of ref document f/p: F

WWP Wipo information: published in national office

Ref document number: 1996920030

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 1996920030

Country of ref document: EP