KR20080049632A - Playback method and apparatus, program, and recording medium - Google Patents

Playback method and apparatus, program, and recording medium Download PDF

Info

Publication number
KR20080049632A
KR20080049632A KR1020070120956A KR20070120956A KR20080049632A KR 20080049632 A KR20080049632 A KR 20080049632A KR 1020070120956 A KR1020070120956 A KR 1020070120956A KR 20070120956 A KR20070120956 A KR 20070120956A KR 20080049632 A KR20080049632 A KR 20080049632A
Authority
KR
South Korea
Prior art keywords
stereo
audio signal
information
processing
signal
Prior art date
Application number
KR1020070120956A
Other languages
Korean (ko)
Inventor
치사토 겜모치
미츠유키 하타나카
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR20080049632A publication Critical patent/KR20080049632A/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Abstract

A play method and a play apparatus, a program, and a recording medium are provided to output a stereo audio signal without abnormal sound regardless of the supply of necessary stereo process information. A play apparatus includes a band division unit(44), a stereo processing unit(45), a band synthesis unit(52), and a control unit. The control unit carries out a stereo process based on stereo process information obtained by necessary stereo process information. A playback method comprises the steps of: outputting stereo audio signals using the monaural audio signal if no necessary stereo process information is supplied; starting updating stereo variables within filters, and outputting the stereo audio signals using the monaural audio signal until all the state variables are updated, if necessary stereo process information is supplied; and performing the stereo process based on stereo process information acquired by the necessary stereo process information, on the monaural audio signal to generate and output stereo audio signals, if all the state variables within the filters are updated.

Description

재생 방법 및 장치, 프로그램 및 기록 매체{Playback method and apparatus, program, and recording medium}Playback method and apparatus, program and recording medium

본 발명은, 모노럴(monaural) 오디오신호의 부호화정보(coded information)로 간헐적으로 다중화된(intermittently multiplexed) 스테레오 처리정보(stereo peocess information)가 전송되는 부호화 오디오 데이터(coded audio data)를 복호화 처리(decode-processing) 및 재생(playing back)하기 위한 재생방법 및 장치, 프로그램 및 기록매체에 관한 것이다. The present invention decodes coded audio data to which stereo peocess information is intermittently multiplexed as coded information of a monaural audio signal. A playback method and apparatus, a program and a recording medium for processing and playing back.

본 명세서는 일본 특허청에 2006년 11월 30일과 2007년 10월 19일에 각각 출원된 일본특허문헌 JP 2006-324775호 및 JP 2007-272856호에 관련된 주제와, 참조로서 여기에 포함된 모든 내용을 포함한다. This specification discloses the subject matter related to Japanese Patent Documents JP 2006-324775 and JP 2007-272856, filed on November 30, 2006 and October 19, 2007, respectively, with the Japan Patent Office. Include.

모노럴 오디오신호와 스테레오 처리정보가 공급되고, 스테레오 처리정보에 근거하여 모노럴 오디오신호를 스테레오 처리함으로써 스테레오 오디오신호를 생성하는 재생장치가 알려져 있다. BACKGROUND ART A reproducing apparatus for supplying a monaural audio signal and stereo processing information and generating a stereo audio signal by stereo processing the monaural audio signal based on the stereo processing information is known.

상기한 바와 같이 모노럴 오디오신호와 스테레오 처리정보에 근거하는 일반적인 스테레오 처리에 대하여 도면을 참조하여 설명한다. 도 6은 일반적인 스테 레오 처리장치의 구성예를 나타내는 블록도이며, 도 7은 도 6의 스테레오 처리장치에 공급되는 신호의 일례를 나타내는 도면이다. 스테레오 처리정보는 다중화되어 전송될 수도 있다. As described above, general stereo processing based on a monaural audio signal and stereo processing information will be described with reference to the drawings. FIG. 6 is a block diagram showing a configuration example of a general stereo processing apparatus, and FIG. 7 is a diagram showing an example of a signal supplied to the stereo processing apparatus of FIG. Stereo processing information may be multiplexed and transmitted.

도 6에 있어서, 모노럴 오디오신호가 입력단자(input terminal)(41)에 공급되고, 스테레오 처리정보가 입력단자(42)에 각각 공급되고 있다. 입력단자(41)로부터의 모노럴 오디오신호는 변환스위치(selector switch)(43)를 통하여 대역분할부(band divider)(44)에 보내져 대역 분할되고, 대역 분할된 모노럴 오디오신호는 스테레오 처리부(stereo processor)(45)에 보내진다. 스테레오 처리부(45)는 입력단자(42)로부터 스테레오 처리정보가 공급되고, 대역 분할된 모노럴 오디오신호를 좌채널(Lch)과 우채널(Rch)로 스테레오 처리한다. 좌우채널(Lch, Rch)의 스테레오 신호는 좌채널(Lch) 대역합성부(band synthesizer)(51) 및 우채널(Rch) 대역합성부(52)에 각각 보내진다. 대역합성부(51)로부터의 Lch 오디오신호는 변환스위치(53)로 보내지고, 이 Lch 오디오신호와 변환스위치(43)로부터 지연부(46)를 통하여 공급된 신호 중 하나가 선택되어, 선택된 신호가 변환스위치(54) 및 출력단자(55)에 보내진다. 대역합성부(52)로부터의 Rch 오디오신호는 변환스위치(54)로 보내지고, 이 Rch 오디오신호와 변환스위치(53)로부터의 신호 중 하나가 선택되어, 선택된 신호가 출력단자(56)에 보내진다. In Fig. 6, a monaural audio signal is supplied to an input terminal 41, and stereo processing information is supplied to an input terminal 42, respectively. The monaural audio signal from the input terminal 41 is sent to a band divider 44 through a selector switch 43, and is band-divided, and the band-divided monaural audio signal is a stereo processor. Is sent to (45). The stereo processing unit 45 is supplied with stereo processing information from the input terminal 42, and performs stereo processing of the band-divided monaural audio signal into the left channel Lch and the right channel Rch. The stereo signals of the left and right channels Lch and Rch are sent to the left channel Lch band synthesizer 51 and the right channel Rch band synthesizer 52, respectively. The Lch audio signal from the band synthesizer 51 is sent to the conversion switch 53, and one of the Lch audio signal and the signal supplied from the conversion switch 43 through the delay unit 46 is selected to select the selected signal. Is sent to the changeover switch 54 and the output terminal 55. The Rch audio signal from the band synthesizer 52 is sent to the conversion switch 54, one of the Rch audio signal and the signal from the conversion switch 53 is selected, and the selected signal is sent to the output terminal 56. Lose.

도 7은, 도 6의 스테레오 처리장치에 입력되는 신호의 일례를 나타낸다. 상기 신호는 부호화 오디오 데이터의 전송단위에, 프레임 또는 블록의 단위와 같이, #0, #1, #2, ... 로 번호를 붙이고 있다. 도면에서, 부호(M)는 모노럴 오디오신호를 나타내고, 부호(S)는 스테레오 처리정보를 나타내고 있다. 도 7의 예에 있어서, 모노럴 오디오신호(M)는 항상 전송되나, 반면, 스테레오 처리정보(S)는 다중화되고 5회마다 1회의 비율로 전송되고 있다. 이 경우, 전송단위 #0에 포함되어 보내진 스테레오 처리정보(S)는 전송단위 #0에서 #4까지에 해당하는 기간 동안 스테레오 처리에 사용되고, 전송단위 #5에 해당하는 타이밍에서 다음의 스테레오 처리정보(S)로 전환된다. 이 전송단위 #5에 해당하는 타이밍에서 보내진 스테레오 처리정보(S)는 전송단위 #5에서 #9에 해당하는 기간 동안 사용된다. 그 후, 이전에 보내진 스테레오 처리정보(S)는 마찬가지로 다음의 스테레오 처리정보(S)가 보내질 때까지 사용된다. FIG. 7 shows an example of a signal input to the stereo processing apparatus of FIG. 6. The signals are numbered # 0, # 1, # 2, ... as in units of frames or blocks, for transmission units of encoded audio data. In the figure, symbol M denotes a monaural audio signal, and symbol S denotes stereo processing information. In the example of FIG. 7, the monaural audio signal M is always transmitted, while the stereo processing information S is multiplexed and transmitted at one rate every five times. In this case, the stereo processing information (S) sent in transmission unit # 0 is used for stereo processing for the period corresponding to transmission unit # 0 to # 4, and the following stereo processing information is performed at the timing corresponding to transmission unit # 5. Switch to (S). The stereo processing information S sent at the timing corresponding to this transmission unit # 5 is used for a period corresponding to the transmission unit # 5 to # 9. Thereafter, the previously sent stereo processing information S is likewise used until the next stereo processing information S is sent.

도 6의 구성에 있어서, 스테레오 처리정보가 공급되면, 각 변환스위치(43, 53, 54)는 선택단자(selectable terminal)(B)측으로 전환된다. 즉, 입력단자(41)로부터 입력된 모노럴 오디오신호는 대역분할부(44)에 의해 대역분할되고, 스테레오 신호는 스테레오 처리정보에 근거하여 스테레오 처리부(45)에 의해 생선된다. 생성된 스테레오신호는 각 채널의 대역합성부(51, 52)에 의해 대역합성되고, 출력단자(55, 56)로부터 좌우채널(Lch, Rch)의 스테레오 오디오신호로서 각각 출력된다. In the configuration of Fig. 6, when stereo processing information is supplied, each conversion switch 43, 53, 54 is switched to the selectable terminal B side. That is, the monaural audio signal input from the input terminal 41 is band-divided by the band dividing section 44, and the stereo signal is produced by the stereo processing section 45 based on the stereo processing information. The generated stereo signal is band synthesized by the band synthesizers 51 and 52 of each channel, and output as stereo audio signals of the left and right channels Lch and Rch from the output terminals 55 and 56, respectively.

이에 대하여, 프레임(전송단위) 데시메이팅(decimating)에 의한 재생에 근거하는 빨리 감기(fast-forward) 재생과 같은 불연속 프레임 재생(discontinuous frame playback)에 있어서, 또는, 임의의 프레임으로부터의 재생에 있어서는, 다중화된 부호화정보가 누락되는 경우가 있다. 이러한 불연속인 프레임 재생 등으로 인해 임의의 프레임(전송단위)으로부터 부호화 오디오 데이터가 공급되는 경우, 사용가능한 스테레오 처리정보가 없는(absent) 상태가 발생할 수 있다. 예를 들면, 도 7의 전송단위 #2에 해당하는 위치에서 입력이 시작되는 경우, 전송단위 #0에 포함된 스테레오 처리정보(S)는 프레임 데시메이팅 등으로 인해 부재하여, 전송단위 #2에서 #4까지에 해당하는 기간 동안 사용가능한 스테레오 처리정보가 없게 된다. In contrast, in discontinuous frame playback, such as fast-forward playback based on playback by frame (transmission unit) decimating, or in playback from any frame. In some cases, multiplexed encoding information may be missing. When encoded audio data is supplied from an arbitrary frame (transmission unit) due to such discontinuous frame reproduction or the like, an absence of usable stereo processing information may occur. For example, when an input is started at a position corresponding to the transmission unit # 2 of FIG. 7, the stereo processing information S included in the transmission unit # 0 is absent due to frame decimation or the like. There is no stereo processing information available for the period up to # 4.

도 6의 장치에서는, 스테레오 처리정보의 유무로 인해 출력 오디오신호의 채널 수가 변화되는 것을 방지하기 위해, 사용가능한 스테레오 처리정보의 부재시(예를 들면, 도 7의 전송단위 #2에서 #4에 해당하는 기간 동안)에도, 모노럴 오디오신호를 스테레오 좌우 채널 모두에 출력하도록 구성되어 있다. 구체적으로는, 각 변환스위치(43, 53, 54)를 선택단자(A) 측으로 전환함으로써, 출력단자(55, 56)로부터 동일한 모노럴 오디오신호를 각각 출력한다. 여기서, 변환스위치(43)가 선택단자(A) 측으로 전환되면, 입력단자(41)로부터의 모노럴 오디오신호는 지연부(46)로 보내진다. 이는, 대역분할부(44)가, 예를 들면, FIR 필터링 처리에서와 같이, 상태변수(state variable)를 유지(hold)하고, 상태변수를 갱신하며 처리를 수행할 때마다 지연이 발생한다는 관점에서, 대역분할부(44)에서 발생하는 지연을 공급된 모노럴 오디오신호에 주기 위함이다. 대역합성부 등에서는 지연이 발생하지 않도록 대역합성을 수행하므로, 지연부(46)는 대역분할부(44)에서의 지연만을 고려한다. 지연부(46)로부터의 모노럴 오디오신호는 변환스위치(53)를 통하여 Lch 출력단자(55)로부터 출력되고, 또한, 변환스위치(54)를 통하여 Rch 출력단 자(56)로부터도 출력된다. 덧붙여 도 7의 전송단위 #2에서 #4까지에 해당하는 기간과 같이 사용가능한 스테레오 처리정보가 없는 경우는, 대역분할부(44) 등의 내부(internal) 상태변수는 초기화된다(initialized). In the apparatus of FIG. 6, in order to prevent the number of channels of the output audio signal from changing due to the presence or absence of stereo processing information, the absence of usable stereo processing information (for example, corresponds to transfer unit # 2 to # 4 in FIG. 7). The monaural audio signal is output to both stereo left and right channels. Specifically, the same monaural audio signal is output from the output terminals 55 and 56 by switching the respective conversion switches 43, 53 and 54 to the selection terminal A side. Here, when the conversion switch 43 is switched to the selection terminal A side, the monaural audio signal from the input terminal 41 is sent to the delay unit 46. This means that a delay occurs whenever the band splitting section 44 holds a state variable, updates a state variable, and performs processing, as in, for example, an FIR filtering process. In order to give a delay occurring in the band dividing section 44 to the supplied monaural audio signal. Since the band synthesis unit performs band synthesis so that a delay does not occur, the delay unit 46 considers only the delay in the band division unit 44. The monaural audio signal from the delay unit 46 is output from the Lch output terminal 55 through the conversion switch 53, and also from the Rch output terminal 56 through the conversion switch 54. In addition, when there is no stereo processing information available for the period corresponding to the transmission units # 2 to # 4 in FIG. 7, an internal state variable such as the band dividing section 44 is initialized.

따라서, 도 7의 전송단위 #2에 해당하는 위치에서 데이터가 공급되었을 경우, 도 6의 스테레오 처리장치에 있어서, 상기한 전송단위 #2에서 #4까지의 기간 동안 내부 상태변수는 초기화되며, 또한, 각 변환스위치(43, 53, 54)도 선택단자(A) 측으로 전환된다. 그 후, 전송단위 #5에 해당하는 위치의 데이터가 입력되면, 각 변환스위치(43, 53, 54)는 선택단자(B) 측으로 전환되며, 또한, 내부 상태변수도 갱신된다. 덧붙여 각 변환스위치(43, 53, 54)의 전환동작 및 각 부의 처리동작은 도시하지 않은 제어부(control section)에 의해, 입력 데이터의 내용, 내부상태 등에 따라 제어된다. Therefore, when data is supplied at a position corresponding to the transmission unit # 2 of FIG. 7, in the stereo processing apparatus of FIG. 6, the internal state variable is initialized for the period of the transmission units # 2 to # 4 described above. , Each changeover switch 43, 53, 54 is also switched to the selection terminal A side. Thereafter, when data at a position corresponding to the transmission unit # 5 is input, each of the conversion switches 43, 53, 54 is switched to the selection terminal B side, and the internal state variable is also updated. In addition, the switching operation of each conversion switch 43, 53, 54 and the processing operation of each part are controlled by the control section which is not shown in accordance with the content, internal state, etc. of input data.

여기서, 스테레오 처리 등을 위한 부호화정보의 일부가 모노럴 오디오신호로 다중화되어 전송되는 부호화 방식(coding system)의 구체적인 예에 대하여 이하에 설명한다. Here, a specific example of a coding system in which a part of encoded information for stereo processing or the like is multiplexed and transmitted as a monaural audio signal will be described below.

예를 들면, HE AAC(High Efficiency Advanced Audio Coding, 국제 표준규격(International Standard) ISO/IEC 14496-3) 부호화 방식, 특히, HE AAC v2(version 2) 부호화 방식으로 부호화된 오디오 데이터는, 복호화(decoding)를 위해 필요한 부호화정보의 일부가 그 안에 다중화되어 전송된다. 이 HE AAC v2 부호화 방식은, 예를 들면, AAC(Advanced Audio Coding) 처리, SBR(Spectral Band Replication) 처리, PS(Parametric Stereo) 처리의 3개의 기술을 결합하여 구성된 다. SBR 처리 및 PS 처리를 위한 부호화정보는 부분적으로 다중화되어 (partially multiplexed) 전송된다. For example, audio data encoded by HE AAC (High Efficiency Advanced Audio Coding, International Standard ISO / IEC 14496-3) coding scheme, in particular, HE AAC v2 (version 2) coding scheme, may be decoded ( A part of encoding information necessary for decoding is multiplexed therein and transmitted. The HE AAC v2 coding scheme is formed by combining three techniques, for example, Advanced Audio Coding (AAC) processing, Spectral Band Replication (SBR) processing, and Parametric Stereo (PS) processing. Encoded information for SBR processing and PS processing is partially multiplexed and transmitted.

AAC 처리는 MPEG(Moving Picture Experts Group) 오디오로 규격화된 음성압축방식의 부호화 처리(coding process)이다. SBR 처리는 입력신호를 복수의 부대역(subband)으로 분할하고, 고음 주파수 대역(high sound frequency band)을 그보다 낮은 주파수 대역으로부터 복제함으로써, 대역 확장(band extension)을 행하는 부호화 처리이다. PS 처리는 모노럴 신호로부터 스테레오 신호를 생성하기 위해 필요한 공간정보 등을 이용하여 공간 부호화(spatial coding)를 실시하는 부호화 처리이다. The AAC process is a coding process of a speech compression method standardized by moving picture experts group (MPEG) audio. SBR processing is an encoding process that divides an input signal into a plurality of subbands and performs band extension by replicating a high sound frequency band from a lower frequency band. The PS process is a coding process that performs spatial coding using spatial information or the like necessary for generating a stereo signal from a monaural signal.

상기한 HE AAC v2 방식으로 부호화된 부호화 오디오 데이터는 상기한 AAC 부호화 방식으로 부호화된 모노럴 오디오 데이터와 동등한(equivalent) AAC 코어(AAC core)의 부호화정보(coded information), 상기한 SBR 처리의 부호화정보 및 상기한 PS 처리의 부호화정보를 포함한다. SBR 처리의 부호화정보는 다중화되어 간헐적으로 전송되는 부호화정보(sbr header)와 항상 전송되는 부호화정보(sbr data)를 포함한다. sbr 데이터(SBR data)를 복호화하려면, sbr 헤더(SBR header)가 필요하다. sbr 헤더(SBR header)는, 일정한 규칙(specific rule)하에 그 내용이 변경될 수 있고, 그 전송 타이밍도 운용(operational practice)에 따른다. PS 처리의 부호화정보(ps data)는, sbr 데이터(SBR data)의 확장영역에 포함되어 전송된다. 따라서, ps 데이터(PS data)를 복호화하는데도 마찬가지로 sbr 헤더(SBR header) 정보가 필요하다. 즉, sbr 헤더(SBR header)는, 스테레오 처리를 위한 ps 데이터(PS data)를 얻기 위해 요구되는 필요 스테레오 처리정보(necessary stereo process information)이다. 도 8은 HE AAC v2 부호화 방식으로 부호화된 오디오 데이터의 일례를 나타낸다. 도 8에 있어서, 부호(AC)는 AAC 코어의 부호화정보를 나타내고, 부호(SH)는 상기 sbr 헤더(SBR header)를 나타내며, 부호(SD)는 상기 sbr 데이터(SBR data)를 나타낸다. The coded audio data encoded by the HE AAC v2 scheme is coded information of an AAC core equivalent to monaural audio data encoded by the AAC encoding scheme, and the encoded information of the SBR process. And encoding information of the above-described PS processing. The encoded information of the SBR process includes encoded information (sbr header) that is multiplexed and transmitted intermittently and encoded information (sbr data) that is always transmitted. To decode sbr data, an sbr header is required. The SBR header may change its contents under certain rules, and its transmission timing depends on operational practice. The coding information (ps data) of the PS processing is included in the extended area of the sbr data (SBR data) and transmitted. Therefore, sbr header information is required for decoding PS data as well. That is, the sbr header is necessary stereo process information required for obtaining ps data for stereo processing. 8 shows an example of audio data encoded by the HE AAC v2 coding scheme. In FIG. 8, code AC represents encoding information of an AAC core, code SH represents the sbr header, and code SD represents the sbr data.

도 8에 나타낸 바와 같이, SBR 데이터(SD)와 그 확장영역에 포함되어 있는 PS 데이터를 복호화하기 위해서는 간헐적으로 전송되는 SBR 헤더(SH)가 필요하다. 그러나 상기한 바와 같은 임의의 프레임으로부터의 재생의 경우, 다중화된 SBR 헤더(SH)가 누락되는 경우가 있을 수 있다. 여기서, 다중화된 프레임들이 특히 상위측(higher-level system) 등에 의해 항상 감시(monitor)되지 않으면, 다중화된 SBR 헤더(SH)를 얻을 수 있는 프레임에 도달할 때까지 출력 오디오신호를 생성하기 위해 AAC 코어의 부호화정보(AC)를 이용하여 복호화 처리가 수행된다. 이 경우의 디코드 처리는 상기 AAC 디코드 처리와, 대역분할(band division) 및 대역합성(band synthesis)을 위한 상기 SBR 처리에 근거하는 업 샘플링 처리(up-sampling process)를 포함한다. As shown in Fig. 8, in order to decode the SBR data SD and the PS data included in the extended area, an SBR header SH intermittently transmitted is required. However, in case of reproduction from any frame as described above, there may be a case where the multiplexed SBR header SH is missing. Here, if the multiplexed frames are not always monitored, especially by a higher-level system or the like, AAC to generate an output audio signal until reaching a frame from which the multiplexed SBR header (SH) can be obtained. The decoding process is performed using the encoding information AC of the core. The decode process in this case includes the AAC decode process and an up-sampling process based on the SBR process for band division and band synthesis.

다중화된 SBR 헤더(SH)를 포함하는 프레임에 도달하면, 이 SBR 헤더(SH)를 이용하여 상기 SBR 데이터(SD)나 그 확장영역에 포함되어 있는 PS 데이터가 복호화된다. 그리고 나서, 이러한 SBR 데이터와 PS 데이터를 이용하여 출력 스테레오 오디오신호를 생성하기 위해 "완전한(complete)" 복호화 처리(스테레오 처리를 포함한다)가 수행된다. 상기 HE AAC v2 부호화 오디오 데이터의 복호화 처리에 있 어서, 상기 AAC 디코드 처리가 수행되고, 그 후, 상기 SBR 처리에 있어서, 대역분할 및 고역(HF) 성분(high frequency component)의 생성이 수행되며, 상기 PS 처리에서 부호화된 공간정보에 근거하여 대역 분할된 모노럴 신호로부터 스테레오 신호가 생성된 후, SBR 처리의 대역합성 처리에 의해 최종적으로 출력 스테레오 오디오신호가 생성된다. When the frame including the multiplexed SBR header SH is reached, the SBR data SD or the PS data included in the extended area are decoded using the SBR header SH. Then, a "complete" decoding process (including stereo processing) is performed to generate an output stereo audio signal using this SBR data and PS data. In the decoding processing of the HE AAC v2 encoded audio data, the AAC decoding processing is performed, and then, in the SBR processing, band division and generation of a high frequency component (HF) are performed. After the stereo signal is generated from the monaural signal band-divided based on the spatial information encoded in the PS process, the output stereo audio signal is finally generated by the band synthesis process of the SBR process.

도 9는, 상기 HE AAC v2 방식으로 부호화된 부호화 오디오 데이터의 재생장치의 구성예를 나타내는 블록도이다. 도 9의 입력단자(input terminal)(11)에는, 전송에 의해, 부호화 오디오 스트림(coded audio stream)이 공급된다. 부호화 오디오 스트림은 AAC 코어의 부호화정보, HF 생성 부호화정보(SBR 데이터) 및 PS 부호화정보(PS 데이터)를 포함한다. 부호화정보의 일부는 다중화되어 전송된다. HF 생성 부호화정보(SBR 데이터) 및 PS 부호화정보(PS 데이터)를 복호화하려면, 상기한 바와 같이, 다중화되어 전송되는 SBR 헤더(SH)가 필요하다. Fig. 9 is a block diagram showing an example of the configuration of a playback device for encoded audio data encoded by the HE AAC v2 system. A coded audio stream is supplied to the input terminal 11 of FIG. 9 by transmission. The encoded audio stream includes encoding information of the AAC core, HF generation encoding information (SBR data), and PS encoding information (PS data). Some of the encoded information is multiplexed and transmitted. In order to decode HF generated encoded information (SBR data) and PS encoded information (PS data), as described above, an SBR header SH which is multiplexed and transmitted is required.

HE AAC v2 부호화 방식에 있어서, SBR 헤더(SH)의 일부가 이전 프레임에 포함된 것과 다른 경우, SBR 처리의 초기화를 실시할 필요가 있다. SBR 처리의 초기화에 의해, 후술하는 QMF 분석부/합성부, 하이브리드 분석부 등의 상태변수(state variable)(지연신호(delay signal))가 초기화된다. 여기서, 상태변수(지연신호)란, 필터 내의 지연소자(delay element)에 유지되는 데이터(신호)를 의미한다. 필터처리에 있어서, 필터 길이(filter length)에 따라 신호의 입력에서 출력까지의 기간 내에서 지연이 발생하고, 상태변수는 이 지연신호를 의미한다. In the HE AAC v2 coding scheme, when a part of the SBR header SH is different from that included in the previous frame, it is necessary to initialize the SBR process. By the initialization of the SBR process, state variables (delay signals) such as a QMF analyzer / synthesizer, a hybrid analyzer, and the like described later are initialized. Here, the state variable (delay signal) means data (signal) held in a delay element in the filter. In the filter process, a delay occurs within a period from the input to the output of the signal according to the filter length, and the state variable means this delay signal.

그런데, HE AAC v2 부호화 방식으로 부호화된 AAC 부호화정보를 복호화하여 얻어지는 모노럴 오디오 데이터는 SBR 처리의 QMF 분석 및 QMF 합성처리를 수행함으로써 업 샘플링된다. 예를 들면, 상기 장치는 AAC 복호화 후 모노럴 오디오 데이터를 24kHz의 샘플링 비율(sampling rate)로 SBR 처리하고, 그것에 의해 샘플링 비율이 48kHz인 오디오 데이터를 출력한다. However, monaural audio data obtained by decoding AAC encoded information encoded by the HE AAC v2 coding scheme is upsampled by performing QMF analysis and QMF synthesis processing of the SBR process. For example, the apparatus performs SBR processing of monaural audio data after sampling AAC at a sampling rate of 24 kHz, thereby outputting audio data having a sampling rate of 48 kHz.

도 9에 있어서, 입력단자(11)로부터의 부호화 오디오 데이터는, 페이로드 디포매터(payload deformatter)(12)로 보내져 AAC 코어 복호부(13)로의 AAC 코어 부호화정보와, HF 생성 부호화정보(SBR 데이터)/PS 부호화정보(PS 데이터)로 분리된다. AAC 코어 복호부(13)는 공급된 AAC 코어 부호화정보를 복호화하고, AAC 코어의 모노럴 오디오신호를 생성하며, 생성된 신호를 SBR 처리부(20)에 보낸다. SBR 처리부(20)의 파서(parser)(14)는, 페이로드 디포매터(12)로부터의 HF 생성 부호화정보 등과 같은 다중화된 정보를 취득하고(acquire), 그 내용을 확인하여(check), SBR 처리의 초기화가 필요한가 아닌가를 판단한다(judge). 초기화가 필요한 경우, 파서(14)는 초기화 제어신호를 단자(14t)로부터 출력하여, 후술 하는 바와 같이 각 부(relevant section)에서 SBR 처리의 초기화가 수행되도록 한다. AAC 코어 복호부(13)로부터 SBR 처리부(20)에 보내진 모노럴 오디오신호는 QMF 분석부(21)에 의해 대역분할되고, 각각의 대역분할된 신호는 변환 스위치(22)에 보내진다. HF 생성 부호화정보(SBR 데이터)가 공급되면, 변환 스위치(22)가 선택단자(B, C)로의 접속을 위해 전환되어, QMF 분석부(21)로부터의 신호가 HF 생성부(23)에 보내지도록 한다. HF 생성부(23)는 HF 신호를 생성한다. 엔벨로프 조정부(envelope adjuster)(24)는 포락선 조정(envelope adjustment)을 행한다. 그 결과로서의 신호는 변환 스위치(25)로 보내진다. In FIG. 9, the encoded audio data from the input terminal 11 is sent to the payload deformatter 12, to the AAC core decoder 13, to the AAC core encoded information and the HF generated encoded information (SBR). Data) / PS encoded information (PS data). The AAC core decoding unit 13 decodes the supplied AAC core encoding information, generates a monaural audio signal of the AAC core, and sends the generated signal to the SBR processing unit 20. The parser 14 of the SBR processing unit 20 acquires multiplexed information, such as HF generation coded information from the payload deformatter 12, and checks the contents thereof, and checks the contents thereof. Judge whether processing should be initiated. When initialization is required, the parser 14 outputs an initialization control signal from the terminal 14t so that initialization of the SBR process is performed in each relevant section as will be described later. The monaural audio signal sent from the AAC core decoder 13 to the SBR processor 20 is band-divided by the QMF analyzer 21, and each band-divided signal is sent to the conversion switch 22. When the HF generation encoding information (SBR data) is supplied, the conversion switch 22 is switched for connection to the selection terminals B and C so that a signal from the QMF analyzer 21 is sent to the HF generator 23. To do that. The HF generator 23 generates an HF signal. Envelope adjuster 24 performs envelope adjustment. The resulting signal is sent to conversion switch 25.

상기 PS 부호화정보(PS데이터)로부터 스테레오 처리정보가 얻어지면, 변환 스위치(22, 25)는 선택단자(C)로의 접속을 위해 전환된다. 변환 스위치(25)의 선택단자(C)로부터의 신호는 하이브리드 분석부(hybrid analyzer)(27)에 보내진다. 하이브리드 분석부(27)는 공급된 대역분할 신호의 저역(LF) 신호를 더욱 대역 분할하고, 그 결과로서의 신호를 신호 해석부(signal de-correlator)(29) 및 스테레오 처리부(stereo processor)(30)에 공급한다. 신호 해석부(29)는 공급된 신호를 해석하고, 그것에 음향조정(acoustic adjustment)을 행하며, 그 결과로서의 신호를 스테레오 처리부(30)에 공급한다. 스테레오 처리부(30)는 공급된 대역분할 신호와 스테레오 처리정보로부터 좌우 채널(Lch, Rch)의 스테레오 신호를 생성한다. 생성된 좌우 채널(Lch, Rch)의 스테레오 신호에 대하여, 각 채널의 하이브리드 합성부(31, 32)는 상기 하이브리드 분석부(27)에서 얻어진 대역분할된 신호를 대역합성하고, 또한, QMF 합성부(33, 34)는 상기 QMF 분석부(21)에 의해 얻어진 대역분할된 신호를 대역합성하여, 좌우 채널(Lch, Rch)의 스테레오 출력 오디오신호를 생성한다. QMF 합성부(33)로부터의 Lch의 오디오신호는 변환 스위치(36) 및 출력단자(37)로 보내진다. QMF 합성부(34)로부터의 Rch의 오디오신호는 변환 스위치(36)로 보내지고, QMF 합성부(33)로부터의 신호와 이 Rch 오디오신호 중 하나가 선택되어, 선택된 신호가 출력단자(38)로 보내진다. When stereo processing information is obtained from the PS coded information (PS data), the conversion switches 22 and 25 are switched for the connection to the selection terminal C. The signal from the selection terminal C of the conversion switch 25 is sent to the hybrid analyzer 27. The hybrid analyzer 27 further divides the low frequency (LF) signal of the supplied band split signal, and divides the resulting signal into a signal de-correlator 29 and a stereo processor 30. Supplies). The signal analyzer 29 analyzes the supplied signal, makes acoustic adjustments to it, and supplies the resulting signal to the stereo processor 30. The stereo processor 30 generates stereo signals of left and right channels Lch and Rch from the supplied band split signal and the stereo processing information. With respect to the stereo signals of the generated left and right channels Lch and Rch, the hybrid synthesizing units 31 and 32 of each channel band synthesize the band-divided signals obtained by the hybrid analyzing unit 27, and the QMF synthesizing unit. Reference numerals 33 and 34 band synthesize the band-divided signals obtained by the QMF analyzer 21 to generate stereo output audio signals of left and right channels Lch and Rch. The Lch audio signal from the QMF synthesizing section 33 is sent to the conversion switch 36 and the output terminal 37. The audio signal of Rch from the QMF synthesizing section 34 is sent to the conversion switch 36, one of the signal from the QMF synthesizing section 33 and this Rch audio signal is selected, and the selected signal is output to the output terminal 38. Is sent to.

상기 스테레오 처리정보와 같은 다중화 정보가 전송되어 있지 않은 경우에는, 도 9의 변환 스위치(22, 25, 35, 36)는 선택단자(A 또는 B)로의 접속을 위해 전환된다. 출력 오디오신호의 샘플링 주파수를 일정하게 하기 위해, QMF 분석부(21) 및 QMF 합성부(33)을 이용하여 업 샘플링만이 수행된다. 또한, 출력 채널수를 일정하게 하기 위해, 출력 신호를 생성하기 위하여 Lch의 오디오신호가 Rch의 오디오신호로 복제(copy)된다. When multiplexing information such as the stereo processing information is not transmitted, the conversion switches 22, 25, 35, 36 in Fig. 9 are switched for connection to the selection terminal A or B. In order to make the sampling frequency of the output audio signal constant, only upsampling is performed using the QMF analyzer 21 and the QMF synthesizer 33. Also, in order to make the number of output channels constant, the audio signal of Lch is copied to the audio signal of Rch in order to generate the output signal.

도 10은, 예를 들면, 상기 도 9의 구성에 있어서의 상기한 바와 같은 복호화 동작을 나타내는 플로차트(flow chart)이다. FIG. 10 is a flowchart showing a decoding operation as described above in the configuration of FIG. 9, for example.

도 10에 있어서, 상기 입력단자(11)에 공급되는 부호화 오디오 스트림과 같은 부호화정보에 대하여, 단계(S101)에서 상기 HE AAC v2 방식에 의해 부호화된 데이터의 복호화(디포매팅) 처리가 수행되어 다중화된 부호화정보로서, 상기한 바와 같이 HF 생성 부호화정보 및 공간 부호화정보를 추출한다. 또한, 상기 AAC 코어 정보에 대하여는, 단계(S102)에서 AAC 신호처리가 수행된다. 다음의 단계(S103)에서는, 상기 SBR 처리가 수행되는지 아닌지가 판단되며, 예(YES)인 경우 처리는 단계(S104)로 진행되고, 반면, 아니오(NO)인 경우 처리는 단계(S114)로 진행된다. 이러한 처리는, 예를 들면, 도 9의 페이로드 디포매터(12), AAC 코어 복호부(13)에 의해 수행되는 처리에 대응한다. 10, decoding (deformatting) of data encoded by the HE AAC v2 method is performed on the encoded information such as the encoded audio stream supplied to the input terminal 11, and multiplexed. As the encoded information, the HF generated encoded information and the spatial encoded information are extracted as described above. Also, for the AAC core information, AAC signal processing is performed in step S102. In the next step S103, it is determined whether or not the SBR process is performed. If YES, the process proceeds to step S104, whereas if NO, the process goes to step S114. Proceed. This process corresponds to, for example, the process performed by the payload deformatter 12 and the AAC core decoder 13 of FIG.

단계(S104)에 있어서, 예를 들면, 상기 QMF 분석부(21)에 의해, QMF 대역분할 처리가 행해진다. 다음의 단계(S105)에서, 다중화된 부호화정보가 이미 복호화 되었는지 아닌지가 판단되고, 예(YES)이면, 처리는 단계(S106)로 진행되며, 반면, 아니오(NO)이면, 처리는 단계(S113)로 진행된다. 단계(S106)에서는, 예를 들면, 상기 HF 생성부(23)에 의해, 다중화된 HF 생성 부호화정보(이미 복호화된 정 보)를 이용하여 HF 신호 생성처리가 행해지고, 그 후, 다음의 단계(S107)에서, PS 처리가 행해지는지 아닌지가 판단된다. In step S104, for example, the QMF analyzer 21 performs QMF band division processing. In the next step S105, it is determined whether or not the multiplexed encoded information has already been decoded, and if yes (YES), the processing proceeds to step S106, while if no (NO), the processing proceeds to step S113. Proceeds to). In step S106, for example, the HF generation unit 23 performs an HF signal generation process using the multiplexed HF generation encoding information (already decoded information), and then, the next step ( In S107, it is determined whether or not the PS process is performed.

단계(S107)에서, 예(YES)(PS 처리가 수행된다)라고 판단되면, 단계(S108)로 진행하도록 제어하여, 하이브리드 분석처리가 수행된다. 그 후, 단계(S109)에서, 공간정보에 근거하여 스테레오 신호 생성처리가 수행되고, 이어서 단계(S110)에서, 하이브리드 합성처리가 수행된다. 그 후, 단계(S111)로 진행하도록 제어한다. 이러한 처리는, 예를 들면, 도 9의 하이브리드 분석부(27)에 의래 수행되는 처리로부터 하이브리드 합성부(31, 32)에 의해 수행되는 처리까지에 해당한다. 단계(S107)에서, 아니오(NO)(PS 처리를 수행하지 않는다)라고 판단 되면, 단계(S111)로 진행하도록 제어한다. If it is determined in step S107 that YES (PS processing is performed), then control proceeds to step S108, where a hybrid analysis process is performed. Then, in step S109, a stereo signal generation process is performed based on the spatial information, and then in step S110, a hybrid synthesis process is performed. Thereafter, the control proceeds to step S111. Such a process corresponds to, for example, a process performed by the hybrid analyzer 27 of FIG. 9 to a process performed by the hybrid synthesis units 31 and 32. In step S107, if NO is determined (NO PS processing is not performed), control proceeds to step S111.

단계(S111)에서, Lch의 QMF 대역합성 처리가 수행되고, 단계(S112)에서, Rch의 QMF 대역합성 처리가 수행되어, 그 결과로서의 오디오신호가 출력된다. 또한, 상기 단계(S113)에서, Lch의 QMF 대역합성 처리가 수행되고, 단계(S114)에서, 스테레오 신호를 생성하기 위해, 필요에 따라 모노럴 신호가 복제되어, 그 결과로서 오디오신호가 출력된다. 이러한 처리는, 예를 들면, 상기 도 9의 변환 스위치(22, 35, 36)를 통하여 QMF 합성부(33, 34)에 의해 행해지는 처리에 해당한다. In step S111, QMF band synthesis processing of Lch is performed, and in step S112, QMF band synthesis processing of Rch is performed, and the resultant audio signal is output. Further, in step S113, QMF band synthesis processing of Lch is performed, and in step S114, a monaural signal is duplicated as necessary to generate a stereo signal, and as a result, an audio signal is output. Such a process corresponds to, for example, a process performed by the QMF synthesizing units 33 and 34 through the conversion switches 22, 35, and 36 shown in FIG.

종래 기술로서, 국제특허문헌의 번역본(Published translation of International Patent Application)(KHOYO) 제2004-535145호 (참조특허 1) 및 일본특허공보(Japanese Patent Application Publication)(KOKAI) 제2006-085183호(참조특허 2)에는, 모노럴 오디오신호를 스테레오 처리정보에 근거하여 스테레오 처리함 으로써 스테레오 오디오신호를 생성하는 기술이 개시되어 있고, ISO/IEC 14496-3: 2005, 정보기술 - 오디오-비주얼 오브젝트의 부호화 - Part 3: 오디오(Information Technology - Coding of audio-visual objects, - Part 3: Audio)(비특허 문헌 1)에는, 상기 HE AAC(High Efficiency Advanced Audio Coding) 부호화 방식의 규격이 개시되어 있다. As a prior art, Published translation of International Patent Application (KHOYO) No. 2004-535145 (Reference Patent 1) and Japanese Patent Application Publication (KOKAI) No. 2006-085183 (Reference) Patent 2) discloses a technique for generating a stereo audio signal by stereo processing a monaural audio signal based on stereo processing information. ISO / IEC 14496-3: 2005, Information technology-Encoding of audio-visual objects- Part 3: Audio (Information Technology-Coding of audio-visual objects-Part 3: Audio) (Non-Patent Document 1) discloses a specification of the HE AAC (High Efficiency Advanced Audio Coding) coding scheme.

그런데, 예를 들면, 상기한 프레임 데시메이션 재생과 같은 불연속 프레임의 재생에 의한, 임의의 프레임으로부터의 재생에 있어서, 내부 상태변수가 초기화되면, 그 후, 스테레오 처리정보와 같은 부분적으로 다중화된 부호화정보가 공급되었을 때 상태변수의 갱신이 개시된다. 따라서 필터 지연 등의 영향으로 인해 불규칙한 음(abnormal sound)이 발생한다. By the way, for example, when the internal state variable is initialized in playback from an arbitrary frame by playback of discontinuous frames such as the above-described frame decimation playback, thereafter, partially multiplexed encoding such as stereo processing information is then performed. When information is supplied, the update of the state variable is started. Therefore, an abnormal sound is generated due to the influence of the filter delay.

예를 들면, 상기 도 6의 구성에 있어서, 상기 도 7의 전송단위(transmission unit) #2에 대응하는 위치로부터 입력이 시작되고, 전송단위 #2에서 #4 사이에 대응하는 기간 동안 사용가능한 스테레오 처리정보가 없는 상태로부터 스테레오 처리정보가 전송단위 #5에 포함되어 입력되면, 각 변환 스위치(43, 53, 56)는 선택단자(B) 측으로 전환된다. 대역 분할부(band divider)(44)는 이들 스위치가 선택단자(B) 측으로 전환된 후 처음으로 대역분할신호(band-division signal)를 생성한다. 이때의 대역 분할부(44)의 상태변수는 초기상태이므로, 전송단위 #5에 대응하는 출력에 대해 이 상태의 영향이 미치게 된다. 예를 들면, 상기 영향은 출력신호의 댐핑(damping) 등을 포함할 수 있고, 그로 인해 불규칙한 음이 발생할 수 있다. For example, in the configuration of FIG. 6, the input starts from a position corresponding to the transmission unit # 2 of FIG. 7 and is usable for a period corresponding to the transmission unit # 2 to # 4. When stereo processing information is included in the transmission unit # 5 from the state where there is no processing information, each conversion switch 43, 53, 56 is switched to the selection terminal B side. The band divider 44 generates a band-division signal for the first time after these switches are switched to the selection terminal B side. At this time, since the state variable of the band dividing unit 44 is the initial state, the influence of this state is affected on the output corresponding to the transmission unit # 5. For example, the influence may include damping of the output signal or the like, thereby causing an irregular sound.

또, 상기 도 9의 구성의 경우에는, HE AAC v2 방식으로 부호화된 오디오 데이터를 프레임 데시메이팅에 의해 빨리 감기(fast-forwarding) 재생을 행하는 경우와 같이, 프레임이 불연속적으로 재생되면, 다중화된 sbr 헤더(SBR header)가 누락 되는 경우가 있다. 예를 들면 , 도 8의 예의 경우에, 프레임(전송단위) #1부터 재생이 시작하면, SBR 헤더(SH)는 프레임 #5에 대응하는 타이밍에서 처음으로 전송된다. 이 경우, SBR 헤더(SH)가 얻어질 수 있는 프레임에 도달할 때까지는, SBR 데이터(SD)의 SBR 부호화정보와 PS 부호화정보가 복호화될 수 없어, 변환 스위치(22)가 그 선택단자(A) 측에 접속되고, 변환 스위치(35)는 선택단자(A) 측에 접속되며, 변환 스위치(36)는 선택단자(B) 측에 각각 접속되게 된다. 따라서 AAC 코어의 모노럴 오디오신호는 SBR 처리의 QMF 분석부(21) 및 Lch QMF 합성부(33)를 이용하여 업 샘플링되고, 스테레오 좌우 채널에 동일한(identical) 출력 오디오신호가 생성된다. In the case of the configuration of FIG. 9, when the frames are reproduced discontinuously, such as when fast-forwarding reproduction of audio data encoded by the HE AAC v2 method is performed by frame decimation, the multiplexing is performed. Sometimes the sbr header is missing. For example, in the case of the example of Fig. 8, when playback starts from frame (transmission unit) # 1, the SBR header SH is first transmitted at a timing corresponding to frame # 5. In this case, the SBR encoding information and the PS encoding information of the SBR data SD cannot be decoded until the frame in which the SBR header SH is obtained can be decoded, so that the conversion switch 22 selects the selection terminal A. ), The changeover switch 35 is connected to the selection terminal A side, and the changeover switch 36 is connected to the selection terminal B side, respectively. Therefore, the monaural audio signal of the AAC core is upsampled using the SBR QMF analyzer 21 and the Lch QMF synthesizer 33, and an identical output audio signal is generated in the stereo left and right channels.

이와 같이 프레임이 불연속적으로 재생되는 경우, 재생장치 내의 필터의 상태변수(지연신호) 및 HE AAC v2 부호화 방식으로 부호화된 입력 오디오 데이터는 불연속이 된다. 따라서 재생장치는 이들 내부 상태변수를 초기화하기 위해 초기화(SBR 처리 초기화 포함) 될 필요가 있다. 이들 재생장치 내의 상태변수(지연신호)는 QMF 분석부(21), QMF 합성부(33, 34), 하이브리드 분석부(27)의 상태변수를 포함하고, 이들 상태변수는 초기화시에 0으로 설정된다. SBR 헤더(SH)가 전송될 때까지 SBR 부호화정보/PS 부호화정보가 복호화될 수 없으므로, 재생장치는 그 변환 스위치(22, 35, 36)를 그들의 선택단자(A) 측으로 전환하여 AAC 코어 복호부(13)로부터의 모노럴 오디오신호가 QMF 분석부(21) 및 Lch QMF 합성부(33)에 의한 처리를 통해 업 샘플링되도록 하고, 결과로서의 출력 오디오신호를 스테레오 좌우 채널에 출력한다. SBR 헤더(SH)가 전송되면, 재생장치의 초기화 후에 SBR 부 호화정보와 PS 부호화정보가 처음으로 복호화되고, SBR 처리 및 PS 처리가 실행된다. QMF 분석부(21) 및 Lch QMF합성부(33)는 SBR 헤더(SH)가 전송되기 전이라도 그들의 업 샘플링 처리를 수행하므로, 그들의 상태변수는 계속해서 갱신된다. 한편, 각 하이브리드 분석부(27) 및 Rch QMF 합성부(34)의 상태변수는 초기화된 상태이다. 이 상태는 이후의 처리에 영향을 미치고, 그것에 의해 출력 오디오신호에 불규칙한 음이 발생한다. 도 11a, 11b는 이러한 처리시점에서의 좌우 채널(Lch, Rch)의 스테레오 출력 오디오신호의 예를 나타낸다. When the frames are discontinuously reproduced in this manner, the state variables (delayed signals) of the filters in the reproducing apparatus and the input audio data encoded by the HE AAC v2 coding scheme become discontinuous. Therefore, the playback apparatus needs to be initialized (including SBR processing initialization) to initialize these internal state variables. The state variables (delay signals) in these reproducing apparatuses include the state variables of the QMF analyzing section 21, the QMF synthesizing sections 33 and 34, and the hybrid analyzing section 27, and these state variables are set to zero at initialization. do. Since the SBR encoded information / PS encoded information cannot be decoded until the SBR header SH is transmitted, the playback apparatus switches its conversion switches 22, 35, and 36 to their selection terminal A side, so that the AAC core decoder The monaural audio signal from (13) is upsampled through the processing by the QMF analyzer 21 and the Lch QMF synthesizer 33, and outputs the resulting output audio signal to the stereo left and right channels. When the SBR header SH is transmitted, the SBR encoding information and the PS encoding information are first decoded after initialization of the playback apparatus, and the SBR processing and the PS processing are executed. Since the QMF analyzer 21 and the Lch QMF synthesizer 33 perform their upsampling process even before the SBR header SH is transmitted, their state variables are continuously updated. On the other hand, the state variables of each hybrid analyzer 27 and Rch QMF synthesizer 34 is in an initialized state. This state affects subsequent processing, whereby an irregular sound is generated in the output audio signal. 11A and 11B show examples of stereo output audio signals of left and right channels Lch and Rch at this processing point.

도 11a, 11b는, 사용가능한 다중화된 부호화정보(스테레오 정보 등)가 없는 상태, 예를 들면, AAC-LC(Low Complexity) 부호화정보신호만이 공급되고, SBR 처리에서 업 샘플링 처리만이 수행되는 상태로부터, 시각(t1)에 스테레오 처리정보를 포함하는 다중화된 부호화정보가 유효(사용 가능)하게 되어 AAC처리, SBR 처리 및 PS 처리가 개시된 상태를 나타내고 있다. 도 11a는, Lch 출력 오디오신호를, 반면, 도 11b는 Rch 출력 오디오신호를 각각 나타내고 있다. 11A and 11B show a state in which no multiplexed encoded information (stereo information, etc.) is available, for example, only AAC-LC (Low Complexity) encoded information signals are supplied, and only upsampling processing is performed in the SBR process. From the state, the multiplexed encoded information including stereo processing information at time t1 becomes valid (usable), indicating a state in which AAC processing, SBR processing, and PS processing are started. Fig. 11A shows the Lch output audio signal, while Fig. 11B shows the Rch output audio signal, respectively.

이 도 11a, b에 있어서, 시각(t1)에서, 재생장치는 상기 내부 상태변수의 초기화 후에 처음으로 다중화된 부호화정보를 인식한다. 그러나 상태변수가 초기화 상태로부터 변화되므로, 시각(t1과 t2) 사이에 상기 SBR 처리를 위한 대역합성부(Rch QMF 합성부(34))의 상태변수에 의한 영향이 Rch의 출력 오디오신호에 미치게 되고, 반면, 시각(t2와 t3) 사이에 상기 PS 처리를 위한 하이브리드 필터(하이브리드 분석부(27))의 상태변수에 의한 영향이 Lch, Rch의 두 오디오신호 모두에 미치게 된다. 그 결과, 출력 오디오신호에 불규칙한 음이 발생하게 된다. 11A and 11B, at time t1, the playback apparatus recognizes encoded information multiplexed for the first time after initialization of the internal state variable. However, since the state variable changes from the initial state, the influence of the state variable of the band synthesizing unit (Rch QMF synthesizing unit 34) for the SBR processing between time t1 and t2 affects the output audio signal of Rch. On the other hand, the influence of the state variables of the hybrid filter (hybrid analyzer 27) for PS processing between the times t2 and t3 affects both audio signals of Lch and Rch. As a result, irregular sounds are generated in the output audio signal.

상기 단점을 회피하기 위해, 다중화된 부호화정보를 항상 감시(monitor)하는 것이 고려된다. 이 경우, 다중화된 정보가 통상의 부호화정보와 동시에 전송된다. 따라서 모든 부호화정보가 복호화될 필요가 있고, 이는 처리량의 감소를 저해한다. In order to avoid the disadvantage, it is considered to always monitor the multiplexed encoded information. In this case, the multiplexed information is transmitted simultaneously with the normal encoded information. Therefore, all encoded information needs to be decoded, which hinders a decrease in throughput.

상기한 상황의 관점에서, 다중화된 부호화정보 및 복호화에 필요한 정보(SBR 헤더 등)가 간헐적으로 전송됨으로 인해 임의의 위치로부터 재생이 행해지는 경우, 내부 상태변수가 초기화된 상태로부터 필요한 부호화정보가 공급될 때 발생하는 필터지연 등으로 인한, 출력 오디오신호에 미치는 악영향(negative influence)(불규칙한 음의 발생 등)을 유효하게 방지할 수 있는 재생장치 및 방법, 프로그램 및 기록매체를 제공하는 것이 바람직하다. In view of the above situation, when reproduction is performed from an arbitrary position due to the intermittent transmission of multiplexed encoding information and information necessary for decoding (such as an SBR header), necessary encoding information is supplied from an internal state variable initialized state. It is desirable to provide a reproducing apparatus and method, a program, and a recording medium which can effectively prevent negative influence (irregular sound generation, etc.) on an output audio signal due to filter delay occurring when the filter is generated.

본 발명의 한 실시예에서는, 스테레오 처리에 요구되는 필요 스테레오 처리정보가 모노럴 오디오신호의 부호화정보로 간헐적으로 다중화되어 전송되는 부호화 오디오 데이터를 복호화 처리 및 재생하는데 있어서, 필요 스테레오 처리정보가 공급되지 않으면 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하며, 필요 스테레오 처리정보가 입력되면 필터 내의 상태변수의 갱신을 개시하고 모든 상태변수가 갱신될 때까지 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하며, 필터 내의 모든 상태변수가 갱신되었으면 모노럴 오디오신호에 대하여 필요 스테레오 처리정보에 의해 얻어진 스테레오 처리정보에 근거하여 스테레오 처리를 수행하여 스테레오 오디오신호를 생성하고 출력하도록 구성된다. In one embodiment of the present invention, when the necessary stereo processing information required for stereo processing is intermittently multiplexed into encoded information of a monaural audio signal and decoded and reproduced encoded audio data transmitted, the required stereo processing information is not supplied. Outputting stereo audio signal using monaural audio signal, and when necessary stereo processing information is input, update of state variable in filter is started, and stereo audio signal is output using monaural audio signal until all state variables are updated, If all the state variables in the filter have been updated, stereo processing is performed on the monaural audio signal based on the stereo processing information obtained by the necessary stereo processing information to generate and output a stereo audio signal.

여기서, 상기 스테레오 처리는, 대역확장된 모노럴 오디오신호에 대하여 행해지는 것이 바람직하다. In this case, the stereo processing is preferably performed on the monaural audio signal extended in the band.

또한, 상기 필요 스테레오 처리정보가 공급되지 않는 경우는, 상기 모노럴 오디오신호를 대역분할 필터링 처리에 의해 적어도 2개의 부대역(sub-band)으로 분할하고, 대역합성 필터링 처리에 의해 상기 대역분할된 모노럴 오디오신호를 업 샘플링하며, 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력한다. 상기 필요 스테레오 처리정보가 공급되는 경우는, 모노럴 오디오신호에 대한 필터 내의 상태변수를 스테레오 오디오신호에 대한 필터링 상태변수로서 처리하는 것이 바람직하다. When the necessary stereo processing information is not supplied, the monaural audio signal is divided into at least two sub-bands by band division filtering processing, and the monaural divided by band synthesis filtering processing. The audio signal is upsampled and a stereo audio signal is output using the monaural audio signal. When the necessary stereo processing information is supplied, it is preferable to process the state variable in the filter for the monaural audio signal as the filtering state variable for the stereo audio signal.

또한, 상기 부호화 오디오 데이터는, HE AAC(High Efficiency Advanced Audio Coding) 부호화 방식에 근거하는 모노럴 오디오 데이터에 해당하는 AAC 코어의 부호화정보와, SBR(Spectral Band Replication) 처리를 위한 부호화정보 및 PS(Parametric Stereo) 처리를 위한 부호화정보를 가진다. 상기 SBR 처리를 위한 부호화정보는 다중화되어 간헐적으로 전송되는 부호화정보인 SBR 헤더(sbr header)와 항상 전송되는 부호화정보인 SBR 데이터(sbr data)를 포함한다. 상기 PS 처리를 위한 부호화정보인 PS 데이터(ps data)는 상기 SBR 데이터의 확장영역에 포함되어 전송된다. 상기 SBR헤더는 상기 SBR 데이터를 복호화하기 위해 요구되는 상기 필요 스테레오 처리정보이다. The encoded audio data may include encoding information of an AAC core corresponding to monaural audio data based on HE AAC (High Efficiency Advanced Audio Coding) coding scheme, encoding information for SBR (Spectral Band Replication) processing, and a parametric (PS). Stereo) has encoding information for processing. The encoded information for SBR processing includes an SBR header, which is multiplexed and intermittently transmitted information, and SBR data, which is always transmitted encoded information. PS data, which is encoding information for the PS processing, is included in the extended area of the SBR data and transmitted. The SBR header is the necessary stereo processing information required for decoding the SBR data.

본 발명의 실시예에 따르면, 필요 스테레오 처리정보가 공급되지 않는 경우 로부터 필요 스테레오 처리정보가 공급되는 경우까지도, 불규칙한 음의 발생으로부터 자유로운 양호한 스테레오 오디오신호가 재생될 수 있다. According to the embodiment of the present invention, even from when the necessary stereo processing information is not supplied to when the necessary stereo processing information is supplied, a good stereo audio signal free from irregular sound generation can be reproduced.

본 발명의 다른 특징 및 형태는 첨부된 도면을 참조하여 이하의 실시예의 상세한 설명에 상세히 기술된다. Other features and aspects of the present invention are described in detail in the following detailed description with reference to the accompanying drawings.

이하, 첨부된 도면을 참조하여 본 발명의 구체적인 실시예에 대하여 상세하게 설명한다. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은, 본 발명의 실시예에 따른 재생장치 또는 재생방법에 이용되는 스테레오 처리장치의 개략적인 구성예를 나타내는 블록도이다. 도 1에 있어서, 상술한 도 6에 대응하는 부분은 동일한 참조부호로서 나타낸다. 1 is a block diagram showing a schematic configuration example of a stereo processing apparatus used in a playback apparatus or a playback method according to an embodiment of the present invention. In Fig. 1, the parts corresponding to Fig. 6 described above are denoted by the same reference numerals.

모노럴 오디오신호가 도 1의 입력단자(input terminal)(41)에 공급되고, 스테레오 처리정보가 도 1의 입력단자(42)에 각각 공급된다. 입력단자(41)로부터의 모노럴 오디오신호는 스위치(switch)(43X) 및 지연부(delay section)(46)에 보내진다. 스위치(43X)로부터의 모노럴 오디오신호는 대역분할부(band divider)(44)에 보내지고 대역분할되어, 그 결과로서 대역분할된 모노럴 오디오신호가 스테레오 처리부(stereo processor)(45)에 보내진다. 스테레오 처리부(45)에는 입력단자(42)로부터 스테레오 처리정보가 공급되고, 대역 분할된 모노럴 오디오신호를 좌 채널(Lch)과 우 채널(Rch) 스테레오신호로 스테레오 처리한다. 그리고 나서, 결과로서의 Lch 및 Rch 스테레오신호 중, Lch 신호는 스위치(61)를 통하여 대역합성부(band synthesizer)(51)로 보내지고, Rch 신호는 스위치(62)를 통 하여 대역합성부(52)로 보내진다. 대역합성부(51)로부터의 Lch 오디오신호는 변환 스위치(53X)로 보내지고, 이 Lch 오디오신호와 지연부(46)을 통하여 공급된 신호 중 하나가 선택되어, 선택된 신호가 변환 스위치(54X) 및 출력단자(55)로 보내진다. 대역합성부(52)로부터의 Rch 오디오신호는 변환 스위치(54X)로 보내지고, 이 Rch 오디오신호와 변환 스위치(53X)로부터 공급된 신호 중 하나가 선택되어, 선택된 신호가 출력단자(56)로 보내진다. 여기서, 각 변환 스위치(43X, 53X, 54X)의 전환동작(switching operation), 스위치(61, 62)의 온/오프 동작 및 각 부의 처리동작은, 도시하지 않은 제어부에 의해, 입력 데이터의 내용, 내부 상태 등에 따라 제어된다. A monaural audio signal is supplied to the input terminal 41 of FIG. 1, and stereo processing information is supplied to the input terminal 42 of FIG. The monaural audio signal from the input terminal 41 is sent to a switch 43X and a delay section 46. The monaural audio signal from the switch 43X is sent to the band divider 44 and band-divided so that the band-divided monaural audio signal is sent to the stereo processor 45. The stereo processing unit 45 is supplied with stereo processing information from the input terminal 42, and performs stereo processing of the band-divided monaural audio signal into left channel Lch and right channel Rch stereo signals. Then, of the resulting Lch and Rch stereo signals, the Lch signal is sent to the band synthesizer 51 through the switch 61, and the Rch signal is passed through the switch 62 to the band synthesizer 52. Is sent). The Lch audio signal from the band synthesis section 51 is sent to the conversion switch 53X, and one of the Lch audio signal and the signal supplied through the delay section 46 is selected, and the selected signal is converted to the conversion switch 54X. And output terminal 55. The Rch audio signal from the band synthesizer 52 is sent to the conversion switch 54X, and one of the Rch audio signal and the signal supplied from the conversion switch 53X is selected, and the selected signal is sent to the output terminal 56. Is sent. Here, the switching operation of each of the conversion switches 43X, 53X, 54X, the on / off operation of the switches 61, 62, and the processing operation of each part are performed by the control unit (not shown), and the contents of the input data, It is controlled according to the internal state or the like.

상기한 도 7에 나타낸 바와 같은 입력신호(모노럴 오디오신호(M) 및 간헐적인 스테레오 처리정보(S))가 도 1에 나타낸 바와 같은 스테레오 처리장치에 공급되는 경우, 전송단위 #0에 포함되어 보내진 스테레오 처리정보(S)는 전송단위 #0에서 #4에 해당하는 기간 동안 스테레오 처리에 이용되고, 그 후, 전송단위 #5에 해당하는 타이밍에서 다음의 스테레오 처리정보(S)로 전환된다. 전송단위 #5에 해당하는 타이밍에서 보내진 이러한 스테레오 처리정보(S)는, 이미 언급한 바와 같이, 전송단위 #5에서 #9에 해당하는 기간 동안 이용된다. When the input signal (monaural audio signal M and the intermittent stereo processing information S) as shown in FIG. 7 is supplied to the stereo processing apparatus as shown in FIG. 1, it is included in the transmission unit # 0 and sent. The stereo processing information S is used for stereo processing for a period corresponding to the transmission unit # 0 to # 4, and is then switched to the next stereo processing information S at the timing corresponding to the transmission unit # 5. This stereo processing information S sent at the timing corresponding to transmission unit # 5 is used for a period corresponding to # 9 in transmission unit # 5 as already mentioned.

이와 같이 사용가능한(usable) 스테레오 처리정보가 사용가능한(available) 경우, 스위치(43X)는 선택단자(B)에 접속되고 스위치(61, 62)는 선택단자(C)에 접속되며, 변환 스위치(53X, 54X)는 선택단자(C)에 접속되기 위해 전환된다. 이 상태에서, 입력단자(41)로부터 입력된 모노럴 오디오신호는 대역분할부(44)에 의해 대역분할되고, 스테레오 처리정보에 근거하여 스테레오 처리부(45)에 의해 스테레오 신호가 생성된다. 그리고 나서, 생성된 스테레오 신호는 각 채널의 대역합성 처리부(51, 52)에 의해 대역합성되고, 결과로서의 Lch, Rch 스테레오 오디오신호가 출력단자(55, 56)로부터 각각 출력된다. When this usable stereo processing information is available, the switch 43X is connected to the selection terminal B, and the switches 61 and 62 are connected to the selection terminal C, and the conversion switch ( 53X and 54X are switched to be connected to the selection terminal C. FIG. In this state, the monaural audio signal input from the input terminal 41 is band-divided by the band dividing section 44, and a stereo signal is generated by the stereo processing section 45 based on the stereo processing information. The generated stereo signal is then band synthesized by the band synthesis processing sections 51 and 52 of each channel, and the resulting Lch and Rch stereo audio signals are output from the output terminals 55 and 56, respectively.

반면, 빨리 감기 재생 등과 같은 불연속적인 프레임 재생으로 인해 임의의 프레임(전송단위)으로부터 부호화 오디오 데이터가 공급되는 경우, 사용가능한 스테레오 처리정보가 없는 상태가 발생할 수 있다. 예를 들면, 도 7의 전송단위 #2에 해당하는 위치로부터 입력이 시작되면, 전송단위 #0에 포함되는 스테레오 처리정보(S)는 프레임 데시메이션 등으로 인해 공급되지 않고, 그 결과 전송단위 #2에서 #4에 해당하는 기간 동안 사용가능한 스테레오 처리정보가 없게 된다. 이와 같이 사용가능한 스테레오 처리정보가 없는 전송단위 #2~#4에 해당하는 기간 동안, 도 1의 스테레오 처리장치에 있어서, 예를 들면, 대역분할부(44) 등의 내부 상태변수가 초기화되고, 또한, 각 변환 스위치(53X, 54X)는 선택단자(A)에 접속된다. 따라서 입력단자(41)로부터 지연부(46)를 통하여 공급되는 모노럴 오디오신호는 변환 스위치(53X)를 통하여 Lch 출력단자(55)로부터 출력되며, 또한, 변환 스위치(54X)를 통하여 Rch 출력단자(56)로부터도 출력된다. 이러한 구성은 스테레오 처리정보의 유무로 인해 출력 오디오신호의 채널 수가 변화되는 것을 방지한다. 여기서, 지연부(46)는 대역분할부(44)에 의해 수행되는, 예를 들면, FIR 필터링 처리 등에 의해 발생되는 지연을 고려하여 설치된다. On the other hand, when encoded audio data is supplied from an arbitrary frame (transmission unit) due to discontinuous frame reproduction such as fast-forward reproduction or the like, a state in which no stereo processing information is available may occur. For example, when the input starts from the position corresponding to the transmission unit # 2 of FIG. 7, the stereo processing information S included in the transmission unit # 0 is not supplied due to frame decimation, and as a result, the transmission unit # There is no stereo processing information available for the period 2 to 4. In the stereo processing apparatus of FIG. 1, for example, the internal state variables such as the band dividing unit 44 are initialized during the period corresponding to the transmission units # 2 to # 4 where no stereo processing information is available. In addition, each conversion switch 53X, 54X is connected to the selection terminal A. As shown in FIG. Accordingly, the monaural audio signal supplied from the input terminal 41 through the delay unit 46 is output from the Lch output terminal 55 through the conversion switch 53X, and also through the conversion switch 54X. It is also output from 56). This configuration prevents the channel number of the output audio signal from changing due to the presence or absence of stereo processing information. Here, the delay unit 46 is provided in consideration of the delay caused by the band division unit 44, for example, generated by the FIR filtering process or the like.

그 후, 상기 도 7의 전송단위 #5에 해당하는 위치에서 데이터가 공급되고 사용가능한 스테레오 처리정보(S)도 공급되면, 먼저, 스위치(43X)가 선택단자(B)에 접속되어, 대역분할부(44)에 모노럴 오디오신호가 공급되도록 한다. 그러나, 이 대역분할부(44)의 상태변수가 완전히 갱신될 때까지, 스위치(61, 62), 변환 스위치(53X, 54X)는 그들의 선택단자(C)에 접속되지 않는다. 이 때문에, 사용가능한 스테레오 처리정보가 없고 내부 상태변수가 초기화된 상태로부터 처음으로 스테레오 처리정보가 공급되면, 스위치(43X)가 선택단자(B)에 접속되어, 대역분할부(44)의 상태변수를 갱신하면서 지연부(46)를 통하여 공급되는 모노럴 오디오신호가 각 변환 스위치(53X, 54X)의 선택단자(A)를 통하여 각 출력단자(55, 56)로부터 출력된다. 그 후, 대역분할부(44)의 상태변수가 완전히 갱신되면, 스위치(61, 62)가 선택단자(C)에 접속되고, 변환 스위치(53X, 54X)가 선택단자(C)에 접속되기 위해 전환되어, 상기한 바와 같이 스테레오 처리된 신호가 출력 오디오신호로서 출력단자(55, 56)로부터 각각 출력된다. 따라서 출력 오디오신호는 대역분할부(44)의 상태변수가 초기화된 상태의 영향으로부터 자유로우며, 따라서 불규칙한 음의 발생이 방지된 오디오신호가 얻어질 수 있다. Thereafter, when data is supplied at the position corresponding to the transmission unit # 5 in FIG. 7 and the usable stereo processing information S is also supplied, first, the switch 43X is connected to the selection terminal B, whereby the bandwidth is divided. The monaural audio signal is supplied to the installment 44. However, the switches 61 and 62 and the conversion switches 53X and 54X are not connected to their selection terminal C until the state variable of this band dividing section 44 is completely updated. For this reason, when stereo processing information is supplied for the first time since no stereo processing information is available and the internal state variable is initialized, the switch 43X is connected to the selection terminal B, whereby the state variable of the band splitting section 44 is provided. The monaural audio signal supplied through the delay section 46 is output from the respective output terminals 55 and 56 through the selection terminal A of each of the conversion switches 53X and 54X while updating the. After that, when the state variable of the band dividing section 44 is completely updated, the switches 61 and 62 are connected to the selection terminal C, and the conversion switches 53X and 54X are connected to the selection terminal C. The signals which have been switched and stereo processed as described above are output from the output terminals 55 and 56 as output audio signals, respectively. Therefore, the output audio signal is free from the influence of the state in which the state variable of the band dividing unit 44 is initialized, and thus an audio signal in which irregular sound generation is prevented can be obtained.

즉, 본 발명의 실시예에 있어서, 스테레오 처리정보가 모노럴 오디오신호의 부호화정보로 간헐적으로 다중화되어 전송되는 부호화 오디오 데이터가 복호화 처리되고 재생될 때, 스테레오 처리정보가 공급되지 않으면, 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 구성되고, 반면, 스테레오 처리정보가 공급되면, 필터 내의 상태변수의 갱신을 개시하고, 모든 상태변수가 갱신될 때까지 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 구성된다. 그 후, 필터 내의 모든 상태변수가 갱신되면, 모노럴 오디오신호에 대하여 스테레오 처리정보에 근거하여 스테레오 처리를 수행하여 스테레오 오디오신호를 생성하고 출력하도록 구성되어 있다. That is, in the embodiment of the present invention, when the encoded audio data transmitted by intermittently multiplexing the stereo processing information into the encoded information of the monaural audio signal is decoded and reproduced, the monaural audio signal is not supplied. And output stereo audio signal using stereo processing information, if the stereo processing information is supplied, to start updating the state variable in the filter and output the stereo audio signal using the monaural audio signal until all state variables are updated. It is composed. Thereafter, when all the state variables in the filter are updated, stereo processing is performed on the monaural audio signal based on the stereo processing information to generate and output a stereo audio signal.

다음으로, 상술한 HE AAC(High Efficiency Advanced Audio Coding, 국제표준규격 ISO/IEC 14496-3) 부호화 방식, 특히, HE AAC v2(버전 2) 부호화 방식으로 부호화된 부호화 오디오 데이터의 재생에 본 발명의 실시예를 적용한 재생장치의 구성예를 도 2를 참조하여 설명한다. 도 2에 있어서, 상기한 도 9의 각 구성요소와 대응하는 부분은 동일한 참조부호로 나타낸다. Next, the present invention reproduces the encoded audio data encoded by the above-described HE AAC (High Efficiency Advanced Audio Coding, ISO / IEC 14496-3) encoding scheme, in particular, HE AAC v2 (version 2) encoding scheme. A configuration example of a playback apparatus to which the embodiment is applied will be described with reference to FIG. In FIG. 2, parts corresponding to the above-described elements of FIG. 9 are denoted by the same reference numerals.

도 2의 입력단자(11)에는, 전송에 의해, 부호화 오디오 스트림(Coded Audio Stream)이 공급된다. 부호화 오디오 스트림은 AAC 코어의 부호화정보, HF 생성 부호화정보(SBR 처리를 위한 대역확장 부호화정보), PS 부호화정보(스테레오 처리를 위한 공간정보)를 포함한다. 일부의 부호화정보는 다중화되어 전송된다. 즉, 상기 도 8에 따라 설명한 바와 같이, 상기 SBR 처리를 위한 부호화정보(SD) (SBR 데이터)는 AAC 코어의 부호화정보(AC)로 항상 다중화되나, 반면, 이 SBR 데이터(SD)를 복호화하기 위해서 요구되는 SBR 헤더(SH)는 부호화정보(AC)로 간헐적으로 다중화된다. 상기 PS 처리를 위한 PS 데이터는, SBR 데이터(SD)의 확장영역에 포함되어 전송된다. SBR 헤더(SH)도 또한 PS 데이터를 얻기 위해 요구되므로, 이 SBR 헤더(SH)는 필요 스테레오 처리정보이다. The coded audio stream is supplied to the input terminal 11 of FIG. 2 by transmission. The encoded audio stream includes encoding information of the AAC core, HF generation encoding information (band extension encoding information for SBR processing), and PS encoding information (spatial information for stereo processing). Some encoded information is multiplexed and transmitted. That is, as described with reference to FIG. 8, the encoded information SD (SBR data) for the SBR processing is always multiplexed with the encoded information AC of the AAC core, while decoding the SBR data SD. The SBR header SH required for this purpose is intermittently multiplexed with the encoding information AC. PS data for the PS processing is included in the extended area of the SBR data SD and transmitted. Since the SBR header SH is also required to obtain PS data, this SBR header SH is necessary stereo processing information.

또, HF 생성 부호화정보(SBR 데이터) 및 PS 부호화정보(PS 데이터)가 포함되면, AAC 코어 복호부(AAC core decoder)(13)에 의해 복호되는 오디오신호는 최종 출력 오디오신호의 절반의 샘플링 레이트(half sampling rate)로 출력된다. 따라서 QMF 분석부(QMF analyzer)(21)와 QMF 합성부(QMF synthesizers)(33, 34)를 결합(combining)함으로써, 오디오신호가 업 샘플링된다. 예를 들면, AAC 코어 복호부(13)로부터의 출력신호의 샘플링 주파수가 24kHz인 경우, QMF 합성부(33, 34)로부터의 출력 오디오신호의 샘플링 주파수는 48kHz가 된다. When the HF generation encoding information (SBR data) and the PS encoding information (PS data) are included, the audio signal decoded by the AAC core decoder 13 has a sampling rate of half of the final output audio signal. Output at (half sampling rate). Therefore, by combining the QMF analyzer 21 and the QMF synthesizers 33 and 34, the audio signal is upsampled. For example, when the sampling frequency of the output signal from the AAC core decoder 13 is 24 kHz, the sampling frequency of the output audio signal from the QMF synthesizing units 33 and 34 is 48 kHz.

입력단자(11)로부터의 부호화 오디오 데이터는 비트스트림 페이로드 디포매터(bitstream payload deformatter), 즉, AAC 코어 복호부(13)로의 AAC 코어 부호화정보와 HF 생성 부호화정보/PS 부호화정보로 분리되는 페이로드 디포매터(12)로 보내진다. The encoded audio data from the input terminal 11 is a bitstream payload deformatter, i.e., a pay separated by AAC core encoding information to the AAC core decoder 13 and HF generation encoding information / PS encoding information. It is sent to the load deformatter 12.

HF 생성 부호화정보/PS 부호화정보는 SBR 처리부(20)에 보내지고, 그 후 비트스트림 파서(bitstream parser), 즉, SBR 처리부(20)의 파서(14)를 통하여 허프만 복호/역양자화부(Huffman decoder/dequantizer)(15)로 보내진다. 허프만 복호/역양자화부(15)에서 HF 신호생성정보, 엔벨로프(envelope) 조정정보, 스테레오 처리정보가 추출된다. 추출된 정보의 전위의 두 항목(former two items)은 HF 생성부(HF generator)(23) 및 엔벨로프 조정부(envelope adjuster)(24)로 각각 보내지는 반면, 후자의 한 항목(latter one item)은 Lch 복제처리 판단부(Lch replication process judgement section)(16)를 통하여 스테레오 처리부(stereo processor)(30)에 보내진다. SBR 처리부(20)의 파서(14)는 페이로드 디포매터(12)로부터 HF 생성 부호화정보 등과 같은 다중화된 정보를 얻고, 그 내용을 확인하며, SBR 처리의 초기화가 필요한지 아닌지를 판단하여, 초기화가 필요한 경우 에는, 초기화 제어신호를 단자(14t)로부터 출력하여 후술하는 바와 같이 각 부에 대하여 SBR 처리의 초기화가 수행되도록 한다. 또한, Lch 복제처리 판단부(16)는 SBR 처리 초기화 후에 처음으로 얻어진 다중화된 부호화정보를 판정하고, 판정출력을 단자(16t)로부터 출력하여, Rch QMF 합성부(34)가 후술하는 Lch QMF 합성부(33)의 상태변수(지연신호)를 복제하는 처리를 수행하도록 한다. The HF generation encoding information / PS encoding information is sent to the SBR processing unit 20, and then through the bitstream parser, that is, the parser 14 of the SBR processing unit 20, Huffman decoding / dequantization unit (Huffman). decoder / dequantizer). The HFman decoding / dequantization unit 15 extracts HF signal generation information, envelope adjustment information, and stereo processing information. The former two items of potentials of the extracted information are sent to the HF generator 23 and the envelope adjuster 24, respectively, while the latter one item is It is sent to the stereo processor 30 through the Lch replication process judgment section 16. The parser 14 of the SBR processing unit 20 obtains multiplexed information, such as HF generation encoding information, from the payload deformatter 12, checks the contents thereof, determines whether initialization of the SBR processing is necessary, and initiates initialization. If necessary, the initialization control signal is output from the terminal 14t so that the initialization of the SBR process is performed for each unit as described later. In addition, the Lch duplication processing judging unit 16 determines the multiplexed encoded information obtained after the SBR process initialization for the first time, outputs a determination output from the terminal 16t, and the Lch QMF synthesizing unit 34 described later in Lch QMF synthesis. The process of copying the state variable (delay signal) of the unit 33 is performed.

AAC 코어 복호부(13)는 공급된 AAC 코어 부호화정보를 복호화하고, AAC 코어의 모노럴 오디오신호를 생성한다. 복호부(13)는 생성된 모노럴 오디오신호를 SBR 처리부(20)의 QMF 분석부(21)로 보낸다. QMF 분석부(21)는 모노럴 오디오신호를 64 대역으로 대역분할하고, 그 결과 대역분할된 신호를 변환 스위치(22X)로 보낸다. HF 생성 부호화정보(SBR 데이터)가 공급되면, 변환 스위치(22X)가 선택단자(B, C)에 접속되기 위해 전환되어, QMF 분석부(21)로부터의 신호가 HF 생성부(HF generator)(23)에 보내지도록 한다. HF 생성부(23)는 HF 신호를 생성하고, 엔벨로프 조정부(24)는 엔벨로프 조정을 행한다. 엔벨로프 조정부(24)는 결과로서의 신호를 하이브리드 분석부(hybrid analyzer)(27) 및 변환 스위치(35X)로 보낸다. The AAC core decoder 13 decodes the supplied AAC core encoding information and generates a monaural audio signal of the AAC core. The decoder 13 sends the generated monaural audio signal to the QMF analyzer 21 of the SBR processor 20. The QMF analyzer 21 divides the monaural audio signal into 64 bands and, as a result, sends the band-divided signal to the conversion switch 22X. When the HF generation encoding information (SBR data) is supplied, the conversion switch 22X is switched to be connected to the selection terminals B and C, so that the signal from the QMF analyzer 21 is converted to the HF generator (HF generator). 23). The HF generator 23 generates an HF signal, and the envelope adjuster 24 performs envelope adjustment. The envelope adjusting unit 24 sends the resulting signal to the hybrid analyzer 27 and the conversion switch 35X.

상기 PS 부호화정보(PS 데이터)로부터 스테레오 처리정보가 얻어지면, 변환 스위치(22X)는 선택단자(C)에 접속되기 위해 전환된다. 하이브리드 분석부(27)는 공급된 대역분할된 신호의 LF 신호를 더욱 대역분할하고, 그 결과로서의 신호를 이전의 대역분할된 신호의 HF 신호와 함께 신호해석부(signal de-correlator)(29) 및 스테레오 처리부(stereo processor)(30)에 공급한다. 신호 해석부(29)는 공 급된 신호를 해석하고, 그것에 음향조정(acoustic adjustment)을 행하며, 그 결과로서의 신호를 스테레오 처리부(30)에 공급한다. 스테레오 처리부(30)는 공급된 대역 분할된 신호와 스테레오 처리정보로부터, Lch, Rch 스테레오신호를 생성한다. 생성된 각 채널의 스테레오신호는 스위치(17, 18)을 통하여 각 채널의 하이브리드 합성부(hybrid snthesizers)(31, 32)로 각각 보내진다. 하이브리드 합성부(31, 32)는 상기한 하이브리드 분석부(27)에 의해 얻어진 분할된 대역을 대역 합성한다. 하이브리드 합성부(31)로부터의 결과 신호(resultant signal)는 변환 스위치(35X)를 통하여 QMF 합성부(33) 및 변환 스위치(19)로 보내지고, 반면, 하이브리드 합성부(32)로부터의 결과 신호는 변환 스위치(19)를 통하여 QMF 합성부(34)로 보내진다. 각 채널의 QMF 합성부(33, 34)는 상기 QMF 분석부(21)에 의해 얻어진 대역 분할된 대역을 대역합성하여, Lch, Rch 스테레오 출력 오디오신호를 각각 생성한다. QMF 합성부(33)로부터의 Lch 오디오신호는 변환 스위치(36X) 및 출력단자(37)로 보내진다. QMF 합성부(34)로부터의 Rch 오디오신호는 변환 스위치(36X)로 보내지고, 이 Rch 오디오신호와 QMF 합성부(33)로부터의 신호 중 하나가 선택되어, 선택된 신호가 출력단자(38)로 보내진다. When stereo processing information is obtained from the PS encoded information (PS data), the conversion switch 22X is switched to be connected to the selection terminal C. The hybrid analyzer 27 further divides the LF signal of the supplied band-divided signal, and the signal de-correlator 29 together with the resulting signal along with the HF signal of the previous band-divided signal. And a stereo processor 30. The signal analyzing unit 29 analyzes the supplied signal, makes acoustic adjustment thereto, and supplies the resulting signal to the stereo processing unit 30. The stereo processor 30 generates Lch and Rch stereo signals from the supplied band-divided signal and stereo processing information. The generated stereo signal of each channel is sent to the hybrid snthesizers 31 and 32 of each channel through the switches 17 and 18, respectively. The hybrid synthesis units 31 and 32 band synthesize the bands obtained by the hybrid analyzer 27 described above. The resultant signal from the hybrid synthesis section 31 is sent to the QMF synthesis section 33 and the conversion switch 19 through the conversion switch 35X, while the result signal from the hybrid synthesis section 32 is used. Is sent to the QMF synthesizing section 34 via the conversion switch 19. The QMF synthesizing units 33 and 34 of each channel band synthesize the band-divided bands obtained by the QMF analyzing unit 21 to generate Lch and Rch stereo output audio signals, respectively. The Lch audio signal from the QMF synthesizing section 33 is sent to a conversion switch 36X and an output terminal 37. The Rch audio signal from the QMF synthesizing section 34 is sent to the conversion switch 36X, and one of the Rch audio signal and the signal from the QMF synthesizing section 33 is selected, and the selected signal is sent to the output terminal 38. Is sent.

여기서, 도 2의 재생장치의 스위칭을 포함하는 각 부의 동작은 도시하지 않는 제어수단에 의해, 입력 부호화정보의 내용, 각 부의 상태 등에 따라 제어된다. Here, the operation of each unit including the switching of the playback device in Fig. 2 is controlled by control means (not shown) according to the contents of the input encoding information, the state of each unit, and the like.

상기한 도 9에 나타낸 재생장치의 구성과 비교하여, 이 도 2에 나타낸 재생장치는 다음의 점에서 다르다. QMF 분석부(21)의 후단의(downstream) 스위칭 구성 및 엔벨로프 조정부(24)의 후단의 스위칭 구성이 수정되어 있다. 스위치(17, 18) 및 변환 스위치(19)가 추가되었다. QMF 합성부(33, 34) 중 하나의 상태변수가 다른 하나로 복제된다. Compared with the configuration of the playback apparatus shown in FIG. 9 described above, the playback apparatus shown in FIG. 2 differs in the following points. The switching configuration downstream of the QMF analyzer 21 and the switching configuration downstream of the envelope adjustment unit 24 are modified. Switches 17 and 18 and conversion switch 19 were added. The state variable of one of the QMF synthesizing units 33 and 34 is duplicated to the other.

도 2의 재생장치에 있어서, 상기한 바와 같이 임의의 프레임(전송단위)으로부터 부호화 오디오 데이터가 공급되는 경우에 대하여 설명한다. 예를 들면, 상기한 도 8의 전송단위 #2에 해당하는 위치에서 입력이 시작하면, 전송단위 #0에 포함되는 필요 스테레오 처리정보인 SBR 헤더(SH)가 공급되지 않는다. 따라서 장치는 전송단위 #2에서 #4까지를 수신하는 동안 SBR 데이터(SD)를 복호화할 수 없으므로, 사용 가능한 스테레오 처리정보(PS 데이터)를 얻을 수 없다. 따라서, 장치는 SBR 처리부(20)의 QMF 분석부(21), 하이브리드 분석부(27), QMF 합성부(33, 34) 등의 내부 상태변수(지연신호)를 초기화한다. 다음으로, 상기한 도 8의 전송단위 #5에 해당하는 위치에서 데이터가 공급되고, 필요 스테레오 처리정보인 SBR 헤더(SH)가 따라서 공급되면, 장치는 SBR 데이터(SD)를 복호화할 수 있으므로 사용가능한 스테레오 처리정보(PS 데이터)를 얻는다. 그 결과, 장치는 SBR 처리부(20)의 QMF 분석부(21), 하이브리드 분석부(27), QMF 합성부(33, 34) 등의 내부 상태변수(지연신호)를 갱신한다. 이들 상태변수(지연신호)는 각각 필터 내의 지연소자에 유지되는 데이터(신호)를 의미한다. 필터링 처리에 있어서, 필터링 길이에 따라 신호의 입력에서 출력까지의 기간 동안 지연이 발생하며, 상태변수는 이러한 지연신호를 의미한다. In the playback device of FIG. 2, a case where encoded audio data is supplied from an arbitrary frame (transmission unit) as described above will be described. For example, when the input starts at the position corresponding to the transmission unit # 2 of FIG. 8, the SBR header SH, which is necessary stereo processing information included in the transmission unit # 0, is not supplied. Therefore, the device cannot decode the SBR data SD while receiving the transmission units # 2 through # 4, and thus cannot obtain usable stereo processing information (PS data). Therefore, the apparatus initializes internal state variables (delay signals) such as the QMF analyzer 21, the hybrid analyzer 27, and the QMF synthesizers 33 and 34 of the SBR processor 20. Next, when data is supplied at the position corresponding to the transmission unit # 5 of FIG. 8 and the SBR header SH which is necessary stereo processing information is supplied accordingly, the device can decode the SBR data SD. Obtain possible stereo processing information (PS data). As a result, the device updates the internal state variables (delay signals) of the QMF analyzing unit 21, the hybrid analyzing unit 27, the QMF synthesizing units 33 and 34 of the SBR processing unit 20, and the like. These state variables (delay signals) mean data (signals) held by delay elements in the filter, respectively. In the filtering process, a delay occurs during the period from the input to the output of the signal according to the filtering length, and the state variable means such a delay signal.

여기서, 사용가능한 스테레오 처리정보(PS 데이터)가 얻어질 수 없어 내부 상태변수가 초기화된 상태에 있어서, 변환 스위치(22X, 35X, 36X)는 선택단자(A) 측으로 접속되기 위해 전환된다. 이 상태에서, QMF 분석부(21)는 AAC 코어 복호부(13)로부터의 모노럴 오디오신호를 대역 분할하고, Lch의 QMF 합성부(33)는 대역분할된 신호를 대역합성하여 좌우채널 모두 동일한 오디오신호를 출력한다. Here, in the state where the usable stereo processing information (PS data) cannot be obtained and the internal state variable is initialized, the conversion switches 22X, 35X, 36X are switched to be connected to the selection terminal A side. In this state, the QMF analyzer 21 band-segments the monaural audio signal from the AAC core decoder 13, and the LMF QMF synthesizer 33 band-synthesizes the band-divided signal so that the left and right channels are the same audio. Output the signal.

그 후, 다중화된 부호화정보가 전송되면, 변환 스위치(22X, 35X, 19, 36X)는 선택단자(B, C)에 접속되기 위해 전환된다. 이 경우, 선택단자(B)는 부호화정보가 대역확장 부호화정보만을 포함할 때 선택되고, 반면, 선택단자(C)는 부호화정보가 대역확장 부호화정보(HF 생성정보) 및 스테레오 처리정보를 포함할 때 선택된다. Then, when the multiplexed encoded information is transmitted, the conversion switches 22X, 35X, 19, 36X are switched to be connected to the selection terminals B, C. In this case, the selection terminal B is selected when the encoding information includes only the extended encoding information. On the other hand, the selection terminal C includes the extension information (HF generation information) and the stereo processing information. When it is selected.

이하, 필요 스테레오 처리정보인 SBR 헤더(SH)가 전송되고, 그것에 의해 재생장치가 SBR 데이터(SD)를 복호화하여, 스테레오 처리정보(PS 데이터)를 얻는 경우에 대하여 설명한다. SBR 처리를 위한 부호화정보(SBR 데이터) 및 스테레오 처리정보(PS 데이터)가 얻어지면, 장치는 처음으로 Rch의 QMF 합성부(34)에 신호를 보낼 준비가 된다. 그 때문에, 상태변수(지연신호)를 고려하지 않고 출력 오디오신호를 생성하면, 장치는 상태변수 초기화 신호를 Rch 오디오신호에 출력하여, 그것에 의해 불규칙한 음을 발생한다. 이러한 관점에서, 본 발명의 실시예에 있어서는, Lch 복제처리 판단부(16)로부터의 판정출력이 이 타이밍에서 Lch의 QMF 합성부(33)의 상태변수(지연신호)를 상태변수 복제처리에서 Rch의 QMF 합성부(34)로 복제하기 위해 사용된다. 이러한 동작을 통해, 스테레오 처리정보가 전송될 때까지 변환스위치들이 선택단자(A)에 접속된 상태로 재생장치가 부호화 오디오신호를 재생하고 있었음에도 관계없이, Lch의 QMF 합성부(33) 상태변수와 동일한 상태 변수가 Rch의 QMF 합성부(34)에 설정된다. 상기한 복제처리가 실행되면, 각 변환 스위치(22X, 35X, 19, 36X)는 선택단자(F)에 접속되기 위해 전환된다. The following describes a case in which the SBR header SH which is necessary stereo processing information is transmitted, whereby the playback apparatus decodes the SBR data SD to obtain stereo processing information (PS data). When encoding information (SBR data) and stereo processing information (PS data) for SBR processing are obtained, the apparatus is ready to send a signal to the QMF synthesis section 34 of Rch for the first time. Therefore, if an output audio signal is generated without considering the state variable (delay signal), the device outputs the state variable initialization signal to the Rch audio signal, thereby generating an irregular sound. In view of this, in the embodiment of the present invention, the determination output from the Lch duplication processing judging unit 16 outputs the state variable (delay signal) of the QMF synthesizing unit 33 of the Lch at this timing in the state variable duplication process. It is used to replicate to the QMF synthesis section 34 of. Through this operation, the state variable of the QMF synthesizing unit 33 of Lch, regardless of whether the playback device is playing the encoded audio signal with the conversion switches connected to the selection terminal A until the stereo processing information is transmitted. The same state variable as is set in the QMF combining section 34 of Rch. When the above duplication process is executed, each conversion switch 22X, 35X, 19, 36X is switched to be connected to the selection terminal F. As shown in FIG.

일반적으로, 대역합성처리 동안 관련성이 없는(irrelevant), 임의의(arbitrary) 신호가 지연신호로서 이용되면, 대역합성처리 동안 의도하지 않은(unexpected) 증폭(amplification)/감쇠(damping)가 발생하여, 그것에 의해 불규칙한 음이 발생한다. 본 발명에 따른 방법에 있어서는, 초기화 후 처음으로 다중화된 부호화정보가 얻어지는 프레임이 모노럴 출력에서 스테레오 출력으로 바뀌는 전환점(switching point)을 나타내므로, Lch의 QMF 합성부(33)의 상태변수(지연신호)가 Rch의 QMF 합성부(34) 상태변수(지연신호)로 이용되는 경우라도, 불규칙한 음이 발생하지 않도록 한다. In general, if an irrelevant, arbitrary signal is used as the delay signal during the band synthesis process, unexpected amplification / damping occurs during the band synthesis process, Thereby an irregular sound is produced. In the method according to the present invention, since the frame from which the multiplexed encoded information is obtained for the first time after initialization indicates a switching point from the monaural output to the stereo output, the state variable (delayed signal) of the QMF synthesizer 33 of Lch is delayed. Is used as a state variable (delay signal) of the QMF synthesis section 34 of Rch, so that irregular sounds are not generated.

또한, 스테레오 처리(PS 처리)에 있어서, 공간부호화 정보(spatial coded information)를 적용하기 위해, 재생장치는 하이브리드 분석부(27)에 의한 대역분할, 신호 해석부(29)로부터의 해석결과 및 전송된 공간정보에 근거한 스테레오신호 생성처리 및 하이브리드 합성을 수행한다. 하이브리드 분석부(27)는 지연을 요구하고 또한 다중화된 부호화정보가 복호화된 후 처음으로 그 처리를 수행하므로, 디코더 내의 변수의 초기화 후에 처음으로 다중화된 부호화정보가 얻어졌을 때 그 상태변수(지연신호)가 초기화되고, 이는 신호 해석부(29)에 의한 신호해석에 영향을 주어, 그것에 의해 불규칙한 음이 발생한다. 즉, QMF 분석부(21)에 의해 대역분할된 신호가 하이브리드 분석부(27)에 공급되고, 하이브리드 분석부(27)의 상태변수(지연신호)가 초기화되므로, 이후의 처리는 올바르게 수행되지 않는다. In addition, in stereo processing (PS processing), in order to apply spatial coded information, the reproduction apparatus is band-split by the hybrid analyzer 27, analysis results from the signal analyzer 29, and transmitted. Stereo signal generation and hybrid synthesis are performed based on the spatial information. Since the hybrid analyzer 27 requests a delay and performs the processing for the first time after the multiplexed encoded information is decoded, the state variable (delayed signal) is obtained when the multiplexed encoded information is obtained for the first time after initialization of the variable in the decoder. ) Is initialized, which affects the signal analysis by the signal analyzing section 29, whereby an irregular sound is generated. That is, the signal band-divided by the QMF analyzer 21 is supplied to the hybrid analyzer 27, and the state variable (delay signal) of the hybrid analyzer 27 is initialized, so that subsequent processing is not performed correctly. .

이러한 관점에서, 본 실시예에서는, 이러한 영향을 제거하기 위해, 하이브리드 분석부(27)가 그 처리를 초기화 후 처음으로 수행할 때, 재생장치는 지연신호를 갱신하기 위해 하이브리드 분석부(27) 및 스테레오 처리부(30)에 대한 Lch, Rch 스테레오신호 생성계수(stereo signal generation coefficient)를 갱신하는 처리를 수행한다. 출력에 대하여는, 스위치(35X, 19)가 각각 선택단자(F)로 전환되어, 신호는 하이브리드 분석부(27)가 각 채널의 QMF 합성부(33, 34)에 출력되기 전으로 분기된다. In view of this, in the present embodiment, in order to eliminate this effect, when the hybrid analyzer 27 performs the processing for the first time after initialization, the playback apparatus performs the hybrid analyzer 27 and to update the delay signal. The Lch and Rch stereo signal generation coefficients of the stereo processing unit 30 are updated. With respect to the output, the switches 35X and 19 are switched to the selection terminals F, respectively, and the signal is branched before the hybrid analyzer 27 is output to the QMF synthesizers 33 and 34 of each channel.

구체적으로는, 스테레오신호는 하이브리드 분석부(27)의 상태변수(지연신호)가 완전히 갱신될 때까지 스위치(17, 18)에 의해 단절(disconnect)(스위치(17, 18)가 모두 오프)된다. 대신에, 각 변환 스위치(22X, 35X)의 선택단자(F)를 통하여 전송되는 신호는 Lch의 QMF 합성부(33) 및 변환 스위치(19)의 선택단자(F)를 통하여 Rch의 QMF 합성부(34)에 보내진다. Lch의 QMF 합성부(33)로부터의 결과신호가 출력단자(37)로부터 출력되고, 반면, Lch의 QMF 합성부(33)와 동일한 상태변수를 가지는 Rch의 QMF 합성부(34)로부터의 결과신호가 변환 스위치(36X)의 선택단자(F)를 통하여 출력단자(38)로부터 출력된다. Specifically, the stereo signal is disconnected (switches 17 and 18 are all turned off) by the switches 17 and 18 until the state variable (delay signal) of the hybrid analyzer 27 is completely updated. . Instead, the signal transmitted through the selection terminal F of each of the conversion switches 22X and 35X is transmitted through the QMF synthesis section 33 of the Lch and the QMF synthesis section of the Rch through the selection terminal F of the conversion switch 19. Is sent to 34. The result signal from the QMF synthesizing section 33 of Lch is output from the output terminal 37, while the result signal from the QMF synthesizing section 34 of Rch having the same state variable as the QMF synthesizing section 33 of Lch. Is output from the output terminal 38 via the selection terminal F of the conversion switch 36X.

하이브리드 분석부(27)의 상태변수(지연신호)는, 상기 비특허문헌 1의 8.6.4절(section)에 명시되어 있는 바와 같이, 6 QMF 샘플에 의한 지연을 가진다. 스테레오 처리부(30)의 Lch, Rch 스테레오신호 생성계수의 갱신처리는, 상기 비특허 문헌 1의 8.6.4.4절에 기재되어 있는 바와 같이, 계수가 차분정보(difference information)로서 전송되므로, 수행될 필요가 있다. The state variable (delay signal) of the hybrid analyzer 27 has a delay by 6 QMF samples, as specified in Section 8.6.4 of Non-Patent Document 1 above. The update processing of the Lch and Rch stereo signal generation coefficients of the stereo processing unit 30 needs to be performed since the coefficients are transmitted as difference information as described in Section 8.6.4.4 of Non-Patent Document 1 above. There is.

하이브리드 분석부(27)의 상태변수(지연신호)가 완전히 갱신되면, 스위치(17, 18)가 모두 온 되어(선택단자(E)에 접속되어), 스테레오 처리부(30)로부터의 Lch, Rch 스테레오신호가 하이브리드 합성부(31, 32)에 각각 보내진다. 변환 스위치(35X, 19, 36X)는 선택단자(E) 측으로 접속되기 위해 각각 전환되어, 하이브리드 합성부(31)로부터의 신호가 QMF 합성부(33)에서 처리되고, 결과신호가 Lch 스테레오 오디오신호로서 출력단자(37)로부터 출력되고, 반면, 하이브리드 합성부(32)로부터의 신호는 QMF 합성부(34)에서 처리되어, 결과신호가 Rch 스테레오 오디오신호로서 출력단자(38)로부터 출력된다. 여기서 재생장치는 하이브리드 분석부(27)의 상태변수를 갱신하는 동안에도 Rch의 QMF 합성부(34)의 상태변수를 갱신함로써 스위치(17, 18) 및 변환 스위치(35X, 19, 36X)를 선택단자(E)에 접속시킬 수 있고, 그것에 의해 재생장치는 단일 프레임(single frame)의 처리 내에서 불규칙한 음을 발생시키지 않고 이들 스위치를 전환할 수 있다. When the state variable (delay signal) of the hybrid analyzer 27 is completely updated, the switches 17 and 18 are both turned on (connected to the selection terminal E), and the Lch and Rch stereo from the stereo processor 30 are The signals are sent to the hybrid combining sections 31 and 32, respectively. The conversion switches 35X, 19, 36X are respectively switched to be connected to the selection terminal E side, so that the signal from the hybrid synthesis section 31 is processed in the QMF synthesis section 33, and the resulting signal is an Lch stereo audio signal. The signal from the hybrid synthesizing section 32 is processed by the QMF synthesizing section 34, and the resultant signal is output from the output terminal 38 as an Rch stereo audio signal. Here, the reproducing apparatus updates the state variables of the QMF synthesizing unit 34 of the Rch while the state variables of the hybrid analyzer 27 are updated, thereby switching the switches 17 and 18 and the conversion switches 35X, 19 and 36X. It is possible to connect to the selection terminal E, whereby the playback apparatus can switch these switches without generating irregular sounds in the processing of a single frame.

도 3~도 5는, 예를 들면, 상기 도 2의 구성에 있어서 상기한 바와 같은 디코딩 동작을 설명하기 위한 플로차트이다. 3 to 5 are flowcharts for explaining the decoding operation as described above in the configuration of FIG. 2, for example.

도 3에 있어서, 상기 입력단자(11)에 공급되는 부호화 오디오 스트림과 같은 부호화정보에 대하여, 단계(S101)에서 다중화된 부호화정보로서, 상기한 바와 같은 HF 생성 부호화정보(SBR 데이터) 및 공간 부호화정보(PS 데이터)를 추출하기 위해, 상기 HE AAC v2 방식에 의해 부호화된 데이터의 복호화(decoding) 처리(디포매팅(deformatting) 처리)가 수행된다. 또한, 상기 AAC 코어 정보에 대하여는, 단계(S102)에서 AAC 신호처리가 수행된다. 다음의 단계(S103)에서는, 상기한 SBR 처리가 수행되는지 아닌지가 판단된다. YES면, 처리는 단계(S104)로 진행되고, 반면, NO이면, 처리는 단계(S114)로 진행된다. 이러한 처리는, 예를 들면, 도 2의 페이로드 디포매터(12) 및 AAC 코어 복호부(13)에 의해 수행되는 처리에 대응하는 것이다. In Fig. 3, the encoded information such as the encoded audio stream supplied to the input terminal 11 is HF generated encoded information (SBR data) and spatial encoding as described above as the encoded information multiplexed in step S101. In order to extract information (PS data), decoding processing (deformatting processing) of data encoded by the HE AAC v2 scheme is performed. Also, for the AAC core information, AAC signal processing is performed in step S102. In the next step S103, it is determined whether or not the above-described SBR processing is performed. If YES, processing proceeds to step S104, while if NO, the processing proceeds to step S114. This processing corresponds to, for example, the processing performed by the payload deformatter 12 and the AAC core decoder 13 of FIG.

단계(S104)에서, 예를 들면, 상기 QMF 분석부(21)에 의해, QMF 대역분할처리가 수행된다. 다음의 단계(S105)에서, 다중화된 부호화정보가 이미 복호화되었는지 아닌지가 판단된다. YES면, 처리는 단계(S106)으로 진행되고, NO이면, 처리는 단계(S113)으로 진행된다. 단계(S106)에서, 예를 들면, 상기 HF 생성부(23)에 의해, 다중화된 HF 신호 생성 부호화정보(이미 복호화된 정보)를 이용하여 HF 신호생성처리가 수행된다. 다음의 단계(S107)에서, PS 처리가 수행되는지 아닌지가 판단된다. In step S104, for example, the QMF analyzer 21 performs QMF band division processing. In the next step S105, it is determined whether or not the multiplexed encoded information has already been decoded. If YES, the process proceeds to step S106, and if NO, the process proceeds to step S113. In step S106, for example, the HF signal generation process is performed by the HF generation section 23 using the multiplexed HF signal generation encoding information (already decoded information). In the next step S107, it is determined whether or not the PS processing is performed.

단계(S107)에서 YES(PS 처리가 수행된다)라고 판단되면, 단계(S120)에서 PS 처리가 수행된 후 처리는 단계(S111)로 진행되며, 반면, 단계(S107)에서 NO(PS 처리가 수행되지 않는다)라고 판단되면, 처리는 직접 단계(S111)로 진행된다. 이하, 단계(S120)에 있어서의 PS 처리의 구체적인 예에 대하여 도 4 또는 도 5를 참조하여 설명한다. If it is determined in step S107 that YES (PS processing is performed), the processing proceeds to step S111 after the PS processing is performed in step S120, while NO (PS processing is performed in step S107). Is not performed), the process proceeds directly to step S111. Hereinafter, the specific example of PS process in step S120 is demonstrated with reference to FIG. 4 or FIG.

단계(S111)에서, Lch의 QMF 대역합성처리가 수행되고, 단계(S112)에서, Rch의 QMF 대역합성처리가 수행된다. 그 후, 결과로서의 오디오신호가 출력된다. 또한, 상기 단계(S113)에서는, Lch의 QMF 대역합성처리가 수행되고, 단계(S114)에서, 필요에 따라, 스테레오 신호를 생성하기 위해, 모노럴 신호가 복제된다. 그 후, 결과로서의 오디오신호가 출력된다. 이러한 처리는, 예를 들면, 상기 도 2의 변환 스위치(35X, 36X)를 통하여 QMF 합성부(33, 34)에 의해 수행되는 처리 등에 대응하는 것이다. In step S111, QMF band synthesis processing of Lch is performed, and in step S112, QMF band synthesis processing of Rch is performed. Thereafter, the resulting audio signal is output. Further, in step S113, QMF band synthesis processing of Lch is performed, and in step S114, a monaural signal is duplicated to generate a stereo signal as necessary. Thereafter, the resulting audio signal is output. Such processing corresponds to, for example, processing performed by the QMF synthesizing units 33 and 34 via the conversion switches 35X and 36X in FIG.

도 4는, 본 발명의 실시예에서 상기한 단계(S120)에서의 PS 처리의 구체적인 예를 나타낸다. 상기한 도 3의 단계(S107)에서 YES(PS 처리가 수행된다)라고 판단되면, 처리는 단계(S108)로 진행되어, 하이브리드 분석처리가 수행되고, 단계(S109)에서, 공간정보에 근거한 스테레오신호 생성처리가 수행된다. 그 후, 단계(S110)에서 하이브리드 합성처리가 수행된 후, 단계(S115)로 진행하도록 제어한다. 단계(S115)에서, Rch의 QMF 대역합성처리에 대한 상태변수(지연신호), 예를 들면, 도 2의 QMF 합성부(34)의 상태변수가 이미 갱신되었는지 아닌지가 판단된다. YES면, 처리는 상기한 도 3의 단계(S111)로 진행되고, NO이면, 처리는 단계(S116)로 진행된다. 단계(S116)에서, Lch의 QMF 대역합성처리에 대한 상태변수가 Rch의 QMF 대역합성처리에 대한 상태변수로 복제되고, 그 후, 상기한 도 3의 단계(S111)로 진행하도록 제어한다. 이러한 처리는, 예를 들면, 도 2의 하이브리드 분석부(27)에 의해 수행되는 처리로부터 QMF 합성부(33, 34)에 의해 수행되는 처리까지의 처리에 대응하는 것이다. 4 shows a specific example of the PS processing in step S120 described above in the embodiment of the present invention. If it is determined in step S107 of FIG. 3 described above that YES (PS processing is performed), the process proceeds to step S108, where a hybrid analysis process is performed, and in step S109, stereo based on spatial information Signal generation processing is performed. Thereafter, after the hybrid synthesis process is performed in step S110, the control proceeds to step S115. In step S115, it is determined whether or not the state variable (delay signal) for the QMF band synthesis process of Rch, for example, the state variable of the QMF synthesizing section 34 in Fig. 2 has already been updated. If YES, the processing proceeds to step S111 of FIG. 3 described above, and if NO, the processing proceeds to step S116. In step S116, the state variable for the QMF band synthesis process of Lch is copied to the state variable for the QMF band synthesis process of Rch, and then control proceeds to step S111 of FIG. Such a process corresponds to, for example, a process from the process performed by the hybrid analyzer 27 of FIG. 2 to the process performed by the QMF synthesis units 33 and 34.

이러한 도 3, 도 4에 나타낸 구체적인 예에 있어서, 부호화정보의 일부가 다중화되어 전송되는 부호화 오디오 데이터의 임의의 프레임으로부터의 재생을 수행하는 경우, 재생장치의 내부상태를 초기화하도록 구성하여, 다중화되어 전송되는 부호화정보가 없는 상태라도, 모노럴 오디오신호를 적어도 2 이상의 서브밴드로 분 할하고, 그 결과신호를 지연이 발생하는 대역합성 필터링 처리에 의해 업 샘플링하여, 모노럴 오디오신호를 출력하도록 한다. 그 후, 다중화된 부호화정보가 공급되고 최초로 모노럴 신호로부터 스테레오 신호를 생성하는 처리가 수행되면, 모노럴 신호에 대한 필터링 상태변수(지연신호)를 스테레오 신호에 대한 필터링 상태변수로서 처리함으로써(단계(S114, S115, S116)), 필터링 처리에 의해 발생하는 지연으로 인한 불규칙한 음의 발생을 방지하도록 구성되어 있다. In the specific example shown in Figs. 3 and 4, when a part of encoded information is reproduced from any frame of encoded audio data transmitted by multiplexing, the internal state of the playback apparatus is configured to be initialized and multiplexed. Even in the absence of the encoded information to be transmitted, the monaural audio signal is divided into at least two or more subbands, and the resultant signal is upsampled by a band synthesis filtering process in which delay occurs to output the monaural audio signal. Then, when the multiplexed encoding information is supplied and the process of first generating the stereo signal from the monaural signal is performed, the filtering state variable (delay signal) for the monaural signal is processed as the filtering state variable for the stereo signal (step S114). , S115, S116)), which is configured to prevent the occurrence of irregular sound due to the delay caused by the filtering process.

다음으로, 도 5는, 본 발명의 실시예에서, 상기한 도 3의 단계(S120)에서의 PS 처리의 다른 구체적인 예를 나타내고 있다. 즉, 상기한 도 3의 단계(S107)에서 YES(PS 처리가 수행된다)라고 판단되면, 처리는 도 5의 단계(S108)로 진행되어, 하이브리드 분석처리(예를 들면, 도 2의 하이브리드 분석부(27)에 의한 처리)가 수행된다. 그 후, 처리는 단계(S119)로 진행되어, 상기 하이브리드 분석처리에 대한 모든 상태변수(지연신호)가 이미 갱신되었는지 아닌지가 판단된다. YES면, 처리는 단계(S109)로 진행하고, NO이면, 처리는 단계(S117)로 진행한다. 단계(S109)에서, 공간정보에 근거한 스테레오신호 생성처리가 수행되고, 단계(S110)에서, 하이브리드 합성처리가 수행된다. 그 후, 처리는 단계(S115)로 진행한다. 단계(S117)에서, 상기 하이브리드 분석처리에 대한 상태변수가 아직 모두 갱신되지 않았으므로, 스테레오 신호를 생성하기 위해 모노럴 신호가 복제되고, 생성된 스테레오신호를 하이브리드 합성처리의 출력으로서 사용한다. 그 후, 단계(S118)로 진행하도록 제어하여, 필요한 상태변수가 갱신되고, 그 후 처리는 단계(S115)로 진행한다. Next, FIG. 5 shows another specific example of the PS processing in step S120 of FIG. 3 described above in the embodiment of the present invention. That is, if it is determined in step S107 of FIG. 3 described above that YES (PS processing is performed), the process proceeds to step S108 of FIG. 5, and the hybrid analysis process (for example, the hybrid analysis of FIG. 2). Processing by the unit 27). The process then proceeds to step S119, where it is determined whether or not all the state variables (delay signals) for the hybrid analysis process have already been updated. If YES, the process proceeds to step S109 and if NO, the process proceeds to step S117. In step S109, a stereo signal generation process based on spatial information is performed, and in step S110, a hybrid synthesis process is performed. The process then proceeds to step S115. In step S117, since all of the state variables for the hybrid analysis process have not yet been updated, the monaural signal is duplicated to generate a stereo signal, and the generated stereo signal is used as the output of the hybrid synthesis process. Thereafter, the control proceeds to step S118, where necessary state variables are updated, and then processing proceeds to step S115.

단계(S115)에서, Rch의 QMF 대역합성처리에 대한 상태변수(예를 들면, 도 2의 QMF 합성부(34)의 상태변수)가 갱신되었는지 아닌지가 판단된다. YES면, 처리는 상기한 도 3의 단계(S111)로 진행하고, NO이면, 처리는 단계(S116)로 진행한다. 단계(S116)에서, Lch의 QMF 대역합성처리에 대한 상태변수가 Rch의 QMF 대역합성처리에 대한 상태변수로 복제되고, 그 후 상기한 도 3의 단계(S111)로 진행하도록 제어한다. In step S115, it is determined whether or not the state variable (for example, the state variable of the QMF synthesizing section 34 in Fig. 2) for the QMF band synthesis process of Rch has been updated. If YES, the process proceeds to step S111 of FIG. 3 described above, and if NO, the process proceeds to step S116. In step S116, the state variable for the QMF band synthesis process of Lch is copied to the state variable for the QMF band synthesis process of Rch, and then control proceeds to step S111 of FIG.

이러한 도 3, 도 5에 나타낸 구체적인 예에 있어서, 상기 도 4를 참조하여 설명한 구체적인 예의 구성에 더하여, 단계(S119, S117, S118)에 나타낸 바와 같이, 필터링 처리에서의 지연이 출력 오디오신호에 영향을 주지 않도록, 적어도 모든 필터링 상태변수(지연신호)가 갱신될 때까지 필터링 상태변수의 갱신처리 및 출력신호의 복제처리가 수행된다. 그 후, 모든 필터링 상태변수가 완전히 갱신된 후에, 통상의 재생처리가 수행되고, 그것에 의해 필터링 처리에서의 지연으로 인한 출력 오디오신호의 불규칙한 음의 발생이 방지된다. 3 and 5, in addition to the configuration of the specific example described with reference to FIG. 4 above, as shown in steps S119, S117 and S118, the delay in the filtering process affects the output audio signal. In order not to give an error, the updating process of the filtering state variable and the duplication process of the output signal are performed until at least all the filtering state variables (delay signals) are updated. Then, after all the filtering state variables are completely updated, normal playback processing is performed, whereby occurrence of irregular sounds of the output audio signal due to delay in the filtering processing is prevented.

본 발명의 실시예에 있어서 Lch, Rch 스테레오 출력 오디오신호의 예를 도 11c, 11d에 나타낸다. 도 10a, 10b를 참조하여 상기한 설명이 시각(t1~t3)에 마찬가지로 적용된다. 즉, 시각(t1)까지는 사용가능한 스테레오 처리정보가 없는 상태(예를 들면, AAC-LC(Low Complexity) 부호화정보 신호만이 입력되고, SBR 처리에서 업 샘플링(Up Sampling)만이 수행되는 상태)이다. 시각(t1)에서, 스테레오 처리정보를 포함하는 다중화된 부호화정보가 유효(사용 가능)하게 되고, 그것에 의해 AAC 처리, SBR 처리, PS 처리가 개시된다. 도 11c는 Lch 출력 오디오신호를 나타내고, 도 11d는 Rch 출력 오디오신호를 나타낸다. 11C and 11D show examples of Lch and Rch stereo output audio signals in the embodiment of the present invention. The above description with reference to FIGS. 10A and 10B is similarly applied to the times t1 to t3. That is, there is no stereo processing information available until time t1 (for example, only the AAC-LC (Low Complexity) encoded information signal is input and only up sampling is performed in the SBR process). . At time t1, multiplexed encoded information including stereo processing information becomes valid (usable), whereby AAC processing, SBR processing, and PS processing are started. FIG. 11C shows an Lch output audio signal, and FIG. 11D shows an Rch output audio signal.

본 발명의 실시예에 있어서, 도 11c, 11d에 나타낸 Lch, Rch 스테레오 출력 오디오신호는, 도 11a, 11b에 나타낸 종래의 출력 오디오신호와의 비교로부터 명백한 바와 같이, 시각(t1~t2) 사이의 상기 SBR 처리를 위한 대역 합성부(QMF 합성부(34))의 상태변수(지연신호)에 의한 영향 및 시각(t2~t3) 사이의 상기 PS 처리를 위한 하이브리드 필터(하이브리드 분석부(27))의 상태변수에 의한 영향으로부터 자유롭다. 본 발명의 실시예에 따르면, 내부 상태변수가 초기화된 상태로부터 처음으로 다중화된 부호화정보(스테레오 처리정보 등)가 공급되는 경우라도, 불규칙한 음 등으로부터 자유로운, 양호한 스테레오 오디오신호가 재생될 수 있다. In the embodiment of the present invention, the Lch and Rch stereo output audio signals shown in Figs. 11C and 11D are between time t1 to t2, as is apparent from the comparison with the conventional output audio signals shown in Figs. 11A and 11B. Hybrid filter (Hybrid analysis unit 27) for the PS processing between the time (t2 ~ t3) and the effect of the state variable (delayed signal) of the band synthesis unit (QMF synthesis unit 34) for the SBR processing Free from influence by state variables According to the embodiment of the present invention, even when the encoded information (stereo processing information, etc.) multiplexed for the first time from the state in which the internal state variable is initialized, a good stereo audio signal free from irregular sounds or the like can be reproduced.

상기한 본 발명의 실시예에 따르면, 스테레오 처리정보를 포함하는 부호화정보의 일부가 모노럴 오디오신호로 다중화되어 전송되는 부호화 오디오 데이터의 복호화 처리 및 재생에 있어서, 사용가능한 상기 다중화된 부호화정보가 공급되지 않는 상태에서 내부 상태변수(지연신호)를 초기화하고, 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 구성된다. 상기 내부 상태변수가 초기화된 상태로 상기 다중화된 부호화정보가 공급되면, 내부 상태변수의 갱신을 개시하고, 모든 상태변수가 갱신될 때까지 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 구성된다. 상기 내부 상태변수가 모두 갱신되었으면, 스테레오 오디오신호를 생성하고 출력하기 위해 상기 모노럴 오디오신호에 대하여 상기 다중화된 부호화정보에 근거하는 스테레오 처리를 포함하는 신호처리를 수행하도록 구성된다. According to the embodiment of the present invention described above, in the decoding processing and reproduction of encoded audio data in which a part of encoded information including stereo processing information is multiplexed into a monaural audio signal and transmitted, the multiplexed encoded information that is usable is not supplied. The internal state variable (delay signal) is initialized in the non-state state, and the stereo audio signal is output using the monaural audio signal. When the multiplexed encoding information is supplied with the internal state variable initialized, updating of the internal state variable is started, and the stereo audio signal is output using the monaural audio signal until all the state variables are updated. And when the internal state variables are all updated, perform signal processing including stereo processing based on the multiplexed encoding information on the monaural audio signal to generate and output a stereo audio signal.

즉, 스테레오 처리정보를 포함하는 부호화정보의 일부가 모노럴 오디오신호로 간헐적으로 다중화되어 전송되는 부호화 오디오 데이터를 복호화 처리 및 재생하는데 있어서, 스테레오 처리정보가 공급되지 않으면, 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 구성된다. 스테레오 처리정보가 공급되면, 필터 내의 내부 상태변수의 갱신을 개시하고, 모든 상태변수가 갱신될 때까지 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 구성된다. 필터 내의 모든 상태변수가 갱신되었으면, 스테레오 오디오신호를 생성하고 출력하기 위해 모노럴 오디오신호에 대하여 스테레오 처리정보에 근거하는 스테레오 처리를 수행하도록 구성된다. In other words, in decoding and reproducing encoded audio data in which a part of encoded information including stereo processing information is intermittently multiplexed into a monaural audio signal and transmitted, if stereo processing information is not supplied, stereo audio is used using a monaural audio signal. Configured to output a signal. When the stereo processing information is supplied, it is configured to start updating the internal state variable in the filter and output the stereo audio signal using the monaural audio signal until all the state variables are updated. Once all the state variables in the filter have been updated, it is configured to perform stereo processing based on the stereo processing information on the monaural audio signal to generate and output the stereo audio signal.

본 발명의 다른 실시예에 있어서는, 부호화 오디오데이터 재생장치가 제공된다. 상기 재생장치는 복호화수단(decoding means), 정보취득수단(information aquisition means), 오디오신호 대역분할수단(audio signal band division means), 고역정보 생성수단(high frequency information generation means), 스테레오신호 생성수단(stereo information generation means), 부대역 분할신호 합성수단(sub-band divided signal synthesis means) 및 출력 오디오신호 생성수단(output audio signal generation means)을 포함한다. 복호화수단은 부호화정보의 일부가 다중화되어 전송되는 부호화 오디오 데이터를 복호화한다. 정보취득수단은 다중화된 부호화정보의 일부가 전송되지 않은 경우에도 전송된 부호화정보의 일부로부터 출력 오디오신호를 생성하기 위한 정보를 취득한다. 오디오신호 대역분할수단은 대역분할신호(band-divided signal)를 생성하기 위해 적어도 2 이상의 부대역으로 의 분할을 수행한다. 고역정보 생성수단은 대역확장 부호화정보(band extension coded information)가 전송되면 생성된 대역분할신호에 대하여 고역정보를 생성한다. 스테레오신호 생성수단은 지연을 요구하는 부대역 분할신호 생성수단(sub-band divided signal generation means)이 대역분할신호에 대하여 부대역 분할신호를 생성하도록 하고, 공간 부호화정보가 전송되면, 공간 부호화정보에 근거하여 모노럴 신호로부터 스테레오 신호를 생성한다. 부대역 분할신호 합성수단은 부대역 분할신호를 대역분할신호로 합성한다. 출력 오디오신호 생성수단은 지연을 요구하는 오디오신호 합성수단(audio signal synthesis means)이 출력 오디오신호를 생성하기 위해 합성된 대역분할신호를 합성하도록 한다. 재생장치에 있어서, 불연속인 위치(프레임)로부터 재생하는 경우, 부대역 신호생성수단(subband signal generation means), 상태변수 초기화수단(state variable initialization means), 재생계속수단(playback continuing means) 및 모노럴 신호 상태변수 활용수단(monaural signal state variable utilization means)이 설치된다. 부대역 신호생성수단은 부호화 오디오 데이터 재생장치의 지연을 요구한다. 상태변수 초기화수단은 오디오신호 합성수단의 상태변수(지연신호)를 초기화한다. 재생계속수단은 상기 초기화 후에 재생을 계속한다. 모노럴신호 상태변수 활용수단은 상기 초기화 후에 처음으로 다중화된 부호화정보가 전송되면, 공간 부호화정보의 복호화 및 모노럴 신호로부터 스테레오 신호를 생성하는데 있어서, 생성된 스테레오 신호에 대한 오디오신호 합성수단의 상태변수(지연신호)로서 모노럴 신호에 대한 상태변수(지연신호)를 이용하여 처리를 수행한다. In another embodiment of the present invention, an apparatus for reproducing encoded audio data is provided. The reproducing apparatus includes decoding means, information acquisition means, audio signal band division means, high frequency information generation means, stereo signal generation means ( stereo information generation means, sub-band divided signal synthesis means and output audio signal generation means. The decoding means decodes the encoded audio data transmitted by multiplexing a part of the encoded information. The information acquiring means acquires information for generating an output audio signal from a part of the transmitted encoded information even when a part of the multiplexed encoded information is not transmitted. The audio signal band dividing means divides into at least two subbands to generate a band-divided signal. The high frequency information generating means generates high frequency information with respect to the generated band split signal when the band extension coded information is transmitted. The stereo signal generating means causes the sub-band divided signal generation means for requesting the delay to generate the subband split signal for the band split signal, and when the spatial encoded information is transmitted, Generate a stereo signal from the monaural signal. The subband split signal synthesizing means synthesizes the subband split signal into a band split signal. The output audio signal generating means causes audio signal synthesis means, which requires a delay, to synthesize the synthesized band split signal to generate the output audio signal. In the playback apparatus, when playing back from discrete positions (frames), subband signal generation means, state variable initialization means, playback continuing means, and monaural signals Monaural signal state variable utilization means is installed. The subband signal generating means requires a delay of the encoded audio data reproducing apparatus. The state variable initialization means initializes the state variable (delay signal) of the audio signal synthesizing means. The reproducing continuation means continues the regeneration after the initialization. When the monaural signal state variable utilization means is first transmitted after the initialization, the encoded information is decoded and the stereo signal is generated from the monaural signal. The state variable of the audio signal synthesizing means for the generated stereo signal ( Processing is performed using the state variable (delay signal) for the monaural signal as a delay signal).

또한, 의사 부대역 분할신호 생성수단(pseudo-subband-divided signal generation means), 복제 및 출력수단(replication and output means), 갱신수단(updating means) 및 스테레오신호 생성수행수단(stereo signal generation performing means)도 설치된다. 의사 부대역 분할신호 생성수단은, 부호화 오디오 데이터 재생장치의 지연신호의 초기화 후 처음으로 다중화된 부호화정보가 전송되면 공간 부호화정보를 복호화하고, 모노럴 신호로부터 스테레오 신호를 생성하는데 있어서, 부대역 분할신호 생성수단의 모든 상태변수(지연신호)가 갱신될 때까지 의사적으로(in a pseudo manner) 부대역 분할신호 생성을 수행한다. 복제 및 출력수단은 의사 부대역 분할신호 생성수단이 의사적으로 동작하고 있는 기간 동안 부대역 분할신호 생성수단에 공급되는 모노럴 대역분할 신호를 복제하고, 스테레오 대역분할신호를 오디오신호 합성수단에 출력한다. 분할계수 갱신수단(division coefficient updating means)은 의사 부대역 분할신호 생성수단이 의사적으로 동작하고 있는 기간 동안 모노럴 신호로부터 스테레오 신호를 생성하기 위한 스테레오신호 생성수단의 차분(difference)에 의해 갱신되는 분할계수를 갱신한다. 스테레오신호 생성수행수단은 부대역 분할신호 생성수단의 모든 지연신호가 갱신된 후 공간 부호화정보에 근거하여 모노럴신호로부터 스테레오신호를 생성한다. In addition, pseudo-subband-divided signal generation means, replication and output means, updating means and stereo signal generation performing means Is also installed. The pseudo subband split signal generating means decodes the spatially encoded information when the multiplexed encoded information is transmitted for the first time after initialization of the delayed signal of the encoded audio data reproducing apparatus, and generates a stereo signal from the monaural signal. Subband division signal generation is performed in a pseudo manner until all state variables (delay signals) of the generating means are updated. The copying and outputting means duplicates the monaural band splitting signal supplied to the subband splitting signal generating means during the period in which the pseudo subband splitting signal generating means is pseudoly operated, and outputs the stereo band splitting signal to the audio signal synthesizing means. . The division coefficient updating means is a division which is updated by the difference of the stereo signal generating means for generating the stereo signal from the monaural signal during the period in which the pseudo subband division signal generating means is operating pseudo. Update the coefficients. The stereo signal generating means generates a stereo signal from the monaural signal based on the spatial encoding information after all delay signals of the subband split signal generating means are updated.

즉, 부호화정보의 일부가 다중화되어 전송되는 부호화된 오디오 데이터에 대한 복호화 처리에 의해 임의의 프레임으로부터 통상적인 재생을 수행하는데 있어서, 디코더의 지연신호를 초기화하고, 다중화되어 전송되는 부호화정보가 없더라도, 적어도 2 이상의 부대역으로 분할하며, 모노럴 오디오신호를 복제하기 위한 지 연을 요구하는 대역합성 필터링 처리에 의해 업 샘플링을 수행함으로써, 그것에 의해 복제된 모노럴 오디오신호가 스테레오 오디오신호로서 출력될 수 있도록 구성되며, 반면, 처음으로 부호화정보가 전송되고 따라서 공간 부호화 처리가 유효하게 되면, 모노럴신호에 대한 오디오신호 대역합성처리를 위한 지연신호를 스테레오신호에 대한 오디오신호 대역합성처리를 위한 지연신호로서 처리하도록 구성되어, 그것에 의해 QMF 합성 필터링 처리에서의 지연으로 인한 출력 오디오신호에서의 불규칙한 음의 발생이 방지될 수 있다. That is, in performing normal reproduction from an arbitrary frame by decoding processing on coded audio data in which a part of encoded information is multiplexed and transmitted, even if there is no encoded information transmitted by multiplexing the delay signal of the decoder, Splitting into at least two subbands and performing upsampling by a band synthesis filtering process requiring a delay for replicating the monaural audio signal, so that the duplicated monaural audio signal can be output as a stereo audio signal On the other hand, if the encoded information is transmitted for the first time and thus the spatial encoding process is valid, the delayed signal for the audio signal band synthesis processing for the monaural signal is treated as the delayed signal for the audio signal band synthesis processing for the stereo signal. Is composed, by it QMF sum The occurrence of irregular sound in the audio signal due to the delayed output of the filtering process can be prevented.

또한, 부대역 분할 필터링 처리에서의 지연이 출력 오디오신호에 영향을 미치지 않도록 적어도 부대역 분할 필터링 처리의 모든 지연신호가 갱신될 때 지연신호의 갱신처리와 출력신호 복제처리가 수행된다. 그 후, 모든 지연신호가 갱신된 후, 통상적인 재생처리가 수행되고, 그것에 의해 필터링 처리에 의해 발생하는 지연으로 인한 출력 오디오신호에서의 불규칙한 음의 발생이 방지될 수 있다. Further, at least all delay signals of the subband division filtering process are updated so that the delay in the subband division filtering process is updated and the output signal duplication process is performed. Then, after all of the delay signals are updated, normal playback processing is performed, whereby occurrence of irregular sounds in the output audio signal due to the delay caused by the filtering processing can be prevented.

이러한 구성의 결과로서, 부호화정보의 일부가 다중화되어 전송되는, 공간 복호화 처리를 요구하는 부호화 오디오 데이터의 경우에 있어서도, 불규칙한 음을 발생하지 않고 임의의 위치로부터의 재생을 실현할 수 있다. As a result of this configuration, even in the case of encoded audio data requiring spatial decoding processing in which part of encoded information is multiplexed and transmitted, reproduction from any position can be realized without generating irregular sounds.

본 발명은 상기한 실시예의 경우로만 한정되는 것이 아니며, 본 발명의 범위 와 취지를 벗어나지 않는 범위 내에서 다양한 방법으로 수정이 가능한 것임은 물론이다. 예를 들면, 상기한 본 발명의 실시예에 있어서는, 하드웨어 구성을 가지는 재생장치 또는 재생방법을 기술하였다. 그러나 상기한 처리단계는 소프트웨어에 의해, 즉, CPU(Central Processing Unit)를 이용한 컴퓨터에 의해 프로그램을 실행시킴으로써 구현될 수 있다. 또한, 이러한 컴퓨터 프로그램은 기록매체에 기록되어 제공될 수 있다. The present invention is not limited only to the above-described embodiment, of course, and can be modified in various ways within the scope and spirit of the present invention. For example, in the above-described embodiment of the present invention, a playback apparatus or playback method having a hardware configuration has been described. However, the above processing step may be implemented by executing the program by software, that is, by a computer using a CPU (Central Processing Unit). In addition, such a computer program may be provided recorded on a recording medium.

도 1은 본 발명의 실시예에 따른 재생장치의 개략적인 구성을 나타내는 블록도이다. 1 is a block diagram showing a schematic configuration of a playback apparatus according to an embodiment of the present invention.

도 2는 본 발명의 실시예가 HE AAC v2 방식으로 부호화된 부호화 오디오 데이터를 재생하기 위한 재생장치에 적용되는 구성예를 나타내는 블록도이다. Fig. 2 is a block diagram showing an example of the configuration of an embodiment of the present invention to be applied to a reproduction device for reproducing encoded audio data encoded by the HE AAC v2 method.

도 3은 도 2에 나타낸 재생장치의 동작을 설명하기 위한 플로차트(flow chart)이다. FIG. 3 is a flow chart for explaining the operation of the playback device shown in FIG.

도 4는 도 3의 단계(S120)에서의 PS 처리의 구체적인 예를 설명하기 위한 플로차트이다. FIG. 4 is a flowchart for explaining a specific example of the PS processing in step S120 of FIG. 3.

도 5는 도 3의 단계(S120)에서의 PS 처리의 다른 구체적인 예를 설명하기 위한 플로차트이다. FIG. 5 is a flowchart for explaining another specific example of the PS processing in step S120 of FIG. 3.

도 6은 종래의 스테레오 처리장치의 구성예를 나타내는 블록도이다. 6 is a block diagram showing a configuration example of a conventional stereo processing apparatus.

도 7은 도 6의 스테레오 처리장치에 공급되는 신호의 예를 나타내는 도면이다. FIG. 7 is a diagram illustrating an example of a signal supplied to the stereo processing apparatus of FIG. 6.

도 8은 HE AAC v2 방식의 스테레오 처리장치에 공급되는 신호의 예를 나타내는 도면이다. 8 is a diagram illustrating an example of a signal supplied to a stereo processing apparatus of an HE AAC v2 system.

도 9는 HE AAC v2 방식으로 부호화된 부호화 오디오 데이터를 재생하기 위한 재생장치의 구성예를 나타내는 블록도이다. 9 is a block diagram showing an example of the configuration of a reproduction device for reproducing coded audio data encoded in the HE AAC v2 system.

도 10은 도 9에 나타낸 재생장치의 동작을 설명하기 위한 플로차트이다. FIG. 10 is a flowchart for explaining the operation of the playback device shown in FIG.

도 11은 종래의 재생장치의 출력 오디오신호와 본 발명의 실시예가 적용된 재생장치의 출력 오디오신호를 비교하는 파형도이다. Fig. 11 is a waveform diagram comparing the output audio signal of the conventional playback apparatus with the output audio signal of the playback apparatus to which the embodiment of the present invention is applied.

[부호의 설명] [Description of the code]

11. 부호화 오디오 데이터의 입력단자 21. QMF 분석부 11. Input terminal of encoded audio data 21. QMF analyzer

23. HF 생성부 27. 하이브리드 분석부 23. HF generator 27. Hybrid analyzer

30, 45. 스테레오 처리부 31, 32. 하이브리드 합성부 30, 45. Stereo processing section 31, 32. Hybrid synthesis section

33, 34. QMF 합성부 44 대역분할부 33, 34. QMF Synthesizer 44 Band Division

51, 52. 대역합성부 51, 52. Band Synthesis Unit

Claims (9)

스테레오 처리(stereo process)에 요구되는 필요 스테레오 처리정보(necessary stereo process information)가 모노럴 오디오신호(monaural audio signal)의 부호화정보(coded information)로 간헐적으로 다중화되어(intermittently multiplexed) 전송되는 부호화 오디오 데이터(coded audio data)를 복호화 처리(decode-process) 및 재생하는 재생방법(playback method)에 있어서, The encoded stereo data required for stereo processing is transmitted intermittently multiplexed into coded information of a monaural audio signal. In a playback method for decoding and processing coded audio data, 상기 필요 스테레오 처리정보가 공급되지 않으면, 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하는 제 1 단계와, A first step of outputting a stereo audio signal using the monaural audio signal if the necessary stereo processing information is not supplied; 상기 필요 스테레오 처리정보가 공급되면, 필터 내의 상태변수(state variable)의 갱신(updating)을 개시하고, 모든 상기 상태변수가 갱신될 때까지 상기 모노럴 오디오신호를 이용하여 상기 스테레오 오디오신호를 출력하는 제 2 단계와, When the necessary stereo processing information is supplied, starting updating of a state variable in the filter and outputting the stereo audio signal using the monaural audio signal until all the state variables are updated. With two stages, 상기 필터 내의 모든 상기 상태변수가 갱신되었으면, 출력 스테레오 오디오신호(output stereo audio signal)를 생성하기 위해, 상기 모노럴 오디오신호에 대하여 상기 필요 스테레오 처리정보에 의해 얻어진 스테레오 처리정보(stereo process information)에 근거하여 스테레오처리를 수행하는 제 3 단계를 포함하여 구성된 것을 특징으로 하는 재생방법. If all the state variables in the filter have been updated, based on stereo process information obtained by the necessary stereo processing information for the monaural audio signal to generate an output stereo audio signal; And a third step of performing stereo processing. 제 1항에 있어서, The method of claim 1, 상기 스테레오처리는 대역확장된(band-extended) 모노럴 오디오신호에 대하여 수행되는 것을 특징으로 하는 재생방법. And the stereo processing is performed on a band-extended monaural audio signal. 제 1항에 있어서, The method of claim 1, 상기 제 1 단계에서, 상기 모노럴 오디오신호는 대역분할 필터링 처리(band division filtering process)에 의해 적어도 2 이상의 부대역(subband)으로 분할되고, 상기 적어도 2 이상의 부대역은 대역합성 필터링 처리(band synthesis filtering process)에 의해 업 샘플링되어(up-sampled), 상기 모노럴 오디오신호를 이용하는 스테레오 오디오신호를 출력하며, In the first step, the monaural audio signal is divided into at least two or more subbands by a band division filtering process, and the at least two or more subbands are band synthesis filtering process. up-sampled to output a stereo audio signal using the monaural audio signal, 상기 제 2 단계에서, 상기 모노럴 오디오신호에 대한 필터 내의 상태변수가 상기 스테레오 오디오신호에 대한 필터링 상태변수로서 처리되는 것을 특징으로 하는 재생방법. In the second step, the state variable in the filter for the monaural audio signal is processed as a filtering state variable for the stereo audio signal. 제 1항에 있어서, The method of claim 1, 상기 부호화 오디오 데이터는, The encoded audio data is, HE AAC(High Efficiency Advanced Audio Coding) 부호화 방식에 근거하는 모노럴 오디오 데이터와 동등한(equivalent) AAC 코어의 부호화정보(AAC core coded information)와, AAC core coded information equivalent to monaural audio data based on HE AAC (High Efficiency Advanced Audio Coding) coding scheme, SBR(Spectral Band Replication) 처리를 위한 부호화정보와, Encoding information for SBR (Spectral Band Replication) processing, PS(Parametric Stereo) 처리를 위한 부호화정보를 가지며, Has encoding information for PS (Parametric Stereo) processing, 상기 SBR 처리를 위한 부호화정보는, 다중화되어 간헐적으로 전송되는 부호화정보인 SBR 헤더(sbr header)와 항상 전송되는 부호화정보인 SBR 데이터(sbr data)를 포함하며, The encoded information for the SBR processing includes an SBR header, which is multiplexed and intermittently transmitted information, and SBR data, which is encoded information, which is always transmitted. 상기 PS 처리를 위한 부호화정보인 PS 데이터(ps data)는, 상기 SBR 데이터의 확장영역(extended area)에 포함되어 전송되고, PS data, which is encoding information for the PS processing, is included in an extended area of the SBR data and transmitted. 상기 SBR 헤더는, 상기 SBR 데이터를 복호화하기 위해 요구되는 상기 필요 스테레오 처리정보인 것을 특징으로 하는 재생방법. And the SBR header is the necessary stereo processing information required for decoding the SBR data. 스테레오 처리에 요구되는 필요 스테레오 처리정보가 모노럴 오디오신호의 부호화정보로 간헐적으로 다중화되어 전송되는 부호화 오디오 데이터를 복호화 처리 및 재생하는 재생장치(playback apparatus)에 있어서, A playback apparatus for decoding and reproducing encoded audio data transmitted by intermittently multiplexing necessary stereo processing information required for stereo processing into encoded information of a monaural audio signal, 공급되는 상기 모노럴 오디오신호를 대역분할하는 대역분할수단(band division means)과, Band division means for band-dividing the supplied monaural audio signal; 상기 대역분할수단으로부터의 신호를 상기 다중화된 부호화정보에 포함되는 상기 스테레오 처리정보에 근거하여 스테레오 처리하는 스테레오 처리수단(stereo processing means)과, Stereo processing means for stereo processing the signal from the band dividing means based on the stereo processing information included in the multiplexed encoding information; 상기 스테레오 처리수단으로부터의 좌채널 및 우채널의 스테레오신호를 각각 대역합성하는 대역합성수단(band synthesis means)과, Band synthesis means for band-synthesizing left and right channel stereo signals from the stereo processing means, respectively; 상기 필요 스테레오 처리정보가 공급되지 않으면 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 제어하며, 상기 필요 스테레오 처리정보가 공급되면 필터 내의 상태변수의 갱신을 개시하고 모든 상기 상태변수가 갱신될 때까지 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 제어하며, 상기 필터 내의 모든 상기 상태변수가 갱신되었으면 스테레오 오디오신호를 생성하고 출력하기 위해 상기 모노럴 오디오신호에 대하여 상기 필요 스테레오 처리정보에 의해 얻어진 스테레오 처리정보에 근거하여 스테레오 처리를 수행하도록 제어하는 제어수단을 포함하여 구성된 것을 특징으로 하는 재생장치. If the necessary stereo processing information is not supplied, the monaural audio signal is used to output a stereo audio signal, and when the required stereo processing information is supplied, when the state variable in the filter is started and all the state variables are updated. And outputting a stereo audio signal by using the monaural audio signal until the state variable in the filter has been updated to generate and output a stereo audio signal by the necessary stereo processing information for the monaural audio signal. And control means for controlling to perform stereo processing based on the stereo processing information. 제 5항에 있어서, The method of claim 5, 상기 스테레오 처리는, 대역확장된 모노럴 오디오신호에 대하여 수행되는 것을 특징으로 하는 재생장치. And the stereo processing is performed on a band-extended monaural audio signal. 스테레오 처리에 요구되는 필요 스테레오 처리정보가 모노럴 오디오신호의 부호화정보로 간헐적으로 다중화되어 전송되는 부호화 오디오 데이터를 복호화 처리 및 재생하는 처리를 컴퓨터에 실행시키는 프로그램(program)에 있어서, A program for causing a computer to execute a process of decoding and reproducing encoded audio data transmitted by intermittently multiplexing necessary stereo processing information required for stereo processing into encoded information of a monaural audio signal. 상기 필요 스테레오 처리정보가 공급되지 않으면, 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하는 제 1 단계와, A first step of outputting a stereo audio signal using the monaural audio signal if the necessary stereo processing information is not supplied; 상기 필요 스테레오 처리정보가 공급되면, 필터 내의 상태변수의 갱신을 개시하고, 모든 상기 상태변수가 갱신될 때까지 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하는 제 2 단계와, A second step of, when the required stereo processing information is supplied, starting updating of the state variables in the filter and outputting a stereo audio signal using the monaural audio signal until all the state variables are updated; 상기 필터 내의 모든 상기 상태변수가 갱신되었으면, 스테레오 오디오신호를 생성하고 출력하기 위해 상기 모노럴 오디오신호에 대하여 상기 필요 스테레오 처리정보에 의해 얻어진 스테레오 처리정보에 근거하여 스테레오 처리를 수행하는 제 3 단계를 포함하여 구성된 것을 특징으로 하는 프로그램. A third step of performing stereo processing on the monaural audio signal based on the stereo processing information obtained by the necessary stereo processing information to generate and output a stereo audio signal when all the state variables in the filter have been updated. Program characterized in that configured by. 스테레오 처리에 요구되는 필요 스테레오 처리정보가 모노럴 오디오신호의 부호화정보로 간헐적으로 다중화되어 전송되는 부호화 오디오 데이터를 복호화 처리 및 재생하는 처리를 컴퓨터에 실행시키는 프로그램이 기록된 기록매체(recording medium)에 있어서, In a recording medium on which a program for causing a computer to execute a process of decoding and reproducing encoded audio data transmitted by intermittently multiplexing necessary stereo processing information required for stereo processing to encoded information of a monaural audio signal is provided. , 상기 기록매체는, The recording medium, 상기 필요 스테레오 처리정보가 공급되지 않으면, 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하는 제 1 단계와, A first step of outputting a stereo audio signal using the monaural audio signal if the necessary stereo processing information is not supplied; 상기 필요 스테레오 처리정보가 공급되면, 필터 내의 상태변수의 갱신을 개시하고, 모든 상기 상태변수가 갱신될 때까지 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하는 제 2 단계와, A second step of, when the required stereo processing information is supplied, starting updating of the state variables in the filter and outputting a stereo audio signal using the monaural audio signal until all the state variables are updated; 상기 필터 내의 모든 상기 상태변수가 갱신되었으면, 스테레오 오디오신호를 생성하고 출력하기 위해 상기 모노럴 오디오신호에 대하여 상기 필요 스테레오 처리정보에 의해 얻어진 스테레오 처리정보에 근거하여 스테레오 처리를 수행하는 제 3 단계를 포함하여 구성된 프로그램이 기록된 것을 특징으로 하는 기록매체. A third step of performing stereo processing on the monaural audio signal based on the stereo processing information obtained by the necessary stereo processing information to generate and output a stereo audio signal when all the state variables in the filter have been updated. The recording medium, characterized in that the recorded program is recorded. 스테레오 처리에 요구되는 필요 스테레오 처리정보가 모노럴 오디오신호의 부호화정보로 간헐적으로 다중화되어 전송되는 부호화 오디오 데이터를 복호화 처리 및 재생하는 재생장치(playback apparatus)에 있어서, A playback apparatus for decoding and reproducing encoded audio data transmitted by intermittently multiplexing necessary stereo processing information required for stereo processing into encoded information of a monaural audio signal, 공급되는 상기 모노럴 오디오신호를 대역분할하는 대역분할부(band divider)와, A band divider for band-dividing the supplied monaural audio signal; 상기 대역분할부로부터의 신호를 상기 다중화된 부호화정보에 포함되는 상기 스테레오 처리정보에 근거하여 스테레오 처리하는 스테레오 처리부(stereo processor)와, A stereo processor which stereo-processes the signal from the band splitter based on the stereo processing information included in the multiplexed encoding information; 상기 스테레오 처리기로부터의 좌채널 및 우채널의 스테레오신호를 각각 대역합성하는 대역합성부(band synthesizer)와, A band synthesizer for band-synthesizing left and right channel stereo signals from the stereo processor, respectively; 상기 필요 스테레오 처리정보가 공급되지 않으면 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 제어하며, 상기 필요 스테레오 처리정보가 공급되면 필터 내의 상태변수의 갱신을 개시하고 모든 상기 상태변수가 갱신될 때까지 상기 모노럴 오디오신호를 이용하여 스테레오 오디오신호를 출력하도록 제어하며, 상기 필터 내의 모든 상기 상태변수가 갱신되었으면 스테레오 오디오신호를 생성하고 출력하기 위해 상기 모노럴 오디오신호에 대하여 상기 필요 스테레오 처리정보에 의해 얻어진 스테레오 처리정보에 근거하여 스테레오 처리를 수행하도록 제어하는 제어부(controller)를 포함하여 구성된 것을 특징으로 하는 재생장치. If the necessary stereo processing information is not supplied, the monaural audio signal is used to output a stereo audio signal, and when the required stereo processing information is supplied, when the state variable in the filter is started and all the state variables are updated. And outputting a stereo audio signal by using the monaural audio signal until the state variable in the filter has been updated to generate and output a stereo audio signal by the necessary stereo processing information for the monaural audio signal. And a controller for controlling to perform stereo processing based on the stereo processing information.
KR1020070120956A 2006-11-30 2007-11-26 Playback method and apparatus, program, and recording medium KR20080049632A (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2006324775 2006-11-30
JPJP-P-2006-00324775 2006-11-30
JPJP-P-2007-00272856 2007-10-19
JP2007272856A JP4930320B2 (en) 2006-11-30 2007-10-19 Reproduction method and apparatus, program, and recording medium

Publications (1)

Publication Number Publication Date
KR20080049632A true KR20080049632A (en) 2008-06-04

Family

ID=39487355

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070120956A KR20080049632A (en) 2006-11-30 2007-11-26 Playback method and apparatus, program, and recording medium

Country Status (5)

Country Link
JP (1) JP4930320B2 (en)
KR (1) KR20080049632A (en)
CN (1) CN101192407B (en)
DE (1) DE602007012644D1 (en)
TW (1) TWI380287B (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101118466B1 (en) * 2010-11-08 2012-03-12 티제이미디어 주식회사 Apparatus for converting mono signal to stereo in video compact disc and method for the same

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2521363B1 (en) * 2009-02-19 2014-05-14 Panasonic Corporation Playback device
TWI433137B (en) 2009-09-10 2014-04-01 Dolby Int Ab Improvement of an audio signal of an fm stereo radio receiver by using parametric stereo
KR101710113B1 (en) * 2009-10-23 2017-02-27 삼성전자주식회사 Apparatus and method for encoding/decoding using phase information and residual signal
JP5850216B2 (en) 2010-04-13 2016-02-03 ソニー株式会社 Signal processing apparatus and method, encoding apparatus and method, decoding apparatus and method, and program
CN102254560B (en) * 2010-05-19 2013-05-08 安凯(广州)微电子技术有限公司 Audio processing method in mobile digital television recording
JP6075743B2 (en) 2010-08-03 2017-02-08 ソニー株式会社 Signal processing apparatus and method, and program
JP5707842B2 (en) 2010-10-15 2015-04-30 ソニー株式会社 Encoding apparatus and method, decoding apparatus and method, and program
JP6155274B2 (en) 2011-11-11 2017-06-28 ドルビー・インターナショナル・アーベー Upsampling with oversampled SBR
EP2981956B1 (en) * 2013-04-05 2022-11-30 Dolby International AB Audio processing system
WO2015041070A1 (en) 2013-09-19 2015-03-26 ソニー株式会社 Encoding device and method, decoding device and method, and program
KR20230042410A (en) 2013-12-27 2023-03-28 소니그룹주식회사 Decoding device, method, and program
JP6210338B2 (en) * 2015-12-28 2017-10-11 ソニー株式会社 Signal processing apparatus and method, and program
CN106534762B (en) * 2016-11-16 2019-12-13 深圳市捷视飞通科技股份有限公司 low-delay distributed audio processing method and system
JP6439843B2 (en) * 2017-09-14 2018-12-19 ソニー株式会社 Signal processing apparatus and method, and program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5835895A (en) * 1997-08-13 1998-11-10 Microsoft Corporation Infinite impulse response filter for 3D sound with tap delay line initialization
US6721710B1 (en) * 1999-12-13 2004-04-13 Texas Instruments Incorporated Method and apparatus for audible fast-forward or reverse of compressed audio content
SE0202159D0 (en) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
CN1284319C (en) * 2002-04-22 2006-11-08 西安大唐电信有限公司 Implement method of multi-channel AMR vocoder and its equipment
SE527866C2 (en) * 2003-12-19 2006-06-27 Ericsson Telefon Ab L M Channel signal masking in multi-channel audio system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101118466B1 (en) * 2010-11-08 2012-03-12 티제이미디어 주식회사 Apparatus for converting mono signal to stereo in video compact disc and method for the same

Also Published As

Publication number Publication date
TWI380287B (en) 2012-12-21
CN101192407A (en) 2008-06-04
TW200830276A (en) 2008-07-16
DE602007012644D1 (en) 2011-04-07
CN101192407B (en) 2011-04-13
JP2008158496A (en) 2008-07-10
JP4930320B2 (en) 2012-05-16

Similar Documents

Publication Publication Date Title
KR20080049632A (en) Playback method and apparatus, program, and recording medium
JP4834539B2 (en) Audio signal synthesis
US8145498B2 (en) Device and method for generating a coded multi-channel signal and device and method for decoding a coded multi-channel signal
AU2006222285B2 (en) Device and method for generating an encoded stereo signal of an audio piece or audio data stream
CA2579114C (en) Device and method for generating a multi-channel signal or a parameter data set
JP4685925B2 (en) Adaptive residual audio coding
KR101086347B1 (en) Apparatus and Method For Coding and Decoding multi-object Audio Signal with various channel Including Information Bitstream Conversion
JP4918490B2 (en) Energy shaping device and energy shaping method
TW200405267A (en) Audio decoding apparatus and audio decoding method
JP2007528025A (en) Audio distribution system, audio encoder, audio decoder, and operation method thereof
KR20120031998A (en) Apparatus and method for restoring multi-channel audio signal using he-aac decoder and mpeg surround decoder
MX2014010098A (en) Phase coherence control for harmonic signals in perceptual audio codecs.
KR100917845B1 (en) Apparatus and method for decoding multi-channel audio signal using cross-correlation
EP2610867A1 (en) Audio reproducing device and audio reproducing method
US8363842B2 (en) Playback method and apparatus, program, and recording medium
JP2006337767A (en) Device and method for parametric multichannel decoding with low operation amount
Quackenbush et al. Digital Audio Compression Technologies
KR20080030848A (en) Method and apparatus for encoding and decoding an audio signal
Breebaart et al. 19th INTERNATIONAL CONGRESS ON ACOUSTICS MADRID, 2-7 SEPTEMBER 2007

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right