KR101455648B1 - Method and System to Encode/Decode Audio/Speech Signal for Supporting Interoperability - Google Patents

Method and System to Encode/Decode Audio/Speech Signal for Supporting Interoperability Download PDF

Info

Publication number
KR101455648B1
KR101455648B1 KR1020070109154A KR20070109154A KR101455648B1 KR 101455648 B1 KR101455648 B1 KR 101455648B1 KR 1020070109154 A KR1020070109154 A KR 1020070109154A KR 20070109154 A KR20070109154 A KR 20070109154A KR 101455648 B1 KR101455648 B1 KR 101455648B1
Authority
KR
South Korea
Prior art keywords
signal
domain
encoding
time domain
information
Prior art date
Application number
KR1020070109154A
Other languages
Korean (ko)
Other versions
KR20090043352A (en
Inventor
성호상
오은미
주기현
김중회
김미영
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070109154A priority Critical patent/KR101455648B1/en
Publication of KR20090043352A publication Critical patent/KR20090043352A/en
Application granted granted Critical
Publication of KR101455648B1 publication Critical patent/KR101455648B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Abstract

본 발명은 상호 운용성을 지원하는 오디오/스피치 신호의 부호화 방법에 관한 것으로, 복수 개의 코덱들간의 상호 운용성(interoperability)을 나타내는 정보를 기초로 신호를 부호화할 도메인을 결정하고, 상호 운용성 정보를 기초로 결정된 도메인에서 신호를 부호화한다.The present invention relates to a method of encoding an audio / speech signal supporting interoperability, comprising: determining a domain to encode a signal based on information indicating interoperability between a plurality of codecs, And encodes the signal in the determined domain.

Description

상호 운용성을 지원하는 오디오/스피치 신호의 부호화/복호화 방법 및 시스템{Method and System to Encode/Decode Audio/Speech Signal for Supporting Interoperability}TECHNICAL FIELD [0001] The present invention relates to a method and system for encoding / decoding audio / speech signals supporting interoperability,

본 발명은 오디오/스피치 신호의 부호화/복호화 방법 및 시스템에 관한 것으로, 보다 상세하게는 상호 운용성을 지원하는 오디오/스피치 신호의 부호화/복호화 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for encoding / decoding an audio / speech signal, and more particularly to a method and system for encoding / decoding an audio / speech signal supporting interoperability.

입력되는 스피치 신호, 오디오 신호, 스피치와 오디오가 혼합된 신호를 부호화 또는 복호화함에 있어서, 적은 비트를 이용하여 압축 효율 및 음질을 향상시킬 수 있는 방법 및 시스템이 요구된다.A method and system for improving the compression efficiency and sound quality by using a small number of bits in encoding or decoding an input speech signal, an audio signal, and a signal in which speech and audio are mixed is required.

본 발명이 해결하고자 하는 과제는 스피치 신호 및 오디오 신호 모두를 효율적으로 부호화하며, 복수의 코덱들간의 상호 운용성을 지원하는 오디오/스피치 신호의 부호화 방법 및 시스템, 및 오디오/스피치 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.SUMMARY OF THE INVENTION An object of the present invention is to provide an audio / speech signal encoding method and system that efficiently encodes both a speech signal and an audio signal, supports interoperability between a plurality of codecs, and a method of encoding an audio / And a computer readable recording medium storing a program for performing the method.

본 발명이 해결하고자 하는 다른 과제는 스피치 신호 및 오디오 신호 모두를 효율적으로 복호화하며, 복수의 코덱들간의 상호 운용성을 지원하는 오디오/스피치 신호의 복호화 방법 및 시스템, 및 오디오/스피치 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.Another object of the present invention is to provide a method and system for decoding an audio / speech signal that efficiently decodes both a speech signal and an audio signal, supports interoperability between a plurality of codecs, and a decoding method of an audio / There is provided a computer-readable recording medium storing a program for executing the program.

상기 과제를 해결하기 위한 본 발명에 따른 신호의 부호화 방법은 복수 개의 코덱들간의 상호 운용성(interoperability)을 나타내는 정보를 기초로 신호를 부호화할 도메인을 결정하는 단계; 및 상기 정보를 기초로 상기 결정된 도메인에서 상기 신호를 부호화하는 단계를 포함한다.According to an aspect of the present invention, there is provided a signal encoding method comprising: determining a domain to encode a signal based on information indicating interoperability between a plurality of codecs; And encoding the signal in the determined domain based on the information.

또한, 상기 과제는 복수 개의 코덱들간의 상호 운용성(interoperability)을 나타내는 정보를 기초로 신호를 부호화할 도메인을 결정하는 단계; 및 상기 정보를 기초로 상기 결정된 도메인에서 상기 신호를 부호화하는 단계를 포함하는 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.According to another aspect of the present invention, there is provided a method for encoding a signal, the method comprising: determining a domain to encode a signal based on information indicating interoperability between a plurality of codecs; And encoding the signal in the determined domain based on the information. The present invention also provides a computer-readable recording medium having recorded thereon a program for executing a method of coding a signal.

또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 신호의 복호화 방법은 신호의 부호화 결과에 포함된 복수 개의 코덱들간의 상호 운용성을 나타내는 정보를 기초로 상기 신호의 부호화 결과를 복호화할 도메인을 판단하는 단계; 및 상기 정보를 기초로 상기 판단된 도메인에서 상기 신호의 부호화 결과를 복호화하는 단계를 포함한다.According to another aspect of the present invention, there is provided a method of decoding a signal, the method comprising: determining a domain in which a result of encoding the signal is to be decoded based on information indicating interoperability between a plurality of codecs included in a signal encoding result step; And decoding the encoded result of the signal in the determined domain based on the information.

또한, 상기 다른 과제는 신호의 부호화 결과에 포함된 복수 개의 코덱들간의 상호 운용성을 나타내는 정보를 기초로 상기 신호의 부호화 결과를 복호화할 도메인을 판단하는 단계; 및 상기 정보를 기초로 상기 판단된 도메인에서 상기 신호의 부호화 결과를 복호화하는 단계를 포함하는 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.According to another aspect of the present invention, there is provided a method of decoding a signal, comprising: determining a domain in which a result of encoding a signal is to be decoded based on information indicating interoperability between a plurality of codecs included in a signal encoding result; And decoding the encoded result of the signal in the determined domain based on the information. The present invention also provides a computer-readable recording medium having recorded thereon a program for executing a method of decoding a signal.

또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 신호의 부호화 시스템은 복수 개의 코덱들간의 상호 운용성(interoperability)을 나타내는 정보를 기초로 신호를 서브 밴드 별로 시간 도메인 중 주파수 도메인 중 어느 하나로 변환하는 도메인 변환부; 상기 정보를 기초로 각 서브 밴드의 신호를 부호화할 도메인을 결정하는 모드 결정부; 시간 도메인에서 부호화하는 것으로 결정된 서브 밴드의 신호를 상기 정보가 나타내는 코덱을 이용하여 시간 도메인에서 부호화하는 시간 도메인 부호화부; 및 주파수 도메인에서 부호화하는 것으로 결정된 서브 밴드의 신호를 주파수 도메인에서 부호화하는 주파수 도메인 부호화부를 포함한다.According to another aspect of the present invention, there is provided a signal encoding system for converting a signal into one of a frequency domain of a time domain and a frequency domain of a time domain based on information indicating interoperability between a plurality of codecs, A conversion unit; A mode determining unit for determining a domain to which a signal of each subband is to be encoded based on the information; A time domain encoding unit for encoding a signal of a subband determined to be encoded in a time domain in a time domain using a codec indicating the information; And a frequency domain encoding unit for encoding a signal of a subband determined to be encoded in the frequency domain in the frequency domain.

또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 신호의 복호화 시스템은 신호의 부호화 결과에 포함된 복수 개의 코덱들간의 상호 운용성을 나타내는 정보를 기초로 상기 신호의 부호화 결과를 복호화할 도메인을 판단하는 모드 판단부; 시간 도메인에서 복호화하는 것으로 판단된 경우 상기 정보가 나타내는 코덱을 이용하여 상기 신호의 부호화 결과를 시간 도메인에서 복호화함으로써 시간 도메인의 신호를 복원하는 시간 도메인 복호화부; 주파수 도메인에서 복호화하는 것으로 판단된 경우 상기 신호의 부호화 결과를 주파수 도메인에서 복호화함으로써 주파수 도메인의 신호를 복원하는 주파수 도메인 복호화부; 및 상기 정보를 기초로 상기 복원된 시간 도메인의 신호 및 상기 복원된 주파수 도메인의 신호를 합성하여 시간 도메인으로 변환하는 도메인 변환부를 포함한다.According to another aspect of the present invention, there is provided a system for decoding a signal, the system for decoding a signal of a signal includes determining a domain to decode an encoding result of the signal based on information indicating interoperability between a plurality of codecs included in a signal encoding result A mode determination unit; A time domain decoding unit for decoding a time domain signal by decoding the encoded result of the signal in the time domain using a codec indicated by the information when it is determined to decode in the time domain; A frequency domain decoding unit for decoding the frequency domain signal by decoding the encoded signal in the frequency domain if it is determined to decode the signal in the frequency domain; And a domain converter for synthesizing the restored time domain signal and the restored frequency domain signal based on the information and converting the synthesized signal to the time domain.

본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다. For the embodiments of the invention disclosed herein, specific structural and functional descriptions are set forth for the purpose of describing an embodiment of the invention only, and it is to be understood that the embodiments of the invention may be practiced in various forms, The present invention should not be construed as limited to the embodiments described in Figs.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 구성요소에 대해 사용하였다. The present invention is capable of various modifications and various forms, and specific embodiments are illustrated in the drawings and described in detail in the text. It should be understood, however, that the invention is not intended to be limited to the particular forms disclosed, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention. Similar reference numerals have been used for the components in describing each drawing.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다. Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries are to be interpreted as having a meaning consistent with the contextual meaning of the related art and are to be interpreted as either ideal or overly formal in the sense of the present application Do not.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다. Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. The same reference numerals are used for the same constituent elements in the drawings and redundant explanations for the same constituent elements are omitted.

도 1은 본 발명의 일 실시예에 따른 상호 운용성을 지원하는 코덱을 개략적 으로 나타내는 개념도이다.1 is a conceptual diagram schematically illustrating a codec supporting interoperability according to an embodiment of the present invention.

도 1을 참조하면, 상호 운용성을 지원하는 코덱은 부호화부(encoding unit, 10) 및 복호화부(decoding unit, 20)를 포함한다. Referring to FIG. 1, a codec for supporting interoperability includes an encoding unit 10 and a decoding unit 20.

부호화부(10)는 부호화기(encoder, 11) 및 다중화부(multiplexing unit, 12)를 포함한다. 부호화기(11)는 오디오/스피치 신호(IN) 및 복수의 코덱들간의 상호 운용성을 나타내는 정보(II, Interoperability Indicator)를 수신하고, 수신한 정보를 기초로 수신한 오디오/스피치 신호를 부호화한다. 다중화부(12)는 부호화기(11)에서 부호화된 결과를 다중화하여 비트스트림으로 출력한다. 다중화부(12)에서 출력된 비트스트림은 채널(30)을 통해 전송되거나 저장부(40)에 저장된다. The encoding unit 10 includes an encoder 11 and a multiplexing unit 12. The encoder 11 receives the audio / speech signal IN and interoperability indicator (II) indicating interoperability between the plurality of codecs and encodes the received audio / speech signal based on the received information. The multiplexing unit 12 multiplexes the results encoded by the encoder 11 and outputs the result as a bit stream. The bit stream output from the multiplexing unit 12 is transmitted via the channel 30 or is stored in the storage unit 40.

복호화부(20)는 역다중화부(demultiplexing unit, 21) 및 복호화기(decoder, 22)를 포함한다. 역다중화부(21)는 채널(30)을 통해 전송되거나 저장부(40)에서 출력된 비트스트림을 역다중화하여 오디오/스피치 신호의 부호화 결과 및 복수의 코덱들간의 상호 운용성을 나타내는 정보(II)를 출력한다. 복호화기(22)는 역다중화부(21)에서 역다중화된 부호화 결과 및 정보(II)를 수신하고, 수신한 정보를 기초로 부호화 결과를 복호화함으로써 오디오/스피치 신호를 복원한다.The decoding unit 20 includes a demultiplexing unit 21 and a decoder 22. The demultiplexing unit 21 demultiplexes the bitstream transmitted through the channel 30 or output from the storage unit 40 to generate the encoded result of the audio / speech signal and the information II indicating the interoperability between the plurality of codecs. . The decoder 22 receives the demultiplexed encoding result and information II from the demultiplexer 21 and decodes the encoded result based on the received information to reconstruct the audio / speech signal.

이와 같이, 본 발명의 일 실시예에 따른 상호 운용성을 지원하는 코덱은 복수의 코덱들간의 상호 운용성을 나타내는 정보(II)를 별도로 수신함으로써, 복수의 코덱들간의 호환성을 가질 수 있다. As described above, the codec for supporting interoperability according to an embodiment of the present invention may have compatibility between a plurality of codecs by separately receiving information (II) indicating interoperability between the plurality of codecs.

도 2는 본 발명의 일 실시예에 따른 상호 운용성 표시자의 일 예를 나타낸다.FIG. 2 illustrates an example of an interoperability indicator according to an embodiment of the present invention.

상호 운용성 표시자(Interoperability Indicator)는 복수의 코덱들간의 상호 운용성을 나타내는 정보이다. 여기서, 상호 운용성은 시스템이나 제품이 고객 측의 특별한 노력 없이도 다른 시스템이나 제품과 함께 잘 동작하기 위한 능력으로, 같은 기종 또는 다른 기종의 시스템끼리 상호 간에 통신할 수 있고, 정보 교환이나 일련의 처리를 정확히 실행할 수 있는 것을 말한다. An interoperability indicator is information indicating interoperability between a plurality of codecs. Here, interoperability is the ability for a system or product to work well with other systems or products without any special effort on the part of the customer, so that systems of the same or different types can communicate with each other, It is precisely what can be done.

오디오/스피치 신호를 시간 도메인에서 부호화/복호화하는 코덱은 여러 종류가 있고, 각각의 코덱은 부호화를 수행할 수 있는 대역폭의 크기 또는 비트 레이트(bit rate) 등이 다를 수 있다. 그 결과, 오디오/스피치 신호를 시간 도메인에서 부호화/복호화하는 코덱의 종류에 따라 오디오/스피치 신호의 부호화/복호화 시스템의 전체적인 동작이 다를 수 있다. 따라서, 시간 도메인에서 부호화/복호화하는 복수의 코덱들간의 상호 운용성을 지원하기 위하여 오디오/스피치 신호의 부호화/복호화 시스템에서 상호 운용성을 나타내는 정보인 상호 운용성 표시자를 이용할 필요가 있다.There are various types of codecs for encoding / decoding audio / speech signals in the time domain, and each codec may have different bandwidths or bit rates for performing encoding. As a result, the overall operation of the audio / speech signal encoding / decoding system may vary depending on the kind of the codec for encoding / decoding the audio / speech signal in the time domain. Therefore, in order to support interoperability between a plurality of codecs to be encoded / decoded in the time domain, it is necessary to use an interoperability indicator which is information indicating interoperability in an audio / speech signal encoding / decoding system.

도 2를 참조하면, 상호 운용성 표시자는 시간 도메인에서 부호화/복호화하는 복수의 코덱들간의 상호 운용성을 지원하는지 여부, 오디오/스피치 신호의 부호화 시스템에서 부호화해야 할 핵심 성분인 저주파수 밴드 신호의 대역폭, 및 오디오/스피치 신호의 부호화 시스템에서 사용될 코덱의 종류 중 적어도 하나를 포함할 수 있다. Referring to FIG. 2, the interoperability indicator indicates whether interoperability between a plurality of codecs to be encoded / decoded in the time domain is supported, a bandwidth of a low frequency band signal, which is a key component to be encoded in the audio / And a type of codec to be used in the encoding system of the audio / speech signal.

예를 들어, 상호 운용성 표시자는 5 비트로 구성될 수 있다. 5 비트 중 최상위 비트는 시간 도메인에서 부호화하는 복수의 코덱들간의 상호 운용성을 지원하는 지 여부에 대한 정보를 나타내고, 두 번째 비트는 저주파수 밴드 신호의 대역폭이 협대역(narrowband) 인지 광대역(wideband)인지 여부에 대한 정보를 나타내고, 하위 비트들은 코덱의 종류에 대한 정보를 나타낼 수 있다. 여기서, 도 2에 도시된 상호 운용성 표시자는 일 예에 불과하며, 다양한 구성을 가질 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.For example, the interoperability indicator may comprise 5 bits. The most significant bit among the five bits indicates whether or not interoperability between a plurality of codecs to be encoded in the time domain is supported. The second bit indicates whether the bandwidth of the low frequency band signal is narrowband or wideband And the lower bits may indicate information on the type of the codec. Here, the interoperability indicator shown in FIG. 2 is merely an example, and a person skilled in the art will understand that the present invention can have various configurations.

먼저, 상호 운용성 표시자의 최상위 비트가 '0'인 경우, 복수의 코덱들간의 상호 운용성을 지원하지 않음을 나타내고, 상호 운용성 표시자의 최상위 비트가 '1'인 경우, 복수의 코덱들간의 상호 운용성을 지원함을 나타낸다. First, if the most significant bit of the interoperability indicator is '0', it indicates that interoperability between a plurality of codecs is not supported. If the most significant bit of the interoperability indicator is '1', interoperability between a plurality of codecs Support.

다음으로, 상호 운용성 표시자의 두 번째 비트가 '1'인 경우, 저주파수 밴드 신호는 광대역 코덱을 이용하여 부호화할 수 있음을 나타낸다. 한편, 상호 운용성 표시자의 두 번째 비트가 '0'일 때, 저주파수 밴드 신호는 협대역 코덱을 이용하여 부호화할 수 있음을 나타낸다.Next, when the second bit of the interoperability indicator is '1', it indicates that the low frequency band signal can be encoded using the wideband codec. On the other hand, when the second bit of the interoperability indicator is '0', it indicates that the low frequency band signal can be encoded using the narrowband codec.

마지막으로, 상호 운용성 표시자의 하위 비트들이 '000'인 경우, 멀티 레이트(multi rate) 코덱을 이용할 수 있음을 나타낸다. 또한, 상호 운용성 표시자의 하위 비트들이 '001'인 경우, 가변 레이트(variable rate) 코덱을 이용할 수 있음을 나타낸다. 또한, 상호 운용성 표시자의 하위 비트들이 '010'인 경우, 스케일러블 레이트(scalable) 코덱을 이용할 수 있음을 나타낸다. 그리고, 상호 운용성 표시자의 하위 비트들이 '011'인 경우, 단일 레이트(single rate) 코덱을 이용할 수 있음을 나타낸다. 이 경우, 저주파수 밴드 신호를 광대역 또는 협대역 코덱을 이용하여 부호화할지에 따라 코덱의 종류가 달라질 수 있다. Finally, if the lower bits of the interoperability indicator are '000', it indicates that a multi-rate codec can be used. Also, when the lower bits of the interoperability indicator are '001', it indicates that a variable rate codec can be used. Also, if the lower bits of the interoperability indicator are '010', it indicates that a scalable codec can be used. And, when the lower bits of the interoperability indicator are '011', it indicates that a single rate codec can be used. In this case, the type of the codec may vary according to whether the low-frequency band signal is encoded using the wideband or narrowband codec.

도 3은 본 발명의 일 실시예에 따른 오디오/스피치 신호의 부호화 시스템을 나타내는 블록도이다.3 is a block diagram illustrating an audio / speech signal encoding system according to an embodiment of the present invention.

도 3을 참조하면, 오디오/스피치 신호의 부호화 시스템은 스테레오 부호화부(stereo encoding unit, 310), 다운믹싱부(down-mixing unit, 320), 고주파수 밴드 부호화부(high frequency band encoding unit, 330), 도메인 변환부(domain conversion unit, 340), 모드 결정부(mode deciding unit, 350), 시간 도메인 부호화부(time domain encoding unit, 360), 주파수 도메인 부호화부(frequency domain encoding unit, 370), 및 다중화부(multiplexing unit, 380)를 포함한다.3, the audio / speech signal encoding system includes a stereo encoding unit 310, a down-mixing unit 320, a high frequency band encoding unit 330, A domain conversion unit 340, a mode deciding unit 350, a time domain encoding unit 360, a frequency domain encoding unit 370, And a multiplexing unit (380).

스테레오 부호화부(310)는 입력 신호(IN) 및 상호 운용성 표시자(II)를 수신하고, 수신한 입력 신호(IN)에서 채널 간의 특성 관계를 나타내는 스테레오 파라미터를 추출하여 부호화한다. 여기서, 입력 신호(IN)는 스피치 신호, 오디오 신호, 또는 스피치와 오디오가 혼합된 신호일 수 있다. The stereo encoding unit 310 receives the input signal IN and the interoperability indicator II and extracts and encodes a stereo parameter indicating the characteristic relationship between the channels in the received input signal IN. Here, the input signal IN may be a speech signal, an audio signal, or a mixed signal of speech and audio.

다운믹싱부(320)는 스테레오 부호화부(310)에서 스테레오 파라미터가 추출된 입력 신호를 다운믹싱(down-mixing)하여 모노 신호를 출력한다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화에 할당되는 비트량을 줄일 수 있다. 여기서, 모노 신호는 스테레오 신호를 대표하는 신호일 수 있다. 다시 말해, 부호화단에서 스테레오 신호에 포함된 좌채널 신호 및 우채널 신호 각각을 부호화하지 않고, 대표적으로 모노 신호만을 부호화하여 전송할 수 있다.The downmixing unit 320 down-mixes the input signal from which the stereo parameter is extracted by the stereo encoding unit 310 and outputs a mono signal. Here, downmixing generates a mono signal of one channel from two or more stereo signals, and can reduce the amount of bits allocated to coding through downmixing. Here, the mono signal may be a signal representative of a stereo signal. In other words, only the mono signal can be encoded and transmitted without encoding each of the left channel signal and the right channel signal included in the stereo signal at the encoding end.

고주파수 밴드 부호화부(330)는 상호 운용성 표시자(II)를 참조하여 다운믹 싱부(320)에서 다운믹싱된 모노 신호 중 소정의 주파수 이상에 해당하는 고주파수 밴드 신호에 대한 파라미터를 부호화한다. The high frequency band encoding unit 330 refers to the interoperability indicator II and encodes a parameter for a high frequency band signal corresponding to a predetermined frequency or more of the downmixed mono signals in the downmixing unit 320.

도 4는 도 3에 포함된 고주파수 밴드 부호화부를 상세하게 나타내는 블록도이다. 4 is a block diagram showing in detail the high frequency band encoding unit included in FIG.

이하에서는 도 3 및 4를 참조하여 고주파수 밴드 부호화부의 동작을 살펴보기로 한다. 고주파수 밴드 부호화부(330)는 코어 대역폭 결정부(core bandwidth determining unit, 331), 고주파수 대역폭 결정부(high frequency bandwidth determining unit, 332), 고주파수 밴드 분석부(high frequency band analysis unit, 333), 및 고주파수 밴드 부호화부(high frequency band encoding unit, 334)를 포함한다.Hereinafter, the operation of the high-frequency band encoding unit will be described with reference to FIGS. The high frequency band coding unit 330 includes a core bandwidth determining unit 331, a high frequency bandwidth determining unit 332, a high frequency band analyzing unit 333, And a high frequency band encoding unit 334.

코어 대역폭 결정부(331)는 상호 운용성 표시자(II)를 참조하여 다운믹싱된 모노 신호 중 부호화해야 할 핵심 성분인 저주파수 밴드 신호의 대역폭이 협대역인지 광대역인지 결정한다. 예를 들어, 도 2의 상호 운용성 표시자의 두 번째 비트가 '1'인 경우 저주파수 밴드 신호의 대역폭은 광대역이고, '0'인 경우 저주파수 밴드 신호의 대역폭은 협대역일 수 있다. The core bandwidth determining unit 331 determines whether the bandwidth of the low frequency band signal, which is a core component to be encoded, of the downmixed mono signal is narrow or broadband with reference to the interoperability indicator II. For example, if the second bit of the interoperability indicator of FIG. 2 is '1', the bandwidth of the low frequency band signal is wide, and if it is '0', the bandwidth of the low frequency band signal may be narrow.

고주파수 대역폭 결정부(332)는 코어 대역폭 결정부(331)에서 결정된 저주파수 밴드 대역폭에 따라, 즉, 저주파수 밴드 신호의 부호화에 사용되는 코덱이 광대역 코덱인지 또는 협대역 코덱인지에 따라 고주파수 대역폭을 결정한다. 보다 상세하게는, 다운믹싱된 모노 신호가 20 Hz에서 20 kHz까지인 경우, 저주파수 밴드 신호를 광대역 코덱을 이용하여 부호화할 경우, 예를 들어, 저주파수 밴드 신호의 대 역폭은 6 kHz까지 일 수 있는바, 고주파수 대역폭 결정부(332)는 고주파수 대역폭을 6 kHz부터 20 kHz로 결정한다. 한편, 저주파수 밴드 신호를 협대역 코덱을 이용하여 부호화할 경우, 예를 들어, 저주파수 밴드 신호의 대역폭이 3.4 kHz까지 일 수 있는바, 고주파수 대역폭 결정부(332)는 고주파수 대역폭을 3.4 kHz부터 20 kHz로 결정한다. The high frequency bandwidth determining unit 332 determines the high frequency bandwidth according to the low frequency band bandwidth determined by the core bandwidth determining unit 331, that is, whether the codec used for encoding the low frequency band signal is a wideband codec or a narrowband codec . More specifically, when the downmixed mono signal is from 20 Hz to 20 kHz, when the low frequency band signal is encoded using the wideband codec, for example, the bandwidth of the low frequency band signal may be up to 6 kHz The high frequency bandwidth determining unit 332 determines the high frequency bandwidth from 6 kHz to 20 kHz. For example, when the low-frequency band signal is encoded using the narrow-band codec, the bandwidth of the low-frequency band signal may be up to 3.4 kHz. The high-frequency bandwidth determining unit 332 may determine the high-frequency bandwidth from 3.4 kHz to 20 kHz .

고주파수 밴드 분석부(333)는 고주파수 대역폭 결정부(332)에서 결정된 대역폭에 해당하는 고주파수 밴드를 분석한다.The high frequency band analyzer 333 analyzes a high frequency band corresponding to the bandwidth determined by the high frequency bandwidth determiner 332. [

고주파수 밴드 부호화부(334)는 고주파수 밴드 분석부(333)의 분석 결과를 기초로 고주파수 밴드 신호에 대한 파라미터를 부호화한다. 예를 들어, 고주파수 밴드 부호화부(334)는 고주파수와 저주파수 밴드 사이에 높은 연관성이 존재하는 오디오/스피치 신호의 특성에 기초하여, 고주파수 밴드 성분을 나타내는 파라미터를 부호화할 수 있다. 이로써, 복호화단에서는 부호화된 파라미터 및 저주파수 밴드의 신호를 이용하여 고주파수 밴드의 성분을 추정할 수 있다.The high frequency band encoding unit 334 encodes the parameters for the high frequency band signal based on the analysis result of the high frequency band analyzing unit 333. [ For example, the high-frequency band encoding unit 334 can encode a parameter indicating a high-frequency band component based on the characteristics of the audio / speech signal in which a high correlation exists between the high-frequency and low-frequency bands. As a result, the component of the high frequency band can be estimated by using the coded parameter and the low frequency band signal at the decoding end.

다시 도 3을 참조하면, 도메인 변환부(340)는 다운믹싱부(320)에서 다운믹싱된 신호를 서브 밴드 별로 시간 도메인 및 주파수 도메인 중 어느 하나로 변환한다. 예를 들어, 도메인 변환부(340)는 FV-MLT(Frequency Varying Modulated Lapped Transform)을 수행하여 다운믹싱된 신호를 서브 밴드 별로 시간 도메인 또는 주파수 도메인으로 변환한다. 다시 말해, 도메인 변환부(340)는 모든 주파수 밴드의 신호를 일정하게 시간 도메인 또는 주파수 도메인으로 변환하는 것이 아니라, 모드 결정부(350)의 결정 결과에 따라서 주파수 밴드 별로 시간 도메인 또는 주파수 도 메인으로 변환할 수 있다.Referring back to FIG. 3, the domain converting unit 340 converts the downmixed signal in the downmixing unit 320 into either a time domain or a frequency domain for each subband. For example, the domain converting unit 340 performs Frequency-Variable Modulated Lapped Transform (FV-MLT) to convert the downmixed signal into a time domain or a frequency domain for each subband. In other words, the domain converter 340 does not convert the signals of all the frequency bands to the time domain or the frequency domain constantly, but may also convert the frequency domain bands into the time domain or the frequency domain according to the determination result of the mode determination unit 350 Can be converted.

보다 상세하게는, 도메인 변환부(340)는 변환부(341) 및 역변환부(342)를 포함한다. 변환부(341)는 다운믹싱된 신호를 서브 밴드 별로 주파수 도메인으로 변환한다. 예를 들어, 변환부(341)는 MDCT(Modified Discrete Cosine Transform) 및 MDST(Modified Discrete Sine Transform)를 수행하여 다운믹싱된 신호를 서브 밴드 별로 주파수 도메인으로 변환할 수 있다. 구체적으로, 변환부(341)는 다운믹싱된 신호를 MDCT에 의해 주파수 도메인으로 변환하여 실수부로 표현하고, MDST에 의해 주파수 도메인으로 변환하여 허수부로 표현할 수 있다. 역변환부(342)는 변환부(341)에서 주파수 도메인으로 변환된 신호 중 소정 주파수 밴드의 신호를 시간 도메인으로 역변환한다. 예를 들어, 역변환부(342)는 소정의 주파수 밴드의 신호에 대하여 IMDCT(Inverse MDCT)를 수행하여 소정의 주파수 밴드의 신호를 시간 도메인으로 역변환할 수 있다. 역변환부(342)의 구체적인 동작에 대하여 도 6을 참조하여 후술하기로 한다.More specifically, the domain converting unit 340 includes a converting unit 341 and an inverse transforming unit 342. The transforming unit 341 transforms the downmixed signal into the frequency domain for each subband. For example, the transforming unit 341 may perform a Modified Discrete Cosine Transform (MDCT) and a Modified Discrete Sine Transform (MDST) to convert a downmixed signal into a frequency domain for each subband. Specifically, the transforming unit 341 transforms the downmixed signal into a frequency domain by MDCT, expresses it as a real part, and converts the downmixed signal into a frequency domain by MDST and expresses it as an imaginary part. The inverse transform unit 342 inversely transforms the signal of the predetermined frequency band among the signals converted into the frequency domain by the transform unit 341 into the time domain. For example, the inverse transform unit 342 performs an inverse MDCT (inverse MDCT) on a signal of a predetermined frequency band, and inversely transforms a signal of a predetermined frequency band into a time domain. The specific operation of the inverse transform unit 342 will be described later with reference to Fig.

모드 결정부(350)는 다운믹싱부(320)에서 다운믹싱된 신호를 기 설정된 기준에 따라서 각 서브 밴드에 대하여 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다. 보다 상세하게는, 모드 결정부(350)는 다운믹싱된 신호를 제로 크로싱 레이트(zero crossing rate) 방법, 에너지 측정 방법, 피치 변화량 측정 방법 등을 이용하여 각 서브 밴드에 대하여 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정할 수 있다. The mode determining unit 350 determines whether to downmix the downmixed signal in the time domain or the frequency domain for each subband according to a preset reference. More specifically, the mode deciding section 350 decodes the downmixed signal It is possible to decide whether to perform coding in the time domain or in the frequency domain for each subband by using a zero crossing rate method, an energy measurement method, and a pitch variation measurement method.

도 5은 도 3에 포함된 모드 결정부를 상세하게 나타내는 블록도이다.5 is a block diagram showing in detail the mode determination unit included in FIG.

이하에서는, 도 3 및 5를 참조하여, 모드 결정부의 동작을 상세하게 살펴보기로 한다. 모드 결정부(350)는 상호 운용성 표시자 확인부(Interoperability Indicator Confirming Unit, 351), 신호 분석부(Signal Analysis Unit, 352), 파라미터 추출부(Parameter Extraction Unit, 353), 및 모드 판단부(Mode Determining Unit, 354)를 포함한다.Hereinafter, the operation of the mode determination unit will be described in detail with reference to FIGS. 3 and 5. FIG. The mode determination unit 350 includes an interoperability indicator confirmation unit 351, a signal analysis unit 352, a parameter extraction unit 353, Determining Unit, 354).

상호 운용성 표시자 확인부(351)는 상호 운용성 표시자(II)를 참조하여 다운믹싱된 신호를 시간 도메인에서 부호화할지 여부를 결정한다. 구체적으로, 상호 운용성 표시자 확인부(351)는 상호 운용성 표시자의 확인 결과, 시간 도메인에서의 복수의 스피치 코덱들간의 상호 운용성을 지원하는 경우(예를 들어, 상호 운용성 표시자의 최상위 비트가 '1'의 값을 가질 경우), 다운믹싱된 신호를 시간 도메인에서 부호화할 것으로 결정한다. 따라서, 이 경우 모드 결정부(350)는 다운믹싱된 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호활지 여부를 판단하는 추가적인 과정을 수행하지 않아도 되므로, 복잡도를 낮출 수 있다.The interoperability indicator confirmation unit 351 refers to the interoperability indicator II and determines whether to downmix the signal in the time domain. Concretely, when the interoperability indicator confirmation unit 351 supports interoperability between a plurality of speech codecs in the time domain as a result of the check of the interoperability indicator (for example, when the most significant bit of the interoperability indicator is' 1 '), It decides to encode the downmixed signal in the time domain. Accordingly, in this case, the mode determination unit 350 can reduce the complexity because it does not need to perform the additional process of coding the downmixed signal in the time domain or the code domain in the frequency domain.

한편, 상호 운용성 표시자 확인부(351)가 상호 운용성 표시자를 확인한 결과, 시간 도메인에서의 복수의 스피치 코덱들간의 상호 운용성을 지원하지 않는 경우에는 모드 결정부(350)는 후술된 바와 같이, 신호 분석부(352), 파라미터 추출부(353), 및 모드 판단부(354)를 이용하여 다운믹싱된 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 여부를 결정한다.On the other hand, when the interoperability indicator confirmation unit 351 does not support the interoperability between the plurality of speech codecs in the time domain as a result of checking the interoperability indicator, the mode determination unit 350 determines The demodulator 352, the parameter extractor 353, and the mode determiner 354 to determine whether to downmix the signal in the time domain or the frequency domain.

신호 분석부(352)는 상호 운용성 표시자 확인부(351)의 확인 결과, 시간 도메인에서의 복수의 스피치 코덱들간의 상호 운용성을 지원하지 않을 경우(예를 들 어, 상호 운용성 표시자의 최상위 비트가 '0'의 값을 가질 경우), 다운믹싱된 신호를 분석하고, 분석한 결과를 파라미터 추출부(353)로 제공한다.When the interoperability indicator verification unit 351 confirms that the interoperability between the plurality of speech codecs in the time domain is not supported (for example, the most significant bit of the interoperability indicator is " 0 '), the downmixed signal is analyzed, and the analyzed result is supplied to the parameter extraction unit 353.

파라미터 추출부(353)는 신호 분석부(352)에서 분석한 결과로부터 부호화의 모드를 결정하기 위한 파라미터를 추출한다. 예를 들어, 파라미터 추출부(353)는 신호가 영점을 기준으로 얼마나 위아래로 움직이는 가를 나타내는 비율인 제로 크로싱 레이트(zero crossing rate)를 구하기 위한 파라미터를 추출할 수 있다. 또 다른 예를 들어, 파라미터 추출부(353)는 신호의 에너지 레벨을 구하기 위한 파라미터를 추출할 수 있다. 또 다른 예를 들어, 파라미터 추출부(353)는 신호의 피치 변화량을 구하기 위한 파라미터를 추출할 수 있다. The parameter extracting unit 353 extracts a parameter for determining the encoding mode from the result of the analysis by the signal analyzing unit 352. [ For example, the parameter extracting unit 353 may extract a parameter for obtaining a zero crossing rate, which is a rate indicating how far the signal moves up and down with respect to the zero point. As another example, the parameter extracting unit 353 can extract a parameter for obtaining the energy level of the signal. As another example, the parameter extracting unit 353 can extract a parameter for obtaining the pitch variation of the signal.

모드 판단부(354)는 파라미터 추출부(353)에서 추출된 파라미터를 기초로 다운믹싱된 신호를 시간 도메인에서 부호화할지 주파수 도메인에서 부호화할지 판단한다. The mode determination unit 354 determines whether the downmixed signal is to be encoded in the time domain or in the frequency domain based on the parameters extracted by the parameter extraction unit 353.

예를 들어, 파라미터 추출부(353)에서 제로 크로싱 레이트를 구하기 위한 파라미터를 추출한 경우, 무성음은 제로 크로싱 레이트가 높고, 유성음은 제로 크로싱 레이트가 낮으므로, 모드 판단부(354)는 제로 크로싱 레이트가 높은 경우에는 주파수 도메인에서 부호화하고, 제로 크로싱 레이트가 낮은 경우에는 시간 도메인에서 부호화하도록 결정할 수 있다. For example, when the parameter for obtaining the zero crossing rate is extracted by the parameter extracting unit 353, the mode determining unit 354 determines that the zero crossing rate is high and the zero crossing rate is low because the unvoiced sound has a high zero crossing rate If it is high, it is encoded in the frequency domain. If the zero crossing rate is low, it can be determined to be encoded in the time domain.

또 다른 예를 들어, 파라미터 추출부(353)에서 신호의 에너지 레벨을 구하기 위한 파라미터를 추출한 경우, 무성음은 에너지가 낮고, 유성음은 에너지가 높으므로, 모드 판단부(354)는 신호의 에너지 레벨이 낮은 경우 주파수 도메인에서 부호 화하고, 신호의 에너지 레벨이 높은 경우 시간 도메인에서 부호화하도록 결정할 수 있다. For example, when the parameter extracting unit 353 extracts a parameter for obtaining the energy level of the signal, the mode determiner 354 determines that the energy level of the signal is lower than the energy level of the signal because the unvoiced sound has low energy and the voiced sound has high energy. It can be determined to encode in the frequency domain if it is low and to encode in the time domain if the energy level of the signal is high.

또 다른 예를 들어, 파라미터 추출부(353)에서 신호의 피치 변화량을 구하기 위한 파라미터를 추출한 경우, 무성음은 피치 변화량이 많고, 유성음은 피치 변화량이 적으므로, 모드 판단부(354)는 피치 변화량이 많은 경우 주파수 도메인에서 부호화하고, 피치 변화량이 적은 경우 시간 도메인에서 부호화하도록 결정할 수 있다.For example, when the parameter extracting unit 353 extracts a parameter for obtaining the pitch change amount of the signal, the mode determining unit 354 determines that the pitch change amount is equal to or larger than the pitch change amount because the unvoiced sound has a large pitch change amount and the voiced sound has a small pitch change amount In many cases, it can be determined to encode in the frequency domain and to encode in the time domain if the pitch variation is small.

본 발명의 일 실시예에서는 시간 도메인에서 부호화를 수행하는 스피치 코덱들간의 상호 운용성을 지원하는지 여부에 따라 모드 결정부(350)의 동작을 설명했지만, 본 발명의 다른 실시예에서는 오디오 코덱들간의 상호 운용성을 지원하는지 여부에 따라 모드 결정부(350)의 동작이 달라질 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있을 것이다.The operation of the mode determination unit 350 according to whether or not interoperability between speech codecs to be encoded in the time domain is supported has been described in the embodiment of the present invention. However, in another embodiment of the present invention, Those skilled in the art will appreciate that the operation of the mode determination unit 350 can be changed depending on whether or not the operation support is supported.

다시 도 3을 참조하면, 각 서브 밴드에 대하여 시간 도메인에서 부호화하는 것으로 결정된 경우에는 모드 결정부(350)에서 출력된 서브 밴드의 신호는 역변환부(342)로 출력된다. 또한, 각 서브 밴드에 대하여 주파수 도메인에서 부호화하는 것으로 결정된 경우에는 모드 결정부(350)에서 출력된 서브 밴드의 신호는 주파수 도메인 부호화부(370)로 출력된다.Referring back to FIG. 3, when it is determined that the subband is encoded in the time domain for each subband, the signal of the subband output from the mode determination unit 350 is output to the inverse transform unit 342. In addition, when it is determined to perform encoding in the frequency domain for each subband, the signal of the subband output from the mode determination unit 350 is output to the frequency domain encoding unit 370.

역변환부(342)는 모드 결정부(350)에서 시간 도메인에서 부호화하는 것으로 결정된 소정의 서브 밴드의 신호를 시간 도메인으로 역변환한다. 예를 들어, 역변환부(342)는 소정의 서브 밴드의 신호에 대하여 IMDCT를 수행하여 시간 도메인으로 역변환한다.The inverse transform unit 342 inverse transforms a signal of a predetermined subband determined to be encoded in the time domain into a time domain in the mode determination unit 350. [ For example, the inverse transform unit 342 performs IMDCT on a signal of a predetermined subband to inverse transform the signal into a time domain.

도 6은 도 3에 포함된 역변환부를 상세하게 나타내는 블록도이다.6 is a block diagram showing in detail the inverse transform unit included in FIG.

이하에서는 도 3 및 6을 참조하여, 역변환부의 동작을 구체적으로 살펴보기로 한다. 역변환부(342)는 대역폭 결정부(3421) 및 IMDCT 수행부(3422)를 포함한다.Hereinafter, with reference to FIGS. 3 and 6, the operation of the inverse transform unit will be described in detail. The inverse transform unit 342 includes a bandwidth determining unit 3421 and an IMDCT performing unit 3422.

대역폭 결정부(3421)는 변환부(341)에서 MDCT가 수행된 결과인 MDCT 계수(coefficients), 모드 결정부(350)에서 결정된 결과 및 상호 운용성 표시자(II)를 제공받는다. 보다 상세하게는, 대역폭 결정부(3421)는 모드 결정부(350)에서 시간 도메인에서 부호화할 것으로 결정된 결과를 제공받은 경우, 상호 운용성 표시자(II)를 참조하여 부호화를 수행해야 하는 코어 레이어(core layer)인 저주파수 밴드 신호의 대역폭(bandwidth)을 결정한다. 예를 들어, 대역폭 결정부(3421)는 저주파수 밴드 신호에 대한 부호화를 수행할 코덱이 광대역(wideband) 코덱인지 협대역(narrowband) 코덱인지에 따라 저주파수 밴드 신호의 대역폭을 결정한다.The bandwidth determining unit 3421 receives the MDCT coefficients that are the result of the MDCT performed by the converting unit 341, the result determined by the mode determining unit 350, and the interoperability indicator II. More specifically, when the mode determining unit 350 receives a result determined to be encoded in the time domain, the bandwidth determining unit 3421 determines whether or not the core layer core layer of the low frequency band signal. For example, the bandwidth determining unit 3421 determines the bandwidth of the low frequency band signal according to whether the codec for encoding the low frequency band signal is a wideband codec or a narrowband codec.

IMDCT 수행부(3422)는 변환부(341)에서 MDCT가 수행된 결과인 MDCT 계수 중 대역폭 결정부(3421)에서 결정된 대역폭에 따라 결정된 MDCT 계수에 대하여 IMDCT를 수행하여 시간 도메인으로 역변환한다.The IMDCT performing unit 3422 performs IMDCT on the MDCT coefficients determined according to the bandwidth determined by the bandwidth determining unit 3421 among the MDCT coefficients obtained as a result of the MDCT performed by the converting unit 341, and performs inverse conversion to the time domain.

다시 도 3을 참조하면, 시간 도메인 부호화부(360)는 상호 운용성 표시자(II)를 참조하여 결정된 코덱에서 역변환부(342)에서 시간 도메인으로 역변환된 신호를 시간 도메인에서 부호화한다.Referring back to FIG. 3, the time domain encoding unit 360 encodes a signal that is inversely transformed from the inverse transform unit 342 into a time domain in a time domain in the codec determined by referring to the interoperability indicator II.

도 7은 도 3에 포함된 시간 도메인 부호화부를 상세하게 나타내는 블록도이 다.FIG. 7 is a block diagram showing the time domain encoding unit included in FIG. 3 in detail.

이하에서는 도 2, 3 및 7을 참조하여, 시간 도메인 부호화부의 동작을 구체적으로 살펴보기로 한다. 시간 도메인 부호화부(360)는 기본 시간 도메인 부호화부(361), 광대역 코덱들(362), 협대역 코덱들(363)을 포함한다. 여기서, 도 2의 상호 운용성 표시자의 예를 들어서 시간 도메인 부호화부(360)의 동작을 설명하는 것은 설명의 편의를 위한 것에 불과하고, 상호 운용성 표시자는 다양한 값을 가질 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있다.Hereinafter, with reference to FIGS. 2, 3 and 7, the operation of the time domain encoding unit will be described in detail. The time domain encoding unit 360 includes a basic time domain encoding unit 361, wideband codecs 362, and narrowband codecs 363. Here, the description of the operation of the time domain encoding unit 360, for example, of the interoperability indicator of FIG. 2 is for convenience of explanation only, and the interoperability indicator may have various values. Those skilled in the art will understand.

상호 운용성 표시자가 '0'의 값을 가질 경우에는 다른 코덱들간의 상호 운용성을 지원하지 않을 것을 나타낸다. 이 경우, 시간 도메인 부호화부(360)는 기본 시간 도메인 부호화부(361)에서 부호화를 수행한다.If the interoperability indicator has a value of '0', it indicates that interoperability between different codecs is not supported. In this case, the time domain encoding unit 360 performs encoding in the basic time domain encoding unit 361.

상호 운용성 표시자가 '11~'의 값을 가질 경우에는 다른 코덱들간의 상호 운용성을 지원하고, 저주파수 밴드 신호를 광대역 코덱에서 부호화하는 것을 나타낸다. 이 경우, 시간 도메인 부호화부(360)는 광대역 코덱들(362) 중 하나를 선택할 수 있다. When the interoperability indicator has a value of '11 ~', interoperability between different codecs is supported, and a low-frequency band signal is encoded in a wideband codec. In this case, the time domain encoding unit 360 can select one of the wideband codecs 362.

보다 상세하게는, 상호 운용성 표시자가 '11000'의 값을 가질 경우, 멀티 레이트 코덱(3621)이 선택될 수 있다. 예를 들어, 멀티 레이트 코덱(3621)은 AMR-WB일 수 있고, 역변환부(342)에서 역변환된 신호는 AMR(Adaptive Multi Rate)-WB를 이용하여 부호화할 수 있다.More specifically, when the interoperability indicator has a value of '11000', the multi-rate codec 3621 may be selected. For example, the multi-rate codec 3621 may be AMR-WB, and the signal that is inversely transformed by the inverse transform unit 342 may be encoded using AMR (Adaptive Multi Rate) -WB.

상호 운용성 표시자가 '11001'의 값을 가질 경우, 가변 레이트 코덱(3622)이 선택될 수 있다. 예를 들어, 가변 레이트 코덱(3622)은 EVRC-WB일 수 있고, 역변환부(342)에서 역변환된 신호는 EVRC(Enhanced Variable Rate Codec)-WB를 이용하여 부호화할 수 있다.When the interoperability indicator has a value of '11001', the variable rate codec 3622 may be selected. For example, the variable rate codec 3622 may be EVRC-WB, and the signal that is inversely transformed by the inverse transform unit 342 may be encoded using EVRC (Enhanced Variable Rate Codec) -WB.

상호 운용성 표시자가 '11010'의 값을 가질 경우, 스케일러블 레이트 코덱(3623)이 선택될 수 있다. 예를 들어, 스케일러블 레이트 코덱(3623)은 G.729.1일 수 있고, 역변환부(342)에서 역변환된 신호는 G.729.1을 이용하여 부호화할 수 있다.When the interoperability indicator has a value of " 11010 ", the scalable rate codec 3623 may be selected. For example, the scalable rate codec 3623 may be G.729.1, and the signal inverted by the inverse transforming unit 342 may be encoded using G.729.1.

상호 운용성 표시자가 '11011'의 값을 가질 경우, 단일 레이트 코덱(3624)이 선택될 수 있다. 예를 들어, 단일 레이트 코덱(3624)는 G.722일 수 있고, 역변환부(342)에서 역변환된 신호는 G.722을 이용하여 부호화할 수 있다.If the interoperability indicator has a value of '11011', a single rate codec 3624 may be selected. For example, the single rate codec 3624 may be G.722, and the inverse transformed signal in the inverse transform unit 342 may be coded using G.722.

상호 운용성 표시자가 '10~'의 값을 가질 경우에는 다른 코덱들간의 상호 운용성을 지원하고, 저주파수 밴드 신호를 협대역 코덱에서 부호화하는 것을 나타낸다. 이 경우, 시간 도메인 부호화부(360)는 협대역 코덱들(363) 중 하나를 선택할 수 있다. When the interoperability indicator has a value of '10 ~', interoperability between different codecs is supported, and a low-frequency band signal is encoded in a narrowband codec. In this case, the time domain encoding unit 360 may select one of the narrowband codecs 363.

보다 상세하게는, 상호 운용성 표시자가 '10000'의 값을 가질 경우, 멀티 레이트 코덱(3631)이 선택될 수 있다. 예를 들어, 멀티 레이트 코덱(3631)은 AMR-NB일 수 있고, 역변환부(342)에서 역변환된 신호는 AMR-NB를 이용하여 부호화할 수 있다.More specifically, when the interoperability indicator has a value of '10000', the multi-rate codec 3631 may be selected. For example, the multi-rate codec 3631 may be an AMR-NB, and the signal inversely transformed by the inverse transform unit 342 may be encoded using AMR-NB.

상호 운용성 표시자가 '10001'의 값을 가질 경우, 가변 레이트 코덱(3632)이 선택될 수 있다. 예를 들어, 가변 레이트 코덱(3632)은 EVRC일 수 있고, 역변환 부(342)에서 역변환된 신호는 EVRC를 이용하여 부호화할 수 있다.When the interoperability indicator has a value of " 10001 ", the variable rate codec 3632 may be selected. For example, the variable rate codec 3632 may be EVRC, and the signal inversely transformed by the inverse transform unit 342 may be encoded using EVRC.

상호 운용성 표시자가 '11010'의 값을 가질 경우, 스케일러블 레이트 코덱(3633)이 선택될 수 있다. 예를 들어, 스케일러블 레이트 코덱(3633)은 G.729.1 NB일 수 있고, 역변환부(342)에서 역변환된 신호는 G.729.1 NB을 이용하여 부호화할 수 있다.If the interoperability indicator has a value of " 11010 ", the scalable rate codec 3633 may be selected. For example, the scalable rate codec 3633 may be G.729.1 NB, and the signal inverted by the inverse transforming unit 342 may be encoded using G.729.1 NB.

상호 운용성 표시자가 '11011'의 값을 가질 경우, 단일 레이트 코덱(3634)이 선택될 수 있다. 예를 들어, 단일 레이트 코덱(3634)는 G.729일 수 있고, 역변환부(342)에서 역변환된 신호는 G.729을 이용하여 부호화할 수 있다.If the interoperability indicator has a value of '11011', a single rate codec 3634 may be selected. For example, the single rate codec 3634 may be G.729, and the signal inverted by the inverse transform unit 342 may be encoded using G.729.

다시 도 3을 참조하면, 주파수 도메인 부호화부(370)는 모드 결정부(350)에서 주파수 도메인에서 부호화하는 것으로 결정된 서브 밴드의 신호를 주파수 도메인에서 부호화한다.Referring again to FIG. 3, the frequency domain encoding unit 370 encodes the subband signal determined to be encoded in the frequency domain by the mode determination unit 350 in the frequency domain.

다중화부(380)는 스테레오 부호화부(310)에서 부호화된 스테레오 파라미터, 고주파수 밴드 부호화부(330)에서 부호화된 고주파수 밴드 신호, 시간 도메인 부호화부(360)에서 부호화된 결과, 및 주파수 도메인 부호화부(370)에서 부호화된 결과를 다중화하여 비트스트림의 형태로 출력한다.The multiplexing unit 380 multiplexes the stereo parameters encoded by the stereo encoding unit 310, the high frequency band signal encoded by the high frequency band encoding unit 330, the result encoded by the time domain encoding unit 360, 370) and outputs the multiplexed result in the form of a bit stream.

도 8은 도 3의 다중화부에서 출력되는 비트스트림의 일 예를 나타내는 개념도이다.8 is a conceptual diagram showing an example of a bit stream output from the multiplexing unit of FIG.

도 8을 참조하면, 비트스트림은 블록 단위로 전송되는 제1 헤더 정보(HEADER_1), 프레임 단위로 전송되는 제2 헤더 정보(HEADER_2), 제1 데이터(DATA_1), 및 제2 데이터(DATA_2)를 포함할 수 있다. 여기서, 프레임의 오디오 신호의 처리 단위를 나타내고, 소정의 개수의 프레임은 블록을 구성한다.Referring to FIG. 8, the bitstream includes first header information HEADER_1 transmitted on a block basis, second header information HEADER_2 transmitted on a frame basis, first data DATA_1, and second data DATA_2. . Here, a processing unit of an audio signal of a frame is shown, and a predetermined number of frames constitute a block.

제1 헤더 정보(HEADER_1)는 오디오 신호의 랜덤 액세스(random access)를 제공하기 위해 매 블록마다 전송된다. 예를 들어, 제1 헤더 정보는 채널 정보, 샘플링 주파수, 한 블록에 포함된 프레임의 개수, 랜덤 액세스 가능한 블록인지에 대한 정보, 저작권 정보, 고정 비트레이트(CBR, Constant Bit Rate)인지 가변 비트레이트(Variable Bit Rate)인지를 나타내는 비트스트림 타입 정보 등을 포함할 수 있다. The first header information HEADER_1 is transmitted every block to provide random access of the audio signal. For example, the first header information may include channel information, a sampling frequency, a number of frames included in one block, information on whether the block is a randomly accessible block, copyright information, a constant bit rate (CBR) (Variable Bit Rate), and the like.

제2 헤더 정보(HEADER_2)는 다른 코덱들간의 상호 운용성을 지원하는지 여부를 나타내는 상호 운용성 표시자(Interoperability Indicator), 현재 데이터의 전송률을 나타내는 비트스트림의 길이 정보(Bitstream Length), 시간 도메인에서 부호화되었는지 주파수 도메인에서 부호화되었는지에 대한 정보를 나타내는 모드 정보(Mode Information), 그 외에 필요한 헤더 데이터(others)를 포함할 수 있다.The second header information HEADER_2 includes an interoperability indicator indicating whether or not interoperability between different codecs is supported, a bitstream length indicating a bit rate of a current data transmission rate, Mode information indicating information on whether the data has been encoded in the frequency domain, and header data others necessary.

제1 데이터(DATA_1)는 저주파수 밴드 신호의 부호화에 할당된 N 비트를 나타낸다. 예를 들어, 도 3의 부호화 시스템에서 시간 도메인 부호화부(360) 및 주파수 도메인 부호화부(370)에서 부호화된 결과는 제1 데이터로 비트스트림에 포함될 수 있다. The first data (DATA_1) represents N bits assigned to the encoding of the low frequency band signal. For example, in the encoding system of FIG. 3, the result encoded in the time domain encoding unit 360 and the frequency domain encoding unit 370 may be included in the bitstream as the first data.

제2 데이터(DATA_2)는 스테레오 부호화부나 고주파수 밴드 부호화부와 같은 다른 부호화 툴에 할당된 M 비트를 나타낸다. 예를 들어, 도 3의 부호화 시스템에서 스테레오 부호화부(310) 및 고주파수 밴드 부호화부(320)에서 부호화된 결과는 제2 데이터로 비트스트림에 포함될 수 있다.The second data DATA_2 indicates M bits allocated to another encoding tool such as a stereo encoding unit or a high-frequency band encoding unit. For example, in the encoding system of FIG. 3, a result encoded by the stereo encoding unit 310 and the high-frequency band encoding unit 320 may be included in the bitstream as the second data.

도 9a 내지 9d는 도 8에 도시된 비트스트림에서 프레임 단위로 전송되는 비트스트림의 예들을 나타내는 도면이다.FIGS. 9A to 9D are diagrams showing examples of a bit stream transmitted on a frame-by-frame basis in the bit stream shown in FIG.

도 9a는 기존의 오디오/스피치 신호의 코덱 간의 통신 시 적용되는 비트스트림을 나타낸다. 이 경우, 프레임 단위로 제2 헤더(HEADER_2), 제1 데이터(DATA_1), 및 제2 데이터(DATA_2)를 포함한 비트스트림을 전송할 수 있다. 9A shows a bit stream applied in communication between codecs of an existing audio / speech signal. In this case, a bitstream including the second header HEADER_2, the first data DATA_1, and the second data DATA_2 may be transmitted on a frame-by-frame basis.

도 9b는 기존의 오디오/스피치 신호의 코덱 간의 통신 시 적용되는 상호 운용성을 지원하는 비트스트림을 나타낸다. 이 경우, 프레임 단위로 제2 헤더(HEADER_2), 제1 데이터(DATA_1), 및 제2 데이터(DATA_2)를 포함한 비트스트림을 전송할 수 있다. 이 때, 제1 데이터는 다른 코덱들간의 상호 운용성을 지원하는 정보를 포함한다.9B shows a bitstream supporting interoperability applied in communication between codecs of an existing audio / speech signal. In this case, a bitstream including the second header HEADER_2, the first data DATA_1, and the second data DATA_2 may be transmitted on a frame-by-frame basis. At this time, the first data includes information for supporting interoperability between different codecs.

도 9c는 일반 코덱 간의 통신 시 적용되는 상호 운용성을 지원하는 비트스트림을 나타낸다. 이 경우, 프레임 단위로 제2 헤더(HEADER_2) 및 제1 데이터(DATA_1)를 포함한 비트스트림을 전송할 수 있다. 이 때, 제1 데이터는 다른 코덱들간의 상호 운용성을 지원하는 정보를 포함한다. 또한, 일반 코덱은 스테레오 부호화부나 고주파수 밴드 부호화부와 같은 별도의 툴을 포함하지 않으므로, 제2 데이터를 포함하지 않는다.FIG. 9C shows a bitstream supporting interoperability applied in communication between general codecs. In this case, a bitstream including the second header HEADER_2 and the first data DATA_1 may be transmitted on a frame-by-frame basis. At this time, the first data includes information for supporting interoperability between different codecs. In addition, since the general codec does not include a separate tool such as a stereo encoding unit or a high-frequency band encoding unit, it does not include the second data.

도 9d는 헤더 정보가 필요없는 일반 코덱 간의 통신 시 적용되는 비트스트림을 나타낸다. 이 경우, 제1 데이터(DATA_1)만을 포함한 비트스트림을 전송할 수 있다. 예를 들어, 통신의 대상이 되는 코덱의 종류를 미리 알고 있을 경우, 별도의 헤더 정보를 보내 줄 필요가 없으므로 이 경우에는 제1 데이터만을 포함한 비트스 트림을 전송할 수 있다. 또한, 일반 코덱은 스테레오 부호화부나 고주파수 밴드 부호화부와 같은 별도의 툴을 포함하지 않으므로, 제2 데이터를 포함하지 않는다.FIG. 9D shows a bit stream applied when communicating between general codecs that do not require header information. In this case, a bitstream including only the first data (DATA_1) can be transmitted. For example, if the type of the codec to be communicated is known in advance, it is not necessary to send separate header information. In this case, a bitstream containing only the first data can be transmitted. In addition, since the general codec does not include a separate tool such as a stereo encoding unit or a high-frequency band encoding unit, it does not include the second data.

도 10은 본 발명의 일 실시예에 따른 오디오/스피치 신호의 복호화 시스템을 나타내는 블록도이다.10 is a block diagram illustrating an audio / speech signal decoding system according to an embodiment of the present invention.

도 10을 참조하면, 오디오/스피치 신호의 복호화 시스템은 역다중화부(demultiplexing unit, 1010), 모드 판단부(mode determining unit, 1020), 시간 도메인 복호화부(time domain decoding unit, 1030), 주파수 도메인 복호화부(1040), 도메인 변환부(domain conversion unit, 1050), 고주파수 밴드 복원부(high frequency band reconstructing unit, 1060), 및 스테레오 복원부(stereo reconstructing unit, 1070)를 포함한다.10, a system for decoding an audio / speech signal includes a demultiplexing unit 1010, a mode determining unit 1020, a time domain decoding unit 1030, a frequency domain A decoding unit 1040, a domain conversion unit 1050, a high frequency band reconstructing unit 1060, and a stereo reconstructing unit 1070.

역다중화부(1010)는 부호화단으로부터 전송받은 비트스트림을 역다중화하여 저주파수 밴드의 부호화 결과, 고주파수 밴드 신호에 대한 파라미터의 부호화 결과, 스테레오 파라미터의 부호화 결과, 및 상호 운용성 표시자 등을 출력한다.The demultiplexer 1010 demultiplexes the bit stream received from the encoder and outputs a low frequency band encoding result, a parameter encoding result for a high frequency band signal, a stereo parameter encoding result, and an interoperability indicator.

모드 판단부(1020)는 상호 운용성 표시자(II)를 참조하여 역다중화부(1010)에서 역다중화된 결과로부터 저주파수 밴드의 부호화 결과를 시간 도메인에서 복호화할지 주파수 도메인에서 복호화할지 여부를 판단한다. 보다 상세하게는, 모드 판단부(1020)는 상호 운용성 표시자(II)가 다른 코덱들간의 상호 운용성을 지원하는 것을 나타내는 경우에는 저주파수 밴드의 부호화 결과를 시간 도메인에서 복호화할 것으로 판단한다. 한편, 모드 판단부(1020)는 상호 운용성 표시자(II)가 다른 코덱들간의 상호 운용성을 지원하지 않는 것을 나타내는 경우에는 저주파수 밴드의 부 호화 결과를 시간 도메인에서 복호화할지 주파수 도메인에서 복호화할지 여부를 기존의 방식대로 판단한다.The mode determination unit 1020 refers to the interoperability indicator II and determines whether to decode the low frequency band coding result in the time domain or the frequency domain from the demultiplexed result in the demultiplexing unit 1010. [ More specifically, when the interoperability indicator II indicates that the interoperability indicator II supports interoperability between different codecs, the mode determination unit 1020 determines that the encoding result of the low frequency band is to be decoded in the time domain. On the other hand, when the interoperability indicator II indicates that interoperability between different codecs is not supported, the mode determination unit 1020 determines whether to decode the low frequency band enhancement result in the time domain or the frequency domain We judge it according to the existing method.

시간 도메인 복호화부(1030)는 모드 판단부(1020)에서 시간 도메인에서 복호화할 것으로 판단된 경우, 상호 운용성 표시자(II)를 참조하여 저주파수 밴드의 부호화 결과를 시간 도메인에서 복호화한다. 보다 상세하게는, 시간 도메인 복호화부(1030)는 상호 운용성 표시자(II)를 참조하여 결정된 코덱에서 저주파수 밴드의 부호화 결과를 시간 도메인에서 복호화한다.The time domain decoding unit 1030 decodes the low frequency band coding result in the time domain by referring to the interoperability indicator II when the mode determination unit 1020 decides to decode in the time domain. More specifically, the time domain decoding unit 1030 decodes the low frequency band coding result in the time domain in the codec determined by referring to the interoperability indicator II.

도 11은 도 10에 포함된 시간 도메인 복호화부를 상세하게 나타내는 블록도이다.11 is a block diagram showing in detail the time domain decoding unit included in FIG.

이하에서는 도 2, 10 및 11을 참조하여, 시간 도메인 복호화부의 동작을 구체적으로 살펴보기로 한다. 시간 도메인 복호화부(1030)는 기본 시간 도메인 복호화부(1031), 광대역 코덱들(1032), 협대역 코덱들(1033)을 포함한다. 여기서, 도 2의 상호 운용성 표시자의 예를 들어서 시간 도메인 복호화부(1030)의 동작을 설명하는 것은 설명의 편의를 위한 것에 불과하고, 상호 운용성 표시자는 다양한 값을 가질 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있다.Hereinafter, with reference to FIGS. 2, 10 and 11, the operation of the time domain decoding unit will be described in detail. The time domain decoding unit 1030 includes a basic time domain decoding unit 1031, wideband codecs 1032, and narrowband codecs 1033. Here, it is for convenience of explanation that the operation of the time domain decoding unit 1030 is described as an example of the interoperability indicator of FIG. 2, and the interoperability indicator may have various values. Those skilled in the art will understand.

상호 운용성 표시자가 '0'의 값을 가질 경우에는 다른 코덱들간의 상호 운용성을 지원하지 않을 것을 나타낸다. 이 경우, 시간 도메인 복호화부(1030)는 기본 시간 도메인 복호화부(1031)에서 복호화를 수행한다.If the interoperability indicator has a value of '0', it indicates that interoperability between different codecs is not supported. In this case, the time domain decoding unit 1030 performs decoding in the basic time domain decoding unit 1031. [

상호 운용성 표시자가 '11~'의 값을 가질 경우에는 다른 코덱들간의 상호 운 용성을 지원하고, 저주파수 밴드 신호를 광대역 코덱에서 복호화하는 것을 나타낸다. 이 경우, 시간 도메인 복호화부(1030)는 광대역 코덱들(1032) 중 하나를 선택할 수 있다. When the interoperability indicator has a value of '11 ~', it indicates that interoperability between other codecs is supported, and a low-frequency band signal is decoded from a wideband codec. In this case, the time domain decoding unit 1030 can select one of the wideband codecs 1032.

보다 상세하게는, 상호 운용성 표시자가 '11000'의 값을 가질 경우, 멀티 레이트 코덱(10321)이 선택될 수 있다. 예를 들어, 멀티 레이트 코덱(10321)은 AMR-WB일 수 있고, 모드 판단부(1020)에서 시간 도메인에서 복호화하는 것으로 판단된 신호는 AMR-WB를 이용하여 복호화할 수 있다.More specifically, when the interoperability indicator has a value of '11000', the multi-rate codec 10321 may be selected. For example, the multi-rate codec 10321 may be AMR-WB, and the signal determined to be decoded in the time domain by the mode determination unit 1020 may be decoded using the AMR-WB.

상호 운용성 표시자가 '11001'의 값을 가질 경우, 가변 레이트 코덱(10322)이 선택될 수 있다. 예를 들어, 가변 레이트 코덱(10322)은 EVRC-WB일 수 있고, 모드 판단부(1020)에서 시간 도메인에서 복호화하는 것으로 판단된 신호는 EVRC-WB를 이용하여 복호화할 수 있다.When the interoperability indicator has a value of '11001', the variable rate codec 10322 may be selected. For example, the variable rate codec 10322 may be EVRC-WB, and the signal determined to be decoded in the time domain by the mode determination unit 1020 may be decoded using the EVRC-WB.

상호 운용성 표시자가 '11010'의 값을 가질 경우, 스케일러블 레이트 코덱(10323)이 선택될 수 있다. 예를 들어, 스케일러블 레이트 코덱(10323)은 G.729.1일 수 있고, 모드 판단부(1020)에서 시간 도메인에서 복호화하는 것으로 판단된 신호는 G.729.1을 이용하여 복호화할 수 있다.If the interoperability indicator has a value of " 11010 ", the scalable rate codec 10323 may be selected. For example, the scalable rate codec 10323 may be G.729.1, and the signal determined to be decoded in the time domain by the mode determination unit 1020 may be decoded using G.729.1.

상호 운용성 표시자가 '11011'의 값을 가질 경우, 단일 레이트 코덱(10324)이 선택될 수 있다. 예를 들어, 단일 레이트 코덱(10324)는 G.722일 수 있고, 모드 판단부(1020)에서 시간 도메인에서 복호화하는 것으로 판단된 신호는 G.722을 이용하여 복호화할 수 있다.If the interoperability indicator has a value of '11011', a single rate codec 10324 may be selected. For example, the single rate codec 10324 may be G.722, and the signal determined to be decoded in the time domain by the mode determination unit 1020 may be decoded using G.722.

상호 운용성 표시자가 '10~'의 값을 가질 경우에는 다른 코덱들간의 상호 운 용성을 지원하고, 저주파수 밴드 신호를 협대역 코덱에서 복호화하는 것을 나타낸다. 이 경우, 시간 도메인 복호화부(1030)는 협대역 코덱들(1033) 중 하나를 선택할 수 있다. When the interoperability indicator has a value of '10 ~', it indicates that interoperability between other codecs is supported, and a low-frequency band signal is decoded from a narrowband codec. In this case, the time domain decoding unit 1030 can select one of the narrowband codecs 1033.

보다 상세하게는, 상호 운용성 표시자가 '10000'의 값을 가질 경우, 멀티 레이트 코덱(10331)이 선택될 수 있다. 예를 들어, 멀티 레이트 코덱(10331)은 AMR-NB일 수 있고, 모드 판단부(1020)에서 시간 도메인에서 복호화하는 것으로 판단된 신호는AMR-NB를 이용하여 복호화할 수 있다.More specifically, when the interoperability indicator has a value of '10000', the multi-rate codec 10331 may be selected. For example, the multi-rate codec 10331 may be an AMR-NB, and the signal determined to be decoded in the time domain by the mode determination unit 1020 may be decoded using the AMR-NB.

상호 운용성 표시자가 '10001'의 값을 가질 경우, 가변 레이트 코덱(10332)이 선택될 수 있다. 예를 들어, 가변 레이트 코덱(10332)은 EVRC일 수 있고, 모드 판단부(1020)에서 시간 도메인에서 복호화하는 것으로 판단된 신호는 EVRC를 이용하여 복호화할 수 있다.When the interoperability indicator has a value of '10001', the variable rate codec 10332 may be selected. For example, the variable rate codec 10332 may be an EVRC, and a signal determined to be decoded in the time domain by the mode determination unit 1020 may be decoded using EVRC.

상호 운용성 표시자가 '11010'의 값을 가질 경우, 스케일러블 레이트 코덱(10333)이 선택될 수 있다. 예를 들어, 스케일러블 레이트 코덱(10333)은 G.729.1 NB일 수 있고, 모드 판단부(1020)에서 시간 도메인에서 복호화하는 것으로 판단된 신호는 G.729.1 NB을 이용하여 복호화할 수 있다.If the interoperability indicator has a value of " 11010 ", the scalable rate codec 10333 may be selected. For example, the scalable rate codec 10333 may be G.729.1 NB, and the signal determined to be decoded in the time domain by the mode determination unit 1020 may be decoded using G.729.1 NB.

상호 운용성 표시자가 '11011'의 값을 가질 경우, 단일 레이트 코덱(10334)이 선택될 수 있다. 예를 들어, 단일 레이트 코덱(10334)는 G.729일 수 있고, 모드 판단부(1020)에서 시간 도메인에서 복호화하는 것으로 판단된 신호는 G.729을 이용하여 복호화할 수 있다.If the interoperability indicator has a value of " 11011 ", a single rate codec 10334 may be selected. For example, the single rate codec 10334 may be G.729, and the signal determined to be decoded in the time domain by the mode determination unit 1020 may be decoded using G.729.

다시 도 10을 참조하면, 주파수 도메인 복호화부(1040)은 모드 판단부(1020) 에서 주파수 도메인에서 복호화할 것으로 판단된 신호를 주파수 도메인에서 복호화한다.Referring again to FIG. 10, the frequency domain decoding unit 1040 decodes the signal determined to be decoded in the frequency domain by the mode determination unit 1020 in the frequency domain.

도메인 변환부(1050)는 시간 도메인 복호화부(1030) 및 주파수 도메인 복호화부(1040)에서 복호화된 결과에 대하여 시간 도메인 또는 주파수 도메인으로 변환한다. 예를 들어, 도메인 변환부(1050)는 FV-MLT를 적용하여 시간 도메인 복호화부(1030) 및 주파수 도메인 복호화부(1040)에서 복호화된 결과에 대하여 시간 도메인 또는 주파수 도메인으로 변환한다. 여기서, 도메인 변환부(1050)는 시간 변환부(1051) 및 역변환부(1052)를 포함한다. The domain converter 1050 transforms the result decoded by the time domain decoder 1030 and the frequency domain decoder 1040 into a time domain or a frequency domain. For example, the domain converting unit 1050 applies FV-MLT to convert the result decoded by the time domain decoding unit 1030 and the frequency domain decoding unit 1040 into a time domain or a frequency domain. Here, the domain converting unit 1050 includes a time converting unit 1051 and an inverse transforming unit 1052.

변환부(1051)는 상호 운용성 표시자(II)를 참조하여 시간 도메인 복호화부(1030)에서 복원된 결과를 주파수 도메인으로 변환한다. 예를 들어, 변환부(1051)은 상호 운용성 표시자(II)를 참조하여 시간 도메인 복호화부(1030)에서 복원된 결과에 대하여 MDCT를 수행하여 시간 도메인에서 주파수 도메인으로 변환할 수 있다. 보다 상세하게는, 변환부(1051)는 상호 운용성 표시자(II)를 참조하여 저주파수 밴드 신호의 대역폭에 해당하는 서브 밴드에 대해서 MDCT를 수행한다.The conversion unit 1051 refers to the interoperability indicator II and converts the result reconstructed by the time domain decoding unit 1030 into the frequency domain. For example, the transform unit 1051 can perform MDCT on the result reconstructed by the time domain decoding unit 1030 by referring to the interoperability indicator II, and convert the time domain to the frequency domain. More specifically, the transform unit 1051 performs MDCT on a subband corresponding to the bandwidth of the low frequency band signal with reference to the interoperability indicator II.

역변환부(1052)는 변환부(1051)에서 주파수 도메인으로 변환된 신호 및 주파수 도메인 복호화부(1040)에서 복호화된 결과를 시간 도메인으로 역변환한다. 예를 들어, 역변환부(1052)는 변환부(1051)에서 주파수 도메인으로 변환된 신호 및 주파수 도메인 복호화부(1040)에서 복호화된 결과에 대하여 IMDCT를 수행하여 시간 도메인으로 역변환한다.The inverse transform unit 1052 inversely transforms the signal transformed into the frequency domain by the transform unit 1051 and the result decoded by the frequency domain decoding unit 1040 into the time domain. For example, the inverse transform unit 1052 performs IMDCT on the signal converted into the frequency domain by the transform unit 1051 and the result decoded by the frequency domain decoding unit 1040, and inverse transforms the result into the time domain.

고주파수 밴드 복원부(1060)는 역다중화부(1010)에서 역다중화된 고주파수 밴드 신호에 대한 파라미터의 부호화 결과를 복호화하고, 상호 운용성 표시자(II)를 참조하여 역변환부(1052)에서 시간 도메인으로 역변환된 신호로부터 고주파수 밴드 성분을 추정하여 전대역의 신호를 복원한다. 보다 상세하게는, 고주파수 밴드 복원부(1060)는 신호의 저주파수 밴드와 고주파수 밴드 사이에는 높은 연관성이 존재하는 가정에 기반을 두고, 역변환부(1052)에서 시간 도메인으로 역변환된 신호로부터 고주파수 밴드 성분을 추정한다.The high frequency band decompression unit 1060 decodes the encoding result of the parameter for the demultiplexed high frequency band signal in the demultiplexing unit 1010 and refers to the interoperability indicator II in the inverse transform unit 1052 to the time domain Estimates a high frequency band component from the inversely transformed signal, and restores the signal of the entire band. More specifically, the high frequency band decompression unit 1060 decomposes the high frequency band component from the signal inversely transformed into the time domain in the inverse transform unit 1052 based on the assumption that there is a high correlation between the low frequency band and the high frequency band of the signal .

스테레오 복원부(1070)는 역다중화부(1010)에서 역다중화된 스테레오 파라미터의 부호화 결과를 복호화하고, 복호화된 스테레오 파라미터를 이용하여 고주파수 밴드 복원부(1060)에서 복원된 신호를 업믹싱하여 스테레오 신호를 출력한다. The stereo reconstruction unit 1070 decodes the result of decoding the demultiplexed stereo parameter in the demultiplexing unit 1010 and upmixes the reconstructed signal in the high frequency band reconstruction unit 1060 using the decoded stereo parameter to generate a stereo signal .

도 12는 본 발명의 일 실시예에 따른 오디오/스피치 신호의 부호화 방법을 나타내는 흐름도이다.12 is a flowchart illustrating a method of encoding an audio / speech signal according to an embodiment of the present invention.

도 12을 참조하면, 본 실시예에 오디오/스피치 신호의 부호화 방법은 도 3에 도시된 오디오/스피치 신호의 부호화 시스템에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 3에 도시된 오디오/스피치 신호의 부호화 시스템에 관하여 이상에서 기술된 내용은 본 실시예에 오디오/스피치 신호의 부호화 방법에도 적용된다.Referring to FIG. 12, the method of encoding an audio / speech signal according to the present embodiment is comprised of steps of time-series processing in the audio / speech signal encoding system shown in FIG. Therefore, the contents described above with respect to the audio / speech signal encoding system shown in FIG. 3 are applied to the method of encoding an audio / speech signal in this embodiment, even if omitted below.

1200 단계에서, 모드 결정부(350)는 상호 운용성에 대한 명령이나 요청을 나타내는 상호 운용성 표시자를 확인한다.In step 1200, the mode determination unit 350 identifies an interoperability indicator indicating an instruction or request for interoperability.

1210 단계에서, 모드 결정부(350)는 상호 운용성 표시자가 상호 운용성 모드를 사용하는지 판단한다. 다시 말해, 모드 결정부(350)는 상호 운용성 표시자가 상 호 운용성 모드를 지원하는지 판단한다. 판단 결과, 상호 운용성 표시자가 상호 운용성 모드를 지원하는 경우 1220 단계를 수행하고, 지원하지 않는 경우 1270 단계를 수행한다.In step 1210, the mode determination unit 350 determines whether the interoperability indicator uses the interoperability mode. In other words, the mode determination unit 350 determines whether the interoperability indicator supports the interoperability mode. As a result of the determination, if the interoperability indicator supports the interoperability mode, step 1220 is performed. Otherwise, step 1270 is performed.

1220 단계에서, 모드 결정부(350)는 상호 운용성 표시자가 상호 운용성 모드를 지원하는 경우 부호화 도메인을 시간 도메인으로 설정한다.In step 1220, the mode determination unit 350 sets the encoding domain to the time domain when the interoperability indicator supports the interoperability mode.

1230 단계에서, 상호 운용성 표시자를 확인하여 부호화를 수행할 코덱의 종류를 선택한다. 예를 들어, 광대역 코덱 또는 협대역 코덱을 선택한다.In step 1230, the interoperability indicator is checked and the type of the codec to be encoded is selected. For example, a wideband codec or a narrowband codec is selected.

1240 단계에서, 부호화를 수행할 코어 레이어인 저주파수 밴드 신호의 부호화 대역폭을 선택한다. 예를 들어, 상호 운용성 표시자의 확인 결과, 저주파수 밴드 신호를 광대역 코덱으로 부호화할 경우에는 저주파수 밴드 신호의 부호화 대역폭은 20 Hz에서 6 kHz까지 일 수 있고, 저주파수 밴드 신호를 협대역 코덱으로 부호화할 경우에는 저주파수 밴드 신호의 부호화 대역폭은 20 Hz에서 3.5 kHz까지 일 수 있다.In step 1240, the encoding bandwidth of the low frequency band signal, which is the core layer to be encoded, is selected. For example, when the low frequency band signal is encoded by the wideband codec as a result of the interoperability indicator, the encoding bandwidth of the low frequency band signal may be from 20 Hz to 6 kHz, and when the low frequency band signal is encoded by the narrowband codec The coding bandwidth of the low frequency band signal can be from 20 Hz to 3.5 kHz.

1250 단계에서, 저주파수 밴드 신호의 부호화 대역폭을 기초로 부호화할 고주파수 대역폭을 선택한다. 예를 들어, 상호 운용성 표시자의 확인 결과, 저주파수 밴드 신호를 광대역 코덱으로 부호화할 경우에는 고주파수 대역폭은 6 kHz에서 20 kHz까지 일 수 있고, 저주파수 밴드 신호를 협대역 코덱으로 부호화할 경우에는 고주파수 대역폭은 3.5 kHz에서 20 kHz까지 일 수 있다.In step 1250, a high frequency bandwidth to be encoded is selected based on the coding bandwidth of the low frequency band signal. For example, as a result of checking the interoperability indicator, when a low-frequency band signal is encoded with a wide-band codec, the high-frequency bandwidth may range from 6 kHz to 20 kHz, and when a low- frequency band signal is encoded with a narrow- It can range from 3.5 kHz to 20 kHz.

1260 단계에서, 상호 운용성 표시자에 따라 선택된 코덱을 이용하여 부호화를 수행한다. 예를 들어, 상호 운용성 표시자의 확인 결과, AMR-WB가 선택된 경우 에는 저주파수 밴드 신호를 AMR-WB를 이용하여 부호화를 수행한다.In step 1260, encoding is performed using the codec selected according to the interoperability indicator. For example, if AMR-WB is selected as the result of the interoperability indicator, the low frequency band signal is encoded using AMR-WB.

1270 단계에서, 상호 운용성 표시자가 상호 운용성 모드를 지원하지 않는 경우 종래의 방법에 따른 부호화를 수행한다. 보다 상세하게는, 상호 운용성 표시자가 상호 운용성 모드를 지원하지 않는 경우, 입력된 신호의 특성에 따라 시간 도메인 또는 주파수 도메인에서 부호화된다.In step 1270, if the interoperability indicator does not support the interoperability mode, encoding is performed according to the conventional method. More specifically, when the interoperability indicator does not support the interoperability mode, it is encoded in the time domain or the frequency domain depending on the characteristics of the input signal.

1280 단계에서, 프레임의 끝인지 확인한다. 확인 결과, 모든 프레임에 대한 부호화가 끝난 경우에는 종료되고, 그렇지 않은 경우 다음 프레임에 대한 상호 운용성 모드 지원 여부를 확인하고, 모든 프레임에 대한 부호화가 끝날 때까지 1210 단계부터 1270 단계를 반복한다.In step 1280, it is checked whether the end of the frame is completed. As a result of checking, if all the frames have been encoded, the process is terminated. If not, the interoperability mode is confirmed for the next frame, and steps 1210 to 1270 are repeated until all the frames are encoded.

도 13은 본 발명의 일 실시예에 따른 오디오/스피치 신호의 복호화 방법을 나타내는 흐름도이다.13 is a flowchart illustrating a method of decoding an audio / speech signal according to an embodiment of the present invention.

도 13을 참조하면, 본 실시예에 오디오/스피치 신호의 복호화 방법은 도 10에 도시된 오디오/스피치 신호의 복호화 시스템에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 10에 도시된 오디오/스피치 신호의 복호화 시스템에 관하여 이상에서 기술된 내용은 본 실시예에 오디오/스피치 신호의 복호화 방법에도 적용된다.Referring to FIG. 13, the method for decoding an audio / speech signal in this embodiment is comprised of steps that are processed in a time-series manner in the audio / speech signal decoding system shown in FIG. Therefore, even if omitted below, the above description of the audio / speech signal decoding system shown in FIG. 10 also applies to the method of decoding an audio / speech signal in this embodiment.

1300 단계에서, 모드 판단부(1020)는 상호 운용성 표시자를 확인한다.In step 1300, the mode determination unit 1020 identifies the interoperability indicator.

1310 단계에서, 모드 판단부(1020)는 상호 운용성 표시자가 상호 운용성 모드를 사용하는지 판단한다. 다시 말해, 모드 판단부(1020)는 상호 운용성 표시자가 상호 운용성 모드를 지원하는지 판단한다. 판단 결과, 상호 운용성 표시자가 상호 운용성 모드를 지원하는 경우 1320 단계를 수행하고, 그렇지 않은 경우 1370 단계를 수행한다.In step 1310, the mode determination unit 1020 determines whether the interoperability indicator uses the interoperability mode. In other words, the mode determination unit 1020 determines whether the interoperability indicator supports the interoperability mode. As a result of the determination, if the interoperability indicator supports the interoperability mode, operation 1320 is performed. Otherwise, operation 1370 is performed.

1320 단계에서, 모드 판단부(1020)는 상호 운용성 표시자가 상호 운용성 모드를 지원하는 경우 복호화 도메인을 시간 도메인으로 설정한다.In step 1320, the mode determination unit 1020 sets the decoding domain to the time domain when the interoperability indicator supports the interoperability mode.

1330 단계에서, 상호 운용성 표시자를 확인하여 복호화를 수행할 코덱의 종류를 선택한다. 예를 들어, 광대역 코덱 또는 협대역 코덱을 선택한다.In step 1330, the interoperability indicator is checked and the type of the codec to be decoded is selected. For example, a wideband codec or a narrowband codec is selected.

1340 단계에서, 복호화를 수행할 코어 레이어인 저주파수 밴드 신호의 복호화 대역폭을 선택한다. 예를 들어, 상호 운용성 표시자의 확인 결과, 저주파수 밴드 신호를 광대역 코덱으로 복호화할 경우에는 저주파수 밴드 신호의 복호화 대역폭은 20 Hz에서 6 kHz까지 일 수 있고, 저주파수 밴드 신호를 협대역 코덱으로 복호화할 경우에는 저주파수 밴드 신호의 복호화 대역폭은 20 Hz에서 3.5 kHz까지 일 수 있다.In step 1340, a decoding bandwidth of a low-frequency band signal, which is a core layer to be decoded, is selected. For example, when the low frequency band signal is decoded by the wideband codec as a result of the check of the interoperability indicator, the decoding bandwidth of the low frequency band signal may be from 20 Hz to 6 kHz, and when the low frequency band signal is decoded by the narrowband codec The decoding bandwidth of the low frequency band signal can be from 20 Hz to 3.5 kHz.

1350 단계에서, 저주파수 밴드 신호의 복호화 대역폭을 기초로 부호화할 고주파수 대역폭을 선택한다. 예를 들어, 상호 운용성 표시자의 확인 결과, 저주파수 밴드 신호를 광대역 코덱으로 복호화할 경우에는 고주파수 대역폭은 6 kHz에서 20 kHz까지 일 수 있고, 저주파수 밴드 신호를 협대역 코덱으로 복호화할 경우에는 고주파수 대역폭은 3.5 kHz에서 20 kHz까지 일 수 있다.In step 1350, a high frequency bandwidth to be encoded is selected based on the decoding bandwidth of the low frequency band signal. For example, if the interoperability indicator is verified, the high frequency bandwidth may be from 6 kHz to 20 kHz when decoding the low frequency band signal to the wideband codec, and when the low frequency band signal is decoded by the narrowband codec, It can range from 3.5 kHz to 20 kHz.

1360 단계에서, 상호 운용성 표시자에 따라 선택된 코덱을 이용하여 복호화를 수행한다. 예를 들어, 상호 운용성 표시자의 확인 결과, AMR-WB가 선택된 경우에는 저주파수 밴드 신호를 AMR-WB를 이용하여 복호화를 수행한다.In step 1360, decoding is performed using the codec selected according to the interoperability indicator. For example, if AMR-WB is selected as a result of the interoperability indicator, the low frequency band signal is decoded using AMR-WB.

1370 단계에서, 상호 운용성 표시자가 상호 운용성 모드를 지원하지 않는 경우 종래의 방법에 따른 복호화를 수행한다. 보다 상세하게는, 상호 운용성 표시자가 상호 운용성 모드를 지원하지 않는 경우, 입력된 비트스트림을 확인하여 시간 도메인 또는 주파수 도메인에서 복호화한다.In step 1370, if the interoperability indicator does not support the interoperability mode, decoding is performed according to the conventional method. More specifically, when the interoperability indicator does not support the interoperability mode, the input bitstream is identified and decoded in the time domain or the frequency domain.

1380 단계에서, 프레임의 끝인지 확인한다. 확인 결과, 모든 프레임에 대한 복호화가 끝난 경우에는 종료되고, 그렇지 않은 경우 다음 프레임에 대한 상호 운용성 모드 지원 여부를 확인하고, 모든 프레임에 대한 복호화가 끝날 때까지 1310 단계부터 1370 단계를 반복한다.In step 1380, it is checked whether the end of the frame is completed. If it is determined that all the frames have been decoded, the process ends. Otherwise, it is checked whether the interoperability mode is supported for the next frame, and steps 1310 to 1370 are repeated until decoding of all frames is completed.

도 14는 본 발명의 일 실시예에 따른 상호 운용 가능한 오디오/스피치 신호의 부호화 장치 및 복호화 장치를 포함하는 시스템의 일 예 나타낸다.FIG. 14 shows an example of a system including an apparatus for encoding and decoding an interoperable audio / speech signal according to an embodiment of the present invention.

도 14를 참조하면, 도 14의 시스템은 네트워크 측의 TRAU(Transcoding Rate and Adaptation Unit, 1410), 기지국(base transceiver station, 1420), 및 단말기(mobile station, 1430)를 포함하고, GSM(Global System for Mobile Communication)에서 사용될 수 있다. GSM은 유럽 및 기타 지역에서 광범위하게 사용되는 디지털 이동전화 시스템이다. Referring to FIG. 14, the system of FIG. 14 includes a Transcoding Rate and Adaptation Unit (TRAU) 1420, a base transceiver station 1420, and a mobile station 1430 on the network side. for Mobile Communication). GSM is a digital mobile phone system widely used in Europe and elsewhere.

여기서, 다운링크는 기지국(1420)에서 단말기(1430)로의 전송 경로로서 도 14에서 점선 화살표로 표시되었고, 업링크는 단말기(1430)에서 기지국(1420) 방향으로의 전송 경로로서 도 14에서 실선 화살표로 표시되었다. Here, the downlink is indicated by a dashed arrow in Fig. 14 as a transmission path from the base station 1420 to the terminal 1430, and the uplink is indicated by a solid line arrow in Fig. 14 as a transmission path from the terminal 1430 to the base station 1420, Respectively.

인터오퍼러블 스피치 부호화부(Interoperable Speech Encoding Unit, ISPE)는 본 발명의 일 실시예에 따른 상호 운용성을 지원하는 스피치 신호의 부호화부이 다. 또한, 인터오퍼러블 스피치 복호화부(Interoperable Speech Decoding Unit, ISPD)는 본 발명의 일 실시예에 다른 상호 운용성을 지원하는 스피치 신호의 복호화부이다.An Interoperable Speech Encoding Unit (ISPE) is a speech signal encoding unit that supports interoperability according to an embodiment of the present invention. In addition, an interoperable speech decoding unit (ISPD) is a decoding unit of a speech signal supporting interoperability according to an embodiment of the present invention.

본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상 내에서 당업자에 의한 변형이 가능함은 물론이다.It is needless to say that the present invention is not limited to the above-described embodiments, and can be modified by those skilled in the art within the scope of the present invention.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.The present invention can also be embodied as computer-readable codes on a computer-readable recording medium. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, hard disk, floppy disk, flash memory, optical data storage, And the like. The computer readable recording medium may also be distributed over a networked computer system and stored and executed as computer readable code in a distributed manner.

도 1은 본 발명의 일 실시예에 따른 상호 운용 가능한 코덱을 개략적으로 나타내는 개념도이다.1 is a conceptual diagram schematically showing an interoperable codec according to an embodiment of the present invention.

도 2는 본 발명의 일 실시예에 따른 상호 운용성 표시자의 일 예를 나타낸다.FIG. 2 illustrates an example of an interoperability indicator according to an embodiment of the present invention.

도 3은 본 발명의 일 실시예에 따른 오디오/스피치 신호의 부호화 시스템을 나타내는 블록도이다.3 is a block diagram illustrating an audio / speech signal encoding system according to an embodiment of the present invention.

도 4는 도 3에 포함된 고주파수 밴드 부호화부를 상세하게 나타내는 블록도이다. 4 is a block diagram showing in detail the high frequency band encoding unit included in FIG.

도 5은 도 3에 포함된 모드 결정부를 상세하게 나타내는 블록도이다.5 is a block diagram showing in detail the mode determination unit included in FIG.

도 6은 도 3에 포함된 역변환부를 상세하게 나타내는 블록도이다.6 is a block diagram showing in detail the inverse transform unit included in FIG.

도 7은 도 3에 포함된 시간 도메인 부호화부를 상세하게 나타내는 블록도이다.FIG. 7 is a block diagram illustrating a time domain encoding unit included in FIG. 3 in detail.

도 8은 도 3의 다중화부에서 출력되는 비트스트림의 일 예를 나타내는 개념도이다.8 is a conceptual diagram showing an example of a bit stream output from the multiplexing unit of FIG.

도 9a 내지 9d는 도 8에 도시된 비트스트림에서 프레임 단위로 전송되는 비트스트림의 예들을 나타내는 도면이다.FIGS. 9A to 9D are diagrams showing examples of a bit stream transmitted on a frame-by-frame basis in the bit stream shown in FIG.

도 10은 본 발명의 일 실시예에 따른 오디오/스피치 신호의 복호화 시스템을 나타내는 블록도이다.10 is a block diagram illustrating an audio / speech signal decoding system according to an embodiment of the present invention.

도 11은 도 10에 포함된 시간 도메인 복호화부를 상세하게 나타내는 블록도 이다.11 is a block diagram showing in detail the time domain decoding unit included in FIG.

도 12는 본 발명의 일 실시예에 따른 오디오/스피치 신호의 부호화 방법을 나타내는 흐름도이다.12 is a flowchart illustrating a method of encoding an audio / speech signal according to an embodiment of the present invention.

도 13은 본 발명의 일 실시예에 따른 오디오/스피치 신호의 복호화 방법을 나타내는 흐름도이다.13 is a flowchart illustrating a method of decoding an audio / speech signal according to an embodiment of the present invention.

도 14는 본 발명의 일 실시예에 따른 상호 운용 가능한 오디오/스피치 신호의 부호화 장치 및 복호화 장치를 포함하는 시스템의 일 예 나타낸다.FIG. 14 shows an example of a system including an apparatus for encoding and decoding an interoperable audio / speech signal according to an embodiment of the present invention.

Claims (24)

복수 개의 코덱들간의 상호 운용성(interoperability)을 나타내는 정보를 기초로 신호를 부호화할 도메인을 결정하는 단계; 및Determining a domain to encode a signal based on information indicating interoperability between the plurality of codecs; And 상기 정보를 기초로 상기 결정된 도메인에서 상기 신호를 부호화하는 단계를 포함하며,And encoding the signal in the determined domain based on the information, 상기 부호화하는 단계는 상기 결정된 도메인에서 상기 정보에 포함된 대역폭의 크기와 코덱의 종류에 근거하여 상기 신호를 부호화하는 것을 특징으로 하는 신호의 부호화 방법.Wherein the encoding step encodes the signal based on a size of a bandwidth included in the information and a codec type in the determined domain. 제1항에 있어서,The method according to claim 1, 상기 정보를 기초로 상기 신호를 서브 밴드 별로 시간 도메인 및 주파수 도메인 중 어느 하나로 변환하는 단계를 더 포함하고,Further comprising the step of converting the signal into one of a time domain and a frequency domain on a subband basis, based on the information, 상기 도메인을 결정하는 단계는 각 서브 밴드의 신호를 부호화할 도메인을 결정하는 것을 특징으로 하는 신호의 부호화 방법.Wherein the step of determining the domain determines a domain to which a signal of each subband is to be encoded. 제2항에 있어서,3. The method of claim 2, 상기 정보를 기초로 상기 신호를 서브 밴드 별로 시간 도메인 및 주파수 도메인 중 어느 하나로 변환하는 단계는 The step of converting the signal into one of a time domain and a frequency domain on a subband basis based on the information 상기 정보에 포함된 시간 도메인에서 부호화할 대역폭의 크기에 따라 선택된 서브 밴드를 시간 도메인으로 역변환하는 것을 특징으로 하는 신호의 부호화 방법.Wherein a subband selected in accordance with a size of a bandwidth to be encoded in a time domain included in the information is inversely transformed into a time domain. 제2항에 있어서,3. The method of claim 2, 상기 도메인을 결정하는 단계는The step of determining the domain 상기 정보가 상기 복수 개의 코덱들간의 상호 운용성을 지원하는 것을 나타내는 경우에는 각 서브 밴드의 신호를 시간 도메인에서 부호화할 것으로 결정하는 것을 특징으로 하는 신호의 부호화 방법.Wherein when the information indicates that interoperability between the plurality of codecs is supported, it is determined to encode signals of the respective subbands in the time domain. 제2항에 있어서,3. The method of claim 2, 상기 신호를 부호화하는 단계는The step of encoding the signal 시간 도메인에서 부호화하는 것으로 결정된 서브 밴드의 신호를 상기 정보가 나타내는 코덱을 이용하여 시간 도메인에서 부호화하는 단계; 및Encoding a signal of a subband determined to be encoded in a time domain in a time domain using a codec indicating the information; And 주파수 도메인에서 부호화하는 것으로 결정된 서브 밴드의 신호를 주파수 도메인에서 부호화하는 단계를 포함하는 것을 특징으로 하는 신호의 부호화 방법.And encoding the signal of the subband determined to be encoded in the frequency domain in the frequency domain. 제5항에 있어서,6. The method of claim 5, 상기 신호의 채널 간의 특성 관계를 나타내는 스테레오 파라미터를 추출하여 부호화하는 단계; 및Extracting and encoding a stereo parameter indicating a characteristic relationship between channels of the signal; And 상기 스테레오 파라미터가 추출된 신호를 다운믹싱하여 모노 신호를 출력하는 단계를 더 포함하고,Further comprising the step of downmixing the extracted signal to output a mono signal, 상기 정보를 기초로 상기 신호를 서브 밴드 별로 시간 도메인 및 주파수 도메인 중 하나로 변환하는 단계는And converting the signal into one of a time domain and a frequency domain on a subband basis based on the information 상기 정보를 기초로 상기 다운믹싱된 모노 신호를 서브 밴드 별로 시간 도메 인 또는 주파수 도메인으로 변환하는 것을 특징으로 하는 신호의 부호화 방법.And converting the downmixed mono signal into a time domain or a frequency domain for each subband based on the information. 제6항에 있어서,The method according to claim 6, 상기 다운믹싱된 모노 신호에서 상기 정보를 기초로 대역폭이 결정된 소정의 주파수 이상의 고주파수 밴드 신호에 대한 파라미터를 부호화하는 단계를 더 포함하는 것을 특징으로 하는 신호의 부호화 방법.Further comprising the step of encoding a parameter for a high frequency band signal having a bandwidth determined based on the information in the downmixed mono signal. 제5항에 있어서,6. The method of claim 5, 매 프레임마다 상기 정보, 및 상기 시간 도메인에서 부호화된 결과 또는 상기 주파수 도메인에서 부호화된 결과를 비트스트림의 형태로 출력하는 단계를 더 포함하는 것을 특징으로 하는 신호의 부호화 방법.Further comprising the step of outputting the information and the result encoded in the time domain or the result encoded in the frequency domain in the form of a bit stream every frame. 복수 개의 코덱들간의 상호 운용성(interoperability)을 나타내는 정보를 기초로 신호를 부호화할 도메인을 결정하는 단계; 및Determining a domain to encode a signal based on information indicating interoperability between the plurality of codecs; And 상기 정보를 기초로 상기 결정된 도메인에서 상기 신호를 부호화하는 단계를 포함하며,And encoding the signal in the determined domain based on the information, 상기 부호화하는 단계는 상기 결정된 도메인에서 상기 정보에 포함된 대역폭의 크기와 코덱의 종류에 근거하여 상기 신호를 부호화하는 것을 특징으로 하는 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.Wherein the encoding step comprises encoding the signal on the basis of a bandwidth size included in the information and a codec type in the determined domain. media. 신호의 부호화 결과에 포함된 복수 개의 코덱들간의 상호 운용성을 나타내는 정보를 기초로 상기 신호의 부호화 결과를 복호화할 도메인을 판단하는 단계; 및Determining a domain in which a result of encoding the signal is to be decoded based on information indicating interoperability between a plurality of codecs included in an encoding result of the signal; And 상기 정보를 기초로 상기 판단된 도메인에서 상기 신호의 부호화 결과를 복호화하는 단계를 포함하며,And decoding the encoding result of the signal in the determined domain based on the information, 상기 복호화하는 단계는 상기 판단된 도메인에서 상기 정보에 포함된 대역폭의 크기와 코덱의 종류에 근거하여 상기 신호의 부호화결과를 복호화하는 것을 특징으로 하는 신호의 복호화 방법.Wherein the decoding step decodes the encoded result of the signal based on the size of the bandwidth included in the information and the type of the codec in the determined domain. 제10항에 있어서,11. The method of claim 10, 상기 도메인을 판단하는 단계는The step of determining the domain 상기 정보가 상기 복수 개의 코덱들간의 상호 운용성을 지원하는 것을 나타내는 경우에는 상기 신호의 부호화 결과를 시간 도메인에서 복호화할 것으로 판단하는 것을 특징으로 하는 신호의 복호화 방법.And when the information indicates interoperability between the plurality of codecs, decides to decode the encoded result of the signal in the time domain. 제10항에 있어서,11. The method of claim 10, 상기 신호의 부호화 결과를 복호화하는 단계는The step of decoding the encoding result of the signal 시간 도메인에서 복호화하는 것으로 판단된 경우 상기 정보가 나타내는 코덱을 이용하여 상기 신호의 부호화 결과를 시간 도메인에서 복호화함으로써 시간 도메인의 신호를 복원하는 단계; 및Reconstructing a signal in the time domain by decoding the encoded result of the signal in the time domain using the codec indicated by the information if it is determined to decode in the time domain; And 주파수 도메인에서 복호화하는 것으로 판단된 경우 상기 신호의 부호화 결과를 주파수 도메인에서 복호화함으로써 주파수 도메인의 신호를 복원하는 단계를 포함하는 것을 특징으로 하는 신호의 복호화 방법.And decoding the frequency domain signal by decoding the encoded signal in the frequency domain if it is determined to decode the signal in the frequency domain. 제12항에 있어서,13. The method of claim 12, 상기 정보를 기초로 상기 복원된 시간 도메인 및 주파수 도메인의 신호를 합 성하여 시간 도메인으로 변환하는 단계를 포함하는 것을 특징으로 하는 신호의 복호화 방법.And combining the recovered time domain and frequency domain signals into a time domain based on the information. 제13항에 있어서,14. The method of claim 13, 상기 정보를 기초로 상기 복원된 시간 도메인 및 주파수 도메인의 신호를 합성하여 시간 도메인으로 변환하는 단계는The step of synthesizing the reconstructed time domain and frequency domain signals into the time domain based on the information 상기 정보에 포함된 시간 도메인에서 복호화할 대역폭의 크기에 따라 선택된 서브 밴드를 주파수 도메인으로 변환하는 단계; 및Converting a selected subband into a frequency domain according to a size of a bandwidth to be decoded in a time domain included in the information; And 상기 시간 도메인의 신호 및 상기 주파수 도메인의 신호를 합성하여 시간 도메인으로 역변환하는 단계를 포함하는 것을 특징으로 하는 신호의 복호화 방법.And combining the signal of the time domain and the signal of the frequency domain to inverse transform the signal into a time domain. 제13항에 있어서,14. The method of claim 13, 상기 신호의 부호화 결과에 포함된 고주파수 밴드 파라미터를 상기 정보를 기초로 복호화하고, 복호화된 파라미터 및 상기 시간 도메인으로 변환된 신호를 이용하여 전대역의 신호를 복원하는 단계를 더 포함하는 것을 특징으로 하는 신호의 복호화 방법.Decoding the high frequency band parameter included in the encoding result of the signal based on the information and restoring the signal of the full band using the decoded parameter and the signal converted into the time domain, / RTI > 제15항에 있어서,16. The method of claim 15, 상기 신호의 부호화 결과에 포함된 스테레오 파라미터를 복호화하고, 상기 복호화된 스테레오 파라미터를 이용하여 상기 복원된 전대역의 신호로부터 스테레 오 신호를 복원하는 단계를 더 포함하는 것을 특징으로 하는 신호의 복호화 방법.Decoding the stereo parameter included in the encoding result of the signal and reconstructing the stereo signal from the restored full-band signal using the decoded stereo parameter. 신호의 부호화 결과에 포함된 복수 개의 코덱들간의 상호 운용성을 나타내는 정보를 기초로 상기 신호의 부호화 결과를 복호화할 도메인을 판단하는 단계; 및Determining a domain in which a result of encoding the signal is to be decoded based on information indicating interoperability between a plurality of codecs included in an encoding result of the signal; And 상기 정보를 기초로 상기 판단된 도메인에서 상기 신호의 부호화 결과를 복호화하는 단계를 포함하고,And decoding the encoding result of the signal in the determined domain based on the information, 상기 복호화하는 단계는 상기 판단된 도메인에서 상기 정보에 포함된 대역폭의 크기와 코덱의 종류에 근거하여 상기 신호의 부호화결과를 복호화하는 것을 특징으로 하는 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.Wherein the decoding step decodes the encoded result of the signal based on the size of the bandwidth included in the information and the type of the codec in the determined domain. Readable recording medium. 복수 개의 코덱들간의 상호 운용성(interoperability)을 나타내는 정보를 기초로 신호를 서브 밴드 별로 시간 도메인 중 주파수 도메인 중 어느 하나로 변환하는 도메인 변환부;A domain converter for converting a signal into one of frequency domains of a time domain on a per-subband basis based on information indicating interoperability between a plurality of codecs; 상기 정보를 기초로 각 서브 밴드의 신호를 부호화할 도메인을 결정하는 모드 결정부;A mode determining unit for determining a domain to which a signal of each subband is to be encoded based on the information; 시간 도메인에서 부호화하는 것으로 결정된 서브 밴드의 신호를 상기 정보가 나타내는 코덱을 이용하여 시간 도메인에서 부호화하는 시간 도메인 부호화부; 및A time domain encoding unit for encoding a signal of a subband determined to be encoded in a time domain in a time domain using a codec indicating the information; And 주파수 도메인에서 부호화하는 것으로 결정된 서브 밴드의 신호를 주파수 도메인에서 부호화하는 주파수 도메인 부호화부를 포함하는 것을 특징으로 하는 신호의 부호화 시스템.And a frequency domain encoding unit for encoding the signal of the subband determined to be encoded in the frequency domain in the frequency domain. 제18항에 있어서,19. The method of claim 18, 상기 정보는 상기 복수 개의 코덱들간의 상호 운용성을 지원하는지 여부, 상기 시간 도메인에서 부호화할 대역폭의 크기, 및 상기 코덱의 종류 중 적어도 하나를 포함하는 것을 특징으로 하는 신호의 부호화 시스템.Wherein the information includes at least one of whether to support interoperability between the plurality of codecs, a bandwidth size to be encoded in the time domain, and a type of the codec. 제18항에 있어서,19. The method of claim 18, 상기 신호의 채널 간의 특성 관계를 나타내는 스테레오 파라미터를 추출하여 부호화하는 스테레오 부호화부; 및A stereo encoding unit for extracting and encoding a stereo parameter indicating a characteristic relationship between channels of the signal; And 상기 스테레오 파라미터가 추출된 신호를 다운믹싱하여 모노 신호를 출력하는 다운믹싱부를 더 포함하고,Further comprising a downmixing unit for downmixing the extracted signal to output a mono signal, 상기 도메인 변환부는 상기 정보를 기초로 상기 다운믹싱된 모노 신호를 서브 밴드 별로 시간 도메인 또는 주파수 도메인으로 변환하는 것을 특징으로 하는 신호의 부호화 시스템.Wherein the domain converter converts the downmixed mono signal into a time domain or a frequency domain for each subband based on the information. 제20항에 있어서,21. The method of claim 20, 상기 다운믹싱된 모노 신호에서 상기 정보를 기초로 대역폭이 결정된 소정의 주파수 이상의 고주파수 밴드 신호에 대한 파라미터를 부호화하는 고주파수 밴드 부호화부를 더 포함하는 것을 특징으로 하는 신호의 부호화 시스템.Further comprising a high frequency band encoding unit for encoding a parameter for a high frequency band signal having a bandwidth determined based on the information in the downmixed mono signal. 신호의 부호화 결과에 포함된 복수 개의 코덱들간의 상호 운용성을 나타내는 정보를 기초로 상기 신호의 부호화 결과를 복호화할 도메인을 판단하는 모드 판단 부;A mode determination unit for determining a domain to be decoded based on information indicating interoperability between a plurality of codecs included in a signal encoding result; 시간 도메인에서 복호화하는 것으로 판단된 경우 상기 정보가 나타내는 코덱을 이용하여 상기 신호의 부호화 결과를 시간 도메인에서 복호화함으로써 시간 도메인의 신호를 복원하는 시간 도메인 복호화부;A time domain decoding unit for decoding a time domain signal by decoding the encoded result of the signal in the time domain using a codec indicated by the information when it is determined to decode in the time domain; 주파수 도메인에서 복호화하는 것으로 판단된 경우 상기 신호의 부호화 결과를 주파수 도메인에서 복호화함으로써 주파수 도메인의 신호를 복원하는 주파수 도메인 복호화부; 및A frequency domain decoding unit for decoding the frequency domain signal by decoding the encoded signal in the frequency domain if it is determined to decode the signal in the frequency domain; And 상기 정보를 기초로 상기 복원된 시간 도메인의 신호 및 상기 복원된 주파수 도메인의 신호를 합성하여 시간 도메인으로 변환하는 도메인 변환부를 포함하는 것을 특징으로 하는 신호의 복호화 시스템.And a domain converter for combining the recovered time domain signal and the recovered frequency domain signal into a time domain based on the information. 제22항에 있어서,23. The method of claim 22, 상기 신호의 부호화 결과에 포함된 고주파수 밴드 파라미터를 복호화하고, 상기 복호화된 파라미터 및 상기 시간 도메인으로 변환된 신호를 이용하여 전대역의 신호를 복원하는 고주파수 밴드 복원부를 더 포함하는 것을 특징으로 하는 신호의 복호화 시스템.And a high frequency band decompression unit decoding the high frequency band parameter contained in the result of encoding the signal and restoring a signal of the full band using the decoded parameter and the signal converted into the time domain. system. 제23항에 있어서,24. The method of claim 23, 상기 신호의 부호화 결과에 포함된 스테레오 파라미터를 복호화하고, 상기 복호화된 스테레오 파라미터를 이용하여 상기 복원된 전대역의 신호로부터 스테레 오 신호를 복원하는 스테레오 복원부를 더 포함하는 것을 특징으로 하는 신호의 복호화 시스템.Further comprising a stereo reconstruction unit for reconstructing a stereo signal included in a result of encoding the signal and reconstructing a stereo signal from the restored full-band signal using the decoded stereo parameter, .
KR1020070109154A 2007-10-29 2007-10-29 Method and System to Encode/Decode Audio/Speech Signal for Supporting Interoperability KR101455648B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070109154A KR101455648B1 (en) 2007-10-29 2007-10-29 Method and System to Encode/Decode Audio/Speech Signal for Supporting Interoperability

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070109154A KR101455648B1 (en) 2007-10-29 2007-10-29 Method and System to Encode/Decode Audio/Speech Signal for Supporting Interoperability

Publications (2)

Publication Number Publication Date
KR20090043352A KR20090043352A (en) 2009-05-06
KR101455648B1 true KR101455648B1 (en) 2014-10-30

Family

ID=40854207

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070109154A KR101455648B1 (en) 2007-10-29 2007-10-29 Method and System to Encode/Decode Audio/Speech Signal for Supporting Interoperability

Country Status (1)

Country Link
KR (1) KR101455648B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100647336B1 (en) * 2005-11-08 2006-11-23 삼성전자주식회사 Apparatus and method for adaptive time/frequency-based encoding/decoding
KR20070077652A (en) * 2006-01-24 2007-07-27 삼성전자주식회사 Apparatus for deciding adaptive time/frequency-based encoding mode and method of deciding encoding mode for the same

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100647336B1 (en) * 2005-11-08 2006-11-23 삼성전자주식회사 Apparatus and method for adaptive time/frequency-based encoding/decoding
KR20070077652A (en) * 2006-01-24 2007-07-27 삼성전자주식회사 Apparatus for deciding adaptive time/frequency-based encoding mode and method of deciding encoding mode for the same

Also Published As

Publication number Publication date
KR20090043352A (en) 2009-05-06

Similar Documents

Publication Publication Date Title
KR101435893B1 (en) Method and apparatus for encoding and decoding audio signal using band width extension technique and stereo encoding technique
CN105957532B (en) Method and apparatus for encoding and decoding audio/speech signal
KR20100087661A (en) Method of coding/decoding audio signal and apparatus for enabling the method
AU2019212843B2 (en) Backward-compatible integration of high frequency reconstruction techniques for audio signals
KR102560473B1 (en) Integration of high frequency reconstruction techniques with reduced post-processing delay
US11621013B2 (en) Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals
KR101455648B1 (en) Method and System to Encode/Decode Audio/Speech Signal for Supporting Interoperability
EP3518233A1 (en) Backward-compatible integration of high frequency reconstruction techniques for audio signals
JP2021522543A (en) Integration of high frequency reconstruction technology with post-processing delay reduction

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
B701 Decision to grant
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee