KR20080066537A - 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 - Google Patents

부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 Download PDF

Info

Publication number
KR20080066537A
KR20080066537A KR1020070104672A KR20070104672A KR20080066537A KR 20080066537 A KR20080066537 A KR 20080066537A KR 1020070104672 A KR1020070104672 A KR 1020070104672A KR 20070104672 A KR20070104672 A KR 20070104672A KR 20080066537 A KR20080066537 A KR 20080066537A
Authority
KR
South Korea
Prior art keywords
additional information
audio signal
information
bitstream
layer
Prior art date
Application number
KR1020070104672A
Other languages
English (en)
Inventor
전상배
성굉모
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20080066537A publication Critical patent/KR20080066537A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Abstract

본 발명에 의한 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및 장치에 의하면 오디오 신호와 함께 부가정보의 비트율을 조정할 수 있다. 따라서 재생하고자 하는 음질이나 전송환경에 따른 신호처리의 유연성을 증가시킬 수 있다. 또한 오디오 신호의 비트율에 따라 부가정보의 비트율도 결정할 수 있어 재생하고자 하는 음질의 정밀한 제어가 가능하다.
오디오신호, 부가정보, 압축, 코덱, 채널 확장 오디오 코덱, 밴드 확장 오디오 코덱

Description

부가정보를 가지는 오디오신호의 부호화/복호화 방법 및 장치 {Encoding/Decoding an Audio Signal with a Side Information}
도 1은 본 발명의 일실시예에 의한 오디오신호 부호화 장치의 구성이 도시된 블록도,
도 2는 도 1의 인코더의 내부구성이 도시된 블록도,
도 3은 도 1의 가변비트율 산출부의 내부구성이 도시된 블록도,
도 4는 본 발명의 일실시예에 따라 분할된 부가정보의 계층구조가 도시된 도,
도 5는 본 발명의 일실시예에 의한 오디오신호 복호화 장치의 구성이 도시된 도,
도 6는 도 5의 부가정보 복호화부의 내부구성이 도시된 블록도이다.
본 발명은 신호의 부호화/복호화 방법에 관한 것으로, 더욱 상세하게는 부가정보를 가지는 오디오신호를 효율적으로 부호화/복호화하는 방법 및 장치에 관한 것이다.
일반적으로 사용되거나 개발중인 오디오 부호화 기술에 있어 밴드별 유사성이나 채널별 유사성을 이용하여 오디오신호 복호화 시 밴드 또는 채널을 확장할 수 있는 압축 기술이 사용되고 있다. 이 경우, 확장되는 영역의 신호는 참조가 되는 오디오신호와 그 확장에 필요한 부가정보에 의해 복호화된다.
이때, 참조되는 오디오신호는 적어도 2개의 계층으로 이루어진 오디오데이터를 형태로 전송됨이 일반적이다. 상기 계층의 구조나 갯수는 비트스트림의 전송률이나 요구음질에 따라 가변된다. 상기 계층의 구조나 갯수는 또한 오디오신호의 이코딩 형태에 따라 결정된다.
그러나 확장되는 영역의 신호의 복호에 필요한 부가정보는 계층을 분할하지 않는다. 따라서, 신호 처리의 유연성에 한계가 있다.
본 발명은 부가정보를 통해 오디오신호를 복호화하는 경우, 부가정보의 비트율을 가변시킬 수 있어 전송환경이나 요구 음질에 따라 신호 처리의 유연성을 증가시키는 신호 부호화/복호화 방법 및 그 장치를 제공하는 것을 목적으로 한다.
상술한 바와 같은 기술적 과제를 해결하기 위한 본 발명에 의한 복호화 방법은, 입력되는 비트스트림에서 복원하고자 하는 오디오 신호를 복호화하는 단계, 상기 비트스트림에 포함된 오디오 신호 복원에 사용되며, 요구되는 재생음질에 따라 기본계층 또는 기본계층 및 하나 이상의 상위계층으로 이루어진 부가정보를 복호화하는 단계, 및 상기 복호화된 오디오 신호를 상기 복호화된 부가정보를 사용하여 복원하는 단계를 포함하는 것을 특징으로 한다.
상술한 바와 같은 기술적 과제를 해결하기 위한 본 발명에 의한 복호화 장치는, 입력되는 비트스트림에서 부호화된 오디오 신호와, 요구되는 재생음질에 따라 기본계층 또는 기본계층 및 하나 이상의 상위계층으로 이루어진 부가정보를 분리하는 디멀티플렉서, 및 상기 분리된 오디오 신호와 부가정보를 복호화하고 상기 복호화된 오디오 신호를 상기 복호화된 부가정보를 사용하여 복원하는 디코더를 포함하는 것을 특징으로 한다.
상술한 바와 같은 기술적 과제를 해결하기 위한 본 발명에 의한 부호화 방법은, 시간영역의 오디오 신호로부터 부호화된 오디오 신호 복원에 필요한 부가정보를 산출하는 단계, 요구되는 재생음질에 따라 상기 부가정보를 기본 계층 또는 기본 계층 및 하나 이상의 상위 계층으로 부호화하는 단계, 및 상기 부호화된 부가정보와, 상기 부가정보를 사용하여 복원할 수 있도록 부호화된 오디오 신호를 포함하는 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 한다.
상술한 바와 같은 기술적 과제를 해결하기 위한 본 발명에 의한 부호화 장치는, 시간영역의 오디오 신호로부터 부호화된 오디오 신호 복원에 필요한 부가정보를 산출하는 부가정보 산출부, 상기 부가정보 산출부에서 산출된 부가정보를 기본 계층 또는 기본 계층 및 하나 이상의 상위 계층으로 부호화하는 비트가변부, 및 상기 부호화된 부가정보와, 상기 부가정보를 사용하여 복원할 수 있는 부호화된 오디오 신호가 포함된 비트스트림을 생성하는 멀티플렉서를 포함하는 것을 특징으로 한다.
상기 본 발명에 의한 부호화/복호화 방법은 바람직하게는 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로 구현할 수 있다.
상기 본 발명에 의한 부호화/복호화 장치는 바람직하게는 멀티 미디어 방송 장치로 구현할 수 있다.
이하에서는 도면을 참조하여 본 발명에 따른 부가 신호를 가지는 오디오 신호의 부호화/복호화 방법 및 그 장치에 대해 상세하게 설명한다.
도 1은 본 발명에 따른 신호의 부호화 장치의 구성에 대한 일실시예를 블록도로 도시한 것으로, 도시된 부호화 장치는 인코더(100), 멀티플렉서(200)를 포함하여 이루어진다.
오디오신호의 압축 방식은 오디오신호 자체를 압축하는 방식(AAC, MP3)과, 그 밴드나 채널을 확장하는 방식(Parametric Stereo, 멀티 채널 오디오, Binaural Spectral Audio Codec 등)이 있을 수 있다. 부가정보란, 신호의 복호화 과정에서 원 신호와 유사한 오디오신호를 재생하기 위하여 사용되는 다양한 종류의 신호를 의미한다.
예를 멀티 채널을 가지는 오디오신호의 경우 인코더를 통과하면 다운믹스된 오디오 신호와 부가정보가 추출된다. 이때 부가정보는 오디오신호 복원 시 업믹스된 오디오 신호에 공간감을 부여할 수 있는 채널에 관한 정보로서, 두 채널 간 에너지 차이 또는 상관관계에 관한 정보를 포함하게 된다. 다운믹스된 오디오 신호는 복호화 된 후 부가정보를 통해 원 오디오 신호에 가까운 공감감을 전달하도록 복원된다.
SBR의 경우, 인코더는 한 프레임을 구성하는 복수개의 주파수 영역 중 특정 주파수 이상의 고주파 영역을 구성하는 오디오신호를 전송하지 않는다. 대신 전송되지 아니한 고주파 신호를 전송한 저주파 신호로부터 복원할 수 있는 부가정보를 추출한다. 이때 부가정보는 오디오신호의 양자화 정도(Quantized Resolution)에 의하여 가변된다.
본 발명의 인코더(10)는 오디오신호를 압축하고 부가정보를 추출한다. 상기에서 언급한 Parametric Stereo, 멀티 채널 오디오, BSAC, SBR는 본 발명의 인코더(10)에서 신호를 부호화하는 일실시예에 지나지 않는다. 따라서, 밴드나 채널을 확장할 수 있도록 압축된 오디오신호를 생성하고, 오디오신호 재생에 필요한 부가정보를 추출하는 인코더는 모두 본 발명의 인코더(10)의 권리범위에 포함된다 할 것이다.
오디오신호 압축 시 그 음질과 압축률은 트레이드-오프 관계에 있다. 따라서, 압축된 오디오 신호를 전송할 통신 환경과 재생 매체에 따라 오디오신호의 Bitrate가 정해지면 그에 따른 최고의 압축률을 제공하기 위해 인코더(100)에서 생성된 오디오신호에 스케빌러티(Scalablity)를 부여한다.
도 2는 인코더(100)의 일실시예의 내부가 도시된 블록도이다. 시간/주파수 변환부(110), 심리음향 모델부(120), 양자화부(130), 부가정보 산출부(140), 비트가변부(150)로 구성된다.
시간/주파수 변환부(110)는 시간영역의 입력 오디오신호를 주파수영역의 신호로 변환한다. 주파수영역의 신호들은 인간의 음향심리모델에 따라 각 대역에서 인간이 느낄 수 있는 신호와 느낄 수 없는 신호의 차이가 크기 때문에 각 주파수 대역에 따른 양자화 비트를 다르게 할당함으로서 압축의 효율을 높일 수 있다.
음향심리 모델부(120)는 시간/주파수 변환부(10)에 의해 주파수성분으로 변환된 오디오신호들을 소정의 대역(subband) 신호들로 묶고, 각 신호들의 상호작용으로 인해 발생되는 마스킹현상을 이용하여 각 대역(subband)에서의 마스킹 문턱치(Masking Threshold)를 계산한다.
양자화부(130)는 각 대역의 양자화 잡음이 마스킹 문턱치보다 작아지도록 소정의 부호화 대역별로 양자화한다. 즉 인간이 들어도 느끼지 못하도록 각 대역의 양자화 잡음의 크기가 상기 마스킹 문턱치보다 작도록 각 대역의 주파수신호들을 양자화한다. 음향심리 모델부(120)에서 계산한 마스킹 문턱치와 각 대역에서 발생하는 잡음(noise)의 비율인 NMR(Noise-to-Mask Ratio)를 이용하여 전대역의 NMR 값이 0dB 이하가 되도록 양자화를 행한다. NMR 값이 0dB 이하라는 것은 양자화잡음에 비해 마스킹값이 높다는 것을 나타내는데, 이것은 양자화잡음을 사람이 들을 수 없다는 의미이다.
부가정보 산출부(140)는 시간영역의 오디오 신호로부터 부호화된 오디오 신호 복원에 필요한 부가정보를 산출한다. 여기서 산출되는 부가정보는 다양한 오디오 코덱 실시예에 따라 앞서 언급한 바와 같이 여러 가지 종류가 있을 수 있다.
비트가변부(150)는 부가정보 산출부(140)에서 산출된 부가정보를 기본 계층(Side Information Base Layer; SBL) 또는 기본 계층 및 하나 이상의 상위 계층Side Information Extended Layer; SEL1, SEL2 등)으로 부호화한다.
멀티플렉서(200)는 도 3에 도시된 바와 같이, 부가정보의 기본계층 및 하나 이상의 상위계층 중 전송될 비트스트림에 포함될 계층 또는 계층수를 결정하는 전송계층 결정부(210), 및 전송계층 결정부(210)에서 결정된 계층의 부가정보 및 인코더(100)에서 부호화된 오디오 신호를 포함하는 비트스트림을 생성하는 비트팩킹부(220)로 구성된다.
비트팩킹부(220)는 전송되기로 결정된 부가정보의 계층 또는 계층수에 관한 정보를 생성하는 비트스트림의 헤더나 태그 등에 포함한다. 비트스트림을 수신한 복호화단은 비트스트림의 헤더나 태그에 포함된 부가정보의 계층에 관한 정보에 따라 부가정보를 추출하여 부가정보를 복호화한다.
비트가변부(150)는 부가정보 산출부(140)에서 산출된 부가정보의 계층구조를 결정하는 계층구조 결정부(151) 및 계층구조 결정부(151)에서 결정된 계층구조에 따라 각 계층별로 부가정보를 부호화하는 부호화부(152)로 구성된다. 양자화된 오디오 신호의 비트율이 조절될 수 있도록 오디오 신호 계층구조 결정부와, 부호화부를 포함할 수 있다.
오디오 신호의 계층구조 결정부는 양자화부(130)에서 양자화되어 추출된 오디오 신호의 비트율이 가변되도록 오디오 신호의 계층에 관한 정보를 결정한다. 계층에 관한 정보란 부호화된 오디오 신호를 이루는 계층의 종류(ABL, AEL1, AEL2)나, 계층의 갯수 또는 각 계층별 비트수 중 적어도 하나 이상을 포함하는 정보이다.
보다 상세히, 오디오 신호의 계층구조 결정부는 요구되는 재생음질에 따라 전송되는 계층이 다를 수 있도록 오디오 신호의 계층구조를 결정한다. 오디오 신호의 부호화부는 상기 오디오 신호의 계층구조 결정부에서 결정된 계층구조에 따라 오디오 신호가 기본계층 또는 기본계층 및 하나 이상의 상위계층을 가지도록 부호화한다.
부가정보 계층구조 결정부(151)는 부가정보 산출부(140)에서 산출된 부가정보의 비트율이 요그되는 재생품질에 따라 가변될 수 있도록 부가정보의 계층에 관한 정보, 즉 계층구조를 결정한다. 부가정보의 계층에 관한 정보란, 부가정보를 이루는 데이터가 가지는 계층의 종류(SBL, SEL1, SEL2)나, 계층의 갯수 또는 각 계층별 비트수 중 적어도 하나 이상을 포함하는 정보이다. 즉, 부가정보를 구성하는 데이터가 계층구조를 가지고 필요에 따라 각 계층이 선택적으로 전송되도록 한다.
이때, 어느 통신 환경이나 재생 매체에서도 필수적으로 전송하여야 할 오디오 신호는 기본계층(ABL)에 포함되며, 전송률이나 요구 음질에 따라 선택적으로 전송될 오디오데이터는 상위계층(AEL1, AEL2)에 포함된다. 복호화 장치에서는 기본계층 및 전송된 상위계층를 합성하여 오디오데이터를 복호화한다.
마찬가지로, 어느 통신 환경이나 재생 매체에서도 필수적으로 전송하여야 할 부가정보를 구성하는 데이터는 기본계층(SBL)에 포함되며, 전송률이나 요구 음질에 따라 선택적으로 전송될 부가정보를 구성하는 데이터는 상위계층(SEL1, SEL2)에 포함된다. 복호화 장치에서는 기본계층 및 전송된 상위계층을 합성하여 부가정보를 복호화하고, 복호화된 부가정보를 이용하여 오디오데이터로부터 원 오디오신호 또는 그에 유사한 오디오신호를 복원한다.
부가정보 중 기본계층(SBL)에 포함될 정보와 상위계층(SEL1, SEL2)에 포함될 정보는 오디오 신호의 부호화 방법에 따라 변경될 것이다. 가령, 후술할 SBR(Spectrul Band Replication) 방법의 경우, 복원하여야 할 고주파 성분에 관한 정보가 기본계층(SBL)에 포함될 것이며 저주파 성분에 관한 정보는 상위계층(SEL1, SEL2)에 포함될 것이다. 이는 SBR의 경우 고주파 성분을 복원하기 위하여 부가정보가 필수적이기 때문이다.
부가정보 부호화부(152)는 비트율이 가장 낮은 기본계층(Base Layer)에 상응하는 부가정보를 부호화하고, 기본계층에 대한 부호화가 끝나면 다음 상위계층(Extended Layer)에 대한 부가정보를 부호화한다.
비트팩킹부(220)는 인코더(100)에서 출력된 부호화된 오디오 신호와 부가정보를 포함하는 비트스트림을 생성한다. 상기 언급한 바와 같이, 비트패킹부는 전송계층 결정부(210)에서 전송이 결정된 계층에 관한 정보 즉, 전송이 결정된 계층에 해당하는 데이터로 이루어진 비트스트림을 생성한다.
비트팩킹부(220)는 생성되는 비트스트림의 헤더나 태크에 상기 비트스트림에 포함되는 오디오 신호 및 부가정보의 계층에 관한 정보 즉, 산출된 계층구조 및 계층의 갯수, 또는 각 계층별 비트수에 관한 정보를 포함한다. 만일, 계층구조를 가진 부호화된 오디오 신호 및 부호화된 부가정보 중 일부계층만 전송된다면 전송되는 계층, 계층수 및 계층별 비트수에 관한 정보도 포함한다.
복호화 장치는 복호화 시 입력된 비트스트림의 헤더에 포함된 계층에 관한 정보로부터 비트스트림에 포함된 오디오 신호 및 부가정보의 계층구조나 계층의 갯 수를 파악한다. 그리고 파악된 계층구조나 계층의 갯수에 관한 정보로부터 계층별로 복호화를 수행한 후 오디오신호를 복원한다.
부가정보의 계층구조 결정부(151)는 디폴트로 부가정보의 계층구조를 오디오신호의 인코딩 방식 또는 계층구조에 따라 결정한다.
오디오 인코딩에 있어서 음질과 압축률은 trade-off 관계에 있다. 따라서, 인코딩은 오디오데이터가 전송되는 통신환경과 재생매체의 환경에 따라 비트율이 정해지면, 정해진 비트율 내에서 최고의 음질이 보장되도록 신호압축을 수행한다.
이에, Spectrul Band Replication(이하, SBR이라 함), Parametric Stereo 등 채널 수 또는 Bandwidth 등을 제한하면서 오디오신호를 복원하기 위한 부가정보들이 등장한다. 부가정보가 가지는 선명도(Resolution) 역시 비트스트림 또는 오디오데이터의 비트율과 상관도가 있다.
부가정보는 전체 오디오 비트율이 증가함에 따라 줄어드는 경우와, 늘어나는 경우가 있다.
우선, 전체 오디오 비트율이 증가함에 따라 줄어드는 경우를 살펴보면, SBR의 경우 본래 전송되어야 할 주파수영역을 전송하지 않는 대신 복원시 필요한 부가정보를 추출하여 전송한다. 복호기에서는 전송된 부가정보를 이용하여 전송된 오디오신호(저주파)에서 전송되지 아니한 오디오신호(고주파)를 복원한다. 이 경우 전송되는 오디오신호가 늘어나면 부가정보에 의해 복원될 부분이 감소하고, 전송되는 오디오신호가 줄어들면 부가정보에 의해 복원될 부분이 증가한다.
다음, 전체 오디오 비트율이 증가함에 따라 늘어나는 경우를 살펴보면 부가 정보 역시 복원 시 참조되는 오디오데이터의 선명도(Quantization Resolution)에 의해 영향을 받는다. 즉, 각 부가정보가 복원해야 할 대역이 구분되어진 상황에서, 전송된 오디오데이터의 선명도가 최고의 음질을 제공할 수 없는 경우 복원에 한계가 있다. 즉, 전송되는 오디오데이터의 선명도가 낮은 경우 부가정보의 선명도를 높여봤자 복원에 한계가 존재한다. 따라서 전송되는 오디오데이터가 줄어들면 전송할 부가정보도 줄어든다.
도 4는 상기 2 가지 경우 기본계층과 상위계층에 나누어 들어갈 부가정보를 매트릭스 형태로 도시하고 있다.
고주파신호 복원에 필요한 부가정보는 SBR의 경우 기본계층에 포함된다. 또한, 고주파신호 복원에 필요한 부가정보라 하더라도 심리음향학적으로 지각에 중요한 데이터가 포함된 MSB(More Significant Bit)과 덜 중요한 데이터가 포함된 LSB(Less Significant Bit)이 존재한다. 따라서, MSB는 기본계층에, LSB는 상위계층에 포함시킨다.
마찬가지로, 저주파신호 복원에 필요한 부가정보는 SBR의 경우 상위계층에 포함된다. SBR의 경우 저주파신호는 오디오데이터가 직접 전송되기 때문이다. 또한, 저주파신호 복원에 필요한 부가정보도 MSB는 기본계층에, LSB는 상위계층에 포함시킨다.
다시 말해, 매트릭스의 x축 방향을 분석하면 왼쪽에 존재하는 데이터는 기본계층에, 오른쪽에 존재하는 데이터는 상위계층에 포함된다. y축 방향을 분석하면 상측에 존재하는 데이터는 기본계층에, 하측에 존재하는 데이터는 상위계층에 포함 된다.
전송계층 결정부(210)는 도 4와 같은 매트릭스 형태로 존재하는 부가정보의 계층을 어느 정도까지 전송할 것인지 결정한다. 전송할 계층의 갯수는 오디오 신호 비트수, 오디오 신호와 부가정보의 계층의 갯수, 오디오 신호와 부가정보의 계층별 비트수 및 생성할 비트스트림의 비트수 등 어느 하나에 의해 결정된다. 이는, 비트스트림 전송환경이나 재생매체, 요구음질 등에 따라 결정할 수 있다. //
도 5는 본 발명에 의한 오디오신호 복호화 장치의 일실시예를 도시한다. 도시된 바와 같이, 디멀티플렉서(300), 디코더(400)로 구성된다. 본 발명에 의한 오디오신호 복호화는 본 발명에 의한 부호화 방법의 역순으로 진행된다.
/////
디멀티플렉서(300)는 입력되는 비트스트림에서 부호화된 오디오 신호와, 요구되는 재생음질에 따라 기본계층 또는 기본계층 및 하나 이상의 상위계층으로 이루어진 부가정보를 분리한다.
디코더(400)는 분리된 오디오 신호와 부가정보를 복호화하고 상기 복호화된 오디오 신호를 상기 복호화된 부가정보를 사용하여 복원한다.
부가정보는, 오디오 신호의 복원 시 채널 확장 또는 밴드 확장을 위해 사용되는 정보, 상기 오디오 신호에 공간감을 부여할 수 있는 채널에 관한 정보, 상기 오디오 신호 중 전송되지 아니한 고주파 신호를 전송한 저주파 신호로부터 복원할 수 있는 정보 중 적어도 하나이다.
한편, 입력되는 비트스트림의 헤더나 태그에는 입력 비트스트림에 관한 정보 가 포함된다. 그 예로 전송되는 부호화된 오디오 신호 및 부가정보의 프레임번호나 프레임크기(비트수)에 관한 정보, 또는 오디오 신호나 부가정보를 구성하는 계층의 구조나 계층의 갯수에 관한 정보를 들 수 있다.
만일, 계층구조를 가지도록 부호화된 오디오 신호 또는 부가정보의 데이터 중 일부 계층의 데이터만 비트스트림에 포함된다면, 상기 비트스트림의 헤더나 태그에는 기본계층 및 하나 이상의 상위계층 중 상기 비트스트림을 통해 전송된 데이터의 계층의 수에 관한 정보와 각 계층별 비트수에 관한 정보를 포함한다.
도 6은 디멀티플렉서(300) 내부의 일실시예를 도시한다.
오디오 신호 계층구조 산출부(330)는 입력되는 비트스트림 헤더 등에 포함된 정보 등을 바탕으로 부호화할 오디오 신호의 계층구조를 산출한다. 오디오 신호 추출부(340)는 산출된 오디오 신호의 계층구조를 바탕으로 비트스트림에서 부호화된 오디오 신호를 추출하여 디코더(400)로 전송한다.
디멀티플렉서(300)의 부가정보 계층구조 산출부(310)는 상기 복호화할 부가정보의 계층구조를 상기 비트스트림의 프레임당 비트수와 상기 전송된 계층의 수 및 각 계층별 비트수 정보에 따라 산출한다.
부가정보 추출부(320)는 산출된 계층구조 즉, 산출된 계층수와 계층별 비트율에 관한 정보를 참고로 비트스트림에 포함된 부가정보를 추출한다. 추출된 부가정보를 기본계층 또는 기본계층 및 하나 이상의 상위계층으로 이루어진다. 계층구조를 가지도록 입력되는 비트스트림에서 추출된 부가정보는 디코더(400)로 출력되어 복호화된다.
디코더(400)는 디멀티플렉서(300)를 통해 부가정보와 분리된 오디오 신호의 역양자화를 수행하고 복호화한다. 그 후, 복호화된 부가정보에 따라 오디오 신호를 복원한다.
디코더(400)의 디코딩 방식은 오디오 신호 인코딩 방식에 따라 결정된다. 부가정보는 오디오 신호 부호화기에 관한 정보나 오디오 신호 특성에 관한 정보를 포함한다. 따라서 디코더(400)는 미리 결정된 방식에 따라 오디오 신호를 디코딩하거나 부가정보에 따라 오디오 신호를 디코딩한다.
만일, 채널확장이나 밴드확장 압축기술이 이용된 인코딩 방식인 경우, 채널확장이나 밴드확장을 할 수 있는 정보를 포함하는 부가정보가 디코더(400)의 디코딩 시 사용된다.
상술한 본 발명에 따른 부호화/복호화 장치는 DAB(Digital Audio Broadcasting), DMB(Digital Multimedia Broadcasting)과 같은 멀티미디어 방송 송/수신 장치에 구비되어, 오디오 신호 또는 음성 신호 등을 부호화/복호화 하는데 사용될 수 있다. 또한 상기 멀티미디어 방송 송/수신 장치는 이동통신 단말기를 포함할 수 있다.
상술한 본 발명에 따른 부호화/복호화 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 상기한 본 발명에 따른 데이터 구조를 가지는 멀티 미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 사용자 추적 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다. 또한, 상술한 부호화 방법에 의해 생성된 비트스트림은 상기 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.
상술한 본 발명에 따른 복호화 장치는 이동 통신 단말기, PMP(Portable Multimedia Player)와 같은 멀티미디어 플레이어, PDA(Personal Digital Assistants) 등의 재생 장치에 구비될 수 있다. 또한, 상술한 복호화 장치는 하드웨어적으로 구현되어 재생 장치 등에 포함되거나, 상술한 바와 같이 소프트웨어적으로 재생 장치에 구현될 수도 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
본 발명에 의한 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및 장치에 의하면 오디오신호와 함께 부가정보의 비트율을 조정할 수 있다. 따라서 재생하고자 하는 음질이나 전송환경에 따른 신호처리의 유연성을 증가시킬 수 있다. 또한 오디오신호의 비트율에 따라 부가정보의 비트율도 결정할 수 있어 재생하고자 하는 음질의 정밀한 제어가 가능하다.

Claims (21)

  1. 입력되는 비트스트림에서 복원하고자 하는 오디오 신호를 복호화하는 단계;
    상기 비트스트림에 포함된 오디오 신호 복원에 사용되며, 요구되는 재생음질에 따라 기본계층 또는 기본계층 및 하나 이상의 상위계층으로 이루어진 부가정보를 복호화하는 단계; 및
    상기 복호화된 오디오 신호를 상기 복호화된 부가정보를 사용하여 복원하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 복호화 방법.
  2. 제 1 항에 있어서,
    상기 부가정보는, 상기 오디오 신호의 복원 시 채널 확장 또는 밴드 확장을 위해 사용되는 정보, 상기 오디오 신호에 공간감을 부여할 수 있는 채널에 관한 정보, 상기 오디오 신호 중 전송되지 아니한 고주파 신호를 전송한 저주파 신호로부터 복원할 수 있는 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 복호화 방법.
  3. 제 1 항에 있어서,
    상기 비트스트림은 상기 부가정보를 이루는 기본계층 또는 기본계층 및 하나 이상의 상위계층 중 상기 비트스트림을 통해 전송된 계층의 수와 각 계층별 비트수에 관한 정보를 포함하는 것을 특징으로 하는 복호화 방법.
  4. 제 3 항에 있어서,
    상기 부가정보 복호화 단계는 상기 복호화할 부가정보의 계층구조를 상기 비트스트림의 프레임당 비트수와 상기 전송된 계층의 수 및 각 계층별 비트수 정보에 따라 산출하는 과정;
    상기 산출된 계층구조에 따라 부가정보를 상기 비트스트림에서 추출하는 과정; 및
    상기 추출된 부가정보를 복호화하는 과정으로 이루어지는 것을 특징으로 하는 복호화 방법.
  5. 입력되는 비트스트림에서 부호화된 오디오 신호와, 요구되는 재생음질에 따라 기본계층 또는 기본계층 및 하나 이상의 상위계층으로 이루어진 부가정보를 분리하는 디멀티플렉서; 및
    상기 분리된 오디오 신호와 부가정보를 복호화하고 상기 복호화된 오디오 신호를 상기 복호화된 부가정보를 사용하여 복원하는 디코더를 포함하는 복호화 장치.
  6. 제 5 항에 있어서,
    상기 부가정보는, 상기 오디오 신호의 복원 시 채널 확장 또는 밴드 확장을 위해 사용되는 정보, 상기 오디오 신호에 공간감을 부여할 수 있는 채널에 관한 정 보, 상기 오디오 신호 중 전송되지 아니한 고주파 신호를 전송한 저주파 신호로부터 복원할 수 있는 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 복호화 방법.
  7. 제 5 항에 있어서,
    상기 비트스트림은 상기 부가정보를 이루는 기본계층 및 하나 이상의 상위계층 중 상기 비트스트림을 통해 전송된 데이터의 계층의 수에 관한 정보와 각 계층별 비트수에 관한 정보를 포함하는 것을 특징으로 하는 복호화 방법.
  8. 제 7 항에 있어서,
    상기 디멀티플렉서는 상기 복호화할 부가정보의 계층구조를 상기 비트스트림의 프레임당 비트수와 상기 전송된 계층의 수 및 각 계층별 비트수 정보에 따라 산출하는 부가정보 계층구조 산출부; 및
    상기 산출된 계층구조에 따라 부가정보를 상기 비트스트림에서 추출하는 부가정보 추출부로 구성되는 것을 특징으로 하는 복호화 장치.
  9. 시간영역의 오디오 신호로부터 부호화된 오디오 신호 복원에 필요한 부가정보를 산출하는 단계;
    요구되는 재생음질에 따라 상기 부가정보를 기본 계층 또는 기본 계층 및 하나 이상의 상위 계층으로 부호화하는 단계; 및
    상기 부호화된 부가정보와, 상기 부가정보를 사용하여 복원할 수 있도록 부호화된 오디오 신호를 포함하는 비트스트림을 생성하는 단계를 포함하는 것을 특징으로 하는 부호화 방법.
  10. 제 9 항에 있어서,
    상기 부가정보는, 상기 오디오 신호의 복호 시 채널 확장 또는 밴드 확장을 위해 사용되는 정보, 상기 오디오 신호에 공간감을 부여할 수 있는 채널에 관한 정보, 상기 오디오 신호 중 전송되지 아니한 고주파 신호를 전송한 저주파 신호로부터 복원할 수 있는 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 부호화 방법.
  11. 제 9 항에 있어서,
    상기 부가정보 부호화 단계에서 상기 부가정보의 계층구조는 상기 부가정보를 사용하여 복원할 오디오 신호의 계층구조에 따라 결정되는 것을 특징으로 하는 부호화 방법.
  12. 제 9 항에 있어서,
    상기 부가정보 부호화 단계는 상기 부가정보의 기본계층 및 하나 이상의 상위계층 중 상기 비트스트림을 통해 전송할 계층 또는 계층수를 결정하는 과정을 더 포함하는 것을 특징으로 하는 부호화 방법.
  13. 제 12 항에 있어서,
    상기 비트스트림 생성단계는 상기 전송할 부가정보의 계층 또는 계층수에 관한 정보를 비트스트림에 더 포함하는 것을 특징으로 하는 부호화 방법.
  14. 시간영역의 오디오 신호로부터 부호화된 오디오 신호 복원에 필요한 부가정보를 산출하는 부가정보 산출부;
    상기 부가정보 산출부에서 산출된 부가정보를 기본 계층 또는 기본 계층 및 하나 이상의 상위 계층으로 부호화하는 비트가변부; 및
    상기 부호화된 부가정보와, 상기 부가정보를 사용하여 복원할 수 있는 부호화된 오디오 신호가 포함된 비트스트림을 생성하는 멀티플렉서를 포함하는 것을 특징으로 하는 부호화 장치.
  15. 제 14 항에 있어서,
    상기 부가정보는, 상기 오디오 신호의 복호 시 채널 확장 또는 밴드 확장을 위해 사용되는 정보, 상기 오디오 신호에 공간감을 부여할 수 있는 채널에 관한 정보, 상기 오디오 신호 중 전송되지 아니한 고주파 신호를 전송한 저주파 신호로부터 복원할 수 있는 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 부호화 장치.
  16. 제 14 항에 있어서,
    상기 비트가변부는 상기 부호화된 부가정보의 계층구조를 결정하는 계층구조 결정부; 및
    상기 계층구조 결정부에서 결정된 계층구조에 따라 각 계층별로 부가정보를 부호화하는 부호화부로 구성되는 것을 특징으로 하는 부호화 장치.
  17. 제 16 항에 있어서,
    상기 계층구조 결정부는 상기 부가정보의 계층구조를 상기 부가정보를 사용하여 복원할 오디오 신호의 계층구조에 따라 결정하는 것을 특징으로 하는 부호화 장치.
  18. 제 16 항에 있어서,
    상기 멀티플렉서는 상기 부가정보의 기본계층 및 하나 이상의 상위계층 중 상기 비트스트림에 포함될 계층 또는 계층수를 결정하는 전송계층 결정부; 및
    상기 전송계층 결정부에서 결정된 계층의 부가정보 및 상기 부호화된 오디오 신호를 포함하는 비트스트림을 생성하는 비트팩킹부를 포함하는 것을 특징으로 하는 부호화 장치.
  19. 제 18 항에 있어서,
    상기 비트팩킹부는 상기 전송되기로 결정된 부가정보의 계층 또는 계층수에 관한 정보를 상기 비트스트림에 포함하는 것을 특징으로 하는 부호화 장치.
  20. 제 1 항 내지 제 4 항, 제 9 항 내지 제 13 항 중 어느 한 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  21. 제 5 항 내지 제 8 항, 제 14 항 내지 제 19 항 중 어느 한 항에 기재된 장치를 포함하는 것을 특징으로 하는 멀티 미디어 방송 장치.
KR1020070104672A 2007-01-12 2007-10-17 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 KR20080066537A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US88001407P 2007-01-12 2007-01-12
US60/880,014 2007-01-12

Publications (1)

Publication Number Publication Date
KR20080066537A true KR20080066537A (ko) 2008-07-16

Family

ID=39831606

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020070104672A KR20080066537A (ko) 2007-01-12 2007-10-17 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
KR1020070104673A KR20080066538A (ko) 2007-01-12 2007-10-17 멀티 채널 신호의 부호화/복호화 방법 및 장치

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020070104673A KR20080066538A (ko) 2007-01-12 2007-10-17 멀티 채널 신호의 부호화/복호화 방법 및 장치

Country Status (1)

Country Link
KR (2) KR20080066537A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017039422A3 (ko) * 2015-09-04 2017-04-20 삼성전자 주식회사 음질 향상을 위한 신호 처리방법 및 장치

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110049068A (ko) * 2009-11-04 2011-05-12 삼성전자주식회사 멀티 채널 오디오 신호의 부호화/복호화 장치 및 방법
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN112262433B (zh) * 2018-04-05 2024-03-01 弗劳恩霍夫应用研究促进协会 用于估计通道间时间差的装置、方法或计算机程序

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017039422A3 (ko) * 2015-09-04 2017-04-20 삼성전자 주식회사 음질 향상을 위한 신호 처리방법 및 장치
US10803877B2 (en) 2015-09-04 2020-10-13 Samsung Electronics Co., Ltd. Signal processing methods and apparatuses for enhancing sound quality
US11380338B2 (en) 2015-09-04 2022-07-05 Samsung Electronics Co., Ltd. Signal processing methods and apparatuses for enhancing sound quality

Also Published As

Publication number Publication date
KR20080066538A (ko) 2008-07-16

Similar Documents

Publication Publication Date Title
KR101221918B1 (ko) 신호 처리 방법 및 장치
JP4740548B2 (ja) 帯域幅拡張技術を利用して符号化及び復号化を行う方法及び装置
JP4347698B2 (ja) パラメトリックオーディオ符号化
US9355645B2 (en) Method and apparatus for encoding/decoding stereo audio
US7848931B2 (en) Audio encoder
JP2012238034A (ja) マルチチャンネルオーディオ信号復号化方法
KR20070070137A (ko) 오디오 데이터 부호화 및 복호화 장치와 방법
RU2007139918A (ru) Кодирование многоканального аудио
JP2005157390A (ja) 付加情報の挿入されたmpeg−4bsacオーディオビットストリームの符号化方法および復号化方法ならびに符号化装置および復号化装置
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
KR20070037945A (ko) 오디오 신호의 부호화/복호화 방법 및 장치
JP2006201785A (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
US20080288263A1 (en) Method and Apparatus for Encoding/Decoding
KR100528325B1 (ko) 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
KR100682915B1 (ko) 다채널 신호 부호화/복호화 방법 및 장치
JP4809234B2 (ja) オーディオ符号化装置、復号化装置、方法、及びプログラム
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
JP2004184975A (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
KR20060036724A (ko) 오디오 신호 부호화 및 복호화 방법 및 그 장치
CN102576531A (zh) 用于处理多信道音频信号的方法、设备和计算机程序
JP4973397B2 (ja) 符号化装置および符号化方法、ならびに復号化装置および復号化方法
WO2010150767A1 (ja) 符号化方法、復号方法、それらの方法を用いた装置、プログラム
KR20080029757A (ko) 믹스 신호의 처리 방법 및 장치
JP4317355B2 (ja) 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination