KR20070087897A - 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법 - Google Patents

비트율 조절이 가능한 오디오 복호화 장치 및 그 방법 Download PDF

Info

Publication number
KR20070087897A
KR20070087897A KR1020060008252A KR20060008252A KR20070087897A KR 20070087897 A KR20070087897 A KR 20070087897A KR 1020060008252 A KR1020060008252 A KR 1020060008252A KR 20060008252 A KR20060008252 A KR 20060008252A KR 20070087897 A KR20070087897 A KR 20070087897A
Authority
KR
South Korea
Prior art keywords
importance value
layer
importance
maximum
decoding
Prior art date
Application number
KR1020060008252A
Other languages
English (en)
Other versions
KR100793287B1 (ko
Inventor
김헌중
안영욱
반재미
Original Assignee
주식회사 코아로직
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 코아로직 filed Critical 주식회사 코아로직
Priority to KR1020060008252A priority Critical patent/KR100793287B1/ko
Priority to US11/626,491 priority patent/US7831436B2/en
Publication of KR20070087897A publication Critical patent/KR20070087897A/ko
Application granted granted Critical
Publication of KR100793287B1 publication Critical patent/KR100793287B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 비트 슬라이스 연산 코딩으로 부호화된 오디오 신호의 산술 복호화 시에 발생하는 계산량을 감소시켜 복호화기의 성능을 개선하기 위한 것으로, 계층 별 부가 정보를 복호화하여 각 계층에 속하는 심벌들의 실질 중요도 값들을 얻고, 계층 별 최대 중요도 값을 참조하여 최상위 비트들로 구성된 심벌에서부터 최하위 비트들로 구성된 심벌의 순서로 코딩 밴드 단위의 복호화를 수행하여 양자화 샘플들을 얻는 비트 플레인 복호화부와, 실질 중요도 값들을 코딩 밴드 단위로 묶어 코딩 밴드 단위의 중요도 검색 트리를 형성하며, 중요도 검색 트리를 이용하여 계층 별로 최대 중요도 값을 구하는 연산부를 포함하는 오디오 복호화 장치 및 그 방법을 제공한다.
엠펙, 오디오 신호, 비트 슬라이스 연산, 스케일러블

Description

비트율 조절이 가능한 오디오 복호화 장치 및 그 방법{Apparatus and method for decoding audio data with scalability}
도 1은 종래의 오디오 부호화 방법에 의한 비트 스트림의 구조를 나타낸 도면이다.
도 2는 종래의 오디오 복호화 방법에서, 최대 중요도 값을 구하기 위한 전체 검색 방식을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 오디오 복호화 장치를 나타낸 구성도이다.
도 4는 본 발명의 일 실시예에 따른 오디오 복호화 장치에서, 최대 중요도 값을 구하기 위한 중요도 검색 트리 구조를 설명하기 위한 도면이다.
도 5는 도 4의 일부를 보다 자세히 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 오디오 복호화 방법을 나타낸 흐름도이다.
도 7은 본 발명의 다른 실시예에 따른 오디오 복호화 방법을 나타낸 흐름도이다.
도 8은 도 6 또는 도 7의 일부 단계를 보다 상세히 나타낸 흐름도이다.
(도면의 주요부분에 대한 부호의 설명)
100: 비트 플레인 복호화부 110: 연산부
120: 역양자화부 130: 주파수/시간 맵핑부
140: 프레임 버퍼
본 발명은 오디오 복호화 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법에 관한 것이다.
비트 슬라이스 연산 코딩(BSAC; Bit Sliced Arithmetic Coding)은 고급 오디오 부호화(AAC:Advanced Audio Coding) 압축 방식의 성능을 일부 개선한 MPEG-4(MPEG; Moving Picture Experts Group 4) 오디오 압축 방식으로 제안되었다.
비트 슬라이스 연산 코딩에서는, 송신단 측에서 신호를 기반 계층(Base Layer)의 오디오 신호와 강화 계층(Enhancement Layer)의 오디오 신호로 각각 부호화하고, 수신단 측에서는 저품질의 복호화기를 구비한 사용자는 기반 계층의 오디오 신호만을 복호화하여 기본적인 오디오 신호를 재생할 수 있고, 고품질의 복호화기를 구비한 사용자는 기반 계층의 오디오 신호에 강화 계층의 오디오 신호를 더하여 고품질의 오디오 신호를 재생할 수 있게 하였다.
이러한 방법에 있어서, 송신단 측에서 전송한 모든 비트 스트림을 수신단 측에서 모두 수신할 때까지 기다려야 하는 한계를 없애고, 송신단 측에서 전송한 모든 비트 스트림을 수신단 측에서 수신하지 못한 경우에도, 그때까지 수신된 비트 스트림만을 이용하여 수신된 오디오 신호를 복원할 수 있도록 하기 위하여 MPEG-4는 각 계층의 오디오 신호를 비트 플레인 단위로 전송하는 미세 입자 스케일러블 코딩(FGS; Fine Grain Scalability) 방법을 도입하였다.
미세입자 스케일러블 코딩은 전체 비트 스트림(Bit Stream) 중 일부의 비트 스트림만으로 복호화가 가능하도록 하는 압축 전송 방식으로서, 수신단 측으로 전송할 오디오 신호를 비트 플레인(Bit Plane) 별로 나누어, 가장 중요한 비트(MSB : Most Significant Bit)를 부호화하여 최우선적으로 전송하고 그 다음 중요한 비트를 비트 플레인 별로 나누어 부호화하여 연속적으로 전송하는 방식을 사용한다.
도 1은 종래의 오디오 부호화 방법에 의한 비트 스트림의 구조를 나타낸 도면이다.
도 1을 참조하면, 비트 스트림의 프레임은 미세입자 스케일러블 코딩을 위해 양자화 샘플과 부가 정보를 계층(Layer) 구조에 맵핑시켜 부호화되어 있다. 즉, 하위 계층의 비트 스트림이 상위 계층의 비트 스트림에 포함되어 있는 계층 구조를 가지고, 각 계층에 필요한 부가 정보들은 계층별로 나뉘어서 부호화된다.
비트 스트림의 선두에는 헤더 정보가 저장되는 헤더 영역(header)이 마련되고, 계층 0의 정보가 패킹되어 있으며, 강화 계층(Enhancement Layer)인 계층 1 내지 계층 N(N은 1보다 크거나 같은 정수)에 속하는 정보가 순서대로 패킹되어 있다. 헤더 영역에서부터 계층 0 정보까지를 기반 계층(Base Layer)이라 부르고, 헤더 영역에서부터 계층 1 정보까지를 계층 1, 계층 2 정보까지를 계층 2라고 부른다. 마찬가지 방식으로, 최상위 계층(Top Layer)은 헤더 영역에서부터 계층 N 정보까지, 즉, 기반 계층(Base Layer)에서부터 강화 계층(Enhancement Layer)인 계층 N까지를 말한다. 각 계층 정보로는 부가 정보와 부호화된 오디오 신호가 저장되어 있다. 가령, 계층 2 정보로 부가 정보 2와 부호화된 양자화 샘플들이 저장되어 있다.
이러한 구조를 통해, 송신단 측의 부호화기로부터 압축된 비트율(bitrate)을 수신단 측의 복호화기에서 항상 같은 비트율로 복호화하지 않고, 강화 계층(Enhancement Layer) 중 하나가 되는 타겟 계층의 부호화 비트율(encoding bitrate)을 최대 비트율, 기반 계층(Base Layer)의 비트율을 최소 비트율로 하여 1kbps 단위로 복호화기에서 조절하여 복호화가 가능하다.
도 2는 종래의 오디오 복호화 방법에서, 최대 중요도 값(max_snf)을 구하기 위한 전체 검색(full search) 방식을 설명하기 위한 도면이다.
수신단 측에서는 도 1과 같은 비트 스트림을 수신하여 매 프레임마다 산술 복호화(Arithmetic Decoding)을 수행하게 되는데, 도 2는 기반 계층(Base Layer) 내지 최상위 계층(Top Layer) 중 임의의 계층에서 산술 복호화가 요구되는지 아닌지를 판단하기 위하여 필요한 최대 중요도 값(max_snf)을 검색하기 위한 전체 검색 방식을 나타내고 있다.
또한, 최대 중요도 값(max_snf)에 의해 산술 복호화가 요구될 때에도, 오디오 신호의 각 주파수 성분에 대한 실질 중요도 값(current_snf)을 검사하여 산술 복호화가 요구되는지에 대한 판단을 하게 된다.
그러나, 여기에서 이루어지는 모든 검색, 즉, 최대 중요도 값(max_snf)의 검색과, 실질 중요도 값(current_snf) 및 최대 중요도 값(max_snf)의 비교는 모두 전 체 검색 방식을 사용하게 된다.
예를 들어, 도 2에 나타나 있는 바와 같이, 주파수 검색 범위가 510, 채널은 2개, 윈도우 그룹은 8개라고 가정하면, 최대 중요도 값(max_snf)을 찾기 위해 수행되어야 할 비교 횟수는 하나의 계층 당 510*2*8=8,160번이고, 이것은 한 프레임마다 계층의 개수만큼 수행된다. 예를 들어, 기반 서브 계층(base_sublayer)이 10개이고, 계층(Layer)이 48개라면, '8,160*58 = 473,280번'의 비교가 수행되어야 한다.
이와 같이, 임의의 주파수 검색 범위(search frequency)에서 임의의 최대 중요도 값(max_snf)을 찾는데 모든 인자(coefficient)에 대하여 모든 실질 중요도 값(current_snf)을 비교하여 가장 큰 값을 찾는 일반적인 방법을 전체 검색 방식이라고 한다.
전체 검색 방식에서 최대 중요도 값(max_snf)을 찾기 위한 프레임 당 계산량은 '주파수 검색 범위*채널 수*윈도우 그룹 수*계층 수'로 나타나며, 이러한 방식은 매 계층, 채널, 윈도우 그룹, 주파수 검색 범위마다 실질 중요도 값(current_snf)을 비교하여 최대 중요도 값(max_snf)을 구해야 하므로, 불필요한 연산량이 많아지고, 그에 따른 복호화기의 성능 저하나 비용 증가가 불가피하다는 문제점이 있었다.
따라서, 본 발명이 이루고자 하는 기술적 과제는 비트 슬라이스 연산 코딩에서 오디오 신호의 산술 복호화 시에 발생하는 많은 계산량을 기존 대비 최대 1/16 수준으로 감소시키고, 그에 따른 복호화기의 성능 개선이나 비용 절감을 유도할 수 있는 오디오 복호화 장치 및 그 방법을 제공하는 것이다.
본 발명이 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 달성하기 위한 본 발명의 일 실시예에 따른 오디오 복호화 장치는, 계층 구조로 부호화된 오디오 신호를 기반 계층에서 타겟 계층까지 비트율 조절이 가능하도록 복호화하는 장치에 있어서, 계층 별 부가 정보를 복호화하여 각 계층에 속하는 심벌들의 실질 중요도 값들을 얻고, 계층 별 최대 중요도 값을 참조하여 최상위 비트들로 구성된 심벌에서부터 최하위 비트들로 구성된 심벌의 순서로 코딩 밴드 단위의 복호화를 수행하여 양자화 샘플들을 얻는 비트 플레인 복호화부와, 상기 실질 중요도 값들을 상기 코딩 밴드 단위로 묶어 상기 코딩 밴드 단위의 중요도 검색 트리를 형성하며, 상기 중요도 검색 트리를 이용하여 계층 별로 상기 최대 중요도 값을 구하는 연산부를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 오디오 복호화 장치는 상기 부가 정보를 기초로 상기 양자화 샘플들을 역양자화하여 원래 크기의 오디오 신호로 복원하는 역양자화부와, 상기 복원된 오디오 신호를 주파수 영역에서 시간 영역으로 변환하는 주파수/시간 맵핑부와, 상기 중요도 검색 트리가 저장 및 갱신되는 프레임 버퍼를 더 포 함할 수 있다.
본 발명의 일 실시예에 따른 오디오 복호화 장치에서, 상기 연산부는, 상기 중요도 검색 트리와 소정의 주파수 범위에 대한 전체 검색 방식을 함께 적용하여 계층 별로 상기 최대 중요도 값을 구하도록 구성된다.
본 발명의 일 실시예에 따른 오디오 복호화 장치에서, 상기 연산부의 프레임 당 계산량은, 각 계층에 속하는 코딩 밴드 수와 전체 검색 방식이 적용된 주파수 범위의 합과, 채널 수와, 윈도우 그룹 수와, 계층 수의 곱에 해당하는 값이 되도록 구성한다.
본 발명의 일 실시예에 따른 오디오 복호화 장치에서, 상기 비트 플레인 복호화부에서, 상기 부가 정보는 차분 복호화되고, 상기 심벌들은 산술 복호화되도록 구성한다.
본 발명의 일 실시예에 따른 오디오 복호화 방법은, 계층 구조로 부호화된 오디오 신호를 기반 계층에서 타겟 계층까지 비트율 조절이 가능하도록 복호화하는 방법에 있어서, (a) 코딩 밴드 단위의 중요도 검색 트리를 이용해 상기 기반 계층 내지 상기 타겟 계층 중의 하나인 기준 계층의 최대 중요도 값을 구하는 단계와, (b) 상기 최대 중요도 값을 최소 중요도 값과 비교하여 산술 복호화의 필요성을 결정하는 단계와, (c) 최대 중요도 값이 상기 최소 중요도 값보다 크거나 같으면, 상기 기준 계층에 속하는 심볼들의 실질 중요도 값을 상기 최대 중요도 값과 비교하면서 상기 심볼들의 복호화 위치를 검색하는 단계와, (d) 상기 코딩 밴드 단위로 상기 심볼들을 산술 복호화하는 단계와, (e) 상기 산술 복호화가 수행된 코딩 밴드 들을 확인하여 상기 중요도 검색 트리를 업데이트하는 단계와, (f) 상기 최대 중요도 값이 상기 최소 중요도 값보다 작아질 때까지 상기 최대 중요도 값을 1씩 감소시키면서 상기 (a) 단계 내지 상기 (e) 단계를 반복하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 다른 실시예에 따른 오디오 복호화 방법은, 계층 구조로 부호화된 오디오 신호를 기반 계층에서 타겟 계층까지 비트율 조절이 가능하도록 복호화하는 방법에 있어서, (a) 코딩 밴드 단위의 중요도 검색 트리를 이용해 상기 기반 계층 내지 상기 타겟 계층 중의 하나인 기준 계층의 최대 중요도 값을 구하는 단계와, (b) 상기 최대 중요도 값을 최소 중요도 값과 비교하여 산술 복호화의 필요성을 결정하는 단계와, (c) 최대 중요도 값이 상기 최소 중요도 값보다 크거나 같으면, 상기 중요도 검색 트리를 이용하여 상기 기준 계층에 속하는 심볼들의 실질 중요도 값을 상기 최대 중요도 값과 비교하면서 상기 심볼들의 복호화 위치를 검색하는 단계와, (d) 상기 코딩 밴드 단위로 상기 심볼들을 산술 복호화하는 단계와, (e) 상기 산술 복호화가 수행된 코딩 밴드들을 확인하여 상기 중요도 검색 트리를 업데이트하는 단계와, (f) 상기 최대 중요도 값이 상기 최소 중요도 값보다 작아질 때까지 상기 최대 중요도 값을 1씩 감소시키면서 상기 (a) 단계 내지 상기 (e) 단계를 반복하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 일 실시예에 따른 오디오 복호화 방법에서, 상기 (a) 단계에서는 상기 중요도 검색 트리와 소정의 주파수 범위에 대한 전체 검색 방식을 함께 적용하여 계층 별로 상기 최대 중요도 값을 구하도록 한다.
본 발명의 다른 실시예에 따른 오디오 복호화 방법에서, 상기 (a) 단계에서는 상기 중요도 검색 트리와 소정의 주파수 범위에 대한 전체 검색 방식을 함께 적용하여 계층 별로 상기 최대 중요도 값을 구하도록 한다.
본 발명의 일 실시예 또는 다른 실시예에 따른 오디오 복호화 장치에서, 상기 (a) 단계의 프레임 당 계산량은 각 계층에 속하는 코딩 밴드 수와 전체 검색 방식이 적용된 주파수 범위의 합과, 채널 수와, 윈도우 그룹 수와, 계층 수의 곱에 해당하는 값이 되도록 한다.
기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
이하, 본 발명의 바람직한 실시예에 따른 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법에 대하여 첨부된 도면들을 참조하여 상세히 설명한다.
도 3은 본 발명의 일 실시예에 따른 오디오 복호화 장치를 나타낸 구성도로서, 비트 슬라이스 연산 코딩을 이용해 계층 구조로 부호화된 오디오 신호를 기반 계층에서 타겟 계층까지 비트율 조절이 가능하도록 복호화하는 장치의 일례를 도시하고 있다.
비트 플레인 복호화부(100)는 계층 구조로 부호화된 비트 스트림을 수신하고, 계층 별 부가 정보를 복호화하여 각 계층에 속하는 심벌(Symbol)들의 실질 중요도 값(current_snf)들을 얻고, 계층 별 최대 중요도 값(max_snf)을 참조하여 최 상위 비트들로 구성된 심벌에서부터 최하위 비트들로 구성된 심벌의 순서로 코딩 밴드(Coding Band) 단위의 복호화를 수행하여 양자화 샘플들을 얻는다. 이때, 부가 정보는 차분 복호화(Differential Decoding)되고, 심벌들은 산술 복호화(Arithmetic Decoding)된다.
연산부(110)는 실질 중요도 값(current_snf)들을 코딩 밴드 단위로 묶어 코딩 밴드 단위의 중요도 검색 트리(Significance Tree)를 형성하며, 중요도 검색 트리를 이용하여 계층 별로 최대 중요도 값(max_snf)을 구한다.
또한, 연산부(110)는 중요도 검색 트리와 소정의 주파수 범위에 대한 전체 검색 방식을 함께 적용하여 계층 별로 최대 중요도 값(max_snf)을 구할 수 있다(도 5 설명 부분 참조).
이때, 연산부(110)의 프레임 당 계산량은 각 계층에 속하는 코딩 밴드 수(cband_range )와 전체 검색 방식이 적용된 주파수 범위(full_search_range)의 합과, 채널 수(channel)와, 윈도우 그룹 수(window_group)와, 계층 수(Layer)의 곱에 해당하는 값이 된다.
역양자화부(120)는 부가 정보를 기초로 양자화 샘플들을 역양자화하여 원래 크기의 오디오 신호로 복원한다.
주파수/시간 맵핑부(130)는 복원된 오디오 신호를 주파수 영역에서 시간 영역으로 변환하여 시간 영역의 PCM(pulse code modulation) 오디오 신호를 출력한다.
프레임 버퍼(140)에는 중요도 검색 트리가 저장되고, 임의의 코딩 밴드에 대 한 산술 복호화가 이루어지는 경우, 해당 코딩 밴드의 매개 중요도 값(cband_snf)이 갱신되어 중요도 검색 트리가 업데이트 된다.
도 4는 본 발명의 일 실시예에 따른 오디오 복호화 장치에서, 최대 중요도 값을 구하기 위한 중요도 검색 트리 구조를 설명하기 위한 도면이고, 도 5는 도 4의 일부를 보다 자세히 나타낸 도면이다.
도 2와 같은 종래의 전체 검색 방식은 도 4와 같이 트리 구조로 바꿀 수 있다. 도 4에서는 종래 도 2의 조건에 본 발명을 적용한 경우를 도시하고 있다.
비트 슬라이스 연산 코딩에서는 코딩 밴드(하나의 코딩 밴드는 32개의 서브 밴드를 가짐) 단위로 복호화가 수행되는데, 본 발명에서는 이 코딩 밴드 단위로 중요도 검색 트리를 만들어 각 코딩 밴드 마다의 매개 중요도 값(cband_snf)에 대한 최대 중요도 값(max_snf)을 프레임 버퍼(140)에 저장한 후, 이 매개 중요도 값(cband_snf) 단위로 검색을 수행하게 된다.
도 4의 예제에서는 0~509 사이의 주파수 검색 범위(search range)를 가지므로, 0~479 사이의 주파수 검색 범위(search range)에서는 매개 중요도 값이 0~14개로 최대 중요도 값(max_snf)을 코딩 밴드 단위로 검색할 수 있다. 그러나, 주파수 검색 범위(search range)에 속하는 480~509까지의 주파수에 마지막 코딩 밴드인 cband(15)의 모두 구간이 포함되지는 않으므로, 정확한 최대 중요도 값(max_snf)을 구할 수가 없게 된다.
따라서, 이 구간에 대하여는 도 5에서와 같이 480~509의 주파수 범위(full_search_range)에 대하여는 부분적인 전체 검색 방식으로 최대 중요도 값 (max_snf)를 구한다면 원래 얻고자 하는 값을 정확하게 얻을 수 있을 것이다.
도 4 및 도 5의 경우를 종래의 도 2의 경우와 비교하여 계산량의 감소를 계산하면 다음과 같다. 우선, 중요도 검색 트리 구조에 의해 검색 대상이 되는 코딩 밴드 수(cband_range)가 15, 전체 검색 방식이 적용된 주파수 범위(full_search_range)가 30, 채널 수(channel)는 2, 윈도우 그룹 수(window_group)는 8이라고 가정하자. 그러면, 최대 중요도 값(max_snf)을 찾기 위해 수행되어야 할 비교 횟수는 한 계층(Layer) 당 (15+30)*2*8 = 720번'이 되며, 이것은 한 프레임마다 계층의 개수만큼 수행된다. 예를 들어, 기반 서브 계층(base_sublayer)이 10개이고, 계층(Layer)이 48개라면, '720*58 = 41,760번'의 비교가 수행된다. 따라서, 종래의 전체 검색 방식과 동일한 결과를 얻으면서 계산량은 약 1/10도 되지 않는다.
즉, 종래의 전체 검색 방식을 사용할 때의 프레임 당 계산량을 일반화하면 'search range / 32 = cband_range * 32 + full_search_range)'가 되지만, 본 발명의 프레임 당 계산량은 '(cband_range + full_search_range) * channel * window_group) * Layer'이 된다. 여기서, search range는 1~1024의 범위를 가지며, cband_range는 1~32의 범위를 가지고, full_search_range도 1~32의 범위를 가진다.
그러므로, 종래의 전체 검색 방식에서 최악의 경우는 search range가 1024가 되는 반면에, 본 발명의 중요도 검색 트리에서는 동일한 조건에서 최악의 경우에 'cband_range + full_search_range'가 64가 되어 기존 대비 1/16배 수준의 계산 량만을 필요로 하게 된다.
물론, 이와 같은 중요도 검색 트리 구조를 위해서는 산술 복호화(Arithmetic decoding) 후에 매개 중요도 값(cband_snf)의 업데이트가 필수 요소이지만, 이러한 업데이트는 전체 주파수 범위 중에 산술 복호화가 이루어진 코딩 밴드만을 대상으로 이루어지므로 계산량의 증가는 거의 없다.
도 6은 본 발명의 일 실시예에 따른 오디오 복호화 방법을 나타낸 흐름도이다.
먼저, S100 단계에서, 코딩 밴드 단위의 중요도 검색 트리를 이용해 기반 계층 내지 타겟 계층 중의 하나인 기준 계층의 최대 중요도 값(max_snf)을 구하고, S110 단계에서, 최대 중요도 값(max_snf)을 최소 중요도 값(min_snf)과 비교하여 산술 복호화의 필요성을 결정한다.
최대 중요도 값(max_snf)이 최소 중요도 값(min_snf)보다 크거나 같으면, S120 단계로 진행하여 기준 계층에 속하는 심볼들의 실질 중요도 값(current_snf)을 최대 중요도 값(max_snf)과 비교하면서 심볼들의 복호화 위치(Decoding Position)를 검색한다.
그리고, 검색 결과에 따라 현재 계층(Layer)에서 산술 복호화가 요구되는지 아닌지를 판단하고, 최대 중요도 값(max_snf)에 의해 산술 복호화가 요구될 때에도 각 심볼들의 계수(coefficient)에 대한 실질 중요도 값(current_snf)을 검사하여 산술 복호화가 요구되는지에 대하여 판단한다. 판단 결과, 산술 복호화가 요구되는 경우에는 S130 단계로, 산술 복호화가 요구되지 않는 경우에는 S150 단계로 각각 진행한다.
최대 중요도 값(max_snf)이 최소 중요도 값(min_snf)보다 작아지면, S160 단계로 진행하여 매 프레임마다 산술 복호화가 수행된 코딩 밴드들을 대상으로 중요도 검색 트리를 업데이트(update)한다.
다음으로, S130 단계에서, 코딩 밴드 단위로 심볼들을 산술 복호화한 후, S140 단계에서, 산술 복호화가 수행된 코딩 밴드들을 확인하여 중요도 검색 트리를 업데이트하기 위한 코딩 밴드 범위를 체크한다.
다음으로, S150 단계에서, 최대 중요도 값(max_snf)이 최소 중요도 값(min_snf)보다 작아질 때까지 최대 중요도 값을 1씩 감소시키면서 S110 단계 내지 S150 단계를 반복한다.
도 7은 본 발명의 다른 실시예에 따른 오디오 복호화 방법을 나타낸 흐름도이다.
먼저, S100 단계에서, 코딩 밴드 단위의 중요도 검색 트리를 이용해 기반 계층 내지 타겟 계층 중의 하나인 기준 계층의 최대 중요도 값(max_snf)을 구하고, S110 단계에서, 최대 중요도 값(max_snf)을 최소 중요도 값(min_snf)과 비교하여 산술 복호화의 필요성을 결정한다.
최대 중요도 값(max_snf)이 최소 중요도 값(min_snf)보다 크거나 같으면, S121 단계로 진행하여 중요도 검색 트리를 이용해 기준 계층에 속하는 심볼들의 실질 중요도 값(current_snf)을 최대 중요도 값(max_snf)과 비교하면서 심볼들의 복호화 위치(Decoding Position)를 검색한다.
그리고, 검색 결과에 따라 현재 계층(Layer)에서 산술 복호화가 요구되는지 아닌지를 판단하고, 최대 중요도 값(max_snf)에 의해 산술 복호화가 요구될 때에도 각 심볼들의 계수(coefficient)에 대한 실질 중요도 값(current_snf)을 검사하여 산술 복호화가 요구되는지에 대하여 판단한다. 판단 결과, 산술 복호화가 요구되는 경우에는 S130 단계로, 산술 복호화가 요구되지 않는 경우에는 S150 단계로 각각 진행한다.
최대 중요도 값(max_snf)이 최소 중요도 값(min_snf)보다 작아지면, S160 단계로 진행하여 매 프레임마다 산술 복호화가 수행된 코딩 밴드들을 대상으로 중요도 검색 트리를 업데이트(update)한다.
다음으로, S130 단계에서, 코딩 밴드 단위로 심볼들을 산술 복호화한 후, S140 단계에서, 산술 복호화가 수행된 코딩 밴드들을 확인하여 중요도 검색 트리를 업데이트하기 위한 코딩 밴드 범위를 체크한다.
다음으로, S150 단계에서, 최대 중요도 값(max_snf)이 최소 중요도 값(min_snf)보다 작아질 때까지 최대 중요도 값(max_snf)을 1씩 감소시키면서 S110 단계 내지 S150 단계를 반복한다.
도 8은 도 6 또는 도 7의 일부 단계를 보다 상세히 나타낸 흐름도로서, S100 단계를 보다 세부적으로 도시하고 있다.
도 8을 참조하면, S100 단계는 코딩 밴드 단위의 중요도 검색 트리 형성 단계(S101), 주파수 검색 범위 계산 단계(S102), 코딩 밴드 단위로 최대 중요도 값(max_snf)을 검색하는 단계(S103), 마지막 코딩 밴드에서 전체 검색(full search) 방식을 이용하여 최대 중요도 값(max_snf)을 검색하는 단계(S104)로 세분화될 수 있다.
즉, 도 6이나 도 7의 S100 단계에 있어서, 중요도 검색 트리와 소정의 주파수 범위(full_search_range)에 대한 전체 검색 방식을 함께 적용하여 계층 별로 최대 중요도 값(max_snf)을 구하는 것이다(도 5 설명 부분 참조).
이때, 프레임 당 계산량은 각 계층에 속하는 코딩 밴드 수(cband_range)와 전체 검색 방식이 적용된 주파수 범위(full_search_range)의 합과, 채널 수(channel)와, 윈도우 그룹 수(window_group)와, 계층 수(Layer)의 곱에 해당하는 값이 된다.
이상 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.
따라서, 이상에서 기술한 실시예들은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이므로, 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 하며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
상기한 바와 같이 이루어진 본 발명의 바람직한 실시예에 따른 오디오 복호화 장치 및 그 방법은 비트 슬라이스 연산 코딩에서 오디오 신호의 산술 복호화 시 에 발생하는 많은 계산량을 기존 대비 최대 1/16 수준으로 감소시키고, 그에 따른 복호화기의 성능 개선이나 비용 절감을 유도할 수 있다.

Claims (10)

  1. 계층 구조로 부호화된 오디오 신호를 기반 계층에서 타겟 계층까지 비트율 조절이 가능하도록 복호화하는 장치에 있어서,
    계층 별 부가 정보를 복호화하여 각 계층에 속하는 심벌들의 실질 중요도 값들을 얻고, 계층 별 최대 중요도 값을 참조하여 최상위 비트들로 구성된 심벌에서부터 최하위 비트들로 구성된 심벌의 순서로 코딩 밴드 단위의 복호화를 수행하여 양자화 샘플들을 얻는 비트 플레인 복호화부; 및
    상기 실질 중요도 값들을 상기 코딩 밴드 단위로 묶어 상기 코딩 밴드 단위의 중요도 검색 트리를 형성하며, 상기 중요도 검색 트리를 이용하여 계층 별로 상기 최대 중요도 값을 구하는 연산부를 포함하는 것을 특징으로 하는 오디오 복호화 장치.
  2. 제1항에 있어서,
    상기 부가 정보를 기초로 상기 양자화 샘플들을 역양자화하여 원래 크기의 오디오 신호로 복원하는 역양자화부;
    상기 복원된 오디오 신호를 주파수 영역에서 시간 영역으로 변환하는 주파수/시간 맵핑부; 및
    상기 중요도 검색 트리가 저장 및 갱신되는 프레임 버퍼를 더 포함하는 것을 특징으로 하는 오디오 복호화 장치.
  3. 제1항에 있어서,
    상기 연산부는,
    상기 중요도 검색 트리와 소정의 주파수 범위에 대한 전체 검색 방식을 함께 적용하여 계층 별로 상기 최대 중요도 값을 구하는 것을 특징으로 하는 오디오 복호화 장치.
  4. 제3항에 있어서,
    상기 연산부의 프레임 당 계산량은,
    각 계층에 속하는 코딩 밴드 수와 전체 검색 방식이 적용된 주파수 범위의 합과, 채널 수와, 윈도우 그룹 수와, 계층 수의 곱에 해당하는 값인 것을 특징으로 하는 오디오 복호화 장치.
  5. 제1항에 있어서,
    상기 비트 플레인 복호화부에서,
    상기 부가 정보는 차분 복호화되고, 상기 심벌들은 산술 복호화되는 것을 특징으로 하는 오디오 복호화 장치.
  6. 계층 구조로 부호화된 오디오 신호를 기반 계층에서 타겟 계층까지 비트율 조절이 가능하도록 복호화하는 방법에 있어서,
    (a) 코딩 밴드 단위의 중요도 검색 트리를 이용해 상기 기반 계층 내지 상기 타겟 계층 중의 하나인 기준 계층의 최대 중요도 값을 구하는 단계;
    (b) 상기 최대 중요도 값을 최소 중요도 값과 비교하여 산술 복호화의 필요성을 결정하는 단계;
    (c) 최대 중요도 값이 상기 최소 중요도 값보다 크거나 같으면, 상기 기준 계층에 속하는 심볼들의 실질 중요도 값을 상기 최대 중요도 값과 비교하면서 상기 심볼들의 복호화 위치를 검색하는 단계;
    (d) 상기 코딩 밴드 단위로 상기 심볼들을 산술 복호화하는 단계;
    (e) 상기 산술 복호화가 수행된 코딩 밴드들을 확인하여 상기 중요도 검색 트리를 업데이트하는 단계; 및
    (f) 상기 최대 중요도 값이 상기 최소 중요도 값보다 작아질 때까지 상기 최대 중요도 값을 1씩 감소시키면서 상기 (a) 단계 내지 상기 (e) 단계를 반복하는 단계를 포함하는 것을 특징으로 하는 오디오 복호화 방법.
  7. 계층 구조로 부호화된 오디오 신호를 기반 계층에서 타겟 계층까지 비트율 조절이 가능하도록 복호화하는 방법에 있어서,
    (a) 코딩 밴드 단위의 중요도 검색 트리를 이용해 상기 기반 계층 내지 상기 타겟 계층 중의 하나인 기준 계층의 최대 중요도 값을 구하는 단계;
    (b) 상기 최대 중요도 값을 최소 중요도 값과 비교하여 산술 복호화의 필요성을 결정하는 단계;
    (c) 최대 중요도 값이 상기 최소 중요도 값보다 크거나 같으면, 상기 중요도 검색 트리를 이용하여 상기 기준 계층에 속하는 심볼들의 실질 중요도 값을 상기 최대 중요도 값과 비교하면서 상기 심볼들의 복호화 위치를 검색하는 단계;
    (d) 상기 코딩 밴드 단위로 상기 심볼들을 산술 복호화하는 단계;
    (e) 상기 산술 복호화가 수행된 코딩 밴드들을 확인하여 상기 중요도 검색 트리를 업데이트하는 단계; 및
    (f) 상기 최대 중요도 값이 상기 최소 중요도 값보다 작아질 때까지 상기 최대 중요도 값을 1씩 감소시키면서 상기 (a) 단계 내지 상기 (e) 단계를 반복하는 단계를 포함하는 것을 특징으로 하는 오디오 복호화 방법.
  8. 제6항에 있어서,
    상기 (a) 단계에서,
    상기 중요도 검색 트리와 소정의 주파수 범위에 대한 전체 검색 방식을 함께 적용하여 계층 별로 상기 최대 중요도 값을 구하는 것을 특징으로 하는 오디오 복호화 방법.
  9. 제7항에 있어서,
    상기 (a) 단계에서,
    상기 중요도 검색 트리와 소정의 주파수 범위에 대한 전체 검색 방식을 함께 적용하여 계층 별로 상기 최대 중요도 값을 구하는 것을 특징으로 하는 오디오 복 호화 방법.
  10. 제8항 또는 제9항에 있어서,
    상기 (a) 단계에서,
    프레임 당 계산량은,
    각 계층에 속하는 코딩 밴드 수와 전체 검색 방식이 적용된 주파수 범위의 합과, 채널 수와, 윈도우 그룹 수와, 계층 수의 곱에 해당하는 값인 것을 특징으로 하는 오디오 복호화 방법.
KR1020060008252A 2006-01-26 2006-01-26 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법 KR100793287B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020060008252A KR100793287B1 (ko) 2006-01-26 2006-01-26 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법
US11/626,491 US7831436B2 (en) 2006-01-26 2007-01-24 Apparatus for decoding audio data with scalability and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060008252A KR100793287B1 (ko) 2006-01-26 2006-01-26 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20070087897A true KR20070087897A (ko) 2007-08-29
KR100793287B1 KR100793287B1 (ko) 2008-01-10

Family

ID=38285541

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060008252A KR100793287B1 (ko) 2006-01-26 2006-01-26 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법

Country Status (2)

Country Link
US (1) US7831436B2 (ko)
KR (1) KR100793287B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101322392B1 (ko) * 2006-06-16 2013-10-29 삼성전자주식회사 스케일러블 코덱의 부호화 및 복호화 방법 및 장치
KR101047056B1 (ko) * 2009-03-23 2011-07-06 (주)부리멀티미디어 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법
CN102074243B (zh) * 2010-12-28 2012-09-05 武汉大学 一种基于比特平面的感知音频分级编码系统及方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0144935B1 (ko) * 1994-12-31 1998-08-17 김광호 비트율 조정이 가능한 부호화 및 복호화장치
KR100346733B1 (ko) 1995-09-22 2002-11-23 삼성전자 주식회사 비트스트림의스케일조절이가능한오디오부호화/복호화방법및장치
KR100261254B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
KR100338801B1 (ko) 1997-07-31 2002-08-21 삼성전자 주식회사 디지털데이터의부호화/복호화방법및장치
KR100335611B1 (ko) 1997-11-20 2002-10-09 삼성전자 주식회사 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
KR100908117B1 (ko) * 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
KR100528325B1 (ko) 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
KR100528327B1 (ko) * 2003-01-02 2005-11-15 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치

Also Published As

Publication number Publication date
KR100793287B1 (ko) 2008-01-10
US20070171990A1 (en) 2007-07-26
US7831436B2 (en) 2010-11-09

Similar Documents

Publication Publication Date Title
EP1904999B1 (en) Frequency segmentation to obtain bands for efficient coding of digital media
AU2006270263B2 (en) Modification of codewords in dictionary used for efficient coding of digital media spectral data
US6345126B1 (en) Method for transmitting data using an embedded bit stream produced in a hierarchical table-lookup vector quantizer
KR101130355B1 (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어 스펙트럼 데이터의 효과적인 코딩
KR101029076B1 (ko) 오디오 데이터 부호화 및 복호화 장치와 방법
EP2006840B1 (en) Entropy coding by adapting coding between level and run-length/level modes
KR20080025399A (ko) 적응적 코딩 및 디코딩에서 다수의 엔트로피 모델의 선택적사용
KR101033256B1 (ko) Fgs 오디오 부호화에서 스케일 팩터방식 비트시프트
CN1121620A (zh) 音频信号编码/译码方法
US20050201629A1 (en) Method and system for scalable binarization of video data
CN107666472B (zh) 混合的数字-模拟编解码的方法和设备
KR100793287B1 (ko) 비트율 조절이 가능한 오디오 복호화 장치 및 그 방법
KR100765747B1 (ko) 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치
KR100975522B1 (ko) 스케일러블 오디오 복/부호화 방법 및 장치
US7495586B2 (en) Method and device to provide arithmetic decoding of scalable BSAC audio data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
E90F Notification of reason for final refusal
B701 Decision to grant
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]
FPAY Annual fee payment

Payment date: 20130102

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140102

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee