KR101644883B1 - 오디오 신호 처리 방법 및 장치 - Google Patents

오디오 신호 처리 방법 및 장치 Download PDF

Info

Publication number
KR101644883B1
KR101644883B1 KR1020100035031A KR20100035031A KR101644883B1 KR 101644883 B1 KR101644883 B1 KR 101644883B1 KR 1020100035031 A KR1020100035031 A KR 1020100035031A KR 20100035031 A KR20100035031 A KR 20100035031A KR 101644883 B1 KR101644883 B1 KR 101644883B1
Authority
KR
South Korea
Prior art keywords
scale factor
global gain
difference value
information
bands
Prior art date
Application number
KR1020100035031A
Other languages
English (en)
Other versions
KR20100114484A (ko
Inventor
윤성용
이현국
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20100114484A publication Critical patent/KR20100114484A/ko
Application granted granted Critical
Publication of KR101644883B1 publication Critical patent/KR101644883B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 포함하는 비트스트림을 수신하는 단계; 밴드의 개수를 수신하는 단계; 상기 밴드의 개수를 이용하여 산술 코딩함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 단계; 상기 글로벌게인 정보 및 상기 스케일팩터 차분값을 이용하여 스케일팩터 데이터를 생성하는 단계; 및 상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 단계를 포함하는 오디오신호의 코딩방법이 개시된다.

Description

오디오 신호 처리 방법 및 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}
본 발명은 신호 처리 방법 및 장치에 관한 것으로서, 더욱 상세하게는 오디오 코딩에 있어서 양자화된 데이터(예: 글로벌게인과 스케일팩터 데이터)를 코딩하기 위한 방법 및 장치에 관한 것이다.
일반적으로, 음악 신호와 같은 오디오 신호에 대해서는 오디오 특성에 기반한 코딩 방식을 적용하고, 음성 신호에 대해서는 음성 특성에 기반한 코딩 방식을 적용한다.
오디오 특성과 음성 특성이 혼재되어 있는 신호에 대해서 어느 하나의 코딩 방식을 적용하는 경우, 오디오 코딩 효율이 떨어지거나, 음질이 나빠지는 문제점이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 스케일팩터 정보를 전송하는 데 있어서 비트수를 줄일 수 있는 코딩 방법 및 장치를 제공하는 데 그 목적이 있다.
본 발명의 또 다른 목적은, 신호 처리에서 글로벌게인정보와 스케일팩터 데이터를 정보간의 연관성에 따라서 효율적으로 전송하기 위한 코딩방법 및 장치에 대한 것이다.
본 발명의 또 다른 목적은, 팩터 데이터(스케일팩터 데이터 또는 스케일팩터 밴드의 개수 등)를 전송하는 데 있어서, 이전 프레임의 데이터를 이용하여 효율적으로 전송하기 위한 코딩 방법 및 장치를 제공하는 데 있다.
본 발명은 다음과 같은 효과와 이점을 제공한다.
첫째, 음성 신호의 특성을 갖는 신호는 음성 신호로 디코딩하고, 오디오 신호의 특성을 갖는 신호는 오디오 신호로 디코딩하기 때문에, 각 신호 특성에 부합하는 디코딩 방식이 적응적으로 선택되는 효과가 있다.
둘째, 글로벌게인과 스케일팩터 데이터의 코딩 방식을 산술코딩방식으로 통합함으로써 추가적으로 발생할 수 있는 오버헤드값을 줄이고 낮은 비트수로 코딩이 가능하다.
셋째, 현재 프레임의 팩터 데이터를 그대로 전송하지 않고, 이전 프레임의 팩터 데이터와의 차분값을 전송함으로써, 비트수를 줄일 수 있다.
넷째, 허프만 코딩방식에서는 확률테이블의 변경이 어려운 반면에 본 발명에서는 가변적으로 확률테이블을 변경하여 효율적인 코딩이 가능하다.
다섯째, 허프만 코딩방식에서 여러 개의 심볼을 이어서 코딩하는 경우에 비효율적인 반면 산술코딩시 한 세트의 여러 심볼을 보낼 때 비트수를 줄일 수 있는 유리한 이점을 가지고 있다.
여섯째, 사용되는 스케일팩터데이터의 개수를 1만큼 뺀 값으로 코딩하므로써, 코딩에 소요되는 비트수를 절약할 수 있다.
일곱째, 글로벌게인의 할당 비트수를 가변비트수로 코딩 함으로써, 코딩에 소요되는 비트수를 현저히 절약할 수 있다.
여덟째, 글로벌게인을 리셋플래그에 따라 절대값과 스케일팩터의 차분값으로 병행하여 사용할 수 있으므로, 비트수를 절약할 수 있다.
도 1은 본 발명의 일 실시예에 따른 인코딩 장치의 구성도.
도 2는 본 발명의 일 실시예에 따른 인코딩 방법에 대한 순서도.
도 3(a)는 스케일팩터 및 스케일팩터 밴드의 관계에 대한 도면.
도3(b)는 윈도우그룹이 여러 개일 때 스케일팩터 및 스케일팩터 밴드의 관계에 대한 도면.
도 4는 본 발명의 일 실시예에 따른 게인결정부의 세부 순서도.
도 5는 전송되는 비트스트림의 스케일팩터의 차분값과 스펙트럴 데이터의 관계에 대한 도면.
도 6은 글로벌 게인 및 스케일팩터의 차분값과의 관계에 대한 도면.
도 7은 본 발명의 일 실시 예에 따른 산술인코딩부에 대한 세부 순서도.
도 8 은 본 발명의 일 실시 예에 따른 멀티플렉싱부에 대한 세부순서도.
도 09는 본 발명의 일 실시예에 따른 주파수도메인기반 코딩정보에 관한 채널의 비트스트림의 스케일팩터 밴드의 개수가 하나 이상일 때 수행되는 신텍스.
도 10은 본 발명의 일 실시예에 따른 스케일팩터와 스펙트럴데이터에 관한 신텍스.
도 12은 본 발명의 일 실시예에 따른 리셋플래그에 따른 산술코딩정보에 관한 신텍스.
도 13은 본 발명의 일 실시예에 따른 디코딩 장치의 구성도.
도 14는 본 발명의 일 실시예에 따른 디코딩 방법의 순서도.
도 15는 도 12의 디멀티플렉싱부의 일 실시 예에 따른 세부 순서도.
도 16은 도 12의 게인획득부의 일 실시 예에 따른 세부 순서도 .
도 17은 도 12의 산술디코딩부의 일 실시 예에 따른 세부 순서도.
도 18은 본 발명의 다른 실시예에 따른 산술코딩장치가 구현된 제품의 개략적인 구성도.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시 예를 상세히 설명하기로 한다.  이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 따라서, 본 명세서에 기재된 실시 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일 실시 예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다.
상기와 같은 목적을 달성하기 위하여 본 발명에 따른 신호처리 방법은 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 포함하는 비트스트림을 수신하는 단계와 밴드의 개수를 수신하는 단계 및 상기 밴드의 개수를 이용하여 산술 코딩 함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 단계, 상기 글로벌게인 정보 및 상기 스케일팩터 차분값을 이용하여 스케일팩터 데이터를 생성하는 단계 및 상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 단계를 포함한다.
본 발명에서 다음 용어는 다음과 같은 기준으로 해석될 수 있고, 기재되지 않은 용어라도 하기 취지에 따라 해석될 수 있다. 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 의미는 달리 해석될 수 있는바, 그러나 본 발명은 이에 한정되지 아니한다.
또한, 본 발명에서 스케일팩터 밴드란, 하나의 스케일팩터가 적용되는 주파수 밴드에 해당할 수 있지만, 이에 한정되지 아니하고, 다양한 용도의 주파수 밴드를 의미하는 것으로 이해되어야 한다. 한편 하나의 스케일팩터는 복수의 스펙트럴 데이터에 대응될 수 있는 값이므로, 스케일팩터 밴드는 복수의 스펙트럴 데이터에 적용되는 주파수 밴드일 수 있다. 여기서 스케일팩터 및 스펙트럴 데이터는 오디오 신호를 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 등을 수행하여 주파수 스펙트럼으로 변환이 수행된 결과일 수도 있지만 이에 한정되지 않는다.
여기서 오디오 신호(audio signal)란, 광의로는, 비디오 신호와 구분되는 개념으로서, 재생 시 청각으로 식별할 수 있는 신호를 지칭하고, 협의로는, 음성(speech) 신호와 구분되는 개념으로서, 음성 특성이 없거나 적은 신호를 의미한다.
본 발명에 따른 오디오 신호 처리 방법 및 장치는, 변형이산 코사인 변환, 게인 결정과정 및 산술코딩이 이용되고 멀티플렉싱과 양자화 과정이 이용될 수 있는 인코딩/디코딩 장치 및 방법이 될 수 있는바, 이하, 변형 이산 코사인 변환(S110 단계), 양자화 과정(S120단계), 게인 결정 과정(S130단계), 산술코딩과정(S140단계) 및 멀티플렉싱 과정(S150단계)에 대하여 설명하고, 위 과정들이 적용된 오디오 신호 인코딩/ 디코딩 장치 및 방법에 대해서 설명하고자 한다.
도1은, 본 발명의 일 실시예에 따른 신호 인코딩 장치(100)의 구성을 보여주는 도면이다. 도 1을 참조하면, 본 발명의 일 실시예에 따른 오디오 신호 인코딩 장치는 게인결정부(130) 및 산술코딩부(140)를 포함하고, 주파수 변환부(110), 양자화부(120), 및 멀티플렉싱부(150)를 더 포함할 수 있다.
이하 도 1 및 도 2를 함께 참조하면서 본 발명의 실시예에 따른 오디오 신호 인코딩 장치 및 이 장치가 수행하는 인코딩 방법에 대해서 설명하고자 한다.
주파수변환부(110)는 입력된 오디오 신호에 대해 주파수 변환을 수행함으로써 스펙트럴 계수를 획득한다(S110 단계). 여기수 주파수 변환은 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 방식에 따른 것일 수 있지만 본 발명은 이에 한정되지 아니한다. 시간-주파수 변환 기법으로 변형 이산 코사인 변환의 장점은 데이터율을 증가시키지 않으면서도 이웃한 블록 간에 50%중복을 허용할 수 있어 블록 변환에서 발생하는 에지에러나 에일리어싱을 효율적으로 제거하는 동시에 코더의 완전복원 조건을 만족할 수 있다. 이러한 주파수 도메인으로 변환함으로써 양자화 과정의 전단계인 스펙트럴 계수를 얻는다.
이러한 시간 주파수 변환은 시간영역신호를 주파수 영역으로 변환하는 것으로 오디오신호를 몇 개의 주파수 성분으로 세분화하고 이들 주파수 성분의 에너지 비율에 따라 비트를 적절히 할당하여 신호의 중복성을 줄이는 방법이다. 대표적으로 변형 이산 코사인 변환(MDCT)등이 이에 해당한다.
코딩된 비트스트림은 주파수 도메인 기반 코딩채널스트림 (fd_channel_stream)을 통해 전송된다. 음성 성분이 들어가 있는 데이터는 주로 선형 예측(Linear Prediction)기반의 코딩장치를 사용하는데 이 정보는 선형 예측된 주파수 도메인 기반 코딩채널스트림(Lpd_Channel_Stream)을 통해 전송된다.
이에 반하여 음악 데이터의 코딩에 주로 사용하는 주파수 도메인 기반 코딩채널스트림(Fd_Channel_Stream)의 경우에는 각 프레임의 샘플들을 변형 이산 코사인 변환(MDCT)을 통해 주파수 도메인의 값들로 변환한다.
한편, 상기 주파수 변환은 스케일팩터 밴드별로 수행될 수 있으나, 본 발명은 이에 한정되지 아니한다. 스케일팩터 밴드에 대해서는 추후 도 3과 함께 후술하고자 한다.
상기 양자화부(120)는 스펙트럴 계수에 대해서 양자화를 수행함으로써, 스케일팩터 및 스펙트럴 데이터를 획득한다(S120 단계). 이 단계는 다음 수학에 따라 수행될 수 있다.
Figure 112010024194443-pat00001
상기 수학식에서 X'는 X를 양자화하여 얻어지는 근사값이며 이를 스펙트럴 계수라 한다. scf는 정수로 X양자화된 스케일팩터, Xquant는 정수로 양자화된 스펙트럴 데이터를 의미한다.
스케일팩터는 스펙일팩터 밴드별로 정해질 수 있는데, 이에 대해서는 도 3을 참조하면서, 설명하고자 한다. 도 3은 스케일팩터와 스케일팩터 밴드의 관계를 나타낸 도면이다. 도 3의 (a)를 우선 참조하면, 각 스케일팩터 밴드에 하나의 스케일팩터가 존재함을 알 수 있다. 즉, 스케일팩터 밴드(sfb)는 0번째부터 max_sfb-1번째까지(여기서 max_sfb는 앞서 언급한 바와 같이 밴드의 개수) 존재하고, 각 스케일팩터 밴드(sfb(i))에 대응하여 스케일팩터(scf[i])가 존재함을 알 수 있다. 밴드의 개수(max_sfb)는 프레임에 상관없이 고정된 값일 수 있지만, 프레임마다 변화하는 값일 수도 있다.
도 3의 (b)는 윈도우 그룹이 여러 개일 때의 경우에 스케일팩터의 개수 및 스케일팩터 밴드의 개수와의 관계를 나타내는 도면이다. 도 3의 (b)를 참조하면 윈도우 그룹이 개수가 num_window_groups인 경우, 하나의 스케일팩터 밴드(sfb[i])에는 복수의 스케일팩터(scf[i](g=0), scf[i](g=1), ,scf[i](g=num_window_group-1)가 존재함을 알 수 있다. 한편, 복수의 스케일팩터(scf[i](g=0), scf[i](g=1), ,scf[i](g=num_window_group-1) (여기서 i는 스케일팩터 밴드 인덱스)는 서로 다른 값을 가질 수 있음은 물론이다. 즉, 총 스케일팩터의 개수는 윈도우 그룹의 개수(num_window_groups) 및 스케일팩터 밴드의 개수(max_sfb)의 곱에 해당함을 알 수 있다.
다시 도 1 및 도 2를 참조하면, 앞서 설명한 양자화부(120)는 양자화를 수행함으로써 스케일팩터 및 스펙트럴 데이터를 획득하는 과정에 있어서, 스펙트럴 밴드의 개수(또는 밴드의 개수)(max_sfb) 및 윈도우 그룹의 개수(num_window_groups)를 이용하거나 결정한다. 이 밴드의 개수 및 윈도우 그룹의 개수는 멀티플렉싱부(150)에 전달되어 비트스트림에 포함될 수 있다. 예를 들어 윈도우 그룹의 개수는 ics_info()의 스케일팩터 그룹핑 정보(scale_factor_grouping info)를 바탕으로 알 수 있으며, 스케일팩터 밴드의 개수(max_sfb) 또한 매 프레임마다 전송될 수 있다.
한편, 게인결정부(130)는 양자화부(120)에 의해 획득된 스케일팩터(scf[i])를 근거로 글로벌 게인(gg: global gain) 및 스케일팩터 차분값(dscf[i])를 결정한다(S130 단계). 나아가 글로벌 게인(gg)를 근거로 글로벌 게인 정보를 생성할 수 있다. 글로벌 게인 정보가 글로벌 게인의 차분값에 해당하는지 절대값에 해당하는지를 나타내는 리셋 플래그를 셋팅하여 멀티플렉싱부(150)에 전달할 수 있다. 이에 대한 구체적인 설명은 도 4내지 도 6 등 과 함께 후술하고자 한다.
산술코딩부(140)는 게인 결정부(130)에 의해 생성된 글로벌 게인 정보 및 스케일팩터 차분값(dscf[i]) 및 스펙트럴 데이터(sptr[j])에 대해서 산술 코딩(Arithmetic coding)을 수행함으로써 코딩 결과를 멀티플렉싱부(150)에 전달한다(S140 단계). 이 과정에 대한 구체적인 설명은 도 7과 함께 설명하고자 한다.
도 4는 앞서 언급된 게인결정부(130)가 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)을 생성하는 세부적인 과정에 해당하는 순서도 있다. 도 4를 참조하면, 우선 게인결정부(13)는 스케일팩터(scf)를 이용하여 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)를 생성한다(S132 단계). 우선 도 5를 참조하면서, 글로벌 게인 및 스케일팩터 차분값의 관계에 대해서 살펴보고자 한다. 도 5를 참조하면, 글로벌 게인(gg)는 하나의 프레임 내에 속하는 복수의 스케일팩터(scf[])를 대표하는 값으로서, 첫 번째 스케일팩터 밴드(i=0)에 대응하는 스케일팩터(scf[0])와 동일한 값일 수 있다. 스케일팩터 차분값(dscf[])은 일련의 스케일팩터들 중에서 이전에 해당하는 스케일팩터(예: scf[max_sfb_-m])과 현재의 스케일팩터(예:scf[max_sfb-m+1])와의 차분값에 해당할 수 있다. 따라서, 첫 번째 스케일팩터(scf[0])가 글로벌 게인(gg)이 되는 경우, 첫 번째 스케일팩터 밴드에 대응하는 스케일팩터 차분값(dscf[0])은 0이 될 수 있다.
또한, 글로벌게인을 조절하는 경우 전체적인 게인의 조절이 가능하다. 그러므로 글로벌게인을 1만큼 증가시키는 경우 전체적인 스케일팩터의 값들이 1만큼 증가하는 효과를 얻는다.
도 6을 참조하면, 윈도우 그룹이 여러 개인 경우 일련의 스케일팩터들이 나타나 있음을 알 수 있다. 여기서 스케일 팩터들은 도면에서와 같이 윈도우그룹 순서대로(즉 g=0에 속하는 스케일팩터들 이후에 g=1에 속하는 스케일팩터들이 존재, g는 윈도우 그룹 인덱스) 있을 수도 있지만, 스케일팩터 밴드 순서대로(즉, i=0은 스케일팩터들이 위치한 다음에, i=1에 속하는 스케일팩터들이 위치(i는 스케일팩터 밴드 인덱스)) 존재할 수도 있다.
다시 도 4를 참조하면, S132 단계에서 글로벌 게인(gg)이 결정된 이후, 이 현재 프레임에 해당하는 글로벌 게인(gg_cur)을 그대로 글로벌 게인 정보로서 전송할지 아니면, 이전 프레임의 글로벌 게인(gg_prev)과의 차분값을 글로벌 게인 정보로서 전송할지 여부를 결정한다(S133 단계).
만약, 이전 프레임의 글로벌 게인(gg_prev)를 참조하기로 결정한 경우(S133 단계의 yes), 게인 결정부(130)에 의해 획득된 글로벌 게인값에 이전 프레임의 글로벌 게인(gg_prev)을 차감함으로써 글로벌 게인의 차분값을 획득한다(S134 단계)(상대값 모드). 이 경우 이전 프레임의 정보를 참조하는지 여부를 나타내는 리셋 플래그를 셋팅한다. 예를 들어, 이전 프레임의 정보를 참조한다는 것을 나타내기 위해 리셋 플래그를 0으로 셋팅할 수 있다(S136 단계).
반대로, 이전 프레임의 글로벌 게인(gg_prev)를 참조하지 않기로 결정한 경우 (S133 단계의 no), 게인 결정부(130)에 의해 획득된 글로벌 게인값의 절대값 그대로 글로벌 게인 정보로 코딩한다(S135 단계)(절대값 모드). 이 경우, 이전 프레임의 정보를 참조하지 않는다는 것을 나타내기 위해 리셋 플래그를 1로 셋팅할 수 있지만(S137 단계), 본 발명은 이에 한정되지 아니한다. 글로벌게인정보가 절대값을 가지는 경우는 예를 들어 처음부터 코딩되지 아니하고 중간부터 코딩해야 하는 경우 이전프레임의 정보를 이용할 수 없어 코딩이 불가능한 경우 효율적으로 절대값을 지정하여 코딩하게 할 수 있는 것이다.
한편, 여기서 글로벌 게인 정보(gg) (차분값 또는 절대값)은 그대로 전송할 수 있지만 옵셋(OFFSET)값을 적용(global_gain=global_gain + SF_OFFSET, SF_OFFSET=100)한 후에 전송할 수도 있다.
한편, 스케일팩터의 경우, 인덱스 오프셋(index_offset)이 더 이용될 수 있다. 여기서 인덱스 오프셋(index_offset)이란, 예를 들어, 인코더에서 -100 ~155을 0~255로 표현하기 위해 빼주고, 디코더에서 0 ~255를 -100 ~155로 복원하기 위해 더해주는 수(예: -100)일 수 있다. 따라서 작은 숫자로 인코더에서 전송함으로써 비트수를 줄이고 추후에 디코더에서 복원과정을 거쳐 신호를 만들어 효율을 높일 수 있다.
도 5 및 도 6은 산술 코딩의 대상을 설명하기 위한 도면이고, 도 7은 앞서 산술코딩부(140)가 산술코딩을 수행하는 과정의 세부 단계에 대한 도면이다. 우선 도 5를 참조하면, 글로벌 게인(gg: global_gain), 및 스케일팩터 차분값(dscf[i], i는 스펙트럴밴드 인덱스) 및 스펙트럴 데이터(sptr[j])(j는 스펙트럴 데이터 인덱스)가 순서대로 위치하고 있음을 알 수 있다. 스케일팩터 차분값(dscf[])는 스케일팩터(scf[])와 그 개수가 동일할 수 있다. 앞서 설명한 바와 같이, 하나의 스케일팩터 밴드(sfb)에 복수의 스펙트럴 데이터(sptr[j])가 대응될 수 있기 때문에, 스펙트럴 데이터의 개수(n)은 스케일팩터 차분값의 개수보다 클 수 있다.
이와 같이 글로벌 게인(gg), 스케일팩터 차분값(dscf) 및 스펙트럴 데이터(sptr) 전체가 산술 코딩의 대상이 되거나, 또는 글로벌 게인(gg) 및 스케일팩터 차분값(dscf)가 산술 코딩의 대상이 될 수 있다.
산술 코딩(Arithmetic coding)이라 함은 엔트로피 코딩 방식 중 하나로서, 각 소스 심볼 대신 전체 메시지를 0과 1 사이의 단일 숫자로 변환하여 코딩하는 방법이다. 메시지의 크기에 따라, 허프만 코딩보다 압축률은 좋을 수 있다.
도 6은 윈도우 그룹이 여러 개인 경우, 산술 코딩의 대상을 나타내는 도면으로서, 도 5의 경우보다 스케일팩터 차분값(dscf)의 개수가 윈도우 그룹의 개수(num_window_group)에 비례해서 크다는 점에서 차이가 있다.
도 7을 참조하면서 산술코딩부(140)의 세부 과정에 대해서 설명하고자 한다. 앞서 도 5 및 도 6과 함께 나타낸 산술 코딩의 대상 중에서, 첫번째 밴드의 스케일팩터 차분값(dscf[0])이 0이 될 수 있기 때문에, 이를 산술 코딩의 대상에 포함시킬 수도 있거나(S141 단계), 제외시킬 수도 있다(S142 단계).
이전 프레임의 동일 밴드의 스케일팩터의 차분값을 참조하여 산술코딩시 이용할 확률테이블을 선택한다(S143 단계). 이전프레임의 동일 밴드의 스케일팩터의 차분값을 이용함으로써, 코딩시 대체로 비슷한 패턴을 보이는 특성을 이용하여 이에 따른 확률분포를 분석한다. 이에 따른 확률테이블로서 코딩하여 코딩효율을 높이는 것이 가능하다.
표1에 따르면 이전 프레임의 스케일팩터 밴드에서의 차분값이 현재프레임의 스케일팩터의 차분값과 상관성을 가지고 있으며, 이는 이전프레임의 스케일팩터의 각 값에 대하여 현재프레임의 스케일팩터의 차분값이 0을 중심으로 가장 높은 값으로 분포되어 있으며, 이전 프레임의 스케일팩터의 차분값이 양수로 갈수록 현재프레임의 스케일팩터의 차분값은 일반적으로 낮아지는 분포를 가지므로 표1과 같은 상관성에 근거하여 현재 프레임의 스케일팩터의 차분값을 코딩하는데 이용할 수 있다.
이전 프레임과 현재 프레임간의 스케일팩터의 차분값(dscf) 관계 예
이전 프레임의 동일 스케일팩터 밴드에서의스케일팩터의 차분값
-4 -3 -2 -1 - 1 2 3 4
현재프레임의 스케일팩터의 차분값
-6 ... ... ... ... ... ... ... ... ...
-5 ... 1.9% 1.1% 0.6% 0.4% 0.3% 0.3% 0.3% ...
-4 ... 3.7% 2.3% 1.4% 0.9% 0.9% 0.8% 0.8% ...
-3 ... 7.1% 5.1% 3.6% 2.4% 2.3% 2.3% 2.0% ...
-2 ... 11.9% 10.5% 8.5% 6.2% 5.9% 5.6% 5.0% ...
-1 ... 14.3 14.7% 15.0% 11.5% 11.0% 9.8% 8.7% ...
0 ... 47.2% 52.3% 56.5% 63.3% 55.9% 53.3% 50.2% ...
1 ... 7.1% 7.7% 8.3% 8.5% 12.4% 13.0% 13.2% ...
2 ... 3.2% 3.5% 3.6% 4.0% 6.4% 7.7% 8.8% ...
3 ... 1.3% 1.3% 1.4% 1.6% 2.8% 3.9% 5.1% ...
4 ... 0.5% 0.5% 0.5% 0.6% 1.1% 1.7% 2.7% ...
5 ... 0.2% 0.2% 0.2% 0.3% 0.5% 0.8% 1.5% ...
6 ... ... ... ... ... ... ... ... ...
본 발명에서의 스케일팩터의 차분값(dscf)에 관한 확률테이블의 개수 예시는 표 2와 같다.
조건에 따라 11개 중 스케일팩터의 차분값(dscf)을 코딩하는데 사용하는 확률테이블을 적응적으로 변경하여 사용한다. 여기서 이전 프레임의 스케일팩터의 차분값(p_dscf)은 이전 프레임의 동일 스케일팩터 밴드(sfb)에서의 스케일팩터의 차분값(dscf)를 의미한다.
상기 스케일팩터의 차분값은 이전 프레임과 현재 프래임을 코딩하기 위하여, 프레임의 길이에 따른 확률테이블을 결정하는 단계를 포함하는 디코딩 과정에서도 사용된다.
롱 프레임인 경우에는 상기 발명과 같은 과정을 그대로 수행하나, 숏 프레임의 경우에는 롱 프레임과 동일한 과정을 수행하는 것은 비트절감차원에서 비효율적이므로 이전 프레임정보를 사용하지 아니하고 별도로 확률테이블을 사용하여 코딩효율을 높일 수 있다. 즉, 이전 프레임의 스케일팩터의 차분값(dscf) 저장시 이전 프레임의 0부터 maxsfb-1까지의 스케일팩터밴드에 대해 스케일팩터의 차분값(dscf)을 저장하게 되는데 이 때 스케일팩터밴드의 개수(max_sfb)보다 이전 프래임의 밴드의 개수가 같거나 큰 스케일팩터밴드(sfb)의 스케일팩터의 차분값(dscf)은 0으로 세팅한다.
또한 롱 프레임의 경우 숏 프레임일 경우의 스케일팩터의 차분값(dscf)의 분포와 특성이 다르기 때문에 숏 프레임에 대해서는 별도의 스케일팩터의 차분값(dscf)에 관한 확률테이블을 두어 코딩효율을 높일 수 있다.
스케일팩터의 차분값(dscf)에 관한 확률테이블의 개수 예시
조건 테이블 인덱스
Reset 0
Short frame 1
p_dscf가 -4이하 2
P_dscf가 -3 3
P_dscf가 -2 4
P_dscf가 -1 5
P_dscf가 0 6
P_dscf가 1 7
P_dscf가 2 8
P_dscf가 3 9
p_dscf가 4이상 10
도 8은 멀티플렉싱부(150)가 각 단계에서 생성된 팩터들을 멀티플렉싱하여 전송하는 과정을 나타내고 있다. 도 8을 참조하면, 우선 앞서 설명한 밴드의 개수(max_sfb)가 0인 경우, 현재 프레임에 대해 팩터들(예: 스케일팩터 등)이 존재하지 않거나 존재할 필요가 없기 때문에, 밴드의 개수(max_sfb)가 0인 경우(S151 단계의 no), 멀티플렉싱하는 과정을 종료한다. 이에 의해, 밴드의 개수(max_sfb)가 0일 때 어떤 정보도 인코딩하지 않음으로써 비트수를 보다 절감할 수 있다.
반대로 밴드의 개수(max_sfb)가 1이상인 경우(S151 단계의 yes), 현재 프레임에 대해 스케일팩터 등의 정보가 존재하는 것이기 때문에, 멀티플렉싱 과정을 진행한다.
한편, 도 9 내지 도 12는 멀티플렉싱부(150)가 비트스트림을 생성할 때 신택스의 예들이다. 도 9의 (L1) 및 (L2) 행을 참조하면, 상기 S151 단계에 대응하는 조건, 즉, 밴드의 개수 1이상일 때의 조건(if(max_sfb){})이 만족되는 경우, 그 이후 단계(ac_scf_spectral_data())가 수행됨을 알 수 있다. 도 9 내지 도 12에 도시된 신택스는 일 예일뿐, 본 발명은 이에 한정되지 않음은 물론이다.
다시 도 8을 참조하면, 앞서 설명한 바와 같이 밴드의 개수가 1이상인 경우, 앞서 S136 단계(또는 S137 단계)에서 셋팅한 리셋 플래그를 비트스트림에 포함시킨다(S152 단계). 도 10을 참조하면, 앞서 도 9에서의 ac_scf_sepctral_data()의 세부 내용이 나타나 있다. 즉, (L1) 행을 참조하면, 제일 상단에 리셋 플래그(arith_reset_flag)가 존재함을 알 수 있다. 즉, 추후 설명될 산술 코딩의 결과에 앞서서 리셋 플래그가 존재하는 것이다.
그런 다음, 앞서 S144 단계에서 산술 코딩된 결과를 비트스트림에 포함시킴으로써 디코더에 전송한다(S153 단계). 도 10의 (L2) 행 및 도 11을 참조하면, 글로벌 게인 및 스케일팩터가 산술코딩되어 전송됨을 알 수 있다. 보다 구체적으로, 도 11의 (L1)행에 나타난 바와 같이(acod_gg) 글로벌 게인(gg)이 산술 코딩이 됨으로써, 고정비트가 아닌 가변비트(vlclbf)로 코딩됨을 알 수 있다. 한편, 도 11의 (L2)행에 나타난 바와 같이(acod_scf[]) 스케일팩터가 역시 산술코딩되어 가변비트로서 비트스트림에 포함됨을 알 수 있다. 한편, 도 10의 (L3)행에 나타난 신택스 엘리먼트(arith_data()) 및 도 12는 스펙트럴 데이터(sptr) 역시 산술 코딩되어 가변비트로서 비트스트림에 포함되는 것을 나타내는 것이다.
이와 같이 본 발명의 실시예에 다른 따른 인코딩 장치 및 인코딩 방법은 상기와 같이 설명된 바에 따라, 글로벌 게인 및 스케일팩터 (나아가 스펙트럴 데이터)까지 산술 코딩함으로써, 보다 비트효율을 높일 수 있다.
이하에서는 본 발명의 실시예에 따른 디코딩 장치 및 디코딩 방법에 대해서 설명하고자 한다.
도13은, 본 발명의 일 실시예에 따른 신호 디코딩 장치(200)의 구성을 보여주는 도면이다. 이는 앞서 도1에서 설명된 인코딩 장치의 역과정을 수행하는 장치에 해당할 수 있다. 도 13을 참조하면, 디코딩 장치(200)는 산술디코딩부(220), 및 스케일팩터 획득부(230)를 포함하고, 디멀티플렉싱부(210), 역양자화부(240) 및 주파수역변환부(예:IMDCT) (250)를 더 포함할 수 있다.
디멀티플렉싱부(210)는 오디오 신호에 대한 비트스트림으로부터 밴드의 개수(max_sfb), 윈도우 그룹의 개수(num_window_group), 및 리셋 플래그 등을 추출한다(S210 단계). 밴드의 개수, 윈도우 그룹의 개수, 리셋 플래그 등에 대해서는 상기 인코딩 장치 및 방법에서 설명한 바와 같을 수 있으므로, 구체적인 설명은 생략하고자 한다. 한편, S210 단계에 대한 구체적인 설명은 추후 도 15와 함께 후술하고자 한다.
산술디코딩부(220)는 밴드의 개수 (및 윈도우 그룹의 개수)를 이용하여 상기 비트스트림의 해당 영역을 산술 디코딩함으로써, 글로벌 게인 정보(gg), 스케일팩터의 차분값(dscf) 및 스펙트럴 데이터(sptr)를 획득한다(S220 단계). 이에 대한 구체적인 설명은 도 16과 함께 후술하고자 한다.
스케일팩터 획득부(230)은 글로벌게인 정보(gg) 및 스케일팩터의 차분값(dscf)을 이용하여 스케일팩터 (데이터)를 생성한다(S230 단계). 이에 대한 구체적인 설명은 도 17과 함께 후술하고자 한다.
역양자화부(240)는 스케일팩터 획득부(230)에 의해 생성된 스케일팩터 데이터(scf) 및 산술디코딩부(220)에 의해 획득된 스펙트럴 데이터(sptr)를 역양자화함으로써, 스펙트럴 계수를 획득한다(S240 단계). 이는 앞서 설명된 수학식 1에 따라 수행될 수 있다.
주파수역변환부(250)는 스펙트럴 계수에 대해 역-주파수 변환을 수행하므로써 시간 도메인의 오디오 신호를 생성한다(S250 단계). 여기서 역-주파수 변환은 IMDCT(INVERSE Modified Discrete Cosine Transform: MDCT) 방식에 해당할 수 있으나 본 발명은 이에 한정되지 아니한다.
도 14는 디멀티플렉싱부(210)가 비트스트림으로부터 필요한 정보를 추출하는 과정에 대한 세부 순서도이다. 도 14를 참조하면, 디멀티플렉싱부(210)는 밴드의 개수(max_sfb) 및 윈도우그룹의 개수정보(num_window_group)을 추출한다(S211 단계). 앞서 언급한 바와 같이 ics_info()등의 신택스에 포함될 수 있다. 그런 다음, 밴드의 개수(max_sfb)가 1 이상인 경우(S212 단계의 yes)에 한해 이후 단계를 수행한다(S213 단계 및 S214 단계). 이는 앞서 도 9의 (L1) 및 (L2) 행과 같은 신택스에 따라 비트스트림을 파싱하는 과정일 수 있으나, 본 발명은 이에 한정되지 아니한다.
만약, 밴드의 개수가 0인 경우(S212의 no), 리셋 플래그를 획득하거나, 산술 디코딩을 수행하지 않고 과정이 종료된다.
우선 비트스트림으로부터 리셋 플래그를 획득한다(S213 단계). 리셋 플래그는 앞서 설명한 바와 같이, 이전 프레임의 정보(글로벌 게인, 스케일팩터 등)을 참조하는지 여부를 지시하는 플래그이다. 이 리셋 플래그는 도 10의 (L1) 행에 나타난 바와 같이 산술 코딩된 글로벌 게인, 스케일팩터(의 차분값) 및 스펙트럴 데이터 보다 앞서서 위치하기 때문에, 산술 디코딩에 앞서서 추출된다.
그런 다음, 산술 코딩된 결과(글로벌 게인, 스케일팩터(의 차분값) 등)에 대한 파싱 즉, 산술 디코딩을 수행하는 단계(S220)를 수행한다(S214 단계).
도 16은 산술 디코딩부(220)가 산술 디코딩을 수행하는 과정에 대한 세부 순서도이다. 도 16을 참조하면, 우선 산술 디코딩시 이용하기 위한 확률 테이블을 결정한다(S221 단계). 확률 테이블은 전송된 확률 테이블 인덱스, 또는 전송된 확률 테이블에 의해 결정될 수도 있고, 앞서 S143 단계의 과정에 따라 결정될 수도 있다.
이와 같이 결정된 확률 테이블을 근거로 산술 디코딩을 수행함으로써, 글로벌 게인 정보(gg), 스케일팩터 차분값(dscf[]) 및 스펙트럴 데이터(sptr[])을 비트스트림으로부터 획득한다(S222 단계). 이 단계는 앞서 도 9 내지 도 12의 신택스에 따라 파싱하는 과정에 해당할 수 있다.
도 17은 스케일팩터 획득부(230)가 글로벌게인 정보 등으로부터 스케일팩터 (데이터)를 획득하는 과정에 대한 세부 순서도이다. 도 17을 참조하면, 우선 앞서 S213 단계에서 획득한 리셋 플래그가 0인지(즉, 이전 프레임을 참조해야하는지 아닌지)를 판단한다(S231 단계). 리셋 플래그가 이전 프레임을 참조하는 모드(상대값 또는 차분값 모드)임을 지시하는 경우(예: 리셋 플래그가 0인 경우)(S231 단계의 yes), 이전 프레임의 글로벌 게인값을 획득한다(S232 단계). 이 이전 프레임의 글로벌 게인(gg_prev)에 현재 프레임의 글로벌 게인 정보(gg_cur)를 더함으로써, 현재 프레임의 글로벌 게인값을 획득한다(S233 단계).
만약, 반대로 리셋 플래그가 이전 프레임을 참조하지 않는 모드임(절대값 모드)을 지시하는 경우(예: 리셋 플래그가 1인 경우)(S231 단계의 no), 이전 프레임의 글로벌 게인 값과 상관없이, 현재 프레임의 글로벌 게인 정보를 그대로 글로벌 게인 값으로 결정한다(S234 단계).
그런 다음, S233 단계 및 S234 단계에서 획득된 글로벌 게인 값, 및 S22 단계에서 산술 디코딩으로 획득된 스케일팩터 차분값(dscf[])를 이용하여 스케일팩터 (데이터)(scf)를 생성한다(S235 단계). 예를 들어, 글로벌 게인 값(gg)에 첫번째 밴드의 스케일팩터 차분값(dscf[0])을 더해서 첫번째 밴드의 스케일팩터 값(scf[0])을 획득한다. 그리고 첫번째 밴드의 스케일팩터 값(scf[0])에 두번째 밴드의 스케일팩터 값(dscf[1])을 더해서 두번째 밴드의 스케일팩터 값(scf[1])을 생성하는 것이다.
이와 같이, 본 발명의 실시예에 따른 디코딩 방법 및 디코딩 장치는, 산술 디코딩을 수행함으로써 글로벌 게인 정보 및 스케일팩터 차분값 등을 획득한다.
도 18은, 본 발명의 실시예에 따른 산술코딩 장치(300)가 구현된 제품의 개략적인 구성을 보여주는 도면이다.
도 18을 참조하면, 유무선 통신부는 유무선 통신 방식을 통해서 비트스트림을 수신한다. 구체적으로 유무선 통신부(310)는 유선통신부, 적외선통신부, 블루투스부, 무선랜통신부 중 하나 이상을 포함할 수 있다.
사용자 인증부(320)는 사용자 정보를 입력 받아서 사용자 인증을 수행하는 것으로서 지문인식부, 홍채인식부, 얼굴인식부, 및 음성인식부 중 하나 이상을 포함할 수 있는데, 각각 지문, 홍채정보, 얼굴 윤곽 정보, 음성 정보를 입력받아서, 사용자 정보로 변환하고, 사용자 정보 및 기존 등록되어 있는 사용자 데이터와의 일치여부를 판단하여 사용자 인증을 수행할 수 있다.
입력부(330)는 사용자가 여러 종류의 명령을 입력하기 위한 입력장치로서, 키패드부, 터치패드부, 리모컨부 중 하나 이상을 포함할 수 있지만, 본 발명은 이에 한정되지 아니한다. 신호 디코딩부는 산술코딩부를 포함하는데,
신코 디코딩부(340)는 앞서 설명한 본 발명의 실시예에 따른 인코딩 장치 또는/및 디코딩 장치에 해당하는 것으로써, 글로벌 게인, 스케일팩터 차분값, 및 스펙트럴 데이터를 산술코딩 또는 산술 디코딩한다. 이로써, 프레임당 여러가지 심볼을 한꺼번에 보내므로 중간과정에서 발생하는 헤더의 중복을 막아 비트손실을 줄여서 코딩효율을 향상시킬 수 있다.
제어부(350)는 입력장치들로부터 입력 신호를 수신하고, 신호 디코딩부와 출력부의 모든 프로세스를 제어한다. 출력부(360)는 신호 디코딩부에 의해 생성된 출력 신호 등이 출력되는 구성요소로서, 스피커부 및 디스플레이부를 포함할 수 있다. 출력 신호가 오디오 신호일 때 출력 신호는 스피커로 출력되고, 비디오 신호일 때 출력 신호는 디스플레이를 통해 출력된다.
본 발명에 따른 오디오 신호 처리 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.
이상과 같이, 본 발명은 비록 한정된 실시 예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.

Claims (14)

  1. 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 포함하는 비트스트림을 수신하는 단계;
    밴드의 개수를 수신하는 단계;
    상기 밴드의 개수를 이용하여 산술 코딩 함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 단계;
    상기 글로벌게인 정보가 이전 프레임의 글로벌게인과의 차분 값인지 아니면 절대값인지 여부를 지시하는 플래그 정보를 수신하는 단계;
    상기 수신된 플래그 정보가 이전 프레임의 글로벌게인과의 차분 값을 글로벌게인 정보로 지시한 경우, 상기 글로벌게인 정보 및 이전 프레임의 글로벌게인을 이용하여 현재 프레임의 글로벌 게인을 생성하는 단계;
    상기 현재 프레임의 글로벌 게인 및 상기 스케일팩터 차분값을 이용하여 상기 스케일팩터 데이터를 생성하는 단계; 및
    상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 단계를 포함하는 것을 특징으로 하는 오디오신호의 처리 방법.
  2. 제1항에 있어서,
    윈도우그룹의 개수정보를 수신하는 단계를 더 포함하고,
    상기 산술 코딩은 상기 윈도우그룹의 개수정보를 더 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.
  3. 제1항에 있어서,
    윈도우그룹의 개수정보를 수신하는 단계를 더 포함하고,
    상기 스케일팩터 차분값은, 윈도우그룹의 개수정보에 대응하는 그룹의 개수와, 상기 밴드의 개수의 곱을 근거로 획득되는 것을 특징으로 하는 오디오 신호의 처리 방법.
  4. 제1항에 있어서,
    상기 산술 코딩을 하는 단계는 상기 밴드의 개수가 1이상인 경우에 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.
  5. 제1항에 있어서,
    상기 산술 코딩하는 단계는,
    현재 프레임의 첫번째 밴드에 대응하는 스케일팩터 차분값을 0으로 결정하는 단계를 더 포함하고,
    상기 스케일팩터 데이터를 생성하는 단계는,
    상기 글로벌게인정보를 그대로 상기 첫번째 밴드에 대응하는 스케일팩터 데이터로 결정하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 처리 방법.
  6. 삭제
  7. 제1항에 있어서,
    상기 산술 코딩은,
    이전 프레임의 특정 밴드의 스케일팩터의 차분값을 근거로 선택된 확률 테이블을 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 방법.
  8. 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 포함하는 비트스트림을 수신하고, 밴드의 개수를 수신하고, 상기 글로벌게인 정보가 이전 프레임의 글로벌게인과의 차분 값인지 아니면 절대값인지 여부를 지시하는 플래그 정보를 수신하는 디멀티플렉싱부; 및
    상기 밴드의 개수를 이용하여 산술 코딩함으로써, 글로벌게인 정보 및 스케일팩터 차분값, 스펙트럴 데이터를 상기 비트스트림으로부터 획득하는 산술 디코딩부;
    상기 수신된 플래그 정보가 이전 프레임의 글로벌게인과의 차분 값을 글로벌게인정보로 지시한 경우, 상기 글로벌게인 정보 및 이전 프레임의 글로벌게인을 이용하여 현재 프레임의 글로벌 게인을 생성하고, 상기 현재 프레임의 글로벌 게인 및 상기 스케일팩터 차분값을 이용하여 상기 스케일팩터 데이터를 생성하는 스케일팩터 획득부; 및
    상기 스케일팩터 데이터 및 상기 스펙트럴 데이터를 이용하여 역양자화를 수행함으로써, 스펙트럴 계수를 획득하는 역양자화부를 포함하는 것을 특징으로 하는 오디오신호의 처리 장치.
  9. 제8 항에 있어서,
    상기 디멀티플렉싱부는, 윈도우그룹의 개수정보를 더 수신하고,
    상기 산술디코딩부는, 상기 윈도우그룹의 개수정보를 더 이용하여 상기 산술 코딩을 수행하는 것을 특징으로 하는 오디오 신호의 처리 장치.
  10. 제 8 항에 있어서,
    상기 디멀티플렉싱부는, 윈도우그룹의 개수정보를 더 수신하고,
    상기 스케일팩터 차분값은, 윈도우그룹의 개수정보에 대응하는 그룹의 개수와, 상기 밴드의 개수의 곱을 근거로 획득되는 것을 특징으로 하는 오디오 신호의 처리 장치.
  11. 제8항에 있어서,
    상기 산술디코딩부는, 상기 밴드의 개수가 1이상인 경우에 상기 산술 코딩을 수행되는 것을 특징으로 하는 오디오 신호의 처리 장치.
  12. 제 8 항에 있어서,
    상기 스케일팩터 획득부는,
    현재 프레임의 첫번째 밴드에 대응하는 스케일팩터 차분값을 0으로 결정하고, 상기 글로벌게인정보를 그대로 상기 첫번째 밴드에 대응하는 스케일팩터 데이터로 결정하는 것을 특징으로 하는 오디오 신호의 처리 장치.
  13. 삭제
  14. 제8 항에 있어서,
    상기 산술 코딩은,
    이전 프레임의 특정 밴드의 스케일팩터의 차분값을 근거로 선택된 확률 테이블을 이용하여 수행되는 것을 특징으로 하는 오디오 신호의 처리 장치.
KR1020100035031A 2009-04-15 2010-04-15 오디오 신호 처리 방법 및 장치 KR101644883B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US16970509P 2009-04-15 2009-04-15
US61/169,705 2009-04-15
US21975309P 2009-06-23 2009-06-23
US61/219,753 2009-06-23

Publications (2)

Publication Number Publication Date
KR20100114484A KR20100114484A (ko) 2010-10-25
KR101644883B1 true KR101644883B1 (ko) 2016-08-02

Family

ID=43133662

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100035031A KR101644883B1 (ko) 2009-04-15 2010-04-15 오디오 신호 처리 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101644883B1 (ko)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4800645B2 (ja) * 2005-03-18 2011-10-26 カシオ計算機株式会社 音声符号化装置、及び音声符号化方法

Also Published As

Publication number Publication date
KR20100114484A (ko) 2010-10-25

Similar Documents

Publication Publication Date Title
KR101343267B1 (ko) 주파수 세그먼트화를 이용한 오디오 코딩 및 디코딩을 위한 방법 및 장치
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
EP2282310B1 (en) Entropy coding by adapting coding between level and run-length/level modes
KR101330362B1 (ko) 오디오 인코딩 방법, 오디오 디코딩 방법 및 오디오 인코더 디바이스
US8046235B2 (en) Apparatus and method of encoding audio data and apparatus and method of decoding encoded audio data
KR101278805B1 (ko) 엔트로피 코딩 방법 및 엔트로피 디코딩 방법
JP5277350B2 (ja) 圧縮符号化および復号の方法、符号器、復号器、ならびに符号化装置
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
KR100904605B1 (ko) 음성부호화장치, 음성복호장치, 음성부호화방법 및음성복호방법
CA2601821A1 (en) Planar multiband antenna
CA2604521C (en) Lossless encoding of information with guaranteed maximum bitrate
KR20060121655A (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어스펙트럼 데이터의 효과적인 코딩
JP2005049889A (ja) オーディオ信号コーディング中にノイズ置換を信号で知らせる方法
KR20050087956A (ko) 무손실 오디오 부호화/복호화 방법 및 장치
JP2011013560A (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
US20100191534A1 (en) Method and apparatus for compression or decompression of digital signals
KR101644883B1 (ko) 오디오 신호 처리 방법 및 장치
JP5379871B2 (ja) オーディオ符号化のための量子化
KR100737386B1 (ko) 공간정보기반 오디오 부호화를 위한 채널간 에너지비 추정및 양자화 방법
JPH0761044B2 (ja) 音声符号化法
KR100947065B1 (ko) 무손실 오디오 부호화/복호화 방법 및 장치
JP3692959B2 (ja) 電子透かし情報埋め込み装置
KR101259120B1 (ko) 오디오 신호 처리 방법 및 장치
JP2005196029A (ja) 符号化装置及び方法
KR20100054749A (ko) 신호의 처리 방법 및 이의 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant