KR101690121B1 - 오디오 신호 코딩 및 디코딩 방법 및 장치 - Google Patents

오디오 신호 코딩 및 디코딩 방법 및 장치 Download PDF

Info

Publication number
KR101690121B1
KR101690121B1 KR1020167005104A KR20167005104A KR101690121B1 KR 101690121 B1 KR101690121 B1 KR 101690121B1 KR 1020167005104 A KR1020167005104 A KR 1020167005104A KR 20167005104 A KR20167005104 A KR 20167005104A KR 101690121 B1 KR101690121 B1 KR 101690121B1
Authority
KR
South Korea
Prior art keywords
subband
bandwidth
normalization factor
factor
signal
Prior art date
Application number
KR1020167005104A
Other languages
English (en)
Other versions
KR20160028511A (ko
Inventor
펭얀 키
제신 리우
레이 미아오
Original Assignee
후아웨이 테크놀러지 컴퍼니 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 후아웨이 테크놀러지 컴퍼니 리미티드 filed Critical 후아웨이 테크놀러지 컴퍼니 리미티드
Publication of KR20160028511A publication Critical patent/KR20160028511A/ko
Application granted granted Critical
Publication of KR101690121B1 publication Critical patent/KR101690121B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명의 실시예는 오디오 신호 코딩 및 디코딩 방법 및 장치를 제공한다. 디코딩 방법은, 오디오 신호의 주파수 대역을 복수의 서브대역으로 분할하고, 각각의 서브대역의 서브대역 정규화 인자(normalization factor)를 양자화하는 단계; 상기 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정하는 단계; 상기 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당하는 단계; 및 각각의 서브대역에 대해 할당된 비트에 따라 상기 오디오 신호의 스펙트럼 계수를 코딩하는 단계를 포함한다. 본 발명의 실시예에 따르면, 코딩 및 디코딩 동안, 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라 비트 할당을 위한 신호 대역폭이 결정된다. 이 방법에서, 결정된 신호 대역폭은 비트를 중앙에 집중함으로써 효과적으로 코딩되고 디코딩되어, 오디오 품질이 향상된다.

Description

오디오 신호 코딩 및 디코딩 방법 및 장치{AUDIO SIGNAL CODING AND DECODING METHOD AND DEVICE}
본 발명은 오디오 신호 코딩 및 디코딩 기술 분야에 관한 것이며, 특히 오디오 신호 코딩 및 디코딩 방법 및 장치에 관한 것이다.
현재, 통신 전송은 오디오의 품질에서 더욱더 중요해지고 있다. 그러므로 음질을 확보하면서 코딩 및 디코딩 동안 음악 품질을 가능한 많이 개선할 필요가 있다. 음악 신호는 통상적으로 훨씬 더 많은 정보를 수반하므로, 종래의 음성 코드 여기 선형 예측(Code Excited Linear Prediction: CELP) 코딩 모드는 음악 신호를 코딩하기에는 적절하지 않다. 일반적으로, 변환 코딩 모드는 주파수 도메인 내의 음악 신호를 프로세싱하는 데 사용되어 음악 신호의 코딩 품질을 향상시킨다. 그렇지만, 한정된 코딩 비트를 어떻게 효과적으로 사용하여 정보를 효과적으로 코딩하는가는 현재의 오디오 코딩 분야의 주요 연구 과제이다.
현재의 오디오 코딩 기술은 일반적으로 고속 푸리에 변환(Fast Fourier Transform: FFT) 또는 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT)을 사용하여 시간 도메인 신호를 주파수 도메인으로 변환한 다음, 주파수 도메인 신호를 코딩한다. 저 비트 레이트의 경우에 양자화를 위한 한정된 수의 비트로는 모든 오디오 신호를 양자화하지 못한다. 그러므로 일반적으로 대역폭 확장(Bandwidth Extension: BWE) 기술 및 스펙트럼 중첩 기술을 사용할 수 있다.
코딩 단에서, 제1 입력 시간 도메인 신호는 주파수 도메인으로 변환되고, 이 주파수 도메인으로부터 스펙트럼의 서브대역 정규화 인자, 즉 엔벨로프 정보가 추출된다. 스펙트럼은 양자화된 서브대역 정규화 인자를 사용하여 정규화되어 그 정규화된 스펙트럼 정보가 획득된다. 마지막으로, 각각의 서브대역에 대한 비트 할당이 결정되고, 정규화된 스펙트럼이 양자화된다. 이 방법에서, 오디오 신호가 양자화된 엔벨로프 정보 및 정규화된 스펙트럼 정보로 코딩되고, 그런 다음 비트 스트림이 출력된다.
디코딩 단에서의 프로세스는 코딩 단에서의 프로세스의 반대이다. 저 레이트 코딩 동안, 코딩 단은 모든 주파수 대역을 코딩할 수 없으며; 디코딩 단에서는, 대역폭 확장 기술이 코딩 단에서 코딩되지 않은 주파수 대역을 복구하는 데 필요하다. 한편, 양자화기(quantifier)의 제한으로 인해, 코딩된 서브대역 상에서 제로 주파수 포인트가 생성될 수 있으며, 이에 따라 그 성능을 개선하기 위해서는 노이즈 필링 모듈(noise filling module)이 필요하다. 마지막으로, 디코딩된 정규화 스펙트럼 계수에 디코딩된 서브대역 정규화 인자를 적용하여 재구성된 스펙트럼 계수를 획득하고, 역변환을 수행하여 시간 도메인 오디오 신호를 출력한다.
그렇지만, 코딩 프로세스 동안, 코딩을 위해 일부의 흩어진 비트와 함께 고주파 고조파(high-frequency harmonic)가 할당될 수 있다. 그렇지만, 이 경우, 시간 축에서의 비트의 왜곡은 연속적이지 않으며, 결과적으로 디코딩 동안 재구성된 고주파 고조파는 원활하지 못하고, 간섭을 받는다. 이것은 많은 노이즈를 야기하여, 재구성된 오디오의 품질을 악화시킨다.
본 발명은 오디오 품질을 향상시킬 수 있는 오디오 신호 코딩 및 디코딩 방법 및 장치를 제공한다.
한 관점에서, 오디오 신호 코딩 방법이 제공되며, 상기 오디오 신호 코딩 방법은, 오디오 신호의 주파수 대역을 복수의 서브대역으로 분할하고, 각각의 서브대역의 서브대역 정규화 인자(normalization factor)를 양자화하는 단계; 상기 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정하는 단계; 상기 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당하는 단계; 및 각각의 서브대역에 대해 할당된 비트에 따라 상기 오디오 신호의 스펙트럼 계수를 코딩하는 단계를 포함한다.
다른 관점에서, 오디오 신호 디코딩 방법이 제공되며, 상기 오디오 신호 디코딩 방법은, 양자화된 서브대역 정규화 인자를 획득하는 단계; 상기 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정하는 단계; 상기 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당하는 단계; 각각의 서브대역에 대해 할당된 비트에 따라, 정규화된 스펙트럼을 디코딩하는 단계; 상기 디코딩된 정규화된 스펙트럼에 대해 노이즈 필링(noise filling) 및 대역폭 확장을 수행하여, 정규화된 완전 대역 스펙트럼(full band spectrum)을 획득하는 단계; 및 상기 정규화된 완전 대역 스펙트럼 및 상기 서브대역 정규화 인자에 따라, 오디오 신호의 스펙트럼 계수를 획득하는 단계를 포함한다.
또 다른 관점에서, 오디오 신호 코딩 장치가 제공되며, 상기 오디오 신호 코딩 장치는, 오디오 신호의 주파수 대역을 복수의 서브대역으로 분할하고, 각각의 서브대역의 서브대역 정규화 인자를 양자화하도록 구성되어 있는 양자화 유닛; 상기 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정하도록 구성되어 있는 제1 결정 유닛; 상기 제1 결정 유닛에 의해 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당하도록 구성되어 있는 제1 할당 유닛; 및 상기 제1 할당 유닛에 의해 각각의 서브대역에 대해 할당된 비트에 따라 상기 오디오 신호의 스펙트럼 계수를 코딩하도록 구성되어 있는 코딩 유닛을 포함한다.
또 다른 관점에서, 오디오 신호 디코딩 장치가 제공되며, 상기 오디오 신호 디코딩 장치는, 양자화된 서브대역 정규화 인자를 획득하도록 구성되어 있는 획득 유닛; 상기 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정하도록 구성되어 있는 제2 결정 유닛; 상기 제2 결정 유닛에 의해 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당하도록 구성되어 있는 제2 할당 유닛; 상기 제2 할당 유닛에 의해 각각의 서브대역에 대해 할당된 비트에 따라, 정규화된 스펙트럼을 디코딩하도록 구성되어 있는 디코딩 유닛; 상기 디코딩 유닛에 의해 디코딩된 상기 정규화된 스펙트럼에 대해 노이즈 필링 및 대역폭 확장을 수행하여, 정규화된 완전 대역 스펙트럼을 획득하도록 구성되어 있는 확장 유닛; 및 상기 정규화된 완전 대역 스펙트럼 및 상기 서브대역 정규화 인자에 따라, 오디오 신호의 스펙트럼 계수를 획득하도록 구성되어 있는 복구 유닛을 포함한다.
본 발명에 따르면, 코딩 및 디코딩 동안, 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라 비트 할당을 위한 신호 대역폭이 결정된다. 이 방법에서, 결정된 신호 대역폭은 비트를 중앙에 집중함으로써 효과적으로 코딩되고 디코딩되어 오디오 품질이 향상된다.
본 발명의 기술적 솔루션을 더 명확하게 하기 위해, 본 발명의 다양한 실시예를 나타내는 첨부된 도면에 대해 이하에 간략하게 설명한다.
도 1은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다.
도 2는 본 발명의 실시예에 따른 오디오 신호 디코딩 방법에 대한 흐름도이다.
도 3은 본 발명의 실시예에 따른 오디오 신호 코딩 장치에 대한 블록도이다.
도 4는 본 발명의 다른 실시예에 따른 오디오 신호 코딩 장치에 대한 블록도이다.
도 5는 본 발명의 실시예에 따른 오디오 신호 디코딩 장치에 대한 블록도이다.
도 6은 본 발명의 다른 실시예에 따른 오디오 신호 디코딩 장치에 대한 블록도이다.
본 발명의 실시예에 개시되는 기술적 솔루션에 대해 실시예 및 첨부된 도면을 참조하여 이하에 설명한다.
도 1은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다.
101. 오디오 신호의 주파수 대역을 복수의 서브대역으로 분할하고, 각각의 서브대역의 서브대역 정규화 인자(normalization factor)를 양자화한다.
이하에서는 상세한 설명을 위한 예로서 MDCT 변환을 사용한다. 먼저, MDCT 변환은 입력 오디오 신호에 대해 수행되어 주파수 도메인 계수를 획득한다. MDCT 변환은 윈도윙(windowing), 시간 도메인 에일리어싱(time domain aliasing), 및 이산 DCT 변환과 같은 프로세스를 포함할 수 있다.
예를 들어, 시간 도메인 신호 x(n)은 사인-윈도우(sine-windowed)이다.
Figure 112016018766380-pat00001
획득된 윈도우 신호는 다음과 같다:
Figure 112016018766380-pat00002
그런 다음 시간 도메인 에일이어싱 연산이 수행된다:
Figure 112016018766380-pat00003
IL/2 및 JL/2는 계수가 L/2인 2개의 대각행렬을 각각 나타낸다:
Figure 112016018766380-pat00004
이산 DCT 변환은 시간 도메인 에일리어싱된 신호에 대해 수행되어 최종적으로 주파수 도메인의 MDCT 계수를 획득한다.
Figure 112016018766380-pat00005
주파수 도메인 엔벨로프는 MDCT 계수로부터 추출되어 양자화된다. 전체 주파수는 상이한 주파수 도메인 분해능(frequency domain resolution)을 가지는 복수의 서브대역으로 분할되고, 각각의 서브대역의 정규화 인자를 추출하고, 서브대역 정규화 인자가 양자화된다.
예를 들어, 16 kHz를 가지는 주파수 대역에 대응하는 32 kHz의 주파수에서 샘플링된 오디오 신호와 관련해서, 프레임 길이가 20ms(640 샘플링 포인트)이면, 서브대역 분할은 표 1에 나타난 형태에 따라 실행된다.
(표 1) 그룹화된 서브대역 분할
Figure 112016018766380-pat00006
먼저, 서브대역은 수 개의 그룹으로 그룹화되고, 그런 다음 하나의 그룹 내의 서브대역은 세분화된다. 각각의 서브대역의 정규화 인자는 다음과 같이 규정된다:
Figure 112016018766380-pat00007
Lp는 서브대역 내의 계수의 수를 나타내고, Sp는 서브대역의 시작 포인트를 나타내고, ep는 서브대역의 종료 포인트를 나타내며, P는 서브대역의 총수를 나타낸다.
정규화 인자가 획득된 후, 팩트(fact)가 로그 도메인(log domain)에서 양자화되어 양자화된 서브대역 정규화 인자(sub-band normalization factor) wnorm이 획득된다.
102. 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정한다.
선택적으로, 실시예에서, 비트 할당을 위한 신호 대역폭 sfm_limit은 오디오 신호의 대역폭의 일부로서, 예를 들어, 저주파에서의 대역폭 0-sfm_limit의 일부 또는 대역폭의 중간 부분으로서 규정된다.
일례에서, 비트 할당을 위한 신호 대역폭 sfm_limit가 규정될 때, 비율 인자 팩트(rate factor fact)가 비트 레이트 정보에 따라 결정될 수 있으며, 상기 비율 인자 팩트는 0보다 크고 1보다 작거나 같다. 실시예에서는, 비트 레이트가 작을수록 비율 인자가 작다. 예를 들어, 상이한 비트 레이트에 대응하는 팩트 값이 표 2에 따라 획득될 수 있다.
(표 2) 비트 레이트 및 사실 값의 매핑 테이블
Figure 112016018766380-pat00008
대안으로, 팩트 역시 식, 예를 들어 fact = q x (0.5 + bitrate_value/128000)에 따라 획득될 수 있으며, 여기서 bitrate_value은 비트 레이트의 값, 예를 들어, 24000이며, q는 정정 팩트(correction fact)이다. 예를 들어, q = 1로 가정할 수 있다. 본 발명의 본 실시예는 이러한 특정하게 예시된 값으로 제한되지 않는다.
대역폭의 일부는 비율 인자 팩트 및 양자화된 서브대역 정규화 인자 wnorm에 따라 결정된다. 각각의 서브대역 내의 스펙트럼 에너지는 양자화된 서브대역 정규화 인자에 따라 획득될 수 있으며, 스펙트럼 에너지는 비율 인자 팩트에 의해 승산된 모든 서브대역의 전체 스펙트럼 에너지의 적(product)보다 크게 될 때까지, 각각의 서브대역 내에서 저주파로부터 고주파로 축적되며, 현재의 서브대역을 뒤따르는 대역폭은 대역폭의 일부로서 사용된다.
예를 들어, 최저 축적 주파수 포인트가 먼저 설정될 수 있고, 주파수 포인트보다 낮은 각각의 서브대역의 스펙트럼 에너지 및 energy_low가 축적될 수 있다. 스펙트럼 에너지는 서브대역 정규화 인자 및 이하의 식에 따라 획득될 수 있다:
Figure 112016018766380-pat00009
q는 설정된 최저 축적 주파수 포인트에 대응하는 서브대역을 나타낸다.
그에 따라 추론이 가능하며, 모든 서브대역의 총 스펙트럼 에너지 energy_sum이 계산될 때까지 서브대역이 부가된다.
energy_low에 기초해서, 서브대역은 저주파로부터 고주파로 축적되도록 하나씩 부가되어 스펙트럼 에너지 energy_limit가 획득되고, energy_limit > fact x energy_sum가 충족되는지를 판단한다. 충족되지 않으면, 상위 축적 스펙트럼 에너지에 대해 더 많은 서브대역이 부가되어야 한다. 충족되면, 현재의 서브대역이 서브대역의 규정된 부분의 최종 서브대역으로서 사용된다. 현재의 서브대역의 일련번호 sfm_limit는 대역폭의 규정된 일부, 즉 0-sfm_limit를 나타내기 위해 출력된다.
전술한 예에서, 비율 인자 팩트는 비트 레이트를 사용해서 결정된다. 다른 예에서, 팩트는 서브대역 정규화 인자를 사용하여 결정될 수 있다. 예를 들어, 서브대역 정규화 인자에 따라, 오디오 신호의 고조파 클래스(harmonic class) 또는 노이즈 레벨을 먼저 획득한다. 일반적으로, 오디오 신호의 고조파 클래스가 클수록, 노이즈 레벨은 낮다. 이하에서는 노이즈 레벨을 상세한 설명을 위한 예로서 사용한다. 노이즈 레벨 noise_level은 이하의 식에 따라 획득될 수 있다:
Figure 112016018766380-pat00010
wnorm은 디코딩된 서브대역 정규화 인자를 나타내고, sfm은 전체 주파수 대역의 서브대역의 수를 나타낸다.
noise_level이 높을 때, 팩트는 크고; noise_level이 낮을 때, 팩트는 작다. 고조파 클래스가 파라미터로서 사용되면, 고조파 클래스가 클 때, 팩트는 작고; 고조파 클래스가 작을 때, 팩트는 크다.
전술한 바에서는 0-sfm_limit의 저주파 대역폭을 사용하고 있으나, 본 발명의 본 실시예는 이에 제한되지 않는다는 것에 유의하여야 한다. 필요에 따라, 대역폭의 일부는 다른 형태로 실현될 수 있는데, 예를 들어, 논-제로 저주파 포인트로부터 sfm_limit로의 대역폭의 일부이다. 이러한 변형 모두는 본 발명의 실시예의 범위 내에 있게 된다.
103. 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당한다.
결정된 신호 대역폭 내의 서브대역의 wnorm 값에 따라 비트 할당이 수행될 수 있다. 이하 반복법이 사용될 수 있다: a) 최대 wnorm 값에 대응하는 서브대역을 찾고 특정한 수의 비트를 할당하며; b) 그에 대응해서 서브대역의 wnorm 값을 감소시키며; c) 비트가 완전하게 할당될 때까지 단계 a) 내지 b)를 반복한다.
104. 각각의 서브대역에 대해 할당된 비트에 따라 오디오 신호의 스펙트럼 계수를 코딩한다.
예를 들어, 코딩 계수는 격자 벡터 양자화 솔루션을 사용할 수 있거나, 또는 MDCT 스펙트럼 계수를 양자화하기 위한 다른 기존의 솔루션을 사용할 수도 있다.
본 발명의 본 실시예에 따르면, 코딩 및 디코딩 동안, 비트 할당을 위한 신호 대역폭은 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라 결정된다. 이 방법에서, 결정된 신호 대역폭은 비트를 중앙집중화함으로써 효과적으로 코딩 및 디코딩되어, 오디오 품질이 향상된다.
예를 들어, 결정된 신호 대역폭이 저주파 부분 중 0-sfm_limit일 때, 비트는 신호 대역폭 0-sfm_limit 내에 할당된다. 비트 할당을 위한 대역폭 0-sfm_limit은, 그 선택된 주파수 대역이 저 비트 레이트의 경우에 비트를 중앙집중화함으로써 효과적으로 코딩되도록 그리고 더 효과적인 대역폭 확장이 코딩되지 않은 주파수 대역에 대해 수행되도록 제한된다. 이것은 주로, 비트 할당 대역폭이 제한되지 않으면, 고주파 고조파가 코딩을 위해 분산된 비트와 함께 할당될 수 있기 때문이다. 그렇지만, 이 경우, 시간 축에서의 비트의 분포가 비연속적이고, 그 결과 재구성된 고주파 고조파가 원활하지 않고, 간섭을 받는다. 비트 할당 대역폭이 제한되지 않으면, 분산된 비트는 저주파에서 중앙집중화되고, 저주파 신호의 코딩을 더 우수하게 할 수 있으며; 대역폭 할당은 저주파 신호를 사용함으로써 고주파 고조파에 대해 수행되어, 더 많은 연속적인 고주파 고조파 신호가 가능하게 된다.
선택적으로, 실시예에서, 도 3에 도시된 바와 같은 103에서, 비트 할당을 위한 신호 대역폭 sfm_limit이 결정된 후의 비트 할당 동안, 고주파 대역이 더 많은 비트와 함께 할당되도록 대역폭 내에서 서브대역의 서브대역 정규화 인자가 먼저 조정된다. 조정 규모(adjustment scale)는 비트 레이트에 대해 자기 적응적(self-adaptive)이 될 수 있다. 이것은, 대역폭 내에서 더 큰 에너지를 가진 저주파 대역이 더 많은 비트와 함께 할당되고, 양자화에 필요한 비트가 충분하면, 서브대역 정규화 인자가 주파수 대역 내의 고주파의 양자화를 위해 비트를 증가시키도록 조정될 수 있다는 점을 고려하고 있다. 이 방법에서, 더 많은 고조파가 코딩될 수 있고, 이는 고주파 대역의 대역 확장에 이롭다. 예를 들어, 대역폭의 일부의 중간 서브대역의 서브대역 정규화 인자는, 중간 서브대역을 뒤따르는 각각의 서브대역의 서브대역 정규화 인자로서 사용된다. 구체적으로, (sfm_limit/2)번째 서브대역의 정규화 인자는 주파수 sfm_limit/2-sfm_limit 내의 각각의 서브대역의 서브대역 정규화 인자로서 사용될 수 있다. sfm_limit/2가 정수가 아니면, 반올림 또는 반내림이 될 수 있다. 이 경우, 비트 할당 동안, 조정된 서브대역 정규화 인자가 사용될 수 있다.
또한, 본 발명의 다른 실시예에 따르면, 본 발명의 실시예에서 제공하는 코딩 및 디코딩 방법의 애플리케이션에서, 오디오 신호의 프레임의 분류가 추가로 고려될 수 있다. 이 경우, 본 발명의 실시예에서는, 상이한 분류에 관한 상이한 코딩 및 디코딩 정책이 사용될 수 있으며, 이에 의해 상이한 신호의 코딩 및 디코딩 품질을 향상시킬 수 있다. 예를 들어, 오디오 신호는 노이즈(Noise), 고조파(Harmonic), 및 일시성(Transient)과 같은 유형으로 분류될 수 있다. 일반적으로, 노이즈형 신호는 평탄 스펙트럼(flat spectrum)이 있는 노이즈 모드로서 분류되며, 강한 고조파 특징을 가진 신호는 크게 변하는 스펙트럼을 가지고 더 많은 정보를 포함하는 고조파 모드로 분류된다
이하에서는 상세한 설명을 위해 고조파 유형 및 비고조파 유형을 사용한다. 본 발명의 본 실시예에 따르면, 도 1에 도시된 바와 같은 101 이전에, 오디오 신호의 프레임이 고조파 유형에 속하는지 또는 비고조파 유형에 속하는지를 판단할 수 있다. 오디오 신호의 프레임이 고조파 유형에 속하면, 도 2에 도시된 바와 같은 방법이 계속해서 수행된다. 구체적으로, 고조파 유형의 프레임과 관련해서, 비트 할당을 위한 신호 대역폭이 도 1에 도시된 실시예에 따라 규정될 수 있는데, 즉 프레임의 비트 할당을 위한 신호 대역폭을 프레임의 대역폭의 일부로서 규정한다. 비고조파 유형의 프레임과 관련해서, 비트 할당을 위한 신호 대역폭이 도 1에 도시된 실시예에 따라 대역폭의 일부에 대해 규정될 수 있거나, 또는 비트 할당을 위한 신호 대역폭이 규정될 수 없는데, 예를 들어 프레임의 비트 할당 대역폭을 프레임의 전체 대역폭으로 결정한다.
오디오 신호의 프레임은 피크 대 평균 비율(peak-to-average ratio)에 따라 분류될 수 있다. 예를 들어, 프레임의 서브대역(고주파 서브대역)의 전부 또는 일부 중 각각의 서브대역의 피크 대 평균 비율이 획득된다. 피크 대 평균 비율은 서브대역의 평균 에너지에 의해 제산된 서브대역의 피크 에너지로부터 계산된다.
피크 대 평균 비율이 제1 임계값보다 큰 서브대역의 수가 제2 임계값보다 크거나 같을 때는, 프레임이 고조파 유형에 속하는 것으로 결정하고, 피크 대 평균 비율이 제1 임계값보다 큰 서브대역의 수가 제2 임계값보다 작을 때는, 프레임이 비고조파 유형에 속하는 것으로 결정한다. 제1 임계값 및 제2 임계값은 필요에 따라 설정되거나 변경될 수도 있다.
그렇지만, 본 발명의 본 실시예는 피크 대 평균 비율에 따른 분류의 예에 제한되지 않으며, 분류는 다른 파라미터에 따라 수행될 수도 있다.
선택된 주파수 대역이 저 비트 레이트의 경우에 비트를 중앙집중화함으로써 효과적으로 코딩되도록 하고 코딩되지 않은 주파수 대역에 대해서는 더 효과적인 대역폭 확장이 수행되도록, 비트 할당에 대한 대역폭 sfm_limit이 제한된다. 이것은 주로, 비트 할당 대역폭이 제약되지 않으면, 고주파 고조파가 코딩을 위해 분산된 비트와 함께 할당될 수 있기 때문이다. 그렇지만, 이 경우, 시간 축에서의 비트의 분배는 연속적이지 않으며, 결과적으로 재구성된 고주파 고조파는 원활하지 않고 간섭을 받게 된다. 비트 할당 대역폭이 제약되면, 분산된 비트는 저주파수에서 중앙집중화되어, 저주파 신호의 코딩을 더 우수하게 할 수 있으며; 저주파 신호를 사용함으로써 고주파 고조파에 대해 대역폭 확장이 수행되어, 더 연속적인 고주파 고조파 신호가 가능하다.
전술한 바는 코딩 단에서의 프로세싱을 설명하는 것이며, 이는 디코딩 단에서의 프로세싱과는 반대이다. 도 2는 본 발명의 실시예에 따른 오디오 신호 디코딩 방법에 대한 흐름도이다.
201. 양자화된 서브대역 정규화 인자를 획득한다.
양자화된 서브대역 정규화 인자는 비트 스트림을 디코딩함으로써 획득될 수 있다.
*202. 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정한다. 202는 도 1에 도시된 바와 같은 102와 유사하며, 따라서 이에 대해서는 반복 설명하지 않는다.
203. 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당한다. 203은 도 1에 도시된 바와 같은 103과 유사하며, 따라서 이에 대해서는 반복 설명하지 않는다.
204. 각각의 서브대역에 대해 할당된 비트에 따라, 정규화된 스펙트럼을 디코딩한다.
205. 디코딩된 정규화된 스펙트럼에 대해 노이즈 필링(noise filling) 및 대역폭 확장을 수행하여, 정규화된 완전 대역 스펙트럼(full band spectrum)을 획득한다.
206. 정규화된 완전 대역 스펙트럼 및 서브대역 정규화 인자에 따라, 오디오 신호의 스펙트럼 계수를 획득한다.
예를 들어, 오디오 신호의 스펙트럼 계수는 각각의 서브대역의 정규화 스펙트럼을 서브대역의 서브대역 정규화 인자로 승산함으로써 복구되고 획득된다.
본 발명의 본 실시예에 따르면, 코딩 및 디코딩 동안, 비트 할당을 위한 신호 대역폭은 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라 결정된다. 이 방법에서, 결정된 신호 대역폭은 비트를 중앙집중화함으로써 효과적으로 코딩 및 디코딩되어, 오디오 품질이 향상된다.
본 실시예에서, 단계 205에서 설명된 노이즈 필링 및 대역폭 확장은 그 순서에 제한되지 않는다. 구체적으로, 노이즈 필링이 대역폭 확장 이전에 수행될 수 있거나; 또는 대역폭 확장이 노이즈 필링 이전에 수행될 수도 있다. 또한, 본 실시예에 따르면, 대역폭 확장은 주파수 대역의 일부에 대해 수행될 수 있는 동안 노이즈 필링은 주파수 대역의 다른 일부에 대해 동시에 수행될 수 있다. 이러한 변형은 모두 본 발명의 본 실시예의 범위 내에 속한다.
서브대역 코딩 동안 양자화기의 제한으로 인해 많은 제로 주파수 포인트가 생성될 수 있다. 일반적으로, 재구성된 오디오 신호 사운드가 더 중립적으로 되도록 하기 위해 약간의 노이즈가 채워질 수 있다.
노이즈 필링이 먼저 수행되면, 노이즈 필링 후에 대역폭 확장이 정규화된 스펙트럼에 대해 수행되어 정규화된 완전 대역 스펙트럼을 획득할 수 있다. 예를 들어, 제1 주파수 대역은 현재 프레임 및 이 현재 프레임 이전의 N개의 프레임의 할당에 따라 결정될 수 있으며, 복제(copy)를 위한 주파수 대역으로 사용될 수 있다. N은 양의 정수이다. 일반적으로 할당된 비트를 가진 복수의 연속적인 서브대역을 제1 주파수 대역의 범위로서 선택하는 바람직하다. 그런 다음, 제1 주파수 대역의 스펙트럼 계수에 따라 고주파 대역의 스펙트럼 계수가 획득된다.
N = 1을 예로 하는 경우를 사용하면, 선택적으로, 본 실시예에서는, 현재 프레임에 대해 할당된 비트와 이전의 N개의 프레임에 대해 할당된 비트 간의 상관관계가 획득될 수 있으며, 제1 주파수 대역은 그 획득된 상관관계에 따라 결정될 수 있다. 예를 들어, 현재 프레임에 할당된 비트가 R_current이고, 이전의 프레임에 할당된 비트가 R_previous인 것으로 하면, 상관관계 R_correlation은 R_current와 R_previous를 승산함으로써 획득될 수 있다.
실시예에서는, 그 획득된 top_band를 제1 주파수 대역의 상한으로 사용하고, top_band/2를 제1 주파수 대역의 하한으로 사용한다. 이전의 프레임의 제1 주파수 대역의 하한과 현재 프레임의 제1 주파수 대역의 하한 간의 차이가 1 kHz보다 작으면, 이전의 프레임의 제1 주파수 대역의 하한을 현재 프레임의 제1 주파수 대역의 하한으로 사용할 수 있다. 이것은 대역폭 확장을 위한 제1 주파수 대역의 연속성을 보장하기 위한 것이며 이에 의해 대역폭 확장 후의 연속적인 고주파 스펙트럼이 보장된다. 현재 프레임의 R_current는 캐싱되어 다음 프레임의 R_previous로서 사용된다. top_limit/2가 정수가 아니면, 반올림 또는 반내림이 수행될 수 있다.
대역폭 확장 동안, 제1 주파수 대역 top_band/2-top_band의 스펙트럼 계수가 고주파 대역 last_sfm-high_sfm에 복제된다.
전술한 바는 노이즈 필링을 먼저 수행하는 예를 설명한 것이다. 본 발명의 본 실시예는 이에 제한되지 않는다. 구체적으로, 대역폭 확장이 먼저 수행될 수 있고, 그런 다음 배경 노이즈가 그 확장된 완전 주파수 대역에 채워질 수 있다. 노이즈 필링의 방법은 전술한 예와 유사할 수 있다.
또한, 고주파 대역과 관련해서, 예를 들어, 전술한 last_sfm-high_sfm의 범위와 관련해서, 주파수 대역 범위 last_sfm-high_sfm 내에 그 채워진 배경 노이즈 는 디코딩 단에 의해 추정된 noise_level 값을 사용함으로써 추가로 조정될 수 있다. noise_level을 계산하는 방법에 대해서는, 식(8)을 참조하라. noise_level은 디코딩된 서브대역 정규화 인자를 사용함으로써 획득되어, 채워진 노이즈의 강도 레벨을 차별화한다. 그러므로 코딩 비트는 전송되지 않아도 된다.
고주파 대역 내의 배경 노이즈는 이하의 방법에 따라 그 획득된 노이즈 레벨을 사용함으로써 조정될 수 있다:
Figure 112016018766380-pat00011
Figure 112016018766380-pat00012
는 디코딩된 정규화 인자를 나타내고 noise_CB(K)는 노이즈 코드북을 나타낸다.
이 방법에서, 대역폭 확장은 저주파 신호를 사용함으로써 고주파 고조파에 대해 수행되어, 고주파 고조파가 더 연속적이게 될 수 있고, 이에 의해 오디오 품질이 보장된다.
전술한 바는 제1 주파수 대역의 스펙트럼 계수를 직접 복제하는 예를 설명한 것이다. 본 발명에 따르면, 제1 주파수 대역의 스펙트럼 계수가 먼저 조정될 수 있고, 대역폭 확장은 그 조정된 스펙트럼 계수를 사용함으로써 수행되어 고주파 대역의 성능이 더 향상된다.
정규화 길이는 스펙트럼 평탄도 정보(spectrum flatness information) 및 고주파 대역 신호 유형에 따라 획득될 수 있으며, 제1 주파수 대역의 스펙트럼 계수는 그 획득된 정규화 길이에 따라 정규화되고, 제1 주파수 대역의 그 정규화된 스펙트럼 계수는 고주파 대역의 스펙트럼 계수로서 사용된다.
스펙트럼 평탄도 정보는: 제1 주파수 대역 내의 각각의 서브대역의 피크 대 평균 비율, 제1 주파수 대역에 대응하는 시간 도메인 신호의 상관관계, 또는 제1 주파수 대역에 대응하는 시간 도메인 신호의 제로-교차 비율(zero-crossing rate)을 포함할 수 있다. 이하에서는 상세한 설명을 위한 예로서 피크 대 평균을 사용한다. 그렇지만, 본 발명의 본 실시예는 이러한 제한을 부여하지 않는다. 구체적으로, 다른 평탄도 정보 역시 조정을 위해 사용될 수 있다. 피크 대 평균 비율은 서브대역의 평균 에너지에 의해 제산된 서브대역의 피크 에너지로부터 계산된다.
최종적으로, 제1 주파수 대역의 각각의 서브대역의 피크 대 평균 비율은 제1 주파수 대역의 스펙트럼 계수에 따라 계산되며, 서브대역은 피크 대 평균 비율의 값 및 서브대역 내의 최대 피크 값에 따른 고조파 서브대역이고, 고조파 서브대역의 수 n_band가 축적되고, 최종적으로 정규화 길이 length_norm_harm이 n_band 및 고주파 대역의 신호 유형에 따라 자기 적응적으로(self-adaptively) 결정된다.
Figure 112016018766380-pat00013
여기서, M은 제1 주파수 대역의 서브대역의 수를 나타내고; α는 자기 적응성 신호 유형을 나타내며; 고조파 신호의 경우, α>1이다.
뒤이어, 제1 주파수 대역의 스펙트럼 계수는 그 획득된 정규화 길이를 사용함으로써 정규화될 수 있고, 제1 주파수 대역의 정규화된 스펙트럼 계수는 고주파 대역의 계수로서 사용된다.
전술한 바는 대역폭 확장 성능을 향상시키는 예에 대해 설명한 것이며, 대역폭 확장 성능을 향상시킬 수 있는 다른 알고리즘 역시 본 발명에 적용될 수 있다.
또한, 코딩 단과 유사하게, 오디오 신호의 프레임의 분류 역시 디코딩 단에서도 고려될 수 있다. 이 경우, 본 발명의 실시예에서는, 상이한 분류에 관한 상이한 코딩 및 디코딩 정책이 사용될 수 있으며, 이에 의해 상이한 신호의 코딩 및 디코딩 품질을 향상시킬 수 있다. 오디오 신호의 프레임의 분류를 위한 방법에 대해서는, 코딩 단의 그것을 참조하면 되며, 이에 대해서는 여기서 설명하지 않는다.
프레임 유형을 나타내는 분류 정보는 비트 스트림으로부터 추출될 수 있다. 고조파 유형의 프레임과 관련해서, 비트 할당을 위한 신호 대역폭은 도 2에 도시된 실시예에 따라 규정될 수 있으며, 즉 프레임의 비트 할당을 위한 신호 대역폭을 프레임의 대역폭의 일부로서 규정한다. 비고조파 유형의 프레임과 관련해서, 비트 할당을 위한 신호 대역폭은 도 2에 도시된 실시예에 따라 대역폭의 일부에 대해 규정될 수 있으며, 또는 종래기술에 따라 비트 할당을 위한 신호 대역폭은 규정될 수 없는데, 예를 들어, 프레임의 비트 할당 대역폭을 프레임의 전체 대역폭으로 결정한다.
전체 스펙트럼 대역의 스펙트럼 계수가 획득된 후, 재구성된 시간 도메인 오디오 신호는 주파수 역변환을 사용하여 획득될 수 있다. 그러므로 본 발명의 실시예에서는, 비고조파 신호 품질이 유지되면서 고조파 신호 품질이 향상될 수 있다.
도 3은 본 발명의 실시예에 따른 오디오 신호 코딩의 블록도이다. 도 3을 참조하면, 오디오 신호 코딩 장치(30)는 양자화 유닛(31), 제1 결정 유닛(32), 제1 할당 유닛(33), 및 코딩 유닛(34)을 포함한다.
양자화 유닛(31)은 오디오 신호의 주파수 대역을 복수의 서브대역으로 분할하고, 각각의 서브대역의 서브대역 정규화 인자를 양자화한다. 제1 결정 유닛(32)은 양자화 유닛(31)에 의해 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정한다. 제1 할당 유닛(33)은 제1 결정 유닛(32)에 의해 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당한다. 코딩 유닛(34)은 제1 할당 유닛(33)에 의해 각각의 서브대역에 대해 할당된 비트에 따라 오디오 신호의 스펙트럼 계수를 코딩한다.
본 발명의 본 실시예에 따르면, 코딩 및 디코딩 동안, 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라 비트 할당을 위한 신호 대역폭이 결정된다. 이 방법에서, 결정된 신호 대역폭은 비트를 중앙에 집중함으로써 효과적으로 코딩되고 디코딩되어 오디오 품질이 향상된다.
도 4는 본 발명의 다른 실시예에 따른 오디오 신호 코딩 장치에 대한 블록도이다. 도 4에 도시된 바와 같은 오디오 신호 코딩 장치(40)에서, 도 3에 도시된 것과 유사한 유닛 또는 구성요소는 동일한 도면부호로 표시된다.
비트 할당의 신호 대역을 결정할 때, 제1 결정 유닛(32)은 오디오 신호의 대역폭의 일부에 대해 비트 할당을 위한 신호 대역폭을 규정할 수 있다. 예를 들어, 도 4에 도시된 바와 같이, 제1 결정 유닛(32)은 제1 비율 인자 결정 모듈(321)을 포함할 수 있다. 제1 비율 인자 결정 모듈(321)은 비트 레이트 정보에 따라 비율 인자 팩트를 결정하도록 구성되어 있으며, 비트 레이트 팩트는 0보다 크고 1보다 작거나 같다. 대안으로, 제1 결정 유닛(32)은 제1 비율 인자 결정 모듈(321)을 대체하기 위해 제2 비율 인자 결정 모듈(322)을 포함한다. 제2 비율 인자 결정 모듈(322)은 서브대역 정규화 인자에 따라 오디오 신호의 고조파 클래스 또는 노이즈 레벨을 획득하고, 고조파 클래스 또는 노이즈 레벨에 따라 비율 인자 팩트를 결정한다.
또한, 제1 결정 유닛(32)은 제1 대역폭 결정 모듈(323)을 더 포함한다. 비율 인자 팩트를 획득한 후, 제1 대역폭 결정 모듈(323)은 비율 인자 팩트 및 양자화된 서브대역 정규화 인자에 따라 대역폭의 일부를 결정할 수 있다.
대안으로, 실시예에서, 제1 대역폭 결정 모듈(323)은, 대역폭의 일부를 결정할 때, 양자화된 서브대역 정규화 인자에 따라 각각의 서브대역 내의 스펙트럼 에너지를 획득하고, 축적된 스펙트럼 에너지가 비율 인자에 의해 승산된 모든 서브대역의 전체 스펙트럼 에너지의 적(product)보다 크게 될 때까지, 각각의 서브대역 내의 스펙트럼 에너지를 저주파로부터 고주파로 축적하고, 현재의 서브대역을 뒤따르는 대역폭을 상기 대역폭의 일부로서 사용한다.
분류 정보를 고려하여, 오디오 신호 코딩 장치(40)는 오디오 신호의 프레임을 분류하도록 구성되어 있는 분류 유닛(35)을 더 포함할 수 있다. 예를 들어, 분류 유닛(35)은 오디오 신호의 프레임이 고조파 유형에 속하는지 또는 비고조파 유형에 속하는지를 판단하고; 오디오 신호의 프레임이 고조파 유형에 속하면, 양자화 유닛(31)을 촉발할 수 있다. 실시예에서, 프레임의 유형은 피크 대 평균 비율에 따라 결정될 수 있다. 예를 들어, 분류 유닛(35)은 프레임의 모든 서브대역 또는 일부 서브대역 중에서 각각의 서브대역의 피크 대 평균 비율을 획득하고; 피크 대 평균 비율이 제1 임계값보다 큰 서브대역의 수가 제2 임계값보다 크거나 같을 때는, 프레임이 고조파 유형에 속하는 것으로 결정하고; 피크 대 평균 비율이 제1 임계값보다 큰 서브대역의 수가 제2 임계값보다 작을 때는, 프레임이 비고조파 유형에 속하는 것으로 결정한다. 이 경우, 제1 결정 유닛(32)은 프레임이 고조파 유형에 속하는 것으로 간주하고, 비트 할당을 위한 신호 대역폭을 프레임의 대역폭의 일부로서 규정한다.
대안으로, 다른 실시예에서, 제1 할당 유닛(33)은 서브대역 정규화 인자 조정 모듈(331) 및 비트 할당 모듈(332)을 포함할 수 있다. 서브대역 정규화 인자 조정 모듈(331)은 결정된 신호 대역폭 내의 서브대역의 서브대역 정규화 인자를 조정한다. 비트 할당 모듈(332)은 조정된 서브대역 정규화 인자에 따라 비트를 할당한다. 예를 들어, 제1 할당 유닛(33)은 대역폭의 일부의 중간 서브대역의 서브대역 정규화 인자를, 중간 서브대역을 뒤따르는 각각의 서브대역의 서브대역 정규화 인자로서 사용할 수 있다.
본 발명의 본 실시예에 따르면, 코딩 및 디코딩 동안, 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라 비트 할당을 위한 신호 대역폭이 결정된다. 이 방법에서, 결정된 신호 대역폭은 비트를 중앙에 집중함으로써 효과적으로 코딩되고 디코딩되어 오디오 품질이 향상된다.
도 5는 본 발명의 실시예에 따른 오디오 신호 디코딩 장치에 대한 블록도이다. 도 5에 도시된 바와 같은 오디오 신호 디코딩 장치(50)는 획득 유닛(51), 제2 결정 유닛(52), 제2 할당 유닛(53), 디코딩 유닛(54), 확장 유닛(55) 및 복구 유닛(56)을 포함한다.
획득 유닛(51)은 양자화된 서브대역 정규화 인자를 획득한다. 제2 결정 유닛(52)은 획득 유닛(51)에 의해 획득된 상기 양자화된 서브대역 정규화 인자에 따라, 또는 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트 할당을 위한 신호 대역폭을 결정한다. 제2 할당 유닛(53)은 제2 결정 유닛(52)에 의해 결정된 신호 대역폭 내의 서브대역에 대해 비트를 할당한다. 디코딩 유닛(54)은 제2 할당 유닛(53)에 의해 각각의 서브대역에 대해 할당된 비트에 따라, 정규화된 스펙트럼을 디코딩한다. 확장 유닛(55)은 디코딩 유닛(54)에 의해 디코딩된 상기 정규화된 스펙트럼에 대해 노이즈 필링 및 대역폭 확장을 수행하여, 정규화된 완전 대역 스펙트럼을 획득한다. 복구 유닛(56)은 확장 유닛(55)에 의해 획득된 상기 정규화된 완전 대역 스펙트럼 및 상기 서브대역 정규화 인자에 따라, 오디오 신호의 스펙트럼 계수를 획득한다.
본 발명의 본 실시예에 따르면, 코딩 및 디코딩 동안, 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라 비트 할당을 위한 신호 대역폭이 결정된다. 이 방법에서, 결정된 신호 대역폭은 비트를 중앙에 집중함으로써 효과적으로 코딩되고 디코딩되어 오디오 품질이 향상된다.
도 6은 본 발명의 다른 실시예에 따른 오디오 신호 디코딩 장치에 대한 블록도이다. 도 6에 도시된 바와 같은 오디오 신호 디코딩 장치(60)에서, 도 5에 도시된 것과 유사한 유닛 또는 구성요소는 동일한 도면부호로 표시된다.
도 4에 도시된 바와 같은 제1 결정 유닛(32)과 마찬가지로, 비트 할당을 위한 신호 대역폭을 결정할 때, 오디오 신호 디코딩 장치(60)의 제2 결정 유닛(52)은 비트 할당을 위한 신호 대역폭을 오디오 신호의 대역폭의 일부에 대해 규정할 수 있다. 예를 들어, 제2 결정 유닛(52)은 비트 레이트 정보에 따라 비율 인자 팩트를 결정하도록 구성되어 있는 제3 비율 인자 결정 유닛(521)을 포함할 수 있고, 비율 인자 팩트는 0보다 크고 1보다 작거나 같을 수 있다. 대안으로, 제2 결정 유닛(52)은 제4 비율 인자 결정 유닛(522)을 포함할 수 있으며, 상기 제4 비율 인자 결정 유닛(522)은 서브대역 정규화 인자에 따라 오디오 신호의 고조파 클래스 또는 노이즈 레벨을 획득하고, 고조파 클래스 및 노이즈 레벨에 따라 비율 인자 팩트를 결정하도록 구성되어 있다.
또한, 제2 결정 유닛(52)은 제2 대역폭 결정 모듈(523)을 더 포함한다. 비율 인자 팩트를 획득한 후, 제2 대역폭 결정 모듈(523)은 비율 인자 팩트 및 양자화된 서브대역 정규화 인자에 따라 대역폭의 일부를 결정할 수 있다.
대안으로, 실시예에서, 제2 대역폭 결정 모듈(523)은, 대역폭의 일부를 결정할 때, 양자화된 서브대역 정규화 인자에 따라, 각각의 서브대역 내의 스펙트럼 에너지를 획득하고, 축적된 스펙트럼 에너지가 상기 비율 인자 팩트에 의해 승산된 모든 서브대역의 전체 스펙트럼 에너지의 적보다 크게 될 때까지, 각각의 서브대역 내의 스펙트럼 에너지를 저주파로부터 고주파로 축적하며, 현재의 서브대역을 뒤따르는 대역폭을 대역폭의 일부로서 사용한다.
대안으로, 실시예에서, 확장 유닛(55)은 제1 주파수 대역 결정 모듈(551) 및 스펙트럼 계수 획득 모듈(552)을 더 포함할 수 있다. 제1 주파수 대역 결정 모듈(551)은 현재 프레임 및 상기 현재 프레임 이전의 N개의 프레임의 비트 할당에 따라, 제1 주파수 대역을 결정하며, 상기 N은 양의 정수이다. 스펙트럼 계수 획득 모듈(552)은 제1 주파수 대역의 스펙트럼 계수에 따라, 고주파 대역의 스펙트럼 계수를 획득한다. 예를 들어, 제1 주파수 대역을 결정할 때, 제1 주파수 대역 결정 모듈(551)은 현재 프레임에 대해 할당된 비트와 이전의 N개의 프레임에 대해 할당된 비트 간의 상관관계를 획득하고, 그 획득된 상관관계에 따라 제1 주파수 대역을 결정할 수 있다.
배경 노이즈가 조정되어야 하면, 오디오 신호 디코딩 장치(60)는 서브대역 정규화 인자에 따라 노이즈 레벨을 획득하고 그 획득된 노이즈 레벨을 사용함으로서 고주파 대역 내의 배경 노이즈를 조정하도록 구성되어 있는 조정 유닛(57)을 더 포함할 수 있다.
대안으로, 다른 실시예에서, 스펙트럼 계수 획득 모듈(552)은 스펙트럼 평탄도 정보 및 고주파 대역 신호 유형에 따라 정규화 길이를 획득하고, 획득된 정규화 길이에 따라, 제1 주파수 대역의 스펙트럼 계수를 정규화하며, 제1 주파수 대역의 정규화된 스펙트럼 계수를 고주파 대역의 스펙트럼 계수로서 사용할 수 있다. 스펙트럼 평탄도 정보는: 제1 주파수 대역 내의 각각의 서브대역의 피크 대 평균 비율, 제1 주파수 대역에 대응하는 시간 도메인 신호의 상관관계, 또는 제1 주파수 대역에 대응하는 시간 도메인 신호의 제로-교차 비율을 포함할 수 있다.
본 발명의 본 실시예에 따르면, 코딩 및 디코딩 동안, 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라 비트 할당을 위한 신호 대역폭이 결정된다. 이 방법에서, 결정된 신호 대역폭은 비트를 중앙에 집중함으로써 효과적으로 코딩되고 디코딩되어 오디오 품질이 향상된다.
본 발명의 실시예에 따르면, 코딩 및 디코딩 시스템은 오디오 신호 코딩 장치 및 오디오 신호 디코딩 장치를 포함할 수 있다.
당업자라면 본 발명의 기술적 솔루션은 본 발명의 실시예에서 설명된 예시적 유닛 및 알고리즘 단계를 결합함으로써, 전자 하드웨어, 컴퓨터 소프트웨어, 또는 하드웨어와 소프트웨어의 통합의 형태로 실현될 수 있다는 것을 이해할 수 있을 것이다. 기능이 하드웨어로 실현되는지 소프트웨어로 실현되는지는 특정한 애플리케이션 및 기술적 솔루션의 설계된 제한에 따라 다를 수 있다. 당업자라면 특정한 애플리케이션의 경우에 다른 방법을 사용하여 기능을 실현할 수 있을 것이다. 그렇지만, 이러한 실현이 본 발명의 범위를 넘어서는 것으로 고려되어서는 안 된다.
당업자라면 상세한 설명을 용이하게 간략하게 하기 위해, 전술한 시스템, 장치, 및 유닛의 작업 프로세스에 대해서, 방법 실시예에서의 대응하는 설명을 참조할 수 있으므로, 이에 대해서는 여기서 설명하지 않는다.
본 발명의 실시예에서 제공하는 예시적 실시예에서, 설명된 시스템, 장치, 및 디바이스는 또한 다른 방식으로 실현될 수 있다는 것은 당연하다. 예를 들어, 장치 실시예는 예시적인 것에 불과하다. 예를 들어, 유닛들은 논리 기능에 의해서만 분할된다. 실제의 실현에서는, 다른 분할 방식이 사용될 수도 있다. 예를 들어, 복수의 유닛 또는 구성요소가 하나의 시스템으로 결합되거나 통합될 수 있으며, 일부의 특징은 무시될 수 있거나 실현되지 않을 수도 있다. 또한, 설명되고 도해된 인터-커플링, 다이렉트 커플링, 또는 통신 가능한 접속은 일부의 인터페이스, 장치, 또는 전자식 또는 기계식 모드 내의 유닛, 또는 다른 방식을 사용하여 실현될 수 있다.
별도의 구성요소로서 사용된 유닛은 물리적으로 서로 독립적으로 될 수도 있고 안 될 수도 있다. 유닛으로서 설명된 구성요소는 물리적 유닛일 수도 있고 아닐 수도 있으며, 즉 하나의 위치에 설치되거나 복수의 네트워크 유닛에 배치될 수도 있다. 유닛의 전부 또는 일부는 본 발명의 실시예에 설명된 기술적 솔루션을 실현하는 데 필요에 따라 선택될 수 있다.
또한, 본 발명의 실시예에서의 다양한 기능 유닛은 프로세싱 유닛, 또는 물리적 독립 유닛으로 통합될 수 있거나; 또는 2가지 이상의 기능 유닛이 하나의 유닛으로 통합될 수도 있다.
이러한 기능이 판매 또는 사용을 위한 독립 제품으로서 소프트웨어 기능 유닛 및 기능의 형태로 실현되면, 컴퓨터가 판독 가능한 저장 매체에 저장될 수도 있다. 이러한 이해를 바탕으로, 종래기술 또는 기술적 솔루션의 일부에 이바지하는 본 발명에서 설명하는 기술적 솔루션 또는 기술적 솔루션의 일부는 본질적으로 소프트웨어 제품의 형태로 구현될 수 있다. 소프트웨어 제품은 저장 매체에 저장될 수 있다. 소프트웨어 제품은 컴퓨터 장치(PC, 서버, 또는 네트워크 장치)가 본 발명의 실시예에서 제공하는 방법 또는 그 단계의 일부를 실행할 수 있게 하는 일련의 명령어를 포함한다. 저장 매체는 프로그램 코드를 저장하는 다양한 매체, 예를 들어, 리드 온리 메모리(ROM), 랜덤 액세스 메모리(RAM), 자기 디스크, 또는 컴팩트 디스크-리드 온리 메모리(CD-ROM)를 포함할 수 있다.
결론적으로, 전술한 바는 본 발명의 예시적 실시예에 지나지 않는다. 본 발명은 이에 제한되지 않는다.

Claims (12)

  1. 고조파(harmonic) 신호 코딩 방법으로서,
    고조파 신호의 주파수 대역을 복수의 서브대역으로 분할하는 단계;
    각각의 서브대역의 서브대역 정규화 인자(normalization factor)를 양자화하는 단계;
    상기 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트를 할당하기 위한 신호 대역폭을 결정하는 단계;
    상기 결정된 신호 대역폭 내에서 서브대역의 서브대역 정규화 인자를 조정하는 단계;
    상기 조정된 서브대역 정규화 인자에 따라 상기 결정된 신호 대역폭 내에서 서브대역에 대해 비트를 할당하는 단계; 및
    각각의 서브대역에 대해 할당된 비트에 따라 상기 고조파 신호의 스펙트럼 계수를 코딩하는 단계
    를 포함하는 고조파 신호 코딩 방법.
  2. 제1항에 있어서,
    상기 비트를 할당하기 위한 신호 대역폭을 결정하는 단계는,
    상기 비트를 할당하기 위한 신호 대역폭을 상기 고조파 신호의 대역폭의 일부로서 규정하는 단계를 포함하는, 고조파 신호 코딩 방법.
  3. 제2항에 있어서,
    상기 고조파 신호의 대역폭의 일부로서 규정하는 단계는,
    상기 비트 레이트 정보에 따라, 0보다는 크고 1보다는 작거나 같은 비율 인자를 결정하는 단계; 및
    상기 비율 인자 및 상기 양자화된 서브대역 정규화 인자에 따라, 상기 대역폭의 일부를 결정하는 단계
    를 포함하는, 고조파 신호 코딩 방법.
  4. 제2항에 있어서,
    상기 비트 할당을 위한 신호 대역폭을 상기 고조파 신호의 대역폭의 일부로서 규정하는 단계는,
    상기 서브대역 정규화 인자에 따라, 상기 고조파 신호의 고조파 클래스(harmonic class) 또는 노이즈 레벨을 획득하는 단계;
    상기 고조파 클래스 또는 상기 노이즈 레벨에 따라, 0보다는 크고 1보다는 작거나 같은 비율 인자를 결정하는 단계; 및
    상기 비율 인자 및 상기 양자화된 서브대역 정규화 인자에 따라, 상기 대역폭의 일부를 결정하는 단계
    를 포함하는, 고조파 신호 코딩 방법.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서,
    상기 결정된 신호 대역폭 내에서 서브대역의 서브대역 정규화 인자를 조정하는 단계는,
    상기 대역폭의 일부의 중간 서브대역의 서브대역 정규화 인자를 상기 중간 서브대역을 뒤따르는 각각의 서브대역의 서브대역 정규화 인자로서 사용하는 단계를 포함하는, 고조파 신호 코딩 방법.
  6. 고조파 신호 코딩 장치로서,
    고조파 신호의 주파수 대역을 복수의 서브대역으로 분할하고, 각각의 서브대역의 서브대역 정규화 인자를 양자화하도록 구성된 양자화 유닛;
    상기 양자화된 서브대역 정규화 인자에 따라, 또는 상기 양자화된 서브대역 정규화 인자 및 비트 레이트 정보에 따라, 비트를 할당하기 위한 신호 대역폭을 결정하도록 구성된 제1 결정 유닛;
    상기 결정된 신호 대역폭 내에서 서브대역의 서브대역 정규화 인자를 조정하도록 구성된 서브대역 정규화 인자 조정 유닛;
    상기 서브대역 정규화 인자 조정 유닛에 의해 조정된 상기 조정된 서브대역 정규화 인자에 따라 상기 제1 결정 유닛에 의해 결정된 신호 대역폭 내에서 서브대역에 대해 비트를 할당하도록 구성된 제1 할당 유닛; 및
    각각의 서브대역에 대해 상기 제1 할당 유닛에 의해 할당된 비트에 따라 상기 고조파 신호의 스펙트럼 계수를 코딩하도록 구성된 코딩 유닛
    을 포함하는 고조파 신호 코딩 장치.
  7. 제6항에 있어서,
    상기 제1 결정 유닛 구체적으로,
    상기 비트를 할당하기 위한 신호 대역폭을 상기 고조파 신호의 대역폭의 일부에 대해 규정하도록 구성되는, 고조파 신호 코딩 장치.
  8. 제7항에 있어서,
    상기 제1 결정 유닛은,
    상기 비트 레이트 정보에 따라, 0보다는 크고 1보다는 작거나 같은 비율 인자를 결정하도록 구성된 제1 비율 인자 결정 모듈;
    상기 비율 인자 및 상기 양자화된 서브대역 정규화 인자에 따라, 상기 대역폭의 일부를 결정하도록 구성된 제1 대역폭 결정 모듈
    을 포함하는, 고조파 신호 코딩 장치.
  9. 제7항에 있어서,
    상기 제1 결정 유닛은,
    상기 서브대역 정규화 인자에 따라, 상기 고조파 신호의 고조파 클래스 또는 노이즈 레벨을 획득하고, 상기 고조파 클래스 또는 상기 노이즈 레벨에 따라, 0보다는 크고 1보다는 작거나 같은 비율 인자를 결정하도록 구성된 제2 비율 인자 결정 모듈; 및
    상기 비율 인자 및 상기 양자화된 서브대역 정규화 인자에 따라, 상기 대역폭의 일부를 결정하도록 구성된 제1 대역폭 결정 모듈
    을 포함하는, 고조파 신호 코딩 장치.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서,
    상기 서브대역 정규화 인자 조정 유닛은, 상기 대역폭의 일부의 중간 서브대역의 서브대역 정규화 인자를 상기 중간 서브대역을 뒤따르는 각각의 서브대역의 서브대역 정규화 인자로서 사용하도록 구성되는, 고조파 신호 코딩 장치.
  11. 삭제
  12. 삭제
KR1020167005104A 2011-07-13 2012-03-22 오디오 신호 코딩 및 디코딩 방법 및 장치 KR101690121B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2011101960353A CN102208188B (zh) 2011-07-13 2011-07-13 音频信号编解码方法和设备
CN201110196035.3 2011-07-13
PCT/CN2012/072778 WO2012149843A1 (zh) 2011-07-13 2012-03-22 音频信号编解码方法和设备

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020137032084A Division KR101602408B1 (ko) 2011-07-13 2012-03-22 오디오 신호 코딩 및 디코딩 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020167035436A Division KR101765740B1 (ko) 2011-07-13 2012-03-22 오디오 신호 코딩 및 디코딩 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20160028511A KR20160028511A (ko) 2016-03-11
KR101690121B1 true KR101690121B1 (ko) 2016-12-27

Family

ID=44696990

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020137032084A KR101602408B1 (ko) 2011-07-13 2012-03-22 오디오 신호 코딩 및 디코딩 방법 및 장치
KR1020167035436A KR101765740B1 (ko) 2011-07-13 2012-03-22 오디오 신호 코딩 및 디코딩 방법 및 장치
KR1020167005104A KR101690121B1 (ko) 2011-07-13 2012-03-22 오디오 신호 코딩 및 디코딩 방법 및 장치

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020137032084A KR101602408B1 (ko) 2011-07-13 2012-03-22 오디오 신호 코딩 및 디코딩 방법 및 장치
KR1020167035436A KR101765740B1 (ko) 2011-07-13 2012-03-22 오디오 신호 코딩 및 디코딩 방법 및 장치

Country Status (8)

Country Link
US (4) US9105263B2 (ko)
EP (2) EP3174049B1 (ko)
JP (3) JP5986199B2 (ko)
KR (3) KR101602408B1 (ko)
CN (1) CN102208188B (ko)
ES (2) ES2718400T3 (ko)
PT (2) PT3174049T (ko)
WO (1) WO2012149843A1 (ko)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
WO2013147666A1 (en) * 2012-03-29 2013-10-03 Telefonaktiebolaget L M Ericsson (Publ) Transform encoding/decoding of harmonic audio signals
CN103544957B (zh) 2012-07-13 2017-04-12 华为技术有限公司 音频信号的比特分配的方法和装置
CN103778918B (zh) 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
KR102200643B1 (ko) * 2012-12-13 2021-01-08 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 음성 음향 부호화 장치, 음성 음향 복호 장치, 음성 음향 부호화 방법 및 음성 음향 복호 방법
CN103915097B (zh) * 2013-01-04 2017-03-22 中国移动通信集团公司 一种语音信号处理方法、装置和系统
PT2951818T (pt) * 2013-01-29 2019-02-25 Fraunhofer Ges Forschung Conceito de preenchimento de ruído
EP3399763A1 (en) * 2013-05-24 2018-11-07 Immersion Corporation Method and system for haptic data encoding
CN104217727B (zh) 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
US9489959B2 (en) 2013-06-11 2016-11-08 Panasonic Intellectual Property Corporation Of America Device and method for bandwidth extension for audio signals
CN104282308B (zh) * 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
CN110867190B (zh) * 2013-09-16 2023-10-13 三星电子株式会社 信号编码方法和装置以及信号解码方法和装置
ES2742420T3 (es) 2013-12-02 2020-02-14 Huawei Tech Co Ltd Método y aparato de codificación
EP2881943A1 (en) * 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
MX361028B (es) * 2014-02-28 2018-11-26 Fraunhofer Ges Forschung Dispositivo de decodificación, dispositivo de codificación, método de decodificación, método de codificación, dispositivo de terminal y dispositivo de estación de base.
CN110808056B (zh) 2014-03-14 2023-10-17 瑞典爱立信有限公司 音频编码方法和装置
KR102653849B1 (ko) * 2014-03-24 2024-04-02 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
KR102121642B1 (ko) * 2014-03-31 2020-06-10 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
CN105336339B (zh) 2014-06-03 2019-05-03 华为技术有限公司 一种语音频信号的处理方法和装置
CN106448688B (zh) 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
JP2016038435A (ja) * 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6457552B2 (ja) * 2014-11-27 2019-01-23 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
KR101701623B1 (ko) * 2015-07-09 2017-02-13 라인 가부시키가이샤 VoIP 통화음성 대역폭 감소를 은닉하는 시스템 및 방법
EP3208800A1 (en) 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
CN108630212B (zh) * 2018-04-03 2021-05-07 湖南商学院 非盲带宽扩展中高频激励信号的感知重建方法与装置
GB2582749A (en) * 2019-03-28 2020-10-07 Nokia Technologies Oy Determination of the significance of spatial audio parameters and associated encoding
EP3751567B1 (en) 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
CN112289328A (zh) * 2020-10-28 2021-01-29 北京百瑞互联技术有限公司 一种确定音频编码码率的方法及系统
CN112669860B (zh) * 2020-12-29 2022-12-09 北京百瑞互联技术有限公司 一种增加lc3音频编解码有效带宽的方法及装置
CN113724716B (zh) * 2021-09-30 2024-02-23 北京达佳互联信息技术有限公司 语音处理方法和语音处理装置
WO2024080597A1 (ko) * 2022-10-12 2024-04-18 삼성전자주식회사 오디오 비트스트림을 적응적으로 처리하는 전자 장치, 방법, 및 비일시적 컴퓨터 판독가능 저장 매체

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69231369T2 (de) * 1991-09-30 2001-03-29 Sony Corp Verfahren und Einrichtung zur Audiodatenkompression
JP3173218B2 (ja) * 1993-05-10 2001-06-04 ソニー株式会社 圧縮データ記録方法及び装置、圧縮データ再生方法、並びに記録媒体
JP3283413B2 (ja) * 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
JPH10240297A (ja) * 1996-12-27 1998-09-11 Mitsubishi Electric Corp 音響信号符号化装置
JPH11195995A (ja) 1997-12-26 1999-07-21 Hitachi Ltd 画像音声圧縮伸長装置
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
JP2000165251A (ja) 1998-11-27 2000-06-16 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置及びそれを実現したマイクロホン
JP2001134295A (ja) * 1999-08-23 2001-05-18 Sony Corp 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体
JP2001267928A (ja) 2000-03-17 2001-09-28 Casio Comput Co Ltd オーディオデータ圧縮装置、及び記憶媒体
JP4055336B2 (ja) 2000-07-05 2008-03-05 日本電気株式会社 音声符号化装置及びそれに用いる音声符号化方法
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP3478267B2 (ja) 2000-12-20 2003-12-15 ヤマハ株式会社 ディジタルオーディオ信号圧縮方法および圧縮装置
JP2003280695A (ja) 2002-03-19 2003-10-02 Sanyo Electric Co Ltd 音声圧縮方法および音声圧縮装置
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US20060172862A1 (en) 2003-06-05 2006-08-03 Flexiped As Physical exercise apparatus and footrest platform for use with the apparatus
ATE371926T1 (de) 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
KR100657916B1 (ko) 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US8036394B1 (en) * 2005-02-28 2011-10-11 Texas Instruments Incorporated Audio bandwidth expansion
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
WO2008126382A1 (ja) 2007-03-30 2008-10-23 Panasonic Corporation 符号化装置および符号化方法
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
JP5539203B2 (ja) * 2007-08-27 2014-07-02 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 改良された音声及びオーディオ信号の変換符号化
ES2403410T3 (es) * 2007-08-27 2013-05-17 Telefonaktiebolaget L M Ericsson (Publ) Frecuencia de transición adaptativa entre el rellenado con ruido y la extensión del ancho de banda
WO2009081568A1 (ja) 2007-12-21 2009-07-02 Panasonic Corporation 符号化装置、復号装置および符号化方法
EP2410522B1 (en) * 2008-07-11 2017-10-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal encoder, method for encoding an audio signal and computer program
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US20100223061A1 (en) * 2009-02-27 2010-09-02 Nokia Corporation Method and Apparatus for Audio Coding
US9424857B2 (en) 2010-03-31 2016-08-23 Electronics And Telecommunications Research Institute Encoding method and apparatus, and decoding method and apparatus
CN102208188B (zh) 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备

Also Published As

Publication number Publication date
KR20160149326A (ko) 2016-12-27
US20130018660A1 (en) 2013-01-17
EP3174049B1 (en) 2019-01-09
EP2613315A4 (en) 2013-07-10
US11127409B2 (en) 2021-09-21
PT3174049T (pt) 2019-04-22
ES2612516T3 (es) 2017-05-17
KR20140005358A (ko) 2014-01-14
KR101765740B1 (ko) 2017-08-07
US20200135219A1 (en) 2020-04-30
ES2718400T3 (es) 2019-07-01
US20180261234A1 (en) 2018-09-13
US9984697B2 (en) 2018-05-29
PT2613315T (pt) 2016-12-22
US9105263B2 (en) 2015-08-11
EP2613315B1 (en) 2016-11-02
JP6702593B2 (ja) 2020-06-03
EP3174049A1 (en) 2017-05-31
JP2018106208A (ja) 2018-07-05
EP2613315A1 (en) 2013-07-10
US10546592B2 (en) 2020-01-28
JP2014523549A (ja) 2014-09-11
WO2012149843A1 (zh) 2012-11-08
JP5986199B2 (ja) 2016-09-06
KR20160028511A (ko) 2016-03-11
KR101602408B1 (ko) 2016-03-10
CN102208188B (zh) 2013-04-17
JP6321734B2 (ja) 2018-05-09
JP2016218465A (ja) 2016-12-22
CN102208188A (zh) 2011-10-05
US20150302860A1 (en) 2015-10-22

Similar Documents

Publication Publication Date Title
KR101690121B1 (ko) 오디오 신호 코딩 및 디코딩 방법 및 장치
JP7177185B2 (ja) 信号分類方法および信号分類デバイス、ならびに符号化/復号化方法および符号化/復号化デバイス
JP5175028B2 (ja) デジタル信号の符号化方法及び装置ならびに復号化方法及び装置
KR101130355B1 (ko) 넓은-뜻의 지각적 유사성을 이용하는 디지털 미디어 스펙트럼 데이터의 효과적인 코딩
TWI591620B (zh) 產生高頻雜訊的方法
JP5313669B2 (ja) ディジタルメディアの効率的コーディング用のバンドを入手するための周波数セグメント化
EP1905007A1 (en) Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
CN109313908B (zh) 用于对音频信号进行编码的音频编码器以及方法
MX2014000161A (es) Aparato y metodo para generar señal extendida de ancho de banda.
KR101736705B1 (ko) 오디오 신호를 위한 비트 할당 방법 및 장치
KR20150058483A (ko) 오디오 신호의 비트를 할당하는 방법 및 장치
RU2633097C2 (ru) Способы и устройства кодирования и декодирования сигнала

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
A107 Divisional application of patent
GRNT Written decision to grant