KR20130137235A - 사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법 - Google Patents

사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법 Download PDF

Info

Publication number
KR20130137235A
KR20130137235A KR1020137028601A KR20137028601A KR20130137235A KR 20130137235 A KR20130137235 A KR 20130137235A KR 1020137028601 A KR1020137028601 A KR 1020137028601A KR 20137028601 A KR20137028601 A KR 20137028601A KR 20130137235 A KR20130137235 A KR 20130137235A
Authority
KR
South Korea
Prior art keywords
spectral
value
coefficients
spectrum
audio signal
Prior art date
Application number
KR1020137028601A
Other languages
English (en)
Other versions
KR101672025B1 (ko
Inventor
사샤 디쉬
벤자민 슈베르트
랄프 가이거
마틴 디에츠
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20130137235A publication Critical patent/KR20130137235A/ko
Application granted granted Critical
Publication of KR101672025B1 publication Critical patent/KR101672025B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Abstract

인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키기 위한 장치가 제공된다. 상기 장치는 처리 유닛(110), 유사 계수 결정기(120), 스펙트럼 변경 유닛(130), 스펙트럼-시간 변환 유닛(140), 제어가능 오실레이터(150) 및 믹서(160)을 포함한다. 상기 유사 계수 결정기(120)는 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하도록 구성되며, 유사 계수들 각각이 스펙트럼 값 및 스펙트럼 위치를 가진다. 상기 스펙트럼 변경 유닛(130)은 변경된 오디오 신호 스펙트럼을 얻기 위해 미리 설정된 값에 하나 이상의 유사 계수들을 설정하도록 구성된다. 상기 스펙트럼-시간 변환 유닛(140)은 시간-영역 변환 신호를 얻기 위해 변경된 오디오 신호 스펙트럼을 시간-영역으로 변환하도록 구성된다. 상기 제어가능 오실레이터(150)는 시간-영역 오실레이터 신호를 발생시키도록 구성되며, 상기 제어가능 오실레이터(150)는 하나 이상의 유사 계수들 중 적어도 하나의 스펙트럼 값 및 스펙트럼 위치에 의해 제어된다. 상기 믹서(160)는 상기 오디오 출력 신호를 얻기 위해 상기 시간-영역 오실레이터 신호 및 시간-영역 변환 신호를 믹스하도록 구성된다.

Description

사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법{APPARATUS AND METHOD FOR AUDIO ENCODING AND DECODING EMPLOYING SINUSOIDAL SUBSTITUTION}
본 발명은 오디오 신호 인코딩, 디코딩 및 처리에 관련되어 있고, 특히 사인 곡선 대체를 이용한 오디오 인코동 및 디코딩에 관련되어 있다.
오디오 신호 처리는 더욱 더 중요해지고 있다. 현대의 지각적 오디오 코덱들이 증가하는 저 비트 레이트들(low bit rates)에서 오디오 만족할만한 오디오 품질을 전달하는데 필요하기 때문에, 도전들이 발생하고 있다. 추가적으로, 예를 들어, 양-방향 통신 응용들 또는 배분된 게이밍 등에 대해, 때때로 허용되는 대기시간(latency)이 매우 낮다.
예를 들어, USAC(Unified Speech and Audio Coding) 같은, 현대의 오디오 코덱들은, 음악 컨텐츠가 여전히 대부분 변형 영역에서 코딩됨에도 불구하고, 때때로 변형 영역 코딩(변형 도메인 코딩, transform domain coding) 및 시간 영역 예측 코딩(time domain predictive coding) 사이에서 때때로 스위칭한다(switch). 예를 들어, < 14kbit/s 인, 저 비트 레이트들에서, 음악 아이템들의 음색(tonal) 구성요소들은 변형 코더들을 이용하여 코딩될 때 때때로 안좋은 소리를 내며, 이는 충분한 품질로 오디오를 코딩하는 업무를 더욱 더 어렵게 만든다.
추가적으로, 저-지연 제약들은 일반적으로 변형 코더들의 필터 뱅크의 차선적(sub-optimal) 주파수 응답을 이끌고 그래서 추가로 그러한 코덱들의 지각적 품질과 타협한다.
전통적인 심리음향학적 모델에 따라, 양자화 노이즈(quantization noise)와 관련된 투명도(transparency)를 위한 전제 조건이 정의된다. 고(high) 비트 레이트에서, 이는 사람의 청각 마스킹(masking) 레벨들을 따르는 양자화 노이즈의 지각적으로 적응된 최적의 시간/주파수 분배와 관련된다. 저 비트 레이트에서, 그러나, 투명도는 달성될 수 없다. 그래서, 마스킹 레벨 요구 감소 전략(masking level requirements reduction strategy)이 저(low) 비트 레이트에서 이용될 수 있다.
이미, 탑-노치(top-notch) 코덱들은 음악 컨텐츠를 위해 제공되었고, 특히, 변경 이상 코사인 변형(Modified Discrete Cosine Transform (MDCT))에 기반한 변형 코더들이며, 이는 주파수 영역에서 스펙트럼 계수들을 양자화하고 전송한다. 그러나, 아주 낮은 데이터 레이트에서, 오직 각 시간 프레임의 아주 적은 스펙트럼 라인들만이 그 프레임에 대해 이용가능한 비트들에 의해 코딩될 수 있다. 결론적으로, 시간적 조정 아티팩트들(artifacts) 및 소위 워블링(warbling) 아티팩트라 불리는 것이 불가피하게 코딩된 신호에 도입된다.
가장 현저하게, 아티팩트들의 이러한 타입들은 준-정적(quasi-stationary) 음색 구성요소들에서 지각된다. 이는 특히, 지연 제한들 때문에, 변형 윈도우 형태가 선택되어야 하는 경우 발생하며 잘-알려진 누수 효과 때문에 인접한 스펙트럼 계수들(스펙트럼 확대) 사이에 상당한 혼선을 유도한다. 그러나, 그럼에도 불구하고 일반적으로 이러한 인접 스펙트럼 계수들 중 오직 하나 또는 몇몇만이 저-비트 레이트 코더에 의해 거친(coarse) 양자화 후에 0이 아니게 남는다.(non-zero) 위에서 언급된대로, 선행기술에서, 하나의 접근에 따라, 변형 코더들이 이용된다. 음악 컨텐츠를 코딩하기 위해 적합한 현대의 고 압축 비율 오디오 코덱들은 모두 변형 코딩에 의존한다. 가장 중요한 예들은 MPEG2/4 어드밴스드 오디오 코딩(AAC) 및 MPEG-D 통합 스피치 및 오디오 코딩(USAC)이다. USAC는 대수 코드 여기 선형 예측(Algebraic Code Excited Linear Prediction, ACELP) 모듈과 일관된 스위칭된 코어 더하기 변형 코딩된 여기(Transform Coded Excitation, TCX) 모듈([5]를 보라)을 갖는다. AAC같이, TCX 또한 코딩 방법에 기반한 변형이다. 저 비트 레이트 설정에서, 특히 내포하는 코딩 설계들이 변경된 이산 코사인 변형(MDCT)([1]을 보라)인 경우, 이러한 코딩 설계들은 워블링 아티팩트들을 보이기 쉽다.
음악 재생을 위해, 변형 코더들은 오디오 데이터 압축을 위해 선호되는 기술이다. 그러나, 저 비트 레이트들에서, 전통적 변형 코더들은 강한 워블링 및 거친 아티팩트들을 보인다. 아티팩트들의 대부분은 너무 드문드문 코딩된 음색 스펙트럼 구성요소들로부터 유래한다. 이는 이러한 것들이 엄격한 지연 제한들을 만족시키기 위해 주로 설계된 차선적인 스펙트럼 전송 기능(누수 효과)에 의해 스펙트럼적으로 얼룩지는 경우 특히 발생한다.
선행 기술에 또다른 접근에 따라, 코딩 설계들은 과도단계들, 사인 곡선들 및 노이즈에 대해 완전히 매개변수적이다(파라메트릭, parametric). 특히, 중간 및 저 비트 레이트들에 대해, 완전히 매개변수적인 오디오 코덱들은 표준화되고, 그 중 가장 중요한 것은 MPEG-4 Part 3, Subpart 7 Harmonic and Individual Lines plus Noise (HILN) ([2]를 보라) 및 MPEG-4 Part 3, Subpart 8 SinuSoidal Coding (SSC) ([3]을 보라)이다. 매개변수 코더들은, 그러나, 유쾌하지 않은 인공적인 소리때문에 거슬리고, 증가하는 비트 레이트를 가지고, 지각적 투명도에 대해 잘 스케일링하지(크기가 잘 조정되지) 않는다.
추가 접근은 하이브리드 파형 및 매개변수 코딩을 제공한다. [4]에서, 파형 코딩 및 MPEG 4-SSC (사인 곡선 부분만) 에 기반한 변형의 하이브리드가 제안된다. 반복 처리에서, 사인 곡선들이 추출되고 변형 코딩 기술들에 의해 코딩될 잔류 신호를 형성하기 위해 신호에서 감산(subtracted)된다. 추출된 사인 곡선들은 매개변수들 집합에 의해 코딩되고 잔류물(residual)과 나란히 전송된다. [6]에서, 하이브리드 코딩 접근이 제공되며 사인곡선들 및 잔류물을 개별적으로 코딩한다. [7]에서, 제한 에너지 겹침 변형(Constrained Energy Lapped Transform (CELT))이라 불리는 코덱/고스트 웹페이지에서, 하이브리드 코딩의 오실레이터들의 뱅크(bank)를 활용하는 아이디어가 묘사된다.
중간 또는 더 높은 비트 레이트에서, 변형 코더들은 그들의 자연스러운 소리 때문에 음악을 코딩하는데 적합하다. 거기에서, 심리음향학 모델을 내포하는 투명도 요구들은 완전히 또는 거의 완전히 만족된다. 그러나, 낮은 비트 레이트에서, 코더들은 심리음향학 모델의 요구를 심각하게 어길 수 밖에 없고 그러한 상황에서 변형 코더들은 와블링, 거칠음, 및 음악적 노이즈 아티팩트들에 취약하다.
비록 완전한 매개변수 오디오 코덱들이 낮은 비트 레이트들에 대해 가장 적합하지만, 그러나 그들은 불쾌하게 인공적인 소리를 내는 것으로 알려져 있다. 게다가, 더 거친 매개변수 모델의 점진적 개선이 실현가능하지 않기 때문에, 이러한 코덱들은 지각적 투명도를 매끄럽게 스케일(scale)하지 않는다.
하이브리드 파형 및 매개변수 코딩은 잠재적으로 개별 접근들의 한계를 극복할 수 있었고 양쪽 기술들의 상호 직교 특성들로부터 잠재적으로 장점이 있을 수 있다. 그러나, 현재 기술에서, 변형 코딩 부분 및 하이브리드 코덱의 매개변수 부분 사이의 상호 작용의 부족에 의해 방해받는다. 문제는 매개변수 및 변형 코덱 부분 사이의 신호 분할, 매개변수 및 변형 코덱 출력의 매끄러운 병합 및 매개변수 시그널링 테크닉들, 변형 및 매개변수 부분 사이의 비트 예산 조절에 관련되어 있다.
본 발명의 목적은 하이브리드 오디오 인코딩 및 디코딩에 관한 향상된 개념을 제공하는 것이다.
본 발명의 목적은 청구항 1에 따른 장치, 청구항 12에 따른 장치, 청구항 29항에 따른 방법, 청구항 30에 따른 방법, 청구항 31에 따른 컴퓨터 프로그램에 의해 달성된다.
인코딩 오디오 신호 스펙트럼에 기반한 오디오 출력 신호를 발생시키기 위한 장치가 제공된다.
다음에서, 본 발명의 실시예들은 특징들에 관련하여 더 자세히 설명된다 :
도 1은 실시예에 따른 인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키기 위한 장치를 도시한다.
도 2는 또다른 실시예에 따라 인코딩된 오디오 신호 스펙트럼 상에 기반한 오디오 출력 신호를 발생시키는 장치를 묘사한다.
도 3은 MDCT / 역 MDCT 체인에 의해 처리된 후의 사인곡선들 및 원래 사인곡선들을 비교하는 두개의 다이어그램을 보여준다.
도 4는 실시예에 따라 오디오 신호 입력 스펙트럼을 인코딩하기 위한 장치를 도시한다.
도 5는 변경된(대체된) 오디오 신호 스펙트럼 및 대응하는 파워 스펙트럼, 오디오 신호 입력 스펙트럼을 묘사한다.
도 6은 또다른 파워 스펙트럼, 또다른 변경된(대체된) 오디오 신호 스펙트럼, 및 양자화된 오디오 신호 스펙트럼을 도시하며, 여기서 인코더 측면에서 발생된 양자화된 오디오 신호 스펙트럼은, 몇몇 실싱예들에서, 디코딩 측면에서 디코딩된 디코딩된 오디오 신호 스펙트럼에 대응한다.
본 발명의 목적은 하이브리드 오디오 인코딩 및 디코딩에 관한 향상된 개념을 제공하는 것이다.
본 발명의 목적은 청구항 1에 따른 장치, 청구항 12에 따른 장치, 청구항 29항에 따른 방법, 청구항 30에 따른 방법, 청구항 31에 따른 컴퓨터 프로그램에 의해 달성된다.
인코딩 오디오 신호 스펙트럼에 기반한 오디오 출력 신호를 발생시키기 위한 장치가 제공된다.
상기 장치는 디코딩된 오디오 신호 스펙트럼을 얻기 위해 인코딩된 오디오 신호 스펙트럼을 처리하기 위한 프로세싱(처리, processing) 유닛을 포함한다. 디코딩된 오디오 신호 스펙트럼은 복수의 스펙트럼 계수들을 포함하고, 여기서 각 스펙트럼 계수들은 스펙트럼 값 및 인코딩된 오디오 신호 스펙트럼 내에 스펙트럼 위치를 가지며, 여기서 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 스펙트럼 계수들은 인코딩된 오디오 신호 스펙트럼 내에 그들의 스펙트럼 위치에 따라 순차적으로 정렬된다.
게다가, 상기 장치는 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하기 위해 유사 계수 결정자(pseudo coefficients determiner)를 포함하며, 유사 계수들 각각은 스펙트럼 위치 및 스펙트럼 값을 갖는다. 게다가, 상기 장치는 변경된(수정된, modified) 오디오 신호 스펙트럼을 얻기 위해 미리 설정된 값에 대해 하나 이상의 유사 계수들을 설정하기 위한 스펙트럼 변경 유닛을 포함한다. 게다가, 상기 장치는 시간-영역 변환 신호를 얻기 위해 시간-영역에 변경된 오디오 신호 스펙트럼을 변환하기 위한 스펙트럼-시간 변환 유닛(spectrum-time conversion unit)을 포함한다.
게다가, 상기 장치는 시간-영역 오실레이터 신호를 발생시키기 위한 제어가능 오실레이터(controllable oscillator)는 하나 이상의 유사 계수들의 적어도 하나 이상의 스펙트럼 값 및 스펙트럼 위치에 의해 제어된다.
게다가, 상기 장치는 오디오 출력 신호를 얻기 위해 시간-영역 오실레이터 신호 및 시간-영역 변환 신호를 믹싱하기 위한 믹서(mixer)를 포함한다.
제안된 개념들은 낮은 비트 레이트들에서 변형 코덱들에 기반한 종래 블록의 지각적 품질을 향상시킨다. 오디오 신호 스펙트럼들에서 로컬 음색 영역들, 인접 로컬 최소값들에 걸쳐, 로컬 최대값들을 망라하여, 몇몇 실시예들에서, 대체될 상기 영역들에 따른 유사한 에너지 또는 레벨(level)을 갖는 (유사 계수들에 따라서도 언급되는) 유사 라인들에 의해 대체하는 것이 제안되었다.
실시예에 따라, 낮은 지연 및 낮은 비트 레이트(bit rate) 오디오 코딩이 제공된다. 몇몇 실시예들은 ToneFilling (TF) 에 따른 새로운 그리고 독창적인 개념에 기반한다. ToneFilling 용어는 코딩 기술을 의미하고, 여기서 반면 나쁘게 코딩된 자연스러운 음색(톤, tones)은 지각적으로 유사한 여전히 순수한 사인 음색들(sine tones)에 의해 대체된다.
그래서, 가장 인접한 MDCT 빈(bin)의 스펙트럼 위치와 관련한 사인곡선의 스펙트럼 위치에 의존하는, 특정 레이트(rate)에서 진폭 변조 아티팩트들(amplitude modulation artifacts)은, 피해진다("워블링(warbling)"으로 알려짐) 실시예들에 따라, 모든 고려가능한 아티팩트들의 곤혹스러운 정도가 가중된다. 이는 아티팩트들의 고정된 것에 대해 예를 들어 변조, 조화도, 피치, 같은 지각적 관점들에 관련된다. 모든 관점들은 사운드 지각 곤혹 모델(Sound Perception Annoyance Model (SPAM))에서 측정된다. 그러한 모델에 의해 조정되어, 톤필링(ToneFilling)은 상당한 이점을 제공한다. 피치 및 변조 에러는 순수 사인 음색(pure sine tone)과 함께 자연스러운 음색을 대체하는 것에 의해 도입되고, 드문드문 양자화된 자연스러운 음색에 의해 야기된 나쁜 정상성(stationarity)("워블링(warbling)") 및 추가적인 노이즈의 영향에 비해 가중된다.
톤필링(ToneFilling )은 사인곡선-플러스-노이즈 코덱들에 대한 상당한 차이들을 제공한다. 예를 들어, TF는, 사인곡선들의 감산 대신에, 사인들에 의해 음색들을 대체한다. 지각적으로 유사한 톤들은 대체될 원래 사운드 구성 성분들에 따라 동일한 로컬 무게 중심(Centers Of Gravity, COG)를 갖는다. 실시예들에 따라, 원래 음색들은 오디오 스펙트럼(COG 기능의 왼쪽에서 오른쪽 발(foot))에서 지워진다. 일반적으로, 대체를 위해 이용되는 사인곡선의 주파수 해상도는 부가 정보를 최소화할 수 있을만큼 거칠며, 반면, 동시에, 불협화음 감각을 피하기 위해 지각적 요구사항들을 설명(처리)한다.
몇몇 실시예들에서, 톤필링은 상기 지각적 요구들 때문에, 낮은 차단 주파수 밑이 아닌, 낮은 컷오프 주파수(차단 주파수) 위에서 수행될 수 있다. 톤필링을 수행할 때, 톤들은 변형 코더 내에서 스펙트럼 유사-라인들을 통해 표현된다. 그러나, 톤필링이 장착된 인코더에서, 유사 라인들은 전통적 음향심리학 모델에 의해 제어되는 일반적 프로세싱의 대상이다. 그래서, 톤필링을 수행할 때, (음색 성분들이 대체되는 비트 레이트 x, y 에서) 매개변수 부분의 선행적 제한에 대한 필요가 없다. 그런, 변형 코덱으로의 단단한 통합이 달성된다.
로컬 COGs(부드럽게 측정; 피크 품질 측정)를 감지하는 것에 의해, 음색 성분들을 제거하는 것에 의해, 대체되는 유사-라인들(예를 들어, 유사 계수들)을 발생시키는 것에 의해, 톤필링 기능성은 인코더에서 이용될 수 있고, 이는 유사 라인들의 표시를 통해 정밀한 주파수 정보 {하프 빈 오프셋(half bin offset)} 및 유사-라인들의 스펙트럼 위치를 통해 주파수 정보, 유사-라인들의 진폭을 통해 레벨 정보를 전달한다. 유사 계수들(유사-라인들)은 어떠한 정규 스펙트럼 계수(스펙트럼 라인)같이 코덱의 다음(subsequent) 양자화 유닛에 의해 처리된다.
톤필링은 고립된 스펙트럼 라인들을 감지하는 것에 의해 디코더에서 더 이용될 수 있고, 여기서 진짜 유사 계수들(true pseudo coefficients) (유사-라인들)은 플래그 배치에 의해 마크될(marked) 수 있따. 상기 디코더는 사인곡선 트랙들을 구축하기 위한 유사-라인 정보를 연결할 수 있다. 탄생/지속/소멸 설계는 연속 트랙들을 합성하도록 이용될 수 있다.
디코딩을 위해, 유사 계수들(유사-라인들)은 부가 정보 내에서 전송되는 플래그 배치(flag array)에 의해 마크될 수 있다. 유사-라인들의 하프-빈(half-bin) 주파수 해상도는 유사 계수들(유사-라인들)의 표시에 의해 시그널링 될 수 있다. 디코더에서, 유사-라인들은 오실레이터들의 뱅크(bank)에 의해 개별적으로 합성되고 역 변형 유닛 전에 스펙트럼으로부터 지워질 수 있다. 시간이 지나, 오실레이터들의 쌍은 연결될 수 있고 매개변수 보간(parameter interpolation)은 매끄럽게 전개되는 오실레이터 출력을 보장하기 위해 이용된다.
매개변수-구동 오실레이터들의 on- 및 offset들은 그것들이 밀접하게 변형 코덱의 윈도우잉 작동의 시간적 특성들에 대응하고 출력 신호의 오실레이터 발생 부분 및 변형 코덱 발생 부분 사이의 매끄러운 전이를 보장하는 식으로 성형(shaped)될 수 있다.
제공된 개념들은 AAC, TCX 또는 유사 구성들같은 현존 변형 코딩 설계들로 노력없이 잘 통합된다. 매개변수 양자화 정확도의 조정은 코덱들의 현존 레이트 제어에 의해 암묵적으로 수행될 수 있다.
실시예에 따라, 스펙트럼 계수들 각각은 즉각 선행자(immediate predecessor) 및 즉각 후행자(immediate successor) 중 적어도 하나를 가질 수 있고, 여기서 상기 스펙트럼 계수의 즉각 선행자들은 시퀀스 내에서 상기 스펙트럼 계수에 바로 앞서는 스펙트럼 계수들 중 하나가 될 수 있고, 여기서 상기 스펙트럼 계수의 즉각 후행자들은 시퀀스 내에서 상기 스펙트럼 계수를 바로 뒤따르는 스펙트럼 계수들 중 하나가 될 수 있다.
유사 계수 결정기는 미리 설정된 값과 다른 스펙트럼 값을 갖고, 미리 설정된 값과 동등한 스펙트럼 값 즉각 선행자을 갖는, 그리고 미리 설정된 값에 동등한 스펙트럼 값 즉각 후행자을 갖는, 시퀀스의 적어도 하나의 스펙트럼 계수를 결정하는 것에 의해 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하도록 구성될 수 있다.
실시예에서, 미리 설정된 값은 0일 수 있다.
실시예에 딸, 유사 계수 결정기는, 즉각 선행자들을 갖고, 그것의 스펙트럼 값은 미리 설정된 값에 동등하고, 즉각 후행자을 갖고, 그것의 스펙트럼 값은 미리 설정된 값과 동등한, 유사 계수 후보에 따라 시퀀스의 적어도 한 스펙트럼 계수를 결정하는 것에 의해 디코딩된 오디오 신호의 하나 이상의 유사 계수들을 결정하도록 구성될 수 있다.
유사 계수 결정기는 부가 정보가 상기 유사 계수 후보가 유사 계수인지를 표시하는지 여부를 결정하는 것에 의해 유사 계수 후보가 유사 계수인지 여부를 결정하도록 구성될 수 있다.
실시예에서, 제어가능 오실레이터는 오실레이터 신호의 오실레이터 신호 주파수는 하나 이상의 유사 계수들의 스펙트럼 위치에 기반하도록 오실레이터 신호를 갖는 시간-영역 오실레이터 신호를 발생시키도록 구성될 수 있다.
몇몇 실시예들에서, 오실레이터 신호의 신호 주파수는 둘 이상의 시간적으로 연속적인 유사 계수들의 스펙트럼 위치 사이에 보간을 수행하는 것에 의해 발생된다.
실시예에 따라, 유사 계수들은 표시된 값들이고, 각각은 표시 성분을 포함한다. 오실레이터 신호의 오실레이터 신호 주파수가 추가로 하나 이상의 유사 계수들 중 하나의 표시 성분에 의존하고, 표시 성분이 제1표시 값을 가질 때, 오실레이터 신호 주파수가 제1주파수 값을 가지도록, 성분 표시가 상이한 제2값을 가질 때, 오실레이터 신호 주파수가 상이한 제2주파수 값을 가지도록, 제어가능 오실레이터는 시간-영역 오실레이터 신호를 발생시키도록 구성될 수 있다.
실시예에서, 제어가능 오실레이터는 시간-영역 오실레이터 신호를 발생시키기 위해 구성될 수 있고, 여기서 오실레이터 신호의 진폭은 하나 이상의 유사 계수들 중 하나의 스펙트럼 값에 의존할 수 있고, 그래서 스펙트럼 값이 제3값을 가질 때 오실레이터 신호의 스펙트럼 값은 제1진폭값을 갖고, 스펙트럼 값이 상이한 제4값을 가질 때 오실레이터 신호의 진폭은 상이한 제2진폭값을 갖고, 제4값이 제3값보다 클 때, 제2진폭 값은 제1진폭 값보다 크다.
몇몇 실시예들에 따라, 오실레이터 신호의 진폭 값은 둘 이상의 시간적으로 연속된 유사 계수들의 스펙트럼 값들 사이에 보간을 수행하는 것에 의해 발생된다. 몇몇 실시예들에서, 오실레이터 신호의 진폭은 값이 전송되는 시간에서의 포인트들 사이에 보간을 수행하는 것에 의해 발생된다.
실시예에서, 제어가능 오실레이터는 예를 들어, 전송 동안 데이터 프레임 손실을 감추기 위해, 또는 오실레이터 제어의 불안정한 거동을 매끄럽게 하기 위해 선행 프레임의 유사 계수로부터 유도된 외삽된(extrapolated) 매개변수들을 통해 추가적으로 제어될 수도 있다.
몇몇 실시예들에 따라, 오실레이터 신호의 진폭 값은 두개 이상의 유사 계수들의 스펙트럼 값들 사이의 보간을 수행하는 것에 의해 발생된다. 예를 들어, 몇몇 실시예들에서, 오실레이터 신호의 진폭은 값이 전송되는 시간에서의 포인트들 사이에 보간을 수행하는 것에 의해 발생된다. 실시예에 따라, 변경된 오디오 신호 스펙트럼은, MDCT 계수들을 포함하여, MDCT 스펙트럼일 수 있다. 스펙트럼-시간 변환 유닛은 시간 영역으로 디코딩된 오디오 신호 스펙트럼의 계수들의 적어도 몇몇을 변환하는 것에 의해 MDCT 영역으로부터 시간 영역으로 MDCT 스펙트럼을 변환하도록 구성될 수 있다.
실시예에서, 믹서는 시간-영역 변환 신호 및 시간-영역 오실레이터 신호를 시간-영역에서 시간-영역 변환 신호를 시간-영역 오실레이터 신호에 더하는 것에 의해 믹스하도록 구성될 수 있다.
게다가, 오디오 신호 입력 스펙트럼을 인코딩하기 위한 장치가 제공된다. 오디오 신호 입력 스펙트럼은 복수의 스펙트럼 계수들을 포함하고, 여기서 스펙트럼 계수들 각각은 오디오 신호 입력 스펙트럼 및 스펙트럼 값 내에 스펙트럼 위치를 갖는다. 스펙트럼 계수들은 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 오디오 신호 입력 스펙트럼 내에 그들의 스펙트럼 위치에 따라 순차적으로 정렬된다. 스펙트럼 계수들 각각은 적어도 하나 이상의 후행자들을 갖고 적어도 하나 이상의 선행자들을 가지며, 여기서 상기 스펙트럼 계수의 선행자들 중 각 하나는 시퀀스 내에 상기 스펙트럼 계수를 선행하는 스펙트럼 계수들 중 하나이다. 상기 스펙트럼 계수의 후행자들 중 각 하나는 시퀀스 내에서 상기 스펙트럼 계수를 후행하는 스펙트럼 계수들 중 하나이다.
상기 장치는, 바람직하게는 내포하는 시간-주파수 변형에 의해 제공되는 더 높은 스펙트럼 해상도에서, 하나의 극값 또는 그 이상의 극값들을 결정하기 위해 극값 결정기를 포함한다.
예를 들어 오디오 신호 입력 스펙트럼은 복수의 MDCT 계수들을 갖는 MDCT 스펙트럼일 수 있다.
극값 결정기는 비교 스펙트럼 상에 극값들 또는 극값을 결정할 수 있고, 여기서 비교 스펙트럼의 계수의 비교 값은 MDCT 스펙트럼의 MDCT 계수들 각각에 할당된다. 그러나, 비교 스펙트럼은 오디오 신호 입력 스펙트럼 보다 더 높은 스펙트럼 해상도를 가질 수 있다. 예를 들어, 비교 스펙트럼은 MDCT 오디오 신호 입력 스펙트럼 보다 두배인 스펙트럼 해상도를 갖는 이산 푸리에 변형 (DFT) 스펙트럼(짝수로 또는 홀수로 쌓인 DFT)일 수 있다. 이에 의해, DFT 스펙트럼의 오직 모든 제2스펙트럼 값은 MDCT 스펙트럼의 스펙트럼 값에 할당된다. 그러나, 비교 스펙트럼의 극값 또는 극값들이 결정될 때, 비교 스펙트럼의 다른 계수들이 고려될 수 있다. 이에 의해, 비교 스펙트럼의 계수는 오디오 신호 입력 스페그럼의 스펙트럼 계수에 할당되지 않는, 그러나 즉각 후행자 및 즉각 선행자를 갖는, 오디오 신호 입력 스펙트럼의 스펙트럼 계수의 즉각 후행자에 그리고 오디오 신호 입력 스펙트럼의 스펙트럼 계수에, 개별적으로 할당되는, 극값에 따라 결정될 수 있다. 따라서, 비교 스펙트럼의 상기 극값(예를 들어, 고-해상도 DFT 스펙트럼)은 (MDCT) 오디오 신호 입력 스펙트럼의 상기 스펙트럼 계수의 상기 즉각 후행자 및 (MDCT) 오디오 신호 입력 스펙트럼의 상기 스펙트럼 계수 사이에 위치하는 (MDCT) 오디오 신호 입력 스펙트럼 내의 스펙트럼 위치에 할당된다는 것이 고려될 수 있다. 그러한 상황은 나중에 설명될 유사 계수의 적절한 표시 값을 선택하는 것에 의해 인코딩 될 수 있다. 이에 의해, 서브-빈(sub-bin) 해상도가 달성된다.
게다가, 상기 장치는 미리 설정된 값에 극값 계수들 중 적어도 하나의 후행자들의 적어도 하나 또는 선행자들의 적어도 하나의 스펙트럼 값을 설정하는 것에 의해 변경된 오디오 신호 스펙트럼을 얻기 위해 오디오 신호 입력 스펙트럼을 변경하기 위한 스펙트럼 변경자를 포함한다. 게다가, 스펙트럼 변경자는 미리 설정된 값에 하나 이상의 극값 계수들의 스펙트럼 값들을 설정하지 않도록 구성되거나, 유사 계수에 의해 하나 이상의 극값 계수들 중 적어도 하나를 교체하도록 구성되고, 여기서 유사 계수의 스펙트럼 값은 미리 설정된 값과 다르다.
게다가, 상기 장치는 인코딩된 오디오 신호 스펙트럼을 얻기 위해 변경된 오디오 신호 스펙트럼을 처리하기 위한 프로세싱(처리) 유닛을 포함한다.
게다가, 상기 장치는 부가 정보를 전송하고 발생시키기 위한 부가 정보 발생기를 포함하고, 여기서 부가 정보 발생기는 스펙트럼 변경자에 의해 발생되는 변경된 오디오 신호 입력 스펙트럼 내에 하나 이상의 유사 계수 후보들(candidates)을 위치시키도록 구성되며, 여기서 부가 정보 발생기는 선택된 후보자들에 따라 유사 계수 후보자들의 적어도 하나를 선택하도록 구성되며, 여기서 부가 정보 발생기는 부가 정보가 유사 계수들에 따라 선택된 후보들을 표시하도록 부가 정보를 발생시키도록 구성된다.
바람직하게는 내포하는 시간-주파수 변형에 의해 제공되는 것에 따라 더 높은 스펙트럼 해상도에서, 극값 결정기는 하나 이상의 극값 계수들을 결정하도록 구성되고, 극값 계수들의 각각이 스펙트럼 계수들 중 하나이고 스펙트럼 값은 그것의 후행자들 중 적어도 하나의 스펙트럼 값보다 크고 및 스펙트럼 값은 그것의 선행자들 중 적어도 하나의 스펙트럼 값보다 크다. 또는, 스펙트럼 계수들 각각은 상기 스펙트럼 계수와 관련된 비교 값을 갖고, 극값 결정기는 하나 이상의 극값 계수들을 결정하도록 구성되고, 그래서 극값 계수들의 각각은 스펙트럼 계수들 중 하나이고 그것의 비교 값은 그것의 선행자들 중 적어도 하나의 비교 값보다 크고 그것의 비교 값은 그것의 후행자들 중 적어도 하나의 비교 값보다 크다.
실시예에 따라, 부가 정보 발생기에 의해 발생되는 부가 정보는 통계적일 수 있고, 미리 설정된 크기 또는 그것의 크기는 신호-적응 방법(signal-adaptive manner)에서 반복하여 측정될 수 있다. 이 경우, 부가 정보의 실제 크기는 디코더에도 전송된다. 그래서, 실시예에 따라, 부가 정보 발생기(440)은 부가 정보의 크기를 전송하도록 구성된다.
실시예에서, 오디오 신호 입력 스펙트럼의 스펙트럼 계수들의 적어도 몇몇의 스펙트럼 값들은 변경된 오디오 신호 스펙트럼에서 변경되지 않은채로 남겨지도록 스펙트럼 변경자는 오디오 신호 입력 스펙트럼을 변경하도록 구성된다.
실시예에 따라, 스펙트럼 계수들 각각은 그것의 후행자들 중 하나에 따라 즉각 후행자 및 그것의 선행자들 중 하나에 따라 즉각 선행자 중 적어도 하나를 가지며, 여기서 상기 스펙트럼 계수의 즉각 선행자는 시퀀스 내에서 상기 스펙트럼 계수를 즉각 선행하는 스펙트럼 계수들 중 하나이며, 상기 스펙트럼 계수의 즉각 후행자는 시퀀스 내에서 상기 스펙트럼 계수를 즉각 후행하는 스펙트럼 계수들 중 하나이다.
스펙트럼 변경자는 미리 설정된 값에 극값 계수들의 적어도 하나의 즉각 선행자 또는 즉각 후행자의 스펙트럼 값을 설정하는 것에 의해 변경된 오디오 신호 스펙트럼을 얻도록 오디오 신호 입력 스펙트럼을 변경하도록 구성될 수 있고, 여기서 스펙트럼 변경자는 미리 설정된 값에 하나 이상의 극값 계수들의 스펙트럼 값들을 설정하지 않도록 구성될 수 있고, 또는 유사 계수에 의해 하나 이상의 극값 계수들의 적어도 하나를 교체하도록 구성될 수 있고 여기서 유사 계수의 스펙트럼 값은 미리 설정된 값과 다르다.
극값 결정기가 비교 스펙트럼(예를 들어, 파워 스펙트럼)에 기반한 극값 계수들을 결정할 때, 예를 들어, 비교 스펙트럼(예를 들어, 파워 스펙트럼)의 로컬 최대값이 될 수 있는, 스펙트럼 계수들은, 오디오 신호 입력 스펙트럼(예를 들어, MDCT 스펙트럼)의 로컬 최대값이 될 필요가 없다.
극값 결정기는 하나 이상의 계수들을 결정하도록 구성될 수 있고, 극값 계수들 각각은 스펙트럼 계수들 중 하나이고 스펙트럼 값은 그것의 즉각 후행자의 스펙트럼 값보다 크고 스펙트럼 값은 그것의 즉각 선행자의 스펙트럼 값보다 크다. 또는 스펙트럼 계수들 각각은 상기 스펙트럼 계수와 관련된 비교 값을 갖고, 극값 결정기는 하나 이상의 극값 계수들을 결정하도록 구성될 수 있고, 그래서 극값 계수들 중 각각은 스펙트럼 계수들 중 하나이며 그것의 비교 값은 그것의 즉각 선행자들의 비교 값보다 크고 그것의 비교 값은 그것의 즉각 후행자들의 비교 값보다 크다.
실시예에 따라, 하나 이상의 최소 계수들 각각은 스펙트럼 계수들 중 하나이며 그것의 스펙트럼 값은 그것의 선행자들 중 하나의 스펙트럼 값보다 작고 그것의 스펙트럼 값은 그것의 후행자들 중 하나의 스펙트럼 값보다 작도록, 극값 결정기는 하나 이상의 최소 계수들을 결정하도록 구성될 수 있고, 또는 여기서 스펙트럼 계수들 각각은 상기 스펙트럼 계수와 관련된 비교 값을 갖고, 최소 계수들 각각은 스펙트럼 계수들 중 하나이며 그것의 비교 값은 그것의 선행자들 중 하나의 비교 값보다 작고 그것의 비교 값은 그것의 후행자들 중 하나의 비교 값보다 작도록 여기서 극값 결정기는 하나 이상의 최소 계수들을 결정하도록 구성된다. 그러한 실시예에서, 스펙트럼 변경자는 스펙트럼 값들 또는 극값 계수들 중 하나 이상의 비교 값 또는 최소 계수들 중 하나 이상에 기반한 표현 값을 결정하도록 구성되고, 표현값이 미리 설정된 값과 상이하게 된다. 게다가, 스펙트럼 변경자는 표현 값에 상기 스펙트럼 값을 설정하는 것에 의해 오디오 신호 입력 시퀀스의 계수들 중 하나의 스펙트럼 값을 변환하도록 구성될 수 있다.
실시예에 따라, 스펙트럼 변경자는 비교 값 또는 극값 계수들 중 하나의 스펙트럼 값 사이의 값 차이가 임계값(threshold value)보다 작은지 여부를 결정하도록 구성될 수 있다. 게다가, 스펙트럼 변경자는 값 차이가 임계값보다 작은지 여부에 의존하여 변경된 오디오 신호 스펙트럼에서 오디오 신호 입력 스펙트럼의 스펙트럼 계수들 중 적어도 몇몇의 스펙트럼 값들이 변경되지 않고 남겨지도록 오디오 신호 입력 스펙트럼을 변경하도록 구성될 수 있다.
실시예에서, 극값 결정기는 스펙트럼 값들의 스펙트럼 값들의 시퀀스의 하나 이상의 서브-시퀀스들을 결정하도록 구성될 수 있고, 서브-시퀀스들의 각 하나는 복수의 다음 스펙트럼 계수들 오디오 신호 입력 스펙트럼을 포함한다. 다음 스펙트럼 계수들은 그것들의 스펙트럼 위치에 따라 서브-시퀀스 내에 순차적으로 정렬될 수 있다. 서브-시퀀스들 각각은 상기 순차적으로-정렬된 서브-시퀀스에서 첫번째인 최초 요소(first element) 및 순차적으로-정렬된 서브-시퀀스에서 마지막인 최종 요소(last element)를 가질 수 있다. 게다가, 서브-시퀀스들 각각은 최소 계수들의 정확한 두개 및 극값 계수들의 정확한 하나, 서브-시퀀스의 최초 요소인 최소 계수들 중 하나, 서브-시퀀스의 최종 요소인 최소 계수들 중 다른 하나를 포함할 수 있다. 그러한 실시예에서, 스펙트럼 변경자는 서브-시퀀스들 중 하나의 계수들의 비교 값들 또는 스펙트럼 값들에 기반한 표현 값을 결정하도록 구성될 수 있다. 스펙트럼 변경자는 표현 값에 상기 스펙트럼 값을 설정하는 것에 의해 상기 서브-시퀀스의 계수들 중 하나의 스펙트럼 값을 변경하도록 구성될 수 있다.
실시예에 따라, 제2합계를 얻기 위해 서브-시퀀스의 모든 스펙트럼 계수들의 비교 값들을 요약하는, 제1합계를 얻기 위해 가중된 계수들을 합산하는 것에 의해; 중간 결과를 얻기 위해 제2합계에 의해 제1합계를 나누는 것에 의해; 스펙트럼 변경자는, 미리 설정된 값에 무게 중심 계수가 아닌, 서브-시퀀스의 모든 스펙트럼 계수들의 스펙트럼 값들을 설정하도록 구성되며, 무게 중심 계수를 얻기 위해 중간 결과상에 가까운 값으로 반올림하는 것을(round-to-nearest)을 적용하는 것에 의해, 극값 결정기는 복수의 가중된 계수들을 얻기 위해 서브-시퀀스의 각 스펙트럼 계수에 대한 위치 값 및 비교 값의 곱을 결정하는 것에 의해 무게 중심 계수를 결정하도록 구성될 수 있다. 또는, 제2합계를 얻기 위해 서브-시퀀스의 모든 스펙트럼 계수들의 스펙트럼 값들을 합산하는, 제1합계를 얻기 위해 가중된 계수들을 합산하는 것에 의해; 중간 결과를 얻기 위해 제2합계에 의해 제1합계를 나누는 것에 의해; 스펙트럼 변경자는 미리 설정된 값에 대한 무게 중심 계수가 아닌, 서브-시퀀스의 모든 스펙트럼 계수들의 스펙트럼 값을 설정하도록 구성되며, 무게 중심을 얻기 위해 중간 결과를 반올림하는 것을 적용하는 것에 의해, 상기 극값 결정기는 복수의 가중된 계수들을 얻기 위해 서브-시퀀스의 각 스펙트럼 계수에 대한 위치 값 및 스펙트럼 값의 곱을 결정하는 것에 의해 무게 중심 계수를 결정하도록 구성될 수 있다.
실시예에서, 미리 설정된 값은 0이다.
실시예에 따라, 각 스펙트럼 계수의 비교 값은 오디오 신호의 에너지 보존 변형으로부터 도출되는 추가 스펙트럼의 추가 계수의 제곱 값(square value)이다. 실시예에서, 각 스펙트럼 계수의 비교 값은 오디오 신호의 에너지 보존 변형으로부터 도출되는 추가 스펙트럼의 추가 계수의 진폭 값이다.
실시예에 따라, 추가 스펙트럼은 이산 푸리에 변형 스펙트럼(DFT) 스펙트럼이고 여기서 에너지 보존 변형은 이산 푸리에 변형(짝수 또는 홀수로 적층된 DFT).
또다른 실시예에 따라, 추가 스펙트럼은 복소 변경 이산 코사인 변형(CMDCT) 스펙트럼이며 여기서 에너지 보존 변형은 CMDCT이다.
실시예에 따라, 스펙트럼 변경자는 미세-조정된 정보를 수신하도록 구성될 수 있다. 오디오 신호 입력 스펙트럼의 계수들은 표시된 값들일 수 있고, 각각은 표시 성분을 포함한다. 제1 미세-조정 정보가 미세-조정 상태에 있을 때, 스펙트럼 변경자는 하나 이상의 극값 계수들 또는 유사 계수 중 표시 성분 하나를 제1표시 값에 대해 설정하도록 구성될 수 있다. 그리고, 미세-조정 정보가 상이한 제2미세-조정 상태에 있을 때, 스펙트럼 변경자는 하나 이상의 극값 계수들 또는 유사 계수 중 표시 성분 하나를 제2표시 값에 대해 설정하도록 구성될 수 있다.
실시예에서, 오디오 신호 입력 스펙트럼은 MDCT 계수들을 포함하는 MDCT 스펙트럼일 수 있다.
실시예에 따라, 처리 유닛은 양자화된 오디오 신호 스펙트럼을 얻기 위해 변경된 오디오 신호 스펙트럼을 양자화하기 위해 구성될 수 있다. 더 나아가 처리 유닛은 인코딩된 오디오 신호 스펙트럼을 얻기 위해 양자화된 오디오 신호 스펙트럼을 처리하도록 구성될 수 있다. 게다가, 처리 유닛은, 계수가 극값 계수들 중 하나인지 여부, 그것의 스펙트럼 값은 즉각 후행자 및 미리 설정된 값에 동등하고, 그것의 스펙트럼 값은 미리 설정된 값에 동등한 즉각 선행자를 갖는 양자화된 오디오 신호 스펙트럼의 스펙트럼 계수들만을 표시하는 부가 정보를 발생시키도록 추가로 구성될 수 있고, 상기 스펙트럼 계수의 즉각 선행자는 양자화된 오디오 신호 스펙트럼 내에 상기 스펙트럼 계수를 즉각 선행하는 또다른 스펙트럼 계수이다.
게다가, 인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키는 방법이 제공된다. 스펙트럼 계수들 각각은 인코딩된 오디오 신호 스펙트럼 및 스펙트럼 값 내에 스펙트럼 위치를 갖는다. 스펙트럼 계수들은 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 인코딩된 오디오 신호 스펙트럼 내에서 그들의 스펙트럼 위치에 따라 순차적으로 정렬된다. 오디오 출력 신호를 발생시키는 방법은 다음을 포함한다 :
- 복수의 스펙트럼 계수들을 포함하는 디코딩된 오디오 신호 스펙트럼을 얻기 위해 인코딩된 오디오 신호 스펙트럼을 처리
- 유사 계수들 각각은 스펙트럼 위치 및 스펙트럼 값을 가지며, 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들(pseudo coefficients)을 결정
- 변경된 오디오 신호 스펙트럼을 얻기 위해 미리 설정된 값에 하나 이상의 유사 계수들을 설정(Setting)
- 시간-영역 변환 신호를 얻기 위해 시간-영역에 변경된 오디오 신호 스펙트럼을 변환(Converting)
- 하나 이상의 유사 계수들 중 적어도 하나에서의 스펙트럼 값 및 스펙트럼 위치에 의해 제어되는 제어가능 오실레이터에 의해 시간-영역 오실레이터 신호를 발생시킴(Generating)
- 오디오 출력 신호를 얻기 위해 시간-영역 오실레이터 신호 및 시간-영역 변환 신호를 믹싱(Mixing)
더하여, 오디오 신호 입력 스펙트럼을 인코딩하기 위한 방법이 제공된다. 오디오 신호 입력 스펙트럼은 복수의 스펙트럼 계수들을 포함한다. 스펙트럼 계수들 각각은 오디오 신호 입력 스펙트럼 및 스펙트럼 값 내에 스펙트럼 위치를 갖는다. 스펙트럼 계수들은 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 오디오 신호 입력 스펙트럼 내에 그들의 스펙트럼 위치에 따라 순차적으로 정렬된다. 스펙트럼 계수들 각각은 하나 이상의 후행자들 중 적어도 하나를 갖는 그리고 하나 이상의 선행자들 중 적어도 하나를 갖는다. 상기 스펙트럼 계수의 각 선행자는 시퀀스 내에 상기 스펙트럼 계수를 선행하는 스펙트럼 계수들 중 하나이다. 상기 스펙트럼 계수의 각 후행자는 시퀀스 내에 상기 스펙트럼 계수를 후행하는 스펙트럼 계수들 중 하나이다. 오디오 신호 입력 스펙트럼을 인코딩하는 방법은 다음을 포함한다 :
- 하나 이상의 극값 계수들을 결정
- 미리 설정된 값에 극값 계수들 중 적어도 하나의 후행자들 중 적어도 하나 또는 선행자들 중 적어도 하나의 스펙트럼 값을 설정하는 것에 의해 변경된 오디오 신호 스펙트럼을 얻기 위해 오디오 신호 입력 스펙트럼을 변경, 여기서 오디오 신호 입력 스펙트럼을 변경하는 것은 미리 설정된 값에 하나 이상의 극값 계수들의 스펙트럼 값들을 설정하지 않는 것에 의해, 또는 유사 계수들에 의해 하나 이상의 극값 계수들 중 적어도 하나에서 교체(replacing)에 의해 수행되고, 여기서 유사 계수의 스펙트럼 값은 미리 설정된 값과 다르다.
- 인코딩된 오디오 신호 스펙트럼을 얻기 위해 변경된 오디오 신호 스펙트럼을 처리(Processing). 및 :
- 부가 정보를 발생(Generating) 및 전송(Transmitting), 여기서 변경된 오디오 신호 입력 스펙트럼 내에 하나 이상의 유사 계수 후보들을 위치시키는 것에 의해 부가 정보가 발생되며, 여기서 상기 부가 정보는 선택된 후보들에 따라 유사 계수 후보들 중 적어도 하나를 선택하는 것에 의해 발생되며, 여기서 상기 부가 정보가 유사 계수들에 따라 선택된 후보들을 표시하도록 상기 부가 정보가 발생된다.
하나 이상의 극값 계수들이 결정되며, 극값 계수들 각각은 스펙트럼 값이 그것의 선행자들 중 하나의 스펙트럼 값보다 큰 그리고 그것의 스펙트럼 값이 그것의 후행자들 중 하나의 스펙트럼 값보다 큰 스펙트럼 계수들 중 하나이다. 또는, 스펙트럼 계수들 각각은 상기 스펙트럼 계수와 관련된 비교 값을 갖고, 여기서 하나 이상의 극값 계수들이 결정되고, 극값 계수들 각각은 그것의 비교 값이 그것의 선행자들 중 적어도 하나의 비교 값보다 큰 그리고 그것의 비교값이 그것의 후행자들 중 적어도 하나의 비교 값보다 큰 스펙트럼 계수들 중 하나이다.
게다가, 컴퓨터 또는 신포 처리기에서 실행될 때 상기-설명된 방법들을 실행하기 위한 컴퓨터 프로그램이 제공된다.
오디오 인코더, 오디오 디코더, 관련 방법들 및 프로그램들 또는 인코딩된 오디오 신호가 제공된다. 게다가, 파형 코더들에 대한 사인곡선 대체의 개념들이 제공된다.
낮은 비트 레이트들에서, 본 발명은 단일 테크닉들을 넘어 지각적 품질 대 비트 레이트의 향상된 스케일링 및 향상된 지각적 품질을 얻기 위해 매개변수 코딩 및 파형 코딩을 어떻게 단단히 통합시키는지에 대한 개념들을 제공한다.
몇몇 실시예들에서, 잔류물로부터 합성된 사인곡선들을 반복적으로 감산하는 사인곡선 코더들과는 대조적으로, 스펙트럼들의 (인근 로컬 최소값들에 걸치고, 로컬 최대값을 아우르는) 첨두(peaky) 영역들은 단일 사인곡선 각각에 의해 완전히 대체될 수 있다. 적합한 첨두 영역들은 매끈해지고 약간 하얘진 스펙트럼 표현에서 추출되고 특정 특징들(피크 높이, 피크 형태)에 관해 선택된다.
몇몇 실시예들에 따라, 이러한 대체 사인곡선들은 사인곡선의 에너지 또는 전체 진폭을 반영하고 코딩될 스펙트럼 내에서 유사-라인들(유사 계수들)로 표현될 수 있다.
몇몇 실시예들에서, 유사-라인들(유사 계수들)은, 사인곡선 매개변수들의 분리된 시그널링과 대조적으로; 어떠한 정규 스펙트럼 라인같이 코덱 존재 양자화기에 의해 처리될 수 있다.
몇몇 실시예들에 따라, 유사-라인들(유사 계수들)은 부가 정보 플래그 배치에 의해 마크될 수 있다.
몇몇 실시예들에서, 유사-라인들의 표시의 선택은 반-부대역(semi-subband) 주파수 해상도를 나타낼 수 있다.
몇몇 실시예들에 따라, 사인곡선 대체를 위한 더 낮은 차단 주파수는 제한된 주파수 해상도(예를 들어, 반-부대역) 때문에 바람직할 수 있다.
몇몇 실시예들에서, 디코더에서, 유사 라인들은 정규 스펙트럼으로부터 삭제될 수 있고; 유사-라인 합성은 오실레이터들 보간의 뱅크(bank)에 의해 달성된다.
몇몇 실시예들에서, 선행 스펙트럼들의 외삽(extrapolation)으로부터 얻어진 사인곡선 트랙의 선택적으로 측정된 시작 위상이 이용될 수 있다.
몇몇 실시예들에 따라, 선택적 시간 영역 앨리어스 취소(TDAC) 테크닉은 사인곡선 트랙의 on-/off-set에서 앨리어스(alias)의 모델링에 의해 이용될 수 있다.
몇몇 실시예들에 따라, on-/off-set에서 앨리어스의 모델링에 의한 선택적 TDAC 앨리어스 취소가 이용될 수 있다.
다음에서, 본 발명의 실시예들은 특징들에 관련하여 더 자세히 설명된다 :
도 1은 실시예에 따른 인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키기 위한 장치를 도시한다.
도 2는 또다른 실시예에 따라 인코딩된 오디오 신호 스펙트럼 상에 기반한 오디오 출력 신호를 발생시키는 장치를 묘사한다.
도 3은 MDCT / 역 MDCT 체인에 의해 처리된 후의 사인곡선들 및 원래 사인곡선들을 비교하는 두개의 다이어그램을 보여준다.
도 4는 실시예에 따라 오디오 신호 입력 스펙트럼을 인코딩하기 위한 장치를 도시한다.
도 5는 변경된(대체된) 오디오 신호 스펙트럼 및 대응하는 파워 스펙트럼, 오디오 신호 입력 스펙트럼을 묘사한다.
도 6은 또다른 파워 스펙트럼, 또다른 변경된(대체된) 오디오 신호 스펙트럼, 및 양자화된 오디오 신호 스펙트럼을 도시하며, 여기서 인코더 측면에서 발생된 양자화된 오디오 신호 스펙트럼은, 몇몇 실싱예들에서, 디코딩 측면에서 디코딩된 디코딩된 오디오 신호 스펙트럼에 대응한다.
도 4는 실시예에 따른 오디오 신호 입력 스펙트럼을 인코딩하기 위한 장치를 도시한다. 인코딩하기 위한 장치는 극값 결정기(410), 스펙트럼 변경자(420), 처리 유닛(430) 및 부가 정보 발생기(440)을 포함한다.
도 4의 장치를 더 자세히 고려하기 전에, 도 4의 장치에 의해 인코딩되는 오디오 신호 입력 스펙트럼이 더 자세히 고려된다. 원칙적으로 오디오 신호 스펙트럼의 어떤 종류든지 도 4의 장치에 의해 인코딩될 수 있다. 오디오 신호 입력 스펙트럼은, 예를 들어, MDCT (Modified Discrete Cosine Transform) 스펙트럼, DFT(Discrete Fourier Transform) 크기 스펙트럼 또는 MDST (Modified Discrete Sine Transform) 스펙트럼이 될 수 있다.
도 5는 오디오 신호 입력 스펙트럼(510)의 예를 도시한다. 도 5에서, 오디오 신호 입력 스펙트럼(510)은 MDCT 스펙트럼이다.
오디오 신호 입력 스펙트럼은 복수의 스펙트럼 계수들을 포함한다. 스펙트럼 계수들 각각은 오디오 신호 입력 스펙트럼 및 스펙트럼 값 내에 스펙트럼 위치를 갖는다.
도 5의 예를 고려하면, 여기서 오디오 신호 입력 스펙트럼은 오디오 신호의 MDCT 변형을 도출하고, 예를 들어, 오디오 신호 입력 스펙트럼을 얻기 위한 오디오 신호를 변형시키는 필터 뱅크(filter bank)는, 예를 들어, 1024 채널들을 이용할 수 있다. 그러면, 스펙트럼 계수들 각각은 1024 채널들 중 하나와 관련되고 채널 숫자(예를 들어 0에서 1023사이의 숫자)는 상기 스펙트럼 계수들의 스펙트럼 위치로 고려될 수 있다. 도 5에서, 가로 좌표(abscissa, 511)은 스펙트럼 계수들의 스펙트럼 위치를 언급한다. 더 나은 설명을 위해, 오직 52 및 148 사이의 스펙트럼 위치들을 갖는 계수들만이 도 5에서 도시된다.
도 5에서, 좌표 (512)는 스펙트럼 계수들의 스펙트럼 값을 결정하는 것을 돕는다. MDCT 스펙트럼, 거기에서, 오디오 신호 입력 스펙트럼의 스펙트럼 계수들의 스펙트럼 값들을 묘사하는 도 5의 예에서, 가로 좌표(512)는 스펙트럼 계수들의 스펙트럼 값들을 언급한다. MDCT 오디오 신호 입력 스펙트럼의 스펙트럼 계수들이 스펙트럼 값들에 따라 양(positive) 뿐만 아니라 음의(negative) 실수들도 가질 수 있다는 것이 주목되어야 한다.
다른 오디오 신호 입력 스펙트럼들은, 그러나, 양 또는 0인 스펙트럼 값들을 갖는 스펙트럼 계수들만을 가질 수 있다. 예를 들어, 오디오 신호 입력 스펙트럼은, 이산 푸리에 변환으로부터 도출되는 계수들의 크기를 표현하는 스펙트럼 값들을 갖는 스펙트럼 계수들과 함께, DFT 크기 스펙트럼일 수 있다. 그러한 스펙트럼 값들은 오직 양(positive) 또는 0일 수 있다.
추가 실시예들에서, 오디오 신호 입력 스펙트럼은 복소수들인 스펙트럼 값들을 갖는 스펙트럼 계수들을 포함한다. 예를 들어, 크기 및 위상 정보를 표시하는 DFT 스펙트럼은 복소수들인 스펙트럼 값들을 갖는 스펙트럼 계수들을 포함할 수 있다.
도 5에서 예시적으로 보여지듯이, 스펙트럼 계수들은 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 오디오 신호 입력 스펙트럼 내에 그드르이 스펙트럼 위치에 따라 순차적으로 정렬된다. 스펙트럼 계수들 각각은 하나 이상의 선행자들 및 하나 이상의 후행자들 중 적어도 하나를 갖고, 여기서 상기 스펙트럼 계수의 각 선행자는 시퀀스 내에 상기 스펙트럼 계수를 선행하는 스펙트럼 계수들 중 하나이다. 상기 스펙트럼 계수의 각 선행자는 시퀀스 내에 상기 스펙트럼 계수를 선행하는 스펙트럼 계수들 중 하나이다. 예를 들어, 도 5에서, 스펙트럼 위치(81, 82 또는 83)(등등)을 갖는 스펙트럼 계수는 스펙트럼 위치(80)을 갖는 스펙트럼 계수에 대한 후행자이다. 스펙트럼 위치(79, 78 또는 77)(등등)을 갖는 스펙트럼 계수는 스펙트럼 위치(80)을 갖는 스펙트럼 계수에 대한 선행자이다. MDCT 스펙트럼의 예에 대해, 스펙트럼 계수의 스펙트럼 위치는 MDCT 변형의 채널이 될 수가 있고, 스펙트럼 계수는, 예를 들어, 0 및 1023 사이의 채널 숫자에 관련된다. 다시, 도시된 목적들을 위해, 도 5의 MDCT 스펙트럼(510)은 52 및 148 사이의 스펙트럼 위치들을 갖는 스펙트럼 계수들만을 도시한다.
도 4로 돌아가, 극값 결정기(410)은 이제 더 자세히 설명된다. 극값 결정기(410)은 하나 이상의 극값 계수들을 결정하도록 구성된다.
일반적으로, 극값 결정기(410)는 극값 계수들에 대한 오디오 신호 입력 스펙트럼에 관련되는 스펙트럼들 또는 오디오 신호 입력 스펙트럼들을 검사한다. 극값 계수들을 결정하는 목적은, 나중에, 하나 이상의 로컬 음색 영역들이 예를 들어, 각 음색 영역에 대한 단일 유사 계수에 의해, 유사 계수들에 의해 오디오 신호 스펙트럼에서 대체되는 것이다.
일반적으로, 오디오 신호의 파워 스펙트럼에서 첨두 영역들, 오디오 신호 입력 스펙트럼은 음색 영역들을 표시하는 것에 관련된다. 그래서 오디오 신호 입력 스펙트럼이 관련되는 오디오 신호의 파워 스펙트럼에서 첨두 영역들을 식별하는 것이 바람직할 수 있다. 극값 결정기(410)는, 예를 들어, 비교 계수들에 따라(그것들의 스펙트럼 값들이 극값 결정기에 의해 쌍방향으로(pairwise) 비교되기 때문에) 참조될 수 있는, 계수들을 포함하는, 파워 스펙트럼을 검사할 수 있고, 그래서 오디오 신호 입력 스펙트럼의 스펙트럼 계수들 각각은 그것과 관련된 비교 값을 갖는다.
도 5에서, 파워 스펙트럼(520)이 도시된다. 파워 스펙트럼(520) 및 MDCT 오디오 신호 입력 스펙트럼(510)은 동일한 오디오 신호에 관련된다. 파워 스펙트럼(520)은 비교 계수들에 따라 참조되는 계수들을 포함한다. 각 스펙트럼 계수는 비교 값 및 가로 좌표(521)에 관련된 스펙트럼 위치를 포함한다. 오디오 신호 입력 스펙트럼의 각 스펙트럼 계수는 그것과 관련된 비교 계수를 갖고, 그래서, 그것과 관련된 그것의 비교 계수의 비교 값을 더 갖는다. 예를 들어, 오디오 신호 입력 스펙트럼의 스펙트럼 값과 관련된 비교 값은 오디오 입력 스펙트럼의 고려되는 스펙트럼 계수에 따라 동일한 스펙트럼 위치를 갖는 비교 계수의 비교 값일 수있다. 오디오 신호 입력 스펙트럼(510)의 스펙트럼 계수들 중 세개(three) 및 파워 스펙트럼(520)의 비교 계수들(및 이와같이 이러한 비교 계수들의 비교 값들과의 관련) 중 세개(three) 사이의 관련은 개별 비교 계수들(또는 그들의 비교 값들) 및 오디오 신호 입력 스펙트럼(510)의 개별 스펙트럼 계수들의 관련을 표시하는 점섬(dashed line)(513, 514, 515)에 의해 표시된다.
극값 계수들 각각은 그것의 비교 값이 그것의 선행자들 중 하나의 비교 값보다 큰 그리고 그것의 비교 값이 그것의 후행자들 중 하나의 비교 값보다 스펙트럼 계수들 중 하나이도록, 극값 결정기(410)는 하나 이상의 극값 계수들을 결정하도록 구성될 수 있다.
예를 들어, 극값 결정기(410)은 파워 스펙트럼의 로컬 최대 값들을 결정할 수 있다. 다른 말로, 극값 계수들 각각이 그것의 비교 값이 그것의 즉각 선행자들의 비교 값보다 큰 그리고 그것의 비교 값이 그것의 즉각 후행자의 비교 값보다 큰 스펙트럼 계수들 중 하나이도록, 극값 결정기(410)는 하나 이상의 극값 계수들을 결정하도록 구성될 수 있다. 여기서, 스펙트럼 계수의 즉각 선행자는 파워 스펙트럼에서 상기 스펙트럼 계수를 즉각 선행하는 스펙트럼 계수들 중 하나이다. 상기 스펙트럼 계수 중 즉각 선행자는 파워 스펙트럼에서 상기 스펙트럼 계수를 즉각 후행하는 스펙트럼 계수들 중 하나이다.
그러나, 다른 실시예들은 극값 결정기(410)가 모든 로컬 최대값들을 결정하는 것을 필요로 하지 않는다. 예를 들어, 몇몇 실시예들에서, 극값 결정기는, 예를 들어, 특정 주파수 범위와만 관련하여, 파워 스펙트럼의 특정 부분들만을 검사할 수 있다.
다른 실시예들에서, 선행하는 로컬 최소값 및/또는 이후 로컬 최소값의 비교 값 및 고려되는 로컬 최대값의 비교 값 사이의 차이가 임계 값보다 큰 곳에서, 극값 결정기(410)는 극값 계수들에 따라 오직 그것들의 계수들만에 대해 구성된다.
극값 결정기(410)는 비교 스펙트럼 상에서 극값 또는 극값들을 결정할 수 있고, 여기서 비교 스펙트럼의 계수의 비교 값은 MDCT 스펙트럼의 MDCT 계수들 각각에 할당된다. 그러나, 비교 스펙트럼은 오디오 신호 입력 스펙트럼보다 더 높은 스펙트럼 해상도를 가질 수 있다. 예를 들어, 비교 스펙트럼은 MDCT 오디오 신호 입력 스펙트럼 보다 두배인 스펙트럼 해상도를 갖는 DFT 스펙트럼일 수 있다. 이에 의해, 오직 모든 DFT 스펙트럼의 모든 제2스펙트럼 값은 그 후 MDCT 스펙트럼의 스펙트럼 값에 할당된다. 그러나, 비교 스펙트럼의 다른 계수들은 비교 스펙트럼의 극값 또는 극값들이 결정될 때 고려될 수 있다. 이에 의해, 비교 스펙트럼의 계수는 오디오 신호 입력 스펙트럼의 스펙트럼 계수에 할당되지 않는, 그러나 즉각 선행자 및 즉각 후행자를 갖는, 오디오 신호 입력 스펙트럼의 스펙트럼 계수에 그리고 오디오 신호 입력 스펙트럼의 스펙트럼 계수의 즉각 후행자에, 각각, 할당되는, 극값에 따라 결정될 수 있다. 그래서, 비교 스펙트럼(예를 들어, 고-해상도 DFT 스펙트럼)의 상기 극값은 (MDCT) 오디오 신호 입력 스펙트럼의 스펙트럼 계수 및 (MDCT) 오디오 신호 입력 스펙트럼의 상기 스펙트럼 계수의 즉각 후행자들 사이에 위치되는 (MDCT) 오디오 신호 입력 스펙트럼 내에 스펙트럼 위치에 할당된다. 그러한 상황은 나중에 설명되는 것처럼 유사 계수의 적절한 표시 값을 선택하는 것에 의해 인코딩 될 수 있다. 이에 의해, 서브-빈(sub-bin) 해상도가 달성된다.
몇몇 실시예들에서, 극값 계수는 그것의 비교 값이 그것의 즉각 선행자의 비교값 및 그것의 즉각 후행자의 비교 값보다 크다는 요구를 충족시킬 필요가 없다. 대신에, 그러한 실시예들에서, 극값 계수의 비교 값이 그것의 선행자들 중 하나 및 그것의 후행자들 중 하나보다 큰 것으로 충분할 수 있다. 예를 들어, 다음 상황을 고려하라 :
스펙트럼 위치 212 213 214 215 216
비교 값 0.02 0.84 0.83 0.85 0.01
표 1에서 설명되는 상황에서, 극값 결정기(410)는 극값 계수에 따라 스펙트럼 위치(214)에서 스펙트럼 계수를 합리적으로 고려할 수 있다. 스펙트럼 계수(214)의 비교 값은 그것의 즉각 선행자(213)의 것보다 크지 않고 (0.83 < 0.84) 그리고 그것의 즉각 후행자(215)의 것보다 크지 않지만(0.83 < 0.85), 그것의 선행자들 중 또다른 하나, 선행자(212),의 비교 값보다는 (상당히) 크고(0.83 > 0.02), 그것의 후행자들 중 또다른 하나, 후행자(216)의 비교 값보다는 (상당히) 크다(0.83 > 0.01). 스펙트럼 계수가 계수들(212) 및 (216)의 비교 값과 비교하여 상대적으로 큰 비교 값들을 갖는 세개의 계수들(213, 214, 215)의 중간에 위치되기 때문에 이 "첨두 영역(peaky area)"에 따른 스펙트럼 계수(214)를 고려하는 것이 더 합리적으로 나타난다.
예를 들어, 극값 결정기(410)는 비교 계수들 중 몇몇 또는 모두에 대해 비교 계수의 비교 값이 상기 비교 계수의 스펙트럼 위치에 가장 가까운 세개의 선행자들의 비교 값들 중 적어도 하나보다 큰 지 여부를 결정하도록 구성될 수 있다. 그리고/또는, 극값 결정기(410)은 비교 계수들 중 몇몇 또는 모두에 대해, 상기 비교 계수의 비교 값이 상기 비교 계수의 스펙트럼 위치에 가장 가까운 세개의 후행자들 의 비교 값들 중 적어도 하나보다 큰 지 여부를 결정하도록 구성될 수 있다. 극값 계산기(410)은 상기 결정들의 결과에 의존하여 상기 비교 계수를 선택하는지여부를 결정할 수 있다.
몇몇 실시예들에서, 각 스펙트럼 계수의 비교 값은 오디오 신호의 에너지 보존 변형으로부터 도출되는 추가 스펙트럼(비교 스펙트럼)의 추가 계수의 제곱 값이다.
추가 실시예들에서, 각 스펙트럼 계수의 비교 값은 오디오 신호의 에너지 보존 변형으로부터 도출되는 추가 스펙트럼의 추가 계수의 진폭 값이다.
실시예에 따라, 추가 스펙트럼은 이산 푸리에 변형 스펙트럼이고 여기서 에너지 보존 변형은 이산 푸리에 변형이다.
추가 실시예에서, 추가 스펙트럼은 복합 변경 이산 코사인 변형(CMDCT) 스펙트럼이고, 여기서 에너지 보존 변형은 CMDCT이다. 또다른 실시예에서, 극값 결정기(410)는 비교스펙트럼을 검사하지 않고, 대신에 오디오 신호 입력 스펙트럼 그 자체를 검사할 수 있다. 이는, 예를 들어, 오디오 신호 입력 스펙트럼 그 자체가 에너지 보존 변형으로부터 도출될 때, 예를 들어, 오디오 신호 입력 스펙트럼이 이산 푸리에 변형 크기 스펙트럼일 때, 합리적일 수 있다.
예를 들어, 극값 결정기(410)는 하나 이상의 극값 계수들을 결정하도록 구성될 수 있고, 극값 계수들 각각은 그것의 스펙트럼 값이 그것의 선행자들 중 하나의 스펙트럼 값보다 크고 그것의 스펙트럼 값이 그것의 후행자들 중 하나의 스펙트럼 값보다 큰 스펙트럼 계수들 중 하나이다.
실시예에서, 극값 결정기(410)는 하나 이상의 극값 계수들을 결정하도록 구성될 수 있고, 극값 계수들 각각은 그것의 스펙트럼 값이 그것의 즉각 선행자들 중 하나의 스펙트럼 값보다 크고 그것의 스펙트럼 값이 그것의 즉각 후행자들 중 하나의 스펙트럼 값보다 큰 스펙트럼 계수들 중 하나이다.
게다가, 상기 장치는 미리 설정된 값에 극값 계수들 중 적어도 하나의 후행자 또는 선행자의 스펙트럼 값을 설정하는 것에 의해 변경된 오디오 신호 스펙트럼을 얻기 위해 오디오 신호 입력 스펙트럼을 변경하기 위한 스펙트럼 변경자(420)를 포함한다. 스펙트럼 변경자(420)은 미리 설정된 값에 하나 이상의 극값 계수들의 스펙트럼 값들을 설정하지 않도록 구성되고, 또는 유사 계수에 의해 하나 이상의 극값 계수들 중 적어도 하나를 대체하도록 구성되고, 여기서 유사 계수의 스펙트럼 값은 미리 설정된 값과 다르다.
바람직하게, 미리 설정된 값은 0일 수 있다. 예를 들어, 도 5의 변경된(대체된) 오디오 신호 스펙트럼(530)에서, 스펙트럼 계수들 중 많은 수의 스펙트럼 값들은 스펙트럼 변경자(420)에 의해 0으로 설정되었다.
다른 말로, 변경된 오디오 신호 스펙트럼을 얻기 위해, 스펙트럼 변경자(420)는 적어도 미리 설정된 값에 극값 계수들 주 하나의 선행자 또는 후행자의 스펙트럼 값을 설정할 것이다. 미리 설정된 값은 예를 들어, 0일 수 있다. 그러한 선행자 또는 후행자의 비교 값은 상기 극값의 비교 값보다 작다.
게다가, 극값 계수들 그 자체에 대하여, 스펙트럼 변경자(420)은 다음을 따를 것이다 :
- 스펙트럼 변경자(420)는 미리 설정된 값에 극값 계수들을 설정할 것이다, 또는 :
- 스펙트럼 변경자(420)는 유사 계수에 의해 극값 계수들 중 적어도 하나를 대체할 것이고, 여기서 유사 계수의 스펙트럼 값은 미리 설정된 값과 다르다. 이는 극값 계수들 중 적어도 하나의 스펙트럼 값이 미리 설정된 값에 설정되고, 스펙트럼 계수들 중 또다른 하나의 스펙트럼 값은 미리 설정된 값과 다른 값에 설정된다는 것을 의미한다. 그러한 값은, 예를 들어, 상기 극값 계수들의, 또는 상기 극값 계수의 선행자들 중 하나의, 또는 상기 극값 계수들의 후속자들 중 하나의, 스펙트럼 값으로부터 유도될 수 있다. 또는, 그러한 값은, 예를 들어, 상기 극값 계수의, 또는 상기 극값 계수의 선행자들 중 하나의, 또는 상기 극값 계수의 후속자들 중 하나의, 비교 값으로부터 유도될 수 있다.
스펙트럼 변경자(420)는, 예를 들어, 상기 극값 계수의 후속자들 중 하나의 비교 값 또는 스펙트럼 값으로부터 또는 상기 극값 계수의 선행자들 중 하나의 비교 값 또는 스펙트럼 값으로부터, 상기 극값 계수의 비교 값 또는 스펙트럼 값으로부터 유도되는 스펙트럼 값을 갖는 유사 계수에 의해 극값 계수들 중 하나를 대체하도록 구성될 수 있다.
게다가, 상기 장치는 인코딩된 오디오 신호 스펙트럼을 얻기 위해 변경된 오디오 신호 스펙트럼을 처리하기 위한 처리 유닛(430)을 포함한다.
예를 들어, 처리 유닛(430)은 오디오 인코더의 어떠한 종류일 수 있고, 예를 들어, MP3(MPEG-1 Audio Layer III or MPEG-2 Audio Layer III; MPEG = Moving Picture Experts Group) 오디오 인코더, WMA(Windows Media Audio)를 위한 오디오 인코더, WAVE-files를 위한 오디오 인코더 또는 MPEG-2/4 AAC(Advanced Audio Coding) 오디오 인코더 또는 MPEG-D USAC(Unified Speed and Audio Coding) 코더일 수 있다.
처리 유닛(430)은, 예를 들어, [8] (ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4)에서 설명된 또는 [9] (ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4)에서 설명된 오디오 인코더일 수 있다. 예를 들어, 처리 유닛(430)은 양자화기(quantizer), 및/또는 예를 들어, [8] 에서 설명된 시간적 노이즈 성형 툴, 및/또는 처리 유닛(430)은 예를 들어, [8]에서 설명된 지각적 노이즈 대체 툴을 포함할 수 있다.
게다가, 상기 장치는 부가 정보를 발생시키고 전송하기 위한 부가 정보 발생기(440)을 포함한다. 부가 정보 발생기(440)은 스펙트럼 변경자(420)에 의해 발생된 변경된 오디오 신호 입력 스펙트럼 내에 하나 이상의 유사 계수 후보들을 위치시키도록 구성된다. 게다가, 부가 정보 발생기(440)는 선택된 후보들에 따라 유사 계수 후보들 중 적어도 하나를 선택하도록 구성된다. 게다가, 부가 정보 발생기(440)는 부가 정보가 유사 계수들에 따라 선택된 후보들을 표시하도록 부가 정보를 발생시키도록 구성된다.
도 4에서 도시된 실시예에서, 부가 정보 발생기(440)은 스펙트럼 변경자(420)에 의해 유사 계수들의 위치들(예를 들어, 유사 계수들 각각의 위치)를 수신하도록 구성된다. 게다가, 도 4의 실시예에서, 부가 정보 발생기(440)은 유사 계수 후보들의 위치들을 수신하도록 구성된다(예를 들어, 유사 계수 후보들 각각의 위치).
예를 들어, 몇몇 실시예들에서, 처리 유닛(430)은 양자화된 오디오 신호 스펙트럼에 기반한 유사 계수 후보들을 결정하도록 구성될 수 있다. 실시예에서, 처리 유닛(430)은 변경된 오디오 신호 스펙트럼을 양자화하는 것에 의해 양자화된 오디오 신호 스펙트럼을 발생시켰을 수 있다.
예를 들어, 처리 유닛(430)은 유사 계수 후보에 따라 양자화된 오디오 신호 스펙트럼의 적어도 하나의 스펙트럼 계수를 결정할 수 있고, 이는 즉각 선행자를 가지며, 그것의 스펙트럼 값은 미리 설정된 값과 동등하며(예를 들어 0과 동등하며), 그것은 즉각 후행자를 가지며, 그것의 스펙트럼 값은 미리 설정된 값과 동등하다.
대안적으로, 몇몇 실시예들에서, 처리 유닛(430)은 부가 정보 발생기(440)에 양자화된 오디오 신호 스펙트럼을 통과시킬 수 있고 부가 정보 발생기(440)는 그 자체로 양자화된 오디오 신호 스펙트럼에 기반하여 유사 계수 후보들을 결정한다. 다른 실시예들에 따라서, 유사 계수 후보들은 변경된 오디오 신호 스펙트럼에 기반하여 대안적 방법으로 결정된다.
부가 정보 발생기에 의해 발생되는 부가 정보는 정적일 수 있고, 미리 설정된 크기 또는 그것의 크기는 신호-적응 방법으로 반복적으로 측정될 수 있다. 이 경우, 부가 정보의 실제 크기는 디코더에도 전송된다. 그래서, 실시예에 따라, 부가 정보 발생기(440)는 부가 정보의 크기를 전송하도록 구성된다.
실시예에 따라, 극값 결정기(410)는 비교 계수들, 예를 들어, 도 5의 파워 스펙트럼의 계수들,을 검사하도록 구성되고, 하나 이상의 최소 계수들을 결정하도록 구성되며, 최소 계수들 각각은 그것의 비교 값이 그것의 선행자들 중 하나의 비교 값보다 작은 그리고 그것의 비교 값이 그것의 후행자들 중 하나의 비교 값보다 작은 스펙트럼 계수들 중 하나이다. 그러한 실시예에서, 스펙트럼 변경자(420)는 최소 계수들 중 하나 이상의 그리고 극값 계수들 중 하나 이상의 비교 값들에 기반하여 표현 값을 결정하도록 구성될 수 있고, 그래서 표현 값은 미리 설정된 값과 다르다. 게다가, 스펙트럼 변경자(420)는 표현 값에 상기 스펙트럼 값을 설정하는 것에 의해 오디오 신호 입력 스펙트럼의 계수들 중 하나의 스펙트럼 값을 변경하도록 구성될 수 있다.
특정 실시예에서, 극값 결정기는 비교 계수들, 예를 들어, 도 5의 파워 스펙트럼(520)의 계수들, 을 검사하도록 구성되고, 하나 이상의 최소 계수들을 결정하도록 구성되고, 그래서 최소 계수들 각각은 그것의 비교 값이 그것의 즉각 선행자들의 비교 값보다 작은 그리고 그것의 비교 값이 그것의 즉각 후행자들의 비교 값보다 작은 스펙트럼 계수들 중 하나이다.
대안적으로, 극값 결정기(410)는 오디오 신호 입력 스펙트럼(510) 그 자체를 검사하도록 구성되고 하나 이상의 최소 계수들을 결정하도록 구성되고, 그래서 하나 이상의 최소 계수들 각각은 그것의 스펙트럼 값이 그것의 선행자들 중 하나의 스펙트럼 값보다 작은 그리고 그것의 스펙트럼 값이 그것의 후행자들 중 하나의 스펙트럼 값보다 작은 스펙트럼 계수들 중 하나이다.
그러한 실시예에서, 스펙트럼 변경자(420)는 극값 계수들 중 하나 이상의 그리고 최소 계수들 중 하나 이상의 스펙트럼 값들에 기반하여 표현 값을 결정하도록 구성될 수 있고, 표현 값은 미리 설정된 값과 다르다. 게다가, 스펙트럼 변경자(420)는 표현 값에 상기 스펙트럼 값을 설정하도록 오디오 신호 입력 스펙트럼의 계수들 중 하나의 스펙트럼 값을 변경하도록 구성될 수 있다.
특정 실시예에서, 극값 결정기(410)는 하나 이상의 최소 계수들을 결정하도록 구성되고 그 자체로 오디오 신호 입력 스펙트럼(510)을 검사하도록 구성되며, 하나 이상의 최소 계수들 각각은 그것의 스펙트럼 값이 그것의 즉각 선행자들의 스펙트럼 값보다 작은 그리고 그것의 스펙트럼 값이 그것의 즉각 후행자들의 스펙트럼 값보다 작은 스펙트럼 계수들 중 하나이다.
양 실시예들에서, 스펙트럼 변경자(420)는, 그들의 스펙트럼 값들 또는 그들의 관련된 비교 값들에서, 표현 값을 결정하기 위해 최소 계수들 중 하나 이상 및 극값 계수를 고려한다. 그래서, 오디오 신호 입력 스펙트럼의 스펙트럼 계수들 중 하나의 스펙트럼 값은 표현 값으로 설정된다. 그것의 스펙트럼 값이 표현 값으로 설정되는, 스펙트럼 계수는, 예를 들어, 극값 계수 그 자체일 수 있고, 또는 그것의 스펙트럼 값이 표현 값으로 설정되는, 스펙트럼 계수는, 극값 계수를 대체하는 유사 계수일 수 있다.
실시예에서, 극값 결정기(410)는 스펙트럼 값들의 시퀀스의 하나 이상의 서브-시퀀스들을 결정하도록 구성될 수 있고, 그래서 서브-시퀀스들 중 각 하나는 오디오 신호 입력 스펙트럼의 복수의 다음 스펙트럼 계수들을 포함한다. 다음 스펙트럼 계수들은 그들의 스펙트럼 위치에 따라 서브-시퀀스 내에 순차적으로 정렬된다. 서브-시퀀스들의 각각은 상기 순차적으로 정렬된 서브-시퀀스에서 첫번째인 첫번째 요소 그리고 상기 순차적으로-정렬된 서브-시퀀스에서 마지막인 마지막 요소를 갖는다.
특정 실시예에서, 서브-시퀀스들의 각각은, 예를 들어, 최소 계수들 중 정확히 두개 및 극값 계수들 중 정확히 하나를 포함하고, 최소 계수들 중 하나는 서브-시퀀스의 첫번째 요소이고, 최소 계수들의 다른 하나는 서브-시퀀스의 마지막 요소이다.
실시예에서, 스펙트럼 변경자(420)는 서브-시퀀스들 중 하나의 계수들의 비교 값 또는 스펙트럼 값들에 기반하여 표현 값을 결정하도록 구성될 수 있다. 예를 들어, 극값 결정기(410)는, 예를 들어, 파워 스펙트럼(520)인, 비교 스펙트럼의 비교 계수들을 검사하였고, 스펙트럼 변경자(420)는 서브-시퀀스들 중 하나의 계수들의 비교 값들에 기반하여 표현 값을 결정하도록 구성될 수 있다. 그러나, 만약 극값 결정기(410)이 오디오 신호 입력 스펙트럼(510)의 스펙트럼 계수들을 검사하였다면, 스펙트럼 변경자(420)는 서브-시퀀스들 중 하나의 계수들의 스펙트럼 값들에 기반하여 표현 값을 결정하도록 구성될 수 있다.
스펙트럼 변경자(420)는 표현 값에 상기 스펙트럼 값을 설정하도록 상기 서브-시퀀스의 계수들 중 하나의 스펙트러 값을 변경하도록 구성된다.
표 2는 스펙트럼 위치들 (252 에서 258)에서 다섯개의 스펙트럼 계수들을 갖는 예를 제공한다.
스펙트럼 위치 252 253 254 255 256 257 258
비교 값 0.12 0.05 0.48 0.73 0.45 0.03 0.18
극값 결정기(410)는, 비교 값(0.73)은 비교 그것의 (여기서는 : 즉각) 선행자 254의 비교 값 (0.48)보다 크고, 그것의 비교 값(0.73)은 그것의(여기서는 : 즉각) 후행자 256 의 비교 값(0.45)보다 크므로, 스펙트럼 계수 255 (스펙트럼 위치 255를 갖는 스펙트럼 계수)이 극값 계수라는 것을 결정할 수 있다.
게다가, 극값 결정기(410)는, 그것의 비교 값(0.05)가 그것의 (여기서는 : 즉각) 선행자 252의 비교 값(0.12)보다 작고, 그것의 비교 값(0.05)이 그것의 (여기서는 : 즉각) 후행자 254 의 비교 값(0.48)보다 작기 때문에, 스펙트럼 계수 253이 최소 계수라는 것을 결정할 수 있다.
게다가, 극값 결정기(410)는 그것의 비교 값(0.03)이 그것의(여기서는 : 즉각) 선행자 256의 비교 값(0.45)보다 작고, 그것의 비교 값(0.03)이 그것의 (여기서는 : 즉각) 후행자 258의 비교 값보다 작기 때문에, 스펙트럼 계수 257이 최소 계수라는 것을 결정할 수 있다.
극값 결정기(410)는 그래서 극값 계수 255에 가장 가까이 후행하는 최소 계수인 최소 계수에 따라 스펙트럼 계수 257을 결정하는 것에 의해, 극값 계수 255에 가장 가까이 선행하는 최소 계수인 최소 계수에 따라 스펙트럼 계수 253을 결정하는 것에 의해, 스펙트럼 계수 255이 극값 계수라는 것을 결정하는 것에 의해, 스펙트럼 계수들 253 내지 257을 포함하는 서브-시퀀스를 결정할 수 있다.
스펙트럼 변경자(420)는 모든 스펙트럼 계수들 253 내지 257 의 비교 값들에 기반하여 서브-시퀀스 253 - 257에 대한 표현 값을 이제 결정할 수 있다. 예를 들어, 스펙트럼 변경자(420)는 서브-시퀀스의 모든 스펙트럼 계수들의 비교 값들을 합산하도록 구성될 수 있다. (예를 들어, 표 2에 대해, 서브-시퀀스 253 내지 257에 대한 표현 값은 0.05 + 0.48 + 0.73 + 0.45 + 0.03 = 1.74 로 합산한다.) 또는, 예를 들어, 스펙트럼 변경자(420)는 서브-시퀀스의 모든 스펙트럼 계수들의 비교 값들의 제곱들을 합산하도록 구성될 수 있다.(예를 들어, 표2에 대해, 서브-시퀀스 253 내지 257에 대한 표현 값은 (0.05)2 + (0.48)2 + (0.73)2 + (0.45)2 + (0.03)2 = 0.9692 으로 합산할 수 있다.) 또는 예를 들어, 스펙트럼 변경자(420)는 서브-시퀀스 253-257의 모든 스펙트럼 계수들의 비교 값들의 제곱들의 합산을 제곱근(square root)하도록 구성될 수 있다.(예를 들어, 표 2에 대해 표현 값은 0.98448이다.)
몇몇 실시예들에 따라, 스펙트럼 변경자(420)는 미리 설정된 값에 극값 계수의 스펙트럼 값(표에서, 스펙트럼 계수 253의 스펙트럼 값)을 설정할 것이다.
다른 실시예들은, 그러나, 무게 중심 접근을 이용한다. 표 3은 스펙트럼 계수들 282 내지 288을 포함하는 서브-시퀀스를 도시한다 :
스펙트럼 위치 281 282 283 284 285 286 287 288 289
비교 값 0.12 0.04 0.10 0.20 0.93 0.92 0.90 0.05 0.15
비록 극값 계수가 스펙트럼 위치 285에 위치되지만, 무게 중심 접근에 따라, 무게 중심은 다른 스펙트럼 위치에 위치되게 된다.
무게 중심의 스펙트럼 위치를 결정하기 위해, 극값 결정기(410)는 서브-시퀀스의 모든 스펙트럼 계수들의 가중된 스펙트럼 위치들을 합산하고 상기 결과를 서브-시퀀스의 스펙트럼 계수들의 비교 값들의 합으로 나눈다. 상업적인 라운딩은 무게 중심을 결정하기 위한 분할의 결과 상에서 이용될 수 있다. 스펙트럼 계수의 가중된 스펙트럼 위치는 그것의 스펙트럼 위치 및 그것의 비교 값들의 곱이다.
요약하자면 : 극값 결정기는 다음에 의해 무게 중심을 얻을 수 있다 :
1) 서브-시퀀스의 각 스펙트럼 계수에 대한 스펙트럼 위치 및 비교 값의 곱을 결정
2) 첫번째 합(sum)을 얻기 위해 1)에서 결정된 곱을 합산
3) 두번째 합을 얻기 위해 서브-시퀀스의 모든 스펙트럼 계수들의 비교 값들을 합산
4) 중간 결과를 발생시키기 위해 두번째 합에 의해 첫번째 합을 나눔; 및
5) 무게 중심을 얻기 위해 중간 결과상에서 반올림(round-to-nearest rounding)을 적용(반올림 : 8.49는 8로 절사되고, 8.5는 9로 반올림됨)
표 3의 예에 대해, 무게 중심이 다음에 의해 얻어진다.
(0.04 ·282 + 0.10 ·283 + 0.20 ·284 + 0.93 ·285 + 0.92 ·286 + 0.90 ·287 + 0.05 ·288) /
/ (0.04 + 0.10 + 0.20 + 0.93 + 0.92 + 0.90 + 0.05) = 897.25 / 3.14 = 285.75 = 286.
그래서, 표 3의 예에서, 극값 결정기(410)는 무게 중심에 따라 스펙트럼 위치 286을 결정하도록 구성될 것이다.
몇몇 실시예들에서, 극값 결정기(410)는 완전한 비교 스펙트럼(예를 들어, 파워 스펙트럼(520))을 검사하지 않거나 완전한 오디오 신호 입력 스펙트럼을 검사하지 않는다. 대신에, 극값 결정기(410)는 비교 스펙트럼 또는 오디오 신호 입력 스펙트럼을 오직 부분적으로 검사할 수 있다.
도 6은 그러한 예를 도시한다. 거기에서, 파워 스펙트럼(620)은 (비교 스펙트럼처럼) 계수 55에서 시작하는 극값 결정기(410)에 의해 검사되었다. 55보다 작은 스펙트럼 위치들에서의 계수들은 검사되지 않았다. 그래서, 55보다 작은 스펙트럼 위치들에서 스펙트럼 계수들은 대체된 MDCT 스펙트럼(630)에서 변경되지 않은채 남아있는다. 대조적으로 도 5는 모든 MDCT 스펙트럼 라인들이 스펙트럼 변경자(420)에 의해 변경된 곳에서 대체된 MDCT 스펙트럼(530)을 도시한다.
그래서, 스펙트럼 변경자(420)는 오디오 신호 입력 스펙트럼의 스펙트럼 계수들 중 적어도 몇몇의 스펙트럼 값들이 변경되지 않고 남아있도록 오디오 신호 입력 스펙트럼을 변경하도록 구성될 수 있다.
몇몇 실시예들에서, 스펙트럼 변경자(420)는, 비교 값 중 하나 또는 극값 계수들 중 하나의 스펙트럼 값 사이의 차이가 임계 값보다 작은지 여부를 결정하도록 구성된다. 그러한 실시예들에서, 스펙트럼 변경자(420)는 오디오 신호 입력 스펙트럼을 변경하도록 구성되며 오디오 신호 입력 스펙트럼의 스펙트럼 계수들 중 적어도 몇몇의 스펙트럼 값들은 값 차이가 임계 값보다 작은지 여부에 의존하여 변경된 오디오 신호 스펙트럼에서 변경되지 않고 남겨진다.
예를 들어, 실시예에서, 스펙트럼 변경자(420)는 모두를 변경하거나 교체하지 않고, 극값 계수들의 오직 몇몇만을 변경하거나 또는 교체하도록 구성될 수 있다. 예를 들어, 극값 계수(예를 들어 로컬 최대값)의 비교 값 및 다음 및/또는 선행 최소 값의 비교 값 사이의 차이가 임계 값보다 작을 때, 스펙트럼 변경자는 이러한 스펙트럼 값들을 변경하지 않도록 (예를 들어 그들 사이의 스펙트럼 계수들의 스펙트럼 값들), 대신에 변경된 (대체된) MDCT 스펙트럼 630에서 변경되지 않은 이러한 스펙트럼 값들을 남겨두도록 결정될 수 있다. 도 6의 변경된 MDCT 스펙트럼 630에서, 스펙트럼 계수들 100 내지 112의 스펙트럼 값들 및 스펙트럼 계수들 124 내지 136의 스펙트럼 값들은 변경되지 않은 (대체된) 스펙트럼(630) 에서 스펙트럼 변경자에 의해 변경되지 않고 남게 된다.
처리 유닛은 양자화된 MDCT 스펙트럼 635를 얻기 위해 변경된 (대체된) MDCT 스펙트럼 630의 계수들을 양자화하도록 더 구성될 수 있다.
실시예에 따라, 스펙트럼 변경자(420)는 미세-조정 정보를 수신하도록 구성될 수 있다. 오디오 신호 입력 스펙트럼의 스펙트럼 계수들의 스펙트럼 값들은 표시된 값들일 수 있고, 각각은 표시 성분을 포함한다. 미세-조정 정보가 첫번째(제1의) 미세-조정 상태일 때, 스펙트럼 변경자는 제1표시 값에 유사 계수의 또는 하나 이상의 극값 계수들 중 하나의 표시 성분을 설정하도록 구성될 수 있다. 미세-조정 정보가 상이한 두번째(제2의) 미세-조정 상태일 때, 제2 표시 값과 다른 유사 계수의 또는 하나 이상의 극값 계수들 중 하나의 스펙트럼 값의 표시 성분을 설정하도록 구성될 수 있다.
예를 들어, 표 4에서,
스펙트럼 위치 291 301 321 329 342 362 388 397 405
스펙트럼 값 +0.88 -0.91 +0.79 -0.82 +0.93 -0.92 -0.90 +0.95 -0.92
미세-조정 상태 1st 2nd 1st 2nd 1st 2nd 2nd 1st 2nd
스펙트럼 계수들의 스펙트럼 값들은 스펙트럼 계수(291)가 제1 미세-조정 상태이고, 스펙트럼 계수(301)가 제2 미세-조정 상태이고, 스펙트럼 계수(321)는 제1미세-조정 상태라는 것, 등등을 표시한다.
예를 들어, 위에서 설명된 무게 중심 결정으로 돌아가보면, 만약 무게 중심이 두개의 스펙트럼 위치들 사이인 경우(예를 들어, 대략 중간), 스펙트럼 변경자는 제2미세-조정 상태가 표시되도록 표시를 설정할 수 있다.
실시예에 따라, 처리 유닛(430)은 양자화된 오디오 신호 스펙트럼을 얻기 위해 변경된 오디오 신호 스펙트럼을 양자화하도록 구성될 수 있다. 처리 유닛(430)은 인코딩된 오디오 신호 스펙트럼을 얻도록 양자화된 오디오 신호 스펙트럼을 처리하도록 더 구성될 수 있다.
게다가, 처리 유닛(430)은, 상기 계수가 극값 계수들 중 하나인지 여부, 그것의 스펙트럼 값이 미리 설정된 값에 동등한 즉각 후행자, 그것의 스펙트럼 값이 미리 설정된 값에 동등한 즉각 선행자를 갖는 양자화된 오디오 신호 스펙트럼의 그러한 스펙트럼 계수들만을 표시하는 부가 정보를 발생시키도록 더 구성될 수 있다.
그러한 정보는 처리 유닛(430)에 극값 결정기(410)에 의해 제공될 수 있다.
예를 들어, 그러한 정보는, 상기 계수가 극값 계수들 중 하나가 아닌지 여부(예를 들어, 비트 값 0에 의해) 또는 상기 계수가 극값 계수들 중 하나인지 여부(예를 들어 비트 값 1에 의해), 그것의 스펙트럼 값이 미리 설정된 값에 동등한 즉각 후행자, 및 그것의 스펙트럼 값이 미리 설정된 값에 동등한 즉각 선행자를 갖는 양자화된 오디오 신호 스펙트럼의 스펙트럼 계수들 각각을 표시하는, 비트 필드에서의 처리 유닛(430)에 의해 저장될 수 있다. 실시예에서, 디코더는 오디오 신호 입력 스펙트럼을 복원하기 위해 나중에 이 정보를 이용할 수 있다. 비트 필드는 신호 적응적으로 선택된 길이 또는 고정된 길이를 가질 수 있다. 나중의 경우에, 비트 필드의 길이는 디코더에 추가적으로 전달될 수 있다.
예를 들어, 처리 유닛(430)에 의해 발생되는 비트 필드 [000111111] 는, (순차적으로 정렬되고) (양자화된) 오디오 신호 스펙트럼에서 나타나는 최초 세개의 "독립(stand-alone)" 계수들(그들의 스펙트럼 값이 미리 설정된 값에 동등하지 않은, 그러나 그것들의 선행자의 그리고 그것들의 후행자의 스펙트럼 값들이 미리 설정된 값에 동등하다.) 은 극값 계수들이 아니지만, 다음 여섯개 "독립" 계수들은 극값 계수들이라는 것을 표시할 수 있다. 이 비트 필드는 도 6에서 양자화된 MDCT 스펙트럼 (635)에서 보여질 수 있는 상황을 설명하고, 여기서 최초 세개의 "독립" 계수들 5, 8, 25 는 극값 계수들이 아니지만, 다음 여섯개 "독립" 계수들 59, 71, 83, 94, 116, 141은 극값 계수들이다.
다시, 상기 스펙트럼 계수의 즉각 선행자는 양자화된 오디오 신호 스펙트럼 내에서 상기 스펙트럼 계수를 즉각 선행하는 또다른 스펙트럼 계수이며, 상기 스펙트럼 계수의 즉각 선행자는 양자화된 오디오 신호 스펙트럼 내에 상기 스펙트럼 계수를 즉각 후행하는 또다른 스펙트럼 계수이다.
다음에서, 실시예에 따라 인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키는 장치가 설명된다.
도 1은 실시예에 따라 인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키기 위한 장치를 도시한다.
상기 장치는 디코딩된 오디오 신호 스펙트럼을 얻기 위해 인코딩된 오디오 신호 스펙트럼을 처리하기 위한 처리 유닛(110)을 포함한다. 디코딩된 오디오 신호 스펙트럼은 복수의 스펙트럼 계수들을 포함하고, 여기서 스펙트럼 계수들 각각은 인코딩된 오디오 신호 스펙트럼 및 스펙트럼 값 내에 스펙트럼 위치를 가지며, 여기서 스펙트럼 계수들은 인코딩된 오디오 신호 스펙트럼 내에서 그것들의 스펙트럼 위치에 따라 순차적으로 정렬되며, 스펙트럼 계수들은 스펙트럼 계수들의 시퀀스를 형성한다.
게다가, 상기 장치는 부가 정보(side info)를 이용하여 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하기 위한 유사 계수 결정기(120)를 포함하고, 유사 계수들의 각각은 스펙트럼 위치와 스펙트럼 값을 갖는다.
게다가, 상기 장치는 변경된 오디오 신호 스펙트럼을 얻기 위해 미리 설정된 값에 대해 하나 이상의 유사 계수들을 설정하기 위한 스펙트럼 변경 유닛(130)을 포함한다.
게다가, 상기 장치는 시간-영역 변환 신호를 얻기 위해 시간-영역에 변경된 오디오 신호 스펙트럼을 변환하기 위한 스펙트럼-시간 변환 유닛(140)을 포함한다.
게다가, 상기 장치는 시간-영역 오실레이터 신호를 발생시키기 위한 제어가능 오실레이터(150)을 포함하고, 상기 제어가능 오실레이터는 하나 이상의 유사 계수들 중 적어도 하나의 스펙트럼 값 및 스펙트럼 위치에 의해 제어된다.
게다가, 상기 장치는 오디오 출력 신호를 얻기 위해 시간-영역 오실레이터 신호 및 시간-영역 변환 신호를 믹싱하기 위한 믹서(160)를 포함한다.
실시예에서, 믹서는 시간-영역에서 시간-영역 오실레이터 신호에 시간-영역 변환 신호를 더하는 것에 의해 시간-영역 변환 신호 및 시간-영역 오실레이터 신호를 믹스하도록 구성될 수 있다.
처리 유닛(110)은, 예를 들어, 오디오 디코더의 어떠한 종류가 될 수 있고, 예를 들어, MP3 오디오 디코더, WMA 에 대한 오디오 디코더, WAVE-files에 대한 오디오 디코더, AAC 오디오 디코더 또는 USAC 오디오 디코더이다. 처리 유닛(110)은, 예를 들어, [8](ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4)에서 설명된 또는 [9](ISO/IEC 14496-3:2005 - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4)에서 설명된 오디오 디코더이다. 예를 들어, 처리 유닛(430)은 양자화된 값들의 리스케일링("역-양자화"), 및/또는 예를 들어 [8]에서 설명된 시간적 노이즈 서ㅎ영 툴을 포함할 수 있고, 처리 유닛(430)은 예를 들어 [8]에서 설명된 지각적 노이즈 대체 툴을 포함할 수 있다.
또다른 실시예에 따라, 스펙트럼 계수들 각각은 즉각 선행자 및 즉각 후행자의 적어도 하나를 가지며, 여기서 상기 스펙트럼 계수의 즉각 선행자는 시퀀스 내에서 스펙트럼 계수를 즉각 선행하는 스펙트럼 계수들 중 하나일 수 있고, 여기서 상기 스펙트럼 계수의 즉각 후행자들은 시퀀스 내에 상기 스펙트럼 계수를 즉각 후행하는 스펙트럼 계수들 중 하나일 수 있다.
유사 계수 결정기(120)는 시퀀스의 적어도 한 스펙트럼 계수를 결정하는 것에 의해 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하도록 구성될 수 있고, 이는 미리 설정된 값과 다른 스펙트럼 값을 가지며, 그것의 스펙트럼 값이 미리 설정된 값과 동등한 즉각 선행자를 가지며, 그것의 스펙트럼 값이 미리 설정된 값과 동등한 즉각 후행자를 갖는다. 실시예에서, 미리 설정된 값은 0일 수 있고 미리 설정된 값은 0일 수 있다.
다른 말로 : 유사 계수 결정기(120)는, 디코딩된 오디오 신호 스펙트럼의 계수들 전부 또는 몇몇에 대해, 개별적으로 고려되는 계수가 미리 설정된 값과 다른지 여부(바람직하게는 : 0과 다른지), 선행 계수의 스펙트럼 값이 미리 설정된 값과 동등한지 여부(바람직하게는 : 0과 같은지), 후행 계수의 스펙트럼 값이 미리 설정된 값과 동등한지 여부(바람직하게는 : 0과 같은지)를 결정한다.
몇몇 실시예들에서, 그런 결정된 계수는 (언제나) 유사 계수이다.
다른 실시예들에서, 그러나, 그러한 결정된 계수는 (오직) 유사 계수 후보이고 유사 계수일 수도 아닐수도 있다. 그러한 실시예들에서, 유사 계수 결정기(120)는 그것의 스펙트럼 값이 미리 설정된 값과 동등한 즉각 선행자를 갖는 그리고 그것의 스펙트럼 값이 미리 설정된 값과 동등한 즉각 후행자를 가질 수 있는, 미리 설정된 값과 다른 스펙트럼 값을 갖는, 적어도 하나의 유사 계수 후보를 결정하도록 구성된다.
유사 계수 결정기(120)는 상기 유사 계수 후보가 유사 계수라는 것을 부가 정보가 표시하는지 여부를 결정하는 것에 의해 유사 계수 후보가 유사 계수인지를 결정하도록 구성된다.
예를 들어, 그러한 부가 정보는 비트 필드에서 유사 계수들 결정기(120)에 의해 수신될 수 있고, 이는 그것의 스펙트럼 값이 미리 설정된 값과 동등한 즉각 후행자 및 그것의 스펙트럼 값이 미리 설정된 값과 동등한 즉각 선행자를 갖는 양자화된 오디오 신호 스펙트럼의 스펙트럼 계수들 각각에 대해, 상기 계수가 극값 계수들 중 하나가 아닌지 여부(예를 들어, 비트 값 0에 의해), 또는 상기 계수가 극값 계수들 중 하나인지 여부(예를 들어, 비트 값 1에 의해)를 표시한다.
예를 들어, 비트 필드 [000111111] 는, (순차적으로 정렬되고) (양자화된) 오디오 신호 스펙트럼에 나타나는 최초 세개 "독립" 계수들은 (그들의 스펙트럼 값은 미리 설정된 값과 동등하지는 않지만, 그들의 선행자의 및 그들의 후행자들의 스펙트럼 값들은 미리 설정된 값과 동등하다) 극값 계수들은 아니지만, 그 다음 "독립" 계수들은 극값 계수들이다. 이 비트 필드는 도 6에서 양자화된 MDCT 스펙트럼 (635)에서 보여질 수 있는 상황을 설명하고, 여기서 최초 세개의 "독립" 계수들 5, 8, 25 는 극값 계수들이 아니지만, 그 다음 "독립" 계수들 59, 71, 83, 94, 116, 141은 극값 계수들이다.
스펙트럼 변경 유닛(130)은 디코딩된 오디오 신호 스펙트럼으로부터 유사 계수들을 "삭제(delete)"하도록 구성될 수 있다. 사실, 스펙트럼 변경 유닛은 미리 설정된 값으로(바람직하게는 0으로) 디코딩된 오디오 신호 스펙트럼의 유사 계수들의 스펙트럼 값을 설정한다. (적어도 하나의) 유사 계수들이 (적어도 하나의) 제어가능 오실레이터(150)을 제어할 필요가 있기 때문에, 이는 합리적이다. 그래서, 예를 들어, 도 6에서 양자화된 MDCT 스펙트럼(635)를 고려해보자. 만약 스펙트럼(635)이 디코딩된 오디오 신호 스펙트럼으로 고려되는 경우, 스펙트럼 변경 유닛(130)은 변경된 오디오 신호 스펙트럼을 얻기 위해 극값 계수들 59, 71, 83, 94, 116 및 141의 스펙트럼 값들을 설정할 것이고 변경되지 않은 스펙트럼의 다른 계수들을 남겨둘 것이다.
스펙트럼-시간 변환 유닛(140)은 스펙트럼 영역에서 시간-영역으로 변경된 오디오 신호 스펙트럼을 변환한다. 예를 들어, 변경된 오디오 신호 스펙트럼은 MDCT 스펙트럼일 수 있고, 스펙트럼-시간 변환 유닛(140)은 역 변경된 개별 코사인 변형(Inverse Modified Discrete Cosine Transform (IMDCT)) 필터 뱅크일 수 있다. 다른 실시예들에서, 상기 스펙트럼은 MDST 스펙트럼일 수 있고 스펙트럼-시간 변환 유닛(140)은 역 변경된 개별 사인 변형(IMDST) 필터 뱅크일 수 있다. 또는, 추가 실시예들에서, 상기 스펙트럼은 DFT 스펙트럼일 수 있고 스펙트럼-시간 변환 유닛(140)은 역 개별 푸리에 변형(IDFT) 필터 뱅크일 수 있다.
제어가능 오실레이터(150)는 오실레이터 신호의 오실레이터 신호 주파수가 하나 이상의 유사 계수들 중 하나의 스펙트럼 위치에 의존할 수 있도록 오실레이터 신호 주파수를 갖는 시간-영역 오실레이터 신호를 발생시키도록 구성될 수 있다. 오실레이터에 의해 발생되는 오실레이터 신호는 시간-영역 사인 신호가 될 수 있다. 제어가능 오실레이터(150)는 하나 이상의 유사 계수들 중 하나의 스펙트럼 값에 의존하는 시간-영역 사인 신호의 진폭을 제어하도록 구성될 수 있다.
실시예에 따라, 유사 계수들은 표시된 값들이고, 각각은 표시 성분을 포함한다. 제어가능 오실레이터(150)는 오실레이터 신호의 오실레이터 신호 주파수가 하나 이상의 유사 계수들 중 하나의 표시 성분상에 더 의존할 수 있도록 그리고 표시 성분이 제1표시 값을 가질 때, 오실레이터 신호 주파수가 제1주파수 값을 가질 수 있도록, 그리고 표시 성분이 상이한 제2값을 가질 때, 오실레이터 신호 주파수가 상이한 제2주파수 값을 가질 수 있도록, 시간-영역 오실레이터 신호를 발생시키도록 구성될 수 있다.
예를 들어, 도 6의 MDCT 스펙트럼(635)에서 스펙트럼 위치(59)에서의 유사 계수를 고려해보자. 주파수 8200 Hz가 스펙트럼 위치 (59)에 할당되는 경우 및 만약 주파수 8400 Hz가 스펙트럼 위치(60)에 할당되는 경우라면, 제어가능 오실레이터는, 만약 유사 계수의 스펙트럼 값의 표시가 양(positive)인 경우, 예를 들어, 오실레이터 주파수를 8200 Hz로 설정하도록 구성될 수 있고, 만약 유사 계수의 스펙트럼 값의 표시가 음(negative)인 경우, 예를 들어, 오실레이터 주파수를 8300Hz로 구성할 수 있다.
그래서, 유사 계수의 스펙트럼 값의 표시는, 제어가능 오실레이터가 유사 계수의 스펙트럼 위치를 즉각 따르는 스펙트럼 위치(예를 들어, 스펙트럼 위치 60)에 할당되는 주파수(예를 들어, 8400 Hz) 및 유사 계수의 스펙트럼 위치(예를 들어, 스펙트럼 위치 59)에 할당되는 주파수(예를 들어, 8200 Hz) 사이의 주파수 (예를 들어, 8300 Hz)에 또는 유사 계수의 스펙트럼 위치(예를 들어, 스펙트럼 위치 59)에 할당되는 주파수(예를 들어, 8200 Hz)에 오실레이터 주파수를 할당하는지 여부를 제어하기 위해 이용될 수 있다.
실시예에서, 제어가능 오실레이터(150)는 선행 프레임의 유사 계수로부터 유도된 하나 이상의 외삽 파라미터들에 의해 추가적으로 제어된다. 예를 들어, 제어가능 오실레이터(150)는 전송 동안 데이터 프레임 손실을 감추기 위해, 또는 오실레이터 제어의 불안정한 거동을 매끄럽게 하기 위해, 선행 프레임의 유사 계수로부터 유도된 외삽된 매개변수들을 통해 추가적으로 제어될 수도 있다. 외삽 매개변수들은, 예를 들어, 스펙트럼 위치 또는 스펙트럼 값이 될 수 있다. 예를 들어, 시간-주파수 영역의 스펙트럼 계수들이 고려될 때, 시간-인스턴트 t-1에 관련된 스펙트럼 계수들은 제1프레임에 의해 포함될 수 있고, 시간-인스턴트 t에 관련된 스펙트럼 계수들은 제2프레임에 할당될 수 있다. 예를 들어, 시간-인스턴트 t-1에 관련된 유사 계수의 스펙트럼 값 및/또는 스펙트럼 위치는 시간-인스턴트 t에 관련된 현재 프레임에 대한 외삽 매개변수를 얻기 위해 복사될 수 있다.
도 2는 실시예를 도시하며, 여기서 상기 장치는 하나 이상의 유사 계수들의 추가 유사 계수들의 스펙트럼 값들 및 스펙트럼 위치들에 의해 제어되는 시간-영역 오실레이터 신호들을 발생시키기 위해 추가 제어가능 오실레이터들(252, 254, 256)를 포함한다.
추가 제어가능 오실레이터들(252, 254, 256) 각각은 추가 시간-영역 오실레이터 신호들 중 하나를 발생시킨다. 제어가능 오실레이터들(252, 254, 256) 각각은 유사 계수들 중 하나의 스펙트럼 위치에 기반하여 오실레이터 신호 주파수를 조정하도록 구성된다. 및/또는 제어가능 오실레이터들(252, 254, 256) 각각은 유사 계수들 중 하나의 스펙트럼 값에 기반하여 오실레이터 신호의 진폭을 조정하도록 구성된다.
도 1 및 도 2의 믹서(160)는 오디오 출력 신호를 얻기 위해 하나 이상의 제어가능 오실레이터들(150, 252, 254, 256)에 의해 발생되는 하나 이상의 시간-영역 오실레이터 신호 및 스펙트럼-시간 변환 유닛(140)에 의해 발생되는 시간-영역 변환 신호를 믹스(mix)하도록 구성된다. 믹서(160)는 하나 이상의 시간-영역 오실레이터 신호들 및 시간-영역 변환 신호의 중첩에 의해 오디오 출력 신호를 발생시킬 수 있다.
도 3은 원래 사인곡선들(왼쪽) 및 MDCT/IMDCT 체인(chain)에 의해 처리된 후의 사인곡선들(오른쪽)을 비교하는 두개의 다이어그램을 도시한다. MDCT / IMDCT 체인에 의해 처리된 후에, 사인곡선은 워블링 아티팩트들을 포함한다. 위에서 제공된 상기 개념들은 사인곡선들이 MDCT/IMDCT 체인에 의해 처리되는 것을 피하지만, 대신에, 사인곡선 정보는 유사 계수에 의해 인코딩되고 및/또는 사인곡선은 제어가능 오실레이터에 의해 재생된다.
비록 몇몇 관점들이 장치의 컨텍스트에서 설명되었지만, 이러한 관점들은 또한 대응하는 방법의 설명도 표현한다는 것이 명백하며, 여기서 블록 및 장치는 방법 단계의 특징 또는 방법 단계에 대응한다. 유사하게, 방법 단계의 컨텍스트에서 설명된 관점들은 대응하는 블록 또는 아이템 또는 대응하는 장치의 특징의 설명도 표현한다.
발명의 분해된 신호는 디지털 저장 매체에 저장될 수 있고 또는 인터넷과 같은 유선 전송 매체 또는 무선 전송 매체처럼 전송 매체상에서 전송될 수 있다.
특정한 실행의 요구들에 의존하여, 이 발명의 실시예들은 하드웨어 또는 소프트웨어에서 실행될 수 있다. 실행들은 전자적으로 읽을 수 있는 컨트롤 신호들을 그곳에 저장하고 있는 디지털 저장매체, 예를 들어 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 플래쉬 메모리,를 이용하여 수행될 수 있고 그것은, 각 방법이 수행되는, 프로그래밍 가능한 컴퓨터 시스템과 연동한다.(또는 연동 가능하다)
본 발명에 따른 몇몇 실시예들은 전자적 판독 가능한 컨트롤 신호들을 갖는 데이터 캐리어를 포함하며, 그것은 여기서 설명된 방법 중 하나가 수행되는 프로그래밍 가능한 컴퓨터 시스템과 연동 가능하다.
일반적으로 본 발명의 실시예들은 프로그램 코드로 컴퓨터 프로그램 결과물에서 실행될 수 있으며, 상기 프로그램 코드는 컴퓨터 프로그램 결과물이 컴퓨터에서 수행될 때 상기 방법 중 하나를 수행하도록 작동되는 것이다. 프로그램 코드는 예시적으로 기계 판독가능 캐리어에 저장될 수도 있다.
다른 실시예들은 여기에 설명되고, 기계 판독가능 캐리어에 저장된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.
다른 말로, 발명의 방법의 실시예는, 컴퓨터 프로그램이 컴퓨터에서 운영될 때 여기서 설명된 방법 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
발명의 방법의 또다른 실시예는, 여기서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 그 자체에 포함하는 데이터 캐리어이다.(또는 디지털 저장 매체, 또는 컴퓨터 판독가능 매체)
발명의 방법의 또다른 실시예는, 여기서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 신호들의 순서 또는 데이타 스트림이다. 데이타 스트림 또는 신호들의 순서는, 예를 들어 인터넷같은 데이타 통신 연결을 통해 전송되기 위해 예시적으로 구성될 수 있다.
또다른 실시예는 여기서 설명된 방법 중 하나를 수행하기 위해 구성되거나 적응되기 위하여 프로세싱 수단, 예를 들어 컴퓨터 또는 프로그래밍 가능한 논리 장치를 포함한다.
또다른 실시예는 여기서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램이 그 자체에 설치된 컴퓨터를 포함한다.
몇몇 실시예에서, 프로그래밍 가능한 논리 장치(예를 들어 필드 프로그래밍 가능한 게이트 어레이)는 여기서 설명된 방법 중 모든 기능 또는 몇몇을 수행하도록 사용될 수 있다. 몇몇 실시예에서, 필드 프로그래밍 가능한 게이트 어레이는 여기서 설명된 방법 중 하나를 수행하기 위해 마이크로 프로세서와 연동될 수 있다. 일반적으로, 상기 방법들은 바람직하게는 어떠한 하드웨어 장치에 의해서도 수행된다.
상기 설명된 실시예들은 단지 본 발명의 원리를 위해 예시적일 뿐이다. 본 상기 배열의 변형, 변화, 그리고 여기서 설명된 자세한 내용들을 기술분야의 다른 숙련자에게 명백하다고 이해되어야 한다. 그것의 의도는, 따라서, 여기의 실시예의 설명 또는 묘사의 방법에 의해 표현된 특정 세부사항들에 의해 제한되는 것이 아닌 오직 목전의 특허 청구항의 범위에 의해서만 제한된다는 것이다.
레퍼런스들( References )
[1] Daudet, L.; Sandler, M.; , "MDCT analysis of sinusoids: exact results and applications to coding artifacts reduction," Speech and Audio Processing, IEEE Transactions on, vol.12, no.3, pp. 302-312, May 2004
[2] Purnhagen, H.; Meine, N.;, "HILN-the MPEG-4 parametric audio coding tools," Circuits and Systems , 2000. Proceedings . ISCAS 2000 Geneva . The 2000 IEEE International Symposium an , vol.3, no., pp.201-204 vol.3, 2000
[3] Oomen, Werner; Schuijers, Erik; den Brinker, Bert; Breebaart, Jeroen:," Advances in Parametrie Coding for High-Quality Audio," Audio Engineering Society Convention 114, preprint, Amsterdam/NL, March 2003
[4] van Schijndel, N.H. ; van de Par, S.; , "Rate-distortion optimized hybrid sound coding," Applications of Signal Processing to Audio and Acoustics, 2005. IEEE Workshop on, vol., no., pp. 235-238, 16-19 Oct. 2005
[5] Bessette, 8.; Lefebvre, R.; Salami, R. ; , "Universal speech/audio coding using hybrid ACELP/TCX techniques," Acoustics, Speech, and Signal Processing, 2005. Proceedings. (ICASSP '05). IEEE International Conference on, vol.3, no., pp. iii/301- iii/304 Val. 3, 18-23 March 2005
[6] Ferreira, A.J.S. "Combined spectral envelope normalization and subtraction of sinusoidal components in the ODFT and MDCT frequency domains," Applications of Signal Processing to Audio and Acoustics, 2001 IEEE Workshop on the, vol., no., pp.51-54, 2001
[7] http://people.xiph.org/~xiphmont/demo/ghost/demo.html
The corresponding archive.org-website is stored at:
http://web.archive.org/web/20110121141149/http://people.xiph.org/~xiphmont /demo/ghost/demo.html
[8] ISO/IEC 14496-3:2005(E) - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4
[9] ISO/IEC 14496-3:2009(E) - Information technology - Coding of audio-visual objects - Part 3: Audio, Subpart 4

Claims (31)

  1. 스펙트럼 계수들의 각각은 스펙트럼 값 및 인코딩된 오디오 신호 스펙트럼 내에 스펙트럼 위치를 가지며, 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 상기 스펙트럼 계수들이 인코딩된 오디오 신호 스펙트럼 내에서 그것들의 스펙트럼 위치에 따라 순차적으로 정렬되고, 복수의 스펙트럼 계수들을 포함하는 디코딩된 오디오 신호 스펙트럼을 얻기 위해 인코딩된 오디오 신호 스펙트럼을 처리하기 위한 처리 유닛(110);
    유사 계수들의 각각은 스펙트럼 값 및 스펙트럼 위치를 가지며, 상기 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하기 위한 유사 계수 결정기(120);
    변경된 오디오 신호 스펙트럼을 얻기 위해 미리 설정된 값에 하나 이상의 유사 계수들을 설정하기 위한 스펙트럼 변경 유닛(130);
    시간-영역 변환 신호를 얻기 위해 변경된 오디오 신호 스펙트럼을 시간-영역으로 변환하기 위한 스펙트럼-시간 변환 유닛(140);
    하나 이상의 유사 계수들 중 적어도 하나의 스펙트럼 값 및 스펙트럼 위치에 의해 제어되며, 시간-영역 오실레이터 신호를 발생시키기 위한 제어가능 오실레이터(150);
    상기 오디오 출력 신호를 얻기 위해 시간-영역 오실레이터 신호 및 상기 시간-영역 변환 신호를 믹싱하기 위한 믹서(160);를 포함하는,
    인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키기 위한 장치.
  2. 제1항에 따른 장치에 있어서,
    상기 스펙트럼 계수들 각각은 즉각 선행자 및 즉각 후행자 중 적어도 하나를 가지며, 상기 스펙트럼 계수의 즉각 선행자는 스펙트럼 계수들의 시퀀스 내에서 상기 스펙트럼 계수를 즉각 선행하는 상기 스펙트럼 계수들 중 하나이고, 상기 스펙트럼 계수의 즉각 후행자는 상기 시퀀스 내에서 상기 스펙트럼 계수를 즉각 후행하는 상기 스펙트럼 계수들 중 하나이며,
    상기 유사 계수 결정기(120)는, 그것의 스펙트럼 값이 상기 미리 설정된 값에 동등한 즉각 선행자를 갖는, 그것의 스펙트럼 값이 상기 미리 설정된 값에 동등한 즉각 후행자를 갖는, 상기 미리 설정된 값과 상이한 스펙트럼 값을 갖는 시퀀스의 적어도 한 스펙트럼 계수를 결정하는 것에 의해 상기 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하도록 구성되는 것을 특징으로 하는 장치.
  3. 제2항에 따른 장치에 있어서,
    상기 미리 설정된 값은 0인 것을 특징으로 하는 장치.
  4. 제2항 또는 제3항에 따른 장치에 있어서,
    상기 유사 계수 결정기(120)는, 그것의 스펙트럼 값이 상기 미리 설정된 값에 동등한 즉각 선행자를 갖는, 그것의 스펙트럼 값이 상기 미리 설정된 값에 동등한 즉각 후행자를 갖는, 유사 계수 후보에 따른 시퀀스의 적어도 한 스펙트럼 계수를 결정하는 것에 의해 상기 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하도록 구성되며,
    상기 유사 계수 결정기(120)는 부가 정보가 상기 유사 계수 후보가 유사 계수인 것을 표시하는지 여부를 결정하는 것에 의해 상기 유사 계수 후보가 유사 계수인지 여부를 결정하도록 구성되는 것을 특징으로 하는 장치.
  5. 선행 청구항들 중 어느 한 항에 따른 장치에 있어서,
    상기 제어가능 오실레이터(150)는 상기 오실레이터 신호의 오실레이터 신호 주파수가 하나 이상의 유사 계수들 중 하나의 스펙트럼 위치에 의존하도록 오실레이터 신호를 갖는 시간-영역 오실레이터 신호를 발생시키도록 구성되는 것을 특징으로 하는 장치.
  6. 제5항에 따른 장치에 있어서,
    상기 유사 계수들은, 각각이 표시 성분을 포함하는, 표시된 값들이며,
    상기 제어가능 오실레이터(150)는, 상기 표시 성분이 제1표시 값을 가질 때, 상기 오실레이터 신호 주파수가 제1주파수 값을 갖도록, 상기 표시 성분이 상이한 제2값을 가질 때, 상기 오실레이터 신호 주파수가 상이한 제2주파수 값을 갖도록, 상기 오실레이터 신호의 오실레이터 신호 주파수가 추가로 하나 이상의 유사 계수들 중 하나의 표시 성분상에 의존하도록, 상기 시간-영역 오실레이터 신호를 발생시키도록 구성되는 것을 특징으로 하는 장치.
  7. 선행 청구항들 중 어느 한 항에 따른 장치에 있어서,
    상기 제어가능 오실레이터(150)는 시간-영역 오실레이터 신호를 발생시키도록 구성되고, 상기 오실레이터 신호의 진폭은 하나 이상의 유사 계수들 중 하나의 스펙트럼 값에 의존하며, 상기 스펙트럼 값이 제3값을 가질 때 상기 오실레이터 신호의 진폭은 제1진폭 값을 가지며, 상기 스펙트럼 값이 상이한 제4값을 가질 때 상기 오실레이터 신호의 진폭은 상이한 제2진폭 값을 가지며, 상기 제4값이 상기 제3값보다 클 때, 상기 제2진폭 값은 상기 제1진폭 값보다 큰 것을 특징으로 하는 장치.
  8. 선행 청구항들 중 어느 한 항에 따른 장치에 있어서,
    상기 제어가능 오실레이터(150)는 선행 프레임의 유사 계수로부터 유도된 하나 이상의 외삽 매개변수들에 의해 추가적으로 제어되는 것을 특징으로 하는 장치.
  9. 선행 청구항들 중 어느 한 항에 따른 장치에 있어서,
    상기 변경된 오디오 신호 스펙트럼은, MDCT 계수들을 포함하는, MDCT 스펙트럼이고,
    상기 스펙트럼-시간 변환 유닛(140)은 디코딩된 오디오 신호 스펙트럼의 계수들 중 적어도 몇몇을 시간 영역으로 변환하는 것에 의해 MDCT 영역으로부터 시간 영역으로 MDCT 스펙트럼을 변환하도록 구성되는 것을 특징으로 하는 장치.
  10. 선행 청구항들 중 어느 한 항에 따른 장치에 있어서,
    상기 믹서(160)는 상기 시간-영역에서 상기 시간-영역 변환 신호를 상기 시간-영역 오실레이터 신호에 더하는 것에 의해 상기 시간-영역 변환 신호 및 상기 시간-영역 오실레이터 신호를 믹스하도록 구성되는 것을 특징으로 하는 장치.
  11. 선행 청구항들 중 한 항에 따른 장치에 있어서,
    상기 제어가능 오실레이터(150)에 의해 발생되는 상기 시간-영역 오실레이터 신호는 제1 시간-영역 오실레이터 신호이며, 상기 장치는 하나 이상의 추가 시간-영역 오실레이터 신호들을 발생시키기 위해 하나 이상의 추가 제어가능 오실레이터들(252, 254, 256)을 더 포함하며, 상기 하나 이상의 추가 제어가능 오실레이터들(252, 254, 256)의 각각은 하나 이상의 추가 시간-영역 오실레이터 신호들 중 하나를 발생시키도록 구성되며, 상기 추가 제어가능 오실레이터들(252, 254, 256)의 각각은 하나 이상의 유사 계수들 중 적어도 하나의 스펙트럼 값 및 스펙트럼 위치에 의해 제어되며,
    상기 믹서(160)는 상기 오디오 출력 신호를 얻기 위해 제1 시간-영역 오실레이터 신호, 상기 하나 이상의 추가 시간-영역 오실레이터 신호들, 및 상기 시간-영역 변환 신호를 믹스하도록 구성되는 것을 특징으로 하는 장치.
  12. 오디오 신호의 오디오 신호 입력 스펙트럼을 인코딩하기 위한 장치에 있어서,
    상기 오디오 신호 입력 스펙트럼은 복수의 스펙트럼 계수들을 포함하며, 상기 스펙트럼 계수들의 각각은 오디오 신호 입력 스펙트럼 내의 스펙트럼 위치, 스펙트럼 값을 가지며, 상기 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 상기 스펙트럼 계수들은 상기 오디오 신호 입력 스펙트럼 내에 그들의 스펙트럼 위치에 따라 순차적으로 정렬되며, 상기 스펙트럼 계수들의 각각은 하나 이상의 선행자들 및 하나 이상의 선행자들 중 적어도 하나를 가지며, 상기 스펙트럼 계수의 선행자들의 각각은 상기 시퀀스 내에서 상기 스펙트럼 계수를 선행하는 스펙트럼 계수들 중 하나이며, 상기 스펙트럼 계수의 후행자들의 각각은 상기 시퀀스 내에서 상기 스펙트럼 계수를 후행하는 스펙트럼 계수들 중 하나이며, 상기 장치는 :
    하나 이상의 극값 계수들을 결정하기 위한 극값 결정기(410),
    미리 설정된 값에 하나 이상의 극값 계수들의 스펙트럼 값들을 설정하지 않도록 구성되고, 또는 유사 계수에 의해 하나 이상의 극값 계수들 중 적어도 하나를 대체하도록 구성되고, 상기 유사 계수의 스펙트럼 값은 미리 정의된 값과 다르며, 미리 설정된 값에 상기 극값 계수들 중 선행자들의 적어도 하나의 또는 후행자들의 적어도 하나의 스펙트럼 값을 설정하는 것에 의해 변경된 오디오 신호 스펙트럼을 얻기 위해 상기 오디오 신호 입력 스펙트럼을 변경하기 위한 스펙트럼 변경자(420),
    인코딩된 오디오 신호 스펙트럼을 얻기 위해 상기 변경된 오디오 신호 스펙트럼을 처리하기 위한 처리 유닛(430), 및
    부가 정보를 발생시키고 전송하기 위한 부가 정보 발생기(440),를 포함하며,
    상기 부가 정보 발생기(440)는 상기 스펙트럼 변경자(420)에 의해 발생된 변경된 오디오 신호 입력 스펙트럼 내에 하나 이상의 유사 계수 후보들을 위치시키도록 구성되며,
    상기 부가 정보 발생기(440)는 선택된 후보들로 유사 계수 후보들의 적어도 하나를 선택하도록 구성되며,
    상기 부가 정보 발생기(440)는 상기 부가 정보가 상기 유사 계수들에 따라 상기 선택된 후보들을 표시하도록 상기 부가 정보를 발생시키도록 구성되며,
    상기 극값 결정기(410)는 하나 이상의 극값 계수들을 결정하도록 구성되며,
    상기 극값 계수들의 각각은 그것의 스펙트럼 값이 그것의 선행자들의 적어도 하나의 스펙트럼 값보다 크고 그것의 스펙트럼 값이 그것의 후행자들 중 적어도 하나의 스펙트럼 값보다 큰 스펙트럼 계수들 중 하나이거나, 또는
    상기 스펙트럼 계수들의 각각은 상기 스펙트럼 계수와 관련된 비교 값을 가지며,
    상기 극값 결정기(410)는 하나 이상의 극값 계수들을 결정하도록 구성되며,
    상기 극값 계수들의 각각은 그것의 비교 값이 그것의 선행자들의 적어도 하나의 비교 값보다 크고 그것의 비교 값이 그것의 후행자들 중 적어도 하나의 비교 값보다 큰 스펙트럼 계수들 중 하나인 것을 특징으로 하는, 오디오 신호의 오디오 신호 입력 스펙트럼을 인코딩하기 위한 장치.
  13. 제12항에 있어서,
    상기 부가 정보 발생기(440)는 상기 부가 정보의 크기를 전송하도록 구성되는 것을 특징으로 하는 장치.
  14. 제12항 또는 제13항에 있어서,
    상기 스펙트럼 변경자(420)는 오디오 신호 입력 스펙트럼의 스펙트럼 계수들 중 적어도 몇몇의 스펙트럼 값들이 상기 변경된 오디오 신호 스펙트럼에서 변경되지 않고 남아있도록 상기 오디오 신호 입력 스펙트럼을 변경하도록 구성되는 것을 특징으로 하는 장치.
  15. 제12항 내지 14항 중 어느 한 항에 따른 장치에 있어서,
    상기 스펙트럼 계수들의 각각은 그것의 선행자들 중 하나로 즉각 선행자 및 그것의 후행자들 중 하나로 즉각 후행자 중 적어도 하나를 가지며, 상기 스펙트럼 계수의 즉각 선행자는 상기 시퀀스 내에서 상기 스펙트럼 계수를 즉각 선행하는 스펙트럼 계수들 중 하나이며, 상기 스펙트럼 계수의 즉각 선행자는 상기 시퀀스 내에 상기 스펙트럼 계수를 즉각 후행하는 스펙트럼 계수들 중 하나이며,
    상기 스펙트럼 변경자(420)는 미리 설정된 값에 극값 계수들 중 적어도 하나의 즉각 선행자 또는 즉각 후행자의 스펙트럼 값을 설정하는 것에 의해 변경된 오디오 신호 스펙트럼을 얻기 위해 상기 오디오 신호 입력 스펙트럼을 변경하도록 구성되며,
    상기 스펙트럼 변경자(420)는 미리 설정된 값에 하나 이상의 극값 계수들의 스펙트럼 값들을 설정하지 않도록 구성되거나, 또는 유사 계수에 의해 하나 이상의 극값 계수들 중 적어도 하나를 대체하도록 구성되며, 상기 유사 계수의 스펙트럼 값은 상기 미리 설정된 값과 다르며,
    상기 극값 결정기(410)는 하나 이상의 극값 계수들을 결정하도록 구성되며, 상기 극값 계수들의 각각은 그것의 스펙트럼 값이 그것의 즉각 선행자의 스펙트럼 값보다 큰 그리고 그것의 스펙트럼 값이 그것의 즉각 후행자의 스펙트럼 값보다 큰 스펙트럼 계수들 중 하나이며, 스펙트럼 계수들의 각각은 상기 스펙트럼 계수와 관련된 비교 값을 가지며, 상기 극값 결정기(410)는 하나 이상의 극값 계수들을 결정하도록 구성되며, 상기 극값 계수들의 각각은 그것의 비교 값이 그것의 즉각 선행자의 비교 값보다 크고 그것의 비교 값이 그것의 즉각 후행자들의 비교 값보다 큰 스펙트럼 계수들 중 하나인 것을 특징으로 하는 장치.
  16. 제15항에 따른 장치에 있어서,
    상기 극값 결정기(410)는, 하나 이상의 최소 계수들의 각각은 그것의 스펙트럼 값이 그것의 선행자들 중 하나의 스펙트럼 값보다 작고 그것의 스펙트럼 값이 그것의 후행자들 중 하나의 스펙트럼 값보다 작은 스펙트럼 계수들 중 하나이도록, 하나 이상의 최소 계수들을 결정하도록 구성되고, 또는 상기 스펙트럼 계수들의 각각은 상기 스펙트럼 계수와 관련된 비교 값을 가지며, 상기 극값 결정기(410)는, 하나 이상의 최소 계수들의 각각은 그것의 비교 값이 그것의 선행자들 중 하나의 비교 값보다 작고 그것의 비교 값이 그것의 후행자들 중 하나의 비교 값보다 작은 스펙트럼 계수들 중 하나이도록, 하나 이상의 최소 계수들을 결정하도록 구성되며,
    표현 값이 미리 설정된 값과 다르도록, 상기 스펙트럼 변경자(420)는 최소 계수들 중 하나 이상 및 극값 계수들 중 하나 이상의 비교 값들 또는 스펙트럼 값들에 기반하여 표현 값을 결정하도록 구성되며, 상기 스펙트럼 변경자는 표현 값에 상기 스펙트럼 값을 설정하는 것에 의해 오디오 신호 입력 스펙트럼의 계수들 중 하나의 스펙트럼 값을 변경하도록 구성되는 것을 특징으로 하는 장치.
  17. 제16항에 따른 장치에 있어서,
    상기 스펙트럼 변경자(420)는 상기 극값 계수들 중 하나의 스펙트럼 값 또는 비교 값 중 하나 사이의 값 차이가 임계 값보다 작은지 여부를 결정하도록 구성되고,
    상기 스펙트럼 변경자(420)는 상기 오디오 신호 입력 스펙트럼의 스펙트럼 계수들 중 적어도 몇몇의 스펙트럼 값들이 상기 값 차이가 임계 값보다 작은지 여부에 의존하여 변경된 오디오 신호 스펙트럼에서 변경되지 않은 채 남아있도록 오디오 신호 입력 스펙트럼을 변경하도록 구성되는 것을 특징으로 하는 장치.
  18. 제16항 또는 제17항에 따른 장치에 있어서,
    상기 극값 결정기(410)는, 오디오 신호 입력 스펙트럼 다음 스펙트럼 계수들이 그들의 스펙트럼 위치에 따라 서브-시퀀스 내에서 순차적으로 정렬되며, 서브-시퀀스들의 각 하나는 복수의 다음 스펙트럼 계수들을 가지도록, 스펙트럼 값들의 시퀀스의 하나 이상의 서브-시퀀스들을 결정하도록 구성되며, 상기 서브-시퀀스들의 각각은 상기 순차적으로-정렬된 서브-시퀀스에서 첫번째인 최초 요소 및 순차적으로-정렬된 서브-시퀀스에서 마지막인 최종 요소를 가지며, 상기 서브-시퀀스들의 각각은 극값 계수들 중 정확히 하나 및 최소 계수들 중 정확히 둘을 포함하며, 최소 계수들 중 하나는 서브-시퀀스의 최초 요소이고, 최소 계수들 중 다른 하나는 서브-시퀀스의 최종 요소이며,
    상기 스펙트럼 변경자(420)는 상기 서브-시퀀스들 중 하나의 계수들의 비교 값들 또는 스펙트럼 값들에 기반하여 표현 값을 결정하도록 구성되며, 상기 스펙트럼 변경자(420)는 상기 표현 값에 상기 스펙트럼 값을 설정하는 것에 의해 상기 서브-시퀀스의 계수들 중 하나의 스펙트럼 값을 변경하도록 구성되는 것을 특징으로 하는 장치.
  19. 제18항에 따른 장치에 있어서,
    상기 스펙트럼 변경자(420)는 상기 서브-시퀀스들 중 하나의 계수들의 비교 값들의 제곱들의 합을 결정하는 것에 의해 표현 값을 결정하도록 구성되는 것을 특징으로 하는 장치.
  20. 제18항 또는 제19항에 따른 장치에 있어서,
    상기 극값 결정기(410)는 첫번째 합을 얻기 위해 가중된 계수들을 합산하고, 두번째 합을 얻기 위해 서브-시퀀스의 모든 스펙트럼 계수들의 비교 값들을 합산하는 것에 의해, 복수의 가중 계수들을 얻기 위해 서브-시퀀스의 각 스펙트럼 계수에 대한 위치 값 및 비교 값의 곱을 결정하는 것에 의해 무게 중심 계수를 결정하도록 구성되며, 중간 결과를 얻기 위해 두번째 합으로 첫번째 합을 나누는 것에 의해; 무게 중심 계수를 얻기 위해 중간 결과에 대한 반올림을 적용하는 것에 의해, 스펙트럼 변경자(420)는 미리 설정된 값에 무게 중심 계수가 아닌, 서브-시퀀스의 모든 스펙트럼 계수들의 스펙트럼 값들을 설정하도록 구성되며,
    첫번째 합을 얻기 위해 가중된 계수들을 합하고, 두번째 합을 얻기 위해 상기 서브-시퀀스의 모든 스펙트럼 계수들의 스펙트럼 값들을 합하는 것에 의해, 중간 값을 얻기 위해 상기 두번째 합으로 첫번째 합을 나누는 것에 의해; 무게 중심 계수를 얻기 위해 중간 결과상에 반올림을 적용하는 것에 의해; 상기 극값 결정기(410)는 복수의 가중된 계수들을 얻기 위해 상기 서브-시퀀스의 각 스펙트럼 계수에 대한 위치 값 및 스펙트럼 값의 곱을 결정하는 것에 의해 무게 중심 계수를 결정하도록 구성되고, 상기 스펙트럼 변경자(420)는 미리 설정된 값에 무게 중심 계수가 아닌, 서브-시퀀스의 모든 스펙트럼 계수들의 스펙트럼 값들을 설정하도록 구성되는 것을 특징으로 하는 장치.
  21. 제12항 내지 제20항 중 어느 한 항에 따른 장치에 있어서, 상기 미리 설정된 값은 0인 것을 특징으로 하는 장치.
  22. 제12항 내지 제21항 중 어느 한 항에 따른 장치에 있어서,
    각 스펙트럼 계수의 비교 값은 상기 오디오 신호의 에너지 보존 변형으로부터 도출된 추가 스펙트럼의 추가 계수의 제곱 값인 것을 특징으로 하는 장치.
  23. 제12항 내지 제22항 중 어느 한 항에 따른 장치에 있어서,
    각 스펙트럼 계수의 비교 값은 상기 오디오 신호의 에너지 보존 변형으로부터 도출되는 추가 스펙트럼의 추가 계수의 진폭 값인 것을 특징으로 하는 장치.
  24. 제12항 내지 제23항 중 어느 한 항에 따른 장치에 있어서,
    상기 추가 스펙트럼은 복소 변경 이산 코사인 변형 스펙트럼(Complex Modified Discrete Cosine Transform spectrum)이며, 상기 에너지 보존 변형은 복소 변경 이산 코사인 변형(Complex Modified Discrete Cosine Transform)인 것을 특징으로 하는 장치.
  25. 제12항 내지 제24항 중 어느 한 항에 따른 장치에 있어서,
    상기 스펙트럼 변경자(420)는 미세-조정 정보를 수신하도록 구성되고,
    상기 오디오 신호 입력 스펙트럼의 스펙트럼 계수들은, 각각이 표시 성분을 포함하는, 표시 성분들이며,
    상기 미세-조정 정보가 상기 변경된 오디오 신호 스펙트럼을 얻기 위해 제1미세-조정 상태에 있는 경우, 상기 스펙트럼 변경자(420)는 유사 계수의 또는 하나 이상의 극값 계수들 중 하나의 스펙트럼 값의 표시 성분을 제1표시 값에 설정하며,
    상기 미세-조정 정보가 상기 변경된 오디오 신호 스펙트럼을 얻기 위해 상이한 제2미세-조정 상태에 있는 경우, 상기 유사 계수의 또는 상기 하나 이상의 극값 계수들 중 하나의 스펙트럼 값의 표시 성분을 상이한 제2표시 값에 설정하도록 구성되는 것을 특징으로 하는 장치.
  26. 제12항 내지 제25항 중 어느 한 항에 따른 장치에 있어서,
    상기 오디오 신호 입력 스펙트럼은 MDCT 계수들을 포함하는 MDCT 스펙트럼인 것을 특징으로 하는 장치.
  27. 제12항 내지 제26항 중 어느 한 항에 따른 장치에 있어서,
    상기 처리 유닛(430)은 양자화된 오디오 신호 스펙트럼을 얻기 위해 상기 변경된 오디오 신호 스펙트럼을 양자화하도록 구성되며,
    상기 처리 유닛(430)은 인코딩된 오디오 신호 스펙트럼을 얻기 위해 상기 양자화된 오디오 신호 스펙트럼을 처리하도록 더 구성되고,
    상기 처리 유닛(430)은, 상기 계수가 상기 극값 계수들 중 하나인지 여부, 그것의 스펙트럼 값이 미리 설정된 값과 동등한 즉각 선행자 및 그것의 스펙트럼 값이 미리 설정된 값과 동등한 즉각 후행자는 갖는 양자화된 오디오 신호 스펙트럼의 그러한 스펙트럼 계수들만을 표시하는 부가 정보를 발생시키도록 더 구성되며,
    상기 스펙트럼 계수의 즉각 선행자는 상기 양자화된 오디오 신호 스펙트럼 내에서 상기 스펙트럼 계수를 즉각 선행하는 또다른 스펙트럼 계수이며, 상기 스펙트럼 계수의 즉각 후행자는 상기 양자화된 오디오 신호 스펙트럼 내에서 상기 스펙트럼 계수를 즉각 후행하는 또다른 스펙트럼 계수인 것을 특징으로 하는 장치.
  28. 제12항 내지 제27항 중 어느 한 항에 따른 장치에 있어서,
    상기 스펙트럼 변경자(420)는, 상기 극값 계수의 후행자들 중 하나의 극값 계수의 비교 값 또는 스펙트럼 값으로부터 또는 상기 극값 계수의 선행자들 중 하나의 극값 계수의 비교 값 또는 스펙트럼 값으로부터, 상기 극값 계수의 비교 값 또는 스펙트럼 값으로부터 유도되는 스펙트럼 값을 갖는 유사 계수에 의해 극값 계수들 중 하나를 대체하도록 구성되는 것을 특징으로 하는 장치.
  29. 인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키는 방법에 있어서,
    상기 스펙트럼 계수들의 각각은 상기 인코딩된 오디오 신호 스펙트럼 내에 스펙트럼 위치 및 스펙트럼 값을 가지며, 상기 스펙트럼 계수들은 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 인코딩된 오디오 신호 스펙트럼 내에서 그들의 스펙트럼 위치에 따라 순차적으로 정렬되며, 상기 방법은 :
    복수의 스펙트럼 계수들을 포함하는 디코딩된 오디오 신호 스펙트럼을 얻기 위해 인코딩된 오디오 신호 스펙트럼을 처리하는 단계;
    유사 계수들 각각은 스펙트럼 값 및 스펙트럼 위치를 가지며, 상기 디코딩된 오디오 신호 스펙트럼의 하나 이상의 유사 계수들을 결정하는 단계;
    변경된 오디오 신호 스펙트럼을 얻기 위해 미리 설정된 값에 하나 이상의 유사 계수들을 설정하는 단계;
    시간-영역 변환 신호를 얻기 위해 상기 변경된 오디오 신호 스펙트럼을 시간-영역으로 변환하는 단계;
    상기 하나 이상의 유사 계수들 중 적어도 하나의 스펙트럼 값 및 스펙트럼 위치에 의해 제어되는 제어가능 오실레이터에 의해 시간-영역 오실레이터 신호를 발생시키는 단계; 및
    상기 오디오 출력 신호를 얻기 위해 상기 시간-영역 오실레이터 신호 및 상기 시간-영역 변환 신호를 믹싱하는 단계;를 포함하는, 인코딩된 오디오 신호 스펙트럼에 기반하여 오디오 출력 신호를 발생시키는 방법.
  30. 오디오 신호 입력 스펙트럼을 인코딩하는 방법에 있어서,
    상기 오디오 신호 입력 스펙트럼은 복수의 스펙트럼 계수들을 포함하고, 스펙트럼 계수들의 각각은 상기 오디오 신호 입력 스펙트럼 내에서 스펙트럼 위치, 스펙트럼 값 및 비교 값을 가지며, 상기 스펙트럼 계수들은 스펙트럼 계수들이 스펙트럼 계수들의 시퀀스를 형성하도록 상기 오디오 신호 입력 스펙트럼 내에 그들의 스펙트럼 위치에 따라 순차적으로 정렬되며, 상기 스펙트럼 계수들의 각각은 하나 이상의 선행자들 및 적어도 하나 이상의 후행자들 중 적어도 하나를 가지며, 상기 스펙트럼 계수의 선행자들 중 각 하나는 시퀀스 내에 상기 스펙트럼 계수를 선행하는 스펙트럼 계수들 중 하나이고, 상기 스펙트럼 계수의 후행자들 중 각 하나는 시퀀스 내에 상기 스펙트럼 계수를 후행하는 스펙트럼 계수들 중 하나이며,
    상기 방법은 :
    하나 이상의 극값 계수들을 결정하는 단계;
    미리 설정된 값에 극값 계수들 중 적어도 하나의 상기 후행자들 중 적어도 하나 또는 상기 선행자들 중 적어도 하나의 스펙트럼 값을 설정하는 것에 의해 변경된 오디오 신호 스펙트럼을 얻기 위해 상기 오디오 신호 입력 스펙트럼을 변경하는 단계;
    인코딩된 오디오 신호 스펙트럼을 얻기 위해 상기 변경된 오디오 신호 스펙트럼을 처리하는 단계; 및
    부가 정보를 발생시키고 전송하는 단계;를 포함하며,
    오디오 신호 입력 스펙트럼을 변경하는 단계는 유사 계수에 의해 하나 이상의 극값 계수들 중 적어도 하나를 대체하는 것에 의해, 또는 미리 설정된 값에 하나 이상의 극값 계수들의 스펙트럼 값들을 설정하지 않는 것에 의해 수행되며, 여기서 유사 계수의 스펙트럼 값은 상기 미리 설정된 값과 상이하며,
    상기 부가 정보는 상기 변경된 오디오 신호 입력 스펙트럼 내에서 하나 이상의 유사 계수 후보들을 위치시키는 것에 의해 발생되며, 여기서 상기 부가 정보는 선택된 후보들로 유사 계수 후보들 중 적어도 하나를 선택하는 것에 의해 발생되며, 여기서 상기 부가 정보는 상기 부가 정보가 상기 유사 계수들로 상기 선택된 후보들을 표시하도록 발생되며,
    상기 극값 계수들의 각각이 그것의 스펙트럼 값이 그것의 선행자들 중 적어도 하나의 스펙트럼 값보다 크고 그것의 스펙트럼 값이 그것의 후행자들 중 적어도 하나의 스펙트럼 값보다 큰 스펙트럼 계수들 중 하나이도록, 상기 하나 이상의 극값 계수들이 결정되며,
    상기 스펙트럼 계수들의 각각은 상기 스펙트럼 계수와 관련된 비교 값을 가지며, 극값 계수들의 각각이 그것의 비교 값이 그것의 선행자들 중 적어도 하나의 비교 값보다 크고 그것의 비교 값이 그것의 후행자들 중 적어도 하나의 후행자들 중 적어도 하나의 비교 값보다 큰 스펙트럼 계수들 중 하나가 되도록 상기 하나 이상의 극값 계수들이 결정되는 것을 특징으로 하는 방법.
  31. 컴퓨터 또는 신호 프로세서에서 실행될 때 제29항 또는 제30항의 방법을 실행하기 위한 컴퓨터 프로그램.
KR1020137028601A 2012-01-20 2012-12-21 사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법 KR101672025B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261588998P 2012-01-20 2012-01-20
US61/588,998 2012-01-20
PCT/EP2012/076746 WO2013107602A1 (en) 2012-01-20 2012-12-21 Apparatus and method for audio encoding and decoding employing sinusoidal substitution

Publications (2)

Publication Number Publication Date
KR20130137235A true KR20130137235A (ko) 2013-12-16
KR101672025B1 KR101672025B1 (ko) 2016-11-02

Family

ID=47603553

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137028601A KR101672025B1 (ko) 2012-01-20 2012-12-21 사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법

Country Status (19)

Country Link
US (1) US9343074B2 (ko)
EP (1) EP2673776B1 (ko)
JP (1) JP5600822B2 (ko)
KR (1) KR101672025B1 (ko)
CN (1) CN103493130B (ko)
AR (1) AR089772A1 (ko)
AU (1) AU2012366843B2 (ko)
BR (1) BR112013026452B1 (ko)
CA (2) CA2848275C (ko)
ES (1) ES2545053T3 (ko)
HK (1) HK1192640A1 (ko)
MX (1) MX350686B (ko)
MY (1) MY157163A (ko)
PL (1) PL2673776T3 (ko)
RU (1) RU2562383C2 (ko)
SG (1) SG194706A1 (ko)
TW (1) TWI503815B (ko)
WO (1) WO2013107602A1 (ko)
ZA (1) ZA201308073B (ko)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105122357B (zh) * 2013-01-29 2019-04-23 弗劳恩霍夫应用研究促进协会 频域中基于lpc进行编码的低频增强
KR101757338B1 (ko) 2013-06-21 2017-07-26 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 오디오 신호의 대체 프레임에 대한 스펙트럼 계수들을 획득하기 위한 방법과 장치, 오디오 디코더, 오디오 수신기 및 오디오 신호들의 전송을 위한 시스템
CN104934032B (zh) * 2014-03-17 2019-04-05 华为技术有限公司 根据频域能量对语音信号进行处理的方法和装置
US9672843B2 (en) 2014-05-29 2017-06-06 Apple Inc. Apparatus and method for improving an audio signal in the spectral domain
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
CN107924683B (zh) * 2015-10-15 2021-03-30 华为技术有限公司 正弦编码和解码的方法和装置
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
WO2019195269A1 (en) * 2018-04-04 2019-10-10 Harman International Industries, Incorporated Dynamic audio upmixer parameters for simulating natural spatial variations
US11031024B2 (en) 2019-03-14 2021-06-08 Boomcloud 360, Inc. Spatially aware multiband compression system with priority
TWI789577B (zh) * 2020-04-01 2023-01-11 同響科技股份有限公司 音訊資料重建方法及系統

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080062705A (ko) * 2006-12-29 2008-07-03 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0215915A4 (en) * 1985-03-18 1987-11-25 Massachusetts Inst Technology TREATMENT OF ACOUSTIC WAVE SHAPES.
US4703357A (en) * 1985-12-24 1987-10-27 Rca Corporation Adaptive television deghosting system
US4686570A (en) * 1985-12-24 1987-08-11 Rca Corporation Analog-to-digital converter as for an adaptive television deghosting system
DE8706928U1 (ko) * 1987-05-14 1987-08-06 Ant Nachrichtentechnik Gmbh, 7150 Backnang, De
CA2066851C (en) * 1991-06-13 1996-08-06 Edwin A. Kelley Multiple user digital receiver apparatus and method with combined multiple frequency channels
JP3241098B2 (ja) * 1992-06-12 2001-12-25 株式会社東芝 多方式対応の受信装置
EP0638869B1 (de) * 1993-08-13 1995-06-07 Siemens Aktiengesellschaft Verfahren zur hochauflösenden Spektralanalyse bei mehrkanaligen Beobachtungen
US5640416A (en) * 1995-06-07 1997-06-17 Comsat Corporation Digital downconverter/despreader for direct sequence spread spectrum communications system
US6356555B1 (en) * 1995-08-25 2002-03-12 Terayon Communications Systems, Inc. Apparatus and method for digital data transmission using orthogonal codes
US6266644B1 (en) * 1998-09-26 2001-07-24 Liquid Audio, Inc. Audio encoding apparatus and methods
US6606129B1 (en) * 1998-12-04 2003-08-12 Samsung Electronics Co., Ltd. Digital filtering of DTV I-F signal to avoid low-end boost of the baseband signal resulting from in-phase synchrodyne
US6665638B1 (en) * 2000-04-17 2003-12-16 At&T Corp. Adaptive short-term post-filters for speech coders
JP2002182695A (ja) * 2000-12-14 2002-06-26 Matsushita Electric Ind Co Ltd 高能率符号化方法及び装置
KR100448892B1 (ko) * 2002-06-04 2004-09-18 한국전자통신연구원 고전력 증폭기의 비선형 왜곡 보상을 위한 전치 왜곡 장치및 그 방법
KR20050021484A (ko) * 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
EP1527442B1 (en) * 2002-08-01 2006-04-05 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band replication
US20040083110A1 (en) * 2002-10-23 2004-04-29 Nokia Corporation Packet loss recovery based on music signal classification and mixing
KR100467617B1 (ko) * 2002-10-30 2005-01-24 삼성전자주식회사 개선된 심리 음향 모델을 이용한 디지털 오디오 부호화방법과그 장치
CN100349207C (zh) * 2003-01-14 2007-11-14 北京阜国数字技术有限公司 高频耦合的伪小波5声道音频编/解码方法
DE10345995B4 (de) * 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
JP2006311353A (ja) * 2005-04-28 2006-11-09 Samsung Electronics Co Ltd ダウンコンバータおよびアップコンバータ
JP5032314B2 (ja) * 2005-06-23 2012-09-26 パナソニック株式会社 オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP2009524101A (ja) * 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
JP4454604B2 (ja) * 2006-06-19 2010-04-21 シャープ株式会社 信号処理方法、信号処理装置及びプログラム
JP4594942B2 (ja) 2007-01-16 2010-12-08 コベルコ建機株式会社 建設機械の冷却構造
WO2008114075A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation An encoder
ES2358786T3 (es) 2007-06-08 2011-05-13 Dolby Laboratories Licensing Corporation Derivación híbrida de canales de audio de sonido envolvente combinando de manera controlable componentes de señal de sonido ambiente y con decodificación matricial.
BRPI0816557B1 (pt) * 2007-10-17 2020-02-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Codificação de áudio usando upmix
US8527265B2 (en) * 2007-10-22 2013-09-03 Qualcomm Incorporated Low-complexity encoding/decoding of quantized MDCT spectrum in scalable speech and audio codecs
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
CA2821035A1 (en) * 2008-03-10 2009-09-17 Sascha Disch Device and method for manipulating an audio signal having a transient event
EP3296992B1 (en) * 2008-03-20 2021-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for modifying a parameterized representation
KR101613975B1 (ko) 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5587061B2 (ja) 2009-09-30 2014-09-10 三洋電機株式会社 抵抗溶接用通電ブロック、この通電ブロックを用いた密閉電池の製造方法及び密閉電池
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US20120212375A1 (en) * 2011-02-22 2012-08-23 Depree Iv William Frederick Quantum broadband antenna

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080062705A (ko) * 2006-12-29 2008-07-03 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법

Also Published As

Publication number Publication date
RU2562383C2 (ru) 2015-09-10
JP5600822B2 (ja) 2014-10-08
TW201346891A (zh) 2013-11-16
WO2013107602A1 (en) 2013-07-25
US20140074486A1 (en) 2014-03-13
EP2673776B1 (en) 2015-06-17
US9343074B2 (en) 2016-05-17
CN103493130B (zh) 2016-05-18
AU2012366843A1 (en) 2013-10-10
MX350686B (es) 2017-09-13
AR089772A1 (es) 2014-09-17
ZA201308073B (en) 2015-01-28
AU2012366843B2 (en) 2015-08-06
KR101672025B1 (ko) 2016-11-02
CA2831176C (en) 2014-12-09
JP2014517932A (ja) 2014-07-24
RU2013148123A (ru) 2015-05-10
SG194706A1 (en) 2013-12-30
CN103493130A (zh) 2014-01-01
CA2831176A1 (en) 2013-07-25
TWI503815B (zh) 2015-10-11
HK1192640A1 (en) 2014-08-22
PL2673776T3 (pl) 2015-12-31
BR112013026452A2 (pt) 2017-06-27
BR112013026452B1 (pt) 2021-02-17
MY157163A (en) 2016-05-13
ES2545053T3 (es) 2015-09-08
EP2673776A1 (en) 2013-12-18
CA2848275C (en) 2016-03-08
MX2013012409A (es) 2013-12-06
CA2848275A1 (en) 2014-04-03

Similar Documents

Publication Publication Date Title
KR101672025B1 (ko) 사인곡선 대체를 이용하여 오디오 인코딩 및 디코딩하기 위한 장치 및 방법
KR101508819B1 (ko) 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩
JP7005564B2 (ja) スペクトルパターンを利用することによってシヌソイドおよびスイープを効率的に合成するための装置および方法
JP5350393B2 (ja) オーディオコーディングシステム、オーディオデコーダ、オーディオエンコーディング方法及びオーディオデコーディング方法
JP6970789B2 (ja) 高位周波数帯域における検出されたピークスペクトル領域を考慮してオーディオ信号を符号化するオーディオ符号器、オーディオ信号を符号化する方法、及びコンピュータプログラム
JP5978218B2 (ja) 低ビットレート低遅延の一般オーディオ信号の符号化
TWI605448B (zh) 產生帶寬延伸訊號的裝置
CN106537499A (zh) 用于使用独立噪声填充生成增强信号的装置和方法
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
Disch et al. Sinusoidal substitution—An integrated parametric tool for enhancement of transform-based perceptual audio coders

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20191001

Year of fee payment: 4