KR20130045349A - 포워드 앨리어싱 취소를 이용한 코더 - Google Patents

포워드 앨리어싱 취소를 이용한 코더 Download PDF

Info

Publication number
KR20130045349A
KR20130045349A KR1020137003325A KR20137003325A KR20130045349A KR 20130045349 A KR20130045349 A KR 20130045349A KR 1020137003325 A KR1020137003325 A KR 1020137003325A KR 20137003325 A KR20137003325 A KR 20137003325A KR 20130045349 A KR20130045349 A KR 20130045349A
Authority
KR
South Korea
Prior art keywords
frame
time
current
aliasing cancellation
sub
Prior art date
Application number
KR1020137003325A
Other languages
English (en)
Other versions
KR101456639B1 (ko
Inventor
제레미 르콩트
패트릭 밤볼트
스테판 바이어
Original Assignee
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Publication of KR20130045349A publication Critical patent/KR20130045349A/ko
Application granted granted Critical
Publication of KR101456639B1 publication Critical patent/KR101456639B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

현재 프레임으로부터 포워드 앨리어싱 취소 데이터를 판독하지 않는 것을 포함하는, 현재 프레임 비-예측의 제2액션 및 현재 프레임으로부터 포워드 앨리어싱 취소 데이터를 판독하는 것을 포함하는, 현재 프레임 예측의 제1액션 사이의 선택을 할 수 잇는 디코더의 파서에 의존하여, 디코더의 파서는 시간-영역 변형 코딩 모드 및 시간-영역 코딩 모드 사이의 스위칭을 지지하는 코덱은 상기 프레임들에 추가 구문 부를 더하는 것에 의해 프레임 손실이 적도록 된다. 다른 말로, 새로운 구문부의 제공 때문에 코딩 효율이 조금 손실되는 반면, 새로운 구문부는 그저 프레임 손실을 갖는 통신 채널의 경우에 코덱을 이용하는 능력을 제공한다. 새로운 구문부 없이는, 상기 디코더는 손실 이후 어떠한 데이터 스트림 포션을 디코딩하지 못하며 파싱을 재개하려 할 때 충돌할 것이다. 따라서, 에러가 나기 쉬운 환경에서, 코딩 효율은 새로운 구분부의 도입에 의해 소실(vanishing)이 방지된다.

Description

포워드 앨리어싱 취소를 이용한 코더{CODER USING FORWARD ALIASING CANCELLATION}
본 발명은 시간-영역 엘리어싱 취소 변형 코딩 모드(time-domain aliasing cancellation transform coding mode) 및 시간-영역 코딩 모드(time-domain coding mode) 뿐만 아니라 양쪽 모드들 사이를 스위칭하기 위한 포워드 엘리어싱 취소(forward aliasing cancellation)를 뒷받침하는 코덱에 관련되어 있다.
스피치, 음악 또는 유사한 것들 같은 다른 타입들의 오디오 신호들의 믹스를 나타내는 일반적인 오디오 신호들을 코딩하기 위한 다른 코딩 모드들을 믹스하는 것이 바람직하다. 개별 코딩 모드들은 특히 오디오 타입들에 적응될 수 있고, 이와 같이, 멀티-모드 오디오 인코더는 오디오 컨텐츠 타입의 변화에 대응하는 시간을 넘는 인코딩 모드를 변화시키는 이점을 취할 수 있다. 다른 말로, 멀티-모드 오디오 인코더는, 예를 들어, 스피치를 코딩하는 것에 대해 특히 전용인 코딩 모드를 이용하여, 스피치 컨텐츠를 갖는 상기 오디오 신호의 부분들을 인코딩하는 것을, 그리고 음악 같은 논-스피치 컨텐츠를 나타내는 오디오 컨텐츠의 다른 부분들을 인코딩하기 위한 또 다른 코딩 모드를 이용하는 것을, 결정할 수 있다. 코드북 여기(codebook excitation) 선형 예측 코딩 모드들(linear prediction coding modes)같은 시간-영역 코딩 모드들은, 스피치 컨텐츠들(speech contents)을 코딩하기 위해 더 적합한 경향이 있고, 반면 변형 코딩 모드들은 예를 들어, 음악이 관련된 코딩까지 시간-영역 코딩 모드들을 능가하는 경향이 있다.
하나의 오디오 신호 내에 다른 오디오 타입들의 공존에 대응하는 문제를 다루기 위한 솔루션들이 이미 있다. 예를 들어, 현재 떠오르는 USAC는, AAC 스탠다드(standard)를 대체로 준수하는 주파수 영역, 및 AMR-WB 플러스 스탠다드의 서브-프레임 모드들에 유사한 두개의 추가 선형 예측 모드들, 즉 MDCT (Modified Discrete Cosine Transformation) 기반 TCX(TCX = transform coded excitation) 모드의 변종(variant) 및 ACELP (adaptive codebook excitation linear prediction) 사이에서 스위칭을 제안한다. 더 정확하게, AMR-WB+ 스탠다드에서, TCX는 DFT 변형에 기반하나 USAC TCX에서 MDCT 변형 기반을 갖는다. 특정 프레임 구조는 AAC에 유사한 FD 코딩 영역 및 AMR-WB+ 에 유사한 선형 예측 영역 사이의 스위칭(switch)를 위해 이용된다. AMR-WB+ 기준 그 자체는 USAC 기준에 상대적인 서브-프레이밍 구조(sub-framing structure)를 형성하는 자체 프레이밍 구조를 이용한다. AMR-WB+ 기준은 더 작은 TCX 및/또는 ACELP 프레임들로 AMR-WB+ 를 세분(sub-dividing)하는 특정 서브디비젼(세분, sub-division) 구성을 허용한다. 유사하게, 상기 AAC 기준은 기초 프레이밍 구조(basis framing structure)를 이용하지만, 상기 프레임 컨텐츠를 변형 코딩(transform code)하기 위해 다른 윈도우 길이들(different window lengths)의 이용을 허용한다. 예를 들어, 긴 윈도우든 연동된 긴 변형 길이든, 또는 더 짧은 길이의 연동된 변형들을 갖는 여덟개의 짧은 윈도우들이든 이용될 수 있다.
MDCT는 앨리어싱을 야기한다. 이는, 따라서, TXC 및 FD 프레임 경계들에서 참이다. 다른 말로, MDCT를 이용하는 단지 어떠한 주파수 영역 코더처럼, 앨리어싱은 윈도우 오버랩 영역들에서 일어나고, 이는 인접 프레임들의 도움에 의해 취소된다. 그것은, 두 FD 프레임들 사이의 또는 두 TCX(MDCT) 프레임들 사이의 어떠한 트랜지션들(transitions) 또는 FD 에서 TCX 이나 TCX 에서 FD 사이의 트랜지션에 대해, 상기 디코딩 측면에서 복원 내에 상기 오버랩/애드 절차에 의한 묵시적 앨리어싱 취소(implicit aliasing cancelation)가 있다는 것이다. 그러면, 상기 오버랩 애드 후에 더 이상의 앨리어싱이 없다는 것이다. 그러나, ACELP를 갖는 트랜지션들의 경우, 고유 앨리어싱 취소(inherent aliasing cancelation)가 없다. FAC는 인근 프레임들로부터 오는 앨리어싱을 취소하는 것이고 이는 그것들이 ACELP와 다른 경우이다.
다른 말로, ACELP 같은, 변형 코딩 모드와 시간 영역 코딩 모드 사이의 트랜지션들이 일어날 때는 언제나 앨리어싱 취소 문제들이 일어난다. 시간 영역에서 스펙트럼 영역으로 가능한 효과적으로 변형을 수행하기 위함이다. MDCT 같은, 시간-영역 앨리어싱 취소 변형 코딩이 이용되고, 즉 코딩 모드는 신호의 윈도우된 부분들을 오버랩핑하는 것이 부분 당(per portion) 변형 계수들이 부분 당 샘플들의 숫자보다 적은 것에 따르는 변형을 이용하여 변형되는 곳에서 오버랩된 변형을 이용하고 그래서 개별 부분들이 관련되는 한 앨리어싱이 일어나며, 이는 이 앨리어싱이 시간-영역 앨리어싱 취소에 의해 취소되는 것과 함께이며, 즉 인접 재-변형된 신호 부분들(neighboring re-transformed signal portions)의 오버랩핑 앨리어싱 부분들(overlapping aliasing portions)을 더하는 것에 의해서이다. MDCT는 시간-영역 앨리어싱 취소 변형같은 것이다. 불이익하게, TDAC(시간-영역 앨리어싱 취소)는 TC 코딩 모드 및 시간-영역 코딩 모드 사이의 트랜지션들에서는 이용가능하지 않다.
이 문제를 풀기 위해, 포워드 앨리어싱 취소(FAC)는 변형 코딩으로부터 시간-영역 코딩으로 코딩 모드의 변화가 일어날 때마다 인코더가 현재 프레임 내에 데이터 스트림 추가 FAC 데이터 내에서 신호를 보내는 것에 따라 이용될 수 있다. 이는, 그러나, 현재 디코딩된 프레임이 FAC 데이터를 그것의 구문 내에 포함하는지 아닌지 여부에 대해 알아내기 위해 연속 프레임들의 코딩 모드들을 비교하는 디코더를 필요로 하게 한다. 이는, 차례로, 동일하게 현재 프레임으로부터 FAC 데이터를 읽거나 파싱(구문 분석, parse)해야 하는지 아닌지에 대해 디코더가 확실히 할 수 있는지에 대한 프레임이 있을 수 있는지를 의미한다. 다른 말로, 하나 또는 그 이상의 프레임들의 전송 중 손실되는 경우, 상기 디코더는 코딩 모드 변화가 일어나는지 아닌지에 관해, 그리고 현재 프레임 인코딩된 데이터의 비트 스트림이 FAC 데이터를 포함하는지 아닌지에 관해, 즉시 계속되는 (수신된) 프레임들에 대하여 알지 못한다. 따라서, 상기 디코더는 현재 프레임을 버리고 다음 프레임을 기다린다. 대안적으로, 상기 디코더는 두번의 디코딩 시도들을 수행하는 것에 의해 현재 프레임을 파싱할 수 있고, 하나는 FAC 데이터가 존재한다고 가정하며, 또다른 것은 FAC 데이터가 존재하지 않는다고 가정하며, 이후 두 대안들 중 어떤 것이 실패하는지에 관해 결정한다. 디코딩 프로세스는 두 조건들 중 하나에서 아마도 디코더 충돌을 만들 것이다. 그것은, 실제로, 후자의 가능성은 실현가능한 접근이 아니다. 상기 디코더는 상기 데이터를 해석하는 방법을 언제나 알아야 하며 상기 데이터를 처리하는 방법 상에서 그 자체의 추측에 의존하지 않아야 한다.
따라서, 본 발명의 목적은, 시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 사이의 스위칭을 지원하면서도 더 에러에 강하고 또는 프레임 손실에 강한 코덱을 제공하는 것이다.
이 목적은 여기에 첨부된 독립항들 중 어떤 것의 주제에 의해 달성된다.
본 발명은 달성가능한 시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 사이의 스위칭을 지원하는 더 에러에 더 강하거나 프레임 손실에 강한 코덱을 찾는 것에 기반하며 만약 추가 구문부(further syntax portion)가 디코더의 파서(parser)가 포함할 현재 프레임을 예측하는 제1액션 사이에서 선택하는 것에 기반하여 프레임들에 더해지는 경우, 현재 프레임으로부터 포워드 앨리어싱 취소 데이터를 읽으며, 포함할 현재 프레임을 비-예측하는 제2액션은 따라서 현재 프레임으로부터 포워드 앨리어싱 취소 데이터를 읽지 않는다. 다른 말로, 상기 제2구문부의 제공 때문에 코딩 효율을 조금 잃는 동안, 상기 제2구문부가 프레임 손실과 통신 채널의 경우에서 상기 코덱을 이용하는 능력을 제공한다. 상기 제2구문부 없이는, 상기 디코더는 손실 뒤에 어떤 데이터 스트림 부분(포션, portion)을 디코딩할 수 없을 것이고 파싱을 재개하는 시도에 있어 충돌할 것이다. 따라서, 에러가 발생하기 쉬운 환경에서, 상기 코딩 효율은 상기 제2구문부의 도입에 의해 소실(배니슁, vanishing)이 방지된다.
본 발명의 추가 바람직한 실시예들은 종속 청구항들의 주제이다. 더하여, 본 발명의 바람직한 실시예들은 도면들과 함께 아래에서 더 자세히 설명된다.
도1은 실시예에 따른 디코더의 개략적 블록도.
도2는 실시예에 따른 인코더의 개략적 블록도.
도3은 도2의 복원기의 가능한 실시예의 블록도.
도4는 도3의 FD 디코딩 모듈의 가능한 실시예의 블록도.
도5는 도3의 LPD 디코딩 모듈의 가능한 실시예의 블록도.
도6은 실시예에 따른 DAC 데이터를 발생시키기 위한 인코딩 절차를 도시하는 개략도.
도7은 실시예에 따른 가능한 TDAC 변형 재-변형의 개략도.
도8, 9는 최적화 센스(sense)를 변화시키는 코딩 모드를 테스트하기 위해 인코더에서 추가 프로세싱의 인코더에서 FAC 데이터의 경로 선구조(path lineation)를 나타내는 블록도.
도10, 11은 데이터 스트림으로부터 도8 및 9의 FAC 데이터가 도착하도록 하기 위한 디코더 핸들링의 블록도.
도12는 디코딩 측면이 다른 코딩 모드의 경계 프레임들로부터 가로지르는 FAC 기반 복원의 개략도.
도13, 14는 도12의 복원기를 수행하도록 도3의 트랜지션 핸들러에서 수행되는 프로세싱을 개략적으로 나타내는 도면.
도15 내지 19는 실시예에 따른 구문 구조의 부분들을 나타내는 도면.
도20 내지 22는 또 다른 실시예에 따른 구문 구조의 부분들을 나타내는 도면.
도1은 본 발명의 실시예에 따른 디코더(10)를 보여준다. 디코더(10)는 정보 신호(18)의 시간 세그멘트들(16a-c)이 각각 코딩되는, 프레임들(14a, 14b, 14c)의 시퀀스를 포함하는 데이터 스트림을 디코딩하기 위함이다. 도1에 도시되는 것처럼, 상기 시간 세그멘트들 (16a 에서 16c) 는 시간에서 서로 직접 인접하는 논-오버랩핑 세그멘트들이고 시간상 순차적으로 정렬된다. 도1에 도시된 것처럼, 시간 세그멘트들 (16a 에서 16c)은 같은 크기일 수 있으나 대안적 실시예들 또한 실현 가능하다. 시간 세그멘트들(16a 에서 16c) 각각은 프레임들(14a 에서 14c) 중 각 하나로 코딩된다. 다른 말로, 각 시간 세그멘트(16a 에서 16c)는 고유하게 프레임들(14a 에서 14c) 중 하나에 연동되고, 차례로, 그들 중에서 정의되는 순서를 가지며, 이는 각각 프레임들(14a 에서 14c)로 코딩되는 세그멘트들(16a 에서 16c)의 순서를 따른다. 비록 도1은 각 프레임(14a 에서 14c)이, 예를 들어, 코드 비트(coded bits),에서 측정된 동일한 길이라는 것을 제안하며, 물론, 이는 강제적인 것은 아니다. 그보다, 프레임들(14a 에서 14c)의 길이는 각 프레임(14a 에서 14c)가 연동된 시간 세그멘트(16a 에서 16c)의 복잡성에 따라 다양해 질 수 있다.
아래에 요약된 실시예들의 설명 각각에 대해, 정보 신호(18)는 오디오 신호라고 가정된다. 그러나, 정보 신호는 또한 어떠한 다른 신호, 가령 물리적 센서 또는 유사한 것, 광 센서 또는 유사한 것에 의해 출력되는 신호 같은 것이 될 수 있다는 것이 주목되어야 한다. 특히, 개별적으로, 신호(18)는 특정 샘플링 레이트에서 샘플링 될 수 있고 시간 세그멘트들(16a 에서 16c)은 샘플들의 숫자 그리고 시간 상에서 동일한 이 신호(18)의 연속적인 부분(포션, portions)을 즉시 커버할 수 있다. 시간 세그멘트(16a 에서 16c) 당 샘플들의 숫자는, 예를 들어, 1024 샘플들이 될 수 있다.
디코더(10)은 파서(parser, 20) 그리고 복원기(reconstructor, 22)를 포함한다. 상기 파서(20)은 상기 데이터 스트림(12)을 파싱(parse, 구문 분석)하기 위해 구성되며, 데이터 스트림(12)를 파싱하는 데 있어, 현재 프레임(14b) 즉 현재 디코딩될 프레임으로부터 제1구문부(first syntax portion, 24) 및 제2구문부(second syntax portion, 26) 를 읽는다. 도1에서, 프레임(14b)는 현재 디코딩될 프레임으로 반면 프레임(14a)는 바로 전에 디코딩된 프레임으로 예시적으로 가정된다. 프레임(14a 에서 14c) 각각은 아래에 요약된 그것의 의미 또는 중요성과 함께 그것에 포함된 제1구문부와 제2구문부를 갖는다. 도1에서, 프레임들(14a 에서 14c) 내에 제1구문부는 그것 안에 "1"을 갖는 박스로 표시되고 제2구문부는 "2"로 명명되는 박스로 표시된다.
자연스럽게, 각 프레임(14a 에서 14c)는 아래에 더 자세히 설명되는 방법으로 연동된 시간 세그멘트(16a 에서 16c)를 나타내기 위한 그것에 포함된 추가 정보 또한 갖는다. 이 정보는 빗금친 블록(hatched block)에 의해 도1에서 표시되며 도면부호(28)은 현재 프레임(14b)의 추가 정보를 위해 이용된다. 파서(20)는, 데이터 스트림(12)를 파싱하는 데 있어, 현재 프레임(14b)로부터 정보(28)를 읽도록 또한 구성된다.
복원기(22)는 시간-영역 앨리어싱 취소 변형 디코딩 모드 및 시간-영역 디코딩 모드 중 선택된 하나를 이용하여 추가 정보(28)의 기반한 현재 프레임(14b)와 연동된 정보 신호(18)의 현재 시간 세그멘트(16b)를 복원하도록 구성된다. 상기 선택은 제1구문 요소(24)에 의존한다. 양 디코딩 모드들은 재-변형을 이용하는 스펙트럼 영역에서 시간-영역으로 돌아가는 어떠한 트랜지션의 존재 또는 부재에 따라 서로 차이가 난다. 상기 재-변형(그것의 대응하는 변형을 따라) 관련된 개별 시간 세그멘트들까지 앨리어싱을 도입하고 그 앨리어싱은, 그러나, 시간-영역 앨리어싱 취소 변형 코딩 모드에서 연속적인 프레임들 사이의 바운더리들에서의 트랜지션들이 관련되는 한 시간-영역 앨리어싱 취소에 의해 보상가능하다. 시간-영역 디코딩 모드는 어떠한 재-변형을 필요로 하게 하지 않는다. 오히려, 상기 디코딩은 시간-영역에 남게 된다. 따라서, 일반적으로 말해, 상기 복원기(22)의 시간-영역 앨리어싱 취소 변형 디코딩 모드는 복원기(22)에 의해 수행되는 재-변형을 수반한다. 이 재변형은(retransform) (TDAC 변형 디코딩 모드인) 현재 프레임(14b)의 정보(28)로부터 얻어지는 것에 따라 변형 계수들의 제1숫자를 제1숫자보다 더 커서 앨리어싱을 야기하는 샘플들의 제2숫자의 샘플 길이를 갖는 재-변형 신호 세그먼트로 맵핑(사상, map)한다. 시간-영역 디코딩 모드는, 차례로, 선형 예측 디코딩 모드를 수반할 수 있으며, 이는 여기(excitation) 및 선형 예측 계수들이, 그런 경우, 시간-영역 코딩 모드인, 현재 프레임의 정보(28)로부터 복원되는 것에 따른다.
따라서, 상기 논의로부터 명확해지는 것에 따라, 시간-영역 앨리어싱 취소 변형 디코딩 모드에서, 복원기(22)는 재-변형에 의해 개별 시간 세그먼트(16b)에서 정보 신호를 복원하기 위한 정보(28) 신호 세그먼트로부터 얻어진다. 재-변형 신호 세그먼트는 현재 시간 세그먼트(16b)보다 길고 시간 세그먼트(16b)를 넘어 확장하고 포함하는 시간 부분(time portion) 내에 정보 신호(18)의 복원에 참여한다. 도1은 원래 신호를 변형하는데 또는, 변형 및 재-변형하는데 모두 쓰이는 변형 윈도우(32)를 도시한다. 보여지는대로, 윈도우(32)는 그것의 시작에서 제로 부분(zero portion, 321 )을, 그 끝부분(trailing end)에서 제로 부분(322 )을, 그리고 현재 시간 세그먼트(16b)의 리딩(leading) 및 트레일링(trailing) 엣지에서 앨리어싱 부분들(323 및 324 )을 포함하며, 윈도우(32)가 하나인 비-앨리어싱 부분(325 )은 앨리어싱 부분들(323 및 324 )사이에 위치될 수 있다. 제로-부분들(321 및 322 )는 선택적이다. 단지 제로 부분들(321 and 322 ) 중 하나만 존재하는 것도 가능하다. 도1에 보여지는 대로, 상기 윈도우 기능은 상기 앨리어싱 부분들 내에서 단순 증가/감소할 수 있다. 앨리어싱은 윈도우(32)가 제로에서 하나로 또는 그 역으로 계속 이끄는 앨리어싱 부분들(323 및 324 ) 내에서 일어난다. 상기 앨리어싱은 시간-영역 앨리어싱 취소 변형 코딩 모드에서 이전의 그리고 연속적인 시간 세그멘트들이 코딩되는 한, 역시 결정적이지는 않다.(not critical) 이러한 가능성은 상기 시간 세그먼트(16c)에 관한 도1에 도시되어 있다. 점선은 상기 앨리어싱 부분이 현재 시간 세그먼트(16b)의 앨리어싱 부분(324 )과 일치하는 시간 세그먼트(16c)에 대한 개별 변형 윈도우(32)를 도시한다. 복원기(22)에 의한 시간 세그먼트들(16b 및 16c)의 재-변형 세그먼트 신호들에 애딩(adding)은 서로에 대한 두 재-변형된 신호 세그먼트들 모두의 앨리어싱을 상쇄한다.(cancels-out)
그러나, 이전 또는 계속되는 프레임(14a 또는 14c)가 시간-영역 코딩 코드에서 코딩되는 경우에, 다른 코딩 모드들 사이의 트랜지션은 현재 시간 세그먼트(16b)의 리딩(leading) 또는 트레일링(trailing) 엣지에서 도출되며, 개별 앨리어싱을 설명하기 위해, 상기 데이터 스트림(12)는 이 개별 트랜지션에서 일어나는 앨리어싱을 보상하기 위해 디코더(10)를 가능하게 하는 트랜지션을 바로 따르는 개별 프레임 내의 포워드 앨리어싱 취소 데이터를 포함한다. 예를 들어, 현재 프레임(14b)이 시간-영역 앨리어싱 취소 변형 코딩 모드가 되는 것이 일어날 수 있지만, 디코더(10)은 이전 프레임(14a)가 시간-영역 코딩 모드인지 여부에 대해 알지 못한다. 예를 들어, 프레임(14a)는 트랜스미션 동안 손실될 수 있고 따라서 디코더(10)은 그에 대한 엑세스를 갖지 않는다. 그러나, 프레임(14a)의 코딩 모드에 의존하여, 현재 프레임(14b)는 앨리어싱 부분(323 )에서 앨리어싱이 일어나는지 아닌지에 대해 보상하기 위해 포워드 앨리어싱 취소 데이터를 포함한다. 유사하게, 만약 현재 프레임(14b)가 시간-영역 코딩 모드에서라면, 이전 프레임(14a)은 디코더(10)에 의해 수신되지 않았고, 그 후 현재 프레임(14b)은 그에 포함된 포워드 앨리어싱 취소 데이터를 갖거나 이전 프레임(14a)의 모드에 의존하지 않는다. 특히, 이전 프레임(14a)가 다른 코딩 모드라면, 즉 시간-영역 앨리어싱 취소 변형 코딩 모드라면, 포워드 앨리어싱 취소 데이터는 시간 세그먼트들(16a 및 16b) 사이의 바운더리에서 다르게 일어나는 앨리어싱을 취소하기 위해 현재 프레임(14b)에서 존재할 것이다. 그러나, 이전 프레임(14a)가 동일 코딩 모드라면, 즉 시간-영역 코딩 모드라면, 파서(20)은 현재 프레임(14b)에 존재할 포워드 앨리어싱 취소 데이터를 예측해야 하는 것은 아니다.
따라서, 파서(20)은 포워드 앨리어싱 취소 데이터(34)가 현재 프레임(14b)에 존재하는지 아닌지에 대해 확인하기 위해 제2구문부(second syntax portion, 26)을 이용한다. 데이터 스트림(12)를 파싱하는데 있어, 파서(20)은 포함할 현재 프레임(14b)를 예측하는 제1액션의 선택된 하나일 수 있고, 따라서 현재 프레임(14b)로부터 포워드 앨리어싱 취소 데이터(34)를 읽고 포함할 현재 프레임(14b) 비-예측 제2액션은, 따라서 현재 프레임(14b)로부터 포워드 앨리어싱 취소 데이터를 읽지 않고, 상기 선택은 상기 제2구문부(26)에 의존한다. 존재하는 경우, 상기 복원기(22)는 포워드 앨리어싱 취소 데이터를 이용하여 이전 프레임(14a)의 및 이전 시간 세그먼트(16a) 그리고 현재 시간 세그먼트(16b) 사이에서 포워드 앨리어싱 취소를 수행하도록 구성된다. 이와 같이, 상기 제2구문부가 존재하지 않는 곳에서의 상황과 비교하여, 도1의 디코더는 버릴 필요가 없고, 또는 성공적이지 못하게 파싱을 방해할 필요가 없고, 이전 프레임(14a)의 코딩 모드의 경우에 있어 현재 프레임(14b)은 예를 들어, 프레임 손실 때문에 디코더(10)에 알려지지 않는다. 오히려, 디코더(10)는 현재 프레임(14b)가 포워드 앨리어싱 취소 데이터(34)를 갖는지 아닌지에 대한 여부를 확인하기 위해 상기 제2구문부(26)를 이용할 수 있다. 다른 말로, 상기 제2구문부는 대안들(alternatives) 중의 하나에 대하여 명확한 기준을 제공하고, 즉 존재하거나 존재하지 않는 이전 프레임에 대한 경계의 FAC 데이터, 어떠한 디코더든, 프레임 손실의 경우에 있어서도, 그들의 실시예로부터 관계없이 동일하게 작동한다는 것을 적용하고 확실히 한다. 이와 같이, 상기-요약된 실시예는 프레임 손실의 문제를 극복하기 위한 메커니즘을 소개한다.
더 아래에서 더 자세한 실시예들이 설명되기 전에, 인코더는 도1의 데이터 스트림(12)를 발생시킬 수 있고 각 도2와 함께 설명된다. 도2의 인코더는 일반적으로 도면 부호(40)으로 표시되며 데이터 스트림(12)로 정보 신호를 인코딩하기 위함이며 상기 데이터 스트림(12)는 정보 신호의 시간 세그먼트들(16a 에서 16c)이 각각 코딩되는 프레임들의 시퀀스를 포함한다. 상기 인코더(40)은 생성자(constructor, 42)와 인서터(inserter, 44)를 포함한다. 생성자는 시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 중 먼저 선택된 하나를 이용하여 현재 프레임(14b)의 정보로 정보 신호의 현재 시간 세그먼트(16b)를 코딩하도록 구성된다. 인서터(44)는 제1구문부(24) 및 제2구문부(26)를 따라 현재 프레임(14b)으로 정보(28)을 삽입하도록 구성되며, 여기서 상기 제1구문부는 상기 제1선택(first selection), 즉 상기 코딩 모드의 선택,을 신호한다(시그널링, signal). 생성자(42)는, 차례로, 이전 프레임(14a)의 이전 시간 세그먼트(16a) 및 현재 시간 세그먼트(16b) 사이의 경계에서 포워드 앨리어싱 취소에 대한 포워드 앨리어싱 취소 데이터를 결정하도록 그리고 현재 프레임(14b) 및 이전 프레임(14a)이 시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 중 다른 것들을 이용하여 인코딩되는 경우에 현재 프레임(14b)로 포워드 앨리어싱 취소 데이터(34)를 삽입(insert)하도록 구성되며, 현재 프레임(14b) 및 이전 프레임(14a)가 시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 중 동일한 것들을 이용하여 인코딩 되는 경우에 현재 프레임(14b)로 어떠한 포워드 앨리어싱 취소 데이터를 삽입하는 것을 금한다. 이는, 인코더(40)의 생성자(42)가 선호되는 것을 결정할 때마다, 몇몇 최적화 센스에서, 다른 것에 양 코딩 모드들 중 하나로부터 스위치하기 위함이며, 생성자(42) 및 인서터(44)는 현재 프레임(14b)으로 포워드 앨리어싱 취소 데이터(34)를 결정 및 삽입하도록 구성되며, 반면 프레임들(14a 및 14b) 사이의 코딩 모드를 유지하는 경우, FAC 데이터(34)는 현재 프레임(14b)으로 삽입되지 않는다. 디코더가, 이전 프레임(14a)의 컨텐츠의 지식 없이, FAC 데이터(34)가 현재 프레임(14b) 내에 존재 하는지 아닌지 여부에 대해, 현재 프레임(14b)로부터 유도하는 것을 가능하게 하기 위해, 특정 구문부(26)가 시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 중 동일하거나 다른 것들을 이용하여 현재 프레임(14b) 및 이전 프레임(14a)가 인코딩되는지 여부에 관해 의존하도록 설정된다. 상기 제2구문부(26)을 실현하기 위한 특정 예들은 아래에 간단히 설명될 것이다.
다음에서, 실시예는 상기 설명된 실시예들의 코덱, 디코더 그리고 인코더가 속하는 것에 따라 설명되고, 프레임들(14a 에서 14c) 그 자체로 서브-프레이밍의 대상이 되는 것에 따른 프레임 구조의 특별한 타입을 지지하며, 시간-영역 앨리어싱 취소 변형 코딩 모드의 두 구별되는 버젼이 존재한다. 특히, 이러한 실시예들에 따라 아래에 더 설명되는데, 다음에서 FD(frequency domain) 코딩 모드로 불리는 제1프레임 타입과 함께, 또는 다음에서 LPD 코딩 모드로 불리는 제2프레임 타입과 함께, 상기 제1구문부(24)는 동일한 것이 읽히는 것으로부터 개별 프레임과 연동되며, 그리고, 상기 개별 프레임이 상기 제2프레임 타입인 경우, 제1서브프레임 타입 및 제2서브프레임 타입 중 각각 하나와 함께, 서브 프레임들의 숫자로 구성되는, 개별 프레임의 서브-디비젼(sub-division)의 서브 프레임들(sub-frames)과 연동한다. 아래에 더 자세히 설명될 것처럼, 상기 제1서브프레임 타입은 TCX 코딩될 대응하는 서브프레임들을 수반할 수 있고 반면 상기 제2서브프레임 타입은 ACELP, 즉 적응 코드북 여기 선형 예측(Adaptive Codebook Excitation Linear Prediction),를 이용하여 코딩될 이 각 서브프레임들을 수반할 수 있다. 또한, 어떠한 다른 코드북 여기 선형 예측 코딩 모드(codebook excitation linear prediction coding mode) 또한 이용될 수 있다.
도1의 복원기(22)는 이러한 다른 코딩 모드 가능성들을 다루기 위해 구성된다. 이를 위해, 상기 복원기(22)는 도3에 설명되는 것처럼 구축된다. 도3의 실시예에 따라, 상기 복원기(22)는 두 스위치들(50 및 52) 그리고 각각 아래에서 더 자세히 설명될 특정 타입의 프레임들 및 서브프레임들을 디코딩하도록 구성되는 세 디코딩 모듈들(54, 56 및 58)을 포함한다.
스위치(50)은 현재 디코딩된 프레임(14b)의 정보(28)이 들어가는 곳에서의 입력(input), 그리고 현재 프레임의 제1구문부(25) 상의 의존하여 제어가능한 스위치(50)를 통하는 제어 입력(control input)을 갖는다. 스위치(50)은 그 중 하나가 FD 코딩(FD = frequency domain(주파수 영역))에 원인이 있는 디코딩 모듈(54)의 입력에 연결되는 두 출력(two outputs)을 가지며, 그 중 다른 하나는 역시 변형 코딩된 여기 선형 예측 디코딩에 원인이 되는 입력 디코딩 모듈(56)에 연결되고, 다른 하나는 코드북 여기 선형 예측 디코딩의 원인이 되는 모듈(58)의 입력에 연결된다. 모든 코딩 모듈들(54 에서 58)은 개별 디코딩 모드에 의해 유도된 이러한 신호 세그먼트들로부터 개별 프레임들 및 서브-프레임들과 연동된 개별 시간 세그먼트들을 복원하는 신호 세그먼트들을 출력하고, 트랜지션 핸들러(transition handler, 60)은 트랜지션 핸들링과 위에서 설명된 그리고 아래에서 더 자세히 설명된 앨리어싱 취소를 수행하기 위해 그리고 그것의 상기 복원된 정보 신호의 출력에서 출력하기 위해 그것의 개별 입력들에서 신호 세그먼트들을 수신한다. 트랜지션 핸들러(60)은 도3에 도시된대로 상기 포워드 앨리어싱 취소 데이터(34)를 이용한다.
도3의 실시예에 따라, 복원기(22)은 다음에 따라 작동한다. 제1구문부(24)가 제1프레임 타입, FD 코딩 모드,와 현재 프레임을 연동시키는 경우, 현재 프레임(15b)와 연동하는 시간 세그먼트(16b)를 복원하기 위한 시간-영역 앨리어싱 취소 변형 디코딩 모드의 제1버젼에 따라주파수 영역 디코딩을 이용하기 위해 스위치(50)는 정보(information, 28)를 FD 디코딩 모듈(54)로 보낸다. 그렇지 않으면, 즉 만약 제1구문부(24)가 현재 프레임(14b)와 제2프레임 타입, LPD 코딩 모드,을 연동시키는 경우, 스위치(50)은 정보(28)를 서브-스위치(52)로 보내고, 차례로, 현재 프레임(14)의 서브-프레임 구조 상에서 작동한다. 더 정확히 하자면, LPD 모드에 따라, 프레임은 하나 또는 그 이상의 서브-프레임들로 나누어지고, 상기 서브-디비젼(sub-division)은 다음 도면들의 관점에서 더 자세히 아래에 설명되는 것처럼 현재 시간 세그먼트(16b)의 비-오버랩핑 서브-포션들(un-overlapping sub-portions)에 대응하는 서브-디비젼(sub-division)에 대응한다. 상기 구문부(24)는 동일한 것이 제1 또는 제2서브-프레임 타입과, 각각, 연동하는지 여부에 대해 하나 또는 그 이상의 서브-포션들 각각에 대해 신호를 보낸다. 개별 서브-프레임이 상기 제1서브-프레임 타입인 경우, 변형 코딩 여기 선형 예측 디코딩(transform coded excitation linear prediction decoding)을 현재 시간 세그먼트(16b)의 개별 서브-포션을 복원하기 위한 시간-영역 앨리어싱 취소 변형 디코딩 모드의 제2버젼으로 이용하기 위해 서브-스위치(52)는 그 서브-프레임에 속한 개별 정보(28)를 TCX 디코딩 모듈(56)으로 보낸다. 만약, 그러나, 상기 개별 서브-프레임이 상기 제2서브-프레임 타입인 경우, 코드북 여기 선형 예측 코딩을 현재 시간 신호(16b)의 개별 서브-포션을 복원하기 위한 시간-영역 디코딩 모드로 수행하도록 서브-스위치(52)는 상기 정보(28)을 모듈(58)로 보낸다.
모듈들(53 에서 58)에 의해 출력된 상기 복원된 신호 세그먼트들은 위에서 설명되고 아래에서 더 자세히 설명되는 것처럼 개별 트랜지션 핸들링 및 오버랩-애드 및 시간-영역 앨리어싱 취소 프로세싱을 수행하는 것과 동시에 알맞은 (표현) 시간 순서로 트랜지션 핸들러(60)에 의해 함께 넣어진다.
특히, 상기 FD 디코딩 모듈(54)는 도4에 보여지는 것처럼 구성될 수 있고 아래에 설명되는 것처럼 작동될 수 있다. 도4에 따라, FD 디코딩 모듈(54)는 서로 연속적으로 연결된 비-양자화기(de-quantizer, 70) 및 재-변형기(re-transformer, 72)를 포함한다. 위에서 설명되는 것처럼, 만약 현재 프레임(14b)가 FD 프레임인 경우, 동일한 것이 모듈(54)로 보내지고 장치-양자화기(device-quantizer, 70)는 정보(28)에 의해 또한 포함되는 스케일 팩터 정보(76)을 이용하여 현재 프레임(14b)의 정보(28) 내에서 변형 계수 정보(74)의 스펙트럼 변화 비-양자화(spectral varying de-quantization)를 수행한다. 상기 스케일 팩터들은, 예를 들어, 휴먼 마스킹 임계(human masking threshold) 밑의 양자화 노이즈를 유지하는 것에 대한 심리 음향학 원리를 이용하여, 인코더 측면에서 결정되었다.
재-변형기(72)는 그 후 현재 프레임(14b)와 연동된 시간 세그먼트(16b)를 넘어, 시간상으로, 연장하는 재-변형된 신호 세그먼트(78)을 얻기 위해 비-양자화된 변형 계수 정보 상에서 재-변형을 수행한다. 아래에서 더 자세히 설명되는 것처럼, 재-변형기(72)에 의해 수행되는 재-변형은 언폴딩 작업(unfolding operation)이 뒤따르는 DCT IV 를 포함하는 IMDCT(역 수정 개별 코사인 변형, Inverse Modified Discrete Cosine Transform)일 수 있고 여기서 역 순서로, 즉 윈도우잉은 마스킹 임계 아래의 양자화 노이즈를 유지하기 위해 심리 음향학 원리들에 의해 조종될 수 있는 양자화가 뒤따르는 DCT IV가 이어지는 폴딩 작업(folding operation)에 잇달아 오며, 이전에 언급된 단계들을 수행하는 것에 의해 변형 계수 정보(74)를 발생시키는 데 이용된 변형 윈도우로부터 벗어나거나 동일할 지 모르는 재-변형 윈도우를 이용하여 윈도우잉(windowing)이 수행된 후이다.
변형 계수 정보(28)의 양은 재-변형기(72)의 재-변형의 TDAC 특성 때문에, 복원된 신호 세그먼트(78)가 긴(long) 샘플들의 숫자보다 더 적다는 것을 아는 것은 의미가 있다. IMDCT 의 경우에, 정보(47) 내에서 변형 계수들의 숫자는 오히려 시간 세그먼트(16b)의 샘플들의 숫자에 동일하다. 그것은, 근본적인 변형은 경계에서의, 즉 현재 시간 세그먼트(16b)의 리딩과 트레일링 엣지들에서의, 변형 때문에 일어나는 앨리어싱을 취소하기 위해 시간-영역 앨리어싱 취소를 필요로하게 하는 결정적인 샘플링 변형으로 불릴 수 있다는 것이다.
소소하게 주목해야 할 점으로, LPD 프레임들의 서브-프레임 구조에 유사하다는 것과, FD 프레임들 또한 서브-프레이밍 구조의 대상이 될 수 있다는 것이 알려져야 한다. 예를 들어, FD 프레임들은, 개별 시간 세그먼트를 코딩하기 위해 단일 윈도우가 현재 시간 세그먼트의 리딩 및 트레일링 엣지를 넘어 연장하는 신호 포션(signal portion)을 윈도우잉(window)하기 위해 이용되는 긴 윈도우 모드가 될 수 있고, 또는 개별적으로 각각 윈도우잉 및 변형의 대상이 되는 더 작은 서브-포션들로 세분되는 FD 프레임의 현재 시간 세그먼트의 경계들을 넘어 연장하는 개별 신호 포션에서 짧은 윈도우 모드일 수도 있다. 그러한 경우에, FD 코딩 모듈(54)는 현재 시간 세그먼트(16b)의 서브-포션에 대한 재-변형된 신호 세그먼트를 출력할 것이다.
FD 코딩 모듈(54)의 가능한 실시예가 설명된 후에, TCX LP 디코딩 모듈 및 코드북 여기 LP 디코딩 모듈(56 및 58)의 가능한 실시예가, 각각, 도5에서 설명된다. 다른 말로, 도5는 현재 프레임이 LPD 프레임인 경우를 다룬다. 그러한 경우, 현재 프레임(14b)은 하나 또는 그 이상의 서브-프레임들로 구축된다. 세개의 서브프레임들(90a, 90b, 및 90c)로 구축되는 현재의 경우가 도시된다. 구조가, 기본적으로, 특정 서브-구조 가능성들(certain sub-structuring possibilities)에 제한될 수 있다. 서브-포션들 각각은 현재 시간 세그먼트(16b)의 서브-포션들(92a, 92b 및 92c) 중 개별적 하나와 연동된다. 그것은, 오버랩 없이, 전체 시간 세그먼트(16b)를 갭 없이 커버하는 하나 또는 그 이상의 서브-포션들(92a 에서 92c)이다. 시간 세그먼트(16b) 내에서 서브-포션들(92a 에서 92c)의 순서에 따라, 시퀀스 순서는 서브 프레임들(92a 에서 92c) 중에서 정의된다. 도5에 보여지는 대로, 현재 프레임(14b)는 서브프레임들(90a 에서 90c)로 완전히 세분되지 않는다. 다른 말로, 비록 LPC 정보는 개별 서브-프레임들로 서브-구조화 될수도 있지만, 현재 프레임(14b)의 몇몇 포션들은 일반적으로 제1 및 제2구문부(24 및 26), FAC 데이터(34) 및 잠재적으로 LPC 정보와 같은 아래에 더 자세히 설명될 추가 데이터 같은 모든 서브-프레임들에 속한다.
TCX 서브-프레임들을 다루기 위해 TCX LP 디코딩 모듈(56)은 스펙트럼 가중 유도기(94), 스펙트럼 가중기(96) 및 재-변형기998)을 포함한다. 목적의 설명을 위해, 상기 제1서브-프레임(90a)는 TCX 서브-프레임이 되는 것으로 보여지며, 반면 제2서브-프레임(90b)는 ACELP 서브-프레임으로 가정된다.
TCX 서브-프레임(90a)를 처리하기 위해, 유도기994)는 현재 프레임(14b)의 정보(28) 내에서 LPC 정보(104)로부터 스펙트럼 가중 필터를 유도하며, 스펙트럼 가중기(96)은 화살표(106)로 보여지는 것처럼 유도기994)로부터 수신된 스펙트럼 가중 필터를 이용하여 서브-프레임(90a)의 관점 내에서 변형 계수 정보를 스펙트럼적으로 가중한다.
재-변환기(98)은, 차례로, 현재 시간 세그먼트의 서브-포션(92a)를 넘어, 시간 t 상에서, 연장하는 재-변형된 신호 세그먼트(108)을 얻기 위하여 스펙트럼적으로 가중된 변형 계수 정보를 재-변형한다. 재-변형기(98)에 의해 수행되는 상기 재-변형은 재-변형기(72)에 의해 수행되는 것과 동일할 수 있다. 사실상, 재-변형기(72 및 98)는 하드웨어, 소프트웨어-루틴 또는 일반적으로 프로그램 가능한 하드웨어 부분을 가질 수 있다.
현재 LPD 프레임(16b)의 정보(28)에 의해 포함되는 LPC 정보(104)는 시간 세그먼트(16b) 내에 또는 각 서브-포션(92a 에서 92c)에 대한 LPC 계수들의 하나의 집합처럼 시간 세그먼트(16b) 내에 몇몇 시간 인스턴스들(time instances)에 대하여 즉각적인 한번의 LPC 계수를 나타낼 수 있다. 스펙트럼 가중 필터 유도기(94)는 동일하게 LPC 합성 필터 또는 그것의 몇몇 수정된 버젼을 실질적으로 근사하는 유도기(94)에 의해 LPC 계수들로부터 유도되는 이송 기능(transfer function)에 따라 정보(90a) 내에 변형 계수들을 스펙트럼적으로 가중하는 스펙트럼 가중 인자(spectral weighting factors)들로 LPC 계수들을 변환한다. 가중기(96)에 의해 스펙트럼 가중을 넘어 수행되는 어떠한 비-양자화는 스펙트럼적으로 불변일 수 있다. 따라서, FD 디코딩 모드로부터 달라지면, TCX 코딩 모드에 따른 양자화 노이즈는 스펙트럼적으로 LPC 분석을 이용하여 형성된다.
재-변형의 이용 때문에, 그러나, 재-변형된 신호 세그먼트(108)은 앨리어싱으로부터 시달리게 된다. 동일한 재-변형을 이용하는 것에 의해, 그러나 연속 프레임들 및 서브-프레임들의 재-변형 신호 세그먼트들(78 및 108)은, 각각, 그들을 오버랩핑하는 부분들(포션들, portions)을 단지 애딩(추가, adding)하는 것으로 트랜지션 핸들러(60)에 의해 취소되는 그들의 앨리어싱을 가질 수 있다.
(A)CELP 서브-프레임들(90b)의 처리에 있어서, 여기 신호 유도기(excitation signal derivator, 100)는 개별 서브프레임(90b) 여기 업데이트 정보(excitation update information)로부터 여기 신호를 유도하며 LPC 합성 필터(102)는 현재 시간 세그먼트(16b)의 서브-포션(92b)에 대해 LP 합성된 신호 세그먼트(110)dmf 얻기 위해 LPC 정보(104)를 이용하여 여기 신호 상에서 LPC 합성 필터링을 수행한다.
유도기들(94 및 100)은 현재 시간 세그먼트(16b) 내에 현재 서브-포션에 대응하는 현재 서브-프레임의 변화 위치에 대해 현재 프레임(16b) 내의 LPC 정보(104)를 적용시키기 위해 몇몇 보간(interpolation)을 수행하도록 구성될 수 있다.
일반적으로 도3 내지 5를 설명할 때, 다양한 신호 세그먼트들(108, 110 및 78)은 정확한 시간 순서로 모든 신호 세그먼트들을 함께 넣는 트랜지션 핸들러(60)를 시작한다. 따라서, 연속적인 FD 프레임들 사이의 경계들, TCX 프레임이 뒤따르는 FD 프레임들 및 FD 프레임들이 뒤따르는 TCX 서브-프레임들 사이의 경계에 대한 포워드 앨리어싱 취소 데이터가 필요가 없다.
그러나, FD 프레임 또는 TCX 서브-프레임(양쪽 모두 변형 코딩 모드 불변을 나타낸다)이 (시간 영역 코딩 모드의 형성을 나타내는) ACELP 서브-프레임을 진행할 때마다 상황은 변환다. 그러한 경우, 트랜지션 핸들러(16)은 포워드 앨리어싱 취소 데이터로부터 현재 프레임으로부터 포워드 앨리어싱 취소 합성 신호를 유도하며 개별 경계를 넘는 정보 신호를 복원하기 위해 즉시 진행하는 시간 세그먼트의 복원된 신호 세그먼트(100 또는 78)에 제1포워드 앨리어싱 취소 합성 신호를 추가(애드, add)한다. 현재 프레임 내의 TCX 서브-프레임 및 ACELP 서브-프레임이 연동된 시간 세그먼트 서브-포션들 사이의 경계를 정의하기 때문에 만약 경계가 현재 시간 세그먼트(16b)의 내부로 떨어지는(fall) 경우, 트랜지션 핸들러는 그것에 정의된 제1구문부(24) 및 서브-프레이밍 구조로부터 이러한 트랜지션들에 대한 개별 포워드 앨리어싱 취소 데이터의 존재를 확인할 수 있다. 상기 구문부(26)는 필요하지 않다. 이전 프레임(14a)는 손실되었을 수도 아닐수도 있다.
그러나, 연속적인 시간 세그먼트들(16a 및 16b) 사이의 경계와 일치하는 경계의 경우, 파서(20)은 현재 프레임(14b)이 포워드 앨리어싱 취소 데이터(34)를 갖는지 여부를 결정하기 위해 현재 프레임 내의 제2구문부(26)을 조사해야 하고, FAC 데이터(34)는 현재 시간 세그먼트(16b)의 리딩 엔드(leading end)에서 일어나는 취소 앨리어싱에 대한 것이며, 이는 이전 프레임이 FD 프레임이이거나 또는 진행하는 LPD 프레임의 마지막 서브-프레임이 TCX 서브-프레임이기 때문이다. 적어도, 파서(20)은, 이전 프레임의 컨텐츠가 손실된 경우에, 구문부(26)를 알 필요가 있다. 유사한 서술들(statements)이 다른 방향으로, 즉 ACELP 서브-프레임들로부터 FD 프레임들 또는 TCX 프레임들로, 트랜지션들에 대해 적용된다. 개별 세그먼트들과 세그먼트 서브-포션들 사이의 개별 경계들이 현재 시간 세그먼트의 내부로 떨어지는(fall) 한, 파서(20)는 현재 프레임(14b) 그 자체로부터, 즉 상기 제1구문부(24)로부터, 이러한 트랜지션들에 대한 포워드 앨리어싱 취소 데이터(34)의 존재를 결정하는데 문제가 없다. 상기 제2구문부는 필요없고 심지어 무관하다. 그러나, 상기 경계가, 이전 시간 세그먼트(16a) 및 현재 시간 세그먼트(16b) 사이의 경계에서 일어나거나, 또는 일치할 때, 파서(20)는 포워드 앨리어싱 취소 데이터(34)가 현재 시간 세그먼트(16b)의 리딩 엔드에서 트랜지션에 대해 존재하거나 존재하지 않는지 여부를, 적어도 이전 프레임에 엑세스가 없는 경우에, 결정하기 위해 상기 제2구문부(26)를 조사할 필요가 있다.
ACELP 에서 FD 또는 TCX 로의 트랜지션의 경우, 트랜지션 핸들러(60)은 포워드 앨리어싱 취소 데이터(34)로부터 제2포워드 앨리어싱 취소 합성 신호를 유도하며 제2포워드 앨리어싱 취소 합성 신호를 현재 시간 세그먼트 내의 재-변형된 신호 세그먼트에 애드(add)하며 이는 경계를 넘는 정보 신호를 복원하기 위함이다.
도3 내지 도5의 설명된 실시예 후에, 이는 다른 코딩 모드들이 존재하는 프레임들 및 서브프레임들에 따른 실시예를 일반적으로 언급하며, 이러한 실시예들의 특정 실행은 아래에서 더 자세히 서술될 것이다. 이러한 실시예들의 설명은 각각, 프레임들 및 서브-프레임들을 포함하는 개별 데이터 스트림을 발생시키는 가능한 방법들을 동시에 포함한다. 다음에서, 비록 그 원리가 다른 신호들로 이송 가능하다고 설명될지라도, 이러한 특정 실시예는 통합 스피치 및 오디오 코덱(USAC)으로 설명된다.
USAC 에서의 윈도우 스위칭은 몇몇 목적들을 갖는다. 그것은 FD 프레임들, 즉 주파수로 인코딩된 프레임들을 코딩하는 것, 그리고LPD 프레임들을 섞으며, 이들은 차례로, ACELP (서브-) 프레임들 및 TCX (서브-) 프레임들로 구조화된다. ACELP 프레임들( 시간-영역 코딩)은 직사각형을 적용하며, TCX 프레임들이(주파수-영역 코딩) 비-직사각형을 적용하는 동안 샘플들을 입력하 위해 논-오버랩핑 윈도우잉(non-overlapping windowing) 하며, 샘플들을 입력하기 위해 오버랩핑 윈도우잉(overlapping windowing)하고 그 후 시간-영역 앨리어싱 취소(TDAC) 변형을 이용하여 신호를 인코딩, 즉 예를 들어, MDCT 한다. 전체 윈도우들을 조화(하모나이즈, harmonize)시키기 위해, TCX 프레임들은 동질 형태를 갖는 집중된 윈도우들을 이용할 수 있고, ACELP 프레임 경계들에서 트랜지션들을 관리하기 위해, 시간-영역 앨리어싱의 취소를 위한 명백한 정보와 전송되는 조화된 TCX 윈도우들의 윈도우잉 효과를 이용할 수 있다. 이 추가 정보는 포워드 앨리어싱 취소(FAC) 에서 보여질 수 있다. FAC 의 양자화 노이즈들과 디코딩된 MDCT가 동일한 특성이도록 FAC 데이터는 LPC 가중 영역(LPC weighted domain)에서 다음 실시예들로 양자화된다.
도6은 변형 코딩(TC)과 함께 인코딩 된 프레임(120)의 인코더에서 프로세싱하는 것을 보여주며, 이는 ACELP와 함께 인코딩된 프레임(122, 124)에 선행하고 후행한다. 상기 논의에서, TC의 개념은 AAC를 이용한 길고 짧은 블록들을 넘는 MDCT 뿐만 아니라, TCX 에 기반한 MDCT 도 포함한다. 그것은, 예를 들어, 도5에서의 서브-프레임(90a, 92a) 처럼 프레임(120)은 FD 프레임 또는 TCX (서브-) 프레임 중 하나가 될 수 있다는 것이다. 도6은 시간-영역 마커들 및 프레임 경계들을 보여준다. 시간-영역 마커들이 수평 축들을 따라가는 짧은 수직 라인들인 동안 프레임 또는 시간 세그먼트 경계들은 점선들로 표시된다. "시간 세그먼트 및 프레임" 용어는 그 사이의 고유한 연동 때문에 때때로 동의어적으로 사용된다는 것이 다음 설명에서 언급되어야 한다.
따라서, 도6의 상기 수직 점선들은 프레임(120)의 시작과 끝을 보여주며 이는 서브-프레임/시간 세그먼트 서브파트(subpart) 또는 프레임/시간 세그먼트가 될 수 있다. LPC1 및 LPC2 는 LPC 필터 계수들 또는 LPC 필터에 대응하는 분석 윈도우의 중심을 나타낼 것이며 이는 앨리어싱 취소를 수행하기 위해 다음에서 이용된다. 이러한 필터 계수들은, 예를 들어, LPC 정보(104)(도5 참조)를 이용하는 보간의 이용에 의해 복원기(22) 또는 유도기(90 및 100)에 의해 디코더에서 유도된다. 상기 LPC 필터들은 다음을 포함한다.: 프레임(120)의 시작에서 그것의 계산에 대응하는 LPC1, 프레임(120)의 끝에서 그것의 계산에 대응하는 LPC2. 프레임(122)는 ACELP로 인코딩된 것으로 가정된다. 동일한 것이 프레임(124)에 적용된다.
도6은 도6의 오른쪽 측면에서 번호가 붙여진 네 라인들로 구조화된다. 각 라인은 인코더에서 프로세싱의 단계를 나타낸다. 그것은 각 라인이 위의 라인(line above)과 함께 정렬된 시간이라는 것으로 이해된다.
도6의 라인1은, 상기 언급된 프레임들(122, 120 및 124)의 세그먼티드(세그먼트화된, segmented), 원래 오디오 신호를 나타낸다. 이런 이유로, "LPC1"의 마커(marker)의 왼쪽에서, 원래 신호는 ACELP로 인코딩된다. "LPC1" 및 "LPC2" 마커들 사이에서, 원래 신호는 TC를 이용하여 인코딩된다. 상기 설명된대로, TC에서 노이즈 형태는 시간 영역에서보다 변형 영역에서 직접적으로 적용된다. 마커 LPC2의 오른쪽에 대해, 원래 신호는 다시 ACELP로, 즉 시간 영역 모드로, 인코딩된다. 코딩 모드들의 시퀀스(ACELP 이후 TC 이후 ACELP)는 FAC 에서 프로세싱을 나타내기 위해 선택되며 이는 FAC가 양 트랜지션들(ACELP to TC 그리고 TC to ACELP)와 관련되기 때문이다.
그러나, 도6의 LPC1 및 LPC2에서 트랜지션들이 현재 시간 세그먼트들의 내부에서 일어날 수 있거나 또는 그것의 리딩 엔드(leading end)와 일치할 수 있다는 것에 주목해야 한다. 처음의 경우에, 연동된 FAC 데이터의 존재의 결정은 단지 상기 제1구문부(24)에 기반한 파서(20)에 의해 수행될 수 있고, 반면 프레임 손실의 경우에, 파서(20)은 나중 경우에서 그렇게 하기 위해 상기 구문부(26)을 필요로 할 수 있다.
도6의 라인2는 프레임들(122, 120 및 124) 각각에서 디코딩된(합성된) 신호들에 대응한다. 따라서, 도5의 레퍼런스 사인(110)은 프레임(122)의 마지막 서브-포션이 도5의 92b 같은 ACELP 인코딩된 서브-포션일 가능성과 대응하는 프레임(122) 내에서 이용되며, 그동안 레퍼런스 사인 조합(reference sign combination) (108/78)은 도5및 4에 유사한, 표시된 프레임(120)에 대한 신호 분배를 위해 이용된다. 다시, 마커 LPC1의 왼쪽에서, 프레임(122)의 합성은 ACELP로 인코딩되었다고 가정된다. 이런 이유로, 마커 LPC1 의 왼쪽에서 상기 합성 신호(110)는 ACELP 합성 신호처럼 식별된다. 원칙적으로, ACELP는 가능한 정확히 웨이브 형태를 인코딩하도록 처리하기 때문에 ACELP 합성 및 원래 신호 사이의 높은 유사성이 있다. 그 후, 도6의 라인2 상에서 마커들 LPC1 및 LPC2 사이의 세그먼트는 디코더에서 보여지는 세그먼트(120)의 역 MDCT 의 출력을 나타낸다. 다시, 세그먼트(120)은, 예를 들어, 도5에서 90b같은, TCX 코딩된 서브-프레임의 서브-포션 또는 FD 프레임의 시간 세그먼트 (16b)일 수 있다. 도면에서, 이러한 세그먼트(108/78)은 "TC 프레임 출력"("TC frame output")으로 명명된다. 도4 및 5에서, 이 세그먼트는 재-변형된 신호 세그먼트로 불린다. 프레임/세그먼트(120)이 TCX 세그먼트 서브파트인 경우에, 상기 TC 프레임은 재-윈도우된 TLP 합성 신호를 나타내며, 여기서 TLP는 TCX의 경우 그것을 나타내기 위한 "Transform-coding with Linear Prediction" 을 나타내며, 개별 세그먼트의 노이즈 형태는 LPC 필터들 LPC1 및 LPC2로부터 스펙트럼 정보를 이용하여 MDCT 계수들 필터링에 의해 변형 영역에서 달성되며, 그것은 스펙트럼 가중기(96)에 관해 도5에서 위에서 설명된다. 도6의 라인2 상의 마커들 "LPC1" 및 "LPC2" 사이의 합성 신호, 즉 앨리어싱을 포함하는 예비로 복원된 신호, 즉 신호(108/78)는 윈도우잉 효과들과 그 시작 밑 끝에서의 시간-영역 앨리어싱을 포함한다. TDAC 변형에 따른 MDCT의 경우에, 시간-영역 앨리어싱은 각각, 언폴딩들(unfoldings, 126a 및 126b)일 수 있다. 다른 말로, 세그먼트(120)의 시작에서 끝으로 연장하는 도6의 라인2에서 상측 커브는 도면부호(108/78)로 표시되며, 변형 윈도우잉 때문에 변하지 않은 변형 신호를 남기기 위해 중간(in the middle)에서 플랫(flat)인 윈도우잉 효과를 보여주며, 다만 시작(비기닝, beginning) 및 끝(엔드, end)에서는 아니다. 상기 언폴딩 효과는 세그먼트의 끝에서 플러스 표시 그리고 세그먼트의 시작에서는 마이너스 표시로 세그먼트(120)의 시작 및 끝에서 더 낮은(lower) 커브들(126a 및 126b)에 의해 보여진다. 이 윈도우잉 및 시간-영역 앨리어싱 (또는 폴딩) 효과는 TDAC 변형들에 대한 명백한 예들로 기능하는 MDCT에 내재한다. 상기 앨리어싱은 두 연속한 프레임들이 MDCT를 이용하여 상기 설명된대로 인코딩 될 때 취소될 수 있다. 그러나, 다른 MDCT 프레임들이 "MDCT 코딩된" 프레임(120)을 선행(preceded) 및/또는 후행(followed)하지 않는 경우, 그것의 윈도우잉 및 시간-영역 앨리어싱은 취소되지 않고 역 MDCT 이후 시간-영역 신호에 남아있는다. 포워드 앨리어싱 취소(FAC)가 상기 설명된 것처럼 이러한 효과들을 수정하기 위해 이용될 수 있다. 결국, 도6의 마커 LPC2 후의 상기 세그먼트(124)는 ACELP를 이용하여 인코딩 되는 것으로 가정된다. 그러한 프레임들에서 합성 신호를 얻기 위해, LPC 필터(102)(도5 참조)의 필터 상태들(filter states), 즉 프레임(124)의 시작에서, 장기 및 단기 예측기들의 메모리,는 적절하게 자기 자신이어야 하며 이는 마커 LPC1 및 LPC2 사이의 이전 프레임(120)의 끝에서 시간-앨리어싱 및 윈도우잉 효과들이 아래에서 설명될 특정 방법으로 FAC 응용에 의해 취소되어야 한다는 것을 내포한다는 것에 주목해야 한다. 요약을 위해, 도6의 라인2는 연속 프레임들(122, 120 및 124)로부터 예비로 예비로 복원된 신호들의 합성을 함유하고, 마커들 LPC1 및 LPC2 사이의 프레임들에 대한 역 MDCT의 출력에서 시간-영역 앨리어싱의 윈도우잉 효과를 포함한다. 도6의 라인3을 얻기 위해, 도6의 라인1 사이의 차이, 즉 원래 오디오 신호(18)에서, 그리고 도6의 라인2, 즉 합성 신호들 (110) 및 (108/78)은, 각각, 위에서 설명된 대로, 계산된다. 이는 제1차이 신호(128)를 산출한다.
프레임(120) 관련 인코더 측면에서 추가 프로세싱은 도6의 라인 3에 대해 다음에 설명된다. 프레임(120)의 시작에서, 처음으로, 도6의 라인2 상에서 마커 LPC1의 왼쪽에서 ACELP 합성(110)으로부터 취해지는 두개의 기여들(contributions)은, 다음에 따라 서로에게 더해진다:
상기 제1기여(130)는 마지막 ACELP 합성 샘플들의 윈도우되고 (폴딩된) 시간-역전 버젼이고, 즉 도5에 보여진 시간 세그먼트(110)의 마지막 샘플들이다. 이 시간-역전 신호에 대한 윈도우 길이 및 형태는 프레임(120)의 왼쪽에 대한 변형 윈도우의 앨리어싱 파트와 같다. 이 기여(130)는 도6의 라인2의 MDCT 프레임(120)에 존재하는 시간-영역 앨리어싱의 좋은 근사처럼 보일 수 있다.
상기 제2기여(132)는 ACELP 합성(110)의 끝, 즉 프레임(122)의 끝에서, 이 필터의 최종 상태들에 따라 취해진 초기 상태를 갖는 LPC1 합성 필터의 윈도우된 제로-입력 응답(zero-input response, ZIR)이다. 이 제2기여의 윈도우 길이 및 형태는 상기 제1기여(130)과 동일할 수 있다.
도6에서 새로운 라인3과 함께, 즉 위의 두 기여들(130 및 132)을 추가한 후에, 새로운 차이들이 도6의 라인4를 얻기 위해 인코더에 의해 취해진다. 마커 LPC2에서 상기 차이 신호(134)가 멈춘다는 것에 주목하자. 시간 영역에서 에러 신호의 예측된 포락선(envelope)의 근사적 관점은 도6의 라인4 상에서 보여진다. ACELP 프레임(122)에서의 에러는 시간-영역에서의 진폭에서 근사적으로 플랫(flat)할 것이라 예측된다. 그 후, TC 프레임(120)에서의 에러는 일반적인 형태, 즉 시간-영역 포락선을 내보이도록 예측되며, 이는 도6의 라인4의 이 세그먼트(120)에 보여지는대로이다. 상기 에러 진폭의 이 예측된 형태는 설명의 목적들을 위해서만 여기서 보여진다.
상기 디코더가 디코딩된 오디오 신호를 생성 또는 복원하도록 하는 도6의 라인3의 합성 신호들만을 이용하도록 되어 있는 경우, 그 후 상기 양자화 노이즈는 도6의 라인4 상에서 에러 신호의 예측된 포락선처럼 전형적으로 될것이다. 그것은 따라서 TC 프레임(120)의 시작 및 끝에서 이 에러를 보상하기 위해 상기 디코더에 수정(correction)이 보내져야 한다고 이해된다. 이 에러는 MDCT/역 MDCT 쌍에 내재한 윈도우잉 및 시간-영역 앨리어싱 효과들로부터 온다. 상기 윈도우잉 및 시간-영역 앨리어싱은 위에서 언급된 것처럼 이전 ACELP 프레임(122)로부터 튜브 기여들(132 및 130)을 추가하는 것에 의해 TC 프레임(120)의 시작에서 감소되었으나, 연속 MDCT 프레임들의 실제 TDAC 작업에서처럼 완벽하게 취소되지는 못한다. 마커 LPC2 바로 직전의 도6의 라인4 상의 TC 프레임(120)의 오른쪽에서, 모든 윈도우잉 및 시간-영역 앨리어싱은 MDCT/역 MDCT 쌍으로부터 남아있고, 따라서, 포워드 앨리어싱 취소에 의해 완전히 취소되어야 한다.
포워드 앨리어싱 취소 데이터를 얻기 위해 인코딩 프로세스를 설명하는 것을 진행하기에 앞서, TDAC 변형 프로세싱의 하나의 예에 따라 간략하기 MDCT를 설명하기 위해 도7에 대한 레퍼런스가 만들어진다. 양 변형 방향들은 도7에 관해 묘사되고 설명된다. 시간-영역에서 변형-영역으로의 트랜지션은 도7의 상측 반쪽에서 설명되고, 반면 재-변형은 도7의 하측 반쪽에서 설명된다.
시간-영역에서 변형-영역으로의 트랜지셔닝(transitioning)에 있어, 상기 TDAC 변형은 데이터 스트림 내에서 실제적으로 전송될 나중의 결과 변형 계수들에 대한 시간 세그먼트(154)를 넘어 연장하는 변형된 신호의 인터벌(interval, 152)에 적용되는 윈도우잉(150)을 포함한다. 윈도우잉(150)에 적용되는 상기 윈도우는 시간 세그먼트(154)의 리딩 엔드(leading end)를 가로지르는 앨리어싱 파트(aliasing part) Lk 및 시간 세그먼트(154)의 리어 엔드(rear end)에서 앨리어싱 파트 Rk 를 그들 사이에서 연장하는 논-앨리어싱 파트 Mk 와 함께 포함하며 도7에 보여진다. MDCT(156)은 상기 윈도우된 신호에 적용된다. 그것은, 폴딩(158)이 시간 세그먼트(154)의 좌측(left hand) (리딩) 경계를 거꾸로 따라 시간 세그먼트(154)의 리딩 엔드 및 인터벌(152)의 리딩 엔드 사이에서 연장하는 인터벌(152)의 사분의 일을 폴드(fold)하기 위해 수행된다. 동일한 것이 앨리어싱 포션 Rk에 대해 수행된다. 그 뒤에, DCT IV (160)은 동일한 숫자의 변형 계수들을 얻기 위해 시간 신호(154)만큼 많은 샘플들을 갖는 윈도우되고(windowed) 폴딩된(folded) 신호 상에서 수행된다. 컨버세이션(conversation)은 그 후 (162)에서 수행된다. 일반적으로, 양자화(162)는 TDAC 변형에 의해 포함되지 않은 것처럼 보일 수 있다.
재-변형은 역으로 수행한다. 그것은, 비-양자화(164)를 따라, IMDCT(166)은 복원될 시간 세그먼트(154)의 시간 세그먼트의 샘플들의 숫자와 동일한 숫자의 시간 샘플들을 얻기 위해, 맨 처음, DCT-1 IV (168)을 포함하여 수행된다는 것이다. 그후에, 언폴딩 프로세스(168)는 앨리어싱 포션들의 길이를 두배로(doubling) 하는 것에 의해 IMDCT 결과의 시간 샘플들의 숫자 또는 시간 인터벌을 연장하는 모듈(168)로부터 수신되는 역으로 변형된 신호 포션 상에서 수행된다. 그 후, 윈도우잉은 (170)에서 수행되고, 재-변형 윈도우(172)를 이용하는데 윈도우잉(150)에 의해 이용된 하나와 같을 수 있고, 또한 다를 수도 있다. 도7에서의 남아있는 블록들은 TDAC 또는 연속 세그먼트들(154)의 오버랩핑 포션들에서 수행되는 오버랩/애드 프로세싱, 즉 도3의 트랜지션 핸들러에 의해 수행되는 것처럼, 거기에서의 언폴딩 앨리어싱 포션들의 애딩(adding),을 도시한다. 도7에서 도시되는 대로, 블록들(172 및 174)에 의한 TDAC는 앨리어싱 취소를 도출한다.
도6의 설명은 이제 더 진행한다. 도6의 라인4 상에서 TC 프레임(120)의 시작과 끝에서 윈도우잉 및 시간-영역 앨리어싱 효과들을 효율적으로 보상하기 위해, TC 프레임(120)이 주파수-영역 노이즈 쉐이핑(frequency-domain noise shaping, FDNS)을 이용하며, 포워드 앨리어싱 수정(forward aliasing correction, FAC)이 도8에서 설명되는 프로세싱을 따라 적용된다고 가정하자. 먼저, 양쪽 모두, 마커 LPC1 주변 TC 프레임(120)의 왼쪽 부분, 그리고 마커 LPC2 주변 TC 프레임(120)의 오른쪽 부분에 대한 프로세싱을 설명하는 것이 주목되어야 한다. LPC1 마커 경계에서 ACELP 프레임(122)를 선행하는 그리고 LPC2 마커 경계에서 ACELP 프레임(124)를 뒤따르는 것으로 가정된 것처럼 도6에서의 TC 프레임(120)을 다시 떠올리자.
마커 LPC1 주변 윈도우잉 및 시간-영역 앨리어싱 효과들을 보상하기 위해, 프로세싱들이 도8에서 설명된다. 먼저, 가중 필터 W(z)가 LPC1 필터로부터 계산된다. 가중 필터 W(z)는 LPC1의 화이트닝 필터(whitening filte) A(z) 또는 수정된 분석(modified analysis)일 수 있다. 예를 들어, λ를 갖는 W(z) = A(z/λ) 는 미리 설정된 가중 인자이다. TC 프레임의 시작에서 에러 신호는 도6의 라인4 상에서 경우인 것처럼 도면 부호(138)에 의해 표시된다. 이 에러는 도8에서의 FAC 타겟으로 불린다. 상기 에러 신호(138)는, 필터의 초기 상태를 갖는, 즉, 필터 메모리인 경우 초기 상태를 갖는, (140)에서 필터 W(z)에 의해 필터링되고, 도6의 라인4 상에서 ACELP 프레임(122)에서 ACELP 에러(141)이 된다. 필터 W(z) 의 출력은 그 후 도6의 변형(142)의 입력을 형성한다. 상기 변형은 MDCT에 예시적으로 보여진다. MDCT에 의해 출력되는 상기 변형 계수들은 프로세싱 모듈(143)에서 양자화되고 인코딩된다. 이러한 인코딩된 계수들은 미리 언급된 FAC 데이터(34)의 부분을 적어도 형성할 수 있다. 이러한 인코딩된 계수들은 코딩 측면으로 전송될 수 있다. 프로세스 Q 의 출력, 즉 양자화된 MDCT 계수들은, 시간-영역을 형성하기 위한 IMDCT(144)처럼 역 변형의 입력이며, 이는 그 후 제로-메모리(제로 초기 상태)를 갖는 (145)에서 역 필터(inverse filter) 1/W(z)에 의해 필터링된다. 1/W(z)를 통한 필터링은 FAC 타겟 후에 연장하는 샘플들에 대한 제로-입력을 이용하여 지나간 FAC 타겟의 길이에 대해 연장된다. 필터 1/W(z) 의 출력은 FAC 합성 신호(146)이고, 이는 거기서 일어나는 윈도우잉 및 시간-영역 앨리어싱 효과를 보상하기 위한 TC 프레임(120)의 시작에서 지금 적용될 수 있는 수정 신호이다.
이제, (마커 LPC2 이전) TC 프레임(120)의 끝에서 윈도우잉 및 시간-영역 앨리어싱 수정이 설명된다. 이를 위해, 도9가 제작되었다. 도6의 라인4 상의 TC 프레임(120)의 끝에서 에러 신호는 도면부호(147)로 제공되며 도9의 FAC 타겟을 나타낸다. FAC 타겟(147)은 가중 필터 W(z) (140)의 초기 상태와 단순히 다른 프로세싱으로 도8의 FAC 타겟(138)과 동일한 프로세스 시퀀스의 대상이다. FAC 타겟(147)을 필터링하기 위한 필터(140)이 초기 상태는 도6의 라인4 상의 TC v프레임(120)에서의 에러이며, 도6의 도면 부호(148)에 의해 표시된다. 그 후, 추가 프로세싱 단계들(142에서 145)은 TC 프레임의 시작에서 FAC 타겟의 프로세싱을 처리하는 도8에서와 같다.
도8 및 9의 프로세싱은 프레임(120)의 TC 코딩 모드를 선택하는 것에 의해 포함된 코딩 모드의 변화가 최적의 선택인지 아닌지 여부를 확인하기 위해 결과 복원(the resulting reconstruction)을 계산하기 위해 그리고 로컬 FAC 합성을 얻기 위해 인코더에서 적용될 때 왼쪽에서 오른쪽으로 완전하게 수행된다. 디코더에서, 도8 및 9의 프로세싱은 중간에서 오른쪽으로만 적용된다. 그것은, 상기 인코딩되고 양자화된 변형 계수들은 프로세서 Q(143)에 의해 전송되고 IMDCT의 입력을 형성하기 위해 디코딩된다는 것이다. 도10 및 11을 예로 살펴보자. 도10은 도8의 우반면(right hand side)과 동일하고 반면 도11은 도9의 우반면(right hand side)와 동일하다. 도3의 트랜지션 핸들러(60)은, 지금 요약되는 특정 실시예에 따라, 도10 및 11에 따라 실행될 수 있다. 그것은, 트랜지션 핸들러(60)은 ACELP 시간 세그먼트 서브-파트로부터 FD 시간 세그먼트 또는 TCX 서브-파트로의 트랜지션의 경우 제1 FAC 합성 신호(146), FD 시간 세그먼트 또는 시간 세그먼트의 TCX 서브-파트에서 ACELP 시간 세그먼트 서브-파트로의 트랜지션의 경우 제2 FAC g합성 신호(149),를 생성하기 위해 재-변형하기 위한 현재 프레임(14b) 내에서 존재하는 FAC 데이터(34) 내의 변형 계수 정보의 대상일 수 있다.
FAC 데이터(34)의 존재가 오직 구문부(24)로부터 파서(20)에 대해 유도 가능한 경우에 FAC 데이터(34)는 현재 시간 세그먼트 내에 일어나는 트랜지션 같은 것에 관계될 수 있고, 반면 파서(20)은, 이전 프레임이 손실된 경우, FAC 데이터(34)가 현재 시간 세그먼트(16b)의 리딩 엣지에서 트랜지션들 같은 것들에 대해 존재하는지 여부를 결정하기 위해 상기 구문부(26)를 이용하는데 필요하다는 것에 다시 주목하라.
도12는 어떻게 현재 프레임(120)에 대한 완전한 합성 또는 복원된 신호가 도12는 도6의 역 단계들을 적용하고 도8 내지 11에서의 FAC 합성 신호들을 이용하여 얻어질 수 있는지를 보여준다. 도12에서 이제 보여지는 단계들은 또한, 예를 들어, 현재 프레임에 대한 코딩 모드가 레이트/왜곡(rate/distortion) 감지(sense) 또는 그 유사한 것들에서 최적화를 이끄는지 여부를 확인하기 위해 인코더에 의해 수행된다는 것을 다시 주목하라. 도12에서, 마커 LPC1의 왼쪽에서 ACELP 프레임(122)은 도3의 모듈(58)에 의해 이미 합성되고 복원되었고, 이는 도면 부호(110)인 도12의 라인2 상의 ACELP 합성 신호로 이끄는 마커 LPC1에 달려있다고 가정된다. FAC 수정 (FAC correction)은 TC 프레임의 끝에서도 이용되고, 그것은 또한 마커 LPC2 뒤의 프레임(124)가 ACELP 프레임이 될 것이라고 가정된다. 그 후, 도 12의 마커 LPC1 및 LPC2 사이의 TC 프레임(120)에서 합성 또는 복원된 신호를 생성하기 위해, 다음 단계들이 수행된다. 이러한 단계들은 도13 및 14에 도시되었으며, 도13은 TC 코딩된 세그먼트 또는 ㅅ세그먼트 서브-파트로부터 ACELP 코딩된 세그먼트 서브-파트로의 트랜지션들을 처리하기 위한 트랜지션 핸들러(60)에 의해 수행되는 단계들을 도시하며, 반면 도14는 역 트랜지션들에 대한 트랜지션 핸들러의 작업을 설명한다.
1. 도2의 라인2에 보여지는대로 하나의 단계는 MDCT-인코딩된 TC 프레임 그리고 LPC1 및 LPC2 사이에서 위치가 얻어진 시간-영역 신호를 디코딩하는 것이다. 디코딩은 모듈(54) 또는 모듈(56)에 의해 수행되며 TDAC 재-변형의 예처럼 역 MDCT를 포함하며 그래서 디코딩된 TC 프레임이 윈도우잉 및 시간-영역 앨리어싱 효과들을 함유하게 된다. 다른 말로, 디코딩될 그리고 도13 및 14에서 지수 k로 표시되는 세그먼트 또는 시간 세그먼트 서브-파트는, 도13에서 도시된것처럼 ACELP 코딩된 시간 세그먼트 서브-파트(92b)일 수 있고 또는 도14에 도시된 것처럼 FD 코딩된 또는 TCX 코딩된 서브-파트(92a)인 시간 세그먼트(16b)일 수 있다. 도13의 경우에, 이전에 처리된 프레임은 따라서 TC 코딩된 세그먼트 또는 시간 세그먼트 서브-파트이고, 도14의 경우에, 미리 처리된 시간 세그먼트는 ACELP 코딩된 서브-파트이다. 모듈들(54 내지 58)에 의해 출력된 것에 따른 복원들(reconstructions) 또는 합성 신호는 부분적으로 앨리어싱 효과들에 의해 안좋은 영향을 받는다. 이는 신호 세그먼트들(78/108)에 대해서도 참(true)이다.
2. 트랜지션 핸들러(60)의 프로세싱의 또 다른 단계는 도14의 경우 도10에 따른, 도13의 경우에 도11에 따른, FAC 합성 신호의 발생이다. 그것은, 각각, FAC 합성 신호들(146 및 149)를 얻기 위해, 트랜지션 핸들러(60)은 FAC 데이터(34) 내에 변형 계수들 상의 재-변형(191)을 수행할 수 있다는 것이다. FAC 합성 신호들(146 및 149)는 TC 코딩된 세그먼트의 시작 및 끝에 위치되며, 이는, 차례로, 앨리어싱 효과들에 걸리며 시간 세그먼트(78/108)에 등록된다. 도13의 경우에, 예를 들어, 도12의 라인1에도 보여지는 것처럼 트랜지션 핸들러(60)는 TC 코디된 프레임 k-1 의 끝에 FAC 합성 신호(149)를 위치시킨다. 도14의 경우에, 도12의 라인1에서도 보여지는 것처럼 트랜지션 핸들러(60)는 TC 코딩된 프레임 k의 시작에서 FAC 합성 신호(146)을 위치시킨다. 프레임 k 는 현재 디코딩될 프레임이고 프레임 k-1 은 이전의 디코딩된 프레임이라는 것에 다시 주목하라.
3. 코딩 모드 변화가 현재 TC 프레임 k 의 시작에서 일어나는 곳에서 도14의 상황이 관련되는 한, TC 프레임 k를 선행하는 ACELP 프레임 k-1 으로부터 윈도우되고 폴딩된 (반전된(inverted)) ACELP 합성 신호(130), 그리고 LPC1 합성 필터의, 윈도우된 제로-입력 응답, 또는 ZIR, 즉 신호(132)는, 앨리어싱이 걸리는 재-변형된 신호 세그먼트(78/108)에 등록되기 위해 위치된다. 이 기여는 도12의 라인3에서 보여진다. 도14에 보여지는대로 그리고 위에서 이미 설명된대로, 트랜지션 핸들러(60)는 도14에서 도면 부호(190 및 192)로 표시된 양 단계들과 함께 현재 신호 k 내에 신호(110)의 지속을 윈도우잉하고 현재 시간 세그먼트 k 의 리딩 경계(leading boundary)를 넘어 선행하는 CELP 서브-프레임의 LPC 합성 필터링을 지속하는 것에 의해 앨리어싱 취소 신호(132)를 얻는다. 앨리어싱 취소 신호(130)을 얻기 위해, 트랜지션 핸들러(60)는 또한 선행 CELP 프레임의 복원된 신호 세그먼트(110)를 단계(194)에서 윈도우하며 상기 신호(130)에 따라 이 윈도우되고(windowed) 시간-역전된 신호(time-reversed signal)을 이용한다.
4. 도12의 라인 1, 2, 및 3의 기여들 그리고 도14에서 기여들(78/108, 132, 130 및 146) 그리고 도13의 기여들(78/108, 149 및 196)은, 위에서 설명된 등록된 위치들에서 트랜지션 핸들러(60)에 의해 추가되고, 이는 도12의 라인4에 보여지는 대로 원래 영역에서 현재 프레임 k 에 대한 합성된 또는 복원된 오디오 신호를 형성하기 위함이다. 도13 및 14의 프로세싱은 TC 프레임에서 합성 또는 복원된 신호(198)를 생성하고 여기서 시간-영역 앨리어싱 및 윈도우잉 효과들은 프레임의 시작 및 끝에서 취소되며, 여기서 마커 LPC1 주변 프레임 경계의 잠재적 불연속은 도12에서 필터 1/W(z) 에 의해 개념적으로 마스크(masked)되고 매끄러워(smoothed) 졌다는 것을 주목하라.
따라서, 도13은 CELP 코딩된 프레임 k 의 현재 프로세싱과 관계가 있고 선행하는 TC 코딩된 세그먼트의 끝에서 포워드 앨리어싱 취소를 이끈다. (196)에서 도시되는 것처럼, 최종적으로 복원된 오디오 신호는 세그먼트들 k-1 및 k 사이의 경계를 넘어 앨리어싱 없이(aliasing less) 복원된다. 도14의 프로세싱은 세그먼트들 k 및 k-1 사이의 경계를 넘어 복원된 신호를 보여주는 도면부호(198)에서 보여지는 것처럼 현재 TC 코딩된 세그먼트 k 의 시작에서 포워드 앨리어싱 취소를 이끈다. 현재 세그먼트 k 의 리어 엔드(rear end)에서 남아있는 앨리어싱은 다음 세그먼트가 TC 코딩된 세그먼트인 경우 TDAC에 의해, 또는 다음 세그먼트가 ACELP 코딩된 세그먼트인 경우 도13에 따른 FAC에 의해, 취소되는 것 중 하나이다. 도13은 시간 세그먼트 k-1의 신호 세그먼트에 대한 도면 부호(198)을 할당하는 것에 의해 이 후자(latter)의 가능성을 언급한다.
다음에서, 특정 가능성들이 어떻게 상기 제2구문부(26)가 실행될 수 있는지에 대해 언급될 것이다.
예를 들어, 손실된 프레임들의 발생을 처리하기 위해, 상기 구문부(26)는 다음 표에 따른 이전 프레임(14a)에서 적용된 코딩 모드를 명쾌하게 현재 프레임(14b) 내에서 신호하는(signals) 보내는 2-bit 필드(field) prev_mode 에 따라 구현될 수 있다 :
prev_mode
ACELP 0 0
TCX 0 1
FD_long 1 0
FD_short 1 1
다른 말로, 이 2-bit 필드는 prev_mode 로 불릴 수 있고 그리고 따라서 이전 프레임(14a)의 코딩 모드를 표시할 수 있다. 방금-언급된 예의 경우에, 네개의 다른 상태들이 구별된다. 즉 :
1) 상기 이전 프레임(14a)는 LPD 프레임이고, 그것의 상기 마지막 서브-프레임은 ACELP 서브-프레임이다;
2) 상기 이전 프레임(14a)은 LPD 프레임이고, 그것의 상기 마지막 서브-프레임은 TCX 코딩된 서브-프레임이다;
3) 상기 이전 프레임은 긴 변형 윈도우를 이용한 FD 프레임이고
4) 상기 이전 프레임은 짧은 변형 윈도우들을 이용한 FD 프레임이다.
잠재적으로 FD 코딩 모드의 다른 윈도우 길이들을 이용하는 것의 가능성은 도3의 설명에 관해 위에서 이미 설명되었다. 자연스럽게, 상기 구무부(26)는 단지 세 개의 다른 상태들을 가질 수 있고 FD 코딩 모드는 단순히 일정한 윈도우 길이로 작동될 수 있으며 그렇게함으로써 위에 리스트된 옵션 3 및 4 의 마지막 두 개를 요약한다.
어떠한 경우에도, 위에서 요약된 2-bit 필드에 기반하여, 상기 파서(20)는 현재 시간 세그먼트 및 이전 시간 세그먼트(16a) 사이의 FAC 데이터가 현재 프레임(14a)내에 존재하는지 아닌지 여부에 대해 결정할 수 있다. 아래에서 더 자세히 설명될 것처럼, 파서(20) 및 복원기(22)는, 이전 프레임(14a)이 긴 윈도우(FD_long)을 이용하는 FD 프레임이었는지 여부, 이전 프레임이 짧은 윈도우들(FD_short)을 이용하는 FD 프레임이었는지 여부, 현재 프레임(14b)가 (만약 현재 프레임이 LPD 프레임이라면) 각각 정보 신호를 복원하고 데이터 스트림을 알맞게 파싱하기 위한 다음 실시예에 따라 구별이 필요한 FD프레임 또는 LPD 프레임을 승계하는지 여부에 대해 prev_mode 에 기반하여 결정할 수도 있다.
따라서, 상기 구문부(26)에 따라 2-Bit 식별자를 이용하는 방금 언급된 가능성에 따라, 각 프레임(16a 내지 16c)은 상기 구문부(24)에 더하여 추가 2-bit 식별자(additional 2-bit identifier)가 구비되고 이는 LPD 코딩 모드의 경우 FD 또는 LPD 코딩 모드 및 서브-프레이밍 구조가 될 현재 프레임의 코딩 모드를 정의(define)한다.
상기 실시예들 모두에 대해, 다른 인터-프레임 의존(inter-frame dependencies) 또한 회피되어야 한다는 것이 언급되어야 한다. 예를 들어, 도1의 디코더는 SBR 능력이 있을 수 있다. 그러한 경우, 크로스오버 주파수는 덜 자주 데이터 스트림(12) 내에 전송될 수 있는 SBR 헤더와 크로스오버 주파수 같은 것을 파싱하는 것 대신에 개별 SBR 연장 데이터 내에 모든 프레임(16a 에서 16c)으로부터 파서(20)에 의해 파싱될 수 있다. 다른 인터-프레임 의존(dependencies)은 유사한 방식으로 제거될 수 있다.
파서(20)는 FIFO (first in first out) 방식으로 이 버퍼를 통해 모든 프레임들(14a 내지 14c) 를 지나면서 버퍼 내에 현재 디코딩된 프레임(14b)을 적어도 버퍼링(buffer)하도록 구성될 수 있다는 점은, 상기 설명된 실시예들 모두에 대해 언급할 가치가 있다. 버퍼링에서, 파서(20)는 프레임들(14a 내지 14c)의 단위로 이 버퍼로부터 프레임들의 제거를 수행할 수 있다. 그것은, 파서(20)의 버퍼의 채움(필링, filling)과 제거(removal)가, 예를 들어, 단 하나, 또는 하나 이상의 최대화된 크기의 프레임들을 수용하는 최대로 이용가능한 버퍼 공간에 의해 부과되는 제약들을 준수하기 위해 프레임들(14a 내지 14c)의 단위로 수행될 수 있다는 것이다.
감소된 비트 소비를 갖는 구문부(26)에 대한 대안적인 시그널링 가능성은 다음에 설명될 것이다. 이 대안에 따라, 상기 구무부(26)의 다른 건축 구조가 이용된다. 이전에 설명된 실시예에서, 상기 구문부(26)은 2-bit 필드였고 이는 인코딩된 USAC 데이터 스트림의 모든 프레임(14a 내지 14c)에서 전송된다. FD 파트(part)에 대해 이전 프레임(14a)가 손실된 경우 그것이 비트 스트림으로부터 FAC 데이터를 읽어야 하는지 여부를 아는 것이 디코더에게 오직 중요하기 때문에, 이러한 2-bits 는 그들 중 하나가 fac_data_present 에 따라 모든 프레임(14a 내지 14c) 내에 시그널링 되는(signaled) 곳에서 두개의 1-bit 플래그(flags)들로 분할될 수 있다. 이러한 비트는 도 15 및 16의 표들에서 보여지는 것처럼 single_channel_element 및 channel_pair_element 에서 도입될 수 있다. 도15 및 16은 본 발명의 실시예에 따라 프레임들(14)의 높은 수준의 구조 정의(high level structure definition)로 보여질 수 있는데, 여기서 기능들 "function_name(...)"은 서브-루틴들을 호출하고, 굵게 쓰여진 구문 요소 이름들은 데이터 스트림으로부터 개별 구문 요소의 판독(reading)을 표시한다. 다른 말로, 도15 및 16의 마크된 부분들(포션들, marked portions) 또는 빗금쳐진 부분들(hatched portions)은, 본 실시예에 따라, 각 프레임(14a 내지 14c)이 flag fac_data_present 가 구비된다는 것을 보여준다. 도면부호(199)는 이러한 부분들을 보여준다.
다른 1-bit 플래그(flag) prev_frame_was_lpd 는 만약 동일한 것이 USAC 의 LPD 파트를 이용하여 인코딩 되는 경우 현재 프레임에서만 전송되고, USAC의 LPD 경로를 이용하여 이전 프레임이 인코딩 되었는지 여부 또한 신호한다. 이는 도17의 표에서 보여진다.
도17의 표는 현재 프레임(14b)이 LPD 프레임인 경우 도1에서의 정보(information, 28)의 부분을 보여준다. (200)에서 보여지는 것처럼, 각 LPD 프레임은 플래그(flag) prev_frame_was_lpd 가 구비된다. 이 정보는 현재 LPD 프레임의 구문을 파싱(parse)하는데 이용된다. LPD 프레임들에서 FAC 데이터(34)의 컨텐츠 및 위치는 TCX 코딩 모드와 CELP 코딩 모드 사이의 트랜지션인 현재 LPD 프레임의 리딩 엔드(선두 종료, leading end)에서의 트랜지션 또는 도18로부터 유도되는 FD 코딩 모드에서 CELP 코딩 모드로의 트랜지션에 의존한다. 특히, 만약 현재 디코딩된 프레임(14b)이 FD 프레임(14a)을 바로 앞세우는 LPD 프레임인 경우, fac_data_present 는 현재 LPD 프레임에서 FAC 데이터가 존재함을 신호하고 그 후 FC 데이터는, 그런 경우에, 도18의 (204)에서 보여지는 것처럼 이득 인자(gain factor) fac_gain 를 포함하는 FAC 데이터(34)와 함께 (202)에서 LPD 프레임 구문의 끝에서 읽혀진다. 이 이득 인자와 함께, 도13의 기여(149)는 이득-조정(gain-adjusted)된다.
만약, 그러나, 현재 프레임이 역시 LPD 프레임인 선행 프레임과 함께 LPD 프레임인 경우에, 즉 TCX 및 CELP 서브-프레임들 사이의 트랜지션이 현재 프레임과 이전 프레임 사이에서 일어나는 경우에, FAC 데이터는 이득 조정가능한 옵션(gain adjustability option) 없이, 즉 FAC 이득 구문 요소 fac_gain 을 포함하는 FAC 데이터(34) 없이, (206)에서 읽혀진다. 추가로, (206)에서 읽혀지는 FAC 데이터의 위치는 현재 프레임이 LPD 프레임이고 이전 프레임이 FD 프레임인 경우에 FAC 데이터가 (202)에서 읽혀지는 위치와는 다르다. 판독(reading, 202)의 위치가 현재 LPD 프레임의 끝에서 일어나는 동안, (206)에서 FAC 데이터의 판독(reading)은 서브-프레임 특정 데이터, 즉, 각각 (208 및 210)에서, 서브-프레임들 구조의 서브-프레임들의 모드들에 의존하는 ACELP 또는 TCX, 의 판독(reading) 전에 일어난다.
도15 내지 18의 예에서, (도5) LPC 정보(104)는 (도5와 비교하여) (212)에서 (90a 및 90b) 같은 서브-프레임 특정 데이터 후에 읽혀진다.
완전성만을 위해, 도17에 따른 상기 LPD 프레임의 구문 구조는 현재 LPD 코딩된 시간 세그먼트의 내부에서 TCX 및 CELP 서브-프레임들 사이의 트랜지션에 관한 FAC 정보를 제공하기 위해 LPD 프레임 내에 잠재적이고 추가적으로 포함된 FAC 데이터에 관해 더 설명된다. 특히, 도15 내지 18의 실시예에 따라서, 상기 LPD 서브-프레임 구조는 단지 쿼터 단위로(in units of quarters) TCX 또는 ACELP 어느 한 쪽에 대해 이러한 쿼터들(quarters)을 할당하는 것과 함께 현재 LPD 코딩된 시간 세그먼트들을 세분(sub-divide)하도록 제한된다. 정확한 LPD 구조는 (214)에서 읽혀지는 구문 요소 lpd_mode 에 의해 정의된다. 제1 및 제2 및 제3 그리고 제4 쿼터(quarter)는 TCX 서브-프레임을 함께 형성할 수 있고 반면 ACELP 프레임들은 쿼터의 길이만에 제한된다. TCX 서브-프레임은 숫자 서브-프레임들이 오직 하나인 경우에 전체 LPD 인코딩된 시간 세그먼트를 넘어 연장할 수도 있다. 도17에서 와일 루프(the while loop)가 현재 LPD 코딩된 시간 세그먼트의 쿼터들을 통해 단계를 밟고, 현재 쿼터 k 가 현재 LPD 코딩된 시간 세그먼트의 내부 내에서 새로운 서브-프레임의 시작일 때마다, (216)에서 현재 시작하는/디코딩된 LPD 프레임의 즉시 선행하는 서브-프레임이 제공되는 FAC 데이터는 다른 모드, 즉 TCX 모드이고 만약 현재 서브-프레임이 ACELP 모드라면 이러한 것들은 반대이다.
완전성을(completeness)만을 위해, 도19는 도15 내지 18의 실시예에 따라 FD 프레임의 가능한 구문 구조를 보여준다. FAC 데이터가 FAC 데이터(34)가 존재하는지 아닌지 여부에 대한 결정과 함께 FD 프레임의 끝에서 읽혀지고, 단지 fac_data_present 플래그를 포함한다는 것이 보여질 수 있다. 그것과 비교하여, 도17에서 LPD 프레임의 경우 fac_data (34)의 파싱은, 정확한 파싱을 위해, 플래그 prev_frame_was_lpd 의 지식(knowledge)을 필요로 한다. 따라서, 1-bit 플래그 prev_frame_was_lpd 는 현재 프레임이 USAC 의 LPD 파트를 이용하여 인코딩 될 때만 오직 전송되고 USAC 코덱의 LPD 경로를 이용하여 이전 프레임이 인코딩되었는지 여부를 신호한다.(도17의 lpd_channel_stream() 구문을 보라.)
도15 내지 19의 실시예에 관해, 추가 구문 요소는 (220)에서, 즉 현재 프레임이 LPD 프레임이고 이전 프레임이 FD 프레임인 경우에(현재 LPD 프레임의 제1프레임이 ACELP 프레임인 것과 함께), 전송될 수 있고 이는 FAC 데이터가 현재 LPD 프레임의 리딩 엔드에서 FD 프레임으로부터 AECLP 서브-프레임으로의 트랜지션을 다루기 위해 (202)에서 읽혀지도록 하기 위함이라는 것에 주의하여야 한다. (202)에서 읽혀지는 이 추가 구문 요소는 이전 FD 프레임(14a)가 FD_long 또는 FD_short 인지 여부를 표시할 수 있다. 이 구문 요소에 의존하여, 상기 FAC 데이터(202)는 영향받을 수 있다. 예를 들어, 구문 신호(149)의 길이는 이전 LPD 프레임을 변형하기 위해 이용되는 윈도우의 길이에 의존하여 영향받을 수 있다. 도15 및 19의 실시예를 요약하고 도1 내지 14에 관해 설명된 실시예 상에 언급된 특징들을 옮기면, 다음 사항들이 개별적으로 또는 조합으로 나중의 실시예들 상에 적용될 수 있다 :
1) 이전 도면들에서 언급된 FAC 데이터(34)는 현재 프레임(14b)과 이전 프레임 사이의, 즉 대응하는 시간 세그먼트들(16a 및 16b) 사이의 트랜지션에서 일어나는 포워드 앨리어싱 취소를 가능하게 하기 위해 현재 프레임(14b)에 존재하는 FAC 데이터를 주로 주목하기 위한 의도였었다. 이 추가 FAC 데이터는, 그러나, 동일한 것이 LPD 모드인 경우에 현재 프레임(14b)에 내부적으로 위치한 CELP 코딩된 서브-프레임들 및 TCX 코딩된 서브-프레임들 사이의 트랜지션들을 다룬다. 추가 FAC 데이터의 존재 또는 부재는 상기 구문부(26)로부터 독립적이다. 도17에서, 이 추가 FAC 데이터는 (216)에서 읽혀진다. 그들의 존재 또는 실재는 (214)에서 읽혀지는 lpd_mode 에 단지 의존한다. 나중의 구문 요소는, 차례로, 현재 프레임의 코딩 모드를 드러내는 상기 구문부(24)의 부분(part)이다. 도15 및 16에서 보여지는 (230) 및 (232)에서 읽혀지는 core_mode 를 따른 lpd_mode 는 구문부(24)에 대응한다.
2) 더하여, 상기 구문부(26)은 위에서 설명된대로 하나 이상의 구문 요소로 구성될 수 있다. 상기 플래그 FAC_data_present 는 이전 프레임 및 현재 프레임 사이의 경계에 대한 fac_data 가 존재하는지 아닌지 여부를 표시한다. 이 플래그는 LPD 프레임 뿐만 아니라 FD 프레임들에서도 존재한다. 추가 플래그는, prev_frame_was_lpd 를 호출했던 위의 실시예에서, 오직 이전 프레임(14a)가 LPD 모드인지 아닌지 여부를 보여주기 위해 LPD 프레임에서 전송된다. 다른 말로, 상기 구문부(26)에 포함된 이 두번째 플래그는 이전 프레임(14a)가 FD 프레임이었는지 여부를 표시한다. 상기 파서(20)는 단지 현재 프레임이 LPD 프레임인 경우에 이 플래그를 읽고 예측한다. 도17에서, 이 플래그는 (200)에서 읽힌다. 이 플래그에 의존하여, 파서(20)는 포함할 FAC 데이터를 예측할 수 있고, 따라서 현재 프레임으로부터 이득 값(gain value) fac_gain 을 읽는다. 이득 값은 현재 및 이전 시간 세그먼트들 사이의 트랜지션에서 FAC에 대해 FAC 합성 신호의 이득을 설정하도록 복원기에 의해 이용된다. 도15 내지 19의 실시예에서, 이 구문 요소는, 각각, 판독(reading) (206 및 202)로 이끄는 조건들을 비교하는 것으로부터 명확해지는 상기 제2플래그에 대한 의존과 함께 (204)에서 읽혀진다. 대안적으로 또는 추가적으로, prev_frame_was_lpd 는 파서(20)가 FAC 데이터를 예측하고 읽는 곳에서 위치를 제어한다. 도15 내지 19의 실시예에서 이러한 위치들은 (206) 또는 (202) 였다. 추가로, 상기 제2구문부(26)는 이전 FD 프레임이 긴 변형 윈도우 또는 짧은 변형 윈도우를 이용하여 인코딩 되는지 여부를 표시하기 위해 현재 프레임이 ACELP 프레임이 되는 리딩(leading) 서브-프레임과 함께 LPD 프레임이 되고 이전 프레임이 FD 프레임이 되는 경우 추가 플래그를 더 포함할 수 있다. 나중에 플래그는 도15 내지 19의 이전 실시예의 경우 (220)에서 읽혀질 수 있다. 이 FD 변형 길이에 관한 지식은, 각각, FAC 데이터의 크기 및 FAC 합성 신호들의 길이를 결정하기 위해 이용될 수 있다. 이 측정에 의해, 상기 FAC 데이터는 이전 FD 프레임의 윈도우의 길이를 오버랩(overlap)하기 위한 크기로 적응될 수 있고(adapted) 이는 코딩 품질(quality)과 코딩 레이트(rate) 사이의 더 나은 타협이 달성될 수 있도록 하기 위함이다.
3) 방금-언급된 세 플래그들로 상기 제2구무부(26)을 분배하는 것에 의해, 현재 프레임이 FD 프레임이 되는 경우 상기 제2구문부(26)를 신호하기 위해 단지 하나의 플래그 또는 비트를 전송하는 것이 가능하고, 현재 프레임이 LPD 프레임이 되고 이전 프레임이 LPD 프레임이 되는 경우 단지 두개의 플래그 또는 비트를 전송하는 것도 가능하다. 단지 FD 프레임으로부터 현재 LPD 프레임으로의 트랜지션의 경우에, 제3플래그(third flag)는 현재 프레임에서 전송되어야 한다. 대안적으로, 상기 언급된대로, 상기 제2구문부(26)는 모든 프레임에 대해 전송되는 2-비트 표시기(2-bit indicator)가 될 수 있고 상기 모드를 표시하며 상기 프레임은 FAC 데이터(38)가 현재 프레임으로부터 읽혀져야 하는지 아닌지, 만약 그렇다면, FAC 합성 신호가 어디서부터 그리고 얼마나 긴지에 대해 결정하기 위해, 파서(parser)에 필요한 연장(extent)에 대한 이 프레임을 선행한다. 그것은, 도15 내지 19의 특정 실시예는 상기 제2구문부(26)을 실시하기 위해 위의 2-비트 식별자(2-bit identifier)를 이용하는 실시예로 쉽게 이송(transferred)될 수 있다는 것이다. 도15 및 16의 FAC_data_present 대신에, 2-비트 식별자가 전송될 것이다. (200) 및 (220)에서의 플래그들이 전송되어야 할 필요는 없다. 대신에, (206) 및 (218)로 이끄는 if-절(if-clause) 에서 fac_data_present 의 컨텐츠는, 2-비트 식별자로부터 상기 파서(20)에 의해 유도될 수 있다. 다음 표는 2-비트 표시기를 이용하기 위해 디코더에서 엑세스(accessed) 될 수 있다.
prev _ mode 현재 프레임( current frame)의 core_mode
( superframe )
first _ lpd _ flag
ACELP 1 0
TCX 1 0
FD_long 1 1
FD_short 1 1
구문부(26)는 FD 프레임들이 오직 하나의 가능한 길이를 이용할 때 세개의 다른 가능한 값들을 단순히 가질 수도 있다.
조금 다르게, 그러나 도15 내지 19에 상기 설명된 것과 매우 유사한 구문 구조가 도15 내지 19에서 이용된 동일한 도면 부호들을 이용하여 도20 내지 22에 보여지며, 그래서 그 레퍼런스(reference)는 도20 내지 22의 실시예의 설명의 실시예를 위해 만들어진다.
도3 이하 참조에 설명된 실시예들과 함께, 앨리어싱 특성을 갖는 어떠한 변형 코딩 설계라도 MDCT 외에, TCX 프레임들과의 연결에서 이용될 수 있다는 것이 주목된다. 게다가, 그 후 LPD 모드에서 앨리어싱 없이, 즉 LPD 프레임 내에서 서브프레임 트랜지션들에 대한 FAC 없이, 따라서, LPD 경계들 사이에서 서브프레임 경계들에 대한 FAC 데이터 전송을 위한 요구 없이, FFT 같은 변형 코딩 설계 또한 이용될 수 있다. FAC 데이터는 단지 FD 에서 LPD 로 그리고 그 반대의 모든 트랜지션에 포함될 것이다.
도1 이하 참조에 관하여 설명된 실시예에 대해, 추가 구문부(26)가 라인에 설정된 곳의 경우에 동일한 것이 겨냥된 것이 주목되며, 즉 이전 프레임의 제1구문부에서 정의된대로 현재 프레임의 코딩 모드 및 이전 프레임의 코딩 모드 사이의 비교에 고유하게 의존하며, 그래서 위의 실시예 모두에서 상기 디코더 또는 파서(parser)는 이러한 프레임들의 제1구문부, 즉 이전 및 현재 프레임을 이용 또는 비교하는 것에 의해 현재 프레임의 제2구문부의 컨텐츠를 고유하게 예측할 수 있도록 하는 것이었다. 프레임 손실이 없는 경우에, 그것은 디코더 또는 파서가 FAC 데이터가 현재 프레임에 존재하는지 아닌지 여부를 프레임들 사이의 트랜지션들로부터 유도하는 것을 가능하게 하였다. 프레임이 손실되는 경우, 플래그 fac_data_present bit 같은 상기 제2구문부는 명확하게 그 정보를 준다. 그러나, 또 다른 실시예에 따라, 상기 인코더는 비록 현재 프레임 및 이전 프레임 사이의 트랜지션이 현재 프레임들의 구문부가 FAC의 부재를 표시하는 (FD/TCX , 즉 ACELP에 대한, 어떤 TC 코딩 모드, 즉 어떤 시간 영역 코딩 모드, 또는 그 반대 같은) FAC 데이터를 일반적으로 따라오는 상기 타입인 경우라도 적응적으로(adaptively) 설정되는 구문부(26)에 따라 컨버스 코딩(converse coding)을 적용하기 위해 상기 제2구문부(26)에 의해 제공되는 명시적 신호전달 가능성(explicit signalisation possibility)을 이용할 수 있다. 상기 디코더는 이후 상기 구문부(26)에 따라 엄격히 행동하도록 실행될 수 있으며, 그래서 예를 들어, 단지 fac_data_present = 0 설정에 의해 억제(suppression)를 신호하는 인코더에서 FAC 데이터 전송을, 효율적으로, 불능화(disabling), 또는 억제(suppressing)한다. 이것이 선호되는 옵션인 시나리오는 추가 FAC 데이터가 너무 많은 비용이 드는 곳에서 아주 낮은 비트 레이트(bit rates)에서 코딩할 때이고 반면 결과 앨리어싱 가공품(artefact)은 전체 사운드 품질과 비교하여 웬만큼 괜찮을 수 있다.
비록 몇몇 관점들이 장치의 문맥에서 설명되었지만, 언급된 관점들은 대응하는 방법의 기술 또한 표현하는 것이라고 이해되어야 하며, 그래서 장치의 블록 또는 구조적 구성요소들 또한 대응하는 방법 단계 또는 방법 단계의 특징에 따라 이해되어야 한다. 그것과 유사하게, 방법 단계에 따라 또는 그와 연결되어 설명된 관점들은 장치의 특징에 대응한다. 방법 단계들의 전체 또는 몇몇은, 마이크로프로세서, 프로그램가능한 컴퓨터 또는 전자 회로처럼, 하드웨어 장치에 의해(또는 이용하는 동안) 수행될 수 있다. 몇몇 실시예들에서, 대부분 중요한 방법 단계들의 조금 또는 몇몇은 그러한 장치에 의해 수행될 수 있다.
본 발명에 따라 인코딩된 오디오 신호는 디지털 저장 매체에 저장될 수 있고 또는 예를 들어 인터넷 같은 유선 전송 매체 또는 무선 전송 매체처럼 전송 매체에서 전송될 수 있다.
특정 실행 요구들에 의존하여, 발명의 실시예들은 하드웨어 또는 소프트웨어에서 실행될 수 있다. 실시예들은 디지탈 저장 매체를 이용하는 동안 수행될 수 있고, 이는 예를 들어, 그위에 저장되는 전자기적으로 판독가능한 컨트롤 신호들을 갖는, 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 FLASH 메모리 등이며, 개별 방법들이 수행되는 프로그래밍 가능한 컴퓨터 시스템과 함께 협력할 수 있거나 또는 실제적으로 협력한다. 따라서, 상기 디지털 저장 매체는 컴퓨터-판독가능할 수 있다.
본 발명에 따른 몇몇 실시예들은 이와 같이 여기서 설명된 방법들 중 어느것처럼 프로그램 가능한 컴퓨터 시스템과 함께 협력할 수 있는 전자적으로 판독가능한 제어 신호들을 포함하는 데이터 캐리어(data carrier)를 포함한다.
일반적으로, 본 발명의 실시예들은 프로그램 코드를 갖는 컴퓨터 프로그램 제품처럼 실행될 수 있으며, 상기 프로그램 코드는 컴퓨터 프로그램 제품이 컴퓨터상에서 구동될 때 방법들 중 어떤 것을 수행하도록 효과를 낸다. 상기 프로그램 코드는 예를 들어, 기계-판독가능한 캐리어에도 저장될 수 있다.
다른 실시예들은 여기에 설명된 방법들 중 어떤 것을 수행할 컴퓨터 프로그램을 포함하며, 언급된 컴퓨터 프로그램은 기계-판독가능한 캐리어에 저장된다.
다른 말로, 컴퓨터 프로그램이 컴퓨터 상에서 구동될 때, 본 발명의 방법의 실시예는 이와 같이 여기서 설명된 방법들 중 어떤 것을 수행하기 위한 프로그램 코드를 가진다.
본 발명의 방법의 추가 실시예는 이와 같이 여기서 설명된 방법들 중 어떤 것을 수행하기 위한 컴퓨터 프로그램이 기록된 데이터 캐리어이다. 상기 데이터 캐리어, 디지털 저장 매체 또는 레코딩된 매체는 일반적으로 유형적이고 및/또는 비-변화적이다.
본 발명의 방법의 추가 실시예는 이와 같이 여기서 설명된 방법들 중 어느 것을 수행하기 위한 컴퓨터 프로그램을 나타내는 신호들의 시퀀스 또는 데이터 스트림이다. 데이터 스트림 또는 신호들의 시퀀스는, 예를 들어, 인터넷을 통해, 데이터 통신 링크를 통해 전송되도록, 예를 들어, 구성될 수 있다.
추가 실시예는 여기에 설명된 방법들 중 어떤 것을 수행하기 위해 적응되는 또는 구성되는, 예를 들어 컴퓨터 또는 프로그램 가능한 논리 장치같은, 프로세싱 수단을 포함한다.
추가 실시예는 여기에 설명된 방법들 중 어느 것을 수행하기 위한 컴퓨터 프로그램이 설치된 컴퓨터를 포함한다.
본 발명에 따른 추가 실시예는 리시버에 대해 여기에 설명된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 전송(예를 들어, 전기적으로 또는 광학적으로)하도록 구성되는 장치 또는 시스템을 포함한다. 상기 리시버는, 예를 들어, 컴퓨터, 모바일 장치, 메모리 디바이스 또는 유사품이 될 수 있다. 상기 장치 또는 시스템은, 예를 들어, 상기 리시버에 대해 컴퓨터 프로그램을 전송하기 위해 파일 서버를 포함할 수 있다.
몇몇 실시예에서, 프로그래밍 가능한 논리 장치(예를 들어 필드 프로그래밍 가능한 게이트 어레이, FPGA)는 여기서 설명된 방법 중 모든 기능 또는 몇몇을 수행하도록 사용될 수 있다. 몇몇 실시예에서, 필드 프로그래밍 가능한 게이트 어레이는 여기서 설명된 방법 중 하나를 수행하기 위해 마이크로 프로세서와 연동될 수 있다. 일반적으로, 상기 방법들은 바람직하게는 어떠한 하드웨어 장치에 의해서도 수행된다.
상기 설명된 실시예들은 단지 본 발명의 원리를 위해 예시적일 뿐이다. 그리고 기술분야의 다른 숙련자가 여기서 설명된 자세한 내용들, 배치의 변화와 변형중 어느것이나 이해할 수 있다고 이해되어야 한다. 그것의 의도는, 따라서, 여기의 실시예의 설명 또는 논의의 방법에 의해 표현된 특정 세부사항들에 의해서 보다는 오직 다음의 특허 청구항의 범위에 의해서만 제한된다는 것이다.

Claims (20)

  1. 정보 신호(18)의 시간 세그먼트들이 디코딩되는 프레임들의 시퀀스를 포함하는 데이터 스트림(12)을, 각각, 디코딩하기 위한 디코더(10)에 있어서,

    상기 데이터 스트림(12)을 파싱하는 데 있어, 현재 프레임(14b)으로부터 제1구문부(24) 및 제2구문부를 읽도록 구성되는, 상기 데이터 스트림(12)을 파싱하도록 구성되는 파서(20); 및

    시간-영역 앨리어싱 취소 변형 디코딩 모드 그리고 시간-영역 디코딩 모드 중 먼저 선택된 하나를 이용하여, 상기 제1선택은 상기 제1구문부(24)에 의존하며, 상기 파싱에 의해 상기 현재 프레임으로부터 얻어지는 정보(28)에 기반하여 상기 현재 프레임(14b)과 연동된 상기 정보 신호(18)의 현재 시간 세그먼트(16b)를 복원하도록 구성되는 복원기(22);를 포함하며,

    상기 파서(20)는, 상기 데이터 스트림(12)을 파싱하는 데 있어, 이와 같이 상기 현재 프레임(14b)로부터 포워드 앨리어싱 취소 데이터(34)를 판독하는 것을 포함할 상기 현재 프레임(14b)을 예측하는 제1액션, 이와 같이 상기 현재 프레임으로부터 포워드 앨리어싱 취소 데이터(34)를 판독하지 않는 것을 포함할 상기 현재 프레임(14b)을 비-예측하는 제2액션, 중 두번째로 선택된 하나가 수행되며, 상기 제2선택은 상기 제2구문부에 의존하고,

    상기 복원기(22)는 상기 포워드 앨리어싱 취소 데이터(34)를 이용하여 상기 현재 시간 세그먼트(16b)와 이전 프레임(14a)의 이전 시간 세그먼트(16a) 사이의 경계에서 포워드 앨리어싱 취소를 수행하도록 구성되는, 정보 신호(18)의 시간 세그먼트들이 디코딩되는 프레임들의 시퀀스를 포함하는 데이터 스트림(12)을 디코딩하기 위한 디코더(10).
  2. 제1항에 따른 디코더(10)에 있어서,
    상기 제1 및 제2 구문부들은 각 프레임에 의해 포함되고, 상기 제1구문부(24)는 동일한 것이 읽혀진 것으로부터의 상기 개별 프레임을, 제1프레임 타입 또는 제2프레임 타입과, 연동하게 하며, 상기 개별 프레임이 상기 제2프레임 타입인 경우, 제1서브 프레임 타입과 제2서브 프레임 타입의 개별적인 하나와, 서브 프레임들의 숫자로 구성되는, 상기 개별 프레임의 서브디비젼의 서브 프레임들과 연동하게 하고, 상기 복원기(22)는, 상기 제1구문부(24)가 상기 개별 프레임과 상기 제1프레임 타입을 연동하게 하는 경우, 상기 개별 프레임과 연동된 상기 시간 세그먼트를 복원하기 위한 시간-영역 앨리어싱 취소 변형 디코딩 모드의 제1버젼에 따라 주파수 영역 디코딩을 이용하며, 상기 제1구문부(24)가 상기 개별 프레임을 상기 제2프레임 타입과 연동하게 하는 경우, 상기 개별 프레임의 각 서브 프레임에 대해, 상기 개별 프레임의 시간 세그멘트의 서브 포션(sub portion)을 복원하기 위해 상기 시간-영역 앨리어싱 취소 변형 디코딩 모드의 제2버젼에 따라 변형 코딩된 여기 선형 예측 디코딩을 이용하며, 상기 제1구문부(24)가 상기 개별 프레임의 상기 개별 서브프레임과 상기 제1서브 프레임 타입을 연동하게 하는 경우, 이는 준수되는 서브 프레임과 연동되고, 상기 개별 프레임의 시간 세그멘트의 서브 포션을 복원하기 위한 상기 시간-영역 디코딩 모드에 따라 코드북 여기 선형 예측 디코딩을 이용하도록 구성되며, 상기 제1구문부(24)가 상기 개별 서브 프레임을 제2서브 프레임 타입과 연동하게 하는 경우, 이는 상기 개별 서브 프레임과 연동되는 것을 특징으로 하는 디코더.
  3. 제1항 또는 제2항에 따른 디코더(10)에 있어서,
    상기 제2구문부는 가능한 값들의 집합을 갖고, 그 각각은
    상기 제1프레임 타입인 상기 이전 프레임(14a),
    상기 제1서브 프레임 타입인 그것의 마지막 서브 프레임을 갖는 상기 제2프레임 타입인 상기 이전 프레임(14a), 및
    상기 제2서브 프레임 타입인 그것의 마지막 서브 프레임을 갖는 상기 제2프레임 타입인 상기 이전 프레임(14a)
    을 포함하는 가능성의 집합 중 하나와 유일하게 연동되며,
    상기 파서(20)는 상기 현재 프레임(14b)의 제2구문부와 상기 이전 프레임(14a)의 제1구문부(24) 사이의 비교에 기반하여 상기 제2선택을 수행하도록 구성되는 것을 특징으로 하는 디코더.
  4. 제3항에 따른 디코더에 있어서,
    만약 상기 현재 프레임(14b)이 상기 제2프레임 타입인 경우, 상기 제1 서브 프레임 타입이 되는 그것의 상기 마지막 서브 프레임과 함께 상기 제2프레임 타입이 되는 상기 이전 프레임(14a) 또는 상기 제1프레임 타입이 되는 상기 이전 프레임(14a)에 의존하여, 상기 파서(20)는 상기 현재 프레임(14b)으로부터 상기 포워드 앨리어싱 취소 데이터(34)의 판독을 수행하도록 구성되며, 만약 이전 프레임이 상기 제1서브 프레임 타입이 되는 그것의 상기 마지막 서브 프레임과 함께 상기 제2프레임 타입이 되는 것이 아니라면, 상기 이전 프레임(14a)이 상기 제1프레임 타입인 경우에 포워드 앨리어싱 취소 이득이 상기 포워드 앨리어싱 취소 데이터(34)로부터 파싱되고, 여기서 상기 복원기(22)는 상기 이전 프레임(14a)이 상기 제1프레임 타입이 되는 경우 상기 포워드 앨리어싱 취소 이득에 의존하는 강도에서 상기 포워드 앨리어싱 취소를 수행하도록 구성되는 것을 특징으로 하는 디코더.
  5. 제4항에 따른 디코더(10)에 있어서,
    상기 파서(20)는, 상기 현재 프레임(14b)이 상기 제1프레임 타입인 경우, 상기 포워드 앨리어싱 취소 데이터(34)로부터 포워드 앨리어싱 취소 이득을 판독하도록 구성되며 상기 복원기는 상기 포워드 앨리어싱 취소 이득에 의존하는 강도에서 상기 포워드 앨리어싱 취소를 수행하도록 구성되는 것을 특징으로 하는 디코더.
  6. 제1항 또는 제2항에 따른 디코더에 있어서,
    상기 제2구문부는
    상기 이전 프레임(14a)은 긴 변형 윈도우를 수반(involve)하는 상기 제1프레임 타입
    상기 이전 프레임(14a)은 짧은 변형 윈도우들을 수반하는 상기 제1프레임 타입
    상기 이전 프레임(14a)은 상기 제1서브 프레임 타입이 되는 그것의 상기 마지막 서브 프레임을 갖는 상기 제2프레임 타입
    상기 이전 프레임(14a)은 상기 제2서브 프레임 타입이 되는 그것의 상기 마지막 서브 프레임을 갖는 상기 제2프레임 타입,
    을 포함하는 가능성들의 집합 중 각 하나와 고유하게 연동되는 가능한 값들의 집합을 가지며
    상기 파서는 상기 이전 프레임(14a)의 상기 제1구문부(24) 및 상기 현재 프레임(14b)의 상기 제2구문부 사이의 비교에 기반하여 상기 제2선택을 수행하며, 상기 현재 프레임(14b)으로부터 상기 포워드 앨리어싱 취소 데이터(34)의 판독을 수행하며, 상기 이전 프레임(14a)이 상기 제1프레임 타입인 경우, 상기 이전 프레임(14a)가 상기 긴 변형 윈도우를 수반하는 경우, 포워드 앨리어싱 취소 데이터(34)의 양이 더 크고(greater), 상기 이전 프레임(14a)이 상기 짧은 변형 윈도우들을 수반하는 경우 더 낮은(lower) 긴 변형 윈도우들 또는 짧은 변형 윈도우들을 수반하는 상기 이전 프레임(14a)에 의존하는 것을 특징으로 하는 디코더.
  7. 제2항 내지 제6항 중 어느 한 항에 따른 디코더(10)에 있어서,
    상기 복원기는,

    상기 제1프레임 타입의 프레임 당(per frame), 상기 제1프레임 타입의 새벽 프레임 내에서 스케일 인자(scale factor) 정보에 기반하여 상기 제1프레임 타입의 개별 프레임 내에서 변형 계수 정보의 스펙트럼 변화 비-양자화(70) 를 수행하며, 상기 제1프레임 타입의 개별 프레임과 연동된 상기 시간세그먼트를 지나고 넘어, 시간적으로, 연장하는 재-변형된 신호 세그먼트(78)을 얻기 위해 상기 비-양자화된 변형 계수 정보를 재-변형하며,

    상기 제2프레임 타입의 프레임 당(per frame),

    상기 제2프레임 타입의 개별 프레임의 제1서브 프레임의 서브 프레임 당,

    상기 제2프레임 타입의 개별 프레임 내에 LPC 정보로부터 스펙트럼 가중 필터를 유도하고(94),

    상기 스펙트럼 가중 필터를 이용하여 상기 제1서브 프레임 타입의 개별 서브 프레임 내에 변형 계수 정보를 스펙트럼적으로 가중하며(96),

    상기 제1서브 프레임 타입의 상기 개별 서브 프레임과 연동된 상기 시간 세그먼트의 상기 서브 포션(sub portion)을 넘어 지나, 시간적으로, 연장하는 재-복원된 신호 세그먼트를 얻기 위해 스펙트럼적으로 가중된 변형 계수 정보를 재-변형(98)하며,

    상기 제2프레임의 개별 프레임의 제2서브 프레임 타입의 서브 프레임 당,

    상기 제2서브 프레임 타입의 개별 서브 프레임 내에 여기 업데이트 정보(excitation update information)로부터 여기 신호(excitation signal)를 유도하며(100)

    상기 제2서브 프레임 타입의 상기 개별 서브 프레임과 연동된 상기 시간 세그먼트의 상기 서브 포션에 대한 LP 합성된 신호 세그먼트(110)을 얻기 위해 상기 제2프레임 타입의 상기 개별 프레임 내에 상기 LPC 정보를 이용하여 상기 여기 신호 상에 LPC 합성 필터링(102)을 수행하며,

    상기 제1서브 프레임 타입의 서브 프레임들과 연동되는, 시간 세그먼트들의 서브 포션들 및 상기 제1프레임 타입의 프레임들 중 즉시 연속적인 것들의 시간 세그먼트들 사이의 경계들에서 일시적으로 오버랩핑하는 윈도우 포션들 내에 시간-영역 앨리어싱 취소를 수행하도록, 그곳을 지나 상기 정보 신호(18)를 복원하도록 구성되며,

    만약 상기 이전 프레임이 상기 제1서브 프레임 타입이 되는 그것의 마지막 서브 프레임과 함께 상기 제2프레임 타입 또는 상기 제1프레임 타입인 경우, 상기 현재 프레임(14b)는 상기 제2서브 프레임 타입이 되는 그것의 상기 제1서브 프레임을 갖는 상기 제2프레임 타입이며, 상기 이전 및 현재 프레임들(14a, 14b) 사이의 경계를 넘어 상기 정보(18)를 복원하기 위해 상기 이전 시간 세그먼트 내에 상기 재-변형된 신호 세그먼트(78)에 대해 상기 제1포워드 앨리어싱 취소 합성 신호를 추가하고 상기 포워드 앨리어싱 취소 데이터(34)로부터 제1포워드 앨리어싱 취소 합성 신호를 유도하며,

    만약 상기 이전 프레임(14a)이 상기 제2서브 프레임 타입이 되는 그것의 상기 제1서브 프레임을 갖는 상기 제2프레임 타입이라면, 상기 현재 프레임(14b)은 상기 제1서브 프레임 타입이 되는 그것의 마지막 서브 프레임을 갖는 상기 제2프레임 타입 또는 상기 제1프레임 타입이 되고, 상기 포워드 앨리어싱 취소 데이터(34)로부터 제2포워드 앨리어싱 취소 합성 신호를 유도하며 상기 이전 및 현재 시간 세그먼트들(16a, 16b) 사이의 경계를 넘어 상기 정보 신호(18)을 복원하도록 상기 현재 시간 세그먼트(16b) 내에 재-변형된 신호 세그먼트에 대해 상기 제2 포워드 앨리어싱 취소 합성 신호를 더하도록(add) 구성되는 것을 특징으로 하는 디코더.
  8. 제7항에 따른 디코더(10)에 있어서,
    상기 복원기는,
    상기 포워드 앨리어싱 취소 데이터(34)에 의해 포함되는 변형 계수 정보 상에서 재-변형을 수행하는 것에 의해 상기 포워드 앨리어싱 취소 데이터(34)로부터 상기 제1포워드 앨리어싱 취소 합성 신호를 유도하고 및/또는

    상기 포워드 앨리어싱 취소 데이터(34)에 의해 포함되는 변형 계수 정보 상에서 재-변형을 수행하는 것에 의해 상기 포워드 앨리어싱 취소 데이터(34)로부터 상기 제2포워드 앨리어싱 취소 합성 신호를 유도하도록 구성되는 것을 특징으로 하는 디코더.
  9. 제7항 또는 제8항에 따른 디코더에 있어서,
    상기 제2구문부는 포워드 앨리어싱 취소 데이터(34)가 상기 개별 프레임에 존재하는지 아닌지 여부를 신호하는 제1플래그를 포함하고, 상기 파서는 상기 제1플래그에 의존하여 상기 제2선택을 수행하도록 구성되며, 상기 제2구문부는 상기 제2프레임 타입의 프레임들 내에서 단지 제2플래그를 더 포함하며, 상기 제2플래그는 상기 이전 프레임이 상기 제1서브 프레임 타입이 되는 그것의 상기 마지막 서브 프레임을 갖는 상기 제2프레임 타입 또는 상기 제1프레임 타입이 되는지 여부를 신호하는 것을 특징으로 하는 디코더.
  10. 제9항에 따른 디코더에 있어서,
    상기 파서는 상기 현재 프레임(14b)으로부터 상기 포워드 앨리어싱 취소 데이터(34) 판독을 수행하도록 구성되고, 상기 현재 프레임(14b)이 제2프레임 타입인 경우, 상기 제2플래그에 의존하고 포워드 앨리어싱 취소 이득은 상기 이전 프레임이 상기 제1프레임 타입이 되는 경우에 상기 포워드 앨리어싱 취소 데이터(34)로부터 파싱되고, 이전 프레임이 상기 제1서브 프레임 타입이 되는 그것의 상기 마지막 서브 프레임을 갖는 상기 제2프레임 타입이 되는 경우가 아니라면, 상기 복원기는 상기 이전 프레임이 상기 제1프레임 타입이 되는 경우의 상기 포워드 앨리어싱 취소 이득에 의존하는 강도에서 상기 포워드 앨리어싱 취소를 수행하도록 구성되는 것을 특징으로 하는 디코더.
  11. 제10항에 따른 디코더에 있어서,
    상기 제2구문부는 상기 이전 프레임이 긴 변형 윈도우 또는 짧은 변형 윈도우들을 수반하는지 여부를 신호하는 제3플래그를 더 포함하고, 이는 만약 상기 제2플래그가 상기 이전 프레임이 상기 제1프레임 타입이라는 것을 신호하는 경우 상기 제2프레임 타입의 프레임들 내에서 만이며, 상기 파서는 포워드 앨리어싱 취소 데이터(34)의 양이 상기 이전 프레임이 상기 긴 변형 윈도우를 수반하는 경우에는 더 크고, 상기 이전 프레임이 상기 짧은 변형 윈도우들을 수반하는 경우에는 더 작은 상기 제3플래그 상에 의존하여 상기 현재 프레임(14b)로부터 상기 포워드 앨리어싱 취소 데이터(34)의 판독을 수행하도록 구성되는 것을 특징으로 하는 디코더.
  12. 제7항 내지 제11항 중 어느 한 항에 따른 디코더에 있어서,
    상기 복원기는, 상기 이전 프레임이 상기 제1서브 프레임 타입이 되는 그것의 마지막 서브 프레임을 갖는 상기 제2프레임 타입이고 상기 현재 프레임(14b)이 상기 제1서브 프레임 타입이 되는 그것의 마지막 서브 프레임을 갖는 상기 제2프레임 타입 또는 상기 제1프레임 타입인 경우, 상기 현재 시간 세그먼트 내에 상기 재-변형된 신호 세그먼트에 상기 제1앨리어싱 취소 신호 세그먼트를 더하고 제1앨리어싱 취소 신호 세그먼트를 얻기 위해 상기 이전 프레임의 마지막 서브 프레임의 LP 합성 신호 세그먼트 상에서 윈도우잉을 수행하도록 구성되는 것을 특징으로 하는 디코더.
  13. 제7항 내지 제12항 중 어느 한 항에 따른 디코더에 있어서,
    상기 복원기는, 상기 이전 프레임 타임이 상기 제2서브 프레임 타입이 되는 그것의 마지막 서브 프레임을 갖는 상기 제2서브 프레임 타입이고 상기 현재 프레임(14b)는 상기 제1 서브 프레임 타입이 되는 그것의 상기 제1서브 프레임을 갖는 상기 제2프레임 타입 또는 상기 제1프레임 타입이 되는 경우에, 상기 이전 프레임에서 상기 현재 프레임으로 상기 여기 신호 상에서 수행되는 LPC 합성 필터링을 지속하고, 제2앨리어싱 취소 신호 세그먼트를 얻기 위해 상기 현재 프레임(14b) 내에 상기 이전 프레임의 LP 합성 신호 세그먼트의 이와 같이 유도된 지속을 윈도우잉하고 상기 현재 시간 세그먼트 내에 상기 재-변형된 신호 세그먼트에 상기 제2앨리어싱 취소 신호 세그먼트를 더하도록 구성되는 것을 특징으로 하는 디코더.
  14. 제1항 내지 제13항 중 어느 한 항에 따른 디코더에 있어서,
    상기 파서(20)는, 상기 데이터 스트림(12)을 파싱하는 데 있어,
    상기 현재 프레임(14b) 및 상기 이전 프레임(14a)이 상기 시간-영역 앨리어싱 취소 변형 코딩 모드 및 상기 시간-영역 코딩 모드 중 동일 또는 상이한 것들을 이용하여 코딩되는지 여부에 대해 독립적으로 그리고 상기 제2구문부에 의존하여 상기 제2선택을 수행하도록 구성되는 것을 특징으로 하는 디코더.
  15. 정보 신호(18)의 시간 세그먼트들이 코딩되는 프레임들의 시퀀스를 포함하는 데이터 스트림(12)으로 정보 신호(18)를, 각각, 인코딩하기 위한 인코더에 있어서,

    시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 중 먼저 선택된 하나를 이용하여 상기 현재 프레임(14b)의 정보로 상기 정보 신호(18)의 현재 시간 세그먼트(16b)를 코딩하도록 구성되는 생성자(42); 및

    제1구문부(24)는 제1선택을 신호하고, 제1구문부(24) 및 제2구문부를 따라 상기 현재 프레임(14b)로 상기 정보(28)을 삽입하도록 구성되는 인서터(inserter, 44);를 포함하며,

    상기 생성자(24) 및 인서터(44)는

    이전 프레임의 이전 시간 세그먼트 및 현재 시간 세그먼트(16a) 사이의 경계에서 포워드 앨리어싱 취소를 위해 포워드 앨리어싱 취소 데이터(34)를 결정하고 상기 현재 프레임(14b) 및 상기 이전 프레임(14a)가 상기 시간-영역 앨리어싱 취소 변형 코딩 모드 및 상기 시간-영역 코딩 모드 중 상이한 것들을 이용하여 인코딩 되는 경우에 상기 현재 프레임(14b)로 상기 포워드 앨리어싱 취소 데이터(34)를 삽입하며,

    상기 현재 프레임(14b) 및 상기 이전 프레임(14a)가 상기 시간-영역 앨리어싱 취소 변형 코딩 모드 및 상기 시간-영역 코딩 모드의 동일한 것들을 이용하여 인코딩되는 경우에 상기 현재 프레임(14b)로 어떠한 포워드 앨리어싱 취소 데이터(34)를 삽입하는 것을 억제(refraining)하도록 구성되며,

    상기 제2구문부(26)는 상기 현재 프레임(14b) 및 상기 이전 프레임(14a)이 상기 시간-영역 앨리어싱 취소 변형 코딩 모드 및 상기 시간-영역 코딩 모드 중 동일한 또는 상이한 것들을 이용하여 인코딩되는지 여부에 의존하여 설정되는 것을 특징으로 하는 인코더.
  16. 제15항에 따른 인코더에 있어서,
    상기 인코더는,
    만약 상기 현재 프레임(14b) 및 상기 이전 프레임(14a)이 상기 시간-영역 앨리어싱 취소 변형 코딩 모드 및 상기 시간-영역 코딩 모드 중 동일한 것들을 이용하여 인코딩되는 경우, 상기 현재 프레임에서 상기 포워드 앨리어싱 취소 데이터(34)의 부재를 신호하는 제1상태(first state)로 상기 제2구문부를 설정하며, 그리고,

    만약 상기 현재 프레임(14b) 및 상기 이전 프레임(14a)이 상기 시간-영역 앨리어싱 취소 변형 코딩 모드 및 상기 시간-영역 코딩 모드 중 상이한 것들을 이용하여 인코딩되는 경우,

    상기 현재 프레임(14b)에서 상기 포워드 앨리어싱 취소 데이터(34)의 부재를 동일하게 신호하는 상기 제2구문부를 설정하는 것과 함께, 비록 상기 현재 프레임(14b) 및 상기 이전 프레임(14a)이 상기 시간-영역 앨리어싱 취소 변형 코딩 모드 및 상기 시간-영역 코딩 모드 중 상이한 것들을 이용하여 인코딩되더라도 상기 현재 프레임(14b)으로 상기 포워드 앨리어싱 취소 데이터(34)의 입력을 억제, 또는

    상기 현재 프레임(14b)으로 상기 포워드 앨리어싱 취소 데이터(34)의 입력을 동일하게 신호하는 상기 제2구문부를 설정하는 것과 함께 상기 현재 프레임(14b)으로 상기 포워드 앨리어싱 취소 데이터(34)를 삽입하기 위해,

    레이트/왜곡 최적화 감지를 결정하도록 구성되는 것을 특징으로 하는 인코더.
  17. 정보 신호(18)의 시간 세그먼트들이 코딩되는 프레임들의 시퀀스를 포함하는 데이터 스트림(12)을, 각각, 디코딩하는 방법에 있어서,

    상기 데이터 스트림(12)을 파싱하는 단계; 및

    시간-영역 앨리어싱 취소 변형 디코딩 모드 및 시간-영역 디코딩 모드 중 먼저 선택된 하나를 이용하고, 상기 제1선택은 상기 제1구문부(24)에 의존하며, 상기 파싱에 의해 상기 현재 프레임으로부터 얻어진 정보에 기반하여 상기 현재 프레임(14b)와 연동되는 상기 정보 신호(18)의 현재 시간 세그먼트를 복원하는 단계;를 포함하며

    상기 데이터 스트림을 파싱하는 단계는 현재 프레임(14b)로부터 제1구문부(24) 및 제2구문부를 판독하는 것을 포함하며,

    상기 데이터 스트림(12)을 파싱하는 단계에 있어서, 이와 같이 상기 현재 프레임(14b)로부터 포워드 앨리어싱 취소 데이터(34)를 판독하는 것을 포함할 상기 현재 프레임(14b)을 예측하는 제1액션, 이와 같이 상기 현재 프레임으로부터 포워드 앨리어싱 취소 데이터(34)를 판독하지 않는 것을 포함할 상기 현재 프레임(14b)을 비-예측하는 제2액션, 중 두번째로 선택된 하나가 수행되며, 상기 제2선택은 상기 제2구문부에 의존하고,

    상기 복원하는 단계는 포워드 앨리어싱 취소 데이터(34)를 이용하여 이전 프레임의 이전시간 세그먼트 및 현재 시간 세그먼트 사이의 경계에서 포워드 앨리어싱 취소를 수행하는 것을 포함하는 것을 특징으로 하는, 정보 신호(18)의 시간 세그먼트들이 코딩되는 프레임들의 시퀀스를 포함하는 데이터 스트림(12)을 디코딩하는 방법.
  18. 정보 신호(18)의 시간 세그먼트들이 코딩되는 프레임들의 시퀀스를 포함하는 데이터 스트림(12)으로 정보 신호(18)를, 각각, 인코딩하기 위한 방법에 있어서,

    시간-영역 앨리어싱 취소 변형 인코딩 모드 및 시간-영역 인코딩 모드 중 먼저 선택된 하나를 이용하여 상기 현재 프레임(14b)의 정보로 상기 정보 신호(18)의 현재 시간 세그먼트를 코딩하는 단계; 및

    제1구문부(24) 및 제2구문부를 따라 상기 현재 프레임(14b)로 정보를 삽입하는 단계;

    상기 현재 프레임(14b) 및 상기 이전 프레임이 상기 시간-영역 앨리어싱 취소 변형 인코딩 모드 및 상기 시간-영역 인코딩 모드 중 상이한 것들을 이용하여 인코딩 되는 경우에 상기 현재 프레임914b)로 상기 포워드 앨리어싱 취소 데이터(34)를 삽입하며, 상기 현재 프레임(14b) 및 상기 이전 프레임이 상기 시간-영역 앨리어싱 취소 변형 인코딩 모드 및 상기 시간-영역 인코딩 모드 중 동일한 것들을 이용하여 인코딩되는 경우에 상기 현재 프레임(14b)로 어떠한 포워드 앨리어싱 취소 데이터(34)를 삽입하는 것을 억제하며, 이전 프레임의 이전 시간 세그먼트 및 상기 현재 시간 세그먼트 사이의 경계에서 포워드 앨리어싱 취소를 위한 포워드 앨리어싱 취소 데이터(34)를 결정하는 단계; 를 포함하며,

    상기 제1구문부(24)는 상기 제1선택을 신호하며,
    상기 제2구문부는 상기 현재 프레임(14b) 및 상기 이전 프레임이 상기 시간-영역 앨리어싱 취소 변형 인코딩 모드 및 상기 시간-영역 인코딩 모드 중 동일 또는 상이한 것들을 이용하여 인코딩 되는지 여부에 의존하여 설정되는 것을 특징으로 하는 인코딩 방법.
  19. 각 프레임은 제1구문부(24), 제2구문부, 그리고 시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 중 먼저 선택된 하나를 이용하여 상기 개별 프레임과 연동되는 시간 세그먼트가 코딩되는 정보를 포함하며, 상기 제1선택은 상기 개별 프레임의 상기 제1구문부(24)에 의존하고, 각 프레임은 포워드 앨리어싱 취소 데이터(34)를 포함하며 또는 상기 개별 프레임의 상기 제2구문부에 의존하지 않고, 포워드 앨리어싱 취소 데이터(34)를 이용하는 포워드 앨리어싱 취소가 상기 이전 프레임(14a)과 연동되는 이전 시간 세그먼트 및 개별 시간 세그먼트 사이의 경계에서 가능하도록 제2구문부는 개별 프레임이 상기 개별 프레임의 포워드 앨리어싱 취소 데이터(34)를 포함하고 이전 프레임은 시간-영역 앨리어싱 취소 변형 코딩 모드 및 시간-영역 코딩 모드 중 상이한 것들을 이용하여 코딩된다는 것을 표시하며, 정보 신호(18)의 시간 세그먼트들이, 각각, 코딩되는 프레임들의 시퀀스를 포함하는 데이터 스트림(12).
  20. 컴퓨터상에서 구동될 때, 제17항 또는 제18항에 따른 방법을 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이 저장된 기록매체.
KR1020137003325A 2010-07-08 2011-07-07 포워드 앨리어싱 취소를 이용한 코더 KR101456639B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US36254710P 2010-07-08 2010-07-08
US61/362,547 2010-07-08
US37234710P 2010-08-10 2010-08-10
US61/372,347 2010-08-10
PCT/EP2011/061521 WO2012004349A1 (en) 2010-07-08 2011-07-07 Coder using forward aliasing cancellation

Publications (2)

Publication Number Publication Date
KR20130045349A true KR20130045349A (ko) 2013-05-03
KR101456639B1 KR101456639B1 (ko) 2014-11-04

Family

ID=44584140

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137003325A KR101456639B1 (ko) 2010-07-08 2011-07-07 포워드 앨리어싱 취소를 이용한 코더

Country Status (17)

Country Link
US (1) US9257130B2 (ko)
EP (5) EP4372742A2 (ko)
JP (5) JP5981913B2 (ko)
KR (1) KR101456639B1 (ko)
CN (1) CN103109318B (ko)
AR (1) AR082142A1 (ko)
AU (1) AU2011275731B2 (ko)
BR (3) BR122021002034B1 (ko)
CA (1) CA2804548C (ko)
ES (3) ES2710554T3 (ko)
MX (1) MX2013000086A (ko)
MY (1) MY161986A (ko)
PL (3) PL3451333T3 (ko)
PT (2) PT3451333T (ko)
SG (1) SG186950A1 (ko)
TW (1) TWI476758B (ko)
WO (1) WO2012004349A1 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2009267518B2 (en) * 2008-07-11 2012-08-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
EP2524374B1 (en) * 2010-01-13 2018-10-31 Voiceage Corporation Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering
PL3451333T3 (pl) * 2010-07-08 2023-01-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder wykorzystujący kasowanie aliasingu w przód
SG192721A1 (en) * 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
ES2634621T3 (es) 2013-02-20 2017-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple
US10043528B2 (en) * 2013-04-05 2018-08-07 Dolby International Ab Audio encoder and decoder
CN105453173B (zh) 2013-06-21 2019-08-06 弗朗霍夫应用科学研究促进协会 利用改进的脉冲再同步化的似acelp隐藏中的自适应码本的改进隐藏的装置及方法
SG11201510463WA (en) 2013-06-21 2016-01-28 Fraunhofer Ges Forschung Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pitch lag estimation
CN105556601B (zh) * 2013-08-23 2019-10-11 弗劳恩霍夫应用研究促进协会 用于使用交叠范围中的组合来处理音频信号的装置及方法
WO2015071173A1 (en) 2013-11-13 2015-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder for encoding an audio signal, audio transmission system and method for determining correction values
EP2980796A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
KR101892086B1 (ko) 2016-05-19 2018-08-27 주식회사 삼양사 옥심에스테르 유도체 화합물, 이를 포함하는 광중합 개시제, 및 감광성 조성물
US10438597B2 (en) * 2017-08-31 2019-10-08 Dolby International Ab Decoder-provided time domain aliasing cancellation during lossy/lossless transitions
KR101991903B1 (ko) 2017-12-07 2019-10-01 주식회사 삼양사 카바졸 옥심에스테르 유도체 화합물 및 이를 포함하는 광중합 개시제와 감광성 조성물
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
KR102228630B1 (ko) 2018-12-28 2021-03-16 주식회사 삼양사 카바졸 멀티 베타 옥심에스테르 유도체 화합물 및 이를 포함하는 광중합 개시제와 포토레지스트 조성물
US11488613B2 (en) * 2019-11-13 2022-11-01 Electronics And Telecommunications Research Institute Residual coding method of linear prediction coding coefficient based on collaborative quantization, and computing device for performing the method

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69926821T2 (de) * 1998-01-22 2007-12-06 Deutsche Telekom Ag Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
US7516064B2 (en) 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
JP4977471B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
KR100878766B1 (ko) * 2006-01-11 2009-01-14 삼성전자주식회사 오디오 데이터 부호화 및 복호화 방법과 장치
US20070168197A1 (en) 2006-01-18 2007-07-19 Nokia Corporation Audio coding
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
BRPI0718738B1 (pt) 2006-12-12 2023-05-16 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo
CN101231850B (zh) * 2007-01-23 2012-02-29 华为技术有限公司 编解码方法及装置
PL2165328T3 (pl) * 2007-06-11 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną
RU2515704C2 (ru) * 2008-07-11 2014-05-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
AU2009267518B2 (en) * 2008-07-11 2012-08-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
KR20100007738A (ko) * 2008-07-14 2010-01-22 한국전자통신연구원 음성/오디오 통합 신호의 부호화/복호화 장치
PL2146344T3 (pl) * 2008-07-17 2017-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście
US9037474B2 (en) * 2008-09-06 2015-05-19 Huawei Technologies Co., Ltd. Method for classifying audio signal into fast signal or slow signal
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
KR101649376B1 (ko) * 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101315617B1 (ko) * 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
KR101797033B1 (ko) * 2008-12-05 2017-11-14 삼성전자주식회사 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
WO2010125228A1 (en) 2009-04-30 2010-11-04 Nokia Corporation Encoding of multiview audio signals
KR20100136890A (ko) * 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
RU2557455C2 (ru) * 2009-06-23 2015-07-20 Войсэйдж Корпорейшн Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
US9613630B2 (en) * 2009-11-12 2017-04-04 Lg Electronics Inc. Apparatus for processing a signal and method thereof for determining an LPC coding degree based on reduction of a value of LPC residual
EP2524374B1 (en) * 2010-01-13 2018-10-31 Voiceage Corporation Audio decoding with forward time-domain aliasing cancellation using linear-predictive filtering
US9275650B2 (en) * 2010-06-14 2016-03-01 Panasonic Corporation Hybrid audio encoder and hybrid audio decoder which perform coding or decoding while switching between different codecs
PL3451333T3 (pl) * 2010-07-08 2023-01-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder wykorzystujący kasowanie aliasingu w przód
TWI480860B (zh) * 2011-03-18 2015-04-11 Fraunhofer Ges Forschung 音訊編碼中之訊框元件長度傳輸技術

Also Published As

Publication number Publication date
BR112013000489B1 (pt) 2021-06-01
KR101456639B1 (ko) 2014-11-04
EP2591470B1 (en) 2018-12-05
JP2021006924A (ja) 2021-01-21
PL4120248T3 (pl) 2024-05-13
EP2591470A1 (en) 2013-05-15
MX2013000086A (es) 2013-02-26
JP2016006535A (ja) 2016-01-14
JP2019032550A (ja) 2019-02-28
PL2591470T3 (pl) 2019-05-31
TWI476758B (zh) 2015-03-11
AR082142A1 (es) 2012-11-14
PT3451333T (pt) 2022-11-22
MY161986A (en) 2017-05-31
BR122021002104B1 (pt) 2021-11-03
AU2011275731B2 (en) 2015-01-22
PT2591470T (pt) 2019-04-08
ES2930103T3 (es) 2022-12-05
SG186950A1 (en) 2013-02-28
ES2968927T3 (es) 2024-05-14
EP4120248C0 (en) 2023-12-20
JP2013532310A (ja) 2013-08-15
CN103109318B (zh) 2015-08-05
US9257130B2 (en) 2016-02-09
JP7488926B2 (ja) 2024-05-22
TW201222529A (en) 2012-06-01
EP4322160A2 (en) 2024-02-14
JP2023071685A (ja) 2023-05-23
CN103109318A (zh) 2013-05-15
BR122021002034B1 (pt) 2021-11-03
EP4322160A3 (en) 2024-05-08
AU2011275731A1 (en) 2013-02-21
PL3451333T3 (pl) 2023-01-23
US20130124215A1 (en) 2013-05-16
CA2804548A1 (en) 2012-01-12
WO2012004349A1 (en) 2012-01-12
JP5981913B2 (ja) 2016-08-31
CA2804548C (en) 2016-06-21
EP3451333A1 (en) 2019-03-06
JP6417299B2 (ja) 2018-11-07
ES2710554T3 (es) 2019-04-25
EP3451333B1 (en) 2022-09-07
RU2013105268A (ru) 2014-08-20
JP6773743B2 (ja) 2020-10-21
EP4120248B1 (en) 2023-12-20
JP7227204B2 (ja) 2023-02-21
EP4372742A2 (en) 2024-05-22
EP4120248A1 (en) 2023-01-18

Similar Documents

Publication Publication Date Title
JP7488926B2 (ja) フォワードエイリアシング消去を用いた符号化器
KR101227729B1 (ko) 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더
KR101315617B1 (ko) 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
US11475901B2 (en) Frame loss management in an FD/LPD transition context
US9984696B2 (en) Transition from a transform coding/decoding to a predictive coding/decoding

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170926

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181015

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191015

Year of fee payment: 6