KR20100134635A - 여러 필터 뱅크 도메인 간의 변환을 위한 방법 및 장치 - Google Patents

여러 필터 뱅크 도메인 간의 변환을 위한 방법 및 장치 Download PDF

Info

Publication number
KR20100134635A
KR20100134635A KR1020107022192A KR20107022192A KR20100134635A KR 20100134635 A KR20100134635 A KR 20100134635A KR 1020107022192 A KR1020107022192 A KR 1020107022192A KR 20107022192 A KR20107022192 A KR 20107022192A KR 20100134635 A KR20100134635 A KR 20100134635A
Authority
KR
South Korea
Prior art keywords
domain
filter bank
mdct
psdo
filter
Prior art date
Application number
KR1020107022192A
Other languages
English (en)
Other versions
KR101589709B1 (ko
Inventor
피터 잭스
스벤 코든
Original Assignee
톰슨 라이센싱
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 톰슨 라이센싱 filed Critical 톰슨 라이센싱
Publication of KR20100134635A publication Critical patent/KR20100134635A/ko
Application granted granted Critical
Publication of KR101589709B1 publication Critical patent/KR101589709B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

필터 뱅크는 다른 구조와 다른 개별의 출력 신ㅎ 도메인을 가질 수 있다. 여러 필터 뱅크 도메인 간의 변환이 때로 요망된다. 보통, 주파수에 대해 변하는 매핑 행렬이 이용된다. 이는 상다한 양의 룩업 테이블을 필요로 한다. 제1 필터 배읔 도메인(DS)의 제1 데이터 프레임을 다른 제2 필터 뱅크 도메인(DT)의 제2 데이터 프레임으로 변환하기 위한 방법은 상기 제1 필터 뱅크 도메인(DS)의 부대역((m-1), mp3(m), mp3(m+1))을 상기 제2 필터 뱅크 도메인에 대응하지만 왜곡 위상을 갖는 중간 도메인(Di)의 부대역(psdo(m-1), psdo(m), psdo(m+1))으로 트랜스코딩 (transcoding)하는 단계; 및 상기 중간 도메인(Di)의 상기 부대역(psdo(m-1), psdo(m), psdo(m+1))을 제2 필터 뱅크 도메인 (DT)의 부대역(MDCT(m-1), MDCT(m), MDCT(m+1))로 트랜스코딩하는 단계를 포함하고, 이 때 위상 정정(SSc, PCp, PC, PCn)은 상기 중간 도메인(Di)의 부대역에 대해 실행된다.

Description

여러 필터 뱅크 도메인 간의 변환을 위한 방법 및 장치{METHOD AND APPARATUS FOR TRANSFORMING BETWEEN DIFFERENT FILTER BANK DOMAINS}
본 발명은 여러 필터 뱅크 도메인 간의 변환을 위한 방법 및 장치에 관한 것이다.
필터 뱅크 (filter bank)는 보통 여러 도메인 (domain) 신호 사이, 예를 들어 시간 도메인 신호와 주파수 도메인 신호 간에서 몇 종류의 변환을 실행한다. 필터 뱅크는 여러 구조와 여러 개별의 출력 신호 도메인을 가질 수 있다. 많은 경우, 여러 필터 뱅크 도메인 간의 전환이 요망되고 있다.
유럽 특허 출원 EP06120969는 시간 도메인을 이용하지 않고, 여러 시간-주파수 분석 도메인을 갖는 암호화 포맷 간의 트랜스코딩 (transcoding)을 위한 방법 및 장치를 개시하고, 이 때 선형 매핑이 이용된다. 따라서, 단일의 트랜스코딩 단계만이 실행되는 것이 요구되며, 연산 복잡성은 중간 시간 도메인 신호를 이용하는 시스템에서 보다 더 낮다. EP06120969에 개시된 가장 중요한 실시예 중 하나가 무손실 오디오 압축을 위해 MP3 하이브리드 필터 뱅크 (hybrid filter bank)에서 정수 MDCT 도메인 (Integer MDCT doamin)으로의 매핑 (mapping)이다. 트랜스코딩 단계는 코덱의 압축율에 상당한 영향을 준다. 이 매핑을 위한 간단한 방법은 소스 필터 계수를 MP3 도메인에서 시간 도메인 샘플로 완전히 복호화한 다음에, MDCT 분석 필터 뱅크를 적용하는 것이다. EP06120969에서 제공된 방법은 시간 도메인을 생략하고, MP3 필터 뱅크 도메인에서 MDCT 도메인으로의 직접적인 매핑을 적용한다. 이 방법에서는, 대략 대각선이지만 주파수에 따라 변하는 많은 매핑 행렬이 이용된다. 따라서, 이 간단한 방법은 상당한 양의 룩업 테이블을 필요로 하게 된다.
변환된 이산 코사인 변환 (modified discrete cosine transform; MDCT)은 이산 코사인 변환(DCT)에 기초하는 퓨리에 (Fourier) 변환의 종류이다. 이것은 후속의 프레임이 중첩하는 연속적인 프레임 상에서 실행되는 것으로 인한, 겹쳐지는 성질 및 그 신호 에너지의 양호한 압축으로 인해 장점이 있다. MP3 코덱에서, MDCT는 32 대역의 다상 직교 필터 (polyphase quadrature filter; PQF) 뱅크의 출력에 적용된다. MDCT 필터 출력은 보통 PQF 필터 뱅크의 통상적인 앨리어싱 (aliasing)을 줄이기 위해 앨리어스 감소가 사후에 처리된다. 이와 같이 필터 뱅크와 MDCT의 조합을 하이브리드 필터 뱅크 또는 부대역 MDCT로 부른다.
해결할 문제는 매핑 행렬의 크기 또는 대응하는 룩업 테이블을 줄이는 것으로, 더욱 효과적인 실현을 가능하게 하는 것이다.
본 발명은 단일 단계의 매핑을 두 개별의 단계로 분해함으로써, 매핑 행렬의 크기와, 대응하는 룩업 테이블의 감소를 실현하고, 이 때 중간 필터 뱅크 도메인이 이용된다. 이러한 매핑의 분해는 더욱 정규의 구조를 갖는 더 간단한 매핑 테이블이 결과되므로, 매우 효율적으로 압축될 수 있다는 것이 알려졌다. 예시적으로, 테이블을 매핑하는 데에 필요한 저장 공간양을 10 이상의 계수만큼 감소시킬 수 있다. 다른 장점으로, 연산의 복잡성의 증가가 매우 낮다. 또한, 가중 수단, 필터링 수단 및 가산기로 특정 매핑을 실행하는 장치를 실현할 수 있다.
본 발명의 일 형태에 따르면, 제1 필터 뱅크 도메인의 제1 데이터 프레임에서 다른 제2 필터 뱅크 도메인의 제2 데이터 프레임으로 변환하기 위한 방법은, 상기 제1 필터 뱅크 도메인의 부대역(sub-bands)을 상기 제2 필터 뱅크 도메인에 대응하지만 왜곡 위상을 갖는 중간 도메인의 부대역으로 트랜스코딩하는 단계; 및 상기 중간 도메인의 상기 부대역을 제2 필터 뱅크 도메인의 부대역으로 트랜스코딩하는 단계를 포함하고, 이 때 위상 정정이 상기 중간 도메인의 부대역에 대해 실행된다.
보통, 시간 신ㅎ를 중간 필터 뱅크 도메인과 제2 필터 뱅크 도메인의 부대역으로 트랜스코딩하는 단계는 코사인 함수를 포함하는 변환으로 표현될 수 있다. 다음에, 중간 필터 뱅크 도메인의 왜곡된 위상은 h사인 함수의 주파수 의존 가산 위상 항에 대응한다.
또한, 본 발명의 일 실시예에서, 제1 필터 뱅크 도메인의 부대역을 중간 필터 뱅크 도메인의 부대역으로 트랜스코딩하는 단계는 제1 필터 뱅크 도메인의 부대역으로부터 잔여의 앨리어스 항을 제거하는 단계를 포함한다. 이런 잔여의 앨리어스 항은 제1 필터 뱅크 도메인, 예를 들어 MP3 다상 필터 뱅크에 대응하는 필터 뱅크에 의해 형성된다. 일 실시예에서, 매핑 행렬이 이용되고, 이들 각각은 이들의 주 대각선을 따라 개별의 하지만 동일한 부행렬을 그리고 다른 위치에서는 영을 포함한다.
일 실시예에서, 중간 도메인의 상기 부대역을 제2 필터 뱅크 도메인의 부대역으로 트랜스코딩하는 단계는 부대역 그룹 사인 정정(또한, 여기에서 부대역 사인 정정으로 불림)을 포함한다. 그룹은 하나 이상의 필터 뱅크 도메인 부대역을 포함한다. 필터 뱅크 도메인 부대역은 또한 "빈"으로 불린다. 부대역 그룹 사인 정정은 빈의 그룹으로 불리고 중간 도메인 신호의 모든 다른 부대역 그룹의 역을 포함한다.
본 발명의 다른 형태에 따르면, 제1 필터 뱅크 도메인의 제1 데이터 프레임을 다른 제2 필터 뱅크 도메인의 제2 데이터 프레임으로 변환하기 위한 장치는 제1 필터 뱅크 도메인의 부대역을 왜곡된 위상을 갖는 상기 제2 필터 뱅크 도메인에 대응하는 중간 도메인의 부대역으로 트랜스코딩하기 위한 제1 트랜스코딩 수단 - 이때 잔여의 앨리어스 항은 제거됨 - ; 및 상기 중간 도메인의 상기 부대역을 제2 필터 뱅크 도메인의 부대역으로 트랜스코딩하기 위한 제2 트랜스코딩 수단을 포함하고, 상기 제2 트랜스코딩 수단은 상기 중간 도메인의 상기 부대역에 대해 위상 정정을 실행하기 위한 위상 정정 수단을 포함한다.
일 실시예에서, 상기 위상 정정은 매핑 행렬을 적용하기 위해 연산 수단 (예를 들어, 마이크로프로세서, DSP 또는 그 일부)에 의해 실행되는 한편, 다른 실시예에서는 제2 트랜스코딩 수단에서의 상기 위상 정정이 가중을 위한 가중 수단과 중간 도메인의 가중된 부대역 계수를 필터링하기 위한 필터 수단에 의해 실행된다.
본 발명의 바람직한 실시예는 첨부한 청구범위, 다음 상세한 설명 및 도면에서 개시된다.
본 발명의 예시의 실시예들은 첨부한 도면을 참조하여 설명된다.
도 1은 단일 단계의 매핑을 위한 아키텍처의 구조도이다.
도 2는 연속창에 대한 위상 정정 단계의 예시적 구현도이다.
도 3은 본 발명에 따른 예시의 아키텍처 또는 플로우챠트의 구조도이다.
도 4는 예시의 일반 구현 구조도이다.
도 5는 저 레이턴시(latency)를 위한 예시의 구현 구조도이다.
도 6은 중간 의사-MDCT 매핑 (연속창)에 대한 MP3의 완전 개선된 앨리어스 보상 행렬의 예시도.
도 7은 도 6의 예시의 완전 개선된 앨리어스 보상 행렬의 개별적 타일을 나타내는 도면이다.
도 8은 부대역 사인 정정을 나타내는 도면이다.
도 9는 왜곡된 중간 필터 뱅크 도메인 내의 가산 위상 항의 값을 나타내는 도면이다.
도 10은 MP3 필터 뱅크, 원래의 MDCT 및 왜곡된 의사 MDCT의 커널 함수 (연속창)의 비교도이다.
도 1은 EP06120969에 개시된 단일 단계의 매핑 과정을 나타낸다. MP3 계수를 갖는 각 프레임 mp3(m)은 MDCT 계수의 세 연속적 프레임 MDCT(m-1), MDCT(m), MDCT(m+1)에 기여한다. 반대로, 각 MDCT 프레임은 세 MP3 프레임으로부터의 기여를 조합한 것이다. 매핑은 개별의 행렬, Tp, T, Tn에 의해 실행되고, 이 때 일 행렬 Tp는 이전의 MDCT 프레임에 기여하고 일 행렬 Tn은 다음 MDCT 프레임에 기여한다.
각 창 유형에는 세 개의 행렬 Tp, T, Tn이 관련되어 있고, 두 MP3 필터 뱅크 모메인과 MDCT 도메인에는 네 개의 다른 창 유형 (연속(long), 단속(short), 시작(start) 및 정지(stop) 창)이 있기 때문에, 총 12개의 행렬이 저장되어야 한다. 모든 행렬이 다른 것은 아니고: 시작과 연속 창의 Tp는 동일하고, 정지와 연속 창의 Tn이 또한 동일할 수 있다. 그렇지만, 약 175kBytes의 총 메모리양이 예를 들어, 45dB의 허용 가능한 매핑 정확도를 성취하는 데에 필요한 룩업 테이블을 저장하는 데에 필요하다. 창 유형/블럭 길이는 시간 경과에 따라 변할 수 있지만, 입력과 출력 도메인에서 동일할 필요는 없음에 유의해야 한다. 여기에서 "프레임"이라고 불리는 것은 MP3 용어에서 또한 "그래뉼(granule)"로 불린다. 그러나, 더욱 일반적인 용어 "프레임"이 이하에서 이용된다.
아래 나타내는 바와 같이, 완전 매핑 행렬에서의 특정한 대칭으로 인해, 공지의 단일 단계의 매핑은 일련의 다수의 부단계로 분해될 수 있다. 이 분해는 이하에서 도입되는 바와 같이, 왜곡된 위상을 갖는 의사-MDCT (pseudo-MDCT)에 기초한다.
일반적으로, 필터 뱅크 도메인은 커널 함수와 코사인 함수로 표현될 수 있다. MP3 하이브리드 필터 뱅크의 커널 함수와 MDCT의 (또는 일반적으로 두 필터 뱅크 도메인 간의) 밀접한 비교로 "의사-MDCT"의 정의를 가져오고, 이는 정상 MDCT와 동일한 커널 함수를 가지지만, 코사인 함수의 아규먼트 (argument)에 가산되는 주파수 의존 위상 항을 갖는다. 이 의사-MDCT는 MP3로부터 목표의 (원래의) MDCT 필터 뱅크 도메인으로의 두 단계의 트랜스코딩 방법에서 중간 도메인으로 이용된다.
원래의 MDCT는 다음의 정의를 갖는다.
Figure pct00001
Figure pct00002
여기에서 n은 시간 지수이고, i는 주파수 지수이고, M은 MDCT의 길이를 나타내고, 즉 변환은 M개의 주파수 빈 (부대역)을 생성하는 반면, 시간 도메인 분석 창 w(n)의 길이는 2M이다. 커널 함수 c(n,i)는 MDCT의 시간 도메인 앨리어스 보상 (TDAC) 속성의 원인이 된다.
윈도우 함수 w(n)는 mp3 코덱에 적용되는 적응성 윈도우 전환 과정에 따라서, "연속", "단속", "시작" 및 "정지"로 이름붙혀진 네 개의 형상 중에서 하나일 수 있다. 연속 창에 대해서
Figure pct00003
이하, 주파수 의존 위상 항목 φi을 코사인 함수의 아규먼트에 가산하여 MDCT의 정의에서 코사인 항 c(n, i)의 정의를 변형시킨다:
Figure pct00004
MDCT 커널 함수와 MP3 하이브리드 필터 뱅크의 커널 함수와의 비교는 대응하는 커널 함수 간의 상관을 동일한 지수 i=1,...,M로 대략 최대화하는 다음의 구간적 선형 위상 왜곡 함수를 생성한다:
Figure pct00005
가산 위상 항 φi을 도 9에 나타내었다. 이 위상 항은 모든 창 형상에 대해 동일하다.
코사인 함수의 아규먼트에 φi을 가산한 것으로 인해, 의사-MDCT는 완전한 재구성 속성을 갖지 않게 되는 것에 유의해야 한다. 그 TDAC 속성을 잃게 되므로, 진정한 MDCT가 되지 않는다. 새로운 커널 함수가 분석-합성 필터 뱅크 쌍으로 적용되면, 시간 도메인 앨리어싱 오류가 있게 된다. 그러나, 신호 대 잡음비는 약 50dB뿐이다. 이 트랜스코딩 정밀도는 대부분의 애플리케이션에서 충분하다.
변형(midification)을 설명하기 위해서, 도 10은 MP3 필터 뱅크, 원래 위상을 갖는 MDCT 및중간 포맷으로 왜곡된 위상을 갖는 MDCT의 처음 54 커널 함수 (각 18개의 빈의 세 부대역)을 나타낸다. MDCT의 위상 변형(phase modification)은 MP3 필터 뱅크의 것과 우수하게 일치하는 미세 구조의 결과를 가져온다는 것을 알 수 있다. 더욱, MP3 필터 뱅크의 부대역 사인 변경이 반영되며, 이는 이하에서 더욱 상세히 설명된다.
도 3은 적어도 MP3의 MDCT 매핑에 적합한, 본 발명의 일 형태에 따른 예시의 플로우챠트의 구조를 나타낸다. 그러나, 이 원리는 여러 필터 뱅크 도메인 간의 매핑에 또한 적용될 수 있다. 원칙적으로, 분해된 매핑은 먼저 MP3 복호화된 주파수 빈을 중간 도메인으로 작용하는 의사-MDCT 도메인으로 트랜스코딩한 다음에, 의사-MDCT 도메인으로부터 목표의 MDCT 도메인으로 트랜스코드하기 위해 위상 정정을 실행하는 것으로 두 주요 단계로 실현된다. 두 주요 단계는 더 작은 부단계에서 또는 특정한 유효 구현으로 다시 실현될 수 있다.
도 1의 단일 단계의 과정과 비교하여, 다단계 방법은 더욱 복잡하게 보이고, 사실상 약간 더욱 알고리즘적인 연산이 관련되어 있다. 그러나, 개별의 단계 각각의 수치 연산의 구조는 단일 단계의 행렬의 것 보다 덜 복잡하다. 이것이 필요한 룩업 테이블 (및 이에 의해 필요한 메모리 공간)의 크기를 상당히 줄이는 것을 가능하게 한다. 부단계 각각에 대한 더욱 상세한 사항을 이하에 제공한다.
의사-MDCT 도메인은 완전한 재구성 분석-합성 필터 뱅크에 관련되지 않고, 두 단계 매핑은 이 불완전한 필터 뱅크 도메인으로 트랜스코딩하고 이 도메인부터 트랜스코딩하는 것에 대응하기 때문에, 총 매핑 정밀도는 중간 표시의 신호 대 잡음 비율로 제한되게 된다. 따라서, (행렬의 클리핑 (clipping) 이나 양자화 없이) 두 단계 방법의 가장 성취 가능한 매핑 정밀도는 약 50-60dB이고, 이는 대부분의 애플리케이션에는 충분한 것이다.
이하에서, 개선된 앨리어스 보상 (Enhanced Alias Compensation (EAC))이 설명된다. 이 단계의 목적은, MP3 다상 필터 뱅크로부터, 즉 MP3 주파수 빈으로부터 발원되는 잔여의 앨리어스 항을 제거하기 위한 것이다. 따라서, 이 단계는 상술된 바와 같이, MP3 필터 뱅크 도메인(소스 필터 뱅크 도메인)에서 왜곡된 의사-MDCT (중간 필터 뱅크 도메인으로 작용하는 왜곡된 목표의 필터 뱅크 도메인)으로의 매핑 과정을 제공한다.
각 매핑 행렬 EACp, EAC, EACn은 MP3 합성 행렬을 의사-MDCT 필터 뱅크의 분석 행렬로 증가시켜 구할 수 있다. 시간 이동이 이전의 프레임과 다음 프레임에의 기여를 위해 부가하여 적용된다.
예시적으로 연속창에 대한, 최종 완전 행렬을 도 6에 도시하였다. 나타낸 바와 같이, 변환 계수 대부분은 0이고, 전혀 연산을 필요로 하지 않는다. 특히, 이전 프레임 EACp에 대한 기여 행렬과 다음 프레임 EACn에 대한 기여 행렬에 대해서, 완전 행렬은 실질적으로 주요 대각선을 따라 31회 반복된 개별의 "타일" 또는 서브행렬로 구성된다는 것을 또한 알 수 있다.
개선된 앨리어스 보상 행렬 EAC, EACp, EACn 각각에 하나씩인, 세 개의 기본 타일이 모든 네 개의 창 유형 tp1, tp2, tp3, tp4에 대해 도 7에 나타내었다. 타일은 원리상 MP3 하이브리드 필터 뱅크에 대한 복잡한 앨리어스 보상의 종류를 나타낸다.
상술된 예에서, tp1은 "연속", tp2는 "시작", tp3는 "정지" 및 tp4는 "단속"에 대응한다. 상술된 부행렬은 이 예에서 유형 "연속", "시작" 및 "정지"에 대해서는 크기 18x18을, 유형 "단속"에 대해서는 크기 18x36을 갖는다 (그러나 EACn 및 EACp의 경우에 모든 다른 컬럼 (column)이 영이기 때문에, 계수의 개수는 동일하다). 여러 필터 뱅크 도메인에 대해서, 크기는 다를 수 있다.
이하에서, 유효한 저장 및 연산을 실행하는 최종 가능성이 설명된다. 도 10에 나타낸 12개의 타일은 유리한 유사성을 갖는다. 가장 중요한 것들은 다음과 같다:
먼저, EAC(tp1) 타일은 주 대각선 및 반 대각선에서만 영이 아닌 계수를 갖는다. 따라서, 이 타일은 매우 제한된 노력으로 저장 및 연산될 수 있다.
둘째, 타일 EAC(tp2) 및 EAC(tp3)는 타일 EAC(tp1)에다가 타일 전체에 대한 몇 부가의 저 레벨의 계수를 더한 것으로 이루어진다. 따라서, 몇 메모리는 EAC(tp2)/EAC(tp3)와 EAC(tp1) 간의 차이를 저장하는 것 만으로 세이브될 수 있다. 나머지 저레벨 계수는 낮거나 매우 더 낮은 정확도로 저장될 수 있으므로, 계수 당 비트수 및 이에 따라 필요한 메모리 면적은 더 작아진다.
일 실시예에서, 하나의 행렬 또는 단위 행렬의 대각선이 도 6의 행렬에 이용되는 실재 EAC 타일을 얻기 위해 중간 컬럼 (즉, 부행렬)의 도시된 EAC 타일에 부가된다. 즉, 대각선의 값은 일 행렬의 양의 오프세트를 가지므로, 저장되는 값은 더 작아진다. 또한, 단속 창에 대한 동질의 종횡비 효과를 알 수 있게 된다.
세째, EACp(tp2)는 EACp(tp1)과 동일하고, EACn(tp3)는 EACn(tp1)과 동일하다.
네째, 기여 행렬 EACp(tp12) 및 EACn(tp1)은 이들의 합과 차를 이용하여 매우 효율적으로 저장 및 연산될 수 있다는 관점에서 유사하다. 즉, 차이 EACp(tp1)-EACn(tp1)은 대각선과 비대각선으로 이루어진 EAC(tp1)타일과 유사한 구조를 갖는다. 유효한 저장 및 연산은 EACp(tp1) 및 EACn(tp1)을 공동으로 저장 및 연산하는 것으로 가능하게 된다.
다섯째, 타일 EACp(tp4) 및 EACn(tp4)은 컬럼 중 일부가 영이거나 영 근처인 점에서 성긴 형태를 이룬다(sarse). 이들 컬럼은 저장 또는 연산될 필요가 없다.
바람직하게, 종래의 매핑 행렬의 주파수 의존성은 이들 타일 내의 적은 변형으로 변환되게 되고, 이는 개선된 앨리어스 보상 행렬 EAC, EACp, EACn 내에서 모든 18개의 부대역 (또는 주파수 빈)이 반복된다. 더이상의 주파수 의존성은 매핑에 남아있지 않다.
이하에서는, 부대역 사인 정정 (sub-band sign correction; SSC)이 설명되며, 이는 중간 도메인 Di에서 목표의 필터 뱅크 도메인 DT로의 제2 변환 단계에서의 하나의 부단계로 이용된다. 여기에서 용어 부대역 사인 정정은 필터 뱅크 도메인 부대역 ("빈")의 그룹을 말한다. 예를 들어, 도 8 및 도 9에서 균일한 사인 정정이 적용되는 부대역은 18개의 필터 뱅크 도메인 부대역 또는 빈을 포함한다. 도 3에 나타낸 바와 같이, 부대역 사인 정정은 중간 도메인, 예를 들어, 의사-MDCT의 부대역 계수 psdo(m-1), psdo(m), psdo(m+1)를 입력으로 수신한다.
수학식 4 및 5의 위상 변형(phase modification) 항 φi은 MP3 다상 필터 뱅크의 모든 다른 부대역의 역(inversion)을 포함한다. 즉, 매 18 빈 후에는, 항 φi이 π만큼 뛴다 이것은 더 작은 MP3 필터 뱅크의 행동을 반영한다. 따라서, 부대역 사인 정정은 소스 필터 뱅크 특성에 적합하다.
의사-MDCT에서 정수 MDCT로의 매핑에 대해, 제1 단계는 부대역 사인 정정 (SSC)를 적용하여 부대역의 이들 교대하는 사인의 정정을 포함하고, 이 때 의사-MDCT 값은 도 8에 나타낸 SSC 함수로 증가된다.
다른 매핑 단계가 원래의 MDCT와 비교하여, 왜곡된 의사-MDCT의 가산 위상 항을 보상하기 위해 필요하다. 개별의 위상 정정은 이용되는 창 유형 (tp1-tp4, 예를 들어, 연속, 시작, 단속, 정지) 각각에 대해 그리고 각 전환시에(연속에서 연속으로, 단속에서 단속으로) 필요하다. 위상 정정은 예를 들어, 매핑 행렬을 적용함으로써 실행될 수 있다. 일 실시예에서, 이들 매핑 행렬의 특정 구조로 인해, 주파수 도메인 빈의 가중에 필터링을 더한 방법이 이용될 수 있다. 이를 이하에서 설명한다.
모든 12개의 적용 가능한 위상 정정 행렬 대부분에는 상당한 리던던시 (redundancy)가 있게 된다. 무엇보다도, MP3에서 MDCT 매핑의 예에서, 다음 전환 행렬은 동일하다:
PCp(연속) = PCp(시작), PCn(연속)=PCn(정지),
PCn(시작)=PCn(단속), 및 PCp(정지)=PCp(단속).
이 속성은 리던던시 감소가 행렬의 저장에 이용될 수 있기 때문에, 다른 위상 정정 행렬의 수를 8로 감소시킨다.
또한, 이전의 프레임 (예를 들어, PCp(연속)) 및 다음 프레임 (예를 들어, PCn(연속))에의 기여에 적용되는 행렬은 매우 유사하다. 이들은 다른 모든 계수의 사인만 다르다. 따라서, 일 실시예에서 이들 두 행렬은 두 부행렬에 이어지는 "버터플라이" 연산으로 구현된다. 이것은 도 2에 나타낸 바와 같이, 가산기 S1 및 감산기 (또는 가산기 및 사인 역전기) S2를 이용하여 연속되는 가산과 감산의 두 값으로 알려져 있다.
세번째로, 행렬 대부분은 주파수 종속 가중 연산 W 및 주파수 빈에 적용되는 부가의 컨볼루션 필터로 분해될 수 있다. 이 분해는 주파수 빈 당 하나의 가중 인자에 하나의 고정된 필터 임펄스 응답을 더한 것만이 저장되어야 한다는 장점을 갖는다. 따라서, 일 실시예에서 상술한 부행렬은 가중 연산 W 및 두 컨볼루션 필터 H1, H2로 구현된다. 이 콘볼루션은 따라서 시간 도메인에서의 승산에 대응하는 주파수 도메인에 적용된다. 이 콘볼루션의 이론적 기초는 종래의 MP3 합성, 시간 지연 및 MDCT 분석의 순서에서 적용되는 시간 도메인 윈도잉이다.
도 2에서 나타낸 바와 같이, 상술한 구현은 하드웨어 이용과 연산의 복잡성 면에서 매우 효율적이다. 특히 연속창에 대해서, 상술한 리던던시는 매우 효율적인 시스템 아키텍처를 가능하게 하고, 이 때 위상 정정 단계 PCp(연속) 및 PCn(연속)은 주파수 빈 당 가중 계수를 적용하고 후속하여 두 필터 H1 및 H2로 필터링하여 공동으로 연산되다. 이들 두 필터는 H1이 오드 (odd) 위치에서만 영이 아닌 계수를 가지는 반면 H2는 이븐 (even) 위치에서만 영이 아닌 계수를 갖는다는 점에서 성긴(sparse) 형태를 이룬다. 필터 출력의 가산은 이전의 MDCT 프레임에의 위상 정정 기여의 결과를 가져오고, 감산은 다음 MDCT 프레임에의 기여를 야기한다.
부가의 효율은 예를 들어 PC(시작), PC(정지), 및 PC(연속) 간에서, 위상 정정 매핑 행렬의 더욱 더 특별한 유사성을 이용하는 것으로 유도될 수 있다. 그러나, 동일한 원리가 상술한 바와 같이 적용된다.
이하에서는, 두 예시의 구현을 설명한다.
도 4는 상술한 두 단계 매핑 과정의 간단한 구현예를 나타낸다. 각 프레임 주기 시작시, 버퍼는 state.pseudo1<=state.pseudo2, state>pseudo2<=state.pseudo3, 및 state.pseudo3<=0인 관점에서 이동된다.
유사하게, Bout<=state.out1, state.out1<=state.out2 및 state.out2<=0이다. MP3 주파수 빈의 각 입력 프레임 in은 행렬 EACp, EAC, EACn로의 승산을 이용하여 매핑되고, 그 결과는 버퍼 state.pseudo1, state.pseudo2 및 state.pseudo3에 각각 가산된다. 다음에, 부대역 사인 정정 (SSC) 및 위상 정정 (PC)이 버퍼 state.pseudo1에 적용된다.
세 최종 기여 PCp*SSC, PC*SSC 및 PCn*SSC는 세 버퍼 Bout, state.out1, 및 state.out2에 각각 가산된다. 버퍼 Bout이 준비되어 출력에 제공될 수 있다.
상술된 구현예에서, 출력 벡터는 입력 프레임과 관련한 두 프레임 주기의 레이턴시를 갖는다. 도 4에 나타낸 구조는 EACp 및 EACn의 기여가 공동으로 연산되고 부가하여 PCp 및 PCn의 기여가 공동으로 연산될 수 있기 때문에, 낮은 복잡도의 구현을 원하는 경우 특별한 이점이 있다.
그러나, 저 레이턴시의 구현을 갖는 것이 요망될 수 있다. 오직 일 프레임 주기의 레이턴시에 의한 다른 구현을 도 5에 나타내었다. 이 구현예에서는, PCp·SSC·EACp(소스 도메인 버퍼 in에서부터 행렬 EACp, SSC 및 PCp를 거쳐 목표의 도메인 버퍼 Bout으로 직접 이르는 경로에 대응)가 실질적으로 영이라는 사실이 이용된다. 따라서, PCp·SSC의 출력 벡터에 대한 기여는 이 버퍼가 현재 입력 MP3 벡터의 EACp를 거친 기여를 아직 포함하지 않더라도, 이미 버퍼 state.pseudo2로부터 연산될 수 있다.
이 방법은 하나의 저장 벡터가 세이브 (state.out2)될 수 있기 때문에, 레이턴시의 일 프레임만이 형성된다는 장점을 갖는다. 한편, 다른 구현예는 PCp 및 PCn을 공동으로 연산함으로써 위상 정정 행렬의 대칭을 더 이상 이용할 수 없다.
상술한 두 단계 방법의 장점은 모든 룩업 테이블의 크기가 종래 기술에서 알려진 아키텍쳐에서 보다 더 작다는 것이다. MP3에서 정수 MDCT로의 상술한 매핑의 예에서, 룩업 테이블은 종래의 직접적 매핑 알고리즘에 대해 이용된 174348 바이트와 비교하여, 12664 바이트만으로 총계된다.
본 발명은 오직 예시적으로 설명되었으며, 본 발명의 영역에서 벗어나지 않고 상세 설명의 변형이 행해질 수 있다는 것이 이해될 것이다.
상세 설명 및 (적당한 경우) 청구범위 및 도면에 기재된 각 특성은 독립적으로 또는 적당히 조합하여 제공될 수 있다. 특성들은 적당한 경우 하드웨어, 소프트웨어 또는 이 둘의 조합으로 구현될 수 있다. 접속은 적용 가능한 경우, 무선 접속 또는 반드시 직접적이거나 전용일 필요는 없지만 유선 접속으로 구현될 수 있다. 청구범위에서 나타내는 참조 부호들은 오직 설명을 위한 것으로 청구범위의 영역을 제한하고자 하는 것은 아니다.

Claims (18)

  1. 제1 필터 뱅크 도메인(DS) (filter bank domain(DS))의 제1 데이터 프레임을 다른 제2 필터 뱅크 도메인(DT)의 제2 데이터 프레임으로 변환하기 위한 방법에 있어서,
    -상기 제1 필터 뱅크 도메인(DS)의 부대역(mp3(m-1), mp3(m), mp3(m+1))을 상기 제2 필터 뱅크 도메인에 대응하되 왜곡 위상(warped phase)을 갖는 중간 도메인(Di)의 부대역(psdo(m-1), psdo(m), psdo(m+1))으로 트랜스코딩 (transcoding)하는 단계; 및
    상기 중간 도메인(Di)의 상기 부대역(psdo(m-1), psdo(m), psdo(m+1))을 제2 필터 뱅크 도메인 (DT)의 부대역(MDCT(m-1), MDCT(m), MDCT(m+1))로 트랜스코딩하는 단계를 포함하고,
    위상 정정(SSC, PCp, PC, PCn)은 상기 중간 도메인(Di)의 부대역(sub-bands)에 대해 실행되는, 방법.
  2. 제1항에 있어서, 제2 데이터 프레임이 적어도 세 개의 연속적인 제1 데이터 프레임으로부터 구성되고, 제1 데이터 프레임은 적어도 세 개의 연속적인 제2 데이터 프레임의 부호화에 이용되는, 방법.
  3. 제1항 또는 제2항에 있어서, 적어도 상기 제2 및 상기 중간 도메인(DS, Di, DT)은 코사인 함수를 포함하는 변환에 의해 시간 도메인 신호로부터 생성될 수 있고, 상기 중간 필터 뱅크 도메인(Di)의 상기 왜곡된 위상은 상기 코사인 함수의 주파수 의존 가산 위상 항(frequency dependent additive phase term)에 대응하는, 방법.
  4. 제 1항 내지 제 3항 중 어느 한 항에 있어서, 상기 제1 필터 뱅크 도메인(DS)의 부대역을 상기 중간 도메인(Di)의 부대역으로 트랜스코딩하는 단계는 (mp3 다상 필터 뱅크로부터 기인하는) 잔여의 앨리어스 항(residual alias terms)을 상기 제1 필터 뱅크 도메인(DS)의 부대역으로부터 제거하는(EAC) 단계를 포함하는, 방법.
  5. 제3항 또는 제4항에 있어서, 매핑 행렬(EAC, EACp, EACn)이 이용되고, 이들 각각은 이들의 주 대각선(main diagonals)을 따라 개별적이지만 동일한 부행렬 및 다른 위치에서는 영을 포함하는, 방법.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 중간 도메인(Di)의 상기 부대역을 상기 제2 필터 뱅크 도메인(DT)의 부대역으로 트랜스코딩하는 단계는 부대역 사인 정정(SSC, sub-band sign correction)을 포함하는 방법.
  7. 제6항에 있어서, 상기 부대역 사인 정정(SSC)은 모든 다른 부대역의 역을 포함하는 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 있어서, 상기 중간 도메인(Di)의 상기 부대역을 상기 제2 필터 뱅크 도메인(DT)의 부대역으로 트랜스코딩하는 단계는 상기 중간 도메인의 가산 위상 항을 보상하는 데에 적합한, 방법.
  9. 제1항 내지 제8항 중 어느 한 항에 있어서, 상기 필터 뱅크 도메인은 변환 시간 창(transformation time windows)을 이용하고, 상기 시간 창에 대해 복수의 다른 창 형상이 미리 정의되고, 상기 제1 및 제2 데이터 프레임은 다른 창 형상을 이용할 수 있고, 개별의 위상 정정(PC)은 상기 창 형상(tp1,...,tp4) 각각과, 상기 중간 필터 뱅크 도메인과 상기 제2 필터 뱅크 도메인의 창 형상들 간의 전환(transition)(tp1-tp1, tp1-tp2,..., tp4-tp4)에 대해 행해지는, 방법.
  10. 제1항 내지 제9항 중 어느 한 항에 있어서, 상기 위상 정정은 상기 중간 도메인(Di)의 상기 부대역 계수를 가중(W)하고 필터링(H1, H2)하여 실행되는, 방법.
  11. 제10항에 있어서, 상기 가중(W)은 주파수 의존적이고, 상이한 주파수 부대역은 상이한 가중치를 가질 수 있고, 상기 필터는 콘볼루션 필터인, 방법.
  12. 제10항에 있어서, 상기 필터링은, 하나의 필터(H1)는 오드(odd) 위치에서만 영이 아닌 계수를 가지고 다른 필터 (H2)는 이븐(even) 위치에서만 영이 아닌 계수를 갖는 점에서, 성긴(sparse) 두 필터를 이용하는, 방법.
  13. 제10항에 있어서, 상기 두 필터 (H1, H2)의 상기 출력의 가산 (S1)은 상기 제2 도메인의 상기 프레임 (MDCT(m-1))의 이전에 상기 위상 정정 기여를 제공하고, 상기 출력의 감산(S2)는 상기 제2 도메인의 상기 프레임 (MDCT(m+1))의 다음에 상기 기여를 제공하는, 방법.
  14. 제1항 내지 제13항 중 어느 한 항에 있어서, 상기 프레임은 오디오 신호 프레임이고, 상기 제1 필터 뱅크 도메인은 MP3 하이브리드 필터 뱅크의 것이고, 상기 제2 필터 뱅크 도메인은 MDCT 필터 뱅크의 것인, 방법.
  15. 제1 필터 뱅크 도메인(DS)의 제1 데이터 프레임을 상이한 제2 필터 뱅크 도메인(DT)의 제2 데이터 프레임으로 변환하기 위한 장치에 있어서,
    - 상기 제1 필터 뱅크 도메인(DS)의 부대역(mp3(m-1), mp3(m), mp3(m+1))을 왜곡된 위상을 갖는 상기 제2 필터 뱅크 도메인에 대응하는 중간 도메인(Di)의 부대역(psdo(m-1), psdo(m), psdo(m+1))으로 트랜스코딩하기 위한 제1 트랜스코딩 수단(EACp, EAC, EACn); 및
    상기 중간 도메인(Di)의 상기 부대역(psdo(m-1), psdo(m), psdo(m+1))을 제2 필터 뱅크 도메인(DT)의 부대역(MDCT(m-1), MDCT(m), MDCT(m+1))으로 트랜스코딩하기 위한 제2 트랜스코딩 수단(SSC, PCp, PC, PCn)을 포함하되,
    상기 제 1 트랜스코딩 수단에 있어 잔여 앨리어스 항(residual alias terms)은 제거되고,
    상기 제2 트랜스코딩 수단은 상기 중간 도메인(Di)의 상기 부대역에 대해 위상 정정을 실행하기 위한 위상 정정 수단(SSC, PCp, PC, PCn)을 포함하는, 장치.
  16. 제15항에 있어서, 상기 위상 정정은 매핑 매트릭스(PCn, PC, PCp)를 적용하기 위한 연산 수단에 의해 실행되는 장치.
  17. 제15항 또는 제16항에 있어서, 상기 제2 트랜스코딩 수단의 상기 위상 정정은 가중(weighting)을 위한 가중 수단(W) 및 상기 중간 도메인(Di)의 상기 부대역 계수를 필터링하기 위한 필터 수단(H1, H2)에 의해 실행되는, 장치.
  18. 제17항에 있어서, 상기 필터 수단(H1, H2)는 상기 제2 필터 뱅크 도메인(DT)의 이전 프레임(MDCT(m-1)) 및 다음 프레임(MDCT(m+1))에 관련된 두 개의 매핑 행렬(PCp(연속), PCn(연속))에 대응하는 두 위상 정정 부단계(sub-steps)를 동시에 실행하는, 장치.
KR1020107022192A 2008-03-05 2009-02-19 여러 필터 뱅크 도메인 간의 변환을 위한 방법 및 장치 KR101589709B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP08102308.7 2008-03-05
EP08102308A EP2099027A1 (en) 2008-03-05 2008-03-05 Method and apparatus for transforming between different filter bank domains

Publications (2)

Publication Number Publication Date
KR20100134635A true KR20100134635A (ko) 2010-12-23
KR101589709B1 KR101589709B1 (ko) 2016-01-28

Family

ID=39428017

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107022192A KR101589709B1 (ko) 2008-03-05 2009-02-19 여러 필터 뱅크 도메인 간의 변환을 위한 방법 및 장치

Country Status (9)

Country Link
US (1) US8620671B2 (ko)
EP (2) EP2099027A1 (ko)
JP (1) JP5490731B2 (ko)
KR (1) KR101589709B1 (ko)
CN (1) CN101960515B (ko)
AU (1) AU2009221366B2 (ko)
BR (1) BRPI0907840A2 (ko)
CA (1) CA2717226A1 (ko)
WO (1) WO2009109468A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2875351A1 (fr) * 2004-09-16 2006-03-17 France Telecom Procede de traitement de donnees par passage entre domaines differents de sous-bandes
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
FR2969804A1 (fr) * 2010-12-23 2012-06-29 France Telecom Filtrage perfectionne dans le domaine transforme.
EP2963648A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
CN112336380A (zh) * 2020-10-29 2021-02-09 成都信息工程大学 一种基于Golay码的超声弹性成像应变估计方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
KR20070074546A (ko) * 2004-08-31 2007-07-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코딩을 위한 방법 및 디바이스

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890106A (en) * 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
GB0003954D0 (en) * 2000-02-18 2000-04-12 Radioscape Ltd Method of and apparatus for converting a signal between data compression formats
US6731690B2 (en) * 2000-12-01 2004-05-04 Motorola, Inc. Methods and apparatus for transmultiplexing a multi-channel signal
US6757648B2 (en) * 2001-06-28 2004-06-29 Microsoft Corporation Techniques for quantization of spectral data in transcoding
US6982377B2 (en) * 2003-12-18 2006-01-03 Texas Instruments Incorporated Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing
FR2875351A1 (fr) * 2004-09-16 2006-03-17 France Telecom Procede de traitement de donnees par passage entre domaines differents de sous-bandes
ES2791001T3 (es) * 2004-11-02 2020-10-30 Koninklijke Philips Nv Codificación y decodificación de señales de audio mediante el uso de bancos de filtros de valor complejo
US20070083377A1 (en) * 2005-10-12 2007-04-12 Steven Trautmann Time scale modification of audio using bark bands
US7676374B2 (en) * 2006-03-28 2010-03-09 Nokia Corporation Low complexity subband-domain filtering in the case of cascaded filter banks
FR2901433A1 (fr) * 2006-05-19 2007-11-23 France Telecom Conversion entre representations en domaines de sous-bandes pour des bancs de filtres variant dans le temps
US8700387B2 (en) * 2006-09-14 2014-04-15 Nvidia Corporation Method and system for efficient transcoding of audio data
EP1903559A1 (en) 2006-09-20 2008-03-26 Deutsche Thomson-Brandt Gmbh Method and device for transcoding audio signals
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
US8185381B2 (en) * 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
KR20070074546A (ko) * 2004-08-31 2007-07-12 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코딩을 위한 방법 및 디바이스

Also Published As

Publication number Publication date
JP2011513781A (ja) 2011-04-28
CA2717226A1 (en) 2009-09-11
KR101589709B1 (ko) 2016-01-28
CN101960515B (zh) 2012-07-18
AU2009221366B2 (en) 2011-09-29
EP2250642A1 (en) 2010-11-17
CN101960515A (zh) 2011-01-26
JP5490731B2 (ja) 2014-05-14
US20110004478A1 (en) 2011-01-06
WO2009109468A1 (en) 2009-09-11
BRPI0907840A2 (pt) 2015-07-21
EP2250642B1 (en) 2015-10-21
US8620671B2 (en) 2013-12-31
EP2099027A1 (en) 2009-09-09
AU2009221366A1 (en) 2009-09-11

Similar Documents

Publication Publication Date Title
JP7126328B2 (ja) 符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ
RU2625444C2 (ru) Система обработки аудио
RU2557455C2 (ru) Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
KR101056253B1 (ko) 오디오 서브밴드 값을 생성하는 장치 및 방법과 시간 영역 오디오 샘플을 생성하는 장치 및 방법
US7275036B2 (en) Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
KR101341115B1 (ko) 적응식 오버샘플링을 사용하는 고주파수 오디오 신호를 발생시키기 위한 장치 및 방법
US8195730B2 (en) Apparatus and method for conversion into a transformed representation or for inverse conversion of the transformed representation
EP2064700B1 (en) Method and device for transcoding audio signals
CN107452392B (zh) 临界采样滤波器组中的基于模型的预测
JP2003333598A (ja) イメージおよびビデオ符号化のための2−d変換
KR20070001115A (ko) 복소수 값 데이터를 이용하는 오디오 신호 디코딩
RU2323469C2 (ru) Устройство и способ для обработки, по меньшей мере, двух входных значений
KR20050007312A (ko) 시간-이산 오디오 신호를 부호화하기 위한 장치 및 방법그리고 부호화 오디오 데이터를 복호화하기 위한 장치 및방법
JP2001184080A (ja) 圧縮オーディオデータへの電子透かし方法およびそのシステム
KR101589709B1 (ko) 여러 필터 뱅크 도메인 간의 변환을 위한 방법 및 장치
JP2004531151A (ja) 時間離散オーディオサンプル値を処理する方法と装置
JP6089878B2 (ja) 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
JP6094322B2 (ja) 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
JP4729505B2 (ja) デジタルオーディオ信号の変換及び変換されたデジタルオーディオ信号の逆変換の方法並びに装置
WO2023118138A1 (en) Ivas spar filter bank in qmf domain
KR20100008333A (ko) 화상 부호화 장치, 화상 복호 장치, 화상 대역 분할 장치 및 화상 대역 합성 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee