KR20130007598A - 오디오 신호들의 대역폭 연장에 기반한 위상 보코더의 개선된 크기 응답과 시간적 정렬을 위한 방법과 장치 - Google Patents

오디오 신호들의 대역폭 연장에 기반한 위상 보코더의 개선된 크기 응답과 시간적 정렬을 위한 방법과 장치 Download PDF

Info

Publication number
KR20130007598A
KR20130007598A KR1020127026336A KR20127026336A KR20130007598A KR 20130007598 A KR20130007598 A KR 20130007598A KR 1020127026336 A KR1020127026336 A KR 1020127026336A KR 20127026336 A KR20127026336 A KR 20127026336A KR 20130007598 A KR20130007598 A KR 20130007598A
Authority
KR
South Korea
Prior art keywords
phase
patch
block
signal
subband
Prior art date
Application number
KR1020127026336A
Other languages
English (en)
Other versions
KR101483157B1 (ko
Inventor
사샤 디쉬
프레드리크 나겔
스테판 빌데
라즈 빌레모스
페르 엑스트랜드
Original Assignee
돌비 인터네셔널 에이비
프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 인터네셔널 에이비, 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. filed Critical 돌비 인터네셔널 에이비
Publication of KR20130007598A publication Critical patent/KR20130007598A/ko
Application granted granted Critical
Publication of KR101483157B1 publication Critical patent/KR101483157B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Abstract

입력 신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치에 있어, 입력 신호로부터 하나 이상의 패치 신호들을 발생시키기 위한 패치 발생기, 여기서 패치 발생기는 분석 필터뱅크로부터 부대역 신호들의 시간연장(1800,1808)을 실행하기 위해 구성되고, 여기서 패치 발생기는 필터뱅크-채널 의존적 위상 보정을 이용하여 부대역 신호들의 위상들을 조정하기 위한 위상 조정기(1806)를 포함하는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치에 관한 발명이다.

Description

오디오 신호들의 대역폭 연장에 기반한 위상 보코더의 개선된 크기 응답과 시간적 정렬을 위한 방법과 장치{IMPROVED MAGNITUDE RESPONSE AND TEMPORAL ALIGNMENT IN PHASE VOCODER BASED BANDWIDTH EXTENSION FOR AUDIO SIGNALS}
위상 보코더들 [1-3] 또는 다른 시간 테크닉들 또는 싱크로나이즈드 오버랩-애드(Synchronized Overlap-Add, SOLA)와 같은 피치 수정 알고리즘들에 의해, 오디오 신호들은 예를 들어 플레이백 비율(playback rate)에 관점에서 수정될 수 있다. 게다가, 이러한 방법들은 상기 원래 플레이백 지속시간을 유지하는 동안 상기 신호의 교차를 수행하는데 적용될 수 있다. 상기 후자는 상기 같은 인수를 적용하는 상기 연장된 오디오 신호의 상기 플레이백 비율의 순차적 조정과 정수 인수로 상기 오디오 신호를 연장하는 것에 의해 달성될 수 있다. 상기 시간-분리 신호에 있어,상기 후자는 상기 샘플링 비율이 바뀌지 않고 유지되는 주어진 상기 연장 인수에 대한 상기 시간 연장된 오디오 신호의 다운 샘플링에 대응한다.
[4-5] 같은 대역폭 연장 방법들에 기반한 위상 보코더는, 요구되는 전체 대역폭의 의존에 따라, 필요 전체 대역폭을 보이는 총합 신호를 형성하기 위해 합산되는 대역이 제한된 부대역들(패치들)의 가변적인 숫자 총합 신호를 발생시킨다.
더한 실시예에서, 개별 패치들의 시간적 정렬 또한 선언될 수 있으나, 패치내에서 위상 보정은, 즉 부대역 신호들 사이에서 하나를 사용하여 처리되고, 같은 교차 인수는 전체적으로 패치 내에서 모든 부대역 신호들이 유효한 시간 보정과 함께 또는 없이 적용될 수 있다.
본 발명의 실시예는 위상 보코더들에 의해 생성되는 단일 패치들의 시간적 정렬과 크기 응답의 최적화를 위한 신규한 방법이다. 이 방법은 다른 교차 인수들과 함께 위상 보코더들로부터 얻어지는 단일 패치들에 대한 추가적인 시간 지연들의 도입과 복합 조정된 필터뱅크 실시의 교차된 부대역의 위상 보정의 선택들로 기본적으로 구성된다. 특정 패치에 도입된 추가적인 지연의 시간 지속은 적용된 교차 인수에 의존적이고 이론적으로 결정될 수 있다. 그렇지 않으면, 상기 지연은 그렇게 조정되고, 디랙 임펄스 입력신호(Dirac impulse input signal)을 적용하며, 모든 패치의 교차된 디랙 임펄스 중력의 시간적 중심은 스펙트로그램 대표의 동일한 시간적 위치에 정렬된다.
위상 보코더와 같은 단일 교차 인수에 의한 오디오 신호들의 교차를 수행할 많은 방법들이 있다. 만약 몇몇 교차된 신호들이 결합되어야 한다면, 그중 하나는 다른 출력들 사이의 시간 지연들을 보정할 수 있다. 이러한 알고리즘들의 필요적 부분이 아니지만 패치들 사이의 보정 수직 정렬은 유용하다. 다른 패치들의 보정 정렬의 문제는 최근 문서들에서 개시되지 않았다.
본 발명의 실시예는 위상 보코더들에 의해 생성되는 단일 패치들의 시간적 정렬과 크기 응답의 최적화를 위한 신규한 방법이다. 이 방법은 다른 교차 인수들과 함께 위상 보코더들로부터 얻어지는 단일 패치들에 대한 추가적인 시간 지연들의 도입과 복합 조정된 필터뱅크 실시의 교차된 부대역의 위상 보정의 선택들로 기본적으로 구성된다. 특정 패치에 도입된 추가적인 지연의 시간 지속은 적용된 교차 인수에 의존적이고 이론적으로 결정될 수 있다. 그렇지 않으면, 상기 지연은 그렇게 조정되고, 디랙 임펄스 입력신호(Dirac impulse input signal)을 적용하며, 모든 패치의 교차된 디랙 임펄스 중력의 시간적 중심은 스펙트로그램 대표의 동일한 시간적 위치에 정렬된다.
위상 보코더와 같은 단일 교차 인수에 의한 오디오 신호들의 교차를 수행할 많은 방법들이 있다. 만약 몇몇 교차된 신호들이 결합되어야 한다면, 그중 하나는 다른 출력들 사이의 시간 지연들을 보정할 수 있다. 이러한 알고리즘들의 필요적 부분이 아니지만 패치들 사이의 보정 수직 정렬은 유용하다. 다른 패치들의 보정 정렬의 문제는 최근 문서들에서 개시되지 않았다.
위상 보코더 응용으로 얻어지는 단일 패치들의 시간적 정렬은 특정한 도전으로 판명된다. 일반적으로, 이러한 패치들은 다른 지속시간의 시간 지연을 가진다. 이것은 위상 보코더들의 합성 윈도우가 연장 인수에 의존적인 고정된 홉(hop) 사이즈에서 배열되며, 따라서 모든 개별 패치는 미리 설정된 지속시간의 지연을 갖는다. 이것은 대역폭이 연장된 총합 신호의 주파수 선택적 시간 지연으로 진행된다. 이 주파수 선택적 지연이 전체 신호의 수직적 간섭 특성에 영향을 미치기 때문에 대역폭 연장된 방법의 순간적 응답에 부정적 영향을 갖게 된다.
또 다른 도전은 개별 패치들을 고려하는 것에 의해 제시되며, 교차 주파수 간섭의 부족은 위상 보코더의 크기 응답의 부정적 영향을 갖는다.
이는 본 발명이 개선된 오디오 품질을 제공하는 대역폭이 연장된 오디오 신호를 발생시키는 컨셉을 제공하는 목적이다.
이 목적은 청구항1에 따른 대역폭이 연장된 오디오 신호를 발생시키는 장치, 청구항 20에 따른 컴퓨터 프로그램 또는 청구항 19에 따른 대역폭이 연장된 오디오 신호를 발생시키는 방법에 의해 달성될 수 있다.
입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치는 입력신호로부터 하나 또는 그 이상의 패치 신호들을 발생시키기 위한 패치 발생기를 포함한다. 패치 발생기는 위상 보정 의존적인 필터뱅크-채널을 이용한 부대역 신호들의 위상 조정을 위하여 위상 조정기를 포함하며 분석 필터 뱅크로부터 부대역 신호들의 시간 연장을 수행하기 위해 구성된다.
본 발명의 더한 이점은 대역폭 연장을 위한 다른 구조들 또는 대역폭 연장을 위한 위상 보코더-유사 구조들에 의한 일반적 도입에 의한 크기 응답의 부정적 영향을 피할 수 있다는 것이다.
본 발명의 더한 이점은 개별 패치들의 최적화된 크기 응답이, 그것은 예를 들어, 위상 보코더-유사 구조들 또는 위상 보코더들에 의해 생성되고, 얻어진다는 것이다.
도 1. 로우패스 필터된 디랙 임펄스의 스펙트로그램을 그린 도면.
도 2. 교차 인수들 2, 3, 그리고 4와 디랙 임펄스의 최첨단 교차의 스펙트로그램을 그린 도면.
도 3. 교차 인수들 2, 3, 그리고 4와 디랙 임펄스의 시간 정렬된 교차의 스펙트로그램을 그린 도면.
도 4. 교차 인수들 2, 3, 그리고 4와 지연 조정의 디랙 임펄스의 시간 정렬된 교차의 스펙트로그램을 그린 도면.
도 5. 저조하게 조정된 위상과 느린 사인 스윕의 교차의 시간 다이어그램.
도 6. 더 나은 위상 보정의 느린 사인 스윕의 교차 도면.
도 7. 더 개선된 위상 보정의 느린 사인 스윕의 교차 도면.
도 8. 실시예에 따른 대역폭 연장 시스템의 도면.
도 9. 단일 부대역 신호를 처리하기 위한 예시적 처리 실행의 또 다른 실시예.
도 10. 부대역 도메인이 보여진 순차적 포락선 조정과 비선형 부대역 처리의 실시예.
도 11. 도 10의 비선형 부대역 처리의 추가적 실시예.
도 12. 부대역 채널 의존적 위상 보정 선택을 위한 다른 실행들의 도면.
도 13. 위상 조정기의 실행을 그린 도면.
도 14a. 교차-인수 독립 위상 보정을 허락하는 분석 필터뱅크를 위한 실행의 세부적인 것을 나타낸 도면.
도 14b. 교차-인수 독립 위상 보정을 필요로 하는 분석 필터뱅크를 위한 실행의 세부적인 것을 나타낸 도면.
위상 보코더들 [1-3] 또는 다른 시간 테크닉들 또는 싱크로나이즈드 오버랩-애드(Synchronized Overlap-Add, SOLA)와 같은 피치 수정 알고리즘들에 의해, 오디오 신호들은 예를 들어 플레이백 비율(playback rate)에 관점에서 수정될 수 있다. 게다가, 이러한 방법들은 상기 원래 플레이백 지속시간을 유지하는 동안 상기 신호의 교차를 수행하는데 적용될 수 있다. 상기 후자는 상기 같은 인수를 적용하는 상기 연장된 오디오 신호의 상기 플레이백 비율의 순차적 조정과 정수 인수로 상기 오디오 신호를 연장하는 것에 의해 달성될 수 있다. 상기 시간-분리 신호에 있어,상기 후자는 상기 샘플링 비율이 바뀌지 않고 유지되는 주어진 상기 연장 인수에 대한 상기 시간 연장된 오디오 신호의 다운 샘플링에 대응한다.
[4-5] 같은 대역폭 연장 방법들에 기반한 위상 보코더는, 요구되는 전체 대역폭의 의존에 따라, 필요 전체 대역폭을 보이는 총합 신호를 형성하기 위해 합산되는 대역이 제한된 부대역들(패치들)의 가변적인 숫자 총합 신호를 발생시킨다.
위상 보코더 응용으로 얻어지는 단일 패치들의 시간적 정렬은 특정한 도전으로 판명된다. 일반적으로, 이러한 패치들은 다른 지속시간의 시간 지연을 가진다. 이것은 위상 보코더들의 합성 윈도우가 연장 인수에 의존적인 고정된 홉(hop) 사이즈에서 배열되며, 따라서 모든 개별 패치는 미리 설정된 지속시간의 지연을 갖는다. 이것은 대역폭이 연장된 총합 신호의 주파수 선택적 시간 지연으로 진행된다. 이 주파수 선택적 지연이 전체 신호의 수직적 간섭 특성에 영향을 미치기 때문에 대역폭 연장된 방법의 순간적 응답에 부정적 영향을 갖게 된다.
또 다른 도전은 개별 패치들을 고려하는 것에 의해 제시되며, 교차 주파수 간섭의 부족은 위상 보코더의 크기 응답의 부정적 영향을 갖는다.
이는 본 발명이 개선된 오디오 품질을 제공하는 대역폭이 연장된 오디오 신호를 발생시키는 컨셉을 제공하는 목적이다.
이 목적은 청구항1에 따른 대역폭이 연장된 오디오 신호를 발생시키는 장치, 청구항 20에 따른 컴퓨터 프로그램 또는 청구항 19에 따른 대역폭이 연장된 오디오 신호를 발생시키는 방법에 의해 달성될 수 있다.
입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치는 입력신호로부터 하나 또는 그 이상의 패치 신호들을 발생시키기 위한 패치 발생기를 포함한다. 패치 발생기는 위상 보정 의존적인 필터뱅크-채널을 이용한 부대역 신호들의 위상 조정을 위하여 위상 조정기를 포함하며 분석 필터 뱅크로부터 부대역 신호들의 시간 연장을 수행하기 위해 구성된다.
본 발명의 더한 이점은 대역폭 연장을 위한 다른 구조들 또는 대역폭 연장을 위한 위상 보코더-유사 구조들에 의한 일반적 도입에 의한 크기 응답의 부정적 영향을 피할 수 있다는 것이다.
본 발명의 더한 이점은 개별 패치들의 최적화된 크기 응답이, 그것은 예를 들어, 위상 보코더-유사 구조들 또는 위상 보코더들에 의해 생성되고, 얻어진다는 것이다.
더한 실시예에서, 개별 패치들의 시간적 정렬 또한 선언될 수 있으나, 패치내에서 위상 보정은, 즉 부대역 신호들 사이에서 하나를 사용하여 처리되고, 같은 교차 인수는 전체적으로 패치 내에서 모든 부대역 신호들이 유효한 시간 보정과 함께 또는 없이 적용될 수 있다.
본 발명의 실시예는 위상 보코더들에 의해 생성되는 단일 패치들의 시간적 정렬과 크기 응답의 최적화를 위한 신규한 방법이다. 이 방법은 다른 교차 인수들과 함께 위상 보코더들로부터 얻어지는 단일 패치들에 대한 추가적인 시간 지연들의 도입과 복합 조정된 필터뱅크 실시의 교차된 부대역의 위상 보정의 선택들로 기본적으로 구성된다. 특정 패치에 도입된 추가적인 지연의 시간 지속은 적용된 교차 인수에 의존적이고 이론적으로 결정될 수 있다. 그렇지 않으면, 상기 지연은 그렇게 조정되고, 디랙 임펄스 입력신호(Dirac impulse input signal)을 적용하며, 모든 패치의 교차된 디랙 임펄스 중력의 시간적 중심은 스펙트로그램 대표의 동일한 시간적 위치에 정렬된다.
위상 보코더와 같은 단일 교차 인수에 의한 오디오 신호들의 교차를 수행할 많은 방법들이 있다. 만약 몇몇 교차된 신호들이 결합되어야 한다면, 그중 하나는 다른 출력들 사이의 시간 지연들을 보정할 수 있다. 이러한 알고리즘들의 필요적 부분이 아니지만 패치들 사이의 보정 수직 정렬은 유용하다. 다른 패치들의 보정 정렬의 문제는 최근 문서들에서 개시되지 않았다.
위상 보코더들에 의한 스펙트라 교차는 과도기의 수직 간섭을 보존하는 것을 보장하지는 않는다. 게다가, 총합 신호에 기여하는 단일 패치들의 다른 시간 지연과 같은 위상 보코더들에 의해 이용되는 오버랩 애드 방법 때문에 고주파수 대역에서 포스트 에코(post echoes)들이 일어난다. 따라서 대역폭 연장 파라메트릭(parametric) 후 처리같은 방법이 패치들 사이에서 더 나은 수직 정렬을 보일 수 있도록 패치들을 정렬하는 것이 선호된다. 전 후-에코를 커버하는 총 시간 길이는 그에 의해 최소화된다.
위상 보코더는 복합 조정된 필터뱅크들의 분석/합성 쌍의 도메인의 부대역 샘플들의 증가하는 정수 위상 수정에 의해 전형적으로 실행된다.이 절차는 각 합성 부대역으로부터 얻어지는 출력 기여분의 위상들의 적절한 정렬을 자동적으로 보장하는 것은 아니며, 위상 보코더의 크기 평탄하지 않은 크기 응답을 일으킨다. 이러한 인위적 결과는 교차된 느린 사인 곡선의 시간-변화 진폭을 도출한다. 일반적 오디오의 오디오 품질의 관점에서, 상기 단점은 조정 신호에 의한 출력의 변화이다.
본 발명의 선호되는 실시예들은 첨부된 도면과 함께 차후 논의될 것이며,
도 1. 로우패스 필터된 디랙 임펄스의 스펙트로그램을 그린 도면.
도 2. 교차 인수들 2, 3, 그리고 4와 디랙 임펄스의 최첨단 교차의 스펙트로그램을 그린 도면.
도 3. 교차 인수들 2, 3, 그리고 4와 디랙 임펄스의 시간 정렬된 교차의 스펙트로그램을 그린 도면.
도 4. 교차 인수들 2, 3, 그리고 4와 지연 조정의 디랙 임펄스의 시간 정렬된 교차의 스펙트로그램을 그린 도면.
도 5. 저조하게 조정된 위상과 느린 사인 스윕의 교차의 시간 다이어그램.
도 6. 더 나은 위상 보정의 느린 사인 스윕의 교차 도면.
도 7. 더 개선된 위상 보정의 느린 사인 스윕의 교차 도면.
도 8. 실시예에 따른 대역폭 연장 시스템의 도면.
도 9. 단일 부대역 신호를 처리하기 위한 예시적 처리 실행의 또 다른 실시예.
도 10. 부대역 도메인이 보여진 순차적 포락선 조정과 비선형 부대역 처리의 실시예.
도 11. 도 10의 비선형 부대역 처리의 추가적 실시예.
도 12. 부대역 채널 의존적 위상 보정 선택을 위한 다른 실행들의 도면.
도 13. 위상 조정기의 실행을 그린 도면.
도 14a. 교차-인수 독립 위상 보정을 허락하는 분석 필터뱅크를 위한 실행의 세부적인 것을 나타낸 도면.
도 14b. 교차-인수 독립 위상 보정을 필요로 하는 분석 필터뱅크를 위한 실행의 세부적인 것을 나타낸 도면.
본 응용은 대역폭 연장과 관련되지 않은 다른 오디오 어플리케이션들의 전후사정, 대역폭 연장의 전후사정의 오디오 신호들을 처리하기 위한 장치들, 방법들 또는 컴퓨터 프로그램들의 다른 관점을 제공한다. 이후 설명되고 주장된 개별 관점들의 특징들은 부분적으로 또는 전체적으로 결합될 수 있고, 개별 관점들은 이미 지각적인 품질, 컴퓨터 시스템 또는 마이크로 프로세서에서 실행될 때의 컴퓨터적인 복잡성과 프로세서/메모리 자원의 관점에서 이득을 제공하기 때문에, 각자 분리되어 사용될 수도 있다.
위상 보코더 수단에 의한 디랙 임펄스 교차에 의해, 주파수 선택적 지연들이 부대역들을 출력하는 것이 도입된다. 이것들의 시간 지연이 사용된 교차 인수들에 의존적이다. 이후, 교차 인수들 2, 3, 4의 디랙 임펄스의 교차가 예시적으로 도 2. 에 보여진다.
주파수 선택적 지연들은 각 결과적인 패치들의 추가적인 개별 시간 지연의 삽입에 의해 보상되게 된다. 이러한 방법으로, 모든 단일 부대역은 정렬되며, 모든 패치의 디랙 임펄스의 중심은 가장 높은 패치의 디랙 임펄스의 중심에 따라 같은 시간적 위치에 위치하게 된다. 상기 정렬은 가장 높은 패치가 보통 가장 높은 시간 지연을 갖기 때문에 가장 높은 패치에 기반하여 수행된다. 진보적인 지연 보상을 적용할 때, 디랙 임펄스의 중심은 스펙트로그램 안에서 모든 패치들에 대해 동일한 시간적 위치에 위치하게 된다. 그러나 결과적 신호들에 대한 표현은 도 3.에 묘사된대로 보일 수 있다. 이것은 모든 순간 에너지 퍼짐의 최소화를 이끈다.
결국, 교차된 고주파수 지역들과 그러한 목적을 위한 원래 입력신호들 사이의 시간 지연을 유지하기 위한 추가적 보상이 필요하게 되며, 상기 입력 신호 또한 ,미리 특정 시간적 위치에 정렬된, 교차된 디랙 임펄스들의 중심이 대역 제한된 디랙 임펄스의 시간적 위치에 매치되도록 지연될 수 있다. 결과적으로 결과 신호의 스펙트로그램은 도 4에 도시되어 있다.
묘사된 방법의 어플리케이션에 대하여 그것은 대역폭 연장 방법의 기초 구성요소에 따른 위상 보코더가 시간 영역에서 실현될 수 있는지 또는 내부에서 필터뱅크 표현이 예를 들어 pQMF 필터 뱅크 같은지에 따라 하찮을 수 있다.
SOLA 테크닉들을 사용할 때, 수직적 간섭 기준이 과도기에서 충족될 때 오버랩 애드 때문에 과도기의 주관적인 오디오 품질이 에코 이펙트들에 의해 손상된다. 가능한, 가장 높은 패치의 실제 중심으로부터의 단일 패치들의 중심의 위치의 약간의 편차는 미리 마스킹된 또는 나중에 마스킹되는 범위 내에 각각 위치하게 된다.
크기 응답의 측면에서 저조하게 조정된 위상 보코더의 결과는 계속되는 진폭의 사인 스윕 입력에 대응하는 도 5.의 출력 신호에 의해 묘사된다. 그것이 보여질 수 있는대로, 고른 출력의 취소와 강한 진폭 변화들이 존재한다. 조금 더 낫게 조정된 위상 보코더로부터의 출력은 도 6.에 도시되어 있다.
위상 보코더를 기반으로 한 복합 조절 필터뱅크의 작업은 부대역 샘플들의 증가하는 위상 수정이다. 사인 곡선적 입력 시간 도메인은 아래 형태의 복합 값 부대역 신호들의 아주 좋은 정확성으로 결과를 도출한다.
Figure pct00001
여기서 ω는 사인곡선의 주파수이며, n은 부대역 지수이고, k는 부대역 시간 슬롯 지수이고, qA 는 분석 필터뱅크의 시간 스트라이드(stride)이고,
Figure pct00002
은 필터뱅크 프로토타입 필터의 주파수 응답이고, θn
Figure pct00003
가 실제 값이 되도록 하는 요구에 의해 정의되는 문제의 필터뱅크를 위한 위상 간격 특성이다. 전형적인 QMF 필터뱅크 설계들에 있어, 이는 긍정적으로 생각될 수 있다. 위상 수정에서 전형적인 결과는 따라서
Figure pct00004
으로 형성되며, T는 교차 순서이고 qs 는 분석 필터뱅크의 시간 스트라이드이다. 합성 필터뱅크가 전형적으로 분석 필터뱅크의 미러이미지로 선택되기 때문에, 적절한 사인곡선형 합성은 사인곡선의 분석 부대역에 대응하는 마지막 표현을 필요로 한다. 이 일치에 실패하는 것은 도 5에 묘사된대로 진폭 수정으로 이어진다.
본 발명의 실시예는
Figure pct00005
에 기반한 추가적 차후 수정 위상 보정을 이용하는 것이다.
이것은 수정되지 않은 부대역 신호들을 요구되는 크로스 부대역 위상 진전을 갖도록 도입할 것이다.
Figure pct00006

이상하게 적층된 복합 수정된 QMF 필터뱅크의 특정 예에 있어, 그 하나는
Figure pct00007
를 갖고, 진보적 위상 보정은
Figure pct00008
에 기반하여 주어진다.
이러한 규칙에 따른 위상 조정된 위상 보코더의 출력은 도 7에 묘사되어 있다.
만약 분석/합성 필터뱅크 쌍이 위상 트위들의 더욱 비대칭적인 분포를 갖는다면, 위상 보정
Figure pct00009
이 있을 것이고, 분석 부대역들에 더해질 때, 합성에 앞서 마이너스 부호는 대칭의 경우에서 상황을 되돌릴 것이다. 그러한 경우에 상기 위의 진보적인 위상 보정은
Figure pct00010
에 기반하여 조정되어야 한다.
이러한 예는
Figure pct00011
에 기반하며 뒤따라오는 통합 스피치 앤 오디오 코딩(USAC)의 MPEG 기준에서 사용되는 64 대역 QMF 필터뱅크 쌍에 의해 주어지며
C는 실수이고 2와 3.5사이의 값을 가질 수 잇다. 특정 값은 321/128 또는 385/128이다.
이런 이유로 쌍 하나는
Figure pct00012
를 이용할 수 있다.
게다가, 위 상황의 특별한 실시예에서, 하나는, 교차 순서 T에 독립적인, 위상 보정을 관찰하며, 분석 필터 뱅크 단계 그 자체에 포함될 수 있다. 위상 증가 이후 동일한 보정에 시간을 맞추는 T에 대응하는 보코더 위상 증가에 앞선 보정 이래로, 다음의 분해가 이점으로 일어난다.
Figure pct00013

분석 필터뱅크 변조는 그래서 정규화된 QMF 필터뱅크 쌍의 경우와 비교하여 위상
Figure pct00014
가 더해지도록 수정되며, 진보적인 위상 보정은 두번째 조건과 단독으로 일치하게 된다.
Figure pct00015

위상 보정의 이점은 출력에 대한 각 보코더 순서 기여의 평탄한 크기 응답이 얻어지는 것이다.
진보적인 처리는 위상 보코더 시간 연장의 응용에 의한 오디오 신호들의 대역폭을 연장하는 모든 오디오 어플리케이션들과 다운 샘플링 또는 증가된 비율의 플레이백에 각각 적합하다.
도 8은 본 발명의 하나의 관점에 따른 대역폭 연장 시스템을 나타낸다. 대역폭 연장 시스템은 코어가 디코드된 신호를 발생시키는 코어 디코더(80)을 포함한다. 코어 디코더(80)은 순차적으로 더 자세히 논의될 패치 발생기(82)와 연결된다. 패치 발생기(82)는 도 8의 모든 요소들, 코어 디코더(80) 외에도 머져(merger, 85) 뿐만 아니라, 로우 밴드 커넥션(83) 그리고 로우 밴드 콜렉터(84)도 포함한다. 특히, 패치 발생기는 하나 또는 그 이상의 패치 신호들을 입력 오디오 신호(86)으로부터 발생시키기 위해 구성되며, 여기서 패치 시그널은 다른 패치의 패치 중심 주파수 또는 입력 오디오 신호의 중심 주파수와 다른 패치 중심 주파수를 갖는다. 특히, 패치 발생기는 첫번째 패쳐(87a), 두번째 패쳐(87b), 세번째 패쳐(87c)를 포함하며, 도 8의 실시예에서, 각 개별 패쳐(87a,87b,87c)는 다운샘플러(88a,88b,88c), QMF 분석 블록(89a,89b,89c), 시간 연장 블록(90a,90b,90c), 그리고 패치 채널 콜렉터 블록(91a,91b,91c)를 포함한다. 블록 91a 부터 91c 까지로부터의 출력과 로우 밴드 콜렉터(84)는 대역폭이 연장된 신호를 출력하는 머져(85)로 입력된다. 이 신호는 포락선 보정 모듈, 조성 보정 모듈 또는 대역폭 연장 신호 프로세싱으로부터 알려진 어느 다른 모듈들과 같은 더 나아간 프로세싱 모듈들에 의해 처리될 수 있다.
가급적, 입력 오디오 신호 그리고 하나 또는 그 이상의 패치 신호들 사이의 시간 비정렬 또는 다른 패치 신호들 사이의 시간 비정렬이 감소되거나 제거되도록 시간 비정렬 패치 발생기(82)는 하나 또는 그 이상의 패치 신호들을 발생시키는 방식으로 패치 보정이 수행된다. 도 8의 실시예에서, 이러한 시간 비정렬의 감소 또는 제거는 패치 콜렉터들(91a 부터 91c)에 의해 얻어진다. 그 대신에 또는 추가적으로, 패치 발생기(82)는 시간 연장 기능과 함께 위상 보정에 의존적인 필터뱅크-채널을 수행하기 위해 구성되어진다. 이는 위상 보정 입력(92a,92b,92c)에 의해 지시된다.
도 8의 실시예는 QMF 분석 블록(89a) 같은 각 QMF 분석 블록이 복수개의 부대역 신호들을 출력하는 것을 기재하고 있다. 시간 연장 기능 각 개별 부대역 신호를 위해 수행되어야 한다. 예를 들어, QMF 분석(89a)은 32개의 부대역 신호들을 출력하고, 따라서 32개의 시간 연장기(90a)가 존재할 수 있다. 그러나, 이 팻쳐(87 a)의 모든 개별적 시간-연장된 신호들을 위한 단일 패치 콜렉터는 충분하다. 차후 논의되겠지만, 도 9는 QMF 분석 뱅크들(89a,89b,89c) 같은 QMF 분석 뱅크에 의한 각 개별 부대역 신호 출력을 위해 수행되는 시간 연장기에서의 프로세싱을 도시하고 있다.
동일 시간 연장량을 이용하여 프로세스된 모든 시간 연장된 신호들의 단일 지연 결과는 충분한 반면, 개별 위상 보정은 각 부대역 신호를 위해 적용되어야 하며, 개별 위상 보정이, 비록 신호-독립적이지만, 부대역 필터뱅크의 채널 숫자 또는, 다르게 말하면, 부대역 신호의 부대역 지수에 의존적이고, 여기서 부대역 지수는 이 설명의 문맥에서 채널 숫자와 동일한 것을 의미한다.
도 9는 단일 부대역 신호를 처리하기 위한 예시적 실행 처리의 또 다른 실시예를 설명한다. 단일 부대역 신호는 도 9에 보여지지 않은 분석 필터 뱅크에 의해 필터되기 전이든 후든 어떤 종류의 데시메이션든지 받게 된다. 그래서, 단일 부대역 신호의 시간 연장은 데시메이션이 형성되기 전의 시간 연장보다 짧아지게 된다. 단일 부대역 신호는 블록 추출기(1800)의 입력이고, 이는 블록 추출기(201)과 동일할 수 있으나, 다른 방식으로 실행될 수도 있다. 도 9의 블록 추출기(1800)는 예시적으로 e 라고 불리는 샘플/블록 선행 값을 이용하여 작동된다. 샘플/블록 선행 값은 가변적일 수 있거나 고정된 세트가 될수도 있으며 도 9에 블록 추출기 박스(1800)을 향하는 화살로 표시되어 있다. 블록 추출기(1800)의 출력에, 많은 수의 추출된 블록들이 존재한다. 블록들은 많이 오버랩핑되어 있고, 이는 샘플/블록 선행 값 e 가 블록 추출기의 블록 길이보다 상당히 작기 때문이다. 한 예는 블록 추출기는 12 샘플들의 블록을 추출하는 것이다. 첫번째 블록은 0에서 11까지의 샘플들을 포함하고, 두번째 블록은 1부터 12까지의 샘플들을 포함하며, 세번째 블록은 2부터 13까지의 샘플들을 포함하는 식으로 진행된다. 이 실시예에서, 샘플/블록 선행 값 e 는 1과 같고, 11-폴드(fold) 오버랩핑이 있다.
개별 블록들은 각 블록의 윈도우 펑션을 이용하여 블록들을 윈도윙 하기 위한 윈도우어(1802)에 입력되는 것들이다. 추가적으로, 위상 계산기(1804)가 구비되며, 각 블록의 위상을 계산한다. 위상 계산기(1804)는 윈도우잉하기 전이나 윈도우잉 한 후 모두 개별 블록을 이용할 수 있다. 그래서, 위상 조정 값 p×k가 계산되며 위상 조정기(1806)에 입력된다. 위상 조정기는 조정 값을 블록의 각 샘플에 적용한다. 예를 들어, 인수 2에 의한 대역폭 연장이 얻어졌을 때, 블록 추출기(1800)에 의해 추출된 블록을 위해 계산된 위상 p 가 인수 2에 의해 곱해지며 위상 조정기(1806) 블록의 각 샘플에 적용된 조정 값은 2에 의해 곱해진 p가 된다.
실시예에서, 단일 부대역 신호는 많은 수의 다른 방법으로 계산될 수 있는 블록의 위상 그리고 복합 부대역 신호이다. 하나의 방법은 블록의 중간 근처 또는 중간값의 샘플을 취하여 복합 샘플의 위상을 계산하는 것이다.
비록 위상 조정기가 윈도우어 다음에 작동되는 방법이 도 9에 도시되었지만, 이 두개의 블록들은, 위상 조정은 블록 추출기에 의해 추출된 블록들에 수행될 수 있고 차후 윈도윙 작동이 수행되도록, 상호교환될 수도 있다. 양 작동들, 즉, 윈도우잉과 위상 조정은 실제-값 또는 복합-값 곱셈들이며, 이 두가지 작동들은 복합 곱셈 인수를 이용한 단일 작동으로 요약될 수 있고, 그 자신은, 윈도우잉 인수와 위상 조정 곱셈 인수의 결과물이다.
위상-조정된 블록들은 오버랩/애드 그리고 진폭 보정 블록(1808)의 입력이고, 여기서 윈도우되고 위상-조정된 블록들은 오버랩-애드된다. 그러나, 중요하게, 블록(1808)의 샘플/블록 선행값 은 블록 추출기(1800)에서 사용된 값과는 다르다. 특히, 블록(1808)의 샘플/블록 선행값은 블록(1800)에서 사용된 e 값보다 크며, 따라서 블록(1808)에 의한 신호 출력의 시간 연장이 얻어지게 된다. 그래서, 블록(1808)에 의한 프로세스된 부대역 신호 출력은 블록(1800)에 입력되는 부대역 신호보다 긴 길이를 갖게 된다. 둘의 대역폭이 얻어질 때, 샘플/블록 선행 값이 이용되며, 블록(1800)의 대응 값보다 두배가 된다. 이는 두 인수에 의한 시간 연장을 야기한다. 그러나, 다른 시간 연장 인수들이 필요할 때, 다른 샘플/블록 선행 값들은 블록(1808)의 출력이 요구되는 시간 길이를 갖도록 이용될 수 있다. 실시예에서, m=0을 갖는 단 하나의 샘플이 위상의 k(또는 T)배를 갖도록 수정될 것이다. 이것은, 이 실시예에서, 모든 블록에 유효한 것은 아니다. 다른 샘플들에 있어 수정(modification)은, 도 13의 블록(143)에 표현된 예에서처럼 달라질 수 있다.
오버랩 문제를 다루기 위해, 진폭보정은 블록(1800)과 블록(1808)의 오버랩 차이의 문제를 다루기 위해 가급적 수행된다. 이 진폭 보정은, 그러나 윈도우어/위상 조정기 곱셈 인수에 도입될 수 있고, 진폭 보정은 또한 오버랩/프로세싱 이후에 수행될 수도 있다.
12의 블록 길이와 하나의 블록추출기의 샘플/블록 선행 값에 관한 위 예에서, 두 인수에 의한 대역폭 연장이 수행될 때, 오버랩/애드 블록(1808)에 관한 샘플/블록 선행 값은 2가 될 수 있다. 이것은 여전히 다섯 블록들의 오버랩을 야기한다. 3 인수에 의한 대역폭 연장이 수행될 때, 블록(1808)에 의해 사용되는 샘플/블록 선행 값은 3이 될수 있고, 오버랩은 3의 오버랩으로 떨어질 수 있다. 4-폴드(fold) 대역폭 연장이 수행될 때, 오버랩/애드 블록(1808)은 여전히 두 블록들보다 더 오버랩되는 결과를 낳는 4의 샘플/블록 선행 값을 이용해야 한다.
추가적으로, 필터뱅크 채널에 의존적인 위상 보정은 위상 조정기의 입력이 된다. 가급적이면, 위상 계산기와 신호-독립 위상 보정(다만 필터뱅크 채널 숫자 의존적)에 의해 결정되는 것에 따른 위상 보정 값이 단일-의존-조정 위상 값의 결합일 때 단일 위상 보정 작업이 수행되는 것이다.
도 8이 원래 코어 디코더 신호보다 더 높은 대역폭을 갖는 대역폭 연장된 오디오 신호를 발생시키는 장치의 대역폭 연장에 관한 실시예를 나타낼 때, 여기서 몇몇 QMF 분석 필터뱅크들(89a 부터 89c)가 이용되고, 추가적인 실시예에서, 오직 단일 분석 필터뱅크가 사용되는 것이 도 10과 도11의 관점에서 설명된다. 게다가, 도 8에 대해 개략적으로 설명된대로 머져(85)가 합성 필터뱅크를 포함할 때 코어 디코더를 위한 QMF 분석(89d)이 오직 요구된다. 그러나, 로우밴드 신호의 머징(merging)이 시간 도메인에서 일어날 때, 아이템(89d)는 요구되지 않는다.
이에 더하여, 머져(85)는 추가적으로 포락선 조정기나 기본적으로 전송되는 고 주파수 복원 파라미터들에 기반한 고 주파수 복원기의 신호 입력 프로세싱을 위한 높은 주파수 복원 프로세서를 포함할 수 있다. 이러한 복원 파라미터들은 포락선 조정 파라미터들, 노이즈 추가 파라미터들, 역 필터링 파라미터들, 손실 하모닉스 파라미터들 또는 다른 파라미터들을 포함할 수 있다. 이러한 파라미터들의 사용 그리고 파라미터들 그 자체 그리고 그들이 어떻게 포락선 조정을 수행하는데 응용되는지, 또는 일반적으로, ISO/IEC 14496-3:2005(E), 섹션 4.6.8에 설명된 대역폭 연장된 신호의 발생이 스펙트럴 대역 복제(SBR) 툴에 기여하는지 묘사되어 있다.
이와 반대로, 그러나, 머져(85)는 합성 필터뱅크 그리고 합성 필터뱅크 이후에 필터뱅크 도메인에서보다 시간 도메인에서 HFR 파라미터들을 이용하여 신호를 프로세싱하기 위한 HFR 프로세서를 포함하는 것이 가능하며, 여기서 HFR 프로세서는 합성 필터뱅크 전에 위치한다.
게다가, 도 8이 고려될 때, 데시메이션 기능은 QMF 분석 이후에 적용될 수 있다. 동시에, (92a) 부터 (92c)에, 각 교차 분기(branch)에 대해 개별적으로 묘사된, 시간 연장 기능은 모든 세 분기(branches)에 대한 단일 작업과 함께 수행될 수 있다.
도 10은 또다른 실시예에 따른 로우밴드 입력 신호(100)으로부터 대역폭 연장된 오디오 신호를 발생시키는 장치를 도시하고 있다. 상기 장치는 분석 필터뱅크(101), 부대역-방향 비선형 부대역 프로세서(102a,102b), 순차적으로 연결된 포락선 조정기(103), 또는 일반적으로 언급된, 파라미터 라인(104)의 입력의 예와 같은 고주파수 복원 파라미터들에서 작동하는 고주파수 복원 프로세서를 포함한다. 도10 또는 도11의 비선형 부대역 프로세서(102a,102b)는 도 8의 블록(82)와 유사한 패치 발생기이다. 포락선 조정기, 또는 일반적으로 언급된, 고주파수 복원 프로세스는 각 부대역 채널을 위한 개별 부대역 신호들과 합성 필터뱅크(105)로 각 부대역 채널을 위해 부대역 신호들이 처리되는 입력들을 처리한다. 합성 필터뱅크(105)는, 입력 신호들의 더 낮은 채널에서, 예를 들어, 도8에 도시된 QMF 분석 뱅크(89d)에 의해 발생되는 것처럼 로우밴드 코어 디코더 신호의 부대역 대표를 받아들인다. 실행에 따라, 로우밴드는 도10의 분석 필터뱅크(101)의 출력으로부터 유도될 수 있다. 교차 부대역 신호들은 고주파수 복원을 수행하기 위한 합성 필터뱅크의 더 높은 필터뱅크 채널들에 반영된다.
필터뱅크(105)는 결국 교차 인수 2, 3, 4에 의한 대역폭 연장들을 포함하는 교차기 출력 신호를 출력하고, 블록(105)에 이한 신호 출력은 더이상 크로스오버 주파수, 즉, 단일 구성요소에 의해 발생된 SBR 또는 HFR의 가장 낮은 주파수에 대응하는 코어 코더 신호 중 가장 높은 주파수, 에 대역폭-제한적이지 않다.
도 10의 실시예에서, 분석 필터뱅크 2배가 넘는 샘플링을 수행하고 특정 분석 부대역 스페이싱(106)을 갖는다. 합성 필터뱅크(105)는 합성 부대역 스페이싱(107)을 갖고, 이는 본 실시예에서, 도 11의 문맥에서 나중에 논의될 교차 기여의 결과를 낳는 분석 부대역 스페이싱 크기의 두배이다.
도 11은 도 10의 비선형 부대역 프로세서(102a)의 바람직한 실시예의 자세한 실시를 묘사한다. 도 11에 묘사된 회로는 단일 부대역 신호(108)을 신호로 받고, 이는 세 "분기"에서 프로세스된 것이다. : 상위 분기(110a)는 교차 인수 2에 의한 교차를 위한 것이다. 도 11의 중간에 있는 분기는 (110b)가 교차 인수 3에 의한 교차를 위한 것이라는 점을 나타내고, 도11의 더 낮은 분기는 교차 인수 4에 의한 교차를 위한 것임을 나타내고, 참조부호 (110c)로 나타내진다. 그러나, 분기(110a)를 위해 도 11의 각 프로세싱 요소에 의해 얻어지는 실제 교차는 오직 1(즉 교차 없음)이다. 중간 분기 (110b)를 위한 도11에 묘사된 프로세싱 요소에 의해 얻어지는 실제 교차는 1.5와 같고 더 낮은 분기(110c)를 위한 실제 교차는 2와 같다. 이는 도11의 왼쪽의 괄호의 숫자에 의해 나타내어지며, 여기서 교차 인수들 T가 나타내어진다. 첫번째 교차 기여를 나타내는 1.5와 2의 교차들은 분기들(110b,110c)의 데시메이션 작업을 가짐으로 인해 얻어지는 첫번째 교차 기여를 나타내고 오버랩-애드 프로세서에 의한 시간 연장을 나타낸다.
두번째 기여, 즉, 교차가 두배가 되는 것은, 합성 필터뱅크(105)에 의해 얻어지는데, 이는 합성 부대역 스페이싱 두배인 합성 부대역 스페이싱(107)을 가진다. 그래서, 두배 합성 부대역 스페이싱 을 갖는 합성 필터뱅크 때문에, 어떤 데시메이션 기능성이든 분기(110a)에서 일어나지 않는다.
분기 110b는, 그러나, 1.5에 의한 교차를 얻기 위한 데시메이션 기능을 가진다. 그러한 사실 때문에 합성 필터뱅크는 분석 필터뱅크의 물리적 부대역 스페이싱의 두배를 가지며, 3의 교차 인수가 도11에 두번째 분기 110b 의 블록 추출기의 왼쪽에 도시된대로 얻어진다.
비슷하게, 세번째 분기는 교차 인수 2에 대응하는 데시메이션 기능을 갖고, 분석 필터뱅크와 합성 필터뱅크의 다른 부대역 스페이싱의 최종 기여는 최종적으로 세번째 분기 (110c)의 교차인수 4에 대응한다.
특히, 각 분기는 블록 추출기(120a,120b,120c)를 가지며 이 블록추출기들 각각은 도 9의 블록 추출기(1800)과 유사할 수 있다. 게다가, 각 분기는 위상 계산기(122a,122b 그리고 122c)를 가지며, 위상 계산기는 도 9의 위상계산기 1804에 유사할 수 있다. 더하여, 각 분기는 위상 조정기(124a, 124b,124c)를 가지며 위상 조정기는 도9의 위상 조정기(1806)과 유사할 수 있다. 더하여, 각 분기는 윈도우어(126a,126b,126c)를 가지며 여기서 각 윈도우어들은 도9의 윈도우어(1802)와 유사할 수 있다. 그럼에도 불구하고, 윈도우어들 (126a,126b,126c)는 몇몇 "제로 패딩"과 함께 직사각형 윈도우를 함께 적용하기 위해 구성된다. 도 11의 실시예의, 각 분기(110a,110b,110c)로부터의 교차 또는 패치 시그널들은, 애더(adder,128)의 입력이고, 이는 각 분기로부터의 기여를 애더(128)의 출력의 교차 블록들이라 불리는 것을 최종적으로 얻기 위하여 현재 부대역 신호에 더하는 것이다.
그러면, 오버랩-애더(130)의 오버랩-애드 절차가 수행되며, 오버랩-애더(130)은 도9의 오버랩/애드 블록(1808)과 유사해질 수 있다. 오버랩-애더는 2·e의 오버랩-애드 선행 값을 적용하고 여기서 오버랩-선행 값 또는 블록 추출기들(120a,120b,120c)의 "스트라이드 값"이고, 오버랩-애더(130)은, 도11의 실시예에서, 교차된 신호를 출력하는데, 이는 채널 k를 위한 단일 부대역 출력, 즉 현재 관찰된 부대역 채널을 위한것이다.
도11에 도시된 프로세싱은, 도10에 도시된대로, 각 분석 부대역 또는 분석 부대역의 특정 그룹을 위해 수행되며, 교차된 부대역 신호들은, 도 10에 묘사된 블록(105)의 출력에서 교차기 출력 신호를 최종적으로 얻기 위한 블록(103)에 의해 프로세스된 후 합성 필터뱅크(105)로의 입력이다.
실시예에서, 첫번째 교차기 분기(110a)의 블록 추출기(120a)는 10 부대역 샘플들을 추출하며, 순차적으로 이 10 QMF 샘플들의 극 좌표로의 변환이 수행된다. 출력은 차후 논의되는 것과 같이, 도13, 블록 (143),에서 논의된대로 정의된다. 위상 조정기(124a)에서 발생된 출력은 윈도우어(126a)를 향하고, 그것은 블록의 마지막 그리고 첫번째 값을 위해 0에 의한 출력을 연장하고, 여기서 이 작업은 길이 10인 직사각형 윈도우의 (합성) 윈도윙과 균등하다. 분기(110a)의 블록 추출기(120a)는 데시메이션을 수행하지 않는다. 따라서, 블록 추출기에 의해 추출된 샘플들은 그들이 추출된대로 동일한 샘플 스페이싱에서 추출된 블록으로 맵핑되게 된다.
그러나, 이는 분기들(110b와110c)과 다르다. 블록 추출기(120b)는 바람직하게 8 부대역 샘플들의 블록을 추출하고 이 8 부대역 샘플들을 다른 부대역 샘플 스페이싱에서 추출된 블록에서 분배한다. 추출된 블록을 위한 비-정수 부대역 샘플 입력들은 보간법에 의해 얻어지며, 따라서 얻어진 QMF 샘플들을 보간된 샘플들과 함께 극 좌표로 변환되며, 위상 조정기(124b)에서 도13의 블록(143)의 표현처럼 유사한 표현을 도출하기 위해 프로세스된다.
그러면, 다시, 윈도우어(126b)의 윈도우윙이 첫번째 두 샘플들과 마지막 두 샘플들을 위해 0으로 위상 조정기(124b)에 의해 블록 출력을 연장하기 위해 수행되며, 이 작업은 길이 8의 직사각형 윈도우의 (합성)윈도윙과 균등하다.
블록 추출기(120c)는 6 부대역 샘플들의 시간 연장과 함께 블록을 추출하기 위해 구성되고 데시메이션 인수 2의 데시메이션을 수행하며, QMF 샘플들의 극좌표로의 변환을 수행하고, 다시 도13의 블록 (143)에 포함된 것과 유사한 표현을 얻기 위해 위상 조정기(124b)의 작업을 수행하고, 첫번재 세 부대역 샘플들과 마지막 세 부대역 샘플들을 위해 출력은 0에 의해 다시 연장된다. 이 작업은 길이 6의 직사각형 윈도우의 (합성) 윈도우윙과 균등하다.
각 분기의 교차 출력은 애더 (128)에 의한 결합 QMF 출력을 형성하기 위하여 추가되며, 결합 QMF 출력들은 최종적으로 블록 (130)에서 오버랩-애드를 이용하여 겹치게 되고, 여기서 오버랩-애드 선행 또는 스트라이드 값은 예전에 논의된대로 블록 추출기(120a,120b,120c)의 스트라이드 값 두배이다.
순차적으로, 바람직한 위상 보정들을 결정하기 위한 다른 실시예는 도12의 문맥에서 논의된다. (151)에서 지시된 실시예에서, 분석/합성 필터뱅크 쌍의 대칭적인 상황이 존재하고, 위상 보정
Figure pct00016
은 교차 인수 T에 의존적인 첫번째 항 (151a)와 n 또는 도11에 k로 표시된 채널숫자에 의존적인 두번째 항 (151b) 를 갖는다.
이 실시예에서, 위상 조정기는, 항 151b에 따라 필터뱅크 채널에 의존하지 않지만, 항 (151a)에 지시된대로 교차 인수 T에 의존할 수도 있는, 도 11에 Ω(k)로 지시된 값
Figure pct00017
을 이용한 위상 보정을 적용하기 위해 구성된다. 그러나 중요하게는, 위상 보정은 실제 부대역 신호에 의존하지 않는다. 이 의존도는 블록(122a,122b,122c)의 문맥에서 논의된바와 같이 보코더 교차를 위한 위상 계산기에 의해 설명되지만, 위상 보정 또는 "복합 출력 이득 값 Ω(k)"는 부대역 신호 독립적이다.
또다른 실시예에서, 도12의 (152)에서 지시된바와 같이, 위상 트위들(twiddle)의 비대칭적 분배가 일어난다. 위상 트위들은 시간축을 따라 합성 필터뱅크의 출력 값들을 시프트하는 것 뿐만 아니라 시간 축을 따라 분석 필터뱅크 입력 샘플들의 블록을 시프트하기 위해서도 사용된다. 위상 트위들 값들은
Figure pct00018
로 지시된다. 위상 트위들의 비대칭적 분배의 경우에서 실제적으로 사용되는 위상 보정은
Figure pct00019
으로 지시되고, 다시 항 (152a)에 의존적인 교차 인수 그리고 부대역 채널 의존적 항 (152b)가 존재한다.
(153)에 지시된 본 발명의 또다른 바람직한 실시예는 오직 부대역 채널에 의존하며 교차 인수에 더 이상 의존하지 않는, 도11에 도시된 위상 보정 항
Figure pct00020
또는 Ω(k)에 있어, (151)과 (152)의 실시예를 넘어서는 이점을 가진다. 이 이점이 있는 상황은 위상 보정의 교차-의존 항을 취소하기 위해 분석 필터뱅크로 위상 트위들의 특정 어플리케이션을 적용함에 의해 얻어질 수 있다. 특정 필터뱅크 실행을 위한 어떤 실시예에 있어서, 이 값은 도 12에 지시된
Figure pct00021
과 동일하다. 그러나, 다른 필터뱅크 설계들을 위해서,
Figure pct00022
값은 다양할 수 있다. 도 12는 상수 인수 385/128을 도시하고 있으나, 이 인수는 2부터 4까지 상황에 따라 다양할 수 있다. 더하여, 385/128로부터 떨어지고, 특정 필터뱅크 디자인을 위한 값으로부터 떨어진, 최적의, 다른 값들이 이용될 수 있고, 특정 연장에서 무시될 수 있는 교차 인수의 미세 의존도에서 오직 야기될 수 있다.
도 13은 각 교차기 분기 (110a,110b,110c)로부터 수행되는 단계들의 순서를 도시한다. 단계(140)에서, 블록 (120a)에서처럼 순수한 샘플 추출에 의해 또는 블록 (120b,120c)에서처럼 데시메이션 수행에 의해 그리고 아마도 또한 블록(120b)의 문맥에서 지적된 바와 같은 보간법에 의해서도 결정될 수 있다. 그러면, 단계(141)에서, 각 샘플의 크기 r 그리고 위상 Φ 이 계산된다. 블록 (142)에서, 도 11의 위상 계산기 (122a, 122b, 122c)는 블록을 위한 특정 크기와 특정 위상을 계산한다. 바람직한 실시예에서, 추출된 잠재적으로 데시메이션되고 보간된 블록의 중간에서의 값의 크기와 위상은 블록의 진폭값처럼 블록을 위한 위상 값이 계산된다. 그러나, 블록의 다른 샘플들은 각 블록의 크기와 위상을 결정하기 위해 취해질 수 있다. 이와 반대로, 블록의 모든 샘플의 크기와 위상을 합산함으로써 그리고 블록의 샘플들의 숫자에 의해 결과값을 나눔으로써 결정되는 평균적인 크기 또는 평균적인 위상은 블록의 크기와 위상처럼 이용될 수 있다. 도13의 실시예에서, 그러나, 블록을 위한 크기와 위상에서처럼, 블록 중간에서의 샘플의 크기와 위상을 지수 0에서 이용하는 것이 바람직하다. 그러면 조정된 샘플이 첫번째 항으로 진보적 위상 보정 Ω(복소수가 된다), 두번째 항으로 (그러나 생략될 수도 있는) 크기 변조, 세번째 항으로 (T-1)·Φ(0)에 대응하는 블록(122a,122b,122c)에 의해 계산되는 단일-의존 위상 값을 이용한 위상 보정기(124a,124b,124c)에 의해 계산된다.
도 14a와 도14b는 도 12 실시예의 분석 필터뱅크들에 두개의 다른 변조 기능을 도시한다. 도 14는 교차 인수에 의존하는 위상 보정을 필요로 하는 분석 필터뱅크에 대한 변조를 도시한다. 필터뱅크의 이 변조는 도 12의 실시예 (153)에 대응한다.
실시예(152)에 대응하는 다른 실시예가 도14b에 도시되어 있는데, 이는 교차 인수-의존적 위상 보정이 위상 트위들의 비대칭적 분배 때문에 적용되는 것이다. 특히, 도 14b는 레퍼런스에 의해 여기 포함된 ISO/IEC 14496-3, 섹션 4.6.18.4.2의 복합 SBR 필터뱅크와 매칭되는 특정 분석 필터뱅크 변조를 도시하고 있다.
도.14a 그리고 14b가 비교될 때 코사인과 사인 값의 계산을 위한 위상 트위들링의 양이 도 14b의 마지막 두 항과 도 14a의 마지막 항과 다르다는 것이 분명해진다.
입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치를 포함하는 실시예는, 입력 오디오 신호로부터 하나 또는 그 이상의 패치 시그널들을 발생시키는 패치 발생기, 여기서 패치 시그널은 다른 패치의 패치 중심 주파수, 입력 오디오 신호의 중심 주파수와 다른 패치 중심 주파수를 갖으며, 여기서 패치 발생기는 입력 오디오 신호와 하나 또는 그 이상의 패치 신호들 사이의 시간 비정렬 또는 다른 패치 신호들 사이의 시간 비정렬이 감소하거나 제거되도록 하나 또는 그 이상의 패치 신호를 발생시키도록 구성되며, 또는 여기서 패치 발생기는 시간 연장 기능 내에서 필터뱅크-채널 의존 위상 보정을 수행하기 위해 구성된다.
또다른 실시예에서, 패치 발생기는 다수의 패쳐들,을 포함하고, 각 패처는 데시메이팅 기능, 시간 연장 기능, 시간 비정렬을 감소시키거나 제거하기 위한 패치 신호들에 대한 시간 보정을 적용하기 위한 패치 콜렉터를 갖는다.
또다른 실시예에서, 패치 발생기는 임펄스-유사 신호가 프로세스될 때, 시간 연장이 패치된 신호들의 중심이 제시간에 서로간 정렬되는 프로세싱에 의해 얻어지는 방식으로 저장되고 선택되도록 구성된다.
또다른 실시예에서, 비정렬을 감소시키거나 제거하기 위한 패치 발생기에 의해 적용되는 시간 지연들이 고정적으로 저장되고 프로세스된 신호에 독립적이다.
또다른 실시예에서, 시간 연장기는 선행값 추출, 윈도우어/위상 조정기, 선행 값 추출로부터 다른 오버랩-애드 선행값을 갖는 오버랩-애더를 이용한 블록 추출기를 포함한다.
또다른 실시예에서, 시간 지연은 선행 값 추출, 오버랩-애드 선행 값 또는 두 값 모두에 의존하는 비정렬을 감소시키거나 제거하기 위해 적용된다.
또다른 실시예에서, 시간 연장기는 블록 추출기, 윈도우어/위상 조정기, 분석 필터뱅크의 다른 채널 숫자들을 갖는 적어도 두개의 다른 채널들을 위한 오버랩-애더들을 포함하고, 여기서 적어도 두개의 채널들 각각을 위한 윈도우어/위상 조정기는 각 채널을 위한 위상 조정을 적용하기 위해 구성되며, 위상 조정은 채널 숫자에 의존한다.
또 다른 실시예에서, 위상 조정기가 샘플링 값들의 블록의 샘플링 값에 대한 위상 조정을 적용하기 위해 구성되는 곳에서, 위상 조정은 시간 연장 량에 의존하고 블록의 실제 위상에 의존하는 위상 값의 결합이며, 위상-의존 위상 값은 채널 숫자에 의존한다.
비록 몇몇 관점이 장치의 문맥에서 설명되었지만, 이러한 관점들 또한 방법 단계의 특징 또는 방법 단계에 대응하는 장치나 블록에서, 대응하는 방법에 대한 설명을 나타낸다는 것은 명백하다. 유사하게, 방법 단계의 문맥에서 설명된 관점들은 또한 장치에 대응하는 특징들 또는 아이템 또는 블록에 대응하는 설명을 나타내고 있다.
진보적인 인코딩된 오디오 신호는 디지털 저장 매체에 저장될 수 있거나 전송 매체에서 전송될 수 있고 그러한 예로 무선 전송 매체 또는 인터넷과 같은 유선 전송 매체가 있다.
특정한 실행의 요구들에 의존하여, 이 발명의 실시예들은 하드웨어 또는 소프트웨어에서 실행될 수 있다. 실행들은 전자적으로 읽을 수 있는 컨트롤 신호들을 그곳에 저장하고 있는 디지털 저장매체, 예를 들어 플로피 디스크, DVD, CD, ROM, PROM, EPROM, EEPROM 또는 플래쉬 메모리,를 이용하여 수행될 수 있고 그것은, 각 방법이 수행되는, 프로그래밍 가능한 컴퓨터 시스템과 연동한다.(또는 연동 가능하다)
본 발명에 따른 몇몇 실시예들은 전자적 판독 가능한 컨트롤 신호들을 갖는 데이터 캐리어를 포함하며, 그것은 여기서 설명된 방법 중 하나가 수행되는 프로그래밍 가능한 컴퓨터 시스템과 연동 가능하다.
일반적으로 본 발명의 실시예들은 프로그램 코드로 컴퓨터 프로그램 결과물에서 실행될 수 있으며, 상기 프로그램 코드는 컴퓨터 프로그램 결과물이 컴퓨터에서 수행될 때 상기 방법 중 하나를 수행하도록 작동되는 것이다. 프로그램 코드는 예시적으로 기계 판독가능 캐리어에 저장될 수도 있다.
다른 실시예들은 여기에 설명되고, 기계 판독가능 캐리어에 저장된 방법들 중 하나를 수행하기 위한 컴퓨터 프로그램을 포함한다.
다른 말로, 발명의 방법의 실시예는, 컴퓨터 프로그램이 컴퓨터에서 운영될 때 여기서 설명된 방법 중 하나를 수행하기 위한 프로그램 코드를 갖는 컴퓨터 프로그램이다.
발명의 방법의 또다른 실시예는, 여기서 설명된 방법 중 하나를 수행하기 위한 zjavxj 프로그램을 그 자체에 포함하는 데이터 캐리어이다.(또는 디지털 저장 매체, 또는 컴퓨터 판독가능 매체)
발명의 방법의 또다른 실시예는, 여기서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램을 나타내는 신호들의 순서 또는 데이타 스트림이다. 데이타 스트림 또는 신호들의 순서는, 예를 들어 인터넷같은 데이타 통신 연결을 통해 전송되기 위해 예시적으로 구성될 수 있다.
또다른 실시예는 여기서 설명된 방법 중 하나를 수행하기 위해 구성되거나 적응되기 위하여 프로세싱 수단, 예를 들어 컴퓨터 또는 프로그래밍 가능한 논리 장치를 포함한다.
또다른 실시예는 여기서 설명된 방법 중 하나를 수행하기 위한 컴퓨터 프로그램이 그 자체에 설치된 컴퓨터를 포함한다.
몇몇 실시예에서, 프로그래밍 가능한 논리 장치(예를 들어 필드 프로그래밍 가능한 게이트 어레이)는 여기서 설명된 방법 중 모든 기능 또는 몇몇을 수행하도록 사용될 수 있다. 몇몇 실시예에서, 필드 프로그래밍 가능한 게이트 어레이는 여기서 설명된 방법 중 하나를 수행하기 위해 마이크로 프로세서와 연동될 수 있다. 일반적으로, 상기 방법들은 바람직하게는 어떠한 하드웨어 장치에 의해서도 수행된다.
상기 설명된 실시예들은 단지 본 발명의 원리를 위해 예시적일 뿐이다. 본 상기 배열의 변형, 변화, 그리고 여기서 설명된 자세한 내용들을 기술분야의 다른 숙련자에게 명백하다고 이해되어야 한다. 그것의 의도는, 따라서, 여기의 실시예의 설명 또는 묘사의 방법에 의해 표현된 특정 세부사항들에 의해 제한되는 것이 아닌 오직 목전의 특허 청구항의 범위에 의해서만 제한된다는 것이다.
[참고문헌]
[1] J. L. Flanagan and R. M. Golden, Phase Vocoder, The Bell System Technical Journal, November 1966, pp 1394 -1509
[2] United States Patent 6549884 Laroche, J. & Dolson, M.: Phase-vocoder pitch-shifting
[3] J. Laroche and M. Dolson, New Phase-Vocoder Techniques for Pitch-Shifting, Harmonizing and Other Exotic Effects, Proc. IEEE Workshop on App. of Signal Proc. to Signal Proc. to Audio and Acous., New Paltz, NY 1999.
[4] Frederik Nagel, Sascha Disch, A harmonic bandwidth extension method for audio codecs, ICASSP, Taipei, Taiwan, April 2009
[5] Frederik Nagel., Sascha Disch and Nikolaus Rettelbach, A phase vocoder driven bandwidth extension method with novel transient handling for audio codecs, 126th AES Convention, Munich, Germany, May 7-10, 2009

Claims (20)

  1. 입력 신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치에 있어서,
    상기 입력 신호(82, 102a, 102b)로부터 하나 이상의 패치 신호들을 발생시키기 위한 패치 발생기(82, 102a, 102b)를 포함하되, 여기서 패치 신호는 다른 패치의 패치 중심 주파수나 입력 오디오 신호의 중심 주파수와 다른 패치 중심 주파수를 가지고,
    패치 발생기(82, 102a, 102b)는 분석 필터뱅크(101)로부터 부대역 신호들의 시간연장을 실행하기 위해 구성되며,
    패치 발생기(82, 102a, 102b)는 필터뱅크-채널 의존적 위상 보정(151, 152, 153)을 이용하여 부대역 신호들의 위상들을 조정하기 위한 위상 조정기(124a, 124b, 124c, 1806)를 포함하는 것을 특징으로 하는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  2. 제1항에 따른 장치에 있어서,
    상기 위상 조정기(124a, 124b, 124c, 1806)는 상기 필터뱅크(101, 105)의 설계에 의해 도입되는 신호의 진폭 변화가 감소되거나 제거되도록 상기 위상 보정(151, 152, 153)을 선택하기 위해 구성되는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  3. 제1항 또는 제2항에 따른 장치에 있어서,
    상기 위상 조정기(124a, 124b, 124c, 1806)는 상기 위상 보정(151, 152, 153)을 적용하기 위해 구성되며, 상기 위상 보정은 부대역 신호에 독립적인 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  4. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 위상 조정기(124a, 124b, 124c, 1806)는 적용된 교차 요소(143)에 의존하는 신호-의존 위상 보정을 추가적으로 적용하기 위해 구성되는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  5. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 패치 발생기(82, 102a, 102b)는 블록-방향 진행을 위해 구성되며,
    블록 선행 값(e)을 이용하여 상기 부대역 신호로부터의 값들 중 다음 순서의 블록들을 추출하기 위한 블록 추출기(1800, 120a, 120b, 120c);
    위상 조정기(124a, 124b, 124c, 1806); 및
    중복-부가 프로세서(1808, 130);를 포함하며,
    여기서 상기 중복-부가 프로세서는 시간 연장을 얻기 위해 블록 선행 값(e)보다 커지는 블록 선행 값(k·e)을 적용하기 위해 구성되는 것을 특징으로 하는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  6. 제5항에 따른 장치에 있어서, 블록 추출기(120b, 120c)는 추가적으로 교차 요소 T에 의존하는 데시메이션 작업을 수행하고 비-정수 데시메이션 작업의 경우 보간(interpolation)을 수행하기 위해 구성되는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  7. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 위상 조정기(124a, 124b, 124c, 1806)는 상기 위상 보정(153)을 적용하기 위해 구성되고,
    상기 위상 보정은,
    πC(k + 1/2)
    를 포함하며, 여기서 k는 필터뱅크 채널을 가리키고 C는 2와 4 사이의 실수인 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  8. 제5항에 따른 장치에 있어서,
    상기 패치 발생기(82, 102a, 102b)는 윈도우 기능을 이용하여 블록을 윈도우윙(windowing)하기 위한 윈도우어(windower)(126a, 126b, 126c, 1802)를 더 포함하는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  9. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서, 적어도 두개의 교차 요소 T를 이용하여 대역폭 연장을 위해 구성되며, 상기 패치 발생기는,

    상기 첫번째 교차 인수를,
    블록 선행 값을 이용하고 첫번째 데시메이션 인수를 이용하는 첫번째 데시메이션을 이용하거나 데시메이션을 이용하지 않고 추출(120a, 120b)하도록;
    상기 부대역 샘플들의 블록의 상기 샘플들을 상 조정(phase adjust)하도록;
    상기 상 조정된 블록이 첫번째 교차 신호를 얻을 수 있도록 확실한 길이까지 제로 패드(zero pad)하도록;

    상기 두번째 교차 인수는,
    첫번째 데시메이션이 수행되었을 때, 블록 선행 값을 이용하고 상기 첫번째 데시메이션 인수보다 더 큰 두번째 데시메이션 인수를 이용하는 데시메이션을 이용하여 부대역 샘플들의 블록을 추출하도록;
    상기 부대역 샘플들의 블록의 상기 샘플들을 상 조정(phase adjust)하도록;
    상기 상 조정된 블록이 두번째 교차된 신호를 얻을 수 있도록 확실한 길이까지 제로 패드(zero pad)하도록;
    교차 블록을 얻도록 샘플별로 상기 첫번째와 상기 두번째 교차된 신호를 추가 (128) 하도록;
    교차된 부대역 신호를 얻기 위하여 상기 블록 선행 값보다 더 큰 선행 값을 이용하는 순차적 교차 블록들을 오버랩-애드(130)하도록;
    구성되는 것을 특징으로 하는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  10. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    조정된 부대역 신호들을 얻기 위하여 상기 부대역 신호들에 적용되는 상기 상 보정에 순차적인 상기 부대역 신호들에 고주파수 복원 파라미터들(104)을 적용하기 위한 고주파수 복원 프로세서;를 더 포함하는,
    입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  11. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 분석 필터뱅크(101)의 부대역 간격보다 더 큰 부대역 간격을 갖는 합성 필터뱅크(105);를 더 포함하는,
    입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  12. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 상 보정이 상기 교차 인수에 의존하는, 상기 분석 필터 뱅크(101)가 상 트위들링을 갖는 격자구조 미러 필터뱅크(Quadrature Mirror Filterbank, QMF)이고, 상기 패치 발생기(82, 102a, 102b)가 저대역 신호로부터 부대역 신호들을 발생시키기 위해 분석 필터뱅크를 포함하는 것을 특징으로 하는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  13. 제1항 내지 제11항 중 어느 한 항에 따른 장치에 있어서,
    상기 분석 필터뱅크(101)은 QMF 필터뱅크이고 상기 상 보정 (153)이 상기 하나 이상의 패치된 신호들을 발생시키기 위해 사용된 교차 인수로부터 독립적이도록, 상 트위들링을 적용하기 위해 구성되는 것을 특징으로 하는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  14. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 패치 발생기는 시간 연장기(92a)를 포함하고, 상기 시간 연장기(92a)는 선행 값 추출을 이용하는 블록 추출기를 포함하는 것을 특징으로 하는 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  15. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 패치 발생기(82, 102a, 102b)는 시간 연장기(92a)를 포함하고, 상기 시간연장기는 분석 필터뱅크의 다른 채널 숫자들을 갖는 적어도 두개의 다른 채널들을 위한 블록 추출기, 윈도우어, 또는 상 조정기 그리고 상기 오버랩-애더(overlap-adder)를 갖고,
    상기 적어도 두개의 채널 각각을 위한 상기 윈도우어 또는 상 조정기는 각 채널을 위한 상 조정을 적용하기 위해 구성되며, 상기 상 조정은 상기 채널 숫자에 의존하는 것을 특징으로 하는, 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  16. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 상 조정기는 샘플링 값들의 블록의 샘플링 값들에 상 조정을 적용하기 위하여 구성되며, 상기 상 조정은 상기 시간 연장량과 상기 블록의 실제 상에 의존한 상 값과, 상기 상 보정에 따른 상기 채널 숫자에 의존적인 신호-독립적 상 값의 결합인 것을 특징으로 하는, 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  17. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 패치 발생기(82, 102a, 102b)는 상기 입력 오디오 신호 그리고 상기 하나 또는 그 이상의 패치 시그널들 사이의 시간 비정렬, 또는 다른 패치 시그널들 사이의 시간 비정렬이 감소되거나 제거되도록, 하나 또는 그 이상의 패치 시그널들을 발생시키기 위해 구성되는 것을 특징으로 하는, 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  18. 상기 선행 청구항들 중 어느 하나에 따른 장치에 있어서,
    상기 패치 발생기(82, 102a, 102b)는 복수의 패치들(87a,87b,87c,110a,110b,110c), 데시메이팅 기능, 시간 연장 기능을 갖는 적어도 하나의 패쳐(patcher), 그리고 상기 시간 비정렬을 감소시키거나 제거하기 위하여 상기 패치 신호들에 대한 시간 보정을 적용하기 위한 패치 보정기를 포함하는 것을 특징으로 하는, 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 장치.
  19. 입력 신호로부터 대역폭이 연장된 오디오 신호를 발생시키기 위한 방법에 있어서,
    상기 입력 신호로부터 하나 또는 그 이상의 패치 신호들을 발생시키는 단계(82,102a,102b);를 포함하며,
    여기서 패치 신호는 다른 패치의 패치 중심 주파수와 또는 상기 입력 오디오 신호의 중심 주파수와 다른 패치 중심 주파수를 갖고, 분석 필터뱅크(101)로부터 부대역 신호들의 시간 연장(90a,90b,90c;1808;130)이 수행되며, 상기 부대역 신호들의 상들은 필터뱅크-채널 의존적인 상 보정(151,152,153)을 이용하여 부대역 신호들이 조정(1806,124a,124b,124c)되는 것을 특징으로 하는, 입력신호로부터 대역폭이 연장된 오디오 신호를 발생시키는 방법.
  20. 컴퓨터상에서 실행될 때, 제 19항에 따른 상기 방법을 수행하는 프로그램 코드를 갖는 컴퓨터 프로그램이 저장된 기록매체.






KR1020127026336A 2010-03-09 2011-03-04 오디오 신호들의 대역폭 연장에 기반한 위상 보코더의 개선된 크기 응답과 시간적 정렬을 위한 방법과 장치 KR101483157B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US31211810P 2010-03-09 2010-03-09
US61/312,118 2010-03-09
PCT/EP2011/053298 WO2011110494A1 (en) 2010-03-09 2011-03-04 Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals

Publications (2)

Publication Number Publication Date
KR20130007598A true KR20130007598A (ko) 2013-01-18
KR101483157B1 KR101483157B1 (ko) 2015-01-15

Family

ID=43829366

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127026336A KR101483157B1 (ko) 2010-03-09 2011-03-04 오디오 신호들의 대역폭 연장에 기반한 위상 보코더의 개선된 크기 응답과 시간적 정렬을 위한 방법과 장치

Country Status (17)

Country Link
US (2) US9318127B2 (ko)
EP (1) EP2545551B1 (ko)
JP (1) JP5854520B2 (ko)
KR (1) KR101483157B1 (ko)
CN (1) CN102985970B (ko)
AR (1) AR080475A1 (ko)
BR (1) BR112012022745B1 (ko)
CA (1) CA2792449C (ko)
ES (1) ES2655085T3 (ko)
MX (1) MX2012010314A (ko)
MY (1) MY152376A (ko)
PL (1) PL2545551T3 (ko)
PT (1) PT2545551T (ko)
RU (1) RU2596033C2 (ko)
SG (1) SG183966A1 (ko)
TW (1) TWI425501B (ko)
WO (1) WO2011110494A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220044566A (ko) * 2019-08-08 2022-04-08 붐클라우드 360, 인코포레이티드 심리음향적 주파수 범위 확장을 위한 비선형 적응성 필터뱅크

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102985970B (zh) * 2010-03-09 2014-11-05 弗兰霍菲尔运输应用研究公司 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准
PL2545553T3 (pl) 2010-03-09 2015-01-30 Fraunhofer Ges Forschung Urządzenie i sposób do przetwarzania sygnału audio z użyciem zrównania granicy obszaru
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
EP2631906A1 (en) * 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
EP2682941A1 (de) * 2012-07-02 2014-01-08 Technische Universität Ilmenau Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
KR20160087827A (ko) * 2013-11-22 2016-07-22 퀄컴 인코포레이티드 고대역 코딩에서의 선택적 위상 보상
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
EP2963645A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
MX371223B (es) * 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
CA3152262A1 (en) 2018-04-25 2019-10-31 Dolby International Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
EP3785260A1 (en) 2018-04-25 2021-03-03 Dolby International AB Integration of high frequency audio reconstruction techniques
CN110881157B (zh) * 2018-09-06 2021-08-10 宏碁股份有限公司 正交基底修正的音效控制方法及音效输出装置
GB2579348A (en) * 2018-11-16 2020-06-24 Nokia Technologies Oy Audio processing

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55107313A (en) 1979-02-08 1980-08-18 Pioneer Electronic Corp Adjuster for audio quality
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
US6766300B1 (en) 1996-11-07 2004-07-20 Creative Technology Ltd. Method and apparatus for transient detection and non-distortion time scaling
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6549884B1 (en) 1999-09-21 2003-04-15 Creative Technology Ltd. Phase-vocoder pitch-shifting
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
WO2002084645A2 (en) 2001-04-13 2002-10-24 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
CN1272911C (zh) 2001-07-13 2006-08-30 松下电器产业株式会社 音频信号解码装置及音频信号编码装置
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
JP2005509928A (ja) * 2001-11-23 2005-04-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ信号帯域幅拡張
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
JP4227772B2 (ja) 2002-07-19 2009-02-18 日本電気株式会社 オーディオ復号装置と復号方法およびプログラム
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100524065B1 (ko) 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
US7337108B2 (en) 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
ATE471557T1 (de) 2003-10-23 2010-07-15 Panasonic Corp Spektrum-codierungseinrichtung, spektrum- decodierungseinrichtung, übertragungseinrichtung für akustische signale, empfangseinrichtung für akustische signale und verfahren dafür
JP4254479B2 (ja) 2003-10-27 2009-04-15 ヤマハ株式会社 オーディオ帯域拡張再生装置
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
MX2007005103A (es) 2004-11-02 2007-07-04 Koninkl Philips Electronics Nv Codificacion y decodificacion de senales de audio utilizando bancos de filtros de valor complejo.
WO2006075663A1 (ja) * 2005-01-14 2006-07-20 Matsushita Electric Industrial Co., Ltd. 音声切替装置および音声切替方法
WO2006108543A1 (en) * 2005-04-15 2006-10-19 Coding Technologies Ab Temporal envelope shaping of decorrelated signal
JP2007017628A (ja) 2005-07-06 2007-01-25 Matsushita Electric Ind Co Ltd 復号化装置
US7565289B2 (en) 2005-09-30 2009-07-21 Apple Inc. Echo avoidance in audio time stretching
JP4760278B2 (ja) 2005-10-04 2011-08-31 株式会社ケンウッド 補間装置、オーディオ再生装置、補間方法および補間プログラム
EP1964438B1 (en) 2005-12-13 2010-02-17 Nxp B.V. Device for and method of processing an audio data stream
FR2910743B1 (fr) 2006-12-22 2009-02-20 Thales Sa Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade.
JP5400059B2 (ja) 2007-12-18 2014-01-29 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
CN101471072B (zh) 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US9275652B2 (en) 2008-03-10 2016-03-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for manipulating an audio signal having a transient event
US9147902B2 (en) * 2008-07-04 2015-09-29 Guangdong Institute of Eco-Environmental and Soil Sciences Microbial fuel cell stack
BRPI0904958B1 (pt) * 2008-07-11 2020-03-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Aparelho e método para calcular dados de extensão de largura de banda usando um quadro controlado por inclinação espectral
ES2461141T3 (es) 2008-07-11 2014-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para generar una señal de ancho de banda ampliado
MY155538A (en) 2008-07-11 2015-10-30 Fraunhofer Ges Forschung An apparatus and a method for generating bandwidth extension output data
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
PL4231290T3 (pl) 2008-12-15 2024-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
CA3107567C (en) * 2009-01-28 2022-08-02 Dolby International Ab Improved harmonic transposition
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
JP5433022B2 (ja) * 2009-09-18 2014-03-05 ドルビー インターナショナル アーベー 高調波転換
ES2805349T3 (es) * 2009-10-21 2021-02-11 Dolby Int Ab Sobremuestreo en un banco de filtros de reemisor combinado
EP2704143B1 (en) * 2009-10-21 2015-01-07 Panasonic Intellectual Property Corporation of America Apparatus, method and computer program for audio signal processing
US8321216B2 (en) 2010-02-23 2012-11-27 Broadcom Corporation Time-warping of audio signals for packet loss concealment avoiding audible artifacts
CN102985970B (zh) * 2010-03-09 2014-11-05 弗兰霍菲尔运输应用研究公司 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220044566A (ko) * 2019-08-08 2022-04-08 붐클라우드 360, 인코포레이티드 심리음향적 주파수 범위 확장을 위한 비선형 적응성 필터뱅크

Also Published As

Publication number Publication date
RU2596033C2 (ru) 2016-08-27
JP2013521536A (ja) 2013-06-10
BR112012022745A2 (pt) 2018-06-05
TWI425501B (zh) 2014-02-01
TW201207844A (en) 2012-02-16
JP5854520B2 (ja) 2016-02-09
US20160267917A1 (en) 2016-09-15
KR101483157B1 (ko) 2015-01-15
AU2011226206B2 (en) 2013-12-19
AR080475A1 (es) 2012-04-11
PT2545551T (pt) 2018-01-03
RU2012142246A (ru) 2014-04-20
EP2545551B1 (en) 2017-10-04
US9318127B2 (en) 2016-04-19
WO2011110494A1 (en) 2011-09-15
BR112012022745B1 (pt) 2020-11-10
US9905235B2 (en) 2018-02-27
CN102985970A (zh) 2013-03-20
ES2655085T3 (es) 2018-02-16
CA2792449C (en) 2017-12-05
AU2011226206A1 (en) 2012-10-18
CN102985970B (zh) 2014-11-05
MY152376A (en) 2014-09-15
US20130058498A1 (en) 2013-03-07
EP2545551A1 (en) 2013-01-16
CA2792449A1 (en) 2011-09-15
PL2545551T3 (pl) 2018-03-30
SG183966A1 (en) 2012-10-30
MX2012010314A (es) 2012-09-28

Similar Documents

Publication Publication Date Title
KR101483157B1 (ko) 오디오 신호들의 대역폭 연장에 기반한 위상 보코더의 개선된 크기 응답과 시간적 정렬을 위한 방법과 장치
JP6727374B2 (ja) 高周波再構成の際のオーディオ信号処理
US20230074883A1 (en) Apparatus and method for processing an input audio signal using cascaded filterbanks
EP2800093A1 (en) Efficient combined harmonic transposition
AU2011226206B9 (en) Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
RU2805938C1 (ru) Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов
RU2814460C1 (ru) Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов
RU2799033C1 (ru) Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов
RU2782168C1 (ru) Система и способ для генерирования ряда сигналов высокочастотных поддиапазонов
BR122021019078B1 (pt) Aparelho e método para processar um sinal de áudio de entrada usando bancos de filtro em cascata

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171228

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181228

Year of fee payment: 5