KR20120052407A - 향상된 오디오 디코더 - Google Patents

향상된 오디오 디코더 Download PDF

Info

Publication number
KR20120052407A
KR20120052407A KR1020127008261A KR20127008261A KR20120052407A KR 20120052407 A KR20120052407 A KR 20120052407A KR 1020127008261 A KR1020127008261 A KR 1020127008261A KR 20127008261 A KR20127008261 A KR 20127008261A KR 20120052407 A KR20120052407 A KR 20120052407A
Authority
KR
South Korea
Prior art keywords
decoded
signal
audio
filter
audio signal
Prior art date
Application number
KR1020127008261A
Other languages
English (en)
Other versions
KR101387871B1 (ko
Inventor
프랭크 바움가르테
윌리엄 스튜어트
샤이 시아우 쿠오
Original Assignee
애플 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 애플 인크. filed Critical 애플 인크.
Publication of KR20120052407A publication Critical patent/KR20120052407A/ko
Application granted granted Critical
Publication of KR101387871B1 publication Critical patent/KR101387871B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

대역폭 확장 데이터를 포함하는 오디오 신호를 디코딩하기 위한 방법, 시스템, 및 장치가 제시된다. 코어 오디오 데이터 및 대역폭 확장 데이터를 포함하는 오디오 신호는 디코더에서 수신될 수 있다. 코어 오디오 데이터는 차단 주파수 아래의 주파수 범위와 같이 오디오 신호의 코어 부분과 관련될 수 있고, 대역폭 확장 데이터는 차단 주파수 위의 주파수 범위와 같이 오디오 신호의 확장된 부분과 관련될 수 있다. 코어 오디오 데이터는 디코드된 코어 오디오 신호를 시간 영역 표현으로 생성하기 위해 디코드될 수 있다. 또한, 오디오 신호의 확장된 부분은 확장 데이터 및 디코드된 코어 오디오 신호에 따라 재구성될 수 있다. 부가적으로, 디코드된 코어 오디오 신호는 저역통과 필터링될 수 있고 확장된 부분은 디코드된 출력 신호를 생성하기 위해 조합되기 전에 고역통과 필터링될 수 있다.

Description

향상된 오디오 디코더{ENHANCED AUDIO DECODER}
본 출원은 2009년 8월 31일자 출원된 미국 출원 번호 12/551,450의 우선권을 주장한다.
본 발명은 고효율 고급 오디오 코딩(High-Efficiency Advanced Audio Coding: HE-AAC) 방식을 사용하여 인코드된 오디오 데이터와 같은, 오디오 데이터의 디코딩, 및 오디오 데이터의 디코딩의 향상에 관한 것이다.
오디오 코딩은 오디오 신호 품질을 유지하면서, 감소된 양의 데이터, 예를 들어, 비트들로 오디오 신호의 내용(content)을 나타내는데 사용된다. 오디오 신호는 재생과 같이, 오디오 신호를 재구성하기 위해 저장될 필요가 있는 데이터의 양을 감소시키기 위해 코딩될 수 있다. 또한, 오디오 신호의 코딩된 표현은 감소된 양의 대역폭을 사용하여 송신될 수 있다. 그러므로, 코딩된 오디오 신호는, 예를 들어, 네트워크를 통해, 코딩되지 않은 오디오 신호보다 빠르게 또는 낮은 대역폭 접속을 통해 송신될 수 있다.
오디오 코덱(코더-디코더)은 오디오 파일의 크기를 감소시키기 위해 오디오 압축을 수행할 수 있다. 코덱은 손실없는 전략을 채용할 수 있는데, 이 경우, 오디오 신호 데이터의 모두는 코딩된 신호에 보유되고, 또는 손실있는 전략을 채용하면, 원래 오디오 신호 데이터의 일부는 코딩된 오디오 신호로부터 검색(retrieve)될 수 없다. 고효율 고급 오디오 코딩(HE-AAC)은 오디오를 스트리밍하는 것을 포함하여, 오디오 압축 및 송신에 사용하기 위해 MPEG(Moving Picture Experts Group)에 의해 채택되었던 손실있는 오디오 코딩 방식이다.
대역폭 확장 전략은 또한 오디오 신호를 코딩하는데 사용하기 위해 개발되어 왔다. 예를 들어, 스펙트럼 대역폭 복사(SBR: Spectral Bandwidth Replication)는 HE-AAC 코딩 및 디코딩에 사용하기 위해 채택되었던 대역폭 확장 전략이다. SBR 데이터는 인코더에 의해 오디오 데이터 스트림에 추가되고 디코딩에 사용하기 위해 수신 디코더에 의해 오디오 데이터 스트림으로부터 파스(parse)될 수 있다. 예를 들어, HE-AAC 코딩에서, 오디오 신호의 저주파수 부분(또는 "코어 신호")은 차단 주파수(cut-off frequency)까지 코딩된다. 오디오 신호의 고주파수 부분, 즉 차단 주파수 위의 모든 주파수를 나타내는 SBR 데이터는 오디오 신호의 유용한 고주파수 부분으로부터 인코더에서 결정된다. SBR 데이터는 오디오 신호의 고주파수 부분이 저주파수 부분에 기초하여 디코더에서 재구성될 수 있도록 생성된다. 또한, SBR 데이터는 오디오 신호의 고주파수 부분이 원래의 고주파수 부분과 가능하면 유사하게 지각적으로 재구성될 수 있도록 생성된다. 오디오 신호의 저주파수 부분과 재구성된 저주파수 부분은 디코드된 오디오 신호를 생성하기 위해 더 병합될 수 있다.
대역폭 확장 전략은 시간과 주파수 영역 사이에서 오디오 신호를 변환하기 위해 필터 뱅크에 의존한다. 예를 들어, SBR은 직교 미러 필터(QMF: Quadrature Mirror Filter) 뱅크를 사용하여 오디오 신호의 주파수 영역 표현을 시간 영역 표현으로(및 그 반대로) 변환한다. QMF 뱅크는 얼라이싱 왜곡(aliasing distortion)을 도입하지 않고서 동작하도록 설계된다. 그러나, QMF 필터 뱅크는 오디오 신호의 전체 주파수 범위를 합성하기 때문에, 그럼에도 불구하고 어떤 왜곡이 신호의 저주파수 부분 내로 도입될 수 있다.
<발명의 개요>
오디오 신호의 고주파수 부분과 관련된 왜곡은 디코딩 중에 분리될 수 있다. 그러므로, 오디오 신호의 고주파수 부분과 관련된 왜곡은 디코딩 중에, 대응하는 저주파수 부분, 즉, 코어 신호 내로 도입되지 않는다. 게다가, 대역폭 확장 전략, 예를 들어, SBR을 사용하여 인코드된 오디오 신호를 디코딩하기 위한 프로세스는 오디오 신호의 디코드된 저주파수 부분이 고주파수 성분이 존재하지 않을 때보다 왜곡이 많지 않도록 구현될 수 있다. 그러므로 오디오 신호의 주파수 범위는, 품질을 저하시키지 않거나 또는 오디오 신호를 송신하는데 요구되는 크기 또는 대역폭을 상당히 증가시키지 않고서, 예를 들어 사람의 귀의 정상 동작 범위를 넘어 확장될 수 있다.
본 발명자들은 오디오 신호의 고주파수 SBR 부분으로 디코딩하는 동안에 생기는 왜곡, 예를 들어, QMF 왜곡을 분리할 필요가 있다는 것을 인식하였다. 본 발명자들은 또한 HE-AAC 디코더 QMF 합성 필터 뱅크 및 QMF 분석 필터 뱅크와 관련된 계수를 코어 AAC 신호의 개선된 주파수 영역 표현을 제공하는 계수로 교체함으로써 왜곡을 감소시킬 필요가 있다는 것을 인식하였다. 또한, 저전력 및 고전력 디코딩 옵션 중에서 선택을 허용하게 할 필요가 또한 인식되었다.
본 발명자들은 또한 HE-AAC 신호와 같이, 대역폭 확장된 오디오 신호의 저주파수 부분의 디코딩 중에, 필터 뱅크, 예를 들어 QMF 필터 뱅크를 바이패스할 필요가 있다는 것을 인식하였다. 신호의 저주파수 부분을 주파수 영역으로 그리고 디코딩 중에 시간 영역으로 다시 변환하는 것을 방지할 필요가 또한 인식되었다. 더구나, 본 발명자들은 오디오 신호의 저주파수 부분 및 오디오 신호의 고주파수 부분을 디코드된 오디오 신호로의 왜곡의 도입을 감소시키기 위해 이들을 결합시키기 전에 분리하여 필터링할 필요를 인식하였다. 따라서, 여기서 설명된 기술 및 장치는, 코어 오디오 신호 내로 부가적 왜곡을 도입하지 않고서, 대역폭 확장 전략, 예를 들어 HE-AAC를 채용하는 인코딩 방식을 사용하여 고품질 오디오 신호를 인코딩하기 위한 알고리즘을 구현한다.
일반적으로, 한 양상에서 기술은 오디오 디코더에서, 오디오 신호의 코어 부분과 관련된 코어 오디오 데이터 및 오디오 신호의 확장된 부분과 관련된 확장 데이터를 수신하는 단계, 디코드된 코어 오디오 신호를 시간 영역 표현으로 생성하기 위해 코어 오디오 데이터를 디코드하는 단계, 확장 데이터 및 디코드된 코어 오디오 신호에 따라 오디오 신호의 재구성된 확장 부분을 생성하는 단계, 고역통과 필터를 사용하여, 재구성된 출력 신호를 생성하기 위해 오디오 신호의 재구성된 확장 부분을 필터링하는 단계, 및 디코드된 출력 신호를 생성하기 위해 디코드된 코어 오디오 신호와 재구성된 출력 신호를 조합하는 단계를 포함하도록 구현될 수 있다.
기술은 또한 오디오 신호의 재구성된 확장 부분을 생성하는 단계가 필터 뱅크를 사용하여, 오디오 신호의 재구성된 확장 부분을 시간 영역 표현으로 변환하는 단계를 더 포함하도록 구현될 수 있다. 또한, 기술은 필터 뱅크가 복소 직교 미러 필터 뱅크이도록 구현될 수 있다. 부가적으로, 기술은 확장 데이터가 스펙트럼 대역 복사 데이터이도록 구현될 수 있다. 또한, 기술은 또한 저역통과 필터를 사용하여, 조합전에 디코드된 코어 오디오 신호를 필터링하는 단계를 포함하도록 구현될 수 있다. 기술은 플랫 주파수 응답과 동일한 조합된 스펙트럼 응답을 갖도록 고역통과 필터 및 저역통과 필터를 구성하는 단계를 포함하도록 더 구현될 수 있다.
일반적으로, 다른 양상에서, 기술은 오디오 디코더에서, 오디오 신호의 코어 부분과 관련된 코어 오디오 데이터 및 오디오 신호의 확장된 부분과 관련된 확장 데이터를 수신하고, 디코드된 코어 오디오 신호를 시간 영역 표현으로 생성하기 위해 코어 오디오 데이터를 디코드하고, 확장 데이터 및 디코드된 코어 오디오 신호에 따라 오디오 신호의 재구성된 확장 부분을 생성하고, 고역통과 필터를 사용하여, 재구성된 출력 신호를 생성하기 위해 오디오 신호의 재구성된 확장 부분을 필터링하고, 디코드된 출력 신호를 생성하기 위해 디코드된 코어 오디오 신호와 재구성된 출력 신호를 조합하는 것을 포함하는 동작들을, 데이터 프로세싱 장치로 하여금 수행하도록 동작가능한, 컴퓨터 판독가능 매체 상에 인코드된 컴퓨터 프로그램 제품으로서 구현될 수 있다.
기술은 또한 데이터 프로세싱 장치로 하여금, 필터 뱅크를 사용하여, 오디오 신호의 재구성된 확장 부분을 시간 영역 표현으로 변환하는 동작을 수행하게 하도록 더 동작가능하게 구현될 수 있다. 부가적으로, 기술은 데이터 프로세싱 장치로 하여금, 코어 오디오 데이터와 확장 데이터를 분리하기 위해 수신된 비트스트림을 파싱하는 동작을 수행하게 하도록 더 동작가능하게 구현될 수 있다. 또한, 기술은 데이터 프로세싱 장치로 하여금, 저역통과 필터를 사용하여, 조합전에 디코드된 코어 오디오 신호를 필터링하는 동작을 수행하게 하도록 더 동작가능하게 구현될 수 있다. 또한, 기술은 데이터 프로세싱 장치로 하여금, 플랫 주파수 응답과 동일한 조합된 스펙트럼 응답을 갖도록 고역통과 필터 및 저역통과 필터를 구성하는 동작을 수행하게 하도록 더 동작가능하게 구현될 수 있다. 부가적으로, 기술은 데이터 프로세싱 장치로 하여금, 디코드된 코어 오디오 신호의 적어도 일부에 기초하여 부대역 신호를 생성하고, 재구성된 확장 부분을 생성하는데 사용하기 위한 부대역 신호를 확장 데이터에 따라 선택하는 동작들을 수행하게 하도록 더 동작가능하게 구현될 수 있다.
일반적으로, 다른 양상에서, 주제는 시간 영역 표현을 갖는 디코드된 저주파수 신호를 생성하기 위해 차단 주파수 아래의 오디오 신호 부분에 대응하는 저주파수 오디오 데이터를 디코드하는 단계, 확장 데이터 및 디코드된 저주파수 신호의 적어도 일부로부터 고주파수 오디오 데이터를 생성하는 단계, 필터 뱅크를 사용하여, 디코드된 고주파수 신호를 생성하기 위해 고주파수 오디오 데이터를 시간 영역 표현으로 변환하는 단계, 왜곡을 감소시키기 위해 디코드된 저주파수 신호 및 디코드된 고주파수 신호 중 적어도 하나를 필터링하는 단계, 및 디코드된 출력 신호를 생성하기 위해 디코드된 저주파수 신호와 디코드된 고주파수 신호를 조합하는 단계를 포함하도록 구현될 수 있다.
또한, 기술은 고주파수 오디오 데이터를 생성하는 단계가 디코드된 저주파수 신호의 적어도 일부에 기초하여 부대역 신호를 생성하는 단계, 및 고주파수 오디오 데이터를 생성하는데 사용하기 위한 부대역 신호를 확장 데이터에 따라 선택하는 단계를 더 포함하도록 구현될 수 있다. 기술은 또한 고주파수 오디오 데이터를 변환하기 전에 생성된 부대역 신호를 제거하는 단계를 포함하도록 구현될 수 있다. 부가적으로, 기술은 필터링 단계가 저역통과 필터를 사용하여 필터 뱅크의 응답과 일치하는 디코드된 저주파수 신호를 필터링하는 단계를 더 포함하도록 구현될 수 있다.
기술은 또한 필터 뱅크가 직교 미러 필터 뱅크를 포함하도록 구현될 수 있다. 또한, 기술은 필터링 단계가 저역통과 필터를 사용하여 디코드된 저주파수 신호를 그리고 고역통과 필터를 사용하여 디코드된 고주파수 신호를 필터링하는 단계를 더 포함하고, 저역통과 필터와 고역통과 필터는 오디오 신호의 주파수 범위의 일부에서 중첩하도록 구현될 수 있다.
일반적으로, 다른 양상에서, 기술은 시간 영역 표현을 갖는 디코드된 저주파수 신호를 생성하기 위해 차단 주파수 아래의 오디오 신호에 대응하는 저주파수 오디오 데이터를 디코드하고, 확장 데이터 및 디코드된 저주파수 신호의 적어도 일부로부터 고주파수 오디오 데이터를 생성하고, 필터 뱅크를 사용하여, 디코드된 고주파수 신호를 생성하기 위해 고주파수 오디오 데이터를 시간 영역 표현으로 변환하고, 왜곡을 감소시키기 위해 디코드된 저주파수 신호 및 디코드된 고주파수 신호 중 적어도 하나를 필터링하고, 디코드된 출력 신호를 생성하기 위해 디코드된 저주파수 신호와 디코드된 고주파수 신호를 조합하는 동작들을 데이터 프로세싱 장치로 하여금 수행하도록 더 동작가능한, 컴퓨터 판독가능 매체 상에 인코드된 컴퓨터 프로그램 제품으로서 구현될 수 있다.
기술은 또한 데이터 프로세싱 장치로 하여금, 디코드된 저주파수 신호의 적어도 일부에 기초하여 부대역 신호를 생성하고, 고주파수 오디오 데이터를 생성하는데 사용하기 위한 부대역 신호를 확장 데이터에 따라 선택하는 동작들을 수행하게 하도록 더 동작가능하게 구현될 수 있다. 또한, 기술은 데이터 프로세싱 장치로 하여금, 고주파수 오디오 데이터를 변환하기 전에 생성된 부대역 신호를 제거하는 동작을 더 수행하게 하도록 더 동작가능하게 구현될 수 있다. 부가적으로, 기술은 데이터 프로세싱 장치로 하여금, 저주파수 오디오 데이터와 확장 데이터를 분리하기 위해 수신된 비트스트림을 파싱하는 동작을 수행하게 하도록 더 동작가능하게 구현될 수 있다.
기술은 또한 데이터 프로세싱 장치로 하여금, 저역통과 필터를 사용하여 디코드된 저주파수 신호를 그리고 고역통과 필터를 사용하여 디코드된 고주파수 신호를 필터링하는 동작을 수행하게 하고, 저역통과 필터와 고역통과 필터는 오디오 신호의 주파수 범위의 일부에서 중첩하도록 더 동작가능하게 구현될 수 있다.
일반적으로, 다른 양상에서, 주제는 오디오 비트스트림을 수신하도록 구성된 입력, 및 디코드된 저주파수 신호를 생성하기 위해 오디오 비트스트림과 관련된 저주파수 오디오 데이터를 디코드하고 - 저주파수 오디오 데이터는 차단 주파수 아래의 오디오 신호 부분에 대응함-, 오디오 비트스트림과 관련된 확장 데이터 및 디코드된 저주파수 신호의 적어도 일부로부터 고주파수 오디오 데이터를 생성하고, 필터 뱅크를 사용하여, 디코드된 고주파수 신호를 생성하기 위해 고주파수 오디오 데이터를 시간 영역 표현으로 변환하고, 왜곡을 감소시키기 위해 디코드된 저주파수 신호 및 디코드된 고주파수 신호 중 적어도 하나를 필터링하고, 디코드된 출력 신호를 생성하기 위해 디코드된 저주파수 신호와 디코드된 고주파수 신호를 조합하는 것을 포함하는 동작들을 수행하도록 구성된 프로세서 전자장치를 포함하는 오디오 디코더를 포함하는 시스템으로서 구현될 수 있다.
기술은 또한 오디오 디코더가 플랫 주파수 응답과 동일한 조합된 스펙트럼 응답을 갖도록 구성된 고역통과 필터 및 저역통과 필터를 더 포함하도록 구현될 수 있다. 또한, 기술은 고역통과 필터 및 저역통과 필터가 주파수 범위의 일부에서 중첩하도록 구현될 수 있다. 부가적으로, 기술은 오디오 디코더가 디코드된 저주파수 신호를 지연하도록 구성된 지연 소자를 더 포함하도록 구현될 수 있다. 또한 기술은 지연 소자와 관련된 지연 기간(delay duration)이 필터 뱅크의 프로세싱 지연에 대응하도록 구현될 수 있다. 또한, 기술은 오디오 디코더가 디코드된 저주파수 신호의 적어도 일부에 기초하여 부대역 신호를 생성하도록 구성된 분석 필터 뱅크, 및 생성된 부대역 신호를 제로-아웃(zero-out)하도록 구성된 제거기를 더 포함하도록 구현될 수 있다. 부가적으로, 기술은 필터 뱅크가 직교 미러 필터 뱅크를 포함하도록 구현될 수 있다.
본 명세서에 설명된 기술은 다음의 장점들 중 하나 이상을 실현하기 위해 구현될 수 있다. 예를 들어, 기술은 대역폭 확장을 이용하는 오디오 코딩 방식이 예를 들어, 사람의 귀의 정상 동작 범위를 넘어 확장하는 오디오 스펙트럼을 갖는 고품질 오디오 신호를 인코드하는데 사용될 수 있도록 구현될 수 있다. 또한, 기술은 신호의 확장된 부분과 관련된 왜곡이 신호의 코어 부분 내로 도입되지 않도록 구현될 수 있다. 기술은 또한 코어 AAC 신호의 품질이 대응하는 AAC 신호에 대하여 절충되지 않는(uncompromised) 디코드된 HE-AAC 신호를 제공하도록 구현될 수 있다.
또한, 기술은 디코딩 경로의 적어도 일부를 위한 하나 이상의 필터 뱅크를 바이패스하는 것을 허용하도록 구현될 수 있다. 따라서, 주파수 영역 표현으로 그리고 다시 시간 영역 표현으로의 변환은 디코드된 신호의 적어도 일부에 대해 피해질 수 있다. 기술은 또한 디코드된 오디오 신호의 대응하는 부분들로부터 왜곡을 제거하기 위해 상보적인 저역통과 필터 및 고역통과 필터를 사용하는 것을 허용하도록 구현될 수 있다. 부가적으로, 기술은 컴퓨팅 리소스 및 배터리 전력과 같은, 하나 이상의 인자에 응답하여 바이패스 구현 및 수정된 필터 계수 구현에 기초하여 디코딩 옵션 중에서 선택하는 것을 허용하도록 구현될 수 있다.
하나 이상의 구현의 상세들이 첨부 도면 및 이후의 설명에서 기술된다. 다른 특징들 및 장점들이 설명 및 도면으로부터, 그리고 청구범위로부터 분명해질 것이다.
도 1은 대역폭 확장 오디오 신호를 디코드하도록 구성된 수정된 오디오 디코더를 도시한다.
도 2는 예시적인 수정된 QMF 뱅크의 프로토타입 저역통과 필터에 대한 타겟 주파수 응답을 도시한다.
도 3은 대역폭 확장 오디오 신호를 디코드하기 위한 예시적인 프로세스를 설명하는 흐름도를 도시한다.
도 4는 바이패스를 포함하고, 대역폭 확장 오디오 신호를 디코드하도록 구성된 수정된 오디오 디코더를 도시한다.
도 5는 코어 디코더 및 QMF 합성 필터 뱅크의 출력에 대한 백색 잡음 신호와 관련된 예시적인 왜곡 레벨을 도시한다.
도 6은 백색 잡음 신호의 디코드된 저주파수 부분을 필터링하는 저역통과 및 백색 잡음 신호의 디코드된 고주파수 부분을 필터링하는 고역통과의 예를 도시한다.
도 7은 백색 잡음 신호의 저역통과 및 고역통과 후의 예시적인 왜곡 레벨을 도시한다.
유사 참조 부호는 명세서 및 도면 전체에 걸쳐 유사 소자를 표시한다.
대역폭 확장 방식을 구현하도록 구성된 코덱은 저 비트율 오디오 신호 대신에 또는 그에 부가하여 고품질 오디오 신호에 사용하기 위해 채택될 수 있다. 예를 들어, 고품질 고 비트율 오디오 신호의 부분, 예를 들어, 고주파수 부분은 SBR 데이터를 사용하여 인코드될 수 있다. 게다가, 디코더는 SBR 데이터를 사용하여 인코드된 부분을 프로세싱하는 것과 관련된 왜곡이 신호의 잔여 부분, 예를 들어, 저주파수 부분에 도입되는 것을 방지하도록 구현될 수 있다. 도 1은 대역폭 확장 오디오 신호를 디코드하도록 구성된 수정된 오디오 디코더를 도시한다. 수정된 오디오 디코더(100)는 HE-AAC 비트스트림과 같이, 대역폭 확장 방식을 사용하여 인코드된 오디오 신호에 대응하는 오디오 비트스트림(102)을 수신할 수 있다. 오디오 비트스트림(102)은 오디오 비트스트림의 코어 부분과 관련된 코어 데이터를 포함할 수 있다. 예를 들어, 코어 데이터는 차단 주파수에 대해 정의될 수 있는 원래의 오디오 신호의 저주파수 부분(또는 저대역)을 나타낼 수 있다. 저주파수 부분의 대역폭 및 따라서 차단 주파수는 타겟 비트율에 기초하여 선택될 수 있다. 차단 주파수를 식별하는 데이터는 오디오 비트스트림(102)으로 인코드될 수 있다. 또한, 오디오 비트스트림(102)은 대역폭 확장 데이터, 예를 들어, 차단 주파수 위의 원래의 오디오 신호의 부분을 정의하는 SBR 데이터를 포함할 수 있다. 코어 데이터 및 대역폭 확장 데이터는 멀티플렉싱을 통하는 것을 포함하는 임의의 방식으로 오디오 비트스트림(102) 내에 배열될 수 있다.
수신된 오디오 비트스트림(102)은 비트스트림 파서(104)로 통과될 수 있고, 이 파서는 비트스트림 데이터를 분리, 예를 들어, 디멀티플렉스할 수 있다. 예를 들어, 비트스트림 파서(104)는 오디오 비트스트림(102)으로부터의 코어 데이터를 분할(또는 추출하고) 코어 데이터 스트림을 생성할 수 있다. 코어 데이터 스트림은 디코딩을 위해 코어 신호 디코더(106)에 제공될 수 있다. 또한, 비트스트림 파서(104)는 오디오 비트스트림(102)으로부터의 대역폭 확장 데이터를 분할하고 스펙트럼 대역 복사(SBR) 데이터 스트림을 생성할 수 있다. SBR 데이터 스트림은 디코딩 및 포스트-프로세싱 동작을 위해 SBR 프로세서(110)에 제공될 수 있다. 어떤 구현에서는, 다른 대역폭 확장 방식이 선택될 수 있고 선택 확장 방식에 대응하는 데이터 스트림이 SBR 데이터 스트림 대신에 생성될 수 있다. 또한, 이러한 구현에서, SBR 프로세서(110)는 선택된 확장 방식에 적응되는 프로세서로 교체될 수 있다.
코어 신호 디코더(106)는 디코드된 코어 오디오 신호의 시간 영역 표현을 생성하기 위해 코어 데이터를 디코드한다. 디코드된 코어 오디오 신호는 원래의 오디오 신호의 저주파수 부분, 예를 들어, 주파수 0과 22kHz 사이에 대응할 수 있다. 예를 들어, 오디오 비트스트림(102)이 HE-AAC 비트스트림인 경우에, 디코드된 코어 오디오 신호는 디코드된 AAC 신호에 대응할 수 있다.
또한, 디코드된 코어 오디오 신호는 수정된 QMF 분석 뱅크(108)에 제공될 수 있고, QMF 분석 뱅크(108)는 디코드된 코어 오디오 신호를 주파수 영역 표현으로 변환할 수 있다. QMF 분석 뱅크(108)는 수정된 QMF 뱅크(이후 논의됨)를 사용하여 디코드된 코어 오디오 신호를 분석하고 원래의 오디오 신호의 고주파수 부분을 재구성하는데 사용하기 위해, 예를 들어 32개 부대역에 대응하는 부대역 신호를 생성할 수 있다. 어떤 구현에서는, 디코드된 코어 오디오 신호는 부대역 신호를 생성하기 전에 업샘플될 수 있다. QMF 분석 뱅크(108)에 의해 생성된 부대역 신호는 SBR 프로세서(110) 및 QMF 합성 뱅크(112)에 제공될 수 있다. 어떤 구현에서는, QMF 분석 뱅크(108)는 표준 HE-AAC 디코더에 관련된 QMF 뱅크와 같이, 수정된 QMF 뱅크와 종래의 QMF 뱅크 사이에서 스위치하도록 구성될 수 있다. 예를 들어, QMF 분석 뱅크(108)는 저전력 상태 또는 제한된 리소스를 검출하는 것에 응답하여 수정된 QMF 뱅크로부터 스위치하도록 구성될 수 있다.
SBR 프로세서(110)는 SBR 데이터 스트림 및 QMF 분석 뱅크(108)로부터 수신된 저주파수 부대역 신호를 사용하여 원래의 오디오 신호의 고주파수 부분을 재구성한다. SBR 프로세서(110)는 SBR 데이터에 기초하여, 고주파수 부대역 신호를 생성하는데 사용하기 위해 저주파수 부대역 신호 중 하나 이상을 선택하도록 구성될 수 있다. 또한, SBR 프로세서(110)는 오디오 신호의 재구성된 고주파수 부분을 생성하기 위해 생성된 고주파수 부대역 신호의 엔벨로프를 조정하도록 구성될 수 있다.
QMF 분석 뱅크(108)에 의해 생성된 저주파수 부대역 신호 및 SBR 프로세서(110)에 의해 생성된 오디오 신호의 재구성된 고주파수 부분은 수정된 QMF 합성 뱅크(112)에 제공된다. 적절한 타이밍을 보장하기 위해, QMF 분석 뱅크(108)에 의해 출력된 저주파수 부대역 신호는 SBR 프로세서(110)로부터의 고주파수 신호의 출력과 일치하도록 지연될 수 있다. QMF 합성 뱅크(112)는 디코드된 오디오 신호를 생성하기 위해 저주파수 부대역 신호로 표현된 저주파수 부분과 재구성된 고주파수 부분을 조합한다.
QMF 합성 뱅크(112)는 코어 신호 디코더(106)의 출력에 존재하지 않았던 디코드된 오디오 신호 내의 왜곡을 감소 또는 제거하기 위해 설계된 수정된 QMF 뱅크를 사용하도록 구성될 수 있다. QMF 분석 뱅크(108)는 또한 수정된 QMF 뱅크 또는 그의 적응을 사용하도록 구성될 수 있다. QMF 분석 뱅크(108)의 경우와 같이, QMF 합성 뱅크(112)는 또한 표준 HE-AAC 디코더와 관련된 QMF 뱅크와 같이, 수정된 QMF 뱅크와 종래의 QMF 뱅크 사이에서 스위치하도록 구성될 수 있다. 게다가, 필터 뱅크는 QMF 분석 뱅크(108) 및 QMF 합성 뱅크(112)가 대응하는 필터 뱅크를 사용하도록 구성되도록 조정될 수 있다.
수정된 QMF 뱅크의 프로토타입 저역통과 필터는 선택된 주파수, 예를 들어, 0kHz에 중심을 둔 통과대역, 및 감쇠될 주파수 범위, 예를 들어, 500Hz 내지 48kHz를 나타내는 저지대역(stopband)을 가질 수 있다. 어떤 구현에서는, 저지대역의 시작 주파수는 필터 최적화 중에 결정될 수 있다. 필터 뱅크 내의 나머지 필터들은 프로토타입 저역통과 필터에 기초하여 도출되어, 각각의 부대역에 대응하는 대역통과 필터가 저역통과 필터와 유사한 특성, 예를 들어 주파수 응답을 갖게 된다. 예를 들어, 수정된 QMF 뱅크는 64개 부대역 필터를 사용하도록 구성될 수 있고, 여기서 각각의 필터는 저역통과 필터와 유사한 주파수 응답을 갖지만, 통과될 수 있는 주파수 범위에 대해 시프트된다. 또한, 수정된 QMF 뱅크는 저지대역에서의 주파수를 선정된 양, 예를 들어 약 70-90 데시벨(dB)만큼 감쇠하도록 적응될 수 있다. 수정된 QMF 뱅크의 예시적인 구현은 도 2를 참조하여 논의된다. 그러나, 다양한 구현들이 가능하다. 수정된 QMF 뱅크는 더 많은 수의 및 따라서 더 정밀한 필터 계수를 포함할 수 있다. 또한, 수정된 QMF 뱅크의 길이가 증가되기 때문에, 필터 설계 최적화는 예를 들어 도 2에 도시된 것과 같이 타겟 주파수 응답을 달성하면서 QMF 구조에 의해 요구된 필터 특성을 유지하도록 수행될 수 있다. 어떤 구현에서, QMF 분석 뱅크(108) 및 QMF 합성 뱅크(112)는 QMF 타입이 아닌 복소 필터 뱅크로 교체될 수 있는데, 그럼에도 불구하고 복소 필터 뱅크는 타겟 주파수 응답을 달성한다.
QMF 합성 뱅크(112)는 디코드된 오디오 신호를 시간 영역 표현, 예를 들어, 펄스 코드 변조(PCM) 포맷으로 오디오 출력(114)에 제공할 수 있다. 또한, 오디오 출력(114)은 디코드된 오디오 신호를, 예를 들어 응용 기기 또는 오디오 출력에 출력할 수 있다.
도 2는 예시적인 수정된 QMF 뱅크의 프로토타입 저역통과 필터에 대한 타겟 주파수 응답을 도시한다. 그래프(202)의 x-축은 저역통과 필터의 정규화된 주파수(204)를 표시하고 y-축은 dB로 측정된 감쇠 레벨(206)을 표시한다. 프로토타입 저역통과 필터의 통과대역은 주파수 0에 중심을 둔다. 또한, 플롯(208)은 저지대역 감쇠가 일반적으로 90dB 이상인 것을 보여 준다. 이 감쇠 레벨에서 생성된 왜곡은 거의 사람의 귀가 감지할 수 없을 것이다. 수정된 QMF 뱅크 각각에 포함된 나머지 부대역 필터들은 포함된 부대역, 예를 들어 32 또는 64 중 특정한 하나에 대응하도록 저역통과 필터에 대해, 주파수에 관련하여, 시프트될 수 있다. 또한, 수정된 QMF 뱅크 내의 나머지 부대역 필터들 각각은 프로토타입 저역통과 필터의 것과 유사한 주파수 응답을 갖도록 구성될 수 있다. 수정된 QMF 뱅크는 타겟 주파수 응답에 근사한 어떤 계수들을 사용하여 구성될 수 있다.
도 3은 대역폭 확장된 오디오 신호를 디코드하기 위한 예시적인 프로세스를 설명하는 흐름도를 도시한다. 대역폭 확장 오디오 신호는 코딩된 오디오 신호의 코어 부분, 예를 들어, 저주파수 부분과 관련된 코어 데이터, 및 코딩된 오디오 신호의 확장된 부분과 관련된 대역폭 확장 데이터, 예를 들어, SBR 데이터를 포함하는 비트스트림으로 나타낼 수 있다. 비트스트림은 디코더에서 수신되고 코어 데이터를 대역폭 확장 데이터로부터 분리하기 위해 파스될 수 있다(302).
코어 데이터는 디코드된 코어 신호를 생성하도록 디코드될 수 있다(304). 코어 데이터는 코어 디코더를 사용하여 디코드되고, 이는 코딩된 오디오 신호의 코어 부분의 시간 영역 표현을 생성할 수 있다. 예를 들어, 대역폭 확장된 오디오 신호는 HE-AAC 비트스트림일 수 있고 코어 데이터는 AAC 코어 디코더를 사용하여 디코드될 수 있다. 또한, 디코드된 코어 신호는 대응하는 부대역 신호를 생성하기 위해, 예를 들어, QMF 분석 뱅크를 사용하여 프로세스될 수 있다(306). 예를 들어, 디코드된 코어 신호의 시간 영역 표현의 카피는 QMF 분석 뱅크를 사용하여 주파수 영역 표현으로 변환될 수 있다. 주파수 영역 표현은 부대역 신호의 수, 예를 들어, 32로 더 분할될 수 있다. 디코드된 코어 신호의 시간 영역 표현의 또 하나의 카피는 저장 또는 지연 소자로 라우팅될 수 있다.
또한, 부대역 신호 및 대역폭 확장 데이터, 예를 들어, SBR 데이터는 코딩된 오디오 신호의 재구성된 부분을 생성하는데 사용될 수 있다(308). 재구성된 부분은 코어 신호의 것 위의 주파수 범위에 대응할 수 있다. 대역폭 확장 데이터는 코딩된 오디오 신호의 확장된 부분에 대응하는 부대역 신호를 재구성하는데 사용하기 위해 디코드된 코어 신호에 대응하는 부대역 신호 중 하나 이상을 선택하는데 사용될 수 있다. 코딩된 오디오 신호의 재구성된 확장된 부분은 또한 주파수 영역으로부터 시간 영역으로 변환될 수 있다(310). 예를 들어, QMF 합성 필터 뱅크는 재구성된 부대역 신호를 수신할 수 있고 그들을 재구성된 출력 신호의 시간 영역 표현으로 변환할 수 있다.
부가적으로, 예를 들어, 코딩된 오디오 신호의 고주파수 부분에 대응하는 재구성된 출력 신호의 시간 영역 표현은 고역통과 필터링된 출력 신호를 생성하기 위해 고역통과 필터링될 수 있다(312). 고역통과 필터는 재구성된 출력 신호만을 통과시키고 따라서 통과 대역 아래의 주파수를 갖는, 왜곡을 포함하는 어떤 신호를 감쇠시키도록 구성될 수 있다. 예를 들어 QMF 합성 필터 뱅크 및/또는 고주파수 프로세싱에 의해 생성된 디코드된 코어 신호의 주파수 범위에서의 왜곡은 따라서 재구성된 출력 신호로부터 제거될 수 있다.
또한, 디코드된 코어 신호는 저역통과 필터링된 출력 신호를 생성하기 위해 저역통과 필터링될 수 있다(314). 예를 들어, 디코드된 코어 신호는 저장 장치로부터 검색되거나 또는 대응하는 재구성된 출력 신호가 고역통과 필터링될 때 지연 소자에 의해 제공될 수 있다. 저역통과 필터링은 실질적으로 디코드된 코어 신호의 주파수 범위만이 통과되고 다른 주파수는 재구성된 출력 신호의 주파수 범위를 포함하여, 필터링되도록 수행될 수 있다. 고역통과 필터 및 저역통과 필터는 상보적이라서, 그들의 조합된 스펙트럼 응답은 플랫 주파수 응답과 동일하게 된다. 더구나, 저역통과 필터링된 출력 신호 및 고역통과 필터링된 출력 신호는 디코드된 오디오 신호를 생성하도록 조합될 수 있다(316).
디코더는 디코드된 신호의 부분, 예를 들어, 코어 신호가 QMF 필터 뱅크를 바이패스하도록 구현될 수 있다. 바이패스를 통해 라우팅된 신호의 부분은 따라서 QMF 필터 뱅크에서의 프로세싱과 관련된 왜곡에 의해 영향받지 않는 채로 남는다. 디코더는 소프트웨어, 하드웨어, 펌웨어, 또는 이들의 임의의 조합에서 구현될 수 있다. 어떤 구현에서, 디코더는 저전력 상태 또는 제한된 리소스를 검출하는 것과 같이, 하나 이상의 인자에 응답하여 수정된 필터 뱅크를 사용하는 것에 대한 대안으로서 바이패스를 통해 신호의 일부를 라우팅하도록 구성될 수 있다. 또한, 바이패스는 저전력 상태 또는 제한된 리소스를 검출하는 것과 같이, 하나 이상의 인자에 응답하여 선택적으로 인에이블/디스에이블될 수 있다. 도 4는 대역폭 확장된 오디오 신호를 디코드하도록 구성된 바이패스를 포함하는 수정된 오디오 디코더를 도시한다. 수정된 오디오 디코더(400)는 HE-AAC 스트림과 같이, 대역폭 확장 방식을 사용하여 인코드된 오디오 신호에 대응하는 오디오 비트스트림(102)을 수신할 수 있다. 오디오 비트스트림(102)은 오디오 비트스트림의 코어 부분과 관련된 코어 데이터를 포함할 수 있다. 예를 들어, 코어 데이터는 차단 주파수에 대하여 정의될 수 있는 원래의 오디오 신호의 저주파수 부분을 나타낼 수 있다. 저주파수 부분의 대역폭, 및 따라서 차단 주파수는 타겟 비트율에 기초하여 선택될 수 있다. 차단 주파수를 식별하는 데이터는 오디오 비트스트림(102)으로 인코드될 수 있다. 또한, 오디오 비트스트림(102)은 차단 주파수 위의 원래의 오디오 신호의 부분을 정의하는 대역폭 확장 데이터, 예를 들어 SBR 데이터를 포함할 수 있다. 코어 데이터 및 대역폭 확장 데이터는 멀티플렉싱을 통하는 것을 포함하는 임의의 방식으로 오디오 비트스트림에 배열될 수 있다.
오디오 비트스트림(102)은 비트스트림 데이터를 분리, 예를 들어 디멀티플렉스할 수 있는 비트스트림 파서(104)로 통과될 수 있다. 예를 들어, 비트스트림 파서(104)는 오디오 비트스트림(102)으로부터의 코어 데이터를 분할할 수 있고 디코딩하기 위해 코어 신호 디코더(106)에 제공될 수 있는 코어 데이터 스트림을 생성할 수 있다. 더구나, 비트스트림 파서(104)는 오디오 비트스트림(102)으로부터의 대역폭 확장 데이터를 분할할 수 있고 SBR 데이터 스트림을 생성할 수 있다. SBR 데이터 스트림은 디코딩 및 포스트-프로세싱 동작을 위해 스펙트럼 대역 복사(SBR) 프로세서(110)에 제공될 수 있다. 어떤 구현에서, 다른 대역폭 확장 방식이 선택될 수 있고 선택된 확장 방식에 대응하는 데이터 스트림은 SBR 데이터 스트림 대신에 생성될 수 있다. 또한, 이러한 구현에서, SBR 프로세서(110)는 선택된 확장 방식에 적응된 프로세서로 교체될 수 있다.
코어 신호 디코더(106)는 디코드된 코어 오디오 신호의 시간 영역 표현을 생성하기 위해 코어 데이터를 디코드한다. 디코드된 코어 오디오 신호는 원래의 오디오 신호의 저주파수 부분, 예를 들어, 주파수 0과 22kHz 사이에 대응할 수 있다. 예를 들어, 오디오 비트스트림(102)이 HE-AAC 비트스트림인 경우, 디코드된 코어 오디오 신호는 디코드된 AAC 신호에 대응할 수 있다.
디코드된 코어 오디오 신호는 지연 소자(410)에 제공된다. 지연 소자(410)에 의해 도입된 지연의 기간은 고정될 수 있고 QMF 분석 뱅크(402), 제거기(canceller)(404), 및 QMF 합성 뱅크(406)의 타이밍과 동일하거나 근사하도록 설정될 수 있다. 따라서, 디코드된 코어 오디오 신호는 디코드된 오디오 신호의 대응하는 고주파수 부분이 고역통과 필터(408)에 제공되는 것과 동시에 또는 거의 동시에 저역통과 필터(412)에 제공될 수 있다. 지연은 특정한 필터 구현을 위해, 예를 들어 QMF 분석 뱅크(402) 및 QMF 합성 뱅크(406)와 일치하는 것으로 예상되고, 필터 구현이 수정되는 경우 수정될 수 있다.
디코드된 코어 오디오 신호는 또한 HE-AAC 표준에 따라 구성될 수 있는 QMF 분석 뱅크(402)에 제공될 수 있다. QMF 분석 뱅크(402)에 의해 구현된 QMF 뱅크는 복소 QMF 뱅크(표준) 또는 실수 QMF 뱅크(저전력)일 수 있다. QMF 분석 뱅크(402)는 디코드된 코어 오디오 신호를 주파수 영역 표현으로 변환하고 디코드된 코어 오디오 신호를 분석하고 원래의 오디오 신호의 고주파수 부분을 재구성하는데 사용하기 위해, 예를 들어 32개 부대역에 대응하는 부대역 신호를 생성하도록 구성될 수 있다. 어떤 구현에서는, 디코드된 코어 오디오 신호는 부대역 신호를 생성하기 전에 업샘플될 수 있다. QMF 분석 뱅크(402)에 의해 생성된 부대역 신호는 SBR 프로세서(110) 및 제거기(404)에 제공될 수 있다.
제거기(404)는 QMF 분석 뱅크(402)로부터 수신된 부대역 신호를 제로-아웃(제거)하도록 구성된다. 부대역 신호를 제로-아웃함으로써, 제거기(404)는 또한 주파수 영역으로의 변환 및 부대역 신호로 분할 중에 디코드된 코어 오디오 신호 내로 도입된 고주파수 프로세싱 아티팩트와 같은 어떤 왜곡을 억제한다.
SBR 프로세서(110)는 SBR 데이터 스트림 및 QMF 분석 뱅크(402)로부터 수신된 저주파수 부대역 신호를 사용하여 원래의 오디오 신호의 고주파수 부분을 재구성한다. SBR 프로세서(110)는 SBR 데이터에 기초하여, 고주파수 부대역 신호를 생성하는데 사용하기 위해 저주파수 부대역 신호의 하나 이상을 선택하도록 구성될 수 있다. 또한, SBR 프로세서(110)는 오디오 신호의 재구성된 고주파수 부분을 생성하기 위해 생성된 고주파수 부대역 신호의 엔벨로프를 조정하도록 구성될 수 있다.
QMF 합성 뱅크(406)는 또한 예를 들어 QMF 분석 뱅크(402)와 동일한 필터 뱅크를 사용하여, HE-AAC 표준에 따라 구성될 수 있다. 제거기(404)에 의해 수행된 제거의 결과로서, SBR 프로세서(110)에 의해 생성된 오디오 신호의 재구성된 고주파수 부분만이 QMF 합성 뱅크(406)에 제공된다. QMF 합성 뱅크(406)는 수신된 고주파수 부분을 고역통과 필터(408)에 제공되는 시간 영역 신호로 변환한다.
고역통과 필터(408) 및 저역통과 필터(412)는 상보적이라서, 그들의 조합된 스펙트럼 응답은 플랫 주파수 응답과 동일하다. 고역통과 필터(408)는 오디오 신호의 재구성된 고주파수 부분만을 통과시키도록 구성될 수 있다. 결과적으로, 차단 주파수 아래의 주파수와 관련된 SBR 프로세서(110)에서의 프로세싱에 의해 생성된 왜곡이 제거될 수 있다. 그러므로, 고역통과 필터(408)는 가산기(414)에 오디오 신호의 재구성된 고주파수 부분만을 제공한다. 어떤 구현에서는, 제거기(404)가 제거될 수 있고 고역통과 필터(408)는 차단 주파수 아래의 신호의 모두 또는 거의 모두를 감쇠하도록 구성될 수 있다.
또한, 저역통과 필터(412)는 저주파수 디코드된 코어 오디오 신호를 통과시키고 차단 주파수 위의 주파수를 갖는 신호를 감쇠하도록 구성될 수 있다. 따라서, 저역통과 필터(412)는 가산기(414)에 저주파수 디코드된 코어 오디오 신호만을 제공한다. 어떤 구현에서는, 고역통과 필터(408)는 생략될 수 있고 저역통과 필터(412)는 QMF 합성 뱅크(406)의 필터 뱅크 응답과 일치하도록 구성될 수 있다.
가산기(414)는 디코드된 오디오 신호를 생성하기 위해 고역통과 필터(408) 및 저역통과 필터(412)의 출력의 시간 영역 합산(summation)을 수행한다. 디코드된 오디오 신호는 다음에 오디오 출력(114)에 제공될 수 있다.
도 5는 코어 디코더 및 QMF 합성 필터 뱅크의 출력에 대한 백색 잡음 신호와 관련된 예시적인 왜곡 레벨을 도시한다. 일정한 신호, 예를 들어 백색 잡음 내로 도입된 QMF 왜곡의 레벨은 디코드된 저주파수 부분(502, Ycore)으로 코어 디코더에 대해 도시된다. 또한, QMF 왜곡의 레벨은 디코드된 고주파수 부분(504, YSBR)으로 QMF 합성 필터 뱅크에 대해 도시된다. 이상적인 경우에, 디코드된 저주파수 부분(502) 및 디코드된 고주파수 부분(504)은 차단 주파수(506)에서 분리되어, 대응하는 오디오 비트스트림으로 표시될 수 있다. QMF 왜곡 레벨은 신호의 전체 주파수 범위에 대해 최고 주파수(508)까지 일정하다. 전형적으로, 왜곡 레벨은 주파수와 오디오 신호 레벨에 따라 변화할 수 있다.
도 6은 백색 잡음 신호의 디코드된 저주파수 부분을 저역통과 필터링하는 것과 백색 잡음 신호의 디코드된 고주파수 부분을 고역통과 필터링하는 예를 도시한다. 백색 잡음 신호를 디코드하는 수정된 오디오 디코더는 도 4와 관련하여 논의된 저역통과 및 고역통과 필터링 전략을 구현할 수 있다. 저역통과 필터는 최저 주파수, 예를 들어, 0Hz에서 상한 주파수(604)까지 확장하는 저역통과 대역(602)을 갖도록 구성될 수 있다. 따라서, 저역통과 대역(602)은 일반적으로 신호의 디코드된 저주파수 부분(502)에 대응한다. 저역통과 필터는 상한 주파수(604)보다 높은 주파수를 갖는 어떤 신호들을 감쇠시킬 수 있다. 더구나, 고역통과 필터는 신호의 최저 주파수(608)에서 신호의 최고 주파수(610)까지 확장하는 고역통과 대역(606)을 갖도록 구성될 수 있다. 그러므로, 고역통과 대역(606)은 일반적으로 신호의 디코드된 고주파수 부분(504)에 대응한다. 고역통과 필터는 최저 주파수(608)보다 낮은 주파수를 갖는 어떤 신호들을 감쇠시킬 수 있다.
또한, 저역통과 필터 및 고역통과 필터는 크로스오버 주파수 범위(612)에 대해 일치될 수 있다. 크로스오버 주파수 범위(612) 내에서 저역통과 필터 및 고역통과 필터의 전체 기여는 1과 동일하여야 한다. 더구나, 크로스오버 주파수 범위(612)는 크로스오버 점에 중심을 두어서, 저역통과 필터와 고역통과 필터 둘 다가 크로스오버 점에서 각각 0.5의 기여를 한다. 크로스오버 점은 그것이 차단 주파수 아래의 주파수에 대응하도록 선택될 수 있다.
도 7은 백색 잡음 신호의 저역통과 및 고역통과 필터링 이후의 예시적인 왜곡 레벨을 도시한다. 저역통과 및 고역통과 필터링을 수행한 후에 남는 QMF 왜곡 레벨(702)은 고역통과 대역(606)과 동일한 공간에 있다(coextensive). 그러므로, QMF 프로세싱에 의해 도입된 왜곡은 고역통과 대역(606) 내의 주파수에 대해서만의 에너지를 갖는다. 또한, 크로스오버 주파수 범위(612)를 제외하고, 저역통과 대역(602)에 대응하는 신호의 부분은 QMF 왜곡이 없다.
본 개시에서 설명된 기술 및 기능적 동작은 본 개시에서 설명된 구조적 수단 및 그들의 구조적 등가물, 또는 이들의 조합을 포함하여, 디지털 전자 회로, 또는 컴퓨터 소프트웨어, 펌웨어, 또는 하드웨어로 구현될 수 있다. 기술은, 하나 이상의 프로그래머블 프로세서 또는 컴퓨터의 동작에 의해 실행하거나 또는 그 동작을제어하기 위해, 하나 이상의 컴퓨터 프로그램 제품, 예를 들어, 컴퓨터 판독가능 매체 상에 유형적으로 저장된 머신 판독가능한 명령어를 사용하여 구현될 수 있다. 또한, 프로그래머블 프로세서 및 컴퓨터는 이동 장치 안에 포함되거나 이동 장치로서 팩키지될 수 있다.
본 개시에 설명된 프로세스 및 논리 흐름은 데이터를 수신, 조작, 및/또는 출력하기 위해 하나 이상의 명령어를 실행하는 하나 이상의 프로그래머블 프로세서에 의해 수행될 수 있다. 프로세스 및 논리 흐름은 또한 하나 이상의 FPGA(필드 프로그래머블 게이트 어레이), PLD(프로그래머블 논리 장치), 및/또는 ASIC(주문형 집적 회로)를 포함하는 프로그래머블 논리 회로에 의해 수행될 수 있다. 임의 종류의 디지털 컴퓨터의 프로세서를 포함하는 일반 및/또는 특수 목적 프로세서가 판독 전용 메모리와 같은 비휘발성 메모리, 랜덤 액세스 메모리와 같은 휘발성 메모리, 또는 이 둘 다를 포함하는 컴퓨터 판독가능 매체에 저장된 컴퓨터 프로그램 및 다른 프로그램된 명령어를 실행하기 위해 사용될 수 있다. 부가적으로, 데이터 및 컴퓨터 프로그램은 하드 드라이브, 플래시 드라이브 및 광학 저장 장치를 포함하여, 하나 이상의 대용량 저장 장치로부터 수신되거나 그에 전송될 수 있다. 또한, 일반 및 특수 목적 컴퓨팅 장치 및 저장 장치는 통신 네트워크를 통해 상호접속될 수 있다. 통신 네트워크는 유선 및 무선 인프라스트럭쳐를 포함할 수 있다. 통신 네트워크는 또한 공중, 사설, 또는 이들의 조합일 수 있다.
여러가지 구현이 여기에 개시되었다. 그럼에도 불구하고, 다양한 수정이 청구범위의 정신 및 범위를 벗어나지 않고서 이루어질 수 있다는 것을 이해할 것이다. 따라서, 다른 구현들은 다음의 청구 범위 내에 드는 것이다.

Claims (28)

  1. 오디오 신호를 디코드하는 방법으로서,
    오디오 디코더에서, 오디오 신호의 코어 부분과 관련된 코어 오디오 데이터 및 상기 오디오 신호의 확장된 부분과 관련된 확장 데이터를 수신하는 단계;
    디코드된 코어 오디오 신호를 시간 영역 표현으로 생성하기 위해 상기 코어 오디오 데이터를 디코드하는 단계;
    상기 확장 데이터 및 상기 디코드된 코어 오디오 신호에 따라 상기 오디오 신호의 재구성된 확장 부분을 생성하는 단계;
    고역통과 필터(highpass filter)를 사용하여, 재구성된 출력 신호를 생성하기 위해 상기 오디오 신호의 상기 재구성된 확장 부분을 필터링하는 단계; 및
    디코드된 출력 신호를 생성하기 위해 상기 디코드된 코어 오디오 신호와 상기 재구성된 출력 신호를 조합하는 단계
    를 포함하는 방법.
  2. 제1항에 있어서, 상기 오디오 신호의 재구성된 확장 부분을 생성하는 단계는 필터 뱅크를 사용하여, 상기 오디오 신호의 상기 재구성된 확장 부분을 시간 영역 표현으로 변환하는 단계를 더 포함하는 방법.
  3. 제2항에 있어서, 상기 필터 뱅크는 복소 직교 미러 필터 뱅크(complex Quadrature Mirror Filter bank)를 포함하는 방법.
  4. 제1항에 있어서, 상기 확장 데이터는 스펙트럼 대역 복사 데이터(spectral band replication data)를 포함하는 방법.
  5. 제1항에 있어서, 저역통과 필터(lowpass filter)를 사용하여, 상기 조합하는 단계 전에 상기 디코드된 코어 오디오 신호를 필터링하는 단계를 더 포함하는 방법.
  6. 제5항에 있어서, 플랫 주파수 응답과 동일한 조합된 스펙트럼 응답을 갖도록 상기 고역통과 필터 및 상기 저역통과 필터를 구성하는 단계를 더 포함하는 방법.
  7. 데이터 프로세싱 장치로 하여금 동작들을 수행하도록 동작가능한 컴퓨터 판독가능 매체 상에 인코드된 컴퓨터 프로그램 제품으로서, 상기 동작들은,
    오디오 디코더에서, 오디오 신호의 코어 부분과 관련된 코어 오디오 데이터 및 상기 오디오 신호의 확장된 부분과 관련된 확장 데이터를 수신하고;
    디코드된 코어 오디오 신호를 시간 영역 표현으로 생성하기 위해 상기 코어 오디오 데이터를 디코드하고;
    상기 확장 데이터 및 상기 디코드된 코어 오디오 신호에 따라 상기 오디오 신호의 재구성된 확장 부분을 생성하고;
    고역통과 필터를 사용하여, 재구성된 출력 신호를 생성하기 위해 상기 오디오 신호의 상기 재구성된 확장 부분을 필터링하고;
    디코드된 출력 신호를 생성하기 위해 상기 디코드된 코어 오디오 신호와 상기 재구성된 출력 신호를 조합하는 것을 포함하는 컴퓨터 프로그램 제품.
  8. 제7항에 있어서, 데이터 프로세싱 장치로 하여금, 필터 뱅크를 사용하여, 상기 오디오 신호의 상기 재구성된 확장 부분을 시간 영역 표현으로 변환하는 것을 포함하는 동작들을 수행하게 하도록 더 동작가능한 컴퓨터 프로그램 제품.
  9. 제7항에 있어서, 데이터 프로세싱 장치로 하여금, 저역통과 필터를 사용하여, 상기 조합하는 것 전에 상기 디코드된 코어 오디오 신호를 필터링하는 것을 포함하는 동작들을 수행하게 하도록 더 동작가능한 컴퓨터 프로그램 제품.
  10. 제9항에 있어서, 데이터 프로세싱 장치로 하여금, 플랫 주파수 응답과 동일한 조합된 스펙트럼 응답을 갖도록 상기 고역통과 필터 및 상기 저역통과 필터를 구성하는 것을 포함하는 동작들을 수행하게 하도록 더 동작가능한 컴퓨터 프로그램 제품.
  11. 제7항에 있어서, 데이터 프로세싱 장치로 하여금,
    상기 디코드된 코어 오디오 신호의 적어도 일부에 기초하여 부대역 신호들을 생성하고;
    상기 재구성된 확장 부분을 생성하는데 사용하기 위한 부대역 신호들을 상기 확장 데이터에 따라 선택하는 것을 포함하는 동작들을 더 수행하게 하도록 더 동작가능한 컴퓨터 프로그램 제품.
  12. 오디오 신호를 디코드하는 방법으로서,
    시간 영역 표현을 갖는 디코드된 저주파수 신호를 생성하기 위해 차단(cutoff) 주파수 아래의 오디오 신호 부분에 대응하는 저주파수 오디오 데이터를 디코드하는 단계;
    확장 데이터 및 상기 디코드된 저주파수 신호의 적어도 일부로부터 고주파수 오디오 데이터를 생성하는 단계;
    필터 뱅크를 사용하여, 디코드된 고주파수 신호를 생성하기 위해 상기 고주파수 오디오 데이터를 시간 영역 표현으로 변환하는 단계;
    왜곡을 감소시키기 위해 상기 디코드된 저주파수 신호 및 상기 디코드된 고주파수 신호 중 적어도 하나를 필터링하는 단계; 및
    디코드된 출력 신호를 생성하기 위해 상기 디코드된 저주파수 신호와 상기 디코드된 고주파수 신호를 조합하는 단계
    를 포함하는 방법.
  13. 제12항에 있어서, 고주파수 오디오 데이터를 생성하는 단계는,
    상기 디코드된 저주파수 신호의 적어도 일부에 기초하여 부대역 신호들을 생성하는 단계; 및
    상기 고주파수 오디오 데이터를 생성하는데 사용하기 위한 부대역 신호들을 상기 확장 데이터에 따라 선택하는 단계를 더 포함하는 방법.
  14. 제13항에 있어서, 상기 고주파수 오디오 데이터를 변환하는 단계 전에 상기 생성된 부대역 신호들을 제거하는(canceling) 단계를 더 포함하는 방법.
  15. 제12항에 있어서, 필터링하는 단계는 저역통과 필터를 사용하여 상기 필터 뱅크의 응답과 일치하는 상기 디코드된 저주파수 신호를 필터링하는 단계를 더 포함하는 방법.
  16. 제15항에 있어서, 상기 필터 뱅크는 직교 미러 필터 뱅크(Quadrature Mirror Filter bank)를 포함하는 방법.
  17. 제12항에 있어서, 필터링하는 단계는 저역통과 필터를 사용하여 상기 디코드된 저주파수 신호를 그리고 고역통과 필터를 사용하여 상기 디코드된 고주파수 신호를 필터링하는 단계를 더 포함하고, 상기 저역통과 필터와 상기 고역통과 필터는 상기 오디오 신호의 주파수 범위의 일부에서 중첩하는 방법.
  18. 데이터 프로세싱 장치로 하여금 동작들을 수행하도록 동작가능한 컴퓨터 판독가능 매체 상에 인코드된 컴퓨터 프로그램 제품으로서, 상기 동작들은,
    시간 영역 표현을 갖는 디코드된 저주파수 신호를 생성하기 위해 차단 주파수 아래의 오디오 신호 부분에 대응하는 저주파수 오디오 데이터를 디코드하고;
    확장 데이터 및 상기 디코드된 저주파수 신호의 적어도 일부로부터 고주파수 오디오 데이터를 생성하고;
    필터 뱅크를 사용하여, 디코드된 고주파수 신호를 생성하기 위해 상기 고주파수 오디오 데이터를 시간 영역 표현으로 변환하고;
    왜곡을 감소시키기 위해 상기 디코드된 저주파수 신호 및 상기 디코드된 고주파수 신호 중 적어도 하나를 필터링하고;
    디코드된 출력 신호를 생성하기 위해 상기 디코드된 저주파수 신호와 상기 디코드된 고주파수 신호를 조합하는 것을 포함하는 컴퓨터 프로그램 제품.
  19. 제18항에 있어서, 데이터 프로세싱 장치로 하여금,
    상기 디코드된 저주파수 신호의 적어도 일부에 기초하여 부대역 신호들을 생성하고;
    상기 고주파수 오디오 데이터를 생성하는데 사용하기 위한 부대역 신호들을 상기 확장 데이터에 따라 선택하는 것을 포함하는 동작들을 수행하게 하도록 더 동작가능한 컴퓨터 프로그램 제품.
  20. 제19항에 있어서, 데이터 프로세싱 장치로 하여금,
    상기 고주파수 오디오 데이터를 변환하기 전에 상기 생성된 부대역 신호들을 제거하는 것을 포함하는 동작들을 수행하게 하도록 더 동작가능한 컴퓨터 프로그램 제품.
  21. 제18항에 있어서, 데이터 프로세싱 장치로 하여금,
    저역통과 필터를 사용하여 상기 디코드된 저주파수 신호를 그리고 고역통과 필터를 사용하여 상기 디코드된 고주파수 신호를 필터링하는 것을 포함하는 동작을 수행하게 하도록 더 동작가능하고, 상기 저역통과 필터와 상기 고역통과 필터는 상기 오디오 신호의 주파수 범위의 일부에서 중첩하는 컴퓨터 프로그램 제품.
  22. 시스템으로서,
    오디오 비트스트림을 수신하도록 구성된 입력; 및
    동작들을 수행하도록 구성된 프로세서 전자장치를 포함하는 오디오 디코더
    를 포함하고, 상기 동작들은
    디코드된 저주파수 신호를 생성하기 위해 오디오 비트스트림과 관련된 저주파수 오디오 데이터를 디코드하고 - 상기 저주파수 오디오 데이터는 차단 주파수 아래의 오디오 신호 부분에 대응함 -;
    상기 오디오 비트스트림과 관련된 확장 데이터 및 상기 디코드된 저주파수 신호의 적어도 일부로부터 고주파수 오디오 데이터를 생성하고;
    필터 뱅크를 사용하여, 디코드된 고주파수 신호를 생성하기 위해 상기 고주파수 오디오 데이터를 시간 영역 표현으로 변환하고;
    왜곡을 감소시키기 위해 상기 디코드된 저주파수 신호 및 상기 디코드된 고주파수 신호 중 적어도 하나를 필터링하고;
    디코드된 출력 신호를 생성하기 위해 상기 디코드된 저주파수 신호와 상기 디코드된 고주파수 신호를 조합하는 것을 포함하는 시스템.
  23. 제22항에 있어서, 상기 오디오 디코더는 플랫 주파수 응답과 동일한 조합된 스펙트럼 응답을 갖도록 구성된 고역통과 필터 및 저역통과 필터를 더 포함하는 시스템.
  24. 제23항에 있어서, 상기 고역통과 필터 및 상기 저역통과 필터는 주파수 범위의 일부에서 중첩하는 시스템.
  25. 제22항에 있어서, 상기 오디오 디코더는 상기 디코드된 저주파수 신호를 지연시키도록 구성된 지연 소자를 더 포함하는 시스템.
  26. 제25항에 있어서, 상기 지연 소자와 관련된 지연 기간은 필터 뱅크의 프로세싱 지연에 대응하는 시스템.
  27. 제22항에 있어서, 상기 오디오 디코더는
    상기 디코드된 저주파수 신호의 적어도 일부에 기초하여 부대역 신호들을 생성하도록 구성된 분석 필터 뱅크; 및
    상기 생성된 부대역 신호들을 제로-아웃(zero-out)하도록 구성된 제거기를 더 포함하는 시스템.
  28. 제22항에 있어서, 상기 필터 뱅크는 직교 미러 필터 뱅크를 포함하는 시스템.
KR1020127008261A 2009-08-31 2010-08-31 향상된 오디오 디코더 KR101387871B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/551,450 US8515768B2 (en) 2009-08-31 2009-08-31 Enhanced audio decoder
US12/551,450 2009-08-31
PCT/US2010/047269 WO2011026083A1 (en) 2009-08-31 2010-08-31 Enhanced audio decoder

Publications (2)

Publication Number Publication Date
KR20120052407A true KR20120052407A (ko) 2012-05-23
KR101387871B1 KR101387871B1 (ko) 2014-04-29

Family

ID=42953749

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127008261A KR101387871B1 (ko) 2009-08-31 2010-08-31 향상된 오디오 디코더

Country Status (6)

Country Link
US (1) US8515768B2 (ko)
EP (1) EP2473994A1 (ko)
KR (1) KR101387871B1 (ko)
CN (1) CN102598121B (ko)
GB (1) GB2473139B (ko)
WO (1) WO2011026083A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5552988B2 (ja) * 2010-09-27 2014-07-16 富士通株式会社 音声帯域拡張装置および音声帯域拡張方法
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6155274B2 (ja) * 2011-11-11 2017-06-28 ドルビー・インターナショナル・アーベー 過剰サンプリングされたsbrを使ったアップサンプリング
TWI521965B (zh) 2012-05-14 2016-02-11 Sony Corp Camera and camera methods, electronic machines and programs
EP2981959B1 (en) * 2013-04-05 2018-07-25 Dolby International AB Audio encoder and decoder for interleaved waveform coding
US10510355B2 (en) * 2013-09-12 2019-12-17 Dolby International Ab Time-alignment of QMF based processing data
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
WO2015063227A1 (en) 2013-10-31 2015-05-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain
JP6593173B2 (ja) 2013-12-27 2019-10-23 ソニー株式会社 復号化装置および方法、並びにプログラム
TWI771266B (zh) 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US9613628B2 (en) * 2015-07-01 2017-04-04 Gopro, Inc. Audio decoder for wind and microphone noise reduction in a microphone array system
EP3182411A1 (en) * 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
TWI752166B (zh) * 2017-03-23 2022-01-11 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
EP3382703A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
MX2020011212A (es) 2018-04-25 2020-11-09 Dolby Int Ab Integracion de tecnicas de reconstruccion de alta frecuencia con retraso post-procesamiento reducido.
IL310202A (en) 2018-04-25 2024-03-01 Dolby Int Ab Combining high-frequency audio reconstruction techniques

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW405328B (en) 1997-04-11 2000-09-11 Matsushita Electric Ind Co Ltd Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
EP1351401B1 (en) * 2001-07-13 2009-01-14 Panasonic Corporation Audio signal decoding device and audio signal encoding device
WO2003038813A1 (en) 2001-11-02 2003-05-08 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
ES2261974T3 (es) * 2002-08-01 2006-11-16 Matsushita Electric Industrial Co., Ltd. Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral.
US20070168197A1 (en) 2006-01-18 2007-07-19 Nokia Corporation Audio coding
WO2008035949A1 (en) 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
JP4396683B2 (ja) 2006-10-02 2010-01-13 カシオ計算機株式会社 音声符号化装置、音声符号化方法、及び、プログラム
WO2008062990A1 (en) 2006-11-21 2008-05-29 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
US8606566B2 (en) 2007-10-24 2013-12-10 Qnx Software Systems Limited Speech enhancement through partial speech reconstruction
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP2146344B1 (en) * 2008-07-17 2016-07-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding/decoding scheme having a switchable bypass
JP5309944B2 (ja) 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US8392200B2 (en) 2009-04-14 2013-03-05 Qualcomm Incorporated Low complexity spectral band replication (SBR) filterbanks

Also Published As

Publication number Publication date
KR101387871B1 (ko) 2014-04-29
US20110054911A1 (en) 2011-03-03
GB2473139B (en) 2012-04-11
US8515768B2 (en) 2013-08-20
EP2473994A1 (en) 2012-07-11
CN102598121B (zh) 2014-05-07
GB2473139A (en) 2011-03-02
GB201014415D0 (en) 2010-10-13
WO2011026083A1 (en) 2011-03-03
CN102598121A (zh) 2012-07-18

Similar Documents

Publication Publication Date Title
KR101387871B1 (ko) 향상된 오디오 디코더
JP5356413B2 (ja) ランダムアクセスポイント(rap)及び多重予測パラメータセット(mpps)機能を備えた適応セグメンテーションを使用する無損失マルチチャンネルオーディオコーデック
CN1809872B (zh) 编码音频信号的设备和方法及解码已编码音频信号的设备和方法
KR100331166B1 (ko) 오디오신호를 코딩하기 위한 방법 및 장치와 비트스트림을디코딩하기 위한 방법 및 장치
CN1327409C (zh) 提供信号重建的宽带音频信号发送机、接收机、系统和方法
EP1334484B1 (en) Enhancing the performance of coding systems that use high frequency reconstruction methods
RU2419171C2 (ru) Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания
JP2018041100A (ja) 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
KR20080005325A (ko) 적응적 부호화/복호화 방법 및 장치
JP4997098B2 (ja) スケーラブル可逆オーディオ・コーデック及びオーサリング・ツール
KR20140022813A (ko) 허프만 부호화를 실행하기 위한 장치 및 방법
KR20130133816A (ko) 예측 인코딩 및 변환 인코딩 사이에서 교번하는 낮은―지연 사운드―인코딩
JP5355387B2 (ja) 符号化装置および符号化方法
KR102622804B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
WO2008066071A1 (en) Decoding apparatus and audio decoding method
JP2007503026A (ja) サブバンドフィルタ処理を用いた透かし埋め込みの装置と方法
Servetti et al. Frequency-selective partial encryption of compressed audio
TW201040941A (en) Embedding and extracting ancillary data
KR100952065B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
TWI559294B (zh) 支援轉換長度切換的頻率域音源編碼器、解碼器、編碼方法、解碼方法及電腦程式
CN105261373A (zh) 用于带宽扩展编码的自适应栅格构造方法和装置
TW201443884A (zh) 用以處理編碼信號之裝置及方法和用以產生編碼信號之編碼器及方法
WO2022012677A1 (zh) 音频编解码方法和相关装置及计算机可读存储介质
ES2439693T3 (es) Codificación de señales de múltiples canales
JP2006254048A (ja) 音響処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170317

Year of fee payment: 4