KR101806058B1 - 스케일링된 고대역 여기를 사용하는 오디오 신호의 대역폭 확장을 위한 방법, 장치, 디바이스, 컴퓨터 판독가능 매체 - Google Patents

스케일링된 고대역 여기를 사용하는 오디오 신호의 대역폭 확장을 위한 방법, 장치, 디바이스, 컴퓨터 판독가능 매체 Download PDF

Info

Publication number
KR101806058B1
KR101806058B1 KR1020167012306A KR20167012306A KR101806058B1 KR 101806058 B1 KR101806058 B1 KR 101806058B1 KR 1020167012306 A KR1020167012306 A KR 1020167012306A KR 20167012306 A KR20167012306 A KR 20167012306A KR 101806058 B1 KR101806058 B1 KR 101806058B1
Authority
KR
South Korea
Prior art keywords
highband
signal
frame
modeled
sub
Prior art date
Application number
KR1020167012306A
Other languages
English (en)
Other versions
KR20160067972A (ko
Inventor
벤카트라만 에스 아티
벤카테쉬 크리쉬난
스테빤 피에르 빌레뜨
비베크 라젠드란
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20160067972A publication Critical patent/KR20160067972A/ko
Application granted granted Critical
Publication of KR101806058B1 publication Critical patent/KR101806058B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

방법은 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 것을 포함하며, 여기서 상기 오디오 신호는 고대역 부분 및 저대역 부분을 포함한다. 그 방법은 또한, 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하는 것을 포함한다. 그 방법은 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정하는 것 및 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 것을 포함한다. 그 방법은 제 2 모델링된 고대역 신호 및 오디오 신호의 고대역 부분에 기초하여 이득 파라미터들을 결정하는 것을 포함한다.

Description

스케일링된 고대역 여기를 사용하는 오디오 신호의 대역폭 확장을 위한 방법, 장치, 디바이스, 컴퓨터 판독가능 매체{METHOD, APPARATUS, DEVICE, COMPUTER-READABLE MEDIUM FOR BANDWIDTH EXTENSION OF AN AUDIO SIGNAL USING A SCALED HIGH-BAND EXCITATION}
관련 출원들에 대한 상호참조
본 출원은 2013 년 10 월 14 일에 출원된 "SYSTEMS AND METHODS OF ENERGY-SCALED SIGNAL PROCESSING" 라는 명칭의 미국 특허 가출원 제 61/890,812 호 및 2014 년 10 월 13 일에 출원된 "SYSTEMS AND METHODS OF ENERGY-SCALED SIGNAL PROCESSING" 라는 명칭의 미국 정규 특허 출원 제 14/512,892 호를 우선권 주장하며, 상기 출원들의 컨텐츠는 그 전체가 참조로서 통합된다.
기술 분야
본 개시물은 일반적으로 신호 프로세싱에 관한 것이다.
기술에서의 진보들은 더 작고 더 강력한 컴퓨팅 디바이스들을 발생시켰다. 예를 들어, 소형이고 경량이며 사용자들에 의해 용이하게 휴대되는 휴대용 무선 전화기들, 개인용 디지털 보조장치들 (PDA들), 및 페이징 디바이스들과 같은 무선 컴퓨팅 디바이스들을 포함하여 다양한 휴대용 개인용 컴퓨팅 디바이스들이 현재 존재한다. 더 구체적으로, 셀룰러 전화기들 및 인터넷 프로토콜 (IP) 전화기들과 같은 휴대용 무선 전화기들은 무선 네트워크들 상으로 음성 및 데이터 패킷들을 통신할 수 있다. 추가로, 다수의 그러한 무선 전화기들은 그 내부에 통합된 다른 타입들의 디바이스들을 포함한다. 예를 들어, 무선 전화기는 또한, 디지털 스틸 카메라, 디지털 비디오 카메라, 디지털 레코더, 및 오디오 파일 플레이어를 포함할 수 있다.
종래의 전화 시스템들 (예컨대, 공중 전화 교환망 (PSTN) 들) 에서, 신호 대역폭은 300 헤르츠 (Hz) 내지 3.4 킬로헤르츠 (kHz) 의 주파수 범위로 제한된다. 셀룰러 전화 및 VoIP (voice over internet protocol) 와 같은 광대역 (WB) 애플리케이션들에서, 신호 대역폭은 50 Hz 부터 7 kHz 까지의 주파수 범위에 걸칠 수도 있다. 수퍼 광대역 (SWB) 코딩 기술들은 약 16 kHz 까지 확장하는 대역폭을 지원한다. 3.4 kHz 에서의 협대역 전화로부터 16 kHz 의 SWB 전화까지의 확장하는 신호 대역폭은 스피치의 명료도 및 자연스러움을 개선시킬 수도 있다.
SWB 코딩 기술들은 통상적으로, 신호의 더 낮은 주파수 부분 (예컨대 50 Hz 내지 7 kHz, 또한 "저대역" 으로 불림) 을 인코딩하고 송신하는 것을 수반한다. 예를 들어, 저대역은 필터 파라미터들 및/또는 저대역 여기 신호를 사용하여 표현될 수도 있다. 그러나, 코딩 효율을 개선하기 위해, 신호의 더 높은 주파수 부분 (예컨대 7 kHz 내지 16 kHz, 또한 "고대역" 으로 불림) 은 고대역을 예측하기 위한 신호 모델링 기술들을 사용하여 인코딩될 수도 있다. 일부 구현들에서, 고대역과 연관된 데이터가 그 예측을 보조하기 위해 수신기에 제공될 수도 있다. 그러한 데이터는 "사이드 정보" 로 지칭될 수도 있고, 이득 정보, 라인 스펙트럼 주파수들 (LSF들, 또한 라인 스펙트럼 쌍들 (LSP들) 로 지칭됨), 등등을 포함할 수도 있다. 이득 정보는 고대역 신호와 모델링된 고대역 신호 양자의 서브-프레임 에너지들에 기초하여 결정된 이득 형상 정보를 포함할 수도 있다. 이득 형상 정보는 모델링된 고대역 신호에 대한 원래의 고대역 신호의 차이들에 기초하여 더 넓은 동적 범위 (예컨대, 큰 스윙들) 를 가질 수도 있다. 더 넓은 동적 범위는 이득 형상 정보를 인코딩/송신하는데 사용된 인코더의 효율을 감소시킬 수도 있다.
오디오 신호 인코딩을 수행하는 시스템들 및 방법들이 개시된다. 특정 실시형태에서, 오디오 신호는 (오디오 신호의 저대역 부분을 나타내는) 저대역 비트 스트림 및 (오디오 신호의 고대역 부분을 나타내는) 고대역 사이드 정보를 포함하는 데이터 스트림 또는 비트 스트림으로 인코딩된다. 고대역 사이드 정보는 오디오 신호의 저대역 부분을 사용하여 생성될 수도 있다. 예를 들어, 저대역 여기 신호는 고대역 여기 신호를 생성하도록 확장될 수도 있다. 고대역 여기 신호는 제 1 모델링된 고대역 신호를 생성 (예컨대, 합성) 하는데 사용될 수도 있다. 고대역 신호와 모델링된 고대역 신호 간의 에너지 차이들은 스케일링 인자들 (예컨대, 하나 이상의 스케일링 인자들의 제 1 세트) 은 결정하는데 사용될 수도 있다. 스케일링 인자들 (또는 스케일링 인자들의 제 1 세트에 기초하여 결정된 스케일링 인자들의 제 2 세트) 은 제 2 모델링된 고대역 신호를 생성 (예컨대, 합성) 하기 위해 고대역 여기 신호에 적용될 수도 있다. 제 2 모델링된 고대역 신호는 고대역 사이드 정보를 결정하는데 사용될 수도 있다. 제 2 모델링된 고대역 신호가 고대역 신호에 대한 에너지 차이들을 설명하도록 스케일링되기 때문에, 제 2 모델링된 고대역 신호에 기초하는 고대역 사이드 정보는 에너지 차이들을 설명하기 위한 스케일링 없이 결정된 고대역 사이드 신호에 대하여 감소된 동적 범위를 가질 수도 있다.
특정 실시형태에서, 방법은 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 것을 포함한다. 오디오 신호는 고대역 부분과 저대역 부분을 포함한다. 그 방법은 또한, 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하는 것을 포함한다. 그 방법은 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정하는 것 및 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 것을 포함한다. 그 방법은 또한, 제 2 모델링된 고대역 신호 및 오디오 신호의 고대역 부분에 기초하여 이득 정보를 결정하는 것을 포함한다.
다른 특정 실시형태에서, 장치는 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하도록 구성된 제 1 합성 필터를 포함하며, 여기서 오디오 신호는 고대역 부분 및 저대역 부분을 포함한다. 그 장치는 또한, 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하고, 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정하도록 구성된 스케일링 모듈을 포함한다. 그 장치는 또한, 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하도록 구성된 제 2 합성 필터를 포함한다. 그 장치는 또한, 제 2 모델링된 고대역 신호 및 오디오 신호의 고대역 부분에 기초하여 이득 정보를 결정하도록 구성된 이득 추정기를 포함한다.
다른 특정 실시형태에서, 디바이스는 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 수단을 포함하며, 여기서 오디오 신호는 고대역 부분 및 저대역 부분을 포함한다. 디바이스는 또한, 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하는 수단을 포함한다. 그 디바이스는 또한, 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정하는 수단을 포함한다. 그 디바이스는 또한, 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 수단을 포함한다. 그 디바이스는 또한, 제 2 모델링된 고대역 신호 및 오디오 신호의 고대역 부분에 기초하여 이득 정보를 결정하는 수단을 포함한다.
또 다른 특정 실시형태에서, 비-일시적 컴퓨터 판독가능 매체는 컴퓨터에 의해 실행될 경우, 컴퓨터로 하여금, 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 것을 포함하는 동작들을 수행하게 하는 명령들을 포함하며, 여기서 오디오 신호는 고대역 부분 및 저대역 부분을 포함한다. 동작들은 또한, 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하는 것을 포함한다. 동작들은 또한, 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정하는 것을 포함한다. 동작들은 또한, 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 것을 포함한다. 동작들은 또한, 제 2 모델링된 고대역 신호 및 오디오 신호의 고대역 부분에 기초하여 이득 파라미터들을 결정하는 것을 포함한다.
개시된 실시형태들 중 적어도 하나에 의해 제공되는 특별한 장점들은, 이득 정보를 계산하는데 사용되는 모델링된 고대역 여기 신호를 스케일링함으로써 인코더에 제공되는 이득 정보의 동적 범위를 감소시키는 것을 포함한다. 예를 들어, 모델링된 고대역 여기 신호는 모델링된 고대역 신호의 서브-프레임들 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지들에 기초하여 스케일링될 수도 있다. 이러한 방식으로 모델링된 고대역 여기 신호를 스케일링하는 것은 서브프레임으로부터 서브프레임까지의 시간 특성들에서의 변동들을 캡처하고, 오디오 신호의 고대역 부분에서 시간적 변화들에 관한 이득 형상 정보의 의존도를 감소시킬 수도 있다. 본 개시의 다른 양태들, 이점들, 및 특징들은 다음의 섹션들: 즉, 도면의 간단한 설명, 상세한 설명, 및 청구항을 포함하여 전체 출원의 검토 후 자명하게 될 것이다.
도 1 은 스케일링된 모델링된 고대역 여기 신호에 기초하여 고대역 사이드 정보를 생성하도록 동작가능한 시스템의 특정 실시형태를 예시하기 위한 다이어그램이다.
도 2 는 도 1 의 고대역 분석 모듈의 특정 실시형태를 예시하기 위한 다이어그램이다.
도 3 은 서브-프레임 정보를 보간하는 특정 실시형태를 예시하기 위한 다이어그램이다.
도 4 는 서브-프레임 정보를 보간하는 다른 특정 실시형태를 예시하기 위한 다이어그램이다.
도 5 내지 도 7 은 모두 도 1 의 고대역 분석 모듈의 다른 특정 실시형태를 예시하기 위한 다이어그램들이다.
도 8 은 오디오 신호 프로세싱 방법의 특정 실시형태를 예시하기 위한 플로우차트이다.
도 9 는 도 1 내지 도 8 의 시스템들 및 방법들에 따라 신호 프로세싱 동작들을 수행하도록 동작가능한 무선 디바이스의 블록 다이어그램이다.
도 1 은 스케일링된 모델링된 고대역 여기 신호에 기초하여 고대역 사이드 정보를 생성하도록 동작가능한 시스템 (100) 의 특정 실시형태를 예시하기 위한 다이어그램이다. 특정 실시형태에서, 시스템 (100) 은 (예컨대, 무선 전화, 또는 코더/디코더 (코덱) 에서) 인코딩 시스템 또는 장치에 통합될 수도 있다.
다음 설명에서, 도 1 의 시스템 (100) 에 의해 수행되는 다양한 기능들은 특정 컴포넌트들 또는 모듈들에 의해 수행되는 것으로 설명된다. 그러나, 이러한 컴포넌트들 및 모듈들의 분할은 오직 예시를 위한 것이다. 대안적인 실시형태에서, 특정 컴포넌트 또는 모듈에 의해 수행되는 기능은 대신에, 다수의 컴포넌트들 또는 모듈들 중에서 분할될 수도 있다. 또한, 대안적인 실시형태에서, 도 1 의 2 이상의 컴포넌트들 또는 모듈들은 단일 컴포넌트 또는 모듈로 통합될 수도 있다. 도 1 에 도시된 각각의 컴포넌트 또는 모듈은 하드웨어 (예컨대, 필드-프로그래머블 게이트 어레이 (FPGA) 디바이스, 애플리케이션용 집적 회로 (ASIC), 디지털 신호 프로세서 (DSP), 제어기, 등등), 소프트웨어 (예컨대, 프로세서에 의해 실행가능한 명령들), 또는 이들의 임의의 조합을 사용하여 구현될 수도 있다.
시스템 (100) 은 오디오 신호 (102) 를 수신하도록 구성되는 분석 필터 뱅크 (110) 를 포함한다. 예를 들어, 오디오 신호 (102) 는 마이크로폰 또는 다른 입력 디바이스에 의해 제공될 수도 있다. 특정 실시형태에서, 입력 오디오 신호 (102) 는 음성을 포함할 수도 있다. 오디오 신호 (102) 는 대략 50 헤르츠 (Hz) 로부터 대략 16 킬로헤르츠 (kHz) 까지의 주파수 범위에서의 데이터를 포함하는 SWB 신호일 수도 있다. 분석 필터 뱅크 (110) 는 주파수에 기초하여 입력 오디오 신호 (102) 를 다수의 부분들로 필터링할 수도 있다. 예를 들어, 분석 필터 뱅크 (110) 는 저대역 신호 (122) 및 고대역 신호 (124) 를 생성할 수도 있다. 저대역 신호 (122) 및 고대역 신호 (124) 는 동일하거나 동일하지 않은 대역폭들을 가질 수도 있고, 오버랩하거나 오버랩하지 않을 수도 있다. 대안적인 실시형태에서, 분석 필터 뱅크 (110) 는 2 초과의 출력들을 생성할 수도 있다.
도 1 의 예에서, 저대역 신호 (122) 및 고대역 신호 (124) 는 오버랩하지 않는 주파수 대역들을 점유한다. 예를 들어, 저대역 신호 (122) 및 고대역 신호 (124) 는 각각, 50 Hz - 7 kHz 및 7 kHz - 16 kHz 의 오버랩하지 않는 주파수 대역들을 점유할 수도 있다. 대안적인 실시형태에서, 저대역 신호 (122) 및 고대역 신호 (124) 는 각각, 50 Hz - 8 kHz 및 8 kHz - 16 kHz 의 오버랩하지 않는 주파수 대역들을 점유할 수도 있다. 다른 대안적인 실시형태에서, 저대역 신호 (122) 및 고대역 신호 (124) 는 오버랩하고 (예컨대, 각각 50 Hz - 8 kHz 및 7 kHz - 16 kHz), 이는 분석 필터 뱅크 (110) 의 저역 통과 필터 및 고역 통과 필터가 평활한 롤오프 (rolloff) 를 가질 수 있게 하고, 저역 통과 필터와 고역 통과 필터의 설계를 간략화하고 비용을 감소시킬 수도 있다. 오버랩하는 저대역 신호 (122) 및 고대역 신호 (124) 는 또한, 수신기에서 저대역 및 고대역 신호들의 평활한 블렌딩 (blending) 을 가능하게 할 수도 있고, 그 결과 더 적은 가청 아티팩트 (audible artifact) 들을 발생할 수도 있다.
도 1 의 설명은 SWB 신호의 프로세싱에 관한 것이지만, 이는 오직 예시를 위한 것이다. 대안적인 실시형태에서, 입력 오디오 신호 (102) 는 대략 50 Hz 내지 대략 8 kHz 의 주파수 범위를 갖는 WB 신호일 수도 있다. 그러한 일 실시형태에서, 저대역 신호 (122) 는 대략 50 Hz 내지 대략 6.4 kHz 의 주파수 범위에 대응할 수도 있고, 고대역 신호 (124) 는 대략 6.4 kHz 내지 대략 8 kHz 의 주파수 범위에 대응할 수도 있다.
시스템 (100) 은 저대역 신호 (122) 를 수신하도록 구성된 (또한 저대역 인코더로 지칭된) 저대역 분석 모듈 (130) 을 포함할 수도 있다. 특정 실시형태에서, 저대역 분석 모듈 (130) 은 코드 여기 선형 예측 (CELP) 인코더의 일 실시형태를 나타낼 수도 있다. 저대역 분석 모듈 (130) 은 선형 예측 (LP) 분석 및 코딩 모듈 (132), 선형 예측 계수 (LPC) 대 라인 스펙트럼 쌍 (LSP) 변환 모듈 (134), 및 양자화기 (136) 를 포함할 수도 있다. LSP들은 또한, 라인 스펙트럼 주파수들 (LSF들) 로 지칭될 수도 있고, 2 개의 용어들은 본원에서 상호교환가능하게 사용될 수도 있다. LP 분석 및 코딩 모듈 (132) 은 저대역 신호 (122) 의 스펙트럼 엔벨로프를 LPC들의 세트로서 인코딩할 수도 있다. LPC들은 오디오의 각 프레임 (예컨대, 16 kHz 의 샘플링 레이트에서 320 개의 샘플들에 대응하는 오디오의 20 밀리초 (ms)), 오디오의 각 서브프레임 (예컨대, 오디오의 5 ms), 또는 이들의 임의의 조합에 대하여 생성될 수도 있다. 각 프레임 또는 서브-프레임에 대하여 생성된 LPC들의 수는 수행되는 LP 분석의 "차수 (order)" 에 의해 결정될 수도 있다. 특정 실시형태에서, LP 분석 및 코딩 모듈 (132) 은 10 차 LP 분석에 대응하는 11 개 LPC들의 세트를 생성할 수도 있다.
LPC 대 LSP 변환 모듈 (134) 은 LP 분석 및 코딩 모듈 (132) 에 의해 생성된 LPC들의 세트를 (예컨대, 일대일 변환을 사용하여) LPS들의 대응하는 세트로 변환할 수도 있다. 대안적으로, LPC들의 세트는 파콜 계수 (parcor coefficient) 들, 로그 면적비 (log-area-ratio) 값들, 이미턴스 스펙트럼 쌍들 (ISPs) 또는 이미턴스 스펙트럼 주파수들 (ISFs) 의 대응하는 세트로 일대일 변환될 수도 있다. LPC들의 세트와 LSP들의 세트 간의 변환은 에러 없이 가역적일 수도 있다.
양자화기 (136) 는 변환 모듈 (134) 에 의해 생성된 LSP들의 세트를 양자화할 수도 있다. 예를 들어, 양자화기 (136) 는 다수의 엔트리들 (예컨대, 벡터들) 을 포함하는 (도시되지 않은) 다수의 코드북들을 포함할 수도 있거나 커플링될 수도 있다. LSP들의 세트를 양자화하기 위해, 양자화기 (136) 는 LSP들의 세트에 (예컨대, 최소 평균들 또는 평균 제곱 에러와 같은 왜곡 측정치에 기초하여) "가장 밀접한" 코드북들의 엔트리들을 식별할 수도 있다. 양자화기 (136) 는 코드북에서 식별된 엔트리들의 위치에 대응하는 인덱스 값 또는 인덱스 값들의 시리즈를 출력할 수도 있다. 양자화기 (136) 의 출력은 저대역 비트 스트림 (142) 에 포함된 저대역 필터 파라미터들을 나타낼 수도 있다. 따라서, 저대역 비트 스트림 (142) 은 오디오 신호 (102) 의 저대역 부분을 나타내는 선형 예측 코드 데이터를 포함할 수도 있다.
저대역 분석 모듈 (130) 은 또한, 저대역 여기 신호 (144) 를 생성할 수도 있다. 예를 들어, 저대역 여기 신호 (144) 는 저대역 분석 모듈 (130) 에 의해 수행된 LP 프로세스 동안 생성되는 LP 잔차 신호를 양자화함으로써 생성되는 인코딩된 신호일 수도 있다. LP 잔차 신호는 예측 에러를 나타낼 수도 있다.
시스템 (100) 은 추가로, 분석 필터 뱅크 (110) 로부터 고대역 신호 (124) 및 저대역 분석 모듈 (130) 로부터 저대역 여기 신호 (144) 를 수신하도록 구성된 고대역 분석 모듈 (150) 을 포함할 수도 있다. 고대역 분석 모듈 (150) 은 고대역 신호 (124) 와 저대역 여기 신호 (144) 에 기초하여 고대역 사이드 정보 (172) 를 생성할 수도 있다. 예를 들어, 고대역 사이드 정보 (172) 는 고대역 LSP들을 나타내는 데이터, (예컨대, 적어도 고대역 에너지 대 저대역 에너지의 비율에 기초하여) 이득 정보를 나타내는 데이터, 스케일링 인자들을 나타내는 데이터, 또는 이들의 조합을 포함할 수도 있다.
고대역 분석 모듈 (150) 은 고대역 여기 생성기 (152) 를 포함할 수도 있다. 고대역 여기 생성기 (152) 는 저대역 여기 신호 (144) 의 스펙트럼을 고대역 주파수 범위 (예컨대, 7 kHz - 16 kHz) 로 확장시킴으로써, (도 2 의 고대역 여기 신호 (202) 와 같은) 고대역 여기 신호를 생성할 수도 있다. 예시를 위해, 고대역 여기 생성기 (152) 는 저대역 여기 신호 (144) 에 변환 (예컨대, 절대값 또는 제곱 연산과 같은 비선형 변환) 을 적용할 수도 있고, 고대역 여기 신호를 생성하기 위해, 변환된 저대역 여기 신호를 잡음 신호 (예컨대, 저대역 신호 (122) 의 천천히 변화하는 시간 특성들을 모방하는 저대역 여기 신호 (144) 에 대응하는 엔벨로프에 따라 변조되거나 형상화된 백색 잡음) 와 믹싱할 수도 있다. 예를 들어, 믹싱은 다음 식에 따라 수행될 수도 있다:
고대역 여기 = (α * 변환된 저대역 여기) + ((1-α) * 변조된 잡음)
변환된 저대역 여기 신호와 변조된 잡음이 믹싱되는 비율은 수신기에서 고대역 복원 품질에 영향을 줄 수도 있다. 보이싱된 (voiced) 음성 신호들에 대하여, 믹싱은 변환된 저대역 여기 쪽으로 바이어싱될 수도 있다 (예컨대, 믹싱 인자 α 는 0.5 내지 1.0 의 범위에 있을 수도 있다). 보이싱되지 않은 신호들에 대하여, 믹싱은 변조된 잡음 쪽으로 바이어싱될 수도 있다 (예컨대, 믹싱 인자 α 는 0.0 내지 0.5 의 범위에 있을 수도 있다).
고대역 여기 신호는 고대역 사이드 정보 (172) 에 포함되는 하나 이상의 고대역 이득 파라미터들을 결정하는데 사용될 수도 있다. 특정 실시형태에서, 고대역 여기 신호 및 고대역 신호 (124) 는 스케일링된 고대역 여기 신호를 결정하기 위해 고대역 여기 신호에 적용되는 스케일링 정보 (예컨대, 스케일링 인자들) 를 결정하는데 사용될 수도 있다. 스케일링된 고대역 여기 신호는 고대역 이득 파라미터들을 결정하는데 사용될 수도 있다. 예를 들어, 도 2 및 도 5 내지 도 7 을 참조하여 추가로 설명되는 것과 같이, 에너지 추정기 (154) 는 고대역 신호의 프레임들 또는 서브-프레임들 및 제 1 모델링된 고대역 신호의 대응하는 프레임들 또는 서브-프레임들의 추정된 에너지를 결정할 수도 있다. 제 1 모델링된 고대역 신호는 고대역 여기 신호에 메모리 없는 선형 예측 합성을 적용함으로써 결정될 수도 있다. 스케일링 모듈 (156) 은 고대역 신호 (124) 의 프레임들 또는 서브-프레임들의 추정된 에너지 및 제 1 모델링된 고대역 신호의 대응하는 프레임들 또는 서브-프레임들의 추정된 에너지에 기초하여 스케일링 인자들 (예컨대, 스케일링 인자들의 제 1 세트) 를 결정할 수도 있다. 예를 들면, 각각의 스케일링 인자는 비율 Ei/Ei' 에 대응할 수도 있고, 여기서 Ei 는 고대역 신호의 서브-프레임 i 의 추정된 에너지이고, Ei' 는 제 1 모델링된 고대역 신호의 대응하는 서브-프레임 i 의 추정된 에너지이다. 스케일링 모듈 (156) 은 또한, 스케일링 인자들 (또는 예컨대, 스케일링 인자들의 제 1 세트의 몇몇 서브프레임들에 걸쳐 이득들을 평균함으로써, 스케일링 인자들의 제 1 세트에 기초하여 결정된 스케일링 인자들의 제 2 세트) 을, 서브-프레임 대 서브-프레임 기반으로, 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정할 수도 있다.
도시된 것과 같이, 고대역 분석 모듈 (150) 은 또한, LP 분석 및 코딩 모듈 (158), LPC 대 LSP 변환 모듈 (160), 및 양자화기 (162) 를 포함할 수도 있다. LP 분석 및 코딩 모듈 (158), 변환 모듈 (160), 및 양자화기 (162) 의 각각은 저대역 분석 모듈 (130) 의 대응하는 컴포넌트들을 참조하여 전술된 것과 같이, 그러나 (예컨대, 각각의 계수, LSP, 등등에 대하여 더 적은 비트들을 사용하여) 비교적 감소된 분해능으로, 기능할 수도 있다. LP 분석 및 코딩 모듈 (158) 은 변환 모듈 (160) 에 의해 LSP들로 변환되고 코드북 (166) 에 기초하여 양자화기 (162) 에 의해 양자화되는 LPC들의 세트를 생성할 수도 있다. 예를 들어, LP 분석 및 코딩 모듈 (158), 변환 모듈 (160), 및 양자화기 (162) 는 고대역 사이드 정보 (172) 에 포함되는 고대역 필터 정보 (예컨대, 고대역 LSP들) 를 결정하기 위해 고대역 신호 (124) 를 사용할 수도 있다. 특정 실시형태에서, 고대역 사이드 정보 (172) 는 고대역 LSP들, 고대역 이득 정보, 스케일링 인자들, 또는 이들의 조합을 포함할 수도 있다. 전술된 것과 같이, 고대역 이득 정보는 스케일링된 고대역 여기 신호에 기초하여 결정될 수도 있다.
저대역 비트 스트림 (142) 및 고대역 사이드 정보 (172) 는 출력 데이터 스트림 또는 출력 비트 스트림 (192) 을 생성하기 위해, 멀티플렉서 (MUX; 180) 에 의해 멀티플렉싱될 수도 있다. 출력 비트 스트림 (192) 은 입력 오디오 신호 (102) 에 대응하는 인코딩된 오디오 신호를 표현할 수도 있다. 예를 들어, 출력 비트 스트림 (192) 은 (예컨대, 유선으로, 무선으로, 또는 광학 채널을 통해) 송신되고 및/또는 저장될 수도 있다. 수신기에서, 디멀티플렉서 (DEMUX), 저대역 디코더, 고대역 디코더, 및 필터 뱅크에 의해 역의 동작들이 수행되어, 오디오 신호 (예컨대, 스피커 또는 다른 출력 디바이스에 제공되는 입력 오디오 신호 (102) 의 복원된 버전) 을 생성할 수도 있다. 저대역 비트 스트림 (142) 을 표현하는데 사용된 비트들의 수는, 고대역 사이드 정보 (172) 를 표현하는데 사용된 비트들의 수보다 실질적으로 더 클 수도 있다. 따라서, 출력 비트 스트림 (192) 에서 비트들의 대부분은 저대역 데이터를 표현할 수도 있다. 고대역 측면 정보 (172) 는 신호 모델에 따라 저대역 데이터로부터 고대역 여기 신호를 재생성하기 위해 수신기에서 사용될 수도 있다. 예를 들어, 신호 모델은 저대역 데이터 (예컨대, 저대역 신호 (122)) 와 고대역 데이터 (예컨대, 고대역 신호 (124)) 간의 관계들 또는 상관들의 예측된 세트를 표현할 수도 있다. 따라서, 상이한 신호 모델들이 상이한 종류의 오디오 데이터 (예컨대, 음성, 음악, 등등) 을 위해 사용될 수도 있고, 사용 중에 있는 특정 신호 모델은 인코딩된 오디오 데이터의 통신 이전에, 송신기 및 수신기에 의해 협상될 (또는 산업 표준에 의해 정의될) 수도 있다. 신호 모델을 사용하여, 송신기에서 고대역 분석 모듈 (150) 은, 수신기에서의 대응하는 고대역 분석 모듈이 출력 비트 스트림 (192) 으로부터 고대역 신호 (124) 를 복원하기 위해 신호 모델을 사용할 수 있도록, 고대역 측면 정보 (172) 를 생성할 수도 있다.
도 2 는 도 1 의 고대역 분석 모듈 (150) 의 특정 실시형태를 예시하는 다이어그램이다. 고대역 분석 모듈 (150) 은 고대역 여기 신호 (202) 및 오디오 신호의 고대역 부분 (예컨대, 고대역 신호 (124)) 를 수신하고, 고대역 여기 신호 (202) 및 고대역 신호 (124) 에 기초하여 이득 파라미터들 (250) 및 프레임 이득 (254) 과 같은 이득 정보를 생성하도록 구성된다. 고대역 여기 신호 (202) 는 저대역 여기 신호 (144) 를 사용하여 고대역 여기 생성기 (152) 에 의해 생성된 고대역 여기 신호에 대응할 수도 있다.
필터 파라미터 (204) 는 제 1 모델링된 고대역 신호 (208) 를 결정하기 위해, 올-폴 (all-pole) LP 합성 필터 (206) (예컨대, 합성 필터) 를 사용하여 고대역 여기 신호 (202) 에 적용될 수도 있다. 필터 파라미터들 (204) 은 올-폴 LP 합성 필터 (206) 의 피드백 메모리에 대응할 수도 있다. 스케일링 인자들을 결정하는 목적을 위해, 필터 파라미터들 (204) 은 메모리가 없을 (memoryless) 수도 있다. 특히, i-번째 서브프레임 LP 합성 필터와 연관된 필터 메모리 또는 필터 상태들 1/Ai(z) 은, 올-폴 LP 합성 필터 (206) 를 실행하기 전에 0 으로 리셋된다.
제 1 모델링된 고대역 신호 (208) 는 제 1 모델링된 고대역 신호 (208) 의 각각의 프레임 또는 서브-프레임의 서브-프레임 에너지 (212) 를 결정하기 위해 에너지 추정기 (210) 에 적용될 수도 있다. 고대역 신호 (124) 는 또한, 고대역 신호 (124) 의 각각의 프레임 또는 서브-프레임의 에너지 (224) 를 결정하기 위해 에너지 추정기 (222) 에 적용될 수도 있다. 제 1 모델링된 고대역 신호 (208) 의 서브-프레임 에너지 (212) 및 고대역 신호 (124) 의 에너지 (224) 는 스케일링 인자들 (230) 을 결정하는데 사용될 수도 있다. 스케일링 인자들 (230) 은 제 1 모델링된 고대역 신호 (208) 의 프레임들 또는 서브-프레임들과 고대역 신호 (124) 의 대응하는 프레임들 또는 서브-프레임들 간의 에너지 차이들을 정량화할 수도 있다. 예를 들면, 스케일링 인자들 (230) 은 고대역 신호 (124) 의 에너지 (224) 와 제 1 모델링된 고대역 신호 (208) 의 추정된 서브-프레임 에너지 (212) 의 비율로서 결정될 수도 있다. 특정 실시형태에서, 스케일링 인자들 (230) 은 서브-프레임 대 서브-프레임 기반으로 결정되고, 여기서 각각의 프레임은 4 개의 서브-프레임들을 포함한다. 이러한 실시형태에서, 하나의 스케일링 인자는 제 1 모델링된 고대역 신호 (208) 의 서브-프레임 및 고대역 신호 (124) 의 대응하는 서브-프레임을 포함하는 서브-프레임들의 각각의 세트에 대하여 결정된다.
이득 정보를 결정하기 위해, 고대역 여기 신호 (202) 의 각각의 서브-프레임이 대응하는 스케일링 인자 (230) 로 보상되어 (예컨대, 곱셈되어) 스케일링된 고대역 여기 신호 (240) 를 생성할 수도 있다. 필터 파라미터들 (242) 은 올-폴 필터 (244) 를 사용하여 스케일링된 고대역 여기 신호 (240) 에 적용되어 제 2 모델링된 고대역 신호 (246) 를 결정할 수도 있다. 필터 파라미터들 (242) 은 도 1 의 LP 분석 및 코딩 모듈 (158) 과 같은 선형 예측 분석 및 코딩 모듈의 파라미터들에 대응할 수도 있다. 이득 정보를 결정하는 목적들을 위해, 필터 파라미터들 (242) 은 이전에 프로세싱된 프레임들 (예컨대, 필터 메모리) 과 연관된 정보를 포함할 수도 있다.
제 2 모델링된 고대역 신호 (246) 는 고대역 신호 (124) 와 함께 이득 형상 추정기 (248) 에 적용되어 이득 파라미터들 (250) 을 결정할 수도 있다. 이득 파라미터들 (250), 제 2 모델링된 고대역 신호 (246) 및 고대역 신호 (124) 는 이득 프레임 추정기 (252) 에 적용되어 프레임 이득 (254) 을 결정할 수도 있다. 이득 파라미터들 (250) 및 프레임 이득 (254) 은 함께 이득 정보를 형성한다. 이득 정보는, 스케일링 인자들이 고대역 신호 (124) 와, 고대역 여기 신호 (202) 에 기초하여 결정된 제 2 모델링된 고대역 신호 (246) 간의 에너지 차이들 중 일부를 설명하기 때문에, 스케일링 인자들 (230) 을 적용하지 않고 결정된 이득 정보에 대하여 감소된 동적 범위를 가질 수도 있다.
도 3 은 서브-프레임 정보를 보간하는 특정 실시형태를 예시하는 다이어그램이다. 도 3 의 다이어그램은 N 번째 프레임 (304) 에 대한 서브-프레임 정보를 결정하는 특정 방법을 도시한다. N 번째 프레임 (304) 은 프레임들의 시퀀스에서 N-1 번째 프레임 (302) 이 선행하며, 프레임들의 시퀀스에서 N+1 번째 프레임 (306) 이 뒤따른다. LSP 는 각 프레임에 대하여 계산된다. 예를 들어, N-1 번째 LSP (310) 는 N-1 번째 프레임 (302) 에 대하여 계산되고, N 번째 LSP (312) 는 N 번째 프레임 (304) 에 대하여 계산되고, N+1 번째 LSP (314) 는 N+1 번째 프레임 (306) 에 대하여 계산된다. LSP들은 도 1, 도 2, 또는 도 5 내지 도 7 의 고대역 신호의 스펙트럼 진화, SHB (124, 502) 를 나타낼 수도 있다.
N 번째 프레임 (304) 에 대한 복수의 서브-프레임 LSP들은 선행하는 프레임 (예컨대, N-1 번째 프레임 (302)) 및 현재 프레임 (예컨대, N 번째 프레임 (304)) 의 LSP 값들을 사용하는 보간에 의해 결정될 수도 있다. 예를 들어, 가중 인자들은 선행하는 LSP (예컨대, N-1 번째 LSP (310)) 의 값들과 현재 LSP (예컨대, N 번째 LSP (312)) 의 값들에 적용될 수도 있다. 도 3 에 도시된 예에서, (제 1 서브-프레임 (320), 제 2 서브-프레임 (322), 제 3 서브-프레임 (324), 및 제 4 서브-프레임 (326) 을 포함하는) 4 개의 서브-프레임들에 대한 LSP들이 계산된다. 4 개의 서브-프레임 LSP들 (320 - 326) 은 동일한 가중 또는 동일하지 않은 가중을 사용하여 계산될 수도 있다.
서브-프레임 LSP들 (320 - 326) 은 제 1 모델링된 고대역 신호 (208) 를 추정하기 위해 필터 메모리 업데이트들 없이 LP 합성을 수행하는데 사용될 수도 있다. 그 후에, 제 1 모델링된 고대역 신호 (208) 는 서브-프레임 에너지 Ei' (212) 를 추정하는데 사용된다. 에너지 추정기 (154) 는 제 1 모델링된 고대역 신호 (208) 및 고대역 신호 (124) 에 대한 서브-프레임 에너지 추정치들을 스케일링 모듈 (156) 에 제공할 수도 있고, 서브-프레임 대 서브-프레임 스케일링 인자들 (230) 을 결정할 수도 있다. 스케일링 인자들은 모델링된 스케일링된 고대역 여기 신호 (240) 를 생성하기 위해 고대역 여기 신호 (202) 의 에너지 레벨을 조정하는데 사용될 수도 있고, 스케일링된 고대역 여기 신호 (240) 는 LP 분석 및 코딩 모듈 (158) 에 의해 제 2 모델링된 (또는 합성된) 고대역 신호 (246) 를 생성하는데 사용될 수도 있다. 제 2 모델링된 고대역 신호 (246) 는 (이득 파라미터들 (250) 및/또는 프레임 이득 (254) 과 같은) 이득 정보를 생성하는데 사용될 수도 있다. 예를 들어, 제 2 모델링된 고대역 신호 (246) 는 이득 추정기 (164) 에 제공될 수도 있고, 이득 파라미터들 (250) 및 프레임 이득 (254) 을 결정할 수도 있다.
도 4 는 서브-프레임 정보를 보간하는 다른 특정 실시형태를 예시하는 다이어그램이다. 도 4 의 다이어그램은 N 번째 프레임 (404) 에 대한 서브-프레임 정보를 결정하는 특정 방법을 도시한다. N 번째 프레임 (404) 은 프레임들의 시퀀스에서 N-1 번째 프레임 (402) 이 선행하며, 프레임들의 시퀀스에서 N+1 번째 프레임 (406) 이 뒤따른다. 2 개의 LSP들이 각 프레임에 대하여 계산된다. 예를 들어, LSP_1 (408) 및 LSP_2 (410) 는 N-1 번째 프레임 (402) 에 대하여 계산되고, LSP_1 (412) 및 LSP_2 (414) 는 N 번째 프레임 (404) 에 대하여 계산되고, LSP_1 (416) 및 LSP_2 (418) 는 N+1 번째 프레임 (406) 에 대하여 계산된다. LSP들은 도 1, 도 2, 또는 도 5 내지 도 7 의 고대역 신호의 스펙트럼 진화, SHB (124, 502) 를 나타낼 수도 있다.
N 번째 프레임 (404) 에 대한 복수의 서브-프레임 LSP들은 선행하는 프레임의 LSP 값들 (예컨대, N-1 번째 프레임 (402) 의 LSP_1 (408) 및/또는 LSP_2 (410)) 중 하나 이상 및 현재 프레임 (예컨대, N 번째 프레임 (404)) 의 LSP 값들 중 하나 이상을 사용하는 보간에 의해 결정될 수도 있다. 도 4 에 도시된 LSP 윈도우들 (예컨대, 점선들 (412, 414) 프레임 N (404) 에 대한 비대칭적 LSP 윈도우들) 은 예시의 목적들을 위한 것이고, (미리보기 (look-ahead) 를 갖는) 프레임들 내의 또는 프레임들에 걸친 오버랩이 프레임으로부터 프레임으로 또는 서브프레임으로부터 서브프레임으로 추정된 LSP들의 스펙트럼 진화를 개선할 수도 있도록, LP 분석 윈도우들을 조정하는 것이 가능하다. 예를 들어, 가중 인자들은 선행하는 LSP 의 값들 (예컨대, LSP_2 (410)) 및 현재 프레임의 LSP 값들 (예컨대, LSP_1 (412) 및/또는 LSP_2 (414)) 에 적용될 수도 있다. 도 4 에 도시된 예에서, (제 1 서브-프레임 (420), 제 2 서브-프레임 (422), 제 3 서브-프레임 (424), 및 제 4 서브-프레임 (426) 을 포함하는) 4 개의 서브-프레임들에 대한 LSP들이 계산된다. 4 개의 서브-프레임 LSP들 (420 - 426) 은 동일한 가중 또는 동일하지 않은 가중을 사용하여 계산될 수도 있다.
서브-프레임 LSP들 (420 - 426) 은 제 1 모델링된 고대역 신호 (208) 를 추정하기 위해 필터 메모리 업데이트들 없이 LP 합성을 수행하는데 사용될 수도 있다. 그 후에, 제 1 모델링된 고대역 신호 (208) 는 서브-프레임 에너지 Ei' (212) 를 추정하는데 사용된다. 에너지 추정기 (154) 는 제 1 모델링된 고대역 신호 (208) 및 고대역 신호 (124) 에 대한 서브-프레임 에너지 추정치들을 스케일링 모듈 (156) 에 제공할 수도 있고, 서브-프레임 대 서브-프레임 스케일링 인자들 (230) 을 결정할 수도 있다. 스케일링 인자들은 모델링된 스케일링된 고대역 여기 신호 (240) 를 생성하기 위해 고대역 여기 신호 (202) 의 에너지 레벨을 조정하는데 사용될 수도 있고, 스케일링된 고대역 여기 신호 (240) 는 LP 분석 및 코딩 모듈 (158) 에 의해 제 2 모델링된 (또는 합성된) 고대역 신호 (246) 를 생성하는데 사용될 수도 있다. 제 2 모델링된 고대역 신호 (246) 는 (이득 파라미터들 (250) 및/또는 프레임 이득 (254) 과 같은) 이득 정보를 생성하는데 사용될 수도 있다. 예를 들어, 제 2 모델링된 고대역 신호 (246) 는 이득 추정기 (164) 에 제공될 수도 있고, 이득 파라미터들 (250) 및 프레임 이득 (254) 을 결정할 수도 있다.
도 5 내지 도 7 은 도 1 의 고대역 분석 모듈 (150) 과 같은 고대역 분석 모듈의 다른 특정 실시형태를 종합적으로 예시하는 다이어그램들이다. 고대역 분헉 모듈은 에너지 추정기 (504) 에서 고대역 신호 (502) 를 수신하도록 구성된다. 에너지 추정기 (504) 는 고대역 신호의 각각의 서브-프레임의 에너지를 추정할 수도 있다. 고대역 신호 (502) 의 각각의 서브-프레임의 추정된 에너지 (506), Ei 는 고대역 에너지 인덱스들 (510) 을 생성할 수도 있는 양자화기 (508) 에 제공될 수도 있다.
고대역 신호 (502) 는 또한, 윈도잉 모듈 (520) 에서 수신될 수도 있다. 윈도잉 모듈 (520) 은 고대역 신호 (502) 의 프레임들의 각 쌍에 대하여 선형 예측 계수들 (LPC들) 을 생성할 수도 있다. 예를 들어, 윈도잉 모듈 (520) 은 제 1 LPC (522) (예컨대, LPC_1) 을 생성할 수도 있다. 윈도잉 모듈 (520) 은 또한 제 2 LPC (524) (예컨대, LPC_2) 을 생성할 수도 있다. 제 1 LPC (522) 및 제 2 LPC (524) 는 각각, LSP 변환 모듈들 (526 및 528) 을 사용하여 LSP들로 변환될 수도 있다. 예를 들어, 제 1 LPC (522) 는 제 1 LSP (530) (예컨대, LSP_1) 로 변환될 수도 있고, 제 2 LPC (524) 는 제 2 LSP (532) (예컨대, LSP_2) 로 변환될 수도 있다. 제 1 및 제 2 LSP들 (530, 532) 은 고대역 LSP 인덱스들 (540) 을 형성하기 위해 LSP들 (530, 532) 을 인코딩할 수도 있는 코더 (538) 에 제공될 수도 있다.
제 1 및 제 2 LSP들 (530, 532) 및 제 3 LSP (534) (예컨대, LSP_2old) 는 보간기 (536) 에 제공될 수도 있다. 제 3 LSP (534) 는 (N 번째 프레임 (304) 의 서브-프레임들이 결정되고 있는 경우) 도 3 의 N-1 번째 프레임 (302) 과 같은 이전에 프로세싱된 프레임에 대응할 수도 있다. 보간기 (536) 는 제 1, 제 2, 및 제 3 LSP들 (530, 532 및 534) 을 사용하여 보간된 서브-프레임 LSP들 (542, 544, 546, 및 548) 을 생성할 수도 있다. 예를 들어, 보간기 (536) 는 서브-프레임 LSP들 (542, 544, 546, 및 548) 을 결정하기 위해 가중들을 LSP들 (530, 532 및 534) 을 적용할 수도 있다.
서브-프레임 LSP들 (542, 544, 546, 및 548) 은 서브-프레임 LPC들 및 필터 파라미터들 (552, 554, 556, 및 558) 을 결정하기 위해 LSP 대 LPC 변환 모듈 (550) 에 제공될 수도 있다.
도 5 에 또한 도시된 것과 같이, 고대역 여기 신호 (560) (예컨대, 저대역 여기 신호 (144) 에 기초하여 도 1 의 고대역 여기 생성기 (152) 에 의해 결정된 고대역 여기 신호) 가 서브-프레이밍 모듈 (562) 에 제공될 수도 있다. 서브-프레이밍 모듈 (562) 은 고대역 여기 신호 (560) 를 서브-프레임들 (570, 572, 574, 및 576) (예컨대, 고대역 여기 신호 (560) 의 프레임 당 4 개의 서브-프레임들) 로 분석할 수도 있다.
도 6 을 참조하여, 고대역 여기 신호 (560) 의 LSP-대-LPC 변환 모듈 (550) 및 서브-프레임들 (570, 572, 574, 및 576) 로부터의 필터 파라미터들 (552, 554, 556, 및 558) 은 대응하는 올-폴 필터들 (612, 614, 616, 618) 에 제공될 수도 있다. 올-폴 필터들 (612, 614, 616, 618) 의 각각은, 고대역 여기 신호 (560) 의 대응하는 서브-프레임 (570, 572, 574, 576) 의 제 1 모델링된 (또는 합성된) 고대역 신호 (HBi', 여기서 i 는 특정 서브-프레임의 인덱스임) 의 서브-프레임들 (622, 624, 626, 628) 을 생성할 수도 있다. 특정 실시형태에서, 스케일링 인자들, 이를테면 스케일링 인자들 (672, 674, 676, 및 678) 을 결정하는 목적들을 위해, 필터 파라미터들 (552, 554, 556, 및 558) 은 메모리가 없을 수도 있다. 즉, 제 1 모델링된 고대역 신호의 제 1 서브-프레임 (622) 을 생성하기 위해, LP 합성, 1/A1(z) 은 0 으로 리셋된 필터 파라미터들 (552) (예컨대, 필터 메모리 또는 필터 상태들) 로 수행된다.
제 1 모델링된 고대역 신호의 서브-프레임들 (622, 624, 626, 628) 은 에너지 추정기들 (632, 634, 636, 및 638) 에 제공될 수도 있다. 에너지 추정기들 (632, 634, 636, 및 638) 은 제 1 모델링된 고대역 신호의 서브-프레임들 (622, 624, 626, 628) 의 에너지 추정치들 (642, 644, 646, 648) (Ei', 여기서 i 는 특정 서브-프레임의 인덱스임) 을 생성할 수도 있다.
도 5 의 고대역 신호 (502) 의 에너지 추정치들 (652, 654, 656, 및 658) 은 제 1 모델링된 고대역 신호의 서브-프레임들 (622, 624, 626, 628) 의 에너지 추정치들 (642, 644, 646, 648) 과 결합되어 (예컨대, 나누어져서) 스케일링 인자들 (672, 674, 676, 및 678) 을 형성할 수도 있다. 특정 실시형태에서, 각각의 스케일링 인자는 제 1 모델링된 고대역 신호, Ei' 의 대응하는 서브-프레임 (622, 624, 626, 628) 의 에너지에 대한 고대역 신호 Ei 의 서브-프레임의 에너지의 비율이다. 예를 들어, 제 1 스케일링 인자 (672) (SF1) 는 E1' (642) 로 나누어지는 E1 (652) 의 비율로서 결정될 수도 있다. 따라서, 제 1 스케일링 인자 (672) 는 도 5 의 고대역 신호 (502) 의 제 1 서브-프레임의 에너지와 고대역 여기 신호 (560) 에 기초하여 결정된 제 1 모델링된 고대역 신호의 제 1 서브-프레임 (622) 간의 관계를 수치로 나타낸다.
도 7 을 참조하면, 고대역 여기 신호 (560) 의 각각의 서브-프레임 (570, 572, 574, 576) 은 대응하는 스케일링 인자 (672, 674, 676, 및 678) 와 결합되어 스케일링된 고대역 여기 신호 (
Figure 112016044561775-pct00001
, 여기서 i 는 특정 서브-프레임의 인덱스임) 의 서브-프레임 (702, 704, 706, 및 708) 을 생성할 수도 있다. 예를 들어, 고대역 여기 신호 (560) 의 제 1 서브-프레임에는 제 1 스케일링 인자 (672) 가 곱해져서 스케일링된 고대역 여기 신호의 제 1 서브-프레임 (702) 을 생성할 수도 있다.
스케일링된 고대역 여기 신호의 서브-프레임들 (702, 704, 706, 및 708) 은 올-폴 필터들 (712, 714, 716, 718) (예컨대, 합성 필터들) 에 적용되어 제 2 모델링된 (예컨대, 합성된) 고대역 신호의 서브-프레임들 (742, 744, 746, 748) 을 결정할 수도 있다. 예를 들어, 스케일링된 고대역 여기 신호의 제 1 서브-프레임 (702) 은 제 1 필터 파라미터들 (722) 과 함께 제 1 의 올-폴 필터 (712) 에 적용되며, 제 2 모델링된 고대역 신호의 제 1 서브-프레임 (742) 을 결정할 수도 있다. 올-폴 필터들 (712, 714, 716, 718) 에 적용된 필터 파라미터들 (722, 724, 726, 및 728) 은 이전에 프로세싱된 프레임들 (또는 서브-프레임들) 과 관련된 정보를 포함할 수도 있다. 예를 들어, 각각의 올-폴 필터 (712, 714, 716) 는 다른 올-폴 필터들 (714, 716, 718) 에 제공되는 필터 상태 업데이트 정보 (732, 734, 736) 를 출력할 수도 있다. 올-폴 필터 (718) 로부터의 필터 상태 업데이트 (738) 는 필터 메모리를 업데이트하기 위해 다음 프레임 (즉, 제 1 서브-프레임) 에서 사용될 수도 있다.
제 2 모델링된 고대역 신호의 서브-프레임들 (742, 744, 746, 748) 은 제 2 모델링된 고대역 신호의 프레임 (752) 을 생성하기 위해, 프레이밍 모듈 (750) 에서 결합될 수도 있다. 제 2 모델링된 고대역 신호의 프레임 (752) 은 고대역 신호 (502) 와 함께 이득 형상 추정기 (754) 에 적용되어 이득 파라미터들 (756) 을 결정할 수도 있다. 이득 파라미터들 (756), 제 2 모델링된 고대역 신호의 프레임 (752) 및 고대역 신호 (502) 는 이득 프레임 추정기 (758) 에 적용되어 프레임 이득 (760) 을 결정할 수도 있다. 이득 파라미터들 (756) 및 프레임 이득 (760) 은 함께 이득 정보를 형성한다. 이득 정보는, 스케일링 인자들 (672, 674, 676, 678) 이 고대역 신호 (502) 와 고대역 여기 신호 (560) 를 사용하여 모델링된 신호 간의 에너지 차이들 중 일부를 설명하기 때문에, 스케일링 인자들 (672, 674, 676, 678) 을 적용하지 않고 결정된 이득 정보에 대하여 감소된 동적 범위를 가질 수도 있다.
도 8 은 800 으로 지정된 오디오 신호 프로세싱 방법의 특정 실시형태를 예시하는 플로우차트이다. 방법 (800) 은 도 1 의 고대역 분석 모듈 (150) 과 같은 고대역 분석 모듈에서 수행될 수도 있다. 방법 (800) 은, 802 에서, 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 것을 포함한다. 오디오 신호는 고대역 부분과 저대역 부분을 포함한다. 예를 들어, 제 1 모델링된 고대역 신호는 도 2 의 제 1 모델링된 고대역 신호 (208) 에 또는 도 6 의 제 1 모델링된 고대역 신호의 서브-프레임들 (622, 624, 626, 628) 의 세트에 대응할 수도 있다. 제 1 모델링된 고대역 신호는 고대역 여기 신호를 메모리 없는 필터 파라미터들을 갖는 올-폴 필터에 적용함으로써 선형 예측 분석을 사용하여 결정될 수도 있다. 예를 들어, 고대역 여기 신호 (202) 는 도 2 의 올-폴 LP 합성 필터 (206) 에 적용될 수도 있다. 상기 예에서, 올-폴 LP 합성 필터 (206) 에 적용된 필터 파라미터들 (204) 은 메모리가 없다. 즉, 필터 파라미터들 (204) 은 프로세싱되고 있는 고대역 여기 신호 (202) 의 특정 프레임 또는 서브-프레임에 관련되며, 이전에 프로세싱된 프레임들 또는 서브-프레임들에 관련된 정보를 포함하지 않는다. 다른 예에서, 도 5 및 도 6 의 고대역 여기 신호 (560) 의 서브-프레임들 (570, 572, 574, 576) 은 대응하는 올-폴 필터들 (612, 614, 616, 618) 에 적용될 수도 있다. 상기 예에서, 올-폴 필터들 (612, 614, 616, 618) 의 각각에 적용된 필터 파라미터들 (552, 554, 556, 558) 은 메모리가 없다.
그 방법 (800) 은 또한, 804 에서, 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하는 것을 포함한다. 예를 들면, 도 2 의 스케일링 인자들 (230) 은 고대역 신호 (124) 의 서브-프레임의 추정된 에너지 (224) 를 제 1 모델링된 고대역 신호 (208) 의 대응하는 서브-프레임의 추정된 서브-프레임 에너지 (212) 로 나눔으로써 결정될 수도 있다. 다른 예에서, 도 6 의 스케일링 인자들 (672, 674, 676, 678) 은 고대역 신호 (502) 의 서브-프레임의 추정된 에너지 (652, 654, 656, 658) 를 제 1 모델링된 고대역 신호의 대응하는 서브-프레임 (622, 624, 626, 628) 의 추정된 에너지 (642, 644, 646, 648) 로 나눔으로써 결정될 수도 있다.
방법 (800) 은, 806 에서, 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정하는 것을 포함한다. 예를 들어, 도 2 의 스케일링 인자 (230) 는 스케일링된 고대역 여기 신호를 생성하기 위해, 서브-프레임 대 서브-프레임 기반으로 고대역 여기 신호 (202) 에 적용될 수도 있다. 다른 예에서, 도 6 의 스케일링 인자들 (672, 674, 676, 678) 은 스케일링된 고대역 여기 신호의 서브-프레임들 (702, 704, 706, 708) 을 생성하기 위해, 고대역 여기 신호 (560) 의 대응하는 서브-프레임들 (570, 572, 574, 576) 에 적용될 수도 있다. 특정 실시형태에서, 하나 이상의 스케일링 인자들의 제 1 세트가 804 에서 결정될 수도 있고, 하나 이상의 스케일링 인자들의 제 2 세트가 806 에서 모델링된 고대역 여기 신호에 적용될 수도 있다. 하나 이상의 스케일링 인자들의 제 2 세트는 하나 이상의 스케일링 인자들의 제 1 세트에 기초하여 결정될 수도 있다. 예를 들어, 하나 이상의 스케일링 인자들의 제 1 세트를 결정하는데 사용된 다수의 서브-프레임들과 연관된 이득들은 하나 이상의 스케일링 인자들의 제 2 세트를 결정하기 위해 평균될 수도 있다. 이러한 예에서, 하나 이상의 스케일링 인자들의 제 2 세트는 하나 이상의 스케일링 인자들의 제 1 세트보다 더 적은 스케일링 인자들을 포함할 수도 있다.
방법 (800) 은 808 에서, 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 것을 포함한다. 예시를 위해, 스케일링된 고대역 여기 신호의 선형 예측 분석이 수행될 수도 있다. 예를 들어, 도 2 의 스케일링된 고대역 여기 신호 (240) 는 제 2 모델링된 (예컨대, 합성된) 고대역 신호 (246) 를 결정하기 위해 필터 파라미터들 (242) 과 함께 올-폴 필터 (244) 에 적용될 수도 있다. 필터 파라미터들 (242) 은 메모리를 포함할 수도 있다 (예컨대, 이전에 프로세싱된 프레임들 또는 서브-프레임들에 기초하여 업데이트될 수도 있다). 다른 예에서, 도 7 의 스케일링된 고대역 여기 신호의 서브-프레임들 (702, 704, 706, 708) 은 제 2 모델링된 (예컨대, 합성된) 고대역 신호의 서브-프레임들 (742, 744, 746, 748) 을 결정하기 위해 필터 파라미터들 (722, 724, 726, 728) 과 함께 올-폴 필터들 (712, 714, 716, 718) 에 적용될 수도 있다. 필터 파라미터들 (722, 724, 726, 728) 은 메모리를 포함할 수도 있다 (예컨대, 이전에 프로세싱된 프레임들 또는 서브-프레임들에 기초하여 업데이트될 수도 있다).
방법 (800) 은 810 에서, 제 2 모델링된 고대역 신호 및 오디오 신호의 고대역 부분에 기초하여 이득 파라미터들을 결정하는 것을 포함한다. 예를 들어, 제 2 모델링된 고대역 신호 (246) 및 고대역 신호 (124) 는 도 2 의 이득 형상 파라미터 (248) 에 제공될 수도 있다. 이득 형상 추정기 (248) 는 이득 파라미터들 (250) 을 결정할 수도 있다. 부가적으로, 제 2 모델링된 고대역 신호 (246), 고대역 신호 (124), 및 이득 파라미터들 (250) 은 프레임 이득 (254) 을 결정할 수도 있는 이득 프레임 추정기 (252) 에 제공될 수도 있다. 다른 예에서, 제 2 모델링된 고대역 신호의 서브-프레임들 (742, 744, 746, 748) 은 제 2 모델링된 고대역 신호의 프레임 (752) 을 형성하는데 사용될 수도 있다. 제 2 모델링된 고대역 신호의 프레임 (752) 및 고대역 신호 (502) 의 대응하는 프레임은 도 7 의 이득 형상 추정기 (754) 에 제공될 수도 있다. 이득 형상 추정기 (754) 는 이득 파라미터들 (756) 을 결정할 수도 있다. 부가적으로, 제 2 모델링된 고대역 신호의 프레임 (752), 고대역 신호 (502) 의 대응하는 프레임, 및 이득 파라미터들 (756) 은 프레임 이득 (760) 을 결정할 수도 있는 이득 프레임 추정기 (758) 에 제공될 수도 있다. 프레임 이득 및 이득 파라미터들은 오디오 신호 (102) 와 같은 오디오 신호를 인코딩하는데 사용된 비트 스트림 (192) 에 포함되는, 도 1 의 고대역 사이드 정보 (172) 와 같은 고대역 사이드 정보에 포함될 수도 있다.
따라서, 도 1 내지 도 8 은 도 1 의 고대역 신호 (124) 와 같은 오디오 신호의 고대역 부분과, 저대역 여기 신호 (144) 와 같은 저대역 여기 신호에 기반하는 고대역 신호의 모델링된 또는 합성된 버전 간의 에너지 차이들을 설명하기 위해 스케일링 인자들을 사용하는 방식으로, 오디오 신호 인코딩을 수행하는 시스템들 및 방법들을 포함하는 예들을 예시한다. 에너지 차이들을 설명하기 위해 스케일링 인자들을 사용하는 것은, 예컨대, 이득 정보의 동적 범위를 감소시킴으로써, 이득 정보의 계산을 개선할 수도 있다. 도 1 내지 도 8 의 시스템들 및 방법들은 모바일 전화, 휴대용 개인 통신 시스템들 (PCS) 유닛, 통신 디바이스, 뮤직 플레이어, 비디오 플레이어, 엔터테인먼트 유닛, 셋톱 박스, 네비게이션 디바이스, 글로벌 포지셔닝 시스템 (GPS) 가능 디바이스, PDA, 컴퓨터, 휴대용 데이터 유닛 (예컨대, 개인용 데이터 보조장치), 고정 위치 데이터 유닛 (예컨대, 미터 판독 장비), 또는 오디오 신호 인코딩 및/또는 디코딩 기능들을 수행하는 임의의 다른 디바이스와 같은 하나 이상의 전자 디바이스들 내에 통합되고 및/또는 이들에 의해 수행될 수도 있다.
도 9 를 참조하여, 무선 통신 디바이스의 특정 예시적인 실시형태의 블록 다이어그램이 도시되고, 일반적으로 900 으로 지정된다. 디바이스 (900) 는 메모리 (932) 에 커플링된 적어도 하나의 프로세서를 포함한다. 예를 들어, 도 9 에 도시된 실시형태에서, 디바이스 (900) 는 제 1 프로세서 (910) (예컨대, 중앙 프로세싱 유닛 (CPU)) 및 제 2 프로세서 (912) (예컨대, DSP 등등) 를 포함한다. 다른 실시형태들에서, 디바이스 (900) 는 오직 단일 프로세서만을 포함할 수도 있거나, 2 초과의 프로세서들을 포함할 수도 있다. 메모리 (932) 는 프로세서들 (910, 912) 중 적어도 하나에 의해, 도 8 의 방법 (700) 또는 도 1 내지 도 7 을 참조하여 설명된 프로세서들 중 하나 이상과 같이 본원에 개시된 방법들 및 프로세스들을 수행하도록 실행가능한 명령들 (960) 을 포함할 수도 있다.
예를 들어, 명령들 (960) 은 저대역 분석 모듈 (976) 및 고대역 분석 모듈 (978) 을 포함하거나 이에 대응할 수도 있다. 특정 실시형태에서, 저대역 분석 모듈 (976) 은 도 1 의 저대역 분석 모듈 (130) 에 대응하고, 고대역 분석 모듈 (978) 은 도 1 의 고대역 분석 모듈 (150) 에 대응한다. 부가적으로 또는 대안적으로, 고대역 분석 모듈 (978) 은 도 2 또는 도 5 내지 도 7 의 컴포넌트들의 조합에 대응하거나 이를 포함할 수도 있다.
다양한 실시형태들에서, 저대역 분석 모듈 (976), 고대역 분석 모듈 (978), 또는 이들 양자는 전용 하드웨어 (예컨대, 회로) 를 통해, 하나 이상의 작업들을 수행하기 위해 메모리 (980) 에서 명령들 (960) 또는 명령들 (961) 을 실행하는 프로세서 (예컨대, 프로세서 (912)) 에 의해, 또는 이들의 조합으로 구현될 수도 있다. 일 예로서, 메모리 (932) 또는 메모리 (980) 는 랜덤 액세스 메모리 (RAM), 자기저항성 랜덤 액세스 메모리 (MRAM), 스핀-토크 전달 MRAM (STT-MRAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거가능한 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈가능 디스크, 컴팩트 디스크 판독 전용 메모리 (CD-ROM) 와 같은 메모리 디바이스를 포함하거나 이에 대응할 수도 있다. 메모리 디바이스는 컴퓨터 (예컨대, 프로세서 (910) 및/또는 프로세서 (912)) 에 의해 실행될 경우, 컴퓨터로 하여금 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하게 하고, 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정하게 하고, 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하게 하고, 제 2 모델링된 고대역 신호와 오디오 신호의 고대역 부분에 기초하여 이득 파라미터들을 결정하게 하는 명령들 (예를 들면, 명령들 (960) 또는 명령들 (961)) 을 포함할 수도 있다. 일 예로서, 메모리 (932) 또는 메모리 (980) 는 컴퓨터 (예컨대, 프로세서 (910) 및/또는 프로세서 (912)) 에 의해 실행될 경우, 컴퓨터로 하여금 도 8 의 방법 (800) 의 적어도 일부를 수행하게 하는 명령들을 포함하는 비-일시적 컴퓨터 판독가능 매체일 수도 있다.
도 9 는 또한, 프로세서 (910) 및 디스플레이 (928) 에 커플링되는 디스플레이 제어기 (926) 를 도시한다. 코덱 (934) 은 도시된 것과 같은 프로세서 (912), 프로세서 (910), 또는 이들 양자에 커플링될 수도 있다. 스피커 (936) 및 마이크로폰 (938) 은 코덱 (934) 에 커플링될 수 있다. 예를 들어, 마이크로폰 (938) 은 도 1 의 입력 오디오 신호 (102) 를 생성할 수도 있고, 프로세서 (912) 는 입력 오디오 신호 (102) 에 기초하여 수신기로의 송신을 위해 출력 비트 스트림 (192) 을 생성할 수도 있다. 다른 예로서, 스피커 (936) 는 도 1 의 출력 비트 스트림 (192) 으로부터 복원된 신호를 출력하는데 사용될 수도 있고, 여기서 출력 비트 스트림 (192) 은 송신기로부터 수신된다. 도 9 는 또한, 무선 제어기 (940) 가 프로세서 (910) 에, 프로세서 (912) 에, 또는 이들 양자에 그리고 무선 안테나 (942) 에 커플링될 수 있는 것을 표시한다. 특정 실시형태에서, 코덱 (934) 은 아날로그 오디오 프로세싱 프론트-엔드 컴포넌트이다. 예를 들어, 코덱 (934) 은 마이크로폰 (938) 으로부터 수신된 신호들 및 스피커 (936) 로 송신된 신호들에 대하여 아날로그 이득 조정 및 파라미터 세팅을 수행할 수도 있다. 코덱 (934) 은 또한 아날로그-디지털 (A/D) 및 디지털-아날로그 (D/A) 컨버터들을 포함할 수도 있다. 특정 예에서, 코덱 (934) 은 또한, 하나 이상의 변조기들 및 신호 프로세싱 필터들을 포함한다. 코덱 (934) 은 마이크로폰 (938) 으로부터 수신된 입력 데이터를 버퍼링하고 스피커 (936) 로 제공될 출력 데이터를 버퍼링하기 위한 메모리를 포함할 수도 있다.
특정 실시형태에 있어서, 프로세서 (910), 프로세서 (912), 디스플레이 제어기 (926), 메모리 (932), 코덱 (934), 및 무선 제어기 (940) 가 시스템-인-패키지 또는 시스템-온-칩 디바이스 (922) 에 포함된다. 특정 실시형태에 있어서, 터치스크린 및/또는 키패드와 같은 입력 디바이스 (930) 및 전력 공급부 (944) 가 시스템-온-칩 디바이스 (922) 에 커플링된다. 더욱이, 특정 실시형태에 있어서, 도 9 에 도시된 바와 같이, 디스플레이 (928), 입력 디바이스 (930), 스피커 (936), 마이크로폰 (938), 안테나 (942), 및 전력 공급부 (944) 가 시스템-온-칩 디바이스 (922) 외부에 있다. 하지만, 디스플레이 (928), 입력 디바이스 (930), 스피커 (936), 마이크로폰 (938), 안테나 (942), 및 전력 공급부 (944) 각각은 인터페이스 또는 제어기와 같은 시스템-온-칩 디바이스 (922) 의 컴포넌트에 커플링될 수 있다.
설명된 실시형태들과 결합하여, 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 수단을 포함하는 장치가 개시되며, 여기서 오디오 신호는 고대역 부분 및 저대역 부분을 포함한다. 예를 들면, 고대역 분석 모듈 (150) (또는 LP 분석 및 코딩 모듈 (158) 과 같은 그 컴포넌트) 은 오디오 신호 (102) 의 저대역 여기 신호 (144) 에 기초하여 제 1 모델링된 고대역 신호를 결정할 수도 있다. 다른 예로서, 도 2 의 올-폴 LP 합성 필터 (206) 와 같은 제 1 합성 필터는 고대역 여기 신호 (202) 에 기초하여 제 1 모델링된 고대역 신호를 결정할 수도 있다. 고대역 여기 신호 (202) 는 오디오 신호의 저대역 여기 신호 (144) 에 기초하여 도 1 의 고대역 여기 생성기 (152) 에 의해 결정될 수도 있다. 다른 예로서, 도 6 의 올-폴 필터들 (612, 614, 616, 618) 과 같은 제 1 합성 필터들의 세트는 고대역 여기 신호의 서브-프레임들 (570, 572, 574, 576) 에 기초하여 제 1 모델링된 고대역 신호의 서브-프레임들 (622, 624, 626, 628) 을 결정할 수도 있다. 다른 예로서, 도 9 의 프로세서 (910), 프로세서 (912), 또는 프로세서들 (910, 912) 중 하나의 컴포넌트 (예컨대, 고대역 분석 모듈 (978) 또는 명령들 (961)) 는 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정할 수도 있다.
그 장치는 또한, 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 오디오 신호의 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하는 수단을 포함한다. 예를 들어, 도 1 의 에너지 추정기 (154) 및 스케일링 모듈 (156) 은 스케일링 인자들을 결정할 수도 있다. 다른 예로서, 스케일링 인자들 (230) 은 도 2 의 추정된 서브프레임 에너지 (212 및 224) 에 기초하여 결정될 수도 있다. 또 다른 예에서, 스케일링 인자들 (672, 674, 676, 678) 은 도 6 의 추정된 에너지 (642, 644, 646, 648) 및 추정된 에너지 (652, 654, 656, 658) 각각에 기초하여 결정될 수도 있다. 또 다른 예로서, 도 9 의 프로세서 (910), 프로세서 (912), 또는 프로세서들 (910, 912) 중 하나의 컴포넌트 (예컨대, 고대역 분석 모듈 (978) 또는 명령들 (961)) 는 스케일링 인자들을 결정할 수도 있다.
그 장치는 또한, 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정하는 수단을 포함한다. 예를 들어, 도 1 의 스케일링 모듈 (156) 은 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하여 스케일링된 고대역 여기 신호를 결정할 수도 있다. 다른 예로서, 결합기 (예컨대, 곱셈기) 는 스케일링 인자들 (230) 을 모델링된 고대역 여기 신호 (202) 에 적용하여 도 2 의 스케일링된 고대역 여기 신호 (240) 를 결정할 수도 있다. 또 다른 예로서, 결합기들 (예컨대, 곱셈기들) 은 도 7 의 스케일링된 고대역 여기 신호의 서브-프레임들 (702, 704, 706, 708) 을 결정하기 위해, 스케일링 인자들 (672, 674, 676, 678) 을 고대역 여기 신호의 대응하는 서브-프레임들 (570, 572, 574, 576) 에 적용할 수도 있다. 또 다른 예로서, 도 9 의 프로세서 (910), 프로세서 (912), 또는 프로세서들 (910, 912) 중 하나의 컴포넌트 (예컨대, 고대역 분석 모듈 (978) 또는 명령들 (961)) 는 모델링된 고대역 여기 신호에 스케일링 인자들을 적용하여 스케일링된 고대역 여기 신호를 결정할 수도 있다.
그 디바이스는 또한, 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 수단을 포함한다. 예를 들면, 고대역 분석 모듈 (150) (또는 LP 분석 및 코딩 모듈 (158) 과 같은 그 컴포넌트) 은 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정할 수도 있다. 다른 예로서, 도 2 의 올-폴 필터 (244) 와 같은 제 2 합성 필터는 스케일링된 고대역 여기 신호 (240) 에 기초하여 제 2 모델링된 고대역 신호 (246) 를 결정할 수도 있다. 또 다른 예로서, 도 7 의 올-폴 필터들 (712, 714, 716, 718) 과 같은 제 2 합성 필터들의 세트는 스케일링된 고대역 여기 신호의 서브-프레임들 (702, 704, 706, 708) 에 기초하여 제 2 모델링된 고대역 신호의 서브-프레임들 (742, 744, 746, 748) 을 결정할 수도 있다. 또 다른 예로서, 도 9 의 프로세서 (910), 프로세서 (912), 또는 프로세서들 (910, 912) 중 하나의 컴포넌트 (예컨대, 고대역 분석 모듈 (978) 또는 명령들 (961)) 는 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정할 수도 있다.
그 장치는 또한, 제 2 모델링된 고대역 신호 및 오디오 신호의 고대역 부분에 기초하여 이득 파라미터들을 결정하는 수단을 포함한다. 예를 들어, 도 1 의 이득 추정기 (164) 는 이득 파라미터들을 결정할 수도 있다. 다른 예에서, 이득 형상 추정기 (248), 이득 프레임 추정기 (252), 또는 이들 양자는 이득 파라미터들 (250) 및 프레임 이득 (254) 과 같은 이득 정보를 결정할 수도 있다. 또 다른 예에서, 이득 형상 추정기 (754), 이득 프레임 추정기 (758), 또는 이들 양자는 이득 파라미터들 (756) 및 프레임 이득 (760) 과 같은 이득 정보를 결정할 수도 있다. 또 다른 예로서, 도 9 의 프로세서 (910), 프로세서 (912), 또는 프로세서들 (910, 912) 중 하나의 컴포넌트 (예컨대, 고대역 분석 모듈 (978) 또는 명령들 (961)) 는 제 2 모델링된 고대역 신호 및 오디오 신호의 고대역 부분에 기초하여 이득 파라미터들을 결정할 수도 있다.
당업자는 본원에 개시된 실시형태들과 관련하여 설명된 다양한 예시적인 논리 블록들, 구성들, 모듈들, 회로들, 및 알고리즘 단계들이 전자 하드웨어, 하드웨어 프로세서와 같은 프로세싱 디바이스에 의해 실행되는 컴퓨터 소프트웨어, 또는 이들 양자의 조합들로서 구현될 수도 있음을 추가로 인식할 것이다. 다양한 예시적인 컴포넌트들, 블록들, 구성들, 모듈들, 회로들 및 단계들이 일반적으로 그들의 기능의 관점에서 상기 기술되었다. 그러한 기능이 하드웨어로 구현되는지 또는 실행가능한 소프트웨어로 구현되는지의 여부는 특정 애플리케이션 및 전체 시스템에 부과되는 설계 제약들에 따라 달라진다. 당업자는 설명된 기능을 각각의 특정 어플리케이션에 대하여 다양한 방식으로 구현할 수도 있지만, 그러한 구현의 결정들이 본 개시의 범위로부터의 일탈을 야기하는 것으로서 해석되지는 않아야 한다.
본 명세서에 개시된 실시형태들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어에서, 프로세서에 의해 실행되는 소프트웨어 모듈에서, 또는 이들 양자의 조합에서 직접 구현될 수도 있다. 소프트웨어 모듈은 RAM, MRAM, STT-MRAM, 플래시 메모리, ROM, PROM, EPROM, EEPROM, 레지스터들, 하드 디스크, 착탈가능 디스크, 또는 CD-ROM 과 같은 메모리 디바이스 내에 상주할 수도 있다. 예시적인 메모리 디바이스는 프로세서가 메모리 디바이스로부터 정보를 판독하고 정보를 메모리 디바이스로 기록할 수 있도록 프로세서에 커플링된다. 대안에서, 메모리 디바이스는 프로세서에 통합될 수도 있다. 프로세서 및 저장 매체는 ASIC 에 상주할 수도 있다. ASIC 는 컴퓨팅 디바이스 또는 사용자 단말기에 상주할 수도 있다. 대안에서, 프로세서 및 저장 매체는 컴퓨팅 디바이스 또는 사용자 단말기에 별개의 컴포넌트들로서 상주할 수도 있다.
개시된 실시형태들의 상기 설명은 당업자로 하여금 개시된 실시형태들을 제조 또는 이용할 수 있도록 제공된다. 이들 실시형태들에 대한 다양한 수정들은 당업자에게 용이하게 자명할 것이며, 본 명세서에서 정의된 원리들은 본 개시의 범위로부터 일탈함 없이 다른 실시형태들에 적용될 수도 있다. 따라서, 본 개시는 본 명세서에서 설명된 실시형태들로 한정되도록 의도되지 않으며, 다음의 청구항들에 의해 정의된 바와 같은 원리들 및 신규한 특징들과 부합하는 가능한 최광의 범위를 부여받아야 한다.

Claims (31)

  1. 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 단계로서, 상기 오디오 신호는 고대역 부분 및 저대역 부분을 포함하는, 상기 제 1 모델링된 고대역 신호를 결정하는 단계;
    상기 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 상기 오디오 신호의 상기 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 하나 이상의 스케일링 인자들의 제 1 세트를 결정하는 단계;
    스케일링된 고대역 여기 신호를 결정하기 위해 모델링된 고대역 여기 신호에 상기 하나 이상의 스케일링 인자들의 제 1 세트 중에서 적어도 하나에 기초하는 하나 이상의 스케일링 인자들의 제 2 세트를 적용하는 단계;
    상기 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 단계;
    상기 제 2 모델링된 고대역 신호 및 상기 오디오 신호의 상기 고대역 부분에 기초하여 이득 파라미터들을 결정하는 단계; 및
    결정된 상기 이득 파라미터들에 기초하여 데이터 스트림을 출력하는 단계를 포함하는, 방법.
  2. 제 1 항에 있어서,
    상기 제 1 모델링된 고대역 신호의 특정 서브-프레임은 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 합성 필터를 적용함으로써 결정되는, 방법.
  3. 제 2 항에 있어서,
    상기 합성 필터는 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 대응하는 필터 파라미터들을 사용하는, 방법.
  4. 제 3 항에 있어서,
    상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 상기 합성 필터를 적용하기 전에, 필터 메모리 또는 필터 상태들이 0 으로 리셋되는, 방법.
  5. 제 3 항에 있어서,
    상기 필터 파라미터들은 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 선행하는 서브-프레임들에 관련된 정보를 포함하지 않는, 방법.
  6. 제 1 항에 있어서,
    상기 제 2 모델링된 고대역 신호의 특정 서브-프레임은 상기 제 2 모델링된 고대역 신호의 특정 서브-프레임에 대응하는 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임에 합성 필터를 적용함으로써 결정되는, 방법.
  7. 제 6 항에 있어서,
    상기 합성 필터는 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임 및 하나 이상의 선행하는 서브-프레임들에 기초하여 필터 메모리를 사용하거나 필터 상태들을 업데이트하는, 방법.
  8. 제 7 항에 있어서,
    상기 필터 메모리 또는 상기 필터 상태들은 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임에 상기 합성 필터를 적용하기 전에, 0 으로 리셋되지 않고 이전 프레임 또는 서브-프레임으로부터 이어지는, 방법.
  9. 제 1 항에 있어서,
    올-폴 (all-pole) 합성 필터들에 기초하여 합성되는 상기 제 1 모델링된 고대역 신호의 서브-프레임들 중 하나 이상의 에너지를 추정하는 단계를 더 포함하며,
    상기 올-폴 합성 필터들은 현재 프레임과 연관된 하나 이상의 라인 스펙트럼 쌍들 및 선행하는 프레임과 연관된 하나 이상의 라인 스펙트럼 쌍들의 가중된 합에 기초하여 보간되는 필터 계수들을 가지는, 방법.
  10. 제 1 항에 있어서,
    특정 서브-프레임에 대한 스케일링 인자를 결정하는 것은,
    상기 오디오 신호의 상기 고대역 부분의 특정 서브-프레임의 에너지를 결정하는 것;
    상기 제 1 모델링된 고대역 신호의 대응하는 서브-프레임의 에너지를 결정하는 것;
    상기 오디오 신호의 상기 고대역 부분의 특정 서브-프레임의 에너지를, 상기 제 1 모델링된 고대역 신호의 대응하는 서브-프레임의 에너지로 나누는 것; 및
    상기 스케일링 인자를 양자화하고 송신하는 것을 포함하는, 방법.
  11. 제 10 항에 있어서,
    상기 하나 이상의 스케일링 인자들의 제 1 세트는 각각의 서브-프레임에 걸쳐 또는 다수의 서브-프레임들로 이루어진 각각의 프레임에 걸쳐 결정되는, 방법.
  12. 제 1 항에 있어서,
    상기 이득 파라미터들은 이득 형상 및 이득 프레임을 포함하고,
    변환된 저대역 여기 신호를 형상화된 잡음 신호와 결합함으로써 상기 모델링된 고대역 여기 신호를 결정하는 단계를 더 포함하는, 방법.
  13. 제 12 항에 있어서,
    상기 오디오 신호의 저대역 부분의 선형 예측 코딩에 기초하여 상기 저대역 여기 신호를 결정하는 단계를 더 포함하는, 방법.
  14. 제 1 항에 있어서,
    고대역 사이드 정보를 결정하는 단계를 더 포함하며,
    상기 고대역 사이드 정보는 고대역 라인 스펙트럼 쌍들을 나타내는 데이터, 상기 이득 파라미터들을 나타내는 데이터, 스케일링 인자를 나타내는 데이터, 또는 이들의 조합을 포함하는, 방법.
  15. 제 1 항에 있어서,
    상기 제 1 모델링된 고대역 신호를 결정하는 단계; 상기 하나 이상의 스케일링 인자들의 제 1 세트를 결정하는 단계; 상기 하나 이상의 스케일링 인자들의 제 2 세트를 적용하는 단계; 상기 제 2 모델링된 고대역 신호를 결정하는 단계; 상기 이득 파라미터들을 결정하는 단계; 및 상기 데이터 스트림을 출력하는 단계는 모바일 통신 디바이스 또는 고정된 통신 유닛을 포함하는 디바이스 내에서 수행되는, 방법.
  16. 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하도록 구성된 제 1 합성 필터로서, 상기 오디오 신호는 고대역 부분 및 저대역 부분을 포함하는, 상기 제 1 합성 필터;
    상기 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 상기 오디오 신호의 상기 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하고, 스케일링된 고대역 여기 신호를 결정하기 위해 모델링된 고대역 여기 신호에 상기 스케일링 인자들을 적용하도록 구성된 스케일링 모듈;
    상기 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하도록 구성된 제 2 합성 필터;
    상기 제 2 모델링된 고대역 신호 및 상기 오디오 신호의 상기 고대역 부분에 기초하여 이득 파라미터들을 결정하도록 구성된 이득 추정기; 및
    결정된 상기 이득 파라미터들에 기초하여 데이터 스트림을 출력하도록 구성된 멀티플렉서를 포함하는, 장치.
  17. 제 16 항에 있어서,
    상기 제 1 합성 필터는 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 합성 필터를 적용함으로써 상기 제 1 모델링된 고대역 신호의 특정-서브프레임을 결정하고,
    상기 합성 필터는 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 대응하는 필터 파라미터들을 사용하며, 그리고
    상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 상기 합성 필터를 적용하기 전에, 필터 메모리 또는 필터 상태들이 0 으로 리셋되는, 장치.
  18. 제 17 항에 있어서,
    상기 필터 파라미터들은 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 선행하는 서브-프레임들에 관련된 정보를 포함하지 않는, 장치.
  19. 제 16 항에 있어서,
    상기 제 2 합성 필터는 상기 제 2 모델링된 고대역 신호의 특정 서브-프레임에 대응하는 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임에 합성 필터를 적용함으로써 상기 제 2 모델링된 고대역 신호의 특정-서브프레임을 결정하고,
    상기 합성 필터는 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임 및 하나 이상의 선행하는 서브-프레임들에 기초하여 필터 메모리를 사용하거나 필터 상태들을 업데이트하며, 그리고
    상기 필터 메모리 또는 필터 상태들은 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임에 상기 합성 필터를 적용하기 전에 0 으로 리셋되지 않고 이전 프레임 또는 서브-프레임으로부터 이어지는, 장치.
  20. 제 16 항에 있어서,
    저대역 비트 스트림을 결정하도록 구성된 저대역 분석 모듈을 더 포함하며,
    상기 저대역 비트 스트림은 상기 오디오 신호의 저대역 부분을 나타내는 선형 예측 코드 데이터를 포함하는, 장치.
  21. 제 16 항에 있어서,
    상기 스케일링 모듈은,
    상기 오디오 신호의 상기 고대역 부분의 특정 서브-프레임의 에너지를 결정하도록 구성된 제 1 에너지 추정기;
    상기 제 1 모델링된 고대역 신호의 대응하는 서브-프레임의 에너지를 결정하도록 구성된 제 2 에너지 추정기; 및
    상기 오디오 신호의 상기 고대역 부분의 특정 서브-프레임의 에너지 대 상기 제 1 모델링된 고대역 신호의 대응하는 서브-프레임의 에너지의 비율을 결정하도록 구성된 결합기를 포함하는, 장치.
  22. 제 16 항에 있어서,
    상기 이득 파라미터들은 이득 형상 및 이득 프레임을 포함하고;
    변환된 저대역 여기 신호를 형상화된 잡음 신호와 결합함으로써 상기 모델링된 고대역 여기 신호를 결정하도록 구성된 고대역 여기 생성기;
    상기 오디오 신호의 저대역 부분의 선형 예측 코딩에 기초하여 상기 저대역 여기 신호를 결정하도록 구성된 저대역 인코더; 및
    고대역 사이드 정보를 결정하도록 구성된 고대역 분석 모듈
    을 더 포함하며,
    상기 고대역 사이드 정보는: 고대역 라인 스펙트럼 쌍들을 나타내는 데이터, 상기 이득 파라미터들을 나타내는 데이터, 및 상기 스케일링 인자를 나타내는 데이터를 포함하는, 장치.
  23. 제 16 항에 있어서,
    상기 데이터 스트림은 저대역 비트스트림 및 고대역 사이드 정보를 포함하고,
    상기 저대역 비트스트림은 상기 오디오 신호의 상기 저대역 부분을 나타내는, 장치.
  24. 제 16 항에 있어서,
    안테나;
    송신기;
    수신기;
    프로세서;
    디코더; 및
    상기 제 1 합성 필터, 상기 스케일링 모듈, 상기 제 2 합성 필터, 상기 이득 추정기, 및 상기 멀티플렉서를 포함하는 인코더를 더 포함하는, 장치.
  25. 제 24 항에 있어서,
    상기 안테나, 상기 송신기, 상기 수신기, 상기 프로세서, 상기 디코더, 및 상기 인코더는 모바일 통신 디바이스 내로 통합되는, 장치.
  26. 제 24 항에 있어서,
    상기 안테나, 상기 송신기, 상기 수신기, 상기 프로세서, 상기 디코더, 및 상기 인코더는 고정된 통신 유닛 내로 통합되는, 장치.
  27. 오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 수단으로서, 상기 오디오 신호는 고대역 부분 및 저대역 부분을 포함하는, 상기 제 1 모델링된 고대역 신호를 결정하는 수단;
    상기 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 상기 오디오 신호의 상기 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하는 수단;
    스케일링된 고대역 여기 신호를 결정하기 위해 상기 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하는 수단;
    상기 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 수단;
    상기 제 2 모델링된 고대역 신호 및 상기 오디오 신호의 상기 고대역 부분에 기초하여 이득 파라미터들을 결정하는 수단; 및
    상기 이득 파라미터들을 결정하는 수단에 응답하여 데이터 스트림을 출력하는 수단을 포함하는, 디바이스.
  28. 제 27 항에 있어서,
    상기 제 1 모델링된 고대역 신호를 결정하는 수단은 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 합성 필터를 적용함으로써 상기 제 1 모델링된 고대역 신호의 특정-서브프레임을 결정하고,
    상기 합성 필터는 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 대응하는 필터 파라미터들을 사용하고,
    상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 상기 합성 필터를 적용하기 전에, 필터 메모리 또는 필터 상태들이 0 으로 리셋되어, 상기 필터 파라미터들이 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 선행하는 서브-프레임들에 관련된 정보를 포함하지 않도록 하고,
    상기 제 2 모델링된 고대역 신호를 결정하는 수단은 상기 제 2 모델링된 고대역 신호의 특정 서브-프레임에 대응하는 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임에 제 2 합성 필터를 적용함으로써 상기 제 2 모델링된 고대역 신호의 특정-서브프레임을 결정하고,
    상기 합성 필터는 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임 및 하나 이상의 선행하는 서브-프레임들에 기초하여 상기 필터 메모리를 사용하거나 필터 상태들을 업데이트하며, 그리고
    상기 필터 메모리 또는 필터 상태들은 상기 스케일링된 고대역 여기 신호의 특정 서브-프레임에 상기 합성 필터를 적용하기 전에 0 으로 리셋되지 않고 이전 프레임 또는 서브-프레임으로부터 이어지는, 디바이스.
  29. 제 27 항에 있어서,
    상기 제 1 모델링된 고대역 신호를 결정하는 수단, 상기 스케일링 인자들을 결정하는 수단, 상기 스케일링 인자들을 적용하는 수단, 상기 제 2 모델링된 고대역 신호를 결정하는 수단, 상기 이득 파라미터들을 결정하는 수단, 및 상기 데이터 스트림을 출력하는 수단은 모바일 통신 디바이스 또는 고정된 통신 유닛 내로 통합되는, 디바이스.
  30. 명령들을 저장하는 비-일시적인 컴퓨터 판독가능 저장 매체로서,
    상기 명령들은 프로세서로 하여금 동작들을 수행하게 하기 위해 상기 프로세서에 의해 실행가능하며,
    상기 동작들은,
    오디오 신호의 저대역 여기 신호에 기초하여 제 1 모델링된 고대역 신호를 결정하는 것으로서, 상기 오디오 신호는 고대역 부분 및 저대역 부분을 포함하는, 상기 제 1 모델링된 고대역 신호를 결정하는 것;
    상기 제 1 모델링된 고대역 신호의 서브-프레임들의 에너지 및 상기 오디오 신호의 상기 고대역 부분의 대응하는 서브-프레임들의 에너지에 기초하여 스케일링 인자들을 결정하는 것;
    스케일링된 고대역 여기 신호를 결정하기 위해 상기 스케일링 인자들을 모델링된 고대역 여기 신호에 적용하는 것;
    상기 스케일링된 고대역 여기 신호에 기초하여 제 2 모델링된 고대역 신호를 결정하는 것;
    상기 제 2 모델링된 고대역 신호 및 상기 오디오 신호의 상기 고대역 부분에 기초하여 이득 파라미터들을 결정하는 것; 및
    결정된 상기 이득 파라미터들에 기초하여 데이터 스트림을 출력하는 것
    을 포함하는, 비-일시적인 컴퓨터 판독가능 저장 매체.
  31. 제 30 항에 있어서,
    상기 제 1 모델링된 고대역 신호의 특정 서브-프레임은 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 합성 필터를 적용함으로써 결정되고,
    상기 합성 필터는 상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 대응하는 필터 파라미터들을 사용하며, 그리고
    상기 모델링된 고대역 여기 신호의 특정 서브-프레임에 상기 합성 필터를 적용하기 전에, 필터 메모리 또는 필터 상태들이 0 으로 리셋되는, 비-일시적인 컴퓨터 판독가능 저장 매체.
KR1020167012306A 2013-10-14 2014-10-14 스케일링된 고대역 여기를 사용하는 오디오 신호의 대역폭 확장을 위한 방법, 장치, 디바이스, 컴퓨터 판독가능 매체 KR101806058B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361890812P 2013-10-14 2013-10-14
US61/890,812 2013-10-14
US14/512,892 US9384746B2 (en) 2013-10-14 2014-10-13 Systems and methods of energy-scaled signal processing
US14/512,892 2014-10-13
PCT/US2014/060448 WO2015057680A1 (en) 2013-10-14 2014-10-14 Method, apparatus, device, computer-readable medium for bandwidth extension of an audio signal using a scaled high-band excitation

Publications (2)

Publication Number Publication Date
KR20160067972A KR20160067972A (ko) 2016-06-14
KR101806058B1 true KR101806058B1 (ko) 2017-12-06

Family

ID=52810406

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167012306A KR101806058B1 (ko) 2013-10-14 2014-10-14 스케일링된 고대역 여기를 사용하는 오디오 신호의 대역폭 확장을 위한 방법, 장치, 디바이스, 컴퓨터 판독가능 매체

Country Status (22)

Country Link
US (1) US9384746B2 (ko)
EP (1) EP3058570B1 (ko)
JP (1) JP6045762B2 (ko)
KR (1) KR101806058B1 (ko)
CN (1) CN105593935B (ko)
AU (1) AU2014337537C1 (ko)
CA (1) CA2925894C (ko)
CL (1) CL2016000834A1 (ko)
DK (1) DK3058570T3 (ko)
ES (1) ES2643828T3 (ko)
HK (1) HK1219800A1 (ko)
HU (1) HUE033434T2 (ko)
MX (1) MX352483B (ko)
MY (1) MY182138A (ko)
NZ (1) NZ717786A (ko)
PH (1) PH12016500600A1 (ko)
RU (1) RU2679346C2 (ko)
SA (1) SA516370876B1 (ko)
SG (1) SG11201601783YA (ko)
SI (1) SI3058570T1 (ko)
WO (1) WO2015057680A1 (ko)
ZA (1) ZA201602115B (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336336B (zh) 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US10475457B2 (en) * 2017-07-03 2019-11-12 Qualcomm Incorporated Time-domain inter-channel prediction
EP3669542B1 (en) * 2017-08-15 2023-10-11 Dolby Laboratories Licensing Corporation Bit-depth efficient image processing
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080027718A1 (en) 2006-07-31 2008-01-31 Venkatesh Krishnan Systems, methods, and apparatus for gain factor limiting
JP4955649B2 (ja) 2005-04-01 2012-06-20 クゥアルコム・インコーポレイテッド 高帯域励振生成のためのシステム、方法、及び装置

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6141638A (en) 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US7117146B2 (en) 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
GB2342829B (en) 1998-10-13 2003-03-26 Nokia Mobile Phones Ltd Postfilter
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6449313B1 (en) 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6704701B1 (en) 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
CA2399706C (en) 2000-02-11 2006-01-24 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
US7110953B1 (en) 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
WO2002023536A2 (en) 2000-09-15 2002-03-21 Conexant Systems, Inc. Formant emphasis in celp speech coding
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6766289B2 (en) 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
KR20050027179A (ko) * 2003-09-13 2005-03-18 삼성전자주식회사 오디오 데이터 복원 방법 및 그 장치
US7613607B2 (en) * 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
US7788091B2 (en) 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
JP2006197391A (ja) 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
CN101185124B (zh) * 2005-04-01 2012-01-11 高通股份有限公司 用于语音信号的分割频带编码的方法和设备
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US9009032B2 (en) 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
JPWO2008072671A1 (ja) 2006-12-13 2010-04-02 パナソニック株式会社 音声復号化装置およびパワ調整方法
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
JP5812998B2 (ja) 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
EP2710590B1 (en) 2011-05-16 2015-10-07 Google, Inc. Super-wideband noise supression
CN102802112B (zh) 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
CN105976830B (zh) * 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4955649B2 (ja) 2005-04-01 2012-06-20 クゥアルコム・インコーポレイテッド 高帯域励振生成のためのシステム、方法、及び装置
US20080027718A1 (en) 2006-07-31 2008-01-31 Venkatesh Krishnan Systems, methods, and apparatus for gain factor limiting

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Bernd Geiser, et al. Bandwidth extension for hierarchical speech and audio coding in ITU-T Rec. G. 729.1. IEEE Transactions on Audio, Speech, and Language Processing, 2007, Vol.15,No.8, pp.2496-2509.
Mikko Tammi, et al. Scalable superwideband extension for wideband coding. IEEE International Conference on Acoustics, Speech and Signal Processing 2009(ICASSP 2009). 2009. pp.161-164.

Also Published As

Publication number Publication date
KR20160067972A (ko) 2016-06-14
HUE033434T2 (en) 2017-11-28
EP3058570B1 (en) 2017-07-26
EP3058570A1 (en) 2016-08-24
DK3058570T3 (en) 2017-10-02
MY182138A (en) 2021-01-18
ES2643828T3 (es) 2017-11-24
PH12016500600B1 (en) 2016-06-13
NZ717786A (en) 2018-05-25
RU2679346C2 (ru) 2019-02-07
CN105593935B (zh) 2017-06-09
JP6045762B2 (ja) 2016-12-14
RU2016113836A (ru) 2017-11-20
RU2016113836A3 (ko) 2018-07-06
SI3058570T1 (sl) 2017-10-30
WO2015057680A1 (en) 2015-04-23
ZA201602115B (en) 2017-09-27
US20150106107A1 (en) 2015-04-16
HK1219800A1 (zh) 2017-04-13
SG11201601783YA (en) 2016-04-28
US9384746B2 (en) 2016-07-05
SA516370876B1 (ar) 2019-08-03
JP2016532912A (ja) 2016-10-20
MX2016004630A (es) 2016-08-01
CL2016000834A1 (es) 2016-11-25
PH12016500600A1 (en) 2016-06-13
MX352483B (es) 2017-11-27
CA2925894C (en) 2018-01-02
CA2925894A1 (en) 2015-04-23
AU2014337537C1 (en) 2018-02-01
AU2014337537B2 (en) 2017-08-03
CN105593935A (zh) 2016-05-18

Similar Documents

Publication Publication Date Title
AU2019203827B2 (en) Estimation of mixing factors to generate high-band excitation signal
KR101806058B1 (ko) 스케일링된 고대역 여기를 사용하는 오디오 신호의 대역폭 확장을 위한 방법, 장치, 디바이스, 컴퓨터 판독가능 매체
CA2925572C (en) Gain shape estimation for improved tracking of high-band temporal characteristics
KR20160087827A (ko) 고대역 코딩에서의 선택적 위상 보상
CN110136742B (zh) 执行噪声调制和增益调节的系统和方法
AU2014337537A1 (en) Method, apparatus, device, computer-readable medium for bandwidth extension of an audio signal using a scaled high-band excitation

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E701 Decision to grant or registration of patent right