KR101828193B1 - 고대역 시간 특징들의 개선된 추적을 위한 이득 형상 추정 - Google Patents

고대역 시간 특징들의 개선된 추적을 위한 이득 형상 추정 Download PDF

Info

Publication number
KR101828193B1
KR101828193B1 KR1020167011241A KR20167011241A KR101828193B1 KR 101828193 B1 KR101828193 B1 KR 101828193B1 KR 1020167011241 A KR1020167011241 A KR 1020167011241A KR 20167011241 A KR20167011241 A KR 20167011241A KR 101828193 B1 KR101828193 B1 KR 101828193B1
Authority
KR
South Korea
Prior art keywords
signal
gain shape
highband
sub
shape parameters
Prior art date
Application number
KR1020167011241A
Other languages
English (en)
Other versions
KR20160067207A (ko
Inventor
벤카타 수브라마니암 찬드라 세카르 체비얌
벤카트라만 에스 아티
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20160067207A publication Critical patent/KR20160067207A/ko
Application granted granted Critical
Publication of KR101828193B1 publication Critical patent/KR101828193B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

방법은 음성 인코더에서, 고조파 확장된 신호에 기초하여 및/또는 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호에 기초하여 제 1 이득 형상 파라미터들을 결정하는 단계를 포함한다. 그 방법은 또한, 합성된 고대역 신호에 기초하고 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들을 결정하는 단계를 포함한다. 그 방법은 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들을 오디오 신호의 인코딩된 버전 내에 삽입하여, 오디오 신호의 인코딩된 버전으로부터 오디오 신호의 재생 동안 이득 조정을 가능하게 하는 단계를 더 포함한다.

Description

고대역 시간 특징들의 개선된 추적을 위한 이득 형상 추정{GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS}
우선권 주장
본 출원은 2013 년 10 월 10 일에 출원된 "GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS" 라는 명칭의 미국 가특허 출원 제 61/889,434 호 및 2014 년 10 월 7 일에 출원된 "GAIN SHAPE ESTIMATION FOR IMPROVED TRACKING OF HIGH-BAND TEMPORAL CHARACTERISTICS" 라는 명칭의 미국 정규 특허 출원 제 14/508,486 을 우선권 주장하며, 이들의 내용들은 참조에 의해 그 전체가 통합된다.
기술 분야
본 개시물은 일반적으로 신호 프로세싱에 관한 것이다.
기술에서의 진보들은 더 작고 더 강력한 컴퓨팅 디바이스들을 발생시켰다. 예를 들어, 소형이고 경량이며 사용자들에 의해 용이하게 휴대되는 휴대용 무선 전화기들, 개인용 디지털 보조기들 (PDA들), 및 페이징 디바이스들과 같은 무선 컴퓨팅 디바이스들을 포함하여 다양한 휴대용 개인용 컴퓨팅 디바이스들이 현재 존재한다. 더 상세하게, 셀룰러 전화기들 및 인터넷 프로토콜 (IP) 전화기들과 같은 휴대용 무선 전화기들은 무선 네트워크들 상으로 음성 및 데이터 패킷들을 통신할 수 있다. 추가로, 다수의 그러한 무선 전화기들은 그 내부에 통합된 다른 타입들의 디바이스들을 포함한다. 예를 들어, 무선 전화기는 또한, 디지털 스틸 카메라, 디지털 비디오 카메라, 디지털 레코더, 및 오디오 파일 플레이어를 포함할 수 있다.
종래의 전화 시스템들 (예컨대, 공중 전화 교환망들 (PSTN들)) 에서, 신호 대역폭은 300 헤르츠 (Hz) 내지 3.4 킬로헤르츠 (kHz) 의 주파수 범위로 제한된다. 셀룰러 전화 및 VoIP (voice over internet protocol) 와 같은 광대역 (WB) 애플리케이션들에서, 신호 대역폭은 50 Hz 부터 7 kHz 까지의 주파수 범위를 가질 수도 있다. 수퍼 광대역 (SWB) 코딩 기술들은 약 16 kHz 까지 확장하는 대역폭을 지원한다. 3.4 kHz 에서의 협대역 전화로부터 16 kHz 의 SWB 전화까지의 확장하는 신호 대역폭은 신호 복원의 품질, 명료도, 및 자연스러움을 개선시킬 수도 있다.
SWB 코딩 기술들은 통상적으로, 신호의 더 낮은 주파수 부분 (예컨대 50 Hz 내지 7 kHz, 또한 "저대역" 으로 불림) 을 인코딩하고 송신하는 것을 수반한다. 예를 들어, 저대역은 필터 파라미터들 및/또는 저대역 여기 신호를 사용하여 표현될 수도 있다. 그러나, 코딩 효율을 개선하기 위해, 신호의 더 높은 주파수 부분 (예컨대 7 kHz 내지 16 kHz, 또한 "고대역" 으로 불림) 은 완전히 인코딩되고 송신되지 않을 수도 있다. 대신, 수신기는 고대역을 예측하기 위해 신호 모델링을 활용할 수도 있다. 일부 구현들에서, 고대역과 연관된 데이터가 그 예측을 보조하기 위해 수신기에 제공될 수도 있다. 그러한 데이터는 "사이드 정보" 로 지칭될 수도 있고, 이득 정보, 라인 스펙트럼 주파수들 (LSF들, 또한 라인 스펙트럼 쌍들 (LSP들) 로 지칭됨), 등등을 포함할 수도 있다. 저대역 신호의 특성들은 사이드 정보를 생성하기 위해 사용될 수도 있지만; 저대역과 고대역 사이의 에너지 격차들은 고대역을 부정확하게 특징짓는 사이드 정보를 발생할 수도 있다.
고대역 시간 특징들의 개선된 추적을 위해 이중 스테이지 이득 형상 추정을 수행하기 위한 시스템들 및 방법들이 개시된다. 음성 인코더는 디코더에서 오디오 신호의 고대역 부분을 복원하기 위해 사용되는 정보 (예컨대, 사이드 정보) 를 생성하기 위해 오디오 신호의 저대역 부분 (예컨대, 고조파 확장된 저대역 여기) 을 활용할 수도 있다. 제 1 이득 형상 추정기는 고조파 확장된 저대역 여기에 존재하지 않는 고대역 결과 잔차 신호에서의 에너지 변동들을 결정할 수도 있다. 예를 들어, 이득 형상 추정기는 고조파 확장된 저대역 여기 신호와 관련하여 고대역 잔차 신호에서 쉬프트되거나 부재하는 고대역에서의 시간적 변동들 또는 편차들 (예컨대, 에너지 레벨들) 을 추정할 수도 있다. (제 1 이득 형상 파라미터들에 기초한) 제 1 이득 형상 조정기는 고대역 잔차의 시간 엔벨로프를 밀접하게 모방하도록, 고조파 확장된 저대역 여기의 시간적 진화를 조정할 수도 있다. 합성된 고대역 신호는 조정된/수정된 고조파 확장된 저대역 여기에 기초하여 생성될 수도 있으며, 제 2 이득 형상 추정기는 합성된 고대역 신호와 제 2 스테이지에서 오디오 신호의 고대역 부분 간의 에너지 변동들을 결정할 수도 있다. 합성된 고대역 신호는 제 2 이득 형상 추정기로부터의 데이터 (예컨대, 제 2 이득 형상 파라미터들) 에 기초하여 오디오 신호의 고대역 부분을 모델링하도록 조정될 수도 있다. 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들은 오디오 신호의 고대역 부분을 복원하기 위해 다른 사이드 정보와 함께 디코더로 송신될 수도 있다.
특정 양태에서, 방법은 음성 인코더에서, 고조파 확장된 신호에 기초하여 및/또는 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호에 기초하여 제 1 이득 형상 파라미터들을 결정하는 단계를 포함한다. 다른 특정 양태에서, 제 1 이득 형상 파라미터들은 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호에서의 시간적 진화에 기초하여 결정된다. 그 방법은 또한, 합성된 고대역 신호에 기초하여 및 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들을 결정하는 단계를 포함한다. 그 방법은 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들을 오디오 신호의 인코딩된 버전 내에 삽입하여, 오디오 신호의 인코딩된 버전으로부터 오디오 신호의 재생 동안 이득 조정을 가능하게 하는 단계를 더 포함한다.
다른 특별한 양태에서, 장치는 고조파 확장된 신호에 기초하여 및/또는 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호에 기초하여 제 1 이득 형상 파라미터들을 결정하도록 구성된 제 1 이득 형상 추정기를 포함한다. 그 장치는 또한, 합성된 고대역 신호에 기초하고 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들을 결정하도록 구성된 제 2 이득 형상 추정기를 포함한다. 그 장치는 추가로, 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들을 오디오 신호의 인코딩된 버전 내에 삽입하여, 오디오 신호의 인코딩된 버전으로부터 오디오 신호의 재생 동안 이득 조정을 가능하게 하도록 구성된 멀티플렉서를 포함한다.
또 다른 특별한 양태에서, 비-일시적 컴퓨터 판독가능 매체는 프로세서에 의해 실행될 경우, 프로세서로 하여금, 고조파 확장된 신호에 기초하여 및/또는 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호에 기초하여 제 1 이득 형상 파라미터들을 결정하게 하는 명령들을 포함한다. 그 명령들은 또한, 프로세서로 하여금, 합성된 고대역 신호에 기초하고 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들을 결정하게 하도록 실행가능하다. 명령들은 또한, 프로세서로 하여금, 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들을 오디오 신호의 인코딩된 버전 내에 삽입하여, 오디오 신호의 인코딩된 버전으로부터 오디오 신호의 재생 동안 이득 조정을 가능하게 하도록 실행가능하다.
또 다른 특별한 양태에서, 장치는 고조파 확장된 신호에 기초하여 및/또는 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호에 기초하여 제 1 이득 형상 파라미터들을 결정하는 수단을 포함한다. 그 장치는 또한, 합성된 고대역 신호에 기초하고 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들을 결정하는 수단을 포함한다. 그 장치는 또한, 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들을 오디오 신호의 인코딩된 버전 내에 삽입하여 오디오 신호의 인코딩된 버전으로부터 오디오 신호의 재생 동안 이득 조정을 가능하게 하는 수단을 포함한다.
또 다른 특별한 양태에서, 방법은 음성 디코더에서, 음성 인코더로부터 인코딩된 오디오 신호를 수신하는 단계를 포함한다. 인코딩된 오디오 신호는 음성 인코더에서 생성된 제 1 고조파 확장된 신호에 기초하는 및/또는 음성 인코더에서 생성된 고대역 잔차 신호에 기초하는 제 1 이득 형상 파라미터들을 포함한다. 인코딩된 오디오 신호는 또한, 음성 인코더에서 생성된 제 1 합성된 고대역 신호에 기초하는 및 오디오 신호의 고대역에 기초하는 제 2 이득 형상 파라미터들을 포함한다. 그 방법은 또한, 제 1 이득 형상 파라미터들에 기초하고 제 2 이득 형상 파라미터들에 기초하여 인코딩된 오디오 신호로부터 오디오 신호를 재생하는 단계를 포함한다.
또 다른 특별한 양태에서, 음성 디코더는 음성 인코더로부터 인코딩된 오디오 신호를 수신하도록 구성된다. 인코딩된 오디오 신호는 음성 인코더에서 생성된 고조파 확장된 신호에 기초하는 및/또는 음성 인코더에서 생성된 고대역 잔차 신호에 기초하는 제 1 이득 형상 파라미터들을 포함한다. 인코딩된 오디오 신호는 또한, 음성 인코더에서 생성된 제 1 합성된 고대역 신호에 기초하는 및 오디오 신호의 고대역에 기초하는 제 2 이득 형상 파라미터들을 포함한다. 음성 디코더는 추가로, 제 1 이득 형상 파라미터들에 기초하고 제 2 이득 형상 파라미터들에 기초하여 인코딩된 오디오 신호로부터 오디오 신호를 재생하도록 구성된다.
또 다른 특별한 양태에서, 장치는 음성 인코더로부터 인코딩된 오디오 신호를 수신하는 수단을 포함한다. 인코딩된 오디오 신호는 음성 인코더에서 생성된 제 1 고조파 확장된 신호에 기초하는 및/또는 음성 인코더에서 생성된 고대역 잔차 신호에 기초하는 제 1 이득 형상 파라미터들을 포함한다. 인코딩된 오디오 신호는 또한, 음성 인코더에서 생성된 제 1 합성된 고대역 신호에 기초하는 및 오디오 신호의 고대역에 기초하는 제 2 이득 형상 파라미터들을 포함한다. 그 장치는 또한, 제 1 이득 형상 파라미터들에 기초하고 제 2 이득 형상 파라미터들에 기초하여 인코딩된 오디오 신호로부터 오디오 신호를 재생하는 수단을 포함한다.
또 다른 특별한 양태에서, 비-일시적 컴퓨터 판독가능 매체는, 프로세서에 의해 실행될 경우, 프로세서로 하여금, 음성 인코더로부터 인코딩된 오디오 신호를 수신하게 하는 명령들을 포함한다. 인코딩된 오디오 신호는 음성 인코더에서 생성된 제 1 고조파 확장된 신호에 기초하는 및/또는 음성 인코더에서 생성된 고대역 잔차 신호에 기초하는 제 1 이득 형상 파라미터들을 포함한다. 인코딩된 오디오 신호는 또한, 음성 인코더에서 생성된 제 1 합성된 고대역 신호에 기초하는 및 오디오 신호의 고대역에 기초하는 제 2 이득 형상 파라미터들을 포함한다. 명령들은 또한, 프로세서로 하여금, 제 1 이득 형상 파라미터들에 기초하고 제 2 이득 형상 파라미터들에 기초하여 인코딩된 오디오 신호로부터 오디오 신호를 재생하게 하도록 실행가능하다.
개시된 실시형태들 중 적어도 하나에 의해 제공되는 특별한 장점들은 오디오 신호의 고조파 확장된 저대역 여기와 오디오 신호의 고대역 잔차 간에 에너지 상관을 개선하는 것을 포함한다. 예를 들어, 고조파 확장된 저대역 여기는 고대역 잔차 신호의 시간 특성들을 밀접하게 모방하기 위해 이득 형상 파라미터들에 기초하여 조정될 수도 있다. 본 개시의 다른 양태들, 이점들, 및 특징들은 다음의 섹션들: 즉, 도면의 간단한 설명, 상세한 설명, 및 청구항을 포함하여 전체 출원의 검토 후 자명하게 될 것이다.
도 1 은 고대역 복원을 위해 2 개의 스테이지들에서 이득 형상 파라미터들을 결정하도록 동작가능한 시스템의 특정 실시형태를 예시하기 위한 다이어그램이다.
도 2 는 고조파 확장된 신호 및/또는 고대역 잔차 신호에 기초하여 제 1 스테이지에서 이득 형상 파라미터들을 결정하도록 동작가능한 시스템의 특정 실시형태를 예시하기 위한 다이어그램이다.
도 3 은 고조파 확장된 신호와 고대역 잔차 신호간의 에너지 격차들에 기초하여 이득 형상 파라미터들을 예시하기 위한 타이밍 다이어그램이다.
도 4 는 합성된 고대역 신호 및 입력 오디오 신호의 고대역 부분에 기초하여 제 2 스테이지에서 제 2 이득 형상 파라미터들을 결정하도록 동작가능한 시스템의 특정 실시형태를 예시하기 위한 다이어그램이다.
도 5 는 이득 형상 파라미터들을 사용하여 오디오 신호를 재생하도록 동작가능한 시스템의 특정 실시형태를 예시하기 위한 다이어그램이다.
도 6 은 고대역 재생을 위한 이득 추정들을 사용하기 위한 방법들의 특정 실시형태들을 예시하기 위한 플로우차트이다.
도 7 은 도 1 내지 도 6 의 시스템들 및 방법들에 따라 신호 프로세싱 동작들을 수행하도록 동작가능한 무선 디바이스의 블록 다이어그램이다.
도 1 을 참조하여, 고대역 복원을 위해 2 개의 스테이지들에서 이득 형상 파라미터들을 결정하도록 동작가능한 시스템의 특정 실시형태가 도시되며, 일반적으로 100 으로 지정된다. 특정 실시형태에서, 시스템 (100) 은 (예컨대, 무선 전화, 코더/디코더 (코덱), 또는 디지털 신호 프로세서 (DSP) 에서) 인코딩 시스템 또는 장치 내에 통합될 수도 있다. 다른 특정 실시형태들에서, 시스템 (100) 은 셋톱 박스, 뮤직 플레이어, 비디오 플레이어, 엔터테인먼트 유닛, 네비게이션 디바이스, 통신 디바이스, PDA, 고정된 위치 데이터 유닛, 또는 컴퓨터 내에 통합될 수도 있다.
다음 설명에서, 도 1 의 시스템 (100) 에 의해 수행되는 다양한 기능들은 특정 컴포넌트들 또는 모듈들에 의해 수행되는 것으로 설명되는 것에 유의하여야 한다. 그러나, 이러한 컴포넌트들 및 모듈들의 분할은 오직 예시를 위한 것이다. 대안적인 실시형태에서, 특정 컴포넌트 또는 모듈에 의해 수행되는 기능은 대신에, 다수의 컴포넌트들 또는 모듈들 중에서 분할될 수도 있다. 또한, 대안적인 실시형태에서, 도 1 의 2 이상의 컴포넌트들 또는 모듈들은 단일 컴포넌트 또는 모듈로 통합될 수도 있다. 도 1 에 도시된 각각의 컴포넌트 또는 모듈은 하드웨어 (예컨대, 필드-프로그래머블 게이트 어레이 (FPGA) 디바이스, 애플리케이션용 집적 회로 (ASIC), DSP, 제어기, 등등), 소프트웨어 (예컨대, 프로세서에 의해 실행가능한 명령들), 또는 이들의 임의의 조합을 사용하여 구현될 수도 있다.
시스템 (100) 은 입력 오디오 신호 (102) 를 수신하도록 구성되는 분석 필터 뱅크 (110) 를 포함한다. 예를 들어, 입력 오디오 신호 (102) 는 마이크로폰 또는 다른 입력 디바이스에 의해 제공될 수도 있다. 특정 실시형태에서, 입력 오디오 신호 (102) 는 음성을 포함할 수도 있다. 입력 오디오 신호 (102) 는 대략 50 Hz 로부터 대략 16 kHz 까지의 주파수 범위에서의 데이터를 포함하는 SWB 신호일 수도 있다. 분석 필터 뱅크 (110) 는 주파수에 기초하여 입력 오디오 신호 (102) 를 다수의 부분들로 필터링할 수도 있다. 예를 들어, 분석 필터 뱅크 (110) 는 저대역 신호 (122) 및 고대역 신호 (124) 를 생성할 수도 있다. 저대역 신호 (122) 및 고대역 신호 (124) 는 동일하거나 동일하지 않은 대역폭을 가질 수도 있고, 오버랩하거나 오버랩하지 않을 수도 있다. 대안적인 실시형태에서, 분석 필터 뱅크 (110) 는 2 이상의 출력들을 생성할 수도 있다.
도 1 의 예에서, 저대역 신호 (122) 및 고대역 신호 (124) 는 오버랩하지 않는 주파수 대역들을 점유한다. 예를 들어, 저대역 신호 (122) 및 고대역 신호 (124) 는 각각, 50 Hz - 7 kHz 및 7 kHz - 16 kHz 의 오버랩하지 않는 주파수 대역들을 점유할 수도 있다. 대안적인 실시형태에서, 저대역 신호 (122) 및 고대역 신호 (124) 는 각각, 50 Hz - 8 kHz 및 8 kHz - 16 kHz 의 오버랩하지 않는 주파수 대역들을 점유할 수도 있다. 다른 대안적인 실시형태에서, 저대역 신호 (122) 및 고대역 신호 (124) 는 오버랩하고 (예컨대, 각각 50 Hz - 8 kHz 및 7 kHz - 16 kHz), 이는 분석 필터 뱅크 (110) 의 저역 통과 필터 및 고역 통과 필터가 평활한 롤오프 (rolloff) 를 가질 수 있게 하고, 저역 통과 필터와 고역 통과 필터의 설계를 간략화하고 비용을 감소시킬 수도 있다. 오버랩하는 저대역 신호 (122) 및 고대역 신호 (124) 는 또한, 수신기에서 저대역 및 고대역 신호들의 평활한 블렌딩 (blending) 을 가능하게 할 수도 있고, 그 결과 더 적은 가청 아티팩트 (audible artifact) 들을 발생할 수도 있다.
도 1 의 예는 SWB 신호의 프로세싱을 도시하지만, 이는 오직 예시를 위한 것임을 유의하여야 한다. 대안적인 실시형태에서, 입력 오디오 신호 (102) 는 대략 50 Hz 내지 대략 8 kHz 의 주파수 범위를 갖는 WB 신호일 수도 있다. 그러한 일 실시형태에서, 저대역 신호 (122) 는 예컨대, 대략 50 Hz 내지 대략 6.4 kHz 의 주파수 범위에 대응할 수도 있고, 고대역 신호 (124) 는 대략 6.4 kHz 내지 대략 8 kHz 의 주파수 범위에 대응할 수도 있다.
시스템 (100) 은 저대역 신호 (122) 를 수신하도록 구성된 저대역 분석 모듈 (130) 을 포함할 수도 있다. 특정 실시형태에서, 저대역 분석 모듈 (130) 은 코드 여기 선형 예측 (CELP) 인코더의 일 실시형태를 나타낼 수도 있다. 저대역 분석 모듈 (130) 은 선형 예측 (LP) 분석 및 코딩 모듈 (132), 선형 예측 계수 (LPC) 대 LSP 변환 모듈 (134), 및 양자화기 (136) 를 포함할 수도 있다. LSP들은 또한, LSF들로 지칭될 수도 있고, 2 개의 용어들 (LSP 및 LSF) 은 본원에서 상호교환가능하게 사용될 수도 있다. LP 분석 및 코딩 모듈 (132) 은 저대역 신호 (122) 의 스펙트럼 엔벨로프를 LPC들의 세트로서 인코딩할 수도 있다. LPC들은 오디오의 각 프레임 (예컨대, 16 kHz 의 샘플링 레이트에서 320 개의 샘플들에 대응하는 오디오의 20 밀리초 (ms)), 오디오의 각 서브프레임 (예컨대, 오디오의 5 ms), 또는 이들의 임의의 조합에 대하여 생성될 수도 있다. 각 프레임 또는 서브-프레임에 대하여 생성된 LPC들의 수는 수행되는 LP 분석의 "차수 (order)" 에 의해 결정될 수도 있다. 특정 실시형태에서, LP 분석 및 코딩 모듈 (132) 은 10 차 LP 분석에 대응하는 11 개 LPC들의 세트를 생성할 수도 있다.
LPC 대 LSP 변환 모듈 (134) 은 LP 분석 및 코딩 모듈 (132) 에 의해 생성된 LPC들의 세트를 (예컨대, 일대일 변환을 사용하여) LPS들의 대응하는 세트로 변환할 수도 있다. 대안적으로, LPC들의 세트는 파콜 계수 (parcor coefficient) 들, 로그 면적비 (log-area-ratio) 값들, 이미턴스 스펙트럼 쌍들 (ISPs) 또는 이미턴스 스펙트럼 주파수들 (ISFs) 의 대응하는 세트로 일대일 변환될 수도 있다. LPC들의 세트와 LSP들의 세트 간의 변환은 에러 없이 가역적일 수도 있다.
양자화기 (136) 는 변환 모듈 (134) 에 의해 생성된 LSP들의 세트를 양자화할 수도 있다. 예를 들어, 양자화기 (136) 는 다수의 엔트리들 (예컨대, 벡터들) 을 포함하는 다수의 코드북들을 포함하거나 커플링될 수도 있다. LSP들의 세트를 양자화하기 위해, 양자화기 (136) 는 LSP들의 세트에 (예컨대, 최소 평균들 또는 평균 제곱 에러와 같은 왜곡 측정치에 기초하여) "가장 밀접한" 코드북들의 엔트리들을 식별할 수도 있다. 양자화기 (136) 는 코드북에서 식별된 엔트리들의 위치에 대응하는 인덱스 값 또는 인덱스 값들의 시리즈를 출력할 수도 있다. 따라서, 양자화기 (136) 의 출력은 저대역 비트 스트림 (142) 에 포함된 저대역 필터 파라미터들을 나타낼 수도 있다.
저대역 분석 모듈 (130) 은 또한, 저대역 여기 신호 (144) 를 생성할 수도 있다. 예를 들어, 저대역 여기 신호 (144) 는 저대역 분석 모듈 (130) 에 의해 수행된 LP 프로세스 동안 생성되는 LP 잔차 신호를 양자화함으로써 생성되는 인코딩된 신호일 수도 있다. LP 잔차 신호는 예측 에러를 나타낼 수도 있다.
시스템 (100) 은 추가로, 분석 필터 뱅크 (110) 로부터 고대역 신호 (124) 및 저대역 분석 모듈 (130) 로부터 저대역 여기 신호 (144) 를 수신하도록 구성된 고대역 분석 모듈 (150) 을 포함할 수도 있다. 고대역 분석 모듈 (150) 은 고대역 신호 (124) 와 저대역 여기 신호 (144) 에 기초하여 고대역 사이드 정보 (172) 를 생성할 수도 있다. 예를 들어, 고대역 사이드 정보 (172) 는 본원에서 추가로 설명되는 것과 같이, (예컨대, 적어도 고대역 에너지 대 저대역 에너지의 비율에 기초하여) 고대역 LSP들 및/또는 이득 정보를 포함할 수도 있다. 특정 실시형태에서, 이득 정보는 고조파 확장된 신호 및/또는 고대역 잔차 신호에 기초하는 이득 형상 파라미터들을 포함할 수도 있다. 고조파 확장된 신호는 고대역 신호 (124) 와 저대역 신호 (122) 간의 불충분한 상관으로 인해 고대역 합성시 사용하기에 부적당할 수도 있다. 예를 들어, 고대역 신호 (124) 의 서브-프레임들은 모델링된 고대역 여기 신호 (161) 에서 적당히 모방되지 않는, 에너지 레벨들에서의 변동들을 포함할 수도 있다.
고대역 분석 모듈 (150) 은 제 1 이득 형상 추정기 (190) 를 포함할 수도 있다. 제 1 이득 형상 추정기 (190) 는 저대역 신호 (122) 와 연관된 제 1 신호에 기초하여 및/또는 고대역 신호 (124) 의 고대역 잔차에 기초하여 제 1 이득 형상 파라미터들을 결정할 수도 있다. 본원에 설명된 것과 같이, 제 1 신호는 저대역 신호 (122) 의 (예컨대, 비선형의 또는 고조파 확장된) 저대역 여기로 변환될 수도 있다. 고대역 사이드 정보 (172) 는 제 1 이득 형상 파라미터들을 포함할 수도 있다. 고대역 분석 모듈 (150) 은 또한, 제 1 이득 형상 파라미터들에 기초하여 고조파 확장된 저대역 여기를 조정하도록 구성된 제 1 이득 형상 조정기 (192) 를 포함할 수도 있다. 예를 들어, 제 1 이득 형상 조정기 (192) 는 고대역 신호 (124) 의 잔차의 대응하는 서브-프레임들의 에너지 레벨들을 근사화하기 위해, 고조파 확장된 저대역 여기의 특정 서브-프레임들을 스케일링할 수도 있다.
고대역 분석 모듈 (150) 은 고대역 여기 생성기 (160) 를 포함할 수도 있다. 고대역 여기 생성기 (160) 는 저대역 여기 신호 (144) 의 스펙트럼을 고대역 주파수 범위 (예컨대, 7 kHz - 16 kHz) 로 확장시킴으로써, 고대역 여기 신호 (161) 를 생성할 수도 있다. 예시를 위해, 고대역 여기 생성기 (160) 는 고대역 여기 신호 (161) 를 생성하기 위해, 조정된 고주파 확장된 저대역 여기를 잡음 신호 (예컨대, 저대역 신호 (122) 의 천천히 변화하는 시간 특징들을 모방하는 저대역 여기 신호 (144) 에 대응하는 엔벨로프에 따라 변조된 백색 잡음) 와 믹싱할 수도 있다. 예를 들어, 믹싱은 다음 식에 따라 수행될 수도 있다:
고대역 여기 = (α * 조정된 고조파 확장된 저대역 여기) + ((1-α) * 변조된 잡음)
조정된 고조파 확장된 저대역 여기와 변조된 잡음이 믹싱되는 비율은 수신기에서 고대역 복원 품질에 영향을 줄 수도 있다. 보이싱된 (voiced) 음성 신호들에 대하여, 믹싱은 조정된 고조파 확장된 저대역 여기 쪽으로 바이어싱될 수도 있다 (예컨대, 믹싱 인자 (α) 는 0.5 내지 1.0 의 범위에 있을 수도 있다). 보이싱되지 않은 신호들에 대하여, 믹싱은 변조된 잡음 쪽으로 바이어싱될 수도 있다 (예컨대, 믹싱 인자 (α) 는 0.0 내지 0.5 의 범위에 있을 수도 있다).
도시된 것과 같이, 고대역 분석 모듈 (150) 은 또한, LP 분석 및 코딩 모듈 (152), LPC 대 LSP 변환 모듈 (154), 및 양자화기 (156) 를 포함할 수도 있다. LP 분석 및 코딩 모듈 (152), 변환 모듈 (154), 및 양자화기 (156) 의 각각은 저대역 분석 모듈 (130) 의 대응하는 컴포넌트들을 참조하여 전술된 것과 같이, 그러나 (예컨대, 각각의 계수, LSP, 등등에 대하여 더 적은 비트들을 사용하여) 비교적 감소된 분해능으로, 기능할 수도 있다. LP 분석 및 코딩 모듈 (152) 은 변환 모듈 (154) 에 의해 LSP들로 변환되고 코드북 (156) 에 기초하여 양자화기 (156) 에 의해 양자화되는 LPC들의 세트를 생성할 수도 있다. 예를 들어, LP 분석 및 코딩 모듈 (152), 변환 모듈 (154), 및 양자화기 (156) 는 고대역 사이드 정보 (172) 에 포함되는 고대역 필터 정보 (예컨대, 고대역 LSP들) 을 결정하기 위해 고대역 신호 (124) 를 사용할 수도 있다.
양자화기 (156) 는 변환 모듈 (154) 에 의해 제공된 LSP들과 같은, 스펙트럼 주파수 값들의 세트를 양자화하도록 구성될 수도 있다. 다른 실시형태들에서, 양자화기 (156) 는 LSF들 또는 LSP들에 부가하여 또는 이를 대신하여, 하나 이상의 다른 타입들의 스펙트럼 주파수 값들의 세트들을 수신하고 양자화할 수도 있다. 예를 들어, 양자화기 (156) 는 LP 분석 및 코딩 모듈 (152) 에 의해 생성된 LPC들의 세트를 수신하고 양자화할 수도 있다. 다른 예들은 파콜 계수들, 로그 면적비 값들, 및 양자화기 (156) 에서 수신되고 양자화될 수도 있는 ISF들의 세트들을 포함한다. 양자화기 (156) 는 입력 벡터 (예컨대, 벡터 포맷의 스펙트럼 주파수 값들의 세트) 를, 코드북 (163) 과 같은 코드북 또는 테이블에서 대응하는 엔트리로의 인덱스로서 인코딩하는 벡터 양자화기를 포함할 수도 있다. 다른 예로서, 양자화기 (156) 는 입력 벡터가 스토리지로부터 취출되는 것보다, 희박한 코드북 실시형태에서와 같은 디코더에서 동적으로 생성될 수도 있는 하나 이상의 파라미터들을 결정하도록 구성될 수도 있다. 예시를 위해, 희박한 코드북 예들은 3GPP2 (Third Generation Partnership 2) EVRC (Enhanced Variable Rate Codec) 와 같은 산업 표준들에 따라 CSLP 및 코덱들과 같은 코딩 방식들에 적용될 수도 있다. 다른 실시형태에서, 고대역 분석 모듈 (150) 은 양자화기 (156) 를 포함할 수도 있고, (예컨대, 필터 파라미터들의 세트에 따라) 합성된 신호들을 생성하기 위해 다수의 코드북 벡터들을 사용하고 및 지각적으로 가중된 영역에서와 같이 고대역 신호 (124) 와 최상으로 매칭하는 합성된 신호와 연관된 코드북 벡터들 중 하나를 선택하도록 구성될 수도 있다.
특정 실시형태에서, 고대역 사이드 정보 (172) 는 고대역 LSP들뿐만 아니라, 고대역 이득 파라미터들을 포함할 수도 있다. 예를 들어, 고대역 여기 신호 (161) 는 고대역 사이드 정보 (172) 에 포함되는 부가적인 이득 파라미터들을 결정하는데 사용될 수도 있다. 고대역 분석 모듈 (150) 은 제 2 이득 형상 추정기 (194) 및 제 2 이득 형상 조정기 (196) 를 포함할 수도 있다. 선형 예측 계수 합성 동작은 합성된 고대역 신호를 생성하기 위해 고대역 여기 신호 (161) 상에 수행될 수도 있다. 제 2 이득 형상 추정기 (194) 는 합성된 고대역 신호와 고대역 신호 (124) 에 기초하여 제 2 이득 형상 파라미터들을 결정할 수도 있다. 고대역 사이드 정보 (172) 는 제 2 이득 형상 파라미터들을 포함할 수도 있다. 제 2 이득 형상 조정기 (196) 는 제 2 이득 형상 파라미터들에 기초하여 합성된 고대역 신호를 조정하도록 구성될 수도 있다. 예를 들어, 제 2 이득 형상 조정기 (196) 는 고대역 신호 (124) 의 대응하는 서브-프레임들의 에너지 레벨들을 근사화하기 위해, 합성된 고대역 신호의 특정 서브-프레임들을 스케일링할 수도 있다.
저대역 비트 스트림 (142) 및 고대역 사이드 정보 (172) 는 출력 비트 스트림 (199) 을 생성하기 위해, 멀티플렉서 (MUX; 180) 에 의해 멀티플렉싱될 수도 있다. 출력 비트 스트림 (199) 은 입력 오디오 신호 (102) 에 대응하는 인코딩된 오디오 신호를 표현할 수도 있다. 예를 들어, 출력 비트 스트림 (199) 은 (예컨대, 유선으로, 무선으로, 또는 광학 채널을 통해) 송신되고 및/또는 저장될 수도 있다. 따라서, 멀티플렉서 (180) 는 제 1 이득 형상 추정기 (190) 에 의해 결정된 제 1 이득 형상 파라미터들 및 제 2 이득 형상 추정기 (194) 에 의해 결정된 제 2 이득 형상 파라미터들을 출력 비트 스트림 (199) 내로 삽입하여 입력 오디오 신호 (102) 의 재생 동안 고대역 여기 이득 조정을 가능하게 할 수도 있다. 수신기에서, 디멀티플렉서 (DEMUX), 저대역 디코더, 고대역 디코더, 및 필터 뱅크에 의해 역의 동작들이 수행되어, 오디오 신호 (예컨대, 스피커 또는 다른 출력 디바이스에 제공되는 입력 오디오 신호 (102) 의 복원된 버전) 을 생성할 수도 있다. 저대역 비트 스트림 (142) 을 표현하는데 사용된 비트들의 수는, 고대역 사이드 정보 (172) 를 표현하는데 사용된 비트들의 수보다 실질적으로 더 클 수도 있다. 따라서, 출력 비트 스트림 (199) 에서 비트들의 대부분은 저대역 데이터를 표현할 수도 있다. 고대역 사이드 정보 (172) 는 신호 모델에 따라 저대역 데이터로부터 고대역 여기 신호를 재생성하기 위해 수신기에서 사용될 수도 있다. 예를 들어, 신호 모델은 저대역 데이터 (예컨대, 저대역 신호 (122)) 와 고대역 데이터 (예컨대, 고대역 신호 (124)) 간의 관계들 또는 상관들의 예측된 세트를 표현할 수도 있다. 따라서, 상이한 신호 모델들이 상이한 종류의 오디오 데이터 (예컨대, 음성, 음악, 등등) 을 위해 사용될 수도 있고, 사용중에 있는 특정 신호 모델은 인코딩된 오디오 데이터의 통신 이전에, 송신기 및 수신기에 의해 협상될 (또는 산업 표준에 의해 정의될) 수도 있다. 신호 모델을 사용하여, 송신기에서 고대역 분석 모듈 (150) 은, 수신기에서의 대응하는 고대역 분석 모듈이 출력 비트 스트림 (199) 으로부터 고대역 신호 (124) 를 복원하기 위해 신호 모델을 사용할 수 있도록, 고대역 사이드 정보 (172) 를 생성할 수도 있다.
시스템 (100) 은 오디오 신호 (102) 의 고조파 확장된 저대역 여기와 입력 오디오 신호 (102) 의 고대역 잔차 간에 프레임별 에너지 상관을 개선시킬 수도 있다 (시간적 진화를 개선시킬 수도 있다). 예를 들어, 제 1 이득 스테이지 동안, 제 1 이득 형상 추정기 (190) 및 제 1 이득 형상 조정기 (192) 는 제 1 이득 파라미터들에 기초하여 고조파 확장된 저대역 여기를 조정할 수도 있다. 고조파 확장된 저대역 여기는 고대역의 잔차를 프레임 기반으로 근사화하도록 조정될 수도 있다. 고조파 확장된 저대역 여기를 조정하는 것은, 합성 도메인에서 이득 형상 추정을 개선하고, 입력 오디오 신호 (102) 의 고대역 복원 동안 가청 아티팩트들을 감소시킬 수도 있다. 시스템 (100) 은 또한, 고대역 신호 (124) 와 고대역 신호 (124) 의 합성된 버전 간의 프레임별 에너지 상관을 개선시킬 수도 있다. 예를 들어, 제 2 이득 스테이지 동안, 제 2 이득 형상 추정기 (194) 와 제 2 이득 형상 조정기 (196) 는 제 2 이득 파라미터들에 기초하여 고대역 신호 (124) 의 합성된 버전을 조정할 수도 있다. 고대역 신호 (124) 의 합성된 버전은 프레임 기반으로 고대역 신호 (124) 를 근사화하도록 조정될 수도 있다. 제 1 및 제 2 이득 형상 파라미터들은 입력 오디오 신호 (102) 의 고대역 복원 동안 가청 아티팩트들을 감소시키기 위해 디코더에 송신될 수도 있다.
도 2 를 참조하여, 고조파 확장된 신호 및/또는 고대역 잔차 신호에 기초하여 제 1 스테이지에서 이득 형상 파라미터들을 결정하도록 동작가능한 시스템 (200) 의 특정 실시형태가 도시된다. 시스템 (200) 은 선형 예측 분석 필터 (204), 비선형 여기 생성기 (207), 프레임 식별 모듈 (214), 제 1 이득 형상 추정기 (190), 및 제 1 이득 형상 조정기 (192) 를 포함한다.
고대역 신호 (124) 는 선형 예측 분석 필터 (204) 로 제공될 수도 있다. 선형 예측 분석 필터 (204) 는 고대역 신호 (124) (예컨대, 입력 오디오 신호 (102) 의 고대역 부분) 에 기초하여, 고대역 잔차 신호 (224) 를 생성하도록 구성될 수도 있다. 예를 들어, 선형 예측 분석 필터 (204) 는 고대역 신호 (124) 의 (현재 샘플들에 기초하는) 향후 샘플들을 예측하는데 사용되는 LPC들의 세트로서, 고대역 신호 (124) 의 스펙트럼 엔벨로프를 인코딩할 수도 있다. 고대역 잔차 신호 (224) 는 프레임 식별 모듈 (214) 및 제 1 이득 형상 추정기 (190) 에 제공될 수도 있다.
프레임 식별 모듈 (214) 은 고대역 잔차 신호 (224) 의 특정 프레임에 대하여 코딩 모드를 결정하고, 코딩 모드에 기초하여 코딩 모드 표시 신호 (216) 를 생성하도록 구성될 수도 있다. 예를 들어, 프레임 식별 모듈 (124) 은 고대역 잔차 신호 (224) 의 특정 프레임이 보이싱된 프레임인지 또는 보이싱되지 않은 프레임인지의 여부를 결정할 수도 있다. 특정 실시형태에서, 보이싱된 프레임은 제 1 코딩 모드 (예컨대, 제 1 메트릭) 에 대응할 수도 있고, 보이싱되지 않은 프레임은 제 2 코딩 모드 (예컨대, 제 2 메트릭) 에 대응할 수도 있다.
저대역 여기 신호 (144) 는 비선형 여기 생성기 (207) 에 제공될 수도 있다. 도 1 과 관련하여 설명된 것과 같이, 저대역 여기 신호 (144) 는 저대역 분석 모듈 (130) 을 사용하여 저대역 신호 (122) (예컨대, 입력 오디오 신호 (102) 의 저대역 부분) 로부터 생성될 수도 있다. 비선형 여기 생성기 (207) 는 저대역 여기 신호 (144) 에 기초하여 고조파 확장된 신호 (208) 를 생성하도록 구성될 수도 있다. 예를 들어, 비선형 여기 생성기 (207) 는 고조파 확장된 신호 (208) 를 생성하기 위해, 저대역 여기 신호 (144) 의 프레임들 (또는 서브-프레임들) 에 절대값 연산 또는 제곱 연산을 수행할 수도 있다.
예시를 위해, 비선형 여기 생성기 (207) 는 저대역 여기 신호 (144) (예컨대, 대략 0 kHz 부터 8 kHz 까지의 범위에 있는 신호) 를 업샘플링하여 대략 0 kHz 부터 16 kHz 까지의 범위에 있는 16 kHz 신호 (예컨대, 저대역 여기 신호 (144) 의 대역폭의 대략 2 배의 대역폭을 갖는 신호) 를 생성하고, 그 후에 업샘플링된 신호에 비선형 동작을 수행할 수도 있다. 16 kHz 신호의 저대역 부분 (예컨대, 대략 0 kHz 부터 8 kHz 까지) 은 저대역 여기 신호 (144) 와 실질적으로 유사한 고조파들을 가질 수도 있고, 16 kHz 신호의 고대역 부분 (예컨대, 대략 8 kHz 부터 16 kHz 까지) 은 고조파들에 실질적으로 자유로울 수도 있다. 비선형 여기 생성기 (207) 는 16 kHz 신호의 저대역 부분에서 "우세한 (dominant)" 고조파들을 16 kHz 신호의 고대역 부분으로 확장시켜 고조파 확장된 신호 (208) 를 생성할 수도 있다. 따라서, 고조파 확장된 신호 (208) 는 비선형 연산들 (예컨대, 제곱 연산들 및/또는 절대값 연산들) 을 사용하여 고조파들을 고대역으로 확장시키는, 저대역 여기 신호 (144) 의 고조파 확장된 버전일 수도 있다. 고조파 확장된 신호 (208) 는 제 1 이득 형상 추정기 (190) 로 및 제 1 이득 형상 조정기 (192) 로 제공될 수도 있다.
제 1 이득 형상 추정기 (190) 는 코딩 모드 표시 신호 (216) 를 수신하고, 코딩 모드에 기초하여 샘플링 레이트를 결정할 수도 있다. 예를 들어, 제 1 이득 형상 추정기 (190) 는 제 1 복수의 서브-프레임들을 생성하기 위해 고조파 확장된 신호 (208) 의 제 1 프레임을 샘플링할 수도 있고, 제 2 복수의 서브-프레임들을 생성하기 위해 유사한 시간 인스턴스들에서 고대역 잔차 신호 (224) 의 제 2 프레임을 샘플링할 수도 있다. 제 1 및 제 2 복수의 서브-프레임들에서 서브-프레임들의 수 (예컨대, 벡터 치수들) 는 코딩 모드에 기초할 수도 있다. 예를 들어, 제 1 (및 제 2) 복수의 서브-프레임들은, 코딩 모드가 고대역 잔차 신호 (224) 의 특정 프레임이 보이싱된 프레임인 것을 표시한다는 결정에 응답하여, 제 1 수의 서브-프레임들을 포함할 수도 있다. 특정 실시형태에서, 제 1 및 제 2 복수의 서브-프레임들은 고대역 잔차 신호 (224) 의 특정 프레임이 보이싱된 프레임이라는 결정에 응답하여 16 개의 서브-프레임들을 각각 포함할 수도 있다. 대안적으로, 제 1 (및 제 2) 복수의 서브-프레임들은, 코딩 모드가 고대역 잔차 신호 (224) 의 특정 프레임이 보이싱된 프레임이 아닌 것을 표시한다는 결정에 응답하여, 제 1 수의 서브-프레임들 미만인 제 2 수의 서브-프레임들을 포함할 수도 있다. 예를 들어, 제 1 및 제 2 복수의 서브-프레임들은, 코딩 모드가 고대역 잔차 신호 (224) 의 특정 프레임이 보이싱된 프레임이 아닌 것을 표시한다는 결정에 응답하여, 8 개의 서브-프레임들을 각각 포함할 수도 있다.
제 1 이득 형상 추정기 (190) 는 고조파 확장된 신호 (208) 및/또는 고대역 잔차 신호 (224) 에 기초하여 제 1 이득 형상 파라미터들 (242) 을 결정하도록 구성될 수도 있다. 제 1 이득 형상 추정기 (190) 는 제 1 복수의 서브-프레임들의 각각의 서브-프레임의 에너지 레벨들을 평가하고, 제 2 복수의 서브-프레임들의 각각의 대응하는 서브-프레임의 에너지 레벨들을 평가할 수도 있다. 예를 들어, 제 1 이득 형상 파라미터들 (242) 은 고대역 잔차 신호 (224) 의 대응하는 서브-프레임들보다 더 낮거나 더 높은 에너지 레벨들을 갖는, 고조파 확장된 신호 (208) 의 특정 서브-프레임들을 식별할 수도 있다. 제 1 이득 형상 추정기 (190) 는 또한, 코딩 모드에 기초하여 고조파 확장된 신호 (208) 의 각각의 특정 서브-프레임에 제공할 에너지의 스케일링 양을 결정할 수도 있다. 에너지의 스케일링은 고대역 잔차 신호 (224) 의 대응하는 서브-프레임들과 비교하여 더 낮거나 더 높은 에너지 레벨들을 갖는 고조파 확장된 신호 (208) 의 서브-프레임 레벨로 수행될 수도 있다. 예를 들어, 코딩 모드가 제 1 메트릭 (예컨대, 보이싱된 프레임) 을 갖는다는 결정에 응답하여, 고조파 확장된 신호 (208) 의 특정 서브-프레임은
Figure 112017051774758-pct00001
의 인자에 의해 스케일링될 수도 있고, 여기서
Figure 112017051774758-pct00002
는 고조파 확장된 신호 (208) 의 특정 서브-프레임의 에너지 레벨에 대응하고,
Figure 112017051774758-pct00003
는 고대역 잔차 신호 (224) 의 대응하는 서브-프레임의 에너지 레벨에 대응한다. 대안적으로, 코딩 모드가 제 2 메트릭 (예컨대, 보이싱되지 않은 프레임) 을 갖는다는 결정에 응답하여, 고조파 확장된 신호 (208) 의 특정 서브-프레임은
Figure 112017051774758-pct00004
Figure 112017051774758-pct00005
의 인자에 의해 스케일링될 수도 있다. 제 1 이득 형상 파라미터들 (242) 은 에너지 스케일링을 요구하는 고조파 확장된 신호 (208) 의 각각의 서브-프레임을 식별할 수도 있고, 개별 서브-프레임들에 대하여 계산된 에너지 스케일링 인자를 식별할 수도 있다. 제 1 이득 형상 파라미터들 (242) 은 도 1 의 제 1 이득 형상 조정기 (192) 및 멀티플렉서 (180) 에 고대역 사이드 정보 (172) 로서 제공될 수도 있다.
제 1 이득 형상 조정기 (192) 는 조정된 고조파 확장된 신호 (244) 를 생성하기 위해, 제 1 이득 형상 파라미터들 (242) 에 기초하여 고조파 확장된 신호 (208) 를 조정하도록 구성될 수도 있다. 예를 들어, 제 1 이득 형상 조정기 (192) 는 조정된 고조파 확장된 신호 (244) 를 생성하기 위해, 계산된 에너지 스케일링에 따라 고조파 확장된 신호 (208) 의 식별된 서브-프레임들을 스케일링할 수도 있다. 조정된 고조파 확장된 신호 (244) 는 스케일링 동작을 수행하기 위해 엔벨로프 추적기 (202) 에 및 제 1 결합기 (254) 에 제공될 수도 있다.
엔벨로프 추적기 (202) 는 조정된 고조파 확장된 신호 (244) 를 수신하고, 조정된 고조파 확장된 신호 (244) 에 대응하는 저대역 시간 도메인 엔벨로프 (203) 를 계산하도록 구성될 수도 있다. 예를 들어, 엔벨로프 추적기 (202) 는 제곱된 값들의 시퀀스를 생성하기 위해, 조정된 고조파 확장된 신호 (244) 의 프레임의 각 샘플의 제곱을 계산하도록 구성될 수도 있다. 엔벨로프 추적기 (202) 는 예컨대, 제곱된 값들의 시퀀스에 1차 무한 임펄스 응답 (IIR) 저역 통과 필터를 적용함으로써, 제곱된 값들의 시퀀스에 평활화 동작을 수행하도록 구성될 수도 있다. 엔벨로프 추적기 (202) 는 저대역 시간 도메인 엔벨로프 (203) 를 생성하기 위해 평활화된 시퀀스의 각 샘플에 제곱근 함수를 적용하도록 구성될 수도 있다. 엔벨로프 추적기 (202) 는 또한, 제곱 연산 대신 절대값 연산을 사용할 수도 있다. 저대역 시간 도메인 엔벨로프 (203) 는 잡음 결합기 (240) 에 제공될 수도 있다.
잡음 결합기 (240) 는 변조된 잡음 신호 (220) 를 생성하기 위해, 저대역 시간 도메인 엔벨로프 (203) 를 백색 잡음 생성기 (비도시) 에 의해 생성된 백색 잡음 (205) 과 결합하도록 구성될 수도 있다. 예를 들어, 잡음 결합기 (240) 는 저대역 시간 도메인 엔벨로프 (203) 에 따라 백색 잡음 (205) 을 진폭 변조하도록 구성될 수도 있다. 특정 실시형태에서, 잡음 결합기 (240) 는 변조된 잡음 신호 (220) 를 생성하기 위해, 저대역 시간 도메인 엔벨로프 (203) 에 따라 백색 잡음 (205) 을 스케일링하도록 구성되는 곱셈기로서 구현될 수도 있다. 변조된 잡음 신호 (220) 는 제 2 결합기 (256) 에 제공될 수도 있다.
제 1 결합기 (254) 는 제 1 스케일링된 신호를 생성하기 위해 믹싱 인자 (α) 에 따라 조정된 고조파 확장된 신호 (244) 를 스케일링하도록 구성되는 곱셈기로서 구현될 수도 있다. 제 2 결합기 (256) 는 제 2 스케일링된 신호를 생성하기 위해 믹싱 인자 (1-α) 에 기초하여 변조된 잡음 신호 (220) 를 스케일링하도록 구성되는 곱셈기로서 구현될 수도 있다. 예를 들어, 제 2 결합기 (256) 는 1 마이너스 믹싱 인자의 차이 (예컨대, 1-α) 에 기초하여 변조된 잡음 신호 (220) 를 스케일링할 수도 있다. 제 1 스케일링된 신호 및 제 2 스케일링된 신호는 믹서 (211) 에 제공될 수도 있다.
믹서 (211) 는 믹싱 인자 (α), 조정된 고조파 확장된 신호 (244) 및 변조된 잡음 신호 (220) 에 기초하여 고대역 여기 신호 (161) 를 생성할 수도 있다. 예를 들어, 믹서 (211) 는 고대역 여기 신호 (161) 를 생성하기 위해 제 1 스케일링된 신호와 제 2 스케일링된 신호를 결합할 수도 있다.
도 2 의 시스템 (200) 은 고조파 확장된 신호 (208) 와 고대역 잔차 신호 (224) 간에 에너지의 시간적 진화를 개선시킬 수도 있다. 예를 들어, 제 1 이득 형상 추정기 (190) 및 제 1 이득 형상 조정기 (192) 는 제 1 이득 형상 파라미터들(242) 에 기초하여 고조파 확장된 신호 (208) 를 조정할 수도 있다. 고조파 확장된 신호 (208) 는 고대역의 잔차 신호 (224) 의 에너지 레벨들을 서브-프레임 기반으로 근사화하도록 조정될 수도 있다. 고조파 확장된 신호 (208) 를 조정하는 것은 도 4 에 대하여 설명되는 것과 같은 합성 도메인에서 가청 아티팩트들을 감소시킬 수도 있다. 시스템 (200) 은 또한, 피치 변동 (pitch variance) 들에 기초하여 이득 형상 파라미터들 (242) 을 수정하기 위해 코딩 모드에 기초하여 서브-프레임들의 수를 동적으로 조정할 수도 있다. 예를 들어, 상대적으로 작은 수의 이득 형상 파라미터들 (242) (예컨대, 상대적으로 작은 수의 서브-프레임들) 은 프레임 내의 시간적 진화에서 상대적으로 낮은 변동을 갖는 보이싱되지 않은 프레임에 대하여 생성될 수도 있다. 대안적으로, 상대적으로 큰 수의 이득 형상 파라미터들 (242) 은 프레임 내에서 시간적 진화에서 상대적으로 높은 변동을 갖는 보이싱된 프레임에 대하여 생성될 수도 있다. 대안적인 실시형태들에서, 고조파 확장된 저대역의 시간적 진화를 조정하기 위해 선택된 서브-프레임들의 수는 보이싱되지 않은 프레임뿐만 아니라 보이싱된 프레임 양자에 대하여 동일할 수도 있다.
도 3 을 참조하여, 고조파 확장된 신호와 고대역 잔차 신호간의 에너지 격차들에 기초하여 이득 형상 파라미터들을 예시하기 위한 타이밍 다이어그램 (300) 이 도시된다. 타이밍 다이어그램 (300) 은 고대역 잔차 신호 (224) 의 제 1 트레이스, 고조파 확장된 신호 (208) 의 제 2 트레이스, 및 추정된 이득 형상 파라미터들 (242) 의 제 3 트레이스를 포함한다.
타이밍 다이어그램 (300) 은 고대역 잔차 신호 (224) 의 특정 프레임 및 고조파 확장된 신호 (208) 의 대응하는 프레임을 도시한다. 타이밍 다이어그램 (300) 은 제 1 타이밍 윈도우 (302), 제 2 타이밍 윈도우 (304), 제 3 타이밍 윈도우 (306), 제 4 타이밍 윈도우 (308), 제 5 타이밍 윈도우 (310), 제 6 타이밍 윈도우 (312), 및 제 7 타이밍 윈도우 (314) 를 포함한다. 각각의 타이밍 윈도우 (302 - 314) 는 개별 신호들 (224, 208) 의 서브-프레임을 나타낼 수도 있다. 7 개의 타이밍 윈도우들이 도시되지만, 다른 실시형태들에서, 추가의 (또는 더 적은) 타이밍 윈도우들이 존재할 수도 있다. 예를 들어, 특정 실시형태들에서, 각각의 개별 신호 (224, 208) 는 최저 4 개의 타이밍 윈도우들 또는 최고 16 개의 타이밍 윈도우들 (즉, 4 개의 서브-프레임들 또는 16 개의 서브-프레임들) 을 포함할 수도 있다. 타이밍 윈도우들의 수는 도 2 에 대하여 설명된 것과 같은 코딩 모드에 기초할 수도 있다.
제 1 타이밍 윈도우 (302) 에서 고대역 잔차 신호 (224) 의 에너지 레벨은 제 1 타이밍 윈도우 (302) 에서 대응하는 고조파 확장된 신호 (208) 의 에너지 레벨을 근사화할 수도 있다. 예를 들어, 제 1 이득 형상 추정기 (190) 는 제 1 타이밍 윈도우 (302) 에서 고대역 잔차 신호 (224) 의 에너지 레벨을 측정하고, 제 1 타이밍 윈도우 (302) 에서 고조파 확장된 신호 (208) 의 에너지 레벨을 측정하고, 차이를 임계치에 비교할 수도 있다. 고대역 잔차 신호 (224) 의 에너지 레벨은 그 차이가 임계치 미만일 경우, 고조파 확장된 신호 (208) 의 에너지 레벨을 근사화할 수도 있다. 따라서, 이 경우, 제 1 타이밍 윈도우 (302) 에 대한 제 1 이득 형상 파라미터 (242) 는 고조파 확장된 신호 (208) 의 대응하는 서브-프레임들에 대하여 에너지 스케일링이 요구되지 않는 것을 표시할 수도 있다. 제 3 및 제 4 타이밍 윈도우들 (306, 308) 에 대한 고대역 잔차 신호 (224) 의 에너지 레벨들은 또한, 제 3 및 제 4 타이밍 윈도우들 (306, 308) 에서 대응하는 고조파 확장된 신호 (208) 의 에너지 레벨을 근사화할 수도 있다. 따라서, 제 3 및 제 4 타이밍 윈도우들 (306, 308) 에 대한 제 1 이득 형상 파라미터들 (242) 은 또한, 고조파 확장된 신호 (208) 의 대응하는 서브-프레임들에 대하여 에너지 스케일링이 요구되지 않을 수도 있는 것을 표시할 수도 있다.
제 2 및 제 5 타이밍 윈도우 (304, 310) 에서 고대역 잔차 신호 (224) 의 에너지 레벨은 변동할 수도 있고, 제 2 및 제 5 타이밍 윈도우 (304, 310) 에서 고조파 확장된 신호 (208) 의 대응하는 에너지 레벨은 고대역 잔차 신호 (224) 에서 변동을 정확히 반영하지 않을 수도 있다. 도 1 및 도 2 의 제 1 이득 형상 추정기 (190) 는 고조파 확장된 신호 (208) 를 조정하기 위해 제 2 및 제 5 타이밍 윈도우 (304, 310) 에서 이득 형상 파라미터 (242) 를 생성할 수도 있다. 예를 들어, 제 1 이득 형상 추정기 (190) 는 제 2 및 제 5 타이밍 윈도우 (304, 310) (예컨대, 제 2 및 제 5 서브-프레임) 에서 고조파 확장된 신호 (208) 를 "스케일링" 하도록 제 1 이득 형상 조정기 (192) 에 표시할 수도 있다. 고조파 확장된 신호 (208) 가 조정되는 양은 고대역 잔차 신호 (224) 의 코딩 모드에 기초할 수도 있다. 예를 들어, 고조파 확장된 신호 (208) 는 코딩 모드가 프레임이 보이싱된 프레임인 것을 표시할 경우,
Figure 112017051774758-pct00006
의 인자에 의해 조정될 수도 있다. 대안적으로, 고조파 확장된 신호 (208) 는 코딩 모드가 프레임이 보이싱되지 않은 프레임인 것을 표시할 경우,
Figure 112017051774758-pct00007
의 인자에 의해 조정될 수도 있다.
제 6 및 제 7 타이밍 윈도우들 (312, 314) 에 대한 고대역 잔차 신호 (224) 의 에너지 레벨은, 제 6 및 제 7 타이밍 윈도우들 (312, 314) 에서 대응하는 고조파 확장된 신호 (208) 의 에너지 레벨을 근사화할 수도 있다. 따라서, 제 6 및 제 7 타이밍 윈도우들 (312, 314) 에 대한 제 1 이득 형상 파라미터들 (242) 은 고조파 확장된 신호 (208) 의 대응하는 서브-프레임들에 에너지 스케일링이 요구되지 않는 것을 표시할 수도 있다.
도 3 에 대하여 설명된 것과 같은 제 1 이득 형상 파라미터들 (242) 을 생성하는 것은, 고조파 확장된 신호 (208) 와 고대역 잔차 신호 (224) 간에 에너지의 시간적 진화를 개선시킬 수도 있다. 예를 들어, 고대역 잔차 신호 (224) 에서 에너지 변동들은 고조파 확장된 신호 (208) 를 제 1 이득 형상 파라미터들 (242) 에 기초하여 조정함으로써 고조파 확장된 신호 (208) 에서 설명될 수도 있다. 고조파 확장된 신호 (208) 를 조정하는 것은 도 4 에 대하여 설명되는 것과 같은 합성 도메인에서 가청 아티팩트들을 감소시킬 수도 있다.
도 4 를 참조하여, 합성된 고대역 신호 및 입력 오디오 신호의 고대역 부분에 기초하여 제 2 스테이지에서 제 2 이득 형상 파라미터들을 결정하도록 동작가능한 시스템 (400) 의 특정 실시형태가 도시된다. 시스템 (400) 은 선형 예측 (LP) 합성기 (402), 제 2 이득 형상 추정기 (194), 제 2 이득 형상 조정기 (196), 및 이득 프레임 추정기 (410) 를 포함할 수도 있다.
선형 예측 (LP) 합성기 (402) 는 합성된 고대역 신호 (404) 를 생성하기 위해, 고대역 여기 신호 (161) 를 수신하고 고대역 여기 신호 (161) 상에 선형 예측 합성 동작을 수행하도록 구성될 수도 있다. 합성된 고대역 신호 (404) 는 제 2 이득 형상 추정기 (194) 및 제 2 이득 형상 조정기 (196) 에 제공될 수도 있다.
제 2 이득 형상 추정기 (194) 는 합성된 고대역 신호 (404) 와 고대역 신호 (124) 에 기초하여 제 2 이득 형상 파라미터들 (406) 을 결정하도록 구성될 수도 있다. 예를 들어, 제 2 이득 형상 추정기 (194) 는 합성된 고대역 신호 (404) 의 각 서브-프레임의 에너지 레벨들을 평가하고, 고대역 신호 (124) 의 각각의 대응하는 서브-프레임의 에너지 레벨들을 평가할 수도 있다. 예를 들어, 제 2 이득 형상 파라미터들 (406) 은 고대역 신호 (124) 의 대응하는 서브-프레임들 보다 더 낮은 에너지 레벨들을 갖는 합성된 고대역 신호 (404) 의 특정 서브-프레임들을 식별할 수도 있다. 제 2 이득 형상 파라미터들 (406) 은 합성 도메인에서 결정될 수도 있다. 예를 들어, 제 2 이득 형상 파라미터들 (406) 은 여기 도메인에서의 여기 신호 (예컨대, 고조파 확장된 신호 (208)) 와 반대로, 합성된 신호 (예컨대, 합성된 고대역 신호 (404)) 를 사용하여 결정될 수도 있다. 제 2 이득 형상 파라미터들 (406) 은 제 2 이득 형상 조정기 (196) 및 멀티플렉서 (180) 에 고대역 사이드 정보 (172) 로서 제공될 수도 있다.
제 2 이득 형상 조정기 (196) 는 제 2 이득 형상 파라미터들 (406) 에 기초하여 조정된 합성된 고대역 신호 (418) 를 생성하도록 구성될 수도 있다. 예를 들어, 제 2 이득 형상 조정기 (196) 는 조정된 합성된 고대역 신호 (418) 를 생성하기 위해, 제 2 이득 형상 파라미터들 (406) 에 기초하여 합성된 고대역 신호 (404) 의 특정 서브-프레임들을 "스케일링"할 수도 있다. 제 2 이득 형상 조정기 (196) 는 도 1 및 도 2 의 제 1 이득 형상 조정기 (192) 가 제 1 이득 형상 파라미터들 (242) 에 기초하여 고조파 확장된 신호 (208) 의 특정 서브-프레임들을 조정하는 것과 유사한 방식으로, 합성된 고대역 신호 (404) 의 특정 서브-프레임들을 "스케일링"할 수도 있다. 조정된 합성된 고대역 신호 (418) 는 이득 프레임 추정기 (410) 에 제공될 수도 있다.
이득 프레임 추정기 (410) 는 조정된 합성된 고대역 신호 (404) 및 고대역 신호 (124) 에 기초하여 이득 프레임 파라미터들 (412) 을 생성할 수도 있다. 이득 프레임 파라미터들 (412) 은 고대역 사이드 정보 (172) 로서 멀티플렉서 (180) 에 제공될 수도 있다.
도 4 의 시스템 (400) 은 합성된 고대역 신호 (404) 의 에너지 레벨들과 고대역 신호 (124) 의 대응하는 에너지 레벨들에 기초하여 제 2 이득 형상 파라미터들 (406) 을 생성함으로써, 도 1 의 입력 오디오 신호 (102) 의 고대역 복원을 개선시킬 수도 있다. 제 2 이득 형상 파라미터들 (406) 은 입력 오디오 신호 (102) 의 고대역 복원 동안 가청 아티팩트들을 감소시킬 수도 있다.
도 5 를 참조하여, 이득 형상 파라미터들을 사용하여 오디오 신호를 재생하도록 동작가능한 시스템 (500) 의 특정 실시형태가 도시된다. 시스템 (500) 은 비선형 여기 생성기 (507), 제 1 이득 형상 조정기 (592), 고대역 여기 생성기 (520), 선형 예측 (LP) 합성기 (522), 및 제 2 이득 형상 조정기 (526) 를 포함한다. 특정 실시형태에서, 시스템 (500) 은 (예컨대, 무선 전화, 코덱, 또는 DSP 에서) 디코딩 시스템 또는 장치에 통합될 수도 있다. 다른 특정 실시형태들에서, 시스템 (500) 은 셋톱 박스, 뮤직 플레이어, 비디오 플레이어, 엔터테인먼트 유닛, 네비게이션 디바이스, 통신 디바이스, PDA, 고정된 위치 데이터 유닛, 또는 컴퓨터 내에 통합될 수도 있다.
비선형 여기 생성기 (507) 는 도 1 의 저대역 여기 신호 (144) 를 수신하도록 구성될 수도 있다. 예를 들어, 도 1 의 저대역 비트스트림 (142) 은 저대역 여기 신호 (144) 를 나타내는 데이터를 포함할 수도 있고, 시스템 (500) 에 비트 스트림 (199) 으로서 송신될 수도 있다. 비선형 여기 생성기 (507) 는 저대역 여기 신호 (144) 에 기초하여 고조파 확장된 신호 (508) 를 생성하도록 구성될 수도 있다. 예를 들어, 비선형 여기 생성기 (507) 는 제 2 의 고조파 확장된 신호 (508) 를 생성하기 위해, 저대역 여기 신호 (144) 의 프레임들 (또는 서브-프레임들) 에 절대값 연산 또는 제곱 연산을 수행할 수도 있다. 특정 실시형태에서, 비선형 여기 생성기 (507) 는 도 2 의 비선형 여기 생성기 (207) 와 실질적으로 유사한 방식으로 동작할 수도 있다. 제 2 의 고조파 확장된 신호 (508) 는 제 1 이득 형상 조정기 (592) 로 제공될 수도 있다.
도 2 의 제 1 이득 형상 파라미터들 (242) 과 같은 제 1 이득 형상 파라미터들은 또한, 제 1 이득 형상 조정기 (592) 에 제공될 수도 있다. 예를 들어, 도 1 의 고대역 사이드 정보 (172) 는 제 1 이득 형상 파라미터들 (242) 을 나타내는 데이터를 포함할 수도 있고, 시스템 (500) 으로 송신될 수도 있다. 제 1 이득 형상 조정기 (592) 는 제 2 의 조정된 고조파 확장된 신호 (544) 를 생성하기 위해, 제 1 이득 형상 파라미터들 (242) 에 기초하여 제 2 의 고조파 확장된 신호 (508) 를 조정하도록 구성될 수도 있다. 특정 실시형태에서, 제 1 이득 형상 조정기 (592) 는 도 1 및 도 2 의 제 1 이득 형상 조정기 (192) 와 실질적으로 유사한 방식으로 동작할 수도 있다. 제 2 의 조정된 고조파 확장된 신호 (544) 는 고대역 여기 생성기 (520) 로 제공될 수도 있다.
고대역 여기 생성기 (520) 는 제 2 의 조정된 고조파 확장된 신호 (544) 에 기초하여 제 2 고대역 여기 신호 (561) 를 생성할 수도 있다. 예를 들어, 고대역 여기 생성기 (520) 는 엔벨로프 추적기, 잡음 결합기, 제 1 결합기, 제 2 결합기, 및 믹서를 포함할 수도 있다. 특정 실시형태에서, 고대역 여기 생성기 (520) 의 컴포넌트들은, 도 2 의 엔벨로프 추적기 (202), 도 2 의 잡음 결합기 (240), 도 2 의 제 1 결합기 (254), 도 2 의 제 2 결합기 (256), 및 도 2 의 믹서 (211) 와 실질적으로 유사한 방식으로 동작할 수도 있다. 제 2 고대역 여기 신호 (561) 는 선형 예측 합성기 (522) 에 제공될 수도 있다.
선형 예측 합성기 (522) 는 제 2 의 합성된 고대역 신호 (524) 를 생성하기 위해, 제 2 의 고대역 여기 신호 (561) 를 수신하고 제 2 의 고대역 여기 신호 (561) 상에 선형 예측 합성 동작을 수행하도록 구성될 수도 있다. 특정 실시형태에서, 선형 예측 합성기 (522) 는 도 4 의 선형 예측 생성기 (402) 와 실질적으로 유사한 방식으로 동작할 수도 있다. 제 2 의 합성된 고대역 신호 (524) 는 제 2 이득 형상 조정기 (526) 에 제공될 수도 있다.
도 4 의 제 2 이득 형상 파라미터들 (406) 과 같은 제 2 이득 형상 파라미터들은 또한, 제 2 이득 형상 조정기 (526) 에 제공될 수도 있다. 예를 들어, 도 1 의 고대역 사이드 정보 (172) 는 제 2 이득 형상 파라미터들 (406) 을 나타내는 데이터를 포함할 수도 있고, 시스템 (500) 으로 송신될 수도 있다. 제 2 이득 형상 조정기 (526) 는 제 2 의 조정된 합성된 고대역 신호 (528) 를 생성하기 위해, 제 2 이득 형상 파라미터들 (406) 에 기초하여 제 2 의 합성된 고대역 신호 (524) 를 조정하도록 구성될 수도 있다. 특정 실시형태에서, 제 2 이득 형상 조정기 (526) 는 도 1 및 도 4 의 제 2 이득 형상 조정기 (196) 와 실질적으로 유사한 방식으로 동작할 수도 있다. 특정 실시형태에서, 제 2 의 조정된 합성된 고대역 신호 (528) 는 도 1 의 고대역 신호 (124) 의 재생된 버전일 수도 있다.
도 5 의 시스템 (500) 은 고대역 여기 신호 (144), 제 1 이득 형상 파라미터들 (242), 및 제 2 이득 형상 파라미터들 (406) 을 사용하여 고대역 신호 (124) 를 재생할 수도 있다. 이득 형상 파라미터들 (242, 406) 을 사용하는 것은 음성 인코더에서 검출된 에너지의 시간적 진화들에 기초하여 제 2 의 고조파 확장된 신호 (508) 및 제 2 의 합성된 고대역 신호 (524) 를 조정함으로써, 재생의 정확성을 개선시킬 수도 있다.
도 6 을 참조하여, 고대역 복원을 위해 이득 추정들을 사용하는 방법들 (600, 610) 의 특정 실시형태들의 플로우차트들이 도시된다. 제 1 방법 (600) 은 도 1 및 도 2 의 시스템들 (100 - 200) 과 도 4 의 시스템 (400) 에 의해 수행될 수도 있다. 제 2 방법 (610) 은 도 5 의 시스템 (500) 에 의해 수행될 수도 있다.
제 1 방법 (600) 은 602 에서, 음성 인코더에서, 고조파 확장된 신호에 기초하여 및/또는 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호에 기초하여 제 1 이득 형상 파라미터들을 결정하는 것을 포함한다. 예를 들어, 도 1 의 제 1 이득 형상 추정기 (190) 는 고조파 확장된 신호 (예컨대, 도 2 의 고조파 확장된 신호 (208)) 및/또는 고대역 신호 (124) 의 고대역 잔차에 기초하여 제 1 이득 형상 파라미터들 (예컨대, 도 2 의 제 1 이득 형상 파라미터들 (242)) 을 결정할 수도 있다.
방법 (600) 은 또한, 604 에서, 합성된 고대역 신호에 기초하고 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들을 결정하는 것을 포함할 수도 있다. 예를 들어, 제 2 이득 형상 추정기 (194) 는 합성된 고대역 신호 (404) 와 고대역 신호 (124) 에 기초하여 제 2 이득 형상 파라미터들 (406) 을 결정할 수도 있다.
606 에서, 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들은 오디오 신호의 인코딩된 버전 내에 삽입되어, 오디오 신호의 인코딩된 버전으로부터 오디오 신호의 재생 동안 이득 조정을 가능하게 할 수도 있다. 예를 들어, 도 1 의 고대역 사이드 정보 (172) 는 제 1 이득 형상 파라미터들 (242) 및 제 2 이득 형상 파라미터들 (406) 을 포함할 수도 있다. 멀티플렉서 (180) 는 제 1 이득 형상 파라미터들 (242) 및 제 2 이득 형상 파라미터들 (406) 을 비트 스트림 (199) 내로 삽입할 수도 있고, 그 비트 스트림 (199) 은 디코더 (예컨대, 도 5 의 시스템 (500)) 로 송신될 수도 있다. 도 5 의 제 1 이득 형상 조정기 (592) 는 제 2 의 조정된 고조파 확장된 신호 (544) 를 생성하기 위해, 제 1 이득 형상 파라미터들 (242) 에 기초하여 고조파 확장된 신호 (508) 를 조정할 수도 있다. 제 2 고대역 여기 신호 (561) 는 제 2 의 조정된 고조파 확장된 신호 (544) 에 적어도 부분적으로 기초한다. 부가적으로, 도 5 의 제 2 이득 형상 조정기 (526) 는 고대역 신호 (124) 의 버전을 재생하기 위해, 제 2 이득 형상 파라미터들 (406) 에 기초하여 합성된 고대역 신호 (524) 를 조정할 수도 있다.
제 2 방법 (610) 은 612 에서, 음성 디코더에서, 음성 인코더로부터 인코딩된 오디오 신호를 수신하는 것을 포함할 수도 있다. 인코딩된 오디오 신호는 음성 인코더에서 생성된 고조파 확장된 신호 (208) 및/또는 음성 인코더에서 생성된 고대역 잔차 신호 (224) 에 기초하는 제 1 이득 형상 파라미터들 (242) 을 포함할 수도 있다. 인코딩된 오디오 신호는 또한, 합성된 고대역 신호 (404) 및 고대역 신호 (124) 에 기초하는 제 2 이득 형상 파라미터들 (406) 을 포함할 수도 있다.
614 에서, 오디오 신호는 제 1 이득 형상 파라미터들에 기초하고 제 2 이득 형상 파라미터들에 기초하여 인코딩된 오디오 신호로부터 재생될 수도 있다. 예를 들어, 도 5 의 제 1 이득 형상 조정기 (592) 는 제 2 의 조정된 고조파 확장된 신호 (544) 를 생성하기 위해, 제 1 이득 형상 파라미터들 (242) 에 기초하여 고조파 확장된 신호 (508) 를 조정할 수도 있다. 도 5 의 고대역 여기 생성기 (520) 는 제 2 의 조정된 고조파 확장된 신호 (544) 에 기초하여 제 2 고대역 여기 신호 (561) 를 생성할 수도 있다. 선형 예측 합성기 (522) 는 제 2 의 합성된 고대역 신호 (524) 를 생성하기 위해, 제 2 의 고대역 여기 신호 (561) 에 선형 예측 합성 동작을 수행할 수도 있고, 제 2 이득 형상 조정기 (526) 는 제 2 의 조정된 합성된 고대역 신호 (528) (예컨대, 재생된 오디오 신호) 를 생성하기 위해, 제 2 이득 형상 파라미터들 (406) 에 기초하여 제 2 의 합성된 고대역 신호 (524) 를 조정할 수도 있다.
도 6 의 방법들 (600, 610) 은 오디오 신호 (102) 의 고조파 확장된 저대역 여기와 입력 오디오 신호 (102) 의 고대역 잔차 간에 프레임별 에너지 상관을 개선시킬 수도 있다 (예컨대, 시간적 진화를 개선시킬 수도 있다). 예를 들어, 제 1 이득 스테이지 동안, 제 1 이득 형상 추정기 (190) 및 제 1 이득 형상 조정기 (192) 는 고대역의 잔차에 기초하여 고조파 확장된 저대역 여기를 모델링하기 위해, 제 1 이득 파라미터들에 기초하여 고조파 확장된 저대역 여기를 조정할 수도 있다. 방법들 (600, 610) 은 또한, 고대역 신호 (124) 와 고대역 신호 (124) 의 합성된 버전 간의 프레임별 에너지 상관을 개선시킬 수도 있다. 예를 들어, 제 2 이득 스테이지 동안, 제 2 이득 형상 추정기 (194) 와 제 2 이득 형상 조정기 (196) 는 고대역 신호 (124) 에 기초하여 고대역 신호 (124) 의 확장된 버전을 모델링하기 위해, 제 2 이득 파라미터들에 기초하여 고대역 신호 (124) 의 합성된 버전을 조정할 수도 있다.
특정 실시형태들에서, 도 6 의 방법들 (600, 610) 은 중앙 프로세싱 유닛 (CPU), 디지털 신호 프로세서 (DSP), 또는 제어기와 같은 프로세싱 유닛의 하드웨어 (예컨대, FPGA 디바이스, ASIC, 등등) 를 통해, 펌웨어 디바이스를 통해, 또는 이들의 임의의 조합으로 구현될 수도 있다. 일 예로서, 도 6 의 방법들 (600, 610) 은 도 7 과 관련하여 설명된 것과 같이, 명령들을 실행하는 프로세서에 의해 수행될 수 있다.
도 7 을 참조하여, 무선 통신 디바이스의 특정 예시적인 실시형태의 블록 다이어그램이 도시되고, 일반적으로 700 으로 지정된다. 디바이스 (700) 는 메모리 (732) 에 커플링된 프로세서 (710) (예컨대, CPU) 를 포함한다. 메모리 (732) 는 프로세서 (710) 및/또는 코덱 (734) 에 의해, 도 6 의 방법들 (600, 610) 과 같이 본원에 개시된 방법들 및 프로세스들을 수행하도록 실행가능한 명령들 (760) 을 포함할 수도 있다.
특정 실시형태에서, 코덱 (734) 은 2-스테이지 이득 추정 시스템 (782) 및 2-스테이지 이득 조정 시스템 (784) 을 포함할 수도 있다. 특정 실시형태에서, 2-스테이지 이득 추정 시스템 (782) 은 도 1 의 시스템 (100) 의 하나 이상의 컴포넌트들, 도 2 의 시스템 (200) 의 하나 이상의 컴포넌트들, 및/또는 도 4 의 시스템 (400) 의 하나 이상의 컴포넌트들을 포함한다. 예를 들어, 2-스테이지 이득 추정 시스템 (782) 은 도 2 의 시스템들 (100 - 200), 도 4 의 시스템 (400), 및 도 6 의 방법 (600) 과 연관된 인코딩 동작들을 수행할 수도 있다. 특정 실시형태에서, 2-스테이지 이득 조정 시스템 (784) 은 도 5 의 시스템 (500) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 예를 들어, 2-스테이지 이득 조정 시스템 (784) 은 도 5 의 시스템 (500) 및 도 6 의 방법 (610) 과 연관된 디코딩 동작들을 수행할 수도 있다. 2-스테이지 이득 추정 시스템 (782) 및/또는 2-스테이지 이득 조정 시스템 (784) 은 전용 하드웨어 (예컨대, 회로) 를 통해, 하나 이상의 작업들을 수행하기 위한 명령들을 실행하는 프로세서에 의해, 또는 이들의 조합으로 구현될 수도 있다.
일 예로서, 메모리 (732) 또는 코덱 (734) 에서의 메모리 (790) 는 랜덤 액세스 메모리 (RAM), 자기저항성 랜덤 액세스 메모리 (MRAM), 스핀-토크 전달 MRAM (STT-MRAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거가능한 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈가능 디스크, 컴팩트 디스크 판독 전용 메모리 (CD-ROM) 와 같은 메모리 디바이스일 수도 있다. 메모리 디바이스는 컴퓨터 (예컨대, 코덱 (734) 에서의 프로세서 및/또는 프로세서 (710)) 에 의해 실행될 경우, 컴퓨터로 하여금 도 6 의 방법들 (600, 610) 중 하나의 적어도 일부를 수행하게 할 수도 있는 명령들 (예컨대, 명령들 (760) 또는 명령들 (795)) 을 포함할 수도 있다. 일 예로서, 메모리 (732) 또는 코덱 (734) 에서의 메모리 (790) 는 컴퓨터 (예컨대, 코덱 (734) 에서의 프로세서 및/또는 프로세서 (710)) 에 의해 실행될 경우, 컴퓨터로 하여금 도 6 의 방법들 (600, 610) 중 하나의 적어도 일부를 수행하게 하는 명령들 (예컨대, 각각 명령들 (760) 또는 명령들 (795)) 을 포함하는 비-일시적 컴퓨터 판독가능 매체일 수도 있다.
디바이스 (700) 는 또한, 코덱 (734) 및 프로세서 (710) 에 커플링된 DSP (796) 을 포함할 수도 있다. 특정 실시형태에서, DSP (796) 는 2-스테이지 이득 추정 시스템 (797) 및 2-스테이지 이득 조정 시스템 (798) 을 포함할 수도 있다. 2-스테이지 이득 추정 시스템 (797) 은 도 1 의 시스템 (100) 의 하나 이상의 컴포넌트들, 도 2 의 시스템 (200) 의 하나 이상의 컴포넌트들, 및/또는 도 4 의 시스템 (400) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 예를 들어, 2-스테이지 이득 추정 시스템 (797) 은 도 2 의 시스템들 (100 - 200), 도 4 의 시스템 (400), 및 도 6 의 방법 (600) 과 연관된 인코딩 동작들을 수행할 수도 있다. 2-스테이지 이득 조정 시스템 (798) 은 도 5 의 시스템 (500) 의 하나 이상의 컴포넌트들을 포함할 수도 있다. 예를 들어, 2-스테이지 이득 조정 시스템 (798) 은 도 5 의 시스템 (500) 및 도 6 의 방법 (610) 과 연관된 디코딩 동작들을 수행할 수도 있다. 2-스테이지 이득 추정 시스템 (797) 및/또는 2-스테이지 이득 조정 시스템 (798) 은 전용 하드웨어 (예컨대, 회로) 를 통해, 하나 이상의 작업들을 수행하기 위한 명령들을 실행하는 프로세서에 의해, 또는 이들의 조합으로 구현될 수도 있다.
도 7 은 또한, 프로세서 (710) 및 디스플레이 (728) 에 커플링된 디스플레이 제어기 (726) 를 도시한다. 코덱 (734) 은 도시된 것과 같이, 프로세서 (710) 에 커플링될 수도 있다. 스피커 (736) 및 마이크로폰 (738) 은 코덱 (734) 에 커플링될 수 있다. 예를 들어, 마이크로폰 (738) 은 도 1 의 입력 오디오 신호 (102) 를 생성할 수도 있고, 코덱 (734) 은 입력 오디오 신호 (102) 에 기초하여 수신기로의 송신을 위해 출력 비트 스트림 (199) 을 생성할 수도 있다. 다른 예로서, 스피커 (736) 는 도 1 의 출력 비트 스트림 (199) 으로부터 코덱 (734) 에 의해 복원된 신호를 출력하는데 사용될 수도 있고, 여기서 출력 비트 스트림 (199) 은 송신기로부터 수신된다. 도 7 은 또한, 무선 제어기 (740) 가 프로세서 (710) 에 그리고 무선 안테나 (742) 에 커플링될 수 있는 것을 표시한다.
특정 실시형태에 있어서, 프로세서 (710), 디스플레이 제어기 (726), 메모리 (732), CODEC (734), DSP (796), 및 무선 제어기 (740) 가 시스템-인-패키지 또는 시스템-온-칩 디바이스 (예컨대, 이동국 모뎀 (MSM)) (722) 에 포함된다. 특정 실시형태에 있어서, 터치스크린 및/또는 키패드와 같은 입력 디바이스 (730) 및 전력 공급부 (744) 가 시스템-온-칩 디바이스 (722) 에 커플링된다. 더욱이, 특정 실시형태에 있어서, 도 7 에 도시된 바와 같이, 디스플레이 (728), 입력 디바이스 (730), 스피커 (736), 마이크로폰 (738), 안테나 (742), 및 전력 공급부 (744) 가 시스템-온-칩 디바이스 (722) 외부에 있다. 하지만, 디스플레이 (728), 입력 디바이스 (730), 스피커 (736), 마이크로폰 (738), 안테나 (742), 및 전력 공급부 (744) 각각은 인터페이스 또는 제어기와 같은 시스템-온-칩 디바이스 (722) 의 컴포넌트에 커플링될 수 있다.
설명된 실시형태들과 함께, 제 1 장치가 개시되고, 고조파 확장된 신호에 기초하여 및/또는 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호에 기초하여 제 1 이득 형상 파라미터들을 결정하는 수단을 포함한다. 예를 들어, 제 1 이득 형상 파라미터들을 결정하는 수단은, 도 1 및 도 2 의 제 1 이득 형상 추정기 (190), 도 2 의 프레임 식별 모듈 (214), 도 7 의 2-스테이지 이득 추정 시스템 (782), 도 7 의 2-스테이지 이득 추정 시스템 (797), 제 1 이득 형상 파라미터들을 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 비-일시적 컴퓨터 판독가능 저장 매체에서 명령들을 실행중인 프로세서), 또는 이들의 임의의 조합을 포함할 수도 있다.
제 1 장치는 또한, 합성된 고대역 신호에 기초하고 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들을 결정하는 수단을 포함할 수도 있다. 예를 들어, 제 2 이득 형상 파라미터들을 결정하는 수단은, 도 1 및 도 4 의 제 2 이득 형상 추정기 (194), 도 7 의 2-스테이지 이득 추정 시스템 (782), 도 7 의 2-스테이지 이득 추정 시스템 (797), 제 2 이득 형상 파라미터들을 결정하도록 구성된 하나 이상의 디바이스들 (예컨대, 비-일시적 컴퓨터 판독가능 저장 매체에서 명령들을 실행중인 프로세서), 또는 이들의 임의의 조합을 포함할 수도 있다.
제 1 장치는 또한, 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들을 오디오 신호의 인코딩된 버전 내에 삽입하여, 오디오 신호의 인코딩된 버전으로부터 오디오 신호의 재생 동안 이득 조정을 가능하게 하는 수단을 포함할 수도 있다. 예를 들어, 제 1 이득 형상 파라미터들 및 제 2 이득 형상 파라미터들을 오디오 신호의 인코딩된 버전 내에 삽입하는 수단은, 도 1 의 멀티플렉서 (180), 도 7 의 2-스테이지 이득 추정 시스템 (782), 도 7 의 2-스테이지 이득 추정 시스템 (797), 제 1 이득 파라미터들을 오디오 신호의 인코딩된 버전 내에 삽입하도록 구성된 하나 이상의 디바이스들 (예컨대, 비-일시적 컴퓨터 판독가능 저장 매체에서 명령들을 실행중인 프로세서), 또는 이들의 임의의 조합을 포함할 수도 있다.
설명된 실시형태들과 함께, 제 2 장치가 개시되며, 음성 인코더로부터 인코딩된 오디오 신호를 수신하는 수단을 포함한다. 인코딩된 오디오 신호는 음성 인코더에서 생성된 제 1 고조파 확장된 신호에 기초하는 및 음성 인코더에서 생성된 고대역 잔차 신호에 기초하는 제 1 이득 형상 파라미터들을 포함한다. 인코딩된 오디오 신호는 또한, 음성 인코더에서 생성된 제 1 합성된 고대역 신호에 기초하는 및 오디오 신호의 고대역에 기초하는 제 2 이득 형상 파라미터들을 포함한다. 예를 들어, 인코딩된 오디오 신호를 수신하는 수단은, 도 5 의 비선형 여기 생성기 (507), 도 5 의 제 1 이득 형상 추정기 (592), 도 5 의 제 2 이득 형상 추정기 (526), 도 7 의 2-스테이지 이득 조정 시스템 (784), 도 7 의 2-스테이지 이득 조정 시스템 (798), 인코딩된 오디오 신호를 수신하도록 구성된 하나 이상의 디바이스들 (예컨대, 비-일시적 컴퓨터 판독가능 저장 매체에서 명령들을 실행중인 프로세서), 또는 이들의 임의의 조합을 포함할 수도 있다.
제 2 장치는 또한, 제 1 이득 형상 파라미터들에 기초하고 제 2 이득 형상 파라미터들에 기초하여 인코딩된 오디오 신호로부터 오디오 신호를 재생하는 수단을 포함할 수도 있다. 예를 들어, 오디오 신호를 재생하는 수단은, 도 5 의 비선형 여기 생성기 (507), 도 5 의 제 1 이득 형상 추정기 (592), 도 5 의 고대역 여기 생성기 (520), 도 5 의 선형 예측 계수 합성기 (522), 도 5 의 제 2 이득 형상 추정기 (526), 도 7 의 2-스테이지 이득 조정 시스템 (784), 도 7 의 2-스테이지 이득 조정 시스템 (798), 오디오 신호를 재생하도록 구성된 하나 이상의 디바이스들 (예컨대, 비-일시적 컴퓨터 판독가능 저장 매체에서 명령들을 실행중인 프로세서), 또는 이들의 임의의 조합을 포함할 수도 있다.
당업자는 본원에 개시된 실시형태들과 관련하여 설명된 다양한 예시적인 논리 블록들, 구성들, 모듈들, 회로들, 및 알고리즘 단계들이 전자 하드웨어, 하드웨어 프로세서와 같은 프로세싱 디바이스에 의해 실행되는 컴퓨터 소프트웨어, 또는 이들 양자의 조합들로서 구현될 수도 있음을 추가로 인식할 것이다. 다양한 예시적인 컴포넌트들, 블록들, 구성들, 모듈들, 회로들 및 단계들이 일반적으로 그들의 기능의 관점에서 상기 기술되었다. 그러한 기능이 하드웨어로 구현되는지 또는 실행가능한 소프트웨어로 구현되는지의 여부는 특정 애플리케이션 및 전체 시스템에 부과되는 설계 제약들에 따라 달라진다. 당업자는 설명된 기능을 각각의 특정 어플리케이션에 대하여 다양한 방식으로 구현할 수도 있지만, 그러한 구현의 결정들이 본 개시의 범위로부터의 일탈을 야기하는 것으로서 해석되지는 않아야 한다.
본 명세서에 개시된 실시형태들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어에서, 프로세서에 의해 실행되는 소프트웨어 모듈에서, 또는 이들 양자의 조합에서 직접 구현될 수도 있다. 소프트웨어 모듈은 랜덤 액세스 메모리 (RAM), 자기저항성 랜덤 액세스 메모리 (MRAM), 스핀-토크 전달 MRAM (STT-MRAM), 플래시 메모리, 판독 전용 메모리 (ROM), 프로그래밍가능 판독 전용 메모리 (PROM), 소거가능한 프로그래밍가능 판독 전용 메모리 (EPROM), 전기적으로 소거가능한 프로그래밍가능 판독 전용 메모리 (EEPROM), 레지스터들, 하드 디스크, 착탈가능 디스크, 컴팩트 디스크 판독 전용 메모리 (CD-ROM) 와 같은 메모리 디바이스에 상주할 수도 있다. 예시적인 메모리 디바이스는 프로세서에 커플링되어, 프로세서가 메모리 디바이스로부터 정보를 판독하거나 메모리 디바이스에 정보를 기록할 수 있게 한다. 대안에서, 메모리 디바이스는 프로세서에 통합될 수도 있다. 프로세서 및 저장 매체는 ASIC 에 상주할 수도 있다. ASIC 는 컴퓨팅 디바이스 또는 사용자 단말기에 상주할 수도 있다. 대안적으로, 프로세서 및 저장 매체는 컴퓨팅 디바이스 또는 사용자 단말기에 별개의 컴포넌트들로서 상주할 수도 있다.
개시된 실시형태들의 상기 설명은 당업자로 하여금 개시된 실시형태들을 제조 또는 이용할 수 있도록 제공된다. 이들 실시형태들에 대한 다양한 수정들은 당업자에게 용이하게 자명할 것이며, 본 명세서에서 정의된 원리들은 본 개시의 범위로부터 일탈함없이 다른 실시형태들에 적용될 수도 있다. 따라서, 본 개시는 본 명세서에서 설명된 실시형태들로 한정되도록 의도되지 않으며, 다음의 청구항들에 의해 정의된 바와 같은 원리들 및 신규한 특징들과 부합하는 가능한 최광의 범위를 부여받아야 한다.

Claims (30)

  1. 음성 인코더에서, 고조파 확장된 신호의 제 1 복수의 서브-프레임들의 에너지 레벨들에 적어도 부분적으로 기초하거나, 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호의 제 2 복수의 서브-프레임들의 에너지 레벨들에 적어도 부분적으로 기초하거나, 또는 그 임의의 조합으로 제 1 이득 형상 파라미터들의 제 1 결정을 수행하는 단계;
    상기 제 1 이득 형상 파라미터들에 적어도 부분적으로 기초하여 고대역 여기 신호를 생성하는 단계;
    상기 고대역 여기 신호에 기초하여 합성된 고대역 신호를 생성하는 단계;
    상기 합성된 고대역 신호에 기초하고 상기 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들의 제 2 결정을 수행하는 단계; 및
    상기 제 1 이득 형상 파라미터들 및 상기 제 2 이득 형상 파라미터들을 상기 오디오 신호의 인코딩된 버전 내에 삽입하는 단계를 포함하는, 방법.
  2. 제 1 항에 있어서,
    상기 제 1 결정은 제 1 이득 형상 추정기 스테이지에서 수행되고, 상기 제 2 결정은 제 2 이득 형상 추정기 스테이지에서 수행되고, 상기 제 2 이득 형상 추정기 스테이지는 상기 제 1 이득 형상 추정기 스테이지와 상이한, 방법.
  3. 제 1 항에 있어서,
    상기 제 1 결정, 상기 제 2 결정, 및 상기 삽입하는 단계는 모바일 통신 디바이스를 포함하는 디바이스에서 수행되는, 방법.
  4. 제 1 항에 있어서,
    상기 제 1 이득 형상 파라미터들은 선형 예측 잔차 도메인에서 결정되고, 상기 제 2 이득 형상 파라미터들은 선형 예측 합성 도메인에서 결정되고, 상기 고조파 확장된 신호는 비선형 고조파 확장을 통해 상기 오디오 신호의 저대역 부분으로부터 생성되는, 방법.
  5. 제 1 항에 있어서,
    수정된 고조파 확장된 신호를 생성하기 위해 상기 제 1 이득 형상 파라미터들에 기초하여 상기 고조파 확장된 신호를 조정하는 단계로서, 상기 고대역 여기 신호를 생성하는 단계는 상기 수정된 고조파 확장된 신호에 적어도 부분적으로 기초하는, 상기 고조파 확장된 신호를 조정하는 단계;
    상기 합성된 고대역 신호를 생성하기 위해 상기 고대역 여기 신호에 선형 예측 합성 동작을 수행하는 단계; 및
    상기 제 2 이득 형상 파라미터들에 기초하여 상기 합성된 고대역 신호를 조정하는 단계를 더 포함하는, 방법.
  6. 제 5 항에 있어서,
    상기 고대역 여기 신호는 상기 수정된 고조파 확장된 신호 및 변조된 잡음 신호에 기초하여 생성되는, 방법.
  7. 제 1 항에 있어서,
    상기 고조파 확장된 신호의 저대역 프레임을 샘플링하여 상기 제 1 복수의 서브-프레임들을 생성하는 단계; 또는
    상기 고대역 잔차 신호의 대응하는 고대역 프레임을 샘플링하여 상기 제 2 복수의 서브-프레임들을 생성하는 단계를 더 포함하는, 방법.
  8. 제 7 항에 있어서,
    상기 고조파 확장된 신호를 조정하는 단계는 상기 제 2 복수의 서브-프레임들의 대응하는 서브-프레임의 에너지 레벨을 근사화하기 위해, 상기 제 1 복수의 서브-프레임들의 특정 서브-프레임을 스케일링하는 단계를 포함하는, 방법.
  9. 제 7 항에 있어서,
    상기 제 2 복수의 서브-프레임들은 상기 고대역 프레임이 보이싱된 (voiced) 프레임이라는 결정에 응답하여 제 1 수의 서브-프레임들을 포함하고,
    상기 제 2 복수의 서브-프레임들은 상기 고대역 프레임이 보이싱된 프레임이 아니라는 결정에 응답하여 상기 제 1 수의 서브-프레임들 미만인 제 2 수의 서브-프레임들을 포함하는, 방법.
  10. 제 7 항에 있어서,
    상기 제 1 복수의 서브-프레임들 및 상기 제 2 복수의 서브-프레임들은 보이싱된 프레임과 보이싱되지 않은 프레임 양자에 대하여 동일한 수의 서브-프레임들을 포함하고,
    상기 제 1 복수의 서브-프레임들 및 상기 제 2 복수의 서브-프레임들은 저대역 코어 샘플 레이트가 12.8 킬로헤르츠 (kHz) 이면 4 개의 서브-프레임들을 포함하고, 상기 제 1 복수의 서브-프레임들 및 상기 제 2 복수의 서브-프레임들은 상기 저대역 코어 샘플 레이트가 16 kHz 이면 5 개의 서브-프레임들을 포함하는, 방법.
  11. 제 1 항에 있어서,
    상기 제 1 결정, 상기 제 2 결정, 및 상기 삽입하는 단계는 고정된 위치 데이터 유닛을 포함하는 디바이스에서 수행되는, 방법.
  12. 고조파 확장된 신호의 제 1 복수의 서브-프레임들의 에너지 레벨들에 적어도 부분적으로 기초하거나, 오디오 신호의 고대역 부분과 연관된 고대역 잔차 신호의 제 2 복수의 서브-프레임들의 에너지 레벨들에 적어도 부분적으로 기초하거나, 또는 그 임의의 조합으로 제 1 이득 형상 파라미터들을 결정하도록 구성된 제 1 이득 형상 추정기;
    상기 제 1 이득 형상 파라미터들에 적어도 부분적으로 기초하여 고대역 여기 신호를 생성하도록 구성된 고대역 여기 생성기;
    상기 고대역 여기 신호에 선형 예측 합성 동작을 수행하여 합성된 고대역 신호를 생성하도록 구성된 선형 예측 합성기;
    상기 합성된 고대역 신호에 기초하고 상기 오디오 신호의 고대역 부분에 기초하여 제 2 이득 형상 파라미터들을 결정하도록 구성된 제 2 이득 형상 추정기; 및
    상기 제 1 이득 형상 파라미터들 및 상기 제 2 이득 형상 파라미터들을 상기 오디오 신호의 인코딩된 버전 내에 삽입하도록 구성된 회로부를 포함하는, 장치.
  13. 제 12 항에 있어서,
    상기 제 1 이득 형상 파라미터들은 선형 예측 잔차 도메인에서 결정되고, 상기 회로부는 멀티플렉서를 포함하고, 상기 고조파 확장된 신호는 비선형 고조파 확장을 통해 상기 오디오 신호의 저대역 부분으로부터 생성되는, 장치.
  14. 제 12 항에 있어서,
    안테나; 및
    상기 안테나에 커플링되고 상기 오디오 신호를 수신하도록 구성된 수신기를 더 포함하는, 장치.
  15. 제 14 항에 있어서,
    상기 제 1 이득 형상 추정기, 상기 제 2 이득 형상 추정기, 상기 회로부, 및 상기 수신기에 커플링된 프로세서를 더 포함하며,
    상기 프로세서는 모바일 통신 디바이스 내로 통합되는, 장치.
  16. 제 14 항에 있어서,
    상기 제 1 이득 형상 추정기, 상기 제 2 이득 형상 추정기, 상기 회로부, 및 상기 수신기에 커플링된 프로세서를 더 포함하며,
    상기 프로세서는 고정된 위치 데이터 유닛 내로 통합되는, 장치.
  17. 제 12 항에 있어서,
    수정된 고조파 확장된 신호를 생성하기 위해 상기 제 1 이득 형상 파라미터들에 기초하여 상기 고조파 확장된 신호를 조정하도록 구성된 제 1 이득 형상 조정기를 더 포함하며,
    상기 제 1 이득 형상 추정기는 추가로,
    상기 고조파 확장된 신호의 저대역 프레임을 샘플링하여 상기 제 1 복수의 서브-프레임들을 생성하거나; 또는
    상기 고대역 잔차 신호의 대응하는 고대역 프레임을 샘플링하여 상기 제 2 복수의 서브-프레임들을 생성하도록
    구성되는, 장치.
  18. 제 17 항에 있어서,
    상기 제 1 복수의 서브-프레임들은 상기 고대역 프레임이 보이싱된 프레임이라는 결정에 응답하여 제 1 수의 서브-프레임들을 포함하고,
    상기 제 1 복수의 서브-프레임들은 상기 고대역 프레임이 보이싱된 프레임이 아니라는 결정에 응답하여 상기 제 1 수의 서브-프레임들 미만인 제 2 수의 서브-프레임들을 포함하는, 장치.
  19. 제 17 항에 있어서,
    상기 제 1 복수의 서브-프레임들은 상기 고대역 프레임이 보이싱된 프레임이라는 결정에 응답하여 16 개의 서브-프레임들을 포함하는, 장치.
  20. 제 17 항에 있어서,
    상기 고대역 여기 생성기는 상기 수정된 고조파 확장된 신호 및 변조된 잡음 신호에 기초하여 상기 고대역 여기 신호를 생성하도록 구성되는, 장치.
  21. 제 12 항에 있어서,
    상기 고조파 확장된 신호의 저대역 프레임에 기초하여 상기 고조파 확장된 신호를 조정하도록 구성된 제 1 이득 형상 조정기; 및
    상기 제 2 이득 형상 파라미터들에 기초하여 상기 합성된 고대역 신호를 조정하도록 구성된 제 2 이득 형상 조정기를 더 포함하는, 장치.
  22. 음성 디코더에서, 음성 인코더로부터 인코딩된 오디오 신호를 수신하는 단계로서, 상기 인코딩된 오디오 신호는,
    제 1 결정에 기초하는 제 1 이득 형상 파라미터들로서, 상기 제 1 결정은 상기 음성 인코더에서 생성된 제 1 고조파 확장된 신호의 제 1 복수의 서브-프레임들의 에너지 레벨들에 적어도 부분적으로 기초하거나, 상기 음성 인코더에서 생성된 고대역 잔차 신호의 제 2 복수의 서브프레임들의 에너지 레벨들에 적어도 부분적으로 기초하거나, 또는 그 임의의 조합인, 상기 제 1 이득 형상 파라미터들, 및
    제 2 결정에 기초하는 제 2 이득 형상 파라미터들로서, 상기 제 2 결정은 상기 음성 인코더에서 생성된 제 1 합성된 고대역 신호에 기초하고 오디오 신호의 고대역 부분에 기초하며, 상기 합성된 고대역 신호는 상기 제 1 이득 형상 파라미터들에 적어도 부분적으로 기초하는 제 1 고대역 여기 신호에 기초하는, 상기 제 2 이득 형상 파라미터들
    을 포함하는, 상기 인코딩된 오디오 신호를 수신하는 단계; 및
    상기 제 1 이득 형상 파라미터들에 기초하고 상기 제 2 이득 형상 파라미터들에 기초하여 상기 인코딩된 오디오 신호로부터 상기 오디오 신호를 재생하는 단계를 포함하는, 방법.
  23. 제 22 항에 있어서,
    상기 음성 디코더에서 상기 오디오 신호를 재생하는 단계는,
    상기 인코딩된 오디오 신호의 저대역 여기를 비선형으로 확장하는 것에 기초하여 제 2 고조파 확장된 신호를 생성하는 단계;
    상기 제 1 이득 형상 파라미터들에 기초하여 상기 제 2 고조파 확장된 신호를 조정하여 수정된 제 2 고조파 확장된 신호를 획득하는 단계;
    상기 수정된 제 2 고조파 확장된 신호에 기초하여 제 2 고대역 여기 신호를 생성하는 단계;
    상기 제 2 고대역 여기 신호에 선형 예측 합성 동작을 수행하여 제 2 합성된 고대역 신호를 생성하는 단계; 및
    상기 제 2 이득 형상 파라미터들에 기초하여 상기 제 2 합성된 고대역 신호를 조정하는 단계를 포함하는, 방법.
  24. 제 22 항에 있어서,
    상기 수신하는 단계 및 상기 재생하는 단계는 모바일 통신 디바이스를 포함하는 디바이스에서 수행되는, 방법.
  25. 제 22 항에 있어서,
    상기 수신하는 단계 및 상기 재생하는 단계는 고정된 위치 데이터 유닛을 포함하는 디바이스에서 수행되는, 방법.
  26. 음성 디코더를 포함하는 시스템으로서,
    상기 음성 디코더는,
    음성 인코더로부터 인코딩된 오디오 신호를 수신하는 것으로서, 상기 인코딩된 오디오 신호는,
    제 1 결정에 기초하는 제 1 이득 형상 파라미터들로서, 상기 제 1 결정은 상기 음성 인코더에서 생성된 제 1 고조파 확장된 신호의 제 1 복수의 서브-프레임들의 에너지 레벨들에 적어도 부분적으로 기초하거나, 상기 음성 인코더에서 생성된 고대역 잔차 신호의 제 2 복수의 서브-프레임들의 에너지 레벨들에 적어도 부분적으로 기초하거나, 또는 그 임의의 조합인, 상기 제 1 이득 형상 파라미터들, 및
    제 2 결정에 기초하는 제 2 이득 형상 파라미터들로서, 상기 제 2 결정은 상기 음성 인코더에서 생성된 제 1 합성된 고대역 신호에 기초하고 오디오 신호의 고대역 부분에 기초하며, 상기 제 1 합성된 고대역 신호는 상기 제 1 이득 형상 파라미터들에 적어도 부분적으로 기초하는 제 1 고대역 여기 신호에 기초하는, 상기 제 2 이득 형상 파라미터들
    을 포함하는, 상기 인코딩된 오디오 신호를 수신하고; 그리고
    상기 제 1 이득 형상 파라미터들에 기초하고 상기 제 2 이득 형상 파라미터들에 기초하여 상기 인코딩된 오디오 신호로부터 상기 오디오 신호를 재생하도록
    구성되는, 시스템.
  27. 제 26 항에 있어서,
    안테나; 및
    상기 안테나에 커플링되고 상기 인코딩된 오디오 신호를 수신하도록 구성된 수신기를 더 포함하는, 시스템.
  28. 제 27 항에 있어서,
    상기 수신기에 커플링된 프로세서를 더 포함하며,
    상기 프로세서 및 상기 수신기는 모바일 통신 디바이스 내로 통합되는, 시스템.
  29. 제 27 항에 있어서,
    상기 수신기에 커플링된 프로세서를 더 포함하며,
    상기 프로세서 및 상기 수신기는 고정된 위치 데이터 유닛 내로 통합되는, 시스템.
  30. 제 26 항에 있어서,
    상기 인코딩된 오디오 신호의 저대역 여기에 기초하여 제 2 고조파 확장된 신호를 생성하도록 구성된 비선형 여기 생성기;
    상기 제 1 이득 형상 파라미터들에 기초하여 상기 제 2 고조파 확장된 신호를 조정하여 수정된 제 2 고조파 확장된 신호를 획득하도록 구성된 제 1 이득 형상 조정기; 및
    상기 수정된 제 2 고조파 확장된 신호에 기초하여 제 2 고대역 여기 신호를 생성하도록 구성되는 고대역 여기 생성기를 더 포함하는, 시스템.
KR1020167011241A 2013-10-10 2014-10-08 고대역 시간 특징들의 개선된 추적을 위한 이득 형상 추정 KR101828193B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201361889434P 2013-10-10 2013-10-10
US61/889,434 2013-10-10
US14/508,486 US9620134B2 (en) 2013-10-10 2014-10-07 Gain shape estimation for improved tracking of high-band temporal characteristics
US14/508,486 2014-10-07
PCT/US2014/059753 WO2015054421A1 (en) 2013-10-10 2014-10-08 Gain shape estimation for improved tracking of high-band temporal characteristics

Publications (2)

Publication Number Publication Date
KR20160067207A KR20160067207A (ko) 2016-06-13
KR101828193B1 true KR101828193B1 (ko) 2018-02-09

Family

ID=52810401

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167011241A KR101828193B1 (ko) 2013-10-10 2014-10-08 고대역 시간 특징들의 개선된 추적을 위한 이득 형상 추정

Country Status (21)

Country Link
US (1) US9620134B2 (ko)
EP (1) EP3055860B1 (ko)
JP (1) JP6262337B2 (ko)
KR (1) KR101828193B1 (ko)
CN (1) CN105593933B (ko)
AU (1) AU2014331903B2 (ko)
CA (1) CA2925572C (ko)
CL (1) CL2016000819A1 (ko)
DK (1) DK3055860T3 (ko)
ES (1) ES2774334T3 (ko)
HK (1) HK1219344A1 (ko)
HU (1) HUE047305T2 (ko)
MX (1) MX350816B (ko)
MY (1) MY183940A (ko)
NZ (1) NZ717833A (ko)
PH (1) PH12016500470A1 (ko)
RU (1) RU2648570C2 (ko)
SA (1) SA516370898B1 (ko)
SI (1) SI3055860T1 (ko)
TW (1) TWI604440B (ko)
WO (1) WO2015054421A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
US9984699B2 (en) 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
US9659564B2 (en) * 2014-10-24 2017-05-23 Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi Speaker verification based on acoustic behavioral characteristics of the speaker
US10109284B2 (en) * 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10431231B2 (en) * 2017-06-29 2019-10-01 Qualcomm Incorporated High-band residual prediction with time-domain inter-channel bandwidth extension
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) * 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US20060282262A1 (en) * 2005-04-22 2006-12-14 Vos Koen B Systems, methods, and apparatus for gain factor attenuation
US20090192792A1 (en) 2008-01-29 2009-07-30 Samsung Electronics Co., Ltd Methods and apparatuses for encoding and decoding audio signal

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
US6233554B1 (en) * 1997-12-12 2001-05-15 Qualcomm Incorporated Audio CODEC with AGC controlled by a VOCODER
US6141638A (en) 1998-05-28 2000-10-31 Motorola, Inc. Method and apparatus for coding an information signal
US7117146B2 (en) 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
GB2342829B (en) 1998-10-13 2003-03-26 Nokia Mobile Phones Ltd Postfilter
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6449313B1 (en) 1999-04-28 2002-09-10 Lucent Technologies Inc. Shaped fixed codebook search for celp speech coding
US6704701B1 (en) 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
CA2399706C (en) 2000-02-11 2006-01-24 Comsat Corporation Background noise reduction in sinusoidal based speech coding systems
AU2001287970A1 (en) 2000-09-15 2002-03-26 Conexant Systems, Inc. Short-term enhancement in celp speech coding
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
US6766289B2 (en) 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
JP3457293B2 (ja) 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
US6993207B1 (en) 2001-10-05 2006-01-31 Micron Technology, Inc. Method and apparatus for electronic image processing
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7047188B2 (en) 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7788091B2 (en) 2004-09-22 2010-08-31 Texas Instruments Incorporated Methods, devices and systems for improved pitch enhancement and autocorrelation in voice codecs
JP2006197391A (ja) 2005-01-14 2006-07-27 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
AU2006232364B2 (en) * 2005-04-01 2010-11-25 Qualcomm Incorporated Systems, methods, and apparatus for wideband speech coding
UA92341C2 (ru) * 2005-04-01 2010-10-25 Квелкомм Инкорпорейтед Системы, способы и устройство широкополосного речевого кодирования
US8280730B2 (en) 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
DE102006022346B4 (de) 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US9009032B2 (en) 2006-11-09 2015-04-14 Broadcom Corporation Method and system for performing sample rate conversion
WO2008072671A1 (ja) 2006-12-13 2008-06-19 Panasonic Corporation 音声復号化装置およびパワ調整方法
US20080208575A1 (en) 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
EP2304723B1 (en) * 2008-07-11 2012-10-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for decoding an encoded audio signal
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
EP2502229B1 (en) 2009-11-19 2017-08-09 Telefonaktiebolaget LM Ericsson (publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
US8600737B2 (en) 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
WO2012158157A1 (en) 2011-05-16 2012-11-22 Google Inc. Method for super-wideband noise supression
CN102802112B (zh) 2011-05-24 2014-08-13 鸿富锦精密工业(深圳)有限公司 具有音频文件格式转换功能的电子装置
ES2771104T3 (es) * 2011-10-28 2020-07-06 Fraunhofer Ges Forschung Aparato de codificación y procedimiento de codificación

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US20060282262A1 (en) * 2005-04-22 2006-12-14 Vos Koen B Systems, methods, and apparatus for gain factor attenuation
US20090192792A1 (en) 2008-01-29 2009-07-30 Samsung Electronics Co., Ltd Methods and apparatuses for encoding and decoding audio signal

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
G.729-based embedded variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729. ITU-T Recommendation G.729.1. 2006.05.*

Also Published As

Publication number Publication date
JP2016539355A (ja) 2016-12-15
RU2648570C2 (ru) 2018-03-26
TW201521020A (zh) 2015-06-01
US20150106102A1 (en) 2015-04-16
ES2774334T3 (es) 2020-07-20
PH12016500470B1 (en) 2016-05-16
PH12016500470A1 (en) 2016-05-16
SA516370898B1 (ar) 2019-01-03
HK1219344A1 (zh) 2017-03-31
DK3055860T3 (da) 2020-02-03
WO2015054421A1 (en) 2015-04-16
MY183940A (en) 2021-03-17
EP3055860A1 (en) 2016-08-17
CN105593933B (zh) 2019-10-15
RU2016113271A (ru) 2017-11-15
JP6262337B2 (ja) 2018-01-17
US9620134B2 (en) 2017-04-11
MX350816B (es) 2017-09-25
EP3055860B1 (en) 2019-11-20
CL2016000819A1 (es) 2016-10-14
AU2014331903B2 (en) 2018-03-01
KR20160067207A (ko) 2016-06-13
CA2925572A1 (en) 2015-04-16
TWI604440B (zh) 2017-11-01
CN105593933A (zh) 2016-05-18
MX2016004528A (es) 2016-07-22
HUE047305T2 (hu) 2020-04-28
CA2925572C (en) 2019-05-21
SI3055860T1 (sl) 2020-03-31
NZ717833A (en) 2019-01-25

Similar Documents

Publication Publication Date Title
KR101828193B1 (ko) 고대역 시간 특징들의 개선된 추적을 위한 이득 형상 추정
AU2019203827B2 (en) Estimation of mixing factors to generate high-band excitation signal
EP3248192B1 (en) Scaling for gain shape circuitry
KR20160087827A (ko) 고대역 코딩에서의 선택적 위상 보상
AU2014331903A1 (en) Gain shape estimation for improved tracking of high-band temporal characteristics
EP3174051B1 (en) Systems and methods of performing noise modulation and gain adjustment
KR20150116880A (ko) 이득 제어를 수행하는 시스템들 및 방법들
US20150149157A1 (en) Frequency domain gain shape estimation
BR112016007914B1 (pt) Estimativa de formato de ganho para rastreamento aperfeiçoado de características temporais de banda alta

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant