KR101078625B1 - 이득 계수 제한을 위한 시스템, 방법 및 장치 - Google Patents

이득 계수 제한을 위한 시스템, 방법 및 장치 Download PDF

Info

Publication number
KR101078625B1
KR101078625B1 KR1020097001288A KR20097001288A KR101078625B1 KR 101078625 B1 KR101078625 B1 KR 101078625B1 KR 1020097001288 A KR1020097001288 A KR 1020097001288A KR 20097001288 A KR20097001288 A KR 20097001288A KR 101078625 B1 KR101078625 B1 KR 101078625B1
Authority
KR
South Korea
Prior art keywords
signal
value
index
quantization
gain
Prior art date
Application number
KR1020097001288A
Other languages
English (en)
Other versions
KR20090025349A (ko
Inventor
아난다파드마나반 에이 칸다다이
벤카테시 크리시난
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20090025349A publication Critical patent/KR20090025349A/ko
Application granted granted Critical
Publication of KR101078625B1 publication Critical patent/KR101078625B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

개시된 구성의 범위는, 음성 신호의 서브대역이 개별적으로 인코딩되는 방법을 포함하고, 여기서 제 1 서브대역의 여기는 제 2 서브대역으로부터 도출된다. 이득 계수는, 오리지널 제 1 서브대역의 엔벌로프와 합성된 제 1 서브대역의 엔벌로프 사이의 시변 관계를 나타내도록 계산된다. 이득 계수는 양자화되고, 사전-양자화된 값을 초과하는 양자화된 값은 재코딩된다.
Figure R1020097001288
이득 계수, 양자화 인덱스, 협대역 신호, 고대역 신호, 음성 인코딩, 스펙트럼 엔벌로프

Description

이득 계수 제한을 위한 시스템, 방법 및 장치{SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR LIMITING}
관련출원
본 출원은, 2006 년 7 월 31 일 출원되었으며, 발명의 명칭이 "METHOD FOR QUANTIZATION OF FRAME GAIN IN A WIDEBAND SPEECH CODER" 인 미국 가특허출원 제 60/834,658 호의 이점을 주장한다.
기술분야
본 개시물은 음성 인코딩에 관한 것이다.
배경기술
종래, 일반 전화 교환망 (PSTN) 을 통한 음성 통신은, 대역폭이 300 내지 3400 ㎑ 의 주파수 범위로 제한되었다. 셀룰러 텔레포니 및 VoIP (Voice over Internet Protocol) 와 같은 음성 통신을 위한 신규 네트워크는 동일한 대역폭 한계를 갖지 않을 수도 있고, 이러한 네트워크를 통해 광대역 주파수 범위를 포함한 음성 통신물을 송/수신하는 것이 바람직할 수도 있다. 예를 들어, 최소 50 ㎐ 및/또는 최대 7 또는 8 ㎑ 로 확장되는 오디오 주파수 범위를 지원하는 것이 바람 직할 수도 있다. 또한, 종래의 PSTN 한계 외부의 범위에서의 오디오 음성 콘텐츠를 가질 수도 있는 고품질 오디오 또는 오디오/비디오 회의와 같은 다른 애플리케이션을 지원하는 것이 바람직할 수도 있다.
음성 코더에 의해 지원되는 고주파수로의 범위의 확장은 요해도 (intelligibility) 를 개선할 수도 있다. 예를 들어, 's' 및 'f' 와 같은 마찰음을 구별하는 정보는 대부분 고주파수에 있다. 또한, 고대역 확장은 현장감과 같은 음성의 다른 품질을 개선할 수도 있다. 예를 들어, 유성 모음은 PSTN 한계보다 훨씬 상위의 스펙트럼 에너지를 가질 수도 있다.
광대역 음성 코딩에 대한 하나의 접근법은, 협대역 음성 코딩 기술 (예를 들어, 0 내지 4 ㎑ 의 범위를 인코딩하도록 구성된 기술) 을 스케일링하여 광대역 스펙트럼을 커버하는 것을 수반한다. 예를 들어, 음성 신호는 고주파수에서의 성분을 포함하도록 보다 고속으로 샘플링될 수도 있고, 협대역 코딩 기술은 보다 많은 필터 계수를 이용하여 이러한 광대역 신호를 나타내도록 재구성될 수도 있다. 그러나, CELP (Codebook Excited Linear Prediction) 와 같은 협대역 코딩 기술은 계산 집약적이고, 광대역 CELP 코더는 너무 많은 처리 사이클을 소모하여 다수의 모바일 및 다른 임베디드 애플리케이션에 있어서 실용적이지 않을 수도 있다. 또한, 이러한 기술을 이용하여 광대역 신호의 전체 스펙트럼을 원하는 품질로 인코딩하는 것은, 수락할 수 없게 대역폭에서의 큰 증가를 야기할 수도 있다. 또한, 협대역 코딩만을 지원하는 시스템으로 협대역 부분이 송신되고/되거나 이 시스템에 의해 디코딩될 수 있기 전에, 이러한 인코딩된 신호의 트랜스코딩이 요구된 다.
트랜스코딩 또는 다른 현저한 변경 없이 적어도 인코딩된 신호의 협대역 부분이 (PSTN 채널과 같은) 협대역 채널을 통해 송신될 수도 있도록 광대역 음성 코딩을 구현하는 것이 바람직할 수도 있다. 또한, 예를 들어, 유선 채널 및 무선 채널을 통한 브로드캐스팅 및 무선 셀룰러 텔레포니와 같은 애플리케이션에서 서비스될 수도 있는 사용자의 수에서의 현저한 감소를 회피하기 위해서, 광대역 코딩 효율의 확장이 바람직할 수도 있다.
광대역 음성 코딩에 대한 또다른 접근법은, 음성 신호의 협대역 부분 및 고대역 부분을 개별적인 서브대역으로서 코딩하는 것을 수반한다. 이러한 타입의 시스템에 있어서, 협대역 여기 신호와 같이 디코더에서 이미 이용가능한 정보로부터 고대역 합성 필터에 대한 여기를 도출함으로써, 증가된 효율이 실현될 수도 있다. 이러한 시스템에 있어서, 오리지널 고대역 신호의 레벨과 합성된 고대역 신호의 레벨 사이의 시변 관계를 나타내는 일련의 이득 계수를 인코딩된 신호에 포함시킴으로써, 품질이 증가할 수도 있다.
개 요
일 구성에 따른 음성 처리 방법은, (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하는 단계; 및 이 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하는 단계를 포함한다. 이 음성 처리 방법은, 제 1 인덱스에 의해 표시된 양자화 값과 이득 계수값 사이의 관계를 평가하는 단계; 및 평가의 결과에 따라, 제 2 인덱스를 양자화 값들의 순서화된 세트로 선택하는 단계를 포함한다.
또다른 구성에 따른 음성 처리 장치는, (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하도록 구성된 계산기; 및 이 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하도록 구성된 양자화기를 포함한다. 이 음성 처리 장치는, (A) 제 1 인덱스에 의해 표시된 양자화 값과 이득 계수값 사이의 관계를 평가하고, (B) 평가의 결과에 따라, 제 2 인덱스를 양자화 값들의 순서화된 세트로 선택하도록 구성된 제한기를 포함한다.
추가적인 구성에 따른 음성 처리 장치는, (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하는 수단; 및 이 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하는 수단을 포함한다. 이 음성 처리 장치는, 제 1 인덱스에 의해 표시된 양자화 값과 이득 계수값 사이의 관계를 평가하고, 평가의 결과에 따라, 제 2 인덱스를 양자화 값들의 순서화된 세트로 선택하는 수단을 포함한다.
도면의 간단한 설명
도 1a 는 광대역 음성 인코더 (A100) 의 블록도이다.
도 1b 는 광대역 음성 인코더 (A100) 의 일 구현 (A102) 의 블록도이다.
도 2a 는 광대역 음성 디코더 (B100) 의 블록도이다.
도 2b 는 광대역 음성 디코더 (B100) 의 일 구현 (B102) 의 블록도이다.
도 3a 는 필터 뱅크 (A110) 의 일 실시예에 대한 저대역 및 고대역의 대역폭 커버리지를 도시한 도면이다.
도 3b 는 필터 뱅크 (A110) 의 또다른 실시예에 대한 저대역 및 고대역의 대역폭 커버리지를 도시한 도면이다.
도 4a 는 음성 신호에 대한 로그 진폭 대 주파수의 플롯의 일 실시예를 도시한 도면이다.
도 4b 는 기본적인 선형 예측 코딩 시스템의 블록도이다.
도 5 는 협대역 인코더 (A120) 의 일 구현 (A122) 의 블록도이다.
도 6 은 협대역 디코더 (B110) 의 일 구현 (B112) 의 블록도이다.
도 7a 는 유성음의 잔여 신호에 대한 로그 진폭 대 주파수의 플롯의 일 실시예를 도시한 도면이다.
도 7b 는 유성음의 잔여 신호에 대한 로그 진폭 대 시간의 플롯의 일 실시예를 도시한 도면이다.
도 8 은 장기 예측도 수행하는 기본적인 선형 예측 코딩 시스템의 블록도이다.
도 9 는 고대역 인코더 (A200) 의 일 구현 (A202) 의 블록도이다.
도 10 은 고대역 부분을 인코딩하는 방법 (M10) 에 대한 흐름도이다.
도 11 은 이득 계산 태스크 (T200) 에 대한 흐름도이다.
도 12 는 이득 계산 태스크 (T200) 의 일 구현 (T210) 에 대한 흐름도이다.
도 13a 는 윈도우 함수 (windowing function) 를 도시한 도면이다.
도 13b 는 음성 신호의 서브프레임에 대한 도 13a 에 도시된 바와 같은 윈도우 함수의 적용을 도시한 도면이다.
도 14a 는 고대역 이득 계수 계산기 (A230) 의 일 구현 (A232) 의 블록도이다.
도 14b 는 고대역 이득 계수 계산기 (A232) 를 포함한 배열의 블록도이다.
도 15 는 고대역 이득 계수 계산기 (A232) 의 일 구현 (A234) 의 블록도이다.
도 16 은 고대역 이득 계수 계산기 (A232) 의 또다른 구현 (A236) 의 블록도이다.
도 17 은 스칼라 양자화기에 의해 수행될 수도 있는 바와 같은 1-차원 매핑의 일 실시예를 도시한 도면이다.
도 18 은 벡터 양자화기에 의해 수행되는 바와 같은 다차원 매핑의 단순한 일 실시예를 도시한 도면이다.
도 19a 는 스칼라 양자화기에 의해 수행될 수도 있는 바와 같은 1-차원 매핑의 또다른 실시예를 도시한 도면이다.
도 19b 는 상이한 크기의 양자화 영역으로의 입력 공간의 매핑의 일 실시예를 도시한 도면이다.
도 19c 는 이득 계수값 R 에 대한 양자화된 값이 오리지널 값보다 큰 실시예를 도시한 도면이다.
도 20a 는 하나의 일반적인 구현에 따른 이득 계수 제한 방법 (M100) 에 대한 흐름도이다.
도 20b 는 이득 계수 제한 방법 (M100) 의 일 구현 (M110) 에 대한 흐름도이다.
도 20c 는 이득 계수 제한 방법 (M100) 의 일 구현 (M120) 에 대한 흐름도이다.
도 20d 는 이득 계수 제한 방법 (M100) 의 일 구현 (M130) 에 대한 흐름도이다.
도 21 은 고대역 인코더 (A202) 의 일 구현 (A203) 의 블록도이다.
도 22 는 고대역 인코더 (A203) 의 일 구현 (A204) 의 블록도이다.
도 23a 는 제한기 (L10) 의 일 구현 (L12) 에 대한 동작도이다.
도 23b 는 제한기 (L10) 의 또다른 구현 (L14) 에 대한 동작도이다.
도 23c 는 제한기 (L10) 의 추가적인 구현 (L16) 에 대한 동작도이다.
도 24 는 고대역 디코더 (B200) 의 일 구현 (B202) 에 대한 블록도이다.
상세한 설명
예를 들어, 디코딩된 신호의 서브대역들 사이의 에너지 분포가 부정확한 경우, 가청 아티팩트 (audible artifact) 가 발생할 수도 있다. 이러한 아티팩트는 사용자에 대해 눈에 띄게 불쾌할 수도 있고, 그에 따라 코더의 지각 품질을 감소시킬 수도 있다.
문맥에서 명백히 제한되지 않는 한, "계산 (calculating)" 이라는 용어는, 본 명세서에서 값의 리스트로부터의 선택, 발생 및 컴퓨팅과 같이 임의의 그 보통의 의미를 나타내는데 이용된다. "포함 (comprising)" 이라는 용어가 본 상세한 설명 및 특허청구범위에서 이용되는 경우, 이 용어는 다른 엘리먼트나 동작을 배제하지는 않는다. "A 가 B 에 기초한다" 는 용어는, (ⅰ) "A 가 B 와 동등하다" 는 경우 및 (ⅱ) "A 가 적어도 B 에 기초한다" 는 경우를 포함하여 임의의 그 보통의 의미를 나타내는데 이용된다. "인터넷 프로토콜" 이라는 용어는, IETF (Internet Engineering Task Force) RFC (Request for Comments) 791 에 기재된 바와 같은 버전 4, 및 버전 6 과 같은 후속 버전을 포함한다.
도 1a 는 본 명세서에 기재된 바와 같은 방법을 수행하도록 구성될 수도 있는 광대역 음성 인코더 (A100) 의 블록도이다. 필터 뱅크 (A110) 는, 광대역 음성 신호 (S10) 를 필터링하여 협대역 신호 (S20) 및 고대역 신호 (S30) 를 생성하도록 구성된다. 협대역 인코더 (A120) 는, 협대역 신호 (S20) 를 인코딩하여 협대역 (NB) 필터 파라미터 (S40) 및 협대역 잔여 신호 (S50) 를 생성하도록 구성된다. 본 명세서에 보다 상세하게 기재된 바와 같이, 협대역 인코더 (A120) 는 통상적으로 부호록 인덱스로서 또는 또다른 양자화된 형태로 협대역 필터 파라미터 (S40) 및 인코딩된 협대역 여기 신호 (S50) 를 생성하도록 구성된다. 고대역 인코더 (A200) 는 인코딩된 협대역 여기 신호 (S50) 에서의 정보에 따라 고대역 신호 (S30) 를 인코딩하여 고대역 코딩 파라미터 (S60) 를 생성하도록 구성된다. 본 명세서에 보다 상세하게 기재된 바와 같이, 고대역 인코더 (A200) 는 통상적으로 부호록 인덱스로서 또는 또다른 양자화된 형태로 고대역 코딩 파라미터 (S60) 를 생성하도록 구성된다. 광대역 음성 인코더 (A100) 의 하나의 특정 실시예는, 약 8.55 kbps 의 레이트로 광대역 음성 신호 (S10) 를 인코딩하도록 구성되는데, 협대역 필터 파라미터 (S40) 및 인코딩된 협대역 여기 신호 (S50) 를 위해서는 약 7.55 kbps 가 이용되고, 고대역 코딩 파라미터 (S60) 를 위해서는 약 1 kbps 가 이용된다.
인코딩된 협대역 신호와 고대역 신호를 단일 비트스트림으로 결합하는 것이 바람직할 수도 있다. 예를 들어, 인코딩된 광대역 음성 신호로서, 저장을 위해 또는 (예를 들어, 유선, 광학 또는 무선 전송 채널을 통한) 송신을 위해 인코딩된 신호를 함께 다중화하는 것이 요구될 수도 있다. 도 1b 는 광대역 음성 인코더 (A100) 의 일 구현 (A102) 의 블록도이고, 이는 협대역 필터 파라미터 (S40), 인코딩된 협대역 여기 신호 (S50), 및 고대역 필터 파라미터 (S60) 를 다중화된 신호 (S70) 로 결합하도록 구성된 다중화기 (A130) 를 포함한다.
또한, 광대역 음성 인코더 (A102) 를 포함한 장치는, 유선, 광학 또는 무선 채널과 같은 전송 채널로 다중화된 신호 (S70) 를 송신하도록 구성된 회로를 포함할 수도 있다. 또한, 이러한 장치는, 에러 정정 인코딩 (예를 들어, 레이트-호 환 (rate-compatible) 콘볼루션 인코딩) 및/또는 에러 검출 인코딩 (예를 들어, 순환 잉여 인코딩), 및/또는 하나 이상의 계층의 네트워크 프로토콜 인코딩 (예를 들어, 이더넷, TCP/IP, cdma2000) 과 같이, 신호에 대해 하나 이상의 채널 인코딩 동작을 수행하도록 구성될 수도 있다.
다중화된 신호 (S70) 의 분리가능한 서브스트림으로서 (협대역 필터 파라미터 (S40) 및 인코딩된 협대역 여기 신호 (S50) 를 포함한) 인코딩된 협대역 신호를 임베디드하여 인코딩된 협대역 신호가 고대역 및/또는 저대역 신호와 같은 다중화된 신호 (S70) 의 또다른 부분에 독립적으로 복구 및 디코딩될 수도 있도록 다중화기 (A130) 가 구성되는 것이 바람직할 수도 있다. 예를 들어, 다중화된 신호 (S70) 는, 고대역 필터 파라미터 (S60) 를 제거함으로써 인코딩된 협대역 신호가 복구될 수도 있도록 배열될 수도 있다. 이러한 특징의 하나의 잠재적인 이점은, 협대역 신호의 디코딩을 지원하지만 고대역 부분의 디코딩을 지원하지는 않는 시스템으로 인코딩된 광대역 신호를 전달하기 이전에 이 인코딩된 광대역 신호의 트랜스코딩에 대한 필요성을 회피하는 것이다.
도 2a 는 광대역 음성 인코더 (A100) 에 의해 인코딩된 신호를 디코딩하는데 사용될 수도 있는 광대역 음성 디코더 (B100) 의 블록도이다. 협대역 디코더 (B110) 는 협대역 필터 파라미터 (S40) 및 인코딩된 협대역 여기 신호 (S50) 를 디코딩하여 협대역 신호 (S90) 를 생성하도록 구성된다. 고대역 디코더 (B200) 는 인코딩된 협대역 여기 신호 (S50) 에 기초한 협대역 여기 신호 (S80) 에 따라 고대역 코딩 파라미터 (S60) 를 디코딩하여 고대역 신호 (S100) 를 생성하도록 구 성된다. 이 실시예에 있어서, 협대역 디코더 (B110) 는 협대역 여기 신호 (S80) 를 고대역 디코더 (B200) 로 제공하도록 구성된다. 필터 뱅크 (B120) 는 협대역 신호 (S90) 와 고대역 신호 (S100) 를 결합하여 광대역 음성 신호 (S110) 를 생성하도록 구성된다.
도 2b 는 광대역 음성 디코더 (B100) 의 일 구현 (B102) 의 블록도이고, 이는 다중화된 신호 (S70) 로부터 인코딩된 신호 (S40, S50 및 S60) 를 생성하도록 구성된 역다중화기 (B130) 를 포함한다. 광대역 음성 디코더 (B102) 를 포함한 장치는, 유선, 광학 또는 무선 채널과 같은 전송 채널로부터 다중화된 신호 (S70) 를 수신하도록 구성된 회로를 포함할 수도 있다. 또한, 이러한 장치는, 에러 정정 디코딩 (예를 들어, 레이트-호환 콘볼루션 디코딩) 및/또는 에러 검출 디코딩 (예를 들어, 순환 잉여 디코딩), 및/또는 하나 이상의 계층의 네트워크 프로토콜 디코딩 (예를 들어, 이더넷, TCP/IP, cdma2000) 과 같이, 신호에 대해 하나 이상의 채널 디코딩 동작을 수행하도록 구성될 수도 있다.
필터 뱅크 (A110) 는 분할-대역 (split-band) 방식에 따라 입력 신호를 필터링하여 저주파수 서브대역 및 고주파수 서브대역을 생성하도록 구성된다. 특정 애플리케이션에 대한 설계 기준에 종속하여, 출력 서브대역은 동등하거나 동등하지 않은 대역폭을 가질 수도 있고, 오버랩되거나 오버랩되지 않을 수도 있다. 또한, 3 개 이상의 서브대역을 생성하는 필터 뱅크 (A110) 의 구성도 가능하다. 예를 들어, 이러한 필터 뱅크는, (50 내지 300 ㎐ 와 같은) 협대역 신호 (S20) 의 주파수 범위 아래의 주파수 범위에서의 성분을 포함하는 하나 이상의 저대역 신호 를 생성하도록 구성될 수도 있다. 또한, (14 내지 20 ㎑, 16 내지 20 ㎑, 또는 16 내지 32 ㎑ 의 범위와 같은) 고대역 신호 (S30) 의 주파수 범위 상위의 주파수 범위에서의 성분을 포함하는 하나 이상의 부가적인 고대역 신호를 생성하도록 이러한 필터 뱅크가 구성되는 것도 가능하다. 이러한 경우에, 광대역 음성 인코더 (A100) 는 이러한 신호 또는 신호들을 개별적으로 인코딩하도록 구현될 수도 있고, 다중화기 (A130) 는 (예를 들어, 분리가능한 부분으로서) 다중화된 신호 (S70) 에 부가적인 인코딩된 신호 또는 신호들을 포함하도록 구성될 수도 있다.
도 3a 및 도 3b 는 2 개의 상이한 구현 실시예에서의 광대역 음성 신호 (S10), 협대역 신호 (S20), 및 고대역 신호 (S30) 의 상대적인 대역폭을 도시한 도면이다. 이들 특정 실시예 모두에 있어서, 광대역 음성 신호 (S10) 는 (0 내지 8 ㎑ 의 범위 내의 주파수 성분을 나타내는) 16 ㎑ 의 샘플링 레이트를 갖고, 협대역 신호 (S20) 는 (0 내지 4 ㎑ 의 범위 내의 주파수 성분을 나타내는) 8 ㎑ 의 샘플링 레이트를 갖지만, 이러한 레이트 및 범위는 본 명세서에 기재된 원리에 대한 한계가 아니고, 이는 임의의 다른 샘플링 레이트 및/또는 주파수 범위에 적용될 수도 있다.
도 3a 에 도시된 실시예에 있어서, 2 개의 서브대역들 사이에 상당한 오버랩은 존재하지 않는다. 이 실시예에서와 같은 고대역 신호 (S30) 는 8 ㎑ 의 샘플링 레이트로 다운샘플링될 수도 있다. 도 3b 의 대안적인 실시예에 있어서, 3.5 내지 4 ㎑ 의 영역이 상위 서브대역 신호 및 하위 서브대역 신호에 의해 기술되도록, 상위 서브대역 및 하위 서브대역은 적절한 오버랩을 갖는다. 이 실시 예에서와 같은 고대역 신호 (S30) 는 7 ㎑ 의 샘플링 레이트로 다운샘플링될 수도 있다. 도 3b 의 실시예에서와 같이 서브대역들 사이에 오버랩을 제공하는 것은, 코딩 시스템이 오버랩 영역에 걸쳐 평활한 롤오프를 갖는 저역 통과 필터 및/또는 고역 통과 필터를 사용하는 것을 허용할 수도 있고/있거나, 오버랩 영역에서의 재생된 주파수 성분의 품질을 증가시킬 수도 있다.
전화 통신을 위한 통상적인 핸드셋에 있어서, 하나 이상의 변환기 (즉, 마이크로폰 및 이어피스 (earpiece) 또는 확성기) 에는 7 내지 8 ㎑ 의 주파수 범위에 대한 뚜렷한 응답이 없다. 도 3b 의 실시예에 있어서, 7 과 8 ㎑ 사이의 광대역 음성 신호 (S10) 의 부분은 인코딩된 신호에 포함되지 않는다. 고역 통과 필터 (130) 의 다른 특정 실시예는 3.5 내지 7.5 ㎑ 및 3.5 내지 8 ㎑ 의 통과 대역을 갖는다.
코더는, 지각적으로 오리지널 신호와 유사하지만 실질적으로 오리지널 신호와 현저하게 상이한 합성된 신호를 생성하도록 구성될 수도 있다. 예를 들어, 실질적인 고대역 잔여가 디코딩된 신호에 완전히 부재할 수도 있기 때문에, 본 명세서에 기재된 바와 같이 협대역 잔여로부터 고대역 여기를 도출하는 코더는 이러한 신호를 생성할 수도 있다. 이러한 경우에, 서브대역들 사이에 오버랩을 제공하는 것은, 하나의 대역으로부터 다른 대역으로의 보다 덜 눈에 띄는 전이 및/또는 보다 적은 가청 아티팩트를 야기할 수도 있는 저대역과 고대역의 평활한 블렌딩을 지원할 수도 있다.
필터 뱅크 (A110 및 B120) 의 저대역 경로 및 고대역 경로는, 2 개의 서브대 역의 오버랩과 완전히 관련이 없는 스펙트럼을 갖도록 구성될 수도 있다. 2 개의 서브대역의 오버랩은, 고대역 필터의 주파수 응답이 -20 dB 로 강하하는 지점으로부터, 저대역 필터의 주파수 응답이 -20 dB 로 강하하는 지점까지의 거리로서 정의된다. 필터 뱅크 (A110 및/또는 B120) 의 각종 실시예에 있어서, 이 오버랩은 약 200 ㎐ 내지 약 1 ㎑ 의 범위이다. 약 400 내지 약 600 ㎐ 의 범위는, 코딩 효율과 지각 평활성 사이의 바람직한 트레이드오프를 나타낼 수도 있다. 전술한 바와 같은 일 특정 실시예에 있어서, 이 오버랩은 약 500 ㎐ 이다.
몇몇 스테이지에서 도 3a 및 도 3b 에 도시된 바와 같이 서브대역 신호를 계산하도록 필터 뱅크 (A110 및/또는 B120) 를 구현하는 것이 바람직할 수도 있다. 필터 뱅크 (A110 및 B120) 의 특정 구현의 엘리먼트의 응답에 관한 부가적인 설명 및 도면은, 2006 년 4 월 3 일 출원되었고, 발명의 명칭이 "SYSTEMS, METHODS, AND APPARATUS FOR SPEECH SIGNAL FILTERING" 이며, Vos 등에 의한 미국특허출원인 대리인 참조번호 제 050551 호의 도 3a, 도 3b, 도 4c, 도 4d, 도 33 내지 도 39b 및 (단락 [00069] 내지 [00087] 을 포함하여) 수반하는 텍스트에서 확인될 수도 있고, 이 자료는, 참조로서 포함을 허용하는 미국 및 임의의 다른 관할권에서, 필터 뱅크 (A110 및/또는 B120) 에 관한 부가적인 개시물을 제공하려는 목적으로, 참조로서 본 명세서에 포함되어 있다.
고대역 신호 (S30) 는, 인코딩에 해로울 수도 있는 고에너지의 펄스 ("버스트") 를 포함할 수도 있다. 광대역 음성 인코더 (A100) 와 같은 음성 인코더는, (예를 들어, 고대역 인코더 (A200) 에 의한) 인코딩 이전에 고대역 신호 (S30) 를 필터링하기 위해서 (예를 들어, 2006 년 4 월 3 일 출원되었고, 발명의 명칭이 "SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND BURST SUPPRESSION" 이며, Vos 등에 의한 미국특허출원인 대리인 참조번호 제 050549 호에 기재된 바와 같은) 버스트 억제기를 포함하도록 구현될 수도 있다.
통상적으로, 협대역 인코더 (A120) 및 고대역 인코더 (A200) 각각은, (A) 필터를 기술하는 파라미터의 세트 및 (B) 입력 신호의 합성된 재생을 생성하도록 전술된 필터를 구동하는 여기 신호로서 입력 신호를 인코딩하는 소스-필터 모델에 따라 구현된다. 도 4a 는 음성 신호의 스펙트럼 엔벌로프의 일 실시예를 도시한 도면이다. 이 스펙트럼 엔벌로프를 특성화하는 피크는 성도 (vocal tract) 의 공진을 나타내고, 포먼트로 지칭된다. 대부분의 음성 코더는 필터 계수와 같은 파라미터의 세트로서 적어도 이러한 대략 스펙트럼 구조 (coarse spectral structure) 를 인코딩한다.
도 4b 는 협대역 신호 (S20) 의 스펙트럼 엔벌로프의 코딩에 적용된 바와 같은 기본적인 소스-필터 배열의 일 실시예를 도시한 도면이다. 분석 모듈은, 일 시간 주기 (통상적으로, 20 밀리초 (msec)) 에 걸쳐 음성 사운드에 대응하는 필터를 특성화하는 파라미터의 세트를 계산한다. 이들 필터 파라미터에 따라 구성된 백색화 필터 (분석 또는 예측 에러 필터로도 지칭됨) 는 스펙트럼 엔벌로프를 제거하여 스펙트럼으로 신호를 평탄화한다. 그 결과적인 백색화된 신호 (잔여로도 지칭됨) 는 보다 작은 에너지를 갖고, 그에 따라 보다 작은 변동을 가지며, 오리지널 음성 신호보다 인코딩하기가 용이하다. 또한, 잔여 신호의 코딩으로 부터 기인한 에러는 스펙트럼에 걸쳐 보다 평탄하게 확산될 수도 있다. 통상적으로, 필터 파라미터 및 잔여는 채널을 통한 효율적인 송신을 위해 양자화된다. 디코더에서, 필터 파라미터에 따라 구성된 합성 필터는, 오리지널 음성 사운드의 합성된 버전을 생성하도록 잔여에 기초한 신호에 의해 여기된다. 통상적으로, 합성 필터는 백색화 필터의 전달 함수의 역인 전달 함수를 갖도록 구성된다.
도 5 는 협대역 인코더 (A120) 의 기본적인 구현 (A122) 의 블록도이다. 이 실시예에 있어서, 선형 예측 코딩 (LPC) 분석 모듈 (210) 은 협대역 신호 (S20) 의 스펙트럼 엔벌로프를 선형 예측 (LP) 계수 (예를 들어, 올-제로 (all-zero) 필터 1/A(z) 의 계수) 의 세트로서 인코딩한다. 통상적으로, 분석 모듈은 입력 신호를 일련의 오버랩되지 않은 프레임으로서 처리하는데, 여기서 신규 계수 세트가 각 프레임에 대해 계산된다. 일반적으로, 프레임 주기는, 신호가 국부적으로 정지될 것으로 예상될 수도 있는 주기이고; 하나의 일반적인 실시예는 (8 ㎑ 의 샘플링 레이트에서의 160 개의 샘플에 등가인) 20 밀리초이다. 일 실시예에 있어서, LPC 분석 모듈 (210) 은, 10 개의 LP 필터 계수의 세트를 계산하여 각 20-밀리초 프레임의 포먼트 구조를 특성화하도록 구성된다. 또한, 입력 신호를 일련의 오버랩 프레임으로서 처리하도록 분석 모듈을 구현하는 것도 가능하다.
분석 모듈은 직접적으로 각 프레임의 샘플을 분석하도록 구성될 수도 있고, 또는 샘플이 먼저 윈도우 함수 (예를 들어, 해밍 윈도우) 에 따라 가중될 수도 있다. 또한, 분석은, 30-msec 윈도우와 같이 프레임보다 큰 윈도우에 걸쳐 수행될 수도 있다. 이 윈도우는, (예를 들어, 20-밀리초 프레임의 직전 및 직후에 5 밀리초를 포함하도록, 5-20-5 와 같이) 대칭적일 수도 있고, 또는 (예를 들어, 선행 프레임의 최종 10 밀리초를 포함하도록, 10-20 과 같이) 비대칭적일 수도 있다. 통상적으로, LPC 분석 모듈은, Levinson-Durbin 되부름 (recursion) 또는 Leroux-Gueguen 알고리즘을 이용하여 LP 필터 계수를 계산하도록 구성된다. 또다른 구현에 있어서, 분석 모듈은, LP 필터 계수의 세트 대신에 각 프레임에 대해 캡스트럼 계수 (cepstral coefficient) 의 세트를 계산하도록 구성될 수도 있다.
협대역 인코더 (A120) 의 출력 레이트는, 필터 파라미터를 양자화함으로써 재생 품질에 대해 비교적 적은 영향으로, 현저하게 감소할 수도 있다. 선형 예측 필터 계수는 효율적으로 양자화하기가 어렵고, 일반적으로 양자화 및/또는 엔트로피 인코딩을 위해 LSP (Line Spectral Pair) 또는 LSF (Line Spectral Frequency) 와 같은 또다른 표현으로 매핑된다. 도 5 의 실시예에 있어서, LP 필터 계수-대-LSF 변환 (220) 은 LP 필터 계수의 세트를 대응하는 LSF 의 세트로 변환한다. LP 필터 계수의 다른 일대일 표현은, 파코어 (parcor) 계수; LAR (Log-Area-Ratio) 값; ISP (Immittance Spectral Pair); 및 ISF (Immittance Spectral Frequency) 를 포함하는데, 이들은 GSM (Global System for Mobile Communications) AMR-WB (Adaptive Multi-rate-Wideband) 코덱에 이용된다. 통상적으로, LP 필터 계수의 세트와 대응하는 LSF 의 세트 사이의 변환은 가역적 (reversible) 이지만, 구성은, 이 변환이 에러 없이 가역적이 아닌 협대역 인코더 (A120) 의 구현도 포함한다.
양자화기 (230) 는 협대역 LSF (또는 다른 계수 표현) 의 세트를 양자화하도 록 구성되고, 협대역 인코더 (A122) 는 이 양자화의 결과를 협대역 필터 파라미터 (S40) 로서 출력하도록 구성된다. 통상적으로, 이러한 양자화기는, 입력 벡터를 테이블 또는 부호록에서의 대응하는 벡터 엔트리에 대한 인덱스로서 인코딩하는 벡터 양자화기를 포함한다.
도 9 는 고대역 인코더 (A200) 의 일 구현 (A202) 의 블록도이다. 고대역을 위해 저차 LPC 분석을 이용하는 것이 바람직할 수도 있지만, 고대역 인코더 (A202) 의 분석 모듈 (A210), LP 필터 계수-대-LSF 변환 (410) 및 양자화기 (420) 는 전술한 바와 같이 협대역 인코더 (A122) 의 대응하는 엘리먼트 (즉, 각각 LPC 분석 모듈 (210), LP 필터 계수-대-LSF 변환 (220) 및 양자화기 (230)) 의 설명에 따라 구현될 수도 있다. 이들 협대역 인코더 엘리먼트 및 고대역 인코더 엘리먼트가 상이한 시점에 동일한 구조 (예를 들어, 게이트의 어레이) 및/또는 명령들 (예를 들어, 코드의 라인) 세트를 이용하여 구현되는 것이 가능하다. 후술하는 바와 같이, 협대역 인코더 (A120) 및 고대역 인코더 (A200) 의 동작은 잔여 신호의 처리에 대해 상이하다.
또한, 도 5 에서 알 수 있는 바와 같이, 협대역 인코더 (A122) 는, 필터 계수의 세트에 따라 구성되는 백색화 필터 (260 ; 분석 또는 예측 에러 필터로도 지칭됨) 를 통해 협대역 신호 (S20) 를 통과시킴으로써 잔여 신호를 발생시킨다. 이 특정 실시예에 있어서, IIR 구현도 이용될 수도 있지만, 백색화 필터 (260) 는 FIR 필터로서 구현된다. 통상적으로, 이 잔여 신호는, 피치에 관한 장기 구조와 같이 음성 프레임의 지각적으로 중요한 정보를 포함하는데, 이는 협대역 필터 파라미터 (S40) 에는 나타나지 않는다. 양자화기 (270) 는 인코딩된 협대역 여기 신호 (S50) 로서의 출력을 위해 이 잔여 신호의 양자화된 표현을 계산하도록 구성된다. 통상적으로, 이러한 양자화기는, 입력 벡터를 테이블 또는 부호록에서의 대응하는 벡터 엔트리에 대한 인덱스로서 인코딩하는 벡터 양자화기를 포함한다. 대안적으로, 이러한 양자화기는 하나 이상의 파라미터를 송신하도록 구성될 수도 있는데, 벡터는 희소 부호록 (sparse codebook) 방법에서와 같이 스토리지로부터 취득되기보다는 디코더에서 이 하나 이상의 파라미터로부터 동적으로 발생될 수도 있다. 이러한 방법은, 대수 CELP (Codebook Excitation Linear Prediction) 와 같은 코딩 방식, 및 3GPP2 (Third Generation Partnership 2) EVRC (Enhanced Variable Rate Codec) 와 같은 코덱에 이용된다.
협대역 인코더 (A120) 가 대응하는 협대역 디코더에 이용가능한 동일한 필터 파라미터 값에 따라 인코딩된 협대역 여기 신호를 발생시키는 것이 바람직하다. 이와 같이, 결과적인 인코딩된 협대역 여기 신호는 이미 양자화 에러와 같이 이들 파라미터 값에서 비이상적인 것에 대해 어느 정도까지 설명할 수도 있다. 따라서, 디코더에서 이용가능한 동일한 계수값을 이용하여 백색화 필터를 구성하는 것이 바람직하다. 도 5 에 도시된 바와 같은 협대역 인코더 (A122) 의 기본적인 실시예에 있어서, 역양자화기 (240) 는 협대역 필터 파라미터 (S40) 를 역양자화하고, LSF-대-LP 필터 계수 변환 (250) 은 그 결과적인 값을 대응하는 LP 필터 계수의 세트에 매핑하고, 이 계수의 세트는, 양자화기 (270) 에 의해 양자화되는 잔여 신호를 발생시키도록 백색화 필터 (260) 를 구성하는데 이용된다.
협대역 인코더 (A120) 의 몇몇 구현은, 잔여 신호에 최상으로 일치하는 부호록 벡터의 세트 중 하나를 식별함으로써, 인코딩된 협대역 여기 신호 (S50) 를 계산하도록 구성된다. 그러나, 협대역 인코더 (A120) 는 또한 실제 잔여 신호를 발생시키지 않으면서 잔여 신호의 양자화된 표현을 계산하도록 구현될 수도 있다는 것이 주목된다. 예를 들어, 협대역 인코더 (A120) 는, 다수의 부호록 벡터를 이용하여 (예를 들어, 필터 파라미터의 현재의 세트에 따라) 대응하는 합성된 신호를 발생시키고, 지각적으로 가중된 도메인에서 오리지널 협대역 신호 (S20) 에 최상으로 일치하는 발생된 신호와 연관된 부호록 벡터를 선택하도록 구성될 수도 있다.
백색화 필터가 협대역 신호 (S20) 로부터 대략 스펙트럼 엔벌로프를 제거한 이후에, 특히 유성음에 대해, 상당량의 미세 고조파 구조가 남아 있을 수도 있다. 도 7a 는 모음과 같은 유성 신호에 대해 백색화 필터에 의해 생성될 수도 있는 바와 같은 잔여 신호의 일 실시예의 스펙트럼 플롯을 도시한 도면이다. 이 실시예에서 가시적인 주기적 구조는 피치에 관련되고, 동일한 스피커에 의해 울리는 상이한 유성 사운드는 상이한 포먼트 구조를 가질 수도 있지만 유사한 피치 구조를 가질 수도 있다. 도 7b 는 시간에 있어서 피치 펄스의 시퀀스를 나타내는 이러한 잔여 신호의 일 실시예의 시간-도메인 플롯을 도시한 도면이다.
협대역 인코더 (A120) 는, 협대역 신호 (S20) 의 장기 고조파 구조를 인코딩하도록 구성된 하나 이상의 모듈을 포함할 수도 있다. 도 8 에 도시된 바와 같이, 이용될 수도 있는 하나의 통상적인 CELP 패러다임은, 단기 특성 또는 대략 스 펙트럼 엔벌로프를 인코딩하는 개방-루프 LPC 분석 모듈, 및 그 다음의 미세 피치 또는 고조파 구조를 인코딩하는 폐쇄-루프 장기 예측 분석 스테이지를 포함한다. 단기 특성은 필터 계수로서 인코딩되고, 장기 특성은 피치 래그 (pitch lag) 및 피치 이득과 같은 파라미터에 대한 값으로서 인코딩된다. 예를 들어, 협대역 인코더 (A120) 는, 하나 이상의 부호록 인덱스 (예를 들어, 고정형 부호록 인덱스 및 적응형 부호록 인덱스) 및 대응하는 이득값을 포함하는 형태로 인코딩된 협대역 여기 신호 (S50) 를 출력하도록 구성될 수도 있다. (예를 들어, 양자화기 (270) 에 의한) 협대역 잔여 신호의 이러한 양자화된 표현의 계산은, 이러한 인덱스를 선택하는 것, 및 이러한 값을 계산하는 것을 포함할 수도 있다. 또한, 피치 구조를 인코딩하는 것은, 피치 프로토타입 파형의 보간을 포함할 수도 있는데, 이 동작은 연속적인 피치 펄스들 사이의 차이를 계산하는 것을 포함할 수도 있다. 장기 구조의 모델링은 무성 음성에 대응하는 프레임에 대해 가능하지 않을 수도 있는데, 이 무성 음성은 통상적으로 잡음과 같고, 비구조적이다.
도 6 은 협대역 디코더 (B110) 의 일 구현 (B112) 의 블록도이다. (예를 들어, 협대역 인코더 (A122) 의 역양자화기 (240) 및 LSF-대-LP 필터 계수 변환 (250) 과 관련하여 전술한 바와 같이) 역양자화기 (310) 는 협대역 필터 파라미터 (S40) 를 (이 경우, LSF 의 세트에 대해) 역양자화하고, LSF-대-LP 필터 계수 변환 (320) 은 LSF 를 필터 계수의 세트로 변환한다. 역양자화기 (340) 는 인코딩된 협대역 여기 신호 (S50) 를 역양자화하여 협대역 여기 신호 (S80) 를 생성한다. 필터 계수 및 협대역 여기 신호 (S80) 에 기초하여, 협대역 합성 필터 (330) 는 협대역 신호 (S90) 를 합성한다. 다시 말하면, 협대역 합성 필터 (330) 는, 역양자화된 필터 계수에 따라 협대역 여기 신호 (S80) 를 스펙트럼으로 정형하여, 협대역 신호 (S90) 를 생성하도록 구성된다. 또한, 협대역 디코더 (B112) 는 협대역 여기 신호 (S80) 를 고대역 인코더 (A200) 로 제공하는데, 이 고대역 인코더는 본 명세서에 기재된 바와 같이 이 협대역 여기 신호를 이용하여 고대역 여기 신호 (S120) 를 도출한다. 후술하는 바와 같은 몇몇 구현에 있어서, 협대역 디코더 (B110) 는, 스펙트럼 틸트, 피치 이득과 래그, 및 음성 모드와 같이 협대역 신호에 관한 부가적인 정보를 고대역 디코더 (B200) 로 제공하도록 구성될 수도 있다.
협대역 인코더 (A122) 및 협대역 디코더 (B112) 의 시스템은 합성에 의한 분석 (analysis-by-synthesis) 음성 코덱의 기본적인 실시예이다. 부호록 여기 선형 예측 (CELP) 코딩은 합성에 의한 분석 코딩의 하나의 대중적인 패밀리이고, 이러한 코더의 구현은, 고정형 부호록 및 적응형 부호록으로부터의 엔트리의 선택과 같은 동작, 에러 최소화 동작, 및/또는 지각적 가중 동작을 포함하여, 잔여의 파형 인코딩을 수행할 수도 있다. 합성에 의한 분석 코딩의 다른 구현은, MELP (Mixed Excitation Linear Prediction), ACELP (Algebraic CELP), RCELP (Relaxation CELP), RPE (Regular Pulse Excitation), MPE (Multi-Pulse CELP), 및 VSELP (Vector-Sum Excited Linear Prediction) 코딩을 포함한다. 관련 코딩 방법은, MBE (Multi-band Excitation) 및 PWI (Prototype Waveform Interpolation) 코딩을 포함한다. 표준화된 합성에 의한 분석 음성 코덱의 예로는, RELP (Residual Excited Linear Prediction) 를 이용하는 ETSI (European Telecommunications Standards Institute)-GSM 풀 레이트 코덱 (GSM 06.10); GSM 확장 풀 레이트 코덱 (ETSI-GSM 06.60); ITU (International Telecommunication Union) 표준 11.8 kb/s G.729 Annex E 코더; IS (Interim Standard)-136 (시분할 다중 접속 방식) 을 위한 IS-641 코덱; GSM-AMR (GSM Adaptive Multi-Rate) 코덱; 및 4GV™ (Fourth-Generation Vocoder™) 코덱 (퀄컴 인코포레이티드, 캘리포니아주의 샌디에고) 이 포함된다. 협대역 인코더 (A120) 및 대응하는 협대역 디코더 (B110) 는, 임의의 이들 기술, 또는 (공지되어 있든지 개발될 것인지 간에) 음성 신호를 (A) 필터를 기술하는 파라미터의 세트 및 (B) 전술된 필터를 구동하여 음성 신호를 재생하는데 이용되는 여기 신호로서 나타내는 임의의 다른 음성 코딩 기술에 따라 구현될 수도 있다.
고대역 인코더 (A200) 는 소스-필터 모델에 따라 고대역 신호 (S30) 를 인코딩하도록 구성된다. 예를 들어, 고대역 인코더 (A200) 는 통상적으로 고대역 신호 (S30) 의 LPC 분석을 수행하여 이 신호의 스펙트럼 엔벌로프를 기술하는 필터 파라미터의 세트를 획득하도록 구성된다. 협대역측에서와 같이, LPC 분석의 잔여로부터 또는 다른 방식으로 이 잔여에 기초하여, 이 필터를 여기시키는데 이용되는 소스 신호가 도출될 수도 있다. 그러나, 고대역 신호 (S30) 는 통상적으로 협대역 신호 (S20) 보다 지각적으로 덜 중요하고, 인코딩된 음성 신호가 2 개의 여기 신호를 포함하는 것은 고비용이 소요된다. 인코딩된 광대역 음성 신호를 전송하는데 필요한 비트 레이트를 감소시키기 위해서, 고대역 대신에 모델링된 여기 신호를 이용하는 것이 바람직할 수도 있다. 예를 들어, 고대역 필터에 대한 여 기는 인코딩된 협대역 여기 신호 (S50) 에 기초할 수도 있다.
도 9 는 고대역 필터 파라미터 (S60a) 및 고대역 이득 계수 (S60b) 를 포함한 고대역 코딩 파라미터 (S60) 의 스트림을 생성하도록 구성되는 고대역 인코더 (A200) 의 일 구현 (A202) 의 블록도이다. 고대역 여기 발생기 (A300) 는 인코딩된 협대역 여기 신호 (S50) 로부터 고대역 여기 신호 (S120) 를 도출한다. 분석 모듈 (A210) 은, 고대역 신호 (S30) 의 스펙트럼 엔벌로프를 특성화하는 파라미터 값의 세트를 생성한다. 이 특정 실시예에 있어서, 분석 모듈 (A210) 은 LPC 분석을 수행하여 고대역 신호 (S30) 의 각 프레임에 대한 LP 필터 계수의 세트를 생성하도록 구성된다. 선형 예측 필터 계수-대-LSF 변환 (410) 은 LP 필터 계수의 세트를 대응하는 LSF 의 세트로 변환한다. LPC 분석 모듈 (210) 및 LP 필터 계수-대-LSF 변환 (220) 과 관련하여 전술한 바와 같이, 분석 모듈 (A210) 및/또는 LP 필터 계수-대-LSF 변환 (410) 은 다른 계수 세트 (예를 들어, 캡스트럼 계수) 및/또는 계수 표현 (예를 들어, ISP) 을 이용하도록 구성될 수도 있다.
양자화기 (420) 는 고대역 LSF (또는 ISP 와 같은 다른 계수 표현) 의 세트를 양자화하도록 구성되고, 고대역 인코더 (A202) 는 이 양자화의 결과를 고대역 필터 파라미터 (S60a) 로서 출력하도록 구성된다. 통상적으로, 이러한 양자화기는, 입력 벡터를 테이블 또는 부호록에서의 대응하는 벡터 엔트리에 대한 인덱스로서 인코딩하는 벡터 양자화기를 포함한다.
또한, 고대역 인코더 (A202) 는, 분석 모듈 (A210) 에 의해 생성되는 인코딩된 스펙트럼 엔벌로프 (예를 들어, LP 필터 계수의 세트) 및 고대역 여기 신호 (S120) 에 따라 합성된 고대역 신호 (S130) 를 생성하도록 구성된 합성 필터 (A220) 를 포함한다. FIR 구현도 이용될 수도 있지만, 합성 필터 (A220) 는 통상적으로 IIR 필터로서 구현된다. 특정 실시예에 있어서, 합성 필터 (A220) 는 6 차 선형 자기회기 (autoregressive) 필터로서 구현된다.
도 8 에 도시된 바와 같은 패러다임에 따른 광대역 음성 인코더 (A100) 의 일 구현에 있어서, 고대역 인코더 (A200) 는 단기 분석 또는 백색화 필터에 의해 생성된 바와 같은 협대역 여기 신호를 수신하도록 구성될 수도 있다. 다시 말하면, 협대역 인코더 (A120) 는, 장기 구조를 인코딩하기 이전에 협대역 여기 신호를 고대역 인코더 (A200) 로 출력하도록 구성될 수도 있다. 그러나, 고대역 인코더 (A200) 가 고대역 디코더 (B200) 에 의해 수신되는 동일한 코딩 정보를 협대역 채널로부터 수신하여, 고대역 인코더 (A200) 에 의해 생성된 코딩 파라미터가 이미 이 정보에서의 비이상적인 것에 대해 어느 정도까지 설명할 수도 있는 것이 바람직하다. 따라서, 고대역 인코더 (A200) 가 광대역 음성 인코더 (A100) 에 의해 출력될 동일한 파라미터화되고/되거나 양자화되는 인코딩된 협대역 여기 신호 (S50) 로부터 협대역 여기 신호 (S80) 를 복원하는 것이 바람직할 수도 있다. 이 접근법의 하나의 잠재적인 이점은, 후술되는 고대역 이득 계수 (S60b) 의 보다 정확한 계산이다.
고대역 이득 계수 계산기 (S230) 는, 오리지널 고대역 신호 (S30) 의 레벨과 합성된 고대역 신호 (S130) 의 레벨 사이의 하나 이상의 차이를 계산하여, 프레임에 대한 이득 엔벌로프를 특정한다. 입력 벡터를 테이블 또는 부호록에서의 대 응하는 벡터 엔트리에 대한 인덱스로서 인코딩하는 벡터 양자화기로서 구현될 수도 있는 양자화기 (430) 는 이득 엔벌로프를 특정하는 값 또는 값들을 양자화하고, 고대역 인코더 (A202) 는 이 양자화의 결과를 고대역 이득 계수 (S60b) 로서 출력하도록 구성된다.
본 명세서에 기재된 엘리먼트 중 하나 이상의 양자화기 (예를 들어, 양자화기 (230, 420 또는 430)) 는 분류된 벡터 양자화를 수행하도록 구성될 수도 있다. 예를 들어, 이러한 양자화기는, 협대역 채널 및/또는 고대역 채널에서의 동일한 프레임 내의 이미 코딩된 정보에 기초하여 부호록의 세트 중 하나를 선택하도록 구성될 수도 있다. 통상적으로, 이러한 기술은 부가적인 부호록 스토리지를 희생하여 증가된 코딩 효율을 제공한다.
도 9 에 도시된 바와 같은 고대역 인코더 (A200) 의 일 구현에 있어서, 합성 필터 (A220) 는 분석 모듈 (A210) 로부터 필터 계수를 수신하도록 배열된다. 고대역 인코더 (A202) 의 대안적인 구현은, 고대역 필터 파라미터 (S60a) 로부터 필터 계수를 디코딩하도록 구성된 역양자화기 및 역변환을 포함하고, 이 경우 합성 필터 (A220) 는 대신에 디코딩된 필터 계수를 수신하도록 배열된다. 이러한 대안적인 배열은, 고대역 이득 계수 계산기 (A230) 에 의한 이득 엔벌로프의 보다 정확한 계산을 지원할 수도 있다.
하나의 특정 실시예에 있어서, 고대역 이득 계수 계산기 (A230) 및 분석 모듈 (A210) 은 각각 프레임당 5 개의 이득값의 세트 및 6 개의 LSF 의 세트를 출력하여, 협대역 신호 (S20) 의 광대역 확장이 프레임당 단지 11 개의 부가적인 값만 으로 달성될 수도 있다. 추가적인 실시예에 있어서, 각 프레임에 대해 또다른 이득값이 부가되어, 광대역 확장에 프레임당 단지 12 개의 부가적인 값만을 제공하게 된다. 귀는 고주파수에서의 주파수 에러에 보다 덜 민감한 경향이 있어, 저차 LPC 에서의 고대역 코딩이 고차 LPC 에서의 협대역 코딩에 대해 유사한 지각 품질을 갖는 신호를 생성할 수도 있다. 고대역 인코더 (A200) 의 통상적인 구현은, 스펙트럼 엔벌로프의 고품질 복원을 위해서는 프레임당 8 내지 12 비트를 출력하고, 시간적 엔벌로프의 고품질 복원을 위해서는 프레임당 또다른 8 내지 12 비트를 출력하도록 구성될 수도 있다. 또다른 특정 실시예에 있어서, 분석 모듈 (A210) 은 프레임당 8 개의 LSF 의 세트를 출력한다.
고대역 인코더 (A200) 의 몇몇 구현은, 고대역 주파수 성분을 갖는 랜덤 잡음 신호를 발생시키고, 고대역 신호 (S30), 협대역 여기 신호 (S80), 또는 협대역 신호 (S20) 의 시간-도메인 엔벌로프에 따라 이 잡음 신호를 진폭-변조함으로써, 고대역 여기 신호 (S120) 를 생성하도록 구성된다. 이러한 경우에, 잡음 발생기의 상태가 인코딩된 음성 신호에서의 다른 정보 (예를 들어, 협대역 필터 파라미터 (S40) 나 그 일부, 및/또는 인코딩된 협대역 여기 신호 (S50) 나 그 일부와 같은 동일한 프레임에서의 정보) 의 결정론적 함수 (deterministic function) 가 되어, 디코더 및 인코딩된 것의 고대역 여기 발생기에서의 대응하는 잡음 발생기가 동일한 상태를 가질 수도 있는 것이 바람직할 수도 있다. 잡음-기반 방법은 무성 사운드에 대해서는 적절한 결과를 생성할 수도 있지만, 유성 사운드의 잔여가 일반적으로 고조파이고, 그 결과 일부 주기적 구조를 갖는 것이 바람직하지 않을 수도 있다.
고대역 여기 발생기 (A300) 는, (예를 들어, 인코딩된 협대역 여기 신호 (S50) 를 역양자화함으로써) 협대역 여기 신호 (S80) 를 획득하고, 협대역 여기 신호 (S80) 에 기초하여 고대역 여기 신호 (S120) 를 발생시키도록 구성된다. 예를 들어, 고대역 여기 발생기 (A300) 는, 협대역 여기 신호 (S80) 의 비선형 처리를 이용한 고조파 합성, 스펙트럼 변환, 스펙트럼 폴딩 (spectral folding), 및/또는 고조파 대역폭 확장과 같은 하나 이상의 기술을 수행하도록 구현될 수도 있다. 하나의 특정 실시예에 있어서, 고대역 여기 발생기 (A300) 는, 확장된 신호와 변조된 잡음 신호의 적응형 믹싱으로 결합된 협대역 여기 신호 (S80) 의 비선형 대역폭 확장에 의해 고대역 여기 신호 (S120) 를 발생시키도록 구성된다. 또한, 고대역 여기 발생기 (A300) 는 확장되고/되거나 믹싱된 신호의 반-희소성 (anti-sparseness) 필터링을 수행하도록 구성될 수도 있다.
고대역 여기 발생기 (A300) 및 고대역 여기 신호 (S120) 의 발생에 관한 부가적인 설명 및 도면은, 2006 년 4 월 3 일 출원되었고, 발명의 명칭이 "SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND EXCITATION GENERATION" (Vos 등) 인 미국특허출원 제 11/397,870 호의 도 11 내지 도 20 및 (단락 [000112] 내지 [000146] 을 포함하여) 수반하는 텍스트에서 확인될 수도 있고, 이 자료는, 참조로서 포함을 허용하는 미국 및 임의의 다른 관할권에서, 고대역 여기 발생기 (A300) 및/또는 하나의 서브대역에 대한 여기 신호의 또다른 서브대역에 대한 인코딩된 여기 신호로부터의 발생에 관한 부가적인 개시물을 제공하려는 목적으로, 참조로서 본 명세서에 포함되어 있다.
도 10 은 협대역 부분 및 고대역 부분을 갖는 음성 신호의 고대역 부분을 인코딩하는 방법 (M10) 에 대한 흐름도이다. 태스크 (X100) 는, 고대역 부분의 스펙트럼 엔벌로프를 특성화하는 필터 파라미터의 세트를 계산한다. 태스크 (X200) 는, 협대역 부분으로부터 도출된 신호에 대해 비선형 함수를 적용함으로써, 스펙트럼으로 연장된 신호를 계산한다. 태스크 (X300) 는, (A) 스펙트럼으로 연장된 신호에 기초한 고대역 여기 신호 및 (B) 필터 파라미터의 세트에 따라 합성된 고대역 신호를 발생시킨다. 태스크 (X400) 는 (C) 협대역 부분으로부터 도출된 신호의 에너지와 (D) 고대역 부분의 에너지 사이의 관계에 기초하여 이득 엔벌로프를 계산한다.
통상적으로, 디코딩된 신호의 시간적 특성이, 오리지널 신호가 나타내는 오리지널 신호의 특성을 닮는 것이 바람직하다. 또한, 상이한 서브대역이 개별적으로 인코딩되는 시스템에 있어서, 디코딩된 신호에서의 서브대역의 상대적인 시간적 특성이 오리지널 신호에서의 서브대역의 상대적인 시간적 특성을 닮는 것이 바람직할 수도 있다. 인코딩된 음성 신호의 정확한 재생을 위해, 합성된 광대역 음성 신호 (S100) 의 고대역 부분의 레벨과 협대역 부분의 레벨 사이의 비율이 오리지널 광대역 음성 신호 (S10) 의 이러한 비율과 유사한 것이 바람직할 수도 있다. 고대역 인코더 (A200) 는, 오리지널 고대역 신호의 시간적 엔벌로프를 기술하거나 다른 방식으로 이 시간적 엔벌로프에 기초한 인코딩된 음성 신호에서의 정보를 포함하도록 구성될 수도 있다. 인코딩된 협대역 여기 신호 (S50) 와 같 이 고대역 여기 신호가 또다른 서브대역으로부터의 정보에 기초하는 경우에 있어서, 특히 인코딩된 파라미터가 합성된 고대역 신호의 시간적 엔벌로프와 오리지널 고대역 신호의 시간적 엔벌로프 사이의 차이를 기술하는 정보를 포함하는 것이 바람직할 수도 있다.
(LPC 계수 또는 유사한 파라미터 값에 의해 기술된 바와 같은) 고대역 신호 (S30) 의 스펙트럼 엔벌로프에 관한 정보에 부가하여, 광대역 신호의 인코딩된 파라미터가 고대역 신호 (S30) 의 시간적 정보를 포함하는 것이 바람직할 수도 있다. 예를 들어, 고대역 코딩 파라미터 (S60a) 에 의해 나타낸 바와 같은 스펙트럼 엔벌로프에 부가하여, 고대역 인코더 (A200) 는, 시간적 또는 이득 엔벌로프를 특정함으로써 고대역 신호 (S30) 를 특성화하도록 구성될 수도 있다. 도 9 에 도시된 바와 같이, 고대역 인코더 (A202) 는, 프레임 또는 그 일부에 걸친 2 개의 신호의 에너지들 사이의 차이 또는 비율과 같이, 고대역 신호 (S30) 와 합성된 고대역 신호 (S130) 사이의 관계에 따라 하나 이상의 이득 계수를 계산하도록 구성 및 배열되는 고대역 이득 계수 계산기 (A230) 를 포함한다. 고대역 인코더 (A202) 의 다른 구현에 있어서, 고대역 이득 계수 계산기 (A230) 도 마찬가지로 구성되지만, 대신에 고대역 신호 (S30) 와 협대역 여기 신호 (S80) 또는 고대역 여기 신호 (S120) 사이의 이러한 시변 관계에 따라 이득 엔벌로프를 계산하도록 배열될 수도 있다.
협대역 여기 신호 (S80) 의 시간적 엔벌로프와 고대역 신호 (S30) 의 시간적 엔벌로프는 유사하다. 그러므로, 고대역 신호 (S30) 와 협대역 여기 신호 (S80) (또는 고대역 여기 신호 (S120) 또는 합성된 고대역 신호 (S130) 와 같이 협대역 여기 신호 (S80) 로부터 도출된 신호) 사이의 관계에 기초한 이득 엔벌로프는 일반적으로 고대역 신호 (S30) 에만 기초한 이득 엔벌로프보다 인코딩에 더 적합하다.
고대역 인코더 (A202) 는, 고대역 신호 (S30) 의 각 프레임에 대해 하나 이상의 이득 계수를 계산하도록 구성된 고대역 이득 계수 계산기 (A230) 를 포함하는데, 여기서 각 이득 계수는 합성된 고대역 신호 (S130) 와 고대역 신호 (S30) 의 대응하는 부분의 시간적 엔벌로프들 사이의 관계에 기초한다. 예를 들어, 고대역 이득 계수 계산기 (A230) 는, 각 이득 계수를 신호의 진폭 엔벌로프들 사이의 비율로서 또는 신호의 에너지 엔벌로프들 사이의 비율로서 계산하도록 구성될 수도 있다. 하나의 통상적인 구현에 있어서, 고대역 인코더 (A202) 는, 각 프레임에 대해 5 개의 이득 계수 (예를 들어, 5 개의 연속적인 서브프레임 각각에 대해 하나의 이득 계수) 를 특정하는 8 내지 12 비트의 양자화된 인덱스를 출력하도록 구성된다. 추가적인 구현에 있어서, 고대역 인코더 (A202) 는, 각 프레임에 대한 프레임-레벨 이득 계수를 특정하는 부가적인 양자화된 인덱스를 출력하도록 구성된다.
이득 계수는, 오리지널 신호의 에너지의 측정치와 합성된 신호의 에너지의 측정치 사이의 비율 R 과 같이 정규화 계수 (normalization factor) 로서 계산될 수도 있다. 비율 R 은 선형값 또는 (예를 들어, 데시벨 규모의) 대수값으로 표현될 수도 있다. 고대역 이득 계수 계산기 (A230) 는, 각 프레임에 대해 이러 한 정규화 계수를 계산하도록 구성될 수도 있다. 대안적으로 또는 부가적으로, 고대역 이득 계수 계산기 (A230) 는, 각 프레임의 다수의 서브프레임 각각에 대해 일련의 이득 계수를 계산하도록 구성될 수도 있다. 일 실시예에 있어서, 고대역 이득 계수 계산기 (A230) 는, 각 프레임 (및/또는 서브프레임) 의 에너지를 제곱의 합계의 제곱근으로서 계산하도록 구성된다.
고대역 이득 계수 계산기 (A230) 는, 일련의 하나 이상의 서브태스크를 포함한 태스크로서 이득 계수 계산을 수행하도록 구성될 수도 있다. 도 11 은 고대역 신호 (S30) 와 합성된 고대역 신호 (S130) 의 대응하는 부분의 상대적인 에너지에 따라 인코딩된 고대역 신호의 대응하는 부분 (예를 들어, 프레임 또는 서브프레임) 에 대한 이득값을 계산하는 이러한 태스크의 일 실시예 (T200) 의 흐름도이다. 태스크 (T220a 및 T220b) 는 각각의 신호의 대응하는 부분의 에너지를 계산한다. 예를 들어, 태스크 (T220a 및 T220b) 는 각각의 부분의 샘플의 제곱의 합계로서 에너지를 계산하도록 구성될 수도 있다. 태스크 (T230) 는 이들 에너지의 비율의 제곱근으로서 이득 계수를 계산한다. 이 실시예에 있어서, 태스크 (T230) 는, 이 부분에 걸친 합성된 고대역 신호 (S130) 의 에너지에 대한 이 부분에 걸친 고대역 신호 (S30) 의 에너지의 비율의 제곱근으로서 이 부분에 대한 이득 계수를 계산한다.
고대역 이득 계수 계산기 (A230) 가 윈도우 함수에 따라 에너지를 계산하도록 구성되는 것이 바람직할 수도 있다. 도 12 는 이득 계수 계산 태스크 (T200) 의 이러한 일 구현 (T210) 의 흐름도이다. 태스크 (T215a) 는 고대역 신호 (S30) 에 윈도우 함수를 적용하고, 태스크 (T215b) 는 합성된 고대역 신호 (S130) 에 동일한 윈도우 함수를 적용한다. 태스크 (T220a 및 T220b) 의 구현 (T222a 및 T222b) 은 각각의 윈도우의 에너지를 계산하고, 태스크 (T230) 는 에너지의 비율의 제곱근으로서 이 부분에 대한 이득 계수를 계산한다.
프레임에 대한 이득 계수의 계산시, 인접 프레임에 오버랩되는 윈도우 함수를 적용하는 것이 바람직할 수도 있다. 서브프레임에 대한 이득 계수의 계산시, 인접 서브프레임에 오버랩되는 윈도우 함수를 적용하는 것이 바람직할 수도 있다. 예를 들어, 오버랩-부가 (overlap-add) 방식으로 적용될 수도 있는 이득 계수를 생성하는 윈도우 함수는 서브프레임들 사이의 불연속성을 감소시키거나 회피하는데 도움이 될 수도 있다. 일 실시예에 있어서, 고대역 이득 계수 계산기 (A230) 는 도 13a 에 도시된 바와 같은 사다리꼴 윈도우 함수를 적용하도록 구성되고, 이 윈도우는 1 밀리초만큼 2 개의 인접 서브프레임 각각에 오버랩된다. 도 13b 는 20-밀리초 프레임의 5 개의 서브프레임 각각에 대한 이러한 윈도우 함수의 적용을 도시한 도면이다. 고대역 이득 계수 계산기 (A230) 의 다른 구현은, 대칭이거나 비대칭일 수도 있는 상이한 윈도우 형상 (예를 들어, 장방형, 해밍) 및/또는 상이한 오버랩 주기를 갖는 윈도우 함수를 적용하도록 구성될 수도 있다. 또한, 프레임이 상이한 길이의 서브프레임을 포함하고/하거나, 고대역 이득 계수 계산기 (A230) 의 일 구현이 프레임 내의 상이한 서브프레임에 대해 상이한 윈도우 함수를 적용하도록 구성되는 것도 가능하다. 하나의 특정 구현에 있어서, 고대역 이득 계수 계산기 (A230) 는, 도 13a 및 도 13b 에 도시된 바와 같은 사다리꼴 윈도우 함수를 이용하여 서브프레임 이득 계수를 계산하도록 구성되고, 또한 윈도우 함수를 이용하지 않고 프레임-레벨 이득 계수를 계산하도록 구성된다.
제한 없이, 다음의 값이 특정 구현에 대한 예시로서 제공된다. 임의의 다른 지속기간이 이용될 수도 있지만, 이들 경우에 대해 20-msec 프레임이 가정된다. 7 ㎑ 로 샘플링된 고대역 신호에 있어서, 각 프레임은 140 개의 샘플을 갖는다. 이러한 프레임이 동등한 길이의 5 개의 서브프레임으로 분할되는 경우, 각 서브프레임은 28 개의 샘플을 갖고, 도 13a 에 도시된 바와 같은 윈도우의 폭은 42 개의 샘플과 같다. 8 ㎑ 로 샘플링된 고대역 신호에 있어서, 각 프레임은 160 개의 샘플을 갖는다. 이러한 프레임이 동등한 길이의 5 개의 서브프레임으로 분할되는 경우, 각 서브프레임은 32 개의 샘플을 갖고, 도 13a 에 도시된 바와 같은 윈도우의 폭은 48 개의 샘플과 같다. 다른 구현에 있어서, 임의의 폭의 서브프레임이 이용될 수도 있고, 고대역 이득 계수 계산기 (A230) 의 일 구현이 프레임의 각 샘플에 대해 상이한 이득 계수를 생성하도록 구성되는 것이 가능하다.
전술한 바와 같이, 고대역 인코더 (A202) 는, (협대역 여기 신호 (S80), 고대역 여기 신호 (S120), 또는 합성된 고대역 신호 (S130) 와 같이) 협대역 신호 (S20) 에 기초한 신호와 고대역 신호 (S30) 사이의 시변 관계에 따라 일련의 이득 계수를 계산하도록 구성되는 고대역 이득 계수 계산기 (A230) 를 포함할 수도 있다. 도 14a 는 고대역 이득 계수 계산기 (A230) 의 일 구현 (A232) 의 블록도이다. 고대역 이득 계수 계산기 (A232) 는, 제 1 신호의 엔벌로프를 계산하도록 배열되는 엔벌로프 계산기 (G10) 의 일 구현 (G10a), 및 제 2 신호의 엔벌로프 를 계산하도록 배열되는 엔벌로프 계산기 (G10) 의 일 구현 (G10b) 을 포함한다. 엔벌로프 계산기 (G10a 및 G10b) 는 동일할 수도 있고, 또는 엔벌로프 계산기 (G10) 의 상이한 구현의 예시일 수도 있다. 몇몇 경우에, 엔벌로프 계산기 (G10a 및 G10b) 는, 상이한 시점에 상이한 신호를 처리하도록 구성된 동일한 구조 (예를 들어, 게이트의 어레이) 및/또는 명령들 (예를 들어, 코드의 라인) 세트로서 구현될 수도 있다.
엔벌로프 계산기 (G10a 및 G10b) 각각은, (예를 들어, 절대값 함수 (absolute value function) 에 따라) 진폭 엔벌로프 또는 (예를 들어, 제곱 함수 (squaring function) 에 따라) 에너지 엔벌로프를 계산하도록 구성될 수도 있다. 통상적으로, 각 엔벌로프 계산기 (G10a, G10b) 는, 입력 신호에 대해 서브샘플링되는 엔벌로프 (예를 들어, 입력 신호의 각 프레임 또는 서브프레임에 대해 하나의 값을 갖는 엔벌로프) 를 계산하도록 구성된다. 예를 들어, 도 11 내지 도 13b 를 참조하여 전술한 바와 같이, 엔벌로프 계산기 (G10a 및/또는 G10b) 는 윈도우 함수에 따라 엔벌로프를 계산하도록 구성될 수도 있는데, 이 윈도우 함수는 인접 프레임 및/또는 서브프레임에 오버랩되도록 배열될 수도 있다.
계수 계산기 (G20) 는, 시간에 따른 2 개의 엔벌로프들 사이의 시변 관계에 따라 일련의 이득 계수를 계산하도록 구성된다. 전술한 바와 같은 일 실시예에 있어서, 계수 계산기 (G20) 는, 대응하는 서브프레임에 대한 엔벌로프의 비율의 제곱근으로서 각 이득 계수를 계산한다. 대안적으로, 계수 계산기 (G20) 는, 대응하는 서브프레임 동안의 엔벌로프들 사이의 차이 또는 부호화된 제곱 차이 (signed squared difference) 와 같이, 엔벌로프들 사이의 거리에 기초하여 각 이득 계수를 계산하도록 구성될 수도 있다. 데시벨 단위로 또는 다른 대수적으로 스케일링된 형태로 이득 계수의 계산된 값을 출력하도록 계수 계산기 (G20) 를 구성하는 것이 바람직할 수도 있다. 예를 들어, 계수 계산기 (G20) 는, 에너지 값의 대수의 차이로서 2 개의 에너지 값의 비율의 대수를 계산하도록 구성될 수도 있다.
도 14b 는 고대역 이득 계수 계산기 (A232) 를 포함한 일반화된 배열의 블록도이고, 여기서 엔벌로프 계산기 (G10a) 는 협대역 신호 (S20) 에 기초한 신호의 엔벌로프를 계산하도록 배열되고, 엔벌로프 계산기 (G10b) 는 고대역 신호 (S30) 의 엔벌로프를 계산하도록 배열되고, 계수 계산기 (G20) 는 고대역 이득 계수 (S60b) 를 (예를 들어, 양자화기 (430) 로) 출력하도록 구성된다. 이 실시예에 있어서, 엔벌로프 계산기 (G10a) 는 중간 처리 (P1) 로부터 수신된 신호의 엔벌로프를 계산하도록 배열되는데, 이 중간 처리는, 본 명세서에 기재된 바와 같이 협대역 여기 신호 (S80) 의 계산, 고대역 여기 신호 (S120) 의 발생, 및/또는 고대역 신호 (S130) 의 합성을 수행하도록 구성되는 구조 및/또는 명령들을 포함할 수도 있다. 편의성을 위해, 엔벌로프 계산기 (G10a) 가 대신에 협대역 여기 신호 (S80) 또는 고대역 여기 신호 (S120) 의 엔벌로프를 계산하도록 배열되는 구현이 명백하게 심사숙고되며 본 명세서에 개시되지만, 엔벌로프 계산기 (G10a) 는 합성된 고대역 신호 (S130) 의 엔벌로프를 계산하도록 배열된다고 가정된다.
전술한 바와 같이, 2 개 이상의 상이한 시간 분해도 (time resolution) 에서 이득 계수를 획득하는 것이 바람직할 수도 있다. 예를 들어, 고대역 이득 계수 계산기 (A230) 가 인코딩될 고대역 신호 (S30) 의 각 프레임에 대해 일련의 서브프레임 이득 계수 및 프레임-레벨 이득 계수 모두를 계산하도록 구성되는 것이 바람직할 수도 있다. 도 15 는 각각 제 1 신호 (엔벌로프 계산기 (G10af, G10as) 가 대신에 협대역 여기 신호 (S80) 또는 고대역 여기 신호 (S120) 의 엔벌로프를 계산하도록 배열되는 구현이 명백하게 심사숙고되며 본 명세서에 개시되지만, 예를 들어 합성된 고대역 신호 (S130)) 의 프레임-레벨 엔벌로프 및 서브프레임-레벨 엔벌로프를 계산하도록 구성되는 엔벌로프 계산기 (G10) 의 구현 (G10af, G10as) 을 포함한 고대역 이득 계수 계산기 (A232) 의 일 구현 (A234) 의 블록도이다. 또한, 고대역 이득 계수 계산기 (A234) 는, 각각 제 2 신호 (예를 들어, 고대역 신호 (S30)) 의 프레임-레벨 엔벌로프 및 서브프레임-레벨 엔벌로프를 계산하도록 구성되는 엔벌로프 계산기 (G10b) 의 구현 (G10bf, G10bs) 를 포함한다.
엔벌로프 계산기 (G10af 및 G10bf) 는 동일할 수도 있고, 또는 엔벌로프 계산기 (G10) 의 상이한 구현의 예시일 수도 있다. 몇몇 경우에, 엔벌로프 계산기 (G10af 및 G10bf) 는, 상이한 시점에 상이한 신호를 처리하도록 구성된 동일한 구조 (예를 들어, 게이트의 어레이) 및/또는 명령들 (예를 들어, 코드의 라인) 세트로서 구현될 수도 있다. 마찬가지로, 엔벌로프 계산기 (G10as 및 G10bs) 는 동일할 수도 있고, 엔벌로프 계산기 (G10) 의 상이한 구현의 예시일 수도 있고, 또는 동일한 구조 및/또는 명령들 세트로서 구현될 수도 있다. 4 개의 엔벌로프 계산기 (G10af, G10as, G10bf 및 G10bs) 모두가 상이한 시점에 동일한 구성가능한 구조 및/또는 명령들 세트로서 구현되는 것이 가능하다.
본 명세서에 기재된 바와 같은 계수 계산기 (G20) 의 구현 (G20f, G20s) 은 각각의 엔벌로프에 기초하여 프레임-레벨 이득 계수 (G60bf) 및 서브프레임-레벨 이득 계수 (G60bs) 를 계산하도록 배열된다. 특정 설계에 적합하도록 승산기 또는 제산기로서 구현될 수도 있는 정규화기 (N10) 는, (예를 들어, 서브프레임 이득 계수가 양자화되기 이전에) 대응하는 프레임-레벨 이득 계수 (G60bf) 에 따라 서브프레임 이득 계수 (G60bs) 의 각 세트를 정규화하도록 배열된다. 몇몇 경우에, 프레임-레벨 이득 계수 (G60bf) 를 양자화한 다음, 대응하는 역양자화된 값을 이용하여 서브프레임 이득 계수 (G60bs) 를 정규화함으로써, 가능하게는 보다 정확한 결과를 획득하는 것이 바람직할 수도 있다.
도 16 은 고대역 이득 계수 계산기 (A232) 의 또다른 구현 (A236) 의 블록도이다. 이 구현에 있어서, 도 15 에 도시된 바와 같은 각종 엔벌로프 계산기 및 이득 계산기는 재배열되어, 엔벌로프가 계산되기 이전에 제 1 신호에 대한 정규화가 수행된다. 정규화기 (N20) 는 특정 설계에 적합하도록 승산기 또는 제산기로서 구현될 수도 있다. 몇몇 경우에, 프레임-레벨 이득 계수 (G60bf) 를 양자화한 다음, 대응하는 역양자화된 값을 이용하여 제 1 신호를 정규화함으로써, 가능하게는 보다 정확한 결과를 획득하는 것이 바람직할 수도 있다.
양자화기 (430) 는, 특정 설계에 적합하다고 간주된 스칼라 및/또는 벡터 양자화의 하나 이상의 방법을 수행하도록 개발되거나 공지된 임의의 기술에 따라 구현될 수도 있다. 양자화기 (430) 는 서브프레임 이득 계수로부터 개별적으로 프레임-레벨 이득 계수를 양자화하도록 구성될 수도 있다. 일 실시예에 있어서, 각 프레임-레벨 이득 계수 (S60bf) 는 4-비트 룩업 테이블 양자화기를 사용하여 양자화되고, 각 프레임에 대한 서브프레임 이득 계수 (S60bs) 의 세트는 4 비트를 이용하여 벡터 양자화된다. 이러한 방식은 (www.3gpp2.org 에서 입수가능한 3GPP2 문서 C.S0014-C 버전 0.2 의 섹션 4.18.4 에 기재된 바와 같이) 유성음 프레임을 위해 EVRC-WB 코더에서 이용된다. 또다른 실시예에 있어서, 각 프레임-레벨 이득 계수 (S60bf) 는 7-비트 스칼라 양자화기를 사용하여 양자화되고, 각 프레임에 대한 서브프레임 이득 계수 (S60bs) 의 세트는 스테이지당 4 비트를 갖는 멀티스테이지 벡터 양자화기를 사용하여 벡터 양자화된다. 이러한 방식은 (상기 인용된 3GPP2 문서 C.S0014-C 버전 0.2 의 섹션 4.18.4 에 기재된 바와 같이) 무성 음성 프레임을 위해 EVRC-WB 코더에서 이용된다. 또한, 다른 방식에 있어서, 각 프레임-레벨 이득 계수가 그 프레임에 대한 서브프레임 이득 계수와 함께 양자화되는 것도 가능하다.
통상적으로, 양자화기는 입력값을 이산 출력값의 세트 중 하나에 매핑하도록 구성된다. 제한된 개수의 출력값이 이용가능하여, 일 범위의 입력값은 단일 출력값에 매핑된다. 양자화는 코딩 효율을 증가시키는데, 그 이유는 대응하는 출력값을 나타내는 인덱스가 오리지널 입력값보다 적은 비트로 송신될 수도 있기 때문이다. 도 17 은 스칼라 양자화기에 의해 수행될 수도 있는 바와 같은 1-차원 매핑의 일 실시예를 도시한 도면이고, 여기서 (2nD-1)/2 와 (2nD+1)/2 사이의 입력값은 출력값 nD 에 매핑된다 (여기서, n 은 정수).
또한, 양자화기는 벡터 양자화기로서 구현될 수도 있다. 예를 들어, 각 프레임에 대한 서브프레임 이득 계수의 세트는 통상적으로 벡터 양자화기를 사용하여 양자화된다. 도 18 은 벡터 양자화기에 의해 수행되는 바와 같은 다차원 매핑의 단순한 일 실시예를 도시한 도면이다. 이 실시예에 있어서, 입력 공간은 (예를 들어, 최근접-이웃 기준 (nearest-neighbor criterion) 에 따라) 다수의 보로노이 영역으로 분할된다. 양자화는, 각 입력값을 대응하는 보로노이 영역 (통상적으로, 중심 ; 여기서, 점으로 도시됨) 을 나타내는 값에 매핑한다. 이 실시예에 있어서, 입력 공간은 6 개의 영역으로 분할되어, 임의의 입력값은 단지 6 개의 상이한 상태만을 갖는 인덱스로 표현될 수도 있다.
도 19a 는 스칼라 양자화기에 의해 수행될 수도 있는 바와 같은 1-차원 매핑의 또다른 실시예를 도시한 도면이다. 이 실시예에 있어서, 몇몇 초기값 a (예를 들어, 0 dB) 로부터 몇몇 종단값 b (예를 들어, 6 dB) 로 확장되는 입력 공간은 n 개의 영역으로 분할된다. n 개의 영역 각각에서의 값은, n 개의 양자화 값 q[0] 내지 q[n-1] 중 대응하는 양자화 값으로 표현된다. 통상적인 애플리케이션에 있어서, n 개의 양자화 값의 세트는 인코더 및 디코더에서 이용가능하여, 양자화 인덱스 (0 내지 n-1) 의 송신은 인코더로부터 디코더로 양자화된 값을 전송하기에 충분하다. 예를 들어, 양자화 값의 세트는 각 디바이스 내의 순서화된 리스트, 테이블 또는 부호록에 저장될 수도 있다.
도 19a 가 n 개의 동등한 크기의 영역으로 분할된 입력 공간을 나타내지만, 대신에 상이한 크기의 영역을 이용하여 입력 공간을 분할하는 것이 바람직할 수도 있다. 입력 데이터의 예측된 분포에 따라 양자화 값을 분포시킴으로써 보다 정확한 평균 결과가 획득될 수도 있다는 것이 가능하다. 예를 들어, 보다 자주 관측될 것으로 예상되는 입력 공간의 영역에서는 보다 높은 분해능 (즉, 보다 작은 양자화 영역) 을 획득하고, 다른 곳에서는 보다 낮은 분해능을 획득하는 것이 바람직할 수도 있다. 도 19b 는 이러한 매핑의 일 실시예를 도시한 도면이다. 또다른 실시예에 있어서, (예를 들어, 대수적으로) 진폭이 a 로부터 b 로 증가함에 따라, 양자화 영역의 크기는 증가한다. 또한, 상이한 크기의 양자화 영역은 (예를 들어, 도 18 에 도시된 바와 같이) 벡터 양자화에 이용될 수도 있다. 프레임-레벨 이득 계수 (S60bf) 의 양자화시, 양자화기 (430) 는 요구에 따라 균일하거나 불균일한 매핑을 적용하도록 구성될 수도 있다. 마찬가지로, 서브프레임 이득 계수 (G60bs) 의 양자화시, 양자화기 (430) 는 요구에 따라 균일하거나 불균일한 매핑을 적용하도록 구성될 수도 있다. 양자화기 (430) 는 이득 계수 (S60bf 및 S60bs) 에 대해 개별적인 양자화기를 포함하도록 구현될 수도 있고/있거나, 동일한 구성가능한 구조 및/또는 명령들 세트를 이용하여 상이한 시점에 이득 계수의 상이한 스트림을 양자화하도록 구현될 수도 있다.
전술한 바와 같이, 고대역 이득 계수 (S60b) 는, 오리지널 고대역 신호 (S30) 의 엔벌로프와 협대역 여기 신호 (S80) 에 기초한 신호 (예를 들어, 합성된 고대역 신호 (S130)) 의 엔벌로프 사이의 시변 관계를 인코딩한다. 이 관계는, 디코딩된 협대역 신호와 고대역 신호의 상대적인 레벨이 오리지널 광대역 음성 신호 (S10) 의 협대역 성분과 고대역 성분의 상대적인 레벨에 근사하도록 디코더에서 복원될 수도 있다.
디코딩된 음성 신호에서의 각종 서브대역의 상대적인 레벨이 부정확한 경우, 가청 아티팩트가 발생할 수도 있다. 예를 들어, 디코딩된 고대역 신호가 오리지널 음성 신호에서보다 대응하는 디코딩된 협대역 신호에 대해 높은 레벨 (예를 들어, 높은 에너지) 을 갖는 경우, 눈에 띄는 아티팩트가 발생할 수도 있다. 가청 아티팩트는 사용자의 경험을 손상하고, 코더의 지각 품질을 감소시킬 수도 있다. 지각적으로 양호한 결과를 획득하기 위해서, 서브대역 인코더 (예를 들어, 고대역 인코더 (A200)) 가 합성된 신호에 대해 에너지를 할당하는데 있어서 전통적인 것이 바람직할 수도 있다. 예를 들어, 전통적인 양자화 방법을 이용하여 합성된 신호에 대한 이득 계수값을 인코딩하는 것이 바람직할 수도 있다.
레벨 불균형으로부터 기인하는 아티팩트는, 증폭된 서브대역에 대한 여기가 또다른 서브대역으로부터 도출되는 상황에 있어서 특히 마땅하지 않을 수도 있다. 예를 들어, 고대역 이득 계수 (S60b) 가 그 오리지널 값보다 큰 값으로 양자화되는 경우, 이러한 아티팩트가 발생할 수도 있다. 도 19c 는 이득 계수값 R 에 대한 양자화된 값이 오리지널 값보다 큰 실시예를 도시한 도면이다. 여기서, 양자화된 값은 q[iR] 로 표시되고, iR 은 값 R 과 연관된 양자화 인덱스를 나타내고,
Figure 112009003893129-pct00001
은 주어진 인덱스에 의해 식별된 양자화 값을 획득하는 연산을 나타낸다.
도 20a 는 하나의 일반적인 구현에 따른 이득 계수 제한 방법 (M100) 에 대한 흐름도이다. 태스크 (TQ10) 는 서브대역 신호의 일부 (예를 들어, 프레임 또는 서브프레임) 의 이득 계수에 대한 값 R 을 계산한다. 예를 들어, 태스크 (TQ10) 는, 합성된 서브대역 프레임의 에너지에 대한 오리지널 서브대역 프레임의 에너지의 비율로서 값 R 을 계산하도록 구성될 수도 있다. 대안적으로, 이득 계수값 R 은 이러한 비율의 (예를 들어, 베이스 10 에 대한) 대수일 수도 있다. 태스크 (TQ10) 는 전술한 바와 같이 고대역 이득 계수 계산기 (A230) 의 일 구현에 의해 수행될 수도 있다.
태스크 (TQ20) 는 이득 계수값 R 을 양자화한다. 이러한 양자화는, (본 명세서에 기재된 바와 같은) 임의의 스칼라 양자화 방법 또는 벡터 양자화 방법과 같이 특정 코더 설계에 적합한 것으로 간주된 임의의 다른 방법에 의해 수행될 수도 있다. 통상적인 애플리케이션에 있어서, 태스크 (TQ20) 는 입력값 R 에 대응하는 양자화 인덱스 iR 을 식별하도록 구성된다. 예를 들어, 태스크 (TQ20) 는, 원하는 탐색 전략 (예를 들어, 최소 에러 알고리즘) 에 따라 R 값과 양자화 리스트, 테이블 또는 부호록에서의 엔트리를 비교함으로써 인덱스를 선택하도록 구성될 수도 있다. 이 실시예에 있어서, 양자화 테이블 또는 리스트는 탐색 전략의 내림차순으로 (즉, q[i-1] ≤ q[i] 가 되도록) 배열된다고 가정된다.
태스크 (TQ30) 는 양자화된 이득값과 오리지널 값 사이의 관계를 평가한다. 이 실시예에 있어서, 태스크 (TQ30) 는 양자화된 이득값과 오리지널 값을 비교한다. R 의 양자화된 값이 R 의 입력값 이하라고 태스크 (TQ30) 가 확인하는 경우에는, 이득 계수 제한 방법 (M100) 이 종료된다. 그러나, R 의 양자화된 값이 R 의 입력값을 초과한다고 태스크 (TQ30) 가 확인하는 경우에는, 태스크 (TQ50) 가 실행되어, R 에 대해 상이한 양자화 인덱스를 선택한다. 예를 들어, 태스크 (TQ50) 는, q[iR] 미만인 양자화 값을 나타내는 인덱스를 선택하도록 구성될 수도 있다.
통상적인 구현에 있어서, 태스크 (TQ50) 는 양자화 리스트, 테이블 또는 부호록에서 다음의 최저값을 선택한다. 도 20b 는 태스크 (TQ50) 의 이러한 구현 (TQ52) 을 포함한 이득 계수 제한 방법 (M100) 의 일 구현 (M110) 에 대한 흐름도이고, 여기서 태스크 (TQ52) 는 양자화 인덱스를 감분하도록 구성된다.
몇몇 경우에, R 의 양자화된 값이 R 값을 일부 공칭량만큼 초과하는 것을 허용하는 것이 바람직할 수도 있다. 예를 들어, R 의 양자화된 값이, 지각 품질에 대해 수락가능하게 낮은 영향을 미칠 것으로 예상되는 일부 양 또는 비율만큼 R 값을 초과하는 것을 허용하는 것이 바람직할 수도 있다. 도 20c 는 이득 계수 제한 방법 (M100) 의 이러한 구현 (M120) 에 대한 흐름도이다. 이득 계수 제한 방법 (M120) 은, R 의 양자화된 값과 R 보다 큰 상한을 비교하는 태스크 (TQ30) 의 일 구현 (TQ32) 을 포함한다. 이 실시예에 있어서, 태스크 (TQ32) 는, R 과 임계치 T1 의 곱을 q[iR] 과 비교하는데, 여기서 T1 은 1 보다 크지만 1 에 근접한 값 (예를 들어, 1.1 또는 1.2) 을 갖는다. 양자화된 값이 이 곱 초과 (대안적으로, 이상) 이라고 태스크 (TQ32) 가 확인하는 경우, 태스크 (TQ50) 의 구현이 실행된다. 태스크 (TQ30) 의 다른 구현은, R 값과 R 의 양자화된 값 사이의 차이가 임계치를 만족시키고/시키거나 이 임계치를 초과하는지 여부를 판정하도록 구성될 수도 있다.
몇몇 경우에, R 에 대해 보다 낮은 양자화 값을 선택하는 것은 오리지널 양자화 값보다 디코딩된 신호들 사이에 큰 불일치를 야기하는 것이 가능하다. 예를 들어, q[iR-1] 이 R 값보다 훨씬 작은 경우에, 이러한 상황이 발생할 수도 있다. 이득 계수 제한 방법 (M100) 의 추가적인 구현은, 태스크 (TQ50) 의 실행 또는 구성이 후보 양자화 값 (예를 들어, q[iR-1]) 의 테스팅을 조건으로 하는 방법을 포함한다.
도 20d 는 이득 계수 제한 방법 (M100) 의 이러한 구현 (M130) 에 대한 흐름도이다. 이득 계수 제한 방법 (M130) 은, 후보 양자화 값 (예를 들어, q[iR-1]) 과 R 미만의 하한을 비교하는 태스크 (TQ40) 를 포함한다. 이 실시예에 있어서, 태스크 (TQ40) 는, R 과 임계치 T2 의 곱을 q[iR-1] 과 비교하는데, 여기서 T2 는 1 보다 작지만 1 에 근접한 값 (예를 들어, 0.8 또는 0.9) 을 갖는다. 후보 양자화 값이 이 곱 이하 (대안적으로, 미만) 라고 태스크 (TQ40) 가 확인하는 경우에는, 이득 계수 제한 방법 (M130) 이 종료된다. 후보 양자화 값이 이 곱 초과 (대안적으로, 이상) 라고 태스크 (TQ40) 가 확인하는 경우에는, 태스크 (TQ50) 의 일 구현이 실행된다. 태스크 (TQ40) 의 다른 구현은, R 값과 후보 양자화 값 사이의 차이가 임계치를 만족시키고/시키거나 이 임계치를 초과하는지 여부를 판정하도록 구성될 수도 있다.
이득 계수 제한 방법 (M100) 의 일 구현은 프레임-레벨 이득 계수 (S60bf) 및/또는 서브프레임 이득 계수 (S60bs) 에 적용될 수도 있다. 통상적인 애플리케이션에 있어서, 이러한 방법은 프레임-레벨 이득 계수에만 적용된다. 이 방법이 프레임-레벨 이득 계수에 대해 신규 양자화 인덱스를 선택하는 경우에, 프레임-레벨 이득 계수의 신규 양자화된 값에 기초하여 대응하는 서브프레임 이득 계수 (S60bs) 를 재계산하는 것이 바람직할 수도 있다. 대안적으로, 서브프레임 이득 계수 (S60bs) 의 계산은, 이득 계수 제한 방법이 대응하는 프레임-레벨 이득 계수에 대해 수행된 이후에 발생하도록 배열될 수도 있다.
도 21 은 고대역 인코더 (A202) 의 일 구현 (A203) 의 블록도이다. 고대역 인코더 (A203) 는, 양자화된 이득 계수값 및 그 오리지널 (즉, 양자화-이전 (pre-quantization)) 값을 수신하도록 배열되는 이득 계수 제한기 (L10) 를 포함한다. 제한기 (L10) 는 이들 값들 사이의 관계에 따라 고대역 이득 계수 (S60b) 를 출력하도록 구성된다. 예를 들어, 제한기 (L10) 는, 본 명세서에 기재된 바와 같은 이득 계수 제한 방법 (M100) 의 일 구현을 수행하여 고대역 이득 계수 (S60b) 를 양자화 인덱스의 하나 이상의 스트림으로서 출력하도록 구성될 수도 있다. 셀룰러 전화기 내에 이러한 인코더를 구현하는 것이 바람직할 수도 있다. 도 22 는 제한기 (L10) 를 통해 프레임-레벨 이득 계수 (S60bf) 를 출력하며 양자화기 (430) 에 의해 생성된 바와 같은 서브프레임 이득 계수 (S60bs) 를 출력하도록 구성되는 고대역 인코더 (A203) 의 일 구현 (A204) 의 블록도이다. 인터넷 프로토콜의 버전과 호환가능한 포맷을 갖는 복수의 패킷을 송신하도록 구성되는 디바이스 내에서 계산기 (A230), 양자화기 (430), 제한기 (L10) 를 구현하는 것이 바람직할 수도 있다. 그러한 일 실시예에서, 복수의 패킷은 협대역 신호 (S20) 를 인코딩하는 파라미터들, 고대역 신호 (S30) 를 인코딩하는 파라미터들, 및 제한기 (L10) 에 의해 생성되는 양자화 인덱스를 포함한다.
도 23a 는 제한기 (L10) 의 일 구현 (L12) 에 대한 동작도이다. 제한기 (L12) 는 R 의 양자화-이전 값과 양자화-이후 (post-quantization) 값을 비교하여, q[iR] 이 R 보다 큰 지 여부를 판정한다. 이 표현이 참인 경우에는, 제한기 (L12) 는 인덱스 iR 의 값을 1 만큼 감분함으로써 또다른 양자화 인덱스를 선택하여, R 에 대한 신규 양자화된 값을 생성한다. 이 표현이 참이 아닌 경우에는, 인덱스 iR 의 값은 변경되지 않는다.
도 23b 는 제한기 (L10) 의 또다른 구현 (L14) 에 대한 동작도이다. 이 실시예에 있어서, 양자화된 값은 R 값과 임계치 T1 의 곱과 비교되는데, 여기서 T1 은 1 보다 크지만 1 에 근접한 값 (예를 들어, 1.1 또는 1.2) 을 갖는다. q[iR] 이 T1R 초과 (대안적으로, 이상) 인 경우에는, 제한기 (L14) 는 인덱스 iR 의 값을 감분한다.
도 23c 는 제한기 (L10) 의 추가적인 구현 (L16) 에 대한 동작도이고, 이는 현재의 값을 대체하도록 제안된 양자화 값이 R 의 오리지널 값에 충분히 근접하는지 여부를 판정하도록 구성된다. 예를 들어, 제한기 (L16) 는, 부가적인 비교를 수행하여, 다음의 최저 인덱싱된 양자화 값 (예를 들어, q[iR-1]) 이 R 의 사전-양자화된 값으로부터 특정된 거리 내에 있거나 이 사전-양자화된 값의 특정된 비율 내에 있는지 여부를 판정하도록 구성될 수도 있다. 이 특정 실시예에 있어서, 후보 양자화 값은 R 값과 임계치 T2 의 곱과 비교되는데, 여기서 T2 는 1 보다 작지만 1 에 근접한 값 (예를 들어, 0.8 또는 0.9) 을 갖는다. q[iR-1] 이 T2R 미만 (대안적으로, 이하) 인 경우에는, 비교는 실패한다. q[iR] 및 q[iR-1] 에 대해 수행된 비교 중 어느 하나가 실패한 경우, 인덱스 iR 의 값은 변경되지 않는다.
이득 계수들 사이의 변동이 디코딩된 신호에서 아티팩트를 초래하는 것이 가능하고, (예를 들어, 1-탭 IIR 필터와 같은 평활화 필터를 적용함으로써) 이득 계수 평활화 방법을 수행하도록 고대역 인코더 (A200) 를 구성하는 것이 바람직할 수도 있다. 이러한 평활화는 프레임-레벨 이득 계수 (S60bf) 및/또는 서브프레임 이득 계수 (S60bs) 에 적용될 수도 있다. 이러한 경우에, 본 명세서에 기재된 바와 같은 이득 계수 제한 방법 (M100) 및/또는 제한기 (L10) 의 구현은 R 의 사전-평활화된 값과 양자화된 값 iR 을 비교하도록 배열될 수도 있다. 이러한 이득 계수 평활화에 관한 부가적인 설명 및 도면은, 2006 년 4 월 21 일 출원되었고, 발명의 명칭이 "SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR SMOOTHING" 인 미국특허출원 제 11/408,390 호 (Vos 등) 의 도 48 내지 도 55b 및 (단락 [000254] 내지 [000272] 를 포함하여) 수반하는 텍스트에서 확인될 수도 있고, 이 자료는, 참조로서 포함을 허용하는 미국 및 임의의 다른 관할권에서, 이득 계수 평활화에 관한 부가적인 개시물을 제공하려는 목적으로, 참조로서 본 명세서에 포함되어 있다.
양자화기에 대한 입력 신호가 매우 평활한 경우, 양자화의 출력 공간에서의 값들 사이의 최소 스텝에 따라, 양자화된 출력이 훨씬 덜 평활하다는 것이 종종 발생할 수도 있다. 이러한 영향은 가청 아티팩트를 야기할 수도 있고, 이득 계수 에 대한 이러한 영향을 감소시키는 것이 바람직할 수도 있다. 몇몇 경우에, 이득 계수 양자화 성능은, 시간적 잡음 정형을 포함하도록 양자화기 (430) 를 구현함으로써 개선될 수도 있다. 이러한 정형은 프레임-레벨 이득 계수 (S60bf) 및/또는 서브프레임 이득 계수 (S60bs) 에 적용될 수도 있다. 시간적 잡음 정형을 이용한 이득 계수의 양자화에 관한 부가적인 설명 및 도면은, 미국특허출원 제 11/408,390 호의 도 48 내지 도 55b 및 (단락 [000254] 내지 [000272] 를 포함하여) 수반하는 텍스트에서 확인될 수도 있고, 이 자료는, 참조로서 포함을 허용하는 미국 및 임의의 다른 관할권에서, 시간적 잡음 정형을 이용한 이득 계수의 양자화에 관한 부가적인 개시물을 제공하려는 목적으로, 참조로서 본 명세서에 포함되어 있다.
고대역 여기 신호 (S120) 가 정규화된 여기 신호로부터 도출되는 경우에 있어서, 소스 여기 신호의 시간-왜곡 (time-warping) 에 따라 고대역 신호 (S30) 의 시간적 엔벌로프를 시간-왜곡하는 것이 요구될 수도 있다. 이러한 시간-왜곡에 관한 부가적인 설명 및 도면은, 2006 년 4 월 3 일 출원되었고, 발명의 명칭이 "SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND TIME WARPING" 이며, Vos 등에 의한 미국특허출원인 대리인 참조번호 제 050550 호의 도 25 내지 도 29 및 (단락 [000157] 내지 [000187] 을 포함하여) 수반하는 텍스트에서 확인될 수도 있고, 이 자료는, 참조로서 포함을 허용하는 미국 및 임의의 다른 관할권에서, 고대역 신호 (S30) 의 시간적 엔벌로프의 시간-왜곡에 관한 부가적인 개시물을 제공하려는 목적으로, 참조로서 본 명세서에 포함되어 있다.
고대역 신호 (S30) 와 합성된 고대역 신호 (S130) 사이의 유사성 정도는, 디코딩된 고대역 신호 (S100) 가 얼마나 고대역 신호 (S30) 를 닮는지를 나타낼 수도 있다. 상세하게는, 고대역 신호 (S30) 의 시간적 엔벌로프와 합성된 고대역 신호 (S130) 의 시간적 엔벌로프 사이의 유사성은, 디코딩된 고대역 신호 (S100) 가 양호한 음질을 가지며 고대역 신호 (S30) 와 지각적으로 유사할 것으로 예상될 수 있다고 나타낼 수도 있다. 엔벌로프들 사이의 시간에 따른 큰 변동은, 합성된 신호가 오리지널과 매우 상이하다는 표시로서 취해질 수도 있고, 이러한 경우에 양자화 이전에 이들 이득 계수를 식별 및 감쇠시키는 것이 바람직할 수도 있다. 이러한 이득 계수 감쇠에 관한 부가적인 설명 및 도면은, 2006 년 4 월 21 일 출원되었고, 발명의 명칭이 "SYSTEMS, METHODS, AND APPARATUS FOR GAIN FACTOR ATTENUATION" 이며, Vos 등에 의한 미국특허출원인 대리인 참조번호 제 050558 호의 도 34 내지 도 39 및 (단락 [000222] 내지 [000236] 을 포함하여) 수반하는 텍스트에서 확인될 수도 있고, 이 자료는, 참조로서 포함을 허용하는 미국 및 임의의 다른 관할권에서, 이득 계수 감쇠에 관한 부가적인 개시물을 제공하려는 목적으로, 참조로서 본 명세서에 포함되어 있다.
도 24 는 고대역 디코더 (B200) 의 일 구현 (B202) 의 블록도이다. 고대역 디코더 (B202) 는, 협대역 여기 신호 (S80) 에 기초하여 고대역 여기 신호 (S120) 를 생성하도록 구성되는 고대역 여기 발생기 (B300) 를 포함한다. 특정 시스템 설계 선택에 종속하여, 고대역 여기 발생기 (B300) 는 본 명세서에 기재된 바와 같이 임의의 고대역 여기 발생기 (A300) 의 구현에 따라 구현될 수도 있다. 통상적으로, 특정 코딩 시스템의 고대역 인코더의 고대역 여기 발생기와 동일한 응답을 갖도록 고대역 여기 발생기 (B300) 를 구현하는 것이 바람직하다. 그러나, 협대역 디코더 (B110) 가 통상적으로 인코딩된 협대역 여기 신호 (S50) 의 역양자화를 수행하기 때문에, 대부분의 경우에 고대역 여기 발생기 (B300) 는 협대역 디코더 (B110) 로부터 협대역 여기 신호 (S80) 를 수신하도록 구현될 수도 있고, 인코딩된 협대역 여기 신호 (S50) 를 역양자화하도록 구성된 역양자화기를 포함할 필요가 없다. 또한, 협대역 디코더 (B110) 가, 협대역 합성 필터 (330) 와 같은 협대역 합성 필터로 입력되기 이전에 역양자화된 협대역 여기 신호를 필터링하도록 배열된 반-희소성 필터 (600) 의 예시를 포함하도록 구현되는 것도 가능하다.
역양자화기 (560) 는 고대역 필터 파라미터 (S60a) 를 (이 실시예에 있어서, LSF 의 세트로) 역양자화하도록 구성되고, LSF-대-LP 필터 계수 변환 (570) 은 (예를 들어, 협대역 인코더 (A122) 의 역양자화기 (240) 및 LSF-대-LP 필터 계수 변환 (250) 과 관련하여 전술한 바와 같이) LSF 를 필터 계수의 세트로 변환하도록 구성된다. 다른 구현에 있어서, 전술한 바와 같이, 상이한 계수 세트 (예를 들어, 캡스트럼 계수) 및/또는 계수 표현 (예를 들어, ISP) 이 이용될 수도 있다. 고대역 합성 필터 (B204) 는 필터 계수의 세트 및 고대역 여기 신호 (S120) 에 따라 합성된 고대역 신호를 생성하도록 구성된다. 고대역 인코더가 (예를 들어, 전술한 고대역 인코더 (A202) 의 실시예에서와 같이) 합성 필터를 포함하는 시스템에 있어서, 합성 필터와 동일한 응답 (예를 들어, 동일한 전달 함수) 을 갖도록 고대역 합성 필터 (B204) 를 구현하는 것이 바람직할 수도 있다.
또한, 고대역 디코더 (B202) 는, 고대역 이득 계수 (S60b) 를 역양자화하도록 구성된 역양자화기 (580), 및 합성된 고대역 신호에 역양자화된 이득 계수를 적용하여 고대역 신호 (S100) 를 생성하도록 구성 및 배열된 이득 제어 엘리먼트 (590 ; 예를 들어, 승산기 또는 증폭기) 를 포함한다. 프레임의 이득 엔벌로프가 2 이상의 이득 계수로 특정되는 경우에 있어서, 이득 제어 엘리먼트 (590) 는, 가능하게는 대응하는 고대역 인코더의 이득 계산기 (예를 들어, 고대역 이득 계수 계산기 (A230)) 에 의해 적용된 바와 동일하거나 상이한 윈도우 함수일 수도 있는 윈도우 함수에 따라, 각각의 서브프레임에 이득 계수를 적용하도록 구성된 로직을 포함할 수도 있다. 고대역 디코더 (B202) 의 다른 구현에 있어서, 이득 제어 엘리먼트 (590) 는 유사하게 구성되지만, 대신에 협대역 여기 신호 (S80) 또는 고대역 여기 신호 (S120) 에 역양자화된 이득 계수를 적용하도록 배열된다. 또한, 이득 제어 엘리먼트 (590) 는, (예를 들어, 프레임-레벨 이득 계수에 따라 입력 신호를 정규화하고, 서브프레임 이득 계수의 세트에 따라 그 결과적인 신호를 정형하기 위해서) 2 이상의 시간적 분해능으로 이득 계수를 적용하도록 구현될 수도 있다.
도 8 에 도시된 바와 같은 패러다임에 따른 협대역 디코더 (B110) 의 일 구현은, 장기 구조 (피치 또는 고조파 구조) 가 복구된 이후에 협대역 여기 신호 (S80) 를 고대역 디코더 (B200) 로 출력하도록 구성될 수도 있다. 예를 들어, 이러한 디코더는 협대역 여기 신호 (S80) 를 인코딩된 협대역 여기 신호 (S50) 의 역양자화된 버전으로서 출력하도록 구성될 수도 있다. 물론, 고대역 디코더 (B200) 가 인코딩된 협대역 여기 신호 (S50) 의 역양자화를 수행하여 협대역 여기 신호 (S80) 를 획득하도록 협대역 디코더 (B110) 를 구현하는 것도 가능하다.
주로 고대역 인코딩에 적용된 바와 같이 기재되었지만, 본 명세서에 개시된 원리는 음성 신호의 또다른 서브대역에 대한 음성 신호의 하나의 서브대역의 임의의 코딩에 적용될 수도 있다. 예를 들어, 인코더 필터 뱅크는 저대역 신호를 (하나 이상의 고대역 신호에 대한 대안에 있어서 또는 이에 부가하여) 저대역 인코더로 출력하도록 구성될 수도 있고, 저대역 인코더는, 저대역 신호의 스펙트럼 분석을 수행하고, 인코딩된 협대역 여기 신호를 확장하고, 오리지널 저대역 신호에 관하여 인코딩된 저대역 신호에 대한 이득 엔벌로프를 계산하도록 구성될 수도 있다. 이들 동작 각각에 있어서, 저대역 인코더가 본 명세서에 기재된 바와 같이 임의의 변동의 전범위에 따라 이러한 동작을 수행하도록 구성될 수도 있다는 것은 명백하게 심사숙고되며 본 명세서에 개시되어 있다.
기재된 구성의 전술한 설명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 명세서에 개시된 구조 및 원리를 실시 또는 이용하는 것을 가능하게 하도록 제공된다. 이들 구성에 대한 각종 변경이 가능하고, 본 명세서에 제공된 일반적인 원리는 또한 다른 구성에 적용될 수도 있다. 예를 들어, 일 구성은, 배선에 의해 접속된 (hard-wired) 회로로서, 주문형 집적 회로로 제조된 회로 구성으로서, 또는 비휘발성 스토리지로 로딩된 펌웨어 프로그램이나 머신 판독가능 코드로서 데이터 저장 매체로부터 또는 이 데이터 저장 매체로 로딩된 소프트웨어 프로그램으로서 부분적으로 또는 전체적으로 구현될 수도 있는데, 이러한 머 신 판독가능 코드는 마이크로프로세서나 다른 디지털 신호 처리 유닛과 같은 논리 엘리먼트의 어레이에 의해 실행가능한 명령들이다. 데이터 저장 매체는, (동적 또는 정적 RAM (Random Access Memory), ROM (Read Only Memory), 및/또는 플래시 RAM 을 포함할 수도 있지만 이에 제한되지는 않는) 반도체 메모리, 또는 강유전체, 자기저항, 오보닉, 중합, 또는 상-변화 메모리와 같은 저장 엘리먼트의 어레이; 또는 자기 또는 광학 디스크와 같은 디스크 매체일 수도 있다. "소프트웨어" 라는 용어는, 소스 코드, 어셈블리 언어 코드, 머신 코드, 바이너리 코드, 펌웨어, 매크로코드, 마이크로코드, 논리 엘리먼트의 어레이에 의해 실행가능한 임의의 하나 이상의 명령들 세트 또는 시퀀스, 및 이러한 예시의 임의의 조합을 포함하는 것으로 이해되어야 한다.
고대역 이득 계수 계산기 (A230), 고대역 인코더 (A200), 고대역 디코더 (B200), 광대역 음성 인코더 (A100), 및 광대역 음성 디코더 (B100) 의 구현의 각종 엘리먼트는, 예를 들어 칩셋에서 2 개 이상의 칩들 사이에 또는 동일한 칩 상에 존재하는 전자 및/또는 광학 디바이스로서 구현될 수도 있지만, 또한 이러한 제한 없이 다른 배열도 심사숙고된다. 이러한 장치의 하나 이상의 엘리먼트 (예를 들어, 고대역 이득 계수 계산기 (A230), 양자화기 (430) 및/또는 제한기 (L10)) 는, 마이크로프로세서, 임베디드 프로세서, IP 코더, 디지털 신호 프로세서, FPGA (Field Programmable Gate Array), ASSP (Application Specific Standard Product), 및 ASIC (Application Specific Integrated Circuit) 와 같은 논리 엘리먼트 (예를 들어, 트랜지스터, 게이트) 의 하나 이상의 고정된 또는 프로그래머블 어레이 상에서 실행되도록 배열된 하나 이상의 명령들 세트로서 부분적으로 또는 전체적으로 구현될 수도 있다. 또한, 하나 이상의 이러한 엘리먼트가 공통 구조 (예를 들어, 상이한 시점에 상이한 엘리먼트에 대응하는 코드의 부분을 실행하는데 사용되는 프로세서, 상이한 시점에 상이한 엘리먼트에 대응하는 태스크를 수행하도록 실행되는 명령들 세트, 또는 상이한 시점에 상이한 엘리먼트에 대한 동작을 수행하는 전자 및/또는 광학 디바이스의 배열) 를 갖는 것이 가능하다. 또한, 하나 이상의 이러한 엘리먼트가, 장치가 임베디드되는 시스템 또는 디바이스의 또다른 동작에 관한 태스크와 같이, 이 장치의 동작에 직접적으로 관련되지 않은 다른 명령들 세트를 실행하거나 태스크를 수행하는데 사용되는 것이 가능하다.
또한, 구성은, 예를 들어 부가적인 음성 코딩 방법, 음성 인코딩 방법, 음성 디코딩 방법을 수행하도록 구성된 구조의 설명에 의해, 본 명세서에 명백하게 개시된 바와 같은 이러한 부가적인 음성 코딩 방법, 음성 인코딩 방법, 음성 디코딩 방법을 포함한다. 또한, 이들 방법 각각은, 논리 엘리먼트의 어레이를 포함한 머신 (예를 들어, 프로세서, 마이크로프로세서, 마이크로제어기, 또는 다른 유한 상태 머신) 에 의해 실행가능하고/하거나 판독가능한 하나 이상의 명령들 세트로서 (예를 들어, 전술한 바와 같은 하나 이상의 데이터 저장 매체에) 유형적으로 포함될 수도 있다. 예를 들어, 구성의 범위는 컴퓨터 판독가능 매체를 포함하는 컴퓨터 프로그램 제품을 포함하며, 상기 컴퓨터 판독가능 매체는,적어도 하나의 컴퓨터로 하여금, (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 상기 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하도록 하는 코드; 적어도 하나의 컴퓨터로 하여금, 상기 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하도록 하는 코드; 적어도 하나의 컴퓨터로 하여금, 상기 제 1 인덱스에 의해 표시된 양자화 값과 상기 이득 계수값 사이의 관계를 평가하도록 하는 코드; 및 적어도 하나의 컴퓨터로 하여금, 상기 평가의 결과에 따라, 제 2 인덱스를 상기 양자화 값들의 순서화된 세트로 선택하도록 하는 코드를 포함한다. 따라서, 본 개시물은 전술한 구성에 제한되도록 의도되는 것이 아니라, 오리지널 개시물의 일부를 형성하는 파일링된 바와 같은 첨부의 특허청구범위를 포함하여, 본 명세서에서 임의의 방식으로 개시된 원리 및 신규 특징에 부합하는 가장 광범위한 범위를 따르는 것이다.

Claims (47)

  1. (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 상기 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하는 단계;
    상기 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하는 단계;
    상기 제 1 인덱스에 의해 표시된 양자화 값과 상기 이득 계수값 사이의 관계를 평가하는 단계; 및
    상기 평가의 결과에 따라, 제 2 인덱스를 상기 양자화 값들의 순서화된 세트로 선택하는 단계를 포함하고,
    상기 관계를 평가하는 단계는, 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값을 초과하는지 여부를 판정하는 단계를 포함하는, 음성 처리 방법.
  2. 제 1 항에 있어서,
    상기 제 1 신호의 시간에서의 일부는 상기 제 1 신호의 프레임이고, 상기 제 2 신호의 시간에서의 대응하는 부분은 상기 제 2 신호의 프레임인, 음성 처리 방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 서브대역은 고대역 신호이고,
    상기 제 2 서브대역은 협대역 신호인, 음성 처리 방법.
  4. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 서브대역은 고대역 신호이고,
    상기 제 2 신호는 상기 고대역 신호의 합성된 버전인, 음성 처리 방법.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 제 2 신호는 또한 상기 1 서브대역으로부터 도출된 성분에 기초하는, 음성 처리 방법.
  6. 제 5 항에 있어서,
    상기 제 1 서브대역으로부터 도출된 성분은 상기 제 1 서브대역의 스펙트럼 엔벌로프인, 음성 처리 방법.
  7. 제 1 항 또는 제 2 항에 있어서,
    상기 음성 신호의 제 2 서브대역으로부터 도출된 성분은 인코딩된 여기 신호인, 음성 처리 방법.
  8. 제 7 항에 있어서,
    상기 제 2 신호는 또한 상기 제 1 서브대역의 스펙트럼 엔벌로프에 기초하는, 음성 처리 방법.
  9. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 신호의 시간에서의 일부와 상기 제 2 신호의 시간에서의 대응하는 부분 사이의 관계는, 상기 제 1 신호의 시간에서의 일부의 에너지의 측정치와 상기 제 2 신호의 시간에서의 대응하는 부분의 에너지의 측정치 사이의 관계인, 음성 처리 방법.
  10. 제 9 항에 있어서,
    상기 이득 계수값을 계산하는 단계는, 상기 제 1 신호의 시간에서의 일부의 에너지의 측정치와 상기 제 2 신호의 시간에서의 대응하는 부분의 에너지의 측정치 사이의 비율에 기초하여 상기 이득 계수값을 계산하는 단계를 포함하는, 음성 처리 방법.
  11. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 인덱스를 선택하는 단계는, 복수의 상기 양자화 값들 각각과 상기 이득 계수값을 비교하는 단계를 포함하는, 음성 처리 방법.
  12. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하는, 음성 처리 방법.
  13. 삭제
  14. 제 1 항 또는 제 2 항에 있어서,
    상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값을 초과하는지 여부를 판정하는 단계는, (C) 상기 제 1 인덱스에 의해 표시된 양자화 값이 특정량만큼 상기 이득 계수값을 초과하는지 여부를 판정하는 단계, 및 (D) 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값의 특정 비율만큼 상기 이득 계수값을 초과하는지 여부를 판정하는 단계 중에서 적어도 하나를 포함하는, 음성 처리 방법.
  15. 제 1 항 또는 제 2 항에 있어서,
    상기 제 2 인덱스를 선택하는 단계는, 상기 제 1 인덱스를 감분하는 단계를 포함하는, 음성 처리 방법.
  16. 삭제
  17. 제 1 항 또는 제 2 항에 있어서,
    상기 제 2 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값을 초과하지 않으면서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하는, 음성 처리 방법.
  18. 제 1 항 또는 제 2 항에 있어서,
    상기 음성 처리 방법은 상기 제 2 인덱스에 의해 표시된 양자화 값을 사용하여 복수의 서브프레임 이득 계수들의 각각을 정규화하는 단계를 포함하는, 음성 처리 방법.
  19. 제 1 항 또는 제 2 항에 있어서,
    상기 제 2 인덱스를 선택하는 단계는, 상기 제 2 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값의 특정 비율 내에 있는지 여부를 판정하는 단계를 포함하는, 음성 처리 방법.
  20. 컴퓨터 판독가능 매체로서,
    적어도 하나의 컴퓨터로 하여금, (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 상기 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하도록 하는 코드;
    적어도 하나의 컴퓨터로 하여금, 상기 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하도록 하는 코드;
    적어도 하나의 컴퓨터로 하여금, 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하도록 하는 코드; 및
    적어도 하나의 컴퓨터로 하여금, 상기 판정에 응답하여, 제 2 인덱스를 상기 양자화 값들의 순서화된 세트로 선택하도록 하는 코드를 포함하는, 컴퓨터 판독가능 매체.
  21. (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 상기 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하도록 구성된 계산기;
    상기 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하도록 구성된 양자화기; 및
    (A) 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하고, (B) 상기 판정에 응답하여, 제 2 인덱스를 상기 양자화 값들의 순서화된 세트로 선택하도록 구성된 제한기를 포함하는, 음성 처리 장치.
  22. 제 21 항에 있어서,
    상기 제 1 신호의 시간에서의 일부는 상기 제 1 신호의 프레임이고, 상기 제 2 신호의 시간에서의 대응하는 부분은 상기 제 2 신호의 프레임인, 음성 처리 장치.
  23. 제 21 항 또는 제 22 항에 있어서,
    상기 제 1 서브대역은 고대역 신호이고,
    상기 제 2 서브대역은 협대역 신호인, 음성 처리 장치.
  24. 제 21 항 또는 제 22 항에 있어서,
    상기 음성 신호의 제 2 서브대역으로부터 도출된 성분은 인코딩된 여기 신호인, 음성 처리 장치.
  25. 제 24 항에 있어서,
    상기 제 2 신호는 또한 상기 제 1 서브대역의 스펙트럼 엔벌로프에 기초하는, 음성 처리 장치.
  26. 제 21 항 또는 제 22 항에 있어서,
    상기 계산기는, 상기 제 1 신호의 시간에서의 일부의 에너지의 측정치와 상기 제 2 신호의 시간에서의 대응하는 부분의 에너지의 측정치 사이의 비율에 기초하여 상기 이득 계수값을 계산하도록 구성되는, 음성 처리 장치.
  27. 제 21 항 또는 제 22 항에 있어서,
    상기 제한기는, 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값을 초과한다고 판정함으로써, 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하도록 구성되는, 음성 처리 장치.
  28. 제 21 항 또는 제 22 항에 있어서,
    상기 제한기는, (C) 상기 제 1 인덱스에 의해 표시된 양자화 값이 특정량만큼 상기 이득 계수값을 초과한다고 판정하는 것, 및 (D) 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값의 특정 비율만큼 상기 이득 계수값을 초과한다고 판정하는 것 중 적어도 하나에 의해, 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하도록 구성되는, 음성 처리 장치.
  29. 제 21 항 또는 제 22 항에 있어서,
    상기 제 2 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값을 초과하지 않으면서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하는, 음성 처리 장치.
  30. 제 21 항 또는 제 22 항에 있어서,
    상기 제한기는, 상기 제 2 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값의 특정 비율 내에 있는지 여부를 판정하도록 구성되는, 음성 처리 장치.
  31. 제 21 항에 있어서,
    상기 음성 처리 장치는, 상기 제한기, 상기 양자화기 및 상기 계산기를 포함한 인코더를 갖는 셀룰러 전화기를 포함하는, 음성 처리 장치.
  32. 제 21 항에 있어서,
    상기 음성 처리 장치는, 인터넷 프로토콜의 일 버전에 따르는 포맷을 갖는 복수의 패킷들을 송신하도록 구성된 디바이스를 포함하고,
    상기 복수의 패킷들은, 상기 제 1 서브대역을 인코딩하는 파라미터들, 상기 제 2 서브대역을 인코딩하는 파라미터들, 및 상기 제 2 인덱스를 포함하는, 음성 처리 장치.
  33. (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 상기 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하는 수단;
    상기 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하는 수단; 및
    상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하고, 상기 판정에 응답하여 제 2 인덱스를 상기 양자화 값들의 순서화된 세트로 선택하는 수단을 포함하는, 음성 처리 장치.
  34. 제 33 항에 있어서,
    상기 음성 신호의 제 2 서브대역으로부터 도출된 성분은 인코딩된 여기 신호인, 음성 처리 장치.
  35. 제 34 항에 있어서,
    상기 제 2 신호는 또한 상기 제 1 서브대역의 스펙트럼 엔벌로프에 기초하는, 음성 처리 장치.
  36. 제 33 항 내지 제 35 항 중 어느 한 항에 있어서,
    상기 이득 계수값을 계산하는 수단은, 상기 제 1 신호의 시간에서의 일부의 에너지의 측정치와 상기 제 2 신호의 시간에서의 대응하는 부분의 에너지의 측정치 사이의 비율에 기초하여 상기 이득 계수값을 계산하도록 구성되는, 음성 처리 장치.
  37. 제 33 항 내지 제 35 항 중 어느 한 항에 있어서,
    상기 제 1 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하고,
    상기 제 2 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값을 초과하지 않으면서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하는, 음성 처리 장치.
  38. 제 20 항에 있어서,
    상기 제 1 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하고,
    상기 제 2 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값을 초과하지 않으면서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하는, 컴퓨터 판독가능 매체.
  39. 제 20 항에 있어서,
    상기 이득 계수값에 기초한 값은 상기 이득 계수값이고,
    적어도 하나의 컴퓨터로 하여금, 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하도록 하는 상기 코드는, 상기 적어도 하나의 컴퓨터로 하여금 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값을 초과한다고 판정하도록 하는 코드를 포함하는, 컴퓨터 판독가능 매체.
  40. (A) 음성 신호의 제 1 서브대역에 기초한 제 1 신호의 시간에서의 일부와 (B) 상기 음성 신호의 제 2 서브대역으로부터 도출된 성분에 기초한 제 2 신호의 시간에서의 대응하는 부분 사이의 관계에 기초하여, 이득 계수값을 계산하는 단계;
    상기 이득 계수값에 따라, 제 1 인덱스를 양자화 값들의 순서화된 세트로 선택하는 단계;
    상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하는 단계; 및
    상기 판정에 응답하여, 제 2 인덱스를 상기 양자화 값들의 순서화된 세트로 선택하는 단계를 포함하는, 음성 처리 방법.
  41. 제 40 항에 있어서,
    상기 이득 계수값에 기초한 값은 상기 이득 계수값이고,
    상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하는 단계는, 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값을 초과한다고 판정함으로써 수행되는, 음성 처리 방법.
  42. 제 40 항 또는 제 41 항에 있어서,
    상기 제 1 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하고,
    상기 제 2 인덱스는, 상기 양자화 값들의 순서화된 세트 중에서 상기 이득 계수값을 초과하지 않으면서 상기 이득 계수값에 가장 근접한 양자화 값을 표시하는, 음성 처리 방법.
  43. 제 40 항에 있어서,
    상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값에 기초한 값 이상이라고 판정하는 단계는, (C) 상기 제 1 인덱스에 의해 표시된 양자화 값이 특정량만큼 상기 이득 계수값을 초과하는지 여부를 판정하는 단계, 및 (D) 상기 제 1 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값의 특정 비율만큼 상기 이득 계수값을 초과하는지 여부를 판정하는 단계 중에서 적어도 하나를 포함하는, 음성 처리 방법.
  44. 제 40 항, 제 41 항 및 제 43 항 중 어느 한 항에 있어서,
    상기 음성 처리 방법은 상기 제 2 인덱스에 의해 표시된 양자화 값을 사용하여 복수의 서브프레임 이득 계수들의 각각을 정규화하는 단계를 포함하는, 음성 처리 방법.
  45. 제 40 항, 제 41 항 및 제 43 항 중 어느 한 항에 있어서,
    상기 제 2 인덱스를 선택하는 단계는 상기 제 2 인덱스에 의해 표시된 양자화 값이 상기 이득 계수값의 특정 비율 내에 있는지 여부를 판정하는 단계를 포함하는, 음성 처리 방법.
  46. 실행시 적어도 하나의 컴퓨터로 하여금 제 1 항, 제 2 항, 제 40 항, 제 41 항 및 제 43 항 중 어느 한 항에 기재된 방법을 수행하도록 하는 명령들을 저장하는, 컴퓨터 판독가능 데이터 저장 매체.
  47. 제 21 항 또는 제 22 항에 있어서,
    상기 음성 처리 장치는 상기 제 2 인덱스에 의해 표시된 양자화 값을 사용하여 복수의 서브프레임 이득 계수들의 각각을 정규화하도록 구성된 정규화기를 포함하는, 음성 처리 장치.
KR1020097001288A 2006-07-31 2007-07-31 이득 계수 제한을 위한 시스템, 방법 및 장치 KR101078625B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US83465806P 2006-07-31 2006-07-31
US60/834,658 2006-07-31
US11/610,104 US9454974B2 (en) 2006-07-31 2006-12-13 Systems, methods, and apparatus for gain factor limiting
US11/610,104 2006-12-13

Publications (2)

Publication Number Publication Date
KR20090025349A KR20090025349A (ko) 2009-03-10
KR101078625B1 true KR101078625B1 (ko) 2011-11-01

Family

ID=38987459

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097001288A KR101078625B1 (ko) 2006-07-31 2007-07-31 이득 계수 제한을 위한 시스템, 방법 및 장치

Country Status (11)

Country Link
US (1) US9454974B2 (ko)
EP (1) EP2047466B1 (ko)
JP (1) JP5290173B2 (ko)
KR (1) KR101078625B1 (ko)
CN (1) CN101496101B (ko)
BR (1) BRPI0715516B1 (ko)
CA (1) CA2657910C (ko)
ES (1) ES2460893T3 (ko)
RU (1) RU2420817C2 (ko)
TW (1) TWI352972B (ko)
WO (1) WO2008030673A2 (ko)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8725501B2 (en) * 2004-07-20 2014-05-13 Panasonic Corporation Audio decoding device and compensation frame generation method
JP4954080B2 (ja) 2005-10-14 2012-06-13 パナソニック株式会社 変換符号化装置および変換符号化方法
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
WO2009116815A2 (en) * 2008-03-20 2009-09-24 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding using bandwidth extension in portable terminal
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
EP2490217A4 (en) 2009-10-14 2016-08-24 Panasonic Ip Corp America ENCODING DEVICE, ENCODING METHOD AND CORRESPONDING METHODS
CA2779453C (en) * 2009-12-07 2015-12-22 Dolby Laboratories Licensing Corporation Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation
AU2011358654B2 (en) * 2011-02-09 2017-01-05 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals
WO2012112357A1 (en) * 2011-02-16 2012-08-23 Dolby Laboratories Licensing Corporation Methods and systems for generating filter coefficients and configuring filters
CN103295578B (zh) 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
EP2830062B1 (en) * 2012-03-21 2019-11-20 Samsung Electronics Co., Ltd. Method and apparatus for high-frequency encoding/decoding for bandwidth extension
CN103928031B (zh) 2013-01-15 2016-03-30 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
WO2014181330A1 (en) * 2013-05-06 2014-11-13 Waves Audio Ltd. A method and apparatus for suppression of unwanted audio signals
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
FR3008533A1 (fr) * 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US9384746B2 (en) * 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
KR102271852B1 (ko) * 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
CN104681032B (zh) * 2013-11-28 2018-05-11 中国移动通信集团公司 一种语音通信方法和设备
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
CN105336336B (zh) * 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN106228991B (zh) * 2014-06-26 2019-08-20 华为技术有限公司 编解码方法、装置及系统
US9595269B2 (en) 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
US10020002B2 (en) * 2015-04-05 2018-07-10 Qualcomm Incorporated Gain parameter estimation based on energy saturation and signal scaling
US10499165B2 (en) * 2016-05-16 2019-12-03 Intricon Corporation Feedback reduction for high frequencies
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2893691B2 (ja) 1988-11-25 1999-05-24 ソニー株式会社 デイジタル信号処理装置
JPH0828875B2 (ja) 1989-08-21 1996-03-21 三菱電機株式会社 符号化装置および復号化装置
IT1257431B (it) * 1992-12-04 1996-01-16 Sip Procedimento e dispositivo per la quantizzazione dei guadagni dell'eccitazione in codificatori della voce basati su tecniche di analisi per sintesi
JP3498375B2 (ja) 1994-07-20 2004-02-16 ソニー株式会社 ディジタル・オーディオ信号記録装置
JPH08123500A (ja) 1994-10-24 1996-05-17 Matsushita Electric Ind Co Ltd ベクトル量子化装置
PL318012A1 (en) 1995-04-19 1997-05-12 Motorola Inc Method of and device for low speed encoding and decoding
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JP3353266B2 (ja) 1996-02-22 2002-12-03 日本電信電話株式会社 音響信号変換符号化方法
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
US6260010B1 (en) * 1998-08-24 2001-07-10 Conexant Systems, Inc. Speech encoder using gain normalization that combines open and closed loop gains
US6397178B1 (en) * 1998-09-18 2002-05-28 Conexant Systems, Inc. Data organizational scheme for enhanced selection of gain parameters for speech coding
US6324505B1 (en) * 1999-07-19 2001-11-27 Qualcomm Incorporated Amplitude quantization scheme for low-bit-rate speech coders
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US6885988B2 (en) * 2001-08-17 2005-04-26 Broadcom Corporation Bit error concealment methods for speech coding
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
US7047188B2 (en) * 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7242763B2 (en) * 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
DE602004007786T2 (de) * 2003-05-01 2008-04-30 Nokia Corp. Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
FI118550B (fi) 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7613607B2 (en) * 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
US7983904B2 (en) 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
US8892448B2 (en) * 2005-04-22 2014-11-18 Qualcomm Incorporated Systems, methods, and apparatus for gain factor smoothing
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding

Also Published As

Publication number Publication date
ES2460893T3 (es) 2014-05-14
WO2008030673A3 (en) 2008-06-26
TW200820219A (en) 2008-05-01
BRPI0715516B1 (pt) 2019-12-10
US9454974B2 (en) 2016-09-27
US20080027718A1 (en) 2008-01-31
KR20090025349A (ko) 2009-03-10
EP2047466B1 (en) 2014-03-26
BRPI0715516A2 (pt) 2013-07-09
RU2009107198A (ru) 2010-09-10
CA2657910C (en) 2015-04-28
WO2008030673A2 (en) 2008-03-13
CN101496101B (zh) 2013-01-23
TWI352972B (en) 2011-11-21
RU2420817C2 (ru) 2011-06-10
JP2009545775A (ja) 2009-12-24
EP2047466A2 (en) 2009-04-15
JP5290173B2 (ja) 2013-09-18
CA2657910A1 (en) 2008-03-13
CN101496101A (zh) 2009-07-29

Similar Documents

Publication Publication Date Title
KR101078625B1 (ko) 이득 계수 제한을 위한 시스템, 방법 및 장치
US10885926B2 (en) Classification between time-domain coding and frequency domain coding for high bit rates
EP1869670B1 (en) Method and apparatus for vector quantizing of a spectral envelope representation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140929

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160929

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170929

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180928

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190924

Year of fee payment: 9