KR100982638B1 - 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들 - Google Patents

고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들 Download PDF

Info

Publication number
KR100982638B1
KR100982638B1 KR1020077025293A KR20077025293A KR100982638B1 KR 100982638 B1 KR100982638 B1 KR 100982638B1 KR 1020077025293 A KR1020077025293 A KR 1020077025293A KR 20077025293 A KR20077025293 A KR 20077025293A KR 100982638 B1 KR100982638 B1 KR 100982638B1
Authority
KR
South Korea
Prior art keywords
signal
highband
narrowband
frequency portion
speech
Prior art date
Application number
KR1020077025293A
Other languages
English (en)
Other versions
KR20070118168A (ko
Inventor
코엔 버나드 보스
아난타파드마나반 에이. 칸다다이
Original Assignee
콸콤 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36588741&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100982638(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 콸콤 인코포레이티드 filed Critical 콸콤 인코포레이티드
Publication of KR20070118168A publication Critical patent/KR20070118168A/ko
Application granted granted Critical
Publication of KR100982638B1 publication Critical patent/KR100982638B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

일실시예에서, 신호 처리 방법은 적어도 인코딩된 협대역 여기 신호 및 다수의 협대역 필터 파라미터들로 음성 신호의 저주파수 부분을 인코딩하는 단계, 및 협대역 여기 신호에 기초하여 고대역 여기 신호를 생성하는 단계를 포함한다. 협대역 여기 신호는 인코딩된 협대역 여기 신호에 기초한다. 상기 방법은 또한 적어도 고대역 여기 신호에 따라서 음성 신호의 고주파수 부분을 적어도 다수의 고대역 필터 파라미터들로 인코딩하는 단계를 포함한다. 인코딩된 협대역 여기 신호는 시간 왜곡을 포함하고, 상기 방법은 시간 왜곡에 관한 정보에 기초하여 고주파수 부분에 시간 시프트를 적용하는 단계를 포함한다.

Description

고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들{SYSTEMS, METHODS, AND APPARATUS FOR HIGHBAND TIME WARPING}
본 출원은 2005년 4월 1일에 미국 가특허 출원된 제 60/667,901호 "CODING THE HIGH-FREQUENCY BAND OF WIDEBAND SPEECH"의 우선권을 청구한다. 본 출원은 또한 2005년 4월 22일에 미국 가특허 출원된 제 60/673,965호 "PARAMETER CODING IN A HIGH-BAND SPEECH CODER"의 우선권을 청구한다.
본 발명은 신호 처리에 관한 것이다.
PSTN(public switched telephone network)를 통한 음성 통신들은 통상적으로 300 내지 3400 kHz의 주파수 범위로 대역폭이 제한되어 왔다. 셀룰러 전화통신 및 IP를 통한 음성(인터넷 프로토콜, VoIP)과 같은 음성 통신들을 위한 새로운 네트워크들은 동일한 대역폭 제한치들을 갖지 않을 수 있고, 또한 그러한 네트워크들을 통해서 광대역 주파수 범위를 포함하는 음성 통신들을 전송 및 수신하는 것이 바람직할 수 있다. 예컨대, 50 Hz까지 아래로 확장하거나 및/또는 7 또는 8 kHz까지 위로 확장하는 오디오 주파수를 지원하는 것이 바람직할 수 있다. 통상적인 PSTN 제한치들 밖의 범위에 있는 오디오 음성 컨텐트를 가질 수 있는, 고품질 오디오 또는 오디오/비디오 회의와 같은 다른 애플리케이션들을 지원하는 것이 또한 바람직 할 수 있다.
음성 코더에 의해 지원되는 범위를 더 높은 주파수들로 확장하는 것은 음성인식도(intelligibility)를 향상시킬 수 있다. 예컨대, 's' 및 'f'와 같은 마찰음들을 구별하는 정보는 대부분 고주파수들 내에 있다. 고대역 확장은 또한 프리센스(presence)와 같은 음성의 다른 품질들을 향상시킬 수 있다. 예컨대, 심지어 유성음 모음은 PSTN 제한치보다 훨씬 위의 스펙트럼 에너지를 가질 수 있다.
광대역 음성 코딩을 위한 한 해결방법은 광대역 스펙트럼을 커버하기 위해서 협대역 음성 코딩 기술(예컨대, 0 내지 4 kHz의 범위를 인코딩하도록 구성된 기술)을 스케일링하는 것을 포함한다. 예컨대, 음성 신호는 고주파수들의 성분들을 포함하도록 더 높은 속도로 샘플링될 수 있고, 협대역 코딩 기술은 이러한 광대역 신호를 나타내기 위해서 더 많은 필터 계수들을 사용하도록 재구성될 수 있다. 그러나 CELP(codebook excited linear prediction)와 같은 협대역 코딩 기술들은 계산 집약적이고, 광대역 CELP 코더는 많은 이동 및 다른 구현될 애플리케이션들에 대해 실용적일 처리 사이클들을 너무 많이 소모할 수 있다. 광대역 신호의 전체 스펙트럼을 이러한 기술을 사용하여 원하는 품질로 인코딩하는 것은 용인할 수 없을 정도로 큰 대역폭 증가를 또한 초래할 수 있다. 게다가, 이러한 인코딩된 신호의 트랜스코딩은 그 신호의 협대역 부분이 협대역 코딩을 단지 지원하는 시스템에 의해서 전송 및/또는 디코딩될 수 있다.
광대역 음성 코딩에 대한 다른 해결방법은 인코딩된 협대역 스펙트럼 포락선으로부터 고대역 스펙트럼 포락선을 외삽(extrapolating)하는 것을 포함한다. 비 록 이러한 해결방법은 어떠한 대역폭의 증가가 없이도 그리고 트랜스코딩을 필요로 하지 않고도 구현될 수 있지만, 음성 신호의 고대역 부분의 대략적인 스펙트럼 포락선 또는 포먼트 구조(formant structure)는 일반적으로 협대역 부분의 스펙트럼 포락선으로부터 정확히 예측될 수 없다.
인코딩된 신호의 적어도 협대역 부분이 트랜스코딩이나 다른 중요한 변경이 없이도 (PSTN 채널과 같은)협대역 채널을 통해 전송될 수 있도록 광대역 음성 코딩을 구현하는 것이 바람직할 수 있다. 광대역 코딩 확장의 효율성은 또한, 예컨대, 무선 셀룰러 전화통신과 유선 및 무선 채널들을 통한 방송과 같은 애플리케이션들에서 서비스될 수 있는 사용자들의 수의 상당한 감소를 방지하는데 있어 바람직할 수 있다.
일실시예에서, 신호 처리 방법은 적어도 인코딩된 저대역 여기 신호 및 다수의 저대역 필터 파라미터들로 음성 신호의 저주파수 부분을 인코딩하는 단계; 및 상기 인코딩된 저대역 여기 신호에 기초하여 고대역 여기 신호를 생성하는 단계를 포함한다. 상기 방법은 또한 적어도 고대역 여기 신호에 따라 적어도 다수의 고대역 필터 파라미터들로 음성 신호의 고주파수 부분을 인코딩하는 단계를 포함한다. 이 방법에서, 인코딩된 저대역 여기 신호는 시변적인 시간 왜곡에 따라 음성 신호에 대해 시간에 걸쳐 왜곡되는 신호를 나타낸다. 상기 방법은, 시간 왜곡에 관한 정보에 기초하여, 다수의 상이한 시간 시프트들을 음성 신호의 고주파수 부분의 상응하는 다수의 시간적으로 연속적인 부분들에 적용하는 단계를 포함한다. 상기 방법은 또한 시간-시프트된 고주파수 부분을 (A) 다수의 고대역 필터 파라미터들 및 (B) 다수의 고대역 이득 팩터들(highband gain factors) 중 적어도 하나로 인코딩하는 단계를 포함한다.
다른 실시예에서, 신호 처리 장치는 적어도 인코딩된 저대역 여기 신호 및 다수의 저대역 필터 파라미터들로 음성 신호의 저주파수 부분을 인코딩하도록 구성된 저대역 음성 인코더; 및 상기 인코딩된 저대역 여기 신호에 기초하여 고대역 여기 신호를 생성하도록 구성되는 고대역 음성 인코더를 포함한다. 본 장치에서, 고대역 인코더는 적어도 고대역 여기 신호에 따라 적어도 다수의 고대역 필터 파라미터들로 음성 신호의 고주파수 부분을 인코딩하도록 구성된다. 본 장치에서, 협대역 음성 인코더는 인코딩된 협대역 여기 신호에 포함되어 있는 음성 신호에 대해서 시변적인 시간 왜곡을 나타내는 조정 데이터 신호를 출력하도록 구성된다. 상기 장치는 고주파수 부분의 상응하는 다수의 시간적으로 연속적인 부분들에 다수의 상이한 시간 시프트들을 적용하고 시간-시프트된 고주파수 부분을 (A) 다수의 고대역 필터 파라미터들 및 (B) 다수의 고대역 이득 팩터들(highband gain factors) 중 적어도 하나로 인코딩하도록 구성되는 지연 라인을 포함하고, 여기서 상기 다수의 상이한 시간 시프트들은 조정 데이터 신호에 기초한다.
다른 실시예에서, 신호 처리 장치는 적어도 인코딩된 저대역 여기 신호 및 다수의 저대역 필터 파라미터들로 음성 신호의 저주파수 부분을 인코딩하기 위한 수단; 상기 인코딩된 저대역 여기 신호에 기초하여 고대역 여기 신호를 생성하기 위한 수단; 및 적어도 고대역 여기 신호에 따라서, 적어도 다수의 고대역 필터 파라미터들로 음성 신호의 고주파수 부분을 인코딩하기 위한 수단을 포함한다. 본 장치에서, 인코딩된 협대역 여기 신호는 시변적인 시간 왜곡에 따라 음성 신호에 대해 시간에 걸쳐 왜곡되는 신호를 나타낸다. 본 장치는, 시간 왜곡에 관한 정보에 기초하여, 다수의 상이한 시간 시프트들을 고주파수 부분의 상응하는 다수의 시간적으로 연속적인 부분들에 적용하기 위한 수단을 포함한다. 본 장치는 상기 장치는 시간-시프트된 고주파수 부분을 (A) 다수의 고대역 필터 파라미터들 및 (B) 다수의 고대역 이득 팩터들(highband gain factors) 중 적어도 하나로 인코딩하기 위한 수단을 포함한다.
도 1은 실시예에 따른 광대역 음성 인코더(A100)의 블록도.
도 1b는 광대역 음성 인코더(A100)의 구현(A102)에 대한 블록도.
도 2a는 실시예에 따른 광대역 음성 디코더(B100)의 블록도.
도 2b는 광대역 음성 인코더(B100)의 구현(B102)에 대한 블록도.
도 3a는 필터 뱅크(A110)의 구현(A112)에 대한 블록도.
도 3b는 필터 뱅크(B120)의 구현(B122)에 대한 블록도.
도 4a는 필터 뱅크(A110)의 일예에 대한 저대역 및 고대역의 대역폭 커버리지를 나타내는 도면.
도 4b는 필터 뱅크(A110)의 일예에 대한 저대역 및 고대역의 대역폭 커버리지를 나타내는 도면.
도 4c는 필터 뱅크(A112)의 구현(A114)에 대한 블록도.
도 4d는 필터 뱅크(B122)의 구현(B124)에 대한 블록도.
도 5a는 음선 신호에 대한 주파수-대-로그진폭의 예를 나타내는 도면.
도 5b는 기본적인 선형 예측 코딩 시스템의 블록도.
도 6은 협대역 인코더(A120)의 구현(A122)에 대한 블록도.
도 7은 협대역 디코더(B110)의 구현(B112)에 대한 블록도.
도 8a는 유성음 음성에 대한 잔여 신호의 주파수-대-로그진폭의 예를 나타내는 도면.
도 8b는 유성음 음성에 대한 잔여 신호의 시간-대-로그진폭의 예를 나타내는 도면.
도 9는 장기 예측을 또한 수행하는 기본적인 선형 예측 코딩 시스템의 블록도.
도 10은 고대역 인코더(A200)의 구현(A202)에 대한 블록도.
도 11은 고대역 여기 생성기(A300)의 구현(A302)에 대한 블록도.
도 12는 스펙트럼 확장기(A400)의 구현(A402)에 대한 블록도.
도 12a는 스펙트럼 확장 동작의 일예에 있어서 여러 위치들에서의 신호 스펙트럼을 나타내는 도면.
도 12b는 스펙트럼 여기 동작의 다른 예에 있어서 여러 위치들에서의 신호 스펙트럼을 나타내는 도면.
도 13은 고대역 여기 생성기(A302)의 구현(A304)에 대한 블록도.
도 14는 고대역 여기 생성기(A302)의 구현(A306)에 대한 블록도.
도 15는 포락선 계산 작업(T100)에 대한 흐름도.
도 16은 결합기(490)의 구현(492)에 대한 블록도.
도 17은 고대역 신호(S30)의 주기성 측정을 계산하는 방법을 나타내는 도면.
도 18은 고대역 여기 생성기(A302)의 구현(A312)에 대한 블록도.
도 19는 고대역 여기 생성기(A302)의 구현(A314)에 대한 블록도.
도 20은 고대역 여기 생성기(A302)의 구현(A316)에 대한 블록도.
도 21은 이득 계산 작업(T200)에 대한 흐름도.
도 22는 이득 계산 작업(T200)의 구현(T210)에 대한 흐름도.
도 23a는 윈도우잉 함수를 나타내는 도면.
도 23b는 도 23a에 도시된 바와 같은 윈도우잉 함수를 음성 신호의 서브프레임들에 적용하는 것을 나타내는 도면.
도 24는 고대역 디코더(B200)의 구현(B202)에 대한 블록도.
도 25는 광대역 음성 인코더(A100)의 구현(AD10)에 대한 블록도.
도 26a는 지연 라인(D120)의 구현(D122)을 개략적으로 나타내는 도면.
도 26b는 지연 라인(D120)의 구현(D124)을 개략적으로 나타내는 도면.
도 27은 지연 라인(D120)의 구현(D130)을 개략적으로 나타내는 도면.
도 28은 광대역 음성 인코더(AD10)의 구현(AD12)에 대한 블록도.
도 29는 실시예에 따른 일반적인 처리 방법(MD100)에 대한 흐름도.
도 30은 실시예에 따른 방법(M100)의 흐름도.
도 31a는 실시예에 따른 방법(M200)의 흐름도.
도 31b는 방법(M200)의 구현(M120)에 대한 흐름도.
도 32는 실시예에 따른 방법(M300)의 흐름도.
도면들 및 첨부된 설명에서는, 동일한 참조 라벨들은 동일하거나 유사한 엘리먼트들이나 신호들을 나타낸다.
본 명세서에 설명되는 바와 같은 실시예들은 단지 대략 800 내지 1000 bps(bits per second)의 대역폭 증가 시에 광대역 음성 신호들의 전송 및/또는 저장을 지원하기 위해서 협대역 음성 코더에 확장을 제공하도록 구성될 수 있는 시스 템들, 방법들, 및 장치를 포함한다. 이러한 구현들의 잠재적인 장점들은 협대역 시스템들과의 호환성을 지원하기 위해 삽입되는 코딩, 협대역 및 고대역 코딩 채널들 사이의 비트들의 쉬운 할당 및 재할당, 계산 집약적인 광대역 합성 연산의 회피, 및 계산 집약적인 파형 코딩 루틴들에 의해 처리될 신호들에 대한 낮은 샘플링 속도 유지를 포함한다.
특별히 상황에 의해서 한정되지 않는 한, 용어 "계산"은 본 명세서에서 컴퓨팅, 생성, 및 값들 목록으로부터의 선택과 같은 본래의 의미들 중 임의의 의미를 나타내기 위해 사용된다. 용어 "포함하는"이 본 설명 및 청구범위에서 사용되는 경우에, 그것은 다른 엘리먼트들이나 동작들을 배제하지 않는다. 용어 "A가 B에 기초하는"은 (i) "A가 B와 동일하다는 것" 및 (ii) "A가 적어도 B에 기초하는 것"을 포함해서, 본래의 의미들 중 임의의 의미를 나타내기 위해 사용된다. 용어 "인터넷 프로토콜"은 IETF(Internet Engineering Task Force) RFC(Request for Comments) 791에 개시된 바와 같은 버전 4와 또한 버전 6과 같은 후속 버전들을 포함한다.
도 1a는 실시예에 따른 광대역 음성 인코더(A100)의 블록도를 나타낸다. 필터 뱅크(A110)는 협대역 신호(S20) 및 고대역 신호(S30)를 생성하기 위해서 광대역 음성 신호(S10)를 필터링하도록 구성된다. 협대역 인코더(A120)는 협대역(NB) 필터 파라미터들(S40) 및 협대역 잔여 신호(S50)를 생성하기 위해서 협대역 신호(S20)를 인코딩하도록 구성된다. 본 명세서에서 더욱 상세히 설명되는 바와 같이, 협대역 인코더(A120)는 통상적으로 협대역 필터 파라미터들(S40) 및 인코딩된 협대역 여기 신호(S50)를 코드북 인덱스들로서 또는 다른 양자화된 형태로 생성하도록 구성된다. 고대역 인코더(A200)는 고대역 코딩 파라미터들(S60)을 생성하기 위해서 인코딩된 협대역 여기 신호(S50) 내의 정보에 따라 고대역 신호(S30)를 인코딩하도록 구성된다. 본 명세서에서 더욱 상세히 설명되는 바와 같이, 고대역 인코더(A200)는 통상적으로 코드북 인덱스들로서 또는 다른 양자화된 형태로 고대역 코딩 파라미터들(S60)을 생성하도록 구성된다. 광대역 음성 인코더(A100)의 한 특정 예는 대략 8.55 kbps(kilobits per second)로 광대역 음성 신호(S10)를 인코딩하도록 구성되는데, 협대역 필터 파라미터들(S40) 및 인코딩된 협대역 여기 신호(S50)에 대해서는 대략 7.55 kbps가 사용되고, 고대역 코딩 파라미터들(S60)에 대해서는 대략 1 kbps가 사용된다.
인코딩된 협대역 및 고대역 신호들을 단일 비트스트림에 결합하는 것이 바람직할 수도 있다. 예컨대, 인코딩된 광대역 음성 신호로서 저장을 위해서나 또는 (예컨대, 유선, 광, 또는 무선 전송 채널을 통한) 전송을 위해서 인코딩된 신호들을 모두 멀티플렉싱하는 것이 바람직할 수도 있다. 도 1b는 협대역 필터 파라미터들(S40), 인코딩된 협대역 여기 신호(S50), 및 고대역 필터 파라미터들(S40)을 멀티플렉싱된 신호(S70)에 결합하도록 구성되는 멀티플렉서(A130)를 구비하고 있는 광대역 음성 인코더(A100)의 구현(A102)에 대한 블록도를 나타낸다.
인코더(A102)를 구비하고 있는 장치는 또한 멀티플렉싱된 신호(S70)를 유선, 광, 또는 무선 채널과 같은 전송 채널에 전송하도록 구성되는 회로를 포함할 수 있다. 이러한 장치는 또한 에러 정정 인코딩(예컨대, 속도-호환가능 컨볼루셔널 인 코딩), 및/또는 에러 검출 인코딩(예컨대, 순환 중복 인코딩)과 같은 하나 이상의 채널 인코딩 동작들, 및/또는 하나 이상의 네트워크 프로토콜 인코딩 층들(예컨대, 이더넷, TCP/IP, cdma2000)을 신호에 대해 수행하도록 구성될 수 있다.
인코딩된 협대역 신호가 고대역 및/또는 저대역 신호와 같은 멀티플렉싱된 신호(S70)의 다른 부분에 상관없이 복원되고 디코딩될 수 있도록 하기 위해서, 인코딩된 협대역 신호(협대역 필터 파라미터들(S40) 및 인코딩된 협대역 여기 신호(S50)를 포함함)를 멀티플렉싱된 신호(S70)의 분리가능한 서브스트림으로서 삽입하도록 멀티플렉서(A230)가 구성되는 것이 바람직할 수도 있다. 예컨대, 멀티플렉싱된 신호(S70)는 인코딩된 협대역 신호가 고대역 필터 파라미터들(S60)을 벗어버림으로써 복원될 수 있도록 배치될 수 있다. 이러한 특징의 한 잠재적인 장점은 협대역 신호의 디코딩을 지원하지만 고대역 부분의 디코딩은 지원하지 않는 시스템에 인코딩된 광대역 신호를 전송하기에 앞서서 상기 인코딩된 광대역 신호를 트랜스코딩해야 하는 필요성을 제거한다는 점이다.
도 2a는 실시예에 따른 광대역 음성 디코더(B100)의 블록도이다. 협대역 디코더(B110)는 협대역 신호(S90)를 생성하기 위해서 협대역 필터 파라미터들(S40) 및 인코딩된 협대역 여기 신호(S50)를 디코딩하도록 구성된다. 고대역 디코더(B200)는 고대역 신호(S100)를 생성하기 위해서, 인코딩된 협대역 여기 신호(S50)에 기초하여, 협대역 여기 신호(S80)에 따른 고대역 코딩 파라미터들(S60)을 디코딩하도록 구성된다. 본 예에서, 협대역 디코더(B110)는 협대역 여기 신호(S80)를 고대역 디코더(B200)에 제공하도록 구성된다. 필터 뱅크(B120)는 광대 역 음성 신호(S110)를 생성하기 위해서 협대역 신호(S90)와 고대역 신호(S100)를 결합하도록 구성된다.
도 2b는 멀티플렉싱된 신호(S70)로부터 인코딩된 신호들(S40, S50, 및 S60)을 생성하도록 구성되는 디멀티플렉서(B130)를 구비하는 광대역 음성 디코더(B100)의 구현(B102)에 대한 블록도이다. 디코더(B102)를 구비하는 장치는 유선, 광, 또는 무선 채널과 같은 전송 채널로부터 멀티플렉싱된 신호(S70)를 수신하도록 구성되는 회로를 포함할 수 있다. 이러한 장치는 또한 에러 정정 디코딩(예컨대, 속도-호환가능 컨볼루셔널 디코딩), 및/또는 에러 검출 디코딩(예컨대, 순환 중복 디코딩)과 같은 하나 이상의 채널 디코딩 동작들, 및/또는 하나 이상의 네트워크 프로토콜 디코딩 층들(예컨대, 이더넷, TCP/IP, cdma2000)을 신호에 대해 수행하도록 구성될 수 있다.
필터 뱅크(A110)는 저주파수 서브대역 및 고주파수 서브대역을 생성하기 위해서 분할-대역 방식에 따라 입력 신호를 필터링하도록 구성된다. 특정 애플리케이션에 대한 설계 기준에 따라, 출력 서브대역들은 동일하거나 동일하지 않은 대역폭들을 가질 수 있으며, 겹치거나 혹은 겹치지 않을 수 있다. 둘 보다 많은 수의 서브대역들을 생성하는 필터 뱅크(A110)의 구성이 또한 가능하다. 예컨대, 이러한 필터 뱅크는 협대역 신호(S20)의 (50 내지 300 Hz의 범위와 같은)주파수 범위보다 아래의 주파수 범위에 있는 성분들을 포함하는 하나 이상의 저대역 신호들을 생성하도록 구성될 수 있다. 이러한 필터 뱅크는 또한 고대역 신호(S30)의 (14 내지 20, 16 내지 20, 또는 16 내지 32 kHz의 범위와 같은)주파수 범위보다 위의 주파수 범위에 있는 성분들을 포함하는 하나 이상의 추가적인 고대역 신호들을 생성하도록 구성되는 것이 가능하다. 이러한 경우에, 광대역 음성 인코더(A100)는 이러한 신호나 신호들을 개별적으로 인코딩하도록 구현될 수 있고, 멀티플렉서(A130)는 (예컨대, 분리가능한 부분으로서) 멀티플렉싱된 신호(S70)에 상기 추가적인 인코딩된 신호나 신호들을 포함시키도록 구성될 수 있다.
도 3a는 감소된 샘플링 속도들을 갖는 두 개의 서브대역 신호들을 생성하도록 구성되는 필터 뱅크(A110)의 구현(A112)에 대한 블록도를 나타낸다. 필터 뱅크(A110)는 고주파수(또는 고대역) 부분 및 저주파수(또는 저대역) 부분을 갖는 광대역 음성 신호(S10)를 수신하도록 배치된다. 필터 뱅크(A112)는 광대역 음성 신호(S10)를 수신하여 협대역 음성 신호(S20)를 생성하도록 구성되는 저대역 처리 경로, 및 광대역 음성 신호(S10)를 수신하여 고대역 음성 신호(S30)를 생성하도록 구성되는 고대역 처리 경로를 구비한다. 저역통과 필터(110)는 선택된 저주파수 서브대역을 통과시키기 위해서 광대역 음성 신호(S10)를 필터링하고, 고역통과 필터(130)는 선택된 고주파수 서브대역을 통과시키기 위해서 광대역 음성 신호(S10)를 필터링한다. 두 서브대역 신호들은 광대역 음성 신호(S10)보다 더 좁은 대역폭을 갖기 때문에, 그들의 샘플 속도들은 정보의 손실이 없이 어느 정도 감소될 수 있다. 다운샘플러(120)는 원하는 데시메이션 팩터에 따라 저역통과 신호의 샘플링 속도를 감소시키고(예컨대, 신호의 샘플들을 제거함으로써 및/또는 샘플들을 평균 값들로 대체함으로써), 다운샘플러(140)도 마찬가지로 다른 원하는 데시메이션 팩터에 따라 고역통과 신호의 샘플링 속도를 감소시킨다.
도 3b는 필터 뱅크(B120)의 상응하는 구현(B122)에 대한 블록도를 나타낸다. 업샘플러(150)는 협대역 신호의 샘플링 속도를 증가시키고(제로-스터핑(zero-stuffing)에 의해서 및/또는 샘플들의 복제에 의해서), 저역통과 필터(160)는 단지 저대역 부분만을 통과시키기 위해서 업샘플링된 신호를 필터링한다(예컨대, 엘리어싱(aliasing)을 방지하기 위해). 마찬가지로, 업샘플러(170)는 고대역 신호(S100)의 샘플링 속도를 증가시키고, 고역통과 필터(180)는 단지 고대역 부분만을 통과시키기 위해서 업샘플링된 신호를 필터링한다. 두 통과대역 신호들은 이어서 광대역 음성 신호(S110)를 형성하기 위해 합해진다. 디코더(B100)의 일부 구현들에서는, 필터 뱅크(B120)가 고대역 디코더(B200)에 의해서 수신되거나 및/또는 계산된 하나 이상이 가중치들에 따라 두 통과대역 신호들의 가중된 합을 생성하도록 구성된다. 둘 보다 많은 통과대역 신호들을 결합하는 필터 뱅크(B120)의 구성이 또한 고려된다.
각각의 필터들(110, 130, 160, 180)은 유한-임펄스-응답(FIR) 필터로서 또는 무한-임펄스-응답(IIR) 필터로서 구현될 수 있다. 인코더 필터들(110 및 130)의 주파수 응답들은 정지대역과 통과대역 사이에 대칭적이거나 또는 다르게 형성된 전이 범위들을 가질 수 있다. 마찬가지로, 디코더 필터들(160 및 180)의 주파수 응답들은 정지대역과 통과대역 사이에 대칭적이거나 다르게 형성된 전이 범위들을 가질 수 있다. 저역통과 필터(110)가 저역통과 필터(160)와 동일한 응답을 갖고 또한 고역통과 필터(130)가 고역통과 필터(180)와 동일한 응답을 갖는 것이 바람직할 수 있지만 엄격히 필요하지는 않다. 일예에서는, 두 필터 쌍들(110, 130 및 160, 180)은 QMF(quadrature mirror filter) 뱅크들이고, 필터 쌍(110, 130)은 필터 쌍(160, 180)과 동일한 계수들을 갖는다.
통상적인 예에서, 저역통과 필터(110)는 300 내지 3400 Hz의 제한된 PSTN 범위를 포함하는 통과대역을 갖는다(예컨대, 0 내지 4 kHz의 대역). 도 4a 및 도 4b는 광대역 음성 신호(S10), 협대역 신호(S20), 및 고대역 신호(S30)의 상대적인 대역폭들을 두 가지의 상이한 구현 예들을 통해 나타낸다. 이러한 특정 예들 모두에서는, 광대역 음성 신호(S10)가 16 kHz의 샘플링 속도(0 내지 8 kHz의 범위 내에 있는 주파수 성분들을 나타냄)를 갖고, 협대역 신호(S20)는 8 kHz의 샘플링 속도(0 내지 4 kHz의 범위 내에 있는 주파수 성분들을 나타냄)를 갖는다.
도 4a의 예에서는, 두 서브대역들 사이에 어떤 상당한 겹침도 존재하지 않는다. 본 예에서 도시된 바와 같은 고대역 신호(S30)는 4 내지 8 kHz의 통과대역을 갖는 고역통과 필터(130)를 사용함으로써 획득될 수 있다. 이러한 경우에는, 필터링된 신호를 팩터 '2'에 의해 다운샘플링함으로써 8 kHz까지 샘플링 속도를 감소시키는 것이 바람직할 수 있다. 신호에 대한 추가적인 처리 동작들의 계산적인 복잡성을 상당히 감소시키는 것으로 기대될 수 있는 이러한 동작은 정보의 손실이 없이도 0 내지 4 kHz의 범위까지 통과대역 에너지를 아래로 이동시킬 것이다.
도 4b의 대안적인 예에서는, 상부 및 하부 서브대역들이 적절한 겹침을 가짐으로써, 3.5 내지 4 kHz의 범위가 두 서브대역 신호들에 의해서 표현된다. 고대역 신호(S30)는 본 예에서 3.5 내지 7 kHz의 통과대역을 갖는 고역통과 필터(130)를 사용함으로써 획득될 수 있다. 이러한 경우에는, 필터링된 신호를 팩터 '16/7'에 의해 다운샘플링함으로써 샘플링 속도를 7 kHz까지 감소시키는 것이 바람직할 수 있다. 신호에 대한 추가적인 처리 동작들의 계산적인 복잡성을 상당히 감소시키는 것으로 기대될 수 있는 이러한 동작은 정보의 손실이 없이도 0 내지 3.5 kHz의 범위까지 통과대역 에너지를 아래로 이동시킬 것이다.
전화 통신을 위한 통상적인 핸드셋에서, 트랜스듀서들 중 하나 이상(즉, 마이크로폰과 수화기 또는 확성기)은 7 내지 8 kHz의 주파수 범위에 걸쳐 적절한 응답이 모자란다. 도 4b의 예에서는, 7 kHz와 8 kHz 사이의 광대역 음성 신호의 일부가 인코딩된 신호에 포함되지 않는다. 고역통과 필터(130)의 다른 특정 예들은 3.5 내지 7.5 kHz 및 3.5 내지 8 kHz의 통과대역을 갖는다.
일부 구현들에서는, 도 4b의 예에서처럼 서브대역들 간에 겹침을 제공하는 것이 겹쳐진 범위에 걸쳐 원만한 롤오프(smooth rolloff)를 갖는 저역통과 필터 및/또는 고역통과 필터를 사용할 수 있게 한다. 이러한 필터들은 통상적으로 더 가파르거나 또는 "브릭-월(brick-wall)" 응답을 갖는 필터들보다 설계가 쉽고, 계산적으로 덜 복잡하고, 및/또는 지연이 덜 발생한다. 가파른 전이 범위들을 갖는 필터들은 원만한 롤오프들을 갖는 유사한 차수의 필터들보다 더 높은 사이드로브들(엘리어싱을 야기할 수 있음)를 갖는 경향이 있다. 가파른 전이 범위를 갖는 필터들은 또한 링잉 결함들(ringing artifacts)을 야기할 수 있는 긴 임펄스 응답을 가질 수 있다. 하나 이상의 IIR 필터들을 구비한 필터 뱅크 구현에 있어서, 겹치는 범위에 걸쳐 원만한 롤오프를 허용하는 것은 단위 원으로부터 더욱 멀리 있는 폴들(poles)을 갖는 필터나 필터들의 사용을 가능하게 하고, 상기 단위 원은 안정적 인 고정된 위치 구현을 보장하는데 중요하다.
서브대역들을 겹치게 하는 것은 더 적은 청각적인 결함들, 감소된 엘리어싱, 및/또는 한 대역으로부터 다른 대역으로의 보다 적은 눈에 띄는 전이를 유도할 수 있는 저대역 및 고대역의 원만한 혼합을 허용한다. 게다가, 협대역 인코더(A120)(예컨대, 파형 코더)의 코딩 효율은 증가하는 주파수에 따라 떨어질 수 있다. 예컨대, 협대역 코더의 코딩 품질은 특히 배경 잡음이 존재하는 경우에는 낮은 비트 속도들로 감소될 수 있다. 이러한 경우들에서는, 서브대역들의 겹침을 제공함으로써 겹치는 범위에서 재생된 주파수 성분들의 품질을 증가시킬 수 있다.
또한, 서브대역들을 겹치게 함으로써 보다 적은 청각적인 결함들, 감소된 엘리어싱, 및/또는 한 대역으로부터 다른 대역으로의 보다 적은 눈에 띄는 전이를 유도할 수 있는 저대역 및 고대역의 원만한 혼합이 가능하다. 이러한 특징은 협대역 인코더(A120) 및 고대역 인코더(A200)가 상이한 코딩 방법론들에 따라 동작하는 구현에 있어 특히 바람직할 수 있다. 예컨대, 상이한 코딩 기술들은 음향이 완전히 상이한 신호들을 생성할 수 있다. 코드북 인덱스들의 형태로 스펙트럼 포락선을 인코딩하는 코더는 진폭 스펙트럼을 대신 인코딩하는 코더와 상이한 음향을 갖는 신호를 생성할 수 있다. 시간-도메인 코더(예컨대, 펄스-코드-변조 또는 PCM 코더)는 주파수-도메인 코더와 상이한 음향을 갖는 신호를 생성할 수 있다. 스펙트럼 포락선 및 상응하는 잔여 신호의 표현을 갖는 신호를 인코딩하는 코더는 스펙트럼 포락선의 표현만을 갖는 신호를 인코딩하는 코더와 상이한 음향을 갖는 신호를 생성한다. 자신의 파형의 표현으로서 신호를 인코딩하는 코더는 정현파 코더로부 터의 음향과는 상이한 음향을 갖는 출력을 생성할 수 있다. 이러한 경우에, 겹치지 않은 서브대역들을 정하기 위해 가파른 전이 범위들을 갖는 필터들을 사용하는 것은 합성된 광대역 신호에서 서브대역들 사이에 갑작스럽고 지각적으로 눈에 띄는 전이를 유도할 수 있다.
비록 상보적으로 겹치는 주파수 응답을 갖는 QMF 필터 뱅크들이 서브대역 기술들에서 종종 사용되지만, 이러한 필터들은 본 명세서에 설명된 광대역 코딩 구현들 중 적어도 일부에 대해서는 부적합하다. 인코더에 있는 QMF 필터 뱅크는 디코더에 있는 상응하는 QMF 필터 뱅크에서 제거되는 상당한 정도의 엘리어싱을 생성하도록 구성된다. 이러한 배치는 신호가 필터 뱅크들 사이에 상당한 양의 왜곡을 초래하는 애플리케이션에 적합하지 않을 수 있는데, 그 이유는 상기 왜곡이 엘리어스 제거 속성의 효과를 감소시킬 수 있기 때문이다. 예컨대, 본 명세서에 설명된 애플리케이션들은 매우 낮은 비트 속도들로 동작하도록 구성되는 코딩 구현들을 포함한다. 매우 낮은 비트 속도들로 인해서, 디코딩된 신호는 본래 신호에 비해서 상당히 왜곡되어 나타나기 쉽고, 그로 인해 QMF 필터 뱅크들의 사용은 제거되지 않은 엘리어싱을 초래할 수 있다. QMF 필터 뱅크들을 사용하는 애플리케이션들은 통상적으로 더 높은 비트 속도들(예컨대, AMR에 대해서는 12 kbps 이상, 그리고 G.722에 대해서는 64 kpbs)을 갖는다.
또한, 코더는 본래 신호와 지각적으로는 유사하지만 본래 신호와는 실질적으로 상당히 다른 합성된 신호를 생성하도록 구성될 수 있다. 예컨대, 본 명세서 설명된 바와 같이 협대역 잔여 신호로부터 고대역 여기를 유도하는 코더는 이러한 신 호를 생성할 수 있는데, 그 이유는 실질적인 고대역 잔여 신호가 디코딩된 신호로부터 완전히 제거될 수 있기 때문이다. 이러한 애플리케이션들에서 QMF 필터 뱅크들의 사용은 제거되지 않은 엘리어싱에 의해 야기되는 상당한 정도의 왜곡을 초래할 수 있다.
QMF 엘리어싱에 의해 야기되는 왜곡의 양은 영향받는 서브대역이 좁은 경우에는 감소될 수 있는데, 그 이유는 상기 QMF 엘리어싱의 효과가 그 서브대역의 폭과 동일한 대역폭으로 제한되기 때문이다. 그러나, 각각의 서브대역이 광대역 대역폭의 대략 절반을 포함하는 본 명세서 설명된 바와 같은 예에서는, 제거되지 않은 엘리어싱에 의해 야기되는 왜곡이 신호의 상당한 부분에 영향을 줄 수 있다. 그 신호의 품질은 제거되지 않은 엘리어싱이 발생하는 주파수 대역의 위치에 의해 영향을 받을 수 있다. 예컨대, 광대역 음성 신호의 중심 근처(3 kHz와 4 kHz 사이)에서 생성되는 왜곡은 신호의 가장자리 근처(예컨대, 6 kHz보다 위)에서 발생하는 왜곡보다 훨씬 더 심각할 수 있다.
비록 QMF 필터 뱅크의 필터들의 응답은 서로 엄격하게 관련되지만, 필터 뱅크들(A110 및 B120)의 저대역 및 고대역 경로들은 그 두 서브대역들을 겹치는 것과는 별도로 완전히 관련되지 않은 스펙트럼을 갖도록 구성될 수 있다. 고역 필터의 주파수 응답이 -20 dB까지 떨어지는 위치로부터 저역 필터의 주파수 응답이 -20 dB까지 떨어지는 위치까지의 거리로서 두 서브대역들의 겹침이 정해진다. 필터 뱅크(A110 및/또는 B120)의 여러 예들에서, 이러한 겹침은 대략 200 Hz 내지 대략 1 kHz의 범위를 갖는다. 대략 400 Hz 내지 대략 600 Hz의 범위는 코딩 효율과 지각적인 원만함 사이의 바람직한 절충을 나타낼 수 있다. 위에 설명된 바와 같은 한 특정 예에서, 겹침은 대략 500 Hz이다.
도 4a 및 도 4b에서 여러 스테이지들로 도시된 바와 같은 동작들을 수행하도록 필터 뱅크(A112 및/또는 B122)를 구현하는 것이 바람직할 수 있다. 예컨대, 도 4c는 일련의 보간, 리샘플링, 데시메이션, 및 다른 동작들을 사용하는 고역통과 필터링 및 다운샘플링 동작들과 기능적으로 동일한 동작을 수행하는 필터 뱅크(A112)의 구현(A114)에 대한 블록도이다. 이러한 구현은 설계를 쉽게 할 수 있거나 및/또는 로직 및/또는 코드의 기능 블록들의 재사용을 허용할 수 있다. 예컨대, 도 4c에 도시된 바와 같이 14 kHz로의 데시메이션 동작 및 7 kHz로의 데시메이션 동작을 수행하는데 있어서는 동일한 기능 블록이 사용될 수 있다. 스펙트럼 반전 동작이 신호를 함수(ejn π) 또는 시퀀스(-1)n 와 곱함으로써 구현될 수 있는데, 그것의 값들은 +1과 -1이 교번적이다. 스펙트럼 형성 동작은 원하는 전체적인 필터 응답을 획득하기 위해서 신호를 형성하도록 구성되는 저역통과 필터로서 구현될 수 있다.
스펙트럼 반전 동작의 결과로서 고대역 신호(S30)의 스펙트럼이 반전된다는 것이 주시된다. 인코더 및 상응하는 디코더에서의 후속하는 동작들은 적절히 구성될 수 있다. 예컨대, 본 명세서에 설명된 바와 같은 고역 여기 생성기(A300)는 스펙트럼적으로 반전된 형태를 또한 갖는 고대역 신호(S120)를 생성하도록 구성될 수 있다.
도 4d는 일련의 보간, 리샘플링, 및 다른 동작들을 사용하는 업샘플링 및 고역통과 필터링 동작들과 기능적인 동일한 동작을 수행하는 필터 뱅크(B122)의 구현(B124)에 대한 블록도를 나타낸다. 필터 뱅크(B124)는 예컨대 필터 뱅크(A114)와 같은 인코더의 필터 뱅크에서 수행되는 것과 유사한 동작들의 반대인 고대역의 스펙트럼 반전 동작을 포함한다. 이러한 특정 예에서, 필터 뱅크(B124)는 또한, 비록 이러한 필터들이 선택적이어서 구비될 필요가 없을지라도, 7100 Hz의 신호의 성분을 감쇠시키는 저대역 및 고대역의 노치 필터들(notch filters)을 구비한다. 본 출원과 함께 출원된 특허 출원 "SYSTEMS, METHOD, AND APPARATUS FOR SPEECH SIGNAL FILTERING"(대리인 관리번호 050551)은 필터 뱅크들(A110 및 B120)의 특정 구현들에 대한 엘리먼트들의 응답들에 관한 추가적인 설명 및 도면들을 포함하고 있고, 상기 특허 출원은 본 명세서에서 참고문헌으로서 포함된다.
협대역 인코더(A120)는 (A) 필터를 설명하는 파라미터들 세트 및 (B) 입력 음성 신호의 합성된 재생을 생성하도록 설명된 필터를 구동시키는 여기 신호로서 입력 음성 신호를 인코딩하는 소스-필터 모델에 따라 구현된다. 도 5a는 음성 신호의 스펙트럼 포락선에 대한 예를 나타낸다. 이러한 스펙트럼 포락선을 특징짓는 피크들은 성도(vocal tract)의 공진을 나타내고 포먼트들로 지칭된다. 대부분의 음성 인코더들은 필터 계수들과 같은 파라미터 세트들로서 적어도 이러한 대략적인 스펙트럼 구조를 인코딩한다.
도 5b는 협대역 신호(S20)의 스펙트럼 포락선의 코딩에 적용될 때 기본적인 소스-필터 배치의 예를 나타낸다. 분석 모듈은 시간 기간(통상적으로 20 msec)에 걸쳐 음성 음향에 상응하는 필터를 특징짓는 파라미터들 세트를 계산한다. 이러한 필터 파라미터들에 따라 구성되는 백색 필터(분석 또는 예측 에러 필터로도 지칭됨)가 신호를 스펙트럼적으로 평탄화시키기 위해서 스펙트럼 포락선을 제거한다. 그로 인한 백색화된 신호(소위 잔여 신호로 지칭됨)는 보다 작은 에너지를 가짐으로써 보다 작은 변동을 갖고, 본래 음성 신호보다 인코딩하기가 더 쉽다. 잔여 신호의 인코딩으로부터 발생하는 에러들은 또한 스펙트럼에 걸쳐 더욱 균일하게 확산될 수 있다. 필터 파라미터들 및 잔여 신호는 채널을 통한 효율적인 전송을 위해서 통상적으로 양자화된다. 디코더에서는, 필터 파라미터들에 따라 구성된 합성 필터가 본래 음성 음향의 합성된 버전을 생성하기 위해서 잔여 신호에 기초하여 신호에 의해 여기된다. 합성 필터는 통상적으로 백색 필터의 전달 함수의 역인 전달 함수를 갖도록 구성된다.
도 6은 협대역 인코더(A120)의 기본적인 구현(A122)에 대한 블록도를 도시한다. 본 예에서는, 선형 예측 코딩(LPC) 분석 모듈(210)이 선형 예측(LP) 계수들의 세트(예컨대, 모든-폴 필터의 계수들 1/A(Z))로서 협대역 신호(S20)의 스펙트럼 포락선을 인코딩한다. 그 분석 모듈은 통상적으로 입력 신호를 일련의 비겹침 프레임들로서 처리하는데, 각각의 프레임에 대해서 새로운 계수들 세트가 계산된다. 프레임 기간은 일반적으로 신호가 국부적으로 정지되어 있는 것으로 예상될 수 있는 기간이고, 하나의 공통적인 예는 20 msec(8 kHz의 샘플링 속도에서 160 샘플들과 동일)이다. 일예에서, LPC 분석 모듈(210)은 각 20 msec 프레임의 포먼트 구조를 특징짓기 위해서 10 개의 LP 필터 계수들로 이루어진 세트를 계산하도록 구성된 다. 입력 신호를 일련의 겹침 프레임들로서 처리하도록 분석 모듈을 구현하는 것이 또한 가능하다.
그 분석 모듈은 각 프레임의 샘플들을 직접적으로 분석하도록 구성될 수 있거나, 또는 그 샘플들이 윈도우잉 함수(예컨대, 해밍 윈도우)에 따라 제일 먼저 가중화될 수 있다. 이러한 분석은 또한 30 msec 윈도우와 같이 프레임보다 더 큰 윈도에 걸쳐 수행될 수도 있다. 이러한 윈도우는 대칭적일 수 있거나(예컨대, 5-20-5, 그럼으로써 그것은 20 msec 프레임의 바로 이전 및 이후의 5 msec를 포함함) 또는 비대칭적일 수 있다(예컨대, 10-20, 그럼으로써 그것은 선행 프레임의 마지막 10 msec를 포함함). LPC 분석 모듈은 통상적으로 Levinson-Durbin 회귀 또는 Leroux-Gueguen 알고리즘을 사용하여 LP 필터 계수들을 계산하도록 구성된다. 다른 구현에서는, 상기 분석 모듈은 LP 필터 계수들 세트 대신에 각각의 프레임에 대한 켑스트럼 계수들(cepstral coefficients) 세트를 계산하도록 구성될 수 있다.
인코더(A120)의 출력 속도는 필터 파라미터들을 양자화시킴으로써 상당히 감소될 수 있고, 따라서 재생 품질에 비교적 적은 영향을 준다. 선형적인 예측 필터 계수들은 효율적으로 양자화기가 어렵고, 일반적으로 양자화 및/또는 엔트로피 인코딩에 있어서 라인 스펙트럼 쌍들(LSPs) 또는 라인 스펙트럼 주파수들(LSFs)과 같은 다른 표현으로서 매핑된다. 도 6의 예에서, LP 필터 계수-LSF 변환(220)은 LP 필터 계수들 세트를 상응하는 LSF들 세트로 변환한다. LP 필터 계수들의 다른 일-대-일 표현들은 파코어 계수들(parcor coefficients); 로그-영역-비율 값들; 이미턴스 스펙트럼 쌍들(ISPs); 및 이미턴스 스펙트럼 주파수들(ISFs)을 포함하는데, 이는 GSM(Global System for Mobile Communication) AMR-WB(Adaptive Multirate-Wideband) 코덱에서 사용된다. 통상적으로 LP 필터 계수들 세트와 상응하는 LSF들 세트 사이의 변환은 반대일 수 있지만, 실시예는 그 변환이 에러없이도 반대가 아닌 인코더(A120)의 구현들을 포함한다.
양자화기(230)는 협대역 LSF들 세트(또는 다른 계수 표현)를 양자화하도록 구성되고, 협대역 인코더(A122)는 협대역 필터 파라미터들(S40)로서 이러한 양자화의 결과를 출력하도록 구성된다. 이러한 양자화기는 통상적으로 인덱스로서 입력 벡터를 표나 코드북의 상응하는 벡터 엔트리로 인코딩하는 벡터 양자화기를 포함한다.
도 6에서 확인되는 바와 같이, 협대역 인코더(A122)는 필터 계수들 세트에 따라 구성되는 백색 필터(260)(분석 또는 예측 에러 필터로도 지칭됨)에 협대역 신호(S20)를 통과시킴으로써 잔여 신호를 또한 생성한다. 이러한 특정 예에서, 백색 필터(260)는, 비록 IIR 구현들이 또한 사용될 수 있을지라도, FIR 필터로서 구현된다. 이러한 잔여 신호는 협대역 필터 파라미터들(S40)로 표현되지 않는 피치에 관한 장기적인 구조와 같은 음성 프레임의 지각적으로 중요한 정보를 통상적으로 포함할 것이다. 양자화기(270)는 인코딩된 협대역 여기 신호(S50)로서 출력을 위한 이러한 잔여 신호의 양자화된 표현을 계산하도록 구성된다. 이러한 양자화기는 통상적으로 인덱스로서 입력 벡터들을 표나 코드북의 상응하는 벡터 엔트리로 인코딩하는 벡터 양자화기를 포함한다. 대안적으로, 이러한 양자화기는 하나 이상의 파라미터들을 전송하도록 구성될 수 있고, 벡터가 희소성 코드북 방법(sparse codebook method)에서처럼 저장부로부터 탐색되기보다는 디코더에서 상기 파라미터들로부터 다이내믹하게 생성될 수 있다. 이러한 방법은 대수학 CELP(codebook excitation linear prediction)와 같은 코딩 방식들 및 3GPP2(Third Generation Partnership 2) EVRC(Enhanced Variable Rate Codec)와 같은 코덱들에서 사용된다.
협대역 인코더(A120)가 상응하는 협대역 디코더에 이용가능하게 될 동일한 필터 파라미터 값들에 따라 인코딩된 협대역 여기 신호를 생성하는 것이 바람직할 수 있다. 이러한 방식에서, 최종적인 인코딩된 협대역 여기 신호는 양자화 에러와 같이 이러한 파라미터 값들의 비이상적임에 대해 어느 정도는 이미 고려할 수 있다. 따라서, 디코더에서 이용가능하게 될 동일한 계수 값들을 사용하는 백색 필터를 구성하는 것이 바람직할 수 있다. 도 6에 도시된 바와 같은 인코더(A122)의 기본적인 예에서, 역양자화기(240)는 협대역 코딩 파라미터들(S40)을 역양자화하고, LSF-LP 필터 계수 변환부(250)는 최종적인 값들을 상응한 LP 필터 계수들 세트에 매핑하고, 이러한 계수들 세트는 양자화기(270)에 의해 양자화되는 잔여 신호를 생성하도록 백색 필터(260)를 구성하는데 사용된다.
협대역 인코더(A120)의 일부 구현들은 잔여 신호를 최상적으로 매칭시키는 코드북 벡터들 세트 중에서 하나를 식별함으로써 인코딩된 협대역 여기 신호(S50)를 계산하도록 구성된다. 그러나, 협대역 인코더(A120)는 또한 잔여 신호를 실질적으로 생성하지 않고도 그 잔여 신호의 양자화된 표현을 계산하도록 구현될 수 있다는 것이 주시된다. 예컨대, 협대역 인코더(A120)는 (현재의 필터 파라미터들 세트에 따라) 상응하는 합성된 신호들을 생성하기 위해 다수의 코드북 벡터들을 사용 하고, 또한 지각적으로 가중된 도메인에서 본래 협대역 신호(S20)를 최상으로 매칭시키는 생성된 신호와 연관된 코드북 벡터를 선택하도록 구성될 수 있다.
도 7은 협대역 디코더(B110)의 구현(B112)에 대한 블록도를 나타낸다. 역양자화기(310)는 협대역 필터 파라미터들(S40)을 (이 경우에는, LSF들 세트로) 역양자화하고, LSF-LP 필터 계수 변환부(320)는 (협대역 인코더(A122)의 변환부(250) 및 역양자화기(240)를 참조하여 위에 설명된 바와 같이) LSF들을 필터 계수들 세트로 변환한다. 역양자화기(340)는 협대역 여기 신호(S80)를 생성하기 위해서 협대역 잔여 신호(S40)를 역양자화한다. 필터 계수들 및 협대역 여기 신호(S80)에 기초해서, 협대역 합성 필터(330)는 협대역 신호(S90)를 합성한다. 즉, 협대역 합성 필터(330)는 협대역 신호(S90)를 생성하기 위해서 역양자화된 필터 계수들에 따라 협대역 여기 신호(S80)를 스펙트럼적으로 형성하도록 구성된다. 협대역 디코더(B112)는 또한 협대역 여기 신호(S80)를 고대역 인코더(A200)에 제공하고, 상기 고대역 인코더(A200)는 본 명세서에 설명된 바와 같이 고대역 여기 신호(S120)를 유도하기 위해서 상기 협대역 여기 신호(S80)를 사용한다. 아래에 설명되는 바와 같이 일부 구현들에서는, 협대역 디코더(B110)가 스펙트럼 기울기, 피치 이득 및 래그, 및 음성 모드와 같이 협대역 신호에 관련된 추가적인 정보를 고대역 디코더(B200)에 제공하도록 구성될 수 있다.
협대역 인코더(A122) 및 협대역 디코더(B112)로 이루어진 시스템은 분석-합성 음성 코덱의 기본적인 예이다. 코드북 여기 선형 예측(CELP) 코딩은 한 대중적인 분석-합성 코딩 군(family)이고, 이러한 코더들의 구현은 고정 및 적응성 코드 북들로부터의 엔트리들 선택, 에러 최소화 동작들, 및/또는 지각적인 가중화 동작과 같은 동작들을 포함해서, 잔여 신호의 파형 인코딩을 수행할 수 있다. 분석-합성 코딩의 다른 구현들은 MELP(mixed excitation linear prediction), ACELP(algebraic CELP), RCELP(relaxation CELP), RPE(regular pulse excitation), MPE(multi-pulse CELP), VSELP(vector-sum excited linear prediction) 코딩을 포함한다. 관련된 코딩 방법들은 MBE(multi-band excitation) 및 PWI(prototype waveform interpolation) 코딩을 포함한다. 표준화된 분석-합성 음성 코덱들의 예들은 잔여 여기 선형 예측(RELP)을 사용하는 ETSI(European Telecommunications Standards Institute)-GSM 최대 속도 코덱(GSM 06.10); GSM 개선 최대 속도 코덱(ETSI-GSM 06.60); ITU(International Telecommunication Union) 표준 11.8 kb/s Annex E 코더; IS-136(시분할 다중 액세스 방식)을 위한 IS(Interim Standard)-641 코덱들; GSM 적응 다중속도(GSM-AMR) 코덱들; 및 4GVTM(Fourth-Generation VocoderTM) 코덱(QUALCOMM Incorporated, 미국 샌디에고)을 포함한다. 협대역 인코더(A120) 및 상응하는 디코더(B110)는 이러한 기술들 중 임의의 기술이나, 또는 필터를 설명하는 파라미터들 세트 및 (B) 음성 신호를 재생하기 위해 상기 설명된 필터를 구동시키는데 사용되는 여기 신호로서 음성 신호를 나타내는 임의의 다른 음성 코딩 기술(공지되었거나 개발될 것임)에 따라 구현될 수 있다.
심지어 백색 필터가 협대역 신호(S20)로부터 대략적인 스펙트럼 포락선을 제거한 이후에도, 특히 유성음 음성의 경우에는 상당한 양의 양호한 하모닉 구조가 남아 있을 수 있다. 도 8a는 모음과 같은 유성음 신호에 대해서 백색 필터에 의해 생성될 수 있을 때 잔여 신호의 일예에 대한 스펙트럼도를 나타내고 있다. 본 예에서 볼 수 있는 주기적인 구조는 피치에 관련되고, 동일한 화자에 의해서 말해진 상이한 유성음 음향들은 상이한 포먼트 구조들을 가질 수 있지만 유사한 피치 구조들을 가질 수 있다. 도 8b는 시간에 따른 피치 펄스들의 시퀀스를 나타내는 이러한 잔여 신호의 예에 대한 시간-도메인을 나타낸다.
코딩 효율 및/또는 음성 품질은 피치 구조의 특징들을 인코딩하기 위해 하나 이상의 파라미터 값들을 사용함으로써 증가될 수 있다. 피치 구조의 한 중요한 특징은 60 내지 400 Hz의 범위 내에 통상적으로 있는 제 1 하모닉의 주파수(기본 주파수로도 지칭됨)이다. 이러한 특징은 통상적으로 피치 래그(pitch lag)로도 지칭되는 기본 주파수의 반대로서 인코딩된다. 피치 래그는 한 피치 기간에 샘플들의 수를 나타내고, 하나 이상의 코드북 인덱스들로서 인코딩될 수 있다. 남성 화자들로부터의 음성 신호들은 여성 화자들로부터의 음성 신호들보다 더 높은 피치 래그들을 갖는 경향이 있다.
피치 구조와 관련된 다른 신호 특징은 하모닉 구조의 강도를 나타내는 주기성, 즉, 신호가 하모닉 또는 비하모닉적인 정도이다. 주기성의 두 통상적인 지시자들은 제로 크로싱들 및 정규화된 자동상관 함수들(NACF들)이다. 주기성은 또한 코드북 이득(예컨대, 양자화된 적응적인 코드북 이득)으로서 일반적으로 인코딩되는 피치 이득에 의해서 지시될 수도 있다.
협대역 인코더(A120)는 협대역 신호(S20)의 장기 하모닉 구조를 인코딩하도 록 구성되는 하나 이상의 모듈들을 포함할 수 있다. 도 9에 도시된 바와 같이, 사용될 수 있는 하나의 통상적인 CELP 범례는 오픈-루프 LPC 분석 모듈을 구비하는데, 상기 오픈-루프 LPC 분석 모듈은 단기 특징들 또는 대략적인 스펙트럼 포락선을 인코딩하고, 그 다음에는 양호한 피치 또는 하모닉 구조를 인코딩하는 폐루프 장기 예측 분석 스테이지가 후속된다. 단기 특징들은 필터 계수들로서 인코딩되고, 장기 특징들은 피치 래그 및 피치 이득과 같은 파라미터들에 대한 값으로서 인코딩된다. 예컨대, 협대역 인코더(A120)는 하나 이상의 코드북 인덱스들(예컨대, 고정된 코드북 인덱스 및 적응적인 코드북 인덱스) 및 상응하는 이득 값들을 포함하는 형태로 인코딩된 협대역 여기 신호(S50)를 출력하도록 구성될 수 있다. (예컨대, 양자화기(270)에 의한) 협대역 잔여 신호의 이러한 양자화된 표현의 계산은 이러한 인덱스들을 선택하는 것과 이러한 값들을 계산하는 것을 포함할 수 있다. 피치 구조의 인코딩은 또한 피치 프로토타입 파형의 보간을 포함할 수도 있고, 이러한 동작은 연속적인 피치 펄스들 사이의 차이를 계산하는 것을 포함할 수 있다. 장기 구조의 모델링은 통상적으로 잡음과 같고 체계적으로 조직되지 않은 무성음 음성에 상응하는 프레임들에 대해서는 디스에이블될 수 있다.
도 9에 도시된 바와 같은 범례에 따른 협대역 디코더(B110)의 구현은 장기 구조(long-term structure)(피치 또는 하모닉 구조)가 복원된 이후에 고대역 디코더(B200)에 협대역 여기 신호(S80)를 출력하도록 구성될 수 있다. 예컨대, 이러한 디코더는 협대역 여기 신호(S80)를 인코딩된 협대역 여기 신호(S50)의 양자화된 버전으로서 출력하도록 구성될 수 있다. 물론, 고대역 디코더(B200)가 협대역 여기 신호(S80)를 획득하기 위해서 인코딩된 협대역 여기 신호(S50)의 역양자화를 수행하도록 협대역 디코더(B110)를 구현하는 것도 가능하다.
도 9에 도시된 바와 같은 범례에 따른 광대역 음성 인코더(A100)의 구현에 있어서, 고대역 인코더(A200)는 단기(short-term) 분석 또는 백색 필터에 의해 생성될 때 협대역 여기 신호를 수신하도록 구성될 수 있다. 즉, 협대역 인코더(A120)는 장기 구조를 인코딩하기 이전에 협대역 여기 신호를 고대역 인코더(A200)에 출력하도록 구성될 수 있다. 그러나, 고대역 인코더(A200)가 고대역 디코더(B200)에 의해 수신될 동일한 코딩 정보를 협대역 채널로부터 수신하는 것이 바람직할 수 있고, 그로 인해서 고대역 인코더(A200)에 의해서 생성되는 코딩 파라미터들이 그 정보의 비이상적임에 대해 어느 정도 이미 고려할 수 있다. 따라서, 고대역 인코더(A200)가 광대역 음성 인코더(A100)에 의해 출력되어질 동일한 파라미터화되고 및/또는 양자화되는 인코딩된 협대역 여기 신호(S50)로부터 협대역 여기 신호(S80)를 재구성하는 것이 바람직할 수 있다. 이러한 해결방법의 한 잠재적인 장점은 아래에 설명되는 고대역 이득 팩터들(S60b)의 더욱 정확한 계산이다.
협대역 신호(S20)의 단기 및/또는 장기 구조를 특징짓는 파라미터들 이외에도, 협대역 인코더(A120)는 협대역 신호(S20)의 다른 특징들에 관련한 파라미터 값들을 생성할 수 있다. 광대역 음성 인코더(A100)에 의한 출력을 위해 적절히 양자화될 수 있는 이러한 값들은 협대역 필터 파라미터들(S40) 중에 포함될 수 있거나 개별적으로 출력될 수 있다. 고대역 인코더(A200)는 또한 (예컨대, 역양자화 이후에) 이러한 추가적인 파라미터들 중 하나 이상에 따라 고대역 코딩 파라미터 들(S60)을 계산하도록 구성될 수 있다. 광대역 음성 디코더(B100)에서는, 고대역 디코더(B200)가 (예컨대, 역양자화 이후에) 협대역 디코더(B110)를 통해서 파라미터 값들을 수신하도록 구성될 수 있다. 대안적으로는, 고대역 디코더(B200)는 그 파라미터들을 직접적으로 수신하도록(그리고 어쩌면 역양자화하도록) 구성될 수 있다.
추가적인 협대역 코딩 파라미터들의 일예에서, 협대역 인코더(A120)는 각 프레임에 대해 음성 모드 파라미터들 및 스펙트럼 기울기에 대한 값을 생성한다. 스펙트럼 기울기는 통과대역에 걸쳐 스펙트럼 포락선의 모양에 관련되고, 양자화된 제 1 반사 효율에 의해 통상적으로 표현된다. 대부분의 유성음 음향들에 대해서, 스펙트럼 에너지는 주파수가 증가함에 따라 감소되고, 따라서 제 1 반사 효율이 음의 값이 되며 대략적으로 -1일 수 있다. 대부분의 무성음 음향들은 제 1 반사 효율이 제로에 가깝도록 평탄하거나 혹은 제 1 반사 효율이 양의 값이고 대략적으로 +1일 수 있도록 고주파수들에서 더 큰 에너지를 갖는 스펙트럼을 갖는다.
음성 모드(유성음 모드로도 지칭됨)는 현재 프레임이 유성음 음성을 나타내는지 또는 무성음 음성을 나타내는지를 지시한다. 이러한 파라미터는 측정치와 임계치 간의 관계와 같은 프레임에 대한 주기성(예컨대, 제로 크로싱들, NACF들, 피치 이득) 및/또는 음성 활성도의 하나 이상의 측정치들에 기초하는 이진값을 가질 수 있다. 다른 구현에 있어서, 음성 모드 파라미터는 침묵(silence) 및 배경 잡음과 같은 모드들이나 또는 침묵과 유성음 음성 사이의 전이를 나타내기 위해서 하나 이상의 다른 상태들을 갖는다.
고대역 인코더(A200)는 소스-필터 모델에 따라 고대역 신호(S30)를 인코딩하도록 구성되는데, 이러한 필터에 대한 여기는 인코딩된 협대역 여기 신호에 기초한다. 도 10은 고대역 필터 파라미터들(S60a) 및 고대역 이득 팩터들(S60b)을 포함하는 고대역 코딩 파라미터들(S60)을 생성하도록 구성되는 고대역 인코더(A200)의 구현(A202)에 대한 블록도를 나타낸다. 고대역 여기 생성기(A300)는 인코딩된 협대역 여기 신호(S50)로부터 고대역 여기 신호(S120)를 유도한다. 분석 모듈(A210)은 고대역 신호(S30)의 스펙트럼 포락선을 특징짓는 파라미터들 세트를 생성한다. 이러한 특정 예에서, 분석 모듈(A210)은 고대역 신호(S30)의 각 프레임에 대한 LP 필터 계수들 세트를 생성하기 위해서 LPC 분석을 수행하도록 구성된다. 선형 예측 필터 계수-LSF 변환부(410)는 상응한 LSF들 세트로 LP 필터 계수들 세트를 변환한다. 분석 모듈(210) 및 변환부(220)를 참조하여 위에 설명된 바와 같이, 분석 모듈(A210) 및/또는 변환부(410)는 다른 계수 세트들(예컨대, 켑스펙트럼 계수들) 및/또는 계수 표현들(예컨대, ISP들)을 사용하도록 구성될 수 있다.
양자화기(420)는 고대역 LSF들 세트(즉, ISP들과 같은 다른 계수 표현)를 양자화하도록 구성되고, 고대역 인코더(A202)는 이러한 양자화의 결과를 고대역 필터 파라미터들(S60a)로서 출력하도록 구성된다. 이러한 양자화기는 통상적으로 표나 코드북에 있는 상응하는 벡터 엔트리에 대한 인덱스로서 입력 벡터를 인코딩하는 벡터 양자화기를 포함한다.
고대역 인코더(A202)는 또한 분석 모듈(A210)에 의해서 생성되는 인코딩된 스펙트럼 포락선(예컨대, LP 필터 계수들 세트) 및 고대역 여기 신호(S120)에 따라 합성된 고대역 신호(S130)를 생성하도록 구성되는 합성 필터(A220)를 포함한다. 합성 필터(A220)는, 비록 FIR 구현들이 또한 사용될 수 있을지라도, 통상적으로는 IIR 필터로서 구현된다. 특정 예에서, 합성 필터(A220)는 6차 선형 자기회귀 필터로서 구현된다.
고대역 이득 팩터 계산기(A230)는 프레임에 대한 이득 포락선을 규정하기 위해서 본래 고대역 신호(S30) 및 합성된 고대역 신호(S130)의 레벨들 사이의 하나 이상의 차이들을 계산한다. 표나 코드북에 있는 상응한 벡터 앤트리에 대한 인덱스로서 입력 벡터를 인코딩하는 벡터 양자화기로 구현될 수 있는 양자화기(430)는 이득 포락선을 규정하는 값이나 값들을 양자화하고, 고대역 인코더(A202)가 고대역 이득 팩터(S60b)로서 이러한 양자화의 결과를 출력하도록 구성된다.
도 10에 도시된 바와 같은 구현에서, 합성 필터(A220)는 분석 모듈(A210)로부터 필터 계수들을 수신하도록 배치된다. 고대역 인코더(A202)의 대안적인 구현은 고대역 필터 파라미터들(S60a)로부터 필터 계수들을 디코딩하도록 구성되는 역양자화기 및 역변환부를 구비하고, 이 경우에 합성 필터(A220)는 디코딩된 필터 계수들을 대신에 수신하도록 배치된다. 이러한 대안적인 배치는 고대역 이득 계산기(A230)에 의한 이득 포락선의 더욱 정확한 계산을 지원할 수 있다.
한 특정 예에서, 분석 모듈(A210) 및 고대역 이득 계산기(A230)는 프레임마다 5개의 이득 값들로 이루어진 세트와 6개의 LSF들로 이루어진 세트를 출력하고, 그럼으로써 협대역 신호(S20)의 광대역 확장이 프레임마다의 단지 7개의 추가적인 값들을 통해 달성될 수 있다. 귀는 고주파수들의 주파수 에러들에는 덜 민감한 경 향이 있고, 따라서 낮은 LPC 차수에서의 고대역 코딩은 더 높은 LPC 차수에서의 협대역 코딩에 필적할만한 지각적인 품질을 갖는 신호를 생성할 수 있다. 고대역 인코더(A200)의 통상적인 구현은 스펙트럼 포락선의 고품질 재구성을 위해서는 프레임마다 8 내지 12 비트들을 출력하고 시간적인 포락선의 고품질 재구성을 위해서는 프레임마다 다른 8 내지 12 비트들을 출력하도록 구성될 수 있다. 다른 특정 예에서, 분석 모듈(A210)은 프레임마다 8개의 LSF들로 이루어진 세트를 출력한다.
고대역 인코더(A200)의 일부 구현들은 고대역 주파수 성분들을 갖는 랜덤한 잡음 신호를 생성함으로써 그리고 협대역 신호(S20)의 시간-도메인 포락선, 협대역 여기 신호(S80), 또는 고대역 신호(S30)에 따라 그 잡음 신호를 진폭-변조함으로써 고대역 여기 신호(S120)를 생성하도록 구성된다. 비록 이러한 잡음-기반 방법은 무성음 음향들에 대해 적절한 결과들을 생성할 수 있지만, 그러나, 상기 방법은 잔여 신호들이 일반적으로 하모닉적이고 따라서 어느 정도의 주기적인 구조를 갖는 유성음 음향들에 대해서는 바람직하지 않을 수 있다.
고대역 여기 생성기(A300)는 협대역 여기 신호(S80)의 스펙트럼을 고대역 주파수 범위로 확장함으로써 고대역 여기 신호(S120)를 생성하도록 구성된다. 도 11은 고대역 여기 생성기(A300)의 구현(A302)에 대한 블록도를 나타낸다. 역양자화기(450)는 협대역 여기 신호(S80)를 생성하기 위해 인코딩된 협대역 여기 신호(S50)를 역양자화하도록 구성된다. 스펙트럼 확장기(A400)는 협대역 여기 신호(S80)에 기초하여 하모닉적으로 확장된 신호(S160)를 생성하도록 구성된다. 결합기(470)는 변조된 잡음 신호(S170)를 생성하기 위해서 포락선 계산기(460)에 의 해 계산되는 시간-도메인 포락선과 잡음 생성기(480)에 의해서 생성되는 랜덤한 잡음 신호를 결합하도록 구성된다. 결합기(490)는 고대역 여기 신호(S120)를 생성하기 위해서 하모닉적으로 확장된 신호(S60)와 변조된 잡음 신호(S170)를 혼합하도록 구성된다.
일예에서, 스펙트럼 확장기(A400)는 하모닉적으로 확장된 신호(S160)를 생성하기 위해서 협대역 여기 신호(S80)에 대해 스펙트럼 폴딩 동작(미러링(mirroring)으로도 지칭됨)을 수행하도록 구성된다. 스펙트럼 폴딩은 여기 신호(S80)를 제로-스터핑하고(zero-stuffing) 이어서 엘리어스를 유지하기 위해 고역통과 필터를 적용함으로써 수행될 수 있다. 다른 예에서, 스펙트럼 확장기(A400)는 협대역 여기 신호(S80)를 고대역으로 스펙트럼적으로 전이시킴으로써(상수-주파수 코사인 신호와의 곱이 후속하는 업샘플링을 통해) 하모닉적으로 확장된 신호(S160)를 생성하도록 구성된다.
스펙트럼 폴딩 및 전이 방법들은 스펙트럼적으로 확장된 신호들을 생성할 수 있는데, 그 신호들의 하모닉 구조는 위상 및/또는 주파수에 있어서 협대역 여기 신호(S80)의 본래 하모닉 구조와 비연속적이다. 예컨대, 이러한 방법들은 기본 주파수의 배수들에 일반적으로 위치하지 않는 피크들을 가진 신호들을 생성할 수 있고, 이는 재구성된 음성 신호에서 음색-음향 결함들을 야기할 수 있다. 이러한 방법들은 또한 비자연적으로 강한 음조 특징들을 갖는 고주파수 하모닉들을 생성하는 경향이 있다. 게다가, PSTN 신호는 8 kHz로 샘플링될 수 있지만 단지 3400 Hz로 대역제한되기 때문에, 협대역 여기 신호(S80)의 상부 스펙트럼은 적은 에너지를 포함 할 수 있거나 혹은 에너지를 전혀 포함하지 않을 수 있고, 따라서 스펙트럼 폴딩 또는 스펙트럼 전이 동작에 따라 생성되는 확장된 신호는 3400 kHz 위의 스펙트럼 홀(spectral hole)을 가질 수 있다.
하모닉적으로 확장된 신호(S160)를 생성하는 다른 방법들은 협대역 여기 신호(S180)의 하나 이상의 기본적인 주파수들을 식별하는 단계, 및 정보에 따라 하모닉 음조들을 생성하는 단계를 포함한다. 예컨대, 여기 신호의 하모닉 구조는 진폭 및 위상 정보와 더불어 기본 주파수에 의해서 특징될 수 있다. 고대역 여기 생성기(A300)의 다른 구현은 기본 주파수 및 진폭에 기초하여 하모닉적으로 확장된 신호(S160)를 생성한다(설명된 바와 같이, 예컨대, 피치 래그 및 피치 이득에 의해서). 그러나, 만약 하모닉적으로 확장된 신호가 협대역 여기 신호(S80)와 위상-코히어런트하지 않다면, 최종적인 디코딩된 음성의 품질은 용인가능하지 않을 수 있다.
협대역 여기와 위상-코히어런트한 고대역 여기 신호를 생성하고 또한 위상 비연속성이 없는 하모닉 구조를 보존하기 위해 비선형 함수가 사용될 수 있다. 비선형 함수는 또한 고주파수 하모닉들 사이의 증가된 잡음 레벨을 제공할 수 있는데, 이는 스펙트럼 폴딩 및 스펙트럼 전이와 같은 방법들에 의해 생성되는 음조 고주파수 하모닉들 보다는 더 자연스러운 음향이기 쉽다. 스펙트럼 확장기(A400)의 여러 구현들에 의해 적용될 수 있는 통상의 무기억 비선형 함수들(memoryless nonlinear funcstions)은 절대값 함수(전파 정류(full wave rectification)로도 지칭됨), 반파 정류, 큐빙(cubing), 및 클립핑(clipping)을 포함한다. 스펙트럼 확 장기(A400)의 다른 구현들은 기억 비선형 함수를 적용하도록 구성될 수 있다.
도 12는 협대역 여기 신호(S80)의 스펙트럼을 확장하기 위해서 비선형 함수를 적용하도록 구성되는 스펙트럼 확장기(A400)의 구현(A402)에 대한 블록도이다. 업샘플러(510)는 협대역 여기 신호(S80)를 업샘플링하도록 구성된다. 비선형 함수의 적용 시에 엘리어싱을 최소화하기 위해서 신호를 충분히 업샘플링하는 것이 바람직할 수 있다. 한 특정 예에서, 업샘플러(510)는 '8'인 팩터에 의해서 신호를 업샘플링한다. 업샘플러(510)는 입력 신호를 제로-스터핑하고 또한 결과를 저역통과 필터링함으로써 업샘플링 동작을 수행하도록 구성될 수 있다. 비선형적인 함수 계산기(520)는 업샘플링된 신호에 비선형 함수를 적용하도록 구성된다. 제곱화와 같이 스펙트럼 확장을 위한 다른 비선형 함수들에 비해서 절대값 함수의 한 잠재적인 장점은 에너지 정규화가 필요하지 않다는 점이다. 일부 구현들에서, 절대값 함수는 각 샘플의 부호 비트를 제거하거나 삭제함으로써 효율적으로 적용될 수 있다. 비선형적인 함수 계산기(520)는 또한 업샘플링되거나 스펙트럼적으로 확장된 신호의 진폭 왜곡(amplitude warping)을 수행하도록 구성될 수 있다.
다운샘플러(530)는 비선형 함수를 적용하여 스펙트럼적으로 확장된 결과를 다운샘플링하도록 구성된다. 다운샘플러(530)가 샘플링 속도를 감소시키기 이전에 스펙트럼적으로 확장된 신호의 원하는 주파수 대역을 선택하기 위해서 대역통과 필터링 동작을 수행하는 것이 바람직할 수 있다(예컨대 불필요한 이미지들에 의한 엘리어싱이나 파손을 감소시키거나 막기 위해). 또한, 다운샘플러(530)가 하나 보다 많은 수의 스테이지에서 샘플링 속도를 감소시키는 것이 바람직할 수 있다.
도 12a는 스펙트럼 확장 동작의 일예에서 여러 위치들에서의 신호 스펙트럼을 나타내는 도면인데, 여기서 주파수 스케일은 여러 소도면들에 걸쳐 동일하다. 소도면 (a)는 협대역 여기 신호(S80)의 일예에 대한 스펙트럼을 나타낸다. 소도면 (b)는 신호(S80)가 '8'인 팩터에 의해 업샘플링된 이후의 스펙트럼을 나타낸다. 소도면 (c)는 비선형적인 함수의 적용 이후에 확장된 스펙트럼의 예를 나타낸다. 소도면 (d)는 저역통과 필터링 이후의 스펙트럼을 나타낸다. 본 예에서, 통과대역은 고대역 신호(S30)의 상부 주파수 제한치(예컨대, 7 kHz 또는 8kHz)까지 확장한다.
소도면 (e)는 다운샘플링의 제 1 스테이지 이후의 스펙트럼을 나타내는데, 여기서 샘플링 속도는 광대역 신호를 획득하기 위해서 '4'인 팩터에 의해 감소된다. 소도면 (f)는 확장된 신호의 고대역 부분을 선택하기 위해서 고역통과 필터링 동작 이후의 스펙트럼을 나타내고, 소도면 (g)는 다운샘플링의 제 2 스테이지 이후의 스펙트럼을 나타내는데, 여기서 샘플링 속도는 '2'인 팩터에 의해 감소된다. 한 특정 예에서, 다운샘플러(530)는 고대역 신호(S30)의 주파수 범위 및 샘플링 속도를 갖는 스펙트럼적으로 확장된 신호를 생성하기 위해서 필터 뱅크(A112)(또는 동일한 응답을 갖는 다른 구조들이나 루틴들)의 고역통과 필터(130) 및 다운샘플러(140)에 광대역 신호를 통과시킴으로써 고역통과 필터링 및 다운샘플링의 제 2 스테이지를 수행한다.
소도면 (g)에서 알 수 있는 바와 같이, 소도면 (f)에 도시된 고역통과 신호의 다운샘플링은 자신의 스펙트럼의 반전을 야기한다. 본 예에서, 다운샘플 러(530)는 또한 신호에 대해 스펙트럼 플립핑(flipping) 동작을 수행하도록 구성된다. 소도면 (h)는 스펙트럼 플립핑 동작을 적용한 결과를 나타내는데, 상기 스펙트럼 플립핑 동작은 신호에 함수 ejn π 또는 시퀀스(-1)n을 곱함으로써 수행될 수 있고, 그것의 값들은 교번적으로 +1 및 -1이다. 이러한 연산은 주파수 도메인에서 신호의 디지털 스펙트럼을 π인 거리만큼 시프트시키는 것과 동일하다. 상이한 차수에 다운샘플링 및 스펙트럼 플립핑 동작들을 적용함으로써 동일한 결과가 또한 획득될 수 있다는 것이 주시된다. 업샘플링 및/또는 다운샘플링의 동작들은 또한 고대역 신호(S30)의 샘플링 속도(예컨대, 7 kHz)를 갖는 스펙트럼적으로 확장된 신호를 획득하기 위해서 리샘플링을 포함하도록 구성될 수 있다.
위에 설명된 바와 같이, 필터 뱅크들(A110 및 B120)은, 협대역 및 고대역 신호들(S20, S30) 중 하나나 둘 모두가 필터 뱅크(A110)의 출력에서 스펙트럼적으로 반전된 형태를 갖고, 스펙트럼적으로 반전된 형태로 인코딩 및 디코딩하고, 또한 광대역 음성 신호(S110)로 출력되기 이전에 필터 뱅크(B120)에서 스펙트럼적으로 다시 반전되도록, 구현될 수 있다. 이러한 경우에는, 물론, 도 12a에 도시된 바와 같은 스펙트럼 플립핑 동작이 불필요할 것인데, 왜냐하면 고대역 여기 신호(S120)가 또한 스펙트럼적으로 반전된 형태를 갖는 것이 바람직할 것이기 때문이다.
스펙트럼 확장기(A402)에 의해 수행되는 스펙트럼 확장 동작의 업샘플링 및 다운샘플링에 대한 여러 작업들이 많은 상이한 방식들로 구성되고 배치될 수 있다. 예컨대, 도 12b는 스펙트럼 확장 동작의 다른 예에 있어서 여러 위치들에서의 신호 스펙트럼을 나타내는 도면인데, 여기서 주파수 스케일은 여러 소도면들에 있어 동일하다. 소도면 (a)는 협대역 여기 신호(S80)의 한 예에 대한 스펙트럼을 나타낸다. 소도면 (b)는 신호(S80)가 '2'인 팩터에 의해 업샘플링된 이후의 스펙트럼을 나타낸다. 소도면 (c)는 비선형 함수의 적용 이후에 확장된 스펙트럼의 예를 나타낸다. 이 경우에, 더 높은 주파수에서 발생할 수 있는 엘리어싱은 용인된다.
소도면 (d)는 스펙트럼 반전 동작 이후의 스펙트럼을 나타낸다. 소도면 (e)는 다운샘플링의 단일 스테이지 이후의 스펙트럼을 나타내고, 여기서 샘플링 속도는 원하는 스펙트럼적으로 확장된 신호를 획득하기 위해서 '2'인 팩터에 의해 감소된다. 본 예에서, 신호는 스펙트럼적으로 반전된 형태이며, 이러한 고대역 신호(S30)를 이러한 형태로 처리한 고대역 인코더(A200)의 구현에서 사용될 수 있다.
비선형 함수 계산기(520)에 의해서 생성되는 스펙트럼적으로 확장된 신호는 주파수가 증가할 때 진폭의 뚜렷한 감소를 갖기 쉽다. 스펙트럼 확장기(A402)는 다운샘플링된 신호에 대해 백색화 동작을 수행하도록 구성되는 스펙트럼 평탄기(540)를 구비한다. 스펙트럼 평탄기(540)는 고정된 백색화 동작을 수행하거나 또는 적응적인 백색 동작을 수행하도록 구성될 수 있다. 적응적인 백색화의 특정 예에서, 스펙트럼 평탄기(540)는 다운샘플링된 신호로부터 4 개의 필터 계수들로 이루어진 세트를 제한하도록 구성되는 LPC 분석 모듈 및 이러한 계수들에 따라 신호를 백색화하도록 구성되는 4-차수 분석 필터를 구비한다. 스펙트럼 확장기(A400)의 다른 구현들은 다운샘플러(530) 이전에 스펙트럼적으로 확장되어진 신호에 대해 스펙트럼 평탄기(540)가 동작하는 구성들을 포함한다.
고대역 여기 생성기(A300)는 하모닉적으로 확장된 신호(S160)를 고대역 여기 신호(S120)로서 출력하도록 구현될 수 있다. 그러나, 일부 경우들에서는, 하모닉적으로 확장된 신호만을 고대역 여기로서 사용하는 것이 청각적인 결함들을 초래할 수 있다. 음성의 하모닉적인 구조는 일반적으로 저대역에서보다 고대역에서 덜 뚜렷하고, 고대역 여기 신호에서 너무 많은 하모닉 구조를 사용하는 것은 윙윙거리는(buzzy) 음향을 초래할 수 있다. 이러한 결함은 여성 화자들로부터의 음성 신호들에 있어 특히 두드러질 수 있다.
실시예들은 하모닉적으로 확장된 신호(S160)를 잡음 신호와 혼합하도록 구성되는 고대역 여기 생성기(A300)의 구현들을 포함한다. 도 11에 도시된 바와 같이, 고대역 여기 생성기(A302)는 랜덤한 잡음 신호를 생성하도록 구성되는 잡음 생성기(480)를 구비한다. 비록 다른 구현들에서는 단위-분산 백색 의사랜덤 잡음 신호가 백색화될 필요가 없고 주파수에 따라 변하는 전력 밀도를 가질 수 있지만, 일예에서는 잡음 생성기(480)는 단위-분산 백색 의사랜덤 잡음 신호를 생성하도록 구성된다. 잡음 생성기(480)가 결정적인 함수로서 잡음 신호를 출력하도록 구성됨으로써 그것의 상태가 디코더에서 복제될 수 있는 것이 바람직할 수 있다. 예컨대, 잡음 생성기(480)는 협대역 필터 파라미터들(S40) 및/또는 인코딩된 협대역 여기 신호(S50)와 같은 동일 프레임 내의 초기에 코딩된 정보의 결정적인 함수로서 잡음 신호를 출력하도록 구성될 수 있다.
하모닉적으로 확장된 신호(S160)와 혼합되기 이전에, 잡음 생성기(480)에 의해서 생성되는 랜덤한 잡음 신호는 협대역 신호(S20), 고대역 신호(S30), 협대역 여기 신호(S80), 또는 하모닉적으로 확장된 신호(S160)의 시간에 따른 에너지 분산에 비슷한 시간-도메인 포락선을 갖도록 진폭-변조될 수 있다. 도 11에 도시된 바와 같이, 고대역 여기 생성기(A302)는 포락선 계산기(460)에 의해 계산되는 시간-도메인 포락선에 따라서 잡음 생성기(480)에 의해 생성되는 잡음 신호를 진폭-변조하도록 구성되는 결합기(470)를 구비한다. 예컨대, 결합기(470)는 변조된 잡음 신호(S170)를 생성하기 위해서 포락선 계산기(460)에 의해 계산되는 시간-도메인 포락선에 따라 잡음 생성기(480)의 출력을 스케일링하도록 배치되는 곱셈기로서 구현될 수 있다.
고대역 여기 생성기(A302)의 구현(A304)에 있어서는, 도 13의 블록도에 도시된 바와 같이, 포락선 계산기(460)가 하모닉적으로 확장된 신호(S160)의 포락선을 계산하도록 배치된다. 고대역 여기 생성기(A302)의 구현(A306)에 있어서는, 도 14의 블록도에 도시된 바와 같이, 포락선 계산기(460)가 협대역 여기 신호(S80)의 포락선을 계산하기 위해 배치된다. 그렇지 않으면, 고대역 여기 생성기(A302)의 추가적인 구현은 시간에 따른 협대역 피치 펄스들의 위치들에 따라 하모닉적으로 확장되는 신호(S160)에 잡음을 추가하도록 구성될 수 있다.
포락선 계산기(460)는 일련의 부작업들을 포함하는 작업으로서 포락선 계산을 수행하도록 구성될 수 있다. 도 15는 이러한 작업의 예(T100)에 대한 흐름도를 나타낸다. 부작업(T110)은 제곱된 값들의 시퀀스를 생성하도록 자신의 포락선이 모델링되는 신호(예컨대, 협대역 여기 신호(S80)나 하모닉적으로 확장된 신호(S160))의 프레임의 각 샘플의 제곱을 계산한다. 부작업(T120)은 제곱된 값들의 시퀀스에 대해 평활 연산을 수행한다. 일예에서, 부작업(T120)은 1차수 IIR 저역통과 필터를 확장에 따른 시퀀스에 적용하고,
y(n)=ax(n)+(1-a)y(n-1) 식(1)
여기서, x는 필터 입력이고, y는 필터 출력이고, n은 시간-도메인 인덱스이며, a는 0.5와 1 사이의 값을 갖는 평활 계수이다. 평활 계수(a)의 값은 고정적일 수 있거나, 대안적인 실시예에서는, 입력 신호에의 잡음의 표시에 따라 적응될 수 있고, 그럼으로서 a는 잡음이 부재 시에는 1에 더 가깝고 잡음의 존재 시에는 0.5에 더 가깝다. 부작업(T130)은 시간-도메인 포락선을 생성하기 위해서 평활된 시퀀스의 각 샘플에 제곱근 함수를 적용한다.
포락선 계산기(460)의 이러한 구현은 직렬 및/또는 병렬 형태로 작업(T100)의 여러 부작업들을 수행하도록 구현될 수 있다. 작업(T100)의 다른 구현들에서는, 부작업(T110)이 자신의 포락선이 3 내지 4 kHz 범위와 같이 모델링될 신호의 원하는 주파수 부분을 선택하도록 구성되는 대역통과 동작이 후속될 수 있다.
결합기(490)는 고대역 여기 신호(S120)를 생성하기 위해서 하모닉적으로 확장된 신호(S160)와 변조된 잡음 신호(S170)를 혼합하도록 구성된다. 결합기(490)의 구현들은, 예컨대, 고대역 여기 신호(S120)를 하모닉적으로 확장된 신호(S160)와 변조된 잡음 신호(S170)의 합으로서 계산하도록 구성될 수 있다. 결합기(490)의 이러한 구현은 가중 팩터를 하모닉적으로 확장된 신호(S160)에 적용하거나 및/또는 합산에 앞서서 변조된 잡음 신호(S170)에 적용함으로써 가중된 합으로서 고대역 여기 신호(S120)를 계산하도록 구성될 수 있다. 각각의 이러한 가중 팩터는 하 나 이상의 기준에 따라 계산될 수 있으며, 고정적인 값일 수 있거나, 혹은 대안적으로는, 프레임마다 또는 서브프레임마다 계산되는 적응적인 값일 수 있다.
도 16은 고대역 여기 신호(S120)를 하모닉적으로 확장된 신호(S160)와 변조된 잡음 신호(S170)의 가중된 합으로서 계산하도록 구성되는 결합기(490)의 구현(492)에 대한 블록도를 나타낸다. 결합기(492)는 하모닉 가중 팩터(S180)에 따라 하모닉적으로 확장된 신호(S160)를 가중화하고, 잡음 가중 팩터(S190)에 따라 변조된 잡음 신호(S170)를 가중화하며, 가중된 신호들의 합으로서 고대역 여기 신호(S120)를 출력하도록 구성된다. 본 예에서, 결합기(492)는 하모닉 가중 팩터(S180) 및 잡음 가중 팩터(S190)를 계산하도록 구성되는 가중 팩터 계산기(550)를 구비한다.
가중 팩터 계산기(550)는 고대역 여기 신호(S120)에서 하모닉 컨텐트-대-잡음 컨텐트의 원하는 비율에 따라 가중 팩터들(S180 및 S190)을 계산하도록 구성될 수 있다. 예컨대, 결합기(492)가 고대역 신호(S30)의 하모닉 에너지-대-잡음 에너지의 비율과 유사한 상기 비율을 갖도록 고대역 여기 신호(S120)를 생성하는 것이 바람직할 수 있다. 가중 팩터 계산기(550)의 일부 구현들에서, 가중 팩터들(S180, S190)은 피치 이득 및/또는 음성 모드와 같이 협대역 신호(S20) 또는 협대역 잔여 신호의 주기성에 관련한 하나 이상의 파라미터들에 따라서 계산된다. 가중 팩터 계산기(550)의 이러한 구현은 예컨대 피치 이득에 비례하는 하모닉 가중 팩터(S180)에 값을 할당하거나 및/또는 유성음 음성 신호들에 대해서 보다는 무성음 음성 신호들에 대해서 잡음 가중 팩터(S190)에 더 높은 값을 할당하도록 구성될 수 있다.
다른 구현들에서, 가중 팩터 계산기(550)는 고대역 신호(S30)의 주기성 측정에 따라서 하모닉 가중 팩터(S180) 및/또는 잡음 가중 팩터(S190)에 대한 값들을 계산하도록 구성된다. 하나의 이러한 예에서, 가중 팩터 계산기(550)는 현재 프레임 또는 서브프레임에 대한 고대역 신호(S30)의 자기상관 계수의 최대 값으로서 하모닉 계수 팩터(S180)를 계산하는데, 여기사 상기 자기상관은 한 피치 래그의 지연을 포함하지만 제로 샘플들의 지연을 포함하지 않는 탐색 범위에 걸쳐 수행된다. 도 17은 한 피치 래그의 지연에 대해 중심에 있고 한 피치 래그보다 크지 않은 길이 n 샘플들로 이루어진 이러한 탐색 범위의 예를 나타낸다.
도 17은 가중 팩터 계산기(550)가 수 개의 스테이지들에서 고대역 신호(S30)의 주기성 측정치를 계산하는 다른 해결방법의 예를 또한 나타낸다. 제 1 스테이지에서는, 현재 프레임이 다수의 서브프레임들로 분할되고, 자기상관 계수가 최대가 되는 지연이 각각의 서브프레임에 대해 별도로 식별된다. 위에서 설명된 바와 같이, 자기상관은 한 피치 래그의 지연을 포함하지만 제로 샘플들의 지연을 포함하지 않는 탐색 범위에 걸쳐 수행된다.
제 2 스테이지에서는, 상응하는 식별된 지연을 각각의 서브프레임에 적용하고, 그 결과의 서브프레임들을 연결하여 최적으로 지연된 프레임을 구성하며, 또한 본래 프레임과 최적으로 지연된 프레임 간의 상관 계수로서 하모닉 가중 팩터(S180)를 계산함으로써, 지연된 프레임이 구성된다. 다른 대안에 있어서는, 가중 팩터 계산기(550)가 각각의 서브프레임에 대해 제 1 스테이지에서 획득되는 최 대 자기상관 계수들의 평균으로서 하모닉 가중 팩터(S180)를 계산한다. 가중 팩터 계산기(550)의 구현들은 또한 상관 계수를 스케일링하고 및/또는 그것을 다른 값과 결합함으로써 하모닉 가중 팩터(S180)에 대한 값을 계산하도록 구성될 수 있다.
프레임의 주기성 존재가 지시되는 경우에만 가중 팩터 계산기(550)가 고대역 신호(S30)의 주기성 측정치를 계산하는 것이 바람직할 수 있다. 예컨대, 가중 팩터 계산기(550)는 피치 이득과 같은 현재 프레임의 주기성의 다른 지시자와 임계값 사이의 관계에 따라서 고대역 신호(S30)의 주기성 측정치를 계산하도록 구성될 수 있다. 일예에서, 가중 팩터 계산기(550)는, 단지 프레임의 피치 이득(예컨대, 협대역 잔여 신호의 적응적인 코드북 이득)이 0.5보다 큰 값(대안적으로는, 적어도 0.5)을 갖는 경우에만, 고대역 신호(S30)에 대해 자기상관 연산을 수행하도록 구성된다. 다른 예에서는, 가중 팩터 계산기(550)가 음성 모드의 특정 상태들을 갖는 프레임들에 대해서만(예컨대, 단지 유성음 신호들에 대해서만) 고대역 신호(S30)에 자기상관 연산을 수행하도록 구성된다. 이러한 경우들에서는, 가중 팩터 계산기(550)가 음성 모드의 다른 상태들 및/또는 피치 이득의 보다 적은 값들을 갖는 프레임들에 대해 디폴트 가중 팩터를 할당하도록 구성될 수 있다.
실시예들은 주기성 이외의 특징들에 따라서 또는 그 주기성에 추가되어 특징들에 따라서 가중 팩터들을 계산하도록 구성되는 가중 팩터 계산기(550)의 다른 구현들을 포함한다. 예컨대, 이러한 구현은 작은 피치 래그를 갖는 음성 신호들에 대해서보다는 큰 피치 래그를 갖는 음성 신호들에 대한 잡음 이득 팩터(S190)에 더 높은 값을 할당하도록 구성될 수 있다. 가중 팩터 계산기(550)의 다른 이러한 구 현은, 다른 주파수 성분들의 신호 에너지들에 관련하여 기본 주파수의 배수들의 신호 에너지의 측정치에 따라서 광대역 음성 신호(S10)나 또는 고대역 신호(S30)의 하모닉성 측정치를 결정하도록 구성된다.
광대역 음성 인코더(A100)의 일부 구현들은 본 명세서에 설명된 바와 같은 피치 이득 및/또는 주기성 또는 하모닉성의 다른 측정치에 기초하여 주기성 또는 하모닉성의 지시(예컨대, 프레임이 하모닉적인지 혹은 비하모닉적인지를 나타내는 1 비트 플래그)를 출력하도록 구성된다. 일예에서, 상응하는 광대역 음성 디코더(B100)는 가중 팩터 계산과 같은 연산을 구성하기 위해서 이러한 지시를 사용한다. 다른 예에서, 이러한 지시는 음성 모드 파라미터에 대한 값을 계산하는데 있어 인코더 및/또는 디코더에서 사용된다.
고대역 여기 생성기(A302)가 고대역 여기 신호(S120)를 생성함으로써 그 여기 신호의 에너지가 가중 팩터들(S180 및 S190)의 특정 값들에 의해서 실질적으로 영향을 받지 않도록 하는 것이 바람직할 수 있다. 이 경우에, 가중 팩터 계산기(550)는 하모닉 가중 팩터(S180)나 또는 잡음 가중 팩터(S190)에 대한 값을 수신하고(또는 고대역 인코더(A200)의 저장부 또는 다른 엘리먼트로부터 이러한 값을 수신하고) 또한 다음과 같은 식에 따라 다른 가중 팩터에 대한 값을 유도하도록 구성될 수 있고,
(Wharmonic)2+(Wnoise)2=1 식(2)
여기서, Wharmonic는 하모닉 가중 팩터(S180)를 나타내고, Wnoise는 잡음 가중 팩 터(S190)를 나타낸다. 대안적으로, 가중 팩터 계산기(550)는 현재 프레임 또는 서브프레임에 대한 주기성 측정치의 값에 따라서, 여러 쌍들의 가중 팩터들(S180, S190) 중에서 상응하는 하나를 선택하도록 구성될 수 있고, 여기서 상기 쌍들은 식(2)과 같은 상수-에너지 비율을 규정하도록 미리 계산된다. 식(2)이 이루어지는 가중 팩터 계산기(550)의 구현에 있어서, 하모닉 가중 팩터(S180)에 대한 통상적인 값들은 대략 0.7 내지 대략 1.0의 범위에 있고, 잡음 가중 팩터(S190)에 대한 통상적인 값들은 대략 0.1 내지 대략 0.7의 범위에 있다. 가중 팩터 계산기(550)의 다른 구현들은 하모닉적으로 확장된 신호(S160)와 변조된 잡음 신호(S170) 사이의 원하는 기준 가중치에 따라서 변경되는 식(2)의 버전에 따라 동작하도록 구성될 수 있다.
희소성 코드북(엔트리가 대부분 제로 값들인 코드북)이 잔여 신호의 양자화된 표현을 계산하기 위해 사용되었을 때 합성된 음성 신호에서는 결함들이 발생할 수 있다. 코드북 희소성은 특히 협대역 신호가 낮은 비트 속도로 인코딩된다. 코드북 희소성에 의해 야기되는 결함들은 통상적으로 시간적으로 준-주기적(quasi-periodic)이고, 대부분은 3 kHz 위에서 발생한다. 인간의 귀는 더 높은 주파수들에서 더 좋은 시간 분해능을 갖기 때문에, 이러한 결함들은 고대역에서 더 두드러질 수 있다.
실시예들은 반-희소성 필터링(anti-sparseness filtering)을 수행하도록 구성되는 고대역 여기 생성기(A300)의 구현을 포함한다. 도 18은 고대역 여기 생성기(A302)의 구현(A312)에 대한 블록도를 나타내는데, 상기 고대역 여기 생성 기(A312)는 역양자화기(450)에 의해 생성되는 역양자화된 협대역 여기 신호를 필터링하도록 배치된 반-희소성 필터(600)를 구비한다. 도 19는 고대역 여기 생성기(A302)의 구현(A314)에 대한 블록도를 나타내는데, 상기 고대역 여기 생성기(A302)는 스펙트럼 확장기(A400)에 의해 생성되는 스펙트럼적으로 확장된 신호를 필터링하도록 배치된 반-희소성 필터(600)를 구비한다. 도 20은 고대역 여기 생성기(A302)의 구현(A316)에 대한 블록도를 나타내는데, 상기 고대역 여기 생성기(A302)는 고대역 여기 신호(S120)를 생성하기 위해 결합기(490)의 출력을 필터링하도록 배치된 반-희소성 필터(600)를 구비한다. 물론, 구현들(A312, A314, 및 A316) 중 임의의 구현의 특징들과 구현들(A304 및 A306) 중 임의의 구현의 특징들을 결합하는 고대역 여기 생성기의 구현이 고려되고, 명확히 개시된다. 반-희소성 필터(600)는 또한 예컨대 스펙트럼 확장기(A402)의 엘리먼트들(510, 520, 530, 및 540) 이후에 스펙트럼 확장기(A400) 내에 배치될 수 있다. 반-희소성 필터(600)는 또한 스펙트럼 폴딩, 스펙트럼 전이, 또는 하모닉 확장을 수행하는 스펙트럼 확장기(A400)의 구현들에 사용될 수 있다는 것이 명확히 주시된다.
반-희소성 필터(600)는 자신의 입력 신호의 위상을 변경하도록 구성될 수 있다. 예컨대, 고대역 여기 신호(S120)의 위상이 랜덤화되거나 그렇지 않으면 더욱 균일하게 시간에 걸쳐 분산되도록 하기 위해 반-희소성 필터(600)가 구성되고 배치되는 것이 바람직할 수 있다. 또한, 필터링된 신호의 크기 스펙트럼이 상당히 변경되지 않도록 하기 위해 반-희소성 필터(600)의 응답이 스펙트럼적으로 평탄되는 것이 바람직하다. 일예에서, 반-희소성 필터(600)는 다음의 식에 따른 전달 함수 를 갖는 전대역 통과 필터로서 구현된다:
Figure 112007078376169-pct00001
식(3)
이러한 필터의 한 효과는 입력 신호의 에너지를 확산시킬 수 있음으로써 그 에너지가 더 이상은 몇 개의 샘플들에만 집중하지 않도록 한다는 것일 수 있다.
코드북 희소성에 의해 야기되는 결함들은 일반적으로 잔여 신호가 적은 피치 정보를 포함하는 경우에 잡음과 같은 신호들에서 더 두드러지고, 또한 배경 잡음의 음성에서도 두드러진다. 희소성은 통상적으로 여기가 장기 구조를 갖는 경우들에 보다 적은 결함들을 야기하고, 실제로 위상 변경은 유성음 신호들에서 잡음을 야기할 수 있다. 따라서, 무성음 신호를 필터링하고 또한 변경없이도 적어도 일부 유성음 신호들을 통과시키도록 반-희소성 필터(600)를 구성하는 것이 바람직할 수 있다. 무성음 신호들은, 주파수가 증가함에 따라 평탄해지거나 윗방향으로 기울어지는 스펙트럼 포락선을 나타내는, 제로 또는 양(positive)에 근접하는 낮은 피치 이득(예컨대, 양자화된 협대역 적응성 코드북 이득) 및 스펙트럼 기울기(예컨대, 양자화된 제 1 반사 계수)에 의해서 특징된다. 반-희소성 필터(600)의 통상적인 구현들은 (예컨대 스펙트럼 기울기의 값에 의해 지시될 때)무성음 음향들을 필터링하고, 피치 이득이 임계값 아래에 있을 때(대안적으로는, 임계값보다 크기 않을 때) 유성음 음향들을 필터링하며, 그렇지 않다면 변경없이 신호를 통과시키도록 구성된다.
반-희소성 필터(600)의 추가적인 구현들은 상이한 최대 위상 변경 각도(예컨 대, 최대 180도)를 갖도록 구성되는 둘 이상의 필터들을 구비한다. 이러한 경우에, 반-희소성 필터(600)는, 더 큰 최대 위상 변경 각도가 더 낮은 피치 이득 값들을 갖는 프레임들에 대해서 사용되도록 하기 위해서, 피치 이득의 값(예컨대, 양자화된 적응적인 코드북 또는 LTP 이득)에 따라 이러한 성분 필터들 중에서 선택하도록 구성될 수 있다. 반-희소성 필터(600)의 구현은 또한, 입력 신호의 더 넓은 주파수 범위에 걸쳐 위상을 변경하도록 구성되는 필터가 더 낮은 피치 이득 값들을 갖는 프레임들에 대해 사용되도록 하기 위해서, 얼마간의 주파수 스펙트럼에 걸쳐 위상을 변경하도록 구성되는 상이한 성분 필터들을 구비할 수 있다.
인코딩된 음성 신호의 정확한 재생의 경우에는, 합성된 광대역 음성 신호(S100)의 고대역 및 협대역 부분들의 레벨들 간의 비율이 본래 광대역 음성 신호(S10)에서의 고대역 및 협대역 부분들의 레벨들 간의 비율과 유사하게 되는 것이 바람직할 수 있다. 고대역 코딩 파라미터들(S60a)에 의해 표현될 때의 스펙트럼 포락선 이외에도, 고대역 인코더(A200)는 시간적인 또는 이득 포락선을 규정함으로써 고대역 신호(S30)를 특징짓도록 구성될 수 있다. 도 10에 도시된 바와 같이, 고대역 인코더(A202)는 고대역 이득 팩터 계산기(A230)를 구비하는데, 상기 고대역 이득 팩터 계산기(A230)는 프레임 또는 그 프레임의 일부 부분에 걸친 두 신호들의 에너지들 간의 차이나 비율과 같은 고대역 신호(S30)와 합성된 고대역 신호(S130) 간의 관계에 따라서 하나 이상의 이득 팩터들을 계산하도록 구성되고 배치된다. 고대역 인코더(A202)의 다른 구현들에 있어서, 고대역 이득 계산기(A230)가 마찬가지로 구성될 수 있지만, 대신에 고대역 신호(S30)와 협대역 여기 신호(S80) 또는 고대역 여기 신호(S120) 간의 이러한 시변적인 관계에 따라 이득 포락선을 계산하도록 배치될 수 있다.
협대역 여기 신호(S80) 및 고대역 신호(S30)의 시간적인 포락선들은 마찬가지로 유사하다. 그러므로, 고대역 신호(S30)와 협대역 여기 신호(S80)(또는 고대역 여기 신호(S120) 또는 합성된 고대역 신호(S130)와 같이 그로부터 유도되는 신호) 간의 관계에 기초하여 이득 포락선을 인코딩하는 것은 일반적으로 고대역 신호(S30)에만 기초하여 이득 포락선을 인코딩하는 것보다 더 효율적일 것이다. 통상적인 구현에 있어서, 고대역 인코더(A202)는 각 프레임에 대해 5 개의 이득 팩터들을 규정하는 8 내지 12 비트들의 양자화된 인덱스를 출력하도록 구성된다.
고대역 이득 팩터 계산기(A230)는 하나 이상의 일련의 부작업들을 포함하는 작업으로서 이득 팩터 계산을 수행하도록 구성될 수 있다. 도 21은 고대역 신호(S30) 및 합성된 고대역 신호(S130)의 상대적인 에너지들에 따라 상응하는 서브프레임에 대한 이득 값을 계산하는 이러한 작업의 예(T200)의 흐름도를 나타내고 있다. 작업들(220a 및 220b)은 각 신호들의 상응한 서브프레임들의 에너지들을 계산한다. 예컨대, 작업들(220a 및 220b)은 각 서브프레임의 샘플들의 제곱들의 합으로서 에너지를 계산하도록 구성될 수 있다. 작업(T230)은 이러한 에너지들의 비율의 제곱근으로서 서브프레임들에 대한 이득 팩터를 계산한다. 본 예에서, 작업(T230)은 서브프레임에 걸쳐 고대역 신호(S30)의 에너지-대-합성된 고대역 신호(S130)의 에너지의 비율의 제곱근으로서 이득 팩터를 계산한다.
고대역 이득 팩터 계산기(A230)가 윈도우잉 함수에 따라서 서브프레임 에너 지들을 계산하는 것이 바람직할 수 있다. 도 22는 이득 팩터 계산 작업(T200)의 이러한 구현(T210)에 대한 흐름도를 나타내고 있다. 작업(T215a)은 고대역 신호(S30)의 윈도우잉 함수를 고대역 신호(S30)에 적용하고, 작업(T215b)은 동일한 윈도우잉 함수를 합성된 고대역 신호(S130)에 적용한다. 작업들(220a 및 220b)의 구현들(222a 및 222b)은 각각의 윈도우들의 에너지들을 계산하고, 작업(T230)은 그 에너지들의 비율에 대한 제곱근으로서 서브프레임에 대한 이득 팩터를 계산한다.
인접하는 서브프레임들에 겹치는 윈도우잉 함수를 적용하는 것이 바람직할 수 있다. 예컨대, 중첩-합 형태(overlap-add fashion)로 적용될 수 있는 이득 팩터들을 생성하는 윈도우잉 함수는 서브프레임들 간의 비연속성을 감소시키거나 방지하는데 도움을 줄 수 있다. 일예에서, 고대역 이득 팩터 계산기(A230)는 도 23a에 도시된 바와 같은 사다리꼴 윈도우잉을 적용하도록 구성되는데, 여기서 그 윈도우는 두 인접하는 서브프레임들 각각을 1 msec만큼 겹친다. 도 23b는 20 msec 프레임의 5 개의 서브프레임들 각각에 이러한 윈도우잉 함수를 적용하는 것을 나타내고 있다. 고대역 이득 팩터 계산기(A230)의 다른 구현들은 대칭적이거나 비대칭적일 수 있는 상이한 윈도우 모양(예컨대, 직사각형, 해밍) 및/또는 상이한 겹침 기간들을 갖는 윈도우잉 함수들을 적용하도록 구성될 수 있다. 고대역 이득 팩터 계산기(A230)의 구현이 상이한 길이들의 서브프레임들을 포함하도록 프레임 내 및/또는 프레임에 대한 상이한 서브프레임들에 상이한 윈도우잉 함수들을 적용하도록 구성되는 것이 또한 가능하다.
제한없이, 다음의 값들이 특정 구현들에 대한 예들로서 제공된다. 비록 임 의의 다른 지속기간이 사용될 수 있지만, 본 경우에는 20 msec 프레임이 가정된다. 7 kHz로 샘플링되는 고대역 신호의 경우에, 각 프레임은 140개의 서브샘플들을 갖는다. 만약 이러한 프레임이 동일한 길이를 갖는 5 개의 서브프레임들로 분할된다면, 각각의 서브프레임은 28 개의 샘플들을 가질 것이고, 도 23a에 도시된 바와 같은 윈도우는 42 개의 샘플들 폭일 것이다. 8 kHz로 고대역 신호가 샘플링되는 경우에는, 각각의 프레임은 160개의 샘플들을 갖는다. 만약 이러한 프레임이 동일한 길이를 갖는 5 개의 서브프레임들로 분할된다면, 각각의 서브프레임은 32 개의 샘플들을 가질 것이고, 도 23a에 도시된 바와 같은 윈도우는 48 개의 샘플들 폭일 것이다. 다른 구현들에서는, 임의의 폭의 서브프레임들이 사용될 수 있고, 심지어는 고대역 이득 계산기(A230)의 구현이 프레임의 각 샘플에 대해 상이한 이득 팩터를 생성하도록 구성되는 것이 가능하다.
도 24는 고대역 디코더(B200)의 구현(B202)에 대한 블록도를 나타낸다. 고대역 디코더(B202)는 협대역 여기 신호(S80)에 기초하여 고대역 여기 신호(S120)를 생성하도록 구성되는 고대역 여기 생성기(B300)를 구비한다. 특정 시스템 설계 선택들에 따라서, 고대역 여기 생성기(B300)는 본 명세서에 설명된 바와 같이 고대역 여기 생성기(A300)의 구현들 중 임의의 구현에 따라 구현될 수 있다. 통상적으로, 특정 코딩 시스템의 고대역 인코더의 고대역 여기 생성기로서 동일한 응답을 갖도록 고대역 여기 생성기(B300)를 구현하는 것이 바람직하다. 협대역 디코더(B110)는 통상적으로 인코딩된 협대역 여기 신호(S50)의 역양자화를 수행할 것이지만, 그러나, 대부분이 경우에 고대역 여기 생성기(B300)는 협대역 디코더(B110)로부터 협 대역 여기 신호(S80)를 수신하도록 구현될 수 있으며, 인코딩된 협대역 여기 신호(S50)를 역양자화하도록 구성되는 역양자화기를 포함할 필요가 없다. 또한, 역양자화된 협대역 여기 신호가 필터(330)와 같은 협대역 합성 필터에 입력되기 이전에, 협대역 디코더(B110)가 상기 역양자화된 협대역 여기 신호를 필터링하도록 배치되는 반-희소성 필터(600)의 경우를 포함하도록 구현되는 것이 가능하다.
역양자화기(560)는 고대역 필터 파라미터들(560a)(본 예에서는, 한 세트의 LSF들에 대한 파라미터들)을 역양자화하도록 구성되고, LSF-LP 필터 계수 변환부(570)는 LSF들을 한 세트의 필터 계수들로 변환하도록 구성된다(예컨대, 협대역 인코더(A122)의 역양자화기(240) 및 변환부(250)를 참조하여 위에 설명된 바와 같이). 다른 구현들에서는, 위에 설명된 바와 같이, 상이한 계수 세트들(예컨대, 켑스펙트럼 계수들) 및/또는 계수 표현들(예컨대, ISP들)이 사용될 수 있다. 고대역 합성 필터(B200)는 고대역 여기 신호(S120) 및 필터 계수들 세트에 따라 합성된 고대역 신호를 생성하도록 구성된다. 고대역 인코더가 합성 필터를 구비하는 시스템의 경우에(예컨대, 위에 설명된 바와 같은 인코더(A202)의 예에서와 같은 경우), 고대역 합성 필터(B200)가 그 합성 필터와 동일한 응답(예컨대, 동일한 전달 함수)을 갖도록 구현하는 것이 바람직할 수 있다.
고대역 디코더(B202)는 또한 고대역 이득 팩터들(S60b)을 역양자화하도록 구성되는 역양자화기(580), 및 고대역 신호(S100)를 생성하기 위해서 합성된 고대역 신호에 역양자화된 이득 팩터들을 적용하도록 구성되고 배치되는 이득 제어 엘리먼트(590)(예컨대, 곱셈기 또는 증폭기)를 구비한다. 프레임의 이득 포락선이 하나 의 이득 팩터에 의해 규정되는 경우에, 이득 제어 엘리먼트(590)는 어쩌면 상응하는 이웃 인코더의 이득 계산기(예컨대, 고대역 이득 계산기(A230))에 의해서 적용되는 것과 동일하거나 혹은 상이한 윈도우잉 함수일 수 있는 윈도우 함수에 따라서 각 서브프레임에 이득 팩터들을 적용하도록 구성되는 로직을 구비할 수 있다. 고대역 디코더(B202)의 다른 구현들에 있어서, 이득 제어 엘리먼트(590)도 유사하게 구성되지만, 대신에 양자화된 이득 팩터들을 협대역 여기 신호(S80)에 적용하거나 또는 고대역 여기 신호(S120)에 적용하도록 배치된다.
위에 언급된 바와 같이, (인코딩 동안에 역양자화된 값들을 사용함으로써) 고대역 인코더 및 고대역 디코더에서 동일한 상태를 획득하는 것이 바람직할 수 있다. 따라서, 이러한 구현에 따른 코딩 시스템에서는 고대역 여기 생성기들(A300 및 B300)의 상응하는 잡음 생성기들에 대해 동일한 상태를 보장하는 것이 바람직할 수 있다. 예컨대, 이러한 구현의 고대역 여기 생성기들(A300 및 B300)은, 잡음 생성기의 상태가 동일한 프레임 내에 이미 코딩되어진 정보의 결정적인 함수이도록 구성될 수 있다(예컨대, 협대역 필터 파라미터들(S40) 또는 그것의 일부 및/또는 인코딩된 협대역 여기 신호(S50) 또는 그것의 일부).
본 명세서에 설명된 엘리먼트들의 양자화기들 중 하나 이상(예컨대, 양자화기(230, 420, 또는 430))은 분류된 벡터 양자화를 수행하도록 구성될 수 있다. 예컨대, 이러한 양자화기는 협대역 채널 및/또는 고대역 채널의 동일 프레임 내에 이미 코딩되어진 정보에 기초하여 한 세트의 코드북들 중 하나를 선택하도록 구성될 수 있다. 이러한 기술은 통상적으로 추가적인 코드북을 저장하는 댓가로 증가된 코딩 효율성을 제공한다.
예컨대 도 8 및 도 9를 참조하여 위에 설명된 바와 같이, 상당한 양의 주기적인 구조가 협대역 음성 신호(S20)로부터 대략적인 스펙트럼 포락선을 제거한 이후에 잔여 신호에 남아 있을 수 있다. 예컨대, 잔여 신호는 시간에 걸쳐 대충 주기적인 펄스들 또는 스파이크들로 이루어진 시퀀스를 포함할 수 있다. 통상적으로 피치에 관련되는 이러한 구조는 특히 유성음 음성 신호들에서 발생하기 쉽다. 협대역 잔여 신호의 양자화된 표현의 계산은 예컨대 하나 이상의 코드북들에 의해 표현되는 바와 같은 장기 주기성의 모델에 따라 이러한 피치 구조의 인코딩을 포함할 수 있다.
실질적인 잔여 신호의 피치 구조는 주기성 모델에 정확히 일치하지 않을 수 있다. 예컨대, 잔여 신호는 피치 펄스들의 위치들의 규칙성에 있어 작은 지터들을 포함할 수 있고, 그로 인해서 프레임에서 연속적인 피치 펄스들 사이의 거리들은 정확히 동일하지 않고, 구조가 완전히 규칙적이지 않다. 이러한 불규칙성은 코딩 효율을 감소시키는 경향이 있다.
협대역 인코더(A120)의 일부 구현들은 양자화 이전이나 또는 양자화 동안에 적응적인 시간 왜곡을 잔여 신호에 적용함으로써 또는 그렇지 않다면 적응적인 시간 왜곡을 인코딩된 여기 신호에 포함시킴으로써 피치 구조의 규칙화를 수행하도록 구성된다. 예컨대, 이러한 인코더는 최종적인 여기 신호가 장기 주기성의 모델에 최적으로 적합하도록 하기 위해서 (하나 이상의 지각적인 가중화 및/또는 에러 최소화 기준에 따라서) 시간에 따른 왜곡 정도를 선택하거나 그렇지 않다면 계산하도 록 구성될 수 있다. 피치 구조의 규칙화는 RCELP(Relaxation Code Linear Prediction) 인코더들로 지칭되는 CELP 인코더들의 서브세트에 의해서 수행된다.
RCELP 인코더는 통상적으로 적응적인 시간 시프트로서 시간 왜곡을 수행하도록 구성된다. 이러한 시간 시프트는 음의 수 msec로부터 양의 수 msec까지의 지연 범위일 수 있고, 그것은 청각적인 비연속성을 막기 위해서 원만하게 변하게 된다. 일부 구현들에서, 이러한 인코더는 구분적인(piecewise) 형태로 규칙화를 적용하도록 구성되는데, 여기서 각각의 프레임 또는 서브프레임은 상응하는 고정된 시간 시프트만큼 왜곡된다. 다른 구현들에서, 인코더는 연속적인 왜곡 함수로서 규칙화를 적용하도록 구성되고, 그럼으로써 프레임 또는 서브프레임은 피치 변화곡선(pitch contour)(피치 궤적으로도 지칭됨)에 따라 왜곡된다. 일부 경우에는(예컨대, 미국 특허 출원공개공보 2004/0098255호에 개시된 바와 같은 경우), 인코더는 인코딩된 여기 신호를 계산하기 위해서 사용되는 지각적으로 가중된 입력 신호에 시프트를 적용함으로써 상기 인코딩된 여기 신호에 시간 왜곡을 포함시키도록 구성된다.
인코더는 규칙화되고 양자화된 인코딩된 여기 신호를 계산하고, 디코더는 디코딩된 음성 신호를 합성하는데 사용되는 여기 신호를 획득하기 위해서 인코딩된 여기 신호를 역양자화한다. 따라서, 디코딩된 출력 신호는 규칙화에 의해서 상기 인코딩된 여기 신호에 포함되어진 동일한 가변적인 지연을 나타낸다. 통상적으로, 규칙화 크기들을 명시하는 어떠한 정보도 디코더에 전송되지 않는다.
규칙화는 잔여 신호를 더 쉽게 인코딩하게 하는 경향이 있고, 이는, 일반적으로 결함들을 생성하지 않고도, 장기 예측기로부터의 코딩 이득을 향상시키며 따 라서 전체적인 코딩 효율을 올린다. 유성음인 프레임들에 대해서만 규칙화를 수행하는 것이 바람직할 수 있다. 예컨대, 협대역 인코더(A124)는 유성음 신호들과 같이 장기 구조를 갖는 이러한 프레임들 또는 서브프레임들만을 시프트시키도록 구성될 수 있다. 심지어 피치 펄스 에너지를 포함하는 서브프레임들에 대해서만 규칙화를 수행하는 것이 바람직할 수 있다. RCELP 코딩의 여러 구현들이 미국 특허 제 5,704,003호(Kleijn 등) 및 제 6,879,955호(Rao)와 미국 특허출원공개공보 제 2004/0098255(Kovesi 등)에 개시되어 있다. RCELP 코더들의 현존하는 구현들은 Telecommunications Industry Association(TIA) IS-127 및 Third Generation Partnership Project 2(3GPP2) Selectable Mode Vocoder(SMV)에 개시된 바와 같은 Enhanced Variable Rate Codec(EVRC)를 포함한다.
불행하게도, 규칙화는 고대역 여기가 인코딩된 협대역 여기 신호로부터 유도되는 광대역 음성 코더에 대해 문제들을 야기할 수 있다(광대역 음성 인코더(A100) 및 광대역 음성 디코더(B100)를 구비하는 시스템과 같이). 시간-왜곡된 신호로부터 그것의 파생으로 인해서, 고대역 여기 신호는 일반적으로 본래 고대역 음성 신호의 시간 프로파일과는 다른 시간 프로파일을 가질 것이다. 즉, 고대역 여기 신호는 본래 고대역 음성 신호와 더 이상은 동시적이지 않을 것이다.
왜곡된 고대역 여기 신호와 본래 고대역 음성 신호 사이의 시간적인 비정렬은 몇 가지 문제점들을 야기할 수 있다. 예컨대, 왜곡된 고대역 여기 신호는 본래 고대역 음성 신호로부터 추출되는 필터 파라미터들에 따라 구성되는 합성 필터를 위한 적절한 소스 여기를 더 이상은 제공하지 않을 수 있다. 그 결과, 합성된 고 대역 신호는 디코딩된 광대역 음성 신호의 인지되는 품질을 감소시키는 청각적인 결함들을 포함할 수 있다.
상기 시간적인 비정렬은 또한 이득 포락선 인코딩에 있어 비효율성을 야기할 수 있다. 위에 언급한 바와 같이, 협대역 여기 신호(S80)와 고대역 신호(S30)의 시간적인 포락선들 사이에는 상관성이 존재하기 쉽다. 이러한 두 시간적인 포락선들 사이의 관련성에 따라 고대역 신호의 이득 포락선을 인코딩함으로써, 이득 포락선을 직접 인코딩하는 것에 비해서 코딩 효율성의 증가가 이루어질 수 있다. 인코딩된 협대역 여기 신호가 규칙화될 때는, 그러나, 이러한 상관성은 약해질 수 있다. 협대역 여기 신호(S80)와 고대역 신호(S30) 사이의 시간적인 비정렬은 고대역 이득 팩터들(S60b)에 있어 변동이 나타나도록 야기하고, 코딩 효율성은 떨어질 수 있다.
구현들은 상응하는 인코딩된 협대역 여기 신호에 포함되어 있는 시간 왜곡에 따라서 고대역 음성 신호의 시간 왜곡을 수행하는 광대역 음성 인코딩의 방법들을 포함한다. 이러한 방법들의 잠재적인 장점들은 디코딩된 광대역 음성 신호의 품질을 향상시키는 것 및/또는 고대역 이득 포락선을 코딩하는 효율성을 향상시키는 것을 포함한다.
도 25는 광대역 음성 인코더(A100)의 구현(AD10)에 대한 블록도를 나타낸다. 인코더(AD10)는 인코딩된 협대역 여기 신호(S50)의 계산 동안에 규칙화를 수행하도록 구성되는 협대역 인코더(A120)의 구현(A124)을 포함한다. 예컨대, 협대역 인코더(A124)는 위에 설명된 RCELP 구현들 중 하나 이상에 따라 구성될 수 있다.
협대역 인코더(A124)는 적용되는 시간 왜곡의 정도를 규정하는 규칙화 데이터 신호(SD10)를 출력하도록 또한 구성된다. 협대역 인코더(A124)가 각각의 프레임 또는 서브프레임에 고정된 시간 시프트를 적용하도록 구성되는 여러 경우들에 있어서, 규칙화 데이터 신호(SD10)는 샘플들, milliseconds, 또는 일부 다른 시간 증분을 통해 정수 또는 비정수 값으로서 각각의 시간 시프트 크기를 나타내는 일련의 값들을 포함할 수 있다. 협대역 인코더(A124)가 샘플들의 프레임이나 다른 시퀀스의 시간 스케일을 변경하도록(예컨대, 한 부분을 압축하고 다른 부분을 확장함으로써) 구성되는 경우에, 규칙화 정보 신호(SD10)는 한 세트의 함수 파라미터들과 같은 변경에 대한 상응하는 설명을 포함할 수 있다. 한 특정 예에서, 협대역 인코더(A124)는 프레임을 3 개의 서브프레임들로 분할하고 또한 각 서브프레임에 대한 고정된 시간 시프트를 계산하도록 구성됨으로써, 규칙화 데이터 신호(SD10)는 인코딩된 협대역 신호의 각각의 규칙화된 프레임에 대한 3 개의 시간 시프트들을 나타낸다.
광대역 음성 인코더(AD10)는 시간-왜곡된 고대역 음성 신호(S30a)를 생성하기 위해서, 입력 신호에 의해 지시되는 지연 크기들에 따라 고대역 음성 신호(S30)의 부분들을 전진 또는 후퇴시키도록 구성되는 지연 라인(D120)을 포함한다. 도 25에 도시된 예에서, 지연 라인(D120)은 규칙화 데이터 신호(SD10)에 의해 지시되는 왜곡에 따라 고대역 음성 신호(S30)를 시간 왜곡시키도록 구성된다. 이러한 방식에서는, 인코딩된 협대역 여기 신호(S50)에 포함되어 있는 동일한 크기의 시간 왜곡이 또한 분석 이전에 고대역 음성 신호(S30)의 상응하는 부분에 적용된다. 비 록 이러한 예는 고대역 인코더(A200)와는 별도의 엘리먼트로서 지연 라인(D120)을 나타내지만, 다른 구현들에서는 지연 라인(D120)이 고대역 인코더의 일부로서 배치된다.
고대역 인코더(A200)의 추가적인 구현들은 비왜곡된 고대역 음성 신호(S30)의 스펙트럼 분석(예컨대, LPC 분석)을 수행하고 또한 고대역 이득 파라미터들(S60b)의 계산에 앞서 고대역 음성 신호(S30)의 시간 왜곡을 수행하도록 구성될 수 있다. 이러한 인코더는, 예컨대, 시간 왜곡을 수행하도록 배치되는 지연 라인(D120)의 구현을 포함할 수 있다. 이러한 경우에는, 그러나, 비왜곡된 신호(S30)의 분석에 기초한 고대역 필터 파라미터들(S60a)이 고대역 여기 신호(S120)와 시간적으로 비정렬되는 스펙트럼 포락선을 나타낼 수 있다.
지연 라인(D120)은 원하는 시간 왜곡 연산들을 고대역 음성 신호(S30)에 적용하기에 적합한 로직 엘리먼트들 및 저장 엘리먼트들의 임의의 결합에 따라 구성된다. 예컨대, 지연 라인(D120)은 원하는 시간 시프트들에 따라 버퍼로부터 고대역 음성 신호(S30)를 판독하도록 구성될 수 있다. 도 26a는 시프트 레지스터(SR1)를 구비하는 지연 라인(D120)의 구현(D122)을 개략적으로 나타내고 있다. 시프트 레지스터(SR1)는 고대역 음성 신호(S30)의 가장 최근의 m 개의 샘플들을 수신하여 저장하도록 구성되는 어느 정도의 길이(m)를 갖는 버퍼이다. m의 값은 지원될 최대 양(또는 "전진") 및 음(또는 "후퇴") 시간 시프트들의 합과 동일하다. m의 값이 고대역 신호(S30)의 프레임 또는 서브프레임 길이와 동일하게 되는 것이 편리할 수 있다.
지연 라인(D122)은 시프트 레지스터(SR1)의 오프셋 위치(OL)로부터 시간-왜곡된 고대역 신호(S30a)를 출력하도록 구성된다. 오프셋 위치(OL)의 위치는 예컨대 규칙화 데이터 신호(SD10)에 의해 지시되는 바와 같은 현재의 시간 시프트에 따라 기준 위치(제로 시간 시프트)에 대해서 변한다. 지연 라인(D122)은 동일한 전진 및 후퇴 제한치들을 제공하도록 구성될 수 있거나, 대안적으로는, 더 큰 시프트가 다른 방향보다 한 방향으로 수행될 수 있도록 하기 위해서 전진 제한치 및 후퇴 제한치 중 어느 하나가 다른 것보다 더 크도록 구성될 수 있다. 도 26a는 음의 시간 시프트보다는 더 큰 양의 시간 시프트를 제공하는 특정 예를 나타낸다. 지연 라인(D122)은 (예컨대, 출력 버스 폭에 따라서) 한 번에 하나 이상의 샘플들을 출력하도록 구성될 수 있다.
수 밀리초보다 큰 크기를 갖는 규칙화 시간 시프트는 디코딩되는 신호에서 청각적인 결함들을 야기할 수 있다. 통상적으로, 협대역 인코더(A124)에 의해 수행될 때의 규칙화 시간 시프트의 크기는 수 밀리초를 초과하지 않을 것이고, 그로 인해서 규칙화 데이터 신호(SD10)에 의해 지시되는 시간 시프트들은 제한될 것이다. 그러나, 이러한 경우에는 지연 라인(D122)이 양 및/또는 음의 방향으로의 시간 시프트들에 대해 최대 제한치를 부여하도록 구성되는 것이 바람직할 수 있다(예컨대, 협대역 인코더에 의해 부여되는 더 엄격한 제한치를 지키도록).
도 26b는 시프트 윈도우(SW)를 나타내는 지연 라인(D122)의 구현(D124)에 대한 개략도를 나타내고 있다. 본 예에서, 오프셋 위치(OL)의 지점은 시프트 윈도우(SW)에 의해서 제한된다. 비록 도 26b는 버퍼 길이(m)가 시프트 윈도우(SW)의 폭보다 더 큰 경우를 나타내지만, 지연 라인(D124)은 또한 시프트 윈도우(SW)의 폭이 m과 같도록 구현될 수 있다.
다른 구현들에 있어서, 지연 라인(D120)은 고대역 음성 신호(S30)를 원하는 시간 시프트들에 따라 버퍼에 기록하도록 구성된다. 도 27은 고대역 음성 신호(S30)를 수신하여 저장하도록 구성되는 두 시프트 레지스터들(SR2 및 SR3)을 구비하는 지연 라인(D120)의 구현(D130)에 대한 개략도를 나타내고 있다. 지연 라인(D130)은 예컨대 규칙화 데이터 신호(SD10)에 의해 지시되는 시간 시프트에 따라서 시프트 레지스터(SR2)로부터의 프레임 또는 서브프레임을 시프트 레지스터(SR3)에 기록하도록 구성된다. 시프트 레지스터(SR3)는 시간 왜곡된 고대역 신호(S30)를 출력하도록 배치되는 FIFO 필터로서 구성된다.
도 27에 도시된 특정 예에서, 시프트 레지스터(SR2)는 프레임 버퍼 부분(FB1) 및 지연 버퍼 부분(DB)을 구비하고, 시프트 레지스터(SR3)는 프레임 버퍼 부분(FB2), 전진 버퍼 부분(AB), 및 후퇴 버퍼 부분(RB)을 구비한다. 전진 버퍼(AB) 및 후퇴 버퍼(RB)의 길이들은 동일할 수 있거나 혹은 하나가 다른 것보다 더 클 수 있고, 따라서 다른 방향보다는 한 방향으로의 더 큰 시프트가 제공된다. 지연 버퍼(DB) 및 후퇴 버퍼 부분(RB)은 동일한 길이를 갖도록 구성될 수 있다. 대안적으로, 지연 버퍼(DB)는 샘플들을 프레임 버퍼(FB1)로부터 시프트 레지스터(SR3)로 전송하는데 필요한 시간 간격을 고려하기 위해서 후퇴 버퍼(RB)보다 더 짧을 수 있고, 상기 시프트 레지스터(SR3)는 시프트 레지스터(SR3)로의 저장에 앞서서 샘플들의 왜곡과 같은 다른 처리 동작들을 포함할 수 있다.
도 27의 예에서, 프레임 버퍼(FB1)는 한 프레임의 고대역 신호(S30)의 길이와 동일한 길이를 갖도록 구성된다. 다른 예에서, 프레임 버퍼(FB1)는 한 서브프레임의 고대역 신호(S30)의 길이와 동일한 길이를 갖도록 구성된다. 이러한 경우에, 지연 라인(D130)은 시프트될 프레임의 모든 서브프레임들에 동일한 (예컨대, 평균) 지연을 적용하기 위해서 로직을 구비하도록 구성될 수 있다. 지연 라인(D130)은 또한 후퇴 버퍼(RB) 또는 전진 버퍼(AB)에 겹쳐기록될 값들을 갖는 프레임 버퍼(FB1)로부터의 값들을 평균하기 위해 로직을 구비할 수 있다. 다른 예에서, 시프트 레지스터(SR3)는 프레임 버퍼(FB1)를 통해서만 고대역 신호(S30)의 값들을 수신하도록 구성될 수 있고, 이 경우에는 지연 라인(D130)이 시프트 레지스터(SR3)에 기록될 연속적인 프레임들 또는 서브프레임들 간의 갭들에 걸쳐 보간하기 위해 로직을 구비할 수 있다. 다른 구현들에서, 지연 라인(D130)은 프레임 버퍼(FB1)로부터의 샘플들을 시프트 레지스터(SR3)에 기록하기 이전에 그에 대해 왜곡 연산을 수행하도록 구성될 수 있다(예컨대, 규칙화 데이터 신호(SD10)에 의해 제시되는 함수에 따라).
지연 라인(D120)이 규칙화 데이터 신호(SD10)에 의해 규정되는 왜곡에 기초하여(그러나, 그와 동일하지는 않음) 시간 왜곡을 적용하는 것이 바람직할 수 있다. 도 28은 지연 값 매퍼(D110)를 구비하는 광대역 음성 인코더(AD10)의 구현(AD12)에 대한 블록도를 나타내고 있다. 지연 값 매퍼(M110)는 규칙화 데이터 신호(SD10)에 의해 지시되는 왜곡을 매핑된 지연 라인들(SD10a)에 매핑시키도록 구성된다. 지연 라인(D120)은 매핑된 지연 값들(SD10a)에 의해 지시되는 왜곡에 따 라서 시간-왜곡된 고대역 음성 신호(S30a)를 생성하도록 배치된다.
협대역 인코더에 의해 적용되는 시간 시프트는 시간에 걸쳐 원만하게 전개하는 것으로 기대될 수 있다. 그러므로, 통상적으로는, 음성 프레임 동안에 서브프레임들에 적용되는 평균 협대역 시간 시프트를 컴퓨팅하고 또한 이러한 평균에 따라서 고대역 음성 신호(S30)의 상응하는 프레임을 시프트시키는 것이 충분하다. 한 이러한 예에서, 지연 값 매퍼(D110)는 각 프레임에 대한 서브프레임 지연 값들의 평균을 계산하도록 구성되고, 지연 라인(D120)은 고대역 신호(S30)의 상응하는 프레임에 그 계산된 평균을 적용하도록 구성된다. 다른 예들에서, 더 짧은 기간(두 서브프레임들이나 또는 프레임의 절반과 같은 기간)이나 또는 더 긴 기간(두 프레임들과 같은 기간)에 걸친 평균이 계산되어 적용될 수 있다. 평균이 비정수인 샘플들 값인 경우에는, 지연 값 매퍼(D110)가 그 값을 지연 라인(D120)에 출력하기 이전에 정수의 샘플 값들로 반올림하도록 구성될 수 있다.
협대역 인코더(A124)는 인코딩된 협대역 여기 신호에서 비정수인 샘플들 수의 규칙화 시간 시프트를 포함하도록 구성될 수 있다. 이러한 경우에는, 지연 값 매퍼(D110)가 협대역 시간 시프트를 정수인 샘플들의 수로 반올림하도록 구성되고 또한 지연 라인(D120)이 그 반올림된 시간 시프트를 고대역 음성 신호(S30)에 적용하도록 구성되는 것이 바람직할 수 있다.
광대역 음성 인코더(AD10)의 일부 구현들에 있어서, 협대역 음성 신호(S20) 및 고대역 음성 신호(S30)의 샘플링 속도들은 다를 수 있다. 이러한 경우에, 지연 값 매퍼(D110)는 협대역 음성 신호(S20)(또는 협대역 여기 신호(S80))와 고대역 음 성 신호(S30)의 샘플링 속도들 사이의 차이를 고려하기 위해서 규칙화 데이터 신호(SD10)에서 지시되는 시간 시프트 크기들을 조정하도록 구성될 수 있다. 예컨대, 지연 값 매퍼(D110)는 샘플링 속도들의 비율에 따라 시간 시프트 크기들을 스케일링하도록 구성될 수 있다. 위에 설명된 바와 같은 한 특정 예에서는, 협대역 음성 신호(S20)가 8 kHz로 샘플링되고, 고대역 음성 신호(S30)는 7 kHz로 샘플링된다. 이러한 경우에, 지연 값 매퍼(D110)는 각각의 시프트 크기에 7/8을 곱하도록 구성된다. 지연 값 매퍼(D110)의 구현들은 또한 본 명세서에 설명된 바와 같은 정수-반올림 및/또는 시간 시프트 평균 연산과 더불어 이러한 스케일링 연산을 수행하도록 구성될 수 있다.
추가적인 구현들에서, 지연 라인(D120)은 그렇지 않으면 샘플들의 프레임이나 다른 시퀀스의 시간 스케일을 변경하도록 구성된다(예컨대, 한 부분은 압축하고 다른 부분을 확장함으로써). 예컨대, 협대역 인코더(A124)는 피치 변화곡선 또는 궤적과 같은 함수에 따라 규칙화를 수행하도록 구성될 수 있다. 이러한 경우에, 규칙화 데이터 신호(SD10)는 한 세트의 파라미터들과 같은 함수의 상응하는 설명을 포함할 수 있고, 지연 라인(D120)은 그 함수에 따라 고대역 음성 신호(S30)의 프레임들 또는 서브프레임들을 왜곡시키도록 구성되는 로직을 포함할 수 있다. 다른 구현들에서, 지연 값 매퍼(D110)는 그 함수가 고대역 음성 신호(S30)에 지연 라인(D120)에 의해서 적용되기 이전에 그 함수를 평균, 스케일, 및/또는 반올림하도록 구성된다. 예컨대, 지연 값 매퍼(D110)는 다수의 샘플들을 각각 나타내는 하나 이상의 지연 값들을 그 함수에 따라 계산하도록 구성될 수 있고, 상기 지연 값들은 이어서 고대역 음성 신호(S30)의 하나 이상의 상응하는 프레임들이나 서브프레임들을 시간 왜곡시키기 위해서 지연 라인(D120)에 의해 적용된다.
도 29는 상응하는 인코딩된 협대역 여기 신호에 포함된 시간 왜곡에 따라서 고대역 음성 신호를 시간 왜곡시키기 위한 방법(MD100)의 흐름도를 나타낸다. 작업(TD100)은 협대역 음성 신호 및 고대역 음성 신호를 획득하기 위해서 광대역 음성 신호를 처리한다. 예컨대, 작업(TD100)은 필터 뱅크(A110)의 구현과 같이 저역통과 및 고역통과 필터들을 구비하는 필터 뱅크를 사용하여 광대역 음성 신호를 필터링하도록 구성될 수 있다. 작업(TD200)은 적어도 인코딩된 협대역 여기 신호 및 다수의 협대역 필터 파라미터들로 협대역 음성 신호를 인코딩한다. 인코딩된 협대역 여기 신호 및/또는 필터 파라미터들은 양자화될 수 있고, 인코딩된 협대역 음성 신호는 또한 음성 모드 파라미터와 같은 다른 파라미터들을 포함할 수 있다. 작업(TD200)은 인코딩된 협대역 여기 신호에 시간 왜곡을 포함시킨다.
작업(TD300)은 협대역 여기 신호에 기초하여 고대역 여기 신호를 생성한다. 이러한 경우에, 협대역 여기 신호는 인코딩된 협대역 여기 신호에 기초한다. 적어도 고대역 여기 신호에 따라, 작업(TD400)은 고대역 음성 신호를 적어도 다수의 고대역 필터 파라미터들로 인코딩한다. 예컨대, 작업(TD400)은 고대역 음성 신호를 다수의 양자화된 LSF들로 인코딩하도록 구성될 수 있다. 작업(TD500)은 인코딩된 협대역 여기 신호에 포함된 시간 왜곡에 관한 정보에 기초하는 고대역 음성 신호에 시간 시프트를 적용한다.
작업(TD400)은 고대역 음성 신호에 대해 스펙트럼 분석(LPC 분석과 같은)을 수행하고 및/또는 고대역 음성 신호의 이득 포락선을 계산하도록 구성될 수 있다. 이러한 경우들에서, 작업(TD500)은 분석 및/또는 이득 포락선 계산에 앞서서 고대역 음성 신호에 시간 시프트를 적용하도록 구성될 수 있다.
광대역 음성 인코더(A100)의 다른 구현들은 인코딩된 협대역 여기 신호에 포함된 시간 왜곡에 의해서 야기되는 고대역 여기 신호(S120)의 시간 왜곡을 반전시키도록 구성된다. 예컨대, 고대역 여기 생성기(A300)는 지연 라인(D120)의 구현을 포함하도록 구현될 수 있는데, 상기 지연 라인(D120)은 규칙화 데이터 신호(SD10) 또는 매핑된 지연 값들(SD10a)을 수신하도록 구성되고, 또한 상응하는 반전 시간 시프트를 협대역 여기 신호(S80)에 적용하고 및/또는 그에 기초하여서 하모닉적으로 확장된 신호(S160) 또는 고대역 여기 신호(S120)와 같은 후속하는 신호에 상기 상응하는 반전 시간 시프트를 적용하도록 구성된다.
다른 광대역 음성 인코더 구현들은 협대역 음성 신호(S20) 및 고대역 음성 신호(S30)를 서로 독립적으로 인코딩하도록 구성될 수 있고, 그럼으로써 고대역 음성 신호(S30)가 고대역 스펙트럼 포락선 및 고대역 여기 신호의 표현으로서 인코딩된다. 이러한 구현은, 인코딩된 협대역 여기 신호에 포함되어 있는 시간 왜곡과 관련한 정보에 따라서, 고대역 잔여 신호의 왜곡을 수행하거나 또는 그렇지 않으면 인코딩된 고대역 여기 신호에 시간 왜곡을 포함시키도록 구성될 수 있다. 예컨대, 고대역 인코더는 고대역 잔여 신호에 시간 왜곡을 적용하도록 구성되는 본 명세서에 설명된 바와 같은 지연 라인(D120) 및/또는 지연 값 매퍼(D110)의 구현을 포함할 수 있다. 이러한 동작의 잠재적인 장점들은 합성된 협대역 및 고대역 음성 신 호들 간의 더 나은 일치와 고대역 잔여 신호의 더 효율적인 인코딩을 포함한다.
위에 언급된 바와 같이, 본 명세서에 설명된 실시예들은 삽입되는 인코딩, 협대역 시스템들과의 호환성 지원 및 트랜스코딩에 대한 필요성 회피를 수행하는데 사용될 수 있는 구현들을 포함한다. 고대역 코딩에 대한 지원은 또한 칩들, 칩셋들, 장치들, 및/또는 역행 호환성을 갖는 광대역 지지를 구비한 네트워크들을 비용에 기초하여 구별하는 것을 제공할 수 있는데, 이들은 협대역 지원만을 갖는다. 본 명세서에 설명된 고대역 코딩에 대한 지원은 또한 저대역 코딩을 지원하기 위한 기술들, 및 예컨대 대략 50 또는 100 Hz로부터 최대로 대략 7 또는 8 kHz까지의 주파수 성분들의 코딩을 지원할 수 있는 실시예에 따른 시스템, 방법, 또는 장치와 연계하여 사용될 수 있다.
위에 언급된 바와 같이, 음성 코더에 고대역 지원을 추가하는 것은 특히 마찰음의 구분에 관한 명료성을 향상시킬 수 있다. 비록 이러한 구분은 일반적으로는 특정 컨텍스트로부터 청취자에 의해 유도될 수 있지만, 고대역 지원은 자동화 음성 메뉴 네비게이션 및/또는 자동적인 통화 처리를 위한 시스템과 같이 음성 인식 및 다른 기계 해석 애플리케이션들에서의 인에이블링 특징으로서 제공될 수 있다.
실시예에 따른 장치는 셀룰러 전화기나 PDA(personal digital assistant)와 같은 무선 통신을 위한 휴대용 장치에 삽입될 수 있다. 대안적으로, 이러한 장치는 VoIP 핸드셋, VoIP 통신들을 지원하도록 구성되는 개인용 컴퓨터, 또는 전화통화 또는 VoIP 통신들을 라우팅하도록 구성되는 네트워크 장치와 같은 다른 통신 장 치에 포함될 수 있다. 예컨대, 실시예에 따른 장치는 통신 장치를 위한 칩 또는 칩셋 내에 구현될 수 있다. 특정 애플리케이션에 따라, 이러한 장치는 음성 신호의 아날로그-디지털 및/또는 디지털-아날로그 변환과 같은 특징들, 음성 신호에 대해 증폭 및/또는 다른 신호 처리 동작을 수행하기 위한 회로, 및/또는 코딩된 음성 신호의 전송 및/또는 수신을 위한 무선-주파수 회로를 포함할 수 있다.
실시예들은 본 출원이 우선권을 청구하는 미국 가특허출원 제 60/667,901호 및 제 60/673,965호에 개시되어 있는 다른 특징들 중 하나 이상을 포함하고 및/또는 이를 사용할 수 있다는 것이 명확히 구상되고 드러난다. 이러한 특징들은 고대역에서 발생하면서 협대역으로부터는 거의 결여되는 짧은 지속시간의 고-에너지 버스트의 제거를 포함한다. 이러한 특징들은 고대역 LSF들과 같은 계수 표현들의 고정되거나 적응적인 평활을 포함한다. 이러한 특징들은 LSF들과 같은 계수 표현들의 양자화와 연관된 잡음의 고정적이거나 적응적인 형성을 포함한다. 이러한 특징들은 이득 포락선의 고정적이거나 적응적인 평활, 및 이득 포락선의 적응적인 감쇠를 포함한다.
설명된 실시예들의 앞서 설명은 당업자가 본 발명을 제작하거나 사용할 수 있을 정도로 제공되었다. 이러한 실시예들에 대해 여러 변경이 가능하고, 본 명세서에 제공된 일반적인 원리들은 다른 실시예들에도 역시 적용될 수 있다. 예컨대, 실시예는 배선에 의한 회로로서, ASIC(application-specific integrated circuit) 내에 제작되는 회로 구성으로서, 또는 비-휘발성 저장부에 로딩되는 펌웨어 프로그램이나 기계-판독가능 코드로서 데이터 저장 매체로부터나 또는 그 데이터 저장 매 체에 로딩되는 소프트웨어 프로그램으로서 부분적으로나 또는 전체적으로 구현될 수 있고, 이러한 코드는 마이크로프로세서나 다른 디지털 신호처리 유닛과 같은 로직 엘리먼트의 어레이에 의해서 실행가능한 명령들이다. 그 데이터 저장 매체는 반도체 메모리(이는 동적 또는 정적인 RAM(random-access memory), ROM(read-only memory), 및/또는 플래시 RAM을 포함할 수 있지만, 이러한 것들로 제한되지는 않음), 또는 강유전성, 자기저항성, 오보닉, 폴리메릭, 또는 위상-변화 메모리와 같은 저장 엘리먼트들의 어레이일 수 있거나, 또는 자기 디스크나 광 디스크와 같은 디스크 매체일 수 있다. "소프트웨어"란 용어는 소스 코드, 어셈블리 언어 코드, 기계 코드, 이진 코드, 펌웨어, 매크로코드, 마이크로코드, 로직 엘리먼트들의 어레이에 의해 실행될 수 있는 명령들의 임의의 하나 이상의 세트들 또는 시퀀스들, 및 이러한 예들의 임의의 결합을 포함하는 것으로 이해되어야 한다.
고대역 여기 생성기들(A300 및 B300), 고대역 인코더(A100), 고대역 디코더(B200), 광대역 음성 인코더(A100), 및 광대역 음성 디코더(B100)의 구현에 대한 여러 엘리먼트들은 예컨대 동일한 칩 위나 또는 칩셋 내의 둘 이상의 칩들 사이에 존재하는 전자 및/또는 광학 장치들로서 구현될 수 있지만, 그러한 것들로 제한되지 않고 다른 배치들도 또한 고려된다. 이러한 장치의 하나 이상의 엘리먼트들은 마이크로프로세서들, 삽입된 프로세서들, IP 코어들, 디지털 신호 프로세서들, FPGA들(field-programmable gate arrays), ASSP들(application-specific standard products), 및 ASIC들(application-specific integrated circuits)과 같은 로직 엘리먼트들(예컨대, 트랜지스터들, 게이트들)의 하나 이상의 고정적이거나 프로그램 가능한 어레이들을 실행하도록 배치되는 하나 이상의 세트들의 명령들로서 전체적으로나 혹은 부분적으로 구현될 수 있다. 또한, 이러한 엘리먼트들 중 하나 이상이 공통적인 구조를 갖는 것이 가능하다(예컨대, 상이한 시간들에 상이한 엘리먼트들에 상응하는 코드의 부분들을 실행하기 위해 사용되는 프로세서, 상이한 시간들에 상이한 엘리먼트들에 상응하는 작업들을 수행하기 위해 실행되는 한 세트의 명령들, 또는 상이한 시간들에 상이한 엘리먼트들에 대한 동작들을 수행하는 전자 및/또는 광학 장치들의 배치). 게다가, 하나 이상의 이러한 엘리먼트들이 작업들을 수행하거나 또는 장치가 삽입되는 장치나 시스템의 다른 동작에 관한 작업과 같은 장치의 동작에 직접 관련되지 않은 다른 세트들의 명령들을 실행하는 것이 가능하다.
도 30은 협대역 부분 및 고대역 부분을 갖는 음성 신호의 고대역 부분을 인코딩하는 실시예에 따른 방법(M100)의 흐름도를 나타낸다. 작업(X100)은 고대역 부분의 스펙트럼 포락선을 특징짓는 한 세트의 필터 파라미터들을 계산한다. 작업(X200)은 협대역 부분으로부터 유도되는 신호에 비선형 함수를 적용함으로써 스펙트럼적으로 확장된 신호를 계산한다. 작업(X300)은 (A) 상기 필터 파라미터들 세트 및 (B) 상기 스펙트럼적으로 확장된 신호에 기초한 고대역 여기 신호에 따라서 합성된 고대역 신호를 생성한다. 작업(X400)은 (C) 고대역 부분의 에너지와 (D) 협대역 부분으로부터 유도되는 신호의 에너지 간의 관련성에 기초하여 이득 포락선을 계산한다.
도 31a는 실시예에 따라 고대역 여기 신호를 생성하는 방법(M200)의 흐름도 를 나타낸다. 작업(Y100)은 음성 신호의 협대역 부분으로부터 유도되는 협대역 여기 신호에 비선형 함수를 적용함으로써 하모닉적으로 확장된 신호를 계산한다. 작업(Y200)은 고대역 여기 신호를 생성하기 위해서 상기 하모닉적으로 확장된 신호를 변조된 잡음 신호와 혼합한다. 도 31b는 작업들(Y300 및 Y400)을 포함하는 다른 실시예에 따라 고대역 여기 신호를 생성하는 방법(M210)을 나타낸다. 작업(Y300)은 협대역 여기 신호와 하모닉적으로 확장된 신호 중 하나의 시간에 걸친 에너지에 따라 시간-도메인 포락선을 계산한다. 작업(Y400)은 변조된 잡음 신호를 생성하기 위해서 시간-도메인 포락선에 따라 잡음 신호를 변조한다.
도 32는 협대역 부분 및 고대역 부분을 갖는 음성 신호의 고대역 부분을 디코딩하는 실시예에 따른 방법(M300)의 흐름도를 나타낸다. 작업(Z100)은 고대역 부분의 스펙트럼 포락선을 특징짓는 한 세트의 필터 파라미터들과 고대역 부분의 시간적인 포락선을 특징짓는 한 세트의 이득 팩터들을 수신한다. 작업(Z200)은 협대역 부분으로부터 유도되는 신호에 비선형 함수를 적용함으로써 스펙트럼적으로 확장된 신호를 계산한다. 작업(Z300)은 (A) 상기 필터 파라미터들 세트 및 (B) 스펙트럼적으로 확장된 신호에 기초한 고대역 여기 신호에 따라 합성된 고대역 신호를 생성한다. 작업(Z400)은 상기 이득 팩터들 세트에 기초하여 합성된 고대역 신호의 이득 포락선을 변조한다. 예컨대, 작업(Z400)은 협대역 부분으로부터 유도되는 여기 신호, 스펙트럼적으로 확장된 신호, 고대역 여기 신호, 또는 합성된 고대역 신호에 상기 이득 팩터들 세트를 적용함으로써 합성된 고대역 신호의 이득 포락선을 변조한다.
실시예들은 또한 본 명세서에 명확히 설명된 바와 같은 추가적인 음성 코딩 방법, 인코딩 방법, 및 디코딩 방법을 포함하는데, 상기 방법들에 대한 설명은 상기 방법들을 수행하도록 구성되는 구조적인 실시예들의 설명을 통해 이루어졌다. 이러한 방법들 각각은 또한 로직 엘리먼트들(예컨대, 프로세서, 마이크로프로세서, 마이크로제어기, 또는 다른 유한 상태 기계)의 어레이로서 (예컨대, 위에 목록된 하나 이상의 데이터 저장 매체들 내에) 명백히 삽입될 수 있다. 따라서, 본 발명은 위에 제시된 실시예들로 제한되도록 의도되지 않고, 오히려 최초 명세서의 일부를 형성하는 출원된 바와 같은 첨부된 청구항들에 포함되는 임의 형태로 기재된 원리들 및 신규 특징들에 따른 가장 넓은 범위가 제공된다.

Claims (22)

  1. 신호 처리 방법으로서,
    적어도 인코딩된 저대역 여기 신호 및 다수의 저대역 필터 파라미터들로 음성 신호의 저주파수 부분을 인코딩하는 단계;
    상기 인코딩된 저대역 여기 신호에 기초하여 고대역 여기 신호를 생성하는 단계; 및
    적어도 상기 고대역 여기 신호에 따라, 적어도 다수의 고대역 필터 파라미터들로 음성 신호의 고주파수 부분을 인코딩하는 단계를 포함하고,
    상기 인코딩된 저대역 여기 신호는 시변적인 시간 왜곡(time-varying time warping)에 따라, 음성 신호에 대해서, 시간적으로 왜곡되는 신호를 나타내고,
    상기 신호 처리 방법은, 상기 시간 왜곡에 관한 정보에 기초해서, 상기 음성 신호의 고주파수 부분의 상응하는 다수의 시간적으로 연속적인 부분들에 다수의 상이한 시간 시프트들을 적용하는 단계를 포함하고,
    상기 신호 처리 방법은 시간-시프트된 고주파수 부분을 (A) 다수의 고대역 필터 파라미터들 및 (B) 다수의 고대역 이득 팩터들(highband gain factors) 중 적어도 하나로 인코딩하는 단계를 포함하는,
    신호 처리 방법.
  2. 제 1항에 있어서, 상기 인코딩된 저대역 여기 신호는 저주파수 부분의 피치 구조(pitch structure)의 모델에 따라 시간적으로 왜곡된 신호를 나타내는, 신호 처리 방법.
  3. 제 2항에 있어서,
    상기 저주파수 부분을 인코딩하는 단계는 협대역 잔여 신호의 피치 구조의 모델에 따라 상기 협대역 잔여 신호에 시간 시프트를 적용하는 단계를 포함하고,
    상기 인코딩된 저대역 여기 신호는 시간-시프트된 협대역 잔여 신호에 기초하는, 신호 처리 방법.
  4. 제 3항에 있어서,
    상기 협대역 잔여 신호에 시간 시프트를 적용하는 단계는 협대역 잔여 신호의 적어도 두 연속적인 서브프레임 각각에 상이한 각각의 시간 시프트들을 적용하는 단계를 포함하고,
    고주파수 부분에 시간 시프트를 적용하는 단계는 각각의 시간 시프트들의 평균에 기초하여 시간 시프트를 고주파수 부분의 프레임에 적용하는 단계를 포함하는, 신호 처리 방법.
  5. 제 3항에 있어서, 상기 다수의 상이한 시간 시프트들을 적용하는 단계는 협대역 잔여 신호에 적용된 시간 시프트를 나타내는 값을 수신하여 상기 수신된 값을 정수 값으로 반올림하는(round) 단계를 포함하는, 신호 처리 방법.
  6. 제 1항에 있어서, 상기 다수의 상이한 시간 시프트들을 적용하는 단계는 상기 고주파수 부분을 인코딩하는 단계에 앞서서 수행되는, 신호 처리 방법.
  7. 제 1항에 있어서, 상기 적어도 다수의 고대역 필터 파라미터들로 고주파수 부분을 인코딩하는 단계는 고주파수 부분을 적어도 다수의 선형 예측 필터 계수들로 인코딩하는 단계를 포함하는, 신호 처리 방법.
  8. 제 1항에 있어서,
    상기 적어도 다수의 고대역 필터 파라미터들로 고주파수 부분을 인코딩하는 단계는 고주파수 부분의 이득 포락선(gain envelope)을 인코딩하는 단계를 포함하고,
    다수의 상이한 시간 시프트들을 적용하는 단계는 상기 이득 포락선을 인코딩하는 단계에 앞서서 수행되는, 신호 처리 방법.
  9. 제 1항에 있어서, 다수의 상이한 시간 시프트들을 적용하는 단계는 저주파수 부분과 고주파수 부분의 샘플링 속도들 간의 비율에 따라 다수의 상이한 시간 시프트들 중 적어도 하나를 계산하는 단계를 포함하는, 신호 처리 방법.
  10. 데이터 저장 매체로서,
    제 1항에 따른 신호 처리 방법을 나타내는 기계-실행가능 명령들을 포함하는,
    데이터 저장 매체.
  11. 신호 처리 장치로서,
    적어도 인코딩된 저대역 여기 신호 및 다수의 저대역 필터 파라미터들로 음성 신호의 저주파수 부분을 인코딩하도록 구성되는 저대역 음성 인코더; 및
    상기 인코딩된 저대역 여기 신호에 기초하여 고대역 여기 신호를 생성하도록 구성되는 고대역 음성 인코더를 포함하고,
    상기 고대역 음성 인코더는 적어도 상기 고대역 여기 신호에 따라, 적어도 다수의 고대역 필터 파라미터들로 음성 신호의 고주파수 부분을 인코딩하도록 구성되고,
    상기 저대역 음성 인코더는 상기 인코딩된 저대역 여기 신호에 포함되어 있는 음성 신호에 대한 시변적인 시간 왜곡(time-varying time warping)을 나타내는 규칙화 데이터 신호(regularization data signal)를 출력하도록 구성되고,
    상기 신호 처리 장치는 고주파수 부분의 상응하는 다수의 시간적으로 연속적인 부분들에 다수의 상이한 시간 시프트들을 적용하고 시간-시프트된 고주파수 부분을 (A) 다수의 고대역 필터 파라미터들 및 (B) 다수의 고대역 이득 팩터들(highband gain factors) 중 적어도 하나로 인코딩하도록 구성되는 지연 라인을 포함하고,
    상기 다수의 상이한 시간 시프트들은 상기 규칙 데이터 신호에 기초하는,
    신호 처리 장치.
  12. 제 11항에 있어서, 상기 인코딩된 저대역 여기 신호는 저주파수 부분의 피치 구조(pitch structure)의 모델에 따라 시간적으로 왜곡된 신호를 나타내는, 신호 처리 장치.
  13. 제 11항에 있어서, 상기 저대역 음성 인코더는 협대역 잔여 신호의 피치 구조의 모델에 따라 시간 시프트를 협대역 잔여 신호에 적용하고 또한 인코딩된 협대역 여기 신호를 시간-시프트된 협대역 잔여 신호에 기초하여 생성하도록 구성되는, 신호 처리 장치.
  14. 제 12항에 있어서,
    상기 저대역 음성 인코더는 협대역 잔여 신호의 적어도 두 연속적인 서브프레임들 각각에 상이한 각각의 시간 시프트를 적용하도록 구성되고,
    상기 지연 라인은 각각의 시간 시프트들의 평균에 기초하여 시간 시프트를 고주파수 부분의 프레임에 적용하도록 구성되는, 신호 처리 장치.
  15. 제 12항에 있어서, 상기 신호 처리 장치는 협대역 잔여 신호의 시간 시프트의 값을 수신하여 상기 수신된 값을 정수 값으로 반올림하도록 구성되는 지연 값 매퍼(delay value mapper)를 포함하는, 신호 처리 장치.
  16. 제 11항에 있어서, 상기 고대역 음성 인코더는 상기 지연 라인에 의해 생성될 때 고주파수 부분을 인코딩하도록 배치되는, 신호 처리 장치.
  17. 제 11항에 있어서, 상기 고대역 음성 인코더는 고주파수 부분을 적어도 다수의 선형 예측 필터 계수들로 인코딩하도록 구성되는, 신호 처리 장치.
  18. 제 11항에 있어서, 상기 고대역 음성 인코더는 상기 지연 라인에 의해 생성될 때 고주파수 부분의 이득 포락선을 인코딩하도록 배치되는, 신호 처리 장치.
  19. 제 11항에 있어서, 상기 신호 처리 장치는 저주파수 부분과 고주파수 부분의 샘플링 속도들 간의 비율에 따라 다수의 상이한 시간 시프트들 중 적어도 하나를 계산하도록 구성되는 지연 값 매퍼를 포함하는, 신호 처리 장치.
  20. 제 11항에 있어서, 상기 신호 처리 장치는 셀룰러 전화기를 포함하는, 신호 처리 장치.
  21. 신호 처리 장치로서,
    적어도 인코딩된 저대역 여기 신호 및 다수의 저대역 필터 파라미터들로 음성 신호의 저주파수 부분을 인코딩하기 위한 수단;
    상기 인코딩된 저대역 여기 신호에 기초하여 고대역 여기 신호를 생성하기 위한 수단; 및
    적어도 상기 고대역 여기 신호에 따라서, 적어도 다수의 고대역 필터 파라미터들로 음성 신호의 고주파수 부분을 인코딩하기 위한 수단을 포함하고,
    상기 인코딩된 저대역 여기 신호는 시변적인 시간 왜곡(time-varying time warping)에 따라서, 음성 신호에 대해, 시간적으로 왜곡된 신호를 나타내고,
    상기 신호 처리 장치는 시간 왜곡에 관한 정보에 기초하여, 고주파수 부분의 상응하는 다수의 시간적으로 연속적인 부분들에 다수의 상이한 시간 시프트들을 적용하기 위한 수단을 포함하고,
    상기 신호 처리 장치는 시간-시프트된 고주파수 부분을 (A) 다수의 고대역 필터 파라미터들 및 (B) 다수의 고대역 이득 팩터들(highband gain factors) 중 적어도 하나로 인코딩하기 위한 수단을 포함하는,
    신호 처리 장치.
  22. 제 21항에 있어서, 상기 신호 처리 장치는 셀룰러 전화기를 포함하는, 신호 처리 장치.
KR1020077025293A 2005-04-01 2006-04-03 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들 KR100982638B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US66790105P 2005-04-01 2005-04-01
US60/667,901 2005-04-01
US67396505P 2005-04-22 2005-04-22
US60/673,965 2005-04-22

Publications (2)

Publication Number Publication Date
KR20070118168A KR20070118168A (ko) 2007-12-13
KR100982638B1 true KR100982638B1 (ko) 2010-09-15

Family

ID=36588741

Family Applications (8)

Application Number Title Priority Date Filing Date
KR1020077025421A KR100956524B1 (ko) 2005-04-01 2006-04-03 스피치 신호의 고대역 부분을 인코딩 및 디코딩하는 방법및 장치
KR1020077025255A KR100956624B1 (ko) 2005-04-01 2006-04-03 고대역 버스트 억제를 위한 시스템, 방법, 및 장치
KR1020077025447A KR101019940B1 (ko) 2005-04-01 2006-04-03 대역폭 확장 스피치 예측 여기 신호의 반-희박성 필터링을위한 방법 및 장치
KR1020077025432A KR100956525B1 (ko) 2005-04-01 2006-04-03 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치
KR1020077025290A KR100956876B1 (ko) 2005-04-01 2006-04-03 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들
KR1020077025293A KR100982638B1 (ko) 2005-04-01 2006-04-03 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들
KR1020077025422A KR100956523B1 (ko) 2005-04-01 2006-04-03 광대역 스피치 코딩을 위한 시스템, 방법, 및 장치
KR1020077025400A KR100956877B1 (ko) 2005-04-01 2006-04-03 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치

Family Applications Before (5)

Application Number Title Priority Date Filing Date
KR1020077025421A KR100956524B1 (ko) 2005-04-01 2006-04-03 스피치 신호의 고대역 부분을 인코딩 및 디코딩하는 방법및 장치
KR1020077025255A KR100956624B1 (ko) 2005-04-01 2006-04-03 고대역 버스트 억제를 위한 시스템, 방법, 및 장치
KR1020077025447A KR101019940B1 (ko) 2005-04-01 2006-04-03 대역폭 확장 스피치 예측 여기 신호의 반-희박성 필터링을위한 방법 및 장치
KR1020077025432A KR100956525B1 (ko) 2005-04-01 2006-04-03 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치
KR1020077025290A KR100956876B1 (ko) 2005-04-01 2006-04-03 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020077025422A KR100956523B1 (ko) 2005-04-01 2006-04-03 광대역 스피치 코딩을 위한 시스템, 방법, 및 장치
KR1020077025400A KR100956877B1 (ko) 2005-04-01 2006-04-03 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치

Country Status (24)

Country Link
US (8) US8484036B2 (ko)
EP (8) EP1866914B1 (ko)
JP (8) JP4955649B2 (ko)
KR (8) KR100956524B1 (ko)
CN (1) CN102411935B (ko)
AT (4) ATE492016T1 (ko)
AU (8) AU2006232363B2 (ko)
BR (8) BRPI0608305B1 (ko)
CA (8) CA2603187C (ko)
DE (4) DE602006012637D1 (ko)
DK (2) DK1864101T3 (ko)
ES (3) ES2340608T3 (ko)
HK (5) HK1113848A1 (ko)
IL (8) IL186442A (ko)
MX (8) MX2007012185A (ko)
NO (7) NO20075510L (ko)
NZ (6) NZ562182A (ko)
PL (4) PL1869673T3 (ko)
PT (2) PT1864101E (ko)
RU (9) RU2402826C2 (ko)
SG (4) SG163556A1 (ko)
SI (1) SI1864282T1 (ko)
TW (8) TWI320923B (ko)
WO (8) WO2006107833A1 (ko)

Families Citing this family (322)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
EP1775717B1 (en) * 2004-07-20 2013-09-11 Panasonic Corporation Speech decoding apparatus and compensation frame generation method
MY149811A (en) * 2004-08-30 2013-10-14 Qualcomm Inc Method and apparatus for an adaptive de-jitter buffer
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
WO2006103488A1 (en) * 2005-03-30 2006-10-05 Nokia Corporation Source coding and/or decoding
WO2006107833A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) * 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
ATE435481T1 (de) * 2005-04-28 2009-07-15 Siemens Ag Verfahren und vorrichtung zur geräuschunterdrückung
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
WO2007007253A1 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio signal synthesis
US8169890B2 (en) * 2005-07-20 2012-05-01 Qualcomm Incorporated Systems and method for high data rate ultra wideband communication
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
BRPI0616624A2 (pt) * 2005-09-30 2011-06-28 Matsushita Electric Ind Co Ltd aparelho de codificação de fala e método de codificação de fala
CN102623014A (zh) * 2005-10-14 2012-08-01 松下电器产业株式会社 变换编码装置和变换编码方法
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
DE602007014059D1 (de) 2006-08-15 2011-06-01 Broadcom Corp Zeitverschiebung eines dekodierten audiosignals nach einem paketverlust
US8706507B2 (en) 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8046218B2 (en) * 2006-09-19 2011-10-25 The Board Of Trustees Of The University Of Illinois Speech and method for identifying perceptual features
JP4972742B2 (ja) * 2006-10-17 2012-07-11 国立大学法人九州工業大学 高域信号補間方法及び高域信号補間装置
EP4325724A3 (en) 2006-10-25 2024-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values
KR101375582B1 (ko) 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7873064B1 (en) * 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8032359B2 (en) 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
FR2920545B1 (fr) * 2007-09-03 2011-06-10 Univ Sud Toulon Var Procede de trajectographie de plusieurs cetaces par acoustique passive
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
BRPI0722269A2 (pt) * 2007-11-06 2014-04-22 Nokia Corp Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
US20100274555A1 (en) * 2007-11-06 2010-10-28 Lasse Laaksonen Audio Coding Apparatus and Method Thereof
KR101444099B1 (ko) * 2007-11-13 2014-09-26 삼성전자주식회사 음성 구간 검출 방법 및 장치
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
US8050934B2 (en) * 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
TWI356399B (en) * 2007-12-14 2012-01-11 Ind Tech Res Inst Speech recognition system and method with cepstral
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2255534B1 (en) * 2008-03-20 2017-12-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding using bandwidth extension in portable terminal
WO2010003068A1 (en) * 2008-07-03 2010-01-07 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
CA2729751C (en) * 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
ES2372014T3 (es) * 2008-07-11 2012-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.
CN103000186B (zh) 2008-07-11 2015-01-14 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2010011963A1 (en) * 2008-07-25 2010-01-28 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US20100070550A1 (en) * 2008-09-12 2010-03-18 Cardinal Health 209 Inc. Method and apparatus of a sensor amplifier configured for use in medical applications
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
DE102008058496B4 (de) * 2008-11-21 2010-09-09 Siemens Medical Instruments Pte. Ltd. Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
AU2010205583B2 (en) 2009-01-16 2013-02-07 Dolby International Ab Cross product enhanced harmonic transposition
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
WO2010111876A1 (zh) * 2009-03-31 2010-10-07 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8805680B2 (en) * 2009-05-19 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
WO2011029484A1 (en) * 2009-09-14 2011-03-17 Nokia Corporation Signal enhancement processing
US9595257B2 (en) * 2009-09-28 2017-03-14 Nuance Communications, Inc. Downsampling schemes in a hierarchical neural network structure for phoneme recognition
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011048099A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
PL2800094T3 (pl) * 2009-10-21 2018-03-30 Dolby International Ab Nadpróbkowanie w banku filtrów z połączonym modułem transpozycji
WO2011048792A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
EP2502230B1 (en) * 2009-11-19 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Improved excitation signal bandwidth extension
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
US8489393B2 (en) * 2009-11-23 2013-07-16 Cambridge Silicon Radio Limited Speech intelligibility
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
RU2464651C2 (ru) * 2009-12-22 2012-10-20 Общество с ограниченной ответственностью "Спирит Корп" Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов
US8559749B2 (en) * 2010-01-06 2013-10-15 Streaming Appliances, Llc Audiovisual content delivery system
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
KR101336051B1 (ko) 2010-01-12 2013-12-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 정보 인코딩 방법, 오디오 정보 디코딩 방법, 및 수치적 이전 콘텍스트 값의 수치 표현의 수정을 이용하는 컴퓨터 프로그램
US8699727B2 (en) 2010-01-15 2014-04-15 Apple Inc. Visually-assisted mixing of audio using a spectral analyzer
US9525569B2 (en) * 2010-03-03 2016-12-20 Skype Enhanced circuit-switched calls
MX2012010469A (es) * 2010-03-10 2012-12-10 Dolby Int Ab Decodificador de señales de audio, codificador de señales de audio, metodos y programa de computacion que utiliza tasa de muestreo dependiente de la codificacion del contorno de distorsion en el tiempo.
US8700391B1 (en) * 2010-04-01 2014-04-15 Audience, Inc. Low complexity bandwidth expansion of speech
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
MX2012011802A (es) * 2010-04-13 2013-02-26 Fraunhofer Ges Forschung Metodo y codificador y descodificador para la presentacion precisa de muestra de una señal de audio.
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
CN102844810B (zh) * 2010-04-14 2017-05-03 沃伊斯亚吉公司 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
MX2012011828A (es) * 2010-04-16 2013-02-27 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para generar una señal de banda amplia que utiliza extension de ancho de banda guiada y extension oculta de ancho de banda.
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101660843B1 (ko) * 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
ES2372202B2 (es) * 2010-06-29 2012-08-08 Universidad De Málaga Sistema de reconocimiento de sonidos de bajo consumo.
PL3079152T3 (pl) 2010-07-02 2018-10-31 Dolby International Ab Dekodowanie audio z selektywnym późniejszym filtrowaniem
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5589631B2 (ja) * 2010-07-15 2014-09-17 富士通株式会社 音声処理装置、音声処理方法および電話装置
WO2012008891A1 (en) * 2010-07-16 2012-01-19 Telefonaktiebolaget L M Ericsson (Publ) Audio encoder and decoder and methods for encoding and decoding an audio signal
JP5777041B2 (ja) * 2010-07-23 2015-09-09 沖電気工業株式会社 帯域拡張装置及びプログラム、並びに、音声通信装置
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US20130310422A1 (en) 2010-09-01 2013-11-21 The General Hospital Corporation Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine
KR101744621B1 (ko) 2010-09-16 2017-06-09 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
WO2012053149A1 (ja) * 2010-10-22 2012-04-26 パナソニック株式会社 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
MX2013009303A (es) 2011-02-14 2013-09-13 Fraunhofer Ges Forschung Codec de audio utilizando sintesis de ruido durante fases inactivas.
RU2630390C2 (ru) 2011-02-14 2017-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для маскирования ошибок при стандартизированном кодировании речи и аудио с низкой задержкой (usac)
AR085222A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Representacion de señal de informacion utilizando transformada superpuesta
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
MY167776A (en) * 2011-02-14 2018-09-24 Fraunhofer Ges Forschung Noise generation in audio codecs
KR101699898B1 (ko) 2011-02-14 2017-01-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼 영역에서 디코딩된 오디오 신호를 처리하기 위한 방법 및 장치
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
RU2562771C2 (ru) * 2011-02-16 2015-09-10 Долби Лабораторис Лайсэнзин Корпорейшн Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров
DK3998607T3 (da) * 2011-02-18 2024-04-15 Ntt Docomo Inc Taleafkoder
US9165558B2 (en) 2011-03-09 2015-10-20 Dts Llc System for dynamically creating and rendering audio objects
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
CN102811034A (zh) 2011-05-31 2012-12-05 财团法人工业技术研究院 信号处理装置及信号处理方法
US9264094B2 (en) * 2011-06-09 2016-02-16 Panasonic Intellectual Property Corporation Of America Voice coding device, voice decoding device, voice coding method and voice decoding method
US9070361B2 (en) 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
BR112013033900B1 (pt) 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
US9059786B2 (en) * 2011-07-07 2015-06-16 Vecima Networks Inc. Ingress suppression for communication systems
JP5942358B2 (ja) * 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2486636C1 (ru) * 2011-11-14 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2486637C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486638C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2496222C2 (ru) * 2011-11-17 2013-10-20 Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486639C1 (ru) * 2011-11-21 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2496192C2 (ru) * 2011-11-21 2013-10-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2490727C2 (ru) * 2011-11-28 2013-08-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) Способ передачи речевых сигналов (варианты)
RU2487443C1 (ru) * 2011-11-29 2013-07-10 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ согласования комплексных сопротивлений и устройство его реализации
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
ES2762325T3 (es) 2012-03-21 2020-05-22 Samsung Electronics Co Ltd Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda
FI3547261T3 (fi) 2012-03-29 2023-09-26 Ericsson Telefon Ab L M Vektorikvantisoija
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
KR101343768B1 (ko) * 2012-04-19 2014-01-16 충북대학교 산학협력단 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법
RU2504898C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
RU2504894C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
DK2891151T3 (en) * 2012-08-31 2016-12-12 ERICSSON TELEFON AB L M (publ) Method and device for detection of voice activity
EP2898506B1 (en) 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
KR101413969B1 (ko) 2012-12-20 2014-07-08 삼성전자주식회사 오디오 신호의 복호화 방법 및 장치
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
PL3054446T3 (pl) * 2013-01-29 2024-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób dostarczania kodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i kodowana reprezentacja, stosujące adaptacyjne względem sygnału rozszerzenie szerokości pasma
RU2618919C2 (ru) * 2013-01-29 2017-05-12 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
US20140213909A1 (en) * 2013-01-31 2014-07-31 Xerox Corporation Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data
US9711156B2 (en) 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
US9715885B2 (en) * 2013-03-05 2017-07-25 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
CA3029033C (en) 2013-04-05 2021-03-30 Dolby International Ab Audio encoder and decoder
CN105264600B (zh) 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
CN117253498A (zh) * 2013-04-05 2023-12-19 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
RU2665253C2 (ru) * 2013-06-21 2018-08-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для улучшенного маскирования адаптивной таблицы кодирования при acelp-образном маскировании с использованием улучшенной оценки запаздывания основного тона
BR112015031605B1 (pt) 2013-06-21 2022-03-29 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3014290A4 (en) 2013-06-27 2017-03-08 The General Hospital Corporation Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data
WO2014210527A1 (en) * 2013-06-28 2014-12-31 The General Hospital Corporation System and method to infer brain state during burst suppression
CN104282308B (zh) 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830054A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
EP3503095A1 (en) 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
EP4166072A1 (en) 2013-09-13 2023-04-19 The General Hospital Corporation Systems and methods for improved brain monitoring during general anesthesia and sedation
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US9224402B2 (en) 2013-09-30 2015-12-29 International Business Machines Corporation Wideband speech parameterization for high quality synthesis, transformation and quantization
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
KR102271852B1 (ko) 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
CN105765655A (zh) 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9564141B2 (en) 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP6281336B2 (ja) * 2014-03-12 2018-02-21 沖電気工業株式会社 音声復号化装置及びプログラム
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336336B (zh) 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
CN107424622B (zh) 2014-06-24 2020-12-25 华为技术有限公司 音频编码方法和装置
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
CN104217730B (zh) * 2014-08-18 2017-07-21 大连理工大学 一种基于k‑svd的人工语音带宽扩展方法及装置
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
TWI550945B (zh) * 2014-12-22 2016-09-21 國立彰化師範大學 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
ES2837107T3 (es) 2015-02-26 2021-06-29 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio para obtener una señal de audio procesada usando una envolvente en el dominio del tiempo objetivo
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
US9830921B2 (en) * 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
NO20151400A1 (en) 2015-10-15 2017-01-23 St Tech As A system for isolating an object
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
MX371223B (es) 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
FR3049084B1 (fr) 2016-03-15 2022-11-11 Fraunhofer Ges Forschung Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code
ES2808997T3 (es) * 2016-04-12 2021-03-02 Fraunhofer Ges Forschung Codificador de audio para codificar una señal de audio, método para codificar una señal de audio y programa informático en consideración de una región espectral del pico detectada en una banda de frecuencia superior
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
CN109416913B (zh) * 2016-05-10 2024-03-15 易默森服务有限责任公司 自适应音频编解码系统、方法、装置及介质
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
US10264116B2 (en) * 2016-11-02 2019-04-16 Nokia Technologies Oy Virtual duplex operation
KR102507383B1 (ko) * 2016-11-08 2023-03-08 한국전자통신연구원 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템
US10786168B2 (en) 2016-11-29 2020-09-29 The General Hospital Corporation Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments
ES2950009T3 (es) 2017-01-06 2023-10-04 Ericsson Telefon Ab L M Métodos y aparatos para señalizar y determinar desplazamientos de señal de referencia
KR20180092582A (ko) * 2017-02-10 2018-08-20 삼성전자주식회사 Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10304468B2 (en) * 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
JP7057428B2 (ja) * 2017-10-27 2022-04-19 テラウェーブ,エルエルシー 符号化正弦波形を使用する高スペクトル効率データ通信システムの受信器
US11876659B2 (en) 2017-10-27 2024-01-16 Terawave, Llc Communication system using shape-shifted sinusoidal waveforms
CN109729553B (zh) * 2017-10-30 2021-12-28 成都鼎桥通信技术有限公司 Lte集群通信系统的语音业务处理方法及设备
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
US10460749B1 (en) * 2018-06-28 2019-10-29 Nuvoton Technology Corporation Voice activity detection using vocal tract area information
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
JP7088403B2 (ja) * 2019-02-20 2022-06-21 ヤマハ株式会社 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム
CN110610713B (zh) * 2019-08-28 2021-11-16 南京梧桐微电子科技有限公司 一种声码器余量谱幅度参数重构方法及系统
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
TWI723545B (zh) * 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置
US11295751B2 (en) * 2019-09-20 2022-04-05 Tencent America LLC Multi-band synchronized neural vocoder
KR102201169B1 (ko) * 2019-10-23 2021-01-11 성균관대학교 산학협력단 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법
CN114548442B (zh) * 2022-02-25 2022-10-21 万表名匠(广州)科技有限公司 一种基于互联网技术的腕表维修管理系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching

Family Cites Families (147)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US526468A (en) * 1894-09-25 Charles d
US596689A (en) * 1898-01-04 Hose holder or support
US525147A (en) * 1894-08-28 Steam-cooker
US321993A (en) * 1885-07-14 Lantern
US1126620A (en) * 1911-01-30 1915-01-26 Safety Car Heating & Lighting Electric regulation.
US1089258A (en) * 1914-01-13 1914-03-03 James Arnot Paterson Facing or milling machine.
US1300833A (en) * 1918-12-12 1919-04-15 Moline Mill Mfg Company Idler-pulley structure.
US1498873A (en) * 1924-04-19 1924-06-24 Bethlehem Steel Corp Switch stand
US2073913A (en) * 1934-06-26 1937-03-16 Wigan Edmund Ramsay Means for gauging minute displacements
US2086867A (en) * 1936-06-19 1937-07-13 Hall Lab Inc Laundering composition and process
US3044777A (en) * 1959-10-19 1962-07-17 Fibermold Corp Bowling pin
US3158693A (en) * 1962-08-07 1964-11-24 Bell Telephone Labor Inc Speech interpolation communication system
US3855416A (en) 1972-12-01 1974-12-17 F Fuller Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment
US3855414A (en) 1973-04-24 1974-12-17 Anaconda Co Cable armor clamp
JPS59139099A (ja) 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
US4616659A (en) 1985-05-06 1986-10-14 At&T Bell Laboratories Heart rate detection utilizing autoregressive analysis
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4747143A (en) 1985-07-12 1988-05-24 Westinghouse Electric Corp. Speech enhancement system having dynamic gain control
NL8503152A (nl) * 1985-11-15 1987-06-01 Optische Ind De Oude Delft Nv Dosismeter voor ioniserende straling.
US4862168A (en) 1987-03-19 1989-08-29 Beard Terry D Audio digital/analog encoding and decoding
US4805193A (en) * 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4852179A (en) 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
JP2707564B2 (ja) 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
US5285520A (en) * 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
CA1321645C (en) 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
US5086475A (en) 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
JPH02244100A (ja) * 1989-03-16 1990-09-28 Ricoh Co Ltd 駆動音源信号生成装置
BR9105987A (pt) 1990-09-19 1993-02-02 Philips Nv Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3191457B2 (ja) 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3721582B2 (ja) 1993-06-30 2005-11-30 ソニー株式会社 信号符号化装置及び方法並びに信号復号化装置及び方法
WO1995010760A2 (en) 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
US5797118A (en) 1994-08-09 1998-08-18 Yamaha Corporation Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns
JP2770137B2 (ja) 1994-09-22 1998-06-25 日本プレシジョン・サーキッツ株式会社 波形データ圧縮装置
US5699477A (en) * 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
FI97182C (fi) 1994-12-05 1996-10-25 Nokia Telecommunications Oy Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin
JP3365113B2 (ja) * 1994-12-22 2003-01-08 ソニー株式会社 音声レベル制御装置
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP2798003B2 (ja) 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
JP3334419B2 (ja) * 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6097824A (en) 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
DE69530204T2 (de) * 1995-10-16 2004-03-18 Agfa-Gevaert Neue Klasse von Gelbfarbstoffen für photographische Materialien
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5737716A (en) * 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
JP3073919B2 (ja) * 1995-12-30 2000-08-07 松下電器産業株式会社 同期装置
US5689615A (en) 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
TW307960B (en) * 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
EP0814458B1 (en) 1996-06-19 2004-09-22 Texas Instruments Incorporated Improvements in or relating to speech coding
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
KR20030096444A (ko) * 1996-11-07 2003-12-31 마쯔시다덴기산교 가부시키가이샤 음원 벡터 생성 장치 및 방법
US6009395A (en) 1997-01-02 1999-12-28 Texas Instruments Incorporated Synthesizer and method using scaled excitation signal
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US6041297A (en) * 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
US5890126A (en) * 1997-03-10 1999-03-30 Euphonics, Incorporated Audio data decompression and interpolation apparatus and method
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6889185B1 (en) 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6231516B1 (en) * 1997-10-14 2001-05-15 Vacusense, Inc. Endoluminal implant with therapeutic and diagnostic capability
JPH11205166A (ja) * 1998-01-19 1999-07-30 Mitsubishi Electric Corp ノイズ検出装置
US6301556B1 (en) 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6385573B1 (en) 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
JP4170458B2 (ja) 1998-08-27 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
US6353808B1 (en) 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR20000047944A (ko) 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP4354561B2 (ja) 1999-01-08 2009-10-28 パナソニック株式会社 オーディオ信号符号化装置及び復号化装置
US6223151B1 (en) * 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
JP3696091B2 (ja) 1999-05-14 2005-09-14 松下電器産業株式会社 オーディオ信号の帯域を拡張するための方法及び装置
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6556950B1 (en) 1999-09-30 2003-04-29 Rockwell Automation Technologies, Inc. Diagnostic method and apparatus for use with enterprise control
US6715125B1 (en) 1999-10-18 2004-03-30 Agere Systems Inc. Source coding and transmission with time diversity
CN1192355C (zh) 1999-11-16 2005-03-09 皇家菲利浦电子有限公司 宽带音频传输系统
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
CN1187735C (zh) 2000-01-11 2005-02-02 松下电器产业株式会社 多模式话音编码装置和解码装置
US6757395B1 (en) 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
JP3681105B2 (ja) 2000-02-24 2005-08-10 アルパイン株式会社 データ処理方式
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US7330814B2 (en) 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
DE60118627T2 (de) * 2000-05-22 2007-01-11 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
US7136810B2 (en) 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
BR0107142A (pt) 2000-08-25 2002-07-02 Koninkl Philips Electronics Nv Métodos para redução do número de bits de um sinal de entrada digital, e para recuperar um sinal de saìda de um sinal de comprimento de palavra reduzido, e, aparelhos de processamento de sinal, e para decodificação de sinal
US6515889B1 (en) * 2000-08-31 2003-02-04 Micron Technology, Inc. Junction-isolated depletion mode ferroelectric memory
US7386444B2 (en) 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP2002202799A (ja) 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3558031B2 (ja) 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
US7346499B2 (en) 2000-11-09 2008-03-18 Koninklijke Philips Electronics N.V. Wideband extension of telephone speech for higher perceptual quality
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
AU2002218501A1 (en) * 2000-11-30 2002-06-11 Matsushita Electric Industrial Co., Ltd. Vector quantizing device for lpc parameters
GB0031461D0 (en) 2000-12-22 2001-02-07 Thales Defence Ltd Communication sets
US20040204935A1 (en) 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
US20030028386A1 (en) 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
CN1529882A (zh) * 2001-05-11 2004-09-15 西门子公司 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法
CN1235192C (zh) * 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
JP2003036097A (ja) * 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
TW525147B (en) 2001-09-28 2003-03-21 Inventec Besta Co Ltd Method of obtaining and decoding basic cycle of voice
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
TW526468B (en) 2001-10-19 2003-04-01 Chunghwa Telecom Co Ltd System and method for eliminating background noise of voice signal
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
DE60212696T2 (de) * 2001-11-23 2007-02-22 Koninklijke Philips Electronics N.V. Bandbreitenvergrösserung für audiosignale
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6751587B2 (en) 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP3826813B2 (ja) 2002-02-18 2006-09-27 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
DE60303689T2 (de) 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
JP3756864B2 (ja) 2002-09-30 2006-03-15 株式会社東芝 音声合成方法と装置及び音声合成プログラム
KR100841096B1 (ko) 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US20040098255A1 (en) 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7242763B2 (en) * 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
CA2415105A1 (en) 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100480341B1 (ko) 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
DE602004007786T2 (de) 2003-05-01 2008-04-30 Nokia Corp. Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
WO2005004113A1 (ja) 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7428490B2 (en) * 2003-09-30 2008-09-23 Intel Corporation Method for spectral subtraction in speech enhancement
US7689579B2 (en) * 2003-12-03 2010-03-30 Siemens Aktiengesellschaft Tag modeling within a decision, support, and reporting environment
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4259401B2 (ja) 2004-06-02 2009-04-30 カシオ計算機株式会社 音声処理装置及び音声符号化方法
US8000967B2 (en) 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
UA94041C2 (ru) * 2005-04-01 2011-04-11 Квелкомм Инкорпорейтед Способ и устройство для фильтрации, устраняющей разреженность
WO2006107833A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Miko Tammi et al. 'Coding distortion caused by a phase difference between the LP filter and its residual' In: 1999 IEEE Workshop on Speech Coding Proceedings, pp.102-104, June 20-23 1999*

Also Published As

Publication number Publication date
RU2386179C2 (ru) 2010-04-10
BRPI0607690A2 (pt) 2009-09-22
ATE492016T1 (de) 2011-01-15
US8484036B2 (en) 2013-07-09
TW200703240A (en) 2007-01-16
DE602006017673D1 (de) 2010-12-02
RU2413191C2 (ru) 2011-02-27
AU2006232358A1 (en) 2006-10-12
MX2007012191A (es) 2007-12-11
TWI330828B (en) 2010-09-21
NO20075503L (no) 2007-12-28
BRPI0607646B1 (pt) 2021-05-25
IL186404A0 (en) 2008-01-20
CA2602804A1 (en) 2006-10-12
US20060277038A1 (en) 2006-12-07
WO2006107839A2 (en) 2006-10-12
KR20070118168A (ko) 2007-12-13
EP1864101A1 (en) 2007-12-12
EP1869673B1 (en) 2010-09-22
ES2391292T3 (es) 2012-11-23
EP1869670A1 (en) 2007-12-26
AU2006232363B2 (en) 2011-01-27
CA2603229A1 (en) 2006-10-12
RU2007140394A (ru) 2009-05-10
BRPI0608305B1 (pt) 2019-08-06
RU2007140383A (ru) 2009-05-10
NO20075511L (no) 2007-12-27
JP2008535026A (ja) 2008-08-28
US8140324B2 (en) 2012-03-20
KR20070118174A (ko) 2007-12-13
JP2008537165A (ja) 2008-09-11
BRPI0608269B8 (pt) 2019-09-03
CN102411935A (zh) 2012-04-11
SG161224A1 (en) 2010-05-27
NZ562182A (en) 2010-03-26
EP1864283A1 (en) 2007-12-12
AU2006232357B2 (en) 2010-07-01
RU2007140429A (ru) 2009-05-20
TW200705390A (en) 2007-02-01
KR100956876B1 (ko) 2010-05-11
KR20070118175A (ko) 2007-12-13
CA2603231C (en) 2012-11-06
IL186438A (en) 2011-09-27
RU2007140406A (ru) 2009-05-10
BRPI0607646A2 (pt) 2009-09-22
EP1869673A1 (en) 2007-12-26
KR20070118170A (ko) 2007-12-13
TWI316225B (en) 2009-10-21
CA2603255C (en) 2015-06-23
TW200705387A (en) 2007-02-01
KR100956624B1 (ko) 2010-05-11
NO20075513L (no) 2007-12-28
NZ562188A (en) 2010-05-28
EP1864282B1 (en) 2017-05-17
MX2007012184A (es) 2007-12-11
US20070088542A1 (en) 2007-04-19
BRPI0607691A2 (pt) 2009-09-22
BRPI0608269B1 (pt) 2019-07-30
RU2491659C2 (ru) 2013-08-27
NO340566B1 (no) 2017-05-15
MX2007012185A (es) 2007-12-11
KR20070118172A (ko) 2007-12-13
CA2603229C (en) 2012-07-31
PL1864101T3 (pl) 2012-11-30
RU2376657C2 (ru) 2009-12-20
WO2006107834A1 (en) 2006-10-12
IL186405A (en) 2013-07-31
AU2006232361B2 (en) 2010-12-23
NZ562183A (en) 2010-09-30
PL1864282T3 (pl) 2017-10-31
ATE485582T1 (de) 2010-11-15
AU2006232360B2 (en) 2010-04-29
BRPI0609530A2 (pt) 2010-04-13
KR100956524B1 (ko) 2010-05-07
IL186439A0 (en) 2008-01-20
US8078474B2 (en) 2011-12-13
JP5129117B2 (ja) 2013-01-23
US8332228B2 (en) 2012-12-11
IL186443A (en) 2012-09-24
KR100956523B1 (ko) 2010-05-07
IL186438A0 (en) 2008-01-20
EP1866914A1 (en) 2007-12-19
AU2006232357C1 (en) 2010-11-25
CA2603187C (en) 2012-05-08
JP2008536169A (ja) 2008-09-04
US8364494B2 (en) 2013-01-29
WO2006107839A3 (en) 2007-04-05
US8069040B2 (en) 2011-11-29
IL186442A (en) 2012-06-28
BRPI0608269A2 (pt) 2009-12-08
KR101019940B1 (ko) 2011-03-09
EP1866915B1 (en) 2010-12-15
AU2006232364B2 (en) 2010-11-25
RU2009131435A (ru) 2011-02-27
KR20070119722A (ko) 2007-12-20
US20060282263A1 (en) 2006-12-14
KR20070118173A (ko) 2007-12-13
AU2006232362B2 (en) 2009-10-08
BRPI0608305A2 (pt) 2009-10-06
KR100956525B1 (ko) 2010-05-07
JP2008535025A (ja) 2008-08-28
TW200703237A (en) 2007-01-16
IL186436A0 (en) 2008-01-20
SG161223A1 (en) 2010-05-27
HK1114901A1 (en) 2008-11-14
KR20070118167A (ko) 2007-12-13
NZ562186A (en) 2010-03-26
RU2381572C2 (ru) 2010-02-10
US20060271356A1 (en) 2006-11-30
NO20075514L (no) 2007-12-28
ES2340608T3 (es) 2010-06-07
MX2007012181A (es) 2007-12-11
US20070088541A1 (en) 2007-04-19
WO2006130221A1 (en) 2006-12-07
JP2008537606A (ja) 2008-09-18
CA2603219A1 (en) 2006-10-12
EP1864281A1 (en) 2007-12-12
JP2008535027A (ja) 2008-08-28
BRPI0607691B1 (pt) 2019-08-13
EP1864283B1 (en) 2013-02-13
IL186404A (en) 2011-04-28
US20070088558A1 (en) 2007-04-19
EP1869670B1 (en) 2010-10-20
EP1866914B1 (en) 2010-03-03
CA2602806A1 (en) 2006-10-12
PT1864282T (pt) 2017-08-10
WO2006107833A1 (en) 2006-10-12
JP5203929B2 (ja) 2013-06-05
TW200707408A (en) 2007-02-16
TWI321777B (en) 2010-03-11
NZ562185A (en) 2010-06-25
HK1115023A1 (en) 2008-11-14
BRPI0609530B1 (pt) 2019-10-29
AU2006232361A1 (en) 2006-10-12
NO340428B1 (no) 2017-04-18
AU2006232357A1 (en) 2006-10-12
NO20075515L (no) 2007-12-28
RU2007140426A (ru) 2009-05-10
TWI321315B (en) 2010-03-01
RU2007140365A (ru) 2009-05-10
RU2390856C2 (ru) 2010-05-27
BRPI0608306A2 (pt) 2009-12-08
IL186441A0 (en) 2008-01-20
PL1866915T3 (pl) 2011-05-31
ATE482449T1 (de) 2010-10-15
US8244526B2 (en) 2012-08-14
JP2008536170A (ja) 2008-09-04
AU2006232358B2 (en) 2010-11-25
SG163556A1 (en) 2010-08-30
SG163555A1 (en) 2010-08-30
BRPI0607690A8 (pt) 2017-07-11
JP5129116B2 (ja) 2013-01-23
SI1864282T1 (sl) 2017-09-29
TW200707405A (en) 2007-02-16
CA2602806C (en) 2011-05-31
JP5161069B2 (ja) 2013-03-13
RU2402827C2 (ru) 2010-10-27
AU2006232362A1 (en) 2006-10-12
EP1864101B1 (en) 2012-08-08
CA2603187A1 (en) 2006-12-07
WO2006107836A1 (en) 2006-10-12
BRPI0608270A2 (pt) 2009-10-06
NZ562190A (en) 2010-06-25
MX2007012189A (es) 2007-12-11
PL1869673T3 (pl) 2011-03-31
JP5203930B2 (ja) 2013-06-05
HK1115024A1 (en) 2008-11-14
AU2006232363A1 (en) 2006-10-12
EP1866915A2 (en) 2007-12-19
US20080126086A1 (en) 2008-05-29
RU2007140381A (ru) 2009-05-10
WO2006107840A1 (en) 2006-10-12
AU2006252957B2 (en) 2011-01-20
TW200705389A (en) 2007-02-01
MX2007012183A (es) 2007-12-11
CN102411935B (zh) 2014-05-07
RU2402826C2 (ru) 2010-10-27
MX2007012182A (es) 2007-12-10
IL186442A0 (en) 2008-01-20
CA2603231A1 (en) 2006-10-12
CA2603255A1 (en) 2006-10-12
DE602006017050D1 (de) 2010-11-04
IL186443A0 (en) 2008-01-20
MX2007012187A (es) 2007-12-11
IL186405A0 (en) 2008-01-20
NO20075510L (no) 2007-12-28
NO20075512L (no) 2007-12-28
ATE459958T1 (de) 2010-03-15
JP5129115B2 (ja) 2013-01-23
WO2006107837A1 (en) 2006-10-12
RU2387025C2 (ru) 2010-04-20
HK1113848A1 (en) 2008-10-17
CA2603246C (en) 2012-07-17
RU2007140382A (ru) 2009-05-10
DE602006018884D1 (de) 2011-01-27
CA2603246A1 (en) 2006-10-12
EP1864282A1 (en) 2007-12-12
TWI324335B (en) 2010-05-01
DE602006012637D1 (de) 2010-04-15
CA2603219C (en) 2011-10-11
TWI320923B (en) 2010-02-21
TWI321314B (en) 2010-03-01
NO340434B1 (no) 2017-04-24
US20060277042A1 (en) 2006-12-07
DK1864282T3 (en) 2017-08-21
PT1864101E (pt) 2012-10-09
AU2006252957A1 (en) 2006-12-07
CA2602804C (en) 2013-12-24
KR100956877B1 (ko) 2010-05-11
AU2006232360A1 (en) 2006-10-12
WO2006107838A1 (en) 2006-10-12
DK1864101T3 (da) 2012-10-08
HK1169509A1 (en) 2013-01-25
JP2008535024A (ja) 2008-08-28
JP4955649B2 (ja) 2012-06-20
TWI319565B (en) 2010-01-11
JP5129118B2 (ja) 2013-01-23
TW200705388A (en) 2007-02-01
AU2006232364A1 (en) 2006-10-12
ES2636443T3 (es) 2017-10-05
US8260611B2 (en) 2012-09-04

Similar Documents

Publication Publication Date Title
KR100982638B1 (ko) 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130830

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140828

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190624

Year of fee payment: 10