KR100956877B1 - 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 - Google Patents

스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 Download PDF

Info

Publication number
KR100956877B1
KR100956877B1 KR1020077025400A KR20077025400A KR100956877B1 KR 100956877 B1 KR100956877 B1 KR 100956877B1 KR 1020077025400 A KR1020077025400 A KR 1020077025400A KR 20077025400 A KR20077025400 A KR 20077025400A KR 100956877 B1 KR100956877 B1 KR 100956877B1
Authority
KR
South Korea
Prior art keywords
vector
speech signal
frame
spectral envelope
narrowband
Prior art date
Application number
KR1020077025400A
Other languages
English (en)
Other versions
KR20070118170A (ko
Inventor
코엔 버나드 보스
Original Assignee
콸콤 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=36588741&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100956877(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 콸콤 인코포레이티드 filed Critical 콸콤 인코포레이티드
Publication of KR20070118170A publication Critical patent/KR20070118170A/ko
Application granted granted Critical
Publication of KR100956877B1 publication Critical patent/KR100956877B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

일 실시예에 따른 양자화기는 입력값의 평활화된 값(예컨대, 선형 스펙트럼 주파수들의 벡터)을 양자화하여 대응하는 출력값을 생성하도록 구성되며, 상기 평활화된 값은 이전 출력값의 양자화 에러 및 스케일 인자에 기초한다.

Description

스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및 장치{METHOD AND APPARATUS FOR VECTOR QUANTIZING OF A SPECTRAL ENVELOPE REPRESENTATION}
본 출원은 "광대역 음성의 고주파수 대역 코딩"이라는 명칭으로 2005년 4월 1일에 출원된 미국 가출원번호 60/667,901의 우선권을 주장한다. 또한, 본 출원은 "고대역 음성 코더에서 파라미터 코딩"이라는 명칭으로 2005년 4월 22일 출원한 미국 가출원번호 60/673,965의 우선권을 주장한다.
본 발명은 신호 처리에 관한 것이다.
음성 인코더(speech encoder)는 선형 스펙트럼 주파수들(LSF)의 벡터 또는 유사한 표현의 형식으로 디코더에 음성 신호의 스펙트럼 엔벨로프의 특징을 전송한다. 효율적인 전송을 위하여, 이들 LSF는 양자화된다.
일 실시예에 따른 양자화기는 입력값의 평활화된 값(smoothed value)(선형 스펙트럼 주파수들 또는 이의 일부분의 벡터와 같은)을 양자화하여 대응하는 출력값을 생성하도록 구성되며, 여기서 평활화된 값은 이전 출력값의 양자화 에러 및 스케일 인자에 기초한다.
도 1a는 일 실시예에 따른 음성 인코더(E100)의 블록도를 도시한다.
도 1b는 음성 디코더(E200)의 블록도를 도시한다.
도 2는 스케일러 양자화기에 의하여 전형적으로 수행되는 1차원 매핑의 예를 도시한다.
도 3은 벡터 양자화기에 의하여 수행되는 다차원 매핑의 단순한 일례를 도시한다.
도 4a는 1차원 신호의 일례를 도시하며, 도 4b는 양자화후 1차원 신호의 버전의 예를 도시한다.
도 4c는 도 6에서 도시된 양자화기(230b)에 의하여 양자화된 도 4a의 신호의 예를 도시한다.
도 4d는 도 5에 도시된 양자화기(230a)에 의하여 양자화된 도 4a의 신호의 예를 도시한다.
도 5는 일 실시예에 따른 양자화기(230)의 구현예(230a)에 관한 블록도를 도시한다.
도 6은 일 실시예에 따른 양자화기(230)의 구현예(230b)에 관한 블록도를 도시한다.
도 7a는 음성 신호에 대하여 주파수에 대한 로그 진폭의 그래프에 관한 예를 도시한다.
도 7b는 기본 선형 예측 코딩 시스템의 블록도를 도시한다.
도 8은 도 10a에 도시된 협대역 인코더(A120)의 구현예(A122)에 관한 블록도를 도시한다.
도 9는 도 11a에 도시된 협대역 디코더(B110)의 구현예(B112)에 관한 블록도를 도시한다.
도 10a는 광대역 음성 인코더(A100)의 블록도를 도시한다.
도 10b는 광대역 음성 인코더(A100)의 구현예(A102)에 관한 블록도를 도시한다.
도 11a는 광대역 음성 인코더(A100)에 대응하는 광대역 음성 디코더(B100)의 블록도를 도시한다.
도 11b는 광대역 음성 인코더(A102)에 대응하는 광대역 음성 디코더(B102)의 예를 도시한다.
양자화 에러 때문에, 디코더에서 재구성된 스펙트럼 엔벨로프는 과도한 변동들을 가질 수 있다. 이들 변동들은 디코딩된 신호에서 부적절한 와블리(warbly) 품질을 유발할 수 있다. 실시예들은 스펙트럼 엔벨로프 파라미터들의 시간적 잡음 성형 양자화(temporal noise shaping quantization)를 사용하여 고품질 광대역 음성을 수행하도록 구성된 시스템들, 방법들 및 장치들을 포함한다. 특징들(feature)은 고대역 LSF들과 같은 계수 표현들의 고정 또는 적응 평활화를 포함한다. 여기에 기술된 특정 애플리케이션은 협대역 신호와 고대역 신호를 결합하는 광대역 음성 코더를 포함한다.
본 명세서에서 명백하게 제한되지 않은 한, 용어 "계산하는 것"은 값들의 리스트로부터 컴퓨팅 하는 것, 생성하는 것 그리고 선택하는 것과 같은 일반적인 의미들중 일부를 표시하기 위하여 여기에서 사용된다. 용어 "포함한다"가 상세한 설명 및 청구범위에서 사용되는 경우에, 이 용어는 다른 엘리먼트들 또는 동작들을 배제하지 않는다. 용어 "A가 B에 기초한다"는 (i) "A가 B와 동일하다" 및 (ii) "A가 적어도 B에 기초한다"를 포함하는 일반적인 의미들중 일부를 표시하기 위하여 사용된다. 용어 "인터넷 프로토콜"은 IETF(Internet Engineering Task Force) RFC(Request for Comments) 791에 개시된 버전 4 및 버전 6과 같은 다음 버전들을 포함한다.
음성 인코더는 필터를 기술하는 파라미터들의 세트로서 입력 음성 신호를 인코딩하는 소스-필터 모델에 따라 구현될 수 있다. 예컨대, 음성 신호의 스펙트럼 엔벨로프는 성도(vocal tract)의 공명(resonance)들을 나타내고 포먼트(formant)로 지칭되는 다수의 피크들에 의하여 특징지워진다. 도 7a는 스펙트럼 엔벨로프의 일례를 도시한다. 대부분의 음성 코더들은 필터 계수들과 같은 파라미터들의 세트로서 적어도 개략(coarse) 스펙트럼 구조를 인코딩한다.
도 1a는 일 실시예에 따른 음성 인코더(E100)의 블록도를 도시한다. 이러한 예에서 기술된 바와같이, 분석 모듈은 선형 예측(LP) 계수들(예컨대, 모든-폴 필터(all-pole filter) 1/A(z)의 계수들)의 세트로서 음성 신호(S1)의 스펙트럼 엔벨로프를 인코딩하는 선형 예측 코딩(LPC) 분석 모듈(210)로서 구현될 수 있다. 분석 모듈은 전형적으로 일련의 비중첩 프레임들로서 입력 신호를 처리하며, 계수들의 새로운 세트는 각각의 프레임과 관련하여 계산된다. 프레임 기간은 일반적으로 신호가 국부적으로 정지된 것으로 예측될 수 있는 기간이며, 하나의 공통적인 예는 20 밀리초(8kHz의 샘플링율에서 160개의 샘플들과 동일한)이다. 저대역 LPC 분석 모듈(예컨대 LPC 분석 모듈(210)로서 도 8에 도시된)의 일례는 협대역 신호(S20)의 각각의 20-밀리초 프레임의 포먼트 구조(formant structure)를 특징지우기 위하여 10개의 LP 필터 계수들의 세트를 계산하도록 구성되며, 고대역 LPC 분석 모듈(예컨대 고대역 인코더(A200)로서 도 10a에 도시된)의 일례는 고대역 신호(S30)의 각각의 20-밀리초 프레임의 포먼트 구조를 특징지우기 위하여 6개(선택적으로, 8개)의 LP 필터 계수들을 계산하도록 구성된다. 일련의 중첩 프레임들로서 입력 신호를 처리하기 위하여 분석 모듈을 실행하는 것이 또한 가능하다.
분석 모듈은 각각의 프레임의 샘플들을 직접 분석하도록 구성될 수 있거나 또는 샘플들은 먼저 윈도윙 함수(windowing function)(예컨대, 해밍 윈도우)에 따라 우선 가중될 수 있다. 분석은 30-msec 윈도우와 같이 프레임보다 큰 윈도우 전반에 걸쳐 수행될 수 있다. 이러한 윈도우는 대칭적이거나(예컨대, 20-msec 프레임 직전 및 직후에서 5-msec를 포함하도록 5-20-5) 또는 비대칭적일 수 있다(예컨대 선행 프레임의 마지막 10msec를 포함하도록 10-20). LPC 분석 모듈은 전형적으로 Levinson-Durbin 궤환법(recursion) 또는 Leroux-Gueguen 알고리즘을 사용하여 LP 필터 계수들을 계산하도록 구성된다. 다른 구현예에 있어서, 분석 모듈은 LP 필터 계수들 대신에 각각의 프레임에 대한 켑스트럼(cepstral) 계수들의 세트를 계산하도록 구성될 수 있다.
음성 인코더의 출력 비트율은 필터 파라미터들을 양자화함으로써 재생 품질에 대하여 비교적 적은 영향을 미치면서 현저하게 감소될 수 있다. 선형 예측 필터 계수들은 효율적으로 양자화하기가 곤란하며, 보통 양자화 및/또는 엔트로피 인코딩을 위하여 라인 스펙트럼 쌍(LSP: Line Spectral Pair)들 또는 라인 스펙트럼 주파수들(SLF)과 같은 다른 표현으로 음성 인코더에 의하여 매핑된다. 도 1a에 도시된 음성 인코더(E100)는 LP 필터 계수들의 세트를 LSF들(S3)의 대응 벡터로 변환하도록 구성된 LP 필터 계수 대 LSF 변환부(220)를 포함한다. LP 필터 계수들의 다른 일대일 표현들은 파코(parcor) 계수들, 즉 로그-영역-비 값들, 이미턴스 스펙트럼 쌍들(ISP:immittance spectral pair), 및 이미턴스 스펙트럼 주파수들(ISF)을 포함하며, 이들은 GSM(Global System for Mobile Communications) AMR-WB(Adaptive Multirate-Wideband) 코덱에서 사용된다. 전형적으로, LP 필터 계수들의 세트 및 LSF들의 대응 세트간의 변환은 가역적(reversible)이나, 실시예들은 또한 변환이 에러없이 가역적이지 않은 음성 인코더의 구현들을 포함한다.
음성 인코더는 전형적으로 협대역 LSF들의 세트들(또는 다른 계수 표현)을 양자화하고 이러한 양자화의 결과를 필터 파라미터들로서 출력하도록 구성된 양자화기를 포함한다. 양자화는 전형적으로 테이블 또는 코드북에서 대응 벡터 엔트리에 대한 인덱스로서 입력 벡터를 인코딩하는 벡터 양자화기를 사용하여 수행된다. 이러한 양자화기는 또한 분류된 벡터 양자화를 수행하도록 구성될 수 있다. 예컨대, 이러한 양자화기는 동일한 프레임내에서(예컨대, 저대역 채널 및/또는 고대역 채널에서) 미리 코딩된 정보에 기초하여 코드북들의 세트중 하나를 선택하도록 구성될 수 있다. 이러한 기술은 전형적으로 코드북을 추가로 저장해야 하나 코딩의 효율성을 향상시킨다.
도 1b는 양자화된 LSF들(S3)을 역양자화하도록 구성된 역양자화기(310) 및 역양자화된 LSF 벡터를 LP 필터 계수들의 세트로 변환하도록 구성된 LSF 대 LP 필터 계수 변환부(320)를 포함하는 대응하는 음성 디코더(E200)의 블록도를 도시한다. LP 필터 계수들에 따라 구성된 합성 필터(330)는 입력 음성 신호의 합성된 재생 신호, 즉 디코딩된 음성 신호(S5)를 생성하기 위하여 여기 신호(excitation signal)에 의하여 구동된다. 여기 신호는 랜덤 잡음 신호 및/또는 인코더에 의하여 전송된 나머지 신호의 양자화된 표현에 기초할 수 있다. 광대역 음성 인코더(A100) 및 디코더(B100)(예컨대, 도면 10a,b 및 11a, b와 관련하여 여기에서 기술된)와 같은 임의의 다중대역 코더들에서, 하나의 대역에 대한 여기 신호는 다른 대역에 대한 여기 신호로부터 유도된다.
LSF들의 양자화는 보통 한 프레임과 다음 프레임이 서로 관련되지 않은 랜덤 에러를 유발한다. 이러한 에러는 양자화된 LSF들이 양자화되지 않은 LSF들보다 덜 평활화되도록 할 수 있으며, 디코딩된 신호의 지각적 품질(perceptual quality)을 감소시킬 수 있다. LSF 벡터들의 독립적 양자화는 일반적으로 비양자화된 LSF 벡터들과 비교하여 프레임마다 스펙트럼 변동량을 증가시키며, 이들 스펙트럼 변동들은 디코딩된 신호가 부자연스러운 소리를 발생시키도록 할 수 있다.
하나의 복잡한 솔루션은 역양자화된 LSF 파라미터의 평활화가 디코더에서 수행되는, Knagenhjelm and Kleijn, "Spectral Dynamics is More Important than Spectral Distortion", 1995 International Conference on Acoustics, Speech, and Signal Processing (ICASSP-95), vol.1, pp. 732-735, 9-12, May 1995" 에 의하여 제안되었다. 이는 스펙트럼 변동을 감소시키나 추가적 지연을 유발한다. 본 애플리케이션은 스펙트럼 변동들이 추가 지연없이 감소될 수 있도록 인코더측에서 시간적 잡음 성형을 사용하는 방법들을 기술한다.
양자화기는 전형적으로 개별 출력값들의 세트중 하나의 개별 출력값에 입력값을 매핑시키도록 구성된다. 제한된 수의 출력값들은 입력값들의 범위가 단일 출력값에 매핑되도록 이용가능하다. 양자화는 대응하는 출력값을 표시하는 인덱스가 원래의 입력값보다 적은 비트로 전송될 수 있기 때문에 코딩 효율성을 증가시킨다. 도 2는 스케일러 양자화기에 의하여 전형적으로 수행되는 1차원 매핑의 예를 도시한다.
양자화기는 벡터 양자화기일 수 있으며, LSF들은 전형적으로 벡터 양자화기를 사용하여 양자화된다. 도 3은 벡터 양자화기에 의하여 수행되는 다차원 매핑의 하나의 단순한 예를 도시한다. 이러한 예에서, 입력 공간은 다수의 보로노이(Voronoi) 영역들로 분할된다(예컨대 근접-이웃-기준(nearest-neighbor criterion)에 따라). 양자화는 여기에서 한점으로서 도시된 대응하는 보로노이(Voronoi) 영역(전형적으로, 센트로이드(centroid))을 나타내는 값에 각각의 입력값을 매핑시킨다. 이러한 예에서, 입력 공간은 임의의 입력값이 단지 6개의 다른 상태들을 가진 인덱스에 의하여 표현될 수 있도록 6개의 영역들로 분할된다.
만일 입력 신호가 매우 평활하면, 양자화된 출력이 양자화의 출력 공간의 값들사이의 최소 스텝에 따라 훨씬 덜 평활화되는 것이 종종 발생한다. 도 4a는 하나의 양자화 레벨(단지 이러한 하나의 레벨만이 여기에서 도시됨)내에서만 변화하는 평활화 1차원 신호의 일례를 도시하며, 도 4b는 양자화후 상기 신호의 예를 도시한다. 비록 도 4a에서의 입력이 단지 작은 범위에 걸쳐 변화할지라도, 도 4b의 결과적인 출력은 더 급격한 전이들(transition)을 포함하며 훨씬 덜 평활하다. 이러한 현상은 가청 인공물(audible artifact)들을 유발할 수 있으며, LSF들(또는 양자화될 스펙트럼 엔벨로프의 다른 표현들)에 대한 이러한 현상을 감소시키는 것이 바람직할 수 있다. 예컨대, LSF 양자화 성능은 시간적 잡음 성형을 통합시킴으로서 개선될 수 있다.
일 실시예에 따른 방법에서, 스펙트럼 엔벨로프 파라미터들의 벡터는 인코더에서 음성의 모든 프레임(또는 다른 블록)에 대하여 한번 추정된다. 파라미터 벡터는 디코더에 효율적으로 전송하기 위하여 양자화된다. 양자화후에, 양자화 에러(양자화된 및 양자화되지 않은 파라미터 벡터간의 차(difference)로서 정의됨)가 저장된다. 프레임 N-1의 양자화 에러는 프레임 N의 파라미터 벡터를 양자화하기전에 스케일 인자만큼 감소되고 프레임 N의 파라미터 벡터에 가산된다. 현재 및 이전에 추정된 스펙트럼 엔벨로프들간의 차(difference)가 비교적 클때 스케일 인자의 값이 보다 작게되는 것이 바람직하다.
일 실시예에 따른 방법에서, LSF 양자화 에러 벡터는 각각의 프레임에 대하여 계산되며, 1.0보다 작은 값을 가진 스케일 인자 b에 의하여 곱해진다. 양자화전에, 이전 프레임에 대한 스케일링된 양자화 에러는 LSF 벡터(입력값(V10))에 가산된다. 이러한 방법의 양자화 동작은 다음과 같은 수식으로 기술될 수 있다.
Figure 112007078668994-pct00001
여기서, s(n)은 프레임 n에 속하는 평활화된 LSF 벡터이며, y(n)은 프레임 n에 속하는 양자화된 LSF 벡터이며,
Figure 112009082035135-pct00002
는 가장 인접한 이웃 양자화 연산이며, b는 스케일 인자이다.
일 실시예에 따른 양자화기(230)는 입력값(V10)(예컨대, LSF 벡터)의 평활화된 값(V20)의 양자화된 출력값(V30)을 생성하도록 구성되며, 여기서 평활화된 값(V20)은 스케일 인자 (V40) 및 이전 출력값(V30)의 양자화 에러에 기초한다. 이러한 양자화기는 추가 지연없이 스펙트럼 변형들을 감소시키기 위하여 적용될 수 있다. 도 5는 이러한 구현에 특정할 수 있는 값들이 인덱스 a에 의하여 표시되는 양자화기(230)의 일 구현예(230a)에 관한 블록도를 도시한다. 이러한 예에서, 양자화 에러는 역양자화기(Q20)에 의하여 역양자화되는 현재의 출력값(V30a)으로부터 현재의 입력값(V10)을 감산하기 위하여 가산기(A10)를 사용하여 계산된다. 에러는 지연 엘리먼트(DE10)에 저장된다. 평활화된 값(V20a)은 예컨대 스케일 인자(V40)에 의하여 스케일링된(예컨대, 곱셈기(M10)에서 곱해진) 이전 프레임의 양자화 에러 및 현재 입력값(V10)의 합이다. 양자화기(230a)는 또한 스케일 인자(V40)가 지연 엘리먼트(DE10)에 양자화 에러를 저장하기전에 제공되도록 구현될 수 있다.
도 4d는 도 4a의 입력 신호에 응답하여 양자화기(230a)에 의하여 생성된 출력값들(V30a)의 (역양자화된) 시퀀스의 예를 도시한다. 이러한 예에서, 스케일 인자(V40)의 값은 0.5로 고정된다. 도 4d의 신호가 도 4a의 변동하는 신호보다 더 평활하다는 것을 알 수 있다.
귀납적 함수(recursive function)를 사용하여 피드백량을 계산하는 것이 바람직할 수 있다. 예컨대, 양자화 에러는 현재의 평활화된 값보다 오히려 현재의 입력값에 대하여 계산될 수 있다. 이러한 방법은 다음과 같은 수식에 의하여 기술될 수 있다.
Figure 112007078668994-pct00003
여기서, x(n)는 프레임 n에 속하는 입력 LSF 벡터이다.
도 6은 이러한 구현에 특정할 수 있는 값들이 인덱스 b에 의하여 표시되는 양자화기(230)의 구현예(230b)에 관한 블록도이다. 이러한 예에서, 양자화 에러는 역양자화기(Q20)에 의하여 역양자화된 현재의 출력값(V30b)으로부터 평활화된 값(V20b)의 현재값을 감산하기 위하여 가산기(A10)를 사용하여 계산된다. 에러는 지연 엘리먼트(DE10)에 저장된다. 평활화된 값(V20b)은 스케일 인자(V40)에 의하여 스케일링된(예컨대, 곱셈기(M10)에서 곱해진) 이전 프레임의 양자화 에러 및 현재의 입력값(V10)의 합이다. 양자화기(230b)는 또한 스케일 인자(V40)가 지연 엘리먼트(DE10)에 양자화 에러를 저장하기전에 제공되도록 구현될 수 있다. 또한, 구현예(230b)와 대조적으로 구현예(230a)에서 스케일 인자(V40)의 다른 값들을 사용하는 것이 가능하다.
도 4c는 도 4a의 입력신호에 응답하여 양자화기(230b)에 의하여 생성된 출력값들(V30b)의 (역양자화된) 시퀀스의 예를 도시한다. 이러한 예에서, 스케일 인자(V40)의 값은 0.5로 고정된다. 도 4c의 신호가 도 4a의 변동하는 신호보다 더 평활한 것을 알 수 있다.
여기에 기술된 실시예들이 도 5 또는 도 6에 도시된 배열에 따라 기존 양자화기(Q10)를 대체 또는 보강함으로써 구현될 수 있다는 것에 유의해야 한다. 예컨대, 양자화기(Q10)는 예측 벡터 양자화기(predictive vector quantizer), 다단계 양자화기(multi-stage quantizer), 분할 벡터 양자화기(split vector quantizer)로서 또는 LSF 양자화를 위한 임의의 다른 방식에 따라 구현될 수 있다.
일례에서, 스케일 인자의 값은 0 내지 1사이의 원하는 값으로 고정된다. 대안적으로, 스케일 인자의 값을 동적으로 조절하는 것이 바람직할 수 있다. 예컨대, 양자화되지 않은 LSF 벡터들에 이미 존재하는 변동 정도에 따라 스케일 인자의 값을 조절하는 것이 바람직하다. 현재 및 이전 LSF 벡터들간의 차(difference)가 클때, 스케일 인자는 거의 0에 가까우며 거의 잡음 성형 결과치들을 야기하지 않는다. 현재의 LSF 벡터가 이전 LSF 벡터와 약간 다를때, 스케일 인자는 거의 1.0이다. 이러한 방식에서, 시간에 따른 스펙트럼 엔벨로프의 전이들은 음성 신호가 변화할때 스펙트럼 왜곡을 최소화하도록 유지될 수 있는 반면에, 스펙트럼 변동들은 음성 신호가 프레임 마다 비교적 일정할때 감소될 수 있다.
스케일 인자의 값은 연속 LSF들간의 거리에 비례하게 만들어질 수 있으며, 벡터들간의 다양한 거리들중 일부는 LSF들간의 변화를 결정하기 위하여 사용될 수 있다. 유클리드 노름(Euclidean Norm)은 전형적으로 사용되나, 사용될 수 있는 다른 것들은 맨하튼 거리(Manhattan distance)(1-노름), 체비세프 거리(Chebyshev distance)(무한 노름), 마할라노비스 거리(Mahalanobis distance), 해밍 거리(Hamming distance)를 포함한다.
연속 LSF 벡터들간의 변화를 결정하기 위하여 가중 거리 측정방법을 사용하는 것이 바람직할 수 있다. 예컨대, 거리 d는 다음과 같은 수식에 따라 계산될 수 있다.
Figure 112007078668994-pct00004
여기서,
Figure 112009082035135-pct00005
은 현재의 LSF 벡터를 표시하며,
Figure 112009082035135-pct00006
는 이전 LSF 벡터를 표시하며, P는 각각의 LSF 벡터에서 엘리먼트들의 수를 표시하며, 인덱스 i는 LSF 벡터 엘리먼트를 표시하며, c는 가중 인자들의 벡터를 표시한다. c의 값은 더 지각적으로 중요한 저주파수 성분들을 강조하도록 선택될 수 있다. 일례로, ci 는 1 내지 8의 i에 대하여 값 1.0을 가지며, i=9에 대하여 0.8을 가지며, i=10에 대하여 0.4를 가진다.
다른 예에서, 연속 LSF 벡터들간의 거리 d는 이하의 수식에 따라 계산될 수 있다.
Figure 112007078668994-pct00007
여기서,
Figure 112009082035135-pct00008
는 가변 가중 인자들의 벡터를 표시한다. 이러한 일례에서,
Figure 112009082035135-pct00009
는 값
Figure 112009082035135-pct00010
를 가지며, 여기서 P는 대응 주파수 f에서 계산된 LPC 전력 스펙트럼을 표시하며, r은 예컨대 0.15 또는 0.3의 전형적인 값을 가진 상수이다. 다른 예에서,
Figure 112009082035135-pct00011
의 값들은 ITU-T G.729 표준에서 사용된 대응 가중 함수에 따라 선택된다.
Figure 112007078668994-pct00012
0 및 0.5에 각각 근사한 경계값들은 각각
Figure 112009082035135-pct00013
의 가장 낮은 및 가장 높은 엘리먼트들에 대하여
Figure 112009082035135-pct00014
Figure 112009082035135-pct00015
대신에 선택된다. 이러한 경우에,
Figure 112009082035135-pct00016
는 앞서 표시된 값들을 가질 수 있다. 다른 예에서,
Figure 112009082035135-pct00017
는 값 1.2를 가진
Figure 112009082035135-pct00018
Figure 112009082035135-pct00019
를 제외하고 값 1.0을 가진다.
프레임 단위 기반(frame-by-frame basis)에 있어서 여기에 기술된 시간적 잡음 성형 방법이 양자화 에러를 증가시킬 수 있다는 것이 도 4a-d로부터 인식될 수 있다. 그러나, 비록 양자화 동작의 절대 제곱 에러가 증가할지라도, 양자화 에러가 스펙트럼의 다른 부분으로 이동될 수 있다는 잠재적인 장점이 존재한다. 예컨대, 양자화 에러는 저주파수로 이동되어 더 평활화될 수 있다. 입력 신호가 평활화될때, 입력신호 및 평활화된 양자화 에러의 합으로서 더 평활한 출력 신호가 획득될 수 있다.
도 7b는 협대역 신호(S20)의 스펙트럼 엔벨로프의 코딩에 적용되는 기본적인 소스-필터 구조의 예를 도시한다. 분석 모듈(710)은 일정 기간(전형적으로 20msec)에 걸쳐 음성 사운드에 대응하는 필터를 특징지우는 파라미터들의 세트를 계산한다. 필터 파라미터들에 따라 구성된 화이트닝 필터(whitening filter)(760)(또는 분석 또는 예측 에러 필터라 칭함)는 신호를 스펙트럼적으로 평탄화하기 위하여 스펙트럼 엔벨로프를 제거한다. 결과적인 화이트닝된 신호(잔여 신호로 지칭됨)는 적은 에너지를 가져서 적은 변형을 가지며, 원래의 음성 신호보다 더 용이하게 인코딩될 수 있다. 잔여 신호들의 코딩으로부터 발생하는 에러들은 스펙트럼 전반에 걸쳐 더 균일하게 확산될 수 있다. 필터 파라미터들 및 잔여 신호들은 채널을 통해 효율적으로 전송하기 위하여 전형적으로 양자화된다. 디코더에서, 필터 파라미터들에 따라 구성된 합성 필터는 원래의 음성 사운드의 합성 버전을 생성하기 위하여 잔여 신호에 기초하여 신호에 의하여 여기(excite)된다. 합성 필터는 전형적으로 화이트닝 필터의 전달 함수의 역(inverse)인 전달함수를 가지도록 구성된다. 도 8은 도 10a에 도시된 협대역 인코더(A120)의 기본 구현예(A122)에 관한 블록도를 도시한다.
도 8에서 알 수 있는 바와같이, 협대역 인코더(A122)는 또한 필터 계수들의 세트에 따라 구성되는 화이트닝 필터(260)(또한 분석 또는 예측 에러 필터로 지칭됨)에 협대역 신호(S20)를 통과시킴으로써 잔여 신호를 생성한다. 이러한 특정 예에서, 화이트닝 필터(260)는 비록 IIR 구현들이 사용될 수 있을지라도 FIR 필터로서 구현된다. 이러한 잔여 신호는 전형적으로 협대역 필터 파라미터들(S40)로 표현되지 않는, 피치(pitch)에 관한 장기간(long-term) 구조와 같은 음성 프레임의 지각적으로 중요한 정보를 포함할 수 있다. 양자화기(270)는 인코딩된 협대역 여기 신호(S50)로서 출력하기 위한 잔여 신호의 양자화된 표현을 계산하도록 구성된다. 이러한 양자화기는 전형적으로 테이블 또는 코드북의 대응하는 벡터 엔트리에 대한 인덱스로서 입력 벡터를 인코딩하는 벡터 양자화기를 포함한다. 대안적으로, 이러한 양자화기는 희소(sparse) 코드북 방법의 경우에서 처럼 저장매체로부터 검색되는 것보다 오히려 벡터가 디코더에서 동적으로 생성될 수 있는 하나 이상의 파라미터들을 전송하도록 구성될 수 있다. 이러한 방법은 대수적 CELP(코드북 여기 선형 예측)와 같은 코딩 방식들 및 3GPP2(3세대 파트너십2) EVRC(강화된 가변율 코덱들)과 같은 코덱들에서 사용된다.
협대역 인코더(A120)가 대응하는 협대역 디코더에서 이용가능한 동일한 필터 파라미터 값들에 따라 인코딩된 협대역 여기 신호를 생성하는 것이 바람직하다. 이러한 방식에서, 결과적인 인코딩된 협대역 여기 신호는 양자화 에러와 같은 파라미터값들의 비이상성(nonideality)들을 어느 정도 미리 고려할 수 있다. 따라서, 디코더에서 이용가능한 동일한 계수값들을 사용하여 화이트닝 필터를 구성하는 것이 바람직하다. 도 8에 도시된 인코더(A122)의 기본적인 예에서, 역양자화기(240)는 협대역 필터 파라미터들(S40)을 역양자화하며, LSF 대 LP 필터 계수 변환부(250)는 LP 필터 계수들의 대응 세트에 결과적인 값들을 다시 매핑하며, 이러한 계수들의 세트는 양자화기(270)에 의하여 양자화된 잔여 신호를 생성하기 위하여 화이트닝 필터(260)를 구성하기 위하여 사용된다.
협대역 인코더(A120)의 일부 구현들은 잔여 신호와 최상으로 매칭되는 코드북 벡터들의 세트중 하나의 코드북 벡터를 식별함으로써 인코딩된 협대역 여기 신호(S50)를 계산하도록 구성된다. 그러나, 협대역 인코더(A120)가 잔여 신호를 실제로 생성하지 않고 잔여 신호의 양자화된 표현을 계산하도록 구현될 수 있다는 것에 유의해야 한다. 예컨대, 협대역 인코더(A120)는 다수의 코드북 벡터들을 사용하여 대응하는 합성 신호들을 생성하고(예컨대, 필터 파라미터들의 현재 세트에 따라), 지각적으로 가중된 영역의 원래의 협대역 신호(S20)와 최상으로 매칭되는 생성된 신호와 연관된 코드북 벡터를 선택하도록 구성될 수 있다.
도 9는 협대역 디코더(B110)의 구현예(B112)에 관한 블록도를 도시한다. 역양자화기(310)는 (이 경우에 LSF들의 세트로) 협대역 필터 파라미터들(S40)을 역양자화하며, LSF 대 LP 필터 계수 변환부(320)는 (예컨대, 협대역 인코더(A122)의 역양자화기(240) 및 변환부(250)와 관련하여 앞서 기술된 바와같이) LSF들을 필터 계수들의 세트로 변환한다. 역양자화기(340)는 협대역 여기 신호(S80)를 생성하기 위하여 인코딩된 협대역 여기 신호(S50)를 역양자화한다. 필터 계수들 및 협대역 여기 신호(S80)에 기초하여, 협대역 합성 필터(330)는 협대역 신호(S90)를 합성한다. 다시 말해서, 협대역 합성 필터(330)는 협대역 신호(S90)를 생성하기 위하여 역양자화된 필터 계수들에 따라 협대역 여기 신호(S80)를 스펙트럼적으로 성형(shape)하도록 구성된다. 도 11a에 도시된 바와같이, 협대역 디코더(B112)(협대역 디코더(B110)의 형태)는 또한 협대역 여기 신호(S80)를 고대역 디코더(B200)에 제공하며, 고대역 디코더(B200)는 협대역 여기 신호(S80)를 사용하여 고대역 여기 신호를 유도한다. 일부 구현들에 있어서, 협대역 디코더(B110)는 스펙트럼 틸트(tilt), 피치 이득 및 래그(lag) 및 음성 모드와 같이 협대역 신호와 관련된 부가 정보를 고대역 디코더(B200)에 제공하도록 구성될 수 있다. 협대역 인코더(A122) 및 협대역 디코더(B112)의 시스템은 합성에 의한 분석 음성 코덱(analysis-by-synthesis speech codec)의 기본적인 예다.
공중 교환 전화망(PSTN)을 통한 음성 통신들은 통상적으로 300-3400kHz의 주파수 범위로 그 대역폭이 제한되었다. 셀룰라 전화 및 VoIP(Voice over IP)와 같은 음성 통신들을 위한 새로운 네트워크들은 동일한 대역폭 제한들을 가질 수 없으며, 이러한 네트워크들을 통해 광대역 주파수 범위를 포함하는 음성 통신들을 전송하고 수신하는 것이 바람직할 수 있다. 예컨대, 50Hz까지 아래로 및/또는 7 또는 8 kHz까지 연장하는 오디오 주파수 범위를 지원하는 것이 바람직할 수 있다. 또한, 통상적인 PSTN 제한들 밖의 범위들내의 오디오 음성 콘텐츠를 가질 수 있는 고품질 오디오 또는 오디오/비디오 회의와 같은 다른 애플리케이션들을 지원하는 것이 바람직할 수 있다.
광대역 음성 코딩과 관련한 한 방법은 광대역 스펙트럼을 커버하기 위하여 협대역 음성 코딩 기술(예컨대, 0-4kHz의 범위를 인코딩하도록 구성된 기술)을 스케일링(scaling)하는 하는 것을 포함한다. 예컨대, 음성 신호는 고주파수의 성분들을 포함하도록 높은 레이트로 샘플링될 수 있으며, 협대역 코딩 기술은 이러한 광대역 신호를 나타내기 위하여 더 많은 필터 계수들을 사용하도록 재구성될 수 있다. 그러나, CELP(코드북 여기 선형 예측)과 같은 협대역 코딩 기술들은 계산적으로 강력하며, 광대역 CELP 코더는 많은 이동 및 다른 내장형 애플리케이션들에 대하여 실시하기에 너무 많은 처리 사이클들을 소비할 수 있다. 이러한 기술을 사용하여 원하는 품질로 광대역 신호의 전체 스펙트럼을 인코딩하는 것은 허용할 수 없는 큰 대역폭 증가를 유발할 수 있다. 더욱이, 이러한 인코딩된 신호의 트랜스코딩은 인코딩된 신호의 협대역 부분이 단지 협대역 코딩을 지원할 수 있는 시스템에 전송되고 및/또는 이 시스템에 의하여 디코딩될 수 있기 전에 요구될 것이다.
도 10a는 개별 협대역 및 고대역 음성 인코더들(A120, A200)을 각각 포함하는 광대역 음성 인코더(A100)의 블록도를 도시한다. 협대역 및 고대역 음성 인코더들(A120, A200)중 어느 하나 또는 둘다는 여기에 기술된 양자화기(230)의 구현예를 사용하여 LSF들(또는 다른 계수 표현)의 양자화를 수행하도록 구성될 수 있다. 도 11a는 대응하는 광대역 음성 디코더(B100)의 블록도를 도시한다. 도 10a에서, 필터 뱅크(A110)는 "음성 신호 필터링을 위한 시스템, 방법 및 장치"라는 명칭을 가진 특허출원(현재는 미국특허 공개공보 제2007/0088558)에 기술된 원리들 및 구현들에 따라 광대역 음성 신호(S10)로부터 협대역 신호(S20) 및 고대역 신호(S30)를 생성하도록 구현될 수 있으며, 상기 특허출원은 여기에 참조문헌으로서 통합된다. 도 11a에 도시된 바와같이, 필터 뱅크(B120)는 디코딩된 협대역 신호(S90) 및 디코딩된 고대역 신호(S100)로부터 디코딩된 광대역 음성 신호(S110)를 생성하기 위하여 유사하게 구현될 수 있다. 도 11a는 또한 협대역 신호(S90) 및 협대역 여기 신호(S80)를 생성하기 위하여 협대역 필터 파라미터들(S40) 및 인코딩된 협대역 여기 신호(S50)를 디코딩하도록 구성된 협대역 디코더(B110), 및 고대역 코딩 파라미터들(S60) 및 협대역 여기 신호(S80)에 기초하여 고대역 신호(S100)를 생성하도록 구성된 고대역 디코더(B200)를 도시한다.
인코딩된 신호의 적어도 협대역 부분이 트랜스코딩 또는 다른 중요한 수정없이 협대역 채널(예컨대, PSTN 채널)을 통해 전송될 수 있도록 광대역 음성 코딩을 실행하는 것이 바람직할 수 있다. 광대역 코딩 확장의 효율성은 예컨대 유선 및 무선 채널들을 통한 방송 및 무선 셀룰라 전화와 같은 애플리케이션들로 서비스될 수 있는 사용자들의 수를 현저하게 감소시키는 것을 방지하기 위하여 바람직할 수 있다.
광대역 음성 코딩과 관련한 한 방법은 인코딩된 협대역 스펙트럼 엔벨로프로부터 고대역 스펙트럼 엔벨로프를 외삽(extrapolate)하는 것을 포함한다. 이러한 방법이 대역폭을 증가시키지 않고 그리고 트랜스코딩에 대한 필요성없이 구현될 수 있는 반면에, 음성 신호의 고대역 부분의 개략적 스펙트럼 엔벨로프 또는 포먼트 구조는 협대역 부분의 스펙트럼 엔벨로프로부터 정확하게 예측될 수 없다.
광대역 음성 인코더(A100)의 하나의 특정 예는 약 8.55 kbps(초당 킬로비트)의 레이트로 광대역 음성 신호(S10)를 인코딩하도록 구성되며, 약 7.55 kbps는 협대역 필터 파라미터들(S40) 및 인코딩된 협대역 여기 신호(S50)를 위하여 사용되며 약 1kbps는 고대역 코딩 파라미터들(예컨대, 필터 파라미터들 및/또는 이득 파라미터들)(S60)을 위하여 사용된다.
인코딩된 저대역 및 고대역 신호들을 단일 비트스트림에 결합하는 것은 바람직할 수 있다. 예컨대, 인코딩된 광대역 음성 신호로서 (예컨대, 유선, 광선 또는 무선 전송 채널을 통해) 전송을 위하여 또는 저장하기 위하여 인코딩된 신호들을 다중화하는 것이 바람직할 수 있다. 도 10b는 협대역 필터 파라미터들(S40), 인코딩된 협대역 여기 신호(S50), 고대역 코딩 파라미터들(S60)을 다중화된 신호(S70)에 결합하도록 구성된 다중화기(A130)를 포함하는 광대역 음성 인코더(A102) 의 블록도를 도시한다. 도 110b는 광대역 음성 디코더(B100)의 대응하는 구현예(B102)의 블록도를 도시한다. 디코더(B102)는 협대역 필터 파라미터들(S40), 인코딩된 협대역 여기 신호(S50) 및 고대역 코딩 파라미터들(S60)을 획득하기 위하여 다중화된 신호(S70)를 역다중화하도록 구성된 역다중화기(B130)를 포함한다.
인코딩된 저대역 신호가 고대역 및/또는 초저대역 신호와 같은 다중화된 신호(S70)의 다른 부분과 관계없이 복원 및 디코딩될 수 있도록, 인코딩된 저대역 신호(협대역 필터 파라미터들(S40) 및 인코딩된 협대역 여기 신호(S50)를 포함하는)를 다중화된 신호(S70)의 분리가능 서브스트림으로서 삽입(embed)하게 멀티플렉서(A130)를 구성하는 것이 바람직할 수 있다. 예컨대, 다중화된 신호(S70)는 인코딩된 저대역 신호가 고대역 코딩 파라미터들(S60)을 스트리핑(stripping)함으로써 복원될 수 있도록 구성될 수 있다. 이러한 특징의 하나의 잠재적 장점은 저대역 신호의 디코딩을 지원하나 고대역 부분의 디코딩을 지원하지 않는 시스템에 인코딩된 광대역 신호를 통과시키기전에 인코딩된 광대역 신호를 트랜스코딩할 필요성을 제거하는 것이다.
여기에 기술된 잡음-성형 양자화기 및/또는 저대역, 고대역, 및/또는 광대역 음성 인코더를 포함하는 장치는 또한 유선, 광선 또는 무선 채널과 같은 전송 채널로 인코딩된 신호를 전송하도록 구성된 회로를 포함할 수 있다. 이러한 장치는 하나 이상의 계층들의 네트워크 프로토콜 인코딩(예컨대, 이더넷, TCP/IP, cdma2000) 및/또는 에러 검출 인코딩(예컨대, 순환 중복 인코딩) 및/또는 에러 정정 인코딩(예컨대, 레이트-호환가능 컨벌루션 인코딩)과 같은 하나 이상의 채널 인코딩 동작들을 신호에 대하여 수행하도록 구성될 수 있다.
합성에 의한 분석 음성 인코더(analysis-by-synthesis speech encoder)로서 저대역 음성 인코더(A120)를 구현하는 것이 바람직할 수 있다. 코드북 여기 선형 예측(CELP) 코딩은 합성에 의한 분석 코딩의 하나의 일반적인 패밀리(family)이며, 이러한 코더들의 구현들은 고정 및 적응 코드북들로부터 엔트리들을 선택하는 것과 같은 동작들, 에러 최소화 동작들, 및/또는 지각적 가중 동작들을 포함하는 잔여 신호의 파형 인코딩을 수행할 수 있다. 합성에 의한 분석 코딩의 다른 예들은 혼합 여기 선형 예측(MELP), 대수 CELP(ACELP), 이완(relaxation) CELP(RCELP), 정규 펄스 여기(RPE), 다중-펄스 CELP(MPE), 벡터-합 여기 선형 예측(VSELP) 코딩을 포함한다. 관련된 코딩 방법들은 다중-대역 여기(MBE) 및 포토타입 파형 보간(PWI) 코딩을 포함한다. 표준화된 합성에 의한 분석 음성 코덱들의 예들은 잔여 여기 선형 예측(RELP)을 사용하는 ETSI(유럽전기통신표준협회)-GSM 풀 레이트 코덱(GSM 06.10); GSM 강화 풀 레이트 코덱(ETSI-GSM 06.60); ITU(국제전기통신연합) 표준 11.8kb/s G.729 부록 E 코더; IS(Interim Standard)-136(시분할 다중접속 방식)용 IS-641 코덱들; GSM 적응 멀티레이트(GSM-AMR) 코덱들; 및 4GVTM(4세대 보코더TM) 코덱(캘리포니아 샌프란시스코에 위치한 QUALCOMM Incorporated)를 포함한다. RCELP 코더들의 기존 구현들은 미국통신산업협회(TIA) IS-127에 기술된 강화된 가변율 코덱(EVRC), 및 3세대 파트너십 프로젝트 2(3GPP2) 선택가능 모드 보코더(SMV)를 포함한다. 여기에 기술된 다양한 저대역, 고대역, 및 광대역 인코더들은 상기 기술들중 일부에 따라, 또는 (A) 필터를 기술하는 파라미터들의 세트로서 그리고 (B) 음성 신호를 재생하기 위하여 기술된 필터를 구동시키는데 사용되는 여기(excitation)의 적어도 일부분을 제공하는 잔여 신호의 양자화 표현으로서 음성 신호를 표현하는 임의의 다른 음성 코딩 기술(공지된 기술인지 또는 개발될 기술인지간에)에 따라 구현될 수 있다.
앞서 언급된 바와같이, 여기에서 제시된 실시예들은 협대역 시스템들과의 호환성을 지원하고 트랜스코딩을 위한 필요성을 제거한, 임베디드 코딩(embeded coding)을 수행하기 위하여 사용될 수 있는 구현예들을 포함한다. 고대역 코딩에 대한 지원은 또한 칩들, 칩세트들, 장치들, 및/또는 역방향 호환성과 광대역 지원을 가진 네트워크들, 및 협대역 지원만을 가진 네트워크들을 기본 비용으로(on a cost basis) 구별하기 위하여 사용될 수 있다. 여기에 기술된 고대역 코딩에 대한 지원은 저대역 코딩을 지원하는 기술과 관련하여 사용될 수 있으며, 이러한 실시예에 따른 시스템, 방법 또는 장치는 예컨대 약 50 또는 100Hz로부터 약 7 또는 8 kHz까지의 주파수 성분들의 코딩을 지원할 수 있다.
앞서 언급된 바와같이, 음성 코더에 고대역 지원을 추가하면 특히 마찰음(fricative)들의 구별에 관한 명료성(intelligibility)이 개선될 수 있다. 비록 이러한 구별이 보통 특정 배경으로부터 인간 청취자에 의하여 추론될 수 있을지라도, 고대역 지원은 자동 음성 메뉴 네비게이션 및/또는 자동 통화 처리를 위한 시스템들과 같은 음성 인식 및 다른 머신 해석 애플리케이션들에서 인에이블 특징으(enabling feature)로서 사용될 수 있다. 일 실시예에 따른 장치는 셀룰라 전화 또는 개인휴대단말(PDA)과 같은 휴대용 무선 통신장치에 내장될 수 있다. 선택적으로, 이러한 장치는 VoIP 핸드셋, VoIP 통신들을 지원하도록 구성된 퍼스널 컴퓨터, 또는 전화 또는 VoIP 통신들을 라우팅하도록 구성된 네트워크 장치와 같은 다른 통신장치에 포함될 수 있다. 예컨대, 일 실시예에 따른 장치는 통신 장치용 칩 또는 칩세트들로서 구현될 수 있다. 특정 애플리케이션에 따르면, 이러한 장치는 또한 음성 신호의 아날로그 대 디지털 및/또는 디지털 대 아날로그 변환부, 음성 신호에 대하여 증폭 및/또는 다른 신호 처리 동작들을 수행하는 회로, 및/또는 코딩된 음성 신호를 전송 및/또는 수신하는 무선 주파수 회로를 포함할 수 있다.
실시예들이 미국 가출원번호 제60/667,901호(현재는 미국특허 공개공보 제2007/0088542호)에 개시된 여러 특징들중 하나 이상을 포함하고 및/또는 이들 특징들과 함께 사용될 수 있다는 것이 인식되어야 한다. 이러한 특징들은 협대역 여기 신호(S80) 또는 협대역 잔여 신호(S50)의 조정(regularization) 또는 다른 시프트에 따른, 고대역 신호(S30) 및/또는 고대역 여기 신호(S120)의 시프팅을 포함한다. 이러한 특징들은 여기에 기술된 양자화전에 수행될 수 있는 LSF들의 적응 평활화를 포함한다. 또한, 이러한 특징들은 또한 이득 엔벨로프의 고정 또는 적응 평활화, 및 이득 엔벨로프의 적응 감쇠를 포함한다.
기술된 실시예들의 전술한 설명은 당업자로 하여금 본 발명을 실시 또는 이용하도록 제공된다. 이들 실시예들에 대한 다양한 수정들이 가능하며, 여기에 기술된 일반적인 원리들은 또한 다른 실시예들에 적용될 수 있다. 예컨대, 실시예는 하드-와이어 회로로서, 주문형 집적회로로 제조된 회로 구성으로서, 또는 비휘발성 저장장치에 로드된 펌웨어 프로그램 또는 머신-판독가능 코드로서 데이터 저장매체로부터 또는 이 데이터 저장매체로 로드된 소프트웨어 프로그램으로서 부분적으로 또는 전체적으로 구현될 수 있으며, 머신-판독가능 코드는 마이크로프로세서 또는 다른 디지털 신호 처리 유닛과 같은 로직 엘리먼트들의 어레이에 의하여 실행가능한 명령들이다. 데이터 저장매체는 반도체 메모리(동적 또는 정적 RAM(랜덤 액세스 메모리), ROM(판독 전용 메모리), 및/또는 플래시 RAM를 포함할 수 있는(그러나, 이에 제한되지 않음)), 또는 강유전체, 자기저항식, 오보닉, 중합체 또는 상 변화 메모리; 또는 자기 또는 광 디스크와 같은 디스크 매체와 같은 저장 엘리먼트들의 어레이일 수 있다. 용어 "소프트웨어"는 소스 코드, 어셈블리 언어 코드, 기계 코드, 2진 코드, 펌웨어, 매크로코드, 마이크로코드, 로직 엘리먼트들의 어레이에 의하여 실행가능한 명령들의 하나 이상의 세트 또는 시퀀스, 및 이러한 예들의 임의의 조합을 포함하는 것으로 이해되어야 한다.
잡음-성형 양자화기; 고대역 음성 인코더(A200); 광대역 음성 인코더(A100, A102); 및 이러한 하나 이상의 이러한 장치들을 포함하는 구조들의 다양한 구현 엘리먼트들은 비록 다른 구조들이 제한없이 고려될 수 있을지라도 예컨대 동일한 칩상에 또는 칩세트의 두개 이상의 칩들사이에 위치하는 전자 및/또는 광학 장치들로서 구현될 수 있다. 이러한 장치의 하나 이상의 엘리먼트들은 마이크로프로세서들, 내장형 프로세서들, IP 코어들, 디지털 신호 프로세서들, FPGA들(필드-프로그램가능 게이트 어레이들), ASSP들(애플리케이션-특정 표준 제품들) 및 ASIC들(주문형 집적회로)과 같은 로직 엘리먼트들(예컨대, 트랜지스터들, 게이트들)의 하나 이상의 고정 또는 프로그램가능 어레이들상에서 실행되도록 구성된 명령들의 하나 이상의 세트들로서 전체적으로 또는 부분적으로 구현될 수 있다. 또한, 이러한 하나 이상의 엘리먼트들이 공통 구조(예컨대, 다른 시간에 다른 엘리먼트들에 대응하는 코드의 부분들을 실행하기 위하여 사용되는 프로세서, 다른 시간에 다른 엘리먼트들에 대응하는 작업들을 수행하기 위하여 실행되는 명령들의 세트, 및/또는 다른 시간에 다른 엘리먼트들에 대한 동작들을 수행하는 전자 및/또는 광학 장치들의 구조)를 가지는 것이 바람직하다. 더욱이, 이러한 하나 이상의 엘리먼트들이 장치의 동작과 직접 관련되지 않은 작업들 또는 다른 명령 세트들, 예컨대 장치 또는 장치가 내장된 시스템의 다른 동작에 관한 작업을 수행 또는 실행하기 위하여 사용되는 것이 바람직하다.
실시예들은 또한 예컨대 음성 처리 및 음성 인코딩을 위한 추가 방법들을 수행하도록 구성된 구조적 실시예들의 설명에 의하여 여기에서 명백하게 기술된 이러한 방법들 뿐만아니라 고대역 버스트 억제 방법들을 포함한다. 이들 방법들의 각각은 또한 로직 엘리먼트들(예컨대, 프로세서, 마이크로프로세서, 마이크로제어기, 또는 다른 유한상태 머신)의 어레이를 포함하는 머신에 의하여 판독 및/또는 실행가능한 하나 이상의 명령 세트들로서 (예컨대, 앞서 언급된 하나 이상의 데이터 저장 매체에) 고밀도로 저장될 수 있다. 따라서, 본 발명은 앞서 기술된 실시예들에 제한되는 것으로 의도되지 않으며 여기에서 임의의 형식으로 기술된 원리들 및 신규한 특징들과 일치하는 가장 넓은 범위를 따른다.

Claims (50)

  1. 스펙트럼 엔벨로프 표현(spectral envelope representation)의 벡터 양자화를 위한 방법으로서,
    대응하는 제 1 및 제 2 벡터들을 생성하기 위하여 음성 신호의 제 1 프레임 및 제 2 프레임을 인코딩하는 단계 ― 상기 제 1 벡터는 상기 제 1 프레임동안 상기 음성 신호의 스펙트럼 엔벨로프(spectral envelope)를 나타내며, 상기 제 2 벡터는 상기 제 2 프레임동안 상기 음성 신호의 스펙트럼 엔벨로프를 나타냄 ―;
    제 1 양자화된 벡터를 생성하는 단계 ― 상기 생성단계는 상기 제 1 벡터의 적어도 일부분에 기초하는 제 3 벡터를 양자화하는 단계를 포함함 ―;
    상기 제 1양자화된 벡터의 양자화 에러를 계산하는 단계;
    제 4벡터를 계산하는 단계 ― 상기 계산단계는 상기 제 2벡터의 적어도 일부분에 상기 양자화 에러의 스케일링된 버전(scaled version)을 가산하는 단계를 포함함 ―; 및
    상기 제 4벡터를 양자화하는 단계를 포함하는,
    스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  2. 제 1항에 있어서, 상기 양자화 에러 계산단계는 상기 제 1 양자화된 벡터 및 상기 제 3 벡터간의 차(difference)를 계산하는 단계를 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  3. 제 1항에 있어서, 상기 양자화 에러 계산단계는 상기 제 1 양자화된 벡터 및 상기 제 1벡터의 적어도 일부분사이의 차(difference)를 계산하는 단계를 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  4. 제 1항에 있어서, 스케일링된 양자화 에러를 계산하는 단계를 더 포함하며, 상기 계산단계는 상기 양자화 에러에 스케일 인자(scale factor)를 곱하는 단계를 포함하며;
    상기 스케일 인자는 상기 제 1벡터의 적어도 일부분 및 상기 제 2벡터의 대응 부분사이의 거리에 기초하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  5. 제 4항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 라인 스펙트럼 주파수들을 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  6. 제 1항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 선형 예측 필터 계수들의 표현(representation)을 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  7. 제 1항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 라인 스펙트럼 주파수들을 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  8. 제 1항에 따른 방법을 기술하는(describing) 머신-실행가능 명령들을 포함하는 데이터 저장매체.
  9. 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치로서,
    음성 신호의 제 1 프레임을 적어도 제 1 벡터로 인코딩하고 음성 신호의 제 2프레임을 적어도 제 2벡터로 인코딩하도록 구성된 음성 인코더 ― 상기 제 1 벡터는 상기 제 1프레임동안 상기 음성 신호의 스펙트럼 엔벨로프를 나타내고 상기 제 2 벡터는 상기 제 2프레임동안 상기 음성 신호의 스펙트럼 엔벨로프를 나타냄 ―;
    제 1 양자화된 벡터를 생성하기 위하여 상기 제 1벡터의 적어도 일부분에 기초하는 제 3벡터를 양자화하도록 구성된 양자화기;
    상기 제 1 양자화된 벡터의 양자화 에러를 계산하도록 구성된 제 1가산기; 및
    제 4벡터를 계산하기 위하여 상기 제 2벡터의 적어도 일부분에 상기 양자화 에러의 스케일링된 버전을 가산하도록 구성된 제 2 가산기를 포함하며;
    상기 양자화기는 상기 제 4벡터를 양자화하도록 구성되는,
    스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  10. 제 9항에 있어서, 상기 제 1가산기는 상기 제 1 양자화된 벡터 및 상기 제 3 벡터간의 차(difference)에 기초하여 상기 양자화 에러를 계산하도록 구성된, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  11. 제 9항에 있어서, 상기 제 1가산기는 상기 제 1 양자화된 벡터 및 상기 제 1벡터의 적어도 일부분사이의 차(difference)에 기초하여 상기 양자화 에러를 계산하도록 구성되는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  12. 제 9항에 있어서, 상기 양자화 에러 및 스케일 인자의 곱(product)에 기초하여 스케일링된 양자화 에러를 계산하도록 구성된 곱셈기; 및
    상기 제 1벡터의 적어도 일부분 및 상기 제 2벡터의 대응 부분사이의 거리에 기초하여 상기 스케일 인자를 계산하도록 구성된 로직(logic)을 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  13. 제 12항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 라인 스펙트럼 주파수들을 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  14. 제 9항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 선형 예측 필터 계수들의 표현을 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  15. 제 9항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 라인 스펙트럼 주파수들을 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  16. 제 9항에 있어서, 무선 통신들을 위한 장치를 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  17. 제 9항에 있어서, 인터넷 프로토콜의 버전에 따라 다수의 패킷들을 전송하도록 구성된 장치를 더 포함하며;
    상기 다수의 패킷들은 상기 제 1 양자화 벡터를 기술하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  18. 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치로서,
    대응하는 제 1 및 제 2 벡터들을 생성하기 위하여 음성 신호의 제 1 프레임 및 제 2 프레임을 인코딩하기 위한 수단 ― 상기 제 1 벡터는 상기 제 1 프레임동안 상기 음성 신호의 스펙트럼 엔벨로프를 나타내며, 상기 제 2 벡터는 상기 제 2 프레임동안 상기 음성 신호의 스펙트럼 엔벨로프를 나타냄 ―;
    제 1 양자화된 벡터를 생성하기 위한 수단 ― 상기 생성수단은 상기 제 1 벡터의 적어도 일부분에 기초하는 제 3 벡터를 양자화하기 위한 수단을 포함함 ―;
    상기 제 1양자화된 벡터의 양자화 에러를 계산하기 위한 수단; 및
    제 4벡터를 계산하기 위한 수단 ― 상기 계산수단은 상기 제 2벡터의 적어도 일부분에 상기 양자화 에러의 스케일링된 버전을 가산하기 위한 수단을 포함함 ―을 포함하며;
    제 1양자화된 벡터를 생성하기 위한 상기 수단은 제 4벡터를 양자화하도록 구성되는,
    스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  19. 제 18항에 있어서, 상기 양자화 에러 계산수단은 상기 제 1 양자화된 벡터 및 상기 제 3 벡터간의 차(difference)에 기초하여 상기 양자화 에러를 계산하도록 구성되는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  20. 제 18항에 있어서, 상기 양자화 에러 계산수단은 상기 제 1 양자화된 벡터 및 상기 제 1벡터의 적어도 일부분사이의 차(difference)에 기초하여 상기 양자화 에러를 계산하도록 구성되는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  21. 제 18항에 있어서, 스케일링된 양자화 에러를 계산하기 위한 수단 ― 상기 계산수단은 상기 양자화 에러에 스케일 인자를 곱하기 위한 수단을 포함함 ―; 및
    상기 제 1벡터의 적어도 일부분 및 상기 제 2벡터의 대응 부분사이의 거리에 기초하여 상기 스케일 인자를 계산하도록 구성된 로직을 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  22. 제 21항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 라인 스펙트럼 주파수들을 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  23. 제 18항에 있어서, 무선 통신들을 위한 장치를 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  24. 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 명령들을 포함하는 컴퓨터 판독가능 매체로서,
    상기 명령들은 프로세서에서 실행할때 상기 프로세서가,
    대응하는 제 1 및 제 2 벡터들을 생성하기 위하여 음성 신호의 제 1 프레임 및 제 2 프레임을 인코딩하며 ― 상기 제 1 벡터는 상기 제 1 프레임동안 상기 음성 신호의 스펙트럼 엔벨로프(spectral envelope)를 나타내며, 상기 제 2 벡터는 상기 제 2 프레임동안 상기 음성 신호의 스펙트럼 엔벨로프를 나타냄 ―;
    제 1 양자화된 벡터를 생성하며 ― 상기 제 1 양자화된 벡터를 생성하는 것은 상기 제 1 벡터의 적어도 일부분에 기초하는 제 3 벡터를 양자화하는 것을 포함함 ―;
    상기 제 1양자화된 벡터의 양자화 에러를 계산하며;
    제 4벡터를 계산하며 ― 상기 제 4벡터를 계산하는 것은 상기 제 2벡터의 적어도 일부분에 상기 양자화 에러의 스케일링된 버전을 가산하는 것을 포함함 ―; 및
    상기 제 4벡터를 양자화하도록 하는,
    컴퓨터 판독가능 매체.
  25. 제 24항에 있어서, 프로세서가 양자화 에러를 계산하도록 하는 상기 명령들은 상기 제 1 양자화된 벡터 및 상기 제 3벡터사이의 차(difference)를 계산하기 위한 명령들을 포함하는, 컴퓨터 판독가능 매체.
  26. 제 24항에 있어서, 프로세서가 양자화 에러를 계산하도록 하는 상기 명령들은 상기 제 1 양자화된 벡터 및 상기 제 1벡터중 적어도 일부분사이의 차(difference)를 계산하기 위한 명령들을 포함하는, 컴퓨터 판독가능 매체.
  27. 제 24항에 있어서, 프로세서가 스케일링된 양자화 에러를 계산하도록 하는 상기 명령들은 상기 양자화 에러에 스케일 인자를 곱하기 위한 명령들을 포함하며;
    상기 스케일 인자는 상기 제 1벡터의 적어도 일부분 및 상기 제 2벡터의 대응 부분사이의 거리에 기초하는, 컴퓨터 판독가능 매체.
  28. 제 27항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 라인 스펙트럼 주파수들을 포함하는, 컴퓨터 판독가능 매체.
  29. 제 24항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 다수의 선형 예측 필터 계수들의 표현(representation)을 포함하는, 컴퓨터 판독가능 매체.
  30. 제 24항에 있어서, 상기 제 2프레임은 상기 음성 신호에서 상기 제 1 프레임을 바로 뒤따르는, 컴퓨터 판독가능 매체.
  31. 제 24항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 적응적으로 평활화된(adaptively smoothed) 스펙트럼 엔벨로프를 나타내는, 컴퓨터 판독가능 매체.
  32. 제 1항에 있어서, 상기 제 4벡터를 역양자화하는 단계; 및
    역양자화된 상기 제 4 벡터에 기초하여 여기 신호(excitation signal)를 계산하는 단계를 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  33. 제 1항에 있어서, 협대역(narrowband) 음성 신호 및 고대역(highband) 음성 신호를 획득하기 위하여 광대역(wideband) 음성 신호를 필터링하는 단계를 더 포함하며;
    상기 제 1 벡터는 상기 제 1 프레임동안 상기 협대역 음성 신호의 스펙트럼 엔벨로프를 나타내며;
    상기 제 2벡터는 상기 제 2프레임동안 상기 협대역 음성 신호의 스펙트럼 엔벨로프를 나타내는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  34. 제 1항에 있어서, 협대역 음성 신호 및 고대역 음성 신호를 획득하기 위하여 광대역 음성 신호를 필터링하는 단계를 더 포함하며;
    상기 제 1 벡터는 상기 제 1 프레임동안 상기 고대역 음성 신호의 스펙트럼 엔벨로프를 나타내며;
    상기 제 2 벡터는 상기 제 2 프레임동안 상기 고대역 음성 신호의 스펙트럼 엔벨로프를 나타내는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  35. 제 1항에 있어서, 협대역 음성신호 및 고대역 음성신호를 획득하기 위하여 광대역 음성 신호를 필터링하는 단계 ― (A) 상기 제 1 벡터는 상기 제 1 프레임동안 상기 협대역 음성신호의 스펙트럼 엔벨로프를 나타내며, (B) 상기 제 2 벡터는 상기 제 2 프레임동안 상기 협대역 음성신호의 스펙트럼 엔벨로프를 나타냄―;
    상기 제 4 벡터를 역양자화하는 단계;
    역양자화된 상기 제 4 벡터에 기초하여, 상기 협대역 음성신호에 대한 여기 신호를 계산하는 단계; 및
    상기 협대역 음성신호에 대한 여기 신호에 기초하여, 상기 고대역 음성 신호에 대한 여기 신호를 유도하는 단계를 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  36. 제 1항에 있어서, 제 4 벡터를 양자화하는 상기 단계는 상기 제 4벡터의 분할 벡터 양자화(split vector quantization)를 수행하는 단계를 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법.
  37. 제 9항에 있어서, 상기 제 2프레임은 상기 음성 신호에서 상기 제 1 프레임을 바로 뒤따르는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  38. 제 9항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 적응적으로 평활화된 스펙트럼 엔벨로프를 나타내는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  39. 제 9항에 있어서, 상기 제 4벡터를 역양자화하도록 구성된 역 양자화기; 및
    역양자화된 상기 제 4벡터에 기초하여 여기 신호를 계산하도록 구성된 화이트닝 필터(whitening filter)를 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  40. 제 9항에 있어서, 협대역 음성 신호 및 고대역 음성 신호를 획득하기 위하여 광대역 음성 신호를 필터링하도록 구성된 필터 뱅크(filter bank)를 더 포함하며;
    상기 제 1 벡터는 상기 제 1 프레임동안 상기 협대역 음성 신호의 스펙트럼 엔벨로프를 나타내며;
    상기 제 2벡터는 상기 제 2프레임동안 상기 협대역 음성 신호의 스펙트럼 엔벨로프를 나타내는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  41. 제 9항에 있어서, 협대역 음성 신호 및 고대역 음성신호를 획득하기 위하여 광대역 음성신호를 필터링하도록 구성된 필터 뱅크를 더 포함하며;
    상기 제 1 벡터는 상기 제 1 프레임동안 상기 고대역 음성 신호의 스펙트럼 엔벨로프를 나타내며;
    상기 제 2 벡터는 상기 제 2 프레임동안 상기 고대역 음성 신호의 스펙트럼 엔벨로프를 나타내는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  42. 제 9항에 있어서, 협대역 음성신호 및 고대역 음성신호를 획득하기 위하여 광대역 음성 신호를 필터링하도록 구성된 필터 뱅크 ― (A) 상기 제 1 벡터는 상기 제 1 프레임동안 상기 협대역 음성신호의 스펙트럼 엔벨로프를 나타내며, (B) 상기 제 2 벡터는 상기 제 2 프레임동안 상기 협대역 음성신호의 스펙트럼 엔벨로프를 나타냄―;
    상기 제 4 벡터를 역양자화하도록 구성된 역양자화기;
    역양자화된 상기 제 4 벡터에 기초하여, 상기 협대역 음성신호에 대한 여기 신호를 계산하도록 구성된 화이트닝 필터(whitening filter); 및
    상기 협대역 음성신호에 대한 여기 신호에 기초하여, 상기 고대역 음성 신호에 대한 여기 신호를 유도하도록 구성된 고대역 인코더를 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  43. 제 9항에 있어서, 상기 양자화기는 상기 제 4 벡터의 분할 벡터 양자화를 수행함으로써 상기 제 4 벡터를 양자화하도록 구성되는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  44. 제 18항에 있어서, 상기 제 2 프레임은 상기 음성 신호에서 상기 제 1 프레임을 바로 뒤따르는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  45. 제 18항에 있어서, 상기 각각의 제 1 및 제 2 벡터는 적응적으로 평활화된 스펙트럼 엔벨로프를 나타내는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  46. 제 18항에 있어서, 상기 제 4 벡터를 역양자화하기 위한 수단; 및
    역양자화된 상기 제 4 벡터에 기초하여 여기 신호를 계산하기 위한 수단을 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  47. 제 18항에 있어서, 협대역 음성 신호 및 고대역 음성 신호를 획득하기 위하여 광대역 음성신호를 필터링하기 위한 수단을 더 포함하며;
    상기 제 1 벡터는 상기 제 1 프레임동안 상기 협대역 음성 신호의 스펙트럼 엔벨로프를 나타내며;
    상기 제 2 벡터는 상기 제 2 프레임동안 상기 협대역 음성 신호의 스펙트럼 엔벨로프를 나타내는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  48. 제 18항에 있어서, 협대역 음성 신호 및 고대역 음성신호를 획득하기 위하여 광대역 음성 신호를 필터링하기 위한 수단을 더 포함하며;
    상기 제 1 벡터는 상기 제 1 프레임동안 상기 고대역 음성 신호의 스펙트럼 엔벨로프를 나타내며;
    상기 제 2 벡터는 상기 제 2 프레임동안 상기 고대역 음성 신호의 스펙트럼 엔벨로프를 나타내는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  49. 제 18항에 있어서, 협대역 음성신호 및 고대역 음성신호를 획득하기 위하여 광대역 음성 신호를 필터링하기 위한 수단 ― (A) 상기 제 1 벡터는 상기 제 1 프레임동안 상기 협대역 음성신호의 스펙트럼 엔벨로프를 나타내며, (B) 상기 제 2 벡터는 상기 제 2 프레임동안 상기 협대역 음성신호의 스펙트럼 엔벨로프를 나타냄―;
    상기 제 4 벡터를 역양자화하기 위한 수단;
    역양자화된 상기 제 4 벡터에 기초하여, 상기 협대역 음성신호에 대한 여기 신호를 계산하기 위한 수단; 및
    상기 협대역 음성신호에 대한 여기 신호에 기초하여, 상기 고대역 음성 신호에 대한 여기 신호를 유도하기 위한 수단을 더 포함하는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
  50. 제 18항에 있어서, 제 1 양자화된 벡터를 생성하기 위한 상기 수단은 상기 제 4 벡터의 분할 벡터 양자화를 수행함으로써 상기 제 4 벡터를 양자화하도록 구성되는, 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 장치.
KR1020077025400A 2005-04-01 2006-04-03 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 KR100956877B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US66790105P 2005-04-01 2005-04-01
US60/667,901 2005-04-01
US67396505P 2005-04-22 2005-04-22
US60/673,965 2005-04-22

Publications (2)

Publication Number Publication Date
KR20070118170A KR20070118170A (ko) 2007-12-13
KR100956877B1 true KR100956877B1 (ko) 2010-05-11

Family

ID=36588741

Family Applications (8)

Application Number Title Priority Date Filing Date
KR1020077025421A KR100956524B1 (ko) 2005-04-01 2006-04-03 스피치 신호의 고대역 부분을 인코딩 및 디코딩하는 방법및 장치
KR1020077025255A KR100956624B1 (ko) 2005-04-01 2006-04-03 고대역 버스트 억제를 위한 시스템, 방법, 및 장치
KR1020077025447A KR101019940B1 (ko) 2005-04-01 2006-04-03 대역폭 확장 스피치 예측 여기 신호의 반-희박성 필터링을위한 방법 및 장치
KR1020077025432A KR100956525B1 (ko) 2005-04-01 2006-04-03 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치
KR1020077025290A KR100956876B1 (ko) 2005-04-01 2006-04-03 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들
KR1020077025293A KR100982638B1 (ko) 2005-04-01 2006-04-03 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들
KR1020077025422A KR100956523B1 (ko) 2005-04-01 2006-04-03 광대역 스피치 코딩을 위한 시스템, 방법, 및 장치
KR1020077025400A KR100956877B1 (ko) 2005-04-01 2006-04-03 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치

Family Applications Before (7)

Application Number Title Priority Date Filing Date
KR1020077025421A KR100956524B1 (ko) 2005-04-01 2006-04-03 스피치 신호의 고대역 부분을 인코딩 및 디코딩하는 방법및 장치
KR1020077025255A KR100956624B1 (ko) 2005-04-01 2006-04-03 고대역 버스트 억제를 위한 시스템, 방법, 및 장치
KR1020077025447A KR101019940B1 (ko) 2005-04-01 2006-04-03 대역폭 확장 스피치 예측 여기 신호의 반-희박성 필터링을위한 방법 및 장치
KR1020077025432A KR100956525B1 (ko) 2005-04-01 2006-04-03 스피치 신호의 스플릿 대역 인코딩을 위한 방법 및 장치
KR1020077025290A KR100956876B1 (ko) 2005-04-01 2006-04-03 고대역 여기 생성을 위한 시스템들, 방법들, 및 장치들
KR1020077025293A KR100982638B1 (ko) 2005-04-01 2006-04-03 고대역 시간 왜곡을 위한 시스템들, 방법들, 및 장치들
KR1020077025422A KR100956523B1 (ko) 2005-04-01 2006-04-03 광대역 스피치 코딩을 위한 시스템, 방법, 및 장치

Country Status (24)

Country Link
US (8) US8484036B2 (ko)
EP (8) EP1866914B1 (ko)
JP (8) JP4955649B2 (ko)
KR (8) KR100956524B1 (ko)
CN (1) CN102411935B (ko)
AT (4) ATE492016T1 (ko)
AU (8) AU2006232363B2 (ko)
BR (8) BRPI0608305B1 (ko)
CA (8) CA2603187C (ko)
DE (4) DE602006012637D1 (ko)
DK (2) DK1864101T3 (ko)
ES (3) ES2340608T3 (ko)
HK (5) HK1113848A1 (ko)
IL (8) IL186442A (ko)
MX (8) MX2007012185A (ko)
NO (7) NO20075510L (ko)
NZ (6) NZ562182A (ko)
PL (4) PL1869673T3 (ko)
PT (2) PT1864101E (ko)
RU (9) RU2402826C2 (ko)
SG (4) SG163556A1 (ko)
SI (1) SI1864282T1 (ko)
TW (8) TWI320923B (ko)
WO (8) WO2006107833A1 (ko)

Families Citing this family (322)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987095B2 (en) * 2002-09-27 2011-07-26 Broadcom Corporation Method and system for dual mode subband acoustic echo canceller with integrated noise suppression
US7619995B1 (en) * 2003-07-18 2009-11-17 Nortel Networks Limited Transcoders and mixers for voice-over-IP conferencing
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
EP1775717B1 (en) * 2004-07-20 2013-09-11 Panasonic Corporation Speech decoding apparatus and compensation frame generation method
MY149811A (en) * 2004-08-30 2013-10-14 Qualcomm Inc Method and apparatus for an adaptive de-jitter buffer
US8085678B2 (en) * 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
WO2006103488A1 (en) * 2005-03-30 2006-10-05 Nokia Corporation Source coding and/or decoding
WO2006107833A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) * 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
ATE435481T1 (de) * 2005-04-28 2009-07-15 Siemens Ag Verfahren und vorrichtung zur geräuschunterdrückung
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
WO2007007253A1 (en) * 2005-07-14 2007-01-18 Koninklijke Philips Electronics N.V. Audio signal synthesis
US8169890B2 (en) * 2005-07-20 2012-05-01 Qualcomm Incorporated Systems and method for high data rate ultra wideband communication
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
US8326614B2 (en) * 2005-09-02 2012-12-04 Qnx Software Systems Limited Speech enhancement system
BRPI0616624A2 (pt) * 2005-09-30 2011-06-28 Matsushita Electric Ind Co Ltd aparelho de codificação de fala e método de codificação de fala
CN102623014A (zh) * 2005-10-14 2012-08-01 松下电器产业株式会社 变换编码装置和变换编码方法
US7991611B2 (en) * 2005-10-14 2011-08-02 Panasonic Corporation Speech encoding apparatus and speech encoding method that encode speech signals in a scalable manner, and speech decoding apparatus and speech decoding method that decode scalable encoded signals
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8532984B2 (en) 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
DE602007014059D1 (de) 2006-08-15 2011-06-01 Broadcom Corp Zeitverschiebung eines dekodierten audiosignals nach einem paketverlust
US8706507B2 (en) 2006-08-15 2014-04-22 Dolby Laboratories Licensing Corporation Arbitrary shaping of temporal noise envelope without side-information utilizing unchanged quantization
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8046218B2 (en) * 2006-09-19 2011-10-25 The Board Of Trustees Of The University Of Illinois Speech and method for identifying perceptual features
JP4972742B2 (ja) * 2006-10-17 2012-07-11 国立大学法人九州工業大学 高域信号補間方法及び高域信号補間装置
EP4325724A3 (en) 2006-10-25 2024-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values
KR101375582B1 (ko) 2006-11-17 2014-03-20 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US8639500B2 (en) * 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
GB2444757B (en) * 2006-12-13 2009-04-22 Motorola Inc Code excited linear prediction speech coding
US20080147389A1 (en) * 2006-12-15 2008-06-19 Motorola, Inc. Method and Apparatus for Robust Speech Activity Detection
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101379263B1 (ko) * 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
US7873064B1 (en) * 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
US8032359B2 (en) 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
GB0704622D0 (en) * 2007-03-09 2007-04-18 Skype Ltd Speech coding system and method
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
DK3401907T3 (da) 2007-08-27 2020-03-02 Ericsson Telefon Ab L M Fremgangsmåde og indretning til perceptuel spektral afkodning af et audiosignal omfattende udfyldning af spektrale huller
FR2920545B1 (fr) * 2007-09-03 2011-06-10 Univ Sud Toulon Var Procede de trajectographie de plusieurs cetaces par acoustique passive
JP5547081B2 (ja) * 2007-11-02 2014-07-09 華為技術有限公司 音声復号化方法及び装置
BRPI0722269A2 (pt) * 2007-11-06 2014-04-22 Nokia Corp Encodificador para encodificar um sinal de áudio, método para encodificar um sinal de áudio; decodificador para decodificar um sinal de áudio; método para decodificar um sinal de áudio; aparelho; dispositivo eletrônico; produto de programa de comoputador configurado para realizar um método para encodificar e para decodificar um sinal de áudio
US20100250260A1 (en) * 2007-11-06 2010-09-30 Lasse Laaksonen Encoder
US20100274555A1 (en) * 2007-11-06 2010-10-28 Lasse Laaksonen Audio Coding Apparatus and Method Thereof
KR101444099B1 (ko) * 2007-11-13 2014-09-26 삼성전자주식회사 음성 구간 검출 방법 및 장치
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
US8050934B2 (en) * 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
TWI356399B (en) * 2007-12-14 2012-01-11 Ind Tech Res Inst Speech recognition system and method with cepstral
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
KR101413967B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
EP2255534B1 (en) * 2008-03-20 2017-12-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding using bandwidth extension in portable terminal
WO2010003068A1 (en) * 2008-07-03 2010-01-07 The Board Of Trustees Of The University Of Illinois Systems and methods for identifying speech sound features
CA2729751C (en) * 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
ES2372014T3 (es) * 2008-07-11 2012-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para calcular datos de ampliación de ancho de banda utilizando un encuadre controlado por pendiente espectral.
CN103000186B (zh) 2008-07-11 2015-01-14 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2010011963A1 (en) * 2008-07-25 2010-01-28 The Board Of Trustees Of The University Of Illinois Methods and systems for identifying speech sounds using multi-dimensional analysis
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
WO2010028297A1 (en) 2008-09-06 2010-03-11 GH Innovation, Inc. Selective bandwidth extension
US8532983B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Adaptive frequency prediction for encoding or decoding an audio signal
US8515747B2 (en) * 2008-09-06 2013-08-20 Huawei Technologies Co., Ltd. Spectrum harmonic/noise sharpness control
US8407046B2 (en) * 2008-09-06 2013-03-26 Huawei Technologies Co., Ltd. Noise-feedback for spectral envelope quantization
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US20100070550A1 (en) * 2008-09-12 2010-03-18 Cardinal Health 209 Inc. Method and apparatus of a sensor amplifier configured for use in medical applications
KR101178801B1 (ko) * 2008-12-09 2012-08-31 한국전자통신연구원 음원분리 및 음원식별을 이용한 음성인식 장치 및 방법
WO2010031003A1 (en) * 2008-09-15 2010-03-18 Huawei Technologies Co., Ltd. Adding second enhancement layer to celp based core layer
US8577673B2 (en) * 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
EP2224433B1 (en) * 2008-09-25 2020-05-27 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
EP2182513B1 (en) * 2008-11-04 2013-03-20 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
DE102008058496B4 (de) * 2008-11-21 2010-09-09 Siemens Medical Instruments Pte. Ltd. Filterbanksystem mit spezifischen Sperrdämpfungsanteilen für eine Hörvorrichtung
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) * 2009-01-06 2013-11-13 Skype Speech coding
AU2010205583B2 (en) 2009-01-16 2013-02-07 Dolby International Ab Cross product enhanced harmonic transposition
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
WO2010111876A1 (zh) * 2009-03-31 2010-10-07 华为技术有限公司 一种信号去噪的方法和装置及音频解码系统
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8805680B2 (en) * 2009-05-19 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using layered sinusoidal pulse coding
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
US8000485B2 (en) * 2009-06-01 2011-08-16 Dts, Inc. Virtual audio processing for loudspeaker or headphone playback
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
WO2011029484A1 (en) * 2009-09-14 2011-03-17 Nokia Corporation Signal enhancement processing
US9595257B2 (en) * 2009-09-28 2017-03-14 Nuance Communications, Inc. Downsampling schemes in a hierarchical neural network structure for phoneme recognition
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
WO2011048099A1 (en) 2009-10-20 2011-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule
PL2800094T3 (pl) * 2009-10-21 2018-03-30 Dolby International Ab Nadpróbkowanie w banku filtrów z połączonym modułem transpozycji
WO2011048792A1 (ja) * 2009-10-21 2011-04-28 パナソニック株式会社 音響信号処理装置、音響符号化装置および音響復号装置
US8484020B2 (en) 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
EP2502230B1 (en) * 2009-11-19 2014-05-21 Telefonaktiebolaget L M Ericsson (PUBL) Improved excitation signal bandwidth extension
CN102612712B (zh) * 2009-11-19 2014-03-12 瑞典爱立信有限公司 低频带音频信号的带宽扩展
US8489393B2 (en) * 2009-11-23 2013-07-16 Cambridge Silicon Radio Limited Speech intelligibility
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
RU2464651C2 (ru) * 2009-12-22 2012-10-20 Общество с ограниченной ответственностью "Спирит Корп" Способ и устройство многоуровневого масштабируемого устойчивого к информационным потерям кодирования речи для сетей с коммутацией пакетов
US8559749B2 (en) * 2010-01-06 2013-10-15 Streaming Appliances, Llc Audiovisual content delivery system
US8326607B2 (en) * 2010-01-11 2012-12-04 Sony Ericsson Mobile Communications Ab Method and arrangement for enhancing speech quality
KR101336051B1 (ko) 2010-01-12 2013-12-04 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 인코더, 오디오 디코더, 오디오 정보 인코딩 방법, 오디오 정보 디코딩 방법, 및 수치적 이전 콘텍스트 값의 수치 표현의 수정을 이용하는 컴퓨터 프로그램
US8699727B2 (en) 2010-01-15 2014-04-15 Apple Inc. Visually-assisted mixing of audio using a spectral analyzer
US9525569B2 (en) * 2010-03-03 2016-12-20 Skype Enhanced circuit-switched calls
MX2012010469A (es) * 2010-03-10 2012-12-10 Dolby Int Ab Decodificador de señales de audio, codificador de señales de audio, metodos y programa de computacion que utiliza tasa de muestreo dependiente de la codificacion del contorno de distorsion en el tiempo.
US8700391B1 (en) * 2010-04-01 2014-04-15 Audience, Inc. Low complexity bandwidth expansion of speech
CN102870156B (zh) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 音频通信设备、输出音频信号的方法和通信系统
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
MX2012011802A (es) * 2010-04-13 2013-02-26 Fraunhofer Ges Forschung Metodo y codificador y descodificador para la presentacion precisa de muestra de una señal de audio.
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
CN102844810B (zh) * 2010-04-14 2017-05-03 沃伊斯亚吉公司 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
MX2012011828A (es) * 2010-04-16 2013-02-27 Fraunhofer Ges Forschung Aparato, metodo y programa de computadora para generar una señal de banda amplia que utiliza extension de ancho de banda guiada y extension oculta de ancho de banda.
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
KR101660843B1 (ko) * 2010-05-27 2016-09-29 삼성전자주식회사 Lpc 계수 양자화를 위한 가중치 함수 결정 장치 및 방법
US8600737B2 (en) * 2010-06-01 2013-12-03 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for wideband speech coding
ES2372202B2 (es) * 2010-06-29 2012-08-08 Universidad De Málaga Sistema de reconocimiento de sonidos de bajo consumo.
PL3079152T3 (pl) 2010-07-02 2018-10-31 Dolby International Ab Dekodowanie audio z selektywnym późniejszym filtrowaniem
US8447596B2 (en) 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
JP5589631B2 (ja) * 2010-07-15 2014-09-17 富士通株式会社 音声処理装置、音声処理方法および電話装置
WO2012008891A1 (en) * 2010-07-16 2012-01-19 Telefonaktiebolaget L M Ericsson (Publ) Audio encoder and decoder and methods for encoding and decoding an audio signal
JP5777041B2 (ja) * 2010-07-23 2015-09-09 沖電気工業株式会社 帯域拡張装置及びプログラム、並びに、音声通信装置
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US20130310422A1 (en) 2010-09-01 2013-11-21 The General Hospital Corporation Reversal of general anesthesia by administration of methylphenidate, amphetamine, modafinil, amantadine, and/or caffeine
KR101744621B1 (ko) 2010-09-16 2017-06-09 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US8924200B2 (en) 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
WO2012053149A1 (ja) * 2010-10-22 2012-04-26 パナソニック株式会社 音声分析装置、量子化装置、逆量子化装置、及びこれらの方法
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
PT3239978T (pt) 2011-02-14 2019-04-02 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
MX2013009303A (es) 2011-02-14 2013-09-13 Fraunhofer Ges Forschung Codec de audio utilizando sintesis de ruido durante fases inactivas.
RU2630390C2 (ru) 2011-02-14 2017-09-07 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для маскирования ошибок при стандартизированном кодировании речи и аудио с низкой задержкой (usac)
AR085222A1 (es) 2011-02-14 2013-09-18 Fraunhofer Ges Forschung Representacion de señal de informacion utilizando transformada superpuesta
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
MY167776A (en) * 2011-02-14 2018-09-24 Fraunhofer Ges Forschung Noise generation in audio codecs
KR101699898B1 (ko) 2011-02-14 2017-01-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 스펙트럼 영역에서 디코딩된 오디오 신호를 처리하기 위한 방법 및 장치
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
RU2562771C2 (ru) * 2011-02-16 2015-09-10 Долби Лабораторис Лайсэнзин Корпорейшн Способы и системы генерирования коэффициентов фильтра и конфигурирования фильтров
DK3998607T3 (da) * 2011-02-18 2024-04-15 Ntt Docomo Inc Taleafkoder
US9165558B2 (en) 2011-03-09 2015-10-20 Dts Llc System for dynamically creating and rendering audio objects
JP5704397B2 (ja) * 2011-03-31 2015-04-22 ソニー株式会社 符号化装置および方法、並びにプログラム
US9298287B2 (en) 2011-03-31 2016-03-29 Microsoft Technology Licensing, Llc Combined activation for natural user interface systems
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
CN102811034A (zh) 2011-05-31 2012-12-05 财团法人工业技术研究院 信号处理装置及信号处理方法
US9264094B2 (en) * 2011-06-09 2016-02-16 Panasonic Intellectual Property Corporation Of America Voice coding device, voice decoding device, voice coding method and voice decoding method
US9070361B2 (en) 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
BR112013033900B1 (pt) 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
US9059786B2 (en) * 2011-07-07 2015-06-16 Vecima Networks Inc. Ingress suppression for communication systems
JP5942358B2 (ja) * 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
RU2486636C1 (ru) * 2011-11-14 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2486637C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486638C1 (ru) * 2011-11-15 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации высокочастотных сигналов и устройство его реализации
RU2496222C2 (ru) * 2011-11-17 2013-10-20 Федеральное государственное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2486639C1 (ru) * 2011-11-21 2013-06-27 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2496192C2 (ru) * 2011-11-21 2013-10-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ генерации и частотной модуляции высокочастотных сигналов и устройство его реализации
RU2490727C2 (ru) * 2011-11-28 2013-08-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Уральский государственный университет путей сообщения" (УрГУПС) Способ передачи речевых сигналов (варианты)
RU2487443C1 (ru) * 2011-11-29 2013-07-10 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ согласования комплексных сопротивлений и устройство его реализации
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
US9972325B2 (en) * 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9082398B2 (en) * 2012-02-28 2015-07-14 Huawei Technologies Co., Ltd. System and method for post excitation enhancement for low bit rate speech coding
US9437213B2 (en) * 2012-03-05 2016-09-06 Malaspina Labs (Barbados) Inc. Voice signal enhancement
ES2762325T3 (es) 2012-03-21 2020-05-22 Samsung Electronics Co Ltd Procedimiento y aparato de codificación/decodificación de frecuencia alta para extensión de ancho de banda
FI3547261T3 (fi) 2012-03-29 2023-09-26 Ericsson Telefon Ab L M Vektorikvantisoija
US10448161B2 (en) 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
KR101343768B1 (ko) * 2012-04-19 2014-01-16 충북대학교 산학협력단 스펙트럼 변화 패턴을 이용한 음성 및 오디오 신호 분류방법
RU2504898C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
RU2504894C1 (ru) * 2012-05-17 2014-01-20 Федеральное государственное военное образовательное учреждение высшего профессионального образования "Военный авиационный инженерный университет" (г. Воронеж) Министерства обороны Российской Федерации Способ демодуляции фазомодулированных и частотно-модулированных сигналов и устройство его реализации
US20140006017A1 (en) * 2012-06-29 2014-01-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
DK2891151T3 (en) * 2012-08-31 2016-12-12 ERICSSON TELEFON AB L M (publ) Method and device for detection of voice activity
EP2898506B1 (en) 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014062859A1 (en) * 2012-10-16 2014-04-24 Audiologicall, Ltd. Audio signal manipulation for speech enhancement before sound reproduction
KR101413969B1 (ko) 2012-12-20 2014-07-08 삼성전자주식회사 오디오 신호의 복호화 방법 및 장치
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
PL3054446T3 (pl) * 2013-01-29 2024-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób dostarczania kodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i kodowana reprezentacja, stosujące adaptacyjne względem sygnału rozszerzenie szerokości pasma
RU2618919C2 (ru) * 2013-01-29 2017-05-12 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для синтезирования аудиосигнала, декодер, кодер, система и компьютерная программа
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
US20140213909A1 (en) * 2013-01-31 2014-07-31 Xerox Corporation Control-based inversion for estimating a biological parameter vector for a biophysics model from diffused reflectance data
US9711156B2 (en) 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
US9741350B2 (en) * 2013-02-08 2017-08-22 Qualcomm Incorporated Systems and methods of performing gain control
US9601125B2 (en) * 2013-02-08 2017-03-21 Qualcomm Incorporated Systems and methods of performing noise modulation and gain adjustment
US9336789B2 (en) * 2013-02-21 2016-05-10 Qualcomm Incorporated Systems and methods for determining an interpolation factor set for synthesizing a speech signal
US9715885B2 (en) * 2013-03-05 2017-07-25 Nec Corporation Signal processing apparatus, signal processing method, and signal processing program
EP2784775B1 (en) * 2013-03-27 2016-09-14 Binauric SE Speech signal encoding/decoding method and apparatus
CA3029033C (en) 2013-04-05 2021-03-30 Dolby International Ab Audio encoder and decoder
CN105264600B (zh) 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
CN117253498A (zh) * 2013-04-05 2023-12-19 杜比国际公司 音频信号的解码方法和解码器、介质以及编码方法
RU2665253C2 (ru) * 2013-06-21 2018-08-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для улучшенного маскирования адаптивной таблицы кодирования при acelp-образном маскировании с использованием улучшенной оценки запаздывания основного тона
BR112015031605B1 (pt) 2013-06-21 2022-03-29 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de áudio tendo um módulo de extensão de largura de banda com um módulo de ajuste de energia
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3014290A4 (en) 2013-06-27 2017-03-08 The General Hospital Corporation Systems and methods for tracking non-stationary spectral structure and dynamics in physiological data
WO2014210527A1 (en) * 2013-06-28 2014-12-31 The General Hospital Corporation System and method to infer brain state during burst suppression
CN104282308B (zh) 2013-07-04 2017-07-14 华为技术有限公司 频域包络的矢量量化方法和装置
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
EP2830054A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
EP3503095A1 (en) 2013-08-28 2019-06-26 Dolby Laboratories Licensing Corp. Hybrid waveform-coded and parametric-coded speech enhancement
TWI557726B (zh) * 2013-08-29 2016-11-11 杜比國際公司 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法
EP4166072A1 (en) 2013-09-13 2023-04-19 The General Hospital Corporation Systems and methods for improved brain monitoring during general anesthesia and sedation
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
CN108172239B (zh) * 2013-09-26 2021-01-12 华为技术有限公司 频带扩展的方法及装置
CN104517611B (zh) 2013-09-26 2016-05-25 华为技术有限公司 一种高频激励信号预测方法及装置
US9224402B2 (en) 2013-09-30 2015-12-29 International Business Machines Corporation Wideband speech parameterization for high quality synthesis, transformation and quantization
US9620134B2 (en) * 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) * 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
KR102271852B1 (ko) 2013-11-02 2021-07-01 삼성전자주식회사 광대역 신호 생성방법 및 장치와 이를 채용하는 기기
EP2871641A1 (en) * 2013-11-12 2015-05-13 Dialog Semiconductor B.V. Enhancement of narrowband audio signals using a single sideband AM modulation
CN105765655A (zh) 2013-11-22 2016-07-13 高通股份有限公司 高频带译码中的选择性相位补偿
US10163447B2 (en) * 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
CN103714822B (zh) * 2013-12-27 2017-01-11 广州华多网络科技有限公司 基于silk编解码器的子带编解码方法及装置
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9564141B2 (en) 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP6281336B2 (ja) * 2014-03-12 2018-02-21 沖電気工業株式会社 音声復号化装置及びプログラム
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
RU2689181C2 (ru) * 2014-03-31 2019-05-24 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер, способ кодирования, способ декодирования и программа
US9697843B2 (en) * 2014-04-30 2017-07-04 Qualcomm Incorporated High band excitation signal generation
CN105336336B (zh) 2014-06-12 2016-12-28 华为技术有限公司 一种音频信号的时域包络处理方法及装置、编码器
CN107424622B (zh) 2014-06-24 2020-12-25 华为技术有限公司 音频编码方法和装置
US9583115B2 (en) * 2014-06-26 2017-02-28 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
US9984699B2 (en) * 2014-06-26 2018-05-29 Qualcomm Incorporated High-band signal coding using mismatched frequency ranges
CN106486129B (zh) * 2014-06-27 2019-10-25 华为技术有限公司 一种音频编码方法和装置
US9721584B2 (en) * 2014-07-14 2017-08-01 Intel IP Corporation Wind noise reduction for audio reception
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
WO2016024853A1 (ko) * 2014-08-15 2016-02-18 삼성전자 주식회사 음질 향상 방법 및 장치, 음성 복호화방법 및 장치와 이를 채용한 멀티미디어 기기
CN104217730B (zh) * 2014-08-18 2017-07-21 大连理工大学 一种基于k‑svd的人工语音带宽扩展方法及装置
US9978388B2 (en) 2014-09-12 2018-05-22 Knowles Electronics, Llc Systems and methods for restoration of speech components
TWI550945B (zh) * 2014-12-22 2016-09-21 國立彰化師範大學 具有急遽過渡帶的複合濾波器之設計方法及其串聯式複合濾波器
US9595269B2 (en) * 2015-01-19 2017-03-14 Qualcomm Incorporated Scaling for gain shape circuitry
DE112016000545B4 (de) 2015-01-30 2019-08-22 Knowles Electronics, Llc Kontextabhängiges schalten von mikrofonen
ES2837107T3 (es) 2015-02-26 2021-06-29 Fraunhofer Ges Forschung Aparato y método para procesar una señal de audio para obtener una señal de audio procesada usando una envolvente en el dominio del tiempo objetivo
US10847170B2 (en) * 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
US9830921B2 (en) * 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
NO20151400A1 (en) 2015-10-15 2017-01-23 St Tech As A system for isolating an object
WO2017064264A1 (en) * 2015-10-15 2017-04-20 Huawei Technologies Co., Ltd. Method and appratus for sinusoidal encoding and decoding
MX371223B (es) 2016-02-17 2020-01-09 Fraunhofer Ges Forschung Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios.
FR3049084B1 (fr) 2016-03-15 2022-11-11 Fraunhofer Ges Forschung Dispositif de codage pour le traitement d'un signal d'entree et dispositif de decodage pour le traitement d'un signal code
ES2808997T3 (es) * 2016-04-12 2021-03-02 Fraunhofer Ges Forschung Codificador de audio para codificar una señal de audio, método para codificar una señal de audio y programa informático en consideración de una región espectral del pico detectada en una banda de frecuencia superior
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
CN109416913B (zh) * 2016-05-10 2024-03-15 易默森服务有限责任公司 自适应音频编解码系统、方法、装置及介质
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
US10264116B2 (en) * 2016-11-02 2019-04-16 Nokia Technologies Oy Virtual duplex operation
KR102507383B1 (ko) * 2016-11-08 2023-03-08 한국전자통신연구원 직사각형 윈도우를 이용한 스테레오 정합 방법 및 스테레오 정합 시스템
US10786168B2 (en) 2016-11-29 2020-09-29 The General Hospital Corporation Systems and methods for analyzing electrophysiological data from patients undergoing medical treatments
ES2950009T3 (es) 2017-01-06 2023-10-04 Ericsson Telefon Ab L M Métodos y aparatos para señalizar y determinar desplazamientos de señal de referencia
KR20180092582A (ko) * 2017-02-10 2018-08-20 삼성전자주식회사 Wfst 디코딩 시스템, 이를 포함하는 음성 인식 시스템 및 wfst 데이터 저장 방법
US10553222B2 (en) * 2017-03-09 2020-02-04 Qualcomm Incorporated Inter-channel bandwidth extension spectral mapping and adjustment
US10304468B2 (en) * 2017-03-20 2019-05-28 Qualcomm Incorporated Target sample generation
TW202341126A (zh) * 2017-03-23 2023-10-16 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications
JP7057428B2 (ja) * 2017-10-27 2022-04-19 テラウェーブ,エルエルシー 符号化正弦波形を使用する高スペクトル効率データ通信システムの受信器
US11876659B2 (en) 2017-10-27 2024-01-16 Terawave, Llc Communication system using shape-shifted sinusoidal waveforms
CN109729553B (zh) * 2017-10-30 2021-12-28 成都鼎桥通信技术有限公司 Lte集群通信系统的语音业务处理方法及设备
EP3483883A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483880A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
US10460749B1 (en) * 2018-06-28 2019-10-29 Nuvoton Technology Corporation Voice activity detection using vocal tract area information
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
JP7088403B2 (ja) * 2019-02-20 2022-06-21 ヤマハ株式会社 音信号生成方法、生成モデルの訓練方法、音信号生成システムおよびプログラム
CN110610713B (zh) * 2019-08-28 2021-11-16 南京梧桐微电子科技有限公司 一种声码器余量谱幅度参数重构方法及系统
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
TWI723545B (zh) * 2019-09-17 2021-04-01 宏碁股份有限公司 語音處理方法及其裝置
US11295751B2 (en) * 2019-09-20 2022-04-05 Tencent America LLC Multi-band synchronized neural vocoder
KR102201169B1 (ko) * 2019-10-23 2021-01-11 성균관대학교 산학협력단 메타 표면의 반사 계수를 제어하기 위한 시간 부호 생성 방법, 메타 표면의 반사 계수를 제어하기 위한 시공간 부호 생성 방법, 이를 실행하는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 기록매체, 및 이를 이용한 메타 표면의 신호 변조 방법
CN114548442B (zh) * 2022-02-25 2022-10-21 万表名匠(广州)科技有限公司 一种基于互联网技术的腕表维修管理系统

Family Cites Families (148)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US526468A (en) * 1894-09-25 Charles d
US596689A (en) * 1898-01-04 Hose holder or support
US525147A (en) * 1894-08-28 Steam-cooker
US321993A (en) * 1885-07-14 Lantern
US1126620A (en) * 1911-01-30 1915-01-26 Safety Car Heating & Lighting Electric regulation.
US1089258A (en) * 1914-01-13 1914-03-03 James Arnot Paterson Facing or milling machine.
US1300833A (en) * 1918-12-12 1919-04-15 Moline Mill Mfg Company Idler-pulley structure.
US1498873A (en) * 1924-04-19 1924-06-24 Bethlehem Steel Corp Switch stand
US2073913A (en) * 1934-06-26 1937-03-16 Wigan Edmund Ramsay Means for gauging minute displacements
US2086867A (en) * 1936-06-19 1937-07-13 Hall Lab Inc Laundering composition and process
US3044777A (en) * 1959-10-19 1962-07-17 Fibermold Corp Bowling pin
US3158693A (en) * 1962-08-07 1964-11-24 Bell Telephone Labor Inc Speech interpolation communication system
US3855416A (en) 1972-12-01 1974-12-17 F Fuller Method and apparatus for phonation analysis leading to valid truth/lie decisions by fundamental speech-energy weighted vibratto component assessment
US3855414A (en) 1973-04-24 1974-12-17 Anaconda Co Cable armor clamp
JPS59139099A (ja) 1983-01-31 1984-08-09 株式会社東芝 音声区間検出装置
US4616659A (en) 1985-05-06 1986-10-14 At&T Bell Laboratories Heart rate detection utilizing autoregressive analysis
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4747143A (en) 1985-07-12 1988-05-24 Westinghouse Electric Corp. Speech enhancement system having dynamic gain control
NL8503152A (nl) * 1985-11-15 1987-06-01 Optische Ind De Oude Delft Nv Dosismeter voor ioniserende straling.
US4862168A (en) 1987-03-19 1989-08-29 Beard Terry D Audio digital/analog encoding and decoding
US4805193A (en) * 1987-06-04 1989-02-14 Motorola, Inc. Protection of energy information in sub-band coding
US4852179A (en) 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
JP2707564B2 (ja) 1987-12-14 1998-01-28 株式会社日立製作所 音声符号化方式
US5285520A (en) * 1988-03-02 1994-02-08 Kokusai Denshin Denwa Kabushiki Kaisha Predictive coding apparatus
CA1321645C (en) 1988-09-28 1993-08-24 Akira Ichikawa Method and system for voice coding based on vector quantization
US5086475A (en) 1988-11-19 1992-02-04 Sony Corporation Apparatus for generating, recording or reproducing sound source data
JPH02244100A (ja) * 1989-03-16 1990-09-28 Ricoh Co Ltd 駆動音源信号生成装置
BR9105987A (pt) 1990-09-19 1993-02-02 Philips Nv Portador de registro no qual foram registrados um arquivo de dados principais e um arquivo de controle,processo e dispositivo para registrar um arquivo de dados principais e um arquivo de controle num portador de registro,e dispositivo para ter um portador de registro
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3191457B2 (ja) 1992-10-31 2001-07-23 ソニー株式会社 高能率符号化装置、ノイズスペクトル変更装置及び方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3721582B2 (ja) 1993-06-30 2005-11-30 ソニー株式会社 信号符号化装置及び方法並びに信号復号化装置及び方法
WO1995010760A2 (en) 1993-10-08 1995-04-20 Comsat Corporation Improved low bit rate vocoders and methods of operation therefor
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5487087A (en) 1994-05-17 1996-01-23 Texas Instruments Incorporated Signal quantizer with reduced output fluctuation
US5797118A (en) 1994-08-09 1998-08-18 Yamaha Corporation Learning vector quantization and a temporary memory such that the codebook contents are renewed when a first speaker returns
JP2770137B2 (ja) 1994-09-22 1998-06-25 日本プレシジョン・サーキッツ株式会社 波形データ圧縮装置
US5699477A (en) * 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
FI97182C (fi) 1994-12-05 1996-10-25 Nokia Telecommunications Oy Menetelmä vastaanotettujen huonojen puhekehysten korvaamiseksi digitaalisessa vastaanottimessa sekä digitaalisen tietoliikennejärjestelmän vastaanotin
JP3365113B2 (ja) * 1994-12-22 2003-01-08 ソニー株式会社 音声レベル制御装置
JP3189614B2 (ja) 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP2798003B2 (ja) 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
JP2956548B2 (ja) 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US6263307B1 (en) 1995-04-19 2001-07-17 Texas Instruments Incorporated Adaptive weiner filtering using line spectral frequencies
JP3334419B2 (ja) * 1995-04-20 2002-10-15 ソニー株式会社 ノイズ低減方法及びノイズ低減装置
US5699485A (en) * 1995-06-07 1997-12-16 Lucent Technologies Inc. Pitch delay modification during frame erasures
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
US6097824A (en) 1997-06-06 2000-08-01 Audiologic, Incorporated Continuous frequency dynamic range audio compressor
DE69530204T2 (de) * 1995-10-16 2004-03-18 Agfa-Gevaert Neue Klasse von Gelbfarbstoffen für photographische Materialien
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5737716A (en) * 1995-12-26 1998-04-07 Motorola Method and apparatus for encoding speech using neural network technology for speech classification
JP3073919B2 (ja) * 1995-12-30 2000-08-07 松下電器産業株式会社 同期装置
US5689615A (en) 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
TW307960B (en) * 1996-02-15 1997-06-11 Philips Electronics Nv Reduced complexity signal transmission system
EP0814458B1 (en) 1996-06-19 2004-09-22 Texas Instruments Incorporated Improvements in or relating to speech coding
JP3246715B2 (ja) 1996-07-01 2002-01-15 松下電器産業株式会社 オーディオ信号圧縮方法,およびオーディオ信号圧縮装置
KR20030096444A (ko) * 1996-11-07 2003-12-31 마쯔시다덴기산교 가부시키가이샤 음원 벡터 생성 장치 및 방법
US6009395A (en) 1997-01-02 1999-12-28 Texas Instruments Incorporated Synthesizer and method using scaled excitation signal
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
US6041297A (en) * 1997-03-10 2000-03-21 At&T Corp Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations
US5890126A (en) * 1997-03-10 1999-03-30 Euphonics, Incorporated Audio data decompression and interpolation apparatus and method
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6889185B1 (en) 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6231516B1 (en) * 1997-10-14 2001-05-15 Vacusense, Inc. Endoluminal implant with therapeutic and diagnostic capability
JPH11205166A (ja) * 1998-01-19 1999-07-30 Mitsubishi Electric Corp ノイズ検出装置
US6301556B1 (en) 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6385573B1 (en) 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
JP4170458B2 (ja) 1998-08-27 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
US6353808B1 (en) 1998-10-22 2002-03-05 Sony Corporation Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal
KR20000047944A (ko) 1998-12-11 2000-07-25 이데이 노부유끼 수신장치 및 방법과 통신장치 및 방법
JP4354561B2 (ja) 1999-01-08 2009-10-28 パナソニック株式会社 オーディオ信号符号化装置及び復号化装置
US6223151B1 (en) * 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
JP3696091B2 (ja) 1999-05-14 2005-09-14 松下電器産業株式会社 オーディオ信号の帯域を拡張するための方法及び装置
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6556950B1 (en) 1999-09-30 2003-04-29 Rockwell Automation Technologies, Inc. Diagnostic method and apparatus for use with enterprise control
US6715125B1 (en) 1999-10-18 2004-03-30 Agere Systems Inc. Source coding and transmission with time diversity
CN1192355C (zh) 1999-11-16 2005-03-09 皇家菲利浦电子有限公司 宽带音频传输系统
CA2290037A1 (en) * 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
US7260523B2 (en) * 1999-12-21 2007-08-21 Texas Instruments Incorporated Sub-band speech coding system
CN1187735C (zh) 2000-01-11 2005-02-02 松下电器产业株式会社 多模式话音编码装置和解码装置
US6757395B1 (en) 2000-01-12 2004-06-29 Sonic Innovations, Inc. Noise reduction apparatus and method
US6704711B2 (en) 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6732070B1 (en) * 2000-02-16 2004-05-04 Nokia Mobile Phones, Ltd. Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching
JP3681105B2 (ja) 2000-02-24 2005-08-10 アルパイン株式会社 データ処理方式
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US6523003B1 (en) * 2000-03-28 2003-02-18 Tellabs Operations, Inc. Spectrally interdependent gain adjustment techniques
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US7330814B2 (en) 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
DE60118627T2 (de) * 2000-05-22 2007-01-11 Texas Instruments Inc., Dallas Vorrichtung und Verfahren zur Breitbandcodierung von Sprachsignalen
US7136810B2 (en) 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
JP2002055699A (ja) * 2000-08-10 2002-02-20 Mitsubishi Electric Corp 音声符号化装置および音声符号化方法
BR0107142A (pt) 2000-08-25 2002-07-02 Koninkl Philips Electronics Nv Métodos para redução do número de bits de um sinal de entrada digital, e para recuperar um sinal de saìda de um sinal de comprimento de palavra reduzido, e, aparelhos de processamento de sinal, e para decodificação de sinal
US6515889B1 (en) * 2000-08-31 2003-02-04 Micron Technology, Inc. Junction-isolated depletion mode ferroelectric memory
US7386444B2 (en) 2000-09-22 2008-06-10 Texas Instruments Incorporated Hybrid speech coding and system
US6947888B1 (en) 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP2002202799A (ja) 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
JP3558031B2 (ja) 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
US7346499B2 (en) 2000-11-09 2008-03-18 Koninklijke Philips Electronics N.V. Wideband extension of telephone speech for higher perceptual quality
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
AU2002218501A1 (en) * 2000-11-30 2002-06-11 Matsushita Electric Industrial Co., Ltd. Vector quantizing device for lpc parameters
GB0031461D0 (en) 2000-12-22 2001-02-07 Thales Defence Ltd Communication sets
US20040204935A1 (en) 2001-02-21 2004-10-14 Krishnasamy Anandakumar Adaptive voice playout in VOP
JP2002268698A (ja) 2001-03-08 2002-09-20 Nec Corp 音声認識装置と標準パターン作成装置及び方法並びにプログラム
US20030028386A1 (en) 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
CN1529882A (zh) * 2001-05-11 2004-09-15 西门子公司 用于扩展窄带滤波的语音信号、特别是由通信设备发送的语音信号的带宽的方法
CN1235192C (zh) * 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
US6879955B2 (en) * 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
JP2003036097A (ja) * 2001-07-25 2003-02-07 Sony Corp 情報検出装置及び方法、並びに情報検索装置及び方法
TW525147B (en) 2001-09-28 2003-03-21 Inventec Besta Co Ltd Method of obtaining and decoding basic cycle of voice
US6988066B2 (en) * 2001-10-04 2006-01-17 At&T Corp. Method of bandwidth extension for narrow-band speech
US6895375B2 (en) 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
TW526468B (en) 2001-10-19 2003-04-01 Chunghwa Telecom Co Ltd System and method for eliminating background noise of voice signal
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
DE60212696T2 (de) * 2001-11-23 2007-02-22 Koninklijke Philips Electronics N.V. Bandbreitenvergrösserung für audiosignale
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US6751587B2 (en) 2002-01-04 2004-06-15 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP4290917B2 (ja) * 2002-02-08 2009-07-08 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法、及び、符号化方法
JP3826813B2 (ja) 2002-02-18 2006-09-27 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
DE60303689T2 (de) 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
JP3756864B2 (ja) 2002-09-30 2006-03-15 株式会社東芝 音声合成方法と装置及び音声合成プログラム
KR100841096B1 (ko) 2002-10-14 2008-06-25 리얼네트웍스아시아퍼시픽 주식회사 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법
US20040098255A1 (en) 2002-11-14 2004-05-20 France Telecom Generalized analysis-by-synthesis speech coding method, and coder implementing such method
US7242763B2 (en) * 2002-11-26 2007-07-10 Lucent Technologies Inc. Systems and methods for far-end noise reduction and near-end noise compensation in a mixed time-frequency domain compander to improve signal quality in communications systems
CA2415105A1 (en) 2002-12-24 2004-06-24 Voiceage Corporation A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
KR100480341B1 (ko) 2003-03-13 2005-03-31 한국전자통신연구원 광대역 저전송률 음성 신호의 부호화기
DE602004007786T2 (de) 2003-05-01 2008-04-30 Nokia Corp. Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
WO2005004113A1 (ja) 2003-06-30 2005-01-13 Fujitsu Limited オーディオ符号化装置
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
FI118550B (fi) * 2003-07-14 2007-12-14 Nokia Corp Parannettu eksitaatio ylemmän kaistan koodaukselle koodekissa, joka käyttää kaistojen jakoon perustuvia koodausmenetelmiä
US7428490B2 (en) * 2003-09-30 2008-09-23 Intel Corporation Method for spectral subtraction in speech enhancement
US7689579B2 (en) * 2003-12-03 2010-03-30 Siemens Aktiengesellschaft Tag modeling within a decision, support, and reporting environment
KR100587953B1 (ko) * 2003-12-26 2006-06-08 한국전자통신연구원 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
JP4259401B2 (ja) 2004-06-02 2009-04-30 カシオ計算機株式会社 音声処理装置及び音声符号化方法
US8000967B2 (en) 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
UA94041C2 (ru) * 2005-04-01 2011-04-11 Квелкомм Инкорпорейтед Способ и устройство для фильтрации, устраняющей разреженность
WO2006107833A1 (en) 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
US9043214B2 (en) 2005-04-22 2015-05-26 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DATTORO J ET AL: "Error spectrum Shaping and Vector Quantization", October 1997 (1997-10), XP002307027, STANFORD UNIVERSITY
HSI-WEN NEIN ET AL: "Incorporating Error Shaping Technique into LSF Vector Quantization" IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, vol . 9, no. 2, February 2001

Also Published As

Publication number Publication date
RU2386179C2 (ru) 2010-04-10
BRPI0607690A2 (pt) 2009-09-22
ATE492016T1 (de) 2011-01-15
US8484036B2 (en) 2013-07-09
TW200703240A (en) 2007-01-16
DE602006017673D1 (de) 2010-12-02
RU2413191C2 (ru) 2011-02-27
AU2006232358A1 (en) 2006-10-12
MX2007012191A (es) 2007-12-11
TWI330828B (en) 2010-09-21
NO20075503L (no) 2007-12-28
BRPI0607646B1 (pt) 2021-05-25
IL186404A0 (en) 2008-01-20
CA2602804A1 (en) 2006-10-12
US20060277038A1 (en) 2006-12-07
WO2006107839A2 (en) 2006-10-12
KR20070118168A (ko) 2007-12-13
EP1864101A1 (en) 2007-12-12
EP1869673B1 (en) 2010-09-22
ES2391292T3 (es) 2012-11-23
EP1869670A1 (en) 2007-12-26
AU2006232363B2 (en) 2011-01-27
CA2603229A1 (en) 2006-10-12
RU2007140394A (ru) 2009-05-10
BRPI0608305B1 (pt) 2019-08-06
RU2007140383A (ru) 2009-05-10
NO20075511L (no) 2007-12-27
JP2008535026A (ja) 2008-08-28
US8140324B2 (en) 2012-03-20
KR20070118174A (ko) 2007-12-13
JP2008537165A (ja) 2008-09-11
BRPI0608269B8 (pt) 2019-09-03
CN102411935A (zh) 2012-04-11
SG161224A1 (en) 2010-05-27
NZ562182A (en) 2010-03-26
EP1864283A1 (en) 2007-12-12
AU2006232357B2 (en) 2010-07-01
RU2007140429A (ru) 2009-05-20
TW200705390A (en) 2007-02-01
KR100956876B1 (ko) 2010-05-11
KR20070118175A (ko) 2007-12-13
CA2603231C (en) 2012-11-06
IL186438A (en) 2011-09-27
RU2007140406A (ru) 2009-05-10
BRPI0607646A2 (pt) 2009-09-22
EP1869673A1 (en) 2007-12-26
KR20070118170A (ko) 2007-12-13
TWI316225B (en) 2009-10-21
CA2603255C (en) 2015-06-23
TW200705387A (en) 2007-02-01
KR100956624B1 (ko) 2010-05-11
NO20075513L (no) 2007-12-28
NZ562188A (en) 2010-05-28
EP1864282B1 (en) 2017-05-17
MX2007012184A (es) 2007-12-11
US20070088542A1 (en) 2007-04-19
BRPI0607691A2 (pt) 2009-09-22
BRPI0608269B1 (pt) 2019-07-30
RU2491659C2 (ru) 2013-08-27
NO340566B1 (no) 2017-05-15
MX2007012185A (es) 2007-12-11
KR20070118172A (ko) 2007-12-13
CA2603229C (en) 2012-07-31
PL1864101T3 (pl) 2012-11-30
RU2376657C2 (ru) 2009-12-20
WO2006107834A1 (en) 2006-10-12
IL186405A (en) 2013-07-31
AU2006232361B2 (en) 2010-12-23
NZ562183A (en) 2010-09-30
PL1864282T3 (pl) 2017-10-31
ATE485582T1 (de) 2010-11-15
AU2006232360B2 (en) 2010-04-29
BRPI0609530A2 (pt) 2010-04-13
KR100956524B1 (ko) 2010-05-07
IL186439A0 (en) 2008-01-20
US8078474B2 (en) 2011-12-13
JP5129117B2 (ja) 2013-01-23
US8332228B2 (en) 2012-12-11
IL186443A (en) 2012-09-24
KR100956523B1 (ko) 2010-05-07
IL186438A0 (en) 2008-01-20
EP1866914A1 (en) 2007-12-19
AU2006232357C1 (en) 2010-11-25
CA2603187C (en) 2012-05-08
JP2008536169A (ja) 2008-09-04
US8364494B2 (en) 2013-01-29
WO2006107839A3 (en) 2007-04-05
US8069040B2 (en) 2011-11-29
IL186442A (en) 2012-06-28
BRPI0608269A2 (pt) 2009-12-08
KR101019940B1 (ko) 2011-03-09
EP1866915B1 (en) 2010-12-15
AU2006232364B2 (en) 2010-11-25
RU2009131435A (ru) 2011-02-27
KR20070119722A (ko) 2007-12-20
US20060282263A1 (en) 2006-12-14
KR20070118173A (ko) 2007-12-13
AU2006232362B2 (en) 2009-10-08
BRPI0608305A2 (pt) 2009-10-06
KR100956525B1 (ko) 2010-05-07
JP2008535025A (ja) 2008-08-28
TW200703237A (en) 2007-01-16
IL186436A0 (en) 2008-01-20
SG161223A1 (en) 2010-05-27
HK1114901A1 (en) 2008-11-14
KR20070118167A (ko) 2007-12-13
NZ562186A (en) 2010-03-26
RU2381572C2 (ru) 2010-02-10
US20060271356A1 (en) 2006-11-30
NO20075514L (no) 2007-12-28
ES2340608T3 (es) 2010-06-07
MX2007012181A (es) 2007-12-11
US20070088541A1 (en) 2007-04-19
WO2006130221A1 (en) 2006-12-07
JP2008537606A (ja) 2008-09-18
CA2603219A1 (en) 2006-10-12
EP1864281A1 (en) 2007-12-12
JP2008535027A (ja) 2008-08-28
BRPI0607691B1 (pt) 2019-08-13
EP1864283B1 (en) 2013-02-13
IL186404A (en) 2011-04-28
US20070088558A1 (en) 2007-04-19
EP1869670B1 (en) 2010-10-20
EP1866914B1 (en) 2010-03-03
CA2602806A1 (en) 2006-10-12
PT1864282T (pt) 2017-08-10
WO2006107833A1 (en) 2006-10-12
JP5203929B2 (ja) 2013-06-05
TW200707408A (en) 2007-02-16
TWI321777B (en) 2010-03-11
NZ562185A (en) 2010-06-25
HK1115023A1 (en) 2008-11-14
BRPI0609530B1 (pt) 2019-10-29
AU2006232361A1 (en) 2006-10-12
NO340428B1 (no) 2017-04-18
AU2006232357A1 (en) 2006-10-12
NO20075515L (no) 2007-12-28
RU2007140426A (ru) 2009-05-10
TWI321315B (en) 2010-03-01
RU2007140365A (ru) 2009-05-10
RU2390856C2 (ru) 2010-05-27
BRPI0608306A2 (pt) 2009-12-08
IL186441A0 (en) 2008-01-20
PL1866915T3 (pl) 2011-05-31
ATE482449T1 (de) 2010-10-15
US8244526B2 (en) 2012-08-14
JP2008536170A (ja) 2008-09-04
AU2006232358B2 (en) 2010-11-25
SG163556A1 (en) 2010-08-30
SG163555A1 (en) 2010-08-30
BRPI0607690A8 (pt) 2017-07-11
JP5129116B2 (ja) 2013-01-23
SI1864282T1 (sl) 2017-09-29
TW200707405A (en) 2007-02-16
CA2602806C (en) 2011-05-31
JP5161069B2 (ja) 2013-03-13
RU2402827C2 (ru) 2010-10-27
AU2006232362A1 (en) 2006-10-12
EP1864101B1 (en) 2012-08-08
CA2603187A1 (en) 2006-12-07
WO2006107836A1 (en) 2006-10-12
BRPI0608270A2 (pt) 2009-10-06
NZ562190A (en) 2010-06-25
MX2007012189A (es) 2007-12-11
PL1869673T3 (pl) 2011-03-31
JP5203930B2 (ja) 2013-06-05
HK1115024A1 (en) 2008-11-14
AU2006232363A1 (en) 2006-10-12
EP1866915A2 (en) 2007-12-19
US20080126086A1 (en) 2008-05-29
RU2007140381A (ru) 2009-05-10
WO2006107840A1 (en) 2006-10-12
AU2006252957B2 (en) 2011-01-20
TW200705389A (en) 2007-02-01
MX2007012183A (es) 2007-12-11
CN102411935B (zh) 2014-05-07
RU2402826C2 (ru) 2010-10-27
MX2007012182A (es) 2007-12-10
IL186442A0 (en) 2008-01-20
CA2603231A1 (en) 2006-10-12
CA2603255A1 (en) 2006-10-12
DE602006017050D1 (de) 2010-11-04
IL186443A0 (en) 2008-01-20
MX2007012187A (es) 2007-12-11
IL186405A0 (en) 2008-01-20
KR100982638B1 (ko) 2010-09-15
NO20075510L (no) 2007-12-28
NO20075512L (no) 2007-12-28
ATE459958T1 (de) 2010-03-15
JP5129115B2 (ja) 2013-01-23
WO2006107837A1 (en) 2006-10-12
RU2387025C2 (ru) 2010-04-20
HK1113848A1 (en) 2008-10-17
CA2603246C (en) 2012-07-17
RU2007140382A (ru) 2009-05-10
DE602006018884D1 (de) 2011-01-27
CA2603246A1 (en) 2006-10-12
EP1864282A1 (en) 2007-12-12
TWI324335B (en) 2010-05-01
DE602006012637D1 (de) 2010-04-15
CA2603219C (en) 2011-10-11
TWI320923B (en) 2010-02-21
TWI321314B (en) 2010-03-01
NO340434B1 (no) 2017-04-24
US20060277042A1 (en) 2006-12-07
DK1864282T3 (en) 2017-08-21
PT1864101E (pt) 2012-10-09
AU2006252957A1 (en) 2006-12-07
CA2602804C (en) 2013-12-24
AU2006232360A1 (en) 2006-10-12
WO2006107838A1 (en) 2006-10-12
DK1864101T3 (da) 2012-10-08
HK1169509A1 (en) 2013-01-25
JP2008535024A (ja) 2008-08-28
JP4955649B2 (ja) 2012-06-20
TWI319565B (en) 2010-01-11
JP5129118B2 (ja) 2013-01-23
TW200705388A (en) 2007-02-01
AU2006232364A1 (en) 2006-10-12
ES2636443T3 (es) 2017-10-05
US8260611B2 (en) 2012-09-04

Similar Documents

Publication Publication Date Title
KR100956877B1 (ko) 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
KR101078625B1 (ko) 이득 계수 제한을 위한 시스템, 방법 및 장치
CN101180676B (zh) 用于谱包络表示的向量量化的方法和设备
JP5437067B2 (ja) 音声信号に関連するパケットに識別子を含めるためのシステムおよび方法
RU2428747C2 (ru) Системы, способы и устройство для широкополосного кодирования и декодирования неактивных кадров
EP3174051B1 (en) Systems and methods of performing noise modulation and gain adjustment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130329

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170330

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180329

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190327

Year of fee payment: 10