KR100535778B1 - 음성 복호기 및 음성 복호 방법 - Google Patents

음성 복호기 및 음성 복호 방법 Download PDF

Info

Publication number
KR100535778B1
KR100535778B1 KR10-2002-7011557A KR20027011557A KR100535778B1 KR 100535778 B1 KR100535778 B1 KR 100535778B1 KR 20027011557 A KR20027011557 A KR 20027011557A KR 100535778 B1 KR100535778 B1 KR 100535778B1
Authority
KR
South Korea
Prior art keywords
filter
frequency band
linear prediction
parameter
representation
Prior art date
Application number
KR10-2002-7011557A
Other languages
English (en)
Other versions
KR20020081388A (ko
Inventor
자니 로톨라-푸킬라
잔네 바이니오
한누 믹콜라
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8557866&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100535778(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20020081388A publication Critical patent/KR20020081388A/ko
Application granted granted Critical
Publication of KR100535778B1 publication Critical patent/KR100535778B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Abstract

음성 복호기는 선형 예측 부호화된 음성 신호를 제1 샘플링비를 가지며 제1 주파수 대역을 나타내는 제1 샘플 스트림으로 변환하기 위한 복호기(103)를 포함한다. 부가적으로 상기 음성 복호기는 입력 신호를 제2 샘플링비를 가지며 제2 주파수 대역을 나타내는 제2 샘플 스트림으로 변환하기 위한 보코더(105) 및 상기 제1 샘플 스트림과 상기 제2 샘플 스트림을 처리된 형태로 결합하기 위한 결합 수단(107)을 포함한다. 상기 음성 복호기는 또한 상기 제1 주파수 대역상에서 상기 복호기(103)에 의해 사용되는 제1 선형 예측 필터에 기초하여, 상기 제2 주파수 대역상에서 상기 보코더(105)에 의해 사용될 제2 선형 예측 필터를 생성하기 위한 수단(301)을 포함한다. 무한 임펄스 응답 필터를 통한 외삽은 상기 제2 선형 예측 필터를 생성하는 바람직한 방법이다.

Description

음성 복호기 및 음성 복호 방법{Speech decoder and a method for decoding speech}
본 발명은 일반적으로 디지털적으로 부호화된 음성을 복호화하는 기술에 관한 것이다. 특히 본 발명은 좁은 주파수 대역 부호화된 입력 신호로부터 넓은 주파수 대역 복호화된 출력 신호를 생성하는 기술에 관한 것이다.
디지털 전화 시스템들은 전통적으로 임의로 선택된 송신기-수신기 쌍들간의 호환성을 보장하기 위하여 고정된 샘플링비들을 갖는 표준 음성 부호화 및 복호화방법들에 의존한다. 2세대 디지털 셀룰러 네트워크 및 그들의 기능적으로 증강된 단말기들의 발달은 샘플링비들에 관한 완전한 일대일 호환성이 보장될 수 없는 상황을 초래하였다. 즉, 송신하는 단말기내의 음성 복호기는 상기 단말기내의 음성 복호기의 출력 샘플링비와 다른 입력 샘플링비를 사용할 수 있다. 또한, 원래 음성 신호의 선형 예측 또는 LP(linear prediction) 분석은 복잡성 제한 때문에 실제 입력 신호보다 더 좁은 주파수 대역을 갖는 신호에 대해 수행될 수 있다. 진보된 수신하는 단말기의 음성 복호기는 상기 분석에서 사용되는 것보다 더 넓은 주파수 대역을 갖는 LP 필터를 생성할 수 있어야 하고 협대역 입력 파라미터들로부터 광대역 출력 신호를 생성할 수 있어야 한다. 기존의 협대역 정보로부터 광대역 LP 필터의 생성은 또한 더 넓은 적용성을 갖는다.
도 1은 협대역 부호화된 음성 신호를 높은 샘플링비를 갖는 음성 합성에서 사용될 수 있는 광대역 복호화된 샘플 스트림으로 변환하기 위한 기존의 원리를 도시한 것이다. 송신단에서 원래의 음성 신호는 블록(101)에서 저역 통과 필터링(LPF: low-pass filtering)된다. 저 주파수 부-대역상의 결과로서 생기는 신호는 협대역 부호기(102)에서 부호화된다. 수신단에서 상기 부호화된 신호는 협대역 복호기(103)로 공급되는데, 상기 협대역 복호기(103)의 출력은 비교적 낮은 샘플링비를 갖는 저 주파수 부-대역을 나타내는 샘플 스트림이다. 상기 샘플링비를 증가시키기 위하여 상기 신호는 샘플링비 보간기(104)로 취해진다.
상기 신호에서 빠진 고 주파수들은 블록(103)으로부터 (개별적으로 도시되지 않은) LP 필터를 취함으로써 그리고 입력으로서 백색 잡음 신호를 사용하는 보코더(vocoder)(105)의 일부로서 LP 필터를 구현하기 위한 LP 필터를 사용함으로써 추정된다. 즉, 저 주파수 부-대역에서의 상기 LP 필터의 주파수 응답 곡선은 합성적으로 생성된 고 주파수 부-대역의 생성시 더 넓은 주파수 대역을 포함하도록 주파수 축의 방향으로 신장된다. 상기 백색 잡음의 세기는 상기 보코더 출력의 세기가 적합하도록 조정된다. 상기 보코더(105)의 출력은 상기 저 주파수 부-대역상의 실제 음성 신호와 과도한 중첩을 방지하기 위하여 블록(106)에서 고역 통과 필터링(HPF: high-pass filtering)된다. 상기 저 주파수 부-대역 및 고 주파수 부-대역은 가산 블록(107)에서 결합되고 상기 결합 대역은 최종 음성 출력 신호를 생성하기 위한 음성 합성기(미도시)로 취해진다.
우리는 상기 음성 신호의 원래의 샘플링비가 12.8 kHz이었고 상기 복호기의 출력에서의 샘플링비가 16 kHz이어야 하는 예시적인 상황을 고려할 수 있다. 상기 LP 분석은 0에서 6400 Hz까지의 주파수들, 즉 0에서 원래의 샘플링비의 절반인 나이키스트 주파수까지의 주파수들에 대해 수행되었다. 따라서, 상기 협대역 복호기(103)는 주파수 응답이 0부터 6400 Hz까지 이르는 LP 필터를 구현한다. 상기 고 주파수 부-대역을 생성하기 위하여, 상기 LP 필터의 주파수 응답은 0부터 8000 Hz까지의 주파수 대역을 포함하도록 상기 보코더(105)에서 신장되는데, 이제 상한은 원하는 높은 샘플링비에 관한 상기 나이키스트 주파수이다.
비록 필요하지 않을지라도, 상기 저 주파수 부-대역과 상기 고 주파수 부-대역 사이에서 어느 정도의 중첩은 보통 바람직하다; 상기 중첩은 최적의 본질적인 오디오 품질을 달성하는데 도움을 줄 수 있다. 10%의 중첩이 목표라고 가정하자. 이것은 상기 협대역 복호기(103)에서 상기 LP 필터의 0부터 6400 Hz까지의(즉 샘플링비 Fs=12.8 kHz를 가지고 0 - 0.5Fs) 전체 주파수 응답이 사용된다는 것을 의미하고, 상기 보코더(105)에서 상기 LP 필터의 5600 Hz에서 8000 Hz까지의(즉 샘플링비 Fs=16 kHz를 가지고 0.35Fs - 0.5Fs) 주파수 응답만이 효과적으로 사용된다는 것을 의미한다. 여기에서 "효과적으로"라는 것은 상기 고역 통과 필터(106)로 인하여, 상기 주파수 응답의 낮은 종단부가 상부 신호 처리 분기의 출력에 영향을 미치지 않는다는 것을 의미한다. 5600 Hz에서 8000 Hz까지 범위의 상기 광대역 LP 필터의 주파수 응답은 4480 Hz에서 6400 Hz까지 범위의 상기 협대역 LP 필터의 주파수 응답의 신장된 복사본이다.
종래 기술의 장치의 단점들은 상기 협대역 LP 필터의 주파수 응답이 원래의 나이키스트 주파수에 근접한, 상부 영역에서 피크를 갖는 상황에서 두드러진다. 도 2는 이러한 상황을 도시한 것이다. 가는 곡선(201)은 샘플링비 16 kHz를 갖는 음성 신호의 분석에서 사용될 0에서 8000 Hz LP 필터의 주파수 응답을 나타낸다. 두꺼운 곡선(202)은 도 1의 장치가 생성할 결합된 주파수 응답을 나타낸다. 각각 4480 Hz와 6400 Hz에서의 대시 라인들(203 및 204)은 상기 보코더에서 구현된 상기 광대역 LP 필터에서 5600 Hz에서 8000 Hz까지의 간격으로 복사되고 신장된 협대역 LP 필터의 주파수 응답의 부분의 한계를 정한다. 상기 협대역 주파수 응답에서 약 4400 Hz에 있는 피크 및 상기 주파수 대역의 상한쪽을 향한 상기 피크로부터의 연속적인 내리막 부분은 상기 결합된 주파수 응답 곡선(202)이 이상적인 광대역 LP 필터의 주파수 응답(201)과 현저하게 다르도록 야기한다.
상기의 단점을 극복하기 위하여 도 1의 원리를 보완하기 위한 다양한 종래 기술의 장치들이 알려져 있다. 특허 공보 US 5,978,759는 부호록(codebook) 또는 검색(loop-up) 테이블을 사용하여 협대역 음성을 광대역 음성으로 확장시키기 위한 장치를 개시한다. 대응하는 광대역 LP 필터의 특징 파라미터들이 검색 테이블내의 매칭하거나 거의 매칭하는 엔트리로부터 독출될 수 있도록, 상기 협대역 LP 필터에 특징적인 일 집합의 파라미터들이 상기 검색 테이블에 대한 검색 키로서 추출되고 취해진다. 유사한 해법은 특허 공보 번호 JP 10124089A로부터 알려져 있다. 약간 다른 접근법은 특허 공보 번호 US 5,455,888로부터 알려져 있는데, 여기에서 고 주파수들은 일종의 검색 테이블을 사용하여 선택된 필터 뱅크를 사용하여 생성된다. 특허 공보 번호 US 5,581,652는 신호들의 파형 특성이 이용되도록 부호록들을 사용함으로써 협대역 음성으로부터 광대역 음성을 재구성하는 것을 제안한다. 더욱이, 공개된 국제 특허 출원 번호 WO 99/49454A1에 있어서 음성 신호가 주파수 영역으로 변환되고, 상기 주파수 영역 신호의 특징적인 피크들이 식별되며 일 집합의 광대역 필터 파라미터들이 변환 테이블에 기초하여 선택되는 방법이 개시된다.
적합한 광대역 필터의 특징들을 검색하는데 있어서 검색 테이블을 사용하는 것은 도 2에 도시된 종류의 손상을 피하는데 도움을 줄 수 있지만, 동시에 그것은 상당한 정도의 비유연성을 수반한다. 한정된 수의 가능한 광대역 필터들만이 구현될 수 있거나 매우 큰 메모리가 이러한 목적을 위해 단독으로 할당되어야 한다. 또한 선택하기 위한 저장된 광대역 필터 구성들의 수를 증가시키는 것은 그들중 정확한 것을 검색하고 설정하기 위하여 할당되어야 하는 시간을 증가시키는데, 이것은 음성 전화와 같은 실시간 동작에 바람직하지 않다.
도 1은 기지의 음성 복호기를 도시한 것이다.
도 2는 기지의 광대역 LP 필터의 불리한 주파수 응답을 도시한 것이다.
도 3a는 본 발명의 원리를 도시한 것이다.
도 3b는 도 3a의 원리를 음성 복호기에 적용한 것을 도시한 것이다.
도 4는 도 3b의 장치의 상세를 도시한 것이다.
도 5는 도 4의 장치의 상세를 도시한 것이다.
도 6은 본 발명에 의한 LP 필터의 유리한 주파수 응답을 도시한 것이다.
도 7은 본 발명의 실시예에 의한 디지털 무선 전화를 도시한 것이다.
본 발명의 목적은 주파수 대역의 확장이, 계산적으로 경제적이고 원래 더 넓은 주파수 대역폭을 사용함으로써 획득될 수 있는 특징들을 잘 모방하는 유연한 방법으로 행해지는 음성 복호기 및 음성 복호 방법을 제공하는 것이다.
본 발명의 목적들은 협대역 LP 필터 폴(pole)들에서의 어떤 규칙성에 기초한 외삽이 이용되도록 협대역 LP 필터로부터 광대역 LP 필터를 생성함으로써 달성된다.
본 발명에 의하면,
제1 주파수 대역을 나타내는 선형 예측 부호화된 음성 신호를 수신하기 위한 입력 수단;
상기 선형 예측 부호화된 음성 신호로부터 상기 제1 주파수 대역과 관련된 제1 선형 예측 필터를 기술하는 정보를 추출하기 위한 수단; 및
입력 신호를 제2 주파수 대역을 나타내는 출력 신호로 변환하기 위한 보코더를 포함하는 음성 처리 장치에 있어서,
상기 제1 선형 예측 필터를 기술하는 정보에 기초하여, 상기 제2 주파수 대역상에서 상기 보코더에 의해 사용될 제2 선형 예측 필터를 생성하기 위한 수단을 포함하는 음성 처리 장치가 제공된다.
또한 본 발명은 상기한 종류의 적어도 하나의 음성 처리 장치를 포함하는 것을 특징으로 하는 디지털 무선 전화에 적용된다.
부가적으로 본 발명은, 선형 예측 부호화된 음성 신호로부터 제1 주파수 대역과 관련된 제1 선형 예측 필터를 기술하는 정보를 추출하는 단계; 및
입력 신호를 제2 주파수 대역을 나타내는 출력 신호로 변환하는 단계를 포함하는 디지털적으로 부호화된 음성을 처리하기 위한 방법에 있어서,
상기 제1 주파수 대역과 관련된 제1 선형 예측 필터를 기술하는 상기 추출된 정보에 기초하여, 상기 입력 신호를 상기 출력 신호로 변환하는데 사용될 제2 선형 예측 필터를 생성하는 단계를 포함하는 음성 복호 방법에 적용된다.
몇몇 잘 알려진 형태들의 제시는 LP 필터들을 위해 존재한다. 특히 소위 주파수 영역 표시로 알려진 것이 존재하는데, LP 필터는 라인 스펙트럴 주파수(LSF: Line Spectral Frequency) 벡터 또는 이미턴스 스펙트럴 주파수(Immittance Spectral Frequency) 벡터로 표시될 수 있다. 상기 주파수 영역 표시는 샘플링비와 상관없다는 이점을 갖는다.
본 발명에 의하면 협대역 LP 필터는 외삽에 의해 광대역 LP 필터를 구성하기 위한 기초로서 동적으로 사용된다. 특히 본 발명은 상기 협대역 LP 필터를 그것의 주파수 영역 표시로 변환하는 것과 상기 협대역 LP 필터의 주파수 영역 표시를 외삽함으로써 광대역 LP 필터의 주파수 영역 표시를 형성하는 것을 포함한다. 충분한 고차의 무한 임펄스 응답(IIR: Infinite Impulse Response) 필터는 바람직하기로는 상기 협대역 LP 필터에 특징적인 규칙성들을 이용하기 위하여 외삽에 사용된다. 바람직하기로는, 상기 광대역 LP 필터의 차수는 상기 광대역 LP 필터 차수 및 상기 협대역 LP 필터 차수의 비(ratio)가 필수적으로 상기 광대역 샘플링 주파수와 상기 협대역 샘플링 주파수의 비와 동일하도록 선택된다. 어떤 집합의 계수들은 상기 IIR 필터를 위해 필요하다; 바람직하기로는 이들은 상기 협대역 LP 필터의 벡터 표시에서 인접한 요소들간의 차이들을 반영하는 차 벡터(difference vector)의 자기상관을 분석함으로써 획득된다.
상기 광대역 LP 필터가 나이키스트 주파수에 근접하여 과도한 증폭을 일으키지 않는다는 것을 보장하기 위하여, 상기 광대역 LP 필터의 벡터 표시에서의 마지막 요소(들)에 어떤 제한들을 두는 것이 유리하다. 특히 상기 벡터 표시에서의 마지막 요소와 상기 샘플링 주파수에 비례하는 상기 나이키스트 주파수간의 차는 대략 동일한 것으로 있어야 한다. 이들 제한들은 상기 벡터 표시에서의 인접 요소들간의 차이가 제어되도록 차별적인 정의들을 통해 용이하게 정의된다.
본 발명의 특징으로서 고려되는 신규한 특징들은 특히 첨부된 청구항들에서 설명된다. 그러나, 본 발명의 부가적인 목적들 및 이점들과 함께, 본 발명의 구성 및 동작 방법 양자에 대해, 본 발명 그 자체는 첨부한 도면들과 관련하여 읽혀질 때 특정 실시예들에 대한 다음 설명으로부터 최선으로 이해될 것이다.
도 1 및 도 2는 종래 기술의 설명에서 설명되었으므로, 본 발명 및 본 발명의 유리한 실시예들에 대한 다음 설명은 도 3a 내지 도 6에 집중된다. 동일한 참조 부호들은 도면들에서 유사한 부분들을 위해 사용된다.
도 3a는 추출 블록(310)에서 협대역 LP 필터의 파라미터들을 추출하기 위하여 협대역 입력 신호의 사용을 도시한 것이다. 상기 협대역 LP 필터 파라미터들은 외삽 블록(301)에 취해지는데, 외삽은 대응하는 광대역 LP 필터의 파라미터들을 생성하는데 사용된다. 이들은 입력으로서 어떤 광대역 신호를 사용하는 보코더(105)에 취해진다. 상기 보코더(105)는 상기 파라미터들로부터 광대역 LP 필터를 생성하고 그들을 사용하여 상기 광대역 입력 신호를 광대역 출력 신호로 변환한다. 또한 상기 추출 블록(310)은 협대역 출력인 출력을 제공할 수 있다.
도 3b는 도 3a의 원리가 다른 기지의 음성 복호기에 어떻게 적용될 수 있는지를 보여준다. 도 1 및 도 3b간의 비교는 협대역 부호화된 음성 신호를 광대역 복호화된 샘플 스트림으로 변환하기 위하여 상기 다른 기지의 원리로의 본 발명을 통해 가져오게 된 부가를 보여준다. 본 발명은 송신단에 영향을 미치지 않는다: 원래의 음성 신호는 블록(101)에서 저역 통과 필터링되고 저 주파수 부-대역상의 결과로서 생기는 신호는 협대역 부호기(102)에서 부호화된다. 또한 수신단에서의 하부 분기도 아마 마찬가지일 것이다: 부호화된 신호는 협대역 복호기(103)로 공급되고, 상기 협대역 복호기의 저 주파수 부-대역 출력의 샘플링비를 증가시키기 위하여 상기 신호는 샘플링비 보간기(104)에 취해진다. 그러나, 블록(103)에서 사용되는 상기 협대역 LP 필터는 상기 보코더(105)에 직접 취해지지 않고 광대역 LP 필터가 생성되는 외삽 블록(301)에 취해진다.
상기 저 주파수 부-대역에서의 상기 LP 필터의 주파수 응답 곡선은 더 넓은 주파수 대역을 포함하도록 단순히 신장되지 않는다; 또한 상기 협대역 LP 필터 특성들은 이전에 생성된 광대역 LP 필터의 어떤 라이브러리(library)에 대한 검색 키로서 사용되지 않는다. 블록(301)에서 수행되는 외삽은 유일한 광대역 LP 필터를 생성하는 것을 의미하고 일 집합의 대안들에서 가장 근접한 매치(match)를 단지 선택하지 않는다는 것을 의미한다. 적합한 외삽 알고리즘을 선택함으로써 각 협대역 LP 필터 입력 및 대응하는 광대역 LP 필터 출력간의 유일한 관계를 보장하는 것이 가능하다는 점에서 그것은 진정한 적응형 방법이다. 상기 외삽 방법은 입력 정보로서 마주치게 될 협대역 LP 필터들에 대해 사전에 거의 알려지지 않는 경우조차 동작한다. 이것은 검색 테이블들에 기초한 모든 해법들을 능가하는 명백한 이점인데, 이것은 이러한 테이블들이 상기 협대역 LP 필터들이 어떤 범주들에 속할 것인지 다소 알려진 경우에만 구성될 수 있기 때문이다. 부가적으로, 본 발명에 의한 상기 외삽 방법은 한정된 양의 메모리만을 필요로 하는데, 이것은 상기 알고리즘 그 자체만이 저장될 필요가 있기 때문이다.
합성적으로 생성된 고 주파수 부-대역의 생성시 블록(301)으로부터 획득된 상기 광대역 LP 필터의 사용은 종래 기술에서 알려진 패턴을 따를 수 있다. 백색 잡음은 상기 고 주파수 부-대역을 나타내는 샘플 스트림을 생성하는데 있어서 상기 광대역 LP 필터를 사용하는 상기 보코더(105)에 입력 데이터로서 공급된다. 상기 백색 잡음의 세기는 상기 보코더 출력의 세기가 적합하도록 조정된다. 상기 보코더(105)의 출력은 블록(106)에서 고역 통과 필터링되고 상기 저 주파수 부-대역 및 고 주파수 부-대역은 가산 블록(107)에서 결합된다. 상기 결합 대역은 최종 음성 출력 신호를 생성하기 위하여 음성 합성기(미도시)에 취해지도록 준비된다.
도 4는 상기 외삽 블록(301)을 구현하는 예시적인 방법을 도시한 것이다. LP-LSF 변환 블록(401)은 상기 복호기(103)로부터 획득된 상기 협대역 LP 필터를 주파수 영역으로 변환한다. 실제 외삽은 외삽기 블록(402)에 의해 주파수 영역에서 행해진다. 외삽기 블록(402)의 출력은 블록(401)에서 행해진 것과 비교하여 역 변환을 수행하는 LSF-LP 변환 블록(403)에 연결된다. 부가적으로, 블록(403)의 출력과 상기 보코더(105)의 제어 입력 사이에 상기 광대역 LP 필터의 이득을 적합한 레벨로 스케일링하는 과업을 갖는 이득 제어기 블록(404)이 연결되어 있다.
도 5는 상기 외삽기(402)를 구현하는 예시적인 방법을 도시한 것이다. 상기 외삽기의 입력은 상기 LP-LSF 변환 블록(401)의 출력에 연결되어 있으므로, 상기 협대역 LP 필터의 벡터 표시()는 상기 외삽기(402)에 대한 입력으로서 획득된다. 상기 외삽을 수행하기 위하여, 외삽 필터가 필터 생성기 블록(501)에서 상기 벡터()를 분석함으로써 생성된다. 또한 상기 필터는 벡터를 가지고 설명될 수 있는데, 여기에서 이것은 벡터 b로서 표시된다. 블록(501)에서 생성된 필터를 사용함으로써, 상기 협대역 LP 필터의 상기 벡터 표시()는 블록(502)에서 상기 광대역 LP 필터의 벡터 표시()로 변환된다. 마지막으로, 상기 광대역 LP 필터가 더 높은 샘플링비에 대해 나이키스트 주파수 근처에서 과도한 증폭을 포함하지 않는다는 것을 보장하기 위하여, 상기 광대역 LP 필터의 상기 벡터 표시()는 상기 LSF-LP 변환 블록(403)에 그것이 전달되기 전에 블록(503)에서 어떤 제한하는 기능들에 종속된다.
이제 도 4 및 도 5에 상기에 소개된 다양한 기능 블록들에서 수행된 동작들의 상세한 분석이 제공될 것이다. 상기 복호기(103)가 상기 협대역 음성 신호를 복호화하는 동안 LP 필터를 구현하고 이용한다는 것은 사실로서 취해진다. 이 LP 필터는 협대역 LP 필터로서 표시되고, 일 집합의 LP 필터 계수들을 통해 특성화된다. 마찬가지로 실제로 모든 고품질 음성 복호기들(및 부호기들)은 상기 LP 필터 계수들을 양자화하기 위하여 LSF 또는 ISF 벡터들로서 알려진 어떤 벡터들을 사용하고, 따라서, 기능적으로 도 4에서 블록(401)으로 도시된 LP-LSF 변환부가 심지어 상기 복호기(103)의 일부일 수 있다는 것은 사실이다. 이 설명 전반에 걸쳐 우리는 일관성을 위해 LSF 벡터들에 대해 말하지만, 또한 이 설명을 ISF 벡터들의 사용에 적용하는 것은 당업자에게 수월하다.
LSF 벡터들은 벡터가 실제로 상기 LSP(Line Spectral Pair: 라인 스펙트럴 쌍)로 불리우는 코사인 영역에서 표시될 수 있거나, 주파수 영역에서 표시될 수 있다. 상기 코사인 영역 표시(상기 LSP 벡터)는 상기 샘플링비에 의존하지만 상기 주파수 영역 표시는 상기 샘플링비에 의존하지 않으므로, 예를 들어 상기 복호기(103)가 외삽 블록(301)에 대한 입력 정보로서 LSP 벡터만을 제공하는 어떤 종류의 스톡(stock) 음성 복호기인 경우, 우선 상기 LSP 벡터를 LSF 벡터로 변환하는 것이 바람직하다. 상기 변환은 알려져 있는 수학식에 따라 용이하게 행해진다.
여기에서, 아래첨자 n은 일반적으로 "협대역"을 나타내고, 는 상기 협대역 LSF 벡터의 i번째 요소이며, 는 상기 협대역 LSP 벡터의 i번째 요소이고, 은 협대역 샘플링비이며, 은 협대역 LP 필터의 차수이다. LSP 및 LSF 벡터들의 정의에 따르면, 또한 은 상기 협대역 LSP 및 LSF 벡터들의 요소들의 수이다.
도 3b, 도 4 및 도 5에 도시된 실시예에 있어서, 실제 외삽은 블록(501)에서 생성된 L차 외삽 필터를 사용하여 블록(502)에서 일어난다. 당장은 단지 블록(501)이 블록(502)에 필터 벡터(b)를 제공하는 것으로 가정한다; 우리는 나중에 상기 필터 벡터의 생성으로 복귀할 것이다. 광대역 LSF 벡터()를 생성하기 위한 유리한 수학식은 다음과 같다.
여기에서, 아래첨자 w는 일반적으로 "광대역"을 나타내고, 는 상기 광대역 LSF 벡터의 i번째 요소이며, k는 가산 인덱스이고, L은 상기 외삽 필터의 차수이며, b((i-1)-k)는 상기 외삽 필터 벡터의 ((i-1)-k)번째 요소이다. 즉, 상기 협대역 LSF 벡터에 존재하는 것과 같은 정도의 많은 요소들이 상기 광대역 LSF 벡터의 시작부분에 정확히 동일하게 있다. 상기 광대역 LSF 벡터에서의 나머지 요소들은 각 새로운 요소가 상기 광대역 LSF 벡터에서 이전의 L 요소들의 가중된 합이 되도록 계산된다. 가중치들은 를 계산시, 상기 합에 기여하는 가장 먼 이전의 요소인 요소 가 b(L-1)과 가중되도록 그리고 상기 합에 기여하는 가장 가까운 이전의 요소인 요소 이 b(0)과 가중되도록 하는 돌림형 순서(convolutional order)의 상기 외삽 필터 벡터들의 요소들이다.
상기 외삽 수학식 2는 의 값, 즉 상기 광대역 LP 필터의 차수를 한정하지 않는다. 외삽의 정확도를 보존하기 위하여, 다음 수학식 3과 같이 되도록 의 값을 선택하는 것이 유리하다.
이것은 상기 LP 필터들의 차수들이 상기 샘플링 주파수들의 상대적인 크기들에 따라 스케일링된다는 것을 의미한다.
상기 광대역 LP 필터가 나이키스트 주파수 에 근접한 주파수들에 대해 과도한 증폭을 생성하지 않아야 하는 요건은 각 LP 필터 벡터의 마지막 요소 및 대응하는 나이키스트 주파수간의 차의 도움으로 공식화될 수 있는데, 상기 차는 수학식 4에 따라 상기 샘플링 주파수를 가지고 추가로 스케일링된다.
상기 광대역 LP 필터에 대한 상기에 주어진 제한들인 수학식 3 및 수학식 4는 의 선택 및 상기 외삽 필터의 결정을 제한한다. 상기 제한들이 어떻게 정확하게 구현되는지는 일상적인 워크숍 실험의 문제이다. 하나의 유리한 접근법은,
이 되도록 차 벡터(D)를 정하는 것이고,
예를 들어 상기 차 벡터(D)내의 아무런 요소 D(k)도 소정의 제한값보다 더 크지 않을 수 있음을 요구함으로써, 또는 상기 차 벡터(D)의 제곱된 요소들 의 합이 소정의 제한값보다 더 크지 않을 수 있음을 요구함으로써, 상기 차 벡터(D)를 어떻게든 제한하는 것이다. 전형적으로 LP 필터는 대역 통과 또는 대역 차단 필터 특성이 아닌, 저역 통과 또는 고역 통과 필터 특성을 갖는다. 상기 협대역 LP 필터가 저역 통과 필터 특성을 갖는 경우, 상기 제한 값이 증가되는 방식으로 상기 소정의 제한 값은 이러한 사실과 관련이 있을 수 있다. 다른 한편으로, 상기 협대역 LP 필터가 고역 통과 특성을 갖는 경우, 상기 제한 값은 감소된다. 상기 차 벡터(D)를 참조하는 다른 적용가능한 제한들은 당업자에 의해 용이하게 연구될 수 있다.
다음에 상기 필터 벡터 b를 생성하는 몇몇 유리한 방법들을 설명할 것이다. 상기 LP 필터 폴들(poles)의 위치들은 그 요소들이 인접한 LP 벡터 요소들간의 차를 기술하는 상기 차 벡터(D)가 어떤 규칙성을 포함하도록 서로 어떤 상관을 갖는 경향이 있다. 자기상관 함수는 수학식 6과 같이 계산할 수 있다.
여기에서,
,
그리고 그것의 최대값, 즉 최대 자기상관도를 생성하는 인덱스 k의 값을 찾을 수 있다. 상기 인텍스 k의 이 값은 m으로서 표시할 수 있다. 상기 필터 벡터 b를 정하는 유리한 방법은 수학식 8과 같이 정하는 것이다.
이러한 방법으로 상기 필터 벡터 b는 상기 협대역 LP 필터의 규칙성을 따른다. 심지어 상기 외삽된 광대역 LP 필터의 새로운 요소들은 외삽 절차에서 상기 필터 b의 사용을 통해 이 특징을 물려받는다.
물론 상기 자기상관 함수인 수학식 6이 명백한 최대값을 가지지 않는 것이 가능하다. 이들 경우들을 고려하기 위하여 상기 외삽 필터 벡터 b가 그들의 중요도에 따라 상기 협대역 LP 필터에서의 모든 규칙성들을 형성해야 한다고 정의할 수 있다. 자기상관은 예를 들면 수학식 9에 따라, 이러한 정의의 수단으로서 사용될 수 있다.
더 일반적인 정의인 수학식 9는 상기 자기상관 함수에서 명백한 최대 피크가 존재하는 경우 상기에 주어진 더 간단한 정의인 수학식 8을 향해 수렴한다.
상기 광대역 LP 필터의 상기 LSF 벡터 표시는 샘플링비 를 갖는 신호들을 처리하는데 사용될 수 있는 실제 광대역 LP 필터로 변환될 준비가 되어 있다. 상기 광대역 LP 필터의 상기 LSP 벡터 표시가 바람직한 경우들을 위하여, LSF-LSP 변환은 수학식 10에 따라 수행될 수 있다.
상기 협대역 변환 수학식 1이 형성된 코사인 영역이 나이키스트 주파수 을 갖는 반면에, 상기 변환 수학식 10이 수행되는 상기 코사인 영역이 에서 나이키스트 주파수를 갖는다는 것은 주목되어야 한다.
상기 획득된 광대역 LP 필터의 총 이득은 종래 기술의 해법들에서 알려진 방식으로 조정되어야 한다. 상기 이득을 조정하는 것은 도 4의 부-블록(404)으로서 도시된 바와 같이 상기 외삽 블록(301)에서 일어날 수 있거나, 상기 보코더(105)의 일부일 수 있다. 도 1의 종래 기술의 해법과의 차이로서, 본 발명에 따라 생성된 상기 광대역 LP 필터의 총 이득은 종래 기술의 광대역 LP 필터의 총 이득보다 더 크도록 허용될 수 있는데, 이것은 도 2에 도시된 바와 같이, 이상적인 주파수 응답으로부터의 큰 발산들이 일어날 것 같지 않고 보호될 필요가 없기 때문이다.
도 6은 본 발명에 따라 외삽에 의해 생성된 광대역 LP 필터를 가지고 획득될 수 있는 전형적인 주파수 응답(601)을 도시한 것이다. 상기 주파수 응답(601)은 샘플링비 16 kHz를 갖는 음성 신호의 분석에서 사용될 0 내지 8000 Hz LP 필터의 주파수 응답을 나타내는 이상적인 곡선(201)을 아주 근접하게 따른다. 상기 외삽 접근법은 진폭 스펙트럼의 더 큰 스케일 경향을 아주 정확하게 형성하는 경향이 있고, 정확하게 상기 주파수 응답에서의 피크들을 국부화하는 경향이 있다. 도 1 및 도 2에 도시된 종래 기술의 장치를 능가하는 본 발명의 중대한 이점은 또한 상기 광대역 LP 필터의 주파수 응답이 연속적이라는 것인데, 즉, 종래 기술의 광대역 LP 필터의 주파수 응답에서 5600 Hz에서의 것과 같이 크기에서 어떤 순간적인 변화들을 가지지 않는다는 것이다.
음성 복호기 단독으로는 본 발명의 정신을 인간 사용자에 상상할 수 있는 이점들로 해석하기에 충분하지 않다. 도 7은 안테나(701)가 듀플렉스 필터(702)에 연결되어 있고, 상기 듀플렉스 필터는 차례로 무선 인터페이스상에서 디지털적으로 부호화된 음성을 수신하고 송신하기 위한 수신 블록(703) 및 송신 블록(704) 양자에 연결된 디지털 무선 전화를 도시한 것이다. 상기 수신 블록(703) 및 상기 송신 블록(704) 양자는 각각 수신된 제어 정보 및 송신될 제어 정보를 운반하기 위한 제어기 블록(707)에 연결된다. 부가적으로 상기 수신 블록(703) 및 송신 블록(704)은 각각 수신된 음성 및 송신될 음성을 처리하기 위한 기저대역 주파수 기능들을 포함하는 기저대역 블록(705)에 연결된다. 상기 기저대역 블록(705) 및 상기 제어기 블록(707)은 전형적으로 마이크로폰, 라우드스피커, 키패드 및 디스플레이(도 7에 특별히 도시되지 않음)로 구성된 사용자 인터페이스(706)에 연결된다.
상기 기저대역 블록(705)의 일부가 도 7에 상세히 도시된다. 상기 수신 블록(703)의 마지막 부분은 그 출력이 음성 복호화 및 합성에 종속될 필요가 있는 채널 복호화된 음성 프레임들로 구성된 채널 복호기이다. 상기 채널 복호기로부터 획득된 음성 프레임들은 프레임 버퍼(710)에 임시로 저장되고 거기에서 실제 음성 복호기(711)로 독출된다. 후자는 메모리(712)로부터 독출된 음성 복호화 알고리즘을 구현한다. 본 발명에 따라, 상기 음성 복호기(711)가 들어오는 음성 신호의 샘플링 주파수가 상승되어야 한다는 것을 알 때, 그것은 합성적으로 생성된 고 주파수 부-대역의 생성시 요구되는 상기 광대역 LP 필터를 생성하기 위하여 상기에 설명된 LP 필터 외삽 방법을 채용한다.
상기 기저대역 블록(705)은 전형적으로 비교적 큰 주문형 반도체(ASIC: Application Specific Integrated Circuit)이다. 본 발명의 사용은 상기 주문형 반도체의 복잡성과 전력 소비를 감소시키는 데 도움을 주는데, 이것은 특히 큰 검색 테이블들이 다양한 미리 계산된 광대역 LP 필터들을 저장하는데 사용된 종래 기술의 해법들과 비교할 때, 한정된 양의 메모리와 소수의 메모리 액세스들만이 상기 음성 복호기의 사용에 필요하기 때문이다. 상술된 계산들을 수행하는 것은 비교적 용이하기 때문에 본 발명은 상기 주문형 반도체의 성능에 과도한 요건들을 두지 않는다.

Claims (17)

  1. 제1 주파수 대역을 나타내는 선형 예측 부호화된 음성 신호를 수신하기 위한 입력 수단;
    상기 선형 예측 부호화된 음성 신호로부터 상기 제1 주파수 대역과 관련된 제1 선형 예측 필터를 기술하는 주파수 영역의 정보를 추출하기 위한 수단(103, 310);
    상기 제1 선형 예측 필터의 주파수 영역 필터 계수들 사이의 규칙성들에 대한 정보를 생성하기 위한 수단;
    입력 신호를 제2 주파수 대역을 나타내는 출력 신호로 변환하기 위한 보코더(vocoder)(105); 및
    상기 규칙성들을 기술하는 생성된 정보에 기초한 알고리즘을 이용하여, 상기 제2 주파수 대역상에서 상기 보코더(105)에 의해 사용될 제2 선형 예측 필터를 생성하기 위한 수단(301)을 포함하는 것을 특징으로 하는 음성 처리 장치.
  2. 제1항에 있어서,
    상기 제1 선형 예측 필터를 기술하는 정보를 주파수 영역에서 제1 파라미터 표시로 변환하기 위한 수단(401);
    상기 제1 파라미터 표시를 주파수 영역에서 제2 파라미터 표시로 외삽하기 위한 수단(402); 및
    상기 제2 파라미터 표시를 상기 제2 선형 예측 필터로 변환하기 위한 수단(403)을 포함하는 것을 특징으로 하는 음성 처리 장치.
  3. 제2항에 있어서, 상기 제1 파라미터 표시를 주파수 영역에서 제2 파라미터 표시로 외삽하기 위한 수단(402)은 무한 임펄스 응답 필터(502)를 포함하는 것을 특징으로 하는 음성 처리 장치.
  4. 제3항에 있어서, 상기 제1 파라미터 표시로부터 상기 무한 임펄스 응답 필터의 벡터 표시를 유도하기 위한 수단(501)을 포함하는 것을 특징으로 하는 음성 처리 장치.
  5. 제2항에 있어서, 상기 제2 파라미터 표시를 제한하기 위한 수단(404, 503)을 포함하는 것을 특징으로 하는 음성 처리 장치.
  6. 제1항에 있어서,
    선형 예측 부호화된 음성 신호를 제1 샘플링비를 가지며 제1 주파수 대역을 나타내는 제1 샘플 스트림으로 변환하기 위한 복호기(103);
    입력 신호를 제2 샘플링비를 가지며 제2 주파수 대역을 나타내는 제2 샘플 스트림으로 변환하기 위한 보코더(105);
    상기 제1 샘플 스트림 및 상기 제2 샘플 스트림을 처리된 형태로 결합하기 위한 결합 수단(107); 및
    상기 제1 주파수 대역상에서 상기 복호기(103)에 의해 사용되는 제1 선형 예측 필터에 기초하여, 상기 제2 주파수 대역상에서 상기 보코더(105)에 의해 사용될 제2 선형 예측 필터를 생성하기 위한 수단(301)을 포함하는 것을 특징으로 하는 음성 처리 장치.
  7. 제6항에 있어서,
    상기 복호기(103) 및 상기 결합 수단(107) 사이에 연결된 샘플링비 보간기(104); 및
    상기 보코더(105)와 상기 결합 수단(107) 사이에 연결된 고역 통과 필터(106)를 포함하는 것을 특징으로 하는 음성 처리 장치.
  8. 디지털 무선 전화기에 있어서,
    음성 처리 장치;
    상기 음성 처리 장치 내에 있는, 제1 주파수 대역을 나타내는 선형 예측 부호화된 음성 신호를 수신하기 위한 입력 수단;
    상기 음성 처리 장치 내에 있는, 상기 선형 예측 부호화된 음성 신호로부터 상기 제1 주파수 대역과 관련된 제1 선형 예측 필터를 기술하는 주파수 영역의 정보를 추출하기 위한 수단(103, 310);
    상기 음성 처리 장치 내에 있는, 상기 제1 선형 예측 필터의 주파수 영역 필터 계수들 사이의 규칙성들에 대한 정보를 생성하기 위한 수단;
    상기 음성 처리 장치 내에 있는, 입력 신호를 제2 주파수 대역을 나타내는 출력 신호로 변환하기 위한 보코더(vocoder)(105); 및
    상기 음성 처리 장치 내에 있는, 상기 규칙성들을 기술하는 생성된 정보에 기초한 알고리즘을 이용하여, 상기 제2 주파수 대역상에서 상기 보코더(105)에 의해 사용될 제2 선형 예측 필터를 생성하기 위한 수단(301)을 포함하는 것을 특징으로 디지털 무선 전화기.
  9. 선형 예측 부호화된 음성 신호로부터 제1 주파수 대역과 관련된 제1 선형 예측 필터를 기술하는 주파수 영역의 정보를 추출하는 단계(103);
    입력 신호를 제2 주파수 대역을 나타내는 출력 신호로 변환하는 단계(105);
    상기 제1 선형 예측 필터의 주파수 영역 필터 계수들 사이의 규칙성들에 대한 정보를 생성하는 단계; 및
    상기 규칙성들을 기술하는 생성된 정보에 기초한 알고리즘을 이용하여, 상기 입력 신호를 상기 출력 신호로 변환하는데 사용될 제2 선형 예측 필터를 생성하는 단계(301)를 포함하는 것을 특징으로 하는 디지털적으로 부호화된 음성을 처리하기 위한 방법.
  10. 제9항에 있어서,
    선형 예측 부호화된 음성 신호를 제1 샘플링비를 가지며 제1 주파수 대역을 나타내는 제1 샘플 스트림으로 변환하는 단계(103);
    입력 신호를 제2 샘플링비를 가지며 제2 주파수 대역을 나타내는 제2 샘플 스트림으로 변환하는 단계(105); 및
    상기 제1 샘플 스트림 및 상기 제2 샘플 스트림을 처리된 형태로 결합하는 단계(107)를 포함하며,
    상기 제1 주파수 대역상에서 상기 복호기에 의해 사용되는 제1 선형 예측 필터에 기초하여, 상기 제2 주파수 대역상에서 상기 보코더에 의해 사용될 제2 선형 예측 필터를 생성하는 단계(301)를 포함하는 것을 특징으로 하는 방법.
  11. 제10항에 있어서,
    상기 제1 선형 예측 필터를 주파수 영역에서 제1 파라미터 표시로 변환하는 단계(401);
    상기 제1 파라미터 표시를 주파수 영역에서 제2 파라미터 표시로 외삽하는 단계(402); 및
    상기 제2 파라미터 표시를 상기 제2 선형 예측 필터로 변환하는 단계(403)를 포함하는 것을 특징으로 하는 방법.
  12. 제10항에 있어서, 상기 제1 파라미터 표시를 주파수 영역에서 제2 파라미터 표시로 외삽하는 단계(402)는 무한 임펄스 응답 필터를 가지고 상기 제1 파라미터 표시를 필터링하는 부단계(502)를 포함하는 것을 특징으로 하는 방법.
  13. 제12항에 있어서, 상기 제1 파라미터 표시에서의 관찰된 규칙성으로부터 상기 무한 임펄스 응답 필터를 위한 벡터 표시를 계산하는 단계(501)를 포함하는 것을 특징으로 하는 방법.
  14. 제13항에 있어서, 상기 제1 파라미터 표시를 주파수 영역에서 제2 파라미터 표시로 외삽하는 단계(402)는, 상기 제2 파라미터 표시의 값들을
    로서 결정하는 부단계(502)를 포함하며, 상기에서 는 상기 제2 파라미터 표시의 i번째 값이고, k는 가산 인덱스이며, L은 상기 무한 임펄스 응답 필터의 차수이고, b((i-1)-k)는 상기 무한 임펄스 응답 필터를 위한 상기 벡터 표시의 ((i-1)-k)번째 요소인 것을 특징으로 하는 방법.
  15. 제14항에 있어서,
    m은 자기상관 함수 의 최대값을 생성하는 인텍스 k의 값이며, , 이고, 는 상기 제1 파라미터 표시의 i번째 요소이며, 은 상기 제1 파라미터 표시에서의 요소들의 수인 경우,
    이 되도록, 상기 무한 임펄스 응답 필터를 위한 상기 벡터 표시를 계산하는 부단계(501)를 포함하는 것을 특징으로 하는 방법.
  16. 제14항에 있어서,
    ,
    ,
    이고,
    는 상기 제1 파라미터 표시의 i번째 요소이며, 은 상기 제1 파라미터 표시에서의 요소들의 수인 경우,
    이 되도록,
    상기 무한 임펄스 응답 필터를 위한 상기 벡터 표시를 계산하는 부단계(501)를 포함하는 것을 특징으로 하는 방법.
  17. 제14항에 있어서,
    는 상기 제2 파라미터 표시에서의 요소들의 수이고, 은 상기 제1 파라미터 표시에서의 요소들의 수이며, 는 상기 제2 샘플링 주파수이고, 은 상기 제1 샘플링 주파수이며, 는 상기 제1 파라미터 표시의 i번째 요소이고, 는 상기 제2 파라미터 표시의 i번째 요소인 경우,
    의 조건들을 충족시키도록 상기 제2 벡터 표시를 제한하는 단계(503)를 포함하는 것을 특징으로 하는 방법.
KR10-2002-7011557A 2000-03-07 2001-03-06 음성 복호기 및 음성 복호 방법 KR100535778B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI20000524A FI119576B (fi) 2000-03-07 2000-03-07 Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
FI20000524 2000-03-07

Publications (2)

Publication Number Publication Date
KR20020081388A KR20020081388A (ko) 2002-10-26
KR100535778B1 true KR100535778B1 (ko) 2005-12-12

Family

ID=8557866

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-7011557A KR100535778B1 (ko) 2000-03-07 2001-03-06 음성 복호기 및 음성 복호 방법

Country Status (15)

Country Link
US (1) US7483830B2 (ko)
EP (1) EP1264303B1 (ko)
JP (2) JP2003526123A (ko)
KR (1) KR100535778B1 (ko)
CN (1) CN1193344C (ko)
AT (1) ATE343835T1 (ko)
AU (1) AU2001242539A1 (ko)
BR (1) BRPI0109043B1 (ko)
CA (1) CA2399253C (ko)
DE (1) DE60124079T2 (ko)
ES (1) ES2274873T3 (ko)
FI (1) FI119576B (ko)
PT (1) PT1264303E (ko)
WO (1) WO2001067437A1 (ko)
ZA (1) ZA200205089B (ko)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3467469B2 (ja) * 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
US8712768B2 (en) * 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
KR20070051878A (ko) * 2004-09-06 2007-05-18 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치 및 스케일러블 부호화 방법
ATE429698T1 (de) * 2004-09-17 2009-05-15 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten tonsignalen
KR20070085982A (ko) * 2004-12-10 2007-08-27 마츠시타 덴끼 산교 가부시키가이샤 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법
JP5046654B2 (ja) * 2005-01-14 2012-10-10 パナソニック株式会社 スケーラブル復号装置及びスケーラブル復号方法
MX2007012184A (es) * 2005-04-01 2007-12-11 Qualcomm Inc Sistemas, metodos y aparatos para codificacion de dialogo de banda ancha.
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
WO2013006322A1 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation Sample rate scalable lossless audio coding
FR3008533A1 (fr) 2013-07-12 2015-01-16 Orange Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences
DK3511935T3 (da) * 2014-04-17 2020-11-02 Voiceage Evs Llc Fremgangsmåde, indretning og computerlæsbar ikke-flygtig hukommelse til lineær-prædiktiv kodning og afkodning af lydsignaler efter overgang mellem rammer med forskellige afsøgningshastigheder
CN107945812B (zh) * 2014-04-25 2022-01-25 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法
KR102002681B1 (ko) 2017-06-27 2019-07-23 한양대학교 산학협력단 생성적 대립 망 기반의 음성 대역폭 확장기 및 확장 방법
CN108198571B (zh) * 2017-12-21 2021-07-30 中国科学院声学研究所 一种基于自适应带宽判断的带宽扩展方法及系统
CN116110409B (zh) * 2023-04-10 2023-06-20 南京信息工程大学 一种ASIP架构的大容量并行Codec2声码器系统及编解码方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0685607A (ja) 1992-08-31 1994-03-25 Alpine Electron Inc 高域成分復元装置
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
DE4343366C2 (de) 1993-12-18 1996-02-29 Grundig Emv Verfahren und Schaltungsanordnung zur Vergrößerung der Bandbreite von schmalbandigen Sprachsignalen
JP3230790B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3230791B2 (ja) 1994-09-02 2001-11-19 日本電信電話株式会社 広帯域音声信号復元方法
JP3483958B2 (ja) 1994-10-28 2004-01-06 三菱電機株式会社 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP2798003B2 (ja) * 1995-05-09 1998-09-17 松下電器産業株式会社 音声帯域拡大装置および音声帯域拡大方法
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
JP3301473B2 (ja) 1995-09-27 2002-07-15 日本電信電話株式会社 広帯域音声信号復元方法
EP0878790A1 (en) 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
EP0945852A1 (en) 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
JP3541680B2 (ja) * 1998-06-15 2004-07-14 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
JP2000305599A (ja) * 1999-04-22 2000-11-02 Sony Corp 音声合成装置及び方法、電話装置並びにプログラム提供媒体
WO2001035395A1 (en) * 1999-11-10 2001-05-17 Koninklijke Philips Electronics N.V. Wide band speech synthesis by means of a mapping matrix

Also Published As

Publication number Publication date
WO2001067437A1 (en) 2001-09-13
US20010027390A1 (en) 2001-10-04
DE60124079D1 (de) 2006-12-07
CA2399253A1 (en) 2001-09-13
JP4777918B2 (ja) 2011-09-21
BR0109043A (pt) 2003-06-03
FI20000524A (fi) 2001-09-08
PT1264303E (pt) 2007-01-31
BRPI0109043B1 (pt) 2017-06-06
CN1193344C (zh) 2005-03-16
ES2274873T3 (es) 2007-06-01
ATE343835T1 (de) 2006-11-15
JP2003526123A (ja) 2003-09-02
CN1416561A (zh) 2003-05-07
EP1264303A1 (en) 2002-12-11
CA2399253C (en) 2010-11-23
JP2007156506A (ja) 2007-06-21
AU2001242539A1 (en) 2001-09-17
KR20020081388A (ko) 2002-10-26
FI20000524A0 (fi) 2000-03-07
FI119576B (fi) 2008-12-31
EP1264303B1 (en) 2006-10-25
ZA200205089B (en) 2003-04-30
US7483830B2 (en) 2009-01-27
DE60124079T2 (de) 2007-03-08

Similar Documents

Publication Publication Date Title
JP4777918B2 (ja) 音声処理装置及び音声を処理する方法
US9818418B2 (en) High frequency regeneration of an audio signal with synthetic sinusoid addition
JP3869211B2 (ja) 広帯域信号の復号における周期性の強調
RU2469422C2 (ru) Способ и устройство для формирования уровня улучшения в системе кодирования звука
CA2562916C (en) Coding of audio signals
JP3983668B2 (ja) 高周波数の再構成方法を使用するコーディング・システムの性能拡大方法
JP3513292B2 (ja) 雑音荷重フィルタリング方法
JP5192630B2 (ja) 符号化音響信号の知覚的に改善した増強
JPS6161305B2 (ko)
EP0837453B1 (en) Speech analysis method and speech encoding method and apparatus
JP2004101720A (ja) 音響符号化装置及び音響符号化方法
JP2002055699A (ja) 音声符号化装置および音声符号化方法
US6052659A (en) Nonlinear filter for noise suppression in linear prediction speech processing devices
JPH0946233A (ja) 音声符号化方法とその装置、音声復号方法とその装置
JP2005114814A (ja) 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体
JP2006119301A (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
JPH11194799A (ja) 楽音符号化装置および楽音復号化装置および楽音符号化復号化装置およびプログラム記憶媒体

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121123

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20131119

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20141124

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20151118

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20161123

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20171117

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20181115

Year of fee payment: 14