KR20070038041A - 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치 - Google Patents

전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치 Download PDF

Info

Publication number
KR20070038041A
KR20070038041A KR1020067026075A KR20067026075A KR20070038041A KR 20070038041 A KR20070038041 A KR 20070038041A KR 1020067026075 A KR1020067026075 A KR 1020067026075A KR 20067026075 A KR20067026075 A KR 20067026075A KR 20070038041 A KR20070038041 A KR 20070038041A
Authority
KR
South Korea
Prior art keywords
rate
parameter
input
bitstream
codec
Prior art date
Application number
KR1020067026075A
Other languages
English (en)
Inventor
마완 에이 자브리
지안웨이 왕
사메 조지
Original Assignee
딜리시움 네트웍스 피티와이 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 딜리시움 네트웍스 피티와이 리미티드 filed Critical 딜리시움 네트웍스 피티와이 리미티드
Publication of KR20070038041A publication Critical patent/KR20070038041A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Abstract

제1 레이트의 제1 음성 압축 방법에 따라 부호화된 데이터의 프레임을 나타내는 비트스트림을 제2 레이트에 따라 제2 음성 압축 방법으로 변환하는 멀티-레이트 음성 부호화기를 통해 데이터의 비트스트림을 트랜스-레이팅하는 방법 및 장치가 제공된다. 트랜스-레이팅 쌍은 음성 압축 파라미터 매핑 모듈을 포함한다. 상기 트랜스-레이팅 방법은, 제1 레이트 음성 압축 방법에 따른 레이트 정보 및 음성 압축 파라미터를 획득하기 위해, 입력 사이트에서의 부호화된 패킷에 대한 비트 언패킹 또는 비양자화 중 하나를 포함한다. 다음으로, 외부 제어 명령에 더하여, 상기 제1 레이트 및 요구되는 출력 레이트, 즉, 제2 레이트 타입의 정보가, 트랜스-레이팅 쌍의 변환 전략을 결정하기 위해 사용된다. 다음으로, 제1 레이트의 압축 파라미터 중 적어도 몇몇은 패스-쓰루되거나 또는 제2 레이트 음성 압축 방법과 양립가능한 제2 레이트의 압축 파라미터로 매핑된다.
레이트, 트랜스-레이트, CELP, 음성 부호화기, 비트스트림, 패스-쓰루, 매핑

Description

전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서 음성 트랜스-레이팅을 위한 방법 및 장치 {METHOD AND APPARATUS FOR VOICE TRANS-RATING IN MULTI-RATE VOICE CODERS FOR TELECOMMUNICATIONS}
본 발명은 일반적으로 전기 통신 신호의 처리에 관련된다. 보다 구체적으로, 본 발명은 하나의 데이터 레이트(rate) 부호화 방법의 제1 음성 압축 비트스트림으로부터 다른 데이터 레이트의 제2 음성 압축 비트스트림으로의 트랜스-레이팅(trans-rating)을 위한 방법 및 장치에 관련된다. 단지 예시를 위하여, 본 발명은 멀티-레이트(multi-rate) 또는 멀티-코드(multi-code) 코드 여기 선형 예측(Code Excited Linear Prediction; CELP) 기반 음성 압축 코덱(codec)에 있어서의 음성 트랜스-레이팅에 적용되었지만, 본 발명은 또한 다른 응용 분야를 포함할 수 있음을 인식하여야 한다.
트랜스-레이팅은 다른 레이트로 동작하는 두 개의 터미널 사이의 차이를 브리지(bridge)하기 위해 사용되는 디지털 신호 처리 기술이다. 이는 전형적으로, 둘 또는 그 이상의 터미널이, 활성 발언(speech) 모드의 8개의 다른 레이트와 비활 성 발언에 대한 SID 및 DTX 프레임 하에서 동작할 수 있는 GSM-AMR 코덱과 같은 멀티-레이트 음성 코덱을 포함할 때 발생한다. GSM-AMR 터미널이 12.2kbps의 최고 레이트로 동작하고 4.95kbps 또는 다른 레이트로 동작하는 다른 GSM-AMR 터미널과의 통신을 시도할 때, 트랜스-레이팅이 요구된다.
종래의 트랜스-레이팅 방식 중 하나는, 입력 비트스트림을 발언 신호로 복호화하고 다른 레이트의 음성 압축 방법에 따라 이 발언 신호를 재부호화함으로써 레이트 변환을 수행한다. 이러한 복호화 및 재부호화 처리는, 음성 압축 파라미터를 얻기 위해 비트-언패킹(bit-unpacking)하고, 펄스-부호화-변조(pulse-coded-modulated; PCM) 포맷 음성 신호를 합성하고, 상기 음성 신호를 후 필터링하고, 다시 음성 압축 파라미터를 얻기 위해 상기 PCM 발언 신호를 해석하고, 제2 레이트의 음성 부호화 방법에 따라, LSP, 적응 코드북(adaptive codebook) 파라미터, 적응 코드북 이득(gain), 고정 코드북 인덱스(fixed codebook index) 파라미터 및 고정 코드북 이득과 같은 음성 압축 파라미터를 재부호화하는 것을 포함하는, 상당한 양의 연산을 수반한다.
상기 종래의 트랜스-레이팅 처리는, 재부호화 처리에 있어서 예견(look-ahead)에 기인하는 적어도 하나의 추가적인 프레임 알고리즘 지연에 의해 지연이 증가한다는 점에서, 또 다른 단점을 갖는다.
스마트 트랜스-레이팅(smart trans-rating)은 복호화하고 재부호화하는 종래의 방법이 아니고, 완전히 다른 도메인에서 동작한다. 스마트 트랜스-레이팅은 압축 파라미터 도메인에 제한된 비트스트림 변환을 수행한다. 많은 경우, 다른 레이 트들을 위한 몇 개의 정의된 수학적 매핑이, 원래의 비트스트림으로부터 목적지 비트스트림으로 CELP 파라미터 인덱스에 적용된다. 이러한 파라미터들은 LPC, 적응 코드북 파라미터, 적응 코드북 이득, 고정 코드북 인덱스 파라미터 및 고정 코드북 이득 파라미터에 적용가능하다.
종래의 트랜스-레이팅의 한계를 극복하고 스마트 트랜스-레이팅 원리를 효과적으로 적용하는 기술이 요구된다.
이에 따라, 본 발명은 제1 레이트의 음성 패킷 데이터를 제2 레이트의 음성 패킷 데이터로 전환하는, 멀티-레이트 음성 부호화기 비트스트림 트랜스-레이팅 장치 및 방법에 관한 것이고, 입력 비트스트림 언패커(unpacker), 하나 또는 그 이상의 트랜스-레이팅 쌍, 패스-쓰루(pass-through) 모듈, 구성(configuration) 모듈, 및 출력 비트스트림 패커(packer)를 포함한다. 각각의 트랜스-레이팅 쌍은, 직접(direct) 공간 도메인 매핑을 위한 모듈들 사이의 적어도 하나의 음성 압축 파라미터 매핑 모듈, 여기 도메인(excitation domain) 매핑에 있어서의 해석, 및 필터링된 여기 도메인 매핑에 있어서의 해석을 포함한다. 마지막으로, 상기 장치는 패스-쓰루 부분과 매핑 부분을 혼합하는 모듈을 포함한다. 상기 트랜스-레이팅 방법은, 레이트 정보와 제1 레이트의 음성 압축 방법에 따른 음성 압축 파라미터를 얻기 위해, 입력 사이트에서의 부호화된 패킷에 대한 비트-언패킹 또는 비양자화(unquantization) 중 어느 하나를 포함한다. 다음으로, 외부 제어 명령에 더하여, 제1 레이트 및 요구되는 출력 레이트, 다시 말해, 제2 레이트 타입에 관한 정보가 트랜스-레이팅 쌍의 전환 전략을 결정하기 위해 사용된다. 다음으로, 제1 레이트의 압축 파라미터의 일부 또는 전체가 패스-쓰루(pass-through)되거나, 또는 제2 레이트의 음성 압축 방법과 양립할 수 있는 방법으로 제2 레이트의 압축 파라미터로 매핑된다.
상기 변환 방식은 변형될 수 있고, 제1 레이트 압축 방법과 제2 레이트 압축 방법의 쌍의 특징에 기초하여 최적화될 수도 있다. 마지막으로, 제2 레이트의 음성 압축 파라미터들이, 제2 레이트의 멀티-레이트 음성 부호화기 표준과 양립할 수 있는 비트스트림으로 팩(pack)된다.
본 발명에 따른 장치는 예를 들어 다음을 포함한다.
- 제1 레이트의 음성 코덱 압축 방법에 따라 입력된 제1 레이트의 음성 패킷으로부터 제1 레이트 정보와 그것의 음성 압축 파라미터를 추출하는 음성 압축 코드 파라미터 언팩 모듈. CELP 기반 코덱의 경우, 이러한 파라미터들은, 다른 파라미터뿐만 아니라, 선 스펙트럼 주파수 파라미터(line spectral frequencies parameters), 적응 코드북 파라미터, 적응 코드북 이득 파라미터, 고정 코드북 이득 파라미터 및 고정 코드북 인덱스 파라미터가 될 수 있다;
- 입력 비트스트림 데이터 레이트 또는 모드, 입력 비트스트림 프레임 에러 플래그(flag), 요구되는 출력 비트스트림 데이터 레이트 또는 모드, 및 외부 제어 명령을 수취하고, 트랜스-레이팅 전략의 결정을 생성하기 위해 출력 데이터 레이트 또는 모드의 결정을 출력하는 트랜스-레이팅 제어기 모듈;
- 발신지(source) 비트스트림 언패커로부터 생성되는 제1 레이트의 입력 발언 파라미터를 제2 레이트 코덱의 양자화된 발언 파라미터로 전환하는 적어도 하나의 트랜스-레이팅 쌍 모듈;
- 만약 출력 제2 레이트 코덱이 입력 제1 레이트 코덱과 동일하다면, 입력 부호화된 파라미터를 출력 부호화된 파라미터로 바로 통과시키는 적어도 하나의 패스-쓰루 모듈; 및
- 상기 전환되고 양자화된 제2 레이트의 발언 파라미터들을 출력 비트스트림 패킷으로 그룹화하는 음성 압축 코덱 비트스트림 패커.
본 발명은 다음의 목적을 갖는다:
- 압축된 음성 파라미터 도메인에서 멀티-레이트 음성 부호화기의 서로 다른 음성 코덱 레이트 비트스트림 사이의 스마트 음성 트랜스-레이팅을 수행한다;
- 파라미터 공간에서 파라미터를 매핑함으로써 음성 품질을 향상시킨다;
- 트랜스-레이팅 처리를 통해 지연을 감소시킨다;
- 트랜스-레이팅 처리의 연산 복잡성을 감소시킨다;
- 트랜스-레이팅 처리에 의해 요구되는 컴퓨터 메모리의 양을 감소시킨다;
- 동일 레이트의 비트스트림 전환, 또는 입력 비트스트림으로부터 감소될 수 있는 출력 레이트의 출력 비트스트림을 갖는, 다른 레이트의 비트스트림 전환에서 패스-쓰루 특성을 지원한다;
- 현재의 그리고 미래의 멀티-레이트 음성 코덱에 적합할 수 있는 포괄적인 트랜스-레이팅 구조를 제공한다.
본 발명의 일 국면에 따라, 트랜스-레이팅 모듈 장치는 복수의 전략에 기초하여 CELP 파라미터 매핑 전략을 선택하도록 된 결정 모듈, 및 적어도 하나의 전환 모듈을 더 포함하고, 상기 전환 모듈은 다음을 포함한다:
- 어떤 반복 없이 직접적인 해석학적 공식(formulae)을 사용하여 목적지 데이터 레이트 압축 파라미터를 생산하는 음성 압축 파라미터 직접(direct) 공간 매핑을 위한 모듈;
- 여기 공간 도메인에서 검색을 수행함으로써 목적지 데이터 레이트 압축 파라미터를 생산하는 매핑의, 상기 여기 공간 도메인에서의 해석을 위한 모듈;
- 필터링된 여기 공간에서 여기 공간 및 고정 코드북의 폐루프 적응 코드북을 검색함으로써 목적지 데이터 레이트 압축 파라미터를 생산하는 매핑의, 상기 필터링된 여기 공간에서의 해석을 위한 모듈;
- 입력 데이터 레이트 비트스트림의 파라미터의 일부가 출력 데이터 레이트 비트스트림의 파라미터와 동일한 양자화된 값을 갖는 경우, 양자화된 파라미터 패스-쓰루 부분을 혼합하는 패스-쓰루 혼합된 매핑을 위한 모듈.
특정의 트랜스-레이팅 쌍에서 선택된 상기 매핑 모듈은 미리 정의되거나 또는 상기 결정에 의해 동적으로 선택될 수 있다.
본 발명의 다른 국면에서, 제1 레이트 비트스트림을 멀티-레이트 음성 부호화기의 제2 레이트 비트스트림으로 트랜스-레이팅하는 방법은 다음의 단계를 포함한다:
- 제1 레이트 또는 모드, 또는 입력 코덱 비트스트림의 잘못된 패킷을 식별하는 입력된 제1 레이트의 음성 코덱 비트스트림의 헤더(header)를 처리하는 단계;
- 제1 레이트 코덱의 입력 비트스트림을 적어도 하나의 음성 압축 파라미터의 셋트로 언패킹하는 단계;
- 제1 레이트 입력 비트스트림을 요구되는 제2 레이트 코덱 출력 비트스트림으로 전환하는 트랜스-레이팅 쌍을 구성하는 단계;
- 제1 레이트의 하나 또는 그 이상의 음성 부호화된 파라미터를 제2 셋트의 레이트 부호화된 압축 파라미터로 전환하는 단계;
- 입력 제1 레이트 코덱의 음성 압축 파라미터의 양자화가 출력 제2 레이트 코덱과 동일한 경우, 입력된 하나 또는 그 이상의 셋트의 부호화된 파라미터를 출력으로 바로 패스-쓰루하는 단계;
- 출력된 제2 레이트의 부호화된 파라미터 셋트(들)을 출력 제2 레이트의 코덱 비트스트림으로 패킹하는 단계.
상기 일반적인 설명과 이하의 상세한 설명은 모두 예시이며 특허청구범위에 기재된 발명에 대한 보다 상세한 설명을 제공하기 위한 것임을 이해하여야 한다.
본 발명은, 그 구성과 동작의 방식 모두에 있어서, 또 다른 목적과 이점과 함께, 첨부된 도면과 관련된 이하의 설명을 참조로 가장 잘 이해될 수 있다.
도 1은 멀티-레이트 음성 부호화기의 트랜스-레이팅을 설명하는 종래의 처리 방식의 블록도이다.
도 2는 복호화 및 재부호화 처리를 통해 하나의 코덱 레이트 비트스트림으로부터 다른 레이트 비트스트림으로 비트스트림을 전환하기 위한 일반적인 트랜스-레이트 접속을 도시한 종래 시스템의 블록도이다.
도 3은 완전한 복호화 및 재부호화 없이 하나의 코덱 레이트 비트스트림으로부터 다른 레이트 비트스트림으로 비트스트림을 전환하기 위한 일반적인 트랜스-레이트 접속을 도시한 블록도이다.
도 4는 종래의, 20초 프레임마다의 적응-멀티-레이트(Adaptive-Multi-Rate; AMR, 또한 소위 GSM-AMR) 음성 부호화기 멀티-레이트 비트 할당을 도시하는 테이블이다.
도 5는 본 발명의 대표적인 실시예의 음성 트랜스-레이팅을 도시하는 블록도이다.
도 6은 패킷 타입 검출과 파라미터 비양자화를 포함하는 입력 비트스트림 언패킹을 도시하는 블록도이다.
도 7은 코드 여기 선형 예측(CELP) 기반 음성 코덱에서의 파라미터 비양자화를 도시하는 블록도이다.
도 8은 트랜스-레이팅 모듈을 도시하는 블록도이다.
도 9는 직접(direct) CELP 파라미터 공간 매핑을 통한 트랜스-레이팅 처리를 도시하는 블록도이다.
도 10은 CELP 여기 파라미터 공간 매핑을 통한 트랜스-레이팅 처리를 도시하는 블록도이다.
도 11은 여기 벡터 교정(calibration)을 도시하는 블록도이다.
도 12는 CELP 여기 파라미터 공간 및 필터링된 여기 파라미터 공간 매핑을 통한 트랜스-레이팅 처리를 도시하는 블록도이다.
도 13은 파라미터 패스-쓰루 및 매핑의 혼합 모듈을 도시하는 블록도이다.
도 14는 AMR에서 패스-쓰루와 레이트 5.15kbps로부터 레이트 4.75kbps로의 매핑의 혼합을 사용하는 트랜스-레이팅의 일 예를 도시하는 블록도이다.
도 15는 AMR에서 패스-쓰루와 레이트 4.75kbps로부터 레이트 5.15kbps로의 매핑의 혼합을 사용하는 트랜스-레이팅의 일 예를 도시하는 블록도이다.
도 16은 AMR에서 레이트 12.2kbps로부터 레이트 4.75kbps로의 필터링된 여기 방법에 있어서의 해석을 사용하는 트랜스-레이팅의 일 예를 도시하는 블록도이다.
도 17은 AMR에서 레이트 4.75kbps로부터 레이트 12.2kbps로의 필터링된 여기 방법에 있어서의 해석을 사용하는 트랜스-레이팅의 일 예를 도시하는 블록도이다.
하기에서, 설명을 목적으로, 다수의 특정한 상세가 본 발명에 대한 철저한 이해를 제공하기 위해 기술된다. 서로 다른 멀티-레이트 음성 부호화기 GSM-AMR 레이트의 트랜스-레이팅이 설명을 위해 예로서 사용된다. 여기서 설명되는 방법은 일반적으로 멀티-레이트 코덱의 임의의 쌍 사이의 트랜스-레이팅에 적용된다. 관련 기술 분야에서 숙련된 자는, 본 발명의 사상이나 영역을 벗어나지 않고, 다른 단계, 구성 및 배열이 사용될 수 있음을 인식할 것이다.
본 발명은 멀티-레이트 음성 부호화기에서 서로 다른 코드 레이트의 두 개의 코덱 사이의 스마트 트랜스-레이팅을 수행하기 위해 사용되는 방법을 포함한다. 본 발명은 또한, 요구되는 출력 비트스트림의 레이트 코덱이 입력 비트스트림의 그것과 동일한, 트랜스-레이팅 패스-쓰루의 특별한 경우를 포함한다. 이하의 단락은 본 발명의 상세를 논의한다.
도 5는 본 발명의 제1 실시예에 따른 멀티-레이트 음성 부호화기 트랜스-레이팅 장치 10을 도시하는 블록도이다. 상기 장치는, 입력 비트스트림 언팩 모듈 12, 적어도 하나의 트랜스 레이팅 쌍 모듈 16, 18, 20, 적어도 하나의 패스-쓰루 모듈 22를 포함하는 스마트 보간 엔진(smart interpolation engine) 14와, 라우팅 스위치 26과 28을 제어하는 트랜스-레이팅 제어 명령 모듈 24, 그리고 및 출력 비트스트림 팩 모듈 30을 포함한다. 장치 10은 제1 레이트의 음성 코덱 비트스트림을 입력 비트스트림 언팩 모듈 12로의 입력으로서 수신하고, 레이트 정보의 결과를 구성 제어 명령 모듈 24로 통과시킨다. 구성 제어 명령 모듈 24는, 특정의 트랜스-레이팅 쌍 모듈 16 또는 패스-쓰루 모듈 22를 결정하고 입력 비트스트림 언팩 모듈 12로부터 출력 비트스트림 팩 모듈 30으로의 데이터 흐름의 스위칭을 제어하기 위해, 입력 레이트 정보, 요구되는 출력 레이트 정보 및 외부 네트워크 명령을 수취한다. 트랜스-레이팅 쌍 모듈 16은 입력 레이트 코덱의 압축된 파라미터를 출력 레이트 코덱의 양자화된 음성 압축된 파라미터로 전환한다. 패스쓰루 모듈 22는 입력 레이트 코덱의 양자화된 파라미터를 바로 출력 레이트 코덱의 양자화된 파라미터로 통과시키거나, 심지어는 입력 비트스트림 패킷을 바로 통과시킨다. 출력 비트스트림 패킷 모듈 30은 전환되고 양자화된 출력 레이트 코덱 파라미터를 출력 비트스트림 패킷으로 그룹화한다.
도 6은, 입력 비트스트림 검출 모듈 32와 CELP 압축된 파라미터 비양자화 모듈 34를 포함하는 입력 비트스트림 언팩 모듈 12의 구조를 도시한다. 비트스트림 식별기 모듈 32는 레이트 정보 보간 및 에러 검출을 수행한다. 이것은 비트스트림의 데이터 레이트 정보를 출력하고 비트스트림의 페이로드를 압축 파라미터 비양자화 모듈(도시되지 않음)로 통과시킨다. 만약 비트스트림에서 에러가 검출되면, 모듈 32는 프레임 에러 플래그를 발신한다.
도 7은 또한 입력 비트스트림 언팩 모듈 12의 CELP 기반 음성 압축 파라미터 비양자화 모듈 34의 블록도를 도시한다. 비양자화 모듈 34는, 코드 분리기 36과 소위, LSP 비양자화기인, 다른 압축 파라미터 비양자화기 유닛 38, 피치 래그(pitch lag) 코드 비양자화기 40, 적응 코드북 이득 코드 비양자화기 42, 고정 코드북 이득 코드 비양자화기 44, 고정 코드북 코드 비양자화기 46, 레이트 코드 비양자화기 48, 프레임 에너지 코드 비양자화기 50, 및 코드 인덱스 패스-쓰루 52를 포함한다. 각각의 비양자화기들은, 각 프레임에 대한 비트스트림 페이로드 코드를 LSP 코드, 피치 래그 코드, 적응 코드북 이득 코드, 고정 코드북 이득 코드, 고정 코드북 벡터 코드, 레이트 코드, 및 프레임 에너지 코드로 분리하기 위해 적용되고, 각각의 선택은 발신지 코덱의 부호화 방법에 기초한다. 실제 사용가능한 파라미터 코드들은 코덱 그 자체, 비트-레이트, 그리고 만약 적용가능하다면 프레임 타입에 의존한다. 이러한 코드들은, 각각 LSP, 피치 래그, 적응 코드북 이득, 고정 코드북 이득, 고정 코드북 벡터, 레이트, 및 프레임 에너지를 출력하는, 적절한 코드 비양자화기로 입력된다. 종종 많은 CELP 부호화기에서 사용되는 다중 서브프레임 여기 처리에 기인하여 각각의 코드 비양자화기의 출력에서 하나 이상의 값이 가능하다. 프레임에 대한 CELP 파라미터들은 다음 단계로 입력된다.
트랜스-레이팅 제어 모듈은, 도 5에 도시된 바와 같이, 입력 비트스트림의 패킷 타입과 데이터 레이트와, 제2 코덱 레이트의 출력의 외부 제어 명령을 수신한다. 이것은 입력 비트스트림과 출력 레이트 요구를 기초로, 트랜스-레이팅 쌍 모듈 중 하나를 선택하기 위해 스위칭 모듈을 제어한다. 만약 요구되는 출력 레이트가 입력 비트스트림 레이트와 동일하다면 패스-쓰루 모듈을 선택하는 것이 가능하다. 예를 들어, 만약 입력 비트스트림이 침묵 기술 프레임 타입(silence description type)이고, 침묵 기술의 타입과 포맷이 요구되는 출력 레이트 코덱과 동일하다면, 트랜스-레이팅 제어 모듈은 트랜스-레이팅 처리 중에 침묵 기술 프레임을 수행하도록 패스-쓰루 모듈을 선택할 것이다.
도 8은 특정 레이트 전환을 수행하는 트랜스-레이팅 쌍 모듈 16의 구조를 도시한다. 입력 레이트 코덱 양자화된 파라미터의 일부를 출력 레이트 코드 파라미터로 패스-쓰루하는 것과 파라미터의 다른 부분을 매핑하는 것의 혼합을 사용하는 요소 56; 어떠한 추가적인 해석이나 반복 없이 입력 레이트 코덱 비양자화 파라미터로부터 대응하는 출력 레이트 코덱 파라미터로의 직접 매핑을 위한 요소 58; 여기 도메인에서의 해석을 위한 요소 60; 및 필터링된 여기 도메인에서의 해석을 위한 요소 62, 또는, 여기 공간에서 적응 코드북을 검색(도시되지 않음)하고 필터링 된 여기 공간에서 고정 코드북을 검색(도시되지 않음)하는 것과 같은 이러한 전략들의 조합을 포함하는, 몇 가지 매핑 방식이 사용될 수 있다. 이러한 4개의 매핑 타입은 모듈 16 내의 스위치 제어 유닛 24로서 도시된 트랜스-레이팅 결정 전략에 의해 제어된다.
전략 결정 모듈 24(도 8)로서도 알려진 트랜스-레이팅 제어 명령 모듈 24(도 5)는 어떤 매핑 전략이 적용되어야 하는지를 결정한다. 그 결정은 특정의 입력 레이트 및 출력 레이트의 코덱 트랜스-레이팅 쌍 사이의 유사점과 차이점의 특징에 기초하여 미리 정의될 수 있다. 입력 레이트 코덱의 압축 파라미터의 일부는 선택된 출력 레이트 코덱과 유사한 양자화 방식과 양자화 테이블을 갖는다면, 패스-쓰루와 매핑의 혼합 모드가 트랜스-레이팅을 위한 적절한 선택이 될 수 있다.
상기 결정은 가용의 연산 리소소(resource) 또는 최소 품질 요구에 기초하여 동적으로 변경될 수 있다. 입력 레이트 코덱의 압축된 파라미터는 연산 복잡성의 댓가로 더 낳은 품질의 출력을 계속하여 제공하는 다수의 방식으로 매핑될 수 있다. 최고의 품질에서, 변환부호화 알고리즘의 연산 복잡성은 억지 탠덤(brute-force tandem) 방식의 그것보다 여전히 낮다. 상기 네 가지 방법은 품질을 감소된 연산 부하를 교환하기 때문에, 장치가 동시에 다수 채널에 의해 과부하된 경우에 품질의 적절한 열화를 제공하도록 사용될 수 있다. 이렇게 해서 트랜스-레이팅의 성능이 가용 리소스를 적응시킬 수 있다.
도 9, 10, 11 및 12는 네 개의 다른 음성 압축 파라미터 기반 매핑 전략을 상세하게 도시한다. 가장 간단한 도 9로부터 시작해서, 이들은 연산 복잡성과 출 력 품질의 순서로 도시된다. 또한, 도 13은 일부 패스-쓰루와 일부 매핑의 방법을 도시한다. 이 방법은 동일한 양자화 알고리즘과 양자화 테이블을 공유하는 입력 레이트 코덱과 출력 레이트 코덱에서 선택된 압축 파라미터에 적용된다. 본 발명의 주요 특성은 멀티-레이트 음성 부호화기 트랜스-레이팅에서 음성 압축 파라미터가 발언 신호를 재구성할 필요없이 직접 매핑될 수 있다는 것이다. 종래의 탠덤 기술에 의해 요구되는 것처럼 신호가 단기 임펄스 응답(short-term impulse response)에 의해 필터링될 필요가 없기 때문에, 이는 폐루프 코드북 검색을 하는 동안 상당한 양의 연산을 하지 않아도 된다는 것을 의미한다. 입력 레이트 비트스트림 메커니즘(mechanism)이 이미 발언을 생성하기 위한 최적의 압축된 파라미터를 결정했기 때문에, 이러한 매핑이 잘 작동한다. 본 발명은 완전한 발언 도메인보다는 여기 도메인에서의, 빠른 패스-쓰루, 또는 직접 매핑, 또는 검색을 위해 이러한 사실을 이용한다.
특히 도 9를 참조하면, 직접 공간 매핑 102의 블록도가 도시된다. 이것은 입력 레이트 코덱 비트스트림 104의 다양한 비양자화되고 압축된 파라미터를 수신하고 직접 압축된 파라미터 매핑을 수행한다. 전형적인 CELP 코덱에서, 이것은 LSP 파라미터, 적응 코드북 파라미터, 적응 코드북 이득 파라미터, 고정 코드북 파라미터, 및 고정 코드북 이득 파라미터를 매핑한다. 각 타입의 파라미터 매핑 후에, 이것은 출력 레이트 코덱에 따라 이러한 파라미터들을 재양자화하고 출력 레이트 코덱 비트스트림 패킹의 다음 단계로 보낸다.
패스-쓰루 또는 부분적인 패스-쓰루 방법 외에, 직접 공간 매핑은 가장 간단 한 트랜스-레이팅 기법이다. 매핑은 입력 레이트 코덱과 출력 레이트 코덱 파라미터의 물리적 의미의 유사성을 기초로 하고, 트랜스-레이팅은 어떠한 반복이나 광범위한 검색없이 해석적 공식을 사용하여 직접적으로 수행된다. 이러한 기법의 이점은 많은 양의 메모리를 요구하지 않고 거의 0의 MIPS를 소모하면서도, 품질이 열화되기는 했지만 여전히 명료한 음성을 생성할 수 있다는 점이다. 이 방법은 다른 서브프레임 크기 또는 다른 압축된 파라미터 표현(representation)에 관하여, 포괄적이며 멀티-레이트 음성 부호화기 트랜스-레이팅의 모든 종류에 적용된다.
도 10은 여기 매핑 104에 있어서의 해석의 블록도를 도시한다. 이것은 입력 레이트 코덱 비트스트림으로부터 비양자화된 LSP 파라미터를 수신하고 출력 레이트 코덱 포맷으로의 매핑을 수행한다. 적응 코드북 및 고정 코드북 파라미터들이 어떠한 검색이나 반복없이 입력 비트스트림 언패킹으로부터 출력 레이트 코덱으로 직접적으로 매핑되는 직접 공간 매핑을 제외하고는, 여기 신호가 재구성된다. 상기 여기의 재구성은 적응 코드북, 적응 코드북 이득, 고정 코드북, 및 고정 코드북 이득의 파라미터를 요구한다.
이 방법은 적응 및 고정 코드북이 검색되고, 이득이 발언 도메인이 아니라 여기 도메인에서 추정된다는 것을 제외하고, 출력 레이트 코덱에 의해 정의된 통상의 방법으로 추정된다는 점에서 직접 공간 매핑 방법 102보다 더 진보적이다. 적응 코드북은 초기 추정으로서, 우선 입력 코덱 비트스트림으로부의 비양자화된 적응 코드북 파라미터를 사용하는 국부적 검색에 의해 결정된다. 상기 검색은 초기 추정의 작은 구간 내이며, 목적지 코덱에 의해 요구되는 정확도(정수 또는 분수 피 치)이다. 적응 코드북 이득은 가장 좋은 코드워드 벡터에 대해 결정된다. 발견되면, 적응 코드워드 벡터 기여도(contribution)가 여기(excitation)로부터 감해지고, 고정 코드북은 나머지에 대한 최적의 매칭(matching)에 의해 결정된다. 종래의 탠덤 방식에 대비되는 이점은 개루프 적응 코드북 추정이 CELP 표준에 의해 사용되는 자기 수정(auto-correction) 방법으로부터 연산되어야 할 필요가 없고, 대신 입력 비트스트림의 비양자화된 파라미터로부터 결정될 수 있다. 또한, 검색은 발언 도메인이 아니라 여기 도메인에서 수행되기 때문에, 적응 코드북 및 고정 코드북 검색 중의 임펄스 응답 필터링이 요구되지 않는다. 이는 출력 음성 품질을 양보함이 없이 상당한 양의 연산을 줄인다.
입력 레이트 코덱과 출력 레이트 코덱 사이의 LSP파라미터의 차이를 고려하면, LSP 파라미터의 효과를 보상하기 위해 재구성된 여기가 교정될 수 있다. 도 11은 여기 교정 방법 106을 도시한다. 입력 비양자화된 파라미터의 재구성된 여기 벡터 형식은 발언 도메인으로 전환하기 위해 입력 레이트 코덱의 LPC 계수에 의해 합성되고, 다음으로 매핑에 있어서의 표적 신호를 형성하기 위해 출력 레이트 코덱의 재양자화된 LPC 파라미터를 사용하여 필터링된다. 이러한 교정은 선택적이며, 입력 및 출력 레이트 코덱 사이의 LPC 파라미터에 있어서 현저한 차이가 존재하는 경우에 청각적 발언 품질을 상당히 향상시킬 수 있다.
도 12는 필터링된 여기 공간 직접 공간 매핑 해석 방법 108의 블록도이다. 이 경우, LPC 파라미터는 여전히 입력 레이트 코덱으로부터 출력 레이트 코덱으로 직접 매핑되고, 비양자화된 적응 코드북 파라미터가 출력 레이트 코덱에 대한 초기 추정으로서 사용된다. 적응 코드북 검색은 또한 여기 도메인 또는 교정된 여기 도메인에서 수행된다. 그러나, 고정 코드북 검색은 필터링된 여기 공간 도메인에서 수행된다. 불규칙성을 완화하는 로우-패스(low-pass) 필터, 입력과 출력 코덱의 여기 벡터의 특징 사이의 차이를 보상하는 필터, 및 청각적으로 중요한 신호 특성을 향상시키는 필터를 포함하는 다양한 필터가 적용될 수 있다. 하나의 이점은 필터의 파라미터(차수(order), 주파수 엠퍼시스/디엠퍼시스(emphasis/de-emphasis), 위상)가 완전히 조정 가능(tunable)하다는 것이다. 이는 가중된 LP 합성 필터(weighted LP synthesis filter)를 사용하는 표준 부호화에 있어서의 표적 신호의 연산과 대조된다. 이렇게 해서, 이러한 전략은 조정(tuning)이, 품질과 복잡성 사이의 맞교환을 위한 준비 뿐만 아니라, 입력과 출력 코덱의 특정 쌍 사이의 트랜스-레이팅 품질을 향상시키도록 한다.
몇몇 특정 트랜스-레이팅 쌍에서, 입력과 출력 코덱은몇 개의 압축 파라미터에 있어서 동일한 압축 알고리즘과 동일한 양자화 테이블을 갖는다. 상기 매핑 방법은 일부의 패스-쓰루와 일부의 매핑 처리 절차로 단순화될 수 있다. 도 13은 조합된 패스-쓰루와 매핑 조합 방법 110의 블록도를 도시한다. 만약 출력 레이트 코덱의 몇 개의 양자화된 파라미터가 입력 레이트 코덱과 동일한 양자화 처리 및 양자화 테이블을 갖는다면, 그 파라미터는 어떠한 검색 또는 양자화 절차 없이 입력 비트스트림으로부터 패스-쓰루 유닛 112를 통해 직접 매핑될 수 있다. 출력 레이트 코덱의 나머지 양자화된 파라미터는 직접 공간 매핑, 여기 공간 매핑에 있어서의 해석, 및 필터링된 여기 공간 매핑에 있어서의 해석의 매핑 방법들 중 하나에 의해 매핑될 수 있다.
상기 방법들의 임의의 조합이 또한 사용될 수 있음을 유의하여야 한다. 높은 품질과 낮은 복잡성을 취득할 수 있는 가장 좋은 방법은 입력 레이트와 출력 레이트 코덱 사이의 균형에 의존할 것이다.
출력 레이트 비트스트림 패킹 모듈은 구성 제어 명령 모듈 24(도 5)를 통해 트랜스-레이팅 쌍 모듈 또는 패스-쓰루 모듈에 접속한다. 패킹 모듈은 출력 레이트의 전환된 그리고 양자화된 파라미터를 출력 레이트 코덱과 일치하도록 출력 비트스트림 패킷으로 그룹화한다.
제1 실시예 - AMR 5.15KBPS -> 4.75KBPS 트랜스- 레이팅
이제 본 발명에 따른 적절한 시스템의 예가 설명된다. 멀티-레이트 음성 부호화기(적응 멀티-레이트 또는 AMR, 또는 소위 GSM-AMR)는 본 발명의 원리를 나타내기 위한 것이다. AMR 코덱은 12.2, 10.2, 7.95, 7.40, 6.70, 5.90, 5.15 및 4.75kbps의 비트-레이트를 갖는 8개의 발신지 코덱을 사용한다. 도 4는 AMR 부호화 알고리즘에 있어서의 8 비트-레이트의 비트 할당을 도시한다.
상기 코덱은 코드 여기 선형 예측(CODE-EXCITED LINEAR PREDICTIVE; CELP) 부호화 모델에 기초한다. 10차 선형 예측(linear prediction; LP), 또는 단기, 합성 필터가 사용된다. 장기(long-term), 합성 필터는 소위 적응 코드북 방식을 사용하여 실행된다.
CELP 발언 합성 모델에 있어서, 단기 선형 예측(Linear Prediction; LP) 합 성 필터의 입력에서의 여기 신호는 적응 및 고정(혁신적인) 코드북으로부터의 두 개의 여기 벡터를 더함으로써 구축된다. 발언은 이러한 코드북으로부터 두 개의 적절히 선택된 벡터를 단기 합성 필터를 통해 공급함으로써 합성된다. 코드북에서 최적 여기 시퀀스는, 원래의 발언과 합성된 발언 사이의 에러가 청각적으로 가중된 왜곡 측정에 따라 최소화되는, 합성에 의한 해석(analysis-by-synthesis) 검색 절차를 사용하여 선택된다. 합성에 의한 해석 검색 기술에서 사용되는 청각 가중된 필터는 비양자화된 LP 파라미터를 사용한다.
부호화기는 초당 8,000 샘플의 샘플링 주파수에서 160 샘플에 대응하는 20ms의 발언 프레임에 동작한다. 160 발언 샘플의 각각에서, 발언 신호는 CELP 모델의 파라미터(LP 필터 계수, 적응 및 고정 코드북의 인덱스 및 이득)를 추출하기 위해 해석된다. 이러한 파라미터는 부호화되고 전송된다. 복호화기에서, 이러한 파라미터는 복호화되고, 발언은 재구성된 여기 신호를 LP 합성 필터를 통해 필터링함으로써 합성된다.
GSM-AMR 발언 프레임은 각각 5ms의 4개의 서브프레임으로 분할(40 샘플)된다. 적응 및 고정 코드북 파라미터는 프레임마다 전송된다. 서브프레임에 따라 양자화된 그리고 비양자화된 LP 파라미터 또는 그들의 보간된 버전(version)이 사용된다. 개루프 피치 래그는 청각적으로 가중된 발언 신호를 기초로 (프레임당 한번인 5.15kbps 및 4.75kbit/s 모드를 제외하고) 다른 서브프레임마다 추정된다.
도 14는 AMR 5.15kbps 비트스트림으로부터 AMR 4.75kbps 비트스트림로의 트랜스-레이팅에 기초한 일부 패스-쓰루와 일부 직접 공간 매핑 혼합 방법을 도시하 는 블록도이다. 두 레이트(5.15kbps 및 4.75kbps)는 동일한 선형 예측 계수(Linear Prediction Coefficients; LPC) 양자화 테이블과 동일한 양자화 처리 절차를 공유하고, 이렇게 해서 두 레이트에 대한 인덱스는 동일(일대일 매핑)하다. 유사하게, 두 레이트는 동일한 적응(또는 피치) 및 고정(또는 대수(algebric)) 코드북 인덱스를 공유한다.
5.15와 4.75 사이의 트랜스-레이팅에서, LPC, 적응 코드북 파라미터 및고정 코드북 파라미터의 세 가지 파라미터는 복잡한 연산없이 원래의 비트스트림으로부터 목적지 비트스트림으로 직접 매핑될 수 있다.
적응 코드북 이득 및 고정 코드북 이득의 경우, 압축 방법 및 테이블이 다르므로, 이러한 파라미터들의 표현은 5.15와 4.75kbps 사이에 다르다. 도 4에 도시된 바와 같이, 입력 AMR 5.15kbps 코덱은 각 서브프레임 사이에 6 비트의 결합(joint) 이득 양자화 인덱스를 갖고, 출력 AMR 4.75kbps 코덱은 모든 두 개의 서브프레임 사이에 8 비트의 결합 이득 양자화 인덱스를 갖는다. 출력 레이트 AMR 4.75kbps는 적응 코드북 이득 및 고정 코드북 이득의 5.15kbps 표현을 출력 비트스트림 포멧으로 전환하기 위한 매핑을 요구한다.
직접 공간 매핑 방법은 적응 코드북 이득과 고정 코드북 이득 양자를 매핑하기 위해 채용될 수 있다. 입력 레이트 결합 적응 코드북 및 고정 코드북은 초기에 비양자화된다. 상기 방법은 비양자화된 적응 코드북 이득과 적응 코드북 이득을 서브프레임마다 획득한다. 다음으로 이러한 이득은 별개로 각각의 두 개의 서브프레임으로 매핑된다. 마지막으로 적응 코드북 이득과 고정 코드북 이득은 4.75kbps 코덱에 대한 출력에 따라 두 개의 서브프레임마다 재양자화된다. 4.75kbps의 결합 이득 인덱스의 상기 매핑 결과는, 4.75kbps 비트스트림에 대한 출력을 형성하기 위해 LSP, 적응 코드북 파라미터 및 고정 코드북 파라미터의 패스-쓰루 결과와 함께 그룹화된다.
적응 코드북과 고정 코드북 이득의 양자화된 결합 이득을 검색하기 위해 여기 공간 매핑에서의 해석 또는 필터링된 여기 공간 매핑에서의 해석을 선택하는 것이 가능하다. 4.75kbps와 5.15kbps는 모두 동일한 LPC 인덱스 표현을 갖기 때문에, 입력 코덱으로부터의 재구성된 여기 벡터를 표적 신호로서 교정할 필요가 없다.
제2 실시예 - AMR 4.75KBPS -> 5.15KBPS 트랜스- 레이팅
도 15는 본 발명의 제2 실시예에 따라 AMR 4.75kbps 비트스트림을 AMR 5.15kbps 비트스트림으로 트랜스-레이팅하는 일례를 도시한다. 상기 트랜스-레이팅 처리는 제1 실시예에서 설명된 반대 방향 트랜스-레이팅의 그것과 매우 유사한다. 5.15kbps의 출력 코덱은 LPC 계수, 적응 코드북 파라미터, 및 고정 코드북 파라미터 사이에 동일한 양자화 처리 절차 및 테이블을 갖는다. 이러한 출력 비양자화된 파라미터는 트랜스-레이팅 쌍에서 패스-쓰루 유닛을 통해 직접 획득될 수 있다.
4.75kbps의 결합 이득 인덱스는, 직접 공간 매핑, 여기 공간 매핑에서의 해석 또는 필터링된 여기 공간 매핑의 매핑 방법 중 하나를 통해 5.15kbps의 비양자 화된 적응 코드북 이득 및 고정 코드북 이득으로부터 획득될 수 있다. 도 15는 직접 공간 매핑에 기초한 방식을 도시한다.
제3 실시예 - AMR 12.2KBPS -> 4.75KBPS 트랜스- 레이팅
AMR 12.2kbps에 대해, LP 해석이 프레임마다 두 번 수행되고 4.75kbps로 내려가는 다른 모드에 대해서는 단 한 번 수행된다는 점에 유의하는 것이 중요하다. 12.2kbps 모드에 대해, LP 파라미터의 두 셋트는 선 스펙트럼 쌍(line spectral pairs; LSP)로 전환되고 38비트 분할 매트릭스 양자화(split matrix quantization; SMQ)를 사용하여 결합적으로 양자화된다. 다른 모드에 대해서는, LP 파라미터의 하나의 셋트가 LSP로 전환되고 4.75kbps에 대한 23 비트 분할 벡터 양자화(split vector quantization; SVQ)를 사용하여 벡터 양자화된다.
도 16은 본 발명의 제3 실시예에 따른 12.2kbps로부터 4.75kbps로의 트랜스-레이팅의 블록도이다. 트랜스-레이팅 쌍 모듈은 레이트 전환을 수행하기 위해 필터링된 여기 공간 매핑에서의 해석 방법을 선택한다.
우선, LSF 파라미터의 인덱스는 유입되는 12.2kbps 비트스트림으로부터 추출되고, 비양자화된 LSP 파라미터는 룩업(lookup) 테이블과 이전의 LSP 잔여(residual) 벡터를 통해 획득된다. 비양자화된 LSP 파라미터는 보간되고 각각의 서브프레임으로 매핑된다. 이러한 LSP 파라미터는 AMR 표준에 특정된 4.75kbps 코덱에 따라 재양자화되고 4.75kbps의 LSP 표현으로 전환된다.
둘째로, 12.2 kbps 입력 코덱의 여기 벡터는 비양자화된 적응 코드북 파라미 터 υ[n], 적응 코드북 이득 g^ p, 고정 코드북 파라미터 c[n], 및 고정 코드북 이득 g^ c을 통해 재구성된다. 재구성된 여기 벡터는 g^ pυ[n]+g^ cc[n]으로서 표현된다.
재구성된 여기 벡터가 트랜스 레이팅 처리에서 표적 신호가 되기 전에, 여기 벡터 교정의 처리가 도 11에 도시된 바와 같이 적용될 수 있다. 이 처리는 입력 12.2kbps의 LPC 비양자화 파라미터를 사용하는 합성 단계와 출력 4.75kbps의 LPC 양자화 파라미터를 사용하는 필터링 단계를 포함할 수 있다. 이는 12.2kbps 및 4.75kbps 코덱 사이의 LSP 파라미터 차이에 기인한 인위적 결과를 교정한다.
다음으로 교정된 여기 백터는 출력 레이트 4.75kbps에 대한 여기 공간 매핑에서의 해석을 위한 표적 신호로서 사용된다. 12.2 kbps의 비양자화된 적응 코드북 파라미터가 4.75kbps의 폐루프 적응 코드북 검색에서의 초기 추정으로서 사용된다. 이 검색은 비양자화된 적응 코드북 파라미터와 적응 코드북 이득을 획득한다. 4.75kbps 코덱은 적응 코드북과 고정 코드북 이득을 표현하기 위해 결합 이득 인덱스를 사용하기 때문에, 4.75kbps의 적응 코드북 이득의 양자화는 고정 코드북 검색 후에 수행된다.
적응 코드워드 벡터 기여도는 교정된 여기로부터 제거된다. 그 결과는 고정 코드북 검색을 위한 표적 신호를 생산하기 위해 필터를 사용하여 필터링된다. 4.75kbps의 고정 코드북 벡터는 코드워드 벡터를 형성하는 두 개의 펄스로 구성되고 고속 기술에 의해 검색된다. 이렇게 해서, 4.75kbps의 고정 코드북 인덱스가 획득된다.
12.2kbps 코덱과 달리, 4.75kbps는 적응 코드북 이득(g^ p)과 고정 코드북 이득(g^ c)에 양자에 대해 결합 검색을 조합한다. 고정 코드북 벡터 c[n]과 함께 연산된 적응 코드워드 벡터 υ[n]을 사용하여, 상관 ∥x-g^ pυ-g^ cc∥(여기서, x는 표적 여기)을 최소화하기 위해 피치 이득과 고정 코드북 이득의 이중 검색(dual search)이 수행된다. 적응 및 고정 코드북에 대한 공통 테이블 인덱스는 4.75kbps의 제1 및 제3 서브프레임에서 부호화된다.
상기한 바와 같이, 직접 공간 매핑과 여기 공간 매핑에서의 해석의 다른 두 방법이 12.2kbps로부터 4.75kbps로의 트랜스-레이팅에 적용될 수 있다. 이러한 다른 방법들은 품질을 감소된 연산 부하와 교환하고, 장치가 동시에 다수 채널에 의해 과부하된 경우에 품질의 적절한 열화를 제공하도록 사용될 수 있다.
제4 실시예 - AMR 4.75KBPS -> 12.2KBPS 트랜스- 레이팅
도 17은 본 발명의 제4 실시예에 따른 4.75kbps로부터 12.2kbps로의 트랜스-레이팅을 위한 시스템 120의 블록도를 도시한다. 트랜스-레이팅은 4.75kbps를 12.2kbps로 전환하기 위해 필터링된 여기 공간 매핑에서의 해석 방법을 선택한다.
우선, LSF 파라미터의 인덱스는 유입되는 4.75kbit/s 비트스트림으로부터 추출되고, 비양자화된 LSP 파라미터는 룩업 테이블과 이전의 LSP 잔여 벡터를 통해 획득된다. 비양자화된 LSP 파라미터는 보간되고 각각의 서브프레임으로 매핑된다. 이러한 LSP 파라미터는 AMR 표준에 특정된 것처럼 12.2kbps 코덱에 따라 두 개의 서브프레임마다 재양자화되고 12.2kbps의 LSP 표현으로 전환된다.
둘째로, 4.75kbps 입력 코덱의 여기 벡터는 비양자화된 적응 코드북 파라미터 υ[n], 적응 코드북 이득 g^ p, 고정 코드북 파라미터 c[n], 및 고정 코드북 이득 g^ c을 통해 재구성된다. 재구성된 여기 벡터는 g^ pυ[n]+g^ cc[n]으로서 표현된다.
재구성된 여기 벡터가 트랜스 레이팅 처리에서 표적 신호가 되기 전에, 여기 벡터 교정의 처리가 도 11에 도시된 바와 같이 적용될 수 있다. 이 처리는 입력 4.75kbps의 LPC 비양자화 파라미터를 사용하는 합성 단계와 출력 12.2kbps의 LPC 양자화 파라미터를 사용하는 필터링 단계를 포함할 수 있다. 이는 4.75kbps 및 12.2kbps 코덱 사이의 LSP 차이에 기인한 인위적 결과를 교정한다.
다음으로 교정된 여기 백터는 출력 레이트 12.2kbps에 대한 여기 공간 매핑에서의 해석을 위한 표적 신호로서 사용된다. 4.75kbps의 비양자화된 적응 코드북 파라미터가 12.2kbps의 폐루프 적응 코드북 검색에서의 초기 추정으로서 사용된다. 적응 코드북은 초기 추정의 작은 구간 내에서, 12.2kbps 코덱에 의해 요구되는 1/6의 정확도로 검색된다. 다음으로 적응 코드북 이득이 가장 좋은 코드-벡터에 대해 결정되고 적응 코드-벡터 기여도가 교정된 여기로부터 제거된다. 그 결과는 고정 코드북 검색을 위한 표적 신호를 생산하기 위해 필터를 사용하여 필터링된다.
다음으로 고정 코드북은 필터링된 여기 공간에서 12.2kbps 코덱에 따라 10 펄스 코드워드 벡터를 형성하기 위한 인덱스를 획득하기 위해 고속 기술에 의해 검색된다. 또한 필터링된 여기 공간은 12.2kbps 코덱의 고정 코드북 이득을 연산하기 위해 사용된다.
4.75kbps로부터 12.2kbps로의 트랜스-레이팅은 또한 다른 알려진 매핑 방법을 채용할 수 있다. 이는 트랜스-레이팅이 가용의 연산 리소스를 실시간 용도에 적응시키도록 한다.
다른 CELP 변환부호화기
본 명세서에 설명된 적응 코드북 연산의 발명은 모든 멀티-레이트 음성 부호화기에 포괄적이고, G.723.1, G.728, AMR, EVRC, QCELP, MPEG-4 CELP, SMV, AMR-WB, VMR과 같은 이미 알려진 멀티-레이트 음성 부호화기 코덱, 그리고 멀티-레이트 코딩을 사용하는 다른 모든 미래의 CELP 기반 음성 코덱에서의 임의의 음성 트랜스-레이팅에 적용된다.
본 발명은, 본 발명이 속하는 기술 분야에서 숙련된 자가 본 발명을 만들거나 이용할 수 있도록 구체적인 실시예를 참조로 설명되었다. 다양한 변경이 당업계의 숙련된 자에게는 명백할 것이며, 여기서 정의된 포괄적 원리는 장의적 능력을 사용함이 없이 다른 실시예에 적용될 것이다. 이렇게 해서, 본 발명은 본 명세서에 설명된 실시예들로 한정될 것을 의도하지 않으며, 특허청구범위에 의해 지시된 것과 같이 본 명세서에 개시된 원리와 신규한 특성과 조화되는 가장 넓은 범위와 일치된다.

Claims (42)

  1. 제1 레이트(rate) 기반 모드의 음성 압축 표준에 따라 부호화된 데이터의 프레임을 나타내는 제1 발신지 비트스트림으로부터 제2 레이트 기반 모드의 제2 음성 압축 표준에 따라 부호화된 데이터의 프레임을 나타내는 제2 목적지 비트스트림으로의 음성 트랜스-레이팅을 수행하는 장치에 있어서,
    입력 데이터 레이트의 상기 제1 비트스트림으로부터의 음성 코드를 발언 파라미터를 나타내는 개별 코드로 분리하는 발신지 비트스트림 언패커(unpacker);
    요구되는 비트스트림 데이터 레이트 모드를 출력하기 위해 제1 비트스트림에 동작하고, 출력 데이터 레이트에 관한 결정을 출력하기 위해 외부 제어 명령에 동작하는 트랜스-레이팅 제어기 모듈;
    입력 비트스트림 데이터를 트랜스-레이팅하기 위한 복수의 트랜스-레이팅 모듈 쌍 - 상기 트랜스-레이팅 모듈은 상기 발신지 비트스트림 언패커로부터 생성되는 입력 데이터 레이트의 발언 파라미터 상의 입력을 수신하도록 동작하고, 출력 데이터 레이트의 양자화된 발언 파라미터를 출력하도록 동작함 -;
    입력 부호화된 인덱스를 출력으로 직접 통과시키도록 작동하는 패스-쓰루 모듈; 및
    출력 데이터 레이트의 양자화된 출력 발언 파라미터를 목적지 비트스트림 패킷으로 그룹화하는 목적지 비트스트림 패커를 포함하는 장치.
  2. 제1항에 있어서,
    상기 발신지 비트스트림 언패커는,
    음성 압축 표준에 따라 데이터 레이트로 부호화된 데이터의 비트스트림 프레임으로부터 입력을 수신하고 상기 패킷의 상기 데이터 레이트를 출력하는 비트스트림 데이터 레이트 식별기; 및
    발언 압축 파라미터의 코드를 비양자화하는 발신지 비트스트림 페이로드(payload) 데이터 비양자화기를 포함하는 장치.
  3. 제1항에 있어서,
    상기 발신지 비트스트림 언패커는 복수의 병렬 모듈인 장치.
  4. 제1항에 있어서,
    상기 트랜스-레이팅 제어기 모듈은,
    상기 입력 레이트와 이전(preceding) 프레임의 출력 레이트, 상기 이전 프레임의 에러 플래그, 및 복수의 이전 프레임들의 외부 명령을 저장하도록 동작하는 파라미터 버퍼; 및
    트랜스-레이팅의 최종 결정을 출력하기 위해, 외부 제어 명령, 입력 데이터 레이트, 이전 프레임 출력 데이터 레이트를 수용하도록 동작하는 결정 모듈을 포함하는 장치.
  5. 제1항에 있어서,
    상기 트랜스-레이팅 제어기 모듈은 복수의 모듈인 장치.
  6. 제1항에 있어서,
    상기 트랜스-레이팅 모듈 중 하나는,
    복수의 전략에 기초하여 코드 여기 선형 예측(Code Excited Linear Prediction; CELP) 파라미터 매핑 전략을 선택하도록 된 결정 모듈;
    반복없이 해석적 공식을 사용하여 목적지 데이터 레이트 압축 파라미터를 생산하도록 동작하는, 음성 압축 파라미터 직접 매핑을 위한 모듈;
    여기 공간 도메인에서의 검색에 의해 상기 목적지 데이터 레이트 압축 파라미터를 생산하도록 동작하는, 여기 공간 도메인 매핑에서의 해석을 위한 모듈;
    여기 공간에서 적응 폐루프를 경유하여, 그리고, 필터링된 여기 공간에서 고정 코드북을 경유하여 검색함으로써 상기 목적지 데이터 레이트 압축 파라미터를 생산하도록 동작하는, 필터링된 여기 공간 도메인 매핑에서의 해석을 위한 모듈; 및
    입력 데이터 레이트 비트스트림의 파라미터의 일부가 출력 데이터 비트스트림의 파라미터와 동일한 양자화된 값을 갖는 경우, 양자화된 파라미터 패스-쓰루 부분을 혼합하는, 패스-쓰루(pass-through) 혼합 매핑을 위한 모듈을 포함하는 장치.
  7. 제1항에 있어서,
    상기 멀티-레이트 쌍 트랜스-레이팅 모듈은 복수의 모듈인 장치.
  8. 제1항에 있어서,
    상기 패스-쓰루 모듈은 개별의 복수의 모듈인 장치.
  9. 제1항에 있어서,
    상기 목적지 코덱 패커는, 각각이 멀티-레이트 음성 압축 부호화기로부터 미리 선택된 데이터 레이트에 적응하도록 동작하는 복수의 프레임 패킹 요소를 포함하는 장치.
  10. 제1항에 있어서,
    상기 음성 압축 표준은, 비트스트림 내에, 데이터 레이트, 피치 이득, 고정 코드북 이득 및 선 스펙트럼 주파수(Line Spectral Frequencies)를 포함하는 스펙트럼 형상 파라미터에 관한 정보를 포함하는 멀티-레이트/멀티-모드 코덱인 장치.
  11. 제2항에 있어서,
    상기 발신지 비트스트림 페이로드 데이터 비양자화기는,
    음성 압축 표준에 따라 데이터 레이트로 부호화된 데이터의 비트스트림 프레임으로부터 입력을 수신하고, 발언 압축 파라미터를 나타내는 인덱스를 분리하도록 동작하는 코드 분리기;
    각각의 압축 파라미터의 코드를 비양자화하도록 동작하는 하나 이상의 비양자화기 모듈; 및
    입력 양자화된 파라미터 인덱스를 다음 단계로 통과시키도록 동작하는 코드 인덱스 패스-쓰루 모듈을 포함하는 장치.
  12. 제6항에 있어서,
    상기 음성 압축 파라미터 직접 공간 매핑 모듈은,
    목적지 레이트 LSP 계수를 부호화하도록 동작하는 LSP 계수 변환기;
    목적지 레이트 적응 코드북 파라미터를 부호화하도록 동작하는 적응 코드북 파라미터 변환기;
    목적지 레이트 적응 코드북 이득 파라미터를 부호화하도록 동작하는 적응 코드북 이득 파라미터 변환기;
    목적지 레이트 고정 코드북 파라미터를 부호화하도록 동작하는 고정 코드북 파라미터 변환기; 및
    목적지 레이트 고정 코드북 이득 파라미터를 부호화하도록 동작하는 고정 코드북 이득 파라미터 변환기를 포함하는 장치.
  13. 제6항에 있어서,
    상기 여기 공간 도메인 매핑에서의 해석 모듈은,
    목적지 레이트 LSP 계수를 부호화하도록 동작하는 LSP 계수 변환기;
    입력 압축된 발언 파라미터로부터 여기 파라미터를 구축하도록 동작하는 여기 벡터 모듈;
    여기 공간에서 제1 검색을 수행함으로써 목적지 레이트 적응 코드북 파라미터를 부호화하도록 동작하는 적응 코드북 파라미터 변환기;
    여기 공간에서 제2 검색을 수행함으로써 목적지 레이트 적응 코드북 이득 파라미터를 부호화하도록 동작하는 적응 코드북 이득 파라미터 변환기;
    여기 공간에서 제3 검색을 수행함으로써 목적지 레이트 고정 코드북 파라미 터를 부호화하도록 동작하는 고정 코드북 파라미터 변환기; 및
    여기 공간에서 제4 검색을 수행함으로써 목적지 레이트 고정 코드북 이득 파라미터를 부호화하도록 동작하는 고정 코드북 이득 파라미터 변환기를 포함하는 장치.
  14. 제6항에 있어서,
    상기 필터링된 여기 공간 도메인 매핑에서의 해석을 위한 모듈은,
    목적지 레이트 LSP 계수를 부호화하도록 동작하는 LSP 계수 변환기;
    입력 압축된 발언 파라미터로부터 여기 파라미터를 구축하도록 동작하는 여기 벡터 모듈;
    입력 압축된 발언 파라미터와 상기 여기 벡터 모듈로부터 필터링된 여기 파라미터를 구축하도록 동작하는 필터링된 여기 벡터 모듈;
    여기 공간에서 검색을 수행함으로써 목적지 레이트 적응 코드북 파라미터를 부호화하도록 동작하는 적응 코드북 파라미터 변환기;
    여기 공간과 필터링된 여기 공간 중 적어도 하나에서 검색을 수행함으로써 목적지 레이트 적응 코드북 이득 파라미터를 부호화하도록 동작하는 적응 코드북 이득 파라미터 변환기;
    필터링된 여기 공간에서 검색을 수행함으로써 목적지 레이트 고정 코드북 파라미터를 부호화하도록 동작하는 고정 코드북 파라미터 변환기; 및
    필터링된 여기 공간에서 검색을 수행함으로써 목적지 레이트 고정 코드북 이득 파라미터를 부호화하도록 동작하는 고정 코드북 이득 파라미터 변환기를 포함하는 장치.
  15. 제6항에 있어서,
    상기 패스-쓰루 혼합 매핑 모듈은,
    입력 부호화된 압축 발언 파라미터의 일부를 목적지 레이트 부호화된 압축 발언 파라미터로 통과시키도록 동작하는 파라미터 패스-쓰루 모듈; 및
    입력 압축 발언 파라미터로부터의 목적지 레이트 압축 발언 파라미터를 부호화하도록 동작하는 파라미터 변환기 모듈을 포함하는 장치.
  16. 제13항에 있어서,
    상기 여기 벡터 모듈은 또한,
    적어도 하나의 CELP 파라미터에 대해 입력 레이트 코덱에 기초하여 재구성된 여기 벡터를 저장하도록 동작하는 입력 레이트 코덱 여기 버퍼;
    입력 레이트 코덱 양자화된 LPC 계수와 출력 레이트 코드 부호화된 LPC 계수를 사용하여 입력 여기 벡터를 교정하도록 동작하는 여기 벡터 교정 유닛; 및
    출력 레이트 코덱 부호화 처리에서 표적으로 사용되는 상기 교정된 여기 벡 터를 저장하도록 동작하는 교정된 여기 버퍼를 포함하는 장치.
  17. 제15항에 있어서,
    상기 파라미터 패스-쓰루 모듈은 복수의 모듈인 장치.
  18. 제15항에 있어서,
    상기 파라미터 변환기 모듈은 복수의 모듈인 장치.
  19. 제15항에 있어서,
    상기 파라미터 변환기 모듈은, 상기 음성 압축 파라미터 직접 공간 매핑 모듈, 여기 공간 도메인 매핑에서의 해석 모듈, 및 여기 공간 도메인 매핑에서의 해석 모듈 중 적어도 하나의 일부인 장치.
  20. 발신지 코덱에 있어서 제1 레이트 기반 모드의 제1 음성 압축 표준에 따라 부호화된 데이터의 프레임을 나타내는 제1 발신지 비트스트림으로부터, 출력 레이트 코덱에 있어서 제2 레이트 기반 모드의 제2 음성 압축 표준에 따라 부호화된 데 이터의 프레임을 나타내는 제2 목적지 비트스트림으로, 음성 압축 패킷을 변환하는 방법에 있어서,
    데이터 레이트, 모드, 및 입력 비트스트림의 패킷 타입 중 하나 이상을 포함하는 데이터 스트림의 특징을 식별하기 위해 발신지 코덱 입력 비트스트림의 헤더(header)를 처리하는 단계;
    상기 입력 비트스트림으로부터 하나 이상의 파라미터를 언팩하기 위해 상기 발신지 코덱 입력 비트스트림을 처리하는 단계;
    요구되는 출력 레이트의 목적지 비트스트림을 출력하기 위해, 식별된 입력 레이트의 상기 입력 비트스트림을 변환하기 위해 트랜스-레이팅 쌍을 구성하는 단계;
    상기 요구되는 출력 레이트의 대응하는 하나 이상의 파라미터를 출력으로서 생성하기 위해, 상기 식별된 입력 레이트의 부호화된 하나 이상의 파라미터의 입력을 변환하는 단계;
    상기 부호화된 파라미터의 양자화가 출력 레이트 코덱에서 사용되는 것과 동일하면, 하나 이상의 부호화된 파라미터를 출력 레이트 코덱으로 패스-쓰루하는 단계; 및
    출력 레이트 코덱에 대해 하나 이상의 파라미터를 패킹함으로써 출력 비트스트림을 처리하는 단계를 포함하는 방법.
  21. 제20항에 있어서,
    상기 발신지 코덱 입력 처리 단계는,
    입력 비트스트림 프레임을 하나 이상의 CELP 파라미터와 연관된 정보로 변환하는 단계;
    상기 연관된 정보를, CELP 비트스트림인 하나 이상의 입력 비트스트림으로 복호화하는 단계; 및
    CELP 파라미터를 보간 장치로 출력하는 단계를 포함하는 방법.
  22. 제21항에 있어서,
    상기 트랜스-레이팅 쌍 구성 단계는,
    상기 입력 CELP 비트스트림의 헤더로부터 입력 레이트 및 모드의 적어도 하나에 대한 발신지 정보를 추출하는 단계;
    CELP 비트스트림인 상기 출력 비트스트림으로부터 외부 제어 명령과 요구되는 레이트 중 적어도 하나를 검색하는 단계;
    이전의 트랜스-레이팅 상태를 검사하는 단계; 및
    트랜스-레이팅 쌍 선택 결정을 출력하는 단계를 포함하는 방법.
  23. 제20항에 있어서,
    상기 변환 단계는,
    직접 CELP 파라미터 공간 매핑;
    여기 공간 도메인 매핑에서의 해석;
    필터링된 여기 공간 매핑에서의 해석; 및
    패스-쓰루의 일부와 파라미터 매핑의 일부
    의 복수의 변환 방법 중 하나로부터 선택되는 방법.
  24. 제20항에 있어서,
    상기 트랜스-레이팅 쌍 구성 단계는 예비적인 처리 중에 선택된 미리 결정된 용도를 위한 방법.
  25. 제20항에 있어서,
    요구되는 출력 레이트 코덱 포맷의 서브프레임 크기와 입력 레이트 코덱 포맷의 서브프레임 크기 사이의 차이가 존재한다면, 상기 변환 단계는 보간 단계를 더 포함하는 방법.
  26. 제20항에 있어서,
    상기 패스-쓰루하는 단계는, 입력 레이트 코덱의 부호화된 파라미터를 비트스트림 언패커로부터의 상기 출력 레이트 코덱의 부호화된 파라미터로 전달하는 단계를 포함하는 방법.
  27. 제21항에 있어서,
    상기 CELP 목적지 레이트 코덱 비트스트림 처리 단계는, 복수의 프레임 패킹 서브프로세싱 단계를 포함하고, 각각의 서브프로세싱 단계는 선택된 목적지 레이트 코덱을 위한 복수의 용도로부터 미리 선택된 용도에 적응할 수 있고, 상기 선택된 목적지 레이트 코덱은 복수의 멀티-레이트 코덱 중 하나인 방법.
  28. 제23항에 있어서,
    직접 CELP 파라미터 공간 매핑 단계는,
    하나 이상의 LSP 계수를 입력 레이트 코덱으로부터 출력 레이트 코덱을 위한 하나 이상의 LSP 계수로 변환하는 단계;
    입력 레이트 코덱 적응 코드북 파라미터로부터 적응 코드북 파라미터를 부호화하는 단계;
    입력 레이트 코덱 적응 코드북 이득 파라미터로부터 적응 코드북 이득 파라미터를 부호화하는 단계;
    입력 레이트 코덱 고정 코드북 파라미터로부터 고정 코드북 파라미터를 부호화하는 단계; 및
    입력 레이트 코덱 고정 코드북 이득 파라미터로부터 고정 코드북 이득 파라미터를 부호화하는 단계를 포함하는 방법.
  29. 제23항에 있어서,
    상기 여기 공간 도메인 매핑 해석 단계는,
    하나 이상의 LSP 계수를 입력 레이트 코덱으로부터 출력 레이트 코덱을 위한 하나 이상의 LSP 계수로 변환하는 단계;
    만약 교정 옵션이 선택된다면 입력 레이트 코덱 여기 벡터를 매핑을 위한 표적 벡터로서 교정하는 단계;
    입력 레이트 코덱 적응 코드북 파라미터로부터 적응 코드북 파라미터를 초기값으로서 선택하는 단계;
    여기 공간의 폐루프에서 적응 코드북 파라미터를 검색하는 단계;
    여기 공간에서 적응 코드북 이득을 검색하는 단계;
    고정 코드북 검색을 위한 표적 신호를 구축하는 단계;
    필터링된 여기 공간에서 고정 코드북 파라미터를 검색하는 단계;
    필터링된 여기 공간에서 고정 코드북 이득을 검색하는 단계; 및 그 결과
    입력 레이트 코덱 재구성된 여기 벡터로서 상기 여기 벡터를 갱신된 파라미 터로 갱신하는 단계를 포함하는 방법.
  30. 제23항에 있어서,
    상기 필터링된 여기 공간 도메인 매핑 해석 단계는,
    하나 이상의 입력 레이트 코덱 LSP 계수를 입력 레이트 코덱으로부터 출력 레이트 코덱을 위한 하나 이상의 출력 레이트 코덱 LSP 계수로 변환하는 단계;
    만약 교정 옵션이 선택된다면 입력 레이트 코덱 여기 벡터를 매핑을 위한 표적 벡터로서 교정하는 단계;
    입력 레이트 코덱 적응 코드북 파라미터로부터 적응 코드북 파라미터를 초기값으로서 선택하는 단계;
    여기 공간의 폐루프에서 적응 코드북 파라미터를 검색하는 단계;
    여기 공간에서 적응 코드북 이득을 검색하는 단계;
    고정 코드북 검색을 위한 표적 신호를 구축하는 단계;
    필터링된 여기 공간에서 고정 코드북 파라미터를 검색하는 단계;
    필터링된 여기 공간에서 고정 코드북 이득을 검색하는 단계; 및
    상기 여기 벡터를 갱신된 파라미터로 갱신하는 단계를 포함하는 방법.
  31. 제23항에 있어서,
    패스-쓰루 단계의 일부와 파라미터 매핑 단계의 일부는,
    입력 레이트 코덱 파라미터를 패스-쓰루 클래스와 매핑 클래스로 분류하는 단계 - 상기 입력 레이트 코덱 파라미터는 공통으로 부호화 방법과 입력 레이트 코덱의 인덱스를 갖고, 상기 출력 레이트 코덱은 패스-쓰루 클래스로서 분류되고, 다른 모든 입력 레이트 코덱 파라미터는 매핑 클래스로서 분류됨 -;
    상기 입력 레이트 코덱의 상기 패스-쓰루 클래스 파라미터를 출력 레이트 코덱의 파라미터로 패스-쓰루하는 단계; 및
    직접 CELP 공간 매핑 방법, 여기 공간 도메인 매핑 해석 방법, 및 필터링된 여기 공간 매핑 해석 방법 중 하나 이상을 사용함으로써, 상기 입력 레이트 코덱의 매핑 클래스 파라미터를 대응하는 출력 레이트 코덱의 파라미터로 변환하는 단계를 포함하는 방법.
  32. 제23항에 있어서,
    상기 변환 방법들은 조합 방법으로서 조합되는 방법.
  33. 제23항에 있어서,
    특정 트랜스-레이팅 쌍에 있어서의 상기 변환 방법은 동적으로 선택되는 방법.
  34. 제25항에 있어서,
    상기 보간 단계는,
    하나 이상의 LSP 계수를 입력 레이트 코덱으로부터 출력 레이트 코덱을 위한 대응하는 LSP 계수로 보간하는 단계; 및
    LSP 파라미터가 아닌 CELP 파라미터를 입력 레이트 코덱으로부터 출력 레이트 코덱을 위한 대응하는 CELP 파라미터로 보간하는 단계를 포함하는 방법.
  35. 제29항에 있어서,
    상기 교정 여기 벡터 교정 단계는 또한,
    하나 이상의 입력 레이트 코덱 복호화된 LPC 계수를 사용하여 입력 레이트 코덱 재구성된 여기 벡터를 합성된 발언 벡터로 변환하는 단계;
    적어도 양자화된 출력 레이트 코덱 LPC 계수를 사용하여, 상기 합성된 발언 벡터를 다시 교정된 여기 벡터로 변환하는 단계; 및
    여기 공간 매핑 해석과 필터링된 여기 공간 매핑 해석을 위해 표적 신호를 위한 교정된 여기 벡터를 전송하는 단계를 포함하는 방법.
  36. 제33항에 있어서,
    상기 제어 신호는 상기 선택된 트랜스-레이팅 매핑 전략의 연산 리소스 특징을 기초로 제공되는 방법.
  37. 제33항에 있어서,
    상기 매핑 전략을 수행하도록 동작하는 복수의 요소의 각각에 연결된 스위칭 모듈에서 제어 신호를 수신하는 단계를 더 포함하는 방법.
  38. 제33항에 있어서,
    복수의 매핑 전략 중 하나 이상이 메모리의 라이브러리로부터 제공되는 방법.
  39. 제34항에 있어서,
    선형 변환 처리를 사용하여 하나 이상의 LPC 계수를 변환하는 단계를 더 포함하는 방법.
  40. 제1항에 있어서,
    가용 연산 리소스에 적응하기 위한 메커니즘을 제공하고 부하 하에서 품질이 적절히 열화되도록 하기 위해 트랜스-레이팅 전략을 교환하는 요소를 더 포함하는 장치.
  41. 제1항에 있어서,
    통신 소음 파라미터의 매핑을 포함하여, 침묵 프레임의 입력 레이트 활성 발언 포맷으로부터 출력 침묵 프레임으로의 고속 변환과, 침묵 프레임의 입력 침묵 프레임으로부터 요구되는 출력 레이트 활성 발언 프레임으로의 고속 변환의 적어도 하나를 수행하도록 동작하는 침묵 프레임 변환부호화 유닛을 더 포함하는 장치.
  42. 제1항에 있어서,
    발언 신호 도메인으로 되돌아가지 않고 수행되도록 동작하는 여기 매핑을 위한 요소를 더 포함하는 장치.
KR1020067026075A 2004-05-11 2005-05-10 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치 KR20070038041A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/843,844 2004-05-11
US10/843,844 US20050258983A1 (en) 2004-05-11 2004-05-11 Method and apparatus for voice trans-rating in multi-rate voice coders for telecommunications

Publications (1)

Publication Number Publication Date
KR20070038041A true KR20070038041A (ko) 2007-04-09

Family

ID=34969461

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020067026075A KR20070038041A (ko) 2004-05-11 2005-05-10 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치

Country Status (6)

Country Link
US (1) US20050258983A1 (ko)
EP (1) EP1751743A1 (ko)
JP (1) JP2007537494A (ko)
KR (1) KR20070038041A (ko)
CN (1) CN1954366A (ko)
WO (1) WO2005112006A1 (ko)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
JP4793539B2 (ja) * 2005-03-29 2011-10-12 日本電気株式会社 符号変換方法及び装置とプログラム並びにその記憶媒体
US8547997B2 (en) * 2005-04-20 2013-10-01 Jupiter Systems Capture node for use in an audiovisual signal routing and distribution system
US20060242669A1 (en) * 2005-04-20 2006-10-26 Jupiter Systems Display node for use in an audiovisual signal routing and distribution system
US8606949B2 (en) 2005-04-20 2013-12-10 Jupiter Systems Interconnection mechanism for multiple data streams
US20060262851A1 (en) * 2005-05-19 2006-11-23 Celtro Ltd. Method and system for efficient transmission of communication traffic
US20070177519A1 (en) * 2006-01-30 2007-08-02 Thomsen Jan H Systems and methods for transcoding bit streams
US8068541B2 (en) * 2006-01-30 2011-11-29 Jan Harding Thomsen Systems and methods for transcoding bit streams
WO2008039857A2 (en) * 2006-09-26 2008-04-03 Dilithium Networks Pty Ltd. Method and apparatus for compressed video bitstream conversion with reduced-algorithmic-delay
US8560729B2 (en) * 2007-02-09 2013-10-15 Onmobile Global Limited Method and apparatus for the adaptation of multimedia content in telecommunications networks
WO2008098247A2 (en) * 2007-02-09 2008-08-14 Dilithium Network Pty Ltd. Method and apparatus for a multimedia value added service delivery system
KR20090085376A (ko) * 2008-02-04 2009-08-07 삼성전자주식회사 문자 메시지의 음성 합성을 이용한 서비스 방법 및 장치
CN102172020B (zh) * 2008-09-09 2014-09-03 爱移通全球有限公司 用于发送视频的方法和设备
US8838824B2 (en) * 2009-03-16 2014-09-16 Onmobile Global Limited Method and apparatus for delivery of adapted media
US8467480B2 (en) * 2009-09-14 2013-06-18 Qualcomm Incorporated Combining decision metrics for decoding based on payload difference
US8521520B2 (en) * 2010-02-03 2013-08-27 General Electric Company Handoffs between different voice encoder systems
US9185152B2 (en) * 2011-08-25 2015-11-10 Ustream, Inc. Bidirectional communication on live multimedia broadcasts
WO2016050916A1 (en) * 2014-10-02 2016-04-07 Jacoti Bvba Method to handle problematic patterns in a low latency multimedia streaming environment
EP3353786B1 (en) * 2015-09-25 2019-07-31 Dolby Laboratories Licensing Corporation Processing high-definition audio data
WO2022179406A1 (zh) * 2021-02-26 2022-09-01 腾讯科技(深圳)有限公司 音频转码方法、装置、音频转码器、设备以及存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5457685A (en) * 1993-11-05 1995-10-10 The United States Of America As Represented By The Secretary Of The Air Force Multi-speaker conferencing over narrowband channels
US5758256A (en) * 1995-06-07 1998-05-26 Hughes Electronics Corporation Method of transporting speech information in a wireless cellular system
US5995923A (en) * 1997-06-26 1999-11-30 Nortel Networks Corporation Method and apparatus for improving the voice quality of tandemed vocoders
JP3235654B2 (ja) * 1997-11-18 2001-12-04 日本電気株式会社 無線電話装置
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
JP2002202799A (ja) * 2000-10-30 2002-07-19 Fujitsu Ltd 音声符号変換装置
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
KR100434275B1 (ko) * 2001-07-23 2004-06-05 엘지전자 주식회사 패킷 변환 장치 및 그를 이용한 패킷 변환 방법
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
KR100460109B1 (ko) * 2001-09-19 2004-12-03 엘지전자 주식회사 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
CN100527225C (zh) * 2002-01-08 2009-08-12 迪里辛姆网络控股有限公司 基于celp的语音代码之间的代码转换方案
JP2004222009A (ja) * 2003-01-16 2004-08-05 Nec Corp 異種網接続ゲートウェイおよび異種網間通信課金システム
US7469209B2 (en) * 2003-08-14 2008-12-23 Dilithium Networks Pty Ltd. Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications

Also Published As

Publication number Publication date
EP1751743A1 (en) 2007-02-14
WO2005112006A1 (en) 2005-11-24
JP2007537494A (ja) 2007-12-20
CN1954366A (zh) 2007-04-25
US20050258983A1 (en) 2005-11-24

Similar Documents

Publication Publication Date Title
KR20070038041A (ko) 전기 통신을 위한 멀티-레이트 음성 부호화기에 있어서음성 트랜스-레이팅을 위한 방법 및 장치
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
US7184953B2 (en) Transcoding method and system between CELP-based speech codes with externally provided status
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
US7962333B2 (en) Method for high quality audio transcoding
US5995923A (en) Method and apparatus for improving the voice quality of tandemed vocoders
US20050053130A1 (en) Method and apparatus for voice transcoding between variable rate coders
CA2940657C (en) Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates
KR20040028750A (ko) 음성 코덱의 선스펙트럼 주파수 벡터 양자화 방법 및 시스템
CN100527225C (zh) 基于celp的语音代码之间的代码转换方案
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
US20040111257A1 (en) Transcoding apparatus and method between CELP-based codecs using bandwidth extension
US7684978B2 (en) Apparatus and method for transcoding between CELP type codecs having different bandwidths
KR100460109B1 (ko) 음성패킷 변환을 위한 lsp 파라미터 변환장치 및 방법
US20060212289A1 (en) Apparatus and method for converting voice packet rate
JPH09269798A (ja) 音声符号化方法および音声復号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application