KR101105353B1 - Cdma 무선 시스템의 가변 비트 레이트 광대역 스피치코딩시 효율적인 인-밴드 딤-버스트 시그날링 및하프-레이트 맥스 오퍼레이션을 위한 방법 및 장치 - Google Patents

Cdma 무선 시스템의 가변 비트 레이트 광대역 스피치코딩시 효율적인 인-밴드 딤-버스트 시그날링 및하프-레이트 맥스 오퍼레이션을 위한 방법 및 장치 Download PDF

Info

Publication number
KR101105353B1
KR101105353B1 KR1020057000166A KR20057000166A KR101105353B1 KR 101105353 B1 KR101105353 B1 KR 101105353B1 KR 1020057000166 A KR1020057000166 A KR 1020057000166A KR 20057000166 A KR20057000166 A KR 20057000166A KR 101105353 B1 KR101105353 B1 KR 101105353B1
Authority
KR
South Korea
Prior art keywords
communication mode
communication
frame
signal
coding parameters
Prior art date
Application number
KR1020057000166A
Other languages
English (en)
Other versions
KR20050016976A (ko
Inventor
젤리네크밀란
살라미레드완
Original Assignee
노키아 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 노키아 코포레이션 filed Critical 노키아 코포레이션
Publication of KR20050016976A publication Critical patent/KR20050016976A/ko
Application granted granted Critical
Publication of KR101105353B1 publication Critical patent/KR101105353B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Selective Calling Equipment (AREA)
  • Communication Control (AREA)

Abstract

제1통신 방식을 이용하고 제1코더 및 제2디코더를 구비한 제1스테이션을, 제2통신 방식을 이용하고 제2코더 및 제2디코더를 구비한 제2스테이션과 상호동작시키는 방법 및 장치에서, 제1스테이션과 제2스테이션간의 통신은 제1 및 제2스테이션들 중 하나의 코더로부터 다른 하나의 디코더로 소리 신호와 관련된 신호-코딩 파라미터들을 전송함으로써 수행된다. 소리 신호는 신호-코딩 파라미터들의 전송시 풀(full) 비트 레이트가 사용되는 제1통신 모드를 이용해 신호-코딩 파라미터들이 한 스테이션의 코더로부터 다른 한 스테이션의 디코더로 전송되어야 하는지의 여부를 판단하도록 분류된다. 소리 신호의 분류에 따라 신호-코딩 파라미터들이 제1통신 모드를 이용해 전송되어야 한다고 판단되고, 신호-코딩 파라미터들의 전송 중에 비트 레이트를 감소시키도록 의도되는 통신 모드를 이용하여 한 스테이션에서 다른 스테이션으로 신호-코딩 파라미터들을 전송하라는 요청이 수신될 때, 한 스테이션의 코더로부터, 신호-코딩 파라미터들의 일부가 베제되고 나머지 신호-코딩 파라미터들이 제2통신 모드를 이용해 다른 스테이션의 디코더로 전송된다. 신호-코딩 파라미터들 중 배제된 부분은 다른 스테이션의 디코더가 그 신호-코딩 파라미터들을 디코딩하기 전에 재생된다.

Description

CDMA 무선 시스템의 가변 비트 레이트 광대역 스피치 코딩시 효율적인 인-밴드 딤-버스트 시그날링 및 하프-레이트 맥스 오퍼레이션을 위한 방법 및 장치 {Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems}
본 발명은 제1통신 방식을 이용하고 제1코더 및 제2디코더를 포함하는 제1스테이션과, 제2통신 방식을 이용하고 제2코더 및 제2디코더를 포함하는 제2스테이션을 상호 동작시키는 방법에 관한 것으로, 제1 및 제2스테이션들 사이의 통신은 제1 및 제2스테이션들 중 하나의 코더로부터 제1 및 제2스테이션들 중 다른 하나의 디코더로 시그날-코딩 파라미터들을 전송함으로써 수행된다.
원격 회의, 멀티미디어, 및 무선 통신과 같은 다양한 어플리케이션들에서, 주관적 품질과 비트 레이트 사이에 바람직한 타협점을 갖는 효율적 디지털 협대역 및 광대역 스피치 코딩 기술들에 대한 수요가 증가하고 있다. 최근까지, 200~3400 Hz의 범위 안에 제한된 전화용 대역폭이 주로 스피치(speech) 코딩 어플리케이션에 이용되었었다. 그러나, 광대역 스피치 어플리케이션들은 통신시 일반적인 전화용 대역폭에 비해 증가된 명료성과 자연스러움을 제공한다. 50~7000 Hz 범위의 대역 폭은 마주보며(face-to-face) 통신하는 느낌을 주는 양호한 품질을 전달하기 충분하다고 알려져 있다. 일반적인 오디오 신호들에 대해, 이 대역폭은 주관적인 허용 가능한 품질을 제공하지만, 20~16000 Hz 및 20~2000 Hz의 범위에서 각각 동작하는 FM 라디오 또는 CD의 품질 보다는 떨어진다.
스피치 코더는 스피치 신호를 디지털 비트 스트림으로 변환하여 통신 채널을 통해 전송하거나 저장 매체에 저장한다. 스피치 신호는 디지털화, 즉, 샘플 당 16비트로 샘플링 및 양자화된다. 스피치 코더는 주관적인 양호한 품질을 유지하면서 이러한 디지털 샘플들을 보다 작은 수의 비트들로 나타내는 역할을 한다. 스피치 디코더 또는 합성기는 전송되거나 저장된 비트 스트림에 대해 작용하여 이것을 스피치 신호로 다시 변환한다.
코드-여기형 선형 예측(Code-Excited Linear Prediction, CELP) 코딩은 주관적인 품질과 비트 레이트 사이에 양호한 타협점을 찾는 최선의 종래 기술들 가운데 하나이다. 이 코딩 기술은 무선 및 유선 어플리케이션들 모두에서 몇 몇 스피치 코딩 표준들의 기초를 이룬다. CELP 코딩에서, 샘플링된 스피치 신호는 보통 프레임들이라 불리는 N개 샘플들의 연속 블록들에서 처리되고, 여기서 N은 통상적으로 10~30 ms에 해당하는 소정 수이다. 선형 예측(LP) 필터가 모든 프레임에서 계산 및 전송된다. LP 필터의 계산은 보통 룩어헤드(lookahead), 즉 다음 프레임으로부터 5~15 ms 스피치 세그먼트를 필요로 한다. N-샘플 프레임은 서브프레임이라 불리는 보다 작은 블록들로 나눠진다. 보통 한 프레임 안에서 서브프레임들의 개수는 3 또는 4개가 되어 4~10 ms의 서브프레임들이 되게 한다. 각 서브프레임에서는 , 일반적으로 지난 여기(past excitation)와 쇄신된 고정 코드북 여기(innovative, fixed-codebook excitation)의 두 성분들로부터 한 여기 신호가 얻어진다. 지난 여기로부터 형성된 성분은 흔히 적응적 코드북 또는 피치(pitch) 여기라고 불린다. 여기 신호를 특징짓는 파라미터들이 부호화되어 디코더로 전송되고, 이때 재구성된 여기 신호가 LP 필터의 입력으로서 사용된다.
코드 분할 다중화 억세스(CDMA) 기술을 이용하는 무선 시스템들에서, 소스-제어형 가변 비트 레이트(VBR) 스피치 코딩의 사용이 시스템의 능력을 크게 향상시킨다. 소스-제어형 VBR 코딩에서, 코덱(codec)은 수 비트 레이트들로 작동하고, 레이트 선택 모듈이 스피치 프레임의 성질(가령, 유성(voiced), 무성(unvoiced), 과도형(transient), 배경 노이즈, 등등)에 기반해, 각 스피치 프레임을 코딩하는데 사용되는 그 비트 레이트를 결정하는데 이용된다. 그 목적은 평균 데이터 레이트(ADR)이라고도 불리는 소정 평균 비트 레이트로 최선의 스피치 품질을 얻고자 하는 것이다. 코덱은 서로 다른 모드들에서 서로 다른 ADR을 얻도록 레이트 선택 모듈을 튜닝함으로써 서로 다른 모드들에서 작동할 수 있고, 이때 코덱 성능은 증가하는 ADR들과 함께 향상된다. 이것이 코덱에 스피치 품질과 시스템 능력 사이의 타협 메커니즘을 제공한다. CDMA 시스템들(예를 들어, CDMA-1 및 CDMA2000)에서는, 보통 4개의 비트 레이트들이 사용되는데, 이들은 풀-레이트(full-rate, FR), 하프-레이트(half-rate, HR), 1/4 레이트(QR), 및 1/8 레이트(ER)이라고 한다. 이 시스템에서 레이트 집합 I 및 레이트 집합 II라고 불리는 두 레이트 집합들이 지원된다. 레이트 집합 II에서, 레이트 선택 메커니즘을 가진 가변 레이트 코덱이, 13.3(FR), 6.2(HR), 2.7(QR), 및 1.0(ER) kbit/s의 소스-코딩 비트 레이트들로 작동되고, 이 레이트들은 (에러 검출을 위해 약간의 비트들이 더해져) 14.4, 7.2, 3.6, 및 1.8 kbit/s의 총 비트 레이트들에 상응한다.
CDMA 시스템들에서, (딤(dim) 및 버스트 시그날링이라 불리는) 인-밴드(in-band) 시그날링 정보를 송신하기 위해 어떤 스피치 프레임들에서는 풀-레이트 대신 하프-레이트가 강요될 수 있다. 좋지 않은 채널 조건(셀 경계 근처와 같은) 중에 코덱의 견고성을 향상시키도록 코덱 하프-레이트를 최대 비트 레이트로서 사용하는 것 역시 시스템에 의해 강요될 수 있다. 이것은 하프-레이트 맥스(max)라고 불린다. 통상적으로, VBR 코딩에서, 하프 레이트는 프레임이 고정형 유성이거나 고정형 무성일 때 사용된다. 두 가지 코덱 구조들이 각 신호 종류에 대해 사용된다(무성의 경우, 피치 코드북 없는 CELP 모델이 사용되고, 유성의 경우 주기성을 개선시키고 피치 인덱스들에 대한 비트 수를 감소시키게 하는 신호 변경이 이용된다). 풀-레이트는 첫 시작과 과도 프레임들 및 혼합형 유성 프레임들에 대해 사용된다(일반적인 CELP 모델이 흔히 이용된다). 레이트 선택 모듈은 부호화될 프레임을 풀-레이트 프레임으로 선택하고 시스템은 하프-레이트 프레임을 강요할 때, 하프-레이트 모드들이 시작 및 과도 신호들을 효과적으로 부호화할 수 없기 때문에 스피치 성능이 저하된다.
최근, 적응적 멀티-레이트 광대역(AMR-WB) 스피치 코덱이라 알려진 광대역 코덱이 몇몇 광대역 스피치 전화통신 및 서비스를 위한 ITU-T(국제 원격통신 연합-원격통신 표준화 부문)과, GSM 및 W-CDMA 제3세대 무선 시스템들을 위한 3GPP(제3 세대 공동 프로젝트)에 의해 선택되었다. AMR-WB 코덱은 6.6에서 23.85 kbit/s 범위 안에 있는 9개의 비트 레이트들을 포함한다. CDMA2000 시스템에 대한 AMR-WB 기반의 소스 제어형 VBR 코덱을 설계하는 것은 CDMA2000과 AMR-WB 코덱을 이용하는 다른 시스템들 사이의 상호 동작을 가능하게 한다는 이점을 가진다. 12.65 kbit/s의 AMR-WB 비트 레이트는 레이트 집합 II의 13.3 kbit/s 풀-레이트에 맞출 수 있는 가장 가까운 레이트이다. 이 레이트가, (스피치 품질을 저하시키는) 트랜스코딩의 필요 없이 상호 동작을 가능하게 하기 위한, CDMA2000 광대역 VBR 코덱 및 AMR-WB 사이의 공통 레이트로서 사용될 수 있다. 6.2 kbit/s의 하프-레이트는 레이트 집합 II 프레임워크의 효과적 동작을 가능하게 하도록 CDMA2000 VBR 광대역 솔루션에 부가되어야 한다. 그러면 코덱은 약간의 CDMA2000-고유 모드들에서 동작할 수 있고, AMR-WB 코덱을 이용한 시스템들과 상호 동작할 수 있는 모드를 포함한다. 그러나, CDMA2000 및, AMR-WB를 이용하는 다른 시스템 사이에 교차-시스템 연결 없는 동작 콜(call)이 이전에 설명한 것과 같이(딤 및 버스트 시그날링 등에서) 하프-레이트의 이용을 강제할 수 있다. AMR-WB 코덱은 CDMA2000 광대역 코덱의 6.2 kbit/s 하프-레이트를 인식하지 않기 때문에, 강제된 하프-레이트 프레임들은 삭제된 프레임들로서 해석된다. 이러한 것이 연결 성능의 역효과를 가져온다.
본 발명의 제1양상에 따라,
- 제1통신 방식을 사용하고 제1코더와 제1디코더를 구비하는 제1스테이션을 제2통신 방식을 사용하고 제2코더와 제2디코더를 구비하는 제2스테이션과 상호 동작시키고, 제1 및 제2스테이션들 사이의 통신은 제1 및 제2스테이션들 중 하나의 코더로부터 제1 및 제2스테이션들 중 다른 하나의 디코더로 신호-코딩 파라미터들을 전송함으로써 수행되는 방법을 제공하고, 이 방법은 신호-코딩 파라미터들의 전송 중 비트 레이트를 감소시키도록 의도된 어떤 통신 모드를 이용하여 상기 한 스테이션에서 다른 스테이션으로 신호-코딩 파라미터들을 전송하라는 요청을 수신하는 단계; 상기 요청에 응하여, 상기 한 스테이션의 코더로부터 신호-코딩 파라미터들의 일부를 제외하고 나머지 신호-코딩 파라미터들을 상기 다른 스테이션의 디코더로 전송하는 단계; 및 상기 신호-코딩 파라미터들의 일부를 재생(regenerating)하고 다른 스테이션의 디코더에서 그 신호-코딩 파라미터들을 디코딩하는 단계를 포함한다.
- 제1통신 방식을 사용하고 제1코더와 제1디코더를 구비하는 제1스테이션을 제2통신 방식을 사용하고 제2코더와 제2디코더를 구비하는 제2스테이션과 상호 동작시키고, 제1 및 제2스테이션들 사이의 통신은 제1 및 제2스테이션들 중 하나의 코더로부터 제1 및 제2스테이션들 중 다른 하나의 디코더로 신호-코딩 파라미터들을 전송함으로써 수행되는 시스템을 제공하고, 이 시스템은 신호-코딩 파라미터들의 전송 중 비트 레이트를 감소시키도록 의도된 어떤 통신 모드를 이용하여 상기 한 스테이션에서 다른 스테이션으로 신호-코딩 파라미터들을 전송하라는 요청을 수신하는 수단; 상기 요청에 응하여, 상기 한 스테이션의 코더로부터 신호-코딩 파라미터들의 일부를 제외하고 나머지 신호-코딩 파라미터들을 상기 다른 스테이션의 디코더로 전송하는 수단; 및 상기 신호-코딩 파라미터들의 일부를 재생(regenerating)하는 수단과 그 신호-코딩 파라미터들을 디코딩하는 디코더를 포함한다.
본 발명의 제2양상에 따라,
- 제1통신 방식을 사용하고 제1코더와 제1디코더를 구비하는 제1스테이션을 제2통신 방식을 사용하고 제2코더와 제2디코더를 구비하는 제2스테이션과 상호 동작시키고, 제1 및 제2스테이션들 사이의 통신은 제1 및 제2스테이션들 중 하나의 코더로부터 제1 및 제2스테이션들 중 다른 하나의 디코더로 소리(sound) 신호와 관련된 신호-코딩 파라미터들을 전송함으로써 수행되는 방법을 제공하고, 이 방법은 신호-코딩 파라미터들의 전송시 풀(full) 비트 레이트가 사용되는 제1통신 모드를 이용해 신호-코딩 파라미터들이 상기 한 스테이션의 코더로부터 다른 한 스테이션의 디코더로 전송되어야 하는지의 여부를 판단하기 위해 상기 소리 신호를 분류하는 단계; 신호-코딩 파라미터들의 전송 중 비트 레이트를 감소시키도록 의도된 제2통신 모드를 이용하여 상기 한 스테이션에서 다른 스테이션으로 신호-코딩 파라미터들을 전송하라는 요청을 수신하는 단계; 소리 신호의 분류에 따라 신호-코딩 파라미터들이 제1통신 모드를 이용해 전송되어야 한다고 판단될 때, 및 제2통신 모드를 이용해 신호-코딩 파라미터들을 전송하라는 요청이 수신될 때, 상기 한 스테이션의 코더로부터 신호-코딩 파라미터들의 일부를 제외하고, 제2통신 모드를 이용해 나머지 신호-코딩 파라미터들을 상기 다른 스테이션의 디코더로 전송하는 단계를 포함한다.
- 제1통신 방식을 사용하고 제1코더와 제1디코더를 구비하는 제1스테이션을 제2통신 방식을 사용하고 제2코더와 제2디코더를 구비하는 제2스테이션과 상호 동작시키고, 제1 및 제2스테이션들 사이의 통신은 제1 및 제2스테이션들 중 하나의 코더로부터 제1 및 제2스테이션들 중 다른 하나의 디코더로 소리(sound) 신호와 관련된 신호-코딩 파라미터들을 전송함으로써 수행되는 시스템을 제공하고, 이 시스템은 신호-코딩 파라미터들의 전송시 풀(full) 비트 레이트가 사용되는 제1통신 모드를 이용해 신호-코딩 파라미터들이 상기 한 스테이션의 코더로부터 다른 한 스테이션의 디코더로 전송되어야 하는지의 여부를 판단하기 위해 상기 소리 신호를 분류하는 수단; 신호-코딩 파라미터들의 전송 중 비트 레이트를 감소시키도록 의도된 제2통신 모드를 이용하여 상기 한 스테이션에서 다른 스테이션으로 신호-코딩 파라미터들을 전송하라는 요청을 수신하는 수단; 소리 신호의 분류에 따라 신호-코딩 파라미터들이 제1통신 모드를 이용해 전송되어야 한다고 판단될 때, 및 제2통신 모드를 이용해 신호-코딩 파라미터들을 전송하라는 요청이 수신될 때, 상기 한 스테이션의 코더로부터 신호-코딩 파라미터들의 일부를 제외하고, 제2통신 모드를 이용해 나머지 신호-코딩 파라미터들을 상기 다른 스테이션의 디코더로 전송하는 수단을 포함한다.
본 발명의 제3양상에 따라,
- 제1스테이션으로부터 제2스테이션으로 신호-코딩 파라미터들을 전송하는 방법이 제공되고, 이 방법은, 제1 및 제2스테이션들 중 하나에서, 풀-레이트 통신 모드에 따라 소리 신호를 코딩하는 단계; 신호-코딩 파라미터들의 전송 중에 비트 레이트를 감소시키도록 의도된 제2통신 모드를 이용하여 제1 및 제2스테이션들 중 상기 한 스테이션에서 다른 스테이션으로 신호-코딩 파라미터들을 전송하라는 요청을 수신하는 단계; 상기 요청에 응하여, 풀-레이트 통신 모드로 부호화된 신호-코딩 파라미터들을 제2통신 모드로 부호화되는 신호-코딩 파라미터들로 변환하는 단계; 및 제2통신 모드로 부호화된 신호-코딩 파라미터들을 제1 및 제2스테이션들 중 상기 다른 하나로 전송하는 단계를 포함한다.
- 제1스테이션으로부터 제2스테이션으로 신호-코딩 파라미터들을 전송하는 시스템이 제공되고, 이 시스템은, 제1 및 제2스테이션들 중 하나에서, 풀-레이트 통신 모드에 따라 소리 신호를 부호화하는 코더; 신호-코딩 파라미터들의 전송 중에 비트 레이트를 감소시키도록 의도된 제2통신 모드를 이용하여 제1 및 제2스테이션들 중 상기 한 스테이션에서 다른 스테이션으로 신호-코딩 파라미터들을 전송하라는 요청을 수신하는 수단; 상기 요청에 응하여, 풀-레이트 통신 모드로 부호화된 신호-코딩 파라미터들을 제2통신 모드로 부호화되는 신호-코딩 파라미터들로 변환하는 수단; 및 제2통신 모드로 부호화된 신호-코딩 파라미터들을 제1 및 제2스테이션들 중 상기 다른 하나로 전송하는 수단을 포함한다.
본 발명의 상술하였거나 기타의 목적들, 이점들, 그리고 특징들이, 첨부된 도면들을 참조했을 뿐인 예로서 주어지는, 이하의 비한정 실시예들의 설명을 통해 보다 명확해질 것이다.
도 1은 본 발명이 사용될 수 있는 스피치 통신 시스템의 비한정 예에 대한 개략적 블록도이다.
도 2는 레이트 결정 로직을 구비하는 가변 비트 레이트 코덱의 비한정 에에 대한 동작 블록도이다.
도 3은 저에너지 프레임들을 위한 일반적 HR을 이용하는 레이트 결정 로직을 포함하는 가변 비트 레이트 코덱의 비한정 예의 동작 블록도이다.
도 4는 레이트 결정 로직 안에서 하프-레이트 시스템 요청을 포함하는, 도 3에 따른 가변 비트 레이트 코덱의 비한정 예에 대한 동작 블록도이다.
도 5는 레이트 결정 로직 안에서 패킷 레벨 (또는 비트스트림 레벨)에 대한 하프-레이트 시스템 요청을 포함하는, 본 발명의 비한정적 실시예에 따른 가변 비트 레이트 코덱의 예를 나타낸 동작 블록도이다.
도 6은 3GPP <-> CDMA2000 모바일 대 모바일 콜, 또는 AMR-WB <-> VBR-WB IP 콜에서 수반될 때의 VBR-WB의 상호 동작 모드시, 본 발명의 비한정적 실시예에 따른 딤 및 버스트 시그날링 방법의 전형적 예이다.
도 7은 광대역 코딩 장치, 보다 상세히는 AMR-WB 코더의 비한정적 예에 대한 개략적 블록도이다.
도 8은 광대역 디코딩 장치, 보다 상세히는 AMR-WB 디코더의 비한정적 에에 대한 개략적 블록도이다.
본 발명의 예시적 실시예는 스피치 신호와 관련해 이하의 설명에서 기술되고 있지만, 본 발명의 개념은 다른 종류의 신호, 특히, 꼭 그것에 국한된 것은 아니지만, 다른 종류의 소리 신호들에도 동등하게 적용될 수 있다는 것을 알아야 한다.
도 1은 스피치 인코딩 및 디코딩 장치들의 사용을 묘사한 스피치 통신 시스템(100)을 도시한다. 도 1의 스피치 통신 시스템(100)은 통신 채널(101)을 통한 스피치 신호의 전송을 지원한다. 예를 들어 어떤 유선, 광학적 링크 또는 광섬유 링크를 포함할 수도 있지만 통신 채널(101)은 보통 적어도 일부의 무선 주파수 링크를 포함한다. 무선 주파수 링크는 흔히, 셀룰라 전화통신 시스템들에서 볼 수 있는 것과 같은 공유된 대역폭을 필요로 하는 다중의, 동시 스피치 통신을 지원한다. 도시되지는 않았지만, 통신 채널(101)은, 부호화된 스피치 신호를 후에 재생하기 위해 기록 및 저장하는, 시스템(100)의 단일 장치 구성에서의 저장 장치로 대체될 수도 있다.
도 1의 스피치 통신 시스템(100)에서, 마이크로폰(102)은 아날로그 스피치 신호(103)를 생성하고, 이 신호는 아날로그-디지털(A/D) 컨버터(104)로 보내져 디지털 스피치 신호(105)로 변환된다. 스피치 코더(106)는 디지털 스피치 신호(105)를 부호화하여 신호-코딩 파라미터들의 집합(107)을 생성하고, 이들은 바이너리 형식으로 부호화되어 채널 코더(108)로 전달된다. 선택 가능한 채널 코더(108)는 신호-코딩 파라미터들(107)을 통신 채널(101)로 보내기 전에 이들의 바이너리 표현에 중복 정보(redundancy)를 부가한다.
수신기에서, 채널 디코더(109)는 수신된 비트 스트림(111)에서 상기 중복 정보를 활용하여 전송 중에 발생한 채널 에러들을 검출 및 정정한다. 스피치 디코더(110)는 채널 디코더(109)로부터 수신된 비트 스트림(112)을 신호-코딩 파라미터들의 집합으로 다시 변환하고 그 복구된 신호-코딩 파라미터들로부터 디지털 합성 스피치 신호(113)를 생성한다. 스피치 디코더(110)에서 재구성된 디지털 합성 스피치 신호(113)는 디지털-아날로그(D/A) 컨버터(115)에서 아날로그 형태(114)로 변환되고 확성 스피커 유닛(116)을 통해 재생된다.
<소스-제어형 가변 비트 레이트 스피치 코딩, Source-controlled Variable Bit Rate Speech Coding>
도 2는 네 개의 코딩 비트 레이트들을 제어하기 위한 레이트 결정 로직을 포함하는 가변 비트 레이트 코덱의 비제한적 예를 도시한다. 이 예에서, 비트 레이트들의 집합은 비활동 스피치 프레임들에 대해 지정된 코덱 비트 레이트(1/8 (CNG) 코딩 모듈, 208), 무성 스피치 프레임들에 대한 비트 레이트(하프-레이트 무성 코딩 모듈, 207), 안정적 유성 프레임들에 대한 비트 레이트(하프-레이트 유성 코딩 모듈, 206), 및 기타 다른 종류의 프레임들을 위한 비트 레이트(풀-레이트 코딩 모듈, 205)을 포함한다.
레이트 결정 로직은 세 단계들(20, 202, 및 203)에서 프레임 베이스로 수행된 신호 분류에 기반하며, 이들의 동작은 이 기술 분야의 당업자들에게 잘 알려져 있다.
먼저, 음성 활동 검출기(VAD)(201)가 활동 및 비활동 스피치 프레임들을 구별한다. 비활동 스피치 프레임이 검출되면 (배경 노이즈 신호) 신호 분류 체인은 종료되고, 그 프레임은 코딩 모듈(208)에서 디코더에서의 컴포트(comfort) 노이즈 생성(CNG)과 함께 1/8 레이트 프레임(CDMA2000 레이트 집합 II에 따른 1.0 kbit/s)으로서 부호화된다. 활동 스피치 프레임이 검출되면, 그 프레임은 제2분류기(202) 의 대상이 된다.
제2분류기(202)는 음성 결정을 내리도록 된 것이다. 분류기(202)가 프레임을 무성 스피치 프레임으로 분류하면, 분류 체인이 끝나고, 그 프레임은 모듈(207)에서, 무성 신호들에 최적화된 하프-레이트(CDMA2000 레이트 집합 II에 따른 6.2 kbit/s)로 부호화된다. 프레임이 무성 스피치 프레임이 아니라고 분류하면, 스피치 프레임은 "안정 유성음" 분류기(203)에서 처리된다.
프레임이 안정한 유성 프레임이라고 분류되면, 그 프레임은 모듈(206)에서 안정한 유성 신호들을 위해 최적화된 하프-레이트(CDMA2000 레이트 집합 II에 따른 6.2 kbit/s)로 부호화된다. 유성 프레임이 아니면, 그 프레임은 유성 개시 또는 급속히 전개되는 유성 스피치 신호와 같은 비고정(not-stationary) 스피치 세그먼트를 포함할 가능성이 크다. 이러한 프레임들은 일반적으로 주관적인 양호한 품질을 유지하기 위해 높은 비트 레이트를 필요로 한다. 따라서, 이런 경우, 스피치 프레임은 모듈(205)에서 풀-레이트 프레임 (CDMA2000 레이트 집합 II에 따른 13.3 kbit/s)으로서 부호화된다.
도 3에 도시된 비한정적 다른 구현예에서, 프레임이 "안정한 유성"으로 분류되지 않으면, 그 프레임은 저에너지 프레임 분류기(311)에서 처리된다. 이것은 VAD 검출기(201)에 의해 고려되지 않은 프레임들을 검출하는데 사용된다. 프레임 에너지가 소정 문턱치 이하이면 그 프레임은 일반적 하프-레이트 코더(312)를 이용해 부호화되고, 그렇지 않으면 모듈(205)에서 풀-레이트 프레임으로서 부호화된다.
신호 분류 모듈들(201, 202, 203, 및 311)은 이 분야의 당업자들에게 잘 알 려진 것이므로, 이 명세서에서는 더 기술되지 않을 것이다. 도 3의 비한정적 예에서, 서로 다른 비트 레이트들의 코딩 모듈들, 즉 모듈들(205, 206, 207, 208, 및 312)은 코드-여기형 선형 예측(CELP) 코딩 기술들에 기반하며, 이 기술들 또한 이 분야의 당업자들에게 잘 알려져 있다. 예를 들어, 비트 레이트들은 위에서 기술한 CDMA2000 시스템의 레이트 집합 II에 따라 설정된다.
비한정적이고, 예시적인 본 발명의 실시예는 여기서 국제 전기통신 연합(ITU)에 의해 권고안 G.722.2로서 표준화되고 AMR-WB 코덱(적응적 멀티 레이트 광대역 코덱)으로서 알려진 광대역 스피치 코덱을 참조해 기술된다[ITU-T 권고안 G.722.2 "적응적 멀티-레이트 광대역(AMR-WB)를 이용한 약 16 kbit/s에서의 스피치의 광대역 코딩", 2002년 제네바]. 이 코덱은 또한 제3세대 무선 시스템들에 있어서 광대역 전화통신을 위한 제3세대 공동 프로젝트(3GPP)에 의해 선택되었다[3GPP TS 26.190, "AMR 광대역 스피치 코덱: 트랜스코딩 기능" 3GPP 기술 사양]. AMR-WB는 6.6 에서 23.85 kbit/s까지 9 개의 비트 레이트들에서 동작할 수 있다. 여기서, 12.65 kbit/s의 비트 레이트가 풀 레이트의 예로서 사용된다.
물론, 비한정적이고, 예시적인 본 발명의 실시예는 다른 종류의 코덱들에도 적용될 수 있다.
독자의 편의를 위해, AMR-WB 코덱의 개괄적 보기가 아래에서 주어진다.
<AMR-WB 코더의 개괄>
도 7을 참조하면, 샘플링된 스피치 신호가, 701에서 711까지 번호 매겨진 11개의 모듈들로 분해되는 도 7의 코딩 장치에 의해 각각의 블록별로 부호화된다.
따라서 입력 스피치 신호(712)는 블록별로, 즉 프레임들이라 불리는 상술한 L-샘플 블록들에서 처리된다.
도 7을 참조하면, 샘플링된 입력 스피치 신호(712)는 다운-샘플러 모듈(701)에서 하향 샘플링된다. 이 분야의 당업자들에게 잘 알려져 있는 기술들을 이용해, 신호가 16 kHZ에서 12.8 kHz로 하향 샘플링된다. 다운-샘플링은 코딩 효율을 증가시키는데, 이는 보다 작은 주파수 대역폭이 부호화되기 때문이다. 이것은 한 프레임 안의 샘플들의 개수가 줄기 때문에 알고리즘의 복잡성을 또한 감소시킨다. 다운-샘플링 후, 20 ms의 320-샘플 프레임이 256-샘플 프레임으로 감소된다(4/5의 다운-샘플링 비율).
그리고 나서 입력 프레임은 옵션인 전-처리 모듈(702)로 주어진다. 전-처리 모듈(702)은 50 hz 차단(cut-off) 주파수를 가진 하이 패스 필터로 이뤄질 수 있다. 하이 패스 필터(702)는 50 Hz 이하에 있는 원치 않는 소리 성분들을 제거한다.
다운 샘플링되고 전처리된 신호는 s p(n), n=0, 1, 2, ...L-1로 표현되고, 이때 L은 프레임의 길이이다(12.8 kHz의 샘플링 주파수에서 256). 이 신호 s p(n)는 다음과 같은 전달 함수를 가지는 전치-강조(pre-emphasis) 필터(703)를 이용해 전치 강조된다:
Figure 112005000369827-pct00001
Figure 112005000369827-pct00002
는 0과 1 사이에 놓인 값을 가지는 전치-강조 팩터이다(일반적인 값은
Figure 112005000369827-pct00003
=0.7). 전치-강조 필터(703)의 기능은 입력 스피치 신호의 고주파수 컨텐츠들을 강화시키는 것이다. 그것은 또한 입력 스피치 신호의 동적 범위를 감소시키는데, 이것이 고정 소수점 구현에 대해 보다 효과적인 것이 되게 한다. 전치-강조는 또한 향상된 소리 품질에 이바지하는, 양자화 에러의 적절한 전반적 인지 가중을 수행하는 데 중요한 역할을 한다.
전치-강조 필터(703)의 출력은 s(n)으로 표기한다. 이 신호는 모듈(704)에서 LP 해석을 수행하는데 사용된다. LP 해석은 이 분야의 당업자들에게 잘 알려진 기술이다. 도 7의 예에서는 자동상관 접근법이 이용된다. 자동상관 접근법에서, 신호 s(n)이 먼저, 일반적으로 약 30~40 ms의 길이를 가진 해밍(Hamming) 윈도우를 사용해 윈도우된다. 자동상관은 윈도우된 신호로부터 계산되고, Levinson-Durbin 반복을 사용해 LP 필터 계수들인 ai를 계산한다. 이때 i=1, ..., p이고, p는 LP 차수로서, 광대역 코딩시 보통 16이 된다. 파라미터들 ai은 LP 필터의 전달 함수 A(z)의 계수들이고, 이것은 다음과 같은 관계로서 주어진다:
Figure 112005000369827-pct00004
LP 해석은 모듈(704)에서 수행되고, 이 모듈은 LP 필터 계수들의 양자화 및 보간도 수행한다. LP 필터 계수들은 먼저 양자화 및 보간 목적에 보다 적합한 다른 등가적 도메인으로 변환된다. 선 스펙트럼 쌍(LSP) 및 이동 스펙트럼 쌍(ISP) 도메인들이 양자화 및 보간이 효과적으로 수행될 수 있는 두 도메인들이다. 16 개 의 LP 필터 계수들, ai이 분리 또는 멀티-스테이지 양자화, 또는 그 조합을 이용해 약 30 내지 50 비트들의 비트들로 양자화될 수 있다. 보간의 목적은 모든 서브프레임마다 LP 필터 계수들의 업데이트를 가능하도록 하면서 모든 프레임 마다 한번씩 이들을 전송하고자 하는 것으로, 이것은 비트 레이트 증가 없이 코더 성능을 향상시킨다. LP 필터의 양자화 및 보간은 이 분야의 당업자들에게 잘 알려져 있다고 생각되므로, 이 명세서에서는 더 이상 기술하지 않을 것이다.
이하의 문단들은 서브프레임 단위로 수행되는 나머지 코딩 동작들을 기술한 것이다. 입력 프레임이 5 ms의 4 서브프레임들로 분할된다(12.8 kHz의 샘플링 주파수에서 64 샘플들). 다음 설명에서, 필터 A(z)는 서브프레임의 양자화되지 않은 보간된 LP 필터를 나타내고, 필터
Figure 112005000369827-pct00005
는 서브프레임의 양자화되고 보간된 LP 필터를 나타낸다. 필터
Figure 112005000369827-pct00006
는 모든 서브프레임마다 통신 채널을 통한 전송을 위해 멀티플렉서(MUX, 713)로 보내진다.
해석하고 합성(analysis-by-synthesis)하는 코더들에서, 입력 스피치 시호(712) 및 인지적으로 가중된 도메인에서 합성된 스피치 신호 사이의 제곱 평균 에러를 최소함으로써 최적의 피치 및 쇄신 파라미터들이 탐색된다. 가중된 신호 s w(n)는 전치-강조 필터(703)로부터의 신호 s(n)에 응하여 인지적 가중 필터(705)에서 계산된다. 광대역 신호들에 적합한, 고정 분모를 가진 인지적 가중 필터(705)가 사용된다. 인지적 가중 필터(705)의 전달 함수의 예가 다음과 같이 주어진다:
Figure 112005000369827-pct00007
피치 해석을 단순화하기 위해, 가중 스피치 신호 s w(n)로부터 개방 루프 피치 시차 TOL이 개방 피치 탐색 모듈(706)에서 먼저 추정된다. 그리고 나서 서브프레임 단위로 폐루프 피치 탐색 모듈(707)에서 수행되는 폐루프 피치 해석은 LTP 파라미터들 T(피치 시차)과 b(피치 이득)의 탐색 복잡도를 크게 덜어주는 개방 루프 피치 시차 TOL 근방으로 제한된다. 개방 루프 피치 해석은 이 분야의 당업자에게 알려진 기술들을 이용해, 보통 10 ms 마다 한번씩 모듈(706)에서 수행된다.
LTP(장기 예측) 해석을 위한 타겟 벡터 x가 먼저 계산된다. 이것은 보통 가중 스피치 신호 s w(n)으로부터 가중된 합성 필터
Figure 112005000369827-pct00008
의 제로-입력 응답 s 0을 감산함으로써 수행된다. 이 제로-입력 응답 s 0은, LP 해석, 양자화 및 보간 모듈(704)로부터의 양자화된 보간 LP 필터
Figure 112005000369827-pct00009
및, LP 필터들인 A(z) 및
Figure 112005000369827-pct00010
에 반응하는 메모리 업데이트 모듈(711)에 저장된 가중된 합성 필터
Figure 112005000369827-pct00011
의 초기 상태에 대해 반응하여 제로-입력 응답 산출기(708)에 의해 산출된다. 이 동작은 이 분야의 당업자에게 잘 알려져 있으므로 추가 기술하지 않을 것이다.
가중 합성 필터
Figure 112005000369827-pct00012
의 N-차원 임펄스 응답 벡터 h가, 모듈(704)로부터 의 LP 필터 A(z) 및
Figure 112005000369827-pct00013
의 계수들을 이용해 임펄스 응답 발생기(709)에서 계산된다. 역시, 이 동작도 이 분야의 당업자들에게 잘 알려진 것이므로 이 명세서에서는 더 기술하지 않을 것이다.
타겟 벡터 x, 임펄스 응답 벡터 h 및 개방 루프 피치 시차 TOL을 입력들로서 이용하는 폐루프 피치 탐색 모듈(707)에서 폐루프 피치 (또는 피치 코드북) 파라미터들 b, T, 및 j들이 계산된다.
타겟 벡터 x와 지난 여기 by의 축척 필터링된 버전 사이의 제곱 평균 가중 피치 예측 에러를 최소화시키는 최선의 피치 시차 T와 이득 b를 찾는 것으로 이뤄지고, 그러한 에러의 예는 다음과 같다.
Figure 112005000369827-pct00014
보다 상세하게 말하면, 피치(피치 코드북) 탐색은 세 단계들로 이뤄진다.
첫번째 단계에서, 가중된 스피치 신호 s w(n)에 응답하여 개방 루프 피치 탐색 모듈(706)에서 개방 루프 피치 시차 TOL이 추정된다. 상술한 바와 같이, 이 개방 루프 피치 해석은 이 기술 분야의 당업자에게 잘 알려져 있는 기술들을 이용하여 보통 10 ms (두 서브프레임) 마다 한번씩 수행된다.
두번째 단계에서는, 폐루프 피치 탐색 모듈(707)에서, 추정된 개방 루프 피치 시차 TOL 주변 (보통 ±5)의 정수 피치 시차들에 대한 탐색 기준 C가 탐색되며, 이것은 탐색 절차를 크게 단순화시킨다. 간단한 절차는 모든 피치 시차 마다 컨볼루션(convolution)을 계산할 필요 없이, 필터링된 코드벡터 y T(이 벡터는 다음에 나오는 설명에서 정의될 것이다)를 업데이트하는데 사용된다. 탐색 기준 C의 예는 다음과 같이 주어진다:
Figure 112005000369827-pct00015
, 여기서 t는 전치 벡터를 나타낸다.
최적의 정수 피치 시차가 두번째 단계에서 구해졌으면, 탐색 (모듈 707)의 세번째 단계가, 탐색 기준 C를 이용해, 그 최적의 정수 피치 시차 주변의 분수들을 테스트한다. 예를 들어, AMR-WB 표준은 1/4 및 1/2 서브샘플 분해능을 이용한다.
광대역 시노들에서, 고조파(harmonic) 구조는 스피치 세그먼트에 따라 어떤 소정 주파수까지만 존재한다. 따라서, 광대역 스피치 신호의 유성 세그먼트들에서 피치 기여부분을 효과적으로 표현할 수 있기 위해서는, 광대역 스펙트럼에 걸쳐 주기성의 정도를 변화시키도록 융통성이 필요로 된다. 이것은 복수개의 주파수 정형(shaping) 필터들 (에를 들어 로우 패스 또는 밴드 패스 필터들)을 통한 피치 코드벡터 처리에 의해 달성된다. 상기 정의된 제곱 평균 가중 에러
Figure 112005000369827-pct00016
를 최소화하는 주파수 정형 필터가 선택된다. 선택된 주파수 정형 필터는 인덱스 j에 의해 식별된다.
피치 코드북 인덱스 T는 부호화되어 통신 채널을 통한 전송을 위해 멀티플렉서(713)로 전송된다. 피치 이득 b는 양자화되어 멀티플렉서(713)로 전송된다. 여 분의 한 비트가 인덱스 j를 부호화하는데 사용되고, 이 여분의 비트 역시 멀티플렉서(713)로 제공된다.
일단 피치, 또는 LTP(장기 예측) 파라미터들 b, T, 및 j가 결정되었으면, 다음 단계는 도 7의 쇄신 여기형 탐새 모듈(710)을 이용한 최적의 쇄신 여기에 대해 검색하는 것으로 이뤄진다. 먼저, 타겟 벡터 x가 LTP 기여부분을 감산하여 업데이트된다:
Figure 112005000369827-pct00017
b는 피치 게인이고 y T는 필터링된 피치 코드북 벡터 (선택된 주파수 정형 필터(인덱스 j)로 필터링되고 임펄스 응답 h로 컨볼빙(convolving)되는 지연 T에서의 지난 여기)이다.
CELP의 쇄신 여기 탐색 절차는, 타겟 벡터 x'와 코드벡터 c k의 축척되고 필터링된 버전 사이의 다음 식과 같은 제곱 평균 에러 E를 최소화시키는 코드벡터 c k 및 게인 g를 찾기 위해 쇄신 코드북에서 수행된다.
Figure 112005000369827-pct00018
여기서 H는 임펄스 응답 벡터 h로부터 도출되는 하위 삼각 컨볼루션 매트릭스이다. 구해진 최적 코드벡터 c k에 대응하는 쇄신 코드북의 인덱스 k 및 이득 g는 통신 채널을 통한 전송을 위해 멀티플렉서(2130로 제공된다.
사용된 쇄신 코드북은, 1995년 8월 22일 허여된 Adoul 등의 미국 특허 5,444,816에 따라, 합성 스피치 품질을 향상시키기 위해 소정 스펙트럼 성분들을 개선시키는 적응적 전치 필터 F(z)가 뒤따르는 대수적 코드북으로 이뤄진 동적 코드북일 수 있음을 알아야 한다. 보다 상세히 말하면, 쇄신 코드북 탐색은 1995년 8월 22일에 허여된 미국 특허 번호 5,444,816 (Adoul 등); 1997년 12월 17일 Adoul 등에게 허여된 5,699,482; 1998년 5월 19일 Adoul 등에게 허여된 5,754,976; 1997년 12월 23일자 5,701,392 (Adoul 등)에 기술된 것과 같은 대수적 코드북을 이용해 모듈(710)에서 수행될 수 있다.
<AMR-WB 디코더의 개괄>
도 8의 스피치 디코더는 디지털 입력(822)(디멀티플렉서(817)로의 입력 비트스트림)과 출력 샘플링된 스피치 신호(823)(가산기(821)의 출력) 사이에 수행되는 여러 단계들을 나타낸다.
디멀티플렉서(817)는 디지털 입력 채널로부터 수신된 바이너리 정보(입력 비트 스트림, 822)로부터 신호-코딩 파라미터들을 추출한다. 각각 수신된 바이너리 프레임으로부터, 추출된 신호-코딩 파라미터들은,
- 프레임 마다 한번씩 생성되는 단기 예측 파라미터들(STP)이라고도 불리는 양자화되고 보간된 LP 계수들
Figure 112008038642476-pct00019
(라인 825);
- 장기 예측(LTP) 파라미터들인, T, b, 및 j (각 서브프레임에 대한); 및
- 쇄신 여기 인덱스 k 및 이득 g (각 서브프레임에 대한)이다.
현재의 스피치 신호는 이들 파라미터들에 기반하여 아래에서 설명되는 바와 같이 합성된다.
쇄신 여기 코드북(818)은 인덱스 k에 반응하여 쇄신 코드벡터 c k를 생성하고, 이것은 증폭기(824)에서, 디코딩된 쇄신 여기 이득 g에 의해 축척된다. 상기 언급한 미국 특허 번호들 5,444,816; 5,699,482; 5,754,976; 및 5,701,392에 기술된 이러한 쇄신 코드북(818)은 쇄신 코드벡터 c k를 생성하는데 사용된다.
증폭기(824)의 출력에서 생성된 축척 코드벡터 gc k는 주파수-종속 피치 개선기(805)를 통해 처리된다.
여기 신호 u의 주기성을 개선하는 것은 음성 세그먼트들의 품질을 향상시킨다. 이 주기성 개선은, 주파수 응답이 낮은 주파수들보다 높은 주파수들을 더 강조하는 쇄신 필터 F(z) (피치 개선기, 805)를 통한 쇄신 (고정된) 여기 코드북으로부터 쇄신 코드벡터 c k를 필터링함으로써 이뤄진다. 쇄신 필터 F(z)의 계수들은 여기 신호 u의 주기성의 정도와 관련된다.
쇄신 필터 F(z)의 계수들을 도출하는 효과적으로 가능한 방법이, 이들을 전체 여기 신호 u의 피치 기여의 정도와 관련시키는 것이다. 이것은 서브프레임 주기성에 따른 주파수 응답을 파생시키며, 여기서 더 높은 주파수들이 더 높은 피치 이득들에 대해 보다 강하게 강조된다(보다 강한 전반적 기울기). 쇄신 필터(805)는 여기 신호 u가 보다 주기적일 때 낮은 주파수들에서 쇄신 코드벡터 c k의 에너지를 낮추는 효과를 가지며, 이것은 높은 주파수대에서 보다 낮은 주파수대에서 여기 신호 u의 주기성을 향상시킨다. 쇄신 필터(805)에 대해 제안된 형태는 다음과 같다:
Figure 112005000369827-pct00020
Figure 112005000369827-pct00021
는 여기 신호 u의 주기성의 정도로부터 나온 주기성 팩터이다. 주기성 팩터
Figure 112005000369827-pct00022
는 음성 팩터 발생기(804)에서 계산된다. 먼저, 음성 팩터 rv가 음성 팩터 발생기(804)에서 다음과 같이 계산된다:
Figure 112005000369827-pct00023
Ev는 축척된 피치 코드벡터 bv T의 에너지이고, Ec는 축척된 쇄신 코드벡터 gck의 에너지이다. 즉,
Figure 112005000369827-pct00024
Figure 112005000369827-pct00025
.
rv의 값은 -1과 1 신호들 사이에 있음을 알아야 한다(1은 순수한 유성 신호에 해당하고 -1은 순수한 무성 신호에 해당한다).
상술한 축척된 피치 코드벡터 bv T는 피치 지연 T를 피치 코드북(801)에 제공 하여 피치 코드벡터를 생성함으로써 발생된다. 그러면 피치 코드벡터는, 차단 주파수가 디멀티플렉서(817)로부터의 인덱스 j와 관련되어 선택된 로우 패스 또는 밴드 패스 필터(802)를 통해 처리되어 필터링된 피치 코드벡터 v T를 생성한다. 그리고 나서, 그 필터링된 피치 코드벡터 v T는 증폭기(826)에 의해 이득 b만큼 증폭되어 축척 피치 코드벡터 bv T가 생성된다.
그리고 나서 음성 팩터 발생기(804)에서 음성 팩터
Figure 112005000369827-pct00026
가 다음과 같이 계산된다:
Figure 112005000369827-pct00027
이것은 순수하게 무성인 신호들에 대해 0인 값이 되고 순수하게 유성인 신호들에 대해 025가 된다.
따라서 쇄신 필터(805)(F(z))를 통해 축척 쇄신 코드벡터 gc k를 필터링함으로써 개선된 신호 cf가 계산된다.
개선된 여기 신호 u'가 가산기(820)에 의해 다음과 같이 계산된다:
Figure 112005000369827-pct00028
이러한 프로세스는 코더(700)에서 수행되지 않음을 주지해야 한다. 따라서, 코더(700)와 디코더(800)간의 동기를 유지하기 위해 메모리(803)에 저장된 개선치 없이 여기 신호 u의 지난 값을 이용해 피치 코드북(810)의 컨텐츠를 업데이트하는 것이 필수적이다. 따라서, 여기 신호 u는 피치 코드북(801)의 메모리(803)를 업데이트하는데 사용되고, 개선된 여기 신호 u'는 LP 합성 필터(806)의 입력에서 사용된다.
합성된 신호 s'는
Figure 112008038642476-pct00029
의 형식을 가지는 LP 합성 필터(806)를 통해 그 개선된 여기 신호 u'를 필터링함으로써 산출되고, 이때
Figure 112008038642476-pct00030
는 현 서브프레임의 양자화 및 보간된 LP 필터이다. 도 8에 도시된 바와 같이, 디멀티플렉서(817)로부터의 라인(825) 상의 양자화 및 보간된 LP 계수들
Figure 112008038642476-pct00031
은 LP 합성 필터(806)으로 제공되어 그에 따라 LP 합성 필터(806)의 파라미터들이 조정된다. 강조해제(de-emphasis) 필터(807)는 도 7의 전치-강조 필터(703)의 반대이다. 강조 해제 필터(807)의 전달 함수는 다음과 같다:
Figure 112005000369827-pct00032
여기서
Figure 112005000369827-pct00033
는 0과 1 사이에 놓인 전치 간조 팩터이다(일반적인 값은
Figure 112005000369827-pct00034
=0.7 이다). 더 고차의 필터 역시 사용될 수 있다.
벡터 s'가 강조 해제 필터 D(z)(807)을 통해 필터링되어 벡터 s d가 구해지고 이것은 하이 패스 필터(808)를 통해 처리되어 50 Hz 이하의 원치 않는 주파수들을 제거하여 s h를 얻는다.
오버-샘플러(809)는 도 7의 다운-샘플러(701)의 반대 프로세스를 수행한다. 예를 들어, 오버-샘플링은 이 기술분야의 당업자에게는 잘 알려져 있는 기술들을 이용하여, 12.8 kHz의 샘플링 레이트를 최초의 16 kHz의 샘플링 레이트로 다시 변환시킨다. 오버-샘플링된 합성 신호는
Figure 112005000369827-pct00035
로 나타낸다. 신호
Figure 112005000369827-pct00036
는 또한 합성된 광대역 중간 신호라고도 불린다.
오버 샘플링된 합성 신호
Figure 112005000369827-pct00037
는 코더(700)에서 다운 샘플링 프로세스(도 7의 모듈 701) 중에 잃었던 고주파수 성분들을 포함하지 않는다. 이것은 합성된 스피치 신호에 대해 저역 통과 인지를 부여한다. 최초 신호의 전체 대역을 복구하기 위해, 고주파수 생성 절차가 모듈(810)에서 수행되고 음성 팩터 발생기(804)(도 8)로부터의 입력을 필요로 한다.
그 결과에 따른 고주파수 발생 모듈(810)로부터의 밴드 패스 필터링된 노이즈 시퀀스 z는 가산기(821)에서 오버 샘플링된 합성 스피치 신호
Figure 112005000369827-pct00038
에 더해져서 최종 재구성 출력 스피치 신호 s out이 출력(823)으로 얻어진다. 고주파수 재생 프로세스는 2000년 5월 4일 간행된 국제 PCT 특허 출원 번호 WO 00/25305에 기술되어 있다.
다시 도 3을 참조하면, 풀-레이트 통신 모드에서, AMR-WB 표준에 따른 코덱은 12.65 kbit/s로 동작하고 표 1에 주어진 비트 할당치를 가지고 사용된다. AMR-WB 코덱의 12.65 kbit/s 레이트의 사용은 CDMA2000 시스템이 AMR-WB 코덱 표준을 이용하는 다른 시스템들과 상호 동작할 수 있도록 하는 가변 비트 레이트 코덱의 설계를 가능하게 한다. 여분의 13 비트들이 CDMA2000 레이트 집합 II의 13.3 kbit/s 풀-레이트를 만족시키기 위해 더해진다. 이 비트들은 제거된 프레임들의 경우 코덱 견고성을 향상시키는데 이용된다. AMR-WB 코덱에 대한 보다 상세한 설명은 200년 제네바의 ITU-T 권고안 G.722.2 "적응적 멀티 레이트 광대역 (AMR-WB)를 이용한 16 kbit/s 주변에서의 광대역 코딩"의 레퍼런스에서 찾을 수 있다. 그 코덱은 광대역 신호들에 최적화된 대수적 코드-여기형 선형 예측(ACELP) 모델에 기반한다. 이것은 샘플링 주파수 16 kHz를 가진 20 ms 스피치 프레임들에 대해 작도한다. LP 필터 파라미터들은 46 비트를 이용하는 프레임 마다 한번씩 코딩된다. 그리고 프레임은 적응적이고도 고정된 코드북 인덱스들 및 이득들이 프레임 당 한번씩 부호화되는 네 개의 서브프레임들로 분할된다. 고정된 코드북은 한 서브프레임내 64개의 위치들이 인터리빙된 위치들의 4 트랙들로 나눠지고 두 부호로 된 펄스들이 각 트랙에 위치하는 대수적 코드북 구조를 이용해 생성된다. 각 트랙의 두 펄스들은 서브프레임 당 총 36 비트들을 제공하는 9 개의 비트들을 이용해 부호화된다.
<표 1. 12.65 kbit/s의 AMR-WB 표준 비트 할당 (4 개의 서브프레임을 구비한 20 ms 프레임들)>
파라미터 비트/프레임
VAD 플래그 1
LP 파라미터들
피치 지연
피치 필터링
이득
대수적 코드북
46
30 = 9+6+9+6
4 = 1+1+1+1
28 = 7+7+7+7
144= 36+36+36+36
총계 253 비트
12.65 kbit/s의 AMR-WB에 기반해, 가변 비트 레이트 광대역(VBR-WB) 해법이 다수의 통신 모드들에 따라 작동될 수 있고, 그 중 한 모드는 12.65 kbit/s로 AMR-WB와 상호 동작 가능한 것이다. 따라서, 풀 레이트(FR)의 두 버전들이 사용되는데, 이들은 13개의 미사용 비트들이 더해져서 13.3 kbit/s를 얻도록 하는 상호동작 가능 FR, 및 VAD 비트 및 여분의 13 사용 가능 비트들이 프레임 삭제(FER)에 대한 코덱의 견고성을 향상시키는 정보를 제공하는데 사용되는 포괄적, 혹은 CDMA-고유의 FR이다. 두 FR 코딩 버전들의 비트 할당은 표 2에서 보여진다. 어떤 여분의 비트들도 프레임 분류 정보를 위해 필요로 도지는 않음을 주지해야 한다. 14- 비트 FER 보호는 6 비트의 에너지 정보를 포함한다. 따라서, 63 레벨들만이 그 에너지를 양자화하는데 이용되고 63에 해당하는 마지막 레벨은 상호동작 모드의 이용을 나타내기 위해 예비해 둔다. 따라서, 상호 동작 FR의 경우, 에너지 정보 인덱스는 63으로 정해진다.
<표 2. 12.65 kbit/s의 AMR-WB 표준에 기반하는 포괄적이고도 상호동작 가능한 풀-레이트 CDMA2000 레이트 집합 II의 비트 할당>
프레임 당 비트들
파라미터 일반 FR 상호동작가능 FR
분류 정보 - -
VAD 비트 - 1
LP 파라미터들 46 46
피치 지연 30 30
피치 필터링 4 4
이득 28 28
대수적 코드북 144 144
FER 보호 비트 14 -
미사용 비트 - 13
총계 266 266
안정적 유성 프레임들의 경우, 하프-레이트 유성 코딩 모듈(206)이 사용된다. 하프-레이트 유성 비트 할당은 표 3에서 주어진다. 이 통신 모드에서 부호화될 프레임들은 매우 주기적임을 특징으로 하기 때문에, 실질적으로 보다 낮은 비트 레이트가, 가령 천이 프레임들과 비교해 주관적으로 양호한 품질을 유지하기 족하다. 다른 신호-코딩 파라미터들을 위한 상당한 비율의 비트 량을 남기면서 20 ms 프레임 당 9 비트만을 이용하는 지연 정보의 효율적 코딩을 가능하게 하는 신호 변경이 사용된다. 신호 변경시, 신호는 프레임 당 9 비트들이 전송될 수 있는 소정 피치 윤곽을 따르도록 된다. 장기 예측의 양호한 성능은 주관적 스피치 품질을 희생하지 않으면서 고정 코드북 여기에 대해 5 ms 서브프레임 당 12 비트들만을 이용할 수 있게 한다. 고정 코드북은 대수적 코드북으로 각각 한 펄스씩을 가지는 두 트랙을 포함한다; 반면 각 트랙은 32개의 가능한 위치들을 가진다.
<표 3. CDMA2000 레이트 집합 II에 따른 하프-레이트 일반, 유성, 무성에 대한 비트 할당>
프레임 당 비트
파라미터 일반 HR 유성 HR 무성 HR
분류 정보 1 3 2
VAD 비트 - - -
LP 파라미터 36 36 46
피치 지연 13 9 -
피치 필터링 - 2 -
이득 26 26 24
대수적 코드북 48 48 52
FER 보호 비트 - - -
미사용 비트 - - -
총계 124 124 124
무성 프레임들의 경우, 적응적 코드북 (또는 피치 코드북)은 사용되지 않는다. 13- 비트 가우시안(Gaussian) 코드북이 각 서브프레임에서 사용되고, 그 코드북 이득은 서브프레임 당 6 비트로 부호화된다. 평균 비트 레이트가 더 감축되어야 할 필요가 있는 경우, 안정한 무성 프레임들의 경우에 무성 1/4 레이트가 사용 될 수 있음을 주지해야 한다.
일반적 하프-레이트 모드(312)가 도 3에 도시된 것과 같은 낮은 에너지 세그먼트들에 대해 사용된다. 이 일반 HR 모드는 나중에 설명되는 것과 같은 최대 하프-레이트 동작시에도 사용될 수 있다. 일반적 HR의 비트 할당은 상기 표 2에 나와 있다.
예를 들어, 일반적 HR의 경우 서로 다른 HR 코더들에 대한 분류 정보에 대해 1 비트가 사용되어 그 프레임이 일반적 HR인지 아니면 다른 HR인지를 가리킨다. 무성 HR의 경우, 2 비트가 분류에 사용되어; 제1비트는 그 프레임이 일반적 HR이 아니고 제2비트는 그것이 무성 HR이고 유성 HR이 아니거나 상호동작 가능 HR (나중에 설명될 것이다)임을 나타내도록 한다. 유성 HR의 경우, 세 비트가 사용된다. 첫번째 두 비트들은 그 프레임이 일반적이거나 무성 HR이 아님을 나타내고, 세번째 비트는 그 프레임이 무성이거나 상호동작 가능 HR인지의 여부를 나타낸다.
1/8 레이트 (CNG) 코딩 모듈(208)은 비활동 스피치 프레임들 (고요함 또는 배경 노이즈)을 부호화하는데 사용된다. 이 경우, LP 필터 파라미터들만이 프레임 당 14 비트들을 가지고 부호화되고 게인은 프레임 당 6 비트로 부호화된다. 이들 파라미터들은 디코더에서 컴포트(Comfort) 노이즈 생성(CNG)을 위해 사용된다. 비트 할당이 표 4에 보여진다.
<표 4. 20 ms 프레임에 대한 1.0 kbit/s의 1/8 레이트의 비트 할당>
파라미터 비트/프레임
LP 파라미터
이득
14
6
총계 20 비트/프레임=1.0 kbit/s
<시스템 강요 하프-레이트 동작>
CDMA 코딩 방식에 따르면, 시스템은 인-밴드(in-band) 시그날링 정보를 전송하기 위해 어떤 스피치 프레임들에서 풀-레이트 대신 하프-레이트의 사용을 강제할 수 있다. 이것을 딤-및-버스트 시그날링(dim-and-burst signaling)이라고 한다. 하프-레이트를 최대 비트 레이트로서 사용하는 것 역시 좋지 않은 채널 상황 (셀 경계 근처 등에서의) 동안 코덱 견고성을 향상시키기 위해 시스템에 의해 강제될 수 있다. 이것을 하르-레이트 맥스(max)라고 한다. 상술한 VBR 코딩 구성에서, 하프-레이트는 프레임이 고정형(stationary) 유성 또는 고정형 무성일 때 사용된다. 풀-레이트는 출발, 과도기 프레임들 및 혼합 유성 프레임들에 대해 사용된다. 레이트 선택 모듈이, 부호화될 하프-레이트 프레임을 풀-레이트 프레임으로서 선택하고 시스템이 그 하프-레이트 프레임을 강제할 때, 하프-레이트 통신 모드들이 시작 및 과도 프레임들을 효과적으로 부호화할 수 없기 때문에 스피치 성능이 저하된다.
게다가, AMR-WB에 기반한 VBR 레이트 집합 II를 이용하는 CDMA2000과 표준 AMR-WB를 이용하는 다른 시스템 사이의 크로스-시스템 탠덤 프리 동작 콜(cross-system dadem free operation call)에서, CDMA2000 시스템은 결과적으로 앞에서 설명한 바와 같이 하프-레이트를 강제할 수 있다(딤-및 버스트 시날링과 같이). AMR-WB 코덱이 CDMA2000 광대역 코덱의 6.2 kbit/s 하프-레이트를 인식하지 못하기 때문에, 강제된 그 하프-레이트 프레임들은 삭제된 프레임들이라고 해석된다. 이것이 접속 성능을 저하시킨다.
비한정적이고 예시적인 본 발명의 실시예는 시스템에 의해 하프-레이트가 강제되는 상황에서 CDMA 무선 시스템들에서 작동하는 가변 비트 레이트 스피치 코덱들의 성능을 향상시키기 위한 새로운 기술들을 구현한다. 또한, 이 새로운 기술은 CDMA2000 시스템이 하프-레이트의 사용을 강제할 때 CDMA2000과 AMR-WB 코덱을 이용하는 다른 시스템들 사이의 크로스-시스템 탠덤 프리 동작시의 성능을 향상시킨다.
딤-및-버스트 시그날링 또는 하프-레이트 맥스 동작시, 분류 메커니즘에 의해 풀-레이트가 선택되었을 때 시스템이 하프-레이트의 사용을 요구하면, 이것은 프레임이 무성이나 안정한 유성이 아니고 유성 시작 또는 급속히 전개되는 유성 스피치 신호와 같은 비고정 스피치 세그먼트를 포함할 가능성이 크다는 것을 나타낸다. 따라서, 무성이나 안정한 유성신호들에 최적화된 하프-레이트의 이용은 스피치 성능을 저하시킨다. 새로운 하프-레이트 모드가 이런 경우 필요로 되며, 그러한 경우들에서 사용될 수 있는 일반적 HR이 도입되었다. 따라서 하프-레이트 맥스 또는 딤-및 버스트 동작의 경우, 코더는 프레임이 유성 또는 무성으로 분류되지 않으면 일반 HR을 이용한다. 그러나, CDMA2000 시스템에서, 패킷-레벨 시그날링이라고 알려진 동작이 존재하며, 여기서는 시그날링 정보가 코더로 제공되지 않고 시스템이 프레임이 코딩된 다음에 HR의 사용을 강제할 수 있다. 따라서, 프레임이 FR 로서 코딩되었고 시스템이 HR의 사용을 필요로 하면, 그 프레임은 지워진 것으로 선언될 것이다. 또, VBR 코더가 12.65 kbit/s에서 AMR-WB와 상호 동작하는 상호동작 모드에서 하프-레이트 맥스 및 딤-및-버스트 동작의 경우, 일반 HR은 그것이 AMR-WB의 일부가 아니기 때문에 사용될 수 없다. (상호 동작 모드에서 패킷-레벨 시그날링, 또는 딤-및-버스트 및 하프-레이트 맥스인)이러한 상황들에서 프레임을 제거하는 것을 막기 위해, 본 발명의 비한정적 실시예는 예를 들어 프레임이 풀-레이트 프레임으로서 부호화된 다음의 고정 코드북 인덱스들과 같은 신호 인코딩 파라미터들의 일부를 빠트림으로써 풀 레이트 모드로부터 직접 도출된 하프-레이트 모드를 이용한다. 디코더 측에서는, 고정 코드북 인덱스들과 같은 신호-인코딩 파라미터들의 빠뜨린 일부가 랜덤하게 생성될 수 있고, 디코더는 그것이 풀-레이트인 것처럼 동작할 것이다. 이러한 하프-레이트 모드를 시그날링 HR 또는 상호동작 가능 HR이라고 하는데 이것은 인코딩 및 디코딩 모두 풀-레이트로 수행되기 때문이다. 본 발명의 비한정적 실시예에 따른 상호 동작 하프-레이트 모드의 비트 할당을 도 5의 표에서 보인다. 이러한 비한정적 실시예에서 풀-레이트는 12.65 kbit/s의 AMr-WB 표준에 기반하고, 하프-레이트는 대수적 고정 코드북의 인덱스들에 필요한 144 비트들을 빠뜨림으로써 도출된다. 시그날링 HR과 상호동작 HR 사이의 차는 시그날링 HR이 CDMA2000 시스템 내 패킷-레벨 시그날링 동작에 사용되고 FER 보호 비트들은 여전히 사용될 수 있다는 데 있다. 시그날링 HR은 대수적 코드북 인덱스들에 대한 144 비트들을 빠뜨림으로써 표 1에 도시된 일반 FR로부터 직접 도출된다. 세 비트들이 클래스 정보를 위해 더해지고 6 비트들 만이 FER 보호를 위해 사용되며 이것은 5 개의 미사용 비트들을 남겨둔다. 상호 동작 가능 HR은 대수적 코드북 인덱스들에 대한 144 비트들을 빠뜨림으로써 상호 동작 가능 HR로부터 도출된다. 세 비트들이 12 개의 미사용 비트들을 남겨두는 클래스 정보에 더해진다. 서로 다른 하프-레이트의 경우에 있어서 분류 정보를 논의할 때 앞에서 설명한 바와 같이, 세 개의 비트들이 유성 HR 또는 상호동작 가능 HR의 경우에 사용된다. 어떤 여분의 정보도 시그날링 HR과 상호 동작 가능 HR을 구분하기 위해 보내지지 않는다. FR의 경우와 마찬가지로, 마지막 레벨의 6-비트 에너지 정보가 이러한 목적을 위해 사용된다. 63개의 레벨들만이 에너지를 양자화하는데 사용되며 값 63에 해당하는 마지막 레벨이 상호 동작 가능 모드의 사용을 나타내는데 예비된다. 따라서, 상호 동작 가능 HR의 경우 에너지 정보 인덱스는 63으로 정해진다.
<표 5. 6.2 kbit/s의 시그날링 및 상호동작 가능 하프-레이트에 대한 비트 할당>
프레임 당 비트
파라미터 시그날링 HR 상호동작가능 HR
분류 정보
VAD 비트
LP 파라미터
피치 지연
피치 필터링
이득
대수적 코드북
FER 보호 비트
미사용 비트
3
-
46
30
4
28
-
8
5
3
1
46
30
4
28
-
-
12
총계 124 124
도 4는 레이트 결정 로직 내 하프-레이트 사용에 대한 시스템 요청을 도 3에 더한 개략적 기능 블록도를 도시한 것이다. 도 3의 구성은 CDMA2000 시스템 안에서의 동작에 유효하다. 레이트 결정 체인의 마지막에서, 모듈(404)이 하프-레이트 시스템 요청이 존재하는지를 검사한다. 레이트 결정 로직이 프레임이 활동 스피치 프레임임을 나타내고(201 모듈), 무성(202 모듈) 또는 안정된 유성(203 모듈) 또는 저에너지를 가진 프레임(모듈 311)이 아니면, 시스템은 하프-레이트 동작(404 모 듈)을 요청하면, 일반 ㅎ프-레이트가 사용되어 프레임을 부호화한다(모듈 312).
그렇지 않으면 (하프-레이트 시스템 요청이 존재하지 않으면) 스피치 프레임은 풀-레이트 프레임 (CDMA2000 레이트 집합 II에 따른 13.3 kbit/s)으로서 부호화된다(모듈(205).
도 5에 도시된 바와 같은 본 발명의 비한정적 실시예에서, 레이트 결정 로직 및 가변 레이트 코딩은 도 3에서와 동일하다. 그러나, 프레임이 부호화되고 비트들이 전송된 이후, 시스템이 하프-레이트 동작을 요청하는지를 검사하는(514 모듈) 한 테스트가 수행된다. 이것이 그런 경우이고 전송된 프레임이 FR 프레임이면 시그날-코딩 파라미터들 중 일부, 예를 들어 고정 코드북 인덱스들이 시그날링 하프-레이트 프레임을 얻기 위해 배제(drop)된다(510 모듈). 이 비제한적 실시예에서, 하나에서 세개까지의 비트들이 하프-레이트 모드 (일반, 유성, 무성, 또는 상호동작 가능)를 위해 사용됨을 주지해야 한다. 따라서, 시그날링 또는 상호동작 가능 하프-레이트를 나타내는 3 비트들은 시그날-코딩 파라미터들(고정 코드북 인덱스들)의 일부가 배제된 다음에 더해진다. 프레임에서 그 비트들은 표 5에 따라 분포된다.
고정 코드북 인덱스들의 배제에 대한 선택은 이 비트들이 에러에 가장 덜 민감한 것이라는 사실에 비롯되고, 이들을 랜덤하게 생성하는 것은 성능에 적은 영향만을 준다. 그러나, 일반성의 손실 없이 상호 동작 가능 또는 시그날링 하프-레이트를 얻기 위해 다른 비트들도 배제될 수 있음을 알아야 한다.
이러한 비한정적 실시예에서, 코더 쪽에서의 시그날링 또는 상호 동작 가능 하프-레이트 동작시, 코더는 풀-레이트 코더로서 동작한다. 고정 코드북 탐색이 평소와 같이 수행되고, 정해진 고정 코드북 여기는 12.64 kbit/s로 AMR-WB 표준에 따라 적응적 코드북 컨텐츠 및 다음 프레임들에 대한 필터 메모리들을 업데이트하는데 사용된다 [2002년 제네바, ITU-T 권고안 G.722.2 "적응적 멀티-레이트 광대역(AMR-WB)을 이용한 16 kbit/s 주변에서의 스피치의 광대역 코딩"][3GPP 기술 사양, 3GPP TS 26.190, "AMR 광대역 스피치 코덱:트랜스코딩 동작"]. 따라서, 어떤 랜덤 코드북 인덱스들도 코더 동작 내에서 사용되지 않는다. 이것은 프레임이 보통의 풀-레이트 동작으로 부호화된 이후 하프-레이트 시스템 요청(514 모듈)이 검사된 도 5의 구현예를 보면 명확하다.
디코더 측의 시그날링 또는 상호 동작 가능 하프-레이트 동작시, 신호-코딩 파라미터들 중 배제된 부분, 가령 고정 코드북의 인덱스들이 랜덤하게 생성된다. 그리고 나서 디코더는 풀-레이트 동작인 것처럼 동작한다. 신호-코딩 파라미터들 중 배제된 부분을 생성하는 다른 방법들도 사용될 수 있다. 예를 들어, 배제된 파라미터들은 수신된 비트스트림의 일부를 복사함으로써 얻어질 수 있다. 코더와 디코더 쪽 메모리들 사이에서 미스-매치(mismatch)가 일어날 수 있다는 것을 알아야 하는데, 이는 신호-코딩 파라미터들 중 배제된 부분, 가령 고정 코드북 여기가 동일하지 않기 때문이다. 그러나, 그러한 미스-매치는 특히, 일반적인 레이트들이 2% 주변인, CDMA2000 VBR과 AMR-WB 사이에서 상호동작이 일어나는 딤-및-버스트 시그날링의 경우에는 성능에 영향을 주지 않는 것으로 나타난다.
딤-및-버스트 동작시 제안된 방식의 성능은 하프-레이트 시스템 요청이 없는 경우와 비교할 때 거의 알기 쉽다. 많은 경우들에서, 레이트 결정 로직은 이미 1/8, 1/4, 또는 하프-레이트(일반, 유성, 무성)로 부호화될 프레임을 결정한다. 그런 경우, 하프-레이트 시스템 요청은 무시되는데 이는 그것이 코더에 의해 이미 수용되고 있고 프레임의 신호 종류가 하프-레이트나 그 보다 낮은 레이트로 부호화되기 적합하기 때문이다.
분류 로직은 동작 모드에 적응적임을 알아야 한다. 따라서, 성능을 개선하기 위해서는, 하프-레이트-맥스 모드 및 딤-및-버스트 시그날링시, 이 분류 로직이 특정 하프-레이트 코덱들을 사용하는데 있어 보다 느슨하게 만들어질 수 있다(하프-레이트 유성 및 무성은 일반 동작에서 보다 상대적으로 더 많이 사용된다). 이것은 일종의 멀티-모드 동작으로의 확장이며, 여기서 분류 로직은 보다 완화되고 더 낮은 평균 데이터 레이트들의 모드들이 사용된다.
<CDMA2000 시스템과, AMR-WB 표준을 사용하는 다른 시스템들 사이의 탠덤 프리 동작>
위에서 언급한 바와 같이, AMR-WB 코덱에 기반하는 CDMA2000 시스템을 위한 가변 비트 레이트 광대역(VBR-WB) 코덱을 설계하는 것은 CDMA2000 시스템 및 AMR-WB 표준 (모바일 GSM 시스템 또는 W-CDMA 제3세대 무선 시스템과 같은)을 이용하는 다른 시스템들 사이의 탠덤 프리 동작(TFO), 또는 패킷-교환 동작을 가능하게 하는 이점을 가진다. 그러나, CDMA2000 시스템과, AMR-WB 표준을 사용하는 다른 시스템 사이의 크로스-시스템 탠덤 프리 동작 콜에서, CDMA2000 시스템은 앞서 설명한 것과 같이 하프-레이트의 사용을 강제할 수 있다(딤-및-버스트 시그날링시). AMR-WB 코덱이 CDMA2000 광대역 코덱의 6.2 kbit/s 하프-레이트를 인식하지 못하기 때문에, 강제된 하프-레이트 프레임들은 제거된 프레임들로 해석된다. 이것이 접속 성능을 저하시킨다. 상술한 상호 동작 하프-레이트 모드의 사용은 이 모드가 AMR-WB 표준의 12.65 kbit/s로 상호 동작할 수 있기 때문에 성능을 크게 향상시킬 것이다.
상술한 바와 같이, 상호동작 가능 하프-레이트는 기본적으로 의사(pseudo) 풀-레이트이며, 여기서 코덱은 풀-레이트 모드인 것처럼 작동한다. 차이는 가령 대수적 코드북 인덱스들과 같은 신호-코딩 파라미터들의 일부가 궁극적으로 배제되어 전송되지 않는다는데 있다. 디코더 쪽에서, 그 대수적 코드북 인덱스들과 같은 배제된 신호-코딩 파라미터들을 랜덤하게 생성하고, 그리고 나서 디코더는 마치 풀-레이트 모드에 있는 것처럼 동작한다.
도 6은 본 발명에 따른 비한정적 실시예에 따른 한 구성을 보이며, CDMA2000 시스템 측에서 시그날링 정보의 인-밴드 전송 중 (즉, 딤 및 버스트 상황)의 상호 동작 가능 하프-레이트 모드의 이용을 보인다. 이 도면에서, 다른 쪽은 AMR-WB 표준을 이용하는 한 시스템이며 3GPP 무선 시스템이 예로서 주어진다.
CDMA2000에서 3GPP 또는 AMR-WB를 이용하는 다른 시스템으로의 방향을 가진 링크시, 멀티플렉스 서브계층은 하프-레이트 요청을 나타내고(딤-및-버스트 시스템 요청을 참조, 601), VBR-WB 코더(602)는 앞서 기술한 상호동작 가능 하프 레이트(I-HR)로 동작할 것이다. 시스템 인터페이스(604)에서, I-HR 프레임이 수신될 때, 랜덤하게 생성된 대수적 코드북 인덱스들이 모듈(603)에 의해 비트스트림 안에 삽입되고 IP-기반 시스템 인터페이스(604)를 통해 12.65 kbit/s 레이트를 출력한다. 3GPP 측의 디코더(605)는 그것을 보통의 12.65 kbit/s 프레임으로 해석할 것이다.
다른 반대 방향으로, 즉, 3GPP나 AMR-WB를 이용하는 시스템으로부터 CDMA2000으로의 링크에 있어서, 시스템 인터페이스(606)에서의 하프-레이트 요청 (딤-및-버스트 시스템 요청(607)을 보라)이 수신되면, 모듈(608)은 대수적 코드북 인덱스들을 배제하고 I-HR 프레임 종류를 나타내는 3 비트를 삽입한다. CDMA2000 측의 디코더(609)는 I-HR 프레임으로서 동작할 것이며, 이것이 VBR-WB 해법의 일부이다.
이러한 제안은 시스템 인터페이스에서 최소한의 로직을 필요로하며 이것은 딤-및-버스트 프레임들을 블랭크-및-버스트 프레임들(제거된 프레임들)로서 강제하는데 있어서의 성능을 크게 향상시킨다.
상호 동작시의 다른 문제는 배경 노이즈 프레임들을 처리하는 것이다. AMR-WB 쪽에서, 코더(610)는 DTX(불연속 전송) 및 CNG(컴포트 노이즈 발생)을 지원한다. 비활동 스피치 프레임들(고요함 또는 배경 노이즈)이 35 비트를 이용해 SID(고요함 표현) 프레임들로서 부호화되고 그렇지 않으면 전송되지 않는다(데이터 없음). CDMA2000 측에서는, 비활동 스피치 프레임들은 1/8 레이트(ER)을 이용해 부호화된다. SID에 대한 35 비트들이 ER을 사용해 전송될 수 없기 때문에, CNG 1/4 레이트(QR)이 사용되어 SID 프레임들을 AMR-WB 측에서 CDMA2000 측으로 전송한다. 전송되지 않은 AMR-WB 측의 노-데이터 프레임들은 ER 프레임들로 변환된다(실시예에서 모든 비트들은 1로 된다). CDMA2000 측의 상호 동작 가능 모드에서, ER 프레임들은 디코더에 의해 프레임 삭제된 것들로서 취급된다.
CDMA2000으로부터 AMR-WB 측까지의 상호 동작시, 비활동 스피치 세그먼드들의 시작시 CNG QR이 사용되고, 그리고 나서 ER 프레임들이 사용된다. 본 발명의 비제한적 실시예에서, 이 동작은 8 개의 프레임들 마다 한 번씩 하나의 SID 프레임이 전송되는 AMR-WB의 VAD/DTX/CNG 동작과 유사하다. 이 경우, 첫번째 비활동 스피치 프레임이 CNG QR 프레임으로서 부호화되고, 이어지는 7 개의 프레임들은 ER 프레임들로서 부호화된다. 시스템 인터페이스에서, CNG QR 프레임들은 AMR-WB SID 프레임들로 변환되고 ER 프레임들은 전송되지 않는다(노-데이터 프레임들)
CNG QR 및 CNG ER 프레임들의 비트 할당이 표 6에 보여진다.
<표 6, 20-ms 프레임에 대한 2.7 kbit/s의 CNG QR 및 1 kbit/s의 CNG ER의 비트 할당>
프레임 당 비트
파라미터 CNG QR CNG ER
분류 정보
LP 파라미터
이득
미사용 비트
1
28
6
19
-
14
6
-
총계 54 20
본 발명이 그 비제한적 실시예와 관련한 앞에서의 설명에서 기술되었으나, 이 실시예는 본 발명의 범위와 개념을 벗어나지 않고 첨부된 청구범위들의 범위 안에서 변형될 수 있다. 예를 들어, 상호 동작 가능 하프-레이트 프레임을 얻기 위해, 고정 코드북 인덱스들과 관련된 것 이외의 비트들, 특히 보다 적은 비트 에러 민감도를 가진 비트들이 배제될 수 있다.

Claims (62)

  1. 신호-코딩 파라미터들을 전송하는 방법에 있어서,
    프레임의 전송 동안 비트 레이트를 감소시키기 위해 제2 통신 모드를 이용하여 상기 프레임을 전송하는 요청을 수신하는 단계로서, 상기 프레임은 소리 신호를 나타내는 신호-코딩 파라미터들을 포함하고, 상기 프레임은 제1 통신 모드에 따라 인코딩되는, 요청 수신 단계;
    상기 요청에 응답하여, 상기 제2 통신 모드를 이용하여 상기 프레임의 전송을 가능하게 하기 위해 상기 신호-코딩 파라미터들의 일부를 배제하는 단계; 및
    상기 프레임에 정보를 삽입하는 단계를 포함하고,
    상기 정보는 수신기에게 상기 신호-코딩 파라미터들의 상기 일부를 배제하는 것에 관련된 특정 통신 모드에 따라 상기 프레임이 인코딩됨을 알리고,
    상기 정보는, 상기 수신기로 하여금, 상기 프레임을 처리하고, 상기 제2 통신 모드에 따라 전송된 상기 프레임으로부터, 상기 제1 통신 모드에 따라 인코딩된 상기 프레임의 버전을 획득하게 하는 것을 특징으로 하는, 방법.
  2. 제1항에 있어서,
    상기 제1 통신 모드는 풀-레이트 (full-rate) 통신 모드이고, 상기 제2 통신 모드는 하프-레이트 (half-rate) 통신 모드임을 특징으로 하는 방법.
  3. 제1항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고, 제1 시스템은 상기 제1 통신 방식을 이용하고, 상기 방법은 상기 제1 시스템과 제2 시스템 사이에서 상호 동작(interoperation)을 가능하게 하고, 상기 제2 시스템은 제2 통신 방식을 이용함을 특징으로 하는 방법.
  4. 제3항에 있어서,
    상기 제1 시스템은 가변 비트 레이트 광대역 (VBR-WB) 코덱을 사용하는 CDMA2000 시스템이고, 상기 제2 시스템은 적응적 멀티-레이트 광대역(AMR-WB) 코덱을 사용하는 3GPP 시스템임을 특징으로 하는 방법.
  5. 제3항에 있어서,
    상기 제1 통신 방식의 상기 제1 통신 모드는 상기 제2 통신 방식의 통신 모드와 상호 동작할 수 있고, 상기 제1 통신 방식의 상기 제2 통신 모드는 상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없음을 특징으로 하는 방법.
  6. 제1항에 있어서,
    상기 신호-코딩 파라미터들의 상기 배제된 일부는 고정 코드북 인덱스들을 포함함을 특징으로 하는 방법.
  7. 제1항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고,
    상기 제1 통신 방식의 상기 제1 통신 모드는 제2 통신 방식의 통신 모드와 상호 동작할 수 있고, 상기 제1 통신 방식의 상기 제2 통신 모드는 상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없음을 특징으로 하는 방법.
  8. 제7항에 있어서,
    제1 장치로부터 제2 장치로 상기 제1 통신 방식의 상기 제2 통신 모드를 사용하여 상기 프레임을 전송하는 단계;
    상기 제2 장치에서, 상기 전송된 프레임을 수신하는 단계;
    상기 수신된 프레임 내의 정보에 응답하여 상기 제2 장치에서, 대체 신호-코딩 파라미터들을 생성하여 상기 신호-코딩 파라미터들의 상기 배제된 일부를 대체하는 단계;
    상기 제2 장치에서, 상기 생성된 대체 신호-코딩 파라미터들을 상기 수신된 프레임에 삽입하여 상기 제2 통신 방식의 상기 통신 모드에 따라 상기 프레임의 추가적인 전송을 가능하게 하는 단계; 및
    상기 제2 통신 방식의 상기 통신 모드를 사용하여 상기 제2 장치에서 제3 장치로 상기 프레임을 추가적으로 전송하는 단계를 더 포함하는 방법.
  9. 제8항에 있어서,
    상기 신호-코딩 파라미터들의 상기 배제된 일부는 고정 코드북 인덱스들을 포함하고,
    대체 신호-코딩 파라미터들을 생성하는 단계는 대체 고정 코드북 인덱스들을 랜덤하게 생성하는 단계를 포함함을 특징으로 하는 방법.
  10. 제1항에 있어서,
    상기 제1 통신 방식의 상기 제1 통신 모드에 따라 상기 소리 신호를 인코딩하는 초기 단계를 더 포함함을 특징으로 하는 방법.
  11. 제1항 또는 제10항에 있어서,
    상기 제2 통신 모드를 사용하여 상기 프레임을 전송하는 단계를 더 포함함을 특징으로 하는 방법.
  12. 제1항에 있어서,
    상기 특정 통신 모드는 시그널링 하프 레이트 통신 모드 또는 상호 동작 하프 레이트 통신 모드를 포함함을 특징으로 하는 방법.
  13. 제1항 내지 제10항 및 제12항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
  14. 프레임의 전송 동안 비트 레이트를 감소시키기 위해 제2 통신 모드를 이용하여 상기 프레임을 전송하는 요청을 수신하는 입력으로서, 상기 프레임은 소리 신호를 나타내는 신호-코딩 파라미터들을 포함하고, 상기 프레임은 제1 통신 모드에 따라 인코딩되는, 입력; 및
    상기 제2 통신 모드를 이용하여 상기 프레임의 전송을 가능하게 하기 위해 상기 신호-코딩 파라미터들의 일부를 배제하고, 상기 프레임에 정보를 삽입하는 처리 모듈을 포함하고,
    상기 정보는 수신기에게 상기 신호-코딩 파라미터들의 상기 일부를 배제하는 것에 관련된 특정 통신 모드에 따라 상기 프레임이 인코딩됨을 알리고,
    상기 정보는, 상기 수신기로 하여금, 상기 프레임을 처리하고, 상기 제2 통신 모드에 따라 전송된 상기 프레임으로부터, 상기 제1 통신 모드에 따라 인코딩된 상기 프레임의 버전을 획득하게 하는 것을 특징으로 하는, 신호-코딩 파라미터들을 전송하는 장치.
  15. 제14항에 있어서,
    제2 통신 방식의 통신 모드와 상호 동작할 수 있는 상기 제1 통신 방식의 제1 통신 모드에 따라 상기 소리 신호를 인코딩하는 인코더; 및
    상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없는 상기 제1 통신 방식의 제2 통신 모드를 사용하여 상기 프레임을 전송하는 전송기를 더 포함함을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  16. 제14항에 있어서,
    상기 신호-코딩 파라미터들의 상기 배제된 일부는 고정 코드북 인덱스들을 포함함을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  17. 제14항에 있어서,
    상기 요청은 하프 레이트 통신 모드를 사용하여 상기 프레임을 전송함을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  18. 제14항에 있어서,
    상기 신호-코딩 파라미터들을 전송하는 장치는 가변 비트 레이트 광대역 (VBR-WB) 코덱을 사용하는 CDMA2000 시스템임을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  19. 제14항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고, 상기 신호-코딩 파라미터들을 전송하는 장치는 상기 제1 통신 방식의 상기 제2 통신 모드를 사용하여 상기 프레임을 전송하는 전송기를 더 포함하고, 상기 제1 통신 방식의 상기 제2 통신 모드는 제2 통신 방식의 통신 모드와 상호 동작할 수 없음을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  20. 제14항에 있어서,
    상기 제1 통신 모드는 풀-레이트 (full-rate) 통신 모드이고, 상기 제2 통신 모드는 하프-레이트 (half-rate) 통신 모드임을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  21. 제14항에 있어서,
    상기 특정 통신 모드는 시그널링 하프 레이트 통신 모드 또는 상호 동작 하프 레이트 통신 모드를 포함함을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  22. 제14항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고,
    상기 제1 통신 방식의 상기 제1 통신 모드는 제2 통신 방식의 통신 모드와 상호 동작할 수 있고, 상기 제1 통신 방식의 상기 제2 통신 모드는 상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없음을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  23. 제14항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고, 상기 신호-코딩 파라미터들을 전송하는 장치는, 상기 제1 통신 방식을 이용하는 제1 시스템 내의 제1 장치를 포함하고, 상기 신호-코딩 파라미터들을 전송하는 장치는, 상기 제1 시스템과 제2 시스템을 통해 제2 장치와 통신하고, 상기 제2 시스템은 제2 통신 방식을 이용하고,
    상기 제1 시스템은 가변 비트 레이트 광대역 (VBR-WB) 코덱을 사용하는 CDMA2000 시스템이고, 상기 제2 시스템은 적응적 멀티-레이트 광대역(AMR-WB) 코덱을 사용하는 3GPP 시스템이고,
    상기 제1 통신 방식의 상기 제1 통신 모드는 제2 통신 방식의 통신 모드와 상호 동작할 수 있고, 상기 제1 통신 방식의 상기 제2 통신 모드는 상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없음을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  24. 신호-코딩 파라미터들을 제1 스테이션 및 제2 스테이션에 전송하는 시스템으로서,
    상기 제1 스테이션은:
    프레임의 전송 동안 비트 레이트를 감소시키기 위해 제1 통신 방식의 제2 통신 모드를 이용하여 상기 프레임을 전송하는 요청을 수신하는 수단으로서, 상기 프레임은 소리 신호를 나타내는 신호-코딩 파라미터들을 포함하고, 상기 프레임은 상기 제1 통신 방식의 제1 통신 모드에 따라 인코딩되는, 요청 수신 수단;
    상기 요청에 응답하여, 상기 제1 통신 방식의 상기 제2 통신 모드를 이용하여 상기 프레임의 전송을 가능하게 하기 위해 상기 신호-코딩 파라미터들의 제1 일부를 배제하는 수단;
    상기 프레임에 정보를 삽입하는 수단으로서, 상기 정보는 상기 신호-코딩 파라미터들의 상기 제1 일부를 배제하는 것에 관련된 상기 제1 통신 방식의 특정 통신 모드에 따라 상기 프레임이 인코딩됨을 알리는, 정보 삽입 수단; 및
    상기 제1 통신 방식의 상기 제2 통신 모드를 사용하여 상기 프레임을 전송하는 수단을 포함하고,
    상기 제2 스테이션은:
    상기 전송된 프레임을 수신하는 수단으로서, 상기 전송된 프레임은 상기 정보 및 상기 신호-코딩 파라미터들의 제2 일부를 포함하는, 수신 수단;
    상기 정보에 응답하여, 대체 신호-코딩 파라미터들을 생성하여 상기 신호-코딩 파라미터들의 상기 제1 일부를 대체하는, 생성 수단;
    상기 생성된 대체 신호-코딩 파라미터들을 상기 수신된 프레임에 삽입하여 제2 통신 방식의 통신 모드에 따라 상기 프레임의 추가적인 전송을 가능하게 하는, 삽입 수단; 및
    상기 제2 통신 방식의 상기 통신 모드에 따라 상기 프레임을 전송하는 수단을 포함함을 특징으로 하는, 시스템.
  25. 신호-코딩 파라미터들을 수신하는 방법으로서,
    제2 통신 모드를 이용하여 프레임을 수신하는 단계로서, 상기 프레임은 정보 및 신호-코딩 파라미터들의 제2 일부를 포함하고, 상기 정보는 제1 통신 모드 대신에 상기 신호-코딩 파라미터들의 제1 일부를 배제하는 것에 관련된 특정 통신 모드에 따라 상기 프레임이 인코딩되어 상기 프레임의 전송 동안 비트 레이트를 감소시킴을 알리는, 프레임 수신 단계;
    상기 정보에 응답하여, 대체 신호-코딩 파라미터들을 생성하여 상기 신호-코딩 파라미터들의 상기 배제된 제1 일부를 대체함으로써 상기 프레임의 전송 동안 상기 비트 레이트를 감소시키는, 대체 신호-코딩 파라미터 생성 단계; 및
    상기 생성된 대체 신호-코딩 파라미터들을 상기 수신된 프레임에 삽입하여 상기 제1 통신 모드에 따라 상기 프레임의 추가적인 전송을 가능하게 하는, 삽입 단계를 포함하는 방법.
  26. 제25항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고,
    상기 제1 통신 방식의 상기 제1 통신 모드는 제2 통신 방식의 통신 모드와 상호 동작할 수 있고, 상기 제1 통신 방식의 상기 제2 통신 모드는 상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없음을 특징으로 하는 방법.
  27. 제26항에 있어서,
    상기 제2 통신 방식의 상기 통신 모드를 이용하여 상기 프레임을 추가적으로 전송하는 단계를 더 포함하는 방법.
  28. 제27항에 있어서,
    상기 프레임을 수신하는 단계 및
    상기 신호-코딩 파라미터들의 상기 제2 일부 및 상기 생성된 대체 신호-코딩 파라미터들을 이용하여 소리 신호를 디코딩하는 단계를 더 포함하는 방법.
  29. 제25항에 있어서,
    상기 제1 통신 모드는 풀-레이트 (full-rate) 통신 모드이고, 상기 제2 통신 모드는 하프-레이트 (half-rate) 통신 모드임을 특징으로 하는 방법.
  30. 제25항에 있어서,
    상기 특정 통신 모드는 시그널링 하프 레이트 통신 모드 또는 상호 동작 하프 레이트 통신 모드를 포함함을 특징으로 하는 방법.
  31. 제25항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고, 제1 시스템은 상기 제1 통신 방식을 이용하고, 상기 방법은 상기 제1 시스템과 제2 시스템 사이에서 상호 동작(interoperation)을 가능하게 하고, 상기 제2 시스템은 제2 통신 방식을 이용함을 특징으로 하는 방법.
  32. 제31항에 있어서,
    상기 제1 시스템은 가변 비트 레이트 광대역 (VBR-WB) 코덱을 사용하는 CDMA2000 시스템이고, 상기 제2 시스템은 적응적 멀티-레이트 광대역(AMR-WB) 코덱을 사용하는 3GPP 시스템임을 특징으로 하는 방법.
  33. 제31항에 있어서,
    상기 제1 통신 방식의 상기 제1 통신 모드는 상기 제2 통신 방식의 통신 모드와 상호 동작할 수 있고, 상기 제1 통신 방식의 상기 제2 통신 모드는 상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없음을 특징으로 하는 방법.
  34. 제2 통신 모드를 이용하여 프레임을 수신하는 수신기로서, 상기 프레임은 정보 및 신호-코딩 파라미터들의 제2 일부를 포함하고, 상기 정보는 제1 통신 모드 대신에 상기 신호-코딩 파라미터들의 제1 일부를 배제하는 것에 관련된 특정 통신 모드에 따라 상기 프레임이 인코딩되어 상기 프레임의 전송 동안 비트 레이트를 감소시킴을 알리는, 수신기; 및
    상기 정보에 응답하여, 대체 신호-코딩 파라미터들을 생성하여 상기 신호-코딩 파라미터들의 상기 배제된 제1 일부를 대체함으로써 상기 프레임의 전송 동안 상기 비트 레이트를 감소시키고, 상기 생성된 대체 신호-코딩 파라미터들을 상기 수신된 프레임에 삽입하여 상기 제1 통신 모드에 따라 상기 프레임의 추가적인 전송을 가능하게 하는, 처리 모듈을 포함하는 신호-코딩 파라미터들을 전송하는 장치.
  35. 제34항에 있어서,
    상기 처리 모듈은 대체 신호-코딩 파라미터들을 랜덤하게 생성함을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  36. 제35항에 있어서,
    상기 랜덤하게 생성된 대체 신호-코딩 파라미터들은 랜덤하게 생성된 대체 고정 코드북 인덱스들을 포함함을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  37. 제34항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고, 상기 신호-코딩 파라미터들을 전송하는 장치는 상기 제1 통신 방식의 상기 제1 통신 모드와 호환가능한 제2 통신 방식의 통신 모드를 사용하여 상기 프레임을 추가적으로 전송하는 전송기를 더 포함함을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  38. 제34항에 있어서,
    상기 제1 통신 모드는 풀-레이트 (full-rate) 통신 모드이고, 상기 제2 통신 모드는 하프-레이트 (half-rate) 통신 모드임을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  39. 제34항에 있어서,
    상기 특정 통신 모드는 시그널링 하프 레이트 통신 모드 또는 상호 동작 하프 레이트 통신 모드를 포함함을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  40. 제34항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고,
    상기 제1 통신 방식의 상기 제1 통신 모드는 제2 통신 방식의 통신 모드와 상호 동작할 수 있고, 상기 제1 통신 방식의 상기 제2 통신 모드는 상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없음을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  41. 제34항에 있어서,
    상기 제1 통신 모드 및 상기 제2 통신 모드는 제1 통신 방식을 위한 것이고, 상기 신호-코딩 파라미터들을 전송하는 장치는, 제1 시스템을 통해 제1 통신을 수신하고 제2 시스템을 통해 제2 통신을 전송하고, 상기 제1 시스템은 상기 제1 통신 방식을 이용하고 상기 제2 시스템은 제2 통신 방식을 이용하고,
    상기 제1 시스템은 가변 비트 레이트 광대역 (VBR-WB) 코덱을 사용하는 CDMA2000 시스템이고, 상기 제2 시스템은 적응적 멀티-레이트 광대역(AMR-WB) 코덱을 사용하는 3GPP 시스템이고,
    상기 제1 통신 방식의 상기 제1 통신 모드는 제2 통신 방식의 통신 모드와 상호 동작할 수 있고, 상기 제1 통신 방식의 상기 제2 통신 모드는 상기 제2 통신 방식의 상기 통신 모드와 상호 동작할 수 없음을 특징으로 하는 신호-코딩 파라미터들을 전송하는 장치.
  42. 삭제
  43. 삭제
  44. 삭제
  45. 삭제
  46. 삭제
  47. 삭제
  48. 삭제
  49. 삭제
  50. 삭제
  51. 삭제
  52. 삭제
  53. 삭제
  54. 삭제
  55. 삭제
  56. 삭제
  57. 삭제
  58. 삭제
  59. 삭제
  60. 삭제
  61. 삭제
  62. 삭제
KR1020057000166A 2002-07-05 2003-06-27 Cdma 무선 시스템의 가변 비트 레이트 광대역 스피치코딩시 효율적인 인-밴드 딤-버스트 시그날링 및하프-레이트 맥스 오퍼레이션을 위한 방법 및 장치 KR101105353B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA2,392,640 2002-07-05
CA002392640A CA2392640A1 (en) 2002-07-05 2002-07-05 A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
PCT/CA2003/000980 WO2004006226A1 (en) 2002-07-05 2003-06-27 Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems

Publications (2)

Publication Number Publication Date
KR20050016976A KR20050016976A (ko) 2005-02-21
KR101105353B1 true KR101105353B1 (ko) 2012-01-16

Family

ID=30005535

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057000166A KR101105353B1 (ko) 2002-07-05 2003-06-27 Cdma 무선 시스템의 가변 비트 레이트 광대역 스피치코딩시 효율적인 인-밴드 딤-버스트 시그날링 및하프-레이트 맥스 오퍼레이션을 위한 방법 및 장치

Country Status (15)

Country Link
US (1) US8224657B2 (ko)
EP (1) EP1520271B1 (ko)
JP (2) JP2005532579A (ko)
KR (1) KR101105353B1 (ko)
CN (2) CN1692408A (ko)
AT (1) ATE518225T1 (ko)
AU (1) AU2003281378B2 (ko)
BR (1) BR0312467A (ko)
CA (1) CA2392640A1 (ko)
ES (1) ES2367259T3 (ko)
HK (1) HK1130558A1 (ko)
MX (1) MXPA05000285A (ko)
MY (1) MY144845A (ko)
RU (2) RU2326449C2 (ko)
WO (1) WO2004006226A1 (ko)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7499403B2 (en) * 2003-05-07 2009-03-03 Alcatel-Lucent Usa Inc. Control component removal of one or more encoded frames from isochronous telecommunication stream based on one or more code rates of the one or more encoded frames to create non-isochronous telecommunications stream
JPWO2006008932A1 (ja) * 2004-07-23 2008-05-01 松下電器産業株式会社 音声符号化装置および音声符号化方法
JP5107574B2 (ja) * 2005-02-24 2012-12-26 パナソニック株式会社 データ再生装置、データ再生方法、プログラム、および集積回路
US8260609B2 (en) 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
US8135047B2 (en) 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8209187B2 (en) * 2006-12-05 2012-06-26 Nokia Corporation Speech coding arrangement for communication networks
GB0705324D0 (en) * 2007-03-20 2007-04-25 Skype Ltd Method of transmitting data in a communication system
WO2009002245A1 (en) * 2007-06-27 2008-12-31 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for enhancing spatial audio signals
DE102008022125A1 (de) * 2008-05-05 2009-11-19 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen
US8320553B2 (en) * 2008-10-27 2012-11-27 Apple Inc. Enhanced echo cancellation
CN101599272B (zh) * 2008-12-30 2011-06-08 华为技术有限公司 基音搜索方法及装置
CN101783142B (zh) * 2009-01-21 2012-08-15 北京工业大学 转码方法、装置和通信设备
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
EP3764356A1 (en) * 2009-06-23 2021-01-13 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN105374362B (zh) 2010-01-08 2019-05-10 日本电信电话株式会社 编码方法、解码方法、编码装置、解码装置以及记录介质
WO2011085483A1 (en) 2010-01-13 2011-07-21 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering
KR20130036304A (ko) * 2010-07-01 2013-04-11 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
JP6100164B2 (ja) 2010-10-06 2017-03-22 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法
CN102104917B (zh) * 2011-02-21 2013-10-09 上海华为技术有限公司 一种调整自适应编码速率的方法、基站控制器及终端
CN103187065B (zh) 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
KR101900319B1 (ko) 2012-02-07 2018-09-19 삼성전자 주식회사 서비스 연동 수행 방법과 이를 위한 시스템
US9472208B2 (en) * 2012-08-31 2016-10-18 Telefonaktiebolaget Lm Ericsson (Publ) Method and device for voice activity detection
US9589570B2 (en) * 2012-09-18 2017-03-07 Huawei Technologies Co., Ltd. Audio classification based on perceptual quality for low or medium bit rates
BR112015014217B1 (pt) * 2012-12-21 2021-11-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V Adição de ruído de conforto para modelagem do ruído de fundo em baixas taxas de bits
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
CN104853383B (zh) * 2015-04-02 2018-05-04 四川大学 一种语音码率调整的方法和装置
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
KR102477464B1 (ko) 2015-11-12 2022-12-14 삼성전자주식회사 무선 통신 시스템에서 음성 패킷의 크기를 제어하기 위한 장치 및 방법
CN105517064A (zh) * 2015-12-03 2016-04-20 海能达通信股份有限公司 一种语音码率调整的方法及核心网设备
CN111262587B (zh) * 2018-11-30 2023-06-06 康泰医学系统(秦皇岛)股份有限公司 一种数据压缩方法、装置、设备及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001052467A1 (en) * 2000-01-10 2001-07-19 Qualcomm Incorporated Method and apparatus for supporting adaptive multi-rate (amr) data in a cdma communication system

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5568483A (en) 1990-06-25 1996-10-22 Qualcomm Incorporated Method and apparatus for the formatting of data for transmission
US5511073A (en) * 1990-06-25 1996-04-23 Qualcomm Incorporated Method and apparatus for the formatting of data for transmission
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
CA2568984C (en) * 1991-06-11 2007-07-10 Qualcomm Incorporated Variable rate vocoder
EP0699334B1 (en) * 1994-02-17 2002-02-20 Motorola, Inc. Method and apparatus for group encoding signals
US5519779A (en) * 1994-08-05 1996-05-21 Motorola, Inc. Method and apparatus for inserting signaling in a communication system
TW271524B (ko) * 1994-08-05 1996-03-01 Qualcomm Inc
JPH08146997A (ja) * 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
ZA961025B (en) * 1995-02-28 1996-07-16 Qualcomm Inc Method and apparatus for providing variable rate data in a communications system using non-orthogonal overflow channels
EP0764939B1 (en) * 1995-09-19 2002-05-02 AT&T Corp. Synthesis of speech signals in the absence of coded parameters
US5996022A (en) * 1996-06-03 1999-11-30 Webtv Networks, Inc. Transcoding data in a proxy computer prior to transmitting the audio data to a client
US6269338B1 (en) * 1996-10-10 2001-07-31 U.S. Philips Corporation Data compression and expansion of an audio signal
CN1262994C (zh) * 1996-11-07 2006-07-05 松下电器产业株式会社 噪声消除器
GB2349251B (en) * 1998-02-24 2003-01-08 Seagate Technology A detector for, and method of, detecting data values using sample vectors
SE516595C2 (sv) * 1998-03-13 2002-02-05 Ericsson Telefon Ab L M Kommunikationsanordning och arbetssätt för behandling av röstmeddelanden
JP2000081898A (ja) * 1998-09-03 2000-03-21 Denso Corp ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6539237B1 (en) * 1998-11-09 2003-03-25 Cisco Technology, Inc. Method and apparatus for integrated wireless communications in private and public network environments
US6182030B1 (en) * 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
JP2000305597A (ja) 1999-03-12 2000-11-02 Texas Instr Inc <Ti> 音声圧縮のコード化
AUPQ141199A0 (en) 1999-07-05 1999-07-29 Telefonaktiebolaget Lm Ericsson (Publ) Data rate adaptation between mobile stations through transit fixed network
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
ES2269112T3 (es) * 2000-02-29 2007-04-01 Qualcomm Incorporated Codificador de voz multimodal en bucle cerrado de dominio mixto.
JP2001267085A (ja) 2000-03-23 2001-09-28 Sanyo Electric Co Ltd 有機発光装置およびその製造方法
WO2001078430A1 (en) 2000-04-11 2001-10-18 Nokia Corporation Application of rtp and rtcp in the amr transport in voice over ip networks
ATE553472T1 (de) * 2000-04-24 2012-04-15 Qualcomm Inc Prädikitve dequantisierung von stimmhaften sprachsignalen
FI20001577A (fi) * 2000-06-30 2001-12-31 Nokia Mobile Phones Ltd Puheenkoodaus
US6847929B2 (en) * 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6766289B2 (en) * 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
US6789059B2 (en) * 2001-06-06 2004-09-07 Qualcomm Incorporated Reducing memory requirements of a codebook vector search
US7042841B2 (en) * 2001-07-16 2006-05-09 International Business Machines Corporation Controlling network congestion using a biased packet discard policy for congestion control and encoded session packets: methods, systems, and program products
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US6981184B2 (en) * 2002-04-11 2005-12-27 Motorola, Inc. Apparatus and method for processing a corrupted frame
US6885638B2 (en) * 2002-06-13 2005-04-26 Motorola, Inc. Method and apparatus for enhancing the quality of service of a wireless communication

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001052467A1 (en) * 2000-01-10 2001-07-19 Qualcomm Incorporated Method and apparatus for supporting adaptive multi-rate (amr) data in a cdma communication system

Also Published As

Publication number Publication date
CN101494055A (zh) 2009-07-29
AU2003281378A2 (en) 2004-01-23
JP2005532579A (ja) 2005-10-27
EP1520271B1 (en) 2011-07-27
CA2392640A1 (en) 2004-01-05
RU2005102831A (ru) 2005-07-20
BR0312467A (pt) 2005-04-26
JP2009239927A (ja) 2009-10-15
ES2367259T3 (es) 2011-10-31
US20060100859A1 (en) 2006-05-11
JP5173939B2 (ja) 2013-04-03
MXPA05000285A (es) 2005-09-20
KR20050016976A (ko) 2005-02-21
WO2004006226B1 (en) 2004-03-04
MY144845A (en) 2011-11-30
HK1130558A1 (en) 2009-12-31
ATE518225T1 (de) 2011-08-15
RU2008102318A (ru) 2009-07-27
EP1520271A1 (en) 2005-04-06
RU2326449C2 (ru) 2008-06-10
AU2003281378B2 (en) 2010-08-19
RU2461897C2 (ru) 2012-09-20
CN101494055B (zh) 2012-10-10
AU2003281378A1 (en) 2004-01-23
CN1692408A (zh) 2005-11-02
WO2004006226A1 (en) 2004-01-15
US8224657B2 (en) 2012-07-17

Similar Documents

Publication Publication Date Title
KR101105353B1 (ko) Cdma 무선 시스템의 가변 비트 레이트 광대역 스피치코딩시 효율적인 인-밴드 딤-버스트 시그날링 및하프-레이트 맥스 오퍼레이션을 위한 방법 및 장치
KR100732659B1 (ko) 가변 비트 레이트 광대역 스피치 음성 코딩시의 이득양자화를 위한 방법 및 장치
US7203638B2 (en) Method for interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
US7657427B2 (en) Methods and devices for source controlled variable bit-rate wideband speech coding
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
JP2005534950A (ja) 線形予測に基づく音声コーデックにおける効率的なフレーム消失の隠蔽のための方法、及び装置
JP2006525533A5 (ko)
US7974846B2 (en) Data embedding device and data extraction device
Choudhary et al. Study and performance of amr codecs for gsm
CA2491623C (en) Method and device for efficient in-band dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
Paksoy Variable rate speech coding with phonetic classification

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20141231

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151217

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161220

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171219

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181226

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20191217

Year of fee payment: 9