KR20030036709A - 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여비대칭 링크를 생성하는 방법 및 시스템 - Google Patents

무선 통신 시스템에서 비대칭 스피치 코더를 사용하여비대칭 링크를 생성하는 방법 및 시스템 Download PDF

Info

Publication number
KR20030036709A
KR20030036709A KR10-2003-7002417A KR20037002417A KR20030036709A KR 20030036709 A KR20030036709 A KR 20030036709A KR 20037002417 A KR20037002417 A KR 20037002417A KR 20030036709 A KR20030036709 A KR 20030036709A
Authority
KR
South Korea
Prior art keywords
modes
speech
mode
speech coder
forward link
Prior art date
Application number
KR10-2003-7002417A
Other languages
English (en)
Other versions
KR100912030B1 (ko
Inventor
아난쓰패드마나반아난쓰
데자코앤드류피
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20030036709A publication Critical patent/KR20030036709A/ko
Application granted granted Critical
Publication of KR100912030B1 publication Critical patent/KR100912030B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/18Service support devices; Network management devices
    • H04W88/181Transcoding devices; Rate adaptation devices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Machine Translation (AREA)
  • Communication Control (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

무선 통신 시스템의 순방향 링크 용량을 그 시스템의 역방향 링크 용량과 밸런싱키키는 방법 및 장치가 제시된다. 선택가능한 모드를 갖는 스피치 코더들이 양쪽 링크에서 구현되어, 순방향 링크 스피치 코더는 역방향 링크에 의해 사용된 모드와 동일한 모드 세트로 동작할 수 없게 된다. 역방향 링크는 순방향 링크보다 큰 사용자 용량을 갖기 때문에, 역방향 링크 스피치 코더는 높은 평균 데이터 레이트로 동작할 수 있다. 따라서, 역방향 링크 스피치 코더에 의해 사용되는 모드 세트는 낮은 평균 데이터 레이트 모드없이 구현할 수 있다. 모드 세트로부터 모드들을 제거함으로써 스피치 코더의 복잡성을 감소시킬 수 있다.

Description

무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 시스템 {METHOD AND APPARATUS FOR USING NON-SYMMETRIC SPEECH CODERS TO PRODUCE NON-SYMMETRIC LINKS IN A WIRELESS COMMUNICATION SYSTEM}
특히 장거리 및 디지털 무선 전화기 애플리케이션에서, 디지털 기술을 통한 보이스 송신이 광범위하게 보급되었다. 이는 재구성된 스피치의 인식 품질을 유지하면서 채널을 통하여 송신할 수 있는 최소 정보량을 결정하는 것에 흥미를 불러일으켰다. 단순히 샘플링과 디지털화를 통해 스피치를 송신하는 경우, 종래의 아날로그 전화기의 통신 품질을 달성하기 위해서는 초당 64 킬로비트(kbps)급의 데이터 레이트가 요구된다. 그러나, 적절한 코딩, 송신, 및 재합성이 뒤따르는 스피치 분석을 수신기에서 이용하여, 데이터 레이트의 현저한 감소를 이룰 수 있다.
스피치 압축용 장치는 원격 통신의 다양한 분야에서 그 용도를 찾을 수 있다. 대표적인 분야는 무선 통신이다. 무선 통신 분야는, 예를들어, 코드없는 전화기, 페이징, 무선 로컬 루프, 셀룰러 및 PCS 전화기 시스템 등의 무선 텔레포니, 모바일 인터넷 프로토콜 (IP) 텔레포니, 및 위성 통신 시스템을 포함하는 다양한 애플리케이션을 갖고 있다. 특히 중요한 애플리케이션은 모바일 가입자용 무선 텔레포니이다.
주파수분할 다중접속 (FDMA), 시분할 다중접속 (TDMA), 및 코드분할 다중접속 (CDMA) 를 포함하는 무선 통신 시스템에 대해서 다양한 무선 인터페이스가 개발되었다. 이와 관련하여, 예를들어 Advanced Mobile Phone Service (AMPS), Global System for Mobile Communications (GSM), 및 Interim Standard 95 (IS-95) 를 포함하는 다양한 국내 및 국제 표준이 확립되었다. 대표적인 무선 텔레포니 통신 시스템은 코드분할 다중접속 (CDMA) 시스템이다. IS-95 표준과 그 파생 표준들, IS-95A, ANSI J-STD-008, IS-95B, 및 제 3 세대 표준안 IS-95C 및 IS-2000 등 (여기서는,포괄하여 IS-95 라고 함) 이 통신 산업 협회 (TIA; Telecommunication Industry Association) 이 아닌 널리 알려진 표준 단체들에 의해서 공표되어, 셀룰러 또는 PCS 텔레포니 통신 시스템용 CDMA 무선 인터페이스의 이용을 명시하고 있다. 실질적으로 IS-95 표준 사양에 따라 구성한 대표적인 무선 통신 시스템이 본 발명의 양수인에게 양도되었으며 여기서 그 내용을 전부 참조하는 미국특허번호 제5,103,459호와 제4,901,307호에 기술되어 있다.
휴먼 스피치 생성 모델과 관련된 파라미터를 추출하고, 그 스피치를 압축하는 기술을 이용하는 장치를 스피치 코더라 한다. 이 스피치 코더는 인입 스피치 신호를 시간 블록이나 분석 프레임으로 분할한다. 일반적으로, 스피치 코더는 인코더와 디코더를 구비한다. 인코더는 일부 관련 파라미터를 추출하기 위해서 인입 스피치 프레임을 분석한 후 그 파라미터들을 이진 표현, 즉 비트나 바이너리 데이터 패킷으로 양자화한다. 데이터 패킷은 통신채널을 통하여 수신기와 디코더로 송신된다. 디코더는 그 데이터 패킷을 처리하고 양자화하여 파라미터를 생성하고, 그 양자화된 파라미터를 사용하여 스피치 프레임을 재합성한다.
스피치 코더의 기능은 스피치에 고유한 모든 자연적 반복을 제거하여 디지털화된 스피치 신호를 낮은 비트 레이트 신호로 압축하는 것이다. 디지털 압축은 양자화를 이용하여 입력 스피치 프레임을 파라미터 세트로 표현하고 이 파라미터들을 비트 세트로 표현함으로써, 디지털 압축을 달성할 수 있다. 입력 신호 프레임이 다수의 비트 Ni를 갖고 스피치 코더에 의해서 생성된 데이터 패킷이 다수의 비트 N0를 갖는 경우, 스피치 코더에 의해서 달성되는 압축율 Cr= Ni/N0이다. 목표 압축율을 달성하면서 디코딩된 스피치의 높은 보이스 품질을 유지하는 것이 해결하고자 하는 과제이다. 스피치 코더의 성능은 (1) 스피치 모델 또는 상술한 분석과 합성의 조합을 얼마나 잘 수행하는 지와 (2) 프레임당 N0비트의 목표 비트 레이트로 파라미터 양자화 처리를 얼마나 잘 수행하는 지이다. 따라서, 스피치 모델의 목적은 각각의 프레임에 대한 적은 파라미터 세트로 스피치 신호의 속성이나 목표 보이스 품질을 파악하는 것이다.
스피치를 인코딩하는 한가지 효과적인 기술이 멀티-모드 코딩이다. 대표적인 멀티-모드 코딩 기술이 발명의 명칭이 VARIABLE RATE SPEECH CODING 인 미국특허출원번호 제09/217,341호에 기술되어 있으며, 이는 본 발명의 양수인에게 양도되었으며, 여기서 그 내용을 전부 참조한다. 종래의 멀티-모드 코더는 서로 다른 모드 또는 인코딩-디코딩 알고리즘을 서로 다른 유형의 입력 스피치 프레임에 적용한다. 각각의 모드 또는 인코딩-디코딩 처리는 예를들어, 보이스 스피치, 언보이스 스피치, 전이 스피치 (보이스 및 언보이스 스피치 시간 사이에 발생하는 스피치), 및 배경 잡음(무음, 또는 논스피치) 등의 일정한 유형의 스피치 세그먼트를 가장 효율적인 방식으로 최적으로 표현하도록 주문 제작된다. 외부, 개방 루프 코드 판정 메카니즘은 입력 스피치 프레임을 검사하여 어떤 모드를 프레임에 적용할 지에 관한 판정을 행한다. 일반적으로, 개방 루프 모드 판정은 입력 프레임으로부터 다수의 파라미터를 추출하고, 그 파라미터들을 일정한 시간적 및 공간적 특성에 대하여 평가하고, 그 평가에 기초하여 행해진다.
현재, 무선 통신 네트워크내의 송신 효율을 증대시키고자하는 상업적으로 강하게 요구되고 있다. 상술한 바와 같이, 스피치 샘플들로부터 스피치 파라미터를 추출하여 높은 목표 압축율 Cr을 획득하는 것이 효율적인 시스템을 만들어내는 한가지 방법이다. 그러나, 스피치 정보를 바이너리 패킷으로 효율적으로 팩킹하는 것으로는 기지국으로부터 원격국으로 데이터 패킷을 무선 송신할 때의 병목을 감소시키는 문제를 완전하게 해결하지는 못한다. 본 명세서에서, 기지국은 원격국이 통신하는 하드웨어를 말한다. 셀은 그 용어를 사용하는 문맥에 따라서, 하드웨어적 또는 지리적 커버리지 영역을 말한다. 섹터는 셀의 일부분이다. CDMA 시스템의 섹터는 셀의 속성을 갖기 때문에, 셀의 관점에서 기술한 교시내용은 섹터로도 확장할 수 있다.
CDMA 시스템에서는, 사용자들 간의 통신이 하나 이상의 기지국을 통하여 수행된다. 하나의 원격국상의 제 1 사용자는 역방향 링크를 통하여 기지국으로 데이터를 송신함으로써 제 2 원격국상의 제 2 사용자와 통신한다. 기지국은 그 데이터를 수신하여 다른 기지국으로 라우팅한다. 이 데이터는 동일한 기지국 또는 제 2 기지국의 순방향 링크를 통하여 제 2 원격국으로 송신된다. 순방향 링크는 기지국으로부터 원격국으로의 송신을 말하며, 역방향 링크는 원격국으로부터 기직국으로의 송신을 말한다. IS-95 및 IS-2000 시스템에서는, 순방향 링크와 역방향 링크에는 별개의 주파수가 할당된다.
순방향 링크는 복수의 파일럿 및 트래픽 채널을 포함하며, 여기서 각각의 채널은 적절한 왈쉬 또는 의사직교 함수로 확산된다. 그후, 각각의 채널은 의사잡음(PN) 시퀀스의 쿼드러처쌍에 의해 1.2288 Mcps 의 고정 칩레이트로 확산된다. 왈쉬 코드와 PN 시퀀스을 사용함으로써, 기지국은 다수의 순방향 링크 CDMA 채널을 생성할 수 있게 된다. 또한, 역방향 트래픽 채널은, 각각의 개별 가입자 네트워크의 무선 구성에 의해 명시된 대로, 다수의 채널을 포함할 수 있다.
각각의 채널은 기능적으로 서로 다른 목적을 달성하도록 물리적으로 구성된다. 예를들어, 파일럿 채널은 왈쉬 코드 "W0" 를 사용하여 단순하게 확산될 수 있지만, 동기 채널은 인코딩, 인터리빙, 확산, 및 변조된 확산 스펙트럼 신호이다. 또한, 다른 순방향 및 역방향 링크 채널들도 인코딩, 인터리빙, 확산, 및 변조된확산 스펙트럼 신호이지만, 적절한 원격 통신 표준에 의해 부여되는 다양한 조건을 충족하도록 다양한 값들로 처리된다.
본 발명은 일반적으로 무선 통신 분야에 관한 것으로서, 보다 구체적으로는 무선 통신 시스템에서 무선 비대칭 링크를 생성하는 방법 및 장치에 관한 것이다.
이하, 본 발명의 특징, 목적, 및 이점을 첨부 도면과 관련하여 상세한 설명에서 보다 명백하게 설명하며, 도면에서 동일한 인용부호는 전반에 걸쳐서 대응하도록 나타낸다.
도 1 은 무선 전화기 시스템의 블록도이다.
도 2 는 각각의 끝단에서 스피치 코더로 종결되는 통신 채널의 블록도이다.
도 3 은 스피치 인코더의 블록도이다.
도 4 는 스피치 디코더의 블록도이다.
도 5 는 인코더/송신기부 및 디코더/수신기부를 구비하는 스피치 코더의 블록도이다.
도 6 은 보이스 스피치의 세그먼트에 대한 신호 진폭대 시간의 그래프이다.
도 7 은 IS-95 시스템 사용시 차량 이동 대 어랑 용량의 그래프이다.
도 8 은 IS-2000 시스템 사용시 차량 이동 대 어랑 (Erlang) 용량의 그래프이다.
도 9 는 통신 세션의 순방향 및 역방향 링크상에서 동작하는 비대칭 스피치 코더의 블록도이다.
비대칭 링크를 생성하는 신규하고 개선된 방법 및 장치가 제시된다. 일 실시형태에서, 비대칭 링크는 무선 통신 시스템의 순방향 링크 용량을 무선 통신 시스템의 역방향 링크 용량과 밸런싱시키기 위한 것으로서, 순방향 링크를 통한 제 1 세트의 모드로 제 1 스피치 코더를 동작시키는 단계; 및 역방향 링크를 통한 제 2 세트의 모드로 제 2 스피치 코더를 동작시키는 단계를 포함하며, 상기 제 1 세트의 모드중 하나 이상의 모드는 낮은 평균 데이터 레이트와 연관되며, 상기 제 2 세트의 모드중 각각의 모드는 높은 평균 데이터 레이트와 연관된다.
다른 실시형태에서는, 무선 통신 시스템의 순방향 링크 및 역방향 링크로 데이터 프레임을 송신하는 방법이 제시되며, 이 방법은 제 1 복수의 모드로 순방향 링크 스피치 코더를 동작시키는 단계; 및 제 2 복수의 모드로 역방향 링크 스피치 코더를 동작시키는 단계를 포함하며, 상기 제 2 복수의 모드중 하나 이상의 모드는 상기 제 1 복수의 모드의 각각의 모드와는 다르다.
또 다른 실시형태에서는, 무선 통신 시스템의 순방향 링크 및 역방향 링크로 데이터 프레임을 송신하는 방법이 제시되며, 이 방법은 제 1 복수의 모드로 순방향 링크 스피치 코더를 동작시키는 단계; 및 제 2 복수의 모드로 역방향 링크 스피치 코더를 동작시키는 단계를 포함하며, 상기 제 1 복수의 모드중 하나 이상의 모드는 상기 제 2 복수의 모드의 각각의 모드와는 다르다.
본 실시형태는 비대칭 순방향 및 역방향 링크를 생성하는 비대칭 스피치 코더에 관한 것이다. 비대칭 순방향 및 역방향 링크를 생성하기 위해서는, 역방향 링크에서의 스피치 코더의 복잡성을 줄이기 위해서 순방향 링크에서의 어랑 용량과 역방향 링크에서의 어랑 용량의 불균형을 이용한다. 어랑은 트래픽 플로우의 측정치이고, 여기서 하나의 어랑은 연속적으로 사용되는 하나의 보이스 채널 또는 더 작은 시간동안 사용되는 채널의 동등한 개수와 동일하다. 이하, 여기서 기술하는 대표적인 실시형태는 CDMA 무선 인터페이스를 이용하도록 구성된 무선 텔레포니 통신 시스템에 존재하는 것이다. 그러나, 당업자는 비대칭 링크를 생성하는 방법 및 장치가 당업자에게 알려진 광범위한 기술들을 이용한 임의의 다양한 통신 시스템에도 존재할 수 있음을 알 수 있다.
대표적인 CDMA 시스템
도 1 에 나타낸 바와 같이, 일반적으로 CDMA 무선 텔레포니 시스템은 복수의 이동 가입자 유닛 (10), 복수의 기지국 (12), 기지국 컨트롤러 (14; BSC), 및 이동 스위칭 센터 (16; MSC) 를 포함한다. 또한, MSC (16) 은 종래의 공중 교환 전화망 (18; PSTN) 과 인터페이스하도록 구성된다. 또한, MSC (16) 은 BSC (14) 와 인터페이스하도록 구성된다. BSC (14) 는 백홀 라인을 경유하여 기지국과 결합한다. 백홀 라인은 예를들어, E1/T1, ATM, IP, PPP, 프레임 릴레이, HDSL, ADSL, 또는 xDSL 등을 포함하는 여러 알려진 인터페이스중 임의의 것을 지원하도록 구성될 수 있다. 이 시스템에는 2 개 이상의 BSC (14) 가 존재할 수 있다. 유리하게는, 각각의 기지국 (12) 은 하나 이상의 섹터 (미도시) 를 포함하며, 각각의 섹터는 무지향성 안테나 또는 기지국 (12) 으로부터 방사상으로 특정한 방향을 향하는 안테나를 포함할 수 있다. 다른 방법으로, 각각의 섹터는 다이버시티 수신용으로 2 개의 안테나를 포함할 수 있다. 유리하게는, 각각의 기지국 (12) 는 복수의 주파수 할당을 지원하도록 설계될 수 있다. 섹터의 교차와 주파수 할당을 CDMA 채널이라고 부르기도 한다. 또한, 기지국 (12) 는 기지국 트랜시버 서브 시스템 (12; BTS) 으로 알려져 있기도 한다. 다른 방법으로, "기지국" 은 산업계에서는 BSC (14) 와 하나 이상의 BTS (12) 를 총괄하여 말하는 것으로 사용하기도 한다. BTS (12) 는 "셀 사이트(12)" 라고도 표시하기도 한다. 다른 방법으로, 주어진 BTS (12) 의 개별 섹터는 셀사이트라고 말하기도 한다. 일반적으로, 이동 가입자 유닛 (10) 은 셀룰러 또는 PCS 전화기 (10) 이다. 유리하게는, 시스템은 IS-95 표준에 따라서 사용되도록 구성할 수 있다.
셀룰러 전화기 시스템의 일반적인 동작중에, 기지국 (12) 은 이동 유닛 (10) 세트로부터 역방향 링크 신호 세트를 수신한다. 이동 유닛 (10) 은 전화 통화 또는 다른 통신을 행한다. 주어진 기지국 (12) 이 수신한 각각의 역방향 링크 신호는 그 기지국 (12) 내에서 처리된다. 처리된 데이터는 BSC (14) 로 포워딩된다. BSC (14) 는 통화 리소스 할당 및 기지국 (12) 간의 소프트 핸드 오프의 조정을 포함하는 이동성 관리 기능을 제공한다. 또한, BSC (14) 는 수신 데이터를 MSC (16) 으로 라우팅하고, 이 MSC 는 PSTN (18) 과의 인터페이스를 위해 추가적인 라우팅 서비스를 제공한다. 유사하게, PSTN (18) 은 MSC (16) 와 인터페이스하며, 이 MSC (16) 는 BSC (14) 와 인터페이스하고, 이어서 이는 순방향 링크 신호 세트를 이동 유닛 세트 (10) 로 송신하기 위해서 기지국 (12) 을 제어한다. 당업자는 가입자 유닛 (10) 이 다른 실시형태에서는 고정 유닛일 수 있음을 알 수 있다.
무선 통신 시스템의 인코더 및 디코더
도 2 에서, 제 1 인코더 (100) 는 디지털화된 스피치 샘플 s(n) 을 수신하고 그 샘플 s(n) 을 인코딩하여, 송신 매체 (102) 또는 통신 채널 (102) 를 통하여 제 1 디코더 (104) 로 송신한다. 디코더 (104) 는 인코딩된 스피치 샘플을 디코딩하여 출력 스피치 신호 SSYNTH(n) 을 합성한다. 다른 방향의 송신에 있어서 제 2 인코더 (106) 는 디지털화된 스피치 샘플 s(n) 을 인코딩하고, 이 샘플을 통신 채널 (108) 을 통해서 송신한다. 제 2 디코더 (110) 는 인코딩된 스피치 샘플를 수신하고 디코딩하여, 합성된 출력 스피치 신호 SSYNTH(n) 을 생성한다.
스피치 샘플 s(n) 은, 예를들어 펄스 코드 변조 (PCM), 압신 μ-법칙 또는 A-법칙을 포함하는 기술 분야에 알려진 임의의 다양한 방법에 따라서 디지털화되고 양자화된 스피치 신호를 나타낸다. 당업계에 알려진 바와 같이, 스피치 샘플 s(n) 이 입력 데이터 프레임으로 구성되며, 이들 프레임 각각은 소정 개수의 디지털화된 스피치 샘플 s(n) 을 포함한다. 대표적인 실시형태에서는, 각각의 20ms 프레임이 160 개의 샘플을 포함하는 8kHz 의 샘플링 레이트가 이용한다. 후술하는 실시형태에서는, 유리하게는 데이터 송신 레이트가 풀 레이트로부터 하프 레이트, 쿼터 레이트, 1/8 레이트로 프레임대 프레임 기반으로 변화한다. 데이터 송신 레이트를 변화시키는 것은 상대적으로 적은 스피치 정보를 포함하는 프레임에 대하여 낮은 비트 레이트를 선택적으로 이용할 수 있기 때문에 유리하다. 당업자가 알 수 있듯이, 다른 샘플링 레이트 및/또는 프레임 사이즈를 이용할 수 있다.또한, 후술하는 실시형태에서, 스피치 인코딩 (또는 코딩) 모드는 프레임의 스피치 정보나 에너지에 응답하여 프레임대 프레임 기반으로 변화할 수 있다.
제 1 인코더 (100) 와 제 2 디코더 (110) 는 공동으로 제 1 스피치 코더 (인코더/디코더) 또는 스피치 코덱을 구성할 수 있다. 스피치 코더는, 예를들어 도 1 을 참조하여 상술한 가입자 유닛, BTS, 또는 BSC 를 포함하는, 스피치 신호를 송신하는 임의의 통신 장치에 사용될 수 있다. 유사하게, 제 2 인코더 (106) 와 제 1 디코더 (104) 는 공동으로 제 2 스피치 코더를 구성할 수 있다. 당업자는 스피치 코더를 디지털 신호 프로세서 (DSP), 주문형 집적회로 (ASIC), 이산 게이트 로직, 펌웨어, 또는 임의의 종래 프로그램가능 소프트웨어 모듈과 마이크로 프로세서로 구현할 수 있음을 알 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래쉬 메모리, 레지스터, 및 당업계에 알려진 임의의 다른 형태의 저장 매체에 존재할 수 있다. 다른 방법으로는, 종래의 프로세서, 컨트롤러, 또는 스테이트 머신으로 마이크로프로세서를 대체할 수 있다. 특히 스피치 코딩용으로 설계된 대표적인 ASIC 는, 본 발명의 양수인에게 양도되었고 여기서 그 내용을 전부 참조하는 미국특허번호 제5,727,123호, 및 본 발명의 양수인에게 양도되었고 여기서 그 내용을 전부 참조하는 발명의 명칭이 VOCODER ASIC 인 1998년 7월 21일자 미국특허번호 제5,784,532호에 기술되어 있다.
인코더 구조
도 3 에서, 스피치 코더에서 사용할 수 있는 인코더는 모드 판정 모듈 (202), 피치 추정 모듈 (204), LP 분석 모듈 (206), LP 분석 필터 (208), LP 양자화 모듈 (210), 및 나머지 양자화 모듈 (212) 을 구비한다. 입력 스피치 프레임 s(n) 은 모드 판정 모듈 (202), 피치 추정 모듈 (204), LP 분석 모듈 (206), 및 LP 분석 필터 (208) 에 제공된다. 모드 판정 모듈 (202) 은 다른 특성들 중에서 각각의 입력 스피치 프레임 s(n) 의 주기성, 에너지, 신호대 잡음비 (SNR) 또는 영교차율 (zero crossing rate) 에 기초하여 모드 인덱스 IM과 모드 M 을 생성한다. 주기성에 따라서 스피치 프레임을 분류하는 다양한 방법이 본 발명의 양수인에게 양도되었으며 여기서 그 내용을 전부 참조하는 미국특허번호 제5,911,128호에 기술되어 있다. 또한, 이런 방법들은 통신 산업협회 잠정 표준안 TIA/EIA IS-127 과 TIA/EIA IS-733호에 구체화되어 있다. 또한, 대표적인 모드 판정 방식이 상술한 미국특허출원번호 제09/217,341호에 기술되어 있다.
피치 추정 모듈 (204) 은 각각의 입력 스피치 프레임 s(n) 에 기초하여 피치 인덱스 Ip와 래그값 P0을 생성한다. LP 분석 모듈 (206) 은 각각의 입력 스피치 프레임 s(n) 에 선형예측 분석을 수행하여 LP 파라미터 α를 생성한다. LP 파라미터 α는 LP 양자화 모듈 (210) 에 제공된다. 또한, LP 양자화 모듈 (210) 은 모드 M 을 수신하며, 모드 의존적 방법으로 양자화 프로세스를 수행한다. LP 양자화 모듈 (210) 은 LP 인덱스 ILP와 양자화된 LP 파리미터를 생성한다. LP 분석 필터 (208) 는 입력 스피치 프레임 s(n) 이외에도 양자화된 LP 파라미터를 수신한다. LP 분석 필터 (208) 은 LP 나머지 신호 R[n] 을 생성하며, 이 나머지 신호는 양자화된 선형 예측된 파라미터에 기초하여 입력 스피치 프레임s(n) 과 재구성된 스피치간의 오차를 나타낸다. LP 나머지 R[n], 모드 M, 및 양자화된 LP 파라미터는 나머지 양자화 모듈 (212) 에 제공된다. 이들 값에 기초하여, 나머지 양자화 모듈 (212) 은 나머지 인덱스 IR과 양자화된 나머지 신호를 생성한다.
디코더 구조
도 4 에서, 스피치 코더에서 사용할 수 있는 디코더 (300) 는 LP 파라미터 디코딩 모듈 (302), 나머지 디코딩 모듈 (304), 모드 디코딩 모듈 (306), 및 LP 합성 필터 (308) 를 구비할 수 있다. 모드 디코딩 모듈 (306) 은 모드 인덱스 IM을 수신하고 디코딩하여, 그로부터 모드 M 을 생성한다. LP 파라미터 디코딩 모듈 (302) 은 모드 M 과 LP 인덱스 ILP를 수신한다. LP 파라미터 디코딩 모듈 (302) 은 수신 값을 디코딩하여 양자화된 LP 파라미터를 생성한다. 나머지 디코딩 모듈 (304) 는 나머지 인덱스 IR, 피치 인덱스 IP, 및 모드 인덱스 IM를 수신한다. 나머지 디코딩 모듈 (304) 은 수신값들을 디코딩하여 양자화된 나머지 신호를 생성한다. 양자화된 나머지 신호와 양자화된 LP 파라미터가 LP 합성 필터 (308) 에 제공되며, 이 필터는 그들로부터 디코딩된 출력 스피치 신호를 합성한다.
멀티모드 인코더/디코더의 동작
도 5 는 통신 채널 또는 송신 매체 (404) 를 통하여 멀티모드 스피치 디코더(402) 와 통신하는 멀티-모드 스피치 인코더 (400) 의 동작 기능을 나타낸다. 유리하게는, 통신 채널 (404) 는 IS-95 표준에 따라서 구성된 RF 인터페이스이다. 당업자는 인코더 (400) 가 관련 디코더 (미도시) 를 갖는 것을 알 수 있다. 인코더 (400) 와 관련 디코더는 함께 제 1 스피치 코더를 형성한다. 또한, 당업자는 디코더 (402) 가 관련 인코더 (미도시) 를 갖는 것을 알 수 있다. 디코더 (402) 와 관련 인코더는 함께 제 2 스피치 코더를 형성한다. 유리하게는, 제 1 및 제 2 스피치 코더는 제 1 및 제 2 DSP 로서 구현할 수 있으며, 예를들어 PCS 및 셀룰러 전화기 시스템의 가입자 유닛과 기지국 또는 위성 시스템의 가입자 유닛과 게이트웨이에 존재할 수 있다.
인코더 (400) 는 파라미터 계산기 (406), 모드 분류 모듈 (408), 복수의 인코딩 모드 (410), 및 패킷 포맷화 모듈 (408) 을 구비한다. 인코딩 모드 (410) 의 개수는 n 으로 나타내며, 당업자는 이것이 인코딩 모드 (410) 의 임의의 타당한 개수를 나타내는 것임을 알 수 있다. 단순하도록, 3 개의 인코딩 모드 (410) 만을 나타내었으며, 점선은 존재 가능한 추가적인 인코딩 모드 (410) 를 나타낸다. 디코더 (402) 는 패킷 디어셈블러와 패킷 손실 검출기 모듈 (414), 복수의 디코딩 모드 (416), 소거 디코더 (418), 및 후치 필터 (post filter), 또는 스피치 합성기 (420) 를 구비한다. 디코딩 모드 (416) 의 개수는 n 으로 나타내며, 당업자는 이것이 디코딩 모드 (416) 의 임의의 타당한 개수를 나타내는 것임을 알 수 있다. 단순하도록, 3 개의 디코딩 모드 (416) 만을 나타내었으며, 점선은 존재 가능한 추가적인 디코딩 모드 (416) 를 나타낸다.
스피치 신호 s(n) 은 파라미터 계산기 (406) 에 제공된다. 스피치 신호는 프레임이라 불리는 샘플들의 블록으로 분할된다. 값 n 은 프레임 개수를 나타낸다. 다른 실시형태에서는, 선형 예측 (LP) 나머지 오차 신호를 스피치 신호 대신에 사용한다. LP 나머지는 예를들어 CELP 코더 등의 스피치 코더에 의해 사용된다. 유리하게는, LP 나머지의 계산은 스피치 신호를 인버스 LP 필터 (미도시) 에 제공하여 행한다. 인버스 LP 필터 A(z) 의 전달함수는 다음식,
에 따라서 계산되며, 여기서 계수 αI는 상술한 특허번호 제5,414,706호와 미국특허출원번호 제09/217,494호에 기술된 공지 기술에 따라서 선택한 소정값을 갖는 필터단들이다. 개수 p 는 인버스 LP 필터가 예측 목적에서 사용한 이전 샘플의 개수를 나타낸다. 특정 실시형태에서, p 는 10 으로 설정된다.
파라미터 계산기 (406) 는 현재 프레임에 기초하여 다양한 파라미터를 유도한다. 일실시형태에서, 이들 파라미터는 선형 예측 코딩 (LPC) 필터 계수, 라인 스펙트럼쌍 (LSP) 계수, 정규화 자기 정렬 함수 (NACF), 개-루프 래그, 영교차율, 밴드 에너지, 및 포먼트 나머지 신호 (formant residue signal) 중 하나 이상을 포함한다. LPC 계수, LSP 계수, 개-루프 래그, 밴드 에너지, 포먼트 나머지 신호는 상술한 미국특허번호 제 5,414,706호에 상세하게 기술되어 있다. NACF 와 영교차율의 계산은 상술한 미국특허번호 제5,911,128호에 상세하게 기술되어 있다.
파라미터 계산기 (406) 는 모드 분류 모듈 (408) 에 결합된다. 파라미터 계산기 (406) 는 파라미터들을 모드 분류 모듈 (408) 에 제공한다. 모드 분류 모듈 (408) 은, 현재 프레임에 대하여 최적의 인코딩 모드 (410) 를 선택하기 위해서 프레임대 프레임 기반으로 인코딩 모드들 (410) 간에 동적으로 스위칭하도록 결합된다. 모드 분류 모듈 (408) 은 파라미터들을 소정의 임계값 및/또는 천정값와 비교하여 현재 프레임에 대한 특정 인코딩 모드 (410) 를 선택한다. 프레임의 에너지 콘텐츠에 기초하여, 모드 분류 모듈 (408) 은 프레임을 논스피치 또는 비활성 스피치 (예를들어, 무음, 배경 잡음, 또는 단어간의 일시정지) 로 분류한다. 프레임의 주기성에 기초하여, 모드 분류 모듈 (408) 은 스피치 프레임을 예를들어, 보이스, 언보이스, 또는 전이와 같은 특정 유형의 스피치로 분류한다. 보이스 스피치는 상대적으로 높은 등급의 주기성을 나타내는 스피치이다.
보이스 스피치의 세그먼트는 도 6 의 그래프에 나타낸다. 나타낸 바와 같이, 피치 주기는 프레임의 콘텐츠를 분석하고 재구성하는 데 유리하게 사용할 수 있는 스피치 프레임의 구성 성분이다. 일반적으로, 언보이스 스피치는 자음적 소리 (consonant sound) 를 포함한다. 일반적으로, 전이 스피치 프레임은 보이스와 언보이스 스피치 간의 전이이다. 보이스 및 언보이스 스피치 모두로 분류되지 않는 프레임은 전이 스피치로 분류된다. 당업자는 임의의 타당한 분류 방식을 이용할 수 있음을 알 수 있다.
스피치 프레임을 분류하는 것은 서로다른 인코딩 모드 (410) 를 서로다른 유형의 스피치를 인코딩하는 데 사용하여 통신 채널 (404) 같은 공유 채널의 대역폭을 보다 효율적으로 사용할 수 있기 때문에 유리하다. 예를들어, 보이스 스피치는 주기적이고 따라서 예측가능성이 크기 때문에, 저비트레이트, 고예측성 인코딩 모드 (410) 를 사용하여 보이스 스피치를 인코딩할 수 있다. 분류 모듈 (408) 같은 분류 모듈은 미국특허출원번호 제09/217,341호, 및 본 발명의 양수인에게 양도되었으며 여기서 그 내용을 전부 참조하는 발명의 명칭이 CLOSED-LOOP MULTIMODE MIXED-DOMAIN LINEAR PREDICTION (MDLP) SPEECH CODER 인 1999년 2월 26일자 미국특허출원번호 제09/259,151호에 상세하게 기술되어 있다.
모드 분류 모듈 (408) 은 프레임 분류에 기초하여 현재 프레임에 대한 인코딩 모드 (410) 를 선택한다. 다양한 인코딩 모드 (410) 가 병렬로 결합된다. 하나 이상의 인코딩 모드 (410) 이 임의의 주어진 시간에 동작할 수 있다. 그렇지만, 단지 하나의 인코딩 모드 (410) 가 임의의 주어진 시점에 동작하고 현재 프레임의 분류에 따라서 선택되는 것이 유리하다.
유리하게는, 서로 다른 인코딩 모드 (410) 은 서로 다른 코딩 비트 레이트, 서로 다른 코딩 방식, 또는 서로 다른 조합의 코딩 비트 레이트와 코딩 방식에 따라서 동작한다. 대표적인 실시형태에서, 사용하는 다양한 코딩 레이트는 풀 레이트, 하프 레이트, 쿼터 레이트, 및/또는 1/8 레이트일 수 있다. 사용하는 다양한 코딩 방식은 CELP 코딩, 원형 피치 주기 (PPP; Prototype pitch period) 코딩 (또는 파형 내삽 (WI; waveform interpolation) 코딩), 및/또는 잡음 여기 선형 예측 (NELP; noise excited linear prediction) 코딩일 수 있다. 따라서, 예를들어, 특정 인코딩 모드 (410) 가 풀 레이트 CELP, 다른 인코딩 모드 (410) 는 하프레이트 CELP, 또다른 인코딩 모드 (410) 는 쿼터 레이트 PPP, 또다른 인코딩 모드 (410) 는 NELP 일 수 있다.
CELP 인코딩 모드 (410) 에 따르면, 선형 예측 성도 모델 (linear predictive vocal tract model) 은 양자화된 형태의 LP 나머지 신호로 여기된다. 이전 프레임 전부에 대하여 양자화된 파라미터는 현재 프레임을 재구성하는 데 사용할 수 있다. 따라서, CELP 인코딩 모드 (410) 는 상대적으로 높은 코딩 비트 레이트를 희생시켜서, 스피치의 상대적으로 정확한 재생을 제공한다. 유리하게는, CELP 인코딩 모드 (410) 는 전이 스피치로 분류된 프레임을 인코딩하는 데 사용할 수 있다. 대표적인 가변 레이트 CELP 스피치 코더는 상술한 미국특허번호 제5,414,796호에 상세하게 기술되어 있다.
NELP 인코딩 모드 (410) 에 따라서, 스피치 프레임을 모델링하는 데 필터링된, 의사 랜덤 잡음 신호를 사용한다. NELP 인코딩 모드 (410) 는 낮은 비트 레이트를 달성하는 비교적 단순한 기술이다. NELP 인코딩 모드 (410) 는 언보이스 스피치로 분류된 프레임을 인코딩하는 것을 촉진하도록 사용될 수 있다. 대표적인 NELP 코딩 모드는 상술한 미국특허출원번호 제09/217,494호에 상세하게 기술되어 있다.
선택한 인코딩 모드 (410) 는 패킷 포맷화 모듈 (412) 에 결합된다. 선택된 인코딩 모드 (410) 는 현재 프레임을 인코딩하거나 양자화하고, 그 양자화된 프레임 파라미터를 패킷 포맷화 모듈 (412) 에 제공한다. 유리하게는, 패킷 포맷화 모듈 (412) 은 양자화된 정보를 통신 채널 (404) 을 통하여 송신하기 위한 패킷으로 어셈블링한다. 일 실시형태에서, 패킷 형성 모듈 (412) 은 에러 정정 코딩을 제공하고 IS-95 표준에 따라서 패킷을 포맷화하도록 구성된다. 패킷은 송신기 (미도시) 에 제공되어, 아날로그 형식으로 변환되고 변조되어, 통신 채널 (404) 을 통하여 수신기 (역시 미도시) 에 송신되며, 이 수신기는 패킷을 수신, 복조, 디지털화하여, 디코더 (402) 에 제공한다.
디코더 (402) 에서, 패킷 디어셈블러와 패킷 손실 검출기 모듈 (414) 은 수신기로부터 패킷을 수신한다. 패킷 디어셈블러와 패킷 손실 검출기 모듈 (414) 은 패킷대 패킷 기반으로 디코딩 모드들 (416) 간에 동적으로 스위칭하도록 결합된다. 디코딩 모드 (416) 의 개수는 인코딩 모드 (410) 의 개수와 동일하며, 당업자가 알 수 있듯이, 각각의 넘버링된 인코딩 모드 (410) 는 동일한 코딩 비트 레이트와 코딩 방식을 이용하도록 구성된 유사하게 넘버링된 개별 디코딩 모드 (416) 와 연관된다.
패킷 디어셈블러와 패킷 손실 검출기 모듈 (414) 이 패킷을 검출하는 경우, 패킷은 디어셈블링되어 관련 디코딩 모드 (416) 에 제공된다. 패킷 디어셈블러와 패킷 손실 검출기 모듈 (414) 이 패킷을 검출하지 않는 경우, 패킷 손실이 선언되며, 유리하게는 소거 디코더 (418) 가, 본 발명의 양수인에게 양도되었으며 여기서 그 내용을 전부 참조하는 발명의 명칭이 FRAME ERASURE COMPENSATION METHOD IN A VARIABLE RATE SPEECH CODER 인 2000년 4월 24일자 관련 미국 특허출원번호 제09/557,283호에 기술된 바와 같은 프레임 소거 처리를 행한다.
디코딩 모드 (416) 의 병렬 어레이와 소거 디코더 (418) 은 후치 필터 (420)에 결합된다. 관련 디코딩 모드 (416) 는 패킷을 디코딩하거나 양자화하고, 패킷은 후치 필터 (420; post filter) 에 정보를 제공하게 된다. 후치 필터 (420) 는 스피치 프레임을 재구성하거나 합성하여, 합성된 스피치 프레임을 출력하게 된다. 대표적인 디코딩 모드와 후치 필터는 상술한 미국특허번호 제5,414,796호와 미국특허출원번호 제09/217,494호에 상세하게 기술되어 있다.
선택형 모드가 가능한 스피치 코더의 구현에 의한 순방향 및 역방향 링크에서의 불균형 감소
언급한 바와 같이, 어랑은 시스템 용량에 대한 측정치 단위이며, 여기서 하나의 어랑은 연속적으로 사용중인 하나의 보이스 채널이다. 도 7 은 IS-95 순방향 링크와 IS-95 역방향 링크의 어랑 용량을 사용자 이동의 함수로 나타낸다. 선 (700) 은 역방향 링크 용량에 해당하고 선 (710) 은 순방향 링크 용량에 해당한다. 도 8 은 IS-2000 순방향 링크 및 IS-2000 역방향 링크의 어랑 용량을 나타낸다. 선 (800) 은 역방향 링크 용량에 해당하고 선 (810) 은 순방향 링크 용량에 해당한다. 양쪽 CDMA 시스템에서, 원격국이 저속으로 이동하는 동안에는, 순방향 링크의 어랑 용량은 역방향 링크 상의 어랑 용량보다 현저히 작다. 예를들어, 도 7 에서, 원격국의 50% 가 이동하고 있는 시점에, 역방향 링크의 용량은 26.9 이고 순방향 링크의 용량은 12 이다. 따라서, 역방향 링크는 순방향 링크보다 2.24 배 큰 용량을 갖는다. 통신 시스템은 순방향 및 역방향 링크 양쪽에서 보이스 활성화를 수행해야 하기 때문에, 시스템 용량은 최저속 링크에 의해서 제한된다.
원격국상의 스피치 코더와 기지국상의 스피치 코더는 일반적으로 동일한 스피치 인코딩 모드를 지원하도록 구현되며, 이로인해 모든 스피치 코더에서 모든 데이터 레이트를 지원하는 대칭적 시스템을 구현하게 된다.
대표적인 실시형태에서, 순방향 링크 용량과 역방향 링크 용량의 불균형은, 각각 평균 데이터 레이트와 관련되는 다수의 선택가능 모드들을 갖는 스피치 코더를 구현하여 감소시킬 수 있다. 표 1 은 선택가능 모드가 없는 스피치 코더에 대한 선택가능 모드 스피치 코더의 용량 이득을 나타낸다.
표 1: 선택가능 모드 스피치 인코더에 대한 이득 (** 역방향 IS-95 링크에서 _ 레이트를 사용하는 것은 권장하지 않음)
표 1 의 모드들은 풀 레이트, 하프 레이트, 쿼터 레이트, 및 1/8 레이트 프레임의 조합을 통하여 얻은 평균 데이터 레이트와 각각 연관된다. 표 2 는 각각의 모드를 달성하기 위해서 사용하는 다양한 프레임의 퍼센티지 조합을 나타낸다.
표 2: 선택가능한 모드 스피치 코더의 동작 모드에 대한 클린 스피치 (clean speech) 레이트 통계
증가하는 모드 개수는 시스템 용량과 보이스 품질간의 이율 배반성을 나타낸다. 예를들어, 모드 0 는 낮은 시스템 용량을 희생하여 높은 보이스 품질을 제공하며, 모드 2 는 낮은 보이스 품질을 희생하여 높은 시스템 용량을 제공한다. 일 실시형태에서는, 새로운 모드 3 이 제공되어 보이스 품질의 적은 손실로 모드 2 보다 더 낮은 평균 데이터 레이트를 달성하여, 시스템 용량과 보이스 품질간의 이율배반에서 추가적인 유연성을 캐리어에 제공할 수 있다.
이 특정 실시형태에서는 모드 3 이 언보이스 프레임에 대하여는 적극적으로 쿼터 레이트 NELP 코딩을, 그리고 매우 안정적인 보이스 프레임에 대해서는 쿼터 레이트 시간 동기식 파형 내삽 코딩 (TSWI) 을 이용하여 구현된다.
따라서, 순방향 링크의 어랑 용량과 역방향 링크의 어랑 용량간의 불균형은 순방향 링크 용량의 증가로 인하여 감소되며, 여기서 증가된 순방향 링크 용량은 모드 2 와 3 같은 선택가능 모드의 구현을 통하여 달성되며, 역방향 링크 용량은 모드 0 또는 1 를 구현함으로써 유지된다. 따라서, 순방향 및 역방향 링크에대하여 사용되는 스피치 코더는 비대칭 모드로 동작한다. 예를들어, 도 8 에 따른 IS-2000 시스템에서는, 역방향 링크는 모드-0 에서 동작하여 37.4 명의 사용자 용량을 가지며, 순방향 링크는 모드-0 에서 동작하여 23.2 명의 사용자 용량을 갖는다. 그러나, 순방향 링크가 모드 2 에서 동작하도록 설정되는 경우, 용량은 49% 가 증가한다. 그 결과, 37.4 명의 사용자가 순방향 링크에 의해 서비스될 수 있다.
스피치 코더의 복잡성 감소를 위한 순방향 및 역방향 링크에서의 불균형 이용
일부 상황에서는, 저용량 순방향 링크에 의해 유발되는 불균형이 데이터 트래픽을 송신되는 시스템에서 제약일 필요가 없다. 예를들어, 패킷화된 데이터 패킷을 기지국으로부터 원격국으로 전달하는 것은 일반적으로 대용량 데이터의 "다운로딩" 으로 이루어진다. 한편, 패킷화된 데이터 패킷을 원격국으로부터 기지국으로 전달하는 것은 적은 데이터 패킷을 "업로딩" 하는 것으로 이루어진다. 이 실시예에서는, 대용량 데이터를 전달할 필요성으로 인하여 순방향 링크가 일반적으로 저속이며, 낮은 용량 요구가 있기 때문에 역방향 링크가 일반적으로 고속이다.
일 실시형태에서, 순방향 링크 및 역방향 링크 용량간의 불균형은 원격국에 위치하는 스피치 코더와 기지국에 위치하는 스피치 코더의 복잡성을 감소시킬 수 있도록 이용된다. 도 9 는 이 실시형태를 나타낸다. 제 1 인코더 (910) 은 4 개의 모드, 모드 A, 모드 B, 모드 C, 및 모드 D 가 가능한 기지국에 위치하며,여기서 각각의 모드는 풀 레이트, 하프 레이트, 쿼터 레이트, 1/8 레이트 프레임의 합성에 의해 생성되는 서로 다른 평균 데이터 레이트를 나타낸다. 모드 A 는 최고 평균 데이터 레이트를 나타내고, 모드 B 는 두 번째 최고 평균 데이터 레이트를 나타내고, 모드 C 는 세 번째 최고 평균 데이터 레이트를 나타내고, 모드 D 는 최저 평균 데이터 레이트를 나타낸다. 순방향 링크 송신 과정중에, 순방향 링크의 평균 데이터 레이트는 모드 C 의 평균 데이터 레이트에 해당하여, 순방향 링크가 거의 풀 용량이다.
제 1 인코더 (910) 는 4 개의 모드 모두로 송신할 수 있으며, 원격국에 위치하는 제 1 디코더 (920) 는 4 개의 모드 모두의 평균 데이터 레이트들로 프레임을 수신하여야 한다.
그러나, 역방향 링크의 큰 용량으로 인하여, 원격국에 위치하는 제 2 인코더 (915) 는 모드 A 같은 높은 평균 데이터 레이트로 송신할 수 있다. 이 실시형태의 일 양태에서는, 모드 C 를 이용하여 데이터 프레임을 송신할 필요가 전혀 없을 지에 대하여 미리 결정한다. 마찬가지로, 원격국상에 위치하는 제 2 인코더 (915) 는 모드 C 의 평균 데이터 레이트로 데이터를 송신하는 능력이 없이 구현된다. 제 2 인코더 (915) 는 모드 C 를 전혀 이용할 수 없기 때문에, 기지국에 위치하는 제 2 디코더 (925) 는 모드 C 를 지원하지 않고 구현될 수 있다.
이하, 도 9 는 낮은 평균 데이터 레이트로 동작하는 모드들을 제거하여 역방향 링크 인코더 및 디코더의 복잡성을 감소시킨다. 도 9 에서 4 개의 모드를 이용하는 것은 예시를 위한 목적이며, 본 발명의 정신과 범위를 벗어나지 않고 더많거나 더 적은 모드를 구현할 수 있다.
도 9 에 나타낸 실시형태의 구현은 언밸런스 시스템과 밸런스 시스템 양쪽에 적용가능하다. 밸런스를 순방향 및 역방향 링크상의 비-대칭 모드 선택을 통하여 달성하는 밸런스 시스템에서는, 일부 낮은 레이트 모드를 이용하지 않는 것을 미리 결정하여 인코더와 디코더의 풀 세트가 없는 단순화된 스피치 코더를 구현할 수 있게 한다.
이상과 같이, 비대칭 순방향 및 역방향 링크를 생성하는 신규하고 개선된 방법 및 장치를 설명하였다. 당업자는, 상기 상세한 설명 전반에 걸쳐서 언급한 데이터, 지시, 명령, 정보, 신호, 비트 심볼, 및 칩은, 유리하게는 전압, 전류, 전자기파, 자기장 또는 자기입자, 광학장 또는 광학입자, 또는 그들의 임의의 조합으로 표현할 수 있다는 것을 알 수 있다. 당업자는 여기 개시한 실시형태와 연관하여 설명한 다양한 예시적인 논리 블록, 모듈, 회로, 알고리즘 단계를 전자 하드웨어, 컴퓨터 소프트웨어, 및 양쪽의 조합으로 구현할 수 있다. 다양한 예시적인 부품, 블록, 모듈, 회로 및 단계들은 일반적으로 그들의 기능 관점에서 설명하였다. 이 기능이 하드웨어 또는 소프트웨어로 구현되는 지의 여부는 전체 시스템에 부여된 특정 애플리케이션과 설계 제한에 의존한다. 당업자는 이런 환경에서 하드웨어와 소프트웨어의 호ㄱ환성과 특정 애플리케이션 각각에 대하여 설명한 기능을 어떻게 최적으로 구현할 지를 알 수 있다. 예를들어, 여기 개시한 실시형태들과 관련하여 설명한 다양한 예시적인 논리 블록, 모듈, 회로 및 알고리즘 단계들은 디지털 신호 프로세서 (DSP), 주문형 집적회로 (ASIC), 필드 프로그렘가능 게이트 어레이 (FPGA) 또는 다른 프로그램 가능 논리 장치, 이산 게이트 또는 트랜지스터 로직, 예를들어 레지스터와 FIFO 같은 이산 하드웨어 부품, 펌웨어 명령 세트를 실행하는 프로세서, 임의의 종래 프로그램 가능 소프트웨어 모듈과 프로세서, 또는 여기 기술한 기능들을 수행하도록 설계된 그들의 임의의 조합으로 구현하거나 수행할 수 있다. 유리하게는, 프로세서는 마이크로프로세서일 수 있지만, 다른 방법으로는 이 프로세서는 임의의 종래 프로세서, 컨트롤러, 마이크로컨트롤러, 또는 스테이트 머신일 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래쉬 메모리, ROM 메모리, EPROM 메모리, EEPROM 메모리, 레지스터, 하드 디스크, 분리형 디스크, CD-ROM, 및 당업계에 알려진 임의의 다른 형태의 저장 매체에 존재할 수 있다. 유리하게는, 대표적인 프로세서는 저장 매체로부터 정보를 판독 및 기록하기 위해서 저장 매체에 결합될 수 있다. 다른 방법으로, 저장 매체는 프로세서에 통합될 수 있다. 프로세서와 저장 매체는 ASIC 에 존재할 수 있다. ASIC 는 전화기에 존재할 수 있다. 다른 방법으로, 프로세서와 저장 매체는 전화기에 존재할 수 있다. 프로세서는 DSP 와 마이크로프로세서간의 조합, 또는 DSP 코더 등과 연관된 2 개의 마이크로프로세서로서 구현할 수 있다.
이상과 같이, 본 발명의 바람직한 실시형태를 설명하였다. 한편, 본 발명의 정신과 범위를 벗어나지 않고서 여기 개시한 실시형태를 다양한 변경을 할 수 있음은 당업자들에게는 명백하다. 따라서, 본 발명은 다음의 청구항에 따른 경우 이외에는 한정되지 않는다.

Claims (7)

  1. 무선 통신 시스템의 순방향 링크 용량을 무선 통신 시스템의 역방향 링크 용량과 밸런싱시키는 방법으로서,
    순방향 링크를 통한 제 1 세트의 모드로 제 1 스피치 코더를 동작시키는 단계; 및
    역방향 링크를 통한 제 2 세트의 모드로 제 2 스피치 코더를 동작시키는 단계를 포함하며,
    상기 제 1 세트의 모드중 하나 이상의 모드는 낮은 평균 데이터 레이트와 연관되며, 상기 제 2 세트의 모드중 각각의 모드는 높은 평균 데이터 레이트와 연관되는 것을 특징으로 하는 밸런싱 방법.
  2. 무선 통신 시스템에서 데이터 프레임을 송신하는 방법으로서,
    무선 통신 시스템의 순방향 링크 용량을 무선 통신 시스템의 역방향 링크 용량과 밸런싱시키는 단계를 포함하며, 상기 밸런싱 단계는 순방향 링크를 통한 제 1 모드로 동작하는 순방향 링크 스피치 코더를 사용하여 달성되며, 상기 제 1 모드는 역방향 링크 스피치 코더가 동작되는 제 2 모드와 대칭이 아닌 것을 특징으로 하는 데이터 프레임 송신 방법.
  3. 무선 통신 시스템에서 순방향 링크 용량을 역방향 링크 용량과 밸런싱시키는시스템으로서,
    복수의 모드로 선택적으로 동작하는 순방향 링크 스피치 코더; 및
    감소된 복수의 모드로 선택적으로 동작하는 역방향 링크 스피치 코더를 구비하며,
    상기 제 1 세트의 모드중 하나 이상의 모드는 낮은 평균 데이터 레이트와 연관되고, 상기 감소된 복수의 모드중 각각의 모드는 높은 평균 데이터 레이트와 관련되는 것을 특징으로 하는 밸런싱 시스템.
  4. 무선 통신 시스템의 순방향 링크와 역방향 링크로 데이터 프레임을 송신하는 방법으로서,
    제 1 복수의 모드로 순방향 링크 스피치 코더를 동작시키는 단계; 및
    제 2 복수의 모드로 역방향 링크 스피치 코더를 동작시키는 단계를 포함하며,
    상기 제 2 복수의 모드중 하나 이상의 모드는 상기 제 1 복수의 모드중 각각의 모드와는 다른 것을 특징으로 하는 데이터 프레임 송신 방법.
  5. 무선 통신 시스템의 순방향 링크와 역방향 링크로 데이터 프레임을 송신하는 방법으로서,
    제 1 복수의 모드로 순방향 링크 스피치 코더를 동작시키는 단계; 및
    제 2 복수의 모드로 역방향 링크 스피치 코더를 동작시키는 단계를 포함하며,
    상기 제 2 복수의 모드중 하나 이상의 모드는 상기 제 1 복수의 모드중 하나의 모드와 동일한 것을 특징으로 하는 데이터 프레임 송신 방법.
  6. 무선 통신템의 순방향 링크와 역방향 링크로 데이터 프레임을 송신하는 방법으로서,
    제 1 복수의 모드로 순방향 링크 스피치 코더를 동작시키는 단계; 및
    제 2 복수의 모드로 역방향 링크 스피치 코더를 동작시키는 단계를 포함하며,
    상기 제 1 복수의 모드중 하나 이상의 모드는 상기 제 2 복수의 모드의 각각의 모드와는 다른 것을 특징으로 하는 데이터 프레임 송신 방법.
  7. 무선 통신 시스템의 순방향 링크와 역방향 링크로 데이터 프레임을 송신하는 방법으로서,
    제 1 복수의 모드로 순방향 링크 스피치 코더를 동작시키는 단계; 및
    제 2 복수의 모드로 역방향 링크 스피치 코더를 동작시키는 단계를 포함하며,
    상기 제 1 복수의 모드중 하나 이상의 모드는 상기 제 2 복수의 모드중 하나의 모드와 동일한 것을 특징으로 하는 데이터 프레임 송신 방법.
KR1020037002417A 2000-08-22 2001-08-14 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 장치 KR100912030B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/643,360 US6477502B1 (en) 2000-08-22 2000-08-22 Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
US09/643,360 2000-08-22
PCT/US2001/025586 WO2002017500A2 (en) 2000-08-22 2001-08-14 Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system

Publications (2)

Publication Number Publication Date
KR20030036709A true KR20030036709A (ko) 2003-05-09
KR100912030B1 KR100912030B1 (ko) 2009-08-12

Family

ID=24580483

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020037002417A KR100912030B1 (ko) 2000-08-22 2001-08-14 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 장치

Country Status (12)

Country Link
US (2) US6477502B1 (ko)
EP (1) EP1312230B1 (ko)
JP (1) JP4860890B2 (ko)
KR (1) KR100912030B1 (ko)
CN (1) CN1250028C (ko)
AT (1) ATE415793T1 (ko)
AU (1) AU2001284950A1 (ko)
BR (1) BR0113417A (ko)
DE (1) DE60136720D1 (ko)
HK (1) HK1056961A1 (ko)
TW (1) TW515158B (ko)
WO (1) WO2002017500A2 (ko)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW376611B (en) * 1998-05-26 1999-12-11 Koninkl Philips Electronics Nv Transmission system with improved speech encoder
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
KR100366637B1 (ko) * 2000-01-28 2003-01-09 삼성전자 주식회사 에러은닉을 이용하여 통화 거리를 개선하는 디지털 무선전화 시스템 및 통화 거리 개선을 위한 음성 통신 방법
US6477502B1 (en) * 2000-08-22 2002-11-05 Qualcomm Incorporated Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
US6745012B1 (en) * 2000-11-17 2004-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive data compression in a wireless telecommunications system
US20030100467A1 (en) * 2001-09-12 2003-05-29 Wolfgang Aehle Binding phenol oxidizing enzyme-peptide complexes
AU2003213931A1 (en) * 2002-04-09 2003-10-27 Nortel Networks Limited Tandem-free operation (tfo) capable communication apparatus
US7096180B2 (en) * 2002-05-15 2006-08-22 Intel Corporation Method and apparatuses for improving quality of digitally encoded speech in the presence of interference
FI20021936A (fi) * 2002-10-31 2004-05-01 Nokia Corp Vaihtuvanopeuksinen puhekoodekki
KR100451622B1 (ko) * 2002-11-11 2004-10-08 한국전자통신연구원 통신용 보코더 및 이를 이용한 통신 방법
JP2006515736A (ja) * 2003-01-10 2006-06-01 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 無線通信網用の一般化レート制御
US7406077B2 (en) * 2003-01-10 2008-07-29 Telefonaktiebolaget Lm Ericsson (Publ) Generalized rate control for a wireless communications network
US8254358B2 (en) * 2003-03-06 2012-08-28 Ericsson Ab Communicating a broadcast message to change data rates of mobile stations
US6734811B1 (en) * 2003-05-21 2004-05-11 Apple Computer, Inc. Single-ended balance-coded interface with embedded-timing
US8149961B1 (en) 2003-08-04 2012-04-03 Regents Of The University Of Minnesota Ranging in multi-band communication systems
US7519019B2 (en) * 2003-08-12 2009-04-14 Telefonaktiebolaget Lm Ericsson (Publ) Method of rate control
US7337108B2 (en) * 2003-09-10 2008-02-26 Microsoft Corporation System and method for providing high-quality stretching and compression of a digital audio signal
US7505764B2 (en) * 2003-10-28 2009-03-17 Motorola, Inc. Method for retransmitting a speech packet
US7489665B1 (en) * 2003-10-29 2009-02-10 Regents Of The University Of Minnesota Enhanced time resolution using multiple receptions
US7616660B2 (en) * 2003-11-21 2009-11-10 Telefonaktiebolaget Lm Ericsson (Publ) Common rate control method for reverse link channels in CDMA networks
ATE371926T1 (de) * 2004-05-17 2007-09-15 Nokia Corp Audiocodierung mit verschiedenen codierungsmodellen
US7852999B2 (en) * 2005-04-27 2010-12-14 Cisco Technology, Inc. Classifying signals at a conference bridge
US8032369B2 (en) * 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US8346544B2 (en) * 2006-01-20 2013-01-01 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision
US8090573B2 (en) * 2006-01-20 2012-01-03 Qualcomm Incorporated Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US7764514B2 (en) * 2006-12-08 2010-07-27 Intel Corporation Electromagnetic interference shielding for device cooling
US8279889B2 (en) * 2007-01-04 2012-10-02 Qualcomm Incorporated Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
US7957140B2 (en) * 2007-12-31 2011-06-07 Intel Corporation Air mover for device surface cooling
US20100098047A1 (en) * 2008-10-21 2010-04-22 Tzero Technologies, Inc. Setting a data rate of encoded data of a transmitter
US9025779B2 (en) 2011-08-08 2015-05-05 Cisco Technology, Inc. System and method for using endpoints to provide sound monitoring

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3663760A (en) * 1970-07-08 1972-05-16 Western Union Telegraph Co Method and apparatus for time division multiplex transmission of binary data
DE69232202T2 (de) 1991-06-11 2002-07-25 Qualcomm Inc Vocoder mit veraendlicher bitrate
US5812534A (en) * 1993-01-08 1998-09-22 Multi-Tech Systems, Inc. Voice over data conferencing for a computer-based personal communications system
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
TW271524B (ko) 1994-08-05 1996-03-01 Qualcomm Inc
US5706282A (en) 1994-11-28 1998-01-06 Lucent Technologies Inc. Asymmetric speech coding for a digital cellular communications system
US5715516A (en) * 1995-10-18 1998-02-03 Cellular Telecom, Ltd. Method and apparatus for wireless communication employing collector arrays
US5790549A (en) * 1996-02-29 1998-08-04 Ericsson Inc. Subtractive multicarrier CDMA access methods and systems
GB2332820A (en) 1997-12-23 1999-06-30 Northern Telecom Ltd cOMMUNICATION SYSTEM HAVING A REDUCED DATA RATE FOR HIGH TRAFFIC LEVELS
US6034971A (en) * 1998-06-30 2000-03-07 Motorola, Inc. Method and apparatus for controlling communication system capacity
US6205129B1 (en) * 1999-01-15 2001-03-20 Qualcomm Inc. Method and apparatus for variable and fixed forward link rate control in a mobile radio communications system
US6621804B1 (en) * 1999-10-07 2003-09-16 Qualcomm Incorporated Method and apparatus for predicting favored supplemental channel transmission slots using transmission power measurements of a fundamental channel
US6477502B1 (en) * 2000-08-22 2002-11-05 Qualcomm Incorporated Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system

Also Published As

Publication number Publication date
EP1312230B1 (en) 2008-11-26
HK1056961A1 (en) 2004-03-05
EP1312230A2 (en) 2003-05-21
DE60136720D1 (de) 2009-01-08
TW515158B (en) 2002-12-21
JP2004507924A (ja) 2004-03-11
CN1250028C (zh) 2006-04-05
WO2002017500A8 (en) 2002-05-02
ATE415793T1 (de) 2008-12-15
US6477502B1 (en) 2002-11-05
US20030014242A1 (en) 2003-01-16
KR100912030B1 (ko) 2009-08-12
JP4860890B2 (ja) 2012-01-25
BR0113417A (pt) 2004-01-06
AU2001284950A1 (en) 2002-03-04
WO2002017500A3 (en) 2002-06-20
WO2002017500A2 (en) 2002-02-28
CN1448034A (zh) 2003-10-08

Similar Documents

Publication Publication Date Title
KR100912030B1 (ko) 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 장치
KR100805983B1 (ko) 가변율 음성 코더에서 프레임 소거를 보상하는 방법
JP5280480B2 (ja) 帯域幅適応性量子化方法と装置
JP4842472B2 (ja) フレーム抹消条件下で予測音声コーダの性能を改良するためにデコーダからエンコーダにフィードバックを供給するための方法および装置
JP4782332B2 (ja) 音声符号器における目標ビットレートを維持する方法および装置
KR100752797B1 (ko) 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치
JP2006510063A (ja) サブサンプルされた励起波形コードブック
KR100754580B1 (ko) 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치
ES2276690T3 (es) Particion de espectro de frecuencia de una forma de onda prototipo.
JP5199281B2 (ja) 第1のビット・レートに関連する第1のパケットを、第2のビット・レートに関連する第2のパケットにディミング(dimming)するシステム及び方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120727

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130729

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140730

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 10