KR100193196B1 - 신호를 그룹 엔코딩하기 위한 방법 및 장치 - Google Patents

신호를 그룹 엔코딩하기 위한 방법 및 장치 Download PDF

Info

Publication number
KR100193196B1
KR100193196B1 KR1019950704514A KR19950704514A KR100193196B1 KR 100193196 B1 KR100193196 B1 KR 100193196B1 KR 1019950704514 A KR1019950704514 A KR 1019950704514A KR 19950704514 A KR19950704514 A KR 19950704514A KR 100193196 B1 KR100193196 B1 KR 100193196B1
Authority
KR
South Korea
Prior art keywords
rate
encoders
encoder
encoding
voice
Prior art date
Application number
KR1019950704514A
Other languages
English (en)
Other versions
KR960702146A (ko
Inventor
케네쓰에이. 스트워트
마이클디. 카친
Original Assignee
모토로라 인크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모토로라 인크 filed Critical 모토로라 인크
Publication of KR960702146A publication Critical patent/KR960702146A/ko
Application granted granted Critical
Publication of KR100193196B1 publication Critical patent/KR100193196B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/20Arrangements for detecting or preventing errors in the information received using signal quality detector
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/0001Systems modifying transmission characteristics according to link quality, e.g. power backoff
    • H04L1/0014Systems modifying transmission characteristics according to link quality, e.g. power backoff by adapting the source coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

코드 분할 다중 접속(CDMA) 통신 시스템은 시스템의 자체-혼선을 감소시키고 다른 음성부호기를 고려해서 개별 음성 부호기에 대한 비율 선택을 결정하므로써 시스템 용량을 향상시킨다. 시스템은 지각적으로 가중치를 부여한 에러 측정값(401)을 선택된 비율을 결정하고 이를 부호기(105)로 다시 제공하는 비율 제어기(404)로의 입력으로서 이용한다. 시스템은 필요시 다른 부호기들의 비율을 유지 하면서 특정 부호기의 비율을 감소시키고 용량을 향상시켜서 최적의 통화 품질과 시스템 용량을 제공한다. 이것은 시스템 용량이 일시적으로 증가될 필요가 있을 때 불필요하게 통화 품질이 감쇠되는 것을 방지한다.

Description

[발명의명칭]
신호를 그룹 엔코딩하기 위한 방법 및 장치
[발명의 상세한 설명]
[발명의 이용분야]
본 발명은 코드 분할 다중 접속(CDMA) 기법을 이용하는 통신 시스템, 특히 이러한 통신 시스템에서 디지털 음성 엔코딩 기법(digital speech encoding)을 갖춘점-다점 다중-접속 링크에서 시스템 자체-혼신의 감소와 시스템 용량의 증가를 위한 가변 레이트 음성 레이트 음성 엔코딩 방법에 관한 것이다.
[발명의 배경]
최근 들어 제한된 가용 무선 주파수 스펙트럼 내에서 다중-사용자 이동통신을 제공하는 다양한 기법들이 제안되었다. 이들 방법에는 주파수 분할 다중 접속(FDMA),시분할 다중 접속(TDMA) 및 코드 분할 다중 접속(CDMA)이 있으며 이들 방법들의 혼합형도 자주 사용된다. 이들 방법 전부가 상업적 셀룰러 원거리 통신 시스템의 설계에서 지난 10년간 체택되어 왔다: 북미의 AMPS 시스템에서의 FDMA, 유럽의 GSM 표준에서의 FD-TDMA, 그리고 최근에는 IS-95 표준에 내장된 미국 통신 산업 협회(TIA) 제안의 직접 순차 FD/CDMA가 그 예들이다. IS-95 표준에서는 가입자들이 셀룰러 대역의 여러 광대역 무선 채널 중에서 하나를 공유한다. 소위 개인 휴대 통신 시스템(PCS:personal communication system)에 대한 여러 제안도 FD-CDMA 기법으로 설계되고 있다.
대부분의 셀룰러 및 PCS 시스템은 음성 통신용의 물리 계층으로서 디지털 음성 엔코딩 및 순방향 채널 에러 정정 기법을 사용한다. 여기서 특히 관심을 끄는 것은 임의 호출측 상에서의 음성의 유무를 인식하기 위해 음성 활성도 탐지(VAD:voice activity detection) 기법을 사용하는 것이다. 음성이 없는 경우에 음성 엔코더는 그 출력 전력을 영으로 감소시키기 위해 자신을 변조기 또는 송신기에 링크시키도록 이들에 명령하거나 또는 임의 사용자 위치에서의 배경 잡음만을 표현하는 임시 패킷 정보를 송신할 수 있다. 이러한 형태로 무선 송신기의 듀티 사이클을 감소시키면 전력 소비 감소(이동 단말기의 경우에 배터리 수명의 증가)와 동일 RF 스텍트럼을 공유하는 사용자들 사이의 혼신 현상의 감소라는 두가지의 이익이 얻어진다. 통화 환경에 따라 송신 전력을 40%에서 65%정도 감소시킬 수 있다. 전력의 감소량은 VAD 기법에 필연적으로 따르는 통화 품질의 하락이 수용될 수 있는 선에서 제한된다.
향후의 전력 감소 문제는 CDMA 시스템에서 특히 중요하다. 이러한 시스템에서 사용자으 용량은 시스템의 자체-혼신 크기에 역비례한다. TIA IS-95의 FD/CDMA 표준에서는 이 접근 기법이 단순한 온-오프 또는 불연속 전송 방법을 대신해서 가변 레이트의 음성 엔코덩를 사용하므로써 좀더 확장된다. IS-95표준에서는 엔코딩된 음성이 20ms 간격으로 분리되는데, 여기서 음성 엔코더는 8000bps, 4000bps, 2000bps, 또는 800 bps 중 효율적인 비트율러 엔코딩하기 위해 선택될 수 있다. 기지국에서 이동국으로 (순방향) 및 이동국에서 기지국으로(역방향)의 IS-95 링크에는 가변 레이트의 엔코딩 기법이 사용된다. 순방향 링크의 경우에는 평균의 송신 전력이 엔코딩 레이트의 감소에 따른 출력 전력의 감소로 인해 감소된다. 채널 기호의 반복을 통해 이동국 수신기에서의 기호 조합과 이에 따른 링크의 성능을 결정하는 잡음 전력 스펙트럼 밀도비에 대한 기호당 에너지의 메인터넌스를 가능하게 한다. 평균 송신 전력-그리고, 이로 인한 시스템의 자체-혼신-은 800bps 송신시 4의 팩터(factor)만큼 감소하는 것을 유의해야 한다. 전형적인 양방향 통화에 대한 총 음성 활성도를 평균하므로써 TIA 표준의 IS-96에 규정된 표준 음성 엔코딩 및 음성 활성도 탐지 알고리즘의 사용시 평균 송신 전력이 그 명목 값의 약 41%로 떨어진다는 것이 추정된다. 이로써 시스템의 순방향 링크 용량에 큰 효과가 나타난다.
그러나, IS-95의 공간 매체 표준과 이와 연관된 IS-96의 음성 엔코더 표준의 현 구현에서는 각 순방향 음성 링크가 독립적으로 엔코딩한다. 즉, 음성 엔코더는 동일 RF 스펙트럼을 공유하는 다른 음성 체널에 대한 고려없이 수용할 만한 통화 품질을 유지하는데 필요한 최소 엔코딩 레이트를 개별적으로 결정한다. 이것은 각 음성 엔코더에서 레이트-결정 알고리즘이 그 엔코딩 레이틀 항상 최소화해야 하는 것을 필요로 한다. 동일 스펙트럼을 공유하는 다른 음성 엔코더의 엔코딩 레이트가 이를 필요로 하지 않을 때조차 이 사항은 준수돼야 한다. 예를 들면, 기지국에서 동일 채널을 공유하는 모든 음성 엔코더들이 낮은 레이트로 송신하는 것을 동시에 찾는 경우에 기지국에서의 총 출력 전력의 감소는 각 음성 엔코더가 시스템용량에 대한 부담없이 다음의 높은 레이트를 허용할 수 있다는 것을 의미한다. 가변 레이트 음성 엔코더를 위한 평균 송신 레이트의 최소화는 통화 품질과의 타협을 필요로 하므로 분리된 음성 엔코딩 기법은 불필요하게 통화 품질을 떨어뜨리게 된다. 또, CDMA 시스템이 용량에 접근하는데 용량을 일시적으로 상승시키기 위해 각 음성 엔코더의 송신 레이트에 제한이 가해질 때, 이러한 제한은 통화 품질상의 효과에 관계없이 동일 제약을 가정해서 모든 음성 링크에 맹목적으로 적용돼야 한다. 그런데, 통화 품질에는 많은 상이한 인자들이 영향을 미치고 그래서 섹터/셀 내에서 통화 품질이 받게 되는 영향을 가장 적게 하면서 특정 엔코더의 레이트를 감소시키는 방법이 존재하므로 위의 방식은 낭비적이다.
또, 동일한 섹터/셀 및 RF 채널을 제공하는 모든 여타 음성 엔코더를 고려해서 개별 음성 엔코더에 대한 레이트 선택을 결정하므로써 FD/CDMA 시스템의 순방향 링크 상에서의 전체적인 음성 엔코딩 방법 및 장치에 대한 요구가 존재한다.
[도면의 간단한 설명]
제1도는 종래의 CDMA 방식 기지국 송신기의 블록도.
제2도는 음성 엔코딩 표준인 TIA IS-96에서 지정된 종래 기술의 레이트 결정 장치의 블록도.
제3도는 양호한 실시예에 이용되며 음성 엔코딩 표준인 TIA IS-96에서 상술되는 타입의 코드표 여기 선형 예측 음성 엔코더의 블록도.
제4도는 본 발명에 따라 음성을 그룹 엔코딩하기 위해 감독 프로세서 또는 레이트 제어기를 사용하는 경우의 블록도.
제5도는 본 발명에 따라 섹터/셀로부터의 송신 전력에 대한 제한을 가정해서 섹터/셀의 총통화 품질을 최적화하는 수많은 알고리즘의 일부로서 레이트 제어기에 의해 이용되는 레이트/품질 표의 예시도.
제6도는 본 발명에 따라 CDMA 그룹 엔코딩 방법을 구현하는 장치의 블록도.
제7도는 본 발명에 따라 그룹 엔코딩 기법을 유리하게 구현할 수 있는 레이트 제어기의 블록도.
[양호한 실시예의 설명]
코드 분할 다중 접속(CDM) 방식의 통신 시스템은 시스템의 자체-혼신을 감소시키고 다른 음성 엔코더를 고려해서 개별 음성 엔코더(부호기)를 위한 레이트를 선택을 결정하므로써 시스템 용량을 향상시킨다. 시스템은 선택된 레이트를 결정하고 엔코더(105)로 다시 제공하는 레이트(비율)제어기(404)로의 입력으로서 지각으로 가중치를 부여하는 에러 측정값(401; perceptually weighted error metrics)을 이용한다. 시스템은 필요시 다른 엔코더를 해당 레이트로 유지시키면서 특정 엔코더의 레이트를 감소시키고 용량을 향상시키므로써 최적의 통화 품질과 시스템 용량을 제공한다.
이것은 시스템 용량이 일시적으로 증가될 필요가 있을 때 필요없는 통화 품질의 감쇠를 방지한다.
본 발명의 양호한 실시예는 통신 산업 협회 표준의 IS-95와 IS-96을 기본으로 하는 CDMA 디지탈 셀룰러 통신 시스템과 관련하여 설명된다. 이 분야의 기술자들은 본 발명이 가변 레이트 음성 엔코딩 기법에 의해 자체-혼신이 감소되는 임의 CDMA 점대 다점 링크(point-to-multipoint link)(일반적으로 디지털 셀룰러 시스템의 순방향 링크)에 적용될 수 있다는 것을 인식할 것이다. 그러나, 설명된 기법은 어떤 통신 시스템에도 유리하게 이용할 수 있으며, 실제로는 통신 시스템에 제한되지 않는다. 예를 들면, 이 기술은 음성 엔코딩 기법이 제한된 기억 공간을 갖는 메모리 수단에 저장용으로 이용될 수도 있다. 본질적으로 이 기술은 엔코딩 기법(음성, 영상, 데이타 등)이 이용되고 엔코딩과 관련된 제한 (전력 레벨, 엔코딩 품질, 시스템 용량, 기억 공간 등)이 존재하는 어떤 응용 분야에도 적용될 수 있다.
이 방법 및 장치는 적어도 2개의 엔코더로부터 레이트 결정 정보를 얻고 적어도 2개의 엔코더에 대한 레이트 결정 정보를 기본으로 해서 적어도 하나의 엔코더의 레이트를 결정함으로써 신호를 엔코딩한다. 양호한 실시예에서 레이트 결정 정보는 엔코딩 레이트의 함수(20ms 세그먼트에 의한 20ms 세그먼트를 기본으로)로서 재구성 품질과 관련되는 품질 정보이다. 품질 정보는 제한적이지는 않지만 합성 분석 음성 엔코더가 생성한 지각 가중치의 에러 측정, 신호 대 잡음(S/N)비, 세그먼트된 S/N, 셉스트럴 거리(cepstral distance), LPC 거리 측정, 및 BARK 스펙트럼 거리 측정을 포함하는데, 이들 모두는 이 기술 분야에 공지되어 있다.
적어도 하나의 엔코더의 레이트 결정은 임계 기준(통상 미리 결정된)을 기초로 한다. 양호한 실시예에서 임계 기준에는 제한적이지는 않지만 엔코더가 할당되는 섹터/셀의 총 출력 전력, 인접 섹터/셀의 총 출력 전력, 서비스하는 기지국에 의한 송신의 현 전력 레벨, 적어도 2개의 엔코더의 현 데이터 레이트, 메모리 수단에서 이용가능한 메모리, 처리 수단에서 이용 가능한 처리 전력, 및 선정된 스펙트럼에서 이용가능한 대역폭이 있다. 또, 양호한 실시예에서 엔코더는 가변 레이트의 종합 분석 방법 엔코더이다. 이들 엔코더는 제한적이지는 않지만 음성 신호, 영상 신호 및 데이터 신호를 포함하는 신호들을 엔코딩할 수 있다.
제1도는 TIA IS-95 디지털 셀룰러 무선 시스템의 양호한 실시예 용으로 설계된 CDMA 기지국(102)의 순방향 링크의 고수준 블록도이다. 제1도의 기지국(102)은 가변 레이트 음성 엔코딩, 순방향 에러 정정, 순방향 링크 전력 제어, 다중 접속 확산, 및 변조와 전송을 수행한다. 제1도에서 여러 표준의 μ-규칙(μ-law)의 엔코딩, 다중화된 64kbps 펄스 코드 변조식(PCM) T1 링크(101)는 공중 교환 전화망(100:PSTN)으로부터 역 다중화기(103)로 이어진다. 그리고, 각 64kbps 음성 링크(104)는 디지털 음성 엔코더(105)를 통과한다. 종래에는 음성 엔코딩 기능이 모토롤라의 DSP56156 프로세서, ROM 부호식 DSP 같은 다수의 범용 디지털 신호 처리기(DSP) 또는 특정 용도 집적 회로(ASIC)에 의해 수행되었다. 이러한 다수의 프로세서는 일반적으로 단일 프린트 회로 기판(이 사항이 본 발명에 반드시 필요한 것은 아니지만) 상에 그룹지어지는데, 이 단일 기판은 전 T1 트렁크(trunk)의 다중화 음성 채널을 처리할 수 있다. 음성의 엔코딩 후, 에러 정정(106)은 컨볼루션 및 주기 코드(convoultion and cyclic codes)의 형태로 공급되고 계속해서 BPSK 기저 대역 변조(107), 월시 커버 및 짧은 의사-잡음(Walsh cover and short pseudo-noise)순차 확산(108), 저대역 통과 필터링(109), 전송 전력 레벨 조정(110)과 전력 증폭(111), 및 이동국으로의 최종 전송(113)(간단하게 하기 위해 RF로의 주파수 전이는 생략함)으로 이어진다.
음성 엔코더(105)를 구현하는데 사용된 DSP 또는 다른 장치에 의해 수행되는 TIA IS-96 표준 처리의 블록도가 제2도에 도시되어 있다. 도시된 바와 같이 음성 엔코더(105)는 두 주요 부분으로 분리될 수 있다. 레이트 결정부와 엔코딩 섹션이 그것이다. 먼저 레이트 결정 기능부터 살펴보자. IS-96 표준에서 각 음성 엔코더(105)는 연관된 PCM 신호 스트림을 160 샘플의 음원 파형(source speech wave form)으로 구성되는 연속 20ms 프레임으로 분할한다. 각 프레임(자기 상관 추정기 (200)에 의해 생성된 프레임의 자기 상관 함수 추정치의 0번째 래그 R(0)인)의 전력 레벨은 3개의 단순-증가 임계값 레벨 중의 어떤 것을 설정하는 비교기(203)의 뱅크로 공급되고 프레임 전력은 초과된다. 이들 레벨은 블록(201)에 의해 형성된 음성 신호의 전력 레벨의 비선형 평균의 2번째 오더 보간(2nd order interpolation)에 의해 발생된다. 유의할 사항은 이들 모든 처리 단계가 TIA 표준의 IS 96에서 규정된다는 점이다. 현 프레임 에너지가 3개의 임계값 중 가장 작은 값보다 작다면, 프레임은 1/8 레이트 프레임으로 표시된다; 프레임 에너지가 임계값의 최저와 중간 사이에 위치하면 프레임은 1/4 레이트 프레임으로 표시된다; 프레임 에너지가 임계값의 중간과 최대 사이에 위치하면 프레임은 1/2 레이트 프레임으로 표시된다; 마지막으로 프레임 에너지가 최대 임계값을 초과하면 프레임은 전 레이트 프레임으로 표시된다. 이 최종 단계는 선택된 레이트(205)를 만들어내기 위해 비교기(2030와 해독기(204)에 의해 수행된다.
선택된 레이트(205)는 해당 레이트에 대한 비트의 지정 개수를 사용하여 음성 프레임이 파라미터 표현을 형성하는 코드표 여기 선형 예측(CELP: codebook excited linear predictive) 음성 엔코딩 기능(206)으로의 입력이 된다. 양호한 실시예에서 1/8 레이트 프레임의 엔코딩 파라미터를 표현하는데 사용한 비트의 개수는 16(에러 정정/검출에 사용된 부가 비트는 무시)이고; 1/4 레이트 프레임은 40비트; 1/2 레이트 프레임은 72비트; 및 전 레이트 프레임은 160비트이다. CELP가 양호한 실시예에서 설명되었지만, 다름 엔코딩 기법 예컨대 파형 코딩, 선형 예측 코딩(LPC), 하위-대역 코딩(), 여기 선형 예측(CELP), 확률적 여기 선형 예측(SELP), 벡터 합 여기 선형 예측(VSELP), 향상된 다중-대역 여기(IMBE) 및 적응성 미분 펄스 코드 변조(ADPCM) 코딩 알고리즘 등이 유리하게 채택될 수 있다.
목적을 명확히 하기 위해 CELP 음성 엔코딩 절차에 대해 상세히 설명할 필요가 있다. 제3도에는 양호한 실시예의 CELP음성 엔코더에 사용된 신호 처리의 고수준 블록도가 도시되어 있다. 제3도에 도시한 바와 같이 64kbps 음성 신호(104)의 연속 20 ms 프레임의 자기 상관 함수의 추정(309)이 먼저 얻어진다(이것은 보통 레이트 결정 절차의 블록(200)과 공동으로 행해진다). 다음에, 예컨대 Schur 순환(301; Schur Recursion)을 사용하는 소위 정규 방정식(Normal Equation)의 솔루션은 단기 선형 예측(STP) 필터 계수(310)를 제공한다. 흔히 STP 필터(303)는 격자 필터이고 STP 계수는 격자 필터 반사 계수이다. 선 스펙트럼 페어링(line spectral pairing) 또는 여타 로버스트 양자화(robust quantization)방법에 의한 양자화 후 STP 계수가 음성 신호를 필터링하는데 사용된다. 그 결과의 신호는 다음에 장기 예측(LTP) 필터(313)와 코드표 탐색 절차(CELP선형 예측 엔코더의 경우에)로 넘어간다. LTP필터는 일반적으로 피드백 지연과 게인이 변화되기 쉬운 제1오더 순환 필터이다. 이들은 LTP 래그 L(304)와 LTP 게인 G(305)로서 제3도에 도시된다. 그 후, 엔코딩은 LTP필터의 출력에서의 에러의 제곱이 최소화되도록 LTP 래그 및 게인과 코드표 인덱스 I(312)를 동시에 조정하므로써 진행된다. 그리고, L, G, 및 I는 양자화되고(흔히 바이어스된 선형 양자화기 방법을 사용하여), STP 계수와 더불어 에러 정정 블록으로 넘겨진다. 이러한 종합 분석 절차의 성능은 인간의 청각 주파수 반응에 의해 최소화되는 에러 측정에 가중치를 부가(weighting)하므로써 향상될 수 있다. 이것은 인간의 귀가 가장 민감하게 느끼는 주파수 성분을 강조하도록 에러 측정(308)을 수정하는 지각 가중치 필터(307:perceptual weighting filter)에 의해 행해진다. 이 분야의 기술자들은 지각 가중치식 에러 측정이 대부분의 세련된 종합 분석 음성 엔코더에 의해 이용 가능함을 인식할 것이다. 따라서, 상술한 바와 같이 본 발명은 CELP 음성 엔코더에 국한되는 것은 아니다.
이상을 토대로 본 발명에 따른 그룹 음성 엔코딩 기법이 설명된다. 종래 기술에서 각 순방향 링크 음성 엔코더의 엔코딩 레이트가 독립적으로 결정된다는 것은 제1도 및 제2도로부터 명백하다. 즉, 각 64kbps음성 링크의 엔코딩 레이트는 해당 음성 신호를 처리하는 신호에 의해 전적으로 결정된다. CDMA 시스템의 순방향 링크에서 자체-혼신(과 이에 따른 용량)의 크기가 각 엔코더의 평균 엔코딩 레이트에 의존하기 때문에, 최대 가능 레이트를 탐색하도록 설계되어야 한다. 이는 각 엔코더가 독립적으로 작동하며 기지국 안테나(112)에서 방출되는 총 전력(과 이에 따른 시스템의 자체-혼신)에 대한 지식을 갖고 있지 않기 때문이다. 낮은 평균 엔코딩 레이트를 얻기 위해서는 통화 품질이 희생되어야 하므로 시스템이 최대 용량에 있지 않을 때 또는 마찬가자로 최대 할당 용량을 전송하지 않을 때 시스템의 총 통화 품질은 불필요하게 희생되게 된다. 달리 말하면, 독립된 음성 엔코딩 방법은 기지국에서의 순간 총 출력 전력이 큰 변동을 갖게한다.
많은 CDMA 전력 제어 알고리즘에서 셀이나 섹터로부터의 총 방출 전력에는 엄격한 제한이 있으므로 개별 링크를 엔코딩하는데 사용한 레이트는 불필요하게 낮게 유지되어야 한다. 게다가, 디지털 식으로 엔코딩된 음성 링크의 지각 품질은 사용된 음성 엔코더 뿐만 아니라 화자의 성별, 억양, 목소리의 크기같은 인자와 음과 배경 잡음의 타입/레벨 같은 환경 인자에도 의존하는 것으로 알려지고 있다. 또, 각 링크를 독립적으로 엔코딩함으로써 한 링크가 다른 링크 및 이에 따른 다른 스피커상에서의 동등한 레이트 감소보다 감지된 총 통화 품질에서 더 작은 손실의 레이트로 감소될 수 있다는 상황에 대한 인식이 없어도 된다. 더구나, TIA 표준의 IS-96에 내장된 현 기술은 레이트 결정의 수행시 지각 가중치의 엔코딩 에러(perceptually-weighted encoding error) 기법을 사용하지 않는다.
제4도에 도시한 방법은 이러한 결점을 극복하는데 사용할 수 있다. 제4도에서 각 음성 엔코더(105)는 각 20ms프레임에 대해 4개의 후보 레이트(다른 실시예에서는 4개이상의 레이트도 가능함)의 각각에서 음성 프레임을 엔코딩함으로써 생성된 지각 가중치의 에러 측정(401)을 평가한다. 그후, 이 정보는 감독 레이트 제어기(404)로 다시 보내진다. 그리고, 레이트 제어기(404)는 제5도와 유사한 레이트/품질 표를 만드는데, 이 표는 레이트 제어기에 보고하는 N개의 음성 엔코더의 각각에 대해 후보 레이트의 각각에서 엔코딩함으로써 생성된 지각 가중치의 에러를 표현한다.
셀 또는 섹터의 총 통화 품질을 최적화하는 간단한 접근 방법은 N개의 모든 음성 채널이 같은 송신 전력을 갖는다는 가정으로부터 시작된다. 모든 엔코더(105)는 가장 낮은 후보 레이트에 위치되고 총 송신 전력(P)은 레이트 제어기(404)에 의해 계산된다. 이러한 경우에, P는 단순히 N개의 모든 엔코더에 대한 레이트 값들의 합과 같다. 여기서 1/8 레이트에 대한 레이트 값은 1/8, 1/4 레이트에 대한 레이트값은 1/4이다. 그후, 레이트 제어기(404)는 N개의 엔코더 중 임의의 것에 대한 현재의 후보 레이트에 상응하는 가장 큰 개체를 레이트/품질 표에서 찾아낸다. 이것은 선택된 레이트의 현 집합에 대한 최악 통화 품질(즉, 가장 큰 지각 가중치 에러)의 엔코더를 인식하는 경우에도 동일하다. 해당 엔코더에 대한 레이트는 다음의 최대 레이트로 증가되고 P는 재계산된다. 이 과정은 절차의 종료 시점에서 P가 총전력 임계값(T)을 넘을 때까지 계속된다. 향상된 접근 기법에서는 각 엔코더와 연관된 송신 게인에 의해 가중치가 부여된 레이트/품질 표의 개체에 이 절차를 적용한다. 이것은 전력 레벨 블록(110)으로부터 추출된다. 이 분야의 기술자들은 이 절차의 전면적인 효과로 더 낮은 레이트에서 동작하므로써 품질이 가장 적게 감소하게 되는 이들 엔코더의 레이트를 희생시켜서 전력이 감소된다는 것을 인식할 것이다.
또 다른 접근 방법은 다음과 같다. 위와 같이 높은 트래픽 로딩의 기간 동안 레이트 감소 기법의 목적(즉, 선정된 기준)은 어떤 임계값(T)보다 작게 되도록 총 송신 전력을 유지하는 것이다. 여기서 T는 현 로딩 조건에 따른 집합이다. N개의 음성 채널에 대한 선택된 레이트의 현 집합에 대해 지각 에러들의 합이 되도록 기지국이 서비스하는 섹터/셀에 대한 통화 품질의 전 측정(Q)을 규정한다. 각 엔코더는 최대 레이트로 엔코딩하도록 초기화된다. 그후, Q가 평가되고 대응하는 송신 전력이 동일 가정의 전력 또는 상술한 가중치 전송 전력 방법을 사용하여 계산된다.
이러한 방법의 단순화는 레이트 제어기(404)가 이용가능하지 않지만 각 DSP가 이용가능한 계산 자원을 시분할하므로써 다수의 음성 링크를 엔코딩하는 경우에 발생한다. 이러한 경우에 레이트 선택 절차는 DSP가 엔코딩을 수행하는 음성 채널의 개수에 적용된다. 제6도는 이러한 기법을 구현하는데 사용될 수 있는 장치를 도시한다. 제6도에서 모토롤라 DSP56156 같은 단일 DSP(603)는 시분할 다중화 직렬버스 또는 종래의 병렬 어드레스/데이터 버스를 통해 통신한다. 레이트 결정 정보와 레이트 선택은 음성 엔코딩용으로 사용된 제어 DSP(603)와 DSP(602)사이에서 버스(604)를 통해 통과한다. 그 대안으로, 제어 DSP(603)가 제거되고 하나 이상의 음성 채널에 대한 총 레이트 제어기 기능과 음성 엔코딩을 이행하기 위해 엔코더 DSP(602)중의 하나가 이용된다.
제7도는 본 발명에 따라 그룹 엔코딩을 구현하는 레이트 제어기(404)의 블록도를 도시한다. 레이트 제어기(404)는 다수의 엔코더(105)로부터 레이트 결정 정보(401)를 수신(700)하는 수단을 포함한다. 양호한 실시예에서 레이트 결정 정보는 지각 가중치의 에러 측정을 포함하는 품질 정보이다. 수신 수단(700)은 선정된 기준을 기본으로 엔코딩 요구 조건을 결정하는 자신의 출력을 받아들이는 결정 수단(703)을 구비한다. 선정된 기준에는 임계 기준과 같이 이미 설명한 것들이 있다. 출력의 결정 수단(703)은 레이트 결정 정보와 선정된 기준을 기본으로 해서 다수의 엔코더 중의 임의 엔코더에 대한 엔코딩 레이트를 조정 수단(706)으로의 입력이다. 선정된 기준이 총 송신 전력 또는 이용가능한 기억 공간인 기법에서는 조정 수단(706)이 상술한 바와 같이 최악의 품질(총 송신 전력 또는 이용가능 기억 공간 및 임계값의 결정/계산을 기본으로 해서)을 갖는 엔코더에 대한 엔코딩 레이트를 통상 증가시킨다. 그러나, 시스템 용량같은 선정된 기준은 특정 엔코더에 대한 엔코딩 레이트를 감소시키기 위해 조정 수단(706)을 필요로 할 수 있다.
본 발명이 특정 실시예를 참고로 도시되고 설명되었지만, 이 분야의 기술자들은 본 발명의 정신 및 범위를 이탈함이 없이 그 형태 및 세부 사항에서 여러 변형이 가능함을 이해할 것이다.

Claims (10)

  1. 신호들을 그룹 엔코딩하는 방법에 있어서, 복수의 엔코더로부터 레이트 결정 정보를 수신하는 단계; 선정된 기준에 기초하여 엔코딩 요구 조건을 결정하는 단계; 및 상기 레이트 결정 정보와 상기 선정된 기준에 기초하여 상기 복수의 엔코더중 임의의 엔코더의 엔코딩 레이트를 조정하는 단계를 포함하는 신호의 그룹 엔코딩 방법.
  2. 제1항에 있어서, 상기 선정된 기준은 상기 엔코더들이 할당되는 섹터/셀의 총 출력 전력, 인접 섹터/셀의 총 출력 전력, 서비스하는 기지국에 의한 현재의 전송 전력 레벨, 적어도 두개의 엔코더의 현재의 데이터 레이트, 메모리 수단에서 이용 가능한 메모리, 처리 수단에서 이용 가능한 처리 전력, 또는 선정된 스펙트럼에서 이용 가능한 대역폭을 더 포함하는 신호의 그룹 엔코딩 방법.
  3. 신호들을 그룹 엔코딩하기 위한 장치에 있어서, 적어도 두개의 엔코더로부터 레이트 결정 정보를 수신하는 수단; 및 상기 수신 수단에 결합되어, 상기 적어도 두개의 엔코더에 대한 상기 레이트 결정 정보에 기초하여 적어도 하나의 엔코더의 레이트를 결정하는 수단을 포함하는 신호의 그룹 엔코딩 장치.
  4. 제3항에 있어서, 상기 적어도 두개의 엔코더는 합성 분석(analysis-by-synthesis) 엔코더를 더 포함하는 신호의 그룹 엔코딩 장치.
  5. 제4항에 있어서, 상기 레이트 결정 정보는 상기 적어도 두개의 엔코더에 의해 생성된 품질 정보를 더 포함하는 신호의 그룹 엔코딩 장치.
  6. 제5항에 있어서, 상기 품질 정보는 상기 합성 분석 엔코더에 의해 생성된 지각 가중치 에러메트릭(perceptual weighting error metrics), 신호 대 잡음(S/N)비, 세그먼트화된 S/N, 켑스트럴 거리(cepstral distance), LPC 거리 측정값 및 BARK 스펙트럼 거리 측정값을 더 포함하는 신호의 그룹 엔코딩 장치.
  7. 제3항에 있어서, 상기 적어도 하나의 엔코더의 레이트를 결정하는 수단은 임계 기준에 기초하여 적여도 제1엔코더의 레이트를 결정하는 수단을 더 포함하는 신호의 그룹 엔코딩 장치.
  8. 제7항에 있어서, 상기 임계 기준은 상기 엔코더들이 할당되는 섹터/셀의 총 출력 전력, 인접 섹터/셀의 총 출력 전력, 서비스하는 기지국에 의한 현재의 전송 전력 레벨, 적어도 두개의 엔코더의 현재의 데이터 레이트, 메모리 수단에서 이용 가능한 메모리, 처리 수단에서 이용 가능한 처리 전력, 또는 선정된 스펙트럼에서 이용 가능한 대역폭을 더 포함하는 신호의 그룹 엔코딩 장치.
  9. 제3항에 있어서, 상기 적어도 두개의 엔코더는 적어도 두개의 가변 레이트 엔코더를 더 포함하는 신호의 그룹 엔코딩 장치.
  10. 제3항에 있어서, 상기 신호는 음성 신호, 영상 신호 또는 데이터 신호를 더 포함하는 신호의 그룹 엔코딩 장치.
KR1019950704514A 1994-02-17 1994-12-22 신호를 그룹 엔코딩하기 위한 방법 및 장치 KR100193196B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US19875094A 1994-02-17 1994-02-17
US08/198,750 1994-02-17
US8/198750 1994-02-17
PCT/US1994/014775 WO1995022818A1 (en) 1994-02-17 1994-12-22 Method and apparatus for group encoding signals

Publications (2)

Publication Number Publication Date
KR960702146A KR960702146A (ko) 1996-03-28
KR100193196B1 true KR100193196B1 (ko) 1999-06-15

Family

ID=22734667

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950704514A KR100193196B1 (ko) 1994-02-17 1994-12-22 신호를 그룹 엔코딩하기 위한 방법 및 장치

Country Status (11)

Country Link
US (1) US5761634A (ko)
EP (1) EP0699334B1 (ko)
JP (1) JP3779320B2 (ko)
KR (1) KR100193196B1 (ko)
CN (1) CN1129263C (ko)
CA (1) CA2157024C (ko)
DE (1) DE69429917T2 (ko)
FI (1) FI116180B (ko)
IL (1) IL112165A0 (ko)
RU (1) RU2129737C1 (ko)
WO (1) WO1995022818A1 (ko)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi
US7751370B2 (en) * 2001-07-13 2010-07-06 Qualcomm Incorporated Method and apparatus for forward link rate scheduling
US6175590B1 (en) * 1997-08-08 2001-01-16 Qualcomm Inc. Method and apparatus for determining the rate of received data in a variable rate communication system
AU8905598A (en) * 1997-08-13 1999-03-08 Qualcomm Incorporated Method and apparatus for interference cancellation for a high data rate user in a cdma system
US6389000B1 (en) * 1997-09-16 2002-05-14 Qualcomm Incorporated Method and apparatus for transmitting and receiving high speed data in a CDMA communication system using multiple carriers
KR100407342B1 (ko) * 1998-05-30 2003-11-28 삼성전자주식회사 부호분할다중접속 통신시스템의 통신장치 및 방법
US6034971A (en) * 1998-06-30 2000-03-07 Motorola, Inc. Method and apparatus for controlling communication system capacity
US7457415B2 (en) 1998-08-20 2008-11-25 Akikaze Technologies, Llc Secure information distribution system utilizing information segment scrambling
AU1524300A (en) * 1998-11-13 2000-06-05 Qualcomm Incorporated Closed-loop variable-rate multimode predictive speech coder
US6674807B1 (en) * 1999-01-21 2004-01-06 Samsung Electronics Co., Ltd. Communication apparatus and method for a CDMA communication system
US7023839B1 (en) * 1999-01-26 2006-04-04 Siemens Communications, Inc. System and method for dynamic codec alteration
US6757277B1 (en) 1999-01-26 2004-06-29 Siemens Information And Communication Networks, Inc. System and method for coding algorithm policy adjustment in telephony-over-LAN networks
JP2000295119A (ja) * 1999-04-06 2000-10-20 Toshiba Corp 無線送信機
EP1059782A3 (en) * 1999-06-10 2004-02-04 Lucent Technologies Inc. Method and apparatus for dynamically allocating bandwidth utilization in a packet telephony network
US6731734B1 (en) 1999-08-19 2004-05-04 Siemens Information & Communication Networks, Inc. Apparatus and method for intelligent conference call codec selection
US6483814B1 (en) * 1999-08-25 2002-11-19 Hrl Laboratories, Llc Channel-adaptive radio modem
CN1192567C (zh) 1999-09-09 2005-03-09 诺基亚公司 基于功率频谱密度估计的数据速率确定
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
KR100347752B1 (ko) * 2000-01-25 2002-08-09 주식회사 하이닉스반도체 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법
US7127390B1 (en) * 2000-02-08 2006-10-24 Mindspeed Technologies, Inc. Rate determination coding
US6856954B1 (en) * 2000-07-28 2005-02-15 Mindspeed Technologies, Inc. Flexible variable rate vocoder for wireless communication systems
US6731668B2 (en) * 2001-01-05 2004-05-04 Qualcomm Incorporated Method and system for increased bandwidth efficiency in multiple input—multiple output channels
US7076316B2 (en) 2001-02-02 2006-07-11 Nortel Networks Limited Method and apparatus for controlling an operative setting of a communications link
CA2399265C (en) * 2001-08-29 2007-02-06 At&T Corp. Multi-frequency data transmission channel power allocation
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
WO2005020210A2 (en) * 2003-08-26 2005-03-03 Sarnoff Corporation Method and apparatus for adaptive variable bit rate audio encoding
US20060007955A1 (en) * 2004-07-06 2006-01-12 Kotzin Michael D Communication network capacity allocation method
ES2365592T3 (es) 2005-09-29 2011-10-07 Syngenta Participations Ag Composiciones funguicidas.
AU2007312597B2 (en) 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
CA2874454C (en) 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
CN101572092B (zh) * 2008-04-30 2012-11-21 华为技术有限公司 编解码端的固定码本激励的搜索方法及装置
CN102723968B (zh) * 2012-05-30 2017-01-18 中兴通讯股份有限公司 一种提升空口容量的方法及装置
RU2480904C1 (ru) * 2012-06-01 2013-04-27 Анна Валерьевна Хуторцева Способ совместной фильтрации и дифференциальной импульсно-кодовой модуляции-демодуляции сигналов

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
GB8421498D0 (en) * 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
JPH0648796B2 (ja) * 1988-02-05 1994-06-22 日本電気株式会社 デマンドアサイン方式衛星通信装置
US4956871A (en) * 1988-09-30 1990-09-11 At&T Bell Laboratories Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
CA2032765C (en) * 1989-12-21 1995-12-12 Hidetaka Yoshikawa Variable rate encoding and communicating apparatus
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
US5659569A (en) * 1990-06-25 1997-08-19 Qualcomm Incorporated Data burst randomizer
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
US5204876A (en) * 1991-03-13 1993-04-20 Motorola, Inc. Method and apparatus for providing high data rate traffic channels in a spread spectrum communication system
US5159447A (en) * 1991-05-23 1992-10-27 At&T Bell Laboratories Buffer control for variable bit-rate channel
US5349645A (en) * 1991-12-31 1994-09-20 Matsushita Electric Industrial Co., Ltd. Word hypothesizer for continuous speech decoding using stressed-vowel centered bidirectional tree searches
IL104412A (en) * 1992-01-16 1996-11-14 Qualcomm Inc Method and instrument for the formation of data for transmission
US5383219A (en) * 1993-11-22 1995-01-17 Qualcomm Incorporated Fast forward link power control in a code division multiple access system

Also Published As

Publication number Publication date
KR960702146A (ko) 1996-03-28
IL112165A0 (en) 1995-03-15
EP0699334A4 (en) 1998-09-30
JPH08509348A (ja) 1996-10-01
DE69429917D1 (de) 2002-03-28
CN1129263C (zh) 2003-11-26
FI954622A0 (fi) 1995-09-29
RU2129737C1 (ru) 1999-04-27
CA2157024C (en) 1999-08-10
US5761634A (en) 1998-06-02
JP3779320B2 (ja) 2006-05-24
CN1121375A (zh) 1996-04-24
EP0699334A1 (en) 1996-03-06
CA2157024A1 (en) 1995-08-24
WO1995022818A1 (en) 1995-08-24
FI954622A (fi) 1995-09-29
EP0699334B1 (en) 2002-02-20
DE69429917T2 (de) 2002-07-18
FI116180B (fi) 2005-09-30

Similar Documents

Publication Publication Date Title
KR100193196B1 (ko) 신호를 그룹 엔코딩하기 위한 방법 및 장치
US8019599B2 (en) Speech codecs
EP1515308B1 (en) Multi-rate coding
EP1312230B1 (en) Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
KR100923891B1 (ko) 음성 비활동 동안에 보이스 송신 시스템들 사이에상호운용성을 제공하는 방법 및 장치
US7653539B2 (en) Communication device, signal encoding/decoding method
US6625226B1 (en) Variable bit rate coder, and associated method, for a communication station operable in a communication system
KR20010022187A (ko) 개선된 음성 인코더를 구비한 전송 시스템
JPH1097292A (ja) 音声信号伝送方法および不連続伝送システム
JP3513436B2 (ja) 送信機およびデジタル信号を受信機に送信するための方法
KR20020013962A (ko) 프레임 소거 상태에서 예측 음성 코더의 성능을 개선하기위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및장치
KR19990007936A (ko) 배터리 수명이 향상된 배터리 전원 무선 송수신기 및 그 작동방법
ES2371455T3 (es) Pre-procesamiento de datos digitales de audio para codecs de audio de móvil.
KR100752797B1 (ko) 음성 코더에서 선 스펙트럼 정보 양자화법을 인터리빙하는 방법 및 장치
Gardner et al. QCELP: A variable rate speech coder for CDMA digital cellular
JP4812230B2 (ja) 複数チャネル信号の符号化及び復号化
US20040243404A1 (en) Method and apparatus for improving voice quality of encoded speech signals in a network
US20050143979A1 (en) Variable-frame speech coding/decoding apparatus and method
KR20020013966A (ko) 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치
FI118703B (fi) Menetelmä ja laite äänenlaadun huononemisen lieventämiseksi viestintäjärjestelmässä
Sasaki et al. Voice activity detection and transmission error control for digital cordless telephone system
Viswanathan et al. Noisy-channel performance of 16 kb/s APC coders
LeBlanc et al. Low complexity, low delay speech coding for indoor wireless communications
JPWO2003021573A1 (ja) コーデック

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130130

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20140129

Year of fee payment: 16

EXPY Expiration of term