KR20090082495A - 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 시스템 및 방법 - Google Patents

제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 시스템 및 방법 Download PDF

Info

Publication number
KR20090082495A
KR20090082495A KR1020097012529A KR20097012529A KR20090082495A KR 20090082495 A KR20090082495 A KR 20090082495A KR 1020097012529 A KR1020097012529 A KR 1020097012529A KR 20097012529 A KR20097012529 A KR 20097012529A KR 20090082495 A KR20090082495 A KR 20090082495A
Authority
KR
South Korea
Prior art keywords
packet
rate
bits
bit rate
special
Prior art date
Application number
KR1020097012529A
Other languages
English (en)
Other versions
KR101164834B1 (ko
Inventor
비베크 라젠드란
아난타파드마나반 에이 칸드하다이
Original Assignee
퀄컴 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 퀄컴 인코포레이티드 filed Critical 퀄컴 인코포레이티드
Publication of KR20090082495A publication Critical patent/KR20090082495A/ko
Application granted granted Critical
Publication of KR101164834B1 publication Critical patent/KR101164834B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/16Central resource management; Negotiation of resources or communication parameters, e.g. negotiating bandwidth or QoS [Quality of Service]
    • H04W28/18Negotiating wireless communication parameters
    • H04W28/22Negotiating communication rate
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Communication Control (AREA)
  • Telephonic Communication Services (AREA)

Abstract

제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 방법이 기재되어 있다. 제 1 패킷이 수신된다. 제 1 패킷은 분석되어, 제 1 패킷과 연관된 제 1 비트 레이트를 결정한다. 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트가 폐기된다. 하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자가 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹된다. 제 2 패킷이 송신된다.
비트 레이트, 디밍, 프로토타입 피치 주기 (PPP), 코드 여기 선형 예측 (CELP), 잡음 여기 선형 예측 (NELP)

Description

제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 시스템 및 방법{SYSTEMS AND METHODS FOR DIMMING A FIRST PACKET ASSOCIATED WITH A FIRST BIT RATE TO A SECOND PACKET ASSOCIATED WITH A SECOND BIT RATE}
기술분야
본 시스템 및 방법은 일반적으로 음성 처리 기술에 관한 것이다. 보다 상세하게는, 본 시스템 및 방법은 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 것에 관한 것이다.
배경기술
디지털 기술에 의한 음성의 전송은 특히 장거리 및 디지털 무선 전화 애플리케이션에서 광범위하게 되었다. 이는 다음에 복원된 음성의 지각 품질 (perceived quality) 을 유지하면서 채널을 통해 송신될 수 있는 최소 정보량을 결정하는데 있어서 관심을 생성하였다. 음성을 압축하기 위한 디바이스는 다수의 전기 통신 분야에서의 용도를 발견한다. 전기 통신의 일례는 무선 통신이다. 무선 통신 분야는, 예를 들어 코드리스 전화, 페이저, 무선 가입자 회선 (WLL), 셀룰러 및 PCS (Portable Communication System) 전화 시스템과 같은 무선 텔레포 니, 모바일 인터넷 프로토콜 (IP) 텔레포니 및 위성 통신 시스템을 포함하여 다수의 애플리케이션을 갖는다. 특히, 중요한 애플리케이션은 모바일 가입자를 위한 무선 텔레포니이다.
도면의 간단한 설명
도 1 은 무선 통신 시스템의 일 구성을 도시한 도면이다.
도 2 는 신호 전송 환경의 일 구성을 도시한 블록도이다.
도 3 은 다중모드 디코더와 통신하는 다중모드 인코더의 일 구성을 도시한 블록도이다.
도 4 는 IWF (Inter-Working Function) 의 일 구성을 도시한 블록도이다.
도 5 는 가변 레이트 음성 코딩 방법의 일 구성을 도시한 흐름도이다.
도 6 은 패킷 디밍 방법의 일 구성을 도시한 흐름도이다.
도 6a 는 패킷을 디코딩하는 일 구성을 도시한 흐름도이다.
도 7a 는 서브프레임으로 분할된 유성 음성 (voiced speech) 의 일 프레임을 도시한 도면이다.
도 7b 는 서브프레임으로 분할된 무성 음성 (unvoiced speech) 의 일 프레임을 도시한 도면이다.
도 7c 는 서브프레임으로 분할된 과도 음성 (transient speech) 의 일 프레임을 도시한 도면이다.
도 8 은 프로토타입 피치 주기 (Prototype Pitch Period: PPP) 코딩 기술의 원리를 도시한 그래프이다.
도 9 는 각종 패킷 타입에 할당된 비트 수를 도시한 차트이다.
도 10 은 풀-레이트 PPP 패킷의 특수 하프-레이트 PPP 패킷으로의 변환의 일 구성을 도시한 블록도이다.
도 11 은 통신 디바이스의 일 구성에서의 특정 컴포넌트의 블록도이다.
상세한 설명
제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 방법이 기재되어 있다. 제 1 패킷이 수신된다. 제 1 패킷은 분석되어, 제 1 패킷과 연관된 제 1 비트 레이트를 결정한다. 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트가 폐기된다. 하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자가 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹된다. 제 2 패킷이 송신된다.
또한, 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 장치가 기재되어 있다. 이 디밍 장치는 프로세서 및 이 프로세서와 전자 통신하는 메모리를 포함한다. 이 메모리에 명령들이 저장되어 있다. 이 명령들은, 제 1 패킷을 수신하고; 제 1 패킷을 분석하여, 제 1 패킷과 연관된 제 1 비트 레이트를 결정하고; 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트를 폐기하고; 하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자를 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹하고; 제 2 패킷을 송신하도록 실행가능하다.
또한, 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하도록 구성되는 시스템이 기재되어 있다. 이 디밍 시스템은 처리 수단 및 제 1 패킷을 수신하는 수단을 포함한다. 제 1 패킷을 분석하여, 제 1 패킷과 연관된 제 1 비트 레이트를 결정하는 수단; 및 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트를 폐기하는 수단이 기재되어 있다. 하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자를 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹하는 수단; 및 제 2 패킷을 송신하는 수단도 기재되어 있다.
또한, 컴퓨터 판독가능 매체가 기재되어 있다. 이 컴퓨터 판독가능 매체는, 제 1 패킷을 수신하고; 제 1 패킷을 분석하여, 제 1 패킷과 연관된 제 1 비트 레이트를 결정하고; 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트를 폐기하고; 하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자를 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹하고; 제 2 패킷을 송신하도록 실행가능한 명령들 세트를 저장하도록 구성된다.
또한, 패킷을 디코딩하는 방법이 기재되어 있다. 패킷이 수신된다. 이 패킷에 포함된 특수 식별자가 판독된다. 이 패킷이 제 1 비트 레이트와 연관된 제 1 패킷으로부터 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍되었다는 것이 발견된다. 패킷에 대한 디코딩 모드가 선택된다.
또한, 풀-레이트로부터 하프-레이트로 패킷을 디밍하는 방법이 기재되어 있 다. 풀-레이트 패킷이 수신된다. 풀-레이트 패킷으로부터 파라미터와 연관된 비트를 폐기함으로써, 풀-레이트 패킷이 하프-레이트 패킷으로 디밍된다. 시그널링 정보와 연관된 비트와 함께 하프-레이트 패킷이 패킹된다. 하프-레이트 패킷이 디코더로 송신된다.
이하, 도면을 참조하여 본 시스템 및 방법의 각종 구성이 설명되는데, 이들 도면에서 동일한 참조부호는 동일하거나 기능적으로 유사한 구성요소를 지시한다. 일반적으로 본 명세서에서 도면에 예시 및 설명된 바와 같은 본 시스템 및 방법의 특징은 각종 상이한 구성으로 배열 및 디자인될 수 있다. 따라서, 아래의 상세한 설명은 청구된 바와 같이 본 시스템 및 방법의 범위를 제한하도록 의도되지는 않고, 단지 본 시스템 및 방법의 구성을 대표한다.
본 명세서에 개시된 구성의 다수의 특징은 컴퓨터 소프트웨어, 전자 하드웨어, 또는 이들의 조합으로 구현될 수도 있다. 이러한 하드웨어와 소프트웨어의 상호교환성 (interchangeability) 을 명확하게 나타내기 위해서, 각종 컴포넌트가 일반적으로 그 기능성 면에서 설명될 것이다. 이러한 기능성이 하드웨어로 구현되는지 또는 소프트웨어로 구현되는지 여부는 시스템 전체에 부과된 디자인 제약 및 특정 애플리케이션에 종속한다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 설명된 기능성을 각 특정 애플리케이션에 대해 상이한 방식으로 구현할 수도 있지만, 이러한 구현 결정은 본 시스템 및 방법의 범위로부터의 벗어남을 야기하는 것으로서 해석되어서는 안 된다.
설명된 기능성이 컴퓨터 소프트웨어로 구현되는 경우, 이러한 소프트웨어는, 시스템 버스나 네트워크를 통해 전자 신호로서 송신되고/되거나 메모리 디바이스 내에 위치한 컴퓨터 명령 또는 컴퓨터 실행가능 코드 중 임의의 타입을 포함할 수도 있다. 본 명세서에 기재된 컴포넌트와 연관된 기능성을 구현하는 소프트웨어는 단일 명령 또는 다수의 명령들을 포함할 수도 있고, 몇몇 상이한 코드 세그먼트에 걸쳐, 상이한 프로그램들 사이에서, 그리고 몇몇 메모리 디바이스에 걸쳐 분산될 수도 있다.
본 명세서에 이용된 바와 같이, "일 구성", "구성", "구성들", "그 구성", "그 구성들", "하나 이상의 구성들", "몇몇 구성들", "특정 구성들", "하나의 구성", "또다른 구성" 등이라는 용어는, 다른 방법으로 명백히 특정되지 않는 한, "개시된 시스템 및 방법의 하나 이상의 구성 (반드시 모두는 아님)" 을 의미한다.
"결정" (및 그 문법상 변형물) 이라는 용어는 매우 넓은 의미로 이용된다. "결정" 이라는 용어는 광범위한 동작을 포함하므로, "결정" 은 계산, 컴퓨팅, 처리, 도출, 조사, 룩업 (예를 들어, 테이블, 데이터베이스 또는 또다른 데이터 구조에서의 룩업), 확인 등을 포함할 수 있다. 또한, "결정" 은 수신 (예를 들어, 정보의 수신), 액세스 (예를 들어, 메모리 내의 데이터에 액세스) 등을 포함할 수 있다. 또한, "결정" 은 결의 (resolving), 선택, 선정, 확립 등을 포함할 수 있다.
"~ 에 기초한다" 라는 어구는, 다른 방법으로 명백히 특정되지 않는 한, "~ 에만 기초한다" 를 의미하지는 않는다. 다시 말하면, "~ 에 기초한다" 라는 어구는 "~ 에만 기초한다" 및 "~ 에 적어도 기초한다" 모두를 기술한다.
셀룰러 네트워크는, 고정형 송신기에 의해 각각 서비스되는 다수의 셀로 이루어진 무선 네트워크를 포함할 수도 있다. 이들 다수의 송신기는 셀 사이트 또는 기지국으로 언급될 수도 있다. 셀은 통신 채널을 통해 기지국으로 음성 신호를 송신함으로써 네트워크에서의 다른 셀과 통신할 수도 있다. 셀은 음성 신호를 다수의 프레임 (예를 들어, 20 밀리초 (㎳) 의 음성 신호) 으로 분할할 수도 있다. 각 프레임은 패킷으로 인코딩될 수도 있다. 패킷은 특정 비트량을 포함할 수도 있는데, 이는 다음에 통신 채널에 걸쳐 수신 기지국 또는 수신 셀로 송신된다. 수신 기지국 또는 수신 셀은 패킷을 패킹해제하고, 각종 프레임을 디코딩하여 신호를 복원할 수도 있다.
기지국에서의 IWF (Inter-Working Function) 는, 통신 채널에 걸쳐 패킷을 송신하기 이전에 풀-레이트 (171 비트) 패킷을 하프-레이트 (80 비트) 패킷으로 "디밍" 할 수도 있다. 디밍은, 풀-레이트 프로토타입 피치 주기 (PPP) 패킷 및 풀-레이트 코드 여기 선형 예측 (Code Excited Linear Prediction: CELP) 패킷을 포함하여 각종 패킷 타입에 대해 구현될 수도 있다.
풀-레이트 패킷을 하프-레이트 패킷으로 디밍한 이후에, 하프-레이트 패킷에 시그널링 정보가 부가될 수도 있다. 디밍 이후에 점유해제될 수도 있는 비트는, 핸드오프, 송신 전력을 증가시키는 메시지 등과 같은 부가적인 시그널링 정보를 전달하는데 이용될 수도 있다. 디밍된 음성 정보 및 시그널링 정보를 포함할 수도 있는 결과적인 패킷은 풀-레이트 패킷으로서 디코더로 송신될 수도 있다.
또한, 높은 비트량으로 송신되는 패킷은 셀룰러 네트워크의 용량을 감소시킬 수도 있다. 복원된 음성 신호의 품질은 기지국에서 패킷 레벨 디밍을 수행함으로써 개선될 수도 있다. 풀-레이트 PPP 패킷 및 풀-레이트 CELP 패킷을 특수 하프-레이트 PPP 패킷 및 특수 하프-레이트 CELP 패킷으로 변환 (또는 디밍) 하여, 이들 특수 하프-레이트 패킷을 디코더로 송신하는 것은, 풀-레이트 PPP 패킷 또는 풀-레이트 CELP 패킷의 소거와 비교하여 디코더에서 복원된 음성 신호의 품질을 개선할 수도 있다. 또한, 풀-레이트 패킷의 디밍은 네트워크 트래픽을 감소시킬 수도 있다.
도 1 은 복수의 모바일 가입자 유닛 (102) 또는 이동국 (102), 복수의 기지국 (104) 및 기지국 제어기 (BSC ; 106) 및 이동 전화 교환국 (MSC ; 108) 을 포함할 수도 있는 코드 분할 다중 접속 (CDMA) 무선 전화 시스템 (100) 을 도시한 도면이다. MSC (108) 는 통상적인 일반 전화 교환망 (PSTN ; 110) 과 인터페이스하도록 구성될 수도 있다. 또한, MSC (108) 는 BSC (106) 와 인터페이스하도록 구성될 수도 있다. 전화 시스템 (100) 내에 2 이상의 BSC (106) 가 존재할 수도 있다. 각 기지국 (104) 은 적어도 하나의 섹터 (도시되지 않음) 를 포함할 수도 있는데, 각 섹터는 무지향성 안테나 또는 기지국 (104) 으로부터 떨어져 방사상으로 특정 방향을 향하는 안테나를 가질 수도 있다. 대안적으로, 각 섹터는 다이버시티 수신을 위한 2 개의 안테나를 포함할 수도 있다. 각 기지국 (104) 은 복수의 주파수 할당을 지원하도록 디자인될 수도 있다. 주파수 할당과 섹터의 교점은 CDMA 채널로 언급될 수도 있다. 모바일 가입자 유닛 (102) 은 셀룰러 또는 PCS (Portable Communication System) 전화기를 포함할 수도 있다.
셀룰러 전화 시스템 (100) 의 동작 중에, 기지국 (104) 은 이동국 (102) 세트로부터 역방향 링크 신호 세트를 수신할 수도 있다. 이동국 (102) 은 전화 통화 또는 다른 통신을 수행하고 있을 수도 있다. 주어진 기지국 (104) 에 의해 수신된 각 역방향 링크 신호는 이 기지국 (104) 내에서 처리될 수도 있다. 결과적인 데이터는 BSC (106) 로 포워딩될 수도 있다. BSC (106) 는 기지국들 (104) 사이의 소프트 핸드오프의 조정을 포함하여 이동성 관리 기능성 및 호 리소스 할당을 제공할 수도 있다. 또한, BSC (106) 는 수신된 데이터를 MSC (108) 로 라우팅할 수도 있는데, 이 MSC (108) 는 PSTN (110) 과의 인터페이스에 대해 부가적인 라우팅 서비스를 제공한다. 유사하게, PSTN (110) 은 MSC (108) 와 인터페이스할 수도 있고, MSC (108) 는 BSC (106) 와 인터페이스할 수도 있는데, 이 BSC (106) 는 다음에 이동국 (102) 세트로 순방향 링크 신호 세트를 송신하도록 기지국 (104) 을 제어할 수도 있다.
도 2 는 인코더 (202), 디코더 (204), 전송 매체 (206) 및 IWF (Inter-working Function ; 208) 를 포함하는 신호 전송 환경 (200) 을 도시한 도면이다. 인코더 (202) 는 이동국 (102) 내에 또는 기지국 (104) 내에 구현될 수도 있다. IWF (208) 는 기지국 (104) 내에 구현될 수도 있다. 디코더 (204) 는 기지국 (104) 내에 또는 이동국 (102) 내에 구현될 수도 있다. 인코더 (202) 는 음성 신호 s(n) (210) 을 인코딩하여, 인코딩된 음성 신호 senc(n) (212) 을 형성할 수도 있다. 인코딩된 음성 신호 (212) 는 전송 매체 (206) 에 걸쳐 디코더 (204) 로 전송하기 위해 특수 인코딩된 패킷 spenc(n) (214) 으로 변환될 수도 있다. 디코더 (204) 는 spenc(n) (214) 을 패킹해제하고, senc(n) (212) 을 디코딩함으로써, 합성된 음성 신호
Figure 112009036536422-PCT00001
(216) 을 발생시킬 수도 있다.
본 명세서에 이용된 바와 같은 "코딩" 이라는 용어는 일반적으로 인코딩 및 디코딩 모두를 포함하는 방법을 언급할 수도 있다. 일반적으로, 코딩 시스템, 방법 및 장치는, 수락가능한 음성 재생을 유지하면서 (즉, s(n) (210)
Figure 112009036536422-PCT00002
Figure 112009036536422-PCT00003
(216)) 전송 매체 (206) 를 통해 전송된 비트 수를 최소화 (즉, spenc(n) (214) 의 대역폭을 최소화) 하려고 한다. 이 장치는 모바일 전화기, PDA (Personal Digital Assistant), 랩톱 컴퓨터, 디지털 카메라, 뮤직 플레이어, 게임 디바이스, 기지국, 또는 프로세서를 갖는 임의의 다른 디바이스일 수도 있다. 인코딩된 음성 신호 (212) 의 구성은 인코더 (202) 에 의해 이용되는 특정 음성 코딩 모드에 따라 변할 수도 있다. 각종 코딩 모드가 후술된다.
후술되는 인코더 (202), 디코더 (204) 및 IWF (208) 의 컴포넌트는 전자 하드웨어, 컴퓨터 소프트웨어, 또는 이들의 조합으로 구현될 수도 있다. 이들 컴포넌트는 그 기능성 면에서 후술된다. 이러한 기능성이 하드웨어로 구현되는지 또는 소프트웨어로 구현되는지 여부는 시스템 전체에 부과된 디자인 제약 및 특정 애플리케이션에 종속할 수도 있다. 전송 매체 (206) 는, 지상-기반 통신 라인, 기지국과 위성 사이의 링크, 셀룰러 전화기와 기지국 사이 또는 셀룰러 전화기와 위성 사이의 무선 통신을 포함하여 다수의 상이한 전송 매체를 나타낼 수도 있지 만, 이에 제한되지는 않는다.
각 통신 파티는 데이터를 송신할 수도 있을 뿐만 아니라 데이터를 수신할 수도 있다. 각 파티는 인코더 (202) 및 디코더 (204) 를 사용할 수도 있다. 그러나, 신호 전송 환경 (200) 은, 전송 매체 (206) 의 일단에는 인코더 (202) 를 포함하며 타단에는 디코더 (204) 를 포함하는 것으로 후술될 것이다.
이 설명을 목적으로, s(n) (210) 은 상이한 성음 및 무음 (silence) 주기를 포함한 통상적인 대화 중에 획득된 디지털 음성 신호를 포함할 수도 있다. 음성 신호 s(n) (210) 은 프레임으로 파티셔닝될 수도 있고, 각 프레임은 서브프레임으로 더 파티셔닝될 수도 있다. 이들 임의로 선택된 프레임/서브프레임 경계는, 몇몇 블록 처리가 수행되는 경우에 이용될 수도 있다. 또한, 프레임에 대해 수행되고 있는 것으로서 기재된 동작은 서브프레임에 대해 수행될 수도 있고, 이 점에서 프레임 및 서브프레임은 본 명세서에서 상호교환가능하게 이용된다. 그러나, s(n) (210) 은, 블록 처리보다는 연속적 처리가 구현되는 경우에 프레임/서브프레임으로 파티셔닝되지 않을 수도 있다. 이로서, 후술되는 블록 기술은 연속적 처리로 확장될 수도 있다.
신호 s(n) (210) 은 8 킬로헤르츠 (㎑) 로 디지털 샘플링될 수도 있다. 각 프레임은 20 밀리초 (㎳) 의 데이터 또는 8 ㎑ 레이트로 샘플링된 160 개의 샘플을 포함할 수도 있다. 각 서브프레임은 53 또는 54 개의 데이터 샘플을 포함할 수도 있다. 이들 파라미터가 음성 코딩에 적절할 수도 있지만, 이들은 단지 예시이며 다른 적합한 대안적인 파라미터가 이용될 수 있다.
도 3 은 통신 채널 (306) 에 걸쳐 다중모드 디코더 (304) 와 통신하는 다중모드 인코더 (302) 의 일 구성을 도시한 블록도이다. 통신 채널 (306) 은 무선 주파수 (RF) 인터페이스를 포함할 수도 있다. 인코더 (302) 는 연관된 디코더 (도시되지 않음) 를 포함할 수도 있다. 인코더 (302) 및 그 연관된 디코더는 제 1 음성 코더를 형성할 수도 있다. 디코더 (304) 는 연관된 인코더 (도시되지 않음) 를 포함할 수도 있다. 디코더 (304) 및 그 연관된 인코더는 제 2 음성 코더를 형성할 수도 있다.
인코더 (302) 는 초기 파라미터 계산 모듈 (318), 레이트 결정 모듈 (320), 모드 분류 모듈 (322), 복수의 인코딩 모드 (324, 326, 328), 및 패킷 포맷팅 모듈 (330) 을 포함할 수도 있다. 인코딩 모드 (324, 326, 328) 의 개수는 N 으로 도시되어 있는데, 이는 임의의 개수의 인코딩 모드 (324, 326, 328) 를 나타낼 수도 있다. 단순화를 위해, 3 개의 인코딩 모드 (324, 326, 328) 가 도시되어 있는데, 여기서 점선은 다른 인코딩 모드의 존재를 나타낸다.
디코더 (304) 는 패킷 분해기 모듈 (332), 복수의 디코딩 모드 (334, 336, 338), 및 포스트 필터 (340) 를 포함할 수도 있다. 디코딩 모드 (334, 336, 338) 의 개수는 N 으로 도시되어 있는데, 이는 임의의 개수의 디코딩 모드 (334, 336, 338) 를 나타낼 수도 있다. 단순화를 위해, 3 개의 디코딩 모드 (334, 336, 338) 가 도시되어 있는데, 여기서 점선은 다른 디코딩 모드의 존재를 나타낸다.
음성 신호 s(n) (310) 은 초기 파라미터 계산 모듈 (318) 로 제공될 수도 있 다. 음성 신호 (310) 는 프레임으로 언급된 샘플 블록으로 분할될 수도 있다. 값 n 은 프레임 번호를 나타낼 수도 있고, 또는 값 n 은 프레임에서의 샘플 번호를 나타낼 수도 있다. 대안적인 구성에 있어서, 선형 예측 (LP) 잔여 에러 신호가 음성 신호 (310) 대신에 이용될 수도 있다. LP 잔여 에러 신호는 코드 여기 선형 예측 (CELP) 코더와 같은 음성 코더에 의해 이용될 수도 있다.
초기 파라미터 계산 모듈 (318) 은 현재의 프레임에 기초하여 각종 파라미터를 도출할 수도 있다. 일 양태에 있어서, 이들 파라미터는, 선형 예측 코딩 (LPC) 필터 계수, LSP (Line Spectral Pair) 계수, NACF (Normalized Autocorrelation Function), 개방-루프 래그, 제로 크로싱 레이트, 대역 에너지, 및 포먼트 잔여 신호 중 적어도 하나를 포함한다.
초기 파라미터 계산 모듈 (318) 은 모드 분류 모듈 (322) 에 연결될 수도 있다. 모드 분류 모듈 (322) 은 인코딩 모드들 (324, 326, 328) 사이에서 동적으로 스위칭할 수도 있다. 초기 파라미터 계산 모듈 (318) 은 모드 분류 모듈 (322) 로 파라미터를 제공할 수도 있다. 모드 분류 모듈 (322) 은 레이트 결정 모듈 (320) 에 연결될 수도 있다. 레이트 결정 모듈 (320) 은 레이트 커맨드 신호를 수락할 수도 있다. 레이트 커맨드 신호는 특정 레이트로 음성 신호 (310) 를 인코딩하도록 인코더 (302) 에 지시할 수도 있다. 일 양태에 있어서, 특정 레이트는, 음성 신호 (310) 가 171 비트를 이용하여 코딩되어야 한다는 것을 나타낼 수도 있는 풀-레이트를 포함한다. 또다른 실시예에 있어서, 특정 레이트는, 음성 신호 (310) 가 80 비트를 이용하여 코딩되어야 한다는 것을 나타낼 수 도 있는 하프-레이트를 포함한다. 추가 실시예에 있어서, 특정 레이트는, 음성 신호 (310) 가 16 비트를 이용하여 코딩되어야 한다는 것을 나타낼 수도 있는 1/8 레이트를 포함한다.
전술한 바와 같이, 모드 분류 모듈 (322) 은 프레임 단위로 인코딩 모드들 (324, 326, 328) 사이에서 동적으로 스위칭하도록 연결되어, 현재의 프레임에 대해 가장 적절한 인코딩 모드 (324, 326, 328) 를 선택할 수도 있다. 모드 분류 모듈 (322) 은 사전정의된 임계값 및/또는 최고값 (ceiling value) 과 파라미터를 비교함으로써 현재의 프레임에 대한 특정 인코딩 모드 (324, 326, 328) 를 선택할 수도 있다. 또한, 모드 분류 모듈 (322) 은 레이트 결정 모듈 (320) 로부터 수신된 레이트 커맨드 신호에 기초하여 특정 인코딩 모드 (324, 326, 328) 를 선택할 수도 있다. 예를 들어, 인코딩 모드 A (324) 는 171 비트를 이용하여 음성 신호 (310) 를 인코딩할 수도 있는 한편, 인코딩 모드 B (326) 는 80 비트를 이용하여 음성 신호 (310) 를 인코딩할 수도 있다.
프레임의 에너지량 (energy content) 에 기초하여, 모드 분류 모듈 (322) 은 프레임을 비음성, 또는 비활성 음성 (예를 들어, 무음, 배경 잡음, 또는 워드들 사이의 휴지 (pause)), 또는 음성으로 분류할 수도 있다. 프레임의 주기성에 기초하여, 모드 분류 모듈 (322) 은 음성 프레임을 특정 음성 타입, 예를 들어 유성, 무성, 또는 과도로 분류할 수도 있다.
유성 음성은, 비교적 고도의 주기성을 나타내는 음성을 포함할 수도 있다. 유성 음성 (702) 의 세그먼트가 도 7a 의 그래프에 도시되어 있다. 예시된 바와 같이, 피치 주기는, 프레임의 콘텐츠를 분석 및 복원하는데 이용될 수도 있는 음성 프레임의 성분일 수도 있다. 무성 음성은 자음을 포함할 수도 있다. 무성 음성 (704) 의 세그먼트가 도 7b 의 그래프에 도시되어 있다. 과도 음성 프레임은 유성 음성과 무성 음성 사이의 변천물 (transitions) 을 포함할 수도 있다. 과도 음성 (706) 의 세그먼트가 도 7c 의 그래프에 도시되어 있다. 유성 음성으로도 무성 음성으로도 분류되지 않는 프레임은 과도 음성으로 분류될 수도 있다. 도 7a, 도 7b 및 도 7c 에 도시된 그래프는 보다 상세하게 후술될 것이다.
음성 프레임의 분류는 상이한 인코딩 모드 (324, 326, 328) 가 상이한 음성 타입을 인코딩하는데 이용되는 것을 허용할 수도 있는데, 이는 통신 채널 (306) 과 같은 공유 채널에서의 대역폭의 보다 효율적인 이용을 야기한다. 예를 들어, 유성 음성이 주기적이고, 그에 따라 고예측성이기 때문에, 저비트 레이트의 고예측성 인코딩 모드 (324, 326, 328) 가 유성 음성을 인코딩하는데 이용될 수도 있다.
모드 분류 모듈 (322) 은 프레임의 분류에 기초하여 현재의 프레임에 대한 인코딩 모드 (324, 326, 328) 를 선택할 수도 있다. 각종 인코딩 모드 (324, 326, 328) 는 병렬로 연결될 수도 있다. 인코딩 모드 (324, 326, 328) 중 하나 이상은 임의의 주어진 시간에 동작할 수도 있다. 일 구성에 있어서, 현재의 프레임의 분류에 따라 하나의 인코딩 모드 (324, 326, 328) 가 선택된다.
상이한 인코딩 모드 (324, 326, 328) 는 상이한 코딩 비트 레이트, 상이한 코딩 방식, 또는 코딩 비트 레이트와 코딩 방식의 상이한 조합에 따라 동작할 수도 있다. 전술한 바와 같이, 이용되는 각종 코딩 레이트는 풀 레이트, 하프 레이트, 1/4 레이트, 및/또는 1/8 레이트일 수도 있다. 이용되는 각종 코딩 방식은 CELP 코딩, 프로토타입 피치 주기 (PPP) 코딩 (또는 파형 보간 (WI) 코딩), 및/또는 잡음 여기 선형 예측 (NELP) 코딩일 수도 있다. 따라서, 예를 들어, 특정 인코딩 모드 (324, 326, 328) 는 풀 레이트 CELP 일 수도 있고, 또다른 인코딩 모드 (324, 326, 328) 는 하프-레이트 CELP 일 수도 있고, 또다른 인코딩 모드 (324, 326, 328) 는 1/4 레이트 PPP 일 수도 있고, 또다른 인코딩 모드 (324, 326, 328) 는 NELP 일 수도 있다.
CELP 인코딩 모드 (324, 326, 328) 에 따르면, 선형 예측 성도 모델은 LP 잔여 신호의 양자화된 버전을 이용하여 여기될 수도 있다. CELP 인코딩 모드에 있어서, 현재의 프레임 전체가 양자화될 수도 있다. CELP 인코딩 모드 (324, 326, 328) 는 비교적 정확한 음성 재생을 제공하지만, 비교적 높은 코딩 비트 레이트를 희생할 수도 있다. CELP 인코딩 모드 (324, 326, 328) 는 과도 음성으로 분류된 프레임을 인코딩하는데 이용될 수도 있다.
NELP 인코딩 모드 (324, 326, 328) 에 따르면, 필터링된 의사 랜덤 잡음 신호가 LP 잔여 신호를 모델링하는데 이용될 수도 있다. NELP 인코딩 모드 (324, 326, 328) 는 저비트 레이트를 달성하는 비교적 단순한 기술일 수도 있다. NELP 인코딩 모드 (324, 326, 328) 는 무성 음성으로 분류된 프레임을 인코딩하는데 이용될 수도 있다.
PPP 인코딩 모드 (324, 326, 328) 에 따르면, 각 프레임 내의 피치 주기의 서브세트가 인코딩될 수도 있다. 음성 신호의 나머지 주기는 이들 프로토타입 주기들 사이에서의 보간에 의해 복원될 수도 있다. PPP 코딩의 시간-도메인 구현에 있어서, 현재의 프로토타입 주기에 근사하도록 이전의 프로토타입 주기를 변경하는 방법을 기술하는 파라미터의 제 1 세트가 계산될 수도 있다. 합산되는 경우에 현재의 프로토타입 주기와 변경된 이전의 프로토타입 주기 사이의 차이에 근사하는 하나 이상의 코드벡터가 선택될 수도 있다. 파라미터의 제 2 세트는 이들 선택된 코드벡터를 기술한다. PPP 코딩의 주파수-도메인 구현에 있어서, 프로토타입의 진폭 및 위상 스펙트럼을 기술하도록 파라미터 세트가 계산될 수도 있다. 이 PPP 코딩의 구현에 따르면, 디코더 (304) 는 진폭 및 위상을 기술하는 파라미터 세트에 기초하여 현재의 프로토타입을 복원함으로써 출력 음성 신호 (316) 를 합성할 수도 있다. 음성 신호는 현재의 복원된 프로토타입 주기와 이전의 복원된 프로토타입 주기 사이의 영역에 걸쳐 보간될 수도 있다. 프로토타입은, 디코더 (304) 에서 LP 잔여 신호 또는 음성 신호 (310) 를 복원하기 위해서 프레임 내에 유사하게 위치되었던 이전의 프레임으로부터의 프로토타입을 이용하여 선형 보간되는 현재의 프레임의 일부를 포함할 수도 있다 (즉, 과거의 프로토타입 주기는 현재의 프로토타입 주기의 예측자로서 이용된다).
전체 음성 프레임보다는 프로토타입 주기를 코딩하는 것은 코딩 비트 레이트를 감소시킬 수도 있다. 유성 음성으로 분류된 프레임은 PPP 인코딩 모드 (324, 326, 328) 로 유리하게 코딩될 수도 있다. 도 7a 에 도시된 바와 같이, 유성 음성은, PPP 인코딩 모드 (324, 326, 328) 에 의해 이용되는 저속 시변 주기 적 성분을 포함할 수도 있다. 유성 음성의 주기성을 이용함으로써, PPP 인코딩 모드 (324, 326, 328) 는 CELP 인코딩 모드 (324, 326, 328) 보다 저비트 레이트를 달성할 수도 있다.
선택된 인코딩 모드 (324, 326, 328) 는 패킷 포맷팅 모듈 (330) 에 연결될 수도 있다. 선택된 인코딩 모드 (324, 326, 328) 는 현재의 프레임을 인코딩 또는 양자화하여, 양자화된 프레임 파라미터 (312) 를 패킷 포맷팅 모듈 (330) 로 제공할 수도 있다. 패킷 포맷팅 모듈 (330) 은 양자화된 프레임 파라미터 (312) 를 포맷팅된 패킷 (313) 으로 조립할 수도 있다. 패킷 포맷팅 모듈 (330) 은 IWF (308) 에 연결될 수도 있다. 패킷 포맷팅 모듈 (330) 은 포맷팅된 패킷 (313) 을 IWF (308) 로 제공할 수도 있다. IWF (308) 는 포맷팅된 패킷 (313) 을 특수 패킷 (314) 으로 변환할 수도 있다. 일 실시예에 있어서, 포맷팅된 패킷 (313) 은 CELP, PPP 또는 NELP 인코딩 모드 (324, 326, 328) 에 의해 인코딩된 풀-레이트 패킷을 포함한다. IWF (308) 는 풀-레이트 포맷팅된 패킷 (313) 을 특수 하프-레이트 패킷 (314) 으로 변환할 수도 있다. 다시 말하면, 풀-레이트 포맷팅된 패킷 (171 비트) (313) 은 80 비트를 포함하는 하프-레이트 패킷으로 변환될 수도 있다. 하프-레이트 패킷은 정확하게 풀-레이트 패킷의 비트 수의 절반을 가질 필요는 없다. IWF (308) 는 특수 하프-레이트 패킷 (314) 을 송신기 (도시되지 않음) 로 제공할 수도 있고, 특수 패킷 (314) 은 아날로그 포맷으로 변환되고, 변조되어, 통신 채널 (306) 을 통해 수신기 (또한 도시되지 않음) 로 송신될 수도 있는데, 이 수신기는 특수 패킷 (314) 을 수신, 복조 및 디지 털화하여, 이 특수 패킷 (314) 을 디코더 (304) 로 제공한다.
디코더 (304) 에 있어서, 패킷 분해기 모듈 (332) 은 수신기로부터 특수 패킷 (314) 을 수신한다. 패킷 분해기 모듈 (332) 은 특수 패킷 (314) 을 패킹해제하여, 이 특수 패킷 (314) 이 풀-레이트로부터 하프-레이트 패킷으로 변환되었다는 것을 발견할 수도 있다. 패킷 분해기 모듈 (332) 은, 특수 패킷에 포함된 특수 식별자를 판독함으로써 특수 패킷이 변환되었다는 것을 발견할 수도 있다. 또한, 패킷 분해기 모듈 (332) 은 패킷 단위로 디코딩 모드들 (334, 336, 338) 사이에서 동적으로 스위칭하도록 연결될 수도 있다. 디코딩 모드 (334, 336, 338) 의 개수는 인코딩 모드 (324, 326, 328) 의 개수와 동일할 수도 있다. 각 넘버링된 인코딩 모드 (324, 326, 328) 는, 동일한 코딩 비트 레이트 및 코딩 방식을 이용하도록 구성된 각각의 유사하게 넘버링된 디코딩 모드 (334, 336, 338) 와 연관될 수도 있다.
패킷 분해기 모듈 (332) 이 특수 패킷 (314) 을 검출하는 경우에는, 특수 패킷 (314) 은 분해되어, 관련된 디코딩 모드 (334, 336, 338) 로 제공된다. 패킷 분해기 모듈 (332) 이 패킷을 검출하지 못한 경우에는, 패킷 손실이 선언되고, 소거 디코더 (도시되지 않음) 가 프레임 소거 처리를 수행할 수도 있다. 디코딩 모드 (334, 336, 338) 의 병렬 어레이는 포스트 필터 (340) 에 연결될 수도 있다. 관련된 디코딩 모드 (334, 336, 338) 는 특수 패킷 (314) 을 디코딩 또는 역양자화하여, 그 정보를 포스트 필터 (340) 로 제공할 수도 있다. 포스트 필터 (340) 는 음성 프레임을 복원 또는 합성하여, 합성된 음성 프레임
Figure 112009036536422-PCT00004
(316) 을 출력할 수도 있다.
일 구성에 있어서, 양자화된 파라미터는 송신되지 않는다. 대신에, 디코더 (304) 에서의 각종 룩업 테이블 (LUT) (도시되지 않음) 의 어드레스를 특정하는 부호록 인덱스가 송신된다. 디코더 (304) 는 부호록 인덱스를 수신하여, 적절한 파라미터 값에 대해 각종 부호록 LUT 를 탐색할 수도 있다. 따라서, 예를 들어, 피치 래그, 적응형 부호록 이득 및 LSP 와 같은 파라미터에 대한 부호록 인덱스가 송신될 수도 있고, 3 개의 연관된 부호록 LUT 가 디코더 (304) 에 의해 탐색될 수도 있다.
CELP 인코딩 모드에 따르면, 피치 래그, 진폭, 위상 및 LSP 파라미터가 송신될 수도 있다. LSP 부호록 인덱스가 송신되는데, 그 이유는 LP 잔여 신호가 디코더 (304) 에서 합성될 수도 있기 때문이다. 부가적으로, 현재의 프레임에 대한 피치 래그값과 이전의 프레임에 대한 피치 래그값 사이의 차이가 송신될 수도 있다.
음성 신호 (310) 가 디코더 (304) 에서 합성되는 PPP 인코딩 모드에 따르면, 피치 래그, 진폭 및 위상 파라미터가 송신된다. PPP 음성 코딩 기술에 의해 이용되는 보다 저비트 레이트는 절대 피치 래그 정보 및 상대 피치 래그 차이값 모두의 송신을 허용하지 않을 수도 있다.
일 실시예에 따르면, 송신을 위해 이전의 프레임에 대한 피치 래그값과 현재의 프레임에 대한 피치 래그값 사이의 차이를 양자화하며, 송신을 위해 현재의 프레임에 대한 피치 래그값은 양자화하지 않는 저비트 레이트 PPP 인코딩 모드로 유 성 음성 프레임과 같은 고도로 주기적인 프레임이 송신된다. 유성 프레임이 사실상 고도로 주기적이기 때문에, 절대 피치 래그값과 대조적으로 차이값을 송신하는 것은 보다 낮은 코딩 비트 레이트가 달성되는 것을 허용할 수도 있다. 일 양태에 있어서, 이 양자화가 일반화되어, 이전의 프레임에 대한 파라미터 값의 가중된 합계가 컴퓨팅되고 (여기서, 가중치의 합계는 1 임), 가중된 합계는 현재의 프레임에 대한 파라미터 값으로부터 감산된다. 그런 다음, 차이가 양자화될 수도 있다.
도 4 는 IWF (408) 의 일 실시예를 도시한 블록도이다. IWF (408) 는 풀-레이트 포맷팅된 패킷 (413) 을 특수 하프-레이트 패킷 (414) 으로 변환할 수도 있다. IWF (408) 는 포맷팅된 패킷 (413) 을 수신할 수도 있고, 비트-레이트 분석기 (450) 는 포맷팅된 패킷 (413) 에 포함된 비트 수를 결정할 수도 있다. 일 양태에 있어서, 풀-레이트 포맷팅된 패킷 (413) 은 171 비트를 포함한다. 폐기 모듈 (452) 은 포맷팅된 패킷 (413) 과 함께 포함된 양자화된 파라미터와 연관된 특정 비트량을 제거할 수도 있다. 일 구성에 있어서, 비트 결정기 (456) 는, 포맷팅된 패킷 (413) 으로부터 어떤 비트가 폐기되는지를 결정한다. 예를 들어, 비트 결정기 (456) 는, 대역 정렬 파라미터와 연관된 비트가 폐기되어야 한다고 결정할 수도 있다. 이로서, 폐기 모듈 (452) 은 이 파라미터와 연관된 비트량을 제거할 수도 있다.
또한, IWF (408) 는 패킹 모듈 (454) 을 포함할 수도 있다. 패킹 모듈 (454) 은 폐기 모듈 (452) 에 의해 폐기되지 않았던 나머지 비트를 특수 패킷 (414) 으로 패킹할 수도 있다. 일 양태에 있어서, 폐기 모듈 (452) 은 포맷팅된 패킷 (413) 과 함께 포함된 비트의 비교적 절반을 제거한다. 이로서, 패킹 모듈 (454) 은 나머지 비트를 포맷팅된 패킷 (413) 과 함께 포함되었던 비트 수의 절반을 포함하는 특수 패킷 (414) 으로 패킹할 수도 있다. 식별자 발생기 (458) 는 특수 식별자를 패킹 모듈 (454) 로 제공할 수도 있다. 패킹 모듈 (454) 은 특수 패킷 (414) 에 특수 식별자와 연관된 비트를 포함시킬 수도 있다. 특수 식별자는, 착신 패킷이 특수 하프-레이트 패킷 (414) 이라고 디코더 (304) 에 표시할 수도 있다. 특수 식별자는 값 101 과 값 127 사이의 범위에 있는 7-비트 값을 포함할 수도 있다. 특수 식별자는, 인코더가 통상적으로 0 과 100 사이의 범위에 있는 패킷에 7-비트 값을 할당한다는 점에서는 위법 값일 수도 있다. 101 과 127 사이의 범위에 있는 7-비트 값을 갖는 패킷은, 인코딩 프로세스 이후에 패킷이 풀-레이트로부터 특수 하프-레이트로 변환되었다고 디코더 (304) 에 표시할 수도 있다.
도 5 는 가변 레이트 음성 코딩 방법 (500) 의 일 실시예를 도시한 흐름도이다. 일 양태에 있어서, 이 가변 레이트 음성 코딩 방법 (500) 은, 풀-레이트 패킷을 수신하여 이 패킷을 특수 하프-레이트 패킷으로 변환하는 것이 가능하게 될 수도 있는 단일 이동국 (102) 에 의해 구현된다. 다른 양태에 있어서, 이 가변 레이트 음성 코딩 방법 (500) 은 2 이상의 이동국 (102) 에 의해 구현될 수도 있다. 다시 말하면, 하나의 이동국 (102) 은 풀-레이트 패킷을 인코딩하는 인코더를 포함할 수도 있는 한편, 개별 이동국 (102), 기지국 (104) 등은 풀-레이트 패 킷을 특수 하프-레이트 패킷으로 변환할 수도 있는 IWF 를 포함한다. 현재의 프레임의 초기 파라미터가 계산될 수도 있다 (502). 일 구성에 있어서, 초기 파라미터 계산 모듈 (318) 이 이 파라미터를 계산한다 (502). 이 파라미터는, 선형 예측 코딩 (LPC) 필터 계수, LSP (Line Spectral Pair) 계수, NACF (Normalized Autocorrelation Function), 개방 루프 래그, 대역 에너지, 제로 크로싱 레이트, 및 포먼트 잔여 신호 중 하나 이상을 포함할 수도 있다.
현재의 프레임이 활성 또는 비활성으로 분류될 수도 있다 (504). 일 구성에 있어서, 모드 분류 모듈 (322) 은 현재의 프레임을 "활성" 음성 또는 "비활성" 음성 중 어느 하나를 포함하는 것으로 분류한다. 전술한 바와 같이, s(n) (310) 은 음성 주기 및 무음 주기를 포함할 수도 있다. 활성 음성은 음성 언어 (spoken word) 를 포함할 수도 있는 한편, 비활성 음성은 그 밖의 모든 것, 예를 들어 배경 잡음, 무음, 휴지를 포함할 수도 있다.
현재의 프레임이 활성으로 분류되는지 또는 비활성으로 분류되는지의 판정이 이루어진다 (506). 현재의 프레임이 활성으로 분류되는 경우에는, 활성 음성은 유성 프레임, 무성 프레임 또는 과도 프레임 중 어느 하나로 더 분류된다 (508). 인간의 음성은 다수의 상이한 방식으로 분류될 수도 있다. 2 가지 음성 분류는 유성음 및 무성음을 포함할 수도 있다. 유성도 무성도 아닌 음성은 과도 음성으로 분류될 수도 있다.
단계 506 및 단계 508 에서 이루어진 프레임 분류에 기초하여 인코더/디코더 모드가 선택될 수도 있다 (510). 도 3 에 도시된 바와 같이, 각종 인코더/디코 더 모드는 병렬로 접속될 수도 있다. 상이한 인코더/디코더 모드는 상이한 코딩 방식에 따라 동작한다. 특정 특성을 나타내는 음성 신호 s(n) (310) 의 코딩 부분에서 특정 모드가 보다 효과적일 수도 있다.
전술한 바와 같이, CELP 모드는 과도 음성으로 분류된 프레임을 코딩하도록 선택될 수도 있다. PPP 모드는 유성 음성으로 분류된 프레임을 코딩하도록 선택될 수도 있다. NELP 모드는 무성 음성으로 분류된 프레임을 코딩하도록 선택될 수도 있다. 동일한 코딩 기술은 빈번하게 상이한 비트 레이트로 동작될 수도 있는데, 여기서 성능 레벨은 변한다. 도 3 에서의 상이한 인코더/디코더 모드는 상이한 코딩 기술, 또는 상이한 비트 레이트로 동작하는 동일한 코딩 기술, 또는 전술한 것의 조합을 나타낼 수도 있다.
선택된 인코더 모드는 현재의 프레임을 인코딩하고 (512), 이 인코딩된 프레임을 제 1 레이트에 따른 패킷으로 포맷팅한다 (514). 디밍 및 버스트 시그널링 정보가 요구되는지 여부의 판정이 이루어진다 (516). 또한, 부가적인 네트워크 용량이 요구되는지 여부의 판정이 이루어진다 (516). 시그널링 또는 부가적인 네트워크 용량이 요구되지 않는 경우에는, 패킷은 디코더로 송신될 수도 있다 (520). 시그널링 또는 부가적인 네트워크 용량이 요구되는 경우에는, 패킷은 기지국에서 제 1 레이트로부터 제 2 레이트로 디밍될 수도 있고 (518), 그런 다음 디코더로 송신되기 (520) 이전에 시그널링 정보와 함께 패킹될 수도 있다. 제 1 레이트는 제 2 레이트보다 많은 비트량을 포함할 수도 있다. 일 양태에 있어서, 패킷의 디밍 (518) 은, 시그널링 정보를 디코더로 송신하는데 이용될 수도 있 는 비트를 해방시키기 위해서 또는 보다 적은 비트 수가 디코더로 송신되도록 패킷으로부터 특정 비트량을 폐기하는 것을 포함한다.
도 6 은 패킷 디밍 방법 (600) 의 일 실시예를 도시한 흐름도이다. 이 패킷 디밍 방법 (600) 은 IWF (208) 에 의해 구현될 수도 있다. 제 1 패킷이 수신될 수도 있다 (602). 제 1 패킷은 인코더 (302) 로부터 수신되는 포맷팅된 패킷 (313) 일 수도 있다. 제 1 패킷은 분석되어, 제 1 패킷과 연관된 제 1 비트 레이트를 결정할 수도 있다 (604). 제 1 비트 레이트는 제 1 패킷에 포함된 비트 수를 나타낼 수도 있다. 일 양태에 있어서, 비트-레이트 분석기 (450) 는 제 1 패킷을 분석하여, 비트 레이트를 결정한다. 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트가 폐기될 수도 있다 (606). 일 구성에 있어서, 폐기 모듈 (452) 은 대역 정렬 파라미터와 연관된 비트를 폐기한다. PPP 코딩의 주파수 도메인 구현에 있어서, 위상 스펙트럼을 코딩하도록 다중대역 접근법이 채택될 수도 있는데, 여기서 위상 양자화는 일련의 선형 위상 시프트의 양자화로 변환된다. 프로토타입 피치 주기 (PPP) 를 주파수 도메인으로 변환하는데 이산 푸리에 급수 (DFS) 변환이 이용될 수도 있다. 진폭 양자화되며 위상 양자화되지 않은 DFS 와 진폭 양자화된 위상 제로 DFS 사이에서 글로벌 정렬 시프트가 컴퓨팅될 수도 있다. 진폭 양자화된 위상 제로 DFS 는, 타깃 PPP 에 대해 최대로 정렬하기 위해서 진폭 양자화된 위상 제로 DFS 로 표현된 PPP 에 기대 선형 위상 시프트를 적용하는 것에 대응할 수도 있는 마이너스의 이 글로벌 정렬만큼 시프트될 수도 있는데, 이는 진폭 양자화된 진위상 (true phase) DFS 에 대응할 수도 있 다. 일 양태에 있어서, 선형 위상 시프트는 모든 고조파의 진위상을 캡처하기에 불충분할 수도 있고, 글로벌 정렬에 부가하여 대역 포커싱된 정렬이 다중 대역에서 컴퓨팅된다. 이는 폐기될 수도 있는 대역 정렬 파라미터에 대응할 수도 있다.
하나 이상의 파라미터와 연관된 제 1 패킷에서의 나머지 비트가 특수 식별자와 함께 제 2 패킷으로 패킹될 수도 있다 (608). 일 양태에 있어서, 제 2 패킷은 제 2 비트 레이트와 연관된다. 제 2 비트 레이트는 제 1 비트 레이트보다 소수의 비트를 포함할 수도 있다. 특수 식별자는 제 2 비트 레이트를 포함하는 것으로서 제 2 패킷을 식별할 수도 있다. 제 2 패킷은 디코더로 송신될 수도 있다 (610). 일 실시예에 있어서, 제 2 패킷은 제 1 기지국으로부터 제 2 기지국으로 송신될 수도 있다 (610). 또다른 실시예에 있어서, 제 2 패킷은 제 1 기지국으로부터 또다른 이동국 (102) 으로 송신될 수도 있다 (610).
도 6a 는 패킷을 디코딩하는 방법 (601) 의 일 구성을 도시한 흐름도이다. 패킷이 수신될 수도 있고 (603), 이 패킷과 함께 포함된 특수 식별자가 판독될 수도 있다 (605). 일 양태에 있어서, 특수 식별자는 위법 래그 식별자이다. 이 패킷이 제 1 비트 레이트와 연관된 제 1 패킷으로부터 제 2 비트 레이트와 연관된 제 2 패킷으로 변환되었다는 것이 발견될 수도 있다 (607). 이 패킷에 대한 디코딩 모드가 선택될 수도 있고 (609), 이 패킷이 디코딩될 수도 있다.
도 7a 는 유성 음성 (702) 을 포함하는 신호 s(n) (310) 의 예시적인 부분을 도시한 도면이다. 유성음은, 완화된 진동 (relaxed oscillation) 으로 진동하 도록 조정된 성대의 긴장 상태로 성문을 통해 공기를 밀어 넣고, 그에 따라 성도를 자극하는 공기의 의사-주기적 펄스를 생성함으로써 생성될 수도 있다. 도 7a 에 도시된 바와 같이, 유성 음성에서 측정된 하나의 특성은 피치 주기이다.
도 7b 는 무성 음성 (704) 을 포함하는 신호 s(n) (310) 의 예시적인 부분을 도시한 도면이다. 무성음은, (일반적으로 입 말단을 향하여) 성도에서의 몇몇 지점에 수축 (constriction) 을 형성하고, 난류 (turbulence) 를 생성하기에 충분히 고속으로 이 수축을 통해 공기를 밀어 넣음으로써 발생될 수도 있다. 결과적인 무성 음성 신호는 유색 잡음을 닮는다.
도 7c 는 과도 음성 (706) (즉, 유성도 무성도 아닌 음성) 을 포함하는 신호 s(n) (310) 의 예시적인 부분을 도시한 도면이다. 도 7c 에 도시된 예시적인 과도 음성 (706) 은 무성 음성과 유성 음성 사이에서 변천하는 s(n) (310) 을 나타낼 수도 있다. 본 명세서에 기재된 기술에 따라 다수의 상이한 음성 분류가 이용되어, 유사한 결과를 달성할 수도 있다.
도 8 의 그래프는 PPP 코딩 기술의 원리를 나타낸다. 단일 프레임 (800) 은 오리지널 신호 s(n) (860) 을 포함할 수도 있다. 피치 주기 (862) (또는 프로토타입 파형) 는 오리지널 신호 (860) 로부터 추출되어 인코딩될 수도 있다. 인코딩된 피치 주기 (862) 는 복원된 신호 (864) 를 발생시키는데 이용될 수도 있다. 복원된 신호 (864) 는 오리지널 신호 (860) 의 복원물일 수도 있다. 인코딩되지 않았던 오리지널 신호 (860) 의 일부 (866) 는 피치 주기들 (862) 사이에서의 보간에 의해 복원될 수도 있다.
도 9 는 각종 패킷 타입에 할당된 비트 수를 도시한 차트 (900) 이다. 이 차트 (900) 는 복수의 파라미터 (902) 를 포함한다. 복수의 파라미터 (902) 내의 각 파라미터는 특정 비트 수를 이용할 수도 있다. 이 차트 (900) 에 예시된 각종 패킷 타입은 전술한 각종 인코딩 모드 중 하나의 인코딩 모드를 이용하여 인코딩되었을 수도 있다. 패킷 타입은, 풀-레이트 CELP (FCELP) (904), 하프 레이트 CELP (HCELP) (906), 특수 하프-레이트 CELP (SPLHCELP) (908), 풀-레이트 PPP (FPPP) (910), 특수 하프-레이트 PPP (SPLHPPP) (912), 1/4-레이트 PPP (QPPP) (914), 특수 하프-레이트 NELP (SPLHNELP) (916), 1/4-레이트 NELP (QNELP) (918) 및 무음 인코더 (920) 를 포함할 수도 있다.
FCELP (904) 및 FPPP (910) 는 총 171 비트를 갖는 패킷일 수도 있다. FCELP (904) 패킷은 SPLHCELP (908) 패킷으로 변환될 수도 있다. 일 양태에 있어서, FCELP (904) 패킷은 고정 부호록 인덱스 (FCB 인덱스) 및 고정 부호록 이득 (FCB 이득) 과 같은 파라미터에 비트를 할당한다. 도시된 바와 같이, FCELP (904) 패킷이 SPLHCELP (908) 패킷으로 변환되는 경우, FCB 인덱스, FCB 이득 및 델타 래그와 같은 파라미터에 제로 비트가 할당된다. 다시 말하면, SPLHCELP (908) 패킷은 이들 비트 없이 디코더로 송신된다. SPLHCELP (908) 패킷은, LSP (Line Spectral Pair), 적응형 부호록 (ACB) 이득, 특수 ID (IDentification), 특수 패킷 ID, 피치 래그 및 모드-비트 정보와 같은 파라미터에 할당되는 비트를 포함한다. 디코더로 송신되는 총 비트 수는 171 로부터 80 으로 감소될 수도 있다.
유사하게, FPPP (910) 패킷은 SPLHPPP (912) 패킷으로 변환될 수도 있다. 도시된 바와 같이, FPPP (910) 패킷은 대역 정렬 파라미터에 비트를 할당한다. FPPP (910) 패킷이 SPLHPPP (912) 패킷으로 변환되는 경우, 대역 정렬에 할당된 비트는 폐기될 수도 있다. 다시 말하면, SPLHPPP (912) 패킷은 이들 비트 없이 디코더로 송신된다. 디코더로 송신되는 총 비트 수는 171 로부터 80 으로 감소될 수도 있다. 일 구성에 있어서, 진폭 파라미터 및 글로벌 정렬 파라미터에 할당된 비트는 SPLHPPP (912) 패킷에 포함된다. 진폭 파라미터는 신호 s(n) (310) 의 스펙트럼의 진폭을 나타낼 수도 있고, 전술한 바와 같은 글로벌 정렬 파라미터는 최대 정렬을 보장할 수도 있는 선형 위상 시프트를 나타낼 수도 있다. 일 양태에 있어서, 전체 신호 s(n) (310) 은 50㎐ 내지 4㎑ 의 주파수의 범위에 있다.
또한, SPLHCELP (908) 패킷, SPLHPPP (912) 패킷 및 SPLHNELP (916) 패킷은 위법 래그 파라미터에 할당된 비트를 포함할 수도 있다. 위법 래그 파라미터는, 디코더가 SPLHCELP (908) 패킷 및 SPLHPPP (912) 패킷을 인코딩 이후에 풀-레이트로부터 하프-레이트 또는 NELP 프레임을 포함한 하프-레이트 프레임으로 변환되었던 패킷으로서 인식하는 것을 허용하는 특수 식별자를 나타낼 수도 있다.
상이한 파라미터 및 패킷에 대해 상이한 비트 수를 갖는 각종 구성이 본 명세서에 예시되어 있다. 본 명세서에서 각 파라미터와 연관된 특정 비트 수는 예시로서 이루어지고, 제한하는 것을 의미하지는 않는다. 파라미터는 본 명세서에 이용된 실시예보다 많거나 적은 비트를 포함할 수도 있다.
도 10 은 풀-레이트 프로토타입 피치 주기 (PPP) 패킷 (1002) 의 특수 하프-레이트 PPP (SPLHPPP) 패킷 (1020) 으로의 변환을 도시한 블록도이다. 변환은 IWF (1008) 에 의해 구현될 수도 있다. FPPP 패킷 (1002) 은 특정 비트 수와 연관되는 몇몇 파라미터를 포함할 수도 있다. FPPP 패킷 (1002) 에 포함된 파라미터는, 1 비트 할당될 수도 있는 모드 비트 (1004), 28 비트 할당될 수도 있는 LSP (Line Spectral Pair) (1006), 7 비트 할당될 수도 있는 피치 래그 (1010), 28 비트 할당될 수도 있는 진폭 (1012), 7 비트 할당될 수도 있는 글로벌 정렬 (1014), 99 비트 할당될 수도 있는 대역 정렬 (1016), 및 1 비트 할당될 수도 있는 예비 파라미터 (1018) 를 포함할 수도 있다. 일 양태에 있어서, FPPP 패킷 (1002) 은 총 171 비트를 포함한다.
IWF (1008) 는 전술한 바와 같이 FPPP 패킷 (1002) 을 SPLHPPP 패킷 (1020) 으로 변환할 수도 있다. 일단 변환되면, SPLHPPP 패킷 (1020) 은 총 80 비트를 포함할 수도 있다. IWF (1008) 는 대역 정렬 (1016) 에 할당된 비트를 폐기할 수도 있다. 또한, IWF (1008) 는 SPLHPPP 패킷 (1020) 에 2 비트 할당될 수도 있는 특수 하프-레이트 ID (1022) 를 포함시킬 수도 있다. 또한, IWF (1008) 는 SPLHPPP 패킷 (1020) 에 대해 위법 래그 식별자 (1024) 를 포함시킬 수도 있는데, 이는 특수 패킷 식별자의 역할을 할 수도 있다. 위법 래그 식별자 (1024) 에는 7 비트 할당될 수도 있고, 디코더가 이 패킷을 FPPP 패킷 (1002) 으로부터 SPLHPPP 패킷 (1020) 으로 변환되었던 패킷으로서 인식하는 것을 허용할 수도 있다. 추가 구성에 있어서, 위법 래그 식별자 (1024) 에 할당된 7 비트는 101 내 지 127 의 범위에서의 값을 나타낼 수도 있다. 또한, IWF (1008) 는 7 비트 할당될 수도 있는 부가적인 래그를 포함시킬 수도 있다. 이는 FPPP 패킷으로부터 비롯되는 피치 래그일 수도 있다.
도 10 에 도시된 실시예는 FPPP 패킷 (1002) 의 SPLHPPP 패킷 (1020) 으로의 변환을 포함하지만, 풀-레이트 코드 여기 선형 예측 (FCELP) 패킷도 또한 특수 하프-레이트 CELP (SPLHCELP) 패킷으로 변환될 수 있다는 것이 이해되어야 한다. FCELP 패킷으로부터 SPLHCELP 패킷으로의 변환은 FPPP 패킷의 SPLHPPP 패킷으로의 변환을 참조하여 기재된 바와 유사한 방식으로 이루어질 수도 있다. FCELP 패킷은 171 비트를 포함할 수도 있고, SPLHCELP 패킷은 80 비트를 포함할 수도 있다.
도 11 은 통신 디바이스 (1102) 의 일 실시예에서의 특정 컴포넌트의 블록도이다. 도 11 에 도시된 실시예에 있어서, 통신 디바이스 (1102) 는 기지국 및/또는 이동국일 수도 있다. 본 시스템 및 방법은 통신 디바이스에 구현될 수도 있다.
도시된 바와 같이, 통신 디바이스 (1102) 는 이 통신 디바이스 (1102) 의 동작을 제어하는 프로세서 (1160) 를 포함할 수도 있다. ROM (Read-Only Memory) 및 RAM (Random Access Memory) 을 포함할 수도 있는 메모리 (1162) 는 프로세서 (1160) 로 명령들 및 데이터를 제공할 수도 있다. 또한, 메모리 (1162) 의 일부는 비휘발성 RAM (NVRAM) 을 포함할 수도 있다.
또한, 통신 디바이스 (1102) 는, 이동국 (102) 또는 셀 사이트 제어기와 같은 원격 위치와 통신 디바이스 (1102) 사이의 데이터 (220) 의 송수신을 허용하는 송신기 (1164) 및 수신기 (1166) 를 포함할 수도 있다. 송신기 (1164) 및 수신기 (1166) 는 트랜시버 (1168) 로 결합될 수도 있다. 안테나 (1170) 는 트랜시버 (1168) 에 전기적으로 연결된다.
또한, 통신 디바이스 (1102) 는, 트랜시버 (1168) 에 의해 수신된 신호의 레벨을 검출하여 정량화하는데 사용되는 신호 검출기 (1172) 를 포함할 수도 있다. 신호 검출기 (1172) 는 총 에너지, 의사잡음 (PN) 칩당 파일럿 에너지, 전력 스펙트럼 밀도로서 이러한 신호를 그리고 다른 신호를 검출한다. 또한, 통신 디바이스 (1102) 는, 어떤 패킷이 풀-레이트 패킷으로부터 특수 하프-레이트 패킷으로 변환되어야 하는지를 결정하는데 사용되는 패킷 결정기 (1176) 를 포함할 수도 있다.
통신 디바이스 (1102) 의 각종 컴포넌트는, 데이터 버스에 부가하여 전력 버스, 제어 신호 버스 및 상태 신호 버스를 포함할 수도 있는 버스 시스템 (1178) 에 의해 함께 연결된다. 그러나, 명백함을 위해, 각종 버스는 도 11 에 버스 시스템 (1178) 으로서 예시되어 있다.
정보 및 신호는 임의의 각종 상이한 기술 및 기법을 이용하여 표현될 수도 있다. 예를 들어, 전술한 설명 전체에 걸쳐 참조될 수도 있는 데이터, 명령들, 커맨드, 정보, 신호, 비트, 심볼 및 칩은 전압, 전류, 전자파, 자계 또는 자기 입자, 광학계 또는 광학 입자, 또는 이들의 임의의 조합으로 표현될 수도 있다.
또한, 본 명세서에 개시된 구성과 관련하여 기재된 각종 예시적인 논리 블록, 모듈, 회로 및 알고리즘 단계는 전자 하드웨어, 컴퓨터 소프트웨어, 또는 이들 의 조합으로 구현될 수도 있다. 이러한 하드웨어와 소프트웨어의 상호교환성을 명확하게 나타내기 위해서, 각종 예시적인 컴포넌트, 블록, 모듈, 회로 및 단계가 일반적으로 그 기능성 면에서 전술되었다. 이러한 기능성이 하드웨어로 구현되는지 또는 소프트웨어로 구현되는지 여부는 시스템 전체에 부과된 디자인 제약 및 특정 애플리케이션에 종속한다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 전술한 기능성을 각 특정 애플리케이션에 대해 상이한 방식으로 구현할 수도 있지만, 이러한 구현 결정은 본 시스템 및 방법의 범위로부터의 벗어남을 야기하는 것으로서 해석되어서는 안 된다.
본 명세서에 개시된 구성과 관련하여 기재된 각종 예시적인 논리 블록, 모듈 및 회로는 범용 프로세서, 디지털 신호 프로세서 (DSP), 주문형 집적 회로 (ASIC), 필드 프로그래머블 게이트 어레이 (FPGA) 또는 다른 프로그래머블 논리 디바이스, 이산 게이트 또는 트랜지스터 로직, 이산 하드웨어 컴포넌트, 또는 본 명세서에 기재된 기능을 수행하도록 디자인된 이들의 임의의 조합으로 구현 또는 수행될 수도 있다. 범용 프로세서는 마이크로프로세서일 수도 있지만, 대안적으로 이 프로세서는 임의의 통상적인 프로세서, 제어기, 마이크로제어기, 또는 상태 머신일 수도 있다. 또한, 프로세서는, 예를 들어 DSP 와 마이크로프로세서의 조합, 복수의 마이크로프로세서, DSP 코어와 결합된 하나 이상의 마이크로프로세서, 또는 이러한 임의의 다른 구성과 같은 컴퓨팅 디바이스의 조합으로 구현될 수도 있다.
본 명세서에 개시된 구성과 관련하여 기재된 알고리즘 또는 방법의 단계는 직접적으로 하드웨어로, 프로세서에 의해 실행되는 소프트웨어 모듈로, 또는 이들 의 조합으로 구체화될 수도 있다. 소프트웨어 모듈은 RAM 메모리, 플래시 메모리, ROM 메모리, EPROM (Erasable Programmable ROM), EEPROM (Electrically EPROM), 레지스터, 하드디스크, 착탈식 디스크, CD-ROM (Compact Disc ROM), 또는 본 발명이 속하는 기술분야에 공지된 임의의 다른 형태의 저장 매체에 존재할 수도 있다. 저장 매체는 프로세서에 연결될 수도 있어, 프로세서가 저장 매체로부터 정보를 판독할 수 있고, 저장 매체에 정보를 기록할 수 있게 된다. 대안적으로, 저장 매체는 프로세서에 일체화될 수도 있다. 프로세서 및 저장 매체는 ASIC 에 존재할 수도 있다. ASIC 는 사용자 단말기에 존재할 수도 있다. 대안적으로, 프로세서 및 저장 매체는 개별 컴포넌트로서 사용자 단말기에 존재할 수도 있다.
본 명세서에 개시된 방법은 기재된 방법을 달성하기 위한 하나 이상의 단계 또는 동작을 포함한다. 방법 단계 및/또는 동작은 본 시스템 및 방법의 범위를 벗어나지 않으면서 서로 상호교환될 수도 있다. 다시 말하면, 단계 또는 동작의 특정 순서가 이 구성의 적절한 동작에 대해 특정되지 않는 한, 특정 단계 및/또는 동작의 순서 및/또는 용도는 본 시스템 및 방법의 범위를 벗어나지 않으면서 변경될 수도 있다. 본 명세서에 개시된 방법은 하드웨어로, 소프트웨어로 또는 이들 모두로 구현될 수도 있다. 하드웨어 및 메모리의 실시예는, RAM, ROM, EPROM, EEPROM, 플래시 메모리, 광학 디스크, 레지스터, 하드디스크, 착탈식 디스크, CD-ROM, 또는 임의의 다른 타입의 하드웨어 및 메모리를 포함할 수도 있다.
본 시스템 및 방법의 특정 구성 및 애플리케이션이 예시 및 기재되었지만, 본 시스템 및 방법은 본 명세서에 개시된 정밀한 구성 및 컴포넌트에 제한되지는 않는다는 것이 이해되어야 한다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명백한 각종 변형, 변경 및 변동은 청구된 시스템 및 방법의 사상 및 범위를 벗어나지 않으면서 본 명세서에 개시된 시스템 및 방법의 배열, 동작 및 상세 내에서 이루어질 수도 있다.

Claims (22)

  1. 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 방법으로서,
    제 1 패킷을 수신하는 단계;
    상기 제 1 패킷을 분석하여, 상기 제 1 패킷과 연관된 제 1 비트 레이트를 결정하는 단계;
    상기 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트를 폐기하는 단계;
    하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자를 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹하는 단계; 및
    상기 제 2 패킷을 송신하는 단계를 포함하는, 디밍 방법.
  2. 제 1 항에 있어서,
    상기 제 1 패킷은 풀-레이트 프로토타입 피치 주기 (Prototype Pitch Period: PPP) 패킷인, 디밍 방법.
  3. 제 1 항에 있어서,
    풀-레이트 프로토타입 피치 주기 (PPP) 패킷을 특수 하프-레이트 PPP 패킷으로 변환하는 단계를 더 포함하는, 디밍 방법.
  4. 제 3 항에 있어서,
    상기 특수 하프-레이트 PPP 패킷은 80 비트를 포함하는, 디밍 방법.
  5. 제 1 항에 있어서,
    상기 제 1 패킷은 풀-레이트 코드 여기 선형 예측 (Code Excited Linear Prediction: CELP) 패킷인, 디밍 방법.
  6. 제 1 항에 있어서,
    풀-레이트 코드 여기 선형 예측 (CELP) 패킷을 특수 하프-레이트 CELP 패킷으로 변환하는 단계를 더 포함하는, 디밍 방법.
  7. 제 6 항에 있어서,
    상기 특수 하프-레이트 CELP 패킷은 80 비트를 포함하는, 디밍 방법.
  8. 제 1 항에 있어서,
    대역 정렬 파라미터와 연관된 비트를 폐기하는 단계를 더 포함하는, 디밍 방법.
  9. 제 1 항에 있어서,
    상기 특수 식별자는 101 과 127 사이의 7-비트 값인, 디밍 방법.
  10. 제 1 항에 있어서,
    상기 제 2 패킷을 제 1 기지국으로부터 제 2 기지국으로 송신하는 단계를 더 포함하는, 디밍 방법.
  11. 제 1 항에 있어서,
    상기 제 2 패킷을 제 1 기지국으로부터 이동국으로 송신하는 단계를 더 포함하는, 디밍 방법.
  12. 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 장치로서,
    프로세서;
    상기 프로세서와 전자 통신하는 메모리; 및
    상기 메모리에 저장된 명령들을 포함하고,
    상기 명령들은,
    제 1 패킷을 수신하고,
    상기 제 1 패킷을 분석하여, 상기 제 1 패킷과 연관된 제 1 비트 레이트를 결정하고,
    상기 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트를 폐기하고,
    하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자를 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹하고,
    상기 제 2 패킷을 송신하도록 실행가능한, 디밍 장치.
  13. 제 12 항에 있어서,
    상기 제 1 패킷은 풀-레이트 프로토타입 피치 주기 (PPP) 패킷인, 디밍 장치.
  14. 제 12 항에 있어서,
    상기 명령들은 또한 풀-레이트 프로토타입 피치 주기 (PPP) 패킷을 특수 하프-레이트 PPP 패킷으로 변환하도록 실행가능한, 디밍 장치.
  15. 제 14 항에 있어서,
    상기 특수 하프-레이트 PPP 패킷은 80 비트를 포함하는, 디밍 장치.
  16. 제 12 항에 있어서,
    상기 제 1 패킷은 풀-레이트 코드 여기 선형 예측 (CELP) 패킷인, 디밍 장치.
  17. 제 12 항에 있어서,
    상기 명령들은 또한 풀-레이트 코드 여기 선형 예측 (CELP) 패킷을 특수 하프-레이트 CELP 패킷으로 변환하도록 실행가능하고,
    상기 특수 하프-레이트 CELP 패킷은 80 비트를 포함하는, 디밍 장치.
  18. 제 12 항에 있어서,
    상기 명령들은 또한 대역 정렬 파라미터와 연관된 비트를 폐기하도록 실행가능한, 디밍 장치.
  19. 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하도록 구성되는 시스템으로서,
    처리 수단;
    제 1 패킷을 수신하는 수단;
    상기 제 1 패킷을 분석하여, 상기 제 1 패킷과 연관된 제 1 비트 레이트를 결정하는 수단;
    상기 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트를 폐기하는 수단;
    하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자를 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹하는 수단; 및
    상기 제 2 패킷을 송신하는 수단을 포함하는, 디밍 시스템.
  20. 제 1 패킷을 수신하고;
    상기 제 1 패킷을 분석하여, 상기 제 1 패킷과 연관된 제 1 비트 레이트를 결정하고;
    상기 제 1 패킷으로부터 적어도 하나의 파라미터와 연관된 비트를 폐기하고;
    하나 이상의 파라미터와 연관된 나머지 비트 및 특수 식별자를 제 2 비트 레이트와 연관된 제 2 패킷으로 패킹하고;
    상기 제 2 패킷을 송신하도록 실행가능한 명령들 세트를 저장하도록 구성된, 컴퓨터 판독가능 매체.
  21. 패킷을 디코딩하는 방법으로서,
    패킷을 수신하는 단계;
    상기 패킷에 포함된 특수 식별자를 판독하는 단계;
    상기 패킷이 제 1 비트 레이트와 연관된 제 1 패킷으로부터 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍되었다는 것을 발견하는 단계; 및
    상기 패킷에 대한 디코딩 모드를 선택하는 단계를 포함하는, 패킷 디코딩 방법.
  22. 풀-레이트로부터 하프-레이트로 패킷을 디밍하는 방법으로서,
    풀-레이트 패킷을 수신하는 단계;
    상기 풀-레이트 패킷으로부터 파라미터와 연관된 비트를 폐기함으로써, 상기 풀-레이트 패킷을 하프-레이트 패킷으로 디밍하는 단계;
    시그널링 정보와 연관된 비트와 함께 상기 하프-레이트 패킷을 패킹하는 단계; 및
    상기 하프-레이트 패킷을 디코더로 송신하는 단계를 포함하는, 패킷 디밍 방법.
KR1020097012529A 2007-01-04 2007-12-27 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 시스템 및 방법 KR101164834B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/619,798 2007-01-04
US11/619,798 US8279889B2 (en) 2007-01-04 2007-01-04 Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate
PCT/US2007/088926 WO2008085752A1 (en) 2007-01-04 2007-12-27 Systems and methods for dimming a first packet associated with a first bit rate to a second packet associated with a second bit rate

Publications (2)

Publication Number Publication Date
KR20090082495A true KR20090082495A (ko) 2009-07-30
KR101164834B1 KR101164834B1 (ko) 2012-07-11

Family

ID=39345162

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020097012529A KR101164834B1 (ko) 2007-01-04 2007-12-27 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 시스템 및 방법

Country Status (10)

Country Link
US (1) US8279889B2 (ko)
EP (1) EP2115740A1 (ko)
JP (1) JP5199281B2 (ko)
KR (1) KR101164834B1 (ko)
CN (1) CN101573752B (ko)
BR (1) BRPI0720873A2 (ko)
CA (1) CA2671881C (ko)
RU (1) RU2440628C2 (ko)
TW (1) TWI358057B (ko)
WO (1) WO2008085752A1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8670990B2 (en) * 2009-08-03 2014-03-11 Broadcom Corporation Dynamic time scale modification for reduced bit rate audio coding
US8345617B2 (en) * 2009-08-24 2013-01-01 Qualcomm Incorporated Sending an uplink order to active set base stations
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
EP0495128B1 (en) * 1990-08-06 1996-03-06 Fujitsu Limited Communication equipment having repeat switching function
DE69233502T2 (de) * 1991-06-11 2006-02-23 Qualcomm, Inc., San Diego Vocoder mit veränderlicher Bitrate
ZA946674B (en) 1993-09-08 1995-05-02 Qualcomm Inc Method and apparatus for determining the transmission data rate in a multi-user communication system
US5519779A (en) 1994-08-05 1996-05-21 Motorola, Inc. Method and apparatus for inserting signaling in a communication system
JPH08146997A (ja) 1994-11-21 1996-06-07 Hitachi Ltd 符号変換装置および符号変換システム
US6205190B1 (en) * 1996-04-29 2001-03-20 Qualcomm Inc. System and method for reducing interference generated by a CDMA communications device
JP3283200B2 (ja) * 1996-12-19 2002-05-20 ケイディーディーアイ株式会社 符号化音声データの符号化レート変換方法および装置
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
US6260009B1 (en) * 1999-02-12 2001-07-10 Qualcomm Incorporated CELP-based to CELP-based vocoder packet translation
KR100297875B1 (ko) 1999-03-08 2001-09-26 윤종용 가변 속도 보코더를 사용하는 코드 분할 다중 접속 시스템의 음질 향상을 위한 방법
US6330532B1 (en) * 1999-07-19 2001-12-11 Qualcomm Incorporated Method and apparatus for maintaining a target bit rate in a speech coder
US7606164B2 (en) * 1999-12-14 2009-10-20 Texas Instruments Incorporated Process of increasing source rate on acceptable side of threshold
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6728391B1 (en) * 1999-12-03 2004-04-27 United Parcel Service Of America, Inc. Multi-resolution label locator
US7574351B2 (en) * 1999-12-14 2009-08-11 Texas Instruments Incorporated Arranging CELP information of one frame in a second packet
US7463600B2 (en) * 2000-01-20 2008-12-09 Nortel Networks Limited Frame structure for variable rate wireless channels transmitting high speed data
WO2001058167A1 (en) * 2000-02-04 2001-08-09 Koninklijke Philips Electronics N.V. Quantization method for bit rate transcoding applications
JP3761795B2 (ja) * 2000-04-10 2006-03-29 三菱電機株式会社 ディジタル回線多重化装置
US6584438B1 (en) 2000-04-24 2003-06-24 Qualcomm Incorporated Frame erasure compensation method in a variable rate speech coder
EP2040253B1 (en) 2000-04-24 2012-04-11 Qualcomm Incorporated Predictive dequantization of voiced speech
CA2384466C (en) 2000-06-28 2007-06-26 Samsung Electronics Co., Ltd. Reverse data transmission method and apparatus in mobile communication system
US6477502B1 (en) * 2000-08-22 2002-11-05 Qualcomm Incorporated Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
CN1160918C (zh) 2000-10-21 2004-08-04 三星电子株式会社 在移动通信系统中传输分组数据
JP2002229599A (ja) * 2001-02-02 2002-08-16 Nec Corp 音声符号列の変換装置および変換方法
US6829579B2 (en) * 2002-01-08 2004-12-07 Dilithium Networks, Inc. Transcoding method and system between CELP-based speech codes
JP4022111B2 (ja) * 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7657427B2 (en) * 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
CA2501368C (en) * 2002-10-11 2013-06-25 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7330427B2 (en) * 2003-04-16 2008-02-12 International Business Machines Corporation MMPP analysis of network traffic using a transition window
KR100689365B1 (ko) 2003-07-10 2007-03-02 삼성전자주식회사 이동통신시스템에서 신호 및 부가 데이터 다중화 전송 방법 및 시스템
US7469209B2 (en) * 2003-08-14 2008-12-23 Dilithium Networks Pty Ltd. Method and apparatus for frame classification and rate determination in voice transcoders for telecommunications
US7016409B2 (en) * 2003-11-12 2006-03-21 Sony Corporation Apparatus and method for use in providing dynamic bit rate encoding
JP4367657B2 (ja) 2004-04-09 2009-11-18 日本電気株式会社 音声通信方法及び装置
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
US7725311B2 (en) * 2006-09-28 2010-05-25 Ericsson Ab Method and apparatus for rate reduction of coded voice traffic

Also Published As

Publication number Publication date
CN101573752B (zh) 2013-06-12
KR101164834B1 (ko) 2012-07-11
JP5199281B2 (ja) 2013-05-15
CA2671881A1 (en) 2008-07-17
CN101573752A (zh) 2009-11-04
WO2008085752A1 (en) 2008-07-17
US8279889B2 (en) 2012-10-02
BRPI0720873A2 (pt) 2014-03-04
JP2010515936A (ja) 2010-05-13
CA2671881C (en) 2013-08-20
RU2440628C2 (ru) 2012-01-20
EP2115740A1 (en) 2009-11-11
RU2009129690A (ru) 2011-02-10
US20080165799A1 (en) 2008-07-10
TWI358057B (en) 2012-02-11
TW200844979A (en) 2008-11-16

Similar Documents

Publication Publication Date Title
CA2658560C (en) Systems and methods for modifying a window with a frame associated with an audio signal
KR100805983B1 (ko) 가변율 음성 코더에서 프레임 소거를 보상하는 방법
ES2287122T3 (es) Procedimiento y aparato para cuantificar de manera predictiva habla sonora.
US6477502B1 (en) Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system
ES2257307T3 (es) Metodo y sistema para codificacion de voz en condiciones de borrado de trama.
JP4511094B2 (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
ES2297578T3 (es) Procedimiento y aparato para submuestrear informacion del espectro de fase.
ES2276690T3 (es) Particion de espectro de frecuencia de una forma de onda prototipo.
KR101164834B1 (ko) 제 1 비트 레이트와 연관된 제 1 패킷을 제 2 비트 레이트와 연관된 제 2 패킷으로 디밍하는 시스템 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 5