KR20020013962A - 프레임 소거 상태에서 예측 음성 코더의 성능을 개선하기위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및장치 - Google Patents

프레임 소거 상태에서 예측 음성 코더의 성능을 개선하기위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및장치 Download PDF

Info

Publication number
KR20020013962A
KR20020013962A KR1020027000692A KR20027000692A KR20020013962A KR 20020013962 A KR20020013962 A KR 20020013962A KR 1020027000692 A KR1020027000692 A KR 1020027000692A KR 20027000692 A KR20027000692 A KR 20027000692A KR 20020013962 A KR20020013962 A KR 20020013962A
Authority
KR
South Korea
Prior art keywords
encoder
decoder
packet
voice
modified
Prior art date
Application number
KR1020027000692A
Other languages
English (en)
Inventor
사라쓰 만주나쓰
앤드류 피. 데자코
Original Assignee
러셀 비. 밀러
콸콤 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 러셀 비. 밀러, 콸콤 인코포레이티드 filed Critical 러셀 비. 밀러
Publication of KR20020013962A publication Critical patent/KR20020013962A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

프레임 소거 상태하에서 예측 음성 코더의 성능을 개선하기 위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및 장치는 수신 음성 코더의 디코더(104,110,200,300)가 음성 코더의 전송시에 인코더(100,106)에 의하여 전송된 프레임을 수신하는데 실패하였다면 수신 음성 코드의 인코더(100,106)에게 통보하는 단계를 포함한다. 통보에 응답하여, 수정된 패킷은 수신 음성 코더의 인코더(100,106)로부터 송신 음성 코더의 디코더(104,110,200,300)에 전송된다. 송신 음성 코더의 디코더(100,106)는 수정된 패킷을 수신하였을 때 송신 음성 코더의 인코더(100,106)에 통보한다. 송신 음성 코더의 인코더(100,106)는 이후 수정된 인코딩 포맷을 이용하여 패킷을 인코딩한다. 수정된 인코딩 포맷은 로우-메모리 인코딩 포맷 또는 메모리없는 인코딩 포맷중 하나일 수 있다. 수정된 패킷은 1의 디지털값으로 세팅된 소거 지시자를 가질 수 있다.

Description

프레임 소거 상태에서 예측 음성 코더의 성능을 개선하기 위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및 장치{METHOD AND APPARATUS FOR PROVIDING FEEDBACK FROM DECODER TO ENCODER TO IMPROVE PERFORMANCE IN A PREDICTIVE SPEECH CODER UNDER FRAME ERASURE CONDITIONS}
디지털 기술에 의한 음성 전송은 특히 장거리 및 디지털 무선전화 분야에서 널리 보급되었다. 또한, 상기 음성전송에 있어서, 재구성된 음성의 인지된 품질을 유지하면서 채널을 통해 전송될 수 있는 최소량의 정보를 결정하는데 관심이 집중되고 있다. 만일 음성이 단순하게 샘플링 및 디지타이징에 의하여 전송된다면, 종래의 아날로그 전화의 음성품질을 달성하는데 초당 64킬로 비트(kbps) 정도의 데이터율이 요구될 것이다. 그러나, 적당한 코딩, 송신 및 수신기측에서의 재합성에 의한 음성 분석을 이용하면 데이터율을 상당히 감소시킬 수 있다.
음성압축용 장치는 무선통신의 여러 분야에서 사용된다. 전형적인 분야는 무선통신이다. 무선통신 분야는 예컨대 무선전화기, 페이징, 무선 로컬 루프, 셀룰러 및 PCS 전화기와 같은 무선전화기, 모빌 인터넷 프로토콜(IP) 전화기 및 위상 통신 시스템등을 포함하는 여러 응용분야들을 포함한다. 특히 중요한 응용분야는 이동 가입자용 무선전화기이다.
주파수분할 다중액세스(FDMA), 시분할 다중액세스(TDMA) 및 코드분할 다중액세스(CDMA)를 포함하는 무선통신 시스템을 위하여 다양한 무선(over-the-air) 인터페이스가 다수 개발되었다. 이와 관련하여, 수개의 국내 및 국제 표준, 예를 들어 앰프스(AMPS), 이동통신용 글로벌 시스템(GSM) 및 잠정 표준 95(IS-95)등이 제정되었다. 전형적인 무선 전화통신 시스템은 코드분할 다중액세스(CDMA) 시스템이다. IS-95 표준 및 그 파생인 IS-95A, ANSI J-STD-008, IS-95B, 제3세대 표준 IS-95C 및 IS-2000등(통칭으로 모두 IS-95로 언급됨)은 미국통신산업협회(TIA) 및 셀룰러 또는 PCS 전화통신 시스템용 CDMA 무선 인터페이스를 사용하기 위한 공지된 다른 표준단체에 의하여 공표되었다. IS-95 표준을 사용하도록 구성된 전형적인 무선통신 시스템은 미국특허번호 제5,103,459호 및 제4,901,307호에 개시되어 있으며, 이 모두는 본 발명의 양수인에게 양도되고, 본 명세서에서 상호참조된다.
인간의 음성생성 모델과 관련된 파라미터를 추출하여 음성을 압축하는 기술을 이용하는 장치를 음성코더라 한다. 음성코더는 입력 음성 신호를 시간블록 또는 분석프레임으로 분할한다. 음성코더는 전형적으로 인코더 및 디코더를 포함한다. 인코더는 입력 음성 프레임을 분석하여 임의의 관련 파라미터를 추출한다음, 이 파라미터를 2진 표현, 즉 비트 세트 또는 2진 데이터 패킷으로 양자화한다. 데이터 패킷은 통신채널을 통하여 수신기 및 디코더로 전송된다. 디코더는 데이터패킷을 처리하고 파라미터를 생성하기 위하여 이들을 역양자화하며, 역양자화 파라미터를 사용하여 음성 프레임을 재합성한다.
음성 코더의 기능은 음성에 고유한 모든 기본적인 리던던시(redundancy)를 제거함으로써 디지털화된 음성 신호를 저비트율 신호로 압축하는 것이다. 디지털 압축은 입력 음성 프레임을 파라미터로 나타내고, 양자화를 이용하여 파라미터를 비트 세트로 나타냄으로써 달성된다. 만일 입력 음성 프레임이 다수의 비트(Ni)를 가지며 음성 코더에 의하여 생성된 데이터 패킷이 다수의 비트(No)를 가진다면, 음성 코더에 의하여 달성되는 압축율은 Cr=Ni/No가 된다. 문제는 목표 압축율을 성취하면서 디코딩된 음성의 높은 음성품질을 유지하는 것이다. 음성 코더의 성능은 (1) 음성 모델 또는 상술한 분석 및 합성 처리의 조합이 얼마나 잘 수행되는가, (2) 파라미터 양자화 처리가 프레임당 No의 목표 비트율에서 얼마나 잘 수행되는가에 달려있다. 따라서, 음성 모델의 목적은 각각의 프레임에 대하여 적은 파라미터 세트를 이용하여 목표 음성 품질 또는 음성 신호의 특성을 포착하는 것이다.
아마도 음성 코더의 설계시 가장 중요한 것은 음성 신호를 기술하는 가장 양호한 파라미터 세트(벡터 포함)를 검색하는 것이다. 이러한 양호한 파라미터 세트는 정확한 음성 신호의 재구성을 위하여 낮은 시스템 대역폭을 요구한다. 피치, 신호전력, 스펙트럼 엔벨로프(또는 포르만트(formant)), 진폭 및 위상 스펙트럼등이 음성 코딩 파라미터의 예이다.
음성 코더는 시간-분해능 처리를 사용하여 작은 음성 세그먼트(전형적으로 5밀리초(ms) 서브프레임) 동시에 인코딩함으로써 시간-영역 음성 파형을 포착하는 시간영역 코더로서 실행될 수 있다. 각각의 서브프레임에 대하여, 코드북 공간으로부터의 높은-분해능 대표값은 공지된 여러 탐색 알고리즘의 수단에 의하여 발견된다. 선택적으로, 음성 코더는 파라미터 세트(분석)를 이용하여 입력 음성 프레임의 짧은 구간 음성 스펙트럼을 포착하고 대응하는 합성 프로세서를 이용하여 상기 스펙트럼 파라미터들로부터 음성 파형을 재구성하는 주파수 영역 코더로서 실행될 수 있다. 파라미터 양자화기는 A. Gersho & R.M. Gray,Vector Quantization and Signal Compression(1992)에 개시된 공지된 양자화 기술에 따라 코드 벡터의 저장된 대표값을 이용하여 파라미터를 나타냄으로써 파라미터를 유지한다.
공지된 시간 영역 음성코더는 L.B. Rabiner & R.W. Schafer,Digital Processing of Speech Signals396-453(1978)에 개시된 코드 여기 선형 예측(CELP) 코더이며, 이 문헌은 참조를 위하여 본 명세서에 통합된다. CELP 코더에서, 음성 신호의 단구간의 상관 또는 리던던시는 선형 예측(LP) 분석에 의하여 제거되며, LP 분석은 단구간의 포르만트 필터 계수를 찾는다. 단구간 예측 필터를 입력 음성 프레임에 적용하는 것은 LP 잔여 신호가 생성되며, LP 잔여 신호는 모델링되어 긴구간 예측 필터 파라미터 및 후속된 확률적 코드북을 이용하여 양자화된다. 그러므로 CELP 코딩은 시간-영역 음성 파형을 인코딩하는 작업을 LP 단구간 필터 계수를 인코딩하는 작업과 LP 잔여신호를 인코딩하는 각각의 작업으로 분리한다. 시간-영역 코딩은 고정율(즉, 각 프레임에 대하여 동일한 N0비트를 이용) 또는 가변율(서로 다른 비트율이 서로 다른 타입의 프레임에 사용되는)에서 수행될 수 있다. 가변율 코더는 목표 품질을 획득하는데 적당한 레벨로 코덱 파라미터를 인코딩하는데 필요한 비트만을 이용한다. 전형적인 가변율 CELP 코더는 미국 특허번호 제5,414,796호에 개시되어 있으며, 이는 본 발명의 양수인에게 양도되고, 참조를 위하여 본 명세서에 통합된다.
CELP 코더와 같은 시간-영역 코더는 전형적으로 시간-영역 음성파형의 정확도를 유지하기 위하여 프레임당 높은 N0비트수에 의존한다. CELP 코더는 일반적으로 프레임당 N0의 비트수가 상대적으로 큰 경우(예를 들어 8kbps이상)인 경우, 양호한 음성 품질을 전달한다. 그러나 낮은 비트율에서(4kbps이하), 시간-영역 코더는 제한된 수의 이동가능한 비트들로 인해 고품질 및 일관된 성능을 유지할 수 없다. 낮은 비트율에서, 제한된 코드북 공간은 높은 비트율의 상업적 응용에서 성공적으로 이용되는 종래의 시간-영역 코더의 파형 매칭 능력을 제한한다. 따라서, 시간상의 개선에도 불구하고, 낮은 비트율에서 동작하는 여러 CELP 코딩 시스템은 잡음으로 인한 큰 왜곡을 겪는다.
결국, 낮은 비트율(즉, 2.4내지 4kbps이하의 범위)의 중간쯤에서 동작하는 높은 품질의 음성 코더를 개발할 필요성이 제기되었다. 응용 영역은 무선 전화기, 위성 통신, 인터넷 전화기, 여러 멀티미디어 및 음성-스트리밍 응용, 음성 메일 및 다른 음성 저장 시스템을 포함한다. 중요한 것은 패킷 손실상황하에서 높은 품질과 일관된 성능을 유지하는 것이다. 최근의 여러 음성 코딩 표준화 작업은 저비율의 음성 코딩 알고리즘을 개발하는쪽으로 이루어진다. 저비트율의 음성 코더는 허용가능한 응용 대역폭에 대하여 더 많은 채널 또는 사용자를 생성하며, 적당한 채널 코딩의 추가 레이어와 결합된 저비트율 음성 코더는 코더 명세(specification)의 전체 비트 버젯(budget)에 적합할 수 있으며, 채널에러 상황하에서 일관된 성능을 전달할 수 있다.
통상적인 매체에 대하여 낮은 비트율을 가진 예측 음성 코더는 프레임 소거로 인하여 야기된 열악한 채널 상태하에서 비효율적으로 수행되는 경향이 있다. 음성 코더의 예측 특성은 프레임 소거에 연이어 수신된 프레임(즉, 전송시에 손실되어 수신되지 않은 프레임)이 불량한 이전 정보를 기초로 합성되고 디코더가 관련 인코더와 동기를 잃게 될 것이라는 것을 나타낸다. 따라서 합성된 프레임은 저하되고 음성 품질 역시 저하될 것이다. 따라서 열악한 채널 상태하에서 음성 코더의 성능을 개선하는 것은 바람직하다. 그러므로 프레임 소거 상태하에서 성능을 개선하기 위하여 피드백 메카니즘을 사용하는 음성 코더가 요구된다.
본 발명은 음성 처리분야에 관한 것으로서, 특히 프레임 소거 상태에서 예측 음성 코더의 성능을 개선하기 위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및 장치에 관한 것이다.
도 1은 무선 통신 시스템의 블록도이다.
도 2는 음성 코더에 의하여 각 단부에서 종결된 통신 채널의 블록도이다.
도 3은 인코더의 블록도이다.
도 4는 디코더의 블록도이다.
도 5는 음성 코딩 결정 프로세스를 도시한 흐름도이다.
도 6A는 음성신호 크기 대 시간을 나타낸 그래프이며, 도 6B는 선형예측(LP) 잔여 크기 대 시간을 나타낸 그래프이다.
도 7은 수신기의 디코더로부터 수신기의 인코더로, 수신기의 인코더로부터 송신기의 디코더로, 송신기의 디코더로부터 송신기의 인코더로 피드백 루프를 사용하는 음성 코딩 시스템의 블록도이다.
본 발명은 프레임 소거 상태에서 성능을 개선하기 위하여 피드백 메카니즘을 사용하는 음성 코더에 관한 것이다. 따라서, 본 발명의 일 양태에서, 음성 코딩 시스템은 유리하게 제 1 인코더 및 제 1 디코더를 포함하는 제 1 음성 코더; 및 제 2 인코더 및 제 2 디코더를 포함하는 제 2 음성 코더를 포함하며, 상기 제 1 인코더는 음성 프레임 패킷을 인코딩하며 통신 채널을 통하여 상기 제 2 디코더로 패킷을 전송하도록 구성되며, 상기 제 2 디코더는 패킷을 수신하여 디코딩하며 만일 전송된 프레임이 상기 제 2 디코더에 의하여 수신되지 않는다면 상기 제 2 인코더에 신호를 전송하며, 상기 제 2 인코더는 패킷을 인코딩하여 전송하며 상기 제 2 디코더의 신호에 응답하여 패킷을 수정하며, 상기 제 1 디코더는 패킷을 수신하여 디코딩하며 상기 제 2 인코더의 수정된 패킷을 수신할 때 제 1 인코더에 신호를 전송하며, 상기 제 1 인코더는 또한 상기 제 1 디코더의 신호에 응답하여 수정된 인코딩 포맷을 이용하여 패킷을 인코딩하도록 구성된다.
본 발명의 다른 양태에서, 제 1 음성 코더의 제 1 디코더로부터 제 2 음성 코더의 제 1 인코더로 피드백을 제공하는 방법은 만일 제 1 디코더가 제 1 인코더에 의하여 전송된 프레임을 수신하는 것을 실패한다면 제 1 음성 코더의 제 2 인코더에게 통보하고; 상기 통보에 응답하여 제 2 인코더로부터 제 2 디코더로 수정된 패킷을 전송하며; 제 2 디코더가 제 2 인코더로부터 수정된 패킷을 수신할 때 제 1 인코더에게 통보하고; 그리고 수정된 인코딩 포맷을 이용하여 제 1 인코더에서 패킷을 인코딩하는 단계를 포함한다.
본 발명의 또 다른 양태에서는 음성 코딩 시스템의 피드백 메카니즘으로서 상기 음성 코딩 시스템은 제 1 인코더 및 제 1 디코더를 포함하는 제 1 음성 디코더 및 제 2 인코더 및 제 2 디코더를 포함하는 제 2 음성 디코더를 포함하며, 상기 피드백 메카니즘은 제 2 디코더가 상기 제 1 인코더에 의하여 전송된 프레임을 수신하는데 실패하는 경우 제 2 인코더에게 통보하는 수단; 상기 통보에 응답하여 제 2 인코더로부터 제 1 디코더에 수정된 패킷을 전송하는 수단; 제 1 디코더가 제 2 인코더의 수정된 패킷을 수신할 때 제 1 인코더에게 통보하는 수단; 그리고 수정된인코딩 포맷을 이용하여 제 1 인코더에서 패킷을 인코딩하는 수단을 포함한다.
본 명세서에 기술된 전형적인 실시예들은 CDMA 무선(over-the-air) 인터페이스를 이용하도록 구성된 무선 전화통신 시스템과 관련된다. 그럼에도 불구하고 당업자들은 본 발명의 특징을 이용하는 서브샘플링 방법 및 장치가 당업자에게 공지된 기술을 이용하는 여러 통신 시스템들과 관련된다는 것을 이해할 것이다.
도 1에 도시된 바와 같이, CDMA 무선 전화시스템은 일반적으로 다수의 이동가입자 유니트(10), 다수의 기지국(12), 기지국 제어기(BSC;14) 및 이동교환센터(MSC;16)를 포함한다. MSC(16)는 통상적인 공중 전화망(PSTN;18)과인터페이스하도록 구성된다. MSC(16)은 또한 BSC(14)와 인터페이스하도록 구성된다. BSC(14)는 귀항 라인을 통하여 기지국(12)에 접속된다. 귀항 라인은 예를 들어 E1/T1, ATM, IP, PPP, 프레임 릴레이, HDSL, ADSL, 또는 xDSL을 포함하는 공지된 여러 인터페이스를 지원하도록 구성될 수 있다. 시스템에는 두개 이상의 BSC(14)가 상주한다. 각각의 기지국(12)은 적어도 하나의 선택기(도시되지 않음)를 포함하며, 각각의 선택기는 기지국(12)으로부터 특정한 방사방향으로 떨어진 안테나 또는 무지향성 안테나를 포함한다. 선택적으로, 각각의 선택기는 다이버시티 수신을 위하여 두개의 안테나를 포함할 수 있다. 각각의 기지국(12)은 다수의 주파수 할당을 지원하도록 설계될 수 있다. 섹터의 교차 및 주파수 할당은 CDMA 채널로 언급될 수 있다. 기지국(12)은 기지국 트랜시버 서브시스템(BTS;12)으로서 공지될 수 있다. 선택적으로, "기지국"은 당업계에서 통상적으로 하나의 BSC(14) 및 하나 이상의 BTS(12)로 언급된다. BTS(12)는 또한 "셀 사이트"(12)로서 표시될 수 있다. 선택적으로, 주어진 BTS(12)의 개별 섹터들이 셀 사이트로서 언급될 수 있다. 이동 가입자 유니트(10)는 전형적으로 셀룰러 또는 PCS 전화기(10)이다. 이 시스템은 유리하게 IS-95 표준에 따라 이용되도록 구성된다.
셀룰러 전화 시스템의 일반적인 동작동안, 기지국(12)은 이동 유니트(10) 세트로부터 역방향 링크 신호 세트를 수신한다. 이동 유니트(10)는 전화기 호출 또는 다른 통신을 수행한다. 주어진 기지국(12)에 의하여 수신된 각각의 역방향 링크 신호는 기지국(12)내에서 처리된다. 최종 데이터는 BSC(14)로 전송된다. BSC(14)는 기지국(12)간의 소프트 핸드오프의 조정을 포함하는 이동성 관리 기능및 호출 자원 할당을 제공한다. BSC(14)는 또한 PSTN(18)과 인터페이스하기 위하여 추가의 라우팅 서비스를 제공하는 MSC(16)에 수신된 데이터를 라우팅한다. 유사하게, PSTN(18)은 MSC(16)와 인터페이스하며, MSC(16)는 BSC(14)와 인터페이스하고 다음으로 기지국(12)을 제어하여 이동 유니트 세트(10)에 순방향 링크 신호 세트를 전송한다.
도 2에서, 제 1 인코더(100)는 디지털화된 음성 샘플(s(n))을 수신하고, 전송 매체(102) 또는 통신 채널(102)을 통하여 제 1 디코더(104)로 전송하기 위한 샘플(s(n))을 인코딩한다. 디코더(104)는 인코딩된 음성 샘플을 디코딩하며, 출력 음성 신호(SSYNTH(n))를 합성한다. 반대방향으로의 전송을 위하여, 제 2 인코더(106)는 통신 채널(108)을 통하여 전송되는 디지털화된 음성 샘플(S(n))을 인코딩한다. 제 2 디코더(110)는 인코딩된 음성 샘플을 수신 및 디코딩하고, 합성된 출력 음성 신호(SSYNTH(n))를 생성한다.
음성 샘플(S(n))은 예를 들어 펄스 코드 변조(PCM), 압신된 μ-법칙, 또는 A-법칙을 포함하는 공지된 여러 방법중 임의의 방법에 따라 디지털화 및 양자화된 음성 신호를 나타낸다. 공지된 바와 같이, 음성 샘플(S(n))은 입력 데이터 프레임으로 구성되고, 각각의 프레임은 미리 결정된 개수의 디지털화된 음성 샘플(S(n))을 포함한다. 전형적인 실시예에서, 8kHz의 샘플링율이 사용되며, 각각의 20ms 프레임은 160개의 샘플을 포함한다. 이하 개시되는 실시예에서, 데이터 전송율은 13,2kbps(전데이터율)에서 6,2kbps(1/2데이터율), 2,6kbps(1/4데이터율),1kbps(1/8데이터율)으로 프레임단위로 변경될 수 있다. 데이터 전송율을 변경하는 것은 낮은 비트율이 상대적으로 적은 음성 정보를 포함하는 프레임에 선택적으로 이용될 수 있기 때문에 유리하다. 당업자에 의하여 이해되는 바와 같이, 다른 샘플링율, 프레임 크기 및 데이터 전송율이 사용될 수 있다.
제 1 인코더(100) 및 제 2 디코더(110)는 모두 제 1 음성 코더 또는 음성 코덱을 포함한다. 음성 코더는 예를 들면 도 1을 참조로 하여 앞서 기술된 바와같이 가입자 유니트, BTS, 또는 BSC를 포함하며 음성 신호를 전송하는 임의의 통신 장치에 사용될 수 있다. 유사하게, 제 2 인코더(106) 및 제 1 디코더(104)는 모두 제 2 음성 코더를 포함한다. 음성 코더가 디지털 신호 처리기(DSP), 주문형 집적회로(ASIC), 이산 게이트 로직, 펌웨어, 또는 임의의 통상적인 프로그램 가능한 모듈 및 마이크로프로세서를 이용하여 수행될 수 있다는 것은 당업자에 의하여 이해될 것이다. 소프트웨어 모듈은 RAM 메모리, 플래쉬 메모리, 레지스터 또는 임의의 다른 형태의 기록가능한 공지된 저장매체에 상주할 수 있다. 선택적으로, 임의의 통상적인 프로세서, 제어기 또는 상태 머신이 마이크로프로세서를 대체할 수 있다. 음성 코딩을 위하여 특별히 설계된 전형적인 ASIC은 본 발명의 양수인에게 양도된 미국 특허번호 제5,727,123호 및 본 발명의 양수인에게 양도되며 VOCODER ASIC으로 명명되고 1994년 2월 16일에 출원된 미국 특허출원 번호 제08/197,417호에 개시되어 있다.
도 3에서, 음성 코더에서 사용될 수 있는 인코더(200)는 모드 결정 모듈(202), 피치 추정 모듈(204), LP 분석 모듈(206), LP 분석 필터(208), LP 양자화 모듈(210) 및 잔여 양자화 모듈(212)을 포함한다. 입력된 음성 프레임(S(n))은 모드 결정 모듈(202), 피치 추정 모듈(204), LP 분석 모듈(206) 및 LP 분석 필터(208)에 제공된다. 모드 결정 모듈(202)은 각각의 입력된 음성 프레임(S(n))중에서 무엇보다도 주기성, 에너지, 신호대잡음비(SNR) 또는 제로크로싱율을 기초로 모드 인덱스(IM) 및 모드(M)를 생성한다. 주기성과 관련되어 음성 프레임을 분류하는 여러 방법들은 미국 특허번호 제5,911,128호에 개시되어 있으며, 이 모두는 본 발명의 양수인에게 양도되고, 본 명세서에서 상호참조된다. 이와같은 방법들은 또한 무선 통신산업 협회 잠정 표준 TIA/EIA IS-127 및 TIA/EIA IS-733에 구체화되어 있다. 전형적인 모드 결정 계획은 전술한 미국 특허출원번호 제09/217,341호에 개시되어 있다.
피치 추정 모듈(204)은 각각의 입력된 음성 프레임(S(n))을 기초로 피치 인덱스(IP) 및 래그값(P0)을 생성한다. LP 분석 모듈(206)은 LP 파라미터(a)를 생성하기 위하여 각각의 입력된 음성 프레임(S(n))에 대하여 선형 예측 분석을 수행한다. LP 파라미터(a)는 LP 양자화 모듈(210)에 제공된다. LP 양자화 모듈(210)은 또한 모드 M을 수신하며, 이에 따라 모드종속 방식으로 양자화 처리를 수행하게 된다. LP 양자화 모듈(210)은 LP 인덱스(ILP) 및 양자화된 LP 파라미터()를 생성한다. LP 분석 필터(208)는 입력된 음성 프레임(S(n))외에 양자화된 LP 파라미터()를 수신한다. LP 분석 필터(208)는 LP 잔여 신호(R[n])을 생성하며, 이는 양자화된 선형 예측 파라미터()를 기초로 하는 재구성된 음성 및 입력된 음성 프레임(S(n)) 사이의 에러를 나타낸다. LP 잔여 R[n], 모드 M 및 양자화된 LP 파라미터()는 잔여 양자화 모듈(212)에 제공된다. 이러한 값들을 기초로, 잔여 양자화 모듈(212)은 잔여 인덱스(IR) 및 양자화된 잔여 신호()를 생성한다.
도 4에서, 음성 코더에 사용될 수 있는 디코더(300)는 LP 파라미터 디코딩 모듈(302), 잔여 디코딩 모듈(304), 모드 디코딩 모듈(306) 및 LP 합성 필터(308)를 포함한다. 모드 디코딩 모듈(306)은 모드 인덱스(IM)를 수신하여 디코딩하며, 이로부터 모드 M을 생성한다. LP 파라미터 디코딩 모듈(302)은 모드 M 및 LP 인덱스(ILP)를 수신한다. LP 파라미터 디코딩 모듈(302)은 수신된 값들을 디코딩하여 양자화된 LP 파라미터()를 생성한다. 잔여 디코딩 모듈(304)은 잔여 인덱스(IR), 피치 인덱스(IP) 및 모드 인덱스(IM)를 수신한다. 잔여 디코딩 모듈(304)은 수신된 값들을 디코딩하여 양자화된 잔여 신호()를 생성한다. 양자화된 잔여 신호() 및 양자화된 LP 파라미터()는 LP 합성 필터(308)에 제공되며, 이 필터는 디코딩된 출력 음성 신호()를 합성한다.
도 3의 인코더(200) 및 도 4의 디코더(300)의 여러 모듈의 동작 및 수행은 상술한 미국 특허번호 5,414,796호 및 L.B. Rabiner & R.W.Schafer,Digital Processing of Speech Signals396-453(1978)에 개시되어 있다.
도 5의 흐름도에 도시된 바와 같이, 일 실시예를 따르는 음성 코더는 전송을 위하여 음성 샘플을 처리하는 여러 단계들을 수행한다. 단계 400에서, 음성 코더는 연속 프레임에서 음성 신호의 디지털 샘플을 수신한다. 주어진 프레임을 수신할 때, 음성 코더는 단계 402로 진행된다. 단계 402에서, 음성 코더는 프레임의 에너지를 검출한다. 에너지는 프레임의 음성 활성도의 측정치이다. 음성 검출은 디지털화된 음성 샘플의 진폭의 제곱을 합산하고 그 결과 에너지를 임계값과 비교함으로써 수행된다. 일 실시예에서, 임계값은 배경잡음의 변화하는 레벨에 기초하여 적용된다. 전형적인 가변 임계음성 활성검출기는 상술한 미국 특허번호 제5,414,796호에 개시되어 있다. 어떤 무성음은 배경잡음으로서 잘못 인코딩된 매우 낮은 에너지의 샘플일 수 있다. 이를 방지하기 위하여, 저에너지 샘플의 스펙트럼 기울기가 상술한 미국 특허번호 제5,414,796호에 개시된 바와 같이 배경잡음과 무성음을 구별하는데 사용될 수 있다.
프레임의 에너지를 검출한 후에, 음성 코더는 단계 404로 진행한다. 단계 404에서, 음성 코더는 검출된 프레임 에너지가 음성정보를 포함하는 프레임을 분류하기에 충분한지를 결정한다. 만일 검출된 프레임 에너지가 미리 결정된 임계값 이하로 떨어진다면, 음성 코더는 단계 406으로 진행한다. 단계 406에서, 음성 코더는 배경잡음(즉, 음성이 아니거나 소리가 없는 상태)으로서 프레임을 인코딩한다. 일 실시예에서, 배경잡음 프레임은 1/8비트율 또는 1kbps로 인코딩된다. 만일 단계 404에서, 검출된 프레임 에너지가 미리 결정된 임계레벨을 충족시키거나 초과한다면, 프레임은 음성으로서 분류되고 음성 코더는 단계 408로 진행된다.
단계 408에서, 음성 코더는 프레임이 무성음인지의 여부를 결정한다. 즉, 음성 코더는 프레임의 주기성을 검사한다. 주기성 검사에 관한 여러 공지된 방법들은 예를 들면 제로 크로싱(zero crossing)의 사용 및 정규 자기상관 함수(NACF)의 사용을 포함한다. 특히, 주기성을 검사하기 위한 제로 크로싱 및 NACF의 사용은 상술한 미국특허번호 제5,911,128호 및 미국특허출원번호 제09/217,341호에 개시되어 있다. 또한, 유성음과 무성음을 구분하는데 사용되는 상술한 방법은 무선통신산업협회 잠정 표준 TIA/EIA IS-127 및 TIA/EIA IS-733호에 구체화되어 있다. 만일 프레임이 단계 408에서 무성음인 것으로 결정되었다면, 음성 코더는 단계 410으로 진행된다. 단계 410에서, 음성 코더는 프레임을 무성음으로 인코딩한다. 일 실시예에서, 무성음 프레임은 1/4비트율 또는 2.6kbps로 인코딩된다. 만일 단계 408에서 프레임이 무성음으로 결정되지 않는다면, 음성 코더는 단계 412로 진행된다.
단계 412에서, 음성 코더는 상술한 미국특허번호 제5,911,128호에 개시된 바와 같이 공지된 주기성 검출방법을 이용하여 프레임이 중간 음성인지를 결정한다. 만일 프레임이 중간 음성인 것으로 결정되면, 음성 코더는 단계 414로 진행된다. 단계 414에서, 프레임은 중간 음성으로서 인코딩된다(즉, 무성음에서 유성음으로 전이되는 단계). 일 실시예에서, 중간 음성 프레임은 MULTIPULSE INTERPOLATIVE CODING OF TRANSITION SPEECH FRAMES로 명명되고 1999년 5월 7일 출원된 미국 특허출원번호 제09/307,294호에 개시된 멀티펄스 보간 코딩 방법에 따라 인코딩되며, 상기 출원은 본 발명의 양수인에게 양도되고, 본 명세서에서 상호참조된다. 다른 실시예에서, 중간 음성 프레임은 전데이터율(full rate) 또는 13.2kbps로 인코딩된다.
단계 412에서, 음성 코더가 프레임이 중간음성이 아닌것으로 결정하면, 단계 416으로 진행된다. 단계 416에서, 음성 코더는 유성음으로 프레임을 인코딩한다. 일 실시예에서, 유성음 프레임은 전데이터율(full rate) 또는 6.2kbps로 인코딩될 수 있다. 또한, 유성음 프레임을 전데이터율 또는 13.2kbps(또는 8k CELP 코더에서 전데이터율, 8kbps)로 인코딩할 수 있다. 그러나 당업자는 1/2데이터율로 코딩된 음성 프레임은 코더가 음성 프레임의 안정상태를 이용하여 유효한 대역폭을 절약할 수 있도록 한다는 것을 이해할 것이다. 게다가, 유성음을 인코딩하는데 사용된 인코딩율과는 상관없이, 유성음은 이전 프레임으로부터의 정보를 이용하여 유리하게 코딩되며, 따라서 예측가능하게 코딩될 것이다.
당업자들은 음성 신호 또는 대응되는 LP 잔여부중 하나가 도 5에 도시된 바와 같은 단계들에 의하여 인코딩될 수 있다는 것을 이해할 것이다. 잡음, 무성음, 중간음, 유성음의 파형특성은 도 6A의 그래프에 시간함수로 도시되어 있다. 잡음, 무성음, 중간음, 유성음 LP 잔여치의 파형특성은 도 6B의 그래프에 시간함수로 도시되어 있다.
일 실시예에서, 음성 코딩 시스템(500)은, 도 7에 도시된 바와 같이, 수신기의 디코더로부터 수신기의 인코더로, 수신기의 인코더로부터 송신기의 디코더로, 송신기의 디코더로부터 송신기의 인코더로 피드백 루프를 제공하도록 구성된다. 수신기 디코더로부터 송신기 인코더로의 피드백 루프는 음성 코딩 시스템(500)로 하여금 후술되는 바와 같이 불량한 프레임 메모리의 전파를 회피하도록 함으로써 프레임 소거 상태하에서 성능을 유리하게 개선할 수 있도록 한다.
음성 코딩 시스템(500)은 제 1 및 제 2 음성 코더(502,504)를 포함한다. 제 1 음성 코더(502)는 송신기 코더로 지정되고, 제 2 음성 코더(504)는 단순히 설명만을 위하여 수신기 음성 코더로 지정된다. 제 1 음성 코더(502)는 인코더(506) 및 디코더(508)를 포함한다. 제 2 음성 코더(504)는 인코더(510) 및 디코더(512)를 포함한다. 음성 코더(502,504)중 하나는 유리하게 DSP의 일부로서 수행될 수 있으며, 예를 들면 가입자 유니트 또는 PCS 또는 셀룰러 전화 시스템의 기지국 또는 위성 시스템의 가입자 유니트 또는 게이트웨이에 상주할 수 있다.
인코더(506)는 통신 채널을 통하여 패킷을 전송한다. 디코더(512)는 패킷을 수신한다. 만일 프레임이 전송동안 손실되었다면(예를 들어, 열등하거나 잡음이 있는 채널 상태로 인하여), 디코더(512)는 프레임 소거가 수신되었다는것을 지시하면서 인코더(510)에 신호를 전송한다. 인코더(510)는 이후에 소거 지시자 비트(EIB)로 지정된 특정 비트값을 전송될 다음 패킷에 1을 세팅한다. 인코더(510)는 이후에 패킷을 전송한다. 패킷은 디코더(508)에 의하여 수신된다. 디코더(508)는 1로 세팅된 EIB를 가진 패킷이 수신되었음을 지시하면서 인코더(506)에 신호를 전송한다. 디코더(508)로부터 신호를 수신할 때, 인코더(506)는 다음 패킷으로 로우-메모리-인코딩된 패킷을 전송한다. 특정 실시예에서, 인코더(506)는 다음 패킷으로 메모리없이-인코딩된 패킷을 전송한다.
음성 코딩 시스템(500)은 다음 이유로 유리하다. 전형적으로, 상대적으로 큰 메모리가 예측 음성 코더에서 사용된다. 따라서 인코딩될 때의 각각의 프레임(특정 실시예에서, 각각의 프레임은 20ms의 길이를 가진다)은 먼저 인코딩된 프레임으로부터의 정보를 이용한다. 이것은 프레임 소거 상태하에서 음성 코더의 성능에 영향을 미친다. 예를 들어, 만일 프레임(또는 다중 프레임)이 소거되었다면, 소거 이후의 프레임은 예측 기반의 음성 코더에서 품질이 저하된다(상기 코더는 현재의 프레임을 예측하기 위하여 과거 프레임의 정보를 이용한다). 이것은 특히 심층적인 예측이 존재하는 저비트율 음성 코더에 효과적이다. 그러나 상술한 실시예에 따르면, 수신측 음성 디코더(512)가 소거된 프레임을 수신하였을 때, 디코더(512)는 디코더(512)가 소거를 받았다는 것을 송신기측 음성 인코더(506)에 피드백 전송하고, 이에 따라 수신측 음성 디코더(512)의 출력 및 메모리와 송신측 음성 인코더(506)의 출력 및 메모리를 다시 동기화시키기 위하여 로우-메모리(low memory)(최소 예측) 인코딩 또는 메모리없는(예측없는) 인코딩중 하나를 요청한다. 그러므로, 상술한 바와 같이, 수신측 음성 디코더(512)는 수신측 음성 인코더(510)에게 다음 패킷과 함께 EIB를 전송할 것을 통보한다. 송신측 음성 디코더(508)는 이후에 송신측 음성 인코더(506)에게 수신된 EIB를 알려준다. 송신측 음성 인코더(506)는 로우-메모리(최소 예측) 인코딩 또는 메모리없는(예측 없는) 인코딩중 하나를 수행하며, 동시에 대응되는 패킷을 수신측 음성 디코더(512)에 전송한다. 수신측 음성 디코더(512)는 이후에 송신측 음성 인코더(506)와 그 메모리를 다시 동기화시키거나 리셋시키기 위하여 디코딩된 패킷을 이용하여 로우-메모리 또는 메모리없는 패킷을 디코딩한다. 로우-메모리(low memory) 또는 메모리없는 인코딩된 패킷을 수신하기 전에 수신측 음성 디코더(512)가 대기해야하는 최대 시간은 1 프레임 시간(수신측 인코더(510)이 이미 패킷 생성을 시작하였기 때문)과, 다음 프레임 시간(송신측 인코더(506)가 이미 EIB를 수신하였을 때 패킷의 생성을 시작하였기 때문)과 단방향 전송 지연 시간을 더한 시간이 된다.
지금까지, 프레임 소거 상태하에서 예측 음성 코더에서 성능을 개선하기 위하여 디코더로부터 인코더로 피드백을 제공하는 신규한 방법 및 장치가 설명되었다. 당업자들은 디지털 신호 프로세서(DSP), 주문형 집적회로(ASIC), 이산 게이트 또는 트랜지스터 로직, 레지스터 또는 FIFO와 같은 이산 하드웨어 요소, 한 세트의 펌웨어 명령을 수행하는 프로세서 또는 임의의 통상적인 프로그램가능한 소프트웨어 모듈 및 프로세서를 이용하여 기술된 실시예와 연관된 여러 논리 블록 및 알고리즘 단계가 수행될 수 있다는 것을 이해할 것이다. 프로세서는 유리하게 마이크로프로세서일 수 있지만, 선택적으로 임의의 통상적인 프로세서, 제어기, 마이크로제어기 또는 상태 머신일 수 있다. 소프트웨어 모듈은 RAM 메모리, 플래쉬 메모리, 레지스터 또는 임의 형태의 기록가능한 저장 매체에 상주할 수 있다. 당업자들은 또한 데이터, 명령, 인스트럭션, 정보, 신호, 비트, 심볼 및 칩들이 유리하게 전압, 전류, 전자기파, 자장 또는 자분, 광필드 또는 광입자 또는 그 조합으로서 참조될 수 있다는 것을 이해할 것이다.
본 발명의 바람직한 실시예가 지금까지 기술되었다. 본 발명의 범위를 벗어나지 않으면서 다양한 변형예를 실시할 수 있다는 것은 당업자에게 명백하다. 그러므로 본 발명은 다음 청구항외에는 제한받지 않는다.

Claims (18)

  1. 제 1 인코더 및 제 1 디코더를 포함하는 제 1 음성 코더; 그리고
    제 2 인코더 및 제 2 디코더를 포함하는 제 2 음성 코더를 포함하며,
    상기 제 1 인코더는 음성 프레임의 패킷을 인코딩하여 이 패밋을 전송 채널을 통하여 상기 제 2 디코더에 전송하도록 구성되며, 상기 제 2 디코더는 상기 패킷을 수신하고 디코딩하여 전송된 프레임이 상기 제 2 디코더에 의하여 수신되지 않는다면 상기 제 2 인코더에 신호를 전송하며, 상기 제 2 인코더는 패킷을 인코딩하여 전송하며 상기 제 2 디코더로부터의 신호에 응답하여 패킷을 수정하며, 상기 제 1 디코더는 패킷을 수신하고 디코딩하여 상기 제 2 인코더로부터의 수정된 패킷을 수신할 때 제 1 인코더에 신호를 전송하며, 상기 제 1 인코더는 상기 제 1 디코더로부터의 신호에 응답하여 수정된 인코딩 포맷을 이용하여 패킷을 인코딩하도록 구성된 음성 코딩 시스템.
  2. 제 1 항에 있어서, 상기 수정된 패킷은 1의 디지털값으로 세팅된 소거 지시자 비트를 가진 패킷을 포함하는 것을 특징으로 하는 음성 코딩 시스템.
  3. 제 1 항에 있어서, 상기 수정된 인코딩 포맷은 로우-메모리 인코딩 구조를 포함하는 것을 특징으로 하는 음성 코딩 시스템.
  4. 제 1 항에 있어서, 상기 수정된 인코딩 포맷은 메모리없는 인코딩 구조를 포함하는 것을 특징으로 하는 음성 코딩 시스템.
  5. 제 1 항에 있어서, 상기 제 1 음성 코더는 가입자 유니트에 상주하며, 상기 제 2 음성 코더는 무선 통신 시스템의 기지국에 상주하는 것을 특징으로 하는 음성 코딩 시스템.
  6. 제 1 항에 있어서, 상기 제 2 음성 코더는 가입자 유니트에 상주하며, 상기 제 1 음성 코더는 무선 통신 시스템의 기지국에 상주하는 것을 특징으로 하는 음성 코딩 시스템.
  7. 제 1 음성 코더의 제 1 디코더로부터 제 2 음성 코더의 제 1 인코더로 피드백을 제공하는 방법으로서:
    만일 상기 제 1 디코더가 상기 제 1 인코더에 의하여 전송된 프레임을 수신하는 것을 실패한다면 상기 제 1 음성 코더의 제 2 인코더에게 통보하는 단계;
    상기 통보에 응답하여 상기 제 2 인코더로부터 상기 제 2 디코더로 수정된 패킷을 전송하는 단계;
    상기 제 2 디코더가 상기 제 2 인코더로부터 상기 수정된 패킷을 수신할 때 상기 제 1 인코더에게 통보하는 단계; 그리고
    수정된 인코딩 포맷을 이용하여 상기 제 1 인코더에서 패킷을 인코딩하는 단계를 포함하는 방법.
  8. 제 7 항에 있어서, 상기 수정된 패킷은 1의 디지털값으로 세팅된 소거 지시자 비트를 가진 패킷을 포함하는 것을 특징으로 하는 방법.
  9. 제 7 항에 있어서, 상기 수정된 인코딩 포맷은 로우-메모리 인코딩 구조를 포함하는 것을 특징으로 하는 방법.
  10. 제 7 항에 있어서, 상기 수정된 인코딩 포맷은 메모리없는 인코딩 구조를 포함하는 것을 특징으로 하는 방법.
  11. 제 7 항에 있어서, 상기 제 1 음성 코더는 가입자 유니트에 상주하며, 상기 제 2 음성 코더는 무선 통신 시스템의 기지국에 상주하는 것을 특징으로 하는 방법.
  12. 제 7 항에 있어서, 상기 제 2 음성 코더는 가입자 유니트에 상주하며, 상기 제 1 음성 코더는 무선 통신 시스템의 기지국에 상주하는 것을 특징으로 하는 방법.
  13. 제 1 인코더 및 제 1 디코더를 포함하는 제 1 음성 디코더 및 제 2 인코더및 제 2 디코더를 포함하는 제 2 음성 코더를 포함하는 음성 코딩 시스템내의 피드백 메카니즘으로서:
    제 2 디코더가 상기 제 1 인코더에 의하여 전송된 프레임을 수신하는데 실패하는 경우 제 2 인코더에게 통보하는 수단;
    상기 통보에 응답하여 제 2 인코더로부터 제 1 디코더에 수정된 패킷을 전송하는 수단;
    제 1 디코더가 제 2 인코더의 수정된 패킷을 수신할 때 제 1 인코더에게 통보하는 수단; 그리고
    수정된 인코딩 포맷을 이용하여 제 1 인코더에서 패킷을 인코딩하는 수단을 포함하는 피드백 메카니즘.
  14. 제 13 항에 있어서, 상기 수정된 패킷은 1의 디지털값으로 세팅된 소거 지시자 비트를 가진 패킷을 포함하는 것을 특징으로 하는 피드백 메카니즘.
  15. 제 13 항에 있어서, 상기 수정된 인코딩 포맷은 로우-메모리 인코딩 구조를 포함하는 것을 특징으로 하는 피드백 메카니즘.
  16. 제 13 항에 있어서, 상기 수정된 인코딩 포맷은 메모리없는 인코딩 구조를 포함하는 것을 특징으로 하는 피드백 메카니즘.
  17. 제 13 항에 있어서, 상기 제 1 음성 코더는 가입자 유니트에 상주하며, 상기 제 2 음성 코더는 무선 통신 시스템의 기지국에 상주하는 것을 특징으로 하는 피드백 메카니즘.
  18. 제 13 항에 있어서 상기 제 2 음성 코더는 가입자 유니트에 상주하며, 상기 제 1 음성 코더는 무선 통신 시스템의 기지국에 상주하는 것을 특징으로 하는 피드백 메카니즘.
KR1020027000692A 1999-07-19 2000-07-19 프레임 소거 상태에서 예측 음성 코더의 성능을 개선하기위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및장치 KR20020013962A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/356,860 US6324503B1 (en) 1999-07-19 1999-07-19 Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions
US09/356,860 1999-07-19
PCT/US2000/019671 WO2001006491A1 (en) 1999-07-19 2000-07-19 Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions

Publications (1)

Publication Number Publication Date
KR20020013962A true KR20020013962A (ko) 2002-02-21

Family

ID=23403267

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020027000692A KR20020013962A (ko) 1999-07-19 2000-07-19 프레임 소거 상태에서 예측 음성 코더의 성능을 개선하기위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및장치

Country Status (12)

Country Link
US (1) US6324503B1 (ko)
EP (1) EP1204967B1 (ko)
JP (1) JP4842472B2 (ko)
KR (1) KR20020013962A (ko)
CN (1) CN1148721C (ko)
AT (1) ATE312399T1 (ko)
AU (1) AU6354500A (ko)
BR (1) BR0012539A (ko)
DE (1) DE60028579T2 (ko)
ES (1) ES2257307T3 (ko)
HK (1) HK1045398B (ko)
WO (1) WO2001006491A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200449479Y1 (ko) * 2010-03-23 2010-07-13 최창묵 시계 수리용 트위저

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6765904B1 (en) 1999-08-10 2004-07-20 Texas Instruments Incorporated Packet networks
JP2000244384A (ja) * 1999-02-18 2000-09-08 Mitsubishi Electric Corp 移動通信端末装置及び移動通信端末装置における音声符号化レート決定方法
US6954727B1 (en) * 1999-05-28 2005-10-11 Koninklijke Philips Electronics N.V. Reducing artifact generation in a vocoder
US6801532B1 (en) 1999-08-10 2004-10-05 Texas Instruments Incorporated Packet reconstruction processes for packet communications
US6757256B1 (en) 1999-08-10 2004-06-29 Texas Instruments Incorporated Process of sending packets of real-time information
US6744757B1 (en) 1999-08-10 2004-06-01 Texas Instruments Incorporated Private branch exchange systems for packet communications
US6678267B1 (en) * 1999-08-10 2004-01-13 Texas Instruments Incorporated Wireless telephone with excitation reconstruction of lost packet
US6801499B1 (en) 1999-08-10 2004-10-05 Texas Instruments Incorporated Diversity schemes for packet communications
US6804244B1 (en) 1999-08-10 2004-10-12 Texas Instruments Incorporated Integrated circuits for packet communications
US6438518B1 (en) * 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US6549886B1 (en) * 1999-11-03 2003-04-15 Nokia Ip Inc. System for lost packet recovery in voice over internet protocol based on time domain interpolation
US7254120B2 (en) * 1999-12-09 2007-08-07 Broadcom Corporation Data rate controller
US7574351B2 (en) * 1999-12-14 2009-08-11 Texas Instruments Incorporated Arranging CELP information of one frame in a second packet
US6745012B1 (en) * 2000-11-17 2004-06-01 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive data compression in a wireless telecommunications system
ATE326088T1 (de) * 2000-11-21 2006-06-15 Koninkl Philips Electronics Nv Übertragungssystem mit anzeige von schlechten rahmen zur wiedersynchronisierung
US6839862B2 (en) * 2001-05-31 2005-01-04 Koninklijke Philips Electronics N.V. Parallel data communication having skew intolerant data groups
US7477876B2 (en) * 2001-11-02 2009-01-13 Alcatel-Lucent Usa Inc. Variable rate channel quality feedback in a wireless communication system
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
KR101237546B1 (ko) * 2005-01-31 2013-02-26 스카이프 통신 시스템에서 프레임들을 연결하는 방법
JP2007013871A (ja) * 2005-07-04 2007-01-18 Toshiba Corp 無線通信システムおよびこの無線通信システムに用いられる復号装置
US7734469B1 (en) * 2005-12-22 2010-06-08 Mindspeed Technologies, Inc. Density measurement method and system for VoIP devices
CN101561791B (zh) * 2008-04-18 2010-09-29 中兴通讯股份有限公司 一种帧宽度可扩展的同步串行接口装置
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
CN105324813A (zh) * 2013-04-25 2016-02-10 诺基亚通信公司 分组网络中的语音转码
US10993087B1 (en) 2019-12-03 2021-04-27 Motorola Solutions, Inc. Communication systems with call interrupt capabilities

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4410986A (en) * 1981-04-16 1983-10-18 Bell Telephone Laboratories, Incorporated Error and status detection circuit for a digital regenerator using quantized feedback
US4901307A (en) * 1986-10-17 1990-02-13 Qualcomm, Inc. Spread spectrum multiple access communication system using satellite or terrestrial repeaters
JPS6444499A (en) * 1987-08-12 1989-02-16 Fujitsu Ltd Forecast encoding system for voice
US5103459B1 (en) 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
US5568483A (en) * 1990-06-25 1996-10-22 Qualcomm Incorporated Method and apparatus for the formatting of data for transmission
ES2225321T3 (es) 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
JP3328945B2 (ja) * 1991-11-26 2002-09-30 松下電器産業株式会社 音声符号化装置、音声符号化方法及び音声復号化方法
DE69331166T2 (de) * 1992-02-03 2002-08-22 Koninkl Philips Electronics Nv Übertragung von digitalen Breitbandsignalen
JP3353852B2 (ja) * 1994-02-15 2002-12-03 日本電信電話株式会社 音声の符号化方法
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
TW271524B (ko) 1994-08-05 1996-03-01 Qualcomm Inc
US5768527A (en) 1996-04-23 1998-06-16 Motorola, Inc. Device, system and method of real-time multimedia streaming
CA2265640A1 (en) * 1996-09-25 1998-04-02 Qualcomm Incorporated Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters
JPH10233728A (ja) * 1997-02-19 1998-09-02 Matsushita Electric Ind Co Ltd 無線電話装置
US6108374A (en) * 1997-08-25 2000-08-22 Lucent Technologies, Inc. System and method for measuring channel quality information
US6058107A (en) 1998-04-08 2000-05-02 Motorola, Inc. Method for updating forward power control in a communication system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR200449479Y1 (ko) * 2010-03-23 2010-07-13 최창묵 시계 수리용 트위저

Also Published As

Publication number Publication date
ATE312399T1 (de) 2005-12-15
BR0012539A (pt) 2002-07-23
EP1204967A1 (en) 2002-05-15
WO2001006491A1 (en) 2001-01-25
ES2257307T3 (es) 2006-08-01
CN1361911A (zh) 2002-07-31
US6324503B1 (en) 2001-11-27
JP4842472B2 (ja) 2011-12-21
AU6354500A (en) 2001-02-05
HK1045398B (zh) 2005-03-04
EP1204967B1 (en) 2005-12-07
CN1148721C (zh) 2004-05-05
DE60028579D1 (de) 2006-07-20
JP2003524939A (ja) 2003-08-19
HK1045398A1 (en) 2002-11-22
DE60028579T2 (de) 2006-09-28

Similar Documents

Publication Publication Date Title
EP1204967B1 (en) Method and system for speech coding under frame erasure conditions
KR100805983B1 (ko) 가변율 음성 코더에서 프레임 소거를 보상하는 방법
KR100898323B1 (ko) 음성 코더용 스펙트럼 크기 양자화 방법
JP4861271B2 (ja) 位相スペクトル情報をサブサンプリングする方法および装置
KR100754591B1 (ko) 음성 코더에서 목표 비트율을 유지하는 방법 및 장치
KR100912030B1 (ko) 무선 통신 시스템에서 비대칭 스피치 코더를 사용하여 비대칭 링크를 생성하는 방법 및 장치
JP4511094B2 (ja) 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置
JP4860860B2 (ja) スピーチコーダにおいてフレームプロトタイプ間の線形位相シフトを計算するために周波数帯域を識別する方法および装置

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E801 Decision on dismissal of amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20080325

Effective date: 20080930

J2X1 Appeal (before the patent court)

Free format text: APPEAL AGAINST DECISION TO DECLINE REFUSAL

J302 Written judgement (patent court)

Free format text: JUDGMENT (PATENT COURT) FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20081204

Effective date: 20090909