KR100299408B1 - 음성의고속코딩을위한심도우선대수코드북검색 - Google Patents

음성의고속코딩을위한심도우선대수코드북검색 Download PDF

Info

Publication number
KR100299408B1
KR100299408B1 KR1019970706298A KR19970706298A KR100299408B1 KR 100299408 B1 KR100299408 B1 KR 100299408B1 KR 1019970706298 A KR1019970706298 A KR 1019970706298A KR 19970706298 A KR19970706298 A KR 19970706298A KR 100299408 B1 KR100299408 B1 KR 100299408B1
Authority
KR
South Korea
Prior art keywords
level
signal
pulse
search
selecting
Prior art date
Application number
KR1019970706298A
Other languages
English (en)
Other versions
KR19980702890A (ko
Inventor
피에르 아도울 쟝
라프람므 클라우드
Original Assignee
알랑 까이엘르
위니베르시떼드쉐르브루끄
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27017596&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR100299408(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 알랑 까이엘르, 위니베르시떼드쉐르브루끄 filed Critical 알랑 까이엘르
Publication of KR19980702890A publication Critical patent/KR19980702890A/ko
Application granted granted Critical
Publication of KR100299408B1 publication Critical patent/KR100299408B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • G10L2019/0014Selection criteria for distances
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Complex Calculations (AREA)

Abstract

음성신호를 엔코딩하는 방법으로 코드북을 검색한다. 상기 코드북은 40개의 위치를 가지며 설정된 유효위치들에 인가될 수 있는 N 개의 비 제로 진폭펄스들을 갖는 코드벡터세트로 구성된다. 검색복잡도를 감소시키기 위하여, 심도우선 검색방법에서는 1 부터 M 까지의 레벨순서들을 갖는 트리구조를 사용하게 된다. 패스 형성과정은 각각의 레벨에서 수행되어 앞서의 레벨에서 유도된 경합패스는 설정된 수의 새로운 펄스들을 선정하고 또한 주어진 펄스 순서 규칙 및 주어진 선정 기준에 따라 상기 새로운 펄스들의 유효위치들을 선택함으써 확장된다. 제 1 레벨에서 유도되고 후속되는 레벨들의 패스 형성 과정에 의하여 확장되는 패스는 경합 벡터의 개의 비제로 진폭 펄스들의 각각의 위치를 결정하게 된다. 수개의 제 1 레벨들에서 음성신호에 근거한 펄스위치 유사추정에 의하여 적합한 조건하에서 검색을 시작할 수 있게 된다. 보상비를 최대로 함에 따른 선정기준은 경쟁하는 경합 벡터들 중에서 최상의 것을 선택하고 처리하는데 사용된다.

Description

[발명의 명칭]
음성의 고속 코딩을 위한 심도 우선 대수 코드북 검색
[기술분야]
[관련 미국 특허 출원]
본 발명은 1995. 3. 10. 자 발명의 명칭 "음성의 고속 코딩을 위한 심도 우선 대수 코드북 검색"이라는 명칭으로 출원된 미합중국 특허 출원번호 제 08/401,785호의 부분계속출원이다.
[배경기술]
[발명의 요약]
본 발명은 음성신호를 디지털 방식으로 엔코딩하기 위한 개선된 방법에 관한 것이며 특히 이에 국한하는 것은 아니나 특정의 음성(SPEECH) 신호를 전송 및 합성하기 위한 개선된 방법에 관한 것이다.
[종래기술의 간단한 설명]
위성, 자동차, 디지털라디오 혹은 팩형(packed)네트워크, 음성저장, 음성 응답 및 무선전화 등을 통한 음성전달과 같은 많은 이용분야의 증가에 따라 음질/비트율이 양호한 효율적인 디지털 음성 엔코딩 기술이 요구되어 왔다.
상호한 음질/비트율을 얻기 위한 종래기술의 하나는 코드 여기 선형 예측(Code Exited Linear Prediction: CELP) 기술로서, 이에 따르면 음성신호를 샘플링하여 연속된 L 샘플들(즉, 벡터)의 블럭으로 처리하는데, 여기에서 L 은 미리 설정된 수이다.
상기 CELP 기술은 코드북(codebook)을 사용한다.
CELP 내용과 관련하여, 코드북은 L-차원의 코드벡터라고 칭하여 지는 인덱스화된 세트의 L-샘플-롱-시퀀스이다. 상기 코드북은 1부터 M 까지 범위의 인덱스 k 로 구성되고,
여기에서 M은:
M=2b
로서 비트 b 의 수로 표시되는 코드북의 크기를 나타낸다.
상기 코드북은 물리적 메모리 예컨대 색인 테이블에 저장되며 또한 인덱스를 대응된 코드벡터(즉 공식)에 대한 인덱스를 연관시키는 메카니즘을 일컫는 경우도 있다.
CELP 기술에 따라 음성을 합성하기 위하여, 각각의 음성 샘플들의 블록은 음성신호의 스펙트럼 특성을 모델링하는 시변필터(time varying filter)들을 통해 코드북으로 부터 적절한 코드벡터를 필터링하여 합성된다. 엔코더의 단부에서, 합성출력은 코드북으로부터의 모든 코드벡터 또는 그 하부 센트에 대하여 연산된다(코드북 검색). 존속되는 코드벡터는 지각적 가중 변형법에 따라 원래의 음성신호에 가장 근접한 합성 출력을 발생시키는 코드벡터이다.
제 1 유형의 코드북은 소위 확률적 코드북이다. 이들 코드북의 단점은 상당한 물리적 저장 수단을 포함하는 것이다. 이들은 확률적이며, 즉 인덱스로부터 관련된 코드벡터로의 패스(path)가 대형 음성 반송 세트들에 인가되는 통계적 기술 또는 랜덤하게 발생된 수들의 결과인 색인 테이블을 포함하는 의미에서 랜덤하다. 확률적 코드북의 크기는 저장 및 검색의 복잡성에 의해 제한되는 경향이 있다.
코드벡터의 제 2 형태는 대수 코드북이다. 확률적 코드북과 비교하여 볼 때, 대수 코드북들은 랜덤한 상태가 아니며 상당한 메모리를 필요로 하지 않는다. 대수 코드북은 인덱스형 코드벡터들의 세트이며, 그 kth번째의 코드벡터 펄스들의 진폭(amplitudes)과 위치들을 물리적 메모리가 없거나 또는 최소로 필요로 하는 규칙을 통하여 대응된 인덱스 k 로 부터 유도된다. 따라서, 대수 코드북의 크기는 메모리의 조건에 따라 제한되는 경우는 없게 된다.
[발명의 목적]
따라서 본 발명의 목적은 다양한 종류의 코드북에 적용할 수 있으며 음성 신호를 엔코딩할 때 코드북 검색의 복잡성을 현저하게 감소시킬 수 있는 방법 및 장치를 제공하기 위한 것이다.
[발명의 상세한 설명]
본 발명에 따라 제공되는, 음성신호를 엔코딩함에 있어서 코드북에서 심도우선검색(depth-first-search)을 수행하는 방법은, 코드북이 각각 다수의 상이한 위치 p 들을 한정하고 코드벡터의 미리 설정된 유효위치 p 에 각각 배정될 수 있는 N 개의 비 제로 진폭 펄스(non-zero-amplitude pulses)들로 이루어지는 일련의 코드벡터 AK 로 구성되며, 심도우선검색은 M 개의 배열된(ordered) 레벨로 형성되는 트리구조(tree structure)를 포함하고, 각각의 레벨 m 은 설정된 Nm(Nm≥1)개수의 비 제로 진폭의 펄스들과 연관되고, 상기 M개의 레벨들과 연관된 상기 설정된 개수들의 합은 상기 코드벡터를 구성하는 비 제로 진폭 펄스들의 개수 N 과 동일하고, 트리구조의 각각의 레벨 m 은 패스 형성 과정, 주어진 펄스 배열(order) 규칙 및 주어진 선택 기준과 연관되는 것으로서,
트리구조의 레벨 1 에서의 상기 연관된 패스 형성 과정은,
펄스 배열 규칙에 관련하여 상기 N 개의 비 제로 진폭 펄스들에서 번호 N1을 선정하는 단계와, 적어도 하나의 레벨 - 1 경합 패스를 한정하도록 연관된 선택 기준에 따라 상기 N1비 제로 진폭 펄스들의 적어도 하나의 유효 위치 p 들을 선택하는 단계로 구성되고,
트리구조의 레벨 m 에서의 상기 연관된 패스 형성 과정은,
연관된 펄스 배열 규칙에 따라 레벨 - (m-1)을 형성하는 과정에서 앞서 선정되지 아니하였던 상기 비 제로 진폭 펄스들 중 Nm개를 선정하는 하부단계와, 적어도 하나의 레벨 - m 경합 패스를 형성하기 위하여 연관된 선택기준에 따라 상기 Nm비 제로 진폭 펄스들의 적어도 하나의 유효 위치 p 를 선택하는 하부단계를 통하여 레벨 - (m-1) 경합 패스를 확장시켜 순환 레벨 - m 경합 패스를 형성하며,
레벨 - 1 에서 시작되고 트리구조의 후속되는 패스 형성 과정 중에 확장되는 레벨 - M 경합 패스는 코드벡터의 N 개의 비 제로 진폭 펄스들의 각각의 위치 p 들을 결정하여 경합 코드 벡터 AK 를 형성하게 되는 것을 특징으로 하여 구성된다.
또한, 본 발명에 따라 제공되는, 음성신호를 엔코딩함에 있어서 코드북에서 심도우선검색을 수행하는 방법은, 코드북이 각각 다수의 상이한 위치들(p)을 한정하고 코드벡터의 설정된 유효위치들 p 에 각각 배정될 수 있는 N 개의 비 제로 진폭의 펄스들로 이루어지는 일련의 벡터 AK 로 구성되며, 심도 검색과정은 (a) N 개의 비 제로 진폭의 펄스들을 각각 적어도 하나의 비 제로 진폭 펄스로 구성되는 M 개의 하부 세트들로 분할하는 단계와 (b) N 개의 비 제로 진폭 펄스들을 유효위치 p 를 나타내는 노드들을 포함하고 M 하부 세트들의 하나와 각각 연관된 다수의 검색레벨을 형성하되, 각각의 검색레벨은 주어진 펄스 배열 규칙 및 주어진 선택기준과 연관되어 있는 트리구조를 포함하는, 코드북의 심도 우선 검색 수행 방법으로서,
트리구조의 제 1 검색레벨에서는 연관된 하부 세트들을 형성하기 위하여 연관된 펄스 배열 규칙에 따라 상기 N 개의 비 제로 진폭펄스들 중 적어도 하나를 선정하는 단계와, 트리구조의 노드들을 통하여 적어도 하나의 패스를 형성하기 위하여 연관된 선택기준에 따라 적어도 하나의 비 제로 진폭 펄스들의 적어도 하나의 유효 위치를 선택하는 단계로 구성되고,
트리구조의 후속 되는 검색레벨에서는 연관된 하부 세트들을 형성하기 위하여 연관된 펄스 배열 규칙과 관련하여 앞서 선정되지 아니하였던 적어도 하나의 비제로 진폭 펄스들을 형성하는 단계와, 트리구조의 상기 노드들을 통하여 상기 적어도 하나의 패스를 확장시키기 위하여 연관된 선택 기준에 따라 연관된 하부 세트들의 적어도 하나의 상기 비 제로 진폭 펄스들의 유효 위치 p 를 선택하는 단계로 구성되며,
제 1 검색단계에서 형성되고 후속 되는 검색레벨들 중에 확대되는 각각의 패스는 음성신호를 엔코딩하기 위한 경합 코드벡터를 구성하는 코드벡터 AK 의 N 개의 비 제로 진폭 펄스들의 각각의 위치 p 들을 결정한다.
본 발명은 또한 음성신호를 엔코딩하기 위해 코드북의 심도우선 검색을 수행하는 장치에 관한 것으로서, 상기 코드북은 각각 다수의 상이한 위치 p 를 정의하고, 코드벡터의 미리 설정된 유효위치 p 에 각각 할당될 수 있는 N 개의 비 제로 진폭의 펄스들을 포함하는 코드벡터 AK 세트들을 포함하며,
상기 심도우선 검색은 (a) N 개의 비 제로 진폭의 펄스들을 각각 적어도 하나의 비 제로 진폭 펄스들로 구성되는 M 개의 하부 세트들로의 분할과, (b) N 개의 비 제로 진폭 펄스들을 유효위치 p 를 나타내는 노드들과, M개의 하부 세트들과 각각과 하나씩 관련되고 주어진 펄스 배열 규칙 및 주어진 선택기준과 연관된 다수의 검색 레벨들을 정의하는 트리구조를 포함하며,
심도 우선 코드북 검색을 수행하는 장치는
트리구조의 제 1 검색 레벨을 위하여, 연관된 하부 세트들을 형성하도록 연관된 펄스 배열 규칙에 따라 상기 N 개의 비 제로 진폭 펄스들중 적어도 하나를 선정하는 제 1 선정수단과, 트리구조의 노드들을 통하여 적어도 하나의 패스를 한정하기 위하여 관련된 선택 기준에 따라 적어도 하나의 상기 비 제로 진폭 펄스들중 적어도 하나의 유효위치 p 를 선택하기 위한 제 1 선택수단을 포함하며,
트리구조의 각각의 후속적인 검색 레벨을 위하여, 연관된 하부 센트를 형성하도록 연관된 펄스 배열 규칙에 따라 앞서 선정되지 않은 적어도 하나의 비 제로 진폭 펄스들을 선정하는 제 2 선정 수단과, 상기 후속 검색 레벨에서 트리구조의 노드들을 통하여 적어도 하나의 패스를 확장시키기 위하여 관련된 선택 기준에 따라 연관된 하부 세트의 적어도 하나의 비 제로 진폭 펄스들중 적어도 하나의 유효 위치 p 를 선택하기 위한 제 2 선택 수단을 포함하며,
제 1 검색 레벨에서 정의되고 후속되는 검색 레벨에서 확장되는 각각의 패스는 음성신호를 엔코딩하기 위한 경합 코드벡터를 구성하는 코드벡터 AK 의 N 개의 비 제로 진폭 펄스들의 각각의 위치 p 들을 결정하도록 구성된다.
본 발명은 또한 다수의 셀 들로 분할되는 광역에서 서비스하기 위한 셀룰러 통신시스템에 관한 것으로서,
이동형 송신기/수신기 유니트들;
상기 셀들내에 각각 위치하는 셀룰러 기지국과;
셀룰러 기지국들 사이의 통신을 제어하는 수단과;
상기 이동 유니트들과 셀룰러 기지국에서 공히 (a) 음성신호를 엔코딩하는 수단과, 엔코딩된 음성신호를 송신하는 수단을 포함하는 송신기 및 (b) 전송된 엔코딩된 신호를 수신하는 수단과 수신된 엔코딩된 음성신호를 디코딩하는 수단을 포함하는 수신기를 포함하는, 하나의 셀 내에 위치한 각각의 이동 유니트와 상기 하나의 셀의 셀룰러기지국 사이의 양방향 무선통신 서브시스템,
상기 음성신호 엔코딩수단은 음성신호를 엔코딩하기 위해 코드북 내에서 심도우선 검색을 수행하는 장치를 포함하고,
상기 코드북은 다수의 상이한 위치 p들을 정의하는 코드벡터 Ak의 세트와, 코드벡터의 미리설정된 유효위치 p들에 각각 할당될 수 있는 N개의 비 제로 진폭펄스들을 포함하며,
상기 심도우선 검색은 (a) 각각 적어도 하나의 비 제로 진폭펄스로 구성되는 M개의 하부 세트로 N개의 비 제로 진폭펄스들로의 분할과, (b) N개의 비 제로 진폭펄스들의 유효위치 p를 나타내는 노드들을 포함하고, 각각 M 하부 세트들중 하나와 연관되어 있고 또한 주어진 펄스 배열 규칙과 주어진 선택기준과 연관된 검색 레벨들을 한정하는 트리구조를 포함하고,
상기 심도우선 코드북 검색을 수행하는 장치는,
트리구조의 제 1검색 레벨에서, 연관된 하부 세트를 형성하기 위해 연관된 펄스 배열 규칙에 따라 상기 N개의 비 제로 진폭펄스들의 적어도 하나를 선정하기 위한 제1수단과,
트리구조의 노드들을 통하여 적어도 하나의 패스를 정의하기 위하나, 연관된 선택기준에 따라 상기 적어도 하나의 비 제로 진폭펄스의 적어도 하나의 유효위치 p를 선택하기 위한 제 1수단;
트리구조의 각각의 후속 되는 검색레벨에서는, 연관된 하부 세트를 형성하기 위하여 연관된 펄스 배열 규칙에 따라 앞서 선택하지 아니하였던 상기 비 제로 진폭 펄스들의 적어도 하나를 선정하기 위한 제2수단과, 트리구조의 노드들을 통하여 상기 적어도 하나의 패스를 확장시키기 위하여 연관된 선택기준에 따라 상기 적어도 하나의 비 제로 진폭펄스의 적어도 하나의 유효위치 p를 상기 후속 검색레벨에서 선택하기 위한 제2수단으로 구성되고,
제1검색레벨에서 정의되고 후속 되는 검색레벨들 중에 확장되는 각각의 패스는 음성신호의 엔코딩을 위한 경합 코드벡터를 구성하는 코드벡터 Ak의 N개의 비제로 진폭펄스들의 각각의 위치 p들을 결정한다.
이하 첨부된 도면을 참조로 하여 본 발명을 상술한다.
[도면의 간단한 설명]
제1도는 본 발명에 따른 펄스-위치 유사 추정기 및 최적화 제어기로 구성되는, 본 발명에 따른 엔코딩 시스템의 적합한 실시예의 개략적인 블록선도.
제2도는 제1도의 엔코딩 시스템과 관련된 디코딩 시스템의 개략적인 블록선도.
제3도는 최적 코드벡터를 계산하기 위하여 제1도의 엔코딩 시스템의 최적화 제어기에 의하여 이용되는 다수의 중첩 루프를 개략적으로 도시한 선도.
제4a도는 제3도의 "중첩 루프 검색의 특징을 예로서 나타내기 위한 트리구조의 도면.
제4b도는 트리의 가장 기대할 수 있는 지역상에만 초점을 맞춤으로써 트리를 조사하기 위한 신속한 방법인, 주어진 특정의 임계값을 초과하는 기능 상태인 하위 레벨에서의 처리시의 제4a도의 트리구조를 나타내는 도면.
제5도는 간섭된 단일 펄스 순열에 따라 설계된 40개의 코드벡터의 10개의 펄스의 코드북에 관련하여, 심도 우선(depth - first) 검색 기술이 트리구조를 통하여 특정의 펄스 위치들에 대하여 수행되는 가를 나타내는 도면.
제6도는 제1도의 펄스 위치 유사 추정기 및 최적화 제어기의 작동상태를 나타내는 플로우챠트.
제7도는 통상적인 셀룰러 통신 시스템의 하부구조의 개략적인 블록선도.
[실시예]
본 명세서에서는 본 발명에 따른 심도 우선 코드북 검색 방법 및 장치를 셀룰러 통신 시스템에 응용하는 것으로 예로서 설명하나, 이들 방법 및 장치들은 음성 신호의 엔코딩이 필요한 다른 형태의 통신 시스템에도 적용할 수 있음은 물론이다.
제 7 도에 도시된 셀룰러 통신 시스템(1)의 경우에는 광역을 다수의 소구역, 즉 셀들로 분할하여 광역에 대하여 통신 서비스를 제공한다. 각각의 셀은 셀룰러 기지국(2)를 갖고 있어 무선통신 신호 채널과 음성 및 데이터 채널들을 제공한다.
무선 신호 채널들은 셀룰러 기지국의 담당 구역(셀) 내에서 페이지 이동 무선 전화기(이동 통신/수신 장치 :3)를 호출하는데 이용되며, 또한 기지국 셀의 내부 또는 외부의 다른 무선 전화기(3)을 호출하거나 또는 별개의 공중통신망(PSTN: Public Switched Telephone Network)에 연결하는데 이용되기도 한다.
무선 전화기(3)를 호출을 하거나 또는 호출을 수신하게되면, 음성 또는 데이터 채널이 무선전화기(3)이 위치하고 있는 셀에 대응되는 셀룰러 기지국(2)에 음성 또는 데이터 채널이 설정되고, 기지국(2)과 무선전화기(3) 사이에 상기 음성 또는 데이터 채널을 통하여 통신이 이루어진다. 무선전화기(3)는 또한 호출이 진행되는 동안에 신호채널을 통하여 제어 또는 타이밍 정보를 수신할 수도 있다.
무선전화기(3) 호출중에 셀을 이탈하여 다른 셀 내로 진입될 경우에, 무선전화기는 새로운 셀내의 가용 음성 또는 데이터 채널로 호출을 넘긴다. 마찬가지로, 호출이 진행되지 아니할 경우에는 제어 메시지가 신호채널을 통해 송신되어 무선전화기가 새로운 셀과 관련된 기지국(2)에 등록된다. 이러한 방식으로 광역에 걸친 무선통신이 가능하게 된다.
휴대용 통신 시스템(1)은 무선전화기(3)와 PSTN(4) 또는 제 1 셀 내에 위치하는 무선전화기(3)와 제 2 셀 내에 위치하는 무선전화기(3) 사이의 통신중에 셀룰러 기지국(2)와 PSTN(4) 사이의 통신을 제어하는 단자(5)를 또한 포함한다.
물론, 하나의 셀 내에 위치하는 무선전화기(3)와 상기 셀의 셀룰러 기지국(2) 사이에 통신이 가능하도록 하는 양방향 무선 통신용 서브 시스템도 또한 필요하다. 이러한 양방향 무선 통신용 시스템은 통상적으로 무선전화기(3)와 셀룰러 기지국(2)에서 공히 (a) 음성신호를 엔코딩하고 엔코딩된 음성신호를 안테나(6 또는 7)를 통하여 송신하기 위한 송신기와, (b) 안테나(6 또는 7)를 통하여 전송된 엔코딩된 음성 신호를 수신하고 수신된 엔코딩된 음성신호를 디코딩하기 위한 수신기를 포함한다. 공지된 바와 같이, 음성신호를 엔코딩하는 이유는 예컨대 무선전화기(3)와 기지국(2) 사이에서 양방향 무선통신 시스템을 통하여 음성을 전송하기 위하여 필요한 밴드폭을 감소시키기 위한 것이다.
본 발명의 목적은 예컨대 음성 또는 데이터 채널을 통하여 셀룰러 기지국(2)과 무선전화기(3) 사이의 음성신호의 양방향 전송에 있어서 양호한 음질/비트율의 전환관계(trade off)를 갖는 효율적인 디지털 음성 엔코딩 기술을 제공하기 위한 것이다. 도 1은 본 발명의 적합한 실시예에 따른 디지털 음성 엔코딩 장치의 개략적인 블록선도이다.
도 1에 도시된 음성 엔코딩 시스템은 모출원인 미합중국 특허 출원번호 제07/927,528호의 도 1에 도시된 엔코딩 장치와 동일한 것이나, 본 발명에서는 여기에 펄스위치 추정기(pulse position estimator: 112)가 부가되어있다. 상기 모출원인 미합중국 특허출원번호 제 07/927,528호는 발명의 명칭 "대수 코드들에 근거한 효율적인 음성 코딩용 동적 코드북"이라는 명칭으로 1992년 9월 10일 자로 출원되었다.
입력되는 아날로그 신호인 음성신호는 샘플링되어 블록처리된다. 부연하건대 본 발명은 음성 신호의 처리에만 적용되는 것은 아니며 상이한 형태의 음성신호도 역시 처리될 수 있음은 물론이다.
도시된 실시예에서, 블록으로 입력된 샘플 음성 S (제 1도)는 연속된 샘플들 L 로 구성된다.
CELP 구조에서 L은 통상적으로 20 과 80 사이에 위치하는 서브프레임 길이로 표시된다. 또한, 샘플 L 들의 블록들은 L - 차원의 벡터들로 불려진다. 엔코딩 과정중에 다양한 L - 차원의 벡터들이 생성된다. 도 1 및 도 2 에 도시된 이들 벡터들과 전송되는 변수들은 다음과 같다.
[주 L- 차원의 벡터들의 리스트]
S 입력 음성 벡터;
R' 피치가 제거된 잔류 벡터;
X 목표 벡터;
D 역방향 필터링된 목표 벡터;
AK 대수 코드북으로 부터의 인덱스 k 의 코드 벡터; 및
CK 신규벡터(innovation vector: 필터링된 코드벡터)
[전송되는 변수들의 리스트]
K 코드벡터 인덱스(대수 코드북의 입력);
g 이득(gain);
STP (A(z)를 한정하는) 단기 예측 변수(Short term pridiction parameters); 및
LTP 장기 예측 변수(Long term prediction parameters: 피치 이득 b 와 피치 지연 T 를 정의)
[디코딩 원리]
먼저 디지털 입력(디멀티플렉서 205의 입력)과 출력 샘플 음성(합성필터 204의 출력) 사이에서 수행되는 다양한 단계를 나타내는 도 2의 음성 디코딩 장치를 설명한다.
디멀티플렉서(205)는 디지털 입력 채널로 부터 수신되는 2진 정보로 부터 4개의 상이한 변수, 즉 인덱스 k, 이득 g, 단기 예측 변수 STP, 장기 예측 변수 LTP 를 추출한다. 음성 신호의 현재의 L - 차원의 벡터들 S 은 이후에 상술하는 바와 같이 상기 4개의 변수들에 근거하여 합성된다.
도 2의 음성 디코딩 장치는 대수 코드 발생기(201)와 적응성 프리필터(adaptive prefilter: 202)로 이루어지는 동적 코드북(dynamic codebook: 208), 증폭기(206), 가산기(207), 장기 예측기(203) 및 합성필터(204)로 구성된다.
제 1 단계에서, 대수 코드 발생기(201)는 인덱스 k 에 응답하여 코드벡터 AK를 발생시킨다.
제 2 단계에서, 코드벡터Ak는 단기 예측 변수 STP 와 함에 공급되는 적응성 프리필터(202)를 통해 처리되어 신규한 출력 벡터(output innovation vector) CK를 발생시킨다. 적응성 프리필터(202)의 목적은 음성 품질을 증진시키기 위하여, 즉 청각에 장애가 되는 주파수에 의해 야기되는 청각적 왜곡상태를 감소시키기 위하여 새로운 출력 벡터 CK 의 주파수 내용을 제어하기 위한 것이다. 적응성 프리필터 (202) 용의 통상적인 전송 함수 F(z) 는 아래와 같다.
Figure kpo00001
Fa(z)는 0<Y1<Y2<1 의 상수인 포맷 프리필터(formant prefilter)이다.
상기 포맷 프리필터는 포르만트 영역을 증가시키는 기능을 하며 특히 코딩비 5 kbit/s 이하에서 효율적으로 작동된다.
Fb(z) 는 피치 프리필터이며 여기에서 T 는 가변시간 피치 지연 값이고 bo는 상수 또는 현재의 또는 앞서의 서브프레임으로부터의 양자화된 장기 피치 예측 변수와 동일한 값이다. Fb(z)는 모든 비율에서 피치조화 주파수를 증가시키는데 효율적이다. 따라서, F(z) 는 통상적으로 F(z)=Fa(z)Fb(z)로서 포르만트 프리필터와 결합되는 피치 프리필터를 포함한다.
다른 현대의 프리필터로 유익하게 적용될 수 있다.
CELP기술에 따르면, 출력 샘플 음성신호는 증폭기(206)을 통해 이득 g 만큼 씩 코드북(208)로 부터 새로운 코드벡터 CK를 스케일링(scaling)하여 얻는다. 다음에 가산기(207)는 스케일된 파형 gCK 를,피드백 루프 내에 위치하고 아래와 같이 정의되는 전송 함수 B(z) 를 갖고 LTP 변수가 공급되는 장기 예측기(203)의 출력[합성필터(204)의 여기 신호의 장기예측성분]에 합산시킨다.
B(z) = bz-T
여기서 b 와 T는 각각 위에서 정의된 피치 이득 및 지연값을 의미한다.
상기 예측기(203)은 최종적으로 수신된 LTP 변수 b 및 T 에 따라 음성의 피치 주기를 설정하도록 전송함수를 갖는 필터이다. 이에 의해 샘플의 적절한 피치 이득 b 및 지연값 T 를 생성하게된다. 복합신호 E+gCk는 전송함수 1/A(z)를 갖는 합성 필터(204)의 여기 신호를 구성하게 된다. 상기 필터(204)는 최종적으로 수신된 STP 변수들과 일치하는 정확한 스펙트럼을 제공하게 된다. 특히, 필터(204)는 음성의 공진 주파수를 모델링한다. 출력블록는 공지된 바에 따라 적절한 앤티엘리어싱(anti-aliasing) 필터링과정을 거쳐 아날로그 신호로 변환될 수 있는 선택된 합성 음성신호이다.
대수 코드북(208)을 설계하는 방법에는 여러 가지가 있다. 본 발명에서는 대수 코드북(208)을 N 개의 비 제로 진폭 펄스(비 제로 펄스로 약칭하기도 함)를 갖는 코트벡터로 구성한다.
각각 ith번째의 비 제로 펄스의 위치 및 진폭을 각각 Pi와 Spi라 하자.
ith번째의 진폭이 고정되어 있거나 또는 코드벡터 검색전에 spi를 선택하는 방법이 마련되어 있기 때문에 진폭 spi가 알려져 있는 것으로 가정할 수가 있다.
"트랙 i" 는 Pi가 1 과 L 사이에서 점유할 수 있는 위치들의 세트를 "트랙 i"라 하고 Ti로 표시한다.
L = 40 으로 가정하고 트랙들의 특정 세트들을 아래에 기재하였다. 제 1 예는 상기한 미합중국 특허출원 제 927,528호에 기재된 구조로서 이는 "인터리브된 단일 펄스 순열(Interleaved Single Pulse Permutations : ISPP) 로 불리워진다. 제 1 구조의 예에서, ISPP(40,5)로 칭해지는 40 위치들의 세트는 각각 40/5 = 8 인 유효위치들의 5 개의 인터리브된 트랙들로 분할된다. 주어진 펄스들의 유효위치 8 = 23으로 정의하기 위하여는 3 개의 비트들이 필요하게된다. 따라서, 이러한 특정 대수 코드북의 펄스 위치들을 확정하기 위하여는 모두 5 × 3 = 15 개의 코딩 비트들이 필요하게 된다.
Figure kpo00002
상기 ISPP는 40 개의 위치들 각각은 단지 하나의 트랙에만 연관되어 있는 식으로 완성된다. 다수의 펄스 또는 코드화 비트들로 특정 요건을 수용하는 코드북 구조를 하나 또는 다수의 ISPP 로부터 유도할 수 있다. 예컨대, 단지 트랙 5 를 무시하거나 또는 트랙 4 및 5 를 하나의 트랙으로 간주함으로써 ISPP(40,5)로 부터 4개의 펄스 코드북을 유도할 수 있다. 설계예 2 및 3 은 ISPP 를 완성하는 다른 경우를 나타낸다.
Figure kpo00003
Figure kpo00004
설계예 3 에서 트랙 T5 내지 T12 의 최종 펄스들의 위치는 서브 프레임 길이 L =40 의 외부에 위치하게 된다.
이 경우 마지막 펄스는 단순히 무시된다.
Figure kpo00005
설계예 4에서, 트랙 T1 및 T2 는 40 개의 위치들의 임의의 위치들에 eok여 허용된다.
트랙 T1 및 T2 의 위치들은 중복된다. 적어도 하나의 펄스들이 동일한 위치를 점유하게 되면 이들의 진폭들은 단순히 합산된다.
ISPP 구조의 일반적인 개념에 따라 다양한 형태의 코드북들을 제공할 수가 있다.
[엔코딩 원리]
샘플링된 음성신호 S 는11 개의 모듈(102 내지 112)로 분할되어 도 1에 도시된 엔코딩 시스템에 의하여 블록 단위로 엔코딩된다. 상기 모듈들의 기능 및 작동상태는 대부분 상기한 미합중국 특허출원 제 07/927,528 호에 기재된 바와 동일하다. 따라서, 이하에서는 각각의 모들들의 기능 및 작동상태에 있어서, 상기 미합중국 특허출원 제 07/927,528 호의 기재 내용에 비하여 신규한 사항에 대하여만 기술한다.
음성 신호의 L 샘플들의 각각의 블록에 있어서, 단기 예측(short term pridiction:STP)이라 호칭되는 선형 예측 코딩(linear pridiction coding: LPC) 변수들의 세트는 LPC 스펙트럼 분석기(102)를 통하여 종래 기술에 따라 생성된다. 특히, 상기 분석기(102)는 L 샘플들의 각각의 블록 S 의 스펙트럼 특성을 모델화한다.
L-샘플의 입력 블록 S 는 STP 변수들의 현재값들에 근거한 하기 전송함수를 갖는 백색화 필터(whitening filter)(103)에 의해 백색화된다.
Figure kpo00006
여기서 ao= 1 이고 z 는 소위 z-변환의 통상의 변수이다. 도 1에 나타낸 바와같이, 백색화필터(103)는 잔류 벡터 R 을 생성한다.
피치 추출기(104)는 LTP 변수들, 즉, 피치 지연 T 및 피치이득 g 를 계산 및 양자화한다. 추출기(104)의 초기 상태는 초기 상태 추출기(110)으로부터 공급되는 값 FS로 설정되어 있다. LTP 변수의 계산 및 양자화의 상세한 과정은 상기 미합중국 특허출원 제 07/927,528 호에 상세히 기재되어 있으며 이는 공지된 것으로서 이에 대한 상세한 설명은 생략한다.
도 1 의 필터응답 특성기(105)에는 STP 및 LTP 변수들이 입력되어 다음 단계에서 이용되는 필터 응답 특성 FRC 를 계산하게 된다. FRC 정보는 하기의 3개의 성분들로 구성되는데, 하기에서 n = 1, 2, .....L 이다.
★ f(n) : F(z)의 응답
F(z)는 통상 피치 프리필터를 포함함을 유의하여야 함.
★ h(n) : Y는 인식인자인, f(n) 에 대한
Figure kpo00007
의 응답
일반적으로 h(n) 은 프리필터 F(z), 인식 계량 필터(perceptual weighting filter) W(z), 및 합성 필터 1/A(z)에 종속된 F(z)W(z)/A(z)의 응답 펄스이다. F(z) 및 1/A(z)는 디코더에서 사용되는 것과 같은 필터이다.
★ U(i,j) : 하기 식에 따른 h(n) 의 자기 상관관계
Figure kpo00008
여기에서 1≤i≤L 및 i≤j≤L; n<1 에서 h(n) = 0 임.
장기 예측기(106)에는 적절한 피치 지연 T 및 이득 b를 사용하여 새로운 E 성분을 생성하기 위하여 지나간 여기 신호(즉, 앞선 프레임의 E + gCx)를 공급한다.
인식필터(107)의 초기상태는 초기상태 추출기(110)으로부터 공급되는 값 Fs 로 설정된다. 도 1 의 감산기(121)에 의하여 계산되는 피치가 제거된 잔류벡터 R'=R-E는 이제 인식필터(107)로 공급되어 후속되는 필터의 출력에서 목표벡터 X를 얻도록 한다. 도 1에 도시한 바와 같이, STP 변수들은 필터(107)에 공급되어 상기 변수들에 따라 그 전송함수를 가변시킨다. 기본적으로, X=R'-P의 공식이 성립되고, 여기에서 P는 지나간 여기상태로부터의 "벨소리(RINGING)" 신호를 포함하는 장기예측(LTP)의 기여상태를 나타낸다. 오차 Δ에 적용되는 MSE 기준은 다음과 같은 행렬식으로 정의된다.
Figure kpo00009
여기에서
Figure kpo00010
이고,
Figure kpo00011
및 S'는 각각 아래의 전송함수를 갖는 인식계량 필터를 통해 처리되는
Figure kpo00012
및 5이다.
Figure kpo00013
여기에서 Y=0.8은 인식상수기고, H는 하기와 같이 h(n)응답으로부터 형성되는 L×L 삼각형 토에플리츠(Toeplitz) 행렬의 하부이다. 항 h(o)는 행렬의 대각선을 점유하고 항 h(1), h(2) ‥‥‥‥ 및 h(L-1)은 각각의 대각선 하측에 위치한다.
역방향 필터링단계는 도 1의 필터(108)에 의해 수행된다. 상기 식에서 얻어진 결과를 이득 g에 대하여 0으로 설정함으로써 다음과 같은 최적의 이득을 산출할 수 있게 된다.
Figure kpo00014
이득 g의 값을 이용하여 다음과 같이 최소화 한다.
Figure kpo00015
상기와 같이 처리하는 목적은 최소화가 얻어지는 특정인덱스 k를 검색하기 위한 것이다. ∥X∥2이 고정된 양이기 때문에, 아래의 식으로 나타나는 양을 최대화함으로써 동일한 인덱스를 검색할 수 있게 된다.
Figure kpo00016
여기에서,
D = (XH) and αk 2= ∥AkHT2.
역방향 필터 (108)에서, 역방향으로 필터링된 목표벡터 D=(XH)가 계산된다. 상기 과정에서 사용되는 "역방향 필터링"라는 용어는 시간이 반전된 X의 필터링로서 (XH)를 번역함에 기인한 것이다.
제어기(109)를 최적화하는 것은 대수 코드북내의 가용 코드벡터들을 검색하여 L-샘플 블록을 엔코딩하기 위한 최상의 코드벡터를 선택할 수 있도록 하는 것이다. 각각 N개의 비 제로 진폭 펄스들을 갖는 코드벡터들의 세트중에서 최상의 코드벡터를 선택하는 기본적인 기준은 다음과 같이 상기한 분수식의 값(비율)이 최대화되는 형태로 주어진다.
기본적인 선택기준 :
Figure kpo00017
여기에서,
Figure kpo00018
이고 Ak는 N개의 비제로 진폭 펄스들을 갖는다. 상기 방정식의 분자는
Figure kpo00019
의 자승이다.
상기 식에서 D는 역방향으로 필터링된 목표벡터이고, Ak는 N개의 비 제로 진폭 Sxi을 갖는 대수 코드벡터이다.
분모는 에너지를 나타내는 항으로서 다음과 같이 표시될 수 있다.
Figure kpo00020
여기에서, U(pi,pj)는 하나는 위치 Pi에 위치하고 다른 하나는 위치 pj에 있는 두 개의 단위 진폭펄스들과 상호연관된 관계이다. 상기 행렬은 필터응답특성기 모듈(105)에서 계산되며 도 1의 블록선도에서 FRC로 표시된 변수들의 세트에 포함된다.
상기 분수를 신속하게 계산하는 방법으로는 도 4에 도시된 N개의 내포루프들을 포함하는 것인데, 여기에서 각각의 양 "Spi" 및 "SpiSpj"의 대신에 선형화된 트림(trim) 표시 S(i) 및 SS(i,j)가 사용된다. 분자 αk 2의 계산은 대부분의 시간이 소비되는 과정이다. 도 4의 각각의 루프에서 수행되는 αk 2에 이용되는 계산은 하기와 같이 최외측 루프로부터 최내측 루프까지 별도의 라인들로 기록될 수 있다.
Figure kpo00021
여기에서 Pi는 i번째의(ith) 비제로 펄스의 위치이다.
상기 방정식은, 필터응답특성기(105)에 의해 공급되는 행렬 U(i,j)를 다음과 같은 관계에 따라 행렬 U'(i,j)도 변환하기 위하여 최적화 제어기(109)를 사용하여 예비계산을 해두면 앞서의 방정식은 단순화될 수 있다.
Figure kpo00022
여기에서 Sk는 대응된 진폭추정치(이하에서 상술함)의 양자화에 따른 위치 k 에서의 개개의 펄스에 대하여 선택된 진폭을 나타낸다. 방정식을 간략화하기 위하여 이후의 설명에서는 인수 2는 생략한다.
새로운 행렬 U'(j,k)에서, 고속알고리즘의 각각의 루프의 계산(도 3 참조)은 다음과 같이 최외측 루프로부터 최내측 루프까지 별도의 라인상에 기술될 수 있다.
Figure kpo00023
도 4a 및 4b는 본 발명과 대비하기 위하여 도 3에 기재되고 이에 따라 설명한 "내포루프검색"의 특정의 특징들을 나타내기 위하여 트리구조의 두가지 예를 도시한 것이다. 도 4a의 트리의 저부에 위치한 단자노드들은 5개의 펄스예(N=5)의 펄스위치의 가능한 모든 조합을 나타내는 것이며, 여기에서 각각의 펄스는 4개의 가능한 위치들 중 하나인 것으로 가정한다. 전체 "내포루프검색" 기술은 기본적으로 도시된 바와 같이 좌측으로부터 우측으로 트리 노드들을 통하여 수행된다. "내포루프검색" 방법의 단점의 하나는 검색의 복잡도가 펄스 N의 수에 따른 함수로서 증가하는 것이다. 대량의 펄스 N을 갖는 코드북을 처리하기 위해서는 코드북의 부분적 검색방법을 설정해야만 한다.
도 4b는 트리의 가장 유망한 영역에만 검색을 집중시킴으로써 고속검색을 달성하는 동일한 트리를 도시한 것이다. 특히, 하부 레벨로의 이행은 계층적인 것이 아니라 주어진 특정 임계치를 초과하는 실행상태에 따라 결정된다.
[심도 우선검색(Depth-First Search)]
이제 본 발명의 목적을 구성하며, 도 1의 펄스위치 유사추정기(pulseposition likelihood-estimator : 112)와 최적화 제어기에 의해 수행되는 다른 고속화 기술에 대하여 설명한다. 먼저 상기 기술의 일반적인 특징을 설명한 후, 전형적인 여러 실시예에 대하여 설명하기로 한다.
검색의 목적은, 펄스들의 진폭들이 고정되어 있거나 또는 1995. 2. 6.자 출원된 미합등록 특허출원 제08/383,968호에 기술된 바와 같이 검색전에 특정의 신호에 근거한 메카니즘에 의해 선택되는 것으로 가정하고, N개의 펄스위치들의 최상의 세트를 갖는 코드벡터를 결정하기 위한 것이다. 기본적인 선택기준은 상기한 비율 Qk를 최대로 하기 위한 것이다.
검색복잡도를 감소시키기 위하여, 펄스위치들은 일시에 Nm개의 펄스들로 결정된다. 특히, N개의 가용 펄스들을 N1+ N2+ ‥‥‥‥‥ + Nm+ NM= N이 되도록 N개의 가용펄스들을 Nm펄스들로 된 M개의 비어있지 않는 하부 세트로 분할한다.(도 6의 단계 601). 관심의 대상인 제1의 J = N1+ N2+ ‥‥‥‥‥ + Nm-1펄스들에 대한 위치들의 선택은 레벌-m 패스(Path) 또는 길이 J의 패스로 칭한다. 펄스위치들의 J의 패스에 대한 기본적인 기준은 J와 관련된 펄스들만을 고려한 경우에 Qk(J) 비율이 된다.
검색은 하부 세트 #1에서 시작되고 트리구조를 따라 후속적인 하부 세트 진행되어 트리의 mth레벨에서 하부 세트 m을 검색하게 된다.
레벨 1에서의 검색의 목적은, 레벨 1에서의 트리 노드들인 길이 N1의 하나 또는 다수의 경합패스(들)을 결정하기 위하여 하부 세트 #1의 N1펄스들과 그들의 유효위치들을 고려하기 위한 것이다.
레벨 m-1의 각각의 종결노드에서의 패스는, Nm의 신규한 펄스들과 그 유효 위치들을 고려함으로써 레벨 m에서의 길이 N1+ N2‥‥‥‥‥ + Nm으로 확장된다. 하나 또는 다수의 확장된 경합패스(들)은 레벨-m 노드들을 구성하도록 결정된다.
최상의 코드벡터는 모든 레벨-M 모드들에 대하여 기준비율 Qk(N)을 최대로 하는 길이 N의 패스와 일치하게 된다.
반면에, 상기한 미합중국 특허출원 927,528호에서는 펄스들(또는 트랙들)은 본 발명에서 다양한 순서로서 고려되는 미리 설정된 순서(i = 1, 2, ‥‥‥ N)에서 검색된다. 실제로, 이들은 검색중에 임의의 시간에서 특정 조건하에 가장 유망한 순서로 추정되는 순서에 따라 고려된다. 이를 위해, 새로운 연대기적 (chronological) 인덱스 n(n = 1, 2, ‥‥‥ N)이 사용되고 검색중에 고려되는 n번째 펄스의 ID(identification) 번호를 "펄스순서함수" i = i(n)에 의하여 주어진다. 예컨대 특정시간에, 5-펄스 코드북의 검색패스는 하기 펄스순서함수에 따라 처리된다.
n = 1 2 3 4 5 연대기적 인덱스
Figure kpo00024
i = 4 3 1 5 2 펄스(또는 트랙) ID
특정시간에 어떠한 펄스순서가 가장 유망한가를 신속하게 추측하기 위해, 본 발명에서는 음성관련 신호에 근거한 "펄스-위치 유사 추정 벡터" B를 사용한다. 상기 추정벡터 B의 P번째 성분 Bp는 검색하고자 하는 최적 코드벡터내의 펄스점유위치 p(p = 1, 2, ‥‥‥‥‥, L)의 가능성을 특성화시킨다. 상기 최적 벡터는 아직 미지이며, 본 발명의 목적은 음성관련신호들로부터 어떻게 상기 최적 벡터의 특성을 추출하는가 하는 것을 밝히는 것이다.
추정벡터 B는 다음과 같이 사용된다.
먼저, 추정벡터 B는 펄스위치를 추정하기가 용이한 트랙 i 또는 j를 결정하기 위한 기준으로 이용한다. 펄스위치 추정이 용이한 트랙은 먼저 처리된다. 이러한 특성은 트리구조의 제1레벨에서 Nm펄스들을 선택하기 위해 펄스 배열 규칙에도 이용되는 수가 있다.
다음에, 주어진 트랙에서, 추정벡터 B는 각각의 유효위치의 상대적 가능성을 나타낸다. 이러한 특성은 소수의 제 1레벨들에서 유효위치들을 선택하는데 신뢰할 수 있게 수행하기에 너무 적은 수의 펄스들에 대해 작용하는 기본적인 선택기준 Qk(j) 대신에 트리구조의 소수의 제 1레벨들의 선택기준으로서 유효하게 이용된다.
음성관련신호들로부터 펄스위치 유사추정벡터 B를 얻는 적합한 방법은 정규화된 역방향 필터링된 목표벡터
Figure kpo00025
와, 정규화된 피치제거 잔류신호
Figure kpo00026
의 합계를 구하여 펄스위치 유사추정벡터 B:
Figure kpo00027
를 구하는 단계로 구성된다.
여기에서 β는 대표값
Figure kpo00028
을 갖는 고정상수이다(β는 대수코드에서 사용되는 비 제로 펄스들의 비율에 따라 0과 1사이에서 선택된다).
한가지 주목할 사항은 1995. 2. 6.자 출원된 발명의 명칭 "음성의 고속코딩을 위한 음성선택 펄스폭들을 갖는 대수 코드북", 출원번호 08/383,968인 미합중국 특허출원에서도 동일한 유사벡터 B를 상이한 문맥(context)에서 상이한 목적으로 사용하는 것인데, 근접한 펄스진폭들의 최적의 조합을 우선적으로 선택하는 방법을 기재하고 있다. 상기한 내용은 q>1 인 비 제로 펄스진폭들을 q값들 중의 하나로 가정할 때 유용하게 된다. 이는 신호 자체로부터 추출될 수 있는 B와 같은 양호한 추정기를 발견하는 것이 효율적인 음성코딩에 있어 매우 중요한 것임을 확인할 수 있다. 실제에 있어서는 이러한 양호한 추정기들은 위치들 또는 진폭들의 추정기를 넘어, 코드벡터 Ak자체를 위한 추정기이다.
그러므로, 상기 미합중국 특허출원 08/383,968호에 기재된 원리와 본 발명의 원리를 결합하여 이루어지는 어떠한 검색기술도 본 발명의 분야 및 범위에 속하게 되는 것이다. 다음의 예를 본 발명에 따른 결합기술의 전형적인 예를 나타내는 실시예이다. 앞서 지적한 바와 같이 중첩된 트럭들로 부터의 두 개 또는 다수개의 펄스들이 프레임내의 동일 위치들을 차지하게 되면 이들은 합산되어야 한다. 이러한 위치 진폭 보상은 격자형 검색방법에 의해 상승적으로 최적화된다.
이해의 편의를 위해 앞서 정의한 변수 및 상수들을 다음과 같이 정리하였다.
[상수의 리스트]
Figure kpo00029
[변수들의 리스트]
Figure kpo00030
[심도우선검색의 실시예]
심도우선 검색의 통상적인 다수의 실시예들을 다음과 같이 검토하기로 한다.
Figure kpo00031
[규칙 R1]
레벨-1 패스형성과정을 위한 제1펄스 위치 Pi(1)을 선정하기 위하여 10가지의 방법을 각각의 5개의 트랙에 대해 순차적으로 고려하고, 각각의 트랙에서는 순차적으로 고려대상인 트랙의 Bp를 최대로 하는 두 개의 위치들 중의 하나를 선택한다.
[규칙 R2]
규칙 2는 다음과 같이 레벨 2 및 3에서 고려되는 4개의 펄스들에 사용되는 펄스-순서 함수를 정의한다. 원형으로 4개의 잔류인덱스들을 배열하고 i(1) 펄스의 우측에서 시작하여 시계방향으로 이들에 다시 번호를 부여한다(즉, 고려중인 특정 레벨-1 노드의 펄스수를 부여함).
이하에서는 심도우선 원리를 명백하게 나타낼 수 있는 검색기술 #2로 칭해지는, 심도우선 코드북 검색의 제2예를 설명하기로 한다.
[검색기술 #2]
[대수코드북]
L=40; N= 10
ISPP(40,10) (i.e. : L1= L2= ‥‥‥ L10= 4)
[검색과정]
Figure kpo00032
[규칙 R3]
펄스 i(1)을 선정하고 전체 p에 대하여 최대 Bp에 따라 그 위치를 선택한다. 주어진 i(2)의 선택기준은 그 트랙내의 Bp를 최대화하는 위치를 선정하는 단계로 구성된다.
[규칙 R4]
레벨 1의 종결시에, 전체 펄스순서함수는 잔류된 8개의 인덱스 n들을 원형으로 배열하고 i(2)의 우측에서 시작하여 다시 번호를 부여함으로써 결정된다.
검색기술 #2는 도 5 및 6에 도시되어 있다. 도 5는 인터리브된(interleaved) 단일펄스 순열에 따라 설계된 40개의 위치 코드벡터들의 10개의 펄스코드북에 적용되는 심도우선 검색기술 #2의 트리구조를 나타낸다. 이에 대응된 플로우챠트는 도 6에 도시되어 있다.
L = 40 위치들은 각각 코드벡터들의 하나에 연결되는 N = 10인 비 제로 진폭 펄스들로 분할된다. 상기 10개의 트랙들은 N개의 인터리브된 단일펄스 순열에 따라 인터리브되어 있다.
[단계 601]
상기한 펄스위치 유사측정 벡터 B를 계산한다.
[단계 602]
추정된 Bp의 최대 절대값의 위치 p를 계산한다.
[단계 603 (레벨-1 패스형성작업 시작)]
단계 602(도 5의 501 참조)에서 발견된 위치에 일치하도록 펄스(즉, 트랙) i(1)을 선정하고 그 유효위치를 선택한다.
[단계 604 (레벨-1 패스형성 과정의 종결)]
펄스 i(2)에 있어서, 각각의 잔류 p개의 펄스들을 순차적으로 선택한다. 주어진 i(2)의 선택기준은 상기 주어진 i(2)의 트랙내에서 Bp를 최대로 할 수 있는 위치를 선택하는 단계로 구성된다. 따라서, 9개의 별개의 레벨-1 표준 패스들이 발생된다(도 5의 502 참조). 상기 레벨-1 경합패스의 각각은 다음에 트리구조의 후속되는 레벨을 통하여 확장되어 9개의 별개의 경합코드벡터들을 형성한다. 레벨-1의 목적은 B 추정치에 근거해서 펄스들의 9개의 양호한 개시 쌍들을 추출하기 위한 것이다. 이러한 이유로, 레벨- 패스 형성 과정은 도 5의 "신호에 근거한 펄스 스크리닝"으로 칭하여 진다.
[단계 605 (규칙 R4)]
계산시간을 단축하기 위해, 후속되는 4개의 레벨들에서 이용되는 펄스순서를 미리 설정한다. 즉, n = 3, 4, ‥‥‥‥ 10의 펄스순서함수 i(n)을, 8개의 잔류 인덱스들을 원형으로 배열하고 i(2)의 우측으로부터 시작하여 시계방향으로 다시 번호를 부여함으로써 결정한다. 상기 순서에 따라 펄스 i(3) 및 i(4)들은 레벨-2에서 선정되고, 펄스 i(5) 및 i(6)들은 레벨-3에서 미리 선정되는 순서로 행하여진다.
[단계 606, 607, 608, 609 (레벨 2 내지 5)]
레벨 2 내지 5는 동일한 과정을 효율적으로 추종할 수 있도록 설계된다. 즉, m = 2, 3, 4, 5가 레벨번호일 경우 연관된 검색기준 Qk(2m)에 따라 고려중인 2개의 펄스들(도 5의 503 참조)의 4개의 위치들의 모든 16개의 조합들에 전체 검색을 하게 된다.
레벨 2 내지 5에 연관된 각각의 패스 형성과정(도 5의 504 참조)로부터 단지 하나의 경합패스(즉, 분지인자가 1임)가 얻어질 때, 검색복잡도는 펄스들의 전체개수에 따라 선형적으로 증가할 뿐이다. 이러한 이유로 레벨 2 내지 5에서 수행되는 검색은 심도우선 검색으로 정확하게 특성화될 수 있다. 트리검색기술은 구조, 기준 및 문제 영역의 관점에서 다양하게 변화될 수 있으나, 인공지능의 분야에서는 "수평우선 검색(breadth-first searches)"와 "심도우선 검색"의 두 개의 광의의 검색기준을 대비하는 것이 통례이다.
[단계 610]
단계 604에서 발생되고 레벨 2 내지 5(즉, 단계 605 내지 609)를 통해 확장된 9개의 별도의 레벨-1 경합패스들은 9개의 경합코드벡터 Ak들을 구성한다(도 5의 505 참조).
단계 610의 목적은 9개의 경합코드벡터 Ak들을 비교하고 최종 레벨, 즉 Qk(10)에 연관된 선택기준에 따라 최상의 것을 선택하기 위한 것이다.
이하 "검색기준 #3"으로 칭하여지는 심도우선 코드북 검사의 제 3실시예를 설명하는데, 이는 동일 위치에서 적어도 하나의 펄스들이 위치될 수 있도록 하는 경우를 설명하기 위한 것이다.
검색기술 #3, 10개 또는 그 이하의 펄스,
[대수 코드북]
L=40; N= 10
분할된 펄스들의 개수 ≤ 10
2개의 SIPP(40,5)의 합
(i.e : L1= L2= ‥‥‥‥ L5= 8; L6= L7= ‥‥‥‥ L10= 8)
[검색과정]
Figure kpo00033
[규칙 5]
2개의 펄스들이 동일위치를 점유할 수 있으므로 이들의 진폭들은 단순 총합이 되어 2배 진폭의 펄스를 발생시킨다. 규칙 R5는 레벨-1 경합 패스들의 세트를 제공하기 위해 제1의 2개의 펄스위치들을 선택하는 방법을 결정하게 된다.
Figure kpo00034
노드들은 5개의 분할된 트랙들내에서 Bp를 최대로 하는 각각의 위치에서의 2배 진폭의 펄스의 하나와 일치하며, 5개의 분할된 트랙들의 각각에서 Bp를 최대로 하는 2개의 위치들을 선택함에 의해 선택되는 10개의 펄스위치들의 집단으로부터 추출되는 모든 2개의 펄스위치들의 조합과도 또한 일치하게 된다.
[규칙 R6] 규칙 4와 유사함
이상과 같이 본 발명의 적합한 실시예를 참조로 하여 본 발명을 도시 및 설명하였으나, 본 발명의 기술적 범위는 이에 국한되는 것은 아니다. 또한, 본 발명은 음성신호 처리에만 국한되는 것은 아니며, 오디오와 같은 청각신호도 처리할 수 있다. 이러한 예도 역시 본 발명의 기술적 범위에 속하는 것으로 본다.

Claims (60)

  1. 각각 다수의 상이한 위치 p 를 정의하고 코드벡터의 설정된 유효위치 p 에 각각 할당될 수 있는 N 개의 비 제로 진폭의 펄스로 이루어지는 코드벡터 AK들의 세트를 포함하는 코드북에서, 음성신호를 엔코딩하기 위해 심도 우선 검색을 수행하는 방법에 있어서, 심도 우선 검색은 (a) N 개의 비 제로 진폭의 펄스들을 각각 적어도 하나의 비 제로 진폭 펄스로 구성되는 M 개의 하부 세트들로 분할하는 단계와 (b) N 개의 비 제로 진폭 펄스들을 유효위치 p 를 나타내는 노드들을 포함하고 M 하부 세트들의 하나와 각각 연관된 다수의 검색레벨을 형성하되, 각각의 검색레벨은 주어진 펄스 배열 규칙 및 주어진 선택기준과 연관되어 있는 트리구조를 포함하며,
    트리구조의 제 1 검색레벨(레벨-1)에서는 연관된 하부 세트(603, 604)들을 형성하기 위하여 연관된 펄스 배열 규칙에 따라 상기 N 개의 비 제로 진폭펄스(i(1), i(2))들 중 적어도 하나를 선정하는 단계와, 트리구조(603, 604)의 노드들을 통하여 적어도 하나의 패스(501, 502)를 형성하기 위하여 연관된 선택기준에 따라 적어도 하나의 비 제로 진폭 펄스들의 적어도 하나의 유효위치를 선택하는 단계로 구성되고, 트리구조(도 5)의 후속 되는 검색레벨(레벨 2 내지 5)에서는 연관된 하부 세트(605)들을 형성하기 위하여 연관된 펄스 배열 규칙과 관련하여 앞서 선택되지 아니하였던 적어도 하나의 비 제로 진폭 펄스들을 형성하는 단계와, 트리구조(단계 606, 607, 608 또는 609)의 상기 노드들을 통하여 상기 적어도 하나의 패스(501, 502)를 확장시키기 위하여 연관된 선택 기준에 따라 연관된 하부 세트들의 적어도 하나의 상기 비 제로 진폭 펄스들의 유효 위치 p 를 선택하는 단계로 구성되며, 제 1 검색단계(레벨 1)에서 한정된 각각의 패스(501, 502)와 후속되는 검색레벨(레벨 2 내지 5)들에서 확대된 패스(504)들 각각은 음성신호를 엔코딩하기 위한 경합 코드벡터(505)를 구성하는 코드벡터 AK의 N 개의 비 제로 진폭 펄스들의 각각의 위치 p 들을 결정하는 것을 특징으로 하는, 음성신호를 엔코딩하기위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  2. 제1항에 있어서, 상기 적어도 하나의 패스(501, 502, 503)는 다수의 패스들로 구성되고, 상기 트리구조(도 5)의 검색 레벨(레벨 1 내지 5)들은 최종 검색레벨(레벨 5)을 포함하고, 트리구조의 상기 최종 검색 레벨(레벨 5)에서는 음성신호를 엔코딩하기위해 연관된 선택 기준에 따라 상기 패스에 의해 형성된 경합 코드 벡터 AK(505)의 하나를 선택하는 단계를 포함하는 것을 특징으로 하는, 음성신호를 엔코딩하기위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  3. 제1항에 있어서, 적어도 하나의 단일 펄스 순열 설계에 따라 N 개의 비 제로 진폭 펄스들의 설정된 유효위치 p 를 유도하기 위한 단계를 더 포함하는 것을 특징으로 하는, 음성신호를 엔코딩하기위해 코드북 내의 심도우선 검색을 수행하는 검 색방법.
  4. 제1항에 있어서, 상기 트리구조의 상기 각각의 후속 검색레벨(레벨 2, 3, 4 또는 5)에 있어서, 앞서의 검색레벨에서 선택된 펄스 위치 p 에 의해 정의되고 상기 후속되는 검색레벨과 관련된 하부 세트들의 상기 적어도 하나의 펄스의 유효위치 p에 의해 확장되는 각각의 패스에 대하여 주어진 수학적 비(ratio)를 계산하고, 상기 주어진 비를 최대로 하는 펄스위치 p 에 의해 정의되는 확장된 패스를 얻는 단계를 또한 포함하는 것을 특징으로 하는, 음성신호를 엔코딩하기위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  5. 제1항에 있어서, 트리구조(도 5)의 제 1 검색레벨(레벨 1)에서, 상기 선정 및 선택단계가 음성신호에 대한 펄스 위치 유사 추정 벡터를 계산하고(601), 연관된 하부 세트의 적어도 하나의 비 제로 진폭 펄스와 상기 펄스 위치 유사 추정 벡터에 대한 적어도 하나의 유효 위치 p 를 선택함(602, 603, 604)에 의하여 수행되는 것을 특징으로 하는, 음성신호를 엔코딩하기위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  6. 제5항에 있어서, 상기 펄스 위치 유사 추정 벡터를 계산하는 단계는 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 를 발생시키기 위하여 음성신호를 처리하는 단계, 및 상기 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 중 적어도 하나에 응답하여 펄스 위치 유사 추정 벡터 B 를 계산하기 위한 단계를 포함하는 것을 특징으로 하는, 음성신호를 엔코딩하기 위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  7. 제6항에 있어서, 상기 목표신호 X, 역방향 필터링된 목표신호 D 및 피치를 제거한 잔류신호 R' 중 적어도 하나에 응답하여 펄스위치 유사추정 벡터 B를 계산하는 단계가 정규 형태
    Figure kpo00035
    로서 역방향 필터링된 목표신호 D를 정규형태
    Figure kpo00036
    인 피치를 제거한 잔류신호 R'에 합산하여
    Figure kpo00037
    (여기에서 β는 불변상수임)인 형태의 펄스위치 유사추정 벡터 B를 얻는 단계를 포함하는 것을 특징으로 하는 음성신호를 엔코딩하기위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  8. 제7항에 있어서, β가 0과 1 사이의 불변상수인 것을 특징으로 하는 음성 신호를 엔코딩하기 위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  9. 제8항에 있어서, β가 ½ 값을 갖는 불변상수인 것을 특징으로 하는 음성신호를 엔코딩하기 위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  10. 제1항에 있어서, 상기 N개의 비 제로 진폭펄스들이 각각의 인덱스들을 갖고 있고, 트리구조(도 5)의 상기 각각의 후속검색 레벨(레벨 2, 3, 4 또는 5)에서, 연관된 펄스 배열 기능과 관련하여 앞서 선정되지 아니하였던 적어도 하나의 비 제로 진폭펄스를 선택하는 단계는 앞서 선택되지 아니하였던 펄스들의 인덱스들을 원상에 배치하고 트리구조의 앞서의 검색레벨에서 선택된 최종 비 제로 진폭 펄스의 우측에서 시작하여 인덱스들의 시계방향 순서에 따라 적어도 하나의 상기 비 제로 진폭펄스를 선택하는 단계를 포함하는 것을 특징으로 하는 음성신호를 엔코딩하기위해 코드북 내의 심도우선 검색을 수행하는 검색방법.
  11. 각각 다수의 상이한 위치 p 를 정의하고 코드벡터의 설정된 유효위치 p 에 각각 할당될 수 있는 N 개의 비 제로 진폭의 펄스로 이루어지는 코드벡터 AK 들의 세트로 구성되는 코드북에서, 음성신호를 엔코딩하기 위한 코드북 심도 우선 검색 수행장치에 있어서, 상기 심도우선 검색은 M 개의 배열된 레벨을 형성하는 트리구조(도 5)를 포함하고, 각각의 레벨 m 은 미리 설정된 개수의 비 제로 진폭의 펄스 Nm(Nm≥ 1) 과 연관되고, 상기 M 레벨들 모두와 연관된 상기 설정된 개수들의 합은 상기 코드벡터들에 포함된 비 제로 진폭 펄스들의 개수 N 과 같고, 트리구조의 각각의 레벨 m 은 패스 형성 과정과 주어진 펄스 배열 규칙 및 주어진 선택 기준과 연관되며, 트리구조의 레벨 m=1 에 연관된 패스 형성 과정을 수행하도록, 연관된 펄스 배열 규칙에 따라 상기 N 개의 비 제로 진폭 펄스들에서 번호 N1을 선정하는 제 1 수단(603, 604)과, 적어도 하나의 레벨 - 1 경합 패스(501, 502)를 형성하기 위하여 연관된 선택 기준에 따라 상기 N1비 제로 진폭 펄스들의 적어도 하나의 유효 위치 p 들을 선택하는 제 1 수단(603, 604)을 포함하고, 트리구조의 각각의 레벨 m ≠1 에서, 레벨 - (m-1) 경합 패스(501, 502)를 확장시켜 순환 레벨 - m 경합 패스(504)를 형성하는 상기 연관된 패스 형성 과정을 수행하도록, 연관된 펄스 배열 규칙에 따라 레벨 - (m-1)을 형성하는 과정에서 앞서 선택되지 아니하였던 상기 비 제로 진폭 펄스들 중 Nm을 선정하는 제 2 수단(605)과, 적어도 하나의 레벨 - m 경합 패스(504)를 형성하기 위하여 연관된 선택 기준에 따라 상기 Nm비 제로 진폭 펄스들의 적어도 하나의 유효 위치 p 들을 선택하는 제 2 수단(606, 607, 608 또는 609)를 포함하며, 트리구조(도 5)의 레벨 m = 1에서 시작되고 후속적인 레벨들과 연관된 패스 형성과정중에 확장되는 레벨 - M 경합 패스는 코드벡터의 N 개의 비 제로 진폭 펄스들의 각각의 위치 p 를 결정하여 경합 코드 벡터 AK 를 형성하도록 된 것을 특징으로 하는, 음성신호를 엔코딩하기 위해 코드북의 심도 우선 검색 수행장치.
  12. 제11항에 있어서, 상기 제 1 선택수단(603, 604)은 트리구조(도 5)의 후속적 레벨 m (레벨 2 내지 5)과 연관된 패스 형성과정중에 확장된 다수의 레벨-1 경합 패스(501, 502, 503)들을 형성하도록 관련된 선택기준에 따라 N1비 제로 진폭 펄스들의 다수의 유효 위치 p들을 선택하며, 상기 트리구조의 레벨 m은 마자막 레벨 M(레벨 5)을 포함하고, 음성 신호를 엔코딩하기 위해 상기 패스들로 형성된 경합 코드벡터 AK 들(505)중 하나를 관련된 선택 기준에 따라 트리구조의 마지막 레벨 M(레벨 5)에서 선택하는 수단(610)을 더 포함하는 것을 특징으로 하는 코드북의 심도우선 검색 수행 장치.
  13. 제11항에 있어서, 적어도 하나의 인터리브된(interleaved) 단일펄스 순열구조에 따라 N개의 비 제로 진폭펄스들의 설정된 유효위치 P를 유도하기 위한 수단으로 또한 구성되는 것을 특징으로 하는 코드북의 심도우선 검색 수행 장치.
  14. 제11항에 있어서, 상기 제 2 선택수단은 각각의 레벨-(m-1) 경합 패스를 위하여 주어진 수학적 비(ratio)를 계산하는 수단과, 상기 주어진 수학적 비를 최대화하는 펄스 위치 p들로 형성된 패스를 유지시키는 수단을 포함하는 코드북의 심도 우선 검색 수행 장치.
  15. 제11항에 있어서, 상기 제 1선정수단과 제1선택수단이 음성신호에 따라 펄스위치 유사추정 벡터를 계산하는 수단(601)과, 상기 펄스위치 유사추정 벡터에 따라 N개의 비 제로 진폭 펄스들의 수 N1과, 펄스 위치 유사 추정 벡터에 따라 N1비 제로 진폭 펄스들의 적어도 하나의 유효 위치들 p를 선택하는 수단(602, 603, 604)를 포함하는 것을 특징으로 하는 코드북의 심도 우선 검색 수행 장치.
  16. 제15항에 있어서, 상기 펄스 위치 유사 추정 벡터를 계산하는 수단이 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 를 발생시키기 위하여 음성신호를 처리하는 수단(103, 121, 107, 108)과, 상기 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스 위치 유사 추정 벡터 B 를 계산하는 수단(601)을 포함하는 것을 특징으로 하는 코드북의 심도우선 검색 수행 장치.
  17. 제16항에 있어서, 상기 목표신호 X, 역방향 필터링된 목표신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스위치 유사추정 벡터 B를 계산하는 수단은 정규형
    Figure kpo00038
    로서 역방향 필터링된 목표신호 D를 정규형
    Figure kpo00039
    인 피치를 제거한 잔류신호 R'에 합산하여
    Figure kpo00040
    (여기에서 β는 불변상수임)인 형태의 펄스위치 유사추정 벡터 B를 얻는 합산수단을 포함하는 것을 특징으로 하는 코드북의 심도우선 검색 수행 장치.
  18. 제17항에 있어서, β가 0과 1 사이의 불변상수인 것을 특징으로 하는 코드북의 심도우선 검색 수행 장치.
  19. 제18항에 있어서, β가 ½의 값을 갖는 불변상수인 것을 특징으로 하는 코드북의 심도우선 검색 수행 장치.
  20. 제11항에 있어서, 상기 N 개의 비 제로 진폭 펄스들이 각각의 인덱스들을 갖고 있고, 상기 제 2 선정 수단(605)이 원형상의 배열에서 아직 선택되지 아니하였던 비제로 진폭 펄스들의 인덱스들을 배치하는 수단과, 트리구조(도 5)의 앞서 선정된 레벨내에서 선택된 최종 비 제로 진폭 펄스의 우측에서 시작하여 인덱스들의 시계방향 순서에 따라 적어도 하나의 상기 Nm비 제로 진폭 펄스를 선정하는 수단을 포함하는 것을 특징으로 하는 코드북의 심도우선 검색 수행 장치.
  21. 다수의 셀 들로 분할되는 광역에서 서비스하기 위찬 셀룰러 통신시스템(1)에 있어서, 이동형 송신기/수신기 유니트(3)들; 상기 셀들 내지 각각 위치하는 셀룰러 기지국(2)과; 셀룰러 기지국(2)들 사이의 통신을 제어하는 수단(5)과; 상기 이동유니트(3)와 셀룰러기지국(2)에서 공히 (a) 음성신호를 엔코딩하기 위한 수단과 엔코딩된 음성신호를 송신하기 위한 수단을 포함하는 송신기, 및 (b) 전송된 엔코딩된 신호를 수신하는 수단과, 수신된 엔코딩된 음성신호를 디코딩하기 위한 수단을 구비한 수신기를 포함하는, 하나의 셀 내에 위치한 각각의 이동 유니트(3)와 상기 하나의 셀의 셀룰러기지국(2) 사이의 양방향 무선통신 서브시스템을 포함하며, 상기 음성신호 엔코딩수단은 음성 신호 엔코딩 변수들을 생성하도록 음성 신호에 응답하는 수단을 포함하고, 상기 음성 신호 엔코딩 변수 생성수단은 음성신호를 엔코딩하기 위해 코드북 내에서 심도우선 검색을 수행하는, 상기 청구범위 11항에 청구된 코드북의 심도 우선 검색 수행장치를 포함하는 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  22. 제21항에 있어서, 상기 제 1 선택수단(603, 604)은 트리구조(도 5)의 후속적인 레벨 m(레벨 2 내지 5)와 관련된 패스 형성 과정중에 확장된 다수의 레벨-1 경합 패스(501, 502, 504)들을 형성하도록 관련 선택 기준에 따라 N1비 제로 진폭 펄스들의 다수의 유효 위치 p들을 선택하며, 상기 트리구조의 레벨 m들은 최종 레벨 M (레벨 5)을 포함하고, 상기 코드북 심도 우선 검색장치는 트리구조의 최종 검색 레벨에서 음성신호를 엔코딩하기 위해 연관된 선택 기준에 따라 상기 패스에 의해 형성된 경합 코드 벡터 AK들(505)중 하나를 선택하는 수단(610)을 또한 포함하는 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  23. 제21항에 있어서, 적어도 하나의 인터리브된 단일 펄스 순열 설계에 따라 N 개의 비 제로 진폭 펄스들의 설정된 유효위치 p 를 유도하기 위한 수단을 더 포함하는 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  24. 제21항에 있어서, 상기 제 2 선택수단은 상기 각각의 레벨-(m-1) 경합 패스를 위하여 주어진 수학적 비를 계산하는 수단과, 상기 주어진 수학적 비를 최대화하는 펄스 위치 p들에 의해 형성된 패스를 유지하는 수단을 포함하는 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  25. 제21항에 있어서, 상기 제 1 선정수단과 제 1 선택수단은 음성신호에 대한 펄스 위치 유사 추정 벡터를 계산하는 수단(601)과, N개의 비 제로 진폭 펄스들의 수 N1와, 상기 펄스 위치 유사 추정 벡터에 대한 상기 N1비 제로 진폭 펄스의 적어도 하나의 유효 위치 p 를 선택하는 수단(602, 603, 604)을 포함하는 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  26. 제25항에 있어서, 상기 펄스 위치 유사 추정 벡터를 계산하는 수단은, 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 를 발생시키기 위하여 음성신호를 처리하는 수단(103, 121, 107, 108)과, 상기 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스 위치 유사 추정 벡터 B 를 계산하는 수단(601)을 포함하는 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  27. 제26항에 있어서, 상기 목표신호 X, 역방향 필터링된 목표신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스위치 유사추정 벡터 B를 계산하는 수단은, 정규형
    Figure kpo00041
    로서 역방향 필터링된 목표신호 D를 정규형
    Figure kpo00042
    인 피치를 제거한 잔류신호 R'에 합산하여
    Figure kpo00043
    (여기에서 β는 불변상수임)인 형태의 펄스위치 유사추정 벡터 B를 얻는 합산수단을 포함하는 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  28. 제27항에 있어서, β가 0과 1 사이의 불변상수인 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  29. 제28항에 있어서, β가 ½의 값을 갖는 불변상수인 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  30. 제21항에 있어서, 상기 N 개의 비 제로 진폭 펄스들이 각각의 인덱스들을 갖고 있고, 상기 제 2 선정 수단(605)이 원형상의 배열에서 아직 선택되지 아니하였던 펄스들의 인덱스들을 배치하는 수단과, 트리구조(도 5)의 앞서의 선정 레벨 내에서 선택된 최종 비 제로 진폭 펄스의 우측에서 시작하여 인덱스들의 시계방향 순서에 따라 Nm비 제로 진폭 펄스를 선정하는 수단을 포함하는 것을 특징으로 하는 광역 서비스용 셀룰러 통신시스템.
  31. (a) 음성신호를 엔코딩하기 위한 수단과 엔코딩된 음성신호를 송신하기 위한 수단을 포함하는 송신기, 및 (b) 전송된 엔코딩된 신호를 수신하는 수단과, 수신된 엔코딩된 음성신호를 디코딩하기 위한 수단을 구비한 수신기를 포함하며, 상기 음성신호 엔코딩수단은 음성 신호 엔코딩 변수들을 생성하도록 음성 신호에 응답하는 수단을 포함하고, 상기 음성 신호 엔코딩 변수 생성수단은 음성신호를 엔코딩하기 위해 코드북 내에서 심도우선 검색을 수행하는, 상기 청구범위 11항에 청구된 코드북의 심도 우선 검색 수행장치를 포함하여 구성되는 셀룰러 네트웍 요소(2).
  32. 제31항에 있어서, 제 1 선택수단(603, 604)은 트리구조(도 5)의 후속적인 레벨 m(레벨 2 내지 5)와 관련된 패스 형성 과정중에 확장된 다수의 레벨-1 경합 패스(501, 502, 504)들을 형성하도록 관련 선택 기준에 따라 N1비 제로 진폭 펄스들의 다수의 유효 위치 p들을 선택하며, 상기 트리구조의 레벨 m들은 최종 레벨 M (레벨 5)을 포함하고, 상기 코드북 심도 우선 검색장치는 트리구조의 최종 검색 레벨에서 음성신호를 엔코딩하기 위해 연관된 선택 기준에 따라 상기 패스에 의해 형성된 경합 오드 벡터 AK들(505)중 하나를 선택하는 수단(610)을 포함하는 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  33. 제31항에 있어서, 적어도 하나의 인터리브된 단일 펄스 순열 설계에 따라 N개의 비 제로 진폭 펄스들의 설정된 유효위치 p 를 유도하기 위한 수단을 더 포함하는 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  34. 제31항에 있어서, 상기 제 2 선택수단은 상기 각각의 레벨-(m-1) 경합 패스를 위하여 주어진 수학적 비를 계산하는 수단과, 상기 주어진 수학적 비를 최대화하는 펄스 위치 p들에 의해 형성된 패스를 유지하는 수단을 포함하는 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  35. 제31항에 있어서, 상기 제 1 선정수단과 제 1 선택수단은 음성신호에 대한 펄스 위치 유사 추정 벡터를 계산하는 수단(601)과, N개의 비 제로 진폭 펄스들의 수 N1와, 상기 펄스 위치 유사 추정 벡터에 대한 상기 N1비 제로 진폭 펄스의 적어도 하나의 유효 위치 p 를 선택하는 수단(602, 603, 604)을 포함하는 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  36. 제35항에 있어서, 상기 펄스 위치 유사 추정 벡터를 계산하는 수단은, 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 를 발생시키기 위하여 음성신호를 처리하는 수단(103, 121, 107, 108)과, 상기 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스 위치 유사 추정 벡터 B 를 계산하는 수단(601)을 포함하는 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  37. 제36항에 있어서, 상기 목표신호 X, 역방향 필터링된 목표신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스위치 유사추정 벡터 B를 계산하는 수단은, 정규형
    Figure kpo00044
    로서 역방향 필터링된 목표신호 D를 정규형
    Figure kpo00045
    인 피치를 제거한 잔류신호 R'에 합산하여
    Figure kpo00046
    (여기에서 β는 불변상수임)인 형태의 펄스위치 유사추정 벡터 B를 얻는 합산수단을 포함하는 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  38. 제37항에 있어서, β가 0과 1 사이의 불변상수인 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  39. 제38항에 있어서, β가 ½의 값을 갖는 불변상수인 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  40. 제31항에 있어서, 상기 N 개의 비 제로 진폭 펄스들이 각각의 인덱스들을 갖고 있고, 상기 제 2 선정 수단(605)이 원형상의 배열에서 아직 선택되지 아니하였던 펄스들의 인덱스들을 배치하는 수단과, 트리구조(도 5)의 앞서의 선정 레벨 내에서 선택된 최종 비 제로 진폭 펄스의 우측에서 시작하여 인덱스들의 시계방향 순서에 따라 Nm비 제로 진폭 펄스를 선정하는 수단을 포함하는 것을 특징으로 하는 셀룰러 네트웍 요소(2).
  41. (a) 음성신호를 엔코딩하기 위한 수단과 엔코딩된 음성신호를 송신하기 위한 수단을 포함하는 송신기, 및 (b) 전송된 엔코딩된 신호를 수신하는 수단과, 수신된 엔코딩된 음성신호를 디코딩하기 위한 수단을 구비한 수신기를 포함하며, 상기 음성신호 엔코딩수단은 음성 신호 엔코딩 변수들을 생성하도록 음성 신호에 응답하는 수단을 포함하고, 상기 음성 신호 엔코딩 변수 생성수단은 음성신호를 엔코딩하기 위해 코드북 내에서 심도우선 검색을 수행하는, 상기 청구범위 11항에 청구된 코드북의 심도 우선 검색 수행장치를 포함하여 구성되는 셀룰러 이동 송수신기.
  42. 제41항에 있어서, 제 1 선택수단(603, 604)은 트리구조(도 5)의 후속적인 레벨 m(레벨 2 내지 5)와 관련된 패스 형성 과정중에 확장된 다수의 레벨-1 경합 패스(501, 502, 504)들을 형성하도록 관련 선택 기준에 따라 N1비 제로 진폭 펄스들의 다수의 유효 위치 p들을 선택하며, 상기 트리구조의 레벨 m들은 최종 레벨 M (레벨 5)을 포함하고, 상기 코드북 심도 우선 검색장치는 트리구조의 최종 검색 레벨에서 음성신호를 엔코딩하기 위해 연관된 선택 기준에 따라 상기 패스에 의해 형성된 경합 코드 벡터 AK들(505)중 하나를 선택하는 수단(610)을 포함하는 것을 특징으로 하는 셀룰러 이동 송수신기.
  43. 제41항에 있어서, 적어도 하나의 인터리브된 단일 펄스 순열 설계에 따라 N개의 비 제로 진폭 펄스들의 설정된 유효위치 p 를 유도하기 위한 수단을 더 포함하는 것을 특징으로 하는 셀룰러 이동 송수신기.
  44. 제41항에 있어서, 상기 제 2 선택수단은 상기 각각의 레벨-(m-1) 경합 패스를 위하여 주어진 수학적 비를 계산하는 수단과, 상기 주어진 수학적 비를 최대화하는 펄스 위치 p들에 의해 형성된 패스를 유지하는 수단을 포함하는 것을 특징으로 하는 셀룰러 이동 송수신기.
  45. 제41항에 있어서, 상기 제 1 선정수단과 제 1 선택수단은 음성신호에 대한 펄스 위치 유사 추정 벡터를 계산하는 수단(601)와, N개의 비 제로 진폭 펄스들의 수 N1와, 상기 펄스 위치 유사 추정 벡터에 대한 상기 N1비 제로 진폭 펄스의 적어도 하나의 유효 위치 p 를 선택하는 수단(602, 603, 604)을 포함하는 것을 특징으로 하는 셀룰러 이동 송수신기.
  46. 제45항에 있어서, 상기 펄스 위치 유사 추정 벡터를 계산하는 수단은, 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 를 발생시키기 위하여 음성신호를 처리하는 수단(103, 121, 107, 108)과, 상기 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스 위치 유사 추정 벡터 B 를 계산하는 수단(601)을 포함하는 것을 특징으로 하는 셀룰러 이동 송수신기.
  47. 제46항에 있어서, 상기 목표신호 X, 역방향 필터링된 목표신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스위치 유사추정 벡터 B를 계산하는 수단은, 정규형
    Figure kpo00047
    로서 역방향 필터링된 목표신호 D를 정규형
    Figure kpo00048
    인 피치를 제거한 잔류신호 R'에 합산하여
    Figure kpo00049
    (여기에서 β는 불변상수임)인 형태의 펄스위치 유사추정 벡터 B를 얻는 합산수단을 포함하는 것을 특징으로 하는 셀룰러 이동 송수신기.
  48. 47항에 있어서, β가 0과 1 사이의 불변상수인 것을 특징으로 하는 셀룰러 이동 송수신기.
  49. 제48항에 있어서, β가 ½의 값을 갖는 불변상수인 것을 특징으로 하는 셀룰러 이동 송수신기.
  50. 제41항에 있어서, 상기 N 개의 비 제로 진폭 펄스들이 각각의 인덱스들을 갖고 있고, 상기 제 2 선정 수단(605)이 원형상의 배열에서 아직 선택되지 아니하였던 펄스들의 인덱스들을 배치하는 수단과, 트리구조(도 5)의 앞서의 선정 레벨 내에서 선택된 최종 비 제로 진폭 펄스의 우측에서 시작하여 인덱스들의 시계방향 순서에 따라 Nm비 제로 진폭 펄스를 선정하는 수단을 포함하는 것을 특징으로 하는 셀룰러 이동 송수신기.
  51. 이동형 송신기/수신기 유니트(3)들; 상기 셀들 내지 각각 위치하는 셀룰러 기지국(2)과; 셀룰러 기지국(2)들 사이의 통신을 제어하는 수단(5)과; 상기 이동유니트(3)와 셀룰러기지국(2)에서 공히 (a) 음성신호를 엔코딩하기 위한 수단과 엔코딩된 음성신호를 송신하기 위한 수단을 포함하는 송신기, 및 (b) 전송된 엔코딩된 신호를 수신하는 수단과, 수신된 엔코딩된 음성신호를 디코딩하기 위한 수단을 구비한 수신기를 포함하는, 하나의 셀 내에 위치한 각각의 이동 유니트(3)와 상기 하나의 셀의 셀룰러기지국(2) 사이의 양방향 무선통신 서브시스템을 포함하는, 다수의 셀 들로 분할되는 광역에서 서비스하기 위한 셀룰러 통신시스템(1)의 양방향 무선 통신 서브시스템에 있어서, 상기 음성신호 엔코딩수단은 음성 신호 엔코딩 변수들을 생성하도록 음성 신호에 응답하는 수단을 포함하고, 상기 음성 신호 엔코딩 변수 생성수단은 음성신호를 엔코딩하기 위해 음성 신호를 구성하는 코드북 내에서 심도우선 검색을 수행하는, 상기 청구범위 11항에 청구된 코드북의 심도 우선 검색 수행장치를 포함하는 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  52. 제51항에 있어서, 상기 제 1 선택수단(603, 604)은 트리구조(도 5)의 후속적인 레벨 m(레벨 2 내지 5)와 관련된 패스 형성 과정중에 확장된 다수의 레벨-1 경합 패스(501, 502, 504)들을 형성하도록 관련 선택 기준에 따라 N1비 제로 진폭 펄스들의 다수의 유효 위치 p들을 선택하며, 상기 트리구조의 레벨 m들은 최종 레벨 M (레벨 5)을 포함하고, 상기 코드북 심도 우선 검색장치는 트리구조의 최종 검색 레벨에서 음성신호를 엔코딩하기 위해 연관된 선택 기준에 따라 상기 패스에 의해 형성된 경합 코드 벡터 AK들(505)중 하나를 선택하는 수단(610)을 또한 포함하는 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  53. 제51항에 있어서, 적어도 하나의 인터리브된 단일 펄스 순열 설계에 따라 N 개의 비 제로 진폭 펄스들의 설정된 유효위치 p 를 유도하기 위한 수단을 더 포함하는 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  54. 제51항에 있어서, 상기 제 2 선택수단은 상기 각각의 레벨-(m-1) 경합 패스를 위하여 주어진 수학적 비를 계산하는 수단과, 상기 주어진 수학적 비를 최대화하는 펄스 위치 p들에 의해 형성된 패스를 유지하는 수단을 포함하는 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  55. 제51항에 있어서, 상기 제 1 선정수단과 제 1 선택수단은 응성신호에 대한 펄스 위치 유사 추정 벡터를 계산하는 수단(601)과, N개의 비 제로 진폭 펄스들의 수 N1와, 상기 펄스 위치 유사 추정 벡터에 대한 상기 N1비 제로 진폭 펄스의 적어도 하나의 유효 위치 p 를 선택하는 수단(602, 603, 604)을 포함하는 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  56. 제55항에 있어서, 상기 펄스 위치 유사 추정 벡터를 계산하는 수단은, 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 를 발생시키기 위하여 음성신호를 처리하는 수단(103, 121, 107, 108)과, 상기 목표 신호 X, 역방향 필터링된 목표 신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스 위치 유사 추정 벡터 B 를 계산하는 수단(601)을 포함하는 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  57. 제56항에 있어서, 상기 목표신호 X, 역방향 필터링된 목표신호 D 및 피치를 제거한 잔류신호 R' 중의 적어도 하나에 응답하여 펄스위치 유사추정 벡터 B를 계산하는 수단은, 정규형
    Figure kpo00050
    로서 역방향 필터링된 목표신호 D를 정규형
    Figure kpo00051
    인 피치를 제거한 잔류신호 R'에 합산하여
    Figure kpo00052
    (여기에서 β는 불변상수임)인 형태의 펄스위치 유사추정 벡터 B를 얻는 합산수단을 포함하는 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  58. 제57항에 있어서, β가 0과 1 사이의 불변상수인 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  59. 제58항에 있어서, β가 ½의 값을 갖는 불변상수인 것을 특징으로 하는 양방향 무선 통신 서브시스템.
  60. 제51항에 있어서, 상기 N 개의 비 제로 진폭 펄스들이 각각의 인덱스들을 갖고 있고, 상기 제 2 선정 수단(605)이 원형상의 배열에서 아직 선택되지 아니하였던 펄스들의 인덱스들을 배치하는 수단과, 트리구조(도 5)의 앞서의 선정 레벨 내에서 선택된 최종 비 제로 진폭 펄스의 우측에서 시작하여 인덱스들의 시계방향 순서에 따라 Nm비 제로 진폭 펄스를 선정하는 수단을 포함하는 것을 특징으로 하는 양방향 무선 통신 서브시스템.
KR1019970706298A 1995-03-10 1996-03-05 음성의고속코딩을위한심도우선대수코드북검색 KR100299408B1 (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US40178595A 1995-03-10 1995-03-10
US8/401,785 1995-03-10
US08/401,785 1995-03-10
US08/509,525 US5701392A (en) 1990-02-23 1995-07-31 Depth-first algebraic-codebook search for fast coding of speech
US08/509,525 1995-07-31
US8/509,525 1995-07-31
PCT/CA1996/000135 WO1996028810A1 (en) 1995-03-10 1996-03-05 Depth-first algebraic-codebook search for fast coding of speech

Publications (2)

Publication Number Publication Date
KR19980702890A KR19980702890A (ko) 1998-08-05
KR100299408B1 true KR100299408B1 (ko) 2001-11-05

Family

ID=27017596

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970706298A KR100299408B1 (ko) 1995-03-10 1996-03-05 음성의고속코딩을위한심도우선대수코드북검색

Country Status (24)

Country Link
US (1) US5701392A (ko)
EP (1) EP0813736B1 (ko)
JP (1) JP3160852B2 (ko)
KR (1) KR100299408B1 (ko)
CN (1) CN1114900C (ko)
AR (1) AR001189A1 (ko)
AT (1) ATE193392T1 (ko)
AU (1) AU707307B2 (ko)
BR (1) BR9607144A (ko)
CA (1) CA2213740C (ko)
DE (1) DE19609170B4 (ko)
DK (1) DK0813736T3 (ko)
ES (1) ES2112808B1 (ko)
FR (1) FR2731548B1 (ko)
GB (1) GB2299001B (ko)
HK (1) HK1001846A1 (ko)
IN (1) IN187842B (ko)
IT (1) IT1285305B1 (ko)
MX (1) MX9706885A (ko)
MY (1) MY119252A (ko)
PT (1) PT813736E (ko)
RU (1) RU2175454C2 (ko)
SE (1) SE520554C2 (ko)
WO (1) WO1996028810A1 (ko)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
JP3273455B2 (ja) * 1994-10-07 2002-04-08 日本電信電話株式会社 ベクトル量子化方法及びその復号化器
EP0773533B1 (en) * 1995-11-09 2000-04-26 Nokia Mobile Phones Ltd. Method of synthesizing a block of a speech signal in a CELP-type coder
DE19641619C1 (de) * 1996-10-09 1997-06-26 Nokia Mobile Phones Ltd Verfahren zur Synthese eines Rahmens eines Sprachsignals
CN1262994C (zh) * 1996-11-07 2006-07-05 松下电器产业株式会社 噪声消除器
US6161086A (en) * 1997-07-29 2000-12-12 Texas Instruments Incorporated Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search
CN100349208C (zh) * 1997-10-22 2007-11-14 松下电器产业株式会社 扩散矢量生成方法及扩散矢量生成装置
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
JP3199020B2 (ja) * 1998-02-27 2001-08-13 日本電気株式会社 音声音楽信号の符号化装置および復号装置
JP3180762B2 (ja) * 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6556966B1 (en) 1998-08-24 2003-04-29 Conexant Systems, Inc. Codebook structure for changeable pulse multimode speech coding
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
JP3824810B2 (ja) * 1998-09-01 2006-09-20 富士通株式会社 音声符号化方法、音声符号化装置、及び音声復号装置
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6295520B1 (en) 1999-03-15 2001-09-25 Tritech Microelectronics Ltd. Multi-pulse synthesis simplification in analysis-by-synthesis coders
EP1221694B1 (en) * 1999-09-14 2006-07-19 Fujitsu Limited Voice encoder/decoder
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
WO2001024166A1 (en) * 1999-09-30 2001-04-05 Stmicroelectronics Asia Pacific Pte Ltd G.723.1 audio encoder
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
KR100464369B1 (ko) * 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US6766289B2 (en) * 2001-06-04 2004-07-20 Qualcomm Incorporated Fast code-vector searching
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
KR100463418B1 (ko) * 2002-11-11 2004-12-23 한국전자통신연구원 Celp 음성 부호화기에서 사용되는 가변적인 고정코드북 검색방법 및 장치
KR100463559B1 (ko) * 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
KR100556831B1 (ko) * 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US20050256702A1 (en) * 2004-05-13 2005-11-17 Ittiam Systems (P) Ltd. Algebraic codebook search implementation on processors with multiple data paths
SG123639A1 (en) 2004-12-31 2006-07-26 St Microelectronics Asia A system and method for supporting dual speech codecs
US8000967B2 (en) 2005-03-09 2011-08-16 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity code excited linear prediction encoding
KR100813260B1 (ko) * 2005-07-13 2008-03-13 삼성전자주식회사 코드북 탐색 방법 및 장치
US8352254B2 (en) * 2005-12-09 2013-01-08 Panasonic Corporation Fixed code book search device and fixed code book search method
US20070150266A1 (en) * 2005-12-22 2007-06-28 Quanta Computer Inc. Search system and method thereof for searching code-vector of speech signal in speech encoder
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
US20080120098A1 (en) * 2006-11-21 2008-05-22 Nokia Corporation Complexity Adjustment for a Signal Encoder
US20080147385A1 (en) * 2006-12-15 2008-06-19 Nokia Corporation Memory-efficient method for high-quality codebook based voice conversion
US8719011B2 (en) * 2007-03-02 2014-05-06 Panasonic Corporation Encoding device and encoding method
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
RU2458413C2 (ru) * 2007-07-27 2012-08-10 Панасоник Корпорэйшн Устройство кодирования аудио и способ кодирования аудио
US8620648B2 (en) 2007-07-27 2013-12-31 Panasonic Corporation Audio encoding device and audio encoding method
US8566106B2 (en) * 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
WO2011074233A1 (ja) 2009-12-14 2011-06-23 パナソニック株式会社 ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
CA2813898C (en) * 2010-10-07 2017-05-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for level estimation of coded audio frames in a bit stream domain
CN102623012B (zh) * 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
US11256696B2 (en) * 2018-10-15 2022-02-22 Ocient Holdings LLC Data set compression within a database system
CN110247714B (zh) * 2019-05-16 2021-06-04 天津大学 集伪装与加密于一体的仿生隐蔽水声通信编码方法及装置

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
CA1164569A (en) * 1981-03-17 1984-03-27 Katsunobu Fushikida System for extraction of pole/zero parameter values
WO1983003917A1 (en) * 1982-04-29 1983-11-10 Massachusetts Institute Of Technology Voice encoder and synthesizer
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
JPS5922165A (ja) * 1982-07-28 1984-02-04 Nippon Telegr & Teleph Corp <Ntt> アドレス制御回路
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
US4764963A (en) * 1983-04-12 1988-08-16 American Telephone And Telegraph Company, At&T Bell Laboratories Speech pattern compression arrangement utilizing speech event identification
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
DE3335358A1 (de) * 1983-09-29 1985-04-11 Siemens AG, 1000 Berlin und 8000 München Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung
US4799261A (en) * 1983-11-03 1989-01-17 Texas Instruments Incorporated Low data rate speech encoding employing syllable duration patterns
CA1236922A (en) * 1983-11-30 1988-05-17 Paul Mermelstein Method and apparatus for coding digital signals
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4724535A (en) * 1984-04-17 1988-02-09 Nec Corporation Low bit-rate pattern coding with recursive orthogonal decision of parameters
US4680797A (en) * 1984-06-26 1987-07-14 The United States Of America As Represented By The Secretary Of The Air Force Secure digital speech communication
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4858115A (en) * 1985-07-31 1989-08-15 Unisys Corporation Loop control mechanism for scientific processor
IT1184023B (it) * 1985-12-17 1987-10-22 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4873723A (en) * 1986-09-18 1989-10-10 Nec Corporation Method and apparatus for multi-pulse speech coding
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
GB8630820D0 (en) * 1986-12-23 1987-02-04 British Telecomm Stochastic coder
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
DE68922134T2 (de) * 1988-05-20 1995-11-30 Nec Corp Überträgungssystem für codierte Sprache mit Codebüchern zur Synthetisierung von Komponenten mit niedriger Amplitude.
US5008965A (en) * 1988-07-11 1991-04-23 Kinetic Concepts, Inc. Fluidized bead bed
CA2050593A1 (en) * 1989-04-04 1990-10-05 Michael Piatak Jr. Recombinant trichosanthin and coding sequence
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JP3089769B2 (ja) * 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
US5667340A (en) * 1995-09-05 1997-09-16 Sandoz Ltd. Cementitious composition for underwater use and a method for placing the composition underwater

Also Published As

Publication number Publication date
DE19609170B4 (de) 2004-11-11
CA2213740A1 (en) 1996-09-19
IT1285305B1 (it) 1998-06-03
AU4781196A (en) 1996-10-02
JPH11501131A (ja) 1999-01-26
ITTO960174A0 (ko) 1996-03-08
SE9600918L (sv) 1996-09-11
PT813736E (pt) 2000-11-30
ATE193392T1 (de) 2000-06-15
MX9706885A (es) 1998-03-31
CN1181151A (zh) 1998-05-06
AR001189A1 (es) 1997-09-24
CA2213740C (en) 2003-01-21
EP0813736A1 (en) 1997-12-29
DK0813736T3 (da) 2000-10-30
FR2731548A1 (fr) 1996-09-13
ES2112808B1 (es) 1998-11-16
HK1001846A1 (en) 1998-07-10
MY119252A (en) 2005-04-30
FR2731548B1 (fr) 1998-11-06
IN187842B (ko) 2002-07-06
SE9600918D0 (sv) 1996-03-08
GB2299001B (en) 1997-08-06
GB9605123D0 (en) 1996-05-08
WO1996028810A1 (en) 1996-09-19
SE520554C2 (sv) 2003-07-22
GB2299001A (en) 1996-09-18
BR9607144A (pt) 1997-11-25
US5701392A (en) 1997-12-23
KR19980702890A (ko) 1998-08-05
ITTO960174A1 (it) 1997-09-08
CN1114900C (zh) 2003-07-16
AU707307B2 (en) 1999-07-08
RU2175454C2 (ru) 2001-10-27
ES2112808A1 (es) 1998-04-01
DE19609170A1 (de) 1996-09-19
JP3160852B2 (ja) 2001-04-25
EP0813736B1 (en) 2000-05-24

Similar Documents

Publication Publication Date Title
KR100299408B1 (ko) 음성의고속코딩을위한심도우선대수코드북검색
JP4187556B2 (ja) スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳
US7774200B2 (en) Method and apparatus for transmitting an encoded speech signal
US5819213A (en) Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
KR19980080463A (ko) 코드여기 선형예측 음성코더내에서의 벡터 양자화 방법
CA2210765E (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
CA2618002C (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
JPH10133696A (ja) 音声符号化装置
WO2000042601A1 (en) A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders
SE524905C2 (sv) Algebraisk kodbok med signalvalda pulsamplituder för snabb kodning av tal
NO322594B1 (no) Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale
JP2004093946A (ja) 音声符号化装置および音声符号化プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130610

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20140305

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20150609

Year of fee payment: 15

EXPY Expiration of term