KR20020013966A - 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치 - Google Patents
위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치 Download PDFInfo
- Publication number
- KR20020013966A KR20020013966A KR1020027000728A KR20027000728A KR20020013966A KR 20020013966 A KR20020013966 A KR 20020013966A KR 1020027000728 A KR1020027000728 A KR 1020027000728A KR 20027000728 A KR20027000728 A KR 20027000728A KR 20020013966 A KR20020013966 A KR 20020013966A
- Authority
- KR
- South Korea
- Prior art keywords
- frame
- prototype
- phase
- current
- vector
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000001228 spectrum Methods 0.000 title abstract description 22
- 239000013598 vector Substances 0.000 claims abstract description 108
- 230000010363 phase shift Effects 0.000 claims abstract description 33
- 238000013139 quantization Methods 0.000 claims description 29
- 238000000354 decomposition reaction Methods 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 230000003595 spectral effect Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/097—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Testing Electric Properties And Detecting Electric Faults (AREA)
Abstract
Description
Claims (81)
- 음성 코더에서 프레임의 프로토타입을 처리하는 방법으로서,프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하는 단계;상기 프레임의 프로토타입의 다수의 위상 파라미터를 생성하는 단계; 및다수의 주파수 대역에서 상기 프레임 프로토타입의 위상 파라미터와 프레임의 기준 프로토타입의 위상 파라미터를 상관시키는 단계를 포함하는 방법.
- 제 1 항에 있어서, 상기 프레임의 기준 프로토타입의 위상 파라미터를 생성하는 단계는 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하는 단계 및 상기 이산 퓨리에 급수 계수를 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하는 단계를 포함하며,상기 프레임의 프로토타입의 위상 파라미터를 생성하는 단계는 상기 프레임의 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하는 단계 및 상기 이산 퓨리에 급수 계수를 상기 프레임의 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 1 항에 있어서, 상기 상관 단계를 수행하는데 있어서 주파수 대역을 식별하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제 1 항에 있어서, 상기 프레임은 음성 프레임인 것을 특징으로 하는 방법.
- 제 1 항에 있어서, 상기 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 방법.
- 제 1 항에 있어서, 상기 상관 단계는 상기 프레임의 프로토타입에 대한 다수의 최적 선형 위상 시프트 값을 생성하는 것을 특징으로 하는 방법.
- 제 1 항에 있어서, 상기 상관 단계는 상기 프레임의 프로토타입에 대한 다수의 최적 회전 순환 값을 생성하는 것을 특징으로 하는 방법.
- 제 6 항에 있어서, 상기 선형 위상 시프트 값을 양자화하고 상기 프레임의 프로토타입에 대한 다수의 진폭 파라미터를 양자화하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제 7 항에 있어서, 상기 회전 순환 값을 양자화하는 단계 및 상기 프레임의 프로토타입에 대한 다수의 진폭 파라미터를 양자화하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 음성 코더에서 프레임의 프로토타입을 처리하는 방법으로서,프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하는 단계;상기 프레임의 프로토타입과 연관된 다수의 선형 위상 시프트 값을 생성하는 단계; 및다수의 주파수 대역에 걸쳐 위상 파라미터와 선형 위상 시프트 값으로부터 위상 벡터를 구성하는 단계를 포함하는 방법.
- 제 10 항에 있어서, 상기 프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하는 단계는 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하는 단계 및 상기 이산 퓨리에 급수 계수를 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 10 항에 있어서, 상기 구성 단계를 수행하는데 주파수 대역을 식별하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제 10 항에 있어서, 상기 프레임은 음성 프레임인 것을 특징으로 하는 방법.
- 제 10 항에 있어서, 상기 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 방법.
- 제 10 항에 있어서, 상기 선형 위상 시프트 값을 생성하는 단계는 상기 다수의 선형 위상 시프트 값을 생성하기 위해 상기 프레임의 프로토타입과 연관된 다수의 양자화된 위상 파라미터를 비양자화하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 12 항에 있어서, 다수의 비양자화 진폭 파라미터를 생성하기 위해 상기 프레임의 프로토타입과 연관된 다수의 진폭 양자화 파라미터를 비양자화시키는 단계를 더 포함하며,상기 식별 단계는 상기 다수의 비양자화 진폭 파라미터에 기초하여 대역을 식별하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 10 항에 있어서, 결합된 벡터를 생성하기 위해 상기 프레임의 프로토타입과 연관된 다수의 진폭 파라미터와 상기 합성된 위상 벡터를 결합하는 단계 및 상기 프레임의 프로토타입의 재구성된 버전을 생성하기 위해 상기 결합된 벡터의 역 이산 퓨리에 급수를 계산하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 음성 코더에서 프레임의 프로토타입을 처리하는 방법으로서,상기 프레임의 프로토타입에 연관된 다수의 회전 순환 값을 생성하는 단계;프레임의 다수의 주파수 대역에서 프레임의 기준 프로토타입의 다수의 위상 파라미터와 연관된 다수의 대역통과 파형을 생성하는 단계; 및상기 다수의 회전 순환 값에 기초하여 상기 다수의 대역통과 파형을 변조시키는 단계를 포함하는 방법.
- 제 18 항에 있어서, 상기 다수의 대역통과 파형을 생성하는 단계는 상기 주파수 대역을 식별하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 제 18 항에 있어서, 상기 프레임은 음성 프레임인 것을 특징으로 하는 방법.
- 제 18 항에 있어서, 상기 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 방법.
- 제 18 항에 있어서, 상기 다수의 회전 순환 값을 생성하는 단계는 상기 다수의 회전 순환 값을 생성하기 위해 상기 프레임의 프로토타입과 연관된 다수의 양자화된 위상 파라미터를 비양자화하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 19 항에 있어서, 다수의 비양자화된 진폭 파라미터를 생성하기 위해 상기 프레임의 프로토타입과 연관된 다수의 진폭 양자화 파라미터를 비양자화하는 단계를 더 포함하며,상기 식별 단계는 상기 다수의 비양자화된 진폭 파라미터에 기초하여 대역을 식별하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 23 항에 있어서, 상기 다수의 회전 순환 값을 생성하는 단계는 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수들을 계산하는 단계, 상기 이산 퓨리에 급수 계수들을 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하는 단계, 상기 다수의 비양자화된 진폭 파라미터와 상기 위상 벡터를 결합하는 단계, 및 상기 다수의 대역통과 파형을 생성하기 위해 상기 위상 벡터의 역 이산 퓨리에 급수를 계산하는 단계를 포함하는 것을 특징으로 하는 방법.
- 제 18 항에 있어서, 상기 프레임의 프로토타입의 재구성된 버전을 생성하기 위해 상기 다수의 변조된 대역통과 파형을 합산하는 단계를 더 포함하는 것을 특징으로 하는 방법.
- 프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하는 수단;현재 프레임의 현재 프로토타입의 다수의 위상 파라미터를 생성하는 수단; 및다수의 주파수 대역에서 상기 현재 프로토타입의 위상 파라미터와 기준 프로토타입의 위상 파라미터를 상관시키는 수단을 포함하는 음성 코더.
- 제 26 항에 있어서, 상기 프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하는 수단은 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하는 수단 및 상기 이산 퓨리에 급수 계수들을 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하는 수단을 포함하며,상기 현재 프로토타입의 다수의 위상 파라미터를 생성하는 수단은 상기 현재 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하는 수단 및 상기 이산 퓨리에 급수 계수를 상기 현재 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하는 수단을 포함하는 것을 특징으로 하는 음성 코더.
- 제 26 항에 있어서, 상기 다수의 주파수 대역을 식별하는 수단을 더 포함하는 것을 특징으로 하는 음성 코더.
- 제 26 항에 있어서, 상기 현재 프레임은 음성 프레임인 것을 특징으로 하는 음성 코더.
- 제 26 항에 있어서, 상기 현재 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 음성 코더.
- 제 26 항에 있어서, 상기 상관 수단은 상기 현재 프로토타입에 대한 다수의 최적 선형 위상 시프트 값을 생성하는 것을 특징으로 하는 음성 코더.
- 제 26 항에 있어서, 상기 상관시키는 수단은 상기 현재 프로토타입에 대해다수의 최적 회전 순환 값을 생성하는 것을 특징으로 하는 음성 코더.
- 제 31 항에 있어서, 상기 선형 위상 시프트 값을 양자화하는 수단 및 상기 현재 프로토타입에 대한 다수의 진폭 파라미터를 양자화하는 수단을 더 포함하는 것을 특징으로 하는 음성 코더.
- 제 32 항에 있어서, 상기 회전 순환 값을 양자화하는 수단 및 상기 현재 프로토타입에 대한 다수의 진폭 파라미터를 양자화하는 수단을 더 포함하는 것을 특징으로 하는 음성 코더.
- 제 26 항에 있어서, 상기 음성 코더는 무선 통신 시스템의 가입자 유니트에 부속하는 것을 특징으로 하는 음성 코더.
- 프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하는 수단;현재 프레임의 현재 프로토타입과 연관된 다수의 선형 위상 시프트 값을 생성하는 수단; 및다수의 주파수 대역에 걸쳐 상기 위상 파라미터 및 선형 위상 시프트 값으로부터 위상 벡터를 구성하는 수단을 포함하는 음성 코더.
- 제 36 항에 있어서, 상기 프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하는 수단은 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하는 수단 및 상기 이산 퓨리에 급수 계수를 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하는 수단을 포함하는 것을 특징으로 하는 음성 코더.
- 제 36 항에 있어서, 상기 다수의 주파수 대역을 식별하는 수단을 더 포함하는 것을 특징으로 하는 음성 코더.
- 제 36 항에 있어서, 상기 현재 프레임은 음성 프레임인 것을 특징으로 하는 음성 코더.
- 제 36 항에 있어서, 상기 현재 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 음성 코더.
- 제 36 항에 있어서, 상기 다수의 선형 위상 시프트 값을 생성하는 수단은 상기 다수의 선형 위상 시프트 값을 생성하기 위해 상기 현재 프로토타입과 연관된 다수의 양자화된 위상 파라미터를 비양자화하는 수단을 포함하는 것을 특징으로 하는 음성 코더.
- 제 38 항에 있어서, 다수의 비양자화된 진폭 파라미터를 생성하기 위해 상기현재 프로토타입과 연관된 다수의 진폭 양자화 파라미터를 비양자화하는 수단을 더 포함하며, 상기 식별 수단은 상기 다수의 비양자화된 진폭 파라미터에 기초하여 상기 다수의 대역을 식별하는 수단을 포함하는 것을 특징으로 하는 음성 코더.
- 제 36 항에 있어서, 결합된 벡터를 생성하기 위해 상기 현재 프로토타입과 연관된 다수의 진폭 파라미터와 상기 구성된 위상 벡터를 결합하는 수단 및 상기 현재 프로토타입의 재구성된 버전을 생성하기 위해 상기 결합된 벡터의 역 이산 퓨리에 급수를 계산하는 수단을 더 포함하는 것을 특징으로 하는 음성 코더.
- 제 36 항에 있어서, 상기 음성 코더는 무선 통신 시스템의 가입자 유니트에 부속하는 것을 특징으로 하는 음성 코더.
- 현재 프레임의 현재 프로토타입과 연관된 다수의 회전 순환 값을 생성하는 수단;다수의 주파수 대역에 프레임의 기준 프로토타입의 다수의 위상 파라미터와 연관된 다수의 대역통과 파형을 생성하는 수단; 및상기 다수의 회전 순환 값에 기초하여 상기 다수의 대역통과 파형을 변조시키는 수단을 포함하는 음성 코더.
- 제 45 항에 있어서, 상기 다수의 주파수 대역을 식별하는 수단을 더 포함하는 것을 특징으로 하는 음성 코더.
- 제 45 항에 있어서, 상기 현재 프레임은 음성 프레임인 것을 특징으로 하는 음성 코더.
- 제 45 항에 있어서, 상기 현재 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 음성 코더.
- 제 45 항에 있어서, 상기 다수의 회전 순환 값을 생성하는 수단은 상기 다수의 회전 순환 값을 생성하기 위해 상기 현재 프로토타입과 연관된 다수의 양자화된 위상 파라미터를 비양자화하는 수단을 포함하는 것을 특징으로 하는 음성 코더.
- 제 46 항에 있어서, 다수의 비양자화된 진폭 파라미터를 생성하기 위해 상기 현재 프로토타입과 연관된 다수의 진폭 양자화 파라미터를 비양자화하는 수단을 더 포함하며, 상기 식별 수단은 상기 다수의 비양자화된 진폭 파라미터에 기초하여 대역을 식별하는 수단을 포함하는 것을 특징으로 하는 음성 코더.
- 제 50 항에 있어서, 다수의 대역통과 파형을 생성하는 수단은 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하는 수단, 상기 이산 퓨리에 급수 계수를 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로분해하는 수단, 상기 다수의 비양자화된 진폭 파라미터와 상기 위상 벡터를 결합하는 수단 및 상기 다수의 대역통과 파형을 생성하기 위해 상기 위상 벡터의 역 이산 퓨리에 급수를 계산하는 수단을 포함하는 것을 특징으로 하는 음성 코더.
- 제 45 항에 있어서, 상기 현재 프로토타입의 재구성 버전을 생성하기 위해 상기 다수의 변조된 대역통과 파형을 합산하는 수단을 더 포함하는 것을 특징으로 하는 음성 코더.
- 제 45 항에 있어서, 상기 음성 코더는 무선 통신 시스템의 가입자 유니트에 부속하는 것을 특징으로 하는 음성 코더.
- 상기 음성 코더에 의해 처리되는 현재 프레임으로부터 현재 프로토타입을 추출하도록 구성된 프로토타입 추출기; 및상기 프레임의 프로토타입 추출기에 연결되고 프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하고, 다수의 주파수 대역에서 상기 기준 프로토타입의 위상 파라미터와 상기 현재 프로토타입의 위상 파라미터를 상관시키도록 구성된 프로토타입 양자화기를 포함하는 음성 코더.
- 제 54 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하고, 상기 이산 퓨리에 급수계수를 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하며, 상기 현재 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하며, 상기 이산 퓨리에 급수 계수를 상기 현재 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하도록 구성되는 것을 특징으로 하는 음성 코더.
- 제 54 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 다수의 주파수 대역을 식별하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 54 항에 있어서, 상기 현재 프레임은 음성 프레임인 것을 특징으로 하는 음성 코더.
- 제 54 항에 있어서, 상기 현재 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 음성 코더.
- 제 54 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 현재 프로토타입에 대한 다수의 최적 선형 위상 시프트 값을 생성하도록 구성되는 것을 특징으로 하는 음성 코더.
- 제 54 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 현재 프로토타입에 대한 다수의 최적 회전 순환 값을 생성하도록 부가로 구성되는 것을 특징으로하는 음성 코더.
- 제 59 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 선형 위상 시프트 값을 양자화하고 상기 현재 프로토타입에 대한 다수의 진폭 파라미터를 양자화하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 60 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 회전 순환 값을 양자화하고 상기 현재 프로토타입에 대한 다수의 진폭 파라미터를 양자화하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 54 항에 있어서, 상기 음성 코더는 무선 통신 시스템의 가입자 유니트에 부속하는 것을 특징으로 하는 음성 코더.
- 상기 음성 코더에 의해 처리되는 현재 프레임으로부터 현재 프로토타입을 추출하도록 구성된 프로토타입 추출기; 및상기 프레임의 프로토타입 추출기에 연결되고 프레임의 기준 프로토타입의 다수의 위상 파라미터를 생성하고, 상기 현재 프로토타입과 연관된 다수의 선형 위상 시프트 값을 생성하며 다수의 주파수 대역에 걸쳐 상기 위상 파라미터 및 선형 위상 시프트 값으로부터 위상 벡터를 구성하도록 하는 프로토타입 양자화기.
- 제 64 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하고 상기 이산 퓨리에 급수 계수를 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 64 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 다수의 주파수 대역을 식별하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 64 항에 있어서, 상기 현재 프레임은 음성 프레임인 것을 특징으로 하는 음성 코더.
- 제 64 항에 있어서, 상기 현재 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 음성 코더.
- 제 64 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 다수의 선형 위상 시프트 값을 생성하기 위해 상기 현재 프로토타입과 연관된 다수의 양자화된 위상 파라미터를 비양자화하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 66 항에 있어서, 상기 프레임의 프로토타입 양자화기는 다수의 비양자화된 진폭 파라미터를 생성하기 위해 상기 현재 프로토타입과 연관된 다수의 진폭 양자화 파라미터를 부가로 비양자화하고 상기 다수의 비양자화된 진폭 파라미터에 기초하여 상기 다수 대역을 식별하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 64 항에 있어서, 상기 프레임의 프로토타입 양자화기는 결합된 벡터를 생성하기 위해 현재 프로토타입과 연관된 다수의 진폭 파라미터와 상기 위상 벡터를 결합하고, 상기 현재 프로토타입의 재구성 버전을 생성하기 위해 상기 결합 벡터의 역 이산 퓨리에 급수를 계산하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 64 항에 있어서, 상기 음성 코더는 무선 통신 시스템의 가입자 유니트에 부속하는 것을 특징으로 하는 음성 코더.
- 상기 음성 코더에 의해 처리되는 현재 프레임으로부터 현재 프로토타입을 추출하도록 구성된 프로토타입 추출기; 및상기 프레임의 프로토타입 추출기에 연결되고 상기 현재 프로토타입과 연관된 다수의 회전 순환 값을 생성하고, 다수의 주파수 대역에서 프레임의 기준 프로토타입의 다수의 위상 파라미터와 연관된 다수의 대역통과 파형을 생성하며, 상기 다수의 회전 순환 값에 기초하여 상기 다수의 대역통과 파형을 변조시키도록 구성된 프로토타입 양자화기를 포함하는 음성 코더.
- 제 73 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 다수의 주파수 대역을 식별하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 73 항에 있어서, 상기 현재 프레임은 음성 프레임인 것을 특징으로 하는 음성 코더.
- 제 73 항에 있어서, 상기 현재 프레임은 선형 예측 잔여 부분의 프레임인 것을 특징으로 하는 음성 코더.
- 제 73 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 다수의 회전 순환 값을 생성하도록 상기 현재 프로토타입과 연관된 다수의 양자화된 위상 파라미터를 비양자화하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 74 항에 있어서, 상기 프레임의 프로토타입 양자화기는 다수의 비양자화된 진폭 파라미터를 생성하기 위해 상기 현재 프로토타입과 연관된 다수의 진폭 양자화 파라미터를 비양자화하고, 상기 다수의 비양자화된 진폭 파라미터에 기초하여 주파수 대역을 식별하도록 구성되는 것을 특징으로 하는 음성 코더.
- 제 78 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 프레임의 기준 프로토타입에 대한 이산 퓨리에 급수 계수를 계산하고, 상기 이산 퓨리에 급수 계수를 상기 프레임의 기준 프로토타입에 대한 진폭 벡터 및 위상 벡터로 분해하며, 상기 다수의 비양자화된 진폭 파라미터와 상기 위상 벡터를 결합하며, 상기 다수의 대역통과 파형을 생성하기 위해 상기 위상 벡터의 역 이산 퓨리에 급수를 계산하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 73 항에 있어서, 상기 프레임의 프로토타입 양자화기는 상기 현재 프로토타입의 재구성 버전을 생성하기 위해 상기 다수의 변조된 대역통과 파형을 합산하도록 부가로 구성되는 것을 특징으로 하는 음성 코더.
- 제 73 항에 있어서, 상기 음성 코더는 무선 통신 시스템의 가입자 유니트에 부속하는 것을 특징으로 하는 음성 코더.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/356,491 | 1999-07-19 | ||
US09/356,491 US6397175B1 (en) | 1999-07-19 | 1999-07-19 | Method and apparatus for subsampling phase spectrum information |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077009507A Division KR100752001B1 (ko) | 1999-07-19 | 2000-07-18 | 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020013966A true KR20020013966A (ko) | 2002-02-21 |
KR100754580B1 KR100754580B1 (ko) | 2007-09-05 |
Family
ID=23401657
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077009507A KR100752001B1 (ko) | 1999-07-19 | 2000-07-18 | 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치 |
KR1020027000728A KR100754580B1 (ko) | 1999-07-19 | 2000-07-18 | 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020077009507A KR100752001B1 (ko) | 1999-07-19 | 2000-07-18 | 위상 스펙트럼 정보를 서브샘플링하는 방법 및 장치 |
Country Status (12)
Country | Link |
---|---|
US (3) | US6397175B1 (ko) |
EP (2) | EP1617416B1 (ko) |
JP (2) | JP4860859B2 (ko) |
KR (2) | KR100752001B1 (ko) |
CN (2) | CN1279510C (ko) |
AT (2) | ATE309600T1 (ko) |
AU (1) | AU6221600A (ko) |
BR (1) | BRPI0012537B1 (ko) |
DE (2) | DE60023913T2 (ko) |
ES (2) | ES2256022T3 (ko) |
HK (3) | HK1064196A1 (ko) |
WO (1) | WO2001006492A1 (ko) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE420432T1 (de) * | 2000-04-24 | 2009-01-15 | Qualcomm Inc | Verfahren und vorrichtung zur prädiktiven quantisierung von stimmhaften sprachsignalen |
JP4178319B2 (ja) * | 2002-09-13 | 2008-11-12 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声処理におけるフェーズ・アライメント |
US6789058B2 (en) * | 2002-10-15 | 2004-09-07 | Mindspeed Technologies, Inc. | Complexity resource manager for multi-channel speech processing |
US7376553B2 (en) * | 2003-07-08 | 2008-05-20 | Robert Patel Quinn | Fractal harmonic overtone mapping of speech and musical sounds |
DE602004004950T2 (de) * | 2003-07-09 | 2007-10-31 | Samsung Electronics Co., Ltd., Suwon | Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren |
EP3561810B1 (en) * | 2004-04-05 | 2023-03-29 | Koninklijke Philips N.V. | Method of encoding left and right audio input signals, corresponding encoder, decoder and computer program product |
JP4207902B2 (ja) * | 2005-02-02 | 2009-01-14 | ヤマハ株式会社 | 音声合成装置およびプログラム |
TWI358056B (en) * | 2005-12-02 | 2012-02-11 | Qualcomm Inc | Systems, methods, and apparatus for frequency-doma |
US8346544B2 (en) * | 2006-01-20 | 2013-01-01 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
WO2008045846A1 (en) * | 2006-10-10 | 2008-04-17 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
KR20090122143A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
HUE045991T2 (hu) * | 2013-02-05 | 2020-01-28 | Ericsson Telefon Ab L M | Hangkeret-elvesztés elrejtése |
ES2955962T3 (es) | 2015-09-25 | 2023-12-11 | Voiceage Corp | Método y sistema que utiliza una diferencia de correlación a largo plazo entre los canales izquierdo y derecho para mezcla descendente en el dominio del tiempo de una señal de sonido estéreo en canales primarios y secundarios |
CN107424616B (zh) * | 2017-08-21 | 2020-09-11 | 广东工业大学 | 一种相位谱去除掩模的方法与装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5067158A (en) * | 1985-06-11 | 1991-11-19 | Texas Instruments Incorporated | Linear predictive residual representation via non-iterative spectral reconstruction |
US4901307A (en) | 1986-10-17 | 1990-02-13 | Qualcomm, Inc. | Spread spectrum multiple access communication system using satellite or terrestrial repeaters |
US5023910A (en) * | 1988-04-08 | 1991-06-11 | At&T Bell Laboratories | Vector quantization in a harmonic speech coding arrangement |
EP0422232B1 (en) * | 1989-04-25 | 1996-11-13 | Kabushiki Kaisha Toshiba | Voice encoder |
JPH0332228A (ja) * | 1989-06-29 | 1991-02-12 | Fujitsu Ltd | ゲイン―シェイプ・ベクトル量子化方式 |
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
US5103459B1 (en) | 1990-06-25 | 1999-07-06 | Qualcomm Inc | System and method for generating signal waveforms in a cdma cellular telephone system |
ES2225321T3 (es) | 1991-06-11 | 2005-03-16 | Qualcomm Incorporated | Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos. |
US5884253A (en) | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
JPH0793000A (ja) * | 1993-09-27 | 1995-04-07 | Mitsubishi Electric Corp | 音声符号化装置 |
US5517595A (en) | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
TW271524B (ko) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
JPH08123494A (ja) * | 1994-10-28 | 1996-05-17 | Mitsubishi Electric Corp | 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置 |
US5692098A (en) * | 1995-03-30 | 1997-11-25 | Harris | Real-time Mozer phase recoding using a neural-network for speech compression |
IT1277194B1 (it) | 1995-06-28 | 1997-11-05 | Alcatel Italia | Metodo e relativi apparati di codifica e di decodifica di un segnale vocale campionato |
US5701391A (en) * | 1995-10-31 | 1997-12-23 | Motorola, Inc. | Method and system for compressing a speech signal using envelope modulation |
WO1998005029A1 (en) * | 1996-07-30 | 1998-02-05 | British Telecommunications Public Limited Company | Speech coding |
US5903866A (en) * | 1997-03-10 | 1999-05-11 | Lucent Technologies Inc. | Waveform interpolation speech coding using splines |
JPH11224099A (ja) * | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
EP0987680B1 (en) * | 1998-09-17 | 2008-07-16 | BRITISH TELECOMMUNICATIONS public limited company | Audio signal processing |
US6266644B1 (en) * | 1998-09-26 | 2001-07-24 | Liquid Audio, Inc. | Audio encoding apparatus and methods |
US6754630B2 (en) | 1998-11-13 | 2004-06-22 | Qualcomm, Inc. | Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation |
US6640209B1 (en) * | 1999-02-26 | 2003-10-28 | Qualcomm Incorporated | Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder |
US6449592B1 (en) * | 1999-02-26 | 2002-09-10 | Qualcomm Incorporated | Method and apparatus for tracking the phase of a quasi-periodic signal |
US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
AU4072400A (en) * | 1999-04-05 | 2000-10-23 | Hughes Electronics Corporation | A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system |
-
1999
- 1999-07-19 US US09/356,491 patent/US6397175B1/en not_active Expired - Lifetime
-
2000
- 2000-07-18 EP EP05019543A patent/EP1617416B1/en not_active Expired - Lifetime
- 2000-07-18 KR KR1020077009507A patent/KR100752001B1/ko active IP Right Grant
- 2000-07-18 KR KR1020027000728A patent/KR100754580B1/ko active IP Right Grant
- 2000-07-18 CN CNB008130019A patent/CN1279510C/zh not_active Expired - Lifetime
- 2000-07-18 DE DE60023913T patent/DE60023913T2/de not_active Expired - Lifetime
- 2000-07-18 BR BRPI0012537A patent/BRPI0012537B1/pt active IP Right Grant
- 2000-07-18 EP EP00948764A patent/EP1204968B1/en not_active Expired - Lifetime
- 2000-07-18 AU AU62216/00A patent/AU6221600A/en not_active Abandoned
- 2000-07-18 ES ES00948764T patent/ES2256022T3/es not_active Expired - Lifetime
- 2000-07-18 JP JP2001511667A patent/JP4860859B2/ja not_active Expired - Lifetime
- 2000-07-18 AT AT00948764T patent/ATE309600T1/de not_active IP Right Cessation
- 2000-07-18 CN CNB031458505A patent/CN1290077C/zh not_active Expired - Lifetime
- 2000-07-18 AT AT05019543T patent/ATE379832T1/de not_active IP Right Cessation
- 2000-07-18 DE DE60037286T patent/DE60037286T2/de not_active Expired - Lifetime
- 2000-07-18 ES ES05019543T patent/ES2297578T3/es not_active Expired - Lifetime
- 2000-07-18 WO PCT/US2000/019601 patent/WO2001006492A1/en active IP Right Grant
-
2002
- 2002-02-01 US US10/066,073 patent/US6678649B2/en not_active Expired - Lifetime
- 2002-12-30 HK HK04106760A patent/HK1064196A1/xx unknown
- 2002-12-30 HK HK02109401.2A patent/HK1047816B/zh unknown
-
2003
- 2003-11-05 US US10/702,967 patent/US7085712B2/en not_active Expired - Lifetime
-
2006
- 2006-07-14 HK HK06107927A patent/HK1091583A1/xx not_active IP Right Cessation
-
2007
- 2007-08-17 JP JP2007213061A patent/JP4861271B2/ja not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100804461B1 (ko) | 보이스화된 음성을 예측적으로 양자화하는 방법 및 장치 | |
KR100898323B1 (ko) | 음성 코더용 스펙트럼 크기 양자화 방법 | |
JP4861271B2 (ja) | 位相スペクトル情報をサブサンプリングする方法および装置 | |
KR100805983B1 (ko) | 가변율 음성 코더에서 프레임 소거를 보상하는 방법 | |
KR100754591B1 (ko) | 음성 코더에서 목표 비트율을 유지하는 방법 및 장치 | |
KR20020013962A (ko) | 프레임 소거 상태에서 예측 음성 코더의 성능을 개선하기위하여 디코더로부터 인코더로 피드백을 제공하는 방법 및장치 | |
JP4511094B2 (ja) | 音声コーダにおける線スペクトル情報量子化方法を交錯するための方法および装置 | |
KR100756570B1 (ko) | 음성 코더의 프레임 프로토타입들 사이의 선형 위상시프트들을 계산하기 위해 주파수 대역들을 식별하는 방법및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
A107 | Divisional application of patent | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
G170 | Re-publication after modification of scope of protection [patent] | ||
FPAY | Annual fee payment |
Payment date: 20120727 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130729 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140730 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20160629 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20170629 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180628 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20190624 Year of fee payment: 13 |