TR201908598T4 - Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. - Google Patents
Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. Download PDFInfo
- Publication number
- TR201908598T4 TR201908598T4 TR2019/08598T TR201908598T TR201908598T4 TR 201908598 T4 TR201908598 T4 TR 201908598T4 TR 2019/08598 T TR2019/08598 T TR 2019/08598T TR 201908598 T TR201908598 T TR 201908598T TR 201908598 T4 TR201908598 T4 TR 201908598T4
- Authority
- TR
- Turkey
- Prior art keywords
- coding
- window
- frame
- data
- analysis
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000005236 sound signal Effects 0.000 title claims abstract description 30
- 230000003595 spectral effect Effects 0.000 claims abstract description 42
- 238000012545 processing Methods 0.000 claims abstract description 16
- 238000004458 analytical method Methods 0.000 claims description 157
- 238000006243 chemical reaction Methods 0.000 claims description 36
- 230000009466 transformation Effects 0.000 claims description 36
- 230000007704 transition Effects 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 9
- 230000002123 temporal effect Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 34
- 230000015572 biosynthetic process Effects 0.000 description 41
- 238000003786 synthesis reaction Methods 0.000 description 41
- 238000004364 calculation method Methods 0.000 description 14
- 238000013139 quantization Methods 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 7
- 230000003044 adaptive effect Effects 0.000 description 6
- 239000010410 layer Substances 0.000 description 6
- 230000000638 stimulation Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000013508 migration Methods 0.000 description 4
- 230000005012 migration Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000012792 core layer Substances 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 101000775670 Lycodes polaris Ice-structuring protein LP Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- NEHMKBQYUWJMIP-UHFFFAOYSA-N chloromethane Chemical compound ClC NEHMKBQYUWJMIP-UHFFFAOYSA-N 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Algebra (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
Abstract
Mevcut buluş, dekode edilmiş bir ses sinyalinin (100) işlenmesi için bir cihaz olup, filtrelenmiş bir ses sinyali (104) elde etmek için dekode edilmiş ses sinyalini filtrelemek üzere bir filtre (102), dekode edilmiş ses sinyalinin ve filtrelenmiş ses sinyalinin, her bir spektral gösterimin birden çok sayıda alt bant sinyallerine sahip olduğu ilgili spektral gösterimlere dönüştürülmesi için bir zaman-spektral dönüştürücü aşaması (106), ağırlıklandırılmış ve filtrelenmiş bir ses sinyali elde etmek için alt bant sinyallerini ilgili ağırlıklandırma katsayıları ile çarpmak suretiyle filtrelenmiş ses sinyalinin frekans seçmeli ağırlıklandırma işlemini gerçekleştirmek üzere bir ağırlıklandırıcı (108), ağırlıklandırılmış ve filtrelenmiş ses sinyali ve dekode edilmiş ses sinyalinin spektral gösterimi arasında bir alt bantsal çıkarma işlemi gerçekleştirmek üzere bir çıkarıcı (112), işlenmiş ve dekode edilmiş bir ses sinyali (116) elde etmek için neticede elde edilen ses sinyali veya neticede elde edilen ses sinyalinden türetilen bir sinyali zaman bölgesi gösterimine dönüştürmek üzere bir spektral-zaman dönüştürücüsü (114) içermektedir.
Description
TARIFNAME
BIR SES SINYALININ HIZALI BIR ILERIYE DÖNÜK KISIMDAN
EAYDALANILARAK ENKODE EDILMESI IÇIN CIHAZ VE YÖNTEM
Mevcut bulus, ses kodlamasina iliskin olup, özellikle de düsük
gecikmeli uygulamalar için kullanima uygun olan anahtarlamali
ses enkoderlerine dayanan ses kodlamasina ve buna bagli olarak
kontrol edilen ses dekoderlerine iliskindir.
Anahtarlamali kodeklere dayanan pek çok ses kodlamasi konsepti
bilinmektedir. Bunlar arasinda yaygin olarak bilinen ses
03)'de de açiklandigi üzere, Genisletilmis Uyarlamali Çoklu
Hiz Genisbant (AMR-WB+) kodegi olarak bilinen konsepttir. Söz
konusu AMR-WB+ ses kodegi, 1'den 9'a kadar olan tüm AMR-WB
konusma kodegi modlarinin yani sira, AMR-WB, VAD ve DTX'i
içermektedir. AMR-WB+, AMR-WB kodegini, TCX, bant genisligi
uzantisi ve stereo'yu eklemek suretiyle genisletmektedir.
Söz konusu olan AMR-WB+ ses kodegi, iç örnekleme frekansi FS
dahilinde olan, 2048 örnege esit giris çerçevelerini
araliginda sinirlandirilmaktadir. 2048 örnekli çerçeveler,
dönüsül olarak örneklenmis iki esit frekans bandina
bölünmektedir. Bu durum, düsük frekans (LF) ve yüksek frekans
(HF) bantlarina karsilik gelen iki adet 1024 örneklik üstün
çerçeve meydana getirmektedir. Her bir üstün çerçeve, dört
adet 256 örneklik çerçeveye bölünmektedir. Iç örnekleme
hizindaki örnekleme, giris sinyalini yeniden örnekleyen,
degisken bir örnekleme dönüstürme düzeni kullanilarak elde
edilmektedir.
Bunun akabinde, düsük frekans (LF) ve yüksek frekans (HF)
sinyalleri iki farkli yaklasimdan faydalanilarak enkode
edilmektedir; düsük frekans (LF) anahtarlanmis ACELP ve
dönüsüm kodlamasi uyarimina (TCX) dayali olan "çekirdek"
enkoder/dekoder kullanilarak enkode ve dekode edilmektedir.
ACELP modunda, standart AMR-WB kodegi kullanilmaktadir. Yüksek
frekans (HF) sinyali, göreceli olarak. çok daha. az bit (16
bit/çerçeve) ile bir bant genisligi uzatma (BWE) yöntemi
kullanilarak enkode edilmektedir. Enkoderden dekodere iletilen
parametreler; mod seçim bitleri, düsük frekans (LF)
parametreleri ve yüksek frekans (HF) parametreleridir. 1024
örneklik her bir üstün çerçeve için olan parametreler,
birbirine özdes boyuta sahip olan dört paket hâlinde olacak
sekilde ayristirilmaktadir. Giris sinyalinin stereo oldugu
durumlarda, stereo enkode etme islemi, her iki giris kanalini
da alirken, sol ve sag kanallar ACELP/TCX enkode etme islemi
için tek bir mono sinyalde birlestirilmektedir. Dekoder
tarafinda, düsük frekans (LF) ve yüksek frekans (HF) bantlari
birbirinden ayri olarak dekode edilmekte ve bunun ardindan bir
sentez filtre bankasi dahilinde birlestirilmektedir. Sayet
çikis sadece mono olacak sekilde kisitlanmakta ise bu durumda
stereo parametreleri çikartilmakta ve dekoder mono modunda
çalismaktadir. AMR-WB+ kodegi, düsük frekans (LF) sinyalini
enkode ederken, ACELP ve TCX modlarindan her ikisi için de LP
analizi uygulamaktadir. Lineer tahmin (LP) katsayilari, her 64
örneklik alt çerçeve de lineer olarak ara degerlenmektedir. LP
analizi penceresi, 384 örneklik uzunlugun bir yarim
kosinüsüdür. Çekirdek mono sinyalin enkode edilmesi için her
bir çerçevede bir ACELP veya TCX kodlamasi kullanilmaktadir.
Kodlama modu, bir kapali döngü sentez yoluyla analiz yöntemine
dayali olarak seçilmektedir. ACELP çerçeveleri için sadece 256
örneklik çerçeveler ise TCX modunda mümkün olmaktadir. AMR-WB+
dahilinde LPC analizi için kullanilan pencere, sekil Sb'de
gösterilmektedir. 20 ms'lik ileriye dönüklügü. olan simetrik
bir LPC analiz penceresinden faydalanilmaktadir. Burada söz
konusu olan ileriye dönüklük hususu, sekil 5b'de de
gösterildigi üzere, 500 ile gösterilen mevcut çerçeve için
olan LPC analizi penceresinin, yalnizca sekil 5b üzerinde 502
ile gösterilen, 0 ve 20 ms'lik araliktaki mevcut çerçeve
dahilinde degil, gelecek çerçeve içerisinde 20 ve 40 Hß'lik
süreler arasinda da uzanmakta oldugu anlamina gelmektedir.
Bunun anlami, söz konusu olan bu LPC analiz penceresinden
faydalanilmasi suretiyle, 20 ms'lik ilave bir gecikme, diger
bir deyisle, gelecek bir çerçevenin tamami gerekli hâle
gelmektedir. Dolayisiyla, sekil 5b üzerinde 504 ile gösterilen
ileriye dönük kisim, AMR-WB+ enkoderi ile iliskilendirilen
sistematik gecikmeye katkida bulunmaktadir. Bir baska deyisle,
mevcut çerçeveye 502 iliskin LPC analiz katsayilarinin
hesaplanabilmesi için ilerideki bir çerçevenin tamamen
kullanilabilir olmasi gerekmektedir.
Sekil 5a'da diger bir enkoder, AMR-WB olarak adlandirilan
kodlayici ve özellikle de mevcut çerçeveye iliskin analiz
katsayilarinin hesaplanmasi için kullanilan LPC analiz
penceresi gösterilmektedir. Bir kez daha mevcut çerçeve, 0 ve
ms arasinda uzamakta ve gelecek çerçeve ise 20 ve 40
ms'lik süreç araliginda uzamaktadir. Sekil 5b'nin aksine, 506
ile gösterilen AMR-WB'ye ait LPC analiz penceresi, yalnizca 5
ms'lik ileriye dönük bir kisma 508, diger bir deyisle, 20 ms
ve 25 ms araliginda bir zaman mesafesine sahiptir.
Dolayisiyla, LPC analizinin neden oldugu gecikme, sekil 5a'ya
iliskin olarak önemli ölçüde azaltilmaktadir. Bununla
birlikte, öte yandan, LPC katsayilarinin belirlenmesi için
olan daha büyük bir ileriye dönük kismin, bir baska deyisle,
daha büyük bir ileriye dönük kismin, LPC analiz penceresi
için daha iyi LPC katsayilarini ve buna bagli olarak, artik
sinyalde daha küçük bir enerjiyi ve dolayisiyla, daha düsük
bir bit hizini ortaya çikardigi bulunmustur.
Sekiller 5a ve 5b bir çerçeve için LPC katsayilarinin
belirlenmesi hususunda yalnizca tek bir analiz penceresine
sahip olan enkoderlere iliskin iken, Sekil 5c ise G.718
konusma kodlayicisi için olan durumu göstermektedir. G.7l8
(06-2008) spesifikasyonu, iletim sistemlerine, medya dijital
sistemlerine ve aglarina iliskin olup, özellikle de dijital
terminal ekipmanlarini. ve bilhassa, bu türden bir ekipman
için konusma ve ses sinyalllerinin bir kodlamasini
açiklamaktadir. Bu standart özellikle, ITU-T G7l8 tavsiye
kararinda tanimlandigi üzere, 8 ila 32 kbit/s dahilinde
konusma. ve sesin dayanikli dar bant ve genis bant gömülü
degisken bit hizi kodlamasina iliskindir. Giris sinyali, 20
ms'lik çerçevelerden faydalanilmasi suretiyle islenmektedir.
Kodek gecikmesi, giris ve çikisa ait olan örnekleme hizina
baglidir. Bir genis bant girisi ve bir genis bant çikisi için
söz konusu olan bu kodlamanin genel algoritmik gecikmesi
42.875 ms'dir. Yüksek katmanli dönüsüm kodlamasina ait
örtüsme eklemeli islemin gerçeklestirilmesine olanak saglamak
için bir 20 ms'lik çerçeve, 1.875 ms'lik giris ve çikis
yeniden örnekleme filtreleri, enkoder için 10 ms'lik ileriye
dönüklük, bir ms'lik art filtreleme gecikmesi ve dekoderde lO
ms'lik gecikmeden meydana gelmektedir. Bir dar bant girisi ve
bir dar bant çikisi için daha yüksek katmanlar
kullanilmamaktadir, ancak bununla birlikte, müzik sinyalleri
için ve çerçeve silintilerinin mevcudiyetinde kodlama
performansinin gelistirilebilmesi için 10 ms'lik dekoder
gecikmesinden faydalanilmaktadir. Sayet çikis, katman 2'ye
sinirlandirilmakta ise C) hâlde kodek gecikmesi lO Ins kadar
azaltilabilmektedir. Enkodere iliskin açiklama asagida
belirtildigi gibidir. Daha altta olan iki katman, 12.8 kHz'te
örneklenmis ön vurgulanan bir sinyale uygulanmaktadir ve daha
üstteki üç katman ise 16 kHz'te örneklenen giris sinyali
bölgesi dahilinde çalismaktadir. Çekirdek katman, kod
uyarimli lineer tahmin (CELP) teknolojisine dayanmakta olup,
söz konusu olan bu teknolojide sinyal, spektral zarfi
izafeten bir lineer tahmin (LP) sentez filtresinden geçirilen
bir uyarim sinyali vasitasiyla modellenmektedir. LP filtresi,
anahtarlanan bir tahminsel yaklasini ve çok asamali vektör
kuantizasyonundan faydalanilarak, emitans spektral frekansi
(ISF) bölgesinde kuantize edilmektedir. Açik döngü perde
analizi, pürüzsüz bir perde konturunun elde edilebilmesi için
perde izleyen bir algoritma kullanilarak
gerçeklestirilmektedir. Kesisim hâlinde olan iki perde
gelisim konturu karsilastirilmakta ve perde tahmininin daha
dayanikli hâle getirilebilmesi için daha düzgün kontur
meydana getiren iz seçilmektedir. Çerçeve seviyesi ön
islemesi; bir yüksek geçirim filtrelemesi, saniye basina
12800 örnek için bir örnekleme dönüstürme, bir ön vurgulama,
bir spektral analiz, dar bant girislerinin bir tespiti, bir
ses aktiflik tespiti, bir gürültü tahmini, gürültü azaltma
islemi, lineer tahmin analizi, LP'den ISF'e dönüstürme islemi
ve bir ara degerleme, agirliklandirilmis bir konusma
sinyalinin bir hesaplamasi, bir açik döngü perde analizi, bir
arka plan gürültü güncellemesi, bir kodlama modunun seçilmesi
için bir sinyal siniflandirmasi ve çerçeve silinti gizlemesi
islemlerini içermektedir. Seçilen enkode etme tipinden
faydalanan katman l enkode etme islemi ise ünsüz bir kodlama
modu, sesli bir kodlama modu, bir geçis kodlama modu, bir
genel kodlama modu ve bir süreksiz iletim ve sessizlik
giderici ton üretimi (DTX/CNG) içermektedir.
Oto-korelasyon yaklasimindan faydalanan uzun süreli bir tahmin
veya lineer tahmin (LP) analizi, CELP modeline ait sentez
filtresinin katsayilarini belirlemektedir. Bununla birlikte,
CELP'de, uzun süreli tahmin genellikle "uyarlamali kod
çizelgesi" oldugundan, lineer tahminden de farkli olmaktadir.
Dolayisiyla lineer tahmin, daha ziyade kisa süreli bir tahmin
olarak. düsünülebilmektedir. Pencerelenmis konusmaya ait oto
korelasyon, Levinson-Durbin algoritmasindan faydalanilmasi
suretiyle LP katsayilarina dönüstürülmektedir. Bunun ardindan
LPC katsayilari, emitans spektral çiftlerine (ISP)
dönüstürülmekte olup, nihayetinde kuantizasyon ve ara
degerleme amaçlari için emitans spektral frekanslarina (ISF)
dönüstürülmektedir. Ara degerlenmis, kuantize edilmis ve
kuantizasyonu geri alinmis katsayilari ise her bir alt çerçeve
için sentez ve agirliklandirma filtrelerini yapilandirmak
üzere LP bölgesine geri dönüstürülmektedir. Aktif bir sinyal
çerçevesinin enkode edilmesi durumunda ise iki set LP
katsayisi, Sekil 5c üzerinde 510 ve 512 ile gösterilen iki LPC
analiz penceresinden faydalanilarak her bir çerçevede
hesaplanmaktadir. Pencere 512, "orta çerçeve LPC penceresi"
olarak ve pencere 510 ise "son çerçeve LPC penceresi" olarak
adlandirilmaktadir. 10 ms'lik bir ileriye dönük kisim 514,
çerçeve sonu oto-korelasyon hesaplamasi için kullanilmaktadir.
Çerçeve yapisi, Sekil 5c üzerinde gösterilmektedir. Çerçeve,
dört alt çerçeveye bölünmekte olup, söz konusu olan her bir
alt çerçeve, 12.8 kHz'lik bir örnekleme hizinda 64 örnege
karsilik gelen 5 ms'lik bir uzunluga sahiptir. Çerçeve sonu
analizi ve orta çerçeve analizi için olan pencereler, Sekil
5c'de de gösterildigi üzere sirasiyla dördüncü alt çerçevede
ve ikinci alt çerçevede merkezlenmektedir. 320 örneklik
uzunluga sahip bir Hamming penceresi, pencereleme islemi için
kullanilmaktadir. Katsayilar, G.7l8 Bölüm 6.4.l'de
tanimlanmaktadir. Oto-korelasyon hesaplamasi ise Bölüm
6.4.2'de açiklanmaktadir. Levinson-Durbin› algoritmasi, Bölüm
6.4.3'te, LP-ISP dönüstürmesi, Bölüm 6.4.4'te ve ISP-LP
dönüstürmesi ise Bölüm 6.4.5'te açiklanmaktadir.
Uyarlamali kod çizelgesi gecikme ve kazanimi, cebirsel kod
çizelgesi endeksi ve kazanimi gibi konusma enkode etme
parametreleri, algisal olarak agirliklandirilmis bölgedeki
giris sinyali ve sentezlenmis sinyal arasindaki hatanin en
aza indirgenmesi suretiyle arastirilmaktadir. Algisal olarak
agirliklandirma islemi, sinyalin, LP filtresi katsayilarindan
türetilen algisal bir agirliklandirma filtresi yordamiyla
filtrelenmesi islemi yapilarak gerçeklestirilmektedir.
Algisal olarak agirliklandirilmis sinyal ayrica, açik döngü
perde analizinde de kullanilmaktadir.
G.718 enkoderi, yalnizca tekil konusma kodlama moduna sahip
olan ari bir konusma kodlayicisidir. Bu nedenle G.7l8
enkoderi anahtarlanan bir enkoder degildir` ve dolayisiyla,
söz konusu olan bu enkoder çekirdek katman dahilinde yalnizca
tekil bir konusma kodlamasi modu sagladigi için avantajli
olmamaktadir. Bu nedenle söz konusu olan bu kodlayicinin
konusma sinyallerinden ziyade diger sinyallere uygulandigi
durumlarda, diger bir deyisle, CELP enkode etme isleminin
arkasinda bulunan modelin uygun olmadigi genel ses
sinyallerine uygulandigi durumlarda kalite ilgili sorunlara
meydana gelecektir.
Bir diger anahtarlamali kodek, USAC kodegi olarak
adlandirilan kodektir, bir baska deyisle, 24 Eylül 2010
tarihli ISO/IEC CD 23003-3'te tanimlanan birlestirilmis
konusma ve ses kodegidir. Söz konusu olan bu anahtarlamali
kodek için kullanilan LPC analiz penceresi Sekil 5d üzerinde
5l6 ile gösterilmektedir. Yine, 0 ila 20 ms araliginda
genisleyen mevcut bir çerçeve varsayilmakta olup, bu nedenle
bu kodege ait olan ileriye dönük kisini 618, 20 ms olarak
görülmektedir, bir baska deyisle, G.7l8'de yer alan ileriye
dönük kisimdan çok daha yüksektir. Dolayisiyla, her ne kadar
USAC enkoderi, anahtarlamali dogasi sayesinde iyi ses
kalitesi sagliyor olsa da Sekil 5d üzerinde gösterilen LPC
analiz penceresinin ileriye dönük kismi 518 nedeniyle önemli
oranda gecikme ortaya koymaktadir. USAC'ye ait olan genel
yapi asagida belirtildigi gibidir. Öncelikle, stereo veya çok
kanalli islemenin idare edilebilmesi için bir MPEG surround
(MPEGS) islevsel biriminden meydana gelen ortak bir ön/ard
isleme ve giris sinyali dahilinde daha yüksek ses frekansinin
parametrik gösterimini idare eden gelistirilmis bir SBR
(eSBR) birimi bulunmaktadir. Bunun ardindan, birinin
degistirilmis ileri düzeyde bir ses kodlamasi (AAC) takim
yolundan ve digerinin ise lineer tahmin kodlamasi (LP veya
LPC bölgesi) tabanli bir yoldan meydana geldigi ve
karsiliginda LPC artigina ait bir frekans bölgesi gösterimi
veya bir zaman bölgesi gösterimi özelligine sahip oldugu iki
kol gelmektedir. AAC ve LPC'den her ikisi için de iletilen
tüm spektrumlar, kuantizasyon ve aritmetik kodlama
islemlerinin ardindan MDCT bölgesinde gösterilmektedir. Zaman
bölgesi gösterimi, bir ACELP uyarim kodlama düzeninden
faydalanmaktadir. ACELP araci, uzun süreli bir tahminci
(uyarlamali kod sözcügü) ile bir darbe benzeri diziyi
(yenilik kod sözcügü) birlestirmek suretiyle bir zaman
bölgesi uyarim sinyalini etkin bir sekilde göstermek üzere
bir yol saglamaktadir. Yeniden yapilandirilan uyarim, bir
zaman bölgesi sinyalinin olusturulabilmesi için bir LP sentez
filtresi kanali ile gönderilmektedir. ACELP aracina yapilan
giris, uyarlamali ve yenilik kod çizelgesi endekslerini,
uyarlamali ve yenilik kodlarina ait kazanim degerlerini,
diger kontrol verilerini ve ters kuantize edilen ve ara
degerlenen LPC filtresi katsayilarini içermektedir. ACELP
aracindan alinan çikis ise zaman bölgesinde yeniden
yapilandirilan ses sinyali olmaktadir.
MDCT tabanli TCX dekode etme araci, agirliklandirilmis LP
artik gösterimini, MDCT bölgesinden, bir zaman bölgesi
sinyaline döndürmek için kullanilmakta olup,
agirliklandirilmis LP sentez filtrelemesini de içeren
agirliklandirilmis zaman bölgesi sinyalini çiktilamaktadir.
destekleyecek biçimde konfigüre edilebilmektedir. TCX aracina
yapilan giris, (ters kuantize edilen) MDCT spektrumlarini ve
ters kuantize edilen ve ara degerlenen LPC filtre
katsayilarini içermektedir. TCX aracindan alinan çikis ise
zaman bölgesinde yeniden yapilandirilan ses sinyali
olmaktadir.
Sekil 6, USAC'de mevcut olan bir durumu göstermekte olup, söz
konusu olan durumda mevcut çerçeve ve 520 için olan LPC analiz
pencereleri 516, geçmis veya son çerçeve için çizilmekte ve
ilaveten TCX penceresi 522 gösterilmektedir. TCX penceresi
522, 0 ve 20 ms'ler arasinda genisleyen mevcut çerçevenin
merkezinde ortalanmakta olup, geçmis çerçeve içerisine 10
ms'lik bir süre ile genislemekte 've 20 ila 40 Ins arasinda
genisleyen gelecek çerçeve içerisine ise 10 ms'lik bir süre
ile genislemektedir. Dolayisiyla, TCX analiz penceresi
ilaveten 20 ve 30 nß'ler arasinda gelecek çerçeve içerisine
genisleyen ileriye dönük bir kisma sahip iken, LPC analiz
penceresi 516, 20 ve 40 ms'ler arasinda, diger bir deyisle 20
ms, ileriye dönük bir LPC kismi gerektirmektedir. Bunun
anlami, USAC analiz penceresinin 516 neden oldugu gecikme 20
ms iken, TCX penceresinin enkoderde neden oldugu gecikmenin
ise 10 ms oldugudur. Dolayisiyla, her iki türde de olan
pencerelere ait ileriye dönük kismin birbirine hizali olmadigi
netlik kazanmaktadir. Bu nedenle, her ne kadar TCX penceresi
522, 10 ms'lik bir gecikmeye neden oluyor olsa dahi enkodere
ait gecikmenin tamami, LPC analiz penceresi 516 nedeniyle 20
ms olmaktadir. Dolayisiyla, her ne kadar TCX penceresi için
oldukça küçük bir ileriye dönük kisim mevcut olsa da bu durum
enkodere ait algoritmik gecikmeyi azaltmamaktadir, zira toplam
gecikme en yüksek katki tarafindan belirlenmektedir, diger bir
deyisle, gelecek çerçeve içerisine 20 ms'lik bir süre ile
genisleyen LPC analiz penceresi 516 nedeniyle 20 Hß'ye esit
olmaktadir, bir baska deyisle, yalnizca mevcut çerçeveyi degil
ayni zamanda ilaveten gelecek çerçeveyi de kapsamaktadir.
B. Besette ve Meslektaslari tarafindan hazirlanan "Universal
Speech/Audio Coding using Hybrid ACELP/TCX Techniques" (ICASSP
sayfalarinda, bir LP tabanli kodlama teknigini ve daha genel
bir dönüsüm kodlamasi teknigini entegre eden hibrit bir ses
kodlamasi algoritmasindan bahsedilmektedir. ACELP ve TCX
modlari, her ikisinin de LP analizine ve uyarim kodlamasina
dayali olacagi bir biçimde entegre edilmektedir. ACELP'de
uyarim, uyarim bölgesinde aralikli bir kod çizelgesinden
faydalanilarak enkode edilmektedir, bununla birlikte TCX'te
ise kod Çizelgesi hedef dahilinde veya agirliklandirilmis
sinyalde ya da bölgede bulunmaktadir. LP analizi, bir sonraki
çerçeve dahilinde bulunan birinci 5 ms'lik alt çerçevenin
ortasinda pozisyonlandirilmis yarim sinüs bir pencereden
faydalanilarak her 20 ms'de bir gerçeklestirilmektedir. 80
ms'lik TCX çerçevesine ait olan bir sonraki çerçeve
içerisindeki bir ileriye dönük kisma karsilik gelen pencereye
ait sag kisim içerisindeki bir örtüsme süresinin, AMR-WB'deki
12.8 kHz'lik bir iç örnekleme hizindan ötürü 10 ms'lik süreye
karsilik gelen 128 örnege esit oldugu 20 ms'lik bir TCX
çerçevesi, 40 ms'lik bir TCX çerçevesi veya 80 ms'lik. bir
uzunluga sahip olan bir TCX çerçevesi mümkün olmaktadir.
Dolayisiyla mevcut bulusun bir amaci, ses kodlamasi veya
dekode edilmesi için bir taraftan iyi ses kalitesi saglayan ve
diger taraftan ise azaltilmis gecikme sonucu veren
gelistirilmis bir kodlama konsepti saglamaktir.
Söz konusu olan bu amaca, Istem l'e göre bir ses sinyalinin
enkode edilmesi için olan bir cihaz, Istem 15'e göre bir ses
sinyalinin enkode edilmesi için bir yöntem veya Istem l6'ya
göre bir bilgisayar programi vasitasiyla ulasilmaktadir.
Mevcut bulusa göre, bir dönüsüm kodlamasi koluna ve bir
tahmin kodlamasi koluna sahip olan anahtarlamali bir ses
kodegi düzeni uygulanmaktadir. Önemli bir biçimde, iki türden
pencere, diger bir deyisle, bir tarafta tahmin kodlamasi
analiz penceresi ve diger tarafta ise dönüsüm kodlamasi
analiz penceresi dönüsüm kodlamasina ait ileriye dönük kismin
ve tahmin kodlamasina ait ileriye dönük kismin birbirlerine
özdes veya tahmin kodlamasina ait ileriye dönük kismin
kismin %ZO'sinden daha az olacak sekilde birbirlerinden
farkli olabilmeleri için ileriye dönük kisimlarina iliskin
olarak hizalanmaktadir. Tahmin analizi penceresinin yalnizca
tahmin kodlamasi kolunda degil, her iki kolda da
kullanildiginin unutulmamasi gerekmektedir. LPC analizi ayni
zamanda, dönüsüm bölgesindeki gürültünün biçimlendirilmesi
için de kullanilmaktadir. Dolayisiyla, bir baska sekilde
ifade etmek gerekirse, ileriye dönük kisimlari birbirine
özdes veya birbirlerine oldukça yakin olmaktadir. Bu durum,
ödünlesmenin optimal oranda elde edilmesini ve ses
kalitesinin veya gecikme özelliklerinin optimalden asagi bir
durumda belirlenmemesini saglamaktadir. Dolayisiyla, analiz
penceresindeki tahmin kodlamasi için ileriye dönüslülügün
daha yüksek oldugu durumlarda LPC analizinin daha iyi oldugu
ancak öte yandan, ileriye dönük kismin daha yüksek oldugu bir
durumda gecikmenin de arttigi fark edilmistir. Öte yandan,
ayni durum. TCX penceresi için de geçerli olmaktadir. TCX
penceresine ait ileriye dönük kismin daha yüksek oldugu
durumlarda, TCX bit hizi da daha iyi bir sekilde
azaltilabilmektedir, zira daha uzun olan TCX pencereleri
genel olarak daha düsük bit hizlarini ortaya çikarmaktadir.
Bu nedenle, mevcut bulusun aksine, ileriye dönük kisimlar
birbiriyle özdes veya birbirlerine çok yakin olmakta ve
özellikle
Dolayisiyla, her ne kadar gecikme nedenlerinden ötürü
istenmeyen bir durum olsa da ileriye dönük kisim
enkode/dekode etme kollarinin her ikisi tarafindan da optimal
olarak kullanilabilmektedir.
Bu durum göz önünde bulunduruldugunda, mevcut bulus
gelistirilmis bir kodlama konsepti ve bununla birlikte, her
iki analiz penceresi için de ileriye dönük kisim düsük olarak
belirlendiginde düsük gecikme saglamaktadir, öte yandan, ses
kalitesi nedenlerinden veya bit hizi nedenlerinden ötürü
meydana getirilmesi zaruri olan gecikmenin her iki sekilde de
yalnizca tek bir kodlama kolu tarafindan degil, her iki
kodlama kolu tarafindan da optimal olarak kullanildigi
gerçeginden ötürü iyi niteliklere sahip bir enkode/dekode
etme konsepti saglamaktadir.
Ses örneklerinden meydana gelen bir akisa sahip bir ses
sinyaline enkode etmek için bir cihaz olup, bir tahmin
analizine iliskin pencerelenmis veri elde etmek için ses
örneklerinden meydana gelen bir akisa bir tahmin kodlamasi
analizi uygulamak ve bir dönüsüm analizine iliskin
pencerelenmis veri elde etmek için ses örneklerinden meydana
gelen akisa bir dönüsüm kodlamasi analiz penceresi uygulamak
üzere bir pencereleyici içermektedir. Dönüsüm kodlamasi
analiz penceresi, bir dönüsüm kodlamasi ileriye dönük kismi
olan ses örneklerinin bir gelecek çerçevesine ait ön tanimli
bir ileriye dönük kisminin ses örneklerinin mevcut bir
çerçevesine ait olan ses örnekleri ile
iliskilendirilmektedir.
Ayrica, tahmin kodlamasi analiz penceresi ise mevcut çerçeveye
ait ses örneklerinin en az bir kismi ile ve bir tahmin
kodlamasi ileriye dönük kismi olan gelecek çerçevenin ön
tanimli bir kismina ait ses örnekleri ile
iliskilendirilmektedir.
Dönüsüm kodlamasi ileriye dönük kismi ve tahmin kodlamasi
ileriye dönük kismi birbiriyle özdes veya birbirlerinden
tahmin kodlamasi ileriye dönük kisminin %20'sinden daha az
olacak sekilde veya dönüsüm kodlamasi ileriye dönük kisminin
birbirlerine oldukça yakindirlar. Söz konusu cihaz ilaveten,
tahmin analizi için pencerelenmis veriden faydalanmak
suretiyle mevcut çerçeve için tahmin kodlanmis verisi üretmek
için veya dönüsüm analizi için pencere verisinden faydalanmak
suretiyle mevcut çerçeve için dönüsüm kodlanmis veri üretmek
için bir enkode etme islemcisi içermektedir.
Enkode edilmis bir ses sinyalinin dekode edilmesi için bir ses
dekoderi olup, enkode edilmis ses sinyalinden bir tahmin
kodlanmis çerçeve için bir veri dekode etme islemi
gerçeklestirmek üzere bir tahmin parametresi dekoderi ve
ikinci kol için ise enkode edilmis ses sinyalinden bir dönüsüm
kodlanmis çerçeve için bir veri dekode etme islemi
gerçeklestirmek üzere bir dönüsüm parametresi dekoderi
içermektedir.
Dönüsüm parametresi dekoderi, bir MDCT veya MDST veya herhangi
baska bir dönüsüm gibi tercihen bir örtüsmeden etkilenen bir
spektral-zaman dönüsümü gerçeklestirmek ve mevcut çerçeve ve
gelecek çerçeve için bir veri elde etmek için dönüstürülmüs
veriye bir sentez penceresi uygulamak üzere konfigüre
edilmektedir. Ses dekoderi tarafindan uygulanan sentez
penceresi, bir birinci örtüsme kismina, ikinci bir bitisik
örtüsmesiz kisma ve üçüncü bir bitisik örtüsme kismina sahip
olacak sekilde uygulanmakta olup, burada üçüncü örtüsme kismi
gelecek çerçeve için ses örnekleriyle iliskilendirilmekte ve
örtüsmesiz kisim ise mevcut çerçeveye ait veri ile
iliskilendirilmektedir. Ilaveten, dekoder tarafinda iyi ses
kalitesi elde edebilmek için gelecek çerçeve için ses
örneklerine ait bir birinci kismi elde etmek üzere, örtüsme ve
mevcut çerçeve için bir sentez penceresine ait üçüncü örtüsme
kismi ile iliskilendirilen sentez pencerelenmis örneklerin ve
gelecek çerçeve için bir sentez penceresine ait birinci
örtüsme kismi ile iliskilendirilen sentez pencerelenmis
örneklerin. örtüsmesi ve eklenmesi için bir örtüsme-ekleyici
uygulanmakta olup, burada gelecek çerçeve için ses
örneklerinin geri kalani, mevcut çerçeve ve gelecek çerçevenin
dönüsüm kodlanmis veri içerdigi durumlarda, örtüsme eklenmeden
elde edilen gelecek çerçeve için sentez penceresine ait ikinci
örtüsmesiz kisim ile iliskilendirilen sentez pencerelenmis
örneklerdir.
Mevcut bulusun tercih edilen düzenlemeleri her iki kodlama
modunun da gecikme kisitlamalari altinda mevcut olan maksimum
ileriye dönüklüge sahip olabilmesi için TCX kolu gibi dönüsüm
kodlamasi kolu ve ACELP kolu gibi tahmin kodlamasi kolu için
olan ayni ileriye dönüklügün birbirine özdes olmasi özelligine
sahiptir. Ayrica, dönüsüm kodlamasi modundan tahmin kodlamasi
moduna, bir çerçeveden bir sonraki çerçeveye, bir
anahtarlamanin herhangi bir örtüsme adresleme sorunu olmadan
kolaylikla gerçeklestirilebilmesi için TCX penceresi
örtüsmesinin ileriye dönük kisim ile sinirlandirilmasi tercih
edilmektedir.
Örtüsmenin ileriye dönüklük ile sinirlandirilmasinin bir baska
nedeni ise dekoder tarafinda herhangi bir gecikme meydana
getirmemektir. Sayet, lO ms'lik ileri dönüklüge sahip bir TCX
penceresi mevcut ise ve örnegin, 20 ms'lik örtüsme gibi, o
hâlde dekoder tarafinda lO ms'den daha fazla gecikme meydana
getirilmesi gerekmektedir. Eger, 10 ms'lik ileri dönüklüge ve
ms'lik örtüsmeye sahip bir TCX penceresi mevcut ise o hâlde
dekoder tarafinda ilaveten herhangi bir gecikme olmayacaktir.
Kolay anahtarlama, bunun iyi bir sonucudur.
Dolayisiyla, analiz penceresine ait ikinci örtüsmesiz kismin
ve sentez penceresinin mevcut çerçevenin sonuna dek
genislemesi ve üçüncü örtüsme kisminin ise yalnizca gelecek
çerçeveye iliskin olarak baslamasi tercih edilmektedir.
Ayrica, TCX'e ait sifirdan farkli kisim veya dönüsüm
kodlamasi analiz/sentez penceresi, bir moddan diger moda
kolay ve düsük verimli bir anahtarlamanin
gerçeklestirilebilmesi için çerçevenin baslangici ile
hizalanmaktadir.
Ayrica, dört alt çerçeve gibi çok sayida alt çerçeveden
meydana gelen bir çerçevenin tamaminin, dönüsüm kodlamasi
modunda (TCX modu gibi) tam anlamiyla kodlanabilmesi veya
tahmin kodlama modunda (ACELP modu gibi) tam anlamiyla
kodlanabilmesi tercih edilmektedir.
Ilaveten, yalnizca tek bir LPC analiz penceresinin degil, bir
LPC analiz penceresinin dördüncü alt çerçevenin merkezi ile
hizalandigi ve bir son çerçeve analizi penceresi oldugu,
diger analiz penceresinin ise ikinci alt çerçevenin merkezi
ile hizalandigi ve bir orta çerçeve analizi penceresi oldugu
iki farkli LPC analiz penceresinin kullanilmasi tercih
edilmektedir. Bununla birlikte, eger enkoder dönüsüm
kodlamasina geçirilirse, o hâlde son çerçeve LPC analiz
penceresine dayali olarak LPC analizinden türetilen yalnizca
tek bir LPC katsayisi veri setinin iletilmesi tercih
edilmektedir. Ayrica dekoder tarafinda, söz konusu olan bu
LPC verisinin, dönüsüm kodlamasi sentezi için dogrudan
kullanilmamasi ve özellikle de TCX katsayilarinin spektral
bir agirliklandirilmasinda dogrudan kullanilmamasi tercih
edilmektedir. Bunun yerine, mevcut çerçeveye ait son çerçeve
LPC analizi penceresinden elde edilen TCX verisinin, geçmis
çerçevedeki son çerçeve LPC analiz penceresinden elde edilen
veri ile, diger bir deyisle, zaman açisindan mevcut
çerçeveden hemen önceki çerçeve ile ara degerlendirilmesi
tercih edilmektedir. TCX modundaki bir çerçevenin tamami için
yalnizca tek bir LPC katsayisi setinin iletilmesi
vasitasiyla, orta çerçeve analizi ve son çerçeve analizi için
iki LPC katsayisi veri setinin iletilmesi ile
karsilastirildiginda, daha da fazla bit hizi azaltmasi elde
edilebilmektedir. Bununlai birlikte, enkoderin ACELP moduna
anahtarlandigi bir durumda ise her iki LPC katsayisi seti de
enkoderden dekodere iletilmektedir.
Ayrica, orta çerçeve LPC analiz penceresinin, mevcut
çerçeveye ait bir hemen sonraki çerçevenin sinirinda sona
ermesi ve ilaveten geçmis çerçeveye genislemesi tercih
edilmektedir- Geçmis çerçeve halihazirda mevcut oldugu ve
herhangi bir gecikme olmadan kullanilabildigi için bu durum
bir gecikme meydana getirmemektedir.
Öte yandan, son çerçeve analizi penceresinin, mevcut
çerçevenin baslangicinda degil, mevcut çerçeve dahilinde
herhangi bir yerde baslamasi da tercih edilen bir durumdur.
Bununla birlikte bu durum herhangi bir problem
yaratmamaktadir, zira TCX agirliklandirmasinin
olusturulmasinda, en sonda tüm verilerin LPC katsayilarinin
hesaplanmasi için kullanilabilmesinin saglanmasi için geçmis
çerçeve için son çerçeve LPC veri setinin ve mevcut çerçeve
için son çerçeve LPC veri setinin bir ortalamasi
kullanilmaktadir. Dolayisiyla, son çerçeve analiz
penceresinin baslangici, tercihen geçmis çerçeveye ait son
çerçeve analiz penceresinin ileriye dönük kismi içerisinde
yer almaktadir.
Dekoder tarafinda, bir moddan diger moda geçilmesi için büyük
ölçüde azaltilmis bir ek yük elde edilmektedir. Bunun nedeni
ise tercihen kendi içinde simetrik olan sentez penceresine ait
örtüsmesiz kismin, mevcut çerçeveye ait örnekler ile degil,
gelecek bir çerçeveye ait örnekler ile iliskilendirilmesi ve
dolayisiyla, yalnizca ileriye dönük kisim içerisinde, diger
bir deyisle, yalnizca gelecek çerçeve içerisinde
genislemesidir. Böylelikle, sentez penceresi, tercihen mevcut
çerçevenin hemen basinda baslayan sadece birinci örtüsme
kisminin, mevcut çerçeve içerisinde oldugu ve ikinci
örtüsmesiz kismin ise birinci örtüsmesiz kismin sonundan
mevcut çerçevenin sonuna kadar uzandigi ve dolayisiyla, ikinci
örtüsme kisminin ileriye dönük kisim ile kesistigi bir sekilde
olmaktadir. Dolayisiyla, TCX'ten ACELP'e bir geçis söz konusu
oldugu durumlarda, sentez penceresine ait örtüsme kismindan
ötürü elde edilen veri atilmakta ve yerine ACELP kolunun
gelecek çerçevesinin baslangicindan beri nevcut olan tahmin
kodlamasi verisi gelmektedir.
Öte yandan, ACELP'den TCX'e bir geçisin söz konusu oldugu
durumlarda ise mevcut çerçevenin hemen basinda baslayan
spesifik bir geçis penceresi uygulanmaktadir, bir baska
deyisle, örtüsme "eslerinin" bulunabilmesi için herhangi bir
verinin yeniden yapilandirilmasinin gerekmedigi örtüsmesiz bir
kisma sahip olan geçis gerçeklestikten hemen sonraki çerçeve
uygulanmaktadir. Bunun yerine, sentez penceresine ait
örtüsmesiz kisim, herhangi bir örtüsme olmadan dogru verileri
saglamakta ve dekoder tarafindan herhangi bir örtüsme ekleme
prosedürüne gerek olmamaktadir. Yalnizca örtüsme kisimlari
için diger bir deyisle, mevcut çerçeve için olan pencerenin
üçüncü kismi ve bir sonraki çerçeve için olan pencerenin
birinci kismi için örtüsme ekleme prosedürü fayda saglamakta
olup, "zaman bölgesi örtüsme iptali (TDAC)" terimi altinda da
bilinen teknikteki MDCT'nin dönüsül olarak örneklenen
dogasindan ileri gelen bit hizini artirmak zorunda
kalmaksizin, nihayetinde iyi bir ses kalite elde edebilmek
için düz MDCT'de oldugu gibi, bir bloktan digerine sürekli bir
güçlenme/sönme elde etmek üzere gerçeklestirilmektedir.
Ilaveten, bir ACELP kodlama modu için enkoder içerisinde orta
çerçeve penceresinden ve son çerçeve penceresinden türetilen
LPC verisi iletilirken, TCX kodlama modu için son çerçeve
penceresinden türetilen yalnizca tek bir LPC veri seti
kullanilmaktadir, dekoder burada ayrica bir fayda
saglamaktadir. Bununla birlikte, TCX dekode edilmis verilerin
spektral olarak agirliklandirilmasi için iletilen LPC verisi
oldugu gibi kullanilmamaktadir, ancak veri, geçmis çerçeve
için elde edilen son çerçeve LPC analiz penceresinden karsilik
gelen veri ile ortalanmaktadir.
Mevcut bulusun tercih edilen düzenlemeleri, tarifname ekinde
yer alan sekillere göre açiklanmakta olup, söz konusu olan
sekillerde:
Sekil la tercih edilen bir anahtarlamali ses enkoderinin bir
blok diyagramini göstermektedir.
Sekil lb ilgili bir anahtarlamali dekodere ait bir blok
diyagrami göstermektedir.
Sekil lc Sekil lb üzerinde gösterilen dönüsüm parametresi
dekoderine iliskin daha fazla ayrintiyi
göstermektedir.
Sekil ld Sekil la'daki dekodere ait dönüsüm kodlamasi moduna
iliskin daha fazla ayrintiyi göstermektedir.
Sekil 2a bir tarafta LPC analizi için, diger tarafta ise
dönüsüm kodlamasi analizi için enkoderde uygulanan
pencereleyici için olan tercih edilen bir
düzenlemeyi göstermekte olup, ayni zamanda Sekil
lb'deki dönüsüm kodlamasi dekoderinde kullanilan
sentez penceresinin bir gösterimidir.
iki çerçeveden daha uzun bir zaman dilimi için
hizali LPC analiz pencerelerine ve TCX pencerelerine
ait pencere sekansini göstermektedir.
TCX'ten ACELP'ye bir geçis için bir durumu ve
ACELP'den TCX'e bir geçis için olan bir geçis
penceresini göstermektedir.
Sekil la'da gösterilen enkodere ait daha fazla
detayi göstermektedir.
bir çerçeve için bir kodlama modunun seçilmesi
hususunda bir sentez yoluyla analiz prosedürünü
göstermektedir.
her bir çerçeve için modlar arasinda seçim
yapilabilmesi hususunda bir diger düzenlemeyi
göstermektedir.
mevcut bir çerçeve için iki farkli LPC analiz
penceresinden faydalanilarak türetilen LPC verisinin
hesaplanmasini ve kullanilmasini göstermektedir.
enkodere ait TCX kolu için bir LPC analiz
penceresinden faydalanan pencereleme vasitasiyla
elde edilen LPC verisinin kullanimini
göstermektedir.
AMR-WB için olan LPC analiz pencerelerini
göstermektedir.
Sekil 5d LPC analizi gerçeklestirmek üzere, AMR-WB+ için olan
simetrik pencereleri göstermektedir.
Sekil 5c bir G.718 enkoderi için olan LPC analiz
pencerelerini göstermektedir.
Sekil 5d USAC'de kullanildigi gibi LPC analiz pencerelerini
göstermektedir.
Sekil 6 mevcut çerçeve için olan bir LPC analiz penceresine
göre mevcut bir çerçeve için olan bir TCX
penceresini göstermektedir.
Sekil la'da, ses örneklerinden meydana gelen bir akisa sahip
olan bir ses sinyalinin enkode edilmesi için bir cihaz
gösterilmektedir. Ses örnekleri veya ses verisi, enkodere
lOO'de girmektedir. Ses verisi, bir tahmin analizi için
pencerelenmis verileri elde etmek üzere, tahmin kodlamasi
analiz penceresinin ses örneklerinden meydana gelen akisa
uygulanmasi için pencereleyici 102 içerisine
yerlestirilmektedir. Söz konusu pencereleyici 102, bir dönüsüm
analizi için pencerelenmis veri elde etmek amaciyla, ses
örneklerinden meydana gelen akisa, bir dönüsüm kodlamasi
analiz penceresi uygulamak üzere ayrica konfigüre
edilmektedir. Uygulamaya bagli olarak, LPC penceresi orijinal
sinyale dogrudan uygulanmamakta olup, bunun yerine, "ön
vurgulanmis" bir sinyale (AMR-WB, AMR-WB+, G
uygulanmaktadir. Öte yandan, TCX penceresi ise orijinal
sinyale dogrudan (USAC'de oldugu gibi) uygulanmaktadir.
Bununla birlikte, her iki pencere de ayni sinyallere
uygulanabilmekte veya TCX penceresi, ön vurgulamak suretiyle
veya kalitenin ya da sikistirma veriminin gelistirilmesi için
kullanilan diger herhangi bir agirliklandirma vasitasiyla,
orijinal sinyalden türetilen islenmis bir ses sinyaline
uygulanabilmektedir.
Dönüsüm kodlamasi analiz penceresi, ses örneklerine ait mevcut
bir çerçeve içerisindeki ses örnekleriyle ve bir dönüsüm
kodlamasi ileriye dönük kismi olan ses örneklerine ait gelecek
çerçevenin ön tanimlanmis bir kisminin ses örnekleri ile
iliskilendirilmektedir.
Ayrica, tahmin kodlamasi analiz penceresi ise mevcut Çerçeveye
ait ses örneklerinin en az bir kismi ile ve bir tahmin
kodlamasi ileriye dönük kismi olan gelecek çerçevenin ön
tanimli bir kismina ait ses örnekleri ile
iliskilendirilmektedir.
Blok 102 üzerinde de ana hatlariyla gösterildigi üzere,
dönüsüm kodlamasi ileriye dönük kismi ve tahmin kodlamasi
ileriye dönük kismi birbiriyle hizalanmakta olup, bunun durum,
söz konusu olan bu kisimlarin birbirleri ile özdes oldugu veya
tahmin kodlamasi ileriye dönük kisminin %20'inden daha az veya
dönüsüm kodlamasi ileriye dönük kisminin %ZO'sinden daha az
olacak sekilde, birbirlerine çok yakin olduklari anlamina
gelmektedir. Tercihen, ileriye dönük kisimlar birbirleri ile
özdes veya birbirlerinden tahmin kodlamasi ileriye dönük
kisminin %S'inden bile daha az veya dönüsüm kodlamasi ileriye
dönük kisminin %5'inden daha az olacak sekilde farklidirlar.
Enkoder ilaveten, tahmin analizi için. pencerelenmis veriden
faydalanmak suretiyle mevcut çerçeve için tahmin kodlanmis
veri üretmek için veya dönüsüm analizi için pencerelenmis
veriden faydalanmak suretiyle mevcut çerçeve için dönüsüm
kodlanmis veri üretmek için bir enkode etme islemcisi 104
içermektedir.
Tercihen, enkoder ayrica, mevcut bir Çerçeve için ve hatta her
bir çerçeve için, LPC verisini 108a e dönüsüm kodlanmis
verileri (TCX verileri gibi) veya tahmin kodlanmis verileri
(ACELP verileri) hat 108b üzerinden almak için bir çikis
arayüzü 106 içermektedir. Enkode etme islemcisi 104, söz
konusu olan bu iki türden veriyi saglamakta ve llOa ile
gösterilen bir tahmin analizi için pencerelenmis verileri ve
110b'de gösterilen bir dönüsüm analizi için pencerelenmis
verileri almaktadir. Enkode etme islemi için cihaz ayrica, ses
verisini 100 girdi olarak alan ve kontrol hatlari 114a
vasitasiyla kontrol verilerini enkode etme islemcisine 104
çikti olarak saglayan veya kontrol verilerini çikis arayüzüne
106 kontrol hatti 114b vasitasiyla saglayan bir enkode etme
modu seçicisi veya kontrol aygiti 112 içermektedir.
Sekil 3a, enkode etme islemcisine 104 ve pencereleyiciye 102
iliskin ilave detaylari saglamaktadir. Pencereleyici 102,
tercihen, bir birinci modül olarak, LPC veya tahmin kodlamasi
analiz pencereleyicisi 102a ve ikinci bir bilesen veya modül
olarak ise dönüsüm kodlamasi pencereleyicisini (TCX
pencereleyicisi gibi) 102b içermektedir. Ok 300 ile de
gösterildigi üzere, LPC analiz penceresi ve TCX penceresi,
her iki pencerenin de ileriye dönük kisimlarinin birbirine
özdes olabilmesi ve dolayisiyla her iki ileriye dönük
kisminda gelecek çerçeve içerisinde ayni zamansal lahzaya dek
genisleyebilmesi için birbirleriyle hizalanmaktadir. LPC
pencereleyicisinden 102a ileride saga dogru olan Sekil
3a'daki üst kol, bir tahmin kodlamasi kolu olup, bir LPC
analiz cihazi ve bir ara degerleyici 302, bir algisal
agirliklandirma filtresi veya bir agirliklandirma blogu 304
ve bir ACELP parametresi hesaplayicisi gibi bir tahmin
kodlamasi parametre hesaplayicisi 306 içermektedir. Ses
verisi 100, LPC pencereleyicisine 102a ve algisal
agirliklandirma bloguna 304 saglanmaktadir. Ilaveten, ses
verisi ayrica, TCX pencereleyicisine saglanmakta olup, TCX
pencereleyicisinin çikisindan saga dogru olan alt kol ise bir
dönüsüm kodlamasi kolunu meydana getirmektedir. Söz konusu
olan bu dönüsüm kodlamasi kolu, bir zaman-frekans dönüstürme
blogu 310, bir spektral agirliklandirma. blogu 312 ve bir
isleme/kuantizasyon enkode etme blogu 314 içermektedir.
Zaman-frekans dönüstürme blogu 310, tercihen, bir MDCT, bir
MDST veya giris degerlerinin sayisinin çikis degerlerinin
sayisindan daha büyük oldugu baska herhangi bir dönüsüm gibi
bir örtüsme meydana getiren dönüsüm olarak uygulanmaktadir.
Zaman-frekans dönüsümü, bir giris olarak, TCX tarafindan
çiktilanan pencerelenmis veriye veya daha genel bir ifade ile
dönüsüm kodlamasi pencereleyicisine 102b sahiptir.
Her ne kadar Sekil 3a, tahmin kodlamasi kolu için LPC
islemesi ile birlikte bir ACELP enkode etme algoritmasi
gösteriyor olsa da CELP gibi diger tahmin kodlayicilari ya da
bilinen teknikte yer alan diger herhangi bir zaman bölgesi
kodlayicisi da uygulanabilmektedir ancak bununla birlikte,
ACELP algoritmasi sagladigi kalite ve verimlilik gibi
nedenlerden ötürü tercih edilmektedir.
Ayrica, dönüsüm kodlamasi kolu için özellikle zaman-frekans
dönüstürme blogu 310 dahilinde bulunan bir MDCT islemesi
tercih edilmektedir, ancak baska herhangi bir spektral bölge
dönüsümü de gerçeklestirilebilmektedir.
Ayrica Sekil 3a'da, blok 310 tarafindan çiktilanan spektral
degerlerin bir LPC bölgesine dönüstürülmesi için bir spektral
agirliklandirma 312 gösterilmektedir. Söz konusu olan bu
spektral agirliklandirma 312, tahmin kodlamasi kolu
içerisinde blok 302 tarafindan meydana getirilen LPC analiz
verisinden türetilen agirliklandirma verisi ile
gerçeklestirilmektedir. Bununla birlikte, alternatif olarak,
zaman bölgesinden LPC bölgesine olan dönüsüm, zaman
bölgesinde ayrica gerçeklestirilebilmektedir. Bu durumda,
tahmin artik zaman bölge verisinin hesaplanabilmesi için TCX
pencereleyicisinden 102b önce bir LPC analiz filtresi
yerlestirilecektir. Ancak, zaman bölgesinden LPC bölgesine
olan dönüsümün, zaman bölgesinden LPC bölgesine olan
dönüsümün, tercihen spektral bölge dahilinde, dönüsüm
kodlanmis verilerin, LPC verisinden bunlara karsilik gelen
agirliklandirma faktörlerine spektral bölge içerisinde
dönüstürülen LPC verilerinden faydalanilarak spektral olarak
agirliklandirilmasiyla gerçeklestirildigi fark edilmistir.
Sekil 3b, her bir çerçeve için olan kodlama modunun
belirlenmesinde bir sentez yoluyla analiz veya "kapali
döngü"'yü örneklemek için genel bir görünümü göstermektedir.
Bu maksatla, Sekil 3c üzerinde gösterilen enkoder, 104b'de
gösterildigi üzere, bir tam. dönüsüm. kodlamasi enkoderi ve
dönüsüm kodlamasi dekoderi içermekte olup, ilaveten Sekil 3c
üzerinde 104a ile gösterildigi üzere, bir tam tahmin kodlama
enkoderi ve buna karsilik gelen bir dekoderi içermektedir.
Her iki blok da lO4a, 104b, girdi olarak ses verisini almakta
ve tani bir enkode/dekode etme islemi gerçeklestirmektedir.
Bunun. ardindan, her iki kodlama. kolu lO4a, 104b için olan
enkode/dekode etme isleminin sonuçlari, orijinal sinyal ile
karsilastirilmakta ve hangi kodlama modunun daha iyi bir
kalite ortaya koydugunun anlasilabilmesi için bir kalite
ölçüsü belirlenmektedir. Söz konusu olan kalite ölçüsü,
örnegin, 3GPP TS 26.290'in Bölüm 5.2.3'ünde açiklandigi
üzere, segmentlenmis bir SNR degeri veya bir ortalama
segmentli SNR olabilmektedir. Bununla birlikte, tipik olarak
enkode/dekode etme sonucunun orijinal sinyal ile
karsilastirilmasi prensibine dayanan baska herhangi bir
kalite ölçüsü de uygulanabilmektedir.
Her bir koldan 104a, 104b karar vericiye 112 saglanan kalite
ölçüsüne bagli olarak, söz konusu karar verici, halihazirda
incelenen mevcut çerçevenin ACELP'den veya TCX'ten hangisinin
kullanilarak enkode edilecegini belirlemektedir. Bu kararin
ardindan, kodlama modu seçiminin gerçeklestirilebilmesi için
pek çok farkli yol bulunmaktadir. Söz konusu olan bu yollardan
bir tanesinde, karar verici 112 belirli bir çerçeve için
yalnizca tek bir kodlama sonucunun, 107'deki çikis kodlanmis
sinyal dahilinde iletildiginden emin olabilmek için mevcut
çerçeve için olan kodlama sonucunu, çikis arayüzüne 106
çiktilamak üzere, ilgili enkoder/dekoder bloklarini 104a, 104b
kontrol etmektedir.
Alternatif olarak, her iki cihaz da 104a, 104b, kendi enkode
etme sonuçlarini çikis arayüzüne 106 iletebilmekte olup, söz
konusu olan her iki sonuç da blok 104b veya blok 104a'dan
gelen sonuçlardan birini çiktilamak üzere, karar vericinin
çikis arayüzünü hat 105 vasitasiyla kontrol edecegi ana dek
saklanmaktadir.
Sekil 3b, Sekil 3c'de gösterilen konsepte iliskin daha fazla
detayi ortaya koymaktadir. Özellikle blok lO4a, tam bir ACELP
enkoderi, tam bir ACELP dekoderi ve bir karsilastirici 112a
içermektedir. Karsilastirici 112a, karsilastiriciya 112c bir
kalite ölçüsü saglamaktadir. Ayni durum, bir TCX enkode edilen
ve yine dekode edilen sinyal ile orijinal ses sinyalinin
karsilastirmasindan ileri gelen bir kalite ölçüsüne sahip olan
karsilastirici 112b için de geçerli olmaktadir. Akabinde, her
iki karsilastirici da 112a, 112b, kendi kalite ölçülerini
nihai karsilastiriciya 112c saglamaktadir. Hangi kalite
ölçüsünün daha iyi olduguna bagli olarak, karsilastirici bir
CELP veya bir TCX'e iliskin bir karara varmaktadir. Söz konusu
karar, ilave faktörlerin karar içerisine yerlestirilmesi
suretiyle arindirilabilmektedir.
Alternatif olarak, mevcut çerçeve için olan ses verisinin
sinyal analizine bagli olarak, mevcut bir çerçeve için
kodlama modunu belirlemek üzere bir açik döngü modu
gerçeklestirilebilmektedir. Bu türden durumlarda, Sekil 3c'de
gösterilen karar verici 112, mevcut çerçeve için ses
verisinin bir sinyal analizini gerçeklestirmekte ve bunun
akabinde, mevcut ses çerçevesini enkode etmek üzere, bir
ACELP enkoderini veya bir TCX enkoderini kontrol etmektedir.
Bu durumda, enkoderin tam bir dekodere ihtiyaci olmamakta ve
sadece enkode etme adimlarinin enkoder dahilinde uygulanmasi
yeterli olmaktadir. Açik. döngü sinyal siniflandirmalari ve
sinyal kararlari, örnegin, AMR-WB+ (3GPP TS 26.290) dahilinde
de açiklanmaktadir.
Sekil 2a, pencereleyiciye 102 ait tercih edilen bir
düzenlemeyi göstermekte olup, özellikle de pencereleyici
tarafindan saglanan pencereleri ortaya koymaktadir.
Tercihen, mevcut çerçeve için olan tahmin kodlamasi analiz
penceresi, dördüncü bir alt çerçevenin ortasinda
merkezlenmekte olup, söz konusu olan› bu pencere is 200'de
gösterilmektedir. Ayrica, ilaveten bir LPC analiz
penceresinin kullanilmasi, diger bir deyisle, 202'de
gösterilen ve mevcut çerçeveye ait ikinci alt çerçevenin
ortasinda merkezlenen orta çerçeve LPC analiz penceresinin
kullanilmasi tercih edilmektedir. Buna ek olarak,
gösterildigi üzere, örnegin MDCT penceresi 204 gibi dönüsüm
kodlamasi penceresi, iki LPC analiz penceresine 200, 202 göre
olacak sekilde yerlestirilmektedir. Özellikle, analiz
penceresine ait olan ileriye dönük kisim 206, zamansal açidan
tahmin kodlamasi analiz penceresine ait ileriye dönük kisim
208 ile ayni uzunluga sahiptir. Her iki ileriye dönük kisim
da gelecek bir sonraki çerçeve içerisine lO ms'lik bir süre
ile genislemektedir. Ayrica, dönüsüm kodlamasi analiz
penceresinin yalnizca örtüsme kismina 206 degil, ayni zamanda
ila 20 ms araliginda örtüsmesiz bir kisma 208 ve birinci
örtüsme kismina 210 sahip olmasi tercih edilmektedir. Örtüsme
kisimlari 206 ve 210, bir dekoderdeki bir örtüsme
ekleyicisinin, bir örtüsme kismi dahilinde bir örtüsme ekleme
islemi gerçeklestirecegi sekilde olup, ancak bununla birlikte
örtüsmesiz kisim için herhangi bir örtüsme ekleme prosedürü
gerekmemektedir.
Tercihen, birinci örtüsme kismi 210, çerçevenin basinda
baslamaktadir, diger bir deyisle, sifir ms'de baslamakta ve
çerçevenin merkezine kadar, diger bir deyisle, 10 ms.,
uzanmaktadir. Örtüsmesiz kisim ayrica, ikinci örtüsme
kisminin 206, ileriye dönük kisim ile tam anlamiyla
kesisebilmesi için çerçeveye 210 ait birinci kismin sonundan,
çerçevenin 20 ns'deki sonuna kadar uzanmaktadir. Bu durum,
bir moddan diger moda geçildiginden Ötürü avantaj
saglamaktadir. TCX performansi açisindan bakildiginda, tam
örtüsmeye (USAC'de de oldugu gibi 20 ms'lik örtüsme) sahip
bir sinüs penceresinin kullanilmasi daha faydali olacaktir.
Ancak bu durum, TCX ve ACELP arasindaki geçisler için ileriye
dönük örtüsme iptali gibi bir teknolojiyi gerekli
kilmaktadir. Ileriye dönük örtüsme iptali, sonradan gelen
kayip TCX çerçevelerinin (ACELP ile degistirilmektedir) neden
oldugu örtüsmenin iptali için USAC'de kullanilmaktadir.
Ileriye dönük örtüsme iptali, önemli miktarda bit sayisi
gerektirmektedir, bu nedenle, sabit bir bit hizi için ve
özellikle de açiklamasi verilen kodegin tercih edilen bir
düzenlemesindeki gibi düsük bit hizli bir kodek için
elverisli olmamaktadir. Bu nedenle, mevcut bulusa ait
düzenlemelere göre, FAC'nin kullanilmasi yerine, tam örtüsme
kisminin 206 gelecek çerçeve içine yerlestirilebilmesi için
TCX penceresi örtüsmesi azaltilmakta ve pencere yönü ileriki
çerçevelere dogru degistirilmektedir. Ayrica, dönüsüm
kodlamasi için Sekil Za'da gösterilen pencere, bir sonraki
çerçevenin ACELP oldugu ve ileriye dönük örtüsme iptalinden
faydalanilmadigi durumlarda, mevcut çerçeve dahilinde
kusursuz yeniden yapilanmanin alinabilmesi için yine de bir
maksimum örtüsmeye sahiptir. Söz konusu olan maksimum
örtüsme, tercihen 10 ms olarak belirlenmekte olup, söz konusu
süre, diger bir deyisle, Sekil Za'da da açikça belirtildigi
üzere 10 ms, zamansal açidan ileriye dönük kisim dahilinde
mevcuttur.
Her ne kadar Sekil 2a, dönüsüm enkode etme islemi için
pencerenin 204 bir analiz penceresi oldugu bir enkodere göre
açiklanmis olsa da pencerenin 204 ayni zamanda dönüsüm dekode
etme islemi için bir sentez penceresini temsil ettigi
unutulmamalidir. Tercih edilen bir düzenlemede, analiz
penceresi sentez penceresi ile özdes olup, söz konusu olan her
iki pencere de kendi içlerinde simetriktir. Bunun anlami, her
iki pencerenin de bir (yatay) merkez hattina simetrik
olmasidir. Bununla. birlikte, diger uygulamalarda ise analiz
penceresinin sekil bakimindan sentez penceresinden farkli
oldugu, simetrik olmayan pencereler kullanilabilmektedir.
Sekil 2b, geçmis bir çerçevenin bir kismi üzerindeki bir
pencere sekansini, bunun akabinde gelen mevcut çerçeveyi,
mevcut çerçeveyi takip eden bir gelecek çerçeveyi ve gelecek
çerçeveyi takip eden bir sonraki gelecek çerçeveyi
göstermektedir.
250'de gösterilen bir örtüsme ekleme islemcisi tarafindan
islenen örtüsme ekleme kisminin, her bir çerçevenin
baslangicindan, yine her bir çerçevenin ortasina dek
genisledigi, diger bir deyisle, gelecek çerçeve verisinin
hesaplanmasi için 20 ve 30 ms'ler` arasinda. ve bir sonraki
gelecek çerçeve için TCX verisini hesaplamak üzere 40 ve 50
ms'ler arasinda ya da mevcut çerçeve için olan veriyi
hesaplamak üzere sifir ve 10 ms arasinda uzandigi netlik
kazanmaktadir. Bununla birlikte, her bir çerçevenin ikinci
yarisi dahilindeki verinin, hesaplanmasi için örtüsme ekleme
islemi ve dolayisiyla ileriye dönük. örtüsme iptali teknigi
gerekli olmamaktadir. Bunun nedeni, sentez penceresinin, her
bir çerçevenin ikinci yarisinda. örtüsmesiz bir kisma sahip
olmasidir.
Tipik olarak, bir MDCT penceresinin uzunlugu, bir çerçevenin
uzunlugunun iki katidir. Bu durum mevcut bulus için de geçerli
olmaktadir. Bununla birlikte, yine Sekil 2a göz önünde
bulunduruldugunda, analiz/sentez penceresinin yalnizca
sifirdan 30 ms'ye uzandigi, ancak pencere uzunlugunun
tamaminin ise 40 ms oldugu. belirginlesmektedir. Söz konusu
olan uzunlugun tamami, MDCT hesaplamasinin ilgili katlama veya
yayilma islemleri için olan giris verisinin saglanmasi
açisindan önem arz etmektedir. Pencerenin 14 ms'lik tam
uzunluga genisletilebilmesi için -5 ve O Ins'ler arasinda 5
ms'lik sifir degerleri ilave edilmekte ve 30 ila 35 Hß'ler
arasindaki çerçevenin sonuna da 5 saniyelik MDCT sifir
degerleri eklenmektedir. Bununla birlikte, söz konusu olan
yalnizca sifirlara sahip ilave kisimlarin, gecikme konusunda
dikkate alinacak hususlar söz konusu oldugunda herhangi bir
payi olmamaktadir, zira söz konusu olan bu verinin herhangi
bir gecikme olmadan halihazirda mevcut olabilmesi için
pencerenin son bes ms'sinin ve yine pencerenin ilk bes
ms'sinin sifir oldugu enkoder veya dekoder tarafindan
bilinmektedir.
Sekil 2c, mümkün olan iki geçisi göstermektedir. Öte yandan,
TCX'ten ACELP'ye gerçeklestirilecek bir geçis islemi için
hususi bir itinanin gösterilmesi gerekmemektedir, zira Sekil
2a'ya göre gelecek çerçevenin bir ACELP çerçevesi oldugu
varsayildiginda, ACELP çerçevesi, gelecek çerçevenin hemen
basinda basladigindan, ileriye dönük kisim 206 için son
çerçevenin TCX dekode edilmesi suretiyle elde edilen veri
silinebilmektedir* ve bu dogrultu herhangi bir veri boslugu
olmamaktadir. ACELP verisi kendi içinde istikrarlidir ve
dolayisiyla bir dekoder, TCX'ten ACELP'e bir anahtara sahip
oldugunda, mevcut çerçeve için TCX'ten hesaplanan veriyi
kullanmakta, gelecek çerçeve için TCX islemesi vasitasiyla
elde edilen veriyi atmakta ve bunun yerine ACELP kolundan
gelecek çerçeve verisini kullanmaktadir.
Bununla birlikte, ACELP'den TCX'e bir geçis islemi
gerçeklestirildiginde ise Sekil 2c'de de gösterildigi üzere,
özel bir geçis penceresi kullanilmaktadir. Söz konusu olan bu
pencere, çerçevenin basinda, sifirdan l'e baslamakta olup,
örtüsmesiz bir kisma 220 ve sonda 222'de gösterilen ve düz
bir MDCT penceresinin örtüsme kismi 206 ile özdes olan bir
örtüsme kismina sahiptir.
Bu pencere ilaveten, -12.5 ms ila pencerenin basindaki sifir
arasinda ve en sonda 30 ve 35.5 arasinda, diger bir deyisle,
ileriye dönük kismin 222 akabinde sifirlar ile takviye
edilmektedir. Bu durum, dönüsüm uzunlugunun artmasina neden
olmaktadir. Uzunluk 50 ms olsa da düz analiz/sentez
penceresinin uzunlugu yalnizca 40 ms'dir. Öte yandan, bu
durum verimliligi azaltmamakta veya bit hizini
artirmamaktadir, ayrica söz konusu olan bu daha uzun yapidaki
dönüsüm, ACELP'den TCX'e bir geçis meydana geldiginde gerekli
olmaktadir. Ilgili dekoderde kullanilan geçis penceresi,
Sekil 2c'de gösterilen pencere ile aynidir.
Bu noktadan itibaren, dekoder daha ayrintili bir biçimde
açiklanacaktir. Sekil lb, enkode edilmis bir ses sinyalinin
dekode edilmesi için bir ses dekoderini göstermektedir. Ses
dekoderi, tahmin parametresi dekoderinin, l81'de alinan ve
bir arayüze 182 girdilenmekte olan enkode edilmis ses
sinyalinden bir tahmin kodlanmis çerçeve için bir veri dekode
etme islemi gerçeklestirmek üzere konfigüre edildigi bir
tahmin. parametresi dekoderini 180 içermektedir. Söz konusu
dekoder ayrica, hat 181 üzerinde enkode edilmis ses
sinyalinden bir dönüsüm kodlanmis çerçeve için bir veri
dekode etme islemi gerçeklestirmek üzere bir dönüsüm
parametresi dekoderi 183 içermektedir. Dönüsüm parametresi
dekoderi, tercihen örtüsmeden etkilenen spektral-zaman
dönüsümü gerçeklestirmek ve mevcut çerçeve ve gelecek bir
çerçeve için veri elde etmek amaciyla dönüstürülmüs veriye
bir sentez penceresi uygulamak üzere konfigüre edilmektedir.
Sentez penceresi, Sekil 2a'da da belirtildigi üzere, bir
birinci örtüsme kismina, bitisik bir ikinci örtüsmesiz kisma
ve yine bitisik üçüncü bir örtüsme kismina sahip olup, burada
söz konusu olan üçüncü örtüsme kismi, yalnizca gelecek
çerçeve için olan ses örnekleri ile iliskilendirilmektedir ve
örtüsmesiz olan kisim ise yalnizca mevcut çerçeveye ait veri
ile iliskilendirilmektedir. Ayrica, gelecek çerçeve için ses
örneklerinden meydana gelen bir birinci kismi elde etmek
üzere, örtüsme ve mevcut çerçeve için bir sentez penceresine
ait üçüncü örtüsme kismi ile iliskilendirilen sentez
penceresi örneklerinin ve gelecek çerçeve için bir sentez
penceresinin birinci örtüsme kismi ile iliskilendirilen
örneklerde bir sentez penceresinin eklenmesi için bir
örtüsme-ekleyici 184 saglanmaktadir. Gelecek çerçeve için
olan ses örneklerinin geri kalani, mevcut çerçevenin ve
gelecek çerçevenin dönüsüm kodlanmis verileri içerdigi
durumda, örtüsme-ekleme gerçeklestirilmeden elde edilen
gelecek çerçeve için olan sentez penceresine ait ikinci
örtüsmesiz kisim ile iliskilendirilen sentez pencerelenmis
örneklerdir. Öte yandan, bir çerçeveden bir sonraki çerçeveye
bir geçis söz konusu oldugu durumlarda, nihai olarak
birlestiricinin 185 çiktisinda dekode edilmis ses verisi elde
etmek üzere, bir kodlama modundan diger kodlama moduna iyi
bir geçis isleminin gerçeklestirilebilmesi için gerekli
dikkatin gösterilmesi gerektiginde bir birlestirici 185 fayda
saglamaktadir.
Sekil lc, dönüsüm parametresi dekoderinin l83
yapilandirilmasina iliskin daha fazla detayi ortaya
koymaktadir.
Dekoder, blogun 183 çiktisinda dekode edilmis spektral
degerler elde etmek üzere, aritmetik dekode etme islemi veya
Huffman dekode etme islemi ya da genel olarak entropi dekode
etme islemi ve bunun akabinde bir dekuantizasyon islemi,
gürültü doldurma, vb. gibi enkode edilmis spektral verilerin
dekode edilmesi için gerekli olan tüm islemeleri
gerçeklestirmek üzere konfigüre edilen bir dekoder isleme
asamasi 183a içermektedir. Söz konusu olan bu spektral
degerler, bir spektral agirliklandiriciya 183b
girdilenmektedir. Spektral agirliklandirici l83b, spektral
agirliklandirma 'verisini, enkoder tarafinda yer alan tahmin
analiz blogundan üretilen ve dekoder tarafindan giris arayüzü
182 vasitasiyla alinan LPC verisi ile beslenmekte olan bir LPC
agirliklandirma verisi hesaplayicisindan l83c almaktadir.
Bunun akabinde, bir ters spektral dönüstürme islemi
gerçeklestirilmekte olup, söz konusu islem, gelecek çerçeve
için olan veriden önce, örnegin örtüsme-ekleyiciye 184
saglanan bir birinci asama olarak tercihen bir DCT-IV' ters
dönüsümünü 183d, bunun ardindan gelen bir yayma islemini ve
sentez pencereleme islemesini l83e içermektedir. Örtüsme-
ekleyici, bir sonraki gelecek çerçeve kullanilabilir
oldugunda, örtüsme ekleme islemini gerçeklestirebilmektedir.
Bloklar 183d ve 183e, birlikte spektral/zaman dönüsümünü veya
Sekil lc'de gösterilen düzenlemede, tercih edilen bir MDCT
ters dönüsümünü (MDCT-l) meydana getirmektedir.
Özellikle blok l83d, 20 ms'lik bir çerçeve için veriyi almakta
ve blogun 183e yayma adimi dahilinde veri hacmini 40 ms'lik
veri içinde, diger bir deyisle, öncekiyle karsilastirildiginda
iki kat daha fazla veri olacak sekilde artirmakta ve bunun
akabinde 40 Hß'lik bir uzunluga (pencere baslangicindaki ve
sonundaki sifir kisimlar' birbirine eklendiginde) sahip olan
sentez penceresi söz konusu olan bu 40 ms'lik veriye
uygulanmaktadir. Ardindan, blogun 183e çikisinda, mevcut blok
için olan veri ve gelecek blok için olan ileriye dönük kisim
dahilindeki veri kullanilabilir hâle gelmektedir.
Sekil 1d, ilgili enkoder tarafi islemesini göstermektedir.
Sekil ld'nin baglaminda ortaya konan özellikler, enkode etme
islemcisinde 104 veya Sekil 3a'da gösterilen ilgili bloklar
tarafindan uygulanmaktadir. Sekil 3a'da gösterilen zaman-
frekans dönüstürümü 310, tercihen bir MDCT olarak uygulanmakta
olup, blok 310a içerisindeki pencereleme isleminin TCX
pencereleyicisi 103d tarafindan gerçeklestirildigi bir
pencereleme katlama asamasi 310a içermektedir. Böylelikle,
Sekil 3a'da gösterilen blok 310 dahilindeki birinci islem, 40
ms'lik giris verisini, 20 ms'lik çerçeve verisine geri
getirmek için katlama islemi olmaktadir. Bunun ardindan,
örtüsme katkilarini almis olan katlanan. veriler ile blokta
310d gösterildigi gibi bir DCT-IV islemi
gerçeklestirilmektedir. Blok , son çerçeve
LPC penceresinden faydalanan analizden türetilen LPC verisini,
bir (LPC'den MDCT'ye) bloga 302b saglamakta ve blok 302d ise
spektral agirliklandirici 312 tarafindan spektral
agirliklandirma isleminin gerçeklestirilebilimesi için
agirliklandirma faktörlerini meydana getirmektedir. Tercihen,
TCX enkode etme modunda, 20 ms'lik bir çerçeve için 16 LPC
katsayisi, 16 MDCT bölgesi agirliklandirma faktörüne, tercihen
bir oDFT'den (tek Ayrik Fourier Dönüsümü) faydalanilarak
dönüstürülmektedir. 8 kHz'lik bir örnekleme hizina sahip NB
modlari gibi diger modlar için ise LPC katsayilarinin sayisi
gibi düsük bir sayida olabilmektedir. Daha yüksek örnekleme
hizlarina sahip olan diger modlar için 16 LPC katsayisindan
daha fazla sayida katsayi da olabilmektedir. Söz konusu olan
buu oDFT isleminin sonucundar 16 agirliklandirmar degeri elde
edilmekte olup, her bir agirliklandirma degeri, blok 310b
vasitasiyla elde edilen spektral veriye ait bir bant ile
iliskilendirilmektedir. Spektral agirliklandirma islemi, bu
spektral agirliklandirma isleminin blok 312 dahilinde oldukça
verimli bir biçimde gerçeklestirilebilmesi için tüm MDCT
spektral degerlerinin bir bant için söz konusu olan bu bant
ile iliskilendirilen ayni agirliklandirma degeri ile bölünmesi
suretiyle gerçeklestirilmektedir. Böylelikle, teknikte de
bilindigi üzere blok 314 tarafindan, diger bir deyisle,
örnegin kuantizasyon ve entropi enkode etme islemleri gibi
islemlerle ilaveten islenen, spektral olarak
agirliklandirilmis spektral degerlerin çiktilanabilmesi için
16 bantlik MDCT degerlerinin her biri ilgili agirliklandirma
faktörü ile bölünmektedir.
Öte yandan, dekoder tarafinda, Sekil ld'deki bloga 312
karsilik gelen spektral agirliklandirma islemi, Sekil lc'de
gösterilen spektral agirliklandirici 183b tarafindan
gerçeklestirilecek bir çarpma islemi olacaktir.
Bu noktadan itibaren, LPC verisinin, LPC analiz penceresi
tarafindan nasil meydana getirildiginin veya Sekil 2'de
gösterilen iki LPC analiz penceresinin ACELP modunda veya
TCX/MDCT modunda kullanilarak üretildiginin ana hatlariyla
çizilebilmesi için Sekil 4a ve Sekil 4b açiklanacaktir.
LPC analiz penceresinin uygulanmasini takiben, LPC
pencerelenmis verilerden faydalanilarak oto korelasyon
hesaplamasi gerçeklestirilmektedir. Bunun ardindan, oto
korelasyon fonksiyonuna bir Levinson-Durbin algoritmasi
uygulanmaktadir. Akabinde, er bir LP analizi için olan 16
adet LP katsayisi, diger bir deyisle, orta çerçeve penceresi
için olan 16 katsayi ve son çerçeve penceresi için olan 16
katsayi, ISP degerlerine dönüstürülmektedir. Böylelikle, oto
korelasyon hesaplamasi isleminden, ISP dönüstürme islemine
kadar olan adimlar, örnegin, Sekil 4a'da gösterilen blok 400
dahilinde gerçeklestirilmektedir.
Ardindan, hesaplama islemi enkoder tarafinda ISP
katsayilarinin kuantizasyonu ile devam etmektedir. Bunun
akabinde, ISP katsayilarinin kuantizasyonu geri alinmakta ve
LP katsayisi bölgesine geri dönüstürülmektedir. Böylelikle,
LPC verisi veya baska bir sekilde ifade edilmesi gerekirse,
blok 400 dahilinde LPC katsayilarindan çok küçük ölçüde
farkli olacak sekilde türetilen 16 adet LPC katsayisi
(kuantizasyon ve yeniden kuantizasyon islemleri nedeniyle)
elde edilmekte ve bunlar daha sonra adim 40l'de de
gösterildigi üzere dördüncü alt çerçeve için dogrudan
kullanilabilmektedir. Bununla birlikte diger alt çerçeveler
numarali bölümünde de ana hatlari ile belirtildigi üzere, pek
çok farkli ara degerleme isleminin gerçeklestirilmesi tercih
edilmektedir. Üçüncü alt çerçeve için olan LPC verisi, blok
402 üzerinde de gösterildigi üzere son çerçeve ve orta
çerçeve LPC verisinin ara degerlendirilmesi suretiyle
hesaplanmaktadir. Tercih edilen ara degerleme islemi, her bir
ilgili verinin iki ile bölünmesi ve birbirine eklenmesi
suretiyle, bir baska deyisle, son çerçeve ve orta çerçeve LPC
verilerinin bir ortalamasi ile gerçeklestirilmektedir. Blok
403 üzerinde de gösterildigi üzere, ikinci alt çerçeve için
olan LPC verisini hesaplamak üzere, ilave bir ara degerleme
islemi gerçeklestirilmektedir. Özellikle de nihayetinde
ikinci alt çerçeve için LPC verisini hesaplamak üzere,
sonuncu çerçevenin son çerçeve LPC verisine ait olan
degerlerin %lO'u, mevcut çerçeve için olan orta çerçeve LPC
verisinin %80'i ve mevcut çerçeveye ait son çerçeve için olan
LPC verisinin degerlerinin %lO'u kullanilmaktadir.
Son olarak, blok 404 ile gösterildigi üzere, birinci alt
çerçeve için LPC verisi, sonuncu çerçeveye ait çerçeve sonu
LPC verisi ile mevcut çerçeveye ait çerçeve ortasi LPC
verisinin arasinda bir ortalamanin olusturulmasi suretiyle
hesaplanmaktadir.
ACELP enkode etme isleminin gerçeklestirilmesi için kuantize
edilmis, bir baska deyisle, orta çerçeve analizi ve son
çerçeve analizinden her iki LPC parametresi seti de bir
dekodere iletilmektedir.
Bloklar 401 ila 404 vasitasiyla hesaplanan bireysel alt
çerçeveler için olan sonuçlara bagli olarak, dekodere
iletilecek olan ACELP verisini elde etmek üzere blok 405
üzerinde de gösterildigi gibi ACELP hesaplamalari
gerçeklestirilmektedir.
Bu noktadan itibaren Sekil 4b açiklanmaktadir. Yine blok 400
üzerinde, orta çerçeve ve son çerçeve LPC verileri
hesaplanmaktadir. Bununla birlikte, TCX enkode etme modu
mevcut oldugundan, dekodere yalnizca çerçeve sonu LPC verisi
iletilmekte olup, çerçeve ortasi LPC verisi dekodere
gönderilmemektedir. Özellikle, bir tanesi LPC katsayilarinin
kendilerine dekodere iletmemekte olup, digeri ise ISP
dönüstürme ve kuantizasyon› islemleri sonrasinda. elde edilen
degerleri iletmektedir. Dolayisiyla, LPC verisi olarak,
çerçeve sonu LPC veri katsayilarindan türetilen kuantize
edilmis ISP degerlerinin dekodere iletilmesi tercih
edilmektedir.
Bununla birlikte, enkoderde, mevcut çerçeveye ait MDCT
spektral verilerinin agirliklandirilmasi için agirliklandirma
faktörlerini elde etmek üzere, adimlar 406 ila 408 üzerinde
gösterilen prosedürler yine de gerçeklestirilmektedir. Bu
amaçla, mevcut çerçeveye ait çerçeve sonu LPC verisi ve bir
önceki çerçeveye ait olan çerçeve sonu LPC verisi ara
degerlenmektedir. Bununla birlikte, LPC veri katsayilarinin,
LPC analizinden türetildigi halleriyle dogrudan ara
degerlendirilmesi tercih edilmeyen bir durumdur. Bunun yerine,
ilgili LPC katsayilarindan türetilen kuantize ve yeniden
dekuantize edilmis ISP degerlerinin ara degerlendirilmesi
tercih edilmektedir. Dolayisiyla, blok 406 dahilinde
kullanilan LPC verisinin yani sira, blok 401 ila 404
üzerindeki diger hesaplamalar için kullanilan LPC verileri de
daima, tercihli olarak, kuantize ve yine dekuantize edilmekte
olup, burada ISP verisi, her bir LPC analiz penceresi basina,
orijinal 16 LPC katsayisindan türetilmektedir.
Blok 406 üzerindeki ara degerleme islemi, tercihen salt bir
ortalama islemidir, bir baska deyisle, ilgili degerler
eklenmekte ve iki ile bölünmektedir. Bunun ardindan, blok 407
içerisinde, mevcut çerçeveye ait MDCT spektral verileri, ara
degerlenmis LPC verisinden faydalanilarak agirliklandirilmakta
olup, blok 408 dahilinde ise nihayetinde enkodere ve bir
dekodere iletilecek olan enkode edilmis spektral verileri elde
etmek üzere, agirliklandirilmis spektral verilerin ilaveten
islemesi gerçeklestirilmektedir. Dolayisiyla, adim 407
dahilinde gerçeklestirilen prosedürler bloga 312 ve Sekil 4d
üzerindeki blok 408 dahilinde gerçeklestirilen prosedür ise
Sekil 4d'de gösterilen bloga 314 karsilik. gelmektedir. Söz
konusu karsilik gelen islemler, dekoder tarafinda
gerçeklestirilmektedir. Böylelikle, bir tarafta spektral
agirliklandirma degerlerinin hesaplanmasi veya diger tarafta
ara degerleme yoluyla bireysel alt çerçeveler için LPC
katsayilarinin hesaplanmasi için ayni ara degerleme islemleri,
dekoder tarafinda da gerekli olmaktadir. Dolayisiyla Sekil 4a
ve Sekil 4b'nin her ikisi de bloklar 401 ila 404 dahilindeki
veya Sekil 4b'de gösterilen 406 üzerindeki prosedürlere
iliskin olarak, dekoder tarafinda esit sekilde uygulanabilir
olmaktadir.
Mevcut bulus özellikle düsük gecikmeli kodek uygulamalari için
fayda saglamaktadir. Bunun anlami, bu türden kodeklerin,
tercihen, 45 ms'den az ve hatta bazi durumlarda 35 ms'ye esit
veya bundan daha az olabilen algoritmik veya sistematik bir
gecikmeye sahip olacak sekilde tasarlanmakta oldugudur. Buna
karsin, LPC analizi ve TCX analizi için olan ileriye dönük
kisim, iyi bir ses kalitesinin elde edilebilmesi için gerekli
olmaktadir. Dolayisiyla, her iki tezatli gereksinimler
arasinda iyi bir ödünlesim gerekmektedir. Bir tarafta gecikme
ve diger tarafta kalite arasinda iyi bir ödünlesimin, 20
ms'lik bir çerçeve uzunluguna sahip olan anahtarlamali bir ses
enkoderi 'veya dekoderi vasitasiyla. elde edilebildigi, ancak
bununla. birlikte 15 ila 30 ms araliginda uzunluklara sahip
çerçevelerin de kabul edilebilir sonuçlar verdigi fark
edilmistir. Öte yandan, gecikme ile ilgili sorunlar söz konusu
oldugunda, lO ms'lik bir ileriye dönük kismin kabul edilebilir
oldugu, bununla birlikte 5 ms ve 20 ms araligindaki degerlerin
de ilgili uygulamaya bagli olarak faydali olabildigi
kesfedilmistir. Ayrica, ileriye dönük kisim ve çerçeve
uzunlugu arasindaki bagintinin, 0.5'lik bir degere sahip
oldugu bir durumda faydali olmasinin yani sira, 0.4 ila
0.6'lik aralikta bulunan degerlerinde kullanisli olabildigi
bulunmustur. Ayrica, her ne kadar mevcut bulus bir tarafta
ACELP ile ve diger tarafta ise MDCT-TCX ile açiklanmis olsa da
CELP gibi zaman bölgesinde çalisan diger algoritmalar veya
baska herhangi bir tahmin veya dalga formu algoritmalari da
kullanisli olmaktadir. TCX/MDCT hususunda, MDST gibi diger
dönüsüm bölgesi kodlama algoritmalari veya baska herhangi
dönüsüm tabanli algoritmalar da uygulanabilmektedir.
Ayni durum, LPC analizi ve LPG hesaplamasinin spesifik
uygulamasi için de geçerli olmaktadir. Yukarida açiklamasi
verilen prosedürlerin kullanilmasi tercih edilmektedir, ancak
bununla. birlikte, söz konusu prosedürlerin bir LPC analiz
penceresine dayali oldugu nüddetçe, hesaplama/ara degerleme
ve analiz için olan diger prosedürler de
kullanilabilmektedir.
Her ne kadar mevcut bulusun bazi yönleri bir cihaz baglaminda
açiklanmis olsa da söz konusu olan bu yönlerin ayni zamanda,
bir blok 'veya cihazin bir yöntem adimina veya bir yöntem
adiminin bir özelligine karsilik gelmekte oldugu ilgili
yöntemin bir açiklamasini temsil etmekte oldugu oldukça
açiktir. Benzer sekilde, bir yönteni adimi baglaminda
açiklanmis olan yönlerin ise ilgili bir cihaza ait ilgili bir
blogun, ögenin veya özelligin bir açiklamasini temsil ettigi
açikça görülebilmektedir.
Belirli uygulama gereksinimlerine bagli olarak, mevcut
bulusun düzenlemeleri, donanim, veya yazilim, dahilinde
uygulanabilmektedir. Söz konusu uygulama, örnegin, bir
DISKET, bir DVD, bir CD, bir ROM, bir PROM, bir EPROM, bir
EEPROM veya bir FLAS BELLEK gibi ilgili yöntemin
gerçeklestirilebilecegi bir biçimde programlanabilir bir
bilgisayar sistemi ile birlikte çalisan (veya birlikte
çalisma yetisine sahip olan) elektronik olarak okunabilir
kontrol sinyallerinin üzerinde depolanmakta oldugu dijital
bir depolama ortami kullanilarak gerçeklestirilebilmektedir.
Mevcut bulusa göre olan birtakim düzenlemeler, burada
açiklamasi verilen yöntemlerden birinin
gerçeklestirilebilecegi bir biçimde, programlanabilir bir
bilgisayar sistemi ile birlikte çalisabilme yetisine sahip
elektronik olarak okunabilir kontrol sinyallerini içeren
geçici olmayan bir veri tasiyicisi içermektedir.
Genel olarak, mevcut bulusun düzenlemeleri, bir program koduna
sahip olan bir bilgisayar programi olarak uygulanabilmekte
olup, burada söz konusu olan program kodu, bilgisayar
programinin bir bilgisayar üzerinde çalistirildigi durumlarda
burada açiklamasi verilen yöntemlerden birini gerçeklestirmek
için isletici olmaktadir. Söz konusu program kodu, örnegin,
makine tarafindan okunabilir bir tasiyici üzerinde
depolanabilmektedir.
Mevcut bulusun diger düzenlemeleri ise burada açiklamasi
verilen yöntemlerden birini gerçeklestirmek için olan
bilgisayar programinin üzerinde depolandigi makine tarafindan
okunabilir bir tasiyiciyi içermektedir.
Bu dogrultuda, bir baska sekilde ifade etmek gerekirse, bulus
konusu yöntemin bir düzenlemesi, bilgisayar programi bir
bilgisayar üzerinde çalistirildiginda, burada açiklamasi
verilen yöntemlerden birini gerçeklestirmek için bir program
koduna sahip bir bilgisayar programi olmaktadir.
Dolayisiyla, bulus konusu yöntemin bir baska düzenlemesi ise
burada açiklamasi verilen yöntemlerden birini gerçeklestirmek
için olan bilgisayar programinin üzerinde kayitli olarak
içeren bir veri tasiyicisidir (veya bir dijital depolama
ortami ya da bilgisayar tarafindan okunabilir bir ortam).
Bu dogrultuda, bulus konusu yöntemin bir diger düzenlemesi ise
burada açiklamasi verilen yöntemlerden birini gerçeklestirmek
için bilgisayar programini temsil eden bir veri akisi veya bir
sinyal sekansidir. Söz konusu veri akisi veya sinyal sekansi,
örnegin, Internet gibi bir veri iletisim baglantisi tarafindan
aktarilmak üzere konfigüre edilebilmektedir.
Bir diger düzenleme ise burada açiklamasi verilen yöntemlerden
birini gerçeklestirmek üzere konfigüre edilen veya uyarlanan,
örnegin bir bilgisayar veya programlanabilir bir mantik cihazi
gibi bir isleme yolu içermektedir.
Bir baska düzenleme ise burada açiklamasi verilen yöntemlerden
birinin gerçeklestirilmesi için olan bilgisayar programini
üzerinde yüklenmis hâlde bulunduran bir bilgisayari
içermektedir.
Bazi düzenlemelerde, programlanabilir bir mantik cihazi
(örnegin, sahada programlanabilir bir kapi dizisi) burada
açiklamasi verilen yöntemlere ait fonksiyonelliklerin
bazilarini veya tamamini gerçeklestirmek üzere
kullanilabilmektedir. Bazi düzenlemelerde ise sahada
programlanabilir' bir kapi dizisi, burada açiklamasi verilen
yöntemlerden, birini gerçeklestirmek. üzere bir mikro islemci
ile birlikte çalisabilmektedir. Genel olarak, söz konusu
yöntemler, tercihen herhangi bir donanim cihazi ile
gerçeklestirilmektedir.
Yukarida açiklamasi verilen düzenlemeler, sadece mevcut bulusa
ait prensiplerin tasvir edilmesi amaciyla saglanmaktadir.
Düzenlemelere ait modifikasyon ve varyasyonlarin ve burada
açiklamasi verilen detaylarin, teknikte uzman kisiler
tarafindan anlasilabilecegi açikça görülmektedir. Bu
dogrultuda, buradaki maksat, mevcut bulusun burada
düzenlemelerin açiklamasi ve izahati yoluyla sunulan spesifik
detaylar ile degil, yalnizca asagida belirtilen patent
istemlerinin kapsami ile sinirlandirilmasidir.
Claims (1)
- ISTEMLER m Bir ses örnekleri akisina (100) sahip bir ses sinyalinin enkode edilmesi için cihaz olup, bir tahmin analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen bir akisa bir tahmin kodlamasi analizi penceresi (200) uygulamak ve bir dönüsüm analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen akisa bir dönüsüm kodlamasi analiz penceresi (204) uygulamak üzere bir pencereleyici (102), burada dönüsüm kodlamasi analiz penceresi, ses örneklerine ait mevcut bir çerçeve içerisindeki ses örnekleriyle ve bir dönüsüm kodlamasi ileriye dönük kismi (206) olan ses örneklerine ait gelecek çerçevenin ön tanimlanmis bir kisminin ses örnekleri ile iliskilendirilmektedir, burada tahmin kodlamasi analiz penceresi ise mevcut çerçeveye ait ses örneklerinin en az bir kismi ile ve bir tahmin kodlamasi ileriye dönük kismi (208) olan gelecek çerçevenin ön tanimli bir kismina ait ses örnekleri ile iliskilendirilmektedir, burada. dönüsüm kodlamasi ileriye dönük kismi (206) ve tahmin kodlamasi ileriye dönük kismi (208) birbiriyle özdes veya birbirlerinden, tahmin kodlamasi ileriye dönük kisminin (208) %20'sinden daha az olacak sekilde veya dönüsüm kodlamasi ileriye dönük kisminin (206) tahmin analizi için pencerelenmis veriden faydalanmak suretiyle mevcut çerçeve için tahmin kodlanmis veri üretmekr için veya dönüsüm analizi için pencerelenmis veriden faydalanmak suretiyle mevcut çerçeve için dönüsüm kodlanmis veri üretmek için bir enkode etme islemcisi (104) içermektedir Istem 1'e göre cihaz olup, burada dönüsüm kodlamasi analiz penceresi (204), dönüsüm kodlamasi ileriye dönük kismi (206) içine dogru genisleyen örtüsmesiz bir kisim içermektedir. Isten 1 veya Istem 2'ye göre cihaz olup, burada dönüsüm kodlamasi analiz penceresi (204), mevcut çerçevenin basindan baslayan ve örtüsmesiz kismin (208) baslangicinda son bulan bir diger örtüsme kismini (210) içermektedir. Istem 1'e göre cihaz olup, burada pencereleyici (102), tahmin kodlamasindan dönüsüm› kodlamasina, bir çerçeveden bir sonraki çerçeveye olan geçis islemi için yalnizca bir baslama penceresi (220, 222) kullanmak üzere konfigüre edilmektedir ve burada baslama penceresi, bir çerçeveden bir sonraki çerçeveye, dönüsüm. kodlamasindan tahmin kodlamasina bir geçis için kullanilmamaktadir. Önceki istemlerden birine göre cihaz olup, ayrica asagidakileri içermektedir: mevcut çerçeve için enkode edilmis bir sinyali çiktilamak üzere bir çikis arayüzü (106) ve mevcut çerçeve için tahmin kodlanmis veriyi ya da dönüsüm kodlanmis veriyi çiktilamak üzere enkode etme islemcisinin (104) kontrol edilmesi için bir enkode etme modu seçicisi (112), burada enkode etme modu seçicisi (112), çerçevenin tamami için enkode edilmis sinyalin tahmin kodlanmis veriyi ya da dönüsüm kodlanmis veriyi içermesini saglamak üzere, çerçevenin tamami için yalnizca tahmin kodlamasi veya dönüsüm kodlamasi arasinda geçis yapmak üzere konfigüre edilmektedir. burada pencereleyici (102), tahmin kodlamasi analiz penceresine ek olarak, mevcut çerçevenin baslangicina yerlestirilen ses örnekleri ile iliskilendirilen ilave bir tahmin kodlamasi analiz penceresinden (202) faydalanmaktadir ve burada tahmin kodlamasi analiz penceresi (200) mevcut çerçevenin baslangicina yerlestirilmekte olan ses örnekleri ile iliskilendirilmemektedir. Önceki istemlerden birine göre cihaz olup, burada çerçeve, birden çok sayida alt çerçeveyi içermektedir, burada tahmin analiz penceresi (200) bir alt çerçevenin merkezine merkezlenmektedir ve burada dönüsüm kodlamasi analiz penceresi ise iki alt çerçeve arasindaki bir sinira merkezlenmektedir. Istem 7'ye göre cihaz olup, burada tahmin analiz penceresi (200) çerçeveye ait son alt çerçevenin merkezinde merkezlenmektedir, burada diger analiz penceresi (202) mevcut çerçeveye ait ikinci alt çerçevenin bir merkezinde merkezlenmektedir, burada dönüsüm kodlamasi analiz penceresi, mevcut çerçeveye ait üçüncü ve dördüncü alt çerçeve arasindaki bir sinirda merkezlenmektedir ve burada mevcut çerçeve, dört alt çerçeveye bölünmektedir. Önceki istemlerden birine göre cihaz olup, burada bir diger tahmin kodlamasi analiz penceresi (202), gelecek çerçeve dahilinde bir ileriye dönük kisma sahip degildir ve mevcut çerçeveye ait örnekler ile iliskilendirilmektedir. Önceki istemlerden birine göre cihaz olup, burada dönüsüm kodlamasi analiz penceresi ilaveten, dönüsüm kodlamasi analiz penceresinin zamansal açidan tani bir uzunlugunun, mevcut çerçevenin zamansal açidan uzunlugunun iki kati olabilmesi için pencerenin bir baslangicindan önce bir sifir kismi ve pencerenin sonunun arkasindan gelen bir sifir kismi içermektedir. Istem lO'a göre cihaz olup, burada tahmin kodlamasi modundan, dönüsüm kodlamasi moduna, bir çerçeveden bir sonraki çerçeveye olan bir geçis için pencereleyici (102) tarafindan bir geçis penceresi kullanilmaktadir, burada geçis penceresi, çerçevenin basindan baslayan bir birinci örtüsmesiz kismi ve örtüsmesiz kismin sonundan baslayan ve gelecek çerçeve içerisine uzanan bir örtüsme kismini içermektedir ve burada gelecek çerçeve içerisine uzanan örtüsme kismi, analiz penceresine ait dönüsüm kodlamasi ileriye dönük kisminin uzunlugu ile özdes bir uzunluga sahiptir. Önceki istemlerden birine göre cihaz olup, burada dönüsüm kodlamasi analiz penceresinin zamansal açidan bir uzunlugu, tahmin kodlamasi analiz penceresinin (200, 202) zamansal açidan uzunlugundan daha büyüktür. Önceki istemlerden birine göre cihaz olup, ayrica asagidakileri içermektedir: mevcut çerçeve için enkode edilmis bir sinyali çiktilamak üzere bir çikis arayüzü (106) ve mevcut çerçeve için tahmin kodlanmis veriyi ya da dönüsüm. kodlanmis veriyi çiktilamak. üzere enkode etme islemcisinin (104) kontrol edilmesi için bir enkode etme modu seçicisi (112), burada pencere (102), tahmin kodlamasi penceresinden önce, mevcut çerçeve içerisinde konumlu olan bir diger tahmin kodlamasi penceresini kullanmak 'üzere konfigüre edilmektedir ve burada enkode etme modu seçicisi (112), enkode etme islemcisini (104) kontrol etmek, dönüsüm kodlanmis verinin, çikis arayüzüne çiktilandigi durumda, yalnizca tahmin kodlamasi penceresinden türetilen ileriye dönük tahmin kodlamasi analiz verisini iletmek ve diger tahmin kodlamasi penceresinden türetilen tahmin kodlamasi analiz verisini iletmemek 'üzere konfigüre edilmektedir burada enkode etme modu seçicisi (112), enkode etme islemcisini (104) kontrol etmek, tahmin kodlamasi penceresinden türetilen tahmin kodlamasi analiz verisini iletmek ve tahmin kodlanmis verinin çikis arayüzüne çiktilandigi durumda, diger tahmin kodlamasi penceresinden türetilen tahmin kodlamasi analiz verisini iletmek üzere konfigüre edilmektedir. M.Önceki istemlerden birine göre cihaz olup, burada enkode etme islemcisi (104): bir tahmin analizi için pencerelenmis veriden (100a) mevcut çerçeve için tahmin kodlamasi verisini türetmek üzere bir tahmin kodlamasi analiz cihazi (302); tahmin kodlama verisinden faydalanarak mevcut çerçeve için ses örneklerinden filtre verisini hesaplamak için bir filtre asamasi (304) ve mevcut çerçeveler için tahmin kodlamasi parametrelerini hesaplamak üzere bir tahmin kodlayicisi parametre hesaplayicisi (306) içeren bir tahmin kodlamasi kolu ve dönüsüm kodlamasi algoritmasi için pencere verisinin spektral bir gösterime dönüstürmek üzere bir zaman-spektral dönüstürücü (310), agirliklandirilmis spektral veri elde etmek için tahmin kodlamasi verisinden türetilen agirliklandirilmis agirliklandirma verisinden faydalanarak spektral verileri agirliklandirmak üzere bir spektral agirliklandirici (312) ve mevcut çerçeve için dönüsüm kodlanmis veri elde etmek üzere, agirliklandirilmis spektral verinin islenmesi için bir spektral veri islemcisi (314) içeren bir dönüsüm ß.Bir ses örnekleri akisina (100) sahip bir ses sinyalinin enkode edilmesi için yöntem olup, bir tahmin analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen bir akisa bir tahmin kodlamasi analizi penceresinin (200) uygulanmasi ve bir dönüsüm analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen akisa bir dönüsüni kodlamasi analiz penceresinin (204) uygulanmasi (102), burada dönüsüm kodlamasi analiz penceresi, ses örneklerine ait mevcut bir çerçeve içerisindeki ses örnekleriyle ve bir dönüsüm kodlamasi ileriye dönük kismi (206) olan ses örneklerine ait gelecek çerçevenin ön tanimlanmis bir kisminin ses örnekleri ile iliskilendirilmektedir, burada tahmin kodlamasi analiz penceresi ise mevcut çerçeveye ait ses örneklerinin en az bir kismi ile ve bir tahmin kodlamasi ileriye dönük kismi (208) olan gelecek çerçevenin ön tanimli bir kismina ait ses örnekleri ile iliskilendirilmektedir, burada dönüsüm kodlamasi ileriye dönük kismi (206) ve tahmin kodlamasi ileriye dönük kismi (208) birbiriyle özdes veya birbirlerinden, tahmin kodlamasi ileriye dönük kisminin (208) %20'sinden daha az olacak sekilde veya dönüsüm kodlamasi ileriye dönük kisminin (206) %20'sinden daha az olacak sekilde farklidirlar ve tahmin analizi için olan pencerelenmis veriden faydalanarak mevcut çerçeve için tahmin kodlanmis verinin üretilmesi (104) veya dönüsüm analizi için olan pencerelenmis veriden faydalanarak mevcut çerçeve için dönüsüm kodlanmis verinin üretilmesi islem adimlarini içermektedir. 1& Istem 15'e göre bir ses sinyalinin enkode edilmesi için olan yöntemin bir bilgisayar üzerinde çalistirildiginda gerçeklestirilmesi için bir program koduna sahip bilgisayar programidir.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
PCT/EP2012/052450 WO2012110473A1 (en) | 2011-02-14 | 2012-02-14 | Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion |
Publications (1)
Publication Number | Publication Date |
---|---|
TR201908598T4 true TR201908598T4 (tr) | 2019-07-22 |
Family
ID=71943595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TR2019/08598T TR201908598T4 (tr) | 2011-02-14 | 2012-02-14 | Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. |
Country Status (19)
Country | Link |
---|---|
US (1) | US9047859B2 (tr) |
EP (3) | EP3503098B1 (tr) |
JP (1) | JP6110314B2 (tr) |
KR (2) | KR101698905B1 (tr) |
CN (2) | CN103503062B (tr) |
AR (3) | AR085221A1 (tr) |
AU (1) | AU2012217153B2 (tr) |
BR (1) | BR112013020699B1 (tr) |
CA (1) | CA2827272C (tr) |
ES (1) | ES2725305T3 (tr) |
MX (1) | MX2013009306A (tr) |
MY (1) | MY160265A (tr) |
PL (1) | PL2676265T3 (tr) |
PT (1) | PT2676265T (tr) |
SG (1) | SG192721A1 (tr) |
TR (1) | TR201908598T4 (tr) |
TW (2) | TWI479478B (tr) |
WO (1) | WO2012110473A1 (tr) |
ZA (1) | ZA201306839B (tr) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9972325B2 (en) | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
EP2927905B1 (en) | 2012-09-11 | 2017-07-12 | Telefonaktiebolaget LM Ericsson (publ) | Generation of comfort noise |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
FR3011408A1 (fr) * | 2013-09-30 | 2015-04-03 | Orange | Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard |
EP3000110B1 (en) * | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
FR3024582A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Gestion de la perte de trame dans un contexte de transition fd/lpd |
FR3024581A1 (fr) * | 2014-07-29 | 2016-02-05 | Orange | Determination d'un budget de codage d'une trame de transition lpd/fd |
KR102413692B1 (ko) * | 2015-07-24 | 2022-06-27 | 삼성전자주식회사 | 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치 |
KR102192678B1 (ko) | 2015-10-16 | 2020-12-17 | 삼성전자주식회사 | 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치 |
SG11201806246UA (en) | 2016-01-22 | 2018-08-30 | Fraunhofer Ges Forschung | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
US10249307B2 (en) * | 2016-06-27 | 2019-04-02 | Qualcomm Incorporated | Audio decoding using intermediate sampling rate |
WO2020089215A1 (en) * | 2018-10-29 | 2020-05-07 | Dolby International Ab | Methods and apparatus for rate quality scalable coding with generative models |
US11955138B2 (en) * | 2019-03-15 | 2024-04-09 | Advanced Micro Devices, Inc. | Detecting voice regions in a non-stationary noisy environment |
Family Cites Families (126)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG70558A1 (en) | 1991-06-11 | 2000-02-22 | Qualcomm Inc | Variable rate vocoder |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
CN1090409C (zh) | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | 采用不同编码原理的传送系统 |
US5537510A (en) | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
JPH10124092A (ja) | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) * | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
JPH10276095A (ja) * | 1997-03-28 | 1998-10-13 | Toshiba Corp | 符号化器及び復号化器 |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
FI114833B (fi) * | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
JP2003501925A (ja) | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
DE60031002T2 (de) | 2000-02-29 | 2007-05-10 | Qualcomm, Inc., San Diego | Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US7901873B2 (en) | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
DE60303689T2 (de) | 2002-09-19 | 2006-10-19 | Matsushita Electric Industrial Co., Ltd., Kadoma | Audiodecodierungsvorrichtung und -verfahren |
US7343283B2 (en) * | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
JP4191503B2 (ja) * | 2003-02-13 | 2008-12-03 | 日本電信電話株式会社 | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
WO2005043511A1 (en) | 2003-10-30 | 2005-05-12 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
EP1852851A1 (en) | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
CA2566368A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding frame lengths |
US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
WO2006079349A1 (en) | 2005-01-31 | 2006-08-03 | Sonorit Aps | Method for weighted overlap-add |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
NZ562183A (en) | 2005-04-01 | 2010-09-30 | Qualcomm Inc | Systems, methods, and apparatus for highband excitation generation |
EP1899958B1 (en) | 2005-05-26 | 2013-08-07 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
PL1897085T3 (pl) | 2005-06-18 | 2017-10-31 | Nokia Technologies Oy | System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy |
KR100851970B1 (ko) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
CN101371295B (zh) | 2006-01-18 | 2011-12-21 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
US20090281812A1 (en) | 2006-01-18 | 2009-11-12 | Lg Electronics Inc. | Apparatus and Method for Encoding and Decoding Signal |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
US7873511B2 (en) * | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
EP2044575B1 (en) | 2006-07-24 | 2017-01-11 | Sony Corporation | A hair motion compositor system and optimization techniques for use in a hair/fur graphics pipeline |
US7987089B2 (en) * | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
BR122019024992B1 (pt) | 2006-12-12 | 2021-04-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo |
FR2911227A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) * | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101513028B1 (ko) * | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) * | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
PT3550564T (pt) | 2007-08-27 | 2020-08-18 | Ericsson Telefon Ab L M | Análise/síntese espectral de baixa complexidade utilizando resolução temporal selecionável |
JP5264913B2 (ja) | 2007-09-11 | 2013-08-14 | ヴォイスエイジ・コーポレーション | 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置 |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
ES2657393T3 (es) * | 2008-07-11 | 2018-03-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y descodificador de audio para codificar y descodificar muestras de audio |
PL2346030T3 (pl) | 2008-07-11 | 2015-03-31 | Fraunhofer Ges Forschung | Koder audio, sposób kodowania sygnału audio oraz program komputerowy |
JP5369180B2 (ja) * | 2008-07-11 | 2013-12-18 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ |
RU2621965C2 (ru) | 2008-07-11 | 2017-06-08 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
WO2010003532A1 (en) | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
BRPI0914056B1 (pt) | 2008-10-08 | 2019-07-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Esquema de codificação/decodificação de áudio comutado multi-resolução |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
CN102334160B (zh) * | 2009-01-28 | 2014-05-07 | 弗劳恩霍夫应用研究促进协会 | 音频编码器,音频解码器,编码和解码音频信号的方法 |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
US8805694B2 (en) | 2009-02-16 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
PL2234103T3 (pl) | 2009-03-26 | 2012-02-29 | Fraunhofer Ges Forschung | Urządzenie i sposób manipulacji sygnałem audio |
CA2763793C (en) | 2009-06-23 | 2017-05-09 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
MX2012004593A (es) | 2009-10-20 | 2012-06-08 | Fraunhofer Ges Forschung | Codec multimodo de audio y codificacion de celp adaptada a este. |
JP5243661B2 (ja) * | 2009-10-20 | 2013-07-24 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム |
CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
WO2011147950A1 (en) | 2010-05-28 | 2011-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low-delay unified speech and audio codec |
ES2710554T3 (es) * | 2010-07-08 | 2019-04-25 | Fraunhofer Ges Forschung | Codificador que utiliza cancelación del efecto de solapamiento hacia delante |
-
2012
- 2012-02-14 JP JP2013553900A patent/JP6110314B2/ja active Active
- 2012-02-14 WO PCT/EP2012/052450 patent/WO2012110473A1/en active Application Filing
- 2012-02-14 TR TR2019/08598T patent/TR201908598T4/tr unknown
- 2012-02-14 KR KR1020137024191A patent/KR101698905B1/ko active IP Right Grant
- 2012-02-14 TW TW101104674A patent/TWI479478B/zh active
- 2012-02-14 EP EP19157006.8A patent/EP3503098B1/en active Active
- 2012-02-14 BR BR112013020699-3A patent/BR112013020699B1/pt active IP Right Grant
- 2012-02-14 CA CA2827272A patent/CA2827272C/en active Active
- 2012-02-14 MY MYPI2013701417A patent/MY160265A/en unknown
- 2012-02-14 TW TW103134393A patent/TWI563498B/zh active
- 2012-02-14 KR KR1020167007581A patent/KR101853352B1/ko active IP Right Grant
- 2012-02-14 CN CN201280018282.7A patent/CN103503062B/zh active Active
- 2012-02-14 ES ES12707050T patent/ES2725305T3/es active Active
- 2012-02-14 MX MX2013009306A patent/MX2013009306A/es active IP Right Grant
- 2012-02-14 AU AU2012217153A patent/AU2012217153B2/en active Active
- 2012-02-14 PL PL12707050T patent/PL2676265T3/pl unknown
- 2012-02-14 CN CN201510490977.0A patent/CN105304090B/zh active Active
- 2012-02-14 EP EP23186418.2A patent/EP4243017A3/en active Pending
- 2012-02-14 AR ARP120100475A patent/AR085221A1/es active IP Right Grant
- 2012-02-14 EP EP12707050.6A patent/EP2676265B1/en active Active
- 2012-02-14 SG SG2013060991A patent/SG192721A1/en unknown
- 2012-02-14 PT PT12707050T patent/PT2676265T/pt unknown
-
2013
- 2013-08-14 US US13/966,666 patent/US9047859B2/en active Active
- 2013-09-11 ZA ZA2013/06839A patent/ZA201306839B/en unknown
-
2014
- 2014-11-27 AR ARP140104448A patent/AR098557A2/es active IP Right Grant
-
2015
- 2015-11-09 AR ARP150103655A patent/AR102602A2/es active IP Right Grant
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TR201908598T4 (tr) | Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. | |
CA2730195C (en) | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal | |
RU2485606C2 (ru) | Схема кодирования/декодирования аудио сигналов с низким битрейтом с применением каскадных переключений | |
AU2009267466B2 (en) | Audio encoder and decoder for encoding and decoding audio samples | |
EP2676268B1 (en) | Apparatus and method for processing a decoded audio signal in a spectral domain | |
AU2013200679B2 (en) | Audio encoder and decoder for encoding and decoding audio samples | |
RU2574849C2 (ru) | Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра | |
ES2963367T3 (es) | Aparato y procedimiento de decodificación de una señal de audio usando una parte de anticipación alineada | |
EP3002751A1 (en) | Audio encoder and decoder for encoding and decoding audio samples |