TR201908598T4 - Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. - Google Patents

Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. Download PDF

Info

Publication number
TR201908598T4
TR201908598T4 TR2019/08598T TR201908598T TR201908598T4 TR 201908598 T4 TR201908598 T4 TR 201908598T4 TR 2019/08598 T TR2019/08598 T TR 2019/08598T TR 201908598 T TR201908598 T TR 201908598T TR 201908598 T4 TR201908598 T4 TR 201908598T4
Authority
TR
Turkey
Prior art keywords
coding
window
frame
data
analysis
Prior art date
Application number
TR2019/08598T
Other languages
English (en)
Inventor
Ravelli Emmanuel
Geiger Ralf
Schnell Markus
Fuchs Guillaume
Ruoppila Vesa
Bäckström Tom
Grill Bernhard
Helmrich Christian
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TR201908598T4 publication Critical patent/TR201908598T4/tr

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Algebra (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Abstract

Mevcut buluş, dekode edilmiş bir ses sinyalinin (100) işlenmesi için bir cihaz olup, filtrelenmiş bir ses sinyali (104) elde etmek için dekode edilmiş ses sinyalini filtrelemek üzere bir filtre (102), dekode edilmiş ses sinyalinin ve filtrelenmiş ses sinyalinin, her bir spektral gösterimin birden çok sayıda alt bant sinyallerine sahip olduğu ilgili spektral gösterimlere dönüştürülmesi için bir zaman-spektral dönüştürücü aşaması (106), ağırlıklandırılmış ve filtrelenmiş bir ses sinyali elde etmek için alt bant sinyallerini ilgili ağırlıklandırma katsayıları ile çarpmak suretiyle filtrelenmiş ses sinyalinin frekans seçmeli ağırlıklandırma işlemini gerçekleştirmek üzere bir ağırlıklandırıcı (108), ağırlıklandırılmış ve filtrelenmiş ses sinyali ve dekode edilmiş ses sinyalinin spektral gösterimi arasında bir alt bantsal çıkarma işlemi gerçekleştirmek üzere bir çıkarıcı (112), işlenmiş ve dekode edilmiş bir ses sinyali (116) elde etmek için neticede elde edilen ses sinyali veya neticede elde edilen ses sinyalinden türetilen bir sinyali zaman bölgesi gösterimine dönüştürmek üzere bir spektral-zaman dönüştürücüsü (114) içermektedir.

Description

TARIFNAME BIR SES SINYALININ HIZALI BIR ILERIYE DÖNÜK KISIMDAN EAYDALANILARAK ENKODE EDILMESI IÇIN CIHAZ VE YÖNTEM Mevcut bulus, ses kodlamasina iliskin olup, özellikle de düsük gecikmeli uygulamalar için kullanima uygun olan anahtarlamali ses enkoderlerine dayanan ses kodlamasina ve buna bagli olarak kontrol edilen ses dekoderlerine iliskindir.
Anahtarlamali kodeklere dayanan pek çok ses kodlamasi konsepti bilinmektedir. Bunlar arasinda yaygin olarak bilinen ses 03)'de de açiklandigi üzere, Genisletilmis Uyarlamali Çoklu Hiz Genisbant (AMR-WB+) kodegi olarak bilinen konsepttir. Söz konusu AMR-WB+ ses kodegi, 1'den 9'a kadar olan tüm AMR-WB konusma kodegi modlarinin yani sira, AMR-WB, VAD ve DTX'i içermektedir. AMR-WB+, AMR-WB kodegini, TCX, bant genisligi uzantisi ve stereo'yu eklemek suretiyle genisletmektedir.
Söz konusu olan AMR-WB+ ses kodegi, iç örnekleme frekansi FS dahilinde olan, 2048 örnege esit giris çerçevelerini araliginda sinirlandirilmaktadir. 2048 örnekli çerçeveler, dönüsül olarak örneklenmis iki esit frekans bandina bölünmektedir. Bu durum, düsük frekans (LF) ve yüksek frekans (HF) bantlarina karsilik gelen iki adet 1024 örneklik üstün çerçeve meydana getirmektedir. Her bir üstün çerçeve, dört adet 256 örneklik çerçeveye bölünmektedir. Iç örnekleme hizindaki örnekleme, giris sinyalini yeniden örnekleyen, degisken bir örnekleme dönüstürme düzeni kullanilarak elde edilmektedir.
Bunun akabinde, düsük frekans (LF) ve yüksek frekans (HF) sinyalleri iki farkli yaklasimdan faydalanilarak enkode edilmektedir; düsük frekans (LF) anahtarlanmis ACELP ve dönüsüm kodlamasi uyarimina (TCX) dayali olan "çekirdek" enkoder/dekoder kullanilarak enkode ve dekode edilmektedir.
ACELP modunda, standart AMR-WB kodegi kullanilmaktadir. Yüksek frekans (HF) sinyali, göreceli olarak. çok daha. az bit (16 bit/çerçeve) ile bir bant genisligi uzatma (BWE) yöntemi kullanilarak enkode edilmektedir. Enkoderden dekodere iletilen parametreler; mod seçim bitleri, düsük frekans (LF) parametreleri ve yüksek frekans (HF) parametreleridir. 1024 örneklik her bir üstün çerçeve için olan parametreler, birbirine özdes boyuta sahip olan dört paket hâlinde olacak sekilde ayristirilmaktadir. Giris sinyalinin stereo oldugu durumlarda, stereo enkode etme islemi, her iki giris kanalini da alirken, sol ve sag kanallar ACELP/TCX enkode etme islemi için tek bir mono sinyalde birlestirilmektedir. Dekoder tarafinda, düsük frekans (LF) ve yüksek frekans (HF) bantlari birbirinden ayri olarak dekode edilmekte ve bunun ardindan bir sentez filtre bankasi dahilinde birlestirilmektedir. Sayet çikis sadece mono olacak sekilde kisitlanmakta ise bu durumda stereo parametreleri çikartilmakta ve dekoder mono modunda çalismaktadir. AMR-WB+ kodegi, düsük frekans (LF) sinyalini enkode ederken, ACELP ve TCX modlarindan her ikisi için de LP analizi uygulamaktadir. Lineer tahmin (LP) katsayilari, her 64 örneklik alt çerçeve de lineer olarak ara degerlenmektedir. LP analizi penceresi, 384 örneklik uzunlugun bir yarim kosinüsüdür. Çekirdek mono sinyalin enkode edilmesi için her bir çerçevede bir ACELP veya TCX kodlamasi kullanilmaktadir.
Kodlama modu, bir kapali döngü sentez yoluyla analiz yöntemine dayali olarak seçilmektedir. ACELP çerçeveleri için sadece 256 örneklik çerçeveler ise TCX modunda mümkün olmaktadir. AMR-WB+ dahilinde LPC analizi için kullanilan pencere, sekil Sb'de gösterilmektedir. 20 ms'lik ileriye dönüklügü. olan simetrik bir LPC analiz penceresinden faydalanilmaktadir. Burada söz konusu olan ileriye dönüklük hususu, sekil 5b'de de gösterildigi üzere, 500 ile gösterilen mevcut çerçeve için olan LPC analizi penceresinin, yalnizca sekil 5b üzerinde 502 ile gösterilen, 0 ve 20 ms'lik araliktaki mevcut çerçeve dahilinde degil, gelecek çerçeve içerisinde 20 ve 40 Hß'lik süreler arasinda da uzanmakta oldugu anlamina gelmektedir.
Bunun anlami, söz konusu olan bu LPC analiz penceresinden faydalanilmasi suretiyle, 20 ms'lik ilave bir gecikme, diger bir deyisle, gelecek bir çerçevenin tamami gerekli hâle gelmektedir. Dolayisiyla, sekil 5b üzerinde 504 ile gösterilen ileriye dönük kisim, AMR-WB+ enkoderi ile iliskilendirilen sistematik gecikmeye katkida bulunmaktadir. Bir baska deyisle, mevcut çerçeveye 502 iliskin LPC analiz katsayilarinin hesaplanabilmesi için ilerideki bir çerçevenin tamamen kullanilabilir olmasi gerekmektedir.
Sekil 5a'da diger bir enkoder, AMR-WB olarak adlandirilan kodlayici ve özellikle de mevcut çerçeveye iliskin analiz katsayilarinin hesaplanmasi için kullanilan LPC analiz penceresi gösterilmektedir. Bir kez daha mevcut çerçeve, 0 ve ms arasinda uzamakta ve gelecek çerçeve ise 20 ve 40 ms'lik süreç araliginda uzamaktadir. Sekil 5b'nin aksine, 506 ile gösterilen AMR-WB'ye ait LPC analiz penceresi, yalnizca 5 ms'lik ileriye dönük bir kisma 508, diger bir deyisle, 20 ms ve 25 ms araliginda bir zaman mesafesine sahiptir.
Dolayisiyla, LPC analizinin neden oldugu gecikme, sekil 5a'ya iliskin olarak önemli ölçüde azaltilmaktadir. Bununla birlikte, öte yandan, LPC katsayilarinin belirlenmesi için olan daha büyük bir ileriye dönük kismin, bir baska deyisle, daha büyük bir ileriye dönük kismin, LPC analiz penceresi için daha iyi LPC katsayilarini ve buna bagli olarak, artik sinyalde daha küçük bir enerjiyi ve dolayisiyla, daha düsük bir bit hizini ortaya çikardigi bulunmustur.
Sekiller 5a ve 5b bir çerçeve için LPC katsayilarinin belirlenmesi hususunda yalnizca tek bir analiz penceresine sahip olan enkoderlere iliskin iken, Sekil 5c ise G.718 konusma kodlayicisi için olan durumu göstermektedir. G.7l8 (06-2008) spesifikasyonu, iletim sistemlerine, medya dijital sistemlerine ve aglarina iliskin olup, özellikle de dijital terminal ekipmanlarini. ve bilhassa, bu türden bir ekipman için konusma ve ses sinyalllerinin bir kodlamasini açiklamaktadir. Bu standart özellikle, ITU-T G7l8 tavsiye kararinda tanimlandigi üzere, 8 ila 32 kbit/s dahilinde konusma. ve sesin dayanikli dar bant ve genis bant gömülü degisken bit hizi kodlamasina iliskindir. Giris sinyali, 20 ms'lik çerçevelerden faydalanilmasi suretiyle islenmektedir.
Kodek gecikmesi, giris ve çikisa ait olan örnekleme hizina baglidir. Bir genis bant girisi ve bir genis bant çikisi için söz konusu olan bu kodlamanin genel algoritmik gecikmesi 42.875 ms'dir. Yüksek katmanli dönüsüm kodlamasina ait örtüsme eklemeli islemin gerçeklestirilmesine olanak saglamak için bir 20 ms'lik çerçeve, 1.875 ms'lik giris ve çikis yeniden örnekleme filtreleri, enkoder için 10 ms'lik ileriye dönüklük, bir ms'lik art filtreleme gecikmesi ve dekoderde lO ms'lik gecikmeden meydana gelmektedir. Bir dar bant girisi ve bir dar bant çikisi için daha yüksek katmanlar kullanilmamaktadir, ancak bununla birlikte, müzik sinyalleri için ve çerçeve silintilerinin mevcudiyetinde kodlama performansinin gelistirilebilmesi için 10 ms'lik dekoder gecikmesinden faydalanilmaktadir. Sayet çikis, katman 2'ye sinirlandirilmakta ise C) hâlde kodek gecikmesi lO Ins kadar azaltilabilmektedir. Enkodere iliskin açiklama asagida belirtildigi gibidir. Daha altta olan iki katman, 12.8 kHz'te örneklenmis ön vurgulanan bir sinyale uygulanmaktadir ve daha üstteki üç katman ise 16 kHz'te örneklenen giris sinyali bölgesi dahilinde çalismaktadir. Çekirdek katman, kod uyarimli lineer tahmin (CELP) teknolojisine dayanmakta olup, söz konusu olan bu teknolojide sinyal, spektral zarfi izafeten bir lineer tahmin (LP) sentez filtresinden geçirilen bir uyarim sinyali vasitasiyla modellenmektedir. LP filtresi, anahtarlanan bir tahminsel yaklasini ve çok asamali vektör kuantizasyonundan faydalanilarak, emitans spektral frekansi (ISF) bölgesinde kuantize edilmektedir. Açik döngü perde analizi, pürüzsüz bir perde konturunun elde edilebilmesi için perde izleyen bir algoritma kullanilarak gerçeklestirilmektedir. Kesisim hâlinde olan iki perde gelisim konturu karsilastirilmakta ve perde tahmininin daha dayanikli hâle getirilebilmesi için daha düzgün kontur meydana getiren iz seçilmektedir. Çerçeve seviyesi ön islemesi; bir yüksek geçirim filtrelemesi, saniye basina 12800 örnek için bir örnekleme dönüstürme, bir ön vurgulama, bir spektral analiz, dar bant girislerinin bir tespiti, bir ses aktiflik tespiti, bir gürültü tahmini, gürültü azaltma islemi, lineer tahmin analizi, LP'den ISF'e dönüstürme islemi ve bir ara degerleme, agirliklandirilmis bir konusma sinyalinin bir hesaplamasi, bir açik döngü perde analizi, bir arka plan gürültü güncellemesi, bir kodlama modunun seçilmesi için bir sinyal siniflandirmasi ve çerçeve silinti gizlemesi islemlerini içermektedir. Seçilen enkode etme tipinden faydalanan katman l enkode etme islemi ise ünsüz bir kodlama modu, sesli bir kodlama modu, bir geçis kodlama modu, bir genel kodlama modu ve bir süreksiz iletim ve sessizlik giderici ton üretimi (DTX/CNG) içermektedir.
Oto-korelasyon yaklasimindan faydalanan uzun süreli bir tahmin veya lineer tahmin (LP) analizi, CELP modeline ait sentez filtresinin katsayilarini belirlemektedir. Bununla birlikte, CELP'de, uzun süreli tahmin genellikle "uyarlamali kod çizelgesi" oldugundan, lineer tahminden de farkli olmaktadir.
Dolayisiyla lineer tahmin, daha ziyade kisa süreli bir tahmin olarak. düsünülebilmektedir. Pencerelenmis konusmaya ait oto korelasyon, Levinson-Durbin algoritmasindan faydalanilmasi suretiyle LP katsayilarina dönüstürülmektedir. Bunun ardindan LPC katsayilari, emitans spektral çiftlerine (ISP) dönüstürülmekte olup, nihayetinde kuantizasyon ve ara degerleme amaçlari için emitans spektral frekanslarina (ISF) dönüstürülmektedir. Ara degerlenmis, kuantize edilmis ve kuantizasyonu geri alinmis katsayilari ise her bir alt çerçeve için sentez ve agirliklandirma filtrelerini yapilandirmak üzere LP bölgesine geri dönüstürülmektedir. Aktif bir sinyal çerçevesinin enkode edilmesi durumunda ise iki set LP katsayisi, Sekil 5c üzerinde 510 ve 512 ile gösterilen iki LPC analiz penceresinden faydalanilarak her bir çerçevede hesaplanmaktadir. Pencere 512, "orta çerçeve LPC penceresi" olarak ve pencere 510 ise "son çerçeve LPC penceresi" olarak adlandirilmaktadir. 10 ms'lik bir ileriye dönük kisim 514, çerçeve sonu oto-korelasyon hesaplamasi için kullanilmaktadir. Çerçeve yapisi, Sekil 5c üzerinde gösterilmektedir. Çerçeve, dört alt çerçeveye bölünmekte olup, söz konusu olan her bir alt çerçeve, 12.8 kHz'lik bir örnekleme hizinda 64 örnege karsilik gelen 5 ms'lik bir uzunluga sahiptir. Çerçeve sonu analizi ve orta çerçeve analizi için olan pencereler, Sekil 5c'de de gösterildigi üzere sirasiyla dördüncü alt çerçevede ve ikinci alt çerçevede merkezlenmektedir. 320 örneklik uzunluga sahip bir Hamming penceresi, pencereleme islemi için kullanilmaktadir. Katsayilar, G.7l8 Bölüm 6.4.l'de tanimlanmaktadir. Oto-korelasyon hesaplamasi ise Bölüm 6.4.2'de açiklanmaktadir. Levinson-Durbin› algoritmasi, Bölüm 6.4.3'te, LP-ISP dönüstürmesi, Bölüm 6.4.4'te ve ISP-LP dönüstürmesi ise Bölüm 6.4.5'te açiklanmaktadir.
Uyarlamali kod çizelgesi gecikme ve kazanimi, cebirsel kod çizelgesi endeksi ve kazanimi gibi konusma enkode etme parametreleri, algisal olarak agirliklandirilmis bölgedeki giris sinyali ve sentezlenmis sinyal arasindaki hatanin en aza indirgenmesi suretiyle arastirilmaktadir. Algisal olarak agirliklandirma islemi, sinyalin, LP filtresi katsayilarindan türetilen algisal bir agirliklandirma filtresi yordamiyla filtrelenmesi islemi yapilarak gerçeklestirilmektedir.
Algisal olarak agirliklandirilmis sinyal ayrica, açik döngü perde analizinde de kullanilmaktadir.
G.718 enkoderi, yalnizca tekil konusma kodlama moduna sahip olan ari bir konusma kodlayicisidir. Bu nedenle G.7l8 enkoderi anahtarlanan bir enkoder degildir` ve dolayisiyla, söz konusu olan bu enkoder çekirdek katman dahilinde yalnizca tekil bir konusma kodlamasi modu sagladigi için avantajli olmamaktadir. Bu nedenle söz konusu olan bu kodlayicinin konusma sinyallerinden ziyade diger sinyallere uygulandigi durumlarda, diger bir deyisle, CELP enkode etme isleminin arkasinda bulunan modelin uygun olmadigi genel ses sinyallerine uygulandigi durumlarda kalite ilgili sorunlara meydana gelecektir.
Bir diger anahtarlamali kodek, USAC kodegi olarak adlandirilan kodektir, bir baska deyisle, 24 Eylül 2010 tarihli ISO/IEC CD 23003-3'te tanimlanan birlestirilmis konusma ve ses kodegidir. Söz konusu olan bu anahtarlamali kodek için kullanilan LPC analiz penceresi Sekil 5d üzerinde 5l6 ile gösterilmektedir. Yine, 0 ila 20 ms araliginda genisleyen mevcut bir çerçeve varsayilmakta olup, bu nedenle bu kodege ait olan ileriye dönük kisini 618, 20 ms olarak görülmektedir, bir baska deyisle, G.7l8'de yer alan ileriye dönük kisimdan çok daha yüksektir. Dolayisiyla, her ne kadar USAC enkoderi, anahtarlamali dogasi sayesinde iyi ses kalitesi sagliyor olsa da Sekil 5d üzerinde gösterilen LPC analiz penceresinin ileriye dönük kismi 518 nedeniyle önemli oranda gecikme ortaya koymaktadir. USAC'ye ait olan genel yapi asagida belirtildigi gibidir. Öncelikle, stereo veya çok kanalli islemenin idare edilebilmesi için bir MPEG surround (MPEGS) islevsel biriminden meydana gelen ortak bir ön/ard isleme ve giris sinyali dahilinde daha yüksek ses frekansinin parametrik gösterimini idare eden gelistirilmis bir SBR (eSBR) birimi bulunmaktadir. Bunun ardindan, birinin degistirilmis ileri düzeyde bir ses kodlamasi (AAC) takim yolundan ve digerinin ise lineer tahmin kodlamasi (LP veya LPC bölgesi) tabanli bir yoldan meydana geldigi ve karsiliginda LPC artigina ait bir frekans bölgesi gösterimi veya bir zaman bölgesi gösterimi özelligine sahip oldugu iki kol gelmektedir. AAC ve LPC'den her ikisi için de iletilen tüm spektrumlar, kuantizasyon ve aritmetik kodlama islemlerinin ardindan MDCT bölgesinde gösterilmektedir. Zaman bölgesi gösterimi, bir ACELP uyarim kodlama düzeninden faydalanmaktadir. ACELP araci, uzun süreli bir tahminci (uyarlamali kod sözcügü) ile bir darbe benzeri diziyi (yenilik kod sözcügü) birlestirmek suretiyle bir zaman bölgesi uyarim sinyalini etkin bir sekilde göstermek üzere bir yol saglamaktadir. Yeniden yapilandirilan uyarim, bir zaman bölgesi sinyalinin olusturulabilmesi için bir LP sentez filtresi kanali ile gönderilmektedir. ACELP aracina yapilan giris, uyarlamali ve yenilik kod çizelgesi endekslerini, uyarlamali ve yenilik kodlarina ait kazanim degerlerini, diger kontrol verilerini ve ters kuantize edilen ve ara degerlenen LPC filtresi katsayilarini içermektedir. ACELP aracindan alinan çikis ise zaman bölgesinde yeniden yapilandirilan ses sinyali olmaktadir.
MDCT tabanli TCX dekode etme araci, agirliklandirilmis LP artik gösterimini, MDCT bölgesinden, bir zaman bölgesi sinyaline döndürmek için kullanilmakta olup, agirliklandirilmis LP sentez filtrelemesini de içeren agirliklandirilmis zaman bölgesi sinyalini çiktilamaktadir. destekleyecek biçimde konfigüre edilebilmektedir. TCX aracina yapilan giris, (ters kuantize edilen) MDCT spektrumlarini ve ters kuantize edilen ve ara degerlenen LPC filtre katsayilarini içermektedir. TCX aracindan alinan çikis ise zaman bölgesinde yeniden yapilandirilan ses sinyali olmaktadir.
Sekil 6, USAC'de mevcut olan bir durumu göstermekte olup, söz konusu olan durumda mevcut çerçeve ve 520 için olan LPC analiz pencereleri 516, geçmis veya son çerçeve için çizilmekte ve ilaveten TCX penceresi 522 gösterilmektedir. TCX penceresi 522, 0 ve 20 ms'ler arasinda genisleyen mevcut çerçevenin merkezinde ortalanmakta olup, geçmis çerçeve içerisine 10 ms'lik bir süre ile genislemekte 've 20 ila 40 Ins arasinda genisleyen gelecek çerçeve içerisine ise 10 ms'lik bir süre ile genislemektedir. Dolayisiyla, TCX analiz penceresi ilaveten 20 ve 30 nß'ler arasinda gelecek çerçeve içerisine genisleyen ileriye dönük bir kisma sahip iken, LPC analiz penceresi 516, 20 ve 40 ms'ler arasinda, diger bir deyisle 20 ms, ileriye dönük bir LPC kismi gerektirmektedir. Bunun anlami, USAC analiz penceresinin 516 neden oldugu gecikme 20 ms iken, TCX penceresinin enkoderde neden oldugu gecikmenin ise 10 ms oldugudur. Dolayisiyla, her iki türde de olan pencerelere ait ileriye dönük kismin birbirine hizali olmadigi netlik kazanmaktadir. Bu nedenle, her ne kadar TCX penceresi 522, 10 ms'lik bir gecikmeye neden oluyor olsa dahi enkodere ait gecikmenin tamami, LPC analiz penceresi 516 nedeniyle 20 ms olmaktadir. Dolayisiyla, her ne kadar TCX penceresi için oldukça küçük bir ileriye dönük kisim mevcut olsa da bu durum enkodere ait algoritmik gecikmeyi azaltmamaktadir, zira toplam gecikme en yüksek katki tarafindan belirlenmektedir, diger bir deyisle, gelecek çerçeve içerisine 20 ms'lik bir süre ile genisleyen LPC analiz penceresi 516 nedeniyle 20 Hß'ye esit olmaktadir, bir baska deyisle, yalnizca mevcut çerçeveyi degil ayni zamanda ilaveten gelecek çerçeveyi de kapsamaktadir.
B. Besette ve Meslektaslari tarafindan hazirlanan "Universal Speech/Audio Coding using Hybrid ACELP/TCX Techniques" (ICASSP sayfalarinda, bir LP tabanli kodlama teknigini ve daha genel bir dönüsüm kodlamasi teknigini entegre eden hibrit bir ses kodlamasi algoritmasindan bahsedilmektedir. ACELP ve TCX modlari, her ikisinin de LP analizine ve uyarim kodlamasina dayali olacagi bir biçimde entegre edilmektedir. ACELP'de uyarim, uyarim bölgesinde aralikli bir kod çizelgesinden faydalanilarak enkode edilmektedir, bununla birlikte TCX'te ise kod Çizelgesi hedef dahilinde veya agirliklandirilmis sinyalde ya da bölgede bulunmaktadir. LP analizi, bir sonraki çerçeve dahilinde bulunan birinci 5 ms'lik alt çerçevenin ortasinda pozisyonlandirilmis yarim sinüs bir pencereden faydalanilarak her 20 ms'de bir gerçeklestirilmektedir. 80 ms'lik TCX çerçevesine ait olan bir sonraki çerçeve içerisindeki bir ileriye dönük kisma karsilik gelen pencereye ait sag kisim içerisindeki bir örtüsme süresinin, AMR-WB'deki 12.8 kHz'lik bir iç örnekleme hizindan ötürü 10 ms'lik süreye karsilik gelen 128 örnege esit oldugu 20 ms'lik bir TCX çerçevesi, 40 ms'lik bir TCX çerçevesi veya 80 ms'lik. bir uzunluga sahip olan bir TCX çerçevesi mümkün olmaktadir.
Dolayisiyla mevcut bulusun bir amaci, ses kodlamasi veya dekode edilmesi için bir taraftan iyi ses kalitesi saglayan ve diger taraftan ise azaltilmis gecikme sonucu veren gelistirilmis bir kodlama konsepti saglamaktir.
Söz konusu olan bu amaca, Istem l'e göre bir ses sinyalinin enkode edilmesi için olan bir cihaz, Istem 15'e göre bir ses sinyalinin enkode edilmesi için bir yöntem veya Istem l6'ya göre bir bilgisayar programi vasitasiyla ulasilmaktadir.
Mevcut bulusa göre, bir dönüsüm kodlamasi koluna ve bir tahmin kodlamasi koluna sahip olan anahtarlamali bir ses kodegi düzeni uygulanmaktadir. Önemli bir biçimde, iki türden pencere, diger bir deyisle, bir tarafta tahmin kodlamasi analiz penceresi ve diger tarafta ise dönüsüm kodlamasi analiz penceresi dönüsüm kodlamasina ait ileriye dönük kismin ve tahmin kodlamasina ait ileriye dönük kismin birbirlerine özdes veya tahmin kodlamasina ait ileriye dönük kismin kismin %ZO'sinden daha az olacak sekilde birbirlerinden farkli olabilmeleri için ileriye dönük kisimlarina iliskin olarak hizalanmaktadir. Tahmin analizi penceresinin yalnizca tahmin kodlamasi kolunda degil, her iki kolda da kullanildiginin unutulmamasi gerekmektedir. LPC analizi ayni zamanda, dönüsüm bölgesindeki gürültünün biçimlendirilmesi için de kullanilmaktadir. Dolayisiyla, bir baska sekilde ifade etmek gerekirse, ileriye dönük kisimlari birbirine özdes veya birbirlerine oldukça yakin olmaktadir. Bu durum, ödünlesmenin optimal oranda elde edilmesini ve ses kalitesinin veya gecikme özelliklerinin optimalden asagi bir durumda belirlenmemesini saglamaktadir. Dolayisiyla, analiz penceresindeki tahmin kodlamasi için ileriye dönüslülügün daha yüksek oldugu durumlarda LPC analizinin daha iyi oldugu ancak öte yandan, ileriye dönük kismin daha yüksek oldugu bir durumda gecikmenin de arttigi fark edilmistir. Öte yandan, ayni durum. TCX penceresi için de geçerli olmaktadir. TCX penceresine ait ileriye dönük kismin daha yüksek oldugu durumlarda, TCX bit hizi da daha iyi bir sekilde azaltilabilmektedir, zira daha uzun olan TCX pencereleri genel olarak daha düsük bit hizlarini ortaya çikarmaktadir.
Bu nedenle, mevcut bulusun aksine, ileriye dönük kisimlar birbiriyle özdes veya birbirlerine çok yakin olmakta ve özellikle Dolayisiyla, her ne kadar gecikme nedenlerinden ötürü istenmeyen bir durum olsa da ileriye dönük kisim enkode/dekode etme kollarinin her ikisi tarafindan da optimal olarak kullanilabilmektedir.
Bu durum göz önünde bulunduruldugunda, mevcut bulus gelistirilmis bir kodlama konsepti ve bununla birlikte, her iki analiz penceresi için de ileriye dönük kisim düsük olarak belirlendiginde düsük gecikme saglamaktadir, öte yandan, ses kalitesi nedenlerinden veya bit hizi nedenlerinden ötürü meydana getirilmesi zaruri olan gecikmenin her iki sekilde de yalnizca tek bir kodlama kolu tarafindan degil, her iki kodlama kolu tarafindan da optimal olarak kullanildigi gerçeginden ötürü iyi niteliklere sahip bir enkode/dekode etme konsepti saglamaktadir.
Ses örneklerinden meydana gelen bir akisa sahip bir ses sinyaline enkode etmek için bir cihaz olup, bir tahmin analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen bir akisa bir tahmin kodlamasi analizi uygulamak ve bir dönüsüm analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen akisa bir dönüsüm kodlamasi analiz penceresi uygulamak üzere bir pencereleyici içermektedir. Dönüsüm kodlamasi analiz penceresi, bir dönüsüm kodlamasi ileriye dönük kismi olan ses örneklerinin bir gelecek çerçevesine ait ön tanimli bir ileriye dönük kisminin ses örneklerinin mevcut bir çerçevesine ait olan ses örnekleri ile iliskilendirilmektedir.
Ayrica, tahmin kodlamasi analiz penceresi ise mevcut çerçeveye ait ses örneklerinin en az bir kismi ile ve bir tahmin kodlamasi ileriye dönük kismi olan gelecek çerçevenin ön tanimli bir kismina ait ses örnekleri ile iliskilendirilmektedir.
Dönüsüm kodlamasi ileriye dönük kismi ve tahmin kodlamasi ileriye dönük kismi birbiriyle özdes veya birbirlerinden tahmin kodlamasi ileriye dönük kisminin %20'sinden daha az olacak sekilde veya dönüsüm kodlamasi ileriye dönük kisminin birbirlerine oldukça yakindirlar. Söz konusu cihaz ilaveten, tahmin analizi için pencerelenmis veriden faydalanmak suretiyle mevcut çerçeve için tahmin kodlanmis verisi üretmek için veya dönüsüm analizi için pencere verisinden faydalanmak suretiyle mevcut çerçeve için dönüsüm kodlanmis veri üretmek için bir enkode etme islemcisi içermektedir.
Enkode edilmis bir ses sinyalinin dekode edilmesi için bir ses dekoderi olup, enkode edilmis ses sinyalinden bir tahmin kodlanmis çerçeve için bir veri dekode etme islemi gerçeklestirmek üzere bir tahmin parametresi dekoderi ve ikinci kol için ise enkode edilmis ses sinyalinden bir dönüsüm kodlanmis çerçeve için bir veri dekode etme islemi gerçeklestirmek üzere bir dönüsüm parametresi dekoderi içermektedir.
Dönüsüm parametresi dekoderi, bir MDCT veya MDST veya herhangi baska bir dönüsüm gibi tercihen bir örtüsmeden etkilenen bir spektral-zaman dönüsümü gerçeklestirmek ve mevcut çerçeve ve gelecek çerçeve için bir veri elde etmek için dönüstürülmüs veriye bir sentez penceresi uygulamak üzere konfigüre edilmektedir. Ses dekoderi tarafindan uygulanan sentez penceresi, bir birinci örtüsme kismina, ikinci bir bitisik örtüsmesiz kisma ve üçüncü bir bitisik örtüsme kismina sahip olacak sekilde uygulanmakta olup, burada üçüncü örtüsme kismi gelecek çerçeve için ses örnekleriyle iliskilendirilmekte ve örtüsmesiz kisim ise mevcut çerçeveye ait veri ile iliskilendirilmektedir. Ilaveten, dekoder tarafinda iyi ses kalitesi elde edebilmek için gelecek çerçeve için ses örneklerine ait bir birinci kismi elde etmek üzere, örtüsme ve mevcut çerçeve için bir sentez penceresine ait üçüncü örtüsme kismi ile iliskilendirilen sentez pencerelenmis örneklerin ve gelecek çerçeve için bir sentez penceresine ait birinci örtüsme kismi ile iliskilendirilen sentez pencerelenmis örneklerin. örtüsmesi ve eklenmesi için bir örtüsme-ekleyici uygulanmakta olup, burada gelecek çerçeve için ses örneklerinin geri kalani, mevcut çerçeve ve gelecek çerçevenin dönüsüm kodlanmis veri içerdigi durumlarda, örtüsme eklenmeden elde edilen gelecek çerçeve için sentez penceresine ait ikinci örtüsmesiz kisim ile iliskilendirilen sentez pencerelenmis örneklerdir.
Mevcut bulusun tercih edilen düzenlemeleri her iki kodlama modunun da gecikme kisitlamalari altinda mevcut olan maksimum ileriye dönüklüge sahip olabilmesi için TCX kolu gibi dönüsüm kodlamasi kolu ve ACELP kolu gibi tahmin kodlamasi kolu için olan ayni ileriye dönüklügün birbirine özdes olmasi özelligine sahiptir. Ayrica, dönüsüm kodlamasi modundan tahmin kodlamasi moduna, bir çerçeveden bir sonraki çerçeveye, bir anahtarlamanin herhangi bir örtüsme adresleme sorunu olmadan kolaylikla gerçeklestirilebilmesi için TCX penceresi örtüsmesinin ileriye dönük kisim ile sinirlandirilmasi tercih edilmektedir. Örtüsmenin ileriye dönüklük ile sinirlandirilmasinin bir baska nedeni ise dekoder tarafinda herhangi bir gecikme meydana getirmemektir. Sayet, lO ms'lik ileri dönüklüge sahip bir TCX penceresi mevcut ise ve örnegin, 20 ms'lik örtüsme gibi, o hâlde dekoder tarafinda lO ms'den daha fazla gecikme meydana getirilmesi gerekmektedir. Eger, 10 ms'lik ileri dönüklüge ve ms'lik örtüsmeye sahip bir TCX penceresi mevcut ise o hâlde dekoder tarafinda ilaveten herhangi bir gecikme olmayacaktir.
Kolay anahtarlama, bunun iyi bir sonucudur.
Dolayisiyla, analiz penceresine ait ikinci örtüsmesiz kismin ve sentez penceresinin mevcut çerçevenin sonuna dek genislemesi ve üçüncü örtüsme kisminin ise yalnizca gelecek çerçeveye iliskin olarak baslamasi tercih edilmektedir.
Ayrica, TCX'e ait sifirdan farkli kisim veya dönüsüm kodlamasi analiz/sentez penceresi, bir moddan diger moda kolay ve düsük verimli bir anahtarlamanin gerçeklestirilebilmesi için çerçevenin baslangici ile hizalanmaktadir.
Ayrica, dört alt çerçeve gibi çok sayida alt çerçeveden meydana gelen bir çerçevenin tamaminin, dönüsüm kodlamasi modunda (TCX modu gibi) tam anlamiyla kodlanabilmesi veya tahmin kodlama modunda (ACELP modu gibi) tam anlamiyla kodlanabilmesi tercih edilmektedir.
Ilaveten, yalnizca tek bir LPC analiz penceresinin degil, bir LPC analiz penceresinin dördüncü alt çerçevenin merkezi ile hizalandigi ve bir son çerçeve analizi penceresi oldugu, diger analiz penceresinin ise ikinci alt çerçevenin merkezi ile hizalandigi ve bir orta çerçeve analizi penceresi oldugu iki farkli LPC analiz penceresinin kullanilmasi tercih edilmektedir. Bununla birlikte, eger enkoder dönüsüm kodlamasina geçirilirse, o hâlde son çerçeve LPC analiz penceresine dayali olarak LPC analizinden türetilen yalnizca tek bir LPC katsayisi veri setinin iletilmesi tercih edilmektedir. Ayrica dekoder tarafinda, söz konusu olan bu LPC verisinin, dönüsüm kodlamasi sentezi için dogrudan kullanilmamasi ve özellikle de TCX katsayilarinin spektral bir agirliklandirilmasinda dogrudan kullanilmamasi tercih edilmektedir. Bunun yerine, mevcut çerçeveye ait son çerçeve LPC analizi penceresinden elde edilen TCX verisinin, geçmis çerçevedeki son çerçeve LPC analiz penceresinden elde edilen veri ile, diger bir deyisle, zaman açisindan mevcut çerçeveden hemen önceki çerçeve ile ara degerlendirilmesi tercih edilmektedir. TCX modundaki bir çerçevenin tamami için yalnizca tek bir LPC katsayisi setinin iletilmesi vasitasiyla, orta çerçeve analizi ve son çerçeve analizi için iki LPC katsayisi veri setinin iletilmesi ile karsilastirildiginda, daha da fazla bit hizi azaltmasi elde edilebilmektedir. Bununlai birlikte, enkoderin ACELP moduna anahtarlandigi bir durumda ise her iki LPC katsayisi seti de enkoderden dekodere iletilmektedir.
Ayrica, orta çerçeve LPC analiz penceresinin, mevcut çerçeveye ait bir hemen sonraki çerçevenin sinirinda sona ermesi ve ilaveten geçmis çerçeveye genislemesi tercih edilmektedir- Geçmis çerçeve halihazirda mevcut oldugu ve herhangi bir gecikme olmadan kullanilabildigi için bu durum bir gecikme meydana getirmemektedir. Öte yandan, son çerçeve analizi penceresinin, mevcut çerçevenin baslangicinda degil, mevcut çerçeve dahilinde herhangi bir yerde baslamasi da tercih edilen bir durumdur.
Bununla birlikte bu durum herhangi bir problem yaratmamaktadir, zira TCX agirliklandirmasinin olusturulmasinda, en sonda tüm verilerin LPC katsayilarinin hesaplanmasi için kullanilabilmesinin saglanmasi için geçmis çerçeve için son çerçeve LPC veri setinin ve mevcut çerçeve için son çerçeve LPC veri setinin bir ortalamasi kullanilmaktadir. Dolayisiyla, son çerçeve analiz penceresinin baslangici, tercihen geçmis çerçeveye ait son çerçeve analiz penceresinin ileriye dönük kismi içerisinde yer almaktadir.
Dekoder tarafinda, bir moddan diger moda geçilmesi için büyük ölçüde azaltilmis bir ek yük elde edilmektedir. Bunun nedeni ise tercihen kendi içinde simetrik olan sentez penceresine ait örtüsmesiz kismin, mevcut çerçeveye ait örnekler ile degil, gelecek bir çerçeveye ait örnekler ile iliskilendirilmesi ve dolayisiyla, yalnizca ileriye dönük kisim içerisinde, diger bir deyisle, yalnizca gelecek çerçeve içerisinde genislemesidir. Böylelikle, sentez penceresi, tercihen mevcut çerçevenin hemen basinda baslayan sadece birinci örtüsme kisminin, mevcut çerçeve içerisinde oldugu ve ikinci örtüsmesiz kismin ise birinci örtüsmesiz kismin sonundan mevcut çerçevenin sonuna kadar uzandigi ve dolayisiyla, ikinci örtüsme kisminin ileriye dönük kisim ile kesistigi bir sekilde olmaktadir. Dolayisiyla, TCX'ten ACELP'e bir geçis söz konusu oldugu durumlarda, sentez penceresine ait örtüsme kismindan ötürü elde edilen veri atilmakta ve yerine ACELP kolunun gelecek çerçevesinin baslangicindan beri nevcut olan tahmin kodlamasi verisi gelmektedir. Öte yandan, ACELP'den TCX'e bir geçisin söz konusu oldugu durumlarda ise mevcut çerçevenin hemen basinda baslayan spesifik bir geçis penceresi uygulanmaktadir, bir baska deyisle, örtüsme "eslerinin" bulunabilmesi için herhangi bir verinin yeniden yapilandirilmasinin gerekmedigi örtüsmesiz bir kisma sahip olan geçis gerçeklestikten hemen sonraki çerçeve uygulanmaktadir. Bunun yerine, sentez penceresine ait örtüsmesiz kisim, herhangi bir örtüsme olmadan dogru verileri saglamakta ve dekoder tarafindan herhangi bir örtüsme ekleme prosedürüne gerek olmamaktadir. Yalnizca örtüsme kisimlari için diger bir deyisle, mevcut çerçeve için olan pencerenin üçüncü kismi ve bir sonraki çerçeve için olan pencerenin birinci kismi için örtüsme ekleme prosedürü fayda saglamakta olup, "zaman bölgesi örtüsme iptali (TDAC)" terimi altinda da bilinen teknikteki MDCT'nin dönüsül olarak örneklenen dogasindan ileri gelen bit hizini artirmak zorunda kalmaksizin, nihayetinde iyi bir ses kalite elde edebilmek için düz MDCT'de oldugu gibi, bir bloktan digerine sürekli bir güçlenme/sönme elde etmek üzere gerçeklestirilmektedir.
Ilaveten, bir ACELP kodlama modu için enkoder içerisinde orta çerçeve penceresinden ve son çerçeve penceresinden türetilen LPC verisi iletilirken, TCX kodlama modu için son çerçeve penceresinden türetilen yalnizca tek bir LPC veri seti kullanilmaktadir, dekoder burada ayrica bir fayda saglamaktadir. Bununla birlikte, TCX dekode edilmis verilerin spektral olarak agirliklandirilmasi için iletilen LPC verisi oldugu gibi kullanilmamaktadir, ancak veri, geçmis çerçeve için elde edilen son çerçeve LPC analiz penceresinden karsilik gelen veri ile ortalanmaktadir.
Mevcut bulusun tercih edilen düzenlemeleri, tarifname ekinde yer alan sekillere göre açiklanmakta olup, söz konusu olan sekillerde: Sekil la tercih edilen bir anahtarlamali ses enkoderinin bir blok diyagramini göstermektedir.
Sekil lb ilgili bir anahtarlamali dekodere ait bir blok diyagrami göstermektedir.
Sekil lc Sekil lb üzerinde gösterilen dönüsüm parametresi dekoderine iliskin daha fazla ayrintiyi göstermektedir.
Sekil ld Sekil la'daki dekodere ait dönüsüm kodlamasi moduna iliskin daha fazla ayrintiyi göstermektedir.
Sekil 2a bir tarafta LPC analizi için, diger tarafta ise dönüsüm kodlamasi analizi için enkoderde uygulanan pencereleyici için olan tercih edilen bir düzenlemeyi göstermekte olup, ayni zamanda Sekil lb'deki dönüsüm kodlamasi dekoderinde kullanilan sentez penceresinin bir gösterimidir. iki çerçeveden daha uzun bir zaman dilimi için hizali LPC analiz pencerelerine ve TCX pencerelerine ait pencere sekansini göstermektedir.
TCX'ten ACELP'ye bir geçis için bir durumu ve ACELP'den TCX'e bir geçis için olan bir geçis penceresini göstermektedir.
Sekil la'da gösterilen enkodere ait daha fazla detayi göstermektedir. bir çerçeve için bir kodlama modunun seçilmesi hususunda bir sentez yoluyla analiz prosedürünü göstermektedir. her bir çerçeve için modlar arasinda seçim yapilabilmesi hususunda bir diger düzenlemeyi göstermektedir. mevcut bir çerçeve için iki farkli LPC analiz penceresinden faydalanilarak türetilen LPC verisinin hesaplanmasini ve kullanilmasini göstermektedir. enkodere ait TCX kolu için bir LPC analiz penceresinden faydalanan pencereleme vasitasiyla elde edilen LPC verisinin kullanimini göstermektedir.
AMR-WB için olan LPC analiz pencerelerini göstermektedir.
Sekil 5d LPC analizi gerçeklestirmek üzere, AMR-WB+ için olan simetrik pencereleri göstermektedir.
Sekil 5c bir G.718 enkoderi için olan LPC analiz pencerelerini göstermektedir.
Sekil 5d USAC'de kullanildigi gibi LPC analiz pencerelerini göstermektedir.
Sekil 6 mevcut çerçeve için olan bir LPC analiz penceresine göre mevcut bir çerçeve için olan bir TCX penceresini göstermektedir.
Sekil la'da, ses örneklerinden meydana gelen bir akisa sahip olan bir ses sinyalinin enkode edilmesi için bir cihaz gösterilmektedir. Ses örnekleri veya ses verisi, enkodere lOO'de girmektedir. Ses verisi, bir tahmin analizi için pencerelenmis verileri elde etmek üzere, tahmin kodlamasi analiz penceresinin ses örneklerinden meydana gelen akisa uygulanmasi için pencereleyici 102 içerisine yerlestirilmektedir. Söz konusu pencereleyici 102, bir dönüsüm analizi için pencerelenmis veri elde etmek amaciyla, ses örneklerinden meydana gelen akisa, bir dönüsüm kodlamasi analiz penceresi uygulamak üzere ayrica konfigüre edilmektedir. Uygulamaya bagli olarak, LPC penceresi orijinal sinyale dogrudan uygulanmamakta olup, bunun yerine, "ön vurgulanmis" bir sinyale (AMR-WB, AMR-WB+, G uygulanmaktadir. Öte yandan, TCX penceresi ise orijinal sinyale dogrudan (USAC'de oldugu gibi) uygulanmaktadir.
Bununla birlikte, her iki pencere de ayni sinyallere uygulanabilmekte veya TCX penceresi, ön vurgulamak suretiyle veya kalitenin ya da sikistirma veriminin gelistirilmesi için kullanilan diger herhangi bir agirliklandirma vasitasiyla, orijinal sinyalden türetilen islenmis bir ses sinyaline uygulanabilmektedir.
Dönüsüm kodlamasi analiz penceresi, ses örneklerine ait mevcut bir çerçeve içerisindeki ses örnekleriyle ve bir dönüsüm kodlamasi ileriye dönük kismi olan ses örneklerine ait gelecek çerçevenin ön tanimlanmis bir kisminin ses örnekleri ile iliskilendirilmektedir.
Ayrica, tahmin kodlamasi analiz penceresi ise mevcut Çerçeveye ait ses örneklerinin en az bir kismi ile ve bir tahmin kodlamasi ileriye dönük kismi olan gelecek çerçevenin ön tanimli bir kismina ait ses örnekleri ile iliskilendirilmektedir.
Blok 102 üzerinde de ana hatlariyla gösterildigi üzere, dönüsüm kodlamasi ileriye dönük kismi ve tahmin kodlamasi ileriye dönük kismi birbiriyle hizalanmakta olup, bunun durum, söz konusu olan bu kisimlarin birbirleri ile özdes oldugu veya tahmin kodlamasi ileriye dönük kisminin %20'inden daha az veya dönüsüm kodlamasi ileriye dönük kisminin %ZO'sinden daha az olacak sekilde, birbirlerine çok yakin olduklari anlamina gelmektedir. Tercihen, ileriye dönük kisimlar birbirleri ile özdes veya birbirlerinden tahmin kodlamasi ileriye dönük kisminin %S'inden bile daha az veya dönüsüm kodlamasi ileriye dönük kisminin %5'inden daha az olacak sekilde farklidirlar.
Enkoder ilaveten, tahmin analizi için. pencerelenmis veriden faydalanmak suretiyle mevcut çerçeve için tahmin kodlanmis veri üretmek için veya dönüsüm analizi için pencerelenmis veriden faydalanmak suretiyle mevcut çerçeve için dönüsüm kodlanmis veri üretmek için bir enkode etme islemcisi 104 içermektedir.
Tercihen, enkoder ayrica, mevcut bir Çerçeve için ve hatta her bir çerçeve için, LPC verisini 108a e dönüsüm kodlanmis verileri (TCX verileri gibi) veya tahmin kodlanmis verileri (ACELP verileri) hat 108b üzerinden almak için bir çikis arayüzü 106 içermektedir. Enkode etme islemcisi 104, söz konusu olan bu iki türden veriyi saglamakta ve llOa ile gösterilen bir tahmin analizi için pencerelenmis verileri ve 110b'de gösterilen bir dönüsüm analizi için pencerelenmis verileri almaktadir. Enkode etme islemi için cihaz ayrica, ses verisini 100 girdi olarak alan ve kontrol hatlari 114a vasitasiyla kontrol verilerini enkode etme islemcisine 104 çikti olarak saglayan veya kontrol verilerini çikis arayüzüne 106 kontrol hatti 114b vasitasiyla saglayan bir enkode etme modu seçicisi veya kontrol aygiti 112 içermektedir.
Sekil 3a, enkode etme islemcisine 104 ve pencereleyiciye 102 iliskin ilave detaylari saglamaktadir. Pencereleyici 102, tercihen, bir birinci modül olarak, LPC veya tahmin kodlamasi analiz pencereleyicisi 102a ve ikinci bir bilesen veya modül olarak ise dönüsüm kodlamasi pencereleyicisini (TCX pencereleyicisi gibi) 102b içermektedir. Ok 300 ile de gösterildigi üzere, LPC analiz penceresi ve TCX penceresi, her iki pencerenin de ileriye dönük kisimlarinin birbirine özdes olabilmesi ve dolayisiyla her iki ileriye dönük kisminda gelecek çerçeve içerisinde ayni zamansal lahzaya dek genisleyebilmesi için birbirleriyle hizalanmaktadir. LPC pencereleyicisinden 102a ileride saga dogru olan Sekil 3a'daki üst kol, bir tahmin kodlamasi kolu olup, bir LPC analiz cihazi ve bir ara degerleyici 302, bir algisal agirliklandirma filtresi veya bir agirliklandirma blogu 304 ve bir ACELP parametresi hesaplayicisi gibi bir tahmin kodlamasi parametre hesaplayicisi 306 içermektedir. Ses verisi 100, LPC pencereleyicisine 102a ve algisal agirliklandirma bloguna 304 saglanmaktadir. Ilaveten, ses verisi ayrica, TCX pencereleyicisine saglanmakta olup, TCX pencereleyicisinin çikisindan saga dogru olan alt kol ise bir dönüsüm kodlamasi kolunu meydana getirmektedir. Söz konusu olan bu dönüsüm kodlamasi kolu, bir zaman-frekans dönüstürme blogu 310, bir spektral agirliklandirma. blogu 312 ve bir isleme/kuantizasyon enkode etme blogu 314 içermektedir.
Zaman-frekans dönüstürme blogu 310, tercihen, bir MDCT, bir MDST veya giris degerlerinin sayisinin çikis degerlerinin sayisindan daha büyük oldugu baska herhangi bir dönüsüm gibi bir örtüsme meydana getiren dönüsüm olarak uygulanmaktadir.
Zaman-frekans dönüsümü, bir giris olarak, TCX tarafindan çiktilanan pencerelenmis veriye veya daha genel bir ifade ile dönüsüm kodlamasi pencereleyicisine 102b sahiptir.
Her ne kadar Sekil 3a, tahmin kodlamasi kolu için LPC islemesi ile birlikte bir ACELP enkode etme algoritmasi gösteriyor olsa da CELP gibi diger tahmin kodlayicilari ya da bilinen teknikte yer alan diger herhangi bir zaman bölgesi kodlayicisi da uygulanabilmektedir ancak bununla birlikte, ACELP algoritmasi sagladigi kalite ve verimlilik gibi nedenlerden ötürü tercih edilmektedir.
Ayrica, dönüsüm kodlamasi kolu için özellikle zaman-frekans dönüstürme blogu 310 dahilinde bulunan bir MDCT islemesi tercih edilmektedir, ancak baska herhangi bir spektral bölge dönüsümü de gerçeklestirilebilmektedir.
Ayrica Sekil 3a'da, blok 310 tarafindan çiktilanan spektral degerlerin bir LPC bölgesine dönüstürülmesi için bir spektral agirliklandirma 312 gösterilmektedir. Söz konusu olan bu spektral agirliklandirma 312, tahmin kodlamasi kolu içerisinde blok 302 tarafindan meydana getirilen LPC analiz verisinden türetilen agirliklandirma verisi ile gerçeklestirilmektedir. Bununla birlikte, alternatif olarak, zaman bölgesinden LPC bölgesine olan dönüsüm, zaman bölgesinde ayrica gerçeklestirilebilmektedir. Bu durumda, tahmin artik zaman bölge verisinin hesaplanabilmesi için TCX pencereleyicisinden 102b önce bir LPC analiz filtresi yerlestirilecektir. Ancak, zaman bölgesinden LPC bölgesine olan dönüsümün, zaman bölgesinden LPC bölgesine olan dönüsümün, tercihen spektral bölge dahilinde, dönüsüm kodlanmis verilerin, LPC verisinden bunlara karsilik gelen agirliklandirma faktörlerine spektral bölge içerisinde dönüstürülen LPC verilerinden faydalanilarak spektral olarak agirliklandirilmasiyla gerçeklestirildigi fark edilmistir.
Sekil 3b, her bir çerçeve için olan kodlama modunun belirlenmesinde bir sentez yoluyla analiz veya "kapali döngü"'yü örneklemek için genel bir görünümü göstermektedir.
Bu maksatla, Sekil 3c üzerinde gösterilen enkoder, 104b'de gösterildigi üzere, bir tam. dönüsüm. kodlamasi enkoderi ve dönüsüm kodlamasi dekoderi içermekte olup, ilaveten Sekil 3c üzerinde 104a ile gösterildigi üzere, bir tam tahmin kodlama enkoderi ve buna karsilik gelen bir dekoderi içermektedir.
Her iki blok da lO4a, 104b, girdi olarak ses verisini almakta ve tani bir enkode/dekode etme islemi gerçeklestirmektedir.
Bunun. ardindan, her iki kodlama. kolu lO4a, 104b için olan enkode/dekode etme isleminin sonuçlari, orijinal sinyal ile karsilastirilmakta ve hangi kodlama modunun daha iyi bir kalite ortaya koydugunun anlasilabilmesi için bir kalite ölçüsü belirlenmektedir. Söz konusu olan kalite ölçüsü, örnegin, 3GPP TS 26.290'in Bölüm 5.2.3'ünde açiklandigi üzere, segmentlenmis bir SNR degeri veya bir ortalama segmentli SNR olabilmektedir. Bununla birlikte, tipik olarak enkode/dekode etme sonucunun orijinal sinyal ile karsilastirilmasi prensibine dayanan baska herhangi bir kalite ölçüsü de uygulanabilmektedir.
Her bir koldan 104a, 104b karar vericiye 112 saglanan kalite ölçüsüne bagli olarak, söz konusu karar verici, halihazirda incelenen mevcut çerçevenin ACELP'den veya TCX'ten hangisinin kullanilarak enkode edilecegini belirlemektedir. Bu kararin ardindan, kodlama modu seçiminin gerçeklestirilebilmesi için pek çok farkli yol bulunmaktadir. Söz konusu olan bu yollardan bir tanesinde, karar verici 112 belirli bir çerçeve için yalnizca tek bir kodlama sonucunun, 107'deki çikis kodlanmis sinyal dahilinde iletildiginden emin olabilmek için mevcut çerçeve için olan kodlama sonucunu, çikis arayüzüne 106 çiktilamak üzere, ilgili enkoder/dekoder bloklarini 104a, 104b kontrol etmektedir.
Alternatif olarak, her iki cihaz da 104a, 104b, kendi enkode etme sonuçlarini çikis arayüzüne 106 iletebilmekte olup, söz konusu olan her iki sonuç da blok 104b veya blok 104a'dan gelen sonuçlardan birini çiktilamak üzere, karar vericinin çikis arayüzünü hat 105 vasitasiyla kontrol edecegi ana dek saklanmaktadir.
Sekil 3b, Sekil 3c'de gösterilen konsepte iliskin daha fazla detayi ortaya koymaktadir. Özellikle blok lO4a, tam bir ACELP enkoderi, tam bir ACELP dekoderi ve bir karsilastirici 112a içermektedir. Karsilastirici 112a, karsilastiriciya 112c bir kalite ölçüsü saglamaktadir. Ayni durum, bir TCX enkode edilen ve yine dekode edilen sinyal ile orijinal ses sinyalinin karsilastirmasindan ileri gelen bir kalite ölçüsüne sahip olan karsilastirici 112b için de geçerli olmaktadir. Akabinde, her iki karsilastirici da 112a, 112b, kendi kalite ölçülerini nihai karsilastiriciya 112c saglamaktadir. Hangi kalite ölçüsünün daha iyi olduguna bagli olarak, karsilastirici bir CELP veya bir TCX'e iliskin bir karara varmaktadir. Söz konusu karar, ilave faktörlerin karar içerisine yerlestirilmesi suretiyle arindirilabilmektedir.
Alternatif olarak, mevcut çerçeve için olan ses verisinin sinyal analizine bagli olarak, mevcut bir çerçeve için kodlama modunu belirlemek üzere bir açik döngü modu gerçeklestirilebilmektedir. Bu türden durumlarda, Sekil 3c'de gösterilen karar verici 112, mevcut çerçeve için ses verisinin bir sinyal analizini gerçeklestirmekte ve bunun akabinde, mevcut ses çerçevesini enkode etmek üzere, bir ACELP enkoderini veya bir TCX enkoderini kontrol etmektedir.
Bu durumda, enkoderin tam bir dekodere ihtiyaci olmamakta ve sadece enkode etme adimlarinin enkoder dahilinde uygulanmasi yeterli olmaktadir. Açik. döngü sinyal siniflandirmalari ve sinyal kararlari, örnegin, AMR-WB+ (3GPP TS 26.290) dahilinde de açiklanmaktadir.
Sekil 2a, pencereleyiciye 102 ait tercih edilen bir düzenlemeyi göstermekte olup, özellikle de pencereleyici tarafindan saglanan pencereleri ortaya koymaktadir.
Tercihen, mevcut çerçeve için olan tahmin kodlamasi analiz penceresi, dördüncü bir alt çerçevenin ortasinda merkezlenmekte olup, söz konusu olan› bu pencere is 200'de gösterilmektedir. Ayrica, ilaveten bir LPC analiz penceresinin kullanilmasi, diger bir deyisle, 202'de gösterilen ve mevcut çerçeveye ait ikinci alt çerçevenin ortasinda merkezlenen orta çerçeve LPC analiz penceresinin kullanilmasi tercih edilmektedir. Buna ek olarak, gösterildigi üzere, örnegin MDCT penceresi 204 gibi dönüsüm kodlamasi penceresi, iki LPC analiz penceresine 200, 202 göre olacak sekilde yerlestirilmektedir. Özellikle, analiz penceresine ait olan ileriye dönük kisim 206, zamansal açidan tahmin kodlamasi analiz penceresine ait ileriye dönük kisim 208 ile ayni uzunluga sahiptir. Her iki ileriye dönük kisim da gelecek bir sonraki çerçeve içerisine lO ms'lik bir süre ile genislemektedir. Ayrica, dönüsüm kodlamasi analiz penceresinin yalnizca örtüsme kismina 206 degil, ayni zamanda ila 20 ms araliginda örtüsmesiz bir kisma 208 ve birinci örtüsme kismina 210 sahip olmasi tercih edilmektedir. Örtüsme kisimlari 206 ve 210, bir dekoderdeki bir örtüsme ekleyicisinin, bir örtüsme kismi dahilinde bir örtüsme ekleme islemi gerçeklestirecegi sekilde olup, ancak bununla birlikte örtüsmesiz kisim için herhangi bir örtüsme ekleme prosedürü gerekmemektedir.
Tercihen, birinci örtüsme kismi 210, çerçevenin basinda baslamaktadir, diger bir deyisle, sifir ms'de baslamakta ve çerçevenin merkezine kadar, diger bir deyisle, 10 ms., uzanmaktadir. Örtüsmesiz kisim ayrica, ikinci örtüsme kisminin 206, ileriye dönük kisim ile tam anlamiyla kesisebilmesi için çerçeveye 210 ait birinci kismin sonundan, çerçevenin 20 ns'deki sonuna kadar uzanmaktadir. Bu durum, bir moddan diger moda geçildiginden Ötürü avantaj saglamaktadir. TCX performansi açisindan bakildiginda, tam örtüsmeye (USAC'de de oldugu gibi 20 ms'lik örtüsme) sahip bir sinüs penceresinin kullanilmasi daha faydali olacaktir.
Ancak bu durum, TCX ve ACELP arasindaki geçisler için ileriye dönük örtüsme iptali gibi bir teknolojiyi gerekli kilmaktadir. Ileriye dönük örtüsme iptali, sonradan gelen kayip TCX çerçevelerinin (ACELP ile degistirilmektedir) neden oldugu örtüsmenin iptali için USAC'de kullanilmaktadir.
Ileriye dönük örtüsme iptali, önemli miktarda bit sayisi gerektirmektedir, bu nedenle, sabit bir bit hizi için ve özellikle de açiklamasi verilen kodegin tercih edilen bir düzenlemesindeki gibi düsük bit hizli bir kodek için elverisli olmamaktadir. Bu nedenle, mevcut bulusa ait düzenlemelere göre, FAC'nin kullanilmasi yerine, tam örtüsme kisminin 206 gelecek çerçeve içine yerlestirilebilmesi için TCX penceresi örtüsmesi azaltilmakta ve pencere yönü ileriki çerçevelere dogru degistirilmektedir. Ayrica, dönüsüm kodlamasi için Sekil Za'da gösterilen pencere, bir sonraki çerçevenin ACELP oldugu ve ileriye dönük örtüsme iptalinden faydalanilmadigi durumlarda, mevcut çerçeve dahilinde kusursuz yeniden yapilanmanin alinabilmesi için yine de bir maksimum örtüsmeye sahiptir. Söz konusu olan maksimum örtüsme, tercihen 10 ms olarak belirlenmekte olup, söz konusu süre, diger bir deyisle, Sekil Za'da da açikça belirtildigi üzere 10 ms, zamansal açidan ileriye dönük kisim dahilinde mevcuttur.
Her ne kadar Sekil 2a, dönüsüm enkode etme islemi için pencerenin 204 bir analiz penceresi oldugu bir enkodere göre açiklanmis olsa da pencerenin 204 ayni zamanda dönüsüm dekode etme islemi için bir sentez penceresini temsil ettigi unutulmamalidir. Tercih edilen bir düzenlemede, analiz penceresi sentez penceresi ile özdes olup, söz konusu olan her iki pencere de kendi içlerinde simetriktir. Bunun anlami, her iki pencerenin de bir (yatay) merkez hattina simetrik olmasidir. Bununla. birlikte, diger uygulamalarda ise analiz penceresinin sekil bakimindan sentez penceresinden farkli oldugu, simetrik olmayan pencereler kullanilabilmektedir.
Sekil 2b, geçmis bir çerçevenin bir kismi üzerindeki bir pencere sekansini, bunun akabinde gelen mevcut çerçeveyi, mevcut çerçeveyi takip eden bir gelecek çerçeveyi ve gelecek çerçeveyi takip eden bir sonraki gelecek çerçeveyi göstermektedir. 250'de gösterilen bir örtüsme ekleme islemcisi tarafindan islenen örtüsme ekleme kisminin, her bir çerçevenin baslangicindan, yine her bir çerçevenin ortasina dek genisledigi, diger bir deyisle, gelecek çerçeve verisinin hesaplanmasi için 20 ve 30 ms'ler` arasinda. ve bir sonraki gelecek çerçeve için TCX verisini hesaplamak üzere 40 ve 50 ms'ler arasinda ya da mevcut çerçeve için olan veriyi hesaplamak üzere sifir ve 10 ms arasinda uzandigi netlik kazanmaktadir. Bununla birlikte, her bir çerçevenin ikinci yarisi dahilindeki verinin, hesaplanmasi için örtüsme ekleme islemi ve dolayisiyla ileriye dönük. örtüsme iptali teknigi gerekli olmamaktadir. Bunun nedeni, sentez penceresinin, her bir çerçevenin ikinci yarisinda. örtüsmesiz bir kisma sahip olmasidir.
Tipik olarak, bir MDCT penceresinin uzunlugu, bir çerçevenin uzunlugunun iki katidir. Bu durum mevcut bulus için de geçerli olmaktadir. Bununla birlikte, yine Sekil 2a göz önünde bulunduruldugunda, analiz/sentez penceresinin yalnizca sifirdan 30 ms'ye uzandigi, ancak pencere uzunlugunun tamaminin ise 40 ms oldugu. belirginlesmektedir. Söz konusu olan uzunlugun tamami, MDCT hesaplamasinin ilgili katlama veya yayilma islemleri için olan giris verisinin saglanmasi açisindan önem arz etmektedir. Pencerenin 14 ms'lik tam uzunluga genisletilebilmesi için -5 ve O Ins'ler arasinda 5 ms'lik sifir degerleri ilave edilmekte ve 30 ila 35 Hß'ler arasindaki çerçevenin sonuna da 5 saniyelik MDCT sifir degerleri eklenmektedir. Bununla birlikte, söz konusu olan yalnizca sifirlara sahip ilave kisimlarin, gecikme konusunda dikkate alinacak hususlar söz konusu oldugunda herhangi bir payi olmamaktadir, zira söz konusu olan bu verinin herhangi bir gecikme olmadan halihazirda mevcut olabilmesi için pencerenin son bes ms'sinin ve yine pencerenin ilk bes ms'sinin sifir oldugu enkoder veya dekoder tarafindan bilinmektedir.
Sekil 2c, mümkün olan iki geçisi göstermektedir. Öte yandan, TCX'ten ACELP'ye gerçeklestirilecek bir geçis islemi için hususi bir itinanin gösterilmesi gerekmemektedir, zira Sekil 2a'ya göre gelecek çerçevenin bir ACELP çerçevesi oldugu varsayildiginda, ACELP çerçevesi, gelecek çerçevenin hemen basinda basladigindan, ileriye dönük kisim 206 için son çerçevenin TCX dekode edilmesi suretiyle elde edilen veri silinebilmektedir* ve bu dogrultu herhangi bir veri boslugu olmamaktadir. ACELP verisi kendi içinde istikrarlidir ve dolayisiyla bir dekoder, TCX'ten ACELP'e bir anahtara sahip oldugunda, mevcut çerçeve için TCX'ten hesaplanan veriyi kullanmakta, gelecek çerçeve için TCX islemesi vasitasiyla elde edilen veriyi atmakta ve bunun yerine ACELP kolundan gelecek çerçeve verisini kullanmaktadir.
Bununla birlikte, ACELP'den TCX'e bir geçis islemi gerçeklestirildiginde ise Sekil 2c'de de gösterildigi üzere, özel bir geçis penceresi kullanilmaktadir. Söz konusu olan bu pencere, çerçevenin basinda, sifirdan l'e baslamakta olup, örtüsmesiz bir kisma 220 ve sonda 222'de gösterilen ve düz bir MDCT penceresinin örtüsme kismi 206 ile özdes olan bir örtüsme kismina sahiptir.
Bu pencere ilaveten, -12.5 ms ila pencerenin basindaki sifir arasinda ve en sonda 30 ve 35.5 arasinda, diger bir deyisle, ileriye dönük kismin 222 akabinde sifirlar ile takviye edilmektedir. Bu durum, dönüsüm uzunlugunun artmasina neden olmaktadir. Uzunluk 50 ms olsa da düz analiz/sentez penceresinin uzunlugu yalnizca 40 ms'dir. Öte yandan, bu durum verimliligi azaltmamakta veya bit hizini artirmamaktadir, ayrica söz konusu olan bu daha uzun yapidaki dönüsüm, ACELP'den TCX'e bir geçis meydana geldiginde gerekli olmaktadir. Ilgili dekoderde kullanilan geçis penceresi, Sekil 2c'de gösterilen pencere ile aynidir.
Bu noktadan itibaren, dekoder daha ayrintili bir biçimde açiklanacaktir. Sekil lb, enkode edilmis bir ses sinyalinin dekode edilmesi için bir ses dekoderini göstermektedir. Ses dekoderi, tahmin parametresi dekoderinin, l81'de alinan ve bir arayüze 182 girdilenmekte olan enkode edilmis ses sinyalinden bir tahmin kodlanmis çerçeve için bir veri dekode etme islemi gerçeklestirmek üzere konfigüre edildigi bir tahmin. parametresi dekoderini 180 içermektedir. Söz konusu dekoder ayrica, hat 181 üzerinde enkode edilmis ses sinyalinden bir dönüsüm kodlanmis çerçeve için bir veri dekode etme islemi gerçeklestirmek üzere bir dönüsüm parametresi dekoderi 183 içermektedir. Dönüsüm parametresi dekoderi, tercihen örtüsmeden etkilenen spektral-zaman dönüsümü gerçeklestirmek ve mevcut çerçeve ve gelecek bir çerçeve için veri elde etmek amaciyla dönüstürülmüs veriye bir sentez penceresi uygulamak üzere konfigüre edilmektedir.
Sentez penceresi, Sekil 2a'da da belirtildigi üzere, bir birinci örtüsme kismina, bitisik bir ikinci örtüsmesiz kisma ve yine bitisik üçüncü bir örtüsme kismina sahip olup, burada söz konusu olan üçüncü örtüsme kismi, yalnizca gelecek çerçeve için olan ses örnekleri ile iliskilendirilmektedir ve örtüsmesiz olan kisim ise yalnizca mevcut çerçeveye ait veri ile iliskilendirilmektedir. Ayrica, gelecek çerçeve için ses örneklerinden meydana gelen bir birinci kismi elde etmek üzere, örtüsme ve mevcut çerçeve için bir sentez penceresine ait üçüncü örtüsme kismi ile iliskilendirilen sentez penceresi örneklerinin ve gelecek çerçeve için bir sentez penceresinin birinci örtüsme kismi ile iliskilendirilen örneklerde bir sentez penceresinin eklenmesi için bir örtüsme-ekleyici 184 saglanmaktadir. Gelecek çerçeve için olan ses örneklerinin geri kalani, mevcut çerçevenin ve gelecek çerçevenin dönüsüm kodlanmis verileri içerdigi durumda, örtüsme-ekleme gerçeklestirilmeden elde edilen gelecek çerçeve için olan sentez penceresine ait ikinci örtüsmesiz kisim ile iliskilendirilen sentez pencerelenmis örneklerdir. Öte yandan, bir çerçeveden bir sonraki çerçeveye bir geçis söz konusu oldugu durumlarda, nihai olarak birlestiricinin 185 çiktisinda dekode edilmis ses verisi elde etmek üzere, bir kodlama modundan diger kodlama moduna iyi bir geçis isleminin gerçeklestirilebilmesi için gerekli dikkatin gösterilmesi gerektiginde bir birlestirici 185 fayda saglamaktadir.
Sekil lc, dönüsüm parametresi dekoderinin l83 yapilandirilmasina iliskin daha fazla detayi ortaya koymaktadir.
Dekoder, blogun 183 çiktisinda dekode edilmis spektral degerler elde etmek üzere, aritmetik dekode etme islemi veya Huffman dekode etme islemi ya da genel olarak entropi dekode etme islemi ve bunun akabinde bir dekuantizasyon islemi, gürültü doldurma, vb. gibi enkode edilmis spektral verilerin dekode edilmesi için gerekli olan tüm islemeleri gerçeklestirmek üzere konfigüre edilen bir dekoder isleme asamasi 183a içermektedir. Söz konusu olan bu spektral degerler, bir spektral agirliklandiriciya 183b girdilenmektedir. Spektral agirliklandirici l83b, spektral agirliklandirma 'verisini, enkoder tarafinda yer alan tahmin analiz blogundan üretilen ve dekoder tarafindan giris arayüzü 182 vasitasiyla alinan LPC verisi ile beslenmekte olan bir LPC agirliklandirma verisi hesaplayicisindan l83c almaktadir.
Bunun akabinde, bir ters spektral dönüstürme islemi gerçeklestirilmekte olup, söz konusu islem, gelecek çerçeve için olan veriden önce, örnegin örtüsme-ekleyiciye 184 saglanan bir birinci asama olarak tercihen bir DCT-IV' ters dönüsümünü 183d, bunun ardindan gelen bir yayma islemini ve sentez pencereleme islemesini l83e içermektedir. Örtüsme- ekleyici, bir sonraki gelecek çerçeve kullanilabilir oldugunda, örtüsme ekleme islemini gerçeklestirebilmektedir.
Bloklar 183d ve 183e, birlikte spektral/zaman dönüsümünü veya Sekil lc'de gösterilen düzenlemede, tercih edilen bir MDCT ters dönüsümünü (MDCT-l) meydana getirmektedir. Özellikle blok l83d, 20 ms'lik bir çerçeve için veriyi almakta ve blogun 183e yayma adimi dahilinde veri hacmini 40 ms'lik veri içinde, diger bir deyisle, öncekiyle karsilastirildiginda iki kat daha fazla veri olacak sekilde artirmakta ve bunun akabinde 40 Hß'lik bir uzunluga (pencere baslangicindaki ve sonundaki sifir kisimlar' birbirine eklendiginde) sahip olan sentez penceresi söz konusu olan bu 40 ms'lik veriye uygulanmaktadir. Ardindan, blogun 183e çikisinda, mevcut blok için olan veri ve gelecek blok için olan ileriye dönük kisim dahilindeki veri kullanilabilir hâle gelmektedir.
Sekil 1d, ilgili enkoder tarafi islemesini göstermektedir.
Sekil ld'nin baglaminda ortaya konan özellikler, enkode etme islemcisinde 104 veya Sekil 3a'da gösterilen ilgili bloklar tarafindan uygulanmaktadir. Sekil 3a'da gösterilen zaman- frekans dönüstürümü 310, tercihen bir MDCT olarak uygulanmakta olup, blok 310a içerisindeki pencereleme isleminin TCX pencereleyicisi 103d tarafindan gerçeklestirildigi bir pencereleme katlama asamasi 310a içermektedir. Böylelikle, Sekil 3a'da gösterilen blok 310 dahilindeki birinci islem, 40 ms'lik giris verisini, 20 ms'lik çerçeve verisine geri getirmek için katlama islemi olmaktadir. Bunun ardindan, örtüsme katkilarini almis olan katlanan. veriler ile blokta 310d gösterildigi gibi bir DCT-IV islemi gerçeklestirilmektedir. Blok , son çerçeve LPC penceresinden faydalanan analizden türetilen LPC verisini, bir (LPC'den MDCT'ye) bloga 302b saglamakta ve blok 302d ise spektral agirliklandirici 312 tarafindan spektral agirliklandirma isleminin gerçeklestirilebilimesi için agirliklandirma faktörlerini meydana getirmektedir. Tercihen, TCX enkode etme modunda, 20 ms'lik bir çerçeve için 16 LPC katsayisi, 16 MDCT bölgesi agirliklandirma faktörüne, tercihen bir oDFT'den (tek Ayrik Fourier Dönüsümü) faydalanilarak dönüstürülmektedir. 8 kHz'lik bir örnekleme hizina sahip NB modlari gibi diger modlar için ise LPC katsayilarinin sayisi gibi düsük bir sayida olabilmektedir. Daha yüksek örnekleme hizlarina sahip olan diger modlar için 16 LPC katsayisindan daha fazla sayida katsayi da olabilmektedir. Söz konusu olan buu oDFT isleminin sonucundar 16 agirliklandirmar degeri elde edilmekte olup, her bir agirliklandirma degeri, blok 310b vasitasiyla elde edilen spektral veriye ait bir bant ile iliskilendirilmektedir. Spektral agirliklandirma islemi, bu spektral agirliklandirma isleminin blok 312 dahilinde oldukça verimli bir biçimde gerçeklestirilebilmesi için tüm MDCT spektral degerlerinin bir bant için söz konusu olan bu bant ile iliskilendirilen ayni agirliklandirma degeri ile bölünmesi suretiyle gerçeklestirilmektedir. Böylelikle, teknikte de bilindigi üzere blok 314 tarafindan, diger bir deyisle, örnegin kuantizasyon ve entropi enkode etme islemleri gibi islemlerle ilaveten islenen, spektral olarak agirliklandirilmis spektral degerlerin çiktilanabilmesi için 16 bantlik MDCT degerlerinin her biri ilgili agirliklandirma faktörü ile bölünmektedir. Öte yandan, dekoder tarafinda, Sekil ld'deki bloga 312 karsilik gelen spektral agirliklandirma islemi, Sekil lc'de gösterilen spektral agirliklandirici 183b tarafindan gerçeklestirilecek bir çarpma islemi olacaktir.
Bu noktadan itibaren, LPC verisinin, LPC analiz penceresi tarafindan nasil meydana getirildiginin veya Sekil 2'de gösterilen iki LPC analiz penceresinin ACELP modunda veya TCX/MDCT modunda kullanilarak üretildiginin ana hatlariyla çizilebilmesi için Sekil 4a ve Sekil 4b açiklanacaktir.
LPC analiz penceresinin uygulanmasini takiben, LPC pencerelenmis verilerden faydalanilarak oto korelasyon hesaplamasi gerçeklestirilmektedir. Bunun ardindan, oto korelasyon fonksiyonuna bir Levinson-Durbin algoritmasi uygulanmaktadir. Akabinde, er bir LP analizi için olan 16 adet LP katsayisi, diger bir deyisle, orta çerçeve penceresi için olan 16 katsayi ve son çerçeve penceresi için olan 16 katsayi, ISP degerlerine dönüstürülmektedir. Böylelikle, oto korelasyon hesaplamasi isleminden, ISP dönüstürme islemine kadar olan adimlar, örnegin, Sekil 4a'da gösterilen blok 400 dahilinde gerçeklestirilmektedir.
Ardindan, hesaplama islemi enkoder tarafinda ISP katsayilarinin kuantizasyonu ile devam etmektedir. Bunun akabinde, ISP katsayilarinin kuantizasyonu geri alinmakta ve LP katsayisi bölgesine geri dönüstürülmektedir. Böylelikle, LPC verisi veya baska bir sekilde ifade edilmesi gerekirse, blok 400 dahilinde LPC katsayilarindan çok küçük ölçüde farkli olacak sekilde türetilen 16 adet LPC katsayisi (kuantizasyon ve yeniden kuantizasyon islemleri nedeniyle) elde edilmekte ve bunlar daha sonra adim 40l'de de gösterildigi üzere dördüncü alt çerçeve için dogrudan kullanilabilmektedir. Bununla birlikte diger alt çerçeveler numarali bölümünde de ana hatlari ile belirtildigi üzere, pek çok farkli ara degerleme isleminin gerçeklestirilmesi tercih edilmektedir. Üçüncü alt çerçeve için olan LPC verisi, blok 402 üzerinde de gösterildigi üzere son çerçeve ve orta çerçeve LPC verisinin ara degerlendirilmesi suretiyle hesaplanmaktadir. Tercih edilen ara degerleme islemi, her bir ilgili verinin iki ile bölünmesi ve birbirine eklenmesi suretiyle, bir baska deyisle, son çerçeve ve orta çerçeve LPC verilerinin bir ortalamasi ile gerçeklestirilmektedir. Blok 403 üzerinde de gösterildigi üzere, ikinci alt çerçeve için olan LPC verisini hesaplamak üzere, ilave bir ara degerleme islemi gerçeklestirilmektedir. Özellikle de nihayetinde ikinci alt çerçeve için LPC verisini hesaplamak üzere, sonuncu çerçevenin son çerçeve LPC verisine ait olan degerlerin %lO'u, mevcut çerçeve için olan orta çerçeve LPC verisinin %80'i ve mevcut çerçeveye ait son çerçeve için olan LPC verisinin degerlerinin %lO'u kullanilmaktadir.
Son olarak, blok 404 ile gösterildigi üzere, birinci alt çerçeve için LPC verisi, sonuncu çerçeveye ait çerçeve sonu LPC verisi ile mevcut çerçeveye ait çerçeve ortasi LPC verisinin arasinda bir ortalamanin olusturulmasi suretiyle hesaplanmaktadir.
ACELP enkode etme isleminin gerçeklestirilmesi için kuantize edilmis, bir baska deyisle, orta çerçeve analizi ve son çerçeve analizinden her iki LPC parametresi seti de bir dekodere iletilmektedir.
Bloklar 401 ila 404 vasitasiyla hesaplanan bireysel alt çerçeveler için olan sonuçlara bagli olarak, dekodere iletilecek olan ACELP verisini elde etmek üzere blok 405 üzerinde de gösterildigi gibi ACELP hesaplamalari gerçeklestirilmektedir.
Bu noktadan itibaren Sekil 4b açiklanmaktadir. Yine blok 400 üzerinde, orta çerçeve ve son çerçeve LPC verileri hesaplanmaktadir. Bununla birlikte, TCX enkode etme modu mevcut oldugundan, dekodere yalnizca çerçeve sonu LPC verisi iletilmekte olup, çerçeve ortasi LPC verisi dekodere gönderilmemektedir. Özellikle, bir tanesi LPC katsayilarinin kendilerine dekodere iletmemekte olup, digeri ise ISP dönüstürme ve kuantizasyon› islemleri sonrasinda. elde edilen degerleri iletmektedir. Dolayisiyla, LPC verisi olarak, çerçeve sonu LPC veri katsayilarindan türetilen kuantize edilmis ISP degerlerinin dekodere iletilmesi tercih edilmektedir.
Bununla birlikte, enkoderde, mevcut çerçeveye ait MDCT spektral verilerinin agirliklandirilmasi için agirliklandirma faktörlerini elde etmek üzere, adimlar 406 ila 408 üzerinde gösterilen prosedürler yine de gerçeklestirilmektedir. Bu amaçla, mevcut çerçeveye ait çerçeve sonu LPC verisi ve bir önceki çerçeveye ait olan çerçeve sonu LPC verisi ara degerlenmektedir. Bununla birlikte, LPC veri katsayilarinin, LPC analizinden türetildigi halleriyle dogrudan ara degerlendirilmesi tercih edilmeyen bir durumdur. Bunun yerine, ilgili LPC katsayilarindan türetilen kuantize ve yeniden dekuantize edilmis ISP degerlerinin ara degerlendirilmesi tercih edilmektedir. Dolayisiyla, blok 406 dahilinde kullanilan LPC verisinin yani sira, blok 401 ila 404 üzerindeki diger hesaplamalar için kullanilan LPC verileri de daima, tercihli olarak, kuantize ve yine dekuantize edilmekte olup, burada ISP verisi, her bir LPC analiz penceresi basina, orijinal 16 LPC katsayisindan türetilmektedir.
Blok 406 üzerindeki ara degerleme islemi, tercihen salt bir ortalama islemidir, bir baska deyisle, ilgili degerler eklenmekte ve iki ile bölünmektedir. Bunun ardindan, blok 407 içerisinde, mevcut çerçeveye ait MDCT spektral verileri, ara degerlenmis LPC verisinden faydalanilarak agirliklandirilmakta olup, blok 408 dahilinde ise nihayetinde enkodere ve bir dekodere iletilecek olan enkode edilmis spektral verileri elde etmek üzere, agirliklandirilmis spektral verilerin ilaveten islemesi gerçeklestirilmektedir. Dolayisiyla, adim 407 dahilinde gerçeklestirilen prosedürler bloga 312 ve Sekil 4d üzerindeki blok 408 dahilinde gerçeklestirilen prosedür ise Sekil 4d'de gösterilen bloga 314 karsilik. gelmektedir. Söz konusu karsilik gelen islemler, dekoder tarafinda gerçeklestirilmektedir. Böylelikle, bir tarafta spektral agirliklandirma degerlerinin hesaplanmasi veya diger tarafta ara degerleme yoluyla bireysel alt çerçeveler için LPC katsayilarinin hesaplanmasi için ayni ara degerleme islemleri, dekoder tarafinda da gerekli olmaktadir. Dolayisiyla Sekil 4a ve Sekil 4b'nin her ikisi de bloklar 401 ila 404 dahilindeki veya Sekil 4b'de gösterilen 406 üzerindeki prosedürlere iliskin olarak, dekoder tarafinda esit sekilde uygulanabilir olmaktadir.
Mevcut bulus özellikle düsük gecikmeli kodek uygulamalari için fayda saglamaktadir. Bunun anlami, bu türden kodeklerin, tercihen, 45 ms'den az ve hatta bazi durumlarda 35 ms'ye esit veya bundan daha az olabilen algoritmik veya sistematik bir gecikmeye sahip olacak sekilde tasarlanmakta oldugudur. Buna karsin, LPC analizi ve TCX analizi için olan ileriye dönük kisim, iyi bir ses kalitesinin elde edilebilmesi için gerekli olmaktadir. Dolayisiyla, her iki tezatli gereksinimler arasinda iyi bir ödünlesim gerekmektedir. Bir tarafta gecikme ve diger tarafta kalite arasinda iyi bir ödünlesimin, 20 ms'lik bir çerçeve uzunluguna sahip olan anahtarlamali bir ses enkoderi 'veya dekoderi vasitasiyla. elde edilebildigi, ancak bununla. birlikte 15 ila 30 ms araliginda uzunluklara sahip çerçevelerin de kabul edilebilir sonuçlar verdigi fark edilmistir. Öte yandan, gecikme ile ilgili sorunlar söz konusu oldugunda, lO ms'lik bir ileriye dönük kismin kabul edilebilir oldugu, bununla birlikte 5 ms ve 20 ms araligindaki degerlerin de ilgili uygulamaya bagli olarak faydali olabildigi kesfedilmistir. Ayrica, ileriye dönük kisim ve çerçeve uzunlugu arasindaki bagintinin, 0.5'lik bir degere sahip oldugu bir durumda faydali olmasinin yani sira, 0.4 ila 0.6'lik aralikta bulunan degerlerinde kullanisli olabildigi bulunmustur. Ayrica, her ne kadar mevcut bulus bir tarafta ACELP ile ve diger tarafta ise MDCT-TCX ile açiklanmis olsa da CELP gibi zaman bölgesinde çalisan diger algoritmalar veya baska herhangi bir tahmin veya dalga formu algoritmalari da kullanisli olmaktadir. TCX/MDCT hususunda, MDST gibi diger dönüsüm bölgesi kodlama algoritmalari veya baska herhangi dönüsüm tabanli algoritmalar da uygulanabilmektedir.
Ayni durum, LPC analizi ve LPG hesaplamasinin spesifik uygulamasi için de geçerli olmaktadir. Yukarida açiklamasi verilen prosedürlerin kullanilmasi tercih edilmektedir, ancak bununla. birlikte, söz konusu prosedürlerin bir LPC analiz penceresine dayali oldugu nüddetçe, hesaplama/ara degerleme ve analiz için olan diger prosedürler de kullanilabilmektedir.
Her ne kadar mevcut bulusun bazi yönleri bir cihaz baglaminda açiklanmis olsa da söz konusu olan bu yönlerin ayni zamanda, bir blok 'veya cihazin bir yöntem adimina veya bir yöntem adiminin bir özelligine karsilik gelmekte oldugu ilgili yöntemin bir açiklamasini temsil etmekte oldugu oldukça açiktir. Benzer sekilde, bir yönteni adimi baglaminda açiklanmis olan yönlerin ise ilgili bir cihaza ait ilgili bir blogun, ögenin veya özelligin bir açiklamasini temsil ettigi açikça görülebilmektedir.
Belirli uygulama gereksinimlerine bagli olarak, mevcut bulusun düzenlemeleri, donanim, veya yazilim, dahilinde uygulanabilmektedir. Söz konusu uygulama, örnegin, bir DISKET, bir DVD, bir CD, bir ROM, bir PROM, bir EPROM, bir EEPROM veya bir FLAS BELLEK gibi ilgili yöntemin gerçeklestirilebilecegi bir biçimde programlanabilir bir bilgisayar sistemi ile birlikte çalisan (veya birlikte çalisma yetisine sahip olan) elektronik olarak okunabilir kontrol sinyallerinin üzerinde depolanmakta oldugu dijital bir depolama ortami kullanilarak gerçeklestirilebilmektedir.
Mevcut bulusa göre olan birtakim düzenlemeler, burada açiklamasi verilen yöntemlerden birinin gerçeklestirilebilecegi bir biçimde, programlanabilir bir bilgisayar sistemi ile birlikte çalisabilme yetisine sahip elektronik olarak okunabilir kontrol sinyallerini içeren geçici olmayan bir veri tasiyicisi içermektedir.
Genel olarak, mevcut bulusun düzenlemeleri, bir program koduna sahip olan bir bilgisayar programi olarak uygulanabilmekte olup, burada söz konusu olan program kodu, bilgisayar programinin bir bilgisayar üzerinde çalistirildigi durumlarda burada açiklamasi verilen yöntemlerden birini gerçeklestirmek için isletici olmaktadir. Söz konusu program kodu, örnegin, makine tarafindan okunabilir bir tasiyici üzerinde depolanabilmektedir.
Mevcut bulusun diger düzenlemeleri ise burada açiklamasi verilen yöntemlerden birini gerçeklestirmek için olan bilgisayar programinin üzerinde depolandigi makine tarafindan okunabilir bir tasiyiciyi içermektedir.
Bu dogrultuda, bir baska sekilde ifade etmek gerekirse, bulus konusu yöntemin bir düzenlemesi, bilgisayar programi bir bilgisayar üzerinde çalistirildiginda, burada açiklamasi verilen yöntemlerden birini gerçeklestirmek için bir program koduna sahip bir bilgisayar programi olmaktadir.
Dolayisiyla, bulus konusu yöntemin bir baska düzenlemesi ise burada açiklamasi verilen yöntemlerden birini gerçeklestirmek için olan bilgisayar programinin üzerinde kayitli olarak içeren bir veri tasiyicisidir (veya bir dijital depolama ortami ya da bilgisayar tarafindan okunabilir bir ortam).
Bu dogrultuda, bulus konusu yöntemin bir diger düzenlemesi ise burada açiklamasi verilen yöntemlerden birini gerçeklestirmek için bilgisayar programini temsil eden bir veri akisi veya bir sinyal sekansidir. Söz konusu veri akisi veya sinyal sekansi, örnegin, Internet gibi bir veri iletisim baglantisi tarafindan aktarilmak üzere konfigüre edilebilmektedir.
Bir diger düzenleme ise burada açiklamasi verilen yöntemlerden birini gerçeklestirmek üzere konfigüre edilen veya uyarlanan, örnegin bir bilgisayar veya programlanabilir bir mantik cihazi gibi bir isleme yolu içermektedir.
Bir baska düzenleme ise burada açiklamasi verilen yöntemlerden birinin gerçeklestirilmesi için olan bilgisayar programini üzerinde yüklenmis hâlde bulunduran bir bilgisayari içermektedir.
Bazi düzenlemelerde, programlanabilir bir mantik cihazi (örnegin, sahada programlanabilir bir kapi dizisi) burada açiklamasi verilen yöntemlere ait fonksiyonelliklerin bazilarini veya tamamini gerçeklestirmek üzere kullanilabilmektedir. Bazi düzenlemelerde ise sahada programlanabilir' bir kapi dizisi, burada açiklamasi verilen yöntemlerden, birini gerçeklestirmek. üzere bir mikro islemci ile birlikte çalisabilmektedir. Genel olarak, söz konusu yöntemler, tercihen herhangi bir donanim cihazi ile gerçeklestirilmektedir.
Yukarida açiklamasi verilen düzenlemeler, sadece mevcut bulusa ait prensiplerin tasvir edilmesi amaciyla saglanmaktadir.
Düzenlemelere ait modifikasyon ve varyasyonlarin ve burada açiklamasi verilen detaylarin, teknikte uzman kisiler tarafindan anlasilabilecegi açikça görülmektedir. Bu dogrultuda, buradaki maksat, mevcut bulusun burada düzenlemelerin açiklamasi ve izahati yoluyla sunulan spesifik detaylar ile degil, yalnizca asagida belirtilen patent istemlerinin kapsami ile sinirlandirilmasidir.

Claims (1)

  1. ISTEMLER m Bir ses örnekleri akisina (100) sahip bir ses sinyalinin enkode edilmesi için cihaz olup, bir tahmin analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen bir akisa bir tahmin kodlamasi analizi penceresi (200) uygulamak ve bir dönüsüm analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen akisa bir dönüsüm kodlamasi analiz penceresi (204) uygulamak üzere bir pencereleyici (102), burada dönüsüm kodlamasi analiz penceresi, ses örneklerine ait mevcut bir çerçeve içerisindeki ses örnekleriyle ve bir dönüsüm kodlamasi ileriye dönük kismi (206) olan ses örneklerine ait gelecek çerçevenin ön tanimlanmis bir kisminin ses örnekleri ile iliskilendirilmektedir, burada tahmin kodlamasi analiz penceresi ise mevcut çerçeveye ait ses örneklerinin en az bir kismi ile ve bir tahmin kodlamasi ileriye dönük kismi (208) olan gelecek çerçevenin ön tanimli bir kismina ait ses örnekleri ile iliskilendirilmektedir, burada. dönüsüm kodlamasi ileriye dönük kismi (206) ve tahmin kodlamasi ileriye dönük kismi (208) birbiriyle özdes veya birbirlerinden, tahmin kodlamasi ileriye dönük kisminin (208) %20'sinden daha az olacak sekilde veya dönüsüm kodlamasi ileriye dönük kisminin (206) tahmin analizi için pencerelenmis veriden faydalanmak suretiyle mevcut çerçeve için tahmin kodlanmis veri üretmekr için veya dönüsüm analizi için pencerelenmis veriden faydalanmak suretiyle mevcut çerçeve için dönüsüm kodlanmis veri üretmek için bir enkode etme islemcisi (104) içermektedir Istem 1'e göre cihaz olup, burada dönüsüm kodlamasi analiz penceresi (204), dönüsüm kodlamasi ileriye dönük kismi (206) içine dogru genisleyen örtüsmesiz bir kisim içermektedir. Isten 1 veya Istem 2'ye göre cihaz olup, burada dönüsüm kodlamasi analiz penceresi (204), mevcut çerçevenin basindan baslayan ve örtüsmesiz kismin (208) baslangicinda son bulan bir diger örtüsme kismini (210) içermektedir. Istem 1'e göre cihaz olup, burada pencereleyici (102), tahmin kodlamasindan dönüsüm› kodlamasina, bir çerçeveden bir sonraki çerçeveye olan geçis islemi için yalnizca bir baslama penceresi (220, 222) kullanmak üzere konfigüre edilmektedir ve burada baslama penceresi, bir çerçeveden bir sonraki çerçeveye, dönüsüm. kodlamasindan tahmin kodlamasina bir geçis için kullanilmamaktadir. Önceki istemlerden birine göre cihaz olup, ayrica asagidakileri içermektedir: mevcut çerçeve için enkode edilmis bir sinyali çiktilamak üzere bir çikis arayüzü (106) ve mevcut çerçeve için tahmin kodlanmis veriyi ya da dönüsüm kodlanmis veriyi çiktilamak üzere enkode etme islemcisinin (104) kontrol edilmesi için bir enkode etme modu seçicisi (112), burada enkode etme modu seçicisi (112), çerçevenin tamami için enkode edilmis sinyalin tahmin kodlanmis veriyi ya da dönüsüm kodlanmis veriyi içermesini saglamak üzere, çerçevenin tamami için yalnizca tahmin kodlamasi veya dönüsüm kodlamasi arasinda geçis yapmak üzere konfigüre edilmektedir. burada pencereleyici (102), tahmin kodlamasi analiz penceresine ek olarak, mevcut çerçevenin baslangicina yerlestirilen ses örnekleri ile iliskilendirilen ilave bir tahmin kodlamasi analiz penceresinden (202) faydalanmaktadir ve burada tahmin kodlamasi analiz penceresi (200) mevcut çerçevenin baslangicina yerlestirilmekte olan ses örnekleri ile iliskilendirilmemektedir. Önceki istemlerden birine göre cihaz olup, burada çerçeve, birden çok sayida alt çerçeveyi içermektedir, burada tahmin analiz penceresi (200) bir alt çerçevenin merkezine merkezlenmektedir ve burada dönüsüm kodlamasi analiz penceresi ise iki alt çerçeve arasindaki bir sinira merkezlenmektedir. Istem 7'ye göre cihaz olup, burada tahmin analiz penceresi (200) çerçeveye ait son alt çerçevenin merkezinde merkezlenmektedir, burada diger analiz penceresi (202) mevcut çerçeveye ait ikinci alt çerçevenin bir merkezinde merkezlenmektedir, burada dönüsüm kodlamasi analiz penceresi, mevcut çerçeveye ait üçüncü ve dördüncü alt çerçeve arasindaki bir sinirda merkezlenmektedir ve burada mevcut çerçeve, dört alt çerçeveye bölünmektedir. Önceki istemlerden birine göre cihaz olup, burada bir diger tahmin kodlamasi analiz penceresi (202), gelecek çerçeve dahilinde bir ileriye dönük kisma sahip degildir ve mevcut çerçeveye ait örnekler ile iliskilendirilmektedir. Önceki istemlerden birine göre cihaz olup, burada dönüsüm kodlamasi analiz penceresi ilaveten, dönüsüm kodlamasi analiz penceresinin zamansal açidan tani bir uzunlugunun, mevcut çerçevenin zamansal açidan uzunlugunun iki kati olabilmesi için pencerenin bir baslangicindan önce bir sifir kismi ve pencerenin sonunun arkasindan gelen bir sifir kismi içermektedir. Istem lO'a göre cihaz olup, burada tahmin kodlamasi modundan, dönüsüm kodlamasi moduna, bir çerçeveden bir sonraki çerçeveye olan bir geçis için pencereleyici (102) tarafindan bir geçis penceresi kullanilmaktadir, burada geçis penceresi, çerçevenin basindan baslayan bir birinci örtüsmesiz kismi ve örtüsmesiz kismin sonundan baslayan ve gelecek çerçeve içerisine uzanan bir örtüsme kismini içermektedir ve burada gelecek çerçeve içerisine uzanan örtüsme kismi, analiz penceresine ait dönüsüm kodlamasi ileriye dönük kisminin uzunlugu ile özdes bir uzunluga sahiptir. Önceki istemlerden birine göre cihaz olup, burada dönüsüm kodlamasi analiz penceresinin zamansal açidan bir uzunlugu, tahmin kodlamasi analiz penceresinin (200, 202) zamansal açidan uzunlugundan daha büyüktür. Önceki istemlerden birine göre cihaz olup, ayrica asagidakileri içermektedir: mevcut çerçeve için enkode edilmis bir sinyali çiktilamak üzere bir çikis arayüzü (106) ve mevcut çerçeve için tahmin kodlanmis veriyi ya da dönüsüm. kodlanmis veriyi çiktilamak. üzere enkode etme islemcisinin (104) kontrol edilmesi için bir enkode etme modu seçicisi (112), burada pencere (102), tahmin kodlamasi penceresinden önce, mevcut çerçeve içerisinde konumlu olan bir diger tahmin kodlamasi penceresini kullanmak 'üzere konfigüre edilmektedir ve burada enkode etme modu seçicisi (112), enkode etme islemcisini (104) kontrol etmek, dönüsüm kodlanmis verinin, çikis arayüzüne çiktilandigi durumda, yalnizca tahmin kodlamasi penceresinden türetilen ileriye dönük tahmin kodlamasi analiz verisini iletmek ve diger tahmin kodlamasi penceresinden türetilen tahmin kodlamasi analiz verisini iletmemek 'üzere konfigüre edilmektedir burada enkode etme modu seçicisi (112), enkode etme islemcisini (104) kontrol etmek, tahmin kodlamasi penceresinden türetilen tahmin kodlamasi analiz verisini iletmek ve tahmin kodlanmis verinin çikis arayüzüne çiktilandigi durumda, diger tahmin kodlamasi penceresinden türetilen tahmin kodlamasi analiz verisini iletmek üzere konfigüre edilmektedir. M.Önceki istemlerden birine göre cihaz olup, burada enkode etme islemcisi (104): bir tahmin analizi için pencerelenmis veriden (100a) mevcut çerçeve için tahmin kodlamasi verisini türetmek üzere bir tahmin kodlamasi analiz cihazi (302); tahmin kodlama verisinden faydalanarak mevcut çerçeve için ses örneklerinden filtre verisini hesaplamak için bir filtre asamasi (304) ve mevcut çerçeveler için tahmin kodlamasi parametrelerini hesaplamak üzere bir tahmin kodlayicisi parametre hesaplayicisi (306) içeren bir tahmin kodlamasi kolu ve dönüsüm kodlamasi algoritmasi için pencere verisinin spektral bir gösterime dönüstürmek üzere bir zaman-spektral dönüstürücü (310), agirliklandirilmis spektral veri elde etmek için tahmin kodlamasi verisinden türetilen agirliklandirilmis agirliklandirma verisinden faydalanarak spektral verileri agirliklandirmak üzere bir spektral agirliklandirici (312) ve mevcut çerçeve için dönüsüm kodlanmis veri elde etmek üzere, agirliklandirilmis spektral verinin islenmesi için bir spektral veri islemcisi (314) içeren bir dönüsüm ß.Bir ses örnekleri akisina (100) sahip bir ses sinyalinin enkode edilmesi için yöntem olup, bir tahmin analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen bir akisa bir tahmin kodlamasi analizi penceresinin (200) uygulanmasi ve bir dönüsüm analizine iliskin pencerelenmis veri elde etmek için ses örneklerinden meydana gelen akisa bir dönüsüni kodlamasi analiz penceresinin (204) uygulanmasi (102), burada dönüsüm kodlamasi analiz penceresi, ses örneklerine ait mevcut bir çerçeve içerisindeki ses örnekleriyle ve bir dönüsüm kodlamasi ileriye dönük kismi (206) olan ses örneklerine ait gelecek çerçevenin ön tanimlanmis bir kisminin ses örnekleri ile iliskilendirilmektedir, burada tahmin kodlamasi analiz penceresi ise mevcut çerçeveye ait ses örneklerinin en az bir kismi ile ve bir tahmin kodlamasi ileriye dönük kismi (208) olan gelecek çerçevenin ön tanimli bir kismina ait ses örnekleri ile iliskilendirilmektedir, burada dönüsüm kodlamasi ileriye dönük kismi (206) ve tahmin kodlamasi ileriye dönük kismi (208) birbiriyle özdes veya birbirlerinden, tahmin kodlamasi ileriye dönük kisminin (208) %20'sinden daha az olacak sekilde veya dönüsüm kodlamasi ileriye dönük kisminin (206) %20'sinden daha az olacak sekilde farklidirlar ve tahmin analizi için olan pencerelenmis veriden faydalanarak mevcut çerçeve için tahmin kodlanmis verinin üretilmesi (104) veya dönüsüm analizi için olan pencerelenmis veriden faydalanarak mevcut çerçeve için dönüsüm kodlanmis verinin üretilmesi islem adimlarini içermektedir. 1& Istem 15'e göre bir ses sinyalinin enkode edilmesi için olan yöntemin bir bilgisayar üzerinde çalistirildiginda gerçeklestirilmesi için bir program koduna sahip bilgisayar programidir.
TR2019/08598T 2011-02-14 2012-02-14 Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem. TR201908598T4 (tr)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
PCT/EP2012/052450 WO2012110473A1 (en) 2011-02-14 2012-02-14 Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion

Publications (1)

Publication Number Publication Date
TR201908598T4 true TR201908598T4 (tr) 2019-07-22

Family

ID=71943595

Family Applications (1)

Application Number Title Priority Date Filing Date
TR2019/08598T TR201908598T4 (tr) 2011-02-14 2012-02-14 Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem.

Country Status (19)

Country Link
US (1) US9047859B2 (tr)
EP (3) EP3503098B1 (tr)
JP (1) JP6110314B2 (tr)
KR (2) KR101698905B1 (tr)
CN (2) CN103503062B (tr)
AR (3) AR085221A1 (tr)
AU (1) AU2012217153B2 (tr)
BR (1) BR112013020699B1 (tr)
CA (1) CA2827272C (tr)
ES (1) ES2725305T3 (tr)
MX (1) MX2013009306A (tr)
MY (1) MY160265A (tr)
PL (1) PL2676265T3 (tr)
PT (1) PT2676265T (tr)
SG (1) SG192721A1 (tr)
TR (1) TR201908598T4 (tr)
TW (2) TWI479478B (tr)
WO (1) WO2012110473A1 (tr)
ZA (1) ZA201306839B (tr)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9972325B2 (en) 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
EP2927905B1 (en) 2012-09-11 2017-07-12 Telefonaktiebolaget LM Ericsson (publ) Generation of comfort noise
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
FR3011408A1 (fr) * 2013-09-30 2015-04-03 Orange Re-echantillonnage d'un signal audio pour un codage/decodage a bas retard
EP3000110B1 (en) * 2014-07-28 2016-12-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
FR3024581A1 (fr) * 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
KR102413692B1 (ko) * 2015-07-24 2022-06-27 삼성전자주식회사 음성 인식을 위한 음향 점수 계산 장치 및 방법, 음성 인식 장치 및 방법, 전자 장치
KR102192678B1 (ko) 2015-10-16 2020-12-17 삼성전자주식회사 음향 모델 입력 데이터의 정규화 장치 및 방법과, 음성 인식 장치
SG11201806246UA (en) 2016-01-22 2018-08-30 Fraunhofer Ges Forschung Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization
US10249307B2 (en) * 2016-06-27 2019-04-02 Qualcomm Incorporated Audio decoding using intermediate sampling rate
WO2020089215A1 (en) * 2018-10-29 2020-05-07 Dolby International Ab Methods and apparatus for rate quality scalable coding with generative models
US11955138B2 (en) * 2019-03-15 2024-04-09 Advanced Micro Devices, Inc. Detecting voice regions in a non-stationary noisy environment

Family Cites Families (126)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG70558A1 (en) 1991-06-11 2000-02-22 Qualcomm Inc Variable rate vocoder
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
CN1090409C (zh) 1994-10-06 2002-09-04 皇家菲利浦电子有限公司 采用不同编码原理的传送系统
US5537510A (en) 1994-12-30 1996-07-16 Daewoo Electronics Co., Ltd. Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
JPH10276095A (ja) * 1997-03-28 1998-10-13 Toshiba Corp 符号化器及び復号化器
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) * 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
JP2003501925A (ja) 1999-06-07 2003-01-14 エリクソン インコーポレイテッド パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
DE60031002T2 (de) 2000-02-29 2007-05-10 Qualcomm, Inc., San Diego Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US7901873B2 (en) 2001-04-23 2011-03-08 Tcp Innovations Limited Methods for the diagnosis and treatment of bone disorders
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
DE60303689T2 (de) 2002-09-19 2006-10-19 Matsushita Electric Industrial Co., Ltd., Kadoma Audiodecodierungsvorrichtung und -verfahren
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
JP4191503B2 (ja) * 2003-02-13 2008-12-03 日本電信電話株式会社 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
WO2005043511A1 (en) 2003-10-30 2005-05-12 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118835B (fi) 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
EP1852851A1 (en) 2004-04-01 2007-11-07 Beijing Media Works Co., Ltd An enhanced audio encoding/decoding device and method
GB0408856D0 (en) 2004-04-21 2004-05-26 Nokia Corp Signal encoding
CA2566368A1 (en) 2004-05-17 2005-11-24 Nokia Corporation Audio encoding with different coding frame lengths
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
WO2006079349A1 (en) 2005-01-31 2006-08-03 Sonorit Aps Method for weighted overlap-add
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
US20070147518A1 (en) 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
NZ562183A (en) 2005-04-01 2010-09-30 Qualcomm Inc Systems, methods, and apparatus for highband excitation generation
EP1899958B1 (en) 2005-05-26 2013-08-07 LG Electronics Inc. Method and apparatus for decoding an audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
PL1897085T3 (pl) 2005-06-18 2017-10-31 Nokia Technologies Oy System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
CN101371295B (zh) 2006-01-18 2011-12-21 Lg电子株式会社 用于编码和解码信号的设备和方法
US20090281812A1 (en) 2006-01-18 2009-11-12 Lg Electronics Inc. Apparatus and Method for Encoding and Decoding Signal
US8032369B2 (en) 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
EP2044575B1 (en) 2006-07-24 2017-01-11 Sony Corporation A hair motion compositor system and optimization techniques for use in a hair/fur graphics pipeline
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
DE102006049154B4 (de) * 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
BR122019024992B1 (pt) 2006-12-12 2021-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo
FR2911227A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) * 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) * 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
PT3550564T (pt) 2007-08-27 2020-08-18 Ericsson Telefon Ab L M Análise/síntese espectral de baixa complexidade utilizando resolução temporal selecionável
JP5264913B2 (ja) 2007-09-11 2013-08-14 ヴォイスエイジ・コーポレーション 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8879643B2 (en) 2008-04-15 2014-11-04 Qualcomm Incorporated Data substitution scheme for oversampled data
US8768690B2 (en) 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
EP2144171B1 (en) * 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
ES2657393T3 (es) * 2008-07-11 2018-03-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y descodificador de audio para codificar y descodificar muestras de audio
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
JP5369180B2 (ja) * 2008-07-11 2013-12-18 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ サンプリングされたオーディオ信号のフレームを符号化するためのオーディオエンコーダおよびデコーダ
RU2621965C2 (ru) 2008-07-11 2017-06-08 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
WO2010003532A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
BRPI0914056B1 (pt) 2008-10-08 2019-07-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificação/decodificação de áudio comutado multi-resolução
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
CN102334160B (zh) * 2009-01-28 2014-05-07 弗劳恩霍夫应用研究促进协会 音频编码器,音频解码器,编码和解码音频信号的方法
EP2214165A3 (en) 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
US8805694B2 (en) 2009-02-16 2014-08-12 Electronics And Telecommunications Research Institute Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding
PL2234103T3 (pl) 2009-03-26 2012-02-29 Fraunhofer Ges Forschung Urządzenie i sposób manipulacji sygnałem audio
CA2763793C (en) 2009-06-23 2017-05-09 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
MX2012004593A (es) 2009-10-20 2012-06-08 Fraunhofer Ges Forschung Codec multimodo de audio y codificacion de celp adaptada a este.
JP5243661B2 (ja) * 2009-10-20 2013-07-24 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ オーディオ信号符号器、オーディオ信号復号器、オーディオコンテンツの符号化表現を供給するための方法、オーディオコンテンツの復号化表現を供給するための方法、および低遅延アプリケーションにおける使用のためのコンピュータ・プログラム
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及系统
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
WO2011147950A1 (en) 2010-05-28 2011-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-delay unified speech and audio codec
ES2710554T3 (es) * 2010-07-08 2019-04-25 Fraunhofer Ges Forschung Codificador que utiliza cancelación del efecto de solapamiento hacia delante

Also Published As

Publication number Publication date
BR112013020699B1 (pt) 2021-08-17
EP3503098C0 (en) 2023-08-30
JP6110314B2 (ja) 2017-04-05
EP2676265A1 (en) 2013-12-25
EP2676265B1 (en) 2019-04-10
TWI563498B (en) 2016-12-21
US9047859B2 (en) 2015-06-02
RU2013141919A (ru) 2015-03-27
AR102602A2 (es) 2017-03-15
EP4243017A2 (en) 2023-09-13
CN103503062A (zh) 2014-01-08
WO2012110473A1 (en) 2012-08-23
KR20130133846A (ko) 2013-12-09
CA2827272A1 (en) 2012-08-23
ZA201306839B (en) 2014-05-28
KR101698905B1 (ko) 2017-01-23
TW201301262A (zh) 2013-01-01
AU2012217153B2 (en) 2015-07-16
MY160265A (en) 2017-02-28
EP3503098B1 (en) 2023-08-30
EP3503098A1 (en) 2019-06-26
TW201506907A (zh) 2015-02-16
JP2014510305A (ja) 2014-04-24
MX2013009306A (es) 2013-09-26
EP4243017A3 (en) 2023-11-08
BR112013020699A2 (pt) 2016-10-25
CN103503062B (zh) 2016-08-10
ES2725305T3 (es) 2019-09-23
AR098557A2 (es) 2016-06-01
US20130332148A1 (en) 2013-12-12
CA2827272C (en) 2016-09-06
CN105304090A (zh) 2016-02-03
PT2676265T (pt) 2019-07-10
SG192721A1 (en) 2013-09-30
CN105304090B (zh) 2019-04-09
AU2012217153A1 (en) 2013-10-10
KR101853352B1 (ko) 2018-06-14
AR085221A1 (es) 2013-09-18
TWI479478B (zh) 2015-04-01
KR20160039297A (ko) 2016-04-08
PL2676265T3 (pl) 2019-09-30

Similar Documents

Publication Publication Date Title
TR201908598T4 (tr) Bir ses sinyalinin hizalı bir ileriye dönük kısımdan faydalanılarak enkode edilmesi için cihaz ve yöntem.
CA2730195C (en) Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
RU2485606C2 (ru) Схема кодирования/декодирования аудио сигналов с низким битрейтом с применением каскадных переключений
AU2009267466B2 (en) Audio encoder and decoder for encoding and decoding audio samples
EP2676268B1 (en) Apparatus and method for processing a decoded audio signal in a spectral domain
AU2013200679B2 (en) Audio encoder and decoder for encoding and decoding audio samples
RU2574849C2 (ru) Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра
ES2963367T3 (es) Aparato y procedimiento de decodificación de una señal de audio usando una parte de anticipación alineada
EP3002751A1 (en) Audio encoder and decoder for encoding and decoding audio samples