TR201910075T4 - Nicemleme sonrası kazanım düzeltmeli ses dekoderi. - Google Patents

Nicemleme sonrası kazanım düzeltmeli ses dekoderi. Download PDF

Info

Publication number
TR201910075T4
TR201910075T4 TR2019/10075T TR201910075T TR201910075T4 TR 201910075 T4 TR201910075 T4 TR 201910075T4 TR 2019/10075 T TR2019/10075 T TR 2019/10075T TR 201910075 T TR201910075 T TR 201910075T TR 201910075 T4 TR201910075 T4 TR 201910075T4
Authority
TR
Turkey
Prior art keywords
gain
shape
accuracy
estimating
measure
Prior art date
Application number
TR2019/10075T
Other languages
English (en)
Inventor
Norvell Erik
Grancharov Volodya
Original Assignee
Ericsson Telefon Ab L M
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ericsson Telefon Ab L M filed Critical Ericsson Telefon Ab L M
Publication of TR201910075T4 publication Critical patent/TR201910075T4/tr

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

Ayrı kazanım ve şekil görünümleri ile kodlanmış olan sesin kodunu çözmede kullanım için bir kazanım ayarlama aygıtı (60) şekil görünümünün (Ñ(b)) bir doğruluk ölçüsünü (A(b)) tahmin etmek ve tahmini doğruluk ölçüsüne (A(b)) bağlı olarak bir kazanım düzeltme (gc(b)) belirlemek üzere yapılandırılmış bir doğruluk ölçer (62) içerir. Kazanım ayarlama aygıtı (60) kazanım görünümünü (Ê(b)) belirlenen kazanım düzeltmeye bağlı olarak ayarlamak üzere yapılandırılmış bir zarf ayarlayıcı (64) da içerir.

Description

TARIFNAME NICEMLEME SONRASI KAZANIM DÜZELTMELI SES DEKODERI AÇIKLAMA TEKNIK ALAN Bu teknoloji nicemlemenin bir kazanim görünümüne ve bir sekil görünümüne bölündügü nicemleme semalarina dayanan kazanim-sekil ses kodlama denen ses kodlamada kazanim düzeltmeye ve özellikle nicemleme sonrasi kazanim düzeltmeye iliskindir.
BILINEN HUSUSLAR Modern telekomünikasyon hizmetlerinin farkli tipte birçok ses sinyalini yönetmesi beklenir.
Ana ses içerigi konusma sinyalleri oldugu için, müzik ve müzik ve konusma karisimlari gibi daha fazla genel sinyali yönetme arzusu vardir. Telekomünikasyon aglarinda kapasite sürekli artmakla birlikte, beher iletisim kanali için gerekli bant genisligini sinirlamak hala önemlidir.
Mobil aglarda her bir çagri için daha küçük iletim bant genislikleri hem mobil cihazda, hem de baz istasyonda daha düsük güç tüketimi saglar. Bu mobil operatör için enerji ve maliyet tasarrufu demektir, son kullanici ise daha uzun pil Ömrü ve daha uzun konusma süresi yasayacaktir. Ayrica, beher kullanici için daha az tüketilen bant genisligiyle mobil ag daha fazla sayida kullaniciya paralel hizmet verebilir.
Günümüzde, mobil ses hizmetleri için baskin sikistirma teknolojisi düsük bant genisliklerinde konusma için iyi ses kalitesi elde eden CELP°tir (Kod Uyarilmis Lineer Tahmin). CELP AMR (Uyarlamali Çoklu Hiz), AMR-WB (Uyarlamali Çoklu Hiz Genisbant) ve GSM-EFR (Mobil Komünikasyon için Global Sistem - Güçlendirilmis Tam Hiz) gibi tahsis edilen kodeklerde yaygin biçimde kullanilir. Ancak, müzik gibi genel ses sinyalleri için CELP teknolojisinin zayif performansi vardir. Bu sinyaller frekans dönüsüm bazli kodlama, örnegin Ancak, dönüsüm bölgesi kodekleri genelde konusma kodeklerinden daha yüksek bit hizinda çalisir. Konusma ve genel ses bölgeleri arasinda kodlama açisindan bir bosluk vardir ve dönüsüm bölgesi kodeklerinin daha düsük bit hizlarinda performansinin arttirilmasi istenir.
Dönüsüm bölgesi kodekleri frekans bölgesi dönüsüm katsayilarinin kompakt bir görünümünü gerektirir. Bu görünümler çogu zaman katsayilarin gruplar halinde kodlandigi vektör nicemlemeye (VQ) dayanir. Vektör nicemlemeye yönelik çesitli usullerin arasinda kazanim- sekil(VQ) vardir. Bu yaklasim ayri ayri katsayilari kodlamadan önce vektörlere normallestirme uygular. Ayri ayri kodlanabilen normallestirme faktörüne ve normallestirilmis katsayilara vektörün kazanimi ve sekli olarak atif yapilir. Kazanim-sekilyapisinin birçok faydasi vardir. Kazanimi ve sekli bölerek kodek kazanim nicemleyiciyi tasarlayarak degisen kaynak girdi seviyelerine kolayca uyarlanabilir. Kazanim ve sekil farkli frekans bölgelerinde farkli önem tasiyabilecegi algisal açidan da faydalidir. Son olarak, kazanim-sekil bölümü nicemleyici tasariini basitlestirir ve kisitlanmamis bir vektör nicemleyiciye kiyasla bellek ve hesaplama kaynaklari açisindan daha az karmasik yapar. Bir kazanim-sekil nicemleyicinin bir islevsel genel görünümü Sekil Vdegörülebilir.
Bir frekans bölgesi spektrumuna uygulanirsa, kazanim-sekil yapisi bir spektral zarf ve hassas yapi görünümü olusturmak üzere kullanilabilir. Kazaniiii degerlerinin sirasi spektruinun zarfini olusturur, sekil vektörleri ise spektral detayi verir. Algisal bir açidan insan isitme sisteminin frekans çözünümünü izleyen üniform olinayan bir bant yapisi kullanilarak spektrumu bölmek faydalidir. Bu genelde dar bant genisliklerinin düsük frekanslar için, daha genis bant genisliklerinin ise yüksek frekanslar için kullanildigi anlamina gelir. Spektral hassas yapinin algisal önemi frekansla degisir, ama sinyalin niteliklerine de bagimlidir.
Dönüsüm kodlayicilar hassas yapinin önemli bölümlerini belirlemek ve mevcut kaynaklari en önemli bölümlere tahsis etmek üzere çogu zaman bir isitme modeli kullanir. Spektral zarf çogu zaman bu isitme modeline girdi olarak kullanilir. Sekil kodlayici tahsis edilen bitleri kullanarak sekil vektörlerini nicemler. Bir isitme modeliyle kodlama sistemine dayanan bir dönüsümün bir örnegi için Sekil 2”ye bakin.
Sekil nicemleyicinin dogruluguna bagli olarak, vektörü tekrar insa etmek üzere kullanilan kazanim degeri az veya çok uygun olabilir. Özellikle tahsis edilen bitler az oldugunda, kazanim degeri optimal degerden uzaklasir. Bunu çözmenin bir yolu, sekil nicemlemeden sonra kazanim uyumsuzluguna neden olan bir düzeltme faktörünü kodlamaktir. Baska bir çözüm, önce sekli kodlamak ve daha sonra nicemlenmis sekle göre optimal kazanim faktörünü hesaplamaktir.
Sekil nicemlemeden sonra bir kazanim düzeltme faktörü kodlamaya yönelik çözüm çok fazla bit hizi kullanabilir. Eger oran halihazirda düsükse, bu daha fazla bitin baska yerden alinmasi gerektigi ve belki hassas yapi için mevcut bit hizini azaltabilecegi anlamina gelir.
Kazanimi kodlamadan önce sekli kodlamak daha iyi bir çözümdür, ama eger sekil nicemleyici için bit hizi nicemleninis kazanim degerinden kararlastirilmissa, o zaman kazanim ve sekil nicemleme birbirine bagimli olacaktir. Bir yinelemeli çözüm bu bagimliligi muhtemelen çözebilir, ama bir mobil cihazda gerçek zamanda çalistirilmak kolayca çok karinasiklasabilir. bölgesi isleme sonrasini açiklar, burada bir uyarlanir modifikasyon kazanim faktörü kodu çözülmüs spektral katsayilarinin algilanan kalitesini gelistirmek amaciyla her bir frekans katsayisina uygulanir.
Bir amaç, ayri kazanim ve sekil görünümleriyle kodlanmis olan sesin kodunu çözerken bir kazanim ayarlamasi elde etmektir.
Bu amaca ekteki Istemlere uygun olarak ulasilir.
Birinci yön ayri kazanim ve sekil görünümleriyle kodlanmis bir ses sinyalinin kodunu çözmeye yönelik bir ses dekoderi içerir. Ses dekoderi bir kodlanmis kazanim görünümünün kodunu çözmeye yönelik araç, bir sekil görünümü için bir bit tahsisi türetmeye yönelik araç ve bir kodlanmis sekil görünümünün kodunu çözmeye yönelik araç içerir, burada sekil bir darbe vektörü kodlama semasi kullanilarak kodlanmistir, burada darbeler farkli yükseklikte darbeler olusturmak için üst üste eklenebilir. Ses dekoderi ayrica bir frekans bandi için sekil görünümünün bir dogruluk ölçüsünü tahmin etmeye yönelik araç içerir, frekans bandi çok sayida katsayi içerir, burada dogruluk ölçüsü bir birkaç darbeye ve bir azami darbenin yüksekligine ve bir kazanim düzeltmeyi belirlemeye dayanir, burada kazanim düzeltme tahmini dogruluk ölçüsüne dayali olarak belirlenir. Ses dekoderi kazanim görünümünü belirlenen kazanim düzeltmeye dayali olarak ayarlamaya yönelik araç da içerir.
Ikinci yön birinci yöne bagli olarak ses dekoderini içeren bir ag dügümü içerir. Üçüncü yön ayri kazanim ve sekil görünümleri ile kodlanmis bir ses sinyalinin kodunu çözmeye yönelik bir usul içerir. Usul bir kodlanmis kazanim görünümünü almayi ve kodunu çözmeyi, bir sekil görünümü için bir bit tahsisi elde etmeyi ve bir kodlanmis sekil görünümünü almayi ve kodunu çözmeyi içerir, burada sekil bir darbe vektörü kodlama semasi kullanilarak kodlanmistir, burada darbeler farkli yükseklikte darbeler olusturmak için üst üste eklenebilir. Usul ayrica bir frekans bandi için sekil görünümünün bir dogruluk ölçüsünü tahmin etmeyi içerir, frekans bandi çok sayida katsayi içerir, burada dogruluk ölçüsü bir birkaç darbeye ve bir azami darbenin yüksekligine dayanir. Usul ayrica tahmini dogruluk ölçüsüne bagli olarak bir kazanim düzeltme belirleineyi ve kazanim görünümünü belirlenen kazanim düzeltmeye bagli olarak ayarlamayi içerir.
Kazanim düzeltme için önerilen sema bir kazanim-sekil ses kodlama sisteminin algilanan kalitesini gelistirir. Semanin düsük hesaplama karmasikligi vardir ve sayet gerektirirse, az ilave bit gerektirir. ÇIZIMLERIN KISA AÇIKLAMASI Diger amaçlari ve avantajlari ile birlikte bu teknoloji ekteki çizimlerle birlikte alinan asagidaki açiklamaya atif yaparak en iyi anlasilabilir.
Sekil 1, bir örnek kazanim-sekil vektörü nicemleme semasini gösterir; Sekil 2, bir örnek dönüsüm bölgesi kodlama ve kodunu çözme semasini gösterir; Sekil 3A-C, kazanim-sekil vektörü nicemlemeyi basitlestirilmis bir durumda gösterir; Sekil 4, bir zarf düzeltmeyi belirlemek üzere bir dogruluk ölçüsü kullanarak bir örnek dönüsüm bölgesi dekoderini gösterir; Sekil 5A-B, sekil vektörü bir seyrek darbe vektörü oldugunda kazanim faktörleriyle sentezle ölçeklemenin bir örnek sonucunu gösterir; Sekil 6A-B, en büyük darbe yüksekliginin sekil vektörünün dogrulugunu nasil gösterebilecegini gösterir; Sekil 7, düzenleme 1 için azalma fonksiyonuna dayanan bir oranin bir örnegini gösterir; Sekil 8, düzenleme 1 için oran ve azami darbe yükseklik bagimli bir kazanim ayarlama fonksiyonunun bir örnegini gösterir; Sekil 9, düzenleme 1 için oran ve azami darbe yükseklik bagimli bir kazanim ayarlama fonksiyonunun baska bir örnegini gösterir; Sekil 10, ses kodlayici ve dekoder sistemine dayanan bir MDCT baglaminda bu teknolojinin bir düzenlemesini gösterir; Sekil 11, stabilite ölçüsünden kazanim ayarlama sinirlama faktörüne bir haritalama fonksiyonunun bir örnegini gösterir; Sekil 12, bir uyarlanir asama ebadi olan bir ADPCM kodlayici ve dekoder sisteminin bir örnegini gösterir; Sekil 13, ses kodlayici ve dekoder sistemine dayanan bir alt-bant ADPCM baglaminda bir örnegi gösterir; Sekil 14, ses kodlayici ve dekoder sistemine dayanan bir alt-bant ADPCM baglaminda bir örnegi gösterir; Sekil 15, bir sinyal siniflandirici içeren bir örnek dönüsüm bölgesi kodlayiciyi gösterir; Sekil 16, bir zarf düzeltmeyi belirlemek üzere bir dogruluk Ölçüsü kullanarak baska bir örnek dönüsüm bölgesi dekoderini gösterir; Sekil 17, bu teknolojiye uygun olarak bir kazanim ayarlama aygitinin bir düzenlemesini gösterir; Sekil 18, bu teknolojiye uygun olarak bir kazanim ayarlama aygitinin bir düzenlemesini daha detayli gösterir; Sekil 19, bu teknolojiye uygun olarak usulü gösteren bir akis semasidir; Sekil 20, bu teknolojiye uygun olarak usulün bir düzenlemesini gösteren bir akis semasidir; ve Sekil 21, bu teknolojiye uygun olarak bir agin bir düzenlemesini gösterir.
DETAYLI AÇIKLAMA Asagidaki açiklamada ayni veya benzer fonksiyonu yapan elemanlar için ayni referans sembolleri kullanilacaktir.
Bu teknoloji detayli açiklanmadan önce, kazanim-sekil kodlama Sekil 1-3°e atiIla gösterilecektir.
Sekil 1, bir örnek kazanim-sekil vektörü nicemleme semasini gösterir. Sekil l7in üst bölümü kodlayici tarafini gösterir. Bir girdi vektörü (x) vektör normunu (kazanim) (g), tipik biçimde Euclidian normunu belirleyen bir norm hesaplayiciya (10) iletilir. Bu kesin norm bir norm nicemleyicide (12) nicemlenir ve nicemlenmis norinun (g) tersi (1/g) girdi vektörünü (x) bir sekil halinde ölçeklemek için bir çogalticiya (14) iletilir. Sekil bir sekil nicemleyicide (16) nicemlenir. Niceinlenmis kazanimin ve seklin görünümleri bir bit akimi çogullayicisina (mux) (18) iletilir. Bu görünümler gerçek nicemlenmis degerlerden ziyade, örnegin tablolardaki (kod kitaplari) endeksleri olusturabileceklerini belirtmek üzere kesikli çizgilerle gösterilmistir.
Sekil 1°in alt bölümü dekoder tarafini gösterir. Bir bit akimi ters-çogullayicisi (demux) (20) kazanim ve sekil görünümlerini alir. Sekil görünümü bir sekil ters-nicemleyicisine (22) iletilir ve kazanim görünümü bir kazanim ters-nicemleyicisine (24) iletilir. Elde edilen kazanim (g) tekrar insa edilen vektörü (13) veren elde edilen sekli ölçekledigi bir çogalticiya(26)iletilir.
Sekil 2, bir örnek dönüsüm bölgesi kodlama ve kod çözme semasini gösterir. Sekil 2lnin üst bölümü kodlayici tarafini gösterir. Bir girdi sinyal, örnegin Modifiye Edilmis Ayrik Kosinüs Dönüsümüne (MDCT) bagli olarak frekans dönüsümünü (X) üretmek üzere bir frekans dönüstürücüye (30) iletilir. Frekans dönüsümü (X) her bir frekans bandinin (b) enerjilerini (E(b)) belirleyen bir zarf hesaplayiciya (32) iletilir. Bu enerjiler bir zarf nicemleyicide (34) enerjiler (E(b)) halinde nicemlenir. Nicemlenmis enerjiler (E(b)) dönüsümün (X) frekans bandinin (b) katsayilarini zarfin karsilik gelen nicemlenmis enerjilerinin (E(b)) tersiyle ölçekleyen bir zarf normallestiriciye (36) iletilir. Ortaya çikan ölçeklenmis sekiller bir hassas yapi nicemleyicisine (38) iletilir. Nicemlenmis enerjiler (E(b)) hassas yapi nicemlemesi için her bir frekans bandina (b) bitler tahsis eden bir bit tahsisatçisina (40) da iletilir. Yukarida belirtildigi gibi, bit tahsisi (R(b)) bir insan isitme sistemi modeline dayandirilabilir. Nicemlenmis kazanimlarin (E`(b)) ve karsilik gelen nicemlenmis sekillerin görünümleri bit akimi çogullayicisina (18) iletilir.
Sekil 2snin alt bölümü de koder tarafini gösterir. Bit akimi ters-çogullayicisi (20) kazanim ve sekil görünümlerini alir. Kazanim görünümleri bir zarf ters-nicemleyicisine (42) iletilir. Üretilen zarf enerjileri (E(b)) alinan sekillerin bit tahsisini (R(b)) belirleyen bir bit tahsisatçisina (44)iletilir. Sekil görünümleri bit tahsisinin (R(b)) kontrol ettigi bir hassas yapi ters-nicemleyicisine (46) iletilir. Kodu çözülmüs sekiller yeniden insa edilmis bir frekans dönüsümü olusturmak üzere onlari karsilik gelen zarf enerjileri (E`(b)) ile ölçekleyen bir zarf sekillendiriciye (48) iletilir. Bu dönüsüm, örnegin Ters Modifiye Edilmis Ayrik Kosinüs Dönüsümüne (IMDCT) bagli olarak sentezlenmis sesi temsil eden bir çikti sinyal üreten bir ters frekans dönüstürücüsüne (50) iletilir.
Sekil 3A-C, yukarida açilanan kazanim-sekil vektörü nicemleinesini frekans bandinin (b)Sekil 3Aida 2-b0yutlu vektör (X(b)) ile gösterildigi basitlestirilmis bir durumda gösterir. Budurum bir çizimde gösterilmek için yeterince basittir, ama kazanim-sekil nicemlemesindeki problemi göstermek içinde yeterince geneldir (uygulamada vektörlerin tipik biçimde 8 veya daha fazla boyutu vardir). Sekil 3A°nin sag tarafi vektör (X(b))`nin bir kesin kazanim-sekil görünümünü bir kazanim (E(b)) ve bir sekil (ünite boy vektörü) (N'(b)) ile gösterir.
Ancak Sekil 3B,de gösterildigi gibi, kesin kazanim (E(b)) kodlayici tarafina bir nicemlenmis kazanim (E(b)) halinde kodlanmistir. Vektör (X(b))”nin ölçeklenmesi için nicemlenmis kazanimin (E`(b)) tersi kullanildigindan, ortaya çikan ölçeklenmis vektör (N(b)) dogru yöne bakacaktir, aina ille de ünite boyunda olmayacaktir. Sekil nicemleine sirasinda ölçeklenmis vektör (N(b)) nicemlenmis sekil (N(b)) halinde nicemlenir. Bu durumda nicemleme sekli (veya yönü) bir miktar isaretli tamsayi darbeden olusturan bir darbe kodlama semasina [3] dayanir. Darbeler her bir boyut için üst üste eklenebilir. Bu, izin verilen sekil nicemleine konumlarinin Sekil 3B-C7de gösterilen dikdörtgen izgaralarda büyük noktalarla gösterildigi anlamina gelir. Sonuç, nicemlenmis sekil (N(b)) genelde N(b),nin (ve N'(b)”nin) sekli (yönü) ile çakisinayacaktir.
Sekil 3C, sekil nicemlemenin dogrulugunun tahsis edilen bitlere (R(b)) veya esit sekilde sekil nicemleme için mevcut toplam darbe sayisina bagli oldugunu gösterir. Sekil 3C3nin sol bölümünde sekil nicemleme 8 darbeye dayanir, sag bölümdeki sekil nicemleme ise sadece 3 darbe kullanir (Sekil 3B”dekiörnek4 darbe kullanir).
Buna göre, sekil nicemleyicinin dogruluguna bagli olarak, dekoder tarafinda vektör (X(b)),yi tekrar insa etmek üzere kullanilan kazanim degerinin (E(b)) az veya çok uygun olmasi takdir edilir. Bu teknolojiye uygun olarak bir kazanim düzeltme nicemlenmis seklin bir dogruluk ölçüsüne dayanabilir.
Kazanimi düzeltmek üzere kullanilan dogruluk ölçüsü dekoderde halihazirda mevcut olan parametrelerden türetilebilir, ama dogruluk ölçüsü için belirlenmis ilave parametrelere de dayanabilir. Tipik biçimde, parametreler sekil vektörü için tahsis edilmis bitlerin sayisini ve sekil vektörünün kendisini içerecektir, ama sekil vektörüyle iliskili kazanim degerini ve kodlama ve kod çözme sistemi için tipik olan sinyaller hakkinda önceden depolanmis istatistikleri de içebilir. Bir dogruluk ölçüsü ve kazanim düzeltme veya ayarlama içeren bir sistemin bir genel görünümü Sekil 4,te gösterilmistir.
Sekil 4, bir zarf düzeltmeyi belirlemek üzere bir dogruluk ölçüsü kullanan bir örnek dönüsüm bölgesi dekoderini (300) gösterir. Çizimin karinasiklasinasini önlemek amaciyla sadece dekoder tarafi gösterilmistir. Kodlayici tarafi Sekil 2'deki gibi uygulanabilir. Yeni özellik bir kazanim ayarlama aygitidir (60). Kazanim ayarlama aygiti (60) sekil görünümünün (N(b)) bir dogruluk ölçüsünü (A(b)) tahmin etmek ve tahmini dogruluk ölçüsüne (A(b)) bagli olarak bir kazanim düzeltme (g(.(b)) belirlemek üzere yapilandirilmis bir dogruluk ölçer (62) içerir.
Kazanim ayarlama aygiti (60) belirlenen kazanim düzeltmeye bagli olarak kazanim görünümünü (E'(b)) ayarlamak üzere yapilandirilmis bir zarf ayarlayici (64) da içerir.
Yukarida belirtildigi gibi, kazanim düzeltme ilave bit sarf etmeden bazi düzenlemelerde yapilabilir. Bu, dekoderde halihazirda mevcut parametrelerden kazanim düzeltmeyi tahmin ederek yapilir. Bu islem kodlanmis seklin dogrulugunun bir tahmini olarak açiklanabilir.
Tipik biçimde bu tahmin dogruluk ölçüsünü (A(b)) sekil nicemlemenin çözünümünü belirten sekil nicemleme niteliklerinden türetmeyi içerir.
Düzenleme 1 Bir düzenlemede, bu teknoloji bir ses kodlayici/dekoder sisteminde kullanilir. Sistem dönüsüm bazlidir ve kullanilan dönüsüm %50 örtüsmeyle sinüsoidal pencereler kullanan Modifiye Edilmis Ayrik Kosinüs Dönüsümüdür (MDCT). Ancak, dönüsüm kodlamaya uygun herhangi bir dönüsümün uygun kesiinleine ve pencereleme ile birlikte kullanilabilecegi anlasilmistir.
Düzenleme l”in kodlayicisi Girdi ses %50 örtüsme kullanilarak çerçeveler halinde çikarilir ve simetrik bir sinüsoidal pencereyle pencerelenir. Her bir pencerelenen çerçeve daha sonra bir MDCT spektrumuna (X) dönüstürülür. Spektrum isleme için alt-bantlara bölünür, burada alt-bant enleri üniform degildir. Banda (b) ait çerçeve(m),nin spektral katsayilari X(b,m) ile gösterilir ve bant genisligine (BW(b_)) sahiptir. Çogu kodlayici ve dekoder asamalari bir çerçeve içinde açiklanabileceginden, çerçeve endeksi çikarilir ve sadece n0tasy0nX(b) kullanilir. Bant genislikleri tercihen insan isitme sisteminin frekans çözünümüyle uyumlu olmasi için artan frekansla artmalidir. Her bir bandin karekök ortalama (RMS) degeri bir normallestirme faktörü olarak kullanilir ve E(b) ile gösterilir: burada X (b)TX (b),nin devrigini gösterir.
RMS degeri beher katsayi için enerji degeri olarak görülebilir. b: l,2,..., Nba,” için normallestirme faktörü (E(b)) dizisi MDCT spektrumunun zarfini olusturur, burada Nba", bantlarin sayisini gösterir. Daha sonra, dizi dekodere iletilmek amaciyla nicemlenir.
Norrnallestirmenin dekoderde terse çevrilebilmesini temin etmek üzere, nicemlenmis zarf (E(b)) elde edilir. Bu örnek düzenlemede zarf katsayilari 3 dBîlik bir asama ebadi kullanilarak log bölgesinde ölçeksel nicemlenmistir ve nicemleyici endeksleri Huffman kodlamasi kullanilarak türevsel biçimde kodlanmistir. Nicemlenmis zarf spektral bantlarin normallestirilmesi için kullanilir, yani Eger nicemlenmemis zarf E(b) normallestirme için kullanilirsa, seklin RMS = 1 degeri olacagina dikkat edin, yani 1 3 N (b) N (b) Nicemlenmis zarf (E`(b)) kullanilarak sekil vektörünün l,e yakin bir RMS degeri olacaktir. Bu özellik kazanim degerinin bir yuvarlamasini yaratmak üzere dekoderde kullanilacaktir.
Normallestirilmis sekil vektörlerinin (N(b)) birligi MDCT spektrumunun hassas yapisini olusturur. Nicemlenmis zarf normallestirilmis sekil vektörlerinin (N(b)) kodlanmasi için bir bit tahsisi (R(b)) üretmek üzerekullanilir. Bit tahsis algoritmasi tercihen bir isitme modeli bitleri algisal olarak en ilgili bölümlere dagitmak üzere kullanir. Herhangi bir nicemleyici semasi sekil vektörünü kodlamak için kullanilabilir. Hepsi için ortak olan, hepsinin girdinin normallestirildigi varsayimiyla tasarlanabilmesidir, bu nicemleyici tasarimini basitlestirir. Bu düzenlemede sekil nicemleme sentez seklini bir miktar isaretli tamsayi darbeden [3] insa eden bir darbe kodlama semasi kullanilarak yapilmistir. Darbeler farkli yükseklikte darbe olusturmak üzere üst üste eklenebilir. Bu düzenlemede bit tahsisi (R(b)) banda (b) tahsis edilen darbe sayisini gösterir.
Zarf nicemlemeden ve sekil nicemlemeden nicemleyici endeksler bir dekodere depolanmak veya iletilmek üzere bir bit akimi halinde çogullanir.
Düzenleme Pin dekoderi Dekoder bit akimindan endeksleri ters-çogullar ve ilgili endeksleri her bir kod çözme modülüne iletir. Ilk önce, nicemlenmis zarf (E(b)) elde edilir. Daha sonra, hassas yapi bit tahsisi kodlayicida kullanilanla ayni bir bit tahsisi kullanilarak nicemlenmis zarftan türetilir.
Hassas yapinin sekil vektörlerinin (N(b)) kodu endeksler ve elde edilen bit tahsisi (R(b)) kullanilarak çözülür.
Simdi kodu çözülmüs hassas yapiyi zarfla ölçeklemeden önce, ilave kazanim düzeltme faktörleri belirlenir. Ilk önce, RMS eslesen kazanim asagidaki sekilde elde edilir: gRMs(b) faktörü RMS degerini 1,e normallestiren bir ölçekleine faktörüdür, yani JwmabWwif(gmibimbi) Bu düzenlemede sentezin ortalama kareli hatasi (MSE) en aza indirilmeye çalisilir: amo) = arg minlNib› - g › ml [6) çözümle ngaib) _ N(b]TN(b) [ ) gMgg(b) girdi sekle (N(b)) dayandigindan, dekoderde bilinmez. Bu düzenlemede etki bir dogruluk ölçüsü kullanilarak tahmin edilir. Bu kazanimlarin orani bir kazanim düzeltme faktörü (gc(b)) olarak tanimlanir: ge( ] gRMslb) Sekil nicemlemenin dogrulugu iyi oldugunda, düzeltme faktörü Ve yakindir, yani Muammzgmai (% Ancak N(b)”nin dogrulugu düsük oldugunda, gMSE(b) ve giz/mü) uzaklasacaktir. Seklin bir darbe kodlama semasi kullanilarak kodlandigi bu düzenlemede, düsük bir oran sekil vektörünü seyrek yapacak ve gRMs(b) MSE açisindan uygun kazanimin bir fazla tahminini verecektir. Bu durum için gc(b) asimi telafi etmek üzere 1”den daha düsük olmalidir. Düsük oran darbe sekil durumunun bir örnek görünümü için Sekil 5A-B,ye bakin. Sekil 5A-B, sekil vektörü bir seyrek darbe vektörü iken gMgg (Sekil SB) ve gRMs (Sekil 5A) kazanim faktörleri ile sentezi ölçeklemenin bir örnegini gösterir. gRMS ölçekleme bir MSE anlaminda çok yüksek olan darbeler verir.
Diger taraftan, zayir` veya seyrek bir hedef sinyal bir darbe sekliyle iyi temsil edilebilir. Girdi sinyalin seyrekligi sentez asamasinda bilinemeyebilecegi için, sentez seklin seyrekligi sentezlenmis sekil vektörünün dogrulugunun bir göstergesi görevini görebilir. Sentez seklin seyrekligini ölçmenin bir yolu, sekildeki azami zirvenin yüksekligidir. Bunun gerisindeki mantik, seyrek bir girdi sinyalin sentez sekilde yüksek zirveler üretmesinin daha olasi10 oldugudur. Zirve yüksekliginin iki esit oranli darbe vektörünün dogrulugunu nasil gösterebileceginin bir görünümü için Sekil 7A-Blye bakin. Sekil ?Alda kesikli sekli temsil etmek üzere mevcut 5 darbe (R(b) = 5) vardir. Sekil sabit oldugundan, kodlama esit yükseklikte (:1) 5 dagitilmis darbe üretir, yani pinax :1. Sekil 7Bsde de kesikli sekli temsil etmek üzere mevcut 5 darbe vardir. Ancak, bu durumda sekil zayif veya seyrektir ve en büyük zirveyi üst üste 3 darbe temsil eder, yani mm: 3. Bu, kazanim düzeltmenin (g(.(b)) nicemlenmis seklin bir tahmini seyrekligine (pmax) dayandigini gösterir.
Yukarida belirtildigi gibi, girdi sekli (N(b)) dekoder bilmez. gMSE(b) girdi sekle (N(b)) dayandigindan, bu kazanim düzeltme veya telafinin (gc(b)) uygulamada ideal denklem (8),e dayanamayacagi anlamina gelir. Bu düzenlemede kazanim düzeltmenin (g(.(b)) darbelerin sayisi (R(b)), sekil vektöründeki en büyük darbenin yüksekligi (pimx(b)) ve frekans bandi (b) açisindan bit-oranina dayanmasi kararlastirilmistir, yani gcib) = f (Rwlßmadbhb) (10) Daha düsük oranlarin genelde MSElyi en aza indirmek üzere kazanimda bir azalma gerektirdigi görülmüstür. Oran bagimliligi ilgili ses sinyali verisinde denenen bir arama tablosu (t(R(b))) gibi uygulanabilir. Bir örnek arama tablosu Sekil 7lde görülebilir. Bu düzenlemedeki sekil vektörlerinin farkli enleri oldugundan, oran tercihen beher örnek için darbelerin sayisi olarak ifade edilebilir. Bu sekilde ayni oran bagimli azalma tüm bant genislikleri için kullanilabilir. Bu düzenlemede kullanilan alternatif bir çözüm, bandin enine bagli olarak tabloda bir asama ebadi (T) kullanmaktir. Burada, 4 farkli grupta 4 farkli bant genisligi kullanilmistir, dolayisiyla 4 asama ebadi gerekir. Asama ebatlarinin bir örnegi Tablo l,de bulunur. Asaina ebadini kullanarak, arama degeri bir yuvarlama islemi (t( I-R(b)~TJ )) kullanilarak elde edilmistir, burada '- J en yakin tamsayiya yuvarlamayi temsil eder.
Bant grubu Bant genisligi Asama ebadi T 2 16 3 24 2 Baska bir örnek arama tablosu Tablo 2,de verilmistir.
Bant grubu Bant genisligi Asama ebadi T 2 16 3 24 2 Tahmini seyreklik hem darbelerin sayisina (R(b)), hem de azami darbenin yüksekligine (pmax(b)) bagli olarak baska bir arama tablosu (u(R(b), pmax(b))) gibi uygulanabilir. Bir örnek arama tablosu Sekil 8'de gösterilmistir. Arama tablosu (u) bant (b) için bir dogruluk ölçüsü (A(b)) görevi görür, yani AU?) = u(R(b)›Pmax(b)) (11) ngEnin yuvarlanmasinin algisal açidan daha düsük frekans araligi için daha uygun görülmüstür. Daha yüksek frekanslar için hassas yapi algisal olarak daha az önemli olur ve enerjilerin veya RMS degerinin eslesmesi daha hayati olur. Bu nedenle, kazanim azalma sadece belirli bir bant sayisinin (bnm) altinda uygulanabilir. Bu durumda kazanim düzeltmenin(gc(b)) frekans bandina (1)) açik bagimligi olacaktir. Ortaya çikan kazanim düzeltme fonksiyonu bu durumda asagidaki sekilde tanimlanabilir: Bu noktaya kadarki açiklama Sekil 4°ün örnek düzenleinesinin temel özelliklerini açiklamak üzere de kullanilabilir. Buna göre, Sekil 4”ün düzenlemesinde son sentez (X(b)) asagidaki sekilde hesaplanir: Xib) = gc(b)gRMS(b)E(n)N(b) (13) Bir alternatif olarak fonksiyon u(R(b), pinax(b)) azami darbe yüksekliginin (pmx) ve tahsis edilen bit oraninin (R(b)) lineer fonksiyonu olarak, örnegin asagidaki sekilde uygulanabilir: burada temayül (k) asagidaki sekilde belirlenmistir: Aci = (amax - amm)/R[b] (15] Fonksiyon R(b) = 1 ve pmax(b) = 1 için ilk azalma faktörünü veren ayarlama parametresine (amin) dayanir. Fonksiyon ayarlama parametresi amin: 0,41 olarak Sekil 97da gösterilmistir. Tipik biçimde umaxe [0, 7, 1, 4] ve umine [0, umd. Denklem (14)”te upmax (b) ve R(b) arasindaki farkta lineerdir. Diger bir olasilik, pmx(b) ve R(b) için farkli temayül faktörlerinin olmasidir.
Verili bir bant için bit hizi yan yana çerçeveler arasindaki bir verili bant için keskin biçimde degisebilir. Bu kazanim düzeltmenin hizli degisikliklerine yol açabilir. Bu tür degisiklikler zarf oldukça stabil oldugunda, yani çerçeveler arasindaki toplam degisiklikler çok küçük oldugunda özellikle kritiktir. Bu çogu zaman tipik biçimde daha stabil enerji zarflari olan müzik sinyalleri için olur. Kazanim azalmanin instabiliteye sebep vermesini önlemek için, bir ilave uyarlama eklenebilir. Böyle bir düzenlemenin bir genel görünümü Sekil 103da verilmistir, burada bir stabilite ölçer (66) dekoderdeki (300) kazanim ayarlama aygitina (60) eklenmistir.
Uyarlama örnegin zarfin (E(b)) bir stabilite Ölçüsüne dayanabilir. Böyle bir ölçünün bir örnegi yan yana logg zarf vektörleri arasindaki kareli Euclidian mesafesini hesaplamaktir: AE(m>= (log,Etami-iogzâwm-DT (161 bandi I› Burada AE(m) çerçeve (m) ve çerçeve (m-l) için zarf vektörleri arasindaki kareli Euclidian mesafesini gösterir. Stabilite ölçüsü daha düzgün bir uyarlama olmasi için düsük geçisli de filtrelenebilir: Unutma faktörü ((1) için uygun bir deger 0,1 olabilir. Düzeltilmis stabilite ölçüsü daha sonra, örnegin asagidaki gibi bir sigmoid fonksiyon kullanilarak azalmanin sinirlanmasini yaratmak10 üzere kullanilabilir: 1+eCi(AI`I(iii)eC2)-C3 7 burada parametreler C1 = 6, C2 = 2 ve C3 = 1,9 olarak ayarlanabilir. Bu parametreler örnek olarak görülmelidir, gerçek degerler ise daha rahat seçilebilir. Örnegin, C2 6 [1,4] Sekil 11, stabilite ölçüsünden (AE(m)) kazanim ayarlama sinirlama faktörüne (gmin) bir haritalama fonksiyonunun bir örnegini gösterir. gmin için yukaridaki ifade tercihen bir arama tablosu gibi veya 1, AE › gibi basit bir asama fonksiyonu ile uygulanir.
Azalma sinirlaina degiskeni (gminE [0,l]) bir stabilite uyarlanmis kazanim modifikasyonu (gc(b)) yaratmak üzere kullanilabilir: Kazanimin tahmininden sonra, son sentez X(b) asagidaki gibi hesaplanir: Düzenleme lsin açiklanan degisikliklerinde sentezlenmis vektörler (X(b)) birligi sentezlenmis spektrumu (X) olusturur, bu ters-MDCT dönüsümünü kullanarak ayrica islenir, simetrik sine pencereyle pencerelenir ve örtüsme-ve-ekleme stratejisi kullanilarak çikti sentezine eklenir.
Baska bir örnekte, sekil sekil nicemlemesi için bir QMF (DörtlüAyna Filtre) filtre bankasi ve bir ADPCM (Uyarlanir Kademeli Darbe-Kod Modülasyonu) semasi kullanilarak nicemlenir.
Bir alt-bant ADPCM semasinin bir örnegi lTU-T G.722 [4],dir. Girdi ses sinyali dilimler halinde tercihen islenir. Bir Örnek ADPCM semasi bir uyarlanir asama ebadi (S) ile Sekil 12°de gösterilmistir. Burada, sekil nicemleyicinin uyarlanir asama ebadi dekoderde halihazirda mevcut olan ve ilave sinyalleme gerektirmeyen bir dogruluk ölçüsü görevi görür.
Ancak, nicemleme asama ebadinin kod çözme isleminin kullandigi parametrelerden çikarilmasi gerekir, sentezlenmis sekilden çikarilmasi gerekmez. Bu örnegin bir genel görünüm Sekil 14”te gösterilmistir. Ancak, bu örnek detayli açiklanmadan önce, bir QMF filtre bankasina dayanan bir örnek ADPCM semasi Sekil 12 ve 13”e atifla açiklanacaktir.
Sekil 12, uyarlanir bir nicemleme asamasi ebadi olan bir ADPCM kodlayici ve dekoder sisteminin bir örnegini gösterir. Bir ADPCM nicemleyici (70) bir girdi sinyal alan ve bir hata sinyali(e) olusturmak üzere önceki girdi sinyalin bir tahminini çikaran bir ekleyici (72) içerir.
Hata sinyali nicemleyici (74),te nicemlenir, niceinleyici (74),ün çiktisi bit akimi çogullayicisina (18) ve de bir asama ebadi hesaplayiciya (76) ve ters-nicemleyici (78),e iletilir. Asama ebadi hesaplayici (76) nicemleme asamasi ebadini (S) kabul edilebilir bir hata elde etmek üzere uyarlar. Nicemleme asamasi ebadi (5) bit akimi çogullayicisina (18) iletilir ve de nicemleyici (74)”ü ve ters-nicemleyici (78)”i kontrol eder. Ters-nicemleyici (78) ekleyici (80),e bir hata tahmini (ê) çikarir. Ekleyici (80),nin diger girdisi geciktirme elemani (82)'nin geciktirdigi girdi sinyalin bir tahminini alir. Bu, geciktirme elemani (82)°ye iletilen girdi sinyalin bir cari tahmin olusturur. Geciken sinyal hata sinyalini (e) olusturmak üzere asama ebadi hesaplayicisina (76) ve de (bir isaret degisikligiyle) ekleyici (72)”ye iletilir.
Bir ADPCM ters-nicemleyicisi (90) alinan nicemleme asamasi ebadinin (S) kodunu çözen ve ters-nicemleyici (94)”e ileten bir asama ebadi dekoderi (92) içerir. Ters-nicemleyici (94) ekleyici (98)”e iletilen hata tahmininin (é) kodunu çözer, ekleyici (98)”in diger girdisi geciktirme elemani (96),nin geciktirdigi çikti sinyali ekleyiciden alir.
Sekil 13, bir alt-bant ADPCM-bazli ses kodlayici ve dekoder sistemi baglaminda bir örnek gösterir. Kodlayici tarafi Sekil 2Snin düzenlemesinin kodlayici tarafina benzer. Temel farklar frekans dönüstürücünün (30)bir QMF (Dörtlü Ayna Filtre) analiz filtre bankasi (100) ile degistirilmis olmasi ve hassas yapi nicemleyicinin (38)Sekil 12”deki nicemleyici (70) gibi bir ADPCM nicemleyiciyle degistirilmis olmasidir. Dekoder tarafi Sekil 27nin düzenlemesinin dekoder tarafina benzer. Temel farklar ters frekans dönüstürücünün (50) bir QMF sentez filtre bankasi(102) ile degistirilmis olmasi ve hassas yapi ters-nicemleyicinin (46) Sekil 12”deki ters-nicemleyici (90) gibi bir ADPCM ters-nicemleyiciyle degistirilmis olmasidir.
Sekil 14, bir alt-bant ADPCM-bazli ses kodlayici ve dekoder sistemi baglaminda bu teknolojinin bir örnegini gösterir. Çizimin karmasiklasmasini önleinek amaciyla, sadece dekoder tarafi (300) gösterilmistir. Kodlayici tarafi Sekil 137teki gibi uygulanabilir. Örnek 2,nin kodlayicisi Kodlayici QMF filtre bankasini alt-bant sinyalleri elde etmek üzere uygular. Her bir alt-bant sinyalinin RMS degerleri hesaplanir ve alt-bant sinyalleri normallestirilir. Zarf (E(b)), alt-bant bit tahsisi (R(b)) ve normallestirilmis sekil vektörleri (N(b)) düzenleme lsdeki gibi elde edilir.
Her bir normallestirilmis alt-bant ADPCM nicemleyiciye beslenir. Bu örnekte ADPCM ileri uyarlanir biçimde çalisir ve alt-bant (1)) için kullanilacak bir ölçekleme asamasi (S(b)) belirler. Ölçekleme asamasi alt-bant çerçevesi boyunca MSE”yi en aza indirmek üzere seçilir. Bu örnekte asama tüm olasi asamalari deneyerek ve asgari MSE7yi vereni seçerek seçilir: SW'm-'n BW(b) burada Q(x,s) s asama ebadi kullanan degisken (x),in ADPCM nicemleme fonksiyonudur.
Seçilen asama ebadi nicemlenmis sekil üretmek üzere kullanilabilir: Zarf nicemlemeden ve sekil nicemlemeden nicemleyici endeksler bir dekodere depolanmak veya iletilmek üzere bir bit akimina çogullanir. Örnek 2,nin dekoderi Dekoder bit akimindan endeksleri ters çogullar ve ilgili endeksleri her bir kod çözme modülüne iletir. Nicemlenmis zarf (E(b)) ve bit tahsisi (R(b)) düzenleme 17deki gibi elde edilir. Sentezlenmis sekil vektörleri (N(b)) uyarlanir asama ebatlariyla (S(b)) birlikte ADPCM dekoder veya ters-nicemleyiciden elde edilir. Asama ebatlari nicemleninis sekil vektörünün dogrulugunu belirtir, burada daha küçük bir asama ebadi daha yüksek bir dogruluga karsilik gelir ve daha yüksek bir dogruluk daha küçük bir asama ebadina karsilik gelir. Bir olasi uygulama, dogrulugu (A(b)) bir orantililik faktörü (y) kullanarak asama ebadina ters orantili yapmaktir: burada 3/ istenen iliskiyi elde etmek üzere ayarlaninalidir. Bir olasi seçenek y : Smjnidir, burada Smin asgari asama ebadidir, bu S(b) : Smin için dogrulugu l verir.10 Kazanim düzeltme faktörü (gp) bir haritalaina fonksiyonu kullanilarak elde edilebilir: Haritalama fonksiyonu (h) oran (R(b))'ye ve frekans bandina (b) bagli olarak bir arama tablosu gibi uygulanabilir. Bu tablo optimal kazanim düzeltme degerlerini (gMSE/gRMS) bu parametrelerle karistirarak ve optimal kazanim düzeltme degerlerinin her bir kümesi için ortalamasini alarak tablo girisini hesaplayarak tanimlanabilir.
Kazanim düzeltmenin tahmininden sonra, alt-bant sentezi (X(b)) asagidaki sekilde hesaplanir: Xlbl : gclblgRiiislbigln)Nlbl (2] Çikti ses çerçevesi sentez QMF filtre bankasini alt-bantlara uygulayarak elde edilir.
Sekil l4ite gösterilen örnekte kazanim ayarlama aygitindaki (60) dogruluk ölçer (62) henüz kodu çözülmeinis nicemleme asama ebadini (S(b)) dogrudan alinan bit akimindan alir. Bir alternatif, yukarida belirtildigi gibi nicemleme asama ebadinin (S(b)) kodunu ADPCM ters- nicemleyicide (90) çözmek ve kodu çözülmüs formda dogruluk ölçere (62) iletmektir.
Yukarida açiklanan örnek 2'nin belirtilen bulusun bir bölümünü olusturmadigi, ama bulusu anlamak için alternatif bir uygulamanin faydali bir örnegini verdigi belirtilmistir.
Diger alternatifler Dogruluk ölçüsü kodlayicida türetilmis bir sinyal sinifi parametreyle tamamlanabilir. Bu, örnegin bir konusma/müzik diskriminatörü veya bir geri plan gürültü seviyesi tahmin edici olabilir. Bir sinyal siniflandirici içeren bir sistemin bir genel görünümü Sekil 15-16°da gösterilmistir. Sekil 15°teki kodlayici tarafi Sekil 2”deki kodlayici tarafina benzer, aina bir sinyal siniflandiriciyla (104) donatilmistir. Sekil 167daki dekoder tarafi (300) Sekil 4itekidekoder tarafina benzer, ama dogruluk ölçere (62) bir diger sinyal sinifi girdisiyle donatilmistir.
Sinyal sinifi, örnegin sinif bagimli bir uyarlamaya sahip olarak kazanim düzeltmeye katilabilir. Eger sinyal siniflarinin sirasiyla C = 1 ve C = 0 degerlerine karsilik gelen konusma veya müzik oldugunu varsayarsak, kazanim ayarlamayi sadece konusma sirasinda etkili olmak üzere kisitlayabiliriz, yani Baska bir altematif düzenlemede sistem kismen kodlanmis bir kazanim düzeltme veya telafi ile birlikte bir öngörücü gibi davranabilir. Bu düzenlemede dogruluk ölçüsü kazanim düzeltme veya telafinin tahminini gelistirmek üzere kullanilir, bu sayede geri kalan kazanim hatasi daha az bitle kodlanabilir.
Kazanim düzeltme veya telafi faktörünü (gg.) yaratirken RMS degerini veya enerjileri eslestirme ve MSElyi minimize etme arasinda bir denge olusturinak istenebilir. Bazi durumlarda enerjileri eslestirme dogru bir dalga biçiminden daha önemli olur. Bu Örnegin daha yüksek frekanslar için dogrudur. Bunu saglamak için son kazanim düzeltme baska bir düzenlemede farkli kazanim degerlerinin agirlikli toplami kullanilarak olusturulabilir: burada ge yukarida açiklanan yaklasimlardan birine uygun olarak elde edilen kazanim düzeltmedir. Agirlik faktörü (ß), örnegin frekansa, bit hizina veya sinyal tipine uyarlanabilir.
Burada açiklanan asamalar, islevler, prosedürler ve/veya bloklar hem genel amaçli elektronik devre, hem de uygulamaya özel devre içeren ayrik devre veya entegre devre teknolojisi gibi herhangi bir konvansiyonel teknoloji kullanilarak donanimda uygulanabilir.
Alternatif olarak, burada açiklanan asamalarin, islevlerin, prosedürlerin ve/veya bloklarin en azindan bazisi bir mikroislemci, Dijital Sinyal Islemci (DSP) gibi uygun bir isleme cihazi ve/veya bir Alan Programlanabilen Geçit Dizilimi (FPGA) cihazi gibi uygun herhangi bir programlanabilen mantik cihazi tarafindan uygulama için yazilimda uygulanabilir.
Dekoderin genel isleme yeteneklerini tekrar kullanmanin mümkün olabilecegi de anlasilmalidir. Bu, örnegin mevcut yazilimi tekrar prograinlayarak veya yeni yazilim bilesenleri ekleyerek yapilabilir.
Sekil 17, bu teknolojiye uygun olarak bir kazanim ayarlama aygitinin (60) bir düzenlemesini gösterir. Bu düzenleme dogruluk ölçüsünü tahmine yönelik bir yazilim bileseni (120), düzeltmenin kazanimini belirlemeye yönelik bir yazilim bileseni (130) ve kazanim görünümünü ayarlamaya yönelik bir yazilim bileseni(140) uygulayan bir islemciye (110), örnegin bir mikro islemciye dayanir. Bu yazilim bilesenleri bellege (150) depolanmistir.
Islemci(l 10)bir sistem veriyolu üzerinden bellekle haberlesir. Parametreler (AA/(b), R(b), E(b)) islemci (110) ve bellegin (150) bagli oldugu bir I/O veriyolunu kontrol eden bir girdi/çikti (l/O) kontrolörü(160) tarafindan alinir. Bu düzenlemede I/O kontrolörünün(160) aldigi parametreler bellege (150) depolanmistir, parametreler yazilim bilesenleri tarafindan bellekte islenir. Yazilim bilesenleri (120, 130) blok (62),nin islevselligini yukarida açiklanan düzenlemelerde uygulayabilir. Yazilim bileseni (140) blok (64)`ün islevselligini yukarida açiklanan düzenlemelerde uygulayabilir. Yazilim bileseni(140),tan elde edilen ayarlanan kazanim görünümü (E`(b)) I/O kontrolörü(l60) tarafindan I/O veriyolu üzerinden bellekten (150) çikarilir.
Sekil 18, bu teknolojiye uygun olarak kazanim ayarlamanin bir düzenlemesini daha detayli gösterir. Bir azalma tahmin edici (200) alinan bit tahsisini (R(b)) bir kazanim azalma (t(R(b))) belirlemek üzere kullanmak için yapilandirilmistir. Azalma tahmin edici (200), örnegin bir arama tablosu olarak veya yukaridaki denklem (14) gibi bir lineer denkleme bagli olarak yazilimda uygulanabilir. Bit tahsisi (R(b)), örnegin sekil görünümündeki (N(b)) en yüksek darbenin yüksekligiyle temsil edilen niceinlenmis seklin bir tahmini seyrekligini (pinax(b)) de alan bir sekil dogruluk tahmin edicisine (202) de iletilir. Sekil dogruluk tahmin edici (202), örnegin bir arama tablosu olarak uygulanabilir. Tahmini azalma (t(R(b))) ve tahmini sekil dogrulugu (A(b)) çogalticida (204),te çogaltilir. Bir düzenlemede bu ürün (t(R(b))-A(b)) kazanim düzeltmeyi (gc(b)) dogrudan olusturur. Baska bir düzenlemede kazanim düzeltme (gc(b)) yukaridaki denklem (12)”ye uygun olarak olusturulmustur. Bu, frekans bandinin (1)) bir frekans limitinden (br/112) az olup, olmadigini belirleyen bir karsilastiricinin (208) kontrol ettigi bir anahtar (206) gerektirir. Eger durum buysa, o zaman gc(b) t(R(b))-A(b),ye esittir. Aksi takdirde, gc(b) l”e ayarlanir. Kazanim düzeltme (gi.(b)) diger girdisi RMS eslesen kazanimini (gRMA(b)) alan baska bir çogalticiya( ve karsilik gelen bant genisligine (BW(b)) bagli olarak bir RMS eslesen kazanim hesaplayici (212) tarafindan belirlenir, yukaridaki denklem (4),e bakin. Ortaya çikan ürün sekil görünümünü (N(b)) ve kazanim görünümünü (E(b)) de alan ve sentezi (X(b)) olusturan baska bir çogaltici (214),e iletilir.
Sekil 10,a atiIla açiklanan stabilite tespiti düzenleme 2°nin yani sira, yukarida açiklanan diger düzenlemelere dahil edilebilir.
Sekil 19, bu teknolojiye uygun olarak usulü gösteren bir akis semasidir. Asama Sl sekil görünümünün (N(b)) bir dogruluk ölçüsünü (A(b)) tahmin eder. Dogruluk ölçüsü, örnegin sekil nicemlemenin çözünümünü gösteren R(b),S(b) gibi sekil nicemleme10 niteliklerinden türetilebilir. Asama SZ tahmini dogruluk ölçüsüne bagli olarak gc(b), gc(b), g'c(b) gibi bir kazanim düzeltme belirler. Asama S3 kazanim görünümünü (E(b)) belirlenen kazanim düzeltmeye bagli olarak ayarlar.
Sekil 20, bu teknolojiye uygun olarak usulün bir düzenlemesini gösteren bir akis semasidir, burada sekil bir darbe kodlama semasi kullanilarak kodlanmistir ve kazanim düzeltme nicemlenmis seklin bir tahmini seyrekligine (pmax(b)) dayanir. Bir dogruluk Ölçüsünün asama Sl,de halihazirda belirlenmis oldugu varsayilir (Sekil 19). Asama S4 tahsis edilmis bit oranina dayanan bir kazanim azalmayi tahmin eder. Asama SS tahmini dogruluk ölçüsüne ve tahmini kazanim azalmasina bagli olarak bir kazanim düzeltme belirler. Daha sonra prosedür kazanim görünümünü ayarlamak üzere asama S3”e ilerler (Sekil 19).
Sekil 21, bu teknolojiye uygun olarak bir agin bir düzenlemesini gösterir. Ag bu teknolojiye uygun olarak bir kazanim ayarlama aygitiyla donatilmis bir dekoder (300) içerir. Bu düzenleme bir telsiz terminal gösterir, ama baska ag dügüinler de fizibildir. Örnegin, IP (Internet Protokolü) üzerinden ses agda kullanilirsa, dügümler bilgisayarlar içerebilir.
Sekil 213deki ag dügümünde bir anten (302) bir kodlanmis ses sinyali alir. Bir telsiz ünitesi (304) bu sinyali yukarida çesitli düzenlemelere atiûa açiklandigi gibi bir dijital ses sinyali üretmek için dekodere (300) iletilen ses parametrelerine dönüstürür. Dijital ses sinyali daha sonra D/A”ya dönüstürülür ve ünite (306)”da güçlendirilir ve son olarak bir hoparlöre(308)i1eti1ir.
Yukaridaki açiklama dönüsüm bazli ses kodlamaya odaklanmakla birlikte, ayni prensipler ayri kazanim ve sekil görünümleri olan zaman bölgesi ses kodlamasina, örnegin CELP kodlamaya da uygulanabilir.
Teknikte uzman olanlar ekteki Istemlerde tanimlanan kapsamdan sapmadan bu teknolojiye çesitli modifikasyonlarin ve degisikliklerin yapilabilecegini anlayacaktir.

Claims (15)

ISTEMLER
1. Ayri kazanim ve sekil görünümleri ile kodlanmis bir ses sinyalinin kodunu çözmeye yönelik bir ses dekoderi (300) olup, söz konusu ses dekoderi asagidakileri içerir: bir kodlanmis kazanim görünümünün (E(b)) kodunu çözmeye yönelik araç (42), bir sekil görünümü için bir bit tahsisi türetmeye yönelik araç (44), bir kodlanmis sekil görünümünün (N(b)) kodunu çözmeye yönelik araç (46), burada sekil bir darbe vektörü kodlama semasi kullanilarak kodlanmistir, burada darbeler farkli yükseklikte darbeler olusturmak için üst üste eklenebilir; bir frekans bandi (b) için sekil görünümünün (N(b)) bir dogruluk ölçüsünü (A(b)) tahmin etmeye yönelik araç (62), frekans bandi (b) çok sayida katsayi içerir, burada dogruluk ölçüsü (A(b)) bir birkaç darbeye (R(b)) ve bir azami darbenin (pmax(b)) yüksekligine ve bir kazanim düzeltme (g(.(b)) belirlemeye dayanir, burada kazanim düzeltme (gi.(b)) tahinini dogruluk ölçüsüne (A(b)) dayali belirlenir; kazanim görünümünü (E(b)) belirlenen kazaniin düzeltmeye bagli olarak ayarlamaya yönelik araç (64).
2. Istem 1'in ses dekoderi olup, burada kazanim düzeltme (g,.(b)) frekans bandina (b) da dayanir.
3. Istem 1 veya 2,nin ses dekoderi olup, burada bir dogruluk ölçüsü tahmin etmeye yönelik araç ayrica asagidakileri içerir: tahsis edilen bit hizina (R(b)) dayanan bir kazanim azalmayi (t(R(b)) tahmin etmeye yönelik bir azalma tahmin araci (200), dogruluk ölçüsünü (A(b)) tahmin etmeye yönelik bir sekil dogruluk tahmin araci (202), tahmini dogruluk ölçüsüne (A(b)) ve tahmini kazanim azalmaya (t(R(b)) bagli olarak bir kazanim düzeltme (g(.(b)) belirlemeye yönelik bir kazanim düzeltme araci (204, 206, 208).
4. Istem 3,ün ses dekoderi olup, burada bir kazanim azalma tahmin etmeye yönelik azalma tahmin araci (200) bir arama tablosu olarak kullanilir.
5. Istem 3 veya 47ün ses dekoderi olup, burada dogruluk ölçüsünü tahmin etmeye yönelik sekil dogruluk tahmin araci (202) bir arama tablosudur.
6. Istem 3 veya 4,ün ses dekoderi olup, burada dogruluk ölçüsünü tahmin etmeye yönelik sekil dogruluk tahmin araci (202) dogruluk ölçüsünü (A(b)) dogruluk ölçüsünü (A(b)) azami darbenin (pmax(b)) yüksekliginin ve tahsis edilen bit hizinin (R(b)) lineer bir fonksiyonundan tahmin etmek üzere yapilandirilmistir.
7. Istem 1 ila 6”dan herhangi birinin ses dekoderi olup, burada bir dogruluk ölçüsü tahmin etmeye yönelik araç (62) kazanim düzeltmeyi (gc(b)) belirlenmis bir ses sinyali sinifina uyarlamak üzere yapilandirilmistir.
8. Bir ag dügümü olup, Istem 1 ila Tden herhangi birine uygun olarak ses dekoderini
9. Ayri kazanim ve sekil görünümleri ile kodlanmis olan sesin kodunu çözmeye yönelik bir usul olup, söz konusu usul asagidaki asamalari içerir: bir kodlanmis kazanim görünümünü (E(b)) alma ve kodunu çözme, bir sekil görünümü için bir bit tahsisi türetme, bir kodlanmis sekil görünümünü (N(b)) alma ve kodunu çözme, burada sekil bir darbe vektörü kodlama seinasi kullanilarak kodlanmistir, burada darbeler farkli yükseklikte darbeler olusturmak üzere üst üste eklenebilir; bir frekans bandi (b) için sekil görünümünün (N(b)) bir dogruluk ölçüsünü (A(b)) tahmin etme (Sl), frekans bandi (b) çok sayida katsayi içerir, burada dogruluk ölçüsü (A(b)) birkaç darbeye (R(b)) ve bir azami darbenin (pmax(b)) yüksekligine dayanir; tahmini dogruluk ölçüsüne (A(b)) bagli olarak bir kazanim düzeltme (g(›(b)) belirleme (82); kazanim görünümünü (E(b)) belirlenen kazanim düzeltmeye bagli olarak ayarlama (S3).
10. Istem 99un usulü olup, burada kazanim düzeltme (g(.(b)) frekans bandina (b) da dayanir.
11. Istem 9 veya 10iun usulü olup, ayrica asagidaki asamalari içerir: tahsis edilmis bit oranina (R(b)) dayanan bir kazanim azalma (t(R(b))) tahmin etme (54); kazanim düzeltmeyi (gc(b)) tahmini dogruluk ölçüsüne (A(b)) ve tahmini kazanim azalmaya (t(R(b))) bagli olarak belirleme (SS).
12. Istem lliin usulü olup, burada kazanim azalma (t(R(b))) arama tablosu (200)'den tahmin
13. Istem 11 veya 12,nin usulü olup, ayrica dogruluk ölçüsünü (A(b)) arama tablosu (202)`den tahmin etmeyi (SS) içerir.
14. Istem 11 veya 12*nin usulü olup, ayrica dogruluk ölçüsünü (A(b)) azami darbe yüksekliginin (pmax) ve tahsis edilen bit oraninin (R(b)) lineer fonksiyonundan tahmin etmeyi
15. Önceki Istem 9 ila 14lten herhangi birinin usulü olup, ayrica kazanim düzeltmeyi (gc(b)) belirlenmis bir ses sinyali sinifina uyarlamayi içerir.
TR2019/10075T 2011-03-04 2011-07-04 Nicemleme sonrası kazanım düzeltmeli ses dekoderi. TR201910075T4 (tr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201161449230P 2011-03-04 2011-03-04

Publications (1)

Publication Number Publication Date
TR201910075T4 true TR201910075T4 (tr) 2019-08-21

Family

ID=46798434

Family Applications (1)

Application Number Title Priority Date Filing Date
TR2019/10075T TR201910075T4 (tr) 2011-03-04 2011-07-04 Nicemleme sonrası kazanım düzeltmeli ses dekoderi.

Country Status (10)

Country Link
US (4) US10121481B2 (tr)
EP (2) EP2681734B1 (tr)
CN (2) CN103443856B (tr)
BR (1) BR112013021164B1 (tr)
DK (1) DK3244405T3 (tr)
ES (2) ES2641315T3 (tr)
PL (2) PL3244405T3 (tr)
PT (1) PT2681734T (tr)
TR (1) TR201910075T4 (tr)
WO (1) WO2012121637A1 (tr)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011122875A2 (ko) * 2010-03-31 2011-10-06 한국전자통신연구원 부호화 방법 및 장치, 그리고 복호화 방법 및 장치
WO2012141635A1 (en) 2011-04-15 2012-10-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive gain-shape rate sharing
KR102070429B1 (ko) * 2011-10-21 2020-01-28 삼성전자주식회사 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치
CN104838443B (zh) * 2012-12-13 2017-09-22 松下电器(美国)知识产权公司 语音声响编码装置、语音声响解码装置、语音声响编码方法及语音声响解码方法
CN105324982B (zh) * 2013-05-06 2018-10-12 波音频有限公司 用于抑制不需要的音频信号的方法和设备
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
KR20240046298A (ko) 2014-03-24 2024-04-08 삼성전자주식회사 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
EP3405950B1 (en) * 2016-01-22 2022-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Stereo audio coding with ild-based normalisation prior to mid/side decision
US10109284B2 (en) 2016-02-12 2018-10-23 Qualcomm Incorporated Inter-channel encoding and decoding of multiple high-band audio signals
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
EP3948857A1 (en) * 2019-03-29 2022-02-09 Telefonaktiebolaget LM Ericsson (publ) Method and apparatus for error recovery in predictive coding in multichannel audio frames

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5263119A (en) * 1989-06-29 1993-11-16 Fujitsu Limited Gain-shape vector quantization method and apparatus
CN1139988A (zh) * 1994-02-01 1997-01-08 夸尔柯姆股份有限公司 猝发脉冲激励的线性预测
JP3707116B2 (ja) * 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
JP3707153B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 ベクトル量子化方法、音声符号化方法及び装置
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6223157B1 (en) * 1998-05-07 2001-04-24 Dsc Telecom, L.P. Method for direct recognition of encoded speech data
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
CN1639984B (zh) * 2002-03-08 2011-05-11 日本电信电话株式会社 数字信号编码方法、解码方法、编码设备、解码设备
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
DE60327039D1 (de) * 2002-07-19 2009-05-20 Nec Corp Audiodekodierungseinrichtung, dekodierungsverfahren und programm
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US8218624B2 (en) * 2003-07-18 2012-07-10 Microsoft Corporation Fractional quantization step sizes for high bit rates
US20090210219A1 (en) * 2005-05-30 2009-08-20 Jong-Mo Sung Apparatus and method for coding and decoding residual signal
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
US20080013751A1 (en) * 2006-07-17 2008-01-17 Per Hiselius Volume dependent audio frequency gain profile
JPWO2008072733A1 (ja) * 2006-12-15 2010-04-02 パナソニック株式会社 符号化装置および符号化方法
JP5339919B2 (ja) * 2006-12-15 2013-11-13 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
WO2009001874A1 (ja) 2007-06-27 2008-12-31 Nec Corporation オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム
US8085089B2 (en) * 2007-07-31 2011-12-27 Broadcom Corporation Method and system for polar modulation with discontinuous phase for RF transmitters with integrated amplitude shaping
US7853229B2 (en) * 2007-08-08 2010-12-14 Analog Devices, Inc. Methods and apparatus for calibration of automatic gain control in broadcast tuners
EP2048659B1 (en) * 2007-10-08 2011-08-17 Harman Becker Automotive Systems GmbH Gain and spectral shape adjustment in audio signal processing
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
JPWO2009125588A1 (ja) * 2008-04-09 2011-07-28 パナソニック株式会社 符号化装置および符号化方法
JP5608660B2 (ja) * 2008-10-10 2014-10-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エネルギ保存型マルチチャネルオーディオ符号化
JP4439579B1 (ja) * 2008-12-24 2010-03-24 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
US8391212B2 (en) * 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
ES2797525T3 (es) * 2009-10-15 2020-12-02 Voiceage Corp Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC
BR112012009490B1 (pt) 2009-10-20 2020-12-01 Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados
US9117458B2 (en) * 2009-11-12 2015-08-25 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
AU2011358654B2 (en) * 2011-02-09 2017-01-05 Telefonaktiebolaget L M Ericsson (Publ) Efficient encoding/decoding of audio signals
AU2012218409B2 (en) * 2011-02-18 2016-09-15 Ntt Docomo, Inc. Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program

Also Published As

Publication number Publication date
WO2012121637A1 (en) 2012-09-13
US11056125B2 (en) 2021-07-06
BR112013021164B1 (pt) 2021-02-17
EP2681734B1 (en) 2017-06-21
ES2744100T3 (es) 2020-02-21
PL2681734T3 (pl) 2017-12-29
CN103443856B (zh) 2015-09-09
CN105225669B (zh) 2018-12-21
EP3244405A1 (en) 2017-11-15
DK3244405T3 (da) 2019-07-22
BR112013021164A2 (pt) 2018-06-26
US20130339038A1 (en) 2013-12-19
EP2681734A1 (en) 2014-01-08
CN103443856A (zh) 2013-12-11
PL3244405T3 (pl) 2019-12-31
PT2681734T (pt) 2017-07-31
US10460739B2 (en) 2019-10-29
EP3244405B1 (en) 2019-06-19
CN105225669A (zh) 2016-01-06
US20200005803A1 (en) 2020-01-02
US10121481B2 (en) 2018-11-06
US20170330573A1 (en) 2017-11-16
ES2641315T3 (es) 2017-11-08
RU2013144554A (ru) 2015-04-10
US20210287688A1 (en) 2021-09-16
EP2681734A4 (en) 2014-11-05

Similar Documents

Publication Publication Date Title
TR201910075T4 (tr) Nicemleme sonrası kazanım düzeltmeli ses dekoderi.
EP3353778A1 (en) Method and system using a long-term correlation difference between left and right channels for time domain down mixing a stereo sound signal into primary and secondary channels
US10770078B2 (en) Adaptive gain-shape rate sharing
TWI785753B (zh) 多聲道信號產生器、多聲道信號產生方法及電腦程式
JP2012118205A (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
EP4179530A1 (en) Comfort noise generation for multi-mode spatial audio coding
US9595268B2 (en) Method and a decoder for attenuation of signal regions reconstructed with low accuracy
RU2575389C2 (ru) Коррекция коэффициента усиления после квантования при кодировании аудио