TR201910075T4 - Nicemleme sonrası kazanım düzeltmeli ses dekoderi. - Google Patents
Nicemleme sonrası kazanım düzeltmeli ses dekoderi. Download PDFInfo
- Publication number
- TR201910075T4 TR201910075T4 TR2019/10075T TR201910075T TR201910075T4 TR 201910075 T4 TR201910075 T4 TR 201910075T4 TR 2019/10075 T TR2019/10075 T TR 2019/10075T TR 201910075 T TR201910075 T TR 201910075T TR 201910075 T4 TR201910075 T4 TR 201910075T4
- Authority
- TR
- Turkey
- Prior art keywords
- gain
- shape
- accuracy
- estimating
- measure
- Prior art date
Links
- 238000012937 correction Methods 0.000 title claims abstract description 60
- 238000013139 quantization Methods 0.000 title description 41
- 239000013598 vector Substances 0.000 claims description 52
- 238000000034 method Methods 0.000 claims description 22
- 230000009467 reduction Effects 0.000 claims description 13
- 230000005236 sound signal Effects 0.000 claims description 11
- 238000012886 linear function Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 17
- 230000015572 biosynthetic process Effects 0.000 description 13
- 238000003786 synthesis reaction Methods 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 8
- 230000033228 biological regulation Effects 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 238000010606 normalization Methods 0.000 description 6
- 230000001419 dependent effect Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000006978 adaptation Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 150000001412 amines Chemical class 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- UKWAMSAUNRIURK-BWYYQZIESA-N gmgg Chemical compound C1=CC(OC)=CC=C1OC[C@@H]1[C@@H](O[C@H]2[C@@H]([C@@H](OCC=3C=CC=CC=3)[C@H](O[C@H]3[C@H]([C@@H](OCC=C)[C@H](O[C@H]4[C@@H]([C@@H](OCC=5C=CC=CC=5)[C@H](OCC=5C=CC=CC=5)[C@@H](COCC=5C=CC=CC=5)O4)N4C(C5=CC=CC=C5C4=O)=O)[C@@H](COCC=C)O3)OCC=3C=CC=CC=3)[C@@H](COCC=3C=CC=CC=3)O2)N2C(C3=CC=CC=C3C2=O)=O)[C@H](OCC=2C=CC=CC=2)[C@@H](N2C(C3=CC=CC=C3C2=O)=O)[C@H](OCC=C)O1 UKWAMSAUNRIURK-BWYYQZIESA-N 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 101000844611 Metallosphaera sedula (strain ATCC 51363 / DSM 5348 / JCM 9185 / NBRC 15509 / TH2) DNA-binding protein 7 Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
Ayrı kazanım ve şekil görünümleri ile kodlanmış olan sesin kodunu çözmede kullanım için bir kazanım ayarlama aygıtı (60) şekil görünümünün (Ñ(b)) bir doğruluk ölçüsünü (A(b)) tahmin etmek ve tahmini doğruluk ölçüsüne (A(b)) bağlı olarak bir kazanım düzeltme (gc(b)) belirlemek üzere yapılandırılmış bir doğruluk ölçer (62) içerir. Kazanım ayarlama aygıtı (60) kazanım görünümünü (Ê(b)) belirlenen kazanım düzeltmeye bağlı olarak ayarlamak üzere yapılandırılmış bir zarf ayarlayıcı (64) da içerir.
Description
TARIFNAME
NICEMLEME SONRASI KAZANIM DÜZELTMELI SES DEKODERI
AÇIKLAMA
TEKNIK ALAN
Bu teknoloji nicemlemenin bir kazanim görünümüne ve bir sekil görünümüne bölündügü
nicemleme semalarina dayanan kazanim-sekil ses kodlama denen ses kodlamada kazanim
düzeltmeye ve özellikle nicemleme sonrasi kazanim düzeltmeye iliskindir.
BILINEN HUSUSLAR
Modern telekomünikasyon hizmetlerinin farkli tipte birçok ses sinyalini yönetmesi beklenir.
Ana ses içerigi konusma sinyalleri oldugu için, müzik ve müzik ve konusma karisimlari gibi
daha fazla genel sinyali yönetme arzusu vardir. Telekomünikasyon aglarinda kapasite sürekli
artmakla birlikte, beher iletisim kanali için gerekli bant genisligini sinirlamak hala önemlidir.
Mobil aglarda her bir çagri için daha küçük iletim bant genislikleri hem mobil cihazda, hem
de baz istasyonda daha düsük güç tüketimi saglar. Bu mobil operatör için enerji ve maliyet
tasarrufu demektir, son kullanici ise daha uzun pil Ömrü ve daha uzun konusma süresi
yasayacaktir. Ayrica, beher kullanici için daha az tüketilen bant genisligiyle mobil ag daha
fazla sayida kullaniciya paralel hizmet verebilir.
Günümüzde, mobil ses hizmetleri için baskin sikistirma teknolojisi düsük bant genisliklerinde
konusma için iyi ses kalitesi elde eden CELP°tir (Kod Uyarilmis Lineer Tahmin). CELP
AMR (Uyarlamali Çoklu Hiz), AMR-WB (Uyarlamali Çoklu Hiz Genisbant) ve GSM-EFR
(Mobil Komünikasyon için Global Sistem - Güçlendirilmis Tam Hiz) gibi tahsis edilen
kodeklerde yaygin biçimde kullanilir. Ancak, müzik gibi genel ses sinyalleri için CELP
teknolojisinin zayif performansi vardir. Bu sinyaller frekans dönüsüm bazli kodlama, örnegin
Ancak, dönüsüm bölgesi kodekleri genelde konusma kodeklerinden daha yüksek bit hizinda
çalisir. Konusma ve genel ses bölgeleri arasinda kodlama açisindan bir bosluk vardir ve
dönüsüm bölgesi kodeklerinin daha düsük bit hizlarinda performansinin arttirilmasi istenir.
Dönüsüm bölgesi kodekleri frekans bölgesi dönüsüm katsayilarinin kompakt bir görünümünü
gerektirir. Bu görünümler çogu zaman katsayilarin gruplar halinde kodlandigi vektör
nicemlemeye (VQ) dayanir. Vektör nicemlemeye yönelik çesitli usullerin arasinda kazanim-
sekil(VQ) vardir. Bu yaklasim ayri ayri katsayilari kodlamadan önce vektörlere
normallestirme uygular. Ayri ayri kodlanabilen normallestirme faktörüne ve normallestirilmis
katsayilara vektörün kazanimi ve sekli olarak atif yapilir. Kazanim-sekilyapisinin birçok
faydasi vardir. Kazanimi ve sekli bölerek kodek kazanim nicemleyiciyi tasarlayarak degisen
kaynak girdi seviyelerine kolayca uyarlanabilir. Kazanim ve sekil farkli frekans bölgelerinde
farkli önem tasiyabilecegi algisal açidan da faydalidir. Son olarak, kazanim-sekil bölümü
nicemleyici tasariini basitlestirir ve kisitlanmamis bir vektör nicemleyiciye kiyasla bellek ve
hesaplama kaynaklari açisindan daha az karmasik yapar. Bir kazanim-sekil nicemleyicinin bir
islevsel genel görünümü Sekil Vdegörülebilir.
Bir frekans bölgesi spektrumuna uygulanirsa, kazanim-sekil yapisi bir spektral zarf ve hassas
yapi görünümü olusturmak üzere kullanilabilir. Kazaniiii degerlerinin sirasi spektruinun
zarfini olusturur, sekil vektörleri ise spektral detayi verir. Algisal bir açidan insan isitme
sisteminin frekans çözünümünü izleyen üniform olinayan bir bant yapisi kullanilarak
spektrumu bölmek faydalidir. Bu genelde dar bant genisliklerinin düsük frekanslar için, daha
genis bant genisliklerinin ise yüksek frekanslar için kullanildigi anlamina gelir. Spektral
hassas yapinin algisal önemi frekansla degisir, ama sinyalin niteliklerine de bagimlidir.
Dönüsüm kodlayicilar hassas yapinin önemli bölümlerini belirlemek ve mevcut kaynaklari en
önemli bölümlere tahsis etmek üzere çogu zaman bir isitme modeli kullanir. Spektral zarf
çogu zaman bu isitme modeline girdi olarak kullanilir. Sekil kodlayici tahsis edilen bitleri
kullanarak sekil vektörlerini nicemler. Bir isitme modeliyle kodlama sistemine dayanan bir
dönüsümün bir örnegi için Sekil 2”ye bakin.
Sekil nicemleyicinin dogruluguna bagli olarak, vektörü tekrar insa etmek üzere kullanilan
kazanim degeri az veya çok uygun olabilir. Özellikle tahsis edilen bitler az oldugunda,
kazanim degeri optimal degerden uzaklasir. Bunu çözmenin bir yolu, sekil nicemlemeden
sonra kazanim uyumsuzluguna neden olan bir düzeltme faktörünü kodlamaktir. Baska bir
çözüm, önce sekli kodlamak ve daha sonra nicemlenmis sekle göre optimal kazanim
faktörünü hesaplamaktir.
Sekil nicemlemeden sonra bir kazanim düzeltme faktörü kodlamaya yönelik çözüm çok fazla
bit hizi kullanabilir. Eger oran halihazirda düsükse, bu daha fazla bitin baska yerden alinmasi
gerektigi ve belki hassas yapi için mevcut bit hizini azaltabilecegi anlamina gelir.
Kazanimi kodlamadan önce sekli kodlamak daha iyi bir çözümdür, ama eger sekil nicemleyici
için bit hizi nicemleninis kazanim degerinden kararlastirilmissa, o zaman kazanim ve sekil
nicemleme birbirine bagimli olacaktir. Bir yinelemeli çözüm bu bagimliligi muhtemelen
çözebilir, ama bir mobil cihazda gerçek zamanda çalistirilmak kolayca çok karinasiklasabilir.
bölgesi isleme sonrasini açiklar, burada bir uyarlanir modifikasyon kazanim faktörü kodu
çözülmüs spektral katsayilarinin algilanan kalitesini gelistirmek amaciyla her bir frekans
katsayisina uygulanir.
Bir amaç, ayri kazanim ve sekil görünümleriyle kodlanmis olan sesin kodunu çözerken bir
kazanim ayarlamasi elde etmektir.
Bu amaca ekteki Istemlere uygun olarak ulasilir.
Birinci yön ayri kazanim ve sekil görünümleriyle kodlanmis bir ses sinyalinin kodunu
çözmeye yönelik bir ses dekoderi içerir. Ses dekoderi bir kodlanmis kazanim görünümünün
kodunu çözmeye yönelik araç, bir sekil görünümü için bir bit tahsisi türetmeye yönelik araç
ve bir kodlanmis sekil görünümünün kodunu çözmeye yönelik araç içerir, burada sekil bir
darbe vektörü kodlama semasi kullanilarak kodlanmistir, burada darbeler farkli yükseklikte
darbeler olusturmak için üst üste eklenebilir. Ses dekoderi ayrica bir frekans bandi için sekil
görünümünün bir dogruluk ölçüsünü tahmin etmeye yönelik araç içerir, frekans bandi çok
sayida katsayi içerir, burada dogruluk ölçüsü bir birkaç darbeye ve bir azami darbenin
yüksekligine ve bir kazanim düzeltmeyi belirlemeye dayanir, burada kazanim düzeltme
tahmini dogruluk ölçüsüne dayali olarak belirlenir. Ses dekoderi kazanim görünümünü
belirlenen kazanim düzeltmeye dayali olarak ayarlamaya yönelik araç da içerir.
Ikinci yön birinci yöne bagli olarak ses dekoderini içeren bir ag dügümü içerir.
Üçüncü yön ayri kazanim ve sekil görünümleri ile kodlanmis bir ses sinyalinin kodunu
çözmeye yönelik bir usul içerir. Usul bir kodlanmis kazanim görünümünü almayi ve kodunu
çözmeyi, bir sekil görünümü için bir bit tahsisi elde etmeyi ve bir kodlanmis sekil
görünümünü almayi ve kodunu çözmeyi içerir, burada sekil bir darbe vektörü kodlama semasi
kullanilarak kodlanmistir, burada darbeler farkli yükseklikte darbeler olusturmak için üst üste
eklenebilir. Usul ayrica bir frekans bandi için sekil görünümünün bir dogruluk ölçüsünü
tahmin etmeyi içerir, frekans bandi çok sayida katsayi içerir, burada dogruluk ölçüsü bir
birkaç darbeye ve bir azami darbenin yüksekligine dayanir. Usul ayrica tahmini dogruluk
ölçüsüne bagli olarak bir kazanim düzeltme belirleineyi ve kazanim görünümünü belirlenen
kazanim düzeltmeye bagli olarak ayarlamayi içerir.
Kazanim düzeltme için önerilen sema bir kazanim-sekil ses kodlama sisteminin algilanan
kalitesini gelistirir. Semanin düsük hesaplama karmasikligi vardir ve sayet gerektirirse, az
ilave bit gerektirir.
ÇIZIMLERIN KISA AÇIKLAMASI
Diger amaçlari ve avantajlari ile birlikte bu teknoloji ekteki çizimlerle birlikte alinan
asagidaki açiklamaya atif yaparak en iyi anlasilabilir.
Sekil 1, bir örnek kazanim-sekil vektörü nicemleme semasini gösterir;
Sekil 2, bir örnek dönüsüm bölgesi kodlama ve kodunu çözme semasini gösterir;
Sekil 3A-C, kazanim-sekil vektörü nicemlemeyi basitlestirilmis bir durumda gösterir;
Sekil 4, bir zarf düzeltmeyi belirlemek üzere bir dogruluk ölçüsü kullanarak bir örnek
dönüsüm bölgesi dekoderini gösterir;
Sekil 5A-B, sekil vektörü bir seyrek darbe vektörü oldugunda kazanim faktörleriyle sentezle
ölçeklemenin bir örnek sonucunu gösterir;
Sekil 6A-B, en büyük darbe yüksekliginin sekil vektörünün dogrulugunu nasil
gösterebilecegini gösterir;
Sekil 7, düzenleme 1 için azalma fonksiyonuna dayanan bir oranin bir örnegini gösterir;
Sekil 8, düzenleme 1 için oran ve azami darbe yükseklik bagimli bir kazanim ayarlama
fonksiyonunun bir örnegini gösterir;
Sekil 9, düzenleme 1 için oran ve azami darbe yükseklik bagimli bir kazanim ayarlama
fonksiyonunun baska bir örnegini gösterir;
Sekil 10, ses kodlayici ve dekoder sistemine dayanan bir MDCT baglaminda bu teknolojinin
bir düzenlemesini gösterir;
Sekil 11, stabilite ölçüsünden kazanim ayarlama sinirlama faktörüne bir haritalama
fonksiyonunun bir örnegini gösterir;
Sekil 12, bir uyarlanir asama ebadi olan bir ADPCM kodlayici ve dekoder sisteminin bir
örnegini gösterir;
Sekil 13, ses kodlayici ve dekoder sistemine dayanan bir alt-bant ADPCM baglaminda bir
örnegi gösterir;
Sekil 14, ses kodlayici ve dekoder sistemine dayanan bir alt-bant ADPCM baglaminda bir
örnegi gösterir;
Sekil 15, bir sinyal siniflandirici içeren bir örnek dönüsüm bölgesi kodlayiciyi gösterir;
Sekil 16, bir zarf düzeltmeyi belirlemek üzere bir dogruluk Ölçüsü kullanarak baska bir örnek
dönüsüm bölgesi dekoderini gösterir;
Sekil 17, bu teknolojiye uygun olarak bir kazanim ayarlama aygitinin bir düzenlemesini
gösterir;
Sekil 18, bu teknolojiye uygun olarak bir kazanim ayarlama aygitinin bir düzenlemesini daha
detayli gösterir;
Sekil 19, bu teknolojiye uygun olarak usulü gösteren bir akis semasidir;
Sekil 20, bu teknolojiye uygun olarak usulün bir düzenlemesini gösteren bir akis semasidir; ve
Sekil 21, bu teknolojiye uygun olarak bir agin bir düzenlemesini gösterir.
DETAYLI AÇIKLAMA
Asagidaki açiklamada ayni veya benzer fonksiyonu yapan elemanlar için ayni referans
sembolleri kullanilacaktir.
Bu teknoloji detayli açiklanmadan önce, kazanim-sekil kodlama Sekil 1-3°e atiIla
gösterilecektir.
Sekil 1, bir örnek kazanim-sekil vektörü nicemleme semasini gösterir. Sekil l7in üst bölümü
kodlayici tarafini gösterir. Bir girdi vektörü (x) vektör normunu (kazanim) (g), tipik biçimde
Euclidian normunu belirleyen bir norm hesaplayiciya (10) iletilir. Bu kesin norm bir norm
nicemleyicide (12) nicemlenir ve nicemlenmis norinun (g) tersi (1/g) girdi vektörünü (x) bir
sekil halinde ölçeklemek için bir çogalticiya (14) iletilir. Sekil bir sekil nicemleyicide (16)
nicemlenir. Niceinlenmis kazanimin ve seklin görünümleri bir bit akimi çogullayicisina (mux)
(18) iletilir. Bu görünümler gerçek nicemlenmis degerlerden ziyade, örnegin tablolardaki (kod
kitaplari) endeksleri olusturabileceklerini belirtmek üzere kesikli çizgilerle gösterilmistir.
Sekil 1°in alt bölümü dekoder tarafini gösterir. Bir bit akimi ters-çogullayicisi (demux) (20)
kazanim ve sekil görünümlerini alir. Sekil görünümü bir sekil ters-nicemleyicisine (22) iletilir
ve kazanim görünümü bir kazanim ters-nicemleyicisine (24) iletilir. Elde edilen kazanim (g)
tekrar insa edilen vektörü (13) veren elde edilen sekli ölçekledigi bir çogalticiya(26)iletilir.
Sekil 2, bir örnek dönüsüm bölgesi kodlama ve kod çözme semasini gösterir. Sekil 2lnin üst
bölümü kodlayici tarafini gösterir. Bir girdi sinyal, örnegin Modifiye Edilmis Ayrik Kosinüs
Dönüsümüne (MDCT) bagli olarak frekans dönüsümünü (X) üretmek üzere bir frekans
dönüstürücüye (30) iletilir. Frekans dönüsümü (X) her bir frekans bandinin (b)
enerjilerini (E(b)) belirleyen bir zarf hesaplayiciya (32) iletilir. Bu enerjiler bir zarf
nicemleyicide (34) enerjiler (E(b)) halinde nicemlenir. Nicemlenmis enerjiler (E(b))
dönüsümün (X) frekans bandinin (b) katsayilarini zarfin karsilik gelen nicemlenmis
enerjilerinin (E(b)) tersiyle ölçekleyen bir zarf normallestiriciye (36) iletilir. Ortaya çikan
ölçeklenmis sekiller bir hassas yapi nicemleyicisine (38) iletilir. Nicemlenmis enerjiler (E(b))
hassas yapi nicemlemesi için her bir frekans bandina (b) bitler tahsis eden bir bit tahsisatçisina
(40) da iletilir. Yukarida belirtildigi gibi, bit tahsisi (R(b)) bir insan isitme sistemi modeline
dayandirilabilir. Nicemlenmis kazanimlarin (E`(b)) ve karsilik gelen nicemlenmis sekillerin
görünümleri bit akimi çogullayicisina (18) iletilir.
Sekil 2snin alt bölümü de koder tarafini gösterir. Bit akimi ters-çogullayicisi (20) kazanim ve
sekil görünümlerini alir. Kazanim görünümleri bir zarf ters-nicemleyicisine (42) iletilir.
Üretilen zarf enerjileri (E(b)) alinan sekillerin bit tahsisini (R(b)) belirleyen bir bit
tahsisatçisina (44)iletilir. Sekil görünümleri bit tahsisinin (R(b)) kontrol ettigi bir hassas yapi
ters-nicemleyicisine (46) iletilir. Kodu çözülmüs sekiller yeniden insa edilmis bir frekans
dönüsümü olusturmak üzere onlari karsilik gelen zarf enerjileri (E`(b)) ile ölçekleyen bir zarf
sekillendiriciye (48) iletilir. Bu dönüsüm, örnegin Ters Modifiye Edilmis Ayrik Kosinüs
Dönüsümüne (IMDCT) bagli olarak sentezlenmis sesi temsil eden bir çikti sinyal üreten bir
ters frekans dönüstürücüsüne (50) iletilir.
Sekil 3A-C, yukarida açilanan kazanim-sekil vektörü nicemleinesini frekans bandinin (b)Sekil
3Aida 2-b0yutlu vektör (X(b)) ile gösterildigi basitlestirilmis bir durumda gösterir. Budurum
bir çizimde gösterilmek için yeterince basittir, ama kazanim-sekil nicemlemesindeki problemi
göstermek içinde yeterince geneldir (uygulamada vektörlerin tipik biçimde 8 veya daha fazla
boyutu vardir). Sekil 3A°nin sag tarafi vektör (X(b))`nin bir kesin kazanim-sekil görünümünü
bir kazanim (E(b)) ve bir sekil (ünite boy vektörü) (N'(b)) ile gösterir.
Ancak Sekil 3B,de gösterildigi gibi, kesin kazanim (E(b)) kodlayici tarafina bir nicemlenmis
kazanim (E(b)) halinde kodlanmistir. Vektör (X(b))”nin ölçeklenmesi için nicemlenmis
kazanimin (E`(b)) tersi kullanildigindan, ortaya çikan ölçeklenmis vektör (N(b)) dogru yöne
bakacaktir, aina ille de ünite boyunda olmayacaktir. Sekil nicemleine sirasinda ölçeklenmis
vektör (N(b)) nicemlenmis sekil (N(b)) halinde nicemlenir. Bu durumda nicemleme sekli
(veya yönü) bir miktar isaretli tamsayi darbeden olusturan bir darbe kodlama semasina [3]
dayanir. Darbeler her bir boyut için üst üste eklenebilir. Bu, izin verilen sekil nicemleine
konumlarinin Sekil 3B-C7de gösterilen dikdörtgen izgaralarda büyük noktalarla gösterildigi
anlamina gelir. Sonuç, nicemlenmis sekil (N(b)) genelde N(b),nin (ve N'(b)”nin) sekli (yönü)
ile çakisinayacaktir.
Sekil 3C, sekil nicemlemenin dogrulugunun tahsis edilen bitlere (R(b)) veya esit sekilde sekil
nicemleme için mevcut toplam darbe sayisina bagli oldugunu gösterir. Sekil 3C3nin sol
bölümünde sekil nicemleme 8 darbeye dayanir, sag bölümdeki sekil nicemleme ise sadece 3
darbe kullanir (Sekil 3B”dekiörnek4 darbe kullanir).
Buna göre, sekil nicemleyicinin dogruluguna bagli olarak, dekoder tarafinda vektör (X(b)),yi
tekrar insa etmek üzere kullanilan kazanim degerinin (E(b)) az veya çok uygun olmasi takdir
edilir. Bu teknolojiye uygun olarak bir kazanim düzeltme nicemlenmis seklin bir dogruluk
ölçüsüne dayanabilir.
Kazanimi düzeltmek üzere kullanilan dogruluk ölçüsü dekoderde halihazirda mevcut olan
parametrelerden türetilebilir, ama dogruluk ölçüsü için belirlenmis ilave parametrelere de
dayanabilir. Tipik biçimde, parametreler sekil vektörü için tahsis edilmis bitlerin sayisini ve
sekil vektörünün kendisini içerecektir, ama sekil vektörüyle iliskili kazanim degerini ve
kodlama ve kod çözme sistemi için tipik olan sinyaller hakkinda önceden depolanmis
istatistikleri de içebilir. Bir dogruluk ölçüsü ve kazanim düzeltme veya ayarlama içeren bir
sistemin bir genel görünümü Sekil 4,te gösterilmistir.
Sekil 4, bir zarf düzeltmeyi belirlemek üzere bir dogruluk ölçüsü kullanan bir örnek dönüsüm
bölgesi dekoderini (300) gösterir. Çizimin karinasiklasinasini önlemek amaciyla sadece
dekoder tarafi gösterilmistir. Kodlayici tarafi Sekil 2'deki gibi uygulanabilir. Yeni özellik bir
kazanim ayarlama aygitidir (60). Kazanim ayarlama aygiti (60) sekil görünümünün (N(b)) bir
dogruluk ölçüsünü (A(b)) tahmin etmek ve tahmini dogruluk ölçüsüne (A(b)) bagli olarak bir
kazanim düzeltme (g(.(b)) belirlemek üzere yapilandirilmis bir dogruluk ölçer (62) içerir.
Kazanim ayarlama aygiti (60) belirlenen kazanim düzeltmeye bagli olarak kazanim
görünümünü (E'(b)) ayarlamak üzere yapilandirilmis bir zarf ayarlayici (64) da içerir.
Yukarida belirtildigi gibi, kazanim düzeltme ilave bit sarf etmeden bazi düzenlemelerde
yapilabilir. Bu, dekoderde halihazirda mevcut parametrelerden kazanim düzeltmeyi tahmin
ederek yapilir. Bu islem kodlanmis seklin dogrulugunun bir tahmini olarak açiklanabilir.
Tipik biçimde bu tahmin dogruluk ölçüsünü (A(b)) sekil nicemlemenin çözünümünü belirten
sekil nicemleme niteliklerinden türetmeyi içerir.
Düzenleme 1
Bir düzenlemede, bu teknoloji bir ses kodlayici/dekoder sisteminde kullanilir. Sistem
dönüsüm bazlidir ve kullanilan dönüsüm %50 örtüsmeyle sinüsoidal pencereler kullanan
Modifiye Edilmis Ayrik Kosinüs Dönüsümüdür (MDCT). Ancak, dönüsüm kodlamaya uygun
herhangi bir dönüsümün uygun kesiinleine ve pencereleme ile birlikte kullanilabilecegi
anlasilmistir.
Düzenleme l”in kodlayicisi
Girdi ses %50 örtüsme kullanilarak çerçeveler halinde çikarilir ve simetrik bir sinüsoidal
pencereyle pencerelenir. Her bir pencerelenen çerçeve daha sonra bir MDCT spektrumuna (X)
dönüstürülür. Spektrum isleme için alt-bantlara bölünür, burada alt-bant enleri üniform
degildir. Banda (b) ait çerçeve(m),nin spektral katsayilari X(b,m) ile gösterilir ve bant
genisligine (BW(b_)) sahiptir. Çogu kodlayici ve dekoder asamalari bir çerçeve içinde
açiklanabileceginden, çerçeve endeksi çikarilir ve sadece n0tasy0nX(b) kullanilir. Bant
genislikleri tercihen insan isitme sisteminin frekans çözünümüyle uyumlu olmasi için artan
frekansla artmalidir. Her bir bandin karekök ortalama (RMS) degeri bir normallestirme
faktörü olarak kullanilir ve E(b) ile gösterilir:
burada X (b)TX (b),nin devrigini gösterir.
RMS degeri beher katsayi için enerji degeri olarak görülebilir. b: l,2,..., Nba,” için
normallestirme faktörü (E(b)) dizisi MDCT spektrumunun zarfini olusturur, burada Nba",
bantlarin sayisini gösterir. Daha sonra, dizi dekodere iletilmek amaciyla nicemlenir.
Norrnallestirmenin dekoderde terse çevrilebilmesini temin etmek üzere, nicemlenmis
zarf (E(b)) elde edilir. Bu örnek düzenlemede zarf katsayilari 3 dBîlik bir asama ebadi
kullanilarak log bölgesinde ölçeksel nicemlenmistir ve nicemleyici endeksleri Huffman
kodlamasi kullanilarak türevsel biçimde kodlanmistir. Nicemlenmis zarf spektral bantlarin
normallestirilmesi için kullanilir, yani
Eger nicemlenmemis zarf E(b) normallestirme için kullanilirsa, seklin RMS = 1 degeri
olacagina dikkat edin, yani
1 3 N (b) N (b)
Nicemlenmis zarf (E`(b)) kullanilarak sekil vektörünün l,e yakin bir RMS degeri olacaktir. Bu
özellik kazanim degerinin bir yuvarlamasini yaratmak üzere dekoderde kullanilacaktir.
Normallestirilmis sekil vektörlerinin (N(b)) birligi MDCT spektrumunun hassas yapisini
olusturur. Nicemlenmis zarf normallestirilmis sekil vektörlerinin (N(b)) kodlanmasi için bir
bit tahsisi (R(b)) üretmek üzerekullanilir. Bit tahsis algoritmasi tercihen bir isitme modeli
bitleri algisal olarak en ilgili bölümlere dagitmak üzere kullanir. Herhangi bir nicemleyici
semasi sekil vektörünü kodlamak için kullanilabilir. Hepsi için ortak olan, hepsinin girdinin
normallestirildigi varsayimiyla tasarlanabilmesidir, bu nicemleyici tasarimini basitlestirir. Bu
düzenlemede sekil nicemleme sentez seklini bir miktar isaretli tamsayi darbeden [3] insa eden
bir darbe kodlama semasi kullanilarak yapilmistir. Darbeler farkli yükseklikte darbe
olusturmak üzere üst üste eklenebilir. Bu düzenlemede bit tahsisi (R(b)) banda (b) tahsis
edilen darbe sayisini gösterir.
Zarf nicemlemeden ve sekil nicemlemeden nicemleyici endeksler bir dekodere depolanmak
veya iletilmek üzere bir bit akimi halinde çogullanir.
Düzenleme Pin dekoderi
Dekoder bit akimindan endeksleri ters-çogullar ve ilgili endeksleri her bir kod çözme
modülüne iletir. Ilk önce, nicemlenmis zarf (E(b)) elde edilir. Daha sonra, hassas yapi bit
tahsisi kodlayicida kullanilanla ayni bir bit tahsisi kullanilarak nicemlenmis zarftan türetilir.
Hassas yapinin sekil vektörlerinin (N(b)) kodu endeksler ve elde edilen bit tahsisi (R(b))
kullanilarak çözülür.
Simdi kodu çözülmüs hassas yapiyi zarfla ölçeklemeden önce, ilave kazanim düzeltme
faktörleri belirlenir. Ilk önce, RMS eslesen kazanim asagidaki sekilde elde edilir:
gRMs(b) faktörü RMS degerini 1,e normallestiren bir ölçekleine faktörüdür, yani
JwmabWwif(gmibimbi)
Bu düzenlemede sentezin ortalama kareli hatasi (MSE) en aza indirilmeye çalisilir:
amo) = arg minlNib› - g › ml [6)
çözümle
ngaib) _ N(b]TN(b) [ )
gMgg(b) girdi sekle (N(b)) dayandigindan, dekoderde bilinmez. Bu düzenlemede etki bir
dogruluk ölçüsü kullanilarak tahmin edilir. Bu kazanimlarin orani bir kazanim düzeltme
faktörü (gc(b)) olarak tanimlanir:
ge( ] gRMslb)
Sekil nicemlemenin dogrulugu iyi oldugunda, düzeltme faktörü Ve yakindir, yani
Muammzgmai (%
Ancak N(b)”nin dogrulugu düsük oldugunda, gMSE(b) ve giz/mü) uzaklasacaktir. Seklin bir
darbe kodlama semasi kullanilarak kodlandigi bu düzenlemede, düsük bir oran sekil
vektörünü seyrek yapacak ve gRMs(b) MSE açisindan uygun kazanimin bir fazla tahminini
verecektir. Bu durum için gc(b) asimi telafi etmek üzere 1”den daha düsük olmalidir. Düsük
oran darbe sekil durumunun bir örnek görünümü için Sekil 5A-B,ye bakin. Sekil 5A-B, sekil
vektörü bir seyrek darbe vektörü iken gMgg (Sekil SB) ve gRMs (Sekil 5A) kazanim faktörleri
ile sentezi ölçeklemenin bir örnegini gösterir. gRMS ölçekleme bir MSE anlaminda çok yüksek
olan darbeler verir.
Diger taraftan, zayir` veya seyrek bir hedef sinyal bir darbe sekliyle iyi temsil edilebilir. Girdi
sinyalin seyrekligi sentez asamasinda bilinemeyebilecegi için, sentez seklin seyrekligi
sentezlenmis sekil vektörünün dogrulugunun bir göstergesi görevini görebilir. Sentez seklin
seyrekligini ölçmenin bir yolu, sekildeki azami zirvenin yüksekligidir. Bunun gerisindeki
mantik, seyrek bir girdi sinyalin sentez sekilde yüksek zirveler üretmesinin daha olasi10
oldugudur. Zirve yüksekliginin iki esit oranli darbe vektörünün dogrulugunu nasil
gösterebileceginin bir görünümü için Sekil 7A-Blye bakin. Sekil ?Alda kesikli sekli temsil
etmek üzere mevcut 5 darbe (R(b) = 5) vardir. Sekil sabit oldugundan, kodlama esit
yükseklikte (:1) 5 dagitilmis darbe üretir, yani pinax :1. Sekil 7Bsde de kesikli sekli temsil
etmek üzere mevcut 5 darbe vardir. Ancak, bu durumda sekil zayif veya seyrektir ve en büyük
zirveyi üst üste 3 darbe temsil eder, yani mm: 3. Bu, kazanim düzeltmenin (g(.(b))
nicemlenmis seklin bir tahmini seyrekligine (pmax) dayandigini gösterir.
Yukarida belirtildigi gibi, girdi sekli (N(b)) dekoder bilmez. gMSE(b) girdi sekle (N(b))
dayandigindan, bu kazanim düzeltme veya telafinin (gc(b)) uygulamada ideal denklem (8),e
dayanamayacagi anlamina gelir. Bu düzenlemede kazanim düzeltmenin (g(.(b))
darbelerin sayisi (R(b)), sekil vektöründeki en büyük darbenin yüksekligi (pimx(b)) ve frekans
bandi (b) açisindan bit-oranina dayanmasi kararlastirilmistir, yani
gcib) = f (Rwlßmadbhb) (10)
Daha düsük oranlarin genelde MSElyi en aza indirmek üzere kazanimda bir azalma
gerektirdigi görülmüstür. Oran bagimliligi ilgili ses sinyali verisinde denenen bir arama
tablosu (t(R(b))) gibi uygulanabilir. Bir örnek arama tablosu Sekil 7lde görülebilir. Bu
düzenlemedeki sekil vektörlerinin farkli enleri oldugundan, oran tercihen beher örnek için
darbelerin sayisi olarak ifade edilebilir. Bu sekilde ayni oran bagimli azalma tüm bant
genislikleri için kullanilabilir. Bu düzenlemede kullanilan alternatif bir çözüm, bandin enine
bagli olarak tabloda bir asama ebadi (T) kullanmaktir. Burada, 4 farkli grupta 4 farkli bant
genisligi kullanilmistir, dolayisiyla 4 asama ebadi gerekir. Asama ebatlarinin bir örnegi Tablo
l,de bulunur. Asaina ebadini kullanarak, arama degeri bir yuvarlama islemi (t( I-R(b)~TJ ))
kullanilarak elde edilmistir, burada '- J en yakin tamsayiya yuvarlamayi temsil eder.
Bant grubu Bant genisligi Asama ebadi T
2 16 3 24 2
Baska bir örnek arama tablosu Tablo 2,de verilmistir.
Bant grubu Bant genisligi Asama ebadi T
2 16 3 24 2
Tahmini seyreklik hem darbelerin sayisina (R(b)), hem de azami darbenin
yüksekligine (pmax(b)) bagli olarak baska bir arama tablosu (u(R(b), pmax(b))) gibi
uygulanabilir. Bir örnek arama tablosu Sekil 8'de gösterilmistir. Arama tablosu (u) bant (b)
için bir dogruluk ölçüsü (A(b)) görevi görür, yani
AU?) = u(R(b)›Pmax(b)) (11)
ngEnin yuvarlanmasinin algisal açidan daha düsük frekans araligi için daha uygun
görülmüstür. Daha yüksek frekanslar için hassas yapi algisal olarak daha az önemli olur ve
enerjilerin veya RMS degerinin eslesmesi daha hayati olur. Bu nedenle, kazanim azalma
sadece belirli bir bant sayisinin (bnm) altinda uygulanabilir. Bu durumda kazanim
düzeltmenin(gc(b)) frekans bandina (1)) açik bagimligi olacaktir. Ortaya çikan kazanim
düzeltme fonksiyonu bu durumda asagidaki sekilde tanimlanabilir:
Bu noktaya kadarki açiklama Sekil 4°ün örnek düzenleinesinin temel özelliklerini açiklamak
üzere de kullanilabilir. Buna göre, Sekil 4”ün düzenlemesinde son sentez (X(b)) asagidaki
sekilde hesaplanir:
Xib) = gc(b)gRMS(b)E(n)N(b) (13)
Bir alternatif olarak fonksiyon u(R(b), pinax(b)) azami darbe yüksekliginin (pmx) ve tahsis
edilen bit oraninin (R(b)) lineer fonksiyonu olarak, örnegin asagidaki sekilde uygulanabilir:
burada temayül (k) asagidaki sekilde belirlenmistir:
Aci = (amax - amm)/R[b] (15]
Fonksiyon R(b) = 1 ve pmax(b) = 1 için ilk azalma faktörünü veren ayarlama
parametresine (amin) dayanir. Fonksiyon ayarlama parametresi amin: 0,41 olarak Sekil 97da
gösterilmistir. Tipik biçimde umaxe [0, 7, 1, 4] ve umine [0, umd. Denklem (14)”te upmax (b) ve
R(b) arasindaki farkta lineerdir. Diger bir olasilik, pmx(b) ve R(b) için farkli temayül
faktörlerinin olmasidir.
Verili bir bant için bit hizi yan yana çerçeveler arasindaki bir verili bant için keskin biçimde
degisebilir. Bu kazanim düzeltmenin hizli degisikliklerine yol açabilir. Bu tür degisiklikler
zarf oldukça stabil oldugunda, yani çerçeveler arasindaki toplam degisiklikler çok küçük
oldugunda özellikle kritiktir. Bu çogu zaman tipik biçimde daha stabil enerji zarflari olan
müzik sinyalleri için olur. Kazanim azalmanin instabiliteye sebep vermesini önlemek için, bir
ilave uyarlama eklenebilir. Böyle bir düzenlemenin bir genel görünümü Sekil 103da
verilmistir, burada bir stabilite ölçer (66) dekoderdeki (300) kazanim ayarlama aygitina (60)
eklenmistir.
Uyarlama örnegin zarfin (E(b)) bir stabilite Ölçüsüne dayanabilir. Böyle bir ölçünün bir örnegi
yan yana logg zarf vektörleri arasindaki kareli Euclidian mesafesini hesaplamaktir:
AE(m>= (log,Etami-iogzâwm-DT (161
bandi I›
Burada AE(m) çerçeve (m) ve çerçeve (m-l) için zarf vektörleri arasindaki kareli Euclidian
mesafesini gösterir. Stabilite ölçüsü daha düzgün bir uyarlama olmasi için düsük geçisli de
filtrelenebilir:
Unutma faktörü ((1) için uygun bir deger 0,1 olabilir. Düzeltilmis stabilite ölçüsü daha sonra,
örnegin asagidaki gibi bir sigmoid fonksiyon kullanilarak azalmanin sinirlanmasini yaratmak10
üzere kullanilabilir:
1+eCi(AI`I(iii)eC2)-C3 7
burada parametreler C1 = 6, C2 = 2 ve C3 = 1,9 olarak ayarlanabilir. Bu parametreler örnek
olarak görülmelidir, gerçek degerler ise daha rahat seçilebilir. Örnegin,
C2 6 [1,4]
Sekil 11, stabilite ölçüsünden (AE(m)) kazanim ayarlama sinirlama faktörüne (gmin) bir
haritalama fonksiyonunun bir örnegini gösterir. gmin için yukaridaki ifade tercihen bir arama
tablosu gibi veya
1, AE ›
gibi basit bir asama fonksiyonu ile uygulanir.
Azalma sinirlaina degiskeni (gminE [0,l]) bir stabilite uyarlanmis kazanim
modifikasyonu (gc(b)) yaratmak üzere kullanilabilir:
Kazanimin tahmininden sonra, son sentez X(b) asagidaki gibi hesaplanir:
Düzenleme lsin açiklanan degisikliklerinde sentezlenmis vektörler (X(b)) birligi sentezlenmis
spektrumu (X) olusturur, bu ters-MDCT dönüsümünü kullanarak ayrica islenir, simetrik sine
pencereyle pencerelenir ve örtüsme-ve-ekleme stratejisi kullanilarak çikti sentezine eklenir.
Baska bir örnekte, sekil sekil nicemlemesi için bir QMF (DörtlüAyna Filtre) filtre bankasi ve
bir ADPCM (Uyarlanir Kademeli Darbe-Kod Modülasyonu) semasi kullanilarak nicemlenir.
Bir alt-bant ADPCM semasinin bir örnegi lTU-T G.722 [4],dir. Girdi ses sinyali dilimler
halinde tercihen islenir. Bir Örnek ADPCM semasi bir uyarlanir asama ebadi (S) ile Sekil
12°de gösterilmistir. Burada, sekil nicemleyicinin uyarlanir asama ebadi dekoderde
halihazirda mevcut olan ve ilave sinyalleme gerektirmeyen bir dogruluk ölçüsü görevi görür.
Ancak, nicemleme asama ebadinin kod çözme isleminin kullandigi parametrelerden
çikarilmasi gerekir, sentezlenmis sekilden çikarilmasi gerekmez. Bu örnegin bir genel
görünüm Sekil 14”te gösterilmistir. Ancak, bu örnek detayli açiklanmadan önce, bir QMF
filtre bankasina dayanan bir örnek ADPCM semasi Sekil 12 ve 13”e atifla açiklanacaktir.
Sekil 12, uyarlanir bir nicemleme asamasi ebadi olan bir ADPCM kodlayici ve dekoder
sisteminin bir örnegini gösterir. Bir ADPCM nicemleyici (70) bir girdi sinyal alan ve bir hata
sinyali(e) olusturmak üzere önceki girdi sinyalin bir tahminini çikaran bir ekleyici (72) içerir.
Hata sinyali nicemleyici (74),te nicemlenir, niceinleyici (74),ün çiktisi bit akimi
çogullayicisina (18) ve de bir asama ebadi hesaplayiciya (76) ve ters-nicemleyici (78),e
iletilir. Asama ebadi hesaplayici (76) nicemleme asamasi ebadini (S) kabul edilebilir bir hata
elde etmek üzere uyarlar. Nicemleme asamasi ebadi (5) bit akimi çogullayicisina (18) iletilir
ve de nicemleyici (74)”ü ve ters-nicemleyici (78)”i kontrol eder. Ters-nicemleyici (78)
ekleyici (80),e bir hata tahmini (ê) çikarir. Ekleyici (80),nin diger girdisi geciktirme elemani
(82)'nin geciktirdigi girdi sinyalin bir tahminini alir. Bu, geciktirme elemani (82)°ye iletilen
girdi sinyalin bir cari tahmin olusturur. Geciken sinyal hata sinyalini (e) olusturmak üzere
asama ebadi hesaplayicisina (76) ve de (bir isaret degisikligiyle) ekleyici (72)”ye iletilir.
Bir ADPCM ters-nicemleyicisi (90) alinan nicemleme asamasi ebadinin (S) kodunu çözen ve
ters-nicemleyici (94)”e ileten bir asama ebadi dekoderi (92) içerir. Ters-nicemleyici (94)
ekleyici (98)”e iletilen hata tahmininin (é) kodunu çözer, ekleyici (98)”in diger girdisi
geciktirme elemani (96),nin geciktirdigi çikti sinyali ekleyiciden alir.
Sekil 13, bir alt-bant ADPCM-bazli ses kodlayici ve dekoder sistemi baglaminda bir örnek
gösterir. Kodlayici tarafi Sekil 2Snin düzenlemesinin kodlayici tarafina benzer. Temel farklar
frekans dönüstürücünün (30)bir QMF (Dörtlü Ayna Filtre) analiz filtre bankasi (100) ile
degistirilmis olmasi ve hassas yapi nicemleyicinin (38)Sekil 12”deki nicemleyici (70) gibi bir
ADPCM nicemleyiciyle degistirilmis olmasidir. Dekoder tarafi Sekil 27nin düzenlemesinin
dekoder tarafina benzer. Temel farklar ters frekans dönüstürücünün (50) bir QMF sentez filtre
bankasi(102) ile degistirilmis olmasi ve hassas yapi ters-nicemleyicinin (46) Sekil 12”deki
ters-nicemleyici (90) gibi bir ADPCM ters-nicemleyiciyle degistirilmis olmasidir.
Sekil 14, bir alt-bant ADPCM-bazli ses kodlayici ve dekoder sistemi baglaminda bu
teknolojinin bir örnegini gösterir. Çizimin karmasiklasmasini önleinek amaciyla, sadece
dekoder tarafi (300) gösterilmistir. Kodlayici tarafi Sekil 137teki gibi uygulanabilir.
Örnek 2,nin kodlayicisi
Kodlayici QMF filtre bankasini alt-bant sinyalleri elde etmek üzere uygular. Her bir alt-bant
sinyalinin RMS degerleri hesaplanir ve alt-bant sinyalleri normallestirilir. Zarf (E(b)), alt-bant
bit tahsisi (R(b)) ve normallestirilmis sekil vektörleri (N(b)) düzenleme lsdeki gibi elde edilir.
Her bir normallestirilmis alt-bant ADPCM nicemleyiciye beslenir. Bu örnekte ADPCM ileri
uyarlanir biçimde çalisir ve alt-bant (1)) için kullanilacak bir ölçekleme asamasi (S(b)) belirler.
Ölçekleme asamasi alt-bant çerçevesi boyunca MSE”yi en aza indirmek üzere seçilir. Bu
örnekte asama tüm olasi asamalari deneyerek ve asgari MSE7yi vereni seçerek seçilir:
SW'm-'n BW(b)
burada Q(x,s) s asama ebadi kullanan degisken (x),in ADPCM nicemleme fonksiyonudur.
Seçilen asama ebadi nicemlenmis sekil üretmek üzere kullanilabilir:
Zarf nicemlemeden ve sekil nicemlemeden nicemleyici endeksler bir dekodere depolanmak
veya iletilmek üzere bir bit akimina çogullanir.
Örnek 2,nin dekoderi
Dekoder bit akimindan endeksleri ters çogullar ve ilgili endeksleri her bir kod çözme
modülüne iletir. Nicemlenmis zarf (E(b)) ve bit tahsisi (R(b)) düzenleme 17deki gibi elde
edilir. Sentezlenmis sekil vektörleri (N(b)) uyarlanir asama ebatlariyla (S(b)) birlikte ADPCM
dekoder veya ters-nicemleyiciden elde edilir. Asama ebatlari nicemleninis sekil vektörünün
dogrulugunu belirtir, burada daha küçük bir asama ebadi daha yüksek bir dogruluga karsilik
gelir ve daha yüksek bir dogruluk daha küçük bir asama ebadina karsilik gelir. Bir olasi
uygulama, dogrulugu (A(b)) bir orantililik faktörü (y) kullanarak asama ebadina ters orantili
yapmaktir:
burada 3/ istenen iliskiyi elde etmek üzere ayarlaninalidir. Bir olasi seçenek
y : Smjnidir, burada Smin asgari asama ebadidir, bu S(b) : Smin için dogrulugu l verir.10
Kazanim düzeltme faktörü (gp) bir haritalaina fonksiyonu kullanilarak elde edilebilir:
Haritalama fonksiyonu (h) oran (R(b))'ye ve frekans bandina (b) bagli olarak bir arama
tablosu gibi uygulanabilir. Bu tablo optimal kazanim düzeltme degerlerini (gMSE/gRMS) bu
parametrelerle karistirarak ve optimal kazanim düzeltme degerlerinin her bir kümesi için
ortalamasini alarak tablo girisini hesaplayarak tanimlanabilir.
Kazanim düzeltmenin tahmininden sonra, alt-bant sentezi (X(b)) asagidaki sekilde hesaplanir:
Xlbl : gclblgRiiislbigln)Nlbl (2]
Çikti ses çerçevesi sentez QMF filtre bankasini alt-bantlara uygulayarak elde edilir.
Sekil l4ite gösterilen örnekte kazanim ayarlama aygitindaki (60) dogruluk ölçer (62) henüz
kodu çözülmeinis nicemleme asama ebadini (S(b)) dogrudan alinan bit akimindan alir. Bir
alternatif, yukarida belirtildigi gibi nicemleme asama ebadinin (S(b)) kodunu ADPCM ters-
nicemleyicide (90) çözmek ve kodu çözülmüs formda dogruluk ölçere (62) iletmektir.
Yukarida açiklanan örnek 2'nin belirtilen bulusun bir bölümünü olusturmadigi, ama bulusu
anlamak için alternatif bir uygulamanin faydali bir örnegini verdigi belirtilmistir.
Diger alternatifler
Dogruluk ölçüsü kodlayicida türetilmis bir sinyal sinifi parametreyle tamamlanabilir. Bu,
örnegin bir konusma/müzik diskriminatörü veya bir geri plan gürültü seviyesi tahmin edici
olabilir. Bir sinyal siniflandirici içeren bir sistemin bir genel görünümü Sekil 15-16°da
gösterilmistir. Sekil 15°teki kodlayici tarafi Sekil 2”deki kodlayici tarafina benzer, aina bir
sinyal siniflandiriciyla (104) donatilmistir. Sekil 167daki dekoder tarafi (300) Sekil
4itekidekoder tarafina benzer, ama dogruluk ölçere (62) bir diger sinyal sinifi girdisiyle
donatilmistir.
Sinyal sinifi, örnegin sinif bagimli bir uyarlamaya sahip olarak kazanim düzeltmeye
katilabilir. Eger sinyal siniflarinin sirasiyla C = 1 ve C = 0 degerlerine karsilik gelen konusma
veya müzik oldugunu varsayarsak, kazanim ayarlamayi sadece konusma sirasinda etkili
olmak üzere kisitlayabiliriz, yani
Baska bir altematif düzenlemede sistem kismen kodlanmis bir kazanim düzeltme veya telafi
ile birlikte bir öngörücü gibi davranabilir. Bu düzenlemede dogruluk ölçüsü kazanim
düzeltme veya telafinin tahminini gelistirmek üzere kullanilir, bu sayede geri kalan kazanim
hatasi daha az bitle kodlanabilir.
Kazanim düzeltme veya telafi faktörünü (gg.) yaratirken RMS degerini veya enerjileri
eslestirme ve MSElyi minimize etme arasinda bir denge olusturinak istenebilir. Bazi
durumlarda enerjileri eslestirme dogru bir dalga biçiminden daha önemli olur. Bu Örnegin
daha yüksek frekanslar için dogrudur. Bunu saglamak için son kazanim düzeltme baska bir
düzenlemede farkli kazanim degerlerinin agirlikli toplami kullanilarak olusturulabilir:
burada ge yukarida açiklanan yaklasimlardan birine uygun olarak elde edilen kazanim
düzeltmedir. Agirlik faktörü (ß), örnegin frekansa, bit hizina veya sinyal tipine uyarlanabilir.
Burada açiklanan asamalar, islevler, prosedürler ve/veya bloklar hem genel amaçli elektronik
devre, hem de uygulamaya özel devre içeren ayrik devre veya entegre devre teknolojisi gibi
herhangi bir konvansiyonel teknoloji kullanilarak donanimda uygulanabilir.
Alternatif olarak, burada açiklanan asamalarin, islevlerin, prosedürlerin ve/veya bloklarin en
azindan bazisi bir mikroislemci, Dijital Sinyal Islemci (DSP) gibi uygun bir isleme cihazi
ve/veya bir Alan Programlanabilen Geçit Dizilimi (FPGA) cihazi gibi uygun herhangi bir
programlanabilen mantik cihazi tarafindan uygulama için yazilimda uygulanabilir.
Dekoderin genel isleme yeteneklerini tekrar kullanmanin mümkün olabilecegi de
anlasilmalidir. Bu, örnegin mevcut yazilimi tekrar prograinlayarak veya yeni yazilim
bilesenleri ekleyerek yapilabilir.
Sekil 17, bu teknolojiye uygun olarak bir kazanim ayarlama aygitinin (60) bir düzenlemesini
gösterir. Bu düzenleme dogruluk ölçüsünü tahmine yönelik bir yazilim bileseni (120),
düzeltmenin kazanimini belirlemeye yönelik bir yazilim bileseni (130) ve kazanim
görünümünü ayarlamaya yönelik bir yazilim bileseni(140) uygulayan bir islemciye (110),
örnegin bir mikro islemciye dayanir. Bu yazilim bilesenleri bellege (150) depolanmistir.
Islemci(l 10)bir sistem veriyolu üzerinden bellekle haberlesir. Parametreler (AA/(b), R(b), E(b))
islemci (110) ve bellegin (150) bagli oldugu bir I/O veriyolunu kontrol eden bir girdi/çikti
(l/O) kontrolörü(160) tarafindan alinir. Bu düzenlemede I/O kontrolörünün(160) aldigi
parametreler bellege (150) depolanmistir, parametreler yazilim bilesenleri tarafindan bellekte
islenir. Yazilim bilesenleri (120, 130) blok (62),nin islevselligini yukarida açiklanan
düzenlemelerde uygulayabilir. Yazilim bileseni (140) blok (64)`ün islevselligini yukarida
açiklanan düzenlemelerde uygulayabilir. Yazilim bileseni(140),tan elde edilen ayarlanan
kazanim görünümü (E`(b)) I/O kontrolörü(l60) tarafindan I/O veriyolu üzerinden bellekten
(150) çikarilir.
Sekil 18, bu teknolojiye uygun olarak kazanim ayarlamanin bir düzenlemesini daha detayli
gösterir. Bir azalma tahmin edici (200) alinan bit tahsisini (R(b)) bir kazanim azalma (t(R(b)))
belirlemek üzere kullanmak için yapilandirilmistir. Azalma tahmin edici (200), örnegin bir
arama tablosu olarak veya yukaridaki denklem (14) gibi bir lineer denkleme bagli olarak
yazilimda uygulanabilir. Bit tahsisi (R(b)), örnegin sekil görünümündeki (N(b)) en yüksek
darbenin yüksekligiyle temsil edilen niceinlenmis seklin bir tahmini seyrekligini (pinax(b)) de
alan bir sekil dogruluk tahmin edicisine (202) de iletilir. Sekil dogruluk tahmin edici (202),
örnegin bir arama tablosu olarak uygulanabilir. Tahmini azalma (t(R(b))) ve tahmini sekil
dogrulugu (A(b)) çogalticida (204),te çogaltilir. Bir düzenlemede bu ürün (t(R(b))-A(b))
kazanim düzeltmeyi (gc(b)) dogrudan olusturur. Baska bir düzenlemede kazanim
düzeltme (gc(b)) yukaridaki denklem (12)”ye uygun olarak olusturulmustur. Bu, frekans
bandinin (1)) bir frekans limitinden (br/112) az olup, olmadigini belirleyen bir karsilastiricinin
(208) kontrol ettigi bir anahtar (206) gerektirir. Eger durum buysa, o
zaman gc(b) t(R(b))-A(b),ye esittir. Aksi takdirde, gc(b) l”e ayarlanir. Kazanim
düzeltme (gi.(b)) diger girdisi RMS eslesen kazanimini (gRMA(b)) alan baska bir
çogalticiya( ve
karsilik gelen bant genisligine (BW(b)) bagli olarak bir RMS eslesen kazanim hesaplayici
(212) tarafindan belirlenir, yukaridaki denklem (4),e bakin. Ortaya çikan ürün sekil
görünümünü (N(b)) ve kazanim görünümünü (E(b)) de alan ve sentezi (X(b)) olusturan baska
bir çogaltici (214),e iletilir.
Sekil 10,a atiIla açiklanan stabilite tespiti düzenleme 2°nin yani sira, yukarida açiklanan diger
düzenlemelere dahil edilebilir.
Sekil 19, bu teknolojiye uygun olarak usulü gösteren bir akis semasidir. Asama Sl sekil
görünümünün (N(b)) bir dogruluk ölçüsünü (A(b)) tahmin eder. Dogruluk ölçüsü, örnegin
sekil nicemlemenin çözünümünü gösteren R(b),S(b) gibi sekil nicemleme10
niteliklerinden türetilebilir. Asama SZ tahmini dogruluk ölçüsüne bagli olarak gc(b), gc(b),
g'c(b) gibi bir kazanim düzeltme belirler. Asama S3 kazanim görünümünü (E(b)) belirlenen
kazanim düzeltmeye bagli olarak ayarlar.
Sekil 20, bu teknolojiye uygun olarak usulün bir düzenlemesini gösteren bir akis semasidir,
burada sekil bir darbe kodlama semasi kullanilarak kodlanmistir ve kazanim düzeltme
nicemlenmis seklin bir tahmini seyrekligine (pmax(b)) dayanir. Bir dogruluk Ölçüsünün asama
Sl,de halihazirda belirlenmis oldugu varsayilir (Sekil 19). Asama S4 tahsis edilmis bit
oranina dayanan bir kazanim azalmayi tahmin eder. Asama SS tahmini dogruluk ölçüsüne ve
tahmini kazanim azalmasina bagli olarak bir kazanim düzeltme belirler. Daha sonra prosedür
kazanim görünümünü ayarlamak üzere asama S3”e ilerler (Sekil 19).
Sekil 21, bu teknolojiye uygun olarak bir agin bir düzenlemesini gösterir. Ag bu teknolojiye
uygun olarak bir kazanim ayarlama aygitiyla donatilmis bir dekoder (300) içerir. Bu
düzenleme bir telsiz terminal gösterir, ama baska ag dügüinler de fizibildir. Örnegin, IP
(Internet Protokolü) üzerinden ses agda kullanilirsa, dügümler bilgisayarlar içerebilir.
Sekil 213deki ag dügümünde bir anten (302) bir kodlanmis ses sinyali alir. Bir telsiz ünitesi
(304) bu sinyali yukarida çesitli düzenlemelere atiûa açiklandigi gibi bir dijital ses sinyali
üretmek için dekodere (300) iletilen ses parametrelerine dönüstürür. Dijital ses sinyali daha
sonra D/A”ya dönüstürülür ve ünite (306)”da güçlendirilir ve son olarak bir
hoparlöre(308)i1eti1ir.
Yukaridaki açiklama dönüsüm bazli ses kodlamaya odaklanmakla birlikte, ayni prensipler
ayri kazanim ve sekil görünümleri olan zaman bölgesi ses kodlamasina, örnegin CELP
kodlamaya da uygulanabilir.
Teknikte uzman olanlar ekteki Istemlerde tanimlanan kapsamdan sapmadan bu teknolojiye
çesitli modifikasyonlarin ve degisikliklerin yapilabilecegini anlayacaktir.
Claims (15)
1. Ayri kazanim ve sekil görünümleri ile kodlanmis bir ses sinyalinin kodunu çözmeye yönelik bir ses dekoderi (300) olup, söz konusu ses dekoderi asagidakileri içerir: bir kodlanmis kazanim görünümünün (E(b)) kodunu çözmeye yönelik araç (42), bir sekil görünümü için bir bit tahsisi türetmeye yönelik araç (44), bir kodlanmis sekil görünümünün (N(b)) kodunu çözmeye yönelik araç (46), burada sekil bir darbe vektörü kodlama semasi kullanilarak kodlanmistir, burada darbeler farkli yükseklikte darbeler olusturmak için üst üste eklenebilir; bir frekans bandi (b) için sekil görünümünün (N(b)) bir dogruluk ölçüsünü (A(b)) tahmin etmeye yönelik araç (62), frekans bandi (b) çok sayida katsayi içerir, burada dogruluk ölçüsü (A(b)) bir birkaç darbeye (R(b)) ve bir azami darbenin (pmax(b)) yüksekligine ve bir kazanim düzeltme (g(.(b)) belirlemeye dayanir, burada kazanim düzeltme (gi.(b)) tahinini dogruluk ölçüsüne (A(b)) dayali belirlenir; kazanim görünümünü (E(b)) belirlenen kazaniin düzeltmeye bagli olarak ayarlamaya yönelik araç (64).
2. Istem 1'in ses dekoderi olup, burada kazanim düzeltme (g,.(b)) frekans bandina (b) da dayanir.
3. Istem 1 veya 2,nin ses dekoderi olup, burada bir dogruluk ölçüsü tahmin etmeye yönelik araç ayrica asagidakileri içerir: tahsis edilen bit hizina (R(b)) dayanan bir kazanim azalmayi (t(R(b)) tahmin etmeye yönelik bir azalma tahmin araci (200), dogruluk ölçüsünü (A(b)) tahmin etmeye yönelik bir sekil dogruluk tahmin araci (202), tahmini dogruluk ölçüsüne (A(b)) ve tahmini kazanim azalmaya (t(R(b)) bagli olarak bir kazanim düzeltme (g(.(b)) belirlemeye yönelik bir kazanim düzeltme araci (204, 206, 208).
4. Istem 3,ün ses dekoderi olup, burada bir kazanim azalma tahmin etmeye yönelik azalma tahmin araci (200) bir arama tablosu olarak kullanilir.
5. Istem 3 veya 47ün ses dekoderi olup, burada dogruluk ölçüsünü tahmin etmeye yönelik sekil dogruluk tahmin araci (202) bir arama tablosudur.
6. Istem 3 veya 4,ün ses dekoderi olup, burada dogruluk ölçüsünü tahmin etmeye yönelik sekil dogruluk tahmin araci (202) dogruluk ölçüsünü (A(b)) dogruluk ölçüsünü (A(b)) azami darbenin (pmax(b)) yüksekliginin ve tahsis edilen bit hizinin (R(b)) lineer bir fonksiyonundan tahmin etmek üzere yapilandirilmistir.
7. Istem 1 ila 6”dan herhangi birinin ses dekoderi olup, burada bir dogruluk ölçüsü tahmin etmeye yönelik araç (62) kazanim düzeltmeyi (gc(b)) belirlenmis bir ses sinyali sinifina uyarlamak üzere yapilandirilmistir.
8. Bir ag dügümü olup, Istem 1 ila Tden herhangi birine uygun olarak ses dekoderini
9. Ayri kazanim ve sekil görünümleri ile kodlanmis olan sesin kodunu çözmeye yönelik bir usul olup, söz konusu usul asagidaki asamalari içerir: bir kodlanmis kazanim görünümünü (E(b)) alma ve kodunu çözme, bir sekil görünümü için bir bit tahsisi türetme, bir kodlanmis sekil görünümünü (N(b)) alma ve kodunu çözme, burada sekil bir darbe vektörü kodlama seinasi kullanilarak kodlanmistir, burada darbeler farkli yükseklikte darbeler olusturmak üzere üst üste eklenebilir; bir frekans bandi (b) için sekil görünümünün (N(b)) bir dogruluk ölçüsünü (A(b)) tahmin etme (Sl), frekans bandi (b) çok sayida katsayi içerir, burada dogruluk ölçüsü (A(b)) birkaç darbeye (R(b)) ve bir azami darbenin (pmax(b)) yüksekligine dayanir; tahmini dogruluk ölçüsüne (A(b)) bagli olarak bir kazanim düzeltme (g(›(b)) belirleme (82); kazanim görünümünü (E(b)) belirlenen kazanim düzeltmeye bagli olarak ayarlama (S3).
10. Istem 99un usulü olup, burada kazanim düzeltme (g(.(b)) frekans bandina (b) da dayanir.
11. Istem 9 veya 10iun usulü olup, ayrica asagidaki asamalari içerir: tahsis edilmis bit oranina (R(b)) dayanan bir kazanim azalma (t(R(b))) tahmin etme (54); kazanim düzeltmeyi (gc(b)) tahmini dogruluk ölçüsüne (A(b)) ve tahmini kazanim azalmaya (t(R(b))) bagli olarak belirleme (SS).
12. Istem lliin usulü olup, burada kazanim azalma (t(R(b))) arama tablosu (200)'den tahmin
13. Istem 11 veya 12,nin usulü olup, ayrica dogruluk ölçüsünü (A(b)) arama tablosu (202)`den tahmin etmeyi (SS) içerir.
14. Istem 11 veya 12*nin usulü olup, ayrica dogruluk ölçüsünü (A(b)) azami darbe yüksekliginin (pmax) ve tahsis edilen bit oraninin (R(b)) lineer fonksiyonundan tahmin etmeyi
15. Önceki Istem 9 ila 14lten herhangi birinin usulü olup, ayrica kazanim düzeltmeyi (gc(b)) belirlenmis bir ses sinyali sinifina uyarlamayi içerir.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161449230P | 2011-03-04 | 2011-03-04 |
Publications (1)
Publication Number | Publication Date |
---|---|
TR201910075T4 true TR201910075T4 (tr) | 2019-08-21 |
Family
ID=46798434
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TR2019/10075T TR201910075T4 (tr) | 2011-03-04 | 2011-07-04 | Nicemleme sonrası kazanım düzeltmeli ses dekoderi. |
Country Status (10)
Country | Link |
---|---|
US (4) | US10121481B2 (tr) |
EP (2) | EP2681734B1 (tr) |
CN (2) | CN103443856B (tr) |
BR (1) | BR112013021164B1 (tr) |
DK (1) | DK3244405T3 (tr) |
ES (2) | ES2641315T3 (tr) |
PL (2) | PL3244405T3 (tr) |
PT (1) | PT2681734T (tr) |
TR (1) | TR201910075T4 (tr) |
WO (1) | WO2012121637A1 (tr) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011122875A2 (ko) * | 2010-03-31 | 2011-10-06 | 한국전자통신연구원 | 부호화 방법 및 장치, 그리고 복호화 방법 및 장치 |
WO2012141635A1 (en) | 2011-04-15 | 2012-10-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive gain-shape rate sharing |
KR102070429B1 (ko) * | 2011-10-21 | 2020-01-28 | 삼성전자주식회사 | 에너지 무손실 부호화방법 및 장치, 오디오 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 오디오 복호화방법 및 장치 |
CN104838443B (zh) * | 2012-12-13 | 2017-09-22 | 松下电器(美国)知识产权公司 | 语音声响编码装置、语音声响解码装置、语音声响编码方法及语音声响解码方法 |
CN105324982B (zh) * | 2013-05-06 | 2018-10-12 | 波音频有限公司 | 用于抑制不需要的音频信号的方法和设备 |
CN104301064B (zh) | 2013-07-16 | 2018-05-04 | 华为技术有限公司 | 处理丢失帧的方法和解码器 |
KR20240046298A (ko) | 2014-03-24 | 2024-04-08 | 삼성전자주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
EP3405950B1 (en) * | 2016-01-22 | 2022-09-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Stereo audio coding with ild-based normalisation prior to mid/side decision |
US10109284B2 (en) | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
EP3948857A1 (en) * | 2019-03-29 | 2022-02-09 | Telefonaktiebolaget LM Ericsson (publ) | Method and apparatus for error recovery in predictive coding in multichannel audio frames |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
CN1139988A (zh) * | 1994-02-01 | 1997-01-08 | 夸尔柯姆股份有限公司 | 猝发脉冲激励的线性预测 |
JP3707116B2 (ja) * | 1995-10-26 | 2005-10-19 | ソニー株式会社 | 音声復号化方法及び装置 |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
ATE302991T1 (de) * | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
US6351730B2 (en) * | 1998-03-30 | 2002-02-26 | Lucent Technologies Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
US6223157B1 (en) * | 1998-05-07 | 2001-04-24 | Dsc Telecom, L.P. | Method for direct recognition of encoded speech data |
US6691092B1 (en) * | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
US6496798B1 (en) * | 1999-09-30 | 2002-12-17 | Motorola, Inc. | Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
JP4506039B2 (ja) * | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US6658383B2 (en) * | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US7146313B2 (en) * | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
CN1639984B (zh) * | 2002-03-08 | 2011-05-11 | 日本电信电话株式会社 | 数字信号编码方法、解码方法、编码设备、解码设备 |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
DE60327039D1 (de) * | 2002-07-19 | 2009-05-20 | Nec Corp | Audiodekodierungseinrichtung, dekodierungsverfahren und programm |
SE0202770D0 (sv) * | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US8218624B2 (en) * | 2003-07-18 | 2012-07-10 | Microsoft Corporation | Fractional quantization step sizes for high bit rates |
US20090210219A1 (en) * | 2005-05-30 | 2009-08-20 | Jong-Mo Sung | Apparatus and method for coding and decoding residual signal |
JP3981399B1 (ja) * | 2006-03-10 | 2007-09-26 | 松下電器産業株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US7590523B2 (en) * | 2006-03-20 | 2009-09-15 | Mindspeed Technologies, Inc. | Speech post-processing using MDCT coefficients |
US20080013751A1 (en) * | 2006-07-17 | 2008-01-17 | Per Hiselius | Volume dependent audio frequency gain profile |
JPWO2008072733A1 (ja) * | 2006-12-15 | 2010-04-02 | パナソニック株式会社 | 符号化装置および符号化方法 |
JP5339919B2 (ja) * | 2006-12-15 | 2013-11-13 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
JP4871894B2 (ja) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
WO2009001874A1 (ja) | 2007-06-27 | 2008-12-31 | Nec Corporation | オーディオ符号化方法、オーディオ復号方法、オーディオ符号化装置、オーディオ復号装置、プログラム、およびオーディオ符号化・復号システム |
US8085089B2 (en) * | 2007-07-31 | 2011-12-27 | Broadcom Corporation | Method and system for polar modulation with discontinuous phase for RF transmitters with integrated amplitude shaping |
US7853229B2 (en) * | 2007-08-08 | 2010-12-14 | Analog Devices, Inc. | Methods and apparatus for calibration of automatic gain control in broadcast tuners |
EP2048659B1 (en) * | 2007-10-08 | 2011-08-17 | Harman Becker Automotive Systems GmbH | Gain and spectral shape adjustment in audio signal processing |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
JPWO2009125588A1 (ja) * | 2008-04-09 | 2011-07-28 | パナソニック株式会社 | 符号化装置および符号化方法 |
JP5608660B2 (ja) * | 2008-10-10 | 2014-10-15 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | エネルギ保存型マルチチャネルオーディオ符号化 |
JP4439579B1 (ja) * | 2008-12-24 | 2010-03-24 | 株式会社東芝 | 音質補正装置、音質補正方法及び音質補正用プログラム |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
ES2797525T3 (es) * | 2009-10-15 | 2020-12-02 | Voiceage Corp | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC |
BR112012009490B1 (pt) | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
US9117458B2 (en) * | 2009-11-12 | 2015-08-25 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
US9208792B2 (en) * | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
AU2011358654B2 (en) * | 2011-02-09 | 2017-01-05 | Telefonaktiebolaget L M Ericsson (Publ) | Efficient encoding/decoding of audio signals |
AU2012218409B2 (en) * | 2011-02-18 | 2016-09-15 | Ntt Docomo, Inc. | Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program |
-
2011
- 2011-07-04 EP EP11860420.6A patent/EP2681734B1/en active Active
- 2011-07-04 ES ES11860420.6T patent/ES2641315T3/es active Active
- 2011-07-04 CN CN201180068987.5A patent/CN103443856B/zh not_active Expired - Fee Related
- 2011-07-04 WO PCT/SE2011/050899 patent/WO2012121637A1/en active Application Filing
- 2011-07-04 CN CN201510671694.6A patent/CN105225669B/zh active Active
- 2011-07-04 ES ES17173430T patent/ES2744100T3/es active Active
- 2011-07-04 TR TR2019/10075T patent/TR201910075T4/tr unknown
- 2011-07-04 DK DK17173430.4T patent/DK3244405T3/da active
- 2011-07-04 PL PL17173430T patent/PL3244405T3/pl unknown
- 2011-07-04 PT PT118604206T patent/PT2681734T/pt unknown
- 2011-07-04 BR BR112013021164-4A patent/BR112013021164B1/pt active IP Right Grant
- 2011-07-04 PL PL11860420T patent/PL2681734T3/pl unknown
- 2011-07-04 EP EP17173430.4A patent/EP3244405B1/en active Active
- 2011-07-04 US US14/002,509 patent/US10121481B2/en active Active
-
2017
- 2017-08-04 US US15/668,766 patent/US10460739B2/en active Active
-
2019
- 2019-09-10 US US16/565,920 patent/US11056125B2/en active Active
-
2021
- 2021-05-27 US US17/331,995 patent/US20210287688A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2012121637A1 (en) | 2012-09-13 |
US11056125B2 (en) | 2021-07-06 |
BR112013021164B1 (pt) | 2021-02-17 |
EP2681734B1 (en) | 2017-06-21 |
ES2744100T3 (es) | 2020-02-21 |
PL2681734T3 (pl) | 2017-12-29 |
CN103443856B (zh) | 2015-09-09 |
CN105225669B (zh) | 2018-12-21 |
EP3244405A1 (en) | 2017-11-15 |
DK3244405T3 (da) | 2019-07-22 |
BR112013021164A2 (pt) | 2018-06-26 |
US20130339038A1 (en) | 2013-12-19 |
EP2681734A1 (en) | 2014-01-08 |
CN103443856A (zh) | 2013-12-11 |
PL3244405T3 (pl) | 2019-12-31 |
PT2681734T (pt) | 2017-07-31 |
US10460739B2 (en) | 2019-10-29 |
EP3244405B1 (en) | 2019-06-19 |
CN105225669A (zh) | 2016-01-06 |
US20200005803A1 (en) | 2020-01-02 |
US10121481B2 (en) | 2018-11-06 |
US20170330573A1 (en) | 2017-11-16 |
ES2641315T3 (es) | 2017-11-08 |
RU2013144554A (ru) | 2015-04-10 |
US20210287688A1 (en) | 2021-09-16 |
EP2681734A4 (en) | 2014-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TR201910075T4 (tr) | Nicemleme sonrası kazanım düzeltmeli ses dekoderi. | |
EP3353778A1 (en) | Method and system using a long-term correlation difference between left and right channels for time domain down mixing a stereo sound signal into primary and secondary channels | |
US10770078B2 (en) | Adaptive gain-shape rate sharing | |
TWI785753B (zh) | 多聲道信號產生器、多聲道信號產生方法及電腦程式 | |
JP2012118205A (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
EP4179530A1 (en) | Comfort noise generation for multi-mode spatial audio coding | |
US9595268B2 (en) | Method and a decoder for attenuation of signal regions reconstructed with low accuracy | |
RU2575389C2 (ru) | Коррекция коэффициента усиления после квантования при кодировании аудио |