TR201811059T4

TR201811059T4 - Ses kaynaklarının parametrik birleşik kodlaması.

Info

Publication number: TR201811059T4
Application number: TR2018/11059T
Authority: TR
Inventors: Faller Christof
Original assignee: Fraunhofer Ges Forschung
Priority date: 2005-02-14
Filing date: 2006-02-13
Publication date: 2018-08-27
Also published as: EP1995721A1; BR122018072505B1; AU2009200407B2; JP5179881B2; US20120314879A1; JP2012234192A; NO20073892L; US9668078B2; EP2320414A1; AU2010236053B2; ES2374434T3; US10339942B2; US10650835B2; CA2597746A1; MX2007009559A; US20220392466A1; US20220392468A1; ES2682073T3; HK1107723A1; CA2707761C

Abstract

Aşağıdaki kodlama senaryosu şöyle ele alınır: Dalga alanı sentezi miksleme, çok kanallı surround ya da kaynak sinyallerini çözmeden sonra stereo sinyaller amacıyla, bir takım ses kaynak sinyallerinin iletilmesi ya da depolanması gerekir. Önerilen teknik, kaynak sinyalleri arasında herhangi bir fazlalık olmadığında bile bunları ayrı olarak kodlamaya kıyasla kaynak sinyallerini birleşik olarak kodlarken ciddi derecede kodlama kazanımı sunmaktadır. Kaynak sinyallerinin istatistiksel özelliklerini, miksleme tekniklerinin özelliklerini ve uzamsal işitme ele alınarak bu mümkün olmaktadır. Kaynak sinyallerinin toplamı, en son mikslenen ses kanallarının çoğunlukla algısal olarak önemli uzamsal işaretleri belirleyen kaynak sinyallerinin istatistiksel özelliklerine ek olarak iletilir. Kaynak sinyalleri, istatistiksel özellikleri, orijinal kaynak sinyallerinin ilgili özelliklerine yaklaşacağı şekilde alıcıda geri kazanılır. Öznel değerlendirmeler, yüksek ses kalitesinin öne sürülen şema ile elde edildiğini göstermektedir.

Description

TARIFNAME SES KAYNAKLARININ PARAMETRIK BIRLESIK KODLAMASI 1. GIRIS Genel bir kodlama probleminde, n'nin zaman indeksi oldugu çok sayida (mono) kaynak sinyallerine si(n) (l Si SM) ve bir sahne açiklama vektörüne S(n) sahibiz. Sahne açiklama vektörü, (sanal) kaynak konumlari, kaynak genislikleri ve (sanal) oda parametreleri gibi akustik parametreler gibi parametreler içermektedir. Sahne açiklamasi, zaman degiskenli olabilir ya da zamanla degisiyor olabilir.

Kaynak sinyalleri ve sahne açiklamasi kodlanir ve bir sifre çözücüye iletilir. Kodlanan kaynak sinyalleri g(n) ardisik sekilde, sahne açiklama vektörünün bir fonksiyonu olarak dalga alani sentezi, çok kanalli ya da stereo sinyaller üretmek amaciyla sahne açiklamasinin bir fonksiyonu olarak karistirilir. Sifre Çözücü çikti sinyalleri îiün (O Si SN) olarak gösterilir. Sahne açiklama vektörünün S(n) iletilemedigini ancak sifre çözücüde belirlenebildigini unutmayiniz. Bu dokümanda, "stereo ses sinyali" terimi her zaman iki-kanalli stereo ses sinyalleri anlamina gelir.

Sahne açiklamasini tanimlar ve her bir ("natürel") kaynak sinyali için bir ayri mono ses kodlayici, ör. bir AAC ses kodlayici kullanir. Bununla birlikte, birçok kaynak bulunan bir kompleks sahne karistirilacagi zaman, bit hizi yüksek olur yani bit hizi, kaynak sayisi ile yükselir. Bir kaynak sinyalini. yüksek. kalite ile kodlama. yaklasik. 60 90 kb/s gerektirir.

Daha öncesinde, Esnek Isleme için Binoral Isaret kodlamasini (BCC) gösteren bir sema bulunan açiklanan kodlama probleminin [1][2] özel bir durumunu isaret etmistik. Sadece belirli kaynak sinyallerinin özeti arti düsük bit hizi yan bilgisini ileterek düsük bit hizi elde edilir. Ancak, kaynak sinyalleri, sifre çözücüde geri kazanilamaz ve sema, stereo ve çok kanalli surround sinyal üretimi ile sinirliydi. Ayni zamanda, genlik ve gecikme kaydirmaya dayanarak sadece basitlestirilmis karistirma kullaniliyordu. Böylece, kaynaklarin yönü kontrol edilebiliyordu ancak baska isitsel uzamsal imaj nitelikleri kontrol edilemiyordu. Bu semanin diger bir sinirlandirmasi bunun sinirli ses kalitesiydi. Özellikle, kaynak sinyallerinin sayisi arttikça ses kalitesindeki bir azalma.

Doküman [1], (Binoral Isaret Kodlama, Parametrik Stereo, MP3 Surround, MPEG Surround) N ses kanallarinin sifrelendigi durumu ve benzer isaretlere sahip N ses kanallarini kapsar ve daha sonra orijinal ses kanallari çözülür. Iletilen yan bilgi, girdi kanallari arasindaki farkliliklara iliskin kanallar arasi isaret parametrelerini Stereo ve çok kanalli ses sinyallerinin kanallari, ses kaynaklari sinyallerinin karisimlarini kapsar ve bu yüzden saf ses kaynak sinyallerine göre dogada farkli olur- Stereo ve çok kanalli ses sinyalleri, uygun bir oynatma sistemi üzerinden arkadan oynatildiginda, dinleyicinin kayit ayari ile kaydedildigi ya da karistirma esnasinda kayit mühendisi tarafindan tasarlandigi üzere bir isitsel uzamsal imaji ("ses asamasi") anlayacagi sekilde karistirilir. Stereo ya da çok kanalli ses sinyalinin kanallari için birlesik kodlamaya yönelik birtakim semalar daha önceden önerilmistir. teknolojisini açiklamaktadir. Bir ses sifreleyici, kaliteyi kontrol etmek için dönüstürmeyi çesitlendirerek, çok kanalli ses verisinde bir ön islemeli çok kanalli dönüstürme gerçeklestirir. Sifreleyici çoklu pencereleri farkli kanallardan bir ya da daha fazla karolar içine gruplandirir ve sifreleyicinin geçicileri izole etmesini saglayan karo yapilandirma bilgisini üretir. islemesini tarif eder. Çok kanalli veri toplanir ve dörtlü gruplari temsil eder. Bu veri daha sonra bir dogrusal öngörücüye çiktilanir. Bir otokorelasyon matrisi hesaplanir ve müteakiben sahte-evrikler üretilir` ve dogrusal öngörü katsayilarina ve artiga çiktilanir. 3062 (2004) sayili Tez "Parametric coding of spatial audio", Christof Faller, Lausanne, EPFL, XP002343263, binoral isaret kodlamasi gibi birçok parametrik kodlama teknolojisini tarif etmektedir. Uzamsal isaretler kanallar arasi zaman farki, kanallar arasi seviye farki ve kanallar arasi korelasyon stereo sinyaller ve çok kanalli ses sinyalleri için tahmin edilir. Bu, bir altbant-vari sekilde gerçeklestirilir. Bir BCC sifre çözücü iletilen toplam sinyal arti uzamsal isaretleri verilen bir stereo ya da çok kanalli ses sinyali üretir. coding", Frank Baumgarte & Christof Faller, sayfalar 1801- 1804, IEEE Akustik Konusma Ve Sinyal Isleme Hakkinda Uluslararasi Konferans (ICASSP), New York, Mayis 13, 2002, XPOlO804245 yayini binoral isaret kodlamasini özetlemektedir. Stereofonik. sinyalden uzamsal isaretlerim çikarimlanmasi bir BCC analizörü ile gerçeklestirilir. BCC analizörü, bir uyum tahmin bloku, güç tahmin bloklari, gecikme dengeleme bloklari ve bir maksimum tespit bloku içermektedir. Girdi sinyalleri bir birinci kanaldan A gelen bir ses sinyali ve bir ikinci kanaldan B gelen› bir ses sinyalidir ve ses kanallari bir Koklear filtre bankasi (CFB) ve bir iç kil hücresi (IHC) modeline tabi tutulur.

Mevcut bulusun bir amaci, sifreleme için gelistirilmis bir konsept saglamaktir; Bu, istem l'in yöntemi ya da istem 2'nin cihazi ile elde edilir. Bulusun amaci, bir minimum bant genisligi kullanirken birden fazla sayida kaynak sinyallerinin iletilmesi için bir yöntem saglamaktir.

Bilinen yöntemlerin çogunda, pleybek formati (ör. stereo, .1) ön tanimlidir` ve kodlama senaryosu üzerine dogrudan etkiye sahiptir. Sifre çözücü tarafindaki ses akisi, sadece bu ön tanimli pleybek formatini kullanmalidir, böylece kullaniciyi bir ön tanimli pleybek senaryosuna (ör. stereo) Önerilen bulus, tipik olarak bir stereo ya da çok kanalli sinyallerin kanallari olmayan ancak farkli konusma ya da enstrüman sinyalleri gibi bagimsiz sinyaller olan N ses kaynak sinyallerini sifreler. Iletilen yan bilgi, girdi kaynak sinyallerine iliskin istatistiksel parametreleri Önerilen bulus, M ses kanallarini orijinal ses kaynak sinyallerinden farkli isaretler ile çözer. Bu farkli isaretlerin her biri alinin toplam sinyale bir karistirici uygulayarak dolayli olarak sentezlenir. Karistirici, alinan istatistiksel kaynak bilginin ve alinan (ya da lokal belirlenen) ses formati parametrelerinin ve karistirma parametrelerinin bir fonksiyonu olarak kontrol edilir.

Alternatif olarak bu farkli isaretler, alinan istatistiksel kaynak bilginin ve alinan (ya da lokal belirlenen) ses formati parametrelerinin ve karistirma parametrelerinin bir fonksiyonu olarak dogrudan hesaplanir. Bu hesaplanan isaretler alinan toplam sinyali göz önünde bulundurarak çikti kanallarini sentezlemek üzere bir Önceki teknik sifre çözücüyü (Binoral isaret kodlamasi, Parametrik Stereo, MPEG Surround) kontrol etmek için kullanilir.

Ses kaynak sinyallerinin birlesik kodlamasi için önerilen sema türünün ilk örnegidir. Ses kaynak sinyallerinin birlesik kodlamasi için tasarlanmistir. Ses kaynak sinyalleri genellikle, bir stereo ya da çok kanalli ses sistemi üzerinden pleybek için uygun olmayan mono ses sinyalleridir. Kisacasi, asagida ses kaynak sinyalleri genellikle kaynak sinyalleri ile gösterilir.

Ses kaynak sinyallerinin pleybekten önce, öncelikle stereo, çok kanalli ya da dalga alani sentezi ses sinyallerine karistirilmasi gerekir. Bir ses kaynak sinyali, bir tekli enstrüman ya da konusmaci ya da bir takim enstrüman ya da konusmacilarin toplami olabilir. Ses kaynak sinyalinin diger bir tipi bir spot mikrofon ile konser esnasinda kaydedilen bir rmnu) ses sinyalidir. Siklikla, ses kaynak sinyalleri çoklu parça kaydedicilerde ya da harddisk kayit sistemlerinde depolanir.

Ses kaynak. sinyallerinin› birlesik, kodlamasi için istemde bulunulan sema sadece ses kaynak. sinyallerinin toplamini iletmeye ya da kaynak sinyallerinin agirlikli bir toplamina dayanmaktadir. Opsiyonel olarak, agirlikli toplama, farkli altbantlarda farkli agirliklar ile yürütülebilir ve agirliklar zamanda uyarlanabilir. Esitleme ile toplama da Bölüm 3.3.2'de [lJ'de açiklandigi üzere uygulanabilir.

Asagida, toplam ya da toplam sinyale atifta bulundugumuzda, her zaman (1) ile üretilen ya da açiklandigi gibi üretilen bir sinyali kastetmekteyiz. Toplam sinyale ek olarak yan bilgi iletilir. Toplam ve yan bilgi, çiktilanan ses akisini temsil eder. Opsiyonel olarak, toplam sinyal bir konvansiyonel mono ses kodlayici kullanilarak kodlanir. Bu akis, bir dosyada (CD, DVD, Harddisk) depolanabilir ya da aliciya yayin yapilabilir. Yan bilgi, karistirici çikti sinyallerinin algisal uzamsal isaretlerini belirleyen en önemli faktörler olan kaynak sinyallerinin istatistiksel Özelliklerini temsil eder. Bu özelliklerin spektral zarflari ve oto-korelasyon fonksiyonlarini geçici olarak gelistirdigi gösterilecektir. Her' bir kaynak sinyal için yaklasik olarak 3 kb/s yan bilgi iletilir. Alicida, kaynak sinyalleri êiün (l 5 i S M), orijinal kaynak sinyallerinin ve toplam. sinyalin karsilik gelen özelliklerine yaklasan yukarida bahsedilen istatistiksel özellikleri ile geri kazanilir. ÇIZIMLERIN KISA AÇIKLAMASI Bulus ekli Sekiller sayesinde daha iyi anlasilacak. olup sekil 1, her bir kaynak sinyalinin iletiminin daha fazla isleme için bagimsiz olarak yapildigi bir sema gösterir, sekil 2, toplam sinyal arti yan bilgi olarak iletilen kaynaklarin bir sayisini gösterir, sekil 3, bir Binoral Isaret Kodlama (BCC) semasinin bir blok diyagramini gösterir, Sekil 4, bir takim kaynak sinyallerine dayali olarak stereo sinyalleri üretmek üzere bir karistirici gösterir, sekil 5, ICTD, ICLD ve ICC ve kaynak sinyali altbant gücü arasindaki bagi gösterir, sekil 6, yan bilgi üretiminin islemini gösterir, sekil 7, her bir kaynak. sinyalinin LPC parametrelerini sekil 8, bir toplam sinyalden kaynak sinyallerini yeniden olusturma islemini gösterir, sekil 9, her bir sinyalin toplam sinyalden üretilmesine yönelik bir alternatif sema gösterir, Sekil 10, bir takim kaynak sinyallerine dayali olarak stereo sinyalleri üretmek üzere bir karistirici gösterir, sekil ll, kaynak seviyelerinin karistirma parametrelerine bagli olmasini engelleyen bir genlik kaydirma algoritmasini gösterir, sekil 12 bir dalga alani sentezi pleybek sisteminin bir hoparlör dizilimini gösterir, sekil l3, iletilen kanallarin downmiksini isleyerek alicida kaynak sinyallerinin bir tahmininin nasil geri kazanilacagini gösterir, sekil 14, iletilen kanallari isleyerek alicida sinyallerinin bir tahmininin nasil geri kazanilacagini gösterir, lLTANIMLAR, NOTASYONLAR VE DEGISKENLER Asagidaki notasyonlar ve degiskenler bu belgede kullanilmaktadir: n zaman indeksi; i ses kanali ya da kaynak indeksi; d gecikme indeksi; M` sifreleyici girdi kaynak sinyalleri sayisi; N sifre çözücü çikti kanallari sayisi; xi(n) karisik orijinal kaynak sinyalleri; îiün karisik sifre çözücü çikti sinyalleri; si(n) sifreleyici girdi kaynak sinyalleri; â(n) ayni zamanda sahte-kaynak sinyalleri olarak da adlandirilan iletilen kaynak sinyalleri; s(n) iletilen toplam sinyal; yi(n) L-kanal ses sinyali; (remikslenecek ses sinyali); .g(k) si(n)'nin (diger sinyaller için benzer sekilde tanimlanan) bir altbant sinyali; E{gß(n)} gf(n)'nin (diger sinyaller için benzer sekilde AL(n) tahmin edilen altbant ICLD; T(n) tahmin edilen altbant ICTD; c(n) tahmin edilen altbant ICC; pihn ilgili kaynak altbant gücü; ai, bi karistirici ölçek faktörleri; ci, di karistirici gecikmeleri; ALi, r(n)karistirici seviyesi ve zaman farki; Gi karistirici kaynak kazanimi; HLSES KAYNAK SINYALLERININ BIRLESIK KODLAMASI Ilk olarak, Binoral Isaret Kodlamasi (BCC), bir parametrik çok kanalli ses kodlama teknigi açiklanmaktadir. Daha sonra, BCC'nin dayandigi ayni anlayis ile bir kodlama senaryosu için kaynak sinyallerinin birlesik kodlamaya yönelik olarak bir algoritma düzenlenebilir.

AJBinoral Isaret Kodlamasi (BCC) Çok kanalli ses kodlama için bir BCC semasi [l][2] asagidaki sekilde gösterilir. Girdi çok kanalli ses sinyali bir tekli kanala downmikslenir. Tüm kanal dalga biçimleri hakkinda kodlama ve bilgi iletimine karsilik olarak, sadece downmikslenen sinyal kodlanir (bir konvansiyonel mono ses kodlayici ile) ve iletilir. Ilaveten, algisal olarak motive edilen "ses kanali farkliliklari", orijinal ses kanallari arasinda tahmin edilir ve ayni zamanda sifre çözücüye iletilir. Sifre çözücü, ses kanali farkliliklarinin orijinal ses sinyalinin karsilik gelen ses kanali farkliliklarina yaklasacagi sekilde kendi çikti kanallarini Toplama yerellestirme, bir hoparlör sinyal kanali çifti için algisal olarak ilgili ses kanali fakliliklarinin, kanal arasi zaman farki (ICTD) ve kanal arasi seviye farki (ICLD) oldugu anlamina gelir. ICTD ve ICLD, isitsel etkinliklerin algilanan yönü ile ilgili olabilir. Diger isitsel uzamsal imaj nitelikler, görünür kaynak genisligi ve dinleyici zarfi gibi, interaural uyum (IC) ile ilgili olabilir. Bir dinleyicinin önünde ve arkasindaki hoparlör çiftleri için, interaural uyunz genellikle dogrudan kanal arasi uyum (lCC) ilgilidir ki böylece BCC tarafindan üçüncü ses kanali farki ölçümü olarak düsünülür. ICTD, ICLD ve ICC zamanin bir fonksiyonu olarak altbantlarda tahmin edilir.

Kullanilan spektral ve geçici çözünürlügün her ikisi de algilama ile motive edilir.

B.Ses kaynaklarinin parametrik birlesik kodlamasi Bir BCC sifre çözücü bit mono sinyal alarak ve düzenli zaman araliklarinda altbant ve kanal çifti basina bir tekli spesifik ICTD, ICLD ve ICC isareti sentezleyerek birçok kanalli ses sinyalini herhangi bir isitsel uzamsal imaj ile üretebilmektedir. Genis yelpazede bir ses materyali algilanan isitsel uzamsal imajin, büyük ölçüde ICTD, ICLD ve ICC ile belirlendigi anlamina gelir. Bu nedenle, Sekil l'deki karistirici girdisi gibi "temiz" kaynak sinyalleri s(n) gerektirmeye karsi olarak, gerçek kaynak sinyallerini karistiriciya saglama durumu için oldugu gibi karistirici çiktisinda benzer ICTD, ICLD ve ICC ile sonuçlanacaklari özellige sahip sadece sözde-kaynak sinyallere $(n) ihtiyaç duymaktayiz..$(n) üretimi için üç amaç vardir . giun, bir karistiriciya saglanirsa, karistirici çikti kanallari, sanki si(n) karistiriciya saglanmis gibi yaklasik olarak ayni uzamsal isaretlere (ICLD, ICTD, ICC) sahip olacaktir. . .%(n), orijinal kaynak sinyalleri s(n) hakkinda olabildigince az bilgi ile üretilecektir (çünkü amaç düsük bit hizli yan bilgiye sahip olmaktir). . &(n), minimum miktarda sinyal bozulmasinin ortaya koyulacagi sekilde iletilen toplam sinyalden s(n) üretilir. Önerilen semayi türetmek için bir stereo karistiriciyi (M = 2) ele almaktayiz. Genel durum üzerinden bir diger sadelestirme ise sadece genlik ve gecikme kaydirmanin karistirma için uygulanmasidir. Ayrik kaynak sinyalleri sifre çözücüde mevcut olmus olsaydi, bir stereo sinyal Sekil 4'te gösterildigi üzere karistirilabilir, yani 96101) "" îai'si(n_ci) X201): Ibisioîhdi) Bu durumda, sahne açiklama vektörü S(n), karistirma parametrelerini belirleyen sadece kaynak yönlerini kapsar, burada T, bir vektörün transpozudur. Karistirma parametreleri için, notasyon kolayligi adina zaman indeksini göz ardi ettigimizi dikkate alin.

Karistiriciyi kontrol etmek için daha kolay parametreler zaman ve seviye farkidir, Ti ve ALi, bunlar, asagidaki tarafindan ai, bi, ci, and di ile baglantilidir 1061/20 _ ' a] = bi = 10(Gi+ALi)/20a burada Gi, dB'de bir kaynak kazanimidir.

Asagida, girdi kaynak sinyallerinin si(n) bir fonksiyonu olarak stereo karistirici çiktisina ait ICTD, ICLD ve sinyallerinin ICTD, ICLD ve ICC'yi (karistirma parametreleri ile birlikte) belirledigine dair isaret verecektir. $(n), tanimlanan kaynak sinyalleri özelliklerinin orijinal kaynak sinyallerinin ilgili özelliklerine yaklasacagi sekilde daha sonra üretilirler.

B1 Karistirici çiktisinin ICTD, ICLD ve ICC'si Isaretler, altbantlarda ve zamanin bir fonksiyonu olarak tahmin edilir. Asagida, kaynak sinyallerinin si(n) sifir ortalamali ve karsilikli olarak bagimsiz oldugu varsayilir.

Karistirici çiktisinin (2) altbant sinyallerinin bir çifti îiÜÜ veîzûn olarak gösterilir. Notasyon basitligi adina zaman alani ve altbant alan sinyalleri için ayni zaman indeksini kullandigimizi unutmayiniz. Ayni zamanda, hiçbir altbant indeksi kullanilmamaktadir ve açiklanan analiz/isleme her bir altbanta bagimsiz olarak uygulanir.

Iki karistirici çikti sinyallerinin altbant gücü söyledir burada $(n), kaynagin si(n) bir altbant sinyalidir ve E{.}, kisa zaman beklentisini göstermektedir, ör.

E{îf(n)} =g "“Znêizm› .(6) ~ burada K, hareket etme ortalamasini belirler. Altbant güç degerlerinin E {s2(n)}, her bir kaynak sinyali için spektral zarfi zamanin bir fonksiyonu olarak gösterdigini unutmayiniz. ICLD, AL(n); ZZ.be{îf(n»} korelasyon fonksiyonu, tahmin edilir. ICC, c(n), suna göre hesaplanir c(n) = mgx yüksek tepeni konumu hesaplanir, Simdi asil soru, normallestirilen çapraz-korelasyon fonksiyonunun, karistirma parametrelerinin bir fonksiyonu olarak nasil hesaplanabilecegidir. (2) ile birlikte, (8) su sekilde yazilabilir JE{ZMa.. s.- (n - c..)}E{Z,.=ib.. s,- (n -a',-›} ki bu suna esittir Z” aßiEßfmndi-(mdi - T..) burada normallestirilen oto-korelasyon fonksiyonu @(n,e); ve Ti = di - ci olur. Verilen (11) ile (12)'yi hesaplamak için, sinyallerin gecikmelerin dikkate alinan araligi içinde genis anlamda duragan olduklarinin varsayilmis oldugunu unutmayiniz, yani E{î,-2(n)}= E{Fzz(n-Cz)} E{3}2(")} =E{3:2("-di)} Iki kaynak sinyali için bir sayisal örnek, ICTD, ICLD ve 'te gösterilir. Sekil 5'in üst, orta ve alt paneli, AL (n), T(n), ve c(n) 'yi sirasiyla, iki kaynak sinyallerinin altbant gücünün oraninin bir fonksiyonu olarak, farkli karistirma parametreleri (4) ALI, ALZ, Tl ve T2 için a = sadece bir kaynagin gücü oldugunda (a = 0 ya da a = 1), E{ Slzm gösterir. Altbantta hesaplanan AL(n) ve T(n)'nin karistirma parametrelerine (ALI , ALZ, T1, T2) esit oldugunu dikkate aliniz.

B.2Gerekli yan bilgiler kaynaklarin E{glz (n) } (6) kisa zamanli altbant gücüne baglidir. ICTD (10) ve ICC (9) hesaplamasi için gerekli olan normallestirilen altbant çapraz korelasyon fonksiyonu ©(n,d) (12), E{gý(n)}'ye ve ek olarak her bir kaynak sinyali için normallestirilen altbant oto-korelasyon fonksiyonuna, ®i(n, e) (13), baglidir. @(n,d)'nin maksimumu, mini{Ti} Sdîmaxi{Ti} araliginda bulunur.

Karistirici parametresine Ti = di-ci' sahip kaynak 1' için, kaynak sinyali altbant özelliginin ®i(n, e) (13) gerekli oldugu ilgili aralik söyledir m;n{Ti}-nse smsix{T;}-Ti (14) altbant özelliklerine E{gp(n)} ve ®i(n, e) bagli oldugundan, prensipte bu kaynak sinyali altbant özelliklerini yan bilgi olarak iletilmeleri gerekir. Diger herhangi türdeki karistiricinin (ör. etkilere sahip karistirici, dalga alani sentezi karistirici/konvolüter, Vb.) benzer özelliklere sahi oldugunu ve böylece bu yan bilginin açiklanandan baska karistiricilar kullanildiginda da kullanisli oldugunu varsaymaktayiz. Yan bilginin miktarini azaltmak için, sifre çözücüde bir dizi öntanimli oto korelasyon fonksiyonlari depolanabilir ve kaynak sinyali özelliklerine en yakin sekilde eslesenleri seçmek için sadece indeksler iletilebilir. Algoritmamizin bir birinci versiyonu, (14) araliginda ®i(n, e) = 1 olarak kabul eder ve böylece (12), yan bilgi olarak sadece altbant güç degerleri (6) kullanilarak hesaplanir. Sekil 5'te gösterilen veri, ®i(n, e) = 1 olarak varsayilarak hesaplanmistir.

Yan bilginin miktarini azaltmak için, kaynak sinyallerinin ilgili dinamik araligi sinirlidir. Her seferinde, her bir altbant için en güçlü kaynagin gücü seçilir. Tüm diger kaynaklarin ilgili altbant gücünü, an güçlü altbant gücünden daha düsük olan bir degerde 24dB sinirlamayi yeterli bulduk.

Böylece nicemleyicinin dinamik araligi 24 dB'ye sinirlandirilabilir.

Kaynak sinyallerinin bagimsiz oldugunu kabul ederek, sifre çözücü, tüm kaynaklarin altbant gücünün toplamini E{52(n)} olarak hesaplayabilir. Böylece, prensipte sifre çözücüye sadece Mi-l kaynaklarinin altbant gücü degerlerini iletmek yeterli iken geri kalan kaynagin altbant gücü yerel olarak hesaplanabilir. Bu fikri dikkate alarak, yan bilgi hizi, birinci kaynagin gücüne iliskin indekslere 2 S i S M sahip kaynaklarin altbant gücünü ileterek hafifçe azaltilabilir, 1;{Si (n)} Daha önceden açiklandigi üzere dinamik aralik sinirlandirmanin (l5)'ten önce gerçeklestirildigini dikkate alin. Alternatif olarak, altbant güç degerleri, bir kaynagin altbant gücüne (15) iliskin normallestirmeye karsi olarak toplam› sinyal altbant gücüne iliskin olarak normallestirilebilir. 44.l kHz'lik bir örnekleme frekansi için, 20 altbant kullanmaktayiz ve her bir altbant için her 12 ms'de bir AßiLn) (2 5 i S M) iletmekteyiz. 20 altbant, isitsel sistemin spektral çözünürlügünün yarisina tekabül eder ( bir altbant iki "kritik bant genisligi" genisligindedir). Resmi olmayan tecrübeler, 20'den fazla altbant örnegin 40 altbant kullanilmasiyla sadece ufak bir gelisme elde edildigini göstermektedir. Altbantlarin ve altbant bant genisliklerinin sayisi isitsel sistemin zaman ve frekans çözünürlügüne göre seçilmektedir. Semanin, bir düsük kaliteli uygulamasi en az üç altbant gerektirir (düsük, orta, yüksek frekanslar). Özel bir düzenlemeye göre, altbantlarin farkli bant genislikleri vardir, düsük frekanslardaki altbantlar, yüksek frekanslardaki altbantlardan daha küçük bant genisligine sahiptir.

Ilgili güç degerleri, yaklasik olarak 3(M - JJ kb/s bit hizi ile sonuçlanan, [2]'de açiklanan ICLD nioemleyiciye benzer olan bir sema ile nicemlenir. Sekil 6, yan bilgi üretiminin islemini göstermektedir (Sekil 2'deki "Yan bilgi üretimi" blokuna tekabül eder).

Yan bilgi hizi, her bir kaynak sinyali için aktiviteyi analiz ederek ve aktif ise sadece"kaynak ile iliskili yan bilgiyi ileterek ilaveten azaltilabilir.

Altbant güç degerlerini E{gp(n)} istatistiksel bilgi olarak iletmeye karsi olarak, kaynak sinyallerinin spektral zarflarini gösteren diger bilgiler iletilebilir. Örnegin, dogrusal öngörüsel kodlama (LPC) parametreleri iletilebilir ya da kafes filtre parametreleri ya da hat spektral çift (LSP) parametreleri gibi ilgili diger parametreler iletilebilir. Her bir kaynak sinyalinin LPC parametrelerini tahmin etme islemi Sekil 7'de gösterilir.

Bßâ(n) hesaplama Sekil 8, toplam sinyal (l) dikkate alinarak kaynak sinyallerini yeniden olusturmak üzere kullanilan islemi gösterir. Bu islemi Sekil 2'deki "Sentez" blokunun parçasidir. Bireysel kaynak sinyalleri, toplam sinyalin her bir altbandlni gi(n) ile ölçekleyerek ve darbe tepkisine hi(n) sahip bir de-korelasyon filtresi uygulayarak geri kazanilir. burada *, dogrusal evrgsim operatörüdür ve E{Gp(n)}, yan bilgi ile sunun tarafindan hesaplanir De-korelasyon filtreleri hi(n), tamamlayici tarak filtreleri, tam geçirgen filtreler, gecikmeler ya da rastgele darbe tepkisine sahip filtreler kullanilabilir.

De-korelasyon isleminin amaci, bireysel dalga biçimlerinin nasil algilandiklarini modifiye etmeden sinyaller arasindaki korelasyonu azaltmaktir. Farkli de-korelasyon teknikleri farkli olgulara neden olur. Tamamlayici tarak filtreleri renklendirmeye yol açar. Tarif edilen tekniklerin tamami "ön-ekolar" gibi olgulara yol açan zamanda geçicilerin enerjisini yaymaktadir. Olgular için potansiyellerini dikkate alarak, de-korelasyon teknikleri mümkün oldugunca küçük uygulanmalidir. Bir sonraki bölüm, bagimsiz sinyallerin â(n) basit üretiminden daha az de- korelasyon islemi gerektiren teknikleri ve stratejileri açiklamaktadir.

Sinyallerin 5,(n) üretimi için bir alternatif sema Sekil 9'da gösterilir. Ilk olarak s(n)'nin. spektrumu, dogrusal öngörü hatasini e(n) hesaplama yardimiyla düzlestirilir.

Sifreleyicide tahmin edilen LPC filtreleri göz önüne alinarak, fi, ilgili tüm kutuplu filtreler sunun tersine z- dönüstürmesi olarak hesaplanir Ortaya çikan tüm kutuplu filtreler, Ã, kaynak sinyallerinin spektral zarfini göstermektedir. LPC parametrelerinden baska yan bilgiler iletilirse, LPC parametrelerinin ilk olarak yan bilginin bir fonksiyonu olarak hesaplanmasi gerekir. Diger semada oldugu gibi, de-korelasyon filtreleri hi, kaynak sinyallerini bagimsiz yapmak üzere kullanilir.

HLUYGULANABILIR KISITLAMALARI DIKKATE ALAN UYGULAMALAR Bu bölümün birinci kisminda, bir stereo ya da çok kanalli karistirici olarak bir BCC sentezi kullanan bir uygulama örnegi verilmektedir. Bu gibi bir BCC tipi sentez semasi, özellikle ilginçtir. Kaynak sinyalleri â(n), bu durumda dogrudan hesaplanmaz ve bu azaltilmis hesapsal karmasiklik ile sonuçlanir. Ayni zamanda bu sema, kaynak sinyallerinin a(n) dogrudan hesaplandigi durum için olandan efektif olarak daha az de-korelasyon gerekli oldugundan daha iyi ses kalitesi potansiyeli sunmaktadir.

Bu bölümün ikinci kismi, önerile sema herhangi bir karistirici ile uygulandigi ve aslinda hiçbir de-korelasyon uygulanmadigi hususlari ele alir: Bu gibi bir sema, de- korelasyon isleme bulunan bir semadan daha düsük kompleksiteye sahiptir ancak ele alinacagi üzere baska Ideal olarak, üretilen â(n)'nin bagimsiz oLarak ele alinacagi sekilde de-korelasyon isleme uygulamak istenebilir. Bununla birlikte, de-korelasyon isleme ortaya konan olgular bakimindan problematik oldugundan, de- korelasyon isleme mümkün olugu kadar az uygulanmak istenebilir. Bu bölümün üçüncü kismi, problematik de- korelasyon islemenin miktarinin, üretilen â(n) bagimsizmis gibi faydalar saglarken nasil azaltilabilecegini ele almaktadir.

A.â(n)'nin dogrudan hesaplamasi olmadan uygulama Karistirma, g(n)'ni dogrudan hesaplamasi olmaksizin iletilen toplam sinyale (l) dogrudan uygulanir. Bir BCC sentezi semasi bu amaçla kullanilir. Asagida, stereo durumunu dikkate almaktayiz ancak açiklanan tüm prensipler, çok kanalli ses sinyallerinin üretimi için de uygulanabilir.

Toplam sinyali isleme için uygulanan bir stereo BCC sentezi semasi (ya da bir "parametrik stereo" semasi) Sekil lO'da gösterilir. Yapilmak. istenen, BCC sentez semasinin Sekil 4'te gösterildigi üzere bir karistiricinin çikti sinyali gibi benzer sekilde algilanan bir sinyal üretmesidir. Bu, BCC sentez semasi çikti kanallari arasindaki ICTD, ICLD ve görünen ilgili isaretlere benzer oldugunda böyledir.Önceden açiklanan daha genel sema için oldugu gibi ayni yan bilgi kullanilir ve böylece sifre çözücünün, kaynaklarin kisa zamanli altbant güç degerlerini E Lg2(n)} hesaplamasini saglar. E Lg2(n)}'yi dikkate alarak, Sekil lO'daki kazanim faktörleri gl ve 92 söyle hesaplanir 2,_1a a.E{s (nn 9201) = (18) çikti altbant gücü ve ICLD'nin (7) Sekil 4'teki karistirici için oldugu gibi ayni olacaklari sekilde. ICTD T(n), (10)'a göre hesaplanir, Sekil lO'daki gecikmeleri DJ ve D2 belirleyerek, belirlemeye göre hesaplanir. iDe-korelasyon isleme (ICC sentezi) [1]'de açiklanmaktadir. Karistirici çikti kanallarina de-korelasyon isleme uygulamanin avantajlari, bagimsiz $(n) üretmeye uygulamaya kiyasla sunlardir: 0 Genellikle kaynak sinyallerinin M sayisi ses çikti kanallarinin N› sayisindan daha büyüktür. Böylece, üretilmesi gereken bagimsiz ses kanallarinin sayisi, .M kaynak sinyallerini de-korelasyon yapmaya karsi olarak N çikti kanallarini de-korelasyon yaparken daha az olur.

. Siklikla, N çikti kanallari, korelasyonlanir (ICC > 0) ve bagimsiz M ve N kanallarini üretmek için gerekli olandan daha az de-korelasyon isleme uygulanabilir.

Daha az de-korelasyon islemeden dolayi daha iyi ses kalitesi beklenir.

En iyi ses kalitesi, karistirici parametreleri a3+b3=1, yani Gi = C) dB olacagi sekilde kisitlandiginda beklenmektedir. Bu durumda, iletilen toplam sinyaldeki (1) her kaynagin gücü, karisik sifre çözücü çikti sinyalindeki ayni kaynagin gücü ile aynidir. Sifre çözücü çikti sinyali (Sekil 10), karistirici çikti sinyali (Sekil 4) bir` BCC sifreleyici/sifre çözücü tarafindan bu durumda sifrelenmis ya da çözülmüs gibi aynidir. Böylece, ayni zamanda benzer kalite beklenebilir.

Sifre çözücü sadece her kaynagin görünmesi gerektigi yönü belirlemez ayni zamanda her kaynagin kazanimi 0,2 +b,2 >1 çesitlenebilir. Kazanim, (Gi > 0 dB) seçerek a,2+b,2 <1 arttirilir ve (Gi < 0 dB) seçilerek azaltilir.

B.De-korelasyon isleme kullanmama Bir önceki tarif edilen teknigin kisitlamasi, karistirmanin bir BCC sentez semasi ile yürütülmesidir. Sadece ICTD, ICLD ve ICC sentezini degil ayni zamanda ilaveten BCC sentezi içinde efektler islemeyi uygulama hayal edilebilir.

Ancak, var olan karistiricilarin ve efektler islemcilerinin kullanilabilecegi istenebilir. Bu ayni zamanda dalga biçimli sentez karistiricilari da içerir (genellikle karistiricilari ve efektler* islemcilerini kullanmak için, â(n), dogrudan hesaplanir ve orijinal kaynak sinyalleriymis gibi kullanilir.

De-korelasyon isleme (hi(n) = ö(n) in (16)) uygulanmazken iyi ses kalitesi de elde edilebilir. De-korelasyon islemeden dolayi ortaya çikan olgular ile kaynak sinyallerinin îiün korelasyonlu olmasindan dolayi olgular arasinda bir anlasmadir. Herhangi bir de-korelasyon isleme kullanilmadiginda ortaya çikan isitsel uzamsal imaj dengesizlikten [l] muzdarip olabilir. Ancak karistirici, yansiticilar ya da diger efektler kullanildiginda ve bu yüzden de-korelasyon islemeye daha az ihtiyaç oldugunda kendisine bazi de-korelasyonlari getirebilir. â(n), de-korelasyon isleme olmadan üretilirse, kaynaklarin seviyesi diger kaynaklara iliskin olarak karistirildiklari yöne baglidir. Bu seviyede bagimlilik için dengeleme yapan bir algoritmasi bulunan mevcut karistiricilardaki genlik kaydirma algoritmalarinin yerini degistirerek karistirma parametrelerindeki gürültü. bagliliginin olumsuz etkisinin üstesinden gelinebilir. Bir seviye dengeleme genlik algoritmasi Sekil ll'de gösterilir ve bu karistirma parametrelerindeki kaynak seviyesini dengelemeyi hedeflemektedir. Bir konvansiyonel genlik kaydirma algoritmasinin kazanim faktörlerini dikkate alarak (ör.

Sekil 4), ai ve bi, Sekil ll'deki agirliklar, 6, ve bi sununla hesaplanir E{(Zi=,b.-S.-(n)) } Unutmayiniz ki &1 ve En, çikti altbant gücünün, $(n) her altbantta bagimsizmis gibi ayni olacagi sekilde hesaplanir. Önceden bahsedildigi üzere, bagimsiz â(n)'nin üretimi problematiktir. Burada stratejiler, @tüm bagimsizmis gibi verimli sekilde benzer bir efekt elde ederken, daha az de- korelasyon uygulamak üzere açiklanir.

Sekil 12'de gösterildigi üzere örnegin bir dalga biçimli sentez sistemini düsünün. 51, 52, ..., ngW : 6) için arzu edilen sanal kaynak konumlari gösterilir. M tamamen bagimsiz sinyalleri üretmeksizin â(n) (16) hesaplamak üzere bir strateji: tBirbirlerine yakin olan kaynaklara tekabül eden kaynak indekslerinin gruplarini üretin. Örnegin Sekil 8'de bunlar söyle olabilir: {l}, {2, 5}, {3}, ve {4, 6}.

ZHer seferinde, her bir altbantta en güçlü kaynagin kaynak indeksini seçiniz. imax = mêXE{5(n)} (21) imax, i.e. hi(n) = ö(n) içeren grubun kaynak indeksleri parçasi için herhangi bir de-korelasyon isleme uygulamayiniz.

Açiklanan algoritma, en güçlü sinyal bilesenlerini en son modifiye eder. Ilaveten, kullanilan farkli hi(n)'nin sayisi azaltilir. De-korelasyon daha kolay oldugundan, daha az bagimsiz kanalin üretilmesi gerektiginden bu bir avantajdir. Açiklana teknik, stereo ya da çok kanalli ses sinyalleri karistirildiginda da uygulanabilir.

V.KALITE VE BIT HIZI BAKIMINDAN ÖLÇEKLENEBILIRLIK Önerilen sema sadece, bir konvansiyonel mono ses kodlayici ile kodlanabilen tüm kaynak sinyallerinin özetini iletilir.

Herhangi bir mono geriye dönük uyumluluk gerekmediginde ve birden fazla ses dalga biçiminin iletimi/depolamasi için mevcut kapasite oldugunda, önerilen sema birden fazla iletim kanali ile kullanim için ölçeklenebilir. Bu, belirli kaynak sinyallerinin farkli altsetleri bulunan birkaç toplam sinyal üreterek uygulanabilir yani kaynak sinyallerinin her bir alt setine önerilen kodlama semasi bireysel olarak uygulanir. Iletilen ses kanallarinin sayisi arttikça ses kalitesinin artmasi beklenir çünkü her iletilen kanaldan de-korelasyon ile daha az bagimsiz kanal üretilmek zorunda olur (bir iletilen kanalin durumuna kiyasla).

VLMEVCUT STEREO VE SURROUND SES FORMATLARINA GERIYE DÖNÜK Asagidaki ses dagitim senaryosunu. göz önünde bulundurun.

Bir tüketici, maksimum kalite bir stereo ya da çok kanalli surround sinyal elde etmektedir (ör. bir ses CD, DVD ya da çevrim içi müzik magazasi araciligiyla). Amaç, standart stereo/surround. pleybek kalitesinde taviz vermeksizin müsteriye opsiyonel olarak, elde edilen ses içeriginin bir özel karisimini üretme esnekligini saglamaktir.

Bu, of .â(n)'nin. hesaplanmasina. belirli stereo ya da çok kanalli ses sinyalinin bir fonksiyonu olarak izin veren yan bilginin bir bit akisini tüketiciye (ör. bir çevrim içi müzik markette opsiyonel satin alma seçenegi olarak) saglama ile uygulanabilir. Tüketicinin karistirma algoritmasi daha sonra â(n)'ye uygulanir. Asagida, stereo ya da çok kanalli ses sinyalleri dikkate alinarak â(n)'yi hesaplamak için iki olasilik açiklanmaktadir.

ALKaynak sinyallerinin toplamini alicida tahmin etme Önerilen kodlama semasinin bir stereo ya da çok kanalli ses iletimi ile en kolay kullanma sekli Sekil l3'te gösterilir, burada yi(n) (1 5 i S L), L belirli stereo ya da çok kanalli ses sinyalinin kanallaridir. Kaynaklarin toplam sinyali iletilen kanallari bir tekli ses kanalina downmiksleme ile tahmin edilir. Downmiksleme, kanallarin yi(n) (1 5 i_ S L) toplamini hesaplama yardimiyla gerçeklestirilir ya da daha sofistike teknikler uygulanabilir.

En iyi performans için, kaynak sinyallerinin seviyesinin, kaynak sinyalleri arasindaki güç oranini kaynaklarin bununla belirli stereo ya da çok kanalli sinyalde kapsandigi güç oranina yaklasacagi sekilde E{gs(n)} tahmininden önce uyarlanmasi tavsiye edilir. Bu durumda, iletilen kanallarin downmiksi, kaynaklarin. (l) toplaminin nispeten iyi bir tahminidir (ya da bunun ölçekli bir versiyonu).

Bir otomatiklesmis islem, yan bilginin hesaplanmasindan önce sifreleyici kaynak sinyali girdilerinin si(n) seviyesini ayarlamak üzere kullanilabilir. Bu islem zamanda uyarlanabilir olarak, her bir kaynak sinyalinin belirli stereo ya da çok kanalli sinyalde kapsandigi seviyeyi tahmin eder. Yan bilginin hesaplanmasindan önce, her kaynak sinyalinin seviyesi artik zamanda uyarlanabilir olarak, kaynagin stereo ya da çok kanalli ses sinyalinde kapsandigi seviyeye esit olacagi sekilde ayarlanir.

B.Iletilen kanallari tek tek kullanma Sekil 14, stereo ya da çok kanalli surround sinyal iletimli önerilen semanin farkli bir uygulamasini gösterir. Burada, iletilen kanallar downmikslenmez ancak â(n)'nin üretimi için tek tek kullanilir. En genel haliyle, $(n)'nin altbant sinyalleri sununla hesaplanir burada wl(n), iletilen kanallarin altbantlarinin spesifik dogrusal kombinasyonlarini belirleyen agirliklardir.

Dogrusal kombinasyonlar, â(n)'nin çoktan mümkün oldugu kadar dekorelasyonlanacagi sekilde seçilir. Böylece, hiçbir ya da sadece küçük bir miktarda de-korelasyon islemi uygulanmasi gerekir ki bu daha önce ele alindigi üzere avantajlidir.

VHUYGULAMALAR Daha önce halihazirda, önerilen kodlama semasi için birtakim uygulamalardan bahsetmistik. Burada, bunlari özetliyor ve birkaç uygulamadan daha bahsediyor olacagiz.

Alwiksleme için ses kodlama Stereo, çok kanalli ya da dalga alani sentez ses sinyallerine mikslemeden önce ses kaynak sinyallerinin ne zaman depolanmasi ya da iletilmesi gerekse önerilen sema uygulanabilir. Önceki teknik ile, bir mono ses kodlayici her bir kaynak sinyaline bagimsiz olarak uygulanabilir ve bu kaynaklarin sayisi ile ölçeklenen bir bit hizi ile sonuçlanir. Önerilen kodlama semasi, bir tekli mono ses kodlayici arti nispeten düsük bit hizli yan bilgi bulunan yüksek sayida ses kaynak sinyallerini sifreleyebilir. Bölüm V'de tarif edildigi üzere, ses kalitesi, eger hafiza kapasitesi bunu yapmaya müsait ise birden fazla iletilmis kanal kullanarak gelistirilebilir.

BNEta-veri ile re-miksleme Bölüni VI'da tarif edildigi üzere, mevcut stereo ve çok kanalli ses sinyalleri, ilave yan bilginin yardimiyla re- mikslenebilir (yani "meta-veri"). Sadece optimize stereo ve çok kanalli miksli ses içerigi satmaya karsi olarak, meta veri bir kullaniciya kendi stereo ve çok kanalli müzigini re-mikslemesine izin vererek satilabilir. Bu örnegin, karaoke için bir sarkida vokalleri azaltmak için ya da müzik ile birlikte bir enstrüman Çalmak için spesifik enstrümanlari kismak için kullanilabilir.

Depolama bir sorun olmasa bile, açiklanan sema, müzigin kisiye özel mikslemesini mümkün kildigi için çok cazip olabilir. Çünkü müzik endüstrisinin çoklu parça kayitlarini hiçbir zaman birakmak istemeyecek olmasi olasidir. Kötüye kullanim açsisindan çok fazla tehlike vardir. Önerilen sema, çoklu parça kayitlardan vazgeçmeden re-miksleme yapabilmeyi mümkün kilar.

Dahasi, stereo ya da çok kanalli sinyaller re-mikslenir re- mikslenmez belirli derecede bir kalite azalmasi meydana gelir ve re-mikslerin yasal olmayan dagitimini daha az cazip kilar. c. Dalga alani sentez dönüsümüne stereo/çok kanal Bölüm VI'da açiklanan sema için diger bir uygulama asagida açiklanmaktadir. Hareketli resimlere eslik eden stereo ve çok kanalli (ör. 5.1 surround) ses yan bilgi eklenerek dalga alani sentez isleme için genisletilebilir. Örnegin, Dolby AC-3 (DVD'de ses) dalga alani sentez sistemleri için .1 geriye dönük uyumlu ses kodlama için genisletilebilir, yani DVDler 5.1 surround sesi konvansiyonel eskiden kalan oynaticilarda ve dalga alani sentez sesi yan bilginin islemesini destekleyen yeni nesil oynaticilarda oynatir.

VIII.ÖZNE.L DEGERLENDIRME Bölüm IV-A ve IV-B'de önerilen algoritmalarin bir gerçek zamanli sifre çözücüsünü gerçeklestirdik. Bir FFT-tabanli STFT filtre bankasi kullanilir. Bir lOZ4-nokta FFT ve bir kullanilir. Spektral katsayilar, her` bir grubun, esdeger dikdörtgen bant genisliginin (ERB) iki kati bir bant genisligine sahip sinyali temsil edecegi sekilde birlikte gruplanir. Resmi olmayan dinleme, ses kalitesinin daha yüksek frekans çözünürlügü seçildiginde dikkate deger sekilde gelismedigini açiga çikarmistir. Daha düsük bir frekans çözünürlügü, iletilecek daha az parametre ile sonuçlandigindan avantajlidir.

Her bir kaynak için genlik/gecikme kaydirma ve kazanim tek tek ayarlanabilir. Algoritma, 12 14 parçali birçok çok parçali ses kayitlarinin kodlamasi için kullanilmistir.

Sifre çözücü, 5.1 surround mikslemenin bir vektör tabanli genlik kaydirma (VBAP) karistirici kullanmasina izin verir.

Her kaynak sinyalinin yönü ve kazanimi ayarlanabilir.

Yazilim, kodlu kaynak sinyalinin miksleme ile orijinal ayrik kaynak sinyallerini miksleme arasinda çalismasin sirasinda geçis yapilmasina izin verir.

Rahat dinleme genellikle, eger her bir kaynak için sifir dB'nin bir kazanimi Gi kullanilirsa kodlu ya da orijinal kaynak sinyallerini karistirma arasinda çok az ya da hiçbir fark ortaya koymaz. Kaynak kazanimlari ne kadar çesitlenirse o kadar fazla yapay olgular meydana gelir.

Kaynaklarin hafif güçlendirilmesi ya da azaltilmasi (ör. ± 6 dB'ye kadar) halen iyi ses verir. Kritik bir senaryo, tüm kaynaklarin bir tarafa mikslenmesi ve sadece bir tekli kaynagin diger karsi tarafa mikslenmesidir. Bu durumda ses kalitesi spesifik miksleme ve kaynak sinyallerine bagli olarak azalabilir. Örnegin çok parçali kayitin kanallari gibi ses kaynak sinyallerinin, birlesik, kodlamasi için› bir kodlama semasi önerilmistir. Amaç, kaynak sinyali dalga biçimlerini yüksek kalite ile kodlamak degildir, bu durumda birlesik kodlama, ses kaynaklari genellikle bagimsiz oldugundan minimal kodlama kazanimi verebilir. Amaç, kodlu kaynak sinyalleri mikslendiginde yüksek kaliteli bir ses sinyali elde edilmesidir. Kaynak sinyallerinin istatistiksel Özelliklerini, miksleme semalarinin ve uzamsal isitmenin özelliklerini ele alarak, önemli kodlama kazanim gelisiminin, kaynak sinyallerini birlesik kodlayarak elde edildigi gösterilmistir.

Kodlama kazanim gelisimi, sadece bir ses dalga biçiminin iletilmesinden kaynaklanmaktadir.

Ilaveten, nihai karistirilan sinyalin uzamsal algisini belirleyen ilgili faktörler olan kaynak sinyallerinin istatistiksel Özelliklerini temsil eden yan bilgiler Yan bilgi hizi kaynak sinyali basina yaklasik 3 kbs'dir. Örnegin stereo, çok kanalli ya da dalga alani sentezi karistiricilari gibi, kodlu kaynak sinyalleri ile herhangi Daha yüksekr bit hizi ve kalitesi için birden fazla ses kanalini ileterek önerilen semayi ölçekleme kolay bir yoldur. Dahasi, belirli stereo ya da çok kanalli ses sinyalinin re-mikslenmesine olanak taniyan, semanin bir varyasyonu öne sürülmüstür (ve hatta ses formatinin degismesi, ör. stereodan çok kanalli ya da dalga alani sentezine). Öne sürülen semanin uygulamalari çogaltilir. Örnegin, MPEG- 4, birden fazla "dogal ses nesnesi" (kaynak sinyali) iletilmek sorunda oldugunda bit hizini azaltmak için öne sürülen sema ile genisletilebilir. Ayni zamanda öne sürülen sema, dalga alani sentez sistemleri için içerigin kompakt gösterimini önerir. Bahsedildigi üzere, mevcut stereo ya da çok kanalli sinyaller, kullanicinin kendi begenisine göre sinyalleri re-mikslemesine izin vermek için yan bilgiler ile tamamlanabilir.

REFERANSLAR tezi, Isviçre Lozan Federal Teknoloji Enstitüsü (EPFL), 2004, Ph.D. Tez No. 3062.

Claims

ISTEMLER

1.Çok sayida kaynak sinyallerini (sl(n),sZ(n),-- ,sM(n)) sifreleme yöntemi olup, asagidakileri içermektedir: çok sayida kaynak sinyalleri (sl(n),sZ(n),-",sM(n)) için, çok sayida kaynak sinyallerinin kaynak sinyallerinin (sl(n),52(n),'°',sM(n)) spektral zarflarini gösteren istatistiksel bilgileri hesaplamayi ki burada istatistiksel bilgi ilaveten, çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir albandi için spesifik. bir kaynak sinyalinin bir normallestirilmis altbant oto-korelasyon fonksiyonu ((®i(n,e)) hakkinda bilgi içerir; ve kaynak sinyallerinin (sl(n),52(n), - ,sM(n)) spektral zarflarini gösteren istatistiksel bilgiyi ve çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir albandi için normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden (sl(n),sZ(n),~--,sM(n)) türetilen bir ses sinyali için meta veri olarak iletme.

2.Birden fazla sayida kaynak sinyalini (sl(n),sZ(n),-~~,sM(n)) sifreleme cihazi olup, burada çok sayida kaynak sinyalleri (sl(n),52(n),-",SM(n)) için, kaynak. sinyallerinin (sl(n),sZ(n),--~,sM(n)) spektral zarflarini gösteren istatistiksel bilgileri hesaplamak üzere çalismaktadir ki burada istatistiksel bilgi ilaveten, çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir altbandi için spesifik bir kaynak sinyalinin bir normallestirilmis altbant oto-korelasyon fonksiyonu ((®i(n,e)) hakkinda bilgi içerir; ve kaynak sinyallerinin (sl(n),52(n),- -,sM(n)) spektral zarflarini gösteren istatistiksel bilgiyi ve çok sayida kaynak sinyallerinin her bir kaynak sinyali için. ve çok sayida altbandin her bir altbandi için normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden (Sl(n),sZ(n),-",sM(n)) türetilen bir ses sinyali için meta veri olarak iletmek üzere çalismaktadir.

3.Istem 2'deki cihaz olup, burada hesaplama, çok sayida kaynak sinyallerini mikslemek üzere miksleme parametreleri tarafindan belirlenen bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri hesaplamayi içerir ve burada iletici, zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden türetilen bir ses sinyali için meta veri olarak iletmek üzere yapilandirilir. .Istem 2'deki cihaz olup, burada iletme, iletilen bilgi olarak, ön tanimli otokorelasyon fonksiyonlarinin bir depolanmis setinde bir ön tanimli otokorelasyon fonksiyonunu tanimlayan bir .Istem 2'deki cihaz olup, burada hesaplama, asagidaki denkleme dayanarak belirlenen bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonunu hesaplamayi içerir: m}n{:77}~ me smsmm- Ti- burada e, zaman araligidir, I , çok sayida kaynak sinyallerinin kaynak sinyalleri için karistirma parametreleri arasindan bir en küçük karistirma parametresidir, l { } kaynak sinyalleri için karistirma parametreleri arasindan bir` en büyük karistirma parametresidir' ve Ti, dikkate alinan spesifik kaynak sinyali için bir karistirma parametresidir. .Istem 2'deki cihaz olup, burada hesaplama, asagidaki denkleme dayanan bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonunu hesaplamayi içerir: burada ®(n,e), spesifik kaynak sinyalinin normallestirilmis altbant otokorelasyon fonksiyonudur, n, bir zaman indeksi, e, zaman araligi, E, bir beklenti operatörü, i, bir kaynak sinyalini tanimlayan bir indeks ve si, dikkate alinan spesifik kaynak sinyalidir. .Istem 2'deki cihaz olup, burada hesaplama, bir kaynak için, kaynak sinyallerinin ( sl(n),52(n), '~,sMKn)) spektral zarflarini, çok sayida altbantlarin her bir altbandi için bir altbant gücünü ya da kafes filtre parametrelerini ya da LPC parametrelerini ya da hat spektral çift parametrelerini gösteren istatistiksel bilgi olarak hesaplamayi içermekte ve burada iletme, kaynak sinyallerinin ( sl(n),52(n),'-',sMfn)) spektral zarflarini, her bir kaynak sinyali için çok sayida altbantlarin her bir altbandi için altbant güçlerini ya da kafes filtre parametrelerini ya da LPC parametrelerini ya da hat spektral çift parametrelerini meta veri olarak gösteren istatistiksel bilgi olarak iletmeyi içermektedir. .Istem 2'deki cihaz olup, burada hesaplayici, her seferinde ve her bir altbant için, en güçlü kaynagin gücünü seçmek ve tüm diger kaynaklarin ilgili altbant gücünü, bir nicemleyicinin bir dinamik. araligini sinirlandirmak için en güçlü altbant kaynagindan daha düsük olan bir 24dB degerinde alt sinirlamak üzere yapilandirilir.