TR201811059T4 - Ses kaynaklarının parametrik birleşik kodlaması. - Google Patents
Ses kaynaklarının parametrik birleşik kodlaması. Download PDFInfo
- Publication number
- TR201811059T4 TR201811059T4 TR2018/11059T TR201811059T TR201811059T4 TR 201811059 T4 TR201811059 T4 TR 201811059T4 TR 2018/11059 T TR2018/11059 T TR 2018/11059T TR 201811059 T TR201811059 T TR 201811059T TR 201811059 T4 TR201811059 T4 TR 201811059T4
- Authority
- TR
- Turkey
- Prior art keywords
- source
- source signals
- signals
- subband
- signal
- Prior art date
Links
- 239000002131 composite material Substances 0.000 title description 5
- 238000002156 mixing Methods 0.000 claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 21
- 230000005236 sound signal Effects 0.000 claims description 24
- 230000003595 spectral effect Effects 0.000 claims description 16
- 238000005311 autocorrelation function Methods 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 10
- 101150067783 Rexo2 gene Proteins 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 abstract description 26
- 238000003786 synthesis reaction Methods 0.000 abstract description 26
- 230000000875 corresponding effect Effects 0.000 abstract description 8
- 238000011156 evaluation Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 25
- 230000006870 function Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 101100042271 Mus musculus Sema3b gene Proteins 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000001934 delay Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005314 correlation function Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 206010012335 Dependence Diseases 0.000 description 1
- 101100149256 Mus musculus Sema6b gene Proteins 0.000 description 1
- 208000033809 Suppuration Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000001061 forehead Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 238000003466 welding Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/13—Application of wave-field synthesis in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
Abstract
Aşağıdaki kodlama senaryosu şöyle ele alınır: Dalga alanı sentezi miksleme, çok kanallı surround ya da kaynak sinyallerini çözmeden sonra stereo sinyaller amacıyla, bir takım ses kaynak sinyallerinin iletilmesi ya da depolanması gerekir. Önerilen teknik, kaynak sinyalleri arasında herhangi bir fazlalık olmadığında bile bunları ayrı olarak kodlamaya kıyasla kaynak sinyallerini birleşik olarak kodlarken ciddi derecede kodlama kazanımı sunmaktadır. Kaynak sinyallerinin istatistiksel özelliklerini, miksleme tekniklerinin özelliklerini ve uzamsal işitme ele alınarak bu mümkün olmaktadır. Kaynak sinyallerinin toplamı, en son mikslenen ses kanallarının çoğunlukla algısal olarak önemli uzamsal işaretleri belirleyen kaynak sinyallerinin istatistiksel özelliklerine ek olarak iletilir. Kaynak sinyalleri, istatistiksel özellikleri, orijinal kaynak sinyallerinin ilgili özelliklerine yaklaşacağı şekilde alıcıda geri kazanılır. Öznel değerlendirmeler, yüksek ses kalitesinin öne sürülen şema ile elde edildiğini göstermektedir.
Description
TARIFNAME
SES KAYNAKLARININ PARAMETRIK BIRLESIK KODLAMASI
1. GIRIS
Genel bir kodlama probleminde, n'nin zaman indeksi oldugu
çok sayida (mono) kaynak sinyallerine si(n) (l Si SM) ve
bir sahne açiklama vektörüne S(n) sahibiz. Sahne açiklama
vektörü, (sanal) kaynak konumlari, kaynak genislikleri ve
(sanal) oda parametreleri gibi akustik parametreler gibi
parametreler içermektedir. Sahne açiklamasi, zaman
degiskenli olabilir ya da zamanla degisiyor olabilir.
Kaynak sinyalleri ve sahne açiklamasi kodlanir ve bir sifre
çözücüye iletilir. Kodlanan kaynak sinyalleri g(n) ardisik
sekilde, sahne açiklama vektörünün bir fonksiyonu olarak
dalga alani sentezi, çok kanalli ya da stereo sinyaller
üretmek amaciyla sahne açiklamasinin bir fonksiyonu olarak
karistirilir. Sifre Çözücü çikti sinyalleri îiün (O Si SN)
olarak gösterilir. Sahne açiklama vektörünün S(n)
iletilemedigini ancak sifre çözücüde belirlenebildigini
unutmayiniz. Bu dokümanda, "stereo ses sinyali" terimi her
zaman iki-kanalli stereo ses sinyalleri anlamina gelir.
Sahne açiklamasini tanimlar ve her bir ("natürel") kaynak
sinyali için bir ayri mono ses kodlayici, ör. bir AAC ses
kodlayici kullanir. Bununla birlikte, birçok kaynak bulunan
bir kompleks sahne karistirilacagi zaman, bit hizi yüksek
olur yani bit hizi, kaynak sayisi ile yükselir. Bir kaynak
sinyalini. yüksek. kalite ile kodlama. yaklasik. 60 90 kb/s
gerektirir.
Daha öncesinde, Esnek Isleme için Binoral Isaret
kodlamasini (BCC) gösteren bir sema bulunan açiklanan
kodlama probleminin [1][2] özel bir durumunu isaret
etmistik. Sadece belirli kaynak sinyallerinin özeti arti
düsük bit hizi yan bilgisini ileterek düsük bit hizi elde
edilir. Ancak, kaynak sinyalleri, sifre çözücüde geri
kazanilamaz ve sema, stereo ve çok kanalli surround sinyal
üretimi ile sinirliydi. Ayni zamanda, genlik ve gecikme
kaydirmaya dayanarak sadece basitlestirilmis karistirma
kullaniliyordu. Böylece, kaynaklarin yönü kontrol
edilebiliyordu ancak baska isitsel uzamsal imaj nitelikleri
kontrol edilemiyordu. Bu semanin diger bir sinirlandirmasi
bunun sinirli ses kalitesiydi. Özellikle, kaynak
sinyallerinin sayisi arttikça ses kalitesindeki bir azalma.
Doküman [1], (Binoral Isaret Kodlama, Parametrik Stereo,
MP3 Surround, MPEG Surround) N ses kanallarinin
sifrelendigi durumu ve benzer isaretlere sahip N ses
kanallarini kapsar ve daha sonra orijinal ses kanallari
çözülür. Iletilen yan bilgi, girdi kanallari arasindaki
farkliliklara iliskin kanallar arasi isaret parametrelerini
Stereo ve çok kanalli ses sinyallerinin kanallari, ses
kaynaklari sinyallerinin karisimlarini kapsar ve bu yüzden
saf ses kaynak sinyallerine göre dogada farkli olur- Stereo
ve çok kanalli ses sinyalleri, uygun bir oynatma sistemi
üzerinden arkadan oynatildiginda, dinleyicinin kayit ayari
ile kaydedildigi ya da karistirma esnasinda kayit mühendisi
tarafindan tasarlandigi üzere bir isitsel uzamsal imaji
("ses asamasi") anlayacagi sekilde karistirilir. Stereo ya
da çok kanalli ses sinyalinin kanallari için birlesik
kodlamaya yönelik birtakim semalar daha önceden
önerilmistir.
teknolojisini açiklamaktadir. Bir ses sifreleyici, kaliteyi
kontrol etmek için dönüstürmeyi çesitlendirerek, çok
kanalli ses verisinde bir ön islemeli çok kanalli
dönüstürme gerçeklestirir. Sifreleyici çoklu pencereleri
farkli kanallardan bir ya da daha fazla karolar içine
gruplandirir ve sifreleyicinin geçicileri izole etmesini
saglayan karo yapilandirma bilgisini üretir.
islemesini tarif eder. Çok kanalli veri toplanir ve dörtlü
gruplari temsil eder. Bu veri daha sonra bir dogrusal
öngörücüye çiktilanir. Bir otokorelasyon matrisi hesaplanir
ve müteakiben sahte-evrikler üretilir` ve dogrusal öngörü
katsayilarina ve artiga çiktilanir.
3062 (2004) sayili Tez "Parametric coding of spatial
audio", Christof Faller, Lausanne, EPFL, XP002343263,
binoral isaret kodlamasi gibi birçok parametrik kodlama
teknolojisini tarif etmektedir. Uzamsal isaretler kanallar
arasi zaman farki, kanallar arasi seviye farki ve kanallar
arasi korelasyon stereo sinyaller ve çok kanalli ses
sinyalleri için tahmin edilir. Bu, bir altbant-vari sekilde
gerçeklestirilir. Bir BCC sifre çözücü iletilen toplam
sinyal arti uzamsal isaretleri verilen bir stereo ya da çok
kanalli ses sinyali üretir.
coding", Frank Baumgarte & Christof Faller, sayfalar 1801-
1804, IEEE Akustik Konusma Ve Sinyal Isleme Hakkinda
Uluslararasi Konferans (ICASSP), New York, Mayis 13, 2002,
XPOlO804245 yayini binoral isaret kodlamasini
özetlemektedir. Stereofonik. sinyalden uzamsal isaretlerim
çikarimlanmasi bir BCC analizörü ile gerçeklestirilir. BCC
analizörü, bir uyum tahmin bloku, güç tahmin bloklari,
gecikme dengeleme bloklari ve bir maksimum tespit bloku
içermektedir. Girdi sinyalleri bir birinci kanaldan A gelen
bir ses sinyali ve bir ikinci kanaldan B gelen› bir ses
sinyalidir ve ses kanallari bir Koklear filtre bankasi
(CFB) ve bir iç kil hücresi (IHC) modeline tabi tutulur.
Mevcut bulusun bir amaci, sifreleme için gelistirilmis bir
konsept saglamaktir; Bu, istem l'in yöntemi ya da istem
2'nin cihazi ile elde edilir. Bulusun amaci, bir minimum
bant genisligi kullanirken birden fazla sayida kaynak
sinyallerinin iletilmesi için bir yöntem saglamaktir.
Bilinen yöntemlerin çogunda, pleybek formati (ör. stereo,
.1) ön tanimlidir` ve kodlama senaryosu üzerine dogrudan
etkiye sahiptir. Sifre çözücü tarafindaki ses akisi, sadece
bu ön tanimli pleybek formatini kullanmalidir, böylece
kullaniciyi bir ön tanimli pleybek senaryosuna (ör. stereo)
Önerilen bulus, tipik olarak bir stereo ya da çok kanalli
sinyallerin kanallari olmayan ancak farkli konusma ya da
enstrüman sinyalleri gibi bagimsiz sinyaller olan N ses
kaynak sinyallerini sifreler. Iletilen yan bilgi, girdi
kaynak sinyallerine iliskin istatistiksel parametreleri
Önerilen bulus, M ses kanallarini orijinal ses kaynak
sinyallerinden farkli isaretler ile çözer. Bu farkli
isaretlerin her biri alinin toplam sinyale bir karistirici
uygulayarak dolayli olarak sentezlenir. Karistirici, alinan
istatistiksel kaynak bilginin ve alinan (ya da lokal
belirlenen) ses formati parametrelerinin ve karistirma
parametrelerinin bir fonksiyonu olarak kontrol edilir.
Alternatif olarak bu farkli isaretler, alinan istatistiksel
kaynak bilginin ve alinan (ya da lokal belirlenen) ses
formati parametrelerinin ve karistirma parametrelerinin bir
fonksiyonu olarak dogrudan hesaplanir. Bu hesaplanan
isaretler alinan toplam sinyali göz önünde bulundurarak
çikti kanallarini sentezlemek üzere bir Önceki teknik sifre
çözücüyü (Binoral isaret kodlamasi, Parametrik Stereo, MPEG
Surround) kontrol etmek için kullanilir.
Ses kaynak sinyallerinin birlesik kodlamasi için önerilen
sema türünün ilk örnegidir. Ses kaynak sinyallerinin
birlesik kodlamasi için tasarlanmistir. Ses kaynak
sinyalleri genellikle, bir stereo ya da çok kanalli ses
sistemi üzerinden pleybek için uygun olmayan mono ses
sinyalleridir. Kisacasi, asagida ses kaynak sinyalleri
genellikle kaynak sinyalleri ile gösterilir.
Ses kaynak sinyallerinin pleybekten önce, öncelikle stereo,
çok kanalli ya da dalga alani sentezi ses sinyallerine
karistirilmasi gerekir. Bir ses kaynak sinyali, bir tekli
enstrüman ya da konusmaci ya da bir takim enstrüman ya da
konusmacilarin toplami olabilir. Ses kaynak sinyalinin
diger bir tipi bir spot mikrofon ile konser esnasinda
kaydedilen bir rmnu) ses sinyalidir. Siklikla, ses kaynak
sinyalleri çoklu parça kaydedicilerde ya da harddisk kayit
sistemlerinde depolanir.
Ses kaynak. sinyallerinin› birlesik, kodlamasi için istemde
bulunulan sema sadece ses kaynak. sinyallerinin toplamini
iletmeye
ya da kaynak sinyallerinin agirlikli bir toplamina
dayanmaktadir. Opsiyonel olarak, agirlikli toplama, farkli
altbantlarda farkli agirliklar ile yürütülebilir ve
agirliklar zamanda uyarlanabilir. Esitleme ile toplama da
Bölüm 3.3.2'de [lJ'de açiklandigi üzere uygulanabilir.
Asagida, toplam ya da toplam sinyale atifta bulundugumuzda,
her zaman (1) ile üretilen ya da açiklandigi gibi üretilen
bir sinyali kastetmekteyiz. Toplam sinyale ek olarak yan
bilgi iletilir. Toplam ve yan bilgi, çiktilanan ses akisini
temsil eder. Opsiyonel olarak, toplam sinyal bir
konvansiyonel mono ses kodlayici kullanilarak kodlanir. Bu
akis, bir dosyada (CD, DVD, Harddisk) depolanabilir ya da
aliciya yayin yapilabilir. Yan bilgi, karistirici çikti
sinyallerinin algisal uzamsal isaretlerini belirleyen en
önemli faktörler olan kaynak sinyallerinin istatistiksel
Özelliklerini temsil eder. Bu özelliklerin spektral
zarflari ve oto-korelasyon fonksiyonlarini geçici olarak
gelistirdigi gösterilecektir. Her' bir kaynak sinyal için
yaklasik olarak 3 kb/s yan bilgi iletilir. Alicida, kaynak
sinyalleri êiün (l 5 i S M), orijinal kaynak sinyallerinin
ve toplam. sinyalin karsilik gelen özelliklerine yaklasan
yukarida bahsedilen istatistiksel özellikleri ile geri
kazanilir.
ÇIZIMLERIN KISA AÇIKLAMASI
Bulus ekli Sekiller sayesinde daha iyi anlasilacak. olup
sekil 1, her bir kaynak sinyalinin iletiminin daha fazla
isleme için bagimsiz olarak yapildigi bir sema gösterir,
sekil 2, toplam sinyal arti yan bilgi olarak iletilen
kaynaklarin bir sayisini gösterir,
sekil 3, bir Binoral Isaret Kodlama (BCC) semasinin bir
blok diyagramini gösterir,
Sekil 4, bir takim kaynak sinyallerine dayali olarak
stereo sinyalleri üretmek üzere bir karistirici gösterir,
sekil 5, ICTD, ICLD ve ICC ve kaynak sinyali altbant gücü
arasindaki bagi gösterir,
sekil 6, yan bilgi üretiminin islemini gösterir,
sekil 7, her bir kaynak. sinyalinin LPC parametrelerini
sekil 8, bir toplam sinyalden kaynak sinyallerini yeniden
olusturma islemini gösterir,
sekil 9, her bir sinyalin toplam sinyalden üretilmesine
yönelik bir alternatif sema gösterir,
Sekil 10, bir takim kaynak sinyallerine dayali olarak
stereo sinyalleri üretmek üzere bir karistirici gösterir,
sekil ll, kaynak seviyelerinin karistirma parametrelerine
bagli olmasini engelleyen bir genlik kaydirma
algoritmasini gösterir,
sekil 12 bir dalga alani sentezi pleybek sisteminin bir
hoparlör dizilimini gösterir,
sekil l3, iletilen kanallarin downmiksini isleyerek
alicida kaynak sinyallerinin bir tahmininin nasil geri
kazanilacagini gösterir,
sekil 14, iletilen kanallari isleyerek alicida
sinyallerinin bir tahmininin nasil geri kazanilacagini
gösterir,
lLTANIMLAR, NOTASYONLAR VE DEGISKENLER
Asagidaki notasyonlar ve degiskenler bu belgede
kullanilmaktadir:
n zaman indeksi;
i ses kanali ya da kaynak indeksi;
d gecikme indeksi;
M` sifreleyici girdi kaynak sinyalleri sayisi;
N sifre çözücü çikti kanallari sayisi;
xi(n) karisik orijinal kaynak sinyalleri;
îiün karisik sifre çözücü çikti sinyalleri;
si(n) sifreleyici girdi kaynak sinyalleri;
â(n) ayni zamanda sahte-kaynak sinyalleri olarak da
adlandirilan iletilen kaynak sinyalleri;
s(n) iletilen toplam sinyal;
yi(n) L-kanal ses sinyali; (remikslenecek ses sinyali);
.g(k) si(n)'nin (diger sinyaller için benzer sekilde
tanimlanan) bir altbant sinyali;
E{gß(n)} gf(n)'nin (diger sinyaller için benzer sekilde
AL(n) tahmin edilen altbant ICLD;
T(n) tahmin edilen altbant ICTD;
c(n) tahmin edilen altbant ICC;
pihn ilgili kaynak altbant gücü;
ai, bi karistirici ölçek faktörleri;
ci, di karistirici gecikmeleri;
ALi, r(n)karistirici seviyesi ve zaman farki;
Gi karistirici kaynak kazanimi;
HLSES KAYNAK SINYALLERININ BIRLESIK KODLAMASI
Ilk olarak, Binoral Isaret Kodlamasi (BCC), bir parametrik
çok kanalli ses kodlama teknigi açiklanmaktadir. Daha
sonra, BCC'nin dayandigi ayni anlayis ile bir kodlama
senaryosu için kaynak sinyallerinin birlesik kodlamaya
yönelik olarak bir algoritma düzenlenebilir.
AJBinoral Isaret Kodlamasi (BCC)
Çok kanalli ses kodlama için bir BCC semasi [l][2]
asagidaki sekilde gösterilir. Girdi çok kanalli ses sinyali
bir tekli kanala downmikslenir. Tüm kanal dalga biçimleri
hakkinda kodlama ve bilgi iletimine karsilik olarak, sadece
downmikslenen sinyal kodlanir (bir konvansiyonel mono ses
kodlayici ile) ve iletilir. Ilaveten, algisal olarak motive
edilen "ses kanali farkliliklari", orijinal ses kanallari
arasinda tahmin edilir ve ayni zamanda sifre çözücüye
iletilir. Sifre çözücü, ses kanali farkliliklarinin
orijinal ses sinyalinin karsilik gelen ses kanali
farkliliklarina yaklasacagi sekilde kendi çikti kanallarini
Toplama yerellestirme, bir hoparlör sinyal kanali çifti
için algisal olarak ilgili ses kanali fakliliklarinin,
kanal arasi zaman farki (ICTD) ve kanal arasi seviye farki
(ICLD) oldugu anlamina gelir. ICTD ve ICLD, isitsel
etkinliklerin algilanan yönü ile ilgili olabilir. Diger
isitsel uzamsal imaj nitelikler, görünür kaynak genisligi
ve dinleyici zarfi gibi, interaural uyum (IC) ile ilgili
olabilir. Bir dinleyicinin önünde ve arkasindaki hoparlör
çiftleri için, interaural uyunz genellikle dogrudan kanal
arasi uyum (lCC) ilgilidir ki böylece BCC tarafindan üçüncü
ses kanali farki ölçümü olarak düsünülür. ICTD, ICLD ve ICC
zamanin bir fonksiyonu olarak altbantlarda tahmin edilir.
Kullanilan spektral ve geçici çözünürlügün her ikisi de
algilama ile motive edilir.
B.Ses kaynaklarinin parametrik birlesik kodlamasi
Bir BCC sifre çözücü bit mono sinyal alarak ve düzenli
zaman araliklarinda altbant ve kanal çifti basina bir tekli
spesifik ICTD, ICLD ve ICC isareti sentezleyerek birçok
kanalli ses sinyalini herhangi bir isitsel uzamsal imaj ile
üretebilmektedir. Genis yelpazede bir ses materyali
algilanan isitsel uzamsal imajin, büyük ölçüde ICTD, ICLD
ve ICC ile belirlendigi anlamina gelir. Bu nedenle, Sekil
l'deki karistirici girdisi gibi "temiz" kaynak sinyalleri
s(n) gerektirmeye karsi olarak, gerçek kaynak sinyallerini
karistiriciya saglama durumu için oldugu gibi karistirici
çiktisinda benzer ICTD, ICLD ve ICC ile sonuçlanacaklari
özellige sahip sadece sözde-kaynak sinyallere $(n) ihtiyaç
duymaktayiz..$(n) üretimi için üç amaç vardir
. giun, bir karistiriciya saglanirsa, karistirici çikti
kanallari, sanki si(n) karistiriciya saglanmis gibi
yaklasik olarak ayni uzamsal isaretlere (ICLD, ICTD, ICC)
sahip olacaktir.
. .%(n), orijinal kaynak sinyalleri s(n) hakkinda
olabildigince az bilgi ile üretilecektir (çünkü amaç
düsük bit hizli yan bilgiye sahip olmaktir).
. &(n), minimum miktarda sinyal bozulmasinin ortaya
koyulacagi sekilde iletilen toplam sinyalden s(n)
üretilir.
Önerilen semayi türetmek için bir stereo karistiriciyi (M =
2) ele almaktayiz. Genel durum üzerinden bir diger
sadelestirme ise sadece genlik ve gecikme kaydirmanin
karistirma için uygulanmasidir. Ayrik kaynak sinyalleri
sifre çözücüde mevcut olmus olsaydi, bir stereo sinyal
Sekil 4'te gösterildigi üzere karistirilabilir, yani
96101) "" îai'si(n_ci) X201): Ibisioîhdi)
Bu durumda, sahne açiklama vektörü S(n), karistirma
parametrelerini belirleyen sadece kaynak yönlerini kapsar,
burada T, bir vektörün transpozudur. Karistirma
parametreleri için, notasyon kolayligi adina zaman
indeksini göz ardi ettigimizi dikkate alin.
Karistiriciyi kontrol etmek için daha kolay parametreler
zaman ve seviye farkidir, Ti ve ALi, bunlar, asagidaki
tarafindan ai, bi, ci, and di ile baglantilidir
1061/20 _ '
a] = bi = 10(Gi+ALi)/20a
burada Gi, dB'de bir kaynak kazanimidir.
Asagida, girdi kaynak sinyallerinin si(n) bir fonksiyonu
olarak stereo karistirici çiktisina ait ICTD, ICLD ve
sinyallerinin ICTD, ICLD ve ICC'yi (karistirma
parametreleri ile birlikte) belirledigine dair isaret
verecektir. $(n), tanimlanan kaynak sinyalleri
özelliklerinin orijinal kaynak sinyallerinin ilgili
özelliklerine yaklasacagi sekilde daha sonra üretilirler.
B1 Karistirici çiktisinin ICTD, ICLD ve ICC'si
Isaretler, altbantlarda ve zamanin bir fonksiyonu olarak
tahmin edilir. Asagida, kaynak sinyallerinin si(n) sifir
ortalamali ve karsilikli olarak bagimsiz oldugu varsayilir.
Karistirici çiktisinin (2) altbant sinyallerinin bir çifti
îiÜÜ veîzûn olarak gösterilir. Notasyon basitligi adina
zaman alani ve altbant alan sinyalleri için ayni zaman
indeksini kullandigimizi unutmayiniz. Ayni zamanda, hiçbir
altbant indeksi kullanilmamaktadir ve açiklanan
analiz/isleme her bir altbanta bagimsiz olarak uygulanir.
Iki karistirici çikti sinyallerinin altbant gücü söyledir
burada $(n), kaynagin si(n) bir altbant sinyalidir ve E{.},
kisa zaman beklentisini göstermektedir, ör.
E{îf(n)} =g "“Znêizm› .(6) ~
burada K, hareket etme ortalamasini belirler. Altbant güç
degerlerinin E {s2(n)}, her bir kaynak sinyali için
spektral zarfi zamanin bir fonksiyonu olarak gösterdigini
unutmayiniz. ICLD, AL(n);
ZZ.be{îf(n»}
korelasyon fonksiyonu,
tahmin edilir. ICC, c(n), suna göre hesaplanir
c(n) = mgx
yüksek tepeni konumu hesaplanir,
Simdi asil soru, normallestirilen çapraz-korelasyon
fonksiyonunun, karistirma parametrelerinin bir fonksiyonu
olarak nasil hesaplanabilecegidir. (2) ile birlikte, (8) su
sekilde yazilabilir
JE{ZMa.. s.- (n - c..)}E{Z,.=ib.. s,- (n -a',-›}
ki bu suna esittir
Z” aßiEßfmndi-(mdi - T..)
burada normallestirilen oto-korelasyon fonksiyonu @(n,e);
ve Ti = di - ci olur. Verilen (11) ile (12)'yi hesaplamak
için, sinyallerin gecikmelerin dikkate alinan araligi
içinde genis anlamda duragan olduklarinin varsayilmis
oldugunu unutmayiniz, yani
E{î,-2(n)}= E{Fzz(n-Cz)}
E{3}2(")} =E{3:2("-di)}
Iki kaynak sinyali için bir sayisal örnek, ICTD, ICLD ve
'te gösterilir. Sekil 5'in üst, orta ve alt paneli,
AL (n), T(n), ve c(n) 'yi sirasiyla, iki kaynak sinyallerinin
altbant gücünün oraninin bir fonksiyonu olarak, farkli
karistirma parametreleri (4) ALI, ALZ, Tl ve T2 için a =
sadece bir kaynagin gücü oldugunda (a = 0 ya da a = 1),
E{ Slzm gösterir. Altbantta
hesaplanan AL(n) ve T(n)'nin karistirma parametrelerine
(ALI , ALZ, T1, T2) esit oldugunu dikkate aliniz.
B.2Gerekli yan bilgiler
kaynaklarin E{glz (n) } (6) kisa zamanli altbant gücüne
baglidir. ICTD (10) ve ICC (9) hesaplamasi için gerekli
olan normallestirilen altbant çapraz korelasyon fonksiyonu
©(n,d) (12), E{gý(n)}'ye ve ek olarak her bir kaynak
sinyali için normallestirilen altbant oto-korelasyon
fonksiyonuna, ®i(n, e) (13), baglidir. @(n,d)'nin
maksimumu, mini{Ti} Sdîmaxi{Ti} araliginda bulunur.
Karistirici parametresine Ti = di-ci' sahip kaynak 1' için,
kaynak sinyali altbant özelliginin ®i(n, e) (13) gerekli
oldugu ilgili aralik söyledir
m;n{Ti}-nse smsix{T;}-Ti (14)
altbant özelliklerine E{gp(n)} ve ®i(n, e) bagli oldugundan,
prensipte bu kaynak sinyali altbant özelliklerini yan bilgi
olarak iletilmeleri gerekir. Diger herhangi türdeki
karistiricinin (ör. etkilere sahip karistirici, dalga alani
sentezi karistirici/konvolüter, Vb.) benzer özelliklere sahi
oldugunu ve böylece bu yan bilginin açiklanandan baska
karistiricilar kullanildiginda da kullanisli oldugunu
varsaymaktayiz. Yan bilginin miktarini azaltmak için, sifre
çözücüde bir dizi öntanimli oto korelasyon fonksiyonlari
depolanabilir ve kaynak sinyali özelliklerine en yakin
sekilde eslesenleri seçmek için sadece indeksler
iletilebilir. Algoritmamizin bir birinci versiyonu, (14)
araliginda ®i(n, e) = 1 olarak kabul eder ve böylece (12),
yan bilgi olarak sadece altbant güç degerleri (6)
kullanilarak hesaplanir. Sekil 5'te gösterilen veri, ®i(n,
e) = 1 olarak varsayilarak hesaplanmistir.
Yan bilginin miktarini azaltmak için, kaynak sinyallerinin
ilgili dinamik araligi sinirlidir. Her seferinde, her bir
altbant için en güçlü kaynagin gücü seçilir. Tüm diger
kaynaklarin ilgili altbant gücünü, an güçlü altbant gücünden
daha düsük olan bir degerde 24dB sinirlamayi yeterli bulduk.
Böylece nicemleyicinin dinamik araligi 24 dB'ye
sinirlandirilabilir.
Kaynak sinyallerinin bagimsiz oldugunu kabul ederek,
sifre çözücü, tüm kaynaklarin altbant gücünün toplamini
E{52(n)} olarak hesaplayabilir. Böylece, prensipte sifre
çözücüye sadece Mi-l kaynaklarinin altbant gücü degerlerini
iletmek yeterli iken geri kalan kaynagin altbant gücü yerel
olarak hesaplanabilir. Bu fikri dikkate alarak, yan bilgi
hizi, birinci kaynagin gücüne iliskin indekslere 2 S i S M
sahip kaynaklarin altbant gücünü ileterek hafifçe
azaltilabilir,
1;{Si (n)}
Daha önceden açiklandigi üzere dinamik aralik
sinirlandirmanin (l5)'ten önce gerçeklestirildigini dikkate
alin. Alternatif olarak, altbant güç degerleri, bir
kaynagin altbant gücüne (15) iliskin normallestirmeye karsi
olarak toplam› sinyal altbant gücüne iliskin olarak
normallestirilebilir. 44.l kHz'lik bir örnekleme frekansi
için, 20 altbant kullanmaktayiz ve her bir altbant için her
12 ms'de bir AßiLn) (2 5 i S M) iletmekteyiz. 20 altbant,
isitsel sistemin spektral çözünürlügünün yarisina tekabül
eder ( bir altbant iki "kritik bant genisligi"
genisligindedir). Resmi olmayan tecrübeler, 20'den fazla
altbant örnegin 40 altbant kullanilmasiyla sadece ufak bir
gelisme elde edildigini göstermektedir. Altbantlarin ve
altbant bant genisliklerinin sayisi isitsel sistemin zaman
ve frekans çözünürlügüne göre seçilmektedir. Semanin, bir
düsük kaliteli uygulamasi en az üç altbant gerektirir
(düsük, orta, yüksek frekanslar).
Özel bir düzenlemeye göre, altbantlarin farkli bant
genislikleri vardir, düsük frekanslardaki altbantlar,
yüksek frekanslardaki altbantlardan daha küçük bant
genisligine sahiptir.
Ilgili güç degerleri, yaklasik olarak 3(M - JJ kb/s bit
hizi ile sonuçlanan, [2]'de açiklanan ICLD nioemleyiciye
benzer olan bir sema ile nicemlenir. Sekil 6, yan bilgi
üretiminin islemini göstermektedir (Sekil 2'deki "Yan bilgi
üretimi" blokuna tekabül eder).
Yan bilgi hizi, her bir kaynak sinyali için aktiviteyi
analiz ederek ve aktif ise sadece"kaynak ile iliskili yan
bilgiyi ileterek ilaveten azaltilabilir.
Altbant güç degerlerini E{gp(n)} istatistiksel bilgi olarak
iletmeye karsi olarak, kaynak sinyallerinin spektral
zarflarini gösteren diger bilgiler iletilebilir. Örnegin,
dogrusal öngörüsel kodlama (LPC) parametreleri iletilebilir
ya da kafes filtre parametreleri ya da hat spektral çift
(LSP) parametreleri gibi ilgili diger parametreler
iletilebilir. Her bir kaynak sinyalinin LPC parametrelerini
tahmin etme islemi Sekil 7'de gösterilir.
Bßâ(n) hesaplama
Sekil 8, toplam sinyal (l) dikkate alinarak kaynak
sinyallerini yeniden olusturmak üzere kullanilan islemi
gösterir. Bu islemi Sekil 2'deki "Sentez" blokunun
parçasidir. Bireysel kaynak sinyalleri, toplam sinyalin her
bir altbandlni gi(n) ile ölçekleyerek ve darbe tepkisine
hi(n) sahip bir de-korelasyon filtresi uygulayarak geri
kazanilir.
burada *, dogrusal evrgsim operatörüdür ve E{Gp(n)}, yan
bilgi ile sunun tarafindan hesaplanir
De-korelasyon filtreleri hi(n), tamamlayici tarak
filtreleri, tam geçirgen filtreler, gecikmeler ya da
rastgele darbe tepkisine sahip filtreler kullanilabilir.
De-korelasyon isleminin amaci, bireysel dalga biçimlerinin
nasil algilandiklarini modifiye etmeden sinyaller
arasindaki korelasyonu azaltmaktir. Farkli de-korelasyon
teknikleri farkli olgulara neden olur. Tamamlayici tarak
filtreleri renklendirmeye yol açar. Tarif edilen
tekniklerin tamami "ön-ekolar" gibi olgulara yol açan
zamanda geçicilerin enerjisini yaymaktadir. Olgular için
potansiyellerini dikkate alarak, de-korelasyon teknikleri
mümkün oldugunca küçük uygulanmalidir. Bir sonraki bölüm,
bagimsiz sinyallerin â(n) basit üretiminden daha az de-
korelasyon islemi gerektiren teknikleri ve stratejileri
açiklamaktadir.
Sinyallerin 5,(n) üretimi için bir alternatif sema Sekil
9'da gösterilir. Ilk olarak s(n)'nin. spektrumu, dogrusal
öngörü hatasini e(n) hesaplama yardimiyla düzlestirilir.
Sifreleyicide tahmin edilen LPC filtreleri göz önüne
alinarak, fi, ilgili tüm kutuplu filtreler sunun tersine z-
dönüstürmesi olarak hesaplanir
Ortaya çikan tüm kutuplu filtreler, Ã, kaynak sinyallerinin
spektral zarfini göstermektedir. LPC parametrelerinden
baska yan bilgiler iletilirse, LPC parametrelerinin ilk
olarak yan bilginin bir fonksiyonu olarak hesaplanmasi
gerekir. Diger semada oldugu gibi, de-korelasyon filtreleri
hi, kaynak sinyallerini bagimsiz yapmak üzere kullanilir.
HLUYGULANABILIR KISITLAMALARI DIKKATE ALAN UYGULAMALAR
Bu bölümün birinci kisminda, bir stereo ya da çok kanalli
karistirici olarak bir BCC sentezi kullanan bir uygulama
örnegi verilmektedir. Bu gibi bir BCC tipi sentez semasi,
özellikle ilginçtir. Kaynak sinyalleri â(n), bu durumda
dogrudan hesaplanmaz ve bu azaltilmis hesapsal karmasiklik
ile sonuçlanir. Ayni zamanda bu sema, kaynak sinyallerinin
a(n) dogrudan hesaplandigi durum için olandan efektif
olarak daha az de-korelasyon gerekli oldugundan daha iyi
ses kalitesi potansiyeli sunmaktadir.
Bu bölümün ikinci kismi, önerile sema herhangi bir
karistirici ile uygulandigi ve aslinda hiçbir de-korelasyon
uygulanmadigi hususlari ele alir: Bu gibi bir sema, de-
korelasyon isleme bulunan bir semadan daha düsük
kompleksiteye sahiptir ancak ele alinacagi üzere baska
Ideal olarak, üretilen â(n)'nin bagimsiz oLarak ele
alinacagi sekilde de-korelasyon isleme uygulamak
istenebilir. Bununla birlikte, de-korelasyon isleme ortaya
konan olgular bakimindan problematik oldugundan, de-
korelasyon isleme mümkün olugu kadar az uygulanmak
istenebilir. Bu bölümün üçüncü kismi, problematik de-
korelasyon islemenin miktarinin, üretilen â(n) bagimsizmis
gibi faydalar saglarken nasil azaltilabilecegini ele
almaktadir.
A.â(n)'nin dogrudan hesaplamasi olmadan uygulama
Karistirma, g(n)'ni dogrudan hesaplamasi olmaksizin
iletilen toplam sinyale (l) dogrudan uygulanir. Bir BCC
sentezi semasi bu amaçla kullanilir. Asagida, stereo
durumunu dikkate almaktayiz ancak açiklanan tüm prensipler,
çok kanalli ses sinyallerinin üretimi için de
uygulanabilir.
Toplam sinyali isleme için uygulanan bir stereo BCC sentezi
semasi (ya da bir "parametrik stereo" semasi) Sekil lO'da
gösterilir. Yapilmak. istenen, BCC sentez semasinin Sekil
4'te gösterildigi üzere bir karistiricinin çikti sinyali
gibi benzer sekilde algilanan bir sinyal üretmesidir. Bu,
BCC sentez semasi çikti kanallari arasindaki ICTD, ICLD ve
görünen ilgili isaretlere benzer oldugunda böyledir.Önceden açiklanan daha genel sema için oldugu gibi ayni yan
bilgi kullanilir ve böylece sifre çözücünün, kaynaklarin
kisa zamanli altbant güç degerlerini E Lg2(n)}
hesaplamasini saglar. E Lg2(n)}'yi dikkate alarak, Sekil
lO'daki kazanim faktörleri gl ve 92 söyle hesaplanir
2,_1a a.E{s (nn
9201) = (18)
çikti altbant gücü ve ICLD'nin (7) Sekil 4'teki karistirici
için oldugu gibi ayni olacaklari sekilde. ICTD T(n), (10)'a
göre hesaplanir, Sekil lO'daki gecikmeleri DJ ve D2
belirleyerek,
belirlemeye göre hesaplanir. iDe-korelasyon isleme (ICC
sentezi) [1]'de açiklanmaktadir. Karistirici çikti
kanallarina de-korelasyon isleme uygulamanin avantajlari,
bagimsiz $(n) üretmeye uygulamaya kiyasla sunlardir:
0 Genellikle kaynak sinyallerinin M sayisi ses çikti
kanallarinin N› sayisindan daha büyüktür. Böylece,
üretilmesi gereken bagimsiz ses kanallarinin sayisi, .M
kaynak sinyallerini de-korelasyon yapmaya karsi olarak N
çikti kanallarini de-korelasyon yaparken daha az olur.
. Siklikla, N çikti kanallari, korelasyonlanir (ICC > 0) ve
bagimsiz M ve N kanallarini üretmek için gerekli olandan
daha az de-korelasyon isleme uygulanabilir.
Daha az de-korelasyon islemeden dolayi daha iyi ses
kalitesi beklenir.
En iyi ses kalitesi, karistirici parametreleri
a3+b3=1,
yani Gi = C) dB olacagi sekilde kisitlandiginda
beklenmektedir. Bu durumda, iletilen toplam sinyaldeki (1)
her kaynagin gücü, karisik sifre çözücü çikti sinyalindeki
ayni kaynagin gücü ile aynidir. Sifre çözücü çikti sinyali
(Sekil 10), karistirici çikti sinyali (Sekil 4) bir` BCC
sifreleyici/sifre çözücü tarafindan bu durumda sifrelenmis
ya da çözülmüs gibi aynidir. Böylece, ayni zamanda benzer
kalite beklenebilir.
Sifre çözücü sadece her kaynagin görünmesi gerektigi yönü
belirlemez ayni zamanda her kaynagin kazanimi
0,2 +b,2 >1
çesitlenebilir. Kazanim, (Gi > 0 dB) seçerek
a,2+b,2 <1
arttirilir ve (Gi < 0 dB) seçilerek azaltilir.
B.De-korelasyon isleme kullanmama
Bir önceki tarif edilen teknigin kisitlamasi, karistirmanin
bir BCC sentez semasi ile yürütülmesidir. Sadece ICTD, ICLD
ve ICC sentezini degil ayni zamanda ilaveten BCC sentezi
içinde efektler islemeyi uygulama hayal edilebilir.
Ancak, var olan karistiricilarin ve efektler islemcilerinin
kullanilabilecegi istenebilir. Bu ayni zamanda dalga
biçimli sentez karistiricilari da içerir (genellikle
karistiricilari ve efektler* islemcilerini kullanmak için,
â(n), dogrudan hesaplanir ve orijinal kaynak sinyalleriymis
gibi kullanilir.
De-korelasyon isleme (hi(n) = ö(n) in (16)) uygulanmazken
iyi ses kalitesi de elde edilebilir. De-korelasyon
islemeden dolayi ortaya çikan olgular ile kaynak
sinyallerinin îiün korelasyonlu olmasindan dolayi olgular
arasinda bir anlasmadir. Herhangi bir de-korelasyon isleme
kullanilmadiginda ortaya çikan isitsel uzamsal imaj
dengesizlikten [l] muzdarip olabilir. Ancak karistirici,
yansiticilar ya da diger efektler kullanildiginda ve bu
yüzden de-korelasyon islemeye daha az ihtiyaç oldugunda
kendisine bazi de-korelasyonlari getirebilir.
â(n), de-korelasyon isleme olmadan üretilirse, kaynaklarin
seviyesi diger kaynaklara iliskin olarak karistirildiklari
yöne baglidir. Bu seviyede bagimlilik için dengeleme yapan
bir algoritmasi bulunan mevcut karistiricilardaki genlik
kaydirma algoritmalarinin yerini degistirerek karistirma
parametrelerindeki gürültü. bagliliginin olumsuz etkisinin
üstesinden gelinebilir. Bir seviye dengeleme genlik
algoritmasi Sekil ll'de gösterilir ve bu karistirma
parametrelerindeki kaynak seviyesini dengelemeyi
hedeflemektedir. Bir konvansiyonel genlik kaydirma
algoritmasinin kazanim faktörlerini dikkate alarak (ör.
Sekil 4), ai ve bi, Sekil ll'deki agirliklar, 6, ve bi
sununla hesaplanir
E{(Zi=,b.-S.-(n)) }
Unutmayiniz ki &1 ve En, çikti altbant gücünün, $(n) her
altbantta bagimsizmis gibi ayni olacagi sekilde hesaplanir.
Önceden bahsedildigi üzere, bagimsiz â(n)'nin üretimi
problematiktir. Burada stratejiler, @tüm bagimsizmis gibi
verimli sekilde benzer bir efekt elde ederken, daha az de-
korelasyon uygulamak üzere açiklanir.
Sekil 12'de gösterildigi üzere örnegin bir dalga biçimli
sentez sistemini düsünün. 51, 52, ..., ngW : 6) için arzu
edilen sanal kaynak konumlari gösterilir. M tamamen
bagimsiz sinyalleri üretmeksizin â(n) (16) hesaplamak üzere
bir strateji:
tBirbirlerine yakin olan kaynaklara tekabül eden kaynak
indekslerinin gruplarini üretin. Örnegin Sekil 8'de
bunlar söyle olabilir: {l}, {2, 5}, {3}, ve {4, 6}.
ZHer seferinde, her bir altbantta en güçlü kaynagin
kaynak indeksini seçiniz.
imax = mêXE{5(n)} (21)
imax, i.e. hi(n) = ö(n) içeren grubun kaynak indeksleri
parçasi için herhangi bir de-korelasyon isleme
uygulamayiniz.
Açiklanan algoritma, en güçlü sinyal bilesenlerini en son
modifiye eder. Ilaveten, kullanilan farkli hi(n)'nin sayisi
azaltilir. De-korelasyon daha kolay oldugundan, daha az
bagimsiz kanalin üretilmesi gerektiginden bu bir
avantajdir. Açiklana teknik, stereo ya da çok kanalli ses
sinyalleri karistirildiginda da uygulanabilir.
V.KALITE VE BIT HIZI BAKIMINDAN ÖLÇEKLENEBILIRLIK
Önerilen sema sadece, bir konvansiyonel mono ses kodlayici
ile kodlanabilen tüm kaynak sinyallerinin özetini iletilir.
Herhangi bir mono geriye dönük uyumluluk gerekmediginde ve
birden fazla ses dalga biçiminin iletimi/depolamasi için
mevcut kapasite oldugunda, önerilen sema birden fazla
iletim kanali ile kullanim için ölçeklenebilir. Bu, belirli
kaynak sinyallerinin farkli altsetleri bulunan birkaç
toplam sinyal üreterek uygulanabilir yani kaynak
sinyallerinin her bir alt setine önerilen kodlama semasi
bireysel olarak uygulanir. Iletilen ses kanallarinin sayisi
arttikça ses kalitesinin artmasi beklenir çünkü her
iletilen kanaldan de-korelasyon ile daha az bagimsiz kanal
üretilmek zorunda olur (bir iletilen kanalin durumuna
kiyasla).
VLMEVCUT STEREO VE SURROUND SES FORMATLARINA GERIYE DÖNÜK
Asagidaki ses dagitim senaryosunu. göz önünde bulundurun.
Bir tüketici, maksimum kalite bir stereo ya da çok kanalli
surround sinyal elde etmektedir (ör. bir ses CD, DVD ya da
çevrim içi müzik magazasi araciligiyla). Amaç, standart
stereo/surround. pleybek kalitesinde taviz vermeksizin
müsteriye opsiyonel olarak, elde edilen ses içeriginin bir
özel karisimini üretme esnekligini saglamaktir.
Bu, of .â(n)'nin. hesaplanmasina. belirli stereo ya da çok
kanalli ses sinyalinin bir fonksiyonu olarak izin veren yan
bilginin bir bit akisini tüketiciye (ör. bir çevrim içi
müzik markette opsiyonel satin alma seçenegi olarak)
saglama ile uygulanabilir. Tüketicinin karistirma
algoritmasi daha sonra â(n)'ye uygulanir. Asagida, stereo
ya da çok kanalli ses sinyalleri dikkate alinarak â(n)'yi
hesaplamak için iki olasilik açiklanmaktadir.
ALKaynak sinyallerinin toplamini alicida tahmin etme
Önerilen kodlama semasinin bir stereo ya da çok kanalli ses
iletimi ile en kolay kullanma sekli Sekil l3'te gösterilir,
burada yi(n) (1 5 i S L), L belirli stereo ya da çok
kanalli ses sinyalinin kanallaridir. Kaynaklarin toplam
sinyali iletilen kanallari bir tekli ses kanalina
downmiksleme ile tahmin edilir. Downmiksleme, kanallarin
yi(n) (1 5 i_ S L) toplamini hesaplama yardimiyla
gerçeklestirilir ya da daha sofistike teknikler
uygulanabilir.
En iyi performans için, kaynak sinyallerinin seviyesinin,
kaynak sinyalleri arasindaki güç oranini kaynaklarin
bununla belirli stereo ya da çok kanalli sinyalde
kapsandigi güç oranina yaklasacagi sekilde E{gs(n)}
tahmininden önce uyarlanmasi tavsiye edilir. Bu durumda,
iletilen kanallarin downmiksi, kaynaklarin. (l) toplaminin
nispeten iyi bir tahminidir (ya da bunun ölçekli bir
versiyonu).
Bir otomatiklesmis islem, yan bilginin hesaplanmasindan
önce sifreleyici kaynak sinyali girdilerinin si(n)
seviyesini ayarlamak üzere kullanilabilir. Bu islem zamanda
uyarlanabilir olarak, her bir kaynak sinyalinin belirli
stereo ya da çok kanalli sinyalde kapsandigi seviyeyi
tahmin eder. Yan bilginin hesaplanmasindan önce, her kaynak
sinyalinin seviyesi artik zamanda uyarlanabilir olarak,
kaynagin stereo ya da çok kanalli ses sinyalinde kapsandigi
seviyeye esit olacagi sekilde ayarlanir.
B.Iletilen kanallari tek tek kullanma
Sekil 14, stereo ya da çok kanalli surround sinyal iletimli
önerilen semanin farkli bir uygulamasini gösterir. Burada,
iletilen kanallar downmikslenmez ancak â(n)'nin üretimi
için tek tek kullanilir. En genel haliyle, $(n)'nin altbant
sinyalleri sununla hesaplanir
burada wl(n), iletilen kanallarin altbantlarinin spesifik
dogrusal kombinasyonlarini belirleyen agirliklardir.
Dogrusal kombinasyonlar, â(n)'nin çoktan mümkün oldugu
kadar dekorelasyonlanacagi sekilde seçilir. Böylece, hiçbir
ya da sadece küçük bir miktarda de-korelasyon islemi
uygulanmasi gerekir ki bu daha önce ele alindigi üzere
avantajlidir.
VHUYGULAMALAR
Daha önce halihazirda, önerilen kodlama semasi için
birtakim uygulamalardan bahsetmistik. Burada, bunlari
özetliyor ve birkaç uygulamadan daha bahsediyor olacagiz.
Alwiksleme için ses kodlama
Stereo, çok kanalli ya da dalga alani sentez ses
sinyallerine mikslemeden önce ses kaynak sinyallerinin ne
zaman depolanmasi ya da iletilmesi gerekse önerilen sema
uygulanabilir. Önceki teknik ile, bir mono ses kodlayici
her bir kaynak sinyaline bagimsiz olarak uygulanabilir ve
bu kaynaklarin sayisi ile ölçeklenen bir bit hizi ile
sonuçlanir. Önerilen kodlama semasi, bir tekli mono ses
kodlayici arti nispeten düsük bit hizli yan bilgi bulunan
yüksek sayida ses kaynak sinyallerini sifreleyebilir. Bölüm
V'de tarif edildigi üzere, ses kalitesi, eger hafiza
kapasitesi bunu yapmaya müsait ise birden fazla iletilmis
kanal kullanarak gelistirilebilir.
BNEta-veri ile re-miksleme
Bölüni VI'da tarif edildigi üzere, mevcut stereo ve çok
kanalli ses sinyalleri, ilave yan bilginin yardimiyla re-
mikslenebilir (yani "meta-veri"). Sadece optimize stereo ve
çok kanalli miksli ses içerigi satmaya karsi olarak, meta
veri bir kullaniciya kendi stereo ve çok kanalli müzigini
re-mikslemesine izin vererek satilabilir. Bu örnegin,
karaoke için bir sarkida vokalleri azaltmak için ya da
müzik ile birlikte bir enstrüman Çalmak için spesifik
enstrümanlari kismak için kullanilabilir.
Depolama bir sorun olmasa bile, açiklanan sema, müzigin
kisiye özel mikslemesini mümkün kildigi için çok cazip
olabilir. Çünkü müzik endüstrisinin çoklu parça kayitlarini
hiçbir zaman birakmak istemeyecek olmasi olasidir. Kötüye
kullanim açsisindan çok fazla tehlike vardir. Önerilen
sema, çoklu parça kayitlardan vazgeçmeden re-miksleme
yapabilmeyi mümkün kilar.
Dahasi, stereo ya da çok kanalli sinyaller re-mikslenir re-
mikslenmez belirli derecede bir kalite azalmasi meydana
gelir ve re-mikslerin yasal olmayan dagitimini daha az
cazip kilar.
c. Dalga alani sentez dönüsümüne stereo/çok kanal
Bölüm VI'da açiklanan sema için diger bir uygulama asagida
açiklanmaktadir. Hareketli resimlere eslik eden stereo ve
çok kanalli (ör. 5.1 surround) ses yan bilgi eklenerek
dalga alani sentez isleme için genisletilebilir. Örnegin,
Dolby AC-3 (DVD'de ses) dalga alani sentez sistemleri için
.1 geriye dönük uyumlu ses kodlama için genisletilebilir,
yani DVDler 5.1 surround sesi konvansiyonel eskiden kalan
oynaticilarda ve dalga alani sentez sesi yan bilginin
islemesini destekleyen yeni nesil oynaticilarda oynatir.
VIII.ÖZNE.L DEGERLENDIRME
Bölüm IV-A ve IV-B'de önerilen algoritmalarin bir gerçek
zamanli sifre çözücüsünü gerçeklestirdik. Bir FFT-tabanli
STFT filtre bankasi kullanilir. Bir lOZ4-nokta FFT ve bir
kullanilir. Spektral katsayilar, her` bir grubun, esdeger
dikdörtgen bant genisliginin (ERB) iki kati bir bant
genisligine sahip sinyali temsil edecegi sekilde birlikte
gruplanir. Resmi olmayan dinleme, ses kalitesinin daha
yüksek frekans çözünürlügü seçildiginde dikkate deger
sekilde gelismedigini açiga çikarmistir. Daha düsük bir
frekans çözünürlügü, iletilecek daha az parametre ile
sonuçlandigindan avantajlidir.
Her bir kaynak için genlik/gecikme kaydirma ve kazanim tek
tek ayarlanabilir. Algoritma, 12 14 parçali birçok çok
parçali ses kayitlarinin kodlamasi için kullanilmistir.
Sifre çözücü, 5.1 surround mikslemenin bir vektör tabanli
genlik kaydirma (VBAP) karistirici kullanmasina izin verir.
Her kaynak sinyalinin yönü ve kazanimi ayarlanabilir.
Yazilim, kodlu kaynak sinyalinin miksleme ile orijinal
ayrik kaynak sinyallerini miksleme arasinda çalismasin
sirasinda geçis yapilmasina izin verir.
Rahat dinleme genellikle, eger her bir kaynak için sifir
dB'nin bir kazanimi Gi kullanilirsa kodlu ya da orijinal
kaynak sinyallerini karistirma arasinda çok az ya da hiçbir
fark ortaya koymaz. Kaynak kazanimlari ne kadar
çesitlenirse o kadar fazla yapay olgular meydana gelir.
Kaynaklarin hafif güçlendirilmesi ya da azaltilmasi (ör. ±
6 dB'ye kadar) halen iyi ses verir. Kritik bir senaryo, tüm
kaynaklarin bir tarafa mikslenmesi ve sadece bir tekli
kaynagin diger karsi tarafa mikslenmesidir. Bu durumda ses
kalitesi spesifik miksleme ve kaynak sinyallerine bagli
olarak azalabilir.
Örnegin çok parçali kayitin kanallari gibi ses kaynak
sinyallerinin, birlesik, kodlamasi için› bir kodlama semasi
önerilmistir. Amaç, kaynak sinyali dalga biçimlerini yüksek
kalite ile kodlamak degildir, bu durumda birlesik kodlama,
ses kaynaklari genellikle bagimsiz oldugundan minimal
kodlama kazanimi verebilir. Amaç, kodlu kaynak sinyalleri
mikslendiginde yüksek kaliteli bir ses sinyali elde
edilmesidir. Kaynak sinyallerinin istatistiksel
Özelliklerini, miksleme semalarinin ve uzamsal isitmenin
özelliklerini ele alarak, önemli kodlama kazanim
gelisiminin, kaynak sinyallerini birlesik kodlayarak elde
edildigi gösterilmistir.
Kodlama kazanim gelisimi, sadece bir ses dalga biçiminin
iletilmesinden kaynaklanmaktadir.
Ilaveten, nihai karistirilan sinyalin uzamsal algisini
belirleyen ilgili faktörler olan kaynak sinyallerinin
istatistiksel Özelliklerini temsil eden yan bilgiler
Yan bilgi hizi kaynak sinyali basina yaklasik 3 kbs'dir.
Örnegin stereo, çok kanalli ya da dalga alani sentezi
karistiricilari gibi, kodlu kaynak sinyalleri ile herhangi
Daha yüksekr bit hizi ve kalitesi için birden fazla ses
kanalini ileterek önerilen semayi ölçekleme kolay bir
yoldur. Dahasi, belirli stereo ya da çok kanalli ses
sinyalinin re-mikslenmesine olanak taniyan, semanin bir
varyasyonu öne sürülmüstür (ve hatta ses formatinin
degismesi, ör. stereodan çok kanalli ya da dalga alani
sentezine).
Öne sürülen semanin uygulamalari çogaltilir. Örnegin, MPEG-
4, birden fazla "dogal ses nesnesi" (kaynak sinyali)
iletilmek sorunda oldugunda bit hizini azaltmak için öne
sürülen sema ile genisletilebilir. Ayni zamanda öne sürülen
sema, dalga alani sentez sistemleri için içerigin kompakt
gösterimini önerir. Bahsedildigi üzere, mevcut stereo ya da
çok kanalli sinyaller, kullanicinin kendi begenisine göre
sinyalleri re-mikslemesine izin vermek için yan bilgiler
ile tamamlanabilir.
REFERANSLAR
tezi, Isviçre Lozan Federal Teknoloji Enstitüsü (EPFL),
2004, Ph.D. Tez No. 3062.
Claims (3)
1.Çok sayida kaynak sinyallerini (sl(n),sZ(n),-- ,sM(n)) sifreleme yöntemi olup, asagidakileri içermektedir: çok sayida kaynak sinyalleri (sl(n),sZ(n),-",sM(n)) için, çok sayida kaynak sinyallerinin kaynak sinyallerinin (sl(n),52(n),'°',sM(n)) spektral zarflarini gösteren istatistiksel bilgileri hesaplamayi ki burada istatistiksel bilgi ilaveten, çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir albandi için spesifik. bir kaynak sinyalinin bir normallestirilmis altbant oto-korelasyon fonksiyonu ((®i(n,e)) hakkinda bilgi içerir; ve kaynak sinyallerinin (sl(n),52(n), - ,sM(n)) spektral zarflarini gösteren istatistiksel bilgiyi ve çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir albandi için normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden (sl(n),sZ(n),~--,sM(n)) türetilen bir ses sinyali için meta veri olarak iletme.
2.Birden fazla sayida kaynak sinyalini (sl(n),sZ(n),-~~,sM(n)) sifreleme cihazi olup, burada çok sayida kaynak sinyalleri (sl(n),52(n),-",SM(n)) için, kaynak. sinyallerinin (sl(n),sZ(n),--~,sM(n)) spektral zarflarini gösteren istatistiksel bilgileri hesaplamak üzere çalismaktadir ki burada istatistiksel bilgi ilaveten, çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir altbandi için spesifik bir kaynak sinyalinin bir normallestirilmis altbant oto-korelasyon fonksiyonu ((®i(n,e)) hakkinda bilgi içerir; ve kaynak sinyallerinin (sl(n),52(n),- -,sM(n)) spektral zarflarini gösteren istatistiksel bilgiyi ve çok sayida kaynak sinyallerinin her bir kaynak sinyali için. ve çok sayida altbandin her bir altbandi için normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden (Sl(n),sZ(n),-",sM(n)) türetilen bir ses sinyali için meta veri olarak iletmek üzere çalismaktadir.
3.Istem 2'deki cihaz olup, burada hesaplama, çok sayida kaynak sinyallerini mikslemek üzere miksleme parametreleri tarafindan belirlenen bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri hesaplamayi içerir ve burada iletici, zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden türetilen bir ses sinyali için meta veri olarak iletmek üzere yapilandirilir. .Istem 2'deki cihaz olup, burada iletme, iletilen bilgi olarak, ön tanimli otokorelasyon fonksiyonlarinin bir depolanmis setinde bir ön tanimli otokorelasyon fonksiyonunu tanimlayan bir .Istem 2'deki cihaz olup, burada hesaplama, asagidaki denkleme dayanarak belirlenen bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonunu hesaplamayi içerir: m}n{:77}~ me smsmm- Ti- burada e, zaman araligidir, I , çok sayida kaynak sinyallerinin kaynak sinyalleri için karistirma parametreleri arasindan bir en küçük karistirma parametresidir, l { } kaynak sinyalleri için karistirma parametreleri arasindan bir` en büyük karistirma parametresidir' ve Ti, dikkate alinan spesifik kaynak sinyali için bir karistirma parametresidir. .Istem 2'deki cihaz olup, burada hesaplama, asagidaki denkleme dayanan bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonunu hesaplamayi içerir: burada ®(n,e), spesifik kaynak sinyalinin normallestirilmis altbant otokorelasyon fonksiyonudur, n, bir zaman indeksi, e, zaman araligi, E, bir beklenti operatörü, i, bir kaynak sinyalini tanimlayan bir indeks ve si, dikkate alinan spesifik kaynak sinyalidir. .Istem 2'deki cihaz olup, burada hesaplama, bir kaynak için, kaynak sinyallerinin ( sl(n),52(n), '~,sMKn)) spektral zarflarini, çok sayida altbantlarin her bir altbandi için bir altbant gücünü ya da kafes filtre parametrelerini ya da LPC parametrelerini ya da hat spektral çift parametrelerini gösteren istatistiksel bilgi olarak hesaplamayi içermekte ve burada iletme, kaynak sinyallerinin ( sl(n),52(n),'-',sMfn)) spektral zarflarini, her bir kaynak sinyali için çok sayida altbantlarin her bir altbandi için altbant güçlerini ya da kafes filtre parametrelerini ya da LPC parametrelerini ya da hat spektral çift parametrelerini meta veri olarak gösteren istatistiksel bilgi olarak iletmeyi içermektedir. .Istem 2'deki cihaz olup, burada hesaplayici, her seferinde ve her bir altbant için, en güçlü kaynagin gücünü seçmek ve tüm diger kaynaklarin ilgili altbant gücünü, bir nicemleyicinin bir dinamik. araligini sinirlandirmak için en güçlü altbant kaynagindan daha düsük olan bir 24dB degerinde alt sinirlamak üzere yapilandirilir.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP05101055A EP1691348A1 (en) | 2005-02-14 | 2005-02-14 | Parametric joint-coding of audio sources |
Publications (1)
Publication Number | Publication Date |
---|---|
TR201811059T4 true TR201811059T4 (tr) | 2018-08-27 |
Family
ID=34938725
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TR2018/11059T TR201811059T4 (tr) | 2005-02-14 | 2006-02-13 | Ses kaynaklarının parametrik birleşik kodlaması. |
Country Status (18)
Country | Link |
---|---|
US (12) | US8355509B2 (tr) |
EP (4) | EP1691348A1 (tr) |
JP (2) | JP5179881B2 (tr) |
KR (1) | KR100924577B1 (tr) |
CN (2) | CN101133441B (tr) |
AT (1) | ATE531035T1 (tr) |
AU (3) | AU2006212191B2 (tr) |
BR (5) | BR122018072508B1 (tr) |
CA (2) | CA2597746C (tr) |
ES (2) | ES2682073T3 (tr) |
HK (2) | HK1107723A1 (tr) |
IL (1) | IL185192A (tr) |
MX (1) | MX2007009559A (tr) |
NO (1) | NO338701B1 (tr) |
PL (1) | PL1844465T3 (tr) |
RU (1) | RU2376654C2 (tr) |
TR (1) | TR201811059T4 (tr) |
WO (1) | WO2006084916A2 (tr) |
Families Citing this family (85)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1691348A1 (en) | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US7840411B2 (en) * | 2005-03-30 | 2010-11-23 | Koninklijke Philips Electronics N.V. | Audio encoding and decoding |
AU2006266579B2 (en) * | 2005-06-30 | 2009-10-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
KR101218776B1 (ko) * | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
CN101410891A (zh) | 2006-02-03 | 2009-04-15 | 韩国电子通信研究院 | 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置 |
KR20080093422A (ko) * | 2006-02-09 | 2008-10-21 | 엘지전자 주식회사 | 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치 |
ATE527833T1 (de) * | 2006-05-04 | 2011-10-15 | Lg Electronics Inc | Verbesserung von stereo-audiosignalen mittels neuabmischung |
US8027479B2 (en) * | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
EP3236587B1 (en) * | 2006-07-04 | 2018-11-21 | Dolby International AB | Filter system comprising a filter converter and a filter compressor and method for operating the filter system |
ES2396072T3 (es) * | 2006-07-07 | 2013-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato para combinar múltiples fuentes de audio paramétricamente codificadas |
MX2008012251A (es) | 2006-09-29 | 2008-10-07 | Lg Electronics Inc | Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. |
RU2407072C1 (ru) * | 2006-09-29 | 2010-12-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов |
EP2084703B1 (en) * | 2006-09-29 | 2019-05-01 | LG Electronics Inc. | Apparatus for processing mix signal and method thereof |
EP2084901B1 (en) * | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
KR100891665B1 (ko) | 2006-10-13 | 2009-04-02 | 엘지전자 주식회사 | 믹스 신호의 처리 방법 및 장치 |
ATE539434T1 (de) * | 2006-10-16 | 2012-01-15 | Fraunhofer Ges Forschung | Vorrichtung und verfahren für mehrkanalparameterumwandlung |
CA2874454C (en) | 2006-10-16 | 2017-05-02 | Dolby International Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
CA2669091C (en) | 2006-11-15 | 2014-07-08 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
JP5394931B2 (ja) * | 2006-11-24 | 2014-01-22 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の復号化方法及びその装置 |
JP5081250B2 (ja) * | 2006-12-01 | 2012-11-28 | エルジー エレクトロニクス インコーポレイティド | 命令入力装置及び方法、メディア信号のユーザインタフェース表示方法及びその具現装置、並びにミックス信号処理装置及びその方法 |
EP2102858A4 (en) * | 2006-12-07 | 2010-01-20 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL |
JP5463143B2 (ja) | 2006-12-07 | 2014-04-09 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及びその装置 |
CN101578656A (zh) * | 2007-01-05 | 2009-11-11 | Lg电子株式会社 | 用于处理音频信号的装置和方法 |
KR101049143B1 (ko) | 2007-02-14 | 2011-07-15 | 엘지전자 주식회사 | 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법 |
CN101542597B (zh) * | 2007-02-14 | 2013-02-27 | Lg电子株式会社 | 用于编码和解码基于对象的音频信号的方法和装置 |
JP5285626B2 (ja) * | 2007-03-01 | 2013-09-11 | ジェリー・マハバブ | 音声空間化及び環境シミュレーション |
KR20080082916A (ko) * | 2007-03-09 | 2008-09-12 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 이의 장치 |
US8463413B2 (en) | 2007-03-09 | 2013-06-11 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
JP5161893B2 (ja) * | 2007-03-16 | 2013-03-13 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法及び装置 |
US8612237B2 (en) * | 2007-04-04 | 2013-12-17 | Apple Inc. | Method and apparatus for determining audio spatial quality |
PL2137725T3 (pl) | 2007-04-26 | 2014-06-30 | Dolby Int Ab | Urządzenie i sposób do syntetyzowania sygnału wyjściowego |
CN103299363B (zh) * | 2007-06-08 | 2015-07-08 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
CN101715643B (zh) | 2007-06-27 | 2012-12-26 | 日本电气株式会社 | 多地点连接装置、信号分析以及装置、其方法及程序 |
EP2560164A3 (en) | 2007-06-27 | 2013-04-17 | Nec Corporation | Signal control device, its system, method, and program |
US8295494B2 (en) * | 2007-08-13 | 2012-10-23 | Lg Electronics Inc. | Enhancing audio with remixing capability |
EP2191462A4 (en) | 2007-09-06 | 2010-08-18 | Lg Electronics Inc | METHOD AND DEVICE FOR DECODING A SOUND SIGNAL |
GB2453117B (en) | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
JPWO2009050896A1 (ja) * | 2007-10-16 | 2011-02-24 | パナソニック株式会社 | ストリーム合成装置、復号装置、方法 |
US8527282B2 (en) | 2007-11-21 | 2013-09-03 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
JP2009128559A (ja) * | 2007-11-22 | 2009-06-11 | Casio Comput Co Ltd | 残響効果付加装置 |
EP2175670A1 (en) * | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
CN101547265B (zh) * | 2008-10-20 | 2014-07-30 | 华为终端有限公司 | 一种3d音频会议的信号处理方法、设备以及系统 |
EP2337328B1 (en) | 2008-10-20 | 2014-12-03 | Huawei Device Co., Ltd. | Method, system and apparatus for processing 3d audio signal |
WO2010053728A1 (en) | 2008-10-29 | 2010-05-14 | Dolby Laboratories Licensing Corporation | Signal clipping protection using pre-existing audio gain metadata |
KR101137361B1 (ko) * | 2009-01-28 | 2012-04-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
EP2626855B1 (en) | 2009-03-17 | 2014-09-10 | Dolby International AB | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
GB2470059A (en) * | 2009-05-08 | 2010-11-10 | Nokia Corp | Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter |
RU2529591C2 (ru) * | 2009-06-30 | 2014-09-27 | Нокиа Корпорейшн | Устранение позиционной неоднозначности при формировании пространственного звука |
US9536529B2 (en) * | 2010-01-06 | 2017-01-03 | Lg Electronics Inc. | Apparatus for processing an audio signal and method thereof |
EP2485213A1 (en) * | 2011-02-03 | 2012-08-08 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Semantic audio track mixer |
TWI603632B (zh) | 2011-07-01 | 2017-10-21 | 杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
CN103999453B (zh) * | 2011-09-18 | 2019-04-12 | 踏途音乐公司 | 具有卡拉ok和照相亭功能的数字点播设备及相关方法 |
CN103050124B (zh) | 2011-10-13 | 2016-03-30 | 华为终端有限公司 | 混音方法、装置及系统 |
KR20130093783A (ko) * | 2011-12-30 | 2013-08-23 | 한국전자통신연구원 | 오디오 객체 전송 장치 및 방법 |
CN112185399A (zh) * | 2012-05-18 | 2021-01-05 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
CN102695116B (zh) * | 2012-05-30 | 2015-06-03 | 蒋憧 | 一种声音采集、处理和再现方法 |
BR122021021487B1 (pt) | 2012-09-12 | 2022-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V | Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d |
EP2898506B1 (en) | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
WO2014085510A1 (en) * | 2012-11-30 | 2014-06-05 | Dts, Inc. | Method and apparatus for personalized audio virtualization |
TWI618050B (zh) * | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
CN107426666B (zh) * | 2013-03-28 | 2019-06-18 | 杜比实验室特许公司 | 用于创作和渲染音频再现数据的非暂态介质和设备 |
EP2991383B1 (en) * | 2013-04-26 | 2021-01-27 | Sony Corporation | Audio processing device and audio processing system |
EP2830051A3 (en) * | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830049A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
CN110797037A (zh) * | 2013-07-31 | 2020-02-14 | 杜比实验室特许公司 | 用于处理音频数据的方法和装置、介质及设备 |
EP2879131A1 (en) | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
WO2015150480A1 (en) | 2014-04-02 | 2015-10-08 | Dolby International Ab | Exploiting metadata redundancy in immersive audio metadata |
RU2571921C2 (ru) * | 2014-04-08 | 2015-12-27 | Общество с ограниченной ответственностью "МедиаНадзор" | Способ фильтрации бинауральных воздействий в аудиопотоках |
CN104036788B (zh) * | 2014-05-29 | 2016-10-05 | 北京音之邦文化科技有限公司 | 音频文件的音质识别方法及装置 |
CN105336333B (zh) * | 2014-08-12 | 2019-07-05 | 北京天籁传音数字技术有限公司 | 多声道声音信号编码方法、解码方法及装置 |
CN107004421B (zh) * | 2014-10-31 | 2020-07-07 | 杜比国际公司 | 多通道音频信号的参数编码和解码 |
CN105895086B (zh) | 2014-12-11 | 2021-01-12 | 杜比实验室特许公司 | 元数据保留的音频对象聚类 |
CN106033671B (zh) * | 2015-03-09 | 2020-11-06 | 华为技术有限公司 | 确定声道间时间差参数的方法和装置 |
KR102657547B1 (ko) | 2015-06-17 | 2024-04-15 | 삼성전자주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
DK3353779T3 (da) * | 2015-09-25 | 2020-08-10 | Voiceage Corp | Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal |
US11152014B2 (en) | 2016-04-08 | 2021-10-19 | Dolby Laboratories Licensing Corporation | Audio source parameterization |
US10224042B2 (en) | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10424307B2 (en) * | 2017-01-03 | 2019-09-24 | Nokia Technologies Oy | Adapting a distributed audio recording for end user free viewpoint monitoring |
JP6787183B2 (ja) * | 2017-02-28 | 2020-11-18 | ヤマハ株式会社 | 音制御装置及び方法 |
CN110800048B (zh) * | 2017-05-09 | 2023-07-28 | 杜比实验室特许公司 | 多通道空间音频格式输入信号的处理 |
WO2020205175A1 (en) | 2019-04-05 | 2020-10-08 | Tls Corp. | Distributed audio mixing |
CN113096672B (zh) * | 2021-03-24 | 2022-06-14 | 武汉大学 | 一种应用于低码率下的多音频对象编解码方法 |
Family Cites Families (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4544919A (en) * | 1982-01-03 | 1985-10-01 | Motorola, Inc. | Method and means of determining coefficients for linear predictive coding |
JPH0650439B2 (ja) * | 1986-07-17 | 1994-06-29 | 日本電気株式会社 | マルチパルス駆動形音声符号化器 |
JP2659605B2 (ja) * | 1990-04-23 | 1997-09-30 | 三菱電機株式会社 | 音声復号化装置及び音声符号化・復号化装置 |
US5764779A (en) * | 1993-08-25 | 1998-06-09 | Canon Kabushiki Kaisha | Method and apparatus for determining the direction of a sound source |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
US5712437A (en) * | 1995-02-13 | 1998-01-27 | Yamaha Corporation | Audio signal processor selectively deriving harmony part from polyphonic parts |
JP2766466B2 (ja) * | 1995-08-02 | 1998-06-18 | 株式会社東芝 | オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法 |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
DE19632734A1 (de) * | 1996-08-14 | 1998-02-19 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal |
US5912976A (en) * | 1996-11-07 | 1999-06-15 | Srs Labs, Inc. | Multi-channel audio enhancement system for use in recording and playback and methods for providing same |
US5886276A (en) * | 1997-01-16 | 1999-03-23 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for multiresolution scalable audio signal encoding |
US6131084A (en) | 1997-03-14 | 2000-10-10 | Digital Voice Systems, Inc. | Dual subframe quantization of spectral magnitudes |
US6005948A (en) * | 1997-03-21 | 1999-12-21 | Sony Corporation | Audio channel mixing |
JPH11109995A (ja) * | 1997-10-01 | 1999-04-23 | Victor Co Of Japan Ltd | 音響信号符号化器 |
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
US6188987B1 (en) * | 1998-11-17 | 2001-02-13 | Dolby Laboratories Licensing Corporation | Providing auxiliary information with frame-based encoded audio information |
JP4610087B2 (ja) * | 1999-04-07 | 2011-01-12 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 損失のない符号化・復号へのマトリックス改良 |
US6539357B1 (en) * | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
TW510143B (en) * | 1999-12-03 | 2002-11-11 | Dolby Lab Licensing Corp | Method for deriving at least three audio signals from two input audio signals |
US6351733B1 (en) * | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US7212872B1 (en) * | 2000-05-10 | 2007-05-01 | Dts, Inc. | Discrete multichannel audio with a backward compatible mix |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7292901B2 (en) | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US20100042406A1 (en) * | 2002-03-04 | 2010-02-18 | James David Johnston | Audio signal processing using improved perceptual model |
DE60311794C5 (de) * | 2002-04-22 | 2022-11-10 | Koninklijke Philips N.V. | Signalsynthese |
KR101016982B1 (ko) * | 2002-04-22 | 2011-02-28 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 디코딩 장치 |
JP4013822B2 (ja) * | 2002-06-17 | 2007-11-28 | ヤマハ株式会社 | ミキサ装置およびミキサプログラム |
KR100981699B1 (ko) * | 2002-07-12 | 2010-09-13 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
US7542896B2 (en) | 2002-07-16 | 2009-06-02 | Koninklijke Philips Electronics N.V. | Audio coding/decoding with spatial parameters and non-uniform segmentation for transients |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
AU2003260841A1 (en) * | 2002-09-23 | 2004-04-08 | Koninklijke Philips Electronics N.V. | Generation of a sound signal |
EP1552724A4 (en) * | 2002-10-15 | 2010-10-20 | Korea Electronics Telecomm | METHOD FOR GENERATING AND USING A 3D AUDIOSCENCE WITH EXTENDED EFFICIENCY OF SOUND SOURCE |
US7243064B2 (en) * | 2002-11-14 | 2007-07-10 | Verizon Business Global Llc | Signal processing of multi-channel data |
US20040117186A1 (en) * | 2002-12-13 | 2004-06-17 | Bhiksha Ramakrishnan | Multi-channel transcription-based speaker separation |
US20040176950A1 (en) * | 2003-03-04 | 2004-09-09 | Docomo Communications Laboratories Usa, Inc. | Methods and apparatuses for variable dimension vector quantization |
DE602004007945T2 (de) * | 2003-09-29 | 2008-05-15 | Koninklijke Philips Electronics N.V. | Codierung von audiosignalen |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7725324B2 (en) * | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
US7394903B2 (en) * | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
JP4939933B2 (ja) * | 2004-05-19 | 2012-05-30 | パナソニック株式会社 | オーディオ信号符号化装置及びオーディオ信号復号化装置 |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
US20060009274A1 (en) * | 2004-07-08 | 2006-01-12 | Richard Finocchio | Method of playing a game of roulette |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
WO2006022308A1 (ja) * | 2004-08-26 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd. | マルチチャネル信号符号化装置およびマルチチャネル信号復号装置 |
US20060048226A1 (en) * | 2004-08-31 | 2006-03-02 | Rits Maarten E | Dynamic security policy enforcement |
DE102004043521A1 (de) * | 2004-09-08 | 2006-03-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes |
DE102004049347A1 (de) * | 2004-10-08 | 2006-04-20 | Micronas Gmbh | Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
EP1691348A1 (en) | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
KR20080015878A (ko) * | 2005-05-25 | 2008-02-20 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 복수 채널 신호의 예측 엔코딩 |
AU2006266579B2 (en) * | 2005-06-30 | 2009-10-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
EP2102858A4 (en) * | 2006-12-07 | 2010-01-20 | Lg Electronics Inc | METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL |
US9111525B1 (en) * | 2008-02-14 | 2015-08-18 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Apparatuses, methods and systems for audio processing and transmission |
US8332229B2 (en) * | 2008-12-30 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte. Ltd. | Low complexity MPEG encoding for surround sound recordings |
TWI590234B (zh) * | 2012-07-19 | 2017-07-01 | 杜比國際公司 | 編碼聲訊資料之方法和裝置,以及解碼已編碼聲訊資料之方法和裝置 |
-
2005
- 2005-02-14 EP EP05101055A patent/EP1691348A1/en not_active Withdrawn
-
2006
- 2006-02-13 CN CN2006800047285A patent/CN101133441B/zh active Active
- 2006-02-13 EP EP06708241A patent/EP1844465B1/en active Active
- 2006-02-13 TR TR2018/11059T patent/TR201811059T4/tr unknown
- 2006-02-13 BR BR122018072508-7A patent/BR122018072508B1/pt active IP Right Grant
- 2006-02-13 WO PCT/EP2006/050904 patent/WO2006084916A2/en active Application Filing
- 2006-02-13 BR BR122018072501-0A patent/BR122018072501B1/pt active IP Right Grant
- 2006-02-13 PL PL06708241T patent/PL1844465T3/pl unknown
- 2006-02-13 ES ES10179108.5T patent/ES2682073T3/es active Active
- 2006-02-13 ES ES06708241T patent/ES2374434T3/es active Active
- 2006-02-13 KR KR1020077018381A patent/KR100924577B1/ko active IP Right Grant
- 2006-02-13 BR BR122018072505-2A patent/BR122018072505B1/pt active IP Right Grant
- 2006-02-13 CA CA2597746A patent/CA2597746C/en active Active
- 2006-02-13 EP EP08015073A patent/EP1995721A1/en not_active Withdrawn
- 2006-02-13 CA CA2707761A patent/CA2707761C/en active Active
- 2006-02-13 JP JP2007554579A patent/JP5179881B2/ja active Active
- 2006-02-13 CN CN2011100613628A patent/CN102123341B/zh active Active
- 2006-02-13 AU AU2006212191A patent/AU2006212191B2/en active Active
- 2006-02-13 BR BR122018072504-4A patent/BR122018072504B1/pt active IP Right Grant
- 2006-02-13 MX MX2007009559A patent/MX2007009559A/es active IP Right Grant
- 2006-02-13 RU RU2007134215/09A patent/RU2376654C2/ru active
- 2006-02-13 BR BRPI0607166-0A patent/BRPI0607166B1/pt active IP Right Grant
- 2006-02-13 EP EP10179108.5A patent/EP2320414B1/en active Active
- 2006-02-13 AT AT06708241T patent/ATE531035T1/de not_active IP Right Cessation
-
2007
- 2007-07-24 NO NO20073892A patent/NO338701B1/no unknown
- 2007-08-10 US US11/837,123 patent/US8355509B2/en active Active
- 2007-08-12 IL IL185192A patent/IL185192A/en active IP Right Grant
- 2007-12-07 HK HK07113398.4A patent/HK1107723A1/xx unknown
-
2009
- 2009-02-04 AU AU2009200407A patent/AU2009200407B2/en active Active
-
2010
- 2010-10-27 AU AU2010236053A patent/AU2010236053B2/en active Active
-
2011
- 2011-12-14 HK HK11113485.2A patent/HK1159392A1/xx unknown
-
2012
- 2012-07-11 JP JP2012155121A patent/JP5638037B2/ja active Active
- 2012-08-22 US US13/591,255 patent/US9668078B2/en active Active
-
2016
- 2016-11-08 US US15/345,569 patent/US10339942B2/en active Active
-
2018
- 2018-10-29 US US16/172,941 patent/US10643629B2/en active Active
- 2018-10-29 US US16/172,935 patent/US10657975B2/en active Active
- 2018-10-29 US US16/172,938 patent/US10643628B2/en active Active
- 2018-10-29 US US16/172,939 patent/US10650835B2/en active Active
-
2020
- 2020-04-08 US US16/843,338 patent/US11495239B2/en active Active
-
2022
- 2022-08-11 US US17/886,177 patent/US11682407B2/en active Active
- 2022-08-11 US US17/886,162 patent/US11621005B2/en active Active
- 2022-08-11 US US17/886,170 patent/US11621006B2/en active Active
- 2022-08-11 US US17/886,173 patent/US11621007B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11621005B2 (en) | Parametric joint-coding of audio sources | |
KR101215868B1 (ko) | 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치 | |
KR101236259B1 (ko) | 오디오 채널들을 인코딩하는 방법 및 장치 | |
RU2396608C2 (ru) | Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема |