TR201811059T4 - Ses kaynaklarının parametrik birleşik kodlaması. - Google Patents

Ses kaynaklarının parametrik birleşik kodlaması. Download PDF

Info

Publication number
TR201811059T4
TR201811059T4 TR2018/11059T TR201811059T TR201811059T4 TR 201811059 T4 TR201811059 T4 TR 201811059T4 TR 2018/11059 T TR2018/11059 T TR 2018/11059T TR 201811059 T TR201811059 T TR 201811059T TR 201811059 T4 TR201811059 T4 TR 201811059T4
Authority
TR
Turkey
Prior art keywords
source
source signals
signals
subband
signal
Prior art date
Application number
TR2018/11059T
Other languages
English (en)
Inventor
Faller Christof
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34938725&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TR201811059(T4) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TR201811059T4 publication Critical patent/TR201811059T4/tr

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Stereophonic System (AREA)

Abstract

Aşağıdaki kodlama senaryosu şöyle ele alınır: Dalga alanı sentezi miksleme, çok kanallı surround ya da kaynak sinyallerini çözmeden sonra stereo sinyaller amacıyla, bir takım ses kaynak sinyallerinin iletilmesi ya da depolanması gerekir. Önerilen teknik, kaynak sinyalleri arasında herhangi bir fazlalık olmadığında bile bunları ayrı olarak kodlamaya kıyasla kaynak sinyallerini birleşik olarak kodlarken ciddi derecede kodlama kazanımı sunmaktadır. Kaynak sinyallerinin istatistiksel özelliklerini, miksleme tekniklerinin özelliklerini ve uzamsal işitme ele alınarak bu mümkün olmaktadır. Kaynak sinyallerinin toplamı, en son mikslenen ses kanallarının çoğunlukla algısal olarak önemli uzamsal işaretleri belirleyen kaynak sinyallerinin istatistiksel özelliklerine ek olarak iletilir. Kaynak sinyalleri, istatistiksel özellikleri, orijinal kaynak sinyallerinin ilgili özelliklerine yaklaşacağı şekilde alıcıda geri kazanılır. Öznel değerlendirmeler, yüksek ses kalitesinin öne sürülen şema ile elde edildiğini göstermektedir.

Description

TARIFNAME SES KAYNAKLARININ PARAMETRIK BIRLESIK KODLAMASI 1. GIRIS Genel bir kodlama probleminde, n'nin zaman indeksi oldugu çok sayida (mono) kaynak sinyallerine si(n) (l Si SM) ve bir sahne açiklama vektörüne S(n) sahibiz. Sahne açiklama vektörü, (sanal) kaynak konumlari, kaynak genislikleri ve (sanal) oda parametreleri gibi akustik parametreler gibi parametreler içermektedir. Sahne açiklamasi, zaman degiskenli olabilir ya da zamanla degisiyor olabilir.
Kaynak sinyalleri ve sahne açiklamasi kodlanir ve bir sifre çözücüye iletilir. Kodlanan kaynak sinyalleri g(n) ardisik sekilde, sahne açiklama vektörünün bir fonksiyonu olarak dalga alani sentezi, çok kanalli ya da stereo sinyaller üretmek amaciyla sahne açiklamasinin bir fonksiyonu olarak karistirilir. Sifre Çözücü çikti sinyalleri îiün (O Si SN) olarak gösterilir. Sahne açiklama vektörünün S(n) iletilemedigini ancak sifre çözücüde belirlenebildigini unutmayiniz. Bu dokümanda, "stereo ses sinyali" terimi her zaman iki-kanalli stereo ses sinyalleri anlamina gelir.
Sahne açiklamasini tanimlar ve her bir ("natürel") kaynak sinyali için bir ayri mono ses kodlayici, ör. bir AAC ses kodlayici kullanir. Bununla birlikte, birçok kaynak bulunan bir kompleks sahne karistirilacagi zaman, bit hizi yüksek olur yani bit hizi, kaynak sayisi ile yükselir. Bir kaynak sinyalini. yüksek. kalite ile kodlama. yaklasik. 60 90 kb/s gerektirir.
Daha öncesinde, Esnek Isleme için Binoral Isaret kodlamasini (BCC) gösteren bir sema bulunan açiklanan kodlama probleminin [1][2] özel bir durumunu isaret etmistik. Sadece belirli kaynak sinyallerinin özeti arti düsük bit hizi yan bilgisini ileterek düsük bit hizi elde edilir. Ancak, kaynak sinyalleri, sifre çözücüde geri kazanilamaz ve sema, stereo ve çok kanalli surround sinyal üretimi ile sinirliydi. Ayni zamanda, genlik ve gecikme kaydirmaya dayanarak sadece basitlestirilmis karistirma kullaniliyordu. Böylece, kaynaklarin yönü kontrol edilebiliyordu ancak baska isitsel uzamsal imaj nitelikleri kontrol edilemiyordu. Bu semanin diger bir sinirlandirmasi bunun sinirli ses kalitesiydi. Özellikle, kaynak sinyallerinin sayisi arttikça ses kalitesindeki bir azalma.
Doküman [1], (Binoral Isaret Kodlama, Parametrik Stereo, MP3 Surround, MPEG Surround) N ses kanallarinin sifrelendigi durumu ve benzer isaretlere sahip N ses kanallarini kapsar ve daha sonra orijinal ses kanallari çözülür. Iletilen yan bilgi, girdi kanallari arasindaki farkliliklara iliskin kanallar arasi isaret parametrelerini Stereo ve çok kanalli ses sinyallerinin kanallari, ses kaynaklari sinyallerinin karisimlarini kapsar ve bu yüzden saf ses kaynak sinyallerine göre dogada farkli olur- Stereo ve çok kanalli ses sinyalleri, uygun bir oynatma sistemi üzerinden arkadan oynatildiginda, dinleyicinin kayit ayari ile kaydedildigi ya da karistirma esnasinda kayit mühendisi tarafindan tasarlandigi üzere bir isitsel uzamsal imaji ("ses asamasi") anlayacagi sekilde karistirilir. Stereo ya da çok kanalli ses sinyalinin kanallari için birlesik kodlamaya yönelik birtakim semalar daha önceden önerilmistir. teknolojisini açiklamaktadir. Bir ses sifreleyici, kaliteyi kontrol etmek için dönüstürmeyi çesitlendirerek, çok kanalli ses verisinde bir ön islemeli çok kanalli dönüstürme gerçeklestirir. Sifreleyici çoklu pencereleri farkli kanallardan bir ya da daha fazla karolar içine gruplandirir ve sifreleyicinin geçicileri izole etmesini saglayan karo yapilandirma bilgisini üretir. islemesini tarif eder. Çok kanalli veri toplanir ve dörtlü gruplari temsil eder. Bu veri daha sonra bir dogrusal öngörücüye çiktilanir. Bir otokorelasyon matrisi hesaplanir ve müteakiben sahte-evrikler üretilir` ve dogrusal öngörü katsayilarina ve artiga çiktilanir. 3062 (2004) sayili Tez "Parametric coding of spatial audio", Christof Faller, Lausanne, EPFL, XP002343263, binoral isaret kodlamasi gibi birçok parametrik kodlama teknolojisini tarif etmektedir. Uzamsal isaretler kanallar arasi zaman farki, kanallar arasi seviye farki ve kanallar arasi korelasyon stereo sinyaller ve çok kanalli ses sinyalleri için tahmin edilir. Bu, bir altbant-vari sekilde gerçeklestirilir. Bir BCC sifre çözücü iletilen toplam sinyal arti uzamsal isaretleri verilen bir stereo ya da çok kanalli ses sinyali üretir. coding", Frank Baumgarte & Christof Faller, sayfalar 1801- 1804, IEEE Akustik Konusma Ve Sinyal Isleme Hakkinda Uluslararasi Konferans (ICASSP), New York, Mayis 13, 2002, XPOlO804245 yayini binoral isaret kodlamasini özetlemektedir. Stereofonik. sinyalden uzamsal isaretlerim çikarimlanmasi bir BCC analizörü ile gerçeklestirilir. BCC analizörü, bir uyum tahmin bloku, güç tahmin bloklari, gecikme dengeleme bloklari ve bir maksimum tespit bloku içermektedir. Girdi sinyalleri bir birinci kanaldan A gelen bir ses sinyali ve bir ikinci kanaldan B gelen› bir ses sinyalidir ve ses kanallari bir Koklear filtre bankasi (CFB) ve bir iç kil hücresi (IHC) modeline tabi tutulur.
Mevcut bulusun bir amaci, sifreleme için gelistirilmis bir konsept saglamaktir; Bu, istem l'in yöntemi ya da istem 2'nin cihazi ile elde edilir. Bulusun amaci, bir minimum bant genisligi kullanirken birden fazla sayida kaynak sinyallerinin iletilmesi için bir yöntem saglamaktir.
Bilinen yöntemlerin çogunda, pleybek formati (ör. stereo, .1) ön tanimlidir` ve kodlama senaryosu üzerine dogrudan etkiye sahiptir. Sifre çözücü tarafindaki ses akisi, sadece bu ön tanimli pleybek formatini kullanmalidir, böylece kullaniciyi bir ön tanimli pleybek senaryosuna (ör. stereo) Önerilen bulus, tipik olarak bir stereo ya da çok kanalli sinyallerin kanallari olmayan ancak farkli konusma ya da enstrüman sinyalleri gibi bagimsiz sinyaller olan N ses kaynak sinyallerini sifreler. Iletilen yan bilgi, girdi kaynak sinyallerine iliskin istatistiksel parametreleri Önerilen bulus, M ses kanallarini orijinal ses kaynak sinyallerinden farkli isaretler ile çözer. Bu farkli isaretlerin her biri alinin toplam sinyale bir karistirici uygulayarak dolayli olarak sentezlenir. Karistirici, alinan istatistiksel kaynak bilginin ve alinan (ya da lokal belirlenen) ses formati parametrelerinin ve karistirma parametrelerinin bir fonksiyonu olarak kontrol edilir.
Alternatif olarak bu farkli isaretler, alinan istatistiksel kaynak bilginin ve alinan (ya da lokal belirlenen) ses formati parametrelerinin ve karistirma parametrelerinin bir fonksiyonu olarak dogrudan hesaplanir. Bu hesaplanan isaretler alinan toplam sinyali göz önünde bulundurarak çikti kanallarini sentezlemek üzere bir Önceki teknik sifre çözücüyü (Binoral isaret kodlamasi, Parametrik Stereo, MPEG Surround) kontrol etmek için kullanilir.
Ses kaynak sinyallerinin birlesik kodlamasi için önerilen sema türünün ilk örnegidir. Ses kaynak sinyallerinin birlesik kodlamasi için tasarlanmistir. Ses kaynak sinyalleri genellikle, bir stereo ya da çok kanalli ses sistemi üzerinden pleybek için uygun olmayan mono ses sinyalleridir. Kisacasi, asagida ses kaynak sinyalleri genellikle kaynak sinyalleri ile gösterilir.
Ses kaynak sinyallerinin pleybekten önce, öncelikle stereo, çok kanalli ya da dalga alani sentezi ses sinyallerine karistirilmasi gerekir. Bir ses kaynak sinyali, bir tekli enstrüman ya da konusmaci ya da bir takim enstrüman ya da konusmacilarin toplami olabilir. Ses kaynak sinyalinin diger bir tipi bir spot mikrofon ile konser esnasinda kaydedilen bir rmnu) ses sinyalidir. Siklikla, ses kaynak sinyalleri çoklu parça kaydedicilerde ya da harddisk kayit sistemlerinde depolanir.
Ses kaynak. sinyallerinin› birlesik, kodlamasi için istemde bulunulan sema sadece ses kaynak. sinyallerinin toplamini iletmeye ya da kaynak sinyallerinin agirlikli bir toplamina dayanmaktadir. Opsiyonel olarak, agirlikli toplama, farkli altbantlarda farkli agirliklar ile yürütülebilir ve agirliklar zamanda uyarlanabilir. Esitleme ile toplama da Bölüm 3.3.2'de [lJ'de açiklandigi üzere uygulanabilir.
Asagida, toplam ya da toplam sinyale atifta bulundugumuzda, her zaman (1) ile üretilen ya da açiklandigi gibi üretilen bir sinyali kastetmekteyiz. Toplam sinyale ek olarak yan bilgi iletilir. Toplam ve yan bilgi, çiktilanan ses akisini temsil eder. Opsiyonel olarak, toplam sinyal bir konvansiyonel mono ses kodlayici kullanilarak kodlanir. Bu akis, bir dosyada (CD, DVD, Harddisk) depolanabilir ya da aliciya yayin yapilabilir. Yan bilgi, karistirici çikti sinyallerinin algisal uzamsal isaretlerini belirleyen en önemli faktörler olan kaynak sinyallerinin istatistiksel Özelliklerini temsil eder. Bu özelliklerin spektral zarflari ve oto-korelasyon fonksiyonlarini geçici olarak gelistirdigi gösterilecektir. Her' bir kaynak sinyal için yaklasik olarak 3 kb/s yan bilgi iletilir. Alicida, kaynak sinyalleri êiün (l 5 i S M), orijinal kaynak sinyallerinin ve toplam. sinyalin karsilik gelen özelliklerine yaklasan yukarida bahsedilen istatistiksel özellikleri ile geri kazanilir. ÇIZIMLERIN KISA AÇIKLAMASI Bulus ekli Sekiller sayesinde daha iyi anlasilacak. olup sekil 1, her bir kaynak sinyalinin iletiminin daha fazla isleme için bagimsiz olarak yapildigi bir sema gösterir, sekil 2, toplam sinyal arti yan bilgi olarak iletilen kaynaklarin bir sayisini gösterir, sekil 3, bir Binoral Isaret Kodlama (BCC) semasinin bir blok diyagramini gösterir, Sekil 4, bir takim kaynak sinyallerine dayali olarak stereo sinyalleri üretmek üzere bir karistirici gösterir, sekil 5, ICTD, ICLD ve ICC ve kaynak sinyali altbant gücü arasindaki bagi gösterir, sekil 6, yan bilgi üretiminin islemini gösterir, sekil 7, her bir kaynak. sinyalinin LPC parametrelerini sekil 8, bir toplam sinyalden kaynak sinyallerini yeniden olusturma islemini gösterir, sekil 9, her bir sinyalin toplam sinyalden üretilmesine yönelik bir alternatif sema gösterir, Sekil 10, bir takim kaynak sinyallerine dayali olarak stereo sinyalleri üretmek üzere bir karistirici gösterir, sekil ll, kaynak seviyelerinin karistirma parametrelerine bagli olmasini engelleyen bir genlik kaydirma algoritmasini gösterir, sekil 12 bir dalga alani sentezi pleybek sisteminin bir hoparlör dizilimini gösterir, sekil l3, iletilen kanallarin downmiksini isleyerek alicida kaynak sinyallerinin bir tahmininin nasil geri kazanilacagini gösterir, sekil 14, iletilen kanallari isleyerek alicida sinyallerinin bir tahmininin nasil geri kazanilacagini gösterir, lLTANIMLAR, NOTASYONLAR VE DEGISKENLER Asagidaki notasyonlar ve degiskenler bu belgede kullanilmaktadir: n zaman indeksi; i ses kanali ya da kaynak indeksi; d gecikme indeksi; M` sifreleyici girdi kaynak sinyalleri sayisi; N sifre çözücü çikti kanallari sayisi; xi(n) karisik orijinal kaynak sinyalleri; îiün karisik sifre çözücü çikti sinyalleri; si(n) sifreleyici girdi kaynak sinyalleri; â(n) ayni zamanda sahte-kaynak sinyalleri olarak da adlandirilan iletilen kaynak sinyalleri; s(n) iletilen toplam sinyal; yi(n) L-kanal ses sinyali; (remikslenecek ses sinyali); .g(k) si(n)'nin (diger sinyaller için benzer sekilde tanimlanan) bir altbant sinyali; E{gß(n)} gf(n)'nin (diger sinyaller için benzer sekilde AL(n) tahmin edilen altbant ICLD; T(n) tahmin edilen altbant ICTD; c(n) tahmin edilen altbant ICC; pihn ilgili kaynak altbant gücü; ai, bi karistirici ölçek faktörleri; ci, di karistirici gecikmeleri; ALi, r(n)karistirici seviyesi ve zaman farki; Gi karistirici kaynak kazanimi; HLSES KAYNAK SINYALLERININ BIRLESIK KODLAMASI Ilk olarak, Binoral Isaret Kodlamasi (BCC), bir parametrik çok kanalli ses kodlama teknigi açiklanmaktadir. Daha sonra, BCC'nin dayandigi ayni anlayis ile bir kodlama senaryosu için kaynak sinyallerinin birlesik kodlamaya yönelik olarak bir algoritma düzenlenebilir.
AJBinoral Isaret Kodlamasi (BCC) Çok kanalli ses kodlama için bir BCC semasi [l][2] asagidaki sekilde gösterilir. Girdi çok kanalli ses sinyali bir tekli kanala downmikslenir. Tüm kanal dalga biçimleri hakkinda kodlama ve bilgi iletimine karsilik olarak, sadece downmikslenen sinyal kodlanir (bir konvansiyonel mono ses kodlayici ile) ve iletilir. Ilaveten, algisal olarak motive edilen "ses kanali farkliliklari", orijinal ses kanallari arasinda tahmin edilir ve ayni zamanda sifre çözücüye iletilir. Sifre çözücü, ses kanali farkliliklarinin orijinal ses sinyalinin karsilik gelen ses kanali farkliliklarina yaklasacagi sekilde kendi çikti kanallarini Toplama yerellestirme, bir hoparlör sinyal kanali çifti için algisal olarak ilgili ses kanali fakliliklarinin, kanal arasi zaman farki (ICTD) ve kanal arasi seviye farki (ICLD) oldugu anlamina gelir. ICTD ve ICLD, isitsel etkinliklerin algilanan yönü ile ilgili olabilir. Diger isitsel uzamsal imaj nitelikler, görünür kaynak genisligi ve dinleyici zarfi gibi, interaural uyum (IC) ile ilgili olabilir. Bir dinleyicinin önünde ve arkasindaki hoparlör çiftleri için, interaural uyunz genellikle dogrudan kanal arasi uyum (lCC) ilgilidir ki böylece BCC tarafindan üçüncü ses kanali farki ölçümü olarak düsünülür. ICTD, ICLD ve ICC zamanin bir fonksiyonu olarak altbantlarda tahmin edilir.
Kullanilan spektral ve geçici çözünürlügün her ikisi de algilama ile motive edilir.
B.Ses kaynaklarinin parametrik birlesik kodlamasi Bir BCC sifre çözücü bit mono sinyal alarak ve düzenli zaman araliklarinda altbant ve kanal çifti basina bir tekli spesifik ICTD, ICLD ve ICC isareti sentezleyerek birçok kanalli ses sinyalini herhangi bir isitsel uzamsal imaj ile üretebilmektedir. Genis yelpazede bir ses materyali algilanan isitsel uzamsal imajin, büyük ölçüde ICTD, ICLD ve ICC ile belirlendigi anlamina gelir. Bu nedenle, Sekil l'deki karistirici girdisi gibi "temiz" kaynak sinyalleri s(n) gerektirmeye karsi olarak, gerçek kaynak sinyallerini karistiriciya saglama durumu için oldugu gibi karistirici çiktisinda benzer ICTD, ICLD ve ICC ile sonuçlanacaklari özellige sahip sadece sözde-kaynak sinyallere $(n) ihtiyaç duymaktayiz..$(n) üretimi için üç amaç vardir . giun, bir karistiriciya saglanirsa, karistirici çikti kanallari, sanki si(n) karistiriciya saglanmis gibi yaklasik olarak ayni uzamsal isaretlere (ICLD, ICTD, ICC) sahip olacaktir. . .%(n), orijinal kaynak sinyalleri s(n) hakkinda olabildigince az bilgi ile üretilecektir (çünkü amaç düsük bit hizli yan bilgiye sahip olmaktir). . &(n), minimum miktarda sinyal bozulmasinin ortaya koyulacagi sekilde iletilen toplam sinyalden s(n) üretilir. Önerilen semayi türetmek için bir stereo karistiriciyi (M = 2) ele almaktayiz. Genel durum üzerinden bir diger sadelestirme ise sadece genlik ve gecikme kaydirmanin karistirma için uygulanmasidir. Ayrik kaynak sinyalleri sifre çözücüde mevcut olmus olsaydi, bir stereo sinyal Sekil 4'te gösterildigi üzere karistirilabilir, yani 96101) "" îai'si(n_ci) X201): Ibisioîhdi) Bu durumda, sahne açiklama vektörü S(n), karistirma parametrelerini belirleyen sadece kaynak yönlerini kapsar, burada T, bir vektörün transpozudur. Karistirma parametreleri için, notasyon kolayligi adina zaman indeksini göz ardi ettigimizi dikkate alin.
Karistiriciyi kontrol etmek için daha kolay parametreler zaman ve seviye farkidir, Ti ve ALi, bunlar, asagidaki tarafindan ai, bi, ci, and di ile baglantilidir 1061/20 _ ' a] = bi = 10(Gi+ALi)/20a burada Gi, dB'de bir kaynak kazanimidir.
Asagida, girdi kaynak sinyallerinin si(n) bir fonksiyonu olarak stereo karistirici çiktisina ait ICTD, ICLD ve sinyallerinin ICTD, ICLD ve ICC'yi (karistirma parametreleri ile birlikte) belirledigine dair isaret verecektir. $(n), tanimlanan kaynak sinyalleri özelliklerinin orijinal kaynak sinyallerinin ilgili özelliklerine yaklasacagi sekilde daha sonra üretilirler.
B1 Karistirici çiktisinin ICTD, ICLD ve ICC'si Isaretler, altbantlarda ve zamanin bir fonksiyonu olarak tahmin edilir. Asagida, kaynak sinyallerinin si(n) sifir ortalamali ve karsilikli olarak bagimsiz oldugu varsayilir.
Karistirici çiktisinin (2) altbant sinyallerinin bir çifti îiÜÜ veîzûn olarak gösterilir. Notasyon basitligi adina zaman alani ve altbant alan sinyalleri için ayni zaman indeksini kullandigimizi unutmayiniz. Ayni zamanda, hiçbir altbant indeksi kullanilmamaktadir ve açiklanan analiz/isleme her bir altbanta bagimsiz olarak uygulanir.
Iki karistirici çikti sinyallerinin altbant gücü söyledir burada $(n), kaynagin si(n) bir altbant sinyalidir ve E{.}, kisa zaman beklentisini göstermektedir, ör.
E{îf(n)} =g "“Znêizm› .(6) ~ burada K, hareket etme ortalamasini belirler. Altbant güç degerlerinin E {s2(n)}, her bir kaynak sinyali için spektral zarfi zamanin bir fonksiyonu olarak gösterdigini unutmayiniz. ICLD, AL(n); ZZ.be{îf(n»} korelasyon fonksiyonu, tahmin edilir. ICC, c(n), suna göre hesaplanir c(n) = mgx yüksek tepeni konumu hesaplanir, Simdi asil soru, normallestirilen çapraz-korelasyon fonksiyonunun, karistirma parametrelerinin bir fonksiyonu olarak nasil hesaplanabilecegidir. (2) ile birlikte, (8) su sekilde yazilabilir JE{ZMa.. s.- (n - c..)}E{Z,.=ib.. s,- (n -a',-›} ki bu suna esittir Z” aßiEßfmndi-(mdi - T..) burada normallestirilen oto-korelasyon fonksiyonu @(n,e); ve Ti = di - ci olur. Verilen (11) ile (12)'yi hesaplamak için, sinyallerin gecikmelerin dikkate alinan araligi içinde genis anlamda duragan olduklarinin varsayilmis oldugunu unutmayiniz, yani E{î,-2(n)}= E{Fzz(n-Cz)} E{3}2(")} =E{3:2("-di)} Iki kaynak sinyali için bir sayisal örnek, ICTD, ICLD ve 'te gösterilir. Sekil 5'in üst, orta ve alt paneli, AL (n), T(n), ve c(n) 'yi sirasiyla, iki kaynak sinyallerinin altbant gücünün oraninin bir fonksiyonu olarak, farkli karistirma parametreleri (4) ALI, ALZ, Tl ve T2 için a = sadece bir kaynagin gücü oldugunda (a = 0 ya da a = 1), E{ Slzm gösterir. Altbantta hesaplanan AL(n) ve T(n)'nin karistirma parametrelerine (ALI , ALZ, T1, T2) esit oldugunu dikkate aliniz.
B.2Gerekli yan bilgiler kaynaklarin E{glz (n) } (6) kisa zamanli altbant gücüne baglidir. ICTD (10) ve ICC (9) hesaplamasi için gerekli olan normallestirilen altbant çapraz korelasyon fonksiyonu ©(n,d) (12), E{gý(n)}'ye ve ek olarak her bir kaynak sinyali için normallestirilen altbant oto-korelasyon fonksiyonuna, ®i(n, e) (13), baglidir. @(n,d)'nin maksimumu, mini{Ti} Sdîmaxi{Ti} araliginda bulunur.
Karistirici parametresine Ti = di-ci' sahip kaynak 1' için, kaynak sinyali altbant özelliginin ®i(n, e) (13) gerekli oldugu ilgili aralik söyledir m;n{Ti}-nse smsix{T;}-Ti (14) altbant özelliklerine E{gp(n)} ve ®i(n, e) bagli oldugundan, prensipte bu kaynak sinyali altbant özelliklerini yan bilgi olarak iletilmeleri gerekir. Diger herhangi türdeki karistiricinin (ör. etkilere sahip karistirici, dalga alani sentezi karistirici/konvolüter, Vb.) benzer özelliklere sahi oldugunu ve böylece bu yan bilginin açiklanandan baska karistiricilar kullanildiginda da kullanisli oldugunu varsaymaktayiz. Yan bilginin miktarini azaltmak için, sifre çözücüde bir dizi öntanimli oto korelasyon fonksiyonlari depolanabilir ve kaynak sinyali özelliklerine en yakin sekilde eslesenleri seçmek için sadece indeksler iletilebilir. Algoritmamizin bir birinci versiyonu, (14) araliginda ®i(n, e) = 1 olarak kabul eder ve böylece (12), yan bilgi olarak sadece altbant güç degerleri (6) kullanilarak hesaplanir. Sekil 5'te gösterilen veri, ®i(n, e) = 1 olarak varsayilarak hesaplanmistir.
Yan bilginin miktarini azaltmak için, kaynak sinyallerinin ilgili dinamik araligi sinirlidir. Her seferinde, her bir altbant için en güçlü kaynagin gücü seçilir. Tüm diger kaynaklarin ilgili altbant gücünü, an güçlü altbant gücünden daha düsük olan bir degerde 24dB sinirlamayi yeterli bulduk.
Böylece nicemleyicinin dinamik araligi 24 dB'ye sinirlandirilabilir.
Kaynak sinyallerinin bagimsiz oldugunu kabul ederek, sifre çözücü, tüm kaynaklarin altbant gücünün toplamini E{52(n)} olarak hesaplayabilir. Böylece, prensipte sifre çözücüye sadece Mi-l kaynaklarinin altbant gücü degerlerini iletmek yeterli iken geri kalan kaynagin altbant gücü yerel olarak hesaplanabilir. Bu fikri dikkate alarak, yan bilgi hizi, birinci kaynagin gücüne iliskin indekslere 2 S i S M sahip kaynaklarin altbant gücünü ileterek hafifçe azaltilabilir, 1;{Si (n)} Daha önceden açiklandigi üzere dinamik aralik sinirlandirmanin (l5)'ten önce gerçeklestirildigini dikkate alin. Alternatif olarak, altbant güç degerleri, bir kaynagin altbant gücüne (15) iliskin normallestirmeye karsi olarak toplam› sinyal altbant gücüne iliskin olarak normallestirilebilir. 44.l kHz'lik bir örnekleme frekansi için, 20 altbant kullanmaktayiz ve her bir altbant için her 12 ms'de bir AßiLn) (2 5 i S M) iletmekteyiz. 20 altbant, isitsel sistemin spektral çözünürlügünün yarisina tekabül eder ( bir altbant iki "kritik bant genisligi" genisligindedir). Resmi olmayan tecrübeler, 20'den fazla altbant örnegin 40 altbant kullanilmasiyla sadece ufak bir gelisme elde edildigini göstermektedir. Altbantlarin ve altbant bant genisliklerinin sayisi isitsel sistemin zaman ve frekans çözünürlügüne göre seçilmektedir. Semanin, bir düsük kaliteli uygulamasi en az üç altbant gerektirir (düsük, orta, yüksek frekanslar). Özel bir düzenlemeye göre, altbantlarin farkli bant genislikleri vardir, düsük frekanslardaki altbantlar, yüksek frekanslardaki altbantlardan daha küçük bant genisligine sahiptir.
Ilgili güç degerleri, yaklasik olarak 3(M - JJ kb/s bit hizi ile sonuçlanan, [2]'de açiklanan ICLD nioemleyiciye benzer olan bir sema ile nicemlenir. Sekil 6, yan bilgi üretiminin islemini göstermektedir (Sekil 2'deki "Yan bilgi üretimi" blokuna tekabül eder).
Yan bilgi hizi, her bir kaynak sinyali için aktiviteyi analiz ederek ve aktif ise sadece"kaynak ile iliskili yan bilgiyi ileterek ilaveten azaltilabilir.
Altbant güç degerlerini E{gp(n)} istatistiksel bilgi olarak iletmeye karsi olarak, kaynak sinyallerinin spektral zarflarini gösteren diger bilgiler iletilebilir. Örnegin, dogrusal öngörüsel kodlama (LPC) parametreleri iletilebilir ya da kafes filtre parametreleri ya da hat spektral çift (LSP) parametreleri gibi ilgili diger parametreler iletilebilir. Her bir kaynak sinyalinin LPC parametrelerini tahmin etme islemi Sekil 7'de gösterilir.
Bßâ(n) hesaplama Sekil 8, toplam sinyal (l) dikkate alinarak kaynak sinyallerini yeniden olusturmak üzere kullanilan islemi gösterir. Bu islemi Sekil 2'deki "Sentez" blokunun parçasidir. Bireysel kaynak sinyalleri, toplam sinyalin her bir altbandlni gi(n) ile ölçekleyerek ve darbe tepkisine hi(n) sahip bir de-korelasyon filtresi uygulayarak geri kazanilir. burada *, dogrusal evrgsim operatörüdür ve E{Gp(n)}, yan bilgi ile sunun tarafindan hesaplanir De-korelasyon filtreleri hi(n), tamamlayici tarak filtreleri, tam geçirgen filtreler, gecikmeler ya da rastgele darbe tepkisine sahip filtreler kullanilabilir.
De-korelasyon isleminin amaci, bireysel dalga biçimlerinin nasil algilandiklarini modifiye etmeden sinyaller arasindaki korelasyonu azaltmaktir. Farkli de-korelasyon teknikleri farkli olgulara neden olur. Tamamlayici tarak filtreleri renklendirmeye yol açar. Tarif edilen tekniklerin tamami "ön-ekolar" gibi olgulara yol açan zamanda geçicilerin enerjisini yaymaktadir. Olgular için potansiyellerini dikkate alarak, de-korelasyon teknikleri mümkün oldugunca küçük uygulanmalidir. Bir sonraki bölüm, bagimsiz sinyallerin â(n) basit üretiminden daha az de- korelasyon islemi gerektiren teknikleri ve stratejileri açiklamaktadir.
Sinyallerin 5,(n) üretimi için bir alternatif sema Sekil 9'da gösterilir. Ilk olarak s(n)'nin. spektrumu, dogrusal öngörü hatasini e(n) hesaplama yardimiyla düzlestirilir.
Sifreleyicide tahmin edilen LPC filtreleri göz önüne alinarak, fi, ilgili tüm kutuplu filtreler sunun tersine z- dönüstürmesi olarak hesaplanir Ortaya çikan tüm kutuplu filtreler, Ã, kaynak sinyallerinin spektral zarfini göstermektedir. LPC parametrelerinden baska yan bilgiler iletilirse, LPC parametrelerinin ilk olarak yan bilginin bir fonksiyonu olarak hesaplanmasi gerekir. Diger semada oldugu gibi, de-korelasyon filtreleri hi, kaynak sinyallerini bagimsiz yapmak üzere kullanilir.
HLUYGULANABILIR KISITLAMALARI DIKKATE ALAN UYGULAMALAR Bu bölümün birinci kisminda, bir stereo ya da çok kanalli karistirici olarak bir BCC sentezi kullanan bir uygulama örnegi verilmektedir. Bu gibi bir BCC tipi sentez semasi, özellikle ilginçtir. Kaynak sinyalleri â(n), bu durumda dogrudan hesaplanmaz ve bu azaltilmis hesapsal karmasiklik ile sonuçlanir. Ayni zamanda bu sema, kaynak sinyallerinin a(n) dogrudan hesaplandigi durum için olandan efektif olarak daha az de-korelasyon gerekli oldugundan daha iyi ses kalitesi potansiyeli sunmaktadir.
Bu bölümün ikinci kismi, önerile sema herhangi bir karistirici ile uygulandigi ve aslinda hiçbir de-korelasyon uygulanmadigi hususlari ele alir: Bu gibi bir sema, de- korelasyon isleme bulunan bir semadan daha düsük kompleksiteye sahiptir ancak ele alinacagi üzere baska Ideal olarak, üretilen â(n)'nin bagimsiz oLarak ele alinacagi sekilde de-korelasyon isleme uygulamak istenebilir. Bununla birlikte, de-korelasyon isleme ortaya konan olgular bakimindan problematik oldugundan, de- korelasyon isleme mümkün olugu kadar az uygulanmak istenebilir. Bu bölümün üçüncü kismi, problematik de- korelasyon islemenin miktarinin, üretilen â(n) bagimsizmis gibi faydalar saglarken nasil azaltilabilecegini ele almaktadir.
A.â(n)'nin dogrudan hesaplamasi olmadan uygulama Karistirma, g(n)'ni dogrudan hesaplamasi olmaksizin iletilen toplam sinyale (l) dogrudan uygulanir. Bir BCC sentezi semasi bu amaçla kullanilir. Asagida, stereo durumunu dikkate almaktayiz ancak açiklanan tüm prensipler, çok kanalli ses sinyallerinin üretimi için de uygulanabilir.
Toplam sinyali isleme için uygulanan bir stereo BCC sentezi semasi (ya da bir "parametrik stereo" semasi) Sekil lO'da gösterilir. Yapilmak. istenen, BCC sentez semasinin Sekil 4'te gösterildigi üzere bir karistiricinin çikti sinyali gibi benzer sekilde algilanan bir sinyal üretmesidir. Bu, BCC sentez semasi çikti kanallari arasindaki ICTD, ICLD ve görünen ilgili isaretlere benzer oldugunda böyledir.Önceden açiklanan daha genel sema için oldugu gibi ayni yan bilgi kullanilir ve böylece sifre çözücünün, kaynaklarin kisa zamanli altbant güç degerlerini E Lg2(n)} hesaplamasini saglar. E Lg2(n)}'yi dikkate alarak, Sekil lO'daki kazanim faktörleri gl ve 92 söyle hesaplanir 2,_1a a.E{s (nn 9201) = (18) çikti altbant gücü ve ICLD'nin (7) Sekil 4'teki karistirici için oldugu gibi ayni olacaklari sekilde. ICTD T(n), (10)'a göre hesaplanir, Sekil lO'daki gecikmeleri DJ ve D2 belirleyerek, belirlemeye göre hesaplanir. iDe-korelasyon isleme (ICC sentezi) [1]'de açiklanmaktadir. Karistirici çikti kanallarina de-korelasyon isleme uygulamanin avantajlari, bagimsiz $(n) üretmeye uygulamaya kiyasla sunlardir: 0 Genellikle kaynak sinyallerinin M sayisi ses çikti kanallarinin N› sayisindan daha büyüktür. Böylece, üretilmesi gereken bagimsiz ses kanallarinin sayisi, .M kaynak sinyallerini de-korelasyon yapmaya karsi olarak N çikti kanallarini de-korelasyon yaparken daha az olur.
. Siklikla, N çikti kanallari, korelasyonlanir (ICC > 0) ve bagimsiz M ve N kanallarini üretmek için gerekli olandan daha az de-korelasyon isleme uygulanabilir.
Daha az de-korelasyon islemeden dolayi daha iyi ses kalitesi beklenir.
En iyi ses kalitesi, karistirici parametreleri a3+b3=1, yani Gi = C) dB olacagi sekilde kisitlandiginda beklenmektedir. Bu durumda, iletilen toplam sinyaldeki (1) her kaynagin gücü, karisik sifre çözücü çikti sinyalindeki ayni kaynagin gücü ile aynidir. Sifre çözücü çikti sinyali (Sekil 10), karistirici çikti sinyali (Sekil 4) bir` BCC sifreleyici/sifre çözücü tarafindan bu durumda sifrelenmis ya da çözülmüs gibi aynidir. Böylece, ayni zamanda benzer kalite beklenebilir.
Sifre çözücü sadece her kaynagin görünmesi gerektigi yönü belirlemez ayni zamanda her kaynagin kazanimi 0,2 +b,2 >1 çesitlenebilir. Kazanim, (Gi > 0 dB) seçerek a,2+b,2 <1 arttirilir ve (Gi < 0 dB) seçilerek azaltilir.
B.De-korelasyon isleme kullanmama Bir önceki tarif edilen teknigin kisitlamasi, karistirmanin bir BCC sentez semasi ile yürütülmesidir. Sadece ICTD, ICLD ve ICC sentezini degil ayni zamanda ilaveten BCC sentezi içinde efektler islemeyi uygulama hayal edilebilir.
Ancak, var olan karistiricilarin ve efektler islemcilerinin kullanilabilecegi istenebilir. Bu ayni zamanda dalga biçimli sentez karistiricilari da içerir (genellikle karistiricilari ve efektler* islemcilerini kullanmak için, â(n), dogrudan hesaplanir ve orijinal kaynak sinyalleriymis gibi kullanilir.
De-korelasyon isleme (hi(n) = ö(n) in (16)) uygulanmazken iyi ses kalitesi de elde edilebilir. De-korelasyon islemeden dolayi ortaya çikan olgular ile kaynak sinyallerinin îiün korelasyonlu olmasindan dolayi olgular arasinda bir anlasmadir. Herhangi bir de-korelasyon isleme kullanilmadiginda ortaya çikan isitsel uzamsal imaj dengesizlikten [l] muzdarip olabilir. Ancak karistirici, yansiticilar ya da diger efektler kullanildiginda ve bu yüzden de-korelasyon islemeye daha az ihtiyaç oldugunda kendisine bazi de-korelasyonlari getirebilir. â(n), de-korelasyon isleme olmadan üretilirse, kaynaklarin seviyesi diger kaynaklara iliskin olarak karistirildiklari yöne baglidir. Bu seviyede bagimlilik için dengeleme yapan bir algoritmasi bulunan mevcut karistiricilardaki genlik kaydirma algoritmalarinin yerini degistirerek karistirma parametrelerindeki gürültü. bagliliginin olumsuz etkisinin üstesinden gelinebilir. Bir seviye dengeleme genlik algoritmasi Sekil ll'de gösterilir ve bu karistirma parametrelerindeki kaynak seviyesini dengelemeyi hedeflemektedir. Bir konvansiyonel genlik kaydirma algoritmasinin kazanim faktörlerini dikkate alarak (ör.
Sekil 4), ai ve bi, Sekil ll'deki agirliklar, 6, ve bi sununla hesaplanir E{(Zi=,b.-S.-(n)) } Unutmayiniz ki &1 ve En, çikti altbant gücünün, $(n) her altbantta bagimsizmis gibi ayni olacagi sekilde hesaplanir. Önceden bahsedildigi üzere, bagimsiz â(n)'nin üretimi problematiktir. Burada stratejiler, @tüm bagimsizmis gibi verimli sekilde benzer bir efekt elde ederken, daha az de- korelasyon uygulamak üzere açiklanir.
Sekil 12'de gösterildigi üzere örnegin bir dalga biçimli sentez sistemini düsünün. 51, 52, ..., ngW : 6) için arzu edilen sanal kaynak konumlari gösterilir. M tamamen bagimsiz sinyalleri üretmeksizin â(n) (16) hesaplamak üzere bir strateji: tBirbirlerine yakin olan kaynaklara tekabül eden kaynak indekslerinin gruplarini üretin. Örnegin Sekil 8'de bunlar söyle olabilir: {l}, {2, 5}, {3}, ve {4, 6}.
ZHer seferinde, her bir altbantta en güçlü kaynagin kaynak indeksini seçiniz. imax = mêXE{5(n)} (21) imax, i.e. hi(n) = ö(n) içeren grubun kaynak indeksleri parçasi için herhangi bir de-korelasyon isleme uygulamayiniz.
Açiklanan algoritma, en güçlü sinyal bilesenlerini en son modifiye eder. Ilaveten, kullanilan farkli hi(n)'nin sayisi azaltilir. De-korelasyon daha kolay oldugundan, daha az bagimsiz kanalin üretilmesi gerektiginden bu bir avantajdir. Açiklana teknik, stereo ya da çok kanalli ses sinyalleri karistirildiginda da uygulanabilir.
V.KALITE VE BIT HIZI BAKIMINDAN ÖLÇEKLENEBILIRLIK Önerilen sema sadece, bir konvansiyonel mono ses kodlayici ile kodlanabilen tüm kaynak sinyallerinin özetini iletilir.
Herhangi bir mono geriye dönük uyumluluk gerekmediginde ve birden fazla ses dalga biçiminin iletimi/depolamasi için mevcut kapasite oldugunda, önerilen sema birden fazla iletim kanali ile kullanim için ölçeklenebilir. Bu, belirli kaynak sinyallerinin farkli altsetleri bulunan birkaç toplam sinyal üreterek uygulanabilir yani kaynak sinyallerinin her bir alt setine önerilen kodlama semasi bireysel olarak uygulanir. Iletilen ses kanallarinin sayisi arttikça ses kalitesinin artmasi beklenir çünkü her iletilen kanaldan de-korelasyon ile daha az bagimsiz kanal üretilmek zorunda olur (bir iletilen kanalin durumuna kiyasla).
VLMEVCUT STEREO VE SURROUND SES FORMATLARINA GERIYE DÖNÜK Asagidaki ses dagitim senaryosunu. göz önünde bulundurun.
Bir tüketici, maksimum kalite bir stereo ya da çok kanalli surround sinyal elde etmektedir (ör. bir ses CD, DVD ya da çevrim içi müzik magazasi araciligiyla). Amaç, standart stereo/surround. pleybek kalitesinde taviz vermeksizin müsteriye opsiyonel olarak, elde edilen ses içeriginin bir özel karisimini üretme esnekligini saglamaktir.
Bu, of .â(n)'nin. hesaplanmasina. belirli stereo ya da çok kanalli ses sinyalinin bir fonksiyonu olarak izin veren yan bilginin bir bit akisini tüketiciye (ör. bir çevrim içi müzik markette opsiyonel satin alma seçenegi olarak) saglama ile uygulanabilir. Tüketicinin karistirma algoritmasi daha sonra â(n)'ye uygulanir. Asagida, stereo ya da çok kanalli ses sinyalleri dikkate alinarak â(n)'yi hesaplamak için iki olasilik açiklanmaktadir.
ALKaynak sinyallerinin toplamini alicida tahmin etme Önerilen kodlama semasinin bir stereo ya da çok kanalli ses iletimi ile en kolay kullanma sekli Sekil l3'te gösterilir, burada yi(n) (1 5 i S L), L belirli stereo ya da çok kanalli ses sinyalinin kanallaridir. Kaynaklarin toplam sinyali iletilen kanallari bir tekli ses kanalina downmiksleme ile tahmin edilir. Downmiksleme, kanallarin yi(n) (1 5 i_ S L) toplamini hesaplama yardimiyla gerçeklestirilir ya da daha sofistike teknikler uygulanabilir.
En iyi performans için, kaynak sinyallerinin seviyesinin, kaynak sinyalleri arasindaki güç oranini kaynaklarin bununla belirli stereo ya da çok kanalli sinyalde kapsandigi güç oranina yaklasacagi sekilde E{gs(n)} tahmininden önce uyarlanmasi tavsiye edilir. Bu durumda, iletilen kanallarin downmiksi, kaynaklarin. (l) toplaminin nispeten iyi bir tahminidir (ya da bunun ölçekli bir versiyonu).
Bir otomatiklesmis islem, yan bilginin hesaplanmasindan önce sifreleyici kaynak sinyali girdilerinin si(n) seviyesini ayarlamak üzere kullanilabilir. Bu islem zamanda uyarlanabilir olarak, her bir kaynak sinyalinin belirli stereo ya da çok kanalli sinyalde kapsandigi seviyeyi tahmin eder. Yan bilginin hesaplanmasindan önce, her kaynak sinyalinin seviyesi artik zamanda uyarlanabilir olarak, kaynagin stereo ya da çok kanalli ses sinyalinde kapsandigi seviyeye esit olacagi sekilde ayarlanir.
B.Iletilen kanallari tek tek kullanma Sekil 14, stereo ya da çok kanalli surround sinyal iletimli önerilen semanin farkli bir uygulamasini gösterir. Burada, iletilen kanallar downmikslenmez ancak â(n)'nin üretimi için tek tek kullanilir. En genel haliyle, $(n)'nin altbant sinyalleri sununla hesaplanir burada wl(n), iletilen kanallarin altbantlarinin spesifik dogrusal kombinasyonlarini belirleyen agirliklardir.
Dogrusal kombinasyonlar, â(n)'nin çoktan mümkün oldugu kadar dekorelasyonlanacagi sekilde seçilir. Böylece, hiçbir ya da sadece küçük bir miktarda de-korelasyon islemi uygulanmasi gerekir ki bu daha önce ele alindigi üzere avantajlidir.
VHUYGULAMALAR Daha önce halihazirda, önerilen kodlama semasi için birtakim uygulamalardan bahsetmistik. Burada, bunlari özetliyor ve birkaç uygulamadan daha bahsediyor olacagiz.
Alwiksleme için ses kodlama Stereo, çok kanalli ya da dalga alani sentez ses sinyallerine mikslemeden önce ses kaynak sinyallerinin ne zaman depolanmasi ya da iletilmesi gerekse önerilen sema uygulanabilir. Önceki teknik ile, bir mono ses kodlayici her bir kaynak sinyaline bagimsiz olarak uygulanabilir ve bu kaynaklarin sayisi ile ölçeklenen bir bit hizi ile sonuçlanir. Önerilen kodlama semasi, bir tekli mono ses kodlayici arti nispeten düsük bit hizli yan bilgi bulunan yüksek sayida ses kaynak sinyallerini sifreleyebilir. Bölüm V'de tarif edildigi üzere, ses kalitesi, eger hafiza kapasitesi bunu yapmaya müsait ise birden fazla iletilmis kanal kullanarak gelistirilebilir.
BNEta-veri ile re-miksleme Bölüni VI'da tarif edildigi üzere, mevcut stereo ve çok kanalli ses sinyalleri, ilave yan bilginin yardimiyla re- mikslenebilir (yani "meta-veri"). Sadece optimize stereo ve çok kanalli miksli ses içerigi satmaya karsi olarak, meta veri bir kullaniciya kendi stereo ve çok kanalli müzigini re-mikslemesine izin vererek satilabilir. Bu örnegin, karaoke için bir sarkida vokalleri azaltmak için ya da müzik ile birlikte bir enstrüman Çalmak için spesifik enstrümanlari kismak için kullanilabilir.
Depolama bir sorun olmasa bile, açiklanan sema, müzigin kisiye özel mikslemesini mümkün kildigi için çok cazip olabilir. Çünkü müzik endüstrisinin çoklu parça kayitlarini hiçbir zaman birakmak istemeyecek olmasi olasidir. Kötüye kullanim açsisindan çok fazla tehlike vardir. Önerilen sema, çoklu parça kayitlardan vazgeçmeden re-miksleme yapabilmeyi mümkün kilar.
Dahasi, stereo ya da çok kanalli sinyaller re-mikslenir re- mikslenmez belirli derecede bir kalite azalmasi meydana gelir ve re-mikslerin yasal olmayan dagitimini daha az cazip kilar. c. Dalga alani sentez dönüsümüne stereo/çok kanal Bölüm VI'da açiklanan sema için diger bir uygulama asagida açiklanmaktadir. Hareketli resimlere eslik eden stereo ve çok kanalli (ör. 5.1 surround) ses yan bilgi eklenerek dalga alani sentez isleme için genisletilebilir. Örnegin, Dolby AC-3 (DVD'de ses) dalga alani sentez sistemleri için .1 geriye dönük uyumlu ses kodlama için genisletilebilir, yani DVDler 5.1 surround sesi konvansiyonel eskiden kalan oynaticilarda ve dalga alani sentez sesi yan bilginin islemesini destekleyen yeni nesil oynaticilarda oynatir.
VIII.ÖZNE.L DEGERLENDIRME Bölüm IV-A ve IV-B'de önerilen algoritmalarin bir gerçek zamanli sifre çözücüsünü gerçeklestirdik. Bir FFT-tabanli STFT filtre bankasi kullanilir. Bir lOZ4-nokta FFT ve bir kullanilir. Spektral katsayilar, her` bir grubun, esdeger dikdörtgen bant genisliginin (ERB) iki kati bir bant genisligine sahip sinyali temsil edecegi sekilde birlikte gruplanir. Resmi olmayan dinleme, ses kalitesinin daha yüksek frekans çözünürlügü seçildiginde dikkate deger sekilde gelismedigini açiga çikarmistir. Daha düsük bir frekans çözünürlügü, iletilecek daha az parametre ile sonuçlandigindan avantajlidir.
Her bir kaynak için genlik/gecikme kaydirma ve kazanim tek tek ayarlanabilir. Algoritma, 12 14 parçali birçok çok parçali ses kayitlarinin kodlamasi için kullanilmistir.
Sifre çözücü, 5.1 surround mikslemenin bir vektör tabanli genlik kaydirma (VBAP) karistirici kullanmasina izin verir.
Her kaynak sinyalinin yönü ve kazanimi ayarlanabilir.
Yazilim, kodlu kaynak sinyalinin miksleme ile orijinal ayrik kaynak sinyallerini miksleme arasinda çalismasin sirasinda geçis yapilmasina izin verir.
Rahat dinleme genellikle, eger her bir kaynak için sifir dB'nin bir kazanimi Gi kullanilirsa kodlu ya da orijinal kaynak sinyallerini karistirma arasinda çok az ya da hiçbir fark ortaya koymaz. Kaynak kazanimlari ne kadar çesitlenirse o kadar fazla yapay olgular meydana gelir.
Kaynaklarin hafif güçlendirilmesi ya da azaltilmasi (ör. ± 6 dB'ye kadar) halen iyi ses verir. Kritik bir senaryo, tüm kaynaklarin bir tarafa mikslenmesi ve sadece bir tekli kaynagin diger karsi tarafa mikslenmesidir. Bu durumda ses kalitesi spesifik miksleme ve kaynak sinyallerine bagli olarak azalabilir. Örnegin çok parçali kayitin kanallari gibi ses kaynak sinyallerinin, birlesik, kodlamasi için› bir kodlama semasi önerilmistir. Amaç, kaynak sinyali dalga biçimlerini yüksek kalite ile kodlamak degildir, bu durumda birlesik kodlama, ses kaynaklari genellikle bagimsiz oldugundan minimal kodlama kazanimi verebilir. Amaç, kodlu kaynak sinyalleri mikslendiginde yüksek kaliteli bir ses sinyali elde edilmesidir. Kaynak sinyallerinin istatistiksel Özelliklerini, miksleme semalarinin ve uzamsal isitmenin özelliklerini ele alarak, önemli kodlama kazanim gelisiminin, kaynak sinyallerini birlesik kodlayarak elde edildigi gösterilmistir.
Kodlama kazanim gelisimi, sadece bir ses dalga biçiminin iletilmesinden kaynaklanmaktadir.
Ilaveten, nihai karistirilan sinyalin uzamsal algisini belirleyen ilgili faktörler olan kaynak sinyallerinin istatistiksel Özelliklerini temsil eden yan bilgiler Yan bilgi hizi kaynak sinyali basina yaklasik 3 kbs'dir. Örnegin stereo, çok kanalli ya da dalga alani sentezi karistiricilari gibi, kodlu kaynak sinyalleri ile herhangi Daha yüksekr bit hizi ve kalitesi için birden fazla ses kanalini ileterek önerilen semayi ölçekleme kolay bir yoldur. Dahasi, belirli stereo ya da çok kanalli ses sinyalinin re-mikslenmesine olanak taniyan, semanin bir varyasyonu öne sürülmüstür (ve hatta ses formatinin degismesi, ör. stereodan çok kanalli ya da dalga alani sentezine). Öne sürülen semanin uygulamalari çogaltilir. Örnegin, MPEG- 4, birden fazla "dogal ses nesnesi" (kaynak sinyali) iletilmek sorunda oldugunda bit hizini azaltmak için öne sürülen sema ile genisletilebilir. Ayni zamanda öne sürülen sema, dalga alani sentez sistemleri için içerigin kompakt gösterimini önerir. Bahsedildigi üzere, mevcut stereo ya da çok kanalli sinyaller, kullanicinin kendi begenisine göre sinyalleri re-mikslemesine izin vermek için yan bilgiler ile tamamlanabilir.
REFERANSLAR tezi, Isviçre Lozan Federal Teknoloji Enstitüsü (EPFL), 2004, Ph.D. Tez No. 3062.

Claims (3)

ISTEMLER
1.Çok sayida kaynak sinyallerini (sl(n),sZ(n),-- ,sM(n)) sifreleme yöntemi olup, asagidakileri içermektedir: çok sayida kaynak sinyalleri (sl(n),sZ(n),-",sM(n)) için, çok sayida kaynak sinyallerinin kaynak sinyallerinin (sl(n),52(n),'°',sM(n)) spektral zarflarini gösteren istatistiksel bilgileri hesaplamayi ki burada istatistiksel bilgi ilaveten, çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir albandi için spesifik. bir kaynak sinyalinin bir normallestirilmis altbant oto-korelasyon fonksiyonu ((®i(n,e)) hakkinda bilgi içerir; ve kaynak sinyallerinin (sl(n),52(n), - ,sM(n)) spektral zarflarini gösteren istatistiksel bilgiyi ve çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir albandi için normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden (sl(n),sZ(n),~--,sM(n)) türetilen bir ses sinyali için meta veri olarak iletme.
2.Birden fazla sayida kaynak sinyalini (sl(n),sZ(n),-~~,sM(n)) sifreleme cihazi olup, burada çok sayida kaynak sinyalleri (sl(n),52(n),-",SM(n)) için, kaynak. sinyallerinin (sl(n),sZ(n),--~,sM(n)) spektral zarflarini gösteren istatistiksel bilgileri hesaplamak üzere çalismaktadir ki burada istatistiksel bilgi ilaveten, çok sayida kaynak sinyallerinin her bir kaynak sinyali için ve çok sayida altbandin her bir altbandi için spesifik bir kaynak sinyalinin bir normallestirilmis altbant oto-korelasyon fonksiyonu ((®i(n,e)) hakkinda bilgi içerir; ve kaynak sinyallerinin (sl(n),52(n),- -,sM(n)) spektral zarflarini gösteren istatistiksel bilgiyi ve çok sayida kaynak sinyallerinin her bir kaynak sinyali için. ve çok sayida altbandin her bir altbandi için normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden (Sl(n),sZ(n),-",sM(n)) türetilen bir ses sinyali için meta veri olarak iletmek üzere çalismaktadir.
3.Istem 2'deki cihaz olup, burada hesaplama, çok sayida kaynak sinyallerini mikslemek üzere miksleme parametreleri tarafindan belirlenen bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri hesaplamayi içerir ve burada iletici, zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonu hakkindaki bilgileri çok sayida kaynak sinyallerinden türetilen bir ses sinyali için meta veri olarak iletmek üzere yapilandirilir. .Istem 2'deki cihaz olup, burada iletme, iletilen bilgi olarak, ön tanimli otokorelasyon fonksiyonlarinin bir depolanmis setinde bir ön tanimli otokorelasyon fonksiyonunu tanimlayan bir .Istem 2'deki cihaz olup, burada hesaplama, asagidaki denkleme dayanarak belirlenen bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonunu hesaplamayi içerir: m}n{:77}~ me smsmm- Ti- burada e, zaman araligidir, I , çok sayida kaynak sinyallerinin kaynak sinyalleri için karistirma parametreleri arasindan bir en küçük karistirma parametresidir, l { } kaynak sinyalleri için karistirma parametreleri arasindan bir` en büyük karistirma parametresidir' ve Ti, dikkate alinan spesifik kaynak sinyali için bir karistirma parametresidir. .Istem 2'deki cihaz olup, burada hesaplama, asagidaki denkleme dayanan bir zaman araligi için spesifik kaynak sinyalinin normallestirilmis altbant oto-korelasyon fonksiyonunu hesaplamayi içerir: burada ®(n,e), spesifik kaynak sinyalinin normallestirilmis altbant otokorelasyon fonksiyonudur, n, bir zaman indeksi, e, zaman araligi, E, bir beklenti operatörü, i, bir kaynak sinyalini tanimlayan bir indeks ve si, dikkate alinan spesifik kaynak sinyalidir. .Istem 2'deki cihaz olup, burada hesaplama, bir kaynak için, kaynak sinyallerinin ( sl(n),52(n), '~,sMKn)) spektral zarflarini, çok sayida altbantlarin her bir altbandi için bir altbant gücünü ya da kafes filtre parametrelerini ya da LPC parametrelerini ya da hat spektral çift parametrelerini gösteren istatistiksel bilgi olarak hesaplamayi içermekte ve burada iletme, kaynak sinyallerinin ( sl(n),52(n),'-',sMfn)) spektral zarflarini, her bir kaynak sinyali için çok sayida altbantlarin her bir altbandi için altbant güçlerini ya da kafes filtre parametrelerini ya da LPC parametrelerini ya da hat spektral çift parametrelerini meta veri olarak gösteren istatistiksel bilgi olarak iletmeyi içermektedir. .Istem 2'deki cihaz olup, burada hesaplayici, her seferinde ve her bir altbant için, en güçlü kaynagin gücünü seçmek ve tüm diger kaynaklarin ilgili altbant gücünü, bir nicemleyicinin bir dinamik. araligini sinirlandirmak için en güçlü altbant kaynagindan daha düsük olan bir 24dB degerinde alt sinirlamak üzere yapilandirilir.
TR2018/11059T 2005-02-14 2006-02-13 Ses kaynaklarının parametrik birleşik kodlaması. TR201811059T4 (tr)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP05101055A EP1691348A1 (en) 2005-02-14 2005-02-14 Parametric joint-coding of audio sources

Publications (1)

Publication Number Publication Date
TR201811059T4 true TR201811059T4 (tr) 2018-08-27

Family

ID=34938725

Family Applications (1)

Application Number Title Priority Date Filing Date
TR2018/11059T TR201811059T4 (tr) 2005-02-14 2006-02-13 Ses kaynaklarının parametrik birleşik kodlaması.

Country Status (18)

Country Link
US (12) US8355509B2 (tr)
EP (4) EP1691348A1 (tr)
JP (2) JP5179881B2 (tr)
KR (1) KR100924577B1 (tr)
CN (2) CN101133441B (tr)
AT (1) ATE531035T1 (tr)
AU (3) AU2006212191B2 (tr)
BR (5) BR122018072508B1 (tr)
CA (2) CA2597746C (tr)
ES (2) ES2682073T3 (tr)
HK (2) HK1107723A1 (tr)
IL (1) IL185192A (tr)
MX (1) MX2007009559A (tr)
NO (1) NO338701B1 (tr)
PL (1) PL1844465T3 (tr)
RU (1) RU2376654C2 (tr)
TR (1) TR201811059T4 (tr)
WO (1) WO2006084916A2 (tr)

Families Citing this family (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
KR101218776B1 (ko) * 2006-01-11 2013-01-18 삼성전자주식회사 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체
CN101410891A (zh) 2006-02-03 2009-04-15 韩国电子通信研究院 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置
KR20080093422A (ko) * 2006-02-09 2008-10-21 엘지전자 주식회사 오브젝트 기반 오디오 신호의 부호화 및 복호화 방법과 그장치
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
EP3236587B1 (en) * 2006-07-04 2018-11-21 Dolby International AB Filter system comprising a filter converter and a filter compressor and method for operating the filter system
ES2396072T3 (es) * 2006-07-07 2013-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato para combinar múltiples fuentes de audio paramétricamente codificadas
MX2008012251A (es) 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
RU2407072C1 (ru) * 2006-09-29 2010-12-20 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов
EP2084703B1 (en) * 2006-09-29 2019-05-01 LG Electronics Inc. Apparatus for processing mix signal and method thereof
EP2084901B1 (en) * 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
KR100891665B1 (ko) 2006-10-13 2009-04-02 엘지전자 주식회사 믹스 신호의 처리 방법 및 장치
ATE539434T1 (de) * 2006-10-16 2012-01-15 Fraunhofer Ges Forschung Vorrichtung und verfahren für mehrkanalparameterumwandlung
CA2874454C (en) 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
CA2669091C (en) 2006-11-15 2014-07-08 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
JP5394931B2 (ja) * 2006-11-24 2014-01-22 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の復号化方法及びその装置
JP5081250B2 (ja) * 2006-12-01 2012-11-28 エルジー エレクトロニクス インコーポレイティド 命令入力装置及び方法、メディア信号のユーザインタフェース表示方法及びその具現装置、並びにミックス信号処理装置及びその方法
EP2102858A4 (en) * 2006-12-07 2010-01-20 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
JP5463143B2 (ja) 2006-12-07 2014-04-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
CN101578656A (zh) * 2007-01-05 2009-11-11 Lg电子株式会社 用于处理音频信号的装置和方法
KR101049143B1 (ko) 2007-02-14 2011-07-15 엘지전자 주식회사 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법
CN101542597B (zh) * 2007-02-14 2013-02-27 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
JP5285626B2 (ja) * 2007-03-01 2013-09-11 ジェリー・マハバブ 音声空間化及び環境シミュレーション
KR20080082916A (ko) * 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
US8463413B2 (en) 2007-03-09 2013-06-11 Lg Electronics Inc. Method and an apparatus for processing an audio signal
JP5161893B2 (ja) * 2007-03-16 2013-03-13 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
PL2137725T3 (pl) 2007-04-26 2014-06-30 Dolby Int Ab Urządzenie i sposób do syntetyzowania sygnału wyjściowego
CN103299363B (zh) * 2007-06-08 2015-07-08 Lg电子株式会社 用于处理音频信号的方法和装置
CN101715643B (zh) 2007-06-27 2012-12-26 日本电气株式会社 多地点连接装置、信号分析以及装置、其方法及程序
EP2560164A3 (en) 2007-06-27 2013-04-17 Nec Corporation Signal control device, its system, method, and program
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
EP2191462A4 (en) 2007-09-06 2010-08-18 Lg Electronics Inc METHOD AND DEVICE FOR DECODING A SOUND SIGNAL
GB2453117B (en) 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
KR101464977B1 (ko) * 2007-10-01 2014-11-25 삼성전자주식회사 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치
JPWO2009050896A1 (ja) * 2007-10-16 2011-02-24 パナソニック株式会社 ストリーム合成装置、復号装置、方法
US8527282B2 (en) 2007-11-21 2013-09-03 Lg Electronics Inc. Method and an apparatus for processing a signal
JP2009128559A (ja) * 2007-11-22 2009-06-11 Casio Comput Co Ltd 残響効果付加装置
EP2175670A1 (en) * 2008-10-07 2010-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Binaural rendering of a multi-channel audio signal
CN101547265B (zh) * 2008-10-20 2014-07-30 华为终端有限公司 一种3d音频会议的信号处理方法、设备以及系统
EP2337328B1 (en) 2008-10-20 2014-12-03 Huawei Device Co., Ltd. Method, system and apparatus for processing 3d audio signal
WO2010053728A1 (en) 2008-10-29 2010-05-14 Dolby Laboratories Licensing Corporation Signal clipping protection using pre-existing audio gain metadata
KR101137361B1 (ko) * 2009-01-28 2012-04-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
EP2626855B1 (en) 2009-03-17 2014-09-10 Dolby International AB Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
RU2529591C2 (ru) * 2009-06-30 2014-09-27 Нокиа Корпорейшн Устранение позиционной неоднозначности при формировании пространственного звука
US9536529B2 (en) * 2010-01-06 2017-01-03 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
EP2485213A1 (en) * 2011-02-03 2012-08-08 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Semantic audio track mixer
TWI603632B (zh) 2011-07-01 2017-10-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
CN103999453B (zh) * 2011-09-18 2019-04-12 踏途音乐公司 具有卡拉ok和照相亭功能的数字点播设备及相关方法
CN103050124B (zh) 2011-10-13 2016-03-30 华为终端有限公司 混音方法、装置及系统
KR20130093783A (ko) * 2011-12-30 2013-08-23 한국전자통신연구원 오디오 객체 전송 장치 및 방법
CN112185399A (zh) * 2012-05-18 2021-01-05 杜比实验室特许公司 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
CN102695116B (zh) * 2012-05-30 2015-06-03 蒋憧 一种声音采集、处理和再现方法
BR122021021487B1 (pt) 2012-09-12 2022-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d
EP2898506B1 (en) 2012-09-21 2018-01-17 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
WO2014085510A1 (en) * 2012-11-30 2014-06-05 Dts, Inc. Method and apparatus for personalized audio virtualization
TWI618050B (zh) * 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
CN107426666B (zh) * 2013-03-28 2019-06-18 杜比实验室特许公司 用于创作和渲染音频再现数据的非暂态介质和设备
EP2991383B1 (en) * 2013-04-26 2021-01-27 Sony Corporation Audio processing device and audio processing system
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830049A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
CN110797037A (zh) * 2013-07-31 2020-02-14 杜比实验室特许公司 用于处理音频数据的方法和装置、介质及设备
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
WO2015150480A1 (en) 2014-04-02 2015-10-08 Dolby International Ab Exploiting metadata redundancy in immersive audio metadata
RU2571921C2 (ru) * 2014-04-08 2015-12-27 Общество с ограниченной ответственностью "МедиаНадзор" Способ фильтрации бинауральных воздействий в аудиопотоках
CN104036788B (zh) * 2014-05-29 2016-10-05 北京音之邦文化科技有限公司 音频文件的音质识别方法及装置
CN105336333B (zh) * 2014-08-12 2019-07-05 北京天籁传音数字技术有限公司 多声道声音信号编码方法、解码方法及装置
CN107004421B (zh) * 2014-10-31 2020-07-07 杜比国际公司 多通道音频信号的参数编码和解码
CN105895086B (zh) 2014-12-11 2021-01-12 杜比实验室特许公司 元数据保留的音频对象聚类
CN106033671B (zh) * 2015-03-09 2020-11-06 华为技术有限公司 确定声道间时间差参数的方法和装置
KR102657547B1 (ko) 2015-06-17 2024-04-15 삼성전자주식회사 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치
DK3353779T3 (da) * 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
US11152014B2 (en) 2016-04-08 2021-10-19 Dolby Laboratories Licensing Corporation Audio source parameterization
US10224042B2 (en) 2016-10-31 2019-03-05 Qualcomm Incorporated Encoding of multiple audio signals
US10424307B2 (en) * 2017-01-03 2019-09-24 Nokia Technologies Oy Adapting a distributed audio recording for end user free viewpoint monitoring
JP6787183B2 (ja) * 2017-02-28 2020-11-18 ヤマハ株式会社 音制御装置及び方法
CN110800048B (zh) * 2017-05-09 2023-07-28 杜比实验室特许公司 多通道空间音频格式输入信号的处理
WO2020205175A1 (en) 2019-04-05 2020-10-08 Tls Corp. Distributed audio mixing
CN113096672B (zh) * 2021-03-24 2022-06-14 武汉大学 一种应用于低码率下的多音频对象编解码方法

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4544919A (en) * 1982-01-03 1985-10-01 Motorola, Inc. Method and means of determining coefficients for linear predictive coding
JPH0650439B2 (ja) * 1986-07-17 1994-06-29 日本電気株式会社 マルチパルス駆動形音声符号化器
JP2659605B2 (ja) * 1990-04-23 1997-09-30 三菱電機株式会社 音声復号化装置及び音声符号化・復号化装置
US5764779A (en) * 1993-08-25 1998-06-09 Canon Kabushiki Kaisha Method and apparatus for determining the direction of a sound source
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5712437A (en) * 1995-02-13 1998-01-27 Yamaha Corporation Audio signal processor selectively deriving harmony part from polyphonic parts
JP2766466B2 (ja) * 1995-08-02 1998-06-18 株式会社東芝 オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
DE19632734A1 (de) * 1996-08-14 1998-02-19 Thomson Brandt Gmbh Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
US6005948A (en) * 1997-03-21 1999-12-21 Sony Corporation Audio channel mixing
JPH11109995A (ja) * 1997-10-01 1999-04-23 Victor Co Of Japan Ltd 音響信号符号化器
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6188987B1 (en) * 1998-11-17 2001-02-13 Dolby Laboratories Licensing Corporation Providing auxiliary information with frame-based encoded audio information
JP4610087B2 (ja) * 1999-04-07 2011-01-12 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 損失のない符号化・復号へのマトリックス改良
US6539357B1 (en) * 1999-04-29 2003-03-25 Agere Systems Inc. Technique for parametric coding of a signal containing information
TW510143B (en) * 1999-12-03 2002-11-11 Dolby Lab Licensing Corp Method for deriving at least three audio signals from two input audio signals
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7212872B1 (en) * 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE519985C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US20100042406A1 (en) * 2002-03-04 2010-02-18 James David Johnston Audio signal processing using improved perceptual model
DE60311794C5 (de) * 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
KR101016982B1 (ko) * 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
JP4013822B2 (ja) * 2002-06-17 2007-11-28 ヤマハ株式会社 ミキサ装置およびミキサプログラム
KR100981699B1 (ko) * 2002-07-12 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US7542896B2 (en) 2002-07-16 2009-06-02 Koninklijke Philips Electronics N.V. Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
AU2003260841A1 (en) * 2002-09-23 2004-04-08 Koninklijke Philips Electronics N.V. Generation of a sound signal
EP1552724A4 (en) * 2002-10-15 2010-10-20 Korea Electronics Telecomm METHOD FOR GENERATING AND USING A 3D AUDIOSCENCE WITH EXTENDED EFFICIENCY OF SOUND SOURCE
US7243064B2 (en) * 2002-11-14 2007-07-10 Verizon Business Global Llc Signal processing of multi-channel data
US20040117186A1 (en) * 2002-12-13 2004-06-17 Bhiksha Ramakrishnan Multi-channel transcription-based speaker separation
US20040176950A1 (en) * 2003-03-04 2004-09-09 Docomo Communications Laboratories Usa, Inc. Methods and apparatuses for variable dimension vector quantization
DE602004007945T2 (de) * 2003-09-29 2008-05-15 Koninklijke Philips Electronics N.V. Codierung von audiosignalen
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
JP4939933B2 (ja) * 2004-05-19 2012-05-30 パナソニック株式会社 オーディオ信号符号化装置及びオーディオ信号復号化装置
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US20060009274A1 (en) * 2004-07-08 2006-01-12 Richard Finocchio Method of playing a game of roulette
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
WO2006022308A1 (ja) * 2004-08-26 2006-03-02 Matsushita Electric Industrial Co., Ltd. マルチチャネル信号符号化装置およびマルチチャネル信号復号装置
US20060048226A1 (en) * 2004-08-31 2006-03-02 Rits Maarten E Dynamic security policy enforcement
DE102004043521A1 (de) * 2004-09-08 2006-03-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals oder eines Parameterdatensatzes
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
JP4809370B2 (ja) * 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
KR20080015878A (ko) * 2005-05-25 2008-02-20 코닌클리케 필립스 일렉트로닉스 엔.브이. 복수 채널 신호의 예측 엔코딩
AU2006266579B2 (en) * 2005-06-30 2009-10-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
EP2102858A4 (en) * 2006-12-07 2010-01-20 Lg Electronics Inc METHOD AND DEVICE FOR PROCESSING AN AUDIO SIGNAL
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
US8332229B2 (en) * 2008-12-30 2012-12-11 Stmicroelectronics Asia Pacific Pte. Ltd. Low complexity MPEG encoding for surround sound recordings
TWI590234B (zh) * 2012-07-19 2017-07-01 杜比國際公司 編碼聲訊資料之方法和裝置,以及解碼已編碼聲訊資料之方法和裝置

Also Published As

Publication number Publication date
EP1995721A1 (en) 2008-11-26
BR122018072505B1 (pt) 2019-07-16
AU2009200407B2 (en) 2010-11-25
JP5179881B2 (ja) 2013-04-10
US20120314879A1 (en) 2012-12-13
JP2012234192A (ja) 2012-11-29
NO20073892L (no) 2007-11-14
US9668078B2 (en) 2017-05-30
EP2320414A1 (en) 2011-05-11
AU2010236053B2 (en) 2012-10-18
ES2374434T3 (es) 2012-02-16
US10339942B2 (en) 2019-07-02
US10650835B2 (en) 2020-05-12
CA2597746A1 (en) 2006-08-17
MX2007009559A (es) 2007-12-10
US20220392466A1 (en) 2022-12-08
US20220392468A1 (en) 2022-12-08
ES2682073T3 (es) 2018-09-18
HK1107723A1 (en) 2008-07-11
CA2707761C (en) 2014-04-29
US10657975B2 (en) 2020-05-19
US20190066705A1 (en) 2019-02-28
US11621007B2 (en) 2023-04-04
US8355509B2 (en) 2013-01-15
US11621006B2 (en) 2023-04-04
JP2008530603A (ja) 2008-08-07
CA2707761A1 (en) 2006-08-17
EP1691348A1 (en) 2006-08-16
US10643628B2 (en) 2020-05-05
US20190066706A1 (en) 2019-02-28
BR122018072508B1 (pt) 2019-07-16
US20190066704A1 (en) 2019-02-28
CN101133441B (zh) 2011-05-25
BRPI0607166B1 (pt) 2019-06-25
CN101133441A (zh) 2008-02-27
CN102123341A (zh) 2011-07-13
US11621005B2 (en) 2023-04-04
US11495239B2 (en) 2022-11-08
US20070291951A1 (en) 2007-12-20
CN102123341B (zh) 2013-07-03
PL1844465T3 (pl) 2012-03-30
AU2010236053A1 (en) 2010-11-18
WO2006084916A2 (en) 2006-08-17
RU2376654C2 (ru) 2009-12-20
US20170055095A1 (en) 2017-02-23
US20170103763A9 (en) 2017-04-13
WO2006084916A3 (en) 2007-03-08
BRPI0607166A2 (pt) 2009-08-11
IL185192A (en) 2014-02-27
HK1159392A1 (en) 2012-07-27
CA2597746C (en) 2016-02-16
US20200234721A1 (en) 2020-07-23
KR20070107698A (ko) 2007-11-07
US10643629B2 (en) 2020-05-05
AU2009200407A1 (en) 2009-02-26
US20190066703A1 (en) 2019-02-28
US11682407B2 (en) 2023-06-20
AU2006212191B2 (en) 2009-01-15
EP2320414B1 (en) 2018-05-02
EP1844465A2 (en) 2007-10-17
NO338701B1 (no) 2016-10-03
IL185192A0 (en) 2008-01-06
US20220392469A1 (en) 2022-12-08
EP1844465B1 (en) 2011-10-26
AU2006212191A1 (en) 2006-08-17
US20220392467A1 (en) 2022-12-08
RU2007134215A (ru) 2009-03-20
ATE531035T1 (de) 2011-11-15
KR100924577B1 (ko) 2009-11-02
JP5638037B2 (ja) 2014-12-10
BR122018072501B1 (pt) 2019-07-09
BR122018072504B1 (pt) 2019-07-09

Similar Documents

Publication Publication Date Title
US11621005B2 (en) Parametric joint-coding of audio sources
KR101215868B1 (ko) 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치
KR101236259B1 (ko) 오디오 채널들을 인코딩하는 방법 및 장치
RU2396608C2 (ru) Способ, устройство, кодирующее устройство, декодирующее устройство и аудиосистема