TR201802631T4 - Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder - Google Patents
Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder Download PDFInfo
- Publication number
- TR201802631T4 TR201802631T4 TR2018/02631T TR201802631T TR201802631T4 TR 201802631 T4 TR201802631 T4 TR 201802631T4 TR 2018/02631 T TR2018/02631 T TR 2018/02631T TR 201802631 T TR201802631 T TR 201802631T TR 201802631 T4 TR201802631 T4 TR 201802631T4
- Authority
- TR
- Turkey
- Prior art keywords
- audio
- metadata
- program
- bitstream
- loudness
- Prior art date
Links
- 238000012545 processing Methods 0.000 claims abstract description 204
- 238000000034 method Methods 0.000 claims abstract description 56
- 230000003044 adaptive effect Effects 0.000 claims abstract description 18
- 238000012937 correction Methods 0.000 claims description 17
- 230000006835 compression Effects 0.000 claims description 7
- 238000007906 compression Methods 0.000 claims description 7
- 238000000691 measurement method Methods 0.000 claims 1
- 238000010606 normalization Methods 0.000 claims 1
- 238000005259 measurement Methods 0.000 description 24
- 230000001537 neural effect Effects 0.000 description 21
- 230000008569 process Effects 0.000 description 19
- 210000005036 nerve Anatomy 0.000 description 17
- 230000004044 response Effects 0.000 description 17
- 239000002699 waste material Substances 0.000 description 17
- 238000010200 validation analysis Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000037431 insertion Effects 0.000 description 12
- 238000003780 insertion Methods 0.000 description 11
- 238000012805 post-processing Methods 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 7
- 238000007781 pre-processing Methods 0.000 description 7
- 238000009877 rendering Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 230000033228 biological regulation Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- SVPXDRXYRYOSEX-UHFFFAOYSA-N bentoquatam Chemical compound O.O=[Si]=O.O=[Al]O[Al]=O SVPXDRXYRYOSEX-UHFFFAOYSA-N 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- OWZPCEFYPSAJFR-UHFFFAOYSA-N 2-(butan-2-yl)-4,6-dinitrophenol Chemical compound CCC(C)C1=CC([N+]([O-])=O)=CC([N+]([O-])=O)=C1O OWZPCEFYPSAJFR-UHFFFAOYSA-N 0.000 description 2
- 241001674048 Phthiraptera Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013502 data validation Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000004907 flux Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 108091081050 CrcZ Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 239000012572 advanced medium Substances 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007596 consolidation process Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/02—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers
- H03G9/025—Combinations of two or more types of control, e.g. gain control and tone control in untuned amplifiers frequency-dependent volume compression or expansion, e.g. multiple-band systems
Abstract
Program ses şiddeti meta verileri ve bit akışındaki ses verilerini, ve isteğe bağlı olarak aynı zamanda bit akışının en az bir segmentinde (örneğin, çerçeve) program sınır meta verilerini dahil ederek kodlanmış bir ses bit akışı oluşturmak için cihaz ve yöntemlerdir. Diğer açılar, bu türlü bir bit akışının kodunun çözülmesi için cihaz ve yöntemlerdir, örneğin, bit akışı tarafından gösterilen bir ses programının ses verilerinin adaptif ses şiddeti işlemesinin gerçekleştirilmesi, veya bu türlü bir ses programının meta verilerinin ve/veya ses verilerinin doğrulanması ve/veya geçerli kılınmasını içerir. Diğer bir açı, yöntemin herhangi bir düzenlemesini gerçekleştirmek üzere konfigüre edilen (örneğin, programlanan) bir ses işleme birimidir (örneğin, bir enkoder, dekoder veya post-işlemci) veya bu, yöntemin herhangi bir düzenlemesine göre üretilen bir ses bit akışının en az bir çerçevesini depolayan bir tampon bellek içerir.
Description
TARIFNAME
PROGRAM SES SIDDETI VE SINIR META VERILERE SAHIP SESLI
ENKODER VE DEKODER
ILGILI BASVURULARA CAPRAZ REFERANS
Bu basvuru, 21 Ocak 2013 tarihinde dosyalanan Birlesik Devletler Provizyonel Patent
Provizyonel Patent Basvurusu No. 61/824,010'a rüçhan isteminde bulunmaktadir.
TEKNIK SAHA
Bulus, ses sinyali islemesine ve daha özel olarak, ses içeriginin ses siddeti isleme
durumunun ve bit akislari tarafindan gösterilen ses program sinirlarinin konumunun
göstergesi olan meta verilere sahip ses veri bit akislarinin kodlanmasi ve kodun
çözülmesi ile ilgilidir. Bulusun bazi uygulamalari, ses verilerini AC-3, Gelistirilmis AC-3
veya E-AC-3 veya Dolby E olarak bilinen formatlardan biri olarak üretir veya kodu
BULU UN ALT YAPISI
Dolby, Dolby Digital, Dolby Digital Plus ve Dolby E Dolby Laboratories Licensing
Corporation'in ticari markalaridir. Dolby Laboratories, Sirasiyla Dolby Digital ve Dolby
Digital Plus olarak bilinen AC-3 ve E-AC-3 özel uygulamalarini saglar.
Ses veri isleme birimleri tipik olarak kör bir tarzda çalisir ve veriler alinmadan önce
olusan ses verisinin islem geçmisini dikkate almaz. Bu, bir hedef ortam olusturma
aracinin kodlanmis ses verisinin tüm kod çözme ve isleyisini gerçeklestirmesi
sirasinda, tek bir varligin tüm ses veri isleme ve çesitli hedef ortam olusturma araçlarini
kodlamasinin gerçeklestigi bir isleme çerçevesinde çalisabilir. Bununla birlikte, bu kör
isleme, çok sayida ses isleme birimi farkli bir aga dagilmis durumdaysa veya birbiri
ardina yerlestirildiyse (diger bir deyisle, zincir) ve kendi ses isleme tiplerini optimal
olarak yerine getirmeleri beklendiginde iyi çalismaz (veya hiç çalismaz). Örnegin, bazi
ses verileri, yüksek performansli ortam sistemleri için kodlanmis olabilir ve bir medya
isleme zinciri boyunca bir mobil cihaz için uygun indirgenmis bir forma
dönüstürülmelidir. Buna göre, bir ses isleme birimi, daha önce gerçeklestirilen ses
verilerinde gereksiz bir isleme tipi uygulayabilir. Örnegin, bir ses seviyelendirme birimi,
giris ses klibinde ayni veya daha fazla ses seviyelendirmesinin daha önce
gerçeklestirilmis olup olmadigina bakilmaksizin, bir giris ses klibi üzerinde isleme
gerçeklestirebilir. Sonuç olarak, ses seviyelendirme birimi, gerekli olmadiginda bile
seviyelendirmeyi gerçeklestirebilir. Bu gereksiz isleme, ses verilerinin içerigini
olustururken bozulmaya ve/veya belirli özelliklerin kaldirilmasina neden olabilir.
Tipik bir ses veri akisi hem ses içerigini (örnegin, bir veya daha fazla ses içerigi
kanalini) hem de ses içeriginin en az bir özelligini gösteren meta verileri içerir. Örnegin,
bir AC-3 bit akisinda, özellikle dinleme ortamina iletilen program sesinin
degistirilmesinde kullanilmasi amaçlanan birkaç ses meta veri parametresi bulunur.
Meta veri parametrelerinden biri DIALNORM parametresidir ve bir ses programinda
olusan iletisimin ortalama seviyesini gösterme amaçlidir ve ses çalma sinyal seviyesini
belirlemek için kullanilir.
Farkli ses programi segmentlerinden olusan bir dizinin (her biri farkli bir DIALNORM
parametresine sahip) bir bit akisinin yürütülmesi sirasinda, bir AC-3 dekoder, bir tür
ses siddeti islemi gerçeklestirmek için her segmentin DIALNORM parametresini
kullanir, burada segment dizisinin dizi kutusunun algilanan ses siddeti tutarli bir
seviyede olacak sekilde oynatma seviyesini veya ses siddetini degistirir. Bir kodlanmis
ses elemani dizisindeki her kodlanmis ses segmenti (eleman) (genel olarak) farkli bir
DIALNORM parametresine sahip olur ve dekoder elemanlarinin her birinin seviyesini
ölçeklendirecektir, böylece her eleman için diyalog çalma seviyesi veya ses siddeti ayni
veya çok benzer olur, bununla birlikte, oynatma sirasinda elemanlarin farkli olanlarina
farkli kazanç miktarlarinin uygulanmasi gerekebilir.
DIALNORM, tipik olarak bir kullanici tarafindan ayarlanir ve kullanici tarafindan
herhangi bir deger ayarlanmazsa bir varsayilan DIALNORM degeri olmasina ragmen
otomatik olarak olusturulmaz. Örnegin, bir içerik Olusturucu, bir AC-3 enkoderinin
disindaki bir cihazla ses siddeti ölçümleri yapabilir ve daha sonra DIALNORM degerini
ayarlamak üzere sonucu (bir ses programinin konusulan diyalogunun ses siddetini
gösterir) enkodere aktarabilir. Dolayisiyla, DIALNORM parametresini dogru bir sekilde
ayarlamak için içerik olusturucusuna güvenmek gerekir.
Bir AC-3 bit akisindaki DIALNORM parametresinin hatali olmasinin çesitli nedenleri
vardir. Ilk olarak, her AC-3 enkoder, DIALNORM degeri içerik olusturucusu tarafindan
ayarlanmadiysa, bit akisinin olusturulmasi sirasinda kullanilan varsayilan DIALNORM
degerine sahiptir. Bu varsayilan deger, sesin gerçek diyalog ses siddeti seviyesinden
önemli derecede farkli olabilir. Ikincisi, bir içerik olusturucunun ses siddetini ölçmesi ve
DlALNORM degeri buna göre ayarlamis olsa bile, önerilen AC-3 ses siddeti ölçüm
yöntemine uymayan ve yanlis bir DlALNORM degeri olusturan bir ses siddeti ölçüm
algoritmasi veya sayaci kullanilmis olabilir. Üçüncüsü, DIALNORM degeri ölçümü ile ve
içerik Olusturucu tarafindan dogru sekilde ayarlanmis bir AC-3 bit akisi olusturulmus
olsa bile, iletim ve/veya bit akisinin depolanmasi sirasinda yanlis bir degere
degistirilmis olabilir. Örnegin, AC-3 bit akislari için televizyon yayini uygulamalarinda,
yanlis DIALNORM meta veri bilgisi kullanilarak kod çözülmesi, modifiye edilmesi ve
daha sonra yeniden kodlanmasi nadir degildir. Dolayisiyla, bir AC-3 bit akisinda
bulunan bir DIALNORM degeri yanlis veya hatali olabilir ve bu nedenle dinleme
deneyiminin kalitesini olumsuz yönde etkileyebilir.
Bundan baska, DIALNORM parametresi, karsilik gelen ses verisinin ses siddeti isleme
durumunu (örnegin, ses verileri üzerinde ses siddeti isleme tipi(ler)ini gerçeklestirmistir)
göstermez. Mevcut bulusa kadar, ses siddeti isleme durumu (örnegin, uygulanan ses
siddeti isleme tip(ler)i), ses bit akisinin ses Içerigi veya ses siddeti isleme durumu ve bit
akisinin ses içerigini gösteren meta verileri mevcut bulusta tarif edilen bir formatta
içermemistir. Böyle bir formatta ses siddeti isleme durumu meta verisi, Özellikle bir ses
bit akisinin adaptif ses siddeti islemesini kolaylastirmak ve/veya ses içeriginin ses
siddeti ve ses siddeti isleme durumunun geçerliligini dogrulamak için yararlidir.
Mevcut bulus bir AC-3 bit akisi, bir E-AC-3 bit akisi veya bir Dolby E bit akisi ile
kullanimla sinirli olmamakla birlikte, kolaylik saglamak için, ürettigi, kod çözdügü veya
baska sekillerde ses siddeti isleme meta verileri içeren bir bit akisini isler.
Bir AC-3 kodlanmis bit akisi meta verileri ve bir ila alti ses içerigi kanalini içermektedir.
Ses içerigi algisal ses kodlamasi kullanilarak sikistirilmis ses verileridir. Meta veriler,
bir dinleme ortamina gönderilen bir programin sesinin degistirilmesinde kullanilmasi
amaçlanan birkaç ses meta veri parametresini içerir.
AC-3'ün (Dolby Digital olarak da bilinir) kodlamasi iyi bilinmektedir ve asagidakileri
içeren birçok yayimlanmis referans ile ortaya konmustur:
ATSC Standard A52/A: Digital Audio Compression Standard (AC-3), Revision A,
Advanced Television Systems Committee, 20 Aug. 2001; ve Birlesik Devletler
Dolby Digital Plus Detaylari (E-AC-3) kodlamasinin ayrintilari, "Introduction to Dolby
Digital Plus, an Enhancement to the Dolby Digital Coding System," AES Convention
Dolby E kodlamanin ayrintilari, "Efficient Bit Allocation, Quantization, and Coding in an
ve "Professional Audio Coder Optimized for Use with Video", AES Preprint 5033, 107th
AES Conference August 1999'de ortaya konmustur.
Bir AC-3 kodlu ses bit akisinin her çerçevesi 1536 dijital ses örnekleri için ses içerigi ve
meta veriyi içerir. 48 kHz'Iik bir örnekleme orani için, 32 milisaniye dijital ses veya
saniyede 31.25 çerçeve hizi temsil eder.
Bir E-AC-3 kodlanmis ses bit akisinin her çerçevesi, çerçevenin bir, iki, üç veya alti ses
dijital ses örnekleri için ses içerigi ve meta verilerini içerir. 48 kHz'Iik bir örnekleme
Sekil 4'te gösterildigi gibi, her AC-3 çerçevesi sunlari içeren bölümlere (segmentlere)
ayrilir: bir senkronizasyon sözcügünü (SW) içeren (Sekil 5'de gösterildigi gibi) bir
Senkronizasyon Bilgi (SI) bölümü ve iki hata düzeltme kelimesinden birincisini (CRC1);
meta verinin çogunu içeren bir Bit akisi Bilgisi (BSI) bölümü; sikistirilmis ses içerigi
içeren (ve meta verileri de içerebilen) alti Ses Blogu (ABO ila ABS); ses içerigi
Sikistirildiktan sonra kalan kullanilmayan bitleri içeren atik bit segmentlerini (W); daha
fazla meta veri içerebilen bir Yardimci (AUX) bilgi segmentini; ve iki hata düzeltme
kelimesinden ikincisi (CRCZ). Atik bit segmentine (W) "atlama alani" da denilebilir.
Sekil 7'de gösterildigi gibi, her E-AC-3 çerçevesi, sunlari içeren bölümlere
(segmentlere) ayrilir: bir senkronizasyon sözcügünü (SW) içeren (Sekil 5'de gösterildigi
gibi) bir Senkronizasyon Bilgi (SI); meta verinin çogunu içeren bir Bit akis Bilgisi (BSI)
bölümü; sikistirilmis ses içerigi içeren (ve meta verileri de içerebilen) bir ila alti Ses
Blogu (ABO ila ABS): ses içerigi Sikistirildiktan sonra kalan kullanilmayan bitleri içeren
atik bit segmentleri (W) (sadece bir atik bit segmenti gösterilmesine ragmen, farkli bir
atik bit segmenti genellikle her ses blogunu takip eder); daha fazla meta veri içerebilen
bir Yardimci (AUX) bilgi bölümü; ve bir hata düzeltme kelimesi (CRC). Atik bit
segmentine (W) "atlama alani" da denilebilir.
Bir AC-3 (veya E-AC-3) bit akisinda, özellikle bir dinleme ortamina iletilen programin
sesinin degistirilmesinde kullanilmasi amaçlanan birkaç ses meta veri parametresi
bulunmaktadir. Meta veri parametrelerinden biri BSI segmentinde yer alan DIALNORM
parametresidir.
Sekil 6'da gösterildigi gibi, bir AC-3 çerçevesinin BSI segmenti, program için
DIALNORM degerini belirten bes bitlik bir parametreyi ("DIALNORM") içermektedir.
AC-3 çerçevesinin ses kodlama modu ("acmod") "O" oldugunda, ayni AC-3
çerçevesinde tasinan ikinci bir ses programinin DIALNORM degerini belirten bes bitlik
bir parametre ("DIALNORM2") dahil edilir, bu da dual-mono veya "1+1" kanal
yapilandirmasinin kullanimda oldugunu gösterir.
BSI segmenti ayrica, "addbsie" bitini takip eden ilave bit akisi bilgisinin varligini (veya
yoklugunu) belirten bir bayrak ("addbsie"), "addbsil" degerini izleyen herhangi bir ilave
bit akisi bilgisinin uzunlugunu gösteren bir parametre ("addbsil") ve "addbsil" degerini
izleyen en fazla 64 bitlik ek bit akisi bilgisini ("addbsi") içerir.
BSI segmenti, Sekil 6'da özellikle gösterilmeyen diger meta veri degerlerini içerir.
meta verileri ve meta veri dogrulama bilgisini içeren bir dijital bir bit akisini tarif
etmektedir. Meta veri dogrulama bilgisi, meta veriden ayri dijital bir bit akisinda
saglanmaktadir. Meta verilerinin tamami veya bir kismi ses için dogru olmayabilir. Meta
veri dogrulama bilgileri, meta verilerinin ses için dogru olup olmadigini algilamak ve
dogru degilse dogru sekilde degistirmek için kullanilabilir. Meta verileri algilamak ve
degistirmek için kullanilabilen meta veri dogrulama bilgileri, meta verinin dogru bir
versiyonunun bir kopyasini veya veri sikistirilmis bir kopyasini içerebilir.
Bulusun Kisa Açiklamasi
Bulus, ilgili bagimsiz koruma taleplerinin özelliklerine sahip olan bir ses isleme birimi ve
bir kodlanmis ses bir bit akisini çözmek için bir yöntem sunmaktadir. Tercih edilen
uygulamalar bagimli istemlerde anlatilmistir.
Bir uygulamalar sinifinda bir ses isleme birimi; birtampon bellek, bir ses dekoder ve bir
ayristirici içerir. Tampon bellek, kodlanmis bir ses bit akisinin en az bir çerçevesini
depolar. Kodlanmis ses bit akisi, ses verileri ve bir meta veri segmenti (örnegin, meta
veri kabi) içerir. Meta veri segmenti bir baslik, bir veya daha fazla meta veri yükü ve
koruma verileri içerir. Baslik, kabin baslangicini tanimlayan bir syncword içerir. Bir veya
daha fazla meta veri yükü, ses verileri ile iliskili bir ses programini tarif eder. Koruma
verileri bir veya daha fazla meta veri yükünden sonra konumlanir. Koruma verileri,
meta veri segmentinin bütünlügünü ve meta veri segmentindeki bir veya daha fazla
yükü dogrulamak için de kullanilabilir. Ses dekoderi, tampon bellege birlestirilir ve ses
verisinin kodunu çözebilir. Ayristirici, ses dekoderine birlestirilir veya entegre olur ve
meta veri segmentini ayristirma kabiliyetine sahiptir. Meta veri segmentini, ses
verilerinden ayri verileri temsil eder.
Tipik uygulamalarda, bir yöntem, kodlanmis ses bit akisinin bir veya daha çok
çerçeveye bölünmüs oldugu bir kodlanmis ses bit akisinin alinmasini içermektedir. Ses
verileri, bir meta veri kabi ile birlikte kodlanmis ses bit akisindan çikarilir. Meta veri
kabi, bir veya daha fazla meta veri yükü ve ardindan koruma verileri içeren bir baslik
içerir. Son olarak, kabin bütünlügü ve bir veya daha fazla meta veri yükü koruma
verileri kullanilarak dogrulanir. Bir veya daha fazla meta veri yükü, ses verileri ile iliskili
bir ses programinin ölçülen ses siddetini gösteren verileri içeren bir program ses siddeti
yükünü içerebilir.
Bulusa ait tipik uygulamalara uygun olarak bir ses bit akisina gömülü olan ses siddeti
isleme durumu meta verileri ("LPSM") olarak ifade edilen bir program ses siddeti meta
yükü, örnegin ses siddeti düzenleyici varliklarin belirli bir programin ses siddeti
önceden belirlenmis bir aralikta olup olmadigini ve karsilik gelen ses verisinin
kendisinin degistirilmedigini dogrulayabilir veya geçerli kilabilir (böylece geçerli
uygulamalara uyulmasini saglar). Ses siddetini hesaplamak yerine, bunu dogrulamak
için ses siddeti isleme durumu meta verilerini içeren bir veri blogunda bulunan bir ses
siddeti degeri okunabilir. LPSM'ye yanit olarak, bir düzenleyici kurum, ses içeriginin ses
siddetini hesaplamaya gerek kalmadan karsilik gelen ses içeriginin, (LPSM tarafindan
belirtildigi üzere) yasal ve/veya düzenleyici gerekliliklerle (örnegin, Ticari Reklam Ses
Siddeti Azaltma Yasasi uyarinca ilan edilen uygulamalar, "CALM" Yasasi olarak bilinir)
uyumlu oldugunu tespit edebilir).
Bazi ses siddeti kanunlarina ve/veya düzenleyici sartlara (örnegin, CALM Yasasi
uyarinca ilan edilen uygulamalara) uyulmasi için gereken ses siddeti ölçümleri, entegre
program ses siddetine dayanir. Entegre program ses siddeti, diyalog seviyesinden
veya tam karisim seviyesinden bir ses siddeti ölçümünün tüm ses programinda
yapilmasini gerektirir. Bu nedenle, tipik yasal sartlara uygunlugu dogrulamak için
program ses siddeti ölçümleri yapmak amaciyla (örnegin, yayin zincirindeki çesitli
asamalarda) ölçümlerin hangi ses verisinin (ve meta verinin) ses programinin tamamini
belirlediginin bilgisi ile yapilmasi gereklidir ve bu, tipik olarak, programin baslangicinin
ve bitisinin konumunun (örnegin, ses programlarinin bir dizinini gösteren bir bit akisinin
islenmesi sirasinda) bilgisi gerektirir.
Mevcut bulusun tipik uygulamalarina göre, kodlanmis bir ses bit akisi en az bir ses
programinin (örnegin, bir sesli program dizisi) göstergesidir ve bit akisi dahilindeki
program sinir meta verisi ve LPSM, bir programin sonunda program ses siddeti
ölçümünün resetlenmesini ve dolayisiyla entegre program ses siddetini ölçmenin
otomatik bir yolunu saglamaktadir. Bulusun tipik uygulamalari, bit akisi tarafindan
belirtilen ardisik ses programlari arasinda en az bir sinirin dogru ve saglam bir sekilde
belirlenmesine imkan veren verimli bir sekilde kodlanmis bir ses bit akisindaki program
sinir meta verilerini içerir. Tipik uygulamalar, bir program sinirinin, farkli programlari
gösteren bit akislarinin (bulusa ait bit akisini üretmek için) bir veya her ikisini birden
kirpan bir sekilde birbirine birlestirildigi durumlarda bile dogru program sinirinin
belirlenmesine olanak sagladiklamalari ile dogru ve saglam bir sekilde tespit
edilmesine izin verir (ve böylece, birlestirme öncesi bit akislarindan en az birinde
bulunan program sinir meta verilerini iptal eder).
Tipik uygulamalarda, bulusun bit akisinin bir çerçevesindeki program sinir meta verisi,
bir çerçeve sayimini gösteren bir program sinir bayragidir. Tipik olarak bayrak, geçerli
çerçeve (bayragi içeren çerçeve) ile bir program siniri (geçerli ses programinin basi
veya sonu) arasindaki çerçevelerin sayisini gösterir. Bazi tercih edilen uygulamalarda,
program sinir bayraklari, her bir bit akis segmentinin basinda ve sonunda, simetrik
olarak verimli bir segmentte yerlestirilir; bu, tek bir programi gösterir (diger bir deyisle,
segmentlerin baslangicindan sonra önceden belirlenmis sayida çerçeve içinde
meydana gelen çerçevelerde ve segmentlerin bitiminden Önceki çerçevelerin önceden
belirlenmis sayida meydana gelen çerçevelerde), böylelikle bu iki bit akisi segmenti
birlestirildiginde (iki programin bir dizisinin göstergesi olacak sekilde), program sinir
meta verileri, iki program arasindaki sinirin her iki tarafinda (örnegin, simetrik olarak)
mevcut olabilir.
Program sinir meta verileri içeren bir kodlanmis ses bit akisina (bir ses programinin
veya bir sesli program dizisinin göstergesi olabilir) dahil edilmesinden kaynaklanan veri
hizi artisini sinirlamak için, tipik uygulamalarda program sinir bayraklari sadece bit
akisi çerçevelerinin bir alt kümesine eklenir. Tipik olarak, sinir bayragi ekleme hizi, her
bir bit akisinin çerçevesinin (bir bayragin eklendigi) bahsedilen herbir çerçeveye en
yakin olan program sinirindan artan bir ayriminin artmayan bir fonksiyonudur, burada
programin göstergesi), bir program sinir bayragi içermeyen çerçeve sayisina
(programin göstergesi) olan ortalama oranini belirtir; burada ortalama, kodlanmis ses
bit akisinin ardisik çerçevelerinin bir sayisi (örnegin, nispeten küçük sayi) üzerinde
çalisan bir ortalamadir. Bir sinif uygulamada, sinir bayragi ekleme orani, en yakin
program sinirindan artan mesafenin (her bayrak ekleme konumunun) Iogaritmik olarak
azalan bir fonksiyonudur ve bayraklardan birini içeren her bir bayrak içeren çerçeve
için, bahsedilen bayrak içeren çerçeve içindeki bayragin boyutu, bahsedilen bayrak
içeren çerçeveye kiyasla en yakin program sinirina daha yakin bir çerçevede bulunan
her bir bayrak boyutuna esit veya bundan daha büyüktür (diger bir deyisle, her bir
bayrak içeren çerçeve içindeki program sinir bayraginin boyutu, en yakin program
sinirindan behsedilen bayrak içeren çerçevenin artan ayriminin azalan bir
fonksiyonudur).
Bulusun diger bir yönü, bulus yönteminin herhangi bir uygulamasini gerçeklestirmek
üzere yapilandirilmis bir ses isleme birimidir (APU). Bulusun baska bir sinif
uygulamasinda, bulus, bulusa ait yöntemin herhangi bir uygulamasi tarafindan üretilen,
kodlanmis bir ses bit akisinin en az bir çerçevesini depolayan (örnegin, geçici olmayan
bir sekilde) bir tampon bellek (tampon) içeren bir APU'dur. APU örnekleri arasinda,
ancak bunlarla sinirli olmamak üzere enkoderler (örnegin, ses ve görüntü
dönüstürücüler), dekoderler, kodekler, ön-isleme sistemleri (ön-islemciler), post-isleme
sistemleri (post-islemciler), ses bit akisi isleme sistemleri ve bu gibi elemanlarin
kombinasyonlari bulunur.
Bulusun diger bir sinif uygulamasinda, bulus, ses veri segmentleri ve meta veri
segmentlerini içeren bir kodlanmis ses bit akisi üretmek üzere yapilandirilmis bir ses
isleme birimidir (APU), burada ses veri segmentlerinin ses verilerinin göstergesidir ve
en azindan bazi meta veri segmentleri ses siddeti isleme durum meta verileri (LPSM)
ve istege bagli olarak program sinir meta verileri içerir. Tipik olarak, bit akisinin bir
çerçevesindeki en az bir tip meta veri segmenti, çerçevenin ses verileri üzerinde bir
birinci ses siddeti tipinin (diger bir deyisle, çerçevenin en az bir sesli veri segmentindeki
ses verisi) gerçeklestirilip gerçeklestirilmedigini gösteren en az bir LPSM segmenti ve
çerçeve ses verilerinin en azindan bir kisminin ses siddetini gösteren en az bir diger
LPSM segmenti (örnegin diyalogu gösteren çerçevenin ses verisinin en azindan
bazilarinin diyalog ses siddeti) içerir. Bu sinif bir uygulamada APU, kodlanmis sesi
üretmek için girdi sesini kodlamak üzere yapilandirilmis bir enkoderdir ve ses veri
segmentleri kodlanmis sesi içerir. Bu siniftaki tipik uygulamalarda, meta veri
segmentlerinin her biri burada açiklanacak tercih edilen bir formata sahiptir.
Bazi uygulamalarda, LPSM (örnegin, LPSM ve program sinir meta verisi) içeren
kodlanmis bit akisinin (bazi uygulamalarda bir AC-3 bit akisi veya bir E-AC-3 bit akisi)
meta veri segmentlerinin her biri, bit akisinin bir çerçevesinin atlama alani segmentinin
(örnegin, Sekil 4 veya Sekil 7`de gösterilen türden bir atik bit segmenti ( W)) bir atik biti
içinde yer alir. Baska uygulamalarda LPSM (örnegin, LPSM ve program sinir meta
verisi) içeren kodlanmis bit akisinin (bazi uygulamalarda bir AC-3 bit akisi veya bir E-
AC-3 bit akisi) meta veri segmentlerinin her biri, bit akisinin veya bir auxdata
alanindaki bir çerçevenin Bit akisi Bilgisi ("BSI") segmentinin "addbsi" alanina (bit
akisinin bir çerçevesinin sonundaki bir auxdata alanina (örnegin, Sekil 4 veya Sekil
7'de gösterilen tipte bir AUX segmenti) ilave bit akisi bilgisi olarak dahil edilir. LPSM'yi
içeren her meta veri segmenti, asagidaki Tablolar 1 ve 2'ye referansla burada belirtilen
formata sahip olabilir (diger bir deyisle, Tablo 1'de belirtilen çekirdek elemanlari veya
bir varyasyonu) bunu yük kapasitesi ID takip eder (meta veriler LPSM olarak
tanimlanir) ve yük tasima kapasitesi degerleri (Tablo 2'de gösterilen formata sahip
LPSM verileri veya burada tarif edilen Tablo 2'de bir varyasyonda gösterilen format)
takip eder. Bazi yapilandirmalarda, bir çerçeve, her biri asagidakileri içeren bir veya iki
meta veri segmentini içerebilir: LPSM ve çerçeve iki meta veri segmenti Içeriyorsa, biri
çerçevenin addbsi alaninda ve digeri çerçevenin AUX alaninda bulunabilir.
Bir sinif uygulamada bulus; bir AC-3 veya E-AC-3 kodlanmis ses bit akisi üretmek için
ses verilerini kodlama asamalarini içeren bir yöntemdir, meta veri segmentine (bit
akisinin en az bir çerçevesinin) LPSM ve program sinir meta verileri ve istege bagli
olarak çerçevenin ait oldugu ses programi için diger meta veriler içerir. Bazi
uygulamalarda, bu meta veri segmentlerinin her biri çerçevenin addbsi alanina veya
çerçevenin bir auxdata alanina dahil edilmistir. Diger uygulamalarda bu meta veri
segmentlerinin her biri, çerçevenin atik bit segmentine dahil edilmistir. Bazi
uygulamalarda, LPSM ve program sinir meta verilerini içeren her meta veri segmenti
bir çekirdek basligi (ve istege bagli olarak ilave çekirdek elemanlar) içerir ve çekirdek
basligini (veya çekirdek basligi ve diger çekirdek elemanlar) takiben bir LPSM yükü
(veya kabi) segmenti asagidaki formata sahiptir:
tipik olarak en az bir tanimlama degeri (örnegin, burada ortaya konan Tablo 2'de
gösterildigi gibi LPSM format versiyonu, uzunluk, süre, sayim ve alt akis iliskilendirme
degerleri) içeren bir baslik, ve
basligin ardindan, LPSM ve program sinir meta verileri. Program sinir meta verileri, bir
program sinir çerçeve sayimi ve çerçevenin yalnizca bir program sinir çerçevesi
sayimi veya bir program sinir çerçeve sayimi ve bir ofset degeri içerdigini gösteren bir
kod degeri (örnegin, bir "offset_exist" degeri) içerebilir), ve (bazi durumlarda) bir ofset
degeri. LPSM asagidakileri içerebilir:
karsilik gelen ses verisinin diyalogu gösterdigini veya diyalogu göstermedigini (örnegin,
karsilik gelen ses verilerinin hangi kanallarin diyalogunu gösterdigini) belirten en az bir
diyalog göstergesi degeri. Diyalog gösterge deger(ler)i diyalogun ilgili ses verilerinin
kanallarinin herhangi bir kombinasyonunda veya hepsinde mevcut olup olmadigini
gösterebilir;
karsilik gelen ses verilerinin belirtilen bir ses siddeti uygulamalari setine uyup
uymadigini gösteren en az bir ses siddeti uygulamasina uygunluk degeri;
karsilik gelen ses verileri üzerinde gerçeklestirilen en az bir ses siddeti isleme tipini
gösteren en az bir ses siddeti isleme degeri; ve
karsilik gelen ses verisinin en az bir ses siddeti (örnegin pik veya ortalama ses siddeti)
karakteristigini gösteren en az bir ses siddeti degeri.
Diger uygulamalarda kodlanmis bit akisi AC-3 bit akisi veya E-AC-S bit akisi olmayan
bir bit akisidir ve meta veri segmentlerinin her biri ek verinin depolanmasi için ayrilan
bit akisinin bir segmenti (veya alan veya slotu) içinde yer alan LPSM (ve ayrica istege
bagli olarak program sinir meta verileri) içerir. LPSM'yi içeren her meta veri segmenti,
asagida Tablolar 1 ve 2'ye referansla belirtilen ayni veya benzer formata sahip olabilir
(diger bir deyisle, Tablo 1'de belirtilenlere benzer veya özdes çekirdek elemanlari ve
ardindan yük ID (meta verileri LPSM olarak tanimlanir) ve yük boyut degerleri, bunu
takiben yük (Tablo 2'de belirtilen formata benzer veya özdes formattaki LPSM verileri
veya burada açiklanan Tablo 2'deki bir varyasyon) içerir.
Bazi uygulamalarda kodlanmis bit akisi, bir çerçeve dizisinden olusur, her çerçeve, bir
("BSI") segmenti ve bir auxdata alani (örnegin, kodlanmis bit akisi bir AC-3 bit akisi
veya bir E-AC-3 bit akisidir) ve ses veri segmentlerini (örnegin, Sekil 4'te gösterilen
çerçevenin ABO-ABö segmentleri) ve meta veri segmentlerini içerir, burada ses veri
segmentleri ses verilerinin göstergesidir ve en azindan meta veri segmentlerinin
bazilari ses siddeti isleme durum meta verileri (LPSM) ve istege bagli olarak da
program sinir meta verilerini içerir. LPSM, bit akisinda asagidaki formatta bulunur.
LPSM'yi içeren meta veri segmentlerinin her biri, bit akisinin bir çerçevesinin BSI
segmentinin bir "addbsi" alanina veya bit akisinin bir çerçevesinin bir auxdata alanina
veya bit akisinin bir çerçevesinin atik bit parçasina dahil edilir. LPSM'yi içeren her bir
meta veri segmenti, asagidaki formatta bir LPSM yükü (veya kabi) segmenti içerir:
(tipik olarak en az bir tanimlama degeri örnegin, burada ortaya konan Tablo 2'de
gösterildigi gibi LPSM format versiyonu, uzunluk, süre, sayim ve alt akis iliskilendirme
degerleri) içeren bir baslik; ve
basligin ardindan, LPSM ve program sinir meta verileri. Program sinir meta verileri, bir
program sinir çerçeve sayimi ve çerçevenin yalnizca bir program sinir çerçevesi
sayimi veya bir program sinir çerçeve sayimi ve bir ofset degeri içerdigini gösteren bir
kod degeri (örnegin, bir "offset_exist" degeri) içerebilir), ve (bazi durumlarda) bir ofset
degeri. LPSM asagidakileri içerebilir:
karsilik gelen ses verisinin diyalogu gösterdigini veya diyalogu göstermedigini (örnegin,
karsilik gelen ses verilerinin hangi kanallarin diyalogunu gösterdigini) belirten en az bir
diyalog göstergesi degeri (örnegin, Tablo 2'nin “Diyalog kanal(lar)i” parametresi).
Diyalog gösterge deger(ler)i diyalogun ilgili ses verilerinin kanallarinin herhangi bir
kombinasyonunda veya hepsinde mevcut olup olmadigini gösterebilir;
karsilik gelen ses verisinin belirtilen bir ses siddeti uygulamalari setine uyup
uymadigini gösteren en az bir ses siddeti uygulamasina uyum degeri (örnegin, Tablo
2'deki "Ses siddeti Düzenleme Tipi" parametresi);
karsilik gelen ses verileri üzerinde gerçeklestirilen en az bir ses siddeti isleme türünü
gösteren en az bir ses siddeti isleme degeri (örnegin, Tablo 2'deki "Diyalog Geçitli Ses
siddeti Düzeltme bayragi", "Ses Siddeti Düzeltme Tipi“ parametrelerinin bir veya daha
fazlasi): ve
karsilik gelen ses verilerinin en az bir ses siddetini (örnegin, tepe veya ortalama ses
siddeti) gösteren en az bir ses siddeti degeri (örnegin, "ITU Relatif Geçitli Ses siddeti",
Tablo 2'deki “Gerçek Tepe” parametrelerinden biri veya daha fazlasi).
Karsilik gelen ses verilerini gösteren en az bir ses siddeti tasarlayan, kullanan veya
üreten bulusun herhangi bir uygulamasinda, ses siddeti deger(ler)i ses siddetini
ve/veya ses verisi dinamik araligini islemek için kullanilan en az bir ses siddeti ölçüm
karakteristigini gösterebilir.
Bazi uygulamalarda, bit akisinin bir çerçevesinin bir "addbsi" alanindaki, veya bir
auxdata alanindaki veya atik bit segmentindeki meta veri segmentlerinin her biri
asagidaki formata sahiptir:
bir çekirdek basligi (tipik olarak, meta veri segmentinin baslangicini tanimlayan bir
syncword, bunu takiben tanimlama degerleri, örnegin Çekirdek eleman sürümü,
uzunlugu ve süresi, genisletilmis eleman sayimi ve alttaki Tablo 1'de gösterilen alt akis
iliskilendirme degerleri); ve
çekirdek basligi ardindan, ses verisi üzerinden hesaplanan en az bir koruma degeri
(örnegin, HMAC özümlemesi ve Ses Parmakizi degerleri, burada HMAC özümlemesi,
(SHA-2 algoritmasi kullanilarak) Tablo 1'de belirtildigi gibi bir 256-bit HMAC
özümlemesi, çekirdek eleman, ve bir çerçevenin tüm genisletilmis elemanlari olabilir)
ses siddeti isleme durumu meta verisinden veya karsilik gelen ses verisinden en az
birinin kod çözme, dogrulama veya geçerlilikten en az biri için yararli olan); ve
çekirdek basligi ardindan da meta veri segmenti LPSM içeriyorsa, LPSM yük
tanimlama ("ID") ve LPSM yük boyutu degerleri, bunlar asagidaki meta veriyi LPSM
yükü olarak tanimlar ve LPSM yük boyutunu gösterir. LPSM yük segmenti (tercihen
yukarida belirtilen formata sahip), LPSM yük lD ve LPSM yük boyut degerlerini takip
Bir önceki paragrafta açiklanan tipte bazi yapilandirmalarda, çerçevenin auxdata
alaninda (veya "addbsi" alani veya atik bit segmentinde) bulunan meta veri
segmentlerinin her biri üç yapi seviyesine sahiptir:
auxdata (veya addbsi) alaninin meta verileri içerdigini gösteren bir bayrak, meta verinin
tip(ler)ini gösteren en az bir ID degeri ve tipik olarak kaç bit meta verinin bulundugunu
(örnegin, her türden) gösteren bir deger (meta veri mevcutsa) de dahil olmak üzere bir
üst seviye yapisi. Ortaya çikabilecek bir meta veri türü, LSPM'dir, mevcut olabilecek
baska bir meta veri türü, program sinir meta verileri ve mevcut olabilecek baska bir
meta veri türü, ortam arastirma meta verisidir;
tanimlanan her meta veri türü için bir çekirdek eleman (örnegin, her özümlestirilmis
meta veri tipi için, yukarida belirtilen tipte çekirdek basligi, koruma degerleri ve yük ID
ve yük boyutu degerleri) içeren bir ara seviye yapisi; ve
bir çekirdek eleman için her bir yükü içeren bir düsük seviye yapisi (örnegin, çekirdek
eleman tarafindan mevcut olarak tanimlandigi takdirde bir LPSM yükü ve/veya
çekirdek eleman tarafindan mevcut olarak tanimlandigi takdirde baska bir türdeki bir
meta veri yükü).
Bu türlü bir üç seviyeli yapidaki veri degerleri yuvalanabilir. Örnegin, bir çekirdek
elemani tarafindan tanimlanan bir LPSM yükü ve/veya baska bir meta veri yükü için
koruma deger(ler)i, çekirdek eleman tarafindan belirlenen (ve dolayisiyla çekirdek
elemanin çekirdek basligindan sonra) her bir yükten sonra dahil edilebilir. Bir örnekte,
çekirdek bir baslik, bir LPSM yükünü tanimlayabilir ve birinci yük için diger yük veri
yükü, yük kapasitesi ve yük boyut degerleri (örnegin, LPSM yükü) çekirdek basligi takip
edebilir, birinci yükün kendisi ID ve boyut degerlerini takip edebilir, ikinci yük için yük ID
ve yük boyutu degeri, birinci yükü takip edebilir, ikinci yükün kendisi de bu lD ve boyut
degerlerini takip edebilir yüklerin biri veya her ikisi (veya çekirdek eleman degerleri ve
Bazi uygulamalarda, bir çerçevenin bir auxdata alanindaki (veya "addbsi" alani veya
atik bit segmenti) bir meta veri segmentinin çekirdek elemani, bir çekirdek basligi (tipik
olarak tanimlama degerleri, örnegin çekirdek elemani versiyonu da dahil olmak üzere)
içerir ve çekirdek basligi sonrasi: meta veri segmentinin meta verileri için parmak izi
verilerini gösteren degerler; harici verilerin (meta veri segmentinin meta verilerine
karsilik gelen ses verileriyle ilgili) varligini gösteren degerler, her bir meta veri tipi için
yük ID ve yük boyutu degerleri (örnegin, LPSM ve/veya LPSM'den baska bir tipteki
meta veriler) ve çekirdek eleman tarafindan tanimlanan en az bir meta veri tipi için
koruma degerleri için dahil edilmistir. Meta veri segmentinin meta veri yükü(yükleri),
çekirdek basligini takip eder ve (bazi durumlarda) çekirdek elemanin degerlerine
yuvalanir.
Tercih edilen diger bir formatta, kodlanmis bit akisi bir Dolby E bit akisidir ve LPSM'yi
(ve ayrica istege bagli olarak program sinir meta verileri) içeren meta veri
segmentlerinin herbiri, Dolby E koruma band araliginin birinci N numune konumlarina
dahil edilmistir.
Diger bir uygulama sinifinda, bulus, ses veri segmentlerini ve meta veri segmentlerini
içeren bir kodlanmis ses bit akisini almak üzere birlestirilmis ve konfigüre edilmis bir
APU'dur (örnegin, bir dekoder), burada ses veri segmentleri ses verilerinin
göstergesidir ve LPSM'yi bit akisindan çikarmak, ses verilerine karsilik olarak
kodlanmis ses verisi üretmek ve LPSM'yi kullanarak ses verisi üzerinde en az bir
adaptif ses siddeti isleme operasyonu gerçeklestirmek için ve meta veri
segmentlerinden en azindan bazilarinin ses siddeti isleme durumu meta verileri
(LPSM) ve istege bagli olarak da program sinir meta verilerini içermektedir. Bu siniftaki
bazi uygulamalar ayni zamanda APU'ya bagli bir post-islemciyi de içermektedir,
burada post-islemci, LPSM'yi kullanarak ses verileri üzerinde en az bir adaptif ses
siddeti isleme islemi gerçeklestirmek üzere birlestirilmistir ve yapilandirilmistir.
Diger bir uygulama sinifinda, bulus, bir tampon bellek (tampon) ve tampona bagli bir
isleme alt sistemi içeren bir ses isleme birimi (APU) olup, burada APU, ses veri
segmentlerini içeren bir kodlanmis ses bit akisi almak üzere birlestirilmistir ve meta veri
segmentlerinden en azindan bazilarinin ses siddeti isleme durumu meta verileri
(LPSM) ve istege bagli olarak da program sinir meta verilerini içermektedir, tampon
kodlanmis ses bit akisinin en azindan bir çerçevesini depolar (örnegin geçici olmayan
bir sekilde) ve isleme alt sistemi LPSM'yi bit akisindan çikarmak ve LPSM'yi kullanarak
ses verileri üzerinde en az bir adaptif ses siddeti isleme operasyonu gerçeklestirmek
üzere yapilandirilmistir. Bu siniftaki tipik uygulamalarda APU, bir enkoder, bir dekoder
ve bir post-islemciden biridir.
Bulusun yönteminin bazi uygulamalarinda, üretilen ses bit akisi AC-3 ile kodlanmis bit
akisi, bir E-AC-3 bit akisi veya ses siddeti isleme durumu meta verileri de dahil olmak
üzere bir Dolby E bit akisi ve diger meta verilerden biridir (örnegin, DIALNORM meta
veri parametresi, dinamik aralik kontrol meta verileri parametreleri ve diger meta veri
parametreleri). Yöntemin bazi diger uygulamalarinda, üretilen ses bit akisi, baska tip
bir kodlanmis bit akisidir.
Bulusun yönleri, bulusun yönteminin herhangi bir uygulamasini gerçeklestirmek üzere,
bulusun yönteminin herhangi bir uygulamasini veya adimlarini uygulamak üzere
yapilandirilmis (örnegin programlanmis) bir sistemi veya cihazi, ve kodu depolayan
(örnegin, geçici olmayan bir sekilde) bir bilgisayarda okunabilir ortami (örnegin, bir disk)
içerir. Örnegin, bulusa ait sistem, bulusun bir uygulamasi da dahil olmak üzere, veri
üzerinde bulusa ait yöntem veya adimlarinin bir uygulamasi da dahil olmak üzere
çesitli islemlerden herhangi birini gerçeklestirmek üzere yazilim veya üretici yazilimi ile
programlanmis ve/veya baska sekilde yapilandirilmis, programlanabilir bir genel amaçli
islemci, dijital sinyal islemcisi veya mikroislemci olabilir veya bunlari içerebilir. Bu türlü
bir genel amaçli islemci, kendisine verilen verilere yanit olarak, bulusa ait yöntemin
(veya adimlarinin) bir uygulamasini gerçeklestirmek üzere programlanmis bir (ve/veya
baska sekilde yapilandirilmis) bir girdi cihazi. bir bellek ve programlanmis isleme
devresini içeren bir bilgisayar sistemi olabilir veya bunlari içerebilir.
SEKILLERIN KISA ACIKL_AMASI
SEKIL 1, bulusa ait yöntemin bir uygulamasini gerçeklestirmek üzere yapilandirilabilen
bir sistemin bir uygulamasinin bir blok diyagramidir.
SEKIL 2, bulusa ait ses isleme biriminin bir uygulamasi olan bir enkoderin bir blok
diyagramidir.
SEKIL 3, bulusa ait ses isleme biriminin bir uygulamasi olan bir dekoderin bir blok
diyagrami ve bulusa ait ses isleme biriminin baska bir uygulamasi ile birlestirilmis bir
post-islemcidir.
SEKIL 4, bölünmüs oldugu segmentleri içeren bir AC-3 çerçevesinin bir diyagramidir.
SEKIL 5, bölünmüs oldugu segmentleri içeren bir AC-3 çerçevesinin Senkronizasyon
Bilgileri (Sl) segmentinin bir diyagramidir.
SEKIL 6, bölünmüs oldugu segmentleri içeren bir AC-3 çerçevesinin Bit akisi Bilgisi
(BSI) segmentinin bir diyagramidir.
SEKIL 7, bölünmüs oldugu segmentleri içeren bir E-AC-3 çerçevesinin bir diyagramidir.
SEKIL 8, formati bulusun bir uygulamasina uygun olan program sinir meta verilerini
içeren bir kodlanmis ses bit akisinin çerçevelerinin bir diyagramidir.
SEKIL 9, Sekil 9'un kodlanmis ses bit akisinin diger çerçevelerinin bir diyagramidir. Bu
çerçevelerin bazilari, bulusun bir uygulamasina uygun formatta program sinir meta
verileri içermektedir.
SEKIL 10, iki kodlanmis ses bit akisinin bir diyagramidir: bir program sinirinin ("Sinir"
etiketli) bir bit akisinin iki çerçeve arasindaki bir geçisle hizalandigi bir bit akisi (TB) ve
bir program sinirinin ("Gerçek Sinir" etiketli), bit akisinin iki çerçevesi arasindaki bir
geçisten 512 örnekle dengelendigi diger bir bir akisi.
SEKIL 11, dört kodlanmis ses bit akisini gösteren bir diyagramlar dizisidir. SEKIL 11'in
üst bölümünde yer alan bit akisi ("Senaryo 1" etiketli), program sinir meta verilerini de
içeren bir birinci ses programinin (P1) ardindan program sinir meta verilerini de içeren
bir ikinci ses programinin (P2) göstergesidir; ikinci bit akisi ("Senaryo 2" etiketli) ,
program sinir meta verilerini ve ardindan program sinir meta verisini içermeyen ikinci
bir ses programini (P2) içeren bir birinci ses programinin (P1) göstergesidir; üçüncü bit
akisi ("Senaryo 3" etiketli), program sinir meta verilerini içeren kirpilmis ve ve program
sinir meta verilerini içeren bir bütün ikinci ses programiyla (P2) birlestirilmisbir birinci
ses programinin (P1) göstergesidir; ve dördüncü bit akisi ("Senaryo 4" etiketli),
program sinir meta verilerini ve program sinir meta verilerini içeren ve birinci ses
programinin bir kismi ile birlestirilen kesilmis ikinci ses programi (P2) içeren kirpilmis
bir birinci ses programinin (P1) göstergesidir.
Gösterim ve Isimlencjirme
Istemler de dahil olmak üzere, bu bulus boyunca, bir sinyali veya veri "üzerinde"
(örnegin, sinyali veya veriyi filtrelemek, ölçeklendirmek, dönüstürmek veya kazanci
uygulamak) bir operasyon gerçeklestirilmesi ifadesi, genis bir anlamda islemi direkt
olarak sinyal veya veriler üzerinde veya sinyal veya verilerin islenmis bir versiyonunda
(örnegin, ön filtrelemeye tabi tutulan bir sinyal versiyonunda veya üzerinde
operasyonun gerçeklestirilmesinden önce ön isleme tabi tutulmasi durumunda)
gerçeklestirmeyi belirtir.
Istemler de dahil olmak üzere bu bulus boyunca, "sistem“ ifadesi, bir cihaz, sistem veya
alt sistemi belirtmek için genis anlamda kullanilir. Örnegin, bir dekoder uygulayan bir alt
sistem, bir dekoder sistemi ve bu tür bir alt sistemi içeren bir sistem, (örnegin, alt
sistemin M girislerini ürettigi birden fazla girdiye yanit olarak X çikis sinyalleri üreten bir
sistem ve diger X - M girisleri harici bir kaynaktan alindiginda) bir dekoder sistemi
olarak da adlandirilabilir.
Istemler de dahil olmak üzere bu bulus boyunca, "islemci" terimi genis bir anlamda, bir
sistemin veya cihazin, veri üzerinde islemler gerçeklestirmek üzere programlanabilir
veya baska türlü yapilandirilabilir (örnegin, yazilim veya üretici yazilimi ile) oldugunu
belirtilmek için kullanilmaktadir (örnegin, ses, veya video veya diger görüntü verileri).
Islemcilerin örnekleri arasinda, alanla programlanabilen bir geçit dizisi (veya diger
konfigüre edilebilir entegre devre veya çip seti), ses veya diger ses verileri üzerinde
iletisim hatti islemeyi gerçeklestirmek üzere programlanmis ve/veya baska sekilde
yapilandirilmis bir dijital sinyal islemcisi, programlanabilir bir genel amaçli islemci veya
bilgisayar, ve programlanabilir bir mikroislemci çipi veya çip seti bulunur.
Istemler de dahil olmak üzere bu bulus boyunca "ses islemcisi'i ve "ses isleme birimi"
ifadeleri, birbirinin yerine kullanilabilir, ve genis anlamda ses verilerini islemek üzere
yapilandirilmis bir sistemi belirtmek için kullanilir. Ses isleme birimleri örnekleri,
bunlarla sinirli olmamak üzere, enkoderler (örnegin, ses ve görüntü dönüstürücüler),
dekoderler, kodekler, ön isleme sistemleri, son isleme sistemleri ve bit akis isleme
sistemleri (bazen bit akis islem araçlari olarak ifade edilir) içerir.
Istemler de dahil olmak üzere bu bulus boyunca, "isleme durumu meta verileri" ifadesi
(örnegin "ses siddeti isleme durumu meta verisi" ifadesi gibi), karsilik gelen ses
verilerinden ayrilmayi ve bu verilerden farkli veriler anlamina gelir (bir ses veri akisinin
ses içerigi meta verilerinin islenmesi durumunu içerir). Isleme durumu meta verileri, ses
verileri ile iliskilendirilir, ilgili ses verisinin ses siddeti isleme durumunu gösterir (örnegin,
ses verisi üzerinde ne tip(ler)de islem yapildigi) ve tipik olarak ses verilerinin en az bir
özelligi veya karakteristigini gösterir. Isleme durumu meta verisinin ses verileriyle
iliskilendirilmesi zamanla senkronizedir. Bu nedenle, mevcut (en son alinan veya
güncellenen) islem durumu meta verisi, karsilik gelen ses verisinin, eszamanli olarak,
ses veri islemesinin belirtilen tip(ler)inin sonuçlarini içerdigini gösterir. Bazi durumlarda,
isleme durumu meta verisi, isleme geçmisi ve/veya belirtilen isleme tiplerinde kullanilan
ve/veya belirtilen isleme tiplerinden türemis parametrelerin bir kismini veya tamamini
içerebilir. Ilave olarak, islem durumu meta verileri, ses verilerinden hesaplanmis veya
çikartilmis olan ilgili ses verilerinin en az bir özellik veya karakteristigini içerebilir.
Isleme durum meta verileri ayrica, karsilik gelen ses verilerinin herhangi bir islenisiyle
ilgili olmayan veya bu yolla türetilmeyen diger meta verileri de içerebilir. Örnegin,
üçüncü taraf verileri, izleme bilgileri, tanimlayicilar, özel veya standart bilgi, kullanici
açiklama verileri, kullanici tercih verileri vb., belirli ses isleme birimi tarafindan diger
ses isleme birimlerine iletilmek üzere eklenebilir.
Istemler de dahil olmak üzere bu bulus boyunca, "ses siddeti isleme durumu meta
verisi" (veya "LPSM") ifadesi, karsilik gelen ses verisinin ses siddeti isleme durumunu
gösteren isleme durumu meta verilerini (örnegin, ses siddeti isleme tip(ler)i ses verisi
üzerinde gerçeklestirilmistir) ve tipik olarak, karsilik gelen ses verilerinin en az bir
özelligi veya karakteristigini (örnegin, ses siddeti) gösterir. Ses siddeti isleme durumu
meta verileri, (diger bir deyisle, tek basina ele alindiginda) ses siddeti isleme durumu
meta verisi olmayan verileri (örnegin, diger meta veriler) içerebilir.
Istemler de dahil olmak üzere bu bulus boyunca "kanal" (veya "ses kanali") ifadesi bir
monofonik ses sinyalini belirtir.
Istemler de dahil olmak üzere bu bulus boyunca, “ses programi" ifadesi, bir veya daha
fazla ses kanali seti ve istege bagli olarak iliskili meta verileri (örnegin, arzu edilen bir
sesli sunumu ve/veya LPSM ve/veya program sinir meta verileri tatif eden meta veriler)
belirtir.
Istemler de dahil olmak üzere bu bulus boyunca, "program sinir meta veri" ifadesi,
kodlanmis ses bit akisinin en az bir ses programini (örnegin, iki veya daha fazla ses
programi) gösterdigi, bir kodlanmis ses bit akisinin meta verisini gösterir ve program
sinir meta verileri en azindan bir söz konusu ses programinin en azindan bir sinirinin
(baslangiç ve/veya bitis) bit akisindaki konumunun göstergesidir. Örnegin, (bir ses
programini gösteren bir kodlanmis ses bit akisinin) program sinir meta verisi, program
baslangiç konumunu belirten meta verileri (örnegin, bit akisinin "N". çerçevesinin
baslangici veya bit akisinin "N. çerçevesinde "lVI". örneginin konumu) ve program
sonu konumunu gösteren ek meta verileri (örnegin, bit akisinin "J. çerçevesinin
baslangici veya bit akisinin ""J çerçevesinde K'" örneginin konumu) içerebilir.
Istemler de dahil olmak üzere bu bulus boyunca, "birlestirme" veya "birlestirilmis" terimi
dogrudan veya dolayli bir birlesme anlamina gelir. Böylece, eger bir birinci cihaz bir
ikinci cihaza birlestirilirse, bu birlesme dogrudan bir birlesme yoluyla veya diger cihazlar
ve birlesmeler yoluyla dolayli bir birlesme yoluyla olabilir.
Bulusun Uygulamalarinin Detayli Açiklamasi
Bulusun tipik uygulamalarina uygun olarak, ses siddeti isleme durumu meta verileri
("LPSM") ve istege bagli olarak program sinir meta verileri olarak ifade edilen bir
program ses siddeti meta verisi, diger segmentlerdeki (ses veri segmentleri) ses
verilerini de içeren bir ses bit akisinin meta veri segmentlerinin bir veya birden fazla
ayrilmis alanlarina (veya slota) yerlestirilir. Tipik olarak, bit akisinin her çerçevesinin en
az bir segmenti, LPSM içerir ve çerçevenin en az bir diger segmenti, karsilik gelen ses
verilerini (diger bir deyisle ses siddeti isleme durumu ve ses siddeti LPSM ile gösterilir)
dahil eder. Bazi uygulamalarda, LPSM'nin veri hacmi, ses verisinin tasinmasi için
ayrilan bit oranini etkilemeksizin tasinacak kadar yeterinde küçük olabilir.
Bir ses veri isleme zincirindeki ses siddeti isleme durumu meta verileri ile iletisim
kurulmasi, iki veya daha fazla ses isleme birimi, isleme zinciri boyunca (veya içerik
ömrü boyunca) birlikte çalisilmasi gerektiginde özellikle yararlidir. Ses bit akisina ses
siddeti isleme meta verisi eklenmeksizin, örnegin zincirde iki veya daha fazla ses kodek
bileseni kullanildiginda ve bit akisinin bir ortam tüketen cihaza (veya bit akisinin ses
içeriginin bir isleme noktasi) yolculugu sirasinda bir defadan fazla daha fazla tek uçlu
ses seviyelendirmesi uygulandiginda, kalite, seviye ve mekansal bozulmalar gibi ciddi
ortam isleme sorunlari ortaya çikabilir.
SEKIL 1, sistemin elemanlarinin bir veya daha fazlasinin bu bulusun bir uygulamasina
göre yapilandirilabildigi ek bir ses isleme zincirinin (bir ses veri isleme sistemi) bir blok
diyagramidir. Sistem, bir araya birlesmis asagidaki elemanlari içermektedir: bir ön
isleme birimi, bir enkoder, bir sinyal analizi ve meta veri düzeltme birimi, bir ses ve
görüntü dönüstürücü, bir dekoder ve bir ön-islem birimi gibi. Gösterilen sistemdeki
varyasyonlarda, elemanlardan bir veya daha fazlasi iptal edilir veya örnek ses veri
isleme birimleri eklenir.
Bazi uygulamalarda, SEKIL 1'deki ön-isleme birimi, ses içerigini girdi olarak içeren
PCM (zaman-alan) örneklerini kabul etmek ve islenmis PCM örneklerini üretmek üzere
yapilandirilmistir. Enkoder, PCM örneklerini girdi olarak kabul edecek ve ses içerigini
gösteren kodlanmis bir (örnegin, sikistirilmis) ses bit akisi üretecek sekilde
yapilandirilabilir. Ses içerigini gösteren bit akisinin verileri bazen burada "ses verileri"
olarak anilacaktir. Enkoder, mevcut bulusun tipik bir uygulamasina göre
yapilandirilmissa, enkoderden gelen ses bit çikisi, ses verilerinin yani sira ses siddeti
isleme durumu meta verilerini (ve tipik haliyle de program sinir meta verileri de dahil
olmak üzere diger meta verileri) içerir.
Sekil 1'deki sinyal analizi ve meta veri düzeltme birimi, bir veya daha fazla kodlanmis
ses bit akisini girdi olarak kabul edebilir ve her kodlanmis ses bit akisinda yer alan
isleme durumu meta verisinin, sinyal analizi (örnegin, kodlanmis bir ses bit akisinda
program sinir meta verilerini kullanarak) gerçeklestirerek dogru olup olmadigini
belirleyebilir (örnegin dogrulayabilir). Sinyal analizi ve meta veri düzeltme birimi, içerdigi
meta verilerin geçersiz oldugunu bulursa, genellikle yanlis deger(ler)i, sinyal
analizinden elde edilen dogru deger(ler) ile degistirir. Bu nedenle, sinyal analizi ve meta
veri düzeltme biriminden üretilen her bir kodlanmis ses bit akisi, düzeltilmis (veya
düzeltilmemis) isleme durum meta verisinin yani sira kodlanmis ses verilerini de
içerebilir.
Sekil 1'deki ses ve görüntü dönüstürücü, kodlanmis ses bit akislarini girdi olarak kabul
edebilir ve yanit olarak degistirilmis (örnegin, farkli sekilde kodlanmis) ses bit
akislarinin çiktisini alabilir (örnegin, bir girdi akisinin kodunun çözülmesi ve çözülmüs
olan akisin farkli bir kodlama formatinda yeniden kodlanmasi yoluyla). Eger ses ve
görüntü dönüstürücü, mevcut bulusun tipik bir uygulamasina uygun olarak
yapilandirilmissa, transkoderden üretilen ses bit akisi, ses siddeti isleme durumu meta
verileri (ve ayrica tipik olarak diger meta veri) ve kodlanmis ses verileri içerir. Meta
veriler bit akisina dahil edilmis olabilir.
Sekil 1'deki dekoder, kodlanmis (örnegin, sikistirilmis) ses bit akislarini girdi olarak ve
çözülen PCM ses örneklerinin çikis (yanit olarak) akislarini kabul edebilir. Dekoder,
mevcut bulusun tipik bir uygulamasina uygun olarak yapilandirilmissa, dekoderin tipik
islemdeki çiktisi, asagidakilerden herhangi biridir veya bunlardan herhangi birini içerir:
bir ses örnekleri akisi ve bir giris kodlanmis bit akisindan çikarilan ilgili bir ses siddeti
isleme durum meta verileri akisi (ve ayrica diger meta veriler); veya
bir ses örnekleri akisi ve bir giris kodlanmis bit akisindan çikarilan ses siddeti isleme
durum meta verilerinden (ve tipik olarak diger meta verilerden) saptanan karsilik gelen
bir kontrol bit akisi; veya
karsilik gelen bir islem durumu meta verisi akisi veya islem durum meta verilerinden
belirlenen kontrol bitleri olmaksizin ses örnekleri akisi. Bu son durumda, dekoder, girdi
kodlanmis bit akisindan ses siddeti isleme durumu meta verilerini (ve/veya diger meta
verileri) çikartabilir ve çikarilan meta verileri çiktisini veremese bile üzerinde en az bir
islem (örnegin, dogrulama) gerçeklestirir; veya bunlarin kontrol bitlerini belirler.
Sekil 1'deki post-islem birimini mevcut bulusun tipik bir uygulamasina uygun olarak
yapilandirmak suretiyle, post-isleme birimi, kodu çözülmüs PCM ses örneklerinin bir
akisini kabul edecek ve örneklerle alinan ses kuvveti isleme durumu meta verilerini (ve
tipik olarak diger meta verileri) veya örneklerle alinan kontrol bitlerini (ses siddeti isleme
durumu meta verilerinden dekoder tarafindan ve tipik olarak diger meta verileri)
kullanarak üzerinde post isleme (örnegin, ses içerigi hacim seviyelendirme)
gerçeklestirecek sekilde yapilandirilir. Post isleme birimi, genellikle, bir veya daha fazla
hoparlör tarafindan çalinmak üzere post islenmis ses içerigini olusturacak sekilde
yapilandirilmistir.
Mevcut bulusun tipik uygulamalari, ses isleme birimlerinin (örnegin enkoderler,
dekoderler, ses ve görüntü dönüstürücüler ve ön ve post isleme birimleri) kendi
islemlerini, ses verilerine uygulanacak isleme, ses isleme birimlerinin sirasiyla aldigi
ses siddeti isleme durumu meta verileri ile gösterilen medya verilerinin eszamanli bir
durumuna göre uyarladigi gelismis bir ses isleme zinciri saglamaktadir.
Sekil 1 sisteminin herhangi bir ses isleme birimine (örnegin, Sekil 1'deki enkoder veya
ses ve görüntü dönüstürücü) ses verisi girdisi, ses verilerinin (örnegin, diger bir deyisle,
diger meta verilerin) ses siddeti isleme durumu meta verilerini (ve istege bagli olarak
baska meta veri) ve ayni zamanda ses verilerini (kodlanmis ses verileri) içerebilir. Bu
meta veriler, mevcut bulusun bir uygulamasina uygun olarak, Sekil 1 sisteminin (veya
Sekil 1'de gösterilmeyen baska bir kaynak) baska bir eleman tarafindan girdi sesine
dahil edilmis olabilir. Girdi sesini (meta verilerle birlikte) alan isleme birimi, meta veriler
üzerinde (örnegin, dogrulama) en az bir islemi veya meta veriye yanit olarak (örnegin,
girdi sesinin adaptif islemi) gerçeklestirmek üzere ve tipik olarak meta verileri, meta
verinin islenmis bir sürümünü veya meta verilerden belirlenen kontrol bitlerini çikti ses
dosyasina dahil etmek üzere yapilandirilabilir.
Bulusun ses isleme biriminin (veya ses islemcisinin) tipik bir uygulamasi, ses verisine
karsilik gelen ses siddeti isleme durumu meta verileri ile gösterilen ses verisinin
durumuna dayali olarak ses verisinin adaptif islemeyi gerçeklestirmek üzere
yapilandirilmistir. Bazi uygulamalarda, adaptif isleme (veya içerir) ses siddeti islemedir
(eger meta veriler, ses verilerinde ses siddeti isleme veya benzer islemenin ses siddeti
üzerinde gerçeklestirilmedigini ancak ses siddeti isleme olmadigini (ve içermez)
gösteriyorsa) ancak (eger meta veriler, ses verisi üzerinde böyle bir ses siddeti isleme
veya benzer isleme isleminin yapildigini gösteriyorsa) ses siddeti isleme degildir. Bazi
yapilandirmalarda, ses islem biriminin, ses verilerinin durumuna göre ses verisinin
diger adaptif islemesini gerçeklestirilmesinin saglanmasi amaciyla adaptif islem, meta
veri geçerli kilma islemidir (örnegin, bir meta veri dogrulama alt biriminde
gerçeklestirilir). Bazi yapilandirmalarda, geçerli kilma, (örnegin, bit akisinda dahil
edilen) ses verileriyle iliskilendirilen ses siddeti isleme durum meta verilerinin
güvenilirligini belirler. Örnegin, meta veriler güvenilir olarak geçerli kilinirsa, daha önce
gerçeklestirilen bir tip ses islemenin sonucu tekrar kullanilabilir ve ayni ses isleme
tipinin yeniden gerçeklestirilmesi önlenebilir. Öte yandan, eger meta veriler bozulmus
(veya baska sekilde güvenilmez) bulunursa, daha önce gerçeklestirilen (güvenilir
olmayan meta verilerle belirtildigi gibi) ortam isleme tipi ses isleme birimi tarafindan
tekrarlanabilir ve/veya diger islemler, meta veriler ve/veya ses verileri üzerinde ses
isleme birimi tarafindan gerçeklestirilebilir. Ses isleme birimi, birim, isleme durumu
meta verisinin geçerli oldugunu belirlerse, (örnegin, bir ortam bit akisinda mevcut olan)
ses siddeti isleme durumu meta verisinin geçerli oldugu gelismis bir ortam isleme
zincirinin altindaki diger ses isleme birimlerine sinyal vermek üzere yapilandirilabilir
(örnegin, çikarilmis bir sifreleme degeri ile referans sifreleme degeri arasindaki bir
eslesmeye dayanarak).
SEKIL 2, bulusa ait ses isleme biriminin bir uygulamasi olan bir enkoderin (100) bir blok
diyagramidir. Enkoderin (100) bilesenleri veya elemanlarindan herhangi biri, donanim,
yazilim veya donanim ile yazilimin bir kombinasyonu halinde bir veya daha fazla islem
ve/veya bir veya daha çok devre (örnegin, ASIC'Ier, FPGA'Iar veya diger entegre
devreler) olarak uygulanabilir. Enkoder (100), çerçeve tamponunu (110), ayristiriciyi
(111), dekoderi (101), ses durumu dogrulayiciyi (102), ses siddeti isleme asamasini
(103), ses akisi seçme asamasini (104), enkoderi (105), stuffer/formatlayici asamasini
(107), meta veri olusturma asamasini (106), diyalog ses siddeti ölçüm alt sistemi (108)'i
ve çerçeve tamponunu (109) gösterir. Tipik olarak, enkoder (100) diger islem
elemanlarini (gösterilmemistir) içerir.
Enkoder (100) (bir ses ve görüntü dönüstürücü), bir giris ses bit akisini (örnegin bir AC-
3 bit akisi, bir E-AC-3 bit akisi veya bir Dolby E bit akisi olabilir) adaptif ve otomatik ses
siddeti islemeyi, girdi bit akisinda bulunan ses siddeti isleme durumu meta verilerini
kullanarak gerçeklestime dahil kodlanmis bir çikti ses bit akisina (örnegin diger bir AC-
3 bit akisi, bir E-AC-S bit akisi veya bir Dolby E bit akisi olabilir) dönüstürmek üzere
yapilandirilmistir. Örnegin, enkoder (100), bir girdi Dolby E bit akisini (yayinlanan ses
programlarini alan tüketici cihazlarda olmayan, üretim ve yayin tesislerinde tipik olarak
kullanilan bir format), AC-3 veya E-AC-3 formatinda kodlanmis bir çikti ses bit akisina
(tüketici cihazlarinda yayin için uygun olan) dönüstürmek üzere yapilandirilabilir.
SEKIL 2'deki sistem, ayrica, (enkoderden (100)'ten kodlanmis bit akislarini depolar
ve/veya ileten) kodlanmis ses dagitim alt sistemi (150) ve dekoderi (152) içerir.
Enkoderden (100) bir kodlanmis ses bit akis alt sistemi (150) (örnegin bir DVD veya
Blu ray diski formunda) tarafindan depolanabilir veya alt sistem (150) (bir iletim hatti
veya agini uygulayabilir) tarafindan iletilebilir veya her ikisi de depolanabilir ve alt
sistem (150) tarafindan iletilebilir. Dekoder (152), bit akisinin her çerçevesinden (ve
ayrica istege bagli olarak bit akisindan program sinir meta verisinin çikartilmasi) ses
siddeti Isleme durum meta verilerini (LPSM) çikartarak ve kodu çözülmüs ses verilerini
üreterek alt sistem (150) yoluyla aldigi bir kodlanmis ses bit akisinin (enkoder (100)
tarafindan üretilen) kodunu çözmek üzere yapilandiilmistir. Tipik olarak, dekoder (152),
LPSM'yi (ve ayrica program sinir meta verisi) kullanarak kodu çözülmüs ses verileri
üzerinde adaptif ses siddeti islemini gerçeklestirmek ve/veya kodu açilmis ses verilerini
ve LPSM'yi, LPSM'yi (ve istege bagli olarak program sinir meta verilerini) kullanarak
kodu çözülmüs ses verilerinde adaptif ses siddeti islemeyi gerçeklestirmek üzere
yapilandirilmis bir post-islemciye iletmek üzere yapilandirilmistir. Tipik olarak, dekoder
(152), alt sistemden (150) alinan kodlanmis ses bit akisini depolayan (örnegin, geçici
olmayan bir sekilde) bir tampon içerir.
Enkoder (100) ve dekoderin (152) çesitli uygulamalari, bulus yönteminin farkli
uygulamalarini gerçeklestirmek üzere yapilandirilmistir.
Çerçeve tampon (110), kodlanmis bir girdi ses bit akisi almak için birlestirilmis bir
tampon bellektir. Operasyon sirasinda, tampon (110) kodlanmis ses bit akisinin en
azindan bir çerçevesini depolar (örnegin, geçici olmayan bir sekilde) ve kodlanmis ses
bit akis çerçevelerinin bir dizisi tampondan (110) ayristiriciya (111) atanir.
Ayristirioi (111), kodlanmis girdi sesinin her çerçevesinden ses siddeti isleme durum
meta verilerini (LPSM) ve istege bagli olarak sinir meta verisini (ve/veya diger meta
verileri) çikartacak sekilde birlestirilir ve yapilandirilir, burada ses durumu dogrulayicisi
LPSM'yi (ve istege bagli olarak sinir meta verisini ve/veya diger meta verileri) atamak,
kodlanmis girdi sesten ses verisi çikarmak ve ses verisini dekodere (101) atamak için
bu tür bir meta veriler dahil edilir. Enkoderin (100) dekoderi (101), kodu çözülmüs ses
verilerini üretmek için ses verisinin kodunu çözmek ve kodu çözülmüs ses verilerini ses
siddeti isleme asamasina (103), ses akisi seçme asamasina (104), alt sisteme (108) ve
tipik olarak durum dogrulayiciya (102) atamak için yapilandirilmistir.
Durum dogrulayici (
dogrulamak ve geçerli kilmak üzere yapilandirilmistir. Bazi uygulamalarda, LPSM, giris
bit akisina dahil edilen (örnegin mevcut bulusun bir uygulamasina uygun olarak) bir veri
blogudur (veya buna dahil edilmistir). Blok, LPSM'yI (ve Istege bagli olarak diger meta
verileri) ve/veya alttaki ses verilerini (dekoderden (101) dogrulayiciya (102) temin
edilen) islemek için bir kriptografik hash (hash tabanli bir mesaj dogrulama kodu veya
bir asagi yönde akis ses isleme birimi, islem durumu meta verilerini nispeten kolayca
dogrulayabilir ve geçerli kilabilir.
Örnegin, bir özet olusturmak için HMAC kullanilir ve bulusun bit akisina dahil edilen
koruma deger(ler)i, özet içerebilir. Özet, bir AC-3 çerçevesi için asagidaki gibi
olusturulabilir:
1. AC-3 verisi ve LPSM kodlandiktan sonra, hashing islevi HMAC için çerçeve veri
bitleri (birlestirilmis frame_data#1 ve frame_data#2) ve LPSM veri bitleri girdi olarak
kullanilir. Bir auxdata alani içerisinde mevcut olabilecek diger veriler, özeti hesaplarken
dikkate alinmaz. Bu türlü baska veriler, ne AC-3 verilerine ne de LSPSM verilerine ait
bitler olabilir. LPSM'ye dahil edilen koruma bitleri, HMAC özetlenmesinin
hesaplanmasinda dikkate alinmayabilir.
2. Özet hesaplandiktan sonra, koruma biti için ayrilmis bir alanda bit akisina yazilir.
3. Tam AC-3 çerçevesinin üretilmesinin son adimi CRC-kontrolünün hesaplanmasidir.
Bu, çerçevenin sonuna yazilir ve bu çerçeveye ait tüm veriler, LPSM bitleri de dahil
olmak üzere dikkate alinir.
Bir veya daha fazla non-HMAC kriptografik yöntemini içeren fakat bunlarla sinirli
olmayan diger kriptografik yöntemler, LPSM'nin ve/veya alttaki ses verilerinin güvenli
bir sekilde iletilmesini ve alinmasini saglamak için LPSM'nin geçerliligi amaciyla
(örnegin, dogrulayicida (102)) kullanilabilir. Örnegin, dogrulama (bu türlü bir sifreleme
yöntemi kullanilarak), bit akisinda bulunan ses siddeti isleme durumu meta verisinin ve
karsilik gelen ses verisinin belirli ses siddeti isleme (meta verilerle gösterildigi gibi)
geçirip geçirmedigini ve böyle belirli bir ses siddeti isleme isleminden sonra
degistirilmemis oldugunu belirlemek için (ve/veya bundan sonuçlanan) bulusa ait ses
bit akisinin bir uygulamasini alan her bir ses isleme biriminde gerçeklestirilebilir.
Durum dogrulayici (102), dogrulama isleminin sonuçlarini göstermek için ses akisi
seçim asamasina (104), meta veri üreticisine (106) ve diyalog ses siddeti ölçüm alt
sistemine (108) kontrol verileri atar. Kontrol verileri karsisinda, asama (104) su
yöntemlerden birini seçebilir (ve enkoder (105) boyunca geçebilir):
ses siddeti Islem asamasinin (103) adaptif olarak islenmis çiktisi (örnegini LPSMi
dekoderden (101) gelen ses verisinin spesifik bir ses siddeti isleme türüne girmedigini
gösterdiginde ve dogrulayicidan (102) gelen kontrol bitlerinin, LPSM'nin geçerli
oldugunu gösterdiginde); veya
dekoderden ( ses verisinin
çiktisi (103) tarafindan gerçeklestirilecek olan belirli ses siddeti islemesine tabi
tutuldugunu gösterdiginde ve dogrulayicidan (102) gelen kontrol bitlerinin, LPSM'nIn
geçerli oldugunu gösterdiginde).
Enkoder (100) asamasi (103) dekoder (101) tarafindan çikarilan LPSM ile gösterilen bir
veya daha fazla ses verisi özelligine dayanilarak dekoderden (101) kodu çözülmüs ses
verileri çikisi üzerinde adaptif ses siddeti islemini gerçeklestirmek üzere yapilandirilir.
Asama (103). adaptif bir dönüstürme domaini gerçek zamanli ses siddeti ve dinamik
aralik kontrol islemcisi olabilir. Asama (103) kullanici girdilerini (örnegin, kullanici hedef
ses siddeti/dinamik aralik degerleri veya dialnorm degerleri) veya diger meta veri
girdilerini (örnegin, bir veya daha fazla üçüncü parti veri tipi, izleme bilgisi,
tanimlayicilar, özel veya standart bilgiler, kullanici açiklama veriler. kullanici tercih
verileri vb.) ve/veya diger girdileri (örnegin parmak isleminden) ve dekoderden (101)
çözülmüs ses verilerini islemek için bu tür bir girdi kullanabilir. Asama (103), kodu
çözülmüs ses verilerinde (dekoderden (101) çikti) (ayristirici (111) tarafindan çikarilan
program sinir meta verisi ile gösterildigi gibi) tek bir ses programini gösteren adaptif
ses siddeti isleme gerçeklestirebilir, ve ayristirici (111) tarafindan çikarilan program
sinir meta verileri gösterildigi sekilde farkli bir ses programinin göstergesi olan kodu
çözülmüs ses verisinin (dekoder (101) çiktisi) alinmasina yanit olarak ses siddeti
islemeyi resetleyebilir.
Diyalog ses siddeti ölçüm alt sistemi (108), dogrulayicidan (102) gelen kontrol bitleri,
LPSM'nin geçersiz oldugunu gösterdiginde örnegin dekoder (101) tarafindan çikarilan
LPSM'yi (ve/veya diger meta verileri) kullanarak diyalogu (veya diger konusmalari)
gösteren, (dekoderden (101)) kodu çözülmüs sesin segmentlerinin ses siddetini
belirlemek üzere çalisabilir. Diyalog ses siddeti ölçüm alt sisteminin (108) çalismasi,
dogrulayicidan (102) gelen kontrol bitleri, LPSM'nin geçerli oldugunu gösterdiginde,
LPSM kodu çözülmüs sesin diyalog (veya diger konusma) segmentlerinin önceden
belirlenmis ses siddetini (dekoderden (101)) gösterdiginde devre disi birakilabilir. Alt
sistem (108), tek bir ses programini (ayristirici (111) tarafindan çikarilan program sinir
meta verisi ile gösterildigi gibi) kodu çözülmüs ses verileri üzerinde bir ses siddeti
ölçümü yapabilir ve bu program sinir meta verilerinin göstergesi olarak farkli bir ses
programini gösteren kodu çözülmüs ses verisini almaya yaniti olarak ölçümü
resetleyebilir.
Ses içerigindeki diyalog seviyesini uygun ve kolay bir sekilde ölçmek için kullanisli
araçlar (örnegin, Dolby LM100 ses siddeti ölçer) mevcuttur. Bulusa ait APU ile ilgili bazi
uygulamalar (örnegin, enkoder (100) asamasi (108)), bir ses bit akisinin ses içeriginin
ortalama diyalog ses siddetini ölçmek için bu türlü bir alet (ya da bir islevin
gerçeklestirilmesi için) uygulanmaktadir (örnegin, , enkoderin (100) dekoderinden (101)
(108) asamasina atanmis kodu çözülmüs bir AC- 3 bit akisi).
Asama (108), ses verisinin gerçek ortalama diyalog ses siddetini ölçmek için
uygulanirsa, ölçüm, çogunlukla konusma içeren ses içeriginin bölümlerini izole etmek
için bir adim içerebilir. Daha sonra konusma agirlikli olan ses parçalari, bir ses siddeti
ölçüm algoritmasina göre islenir. AC-3 bit akisindan kodlanmis ses verileri için, bu
algoritma (uluslararasi standart ITU-R 88.1770 uyarinca) standart bir K-agirlikli ses
siddeti ölçümü olabilir. Alternatif olarak, (örnegin, ses siddetinin psikoakustik
modellerine dayanan) diger ses siddeti ölçümleri kullanilabilir.
Konusma segmentlerinin izolasyonu ses verisinin ortalama diyalog ses siddetini ölçmek
için gerekli degildir. Bununla birlikte, ölçümün dogrulugunu gelistirir ve genellikle bir
dinleyicinin perspektifinden daha tatmin edici sonuçlar saglar. Tüm ses içerigi diyalog
(konusma) içermedginden, tüm ses içeriginin ses siddeti ölçümü, konusma mevcut
oldugunda sesin diyalog seviyesinin yeterli bir yaklasimini saglayabilir.
Meta veri üreticisi (106) enkoderden (100) çikti olarak alinacak olan kodlanmis bit
akisinin asamasi (107) tarafindan dahil edilecek meta veriyi üretir (ve/veya asama
( ve/veya ayristirici
(111) tarafindan çikarildigi asamaya (107) geçebilir (ve istege bagli olarak program
sinir meta verileri ve/veya diger meta veriler) (örnegin, dogrulayicidan (102) gelen
kontrol bitleri, LPSM ve/veya diger meta verilerin geçerli oldugunu gösterdiginde), veya
yeni LPSM üretebilir (ve istege bagli olarak program sinir meta verileri ve/veya diger
meta veriler) ve yeni meta verileri asamaya (107) atar (örnegin, dogrulayicidan (102)
gelen kontrol bitleri LPSM'nin ve/veya dekoder (101) tarafindan çikarilan diger meta
verilerin geçersiz oldugunu gösterdigi zaman), veya dekoder (101) ve/veya ayristirici
(111) tarafindan çikarilan meta verilerin bir kombinasyonunu asamaya (107) atayabilir.
Meta veri üretici (106), alt sistem (108) tarafindan üretilen ses siddeti verisini ve alt
sistem (108) tarafindan gerçeklestirilen ses siddeti isleme tipini gösteren en az bir
degeri içerebilir, bu da LPSM'de enkoderden (100) çikacak olan kodlanmis bit akisina
dahil edilmek üzere asamaya (107) atar.
Meta veri üretici (106), kodlanmis bit akisina ve/veya kodlanmis bit akisina dahil
edilecek ilgili ses verisine dahil edilecek LPSM'nin kod çözme, dogrulama veya geçerli
kilma (ve istege bagli olarak ayrica diger meta verileri) islemlerinin en azindan biri için
yararli koruma bitleri (hash tabanli bir mesaj dogrulama kodundan veya "HMAC'"den
olusabilir veya bunlari içerebilir) üretebilir. Meta veri üretici (106), kodlanmis bit akisina
dahil edilmek üzere asamaya (107) bu türlü koruma bitlerini saglayabilir.
Tipik bir operasyonda, diyalog ses siddeti ölçüm alt sistemi (108), ve dinamik aralik
degerlerine yanit olarak ses siddeti degerleri (örnegin, geçitli ve geçitsiz diyalog ses
siddeti degerleri) üretmek için dekoderden (101) gelen ses verilerini isler. Bu degerlere
yanit olarak, meta veri üretici (106) enkoderden (100) çikacak olan kodlanmis bit
akisina dahil etmek (stuffer/formatlayici (107) tarafindan) üzere ses siddeti isleme
durum meta verileri (LPSM) üretebilir.
Buna ek olarak, opsiyonel olarak veya alternatif olarak, enkoderin (100) alt sistemleri
(106) ve/veya (108), ses verisinin ilave bir analizini yaparak, asamadan (107) çikacak
kodlanmis bit akisina dahil edilmek üzere ses verisinin en az bir karakteristik özelligini
gösteren meta veriler üretir.
Enkoder (105), seçme asamasindan (104) gelen ses verilerini kodlar (örnegin, üzerine
sikistirma yaparak) kodlar ve asamadan (107) çikacak kodlanmis bit akisina dahil
edilmek üzere kodlanmis sesi asamaya (107) atar.
Asama (107), enkoderden (105) kodlanan ve asamadan (107) çikan kodlanmis bir
akisini üretmek için üreticiden ( çogaltir, ve böylece
tercihen kodlanmis bit akisinin mevcut bulusun tercih edilen bir uygulamasi ile belirtilen
formata sahip olur.
Çerçeve tampon (109), asamadan (107) kodlanmis ses bit akisi çiktisinin en az bir
çerçevesini depolayan (örnegin geçici olmayan bir sekilde) bir tampon bellegidir ve
daha sonra kodlanmis ses bit akisinin çerçevelerinin bir dizisi tampondan (109) dagitim
sistemine (150) enkoder (100) çiktisi olarak atanir.
Meta veri üreticisi ( tarafindan kodlanmis
bit akisina dahil edilir ve karsilik gelen ses verisinin ses siddeti isleme durumunu
(örnegin, ses verisinde hangi tür(ler)de ses siddetlerinin islendigi) ve ses siddetini
(örnegin, ölçülen diyalog ses siddeti, geçitli ve/veya geçitsiz ses siddeti ve/veya
dinamik aralik) gösterir.
Burada, ses verilerinde gerçeklestirilen ses siddeti “geçitleme” ve/veya seviye
ölçümleri, esik degerini asan hesaplanmis deger(ler)in son ölçümde yer aldigi spesifik
bir seviye veya ses siddeti esigini göstermektedir (örnegin, son ölçülen degerlerde -60
dBFS'nin altindaki kisa süreli ses siddeti degerlerini yoksaymak). Mutlak bir deger
üzerinde geçitleme, sabit bir seviyeye veya ses siddetine isaret eder; buna karsilik ilgili
bir degerdeki geçitleme, geçerli bir "geçitsiz" ölçüm degerine bagli olan bir degere
isaret eder.
Enkoderin (100) bazi uygulamalarinda, bellekte (109) tampona alinan (ve yayinlama
sistemine (150) gönderilen) kodlanmis bit akisi bir AC-3 bit akisi veya bir E-AC-3 bit
akisidir ve ses veri segmentlerini (örnegin, Sekil 4'te gösterilen çerçevenin ABO-ABS
segmentleri) ve meta veri segmentlerini içerir, burada ses verisi segmentleri ses
verisinin göstergesidir ve meta veri segmentlerinden en azindan bazilari ses siddeti
isleme durumu meta verilerini (LPSM) içerir. Asama (107), LPSM'yi (ve istege bagli
olarak program sinir meta verileri) bit akisina asagidaki formatta ekler. LPSM (ve
istege bagli olarak program sinir meta verileri) içeren meta veri segmentlerinin her biri,
bit akisinin bir atik bit segmentine (örnegin, Sekil 4 veya Sekil 7'de gösterildigi gibi "W"
atik bit parçasi) veya bit akisinin bir çerçevesinin Bit akis Bilgisi ("BSI") segmentinin
(örnegin, Sekil 4 veya Sekil 7'de gösterilen AUX segmenti) dahil edilir. Bit akisinin bir
çerçevesi, her biri LPSM'yi içeren bir veya iki meta veri segmentini içerebilir ve çerçeve,
iki meta veri segmenti içeriyorsa, biri çerçeve addbsi alaninda ve digeri çerçevenin
AUX alaninda bulunabilir. Bazi uygulamalarda, LPSM'yi içeren her meta veri segmenti
asagidaki formata sahip bir LPSM yük (veya kap) segmenti içerir:
bir baslik (tipik olarak, LPSM yükünün baslangicini tanimlayan bir syncword de dahil
olmak üzere), takiben en az bir tanimlama degeri, örnegin, LPSM format versiyonu,
uzunluk, süre, sayim ve alt akis iliskilendirme degerleri asagida Tablo 2'de
gösterilmektedir); ve
basliktan sonra,
karsilik gelen ses verisinin diyalogu gösterdigini veya diyalogu göstermedigini (örnegin,
karsilik gelen ses verilerinin hangi kanallarinin diyalogu gösterdigini) belirten en az bir
diyalog göstergesi degeri (örnegin, Tablo 2'deki "Dialog kanal(lar)i" parametresi);
karsilik gelen ses verisinin belirtilen bir ses siddeti uygulamalari setine uyup
uymadigini gösteren en az bir ses siddeti uygulamasina uygunluk degeri (örnegin,
Tablo 2'deki "Ses siddeti Düzenleme Tipi" parametresi);
karsilik gelen ses verileri üzerinde gerçeklestirilen en az bir ses siddeti isleme türünü
belirten en az bir ses siddeti isleme degeri (örnegin, Tablo 2'deki “Diyalog geçitli Ses
siddeti Düzeltme bayragi", "Ses Siddeti Düzeltme Tipi“ parametrelerinin bir veya daha
fazlasi); ve
karsilik gelen ses verilerinin en az bir ses siddeti karakteristigini gösteren (örnegin,
tepe veya ortalama ses siddeti) en az bir ses siddeti degeri (örnegin, "ITU Relatif
Geçitli Ses siddeti“, "ITU Konusma Geçitli Ses Siddeti", "ITU (EBU 3341) Kisa Süreli 35
Ses siddeti" ve Tablo 2'deki “Gerçek Tepe" parametrelerinden biri veya daha fazlasi).
Bazi uygulamalarda, LPSM ve program sinir meta verilerini içeren her meta veri
segmenti bir çekirdek basligi (ve istege bagli olarak ilave çekirdek elemanlari) içerir ve
çekirdek basligi (veya çekirdek basligi ve diger çekirdek elemanlari) ardindan bir LPSM
yükü (veya kabi) segmenti asagidaki formata sahiptir:
tipik olarak en az bir tanimlama degeri (örnegin, burada kurulan Tablo 2'de gösterildigi
gibi LPSM format versiyonu, uzunluk, süre, sayim ve alt akis iliskilendirme degerleri)
içeren bir baslik, ve
basligin ardindan, LPSM ve program sinir meta verileri. Program sinir meta verileri, bir
program sinir çerçeve sayimi ve çerçevenin yalnizca bir program sinir çerçevesi
sayimi veya bir program sinir çerçeve sayisi ve bir ofset degeri içerdigini gösteren bir
kod degeri (örnegin, bir "offset_exist" degeri), ve (bazi durumlarda) bir ofset degeri
içerebilir.
Bazi uygulamalarda, asama (107) tarafindan atik bit segmentine veya bit akisinin bir
çerçevesinin bir "addbsi" alanina veya bir auxdata alanina eklenen meta veri
segmentlerinin her biri asagidaki formata sahiptir:
bir çekirdek basligi (tipik olarak, meta veri segmentinin baslangicini tanimlayan bir
syncword, bunu takiben tanimlama degerleri, örnegin Çekirdek eleman sürümü,
uzunlugu ve süresi, genisletilmis eleman sayisi ve altta Tablo 1'de gösterilen alt akis
iliskilendirme degerleri); ve
çekirdek basligin ardindan, ses siddeti isleme durumu meta verisinden veya karsilik
gelen ses verilerinden en az birinin sifre çözme, dogrulama veya geçerli kilinmasi için
yararli en az bir koruma degeri (örnegin, Tablo 1'in HMAC özet,ve Ses Parmakizi
degerleri); ve
yine çekirdek basligi ardindan meta veri segmenti LPSM içeriyorsa, LPSM yük
tanimlama ("ID") ve LPSM yük boyutu degerleri, bunlar asagidaki meta veriyi LPSM
yükü olarak tanimlar ve LPSM yük boyutunu gösterir.
LPSM yük (veya kap) (tercihen yukarida belirtilen formata sahip olan) segment, LPSM
yük ID ve LPSM yük kapasitesi degerlerini takip eder.
Bazi uygulamalarda, bir çerçevenin auxdata alanindaki (veya "addbsi" alanindaki) meta
veri segmentlerinin her biri üç yapi seviyesine sahiptir:
auxdata (veya addbsi) alaninin meta verileri içerdigini gösteren bir bayrak, meta verinin
tip(ler)ini gösteren en az bir lD degeri ve tipik olarak kaç bit meta verinin bulundugunu
(örnegin, her türden) gösteren bir deger (meta veri mevcutsa) de dahil olmak üzere bir
üst seviye yapisi. Ortaya çikabilecek bir meta veri türü, LSPM'dir, mevcut olabilecek
baska bir meta veri türü, program sinir meta verileri ve mevcut olabilecek baska bir
meta veri türü, ortam arastirma meta verisidir (örnegin Nielsen Ortam Arastirma
metaverisi);
tanimlanan her meta veri türü için bir çekirdek eleman (örnegin. her özümlestirilmis
meta veri tipi için, yukarida belirtilen tipte çekirdek basligi, koruma degerleri ve LPSM
yük ID ve LPSM yük boyutu degerleri) içeren bir ara seviye yapisi; ve
bir çekirdek eleman için her bir yükü içeren bir düsük seviye yapisi (örnegin, çekirdek
eleman tarafindan mevcut olarak tanimlandigi takdirde bir LPSM yükü ve/veya
çekirdek eleman tarafindan mevcut olarak tanimlandigi takdirde baska bir türdeki bir
meta veri yükü).
Bu türlü bir üç seviyeli yapidaki veri degerleri yuvalanabilir. Örnegin, bir çekirdek
elemani tarafindan tanimlanan bir LPSM yükü ve/veya baska bir meta veri yükü için
koruma deger(ler)i, çekirdek eleman tarafindan belirlenen (ve dolayisiyla çekirdek
elemanin çekirdek bagligindan sonra) her bir yükten sonra dahil edilebilir. Bir örnekte,
çekirdek bir baslik, bir LPSM yükünü tanimlayabilir ve birinci yük için diger yük veri
yükü, yük ID ve yük boyut degerleri (örnegin, LPSM yükü) çekirdek basligi takip
edebilir, birinci yükün kendisi ID ve boyut degerlerini takip edebilir, ikinci yük için yük ID
ve yük boyutu degeri, birinci yükü takip edebilir, ikinci yükün kendisi de bu ID ve boyut
degerlerini takip edebilir yüklerin biri veya her ikisi (veya çekirdek eleman degerleri ve
Bazi uygulamalarda, dekoder (101), kriptografik hash ile birlikte bulusun bir
uygulamasina uygun olarak üretilen bir ses bit akisi alirsa, dekoder, bit akisindan
saptanan bir veri blogundan kriptografik hashi ayristirmak ve almak üzere
yapilandirilmistir, söz konusu blok ses siddeti isleme durumu meta verileri (LPSM) ve
istege bagli olarak program sinir meta veriler içermektedir. Dogrulayici (102) alinan bit
akisi ve/veya iliskili meta veriyi dogrulamak için kriptografik hashi kullanabilir. Örnegin,
dogrulayici (102), referans kriptografik hash ile veri blogundan alinan kriptografik hash
arasindaki bir eslesmeye dayanarak LPSM'yi bulursa, karsilik gelen ses verileri
üzerinde islemcinin (103) çalismasini devre disi birakabilir ve seçim asamasinin (104)
ses verileri (degismeden) boyunca geçmesine neden olur. Buna ek olarak, istege bagli
olarak veya alternatif olarak, kriptografik hash temelli bir yöntem yerine baska sifreleme
teknikleri kullanilabilir.
SEKIL 2'deki enkoder ( tarafindan çikarilan program
sinir meta verisine yanit olarak ve istege bagli olarak) bir post/ön-islem biriminin
kodlanacak ses verilerinde bir çesit ses siddeti islemi gerçeklestirdigini ((105), (106), ve
(107) elemanlarinda) belirleyebilir ve dolayisiyla daha önce gerçeklestirilen ses gücü
islemesinde kullanilan ve/veya türetilen spesifik parametreleri içeren ses gücü isleme
durumu meta verisi (jeneratör (106)'da) yaratabilir. Bazi uygulamalarda, enkoder (100),
ses içerigi üzerinde gerçeklestirilen isleme türlerinden haberdar oldugu sürece, ses
içerigi üzerinde islem geçmisini gösteren islem durumu meta verisi olusturabilir (ve
buradaki kodlanmis bit akisi çiktisini içerir).
SEKIL 3, bulusa ait ses isleme biriminin bir uygulamasi olan bir dekoderin (200) ve ona
birlestirilmis bir post-islemcinin (300) bir blok diyagramidir. Post-islemci (300), ayni
zamanda, bulusun ses isleme biriminin bir uygulamasidir. Dekoder (200) ve post-
islemcinin (300) bilesenleri veya elemanlarindan herhangi biri donanim, yazilim veya
donanim ve yazilim kombinasyonunda bir veya daha fazla islem ve/veya bir veya daha
fazla devre (ASIC'Ier, FPGA'Iar veya diger entegre devreler) olarak uygulanabilir.
Dekoder (200), gösterildigi gibi birlestirilmis çerçeve tampon (201), ayristirici (205), ses
dekoderi (202), ses durumu dogrulama asamasi (dogrulayici) (203) ve kontrol bit
üretme asamasini (204) içerir. Tipik olarak, dekoder (200), diger isleme elemanlari
(gösterilmemistir) içerir.
Çerçeve tampon (201) (bir tampon bellek), dekoder (200) tarafindan alinan kodlanmis
ses bit akisinin en azindan bir çerçevesini depolar (örnegin, geçici olmayan bir
sekilde). Kodlanan ses bit akisinin çerçevelerinin bir dizisi tampon bellekten (201)
ayistiriciya (205) atanir.
Ayristirici ( dogrulayici
ve istege bagli olarak program sinir meta verisini ve diger meta veriyi kodlanmis girdi
sesinin her çerçevesinden çikaracak sekilde LPSM'yi (ve istege bagli olarak program
sinir meta verisini) çikti olarak atamak (örnegin, post-islemciye (300)) için, kodlanmis
girdi sesinden ses verilerini çikarmak için ve ses dosyalarini dekodere (202) atamak
için bilestirilir ve yapilandirilir.
Dekodere (200) kodlanmis ses bit akisi girisi, bir AC-3 bit akisi, bir E-AC-3 bit akisi
veya bir Dolby E bit akisi olabilir.
SEKIL 37deki sistem post-islemciyi (300) de kapsamaktadir. Post-islemci (300) ara
çerçeve tamponu (301) ve tampona (301) bagli en azindan bir isleme elemanini içeren
diger isleme elemanlarini (gösterilmemektedir) kapsamaktadir. Çerçeve tampon (301),
(örnegin, geçici olmayan bir durumda) kodu çözülmüs ses bit akisinin post-islemci
(300) tarafindan dekoderden (200) alinmis en az bir çerçevesini depolar. Post-
islemcinin (300) isleme elemanlari, tampondan (301) kodlanmis ses bit akisi çiktisinin
çerçevelerinin bir dizisini alacak ve adaptif proseste isleyecek sekilde, dekoderin (200)
asamasindan (204) kontrol biti çiktilarini ve/veya dekoderden (202) meta veri (LPSM
degerlerini içeren) çiktilarini kullanarak birlestirilmis ve yapilandirilmistir. Tipik olarak,
post-islemci (300), LPSM degerlerini ve istege bagli olarak program siniri meta
verilerini kullanarak kodu çözülmüs ses verilerinde adaptif ses siddeti islemini
gerçeklestirmek üzere yapilandirilmistir (örnegin, ses siddeti isleme durumu ve/veya
tek bir ses programini gösteren ses verileri için LPSM ile gösterilen bir veya daha fazla
ses verileri özelliklerine dayanilarak).
Dekoderin (200) ve post-islemcinin (300) çesitli uygulamalari, bulusun yönteminin farkli
uygulamalarini gerçeklestirmek üzere yapilandirilmistir.
Dekoderin (200) ses dekoderi (202) kodu çözülmüs ses verisi üretmek üzere ayristirici
(205) tarafindan çikarilan ses verisini çözmek ve çözülmüs ses verisini çikti olarak
(örnegin, post islemciye (300)) vermek üzere yapilandirilmistir.
Durum dogrulayici (
dogrulamak ve geçerli kilmak üzere yapilandirilmistir. Bazi uygulamalarda, LPSM, giris
bit akisina dahil edilen (örnegin mevcut bulusun bir uygulamasina uygun olarak) bir veri
blogudur (veya dahil edilmistir). Blok, LPSM'yi (ve ayrica istege bagli olarak diger meta
verileri) ve/veya altta bulunan ses verilerini (ayristirici (205) ve/veya dekoderden (202)
dogrulayiciya (203) saglanan) islemek için bir kriptografik hash (bir hash tabanli mesaj
dogrulama kodu veya "HMAC") içerebilir. Veri bloklari, bu uygulamalarda dijital olarak
imzalanabilir, böylece bir asagi yönde ses isleme birimi islem durumu meta verilerini
nispeten kolayca dogrulayabilir ve geçerli kilabilir.
Bir veya daha fazla non-HMAC kriptogafik yöntemini içeren fakat bunlarla sinirli
olmayan diger kriptografik yöntemler, LPSM'nin ve/veya temel ses verisinin güvenli bir
sekilde iletilmesini ve alinmasini saglamak için LPSM'nin geçerliligi için (örnegin
dogrulayicida (203)) kullanilabilir. Örnegin, dogrulama (böyle bir kriptografik yöntem
kullanilarak), bit akisinda bulunan ses siddeti isleme durumu meta verisinin ve karsilik
gelen ses verisinin belirli ses siddeti islemesinden (meta verilerle gösterildigi gibi) geçip
geçmedigini (ve/veya bundan kaynaklanip kaynaklanmadigini) ve bu türlü belirli bir ses
siddeti isleme isleminden sonra modifiye edilmedigini belirlemek için bulusa ait ses bit
akisinin bir uygulamasini alan tüm ses isleme biriminde gerçeklestirilebilir.
Durum dogrulayici (203), dogrulama isleminin sonuçlarini göstermek için kontol bit
üreticiye (204) kontrol verilerini (örnegin, post-islemciye (300)) atar ve/veya kontrol
verilerinin çikti olarak verir. Kontrol verilerine (ve istege bagli olarak. giris bit akisindan
çikarilan diger meta veriler) yaniti olarak, asama (204) asagidakileri üretebilir (ve post-
islemciye (300) atayabilir):
dekoderden (202) kodu çözülmüs ses verisi çiktisinin spesifik bir ses siddeti isleme
tipine maruz kaldigini gösteren kontrol bitleri (LPSM, dekoderden (202) gelen ses
verisinin spesifik bir ses siddeti isleme tipine tabi oldugunu gösterdiginde ve
dogrulayicinin (; veya
dekoderinin (202) kodu çözülmüs ses verisinin spesifik bir ses siddeti isleme tipine
maruz kalmasi gerektigini gösteren kontrol bitleri (örnegin, LPSM dekoderden (202)
gelen ses veri çiktisinin belirli bir ses siddeti isleme tipine tabi oldugunu gösterdiginde
veya LPSM, LPSM dekoderden (202) gelen ses veri çiktisinin belirli bir ses siddeti
isleme tipine tabi oldugunu gösterdiginde, ancak dogrulayicidan (203) gelen kontrol
bitlerinin LPSM'nin geçerli olmadigini gösterdiginde).
Alternatif olarak, dekoder (200), girdi bit akisindan dekoder (202) tarafindan çikarilan
meta veriyi ve ayristirici (205) tarafindan girdi bit akisindan post-islemciye (300)
çikarilan LPSM'yi (ve istege bagli olarak ayrica program sinir meta veri) metaveriye
atar ve post-islemci (300), LPSM'yi (ve ayrica istege bagli olarak program sinir meta
verisini) kullanarak kodlanmis ses verilerinde ses siddeti isleme veya LPSM'nin
dogrulamasini gerçeklestirir ve sonrasinda dogrulama LPSM'nin geçerli oldugunu
gösterdiginde kodlanmis ses verisi üzerinde LPSM (ve ayrica istege bagli olarak
program sinir meta verileri) kullanarak ses siddeti islemi gerçeklestirir.
Bazi uygulamalarda, dekoder (200), kriptografik hash bulunan bulusun bir
uygulamasina uygun olarak üretilen bir ses bit akisi aldiginda, dekoder bit akisindan
belirlenen bir veri blogundan kriptografik hash elde edecek ve ayristiacak sekilde
yapilandirilir ve bahsedilen blok ses siddeti isleme durum meta verileri (LPSM) içerir.
Dogrulayici (203), alinan bit akisi ve/veya iliskili meta veriyi dogrulamak için kriptografik
hashi kullanabilir. Örnegin, dogrulayici (203), bir referans kriptografik hash ile veri
blogundan alinan kriptografik hash arasindaki bir eslesmeye dayanarak LPSM'yi
geçerli bulursa, bit akisinin ses verisi (degismeyen) boyunca geçmesi için bir asagi
yönde ses isleme birimine (örnegin, bir ses seviyeleme birimi olan veya bunu içeren
post-islemciye (300)) sinyal verebilir. Buna ek olarak, istege bagli veya alternatif olarak,
kriptografik hash temelli bir yöntem yerine baska sifreleme teknikleri kullanilabilir.
Dekoderin (200) bazi uygulamalarinda, alinan (ve bellekte (201) tamponlanmis olan)
kodlanmis bit akisi, bir AC-3 bit akisi veya bir E-AC-3 bit akisidir, burada ses veri
segmentleri (örnegin, Sekil 4'te gösterilen çerçevenin ABO-ABS segmentlerini) ses
verilerini gösterir, ve meta veri segmentlerinden en azindan bazilarinin her biri ses
siddeti isleme durumu meta verileri (LPSM) ve istege bagli olarak program sinir meta
verileri içerir. Dekoder asamasi (202) (ve/veya ayristirici (205)), asagidaki formata
sahip olan bit akisindan LPSM'yi (ve istege bagli olarak da program sinir meta veri)
çikarmak üzere yapilandirilmistir. LPSM'yi (ve ayrica istege bagli olarak program sinir
meta verisi) içeren meta veri segmentlerinin her biri, bit akisinin bir çerçevesinin atik bit
segmentine veya bir Bit akisi Bilgisinin ("BSI") segmentinin bir “addbsi" alanina, veya
bit akisinin bir çerçevesinin sonundaki bir auXdata alanina (örnegin, Sekil 4'te
gösterilen AUX segmentinde) dahil edilir. Bit akisinin bir çerçevesi, her biri LPSM'yi
içeren bir veya iki meta veri segmentini içerebilir ve çerçeve, iki meta veri segmenti
içeriyorsa, biri çerçeve addbsi alaninda ve digeri çerçevenin AUX alaninda bulunabilir.
Bazi uygulamalarda, LPSM'yi içeren her meta veri segmenti asagidaki formata sahip
bir LPSM yük (veya kap) segmenti içerir:
bir baslik (tipik olarak, LPSM yükünün baslangicini tanimlayan bir syncword de dahil
olmak üzere), takiben en az bir tanimlama degeri, örnegin, LPSM format versiyonu,
uzunluk, süre, sayim ve alt akis iliskilendirme degerleri asagida Tablo 2'de
gösterilmektedir); ve
basliktan sonra,
karsilik gelen ses verisinin diyalogu gösterdigini veya diyalogu göstermedigini (örnegin,
karsilik gelen ses verilerinin hangi kanallarinin diyalogu gösterdigini) belirten en az bir
diyalog göstergesi degeri (örnegin, Tablo 2'deki "Dialog kanal(lar)i" parametresi);
karsilik gelen ses verisinin belirtilen bir ses siddeti uygulamalari setine uyup
uymadigini gösteren en az bir ses siddeti uygulamasina uygunluk degeri (örnegin,
Tablo 2'deki "Ses siddeti Düzenleme Tipi" parametresi);
karsilik gelen ses verileri üzerinde gerçeklestirilen en az bir ses siddeti isleme türünü
belirten en az bir ses siddeti isleme degeri (örnegin, Tablo 2'deki "Diyalog geçitli Ses
siddeti Düzeltme bayragi", "Ses Siddeti Düzeltme Tipi" parametrelerinin bir veya daha
fazlasi); ve
karsilik gelen ses verilerinin en az bir ses siddeti karakteristigini gösteren (örnegin,
tepe veya ortalama ses siddeti) en az bir ses siddeti degeri (örnegin, "ITU Relatif
Geçitli Ses siddeti", "ITU Konusma Geçitli Ses Siddeti", "ITU (EBU 3341) Kisa Süreli 33
Ses siddeti" ve Tablo 2'deki “Gerçek Tepe" parametrelerinden biri veya daha fazlasi).
Bazi uygulamalarda, LPSM ve program sinir meta verilerini içeren her meta veri
segmenti bir çekirdek basligi (ve istege bagli olarak ilave çekirdek elemanlari) içerir ve
çekirdek basligi (veya çekirdek basligi ve diger çekirdek elemanlari) ardindan bir LPSM
yükü (veya kabi) segmenti asagidaki formata sahiptir:
tipik olarak en az bir tanimlama degeri (örnegin, burada kurulan Tablo 2'de gösterildigi
gibi LPSM format versiyonu, uzunluk, süre, sayim ve alt akis iliskilendirme degerleri)
içeren bir baslik, ve
basligin ardindan, LPSM ve program sinir meta verileri. Program sinir meta verileri, bir
program sinir çerçeve sayimi ve çerçevenin yalnizca bir program sinir çerçevesi
sayimi veya bir program sinir çerçeve sayisi ve bir ofset degeri içerdigini gösteren bir
kod degeri (örnegin, bir "offset_exist“ degeri), ve (bazi durumlarda) bir ofset degeri
içerebilir.
Bazi uygulamalarda, ayristirici (205) (ve/veya dekoder asamasi (202)) bit akisinin bir
çerçevesinin bir atik bit parçasindan veya bir "addbsi" alanindan veya bir auxdata
alanindan çikaracak meta verileri sekilde yapilandirilmistir, meta veri segmentlerinin
her biri asagidaki formata sahiptir:
bir çekirdek basligi (tipik olarak, meta veri segmentinin baslangicini tanimlayan bir
syncword, bunu takiben tanimlama degerleri, örnegin Çekirdek eleman sürümü,
uzunlugu ve süresi, genisletilmis eleman sayisi ve altta Tablo 1'de gösterilen alt akis
iliskilendirme degerleri); ve
çekirdek basligin ardindan, ses siddeti isleme durumu meta verisinden veya karsilik
gelen ses verilerinden en az birinin sifre çözme, dogrulama veya geçerli kilinmasi için
yararli en az bir koruma degeri (örnegin, Tablo 1'in HMAC özet ve Ses Parmakizi
degerleri); ve
yine çekirdek basligi ardindan meta veri segmenti LPSM içeriyorsa, LPSM yük
tanimlama ("ID") ve LPSM yük boyutu degerleri, bunlar asagidaki meta veriyi LPSM
yükü olarak tanimlar ve LPSM yük boyutunu gösterir.
LPSM yük (veya kap) (tercihen yukarida belirtilen formata sahip olan) segment, LPSM
yük ID ve LPSM yük kapasitesi degerlerini takip eder.
Daha genel olarak, bulusun tercih edilen uygulamalari tarafindan üretilen kodlanmis
ses bit akisi, meta veri elemanlarini ve alt elemanlari çekirdek (zorunlu) veya
genisletilmis (istege bagli elemanlar) olarak etiketleyen bir mekanizma saglayan bir
yapiya sahiptir. Bu, bit akisinin (meta veriler de dahil olmak üzere) veri hizinin çok
sayida uygulamaya ölçeklenmesine olanak tanir. Tercih edilen bit akisi sözdiziminin
çekirdek (zorunlu) elemanlari, ses içerigiyle iliskili genisletilmis (istege bagli)
elemanlarin (bant içi) ve/veya uzaktaki bir konumda (bant disinda) sinyal verme
Çekirdek eleman(lar), bit akisinin her çerçevesinde mevcut olmalidir. Çekirdek
elemanlarin bazi alt elemanlari istege baglidir ve herhangi bir kombinasyon halinde
mevcut olabilir. Genisletilmis elemanlarin (bit hizi yükünü sinirlamak için) her
çerçevede bulunmasi zorunlu degildir. Böylece, genisletilmis elemanlar bazi
çerçevelerde mevcut olabilir, bazilarinda olmayabilir. Genisletilmis bir elemanin bazi alt
elemanlari istege baglidir ve herhangi bir kombinasyonda mevcut olabilirken,
genisletilmis bir elemanin bazi alt elemanlari zorunlu olabilir (diger bir deyisle,
genisletilmis eleman, bit akisinin bir çerçevesinde mevcutsa).
Bir sinif uygulamada, bir ses veri segmentleri dizisi ve meta veri segmentlerini içeren
bir kodlanmis ses bit akisi üretilmektedir (örnegin, bulusu somutlastiran bir ses isleme
birimi tarafindan üretilmektedir). Ses veri segmentleri ses verilerinin göstergesidir, en
azindan meta veri segmentlerinin bazilari ses siddeti isleme durum meta verileri
(LPSM) ve istege bagli olarak program sinir meta verileri içerir ve ses veri segmentleri
meta veri segmentleriyle zaman bölmeli çoklanmistir. Bu siniftaki tercih edilen
uygulamalarda, meta veri segmentlerinin her biri burada tarif edilecek olan tercih edilen
bir formata sahiptir.
Tercih edilen bir formatta, kodlanmis bit akisi bir AC-3 bit akisi veya bir E-AC-3 bit
akisidir ve LPSM'yi içeren meta veri segmentlerinin herbiri (örnegin, enkoderin (100)
tercih edilen bir uygulamasinin (
segmentinin "addbsi" alanindaki (Sekil 6'da gösterilen) veya bit akisinin bir
çerçevesinin bir auxdata alaninda veya bit akisinin bir çerçevesinin bir atik bit
segmentinde ek bit akisi bilgileri olarak dahil edilir.
Tercih edilen formatta, çerçevelerin her biri, çerçevenin addbsi alaninda (veya atik bit
segmentinde) asagidaki Tablo 1'de gösterilen formata sahip bir çekirdek eleman içerir:
Parametre Açiklama Zorunlu/Opsiyonel
SYNC [ID] Syncword, 0x5838 degerine ayarlanmis 16 bitlik M
bir deger olabilir
Çekirdek M
elemani
versiyonu
Çekirdek M
elemani
Çekirdek M
elemani süresi
Genisletilmis Çekirdek elemanla iliskili uzatilmis meta veri M
eleman sayimi elemanlarinin sayisini belirtir. Bit akisi, üretimden
dagitim ve son emisyon yoluyla geçtikçe, bu deger
artabilir/azalabilir.
Parametre Açiklama Zorunlu/Opsiyonel
Alt akis iliskisi Çekirdek elemaninin hangi alt akis(lar) ile iliskili M
oldugunu açiklar.
Imza (HMAC Ses verisi, çekirdek eleman ve tüm çerçevenin tüm M
özeti) genisletilmis elemanlari üzerinden hesaplanan 256
bitlik HMAC özet (SHA-2 algoritmasi kullanilarak)
PGM sinir geri Alan, yalnizca bir ses program dosyasinin/akisinin O
sayim basina veya kuyruguna belirli sayida çerçeve için
görünür. Bu nedenle, bu parametrenin dahil
edilmesini sinyallemek için bir çekirdek elemani
versiyonu degisikligi kullanilabilir.
Ses parmak izi Ses Parmak izi, çekirdek eleman süresi alani 0
tarafindan temsil edilen PCM ses örneklerinin bir
kismi üzerinden alinmistir.
Video parmak Video Parmak Izi çekirdek eleman süresi alani 0
izi tarafindan temsil edilen sikistirilmis video
örneklerinden (varsa) alinir.
URL/UUID Bu alan, ek bir program içeriginin (özü) ve/veya bit 0
akisi ile iliskili meta verilerin harici bir konumunu
referans alan bir URL ve/veya UUID (parmak izi
için gereksiz olabilir) tasimak üzere tanimlanmistir.
Tercih edilen formatta, LPSM içeren addbsi (veya auxdata) alanlarinin veya atik bit
segmentlerinin her biri, bir çekirdek basligi (ve ayrica istege bagli olarak ek çekirdek
elemanlari) içerir ve çekirdek basliginin (veya çekirdek basliginin ve diger çekirdek
elemanlarin) ardindan, asagidaki LPSM degerleri (parametreler) içerir:
çekirdek eleman degerlerini takip eden (örnegin, Tablo 1'de belirtildigi gibi) bir yük ID'si
(meta verileri LPSM olarak tanimlar);
yük ID”yi takip eden bir yük boyutu (LPSM yükünün boyutunu belirtir); ve
asagidaki tabloda (Tablo 2) belirtilen formata sahip olan LPSM verileri (yük ID ve yük
boyutu degeri asagidaki gibidir):
LPSM Açiklama özgün Zorunlu/Opsiyonel Ekleme hizi
Parametresi durumlarin (Parametrenin
Siddeti] süresi)
versiyonu
LPSM Sadece xxx M
süresi (xxx) alanlai için geçerli
LPSM alt M
akis iliskisi
Dialog L, C ve R ses 8 M ~0.5 saniye
kanal(lar)i kanallarinin hangi (tipik)
birlesiminin
önceki 0.5
saniyede
konusmayi
içerdigini gösterir.
Konusma
herhangi bir L, C
kombinasyonunda
mevcut
olmadiginda, bu
parametre
seklinde gösterir
Parametresi
Ses Siddeti
Düzenleme
Dialog
geçitli Ses
Düzeltme
bayragi
Ses Siddeti
Düzeltme
Geçitli Ses
Siddeti (INF)
Açiklama
iliskilendirilmis
ses veri akisinin
düzenleme
grubuna (ömegin,
ATSC A/85 veya
EBU R128) uygun
oldugunu gösterir
Iliskili ses akisinin
diyalog
geçitlemesine
dayanilarak
düzeltildigini
gösterir
Ilgili ses akisinin
sonsuz ileri
bakma (dosya
tabanli) veya
gerçek zamanli
(RT) bir ses
siddeti ve dinamik
denetleyicisi ile
düzeltilip
düzeltilmedigini
gösterir.
Uygulanan meta
veri olmadan ilgili
ses akisinin ITU-
durumlarin
Zorunlu/Opsiyonel
O (sadece
Loudness_Regulation_Type
karsilik gelen sesin
DÜZELTILMEMIS oldugunu
gösteriyorsa mevcuttur)
Loudness_Regulation_Type
karsilik gelen sesin
DÜZELTILMEMIS oldugunu
gösteriyorsa mevcuttur)
Ekleme hizi
(Parametrenin
güncelleme
1 saniye
Parametresi
Konusma
Geçitli Ses
Siddeti (INF)
3341) Kisa
Süreli 33
Ses Siddeti
Açiklama özgün
durumlarin
R 88.1770-3
entegre ses
siddetini gösterir
(örnegin, 7 bit: -58
Ilgili metnin 128
uygulanmadigi
(örnegin, 7 bit: -58
iliskili ses akisinin
konusma/diyalog
günlügünün ITU-
R 88.1770-tümlesik ses
siddetini belirtir.
hizi (örnegin, 8bit:
116 -> +11.5
adimlari)
uygulanan meta
veri olmaksizin
(kayar pencere)
iliskili ses akisinin
3 saniyelik
geçitsiz ITU (ITU-
siddetini belirtir
Zorunlu/Opsiyonel
Ekleme hizi
(Parametrenin
güncelleme
1 saniye
0.1 saniye
Parametresi
Gerçek En
Downmix
Prog ram
Açiklama özgün Zorunlu/Opsiyonel
durumlarin
Ilgili metnin 256 O
uygulanmadigi
ilgili ses akisinin
Ek 2 TruePeak
degerini (dB TP)
gösterir. (diger bir
deyisle, eleman
süre alaninda
sinyal verilen
çerçeve süresi
üzerindeki en
büyük deger) 116
0,5 LKFS adimlari
Downmix ses
siddeti ofsetini
gösterir
Çerçevelerde, bir
program sinirinin
olusmayacagini
belirtir. Program
siniri çerçeve
sinirinda
olmadiginda,
istege bagli
örnegin ek ofset,
gerçek program
Ekleme hizi
(Parametrenin
güncelleme
0.5 saniye
LPSM Açiklama özgün Zorunlu/Opsiyonel Ekleme hizi
Parametresi durumlarin (Parametrenin
Siddeti] süresi)
çerçevede ne
kadar olusacagini
gösterir
Bulusa göre üretilen bir kodlanmis bit akisinin tercih edilen bir baska formatinda bit
akisi bir AC-3 bit akisi veya bir E-AC-3 bit akisidir ve LPSM'yi (ve ayrica istege bagli
olarak program sinir meta verileri) içeren meta veri segmentlerinin her biri (örnegin,
enkoderin (100) tercih edilen bir uygulamasinin asamasina (107) göre): bit akisinin bir
çerçevesinin bir atik bit parçasi; veya bit akisinin bir çerçevesinin Bit akisi Bilgilerinin
("BSI") segmentinin bir "addbsi" alani (Sekil 6'da gösterilmistir): veya bit akisinin bir
çerçevesinin ucundaki bir auxdata alanina (örnegin, Sekil 4'te gösterilen AUX
segmentine) sahiptir. Bir çerçeve, her biri LPSM'yi içeren bir veya iki meta veri
segmentini içerebilir ve çerçeve iki meta veri segmenti içeriyorsa, biri çerçeve addbsi
alaninda ve digeri çerçevenin AUX alaninda bulunabilir. LPSM'yi içeren her meta veri
segmenti, yukarida Tablo 1 ve 2'ye referansla yukarida belirtilen formata sahiptir (diger
bir deyisle, Tablo 1'de belirtilen çekirdek elemanlarini ve ardindan yük ID (meta verileri
LPSM olarak tanimlayarak) ve yukarida belirtilen yük boyutu degerlerini içerir) ardindan
yükü (Tablo 2'de gösterilen formattaki LPSM verileri) içerir.
Tercih edilen baska bir formatta, kodlanmis bit akisi bir Dolby E bit akisidir ve LPSM'yi
(ve ayrica istege bagli olarak program sinir meta verileri) içeren meta veri
segmentlerinin her biri, Dolby E koruma band araliginin birinci N örnek konumlaridir.
LPSM'yi içeren bu türlü bir meta veri segmentini içeren bir Dolby E bit akisi, tercihen
SMPTE 337M baslama ekinin Pd sözcügünde isaretlenen LPSM faydali yük
uzunlugunu gösteren bir degeri içerir (SMPTE 337M Pa kelime yineleme hizi tercihen
iliskili video çerçeve hiziyla ayni kalir).
Kodlanan bit akisinin bir E-AC-3 bit akisi olmasinin tercih edildigi bir formatta, LPSM'yi
(ve ayrica istege bagli olarak program sinir meta verisi) içeren meta veri segmentlerinin
herbiri (örnegin, enkoderin (100) tercih edilen bir uygulamanin asamasina (107) kadar)
bir atik bit segmentine, veya bir bir akisi çerçevesinin Bit akisi Bilgisi ("BSI")
segmentinin "addbsi" alanina, ek bit akisi bilgisi olarak eklenebilir. Daha sonra, tercih
edilen formatta LPSM ile bir E-AC-3 bit akisini kodlamanin ek yönlerini tarif edecegiz:
1. bir E-AC-3 bit akisinin olusturulmasi sirasinda, E-AC-3 enkoder (LPSM degerlerini
bit akisina ekler) "aktif" iken, üretilen her çerçeve (senkron çerçeve) için bit akisi
asagidakileri içermelidir, çerçevenin addbsi alaninda (veya atik bit segmentinde)
tasinan bir meta veri blogu (LPSM dahil). Meta veri blogunu tasimak için gereken bitler
enkoder bit hizini (çerçeve uzunlugu) artirmamalidir;
2. Her meta veri blogu (LPSM'yi içeren) asagidaki bilgileri içermelidir:
loudness_c0rrecti0n_type_flag: burada '1', ilgili ses verisinin ses siddetinin enkoderden
yukari dogru düzeltildigini ve 'O' ses siddetinin enkoderde bulunan bir ses siddeti
düzelticisi tarafindan düzeltildigini gösterir (örnegin, Sekil 2'deki enkoderin (100) ses
siddeti islemcisi (103)):
speech_channel: hangi kaynak kanal(lar)in konusma içerdigini gösterir (önceki 0.5
saniye boyunca). Herhangi bir konusma saptanmazsa, bu sekilde belirtilecektir;
speech_loudness: konusmayi içeren (önceki 0.5 saniye boyunca) karsilik gelen ses
kanallarinin entegre konusma ses siddetini gösterir;
lTU_Ioudness: her karsilik gelen ses kanalinin entegre ITU BS.1770-3 ses siddetini
gösterir; ve
kazanç: bir dekoderi ters çevirmek için ses siddeti bilesik kazanç(lar) (reversibilite
göstermek için);
3. (LPSM degerlerini bit akisina ekleyen) E-AC-3 enkoder "aktif" ve "güven" bayragi ile
bir AC-3 çerçevesi aliyor olsa da, enkoderdaki ses siddeti denetleyicisi (örnegin, Sekil
2'deki enkoderin (100) ses siddeti islemcisi (103)) bypass edilmelidir. 'Güvenilir' kaynak
dialnorm ve DRC degerleri, E-AC-3 enkoder bilesenine (örnegin, enkoder (100)
asamasinda (107)) (örnegin, enkoderin (100) üreticisi (106) tarafindan) iletilmelidir.
LPSM blok üretimi devam eder ve loudness_c0rrection_type_flag '1' olarak ayarlanir.
Ses siddeti denetleyicisi bypass dizisi. 'güven' bayragi göündügünde kodu çözülmüs
AC-3 çerçevesinin baslangiciyla eslestirilmelidir. Ses siddeti denetleyicisi bypass sirasi
asagidaki gibi uygulanmalidir: Ieveler_amount kontrolü 10 ses blogu süresi (diger bir
deyisle 53.3 msaniye) üzerinden 9 degerinden O degere azaltilir ve
sonuçlanmalidir). Seviyelendiricinin "güvenilir" bypass terimi, kaynak bit akisinin
dialnorm degerinin de enkoder çiktisinda tekrar kullanilmasini gerektirir. (örnegin,
dialnorm degeri için -30 degerinden yararlanmalidir)
4. E-AC-3 enkoder (LPSM degerlerini bit akisina ekler) "aktif" ve "güven" bayragi
olmadan bir AC-3 çerçevesi alirken, enkoderde yer alan ses siddeti denetleyicisi
(örnegin, Sekil 2'deki enkoderin (100) ses siddeti islemcisi (103)) aktif olmalidir. LPSM
blok üretimi devam eder ve ses Ioudness_correcti0n_type_flag '0' olarak ayarlanir. Ses
siddeti denetleyicisi etkinlestirme sirasi, 'güven' bayraginin kayboldugu kodu çözülmüs
AC-3 çerçevesinin baslangicina senkronize edilmelidir. Ses siddeti denetleyicisi
etkinlestirme sirasi asagidaki gibi uygulanmalidir: Ieveler_amount kontrolü, 0
degerinden 1 ses blogu süresi boyunca 9 degerine artar. (diger bir deyisle 5.3 msaniye)
ve Ieveler_back_end_meter kontrolü 'aktif' moda yerlestirilir (bu islem kesintisiz bir
geçis ile sonuçlanmali ve bir back_end_meter entegrasyon resetlemesi içermelidir): ve
. kodlama sirasinda bir grafik kullanici arayüzü (GUI) asagidaki parametreleri bir
kullaniciya göstermelidir: "Giris Ses Programi:
bayragina dayanir ve" Gerçek Zamanli Ses siddeti Düzeltmesi: [Etkin/Devre Disi]" - bu
parametrenin durumu enkoderde gömülü olan bu ses siddeti denetleyicisinin etkin olup
olmadigini temel alir.
Bir atik bit segmenti veya Bit akisi Bilgisi ("BSI") segmentinin "addbsi" alanina dahil
edilen LPSM'ye (tercih edilen formatta) sahip bir AC-3 veya E-AC-3 bit akisinin
kodunun çözülmesi sirasinda, dekoder, LPSM blok verilerini ayristirmali (atik bit
segmentinde veya addbsi alaninda) ve çikarilan LPSM degerlerini bir grafik kullanici
arabirimine (GUI) geçirmelidir. Çikarilan LPSM degerleri kümesi her çerçevede
yenilenir.
Bulusa uygun olarak üretilen bir kodlanmis bit akisinin tercih edilen bir baska
formatinda, kodlanmis bit akisi bir AC-3 bit akisi veya bir E-AC-3 bit akisidir ve
LPSM'yi içeren meta veri segmentlerinin her biri (örnegin, segmentinde enkoderin
(100) tercih edilen bir uygulanisinin (107) asamasinda) veya bit akisinin bir
çerçevesinin Bit akisi Bilgisinin ("BSI") "addbsi" alanina (Sekil 6'da gösterilen), bir atik
bit segmentine veya bir Aux segmentine dahil edilir. Bu formatta (Tablo 1 ve 2'ye
referansla yukarida tarif edilen format üzerinde bir degisiklik), LPSM içeren addbsi
(veya Aux veya atik biti) alanlarinin her biri asagidaki LPSM degerlerini içerir:
Tablo 1'de belirtilen çekirdek elemanlar, ardindan yük ID (LPSM olarak meta veriyi
tanimlayan) ve yük tasima boyutu degerleri ardindan (yukaridaki Tablo 2'de gösterilen
zorunlu unsurlara benzer sekilde) asagidaki formata sahip olan yük (LPSM verileri):
LPSM yükünün versiyonu: LPSM yükünün versiyonunu gösteren 2-bitlik bir alan;
dialchan: Ilgili ses verilerinin Sol, Sag ve/veya Orta kanallarinin sesli diyalog içerdigini
gösteren 3-bitlik bir alan. Dialchan alaninin bit tahsisi asagidaki gibidir: sol kanalda
diyalogun varligini gösteren bit 0 dialchan alaninin en anlamli bitinde depolanir; ve orta
kanalda diyalogun varligini gösteren bit 2, dialchan alaninin en az anlamli bitinde
depolanir. Dialchan alaninin her biti, karsilik gelen kanal, programin önceki 0.5 saniye
boyunca konusmali diyalog içeriyorsa '1' e ayarlanir;
loudregtyp: program ses siddetinin hangi ses siddeti uygulamasina uygun oldugunu
gösteren 4-bitlik bir alan. "Loudregtyp" alanini '000' olarak ayarlamak, LPSM'nin ses
siddeti uygulamasina uygunluk göstermedigini gösterir. Örnegin, bu alanin bir degeri
(örnegin, 0000) bir ses siddeti düzenleme standardina uyulmadigini gösterebilir, bu
alanin baska bir degeri (örnegin, 0001) programin ses verisinin ATSC A/85 standardina
uygun oldugunu gösterebilir ve bu alanin baska bir degeri (örnegin, 0010), programin
ses verisinin EBU R128 standardina uygun oldugunu gösterebilir. Örnekte, alan '0000'
haricindeki herhangi bir degere ayarlanirsa, yük altinda Ioudcorrdialgat ve Ioudcorrtyp
izlenmelidir;
gösteren bir bitlik alan. Programin ses siddeti diyalog kapisi kullanilarak düzeltilirse,
yüksek sesle çalinan alanin degeri '1' olarak ayarlanir. Aksi halde '0' olarak ayarlanir;
Programin ses siddeti sonsuz öne bakma (dosya tabanli) ses siddeti düzeltme islemi
ile düzeltilirse, yüksek frekansli alanin degeri '0' olarak ayarlanir. Gerçek ses siddeti
ölçümü ve dinamik aralik kontrolü kombinasyonu kullanilarak programin ses siddeti
düzeltilirse, bu alanin degeri '1' olarak ayarlanir;
loudrelgate: göreceli geçitli ses siddeti verilerinin (ITU) var olup olmadigini gösteren bir
bitlik alan. Loudrelgate alani '1' olarak ayarlanirsa, yükte 7-bit ituloudrelgat alani izlenir;
dialnorm ve dinamik menzil sikistirmasi uygulandigindan herhangi bir kazanç ayari
yapilmaksizin ITU-R BS.1770-3'e göre ölçülen ses programinin entegre ses siddetini
yorumlanir;
bir bitlik alan. Loudspchgate alani '1' olarak ayarlanmissa, yükte 7-bit Ioudspchgat alani
takip etmelidir;
lTU-R 88.1770-3 formülü (2)'ye göre ölçülmüs ve dialnorm ve dinamik aralik
sikistirmasi uygulandigindan herhangi bir kazanç ayari yapilmadan karsilik gelen ses
programinin tümlesik ses siddetini gösterir. O'dan 127'ye kadar olan degerler, 0.5 LKFS
adimlarinda -58 ila +5.5 LKFS olarak yorumlanir;
loudstrm3se: kisa süreli (3 saniyelik) ses siddeti verilerinin olup olmadigini gösteren bir
bitlik alan. Alan '1'e ayarlanirsa, yükte 7 bitlik bir Ioudstrmßs alani takip etmelidir;
uygulandigindan herhangi bir kazanç ayari yapilmaksizin ilgili ses programinin Önceki
3 saniyesinin sesi yükselmis oldugunu gösteren 7-bitlik bir alan. O'dan 256'ya kadar
olan degerler 0.5 LKFS adimlarinda -116 LKFS ila +11.5 LKFS olarak yorumlanir;
truepke: gerçek pik ses siddetinin olup olmadigini gösteren bir bitlik alan. Truepke alani
truepk: ITU-R BS.1770-3'ün Ek 2'sine göre ölçülen ve dialnorm ve dinamik aralik
sikistirmasi uygulanmasi nedeniyle herhangi bir kazanç ayarlamasi yapilmaksizin,
programin gerçek tepe örneginek degerini gösteren 8-bitlik bir alan. O'dan 256'ya kadar
olan degerler 0.5 LKFS adimlarinda -116 LKFS ila +11.5 LKFS olarak yorumlanir.
Bazi uygulamalarda, bir AC-3 bit akisinin veya bir E-AC-3 bit akisinin bir çerçevesinin
bir atik bit segmentindeki veya bir auxdata (veya "addbsi") alanindaki bir meta veri
segmentinin çekirdek elemani, bir çekirdek basligi (tipik olarak tanimlama degerleri,
örnegin çekirdek elemani versiyonu de dahil olmak üzere) içerir ve çekirdek basligi
sonrasi: meta veri segmentinin meta verileri için parmak izi verilerini gösteren degerler
(veya diger koruma degerleri); harici verilerin (meta veri segmentinin meta verilerine
karsilik gelen ses verileriyle ilgili) varligini gösteren degerler, her bir meta veri tipi için
yük ID ve yük boyutu degerleri (örnegin, LPSM ve/veya LPSM'den baska bir tipteki
meta veriler) ve çekirdek eleman tarafindan tanimlanan en az bir meta veri tipi için
koruma degerleri için dahil edilmistir. Meta veri segmentinin meta veri yükü(yükleri),
çekirdek basligini takip eder ve (bazi durumlarda) çekirdek elemanin degerlerine
yuvalanir.
Bulusun tipik uygulamalari, bit akisi tarafindan belirtilen ardisik ses programlari
arasinda en az bir sinirin dogru ve saglam bir sekilde belirlenmesine imkan veren
verimli bir sekilde kodlanmis bir ses bit akisindaki program sinir meta verilerini içerir.
Tipik uygulamalar, bir program sinirinin, farkli programlari gösteren bit akislarinin
(bulusa ait bit akisini üretmek için) bir veya her ikisini birden kirpan bir sekilde birbirine
birlestirildigi durumlarda bile dogru program sinirinin belirlenmesine olanak
sagladiklamalari ile dogru ve saglam bir sekilde tespit edilmesine izin verir (ve böylece,
birlestirme öncesi bit akislarindan en az birinde bulunan program sinir meta verilerini
iptal eder).
Tipik uygulamalarda, bulusun bit akisinin bir çerçevesindeki program sinir meta verisi,
bir çerçeve sayimini gösteren bir program sinir bayragidir. Tipik olarak bayrak, geçerli
çerçeve (bayragi içeren çerçeve) ile bir program siniri (geçerli ses programinin basi
veya sonu) arasindaki çerçevelerin sayisini gösterir. Bazi tercih edilen uygulamalarda,
program sinir bayraklari, her bir bit akis segmentinin basinda ve sonunda, simetrik
olarak verimli bir segmentte yerlestirilir; bu, tek bir programi gösterir (diger bir deyisle,
segmentlerin baslangicindan sonra önceden belirlenmis sayida çerçeve içinde
meydana gelen çerçevelerde ve segmentlerin bitiminden önce, önceden belirlenen
çerçevelerin sayisinda meydana gelen çerçevelerde), böylelikle bu iki bit akisi
segmenti birlestirildiginde (iki programin bir dizisinin göstergesi olacak sekilde),
program sinir meta verileri, iki program arasindaki sinirin her iki tarafinda (örnegin,
simetrik olarak) mevcut olabilir.
Maksimum saglamlik, bir programin göstergesi olan bir bit akisinin her çerçevesine bir
program sinir bayragi eklenerek elde edilebilir, ancak bu, veri hizindaki iliskili artis
nedeniyle genellikle pratik olmayacaktir. Tipik uygulamalarda, program sinir bayraklari
kodlanmis bir ses bit akisinin (yalnizca bir ses programinin veya bir sesli program
dizisinin göstergesi olabilir) çerçevelerinin yalnizca bir alt grubuna eklenir ve sinir
bayragi ekleme hizi, bit siniri çerçevelerinin her birinin (bir bayragin yerlestirildigi) her
bir çerçeveye en yakin olan program sinirindan artan ayriminin artmayan bir
fonksiyonudur; burada "sinir bayragi ekleme hizi", bir program sinir bayragi içeren
çerçeve sayisinin (bir programin göstergesi), bir program sinir bayragi içermeyen
çerçeve sayisina (programin göstergesi) ortalama oranidir; burada ortalama,
kodlanmis ses bit akisinin ardisik çerçevelerinin bir sayisi (örnegin nispeten küçük
sayi) üzerinden bir hareketli ortalamadir.
Sinir bayragi ekleme hizinin arttirilmasi (örnegin bit akisindaki bir program sinirina
yakin konumlarda), bit akisinin iletilmesi için gereken veri hizini arttirmaktadir. Bunu
telafi etmek için, her eklenen bayragin boyutu (bit sayisi), sinir bayragi ekleme hizi
arttikça azaltilmalidir (örnegin, bit akisinin "N", çerçevesindeki program sinir
bayraginin boyutu azaltilir, burada N, bir tamsayidir ve “N" çerçeve ile en yakin
program siniri arasindaki mesafenin (çerçevelerin sayisi) artmayan bir fonksiyonudur).
Bir sinif uygulamada, sinir bayragi ekleme hizi, en yakin program sinirindan artan
mesafenin (her bayrak ekleme konumunun) artan mesafesinin Iogaritmik olarak azalan
bir fonksiyonudur ve bayraklardan birini içeren her bayrak içeren çerçeve için,
bahsedilen bayrak içeren çerçevenin bayrak boyutu bahsedilen bayrak içeren
çerçeveden en yakin program sinirina daha yakin konumlanmis bir çerçevedeki her
bayragin boyutuna esit veya bundan büyüktür. Tipik olarak, her bir bayragin boyutu,
bayragin eklenme konumundan en yakin program sinirina kadar olan çerçevelerin
sayisinin artan bir fonksiyonu tarafindan belirlenir.
Örnegin, Sekiller 8 ve 9'de, bir çerçeve numarasi ile (üst satirda) belirlenen her sütun
bir kodlanmis ses bit akisinin bir çerçevesini gösterir. Bit akisi, Sekil 9'un sol tarafinda
birinci program sinirina (programin baslangicini belirtir) sahip ve Sekil 8'in sag
tarafindaki çerçeve numarasi "1" ile tanimlanan sütunun hemen saginda olusan bir
ikinci program sinirina (programin sonunu belirtir) sahip bir ses programinin
göstergesidir. Sekil 8'de gösterilen çerçevelere dahil edilen program sinir bayraklari,
mevcut çerçeve ile ikinci program siniri arasindaki çerçevelerin sayisini asagi dogru
sayar. Sekil 9'da gösterilen çerçevelere dahil edilen program sinir bayraklari, mevcut
çerçeve ile birinci program siniri arasindaki çerçevelerin sayisini sayar.
Sekiller 8 ve 9'daki uygulamada, bir program sinir bayragi, bit akisiyla belirtilen ses
programinin baslangicindan sonra, sifrelenmis bit akisinin ilk X çerçevelerinin "2N".
çerçevelerinin her birine ve bit akisi tarafindan belirtilen programin sonuna en yakin
olan "2N". çerçevelerin her birine (bit akisinin son X çerçevelerinin) eklenir, burada
program Y çerçevelerini içermektedir, X, Y/2'den küçük veya esit bir tamsayidir ve N,
1'den l092(X)'e kadar bir araliktaki pozitif bir tam sayidir. Böylece (Sekil 8 ve 9'da
gösterildigi gibi), bir program sinir bayragi, bit akisinin (programin basina en yakin
bayrak içeren çerçeve) ikinci çerçeveye (N = 1), dördüncü çerçeveye (N = 2), sekizinci
çerçeveye (N = 3) vb. ve bit akisinin sonundan sekizinci çerçeveye, bit akisinin
sonundan dördüncü çerçeveye ve bit akisinin sonundan ikinci çerçeveye (programin
sonuna en yakin olani bayrak içeren çerçeve) eklenir. Bu örnekte, programin
baslangicindan (veya sonundan) sonraki "2N". çerçevedeki program sinir bayragi,
Sekiller 8 ve 9'de gösterildigi gibi 'ng(2N+2) ikili bitlerden olusur. Böylece, programin
baslangicindan (veya sonundan) ikinci çerçevedeki (N = 1) program sinir bayragi
sonraki dördüncü çerçeve (N = 2), logz(2"'*2)=logz(24) = 4 ikili bit içerir ve bu sekilde
devam eder.
Sekiller 8 ve 9`daki örnekte, her bir program sinir bayraginin formati asagidaki gibidir.
Her program sinir bayragi önde gelen "1" bit, "0" bit dizisi (bir "0" bit veya bir veya daha
fazla ardisik "0" bit yok) ve önde gelen bitten sonra iki bitlik bir iz kodundan olusur. Iz
kodu, Sekil 8'de belirtildigi gibi bit akisinin son X çerçevelerindeki (program sonuna en
yakin çerçevelerdeki) bayraklar için "11"dir. Iz kodu, Sekil 9'da gösterildigi gibi, bit
akisinin birinci X çerçevelerindeki bayraklar için "10"dur (programin baslangicina yakin
çerçeveler). Böylece, her bayragi okumak (kod çözmek) için, önde gelen "1" bit ve iz
kodu arasindaki sifir sayilari sayilir. Iz kodu "11" olarak tanimlanirsa, bayrak mevcut
çerçeve (bayragi içeren çerçeve) ile programin bitisi arasinda (2Z+1 - 1) çerçeve
oldugunu belirtir, burada Z bayragin önde gelen “1" biti ve iz kodu arasindaki sifirlarin
sayisidir. Dekoder, bayragin diger (ara) bitlerinin dizisinin tersini saptamak için
(örnegin, ara bitlerin dizisi "0001" ise ve "1" ile biterse, ara bitlerin ters çevrilmis dizisi
bitini görmezden gelecek sekilde ve ara bitlerin ters çevrilmis dizisinin ikili degerini
programin sonuna göre geçerli çerçevenin (bayragin bulundugu çerçeve) endeksi
olarak tanimlamak için verimli bir sekilde uygulanabilir. Örnegin, ara bitlerin ters
çevrilmis sirasi "1000" ise, bu ters çevrilmis dizi ikili deger 24 = 16'ya sahiptir ve
çerçeve programin bitiminden önce 16. çerçeve olarak tanimlanir (Sekil 8'deki sütunda
gösterildigi gibi çerçeve "0" I tanimlar).
Iz kodu "10" olarak tanimlanirsa, bayrak, programin baslangici ile geçerli çerçeve
(bayragi içeren çerçeve) arasinda (22+1 - 1) çerçeveler oldugunu gösterir; burada 2,
bayragin önde gelen "1" biti ve iz kodu arasindaki sifirlarin sayisidir. Dekoder, bayragin
diger (ara) bitlerinin dizisinin tersini saptamak için (örnegin, ara bitlerin dizisi "0001'i ise
ve "1" ile biterse, ara bitlerin ters çevrilmis dizisi “1000”dir ve ters çevrilmis dizideki
birinci bit “1”dir) bu bayraklarin her birini ilk ve son bitini görmezden gelecek sekilde ve
ara bitlerin ters çevrilmis dizisinin ikili degerini programin sonuna göre geçerli
çerçevenin (bayragin bulundugu çerçeve) endeksi olarak tanimlamak için verimli bir
sekilde uygulanabilir. Örnegin, ara bitlerin ters çevrilmis sirasi "1000" ise, bu ters
çevrilmis dizi ikili deger 24 = 16'ya sahiptir ve çerçeve programin baslangicindan sonra
16. çerçeve olarak tanimlanir (Sekil 9'daki sütunda gösterildigi gibi çerçeve "32"yi
tanimlar).
Sekiller 8 ve 9idaki örnekte bir program sinir bayragi, bir program sinir bayragi, bit
akisiyla belirtilen ses programinin baslangicindan sonra, sifrelenmis bit akisinin ilk X
çerçevelerinin "2N". çerçevelerinin her birine ve bit akisi tarafindan belirtilen programin
sonuna en yakin olan "2N". çerçevelerin her birine (bit akisinin son X çerçevelerinin)
eklenir, burada program Y çerçevelerini içermektedir, X, Y/2'den küçük veya esit bir
tamsayidir ve N, 1'den log2(X)'e kadar bir araliktaki pozitif birtam sayidir. Program sinir
bayraklarinin dahil edilmesi bayraksiz bit akisini iletmek için gereken bit oranina
sadece 1.875 bit/çerçeve ortalama bir bit hizi ekler.
Sekiller 8 ve 9'daki tipik bir uygulamada, bit akisinin bir AC-3 kodlanmis ses bit akisi
oldugu her çerçevede, 1536 dijital ses örnegi için ses Içerigi ve meta veriler bulunur. 48
kHz'Iik bir örnekleme orani için, bu 32 milisaniye dijital ses veya saniyede 31.25
çerçeve hizini temsil eder. Bu nedenle, böyle bir uygulamada, bir program sinirindan
belirli sayida çerçeve ("X" çerçeve) ile ayrilmis bir çerçevedeki bir program sinir
bayragi, sinirin, bayrak içeren çerçevenin bitiminden sonra 32X milisaniye olarak
gerçeklestigini gösterir (veya bayrak içeren çerçeve baslamadan önce 32X milisaniye).
Bit akisinin bir E-AC-3 kodlanmis ses bit akisi oldugu Sekiller 8 ve 9'daki tipik bir
uygulamada, bit akisinin her çerçevesi, çerçevenin sirasiyla bir, iki, üç veya alti ses
ses içerigi ve meta verilerini içerir. 48 kHz'Iik bir örnekleme orani için sirasiyla 5.333,
veya 31,25 saniye basina çerçeve sesi temsil eder. Böylece, böyle bir uygulamada (her
çerçevenin 32 milisaniyelik dijital sesi gösterdigini varsayarsak), bir program sinirindan
belirli sayida çerçeve ("X" çerçeve) ile ayrilmis bir çerçevedeki bir program sinir
bayragi, bayrak içeren çerçevenin bitiminden (veya bayrak içeren çerçevenin
baslangicindan 32X milisaniye önce) sonra sinirin 32X milisaniyede olustugunu
gösterir.
Bir program sinirinin, bir ses bit akisinin bir çerçevesi içinde (diger bir deyisle, bir
çerçevenin basina veya sonuna hizalanmamasi) olusabilecek bazi uygulamalarda, bit
akisinin bir çerçevesine dahil edilen program sinir meta verisi, bir bit akisinin bir
çerçevesinde bulunan bir program sinir çerçeve sayisi (diger bir deyisle çerçeve sayisi
içeren çerçeve ve bir program siniri basi veya bitisi arasindaki tam çerçevelerin
sayisini belirten meta veriler) ve bir ofset degerine dahil edilir. Ofset degeri, program
sinirini içeren bir çerçevenin baslangici veya sonu ile program sinirinin bulundugu
çerçeve içindeki program sinirinin gerçek konumu arasinda bir ofsetin (tipik olarak
birkaç örnek) göstergesidir.
Bir kodlanmis ses bit akisi karsilik gelen bir video program dizisinin bir program dizisi
(ses kayitlari) göstergesi olabilir ve bu tür ses programlarinin sinirlari, ses
çerçevelerinin kenarlari yerine video çerçevelerinin kenarlarinda ortaya çikma
egilimindedir. Ayrica, bazi ses kodek bilesenleri (örnegin, E-AC-3 kodek bilesenleri),
video çerçeveleri ile hizalanmayan ses çerçevesi boyutlarini kullanir. Ayrica, bazi
durumlarda, baslangiçta kodlanmis bir ses bit akisi, bir dönüstürülmüs bit akisi
olusturmak üzere dönüstürmeye tabi tutulur ve baslangiçta kodlanmis bit akisinin,
dönüstürülmüs bit akisindan farkli bir çerçeve boyutu vardir, böylece bir program
sinirinin (baslangiçta kodlanmis bit akisiyla belirlenir) dönüstürülmüs bit akisinin bir
çerçeve sinirinda meydana gelmesi garanti edilemez. Örnegin, baslangiçta kodlanmis
bit akisi (örnegin, Sekil 10'daki bit akisi "IEB") her çerçeve için 1538 örnekten olusan
bir çerçeve boyutuna sahipse ve kodlanmis bit akisi (örnegin, Sekil 10'daki bit akisi
program sinirinin, kodlanmis bit akisinin bir çerçeve sinirinda degil, farkli kodeklerin
farkli çerçeve boyutlarindan dolayi bunlarin bir çerçevesindeki bir konunumda (örnegin,
Sekil 10'da gösterildigi gibi, kodlanmis bit akisinin bir çerçevesindeki 512 örnek)
meydana gelmesine neden olabilir. Kodlanmis bir ses bit akisinin bir çerçevesine dahil
edilen program sinir meta verisinin, bir program sinir çerçeve sayisinin yani sira bir
ofset degerini içerdigi mevcut bulusun uygulamalari, bu paragrafta (diger durumlarda
oldugu gibi) belirtilen üç durumda faydalidir.
Yukarida Sekiller 8 ve 9”a referansla tarif edilen uygulama, kodlanmis bit akisinin
herhangi bir çerçevesinde bir ofset degeri (örnegin, bir ofset alani) içermez. Bu
uygulamadaki varyasyonlarda, bir program sinir bayragi (örnegin, Sekil 8'de 0, 8, 12 ve
numarali çerçeveler) içeren bir kodlanmis ses bit akisinin her çerçevesine bir ofset
degeri dahil edilmistir.
Bir sinif uygulamada, bir veri yapisi (bulusa ait program sinir meta verilerini içeren bir
kodlanmis bit akisinin her çerçevesindeki) bir çerçevenin yalnizca bir program sinir
çerçevesi sayimi içeren veya bir program sinir çerçevesi sayimi ve bir ofset degeri
içerdigini gösteren bir kod degeri içerir. Örnegin, kod degeri tek bitlik bir alanin (burada
bir "offset_exist" alani olarak anilacaktir) degeri olabilir, "offset_exist" = 0 degeri
çerçevede hiçbir ofset degerinin bulunmadigini gösterebilir ve "offset_exist" = 1 degeri,
bir program sinir çerçeve sayimi ve bir ofset degerinin çerçeveye dahil edildigini
gösterebilir.
Bazi uygulamalarda, AC-3 veya E-AC-3 kodlanmis ses bit akisinin en az bir çerçevesi,
bit akisi tarafindan tanimlanan bir ses programi için LPSM ve program sinir meta
verileri (ve istege bagli olarak diger meta veriler) de içeren bir meta veri segmentini
içerir. Bu tür bir meta veri segmenti (bir addbsi alanina, bir auxdata alanina veya bit
akisinin atik bit parçasina eklenebilen), bir çekirdek basligi (ve istege bagli olarak ek
çekirdek elemanlari) ve çekirdek basligi (veya çekirdek baslik ve diger çekirdek
elemanlar) sonrasi asagidaki formata sahip bir LPSM yükü (veya konteyner) segmenti
bir baslik (tipik olarak en az bir tanimlama degeri, örnegin, LPSM format versiyonu,
uzunluk, süre, sayim ve alt akis iliskilendirme degerleri içeren), ve
basligin ardindan, program sinir meta verileri (bir program sinir çerçeve sayimi ve
çerçevenin yalnizca bir program sinir çerçevesi sayimi veya bir program sinir çerçeve
sayimi ve bir ofset degeri içerdigini gösteren bir kod degeri (örnegin, bir "of'fset_exist"
degeri) ve LPSM. LPSM asagidakileri içerebilir:
karsilik gelen ses verisinin diyalogu gösterdigini veya diyalogu göstermedigini (örnegin,
karsilik gelen ses verilerinin hangi kanallarin diyalogunu gösterdigini) belirten en az bir
diyalog göstergesi degeri. Diyalog gösterge deger(ler)i diyalogun ilgili ses verilerinin
kanallarinin herhangi bir kombinasyonunda veya hepsinde mevcut olup olmadigini
gösterebilir;
karsilik gelen ses verilerinin belirtilen bir ses siddeti uygulamalari setine uyup
uymadigini gösteren en az bir ses siddeti düzenlemesine uygunluk degeri;
karsilik gelen ses verileri üzerinde gerçeklestirilen en az bir ses siddeti isleme tipini
gösteren en az bir ses siddeti isleme degeri; ve
karsilik gelen ses verisinin en az bir ses siddeti (örnegin pik veya ortalama ses siddeti)
karakteristigini gösteren en az bir ses siddeti degeri.
Bazi uygulamalarda LPSM yük segmenti, çerçevenin sadece bir program sinir
çerçevesi sayimi veya bir program sinir çerçeve sayimi ve bir ofset degeri içerdigini
gösteren bir kod degeri ("offset_exist" degeri) içerir. Örnegin, bu tür bir uygulamada,
böyle bir kod degeri, çerçevenin bir program sinir çerçeve sayimi ve bir ofset degerini
içerdigini gösterdiginde (örnegin, offset_exist = 1 oldugunda) LPSM yük segmenti, 11-
bit imzasiz tamsayi (O ile 2048 arasinda bir degere sahip olan) ve sinyal verilen
çerçeve siniri (program sinirini içeren çerçevenin siniri) ile gerçek program siniri
arasindaki ilave ses numunelerinin sayisini belirtir. Program sinir çerçevesi sayimi,
program sinirini içeren çerçeveye, çerçeve sayisini (geçerli çerçeve hizinda)
gösteriyorsa, program sinirinin kesin konumu (örnek sayisinin birimleri cinsinden)
(LPSM yük boslugu segmentini içeren çerçevenin baslangica veya sonuna göre) su
sekilde hesaplanir:
S = (frame/*counter * frame size) + offset,
burada 8, program sinirina (LPSM yük tasiyici segmentini içeren çerçevenin
baslangicindan veya sonundan itibaren) örnek sayisini, "frame_counter" ise program
siniri çerçeve sayimi tarafindan belirtilen çerçeve sayisini, "frame size" çerçeve basina
örneklerin sayisi ve "ofset“, ofset degeri ile gösterilen örneklerin sayisidir.
Program sinir bayraklarinin yerlestirme hizinin gerçek program sinirinin yakininda
arttigi bazi uygulamalar, ofset degerinin hiç program sinirini içeren çerçeveden ("Y")
sayidan az veya esittir. Tipik olarak, Y = 32'dir. Bu kurali uygulayan bir E-AC-3 enkoder
için (Y = 32 ile), enkoder hiçbir zaman bir ses programinin son saniyesine bir ofset
degeri eklemez. Bu durumda, alici cihaz, bir zamanlayici muhafaza etmekten
sorumludur ve böylece kendi sinir hesaplamasini gerçeklestirir (program siniri içeren
çerçeveden Y çerçeveden fazla olan kodlanmis bir bit akisi çerçevesinde bir ofset
degeri de dahil olmak üzere program sinir meta verisine yanit olarak).
Ses programlarinin karsilik gelen video programlarinin video çerçevelerine "çerçeve
hizali" olarak bilinen programlar için (örnegin, Dolby E kodlanmis sesle tipik katki
beslemeleri), ses programlarini gösteren kodlanmis bit akislarina ofset degerlerini dahil
etmek gereksiz olacaktir. Dolayisiyla, ofset degerleri tipik olarak bu sekilde kodlanmis
bit akislarina dahil edilmez.
Sekil 11'e bakildiginda, kodlanmis ses bit akislarinin bulusa ait ses bit akisinin bir
uygulamasini olusturmak üzere bir araya getirildigi durumlari ele alacagiz.
Sekil 11`in üstünde yer alan bit akisi, ("Senaryo 1" etiketli), program sinir meta verileri
(program sinir bayraklari, F) ve ardindan da program sinir meta verileri (program sinir
bayraklari, F) içeren bir bütün ikinci ses programi (P2) içeren bir bütün birinci ses
programinin (P1) göstergesidir. Birinci programin bitis kismindaki (bazilari Sekil 11'de
gösterilmistir) program sinir bayraklari, Sekil 8'e atifta bulunularak tarif edilenlerle ayni
veya benzer ve iki program arasindaki sinirin yerini belirlemektedir (diger bir deyisle,
ikinci programin basinda yer alan sinir). Ikinci programin baslangiç bölümündeki
(bazilari Sekil 11'de gösterilmistir) program sinir bayraklari, Sekil 9'a referanslar tarif
edilenlerle ayni veya benzerdir ve ayrica sinirin konumunu belirlemektedir. Tipik
uygulamalarda, bir enkoder veya dekoder, program sinirina kadar geri sayim yapan bir
zamanlayiciyi (birinci programdaki bayraklar tarafindan kalibre edilir) uygular ve ayni
zamanlayici (ikinci programdaki bayraklar tarafindan kalibre edilmistir), ayni program
sinirindan yukari ileri dogru yapar. Sekil 11'de yer alan Senaryo 1'deki sinir
zamanlayici grafigi ile gösterildigi gibi, bu zamanlayicinin geri sayimi (birinci
programdaki bayraklar tarafindan kalibre edilmistir) sinirda sifira ulasir ve
zamanlayicinin ileri sayimi (ikinci programdaki bayraklar tarafindan kalibre edilir),
sinirin ayni konumunu gösterir.
Sekil 11'in üstünde yer alan ikinci bit akisi ("Senaryo 2" etiketli), program sinir meta
verileri (program sinir bayraklari, F) ve ardindan program sinir meta verileri içermeyen
bir bütün ikinci ses programi (P2) içeren bir bütün birinci ses programinin (P1)
göstergesidir. Birinci programin bitis bölümündeki (bazilari Sekil 11'de gösterilmistir)
program sinir bayraklari, Sekil 8'e referansla tarif edilenlerle ayni veya benzerdir ve
ayni Senaryo 1'deki gibi iki program arasindaki sinirin yerini belirlemektedir (diger bir
deyisle, ikinci programin baslangicinda). Tipik uygulamalarda, bir enkoder veya
dekoder, program sinirina kadar geri sayim yapan bir zamanlayiciyi (birinci
programdaki bayraklar tarafindan kalibre edilmistir) uygular ve ayni zamanlayici (tekrar
kalibre edilmemistir) (Sekil 11'deki Senaryo 2'deki sinir zamanlayici grafigi ile
gösterildigi gibi) program sinirindan ileri sayim yapmaya devam etmektedir.
Sekil 11`in üstünde yer alan üçüncü bit akisi ("Senaryo 3" etiketli), program sinir meta
verilerini (program sinir bayraklari, F) içeren ve ayni zamanda program sinir
metaverilerini içeren (program sinir bayraklari, F) bütün ikinci ses programi (P2) ile
birlesen kirpilmis bir birinci ses programinin (P1) göstergesidir. Birlestirme, birinci
programin son "N" çerçevelerini kaldirmistir. Ikinci programin baslangiç bölümündeki
(bazilari Sekil 11'de gösterilmistir) program sinir bayraklari, Sekil 9'a referansla tarif
edilenlerle ayni veya benzerdir ve kirpilan birinci program ve bütün ikinci program
arasindaki sinirin (birlestirme) konumunu belirlerler. Tipik uygulamalarda, bir enkoder
veya dekoder, kirpilmamis birinci programin sonuna kadar sayilan (ikinci programdaki
bayraklar tarafindan kalibre edilen) bir zamanlayiciyi uygular ve ayni zamanlayici
(birinci programdaki bayraklar tarafindan kalibre edilmistir) ikinci programin
baslangicina kadar ileri sayar. Ikinci programin baslangici Senaryo 3'teki program
siniridir. Sekil 11'deki Senaryo 3'teki sinir zamanlayici grafigi ile gösterildigi gibi, bu tür
bir zamanlayicinin geri sayimi (birinci programdaki program sinir meta verileri
tarafindan kalibre edilmistir), sifira ulasmadan (birinci programdaki program sinir meta
verisine yanit olarak) resetlenir (ikinci programdaki program sinir meta verisine yanit
olarak). Böylece, (birlestirme ile) birinci programin kirpilmasi, zamanlayicinin, kirpilan
birinci program ile ikinci programin baslangici arasindaki program sinirini, birinci
programda tek basina program sinir meta verisine yanit olarak (diger bir deyisle,
kalibrasyon altinda) tanimlamasini engelledigi halde, ikinci programdaki program meta
verisi zamanlayiciyi resetler, böylece resetleme zamanlayicisi (sifirlama
zamanlayicisinin "sifir" sayimina karsilik gelen konum olarak) kirpilan birinci program
ile ikinci programin baslangici arasindaki program sinir konumunu dogru sekilde
gösterir.
Dördüncü bit akisi ("Senaryc› 4“ etiketli), program sinir meta verilerini (program sinir
bayraklari, F) ve program sinir meta verilerini (program sinir bayraklari, F) içeren
kesilmis ikinci ses programi (P2) ve birinci ses programinin bir kismi (kesilmemis
kismi) ile birlestirilen içeren kirpilmis birinci ses programinin (P1) göstergesidir. Tüm
(ön-kirpma) ikinci programin (bazilari Sekil 11'de gösterilmistir) baslangiç bölümündeki
program sinir bayraklari, Sekil 9'a referansla tarif edilenlerle ayni veya benzerdir ve
program sinir bayraklari, (bazilari Sekil 11'de gösterilmektedir) tüm (ön-kirpma) birinci
programin bitis bölümü, Sekil 8'e referansla tarif edilenlerle ayni veya benzerdir.
Birlestirme, birinci programdan (ve dolayisiyla ekleme öncesinde bulunan program sinir
bayraklarinin bir segmentini) son "N" çerçevelerini ve ikinci programin birinci "M"
çerçevelerini (ve dolayisiyla birlestirmeden önce içerilen program sinir bayraklarinin bir
segmentini) kaldirmistir. Tipik uygulamalarda, bir enkoder veya dekoder, kirpilmamis
birinci programin sonuna kadar sayilan (ikinci programdaki bayraklar tarafindan kalibre
edilen) bir zamanlayiciyi uygular ve ayni zamanlayici (birinci programdaki bayraklar
tarafindan kalibre edilmistir) ikinci programin baslangicina kadar ileri sayar. Sekil
11'deki Senaryo 4'teki sinir zamanlayici grafigi ile gösterildigi gibi, bu tür bir
zamanlayicinin geri sayimi (birinci programdaki program sinir meta verileri tarafindan
kalibre edilmistir), sifira ulasmadan (birinci programdaki program sinir meta verisine
yanit olarak) resetlenir (ikinci programdaki program sinir meta verisine yanit olarak).
Böylece, (birlestirme ile) birinci programin kirpilmasi (birlestirme ile) zamanlayicinin,
kirpilan birinci program ile kirpilan ikinci programin baslangici arasindaki program
sinirini, birinci programda tek basina program sinir meta verisine yanit olarak (diger bir
deyisle, kalibrasyon altinda) tanimlamasini engeller. Ancak sifirlama zamanlayicisi,
kirpilan birinci programin sonu ile kirpilan ikinci programin baslangici arasindaki
program sinirinin konumunu dogru olarak göstermez. Böylece, her iki birlestirilen bit
akisinin kirpilmasi, aralarindaki sinirin dogru bir sekilde belirlenmesini engelleyebilir.
Mevcut bulusun uygulamalari, donanim, kullanici yazilimi veya yazilim veya bunlarin
bir kombinasyonu halinde (örnegin, programlanabilir bir mantik dizisi olarak)
uygulanabilir. Aksi belirtilmedikçe, bulusun bir parçasi olarak dahil edilen algoritmalar
veya islemler, herhangi bir belirli bilgisayar veya diger cihazlarla tabiati geregi ilgili
degildir. Özellikle, çesitli genel amaçli makineler, burada verilen ögretilere uygun olarak
yazilan programlarla kullanilabilir veya gerekli yöntem asamalarini gerçeklestirmek için
daha özel cihazlar (örnegin, entegre devreler) olusturmak daha uygun olabilir. Bu
nedenle, bulus, bir veya daha fazla programlanabilir bilgisayar sistemi üzerinde çalisan
bir veya daha fazla bilgisayar programi (örnegin, Sekil 1'deki elemanlardan herhangi
birinin veya Sekil 2'deki enkoderin (100) (veya bir elemaninin), veya Sekil Sideki
dekoderin (200) (veya bir elemaninin), veya Sekil 3'teki post-islemcinin (300) (veya bir
elemaninin) uygulanmasi) uygulanmasi en azindan bir islemci, en az bir veri depolama
sistemi (uçucu ve uçucu olmayan bellek ve/veya depolama elemani içerir), en az bir
girdi cihazi veya portu ve en az bir çikti cihazi veya portu içerecek sekilde uygulanir.
Burada açiklanan fonksiyonlari yerine getirmek ve çikti bilgisi üretmek için girdi
verilerine program kodu uygulanir. Çikti bilgisi bilinen yöntemlerle bir veya daha fazla
çikti cihazina uygulanir.
Bu tür her bir program, bir bilgisayar sistemi ile iletisim kurmak için herhangi bir arzu
edilen bilgisayar dilinde (makine, kurulum veya üst düzey prosedür, mantiksal veya
nesne yönelimli programlama dilleri dahil) uygulanabilir. Her durumda, dil derlenmis
veya yorumlanmis bir dil olabilir.
Örnegin, bilgisayar yazilimi komut dizileri tarafindan gerçeklestirildiginde, bulusun
uygulamalarinin çesitli fonksiyonlari ve asamalari, uygun dijital sinyal isleme
donaniminda çalisan çoklu okunur yazilim komut dizileri tarafindan uygulanabilir, bu
durumda, çesitli aygitlar, adimlar ve fonksiyonlar, yazilim talimatlarinin bölümlerine
karsilik gelebilir.
Bu tür bir bilgisayar programi tercihen, burada anlatilan prosedürleri gerçeklestirmek
için bilgisayar sistemi tarafindan depolama ortami veya cihaz okundugunda bilgisayari
yapilandirmak ve çalistirmak için, genel veya özel amaçli bir programlanabilir bilgisayar
tarafindan okunabilen bir depolama ortami veya cihaza (örnegin, kati hal bellek veya
ortam veya manyetik veya optik medya) depolanmaktadir veya indirilmektedir. Bulusa
ait sistem ayrica, bir bilgisayar programiyla yapilandirilmis (diger bir deyisle,
depolanarak) bir bilgisayar tarafindan okunabilir, burada depolama ortami bu sekilde
yapilandirilan kayit aracinin, bir bilgisayar sisteminin, burada açiklanan foksiyonlari
yerine getirmek için özel ve önceden tanimlanmis bir segmentte çalismasina neden
Bulusun bazi uygulamalari tarif edilmistir. Bununla birlikte, çesitli degisikliklerin bulusun
alanindan ayrilmaksizin yapilabilecegi anlasilacaktir. Yukaridaki ögretiler isiginda
mevcut bulusun çok sayida modifikasyonu ve varyasyonu mümkündür. Ekli istemlerin
alani dahilinde bulusun burada açiklananlardan farkli olarak uygulanabilecegi
anlasilmalidir.
Claims (1)
- ISTEMLER Asagidakileri içeren bir ses isleme birimi (100, 200) olup, asagidakileri içerir: kodlanmis bir ses bit akisinin en az bir çerçevesinin depolanmasi için bir tampon bellek (110, 201), burada kodlanmis ses bit akisi, ses verileri ve bir meta veri segmentini içermektedir, burada, meta veri segmenti, veri ve ses verilerinden ayri ve farklidir ve bir baslik, bir veya daha fazla meta veri yükleri ve koruma verileri içerir; ses verisinin kodunu çözmek için tampon bellege (110, 201) birlestirilmis bir ses dekoderi (101, 202); ve kodlanmis ses bit akisini ayristirmak için ses dekoderine (101, 202) birlestirilmis veya bütünlestirilmis bir ayristirici (111, 205), burada baslik, meta veri segmentinin baslangicini tanimlayan bir syncword içerir; bir veya daha fazla meta veri yükü, ses verileri ile iliskili bir ses programini tarif eder, koruma verileri bir veya daha fazla meta veri yükünden sonra konumlanir ve koruma verileri meta veri segmentinin bütünlügünü ve meta veri segmentindeki bir veya daha fazla yükü dogrulamak için kullanilir. Istem 1'e göre ses isleme birimi (100, 200) olup, burada, meta veri segmenti, bir atlama alani, bir auxdata alani, bir addbsi alani veya bunlarin kombinasyonunu içeren bir gruptan seçilen bir AC-3 veya E-AC-3 ayrilmis veri alaninda depolanmaktadir. Istem 1 veya 2'ye göre ses Isleme birimi (100, 200) olup, burada bir veya daha fazla meta veri yükü ardisik ses programlari arasindaki en az bir siniri gösteren meta verileri içerir. Istem 1 veya 2'ye göre ses isleme birimi (100, 200) olup, burada bir veya daha fazla meta veri yükü, bir ses programinin ölçülen ses siddetini gösteren verileri içeren bir program ses siddeti yükünü içerir. Istem 4'e göre ses isleme birimi (100, 200) olup, burada program ses siddeti yükü sunlari içerir: bir ses kanalinin konusulan diyalogu içerip içermedigini gösteren bir alan; veya program ses siddeti yükünde bulunan ses siddeti verilerini üretmek için kullanilan bir ses siddeti ölçüm yöntemini belirten bir alan. Istem 4'e göre ses isleme birimi (100, 200) olup, burada programin ses siddeti yükü sunlari içerir: bir ses programinin ses siddetinin diyalog geçidi kullanilarak düzeltilip düzeltilmedigini gösteren bir alan; veya bir ses programinin ses siddetinin sonsuz ileri bakis veya dosya tabanli ses siddeti düzeltme islemi kullanilarak düzeltilip düzeltilmedigini gösteren bir alan. Istem 4'e göre ses isleme birimi (100, 200) olup, burada programin ses siddeti yükü dinamik aralik sikistirmasi ile iliskilendirilen herhangi bir kazanç ayari olmaksizin bir ses programinin entegre ses siddetini gösteren bir alani içerir. Istem 4'e göre ses isleme birimi (100, 200) olup, burada program ses siddeti yükü, diyalog normallestirilmesi ile iliskilendirilen herhangi bir kazanç ayari olmaksizin bir ses programinin entegre ses siddetini gösteren bir alani içerir. 200), programin ses siddeti yükünü kullanarak adaptif ses siddeti islemeyi gerçeklestirmek üzere yapilandirilmistir. Istemler 1 - 9`dan herhangi birine göre ses isleme birimi (100), 200) olup, burada kodlanmis ses bit akisi bir AC-3 bit akisi veya bir E-AC-3 bit akisidir. Istemler 4 - 9'dan herhangi birine göre ses isleme birimi (100, 200) olup, burada ses isleme birimi (100, 200), kodlanmis ses bit akisindan program ses siddeti yükünü ayiklayacak ve program ses siddeti yükünü dogrulayacak veya geçerli kilacak sekilde yapilandirilmistir. Istemler 1 - 11'den herhangi birine göre ses isleme birimi (100, 200) olup, burada bir veya daha fazla meta veri yükü her biri benzersiz bir yük tanimlayicisi içerir ve benzersiz yük tanimlayicisi her bir meta veri yükünün baslangicinda bulunur. Istemler 1 - 11'den herhangi birine göre ses isleme birimi (100, 200) olup, syncword, 0x5838'lik bir degere sahip olan 16-bitlik bir syncworddür. Kodlanmis bir ses bit akisinin kodunun çözülmesi için bir yöntem olup, yöntem asagidakileri içermektedir: kodlanmis bir ses bit akisinin alinmasi, kodlanmis ses bit akisi bir veya daha fazla çerçeveye bölünmüstür; kodlanmis ses bit akisindan ses verisi ve bir meta veri segmentinin çikarilmasi, meta veri segmentini, ses verilerinden ayri ve farklidir ve bir baslik, bunu takiben bir veya daha fazla meta veri yükü ve takiben koruma verileri içerir; ve koruma verisinin kullanimi yoluyla segmentin bütünlügünün ve bir veya daha fazla meta veri yükünün dogrulanmasi, burada bir veya daha fazla meta veri yükü, ses verileri ile iliskili bir ses programinin ölçülmüs ses siddetini gösteren verileri içeren bir program ses siddeti yükünü içerir. Istem 14'e göre yöntem olup, burada meta veri segmenti, bir çerçevenin bir veya daha fazla atlama alani veya atik bit segmentlerinde depolanir.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361754882P | 2013-01-21 | 2013-01-21 | |
US201361824010P | 2013-05-16 | 2013-05-16 |
Publications (1)
Publication Number | Publication Date |
---|---|
TR201802631T4 true TR201802631T4 (tr) | 2018-03-21 |
Family
ID=51210033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TR2018/02631T TR201802631T4 (tr) | 2013-01-21 | 2014-01-15 | Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder |
Country Status (22)
Country | Link |
---|---|
US (6) | US9916838B2 (tr) |
EP (3) | EP3244406B1 (tr) |
JP (9) | JP6212565B2 (tr) |
KR (8) | KR102488704B1 (tr) |
CN (2) | CN107657959B (tr) |
AU (1) | AU2014207590B2 (tr) |
BR (5) | BR122020018591B1 (tr) |
CA (1) | CA2888350C (tr) |
DK (1) | DK2901449T3 (tr) |
ES (4) | ES2749089T3 (tr) |
HK (3) | HK1212091A1 (tr) |
HU (1) | HUE036119T2 (tr) |
IL (9) | IL293618A (tr) |
MX (6) | MX2018006149A (tr) |
MY (2) | MY193854A (tr) |
PL (1) | PL2901449T3 (tr) |
RU (3) | RU2589362C1 (tr) |
SG (2) | SG10201604643RA (tr) |
TR (1) | TR201802631T4 (tr) |
TW (9) | TWI611395B (tr) |
UA (3) | UA122560C2 (tr) |
WO (1) | WO2014113465A1 (tr) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2783366B1 (en) * | 2011-11-22 | 2015-09-16 | Dolby Laboratories Licensing Corporation | Method and system for generating an audio metadata quality score |
US9570090B2 (en) * | 2015-05-26 | 2017-02-14 | Google Inc. | Dialog system with automatic reactivation of speech acquiring mode |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
US10095468B2 (en) | 2013-09-12 | 2018-10-09 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
US9349378B2 (en) | 2013-11-19 | 2016-05-24 | Dolby Laboratories Licensing Corporation | Haptic signal synthesis and transport in a bit stream |
EP2879131A1 (en) | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
US9621963B2 (en) | 2014-01-28 | 2017-04-11 | Dolby Laboratories Licensing Corporation | Enabling delivery and synchronization of auxiliary content associated with multimedia data using essence-and-version identifier |
US10063207B2 (en) | 2014-02-27 | 2018-08-28 | Dts, Inc. | Object-based audio loudness management |
MY174199A (en) | 2014-05-28 | 2020-03-13 | Fraunhofer Ges Forschung | Data processor and transport of user control data to audio decoders and renderers |
RU2017106641A (ru) * | 2014-09-08 | 2018-09-03 | Сони Корпорейшн | Устройство и способ кодирования, устройство и способ декодирования и программа |
WO2016057530A1 (en) * | 2014-10-10 | 2016-04-14 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
US9584911B2 (en) * | 2015-03-27 | 2017-02-28 | Cirrus Logic, Inc. | Multichip dynamic range enhancement (DRE) audio processing methods and apparatuses |
CN107820711B (zh) | 2015-06-17 | 2020-09-08 | 弗劳恩霍夫应用研究促进协会 | 用于音频编码系统中用户交互性的响度控制 |
US9837086B2 (en) * | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
EP3332310B1 (en) | 2015-08-05 | 2019-05-29 | Dolby Laboratories Licensing Corporation | Low bit rate parametric encoding and transport of haptic-tactile signals |
US9590580B1 (en) | 2015-09-13 | 2017-03-07 | Guoguang Electric Company Limited | Loudness-based audio-signal compensation |
US10341770B2 (en) * | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
US10007713B2 (en) * | 2015-10-15 | 2018-06-26 | Disney Enterprises, Inc. | Metadata extraction and management |
US10594689B1 (en) | 2015-12-04 | 2020-03-17 | Digimarc Corporation | Robust encoding of machine readable information in host objects and biometrics, and associated decoding and authentication |
US10573324B2 (en) | 2016-02-24 | 2020-02-25 | Dolby International Ab | Method and system for bit reservoir control in case of varying metadata |
US10015612B2 (en) * | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
US10210881B2 (en) * | 2016-09-16 | 2019-02-19 | Nokia Technologies Oy | Protected extended playback mode |
SG10202100336WA (en) | 2017-01-10 | 2021-02-25 | Fraunhofer Ges Forschung | Audio decoder, audio encoder, method for providing a decoded audio signal, method for providing an encoded audio signal, audio stream, audio stream provider and computer program using a stream identifier |
US10354669B2 (en) | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
US10878879B2 (en) * | 2017-06-21 | 2020-12-29 | Mediatek Inc. | Refresh control method for memory system to perform refresh action on all memory banks of the memory system within refresh window |
CN110945494A (zh) | 2017-07-28 | 2020-03-31 | 杜比实验室特许公司 | 向客户端提供媒体内容的方法和系统 |
CN109389987B (zh) | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
US11895369B2 (en) | 2017-08-28 | 2024-02-06 | Dolby Laboratories Licensing Corporation | Media-aware navigation metadata |
JP7274492B2 (ja) | 2018-02-22 | 2023-05-16 | ドルビー・インターナショナル・アーベー | パケット化メディアストリームのサイドロード処理のための方法、機器、およびシステム |
EP3570279A1 (en) * | 2018-05-17 | 2019-11-20 | MediaTek Inc. | Audio output monitoring for failure detection of warning sound playback |
US10937434B2 (en) * | 2018-05-17 | 2021-03-02 | Mediatek Inc. | Audio output monitoring for failure detection of warning sound playback |
WO2020084170A1 (en) * | 2018-10-26 | 2020-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Directional loudness map based audio processing |
US11316490B2 (en) | 2019-03-14 | 2022-04-26 | Gaudio Lab, Inc. | Audio signal processing method and device for controlling loudness level |
JP7314398B2 (ja) * | 2019-08-15 | 2023-07-25 | ドルビー・インターナショナル・アーベー | 変更オーディオビットストリームの生成及び処理のための方法及び装置 |
EP4052725A1 (en) | 2019-10-30 | 2022-09-07 | National University Corporation Okayama University | Prophylactic and/or therapeutic agent for inflammatory pulmonary disease |
US11922532B2 (en) | 2020-01-15 | 2024-03-05 | Digimarc Corporation | System for mitigating the problem of deepfake media content using watermarking |
CN115280791A (zh) * | 2020-03-11 | 2022-11-01 | 字节跳动有限公司 | 数字媒体完整性的指示 |
US11315581B1 (en) | 2020-08-17 | 2022-04-26 | Amazon Technologies, Inc. | Encoding audio metadata in an audio frame |
CN115292545B (zh) * | 2022-10-08 | 2022-12-20 | 腾讯科技(深圳)有限公司 | 一种音频数据处理方法、装置、设备以及可读存储介质 |
Family Cites Families (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE138238T1 (de) | 1991-01-08 | 1996-06-15 | Dolby Lab Licensing Corp | Kodierer/dekodierer für mehrdimensionale schallfelder |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
KR0152037B1 (ko) * | 1994-09-27 | 1998-11-02 | 김광호 | 다채널 오디오신호의 전송 비트열구조 |
US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
US7224819B2 (en) | 1995-05-08 | 2007-05-29 | Digimarc Corporation | Integrating digital watermarks in multimedia content |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
GB2373975B (en) | 2001-03-30 | 2005-04-13 | Sony Uk Ltd | Digital audio signal processing |
US6807528B1 (en) * | 2001-05-08 | 2004-10-19 | Dolby Laboratories Licensing Corporation | Adding data to a compressed data frame |
US7072477B1 (en) | 2002-07-09 | 2006-07-04 | Apple Computer, Inc. | Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file |
US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
US8301884B2 (en) * | 2002-09-16 | 2012-10-30 | Samsung Electronics Co., Ltd. | Method of managing metadata |
KR100860984B1 (ko) | 2002-10-15 | 2008-09-30 | 삼성전자주식회사 | 메타데이터 관리 방법 |
US8979655B2 (en) * | 2002-12-10 | 2015-03-17 | Ol2, Inc. | System and method for securely hosting applications |
CN100583239C (zh) * | 2003-02-28 | 2010-01-20 | 松下电器产业株式会社 | 再生装置及再生方法 |
JP2007526588A (ja) * | 2003-06-18 | 2007-09-13 | トムソン ライセンシング | 映画フィルムへのデータ記録 |
US7509255B2 (en) | 2003-10-03 | 2009-03-24 | Victor Company Of Japan, Limited | Apparatuses for adaptively controlling processing of speech signal and adaptively communicating speech in accordance with conditions of transmitting apparatus side and radio wave and methods thereof |
WO2005069613A1 (en) | 2004-01-08 | 2005-07-28 | Koninklijke Philips Electronics, N.V. | Graphical representation of programs stored in a personal video recording device |
US8131134B2 (en) * | 2004-04-14 | 2012-03-06 | Microsoft Corporation | Digital media universal elementary stream |
DE602005023997D1 (de) | 2004-06-21 | 2010-11-18 | Mitsubishi Electric Corp | Codierungseinrichtung für bewegliche bilder, aufzeichnungseinrichtung für bewegliche bilder und wiedergabeeinrichtung für bewegliche bilder |
US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7624021B2 (en) | 2004-07-02 | 2009-11-24 | Apple Inc. | Universal container for audio data |
KR100991803B1 (ko) * | 2004-07-22 | 2010-11-04 | 주식회사 넷앤티비 | Saf 동기화 계층 패킷 구조를 제공하는 saf 동기화 계층 패킷 제공 시스템 및 사용자 단말 |
KR100689443B1 (ko) | 2004-08-21 | 2007-03-08 | 삼성전자주식회사 | 방송 데이터를 저장하기 위한 디지털 방송 시스템 및송수신 방법 |
US7729673B2 (en) | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
CL2006000541A1 (es) | 2005-03-10 | 2008-01-04 | Qualcomm Inc | Metodo para el procesamiento de datos multimedia que comprende: a) determinar la complejidad de datos multimedia; b) clasificar los datos multimedia en base a la complejidad determinada; y aparato asociado. |
TWI397903B (zh) | 2005-04-13 | 2013-06-01 | Dolby Lab Licensing Corp | 編碼音訊之節約音量測量技術 |
TW200638335A (en) | 2005-04-13 | 2006-11-01 | Dolby Lab Licensing Corp | Audio metadata verification |
WO2006113999A1 (en) * | 2005-04-26 | 2006-11-02 | D-Box Technologies Inc. | Method and apparatus for providing a motion signal with a sound signal using an existing sound signal encoding format |
US7702279B2 (en) * | 2005-12-20 | 2010-04-20 | Apple Inc. | Portable media player as a low power remote control and method thereof |
BRPI0706488A2 (pt) * | 2006-02-23 | 2011-03-29 | Lg Electronics Inc | método e aparelho para processar sinal de áudio |
US7983910B2 (en) * | 2006-03-03 | 2011-07-19 | International Business Machines Corporation | Communicating across voice and text channels with emotion preservation |
US20080025530A1 (en) | 2006-07-26 | 2008-01-31 | Sony Ericsson Mobile Communications Ab | Method and apparatus for normalizing sound playback loudness |
US20080080722A1 (en) | 2006-09-29 | 2008-04-03 | Carroll Tim J | Loudness controller with remote and local control |
WO2008136608A1 (en) | 2007-05-02 | 2008-11-13 | Pixtree Technologis, Inc. | Method of processing media data and receiver, broadcasting system |
KR101074585B1 (ko) * | 2007-07-02 | 2011-10-17 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 미디어 데이터 컨테이너 및 메타데이터 컨테이너를 포함하는 파일을 읽고 저장하는 장치 및 방법 |
CN101350604B (zh) | 2007-07-19 | 2012-07-04 | 鸿富锦精密工业(深圳)有限公司 | 自动切换音量调节模式的装置及方法 |
US20090164473A1 (en) | 2007-12-19 | 2009-06-25 | Harman International Industries, Incorporated | Vehicle infotainment system with virtual personalization settings |
US20090164378A1 (en) * | 2007-12-21 | 2009-06-25 | Steven Marcus Jason West | Music Distribution |
JP5142769B2 (ja) * | 2008-03-11 | 2013-02-13 | 株式会社日立製作所 | 音声データ検索システム及び音声データの検索方法 |
US20090253457A1 (en) | 2008-04-04 | 2009-10-08 | Apple Inc. | Audio signal processing for certification enhancement in a handheld wireless communications device |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
US8315396B2 (en) | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
EP2319039B1 (fr) * | 2008-07-29 | 2017-11-29 | Orange | Procede de mise a jour d'un codeur par interpolation de filtre |
US8218790B2 (en) | 2008-08-26 | 2012-07-10 | Apple Inc. | Techniques for customizing control of volume level in device playback |
JP2010135906A (ja) | 2008-12-02 | 2010-06-17 | Sony Corp | クリップ防止装置及びクリップ防止方法 |
JP5267115B2 (ja) | 2008-12-26 | 2013-08-21 | ソニー株式会社 | 信号処理装置、その処理方法およびプログラム |
JP4519934B2 (ja) * | 2008-12-26 | 2010-08-04 | 株式会社東芝 | 音声再生装置 |
US8422699B2 (en) | 2009-04-17 | 2013-04-16 | Linear Acoustic, Inc. | Loudness consistency at program boundaries |
KR101842411B1 (ko) * | 2009-08-14 | 2018-03-26 | 디티에스 엘엘씨 | 오디오 객체들을 적응적으로 스트리밍하기 위한 시스템 |
TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
TWI525987B (zh) | 2010-03-10 | 2016-03-11 | 杜比實驗室特許公司 | 在單一播放模式中組合響度量測的系統 |
EP2381574B1 (en) | 2010-04-22 | 2014-12-03 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an input audio signal |
JP2012010311A (ja) * | 2010-05-26 | 2012-01-12 | Sony Corp | 送信装置、送信方法、受信装置、受信方法および送受信システム |
US20120033819A1 (en) | 2010-08-06 | 2012-02-09 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus therefor, decoding apparatus therefor, and information storage medium |
BR122021003688B1 (pt) * | 2010-08-12 | 2021-08-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
JP5903758B2 (ja) | 2010-09-08 | 2016-04-13 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
TWI716169B (zh) * | 2010-12-03 | 2021-01-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
US8989884B2 (en) | 2011-01-11 | 2015-03-24 | Apple Inc. | Automatic audio configuration based on an audio output device |
EP2695161B1 (en) | 2011-04-08 | 2014-12-17 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
JP2012235310A (ja) | 2011-04-28 | 2012-11-29 | Sony Corp | 信号処理装置および方法、プログラム、並びにデータ記録媒体 |
WO2012146757A1 (en) | 2011-04-28 | 2012-11-01 | Dolby International Ab | Efficient content classification and loudness estimation |
US20120287999A1 (en) | 2011-05-11 | 2012-11-15 | Microsoft Corporation | Syntax element prediction in error correction |
US8965774B2 (en) | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
JP2013102411A (ja) | 2011-10-14 | 2013-05-23 | Sony Corp | 音声信号処理装置、および音声信号処理方法、並びにプログラム |
WO2013087861A2 (en) | 2011-12-15 | 2013-06-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer programm for avoiding clipping artefacts |
TWI517142B (zh) | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
EP2757558A1 (en) | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
CA2898567C (en) | 2013-01-28 | 2018-09-18 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices |
US9607624B2 (en) | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
US9559651B2 (en) | 2013-03-29 | 2017-01-31 | Apple Inc. | Metadata for loudness and dynamic range control |
JP2015050685A (ja) | 2013-09-03 | 2015-03-16 | ソニー株式会社 | オーディオ信号処理装置および方法、並びにプログラム |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
US9300268B2 (en) | 2013-10-18 | 2016-03-29 | Apple Inc. | Content aware audio ducking |
PT3061090T (pt) | 2013-10-22 | 2019-07-11 | Fraunhofer Ges Forschung | Conceito combinado para a compressão de gama dinâmica e a prevenção de clipping guiada para dispositivos de áudio |
US9240763B2 (en) | 2013-11-25 | 2016-01-19 | Apple Inc. | Loudness normalization based on user feedback |
US9276544B2 (en) | 2013-12-10 | 2016-03-01 | Apple Inc. | Dynamic range control gain encoding |
RU2764260C2 (ru) | 2013-12-27 | 2022-01-14 | Сони Корпорейшн | Устройство и способ декодирования |
US9608588B2 (en) | 2014-01-22 | 2017-03-28 | Apple Inc. | Dynamic range control with large look-ahead |
US9654076B2 (en) | 2014-03-25 | 2017-05-16 | Apple Inc. | Metadata for ducking control |
CN106165014B (zh) | 2014-03-25 | 2020-01-24 | 弗朗霍夫应用科学研究促进协会 | 音频编码器装置、音频解码器装置、及其操作方法 |
MY174199A (en) | 2014-05-28 | 2020-03-13 | Fraunhofer Ges Forschung | Data processor and transport of user control data to audio decoders and renderers |
RU2699406C2 (ru) | 2014-05-30 | 2019-09-05 | Сони Корпорейшн | Устройство обработки информации и способ обработки информации |
KR20220104290A (ko) | 2014-06-30 | 2022-07-26 | 소니그룹주식회사 | 정보 처리 장치 및 정보 처리 방법 |
TWI631835B (zh) | 2014-11-12 | 2018-08-01 | 弗勞恩霍夫爾協會 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
US20160315722A1 (en) | 2015-04-22 | 2016-10-27 | Apple Inc. | Audio stem delivery and control |
US10109288B2 (en) | 2015-05-27 | 2018-10-23 | Apple Inc. | Dynamic range and peak control in audio using nonlinear filters |
WO2016193033A1 (de) | 2015-05-29 | 2016-12-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und verfahren zur lautstärkenregulierung |
CN107820711B (zh) | 2015-06-17 | 2020-09-08 | 弗劳恩霍夫应用研究促进协会 | 用于音频编码系统中用户交互性的响度控制 |
US9934790B2 (en) | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
US9837086B2 (en) | 2015-07-31 | 2017-12-05 | Apple Inc. | Encoded audio extended metadata-based dynamic range control |
US10341770B2 (en) | 2015-09-30 | 2019-07-02 | Apple Inc. | Encoded audio metadata-based loudness equalization and dynamic equalization during DRC |
-
2014
- 2014-01-15 MX MX2018006149A patent/MX2018006149A/es unknown
- 2014-01-15 MX MX2021011251A patent/MX2021011251A/es unknown
- 2014-01-15 CN CN201710860453.5A patent/CN107657959B/zh active Active
- 2014-01-15 RU RU2015113788/08A patent/RU2589362C1/ru active
- 2014-01-15 UA UAA201606019A patent/UA122560C2/uk unknown
- 2014-01-15 BR BR122020018591-0A patent/BR122020018591B1/pt active IP Right Grant
- 2014-01-15 KR KR1020217013811A patent/KR102488704B1/ko active IP Right Grant
- 2014-01-15 KR KR1020207033614A patent/KR102251763B1/ko active IP Right Grant
- 2014-01-15 BR BR122020020608-0A patent/BR122020020608B1/pt active IP Right Grant
- 2014-01-15 KR KR1020167005828A patent/KR102153278B1/ko active IP Right Grant
- 2014-01-15 UA UAA201606020A patent/UA122050C2/uk unknown
- 2014-01-15 SG SG10201604643RA patent/SG10201604643RA/en unknown
- 2014-01-15 EP EP17173020.3A patent/EP3244406B1/en active Active
- 2014-01-15 TR TR2018/02631T patent/TR201802631T4/tr unknown
- 2014-01-15 WO PCT/US2014/011672 patent/WO2014113465A1/en active Application Filing
- 2014-01-15 KR KR1020177016786A patent/KR102183712B1/ko active IP Right Grant
- 2014-01-15 MY MYPI2018002421A patent/MY193854A/en unknown
- 2014-01-15 CA CA2888350A patent/CA2888350C/en active Active
- 2014-01-15 RU RU2016119385A patent/RU2713609C2/ru active
- 2014-01-15 KR KR1020167015999A patent/KR102158002B1/ko active IP Right Grant
- 2014-01-15 SG SG11201502405RA patent/SG11201502405RA/en unknown
- 2014-01-15 MY MYPI2015701028A patent/MY183382A/en unknown
- 2014-01-15 BR BR112015007723-4A patent/BR112015007723B1/pt active IP Right Grant
- 2014-01-15 MX MX2015004468A patent/MX339611B/es active IP Right Grant
- 2014-01-15 UA UAA201503505A patent/UA112249C2/uk unknown
- 2014-01-15 AU AU2014207590A patent/AU2014207590B2/en active Active
- 2014-01-15 JP JP2015537032A patent/JP6212565B2/ja active Active
- 2014-01-15 ES ES16164487T patent/ES2749089T3/es active Active
- 2014-01-15 ES ES16164479.4T patent/ES2667871T3/es active Active
- 2014-01-15 KR KR1020157009454A patent/KR101637897B1/ko active IP Right Grant
- 2014-01-15 CN CN201480002687.0A patent/CN104737228B/zh active Active
- 2014-01-15 KR KR1020157009559A patent/KR102192755B1/ko active IP Right Grant
- 2014-01-15 HU HUE14740284A patent/HUE036119T2/hu unknown
- 2014-01-15 EP EP14740284.6A patent/EP2901449B1/en active Active
- 2014-01-15 KR KR1020237001019A patent/KR20230011500A/ko not_active Application Discontinuation
- 2014-01-15 MX MX2016004804A patent/MX356196B/es unknown
- 2014-01-15 IL IL293618A patent/IL293618A/en unknown
- 2014-01-15 BR BR122015008454-7A patent/BR122015008454B1/pt active IP Right Grant
- 2014-01-15 EP EP20211869.1A patent/EP3822970A1/en active Pending
- 2014-01-15 PL PL14740284T patent/PL2901449T3/pl unknown
- 2014-01-15 IL IL287218A patent/IL287218B/en unknown
- 2014-01-15 RU RU2016119393A patent/RU2719690C2/ru active
- 2014-01-15 US US14/434,528 patent/US9916838B2/en active Active
- 2014-01-15 ES ES17173020T patent/ES2843744T3/es active Active
- 2014-01-15 MX MX2016004803A patent/MX343571B/es unknown
- 2014-01-15 ES ES14740284.6T patent/ES2660487T3/es active Active
- 2014-01-15 BR BR122016011963-7A patent/BR122016011963B1/pt active IP Right Grant
- 2014-01-15 DK DK14740284.6T patent/DK2901449T3/en active
- 2014-01-16 TW TW106112038A patent/TWI611395B/zh active
- 2014-01-16 TW TW110149670A patent/TWI811934B/zh active
- 2014-01-16 TW TW109117299A patent/TWI754286B/zh active
- 2014-01-16 TW TW106115507A patent/TWI611396B/zh active
- 2014-01-16 TW TW104142267A patent/TWI590231B/zh active
- 2014-01-16 TW TW108114777A patent/TWI696171B/zh active
- 2014-01-16 TW TW106137433A patent/TWI636454B/zh active
- 2014-01-16 TW TW107123341A patent/TWI666628B/zh active
- 2014-01-16 TW TW103101619A patent/TWI524329B/zh active
-
2015
- 2015-03-04 IL IL237561A patent/IL237561A/en active IP Right Grant
- 2015-04-09 MX MX2022013535A patent/MX2022013535A/es unknown
-
2016
- 2016-01-05 HK HK16100034.0A patent/HK1212091A1/xx unknown
- 2016-07-05 JP JP2016133169A patent/JP6442443B2/ja active Active
- 2016-07-05 JP JP2016133170A patent/JP6371340B2/ja active Active
-
2017
- 2017-04-03 US US15/478,049 patent/US9911426B2/en active Active
- 2017-04-19 US US15/491,661 patent/US9905237B2/en active Active
- 2017-04-25 JP JP2017085923A patent/JP6472481B2/ja active Active
- 2017-09-29 JP JP2017190117A patent/JP6561097B2/ja active Active
- 2017-11-20 US US15/818,102 patent/US10672413B2/en active Active
- 2017-11-30 IL IL256015A patent/IL256015B/en active IP Right Grant
- 2017-11-30 IL IL256016A patent/IL256016B/en active IP Right Grant
-
2018
- 2018-01-23 US US15/877,808 patent/US20180151188A1/en not_active Abandoned
- 2018-04-04 HK HK18104468.5A patent/HK1245490A1/zh unknown
- 2018-05-16 IL IL25941218A patent/IL259412B/en active IP Right Grant
- 2018-07-03 HK HK18108488.2A patent/HK1248913A1/zh unknown
-
2019
- 2019-07-22 JP JP2019134480A patent/JP6641058B2/ja active Active
- 2019-09-05 IL IL269138A patent/IL269138B/en active IP Right Grant
- 2019-12-26 JP JP2019235970A patent/JP6929345B2/ja active Active
-
2020
- 2020-05-03 IL IL274397A patent/IL274397B/en active IP Right Grant
- 2020-05-28 US US16/886,227 patent/US20200357422A1/en not_active Abandoned
-
2021
- 2021-02-02 IL IL280583A patent/IL280583B/en unknown
- 2021-08-10 JP JP2021130749A patent/JP7371067B2/ja active Active
-
2023
- 2023-07-20 JP JP2023117942A patent/JP2023134751A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7371067B2 (ja) | プログラム・ラウドネスおよび境界メタデータをもつオーディオ・エンコーダおよびデコーダ | |
KR102297597B1 (ko) | 프로그램 정보 또는 서브스트림 구조 메타데이터를 갖는 오디오 인코더 및 디코더 | |
EP3082128B1 (en) | Audio decoder with program loudness and boundary metadata |