TW201622368A - 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 - Google Patents
用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 Download PDFInfo
- Publication number
- TW201622368A TW201622368A TW104136494A TW104136494A TW201622368A TW 201622368 A TW201622368 A TW 201622368A TW 104136494 A TW104136494 A TW 104136494A TW 104136494 A TW104136494 A TW 104136494A TW 201622368 A TW201622368 A TW 201622368A
- Authority
- TW
- Taiwan
- Prior art keywords
- stream
- data
- encoder
- media material
- secondary media
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000012545 processing Methods 0.000 claims abstract description 33
- 230000008569 process Effects 0.000 claims abstract description 8
- 239000000463 material Substances 0.000 claims description 220
- 238000005070 sampling Methods 0.000 claims description 56
- 230000003321 amplification Effects 0.000 claims description 22
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 22
- 238000012952 Resampling Methods 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 239000000523 sample Substances 0.000 description 56
- 230000005540 biological transmission Effects 0.000 description 32
- 230000005236 sound signal Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 23
- 238000006243 chemical reaction Methods 0.000 description 17
- 238000012544 monitoring process Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 16
- 230000003068 static effect Effects 0.000 description 12
- 238000009826 distribution Methods 0.000 description 11
- 238000004519 manufacturing process Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000013461 design Methods 0.000 description 8
- 238000007493 shaping process Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 238000003860 storage Methods 0.000 description 7
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000002093 peripheral effect Effects 0.000 description 4
- 230000001360 synchronised effect Effects 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 238000004091 panning Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- MYPYJXKWCTUITO-UHFFFAOYSA-N vancomycin Natural products O1C(C(=C2)Cl)=CC=C2C(O)C(C(NC(C2=CC(O)=CC(O)=C2C=2C(O)=CC=C3C=2)C(O)=O)=O)NC(=O)C3NC(=O)C2NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(CC(C)C)NC)C(O)C(C=C3Cl)=CC=C3OC3=CC2=CC1=C3OC1OC(CO)C(O)C(O)C1OC1CC(C)(N)C(O)C(C)O1 MYPYJXKWCTUITO-UHFFFAOYSA-N 0.000 description 2
- 241000270281 Coluber constrictor Species 0.000 description 1
- 241001417495 Serranidae Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 230000000386 athletic effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- OQZCSNDVOWYALR-UHFFFAOYSA-N flurochloridone Chemical compound FC(F)(F)C1=CC=CC(N2C(C(Cl)C(CCl)C2)=O)=C1 OQZCSNDVOWYALR-UHFFFAOYSA-N 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000011295 pitch Substances 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/233—Processing of audio elementary streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/235—Processing of additional data, e.g. scrambling of additional data or processing content descriptors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/81—Monomedia components thereof
- H04N21/8106—Monomedia components thereof involving special audio data, e.g. different tracks for different languages
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
顯示用於編碼包含針對主要媒體資料的元資料或控制資料的次要媒體資料之一編碼器,其中該編碼器係經組配以使用增加冗餘或頻帶限制而編碼該次要媒體資料,及其中該編碼器係經組配以輸出該已編碼次要媒體資料為一串流之數位字組。因此,該串流之數位字組可經形成為使得其能夠對抗一數位音訊串流的一典型處理。又復,用於處理一數位音訊串流的手段能夠處理該串流之數位字組,原因在於該串流之數位字組可經設計為一類似音訊或類似類比數位串流。
Description
本發明係有關於用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器。
換言之,本發明顯示一種透過一數位音訊頻道分配控制資料或元資料之方法及設備。一實施例顯示控制資料或元資料的方便及可靠的傳輸以伴隨一音訊信號,特別於使用內嵌於高畫質串列數位介面(HD-SDI)的標準AES3(AES:音訊工程學會)脈衝代碼調變(PCM)音訊位元串流的電視臺、系統、或網路。
於音訊、視訊、及其它多媒體內容的生產及傳輸中,藉由涵括描述該內容特性的元資料,該內容的重製可被提升或變得更為有用或更有價值。舉例言之,藉由涵括ID3標籤於MP3檔案而提供有關該內容的名稱或藝術家的資訊,可使得以MP3格式編碼的音樂變得更為有用。
於視訊內容中,常見不僅包括描述性元資料,同
時取決於該消費者的設備及環境,也包括用於控制該內容的重製之資料。舉例言之,電視廣播及視訊碟諸如DVD及藍光碟包括動態範圍控制資料,其係用以修正該內容的響度範圍,及下混增益,其係用以控制一環繞音效多聲道音訊信號的轉換用於在一立體聲裝置上重製。以動態範圍控制資料為例,歷經各個數毫秒內容發送增益以便壓縮該內容之動態範圍用於在一噪雜環境中回放,或當偏好節目之較小範圍的響度時,經由藉該等增益選擇性地倍增該終音訊信號。
涵括此種元資料或控制資料於數位位元串流或檔案以供傳遞給消費者的手段已經明確建立及規定於音訊編碼標準,諸如先進電視系統委員會公司音訊壓縮標準A/52的標準化(ATSC A/52)或MPEG HE-AAC(IXO/IEC 14496-3及ETSI TS 101 154的標準化)。
然而,在內容被編碼成一終位元串流之前,於專業或製作環境中的元資料或控制資料之傳輸係遠更不標準化。直到今日,此項資訊本質上主要為靜態,在該內容的持續期間維持恆定。雖然響度控制增益為動態,但於內容產生標準中「編碼輪廓」可經建立以控制於終音訊編碼處理期間該等增益的生成。藉此方式,於該內容形成環境中無需紀錄或傳輸動態元資料。
物件取向音訊系統的發展,於該處於二維或三維的聲音係不以傳統揚聲器頻道或立體聲組件的位準描述,反而係以空間座標或其它資料描述其位置及大小,若此等
聲音隨著時間之推移而移動,則現在要求傳輸連續改變的動態元資料。又,靜態物件係用以允許以離散的額外音訊元件形成內容,諸如,其它語言、針對視障者的音訊描述、或運動賽事的主場隊或客場隊評論。具有此等靜態物件的內容不再配合專業設施目前設計用以因應的頻道的一致模型,諸如立體聲或5.1環繞音效。如此,描述性元資料可於製作或分配期間伴隨各項內容,使得該元資料可被編碼成音訊位元串流用於發射或傳遞給該消費者。
理想上地,專業內容格式將單純包括此種位置或描述性元資料提供於其結構或架構綱要。確實,新格式或擴延至既有格式,諸如MDA或BWF-ADM已經發展用於此項目的。但此等格式於大半情況下並非由舊式設備所瞭解,特別用在設計用於現場或即時用途的系統中分配者。
於此等系統中,舊式標準諸如AES 3、MADI、或SDI上的內嵌音訊為常見。此等標準的使用逐漸由以IP為基的標準諸如拉維那(Ravenna)、丹堤(Dante)、或AES 67所擴大或置換。全部此等標準或技術係經設計用以傳輸PCM音訊頻道及非供發送動態或描述性元資料。
考慮用於解決此項問題的一項技術係使用透明位元率音訊編碼,以「夾層」格式編碼音訊,使得可涵括也含有靜態元資料的經適當格式化的數位位元串流。此一位元串流然後經格式化,使得其可透過傳統電視臺或專業基礎架構而呈PCM編碼音訊資料被發送。電視產業的此項技術之一常見實施例為根據SMPTE標準ST 337載於PCM
AES3音訊頻道的杜比E系統。
杜比E允許設計有四個PCM音訊頻道的舊式設備被用於環繞音效需要的5.1頻道,及也包括提供傳輸該節目的「對白標準化」或整合響亮值。
杜比E系統的使用洩示數個操作缺點:一項問題為涵括取樣率轉換於許多用以將PCM音訊信號嵌置於製作或分配設施的SDI基礎架構。常見執行音訊信號的取樣率轉換或再取樣以確保該音訊資料取樣時鐘與用於該設施的視訊取樣時鐘及視訊同步信號的正確相位及頻率同步。此種再取樣通常對PCM音訊信號有無法聽聞的效應,但改變了PCM樣本值。如此,用於傳輸杜比E位元串流的一音訊頻道將具有被再取樣訛誤的位元串流。於此種情況下,再取樣可被停用,及使用其它手段以確保該設施內部的樣本時鐘的同步。
另一項問題為由採用的音訊編解碼器的區塊變換本質所導入的延遲。杜比E編解碼器要求一個視訊框(用於交錯式ATSC視訊約1/30秒)用於編碼信號及一個視訊框用於解碼信號,導致音訊相對於視訊的2-訊框延遲。如此要求延遲視訊信號以維持嘴形同步,導入分配基礎架構的額外延遲。
第三個問題為需要規劃SDI路由交換器以處理攜載杜比E位元串流的輸入為資料頻道替代音訊信號。雖然杜比E含有「保護頻帶」環繞視訊信號的垂直區間以允許路由交換器切換到另一個輸入而無杜比E資料的損耗,但在此種
切換期間,許多路由交換器進行音訊信號的交錯淡出以防止於正常PCM音訊頻道中的可聽聞的砰一聲或暫態。此等交錯淡出的持續時間為5-20毫秒,及訛誤了環繞切換點的杜比E位元串流。
此等操作限制導致大部分電視臺捨棄杜比E的使用,支持當攝入其網路時標準化全部內容的對白標準化位準的策略,使得固定對白標準化值及動態範圍輪廓可規劃入其發射音訊編碼器。
偶爾用於電視臺的替代技術係將元資料資訊插入在VANC資料中的SDI視訊信號本身,如於SMPTE標準ST 2020中標準化。經常如此組合使用AES3的使用者位元攜載元資料。但尋常SDI嵌入設備不支援自AES串流擷取此一元資料用於插入VANC位元。
偶爾使用的額外技術藉插入音訊信號的LSB內而編碼在一PCM音訊信號內部的動態控制資料。此種技術係描述於報告「光碟之可變位元率內嵌資料頻道」,作者Oomen,且已採用於MPEG環繞音訊編碼標準的實施。但此種內嵌資料無法倖存通過取樣率轉換或LSB截短。
相關技術係使用額外位元諸如載明於AES3標準的使用者位元或附屬樣本位元作為適用於動態控制資料的旁資料頻道。不幸,AES3標準的許多實施例捨棄了此項資訊。
前述技術的又一項限制為其意圖只用在技術傳輸環境。若其路由通過製作設備,諸如音控臺或數位音訊
工作站,即便在所含PCM頻道上未進行操作,即無法保證通過音控臺的資料路徑為位元準確,原因在於此種設備並非設計用於此項目的之故。
即便可確保此種位元準確,但只要意外觸碰一音量控制器及因而在PCM頻道導入些微增益變化,則將訛誤了該信號。
全部此等技術共通的問題為由製作及傳送設備所加諸的極限,該設備係只設計用於攜載PCM音訊信號而未考慮數位控制資料的嵌入。
因此,需要有改良辦法。
本發明之目的係提出用於處理包含元資料或控制資料的媒體信號之改良概念。此項目的係由申請專利範圍獨立項之主旨予以達成。
本發明係基於發現次要媒體資料,例如,攜載第一媒體信號(例如,酬載資料)的內容之進一步資訊的元資料或包含控制第一媒體資料內容的重製之控制資料,可配置於一串流之數位字組,其係穩健地對抗顯著多種信號操控。實施例顯示該串流之數位字組為類似音訊數位信號,能夠承受或穩健地對抗音訊信號的典型信號操控。信號處理可以是取樣頻率之變換、信號的放大或衰減、或直流電(DC)偏位。可執行取樣頻率之變換例如,若該串流之數位字組係排列於較高階串流諸如AES3 PCM數位音訊頻道,於該處產生該串流之數位字組的該編碼器之一取樣頻率係與
產生該較高階串流的一信號處理器,諸如AES3數位音訊介面的取樣頻率不同。因此,次要媒體資料可視為典型音訊信號處理,因此可在本系統的多個音訊頻道中之一者實施,例如於電視(TV)錄音室的特定硬體實施。一特定實施例可以是含有16個音訊頻道的SDI視訊信號,於該處一個音訊頻道用於元資料或控制資料。SDI視訊信號也含有一或多個視訊頻道。音訊頻道可以是PCM數位音訊頻道。因此,元資料或控制資料可編碼為穩健類似音訊數位信號而非標準數位位元串流,以穩健對抗典型用於PCM數位音訊頻道的信號操控。本系統藉由以後述編碼器或解碼器置換目前編碼器或解碼器可擴延而包含控制資料或元資料。此項置換可藉比較廉價的軟體更新達成。即便編碼器或解碼器係於硬體實現,其它(昂貴)硬體諸如廣播設備仍可維持不變。
實施例顯示一種編碼器用於編碼包含針對主要媒體資料的元資料或控制資料的次要媒體資料。該編碼器係經組配以編碼該次要媒體資料而獲得一串流之數位字組,該編碼包含藉一數位調變而變換該次要媒體資料或包含頻帶限制。再者,該編碼器係經組配以輸出該已編碼次要媒體資料為該串流之數位字組。因此,該串流之數位字組可形成使得能夠對抗一數位音訊串流的典型處理。又復,用於處理一數位音訊串流的手段能夠處理該串流之數位字組,原因在於該串流之數位字組可設計為類似音訊或類似類比的數位串流。
實施例係有關於編碼。該編碼包含藉該數位調變
而增加冗餘。該數位調變,例如脈衝調幅,係使得該串流之數位字組的每個數位字組傳輸該次要媒體資料之二或多個位元。再者,該編碼器可輸出該串流之數位字組使得該串流之數位字組係於一PCM音訊頻道上可傳輸。又復,該編碼器可輸出一進一步串流之數位字組。該進一步串流之數位字組表示該主要媒體資料,及該進一步串流係與該串流之數位字組分開。該主要媒體資料可以是音訊資料,及該次要媒體資料可以是針對該音訊資料的元資料或針對該音訊資料的控制資料。因此,該編碼器可經組配以輸出該串流之數位字組及該進一步串流之數位字組,使得該進一步串流之數位字組係於一第一音訊PCM頻道上可傳輸,及使得該串流之數位字組於與該第一音訊PCM頻道不同的一第二音訊PCM頻道上可傳輸。表示該主要媒體資料的該進一步串流之該等數位字組中之各者可具有大於8位元而小於32位元之一預定數目的位元,及其中該串流之數位字組的該等數位字組中之各者也可具有該預定數目之位元。該編碼器可進一步產生該串流之數位字組,使得該串流之數位字組包含一時間參考圖樣或一幅值參考圖樣。
進一步實施例顯示該次要媒體資料的對齊。因此,該編碼器輸出表示一序列之視訊影像的一視訊串流,使得相關於一某個視訊影像的該次要媒體資料之該控制資料或元資料係與某個視訊影像有關。此點為優異,原因在於該序列之視訊影像可被切斷在任何視訊影像在介於連續視訊影像的任一者間,而接續的視訊影像仍然含有與本視
訊影像相關的控制資料或元資料。又復,該編碼器可輸出該串流之數位字組為與該序列之視訊影像中之一第一視訊影像相關聯的一第一串流之數位字組,及輸出該串流之數位字組為與該序列之視訊影像中之一第二視訊影像相關聯的一第二串流之數位字組,其中該等第一及第二數位字組係彼此相同。此點為優異,若連續視訊影像包含相同的元資料或控制資料,則用以確保各個視訊影像包含有關該視訊影像的元資料或控制資料。
再者,實施例顯示該編碼器輸出該已編碼次要媒體資料為該串流之數位字組作為一控制軌道,及輸出至多15頻道的主要媒體資料作為音訊軌道,其中該控制軌道及該等音訊軌道係根據AES 3標準形成。
進一步實施例顯示該編碼器係經組配以產生該等數位字組,該等數位字組具有12至28位元,或其中該等數位字組係以30kHz至55kHz之一取樣率取樣,或其中該等數位字組具有70至160分貝的一動態範圍,或具有-20分貝均方根(RMS)全尺規的一標稱信號位準。該編碼器可使用一頻率上限針對30kHz至55kHz之一取樣率頻帶限制該次要媒體資料為15kHz至27.5kHz。
實施例進一步顯示該編碼器包含一映射器及一串流建立器。該映射器經組配用於將包含一第一位元數目之一群組的次要媒體資料映射至包含大於該第一位元數目的一第二位元數目之一資料字組。又復,該已分組次要媒體資料係以至該資料字組之一最高有效位元或一最低有效
位元的一間隙對齊。該串流建立器經組配用於使用一參考圖樣及多個資料字組而建立表示已編碼次要媒體資料的一串流之數位字組。此點為優異,原因在於該間隙使得能針對該間隙到該最高有效位元的各個位元,該已分組次要媒體資料放大約6分貝(或具有2之因數),及針對該間隙到該資料字組的該最低有效位元的各個位元約6分貝(或具有0.5之因數)的衰減。因此,無論放大或衰減係蓄意施加或意外施加皆不要緊,原因在於資料字組的結構具有已分組次要媒體資料(資訊)映射至資料字組,於該處在已分組次要媒體資料兩端施加填補位元以獲得該資料字組使得能位元移位(針對移位至該最高有效位元的各個位元放大因數2,或針對移位至該最低有效位元的各個位元衰減因數0.5)。因此該已分組次要媒體資料不被訛誤,維持有效直到放大或衰減係大於該填補位元為止。
實施例進一步顯示該編碼器包含一分組器用於將一位元串流之次要媒體資料分組而形成已分組次要媒體資料。再者,該編碼器可包含一參考信號產生器用於產生一參考圖樣指示於該主要媒體資料中之一參考幅值或一預定時瞬。該串流建立器可使用該參考圖樣或該資料字組而建立表示已編碼次要媒體資料的一串流之數位字組。參考圖樣可指示於該主要媒體資料中之一參考幅值或一預定時瞬。於一解碼器分析該參考圖樣使得該解碼器能夠計算,在該串流於編碼器編碼之後,施加至該串流之數位字組的放大或衰減或DC偏位。又復,該串流之數位字組的取樣率
可從該主要媒體資料的該預定時瞬決定。
串流建立器可進一步包含一濾波器用以低通濾波資料字組或一參考圖樣用以獲得數位字組包含多於一個具有一預定取樣率的樣本之一長度,其中該數位字組之一幅值係根據該資料字組或該參考圖樣而被加權,及其中該濾波器係經組配以在該預定取樣率的瞬間加總連續數位字組以獲得該串流之數位字組。施用該濾波器為優異,原因在於該次要媒體資料比正常音訊資料對再取樣更易受傷害。因此,該濾波器使得該次要媒體資料承受在編碼器與解碼器間或在解碼器內相對於編碼器施加的再取樣步驟,及承受在解碼器週期要求的再取樣步驟。再者,該串流之數位字組可以是類比,及於再取樣期間再度數位轉換而無顯著損耗。然而,再取樣可能與將數位信號轉換成類比信號不同。類比轉換可能涉及具有脈衝響應的濾波器其將玷污該資料,及類比至數位轉換可能給信號增加量化雜訊,以及任何類比雜訊(熱或半導體產生的雜訊、嗡嗡聲、或干擾等)。使用本發明概念產生的信號能夠承受再取樣及數位至類比轉換。
依據進一步實施例,濾波器係經組配以在一資料脈衝的一預定取樣率的瞬間獲得零點,其中該資料脈衝包含一資料字組包含已分組次要媒體資料或該參考圖樣。又復,串流建立器係經組配以使用該參考圖樣及多個資料字組而建立表示已編碼次要媒體資料的該串流,使得該資料脈衝的零點係對齊一進一步資料脈衝的一最大值而獲得表
示該已編碼次要媒體資料的一無符碼間干擾的串流。換言之,優異地使用尼奎斯特濾波器,原因在於經尼奎斯特濾波的信號可在解碼器內被解碼而無符碼間干擾。換言之,優異地使用滿足尼奎斯特針對零符碼間干擾的標準的一濾波器。依據實施例,該濾波器的截止頻率可少於該主要媒體資料的一取樣頻率的1.5倍。
依據一實施例,參考信號產生器產生包含一第一數目之位元的一已分組參考圖樣。該參考信號產生器係進一步經組配以將該已分組參考圖樣映射至包含大於該第一數目之位元的一第二數目之位元的一資料字組。另外,該映射器係經組配以將包含一第一數目之位元的一已分組參考圖樣映射至包含大於該第一數目之位元的一第二數目之位元的一資料字組。該等實施例描述選項用以施加包含元資料或控制資料的該等資料字組格式至參考圖樣。優異地,該參考圖樣獲得與次要媒體資料對媒體信號之放大或衰減的相同警告。因此,該參考信號產生器可提供呈經映射之次要媒體資料形式的參考圖樣,表示參考圖樣包含第一數目之位元且係映射入一參考圖樣,包含大於第一數目之位元的一第二數目之位元,且包含對該最高有效位元及對該最低有效位元的相同間隙,如於解碼器及編碼器中已經描述。另外,該參考信號產生器輸出包含第一數目之位元的一參考圖樣。根據次要媒體資料,映射器將具有第一數目之位元的該參考圖樣映射入具有第二數目之位元的一資料字組。
實施例進一步顯示一種用於解碼一媒體信號的解碼器,該媒體信號包含一已接收的串流之數位字組表示已編碼次要媒體資料其包含針對主要媒體資料的元資料或控制資料。該解碼器係經組配以使用就由所接收的資料字組表示的幅值操控該所接收的串流之數位字組或使用再取樣而回復該次要媒體資料。該解碼器係經組配以自該已回復的次要媒體資料推衍一位元串流。
實施例進一步顯示該解碼器包含一參考信號產生器、一信號操控器、及一信號處理器。參考圖樣分析器分析該已編碼次要媒體資料的一參考圖樣,其中該參考圖樣分析器係經組配以決定該參考圖樣的一幅值或決定在該主要媒體資料中之一預定時瞬。信號操控器根據該已分析之參考圖樣及一經計算的參考圖樣操控該已編碼次要媒體資料而獲得次要媒體資料。信號處理器根據已編碼次要媒體資料處理該主要媒體資料而獲得一已解碼媒體信號。此點為優異,原因在於編碼期間施用至媒體信號的信號處理使得信號操控器能準確地自已解碼媒體信號再度獲得媒體信號,而與典型信號操控例如放大等獨立無關。
依據實施例,信號操控器包含一取樣率轉換器經組配以,根據於該參考圖樣中指示的該主要媒體資料之一預定時瞬,將與該等數位字組相關聯的一取樣率轉換成一預定取樣率以獲得經再取樣的數位字組。此點為優異,原因在於用於音訊取樣率的標準在媒體資料之處理期間可經混合。甚至小取樣率轉換例如48kHz至48.1kHz訛誤了次要
媒體資料,原因在於與包含元資料或控制資料的音訊資料相反,次要媒體資料中無冗餘或相依性。換言之,次要媒體資料的連續符碼可在一個樣本內自最高可能值變化到最低可能值。如此,導致因次要媒體資料內部的強力改變所致之極高頻率。
然而,與次要媒體資料相反地,音訊樣本典型地頻帶受限,表示音訊資料的變化受限於取樣頻率決定的最大頻率。
進一步實施例描述參考圖樣分析器包含一時瞬決定器經組配以就一取樣率之樣本,決定於該參考圖樣中的該主要媒體資料之該預定時瞬;一升取樣器經組配以升取樣環繞該預定時瞬的一範圍而決定一預定時瞬的一確切位置;一取樣累加器經組配以決定在該串流之數位字組內部的該等數位字組之一確切位置而獲得與該等數位字組相關聯的一實際取樣率其係與一預定取樣率不同。
實施例進一步顯示參考圖樣分析器包含一增益因數計算器,以根據該參考圖樣之該幅值及該經計算的參考圖樣之該幅值計算一放大或衰減因數,及其中該信號操控器包含一乘法器經組配以根據該放大或衰減因數放大或衰減該等資料字組而獲得經增益補償的資料字組。此點為優異,原因在於編碼媒體信號的放大或衰減乃編碼器移轉至解碼器期間可能造成的主要問題之一。若因一頻道具有前述特性故使得其它音訊頻道須被蓄意或意外地放大或衰減時,則此點可蓄意施加,例如於等效器。
依據進一步實施例,顯示包含一串流之數位字組的一媒體信號。該串流之數位字組表示包含針對主要媒體資料的元資料或控制資料之次要媒體資料。
進一步實施例顯示該參考圖樣分析器包含一幅值檢測器經組配以決定一參考圖樣的一幅值及該參考圖樣的一進一步幅值。該參考圖樣分析器可進一步包含一偏移值補償單元經組配以根據該參考圖樣的該幅值及該參考圖樣的該進一步之一漂移幅值而計算該已編碼次要媒體資料的一偏移值,及其中該信號操控器包含一加法器經組配以自該已編碼次要媒體資料加上該已編碼次要媒體資料的該偏移值而獲得經偏移值補償的已編碼次要媒體資料。本實施例之優點係類似增益因數計算器的先前實施例,於該處一偏移值可施加至已編碼次要媒體資料替代增益,例如於編碼器與解碼器間之等效處理期間,或從由傳輸頻道造成的漂移意外地施加。
實施例進一步顯示信號操控器包含一解映射器經組配以自包含大於一第一位元數目的一第二位元數目的資料字組解映射包含該第一位元數目之次要媒體資料。此外或另外,信號操控器包含一解除分組器經組配以將包含一第一位元數目之一群組的次要媒體資料解除分組而獲得已解碼次要媒體資料之該位元串流。數位字組可進一步包含含有經濾波的次要媒體資料的數位字組其包含一參考圖樣及多個資料字組,其中該次要媒體資料係映射到具有至該資料字組的最高有效位元或該資料字組的最低有效位元
之一間隙的資料字組。再者,該參考圖樣包含該已編碼次要媒體資料之一參考幅值及於主要媒體資料中之一預定時瞬及其中該等多個資料字組包含次要媒體資料。
實施例顯示該媒體信號包含該主要媒體資料之一進一步串流,其中該主要媒體資料包含音訊資料或視訊資料,其中包含該主要媒體資料之該進一步串流在該主要媒體資料中之預定時瞬係對齊該串流之已編碼次要媒體資料。此點為優異,原因在於在該主要媒體資料中之該時瞬允許次要媒體資料準確對齊主要媒體資料。換言之,音訊信號及元資料或控制資料可對齊在一垂直空白的一視訊信號的訊框或該視訊信號之一進一步同步信號。又復,時瞬可以是音訊信號中的同步信號,次要媒體資料係對齊該時瞬。因此,次要媒體資料也可施加至只有音訊串流。概念是提供在視訊信號的各個訊框內部的次要媒體資料之任何資訊。因次要媒體資料係對齊主要媒體資料中視訊串流切斷的該時瞬,次要媒體資料維持不變且完整。因此,各個視訊框仍可含有自次要媒體資料的任何資訊,即便包含該視訊框的該視訊信號被切割亦復如此。
實施例可依據下列考量發展。因此,本發明之實施例的一優點係提出一種手段用於攜載靜態及動態控制資料或元資料伴隨脈衝代碼調變(PCM)數位音訊信號通過只提供PCM音訊頻道的傳統製作及分配設備。
此點可藉考慮PCM數位音訊頻道的基礎本質為音訊信號的傳輸手段達成。此等音訊信號通常以16至24位
元之位元深度及48kHz之一取樣率取樣且具有結果所得90至140分貝的一動態範圍,帶有-20分貝均方根(RMS)全尺規的一標稱信號位準。
如此,若考慮典型AES3傳輸頻道為具有此等特性的數位化通訊頻道,則常見採用於數位通訊的調變技術可用以透過該頻道發送調變資料。此等技術當然對增益變化、中等時基失真,及許多情況下,頻道的頻率響應失真免疫。
AES3 PCM數位音訊頻道與用於數位通訊的頻道不同。其嚴格為數位頻道,沒有無線電通訊頻道典型的多路徑及快速頻道衰減問題。給定90分貝至140分貝動態範圍,實際上並不限於潛在傳輸功率提供足夠的載波對雜訊比。當用在視訊系統時,諸如嵌入串列數位介面(SDI)視訊信號中時,由於需要避免可能發生切換的該視訊垂直同步區間故,其有特性區塊本質。又,不似許多通訊系統,需要有低潛伏延遲,以避免嘴形同步問題,或避免當進行現場廣播時監視音訊的困難。
針對物件需要的控制資料或元資料之資料通量要求因物件的數目而異,無論為靜態或動態,及因採用的特定物件音訊標準而異。一個此種標準為MPEG-H音訊規格,ISO/IEC 23008-3。於本標準中,典型使用例涉及元資料或控制資料使用MHAS(MPEG-H音訊串流(定義於ISO/IEC 23008-3第14章「MPEG-H 3D音訊串流」))規格於10-30kb/s位元率編碼於串流封包。
舉例言之,於MPEG-H音訊場景中的各個動態物件要求1.5kb/s用於傳輸。如此,有16個動態物件的節目(實際最大值,給定SDI介面只支援16個嵌入式音訊頻道)要求約25kb/s資料。若係各個音訊框發送,則有關音訊場景的靜態元資料可能耗用另外40-50kb/s。
藉由考慮下列因素可估計需要的潛在位元錯誤率(BER):若允許每年一次操作的單一位元錯誤,給定75kb/s的位元率,則一年將發送2.36E12位元,要求4.2E-13位元錯誤率(BER)。但控制資料中的資訊高度冗餘。大半情況下,位元錯誤將由潛在MHAS協定檢測,控制資料將從周圍封包內插。此外或另外,可使用循環冗餘檢查(CRC)值,例如使用16位元,或其它合宜代碼或機制用以檢查位元錯誤。於此種情況下,每個小時一次位元錯誤可以是合理的上限。後述情況將要求3.7E-9的BER。如此,此種傳輸方案的合理BER可能需要1E-9至1E-12間之BER,此點以AES3數位音訊頻道中可用的高信號對雜訊比容易可能達成。
須注意用於通訊頻道的典型BER表示法不適用此處,原因在於此一頻道中的雜訊嚴格為量化與再取樣的雜訊,具有矩形或可能地(以施加遞色(dither)為例)三角形機率密度函式。
由取樣率轉換(或更精確言之,由異步操作來源)所導入的時基誤差受到在各件設備中採用作為異步來源的時鐘源之準確度所限。大部分的專業電視臺使用自準確晶體、GPS、或銣標準產生的時鐘源或同步信號源操作,典
型具有0.1ppm至1ppm的最大頻率公差。典型消費者設備可具有30ppm的頻率公差。針對在極端溫度操作的消費者設備允許有些邊際,針對於連結至專業電視臺的現場操作的消費者設備情況,可安全地假設100ppm的公差。
如此,應用本發明於傳輸針對常用MPEG-H音訊標準需要的控制資料或元資料之目的,可能的設計假設及目標之集合為:
本發明之一較佳實施例的進一步目標係讓音訊編碼工程師容易實施及除錯,該等工程師極其熟諳概念音訊編碼使用的基塊,但可能對資料通訊常用的實施技術沒有經驗。
給定24kHz頻道頻寬,及16千鮑設計符碼率,單
純傳統調變技術諸如ASK或PSK將不足。將使用提供至少5b/s/Hz的編碼效率。
熟諳技藝人士將瞭解多種常用數位通訊的調變技術將滿足此等設計假設及目標。舉例言之,可使用64 QAM(有64符碼字母表的正交調幅),其提供6b/s/Hz的編碼效率。然而,實施QAM解調器通常使用中等複雜信號處理以回復載波頻率及符碼時鐘,包括使用音訊編碼工程師不熟的數位鎖相迴路(PLL)。此等PLL要求回路濾波器或累加器的調諧以避免回路不穩,及在過渡或切換之後要求某個時間以穩定獲得信號。
此處呈示的較佳實施例使用32 PAM(有32位準的脈衝調幅)作為替代方案,其不要求PLL,及產生一設計其使用音訊編碼常用的信號處理函式。針對編碼效率的各個增量,PAM要求信號對雜訊比增加6分貝,比較QAM需要3分貝,但於此種系統中信號對雜訊比特有地為高,而PAM接收器的設計及除錯成本較低。
先前描述的全部實施例可合計或組合例如於電視臺視之,於該處該編碼器例如於第一取樣頻率,以對應音訊信號及元資料或控制資料(次要媒體資料)編碼視訊信號,及其中在媒體信號傳輸給消費者之前,解碼器可應用至控制例(例如,監視單元)或發射例。
1、2‧‧‧音訊周邊裝置或工作站
3‧‧‧32 PAM調諧器、發射器
4、8‧‧‧AES3數位音訊介面
5‧‧‧HD-SDI嵌入器
6‧‧‧以SDI為基的電視台或基礎架構
7‧‧‧HD-SDI解嵌入器
9‧‧‧32 PAM解調器、接收器
10‧‧‧緩衝器
11‧‧‧概念暫存器
12、100‧‧‧編碼器
13‧‧‧概念交換器
14、21、22‧‧‧暫存器
15‧‧‧濾波器
15’‧‧‧濾波函式或資料脈衝
17‧‧‧參考信號產生器
20‧‧‧幅值檢測器
24、26‧‧‧減法器
27‧‧‧乘法器
28‧‧‧取樣率轉換器、取樣/內插濾波器
29‧‧‧解映射器
30‧‧‧功能區塊
31‧‧‧輸出緩衝器、解除分組器
32‧‧‧時瞬決定器
33‧‧‧升頻器
34‧‧‧取樣累加器
40‧‧‧時瞬
41、42‧‧‧脈衝、脈衝週期、幅值
43‧‧‧資料酬載容器
50‧‧‧解碼器
55‧‧‧已編碼次要媒體資料、AES3 PCM音訊資料
60‧‧‧參考圖樣分析器
65‧‧‧信號操控器
70‧‧‧信號處理器
75‧‧‧已分析的參考圖樣
80‧‧‧次要媒體資料
85‧‧‧已解碼媒體信號
85’‧‧‧音訊控制資料或元資料位元串流
90、90a-b‧‧‧主要媒體資料
92‧‧‧實際取樣率
94‧‧‧增益因數計算器
95‧‧‧已編碼次要媒體資料
96‧‧‧偏移值補償單元
96a‧‧‧偏移值
97‧‧‧經偏移值補償的已編碼次要媒體資料
99‧‧‧PCM取樣時鐘
105‧‧‧分組器
115‧‧‧映射器
120‧‧‧串流建立器
125‧‧‧位元串流
125’‧‧‧已解碼的次要媒體資料位元串流
130‧‧‧次要媒體資料、資料酬載
130a‧‧‧簽章擴延
130b‧‧‧零
135‧‧‧參考圖樣
135a‧‧‧第二同步符碼、第二參考圖樣
140‧‧‧資料字組
142‧‧‧數位字組
145‧‧‧串流、PCM信號
155‧‧‧媒體信號
160‧‧‧垂直同步信號
165‧‧‧零交叉、預定時瞬
180a-c‧‧‧中間樣本
200‧‧‧MPEG-H音訊監視及編寫單元
205‧‧‧具有內嵌音訊的視訊
205’‧‧‧解碼信號
205”‧‧‧控制軌道
210‧‧‧以網路為基的控制介面
215‧‧‧遠程控制
220‧‧‧監視器控制
225‧‧‧整合式響度儀器
235‧‧‧連結
240‧‧‧網際網路協定連結
245‧‧‧視訊/MPEG-H音訊貢獻或分配編碼器
250‧‧‧視訊編碼器
255‧‧‧MPEG-H編碼器
260‧‧‧傳送多工器
265‧‧‧多工化信號
270‧‧‧視訊/MPEG-H音訊貢獻或分配解碼器
275‧‧‧傳送解多工器
280‧‧‧視訊解碼器
285‧‧‧MPEG-H解碼器
1100、1200‧‧‧方法
1105、1110、1205、1210‧‧‧步驟
接著將參考附圖討論本發明之實施例,附圖中:圖1顯示依據實施例於電視臺或網路中一編碼器及一
解碼器的系統的示意方塊圖;圖2顯示依據一實施例用於編碼次要媒體資料的一編碼器的示意方塊圖;圖3顯示依據又一實施例用於編碼次要媒體資料的一編碼器的示意方塊圖;圖4顯示依據一實施例本發明之發射器部分的示意概念方塊圖,該部分接收一元資料或控制資料位元串流且將其編碼為32 PAM信號經格式化用於以16位元48kHz PCM音訊頻道傳輸;圖6顯示依據一實施例一解碼器的示意方塊圖;圖7顯示依據一實施例一接收器部分的示意方塊圖,該部分自16位元48kHz PCM音訊頻道接收PCM資料及解碼內嵌32 PAM信號成元資料或控制資料位元串流;圖8a顯示依據一實施例一媒體信號的示意表示型態;圖8b顯示依據又一實施例一媒體信號的示意表示型態;圖8c顯示依據一實施例的示意圖,顯示5-位元32 PAM信號符碼映射入16-位元PCM音訊頻道樣本字組的映射關係;圖9a、b顯示依據一實施例的示意波形圖,顯示視訊設施的垂直同步信號與PCM音訊頻道中的已編碼元資料或控制資料間之時間關係;圖10a以時間連續表示型態顯示具有衰減截止因數為0.98的升餘弦整形濾波器;
圖10b以時間離散表示型態顯示具有衰減截止因數為0.98的升餘弦整形濾波器;圖11a以時間連續表示型態顯示具有衰減截止因數為0.7的升餘弦整形濾波器;圖11b以時間離散表示型態顯示具有衰減截止因數為0.7的升餘弦整形濾波器;圖11c顯示圖11b的影像三次於一列,對齊相鄰濾波函式間兩個樣本的偏移值;圖12a顯示依據一實施例於時間連續表示型態依據一實施例的一串流之示意表示型態;圖12b以放大版本顯示圖12a中已呈示的串流之一部分;圖12c顯示依據一實施例於時間離散表示型態依據一實施例的一串流之示意表示型態;圖12d以放大版本顯示圖12a中已呈示的串流之一部分;圖13顯示使用一參考圖樣及多個資料字組解碼包含表示次要媒體資料的一串流的一媒體信號之方法的示意流程圖;圖14顯示使用一編碼器用於編碼一媒體信號之方法的示意流程圖;圖15a顯示於固定模式中之一系統的示意表示型態;及圖15b顯示於控制軌道模式中之一系統的示意表示型態。
後文中,將以進一步細節描述本發明之實施例。個別圖式中顯示具有相同或相似功能的元件將連結相同的元件符號。
實施例提供音訊信號元資料或控制資料伴隨一數位音訊信號的方便而可靠的傳送。元資料或控制資料係經數位調變或編碼成一信號,承受於專業音訊或視訊製作或分配設施及網路內透過一正常數位音訊頻道的分配的典型傳輸降級,或該頻道嵌入一數位視訊信號內。元資料可包含螢幕上顯示器的描述、一視訊框內部的物件位置、針對不同音訊頻道的語言資訊,諸如德文、英文、法文等語文。控制資料可包含有關音訊頻道之編碼資訊以便施加正確解碼參數,控制資料可包含參數用以詮釋較高階立體混聲或任何其它資料用以解碼該音訊信號。然而,元資料及控制資料可用於許多其它用途。於數位媒體中,要素為資產的潛在內容,及元資料為有關該資產的描述性資料。因此,前述實施例並不限制本發明之範圍。
圖1顯示包含編碼器及解碼器的資料處理系統400之一示意方塊圖。特別,圖1顯示包含編碼器的32 PAM調諧器3及包含解碼器的32 PAM解調器9。又復,顯示依據一實施例包含次要媒體資料125及主要媒體資料90a(例如,音訊要素信號)、以及額外的主要媒體資料90b(例如,視訊信號)的一媒體信號155。系統可以是TV播放室的一部
分,於該處包含音訊控制資料及元資料位元串流的次要媒體資料係被涵括於該等音訊要素信號,因此針對各個視訊框對齊視訊信號。因此,於TV播放室中,編碼視訊信號可使用監視單元檢查,及因而使用解碼器以解碼編碼媒體信號。又復,在頻道編碼及進一步處理操作以準備終媒體信號傳輸給消費者之前,媒體信號可使用次要媒體資料解碼。終媒體信號不再具有任何次要媒體資料。
更加籠統言之,依據一實施例,資料處理系統包含信號操控器用於操控數位字組串流以獲得經操控的數位字組串流,其中該解碼器係經組配以自該經操控的數位字組串流中回復該數位字組串流。信號操控器可藉幅值放大或幅值衰減或偏移值導入或偏移值變異或頻率選擇性衰減或放大或再取樣操控。又復,解碼器可復原藉幅值放大或幅值衰減或偏移值導入或偏移值變異或頻率選擇性衰減或放大或再取樣操控的數位字組串流。再者,信號操控器可接收PCM音訊頻道且可輸出PCM音訊頻道,其中該編碼器係經組配以輸出在該PCM音訊頻道上可傳輸的信號,及其中該解碼器係經組配以接收自該PCM音訊頻道的傳輸串流。
換言之,圖1顯示在專業音訊或視訊製作或分配設施或網路環境中本發明之一較佳實施例的操作。音訊周邊裝置或工作站1乃一或多個數位音訊信號的來源,稱作為要素信號(或主要媒體資料)以資與相關控制資料或元資料信號(次要媒體資料)區別,後者也係源自於周邊裝置或工作
站。
控制資料或元資料位元串流輸入發射器3,其將該等資料或串流轉換成一形式,諸如32 PAM經調變PCM樣本,其將通過AES3或HD-SDI頻道的正常頻道損害倖存。然後,樣本以及一或多個選擇性音訊要素信號供給AES3數位音訊介面4。此種介面的輸出係藉嵌入器5而嵌入HD-SDI視訊信號,其可施加取樣率轉換以對齊AES3時鐘的相位及頻率與HD-SDI視訊信號的時鐘信號及同步信號。然後,此一視訊信號通過以SDI為基的電視台或基礎架構6用以傳遞給第二音訊周邊裝置或工作站2。數位音訊信號係藉解嵌入器7擷取自HD-SDI信號,及呈AES3位元串流發送給AES3數位音訊介面8。含有控制資料或元資料資訊的對應該AES頻道之PCM資料(已編碼的次要媒體資料)發送給接收器9。接收器9包含解碼器50,其將32 PAM或類似的調變信號解碼成音訊控制資料或元資料位元串流85’,其可以是已解碼媒體信號85的一部分。又復,圖6中顯示的信號處理器70根據已編碼的次要媒體資料而處理主要媒體資料(音訊要素信號)以獲得已編碼的媒體資料。
圖2顯示用於編碼包含針對主要媒體資料的元資料及控制資料的次要媒體資料之編碼器100的示意方塊圖。編碼器係經組配以使用增加冗餘或頻帶限制而編碼次要媒體資料80。編碼器係進一步經組配以輸出已編碼的次要媒體資料作為數位字組串流145。於一較佳實施例中,藉填補零或符號擴延,可增加冗餘至次要媒體資料。其它實
施例可使用檢查和或冗餘代碼。又一實施例顯示頻帶受限的次要媒體資料或頻帶受限的次要媒體資料群組,選擇性地有或無增加冗餘。頻帶限制可藉施加(低通)濾波器至一信號推衍,或更明確言之,施加至編碼器的輸出信號,其可以是已分組的或已映射的次要媒體資料。依據進一步實施例,編碼器係經組配以產生數位字組,數位字組具有12至28位元,或其中數位字組係以30kHz至55kHz的取樣率取樣,或其中數位字組具有70至160分貝的動態範圍,或具有-20分貝均方根(RMS)全尺規的標稱信號位準。編碼器也可經組配以使用頻率上限用以針對30kHz至55kHz的取樣率,頻帶限制次要媒體資料於15kHz至27.5kHz間。
圖3顯示用於編碼一媒體信號的編碼器100之示意方塊圖。編碼器100包含映射器115及串流建立器120。映射器115係經組配以將包含第一位元數目的一組已分組次要媒體資料130映射入包含大於第一位元數目的第二位元數目之資料字組140。已分組次要媒體資料係以一間隙對齊該資料字組的最高有效位元或最低有效位元。串流建立器係經組配以建立表示已分組次要媒體資料的一串流之數位字組。依據進一步實施例,編碼器包含一分組器105經組配用於分組次要媒體資料80,其可以是一位元串流的次要媒體資料,以形成已分組次要媒體資料130。再者,編碼器可包含一參考信號產生器17,經組配以產生一參考圖樣,指示主要媒體資料中的參考幅值或預定時瞬,其中串流建立器120係經組配以使用參考圖樣60或資料字組140而建立表
示已編碼次要媒體資料55的數位字組串流145。因此,兩個信號亦即參考圖樣135及資料字組140可輸入到一串流建立器120經組配以建立表示已編碼次要媒體資料的數位字組串流145。
圖4顯示依據一實施例編碼器100的示意方塊圖。實施例顯示編碼器100包含一濾波器15用以低通濾波該資料字組或參考圖樣而獲得包含大於具有預定取樣率的一個樣本之長度的一資料脈衝,其中該資料脈衝的幅值係根據該資料字組或參考圖樣加權,及其中該濾波器係經組配以在該取樣率的瞬間加總連續資料脈衝。又復,濾波器可經組配以在該資料脈衝的一預定取樣率的樣本獲得零點。資料脈衝包含一資料字組包含分組次要媒體資料或參考圖樣。串流建立器係經組配以使用參考圖樣及多個資料字組而建立表示編碼次要媒體資料的串流,使得資料脈衝的零點對齊又一資料脈衝的最大值,而獲得表示該已編碼的次要媒體資料的不含符碼間干擾(ISI)的串流。換言之,優異地使用尼奎斯特(Nyquist)濾波器以使得解碼器能再取樣資料字組或數位字組串流而無符碼間干擾或頻疊問題。圖11c顯示一實施例例示已濾波資料字組,及從該等資料字組中之三者建立一串流例。依據實施例,濾波器包含具有小於主要媒體資料的取樣頻率的1.5倍的頻率截止。
須注意映射器115未描繪於圖4。然而,映射器可在暫存器14與濾波器15間實現,或成為方塊或函式中之一者的一部分。
換言之,圖4顯示本發明之一較佳實施例的發射器部分的概念操作。音訊控制資料及元資料位元串流輸入緩衝器10用於暫時儲存,以便允許在垂直同步160或其它處理操作期間被發射資料的中斷。位元串流125並聯成為5位元的字組,及由概念暫存器11移轉出緩衝器。然後暫存器的輸出藉編碼器12編碼成葛雷(Gray)代碼值。除非當垂直同步信號160被啟用時,編碼器12的輸出才輸入暫存器14。暫存器14的輸出被用作為2組成式二進位,其被符號擴延且映射入16-位元資料字組,如圖8c顯示,及饋入脈衝整形濾波器15。濾波器理想上為尼奎斯特型濾波器,其於符碼週期的脈衝響應具有sin(x)/x空位以防止符碼間干擾。此等濾波器於數位通訊理論中為眾所周知。舉例言之,合宜濾波器將為升餘弦脈衝整形濾波器,過量頻寬參數設定為0.75。然後濾波器15的輸出饋至其它傳輸手段用於涵括為PCM音訊頻道內的音訊樣本,及內嵌於SDI視訊信號。該項處理可由例如48kHz的一(PCM)取樣時鐘99驅動。
於視訊信號的垂直同步間隔期間,一概念交換器13選擇參考信號產生器17的輸出用於傳輸替代葛雷編碼器12的輸出。於此間隔期間沒有任何資料讀取自緩衝器10。參考信號產生器17輸出零的符碼值,如此,於垂直空白間隔期間,輸出零的穩態PCM值。於垂直空白間隔結束時,在交換器13回到葛雷編碼器12的輸出開始自緩衝器10讀取資料之前,參考信號產生器輸出8個具有代碼0x0F的符碼及然後8個具有代碼0x11的符碼。藉此方式(例如,使用濾波
器15中的定標),產生圖4中顯示的16-位元有符號二成分式PCM信號,於垂直空白期間具有零值,然後為值0x0780的8-符碼寬正脈衝41,及然後為值0xf880的8-符碼寬負脈衝42。如此脈衝41及42形成正及負幅值參考及在符碼邊緣的強力過渡,其可用於接收器以回復所傳輸的32 PAM信號的原先幅值及相位。
圖5顯示用於解碼一媒體信號155的解碼器50之示意方塊圖,該媒體信號155包含所接收的數位字組之串流145,表示包含針對主要媒體資料的元資料及控制資料的已編碼次要媒體資料55。解碼器50係經組配以使用相對於由所接收的數位字組所表示的幅值而操控所接收的數位字組串流,或使用再取樣而回復次要媒體資料,及其中該解碼器係進一步經組配以自所回復的次要媒體資料推衍一位元串流125’。在數位字組傳輸之前,解碼器可能知曉原先幅值或一預定時瞬用以操控所接收的數位字組而回復次要媒體資料。
圖6顯示使用一參考圖樣及多個資料字組用於解碼一媒體信號的一解碼器50之示意方塊圖,該媒體信號包含表示已編碼次要媒體資料的一串流。解碼器50包含一參考圖樣分析器60、一信號操控器65、及一信號處理器70。參考圖樣分析器60係經組配以分析已編碼次要媒體資料的參考圖樣,其中該參考圖樣分析器60係經組配以決定該參考圖樣的幅值,或決定主要媒體資料中的一預定時瞬。信號操控器65接收已編碼次要媒體資料55及參考圖樣分析器
60的已分析之參考圖樣75。信號操控器65係經組配以根據已分析之參考圖樣75及經計算的參考圖樣而操控已編碼次要媒體資料55以獲得次要媒體資料80。媒體資料,例如資料字組,可分開傳輸給信號操控器,或媒體資料可經由參考圖樣分析器而直接傳輸給信號操控器。信號處理器70接收次要媒體資料80,且係經組配以根據已編碼次要媒體資料55處理主要媒體資料90而獲得已解碼媒體信號85。
於進一步詳細說明部分中將載明媒體信號,尤其就圖8-12而言。依據實施例,已編碼次要媒體資料為脈衝代碼調變(PCM)包含脈衝調幅(PAM)符碼於資料字組。為了獲得PCM已調變已編碼次要媒體資料,該等資料字組可以是PCM已調變。
圖7顯示依據一實施例解碼器50之一示意方塊圖。此處,顯示參考圖樣分析器60及信號操控器65的實施例。
實施例顯示參考圖樣分析器60包括一增益因數計算器94,經組配以根據參考圖樣的幅值及經計算得的參考圖樣的幅值而計算一放大或衰減因數。又復,信號操控器65包含一乘法器27,經組配以根據放大或衰減因數而放大或衰減已編碼次要媒體資料,用以獲得增益經補償之已編碼次要媒體資料95。因此,參考圖樣分析器60可進一步包含一幅值檢測器20經組配以決定參考圖樣的幅值。然而,該參考圖樣的幅值可與一已知參考圖樣的幅值作比較以獲得一增益因數。此種方法較佳地係以無DC工作,或者
換言之,以增益補償信號工作。因此,圖7中顯示的實施例提出進一步增益計算方法,藉由使用減法器24扣除參考圖樣中之一正幅值及參考圖樣中之一負幅值,及求出幅值間之已知差值與幅值間求出的差值的一分數以獲得放大或衰減因數。
實施例進一步顯示參考圖樣分析器60包含一幅值檢測器20,經組配以決定該參考圖樣的該幅值及該參考圖樣的又一幅值,其中該參考圖樣分析器進一步包含一偏移值補償單元96,經組配以根據該參考圖樣的該幅值及該參考圖樣的又一幅值的漂移而計算該已編碼次要媒體資料55的一偏移值96a。因此,信號操控器65包含一加法器,經組配以將該已編碼次要媒體資料的該偏移值加到該已編碼次要媒體資料以獲得經偏移值補償的已編碼次要媒體資料97。該漂移可藉將該參考圖樣的該(正)幅值及該參考圖樣的(負)又一幅值相加求出。該偏移值,或依據實施例該偏移值之半可藉減法器26自已編碼次要媒體資料55扣除而獲得經偏移值補償的已編碼次要媒體資料97。
換言之,圖7顯示本發明之較佳實施例的接收器部分之概念操作。自一SDI視訊信號(主要媒體資料)解除嵌入的AES3 PCM音訊資料(次要媒體資料)55係輸入一參考幅值檢測器20,其給參考圖樣135(參考圖7)的一脈衝週期41期間及一脈衝週期42期間的PCM音訊信號的中央四個樣本求取平均值。此點可使用定時電路基於垂直同步信號160完成,或於替代實施例中,基於垂直同步信號160與檢驗輸入
PCM值的組合完成用以檢測參考圖樣135中脈衝41的前緣。如此,脈衝41的平均幅值儲存於暫存器21,及同理,脈衝42的平均幅值儲存於暫存器22。暫存器21與22的輸出經加總而決定原先信號的零位準,及輸入減法器26,其從該信號去除任何DC偏移值96a。暫存器21與22的輸出藉減法器24扣除而決定兩個脈衝41及42的峰至峰幅值。此一幅值饋至功能區塊25,其計算欲施用至乘法器27的一適當增益因數94a以標準化減法器26的輸出,使得原先PCM信號值幾乎在乘法器27的輸出重製。如此處描述的此等功能將為熟諳類比電視系統設計人士所熟知,作為三位準同步檢測器及同步梢端控制自動增益控制(AGC)功能的數位實施例。
雖然功能20、21、22、23、24、25、26、27之操作理想上將回復在編碼器(參考圖4)中在發射器濾波器15的輸出產生的PCM信號(串流)145的確切值,但在算術運算中的捨入誤差、及脈衝41及42的振鈴效應或其它降級可能使得乘法器27的輸出只近似在濾波器15產生的信號。此項誤差係藉求取參考圖樣中脈衝41及42的四個中央樣本的平均值,及藉使用有足夠大小的PCM值而予減低,使得近似誤差不會可察覺地影響符碼的決定,容後詳述。
此外,如圖8c顯示,符碼指派給PCM值允許被傳輸的PCM信號的放大達至多4位元或約24分貝,及也允許4位元或約24分貝的類似衰減,同時仍然維持3 LSB作為該信號的捨入誤差或降級的邊際。
依據進一步實施例,信號操控器65包含一取樣率
轉換器28,經組配以根據在參考圖樣135中指示的主要媒體資料的預定時瞬,將與數位字組140相關聯的一取樣率轉換成預定取樣率以獲得經再取樣的數位字組。
換言之,所接收的參考圖樣可包含一特定序列,例如兩個脈衝間的零交叉,其中在傳輸前的原先序列為解碼器所已知。解碼器可基於零交叉之位置的準確分析,而計算在數位字組串流傳輸之前與接收之後該數位字組串流的取樣率間之差異。該差值可用於使用該數位字組的原先取樣率而解碼該數位字組串流。
實施例進一步顯示參考圖樣分析器包含一時瞬決定器32,經組配以就一取樣率之樣本而言,決定該參中的主要媒體資料的預定時瞬;一升取樣器33經組配以升取樣環繞該預定時瞬的一範圍而決定該時瞬的確切位置;及一取樣累加器34經組配以判定多個數位字組在數位字組串流內部的確切位置而獲得與該等數位字組相關聯的實際取樣率92係與預定取樣率不同。
須注意依據實施例,主要媒體資料的預定時瞬係指示為參考圖樣之一正幅值與參考圖樣之一負幅值間之零交叉,指示主要媒體資料中的同步信號係在該參考圖樣之正幅值之前發送。因此,參考圖樣分析器係經組配以找出時瞬決定器32中的零交叉。升取樣器33係經組配以N次升取樣零交叉前的樣本與零交叉後的樣本間之區域。因此,獲得兩個樣本值,及針對目前參考圖樣及一隨後參考圖樣,獲得兩個樣本間之該等N-值最接近零中之一者的值。取樣
累加器34計算該參考圖樣與接續參考圖樣間之取樣率,或換言之,計算對應於已編碼次要媒體資料中的該等樣本的時間點,於該處可獲得目前符碼值而無例如,因編碼器中之已編碼次要媒體資料55的尼奎斯特濾波所致的符碼間之干擾。因此,取樣率轉換器28係經組配以根據計算得的預定時瞬或取樣累加器34的實際取樣率92而取樣該已編碼次要媒體資料。
換言之,圖7進一步顯示依據一實施例一接收器部分的示意概念方塊圖,依據一實施例,該接收器部分自16-位元48kHz PCM音訊頻道接收PCM資料,且將內嵌式32 PAM信號145解碼成元資料或控制資料位元串流。為了從在乘法器27之輸出的標準化PCM資料回復PAM符碼,資料現在將在對應於符碼週期中心的瞬間取樣以避免符碼間干擾。此點完成如後:乘法器27之輸出係輸入一功能區塊32,其係以檢測器20及暫存器21及22的功能之類似方式操作,及將出現在參考圖樣的脈衝41及42間之零交叉的由乘法器27輸出的標準化PCM信號之PCM值輸出給區塊33。
功能區塊33取此二PCM值及計算常見代數公式用以計算線性函式之y截距如後:
xn為零交叉左側樣本之值及xn+1為零交叉右側樣本之值。如此,可判定一樣本週期的N個細分中將出現由PCM樣本表示的波形之零交叉。以此種較佳實施例為例,N設定為等於
16,但N的選擇乃提高符碼取樣準確度與針對濾波器28儲存額外濾波係數的需要間的工程折衷,容後詳述。依據進一步實施例,N設定為等於128或256。任何其它值也適宜。
累加器34與取樣/內插濾波器28的組合係用以在接近符碼週期中央的時瞬自乘法器27再取樣輸入信號。累加器34類似數位差示分析器(DDA)用作為分量累加器,諸如描述於「互動式電腦圖形原理」,Newman及Sproull,第二版,麥克羅希爾,1979年,2-9頁,且係類似用於數位鎖相迴路設計及直接數位頻率合成器的相位累加器。
於此種情況下,累加器34係以由功能區塊33求出的零交叉細分數目開始,及然後遞增半個符碼週期,於此種情況下,針對16千鮑符碼率為48kHz時鐘的1.5樣本,用以移動累加器位置從符碼邊緣到符碼中心。然後,針對各個樣本時鐘,累加器34遞增1.0,其分數位元(log2 N)選擇內插濾波器28的一個相位,例如,多相位FIR內插濾波器排組。34及28之系統形成了取樣率轉換器,類似「彈性取樣率轉換方法」,Julius O.Smith及P.Gossett,IEEE國際會議於ICASSP 1984,112-115頁,1984年3月中的描述。多相位濾波器的一種辦法之設計係描述於前文報告。
然後,在各個時鐘週期於該處有個自累加器34的分數部分的進行,濾波器28的輸出將含有各個接收符碼的中點樣本。當此種取樣累加器34的此種進行時,暫存器29被啟用以儲存符碼,其然後輸入功能區塊30,其向右移位16-位元值7位元帶有捨入,以回復所傳輸的符碼。然後,
五個較低位元值自葛雷代碼解碼及儲存於一輸出緩衝器31。然後,緩衝器31內容可用作為所接收的音訊控制資料或元資料位元串流(例如,次要媒體資料125的位元串流)。
如前文描述的累加器34之操作,單獨基於在各個垂直同步脈衝之後發送的自脈衝41及42的計時參考,導致符碼取樣相位的調整。熟諳技藝人士將瞭解此點將校正輸入符碼與本地符碼取樣時鐘間的相位誤差,但可能不會完全校正任何頻率誤差。使用前述設計目標,於發射器時間基準的100ppm頻率誤差,恰在垂直同步區間之前在一資料酬載的最末端,將導致0.15樣本時鐘或0.050符碼寬度的取樣誤差。
藉由增加一頻率項到累加器34的增量,將進一步減少誤差。此項可藉將累加器的分數部分與垂直同步週期之後開始之值作比較求出。然後,此等值之差可除以自最末垂直同步週期以來的近似或確切取樣時鐘數目,及加到用以遞增取樣累加器34的1.0值。藉此方式,可去除大部頻率誤差效應。
依據又一實施例,信號操控器包含一解映射器29,經組配以從包含第二位元數目大於第一位元數目的資料字組解映射包含第一位元數目之分組次要媒體資料。此外或另外,信號操控器包含一解組器31,經組配以解組已被分組的包含第一位元數目之次要媒體資料而獲得已解碼的次要媒體資料位元串流125’,其乃次要媒體資料80的位元串流表示型態,及因而表示次要媒體資料125的位元串
流。
如下圖8至圖12描述已編碼次要媒體資料之實施例,指示資料字組為經PAM編碼,及施用至(尼奎斯特)濾波器15導致一PCM信號。
圖8a顯示依據一實施例媒體信號155的示意表示型態。媒體信號包含一串流之數位字組145,表示已編碼次要媒體資料55包含針對主要媒體資料的元資料或控制資料。
圖8b顯示依據又一實施例媒體信號155之示意表示型態。該媒體信號包含使用一參考圖樣135及多個資料字組140表示已編碼次要媒體資料55的一串流145,其中該等多個資料字組140包含次要媒體資料。又復,已編碼次要媒體資料映射入多個資料字組,對該資料字組的最高有效位元或對該資料字組的最低有效位元有個間隙。依據實施例,參考圖樣135及資料字組140經過濾以推衍數位字組142,或更精確言之,數位字組之串流145。
參考圖樣較佳包含與資料字組140的相同結構,表示次要媒體資料125之位元串流包含一參考圖樣135,其被分組成分組參考圖樣(根據分組次要媒體資料)及形成為資料字組諸如資料字組140。如此將導致例如圖4中顯示的編碼器100的一致處理,其中交換器13係經組配以在參考圖樣135與主要媒體資料的元資料或控制資料間切換。換言之,於第一實施例中,次要媒體資料包含分組參考圖樣及主要媒體資料的元資料或控制資料。於第二實施例中,參
考圖樣係與次要媒體資料獨立無關。差異化為優異原因在於參考圖樣及元資料或控制資料的處理選擇性地為彼此聯合或彼此分開。又復,已解碼媒體信號85或已解碼的次要媒體資料位元串流125’,就例如已編碼次要媒體資料位元串流55的捨入誤差而言,理想上係相同或至少相似。
實施例顯示包含已編碼次要媒體資料的參考幅值及主要媒體資料中之一預定時瞬的參考圖樣135。依據進一步實施例,媒體信號包含主要媒體資料的又一串流,其中該主要媒體資料包含音訊資料及視訊資料。包含主要媒體資料的又一串流在主要媒體資料中之該預定時瞬係對齊已編碼次要媒體資料串流。主要媒體90a或90b包含例如由零交叉165表示於參考圖樣的時瞬40。
圖8c顯示依據一實施例資料字組140之示意表示型態。該分組器將次要媒體資料之位元串流分組成包含5位元(例如,位元7至位元11)的已分組次要媒體資料130,其中該映射器係經組配以符號擴延130a已分組次要媒體資料至最高有效位元(例如,位元12至位元15),表示已分組次要媒體資料的第一位元(位元11)係填補到位元15至12,及其中該映射器進一步以零130b填補距最低有效位元的間隙(例如,位元6到0)。進一步實施例顯示包含8個位元的次要媒體資料。左或右的填補位元據此共減少了3位元獲得16-位元資料字組。也實現了其它組合諸如次要媒體資料或資料字組的不同長度或填補位元的另一大小。又復,參考圖樣可經處理使得參考圖樣包含與資料字組140相同的結構。
圖9a顯示主要媒體資料160之一時瞬40,指示垂直空白區間,或視訊框中的又一同步點。優異地,同步部分40指示視訊框中的一合宜時間點,指示切割視訊框串流的一合宜位置。如此可能為垂直空白區間,或例如視訊框中的某條線(例如,線7),於該處可執行視訊串流的切割。因此,兩個接續同步脈衝間距為一個訊框。一個訊框可包含800個或801個音訊樣本,結果導致每個視訊框約300個資料字組及額外的參考圖樣、版本編碼、連續性計數器、循環冗餘檢查或額外負擔。
圖9b顯示使用一參考圖樣及多個資料字組表示已編碼次要媒體資料的該串流145之示意表示型態。因圖9b係排齊於圖9a,其顯示參考圖樣135係由時瞬40驅動。因此,依據此一實施例,預定時瞬165為參考圖樣的幅值41與42間之零交叉,指示在主的同步信號160中的時瞬40。參考圖樣的第一幅值41可包含0x0780 HEX之一幅值,其中參考圖樣的第一幅值42可包含0xf880 HEX之一值。相鄰參考圖樣的第一及第二幅值可以零填補,或依據進一步實施例,零填補位元乃參考圖樣的部分。在參考圖樣經處理之後,串流建立器施用資料字組140到資料酬載容器43。進一步實施例顯示資料酬載容器43內的一額外部分,於該處施加冗餘,例如以進行位元錯誤校正,例如檢查和、等位位元、循環冗餘檢查等。參考圖樣135及資料字組140可經過濾而獲得資料字組142而形成串流145。
以下圖10至圖12以進一步細節描述濾波器15、串
流建立器120、及串流145。圖10a顯示具有衰減截止因數=0.98的升餘弦整形濾波器,其中圖10b顯示根據一取樣頻率取樣的升餘弦整形濾波器。可知具有衰減截止因數=0.98的升餘弦整形濾波器將幾乎全部脈衝能置於三個中央樣本180a、180b。但可使用13個樣本用於加法,或更明確言之,只使用非為零的七個係數。但只使用三個中央樣本將使得編碼符碼能夠進行良好重建而無頻疊問題或符碼間干擾。
圖11a及11b顯示於時間連續表示型態(圖11a)及時間離散表示型態(圖11b)具有衰減截止因數0.7的升餘弦整形濾波函式15’。圖11c於一列顯示圖11b的影像三次,對齊連續濾波函式間兩個樣本的偏移值,濾波函式可以是資料脈衝15’。濾波函式或資料脈衝15’係經調變,例如相乘,乘以經映射的次要媒體資料(表示次要媒體資料的一個符碼)或參考圖樣的(一符碼),各自表示參考圖樣的一資料字組140或(經PCM調變的)符碼。參數係以此種方式經選擇使得升餘弦濾波的分開表示型態的每第二個樣本為零。因此,兩個相鄰脈衝放置有2樣本距離,使得各個脈衝中央係在全部其它脈衝皆交叉零的位置。此種概念針對調變過程相當簡單,針對解調也簡單,於該處檢查中央樣本包含時間誤差及增益誤差的補償。若在發射之後數位字組的時鐘偏差、或原先取樣頻率與實際取樣頻率間之差夠低,則可進行解碼器的符碼復原,而不計算來源取樣頻率。又復,少數幅值有利於符碼復原而於解碼器無取樣率轉換。優異地施用相位補償而與時鐘偏差的校正獨立無關。
各個樣本值(自頂至底)相加導致數位字組的串流145。又復,各個樣本之幅值,或換言之,各個樣本值以資料字組140或參考圖樣的符碼加權(例如,倍增),可視為脈衝調幅。依據實施例,此等示意圖適用於參考圖樣及資料字組。又復,注意以每秒24000符碼及256幅值(8位元)或32幅值(5位元)描述的實施例為舉例說明而非限制本發明之範圍。也包括其它符碼率,較低及較高符碼率兩者,使用取樣率轉換而將該等符碼插入包含次要媒體資料的串流之零交叉以及幅值階級的不同解析度。
圖12顯示依據一實施例串流145的示意表示型態。圖12a顯示包含經濾波之參考圖樣135及經濾波之資料字組140的串流145之示意時間連續表示型態。又復,顯示第二參考圖樣135a,其可選擇性地施用於訊框終端而達成一信號訊框內部的準確計時回復。因此,第二同步符碼(或參考圖樣)135a可能具有比第一參考圖樣135略低的幅值,及又復,第一參考圖樣135可能包含比其它符碼更高的幅值。藉此方式,極其有效地搜尋第一同步符碼。又復,資料字組可包含一或多個冗餘位元以啟用錯誤檢測。圖12b以放大版本顯示串流145。圖12c以於一取樣率之樣本的時間離散形式顯示圖12a中顯示的信號之相似信號。再者,圖12d以時間離散形式顯示類似圖12b中顯示的信號之信號。
圖13顯示使用一參考圖樣及多個資料字組,解碼包含表示次要媒體資料的一串流的一媒體信號之方法1100的示意流程圖。方法1100包含一步驟1105用來以解碼器回
復次要媒體資料,回復包含就所接收的數位字組表示的幅值或使用再取樣而操控所接收的數位字組之串流,及步驟1110自該已回復次要媒體資料推衍一位元串流。
圖14顯示用於使用一編碼器編碼一媒體信號之方法1200的示意流程圖。方法1200包含使用增加冗餘或頻帶限制而使用一編碼器編碼一媒體信號的步驟1205,及輸出已編碼次要媒體資料作為數位字組之串流的步驟1210。
較佳實施例之建構考量
所描述之實施例可於軟體呈一串列電腦指令或於硬體組件實施。此處描述之操作典型地係藉電腦CPU或數位信號處理器作為軟體指令進行,圖式中顯示的暫存器及操作器可藉對應電腦指令實現。然而,如此並不排除於使用硬體組件的相當硬體設計中之實施例。又,本發明之操作於此處係以循序基本方式顯示。但熟諳技藝人士須瞭解當在特定硬體或軟體平台上實施時,該等操作可經組合、變換、或預計算以優化效率。
只有音訊系統之替代實施例
又復,本發明可用於無分散式垂直同步的只有音訊系統,使用方式係經由迴旋卷積編碼或其它手段,藉一等效本地產生的信號置換發射器中之垂直同步信號,及藉保護輸入暫存器11的資料位元串流免於將產生與脈衝41相同脈衝的符碼圖樣。然後,參考幅值檢測器20可經修改而藉脈衝41的檢測而再生接收器內的本地同步信號。
於進一步實施例中,提供為位元中流而獲得類似
音訊數位串流,諸如圖1在方塊3的輸出之串流的音訊元資料之調變可包含替代彼此或彼此除外的若干程序。更明確言之,由圖6的方塊3輸出的及圖6的方塊4輸入的串流例如為一序列PCM值,諸如16-位元或32-位元PCM值,諸如儲存於CD上者。當然,控制資料或元資料位元串流具有某個位元串流語義,於元資料位元串流中包含數個位元的實際數位字組典型地將具有可變長度。然而,方塊3或籠統言之自音訊控制資料或元資料產生類似音訊數位串流的程序包含分組器,用以將得自該串流的第一數目之位元分組。因而如此表示例如5位元之一序列係取自元資料位元串流。然後,決定由第一數目之位元亦即由5位元表示的狀態。此種狀態乃32狀態中之一者。然後,於一個實施例中,該狀態由第二數目之位元表示,於該處第二數目之位元係大於第一數目之位元。此種第二數目之位元之表示型態可以是例如,16位元表示型態或32位元表示型態等。然而,總而言之,第二數目之位元係大於第一數目之位元,使得某種穩健或冗餘被導入該表示型態。然後,由第二數目之位元表示的狀態被寫入全部皆由第二數目之位元組成的一序列之數位字組,此項寫入被執行單次,或者為了更進一步增加冗餘,循序地執行多於一次。較佳地,該狀態被循序地寫入該序列內2、3或甚至更多次,使得藉此實施例產生的類似音訊數位串流乃階梯狀形式,經常性地有一組相同值,接著另一組相同值,此等值的高度或狀態只是某個數目之狀態中之一者,諸如32個不同的可能狀態中之只有一者,
但個別值不由例如5位元值表示,反而由16或32位元值表示。另外,藉分組成第一數目之位元已獲得某種冗餘,此時循序地將第一數目之位元寫入該序列之數位字組多於一次,亦即藉由重複某個數目之次數。
取決於所施加的冗餘,亦即,第二數目之位元係大於第一數目之位元的冗餘及/或藉重複該狀態某個次數,可進行接收器端上的不同重建方式。舉例言之,當只執行一種重複時,則例如取三個接續值須相同,及進行判定該值是否由二或三個值表示。如此,做出大部分決定。
另外或此外,及特別當應用具有第二數目之位元係大於第一數目之位元的實施例時,亦即,當5位元狀態例如由16位元表示,多數決策除外,或作為決策的又一成分,或替代多數決策,可進行低通濾波或平均值計算等以便找出或重建原先值。
本發明之經傳輸的或經編碼的信號可儲存於數位儲存媒體上,或可在傳輸媒體上傳輸,諸如無線傳輸媒體或有線傳輸媒體諸如網際網路。
實施例顯示針對元資料或控制資料的不同PCM頻道,允許要素音訊信號(或主要媒體資料)以全品質及解析度發射。又復,控制資料或元資料信號可變換成PCM音訊信號的典型降級可倖存者,諸如增益變化、時間基準誤差、再取樣、相對於主信號的延遲變化等。再者,實施例可於較佳的但非排它的情況,以未經編碼的或未經壓縮的要素信號操作。
進一步較佳實施例描述如後:新穎以MPEG-H為基的TV音訊系統將三個主要新穎特徵帶入電視廣播。「MPEG-H」係指MPEG-H部分3,ISO/IEC 23008-3,且可能與MMT傳送、HEVC視訊編碼等有關其它部分不相關。更明確言之,係有關於由MPEG-H音訊聯盟基於MPEG-H音訊編解碼器發展出的新TV音訊系統。三個主要新穎特徵為:
●互動性以使得消費者能依其喜好選擇不同的音訊呈現形式,諸如運動賽事時主場隊或客場隊評論,或調大或調小節目中的特定音訊元素,諸如對話或音效。
●沈浸式音響藉由增加高度頻道,使用MPEG-H較高階立體混聲模式,或在收聽者上方的靜態搖攝物件而改良聲音的寫實逼真。
●多平台調適。不似今日的TV音響,MPEG-H系統將訂製回放,使得在裝置及環境範圍獲得最佳效果,從有揚聲器的安靜家庭劇院到有耳塞式耳機的地鐵或機場。
全部此等特徵將在廣播者或內容分配者的控制之下,提供新穎創新機會,諸如有效增加額外語言、播放器、或正式麥克風的能力,或如該聯盟已經示範,賽車中汽車對車隊後勤維修工作站無線電的能力。
因MPEG-H音訊系統係經設計以在未經修改的HD-SDI內嵌式音訊頻道上工作,當站台選擇時可開始實現
MPEG-H音訊特徵而無需改變其內部電台或操作程序。提示廣播者當採用MPEG-H時考慮四階段式處理:
1.使用MPEG-H音訊傳輸立體聲及環繞節目:如此將允許廣播者獲得MPEG-H音訊的位元率效率及新穎行動音訊特徵而無需任何操作變化。
2.增加音訊物件用於額外語言或其它評論,使得觀賞者能夠收聽你的主場隊TM音訊或收聽其偏愛的賽車手的無線電,以及提供委託存取特徵,諸如視覺描述。
3.增加沈浸式音響藉由增加高度頻道,較高階立體混聲模式,或在收聽者上方的靜態搖攝物件以改良聲音的逼真。
4.增加動態音訊物件:與固定定位的靜態物件相反,動態物件隨時間移動而追蹤視訊動作以提供創新效果。例如若音效係被搖攝,則比起發送5個或9個頻道靜態物件,動態物件可減少要求的位元率。
調適MPEG-H的現場製作與播放:兩種辦法
於今日的電視台,現場或即時視訊信號係使用HD-SDI介面傳送,其支援至多16個內嵌式音訊頻道。一系統實例係設計成直接使用此等頻道於節目的頻道、物件、及其它音訊元素。
圖15顯示依據一實施例MPEG-H分散式系統的示意圖,於該處圖15a顯示固定模式系統,圖15b顯示控制追蹤模式的系統。針對如上階段1至3,可使用固定頻道映射圖或綱要及固定式編碼元資料的傳統辦法(參考圖15a)。此種辦法具有容易瞭解的優點,若不使用物件或只使用少
數例行物件則就操作變化而言只有極少要求。此種辦法稱作固定模式,但預設值可用於外在控制之下以改變編碼器設定值。
圖15a表示的固定式模式基本上顯示MPEG-H音訊監視及編寫單元200其可於監視模式操作。輸入監視及編寫單元200者為內嵌有音訊的視訊205,諸如包含至多16個音訊頻道的HD-SDI信號。MPEG-H音訊監視及編寫單元200可經組配以使用以網路為基的控制介面210,其針對頻道指派及音訊參數設定固定預設值。MPEG-H音訊監視及編寫單元200的輸出為一遠程控制215包含監視器控制220及整合式響度儀器225。以網路為基的控制介面或遠程控制(或兩者)可藉網際網路協定連結240而連結到MPEG-H音訊監視及編寫單元200。又復,MPEG-H音訊監視及編寫單元200可使用連結235而連結到揚聲器(圖中未顯示)。
HD-SDI信號205係輸入到一視訊/MPEG-H音訊貢獻或分配編碼器245,包含一視訊編碼器250及一MPEG-H編碼器255。MPEG-H編碼器可使用以網路為基的控制介面210及網際網路協定連結240而被饋入針對頻道指派及音訊參數的固定預設值。視訊編碼器250及MPEG-H編碼器255的輸出係輸入給一傳送多工器260。多工化信號265係使用例如網際網路協定(IP)或數位視訊廣播非同步串列介面(DVB/ASI)分配或傳輸。
視訊/MPEG-H音訊貢獻或分配解碼器270接收多工化信號265,及傳送解多工器275將該多工化信號265解多
工化。解多工信號可饋入視訊解碼器280及MPEG-H解碼器285,配合包含至多16頻道的內嵌有音訊的視訊信號205的解碼版本205’。施加至解碼信號205’的進一步音訊處理可相當於HD-SDI視訊信號205中的音訊信號在傳輸之前的處理。
依據一實施例,發展替代辦法,亦即控制軌道模式(參考圖15b),其使用控制軌道置於音訊頻道中之一者上,通常為頻道16。控制軌道可包含針對主要媒體資料的元資料或控制資料。
圖15b中呈現的示意方塊圖比較就圖15a描述的方塊圖顯示數個變化。首先,MPEG-H音訊監視單元200以編寫模式操作,其使得監視單元200能產生控制軌道,且將該控制軌道插入包含至多15頻道的內嵌有音訊的視訊的頻道16。第16頻道可維持用於控制軌道。用於產生控制軌道的頻道指派及音訊參數可由以網路為基的控制介面210設定。包含至多15頻道的內嵌有音訊的視訊及所產生的控制軌道205”的進一步處理係類似圖15a的信號處理。然而頻道指派及音訊參數係讀取自控制軌道,而無需使用例如網路介面施用。
控制軌道可同步化至垂直同步以許可視訊容易編輯與切換。控制軌道係設計成恰似縱時間代碼信號操作。其將倖存透過PCM音訊頻道的正常處理,但無法成功地透過壓縮音訊頻道傳輸,諸如層II貢獻編解碼器。針對此種情況,可使用MPEG-H音訊貢獻編碼器,其壓縮音訊頻道
以供傳輸,且將控制軌道轉換成載於MPEG-H音訊位元串流的元資料。
控制軌道:
●含有編碼器需要的全部組態資訊,包括
○頻道映射圖或綱要
○物件名稱或標示
○物件群組及控制極限
○節目參考位準(於MPEG術語中「對白標準化」),下混增益,及DRC輪廓
○動態物件之位置資訊
●可於路由、生產、及主控制交換器切換
●將通過訊框同步化器及其它終端設備
●可於視訊編輯器或音訊工作站使用其它音訊軌道編輯
●將通過有其它音訊軌道的音訊機臺
●提供經編碼或經監視音訊的訊框準確過渡以匹配視訊節目切換或編輯
●不要求組配設備用於控制軌道頻道的「資料模式」或「非音訊模式」處理
控制軌道因其係載於有內容的一音訊頻道,提供MPEG-H音訊編碼器的全部參數之自動設定而無需任何手動規劃或無需修改電臺的其它設備。編碼器將控制軌道資訊轉譯成MPEG-H音訊元資料,其係於已編碼位元串流傳輸給MPEG-H音訊解碼器。此種操作模式定名為控制軌道模
式。
專業解碼器可以貢獻或傳輸模式操作,於該處其從所接收的元資料重製控制軌道信號,或以發射模式操作於該處其渲染音訊頻道恰似消費者解碼器進行的方式般。
控制軌道可由音訊監視及編寫單元產生,由音訊操作者用於現場節目。為了攝入紀錄內容,HD-SDI信號可通過音訊監視及編寫單元用於即時對白配音期間增加控制軌道,或以檔案為基的用具可用以將控制軌道插入常用檔案格式,諸如快速時間/MP4FF或MXF。當然音訊監視及編寫單元也在監視期間使用控制軌道以模擬MPEG-H音訊解碼器的動作。
因控制軌道可恰如任何其它音訊頻道般編輯,只藉由在編輯時間線上拋棄項,具有不同頻道指派或不同物件的節目可於編輯器組合。
控制軌道的使用表示一個音訊頻道不再可用於物件或頻道,但也開啟了使用動態物件的可能性。用於搖攝聲音,諸如音效,可能需要數個靜態物件頻道以產生使用單一頻道動態物件的效果。
控制軌道辦法允許在一廣播日期間使用的MPEG-H音訊模式的完全彈性。容易地可能有一節目具有立體聲及兩個對話物件被完全沈浸式7.1+4H音響節目插入,或甚至高階立體聲音響穿插有立體聲或5.1環繞的商業廣告。
所顯示的一項新穎可能係能夠增廣商業廣告的
範圍涵括人口統計學,以主要語言收聽廣告較為舒適。意圖接觸最寬廣的可能聽眾的本地電台可有數種語言的旁白或對話可由廣告主選擇。系統實例之較佳語言特徵將以廣播時的較佳語言呈現商業廣告給觀看者,而針對或沒有該種語言呈現的其它節目或商業廣告自動切回預設語言。
內容過渡有某些限制,主要於網路打破及結合操作期間,可能具有含控制軌道信號的新內容與不含控制軌道信號的舊內容之混合物。舉例言之,MPEG-H音訊編碼器及MPEG-H音訊監視及編寫單元可被設定為切換成5.1環繞模式,具有-24 LKFS(響度、K加權、相對於原尺寸)的固定響度及標準下混增益及DRC輪廓,如同今日典型使用的設施。藉此方式,舊內容可如同今日編碼,而具有沈浸式或互動式特徵的新內容將自動以正確設定值編碼。
本發明之進一步實施例係有關於下列實例:
1.一種將數位音訊頻道中的資料藉由數位調變或編碼成該頻道內信號頻帶受限或耐受傳輸的傳輸降級的用於發射或接收該資料的系統,或一種信號其非原始位元以某種方式堆積在一起但倖存通過頻道降級。
2.實例1之系統其中該資料為控制資料、元資料、或載於一第二數位音訊頻道中的音訊信號有關的其它資料。
3.一種將數位音訊頻道中的資料經壓縮數位音訊位元串流藉由數位調變或編碼用於該頻道內傳輸的用於發射該位元串流的系統。
4.實例3之系統其中該資料經壓縮數位音訊位元串流含
有元資料或控制資料。
5.實例3之系統其中該資料經壓縮數位音訊位元串流只含有元資料或控制資料而不含相關音訊資訊。
6.實例1之系統其中該數位音訊頻道係嵌入於一數位視訊信號中。
7.實例2之系統其中該數位音訊頻道係嵌入於一數位視訊信號中。
8.實例3之系統其中該數位音訊頻道係嵌入於一數位視訊信號中。
9.實例4之系統其中該數位音訊頻道係嵌入於一數位視訊信號中。
10.實例5之系統其中該數位音訊頻道係嵌入於一數位視訊信號中。
11.用於調變包含一位元之串流的音訊控制資料或元資料用以獲得一類似音訊數位串流的方法、設備或電腦程式,包含:將第一數目之位元分組;決定由該第一數目之位元表示之一狀態;藉一第二數目之位元表示該狀態,該第二數目之位元係大於該第一數目之位元,及循序將該第二數目之位元寫入包含該第二數目之位元的一序列之數位字組內部單次或多於一次;或循序將該第一數目之位元寫入一序列之數位字組中多於一次。
12.用於解調一數位串流以獲得音訊元資料或控制資料之一位元串流的方法、設備或電腦程式,包含:在一序列所接收的音訊樣本間執行多數決或平均值計算以獲得已分組的第一數目之位元或音訊樣本量化成多個位元;及將藉鏈接二或多組第一數目之位元而獲得元資料資訊所獲得的一序列之位元進行語義剖析。
雖然已經於方塊圖脈絡描述本發明,於該處該等方塊表示實際或邏輯硬體組件,本發明也可藉電腦實施方法具體實施。於後述情況下,該等方塊表示對應的方法步驟,於該處此等步驟表示藉對應邏輯或實體硬體方塊執行的方塊。
雖然已經於設備脈絡描述若干面向,但顯然此等面向也表示對應方法的描述,於該處方塊或裝置對應於方法步驟或方法步驟的特性件。類似地,於方法步驟之脈絡描述的面向也表示對應設備的對應方塊或項或特性件之描述。部分或全部的方法步驟可藉(或使用)硬體設備執行,例如微處理器、可規劃電腦或電子電路。於若干實施例中,藉此種設備可執行最重要的方法步驟中之某一者或多者。
取決於某些實施要求,本發明之實施例可於硬體或軟體實施。具體實施可使用具有可電子讀取控制信號儲存其上的數位儲存媒體進行,例如,軟碟、DVD、藍光碟、CD、ROM、PROM、及EPROM、EEPROM或快閃記憶體,其可與可規劃電腦系統協作(或能夠協作)使得進行個別方
法。因此,數位儲存媒體可以是可電腦讀取。
依據本發明之若干實施例包含具有可電子讀取控制信號的資料載體,其可與可規劃電腦系統協作,使得進行此處描述之方法中之一者。
一般而言,本發明之實施例可實施為具有程式代碼的電腦程式產品,當該電腦程式產品在一電腦上跑時該程式代碼可操作用以執行該等方法中之一者。該程式代碼例如可儲存於機器可讀取載體上。
其它實施例包含電腦程式用以執行儲存於機器可讀取載體上的此處描述之方法中之一者。
因此,換言之,本發明之方法實施例為具有程式代碼的電腦程式,當該電腦程式在一電腦上跑時該程式代碼可用以執行此處描述之該等方法中之一者。
因此,本發明之方法的進一步實施例為一資料載體(或非暫態儲存媒體,諸如數位儲存媒體或電腦可讀取媒體)包含用以執行此處描述之該等方法中之一者的該程式代碼紀錄其上。資料載體、數位儲存媒體或已紀錄媒體典型地為具體有形及/或非暫態。
因此,本發明之方法的進一步實施例為表示用以執行此處描述之該等方法中之一者的該電腦程式之一資料串流或一序列信號。該資料串流或該序列信號例如可經組配以透過資料通訊連結,例如透過網際網路移轉。
又一實施例包含一種處理構件,例如電腦或可規劃邏輯裝置經組配以或適用以執行此處描述之該等方法中
之一者。
又一實施例包含一種電腦其上安裝有用以執行此處描述之該等方法中之一者的電腦程式。
依據本發明之進一步實施例包含一種設備或一種系統經組配以將用以執行此處描述之該等方法中之一者的電腦程式移轉(例如,電子式或光學式)給接收器。接收器可以是例如,電腦、行動裝置、記憶體裝置等。該設備或系統例如可包含一檔案伺服器用以將該電腦程式移轉給接收器。
於若干實施例中,可規劃邏輯裝置(例如,可現場程式規劃閘陣列)可用以執行此處描述之該等方法的功能中之部分或全部。於若干實施例中,可現場程式規劃閘陣列可與微處理器協作以執行此處描述之該等方法中之一者。籠統言之,該等方法較佳地係藉任一種硬體設備執行。
前文描述之實施例僅用於例示本發明之原理。須瞭解此處描述之配置及細節的修改及變化將為熟諳技藝人士顯然易知。因此,意圖僅由隨附之申請專利範圍各項之範圍所限,而非藉此處描述及解說的實施例呈現的特定細節所限。
International Organization for Standardization and International Electrotechnical Commission, ISO/IEC 14496-3 Information technology - Coding of audio-visual objects - Part 3: Audio, www.iso.org.
International Organization for Standardization and International Electrotechnical Commission, ISO/IEC 23003-1:2007 Information technology - MPEG audio technologies - Part 1: MPEG Surround, www.iso.org.
International Organization for Standardization and International Electrotechnical Commission, ISO/IEC DIS 23008-3 Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio, www.iso.org.
European Telecommunications Standards Institute, ETSI TS 101 154: Digital Video Broadcasting (DVB); Specification for the use of Video and Audio Coding in Broadcasting Applications based on the MPEG-2 transport stream, www.etsi.org.
Advanced Television Systems Committee, Inc., Audio Compression Standard A/52, www.atsc.org.
Dolby Laboratories, Inc., “Post It with Dolby E”, www.dolby.com, 2003.
Snell Ltd., “White Paper: Dolby E Processing, Working with Dolby E in a Broadcast Environment”, www.snellgroup.com, 2011.
A. W. J. Oomen, M. E. Groenewegen, R. G. van der Waal, and R. N. J. Veldhuis, “A Variable-Bit-Rate Buried-Data Channel for Compact Disc,” J. Audio Eng. Soc., vol. 43, p. 23-28 (1995 Jan./Feb.).
Audio Engineering Society, AES 3-2003, AES standard for digital audio - Digital input-output interfacing - Serial
transmission format for two-channel linearly represented digital audio data, www.aes.org, 2003.
Audio Engineering Society, AES10-2008 (r2014): AES Recommended Practice for Digital Audio Engineering - Serial Multichannel Audio Digital Interface (MADI), www.aes.org, 2014.
Audio Engineering Society, AES67-2013: AES standard for audio applications of networks - High-performance streaming audio-over-IP interoperability), www.aes.org, 2013.
Society of Motion Picture and Television Engineers, Ancillary Data Packet and Space Formatting, ST 291-1:2011.
Society of Motion Picture and Television Engineers, 1.5 Gb/s Signal/Data Serial Interface ST 292-1:2012.
Society of Motion Picture and Television Engineers, Format for Non-PCM Audio and Data in an AES3 Serial Digital Audio Interface ST 337:2008.
Society of Motion Picture and Television Engineers, Format of Audio Metadata and Description of the Asynchronous Serial Bitstream Transport ST 2020-1:2014.
"A flexible sampling-rate conversion method," Julius O. Smith and P. Gossett, IEEE International Conference on ICASSP 1984, pp.112-115, Mar 1984.
“Principles of Interactive Computer Graphics”, Newman and Sproull, 2nd ed., Mc-Graw-Hill, 1979, figure 2-9,
80‧‧‧次要媒體資料
100‧‧‧編碼器
145‧‧‧數位字組之串流
Claims (44)
- 一種用於編碼包含針對主要媒體資料的元資料或控制資料的次要媒體資料之編碼器,其中該編碼器係經組配以編碼該次要媒體資料而獲得一串流之數位字組,該編碼包含藉一數位調變而變換該次要媒體資料或包含頻帶限制,及其中該編碼器係經組配以輸出該已編碼次要媒體資料為該串流之數位字組。
- 如請求項1之編碼器,其中該編碼包含藉該數位調變而增加冗餘。
- 如請求項1或2之編碼器,其中該數位調變係使得該串流之數位字組的每個數位字組傳輸該次要媒體資料之二或多個位元。
- 如前述請求項中任一項之編碼器,其中該編碼器係經組配以輸出該串流之數位字組使得該串流之數位字組係於一脈衝代碼調變(PCM)音訊頻道上可傳輸。
- 如前述請求項中任一項之編碼器,其中該編碼器係經組配以輸出一進一步串流之數位字組,該進一步串流之數位字組表示該主要媒體資料,該進一步串流係與該串流之數位字組分開。
- 如請求項5之編碼器,其中該主要媒體資料為音訊資料,及其中該次要媒體資料為針對該音訊資料的元資料或針對該音訊資料的控制資料。
- 如請求項5或6之編碼器,其中該編碼器係經組配以輸出該串流之數位字組及該進一步串流之數位字組使得該進一步串流之數位字組係於一第一音訊PCM頻道上可傳輸,及使得該串流之數位字組於與該第一音訊PCM頻道不同的一第二音訊PCM頻道上可傳輸。
- 如請求項5或6或7之編碼器,其中表示該主要媒體資料的該進一步串流之該等數位字組中之各者具有大於8位元而小於32位元之一預定數目的位元,及其中該串流之數位字組的該等數位字組中之各者也具有該預定數目之位元。
- 如前述請求項中任一項之編碼器,其中該數位調變為一脈衝調幅。
- 如前述請求項中任一項之編碼器,其中該編碼器係經組配以產生該串流之數位字組使得該串流之數位字組包含一時間參考圖樣或一幅值參考圖樣。
- 如前述請求項中任一項之編碼器,其中該編碼器係經組配以輸出表示一序列之視訊影像的一視訊串流,及其中該編碼器係經組配以輸出該串流之數位字組使得相關於一某個視訊影像的該次要媒體資料之該控制資料或元資料係與某個視訊影像有關。
- 如請求項11之編碼器,其中該編碼器係經組配以輸出該串流之數位字組為與該序列之視訊影像中之一第一視訊影像相關聯的一第一串流之數位字組,及輸出該串流之數位字組為與該序列之視訊影像中之一第二視訊影 像相關聯的一第二串流之數位字組,其中該等第一及第二數位字組係彼此相同。
- 如前述請求項中任一項之編碼器,其中該編碼器係經組配以產生該等數位字組,該等數位字組具有12至28位元,或其中該等數位字組係以30kHz至55kHz之一取樣率取樣,或其中該等數位字組具有70至160分貝的一動態範圍,或具有-20分貝均方根(RMS)全尺規的一標稱信號位準。
- 如前述請求項中任一項之編碼器,其中該編碼器係經組配以使用一頻率上限針對30kHz至55kHz之一取樣率頻帶限制該次要媒體資料為15kHz至27.5kHz。
- 如前述請求項中任一項之編碼器,其中該編碼器包含:一映射器經組配用於將包含一第一位元數目之一群組的次要媒體資料映射至包含大於該第一位元數目的一第二位元數目之一資料字組及其中該已分組次要媒體資料係以至該資料字組之一最高有效位元或一最低有效位元的一間隙對齊;一串流建立器經組配用於建立表示已編碼次要媒體資料的一串流之數位字組。
- 如前述請求項中任一項之編碼器,其中該編碼器包含一分組器經組配用於將一位元串流之次要媒體資料分組而形成已分組次要媒體資料。
- 如前述請求項中任一項之編碼器,其中該編碼器包含一參考信號產生器經組配用於 產生一參考圖樣指示於該主要媒體資料中之一參考幅值或一預定時瞬;及其中一串流建立器係經組配以使用該參考圖樣或該資料字組而建立表示已編碼次要媒體資料的一串流之數位字組。
- 如前述請求項中任一項之編碼器,其中一串流建立器包含一濾波器用以低通濾波資料字組或一參考圖樣用以獲得數位字組包含多於一個具有一預定取樣率的樣本之一長度,其中該數位字組之一幅值係根據該資料字組或該參考圖樣而被加權,及其中該濾波器係經組配以在該預定取樣率的瞬間加總連續數位字組以獲得該串流之數位字組。
- 如前述請求項中任一項之編碼器,其中一濾波器係經組配以在一資料脈衝的一預定取樣率的瞬間獲得零點,其中該資料脈衝包含一資料字組包含已分組次要媒體資料或該參考圖樣;其中一串流建立器係經組配以使用該參考圖樣及多個資料字組而建立表示已編碼次要媒體資料的該串流,使得該資料脈衝的零點係對齊一進一步資料脈衝的一最大值而獲得表示該已編碼次要媒體資料的一不含符碼間干擾(ISI)的串流。
- 如前述請求項中任一項之編碼器,其中該濾波器包含少於該主要媒體資料的一取樣頻率的1.5倍的一截止頻率。
- 如前述請求項中任一項之編碼器,其中一參考信號產生 器係經組配以產生包含一第一數目之位元的一已分組參考圖樣及其中該參考信號產生器係進一步經組配以將該已分組參考圖樣映射至包含大於該第一數目之位元的一第二數目之位元的一資料字組;或其中該映射器係經組配以將包含一第一數目之位元的一已分組參考圖樣映射至包含大於該第一數目之位元的一第二數目之位元的一資料字組。
- 如前述請求項中任一項之編碼器,其中該編碼器係經組配以輸出該已編碼次要媒體資料為該串流之數位字組作為一控制軌道及輸出該主要媒體資料的至多15頻道作為音訊軌道,其中該控制軌道及該等音訊軌道係根據該AES 3標準形成。
- 一種用於解碼一媒體信號的解碼器,該媒體信號包含一已接收的串流之數位字組表示已編碼次要媒體資料其包含針對主要媒體資料的元資料或控制資料;其中該解碼器係經組配以回復該次要媒體資料,其中該回復包含施用一數位解調操作或一再取樣操作以獲得已回復的次要媒體資料,及其中該解碼器係經組配以自該已回復的次要媒體資料推衍一位元串流。
- 如請求項23之解碼器,其中該回復包含就由所接收的資料字組表示的幅值而言操控該所接收的資料字組之串流。
- 如請求項23或24之解碼器,其中該媒體信號額外地包含 表示已編碼次要媒體資料的一進一步接收的資料字組之串流,該進一步接收的串流係與該接收的串流分開,及其中該解碼器係經組配以使用由該位元串流表示的該元資料或控制資料而處理由該進一步接收的串流表示的該主要媒體資料。
- 如請求項23至25中任一項之解碼器,其包含:一參考圖樣分析器用於分析該已編碼次要媒體資料的一參考圖樣,其中該參考圖樣分析器係經組配以決定該參考圖樣的一幅值或決定在該主要媒體資料中之一預定時瞬;一信號操控器用於根據該已分析之參考圖樣及一經計算的參考圖樣操控該已編碼次要媒體資料而獲得次要媒體資料;一信號處理器用於根據已編碼次要媒體資料處理該主要媒體資料而獲得一已解碼媒體信號。
- 如請求項23至26中任一項之解碼器,其中一信號操控器包含一取樣率轉換器經組配以,根據於該參考圖樣中指示的該主要媒體資料之一預定時瞬,將與該等數位字組相關聯的一取樣率轉換成一預定取樣率以獲得經再取樣的數位字組。
- 如請求項23至27中任一項之解碼器,其中一參考圖樣分析器包含:一時瞬決定器經組配以就一取樣率之樣本,決定於 該參考圖樣中的該主要媒體資料之該預定時瞬;一升取樣器經組配以升取樣環繞該預定時瞬的一範圍用以決定一預定時瞬的一確切位置;一取樣累加器經組配以決定在該串流之數位字組內部的該等數位字組之一確切位置而獲得與該等數位字組相關聯的一實際取樣率其係與一預定取樣率不同。
- 如請求項23至28中任一項之解碼器,其中一參考圖樣分析器包含一增益因數計算器以根據該參考圖樣之該幅值及該經計算的參考圖樣之該幅值計算一放大或衰減因數及其中該信號操控器包含一乘法器經組配以根據該放大或衰減因數放大或衰減該等資料字組而獲得經增益補償的資料字組。
- 如請求項23至29中任一項之解碼器,其中該參考圖樣分析器包含一幅值檢測器用以決定一參考圖樣的一幅值及該參考圖樣的一進一步幅值;其中該參考圖樣分析器進一步包含一偏移值補償單元經組配以根據該參考圖樣的該幅值及該參考圖樣的該進一步之一漂移幅值而計算該已編碼次要媒體資料的一偏移值,其中該信號操控器包含一加法器經組配以將該已編碼次要媒體資料的該偏移值加至該已編碼次要媒體資料而獲得經偏移值補償的已編碼次要媒體資料。
- 如請求項23至30中任一項之解碼器,其中一信號操控器包含一解映射器經組配以自包 含大於一第一位元數目的一第二位元數目的資料字組解映射包含該第一位元數目之次要媒體資料;或其中一信號操控器包含一解除分組器經組配以將包含一第一位元數目之一群組的次要媒體資料解除分組而獲得已解碼次要媒體資料之該位元串流。
- 一種媒體信號,其包含:一串流之數位字組表示包含針對主要媒體資料的元資料或控制資料的已編碼次要媒體資料。
- 如請求項32之媒體信號,其中該等數位字組包含經濾波的次要媒體資料。
- 如請求項32或33之媒體信號,其中該次要媒體資料包含一參考圖樣及多個資料字組。
- 如請求項32、33、或34之媒體信號,其中該次要媒體資料係以至該資料字組之該最高有效位元或該資料字組之該最低有效位元有一間隙而對映入資料字組。
- 如請求項32至35中任一項之媒體信號,其中該參考圖樣包含該已編碼次要媒體資料之一參考幅值及於主要媒體資料中之一預定時瞬及其中該等多個資料字組包含次要媒體資料。
- 如請求項32至36中任一項之媒體信號,其中該媒體信號包含該主要媒體資料之一進一步串流,其中該主要媒體資料包含音訊資料或視訊資料,其中包含該主要媒體資料之該進一步串流在該主要媒體資料中之預定時瞬係對齊該串流之已編碼次要媒體資料。
- 一種用於解碼一媒體信號之方法,該媒體信號包含一已接收的串流之數位字組表示已編碼次要媒體資料其包含針對主要媒體資料的元資料或控制資料,該方法包含:回復該次要媒體資料,其中該回復包含施用一數位解調操作或一再取樣操作以獲得已回復的次要媒體資料,及自該已回復的次要媒體資料推衍一位元串流。
- 一種編碼包含針對主要媒體資料的元資料或控制資料的次要媒體資料之方法,該方法包含:編碼該次要媒體資料而獲得一串流之數位字組,該編碼包含藉一數位調變而變換該次要媒體資料或包含頻帶限制,及輸出該已編碼次要媒體資料為數位字組的該串流。
- 一種電腦程式,其具有一程式代碼用於當該電腦程式在一電腦上跑時執行如請求項38或39之該方法。
- 一種資料處理系統,其包含:如請求項1至22中任一項之一編碼器;及如請求項23至31中任一項之一解碼器。
- 如請求項41之資料處理系統,其進一步包含:一信號操控器用於操控該串流之數位字組而獲得一經操控的串流之數位字組,其中該解碼器係經組配以自該經操控的串流之數位字組回復該串流之數位字組。
- 如請求項42之資料處理系統,其中該信號操控器係經組配以藉幅值放大或幅值衰減或偏移值導入或偏移值變化或頻率選擇性衰減或放大或再取樣而予操控,及其中該解碼器係經組配以回復藉幅值放大或幅值衰減或偏移值導入或偏移值變化或頻率選擇性衰減或放大或再取樣操控的該串流之數位字組。
- 如請求項42或43之資料處理系統,其中該信號操控器係經組配以接收一PCM音訊頻道及輸出一PCM音訊頻道,其中該編碼器係經組配以輸出在該PCM音訊頻道上可傳輸的一信號,及其中該解碼器係經組配以接收自該PCM音訊頻道已接收的該串流。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14192907 | 2014-11-12 | ||
??14192907.5 | 2014-11-12 | ||
??15163198.3 | 2015-04-10 | ||
EP15163198 | 2015-04-10 | ||
??15181428.2 | 2015-08-18 | ||
EP15181428 | 2015-08-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201622368A true TW201622368A (zh) | 2016-06-16 |
TWI631835B TWI631835B (zh) | 2018-08-01 |
Family
ID=54476977
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104136494A TWI631835B (zh) | 2014-11-12 | 2015-11-05 | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 |
Country Status (13)
Country | Link |
---|---|
US (2) | US10349092B2 (zh) |
EP (1) | EP3219105A1 (zh) |
JP (2) | JP6530070B2 (zh) |
KR (1) | KR102151707B1 (zh) |
CN (1) | CN107211164B (zh) |
AU (1) | AU2015345248B2 (zh) |
CA (1) | CA2967519C (zh) |
MX (1) | MX2017006198A (zh) |
MY (1) | MY186808A (zh) |
RU (1) | RU2679379C2 (zh) |
SG (1) | SG11201703855SA (zh) |
TW (1) | TWI631835B (zh) |
WO (1) | WO2016075053A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI765932B (zh) * | 2016-12-21 | 2022-06-01 | 南韓商三星電子股份有限公司 | 半導體記憶體裝置之資料對齊電路以及其資料對齊之方法 |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2007005027A (es) | 2004-10-26 | 2007-06-19 | Dolby Lab Licensing Corp | Calculo y ajuste de la sonoridad percibida y/o el balance espectral percibido de una senal de audio. |
TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
CN112185400B (zh) | 2012-05-18 | 2024-07-30 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
SG11201502405RA (en) | 2013-01-21 | 2015-04-29 | Dolby Lab Licensing Corp | Audio encoder and decoder with program loudness and boundary metadata |
ES2624419T3 (es) | 2013-01-21 | 2017-07-14 | Dolby Laboratories Licensing Corporation | Sistema y procedimiento para optimizar la sonoridad y el rango dinámico a través de diferentes dispositivos de reproducción |
CN116665683A (zh) | 2013-02-21 | 2023-08-29 | 杜比国际公司 | 用于参数化多声道编码的方法 |
CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
CN105190618B (zh) | 2013-04-05 | 2019-01-25 | 杜比实验室特许公司 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
CN109785851B (zh) | 2013-09-12 | 2023-12-01 | 杜比实验室特许公司 | 用于各种回放环境的动态范围控制 |
CN105531759B (zh) | 2013-09-12 | 2019-11-26 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
CN105142067B (zh) | 2014-05-26 | 2020-01-07 | 杜比实验室特许公司 | 音频信号响度控制 |
EP4060661B1 (en) | 2014-10-10 | 2024-04-24 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
US11223857B2 (en) * | 2015-06-02 | 2022-01-11 | Sony Corporation | Transmission device, transmission method, media processing device, media processing method, and reception device |
EP3996375A1 (en) * | 2016-05-26 | 2022-05-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Broadcast streaming of panoramic video for interactive clients |
JP2018148488A (ja) * | 2017-03-08 | 2018-09-20 | ソニーセミコンダクタソリューションズ株式会社 | 信号処理装置および方法 |
US10390030B2 (en) * | 2017-03-10 | 2019-08-20 | Raytheon Company | Symbology encoding in video data |
US10412395B2 (en) | 2017-03-10 | 2019-09-10 | Raytheon Company | Real time frame alignment in video data |
WO2018207155A2 (en) * | 2017-05-12 | 2018-11-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive crc length for beam sweeping |
IT201700078297A1 (it) * | 2017-07-11 | 2019-01-11 | Inst Rundfunktechnik Gmbh | Verfahren und einrichtung zum ableiten von audioparameterwerten aus einem aes67 kompatiblen audioinformationssignal |
GB2593117A (en) * | 2018-07-24 | 2021-09-22 | Nokia Technologies Oy | Apparatus, methods and computer programs for controlling band limited audio objects |
US10554963B1 (en) | 2018-10-16 | 2020-02-04 | Raytheon Company | Video load balancing and error detection based on measured channel bandwidth |
US11153360B2 (en) | 2019-05-21 | 2021-10-19 | Genetec Inc. | Methods and systems for codec detection in video streams |
US12073842B2 (en) * | 2019-06-24 | 2024-08-27 | Qualcomm Incorporated | Psychoacoustic audio coding of ambisonic audio data |
WO2021101449A1 (en) * | 2019-11-23 | 2021-05-27 | Creative Technology Ltd | System and method for transmitting data over a digital interface |
CN111238547B (zh) * | 2020-01-19 | 2022-02-08 | 东方电气自动控制工程有限公司 | 一种位置式编码器过零翻转时转速计算的算法 |
WO2021232157A1 (en) * | 2020-05-19 | 2021-11-25 | The Governing Council Of The University Of Toronto | Sustained release pharmaceutical composition |
CN112988109B (zh) | 2021-05-17 | 2021-09-28 | 深圳市爱图仕影像器材有限公司 | 单音频接口信号切换电路及单音频接口切换装置 |
CN114339297B (zh) * | 2022-03-09 | 2022-06-21 | 央广新媒体文化传媒(北京)有限公司 | 音频处理方法、装置、电子设备和计算机可读存储介质 |
CN114554027B (zh) * | 2022-03-16 | 2022-11-25 | 湖南双菱电子科技有限公司 | 一种音频嵌入处理及视音频同步输出处理方法 |
CN115103286B (zh) * | 2022-04-29 | 2024-09-27 | 北京瑞森新谱科技股份有限公司 | 一种asio低延时声学采集方法 |
CN116994600B (zh) * | 2023-09-28 | 2023-12-12 | 中影年年(北京)文化传媒有限公司 | 基于音频驱动角色口型的方法及系统 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1109155A (en) * | 1977-07-14 | 1981-09-15 | Northern Telecom Limited | Automatic d-c offset cancellation in pcm encoders |
US4550425A (en) * | 1982-09-20 | 1985-10-29 | Sperry Corporation | Speech sampling and companding device |
DE3504734C2 (de) | 1985-02-12 | 1998-12-10 | Max Planck Gesellschaft | Verfahren und Vorrichtung zur Aufnahme von Spinresonanzdaten |
JPH0865072A (ja) * | 1994-08-23 | 1996-03-08 | Mitsubishi Electric Corp | デジタル音声放送受信機 |
US6411725B1 (en) * | 1995-07-27 | 2002-06-25 | Digimarc Corporation | Watermark enabled video objects |
US5822360A (en) * | 1995-09-06 | 1998-10-13 | Solana Technology Development Corporation | Method and apparatus for transporting auxiliary data in audio signals |
EP1431961B1 (en) * | 1995-12-06 | 2008-05-14 | Verance Corporation | Post-compression hidden data transport |
US8908872B2 (en) * | 1996-06-07 | 2014-12-09 | That Corporation | BTSC encoder |
US6226758B1 (en) * | 1997-09-30 | 2001-05-01 | Cirrus Logic, Inc. | Sample rate conversion of non-audio AES data channels |
US6209094B1 (en) * | 1998-10-14 | 2001-03-27 | Liquid Audio Inc. | Robust watermark method and apparatus for digital signals |
US6571144B1 (en) * | 1999-10-20 | 2003-05-27 | Intel Corporation | System for providing a digital watermark in an audio signal |
US6737957B1 (en) * | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
KR20020020899A (ko) * | 2000-03-30 | 2002-03-16 | 요트.게.아. 롤페즈 | 이진 소스신호의 복수의 비트의 스트림을 이진 채널신호의복수의 비트의 스트림으로 인코딩하는 방법 |
US7088398B1 (en) * | 2001-12-24 | 2006-08-08 | Silicon Image, Inc. | Method and apparatus for regenerating a clock for auxiliary data transmitted over a serial link with video data |
US20050213726A1 (en) * | 2001-12-31 | 2005-09-29 | Polycom, Inc. | Conference bridge which transfers control information embedded in audio information between endpoints |
JP2004201267A (ja) * | 2002-10-24 | 2004-07-15 | Sony Corp | ディジタルフィルタ並びにその係数算出装置及び係数算出方法 |
US7535836B2 (en) * | 2003-02-12 | 2009-05-19 | Broadcom Corporation | Method and system to provide word-level flow control using spare link bandwidth |
ATE378782T1 (de) * | 2003-09-22 | 2007-11-15 | Inova Semiconductors Gmbh | System und verfahren zur bildung einer bidirektionalen multimediaverbindung |
US20080317170A1 (en) * | 2004-01-19 | 2008-12-25 | Koninklijke Philips Electronic, N.V. | Embedding a Secondary Information Signal in a Channel Data Stream |
US8826328B2 (en) * | 2004-11-12 | 2014-09-02 | Opentv, Inc. | Communicating primary content streams and secondary content streams including targeted advertising to a remote unit |
KR100686521B1 (ko) * | 2005-09-23 | 2007-02-26 | 한국정보통신대학교 산학협력단 | 비디오 및 메타데이터의 통합을 위한 비디오 멀티미디어응용 파일 형식의 인코딩/디코딩 방법 및 시스템 |
CA2684851C (en) * | 2007-05-04 | 2015-11-24 | Nokia Corporation | Media stream recording into a reception hint track of a multimedia container file |
JP2009212697A (ja) * | 2008-03-03 | 2009-09-17 | Aiphone Co Ltd | テレビドアホン装置 |
US20120033819A1 (en) * | 2010-08-06 | 2012-02-09 | Samsung Electronics Co., Ltd. | Signal processing method, encoding apparatus therefor, decoding apparatus therefor, and information storage medium |
US8380334B2 (en) * | 2010-09-07 | 2013-02-19 | Linear Acoustic, Inc. | Carrying auxiliary data within audio signals |
US20130170558A1 (en) | 2010-09-10 | 2013-07-04 | Thomson Licensing | Video decoding using block-based mixed-resolution data pruning |
JP5909100B2 (ja) * | 2012-01-26 | 2016-04-26 | 日本放送協会 | ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム |
US9373335B2 (en) * | 2012-08-31 | 2016-06-21 | Dolby Laboratories Licensing Corporation | Processing audio objects in principal and supplementary encoded audio signals |
CA2898567C (en) * | 2013-01-28 | 2018-09-18 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method and apparatus for normalized audio playback of media with and without embedded loudness metadata on new media devices |
WO2014192568A1 (ja) * | 2013-05-30 | 2014-12-04 | ソニー株式会社 | 信号処理装置、信号処理方法、プログラム、及び、信号伝送システム |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
EP2830047A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for low delay object metadata coding |
WO2015034275A1 (ko) * | 2013-09-05 | 2015-03-12 | 엘지전자(주) | 무선 통신 시스템에서 오디오/비디오 스트리밍 수행 방법 및 장치 |
EP3044877B1 (en) * | 2013-09-12 | 2021-03-31 | Dolby Laboratories Licensing Corporation | System aspects of an audio codec |
WO2015138798A1 (en) * | 2014-03-13 | 2015-09-17 | Verance Corporation | Interactive content acquisition using embedded codes |
US20150325115A1 (en) * | 2014-05-09 | 2015-11-12 | Sony Computer Entertainment Inc. | Scheme for embedding a control signal in an audio signal |
US9928728B2 (en) * | 2014-05-09 | 2018-03-27 | Sony Interactive Entertainment Inc. | Scheme for embedding a control signal in an audio signal using pseudo white noise |
EP3522554B1 (en) * | 2014-05-28 | 2020-12-02 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Data processor and transport of user control data to audio decoders and renderers |
US9838571B2 (en) * | 2015-04-10 | 2017-12-05 | Gvbb Holdings S.A.R.L. | Precision timing for broadcast network |
US9934790B2 (en) * | 2015-07-31 | 2018-04-03 | Apple Inc. | Encoded audio metadata-based equalization |
-
2015
- 2015-11-05 TW TW104136494A patent/TWI631835B/zh active
- 2015-11-06 MX MX2017006198A patent/MX2017006198A/es active IP Right Grant
- 2015-11-06 CA CA2967519A patent/CA2967519C/en active Active
- 2015-11-06 CN CN201580073193.6A patent/CN107211164B/zh active Active
- 2015-11-06 AU AU2015345248A patent/AU2015345248B2/en active Active
- 2015-11-06 MY MYPI2017000703A patent/MY186808A/en unknown
- 2015-11-06 KR KR1020177016054A patent/KR102151707B1/ko active IP Right Grant
- 2015-11-06 JP JP2017525797A patent/JP6530070B2/ja active Active
- 2015-11-06 EP EP15790965.6A patent/EP3219105A1/en active Pending
- 2015-11-06 WO PCT/EP2015/075987 patent/WO2016075053A1/en active Application Filing
- 2015-11-06 RU RU2017120175A patent/RU2679379C2/ru active
- 2015-11-06 SG SG11201703855SA patent/SG11201703855SA/en unknown
-
2017
- 2017-05-08 US US15/589,839 patent/US10349092B2/en active Active
-
2019
- 2019-05-15 JP JP2019091836A patent/JP6887461B2/ja active Active
- 2019-06-21 US US16/448,454 patent/US11218740B2/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI765932B (zh) * | 2016-12-21 | 2022-06-01 | 南韓商三星電子股份有限公司 | 半導體記憶體裝置之資料對齊電路以及其資料對齊之方法 |
Also Published As
Publication number | Publication date |
---|---|
US10349092B2 (en) | 2019-07-09 |
US20190373294A1 (en) | 2019-12-05 |
US20180007398A1 (en) | 2018-01-04 |
JP2018500804A (ja) | 2018-01-11 |
JP6887461B2 (ja) | 2021-06-16 |
RU2017120175A3 (zh) | 2018-12-13 |
US11218740B2 (en) | 2022-01-04 |
WO2016075053A1 (en) | 2016-05-19 |
CN107211164B (zh) | 2021-01-29 |
RU2017120175A (ru) | 2018-12-13 |
RU2679379C2 (ru) | 2019-02-07 |
EP3219105A1 (en) | 2017-09-20 |
AU2015345248A1 (en) | 2017-06-01 |
CN107211164A (zh) | 2017-09-26 |
TWI631835B (zh) | 2018-08-01 |
AU2015345248B2 (en) | 2019-02-14 |
JP6530070B2 (ja) | 2019-06-12 |
MX2017006198A (es) | 2017-07-31 |
KR102151707B1 (ko) | 2020-09-03 |
BR112017009734A2 (pt) | 2018-02-06 |
CA2967519C (en) | 2020-07-07 |
JP2019193268A (ja) | 2019-10-31 |
KR20170084231A (ko) | 2017-07-19 |
SG11201703855SA (en) | 2017-06-29 |
MY186808A (en) | 2021-08-22 |
CA2967519A1 (en) | 2016-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI631835B (zh) | 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器 | |
US10546599B1 (en) | Systems and methods for identifying a mute/sound sample-set attribute | |
CN107851449B (zh) | 基于编码音频元数据的均衡 | |
AU2006228821B2 (en) | Device and method for producing a data flow and for producing a multi-channel representation | |
JP6190942B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
JP4467984B2 (ja) | オーディオのコード化 | |
KR20070061100A (ko) | 프리셋 오디오 장면을 이용한 객체기반 3차원 오디오서비스 시스템 및 그 방법 | |
JP2017532603A (ja) | オーディオ信号のエンコードおよびデコード | |
CN109040818A (zh) | 直播时的音视频同步方法、存储介质、电子设备及系统 | |
Fielder et al. | Professional audio coder optimized for use with video | |
US20120251069A1 (en) | Audio enhancement based on video and/or other characteristics | |
Dehery | MUSICAM source coding | |
BR112017009734B1 (pt) | Decodificador para decodificar um sinal de mídia e codificador para codificar dados de mídia secundários que compreendem metadados ou dados de controle para dados de mídia primários | |
US20200051576A1 (en) | Signal processing apparatus, signal processing method, and program | |
Mailhot | Accomodating Pre-Compressed Digital Audio in the Modern Television Plant | |
WO2010063108A1 (en) | Method and device for encoding vibro-kinetic data onto an lpcm audio stream over an hdmi link | |
IRT et al. | D2. 2: Interim Reference Architecture Specification and Integration Report | |
Vernony et al. | Carrying multichannel audio in a stereo production and distribution infrastructure |