TWI431610B - 用以將以物件為主之音訊信號編碼與解碼之方法與裝置 - Google Patents
用以將以物件為主之音訊信號編碼與解碼之方法與裝置 Download PDFInfo
- Publication number
- TWI431610B TWI431610B TW097105210A TW97105210A TWI431610B TW I431610 B TWI431610 B TW I431610B TW 097105210 A TW097105210 A TW 097105210A TW 97105210 A TW97105210 A TW 97105210A TW I431610 B TWI431610 B TW I431610B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- information
- channel
- downmix
- signals
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 119
- 230000005236 sound signal Effects 0.000 title claims abstract description 14
- 230000008569 process Effects 0.000 claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 31
- 238000002156 mixing Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 4
- 230000004048 modification Effects 0.000 abstract description 3
- 238000012986 modification Methods 0.000 abstract description 3
- 238000009877 rendering Methods 0.000 description 119
- 239000011159 matrix material Substances 0.000 description 103
- 230000000694 effects Effects 0.000 description 32
- 238000010586 diagram Methods 0.000 description 27
- 230000002829 reductive effect Effects 0.000 description 21
- 238000012937 correction Methods 0.000 description 17
- 230000001965 increasing effect Effects 0.000 description 16
- 230000008859 change Effects 0.000 description 12
- 238000001228 spectrum Methods 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 10
- 230000003595 spectral effect Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 230000036961 partial effect Effects 0.000 description 8
- 230000001360 synchronised effect Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000001934 delay Effects 0.000 description 7
- 238000013507 mapping Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 230000007423 decrease Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000003111 delayed effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 101000860173 Myxococcus xanthus C-factor Proteins 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000002730 additional effect Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000002868 homogeneous time resolved fluorescence Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- VMXUWOKSQNHOCA-UKTHLTGXSA-N ranitidine Chemical compound [O-][N+](=O)\C=C(/NC)NCCSCC1=CC=C(CN(C)C)O1 VMXUWOKSQNHOCA-UKTHLTGXSA-N 0.000 description 1
- 239000013643 reference control Substances 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000003454 tympanic membrane Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明涉及一種音訊編碼方法及裝置,以及一種音訊解碼方法及裝置,其中藉執行編碼和解碼操作,可以有效地處理以物件為主的音訊信號。
通常,在多聲道音訊編碼和解碼技術中,會將一多聲道信號的許多聲道信號降混成較少聲道信號,將與原始聲道信號有關的輔助資訊傳送出去,以及將具有與該原始聲道信號相同聲道數目的一多聲道信號還原回來。
以物件為主的音訊編碼和解碼技術,在將若干音源降混為較少音源信號並傳送與原始音源有關之輔助資訊的觀點下,基本上是相似於多聲道音訊編碼和解碼技術。然而,在以物件為主的音訊編碼和解碼技術中,物件信號是指一聲道信號的基本元素(例如,一樂器或者一人聲),該信號的處理與在多聲道音訊解碼和編碼技術中的聲道信號的處理是相同的,並因此可以被編碼。
換句話說,在以物件為主的音訊編碼和解碼技術中,物件信號被認為是需要編碼的實體。在這點上,以物件為主的音訊編碼和解碼技術是不同於多聲道音訊編碼和解碼技術,在多聲道音訊編碼和解碼技術中,一多聲道音訊編碼操作僅僅依據聲道間資訊,而不考慮需要編碼的聲道信號的元素數量。
本發明提供了一種音訊編碼的方法和裝置,以及一音訊解碼的方法和裝置,利用上述方法和裝置,音訊信號可以被編碼和解碼,從而音訊信號可以應用在各種環境中。
依據本發明的特點,提供一音訊解碼方法,該方法包括:接收一降混信號和以物件為主的輔助資訊,該下降信號包含至少兩個降混聲道信號;從以物件為主的輔助資訊中擷取增益資訊,並根據增益資訊,在聲道間基礎上產生用於修正降混信號的修正資訊;以及藉在降混聲道信號上應用修正資訊修正降混聲道信號。
依據本發明的另一方面,提供一音訊編碼方法,該方法包括:藉降混一物件信號產生一降混信號,該降混信號至少包括兩個降混聲道信號;擷取關於物件信號的物件有關資訊並根據物件有關資訊產生以物件為主的輔助資訊;以及在聲道間基礎上,在以物件為主的輔助資訊內,插入用以修正降混聲道信號的增益資訊。
依據本發明的另一特點,提供一音訊解碼裝置,該裝置包括:一多工解訊器,被配置用於從一輸入音訊信號內擷取一降混信號以及以物件為主的輔助資訊,該降混信號包括至少兩個降混聲道信號;以及一轉碼器,被配置成根據從以物件為主的輔助資訊中所擷取的增益資訊,在聲道間基礎上產生用於修正降混聲道信號的修正資訊,並藉應用該修正資訊到降混聲道信號來修正降混聲道信號。
依據本發明的另一特點,提供一電腦可讀記錄媒體,該媒體在其上記錄用於執行一音訊解碼方法的一電腦程式,該音訊解碼方法包括接收一降混信號以及以物件為主的輔助資訊,該降混信號包括至少兩個降混聲道信號;從以物件為主的輔助資訊中擷取增益資訊,並根據該增益資訊,在聲道間基礎上產生用於修正降混聲道信號的修正資訊;以及藉將修正資訊應用至降混聲道信號而修正降混聲道信號。
依據本發明的另一特點,提供一電腦可讀記錄媒體,該媒體在其上具有用於執行一音訊編碼方法的一電腦程式,該音訊編碼方法包括:藉一降混物件信號產生一降混信號,該降混信號包括至少兩個降混聲道信號;擷取與物件信號有關的物件有關資訊並根據物件有關資訊產生一物件為主的輔助資訊;以及在聲道間基
礎上,將用於修正降混聲道信號的增益資訊插入以物件為主的輔助資訊內。
以下配合圖式及元件符號對本發明的實施方式做更詳細的說明。
本發明所提供的一音訊編碼方法及裝置以及一音訊解碼方法及裝置,可以應用於以物件為主的音訊處理操作中,但本發明並不局限於此。換句話說,除了以物件為主的音訊處理操作之外,音言卂編碼方法及裝置以及音訊解碼方法及裝置可以用於各種信號處理操作中。
圖1顯示了一典型以物件為主的音訊編碼/解碼系統的方塊圖。通常,輸入至一以物件為主的音訊編碼裝置的音訊信號與一多聲道信號的聲道不相對應,而是都為獨立物件信號。在這一點上,一以物件為主的音訊編碼裝置不同於一多聲道音訊編碼裝置,在多聲道音訊編碼裝置中會輸入一多聲道信號的聲道信號。
舉個例子,如一5.1聲道信號的一前左聲道信號和一前右聲道信號的聲道信號可以輸入至一多聲道音訊信號,但是,如一人聲或者一樂器聲音(例如,一小提琴或者一鋼琴的聲音)的物件信號,該物件信號與聲道信號相比為更小的實體,可以輸入至一以物件為主的音訊編碼裝置。
參考圖1,以物件為主的音訊編碼/解碼系統包括:一以物件為主的音訊編碼裝置以及一以物件為主的音訊解碼裝置。該以物件為主的音訊編碼裝置包括一物件編碼器100,並且該以物件為主的音訊解碼裝置包括一物件解碼器111和一混合器/渲染裝置(mixer/renderer)113。
該物件編碼器100接收N個物件信號,並產生一以物件為主的一個或多個聲道的降混信號以及輔助資訊,該輔助資訊包含從N個物件信號擷取的許多條資訊,該N個物件信號例如能量差異
資訊(energy different information)、相位差異資訊(phase difference information)以及相關性資訊(correlection information)。該輔助資訊和以物件為主的降混信號合併成一單一位元串流,而且該位元串流傳輸至以物件為主的解碼裝置內。
該輔助資訊可以包括一旗標,用以說明是否執行音訊編碼或者以物件為主的音訊編碼,並因此,可以確定在輔助資訊的基礎上,是否執行以聲道為主的音訊編碼或者以物件為主的音訊編碼。該輔助資訊業可以包括能量資訊(energy information)、分組資訊(grouping information)、靜音期資訊(silent period information),降混增益資訊(downmix gain information)以及涉及物件信號的延遲資訊(delay information)。
該輔助資訊和以物件為主的降混信號可以合併成一單一位元串流,並且單一位元串流可以傳輸至以物件為主的音訊解碼裝置。
該物件解碼器111從以物件為主的音訊編碼裝置接收以物件為主的降混信號和輔助資訊,並在以物件為主的降混信號以及輔助資訊的基礎上,復原物件信號,該物件信號具有與N個物件信號相似的性質。物件解碼器111產生的物件信號仍然沒有在一多聲道空間內分配至任何位置。因此,該混合器/渲染器113將物件解碼器111產生的每個物件信號分配至一多聲道空間內的一預定位置並確定物件信號的位階,從而物件信號能夠通過混合器/渲染器113,參考由混合器/渲染器113所確定的獨立相應位階,從各自相應位置中復原。
與物件解碼器111產生的每個物件信號有關的控制資訊(control information)可以隨時間變化,並因此,物件解碼器111產生的物件信號的空間位置和位階可以根據該控制資訊變化。
圖2顯示了本發明第一實施例中一音訊解碼裝置120的方塊圖。參考圖2,音訊解碼裝置120可以能夠通過分析控制資訊進行自適應解碼(adaptive decoding)。
參考圖2,該音訊解碼裝置120包括:一物件解碼器121,一
混合器/渲染器123,以及一參數轉換器125。該音訊加碼裝置120也可以包括一信號分離器(圖中未示),其從輸入的一位元串流中擷取一降混信號和輔助資訊,並且應用至本發明其他實施例中的音訊解碼裝置。
該物件解碼器121在一降混信號和由參數轉換器125提供的修正輔助資訊的基礎上產生許多物件信號。該混合器/渲染器123將物件解碼器121產生的每個物件信號分配至一多聲道空間內的一預定位置並根據控制資訊確定物件解碼器121所產生的物件信號的位階。該參數轉換器125通過合併輔助資訊和控制資訊產生修正輔助資訊。然後,該參數轉換器125將該修正輔助資訊傳輸至物件解碼器121。
該物件解碼器121可以能夠在修正輔助資訊內通過分析控制資訊執行自適應解碼。
例如,如果該控制資訊顯示出一第一物件信號和一第二物件信號分配至一多聲道空間內的相同位置並具有相同的位階,則一典型音訊解碼裝置可以分別對第一物件信號和第二物件信號進行解碼,並因此通過一混合器/渲染裝置操作在一多聲道空間內排列解碼後的信號。
在另一方面,音訊解碼裝置120的物件解碼器121從輔助資訊內的控制資訊瞭解到,第一物件信號和第二物件信號分配到一多聲道空間內相同的位置並具有相同的位階,如同兩個物件信號為一單一聲源。因此,物件解碼器121對第一物件信號和第二物件信號依照一單一聲源處理而沒有分別對兩者進行解碼。結果,解碼的複雜度降低。另外,由於需要處理的聲源的數量減少,混合/渲染得複雜度也降低。
當物件信號的數量大於輸出聲道的數量的時候,該音訊解碼裝置120可以有效地利用,因為複數個物件信號很有可能分配到相同的空間位置。
另一方式是,當第一物件信號和第二物件信號分配至一多聲
道空間內的相同位置但具有不同的位階的時候,該音訊解碼裝置120可以利用。在這個情況下,該音訊解碼裝置120將第一物件信號和第二物件信號作為一單一信號處理,對兩個物件信號進行解碼,而非對第一物件信號和第二物件信號分別解碼並將解碼後的信號傳輸至混合器/渲染器123的操作。尤其特別地,該物件解碼器121可以從修正後的輔助資訊內的控制資訊中獲取與在第一物件信號和第二物件信號的位階間差異有關的資訊,並期望在獲取的資訊基礎上對第一物件信號和第二物件信號進行解碼。結果,即使第一物件信號和第二物件信號具有不同的位階,但第一物件信號和第二物件信號可以如同一單一音源一樣進行解碼。
再另一方式是,該物件解碼器121可以根據控制資訊調整物件解碼器121產生的物件信號的位階。然後,該物件解碼器121可以對位階調整後的物件信號進行解碼。因此,該混合器/渲染器123不需要調整物件解碼器121提供的解碼物件信號的位階,但僅僅在一多聲道空間內排列物件解碼器121提供的解碼物件信號。簡而言之,因為物件解碼器121根據控制資訊調整物價解碼器121所產生的物件信號的位階,則該混合器/渲染器123能夠隨意地在一多聲道空間內排列物件解碼器121所產生的物件信號,而不需要額外調整物件解碼器121產生的物件信號的位階。因此,可以降低混合/渲染的複雜度。
根據圖2中所示的實施例,音訊解碼裝置120的物件解碼器能夠自適應地通過分析控制資訊,完成一解碼操作,從而降低了解碼的複雜度和混合/渲染的複雜度。可以使用通過音訊解碼裝置120執行的上述結合方法。
圖3顯示了本發明第二實施例中一音訊解碼裝置的方塊圖。參考圖3,該音訊解碼裝置130包括一物件解碼器131和一混合器/渲染器133。該音訊解碼裝置130的特點在於不僅僅將輔助資訊提供給物件解碼器131,而且還提供給混合器/渲染器133。
即使當與一靜音期對應的一物件信號的存在時候,該音訊解
碼裝置130可以有效地執行一解碼操作。舉個例子,第二至第四物件信號可以對應一音樂播放期(music play period),在該期間播放一樂器,並且一第一物件信號可以與一啞音期(mute period)對應,在該期間,僅僅播放背景音樂,而一第一物件信號可以與一靜音期(silent period)對應,在該期間,播放伴奏。在這個情況下,代表與一靜音期對應的複數個物件信號中的物件信號資訊可以包含在附加資訊中,並且該附加資訊可以提供至混合器/渲染器133而且提供至物件解碼器131。
該物件解碼器131可以通過不對靜音期對應的一物件信號進行解碼,從而降低解碼的複雜性。該物件解碼器131將一物件信號對應設定為數值0,並將該物件信號的位階傳輸至混合器/渲染器133。通常,具有數值0的物件信號與具有其他數值的物件信號同等處理,並因此進一步進行一混合/渲染操作。
另一方面,該音訊解碼裝置130將輔助資訊傳輸至混合器/渲染器133,該輔助資訊包含代表複數個物件信號中與一靜音期對應的的物件信號資訊,並可以因此防止與靜音期對應的一物件信號進行混合器/渲染器133所提供的一混合/渲染操作。因此,該音訊解碼裝實130能夠制止混合/渲染操作中不必要的複雜度的增加。
圖4顯示了本發明第三實施例中一音訊解碼裝置140的方塊圖。參考圖4,該音訊解碼裝置140利用一多聲道解碼器141,而非一物件解碼器和一混合器/渲染裝置,並在物件信號適當地排列在一多聲道空間內之後對一定量的物件信號進行解碼。
尤其特別地,該音訊解碼裝置140包括多聲道解碼器141和一參數轉換器145。該多聲道解碼器141產生一多聲道信號,其物件信號已經在一降混信號和空間參數資訊(spatial parameter information)的基礎上,在一多聲道空間內排列,該多聲道信號是參數轉換器145提供的以聲道為主的參數資訊。該參數轉換器145分析通過一音訊編碼裝置(圖中未示)傳輸的輔助資訊和控制資訊,並在分析結果的基礎上產生空間參數資訊。尤其特別地,該
參數轉換器145通過合併輔助資訊和控制資訊產生空間參數資訊,這裏,該控制資訊包括重放資訊和混合資訊。也就是說,該參數轉換器145將輔助資訊和控制資訊合併後執行轉換為與一至二(OTT)匣或者二至三(TTT)匣對應的空間資料。
該音訊解碼裝置140可以執行一多聲道解碼操作,在該操作中,一以物件為主的解碼操作和一混合/渲染操作共同執行並可以因此跳過每個物件信號的解碼操作。因此,可以減少解碼和/或混合/渲染的複雜度。
舉個例子,當在10個物件信號的基礎上,獲取到10個物件信號以及一多聲道信號需要通過一5.1聲道揚聲器系統重現的時候,一典型的以物件為主的音訊解碼裝置在一降混信號和輔助資訊的基礎上,分別產生與1個物件信號對應的解碼信號並通過在一多聲道空間內適當地安排10個物件信號,進而產生一5.1聲道信號,從而物件信號能夠適用於一5.1聲道揚聲器環境。然而,不能有效地在一5.1聲道信號產生過程中產生10個物件信號,並且隨著物件信號的數量以及產生的多聲道信號的聲道數量間差異的增加,這個問題變得更加嚴重。
另一方面,在圖4中所示的實施例中,該音訊解碼裝置140載輔助資訊和控制資訊的基礎上產生適合一5.1聲道信號的空間參數資訊,並將空間參數資訊和一降混信號提供至多聲道解碼器141。然後,該多聲道解碼器141在空間參數資訊和降混信號的基礎上,產生一5.1聲道信號。換句話說,當需要輸出的聲道數量是5.1聲道,該音訊解碼裝置140能夠在一降混信號的基礎上,方便地產生一5.1聲道信號而不需要產生10個物件信號,並且因此與一現有音訊解碼裝置相比,在複雜性上更加有效
當需要計算空間參數資訊的計算量少於在解碼每個物件信號之後的一混合/渲染所需的計算量的時候,該音訊解碼裝置140被認為很有效,這裏,空間參數資訊與每個OTT匣和TTT匣對應並通過分析一音訊編碼裝置傳輸的輔助資訊和控制資訊進行計算。
該音訊解碼裝置140可以方便地通過將輔助資訊和控制資訊分析得來的用於產生空間參數資訊的一模組加入一典型多聲道音訊解碼裝置而獲得,並且因此可以保留與一典型多聲道音訊解碼裝置的相容性。又,該音訊解碼裝置140可以利用一典型多聲道音訊解碼裝置的現有工具,提高聲音的品質,該典型多聲道音訊解碼裝置的現有工具如一包絡整形器(envelope shaper)、一子帶時序處理(STP)工具以及一解聯器(decorrelator)。已知如此,可以總結為一典型多聲道音訊解碼方法的全部優勢能夠方便地在一物件音訊解碼方法上應用。
通過參數轉換器145傳輸至多聲道解碼器141的空間參數資訊可能已經被壓縮,從而使用於傳輸。另一方式是,該空間參數資訊可以具有與一典型多聲道編碼裝置所傳輸的資料相同的格式。即,該空間參數資訊可能已經經過一Huffman解碼操作或者一引導解碼操作,並可能因此作為未壓縮的空間提示資料傳輸至每個模組。前者適於將空間參數資訊傳輸至一遠端位置內的多聲道音訊解碼裝置,而後者比較方便,原因是一多聲道音訊解碼裝置不需要將壓縮的空間提示資料轉換為非壓縮空間提示資料,其能夠方便地在一解碼操作中使用。
在輔助資訊和控制資訊的分析的基礎上,空間參數資訊的配置可能引起一延遲。為了補償這個延遲,可以為一降混信號提供一附加的緩衝器,使得降混信號和一位元串流間的延遲能夠被補償。另一方式是,可以為從控制資訊中獲取的空間參數資訊提供一附加緩衝器,使得空間參數資訊和一位元串流之間的一延遲可以被補償。這些方法,無論如何,都因為需要提供一附加緩衝器而變得不方便。另一方式是,考慮到一降混信號和空間參數資訊間的延遲發生的可能性,可以在一降混信號前面傳輸輔助資訊。
這個情況下,通過將輔助資訊和控制資訊合併獲得的空間參數資訊不需要調整就可以方便地使用。
如果一降混信號的複數個物件信號具有不同的位階,一任意
降混增益(ADG)模組可以確定物件信號相關位階,該任意降混增益(ADG)模組能夠直接補償降混信號,並且每一個物件信號都可以利用空間提示資料分配至一多聲道空間內的一預定位置,該空間提示資料如聲道位階差異(CLD)資訊、聲道間關聯(ICC)資訊以及聲道預測係數(CPC)資訊。
舉個例子,如果控制資訊指出一預定物件信號要分配至一多聲道空間內的一預定位置,並比其他物件信號具有一較高位階,則一典型多聲道解碼器就可以計算降混信號的聲道能量間的差異,並將降混信號在計算結果的基礎上劃分為許多輸出聲道。然而,一典型多聲道解碼器在一降混信號內不能提高或者降低一某種聲音的音量。換句話說,一典型多聲道解碼器方便地將一降混信號分配至數個輸出聲道,並因此可以提高或者降低降混信號內的一聲音的音量。
根據控制資訊,將一物件編碼器所產生的一降混信號的數個物件信號中的每一個進行相對方便地分配至一多聲道空間內的一預定位置上。然而,在加大或者減小一預定物件信號的振幅上需要特殊的技術。換句話說,如果使用一物件編碼器所產生的一降混信號,則很難減小降混信號的每個物件信號的振幅。
因此,根據本發明的實施例,物件信號的相對振幅可以根據控制資訊,通過利用如圖5所示的一ADG模組147進行變化。該ADG模組147可以安裝至多聲道解碼器141內或者可以獨立於多聲道加碼器141。
如果一降混信號的物件信號的相對振幅利用ADG模組147進行適當地調整,則可以執利用一典型多聲道解碼器完成物件解碼。如果一物件編碼器產生的一降混信號是一單聲道或者立體聲信號或者一具有三個以上聲道的多聲道信號,則降混信號可以通過ADG模組147進行處理。如果一物件編碼器產生的一降混信號具有兩個或兩個以上的聲道,並且需要通過ADG模組147調整的一預定物件僅僅存在於降混信號的聲道中一個聲道內,則該ADG
模組147可以僅僅應用於包含預定物件信號的聲道,而不是應用於降混信號的全部聲道。上述方式中通過ADG模組147處理的一降混信號可以利用一典型多聲道解碼器進行簡便處理而不需要改進多聲道解碼器的結構。
儘管當一最終輸出信號不是一可以通過多聲道揚聲器還原的多聲道信號,而是一雙耳聲道道信號的時候,ADG模組147仍可以用於調整最終輸出信號的物件信號的相對振幅。
對於ADG模組147的替換使用,指定一增益值的增益資訊應用於每個物件信號,並可以在數個物件信號的產生過程中,包含在控制資訊內。為此,一典型多聲道解碼器的結構可以得到修正。儘管需要對一當前多聲道解碼器的結構進行修正,但這個方法在一解碼操作中,通過將一增益數值應用於每個物件信號中,而不需要計算ADG和補償每個物件信號,這就便於降低解碼的複雜性。
該ADG模組147不僅僅可以用於調整物件信號的位階也可以用於修正一特定物件信號的頻譜資訊。尤其特別地,該ADG模組147不僅僅可以用於提高或者降低一特定物件信號的位階而且可以用於修正該特定物件信號的頻譜資訊,例如增強該特定物件信號的一高-或-低-音調部分。修正頻譜資訊而不利用ADG模組147是不可能的。
圖6顯示了本發明第四實施例中一音訊解碼裝置150的方塊圖。參考圖6,該音訊解碼裝置150包括一多聲道雙耳聲道道解碼器151、一第一參數轉換器157以及一第二參數轉換器159。
該第二參數轉換器159分析輔助資訊和由一音訊編碼裝置提供的控制資訊,並根據分析的結果配置空間參數資訊。該第一參數轉換器157配置虛擬三維(3D)參數資訊,該3D參數資訊可以用在多聲道雙耳聲道道解碼器151內,配置的方式是通過將如頭部相關轉移函數(HRTF)參數的三維(3D)資訊加入空間參數資訊中而實現。該多聲道雙耳聲道道解碼器151通過將雙耳聲道
參數資訊應用於一降混信號而產生一雙耳聲道信號。
該第一參數轉換器157和第二參數轉換器159可以用一單一模組替代,亦即一參數轉換模組155,該參數轉換模組155接收輔助資訊、控制資訊以及3D資訊並在輔助資訊、控制資訊以及HRTF參數的基礎上配置雙耳聲道參數資訊。
傳統上,為了在一耳機中產生用於播放包含10個物件信號的一降混信號的一雙耳聲道信號,一物件信號必須在降混信號和輔助資訊的基礎上分別產生10個解碼信號對應10個物件信號。其後,一混合器/渲染裝置將10個物件信號中的每個物件信號,參考控制資訊,分配至一多聲道空間內的一預定位置,從而適用於一5-聲道揚聲器環境。其後,該混合器/渲染裝置產生可以用一5-聲道揚聲器還原的一5-聲道信號。其後,該混合器/渲染裝置將3D資訊應用至5-聲道信號,進而產生一2-聲道信號。簡言之,上述傳統的音訊解碼方法包括:還原10個物件信號,將10個物件信號轉換為一5-聲道信號,以及在該5-聲道信號的基礎上產生一2-聲道信號,而這個方法效率低。
另一方面,該音訊解碼裝置150可以容易地產生一雙耳聲道信號,其可以在物件信號的基礎上利用一耳機還原。另外,該音訊解碼裝置150通過對輔助資訊和控制資訊的分析配置空間參數資訊,並可以因此利用一典型多聲道雙耳聲道解碼器產生一雙耳聲道信號。此外,當接受輔助資訊、控制資訊以及HRTF參數的之參數轉換器併入為該音訊解碼裝置150之裝備時,其仍可以利用一典型多聲道雙耳聲道解碼器,並依據該輔助資訊、控制資訊以及HRTF參數來設定雙耳參數資訊。
圖7顯示了本發明第五實施例中一音訊解碼裝置160的方塊圖。參考圖7,該音訊解碼裝置160包括一前處理器161、一多聲道解碼器163以及一參數轉換器165。
該參數轉換器165產生空間參數資訊,其可以在多聲道解碼器163中使用,也可以產生參數資訊,其可以在前處理器161中
使用。該前處理器161在一降混信號上執行一前處理操作,並將前處理操作過的一降混信號傳輸至多聲道解碼器163。該多聲道解碼器163在該降混信號上利用前處理器161執行一解碼操作,藉以輸出一立體聲信號、一雙耳聲道立體聲信號或者一多聲道信號。通過前處理器161進行前處理操作的實例包括在一時域(time domain)或者一頻域(frequency domain)內利用濾波對一降混信號進行修正或者轉換。
如果輸入至音訊解碼裝置160的一降混信號是一立體聲信號,則該降混信號可以在前處理器161內進行降混前處理,這個操作是在該降混信號輸入多聲道解碼器163之前完成,這樣處理的原因是多聲道解碼器163不能通過解碼將與一立體聲降混信號的左聲道對應的物件信號映射至一多聲道信號的一右聲道。因此,為了將屬於一立體聲降混信號的左聲道的物件信號遷移至一右聲道,該立體聲降混信號可能需要經過前處理器161的前處理,並且前處理過的降混信號可以輸入至多聲道解碼器163內。
一立體聲降混信號的前處理可以在輔助資訊和控制資訊得出的前處理資訊的基礎上實現。
圖8顯示了本發明第六實施例中一音訊解碼裝置170的方塊圖。參考圖8,該音訊解碼裝置170包括一多聲道解碼器171、一後處理器173以及一參數轉換器175。
參數轉換器175產生可被多聲道解碼器171利用之空間參數資訊,亦產生可被後處理器173利用的參數資訊,該後處理器173在一多聲道解碼器171輸出的信號執行一後處理(post-processing)操作。該多聲道解碼器171輸出的信號例子包含了一立體聲信號、一雙耳的立體聲信號或一多聲道信號。
後處理器173執行的後處理操作的實例包括:對輸出信號的全部聲道或者每個聲道進行修正以及轉換。舉個例子,如果輔助資訊包括關於一預定物件信號的基本頻率資訊,則後處理器173可以從預定物件信號中參考基本頻率資訊去除諧波分量。一多聲
道音訊解碼方法不能有效地在一卡拉OK錄音系統中使用。然而,如果關於聲音物件信號的基本頻率資訊包含在輔助資訊,並且聲音物件信號的諧波分量在一後處理操作中去除,可以利用圖8中所示的實施例實現一高性能卡拉OK錄音系統。圖8中所示的實施例也可以用於除了聲音物件信號之外的物件信號。舉個例子,可以通過利用圖8中所示的實施例去除一預定樂器的聲音。又,可以利用關於物件信號的基本頻率資訊,通過圖8中所示的實施例,放大預定的諧波分量。簡單地說,後處理參數可以達到各種效果,如一插入回響效果、增加雜訊以及放大低音調部分,以上都不能通過多聲道解碼器171實施。
該後處理器173可以直接將一附加效果應用於一降混信號或者將一降混信號加入已經在多聲道解碼器171中應用的效果。無論是否必要,該後處理器173可以改變一物件的頻譜或者修正一降混信號。如果不合適直接執行如一降混信號上的回響的效果處理操作並將效果處理操作中獲得的一信號傳輸至多聲道解碼器171,該後處理器173可以簡化地將效果處理操作獲得的信號加入多聲道解碼器171的輸出中,而非在降混信號上直接進行效果處理並將效果處理的結果傳輸至多聲道解碼器171的操作。
圖9顯示了本發明第七實施例中一音訊解碼裝置180的方塊圖。參考圖9,該音訊解碼裝置180包括一前處理器181、一多聲道解碼器183、一後處理器185以及一參數轉換器187。
前處理器161的描述直接應用於前處理器181上。該後處理器185可以用於添加前處理181的輸出以及多聲道解碼器183的輸出,並因此提供一最終信號。在這個情況下,該後處理器185只當作用以加成信號的一加法器。一效果參數可以提供至執行一效果應用的前處理器181或者後處理器185。另外,將一效果應用至一降混信號所獲得的一信號加成到多聲道解碼器183的輸出,以及一效果應用至多聲道解碼器183可以同時進行。
圖7和圖9所示的前處理器161和181可以根據使用者所提
供的控制資訊在一降混信號上執行渲染操作。另外,圖7和圖9中所示的前處理器161和181可以增加或者降低物件信號的位階以及改變物件信號的頻譜。在這個情況下,圖7和圖9所示的前處理器161和181可以執行一ADG模組的功能。
根據物件信號的方向資訊(direction information),一物件信號的渲染操作、物件信號的位階調整以及物件信號的頻譜改變可以同時進行。另外,一些與物件信號的方向資訊有關的物件信號的渲染操作、物件信號的位階調整操作以及物件信號頻譜的改變操作可以通過使用前處理器161或者181完成,並且無論是與物件信號的方向資訊有關的物件信號的渲染操作,物件信號的位階調整操作還是物件信號頻譜的改變操作,未被前處理器161或者181完成的,都可以利用一ADG模組完成。舉個例子,利用一ADG模組完成一物件信號的頻譜改變不是很有效率,在該操作中,利用一量子化位階間隔和一參數帶間隔。在這個情況下,該前處理器161或者181可以用於在一逐頻(frequency-by-frequency)基礎上精密地改變一物件信號的頻譜,而且一ADG模組可以用於調整物件信號的位階。
圖10顯示了本發明第八實施例中一音訊解碼裝置的方塊圖。參考圖10,該音訊解碼裝置200包括一渲染矩陣產生器201(rendering matrix generator)、一轉碼器(transcoder)203、一多聲道解碼器205、一前處理器207、一效果處理器208以及一加法器209。
該渲染矩陣產生器201產生一渲染矩陣,其代表關於物件信號的物件位置資訊以及關於物件信號位階的重放配置資訊,並將渲染矩陣提供給轉碼器203。該渲染矩陣產生器201在物件位置資訊的基礎上產生3D資訊,如一HRTF係數。一HRTF是一轉換函數,其描述了在一任意位置之音源與耳膜間的聲波傳輸,並且回傳一數值,該數值根據音源的方向和高度而變化。如果一不具有方向性的信號利用HRTF進行濾波,則可以像從一特定方向再生
一樣聽到該信號。
渲染矩陣產生器201所接收到的該物件位置資訊和播放配置資訊可以隨著時間變化並可以由一最終使用者提供。
該轉碼器203在以物件為主的輔助資訊、渲染矩陣以及3D資訊的基礎上,產生以聲道為主的輔助資訊,並將多聲道解碼器205所必需的以聲道為主的輔助資訊和3D資訊提供給多聲道解碼器205。即,該轉碼器203傳送關於從N個物件信號的以物件為主的參數資訊所獲得的M個聲道之以聲道為主的輔助資訊和N個物件信號中每個信號的3D資訊至多聲道解碼器205。
該多聲道解碼器205在轉碼器203提供的一降混信號和以聲道為主的輔助資訊的基礎上,產生一多聲道音訊信號,並根據3D資訊在多聲道音訊信號的基礎上執行3D渲染,從而產生一3D多聲道信號。該渲染矩陣產生器201可以包括一3D資訊資料庫(圖中未示)。
如果在將多聲道解碼器205輸入降混信號輸入之前,存在需要前處理一降混信號,則轉碼器203將關於前處理的資訊傳輸至前處理器207。該以物件為主的輔助資訊包括關於全部物件信號的資訊,並且該渲染矩陣包括物件位置資訊以及重放配置資訊。該轉碼器203可以在以物件為主的輔助資訊和渲染矩陣產生以聲道為主的輔助資訊,並因此根據聲道資訊產生用於混合和重現物件信號所必須的以聲道輔助資訊。其後,該轉碼器203將以聲道為主的輔助資訊傳輸至多聲道解碼器205。
由轉碼器203提供的以聲道為主的輔助資訊和3D資訊可以包括圖框索引。因此,該多聲道解碼器205可以通過利用圖框索引同步以聲道為主的輔助資訊和3D資訊,並且因此能夠僅僅將3D資訊應用至一位元串流的特定圖框。另外,即使3D資訊得到更新,可以方便地利用圖框索引同步以聲道為主的輔助資訊和更新的3D資訊。即,圖框索引可以分別包含在以聲道為主的輔助資訊和3D資訊,目的是使多聲道解碼器205同步以聲道為主的輔助資
訊和3D資訊。
該前處理器207可以對一輸入降混信號進行前處理。如果有必要,在輸入降混信號輸入至多聲道解碼器205之前,如上面所描述地,如果輸入的降混信號是一立體聲信號,並且需要從左聲道重放屬於右聲道的一物件信號,則降混信號可以在輸入多聲道解碼器205之前可能已經經過前處理,原因是多聲道解碼器205不能將一物件信號從一個聲道遷移至另一個聲道。前處理該輸入降混信號所必須的資訊,可以通過轉碼器203提供至前處理器207。經前處理器207前處理過的一降混信號,可以傳輸至多聲道解碼器205。
該效果處理器208和加法器209可以直接將一附加效果應用至一降混信號,或者將一降混信號加入已經應用了效果的多聲道解碼器205的輸出上。無論什麼時候有必要,該效果處理器208可以改變一物件的頻譜或者修正一降混信號。如果不合適在一降混信號上直接應用一效果處理,該處理如回響,並且將效果處理後獲取的一信號傳輸至多聲道解碼器205,則效果處理器208可以簡化地將效果處理操作所獲得的信號加入多聲道解碼器205的輸出,而非直接在降混信號上,進行效果處理的操作並將效果處理後的結果傳輸至多聲道解碼器205。
在渲染矩陣產生器201產生的一渲染矩陣將在下文中進行詳細描述。
一渲染矩陣是一矩陣,其代表物件信號的位置和播放配置。
即,如果存在N個物件信號和M個聲道,則一渲染矩陣可以包括N個物件信號如何以各種形式映射在M個聲道上。
尤其特別地,當N個物件信號映射在M個聲道上的時候,可以產生一N*M渲染矩陣。在這個情況下,該渲染矩陣包括N行,其分別代表N個物件信號,以及M列,其分別代表M個聲道。N行中的每行內的M個係數中的每一個係數可以為一實數或者一整數,代表分配至一對應聲道的一部分物件信號與完整物件信號的
比例。
尤其特別地,N*M渲染矩陣的N行中的每行內的M個係數可以為實數。因此,如果N*M渲染矩陣的一行內的M個係數的總和等於一預先確定的參考數值,舉個例子,1,該參考數值可以利用已經變化的一物件信號的位階進行確定。如果M個係數的總和大於1,可以確定物件信號的位階已經增加。該預定參考數值可以為除了1的一數位數值。物件信號的位階變化的數量可以限制在12dB的範圍。舉個例子,如果預定參考數值為1並且M個參數的總和為1.5,可以確定物件信號的位階已經增加了12dB。如果預定參考數值為1並且M個係數的總和為0.5至1.5,可以確定物件信號已經在-12dB和+12dB之間變化了一預定數量,並且根據M個係數的總和,該預定數量可以確定為線性。
N*M渲染矩陣的N行中每行內的M個係數可以為整數。然後,如果N*M渲染矩陣的一行內的M個係數的總和等於一預定數值,例如10、20、30或者100,則可以確定一物件信號的位階已經改變。如果M個係數的總和小於預先確定的參考數值,則可以確定物件信號的位階已經減少。如果M個係數的總和大於預先確定的參考數值,則可以確定物件信號的位階已經增加。物件信號的位階變化的數量可以限制在如12dB的範圍內。M個係數的總和與預先確定的參考數值的差異數量可以代表物件信號已經變化的位階的數量(單位:dB)。舉個例子,如果M個係數的總和是一個大於預定參考數值的數值,可以確定物件信號的位階可以確定已經增加了2dB。因此,如果預定參考數值是20並且M個係數的總和為23,可以確定物件信號的位階已經增加了6dB。如果預定的參考數值為20並且M個係數的總和為15,可以確定物件信號的位階已經降低了10dB。
舉個例子,如果存在六個物件信號和五個聲道(例如,前左(FL)、前右(FR)、中心(C)、後左(RL)和後右(RR)聲道),則可以產生具有與六個物件信號分別對應的六行以及與五個聲道
分別對應的五列的一6*5渲染矩陣,則該6*5渲染矩陣的係數可以為整數,代表在五個聲道中六個物件信號中每個物件信號的分配比例。該6*5渲染矩陣可以具有的一參考數值為10。因此,如果6*5渲染矩陣得六行中任意一行內的五個係數的總和等於10,則可以確定一對應物件信號的位階還沒有改變。6*5渲染矩陣的六行中任意一行內的五個係數的總和與參考數值之間差異的數量代表一對應物件信號的已經變化位階的數量。舉個例子,如果6*5渲染矩陣得六行中任意一行內的五個係數的總數與參考數值的差異為1,可以確定一對應物件信號的位階已經變化了2dB。該6*5渲染矩陣可以用方程式(1)表示:
參考方程(1)的6*5渲染矩陣,該第一行與第一物件信號對應,並代表第一物件信號在FL、FR、C、RL以及RR聲道間分配的比例。當第一行的第一係數具有一最大整數值3,並且第一行的係數總和為10,則可以確定第一物件信號主要分配至FL聲道,而且第一物件信號的位階仍然沒有變化。當對應第二物件信號的第二行的第二係數具有一最大整數值4,並且第二行的係數總和為12,可以確定第二物件信號主要分配至FR聲道,而且第二物件信號的位階已經增加了4dB。當對應第三物件信號的第三行的第三係數具有一最大整數值12,並且第三行的係數總和為12,可以確定第三
物件信號僅僅分配至C聲道,而且第三物件信號的位階已經增加了4dB。當對應第五物件信號的第五行的全部係數都具有相同的整數值2,並且第五行的係數總和為10,可以確定第五物件信號在FL、FR、CRL和RR聲道間均勻地分配,並且第五物件信號的位階仍然沒有變化。
另一方式是,當N個物件信號映射至M個聲道的時候,可以產生一N*(M+1)渲染矩陣。一N*(M+1)渲染矩陣與一N*M渲染矩陣非常相似。尤其特別地,在一N*(M+1)渲染矩陣內,類似於在一N*M渲染矩陣內,N行內的每行內的第一至第M係數代表一對應物件信號在FL,FR,C,RL和RR聲道間分配的比例。然而,一N*(M+1)渲染矩陣,不同於一N*M渲染矩陣,具有代表物件信號的位階的一附加列(例如,一第(M+1)列)。
一N*(M+1)渲染矩陣,不同於一N*M渲染矩陣,指出一物件信號在M個聲道中如何分配,並且個別物件信號的位階是否已經變化。因此,通過利用一N*(M+1)渲染矩陣,即便在不需要附加計算的物件信號的位階內,也可以方便地獲取關於一變化的信息。當一N*(M+1)渲染矩陣基本與一N*M渲染矩陣相同,一N*(M+1)渲染矩陣在不需要附加計算的條件下可以方便地轉換為一N*M渲染矩陣,反之亦然。
另一方式是,當N個物件信號映射至M個聲道的時候,可以產生一N*2渲染矩陣。該N*2渲染矩陣具有代表物件信號的角位元的一第一列以及代表一變化的一第二列,即便在每個物件信號的位階內。該N*2渲染矩陣可以代表在範圍0-360度內1或3度等間隔處的物件信號的角位置。在全部方位間均勻分配的一物件信號可以用一預先確定數值代表,而不用一角度代表。
一N*2渲染矩陣可以轉換為一N*3渲染矩陣,其不但可以代表物件信號的2D方向而且可以代表物件信號的3D方向。尤其特別地,一N*3渲染矩陣的一第二列可以用於代表物件信號的3D方向。一N*3渲染矩陣的一第三列代表一變化,即便在每個物件信號
的位階內使用與一N*M渲染矩陣內所用的相同的方法。如果一物件解碼器的一最終播放模式是雙耳聲道立體聲,則該渲染矩陣產生器201可以傳輸代表每個物件信號的位置的3D資訊或者對應3D資訊的一索引。在後面的情況內,該轉碼器203可能需要具有與渲染矩陣產生器201傳輸的一索引的3D資訊。另外,如果從渲染矩陣產生器201中獲取代表每個物件信號的位置的3D資訊,則該轉碼器203能夠在所獲取的3D資訊、一渲染矩陣少及以物件為主的輔助資訊的基礎上計算可在多聲道解碼器205中使用的3D資訊。
一渲染矩陣和3D資訊可以根據一最終使用者在物件位置資訊和播放配置資訊上做出的一修正適應性地即時變化。因此,關於渲染矩陣和3D資訊是否更新,即便是在渲染矩陣和3D資訊內的更新,都可以傳輸至等間隔時間處的轉碼器203,舉個例子,在0.5秒間隔處。然後,如果在渲染矩陣和3D資訊內發現更新,渲染矩陣和3D渲染矩陣隨時間線性變化,則轉碼器203可以在獲取的更新和現有的渲染矩陣以及現有的3D資訊上執行線性轉換。
如果當一渲染矩陣和3D資訊傳輸至轉碼器203,一最終使用者還沒有修正物件位置資訊和播放配置資訊,則代表仍沒有變化的渲染矩陣和3D資訊的資訊傳輸至轉碼器203。另一方面,如果當一渲染矩陣和3D資訊傳輸至轉碼器203,物件位置資訊和播放配置資訊已經被一最終使用者修正,則代表已經變化的渲染矩陣和3D資訊的資訊以及渲染矩陣和3D資訊內更新的資訊可以傳輸至轉碼器203。尤其特別地,渲染矩陣內的更新和3D資訊內的更新可以獨立地傳輸至轉碼器203。另一方式是,渲染矩陣內的更新和/或3D資訊內的更新可以選擇性地通過一預定代表數值代表。然後,該預定代表性數值可以隨著一資訊傳輸至轉碼器203,該資訊代表該預定代表性數值與渲染矩陣的更新或者3D資訊內的更新對應。在這個方式中,可以方便通知轉碼器203渲染矩陣和3D資訊是否已經更新。
一N*M渲染矩陣,像方程(1)指出的矩陣,也可以包括一附
加列,用於代表物件信號的3D方向。在這個情況下,該附加列可以將物件信號的3D方向表示為在範圍-90至+90度的角。該附加列可以不僅僅提供至一N*M矩陣而且提供至一N*(M+1)渲染矩陣和一N*2矩陣。可能在一多聲道解碼器的一標準解碼模式內利用物件信號的3D方向資訊並不必要。相反,可能在多聲道解碼器的一雙耳聲道模式中有必要使用物件信號的3D資訊。物件信號的3D方向資訊可以隨著一渲染矩陣傳輸。另一方式是,物件信號的3D方向資訊隨3D資訊傳輸。物件信號的3D方向資訊在一雙耳聲道模式解碼操作過程中不影響以聲道為主的輔助資訊但影響3D資訊。
關於空間位置的資訊和物件信號的位階可以提供為一渲染矩陣。另一方式是,關於空間位置的資訊和物件信號的位階可以代表為對物件信號的頻譜的修正,該修正如增強物件信號的低音部或者高音部。在這個情況中,關於物件信號的頻譜的修正資訊,可以當作一多聲道編碼解碼器內所用的每個參數帶內的變化傳輸。如果一最終使用者控制物件信號的頻譜的修正,則關於物件信號的頻譜的修正資訊,可以當作從一渲染矩陣分離出的一頻譜矩陣傳輸。該頻譜矩陣可以具有與物件信號一樣多的行以及具有與參數一樣的列。頻譜矩陣的每個係數代表關於每個參數帶位階調整的資訊。
其後,代碼轉換器203的運行將在下文進行詳細地描述。該轉碼器203在以物件為主的輔助資訊,渲染矩陣資訊和3D資訊的基礎上產生用於多聲道解碼器205的以聲道為主的輔助資訊,並且將以聲道為主的輔助資訊傳輸至多聲道解碼器205。另外,該轉碼器203用於多聲道解碼器205的3D資訊並將該3D資訊傳輸至多聲道解碼器205。如果一輸入降混信號需要在輸入至多聲道解碼器205之前進行前處理,則該轉碼器203可以傳輸關於輸入降混信號的資訊。
該轉碼器203可以以物件為主的輔助資訊,該輔助資訊說明複數個物件信號如何包含在一輸入降混信號內。該以物件為主的輔助資訊可以說明複數個物件信號通過利用一OTT匣和一TTT匣以
及利用CLD、ICC和CPC資訊如何包含在一輸入降混信號內。該以物件為主的輔助資訊可以提供出在一物件編碼器可能執行的各種方法的描述,用於說明關於複數個物件信號中的每個物件信號的資訊,並可能因此可以說明物件信號如何包含在輔助資訊內。
對於一多聲道編碼解碼器的一TTT匣,L、C和R信號可以降混或者升混為L和R信號的情況,在這個情況下,該C信號既可以共用少許位元的L也可以共用少許位元的R信號。然而,很少在降混或者升混物件信號的情況內發生。因此,一OTT匣被廣泛用於對物件代碼進行升混或者降混。即使一C信號包含一獨立信號成分,而不是部分L和R信號,一TTT匣可以用於在物件代碼上執行升混或者降混。
舉個例子,如果存在六個物件信號,該些六個物件信號可以通過一OTT匣轉換為一降混信號,關於每個物件信號的資訊可以通過利用一OTT匣獲取,如圖11所示。
參考圖11,六個物件信號可以通過一個降混信號和總計五個OTT匣211、213、215、217和219提供的資訊(如CLD和ICC資訊)表示出來。如圖11所示的結構可以以各種方式變化。即,參考圖11,該第一OTT匣211可以接收六個物件信號中的兩個物件信號。另外,OTT匣211、213、215、217和219分位階連接的方式可以自由地變換。因此,輔助資訊可以包括分級結構資訊,該結構資訊說明OTT匣211、213、215、217和219如何分位階地連接,還包括輸入位置資訊,該位置資訊說明每個物件信號輸入哪一個OTT匣。如果該OTT匣211、213、215、217和219形成一任意樹結構,則一多聲道編碼解碼器中使用並用於表示出一任意自由結構的一方法,可以用於說明這類分級結構資訊。另外,這類輸入位置資訊可以以各種方式說明。
輔助資訊也可以包括關於每個物件信號期間的一靜音期的資訊。在這個情況下,該OTT匣211、213、215、217和219的樹結構可以隨時間適應性變換。舉個例子,參考圖11,當第一物件信號
OBJECT1是靜音的時候,關於第一OTT匣211的資訊不必要。而且只有第二物件信號OBJECT2可以輸入至第四OTT匣217。因而,OTT匣211、213、215、217和219的樹結構可以因此變換。從而,關於一變換的資訊,即便是在OTT匣211、213、215、217和219的樹結構內,可以包括在輔助資訊內。
如果一預定物件信號為靜音,則說明與預定物件信號對應的一OTT匣的資訊不在使用範圍內,並且可以提供出說明從OTT匣中沒有可用提示的資訊。在這個方式中,可以通過不包含關於OTT匣或者TTT匣的資訊,從而減少輔助資訊的大小,該些不包含的OTT匣或者TTT匣資訊不可在輔助資訊內使用。即使複數個OTT匣或者TTT匣的一樹結構經過修正,但可以根據說明靜音的物件信號的資訊,方便地確定哪些OTT或者TTT匣開啟或者關閉。因此,不需要頻繁地傳輸關於修正的資訊,即便是傳輸至OTT或者TTT匣。相反,可以傳輸說明靜音的物件信號的資訊。然後,一解碼器可以方便地確定OTT或者TTT匣的樹結構哪一部分需要修正。因此,可以縮減需要傳輸至一解碼器的資訊的大小。另外,可以方便地將關於物件信號的提示傳輸至一解碼器。
圖12顯示了一圖表,用於解釋包含在一降混信號內的複數個物件信號。在圖11所示的實施例中,採用如圖所示的多聲道代碼的一OTT匣結構。然而,在圖12中所示的實施例中,使用多聲道代碼的一變換OTT匣結構。即,參考圖12,複數個物件信號輸入至每個匣,並且僅僅在最終產生一個降混信號。參考圖12,關於每一個物件信號的資訊可以通過每個物件信號的能量位階與物件信號的能量位階的總和的比例進行表示。然而,隨著物件信號數量的增加,每個物件信號的能量位階與物件信號能量位階總和的比例減少。為了解決這個問題,在一預定參數帶內搜索具有一最大能量位階的其中一個物件信號(下文稱為一最大能量物件信號),並且其他物件信號(下文稱為非最大能量物件信號)的能量位階與最大能量物件信號的能量位階的比例,可以提供為關於每
個物件信號的資訊。在這個情況下,一旦確定說明一最大能量物件信號的資訊和最大能量物件信號的能量位階的絕對值,則其他非最大能量物件信號的能量位階可以方便地確定。
一最高能量物件信號的能量位階,對於將複數個位元串流合併為在一多點控制單元(MCU)內執行的一單一位元串流是必要的。然而,在大多數情況下,一最高能量物件信號的能量位階不是必須的,這是因為一最高能量物件信號的能量位階的絕對值可以方便地從一個比例中獲取,該比例是其他非最高能量物件信號的能量位階與最高能量物件信號的能量位階的比值。
舉個例子,假設存在屬於一預定參數帶的四個物件信號A,B,C和D,這裏,物件信號A是一最高能量物件信號。然後,該預定參數帶的能量EP
和物件信號A的能量位階的絕對值EA
滿足方程式(2):
這裏,a、c和c分別代表物件信號B、C和D的能量位階與物件信號的能量位階的比例。參考方程式(2),可以在比例a、b和c以及預定參數帶的能量EP
的基礎上,計算出物件信號A的能量位階的絕對值EA
。因此,除非需要將複數個位元串流合併為一MCU所用的一單一位元串流,物件信號A的能量位階的絕對值EA
可以不需要包括在一位元串流內。代表物件信號A的能量位階的絕對值EA
是否包含在一位元串流內的資訊可以包含在該位元串流的一標題內,
進而減少位元串流的大小。
另一方面,如果需要通過利用一MCU將複數個位元串流合併為一MCU所用的一單一位元串流,則一最高能量物件信號的能量位階是必要的。在這個情況下,根據非最高能量位階物件信號的能量位階與一最高能量物件信號的能量位階的比例,計算得到的能量位階的總和可能與通過降混全部物件信號獲取的一降混信號的能量位階相同。舉個例子,當降混信號的能量位階是100的時候,計算得能量位階的總和可以為98或者103,這是由於,例如,在量化和逆量化操作過程中導致的誤差。為瞭解決這個問題,降混信號的能量位階和計算得到的能量位階的總和之間的差異可以適當地通過以一預定係數地增加每個計算的能量位階進而補償。如果降混信號的能量位階為X,計算得能量位階的總和為Y,則每個計算的能量位階可以乘以X/Y。如果降混信號的能量位階和計算得能量位階的總和之間的差異沒有補償,此種量化誤差可能包含在參數帶和圖框內,從而導致信號失真。
因此,說明在一預定參數帶內複數個物件信號中哪一個物件信號具有能量的一最高絕對值是必要的。這類資訊可以通過若干位元表示。說明一預定參數帶內複數個物件信號中哪一個物件信號具有能量的一最高絕對值的所需若干位元根據物件信號的數量改變。隨著物件信號數量的增加,說明一預定參數帶內複數個物件信號中哪一個物件信號具有能量的一最高絕對值的所需若干位元降低。位元的一預定數量可以提前分配,用於說明一預定參數帶內複數個物件信號中具有能量的一最高絕對值的物件信號增加。另一方式是,位元的數量用於說明在一預定參數帶內複數個物件信號中具有能量的一最高絕對值的物件信號可以根據特定資訊確定。
說明在每個參數帶內複數個物件信號中哪一個物件信號具有能量的一最高絕對值的資訊的大小能夠通過利用一方法減少,該方法與用於減少一多聲道編碼解碼器的OTT和/或TTT匣內所用的
CLD、ICC和CPC的大小的方法相同,例如,利用一時間微分方法、一頻率微分方法或者一引導編碼方法。
為了說明在每個參數帶內複數個物件信號中哪一個物件信號具有能量的一最高絕對值,可以使用一優化Huffman表。在這個情況下,說明物件信號的能量位階順序的資訊與任意所需的具有最高絕對能量的物件信號的能量位階作比較。舉個例子,如果存在五個物件信號(例如,第一至第五物件信號)並且第三物件信號為一最高能量物件信號,可以提供關於第三物件信號的資訊。然後,第一、第二、第四和第五物件信號的能量位階與第三物件信號的能量位階的比例可以以各種方式提供出來,並在下文中進一步詳細說明。
第一、第二、第四和第五物件信號的能量位階與第三物件信號的能量位階的比例可以依次提供。另一方式是,第四、第五、第一和第二物件信號的能量位階與第三物件信號的能量位階的比例,可以依次提供為一迴圈方式。然後說明第一、第二、第四和第五物件信號的能量位階與第三物件信號的能量位階的比例順序的資訊,可以提供包含在一檔標題中或者可以在以一定數量圖框間隔傳輸。一多聲道編碼解碼器可以根據OTT匣的序列號確定CLD和ICC資訊。同樣地,說明每個物件信號如何映射至一位元串流的資訊是必要的。
對於一多聲道編碼解碼器的情況,關於與每個聲道對應信號的資訊可以利用OTT或者TTT匣的序列號識別。根據一以物件為主的音訊編碼方法,如果存在N個物件信號,則需要N個物件信號適當地編號。然而,一最終使用者有必要不時地利用一物件解碼器控制N個物件信號。在這個情況下,最終使用者可能不僅僅需要N個物件信號的序列號而且需要N個物件信號的描述,該描述如說明第一物件信號與一婦女的聲音對應的描述以及說明第二物件信號與一鋼琴的聲音對應的描述。N個物件信號的描述可以包含在如元資料的一位元串流的標題內,並因此隨該位元串流傳輸。尤其特
別地,N個物件信號的描述可以提供為文本或者可以利用一代碼表或者字碼提供出來。
關於物件信號間相關性的關聯資訊有時是必要的。為了這個目的,可以計算出一最高能量物件信號和其他非最高能量物件信號之間的相關性。在這個情況下,與全部OTT匣內使用的一單一ICC作比較之後,可以為全部物件信號指定一單一相關值。
如果物件信號是立體聲信號,則物件信號的左聲道能量與右聲道的能量的比例以及ICC資訊是必要的。物件信號的左聲道能量與右聲道的能量的比例可以利用一方法計算得到,該方法與用於計算複數個物件信號的能量位階的方法相同,計算過程是在任何一個最高能量物件信號的能量位階的絕對值以及其他非最高能量物件信號的能量位階與最高能量物件信號的能量位階的比例的基礎上完成的。舉個例子,如果一最高能量物件信號的左和右聲道的能量位階的絕對值分別為A和B,則一非最高能量的物件信號的能量位階與A的比例以及非最高能量物件信號的右聲道的能量位階與B的比例分別為x和y,非最高能量物件信號的左和右聲道的能量位階可以計算為A*x和B*y。在這個方式中,可以計算出一立體聲物件信號的左聲道能量與右聲道能量的比例。
一最高能量物件信號的絕對值以及其他非最高能量物件信號的能量位階與最高能量物件信號的能量位階的比例也可以用在當物件信號是單音信號的時候,通過單音物件信號獲取的一降混信號是一立體聲信號,並且單音物件信號包含在立體聲降混信號的雙聲道內。在這個情況下,包含在一立體聲降混信號的左聲道內的一部分單音物件信號的能量比例以及包含在立體聲降混信號的右聲道內的部分對應單音物件信號的能量比例以及相關資訊是必要的,並且直接應用於立體聲物件信號。如果一單音物件信號同時包含在一立體聲降混信號的L和R聲道內,則該單音物件信號的L和R聲道成分可以僅僅具有一位階差,而且該單音物件信號可以具有貫穿全部參數帶的一相關值1。在這個情況下,為了減少資料
的數量,說明單音物件信號具有貫穿全部參數帶的一相關值1的資訊可以附加提供。然後,需要指出用於每個參數帶的該相關值1。
相反,相關值1可以對全部參數帶進行說明。
在通過總和複數個物件信號產生一降混信號的過程中,可能發生削波。為瞭解決這個問題,一預定增益可以為一降混信號的倍數,從而該降混信號的最大位階可以超過一削波臨界值。該預定增益可以隨著時間變化。從而,關於該預定增益的資訊是必要的。如果該降混信號是一立體聲信號,則可以為降混信號的L和R聲道提供不同的增益值,從而防止削波。為了減少傳輸資料的數量,不可以獨立地傳輸不同的增益值。相反,不同增益值的總和以及不同增益值的比例可以傳輸。然後,與獨立地傳輸不同的增益值的情況相比較,可以減少數量傳輸的數量以及一動態範圍。
為了進一步減少資料傳輸的數量,可以提供一位元,用於說明在通過總和複數個物件信號而產生一降混信號的過程中是否已經發生削波。然後,如果僅僅確定已經發生削波,則可以傳輸增益值。此種削波資訊對於防止總和複數個降混信號的過程中發生削波是有必要的,進而合併複數個位元串流。為了防止削波,複數個降混信號的總和可以為用於防止削波的一預定增益值的倍數。
圖13至圖16顯示了用於解釋以物件為主的輔助資訊配置的圖表。圖13至圖16中所示的實施例不僅僅應用於單音或者立體聲物件信號而且應用於多聲道物件信號。
參考圖13,一多聲道物件信號(OBJECT A(CH1)至OBJECT A(CHn))輸入至一物件編碼器221。然後該物件編碼器221根據多聲道物件信號(OBJECT A(CH1)至OBJECT A(CHn))產生一降混信號和輔助資訊。一物件編碼器223接收複數個物件信號OBJECT A(CH1)至OBJECT A(CHn)以及物件編碼器221產生的降混信號,並且根據物件信號OBJ.1至OBJ.N和所接收的降混信號產生另一個降混信號和另一個輔助資訊。一多工器225合併物件編碼器
221產生的輔助資訊和物件編碼器223產生的輔助資訊。
參考圖14,一物件編碼器223根據一多聲道物件信號OBJECT A(CH1)至OBJECT A(CHn)產生一第一位元串流。然後,一物件編碼器231根據複數個非多聲道物件信號OBJECT1至OBJECTn產生一第二位元串流。然後,一物件編碼器235將第一位元串流和第二位元串流通過利用一方法合併為一單一位元串流,該方法與將複數個位元串流合併為輔助MCU的一單一位元串流所用的方法一樣。
參考圖15,一多聲道編碼器241根據一多聲道物件信號OBJECT A(CH1)至OBJECT A(CHn)產生一降混信號和以聲道為主的輔助資訊。一物件編碼器243接收多聲道編碼器241產生來的降混信號和通過複數個非多聲道物件信號OBJECT1至OBJECTn,並且根據接收的降混信號和物件信號OBJECT1至OBJECTn產生一物件位元串流和輔助資訊。一多工器245將多聲道編碼器241產生的以聲道為主的資訊和物件編碼器243產生的輔助資訊合併,並輸出合併的結果。
參考圖16,一多聲道編碼器253根據一聲道物件信號OBJECT A(CH1)至OBJECT A(CHn)產生一降混信號和以聲道為主的複數資訊。一物件編碼器251根據複數個非多聲道物件信號OBJECT1至OBJECTn產生一降混信號和輔助資訊。一物件編碼器255接收多聲道編碼器253產生的降混信號和物件編碼器251產生的降混信號,並將接收的降混信號合併。一多工器257將物件編碼器251產生的輔助資訊和多聲道編碼器253產生的以聲道為主的輔助資訊合併,並將合併的結果輸出。
在電話會議使用以物件為主的音訊編碼的情況中,有必要有時將複數個物件位元串流合併為一單一位元串流。複數個物件位元串流合併為一單一位元串流的處理將在下文中進行詳細說明。
圖17顯示了用於解釋將兩個以物件為主的輔助資訊合併的圖表。參考圖17,當兩個物件位元串流合併為一單一物件位元串流
的時候,分別存在於兩個物件位元串流內如CLD和ICC資訊的輔助資訊需要進行修正。通過簡單地利用如一第十一OTT匣的一附加OTT匣,以及利用第十一OTT匣提供的如CLD和ICC資訊的輔助資訊將兩個物件位元串流合併為一單一物件位元串流。
為了將兩個物件位元串流合併為一單一物件位元串流,兩個物件位元串流中的每一個位元串流的樹狀配置設定資訊(tree configuration information)必須合併至整合樹狀設定資訊(integrated tree configuration information)。為瞭解決這個問題,即便兩個物件位元串流的合併產生的附加配置資訊可以修正,用於產生兩個物件位元串流的一定數量的OTT匣的索引可以修正,並且僅僅少數如一計算處理通過第十一OTT匣執行的附加處理以及兩個物件位元串流的兩個降混信號的降混可以執行。在這個方式中,該兩個物件位元串流能夠方便地合併為一單一物件位元串流,而不需要對產生該兩個物件信號的每個物件信號相關的資訊進行修正。
參考圖17,該第十一OTT匣可以為可選擇地。在這個情況下,兩個物件位元串流的兩個降混信號可以用作兩聲道降混信號。因此,兩個物件位元串流能夠合併為一單一物件位元串流,而不需要附加計算。
圖18顯示了用於解釋將兩個以上的獨立物件位元串流合併為具有一立體聲降混信號的一單一物件位元串流的圖表。參考圖18,如果兩個以上的獨立物件位元串流具有不同數量的參數帶,則參數帶可以在物件位元串流上執行,從而具有少數參數帶的一個物件位元串流的參數帶的數量能夠增加至與其他物件位元串流的參數帶的數量一樣。
尤其特別地,可以利用一預定映射表完成參數帶映射。在這個情況下,參數帶映射可以利用一簡單線性公式完成。
如果存在交疊參數帶,考慮到彼此交疊的參數帶的數量,參數值可以適當地混合。當優先考慮低複雜度的情形下,參數帶映射可以在兩個物件位元串流上執行,從而在兩個物件位元串流
中,具有更多參數帶的其中一個的參數帶的數量能夠減少至與另一個物件位元串流的參數帶的數量一樣。
在圖17和圖18所示的實施例中,兩個以上的獨立物件位元串流能夠合併為一綜合物件位元串流,而不需要對獨立物件位元串流的現有參數進行計算。然而,在合併複數個降混信號的情況下,關於降混信號的參數可能需要通過QMF/hybrid分析再一次計算。然而,這個計算需要大量的計算,從而妥協了圖17和圖18中所示的實施例的優勢。因此,有必要提出擷取參數的方法,而不需要QMF/hybrid分析或者綜合,儘管當降混信號進行降混的時候。為瞭解決這個問題,關於每個降混信號的每個參數帶的能量的能量資訊可以包含在一物件位元串流內。然後,當降混信號進行降混的時候,如CLD資訊的資訊可以根據該能量資訊方便地計算,而不需要QMF/hybrid分析或者綜合。該能量資訊可以代表用於每個參數帶的一最高能量位階或者每個參數帶的一最高能量物件信號的能量位階的絕對值。計算量可以進一步通過利用ICC值減少,該ICC值從一整體參數帶的一時域中獲取。
在對複數個降混信號進行降混的過程中,可能發生削波。為瞭解決這個問題,可以減少降混信號的位階。如果降混信號的位階減少,則關於減少位階的降混信號的位階資訊可能需要包含在一物件位元串流內。用於防止削波的位階資訊可以應用於一物件位元串流的每一個圖框上或者可以僅僅應用於削波發生的一些圖框上。原始降混信號的位階可以通過反向地應用位階資訊進行計算,用於防止一解碼操作中的削波。用於防止削波的位階資訊可以在一時間域內計算並從而不需要進行QMF/hybrid分析或者綜合。複數個物件信號合併為一單一物件位元串流的操作可以利用如圖12所示的結構執行,並且參考圖19在下文中進行詳細地說明。
圖19顯示了用於解釋將兩個物件位元串流合併為一單一物件位元串流的圖表。參考圖19,一第一匣261產生一第一物件位元串流,並且一第二匣263產生一第二物件位元串流。然後,一第三匣
265通過合併第一和第二位元串流產生一第三位元串流。在這個情況下,如果第一和第二物件位元串流包括每個參數帶的一最高能量物件信號的能量位階的絕對值資訊,以及非最高能量物件信號的能量位階與最高能量物件信號的能量位階的比例,以及關於增益值的增益資訊,該增益值通過第一和第二匣261和263成倍於降混信號,則該第三匣265可以通過合併第一和第二位元串流簡單地產生第三物件位元串流,而不需要附加參數計算或者擷取。
該第三匣265接收複數個降混信號DOWNMIA_A和DOWNMIX_B。該第三匣265將降混信號DOWNMIX_A和DOWNMIX_B轉換為PCM信號,並合計PCM信號,從而產生一單一降混信號。在這個過程中,可能發生削波。為瞭解決這個問題,該降混信號DOWNMIX_A和DOWNMIX_B可以為一預定增益值的倍數。關於該預定增益值的資訊可以包括在第三物件位元串流內並隨著第三物件位元串流傳輸。
複數個物件位元串流合併為一單一位元串流的過程將在下文中進一步詳細說明。參考圖19,A可以包括複數個物件信號OBJECT1至OBJECTn中任意一個是一最高能量物件信號的資訊以及其他非最高能量物件信號的能量位階與最高能量物件信號的能量位階的比例。同樣地,SIDE INFO可以包括SIDE INFO A可以包括複數個物件信號OBJECT1至OBJECTn中任意一個是一最高能量物件信號的資訊以及其他非最高能量物件信號的能量位階與最高能量物件信號的能量位階的比例。
SIDE_INFO_A和SIDE_INFO_B可以平行地包含在一個位元串流內,如圖2所示。在這個情況下,說明一個以上的位元串流是否平行存在的一位元可以額外提供出來。
參考圖20,為了說明一預定位元串流是否為在其內包含有一個以上的位元串流的綜合位元串流,即便是包含在預定位元串流內,說明預定位元串流的資訊是否為一綜合位元串流的資訊,關於位元串流數量的資訊,以及即便是包含在預定位元串流內的關
於位元串流原始位置的資訊都可以在預定位元串流的標題處提供出來並隨後具有即便是在預定位元串流內的一個以上的位元串流。在這個情況下,一解碼器可以通過分析預定位元串流的標題資訊,確定該預定位元串流是否為包含有一個以上位元串流的一綜合位元串流。這類位元串流合併方法不需要額外的處理,除了需要對一位元串流進行一些額外的識別。然而,此識別需要在一定數量圖框間隔處提供出來。另外,這類位元串流合併方法需要一解碼器,用於確定解碼器接收的全部位元串流是否為一綜合位元串流。
作為上述位元串流合併方法的替換方法,複數個位元串流可以利用一方法合併為一單一位元串流,在此方式中,一解碼器不能識別單一位元串流是否為一綜合位元串流。這個內容將在下文中參考圖21進行詳細說明。
參考圖21,SIDE_INFO_A代表的一最高能量物件信號的能量位階與SIDE_INFO_B代表的一最高能量物件信號的能量位階進行比較。然後,兩個物件信號中任意一個具有一較高能量位階的物件信號確定為一綜合位元串流的一最高能量物件信號。舉個例子,如果SIDE_INFO_A代表的最高能量物件信號的能量位階高於SIDE_INFO_B代表的最高能量物件信號的能量位階,則SIDE_INFO_A代表的最高能量信號可以成為一綜合位元串流的一最高能量物件信號。然後,SIDE_INFO_A的能量比例資訊可以在綜合位元串流內使用,而SIDE_INFO_B的能量比例資訊可以為能量位階比例的倍數。然後,SIDE_INFO_A和SIDE_INFO_B中任意一個的能量比例資訊包括關於可以在綜合位元串流內使用的綜合位元串流的最高能量物件信號的資訊,以及包括A代表的最高能量物件信號的能量比例資訊和SIDE_INFO_B代表的最高能量物件信號的能量比例資訊。這個方法包括SIDE_INFO_B的能量比例資訊的重算。然而,SIDE_INFO_B的能量比例的重算相對簡單。在這個方法中,一解碼器不能確定一位元串流是否接收包含一個以
上位元串流的綜合位元串流,並因此可以使用一典型解碼方法。
包含立體聲降混信號的兩個物件位元串流可以簡單地合併為一單一物件位元串流,而不需要關於物件信號資訊的重算,該合併的方法幾乎與合併包含單聲降混信號的位元串流所用的方法一樣。在一物件位元串流內,關於一降混物件信號的樹結構的資訊係先於樹結構的每個分支(例如,每個匣)獲取的物件信號資訊。
物件位元串流已經在上文中說明,假設某些物件僅僅分配至一立體聲降混信號的一左聲道或者一右聲道。然而,物件信號通常在一立體聲降混信號的雙聲道間分配。因此,下文將詳細說明如何根據在一立體聲降混信號的雙聲道間分配的物件位元串流,產生一物件位元串流。
圖22顯示了用於解釋通過混合複數個物件信號產生一立體聲降混信號的方法的圖表,尤其顯示了將四個物件信號OBJECT1至OBJECT4降混為L和R立體聲信號的一方法。參考圖22。參考圖22,四個物件信號OBJECT1至OBJECT4中的一些信號既屬於一降混信號的L聲道又屬於R聲道。舉個例子,該第一物件信號OBJECT1以a:b的比例在L和R聲道之間分配,如方程式(3):
如果一物件信號在一立體聲降混信號的L和R聲道間分配,則進一步需要關於物件信號在L和R聲道間分配比例(a:b)的聲道分配比例資訊。然後,如CLD和ICC資訊,關於的物件信號的資訊可以通過在一立體聲降混信號的L和R聲道中利用OTT匣執行降混獲得,這個過程將進一步參考圖23進行詳細說明。
參考圖23,在一降混操作過程中,一旦從複數個OTT匣獲取
CLD和ICC資訊以及提供每個物件信號的聲道分配比例資訊,可以計算出一多聲道位元串流,該位元串流通過變化從而適應最終使用者在物件位置資訊和重放配置資訊中做出的任何修正。另外,如果一立體聲降混信號需要通過降混前處理進行處理,則可以獲取關於立體聲降混信號如何通過降混前處理的資訊,並且可以將獲取的資訊傳輸至前處理器。即,如果提供的每個物件信號不存在聲道分配比例資訊,就沒有方法計算一多聲道位元串流並且獲取前處理操作所必需的資訊。一物件信號的聲道分配資訊可以代表為兩個整數的一比例或者一數量級(單位:dB)。
如上所述,如果一物件信號在一立體聲的降混信號的兩個聲道間分配,則可能需要物件信號的聲道分配比例資訊。聲道分配比例資訊可能具有一固定值,該固定值說明在一立體聲降混信號的兩個聲道間一物件信號的分配比例。另一方式是,當聲道分配比例資訊被用作ICC資訊的時候,一物件信號的聲道分配比例資訊可以從物件信號的一個頻率帶至另一個頻率帶變化。如果一立體聲降混信號是通過一複雜降混操作而獲得,亦即如果一物件信號屬於一立體聲降混信號的兩個聲道並且從物件信號的一個頻率帶至另一個頻率帶通過改變ICC資訊對該物件信號進行降混,則還需要對物件信號的降混的詳細說明,從而解碼一最終渲染物件信號。這個實施例可以應用於已經說明過的所有物件結構。
下文中,進一步參考圖24至圖27對前處理進行詳細說明。如果輸入至一物件解碼器的一降混信號是一立體聲信號,則輸入的降混信號可能需要在輸入物件解碼器的一多聲道解碼器之前進行前處理,這是因為多聲道解碼器不能將屬於輸入的降混信號的左聲道的一信號映射至一右聲道。因此,為了讓一最終使用者將屬於輸入降混信號的左聲道的一物件信號移位至一右聲道,該輸入的降混信號可能需要進行前處理,從而前處理後的降混信號可以輸入至多聲道解碼器。
一立體聲降混信號的前處理的過程包括:從一物件位元串流
中獲取與處理資訊以及從一渲染矩陣中獲取與處理資訊並且根據前處理資訊適當地處理立體聲降混信號,這個過程將在下文進一步詳細描述。
圖24顯示了用於解釋根據四個物件信號OBJECT1至OBJECT4,如何配置一立體聲降混信號的圖表。參考圖24,該第一物件信號OBJECT1在L和R聲道間以比例a:b分配,該第二物件信號OBJECT2在L和R聲道間以比例c:d分配,該第三物件信號OBJECT3僅在L聲道中分配,並且第四物件信號OBJECT4僅在R聲道中分配。通過將第一至第四物件信號OBJECT1至OBJECT4穿過一定數量的OTT,可以產生如CLD和ICC的資訊,並且根據產生的資訊可以產生一降混信號。
假設一最終使用者通過適當地設定第一至第四物件信號OBJECT1至OBJECT4的位置和位階,獲取一渲染矩陣,並且假設存在五個聲道。該渲染矩陣可以通過方程(4)表示:
參考方程式(4),當四行內每一行的五個係數的總和等於一預定值的時候,如100,可以確定一對應物件信號的位階仍沒有變化。四行內每一行的五個係數的總和與參考值的差異量可以是已經變化的一對應物件信號的位階的量(單位:dB)。方程式(4)的渲染矩陣的第一、第二、第三、第四和第五列分別代表FL、FR、RL和RR聲道。
方程式(4)的渲染矩陣的第一行於第一物件信號OBJECT1對應並具有總共五個係數,亦即30、10、20、30和10。由於第一
行的五個係數的總和是100,則可以確定第一物件信號OBJECT1的位階仍沒有變化,並且僅僅第一物件信號OBJECT1的空間位置已經改變。儘管第一行的五個係數代表不同的聲道方向,但可以大致分為兩個聲道:L和R聲道。然後,第一物件信號OBJECT1在L和R聲道之間分配的比例可以計算為70%(=(30+30+20)*0.5):30%(=(10+10+20)*0.5)。因此,方程式(4)的渲染矩陣說明第一物件信號OBJECT1的位階仍沒有變化,並且第一物件信號在L和R聲道間分配的比例為70%:30%。如果方程式(4)的渲染矩陣的任意一行的五個係數的總和小於或者大於100,可以確定一對應物件信號的位階已經變化,並且因此,該對應物件信號可以通過前處理進行處理或者可以轉換並傳輸為ADG。
為了前處理降混信號,可以計算降混信號在參數帶間分配的比例,參數帶中的參數可以從降混信號上執行的QMF/hybrid轉換獲取的信號中擷取,而且該降混信號可以根據設定的一渲染矩陣在參數帶間重新分配。在參數帶間重新分配降混信號的各種方法將在下文中進行詳細說明。
在一第一重新分配方法中,利用各自的輔助資訊(如CLD和ICC資訊)以及利用與一多聲道編碼解碼器所用的方法相同的方法,對L和R聲道降混信號進行獨立地解碼。然後,在L和R聲道降混信號間分配的物件信號進行還原。為了減少計算量,L和R聲道降混信號可以僅僅利用CLD資訊進行解碼。每個還原物件信號在L和R聲道降混信號間分配的比例可以根據輔助資訊確定。
每個還原的物件信號可以根據一渲染矩陣在L和R聲道降混信號間重新分配。然後,重新分配的物件信號通過OTT匣根據聲道間的基礎進行降混,從而完成前處理。簡單地說,該第一重新分配方法採用的方法與一多聲道編碼解碼器所用的方法相同。然而,該第一重新分配方法需要與每個聲道的物件信號一樣多的解碼處理,並需要一重新分配處理以及一以聲道為主的降混處理。
在一第二重新分配方法中,不同於第一重新分配的方法,物
件信號沒有從L和R降混信號中還原。相反,每個L和R降混信號分為兩部分:留在一對應聲道的一部分L_L或者R_R,以及將重新分配的另一部分L_R或者R_L,如圖25所示。參考圖25,L_L代表留在一L聲道內的一部分L聲道降混信號,並且L_R代表加入一R聲道的一部分L聲道降混信號。同樣地,R_R代表留在R聲道的一部分R聲道降混信號,而R_L代表加入一L聲道的一部分R聲道降混信號。每個L和R聲道降混信號可以根據每個物件信號在L和R聲道降混信號間分配的比例,以及每個物件信號將在前處理的L和R聲道L’和R’間分配的比例,分為兩部分(L_L和L_R或者R_R和R_L),如方程式(2)定義地。因此,通過將每個物件信號在L和R降混信號間分配的比例與每個物件信號將在前處理的L和R聲道L’和R’間分配的比例進行對比,可以確定L和R聲道降混信號將如何在前處理的L和R聲道L’和R’間分配。
上面已經說明根據一預定能量比例將一L聲道信號劃分為信號L_L和L_R的內容。一旦L聲道信號分為信號L_L和L_R,信號L_L和L_R間的一ICC可能需要進行確定。信號L_L和L_R間的ICC可以簡單地根據關於物件信號的ICC資訊進行確定。即,信號L_L和L_R間的ICC可以根據每個物件信號在信號L_L和L_R間的分配比例進行確定。
該第二降混重新分配方法將進一步在下面進行詳細描述。假設該L和R聲道降混信號L和R通過如圖24所示的方法獲取,第一、第二、第三和第四物件信號OBJECT1、OBJECT2、OBJECT3、和OBJECT4分別在L和R聲道降混信號L和R間分別以1:2、2:3、1:0、和0:1的比例分配。複數個物件信號可以利用一定數量的OTT匣進行降混處理,並且如CLD和ICC資訊的資訊可以從物件信號的降混處理中獲得。
用於第一至第四物件信號OBJECT1至OBJECT4的一渲染矩陣的實例用方程式(4)表示。該渲染矩陣包括第一至第四物件信號OBJECT1至OBJECT4的位置資訊。因此,前處理後的L和R聲道降
混信號L’和R’可以通過利用渲染矩陣執行前處理而獲取。如何產生和說明渲染矩陣,已經在上面參考方程式(3)做出說明。
第一至第四物件信號OBJECT1至OBJECT4中每個物件信號在前處理後的L和R聲道降混信號L和R間分配的比例可以通過方程式(5)計算:
第一至第四物件信號OBJECT1至OBJECT4中每個物件信號在L和R聲道降混信號間分配的比例可以通過方程(6)計算:
參考方程式(5)在前處理L聲道降混信號L中分配的部分第三物件信號OBJECT3以及在R聲道降混信號R中分配的部分第三物件信號OBJECT3的總和為110,並因此,可以確定第三物件信號OBJECT3的位階已經增加了10。另一方面,在前處理L聲道降混信
號L中分配的部分第四物件信號OBJECT4以及在R聲道降混信號R中分配的部分第四物件信號OBJECT4的總和是95,並因此,可以確定第四物件信號OBJECT4的位階已經減少了5。如果用於第一至第四物件信號OBJECT1至OBJECT4的渲染矩陣具有一參考值100,而且渲染矩陣的每行內細數的總和與參考值100之間的差異量代表了一對應物件信號的位階已經變化的量(單位:dB),可以確定物件信號OBJECT3的位階已經增加了10dB,並且第四物件信號OBJECT4的位階已經減少了5dB。
方程式(5)和(6)可以重新整理為方程式(7):
在方程式(7)中,將第一至第四物件信號OBJECT1至OBJECT4在前處理之前的L和R聲道降混信號間分配的比例與第一至第四物件信號OBJECT1至OBJECT4在前處理之後的L和R聲道降混信號間分配的比例進行比較。從而,通過使用方程式(7),可以簡單地確定第一至第四物件信號OBJECT1至OBJECT4中有多少物件信號將通過前處理重新分配。舉個例子,參考方程式(7),第二物件信號OBJECT2在L和R聲道降混信號間分配的比例從40:60變為30:70,並因此可以確定最初分配至L聲道降混信號的第二物件信號OBJECT2的四分之一(25%)需要移位元至R聲道降混信號。這個過程可以參考方程式(8)說明:
[方程式(8)]
OBJECT1:最初在R上分配的55%OBJECT1需要移位元至L
OBJECT2:最初在L上分配的25%OBJECT1需要移位元至R
OBJECT3:最初在L上分配的50%OBJECT1需要移位元至R
OBJECT4:最初在R上分配的50%OBJECT1需要移位元至L
通過使用方程式(8),圖25的信號L_L、L_R以及R_R可以用方程式(9)表示出來:
方程式(9)內每個物件信號的值可以通過一OTT匣提供的量化CLD資訊表示為一對應物件信號在L和R聲道間的分配比例,如用方程式(10)表達:
[方程式(10)]
確定用於圖25中的每個分解框內的CLD資訊,如用方程式(11)表達:
在這個方式中,在一分解框內,可以確定用於根據一L聲道降混信號產生信號L_L和L_R的CLD和ICC資訊,並且在一分解框內,可以確定用於根據一R聲道降混信號產生信號R_L和R_R的CLD和ICC資訊。一旦獲取了L_L、L_R、R_L和R_R信號,如圖25所示,信號L_R和B_R可以相加,從而獲得一前處理的立體聲降混信號。如果一最終聲道是一立體聲聲道,可以輸出通過前處理獲取的L和R聲道降混信號。在這個情況下,即便是在每個物件信號位階內的變化仍然沒有進行調整。為瞭解決這個問題,可以額外地提供執行一ADG功能的一預定模組。用於調整每個物件信號位
階的資訊可以利用一方法計算,該方法與用於計算ADG資訊的方法一樣,這個過程將進一步詳細說明。另一方式是,每個物件信號的位階可以在一前處理過程內調整。在這個情況下,每個物件信號的位階的調整可以利用一方法執行,該方法與用於處理ADG的方法一樣。作為圖25所示的實施例的替換,可以通過一解聯器和一混合器執行一解聯操作,勝於通過分析模組PARSING 1 301和PARSING 2 303完成操作,如圖26所示,為了調整通過混合器獲取的信號L’和R’之間的相關性。參考圖26,Pre_L’與Pre_R’說明位階調整獲取的L和R聲道信號。信號Pre_L’與Pre_R’的其中之一
可以輸入至解聯器307,並因此通過混音器309進行一混合操作,進而獲取一相關調整信號。
一前處理的立體聲降混信號可以輸入至一多聲道解碼器。為了提供與一最終使用者設定的物件位置資訊和重放資訊相容的多聲道輸出,不但一前處理降混信號而且以聲道為主的附屬資訊對於執行多聲道解碼是有必要的。下文將詳細說明如何再一次通過上述實例獲取以聲道為主的輔助資訊。輸入至一多聲道解碼器內的前處理的降混信號L’和R’可以在方程式(5)的基礎上,通過方程式(12)表達:
[方程式(12)]Eng L
’
=Eng L
_L
+Eng R
_L
=0.7Eng Obj
1
+0.3Eng Obj
2
+0.5Eng Obj
3
+0.5Eng Obj
4 Eng R
’
=Eng L
_R
+Eng R
_R
=0.3Eng Obj
1
+0.7Eng Obj
2
+0.5Eng Obj
3
+0.5Eng Obj
4
第一至第四物件信號OBJECT1至OBJECT4中的每一個信號在FL、RL、C、FR和RR聲道中分配的比例可以通過方程式(13)表達:
[方程式(13)]Eng FL
=0.3Eng Obj
1
+0.1Eng Obj
2
+0.2Eng Obj
3
+0.21.100/95.Eng Obj
4 Eng RL
=0.3Eng Obj
1
+0.1Eng Obj
2
+0.2Eng Obj
3
+0.11.100/95.Eng bOj
4 E ngC
=0.2Eng Obj
1
+0.2Eng Obj
2
+0.2Eng Obj
3
+0.31.100/95.Eng Obj
4 Eng FR
=0.1Eng Obj
1
+0.3Eng Obj
2
+0.2Eng Obj
3
+0.21.100/95.Eng Obj
4 Eng RR
=0.1Eng Obj
1
+0.3Eng Obj
2
+0.2Eng Obj
3
+0.11.100/95.Eng Obj
4
該前處理的降混信號L’和R’可以通過MPS擴大為5.1聲道,如圖27所示。參考圖27,一TTT匣TTT0和OTT匣OTTA,OTTB以及OTTC的參數可能需要在參數帶單位內計算,但參數帶為了簡便沒有描述出來。
該TTT匣TTT0可以用在兩個不同的模式中:一以能量為主的模式和一預報模式。當在以能量為主的模式中使用的時候,該TTT匣TTT0需要兩條CLD資訊。當在預報模式下使用的時候,TTT匣TTT0需要兩條CPC資訊和一條ICC資訊。
為了在以能量為主的模式下計算CLD資訊,圖27所示的信號L”、R”和C可以利用方程式(6)、(10)和(13)計算。信號L”的能量位階可以通過方程式(14)計算:
[方程式(14)]
方程式(14)也可以用於計算R”或者C的能量位階。之後,在TTT匣TTT0內使用的CLD資訊可以根據信號L”、R”和C的能量位階計算,如用方程式(15)表達:
方程式(14)可以根據方程式(10)產生。儘管方程式(10)僅僅定義了如何計算一L聲道的能量值,但一R聲道的能量值也可以利用方程式(10)計算。在這個方式中,第三和第四OTT匣的CLD和ICC值可以根據第一和第二匣的CLD和ICC值計算。然而,這個過程可能並不需要應用於全部樹結構中而僅僅應用於特定用於解碼物件信號的樹結構。包含在一物件位元串流內的資訊可以傳輸至每個OTT匣。另一方式是,包含在一物件位元串流內的資
訊可以僅僅傳輸至一些OTT匣,並且說明還沒有接收資訊的OTT匣的資訊可以通過計算獲取。
如CLD和ICC資訊的參數可以利用上述方法進行計算而用於OTT匣OTTA,OTTB和OTTC。此多聲道參數可以輸入至一多聲道解碼器並進而進行多聲道解碼,從而獲取一多聲道信號,該信號根據一最終使用者所需的物件位置資訊和重放配置資訊適當地渲染。
如果物件信號的位階仍然沒有通過前處理調整,則該多聲道參數可能包括ADG參數。一ADG參數的計算將再一次通過上述實例進行詳細地說明。
當產生一渲染矩陣的時候,從而一第三物件信號的位階能夠增加10dB,一第四物件信號的位階能夠減少5dB,在L內的一第三物件信號成分的位階能夠增加10dB,並且在L內的一第四物件信號的位階能夠減少5dB,第一和第四物件信號的位階調整之前和之後的能量位階的一比例RatioADG,L’可以利用方程式(16)計算:
比例Ratio ADG,L’
可以通過將方程式(10)取代方程式(16)而確定。用於一R聲道的一比例Ratio ADG,R
也可以利用方程式(16)計算。比例Ratio ADG,L’
和Ratio ADG,R’
代表物件信號的位階調整導致的一對應參數帶的能量變化。因此,ADG值ADG(L’)and ADG(R’)能夠利用比例Ratic ADG,L’
和Ratio ADG,R’
計算,如方程式(17)表達:
[方程式(17)]ADG
(L
’)=10log10
(Ratio ADG,L’
)ADG
(R
’)=10log10
(Ratio ADG,R’
)
一旦確定ADG參數ADG(L’)和ADG(R’),ADG參數ADG(L’)和ADG(R’)通過利用一ADG量化表格進行量化,並且傳輸量化後的ADG值。如果存在需要進一步精確調整的ADG值ADG(L’)和ADG(R’),則ADG值ADG(L’)和ADG(R’)的調整可以通過一前處理器執行,勝於通過一MPS解碼器。
在一物件位元串流內,用於代表物件信號的參數帶的數量和間隔可以不同於一多聲道解碼器內使用的參數帶的數量和間隔。在這個情況下,物件位元串流的參數帶可以線性地映射至多聲道解碼器的參數帶上。尤其特別地,如果一物件位元串流的一特定參數帶涉及一多聲道解碼器的兩個參數帶,則線性映射可以執行,從而物件位元串流的特定參數帶能夠劃分,該劃分是根據在多聲道解碼器的兩個參數帶間分配的對應參數帶的比例。另一方面,如果一物件位元串流的一個以上的參數帶包含在一多聲道解碼器的一特定參數帶內,則物件位元串流的參數值可以均分。另一方式是,參數帶映射能夠利用多聲道標準的一當前參數帶映射表執行。
當物件解碼用於電信會議的時候,不同人的語音對應物件信號。一物件解碼器將對應物件信號的語音分別輸出至特定揚聲器。然而,當一個以上的人同時說話的時候,很難使一物件解碼器將人的語音通過解碼適當地分配至不同的揚聲器,並且人語音的渲染操作可能導致聲音失真並惡化聲音的品質。為瞭解決這個問題,說明是否同時又一個以上的人在說話的資訊可以包含在一位元串流內。然後,如果根據資訊確定存在一個以上的人同時說話,則一以聲道為主的位元串流可以修正,從而與降混信號幾乎相似的僅解碼信號可以輸出至每個揚聲器。
舉個例子,假設存在三個人a、b和c,並且a、b和c三人的語音需要解碼,從而分別輸出至揚聲器A、B和C。當a、b和c三人同時說話的時候,a、b和c三人的語音可以全部包含在一降
混信號內,該降混信號通過對分別代表a、b和c三人的語音進行降混處理而獲取。在這個情況下,關於分別對應a、b和c三人語音的部分降混信號的資訊可以配置為一多聲道位元串流。然後。該降混信號可以利用一典型物件解碼方法進行解碼,從而a、b和c三人的語音能夠分別輸出至揚聲器A、B和C。揚聲器A、B和C中每一個的輸出可以還原並且具有與原始降混信號相比較低的識別率。另外,a、b和c三人的語音不能完全彼此獨立。為瞭解決這個問題,關於a、b和c三人同時說話的資訊可以包含在一位元串流內。然後,一遍碼解碼器可以產生一多聲道位元串流,從而通過對a、b和c三人語音對應的物件信號進分別行降混,進而獲取的降混信號能夠輸出至每個揚聲器A、B和C。在這個方式中,可以防止信號失真。
實際上,當一個以上的人同時說話的時候,很難區分出每個人的語音。因此,當一降混信號輸出的時候地聲音品質比降混信號渲染的時候地聲音品質要高,從而不同人的語音能夠彼此區分並輸出至不同的揚聲器。對於這個問題,一遍碼解碼器可以產生一多聲道位元串流,從而當一個以上人同時說話時獲取的一降混信號可以輸出至全部揚聲器,或者該降混信號能夠放大並輸出至揚聲器。
為了說明一物件位元串流的一降混信號是否源於一個以上人的同時說話,一物件編碼器可以適當地修正物件位元串流,而非如上面該提供附加的資訊。在這個情況下,一物件解碼器可以在物件位元串流上執行一典型解碼操作,從而該降混信號能夠輸出至揚聲器,或者該降混信號能夠放大,但就某種程度不會發生信號失真,進而輸出至揚聲器。
提供至一多聲道解碼器如一HTRF的3D資訊將在下文中進行詳細說明。
當一物件解碼器在一雙耳聲模式下運行的時候,物件解碼器內的一多聲道解碼器也在雙耳聲模式下運行。一最終使用者可以
將如一HRTF的3D資訊傳輸至多聲道解碼器,該資訊根據物件信號的空間位置進行優化。
尤其特別地,當存在兩個物件信號的時候,如OBJECT 1和OBJECT2,而且該兩個物件信號OBJECT 1和OBJECT2分別設置在位置1和位置2,一渲染矩陣產生器或者轉碼器可以具有說明物件信號OBJECT 1和OBJECT2的位置的3D資訊。如果該渲染矩陣產生器具有說明物件信號OBJECT 1和OBJECT2位置的3D資訊,則渲染矩陣產生器可以將說明信號OBJECT 1和OBJECT2位置的3D資訊傳輸至轉碼器。另一方面,如果轉碼器具有說明信號OBJECT 1和OBJECT2位置的3D資訊,則渲染矩陣產生器僅僅可以將與3D資訊對應的索引資訊傳輸至轉碼器。
在這個情況下,可以根據說明位置1和2的3D資訊,產生一雙耳聲信號,如方程式(18)表達:
[方程式(18)]L
=Obj
1*HRTF L,Pos
1
+Obj
2*HRTF L,Pos
2 R
=Obj
1*HRTF R,Pos
1
+Obj
2*HRTF R,Pos
2
假設一5.1聲道揚聲器系統將用於還原聲音,一多聲道雙耳聲解碼器通過執行解碼獲取雙耳道聲音,並且該雙耳道聲音可以用方程式(19)表達:
[方程式(19)]L
=FL
*HRTF L,FL
+C
*HRTF L,C
+FR
*HRTF L,FR
+RL
*HRTF L,RL
+RR
*HRTF L,RR R
=FL
*HRTF R,FL
+C
*HRTF R,C
+FR
*HRTF R,FR
+RL
*HRTF R,RL
+RR
*HRTF R,RR
物件信號OBJECT1的一L聲道成分可以通過方程式(20)表達:
[方程式(20)]L Obj
1
=Obj
1*HRTF L,Pos
1 L Obj
1
=FL Obj
1
*HRTF L,FL
+C Obj
1
*HRTF L,C
+FR Obj
1
*HRTF L,FR
+RL Obj
1
*HRTF L,RL
+RR Obj
1
*HRTF L , RR
物件信號OBJECT1的一R聲道成分和物件信號OBJECT2的L和R聲道成分可以全部利用方程式(20)定義。
舉個例子,如果物件信號OBJECT1和OBJECT2的能量位階與總能量位階的比例分別為a和b,則在一FL聲道分配的部分物件信號OBJECT1與總物件信號OBJECT1的比例為c,並且在FL聲道分配的部分物件信號OBJECT2與總物件信號OBJECT2的比例為d,在FL聲道分配的物件信號OBJECT1和OBJECT2的比例為ac:bd。在這個情況下,FL聲道的一HRTF可以確定,如用方程式(21)中表達:
在這個方式中,可以獲取在一多聲道雙耳道解碼器使用的3D資訊。因為在一多聲道雙耳道解碼器使用的3D資訊更多地代表物
件信號的實際位置,從而當利用與五個揚聲器位置對應的3D資訊執行多聲道解碼的時候,可以更生動地利用在一多聲道雙耳道解碼器使用的3D資訊,通過雙耳聲解碼還原雙耳聲信號。
如上所述,在一多聲道雙耳道解碼器使用的3D資訊可以根據代表物件信號空間位置的3D資訊以及能量比例資訊進行計算。另一方式是,當根據物件信號的ICC資訊,增加代表物件信號空間位置的3D資訊的時候,在一多聲道雙耳道解碼器使用的3D資訊可以通過適當地執行解聯操作產生。
效果處理可以作為部分前處理執行。另一方式是,效果處理的結果可以簡單地加入一多聲道解碼其的輸出中。在前一個情況下,為了在一物件信號上執行效果處理,除了一L聲道分為L_L和L_R並且一R聲道分為R_R和R_L之外,可能需要執行物件信號的擷取。
尤其特別地,一物件信號可以先從L和R聲道信號擷取。然後,該L聲道信號可以分為L_L和L_R,R聲道可以分為R_R和R_L。效果處理可以在物件信號上執行。然後,效果處理後的物件信號可以根據一渲染矩陣分為L和R聲道成分。其後,效果處理後的物件信號的L聲道成分可以加入L_L和R_L,並且效果處理後的物件信號的R聲道成分可以加入R_R和L_R。
另一方式是,前處理後的L和R聲道信號L’和R’可以首先產生。其後,一物件信號可以從前處理後的L和R聲道信號L’和R’中擷取。其後,可以在物件信號上執行前處理,並且效果處理的結果可以返回加入前處理後的L和R聲道信號。
一物件信號的頻譜可以通過效果處理進行修正。例如,一物件信號的一高音部的位階或者一低音部的位階可以有選擇地提高。對於這個問題,僅僅可以修正與物件信號的高音部或者低音部對應的一頻譜部。在這個情況下,包含在一物件位元串流內的與物件有關的資訊可能因此需要修正。舉個例子,如果一特定物件信號的一低音部的位階提高,則該特定物件信號的低音部的位
階也可以提高。從而,包含在一物件位元串流內的能量資訊不能再完全代表特定物件信號的能量。為瞭解決這個問題,包含在物件位元串流內的能量資訊可以直接根據特定物件信號的能量內的變化進行修正。另一方式是,由一轉碼器提供的頻譜變化資訊可以應用於一多聲道位元串流的結構中,從而該特定物件信號的能量變化能夠在多聲道位元串流內反映出來。
圖28至圖33顯示了將複數條以物件為主輔助資訊和複數個降混信號合併為一條輔助資訊和一降混信號。當電信會議的情況下,有時需要將複數條以物件為主的輔助資訊和複數個降混信號合併為輔助資訊和一降混。在這個情況下,需要考慮一些因素。
圖28顯示了一物件編碼位元串流。參考圖28,該物件編碼位元串流包括一降混信號和輔助資訊。該降混信號與輔助資訊同步。從而,該物件編碼位元串流可以方便地進行編碼而不用考慮額外的因素。然而,將複數個位元串流合併為一單一位元串流的情況下,必須確認單一位元串流的一降混信號與單一位元串流的輔助資訊同步。
圖29用於解釋複數個物件編碼位元串流BS1和BS2的合併處理。參考圖29,參考數字1,2和3代表圖框數。為了將複數個降混信號合併為一單一降混信號,該降混信號可以轉換為脈衝編碼調製(PCM)信號,該PCM信號可以在一時間域上進行降混,並且降混後的PCM信號可以修正為一壓縮編碼解碼器格式。在這些過程中,可能產生一延遲,如圖29(b)所示。因此,當通過合併複數個位元串流獲取需要解碼的一位元串流的時候,必須確認需要解碼的一位元串流的一降混信號與需要解碼的位元串流的輔助資訊完全同步。
如果一降混信號和一位元串流的輔助資訊之間存在一延遲,則該位元串流可以通過與延遲對應的一預定量進行補償。在一降混信號和一位元串流的輔助資訊之間的一延遲可以根據用於產生降混信號的壓縮編碼解碼器的類型改變,因此,即便是在一降混
信號和一位元串流的輔助資訊之間的一位元延遲都可以包含在輔助資訊內。
當位元串流BS1和BS2的降混信號通過不同類型的編碼解碼器產生或者位元串流BS1的輔助資訊的結構與位元串流BS2的輔助資訊的結構不同的時候,圖30顯示了兩個位元串流BS1和BS2合併為一單一位元串流的情況。參考圖30,當位元串流BS1和BS2的降混信號通過不同類型編碼解碼器產生或者位元串流BS1的輔助資訊的結構與位元串流BS2的輔助資訊的結構不同的時候,可以確定位元串流BS1和BS2具有不同的信號延遲d1和d2,信號延遲的結果通過將降混信號轉換為時間域信號獲得,並且時間域信號的轉換操作通過使用一單一壓縮編碼解碼器完成。在這個情況下,如果不考慮不同信號延遲而僅僅增加位元串流BS1和BS2,則位元串流BS1的降混信號可能與位元串流BS2的降混信號不重合,而且位元串流BS1的輔助資訊可能與位元串流BS2的輔助資訊不重合。為瞭解決這個問題,延遲d1的位元串流BS1的降混信號可能進一步延遲,從而與延遲d2的位元串流BS2的降混信號同步。然後,位元串流BS1和BS2可以利用與圖30的實施例中所用的方法相同的方法進行合併,如果存在一個以上的位元串流需要進行合併,具有一最大延遲的無論哪一個位元串流可以用作一參考位元串流,並且因此,另一個位元串流可以進一步延遲,從而與參考位元串流同步。一降混信號和輔助資訊之間的一位元延遲可以包含在一物件位元串流。
可以提供出代表在一位元串流內是否存在一單一延遲的位元。只有位元資訊指出在一位元串流記憶體在一單一延遲,才會進一步提供說明信號延遲的資訊。在這個方式中,可以減少用於說明即便是在一單一位元串流內的一單一延遲所需資訊的數量。
圖32說明利用不同信號延遲如何補償具有不同信號延遲的兩個位元串流BS1和BS2中的一個位元串流,尤其說明瞭如何補償位元串流BS2,其所具有的信號延遲比位元串流BS2的信號延遲
要長。參考圖32,位元串流BS1的輔助資訊的第一至第三圖框可以全部使用。另一方面,因為位元串流BS2的輔助資訊的第一至第三圖框不能分別與位元串流BS1的第一至第三圖框同步,所以位元串流BS2的輔助資訊的第一至第三圖框不能使用。舉個例子,位元串流BS1的輔助資訊的第二圖框不僅僅與位元串流BS2的輔助資訊的部分第一圖框對應而且與位元串流BS2的輔助資訊的部分第二圖框對應。可以計算出與位元串流BS1的輔助資訊的第二圖框對應的位元串流BS2的輔助資訊的部分第二圖框與位元串流BS2的全部第二圖框所成的比例,以及與位元串流BS1的輔助資訊的第二圖框對應的位元串流BS2的輔助資訊的部分第一圖框與位元串流BS2的輔助資訊的全部第一圖框所成的比例,而且位元串流BS2的輔助資訊的第一圖框和第二圖框可以或者根據計算的結果進行均分或者內插。在這個方式中,位元串流BS2的輔助資訊的第一至第三圖框能夠分別與位元串流BS1的輔助資訊的第一至第三圖框同步,如圖32(b)所示。然後,位元串流BS1的輔助資訊和位元串流BS2的輔助資訊可以利用圖29所示的實施例中的方法進行合併。位元串流BS1和BS2的降混信號可以合併為一單一降混信號,而不需要延遲補償。在這個情況下,與信號延遲d1對應的延遲資訊可以儲存在通過合併位元串流BS1和位元串流BS2獲取的一合併位元串流內。
圖33顯示了在具有不同信號延遲的兩個位元串流內如何補償任何一個具有一較短信號延遲的位元串流的情況。參考圖33,位元串流BS2的輔助資訊的第一至第三圖框可以全部使用。另一方面,位元串流BS1的輔助資訊的第一至第三圖框不能使用,原因是位元串流BS1的輔助資訊的第一至第三圖框不能分別與位元串流BS2的輔助資訊的第一和第三圖框同步。舉個例子,位元串流BS2的輔助資訊的第一圖框不僅僅與位元串流BS1的輔助資訊的部分第一圖框對應而且與位元串流BS1的輔助資訊的部分第二圖框對應。可以計算出與位元串流BS2的輔助資訊的第一圖框對應
的位元串流BS1的輔助資訊的部分第一圖框與位元串流BS1的全部第一圖框所成的比例,以及與位元串流BS2的輔助資訊的第一圖框對應的位元串流BS1的輔助資訊的部分第二圖框與位元串流BS1的輔助資訊的全部第二圖框所成的比例,而且位元串流BS1的輔助資訊的第一圖框和第二圖框可以或者根據計算的結果進行均分或者內插。在這個方式中,位元串流BS1的輔助資訊的第一至第三圖框能夠分別與位元串流BS2的輔助資訊的第一至第三圖框同步,如圖33(b)所示。然後,位元串流BS1的輔助資訊和位元串流BS2的輔助資訊可以利用圖29所示的實施例中的方法進行合併。位元串流BS1和BS2的降混信號可以合併為一單一降混信號,而不需要延遲補償,即使該降混具有不同的信號延遲。在這個情況下,與信號延遲d2對應的延遲資訊可以儲存在通過合併位元串流BS1和位元串流BS2獲取的一合併位元串流內。
如果複數個物件編碼位元串流合併為一單一位元串流,則物件編碼位元串流的降混信號可能需要合併為一單一降混信號。為了將對應不同壓縮編碼解碼器的複數個降混信號合併為一單一降混信號,該降混信號可以轉換為PCM信號或者頻域信號,並且PCM信號或者頻域信號可以在一對應域內增加。其後,增加的結果可以利用一預定壓縮編碼解碼器轉換。不論在一PCM操作過程中還是在一頻域內增加降混信號,並且根據壓縮編碼解碼器的類型,都可能發生各種信號延遲。因為一解碼器不容易從需要解碼的一位元串流內識別各種信號,則說明各種信號延遲的延遲資訊可能需要包含在位元串流內。此延遲資訊可以代表一PCM信號內延遲採樣的數量或者一頻域內延遲採樣的數量。
本發明可以實現為一電腦可讀記錄媒體上編寫的電腦可讀碼。該電腦可讀記錄媒體可以為各種記錄裝置,用於將資料以一電腦可讀的方式儲存。電腦可讀記錄媒體的實例包括一ROM、一RAM、一CD-ROM、一磁帶、一軟碟、一光學資料記憶體以及一載波(例如,通過網際網路的資料傳輸)。該電腦可讀記錄媒體可
以在複數個與一網路連接的電腦系統上分佈,從而以一分散的方式寫入和執行電腦可讀碼。需要用於實現本發明的功能性程式,程式碼以及指令段可以方便本領域的技術人員瞭解本發明的內容。
如上所述,根據本發明,以物件為主的音訊編碼和解碼方法的優勢有益於為每一個物件信號定位聲音圖像。因此,可以在播放物件信號時提供更加真實的聲音。另外,本發明可以應用於互動遊戲,並可以因此提供給使用者一更加真實的虛擬現實環境。
本發明已經參考示範實施例而特別顯示以及描述過,熟知該技術領域的人士將了解,可以在不偏離如以下申請專利範圍所定義的本發明精神與範圍下,在此做形式以及細節上的不同改變。
100‧‧‧物件編碼器
111‧‧‧物件解碼器
113‧‧‧混合器/渲染器
120‧‧‧音訊解碼裝置
121‧‧‧物件解碼器
123‧‧‧混合器/渲染器
125‧‧‧參數轉換器
130‧‧‧音訊解碼器
131‧‧‧物件解碼器
133‧‧‧混合器/渲染器
140‧‧‧音訊解碼裝置
141‧‧‧多聲道解碼器
145‧‧‧參數轉換器
147‧‧‧ADG模組
150‧‧‧音訊解碼裝置
151‧‧‧多聲道雙耳聲解碼器
155‧‧‧參數轉換模組
157‧‧‧第一參數轉換器
159‧‧‧第二參數轉換器
160‧‧‧音訊解碼裝置
161‧‧‧前處理器
163‧‧‧多聲道解碼器
165‧‧‧參數轉換器
170‧‧‧音訊解碼裝置
171‧‧‧多聲道解碼器
173‧‧‧後處理器
175‧‧‧參數轉換器
180‧‧‧音訊解碼裝置
181‧‧‧前處理器
183‧‧‧多聲道解碼器
185‧‧‧後處理器
187‧‧‧參數轉換器
200‧‧‧音訊解碼裝置
201‧‧‧渲染矩陣產生器
203‧‧‧轉碼器
205‧‧‧多聲道解碼器
207‧‧‧前處理器
208‧‧‧效果處理器
209‧‧‧加法器
211‧‧‧OTT匣
213‧‧‧OTT匣
125‧‧‧OTT匣
127‧‧‧OTT匣
129‧‧‧OTT匣
221‧‧‧物件編碼器
223‧‧‧物件編碼器
225‧‧‧多工器
231‧‧‧物件編碼器
233‧‧‧物件編碼器
235‧‧‧物件編碼器
241‧‧‧多聲道編碼器
243‧‧‧物件編碼器
245‧‧‧多工器
251‧‧‧物件編碼器
253‧‧‧多聲道編碼器
255‧‧‧物件編碼器
257‧‧‧多工器
261‧‧‧第一匣
263‧‧‧第二匣
265‧‧‧第三匣
301‧‧‧分析模組1
303‧‧‧分析模組2
307‧‧‧解聯器
309‧‧‧混音器
圖1顯示了一典型以物件為主的音訊編碼/解碼系統的方塊圖;圖2顯示了本發明第一實施例中一音訊解碼裝置的方塊圖;圖3顯示了本發明第二實施例中一音訊解碼裝置的方塊圖;圖4顯示了本發明第三實施例中一音訊解碼裝置的方塊圖;圖5顯示了可以用在圖4所示的音訊解碼裝置內的一任意降混增益(ADG)模組的方塊圖;圖6顯示了本發明第四實施例中一音訊解碼裝置的方塊圖;圖7顯示了本發明第五實施例中一音訊解碼裝置的方塊圖;圖8顯示了本發明第六實施例中一音訊解碼裝置的方塊圖;圖9顯示了本發明第七實施例中一音訊解碼裝置的方塊圖;圖10顯示了本發明第八實施例中一音訊解碼裝置的方塊圖;圖11和圖12顯示了用於解釋一轉碼器運行的圖表;圖13至圖16顯示了用於解釋以物件為主的輔助資訊配置的圖表;圖17至圖22顯示了用於解釋將複數條以物件為主的輔助資訊合併為一單一條輔助資訊的圖表;圖23至圖27顯示了用於解釋一前處理操作的圖表;以及
圖28至圖33顯示了將複數個以物件為主信號解碼的位元串流合併為一個位元串流的情況。
120‧‧‧音訊解碼裝置
121‧‧‧物件解碼器
123‧‧‧混合器/渲染器
125‧‧‧參數轉換器
Claims (15)
- 一種音訊解碼方法,包括:接收一降混信號和以物件為主的輔助資訊,該降混信號包含至少兩個降混聲道信號,並且以降混至少一個物件信號而產生;從以物件為主的輔助資訊中擷取聲道分配比例資訊,該聲道分配比例資訊指出該物件信號分配至該等降混聲道信號的每一個當中之比例;依據聲道分配比例資訊,產生前處理資訊,用於修正包括在降混聲道信號中之至少一個物件信號;以及藉在降混聲道信號上應用前處理資訊,處理降混信號。
- 依據申請專利範圍第1項所述之音訊解碼方法,進一步包括:接收控制資訊,該控制資訊指出包括在降混信號中之物件信號的位置或位階;以及根據在以物件為主的輔助資訊和控制資訊,產生以聲道為主的輔助資訊。
- 依據申請專利範圍第2項所述之音訊解碼方法,進一步包括:根據在以聲道為主的輔助資訊和處理後的降混信號,產生一多聲道音訊信號。
- 依據申請專利範圍第1項所述之音訊解碼方法,其中該以物件為主的輔助資訊包含旗標資訊,該旗標資訊說明降混增益資訊是否包含在以物件為主的輔助資訊內。
- 一種音訊編碼方法,包括:藉降混至少一個物件信號產生一降混信號,該降混信號包括至少兩個降混聲道信號; 藉計算該物件信號分配至該等降混聲道信號的每一個當中之比例,產生聲道分配比例資訊;根據該至少一個物件信號,產生以物件為主的輔助資訊;以及將用於修正降混聲道信號的聲道分配比例資訊插入以物件為主的輔助資訊內。
- 依據申請專利範圍第5項所述之音訊編碼方法,進一步包括:藉將降混信號和以物件為主的輔助資訊合併,產生一位元串流。
- 依據申請專利範圍第6項所述之音訊編碼方法,其中該位元串流包括是否傳輸聲道分配比例資訊的旗標資訊。
- 一種音訊解碼裝置,包括:一多工解訊器,被配置用於從一輸入音訊信號內擷取一降混信號和以物件為主的輔助資訊,該降混信號包括至少兩個降混聲道信號;一轉碼器,被配置以擷取聲道分配比例資訊,該聲道分配比例資訊指出物件信號分配至該等降混聲道信號的每一個當中之比例,並根據聲道分配比例資訊,產生用於修正降混聲道信號的前處理資訊;以及一前處理器,被配置以藉在降混聲道信號上應用該前處理資訊,處理該降混信號。
- 依據申請專利範圍第8項所述之音訊解碼裝置,其中該多工解訊器進一步擷取控制資訊,該控制資訊指出包括在該降混信號中之物件信號的位置或位階,並且其中該轉碼器根據在以物件為主的輔助資訊和控制資訊,產生以聲道為主的輔助資訊。
- 依據申請專利範圍第9項所述之音訊解碼裝置,進一步包括: 一多聲道解碼器,該多聲道解碼器根據在以聲道為主的輔助資訊和處理後的降混信號,產生一多聲道音訊信號。
- 一種處理器可讀記錄媒體,在該處理器可讀記錄媒體上記錄一用以執行一處理器中依據申請專利範圍第1項所述之方法的程式。
- 一種電腦可讀記錄媒體,該電腦可讀記錄媒體上記錄有用以執行一音訊解碼方法的一電腦程式,該音訊解碼方法包括:接收一降混信號和以物件為主的輔助資訊,該降混信號包含至少兩個降混聲道信號;從以物件為主的輔助資訊中擷取聲道分配比例資訊,該聲道分配比例資訊指出該物件信號分配至該等降混聲道信號的每一個當中之比例;依據該聲道分配比例資訊,產生前處理資訊,用於修正降混聲道信號;以及藉在降混聲道信號上應用前處理資訊,處理降混信號。
- 依據申請專利範圍第12項所述之電腦可讀記錄媒體,其中該音訊解碼方法進一步包括:接收控制資訊,該控制資訊指出包括在降混信號中之物件信號的位置或位階;根據在以物件為主的輔助資訊和控制資訊,產生以聲道為主的輔助資訊;以及根據在以聲道為主的輔助資訊和處理後的降混信號,產生一多聲道音訊信號。
- 一種電腦可讀記錄媒體,該電腦可讀記錄媒體上記錄有用以執行一音訊編碼方法的一電腦程式,該音訊編碼方法包括: 藉降混至少一個物件信號產生一降混信號,該降混信號包括至少兩個降混聲道信號;藉計算該物件信號分配至該等降混聲道信號的每一個當中之比例,產生聲道分配比例資訊;根據該至少一個物件信號,產生以物件為主的輔助資訊;以及將用於修正降混聲道信號的聲道分配比例資訊插入以物件為主的輔助資訊內。
- 依據申請專利範圍第14項所述之電腦可讀記錄媒體,其中該音訊編碼方法進一步包括:藉將該降混信號以及以物件為主的輔助資訊合併,產生一位元串流。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US90108907P | 2007-02-14 | 2007-02-14 | |
US90164207P | 2007-02-16 | 2007-02-16 | |
US90381807P | 2007-02-28 | 2007-02-28 | |
US90768907P | 2007-04-13 | 2007-04-13 | |
US92402707P | 2007-04-27 | 2007-04-27 | |
US94762007P | 2007-07-02 | 2007-07-02 | |
US94837307P | 2007-07-06 | 2007-07-06 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200921642A TW200921642A (en) | 2009-05-16 |
TWI431610B true TWI431610B (zh) | 2014-03-21 |
Family
ID=39690272
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW097105208A TWI443647B (zh) | 2007-02-14 | 2008-02-14 | 用以將以物件為主之音訊信號編碼與解碼之方法與裝置 |
TW097105206A TWI396187B (zh) | 2007-02-14 | 2008-02-14 | 用於將以物件為主之音訊信號編碼與解碼之方法與裝置 |
TW097105210A TWI431610B (zh) | 2007-02-14 | 2008-02-14 | 用以將以物件為主之音訊信號編碼與解碼之方法與裝置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW097105208A TWI443647B (zh) | 2007-02-14 | 2008-02-14 | 用以將以物件為主之音訊信號編碼與解碼之方法與裝置 |
TW097105206A TWI396187B (zh) | 2007-02-14 | 2008-02-14 | 用於將以物件為主之音訊信號編碼與解碼之方法與裝置 |
Country Status (11)
Country | Link |
---|---|
US (7) | US8296158B2 (zh) |
EP (3) | EP2111617B1 (zh) |
JP (4) | JP5232795B2 (zh) |
KR (3) | KR101041825B1 (zh) |
AT (1) | ATE526659T1 (zh) |
AU (3) | AU2008215232B2 (zh) |
BR (2) | BRPI0802613A2 (zh) |
CA (3) | CA2645915C (zh) |
MX (3) | MX2008013078A (zh) |
TW (3) | TWI443647B (zh) |
WO (3) | WO2008100098A1 (zh) |
Families Citing this family (108)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4966981B2 (ja) * | 2006-02-03 | 2012-07-04 | 韓國電子通信研究院 | 空間キューを用いたマルチオブジェクト又はマルチチャネルオーディオ信号のレンダリング制御方法及びその装置 |
EP2595152A3 (en) * | 2006-12-27 | 2013-11-13 | Electronics and Telecommunications Research Institute | Transkoding apparatus |
EP3712888B1 (en) * | 2007-03-30 | 2024-05-08 | Electronics and Telecommunications Research Institute | Apparatus and method for coding and decoding multi object audio signal with multi channel |
US8321211B2 (en) * | 2008-02-28 | 2012-11-27 | University Of Kansas-Ku Medical Center Research Institute | System and method for multi-channel pitch detection |
KR101461685B1 (ko) * | 2008-03-31 | 2014-11-19 | 한국전자통신연구원 | 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치 |
US8670440B2 (en) | 2008-05-13 | 2014-03-11 | Electronics And Telecommunications Research Institute | Data transceiving apparatus and method in centralized MAC-based wireless communication system |
US8315396B2 (en) * | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
MX2011011399A (es) * | 2008-10-17 | 2012-06-27 | Univ Friedrich Alexander Er | Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto. |
ES2963744T3 (es) | 2008-10-29 | 2024-04-01 | Dolby Int Ab | Protección de recorte de señal usando metadatos de ganancia de audio preexistentes |
KR101600352B1 (ko) * | 2008-10-30 | 2016-03-07 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 장치 및 방법 |
WO2010087627A2 (en) * | 2009-01-28 | 2010-08-05 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
US8255821B2 (en) * | 2009-01-28 | 2012-08-28 | Lg Electronics Inc. | Method and an apparatus for decoding an audio signal |
WO2010090019A1 (ja) * | 2009-02-04 | 2010-08-12 | パナソニック株式会社 | 結合装置、遠隔通信システム及び結合方法 |
EP2395504B1 (en) * | 2009-02-13 | 2013-09-18 | Huawei Technologies Co., Ltd. | Stereo encoding method and apparatus |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
WO2010138309A1 (en) * | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Audio signal dynamic equalization processing control |
WO2010138311A1 (en) * | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Equalization profiles for dynamic equalization of audio data |
KR101387902B1 (ko) * | 2009-06-10 | 2014-04-22 | 한국전자통신연구원 | 다객체 오디오 신호를 부호화하는 방법 및 부호화 장치, 복호화 방법 및 복호화 장치, 그리고 트랜스코딩 방법 및 트랜스코더 |
US20100324915A1 (en) * | 2009-06-23 | 2010-12-23 | Electronic And Telecommunications Research Institute | Encoding and decoding apparatuses for high quality multi-channel audio codec |
KR101283783B1 (ko) * | 2009-06-23 | 2013-07-08 | 한국전자통신연구원 | 고품질 다채널 오디오 부호화 및 복호화 장치 |
ES2793958T3 (es) * | 2009-08-14 | 2020-11-17 | Dts Llc | Sistema para trasmitir adaptativamente objetos de audio |
TWI484473B (zh) * | 2009-10-30 | 2015-05-11 | Dolby Int Ab | 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統 |
AU2010321013B2 (en) * | 2009-11-20 | 2014-05-29 | Dolby International Ab | Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter |
CN102696070B (zh) * | 2010-01-06 | 2015-05-20 | Lg电子株式会社 | 处理音频信号的设备及其方法 |
US9112591B2 (en) * | 2010-04-16 | 2015-08-18 | Samsung Electronics Co., Ltd. | Apparatus for encoding/decoding multichannel signal and method thereof |
US8948403B2 (en) * | 2010-08-06 | 2015-02-03 | Samsung Electronics Co., Ltd. | Method of processing signal, encoding apparatus thereof, decoding apparatus thereof, and signal processing system |
EP2610865B1 (en) * | 2010-08-23 | 2014-07-23 | Panasonic Corporation | Audio signal processing device and audio signal processing method |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
TWI573131B (zh) * | 2011-03-16 | 2017-03-01 | Dts股份有限公司 | 用以編碼或解碼音訊聲軌之方法、音訊編碼處理器及音訊解碼處理器 |
CN103443854B (zh) | 2011-04-08 | 2016-06-08 | 杜比实验室特许公司 | 用于混合来自两个编码位流的音频节目的元数据的自动配置 |
JP5463385B2 (ja) * | 2011-06-03 | 2014-04-09 | アップル インコーポレイテッド | テキストデータとオーディオデータとの間のマッピングの自動作成 |
KR101783962B1 (ko) * | 2011-06-09 | 2017-10-10 | 삼성전자주식회사 | 3차원 오디오 신호를 부호화 및 복호화하는 방법 및 장치 |
US9754595B2 (en) | 2011-06-09 | 2017-09-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding 3-dimensional audio signal |
EP2560161A1 (en) | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
US20130065213A1 (en) * | 2011-09-13 | 2013-03-14 | Harman International Industries, Incorporated | System and method for adapting audio content for karaoke presentations |
IN2014CN03413A (zh) * | 2011-11-01 | 2015-07-03 | Koninkl Philips Nv | |
WO2013093821A1 (en) * | 2011-12-22 | 2013-06-27 | Koninklijke Philips Electronics N.V. | Wireless network configuration system and method |
CN104303229B (zh) | 2012-05-18 | 2017-09-12 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
EP2862370B1 (en) | 2012-06-19 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Rendering and playback of spatial audio using channel-based audio systems |
TWI453441B (zh) * | 2012-06-29 | 2014-09-21 | Zeroplus Technology Co Ltd | Signal decoding method |
US9190065B2 (en) | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9479886B2 (en) * | 2012-07-20 | 2016-10-25 | Qualcomm Incorporated | Scalable downmix design with feedback for object-based surround codec |
JP6045696B2 (ja) | 2012-07-31 | 2016-12-14 | インテレクチュアル ディスカバリー シーオー エルティディIntellectual Discovery Co.,Ltd. | オーディオ信号処理方法および装置 |
US9489954B2 (en) * | 2012-08-07 | 2016-11-08 | Dolby Laboratories Licensing Corporation | Encoding and rendering of object based audio indicative of game audio content |
EP2883226B1 (en) * | 2012-08-10 | 2016-08-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and methods for adapting audio information in spatial audio object coding |
BR122021021503B1 (pt) * | 2012-09-12 | 2023-04-11 | Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d |
US9460729B2 (en) * | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
KR20140046980A (ko) * | 2012-10-11 | 2014-04-21 | 한국전자통신연구원 | 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법 |
KR20140047509A (ko) | 2012-10-12 | 2014-04-22 | 한국전자통신연구원 | 객체 오디오 신호의 잔향 신호를 이용한 오디오 부/복호화 장치 |
CA2893729C (en) | 2012-12-04 | 2019-03-12 | Samsung Electronics Co., Ltd. | Audio providing apparatus and audio providing method |
EP2757558A1 (en) * | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
TWI530941B (zh) * | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
CA3211308A1 (en) | 2013-05-24 | 2014-11-27 | Dolby International Ab | Coding of audio scenes |
JP6248186B2 (ja) | 2013-05-24 | 2017-12-13 | ドルビー・インターナショナル・アーベー | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
EP2973551B1 (en) | 2013-05-24 | 2017-05-03 | Dolby International AB | Reconstruction of audio scenes from a downmix |
US9420393B2 (en) * | 2013-05-29 | 2016-08-16 | Qualcomm Incorporated | Binaural rendering of spherical harmonic coefficients |
EP3011764B1 (en) * | 2013-06-18 | 2018-11-21 | Dolby Laboratories Licensing Corporation | Bass management for audio rendering |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
EP3014901B1 (en) | 2013-06-28 | 2017-08-23 | Dolby Laboratories Licensing Corporation | Improved rendering of audio objects using discontinuous rendering-matrix updates |
EP2830049A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2830335A3 (en) | 2013-07-22 | 2015-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, and computer program for mapping first and second input channels to at least one output channel |
EP2830046A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal to obtain modified output signals |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830050A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
KR102243395B1 (ko) * | 2013-09-05 | 2021-04-22 | 한국전자통신연구원 | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 |
US10095468B2 (en) * | 2013-09-12 | 2018-10-09 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
CN105531759B (zh) * | 2013-09-12 | 2019-11-26 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
WO2015056383A1 (ja) | 2013-10-17 | 2015-04-23 | パナソニック株式会社 | オーディオエンコード装置及びオーディオデコード装置 |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
SG11201603116XA (en) | 2013-10-22 | 2016-05-30 | Fraunhofer Ges Forschung | Concept for combined dynamic range compression and guided clipping prevention for audio devices |
ES2755349T3 (es) | 2013-10-31 | 2020-04-22 | Dolby Laboratories Licensing Corp | Renderización binaural para auriculares utilizando procesamiento de metadatos |
EP2879131A1 (en) | 2013-11-27 | 2015-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder, encoder and method for informed loudness estimation in object-based audio coding systems |
US10492014B2 (en) | 2014-01-09 | 2019-11-26 | Dolby Laboratories Licensing Corporation | Spatial error metrics of audio content |
KR101567665B1 (ko) * | 2014-01-23 | 2015-11-10 | 재단법인 다차원 스마트 아이티 융합시스템 연구단 | 퍼스널 오디오 스튜디오 시스템 |
US9779739B2 (en) | 2014-03-20 | 2017-10-03 | Dts, Inc. | Residual encoding in an object-based audio system |
EP3151240B1 (en) * | 2014-05-30 | 2022-12-21 | Sony Group Corporation | Information processing device and information processing method |
US10373711B2 (en) | 2014-06-04 | 2019-08-06 | Nuance Communications, Inc. | Medical coding system with CDI clarification request notification |
US10754925B2 (en) | 2014-06-04 | 2020-08-25 | Nuance Communications, Inc. | NLU training with user corrections to engine annotations |
US10621994B2 (en) * | 2014-06-06 | 2020-04-14 | Sony Corporaiton | Audio signal processing device and method, encoding device and method, and program |
CN110895943B (zh) | 2014-07-01 | 2023-10-20 | 韩国电子通信研究院 | 处理多信道音频信号的方法和装置 |
US9774974B2 (en) | 2014-09-24 | 2017-09-26 | Electronics And Telecommunications Research Institute | Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion |
KR20220066996A (ko) * | 2014-10-01 | 2022-05-24 | 돌비 인터네셔널 에이비 | 오디오 인코더 및 디코더 |
CN106796809B (zh) | 2014-10-03 | 2019-08-09 | 杜比国际公司 | 个性化音频的智能访问 |
CA2982017A1 (en) * | 2015-04-10 | 2016-10-13 | Thomson Licensing | Method and device for encoding multiple audio signals, and method and device for decoding a mixture of multiple audio signals with improved separation |
US10136240B2 (en) | 2015-04-20 | 2018-11-20 | Dolby Laboratories Licensing Corporation | Processing audio data to compensate for partial hearing loss or an adverse hearing environment |
CN106303897A (zh) | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
WO2017035281A2 (en) | 2015-08-25 | 2017-03-02 | Dolby International Ab | Audio encoding and decoding using presentation transform parameters |
US10366687B2 (en) * | 2015-12-10 | 2019-07-30 | Nuance Communications, Inc. | System and methods for adapting neural network acoustic models |
CN107346493B (zh) * | 2016-05-04 | 2021-03-23 | 阿里巴巴集团控股有限公司 | 对象分配方法和装置 |
US10863297B2 (en) | 2016-06-01 | 2020-12-08 | Dolby International Ab | Method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position |
US10949602B2 (en) | 2016-09-20 | 2021-03-16 | Nuance Communications, Inc. | Sequencing medical codes methods and apparatus |
US9896031B1 (en) | 2017-01-03 | 2018-02-20 | Ford Global Technologies, Llc | Spatial auditory alerts for a vehicle |
US11133091B2 (en) | 2017-07-21 | 2021-09-28 | Nuance Communications, Inc. | Automated analysis system and method |
US11024424B2 (en) | 2017-10-27 | 2021-06-01 | Nuance Communications, Inc. | Computer assisted coding systems and methods |
GB201718341D0 (en) | 2017-11-06 | 2017-12-20 | Nokia Technologies Oy | Determination of targeted spatial audio parameters and associated spatial audio playback |
US10650834B2 (en) * | 2018-01-10 | 2020-05-12 | Savitech Corp. | Audio processing method and non-transitory computer readable medium |
GB2572650A (en) | 2018-04-06 | 2019-10-09 | Nokia Technologies Oy | Spatial audio parameters and associated spatial audio playback |
GB2574239A (en) | 2018-05-31 | 2019-12-04 | Nokia Technologies Oy | Signalling of spatial audio parameters |
GB2578625A (en) | 2018-11-01 | 2020-05-20 | Nokia Technologies Oy | Apparatus, methods and computer programs for encoding spatial metadata |
CN113168839B (zh) * | 2018-12-13 | 2024-01-23 | 杜比实验室特许公司 | 双端媒体智能 |
JP7092047B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 符号化復号方法、復号方法、これらの装置及びプログラム |
US11545166B2 (en) | 2019-07-02 | 2023-01-03 | Dolby International Ab | Using metadata to aggregate signal processing operations |
US11582572B2 (en) * | 2020-01-30 | 2023-02-14 | Bose Corporation | Surround sound location virtualization |
WO2022076404A1 (en) | 2020-10-05 | 2022-04-14 | The Trustees Of Columbia University In The City Of New York | Systems and methods for brain-informed speech separation |
CN112309419B (zh) * | 2020-10-30 | 2023-05-02 | 浙江蓝鸽科技有限公司 | 多路音频的降噪、输出方法及其系统 |
WO2023077284A1 (zh) * | 2021-11-02 | 2023-05-11 | 北京小米移动软件有限公司 | 一种信号编解码方法、装置、用户设备、网络侧设备及存储介质 |
Family Cites Families (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3882280A (en) | 1973-12-19 | 1975-05-06 | Magnavox Co | Method and apparatus for combining digitized information |
US6289308B1 (en) | 1990-06-01 | 2001-09-11 | U.S. Philips Corporation | Encoded wideband digital transmission signal and record carrier recorded with such a signal |
EP0562211A1 (en) | 1992-03-25 | 1993-09-29 | International Business Machines Corporation | Self-aligning fiber couplers |
TW272341B (zh) | 1993-07-16 | 1996-03-11 | Sony Co Ltd | |
JP3747492B2 (ja) | 1995-06-20 | 2006-02-22 | ソニー株式会社 | 音声信号の再生方法及び再生装置 |
US6505160B1 (en) | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
IT1281001B1 (it) | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
TW429700B (en) | 1997-02-26 | 2001-04-11 | Sony Corp | Information encoding method and apparatus, information decoding method and apparatus and information recording medium |
US7110662B1 (en) * | 1997-03-25 | 2006-09-19 | Samsung Electronics Co., Ltd. | Apparatus and method for recording data on a DVD-audio disk |
US6741796B1 (en) | 1997-03-25 | 2004-05-25 | Samsung Electronics, Co., Ltd. | DVD-Audio disk, and apparatus and method for playing the same |
US6449227B1 (en) | 1997-03-25 | 2002-09-10 | Samsung Electronics Co., Ltd. | DVD-audio disk, and apparatus and method for playing the same |
KR100261254B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
JP4132154B2 (ja) * | 1997-10-23 | 2008-08-13 | ソニー株式会社 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
KR100335609B1 (ko) | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
US20050120870A1 (en) | 1998-05-15 | 2005-06-09 | Ludwig Lester F. | Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications |
US7478042B2 (en) | 2000-11-30 | 2009-01-13 | Panasonic Corporation | Speech decoder that detects stationary noise signal regions |
TW501376B (en) | 2001-02-09 | 2002-09-01 | Elan Microelectronics Corp | Decoding device and method of digital audio |
US6849794B1 (en) | 2001-05-14 | 2005-02-01 | Ronnie C. Lau | Multiple channel system |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
MXPA03005133A (es) * | 2001-11-14 | 2004-04-02 | Matsushita Electric Ind Co Ltd | Dispositivo de codificacion, dispositivo de decodificacion y sistema de los mismos. |
US7149412B2 (en) | 2002-03-01 | 2006-12-12 | Thomson Licensing | Trick mode audio playback |
BR0304231A (pt) | 2002-04-10 | 2004-07-27 | Koninkl Philips Electronics Nv | Métodos para codificação de um sinal de canais múltiplos, método e disposição para decodificação de informação de sinal de canais múltiplos, sinal de dados incluindo informação de sinal de canais múltiplos, meio legìvel por computador, e, dispositivo para comunicação de um sinal de canais múltiplos |
DE60326782D1 (de) | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
EP1523863A1 (en) | 2002-07-16 | 2005-04-20 | Koninklijke Philips Electronics N.V. | Audio coding |
DE60327039D1 (de) | 2002-07-19 | 2009-05-20 | Nec Corp | Audiodekodierungseinrichtung, dekodierungsverfahren und programm |
JP2004064363A (ja) | 2002-07-29 | 2004-02-26 | Sony Corp | デジタルオーディオ処理方法、デジタルオーディオ処理装置およびデジタルオーディオ記録媒体 |
CA2464408C (en) | 2002-08-01 | 2012-02-21 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method for band expansion with aliasing suppression |
EP1543307B1 (en) | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
US9002716B2 (en) | 2002-12-02 | 2015-04-07 | Thomson Licensing | Method for describing the composition of audio signals |
EP1576602A4 (en) * | 2002-12-28 | 2008-05-28 | Samsung Electronics Co Ltd | METHOD AND DEVICE FOR MIXING AUDIO SEQUENCE AND INFORMATION RECORDING MEDIUM |
WO2004080125A1 (en) | 2003-03-04 | 2004-09-16 | Nokia Corporation | Support of a multichannel audio extension |
JP2004361731A (ja) | 2003-06-05 | 2004-12-24 | Nec Corp | オーディオ復号装置及びオーディオ復号方法 |
US8140164B2 (en) * | 2003-10-15 | 2012-03-20 | Rmx, Llc | Therapeutic diaphragm stimulation device and method |
US7617109B2 (en) | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
US7391870B2 (en) | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
KR100658222B1 (ko) | 2004-08-09 | 2006-12-15 | 한국전자통신연구원 | 3차원 디지털 멀티미디어 방송 시스템 |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
TWI237806B (en) * | 2004-11-03 | 2005-08-11 | Sunplus Technology Co Ltd | Audio decoding system with ring buffer and method thereof |
EP1817767B1 (en) | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
EP1691348A1 (en) | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
DE102005008366A1 (de) * | 2005-02-23 | 2006-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten |
TWI279712B (en) | 2005-04-13 | 2007-04-21 | Realtek Semiconductor Corp | Voice message encoding/decoding apparatus and its method |
AU2006266655B2 (en) | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
KR20070011100A (ko) | 2005-07-18 | 2007-01-24 | 엘지전자 주식회사 | 다채널 오디오 코딩에서 오디오 신호의 에너지 보정방법 및그 보정을 위한 부호화된 오디오 신호 생성방법 |
US8359341B2 (en) | 2005-12-10 | 2013-01-22 | International Business Machines Corporation | Importing content into a content management system using an e-mail application |
JP4966981B2 (ja) | 2006-02-03 | 2012-07-04 | 韓國電子通信研究院 | 空間キューを用いたマルチオブジェクト又はマルチチャネルオーディオ信号のレンダリング制御方法及びその装置 |
WO2007091870A1 (en) | 2006-02-09 | 2007-08-16 | Lg Electronics Inc. | Method for encoding and decoding object-based audio signal and apparatus thereof |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
DE102006029752A1 (de) | 2006-06-28 | 2008-01-10 | Basf Construction Polymers Gmbh | Verwendung von Methacrylat-Derivaten zur Verdickung salzhaltiger Medien |
CN101506875B (zh) | 2006-07-07 | 2012-12-19 | 弗劳恩霍夫应用研究促进协会 | 用于组合多个参数编码的音频源的设备和方法 |
AU2007271532B2 (en) | 2006-07-07 | 2011-03-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for combining multiple parametrically coded audio sources |
WO2008039038A1 (en) | 2006-09-29 | 2008-04-03 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi-object audio signal with various channel |
WO2008046530A2 (en) | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
DE602007013415D1 (de) * | 2006-10-16 | 2011-05-05 | Dolby Sweden Ab | Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung |
WO2008060111A1 (en) | 2006-11-15 | 2008-05-22 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
ES2452348T3 (es) * | 2007-04-26 | 2014-04-01 | Dolby International Ab | Aparato y procedimiento para sintetizar una señal de salida |
US8295494B2 (en) | 2007-08-13 | 2012-10-23 | Lg Electronics Inc. | Enhancing audio with remixing capability |
MX2010004220A (es) * | 2007-10-17 | 2010-06-11 | Fraunhofer Ges Forschung | Codificacion de audio usando mezcla descendente. |
-
2008
- 2008-02-14 CA CA2645915A patent/CA2645915C/en active Active
- 2008-02-14 WO PCT/KR2008/000883 patent/WO2008100098A1/en active Application Filing
- 2008-02-14 KR KR1020097001829A patent/KR101041825B1/ko active IP Right Grant
- 2008-02-14 AU AU2008215232A patent/AU2008215232B2/en active Active
- 2008-02-14 WO PCT/KR2008/000884 patent/WO2008100099A1/en active Application Filing
- 2008-02-14 MX MX2008013078A patent/MX2008013078A/es active IP Right Grant
- 2008-02-14 CA CA2645913A patent/CA2645913C/en active Active
- 2008-02-14 JP JP2009534511A patent/JP5232795B2/ja active Active
- 2008-02-14 BR BRPI0802613-0A patent/BRPI0802613A2/pt not_active IP Right Cessation
- 2008-02-14 AU AU2008215230A patent/AU2008215230B2/en active Active
- 2008-02-14 US US12/438,929 patent/US8296158B2/en active Active
- 2008-02-14 AU AU2008215231A patent/AU2008215231B2/en active Active
- 2008-02-14 JP JP2009532305A patent/JP5254983B2/ja active Active
- 2008-02-14 US US12/438,928 patent/US8271289B2/en active Active
- 2008-02-14 EP EP08712513.4A patent/EP2111617B1/en active Active
- 2008-02-14 TW TW097105208A patent/TWI443647B/zh active
- 2008-02-14 TW TW097105206A patent/TWI396187B/zh active
- 2008-02-14 KR KR1020097001828A patent/KR101069268B1/ko active IP Right Grant
- 2008-02-14 EP EP08712511A patent/EP2115739A4/en not_active Ceased
- 2008-02-14 EP EP08712512A patent/EP2111616B1/en active Active
- 2008-02-14 BR BRPI0802614-9A patent/BRPI0802614A2/pt not_active IP Right Cessation
- 2008-02-14 MX MX2008012986A patent/MX2008012986A/es active IP Right Grant
- 2008-02-14 MX MX2008013073A patent/MX2008013073A/es active IP Right Grant
- 2008-02-14 CA CA2645912A patent/CA2645912C/en active Active
- 2008-02-14 AT AT08712512T patent/ATE526659T1/de not_active IP Right Cessation
- 2008-02-14 US US12/438,938 patent/US8756066B2/en active Active
- 2008-02-14 TW TW097105210A patent/TWI431610B/zh active
- 2008-02-14 WO PCT/KR2008/000885 patent/WO2008100100A1/en active Application Filing
- 2008-02-14 KR KR1020097001827A patent/KR101049143B1/ko active IP Right Grant
- 2008-02-14 JP JP2009532306A patent/JP2010506232A/ja active Pending
-
2011
- 2011-02-11 US US13/026,190 patent/US8417531B2/en active Active
- 2011-02-11 US US13/026,172 patent/US8204756B2/en active Active
- 2011-02-11 US US13/026,182 patent/US8234122B2/en active Active
-
2012
- 2012-05-28 JP JP2012120606A patent/JP5291227B2/ja not_active Expired - Fee Related
-
2014
- 2014-06-16 US US14/306,169 patent/US9449601B2/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI431610B (zh) | 用以將以物件為主之音訊信號編碼與解碼之方法與裝置 | |
RU2449388C2 (ru) | Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов |