TWI305639B - Apparatus and method for generating a multi-channel output signal - Google Patents
Apparatus and method for generating a multi-channel output signal Download PDFInfo
- Publication number
- TWI305639B TWI305639B TW094122951A TW94122951A TWI305639B TW I305639 B TWI305639 B TW I305639B TW 094122951 A TW094122951 A TW 094122951A TW 94122951 A TW94122951 A TW 94122951A TW I305639 B TWI305639 B TW I305639B
- Authority
- TW
- Taiwan
- Prior art keywords
- channel
- input
- channels
- transmission
- output
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 62
- 230000005540 biological transmission Effects 0.000 claims abstract description 141
- 230000002829 reductive effect Effects 0.000 claims abstract description 18
- 238000002156 mixing Methods 0.000 claims description 55
- 230000000694 effects Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 15
- 238000003379 elimination reaction Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 230000008030 elimination Effects 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 230000001419 dependent effect Effects 0.000 claims description 4
- 210000003734 kidney Anatomy 0.000 claims 1
- 238000013461 design Methods 0.000 description 23
- 239000011159 matrix material Substances 0.000 description 23
- 230000033458 reproduction Effects 0.000 description 20
- 230000015572 biosynthetic process Effects 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 239000000203 mixture Substances 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 238000011144 upstream manufacturing Methods 0.000 description 7
- 230000010365 information processing Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- KJUCPVIVNLPLEE-UHFFFAOYSA-N 2,6-difluoro-n-[2-fluoro-5-[5-[2-[(6-morpholin-4-ylpyridin-3-yl)amino]pyrimidin-4-yl]-2-propan-2-yl-1,3-thiazol-4-yl]phenyl]benzenesulfonamide Chemical compound S1C(C(C)C)=NC(C=2C=C(NS(=O)(=O)C=3C(=CC=CC=3F)F)C(F)=CC=2)=C1C(N=1)=CC=NC=1NC(C=N1)=CC=C1N1CCOCC1 KJUCPVIVNLPLEE-UHFFFAOYSA-N 0.000 description 1
- 101001099542 Aspergillus niger Pectin lyase A Proteins 0.000 description 1
- 101100117236 Drosophila melanogaster speck gene Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000036962 time dependent Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Mobile Radio Communication Systems (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Logic Circuits (AREA)
- Time-Division Multiplex Systems (AREA)
Description
1305639 九、發明說明: 【發明所屬之技術領域】 本發明有關多重聲道解碼法,且特別地有關其中至少四 個傳輸聲道存在,亦即,其係立體聲可相容之多重聲道解碼 法。 【先前技術】 近來,多重聲道之聲頻再生技術正呈現越來越重要。此 可能由於諸如熟知之mp3技術的聲頻壓縮/編碼技術已可 經由網際網路或其他具有受限帶寬之傳輸聲道來散佈聲頻 記錄之故;該ra p 3編碼技術已變得如此有名係因爲其可允許 以立體聲格式來散佈所有該等記錄,亦即,以包含一第一或 立體聲左聲道及一第二或右立體聲道之聲頻記錄之數位表 示的格式。 儘管如此,仍存在有習知兩聲道聲音系統的基本缺點。 因此,已發展環繞技術’所建議之多重聲道環繞表示包含除 了該兩立體聲聲道L及R之外的附加之中心聲道c以及兩 個環繞聲道Ls及Rs。此參考聲音格式亦稱爲三/二立體 聲,其意指三個前置聲道及兩個環繞聲道。通常,需要五個 傳輸聲道。在一播放環境中,至少需要五個在個別五個不同 位置處的揚聲器來取得最佳悅耳之點於距離該五個良好配 置之揚聲器的某一距離中。 用以降低多重聲道聲頻信號之傳輸所需之資料數量的 若干技術於本項技藝中爲已知。該等技術稱爲結合立體聲技 術。爲達此目的,請參閱桌10圖,其顯示一結合立體聲裝 1305639 置60。此裝置可爲一實施例如強度立體聲(is)或雙耳提示編 碼法(BCC)之裝置,此一裝置大致地接收至少兩聲道(CH1, CH2,…CHn)爲輸入’及輸出一單一載波聲道及參數資料,該 參數資料係界定使得原始聲道(CH1,CH2,…CHn)之近似値 可於解碼器中計算。 典型地,該載波聲道將包含副頻帶取樣,頻譜係數,時 間域取樣等,其提供基礎信號之相當精細的表示;而參數-資 料並不包含頻譜係數之該等取樣,而是包含控制參數以用於· ^ 控制諸如藉乘法之評權,時間轉移法,頻率轉移法,…之若 干再現的算式。因此,該參數資料僅包含信號或相關連聲道 之相當粗略的表示。若以數字予以說明時,一載波聲道所需 之資料數量將在6 0至7 0仟位元/秒的範圍中,而用於以聲 道之參數側資訊所需之資料數量將在1 · 5至2 · 5仟位元/秒 的範圍中。用於參數資料之實例係熟知之標度因子,強度立 體聲資訊或雙耳提示參數,如下文將予以描述者。 強度立體聲編碼法係描述於1 994年2月阿姆斯特丹市 i AES 預干[J 3799,J. Herre,K.H. Brandenburg, D. Lederer 之 “強度立體聲編碼法”中。大致,強度立體聲之槪念係依據 欲施加於立體聲頻兩聲道之資料的主軸轉換。若大多數之資 料點係集中於第一主軸周圍,則編碼增益可在編碼法之前藉 旋轉兩信號某一角度而達成。然而,此並非一直適用於實際 的立體聲產生技術。因此,此技術係藉排除第二正交成分於 位元資料流中之傳輸而予以修正。所以,用於左及右聲道之 重視信號包含不同加權或標度形式之同一經傳輸之信號。儘 1305639 管如此’雖重視之信號將相異於其振幅,但就其相位資訊而 言卻係相同的。而且,兩者原始聲頻聲道之能量時間包封將 藉由典型地以頻率選擇方式操作之選擇性標度之操作予以 維持。此相符於高頻處之人類的聲音感覺,其中主要之空間 提示係由能量包封所決定。 此外’在實用之施行中,經傳輸之信號,亦即,載波聲 道係由左聲道與右聲道之加和信號所產生而取代旋轉兩者 成分。再者,此處理,亦即,產生強度立體聲參數用以執行 標度操作係執行頻率選擇性,亦即,無關於各標度因子頻 帶’亦即,執行編碼器頻率分隔。較佳地,兩聲道組合以形 成一組合的或“載波”聲道,且除了該組合聲道之外,該強 度立體聲資訊係依據第一聲道之能量,第二聲道之能量或組 合聲道之能量予以決定。 BCC技術係描述於AES會議記錄5 574, “施加於立體 聲及多重聲道聲頻壓縮之雙耳提示編碼法” ,C. Faller,F. Baumgarte,2002年5月,慕尼黑。在BCC編碼法中,若干 聲頻輸入聲道利用DFT爲主之變換藉重疊窗而轉換爲頻譜 表示,產生之均勻頻譜劃分爲各具有一指數之非重疊分隔。 各分隔具有成比例於等效矩形帶寬(ERB)之帶寛。聲道間之 位準差異(ICLD)及道通間之時間差異(IC TD)則估算用於各 訊框k之各分隔。ICLD及ICTD量化及編碼而產生BCC位 元資料流,該聲道間之位準差異及聲道間之時間差異係給與 相關於一參考聲道之各聲道,然後,根據指定之方程式來計 算以欲處理之信號的若干分隔爲主之參數。 1305639 在解碼器側,解碼器接收無立體聲之信號及BCC位元 資料流。該無立體聲之信號轉換爲頻率域且輸入於亦接收經 解碼之ICLD及ICTD値的空間合成區塊。在該空間合成區 塊中,係用該等BCC參數(ICLD及ICTD)値來執行該無立體 聲之信號以合成多重聲道信號,在頻率/時間轉換之後,該 多重聲道信號表示原始多重聲頻信號之再生。 在BCC之例子中’結合立體聲模組60係操作以輸出聲 道側資訊,使得參數聲道資料爲量化的及編碼的ICLD或 ^ ICTD參數,其中該等原始聲道之一使用爲用以編碼聲道例 資訊之參考聲道。 大致,該載波聲道係由參與之原始聲道的加和所形成。 自然地,上述技術僅提供解碼器之無立體聲之表示,其 只能處理載波聲道而無法處理用以產生超過一輸入聲道之 一或更多近似値的參數資料。 熟知爲雙耳提示編碼法(BCC)之聲頻編碼技術亦詳述於 美國專利申請案公告 US2003/0219130 A1,2003/0026441 A1 ® 及2003 /003 5 5 5 3 A1中。此外,另外請參閱2003年1 1月之 “雙耳提示編碼法,第II部分:設計及應用” ,C. Faller 及 F. Baumgarte, IEEE Trans. On Audio and Speck Proc.,第 1 1冊,第6號。該等引例之美國專利申請案公告以及由Faller 及Baumgarte所著作之兩個在BCC技術上之所引例的技術刊 物將整個結合於本文中供參考。 在下文中,將參照第1 1至1 3圖詳細說明用於多重聲道 聲頻編碼法之一般典型的BCC設計。第Η圖顯示此一用於 1305639 多重聲道聲頻信號之編碼/傳輸之一般的雙耳提示編碼設 計;在BCC編碼器112之輸入110處的多重聲道聲頻輸入 信號係下行混波於一下行混波區塊1 1 4中。在此實例中’在 輸入110處之原始多重聲道信號爲具有在前聲道,右前聲 道,在環繞聲道,右環繞聲道及中心聲道之5聲道環繞信號。 例如該下行區塊114藉該等五聲道之簡單加法而產生一加和 信號爲無立體聲之信號。其他下行混波設計於本項技術中係 已知,使得具有單一聲道之下行混波信號可利用多重聲道輸 • 入信號而取得。此單一聲道輸出於加和信號線1 1 5處。藉 B C C分析區塊1 1 6所取得之側邊資訊則輸出於側邊資訊線 1 17之處。在該BCC分析區塊中’聲道間之位準差異(ICLD) 及聲道間之時間差異(ICTD)係如上文所描繪地計算。近來’ 該BCC分析區塊116已增加而亦計算聲道間之校正値(ICC 値)。較佳地,該加和信號及側邊信號以量化及編碼之形式 傳輸至BCC解碼器120。該BCC解碼器120解壓縮該經傳 輸之加和信號爲若干副頻帶且施加標度,延遲及其他處理以 B 產生經輸出之多重聲道聲頻信號之副頻帶。此處理係執行使 得在輸出121處之經再現之多重聲道信號的IC LD,IC TD及 ICC參數(提示)相似於進入BCC編碼器內之輸入110處的原 始多重聲道信號之個別提示。爲達此目的,該BCC解碼器 120包含一 BCC合成區塊122及一側邊資訊處理區塊I23。 在下文中,將參照第12圖解說該BCC合成區塊122的 內部結構。在線1 1 5上之加和信號輸入於時間/頻率轉換單 元或濾波器排組(FB) 125。在該區塊125之輸出處’當聲頻 1305639 濾波器排組12 5執行1 : 1轉換,亦即,從N個時間域取樣 來產生N個頻譜係數之一種轉換時,存在有N個副頻道信 號,或者在一極端之例子中,存在有一區塊之頻譜係數。 討BCC合成區塊122進一步包含一延遲級126, 一位準 修正級127,一相互關係處理級128及一反相濾波器排組 (IFB)129;在該級129之輸出處,具有例如在5聲道環繞系 統之例子中之五聲道的經再現多聲道聲頻信號可輸出至一 組揚聲器1 24,如第1 1圖中所描繪。 如第12圖中所示,輸出信號s(n)利用元件125而轉換 爲頻率域或濾波器排組域。由元件1 25所輸出之信號藉乘法 節點1 3 0予以相乘,使取得如圖示之相同信號的若千形式。 大致原始信號的各形式數目相等於在輸出信號之輸出聲道 的數目,大致,當節點130處之各形式的原始信號接受若干 延遲h,d2…,di,…,dN時,原始信號之形式的數目將相等 於欲重現之輸出信號中的輸出聲道數目;該等延遲參數由第 11圖中之側邊資訊處理區塊123計算及導出自例如由BCC 分析區塊1 1 6所決定之聲道間的時間差異。 其亦可正確用於乘法參數als a2,…,ai,…,aN,亦即, 可依據例如由B C C分析區塊1 1 6所計算之聲道間的位準差 異,藉該側邊資訊處理區塊1 2 3來計算該等乘法參數》 由B C C分析區塊1 1 6所計算之I C C參數係使用於控制 區塊1 2 8的功能性,使得經延遲及經位準調整之信號間的若 干相互關係可獲得於區塊128之輸出處。此處,應注意的是, 該等級1 2 6 , 1 2 7 , 1 2 8間之順序可相異於第1 2圖中所示之例 1305639 子。 此處,應注意的是,在聲頻信號之有關訊框之處理中, 該BCC分析係有關訊框,亦即,時變地,且亦有關頻率執 行,此意指可取得BCC參數供各頻譜頻帶用。此意謂者, 在該聲頻濾波器排組125解壓縮輸入信號爲例如32個帶通 信號的例子中,該BCC分析區塊將獲得一組用於各該32頻 帶的BCC參數。自然,來自第11圖之詳細地顯示於第12 圖中之BCC合成區塊122將執行亦以該實例中之32頻帶爲 β主之重現。 下文中,請參閱第13圖,該圖顯示一決定若干BCC參 數之配置。通常,ICLD,ICTD及ICC參數可界定於配對之 聲道間。然而,較佳的是決定ICLD及ICTD參數於一參考 聲道與各其他聲道之間。此描繪於第13A圖之中。 ICC參數可以以不同方式界定。最常用者,可估算ice 參數於第1 3 B圖中所示之所有可行的聲道配對間之編碼器 中;在此例子中,解碼器將合成IC C,使其大約地相同於所 B 有可行聲道配對間之原始多重聲道信號中。然而,所提出的 僅在於估算各時間之最強的兩聲道間之ICC參數,此設計描 繪於顯示一實例之第1 3 C圖中’其中在一時間例子時,][c c 參數估算於聲道1與2之間’而在另一時間例子時,ICC參 數則計算於聲道1與5之間。然後,解碼器合成該等最強聲 道間之聲道間的相互關係及應用若干啓發式法則供計算及 合成剩餘聲道配對之聲道間的相干性。 例如有關依據經傳輸之ICLD參數來計算乘法參數,可 1305639 參考上文引例之AES會議記錄5574,該等ICLD參數表示原 始多重聲道信號中之能量分佈。一般,在第1 3 A圖中所示的 是,存在有四個ICLD參數顯示所有聲道與左前聲道間之能 量差異。在側邊資訊處理區塊123中,該等乘法參數ai,…,aN 產生自ICLD參數,使得所有經再現之輸出聲道的總能量相 等於(或成比例於)經傳輸之加和信號的能量。用以決定該等 參數的簡單方式係一種兩階段方法,其中在一第一階段中, 用於左前聲道之乘法因子設定於1而用於第13A圖中之其他 聲道的乘法因子則設定爲該經傳輸之ICLD値。然後,在一 第二階段中,計算所有五個聲道之能量及比較於該經傳輸之 加和信號的能量。接著,利用一致於所有聲道之下列標度因 子來下行標度所有聲道,其中該下行標度因子係選擇使得所 有再現之輸出聲道的總能量在下行標度之後相等於經傳輸 之加和信號的總能量。 自然地,存在有其他用以計算乘法因子之方法,其並未 依賴該兩階段之方法,而是僅需一階段方法。 有關延遲參數應注意的是,當用於左前聲道之延遲參數 d!設定於零時,可直接使用傳輸自BCC編碼器之延遲參數 ICTD。此處,不必執行再標度,因爲延遲並不改變信號之能 量。 有關聲道間相干性測量從BCC編碼器傳輸至BCC解碼 器之ICC,應注意的是,此處之相干性調處可藉諸如相乘所 有副頻帶之評權因子與具有[201〇g10(-6)與201ogl0(6)]範圍 之隨機數而修正乘法因子a,,…,an而完成。較佳地,虛擬 1305639 隨機數序係選擇使得變化大約地恆常於所有關鍵性頻帶,且 該平均値在各關鍵性頻帶之內爲零。相同的數序係應用於各 不同訊框之頻譜係數。因此,聲頻影像寬度可藉修正虛擬隨 機數序之變化而予以控制。愈大的變化會產生更大的影像寬 度。變化修正可執行於關鍵性帶寬之個別頻帶之中。此使多 重目標能同時存在於聽覺環境中而各目標具有不同的影像 寬度。用於該虛擬隨機數序之合適的振幅分佈係對數標度上 之均勻分佈,例如美國專利申請公告第2003/0219130 A1中 所描述。儘管如此,所有BCC合成處理係相關於如第1 1圖 中所示之從BCC編碼器至BCC解碼器之傳輸爲加和信號之 單一輸入聲道。 爲了以可相容之方式’亦即,以可瞭解於一般立體聲解 碼器之位元資料流格式而傳輸該五個聲道,已使用例如描述 於“MUSICAM環繞:一種可相容於IS〇 11172-3之通用型 多重聲道編碼系統” ,G. Theile及G. Stoll,AES預刊 _ 3 403,1 992年10月,舊金山,之中所謂矩陣化技術,該五 個輸入聲道L,R, C,Ls,及RS提供於一用以執行矩陣化操 作之矩陣化裝置中而從該五個輸入聲道計算基本的或可相 容的立體聲聲道Lo, R0。特別地,該等基本的立體聲頻道 L〇/R0係計算如下式所示:
Lo = L + xC + yLs Ro = R + xC + yRs 其中X及y爲常數。其他三個聲道c,Ls,Rs係傳輸爲 它們在除了基本立體聲層之外的擴充層之中,該基本立體聲 -14- 1305639 層包含基本立體聲信號Lo及R〇的編碼形式;相對於該位元 資料流’此Lo/Ro基本立體聲層包含一標頭,諸如標度因子 之資訊以及副頻帶取樣。該多重聲道擴充層,亦即,中心聲 道及兩個環繞聲道包含於多重聲道擴充欄之中,該多重聲道 擴充欄。 在解調器側’執行反向矩陣化操作以形成左及右聲道之 重現於利用基本立體聲聲道Lo及Ro以及三個附加聲道之五 聲道表示中。此外,該三個附加聲道係解碼自輔助資訊以獲 得原始多重聲道聲頻信號之經解碼的五個聲道或環繞表示。 用於多重聲道編碼之另一方式描述於刊物“改良式 MPEG-2聲頻多重聲道編碼法”中,b. Grill, J. Herre, Κ·Η_ Brandenburg,Ε· Eberlein,J. Koller,J. Mueller,AES 預刊 3865, 1994年2月,阿姆斯特丹,其中爲了獲得後退可相容 性,考慮到後退可相容之模式。爲此目的,係使用可相容性 矩陣而自原始之五輸入聲道取得兩個所謂之下行混波聲道 Lc,Rc。此外,可動態地選擇傳輸爲輔助資料之輔助聲道。 爲發展立體之不相干性,係應用結合立體聲技術於成群 之聲道,例如三個前聲道,亦即,用於左聲道,右聲道及中 心聲道;爲此目的,該等三個聲道組合以取得一組合聲道, 此組合聲道量化及包裝爲位元資料流。然後,此組合聲道與 相對應之結合立體聲資訊一起輸入於結合立體聲解碼模組 內而獲得結合立體聲經解碼之聲道,亦即’結合立體聲經解 碼之左聲道,結合立體聲經解碼之右聲道以及結合立體聲經 解碼之中心聲道;該等結合立體聲經解碼之聲道與在環繞聲 1305639 道及右環繞聲道一起輸入於可相容性矩陣區塊內以形成第 一及第二下行混波聲道Lc,Rc。然後,量化形成之兩下行混 波聲道與量化形式之該組合聲道包裝爲具有結合立體聲編 碼參數在一起的位元資料流。 因此,利用強度立體聲編碼法,獨立的原始聲道信號之 組群可傳輸於單一部分之“載波”資料內。然後,解碼器重 視所包含之信號爲相符之資料,該等資料係根據其原始之能 量時間包封而再標度。因此,該等經傳輸之聲道的線性組合 ^ 將產生相當不同於原始下行混波之結果,此可依據強度立體 聲槪念而應用於任一種類之結合立體聲編碼法。用於提供可 相容之下行混波聲道的編碼系統,存在有一直接之影響:如 先前刊物中之所述,藉解矩陣法之再現會遭遇到不完全再現 所造成的缺陷;利用其中左,右及中心聲道之結合立體聲編 碼執行於編碼器中的矩陣化之前的所謂結合立體聲預失真 設計可減輕此問題。在此方式中,因爲在編碼器側之上,已 使用結合立體聲經解碼之信號以產生下行混波信號。故,用 B 於再現之解矩陣設計將引進少許缺陷。所以不完全之再現過 程將轉移到可相容之下行混波頻道Lc及RC內,其中該不完 全之再現過程極可能地由聲頻信號本身所遮掩。 雖然,此一系統因爲解矩陣於解碼器側之上而僅只產生 少許缺陷,但其具有若干缺點。一缺點係該立體聲可相容之 下行混波頻道Lc及Rc並非產生原始聲道而是衍生自原始聲 道之強度立體聲經編碼/解碼的形式。因此,由於該強度立 體聲編碼系統之資料損失會包含於可相容之下行混波頻道 -16- 1305639 中。因而,一僅解碼除了該增強之強度立體聲經編碼之聲道 外的可相容聲道之僅立體聲解碼器將提供一受到強度立體 聲所引起之資料損失所影響的輸出信號。 此外,除了該兩個下行混聲道外之完整的附加聲道必須 予以傳輸。此聲道係一組合聲道,其利用左聲道,右聲道及 中心聲道之結合立體聲解碼而形成。附加地,由該組合聲道 再現該等原始聲道L,R,C之強度立體聲資訊亦必須傳輸至 解碼器。在解碼器之處,執行反向矩陣化,亦即,解矩陣化 • 操作而從兩下行混波頻道來產生環繞頻道。此外,該原始之 左,右及中心聲道係藉結合立體聲解碼法,利用經傳輸之組 合聲道及經傳輸之結合立體聲參數而使近似。因此,應注意 的是,原始之左,右及中心聲道係藉組合聲道之結合立體聲 解碼而產生。 第1 1圖中所示之BCC設計的增強係一具有至少兩個聲 頻傳輸聲道之BCC設計,使得可獲得一立體聲可相容之處 理。在編碼器中,C個輸入聲道下行混波爲E個傳輸之聲頻 ® 聲道。在若干配對之輸入聲道間的ICTD,ICLD及ICC提示 係估算爲頻率及時間之函數。經估算之提示傳輸至解碼器當 作側邊資訊。具有C個輸入聲道及E個傳輸聲道之BCC設 計表示爲C-2-E BCC。 槪估而言,BCC處理係經傳輸之聲道的頻率選擇性,時 間變化性之後處理。在下文中,隨著絕對瞭解於此,將不再 介紹頻帶指數。代替地,假設諸如sn,yn,an等之變數爲 具有維量(1,f)之向量,其中f表示頻帶的數目。 1305639 所謂規則性BCC設計係描述於2002年5月C. Faller 及 F. Baumgarte 之 P r ep r i nt 1 1 21 h C ο nv · A ud · En gl · S o c ·,中 的“應用於立體聲及多重聲道聲頻壓縮之雙耳提示編碼 法"之中;F. Baumgarte及C. Faller之“雙耳提示編碼法一 第I部:聲頻心理學基本及設計原理” ,IEEE Trans. On Speech and Audio Proc.,第 11 冊,第 6 號,2003 年 11 月, 之中;以及C. Faller及F_ Baumgarte之“雙耳提示編碼法-第 II 部:設計及應用”,IEEE Trans. On Speech and Audio _ Pro c.,第11冊,第6號,2003年11月,之中。此處,具 有如第11圖中所示的單一傳輸之聲頻聲道係用於立體聲或 多重聲道聲頻播放之現有無立體聲系統之後退可相容之擴 充,因爲經傳輸之單一聲頻聲道係一有效之無立體聲信號, 其適用於藉傳統接收器播放。 然而,大多數所安裝之聲頻廣播的外結構(類比及數位 放音機,電視機等)以及聲頻儲存系統(塑膠唱片,小型音 匣,精緻碟片,VHS視頻,MP3聲音儲存等)係以兩聲道立 B 體聲爲主;另一方面,符合5.1標準(Rec_ ITU-R BS.755, 具有或不具有附圖之多重聲道立體聲系統,ITU,1 993, http://www.itu.org)之“家庭劇院系統”正呈現更受歡迎; 因此,如 J· Herre,C. Faller,C. Ertel, J. Hilper, A. Hoelzer, 及 C. Spenger 於 2004 年 5 月,在 Preprint 116th Conv. Aud. Eng. Soc.,(第1 16屆傳統聲頻工程協會頂刊)中之“ MP3環 繞:多重聲道聲頻之有效及可相容之編碼法”中所述,具有 兩個傳輸聲道之BCC(C至2 BCC)係特別專注於擴充現有的 1305639 立體聲系統於擴充現有的立體聲系統於多聲道環繞。關於此 點,亦請參考美國專利申請案“用以建構多重聲道輸出信號 或用以產生下行混波信號之裝置及方法” ,U S申請案號第 10/762,100 號,2004 年 1 月 20 日申請。 在類比域中,諸如“杜比環繞”,“杜比後邏輯”,及 “杜比後邏輯II” (J. Hull, “環繞音響過去’現在’及未 來” ,Techn. Rep.(技術代表),杜比實驗室,1 999年, www.dolbv.com/tech/ ; R. Dressier, 杜比環繞後邏輯 II 解碼器-操作原理”,Techn Rep.,杜比實驗室’ 2000年’ www.dolbv.com/tech/)之矩陣化算式已流行多年。該等算式 應用“矩陣化”供映像5.1聲頻聲道於立體聲可相容之聲道 配對。然而,相較於 J. Herre,C. Faller,C. Ertel,J_ Hilpert, A. Hoelzer 及 C. Spenger 於 2004 年 5 月之 Preprint 116th Conv. Aud. Eng. Soc.中之“ MP3環繞:多重聲道聲頻之有效 及可相容之編碼法”,矩陣化算式僅提供有效降低之可撓性 及品質。若已考慮限制矩陣化算式於當混波聲頻信號供5 · 1 環繞用之時’則可減少此缺點之若干效應’例如其係描述於 J. Hilson之“具有杜比後邏輯Π技術之混波法” ’Techn. Re.杜比實驗室 ’ 2004 年’ www.dolbv.com/tech/PLII.Mixing丄 J i m H i 1 s 〇 n · h t m 1 中。 C至2 B C C可視爲具有相似於具備額外協助者側邊資訊 之矩陣化算式的功能性之設計’然而’因其支援從任一數目 之原始聲道映像於任一數目之傳輸聲道’故以其本質而言’ 其係更爲通用的;C至E BCC係打算用於數位域且其低的位 1305639 元速率之額外側邊資訊通常可以以後退之可相容方式包含 於現有的資料傳輸中,此意指傳統接收器將忽略該額外側邊 資訊且直接地播放兩個經傳輸之聲道,例如其係描述於2 0 0 4 年 5 月 Preprint 1 16th Conv. Aud. Eng. Soc.中之 J. Herre,C · F a 11 e r,C E r t e 1,J · H i 1 p e 11,A · Η o e 1 z e r 及 C . S p e n g e r 的 “ MP3環繞:多重聲道聲頻之有效及可相容之編碼法”中。 永久的目標在於完成一相似於所有原始聲頻聲道之分別傳 輸的聲頻品質,亦即,大大地比可期望自傳統矩陣化算式之 •品質更佳的品質。 在下文中,將參照第6a圖以便描繪從左聲道L或Xi,右 聲道R或x2,中心聲道C或x3,左環繞聲道SL或X4及右 環繞聲道sR或x5之五個輸入聲道產生兩個傳輸聲道之習知 編碼器下行混波操作;該下行混波情勢示意地顯示於第6a 圖中,明顯地,第一傳輸聲道y i係利用左聲道x 1,中心聲 道x3及左環繞聲道X4所形成;此外,第6a圖顯示該右傳輸 聲道y 2係利用右聲道X 2,中心聲道X 3及右環繞聲道X 5所形 •成。 大致較佳之下行混波法則或下行混波矩陣係顯示於第 6C圖中,呈明顯的是,中心聲道X3藉評權因子1/A予以 加權,意指中心聲道χ3之能量的第一半部置入於左傳輸聲 道或第一傳輸聲道Lt之內,而在中心聲道中之能量的第二 半部則引入於第二傳輸聲道或右傳輸半Rt之內,因此,該 下行混波會映像該等輸入聲道於傳輸聲道,該下行混波係藉 映像η個輸入取樣至m個輸出取樣之(m, η)矩陣予以便利地 -20 - 1305639 描述’此矩陣之輸入係在加和而形成相關之輸出聲道之前施 加於相對應之聲道的權値。 存在有不同的下行混波方法可發現於ITU推薦中(Rec. ITU-RBS.775,具有或不具有附圖之多重聲道立體聲系統, IT U,1 9 9 3,http://www_itu.org)。此外,參考 2004 年 5 月 Preprint 116th Conv. Aud. Eng. Soc.中之 J. Herre,C. Faller, C. Ertel,J. Hilpert,A. Hoelzer 及 C. Spenger 的 “MP3環繞:多重聲道聲頻之有效及可相容之編碼法”第 ® 4.2節中以相對於不同的下行混波方法;該下行混波可執行 於時間域中或頻率域中,其可時變於信號適用方式或頻率 (頻帶)相依中,聲道指定係由矩陣顯示於第6a圖之右邊且獲 得如下:
^左聲道 j 右聲道 中心聲道 左後聲道 、右後聲道」 所以,用於5至2 BCC之重要例子,一經傳輸之聲道係 計算自右聲道,右後聲道及中心聲道,以及另一經傳輸之聲 道則計算自左聲道’左後聲道及中心聲道,而相對應於 D -1"1 〇 女 1 〇1 52 — L。1 古。ij 之實例的下行混波矩陣,其亦顯示於第6 c圖中。 -2 1- 1305639 在此下行混波矩陣中,評權因子可選擇使得各行中之該 等値的平方和爲1,使得各輸入信號之功率均等地給與該等 下行混波之信號;當然亦可使用其他的下行混波設計。 特定地,請參閱第6b或7b圖,其顯示編碼器下行混波 設計之特定實施’顯示用於一副頻帶之處理;在各副頻帶 中,控制標度因子e!及e2以“等化”下行混波信號中之信 號成分的響度;在此例子中,該下行混波執行於頻率域中, 具有指定頻率域副頻帶時間指數之變數η(第7b圖),以及k m w 爲經變換之時間域信號區塊之指數;尤其,顯示評權裝置, 用以在藉個別之加和裝置引入中心聲道之加權形式至左傳 輸聲道及右傳輸聲道內之前評權該中心聲道。 在解碼器中之相對應上行混波係相對於第7a,7b及7c 圖而顯示;在該解碼器中,必須計算上行混波,該上行混波 可映像傳輸聲道至輸出聲道,該上行混波可便利地藉映像i 個傳輸取樣至j個輸出取樣之(i,j)矩陣(i列,j行)予以描 g 述;同樣地,此矩陣之輸入係在加和而形成相關之輸出聲道 之前施加於相對應之聲道的權値。該上行混波可執行於時間 域中或頻率域中;此外,其可時變於信號適用方式或頻率(頻 帶)相依中。例如相對於下行混波矩陣,該等矩陣輸入之絕 對値並不表示輸出聲道之最終權値,因爲該等經上行混波之 聲道會進一步地在BCC處理的例子中修正,尤其,該修正 可利用諸如ICLD等之空間提示所提供之資訊而發生;在此 實例中之此處,所有輸入係設定於〇或1。 第7 a圖顯示5個揚聲器環繞系統之上行混波情勢。除 -22 - 1305639 了各揚聲器之外,顯示使用於BCC合成之基礎 地,相對於左環繞輸出聲道,使用第一傳輸聲道 道亦爲正確。此聲道係使用爲基礎聲道,亦稱 道”。 至於右輸出聲道及右環繞輸出聲道,它們亦 聲道,亦即,第二或右傳輸聲道y2。有關中心聲 應注意的是,用於B C C中心聲道合成之基礎聲 7 c圖中所示之上行混波矩陣而形成,亦即,藉相 _聲道。 給定該兩傳輸聲道而產生5聲道輸出信號之 第7b圖中。此處,該上行混波執行於頻率域中 頻率域副頻帶時間指數之變數η,以及k爲經變 信號區塊之指數。此處,應注意的是,ICTD及 應用於使用相同基礎聲道之聲道配對之間,亦即 左聲道與左後聲道之間,以及在右聲道與右後聲 第7b圖中以A所表示之兩區塊包含用於2聲道 1設計。 估算於編碼器之用以計算解碼器輸出信號 參數所必須之側邊資訊包含下列提示:△ L ! 2,△ △ L15, ri4, T25, C14,及 c25(ALij 係聲道 i 與 j 差異,r ij係聲道i與j之間的時間差異,以及 與j之間的相互關係係數。)。此處,應注意的是 其他的位準差異;需存在有足夠的資訊於解碼器 如用於BCC合成之標度因子,延遲等。 聲道。特別 yi。又左聲 “左傳輸聲 使用相同的 道,此處, 道係根據第 加該兩傳輸 方法顯示於 ,具有指示 換之時間域 ICC合成係 ,分別地在 道之間。在 ICC合成之 合成的所有 > L 1 3 , Δ L 1 4 , 之間的位準 Cij爲聲道i ,亦可使用 用以計算例 -23 - 1305639 在下文中,請參閱第7d圖以進一步描繪用於各聲道之 位準修正,亦即,ai之計算及隨後之並未顯示於第7b圖中 之總常態化。較佳地,傳輸聲道間之位準差異△ Li當作側邊 資訊,亦即,當作ICLD ;應用於聲道信號必須使用參考聲 道Fref與欲計算之聲道Fi間之指數關係,此係顯示於第7d 圖之頂部。 未顯示於第7b圖中的是隨後或最終之總常態化,其可 發生於相互關係區塊A之前或相互關係區塊A之後。當相 ^ 互關係區塊影響到由ai所加權之聲道的能量時,則總常態 位應發生於相互關係區塊A之後。爲確定所有輸出聲道之能 量相等於所有傳輸聲道之能量,參考聲道係如第7d圖中所 示地標示。較佳地,該參考聲道爲經平方之傳輸聲道的加和 之根。 在下文中,將說明相關連於該等下行混波/上行混波的 問題。當考慮如第6及7圖中所描繪之5至2 BCC設計時, _ 下文將呈明顯。 原始之中心聲道引入於該兩傳輸聲道之內,且藉此,亦 引入於經再現之左及右輸出聲道之內。 此外,在此設計中,共同中心之促成具有相同振幅於該 兩再現之輸出聲道中。 此外,在解碼期間,原始中心信號係係由產生自該等經 傳輸之左及右聲道的中心信號所置換,且因而無法獨立於 (亦即,無相互關係於)該等經再現之左及右聲道。 此效應具有不利的影響於具有極寬廣聲音影像之信號 -24- 1305639 的音感品質之上,該極寬廣之聲音影像係藉所有聲頻聲道間 之高度的解相互關係(亦即’低相干性)予以特徵化。該等信 號之實例爲,當使用具有足夠寬之間隔的不同麥克風來產生 原始多重聲道信號時之喝采觀眾的聲音。針對該等信號,經 解碼之聲音的聲音影像將變得更窄且其天生之寬廣性將降 低。 【發明內容】 本發明之目的在於提供一種較高品質之多重聲道再現 ^ 觀念,其可產生具有改善之音感的多聲道輸出信號。 根據本發明之第一觀念’此目的係藉一種用以產生具有 K個輸出聲道之多重聲道輸出信號之裝置而達成’該多重聲 道輸出信號利用E個傳輸聲道以相對應於具有c個輸入聲道 之多重聲道輸入信號,該E個傳輸聲道表示一具有C個輸入 聲道當作輸入及利用相關於該等輸入聲道之參數的側邊資 訊的下行混波操作之結果’其中E係2 2,C係>E,及K係 >1且SC,以及其中該下行混波操作有效於引入一第一輸入 聲道於一第一傳輸聲道中及一第二傳輸聲道中,且附加地引 入一第二輸入聲道於該第一傳輸聲道中,該裝置包含:一消 除聲道計算器,用以利用相關於包含在該第一傳輸聲道’該 第二傳輸聲道或該參數的側邊資訊中之第一輸入聲道的資 訊來計算一消除聲道;一組合器,用以組合該消除聲道及該 第一傳輸聲道或其之一經處理的形式而獲得一第二基礎聲 道,其中相較於該第一輸入聲道在該第一傳輸聲道上之影 響,該第一輸入聲道之影響會降低;以及一聲道再現器’用 -25 - 1305639 以利用該第二基礎聲道及相關於該第二輸入聲道之參數的 側邊資訊來再現一相對應於該第二輸入聲道之第二輸出聲 道,及用以利用一相異於該第二基礎聲道之第一基礎聲道及 相關於該第一輸入聲道之參數的側邊資訊來再現一相對應 於該第一輸入聲道之第一輸出聲道,其中該第一聲道之影響 相較於該第二基礎聲道會更高。 根據本發明之第二觀點,此目的係藉一種用以產生具有 K個輸出聲道之多重聲道輸出信號之方法而達成’該多重聲 ®道輸出信號利用E個傳輸聲道以相對應於具有C個輸入聲道 之多重聲道輸入信號,該E個傳輸聲道表示一具有C個輸入 聲道之多重聲道輸入信號,該E個傳輸聲道表示一具有C個 輸入通當作輸入及利用相關於該等輸入聲道之參數的側邊 資訊之下行混波操作之結果,其中E係2 2 ’ C係〉E ’及K 係> 1且各C,以及其中該下行混波操作有效於引入一第一輸 入聲道於一第一傳輸聲道中及一第二傳輸聲道中’且附加地 引入一第二輸入聲道於該第一傳輸聲道中’該方法包含:利 ® 用相關於包含該在該第一傳輸聲道,該第二傳輸聲道或該參 數的側邊資訊中之第一輸入聲道的資訊來計算—消除聲 道;組合該消除聲道及該第一傳輸聲道或其之一經處理的形 式而獲得一第二基礎聲道,其中相較於該第一輸入聲道在該 第一傳輸聲道上之影響,該第一輸入聲道之影響會降低;以 及利用下行混波操作該第二基礎聲道及相關於該第二輸入 聲道之參數的側邊資訊來再現一相對應於該第二輸入聲道 之第二輸出聲道,及利用一相異於該第二基礎聲道之第一基 -26- 1305639 礎聲道及相關於該第一輸入聲道之參數的側邊資訊來再現 一相對應於該第一輸入聲道之第一輸出聲道,其中該第一聲 道之影響相較於該第二基礎聲道會更高。 根據本發明之第三觀點,此目的係藉一種具有程式碼之 電腦程式而達成’當該程式運轉於一電腦上之時,用以執行 一用以產生多重聲道輸出信號之方法。 此處’應注意的是,較佳地,K等於C。儘管如此,亦 可再現較少的輸出聲道,諸如三個輸出聲道L, R,c而不再 ^ 現Ls及Rs。在此例子中’該K( = 3)個輸出聲道相對應於三 個原始C( = 5)個輸入聲道L,R, C。 本發明係根據發現下列而改善多重聲道輸出信號的聲 音品質,一某一基礎聲道係藉組合傳輸聲道及消除聲道而計 算,其係計算於接收器或解碼器端;該消除聲道係計算使得 藉組合該消除聲道及傳輸聲道所獲得之修正的基礎聲道具 有降低之中心聲道影響,亦即,具有降低其係引入於該兩傳 輸聲道內之中心聲道的影響。換言之,相較於其中並不計算 ® 及組合該消除聲道於傳輸聲道之情勢,不可避免地發生於當 執行下行混波及隨後之上行混波操作時之中心聲道(引入於 兩傳輸聲道內之聲道)的影響會降低。 相較於先前技術,例如並未單純地使用左傳輸聲道爲用 以再現左聲道或左環繞聲道的基礎聲道而言;本發明相對於 此’使左傳輸聲道藉組合於消除聲道而予以修正,使得在用 以再現左或右輸出聲道的基礎聲道中之原始中心輸入聲道 的影響會降低而甚至完全地消除。 -27 - 1305639 獨創地,該消除聲道利用已存在於解碼器或多重聲道輸 出產生器之原始中心聲道上的資訊而計算於解碼器。在該中 心聲道上之資訊包含於左傳輸聲道,右傳輸聲道及參數的側 邊資訊中,諸如在用於中心聲道之位準差異,時間差異或相 互關係參數。根據若干實施例,所有此資訊可使用以獲得高 品質中心聲道消除。然而,在其他較低層級之實施例中,僅 使用中心輸入聲道上之此資訊的一部分,此資訊可爲左傳輸 聲道,右傳輸聲道或參數的側邊資訊。此外,亦可使用編碼 ® 器中所估算及傳輸至解碼器之資訊。 因此,在5至2的環境中,左傳輸聲道或右傳輸聲道並 未直接地使用於左邊及右邊之現現,而是藉組合於消除聲道 以獲得一相異於相對應傳輸聲道之經修正的基礎聲道。較佳 地,將依據執行於編碼器以產生傳輸聲道之下行混波操作之 附加的加權因子亦包含消除聲道之計算中。在5至2環境 中,至少兩個消除聲道將予以計算,使得各傳輸聲道可以與 指定之消除聲道組合以獲得經修正的基礎聲道,用以分別地
W 再現左及左環繞輸出聲道以及右及右環繞輸出聲道。 本發明可結合於若干系統或應用之內,包含例如數位視 頻播放器,數位聲頻播放器,電腦,衛星接收器,有線接收 器,陸上廣播接收器,及家庭娛樂系統。 【實施方式】 在將給定較佳實施例之詳細說明之前,當作本發明基礎 之問題及該等問題之解決將以一般術語予以描述,用以改善 經再現之輸出聲道的聽覺空間影像之本發明技術可應用於 -28 - 1305639 當輸入聲道混波於一c至E參數之多重聲道系統中超過一個 傳輸聲道的所有例子,較佳實施例爲本發明在雙耳提示編碼 (BCC)系統中之實施。爲簡明且不失其一般性起見,本發明 技術將描述於用於以後退可相容方式編碼/解碼5 · 1環繞信 號之B C C設計的特定例。 上述聽覺影像寬度降低之問題大多發生於含有來自不 同方向之諸如在任一種現場記錄中的觀察喝采信號之獨立 快速重複性的暫態;雖然該影像寬度降低在原理上可利用較 ® 高的時間解析於ICLD合成而予以解決,但此將導致增大的 側邊資訊速率且亦需改變所使用之分析/合成濾波器排組 的窗口大小;此處應注意的是,此或然率會附加地造成音調 成分上的負面效應,因爲時間解析度之增加會自動地意謂著 頻率解析度之減少。 取代地,本發明爲一種簡單的觀念,其並不具有該等缺 點且打算降低中心聲道信號成分在側邊聲道中的影響。 如相關於第7a至7d圖中已描述地,用於5至2 BCC之 1 五個經重現之輸出聲道的基礎聲道爲 (k) = γ, (k) = (^:)+¾ (k)!^2 + jc4 (A) s2(k) = y2{k) = 3c2 W+ x3 W/V2 + x5{k) si {k) = y, (k)+y2 (k) = 5c, {k)+x2 {k) + (k) + (k) + x5 (k) ^s{k) = s2{k)
應注意的是,原始中心聲道信號成分的X3將出現3dB 之放大於中心基礎聲道副頻帶s 3中(因子1 / ’以及3 d B 之衰減於其餘(側邊聲道)基礎聲道副頻帶中。 -29 - 1305639 根據本發明,爲進一步衰減在側邊基礎聲道副頻帶信號 之中心聲道信號成分的影響,將應用下文之大致槪念如第2 圖中所描繪。 最後經解碼之中心聲道信號的估算較佳地藉標度其爲 由諸如BCC環境中之ICLD値的相對應位準資訊所描述之所 企望靶標位準而加以計算。較佳地,此經解碼之中心信號係 計算於頻譜域之中以便節省計算’亦即,不施加合成濾波器 排組之處理。 此外,相對應於消除聲道之此中心解碼之信號或中心再 現之信號可予以加權’且然後組合於其他輸出聲道之基礎聲 道信號。此組合較佳地爲減法。雖如此’但當加權因子具有 不同的正負號時,則加法亦可造成中心聲道在使用於再現左 或右輸出聲道的基礎聲道中之影響降低。此處理將形成一用 於左及左環繞聲道之再現或用於右及右環繞聲道之再現之 經修正的基礎聲道。較佳地,-3 dB之加權因子爲較佳的’但 任一其他値亦係可行的。 取代使用於第7b圖中之原始傳輸基礎聲道信號’經修 正之基礎聲道信號係使用於其他輸出聲道’亦即’除了中心 聲道外之該等聲道之經解碼輸出聲道的計算。 在下文中,將參照第2圖說明本發明槪念之方塊圖。第 2圖顯示一種用以產生具有κ個輸出聲道之多重聲道輸出信 號之裝置,該多重聲道輸出信號利用Ε個傳輸聲道以相對應 於具有C個輸入聲道之多重聲道輸入信號’該Ε個傳輸聲道 表示一具有C個輸入通當作輸入及利用該等輸入聲道上之 -30- 1305639 參數的側邊資訊的下行混波操作之結果,其中E g 2,C>E, 及K> 1且S C。此外,該下行混波操作下行混波操作有效於 引入一第一輸入聲道於一第一傳輸聲道中及一第二傳輸聲 道中。本發明之裝置包含消除聲道計算器20以計算至少一 消除聲道21,該消除聲道21輸入於組合器22內,組合器 22在一第二輸入23處直接地接收第一傳輸聲道或該第一傳 輸聲道之經處理的形式。爲獲得第一傳輸聲道之經處理的形 式,第一傳輸聲道之處理係藉由處理器24執行,該處理器 • 24可存在若干實施例中,但大致地,其係選用的。該組合器 操作以獲得第二基礎聲道25,用以輸入於聲道再現器26之 內。 聲道再現器利用第二基礎聲道25及在另一輸入27處輸 入於聲道再現器26之原始在輸入聲道上之參數的側邊資訊 而產生第二輸出聲道。在該聲道再現器26之輸出處,可獲 得第二輸出聲道2 8,其可爲經再現之左輸聲道,相較於第 7b圖中之設想情況,其係藉基礎聲道產生,相較於第7b圖 B 中之情勢,其具有原始輸入之中心聲道的小影響或甚至全部 消除之影響。 如上文已述地,雖然如第7b圖所示地產生之左輸出聲 道包含某一影響,但此某一影響會降低於如第2圖中所產生 之第二基礎聲道,因爲消除聲道與第一傳輸聲道或經處理之 第一傳輸聲道組合之故。 如第2圖中所示地,該消除聲道計算器2 0利用原始中 心聲道上有效爲解碼器之資訊,亦即,用以產生多重聲道輸 1305639 出信號的資訊來計算消除聲道;此資訊包含第一輸入聲道30 上之參數的側邊資訊,或包含第一傳輸聲道3 1 ’因下行混波 操作之故,該第一傳輸聲道31亦包含中心聲道上之若干資 訊,或包含第二傳輸聲道32 ’因下行混波操作之故’該第二 傳輸聲道32亦包含中心聲道上之資訊。較佳地,所有此資 訊係使用於中心聲道之最佳重現以獲得消除聲道2 1。 此一最佳之實施例將接著相對於第3及4圖描述。相較 於第2圖,第3圖顯示第2圖之雙重裝置,亦即,一用於消 • 除中心聲道之影響於左基礎聲道S1及右基礎聲道S2的裝 置。來自第2圖之消除聲道計算器20包含一中心聲道再現 裝置20a及一加權裝置20b以獲得消除聲道21於該加權裝 置之輸出處。第2圖中之組合器22係一簡單的減法器,其 操作而從第一傳輸聲道3 1減去消除聲道2 1,以獲得就第2 圖而言之第二基礎聲道25,用以再現第二輸出聲道(諸如左 輸出聲道)及選用地亦再現左環繞輸出聲道。經再現之中心 聲道x3(k)可獲得於該中心聲道再現裝置20a之輸出處。 m ¥ 第4圖指示實施爲電路圖之較佳實施例,其使用已相對 於第3圖所說明之技術。此外,第4圖顯示頻率選擇性處理, 其係最佳地適用於積體於一直行之頻率選擇性B C C再現裝 置。 中心聲道再現2 6藉加和該兩傳輸聲道於加法器4 0中而 發生。然後使用聲道位準差異之參數的側邊資訊或如第7d 圖中所示之產生自聲道間位準差異之因子a3以產生一修正 形式之第一基礎聲道(以第2圖之觀點),其係輸入於第2圖 -32 - 1305639 中第一基礎聲道輸入29處之聲道再現器26內;在乘法器41 之輸出處之經再現的中心聲道可使用於中心聲道輸出再現 (在第7d圖中所述之一般常態化之後)。 爲確認中心聲道在用於左及右再現之基礎聲道中的影 響,施加1 / W的加權因子,其係利用第4圖中之乘法器42 來描繪;然後,供給該經再現及再加權之中心聲道回到相對 應於第2圖中組合器22之加法器43a及43b。 因此,第二基礎聲道Si* 34(或32及s5)相異於傳輸聲 ® 道yi,其中相較於第7b圖中之例子,中心聲道之影響會降 低。 所產生之基礎聲道副頻帶係以數學用語提供如下: sx(k) = y^k) - a^kXy^k) + y2(k)) / 4l s2(k) = y2(^) - a^kXy.ik) + y2(k)) / 4Ϊ
Uk) = m) + Uk) 式⑻=^⑻ s^k) = s2(k) p 所以,第4圖之裝置提供從側邊聲道之基礎聲道減去中心聲 道之副頻帶估算,以爲了改善該等聲道間之獨立性,且因 此,提供該經再現輸出的多重聲道信號較佳的空間寬度。 本發明之另一實施例將參照第5a及5b圖來加以說明, 以決定一相異於第3圖中所計算之消除聲道的消除聲道。相 較於第3圖,第4圖之實施例’用以計算第二基礎聲道si (k) 之消除聲道21並未產生自第一傳輸聲道以及第二傳輸聲 道,而是利用某一加權因子x_lr而單獨地產生自第二傳輸 聲道y2(k),其可藉第5a圖中之乘法裝置51予以描繪。因 1305639 此,第5a圖中之消除聲道21不但相異於第3圖中之消除聲 道,而且可提供中心聲道在使用於再現第二輸出聲道’亦 即,左輸出聲道xl(k)之基礎聲道sl(k)上之影響的降低。 在第5 a圖之實施例中,亦顯示處理器24之較佳實施 例。特別地,該處理器24係實施爲另一乘法裝置52 ’其藉 乘法因子(l_x_l〇來應用乘法。較佳地,如第5a圖中所示, 由處理器24施加於第一傳輸聲道之乘法因子將依據使用於 相乘該第二傳輸聲道以獲得消除聲道21之_法因子51。最 ® 後,使用組合器22之輸入23處之第一傳輸聲道的經處理形 式供給合用,該組合包含從第一傳輸聲道的經處理形式減去 該消除聲道21。此等再產生第二基礎聲道25而具有原始中 心輸入聲道之降低的或完全消除的影響。 如第5a圖中所示,重複相同的程序而在進入右/右環繞 再現裝置的輸入處獲得第三基礎聲道s2(k);然而,如第5a 圖中所示,第三基礎聲道S2(k)藉組合第二傳輸聲道yl(k) 之經處理的形式與另一由第一傳輸聲道y 1 (k)透過乘法裝置 ® 54中之乘法所產生之消除聲道53而獲得,該乘法裝置54 具有乘法因子x_rl,其可一致於裝置51之x_lr,但亦可相 異於此値。如第5 a圖中所示之用以處理第二傳輸的處理器 爲乘法裝置5 5 ;用以組合第二消除聲道5 3與第二傳輸聲道 y2(k)之經處理形式的組合器係由參考符號56描繪於第5a 圖中。來自第2圖之消除聲道計算器進一步包含一用以計算 消除係數之裝置,以參考符號57表示於第5a圖中。該裝置 5 7可操作以獲得諸如聲道間位準差異等之參數的側邊資訊 -34 - 1305639 於原始或輸入之中心聲道。此係相同於第3圖中之裝置 20a,其中中心聲道再現裝20a亦包含一輸入’用以接收諸 如位準値或聲道間位準差異等之參數的側邊資訊。 下列方程式 =么⑻-占加说⑻+歹2(欠))/ W =、ι -含)歹办)-含歹2(欠) 运2〇0 =歹2〇〇 - a3〇)(i^(Jc) + 歹2⑻)/ W =〔1 -为>2⑻-@ 私欠) W ^ ® 顯示第5 a圖實施例之數學說明,且在其右側一方面描繪消 除聲道計算器中之消除處理及另一方面描繪處理器中之消 除處理(第2圖中之2 1,24)。在此特定實施例中,描繪於此 之因子x_lr與x_rl係彼此相同。 上述實施例明顯指出,本發明包含如左及右傳輸聲道之 信號適用線性組合的再現基礎聲道之組成,此一形態描繪於 第5 a圖中。 g 當從不同角度予以檢視時,本發明裝置亦可理解爲一動 態的上行混波程序’其中使用不同的上行混波矩陣於各副頻 帶及各時間例k。此一動態之上行混波矩陣描繪於第5b圖 中。應注意的是’此一上行混波矩陣U存在於各副頻帶,亦 即’存在於第4圖中之濾波器排組裝置的各輸出。關於時間 相依方式,應注意的是,第5b圖包含時間指數k。當具有各 時間指數之位準資訊時,上行混波矩陣將從各時間例改變至 下一時間。然而’當相同的位準資訊a3使用於整個區塊之 藉輸入濾波器排組FB轉換爲頻率表示的値時,則値a3將出 5 1305639 現於整個區塊之例如ι〇24或2048之取樣値。在此例中,除 了從値到値改變之外,該上行混波矩陣在時間方向中從區塊 到區塊改變。儘管如此,仍存在有使參數之位準値平穩之技 術,使得可在以某一頻帶上行混波之期間獲得不同振幅修正 因子a3。 槪括而言,亦可利用供輸出之中心聲道副頻帶計算用的 不同因子及供“動態上行混波”用的因子而產生因子a3,其 係如上述所計算之a3的經標度形式。 在一較佳實施例中,中心成分消除的加權強度可適當地 利用從編碼器到解碼器之側邊資訊的明確傳輸予以控制。在 此例中,第2圖中所示之消除聲道計算器20將包含一進一 步的控制輸入,其接收一明確之控制信號,該信號可計算以 指示在左聲道與中心聲道或右聲道與中心聲道間之直接的 相依性。關於此點,該控制信號將不同於中心聲道與左聲道 的位準差異,因爲該等位準差異相關於一種虛參考聲道,其 可爲第一傳輸聲道中之能量的總和以及第二傳輸聲道中之 能量的總和,如第7d圖之頂部所描繪。 例如,此一控制參數可指出,中心聲道在臨限値之下且 趨近於零,然而存在有信號於左聲道或右聲道中,其在臨限 値之上。在此例子中,消除聲道計算器對於相對應控制信號 的適當反應將是關閉聲道消除及施加如第7b圖中所示之一 般上行混波設計,用以避免並未存在輸入中之中心聲道的 “過度消除”,關於此點,此將爲如上述之控制加權強度之 極端種類。 -36- 1305639 從第4圖明顯得知,較佳地,執行無時間延遲處理操作 以計算再現之中心聲道。此係有利的,因爲其中回授之作業 不必考慮到任何的時間延遲。儘管如此,當使用原始中心聲 道爲參考聲道用以計算時間差異di時,可予以達成而不會 損及品質。此係相同於任何相互關係之手段。較佳地,並不 執行任何用以再現中心聲道之相互關係處理。依據相互關係 計算之種類,當使用原始中心聲道爲任何相互關係參數之參 考時’可予以達成而不會損及品質。 應注意的是’本發明並不依據某一下行混波之設計。此 意指可利用自動下行混波下行混波操作或由聲音工程師所 執行之聲道動下行混波設計。甚至可利用自動產生之參數資 訊伴隨有手動產生之下行混波聲道。 依據應用環境,本發明之用以再現或產生的方法可實施 於硬體中或軟體中。此實施可爲一諸如具有可電子讀取式控 制信號之碟片或CD之數位儲存媒體,其可結合於可程式化 之電腦系統,使得本發明之方法得以執行。因此,槪括而言, 本發明亦相關於一種具有程式碼儲存於一可機械讀取載體 上之電腦程式產品,當電腦程式產品運轉於電腦上之時,該 程式碼適用於執行本發明之方法。換言之,因此,本發明亦 相關於一種具有程式碼之電腦程式,當電腦程式運轉於電腦 上之時可用以執行該等方法。 本發明可使用於連接或結合於種種不同的應用或系統 之內’包含用於電視或電子音樂分佈,廣播,輸出,及/或 接收之系統。該等系統包含用以經由下文予以解碼/編碼傳 1305639 輸之系統,例如經由陸地,衛星,有線,網際網路,網內網 路’或實體媒體(例如精緻碟片,數位多功能碟片,半導體 晶片’硬碟驅動器’記憶體及類似物);本發明亦可採用於 遊戲及遊戲系統中’包含例如打算與使用者互動供娛樂用之 互動式軟體產品(動作’角色扮演,策略,冒險,模擬,競 賽’運動,遊樂器,插卡及機板遊戲)及/或可公開於多重 機器,平台或媒體之教育。進一步地,本發明可結合於聲頻 播放器或CD-ROM/DVD系統’本發明亦可結合爲pc軟體 ®應用’該PC軟體應用可結合數位解碼(例如播放器,解碼器) 及結合數位編碼能力之軟體應用(例如編碼器,轉換器,記 錄器,及自動點唱機)。 【圖示簡單說明】 本發明之較佳實施例係藉引用附圖予以描述,其中 第1圖係產生傳輸聲道及參數側邊資訊於輸入聲道上之 多重聲道編碼器的方塊圖; 第2圖係根據本發明之用以產生多重聲道輸出信號之較 佳裝置的示意方塊圖; 第3圖係根據本發明第一實施例之本發明裝置的示意 圖; 第4圖係第3圖之較佳實施例的電路實施; 第5 a圖係根據本發明第二實施例之本發明裝置的方塊 圖; 第5 b圖係如第5 a圖中所示之動態上行混波的數學式表 示; -38- 1305639 第6a圖係用以描繪下行混波操作之槪略B 第6b圖係用以實施第6圖之下行混波操f 第6c圖係下行混波操作之數學式表示; 第7a圖係示意圖,用以指示使用於上行 聲可相容環境中的基礎聲道; 第7b圖係電路圖,用以在一立體聲環境 道之再現; 第7c圖係使用於第7b圖中之上行混波矩 7[\ > - 第7d圖係數學式描繪用於各聲道之位準 總常態化; 第8圖描繪一編碼器; 第9圖描繪一解碼器; 第10圖描繪一先前技術之結合立體聲編: 第1 1圖係先前技術之BCC編碼器/解碼 S式; 有的電路圖; 混波於一立體 中實施多重聲 陣的數學式表 修正及隨後之 碼器; 器系統的方塊 前技術實施的 參數之熟知設 圖 表 示 « » 第 1 2圖係第 1 1 圖之BCC 合成區塊之先 方 塊 圖 , 以及 第 1 3圖係用 以 決 定 ICLD , ICTD 及 ICC 計 的 圖 式 0 ί 元 件 符 號說明】 20 消 除 聲 道計算器 21 消 除 聲 道 • 22 組 合 器 -39 - 1305639 23 第二輸入 2 4 處理器 25 第二基礎聲道 26 聲道再現器 27 輸入 28 29 3 0 3 1 32 第二輸出聲道 第一基礎聲道輸入 第一輸入聲道 第一傳輸聲道 第二傳輸聲道 40, 43 a, 43b 加法器 4 1,42 乘法器 110 輸入 112 114 115
116 117 120 B C C編碼器 下行混波區塊 加和信號線 B C C分析區塊 側邊資訊線 B C C解碼器 121 輸出 122 BCC合成區塊 123 側邊資訊處理區塊 125 聲頻濾波器排組 124 揚聲器 -40 - 1305639 126 延 遲 級 127 位 準 修 正 級 128 相 互 關 係 處 理 級 129 反 相 濾 波 器 排 組級IFB 130 乘 法 節 點
Claims (1)
1305639 第94 1 22 951號「用以產生多重聲道輸出信號之裝置及方法」 專案 (2008年7月修正) 十、申請專利範圍: 1.一種用以產生具有K個輸出聲道之多重聲道輸出信號之裝 置,該多重聲道輸出信號利用E個傳輸聲道及利用相關於 該等輸入聲道之參數資訊,以相對應於具有C個輸入聲道 之多重聲道輸入信號,該等E個傳輸聲道表示一具有C個 輸入聲道當作輸入的下行混波操作之結果,其中E係2 2, C係> E,及K係> 1且S C,以及其中該下行混波操作有效 於引入一第一輸入聲道於一第一傳輸聲道中及一第二傳 輸聲道中,且附加地引入一第二輸入聲道於該第一傳輸聲 道中,該裝置包含: 一消除聲道計算器(2 0) ’用以利用相關於包含在該第一 傳輸聲道、該第二傳輸聲道或該參數資訊中之第一輸入聲 道的資訊來計算一消除聲道(21); 一組合器(22) ’用以組合該消除聲道(21)及該第一傳輸 聲道(23)或其經處理的形式以獲得一第二基礎聲道(2 5), 其中相較於在該第一傳輸聲道上之該第一輸入聲道之影 響,該第一輸入聲道之影響會降低;以及 一聲道再現器(26),用以利用該第二基礎聲道及相關於 該第二輸入聲道之參數資訊來再現一相對應於該第二輸 入聲道之第二輸出聲道,及用以利用一相異於該第二基礎 聲道之第一基礎聲道及相關於該第一輸入聲道之參數資 1305639 々年ίτ>月Γ曰修⑻正替換頁 訊來再現一相對應於該第一輸入聲道之第一輸出聲道,其 中該第一聲道之影響相較於該第二基礎聲道係更高的。 2 .如申請專利範圍第1項之裝置,其中該組合器(2 2)係操作 而從該第一傳輸聲道或其經處理之形式減去該消除聲道。 3 ·如申請專利範圍第1項之裝置,其中該消除聲道計算器2 〇
係操作而利用該第一傳輸聲道及該第二傳輸聲道來計算 一用於該第一輸入聲道之估算,以獲得該消除聲道(21)。 4.如申請專利範圍第1項之裝置,其中該參數資訊包含在該 第一輸入聲道與一參考聲道間之差異參數,以及其中該消 除聲道計算器(20)係操作以計算該第一傳輸聲道與該第二 傳輸聲道之和’並利用該差異參數來加權該和。 5 .如申請專利範圍第1項之裝置’其中該下行混波操作係使 得該第一輸入聲道在藉下行混波因子被標度之後引入於 該第一傳輸聲道之內,以及其中該消除聲道計算器(2〇)係 操作利用一相依於該下行混波因子之標度因子以標度該 第一及該第二傳輸聲道之和。
6 _如申請專利範圍第5項之裝置,其中加權因子等於該下行 混波因子。 7.如申請專利範圍第1項之裝置,其中該消除聲道計算器 (20)係操作以決定該第一及第二傳輸聲道之和以獲得該第 一基礎聲道。 8.如申請專利範圍第1項之裝置,其中進一步包含一處理器 (24),該處理器係操作而藉使用一第一加權因子之加權來 處理該第一傳輸聲道,以及其中該消除聲道計算器(20)係 1305639 操作而利用一第二加權因子以加權該第二傳輸聲道。 9_如申請專利範圍第8項之裝置,其中該參數資訊包含在該 第一輸入聲道與一參考聲道間之差異參數,以及其中該消 除聲道計算器(20)係依據一差異參數而操作以決定第二加 權因子。 1 0.如申請專利範圍第8項之裝置,其中該第一加權因子等於 (Ι-h)’其中h爲一實數値,以及其中該第二加權因子等於 h 0 βΙ 11.如申請專利範圍第10項之裝置’其中該參數資訊包含一 位準差異値,以及其中h係由該參數位準差異値所產生。 1 2 .如申請專利範圍第1 1項之裝置,其中該h相等於由該位 準差異除以一取決於該下行混波操作之因子所產生的値。 13. 如申請專利範圍第1〇項之裝置,其中該參數資訊包含在 該第一聲道與該參考聲道間之該位準差異,以及其中h等 於1/万xlOL/2Q,其中L爲該位準差異。 14. 如申請專利範圍第1項之裝置,其中該參數資訊進一步包 ® 含一控制信號,該控制信號相依於該第一輸入聲道與該第 二輸入聲道間之關係,以及 其中該消除聲道計算器(2 0)係由該控制信號控制而主動 地增加或減少該消除聲道之能量或甚至使該消除聲道計 算完全失能。 1 5.如申請專利範圍第1項之裝置,其中該下行混波操作進一 步操作以引入一第三輸入聲道於該第二傳輸聲道之內,該 裝置進一步包含另一組合器,用以組合該消除聲道及該第 1305639 二傳輸聲道或其經處理之形式,以獲得一第三基礎聲道, 其中相較於該第二傳輸聲道上之該第一輸入聲道之影 響’該第一輸入聲道之影響會降低;以及 一聲道再現器,用以利用該第三基礎聲道及相關於該第 三輸入聲道之參數資訊來再現相應於該第三輸入聲道之 第三輸出聲道。 16.如申請專利範圍第丨項之裝置,其中該參數資訊包含聲道 間之位準差異,聲道間之時間差異、聲道間之相位差異或 聲道間之相互關係値,以及 其中該聲道重現器(26)係操作以施加上述組群之該等參 數之任一於一基礎聲道上,以獲得一原始輸出聲道。 17·如申請專利範圍第16項之裝置,其中該聲道再現器(26) 係操作以標度該原始輸出聲道,使得在該最後再現之輸出 聲道中的總能量相等於該E個傳輸聲道之總能量。 1 8 _如申請專利範圍第!項之裝置,其中該參數資訊爲既定之 頻帶,以及其中該消除聲道計算器(20)、組合器(22)及聲 道再現器(26)係操作而利用頻帶之既定參數資訊來處理複 數個頻帶,以及 其中該裝置進一步包含一時間/頻率轉換單元(IFB),用 以轉換該等傳輸聲道爲一具有頻帶之頻率表示,及一頻率 /時間轉換單元,用以轉換經再現之頻帶爲時域。 1 9.如申請專利範圍第丨項之裝置,其中進一步包含: 一系統,選自包含一數位視頻播放器、〜數位聲頻播放 器、一電腦、一人造衛星接收器、一有線接收器、一陸上 -4 - 1305639 廣播接收器,及一家庭娛樂系統之組群;以及 其中該系統包含該聲道計算器、該組合器,及該聲道再 現器。 20.—種產生具有K個輸出聲道之多重聲道輸出信號之方 法,該多重聲道輸出信號利用E個傳輸聲道及利用相關於 該等輸入聲道之參數資訊以相對應於具有C個輸入聲道之 多重聲道輸入信號,該E個傳輸聲道表示一具有C個輸入 聲道當作輸入的下行混波操作之結果,其中E係$2,C 係> E,及K係> 1且‘ C,以及其中該下行混波操作有效於 引入一第一輸入聲道於一第一傳輸聲道中及一第二傳輸 聲道中,且附加地引入一第二輸入聲道於該第一傳輸聲道 中,該方法包含: 利用相關於包含在該第一傳輸聲道、該第二傳輸聲道或 該參數資訊中之第一輸入聲道的資訊來計算(20)—消除聲 道: 組合(2 2)該消除聲道及該第一傳輸聲道或一經處理的形 式而獲得一第二基礎聲道,其中相較於在該第一傳輸聲道 上之該第一輸入聲道之影響,該第一輸入聲道之影響會降 低;以及 利用該第二基礎聲道及相關於該第二輸入聲道之參數 資訊,再現(2 6)—相對應於該第二輸入聲道之第二輸出聲 道,及利用一相異於該第二基礎聲道之第一基礎聲道及相 關於該第一輸入聲道之參數資訊,再現一相對應於該第一 輸入聲道之第一輸出聲道,其中該第一聲道之影響相較於 1305639 該第二基礎聲道是較高的。 2 1. —種具有程式碼之電腦程式產品,當運轉於一電腦上之 時’用以執行一用以產生具有K個輸出聲道多重聲道輸出 信號之方法’該多重聲道輸出信號利用E個傳輸聲道及利 用相關於該等輸入聲道之參數資訊以相對應於具有C個輸 入聲道之多重聲道輸入信號,該E個傳輸聲道表示一具有 C個輸入聲道當作輸入的下行混波操作之結果,其中e係 22,C係:>E,及K係>1且SC,以及其中該下行混波操 作有效於引入一第一輸入聲道於一第一傳輸聲道中及一 第二傳輸聲道中,且附加地引入一第二輸入聲道於該第一 傳輸聲道中,該方法包含: 利用相關於包含在該第一傳輸聲道、該第二傳輸聲道或 該參數資訊中之第一輸入聲道的資訊,計算(20)—消除聲 道: 組合(22)該消除聲道及該第一傳輸聲道或一經處理的形 式而獲得一第二基礎聲道,其中相較於在該第一傳輸聲道 上之該第一輸入聲道之影響,該第一輸入聲道之影響會降 低;以及 利用該第二基礎聲道及相關於該第二輸入聲道之參數 資訊來再現(26)—相對應於該第二輸入聲道之第二輸出聲 道,及利用一相異於該第二基礎聲道之第一基礎聲道及相 關於該第一輸入聲道之參數資訊,再現一相對應於該第一 輸入聲道之第一輸出聲道,其中該第一聲道之影響相較於 該第二基礎聲道係較高的。 1305639 七、指定代表圖·· (一) 本案指定代表圖為:第2圖。 (二) 本代表圖之元件符號簡單說明: 八、本案若有化學式時,請揭示最能顯示發明特徵的化學式: 20 消 除 聲 道 計 算 器 2 1 消 除 聲 道 22 組 合 器 23 第 二 輸 入 24 處 理 器 25 第 二 基 礎 聲 道 26 dsrti 腎 道 再 現 器 27 輸 入 29 第 — 基 礎 聲 道 輸入 30 第 一 輸 入 道 3 1 第 — 傳 輸 聲 道 32 第 二 傳 輸 聲 道
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US58657804P | 2004-07-09 | 2004-07-09 | |
US10/935,061 US7391870B2 (en) | 2004-07-09 | 2004-09-07 | Apparatus and method for generating a multi-channel output signal |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200617884A TW200617884A (en) | 2006-06-01 |
TWI305639B true TWI305639B (en) | 2009-01-21 |
Family
ID=34966842
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW094122951A TWI305639B (en) | 2004-07-09 | 2005-07-07 | Apparatus and method for generating a multi-channel output signal |
Country Status (16)
Country | Link |
---|---|
US (1) | US7391870B2 (zh) |
EP (1) | EP1774515B1 (zh) |
JP (1) | JP4772043B2 (zh) |
KR (1) | KR100908080B1 (zh) |
CN (1) | CN1985303B (zh) |
AT (1) | ATE556406T1 (zh) |
AU (1) | AU2005262025B2 (zh) |
BR (1) | BRPI0512763B1 (zh) |
CA (1) | CA2572989C (zh) |
ES (1) | ES2387248T3 (zh) |
HK (1) | HK1099901A1 (zh) |
NO (1) | NO338725B1 (zh) |
PT (1) | PT1774515E (zh) |
RU (1) | RU2361185C2 (zh) |
TW (1) | TWI305639B (zh) |
WO (1) | WO2006005390A1 (zh) |
Families Citing this family (80)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
US8027478B2 (en) * | 2004-04-16 | 2011-09-27 | Dublin Institute Of Technology | Method and system for sound source separation |
PL2175671T3 (pl) * | 2004-07-14 | 2012-10-31 | Koninl Philips Electronics Nv | Sposób, urządzenie, urządzenie kodujące, urządzenie dekodujące i system audio |
TWI497485B (zh) * | 2004-08-25 | 2015-08-21 | Dolby Lab Licensing Corp | 用以重塑經合成輸出音訊信號之時域包絡以更接近輸入音訊信號之時域包絡的方法 |
BRPI0517949B1 (pt) * | 2004-11-04 | 2019-09-03 | Koninklijke Philips Nv | dispositivo de conversão para converter um sinal dominante, método de conversão de um sinal dominante, e meio não transitório legível por computador |
KR101183859B1 (ko) * | 2004-11-04 | 2012-09-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다중채널 오디오 신호들의 인코딩 및 디코딩 |
EP1817767B1 (en) * | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
KR100682904B1 (ko) * | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
CN101147191B (zh) * | 2005-03-25 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
DE602006002501D1 (de) * | 2005-03-30 | 2008-10-09 | Koninkl Philips Electronics Nv | Audiokodierung und audiodekodierung |
KR101271069B1 (ko) * | 2005-03-30 | 2013-06-04 | 돌비 인터네셔널 에이비 | 다중채널 오디오 인코더 및 디코더와, 인코딩 및 디코딩 방법 |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
WO2006126844A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
EP1905004A2 (en) * | 2005-05-26 | 2008-04-02 | LG Electronics Inc. | Method of encoding and decoding an audio signal |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
JP4896449B2 (ja) * | 2005-06-29 | 2012-03-14 | 株式会社東芝 | 音響信号処理方法、装置及びプログラム |
WO2007004831A1 (en) * | 2005-06-30 | 2007-01-11 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US8626503B2 (en) * | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
US8019614B2 (en) * | 2005-09-02 | 2011-09-13 | Panasonic Corporation | Energy shaping apparatus and energy shaping method |
WO2007037613A1 (en) * | 2005-09-27 | 2007-04-05 | Lg Electronics Inc. | Method and apparatus for encoding/decoding multi-channel audio signal |
CN101278598B (zh) * | 2005-10-07 | 2011-05-25 | 松下电器产业株式会社 | 音频信号处理装置以及音频信号处理方法 |
KR101218776B1 (ko) | 2006-01-11 | 2013-01-18 | 삼성전자주식회사 | 다운믹스된 신호로부터 멀티채널 신호 생성방법 및 그 기록매체 |
TWI329462B (en) * | 2006-01-19 | 2010-08-21 | Lg Electronics Inc | Method and apparatus for processing a media signal |
JP5054035B2 (ja) * | 2006-02-07 | 2012-10-24 | エルジー エレクトロニクス インコーポレイティド | 符号化/復号化装置及び方法 |
JP4997781B2 (ja) * | 2006-02-14 | 2012-08-08 | 沖電気工業株式会社 | ミックスダウン方法およびミックスダウン装置 |
ES2339888T3 (es) | 2006-02-21 | 2010-05-26 | Koninklijke Philips Electronics N.V. | Codificacion y decodificacion de audio. |
FR2899424A1 (fr) * | 2006-03-28 | 2007-10-05 | France Telecom | Procede de synthese binaurale prenant en compte un effet de salle |
FR2899423A1 (fr) | 2006-03-28 | 2007-10-05 | France Telecom | Procede et dispositif de spatialisation sonore binaurale efficace dans le domaine transforme. |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
US8027479B2 (en) | 2006-06-02 | 2011-09-27 | Coding Technologies Ab | Binaural multi-channel decoder in the context of non-energy conserving upmix rules |
US20080004883A1 (en) * | 2006-06-30 | 2008-01-03 | Nokia Corporation | Scalable audio coding |
CN101652810B (zh) * | 2006-09-29 | 2012-04-11 | Lg电子株式会社 | 用于处理混合信号的装置及其方法 |
EP2084901B1 (en) * | 2006-10-12 | 2015-12-09 | LG Electronics Inc. | Apparatus for processing a mix signal and method thereof |
DE602007013415D1 (de) * | 2006-10-16 | 2011-05-05 | Dolby Sweden Ab | Erweiterte codierung und parameterrepräsentation einer mehrkanaligen heruntergemischten objektcodierung |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
JP5450085B2 (ja) | 2006-12-07 | 2014-03-26 | エルジー エレクトロニクス インコーポレイティド | オーディオ処理方法及び装置 |
CA2645915C (en) | 2007-02-14 | 2012-10-23 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
KR101100213B1 (ko) | 2007-03-16 | 2011-12-28 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8064624B2 (en) * | 2007-07-19 | 2011-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for generating a stereo signal with enhanced perceptual quality |
US8032085B2 (en) * | 2007-09-10 | 2011-10-04 | Technion Research & Development Foundation Ltd. | Spectrum-blind sampling and reconstruction of multi-band signals |
KR101464977B1 (ko) * | 2007-10-01 | 2014-11-25 | 삼성전자주식회사 | 메모리 관리 방법, 및 멀티 채널 데이터의 복호화 방법 및장치 |
US8930197B2 (en) * | 2008-05-09 | 2015-01-06 | Nokia Corporation | Apparatus and method for encoding and reproduction of speech and audio signals |
BRPI0908630B1 (pt) * | 2008-05-23 | 2020-09-15 | Koninklijke Philips N.V. | Aparelho de 'upmix' estéreo paramétrico, decodificador estéreo paramétrico, método para a geração de um sinal esquerdo e de um sinal direito a partir de um sinal de 'downmix' mono com base em parâmetros espaciais, dispositivo de execução de áudio, aparelho de 'downmix' estéreo paramétrico, codificador estéreo paramétrico, método para a geração de um sinal residual de previsão para um sinal de diferença a partir de um sinal esquerdo e de um sinal direito com base nos parâmetros espaciais, e, produto de programa de computador |
US8060042B2 (en) * | 2008-05-23 | 2011-11-15 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
BRPI0905069A2 (pt) * | 2008-07-29 | 2015-06-30 | Panasonic Corp | Aparelho de codificação de áudio, aparelho de decodificação de áudio, aparelho de codificação e de descodificação de áudio e sistema de teleconferência |
JP5635502B2 (ja) * | 2008-10-01 | 2014-12-03 | ジーブイビービー ホールディングス エス.エイ.アール.エル. | 復号装置、復号方法、符号化装置、符号化方法、及び編集装置 |
DE102008056704B4 (de) * | 2008-11-11 | 2010-11-04 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
WO2010095083A1 (en) | 2009-02-18 | 2010-08-26 | Technion Research & Development Foundation Ltd | Efficient sampling and reconstruction of sparse multi-band signals |
CN101556799B (zh) * | 2009-05-14 | 2013-08-28 | 华为技术有限公司 | 一种音频解码方法和音频解码器 |
JP2011002574A (ja) * | 2009-06-17 | 2011-01-06 | Nippon Hoso Kyokai <Nhk> | 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム |
JP5345024B2 (ja) * | 2009-08-28 | 2013-11-20 | 日本放送協会 | 3次元音響符号化装置、3次元音響復号装置、符号化プログラム及び復号プログラム |
TWI433137B (zh) | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
US8774417B1 (en) * | 2009-10-05 | 2014-07-08 | Xfrm Incorporated | Surround audio compatibility assessment |
EP2367293B1 (en) * | 2010-03-14 | 2014-12-24 | Technion Research & Development Foundation | Low-rate sampling of pulse streams |
DE102010015630B3 (de) * | 2010-04-20 | 2011-06-01 | Institut für Rundfunktechnik GmbH | Verfahren zum Erzeugen eines abwärtskompatiblen Tonformates |
WO2011135472A2 (en) | 2010-04-27 | 2011-11-03 | Technion Research & Development Foundation Ltd. | Multi-channel sampling of pulse streams at the rate of innovation |
WO2012009851A1 (en) * | 2010-07-20 | 2012-01-26 | Huawei Technologies Co., Ltd. | Audio signal synthesizer |
BR122021003884B1 (pt) | 2010-08-12 | 2021-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Reamostrar sinais de saída de codecs de áudio com base em qmf |
BR112013004362B1 (pt) * | 2010-08-25 | 2020-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | aparelho para a geração de um sinal descorrelacionado utilizando informação de fase transmitida |
WO2012049591A1 (en) | 2010-10-13 | 2012-04-19 | Technion Research & Development Foundation Ltd. | Sub-nyquist sampling of short pulses |
TWI462087B (zh) * | 2010-11-12 | 2014-11-21 | Dolby Lab Licensing Corp | 複數音頻信號之降混方法、編解碼方法及混合系統 |
US20120155650A1 (en) * | 2010-12-15 | 2012-06-21 | Harman International Industries, Incorporated | Speaker array for virtual surround rendering |
UA107771C2 (en) * | 2011-09-29 | 2015-02-10 | Dolby Int Ab | Prediction-based fm stereo radio noise reduction |
ITTO20120067A1 (it) * | 2012-01-26 | 2013-07-27 | Inst Rundfunktechnik Gmbh | Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal. |
US9131313B1 (en) * | 2012-02-07 | 2015-09-08 | Star Co. | System and method for audio reproduction |
JP6248186B2 (ja) * | 2013-05-24 | 2017-12-13 | ドルビー・インターナショナル・アーベー | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
US9338573B2 (en) | 2013-07-30 | 2016-05-10 | Dts, Inc. | Matrix decoder with constant-power pairwise panning |
WO2015036350A1 (en) * | 2013-09-12 | 2015-03-19 | Dolby International Ab | Audio decoding system and audio encoding system |
EP3444815B1 (en) | 2013-11-27 | 2020-01-08 | DTS, Inc. | Multiplet-based matrix mixing for high-channel count multichannel audio |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
CN106997768B (zh) * | 2016-01-25 | 2019-12-10 | 电信科学技术研究院 | 一种语音出现概率的计算方法、装置及电子设备 |
EP3246923A1 (en) | 2016-05-20 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing a multichannel audio signal |
RU2628198C1 (ru) * | 2016-05-23 | 2017-08-15 | Самсунг Электроникс Ко., Лтд. | Способ межканального предсказания и межканальной реконструкции для многоканального видео, снятого устройствами с различными углами зрения |
CA3045847C (en) * | 2016-11-08 | 2021-06-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Downmixer and method for downmixing at least two channels and multichannel encoder and multichannel decoder |
JP6866679B2 (ja) | 2017-02-20 | 2021-04-28 | 株式会社Jvcケンウッド | 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム |
US12100403B2 (en) * | 2020-03-09 | 2024-09-24 | Nippon Telegraph And Telephone Corporation | Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium |
JP7385531B2 (ja) * | 2020-06-17 | 2023-11-22 | Toa株式会社 | 音響通信システム、音響送信装置、音響受信装置、プログラムおよび音響信号送信方法 |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG49883A1 (en) | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
JP3577798B2 (ja) * | 1995-08-31 | 2004-10-13 | ソニー株式会社 | ヘッドホン装置 |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6249578B1 (en) | 1998-04-06 | 2001-06-19 | Ameritech Corporation | Interactive electronic ordering for telecommunications products and services |
JP3657120B2 (ja) | 1998-07-30 | 2005-06-08 | 株式会社アーニス・サウンド・テクノロジーズ | 左,右両耳用のオーディオ信号を音像定位させるための処理方法 |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
TW589815B (en) * | 2002-01-16 | 2004-06-01 | Winbond Electronics Corp | Control method for multi-channel data transmission |
KR101049751B1 (ko) * | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
-
2004
- 2004-09-07 US US10/935,061 patent/US7391870B2/en active Active
-
2005
- 2005-05-12 CN CN2005800231310A patent/CN1985303B/zh active Active
- 2005-05-12 CA CA2572989A patent/CA2572989C/en active Active
- 2005-05-12 RU RU2007104933/09A patent/RU2361185C2/ru active
- 2005-05-12 JP JP2007519630A patent/JP4772043B2/ja active Active
- 2005-05-12 EP EP05740130A patent/EP1774515B1/en active Active
- 2005-05-12 BR BRPI0512763A patent/BRPI0512763B1/pt active IP Right Grant
- 2005-05-12 AU AU2005262025A patent/AU2005262025B2/en active Active
- 2005-05-12 ES ES05740130T patent/ES2387248T3/es active Active
- 2005-05-12 WO PCT/EP2005/005199 patent/WO2006005390A1/en active Application Filing
- 2005-05-12 PT PT05740130T patent/PT1774515E/pt unknown
- 2005-05-12 AT AT05740130T patent/ATE556406T1/de active
- 2005-05-12 KR KR1020077000404A patent/KR100908080B1/ko active IP Right Grant
- 2005-07-07 TW TW094122951A patent/TWI305639B/zh active
-
2007
- 2007-01-02 NO NO20070034A patent/NO338725B1/no unknown
- 2007-07-12 HK HK07107471.6A patent/HK1099901A1/xx unknown
Also Published As
Publication number | Publication date |
---|---|
ATE556406T1 (de) | 2012-05-15 |
TW200617884A (en) | 2006-06-01 |
CA2572989A1 (en) | 2006-01-19 |
EP1774515B1 (en) | 2012-05-02 |
JP2008505368A (ja) | 2008-02-21 |
HK1099901A1 (en) | 2007-08-24 |
PT1774515E (pt) | 2012-08-09 |
CN1985303A (zh) | 2007-06-20 |
EP1774515A1 (en) | 2007-04-18 |
KR100908080B1 (ko) | 2009-07-15 |
US7391870B2 (en) | 2008-06-24 |
ES2387248T3 (es) | 2012-09-19 |
NO20070034L (no) | 2007-02-06 |
AU2005262025B2 (en) | 2008-10-09 |
BRPI0512763A (pt) | 2008-04-08 |
RU2007104933A (ru) | 2008-08-20 |
WO2006005390A1 (en) | 2006-01-19 |
BRPI0512763B1 (pt) | 2018-08-28 |
KR20070027692A (ko) | 2007-03-09 |
CN1985303B (zh) | 2011-06-15 |
NO338725B1 (no) | 2016-10-10 |
RU2361185C2 (ru) | 2009-07-10 |
AU2005262025A1 (en) | 2006-01-19 |
CA2572989C (en) | 2011-08-09 |
JP4772043B2 (ja) | 2011-09-14 |
US20060009225A1 (en) | 2006-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI305639B (en) | Apparatus and method for generating a multi-channel output signal | |
US7941320B2 (en) | Cue-based audio coding/decoding | |
JP5156386B2 (ja) | 空間音声のパラメトリック符号化のためのコンパクトなサイド情報 | |
US7787631B2 (en) | Parametric coding of spatial audio with cues based on transmitted channels | |
US8340306B2 (en) | Parametric coding of spatial audio with object-based side information | |
AU2005204715B2 (en) | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |