TWI307248B - Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing - Google Patents

Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing Download PDF

Info

Publication number
TWI307248B
TWI307248B TW095103076A TW95103076A TWI307248B TW I307248 B TWI307248 B TW I307248B TW 095103076 A TW095103076 A TW 095103076A TW 95103076 A TW95103076 A TW 95103076A TW I307248 B TWI307248 B TW I307248B
Authority
TW
Taiwan
Prior art keywords
signal
channel
smoothing
post
processing
Prior art date
Application number
TW095103076A
Other languages
English (en)
Other versions
TW200701821A (en
Inventor
Matthias Neusinger
Juergen Herre
Sascha Disch
Heiko Purnhagen
Kristofer Kjoerling
Jonas Engdegard
Jereon Breebaart
Erik Schuijers
Werner Oomen
Original Assignee
Fraunhofer Ges Forschung
Coding Tech Ab
Koninkl Philips Electronics Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung, Coding Tech Ab, Koninkl Philips Electronics Nv filed Critical Fraunhofer Ges Forschung
Publication of TW200701821A publication Critical patent/TW200701821A/zh
Application granted granted Critical
Publication of TWI307248B publication Critical patent/TWI307248B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Magnetic Resonance Imaging Apparatus (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)

Description

1307248 九、發明說明: 【發明所屬之技術領域】 本發明關多頻道聲音處理且,特別是,有關使用參數 側資訊之多頻道編碼與合成。 【先前技術】 近來,多頻道聲音再生技術正變得愈來愈流行。此可 由於聲音壓縮/編碼技術如眾所周知之Μ P E G -1層3 (亦知悉 爲mp3)技術已使它能經由網際網路,或其他具有一有限頻 帶寬度之傳送頻道傳佈聲音內容。 對此流行之另一原因爲多頻道內容之可利用性增加, 與在家用環境中多頻道放音裝置之增加普及性。 mp3編碼技術變得如此著名,係因爲它允許所有記錄 以立體聲格式傳佈’即’包含第一或左立體聲頻道與第二 或右立體聲頻道之聲音記錄之數位表示。又,mp3技術創 造在既定可用儲存與傳送頻帶寬度下,可用於聲音傳佈之 新的可能。 雖然’習知雙頻道聲音系統具有基本缺失。由於僅二 擴音器被使用之事實’它們導致一有限的空間影像。因此, 已發展環繞技術。一建議多頻道-環繞表示包含,除二立體 聲頻道L與R外,一額外中央頻道c,二環繞頻道Ls、Rs 與選擇地一低頻率提升頻道或次低音揚聲器頻道。此參考 聲音格式亦被參引爲三/二立體聲(或5.1格式),其意指三 個前頻道與二環繞頻道。通常,需要五個傳送頻道。於放 音環境中’至少需要在五個不同位置之五個擴音器以在離 該五個良好分置的擴音器某距離得到一最佳甜蜜點。 1307248 在技藝中已知數種技術用於減低傳送多頻道聲 之資料量。此等技術稱爲結合立體聲技術。爲此目 考第10圖’其顯示一結合立體聲裝置60。此裝置可 例如強度立體聲(IS),參數立體聲(PS)或(一相關)雙 示編碼(BCC)之一裝置。此等裝置在至少二頻道 CH2,…CHn)通常接收作爲一輸入,且輸出單一載 與參數資料。該參數資料係界定爲使得,於一解碼 可計算一原始頻道(CHI,CH2,…CHn)之大槪。 通常,該載波頻道將包含次頻帶樣本、頻譜係 域樣本等,其提供一比較性根本訊號之一良好表示 參數資料並不包含此等頻譜係數之樣本,而是包含 數用於控制某重建演算法如以相乘加權、時間轉換 轉換、相位轉換。該參數資料因此僅包含經聯合頻 號的一比較性粗糙表示。以數字表示,以使用一習 聲音碼器之一載波頻道編碼所需之資料量將是在1 至7 Ok Bit/s間,同時用於一頻道以參數側資訊所需 量將是在範圍1.5至2.5kBit/s間。用於參數資料之 爲眾所皆知之比例因素,強度立體聲資訊或立體聲 數等將描述於下。 強度立體聲編碼描述於AES預印本3 799,’'強 聲編碼J.Herre’ K.H.Brandenburg’ D.Lederer’ at 96 2月1994,阿姆斯特丹。通常,強度立體聲之觀念 一主軸轉換以被施加至立體音頻道二者之資料。假 數之資料點爲集中於第一原則軸,一編碼增益可先 前藉旋轉訊號二者某一角度達成’且從位元流之傳 音訊號 的,參 爲執行 聲道提 (CH1, 波頻道 器中, 數、時 ,同時 控制參 、頻率 道之訊 知損失 S圍 6 0 之資料 一例子 提示參 度立體 ,h AES > 係基於 如大多 於編碼 送中排 1307248 ^ 除第二正交部分。用於左與右頻道之重建訊號包含相同經 . 傳送訊號之不同加權或比例版本。雖然’該重建訊號不同 於其振幅但關於其相位資訊爲相同的。然而’該二原始聲 音頻道之能量時間包封,藉由選取的比例作業被保持,其 典型地以頻率選取方式作業。此符合在高頻下人類之聲音 知覺,其中佔優勢之空間提示以能量包封被決定。 此外,於實際施行上’經傳送訊號即將載波頻道從左 頻道與右頻道之總和訊號產生,而非輪流更換二元件。又, Φ 此處理即用於執行比例作業之產生強度立體聲參數,被實 施頻率選取,即對每一比例因子頻帶爲獨立地,即編碼器 頻率劃分。較佳地,頻道二者被結合以形成一經結合或“載 波”頻道,且除經結合頻道外,該強度立體聲資訊被決定, 其係視第一頻道之能量,第二頻道之能量或經結合頻道之 能量而定。 BCC技術描述於AES大會論文5 5 74,"施加於立體聲 立體聲之雙聲道提示編碼與多頻道聲音壓縮”,C.Faller, ^ F.Baumgarte,5月2002,慕尼黑。於BCC編碼中,一些聲 音輸入頻道被轉換爲一頻譜表示,其使用具有重疊視窗之 DFT基礎的轉換。所產生之均勻頻譜被劃分成非重疊分割 每一者具有一索引。每一劃分具有~頻帶寬度與相等的矩 形頻帶寬度(ERB)成比例。該頻道間位準差異(ICLD)與頻道 間時間差異(ICTD)對每一時框k、每一劃分被估計。icLD 與ICTD被量化與編碼導致一 BCC位元流。頻道間位準差 異與頻道間時間差異被給定用於相對於一參考頻道之每一 頻道。接著,參數依據規定的公式被計算,其視欲處理訊 1307248 、 號之某些劃分而定。 . 在一解碼器側’解碼器接收一單音訊號與BCC位元 流。該單音訊號被轉換成頻域且輸入一空間合成區塊,其 亦接收經解碼ICLD與ICTD値。於空間合成區塊,BCC參 數(ICLD與ICTD)値被使用以實施該單音訊號之加權作 業,以合成多頻道訊號,其中於頻率/時間轉換後,表示該 原始多頻道聲音訊號之一重建。 於BCC情形中’該結合立體聲模組60作爲輸出該頻道 φ 側資訊,使得參數頻道資料被量化且編碼ICLD或ICTD參 數’其中原先頻道之一者被用作爲參考頻道用於編碼該頻 道側資訊。 通常,於最簡單實施例中,將該載波頻道形成爲該參 與原先頻道之總和。 通常’以上技術僅提供一單音表示用於一解碼器,其 僅處理該載波頻道,而不能處理參數資料用於產生多於一 輸入頻道之一個或多個近似値。 φ 已知爲雙聲道提示編碼(BCC)之聲音編碼技術亦仔細 描述於美國專利申請出版品US 2003,0219130 A1, 2003/002644 1 A1 與 2003/00355 5 3 A1 中。額外參考亦針對 “雙聲道提示編碼。第二部分:方案與應用” ,C.Fallei-與 F _ B a u m g a r t e ’ IE E E T r a n s. Ο n A u d i 〇 a n d S p e e c h P r 〇 c ., Vol.11’ No.6’ Nov.2003。引證之美國專利申請出版品與在 BCC技術上Faller與Baumgarte著作之二引證技術出版品 在此以其全部倂入於此供作參考。 雙聲道提示編碼方案之顯著改進,其使參數方案可施 1307248 加至一非常廣泛之位元率範圍,已知爲‘參數立體 聲’ (PS),如在MPEG-4高效率AAC v2中之標準化。參數 立體聲之重要延伸之一者爲包含一空間‘散佈’參數。此 知覺印象以頻道間校正或頻道間相關(ICC)之數學特性得 到。PS參數之分析、知覺量化、傳送與合成過程被詳細描 述於“立體聲參數編碼” ,J.Breebaart,S.van de Par, A.Kohlrausch 與 E.Schuijers,EURASIP J.Appl. Sign. Proc. 2005: 9’ 1305-1322。另外參考係針對 J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuijers,"在低位元率下高品質參 數空間聲音編碼",AES 1 16‘h會議,柏林,預印本607 2 , 5 月 2004’ 與 E.Schuijers,J. Breebaart,H· Purnhagen, J.Engdegard,”低複雜度參數立體聲編碼",AES 116'h會 議,柏林,預印本6073,5月2004。 以下,一通常BCC方案用於多頻道聲音編碼參考第! ! 至1 3圖被詳細說明。第1 1圖顯示此等一般雙聲道提示編 碼方案用於多頻道聲音訊號之編碼/傳送。在BCC編碼器 1 1 2之一輸入1 1 0之多頻道聲音輸入訊號被降混於一降混 區塊114。於本例子中,在輸入11〇之原先多頻道訊號爲5 頻道環繞訊號具有一左前頻道、一右前頻道、一左環繞頻 道、一右環繞頻道與一中央頻道。於本發明之一較佳實施 例中’該降混區塊114藉將該些5頻道之簡單附加成一單 音訊號而產生一總和訊號。技藝中已知其他降混方案使 得’使用一多頻道輸入訊號’可得到一具有單一頻道之降 混訊號。此單一頻道爲在一總和訊號線1 1 5之輸出。以一 B CC分析區塊1 1 6所得之一側資訊爲在—側資訊線丨丨7之 1307248 . 輸出。於BCC分析區塊中,頻道間位準差異(ICLD),與頻 • 道間時間差異(ICTD)被計算作爲以上已略述之要點。近 來,BCC分析區塊1 16具有以頻道間校正値(ICC値)形式之 下傳參數立體聲參數。該總和訊號與側資訊被傳送,宜爲 以量化與編碼形式,至一BCC解碼器120。該BCC解碼器 分解該經傳送總和訊號成一些次頻帶且施加比例化,延遲 與其他處理以產生輸出多頻道聲音訊號之次頻帶。此處理 被實施使得在一輸出121之重建多頻道訊號之ICLD,ICTD φ 與ICC參數(提示),近似於在輸入1 10用於原先多頻道訊 號之個別提示,而成爲BCC編碼器112。爲此目的,BCC 解碼器1 20包含一 BCC合成區塊1 22與一側資訊處理區塊 123 ° 以下,BCC合成區塊122之內部建構將參考第12圖說 明。在線1 1 5上之總和訊號被輸入於一時間/頻率轉換單元 或濾波器庫FB125。在區塊125之輸出,存有一些N個次 頻帶訊號或,於一極端情形,一頻譜係數之區塊,當聲音 I 濾波器庫125執行一 1 : 1轉換時,即’從N個時域樣本產 生N個頻譜係數之轉換。 BCC合成區塊122另外包括一延遲階段126’ 一'位準修 正階段1 27,一相關處理階段128與一反濾波器庫階段 IFB 1 29。在階段1 29之輸出,於5頻道環繞系統情形中, 重建多頻道聲音訊號具有例如5個頻道,可被輸出至一組 擴音器124如第1 1圖所例示。 如第12圖所示中,輸入訊號(η)藉由元件125被轉換成 頻域或濾波器庫域。將由元件1 25之訊號輸出相乘,使得 -10- 1307248 Α 2階段程序而是僅需要1階段程序。1階段方法被描述於 ^ AES預印本"用於MPEG空間聲音編碼之參考模式架構,,, J.Herre等人,2005,巴塞隆納。 關於延遲參數,注意的是當對左前頻道之延遲參數dl 被設爲0時,延遲參數ICTD從BCC編碼器被傳送可予直 接使用。無再比例需於此執行,因爲一延遲不會改變訊號 之能量。 關於從BCC編碼器傳送至BCC解碼器之頻道間相關量 φ 測ICC,在此注意的是一相關操控可藉修正相乘因子 a,,…,a»被實施,如將所有次頻帶之加權因子與介於 201og 10(-6)與2 01 ogl 0(6)間之隨機數値相乘。該擬似隨機序 列宜被選取使得該變異對全部臨界頻帶約爲固定的,且在 每一臨界頻帶中之該平均値爲0。相同序列對每一不同時 框被施加至頻譜係數。如此,該聽覺影像寬度藉修正擬似 隨機序列之變異被控制。一較大變異產生一較大影像寬 度。該變異修正可被實施於臨界頻帶寬之個別頻帶中。此 φ 使在一聲音情景中之多個物件同時存在,每一物件具有一 不同影像寬度。一合適振幅分佈用於擬似隨機序列爲一對 數比例之均勻分佈,如於美國專利申請出版品 2003/0 219130 A1所略述者。雖然,所有BCC合成處理爲關 於如第1 1圖所示從BCC編碼器傳送至BCC解碼器作爲總 和訊號之單一輸入頻道。 相對於第1 3圖已略述於上者,該參數側資訊’即,頻 道間位準差異(ICLD)、頻道間時間差異(ICTD)或頻道間同 調參數(ICC)可被計算且傳送用於該5頻道之每一者。通 -13-
1307248 * 常,此意指一者傳送5組頻道間位準差異用於 . 相同地用於頻道間時間差異亦爲真實的。相對 調參數,其亦足以僅傳送例如2組該些參數。 相對於第12圖已略述於上者,並無單一 數、時間差異參數或同調參數用於一時框或一 部分。替代地’這些參數被決定用於數個不同 到一頻率相依參數化。因爲其宜使用例如3 2 即’一濾波器庫具有32個頻帶用於BCC分析與 ^ 該參數可佔有相當多資料。雖然與其它多頻道 該參數表示導致相當低資料率,對用於代表一 如具有二頻道(立體聲訊號)之訊號,或具有多 —多頻道環繞訊喊之需要資料率的進一步減少 求。 爲此目的,重建參數所計算之編碼器側依 則被量化。此意指未量化重建參數被映至於量 化指標之有限集合,如技藝中已知與特定描述 聲梦數編碼” ,J。Breebaart,S.van de Par,. 與 E.Schuijers,EURASIP J. Appl. Sign. Pro 1305-1322 及在 C.Faller 與 F_ Baumgarte,"以弓澤 至聲音壓縮之雙耳提示編碼"AES 113^會議, 印本5686’ 10月2002中詳細參數編碼。 量化對所有參數値具有影響,其小於量化 被量化至0,視是否量化器爲中間階面或中間 藉將一大組未量化値映至一小組經量化値,得 料節省。這些資料率節省以編碼器側上對經量 5頻道訊號。 於頻道間同 位準差異參 訊號之時間 頻帶,使得 目頻率頻道, ! BCC合成, :傳送相比, 多頻道訊號 於二頻道如 '有一持續需 :據某量化法 :化位準或量 I用於“立體 A.Kohlrausch c.2005 : 9 > 〖性表示施加 洛杉磯,預 ;步階尺寸, 丨升態型式。 =到額外的資 :化重建參數 -14- 1307248 * 熵編碼進一步提升。較佳熵編碼方法爲基於預定碼表之霍 ^ 夫曼(Huffman)方法或基於訊號統計之實際決定與碼簿之訊 號適應性構建。或者,其他熵編碼工具可被使用如算術編 碼。 通常,方法具有法則,其中用於重建參數所需要之資 料率隨量化器步階尺寸增加而減少。就不同地敍陳述而 言’一較粗糙量化導致較低資料率,且一較精細量化導致 較高資料率。 g 因爲參數訊號表示通常對用於低資料率環境爲需要 的’嘗試量化該重建參數儘可能粗糙,以得到在基本頻道 中具有某些資訊量之訊號表示,且亦具有一合理的小資料 量用於側資訊,該側資訊包含被量化與熵編碼重建參數。 因此,習知技藝方法,從欲編碼之多頻道訊號直接導 出欲傳送之重建參數。如以上所討論之一粗糙量化導致重 建參數扭曲,當該經量化重建參數於解碼器中被反量化且 使用於多頻道合成時,其導致大的捨入誤差。通常,該捨 φ 入誤差隨量化器步階尺寸而增加,即,使用經選取"量化器 粗糙度(coarseness)"。此等捨入誤差可導致量化位準變化, 即,從第一時間瞬間之第一量化位準至稍後時間瞬間之第 二量化位準之變化,其中一量化器位準與另一量化器位準 間之差異,以相當大的量化器步階尺寸界定,其宜用於一 粗糙量化。不巧地,達到大量化器步階尺寸之此等量化器 位準變化,當該未量化參數爲介於二量化位準之中間時, 僅可以參數中微小變化觸發。其清楚在側資訊中此等量化 器指標變化之出現,導致在訊號合成階段中相同大的變 -15- 1307248 化。當’如一範例,頻道間位準差異被考慮時,它將變得 清楚其中一大的變化導致某一擴音器訊號之響度大幅減 低’伴隨而來在另一擴音機訊號響度之大幅增加。此種情 形’對一粗糙量化其僅以單一量化位準變化觸發,可被知 覺爲從(虛擬上)第一地至(虛擬上)第二地之音源的即刻變 遷。此等從一時間瞬間至另一時間瞬間之即刻變遷聽起來 爲不真實的’即’被知覺爲一調變效果,因爲,特別地, 音色訊號之音源不會非常快地變化其位置。 通常,傳送誤差亦導致量化器標記大的變化,其即刻 在多頻道輸出訊號中導致大的變化,其對以下情形更是真 實,其中用於資料率理由之粗糙量化器已被採行。 技藝中技術用於二個("立體聲")或多個("多頻道")聲音 輸入頻道之參數編碼,從輸入訊號直接導出空間參數。此 等參數之例子爲如以上略述者,頻道間位準差異(ICLD)或 頻道間強度差異(IID),頻道間時間延遲(ICTD)或頻道間相 位差異(IPD),與頻道間校正/相關(ICC),其每一者以時間 與頻率選取方式被傳送,即,每頻帶且作爲時間之一函 數。用於此等參數傳送至解碼器,這些參數之一粗糙量化 爲需要的以保持側資訊率在最低。結果’相當大的捨入誤 差發生,當比較該經傳送參數値與其原始値時。此意指甚 至在原先訊號中之一參數之柔性與逐漸變化,可導致使用 於解碼器中參數値之一急遽變化’假如從一經量化參數値 至下一値之決策臨界値超過的話。因爲這些參數値被使用 於輸出訊號之合成,參數値中之急遽變化亦可造成輸出訊 號中之"跳躍π ’其對某些型式訊號如’'切換”或”調變"等人工 -16 - 1307248 - 物知覺爲困擾的(視該參數之暫態粗糙度與量化解析度而 - 定)。 美國專利申請案號1 0/8 8 3,5 3 8描述以BCC型式方法之 一過程用於後處理經傳送參數値以當以低解析度代表參數 時避免人工物用於某些型式訊號。在合成過程中之這些不 連續會導致人工物用於音色訊號。因此’該美國專利申請 案提出在解碼器中使用一音色偵測器’其被用以分析該經 傳送降混訊號。當該訊號被發現爲音色的時,接著對時間 φ 之一平滑作業被實施於經傳送參數上。結果,此處理型式 表示一種方法用於音色訊號之參數有效傳送。 然而,會有除音色輸入訊號之輸入訊號等級,其對空 間參數之一粗糙量化爲相同敏感的。 • 用於此等情形之一例子爲點源,其於二位置間緩慢移 動(例如,一雜訊訊號進行非常緩慢以在中央與左前方 擴音器間移動)。位準參數之一粗糙量化將導致在音源 之空間位置與軌道可知覺性"跳躍"(不連續)。因爲這些 φ 訊號通常未於解碼器中偵測爲音色的,先前技藝之平 滑將明顯對此情形並無助益。 • 其他例子爲快速移動之具有音色材料之點源,如快速 移動正弦曲線。先前技藝之平滑將偵測這些成份爲音 色的’且因此引發一平滑作業。然而,當移動速度不 爲先前技藝平滑演算法所知時,該施加的平滑時間常 數將通常爲不適當的且例如,再生一具有非常緩慢移 動速度之移動點源,及與原先意欲位置相比經再生空 間位置之一顯著落後。 -17- 1307248 » 【發明內容】 . 本發明之一目的爲提供一改進的聲音訊號處理觀念, 其一方面允許低資料速率且另一方面良好的主觀品質。 依據本發明之第一觀點,此目標以一裝置用於產生多 頻道合成器控制訊號而達成,包括:一訊號分析器,用於 分析一多頻道輸入訊號;一平滑資訊計算器,用於決定回 應該訊號分析器之平滑控制資訊,該平滑資訊計算器係作 爲決定平滑控制資訊使得,回應平滑控制資訊,一合成器 Φ 側後處理器產生一後處理重建參數或從重建參數導出之一 後處理量用於一將處理之輸入訊號的時間部分;及一資料 產生器,用於產生一代表該平滑控制資訊之控制訊號作爲 多頻道合成器控制訊號。 依據發明之第二觀點,此目標以一多頻道合成器用於 從一輸入訊號產生一輸出訊號,該輸入訊號具有至少一輸 入頻道與一序列經量化重建參數’該經量化重建參數爲依 據一量化法則被量化,且聯合輸入訊號之後續時間部分, Φ 該輸出訊號具有一些經合成輸出頻道’且經合成輸出頻道 之數目爲大於輸入頻道或輸入頻道之數目’輸入頻道具有 代表平滑控制資訊之一多頻道合成器控制訊號,該平滑控 制資訊依賴一編碼器側訊號分析’該平滑控制資訊被決定 使得一合成器側後處理器產生,對應合成器控制訊號一後 處理重建參數或從重建參數導出之一後處理量,包括:一 控制訊號供給器用於提供具有平滑控制資訊之控制訊號; 一後處理器用於決定’對應該控制訊號’後處理重建參數 或從重建參數導出之後處理量’用於欲處理輸入訊號之一
-18- 1307248 * 時間部分,其中後處理器作爲決定後處理重建參數或後處 . 理量’使得後處理重建參數値或後處理量不同於依據量化 法則使用再量化得到之値;與一多頻道重建器用於重建經 合成輸出頻道之數目之一時間部分,其使用輸入頻道之時 間部分與後處理重建參數或後處理値。 又本發明之觀點有關產生一多頻道合成器控制訊號之 方法,對應電腦程式,或一多頻道合成器控制訊號,從一 輸入訊號產生一輸出訊號之方法。 φ 本發明係基於經導向重建參數之平滑之編碼器側,將 導致經合成多頻道輸出訊號之一改進聲音品質之事實。此 大體上聲音品質之改進可以一附加編碼器側處理得到以決 定平滑控制資訊,其可於本發明之較佳實施例中,傳送至 解碼器,其傳送需要一有限的(小量的)位元數。 在解碼器側,平滑控制資訊被使用以控制平滑作業。 在解碼器側上此編碼器導引參數平滑可被使用,而非使用 解碼器側參數平滑,其係基於例如音色/暫態偵測,或可被 Φ 使用於結合解碼器側參數平滑。該方法被施加用於某一時 間部分且經傳送降混訊號之某一頻帶亦可使用該平滑控制 資訊加以訊號化,如在編碼器側上以一訊號分析器所決定 者。 總之,本發明在重建參數之編碼器側控制的適應性平 滑被施行於多頻道合成器中爲有利的,其一方面導致聲音 品質之實質提升,且僅導致小量的額外位元量。由於量化 固有的品質劣化事實,使用額外的平滑控制資訊可予減 輕’本發明槪念甚至可被應用而不需任何增加,且甚至可 -19- 1307248 • 爲經傳送位元之減少,因爲用於平滑控制資訊之該位元可 . 藉施加一更粗糙量化予以省卻,使得較少位元需要用於編 碼該經量化値。如此,該平滑控制資訊與編碼經量化値可 需要相同或更少經量化値之位元率,而不需如未公開之美 國專利申請案中所略述之平滑控制資訊,同時保持相同位 準或主觀聲音品質之一較高位準。 通常,使用於多頻道合成器之用於經量化重建參數之 後處理,一方面作爲減少或甚至消除聯合粗糙量化之問 Φ 題,且另一方面量化位準變化。 當於習知技藝系統中,在編碼器中小參數變化可導致 在解碼器中一強烈參數變化,因爲合成器中之一再量化爲 僅允許用於限定組經量化値,本發明裝置實施重建參數之 一後處理,使得該後處理重建參數用於輸入訊號之欲處理 時間部分,未以編碼器採用之量化光柵決定,而是導致重 建參數之値,其不同於依據量化法則量化所得到之値。 當於線性量化器情形,習知技藝方法僅允許反經量化 Φ 値爲該量化器步階尺寸之整數倍數,本發明後處理允許反 經量化値爲量化器步階尺寸之非整數倍數。此意指本發明 後處理減少量化器步階尺寸限制,因爲位於二相臨量化器 位準間之後處理重建參數可藉後處理得到,且可爲本發明 多頻道重建器使用,其使用後經處理重建參數。 此後處理可於多頻道合成器之再量化之前或之後實 施。當該後處理使用經量化參數實施時,即,使用量化器 標記’ 一反量化器爲需要的,其不僅對量化器步驟倍數可 予反量化,且亦可對量化器步階尺寸倍數間之反經量化値 -20- 1307248 - 予以反量化。 , 於後處理情形使用反經量化重建參數被施行,可使用 直進式反量化器,且使用反經量化値一內插/濾波/平滑被實 施。 於非線性量化法則情形下,如一對數量化法則,於再 量化前經量化重建參數之一後處理爲較佳的,因爲對數量 化爲近似於人類耳朵之聲音感知,其對低位準聲音爲較正 確的,且對高位準聲音爲較不正確的,即,作一種對數壓 • 縮。 在此注意的是本發明優點不僅藉修正重建參數本身得 到’其本身係包含於位元流中如經量化參數。該優點亦可 從重建參數藉導出一後處理量而得到。此爲特別有用的, 當重建參數爲一差異參數與一操控,如平滑被實施於從差 異參數導出之絕對參數時。 於本發明之較佳實施例中,對重建參數之後處理藉由 一訊號分析器被控制,其分析聯合重建參數之訊號部分以 • 發現’其訊號特性存在。於一較佳實施例中,解碼器控制 的後處理僅對訊號之音色部分致動(相對於頻率及/或時 間)’或當音色部份僅以一點源產生用於緩慢移動點源,該 後處理對非音色部分被解除致動,即,輸入訊號之暫態部 分或具有音色素材之快速移動點源^當此非用於訊號之音 色部分情形時此確定重建參數變化之全部動態被傳送用於 聲音訊號之暫態部分。 較佳地’後處理器以重建參數之平滑形式實施一修 正’從聽覺心理觀點此爲有意義的,不會影響重要的空間 -21 - 1307248 * 偵測提示’其對非音色,即,暫態訊號部分爲特別重要的。 . 本發明導致—低資料率,因爲重建參數之一編碼器側 量化可爲一粗糙量化,因爲系統設計者不必懼怕解碼器中 顯著的變化’因爲從一反量化位準至另一反經量化位準之 一重建參數之變化,其變化以藉映射至二再量化位準間之 一値之本發明處理被降低。 本發明之另一優點爲改善系統之品質,因爲從一再量 化位準至下一允許再量化位準之變化,所造成之聽覺人工 φ 物以本發明後處理被減低,其作爲映至二允許再量化位準 間之一値。 通常,經量化重建參數之本發明後處理,除藉編碼器 中參數化所得之資訊損失與重建參數之後續量化外,表示 進一步資訊損失。然而,此並非問題,因爲本發明後處理 器宜使用確實或前置經量化重建參數,用於決定後處理重 建參數,以被使用於輸入訊號之確實時間部分之重建,即, 基底頻道。其已顯示此導致一改善的主觀品質,因爲編碼 Φ 器引發之誤差可被補償至某種程度。甚至當編碼器側引發 誤差未以重建參數之後處理補償,在重建多頻道聲音訊號 中空間知覺之強烈變化被減低,宜僅用於音色訊號部分, 使得主觀的聽覺品質於任一情形被改善,而不論是否此導 致進一步資訊損失之事實。 【實施方式】 第la與lb圖顯示本發明多頻道編碼器/合成器綱要之 方塊圖。如相對於第4c圖將於稍後顯示,抵達解碼器側之 一訊號具有至少一輸入頻道與一序列經量化重建參數,該 -22- 1307248 經量化重建參數依據一量化法則被量化。每一重建參數聯 合輸入頻道之一時間部分,使得一序列時間部分聯合一序 列經量化重建參數。此外,該輸出訊號以第1 a與1 b圖所 示之多頻道合成器被產生,具有一些經合成輸出頻道,於 任何情形其大於輸入訊號中輸入頻道之數目。當輸入頻道 之數目爲1時,即當具有單一輸入頻道時,輸出頻道之數 目爲2或更多。然而,當輸入頻道之數目爲2或3時,輸 出頻道之數目分別將至少3或至少4。 於BCC情形中,輸入頻道之數目將爲1或通常不超過 2,同時輸出頻道之數目將爲5(左環繞、左、中央、右、右 環繞)或6(5環繞頻道加上一次低音揚聲器頻道)或於7.1或 9.1多頻道格式情形甚至更多。一般表示者,輸出源之數目 將高於輸入源之數目。 第la圖例示’在左側裝置1用於產生一多頻道合成器 控制訊號。方塊1名爲"平滑參數取出"包括一訊號分析器、 —平滑資訊計算器與一資料產生器。如第lc圖所示,訊號 分析器1 a接收,作爲一輸入’原先多頻道訊號。訊號分析 器分析多頻道輸入訊號以得到一分析結果。此分析結果轉 送至平滑資訊計算器用於對應訊號分析器,決定平滑控制 資訊,即訊號分析結果。特別地’平滑資訊計算器1 b作爲 決定平滑資訊使得對應平滑控制資訊,一解碼器側參數後 處理器產生一經平滑參數或從參數所導出之一平滑量參數 用於欲處理輸入訊號之一時間部分,使得在經平滑重建參 數之値或經平滑量,不同於依據一量化法則使用再量化得 到之値。 -23- 1307248 . 又,第la圖中該平滑參數取出裝置1,包含一資料產 ^ 生器用於輸出代表平滑控制資訊之一控制訊號,作爲解碼 器控制訊號。 特別地,代表平滑控制資訊之控制訊號可爲一平滑遮 罩、一平滑時間常數或控制解碼器側平滑作業之任何其他 値,使得重建多頻道輸出訊號,與基於非平滑値之重建多 頻道輸出訊號相比,基於一平滑値具有一改善品質。 該平滑遮罩包含訊號化資訊,其由例如對使用於平滑 φ 之每一頻率指示”開啓/關閉”狀態之旗標組成。如此,該 平滑遮罩可視爲對每一頻帶聯合具有一位元之時框的向 量,其中此位元控制,對此頻帶該編碼器導引平滑爲主動 與否。 如第la圖所示之一空間聲音編碼器宜包含一降混器3 與一後續聲音編碼器4。又,該空間聲音編碼器包含一空 間參數取出裝置2,其輸出經量化空間提示如頻道間位準 差異(ICLD)、頻道間時間差異(ICTDs)、頻道間相關値 • (ICC)、頻道間相位差異(IPD)、頻道間強度差異(IIDs)等。 在本文中,其略述頻道間位準差異爲大體上相同於頻道間 強度差異。 降混器3可被建構如第1 1圖所略述之項目1 1 4。又, 該空間參數取出裝置2可被實施如對第11圖項目1 1 6中所 略述者。雖然,另外實施例對降混器3與該空間參數取出 器2可被使用於本發明中。 又,聲音編碼器4並不一定需要。然而,當在元件3 之輸出處降混訊號之資料率對經由傳送/儲存裝置之降混 -24- 1307248 . 訊號之傳送爲太高時,此裝置被使用。 . 一空間聲音解碼器包含一編碼器導引參數平滑裝置 9a,其被耦合至多頻道升混器12。該輸入訊號對多頻道升 混器1 2通常對解碼經傳送/經儲存降混訊號爲一聲音解碼 器8之輸出訊號。 較佳地’本發明多頻道合成器用於從一輸入訊號產生 一輸出訊號,該輸入訊號具有至少一輸入頻道與一序列經 量化重建參數,該經量化重建參數依據一量化法則被量 φ 化,且聯合該輸入訊號之後續時間部分,輸出訊號具有一 些經合成輸出頻道,且經合成輸出頻道之數目爲大於一個 或大於一些輸入頻道,包括一控制訊號供應器用於供應具 有平滑控制資訊之一控制訊號。當控制資訊與參數資訊多 工時’此控制訊號供應器可爲一資料流訊號分離器。然而, 當該平滑控制資訊在第1 a圖中經由一分開頻道從裝置1至 裝置9a被傳送時,其從參數頻道14a或降混訊號頻道被分 開’被連接至聲音解碼器8之輸入側,接著控制訊號供應 φ 器僅是接收第la圖中以平滑參數取出裝置1產生之控制訊 號裝置9a之一輸入。 又,本發明多頻道合成器包括一後處理器9a,其又稱 爲一"編碼器導引參數平滑裝置"。該後處理器爲用於決定 一後處理重建參數或從重建參數導出之一後處理量,用於 欲處理之輸入訊號的時間部分,其中該後處理器作爲決定 後經處理重建參數或後處理量,使得該後處理重建參數或 後處理量之値不同於依據量化法則使用再量化所得之値。 該後處理重建參數或後處理量從裝置9a轉送至多頻道升混 -25- 1307248 ' 器12,使得該多頻道升混器或多頻道重建器丨2可實 , 建作業’用於重建經合成輸出頻道之數目之一時間 其使用輸入頻道之時間部分與後處理重建參數或 値。 其後,參考例示於第丨b圖本發明之較佳實施例 合編碼器導引參數平滑且解碼器導引參數平滑,如 未公開之美國專利申請案號1〇/883,538中所界定者 實施例中’平滑參數取出裝置〗’詳細顯示於第1C φ 此外產生一編碼器/解碼器控制旗標5a,其被傳送至 /開關結果區塊9b。 第lb圖中多頻道合成器或空間聲音解碼器包含 參數後處理器10’其爲解碼器導引參數平滑裝置, 道重建器12。解碼器導引參數平滑裝置1〇作爲接 化’且宜編碼重建參數用於輸入訊號之後續時間部 重建參數後處理器10作爲決定在一輸出之後處理 數,用於輸入訊號之欲處理之一時間部分。該重建 φ 處理器依據後處理法則作業,在一些較佳實施例中 通濾波法則、一平滑法則或另一近似作業。特別地 理器作爲決定後處理重建參數,使得後處理重建參 不同於依據量化法則,任一經量化重建參數之再量 之値。 多頻道重建器12被使用於重建每一合成輸出頻 之一時間部分,其使用經處理輸入頻道之時間部分 理重建參數。 . 於本發明較佳實施例中,該經量化重建參數爲 施~重 部分, 後處理 ’其結 爲先前 。於此 圖中, —結合 一重建 與多頻 收經量 分。該 重建參 參數後 爲一低 ’後處 數之値 化所得 :道數目 與後處 經量化 -26- 1307248 - B C C參數,如頻道間位準差異、頻道間時間差異、或頻道 . 間同調參數、或頻道間相位差異、或頻道間強度差異。通 常,所有其他重建參數如用於強度立體聲之立體聲參數’ 或用於參數立體聲之參數可同樣依據本發明被處理。 經由線5 a傳送之編碼器/解碼器控制旗標作爲控制該 開關’或結合裝置9b以轉送解碼器導引平滑値或編碼器導 引平滑値至多頻道升混器12。 以下,參考第4 c圖,顯示用於一位元流之例子。位元 φ 流包含數個時框20a,20b,20c,…等。每一時框包含以第 4c圖中時框之上矩形表示之輸入訊號之一時間部分。此 外,每一時框包含一組經量化重建參數,其聯合時間部分 且以每一時框20a,20b,20c之下矩形例示於第4c圖中。 可爲模範地,時框20b被考慮作爲欲處理之輸入訊號部分, 其中此時框已先於輸入訊號部分,即,其形成欲處理輸入 訊號部分之”過去”。此外,具有以下輸入訊號部分,其 形成欲處理輸入訊號部分之”未來”(欲處理之輸入部分 φ 亦稱爲"確實(actual)’’輸入訊號部分),同時在”過去”之 輸入訊號部分被稱爲先前輸入訊號部分,且在未來之訊號 部分被稱爲稍後輸入訊號部分。 本發明方法成功地處理具有緩慢移動點源之問題情 形,較佳地具有似雜訊特色或具有音色素材之快速移動點 源,如藉允許實施於解碼器中之平滑作業之更詳細編碼器 控制的快速移動正弦曲線。 如先前略述者,在編碼器導引參數平滑裝置9a或解碼 器導引參數平滑裝置10中,實施一後處理作業之較佳方式 -27- 1307248 * 爲於頻帶導向方式中,所實施之一平滑作業。 . 又,爲主動控制以編碼器導引參數平滑裝置9a所實施 之解碼器中之後處理,編碼器宜傳送訊號資訊作爲至合成 器/解碼器之側資訊的部分。然而,該多頻道合成器控制訊 號亦可被分別傳送至解碼器,而無需爲參數資訊或降混訊 號資訊之側資訊的部分。 於一較佳實施例中,此訊號化資訊由指示使用於平滑 之每一頻帶之”開啓/關閉”狀態之旗標組成。爲允許此資 φ 訊之有效傳送,一較佳實施例亦可使用一組"短切(short cut)"以發出具有非常少位元之某經常使用構形訊號。 爲此目的,第lc圖中平滑資訊計算器lb決定無平滑 被執行於任何頻帶。此經由以資料產生器1 c產生之"全部· 關閉"短切訊號發出訊號。特別地,代表"全部-關閉"短切訊 號之一控制訊號可爲某一位元型態或某一旗標。 又,該平滑資訊計算器1 b可決定在全部頻帶中,一編 碼器導引平滑作業將被實施。爲此目的,資料產生器1 c產 φ 生一 π全部-開啓''短切訊號,其發出訊號其中平滑被施加於 全部頻帶。此訊號可爲某位元型態或一旗標。 又,當訊號分析器1 a決定訊號不會從一時間部分至下 ~時間部分變化很大時,即從一目前時間部分至一未來時 間部分’平滑資訊計算器1 b可決定在編碼器導引參數平滑 作業中無變化需被實施。接著,資料產生器1 c將產生一" 重複最終遮罩"短切訊號,其將發出訊號至解碼器/合成 器’其中相同有關頻帶開啓/關閉型態將被使用於平滑,如 其被使用於先前時框之處理。 -28- 1307248 • 於一較佳實施例中,訊號分析器1 a作爲估算移動之速 . 度,使得解碼器平滑之衝擊係配合一點源之空間移動速 度。此過程之結果,一適宜平滑時間常數以平滑資訊計算 器1 b被決定,且經由資料產生器1 c以使用之側資訊,發 出訊號至解碼器。於一較佳實施例中,資料產生器lc產生 與傳送一索引値至一解碼器,其允許解碼器於不同預先界 定平滑時間常數間選取(如125ms,250ms,500ms,…)。於 另一較佳實施例,僅一時間常數對全部頻帶被傳送。此降 φ 低對平滑時間常數發出訊號資訊量,且足夠用於在頻譜中 一主要移動點源之經常出現情形。決定一合適平滑時間常 數之說明性過程將連同第2a與2b圖描述。 解碼器平滑程序之明示控制與一解碼器導引平滑方法 相比,需要一些額外側資訊之傳送。因爲此控制對具有特 定性質之全部輸入訊號之某一部分僅可爲必須的,二種方 式宜倂成單一方法,其亦稱爲"混合方法"。此可藉傳送訊 號化資訊達成,如一位元決定是否平滑將被執行,其基於 φ 在解碼器中一音色/暫態估計如以第1 b圖中裝置1 6或在明 示編碼器控制下所實施者。於後者情況,第1 b圖之側資訊 5 a被傳送至解碼器。 其後,將討論較佳實施例對辨識緩慢移動點源與估計 合適時間常數,以發出訊號至一解碼器。較佳地,所有估 計被執行於編碼器中,且因此能接近訊號參數之非經量化 版本,當然,其於編碼器中爲不可利用的,因爲在第la圖 與1 b圖中,裝置2傳送經量化空間提示用於資料壓縮原因 之事實。 -29- 1307248 * 其後,參考第2 a與2 b圖用於顯示對緩慢移動點源之 . 辨識的一較佳實施例。在某一頻帶與時框內一聲音事件之 空間位置,如連同第2 a圖所示被辨識。特別地,對每一聲 音輸出頻道,一單元長度向量指示在一通常收聽機構 中,該對應擴音機之相對位置。於第2 a圖所示之例子中, 該一般5頻道收聽機構使用擴音器L、C、R、Ls與Rs,及 對應單元長度向量eL·、ec、εκ、61^與eRs。 在某一頻帶與時框內之聲音事件之空間位置被計算作 ^ 爲這些向量之能量加權平均,如第2a圖中方程式所略述 者。從第2a圖較爲清楚,每一單元長度向量具有某x座標 與某y座標。藉相乘每一單元長度向量座標與對應能量, 且藉加總X座標項與y座標項,可以得到用於某一頻帶之 一空間位置與在某一位置X,y之某一時框。 如於第2b圖中步驟40所略述者,此決定對二接續時 間瞬間被實施。 接著,於步驟41中,決定是否具有空間位置 ρι,P2 I 之源爲緩慢移動。當接續空間位置間之距離爲低於一預定 臨界値時,該源被決定爲一緩慢移動源。然而當其決定該 位移量爲高於某最大位移臨界値,接著當其決定該源非緩 慢移動時,第2 b圖中之程序停止。 第2a圖中値L、C、R、Ls與Rs分別標示對應頻道之 能量。或者,以dB量得之能量亦可被使用於決定一空間位 置P。 於步驟42中,其被決定是否該源爲一點源或近似一點 源。較佳地,當相關ICC參數超過某一最小臨界値如0.85, -30- 1307248 • 點源被偵測到。當被決定時ICC參數爲低於預定臨界値, • 接者該源不爲一點源且停止第2a圖之程序。然而,當決定 該源爲一點源或一近似點源時,第2 b圖中程序進行至步驟 43。於此步驟’較佳地參數多頻道方案之頻道間位準差異 參數於某一觀察間隔內被決定,導致一些量測。該觀察間 隔可由一些編碼時框或一組觀測値組成,該組觀測値係較 時框組成序列所界定者爲高之時間解析度下進行。 於步驟44中’計算用於接續時間瞬間之icld曲線斜 • 率。接著’於步驟45中選取一滑時間常數,其反比於曲線 之斜率。 接著於步驟45中,一平滑時間常數作爲平滑資訊之例 被輸出且使用於解碼器側平滑裝置中,其從第4a與4b圖 變得顯明可爲平滑濾波器。於步驟4 5中所決定該平滑時間 常數’因此,被使用以設定使用於區塊9 a平滑化之數位濾 波器之濾波器參數。 關於第1 b圖’其強調編碼器導引參數平滑化9a與解 φ 碼器導引參數平滑化10亦可使用一單一裝置如第4b、5或 6a圖所示被執行,因爲一方面該平滑化控制資訊,且另一 方面以控制參數取出裝置16之解碼器經決定資訊輸出二 者作用於一平滑濾波器,與本發明之較佳實施例中平滑濾 波器之致動。 僅當一共通平滑時間常數發出訊號用於全部頻帶,對 每一頻帶之個別結果可被結合成一整體結果,例如以平均 化或加權平均化。於此情形,解碼器施加相同(能量加權的) 平均化平滑時間常數至每一頻帶,使得對全部頻譜僅單一 -31- 1307248 * 平滑時間常數需被傳送。當發現頻帶具有與經結合時間常 . 數有顯著變異時,對使用對應"啓動/關閉"旗標之這些頻 帶,平滑可被關閉。 其後,參考第3a、3b與3c圖以例示另一實施例,對 編碼器導引平滑控制係基於一藉合成進行分析方式。該基 本構想由某重建參數(宜爲IID/ICLD參數)之比較組成,該 重建參數由從量化與參數平滑至該對應非經量化(即,經量 測)(IID/ICLD)參數產生。此過程在第3a圖中所例示較佳實 φ 施例示意圖被加總。二不同多頻道輸入頻道一方面如L與 另一方面R被個別輸入分析濾波器庫中。該濾波器庫輸出 被分割與視窗化以得到一合適的時間/頻率表示。 如此,第3a圖包含具有二分開分析濾波器庫70a,70b 之一分析濾波器庫裝置。通常,單一分析濾波器庫與一儲 存可被使用二倍於分析二頻道。接著,於分割與視窗化裝 置72,該時間分割被實施。接著,每時框之ICLD/IID估計 被實施於裝置73中。該參數用於每一時框接續被送至一量 φ 化器74。因此,得到在裝置74之輸出的經量化參數。該經 量化參數接續以裝置7 5中一組不同時間常數被處理。較佳 地,本質上對解碼器可利用之全部時間常數以裝置75被使 用。最後,一比較與選取單元76比較該經量化與經平滑IID 參數至原先(未處理)IID估計。單元76輸出該經量化IID 參數與平滑時間常數,該平滑時間常數導致經處理與原先 經量測IID値間之一最佳配合。 其後’參考第3c圖之流程圖,其對應第3 a圖中裝置。 如於步驟46中略述者,產生用於數個時框之IID參數。接 -32- 1307248 . 著,於步驟47中,這些IID參數被量化。於步驟48中, . 該經量化IID參數使用不同時間常數被平滑。接著,於步 驟49中,一經平滑序列與一原先產生序列間之誤差被計算 用於步驟49中所使用之每一時間常數。最後,於步驟50 中,該經量化序列與平滑時間常數被選取,其導致最小誤 差。接著,步驟5 0輸出經量化値序列與與最佳時間常數。 於較精密實施例中,其較佳用於高等的裝置,此過程 亦可被實施用於一組從量化器可能IID値目錄中選取之經 φ 量化IID/ICLD參數。於該情形,該比較與選取程序將包括 經處理IID與未處理IID參數之比較,用於經傳送(經量 化)IID參數與平滑時間常數之各種不同組合。如此,如於 步驟47中以方括弧所略述者,與第一實施例成對比,第二 實施例使用不同量化法則或相同量化法則,但不同量化步 驟大小以量化IID參數。接著,於步驟5 1中,對每一量化 方式與每一時間常數一誤差被計算。如此,與第3c圖中步 驟50相比,欲於步驟52中所決定之候選者數目於更精密 φ 實施例中,爲與第一實施例相比較高於相同於不同量化方 式之數目之一因子。 接著,於步驟52中,一個二維最佳化對(1)誤差與(2) 位元率被實施以搜尋用於一序列經量化値與一匹配時間常 數。最後,於步驟5 3中,該經量化値序列爲使用霍夫曼碼 或算術碼進行熵編碼。步驟5 3最後導致被傳送至一解碼器 或多頻道合成器之一位元序列。 第3b圖例示以平滑化之後處理效果。項目77例示對 時框η之一經量化IID參數。項目7 8例示用於具有時框指 -33- 1307248 標n+l之時框的經量化IID參數。該經量化IID參數78從 . 參考號碼79表示之每時框經量測IDD參數,以一量化導 出。具有不同時間常數之經量化參數77與78之此參數序 列平滑化,導致在80a與80b之較小後處理參數値。時間 常數用於平滑參數序列77,78,其導致後處理(經平滑)參數 80a爲小於平滑時間常數,其導致後處理參數80b。如技藝 中顯示’平滑時間常數爲與一對應低通濾波器之截止頻率 倒數。 • 在第3c圖中結合步驟51至53所例示之實施例爲較佳 的,因爲其對誤差與位元率可實施二維最佳化,因爲不同 量化法則可導致用於代表經量化値之不同位元數。又,此 實施例係基於該後處理重建參數之確定値,視經量化重建 參數與處理之方式而定的發現。
例如,從時框至時框之(經量化)IID中大的差異,結合 大的平滑時間常數有效地導致僅該經處理IID之小量淨效 果。相同的淨效果與一較小時間常數相比的話,可以IID • 參數中小的差異被構建。此額外之自由度啓動編碼器以最 佳化重建IID與同時產生之位元率二者(在某IID値之傳送 較某另一IID參數之傳送更昂貴之事實下)。 如以上略述者,在平滑上IID軌跡之效果略述於第3b 圖’其顯示一 IID軌跡對平滑時間常數之各種數値,其中 星形表示每時框之一經量測IID,且其中三角形表示量 化器之可能値。在IID量化器之既定有限準確度下,在時 框n+1上以星形表示之IDD値爲無法利用的。最接近之IID 値以三角形表示。在圖形中之線顯示時框間之IID軌跡’ -34- l3〇7248 • 其係從各平滑常數產生。該選取演算法將選取平滑時間常 • 數,其係導致一IID軌跡其爲終端最接近對時框n+1之經 量測IID參數。 以上例示全部有關於IID參數。原則上,所有描述方 法亦可被施加至IPD,ITD,或ICC參數。 本發明因此有關一編碼器側處理與一解碼器側處理, 其形成使用一平滑啓動/關閉遮罩與經由一平滑控制訊號 之時間常數訊號之系統。又,每頻帶關於頻帶訊號被實施, # 其中,又短切爲較佳的,其可包含全部頻帶啓用、全部頻 帶關閉或重覆先前狀態短切。又,其較佳使用一共通平滑 時間常數用於全部頻帶。又,另外或是或者地,一訊號用 於自動音色基礎之平滑與直接表示相形下,編碼器控制可 被傳送以執行一混合方法。 其後,參考解碼器側執行,與編碼器導引參數平滑一 起作用。 第4a圖顯示一編碼器側2 1與一解碼器側22。於編碼 • 器中,N個原先輸入頻道被輸入一降混器階段23。該降混 器階段作爲減少頻道數目至例如單一單音頻道或,可能 地’至二立體聲頻道。在降混器23之輸出的經降混訊號表 示爲’接著,輸入一源編碼器24 ’源編碼器被實施例如作 爲一mp3編碼器或AAC編碼器產生一輸出位元流。編碼器 側21又包括一參數取出器25,其依據本發明實施BCC分 析(第1 1圖區塊1 1 6)且輸出該經量化與宜是霍夫曼編碼頻 道間位準差異(I C L D)。在源編碼器2 4之輸出的位元流與以 參數取出器25之經量化重建參數輸出可被傳送至一解碼 -35- 1307248 . 器22或可被儲存用於稍後傳送至一解碼器等。 解碼器2 2包含一源解碼器2 6,作爲構建從經接收位元 * 流之一訊號(來自於源編碼器2 4)。爲此目的’源解碼器2 6 在其輸出供應輸入訊號之接續時間部分至一升混器1 2 ’其 實施與第1圖中多頻道重建器1 2之相同機能。較佳地’此 機能爲如以第1 1圖之區塊1 22所執行之一 BCC合成。 相對於第11圖,本發明多頻道合成器進而包括後處理 器10(第4a圖),其稱爲"頻道間位準差異(ICLD)平滑器", φ 其以輸入訊號分析器1 6控制,宜實施輸入訊號之一音色分 析。 從第4a圖可見到,會有重建參數如頻道間位準差異 (ICLDs),其被輸入ICLD平滑器,於參數取出器25與升混 器12間具有一額外連接。經由此旁通連接、對重建之其他 參數,其不必被後處理,可從參數取出器2 5供應至升混器 12° 第4b圖顯示以訊號分析器16與ICLD平滑器10,所 φ 形成之訊號適應性重建參數處理之~較佳實施例。 訊號分析器16從音色決定單元16a與接續臨界裝置16b 被形成。此外’從第4 a圖之重建參數後處理器1 〇包含一 平滑濾波器1 0a與一後處理器開關1 〇b。該後處理器開關 1 Ob以臨界裝置1 6b被控制,使得開關被致動,當臨界裝置 16b決定輸入訊號之某訊號特性如音色特性時,爲與某臨界 値處於一預定關係。於目前情形中,該情形爲使得開關於 上位置被致動(如第4b圖所示),當輸入訊號之訊號部分音 色,與特別地’輸入訊號之某時間部分之某頻帶具有高於 -36- 1307248 音色臨界値之音色。於此情形,開關l〇b被致動以連接平 滑濾波器10a之輸出至多頻道重建器12之輸入,使得後處 理而非反量化頻道間差異被供應至解碼器/多頻道重建器/ 升混器12。 然而,當於一解碼器控制執行中之音色決定裝置,決 定輸入訊號之一確實時間部分之某頻帶,即,欲處理輸入 訊號部分之某頻帶具有音色低於特定臨界値,即爲暫態, 該開關被致動使得平滑濾波器1 〇a爲旁通的。 於後者情形,藉平滑濾波器1 〇a之訊號適應性後處理 確定該重建參數變化用於暫態訊號通過該後處理階段未修 正,且導致相對於空間影像重建輸出訊號中之快速變化, 其對應實際情形具有對暫態訊號之高度機率。 於此注意的是第4b圖實施例,即,一方面致動後處理 且另一方面完全使後處理無作用,即,因爲其簡單與有效 之結構,對後處理是否一個二元決定僅是一較佳實施例。 雖然,必須注意的是,特別相對於音色,此訊號特性不僅 是一品質上參數且是一量化參數,通常介於0與1之間。 依據該量化決定參數、平滑濾波器之平滑程度或,例如, 低通濾波器之截止頻率可被設定使得對大音色訊號,一強 烈平滑被致動,同時對非如此音色之訊號,由具有較低平 滑程度之平滑開始。 通常,其亦可偵測暫態部分與放大參數中該變化至預 定經量化値或量化指標間之値,使得對強烈暫態訊號,對 重建參數之後處理導致一多頻道訊號之空間影像之更放大 變化。於此情形,量化步階尺寸爲1如以對後續時間部分 -37- 1307248 • 之後續重建參數所教示者,可被提升至例如,1.5、1.4、1·3 . 等,其導致重建多頻道訊號更劇烈之空間影像變化。 於此注意的是一音色訊號特性、一暫態訊號特性或其 他訊號特性僅是對訊號特性例子,基於一訊號分析可被實 施以控制一重建參數後處理器。對應此控制,該重建參數 後處理器一方面,決定具有數値不同於用於量化指標之任 何値之後處理重建參數,或另一方面如以一預定量化法則 所決定之再量化値。 φ 在此注意的是重建參數之後處理視訊號特性而定, 即,一訊號適應性參數後處理僅爲選擇的。一訊號獨立後 處理亦對許多訊號提供優點。例如,某一後處理功能可被 使用者選取,使得使用者得到提升變化(於一放大功能情形) 或減弱變化(於平滑功能情形)。或者,一獨立於任何使用 者選取之後處理與獨立於訊號特性,相對於誤差彈性亦能 提供某些優點。在量化器索引中一傳送誤差可導致聽覺上 人工物將變得清楚,特別是於大量化器步驟尺寸情形。爲 φ 此目的,當訊號必須被傳送於易誤差頻道時,可實施一前 向誤差校正或另一類似作業。依據本發明,後處理防止用 於任何無效率位元誤差校正碼之需要,因爲基於過去重建 參數之重建參數後處理將導致誤差傳送量化重建參數之偵 測,且將導致對此等誤差之適宜的計數量測。此外,當後 處理功能爲一平滑功能時,非常不同於前或後重建參數之 量化重建參數將自動地被操縱如以下將略述者。 第5圖顯示第4a圖重建參數後處理器10之一較佳實 施例。特別地,經量化重建參數被編碼情形被考慮,其中。 -38- 1307248 . 在此,該編碼量化重建參數進入一熵解碼器1 〇 c,其輸出解 . 碼量化重建梦數之序列。在熵解碼器之輸出之重建參數被 量化,其意指它們未具有某一 “有用的”値,而是意指它 們指示某量化器索引或以一後續反量化器實施之某量彳匕法 則之量化器位準。操控器10 d可爲,例如,一數位爐波器 如一 IIR(較佳地)或一具有以所需後處理功能決定之任何 濾波器特性的FIR濾波器。一平滑或低通濾波後處理功能 爲較佳的。在操控器1 Od之輸出,得到經操控量化重建參 φ 數之序列’其不僅爲整數且爲以量化法則所決定之範圍內 之任何實數。此一經操控量化重建參數與階段1 〇 d前之値 1,0,1相比的話’可具有値1 · 1,0.1 , 0 · 5,…。在區塊1 Od之 輸出之序列値接著被輸入一提升反量化器1 〇e以得到後處 理重建參數,其可被使用於第la與lb圖之區塊12中之多 頻道重建(例如,BCC合成)。 須注意的是該提升反量化器10e(第5圖)不同於一普通 反量化器,因爲一普通反量化器僅從一量化索引之有限數 φ 目,映射每一量化輸入至一特定反量化輸出値。普通反量 化器不能映射非整數量化器索引。該提升反量化器10e因 此被實施以較佳地使用相同量化法則,如一線性或對數量 化法則,但它可接受非整數輸入以提供輸出値,其是不同 於僅使用整數輸入得到之値。 相對於本發明,是否該操控實施於再量化前(見第5圖) 或於再量化後(見第6a,6b圖),其基本上並無差異。於後 者情形,反量化器僅需爲一通常直進式反量化器,其不同 於如以上已略述之第5圖中提升反量化器10e。當然,第5 -39- 1307248 * 與6a圖間之選取爲視某實施而定之選擇情形。對本實施, . 第5圖實施例爲較佳的,因爲它與既存之BCC演算法更爲 相容。雖然,此對其他應用可能爲不同的。 第6b圖顯示一實施例,其中第6a圖之提升反量化器 l〇e可以一直進式反量化器取代,且一映射器10g用於依據 一線性或較佳地非線性曲線映射。此映射器可以硬體或軟 體如用於實施一數學運算之電路或查表實現。使用例如平 滑器l〇g之資料操作可於映射器l〇g前或映射器10g後或 Φ 二者結合被實施。此實施例爲較佳的,當該後處理被實施 於反量化器領域時,因爲全部元件1 Of,1 Oh,1 0g可使用 直進式元件如軟體常式電路被實施。 通常’後處理器1 0可被實施爲如第7 a圖所示之一後 處理器,其接收全部或實際量化重建參數、,未來重建參 數或過去量化重建參數之一選取。於此情形,其中後處理 器僅接收至少一過去重建參數與實際重建參數,該後處理 器將作爲一低通濾波器。然而,當後處理器1 〇接收一未來 Φ 而非延遲量化重建參數,其在使用某延遲之真實時間應用 爲可能的,該後處理器可於未來與目前或過去量化重建參 數間實施一內插,例如平滑重建參數之一時間經過,例如 對某一頻帶。 第7 b圖顯示一範例實施,其中該後處理値非從反量化 重建參數導出,而是從反量化重建參數導出之値。對導出 之處理以裝置700被實施用於導出,於此情形,可經由線 7 0 2接收該量化重建參數,或經由線7 0 4可接收一反量化 參數。其可例如接收一振幅値作爲一經量化參數一振幅 -40- 1307248 値’其爲該裝置使用以導出用於計算之能量値。接著,其 爲接受後處理(例如,平滑)作業之此能量値。該經量化參 數經由線708被轉發至區塊706。因此,後處理可直接使用 以線7 1 0所示之經量化參數被實施,或使用如以線7 1 2所 示之反量化參數,或使用如以線7 1 4從反量化參數導出之 値。 如以上略述者’克服由於在粗糙量化環境中,量化步 階尺寸之人工物之資料操控亦可實施於從重建參數導出之 • 量,該重建參數附加至參數化經編碼多頻道訊號中之基底 頻道。例如當經量化重建參數爲一差異參數(ICLD),此參 數可被反量化而無需任何修正。接著一絕對位準値用於一 輸出頻道可被導出,且該發明資料操控於絕對値上被實 施。此過程亦導致該發明人工物減少,只要經量化重建參 數間之處理路徑中資料操控,且真實重建被實施使得後處 理重建參數之値或後處理量不同於依據量化法則,使用再 量化得到之値,即,不需操控以克服該“步階尺寸限制’,。 φ 用於從經量化重建參數導出該最終操控量之任何映射 功能,爲可設計的且使用於技藝中,其中這些映射功能包 含依據一映射法則,用於獨特映射一輸入値至一輸出値之 功能’以得到一非後處理量’其接著被後處理以得到使用 於多頻道重建(合成)演算法之後處理量。 以下,參考第8圖說明第5圖之—提升反量化器1〇e與 第6a圖之直進式反量化器1〇f間之差異。爲此目的,第8 圖中例不顯75 ’如對非經量化値—水平軸、—輸入値軸。 該垂直軸例示量化器位準或量化器索引,其宜爲具有値〇、 -41 - 1307248 • 1、2、3之整數。在此須注意的是第8圖中量化器將不導致 , 0與1間或1與2間之任何値。映射至這些量化器位準以階 梯型功能控制,使得介於-】〇與1 〇間之値,例如被映至0, 同時1 0與20間之値被量化至1等。 以可能反量化器功能必須映射一 〇量化器位準至〇之 一反量化値。量化器位準1將被映射至一反量化値1 0。類 似地,量化器位準2例如將被映射至一反量化値20。因此, 再量化以參考號碼3 1所示之一反量化器功能控制。須注意 φ 的是,用於一直進式反量化器,僅線3 0與線3 1之交點爲 可能的。此意指,對具有第8圖之反量化器法則之直進式 反量化器僅値0,1 0,20,30可以再量化得到。 此不同於提升反量化器10e,因爲該提升反量化器接 收,作爲一輸入,介於0與1或1與2之値如0.5値。以 操控器10d所得之0.5値之進一步再量化將導致5之一反 量化輸出値,即,於後處理重建參數中,具有一値不同於 依據量化法則以再量化所得之値。當該通常量化法則僅允 φ 許〇或1 0之値,依據較佳量化器功能3 1運作之較佳反量 化器導致一不同値,即,値5如第8圖中所示者。 當直進反量化器僅將整數量化器位準映至經量化位 準,該經提升反量化器接收非整數量化器"位準",以將這 些値映至以反量化器法則所決定之這些値間之"反量化値 "〇 第9圖顯示對第5實施例較隹後處理之影響。第9a圖 顯示於〇與3間變化之一序列經量化重建參數。第9b圖顯 示一序列後處理重建參數,其亦稱爲"經修正量化器指標 -42- 1307248 • ",當第9a圖中之波形被輸入一低通(平滑)濾波器時。在此 . 需注意的是在時間瞬間1、4、6、8、9與10之增加/減少 於第9b實施例中被減低。強調注意的是時間瞬間8與時間 瞬間9間之尖峰,其可爲一人工物係以一全部量化步驟被 減弱。然而,此等極端値之減弱可以依據以上略述之一量 化音色値,以後處理之一程度控制。 本發明在本發明後處理平滑波動或平滑短極端値爲有 利的。該情況特別於產生於一情形,其中從具有一相似能 φ 量之數個輸入頻道之訊號部分被疊加於一訊號之一頻帶, 即’該基底頻道或輸入訊號頻道。此頻帶接著,每時間部 分且視以高度波動方式混合至該個別輸出頻道之瞬間情況 而定。然而,從聽覺心理學觀點,其宜平滑這些波動,因 爲這些波動不會實質貢獻一來源之位置偵測,而會以負面 方式影響主觀的收聽印象。 依據本發明之一較佳實施例,此等可聽見人工物被減 低或甚至被去除,而不會在系統中不同地方招致任何品質 φ 損失’或不需經傳送重建參數之一較高解析度/量化(與, 因此一較高資料率)。本發明藉實施參數之一訊號適應性修 正(平滑),達到此目標而無需大體上影響重大空間局部化 偵測提示。 在重建輸出訊號特性中突然出現之變化導致可聽見之 人工物’特別對具有一高度常數不變特性之聲音訊號。此 情形具有音色訊號。因此,對用於此等訊號經量化重建參 數間’提供一"平滑器(smoother)"轉換爲重要的。此可以例 如以平滑、內插等方法得到。 -43- 1307248 此外,此等參數値修正可導致對其它聲音訊號型式聽 覺上扭曲。此爲對訊號情形,包含其特性中快速變動。此 一特性可發現於暫態部分或一撞擊儀器之襲擊中。於此情 形,該實施例提供對參數平滑之解除。 此以訊號適應性方式,後處理該經傳送量化重建參數 而得到。 適應性可爲線性或非線性。當該適應性爲非線化時, 如第3c圖所描述之一臨界値程序被實施。 另一標準用於用於控制該適應性爲訊號特性不變性之 一決定。某一形式用於決定訊號特性之不變性爲訊號包封 之評估或’特別地,訊號之音色。在此需注意的是該音色 可被決定用於整個頻率範圍或,較佳地,個別用於一聲音 訊號之不同頻帶。 此實施例導致人工物之一減低或甚至除去,其是到目 前爲止無法避免的,而不會引起用於傳送參數値所需資料 率之增加。 如相對於第4 a與4 b圖略述於上者,本發明之較佳實施 例中當考慮該訊號部分具有一音色特性時,解碼器控制模 式實施頻道間位準差異之平滑。頻道間位準差異被計算於 一編碼器中’且於一編碼器中經量化被送至一解碼器用於 實施一訊號適應性平滑作業。該適應性要件爲與一臨界値 決定有關之音色決定’其對音色頻譜成份於頻道間位準差 異之濾波上開啓’且對似雜訊與暫態頻譜成份關閉此等後 處理。於此實施例中,對實施適應性平滑演算法,無需要 編碼器之額外側資訊。 -44- 1307248 • 此處注意的是本發明後處理亦可使用於多頻道訊號之 . 其它參數編碼槪念,如用於參數立體聲、MP3環繞音響與 類似方法。 本發明方法或裝置或電腦程式可被實施或包含於數個 裝置。第14圖顯示具有一發射器之傳送系統,包含一發明 性編碼器’且具有包含一發明性解碼器之接收器。傳送頻 道可爲一無線或有線頻道。又,如第1 5圖中所示,編碼器 可被包含於一錄音器或解碼器可被包含於一放音器中。從 φ 錄音器之聲音記錄可經由網際網路,或使用郵寄散佈之儲 存媒體或遞送資源或散佈儲存媒體如記憶卡、CD或DVD 或其他可能被散佈於放音器中。 視本發明方法之某些實施需求,該發明方法可被實施 於硬體或軟體中。該實施可使用一數位儲存媒體,特別是 一碟片或具有經儲存電子式可讀取控制訊號被實施,其可 與一可程式化電腦系統合作’使得本發明方法被實施。通 常’本發明因此爲具有一儲存在機器可讀取式載體之程式 φ 碼的電腦程式產品’當該電腦程式產品執行於一電腦時, 該程式碼被構形用於實施至少本發明方法之一種。換句話 說’當該電腦程式執行於一電腦時,本發明方法因此爲用 於實施本發明方法具有一程式碼之一電腦程式。 當以上以參考特別實施例特別顯示與予以描述時,業 界技藝人士將瞭解其它形式與細節上各種變化,將不會逸 離本發明之精神與範疇。其瞭解到各種變化可修改不同實 施例達成’而不會脫離在此所揭露之廣泛槪念與對以下申 請專利範圍之瞭解。 -45- 1307248 • 【圖式簡單說明】 . 本發明之較佳實施例接著參考附圖描述於下,其中: 第1 a圖爲依據本發明之第一實施例,一編碼器側裝置與對 應解碼器側裝置之示意圖; 第1 b圖爲依據本發明之另一實施例,一編碼器側裝置 與對應解碼器側裝置之示意圖; 第lc圖爲較佳控制訊號產生器之一示意區塊圖; 第2a圖爲一示意表示圖,用於決定一聲源之空間位 φ 置; 第2b圖爲一較佳實施例之流程圖,用於計算一平滑時 間常數作爲用於平滑資訊之一例子; 第3a圖爲另一實施例,用於計算經量化頻道間強度差 異與對應平滑參數; 第3b圖爲一範例圖,例示每時框之經量測IID參數與 每時框經量化IID參數,及每時框經處理量化IID參數間 之差異,用於各種不同時間常數; φ 第3c圖爲如施加於第3a圖槪念之較佳實施例之流程 圖; 第4a圖爲一示意圖,例示一解碼器-側導向系統; 第4b圖爲一欲使用於第lb圖中本發明多頻道合成器 之後處理器/訊號分析器組合之一示意圖; 第4c圖爲一輸入訊號與聯合經量化重建參數之時間 部分之示意表示圖,用於過去訊號部分,欲處理之實際訊 號部分與未來訊號部分; -46- 1307248 • 第5圖爲從第1圖之編碼器導引參數平滑裝置之一實 . 施例; 第6a圖爲第1圖所示之編碼器導引參數平滑裝置之另 ~實施例; 第6b圖爲編碼器導引參數平滑裝置之又一實施例; 第7a圖爲第1圖所示之編碼器導引參數平滑裝置之另 一實施例; 第7b圖爲欲後處理參數之一示意圖,其依據本發明亦 Φ 顯示從重建參數所導出之量可被平滑化; 第8圖爲一示意圖,表示一實施一直接映射或一提升 映射之量化器/反量化器; 第9a圖爲聯合後續輸入訊號部分之經量化重建參數 之一範例時間發展; 第9b圖爲後處理重建參數之一時間發展,其已藉後處 理器實施一平滑(低通)功能被後處理; 第1 0圖例示一習知技藝聯合立體聲編碼器; 擎 弟Π圖爲一區塊圖表示一習知技藝BCC編碼器/解碼 器鏈; 第12圖爲第11圖中BCC合成區塊之一習知技藝實施 之區塊圖; 第13圖爲用於決定IC LD,ICTD與ICC參數之一眾所 皆知方案表示; 第1 4圖爲一傳送系統與發射器與接收器;及 第15圖爲一具有本發明編碼器之一錄音器與具有一 解碼器之放音器。 -47- 1307248 【主要元件符號說明】
1 平 滑 參 數 取 出裝置 la 訊 號 分 析 器 1 b 平 滑 資 訊 計 算器 1 c 資 料 產 生 器 2 空 間 參 數 取 出器 3 降 混 器 4 聲 音 編 碼 器 5 a 編 碼 器 /解碼器控制旗標 8 聲 音 解 碼 器 9 a 編 碼 器 導 引 參數平滑裝置 9b 結 合 /開關結果區塊 10 重 建 參 數 後 處理器 10a 平 滑 濾 波 器 1 Ob 後 處 理 器 開 關 10c 熵 解 碼 器 1 Od 操 控 器 lOe 反 量 化 器 lOf 反 量 化 器 lOg 映 射 器 12 多 頻 道 升 混 器 14a 參 數 頻 道 16 訊 號 分 析 器 16a 色 決 定 單 元 16b 臨 界 裝 置 -48- 1307248
20a 時 框 20b 時框 20c 時框 21 編 碼 器 側 22 解 碼 器 側 23 降 混 器 階 段 24 源 編 碼 器 25 參 數 取 出 器 26 源 解 碼 器 30 線 3 1 線 60 結 合 -〈了‘ 體 聲 裝 置 70a 分 析 濾 波 器 庫 70b 分 析 濾 波 器 庫 72 裝 置 73 裝 置 74 裝 置 75 裝 置 76 比 較 與 巳 m 取 單 元 77 參 數 序 列 78 參 數 序 列 79 每 時 框 經 量 測 IDD參數 80a 後 處 理 參 數 80b 後 處 理 參 數 110 輸 入 -49- 1307248
1 12 114 115 116 117 120 121 122 123 124 125 126 127 128 129 130 700 702 704 706 708 710 7 12 7 14 BCC編碼器 降混區塊 線 BCC分析區塊 側資訊線 BCC解碼器 輸出 BCC合成區塊 側資訊處理區塊 擴音器 濾波器庫 延遲階段 位準修正階段 相關處理階段 反濾波器庫階段 相乘節點 裝置 線 線 區塊 線 線 線 線 -50-

Claims (1)

  1. --: 年月日饺(更)正养換頁 J307248 第95 1 03 076號「產生多頻道合成器控制fi號之ΐ置及方法 與用於多頻道合成之裝置及方法」專利案 (200 8年10月修正) 十、申請專利範圍: 1.一種用於產生一多頻道合成器控制訊號之裝置,包括: 一訊號分析器,用於分析一多頻道輸入訊號;
    一平滑資訊計算器,用於決定回應該訊號分析器之平 滑控制資訊,該平滑資訊計算器係作爲決定平滑控制資 訊’使得回應平滑控制資訊,一合成器側後處理器針對 一將被處理之輸入訊號的時間部分,產生一後處理重建 參數或從重建參數導出一後處理量;及 一資料產生器,用於產生一代表該平滑控制資訊之控 制訊號,作爲多頻道合成器控制訊號。 2 .如申請專利範圍第1項之裝置,其中該訊號分析器係作 爲分析一多頻道訊號特性之變化,其變化係從多頻道輸 入訊號之第一時間部分至多頻道輸入訊號之稍後第二時 間部分,及 其中該平滑資訊計算器作爲決定一基於該經分析變化 之平滑時間常數資訊。 3 ·如申請專利範圍第1項之裝置,其中該訊號分析器係作 爲實施多頻道輸入訊號之頻帶分析,及 其中平滑參數計算器係作爲決定頻帶平滑控制資訊。 4 如申請專利範圍第3項之裝置,其中資料產生器係作爲 輸出具有用於每一頻帶之位元之平滑控制遮罩,用於每 一頻帶之位元指示解碼器側後處理器是否執行平滑。 1307248 \ 5 .如申請專利範圍第3項之裝置,其中資料產生器係作爲 產生—全部-關閉短切訊號(all-off short cut signal),該 訊號指示無平滑被實施,或 產生一全部-啓動短切訊號(all-on short cut signal), 該訊號指示平滑將被執行於每一頻帶,或 產生一重複最後遮罩訊號,該訊號指示一頻帶狀態將 被使用於一目前時間部分’其已被合成器側後處理器使 用當作一先前時間部分。
    6 ·如申請專利範圍第1項之裝置,其中資料產生器作爲產 生一合成器致動訊號’其指示合成器側後處理器是否使 用於一資料流傳送之資訊或使用從合成器側訊號分析所 得到之資訊運作。 7. 如申請專利範圍第2項之裝置,其中資料產生器作爲產 生,如平滑控制資訊,從一組對合成器側後處理器已知 之値,指布某一平滑時間常數値之訊號。
    8. 如申請專利範圍第2項之裝置,其中訊號分析器基於對 一多頻道輸入訊號時間部分之一頻道間同調參數,作爲 決定是否一點源存在,及 其中當訊號分析器已決定一點源存在時,該平滑資訊 計算器或資料產生器僅爲主動式。 9 .如申請專利範圍第1項之裝置,其中平滑資訊計算器作 爲對後續多頻道輸入訊號時間部分,計算一點源之位置 的變化,及 其中資料產生器作爲輸出一指示位置之變化爲低於一 預定臨界値之控制訊號,使得平滑以合成器側後處理器 1307248 厂--- 年月日修(更)正替換頁: 1 _______ 被施加。 1 0 .如申請專利範圍第2項之裝置,其中訊號分析器以數個 時間瞬間作爲產生一頻道間位準差異或頻道間強度差 異,及 其中平滑資訊計算器作爲計算一平滑時間常數,其爲 反比於頻道間位準差異之曲線斜率或頻道間強度差異 參數。
    1 1 ·如申請專利範圍第2項之裝置,其中平滑資訊計算器作 爲計算用於一群數個頻帶之單一平滑時間常數,及 其中資料產生器作爲指示用於數個頻帶組中一個或 多個頻帶之資訊’其中使合成器側後處理器無作用。 1 2 ·如申請專利範圍第1項之裝置,其中平滑資訊計算器藉 合成處理作爲實施一分析。 1 3 .如申請專利範圍第1 2項之裝置,其中平滑資訊計算器 作爲計算數個時間常數’使用該數個時間常數模擬一合 成器側後處理’選取一時間常數,產生用於接續時框之 値,其顯示離非量化對應値之最小偏離。 1 4 ·如申請專利範圍第1 2項之裝置,其中不同測試對被產 生,其中一測試對具有一平滑時間常數與某種量化法 貝IJ ,及 其中平滑資訊計算器作爲從該測試對使用一量化法 則與選取平滑時間常數選取經量化之値,該測試對導致 在後處理値與非量化對應値間之一最小偏離。 I5·如申請專利範圍第1項之裝置,其中該裝置可配置於發 射器或錄音器中。 1307248 飲 Km : 1 6 . —種產生多頻道合成器控制訊號之方法’包括: 分析一多頻道輸入訊號; 回應該訊號分析步驟決定平滑控制資訊’使得回應該 平滑控制資訊,一後處理步驟’針對將被處理輸入訊號 之一時間部分,產生一後處理重建參數或從重建參數導 出之後處理量;及 產生代表平滑控制資訊之一控制訊號,作爲多頻道合 成器控制訊號。 φ 1 7 .如申請專利範圍第1 6項之方法,其中該方法可用於傳 輸器或聲音記錄器中》 18.—種用於從一輸入訊號產生一輸出訊號之多頻道合成 器,該輸入訊號具有至少一輸入頻道與一序列經量化重 建參數,該經量化重建參數依據一量化法則被量化,且 與輸入訊號之後續時間部分相關連,該輸出訊號具有一 些經合成輸出頻道,且經合成輸出頻道之數目大於輸入 頻道之數目,輸入頻道與代表平滑控制資訊之一多頻道 φ 合成器控制訊號相關連,包括: 一控制訊號提供器,用於提供具有平滑控制資訊之 控制訊號; 一後處理器,回應該控制訊號,以對將被處理輸入 訊號之一時間部分決定後處理重建參數或從重建參數 導出之後處理量,其中後處理器作爲決定後處理重建 參數或後處理量,使得後處理重建參數之値或後處理 量不同於依據量化法則使用再量化所得到之値;及 一多頻道重建器,用於使用輸入頻道之時間部分與 -4- 1307248 tff ΐίΓ*Φ^ ------ 年dk更)正替換頁 後處理重建參數或後處理値,重建經合成輸出頻道之 數目之一時間部分。 1 9 .如申g靑專利範圍第1 8項之多頻道合成器,其中平滑控 制資訊指示一平滑時間常數,及 其中後處理器作爲實施一低通濾波,其中一濾波器 特性回應平滑時間常數被設定。 2 0 .如申請專利範圍第1 8項之多頻道合成器,其中控制訊
    號包含平滑控制資訊,用於該至少一輸入頻道之複數 個頻帶的每一頻帶,及 其中後處理器作爲回應控制訊號,以頻帶方式實施 後處理。 2 1 .如申請專利範圍第1 8項之多頻道合成器,其中控制訊 號包含一平滑控制遮罩,該遮罩對每一頻帶具有一位 元,對每一頻帶之該位元指示,是否後處理器將實施 平滑,及
    其中僅在平滑控制遮罩中用於該頻帶之一位元具有 一預定値時’該後處理器回應平滑控制遮罩作爲實施 平滑。 22.如申請專利範圍第1 8項之多頻道合成器,其中控制訊 號包含一全部-關閉短切訊號、一全部-開啓短切訊號或 一重複最後遮罩短切訊號(rePeat last mask short cut signal),及 其中後處理器作爲實施一平滑作業,回應全部-關閉 短切訊號、全部-開啓短切訊號或重複最後遮罩短切訊 號。 1307248 r;m:w2^ ;夂::.: j · ' > 1 ·,. !«— — —-------— ...........— 圓-—> -*« 2 3 _如申請專利範圍第1 8項之多頻道合成器,其中資料訊 號包含一解碼器致動訊號’指不後處理器是否將使用 資料訊號中所傳送之資訊’或使用從一'解碼器側訊號 分析所導出之資訊而運作,及 其中後處理器作爲使用該平滑控制資訊,或基於回 應該控制訊號之一解碼器側訊號分析而運作。 2 4.如申請專利範圍第18項之多頻道合成器,其中該多頻 道合成器可配置於接收器或音頻放音器中。
    2 5 ·如申請專利範圍第2 3項之多頻道合成器,其中又包括 一輸入訊號分析器,用於分析輸入訊號,以決定將被 處理之輸入訊號之一時間部分的訊號特性,其中該後 處理器依訊號特性而作爲決定後處理重建參數, 其中該訊號特性爲將被處理之輸入訊號之部分之一 音色特性或一暫態特性。
    26.—種從一輸入訊號產生一輸出訊號之方法,該輸入訊號 具有至少一輸入頻道與一序列經量化重建參數,該經量 化重建參數爲依據一量化法則被量化,且與輸入訊號之 後續時間部分相關連,該輸出訊號具有一些經合成輸出 頻道,且經合成輸出頻道之數目爲大於輸入頻道之數 目,該輸入訊號與代表平滑控制資訊之一多頻道合成器 控制訊號相關連,包括: 提供具有平滑控制資訊之控制訊號; 回應該控制訊號,針對將被處理之輸入訊號之一時 間部分,決定後處理重建參數或從重建參數導出之後 處理量;及 1307248 I " I年一月“0修i更)正替換頁 i--------________ _ 使用輸入頻道之時間部分與後處理重建參數或後 理値,重建經合成輸出頻道數目之一時間部分。 27_如申請專利範圍第26項之方法,其中該方法可用於接 收器或聲音播放器中。
    28.—種儲存多頻道合成器控制訊號於其中之機器可讀取 之儲存媒體,其中該多頻道合成器控制訊號具有依一多 頻道輸入訊號而定之平滑控制資訊,該平滑控制資訊爲 使得回應該平滑控制資訊,一合成器側後處理器針對將 被處理輸入訊號之一時間部分,產生一後處理重建參數 或從重建參數導出之一後處理量,其係不同於依據一量 化法則使用再量化所得到之値。
    2 9.—種具有一發射器與一接收器之傳送系統,該發射器具 有一用於產生一多頻道合成器控制訊號之裝置,該裝置 包括:一訊號分析器,用於分析一多頻道輸入訊號;一 平滑資訊計算器,用於回應訊號分析器,決定平滑控制 資訊,該平滑資訊計算器作爲決定平滑控制資訊,使得 回應該平滑控制資訊,一合成器側後處理器針對將被處 理之輸入訊號之一時間部分產生一後處理重建參數或 從該重建參數導出之一後處理量;及一資料產生器,用 於產生代表平滑控制資訊之一控制訊號,作爲多頻道合 成器控制訊號;及 該接收器具有一多頻道合成器,用於從一輸入訊號產 生一輸出訊號,該輸入訊號具有至少一個輸入頻道與一 序列經量化重建參數,該經量化重建參數依據一量化法 則被量化,且與輸入訊號之後續時間部分相關連,該輸 1307248 I— ί
    出訊號具有一些經合成輸出頻道,且經合成輸出頻道之 數目爲大於輸入頻道之數目,該輸入頻道與代表平滑控 制資訊之一多頻道合成器控制訊號相關連,該接收機包 括:一控制訊號提供器,用於提供具有平滑控制資訊之 控制訊號;一後處理器,用於回應該控制訊號,針對將 被處理之輸入訊號之一時間部分,決定該後處理重建參 數或從該重建參數導出之後處理量,其中該後處理器作 爲決定後處理重建參數或後處理量,使得後處理重建參 數之値或後處理量不同於依據量化法則使用再量化得 到之値;及一多頻道重建器,用於使用輸入頻道之時間 部分與後處理重建參數或後處理値,重建經合成輸出頻 道之數目之一時間部分。
    3 〇. —種自一發射器發射多頻道輸入信號至一接收器之方 法,該方法包含下列步驟:於該發射器端,分析一多頻 道輸入訊號;回應該訊號分析步驟,決定平滑控制資 訊,使得回應該平滑控制資訊,一後處理步驟,針對將 被處理之輸入訊號之一時間部分產生一後處理重建參 數或從重建參數導出之一後處理量;且產生代表平滑控 制資訊之一控制訊號’作爲多頻道合成器控制訊號;及 於該接收器端,提供具有平滑控制資訊之控制訊號; 回應該控制訊號,針對將被處理之輸入訊號之一時間部 分決定後處理重建參數或從重建參數導出之後處理 量;且使用輸入頻道之時間部分與後處理重建參數或後 處理値,重建經合成輸出頻道之數目之一時間部分。 3 1 . —種儲存電腦程式之機械可讀取之儲存媒體,其中該 1307248 —9ΤΊ〇"'2'9 — * 年为’日修(更)正替換頁 Λ · ......— ...... ....................— 電腦程式係用於在一電腦運行時執行如申請專利範圍 第16、17、26、27或30項之方法。
TW095103076A 2005-04-15 2006-01-26 Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing TWI307248B (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US67158205P 2005-04-15 2005-04-15
US11/212,395 US7983922B2 (en) 2005-04-15 2005-08-27 Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing

Publications (2)

Publication Number Publication Date
TW200701821A TW200701821A (en) 2007-01-01
TWI307248B true TWI307248B (en) 2009-03-01

Family

ID=36274412

Family Applications (1)

Application Number Title Priority Date Filing Date
TW095103076A TWI307248B (en) 2005-04-15 2006-01-26 Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing

Country Status (18)

Country Link
US (2) US7983922B2 (zh)
EP (1) EP1738356B1 (zh)
JP (3) JP5511136B2 (zh)
KR (1) KR100904542B1 (zh)
CN (1) CN101816040B (zh)
AU (1) AU2006233504B2 (zh)
BR (1) BRPI0605641B1 (zh)
CA (1) CA2566992C (zh)
ES (1) ES2399058T3 (zh)
HK (1) HK1095195A1 (zh)
IL (1) IL180046A (zh)
MX (1) MXPA06014987A (zh)
MY (1) MY141404A (zh)
NO (1) NO338934B1 (zh)
PL (1) PL1738356T3 (zh)
RU (1) RU2361288C2 (zh)
TW (1) TWI307248B (zh)
WO (1) WO2006108456A1 (zh)

Families Citing this family (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7644282B2 (en) 1998-05-28 2010-01-05 Verance Corporation Pre-processed information embedding system
US6737957B1 (en) 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
EP2782337A3 (en) 2002-10-15 2014-11-26 Verance Corporation Media monitoring, management and information system
US9055239B2 (en) 2003-10-08 2015-06-09 Verance Corporation Signal continuity assessment using embedded watermarks
US7369677B2 (en) * 2005-04-26 2008-05-06 Verance Corporation System reactions to the detection of embedded watermarks in a digital host content
US20060239501A1 (en) 2005-04-26 2006-10-26 Verance Corporation Security enhancements of digital watermarks for multi-media content
KR101283525B1 (ko) * 2004-07-14 2013-07-15 돌비 인터네셔널 에이비 오디오 채널 변환
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8020004B2 (en) 2005-07-01 2011-09-13 Verance Corporation Forensic marking using a common customization function
US8781967B2 (en) 2005-07-07 2014-07-15 Verance Corporation Watermarking in an encrypted domain
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
WO2007046659A1 (en) 2005-10-20 2007-04-26 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
DE602006012370D1 (de) * 2005-12-13 2010-04-01 Nxp Bv Einrichtung und verfahren zum verarbeiten eines audio-datenstroms
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
TWI329462B (en) * 2006-01-19 2010-08-21 Lg Electronics Inc Method and apparatus for processing a media signal
US8560303B2 (en) * 2006-02-03 2013-10-15 Electronics And Telecommunications Research Institute Apparatus and method for visualization of multichannel audio signals
JP5054035B2 (ja) * 2006-02-07 2012-10-24 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US7584395B2 (en) * 2006-04-07 2009-09-01 Verigy (Singapore) Pte. Ltd. Systems, methods and apparatus for synthesizing state events for a test data stream
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8374365B2 (en) * 2006-05-17 2013-02-12 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US8712061B2 (en) * 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder
US9697844B2 (en) * 2006-05-17 2017-07-04 Creative Technology Ltd Distributed spatial audio decoder
US8041041B1 (en) * 2006-05-30 2011-10-18 Anyka (Guangzhou) Microelectronics Technology Co., Ltd. Method and system for providing stereo-channel based multi-channel audio coding
US20070299657A1 (en) * 2006-06-21 2007-12-27 Kang George S Method and apparatus for monitoring multichannel voice transmissions
US20080235006A1 (en) * 2006-08-18 2008-09-25 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
CN101652810B (zh) * 2006-09-29 2012-04-11 Lg电子株式会社 用于处理混合信号的装置及其方法
EP2084901B1 (en) * 2006-10-12 2015-12-09 LG Electronics Inc. Apparatus for processing a mix signal and method thereof
WO2008060111A1 (en) * 2006-11-15 2008-05-22 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
KR101062353B1 (ko) * 2006-12-07 2011-09-05 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 그 장치
WO2008082276A1 (en) * 2007-01-05 2008-07-10 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8612237B2 (en) * 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
KR101230479B1 (ko) 2008-03-10 2013-02-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법
US20090243578A1 (en) * 2008-03-31 2009-10-01 Riad Wahby Power Supply with Digital Control Loop
US8259938B2 (en) 2008-06-24 2012-09-04 Verance Corporation Efficient and secure forensic marking in compressed
EP2169665B1 (en) * 2008-09-25 2018-05-02 LG Electronics Inc. A method and an apparatus for processing a signal
EP2169664A3 (en) * 2008-09-25 2010-04-07 LG Electronics Inc. A method and an apparatus for processing a signal
WO2010036059A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. A method and an apparatus for processing a signal
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
WO2010087627A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
EP2402941B1 (en) * 2009-02-26 2015-04-15 Panasonic Intellectual Property Corporation of America Channel signal generation apparatus
EP2413314A1 (en) * 2009-03-24 2012-02-01 Huawei Technologies Co., Ltd. Method and device for switching a signal delay
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
WO2011034090A1 (ja) * 2009-09-18 2011-03-24 日本電気株式会社 音声品質解析装置、音声品質解析方法およびプログラム
AU2010303039B9 (en) 2009-09-29 2014-10-23 Dolby International Ab Audio signal decoder, audio signal encoder, method for providing an upmix signal representation, method for providing a downmix signal representation, computer program and bitstream using a common inter-object-correlation parameter value
CN102812511A (zh) * 2009-10-16 2012-12-05 法国电信公司 优化的参数立体声解码
PL2491551T3 (pl) * 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Urządzenie do dostarczania reprezentacji sygnału upmixu w oparciu o reprezentację sygnału downmixu, urządzenie do dostarczania strumienia bitów reprezentującego wielokanałowy sygnał audio, sposoby, program komputerowy i strumień bitów wykorzystujący sygnalizację sterowania zniekształceniami
KR101591704B1 (ko) * 2009-12-04 2016-02-04 삼성전자주식회사 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치
EP2357649B1 (en) 2010-01-21 2012-12-19 Electronics and Telecommunications Research Institute Method and apparatus for decoding audio signal
EP2532178A1 (en) * 2010-02-02 2012-12-12 Koninklijke Philips Electronics N.V. Spatial sound reproduction
TWI443646B (zh) * 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
EP3779975B1 (en) 2010-04-13 2023-07-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder and related methods for processing multi-channel audio signals using a variable prediction direction
CN102314882B (zh) * 2010-06-30 2012-10-17 华为技术有限公司 声音信号通道间延时估计的方法及装置
US20120035940A1 (en) * 2010-08-06 2012-02-09 Samsung Electronics Co., Ltd. Audio signal processing method, encoding apparatus therefor, and decoding apparatus therefor
US8463414B2 (en) * 2010-08-09 2013-06-11 Motorola Mobility Llc Method and apparatus for estimating a parameter for low bit rate stereo transmission
TWI516138B (zh) * 2010-08-24 2016-01-01 杜比國際公司 從二聲道音頻訊號決定參數式立體聲參數之系統與方法及其電腦程式產品
US9607131B2 (en) 2010-09-16 2017-03-28 Verance Corporation Secure and efficient content screening in a networked environment
CN103250206B (zh) 2010-10-07 2015-07-15 弗朗霍夫应用科学研究促进协会 用于比特流域中的编码音频帧的强度估计的装置及方法
FR2966277B1 (fr) * 2010-10-13 2017-03-31 Inst Polytechnique Grenoble Procede et dispositif de formation d'un signal mixe numerique audio, procede et dispositif de separation de signaux, et signal correspondant
PL2671222T3 (pl) * 2011-02-02 2016-08-31 Ericsson Telefon Ab L M Określanie międzykanałowej różnicy czasu wielokanałowego sygnału audio
BR112013029850B1 (pt) * 2011-05-26 2021-02-09 Koninklijke Philips N.V. sistema de áudio e método de operação de um sistema de áudio
US9299355B2 (en) 2011-08-04 2016-03-29 Dolby International Ab FM stereo radio receiver by using parametric stereo
US9589550B2 (en) * 2011-09-30 2017-03-07 Harman International Industries, Inc. Methods and systems for measuring and reporting an energy level of a sound component within a sound mix
US8682026B2 (en) 2011-11-03 2014-03-25 Verance Corporation Efficient extraction of embedded watermarks in the presence of host content distortions
US8923548B2 (en) 2011-11-03 2014-12-30 Verance Corporation Extraction of embedded watermarks from a host content using a plurality of tentative watermarks
US8533481B2 (en) 2011-11-03 2013-09-10 Verance Corporation Extraction of embedded watermarks from a host content based on extrapolation techniques
US8615104B2 (en) 2011-11-03 2013-12-24 Verance Corporation Watermark extraction based on tentative watermarks
US8745403B2 (en) 2011-11-23 2014-06-03 Verance Corporation Enhanced content management based on watermark extraction records
US9323902B2 (en) 2011-12-13 2016-04-26 Verance Corporation Conditional access using embedded watermarks
US9547753B2 (en) 2011-12-13 2017-01-17 Verance Corporation Coordinated watermarking
EP2834814B1 (en) 2012-04-05 2016-03-02 Huawei Technologies Co., Ltd. Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder
JP6063555B2 (ja) 2012-04-05 2017-01-18 華為技術有限公司Huawei Technologies Co.,Ltd. マルチチャネルオーディオエンコーダ及びマルチチャネルオーディオ信号を符号化する方法
JP2015517121A (ja) * 2012-04-05 2015-06-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド インターチャネル差分推定方法及び空間オーディオ符号化装置
EP2862166B1 (en) * 2012-06-14 2018-03-07 Dolby International AB Error concealment strategy in a decoding system
US9571606B2 (en) 2012-08-31 2017-02-14 Verance Corporation Social media viewing system
US8726304B2 (en) 2012-09-13 2014-05-13 Verance Corporation Time varying evaluation of multimedia content
US9106964B2 (en) 2012-09-13 2015-08-11 Verance Corporation Enhanced content distribution using advertisements
US8869222B2 (en) 2012-09-13 2014-10-21 Verance Corporation Second screen content
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9654527B1 (en) 2012-12-21 2017-05-16 Juniper Networks, Inc. Failure detection manager
KR101757341B1 (ko) 2013-01-29 2017-07-14 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 저-복잡도 음조-적응 오디오 신호 양자화
US9262794B2 (en) 2013-03-14 2016-02-16 Verance Corporation Transactional video marking system
US9485089B2 (en) 2013-06-20 2016-11-01 Verance Corporation Stego key management
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US9251549B2 (en) 2013-07-23 2016-02-02 Verance Corporation Watermark extractor enhancements based on payload ranking
TWI847206B (zh) 2013-09-12 2024-07-01 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
US9208334B2 (en) 2013-10-25 2015-12-08 Verance Corporation Content management using multiple abstraction layers
CN103702274B (zh) * 2013-12-27 2015-08-12 三星电子(中国)研发中心 立体环绕声重建方法及装置
KR20240116835A (ko) * 2014-01-08 2024-07-30 돌비 인터네셔널 에이비 사운드 필드의 고차 앰비소닉스 표현을 코딩하기 위해 요구되는 사이드 정보의 코딩을 개선하기 위한 방법 및 장치
US10504200B2 (en) 2014-03-13 2019-12-10 Verance Corporation Metadata acquisition using embedded watermarks
EP3117626A4 (en) 2014-03-13 2017-10-25 Verance Corporation Interactive content acquisition using embedded codes
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
WO2016028936A1 (en) 2014-08-20 2016-02-25 Verance Corporation Watermark detection using a multiplicity of predicted patterns
US9747922B2 (en) * 2014-09-19 2017-08-29 Hyundai Motor Company Sound signal processing method, and sound signal processing apparatus and vehicle equipped with the apparatus
US9942602B2 (en) 2014-11-25 2018-04-10 Verance Corporation Watermark detection and metadata delivery associated with a primary content
US9769543B2 (en) 2014-11-25 2017-09-19 Verance Corporation Enhanced metadata and content delivery using watermarks
WO2016100916A1 (en) 2014-12-18 2016-06-23 Verance Corporation Service signaling recovery for multimedia content using embedded watermarks
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
WO2016176056A1 (en) 2015-04-30 2016-11-03 Verance Corporation Watermark based content recognition improvements
WO2017015399A1 (en) 2015-07-20 2017-01-26 Verance Corporation Watermark-based data recovery for content with multiple alternative components
US10366687B2 (en) * 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
FR3048808A1 (fr) * 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
WO2017184648A1 (en) 2016-04-18 2017-10-26 Verance Corporation System and method for signaling security and database population
CN107452387B (zh) * 2016-05-31 2019-11-12 华为技术有限公司 一种声道间相位差参数的提取方法及装置
EP3264802A1 (en) 2016-06-30 2018-01-03 Nokia Technologies Oy Spatial audio processing for moving sound sources
US10949602B2 (en) 2016-09-20 2021-03-16 Nuance Communications, Inc. Sequencing medical codes methods and apparatus
US10362423B2 (en) 2016-10-13 2019-07-23 Qualcomm Incorporated Parametric audio decoding
WO2018237191A1 (en) 2017-06-21 2018-12-27 Verance Corporation ACQUISITION AND TREATMENT OF METADATA BASED ON A WATERMARK
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
CN117292695A (zh) * 2017-08-10 2023-12-26 华为技术有限公司 时域立体声参数的编码方法和相关产品
US10891960B2 (en) * 2017-09-11 2021-01-12 Qualcomm Incorproated Temporal offset estimation
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
GB2571949A (en) * 2018-03-13 2019-09-18 Nokia Technologies Oy Temporal spatial audio parameter smoothing
US11468149B2 (en) 2018-04-17 2022-10-11 Verance Corporation Device authentication in collaborative content screening
CN109710058A (zh) * 2018-11-27 2019-05-03 南京恩诺网络科技有限公司 触觉信息录制方法及装置、系统
WO2021041623A1 (en) * 2019-08-30 2021-03-04 Dolby Laboratories Licensing Corporation Channel identification of multi-channel audio signals
AU2021357364B2 (en) * 2020-10-09 2024-06-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing
BR112023006291A2 (pt) * 2020-10-09 2023-05-09 Fraunhofer Ges Forschung Dispositivo, método ou programa de computador para processar uma cena de áudio codificada usando uma conversão de parâmetro
US11722741B2 (en) 2021-02-08 2023-08-08 Verance Corporation System and method for tracking content timeline in the presence of playback rate changes
CN115410584A (zh) * 2021-05-28 2022-11-29 华为技术有限公司 多声道音频信号的编码方法和装置
US12052573B2 (en) * 2021-11-11 2024-07-30 Verizon Patent And Licensing Inc. Systems and methods for mitigating fraud based on geofencing

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5001650A (en) * 1989-04-10 1991-03-19 Hughes Aircraft Company Method and apparatus for search and tracking
DE3943879B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
US5267317A (en) * 1991-10-18 1993-11-30 At&T Bell Laboratories Method and apparatus for smoothing pitch-cycle waveforms
FI90477C (fi) * 1992-03-23 1994-02-10 Nokia Mobile Phones Ltd Puhesignaalin laadun parannusmenetelmä lineaarista ennustusta käyttävään koodausjärjestelmään
US5703999A (en) 1992-05-25 1997-12-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Process for reducing data in the transmission and/or storage of digital signals from several interdependent channels
DE4217276C1 (zh) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
US5664055A (en) * 1995-06-07 1997-09-02 Lucent Technologies Inc. CS-ACELP speech compression system with adaptive pitch prediction filter gain based on a measure of periodicity
JP3319677B2 (ja) * 1995-08-08 2002-09-03 三菱電機株式会社 周波数シンセサイザ
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US5815117A (en) * 1997-01-02 1998-09-29 Raytheon Company Digital direction finding receiver
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
DE19716862A1 (de) * 1997-04-22 1998-10-29 Deutsche Telekom Ag Sprachaktivitätserkennung
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
JP4008607B2 (ja) 1999-01-22 2007-11-14 株式会社東芝 音声符号化/復号化方法
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6421454B1 (en) * 1999-05-27 2002-07-16 Litton Systems, Inc. Optical correlator assisted detection of calcifications for breast biopsy
US6718309B1 (en) * 2000-07-26 2004-04-06 Ssi Corporation Continuously variable time scale modification of digital audio signals
US7003467B1 (en) 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
JP2002208858A (ja) * 2001-01-10 2002-07-26 Matsushita Electric Ind Co Ltd 周波数シンセサイザと周波数生成方法
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US8605911B2 (en) * 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US7027982B2 (en) * 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7110940B2 (en) * 2002-10-30 2006-09-19 Microsoft Corporation Recursive multistage audio processing
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
US7099821B2 (en) * 2003-09-12 2006-08-29 Softmax, Inc. Separation of target acoustic signals in a multi-transducer arrangement
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JP4151020B2 (ja) 2004-02-27 2008-09-17 日本ビクター株式会社 音声信号伝送方法及び音声信号復号化装置
ATE527654T1 (de) * 2004-03-01 2011-10-15 Dolby Lab Licensing Corp Mehrkanal-audiodecodierung
DE602005011439D1 (de) * 2004-06-21 2009-01-15 Koninkl Philips Electronics Nv Verfahren und vorrichtung zum kodieren und dekodieren von mehrkanaltonsignalen
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
WO2006091139A1 (en) * 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
TWI313362B (en) 2005-07-28 2009-08-11 Alpha Imaging Technology Corp Image capturing device and its image adjusting method
DE602006021347D1 (de) * 2006-03-28 2011-05-26 Fraunhofer Ges Forschung Verbessertes verfahren zur signalformung bei der mehrkanal-audiorekonstruktion
PL2491551T3 (pl) * 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Urządzenie do dostarczania reprezentacji sygnału upmixu w oparciu o reprezentację sygnału downmixu, urządzenie do dostarczania strumienia bitów reprezentującego wielokanałowy sygnał audio, sposoby, program komputerowy i strumień bitów wykorzystujący sygnalizację sterowania zniekształceniami

Also Published As

Publication number Publication date
CA2566992A1 (en) 2006-10-19
JP5625032B2 (ja) 2014-11-12
KR100904542B1 (ko) 2009-06-25
HK1095195A1 (en) 2007-04-27
MXPA06014987A (es) 2007-08-03
CN101816040B (zh) 2011-12-14
MY141404A (en) 2010-04-30
US20110235810A1 (en) 2011-09-29
EP1738356B1 (en) 2012-11-28
NO20065383L (no) 2007-11-15
BRPI0605641B1 (pt) 2020-04-07
JP5624967B2 (ja) 2014-11-12
RU2006147255A (ru) 2008-07-10
JP2013077017A (ja) 2013-04-25
AU2006233504B2 (en) 2008-07-31
WO2006108456A1 (en) 2006-10-19
JP5511136B2 (ja) 2014-06-04
KR20070088329A (ko) 2007-08-29
US7983922B2 (en) 2011-07-19
BRPI0605641A (pt) 2007-12-18
CA2566992C (en) 2013-12-24
TW200701821A (en) 2007-01-01
JP2012068651A (ja) 2012-04-05
JP2008511849A (ja) 2008-04-17
PL1738356T3 (pl) 2013-04-30
IL180046A0 (en) 2007-05-15
AU2006233504A1 (en) 2006-10-19
IL180046A (en) 2011-07-31
CN101816040A (zh) 2010-08-25
NO338934B1 (no) 2016-10-31
ES2399058T3 (es) 2013-03-25
RU2361288C2 (ru) 2009-07-10
US20080002842A1 (en) 2008-01-03
EP1738356A1 (en) 2007-01-03
US8532999B2 (en) 2013-09-10

Similar Documents

Publication Publication Date Title
TWI307248B (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US8843378B2 (en) Multi-channel synthesizer and method for generating a multi-channel output signal
JP4521032B2 (ja) 空間音声パラメータの効率的符号化のためのエネルギー対応量子化
JP5189979B2 (ja) 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
CN110379434B (zh) 用于参数化多声道编码的方法
CN110890101B (zh) 用于基于语音增强元数据进行解码的方法和设备
EP1995721A1 (en) Parametric joint-coding of audio sources
EP2345026A1 (en) Apparatus for binaural audio coding