TWI485699B - 音訊信號訊框中事件槽位的編碼與解碼技術 - Google Patents
音訊信號訊框中事件槽位的編碼與解碼技術 Download PDFInfo
- Publication number
- TWI485699B TWI485699B TW101101714A TW101101714A TWI485699B TW I485699 B TWI485699 B TW I485699B TW 101101714 A TW101101714 A TW 101101714A TW 101101714 A TW101101714 A TW 101101714A TW I485699 B TWI485699 B TW I485699B
- Authority
- TW
- Taiwan
- Prior art keywords
- event
- slots
- audio signal
- frame
- slot
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 108
- 230000001052 transient effect Effects 0.000 claims description 84
- 238000000034 method Methods 0.000 claims description 74
- 238000012360 testing method Methods 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 16
- 238000013316 zoning Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 23
- 230000008569 process Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000005192 partition Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 238000002156 mixing Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000006872 improvement Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Description
本發明係有關於音訊處理及音訊編碼領域,更明確言之,係有關於音訊信號訊框中事件槽位的編碼與解碼技術。
音訊處理及音訊編碼已多所進展。更明確言之,空中音訊應用已變得愈來愈重要。音訊信號處理常係用來解相關或呈現信號。此外,信號的解相關及呈現係用在單聲道至立體聲上混、單聲道/立體聲至多聲道上混、人工混響、立體聲加寬或使用者互動式混合/呈現之處理程序。
若干音訊信號處理系統採用解相關器。一個重要實例為於參數性空間音訊解碼器中應用解相關信號來恢復從一或數個下混信號重構的二或多個信號間之特定解相關性質。解相關器的施加顯著地改進輸出信號之知覺品質,例如當比較立體聲強度時。更明確言之,使用解相關器使得以寬廣聲音影像、若干並行聲音物件及/或環境氣氛允許妥為合成空間聲音。但也已知解相關器會導入假影,例如時間信號結構、音質等的改變。
解相關器用在音訊處理之其它應用實例有例如人造混響的產生來改變空間效果,或使用解相關器於多聲道回聲消除系統來改良混響表現。
一種重要的空間音訊編碼體系為參數立體聲(PS)。第1
圖例示說明單聲道至立體聲解碼器結構。單一解相關器從單聲道輸入信號M(「乾」信號)產生解相關器信號D(「濕」信號)。解相關信號D然後連同信號M饋入混合器。然後,混合器施加混合矩陣H至輸入信號M及D來產生輸出信號L及R。混合矩陣H中的係數可以固定、信號相依性、或由使用者所控制。
另外,混合矩陣係藉側邊資訊控制,側邊資訊係連同下混傳輸及含有有關參數描述,該參數描述如何上混該混信號來形成期望的多聲道輸出。空間側邊資訊通常係於依據信號編碼器之單聲道混程序期間產生。
如前述空間音訊編碼廣泛應用於例如參數立體聲。參數立體聲解碼器之典型結構係顯示於第2圖。於第2圖中,解相關係於變換域執行。空間參數可藉使用者或額外工具修改,例如雙耳呈現/表示型態之後處理。於此種情況下,上混參數係與得自雙耳濾波器之參數組合來計算混合矩陣之輸入參數。
混合矩陣H之輸出L/R係從單聲道輸入信號M及解相關信號D計算。
於混合矩陣中,饋至輸出的解相關聲音量係基於傳輸參數控制,例如聲道間位準差(ILD)、聲道間相關性/同調性(ICC)及/或固定式或使用者界定之設定值。
於構思上,解相關器輸出D之輸出信號置換殘差信號,
理想上允許原先L/R信號的完好解碼。於該上混器利用解相關器輸出D替代殘差信號,結果導致位元率的節省,否則將要求傳輸殘差信號。如此解相關器之目標係從單聲道信號M產生信號D,其具有與由D所置換的殘差信號相似的性質。參考文件:
[1]J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuijers,“High-Quality Parametric Spatial Audio Coding at Low Bitrates”in Proceedings of the AEs 116th
Convention,Berlin,Preprint 6072,May 2004.
考慮MPEG環繞(MPS),類似PS之結構定名為一對二箱(OTT箱)係採用於空間音訊解碼樹。如此可知為單聲道至立體聲上混至多聲道空間音訊編碼/解碼體系之構思的一般化。於MPS中,也存在有二對三上混系統(TTT箱),取決於TTT操作模式可應用解相關器。細節係描述於文件:
[2]J.Herre,K.KjÖrling,J.Breebaart,et al.,“MPEG surround-the ISO/MPEG standard for efficient and compatible multi-channel audio coding,”in Proceedings of the 122th
AES Convention,Vienna,Austria,May 2007.
至於方向性音訊編碼(DirAC),DirAC係有關於參數聲場編碼體系,非限於有固定揚聲器位置的固定音訊輸出聲道數目。DirAC應用解相關器於DirAC呈現器,亦即於空間音訊解碼器來合成聲場之非同調組分。方向性音訊編碼又更描述於:
[3]Pulkki,Ville:“Spatial Sound Reproduction with Directional
Audio Coding”,in J.Audio Eng.Soc.,Vol.55,No.6,2007
有關高階解相關器可參考文件:
[4]ISO/IEC International Standard“Information Technology-MPEG audio technologies-Part1:MPEG Surround”,ISO/IEC 23003-1:2007.
[5]J.Engdegard,H.Purnhagen,J.RÖden,L.Liljeryd,“Synthetic Ambience in Parametric Stereo Coding”in Proceedings of the AES 116th
Convention,Preprint,May 2004.
IIR晶格全通結構係用於空間音訊解碼器作為解相關器,類似MPS[2,4]。其它高階解相關器應用(潛在頻率相依性)延遲來解相關信號或疊積輸入信號,例如使用指數衰減雜訊叢發。有關高階解相關器用於空間音訊上混系統之綜論,參考文件[5]:「於參數立體聲編碼之合成環境」。
一般而言,於參數空間音訊編碼器中編碼/解碼的立體聲或多聲道鼓掌狀信號已知會導致信號品質減低。鼓掌狀信號係以含有來自不同方向的相當緊密暫態混合物為其特徵。此等信號之實例為鼓掌、雨聲、馬匹奔馳等。鼓掌狀信號常也含有來自遠方聲源的聲音成分,於知覺上融合入雜訊狀平滑背景聲場。
類似MPEG環繞之採用於空間音訊解碼器之晶格全通結構係作為人工混響產生器,結果極為適用於產生均質平滑雜訊狀反聲音(類似室內混響尾)。但其為具有非均質時空結構之聲場,仍然浸沒收聽者:一個突顯實例為鼓掌狀聲場,產生收聽者-波封並非只藉均質雜訊狀場,但只有來自
不同方向的單一拍手的相當緊密序列。如此,鼓掌聲場的非均質成分可藉暫態之空間分配混合物決定特徵。此等離散拍手絲毫也非均質、平滑及雜訊狀。
由於其混響狀表現,晶格全通解相關器無法產生具有例如鼓掌特性之浸沒式聲場。取而代之當施加至鼓掌狀信號時,傾向於暫時玷污信號的暫態。非期望的結果為雜訊狀浸沒式聲場,而無鼓掌狀聲場的獨特時空結構。又,暫態事件類似單一拍手可引出解相關器濾波器的振鈴假影。
統一語音與音訊編碼(USAC)為語音及音訊及其於不同位元率之混合物的音訊編碼標準。
當參數立體聲編碼技術為可應用時,USAC之知覺品質於32 kbps範圍之位元率可就鼓掌及鼓掌狀聲音進一步改良。USAC編碼鼓掌項目傾向於具有窄聲音階段,若於編解碼器內部未施加專用鼓掌處理則缺乏波封。至較大程度,USAC之立體聲編碼技術及其限制係繼承自MPEG環繞(MPS)。但USAC確實提供適當鼓掌處理要求的專用調整適應。該調整適應係定名為暫態操控解相關器(TSD)且為本發明之實施例。
鼓掌信號可由單一離散附近拍手時間上分開數毫秒,及源自於極為緊密遠方拍手之重疊雜訊狀環境。於可感測之側邊資訊率之參數立體聲編碼,空間參數集合之粒度(聲道間位準差、聲道間相關性等)係遠過低來確保單一拍手之足夠空間重新分配,結果導致缺乏波封。此外,拍手係接受藉晶格全通解相關器處理。如此無可避免地誘導暫態之
暫時分配,及進一步減少主觀品質。
於USAC解碼器內部採用暫態操控解相關器(TSD),結果導致MPS處理之修改。此種辦法之潛在構思係解決鼓掌解相關問題如下:
-晶格全通解相關器之前分開於QMF定義域之暫態,亦即:將解相關器輸入信號分裂成暫態串流s2及非暫態串流s1。
-將暫態串流饋至不同參數控制解相關器,其係極為適合暫態混合物。
-將非暫態串流饋至MPS全通解相關器。
-將二解相關器D1
及D2
之輸出相加來獲得解相關信號D。
第3圖例示說明USAC解碼器內部之一對二(OTT)組態。第3圖之U字形暫態處理箱包含平行信號路徑而與暫態處理相對。
導引TSD處理程序之兩個參數係從編碼器傳輸至解碼器作為頻率不相干性參數(參考第3圖):
-於編碼器進行暫態檢測器之二進制暫態/非暫態決策。有效無損耗編碼方案係用來傳輸暫態QMF槽位資料。
-實際暫態解相關器參數乃暫態解相關器調控暫態之空間分配所需。暫態解相關器參數標示混與其殘差間之夾角。此等參數只針對於編碼器已經檢測含有暫態的時槽傳輸。
為了評比前述技術之品質,使用高品質靜電STAX頭戴式耳機,於控制收聽測試環境下,進行兩項MUSHRA收聽
測試。測試係於32kbps及16 kbps立體聲組態進行。16位專家收聽者參與各項測試。
因USAC測試集合不含鼓掌項目,故須選擇額外鼓掌項目來驗證所提示技術的效果。表1列舉項目已經含括於測試:
有關常規12個MPEG USAC收聽測試項目,TSD未曾作動。但此等項目並未維持確切相同位元,因TSD致能位元(指示TSD為關閉)係額外地含括於位元串流,如此略微影響核心編碼器之位元預算。因此等差異為極小,故此等項目並未含括於收聽測試。提供有關此等差之大小資料來顯示此等改變為可忽略且無法覺察。
定名為inter-TES的編解碼器工具乃USAC參考模型8(RM8)的一部分。因已報告此項技術改良包括鼓掌狀信號的暫態之知覺品質,每個測試條件下inter-TES經常性切換為啟動。此種配置中,確保最佳可能品質,及驗證inter-TES及TSD之正交性。
系統測試具有下列組態:
-USAC RM8系統
-CE:藉暫態操控解相關器(TSD)加強的USAC RM8系統
第4及5圖描述MUSHRA分數連同其用於32 kbps測試情況的95%可信度區間。針對該測試資料,假設為學生t分配。第4圖之絕對分數顯示針對全部項目有較高平均分數,五項中的四項就95%可信度意義而言顯著改良。相對於RM8並無任何項目降級。於TSD分數實驗(CE)中相對於USAC RM8評估,USAC+TSD之差分係作圖於第5圖。此處可知全部項目顯著改良。
針對16 kbps測試設定值,第6及7圖描述MUSHRA分數連同其95%可信度區間。假設為學生t分布。第6圖之絕對分數顯示針對全部項目有較高平均分數。針對一個項目,可知95%可信度意義。並無任何項目比RM8更差。差分係作圖於第7圖。再度,驗證全部項目相對於不同資料的顯著改良。
TSD工具係藉於位元串流傳輸的bsTsdEnable旗標致能。若TSD被致能,則暫態的實際分開係藉暫態檢測旗標TsdSepData控制,該旗標也係於位元串流傳輸,且於TSD被致能之情況下,該旗標係藉TsdCodedPos編碼。
於該編碼器中,TSD致能旗標bsTsdEnable係藉分段分類器產生。暫態檢測旗標TsdSepData係藉暫態檢測器設定。
如前文已經指示,針對12 MPEG USAC測試項目,TSD未經作動。針對五個額外鼓掌項目,TSD作動描述於第8圖,顯示bsTsdEnable邏輯態相對於時間。
若TSD經作動,於某些QMF時槽檢測暫態,隨後饋至專用暫態解相關器。針對各個額外測試項目,表2列舉於TSD作動訊框內包含暫態之時槽的百分比。
從編碼器發射暫態分離決定及解相關器參數給解碼器確實要求某些量的側邊資訊。但此量係由源自於MPS內部寬帶空間線索傳輸的位元率節省所過度補償。
結果,平均MPS+TSD側邊資訊位元率甚至比表3第一欄列舉的普通USAC的普通MPS側邊資訊位元率更低。如用於主觀品質評估的所提示組態中,表3第二欄列舉的平均位元率已經針對TSD測量:
TSD之運算複雜度來自於
-暫態槽位解碼
-暫態解相關器複雜度。
假設32時槽的MPEG環繞空間訊框長度,最差情況下每
個空間訊框槽位解碼要求(64除法+80乘法),亦即每個空間訊框64*
25+80=1680運算。
忽略拷貝操作及條件陳述,藉每個時槽及混成QMF帶一次複合乘法可給定暫態解相關器複雜度。
如此導致下列TSD之總複雜度值,於表4顯示且與普通USAC複雜度值比較:
要言之,收聽測試資料明白顯示在兩個運算點,於全部項目的不同分數,鼓掌信號的主觀分數有顯著改進。以絕對分數表示,TSD條件的全部項目具有較高平均分數。針對32kbps,五項中的四項有顯著改進。針對16 kbps,一項有顯著改進。並無任何項目的分數比RM8更差。如從複雜度資料可知,於可忽略運算成本達成改良。如此更進一步強調TSD工具用於USAC的效果。
前述暫態調控解相關器顯著改良於USAC的音訊處理。但如前文可知,暫態操控解相關器要求有關於一特定時槽是否存在有暫態之資訊。於USAC中,有關時槽之資訊可以逐訊框基礎傳輸。一個訊框包含數個例如32時槽。因此須瞭解編碼器也傳輸有關以逐訊框基礎,哪些時槽包含暫態之資訊。減少欲傳輸之位元數目於音訊信號的處理上
具關鍵重要性。原因在於即使單一音訊記錄包含大量訊框,如此表示即便針對各個訊框欲傳輸的位元數係只減少數位元,但總位元傳輸率顯著減低。
但於音訊信號訊框中事件槽位解碼問題不僅限於解碼暫態問題。也又更可用於解碼其它事件之槽位,諸如音訊信號訊框之時槽為調性(或否)、是否包含雜訊(或是否不含雜訊)等。實際上,音訊信號訊框中事件槽位之有效編碼及解碼裝置極有用於大量不同種事件。
當本文件指稱音訊信號訊框的時槽或槽位時,此種意義的時槽可以是時槽、頻槽、時頻槽、或任何其它槽。又復須瞭解本發明並非限於USAC之音訊處理及音訊信號訊框,反而係指稱任一種音訊信號訊框及任一種音訊格式,諸如MPEG1/2、層3(MP3)、高階音訊編碼(AAC)等。針對任一種音訊信號訊框,音訊信號訊框中事件槽位之有效編碼及解碼極其有用。
因此本發明之一目的係提出一種以少數位元編碼音訊信號訊框中事件槽位之裝置。此外,本發明之一目的係提出一種解碼音訊信號訊框中藉依據本發明之編碼裝置所編碼的事件槽位之裝置。本發明之目的係藉如申請專利範圍第1項之解碼裝置、如申請專利範圍第11項之編碼裝置、如申請專利範圍第14項之解碼方法、如申請專利範圍第15項之編碼方法、如申請專利範圍第16項之解碼電腦程式、如申請專利範圍第17項之編碼電腦程式、及如申請專利範圍
第18項之編碼信號而予達成。
本發明假設指示音訊信號訊框之時槽總數的訊框槽數及指示該音訊信號訊框包含該等事件之槽數的事件槽數可於本發明之解碼裝置得知。舉例言之,編碼器可傳輸訊框槽數及或事件槽數給解碼裝置。依據一實施例,編碼器可藉傳輸一數目,該數目為音訊信號訊框之時槽總數減1來指示音訊信號訊框之時槽總數。編碼器又更可藉傳輸一數目,該數目為該音訊信號訊框包含該等事件之槽數減1來指示該音訊信號訊框包含該等事件之槽數。另外,解碼器本身可無來自編碼器之資訊而決定音訊信號訊框之時槽總數及該音訊信號訊框包含該等事件之槽數。
基於此等假設,依據本發明,於該音訊信號訊框中包含事件之槽位數目可使用下列發現編碼及解碼:設N為音訊信號訊框之時槽總數,及設P為音訊信號訊框中包含事件之時槽數目。
假設編碼裝置及解碼裝置二者為知曉N值及P值。
知曉N及P,可推衍於該音訊信號訊框中包含該等事件之槽位只有個不同組合。
舉例言之,若一訊框中的槽位係編碼從0至N-1及若P=8,則第一槽位與事件的可能組合為(0,1,2,3,4,5,6,7)、第二者為(0,1,2,3,4,5,6,8)、等等直到組合(N-8,N-7,N-6,N-5,N-4,,N-3,N-2,N-1),故共有個不同組合。
此外,本發明採用額外發現事件狀態數目可藉編碼裝置編碼,及事件狀態數目係傳輸至解碼器。若各個可能的組合係藉一獨特事件狀態數目表示,及若解碼裝置係知曉哪個事件狀態數目表示於該音訊信號訊框中包含該等事件之哪個槽位組合(例如藉施加適當解碼方法),則解碼裝置可使用N、P、及事件狀態數目解碼包含事件之槽位。針對許多典型N及P值,此種編碼技術比較其它方法(例如針對訊框的各個時槽採用具一個位元之位元陣列,其中各個位元指示一事件是否出現於此時槽與否)採用更少位元來編碼事件之槽位。
異言之,於該音訊信號訊框中包含該等事件之槽位之編碼問題可藉使用儘可能少數位元,編碼在[0...N-1]範圍的位置pk
之離散數目P,使得針對k≠h,槽位不相重疊pk
≠ph
加以解決。因槽位順序無關緊要,故接著位置的獨特組合數目為二項式係數。如此要求的位元(bits)數為
於一實施例中,提供一種解碼裝置,其中該解碼裝置係適用於進行測試比較事件狀態數目或更新事件狀態數目與臨界值。此種測試可採用來從事件狀態數目推導包含事件之槽位。比較事件狀態數目與臨界值之測試可藉比較該事件狀態數目或更新事件狀態數目是否大於、大於或等
於、小於、或小於或等於該臨界值而進行該測試。此外,較佳該解碼裝置係適用於取決於該測試結果而更新該事件狀態數目或一更新事件狀態數目。
依據一實施例,提供一種解碼裝置係適用於進行測試比較事件狀態數目或更新事件狀態數目相對於一特別考慮時槽,其中該臨界值係取決於該訊框槽數、該事件槽數及該考慮時槽於該訊框內部位置。藉此,包含事件之槽位可以逐一時槽基礎決定,針對一訊框之各個時槽逐一地決定該時槽是否包含一事件。
依據又一實施例,提供一種解碼裝置係適用於將該訊框分裂成包含該訊框之一第一時槽集合之一第一訊框區劃及一第二時槽集合之一第二訊框區劃,及其中該解碼裝置係進一步適用於針對該等訊框區劃各自分開地決定包含該等事件之槽位。藉此,藉將一訊框或訊框區劃重複地分割成又更小的訊框區劃而可決定包含事件之槽位。
後文中,將就附圖以進一步細節描述本發明之實施例,附圖中:第1圖為解相關器於單聲道對立體聲上混器之典型應用;第2圖為解相關器於單聲道對立體聲上混器之又一典型應用;第3圖為含括暫態操控解相關器(TSD)之一對二(OTT)系統之綜覽;第4圖為略圖顯示於TSD分數實驗(CE)中針對32 kbps
立體聲比較RM8與USAC RM8+TSD之絕對分數;第5圖為略圖顯示針對32 kbps立體聲比較採用暫態操控解相關器的USAC相較於普通USAC系統之差分;第6圖為略圖顯示於TSD分數實驗(CE)中針對16 kbps立體聲比較RM8與USAC RM8+TSD之絕對分數;第7圖為略圖顯示針對16 kbps立體聲比較採用暫態操控解相關器的USAC相較於普通USAC系統之差分;第8圖顯示針對五個額外項目之TSD活性,描述為bsTsdEnable旗標之邏輯態;第9a圖顯示依據本發明之一實施例於一音訊信號訊框中包含該等事件之槽位的解碼裝置;第9b圖顯示依據本發明之又一實施例於一音訊信號訊框中包含該等事件之槽位的解碼裝置;第9c圖顯示依據本發明之另一實施例於一音訊信號訊框中包含事件之槽位的解碼裝置;第10圖為流程圖顯示依據本發明之一實施例藉解碼裝置所執行之解碼方法;第11圖顯示依據本發明之一實施例體現包含事件之槽位的解碼之假代碼;第12圖為流程圖顯示依據本發明之一實施例藉編碼裝置所執行之編碼方法;第13圖為假代碼描述依據本發明之又一實施例於一音訊信號訊框中包含事件之槽位的編碼方法;第14圖顯示依據本發明之又一實施例於一音訊信號訊
框中包含事件之槽位的解碼裝置;第15圖顯示依據本發明之一實施例於一音訊信號訊框中包含事件之槽位的編碼裝置;第16圖描述依據一實施例USAC之MPS 212資料之語法;第17圖顯示依據一實施例USAC之TsdData之語法;第18圖顯示取決於MPS訊框長度之nBitsTrSlots表;第19圖顯示依據一實施例有關USAC之bsTempShapeConfig之表;第20圖顯示依據一實施例USAC之TempShapeData之語法;第21圖顯示依據一實施例於OTT解碼區塊中之解相關器區塊D;第22圖顯示依據一實施例USAC之EcData之語法;第23圖顯示用以產生TSD資料之一信號流程圖。
第9a圖例示說明依據本發明之一實施例於一音訊信號訊框中包含該等事件之槽位的解碼裝置10。解碼裝置10包含分析單元20及產生單元30。指示該音訊信號訊框之時槽總數之一訊框槽數FSN,指示該音訊信號訊框之包含事件之槽數一事件槽數ESON,及一事件狀態數目ESTN係饋入解碼裝置10。然後解碼裝置10藉使用訊框槽數FSN、事件槽數ESON、及事件狀態數目ESTN而解碼包含事件之槽位。解碼係藉於解碼過程中分析單元20與產生單元30之協作進行。分析單元20係負責執行測試,例如比較事件狀態數目ESTN與一臨界值,而產生單元30產生與更新解碼程序
之中間結果,例如更新事件狀態數目。
此外,產生單元30產生於該音訊信號訊框中包含該等事件之多個槽位的指示。該音訊信號訊框中包含該等事件之多個槽位的特定指示可稱作為「指示狀態」。
依據一實施例,可產生該音訊信號訊框中包含該等事件之多個槽位的指示,使得於第一時間點,產生單元30指示第一時槽而與該時槽是否包含一事件無關;於第二時間點,產生單元30指示第二時槽而與該時槽是否包含一事件無關等。
依據又一實施例,包含事件之多個槽位的指示例如可以是一位元陣列,針對該訊框之各個時槽指示是否包含一事件。
分析單元20與產生單元30可協作使得於解碼過程中兩個單元彼此呼叫一或多次來產生中間結果。
第9b圖例示說明依據本發明之一實施例之解碼裝置40。解碼裝置40與第9a圖之解碼裝置10相異之處在於其更包含音訊信號處理器50。音訊信號處理器50接收音訊輸入信號,及由產生單元45產生於該音訊信號訊框中包含該等事件之多個槽位的指示。取決於該指示,音訊信號處理器50產生音訊輸出信號。音訊信號處理器50可例如藉將音訊輸入信號解相關而產生音訊輸出信號。此外,音訊信號處理器50可包含晶格IIR解相關器54、暫態解相關器56、及暫態分離器52用以產生音訊輸出信號,如第3圖描述。若於該音訊信號訊框中包含該等事件之多個槽位的指示係指示一
時槽包含一暫態,則該音訊信號處理器50將藉暫態解相關器56而將與該時槽相關之音訊輸入信號解相關。但若於該音訊信號訊框中包含該等事件之多個槽位的指示係指示一時槽不包含一暫態,則該音訊信號處理器將藉晶格IIR解相關器54而將與該時槽相關之音訊輸入信號S解相關。音訊信號處理器採用暫態分離器52,取決於該項指示是否指示該特定時槽包含一暫態(藉暫態解相關器56解相關)或該時槽不包含一暫態(藉晶格IIR解相關器54解相關),基於該指示而決定該音訊輸入信號之與一時槽相關部分係饋入暫態解相關器56或饋入晶格IIR解相關器54。
第9c圖例示說明依據本發明之一實施例之解碼裝置60。解碼裝置60與第9a圖之解碼裝置10相異之處在於其更包含一時槽選擇器90。解碼係以逐一時槽基礎,針對一訊框之各個時槽逐一地決定該時槽是否包含一事件而進行。時槽選擇器90決定考慮一訊框之哪個時槽。較佳辦法為時槽選擇器90逐一地選擇一訊框之時槽。
本實施例之解碼裝置60的逐一時槽解碼係植基於下列發現,解碼裝置60可應用於於一音訊信號訊框中包含事件之槽位的解碼裝置、編碼裝置、解碼方法、及編碼方法之實施例。下列發現也適用於個別電腦程式及編碼信號:假設N為音訊信號訊框的時槽(總)數目,及P為包含該訊框之事件的槽數(如此表示N可以是訊框槽數FSN,及P可以是事件槽數ESON)。考慮訊框之第一時槽。可區別二情況:若第一時槽為不包含事件之時槽,則相對於該訊框之
剩餘N-1時槽,相對於該訊框之剩餘N-1時槽,P包含事件之槽位只有不同的可能組合。
若第一時槽為包含事件之時槽,則相對於該訊框之剩餘N-1時槽,相對於該訊框之剩餘N-1時槽,剩餘P-1包含事件之槽位只有不同的可能組合。
基於此項發現,實施例又更基於發現具有第一時槽不發生事件的全部組合須藉小於或等於臨界值之事件狀態數目編碼。此外,具有第一時槽發生事件的全部組合須藉大於臨界值之事件狀態數目編碼。於一實施例中,全部事件狀態數目可以是正整數或0,有關第一時槽的適當臨界值可以是。
於一實施例中,解碼裝置係適用於藉測試決定訊框之第一時槽是否包含一事件,事件狀態數目是否大於臨界值。(另外,也可實現實施例之編碼/解碼處理程序,使得解碼裝置測試事件狀態數目是否大於或等於、小於或等於、或小於臨界值)。分析第一時槽後,使用調整值繼續對第二訊框時槽繼續解碼:除了調整考慮的時槽數(減少1)之外,於事件狀態數目係大於臨界值之情況下,包含事件之槽數最終也減少1(若該第一時槽確實包含一事件)及事件狀態數目係經調整,來從該事件狀態數目刪除與第一時槽相關部分。解碼程序可以類似方式針對該訊框之額外時槽繼續。
於一實施例中,編碼在[0...N-1]範圍的位置pk
之離散數目P,使得針對k≠h,槽位不相重疊pk
≠ph
。此處,於該給定範圍的各個獨特槽位組合稱作為一個狀態,及於該範圍的各個可能位置稱作為一個時槽。依據解碼裝置一實施例,考慮於該範圍之第一時槽。若該時槽不具有分配給它的位置,則該範圍可減至N-1,及可能的狀態數目減至。
顛倒地,若該狀態係大於,則可得結論該時槽具有分配給它的位置。由此可獲得如下解碼演算法:
在各次迭代重複計算二項式係數的代價昂貴。因此,依據實施例,下述法則可用來運用得自前次迭代重複之值而更新該二項式係數:
運用此等公式,二項式係數的各次更新只耗用一次乘法及一次除法,於該處明確評估將耗用各次迭代重複時P次乘除。
於此一實施例中,解碼器的總複雜度為針對該二項式係數的初始化P乘法及除法,針對各次迭代重複1乘法、除法、及條件語句,及針對各個編碼位置1乘法、加法及除法。注意理論上可將初始化所需除法數目減至一。但實際上,此種辦法將導致極大整數,大到難以處理。最惡劣情況解碼器的複雜度為N+2P除法及N+2P乘法、P加法(若使用MAC運算則可忽略不計),及N條件語句。
於一實施例中,編碼裝置採用的編碼演算法無需迭代重複通過全部時槽,反而只需迭代重複通過有分配槽位的時槽。因此,
編碼器最惡劣情況複雜度為P.(P-1)乘法及P.(P-1)除法,以及P-1加法。
第10圖例示說明依據本發明之一實施例藉解碼裝置進行之解碼方法。於此一實施例中,解碼係以逐一時槽基礎執行。
於步驟110,數值經初始化。解碼裝置儲存其接收作為輸入值的事件狀態數目於變數s。此外,如事件槽數指示的該訊框之包含事件時槽數目係儲存於變數p。此外,如訊框槽數指示的含於該訊框之時槽數目係儲存於變數N。
於步驟120,針對該訊框之全部時槽,TsdSepData[t]之值係以0初始化。位元陣列TsdSepData乃欲產生的輸出資料。指示針對各個槽位t,具有相對應槽位的時槽是否包含
一事件(TsdSepData[t]=1)或不包含一事件(TsdSepData[t]=0)。於步驟120,該訊框之全部時槽的相對應值係以0初始化。
於步驟130,變數k係以值N-1初始化。於此一實施例中,包含N元件之一訊框時槽係編號為0,1,2,...,N-1。設k=N-1,表示具有最高槽號碼的該時槽被視為第一。
於步驟140,考慮是否k0。若k<0,則槽位解碼已經完成而結束處理程序,否則以步驟150繼續處理程序。
於步驟150,測試是否p>k。若p係大於k,則表示全部剩餘TsdSepData時槽包含一事件。於步驟230繼續處理程序,其中剩餘時槽0,1,...,k的全部欄位值係設定為1,指示剩餘時槽各自係包含一事件。於此種情況下,隨後結束處理程序。但若步驟150發現p不大於k,則於步驟160繼續處理程序。
於步驟160,計算數值。C係用作為臨界值。
於步驟170,測試(最終更新的)事件狀態數目s是否大於或等於c,其中c為剛才於步驟160計算的臨界值。
若s係小於c,則表示所考慮的時槽(具有槽位k)不含一事件。於此種情況下,無需採行進一步動作,原因在於於步驟140針對此一時槽TsdSepData[k]已經設定為0。然後以步驟220繼續處理。於步驟220,k係設定為k:=k-1及考慮下個時槽。
但若於步驟170測試顯示s係大於或等於c,如此表示所考慮的時槽k包含一事件。於此種情況下,於步驟180事件
狀態數目s係經更新及設定為值s:=s-c。此外於步驟190,TsdSepData[k]係設定為1來指示時槽k包含一事件。此外於步驟200,p係設定為p-1,指示剩餘欲檢驗的時槽只包含p-1個時槽具有事件。
於步驟210,測試p是否等於0。若p係等於0,則剩餘時槽不包含事件及解碼處理結束。否則,剩餘時槽中之至少一者包含事件及處理繼續步驟220,於該處解碼處理繼續下個時槽(k-1)。
第10圖例示說明實施例之解碼處理產生一陣列TsdSepData作為輸出值,指示針對該訊框之各個時槽k,該時槽是否包含一事件(TsdSepData[k]=1)或不包含一事件(TsdSepData[k]=0)。
回頭參考第9c圖,一實施例之解碼裝置60,其中該裝置體現第10圖例示說明之解碼方法,包含時槽選擇器90,決定考慮哪個時槽。就第10圖而言,此種時槽選擇器90適合執行第10圖之方法步驟130及220。此一實施例之適當分析單元70將適用於執行第10圖之方法步驟140、150、170及210。此一實施例之產生單元80將適用於執行第10圖之全部其它方法步驟。
第11圖例示說明依據本發明之一實施例體現解碼包含事件之槽位的假代碼。
第12圖例示說明依據本發明之一實施例藉編碼裝置執行之編碼方法。於此一實施例中,編碼係以逐一時槽基礎執行。依據第12圖例示說明之實施例的編碼方法目的係產
生事件狀態數目。
於步驟310,數值經初始化。p_s係以0初始化。事件狀態數目係以連續地更新變數p_s而產生。當編碼程序結束時,p_s將攜帶該事件狀態數目。步驟310也初始化變數k,藉設定k為k:=於一訊框中包含事件之槽數-1。
於步驟320,變數「slots」係設定為slots:=tsdPos[k],其中tsdPos為保有包含事件之槽位之一陣列。該陣列中之槽位係以上升順序儲存。
於步驟330進行測試,測試是否kslots。若情況如此,則處理程序結束。否則,處理程序於步驟340繼續。
於步驟340,求出值。
於步驟350,變數p_s經更新及設定為p_s:=p_s+c。
於步驟360,k係設定為k:=k-1。
然後於步驟370進行測試,測試是否k0。若情況如此,則考慮下個時槽k-1。否則處理程序結束。
第13圖描述假代碼,體現依據本發明一實施例包含事件之槽位之編碼。
第14圖例示說明依據本發明又一實施例於一音訊信號訊框中包含事件之槽位之解碼裝置410。再度,如同於第9a圖,指示該音訊信號訊框之時槽總數之一訊框槽數FSN,指示該音訊信號訊框之包含事件之槽數一事件槽數ESON,及一事件狀態數目ESTN係饋入解碼裝置410。解碼裝置410與第9a圖之裝置之差異在於前者更包含一訊框劃
分器440。訊框劃分器440係適用於將該訊框分裂成包含該訊框之一第一時槽集合之一第一訊框區劃及包含該訊框之一第二時槽集合之一第二訊框區劃,及其中係針對該等訊框區劃之各者而分開地決定包含事件之槽位。藉此藉重複地將一訊框或訊框區劃分裂成又更小的訊框區劃,可決定包含事件之槽位。
本實施例之解碼裝置410的「基於區劃」的解碼係基於下列構思,該構思可應用於於一音訊信號訊框中包含事件之槽位的解碼裝置、編碼裝置、解碼方法、及編碼方法。下列構思也適用於個別電腦程式及編碼信號:基於區劃的解碼係基於下列構思:一訊框係分裂成兩個訊框區劃A及B,各個訊框區劃包含一時槽集合,其中訊框區劃A包含Na
時槽及其中訊框區劃B包含Nb
時槽,及使得Na
+Nb
=N。該訊框可任意地分裂成兩個區劃,較佳使得區劃A及B具有接近相等時槽總數(例如使得Na
=Nb
或使得Na
=Nb
-1)。藉將訊框分裂成兩個區劃,決定何處發生事件的槽位任務也分裂成兩個子任務,亦即決定於訊框區劃A何處發生事件的槽位,及決定於訊框區劃B何處發生事件的槽位。
於此一實施例中,再度假設解碼裝置係知曉該訊框之槽數、該訊框之包含事件之槽數、及事件狀態數目。為了解決兩個子任務,解碼裝置也須知曉各個訊框區劃之槽數、有關各個訊框區劃發生事件之槽數、及各個訊框區劃之事件狀態數目(此種訊框區劃之事件狀態數目現在稱作
為「事件子狀態數目」)。
當解碼裝置本身將訊框分裂成兩個訊框區劃時,本身知曉訊框區劃A包含Na
時槽及訊框區劃B包含Nb
時槽。決定針對二訊框區劃中之各者,包含事件之槽數係基於下列發現:當訊框已經分裂成兩個訊框區劃時,包含事件之時槽各自現在係定位於區劃A或區劃B。此外,假設P為一訊框區劃包含事件之槽數,及N為該訊框區劃之時槽總數,及f(P,N)為回送一訊框區劃之事件之槽位的不同組合數目之函式,則整個訊框(已經分裂成區劃A及區劃B)的之事件之槽位的不同組合數目為:
基於前述考量,依據一實施例,具有第一組態之全部組合須以小於第一臨界值的事件狀態數目編碼,於該處區劃A具有0時槽包含事件及區劃B具有P時槽包含事件。事件狀態數目可編碼成正或零的整數值。因只有f(0,Na
).f(P,Nb
)具第一組態,故適當臨界值可以是f(0,Na
).f(P,Nb
)。
具有第二組態之全部組合須以大於或等於第一臨界值但小於或第二第二值的事件狀態數目編碼,於該處區劃A具有1時槽包含事件及區劃B具有P-1時槽包含事件。事件狀
態數目可編碼成正或零的整數值。因只有f(1,Na
).f(P-1,Nb
)具第二組態,故適當臨界值可以是f(0,Na
).f(P,Nb
)+f(1,Na
).f(P-1,Nb
)。對具有其它組態之組合的事件狀態數目係以類似方式決定。
依據一實施例,解碼係藉將一個訊框分離成兩個訊框區劃A及B進行。然後,測試事件狀態數目是否小於第一臨界值。於一於較佳實施例中,第一臨界值可以是f(0,Na
).f(P,Nb
)。
若事件狀態數目係小於第一臨界值,則可獲得結論區劃A具有0時槽包含事件及區劃B具有該訊框的全部P時槽發生事件。然後以表示該相對應區劃的包含事件之槽數所決定的個別數目對二區劃進行解碼。此外,針對區劃A決定第一事件狀態數目,及針對區劃B決定第二事件狀態數目,個別地係用作為新事件狀態數目。於本文件中,訊框區劃的事件狀態數目稱作為「事件子狀態數目」。
但若事件狀態數目係大於或等於第一臨界值,則事件狀態數目可經更新。於一於較佳實施例中,事件狀態數目可藉從事扣除一值,較佳地藉扣除第一臨界值例如f(0,Na
).f(P,Nb
)而予更新。於第二步驟中,測試更新事件狀態數目是否小於第二臨界值。於一於較佳實施例中,第二臨界值可以是f(1,Na
).f(P-1,Nb
)。若事件狀態數目係小於第二臨界值,則可推導區劃A具有1時槽包含事件及區劃B具有P-1時槽包含事件。然後以表示各個區劃的包含事件之槽數個別所決定數目對二區劃進行解碼。第一事件子狀態值採用於
區劃A之解碼,及第二事件子狀態值採用於區劃B之解碼。但若事件狀態數目係大於或等於第二臨界值,則該事件狀態數目可經更新。於一於較佳實施例中,事件狀態數目可藉從事件狀態數目扣除一值,較佳為f(1,Na
).f(P-1,Nb
)而予更新。解碼方法同理適用於有關二訊框區劃包含事件之時槽的其餘分配可能性。
於一實施例中,區劃A之事件子狀態數目及區劃B之事件子狀態數目可採用於區劃A及區劃B之解碼,其中二事件子狀態值係藉進行除法決定:事件狀態值/f(區劃B之包含事件之槽數,Nb
)較佳地,區劃A之事件子狀態數目為前述除法之整數部分,及區劃B之事件子狀態數目為該除法之其餘部分。本除法中採用的事件狀態數目可以是該訊框之原先事件狀態數目或更新之事件狀態數目,例如如前述,藉扣除一或多個臨界值而更新。
為了例示說明前述基於區劃而解碼的構思,考慮一種情況,於該處一個訊框具有二時槽包含事件。此外,若f(p,N)再度為回送一訊框區劃之事件之槽位的不同組合數目之函式,其中p為一訊框區劃包含事件之槽數,及N為該訊框區劃之時槽總數。然後,針對位置的各個可能分配獲得下列可能組合數目:
如此可獲得結論,若該訊框之編碼事件狀態數目係小於f(0,Na
).f(2,Nb
),則包含事件之時槽須分配為0及2。否則,f(0,Na
).f(2,Nb
)係從該事件狀態數目扣除,及結果與f(1,Na
).f(1,Nb
)比較。若前者為較小,則位置分配為1及1。否則只剩下分配2及0,及槽位係分配為2及0。
後文中,依據一實施例,提供假代碼用於一音訊信號訊框中包含某些事件(此處:「脈衝」)之槽位的解碼。於此假代碼中,「pulses_a」為(假設)於區劃A中包含事件之槽數,及「pulses_b」為(假設)於區劃B中包含事件之槽數。於此假代碼中,(最終更新的)事件狀態數目稱作為「狀態」。區劃A及B之事件子狀態數目仍然聯合編碼於「狀態」變數。依據一實施例之聯合編碼方案,A之事件子狀態數目(後文稱作為「state_a」)乃除法狀態/f(pulses_b,Nb
)之整數部分,及B之事件子狀態數目(後文稱作為「state_b」)乃該除法之其餘部分。藉此,二區劃之長度(區劃之時槽總數)及編碼位置數目(區劃中包含事件之槽數)可藉相同辦法解碼:
此一演算法之輸出為向量於每個編碼位置(亦即包含事件之時槽之槽位)具有壹(1)及於它處(亦即不包含事件之槽位)具有零(0)。
後文中,依據一實施例針對於一音訊信號訊框中包含事件之槽位之編碼實施例提供假代碼,該實施例使用前述相似變數具有相似意義:
此處,類似解碼器演算法,假設於向量x之每個編碼位置(亦即包含事件之時槽之槽位)係以壹(1)標示及全部其它元件(亦即不包含事件之槽位)係為零(0)。
前述以假代碼公式表示的遞歸方法方便使用標準方法以非遞歸方式體現。
依據本發明之一實施例,函式f(p,N)可實現為詢查表。當位置為非重疊時,諸如於目前脈絡,則狀態數目函式f(p,N)單純為二項式函式,可於線上計算。亦即
依據本發明之一實施例,編碼器及解碼器二者皆具有for迴圈,於該處針對k之接續值計算乘積f(p-k,Na)*
f(k,Nb)。為了有效運算,可寫成
換言之,減法/加法(於解碼器於步驟2b及2c,及於編碼器於步驟4a)連續項可藉每次迭代重複三次乘法及一次除法求出。
同理,如同於前述方法,長向量(有許多時槽之一訊框)之狀態可以是極大整數,容易延長於標準處理器的表示型態長度。因此需要使用可處理極長整數的算術函式。
有關複雜度,此處考慮之方法係與前述逐一時槽法不同,乃分裂及得勝演算法。假設輸入向量長度為2的次方,則遞歸具有log2(N)之深度。
因在遞歸的各個深度之脈衝數維持常數,故各次遞歸的for迴圈的迭代重複數為相同。接著迴圈數目為pulses.log2(N)。
如前文說明,f(p-k,Na)*
f(k,Nb)之各次更新可以三次乘法及一次除法完成。
須注意於解碼器之減法及比較可假設為一次運算。
方便瞭解區劃係合併log2(N)-1次。於編碼器中狀態之聯合編碼,如此需要乘與加log2(N)-1次。同理,於解碼器中狀態之聯合解碼,如此需要除log2(N)-1次。
須注意除法中,只有於解碼器中狀態之聯合編碼需要除法,於該處分母為長整數。其它除法在分母經常有相當
短整數。因具有長分母的除法乃最複雜運算,故可能時應避開。
要言之,於解碼器中長整數算術運算數目為
只要求使用長分母的log2(N)-1除法。
於額外實施例中,包含或適用以採用遞歸處理步驟的前述實施例係經修改,使得部分或全部遞歸處理步驟係使用標準方法以非遞歸方式體現。
第15圖例示說明依據一實施例於一音訊信號訊框中包含事件之槽位之編碼裝置(510)。編碼裝置(510)包含事件狀態數目產生器(530),其係適用於藉編碼事件狀態數目而編碼槽數。此外,該裝置係包含時槽資訊單元(520)適用於提供訊框槽數及事件槽數給事件狀態數目產生器(530)。事件狀態數目產生器可體現前述編碼方法中之一者。
於又一實施例中,提供一編碼音訊信號。該編碼音訊信號包含一事件槽數。於另一實施例中,該編碼音訊信號
又更包含一事件槽數。此外,該編碼音訊信號訊框包含一訊框槽數。於該音訊信號訊框中,於一音訊信號訊框中包含事件之槽位可依據前述解碼方法中之一者解碼。於一實施例中,事件狀態數目、事件槽數及訊框槽數係經傳輸使得於一音訊信號訊框中包含事件之槽位可依據前述方法中之一者解碼。
本發明之編碼音訊信號可儲存於數位儲存媒體或非暫時性儲存媒體,或可於傳輸媒體諸如無線傳輸媒體或有線諸如網際網路上傳輸。
後文解說依據一實施例適用於支援暫態操控解相關器(TSD)的USAC語法定義:第16圖例示說明MPEG環繞(MPS)212資料。MPS 212資料為包含MPS 212立體聲模組之有效負載的資料區塊。MPS 212資料包含TSD資料。
第17圖描述TSD資料之語法。TSD資料包含於一MPS 212資料訊框中的時槽之暫態時槽(bsTsdNumTrSlots)及TSD暫態相位資料(bsTsdTrPhaseData)數目。若一時槽包含暫態資料(TsdSepData[ts]係設定為1),則bsTsdTrPhaseData包含相位資料,否則bsTsdTrPhaseData[ts]係設定為0。
nBitsTrSlots定義採用以攜載暫態時槽數目(bsTsdNumTrSlots)之位元數。nBitsTrSlots取決於MPS 212資料訊框中的槽數(numSlots)。第18圖例示說明於MPS 212資料訊框中的槽數與採用以攜載暫態時槽數目之位元數間之關係。
第19圖定義tempShapeConfig之意義。tempShapeConfig指示於解碼器中,時間性成形之操作模式(STP或GES)或暫態操控解相關器之作動。若tempShapeConfig係設定為0,則時間性成形絲毫也不適用;若tempShapeConfig係設定為1,則適用子帶定義域時間性處理(STP);若tempShapeConfig係設定為2,則適用導引波封成形(GES);及若tempShapeConfig係設定為3,則適用暫態操控解相關器(TSD)。
第20圖例示說明TempShapeData之語法。若bsTempShapeConfig係設定為3,則TempShapeData包含bsTsdEnable指示於一訊框中TSD被致能。
第21圖例示說明依據一實施例解相關器區塊D。於OTT解碼區塊中的該解相關器區塊D包含一信號分離器、二解相關器結構、及一信號組合器。
DAP
表示:全通解相關器,如小節7.11.2.5(全通解相關器)定義。
DTR
表示:暫態解相關器。
若於目前訊框中TSD工具為作動,換言之,若(bsTsdEnable==1),則輸入信號依據下式分開成暫態串流及非暫態串流:
每一時槽暫態分離旗標TsdSepData(n)係藉TsdTrPos_dec( )而從可變長度碼字組bsTsdCodedPos解碼,容後詳述。bsTsdCodedPos的碼字組長度亦即nBitsTsdCW係依據下式計算:
轉向參考第11圖,第11圖例示說明依據一實施例TSD暫態時槽分離資料bsTsdCodedPos解碼成TsdSepData[n]。由針對編碼暫態位置之「1」及針對其它的「0」所組成的長度numSlots陣列係定義如第11圖例示說明。
若於目前訊框中TSD工具為去能,換言之,若(bsTsdEnable==0),則輸入信號係彷彿針對全部n的TsdSepData(n)=0般處理。
暫態信號成分係於暫態解相關器結構DTR
處理如下:
於該處
非暫態信號成分係如下個小節定義於全通解相關器DAP
處理,獲得針對非暫態信號成分之解相關器輸出,
解相關器輸出相加來形成含有暫態信號成分及非暫態信號成分二者的解相關信號。
第22圖例示說明包含bsFrequencyResStrideXXX之EcData語法。語法元素bsFreqResStride允許於MPS利用寬帶線索。XXX係藉資料型別值(CLD、ICC、IPD)置換。
於OTT解碼器結構中的暫態操控解相關器提供施加特化解相關器至鼓掌狀信號的暫態成分的可能。此種TSD特徵之作動係藉每個訊框傳輸一次的編碼器產生的bsTsdEnable旗標控制。
於編碼器之二聲道對一聲道模組(R-OTT)中的TSD資料係產生如下:
-跑語意信號分類器其檢測鼓掌狀信號。分類結果每個訊框傳輸一次:針對鼓掌狀信號bsTsdEnable旗標係設定為1,否則係設定為0。
-若針對目前訊框之bsTsdEnable係設定為0,則對此一訊框不再產生/傳輸TSD資料。
-若針對目前訊框之bsTsdEnable係設定為1,則執行下列:
○啟動OTT空間參數之寬帶計算。
○檢測於目前訊框之暫態(每個MPS時槽之二進制決定)。
○依據下列假代碼編碼於向量tsdPos中tsdPosLen暫態槽位,於該處於tsdPos中的槽位預期為上升順序。第13圖例示說明用以編碼於tsdPosLen中暫態槽位之假代碼。
○傳輸暫態槽數(bsTsdNumTrSlots=(檢測得之暫態槽數)-1)。
○傳輸編碼暫態位置(bsTsdCodedPos)。
○針對各個暫態時槽,計算表示下混信號與殘差信號間之寬帶相差的相位測量值。
○針對各個暫態時槽,編碼與傳輸寬帶相差測量值(bsTsdTrPhaseData)。
最後,第23圖例示說明於二聲道對一聲道模組(R-OTT)中的TSD資料產生的信號流程圖。
雖然於裝置脈絡已經描述若干構面,但顯然此等構面也表示相對應方法之描述,於該處一個方塊或裝置係相對應於一個方法步驟或方法步驟特徵。同理,於方法步驟之脈絡中描述的構面也表示相對應方塊或項目或相對應裝置之特徵的描述。
取決於某些體現要求,本發明之實施例可於硬體或軟體體現。體現可使用數位儲存媒體執行,例如具有可電子讀取控制信號儲存於其上之軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該等信號與可程式規劃電腦系統協作(或可協作)使得執行個別方法。
依據本發明之若干實施例包含具有電子可讀取控制信號之資料載體,該等信號與可程式規劃電腦系統可協作使得執行此處所述方法中之一者。
大致上言之,本發明之實施例可體現為具有程式代碼之電腦程式產品,當該電腦程式產品在電腦上跑時,該程式代碼可操作用以執行方法中之一者。程式代碼例如可儲存於機器可讀取載體上。
其它實施例包含儲存於機器可讀取載體上或非暫時性儲
存媒體上的用以執行此處揭示之方法中之一者的電腦程式。
換言之,因此,本發明方法之實施例為具有程式代碼之電腦程式,當該電腦程式在電腦上跑時,該程式代碼可操作用以執行方法中之一者。
因此,本發明方法之又一實施例為資料載體(或數位儲存媒體,或電腦可讀取媒體)包含用以執行此處所述方法中之一者的電腦程式記錄其上。
因此,本發明方法之又一實施例為表示用以執行此處所述方法中之一者的電腦程式之一資料串流或一序列信號。該資料串流或序列信號例如可經組配來透過資料通訊連結例如網際網路轉移。
又一實施例包含組配來或適用於執行此處所述方法中之一者的處理裝置,例如電腦或可程式規劃邏輯裝置。
又一實施例包含一種電腦具有用以執行此處所述方法中之一者的電腦程式安裝於其上。
於若干實施例中,可程式規劃邏輯裝置(例如可現場程式規劃閘陣列)可用以執行此處所述方法功能之部分或全部。於若干實施例中,可現場程式規劃閘陣列可與微處理器協作來執行此處所述方法中之一者。概略言之,方法較佳地係藉任一種硬體裝置執行。
前述實施例僅供舉例說明本發明之原理。須瞭解此處所述配置及細節之修改及變化為熟諳技藝人士顯然易知。因此,本發明之範圍意圖只受審查中之申請專利範圍所限而非受藉由描述與解說此處實施例而呈示之特定細節所限。
[1]J.Breebaart,S.van de Par,A.Kohlrausch,E.Schuijers,“High-Quality Parametric Spatial Audio Coding at Low Bitrates”in Proceedings of the AEs 116th
Convention,Berlin,Preprint 6072,May 2004
[2]J.Herre,K.KjÖrling,J.Breebaart et al.,“MPEG surround-the ISO/MPEG standard for efficient and compatible multi-channel audio coding,”in Proceedings of the 122th
AES Convention,Vienna,Austria,May 2007
[3]Pulkki,Ville;“Spatial Sound Reproduction with Directional Audio Coding”in J.Audio Eng.Soc.,Vol.55,No.6,2007
[4]ISO/IEC International Standard“Information Technology-MPEG audio technologies-Part1:MPEG Surround”,ISO/IEC 23003-1:2007.
[5]J.Engdegard,H.Purnhagen,J.RÖden,L.Liljeryd,“Synthetic Ambience in Parametric Stereo Coding”in Proceedings of the AES 116th
Convention,Berlin,Preprint,May 2004
10、40、60、410‧‧‧解碼裝置
20、42、70、420‧‧‧分析單元
30、45、80、430‧‧‧產生單元
50‧‧‧音訊信號處理器
52‧‧‧暫時分離器
54‧‧‧晶格IIR解相關器
56‧‧‧暫態解相關器
90‧‧‧時槽選擇器
110-230、310-370‧‧‧處理方塊
440‧‧‧訊框劃分器
510‧‧‧編碼裝置
520‧‧‧時槽資訊單元
530‧‧‧事件狀態數目產生器
D‧‧‧解相關器
H‧‧‧混合矩陣
L‧‧‧左聲道
M‧‧‧單聲道輸入
R‧‧‧右聲道
第1圖為解相關器於單聲道對立體聲上混器之典型應用;第2圖為解相關器於單聲道對立體聲上混器之又一典型應用;第3圖為含括暫態操控解相關器(TSD)之一對二(OTT)系統之綜覽;
第4圖為略圖顯示於TSD分數實驗(CE)中針對32 kbps立體聲比較RM8與USAC RM8+TSD之絕對分數;第5圖為略圖顯示針對32 kbps立體聲比較採用暫態操控解相關器的USAC相較於普通USAC系統之差分;第6圖為略圖顯示於TSD分數實驗(CE)中針對16 kbps立體聲比較RM8與USAC RM8+TSD之絕對分數;第7圖為略圖顯示針對16 kbps立體聲比較採用暫態操控解相關器的USAC相較於普通USAC系統之差分;第8圖顯示針對五個額外項目之TSD活性,描述為bsTsdEnable旗標之邏輯態;第9a圖顯示依據本發明之一實施例於一音訊信號訊框中包含該等事件之槽位的解碼裝置;第9b圖顯示依據本發明之又一實施例於一音訊信號訊框中包含該等事件之槽位的解碼裝置;第9c圖顯示依據本發明之另一實施例於一音訊信號訊框中包含事件之槽位的解碼裝置;第10圖為流程圖顯示依據本發明之一實施例藉解碼裝置所執行之解碼方法;第11圖顯示依據本發明之一實施例體現包含事件之槽位的解碼之假代碼;第12圖為流程圖顯示依據本發明之一實施例藉編碼裝置所執行之編碼方法;第13圖為假代碼描述依據本發明之又一實施例於一音訊信號訊框中包含事件之槽位的編碼方法;
第14圖顯示依據本發明之又一實施例於一音訊信號訊框中包含事件之槽位的解碼裝置;第15圖顯示依據本發明之一實施例於一音訊信號訊框中包含事件之槽位的編碼裝置;第16圖描述依據一實施例USAC之MPS 212資料之語法;第17圖顯示依據一實施例USAC之TsdData之語法;第18圖顯示取決於MPS訊框長度之nBitsTrSlots表;第19圖顯示依據一實施例有關USAC之bsTempShapeConfig之表;第20圖顯示依據一實施例USAC之TempShapeData之語法;第21圖顯示依據一實施例於OTT解碼區塊中之解相關器區塊D;第22圖顯示依據一實施例USAC之EcData之語法;第23圖顯示用以產生TSD資料之一信號流程圖。
10‧‧‧解碼裝置
20‧‧‧分析單元
30‧‧‧產生單元
Claims (18)
- 一種用以解碼一編碼音訊信號之解碼裝置,該編碼音訊信號具有一音訊信號訊框包含時槽及與該等時槽相聯結的事件,該裝置係包含:一分析單元,用以分析指示該音訊信號訊框之時槽總數之一訊框槽數、指示包含該音訊信號訊框之該等事件之時槽數目之一事件槽數、及一事件狀態數目;及一產生單元,用以使用該訊框槽數、該事件槽數、及該事件狀態數目,來產生於該音訊信號訊框中包含該等事件之多個槽位之一指示。
- 如請求項1之解碼裝置,其中該解碼裝置係適用以解碼於一音訊信號訊框中之暫態的槽位。
- 如請求項1之解碼裝置,其中該分析單元係適用以進行一測試比較該事件狀態數目或一更新事件狀態數目與一臨界值。
- 如請求項3之解碼裝置,其中該分析單元係適用以藉比較該事件狀態數目或一更新事件狀態數目是否大於、大於或等於、小於、或小於或等於該臨界值而進行該測試,及其中該產生單元係更適用於取決於該測試結果而更新該事件狀態數目或一更新事件狀態數目。
- 如請求項3之解碼裝置,其中該解碼裝置係更包含一時槽選擇器, 其中該時槽選擇器係適用於選擇一時槽作為一考慮時槽,其中該分析單元係適用以就一考慮時槽進行該項測試,及其中該臨界值係取決於該訊框槽數、該事件槽數及該考慮時槽於該訊框內部位置。
- 如請求項5之解碼裝置,其中該分析單元係適用以進行該測試比較該事件狀態數目或一更新事件狀態數目與該臨界值,其中該臨界值為,其中N為該音訊信號訊框之時槽總數,其中P為包含該音訊信號訊框或該音訊信號訊框之一所考慮部分之該等事件之槽數,及其中h為該考慮時槽於該訊框內部位置。
- 如請求項1之解碼裝置,其中該解碼裝置進一步包含一訊框劃分器,其中該訊框劃分器係適用於將該訊框分裂成包含該訊框之一第一時槽集合之一第一訊框區劃及包含該訊框之一第二時槽集合之一第二訊框區劃,及其中該解碼裝置係進一步適用於針對該等訊框區劃各者分開地決定包含該等事件之槽位。
- 如請求項1之解碼裝置,其係進一步包含:一音訊信號處理器,用以使用該訊框槽數、該事件 槽數、及該事件狀態數目而使用於該音訊信號訊框中包含該等事件之多個槽位之指示來產生一音訊輸出信號。
- 如請求項8之解碼裝置,其中若包含該等事件之多個槽位之該指示係於一第一指示態,則該音訊信號處理器係適用於依據一第一方法而產生該音訊輸出信號,及其中若包含該等事件之多個槽位之該指示係於與該第一指示態相異之一第二指示態,則該音訊信號處理器係適用於依據一不同第二方法而產生該音訊輸出信號。
- 如請求項9之解碼裝置,其中音訊信號處理器係適用於使得若該第一指示態指示該時槽包含一暫態,則該第一方法包含採用一暫態解相關器來解碼一時槽,及若該第二指示態指示該時槽不包含一暫態,則該第二方法包含採用一第二解相關器來解碼一時槽。
- 一種用以編碼於一音訊信號訊框中包含事件之槽位之編碼裝置,該裝置係包含:一事件狀態數目產生器,用以藉編碼一事件狀態數目來編碼該等槽位;及一時槽資訊單元,其係適用於提供指示該音訊信號訊框之時槽總數之一訊框槽數及指示該音訊信號訊框中包含該等事件之時槽數目之一事件槽數給該事件狀態數目產生器,其中該事件狀態數目、該訊框槽數、及該事件槽數一 起指示該音訊信號訊框中包含該等事件之多個槽位。
- 如請求項11之編碼裝置,其中該事件狀態數目產生器係適用於藉針對包含一事件之各個時槽加一正整數值而產生一事件狀態數目。
- 如請求項11之編碼裝置,其中該事件狀態數目產生器係適用於產生該事件狀態數目,係藉針對一第一訊框區劃產生一第一事件子狀態數目,藉針對一第二訊框區劃產生一第二事件子狀態數目,及藉組合該第一及第二事件狀態數目而產生該事件狀態數目。
- 一種用以將於一音訊信號訊框中包含事件之槽位解碼之方法,該方法係包含:分析指示該音訊信號訊框之時槽總數之一訊框槽數、指示包含該音訊信號訊框之該等事件之時槽數目之一事件槽數、及一事件狀態數目;及使用該訊框槽數、該事件槽數、及該事件狀態數目而產生於該音訊信號訊框中包含該等事件之多個槽位之一指示。
- 一種用以將於一音訊信號訊框中包含事件之槽位編碼之方法,該方法係包含:接收或決定指示該音訊信號訊框之時槽總數之一訊框槽數,接收或決定指示該音訊信號訊框之包含事件之槽數一事件槽數, 基於該事件狀態數目、該訊框槽數、及該事件槽數編碼一事件狀態數目,使得於該音訊信號訊框中包含該等事件之多個槽位可使用該訊框槽數、該事件槽數、及該事件狀態數目解碼。
- 一種用以將於一音訊信號訊框中包含事件之槽位解碼之電腦程式,該電腦程式係體現如請求項14之用以將於一音訊信號訊框中包含事件之槽位解碼之方法。
- 一種用以將於一音訊信號訊框中包含事件之槽位編碼之電腦程式,該電腦程式係體現如請求項15之用以將於一音訊信號訊框中包含事件之槽位編碼之方法。
- 一種其上儲存有一編碼音訊信號之電腦可讀媒體,該編碼音訊信號包含一事件狀態數目,其中包含事件之該槽位可依據如請求項14之方法解碼。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161433803P | 2011-01-18 | 2011-01-18 | |
EP11172791A EP2477188A1 (en) | 2011-01-18 | 2011-07-06 | Encoding and decoding of slot positions of events in an audio signal frame |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201248619A TW201248619A (en) | 2012-12-01 |
TWI485699B true TWI485699B (zh) | 2015-05-21 |
Family
ID=44508771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101101714A TWI485699B (zh) | 2011-01-18 | 2012-01-17 | 音訊信號訊框中事件槽位的編碼與解碼技術 |
Country Status (15)
Country | Link |
---|---|
US (1) | US9502040B2 (zh) |
EP (2) | EP2477188A1 (zh) |
JP (1) | JP5818913B2 (zh) |
KR (1) | KR101657251B1 (zh) |
CN (1) | CN103620677B (zh) |
AR (1) | AR084873A1 (zh) |
AU (1) | AU2012208673B2 (zh) |
BR (1) | BR112013018362B1 (zh) |
CA (1) | CA2824935C (zh) |
MX (1) | MX2013008364A (zh) |
MY (1) | MY155887A (zh) |
SG (1) | SG191988A1 (zh) |
TW (1) | TWI485699B (zh) |
WO (1) | WO2012098098A1 (zh) |
ZA (1) | ZA201306173B (zh) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101660004B1 (ko) * | 2012-08-03 | 2016-09-27 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 멀티채널 다운믹스/업믹스 케이스들에 대해 매개변수 개념을 이용한 멀티-인스턴스 공간-오디오-오브젝트-코딩을 위한 디코더 및 방법 |
WO2014126688A1 (en) * | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
WO2014126684A1 (en) * | 2013-02-14 | 2014-08-21 | Dolby Laboratories Licensing Corporation | Time-varying filters for generating decorrelation signals |
BR112015018522B1 (pt) | 2013-02-14 | 2021-12-14 | Dolby Laboratories Licensing Corporation | Método, aparelho e meio não transitório que tem um método armazenado no mesmo para controlar a coerência entre canais de sinais de áudio com upmix. |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
EP2830053A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal |
JP6242489B2 (ja) * | 2013-07-29 | 2017-12-06 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 脱相関器における過渡信号についての時間的アーチファクトを軽減するシステムおよび方法 |
CA2926243C (en) | 2013-10-21 | 2018-01-23 | Lars Villemoes | Decorrelator structure for parametric reconstruction of audio signals |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
EP2963649A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
ES2956344T3 (es) | 2015-08-25 | 2023-12-19 | Dolby Laboratories Licensing Corp | Descodificador de audio y procedimiento de descodificación |
WO2017100619A1 (en) * | 2015-12-10 | 2017-06-15 | Ascava, Inc. | Reduction of audio data and data stored on a block processing storage system |
CN105654959B (zh) * | 2016-01-22 | 2020-03-06 | 韶关学院 | 一种自适应滤波的系数更新方法及装置 |
FR3048808A1 (fr) * | 2016-03-10 | 2017-09-15 | Orange | Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal |
JP7257975B2 (ja) | 2017-07-03 | 2023-04-14 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
PL3659140T3 (pl) * | 2017-07-28 | 2024-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie do enkodowania lub dekodowania enkodowanego sygnału wielokanałowego za pomocą sygnału wypełnienia generowanego przez filtr szerokopasmowy |
US10594869B2 (en) | 2017-08-03 | 2020-03-17 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
US10542153B2 (en) | 2017-08-03 | 2020-01-21 | Bose Corporation | Multi-channel residual echo suppression |
US10200540B1 (en) * | 2017-08-03 | 2019-02-05 | Bose Corporation | Efficient reutilization of acoustic echo canceler channels |
US10863269B2 (en) | 2017-10-03 | 2020-12-08 | Bose Corporation | Spatial double-talk detector |
TWI812658B (zh) * | 2017-12-19 | 2023-08-21 | 瑞典商都比國際公司 | 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統 |
US10964305B2 (en) | 2019-05-20 | 2021-03-30 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070201514A1 (en) * | 2005-08-30 | 2007-08-30 | Hee Suk Pang | Time slot position coding |
US20100145697A1 (en) * | 2004-07-06 | 2010-06-10 | Iucf-Hyu Industry-University Cooperation Foundation Hanyang University | Similar speaker recognition method and system using nonlinear analysis |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3307138B2 (ja) * | 1995-02-27 | 2002-07-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
US6424938B1 (en) | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
ES2208297T3 (es) * | 1999-04-07 | 2004-06-16 | Dolby Laboratories Licensing Corporation | Generacion de matrices para codificacion y descodificacion sin perdidas de señales de audio multicanal. |
BR0305555A (pt) | 2002-07-16 | 2004-09-28 | Koninkl Philips Electronics Nv | Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado |
SG108862A1 (en) * | 2002-07-24 | 2005-02-28 | St Microelectronics Asia | Method and system for parametric characterization of transient audio signals |
US7536305B2 (en) | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
TW594674B (en) * | 2003-03-14 | 2004-06-21 | Mediatek Inc | Encoder and a encoding method capable of detecting audio signal transient |
US7353169B1 (en) * | 2003-06-24 | 2008-04-01 | Creative Technology Ltd. | Transient detection and modification in audio signals |
US7519538B2 (en) | 2003-10-30 | 2009-04-14 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
JP4867914B2 (ja) * | 2004-03-01 | 2012-02-01 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャンネルオーディオコーディング |
KR20070003594A (ko) * | 2005-06-30 | 2007-01-05 | 엘지전자 주식회사 | 멀티채널 오디오 신호에서 클리핑된 신호의 복원방법 |
WO2007029412A1 (ja) * | 2005-09-01 | 2007-03-15 | Matsushita Electric Industrial Co., Ltd. | マルチチャンネル音響信号処理装置 |
US7974713B2 (en) * | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
WO2007110101A1 (en) * | 2006-03-28 | 2007-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enhanced method for signal shaping in multi-channel audio reconstruction |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
DE102007018032B4 (de) * | 2007-04-17 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Erzeugung dekorrelierter Signale |
CN101308655B (zh) * | 2007-05-16 | 2011-07-06 | 展讯通信(上海)有限公司 | 一种音频编解码方法与装置 |
US8725520B2 (en) * | 2007-09-07 | 2014-05-13 | Qualcomm Incorporated | Power efficient batch-frame audio decoding apparatus, system and method |
TWI433137B (zh) * | 2009-09-10 | 2014-04-01 | Dolby Int Ab | 藉由使用參數立體聲改良調頻立體聲收音機之聲頻信號之設備與方法 |
-
2011
- 2011-07-06 EP EP11172791A patent/EP2477188A1/en not_active Withdrawn
-
2012
- 2012-01-17 MX MX2013008364A patent/MX2013008364A/es active IP Right Grant
- 2012-01-17 SG SG2013054283A patent/SG191988A1/en unknown
- 2012-01-17 TW TW101101714A patent/TWI485699B/zh active
- 2012-01-17 CN CN201280013909.XA patent/CN103620677B/zh active Active
- 2012-01-17 CA CA2824935A patent/CA2824935C/en active Active
- 2012-01-17 WO PCT/EP2012/050613 patent/WO2012098098A1/en active Application Filing
- 2012-01-17 KR KR1020137021329A patent/KR101657251B1/ko active IP Right Grant
- 2012-01-17 EP EP12701848.9A patent/EP2666161A1/en active Pending
- 2012-01-17 JP JP2013549787A patent/JP5818913B2/ja active Active
- 2012-01-17 BR BR112013018362-4A patent/BR112013018362B1/pt active IP Right Grant
- 2012-01-17 AU AU2012208673A patent/AU2012208673B2/en active Active
- 2012-01-17 MY MYPI2013002693A patent/MY155887A/en unknown
- 2012-01-17 AR ARP120100152A patent/AR084873A1/es active IP Right Grant
-
2013
- 2013-07-17 US US13/944,766 patent/US9502040B2/en active Active
- 2013-08-16 ZA ZA2013/06173A patent/ZA201306173B/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100145697A1 (en) * | 2004-07-06 | 2010-06-10 | Iucf-Hyu Industry-University Cooperation Foundation Hanyang University | Similar speaker recognition method and system using nonlinear analysis |
US20070201514A1 (en) * | 2005-08-30 | 2007-08-30 | Hee Suk Pang | Time slot position coding |
Also Published As
Publication number | Publication date |
---|---|
ZA201306173B (en) | 2014-04-30 |
US20130304480A1 (en) | 2013-11-14 |
TW201248619A (en) | 2012-12-01 |
KR20130133833A (ko) | 2013-12-09 |
BR112013018362A2 (pt) | 2016-10-04 |
CA2824935C (en) | 2016-08-30 |
AR084873A1 (es) | 2013-07-10 |
EP2477188A1 (en) | 2012-07-18 |
CN103620677A (zh) | 2014-03-05 |
WO2012098098A1 (en) | 2012-07-26 |
US9502040B2 (en) | 2016-11-22 |
RU2013138354A (ru) | 2015-02-27 |
JP2014508316A (ja) | 2014-04-03 |
AU2012208673A1 (en) | 2013-08-29 |
CN103620677B (zh) | 2015-10-14 |
SG191988A1 (en) | 2013-08-30 |
AU2012208673B2 (en) | 2015-05-14 |
EP2666161A1 (en) | 2013-11-27 |
JP5818913B2 (ja) | 2015-11-18 |
MX2013008364A (es) | 2013-08-12 |
BR112013018362B1 (pt) | 2021-01-19 |
KR101657251B1 (ko) | 2016-09-13 |
CA2824935A1 (en) | 2012-07-26 |
MY155887A (en) | 2015-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI485699B (zh) | 音訊信號訊框中事件槽位的編碼與解碼技術 | |
JP6196249B2 (ja) | 複数のチャネルを有するオーディオ信号を符号化する装置と方法 | |
US9966080B2 (en) | Audio object encoding and decoding | |
JP5563647B2 (ja) | マルチチャンネル復号化方法及びマルチチャンネル復号化装置 | |
JP5490143B2 (ja) | ダウンミックスオーディオ信号をアップミックスするためのアップミキサー、方法、および、コンピュータ・プログラム | |
JP6133422B2 (ja) | マルチチャネルをダウンミックス/アップミックスする場合のため一般化された空間オーディオオブジェクト符号化パラメトリック概念のデコーダおよび方法 | |
JP6732739B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
RU2575393C2 (ru) | Кодирование и декодирование позиций слотов с событиями в кадре аудиосигнала | |
AU2015201672A1 (en) | Apparatus for generating a decorrelated signal using transmitted phase information |