TWI459374B - 音訊信號解碼器、時間扭曲輪廓資料提供器、方法及電腦程式 - Google Patents

音訊信號解碼器、時間扭曲輪廓資料提供器、方法及電腦程式 Download PDF

Info

Publication number
TWI459374B
TWI459374B TW098123191A TW98123191A TWI459374B TW I459374 B TWI459374 B TW I459374B TW 098123191 A TW098123191 A TW 098123191A TW 98123191 A TW98123191 A TW 98123191A TW I459374 B TWI459374 B TW I459374B
Authority
TW
Taiwan
Prior art keywords
time
contour
time warp
warped
warp
Prior art date
Application number
TW098123191A
Other languages
English (en)
Other versions
TW201009809A (en
Inventor
Stefan Bayer
Sascha Disch
Ralf Geiger
Guillaume Fuchs
Max Neuendorf
Gerald Schuller
Bernd Edler
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=41131685&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TWI459374(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201009809A publication Critical patent/TW201009809A/zh
Application granted granted Critical
Publication of TWI459374B publication Critical patent/TWI459374B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Synchronisation In Digital Transmission Systems (AREA)

Description

音訊信號解碼器、時間扭曲輪廓資料提供器、方法及電腦程式
本發明係關於音訊信號解碼器、時間扭曲輪廓資料提供器、方法及電腦程式。
發明背景
根據本發明的一些實施例關於一種音訊信號解碼器。根據本發明的進一步實施例關於時間扭曲輪廓資料提供器。根據本發明的進一步實施例關於一種解碼音訊信號的方法、一種將時間扭曲輪廓資料提供給電腦程式的方法。
根據本發明的一些實施例與時間扭曲MDCT轉換編碼器的方法有關。
在下文中,將對時間扭曲音訊編碼領域做一簡要介紹,時間扭曲音訊編碼的概念可連同本發明的一些實施例被應用。
在最近幾年,用以將音訊信號轉換成頻域表現型態、及有效地編碼此一頻域表現型態(例如考慮知覺遮蔽臨界值)的技術已被開發。此一音訊信號編碼概念在以下情況下特別有效,即如果一組編碼頻譜係數被傳送的區塊長度長,且如果只有一相對少數的頻譜係數遠大於全域遮蔽臨界值,而大數目的頻譜係數在該全域遮蔽臨界附近或小於該全域遮蔽臨界從而可被忽略(或用最小碼長編碼)。
例如,餘弦式或正弦式調變重疊轉換由於其能量壓縮性質通常被用在信號源編碼之應用中。也就是說,對於具 有恆定基本頻率(音距)的諧音而言,它們將信號能量集中到少數頻譜分量(子頻帶),這導致有效的信號表現型態。
一般地,信號的(基本)音距將被理解為可與信號之頻譜區別的最低主頻。在一般的語音模型中,音距是經人的喉嚨調變之激勵信號的頻率。若只是一個單一的基本頻率存在,則頻譜將極為簡單,只包含該基本頻率與泛音。這種頻譜可被高效地編碼。然而,對於具有變化音距的信號而言,與每一諧波分量對應的能量透過若干轉換係數來傳播,從而導致編碼效率的降低。
為了克服這種編碼效率的降低,將被編碼的音訊信號被以一非均勻時間網格有效地重新取樣。在隨後的處理中,透過非均勻重新取樣所獲得的樣本位置如同它們將代表非均勻時間網格上的值地被處理。這種操作通常由片語‘時間扭曲’來表示。取樣次數可依據音距的時間變化有利地選擇,藉此在音訊信號之時間扭曲版本中的音距變化小於音訊信號之原始版本(在時間扭曲之前)中的音距變化。在將音訊信號時間扭曲之後,音訊信號之時間扭曲版本被轉換到頻域。音距依賴時間扭曲具有的效應是,時間扭曲音訊信號的頻域表現型態典型地顯示出能量壓縮成一數目遠少於原始(非時間扭曲)音訊信號頻域表現型態的頻譜分量。
在解碼器端,時間扭曲音訊信號的頻域表現型態被轉換回到時域,藉此在解碼器端可得到時間扭曲音訊信號的時域表現型態。然而,在解碼器端重建時間扭曲音訊信號的時域表現型態中,編碼器端輸入音訊信號的原始音距變 化不包括在內。因此,透過對時間扭曲音訊信號之解碼器端重建時域表現型態的重新取樣,又一時間扭曲被施加。為了在解碼器端獲得編碼器端輸入音訊信號的良好重建,解碼器端時間扭曲至少近乎關於編碼器端時間扭曲的反操作是所期望的。為了獲得一合適的時間扭曲,在解碼器端可得一容使依比例調整解碼器端時間扭曲的一資訊是所期望的。
因為典型所需要的是從音訊信號編碼器向音訊信號解碼器傳送此一資訊。維持此一傳輸所需要的位元率較小而仍然在解碼器端提供可靠重建所需要的時間扭曲資訊是所期望的。
鑒於以上討論,期望有一種容許根據時間扭曲資訊的有效編碼表現型態可靠重建時間扭曲資訊的概念。
發明概要
根據本發明的一實施例產生一音訊信號解碼器,該音訊信號解碼器被組配成根據包含一時間扭曲輪廓演化資訊的一編碼音訊信號表現型態提供一解碼音訊信號表現型態。該音訊信號解碼器包含一時間扭曲輪廓計算器,該時間扭曲輪廓計算器被組配成根據描述時間扭曲輪廓之一時間演化的時間扭曲輪廓演化資訊從一預定時間扭曲輪廓初始值一再地重新開始產生時間扭曲輪廓資料。音訊信號解碼器也包含一時間扭曲輪廓重新調整器(rescaler),該時間扭曲輪廓重新調整器被組配成重新依比例調整時間扭曲輪 廓資料的至少一部分,藉此在時間扭曲輪廓的一重新調整版本中,在重新開始處的不連續被避免、減小或消除。音訊信號解碼器也包含一時間扭曲解碼器,該時間扭曲解碼器被組配成根據編碼音訊信號表現型態且使用時間扭曲輪廓的重新調整版本提供解碼音訊信號表現型態。
上述實施例係基於時間扭曲輪廓可使用一表現型態高效率編碼之發現,該表現型態描述時間扭曲輪廓的時間演化、或相對改變,因為時間扭曲輪廓的時間變化(也被指定為「演化」)實際上是時間扭曲輪廓的特性量,而其絕對值對於時間扭曲音訊信號的編碼/解碼而言不重要。然而,已發現的是,根據描述時間扭曲輪廓隨時間變化的一時間扭曲輪廓演化資訊重建時間扭曲輪廓,帶來解碼器中的一可允許值範圍可能被超過的問題,例如以數值下溢或上溢之形式。這是由解碼器通常包含具有一有限解析度之一數字表現型態的事實產生的。再者,已發現的是,解碼器中的下溢或上溢危險可透過從一預定時間扭曲輪廓初始值一再地重新開始重建時間扭曲輪廓來消除。然而,僅重新開始時間扭曲輪廓的重建帶來在重新開始時間處存在時間扭曲輪廓不連續的問題。因此,已發現的是,重新依比例調整可被用來在重新開始處避免、消除、或至少減小這種不連續,其中時間輪廓的重建從預定時間扭曲輪廓初始值被一再地重新開始。
綜上所述,已發現的是,若時間扭曲輪廓的重建從一預定時間扭曲輪廓初始值被一再地重新開始,且從該重新開始產生的不連續透過重新依比例調整時間扭曲輪廓的至少一部分被減小或消除,則一區塊式連續時間扭曲輪廓可被重建而沒有數值下溢或上溢的風險。
因此,可實現的是,時間扭曲輪廓永遠是在重新開始時間的某一時間環境內的環繞時間扭曲輪廓初始值的一明確界定範圍內。在許多情況下,這是足夠的,因為典型地只有相對於音訊信號重建的當前時間所定義的時間扭曲輪廓的一時間部分為區塊式音訊信號重建所需要,而時間扭曲輪廓的「較舊」部分不被當前的音訊信號重建所需要。
綜上所述,這裡所描述的實施例提供描述時間扭曲輪廓的時間演化之一相對時間扭曲輪廓資訊的有效使用,其中解碼器中的數值上溢或下溢可透過一再地重新開始時間扭曲輪廓來避免,且其中通常為音訊信號重建所需要的時間扭曲輪廓連續性可以甚至在重新開始時透過合適的重新依比例調整來實現。
在下文中,包含本發明概念之可任擇改進的一些較佳實施例將予以討論。
在本發明的一實施例中,時間扭曲輪廓計算器被組配成從一預定初始值開始且使用第一相對改變資訊計算時間扭曲輪廓之第一部分的時間演化,以及從該預定初始值開始且使用第二相對改變資訊計算時間扭曲輪廓之第二部分的時間演化,其中時間扭曲輪廓的第一部分與時間扭曲輪廓的第二部分是時間扭曲輪廓之接續部分。較佳地,時間扭曲輪廓重新調整器被組配成重新依比例調整時間扭曲輪廓之該等部分中的一者,以獲得時間扭曲輪廓之第一部分與時間扭曲輪廓之第二部分之間的平穩過渡。
使用這一概念,第一時間扭曲輪廓部分與第二時間扭曲輪廓部分兩者可從一明確界定的預定初始值開始被產生,該初始值對於第一時間扭曲輪廓部分的重建及第二時間扭曲輪廓部分的重建而言可以是相同的。假設相對改變資訊描述時間扭曲輪廓在一有限範圍內的相對改變,則保證時間扭曲輪廓的第一部分與時間扭曲輪廓的第二部分顯示出一有限範圍的值。因此,一數值下溢或一數值上溢可被避免。
再者,透過重新依比例調整時間扭曲輪廓的其中一部分,在從時間扭曲輪廓的第一部分到該時間扭曲輪廓的第二部分之過渡處(即在重新開始處)的不連續可被減小或甚至被消除。
在一較佳實施例中,時間扭曲輪廓重新調整器被組配成重新依比例調整時間扭曲輪廓的第一部分,藉此時間扭曲輪廓的第一部分之調整版本中的一最後值採取預定初始值,或偏離該預定初始值至多一預定容限值。
以此方式,可被實現的是,在從第一部分到第二部分之過渡處的時間扭曲輪廓的一值採取一預定值。因此,值的範圍可被保持特別小,因為中心值是固定的(或依比例調整為一預定值)。例如,若時間扭曲輪廓的第一部分與時間扭曲輪廓的第二部分兩者都是上升的,則第一部分之重新調整版本中的最小值處於預定初始值以下,且第二部分的終值處於預定初始值以上。然而,與預定初始值的最大偏差藉由第一部分之斜率與第二部分之斜率中的最大值決定。相反地,若第一部分與第二部分被以一連續方式放在一起,而既不從初始值開始也不重新依比例調整,則第二部分的一端將以第一部分與第二部分之斜率的和偏離該初始值。
因此,可看出的是,值的範圍(與初始值的最大偏差)可透過在第一部分與第二部分之間的過渡處依比例調整一中心值以採取初始值來減小。值範圍的這一減小是特別有利的,因為此一減小支援使用具有一有限數值範圍的一比較低解析度資料格式,轉而提供便宜且省電的消費者裝置設計,而這是音訊編碼領域中的持續挑戰。
在一較佳實施例中,重新調整器被組配成將扭曲輪廓資料值乘以一正規化因子來依比例調整時間扭曲輪廓的一部分,或將扭曲輪廓資料值除以一正規化因子來依比例調整時間扭曲輪廓的該部分。已發現的是,一線性比例調整(而非例如時間扭曲輪廓的附加移位)是特別合適的,因為乘法調整或除法調整保持時間扭曲輪廓的相對變化,這對於時間扭曲而言是有意義的,不同於沒有意義的時間扭曲輪廓的絕對值。
在另一較佳實施例中,時間扭曲輪廓計算器被組配成獲得時間扭曲輪廓之一特定部分的扭曲輪廓和值,以及使用一共用比例調整值調整時間扭曲輪廓的該特定部分及該時間扭曲輪廓之該特定部分的扭曲輪廓和值。
已發現的是在一些情況下,從扭曲輪廓得出扭曲輪廓和值是所期望的,因為此一扭曲輪廓和值可用於從時間扭曲輪廓導出一時間輪廓。因此,使用特定的時間扭曲輪廓及對應的扭曲輪廓和值計算第一時間輪廓是可能的。再者,已發現的是,時間扭曲輪廓的調整版本與對應的比例調整和值可能為隨後計算另一時間輪廓所需要。因此,已發現的是,對於該特定時間扭曲輪廓的重新調整版本而言,沒有必要重新計算扭曲輪廓和值,因為透過重新依比例調整扭曲輪廓的特定部分之原始版本的扭曲輪廓和值來得出該扭曲輪廓的該特定部分之該調整版本的扭曲輪廓和值是可能的。
在一較佳實施例中,音訊信號解碼器包含一時間輪廓計算器,該時間輪廓計算器被組配成使用時間扭曲輪廓之第一部分、時間扭曲輪廓之第二部分及時間扭曲輪廓之第三部分的時間扭曲輪廓資料值計算第一時間輪廓,以及使用時間扭曲輪廓之第二部分、時間扭曲輪廓之第三部分及時間扭曲輪廓之第四部分的時間扭曲輪廓資料值計算第二時間輪廓。換言之,時間扭曲輪廓的第一複數部分(包含三個部分)用於計算第一時間輪廓,而第二複數部分(包含三個部分)用於計算第二時間輪廓,其中該等第一複數部分與該等第二複數部分重疊。時間扭曲輪廓計算器被組配成根據描述第一部分之時間演化的時間扭曲輪廓演化資訊,從一預定時間扭曲輪廓初始值開始產生該第一部分的時間扭曲輪廓資料。再者,時間扭曲輪廓計算器被組配成重新依比例調整時間扭曲輪廓的第一部分,藉此時間扭曲輪廓之第一部分的一最後值包含預定時間扭曲輪廓初始值,以根據描述第二部分之時間演化的時間扭曲輪廓演化資訊,從該預定時間扭曲輪廓初始值開始產生時間扭曲輪廓的第二部分的時間扭曲輪廓資料,以及使用一共用比例調整因數共同地重新依比例調整第一部分與第二部分,藉此第二部分的一最後值包含該預定時間扭曲輪廓初始值,以獲得共同重新依比例調整的時間扭曲輪廓資料值。時間扭曲輪廓計算器亦被組配成根據時間扭曲輪廓之第三部分的時間扭曲輪廓演化資訊,從該預定時間扭曲輪廓初始值開始產生時間扭曲輪廓之該第三部分的原始時間扭曲輪廓資料值。
因此,時間扭曲輪廓的第一部分、第二部分及第三部分被產生,藉此其等形成時間扭曲輪廓的一連續部分。因此,時間輪廓計算器被組配成使用第一與第二時間扭曲輪廓部分之共同重新依比例調整的時間扭曲輪廓資料值及第三時間扭曲輪廓部分的時間扭曲輪廓資料值計算第一時間輪廓。
隨後,時間扭曲輪廓計算器被組配成使用另一共用比例調整因數共同地重新依比例調整時間扭曲輪廓的第二重新依比例調整部分及第三原始部分,藉此時間扭曲輪廓之第三部分的一最後值包含預定時間扭曲初始值,以獲得第二部分的一兩次重新調整版本及時間扭曲輪廓之第三部分的一次重新調整版本。再者,時間扭曲輪廓計算器被組配成根據時間扭曲輪廓之第四部分的時間扭曲輪廓演化資訊,從該預定時間扭曲輪廓初始值開始產生時間扭曲輪廓之該第四部分的原始時間扭曲輪廓資料值。再者,時間扭曲輪廓計算器被組配成使用第二部分的一兩次重新調整版本、第三部分的一一次重新調整版本及時間扭曲輪廓之第四部分的原始版本計算第二時間輪廓。
因此,可看出的是,時間扭曲輪廓的第二部分與第三部分兩者都用於計算第一時間輪廓及用於計算第二時間輪廓。然而,在計算第一時間輪廓與計算第二時間輪廓之間存在第二部分與第三部分的重新依比例調整,以保持所使用的值範圍充分地小,同時保證計算各自的時間輪廓所考慮的時間扭曲輪廓部分的連續性。
在另一較佳實施例中,信號解碼器包含被組配成使用時間扭曲輪廓的複數個部分計算一時間扭曲控制資訊的一時間扭曲控制資訊計算器。該時間扭曲控制資訊計算器被組配成根據第一複數時間扭曲輪廓部分的時間扭曲輪廓資料計算用於重建音訊信號之第一訊框的時間扭曲控制資訊,以及根據第二複數時間扭曲輪廓部分的時間扭曲輪廓資料計算用於重建音訊信號之第二訊框的時間扭曲控制資訊,該第二訊框與該第一訊框重疊或不重疊。當與該等第二複數時間扭曲輪廓部分相比較時,該等第一複數時間扭曲輪廓部分相對於時間移位。該等第一複數時間扭曲輪廓部分包含至少一個具有第二複數時間扭曲輪廓部分之共用時間扭曲輪廓部分。已發現的是,本發明重新依比例調整方法帶來特別的優點,若時間扭曲輪廓的重疊部分(第一複數時間扭曲輪廓部分及第二複數時間扭曲輪廓部分)用於獲得用於重建不同音訊訊框(第一訊框及第二訊框)的時間扭曲控制資訊。若時間扭曲輪廓的重疊部分用於獲得時間扭曲控制資訊,透過重新依比例調整所獲得的時間扭曲輪廓的連續性帶來特別的優點,因為如果時間扭曲輪廓存在任何不連續的話,使用時間扭曲輪廓的重疊部分可能導致嚴重的降級結果。
在又一較佳實施例中,時間扭曲輪廓計算器被組配成產生一新時間扭曲輪廓,藉此該時間扭曲輪廓在第一複數時間扭曲輪廓部分或第二複數時間扭曲輪廓部分中的一位置處從預定扭曲輪廓初始值重新開始,使得在一重新開始位置處有一時間扭曲輪廓的不連續。為了補償這種不連續,時間扭曲輪廓重新調整器被組配成重新依比例調整時間扭曲輪廓,使得不連續被減小或消除。
在再一較佳實施例中,時間扭曲輪廓計算器被組配成產生時間扭曲輪廓,使得在該等第一複數時間扭曲輪廓部分中的一位置處存在從預定時間扭曲輪廓初始值開始的時間扭曲輪廓的第一重新開始,藉此在該第一重新開始位置處存在第一不連續。在這種情況下,時間扭曲輪廓重新調整器被組配成重新依比例調整時間扭曲輪廓,使得該第一不連續被減小或消除。時間扭曲計算器進一步亦被組配成產生時間扭曲輪廓,藉此存在時間扭曲輪廓從預定時間扭曲輪廓初始值的第二重新開始,使得該第二重新開始位置處存在第二不連續。重新調整器亦被組配成重新依比例調整時間扭曲輪廓,使得該第二不連續被減小或消除。
換言之,有時具有大量的時間扭曲輪廓重新開始是較佳的,例如每一音訊訊框一個重新開始。以此方式,處理演算法可以是非常規則的。同樣地,值的範圍可被保持相當小。
在另一較佳實施例中,時間扭曲計算器被組配成從預定時間扭曲輪廓初始值開始週期性地重新開始時間扭曲輪廓,使得在該重新開始處有一不連續。重新調整器適於重新依比例調整時間扭曲輪廓的至少一部分,以減小或消除在該重新開始處的時間扭曲輪廓的不連續。音訊信號解碼器包含一時間扭曲控制資訊計算器,該時間扭曲控制資訊計算器被組配成組合始於一重新開始之前的依比例調整時間扭曲輪廓資料與始於該重新開始之後的時間扭曲輪廓資料,以獲得時間扭曲控制資訊。
在又一較佳實施例中,時間扭曲輪廓計算器被組配成接收一編碼扭曲比資訊,以從該編碼扭曲比資訊得出一扭曲比值序列,以及獲得從該扭曲輪廓初始值開始的複數個扭曲輪廓節點值。與扭曲輪廓起始點相關聯的扭曲輪廓初始值與扭曲輪廓節點值之比由扭曲比值決定。已顯示根據一扭曲比值序列的時間扭曲輪廓重建帶來許多相當好的結果,因為扭曲比值以一相當有效的方式編碼時間扭曲輪廓的相對變化,而這是應用時間扭曲的關鍵資訊。因此,扭曲比資訊已被發現是時間扭曲輪廓演化的相當有效描述。
在再一較佳實施例中,時間扭曲輪廓計算器被組配成根據包含扭曲輪廓初始值與中間扭曲輪廓節點的扭曲輪廓節點值之比及中間扭曲輪廓節點的扭曲輪廓節點值與所特定扭曲輪廓節點的扭曲輪廓值之比作為因數的乘積資訊,計算以中間扭曲輪廓節點與時間扭曲輪廓起始點隔開的特定扭曲輪廓節點的扭曲輪廓節點值。已發現的是,扭曲輪廓節點值可使用複數個扭曲比值的乘法運算以一特別有效方式被計算。同樣地,使用此一乘法運算提供扭曲輪廓的重建,這非常適於扭曲輪廓的理想特性。
根據本發明的另一實施例產生一時間扭曲輪廓資料提供器,該時間扭曲輪廓資料提供器用於根據時間扭曲輪廓演化資訊提供表示一音訊信號的相對音距之時間演化的時間扭曲輪廓資料。該時間扭曲輪廓資料提供器包含一被組配成根據描述時間扭曲輪廓之時間演化的時間扭曲輪廓演化資訊產生時間扭曲輪廓資料的一時間扭曲輪廓計算器。該時間扭曲輪廓計算器被組配成在重新開始位置處一再地或週期性地重新開始從一預定時間扭曲輪廓初始值計算時間扭曲輪廓資料,藉此產生時間扭曲輪廓的不連續以及減小時間扭曲輪廓資料值的範圍。時間扭曲輪廓資料提供器進一步包含一時間扭曲輪廓重新調整器,該時間扭曲輪廓重新調整器被組配成一再地重新依比例調整時間扭曲輪廓的複數個部分,以在時間扭曲輪廓的重新依比例調整部分中減小或消除重新開始位置處的不連續。該時間扭曲輪廓資料提供器係基於如同上述音訊信號解碼器的相同概念。
根據本發明的又一實施例產生一種根據編碼音訊信號 表現型態提供一解碼音訊信號表現型態的方法。
本發明的再一實施例設計一種用於根據一編碼音訊信號表現型態提供一解碼音訊信號的電腦程式。
圖式簡單說明
根據本發明的實施例將參考所包含圖式連續地予以描述,其中:第1圖顯示一時間扭曲音訊編碼器的方塊概要圖;第2圖顯示一時間扭曲音訊解碼器的方塊概要圖;第3圖顯示根據本發明之一實施例的一音訊信號解碼器的方塊概要圖;第4圖顯示根據本發明之一實施例的用於提供解碼音訊信號表現型態之方法的流程圖;第5圖顯示根據本發明之一實施例的從一音訊信號解碼器之方塊概要圖的詳細摘錄;第6圖顯示根據本發明之一實施例的從用於提供解碼音訊信號表現型態之方法的流程圖的詳細摘錄;第7a圖、第7b圖顯示根據本發明之一實施例的重建時間扭曲輪廓的圖形表現型態;第8圖顯示根據本發明之一實施例的重建時間扭曲輪廓的另一圖形表現型態;第9a圖、第9b圖顯示用於計算時間扭曲輪廓的演算法;第9c圖顯示從一時間扭曲比索引到一時間扭曲比值之映射表;第10a圖及第10b圖顯示用於計算時間輪廓、樣本位 置、過渡長度、「第一位置」及「最後位置」之演算法的表現型態;第10c圖顯示用於視窗形狀計算之演算法的表現型態;第10d圖及第10e圖顯示用於一視窗之應用之演算法的表現型態;第10f圖顯示用於時變重新取樣之演算法的表現型態;第10g圖顯示用於後時間扭曲訊框處理及用於重疊與相加之演算法的圖形表現型態;第11a圖及第11b圖顯示一圖例;第12圖顯示可從一時間扭曲輪廓擷取之一時間輪廓的圖形表現型態;第13圖顯示根據本發明之一實施例提供扭曲輪廓之裝置的詳細方塊概要圖;第14圖顯示根據本發明之另一實施例的一音訊信號解碼器的方塊概要圖;第15圖顯示根據本發明之一實施例的另一時間扭曲輪廓計算器的方塊概要圖;第16a圖及第16b圖顯示根據本發明之一實施例的計算時間扭曲節點值的圖形表現型態;第17圖顯示根據本發明之一實施例的另一音訊信號編碼器的方塊概要圖;第18圖顯示根據本發明之一實施例的另一音訊信號解碼器的方塊概要圖;以及第19a-19f圖顯示根據本發明之一實施例的一音訊串流 之語法元素的表現型態。
實施例之詳細描述 1. 根據第1圖的時間扭曲音訊編碼器
因為本發明與時間扭曲音訊編碼及時間扭曲音訊解碼有關,可實施本發明之一原型時間扭曲音訊編碼器及一時間扭曲音訊解碼器的簡略概述將被提出。
第1圖顯示一時間扭曲音訊編碼器的方塊概要圖,其中本發明的一些層面及實施例可在該時間扭曲音訊編碼器中被整合。第1圖中的音訊信號編碼器100被組配成接收一輸入音訊信號110及在一訊框序列中提供該輸入音訊信號110的一編碼表現型態。音訊編碼器100包含一取樣器104,該取樣器104適於對音訊信號110(輸入信號)取樣,以得到被用作頻域轉換之基礎的信號區塊(取樣表現型態)105。音訊編碼器100進一步包含一轉換視窗計算器106,該轉換視窗計算器106適於得到用於從取樣器104輸出之取樣表現型態105的調整視窗。這些被輸入到一視窗化程式(windower)108中,該視窗化程式108適於將調整視窗施加到從取樣器104得到的取樣表現型態105。在一些實施例中,音訊編碼器100可額外地包含一頻域轉換器108a,以得到取樣且調整表現型態105的頻域表現型態(例如以轉換係數形式)。該頻域表現型態可被處理或進一步作為音訊信號110的編碼表現型態被傳送。
音訊編碼器100進一步使用可被提供給音訊編碼器100 或可透過音訊編碼器100得到之音訊信號110的音距輪廓112。因此音訊編碼器100可選擇性地包含用於得到音距輪廓112的一音距估計器。該取樣器104可在輸入音訊信號110的一連續表現型態上操作。可選擇性地,取樣器104可在輸入音訊信號110的一已取樣表現型態上操作。在後一種情況下,取樣器104可對音訊信號110重新取樣。取樣器104可例如適於時間扭曲相鄰重疊音訊區塊,藉此重疊部分在取樣後的每一輸入區塊中具有一恆定音距或被減小音距變化。
轉換視窗計算器106依據由取樣器104所執行的時間扭曲得到音訊區塊的調整視窗。為了達到這個目的,一可任擇取樣率調整方塊114可能是存在的,以定義取樣器所使用的時間扭曲規則,該時間扭曲規則而後也被提供給轉換視窗計算器106。在一備選實施例中,取樣率調整方塊114可被省略,且音距輪廓112可被直接提供給轉換視窗計算器106,該轉換視窗計算器106本身可執行合適的計算。再者,取樣器104可將所施加的取樣動作傳送至轉換視窗計算器106,以致能合適調整視窗的計算。
時間扭曲被執行,使得由取樣器104扭曲與取樣的取樣音訊區塊的音距輪廓較輸入區塊中的原始音訊信號110的音距輪廓恆定。
2. 根據第2圖的時間扭曲音訊解碼器
第2圖顯示一時間扭曲音訊解碼器200的方塊概要圖,其中該時間扭曲音訊解碼器200用於處理一音訊信號之第一與第二訊框的第一時間扭曲且取樣或簡單時間扭曲表現 型態,其中該音訊信號具有一訊框序列,其中第二訊框接著第一訊框,且用於進一步處理該第二訊框及接著該訊框序列中的該第二訊框的第三訊框的第二時間扭曲表現型態。音訊解碼器200包含一轉換視窗計算器210,該轉換視窗計算器210適於使用關於第一與第二訊框之音距輪廓212的資訊得到用於第一時間扭曲表現型態211a的第一調整視窗,以及使用關於第二與第三訊框之音距輪廓的資訊得到用於第二時間扭曲表現型態211b的第二調整視窗,其中該等調整視窗可能具有相同數目的樣本,且其中用來淡出第一調整視窗的第一數目的樣本可能不同於用來淡出第二調整視窗的第二數目的樣本。音訊解碼器200進一步包含一視窗化程式216,該視窗化程式216適於將第一調整視窗施加到第一時間扭曲表現型態,以及將第二調整視窗施加到第二時間扭曲表現型態。音訊解碼器200此外還包含一重新取樣器218,該重新取樣器218適於反時間扭曲第一比例調整時間扭曲表現型態,以使用關於第一與第二訊框之音距輪廓的資訊得到第一取樣表現型態,以及反時間扭曲第二比例調整時間扭曲表現型態,以使用關於第二與第三訊框之音距輪廓的資訊得到第二取樣表現型態,藉此與第二訊框對應的第一取樣表現型態的一部分包含一音距輪廓,該音距輪廓在一預定容限範圍內等於與第二訊框對應的第二取樣表現型態之該部分的音距輪廓。為了得到調整視窗,轉換視窗計算器210可直接接收音距輪廓212,或從一可任擇取樣率調整器220接收關於時間扭曲的資訊,取樣率調整器 220接收音距輪廓212且以此一方式得到一反時間扭曲策略,即在重疊區域中的音距變得相同,且選擇性地,在反時間扭曲之前的重疊視窗部分的不同衰落長度與在反時間扭曲後的長度變得相同。
音訊解碼器200此外還包含一可任擇加法器230,該加法器230適於將與第二訊框對應的第一取樣表現型態的該部分加入到與第二訊框對應的第二取樣表現型態的該部分,以得到音訊信號之第二訊框的一重建表現型態作為一輸出信號242。在一個實施例中,第一時間扭曲表現型態與第二時間扭曲表現型態可被提供作為音訊解碼器200的輸入。在另一實施例中,音訊解碼器200可選擇性地包含一反頻域轉換器240,該反頻域轉換器240可從被提供到該反頻域轉換器240之輸入端的第一與第二時間扭曲表現型態的頻域表現型態得到第一與第二時間扭曲表現型態。
3. 根據第3圖的時間扭曲音訊信號解碼器
在下文中,將予以描述一簡化音訊信號解碼器。第3圖顯示這一簡化音訊信號解碼器300的方塊概要圖。該音訊信號解碼器300被組配成接收編碼音訊信號表現型態310,並據以提供一解碼音訊信號表現型態312,其中該編碼音訊信號表現型態310包含一時間扭曲輪廓演化資訊。該音訊信號解碼器300包含一時間扭曲輪廓計算器320,該時間扭曲輪廓計算器320被組配成根據時間扭曲輪廓演化資訊316產生時間扭曲輪廓資料322,該時間扭曲輪廓演化資訊描述時間扭曲輪廓的時間演化,且該時間扭曲輪廓演化資訊被編碼 音訊信號表現型態310所包含。當從時間扭曲輪廓演化資訊316得到時間扭曲輪廓資料322時,時間扭曲輪廓計算器320從一預定時間扭曲輪廓初始值一再地重新開始,這將在下文中予以詳細地描述。重新開始可能具有時間扭曲輪廓包含不連續(大於透過時間扭曲輪廓演化資訊316編碼之步驟的逐步改變)之結果。音訊信號解碼器300進一步包含一時間扭曲輪廓資料重新調整器330,該時間扭曲輪廓資料重新調整器330被組配成重新依比例調整時間扭曲輪廓資料322的至少一部分,藉此在時間扭曲輪廓的重新調整版本332中,在時間扭曲輪廓計算之重新開始處的不連續被避免、減小或消除。
音訊信號解碼器300也包含一扭曲解碼器340,該扭曲解碼器340被組配成根據編碼音訊信號表現型態310且使用時間扭曲輪廓的重新調整版本332提供一解碼音訊信號表現型態312。
為了將音訊信號解碼器300放入到時間扭曲音訊解碼之脈絡中,應注意的是,編碼音訊信號表現型態310可包含轉換係數211的一編碼表現型態,而且也包含音距輪廓212(也被指定為時間扭曲輪廓)的一編碼表現型態。時間扭曲輪廓計算器320與時間扭曲輪廓資料重新調整器330可被組配成時間扭曲輪廓的重新調整版本332之形式提供音距輪廓212的重建表現型態。扭曲解碼器340可例如接管視窗化216、重新取樣218、取樣率調整220以及視窗形狀調整210的功能。再者,扭曲解碼器340可例如選擇性地包含反轉換 240及重疊/相加230的功能,藉此解碼音訊信號表現型態312可能與時間扭曲音訊解碼器200的輸出音訊信號232等效。
透過將重新依比例調整施加到時間扭曲輪廓資料322,時間扭曲輪廓的一連續(或至少近似連續)的重新調整版本332可被獲得,從而保證數值上溢或下溢被避免,甚至當使用對編碼有效的相對時間扭曲輪廓演化資訊時亦然。
4. 根據第4圖的一種用於提供解碼音訊信號表現型態的方法。
第4圖顯示根據包含時間扭曲輪廓演化資訊的編碼音訊信號表現型態提供解碼音訊信號表現型態之方法的流程圖,該流程可藉根據第3圖的裝置300執行。方法400包含第一步驟410,該第一步驟410根據描述時間扭曲輪廓之時間演化的時間扭曲輪廓演化資訊從一預定時間扭曲輪廓初始值一再地重新開始產生時間扭曲輪廓資料。
方法400進一步包含一步驟420,該步驟420重新依比例調整時間扭曲控制資料的至少一部分,藉此在時間扭曲輪廓的重新調整版本中,在其中的一個重新開始處的不連續被避免、減小或消除。
方法400進一步包含根據編碼音訊信號表現型態且使用時間扭曲輪廓的重新調整版本提供解碼音訊信號表現型態的一步驟430。
5. 參考第5-9圖且根據本發明之一實施例的詳細描述
在下文中,根據本發明的一實施例將參考第5-9圖詳細 地予以描述。
第5圖顯示一裝置500方塊概要圖,該裝置500根據時間扭曲輪廓演化資訊510提供時間扭曲控制資訊512。裝置500包含根據時間扭曲輪廓演化資訊510提供重建時間扭曲輪廓資訊522的一裝置520,以及根據重建時間扭曲輪廓資訊522提供時間扭曲控制資訊512的一時間扭曲控制資訊計算器530。
提供重建時間扭曲輪廓資訊的裝置520
在下文中,裝置520的結構與功能將予以描述。裝置520包含一時間扭曲輪廓計算器540,該時間扭曲輪廓計算器540被組配成接收時間扭曲輪廓演化資訊510,並據以提供一新扭曲輪廓部分資訊542。例如,針對將被重建的每一音訊信號訊框,一組時間扭曲輪廓演化資訊可被傳送至裝置500。然而,與將被重建的一音訊信號訊框相關聯的該組時間扭曲輪廓演化資訊510可被用於重建複數個音訊信號訊框。類似地,多組時間扭曲輪廓演化資訊可被用於重建一單一音訊信號訊框的音訊內容,這將在下文中予以詳細地討論。作為結論,在一些實施例中可陳述為,時間扭曲輪廓演化資訊510可以一速率被更新,音訊信號的複數個轉換域係數組將以該同一速率被重建或更新(每一音訊信號訊框一個時間扭曲輪廓部分)。
時間扭曲輪廓計算器540包含一扭曲節點值計算器544,該扭曲節點值計算器544被組配成複數個根據(或一時間序列)時間扭曲輪廓比值(或時間扭曲比索引)計算複數個(或一時間序列)扭曲輪廓節點值,其中時間扭曲比值(或索引)由時間扭曲輪廓演化資訊510所組成。為了達到這一目的,扭曲節點值計算器544被組配成一預定初始值(例如1)開始提供時間扭曲輪廓節點值,以及使用時間扭曲輪廓比值計算隨後的時間扭曲輪廓節點值,這將在下文中予以討論。
再者,時間扭曲輪廓計算器540選擇性地包含一內插器548,該內插器548被組配成在接續的時間扭曲輪廓節點值之間內插。因此,新時間扭曲輪廓部分的描述542被獲得,其中該新時間扭曲輪廓部分典型地從扭曲節點值計算器544所使用的預定初始值開始。此外,裝置520被組配成考慮額外的時間扭曲輪廓部分,即用於提供全部時間扭曲輪廓部分的一所謂的「最後時間扭曲輪廓部分」及一所謂的「目前時間扭曲輪廓部分」。為了達到這一目的,裝置520被組配成將該所謂的「最後時間扭曲輪廓部分」及該所謂的「目前時間扭曲輪廓部分」儲存在沒有在第5圖中顯示的一記憶體中。
然而,裝置520也包含一重新調整器550,該重新調整器550被組配成重新依比例調整該「最後時間扭曲輪廓部分」及該「目前時間扭曲輪廓部分」,以避免(或減小、或消除)基於「最後時間扭曲輪廓部分」、「目前時間扭曲輪廓部分」及「新時間扭曲輪廓部分」之全部時間扭曲輪廓部分中的任何不連續。為了達到這一目的,重新調整器550被組配成接收「最後時間扭曲輪廓部分」及「目前時間扭曲輪廓部分」的所儲存描述,以及共同地重新依比例調整該「最後時間扭曲輪廓部分」及該「目前時間扭曲輪廓部分」,以獲得該「最後時間扭曲輪廓部分」及該「目前時間扭曲輪廓部分」的重新調整版本。與重新調整器550所執行的重新依比例調整有關的細節將參考第7a圖、第7b圖及第8圖在下文中予以討論。
此外,重新調整器550也可被組配成例如從沒有在第5圖中顯示的一記憶體接收與「最後時間扭曲輪廓部分」相關聯的一和值及與「目前時間扭曲輪廓部分」相關聯的另一和值。這些和值有時分別用“last_warp_sum”及“cur_warp_sum”標明。重新調整器550被組配成使用一重新比例調整因數重新依比例調整與時間扭曲輪廓部分相關聯的和值,其中對應的時間扭曲輪廓部分用該同一重新比例調整因數來重新依比例調整。因此,重新比例調整和值被獲得。
在一些情況下,裝置520可包含一更新器560,該更新器560被組配成一再地更新重新調整器550的時間扭曲輪廓部分輸入且亦更新重新調整器550的和值輸入。例如,更新器560可被組配成訊框速率更新該資訊。例如,目前訊框週期的「新時間扭曲輪廓部分」可作為下一訊框週期中的「目前時間扭曲輪廓部分」。類似地,目前訊框週期的重新依比例調整的「目前時間扭曲輪廓部分」可作為下一訊框週期中的「最後時間扭曲輪廓部分」。因此,一記憶體有效實施態樣被產生,因為目前訊框週期的「最後時間扭曲輪廓部分」可能在目前訊框週期完成以後被丟棄。
綜上所述,裝置520被組配成為每一訊框週期(一些特別訊框週期除外,例如在訊框序列開始、或在訊框序列結束、或在時間扭曲不作用的訊框中)提供包含一「新時間扭曲輪廓部分」、一「重新依比例調整目前時間扭曲輪廓部分」及一「重新依比例調整最後時間扭曲輪廓部分」之描述的時間扭曲輪廓部分的描述。此外,裝置520可為每一訊框週期(上述特別訊框週期除外)提供例如包含一「新時間扭曲輪廓部分和值」、一「重新依比例調整目前時間扭曲輪廓和值」及一「重新依比例調整最後時間扭曲輪廓和值」的扭曲輪廓和值之表現型態。
時間扭曲控制資訊計算器530被組配成根據裝置520所提供的重建時間扭曲輪廓資訊計算時間扭曲控制資訊512。例如,時間扭曲控制資訊計算器包含一時間輪廓計算器570,該時間輪廓計算器570被組配成根據重建時間扭曲控制資訊計算時間輪廓572。再者,時間扭曲輪廓資訊計算器530包含一樣本位置計算器574,該樣本位置計算器574被組配成接收時間輪廓572並據以例如以樣本位置向量576之形式提供樣本位置資訊。樣本位置向量576描述例如由重新取樣器218所執行的時間扭曲。
時間扭曲控制資訊計算器530也包含一過渡長度計算器,該過渡長度計算器被組配成從重建時間扭曲控制資訊得到過渡長度資訊。過渡長度資訊582可例如包含描述左過渡長度的資訊以及描述右過渡長度的資訊。過渡長度可例如依據由「最後時間扭曲輪廓部分」、「目前時間扭曲輪廓部分」及「新時間扭曲輪廓部分」所描述的時間部分的長度。例如,若由「最後時間扭曲輪廓部分」所描述之時間部分的時間擴展較由「目前時間扭曲輪廓部分」所描述之時間部分的時間擴展短,或若由「新時間扭曲輪廓部分」所描述之時間部分的時間擴展較由」目前時間扭曲輪廓部分「所描述之時間部分的時間擴展短,則過渡長度可被縮短(當與預設過渡長度相比較時)。
此外,時間扭曲控制資訊計算器530可進一步包含第一與最後位置計算器584,該第一與最後位置計算器584被組配成左及右過渡長度為基礎計算所謂的「第一位置」與所謂的「最後位置」。「第一位置」與「最後位置」增加重新調整器的效率,因為在視窗化以後,這些位置以外的區域與零相同,從而不需要被考慮用於時間扭曲。在這裡應注意的是,樣本位置向量576包含例如由重新調整器280所執行之時間扭曲所需要的資訊。此外,左與右過渡長度582及「第一位置」與「最後位置」586組成例如為視窗化程式216所需要的資訊。
因此,可以說裝置520與時間扭曲控制資訊計算器530可一起接管取樣率調整220、視窗形狀調整210及樣本位置計算219的功能。
在下文中,音訊解碼器的功能包含裝置520,且時間扭曲控制資訊計算器530將參考第6圖、第7a圖、第7b圖、第8圖、第9a-9c圖、第10a-10g圖、第11a圖、第11b圖及第12圖予以描述。
第6圖顯示根據本發明之一實施例的用於解碼音訊信號之編碼表現型態之方法的流程圖。方法600包含提供一重建時間扭曲輪廓資訊,其中提供重建時間扭曲輪廓資訊之該步驟包含計算610扭曲節點值、在扭曲節點值之間內插620以及重新依比例調整630一個或複數個先前計算的扭曲輪廓部分及一個或複數先前計算的扭曲輪廓和值。該方法600進一步包含使用在第610步及第620步所獲得的「新時間扭曲輪廓部分」、重新依比例調整的先前計算的時間扭曲輪廓部分(「目前時間扭曲輪廓部分」及「最後時間扭曲輪廓部分」)也選擇性地使用該重新依比例調整的先前計算的扭曲輪廓和值計算640時間扭曲控制資訊。結果,時間輪廓資訊、及/或樣本位置資訊、及/或過渡長度資訊及/或第一位置與最後位置資訊可在第640步被獲得。
方法600進一步包含使用在第640步所獲得的時間扭曲控制資訊執行650時間扭曲信號重建。與時間扭曲信號重建有關的細節隨後將予以描述。
方法600也包含更新記憶體的一步驟660,這將在下文中予以描述。
時間扭曲輪廓部分之計算
在下文中,與時間扭曲輪廓部分之計算有關的細節將參考第7a圖、第7b圖、第8圖、第9a圖、第9b圖、第9c圖予以描述。
將假設一初始狀態是存在的,這在第7a圖的圖形表現型態710中予以繪示。可看出的是,第一扭曲輪廓部分716(扭曲輪廓部分1)與第二扭曲輪廓部分718(扭曲輪廓部分2)是存在的。每一扭曲輪廓部分通常包含通常儲存在一記憶體中的複數個離散扭曲輪廓資料值。不同的扭曲輪廓資料值與複數個時間值相關聯,其中時間在橫坐標712處被顯示。扭曲輪廓資料值的幅度在縱坐標714處被顯示。可看出的是,第一扭曲輪廓部分具有一結束值1,而第二扭曲輪廓部分具有一初始值1,其中值1可被認為是一「預定值」。應注意的是,第一扭曲輪廓部分716可被認為是一「最後時間扭曲輪廓部分」(也被指定為“last_warp_contour”),而第二扭曲輪廓部分718可被認為是一「目前時間扭曲輪廓部分」(也被稱為“cur_warp_contour”)。
從該初始狀態開始,一新扭曲輪廓部分例如在方法600的第610步、第620步被計算。因此,第三扭曲輪廓部分的扭曲輪廓資料值(也被指定為「扭曲輪廓部分3」或「新時間扭曲輪廓部分」或“new_warp_contour”)被計算。該計算可例如根據在第9a圖中所示的演算法910被分成扭曲節點值的計算,及根據在第9a圖中所示的演算法920的在扭曲節點值之間的內插620。因此,一新扭曲輪廓部分722被獲得,該新扭曲輪廓部分722從預定值(例如1)開始且被顯示在第7a圖的圖形表現型態720中。可看出的是,第一時間扭曲輪廓部分716、第二時間扭曲輪廓部分718及第三時間扭曲輪廓部分與相繼且連續的時間區間相關聯。再者,可看出的是,在第二時間扭曲輪廓部分718的結束點718b與第三時間扭曲輪廓部分的起始點722a之間存在一不連續724。
應注意的是,不連續724通常包含一幅度,該幅度大於一時間扭曲輪廓部分中的時間扭曲輪廓之任何兩個時間相鄰扭曲輪廓資料值之間的變化。這是由於第三時間扭曲輪廓部分722的初始值722a被施加為預定值(例如1)且與第二時間扭曲輪廓部分718的結束值718b相獨立的事實。應注意的是,不連續724從而大於兩個相鄰、離散扭曲輪廓資料值之間的不可避免的變化。
然而,第二時間扭曲輪廓部分718與第三時間扭曲輪廓部分722之間的這一不連續對於時間扭曲輪廓資料值的進一步使用而言將是不利的。
因此,在方法600的第630步驟,第一時間扭曲輪廓部分與第二時間扭曲輪廓部分被共同地重新依比例調整。例如,第一時間扭曲輪廓部分716的時間扭曲輪廓資料值及第二時間扭曲輪廓部分718的時間扭曲輪廓資料值透過與一重新比例調整因數(也被指定為“norm_fac”)相乘來重新依比例調整。因此,第一時間扭曲輪廓部分716的一重新調整版本716'被獲得,且第二時間扭曲輪廓部分718的一重新調整版本718'也被獲得。相反,在這一重新依比例調整步驟,第三時間扭曲輪廓部分的左側通常不受影響,這可在第7a圖的圖形表現型態730中看出。重新比例調整可被執行,藉此重新比例調整結束點718b'包含與第三時間扭曲輪廓部分722的起始點722a至少近似相同的資料值。因此,第一時間扭曲輪廓部分的重新調整版本716'、第二時間扭曲輪廓部分的重新調整版本718'及第三時間扭曲輪廓部分722一起形成一(近似)連續的時間扭曲輪廓部分。特別地,該比例調整可被執行,藉此重新比例調整結束點718b'與起始點722a的資料值之間的差值不大於時間扭曲輪廓部分716'、718'、722之任何兩個相鄰資料值之間的差值。
因此,近似連續的時間扭曲輪廓部分包含重新依比例調整的時間扭曲輪廓部分716'、718',且原始時間扭曲輪廓部分722被用於計算在第640步被執行的時間扭曲控制資訊。例如,針對與第二時間扭曲輪廓部分718時間相關聯的音訊訊框,時間扭曲控制資訊可被計算。
然而,在第640步計算時間扭曲控制資訊之後,在第650步,一時間扭曲信號重建可被執行,這將在下文中較詳細地解釋。
隨後,需要獲得下一音訊訊框的時間扭曲控制資訊。為了達到這一目的,第一時間扭曲輪廓部分的重新調整版本716'可被摒棄以節省記憶體,因為其不再被需要。然而,重新調整版本716'自然也可被保存用於任何目的。此外,在新的計算上以第二時間扭曲輪廓部分的重新調整版本718'代替「最後時間扭曲輪廓部分」,這在第7b圖中的圖形表現型態740中可看出。再者,代替先前計算中之「新時間扭曲輪廓部分」的第三時間扭曲輪廓部分722在下一計算中作用為「目前時間扭曲輪廓部分」。關聯性在圖形表現型態740中被顯示。
繼記憶體的這一更新(方法600的第660步)之後,一新時間扭曲輪廓部分752被計算,這可在圖形表現型態750中看出。為了達到這一目的,方法600的第610步及第620步可在新的輸入資料下被重新執行。第四時間扭曲輪廓部分752目前扮演「新時間扭曲輪廓部分」的角色。如所看出的,在第三時間扭曲輪廓部分的結束點722b與第四時間扭曲輪廓部分752的起始點752a之間通常存在不連續。這一不連續754透過隨後重新依比例調整(方法600的第630步)第二時間扭曲輪廓部分的重新調整版本718'及第三時間扭曲輪廓部分722的原始版本來減小或消除。因此,第二時間扭曲輪廓部分的一兩次重新調整版本718"及第三時間扭曲輪廓部分的一次重新調整版本722'被獲得,這可從第7b圖中的圖形表現型態760看出。如所看出的,時間扭曲輪廓部分718"、722'、752形成一至少近似連續的時間扭曲輪廓部分,該時間扭曲輪廓部分用於在重新執行第640步時計算時間扭曲控制資訊。例如,時間扭曲控制資訊可根據時間扭曲輪廓部分718"、722'、752被計算,該時間扭曲控制資訊與集中在第二時間扭曲輪廓部分上的一音訊信號時間訊框相關聯。
應注意的是,在一些情況下,期望每一時間扭曲輪廓部分具有一相關聯扭曲輪廓和值。例如,第一扭曲輪廓和值可能與第一時間扭曲輪廓部分相關聯、第二扭曲輪廓和值可能與第二時間扭曲輪廓部分相關聯等等。該等扭曲輪廓和值可例如用於在第640步計算時間扭曲控制資訊。
例如,扭曲輪廓和值可代表各自時間扭曲輪廓部分之扭曲輪廓資料值的和。然而,因為時間扭曲輪廓部分被依比例調整,有時期望也依比例調整時間扭曲輪廓和值,藉此時間扭曲輪廓和值採用其相關聯時間扭曲輪廓部分的特性。因此,當第二時間扭曲輪廓部分718被依比例調整以獲得其調整版本718'時,與該第二時間扭曲輪廓部分718相關聯的扭曲輪廓和值可被依比例調整(例如透過相同的比例調整因數)。類似地,當第一時間扭曲輪廓部分716被依比例調整以獲得其調整版本716'時,與該第一時間扭曲輪廓部分716相關聯的扭曲輪廓和值可被依比例調整(例如透過相同的比例調整因數),如果期望的話。
再者,當繼續考慮新時間扭曲輪廓部分時,一重新相關聯(或記憶體重新配置)可被執行。例如,扮演用於計算與時間扭曲輪廓部分716'、718'、722相關聯之時間扭曲控制資訊的「目前時間扭曲輪廓和值」之角色的與第二時間扭曲輪廓部分的調整版本718'相關聯的扭曲輪廓和值可被認為是用於計算與時間扭曲輪廓部分718"、722'、752相關聯之時間扭曲控制資訊的「最後時間扭曲和值」。類似地,與第三時間扭曲輪廓部分722相關聯的扭曲輪廓和值可被認為是用於計算與時間扭曲輪廓部分716'、718'、722相關聯之時間扭曲控制資訊的「新扭曲輪廓和值」且可被映射以作為用於計算與時間扭曲輪廓部分718"、722'、752相關聯之時間扭曲控制資訊的「目前扭曲輪廓和值」。再者,第四時間扭曲輪廓部分752的最新計算的扭曲輪廓和值可扮演用於計算與時間扭曲輪廓部分718"、722'、752相關聯之時間扭曲控制資訊的「新扭曲輪廓和值」之角色。
根據第8圖的例子
第8圖顯示繪示透過根據本發明的實施例解決之問題的圖形表現型態。第一圖形表現型態810顯示在一些習知實施例中被獲得的一重建相對音距隨時間逝去的時間演化。橫坐標812描述時間,縱坐標814描述相對音距。曲線816顯示可從相對音距資訊被重建的相對音距隨時間逝去的時間演化。關於相對音距輪廓的重建,應注意的是,對於應用時間扭曲修改型離散餘弦轉換(MDCT)而言,只是實際訊框中的音距的相對變化知識是必要的。為了理解這一點,現參考用於從相對音距輪廓獲得時間輪廓的計算步驟,該步驟針對相同的相對音距輪廓的調整版本產生相同的時間輪廓。因此,只編碼相對而非絕對音距值就足夠,而這增加了編碼效率。為了進一步增加效率,實際量化值不是相對音距而是音距中的相對改變,即目前相對音距與先前相對音距的比(這將在下文中詳細地討論)。在例如信號根本不顯示出諧波結構的一些訊框中,可能沒有時間扭曲是所期望的。在這些情況下,額外的旗標可選擇性地指示一平坦音距而非用上述方法編碼這一平坦輪廓。因為在現實世界的信號中,這些訊框的數量通常足夠高,在任何時候被加入的額外位元與保存用於非扭曲訊框的位元之間的折中有利於位元儲存。
用於計算音距變化(相對音距輪廓、或時間扭曲輪廓)的初始值可被任意地選擇,且甚至在編碼器與解碼器中會 是不同的。由於時間扭曲MDCT(TW-MDCT)的性質,音距變化的不同初始值仍然產生相同的樣本位置及適合的視窗形狀以執行TW-MDCT。
例如,一(音訊)編碼器獲得每一節點的音距輪廓,其在與連同一非必需之有聲/無聲規格的樣本中被表現為實際音距延遲,該有聲/無聲規格例如是透過應用從語音編碼所知的一音距估測及有聲/無聲判斷獲得。若對於目前節點而言,分類被設定為有聲,或無有聲/無聲決定可利用,則編碼器計算實際音距滯後間的比例並將其量化,或如果無聲則只設定該比為1。另一例子可能是音距變化透過一種合適方法(例如信號變化估計)直接估計。
在解碼器中,在編碼音訊之起始處的第一相對音距的初始值被設定為例如1的一任意值。因此,解碼相對音距輪廓不在在編碼器音距輪廓而是在其一調整版本的相同絕對範圍內。然而,如上所述,TW-MDCT演算法產生相同的樣本位置與視窗形狀。此外,若編碼音距比將產生一平坦音距輪廓,則編碼器可能決定不發送完全編碼輪廓,而是將activePitchData旗標設定為0,將位元保存在這一訊框中(例如將numPitchbits*numPitches位元保存在這一訊框中)。
在下文中,在不存在發明音距輪廓重新正規化之情況下發生的問題將予以討論。如上所述,對於TW-MDCT而言,只需要在圍繞目前區塊之某一有限時間間距範圍內的相對音距改變用於計算時間扭曲與正確的視窗形狀調適(參考上文的解釋)。時間扭曲針對檢測到音距改變的部分採 用解碼輪廓,並且在所有其他情況下保持恆定(參考第8圖的圖形表現型態810)。對於計算一個區塊的視窗與樣本位置而言,需要三個連續的相對音距輪廓部分(例如三個時間扭曲輪廓部分),其中第三個在訊框中最近被傳送的一者(被指定為「新時間扭曲輪廓部分」),而其他的兩個從過去被緩衝(例如被指定為「最後時間扭曲輪廓部分」與「目前時間扭曲輪廓部分」)。
為了獲得一例子,例如參考第7a圖及第7b圖以及第8圖的圖形表現型態810、860所做出的解釋。為了計算例如用於從訊框0延伸到訊框2之訊框1的(或與訊框1相關聯的)視窗的樣本位置,訊框0、1及2的(或與訊框0、1及2相關聯的)音距輪廓是需要的。在位元流中,只訊框2的音距資訊在目前訊框中被發送,而其他兩個從過去獲得。如在這裡所解釋的,透過將第一解碼相對音距比施加到訊框1的最後音距以獲得在訊框2之第一節點處的音距等等,音距輪廓可能是連續的。由於信號的性質,現在可能的是,若音距輪廓是簡單連續的(即若最近被傳送的輪廓部分被附接到現存的兩個部分而未加以任何修改),編碼器之內部數字格式中的範圍上溢在某一時間之後發生。例如,信號可能以具有強諧波特性及在開始處具有一高音距值的一部分開始,其中該高音距值在該部分中不斷減小,從而產生不斷減小的相對音距。然後可能接著不具有音距資訊的一部分,藉此相對音距保持恆定。然後,一諧波部分可再次以較先前部分中的最後絕對音距高的一絕對音距開始,且再次下降。然 而,若我們只使相對音距繼續,則其與在最後諧波部分的末尾處相同,且將進一步下降等等。若信號足夠強且具有一總體上升或下降趨勢的其諧波部分(如在第8圖的圖形表現型態810中所示),相對音距遲早要達到內部數字格式之範圍的邊界。從語音編碼所周知的是,語音信號的確顯示出此特性。因此,當使用上述的習知方法時,編碼包括在一相對短暫時間後實際超過用於相對音距之浮點數值範圍之語音的真實世界信號的一序連集合並不令人吃驚。
總之,對於其中音距可被決定之音訊信號部分(或訊框),相對音距輪廓(或時間扭曲輪廓)的合適演化可被決定。對於其中音距不可被決定(例如因為音訊信號部分是類雜訊)的音訊信號部分(或音訊信號訊框),相對音距輪廓(或時間扭曲輪廓)可被保持恆定。因此,若在具有不斷增加音距與不斷減小音距的音訊部分之間存在不平衡,則相對音距輪廓(或時間扭曲輪廓)將陷入數值下溢或數值上溢。
例如,在圖形表現型態810中,針對存在具有不斷減小音距的複數個相對音距輪廓部分820a、820b、820c、820d以及不具有音距的一些音訊部分822a、822b,而不存在具有不斷增加音距之音訊部分的情況,一相對音距輪廓被顯示。因此,可看出的是,相對音距輪廓816陷入數值下溢(至少在非常不利的情況下)。
在下文中,針對這一問題的解決方案將予以描述。為了避免上述問題,特別是數值下溢或上溢,根據本發明之一層面的一週期性相對音距輪廓重新正規化已被引入。因 為扭曲時間輪廓與視窗形狀的計算只依賴於上述三個相對音距輪廓部分(也被指定為「時間扭曲輪廓部分」)上的相對改變,如這裡所解釋的,用相同的結果重新正規化(例如音訊信號之)每一訊框的這一輪廓(例如可由三個「時間扭曲輪廓部分」組成的時間扭曲輪廓)是可能的。
為此,參考例如被選擇為第二輪廓部分(也被指定為「時間扭曲輪廓部分」)中的最後樣本,且輪廓現在以使這一樣本具有一值1.0之方式被正規化(例如在線性域中倍增)(參考第8圖中的圖形表現型態860)。
第8圖的圖形表現型態860表示相對音距輪廓正規化。橫坐標862顯示以訊框(訊框0、1、2)被再分的時間。縱坐標864描述相對音距輪廓的值。
在正規化之前的相對音距輪廓用870標明且覆蓋兩個訊框(例如訊框標編號0及訊框標編號1)。從預定相對音距輪廓初始值(或時間扭曲輪廓初始值)開始的一新相對音距輪廓部分(也被指定為「時間扭曲輪廓部分」)用874標明。如所看到的,新相對音距輪廓部分874從該預定相對音距輪廓初始值(例如1)的重新開始帶來在重新開始時間點之前的相對音距輪廓部分870與新相對音距輪廓部分874之間的不連續,該不連續用878標明。這一不連續將為從輪廓之任何時間扭曲控制資訊的導出帶來嚴重的問題,且可能將產生音訊失真。因此,先前所獲得的在重新開始時間點重新開始之前的相對音距輪廓部分870被重新依比例調整(或被正規化),以獲得一重新比例調整相對音距輪廓部分870'。該正 規化被執行,藉此相對音距輪廓部分870中的最後樣本被依比例調整為預定相對音距輪廓初始值(例如1.0)
演算法之詳細描述
在下文中,透過根據本發明之一實施例的一音訊解碼器執行的一些演算法將予以詳細地描述。為了達到這一目的,現參考第5圖、第6圖、第9a圖、第9b圖、第9c圖及第10a-10g圖。再者,參考第11a圖及第11b圖中的資料元素、幫助元素及常數的圖例。
一般而言,可以說在這裡所描述的方法可用於解碼根據一時間扭曲修改型離散餘弦轉換被編碼的音訊串流。因此,當TW-MDCT針對音訊流被致能時(這可由例如被稱為“twMdct”旗標的一旗標指示,該旗標可能被包含在一特定配置資訊中),一時間扭曲濾波器組與區塊交換可取代一標準濾波器組與區塊交換。除反改進離散餘弦轉換(IMDCT)之外,時間扭曲濾波器組與區塊交換包含從一任意間隔時間網格到正常規則間隔時間網格的時域到時域映射及視窗形狀的對應調適。
在下文中,解碼過程將被描述。在第一步,扭曲輪廓被解碼。扭曲輪廓可能例如使用扭曲輪廓節點的碼薄索引被編碼。扭曲輪廓節點的碼簿索引例如使用在第9a圖的圖形表現型態910中所示的演算法來解碼。根據該演算法,扭曲比值(warp_value_tbl)例如使用由第9c圖中的映射表990所定義的映射從扭曲比碼簿索引(tw-ratio)得到。如從參考數字910所示的演算法看出的是,若旗標(tw_data_present)指示時間扭曲資料不存在,則扭曲節點值可被設定為一恆定預定值。相反,若該旗標指示時間扭曲資料是存在的,則第一扭曲節點值可被設定為預定時間扭曲輪廓初始值(例如1)。(一時間扭曲輪廓部分的)接續的扭曲節點值可根據多重時間扭曲比值之一乘積來決定。例如,緊接第一扭曲節點(i=0)之一節點的扭曲節點值可等於第一扭曲比值(若初始值為1)或等於第一扭曲比值與初始值的乘積。接續的時間扭曲節點值(i=2、3、...、num_tw_nodes)透過形成多重時間扭曲比值(選擇性地考慮初始值,若初始值不等於1的話)的一乘積來計算。自然,乘積形成的順序是任意的。然而,透過將第i扭曲節點值乘以一單一扭曲比值而從第i扭曲節點值得到第(i+1)扭曲節點值是有利的,其中該單一扭曲比值描述時間扭曲輪廓的兩個接續節點值之間的比例。
如可從在參考數字910處所示的演算法看出的,對於一單一音訊訊框上的一單一時間扭曲輪廓部分而言,可能存在複數個扭曲比碼薄索引(其中在時間扭曲輪廓部分與音訊訊框之間可能存在一對一對應)。
總之,在第610步,針對一特定時間扭曲輪廓部分(或一特定音訊訊框),複數個時間扭曲節點值可例如使用扭曲節點值計算器544被獲得。隨後,一線性內插可在時間扭曲節點值(warp_node_values[i])之間被執行。例如,為了獲得「新時間扭曲輪廓部分」(new_warp_contour)的時間扭曲輪廓資料值,在第9a圖的參考數字920處所示的演算法可被使
用。例如,新時間扭曲輪廓部分中之樣本的數目等於反改進離散餘弦轉換之時域樣本之數目的一半。關於這一問題,應注意的是,相鄰音訊信號訊框通常被移位(至少近似)MDCT或IMDCT之時域樣本之數目的一半。換言之,為了獲得樣本式(N_long樣本)new_warp_contour[],warp_node_values[]使用在參考數字920處所示的演算法被線性內插在被相等間隔(interp_dist分開)的節點之間。
內插可以例如透過第5圖之裝置的內插器548或者在演算法600的第620步被執行。
在針對這一訊框(即目前在考慮中訊框)獲得全部扭曲輪廓之前,從過去被緩衝的值被重新依比例調整,藉此past_warp_contour[]的最後扭曲值等於1(或較佳地等於新時間扭曲輪廓部分之初始值的任何其他預定值)。
這裡應注意的是,術語「過去扭曲輪廓」較佳地包含上述「最後時間扭曲輪廓部分」及上述「目前時間扭曲輪廓部分」。也應注意的是,「過去扭曲輪廓」通常包含等於IMDCT中的一數目時域樣本的一長度,藉此「過去扭曲輪廓」的值用在0與2*n_long-1之間的索引來標明。因此,“past_warp_contour[2*n_long-1]”標明「過去扭曲輪廓」的一最後扭曲值。因此,正規化因子“norm_fac”可根據在第9a圖的參考數字930處所示的方程式來計算。因此,過去扭曲輪廓(包含「最後時間扭曲輪廓部分」與「目前時間扭曲輪廓部分」)可根據在第9a圖的參考數字932處所示的方程式來成倍地重新依比例調整。此外,「最後扭曲輪廓和值」(last_warp_sum)與「目前扭曲輪廓和值」(cur_warp_sum)可被成倍地重新依比例調整,如在第9a圖的參考數字934及936處所示。該重新依比例調整可由第5圖的重新調整器550或在第6圖之方法600的第630步被執行。
應注意的是,在這裡(例如在參考數字930處)所描述的正規化然後可被修改,例如透過用任何其他所期望的預定值取代初始值」1”。
透過施加正規化,也被標明為一「時間扭曲輪廓部分」的“full warp_contour[]”透過序連“past_warp_contour”與“new_warp_contour”來獲得。因此,三個時間扭曲輪廓部分(「最後時間扭曲輪廓部分」、「目前時間扭曲輪廓部分」及「新時間扭曲輪廓部分」)形成「全部扭曲輪廓」,這在進一步的計算步驟中可能被施加。
此外,一扭曲輪廓和值(new_warp_sum)被計算,例如作為所有“new_warp_contour[]”值的和。例如,新扭曲輪廓和值可根據在第9a圖的參考數字940處所示的演算法計算。
接著上述計算,被時間扭曲控制資訊計算器530或方法600的第640步所需要的輸入資訊是可得的。因此,時間扭曲控制資訊的計算640可例如透過時間扭曲控制資訊計算器530來執行。同樣地,時間扭曲信號重建650可透過音訊解碼器來執行。計算640與時間扭曲信號重建650兩者將在下文中較詳細地解釋。
然而,注意到本演算法一再地繼續進行是重要的。從而在計算上有效,以更新記憶體。例如,丟棄關於最後時間扭曲輪廓部分的資訊是可能的。再者,使用目前的「目前時間扭曲輪廓部分」作為下一計算週期中的「最後時間扭曲輪廓部分」是可取的。再者,使用目前的「新時間扭曲輪廓部分」作為下一計算週期中的「目前時間扭曲輪廓部分」是可取的。這一分配可使用在第9b圖的參考數字950處所示的方程式來做出,(其中warp_contour[n]描述目前的「新時間扭曲輪廓部分」,其中2*n_longn<3.n_long)。
合適的分配可在第9b圖的參考數字952及954處看到。
換言之,用於解碼下一訊框的記憶體緩衝器可根據在參考數字950、952及954處所示的方程式來更新。
應注意的是,若沒有針對一先前訊框產生合適的資訊,則根據方程式950、952及954的更新不提供合理的結果。因此,在解碼第一訊框之前,或若最後訊框用在交換編碼器之脈絡中的一不同類型編碼器(例如一LPC域編碼器)編碼,則記憶體的狀態可根據在第9b圖的參考數字960、962及964處所示的方程式來設定。
時間扭曲控制資訊的計算
在下文中,將簡要地描述時間扭曲控制資訊可如何根據時間扭曲輪廓(包含例如三個時間扭曲輪廓部分)及根據扭曲輪廓和值來計算。
例如,所期望的是使用時間扭曲輪廓來重建時間輪廓。為了達到這一目的,在第10a圖的參考數字1010、1012處所示的演算法可被使用。如所看出的,時間輪廓將一索引i(0i3.n_long)映射到一對應時間輪廓值上。這種映射的一例子被顯示在第12圖中。
基於時間輪廓的計算,通常需要計算樣本位置(sample_pos[]),該樣本位置描述以一線性時間依比例調整的時間扭曲樣本的位置。這種計算可使用在第10b圖的參考數字1030處所示的演算法來執行,在演算法1030中,在第10a圖的參考數字1020及1022處所示的輔助函數可被使用。因此,關於取樣時間的資訊可被獲得。
此外,時間扭曲過渡的一些長度(warp_trans_len_left;warped_trans_len_right)例如使用在第10b圖中所示的演算法1032來計算。選擇性地,時間扭曲過渡長度可依據視窗類型或轉換長度來調適,例如使用在第10b圖的參考數字1034處所示的演算法。此外,所謂的「第一位置」及所謂的「最後位置」可以根據過渡長度資訊,例如使用在第10b圖的參考數字1036處所示的演算法來計算。總之,可透過裝置530或在方法600的第640步被執行的樣本位置與視窗長度調整將被執行。從“warp_contour[]”,以一線性時間依比例調整的時間扭曲樣本的一樣本位置向量(“sample_pos[]”)可被計算。為此,首先,時間輪廓可使用在參考數字1010、1012處所示的演算法來產生。在參考數字1020及1022處所示的輔助函數“warp_in_vec()”及“warp_time_inv()”下,樣本位置向量(“sample_pos[]”)及過渡長度(“warped_trans_len_left”及“warped_trans_len_right”)被計算,例如使用在參考數字1030、1032、1034及1036處所示的演算法。因此,時間扭曲控制資訊512被獲得。
時間扭曲信號重建
在下文中,可根據時間扭曲控制資訊被執行的時間扭曲信號重建將被簡要地討論,以將時間扭曲輪廓的計算放入到合適的背景脈絡中。
音訊信號的重建包含執行在這裡沒有詳細描述的反改進離散餘弦轉換,因為其為本技藝領域中的任何一個具有通常知識者所熟知。反改進離散餘弦轉換的執行允許根據一組頻域係數重建扭曲時域樣本。執行IMDCT例如可被訊框式地執行,這表示例如一2048扭曲時域樣本訊框根據一組1024頻域係數來重建。為了正確重建,不多於兩個的接續的視窗重疊是必要的。由於TW-MDCT的性質,可能發生的是,一個訊框的反時間扭曲部分延伸到一非相鄰訊框,從而違反了上述的先決條件。因此視窗形狀的衰落長度需要透過計算上述合適的warped_trans_len_left及warped_trans_len_right值來縮短。
一視窗化與區塊交換650b而後被施加到從IMDCT所獲得的時域樣本。該視窗化與方塊交換650b可依據時間扭曲控制資訊被施加到由IMDCT 650a所提供的扭曲時域樣本,以獲得視窗化扭曲時域樣本。例如,依據“window_shape”資訊或元素,不同的超取樣轉換視窗原型可被使用,其中超取樣視窗的長度可由在第10c圖的參考數字1040處所示的方程式提出。例如,對於第一種類型的視窗形狀(例如window_shape==1)而言,視窗係數根據在第10c圖的參考數字1042處所示的定義由凱撒貝索衍生(KBD)視窗(“Kaiser-Bessel”derived(KBD)window)提出,其中W'、「凱撒貝索核心視窗功能」被定義,如在第10c圖的參考數字1044處所示。
否則,當一不同視窗形狀被使用時(例如,若window_shape==0),一正弦視窗可根據在參考數字1046處的定義被使用。對於所有種類的視窗序列(“window_sequences”)而言,用於左視窗部分的原型透過先前區塊的視窗形狀來決定,在第10c圖的參考數字1048處所示的公式表示這一事實。同樣地,用於右視窗形狀的原型透過在第10c圖的參考數字1050處所示的公式來決定。
在下文中,上述視窗對由IMDCT所提供的扭曲時域樣本的施加將予以描述。在一些實施例中,訊框的資訊可由複數個短序列(例如,八個短序列)提供。在其他實施例中,訊框的資訊可使用具有不同長度的區塊來提供,其中對於起始序列、停止序列及/或非標準長度序列而言,特別處理可能被需要。然而,因為過渡長度可如上述那樣被決定,可能足以區分使用八個短序列被編碼的訊框(由合適的訊框類型資訊“eight_short_sequence”指示)與所有其他訊框。
例如,在由八個短序列所描述的訊框中,在第10d圖的參考數字1060處所示的演算法可被施加用於視窗化。相反,對於使用其他資訊被編碼的訊框而言,在第10e圖的參考數字1064處所示的演算法可被施加。換言之,在第10d圖中的參考數字1060處所示的類似C程式碼部分描述一所謂「八個短序列」的視窗化與內部重疊相加。相反,在第10d圖的參考數字1064處所示的類似C程式碼部分描述其他情況下的視窗化。
重新取樣
在下文中,依據時間扭曲控制資訊之視窗化扭曲時域樣本的反時間扭曲650c將予以描述,從而規則取樣的時域樣本、或簡單時域樣本透過時變重新取樣來獲得。在時變重新取樣中,視窗化區塊z[]根據所樣本位置來重新取樣,例如使用在第10f圖的參考數字1070處所示的脈衝回應。在重新取樣之前,視窗化區塊可在兩端用零填充,如在第10f圖的參考數字1072處所示。重新取樣本身透過在第10f圖的參考數字1074處所示的偽碼部分來描述。
後重新取樣器訊框處理
在下文中,時域樣本的可任擇後處理650d將予以描述。在一些實施例中,後重新取樣訊框處理可依據一類型的視窗序列來執行。依據參數“window_sequence”,某些進一步的處理步驟可被施加。
例如,若視窗序列是一所謂的“EIGHT_SHORT_SEQUENCE”、一所謂的“LONG_START_SEQUENCE”、一所謂的“SHORT_START_1152_SEQUENCE”後接一所謂的LPD_SEQUENCE,則如在參考數字1080a、1080b、1082處所示的後處理可被執行。
例如,若下一視窗序列是一所謂的“LPD_SEQUENCE”,則一修正視窗Wcorr (n)可考慮在參考數字1080b處所示的定義被計算,如在參考數字1080a處所示。同樣地,修正視窗Wcorr (n)可被施加,如在第10g圖的參考數字1082處所示。
對於所有其他情況而言,可能沒有什麼要做,如在第10g圖的參考數字1084處所看出的。
與先前視窗序列的重疊與相加
此外,目前時域樣本與一個或複數個先前時域樣本的重疊與相加650e可被執行。對於所有序列而言,該重疊與相加可能是相同的,且可在數學上描述,如在第10g圖的參考數字1086處所示。
圖例
關於所提出的解釋,現參考在第11a圖及第11d圖中所示的圖例。特別地,反轉換的合成視窗長度N通常是合成元素“window_sequence”與演算法脈絡的函數。其可例如被定義如在第11b圖的參考數字1190處所顯示。
根據第13圖的實施例
第13圖顯示用於提供重建時間扭曲輪廓資訊之裝置1300的方塊概要圖,其中該裝置1300接管參考第5圖所描述的裝置520的功能。然而,資料路徑與緩衝器被較詳細地顯示。該裝置1300包含執行扭曲節點值計算器544之功能的一扭曲節點值計算器1344。該扭曲節點值計算器1344接收扭曲比的碼薄索引“tw_ratio[]”作為編碼扭曲比資訊。扭曲節點值計算器包含一扭曲值表格表示,例如在第9c圖中所表示的時間扭曲比索引到時間扭曲比值上的映射。扭曲節點值計算器1344可進一步包含用於執行在第9a圖的參考數字910處所表示之演算法的一乘法器。因此,扭曲節點值計算器提供扭曲節點值“warp_node_values[i]”。再者,裝置1300包含一扭曲輪廓內插器1348,該扭曲輪廓內插器1348取內插器540a的功能且可被認為執行在第9a圖的參考數字920處所示的演算法,從而獲得新扭曲輪廓(“new_warp_contour”)的值。裝置1300進一步包含一新扭曲輪廓緩衝器1350,該新扭曲輪廓緩衝器1350儲存新扭曲輪廓(即warp_contour[i],其中2.n_longi<3.n_long)的值。裝置1300進一步包含一過去扭曲輪廓緩衝器/更新器1360,該過去扭曲輪廓緩衝器/更新器1360儲存「最後時間扭曲輪廓部分」與「目前時間扭曲輪廓部分」且根據一重新比例調整及根據目前訊框之處理的完成更新記憶體的內容。因此,該過去扭曲輪廓緩衝器/更新器1360可與過去扭曲輪廓重新調整器1370協同工作,藉此該過去扭曲輪廓緩衝器/更新器與該過去扭曲輪廓重新調整器一起完成演算法930、932、934、936、950、960的功能。選擇性地,該過去扭曲輪廓緩衝器/更新器1360也可接管演算法932、936、952、954、962、964的功能。
因此,裝置1300提供扭曲輪廓(“warp_contour”)且最佳地也提供扭曲輪廓和值。
根據第14圖的音訊信號編碼器
在下文中,根據本發明之一層面的音訊信號編碼器將予以描述。第14圖的該音訊信號編碼器整體用1400標明。該音訊信號編碼器被組配成接收音訊信號1410,且選擇性地,與該音訊信號1410相關聯的一在外部被提供的扭曲輪廓資訊1412。再者,該音訊信號編碼器1400被組配成提供音訊信號1410的一編碼表現型態1440。
音訊信號編碼器1400包含一時間扭曲輪廓編碼器1420,該時間扭曲輪廓編碼器1420被組配成接收與音訊信號1410相關聯的時間扭曲輪廓資訊1422,且據以提供一編碼時間扭曲輪廓資訊1424。
音訊信號編碼器1400進一步包含一時間扭曲信號處理器(或時間扭曲信號編碼器)1430,該時間扭曲信號處理器1430被組配成接收音訊信號1410,以及據以提供音訊信號1410的時間扭曲編碼表現型態1432,將時間扭曲資訊1422所描述的時間扭曲考慮在內。音訊信號1410的編碼表現型態1414包含編碼時間扭曲輪廓資訊1424及音訊信號1410之頻譜的編碼表現型態1432。
選擇性地,音訊信號編碼器1400包含一扭曲輪廓資訊計算器1440,該扭曲輪廓資訊計算器1440被組配成根據音訊信號1410提供時間扭曲輪廓資訊1422。然而,可選擇性地,該時間扭曲輪廓資訊1422可根據在外部被提供的扭曲輪廓資訊1412來提供。
時間扭曲輪廓編碼器1420可被組配成計算由時間扭曲輪廓資訊1422所描述的時間扭曲輪廓之接續節點值之間的比例。例如,該等節點值可能是由時間扭曲輪廓資訊所表示之時間扭曲輪廓的樣本值。例如,若針對音訊信號1410的每一訊框,時間扭曲輪廓資訊包含複數個值,時間扭曲節點值可以是這一時間扭曲輪廓資訊的一真正的子集。例如,時間扭曲節點值可以是時間扭曲輪廓值的一週期性真正子集。例如,時間扭曲節點值可以是時間扭曲輪廓值的一週期性真正子集。時間扭曲輪廓節點值每N個音訊樣本可能存在,其中N可能大於或等於2。
時間扭曲輪廓節點值比例計算器可被組配成計算時間扭曲輪廓之接續時間扭曲節點值之比,從而提供描述時間扭曲輪廓之接續節點值之比的資訊。時間扭曲輪廓編碼器的比例編碼器可被組配成編碼時間扭曲輪廓之接續節點值之比。例如,比例編碼器可將不同比例映射到不同的碼薄索引。例如,一映射可被選擇,藉此由時間扭曲輪廓值比例計算器所提供的比例在0.9與1.1之間或者甚至在0.95與1.05之間的一範圍內。因此,該比例編碼器可被組配成將這一範圍映射到不同的碼薄索引。例如,在第9c圖的表格中所示的對應關係可作為這一映射中的支援點,藉此例如一比例1被映射到碼薄索引3上,而比例1.0057被映射到碼薄索引4上等等(與第9c圖相比較)。在第9c圖的表格中所示的那些之間的比值可被映射到合適的碼薄索引,例如對在第9c圖的表格中所提出的碼薄索引而言,最接近比值的碼薄索引。
自然,不同的編碼可被使用,藉此例如一數目的可用碼薄索引可被選擇較這裡所顯示的大或小。同樣地,在扭曲輪廓節點值與碼薄值索引之間的相關聯性可被合適地選擇。同樣地,碼薄索引可使用例如二進制編碼、選擇性地使用熵編碼來編碼。
因此,編碼比例1424被獲得。
時間扭曲信號處理器1430包含一時間扭曲時域到頻域轉換器1434,該轉換器1434被組配成接收音訊信號1410及與該音訊信號(或其一編碼版本)相關聯的時間扭曲輪廓資訊1422a,以及據以提供一頻譜域(頻域)表現型態1436。
時間扭曲輪廓資訊1422a可較佳地使用一輪廓解碼器1425從由時間扭曲輪廓編碼器1420所提供的編碼資訊1424得到。以此方式,可實現的是,編碼器(特別是其時間扭曲信號處理器1430)及解碼器(接收音訊信號的編碼表現型態1414)在同一扭曲輪廓(即解碼(時間)扭曲輪廓)上操作。然而,在一簡化實施例中,時間扭曲信號處理器1430所使用的時間扭曲輪廓資訊1422a可與輸入到時間扭曲輪廓編碼器1420的時間扭曲輪廓資訊1422相同。
當例如使用音訊信號1410的時變重新依比例調整操作形成頻域表現型態1436時,時間扭曲時域到頻域轉換器1434可例如考慮時間扭曲。然而,選擇性地,時變重新依比例調整與時域到頻域轉換在一單一處理步驟中被整合。時間扭曲信號處理器也包含一頻譜值編碼器1438,該頻譜值編碼器1438被組配成編碼頻域表現型態1436。頻譜值編碼器1438可例如被組配成考慮知覺遮蔽。同樣地,頻譜值編碼器1438可被組配成使編碼精確性適應頻帶的知覺相關性以及施加一熵編碼。因此,音訊信號1410的編碼表現型態1432被獲得。
根據第15圖的時間扭曲輪廓計算器
第15圖顯示根據本發明之另一實施例的時間扭曲輪廓計算器的方塊概要圖。時間扭曲輪廓計算器1500被組配成接收一編碼扭曲比資訊1510,以便據以提供複數個扭曲節點值1512。該時間扭曲輪廓計算器1500包含例如一扭曲比解碼器1520,該扭曲比解碼器1520被組配成從編碼扭曲比資訊1510得到一扭曲比值序列1522。該時間扭曲輪廓計算器1500也包含一扭曲輪廓計算器1530,該扭曲輪廓計算器1530被組配成從扭曲比值序列1522得到扭曲節點值序列1512。例如,扭曲輪廓計算器可被組配成獲得從一扭曲輪廓初始值開始的扭曲輪廓節點值,其中與一扭曲輪廓起始點相關聯的扭曲輪廓初始值與扭曲輪廓節點值之比由扭曲比值1522決定。扭曲節點值計算器亦被組配成根據一乘積形成計算以一中間扭曲輪廓節點與扭曲輪廓起始點隔開的一特定扭曲輪廓節點的扭曲輪廓節點值1512,且該乘積包含扭曲輪廓初始值(例如1)與中間扭曲輪廓節點的之扭曲輪廓節點值之比、及中間扭曲輪廓節點的扭曲輪廓節點值與該特定扭曲輪廓節點的扭曲輪廓節點值之比作為因素。
在下文中,時間扭曲輪廓計算器1500的操作將參考第16a圖及第16b圖予以簡要地討論。
第16a顯示時間扭曲輪廓之連續計算的圖形表現型態。第一圖形表現型態1610顯示一時間扭曲比碼薄索引序列1510(索引=0、索引=1、索引=2、索引=3、索引=7)。再者,圖形表現型態1610顯示與該等碼薄索引相關聯的一扭曲比值序列(0.983、0.988、0.994、1.000、1.023)。再者,可看出的是,第一扭曲節點值1621(i=0)被選擇為1(其中1是一初始值)。如所看出的,第二扭曲節點值1622(i=1)透過使初始值1與第一比值0.983(與第一索引0相關聯)相乘被獲得。可進一步看出的是,第三扭曲節點值1623透過使0.983的第二扭曲節點值1622與0.988(與第二索引1相關聯)的第二扭曲比值相乘來獲得。以同樣的方式,第四扭曲節點值1624透過使第三扭曲節點值1623與0.994(與第三索引2相關聯)的第三扭曲比值相乘來獲得。
因此,一扭曲節點值序列1621、1622、1623、1624、1625、1626被獲得。
各自的扭曲節點值被有效地獲得,藉此其是初始值(例如1)與位於起始扭曲節點值1621與各自扭曲節點值1622到1626之間的所有中間扭曲比值的乘積。
圖形表現型態1640繪示扭曲節點值之間的線性內插。例如,在兩個相鄰時間扭曲節點值1621、1622之間的內插值1621a、1621b、1621c可例如利用線性內插在一音訊信號解碼器中被獲得。
第16b圖顯示使用從一預定初始值的週期性重新開始之一時間扭曲輪廓重建的圖形表現型態,該時間扭曲輪廓重建動作可選擇性地在時間扭曲輪廓計算器1500中被實施。換言之,一再或週期性重新開始不是一基本特徵,所提供的數值上溢可在編碼器端或在解碼器端透過任何合適的量測被避免。如所看到的,一扭曲輪廓部分可從一起始點1660開始,其中扭曲輪廓節點1661、1662、1663、1664可被決定。為了達到這一目的,扭曲比值(0.983、0.988、0.965、1.000)可被考慮,藉此第一時間扭曲輪廓部分的鄰近扭曲輪廓節點1661到1664以這些扭曲比值所決定的比例被分開。然而,一另外的第二時間扭曲輪廓部分可在第一時間扭曲輪廓部分(包含節點1660-1664)的一結束點1664之後開始已被實現。第二時間扭曲輪廓部分可從一新起始點1665開始,該新起始點1665可與任何扭曲比值相獨立地採取預定初始值。因此,第二時間扭曲輪廓部分的扭曲節點值可根據第二時間扭曲輪廓部分的扭曲比值從第二時間扭曲輪廓部分的起始點1665開始被計算。稍後,第三時間扭曲輪廓部分可從一對應起始點1670開始,該對應起始點1670可再次獨立於任何扭曲比值採取該預定初始值。因此,時間扭曲輪廓部分的週期性重新開始被獲得。選擇性地,一一再重新正規化可被施加,如上文所詳細描述的。
根據第17圖的音訊信號編碼器
在下文中,根據本發明之另一實施例的音訊信號編碼器將參考第17圖予以簡要地描述。音訊信號編碼器1700被組配成接收一多聲道音訊信號1710且提供該多聲道音訊信號1710的一編碼表現型態1712。該音訊信號編碼器1700包含一編碼音訊表現型態提供器1720,該編碼音訊表現型態提供器1720被組配成依據描述與複數音訊聲道中的音訊聲道相關聯的扭曲輪廓之間的相似性或差異的資訊,選擇性地提供包含通常與該多聲道音訊信號的複數個音訊聲道相關聯的一共同扭曲輪廓資訊的一音訊表現型態,或包含與複數個音訊聲道中的不同音訊聲道個別地相關聯的個別扭曲輪廓資訊的一編碼音訊表現型態。
例如,音訊信號編碼器1700包含被組配成提供描述與音訊聲道相關聯的扭曲輪廓之間的相似性或差異之資訊1732的一扭曲輪廓相似性計算器或扭曲輪廓差異計算器1730。該編碼音訊表現型態提供器包含例如一選擇性時間扭曲輪廓編碼器1722,該選擇性時間扭曲輪廓編碼器1722被組配成接收時間扭曲輪廓資訊1724(該資訊1724可在外部被提供或可由一可任擇時間扭曲輪廓資訊計算器1734提供)及資訊1732。若資訊1732指示兩個或複數個音訊聲道的時間扭曲輪廓充分地相似,選擇性時間扭曲輪廓編碼器1722可被組配成提供一共同編碼時間扭曲輪廓資訊。該共同扭曲輪廓資訊可例如基於兩個或複數個聲道之扭曲輪廓資訊的平均。然而,可選擇性地,該共同扭曲輪廓資訊可基於一單音訊聲道的一單一扭曲輪廓資訊,但與複數個聲道共同地相關聯。
然而,若資訊1732指示複數個音訊聲道的扭曲輪廓不充分地相似,則選擇性時間扭曲輪廓編碼器1722可提供不同扭曲輪廓的獨立編碼資訊。
編碼音訊表現型態提供器1720也包含一時間扭曲信號處理器1726,該時間扭曲信號處理器1726亦被組配成接收時間扭曲輪廓資訊1724與多聲道音訊信號1710。時間扭曲信號處理器1726被組配成編碼音訊信號1710的複數個聲道。時間扭曲信號處理器1726也包含不同的操作模式。例如,時間扭曲信號處理器1726可被組配成個別地選擇性地編碼音訊聲道,或利用內部聲道相似性共同地將其等編碼。在一些情況下,時間扭曲信號處理器1726能共同地編碼具有一共用時間扭曲輪廓資訊的複數個音訊聲道。存在左音訊聲道與右音訊聲道顯示出相同的基頻演化但是具有除此之外不同的信號特性,例如,不同絕對基本頻率或不同頻譜包絡線的情況。在這種情況下,因為左音訊聲道與右音訊聲道之間的明顯差異,共同地編碼左音訊聲道與右音訊聲道不是所期望的。然而,左音訊聲道與右音訊聲道中的相對基頻演化可能是平行的,藉此共用時間扭曲的施加是非常有效的解決方案。這種音訊信號的一個例子是複音音樂,其中複數個音訊聲道的內容顯示出明顯的差異(例如受不同歌手或樂器支配),但是顯示出類似的基頻變化。
因此,透過提供針對複數個音訊聲道具有時間扭曲輪廓的共同編碼的可能性而同時保持獨立編碼被提供共用基頻輪廓資訊的不同音訊聲道之頻譜的選擇,編碼效率可被明顯地提高。
編碼音訊表現型態提供器1720選擇性地包含一旁側資訊編碼器1728,該旁側資訊編碼器1728被組配成接收資訊1732及提供指示一共用編碼扭曲輪廓是否針對複數個音訊聲道被提供或個別編碼扭曲輪廓是否針對複數個音訊聲道被提供的旁側資訊。例如,這種旁側資訊可以一1位元旗標(即“common_tw”)之形式被提供。
總之,選擇性時間扭曲輪廓編碼器1722選擇性地提供與複數個音訊信號相關聯之時間扭曲音訊輪廓的個別編碼表現型態,或表示與複數個音訊聲道相關聯之一單一共同時間扭曲輪廓的一共同編碼時間扭曲輪廓表現型態。旁側資訊編碼器1728選擇性地提供指示個別時間扭曲輪廓表現型態或一共同時間扭曲輪廓表現型態是否被提供的一旁側資訊。時間扭曲信號處理器1726提供複數個音訊聲道的編碼表現型態。選擇性地,一共用編碼資訊可針對複數個音訊聲道被提供。然而,通常情況下提供複數音訊聲道的個別編碼表現型態甚至是可能的,其中對該等複數個音訊聲道而言,一共用時間扭曲輪廓表現型態是可得的,藉此具有不同音訊內容但是相同時間扭曲的不同音訊聲道被合適的表現型態。因此,編碼表現型態1712包含由選擇性時間扭曲輪廓編碼器1722、及時間扭曲信號處理器1726、及選擇性地旁側資訊編碼器1728所提供的編碼資訊。
根據第18圖的音訊信號解碼器
第18圖顯示根據本發明之一實施例的一音訊信號解碼器的方塊概要圖。音訊信號解碼器1800被組配成接收一編碼音訊信號表現型態1810(例如編碼表現型態1712)及據以提供多聲道音訊信號的一解碼表現型態1812。音訊信號解碼器1800包含一旁側資訊擷取器1820及一時間扭曲解碼器1830。該旁側資訊擷取器1820被組配成從編碼音訊信號表現型態1810擷取一時間扭曲輪廓應用資訊1822及一扭曲輪廓資訊1824。例如,旁側資訊擷取器1820可被組配成認定針對編碼音訊信號的複數個聲道,一單一共用時間扭曲輪廓資訊是否可得,或者針對複數個聲道,獨立時間扭曲輪廓資訊是否可得。因此,該旁側資訊擷取器可提供時間扭曲輪廓應用資訊1822(指示共同或個別時間扭曲輪廓資訊是否是可得的)與時間扭曲輪廓資訊1824(描述個別時間扭曲輪廓之共用(共同)時間扭曲輪廓的時間演化)兩者。時間扭曲解碼器1830可被組配成根據編碼音訊信號表現型態1810重建多聲道音訊信號的解碼表現型態,將由資訊1822、1824所描述的時間扭曲考慮在內。例如,時間扭曲解碼器1830可被組配成施加用於解碼不同音訊聲道的一共用時間扭曲輪廓,其中對於該等不同聲道而言,個別編碼頻域資訊是可得的。因此,時間扭曲解碼器1830可例如重建包含類似或相同時間扭曲但是不同基頻之多聲道音訊信號的不同聲道。
根據第19a圖到第19e圖的音訊串流
在下文中,包含一個或複數個聲道及一個或複數個時間扭曲輪廓的一編碼表現型態的一音訊串流將予以描述。
第19a圖顯示一所謂“USAC_raw_data_block”資料流元素的圖形表現型態,其中該資料流元素可包含一單聲道元素(SCE)、一雙聲道元素(CPE)或一個或複數個單聲道元素及/或一個或複數個雙聲道元素的一組合。
“USAC_raw_data_block”通常可包含一編碼音訊資料區塊,而額外的時間扭曲輪廓資訊可在一獨立資料流元素中被提供。然而,將一些時間扭曲輪廓資料編碼到“USAC_raw_data_block”中通常是可能的。
如從第19b圖所看出的,一單聲道元素典型地包含一頻域聲道流(“fd_channel_stream”),這將參考第9d圖予以詳細地解釋。
如從第19c圖可看出的,一雙聲道元素(“channel_pair_elelment”)通常包含複數個頻域聲道流。同樣地,雙聲道元素可包含時間扭曲資訊。例如,可在一組態資料流元素中或在“USAC_saw_data_block”中被傳送的時間扭曲啟動旗標(“tw_MDCT”)決定時間扭曲資訊是否被包括在該雙聲道元素中。例如,若tw_MDCT旗標指示時間扭曲在作用中,則雙聲道元素可包含指示針對雙聲道元素的音訊聲道是否存在一共用時間扭曲的一旗標(“common_tw”)。若該旗標(“common_tw”)指示針對複數個音訊聲道存在一共用時間扭曲,則一共用時間扭曲資訊(tw_data)被例如與頻域聲道流相獨立地包括在該雙聲道元素中。
現參考描述頻域聲道流的第19d圖。如從第19d圖可看出的,頻域聲道流例如包含一全域增益資訊。同樣地,頻域聲道流包含時間扭曲資料,若時間扭曲在作用中(旗標“tw_MDC”作用)及若針對複數個音訊信號聲道不存在共用時間扭曲資訊(旗標“common_tw”是不作用的)。
再者,頻域聲道流也包含比例調整因數資料(“scale_factor_data”)及編碼頻譜資料(例如算術編碼頻譜資 料“ac_spectral_data”)。
現參考簡要討論時間扭曲資料之語法的第19e圖。時間扭曲資料可例如選擇性地包含指示時間扭曲資料是否存在的一旗標(例如“tw_data_present”或「作用音距資料(active Pitch Data)」)。若時間扭曲資料是存在的(即時間扭曲資料不是平的),則時間扭曲資料可包含具有可例如根據第9c圖的碼薄表被編碼之複數個編碼時間扭曲比值(例如“tw_ratio[i]”或“pitchIdx[i]”)的一序列。
因此,時間扭曲資料可包含指示不存在可得時間扭曲資料的一旗標,若時間扭曲輪廓是恆定的(時間扭曲比近似等於1.000),則該旗標可由一音訊信號編碼器設定。相反,若時間扭曲輪廓是變化的,則接續時間扭曲輪廓節點之比可使用組成“tw_ratio”資訊的碼薄索引來編碼。
結論
綜上所述,根據本發明的實施例帶來時間扭曲領域中的不同提高。
於此所描述的本發明層面在時間扭曲MDCT轉換編碼器之脈絡中(參見例如參考文獻[1])。根據本發明的實施例提供用於提高時間扭曲MDCT轉換編碼器之性能的方法。
根據本發明的一層面,一特別有效的位元流格式被提供。該位元流格式描述係基於且增強MPEG-2 AAC位元流語法(例如參見參考文獻[2]),但是當然可應用到在一串流起始具有一般性描述標題及一獨立訊框式資訊語法的所有位元流格式。
例如,以下旁側資訊可在位元流中被傳送: 一般地,一個位元旗標(例如所指定的“tw_MDCT”)在一般特定音訊配置(GASC)中可能是存在的,指示時間扭曲是否作用。音距資料可使用在第19e圖中所示的語法或在第19f圖中所示的語法來傳送。在第19f圖中所示的語法中,音距的數目(“numPitches”)可能等於16,且音距位元的數目(“numPitchBits”)可能等於3。換言之,每一時間扭曲輪廓部分(或每一音訊信號訊框)可能存在16個編碼扭曲比值,且每一扭曲輪廓比值可使用3個位元來編碼。
此外,在一單聲道元素(SCE)中,若扭曲是有效的,音距資料(pitch_data[])可能位於個別聲道中的部分資料之前。
在雙聲道元素(CPE)中,若二聲道有一共同音距資料,則一共同音距旗標發出信號,其後結果是若無共同音距資料,個別音距輪廓被發現於個別聲道中。
在下文中,針對一雙聲道元素的實例將被提出。一個實例可能是被置於立體聲全景中的一單一諧波聲源的信號。在這種情況下,第一聲道與第二聲道的相對音距輪廓將是相等的或者由於變化估計中的一些小錯誤將只略有不同。在這種情況下,編碼器可決定不是針對每一聲道發送兩個獨立編碼的音距輪廓,而是只發送是第一與第二聲道之一平均的一個音距輪廓,以及在這兩個聲道上施加TW-MDCT之過程中使用相同的輪廓。另一方面,可能存在一信號,其中音距輪廓的估計針對第一與第二聲道分別產生不同結果。在這種情況下,獨立編碼的音距輪廓在對應 聲道中被發送。
在下文中,根據本發明之一層面的音距輪廓資料的有利解碼將予以描述。例如,若「作用音距資料(PitchData)」旗標為0,則音距輪廓針對該訊框中的所有樣本被設定為1,否則個別音距輪廓節點被計算如下:●存在numPitches+1個節點,●節點[0]總是1.0;●節點
[i]=node[i-1]˙relChange[i](i=1..numPitches+1),其中relChange透過pitchIdx[i]的反量化來獲得。
音距輪廓而後透過節點間的線性內插來產生,其中節點樣本位置是0:frameLen/numPitches:frameLen。
實施備選
依據某些實施要求,本發明的實施例可用硬體或軟體實施。實施態樣可使用數位儲存媒體來執行,例如其上儲存有複數個電氣可讀控制信號的軟式磁碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,其中該等電氣可讀控制信號與(或可與)一可程式電腦系統協同工作,藉此各自的方法被執行。
根據本發明的一些實施例包含具有複數個電氣可讀控制信號的一資料載體,該等電氣可讀控制信號可與一可程式電腦系統協同工作,藉此於此所述的其中一種方法被執行。
一般地,本發明的實施例可被實施為具有程式碼的一 電腦程式產品,當該電腦程式產品在一電腦上執行時,該程式碼可操作以執行其中的一種方法。該程式碼可例如被儲存在一機器可讀載體上。
其他實施例包含儲存在一機器可讀載體上的用於執行於此所述的其中一種方法的電腦程式。
換言之,本發明方法的一實施例從而是具有程式碼的一電腦程式,當該電腦程式在一電腦上執行時,該程式碼用於執行於此所述的其中的一種方法。
本發明方法的另一實施例從而是包含(其上記錄)用於執行於此所述的其中一種方法之電腦程式的一資料載體(或數位儲存媒體、或電腦可讀媒體)。
本發明方法的又一實施例從而是表示用於執行於此所述之其中一種方法的電腦程式的一資料流或一信號序列。該資料流或信號序列可例如被組配成藉由例如網際網路的一資料通訊連接體來傳送。
再一實施例包含被組配成或適於執行於此所述之其中一種方法的一處理裝置,例如一電腦、或一可程式邏輯裝置。
另一實施例包含其上安裝有用於執行於此所述之其中一種方法的電腦程式的一電腦。
在一些實施例中,一可程式邏輯裝置(例如一現場可程式閘陣列)可用來執行於此所述之方法的一些或全部功能。在一些實施例中,一現場可程式閘陣列可與一微處理器協同工作,以執行於此所述的其中一種方法。
參考文獻
[1]L. Villemoes, “Time Warped Transform Coding of Audio Signals”, PCT/EP2006/010246,國際專利申請案(Int. patent application),2005年11月
[2]Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding.國際標準(International Standard)13818-7, ISO/IECJTC1/SC29/WG11動畫專家群(Moving pictures Expert Group), 1997
100‧‧‧音訊編碼器
104‧‧‧取樣器
105‧‧‧取樣表現型態
106、210‧‧‧轉換視窗計算器
108‧‧‧視窗化程式
108a‧‧‧頻域轉換器
110、1410‧‧‧音訊信號
112‧‧‧音距輪廓
114‧‧‧取樣率調整方塊
200‧‧‧音訊解碼器
211‧‧‧轉換係數
211a、211b‧‧‧時間扭曲表現型態
212‧‧‧音距輪廓
216‧‧‧視窗化程式
218‧‧‧重新取樣器
219‧‧‧時間扭曲計算器
220‧‧‧取樣率調整器
230‧‧‧加法器
232‧‧‧輸出音訊信號
240‧‧‧反頻域轉換器
300、1800‧‧‧音訊信號解碼器
310、1810‧‧‧編碼音訊信號表現型態
312‧‧‧解碼音訊信號表現型態
316、510‧‧‧時間扭曲輪廓演化資訊
320、540、1500‧‧‧時間扭曲輪廓計算器
322‧‧‧時間扭曲輪廓資料
330‧‧‧時間扭曲輪廓資料重新調整器
332‧‧‧時間扭曲輪廓的重新調整版本
340‧‧‧扭曲解碼器
400、600‧‧‧方法
410~430、610~650‧‧‧流程步驟
500、520、1300‧‧‧裝置
512‧‧‧時間扭曲控制資訊
522‧‧‧重建時間扭曲輪廓資訊
530‧‧‧時間扭曲控制資訊計算器
542‧‧‧新扭曲輪廓部分資訊
544、1344‧‧‧扭曲節點值計算器
548‧‧‧內插器
550‧‧‧重新調整器
570‧‧‧時間輪廓計算器
572‧‧‧時間輪廓
574‧‧‧樣本位置計算器
576‧‧‧樣本位置向量
582‧‧‧過渡長度資訊
584‧‧‧第一與最後位置計算器
710、720、730、740、810、 860、910、1610、1640‧‧‧圖形表現型態
712、812、862‧‧‧橫坐標(時間)
714‧‧‧縱坐標(扭曲輪廓資料值)
716、718、722、752‧‧‧時間扭曲輪廓部分
716'、718'‧‧‧重新調整版本
718"‧‧‧兩次重新調整版本
718b、718b'‧‧‧結束點
722'‧‧‧一次重新調整版本
722a、752a‧‧‧起始點
724、878‧‧‧不連續
814‧‧‧縱坐標(相對音距)
816‧‧‧相對音距曲線
820a、820b、820c、820d‧‧‧相對音距輪廓部分
822a、822b‧‧‧音訊部分
864‧‧‧縱坐標(相對音距輪廓值)
870‧‧‧相對音距輪廓部分
870'‧‧‧重新比例調整相對音距輪廓部分
874‧‧‧相對音距輪廓部分/時間扭曲輪廓部分
920、930、932、934、936、940、950、952、954、960、962、964、1010、1012、1020、1022、1030、1032、1034、1036、1040、1042、1044、1046、1048、1050、1060、1070、1072、1074、1080a、 1080b、1082、1084、1086‧‧‧參考數字
990‧‧‧映射表
1348‧‧‧扭曲輪廓內插器
1350‧‧‧新扭曲輪廓緩衝器
1360‧‧‧過去扭曲輪廓緩衝器/ 更新器
1370‧‧‧過去扭曲輪廓重新調整器
1400‧‧‧音訊信號編碼器
1412、1824‧‧‧扭曲輪廓資訊
1414、1432、1440、1712、1812‧‧‧編碼表現型態
1420‧‧‧時間扭曲輪廓編碼器
1422、1422a、1724‧‧‧時間扭曲輪廓資訊
1424‧‧‧編碼資訊
1425‧‧‧輪廓解碼器
1430、1726‧‧‧時間扭曲信號處理器
1434‧‧‧時間扭曲時域到頻域轉換器
1436‧‧‧頻譜域(頻域)表現型態
1438‧‧‧頻譜值編碼器
1510‧‧‧編碼扭曲比資訊
1512、1621、1622、1622、1623、1624、1625、1626‧‧‧扭曲節點值
1520‧‧‧扭曲比解碼器
1522‧‧‧扭曲比值序列
1530‧‧‧扭曲輪廓計算器
1621a、1621b、1621c‧‧‧內插值
1660、1665、1670‧‧‧起始點
1661、1662、1663、1664‧‧‧扭曲輪廓節點
1710‧‧‧多聲道音訊信號
1720‧‧‧編碼音訊表現型態提供器
1722‧‧‧選擇性時間扭曲輪廓編碼器
1728‧‧‧附屬資訊編碼器
1730‧‧‧扭曲輪廓相似性計算器或扭曲輪廓差異計算器
1732‧‧‧資訊
1734‧‧‧時間扭曲輪廓資訊計算器
1820‧‧‧旁側資訊擷取器
1822‧‧‧時間扭曲輪廓應用資訊
1830‧‧‧時間扭曲解碼器
第1圖顯示一時間扭曲音訊編碼器的方塊概要圖;第2圖顯示一時間扭曲音訊解碼器的方塊概要圖;第3圖顯示根據本發明之一實施例的一音訊信號解碼器的方塊概要圖;第4圖顯示根據本發明之一實施例的用於提供解碼音訊信號表現型態之方法的流程圖;第5圖顯示根據本發明之一實施例的從一音訊信號解碼器之方塊概要圖的詳細摘錄;第6圖顯示根據本發明之一實施例的從用於提供解碼音訊信號表現型態之方法的流程圖的詳細摘錄;第7a圖、第7b圖顯示根據本發明之一實施例的重建時間扭曲輪廓的圖形表現型態;第8圖顯示根據本發明之一實施例的重建時間扭曲輪廓的另一圖形表現型態;第9a圖、第9b圖顯示用於計算時間扭曲輪廓的演算法; 第9c圖顯示從一時間扭曲比索引到一時間扭曲比值之映射表;第10a圖及第10b圖顯示用於計算時間輪廓、樣本位置、過渡長度、「第一位置」及「最後位置」之演算法的表現型態;第10c圖顯示用於視窗形狀計算之演算法的表現型態;第10d圖及第10e圖顯示用於一視窗之應用之演算法的表現型態;第10f圖顯示用於時變重新取樣之演算法的表現型態;第10g圖顯示用於後時間扭曲訊框處理及用於重疊與相加之演算法的圖形表現型態;第11a圖及第11b圖顯示一圖例;第12圖顯示可從一時間扭曲輪廓擷取之一時間輪廓的圖形表現型態;第13圖顯示根據本發明之一實施例提供扭曲輪廓之裝置的詳細方塊概要圖;第14圖顯示根據本發明之另一實施例的一音訊信號解碼器的方塊概要圖;第15圖顯示根據本發明之一實施例的另一時間扭曲輪廓計算器的方塊概要圖;第16a圖及第16b圖顯示根據本發明之一實施例的計算時間扭曲節點值的圖形表現型態;第17圖顯示根據本發明之一實施例的另一音訊信號編碼器的方塊概要圖; 第18圖顯示根據本發明之一實施例的另一音訊信號解碼器的方塊概要圖;以及第19a-19f圖顯示根據本發明之一實施例的一音訊串流之語法元素的表現型態。
300...音訊信號解碼器
310...編碼音訊信號表現型態
312...解碼音訊信號表現型態
316...時間扭曲輪廓演化資訊
320...時間扭曲輪廓計算器
322...時間扭曲輪廓資料
330...時間扭曲輪廓資料重新調整器
332...時間扭曲輪廓的重新調整版本
340...扭曲解碼器

Claims (14)

  1. 一種音訊信號解碼器,被組配成根據包含一時間扭曲輪廓演化資訊的一編碼音訊信號表現型態提供一解碼音訊信號表現型態,該音訊信號解碼器包含:一時間扭曲計算器,該時間扭曲計算器被組配成根據描述該時間扭曲輪廓之一時間演化的該時間扭曲輪廓演化資訊從一預定時間扭曲輪廓初始值一再地重新開始產生時間扭曲輪廓資料;一時間扭曲輪廓重新調整器,該時間扭曲輪廓重新調整器被組配成重新依比例調整該時間扭曲輪廓資料的至少一部分,使得在該時間扭曲輪廓的一重新調整版本中,在一重新開始處的一不連續被避免、減小或消除;以及一扭曲解碼器,該扭曲解碼器被組配成根據該編碼音訊信號表現型態且使用該時間扭曲輪廓的重新調整版本來提供該解碼音訊信號表現型態。
  2. 如申請專利範圍第1項所述之音訊信號解碼器,其中該時間扭曲計算器被組配成從該預定初始值開始且首先使用一相對改變資訊計算該時間扭曲輪廓之第一部分的一時間演化,以及從該預定初始值開始且使用第二相對改變資訊計算該時間扭曲輪廓之第二部分的一時間演化,其中該時間扭曲輪廓的該第一部分與該時間扭曲輪廓的該第二部分是該時間扭曲輪廓之接續部分,且其中該時間扭曲輪廓重新調整器被組配成重新 依比例調整該時間扭曲輪廓之該等部分中的一者,以獲得該時間扭曲輪廓之該第一部分與該時間扭曲輪廓之該第二部分之間的一平穩過渡。
  3. 如申請專利範圍第2項所述之音訊信號解碼器,其中該時間扭曲輪廓重新調整器被組配成重新依比例調整該時間扭曲輪廓的該第一部分,使得該時間扭曲輪廓的該第一部分之調整版本中的一最後值採取該預定初始值,或偏離該預定初始值至多一預定容限值。
  4. 如申請專利範圍第1項所述之音訊信號解碼器,其中該時間扭曲輪廓重新調整器被組配成使時間扭曲輪廓資料值與一正規化因子相乘,以依比例調整該時間扭曲輪廓的該部分,或使該時間扭曲輪廓資料值除以一正規化因子,以依比例調整該時間扭曲輪廓的該部分。
  5. 如申請專利範圍第1項所述之音訊信號解碼器,其中該時間扭曲計算器被組配成獲得該時間扭曲輪廓之一特定部分的一扭曲輪廓和值,以及使用一共用比例調整值依比例調整該時間扭曲輪廓的該特定部分及該時間扭曲輪廓之該特定部分的該扭曲輪廓和值。
  6. 如申請專利範圍第1項所述之音訊信號解碼器,其中該音訊信號解碼器進一步包含一時間輪廓計算器,該時間輪廓計算器被組配成使用該時間扭曲輪廓之第一部分、該時間扭曲輪廓之第二部分及該時間扭曲輪廓之第三部分的時間扭曲輪廓資料值計算第一時間輪廓,以及使用該時間扭曲輪廓之該第二部分、該時間扭曲輪 廓之該第三部分及該時間扭曲輪廓之第四部分的時間扭曲輪廓資料值計算第二時間輪廓;其中該時間扭曲輪廓計算器被組配成根據描述該時間扭曲輪廓之該第一部分之一時間演化的一時間扭曲輪廓演化資訊,從一預定時間扭曲輪廓初始值開始產生該時間扭曲輪廓之該第一部分的時間扭曲輪廓資料;其中該時間扭曲輪廓資料重新調整器被組配成重新依比例調整該時間扭曲輪廓的該第一部分,使得該時間扭曲輪廓之該第一部分的一最後值包含該預定時間扭曲輪廓初始值;其中該時間扭曲輪廓計算器被組配成根據描述該時間扭曲輪廓之該第二部分之一時間演化的一時間扭曲輪廓演化資訊,從該預定時間扭曲輪廓初始值開始產生該時間扭曲輪廓之該第二部分的扭曲輪廓資料;其中該時間扭曲輪廓資料重新調整器被組配成使用一共用比例調整因數共同地重新依比例調整該時間扭曲輪廓的該第一部分及該時間扭曲輪廓的該第二部分,使得該時間扭曲輪廓之該第二部分的一最後值包含該預定時間扭曲輪廓初始值,以共同地獲得一重新依比例調整的時間扭曲輪廓資料值;其中該時間扭曲輪廓計算器被組配成根據該時間扭曲輪廓之該第三部分的一時間扭曲輪廓演化資訊,從該預定時間扭曲輪廓初始值開始產生該時間扭曲輪廓之該第三部分的原始時間扭曲輪廓資料值; 其中該時間輪廓計算器被組配成使用該第一與第二時間扭曲輪廓部分的該等共同重新依比例調整時間扭曲輪廓資料值及該第三時間扭曲輪廓部分的該等時間扭曲輪廓資料值計算該第一時間輪廓;其中該時間扭曲輪廓資料重新調整器被組配成使用另一共用比例調整因數共同地重新依比例調整該時間扭曲輪廓之該第二重新調整部分及該時間扭曲輪廓之該第三部分的時間扭曲輪廓資料值,使得該時間扭曲輪廓之該第三部分的一最後值包含該預定時間扭曲輪廓初始值,以獲得該時間扭曲輪廓之該第二部分的一兩次重新調整版本及該時間扭曲輪廓之該第三部分的一次重新調整版本;其中該時間扭曲輪廓計算器被組配成根據該時間扭曲輪廓之該第四部分的一時間扭曲輪廓演化資訊,從該預定時間扭曲輪廓初始值開始產生該時間扭曲輪廓之該第四部分的原始時間扭曲輪廓資料值;以及其中該時間輪廓計算器被組配成使用該時間扭曲輪廓之該第二部分的該兩次重新調整版本、該時間扭曲輪廓之該第三部分的該一次重新調整版本及該時間扭曲輪廓之該第四部分的該原始版本計算該第二時間輪廓。
  7. 如申請專利範圍第1項所述之音訊信號解碼器,其中該音訊信號解碼器更包含一時間扭曲控制資訊計算器,該時間扭曲控制資訊計算器被組配成使用該時間扭曲輪 廓的複數個部分計算一時間扭曲控制資訊,其中該時間扭曲控制資訊計算器被組配成根據第一複數時間扭曲輪廓部分的時間扭曲輪廓資料,計算用於重建該音訊信號之第一訊框的一時間扭曲控制資訊,以及根據第二複數時間扭曲輪廓部分的時間扭曲輪廓資料,計算用於重建該音訊信號之第二訊框的一時間扭曲控制資訊,該音訊信號的該第二訊框與該音訊信號的該第一訊框重疊或不重疊,其中當與該等第二複數時間扭曲輪廓部分相比較時,該等第一複數時間扭曲輪廓部分相對於時間移位,以及其中該等第一複數時間扭曲輪廓部分包含至少一個包括第二複數時間扭曲輪廓部分的共用時間扭曲輪廓部分。
  8. 如申請專利範圍第7項所述之音訊信號解碼器,其中該時間扭曲輪廓計算器被組配成產生該時間扭曲輪廓,藉此該時間扭曲輪廓在該等第一複數時間扭曲輪廓部分中的一位置或在該等第二複數時間扭曲輪廓部分中的一位置從該預定時間扭曲輪廓初始值重新開始,使得在該重新開始的位置存在該時間扭曲輪廓的一不連續;以及其中該時間扭曲輪廓重新調整器被組配成重新依比例調整該等時間扭曲輪廓部分中的一個或複數個部分,使得該不連續被減小或消除。
  9. 如申請專利範圍第8項所述之音訊信號解碼器,其中該時間扭曲輪廓計算器被組配成產生該時間扭曲輪廓,使得在該等第一複數時間扭曲輪廓部分中的一位置有一從該預定時間扭曲輪廓初始值開始的時間扭曲輪廓第一重新開始,使得該第一重新開始之該位置有一第一不連續,其中該時間扭曲輪廓重新調整器被組配成重新依比例調整該時間扭曲輪廓,藉此該第一不連續被減小,其中該時間扭曲計算器亦被組配成產生該時間扭曲輪廓,藉此在該等第二複數時間扭曲輪廓部分中的一位置處存在從該預定時間扭曲輪廓初始值開始的該時間扭曲輪廓的第二重新開始,使得在該第二重新開始之該位置處存在第二不連續;以及其中該時間扭曲輪廓資料重新調整器亦被組配成重新依比例調整該時間扭曲輪廓,使得該第二不連續被減小或消除。
  10. 如申請專利範圍第1項所述之音訊信號解碼器,其中該時間扭曲輪廓計算器被組配成從該預定時間扭曲輪廓初始值開始週期性地重新開始該時間扭曲輪廓,使得在該等重新開始處有複數個週期性不連續;其中該時間扭曲輪廓資料重新調整器適於在任一時間依次地重新依比例調整該時間扭曲輪廓的至少一個部分,以依次地減小或消除在該等重新開始處時間扭曲輪廓的不連續;以及 其中該音訊信號解碼器包含一時間扭曲控制資訊計算器,該時間扭曲控制資訊計算器被組配成組合從該重新開始之前與重新開始之後的時間扭曲輪廓資料以獲得一時間扭曲控制資訊。
  11. 如申請專利範圍第1項所述之音訊信號解碼器,其中該時間扭曲輪廓計算器被組配成接收一編碼扭曲比資訊,以從該編碼時間扭曲比資訊得出一系列的時間扭曲比值,以及獲得從該時間扭曲輪廓初始值開始的複數個時間扭曲輪廓節點值;其中與一時間扭曲輪廓起始點相關聯的該時間扭曲輪廓初始值與隨後時間扭曲輪廓節點之該時間扭曲輪廓節點值之比由該等時間扭曲比值決定:其中該時間扭曲輪廓計算器被組配成根據包含該時間扭曲輪廓初始值與中間時間扭曲輪廓節點的時間扭曲輪廓節點值之間的一比例、及該中間時間扭曲輪廓節點的該時間扭曲輪廓節點值與特定時間扭曲輪廓節點的該時間扭曲輪廓值之間的一比例作為因數的一乘積形成,計算與該時間扭曲輪廓起始點相隔一中間時間扭曲輪廓節點的一特定時間扭曲輪廓節點的一時間扭曲輪廓節點值。
  12. 一種根據包含一時間扭曲輪廓演化資訊的一編碼音訊信號表現型態提供一解碼音訊信號表現型態的方法,該方法包含以下步驟:根據描述該時間扭曲輪廓之一時間演化的一時間 扭曲輪廓演化資訊從一預定時間扭曲輪廓初始值一再地重新開始產生時間扭曲輪廓資料;重新依比例調整該時間扭曲輪廓資料的至少一部分,使得在該時間扭曲輪廓的一重新調整版本中,在一重新開始處的一不連續被避免、減小或消除;以及根據該編碼音訊信號表現型態且使用該時間扭曲輪廓的該重新調整版本來提供該解碼音訊信號表現型態。
  13. 一種電腦程式,當該電腦程式在一電腦上執行時,其用於完成如申請專利範圍第12項所述之方法。
  14. 一種根據一時間扭曲輪廓演化資訊提供表示一音訊信號之一相對音距之一時間演化的時間扭曲輪廓資料的時間扭曲輪廓資料提供器,該時間扭曲輪廓資料提供器包含:一時間扭曲輪廓計算器,該時間扭曲輪廓計算器被組配成根據描述該時間扭曲輪廓之一時間演化的一時間扭曲輪廓演化資訊產生時間扭曲輪廓資料,其中該時間扭曲輪廓計算器被組配成在一重新開始位置處一再地或週期性地重新開始,從一預定時間扭曲輪廓初始值計算該時間扭曲輪廓資料,藉此產生該時間扭曲輪廓的複數個不連續以及減小該等時間扭曲輪廓資料值的一範圍;以及一時間扭曲輪廓重新調整器,該時間扭曲輪廓重新調整器被組配成一再地重新依比例調整該時間扭曲輪 廓的複數個部分,以在該時間扭曲輪廓的複數個重新比例調整部分中減小或消除該等重新開始位置處的不連續。
TW098123191A 2008-07-11 2009-07-09 音訊信號解碼器、時間扭曲輪廓資料提供器、方法及電腦程式 TWI459374B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7987308P 2008-07-11 2008-07-11
US10382008P 2008-10-08 2008-10-08
PCT/EP2009/004757 WO2010003582A1 (en) 2008-07-11 2009-07-01 Audio signal decoder, time warp contour data provider, method and computer program

Publications (2)

Publication Number Publication Date
TW201009809A TW201009809A (en) 2010-03-01
TWI459374B true TWI459374B (zh) 2014-11-01

Family

ID=41131685

Family Applications (3)

Application Number Title Priority Date Filing Date
TW098123191A TWI459374B (zh) 2008-07-11 2009-07-09 音訊信號解碼器、時間扭曲輪廓資料提供器、方法及電腦程式
TW098123192A TWI453732B (zh) 2008-07-11 2009-07-09 時間扭曲輪廓計算器、音訊信號編碼器、編碼音訊信號表現型態、方法及電腦程式
TW098123194A TWI451402B (zh) 2008-07-11 2009-07-09 音訊信號解碼器、音訊信號編碼器、編碼多聲道音訊信號表現型態、方法及電腦程式

Family Applications After (2)

Application Number Title Priority Date Filing Date
TW098123192A TWI453732B (zh) 2008-07-11 2009-07-09 時間扭曲輪廓計算器、音訊信號編碼器、編碼音訊信號表現型態、方法及電腦程式
TW098123194A TWI451402B (zh) 2008-07-11 2009-07-09 音訊信號解碼器、音訊信號編碼器、編碼多聲道音訊信號表現型態、方法及電腦程式

Country Status (18)

Country Link
US (3) US9043216B2 (zh)
EP (3) EP2257945B1 (zh)
JP (4) JP5323180B2 (zh)
KR (3) KR101205593B1 (zh)
CN (3) CN102007537B (zh)
AR (3) AR072498A1 (zh)
AT (2) ATE532176T1 (zh)
AU (3) AU2009267486B2 (zh)
BR (2) BRPI0906300B1 (zh)
CA (3) CA2718740C (zh)
ES (3) ES2376849T3 (zh)
HK (3) HK1151619A1 (zh)
MX (3) MX2010010747A (zh)
MY (1) MY154452A (zh)
PL (3) PL2257945T3 (zh)
RU (3) RU2509381C2 (zh)
TW (3) TWI459374B (zh)
WO (3) WO2010003583A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI692754B (zh) * 2017-09-07 2020-05-01 大陸商電信科學技術研究院有限公司 有限衝激回應濾波器係數向量的可持續更新方法及裝置

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
PT2410522T (pt) 2008-07-11 2018-01-09 Fraunhofer Ges Forschung Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2471061B1 (en) * 2009-10-08 2013-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
ES2458354T3 (es) * 2010-03-10 2014-05-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de señales de audio, codificador de señales de audio, métodos y programa de ordenador que utiliza tasa de muestreo dependiente de la codificación del contorno de distorsión en el tiempo
EP2372703A1 (en) * 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
SG184230A1 (en) * 2010-03-26 2012-11-29 Agency Science Tech & Res Methods and devices for providing an encoded digital signal
KR101740359B1 (ko) * 2011-01-25 2017-05-26 니폰 덴신 덴와 가부시끼가이샤 부호화 방법, 부호화 장치, 주기성 특징량 결정 방법, 주기성 특징량 결정 장치, 프로그램, 기록 매체
JP5666021B2 (ja) 2011-02-14 2015-02-04 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 復号後オーディオ信号をスペクトル領域で処理する装置及び方法
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
BR112013020699B1 (pt) 2011-02-14 2021-08-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Aparelho e método para codificar e decodificar um sinal de áudio utilizando uma parte antecipada alinhada
AR085361A1 (es) 2011-02-14 2013-09-25 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio
AU2012217156B2 (en) 2011-02-14 2015-03-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
MX2012013025A (es) * 2011-02-14 2013-01-22 Fraunhofer Ges Forschung Representacion de señal de informacion utilizando transformada superpuesta.
EP2661745B1 (en) 2011-02-14 2015-04-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (usac)
MY166006A (en) 2011-02-14 2018-05-21 Fraunhofer Ges Forschung Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
JP5969513B2 (ja) 2011-02-14 2016-08-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 不活性相の間のノイズ合成を用いるオーディオコーデック
WO2012126893A1 (en) 2011-03-18 2012-09-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element length transmission in audio coding
TWI450266B (zh) * 2011-04-19 2014-08-21 Hon Hai Prec Ind Co Ltd 電子裝置及音頻資料的解碼方法
US9967600B2 (en) * 2011-05-26 2018-05-08 Nbcuniversal Media, Llc Multi-channel digital content watermark system and method
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
CN102855884B (zh) * 2012-09-11 2014-08-13 中国人民解放军理工大学 基于短时连续非负矩阵分解的语音时长调整方法
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备
US9548056B2 (en) * 2012-12-19 2017-01-17 Dolby International Ab Signal adaptive FIR/IIR predictors for minimizing entropy
CA2925734C (en) * 2013-10-18 2018-07-10 Guillaume Fuchs Coding of spectral coefficients of a spectrum of an audio signal
FR3015754A1 (fr) * 2013-12-20 2015-06-26 Orange Re-echantillonnage d'un signal audio cadence a une frequence d'echantillonnage variable selon la trame
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
JP6807033B2 (ja) * 2015-11-09 2021-01-06 ソニー株式会社 デコード装置、デコード方法、およびプログラム
US10074373B2 (en) * 2015-12-21 2018-09-11 Qualcomm Incorporated Channel adjustment for inter-frame temporal shift variations
JP6730438B2 (ja) 2016-01-22 2020-07-29 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法
KR20220054645A (ko) * 2019-09-03 2022-05-03 돌비 레버러토리즈 라이쎈싱 코오포레이션 저지연, 저주파 효과 코덱
TWI752551B (zh) * 2020-07-13 2022-01-11 國立屏東大學 迅吃偵測方法、迅吃偵測裝置與電腦程式產品

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0680033A2 (en) * 1994-04-14 1995-11-02 AT&T Corp. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US20010023399A1 (en) * 2000-03-09 2001-09-20 Jun Matsumoto Audio signal processing apparatus and signal processing method of the same
TW493161B (en) * 1999-09-22 2002-07-01 Conexant Systems Inc System of encoding and decoding speech signals
US20040102969A1 (en) * 1998-12-21 2004-05-27 Sharath Manjunath Variable rate speech coding
TW200719319A (en) * 2005-11-03 2007-05-16 Coding Tech Ab Time warped modified transform coding of audio signals
TW200822062A (en) * 2006-08-22 2008-05-16 Qualcomm Inc Time-warping frames of wideband vocoder

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
JP3076859B2 (ja) 1992-04-20 2000-08-14 三菱電機株式会社 ディジタルオーディオ信号の信号処理装置
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
JPH0784597A (ja) * 1993-09-20 1995-03-31 Fujitsu Ltd 音声符号化装置および音声復号化装置
FI105001B (fi) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ATE302991T1 (de) 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6449590B1 (en) * 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US7047185B1 (en) 1998-09-15 2006-05-16 Skyworks Solutions, Inc. Method and apparatus for dynamically switching between speech coders of a mobile unit as a function of received signal quality
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6223151B1 (en) 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
DE19910833C1 (de) 1999-03-11 2000-05-31 Mayer Textilmaschf Kurzketten-Schärmaschine
EP1099215B1 (en) 1999-05-26 2005-02-23 Koninklijke Philips Electronics N.V. Audio signal transmission system
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6366880B1 (en) 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
US6850884B2 (en) * 2000-09-15 2005-02-01 Mindspeed Technologies, Inc. Selection of coding parameters based on spectral content of a speech signal
BR0107420A (pt) 2000-11-03 2002-10-08 Koninkl Philips Electronics Nv Processos de codificação de um sinal de entrada e de decodificação, sinal modificado modelado, meio de armazenagem, decodificador, reprodutor de áudio, e ,aparelho para codificação de sinais
US6925435B1 (en) 2000-11-27 2005-08-02 Mindspeed Technologies, Inc. Method and apparatus for improved noise reduction in a speech encoder
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
CN100338650C (zh) * 2001-04-05 2007-09-19 皇家菲利浦电子有限公司 时标扩展方法、时标修改装置和接收音频信号的接收器
FI110729B (fi) 2001-04-11 2003-03-14 Nokia Corp Menetelmä pakatun audiosignaalin purkamiseksi
AU2002307533B2 (en) 2001-05-10 2008-01-31 Dolby Laboratories Licensing Corporation Improving transient performance of low bit rate audio coding systems by reducing pre-noise
DE20108778U1 (de) * 2001-05-25 2001-08-02 Mannesmann VDO AG, 60388 Frankfurt Gehäuse für ein in einem Fahrzeug verwendbares Gerät zur automatischen Ermittlung von Straßenbenutzungsgebühren
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
EP1278185A3 (en) 2001-07-13 2005-02-09 Alcatel Method for improving noise reduction in speech transmission
US6963842B2 (en) 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
KR20040060946A (ko) * 2001-10-26 2004-07-06 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코더에서의 사인곡선의 파라미터의 추적
CA2365203A1 (en) * 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP2003316392A (ja) 2002-04-22 2003-11-07 Mitsubishi Electric Corp オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置
US7457757B1 (en) 2002-05-30 2008-11-25 Plantronics, Inc. Intelligibility control for speech communications systems
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
TWI288915B (en) 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US7043423B2 (en) 2002-07-16 2006-05-09 Dolby Laboratories Licensing Corporation Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
EP1550108A2 (en) * 2002-10-11 2005-07-06 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US20040181411A1 (en) * 2003-03-15 2004-09-16 Mindspeed Technologies, Inc. Voicing index controls for CELP speech coding
JP4629353B2 (ja) * 2003-04-17 2011-02-09 インベンテイオ・アクテイエンゲゼルシヤフト エスカレータまたは動く歩道のための移動手摺り駆動装置
KR100732659B1 (ko) * 2003-05-01 2007-06-27 노키아 코포레이션 가변 비트 레이트 광대역 스피치 음성 코딩시의 이득양자화를 위한 방법 및 장치
US7363221B2 (en) 2003-08-19 2008-04-22 Microsoft Corporation Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation
KR100604897B1 (ko) 2004-09-07 2006-07-28 삼성전자주식회사 하드 디스크 드라이브 조립체, 하드 디스크 드라이브의장착 구조 및 이를 채용한 휴대폰
KR100640893B1 (ko) 2004-09-07 2006-11-02 엘지전자 주식회사 음성 인식용 베이스밴드 모뎀 및 이동통신용 단말기
WO2006079813A1 (en) 2005-01-27 2006-08-03 Synchro Arts Limited Methods and apparatus for use in sound modification
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
CN101167125B (zh) * 2005-03-11 2012-02-29 高通股份有限公司 用于对声码器内的帧进行相位匹配的方法及设备
RU2381572C2 (ru) * 2005-04-01 2010-02-10 Квэлкомм Инкорпорейтед Системы, способы и устройство широкополосного речевого кодирования
JP4550652B2 (ja) 2005-04-14 2010-09-22 株式会社東芝 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法
US7885809B2 (en) 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
EP1875464B9 (en) 2005-04-22 2020-10-28 Qualcomm Incorporated Method, storage medium and apparatus for gain factor attenuation
JP4450324B2 (ja) 2005-08-15 2010-04-14 日立オートモティブシステムズ株式会社 内燃機関の始動制御装置
JP2007084597A (ja) 2005-09-20 2007-04-05 Fuji Shikiso Kk 表面処理カーボンブラック組成物およびその製造方法
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
ES2391116T3 (es) 2006-02-23 2012-11-21 Lg Electronics Inc. Método y aparato para procesar una señal de audio
TWI294107B (en) 2006-04-28 2008-03-01 Univ Nat Kaohsiung 1St Univ Sc A pronunciation-scored method for the application of voice and image in the e-learning
RU2418322C2 (ru) 2006-06-30 2011-05-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер, аудиодекодер и аудиопроцессор, имеющий динамически изменяющуюся характеристику перекоса
US8682652B2 (en) * 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US7873511B2 (en) * 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
CN101136901B (zh) * 2006-08-18 2012-11-21 广州广晟数码技术有限公司 用于处理基于帧的数据的方法和系统
CN101025918B (zh) 2007-01-19 2011-06-29 清华大学 一种语音/音乐双模编解码无缝切换方法
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
PT2410522T (pt) 2008-07-11 2018-01-09 Fraunhofer Ges Forschung Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador
JP5297891B2 (ja) 2009-05-25 2013-09-25 京楽産業.株式会社 遊技機
US9269366B2 (en) 2009-08-03 2016-02-23 Broadcom Corporation Hybrid instantaneous/differential pitch period coding
EP2492911B1 (en) 2009-10-21 2017-08-16 Panasonic Intellectual Property Management Co., Ltd. Audio encoding apparatus, decoding apparatus, method, circuit and program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0680033A2 (en) * 1994-04-14 1995-11-02 AT&T Corp. Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
US20040102969A1 (en) * 1998-12-21 2004-05-27 Sharath Manjunath Variable rate speech coding
TW493161B (en) * 1999-09-22 2002-07-01 Conexant Systems Inc System of encoding and decoding speech signals
US20010023399A1 (en) * 2000-03-09 2001-09-20 Jun Matsumoto Audio signal processing apparatus and signal processing method of the same
TW200719319A (en) * 2005-11-03 2007-05-16 Coding Tech Ab Time warped modified transform coding of audio signals
TW200822062A (en) * 2006-08-22 2008-05-16 Qualcomm Inc Time-warping frames of wideband vocoder

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI692754B (zh) * 2017-09-07 2020-05-01 大陸商電信科學技術研究院有限公司 有限衝激回應濾波器係數向量的可持續更新方法及裝置
US11295752B2 (en) 2017-09-07 2022-04-05 China Academy Of Telecommunications Technology Method and device of sustainably updating coefficient vector of finite impulse response filter

Also Published As

Publication number Publication date
AR072498A1 (es) 2010-09-01
PL2260485T3 (pl) 2013-08-30
WO2010003582A1 (en) 2010-01-14
AR072739A1 (es) 2010-09-15
JP2014130359A (ja) 2014-07-10
KR101205593B1 (ko) 2012-11-27
RU2509381C2 (ru) 2014-03-10
ATE532177T1 (de) 2011-11-15
JP2011521303A (ja) 2011-07-21
KR20100125372A (ko) 2010-11-30
RU2010139022A (ru) 2012-03-27
RU2486484C2 (ru) 2013-06-27
ES2404132T3 (es) 2013-05-24
CA2718859C (en) 2015-09-29
KR101205644B1 (ko) 2012-11-27
PL2257945T3 (pl) 2012-04-30
ATE532176T1 (de) 2011-11-15
BRPI0906320B1 (pt) 2021-05-18
CN102007531B (zh) 2013-08-21
US9043216B2 (en) 2015-05-26
AU2009267485B2 (en) 2011-10-06
JP5323180B2 (ja) 2013-10-23
CN102007536B (zh) 2012-09-05
US20110158415A1 (en) 2011-06-30
MY154452A (en) 2015-06-15
TWI453732B (zh) 2014-09-21
MX2010010749A (es) 2010-11-30
US20110161088A1 (en) 2011-06-30
MX2010010748A (es) 2010-11-30
CA2718857C (en) 2014-09-09
CA2718740A1 (en) 2010-01-14
EP2257944A1 (en) 2010-12-08
EP2260485B1 (en) 2013-04-03
AU2009267484B2 (en) 2011-09-01
RU2010139023A (ru) 2012-03-27
JP5323179B2 (ja) 2013-10-23
CN102007537A (zh) 2011-04-06
CA2718740C (en) 2015-10-27
KR20100134625A (ko) 2010-12-23
CN102007537B (zh) 2013-08-28
RU2010139021A (ru) 2012-03-27
JP6041815B2 (ja) 2016-12-14
KR101205615B1 (ko) 2012-11-27
AU2009267486B2 (en) 2011-09-15
BRPI0906320A2 (pt) 2020-01-14
AU2009267485A1 (en) 2010-01-14
TW201009809A (en) 2010-03-01
TWI451402B (zh) 2014-09-01
US9299363B2 (en) 2016-03-29
EP2257945A1 (en) 2010-12-08
HK1151620A1 (en) 2012-02-03
WO2010003581A1 (en) 2010-01-14
US20110106542A1 (en) 2011-05-05
BRPI0906300A2 (pt) 2020-09-24
ES2376974T3 (es) 2012-03-21
AR072500A1 (es) 2010-09-01
CN102007536A (zh) 2011-04-06
EP2257944B1 (en) 2011-11-02
CN102007531A (zh) 2011-04-06
AU2009267486A1 (en) 2010-01-14
ES2376849T3 (es) 2012-03-20
BRPI0906300B1 (pt) 2021-11-09
JP5551686B2 (ja) 2014-07-16
TW201009810A (en) 2010-03-01
CA2718859A1 (en) 2010-01-14
JP2011521304A (ja) 2011-07-21
US9025777B2 (en) 2015-05-05
MX2010010747A (es) 2010-11-30
PL2257944T3 (pl) 2012-04-30
KR20100134627A (ko) 2010-12-23
CA2718857A1 (en) 2010-01-14
TW201009811A (en) 2010-03-01
BRPI0906319A2 (pt) 2023-03-14
EP2257945B1 (en) 2011-11-02
AU2009267484A1 (en) 2010-01-14
WO2010003583A1 (en) 2010-01-14
HK1151883A1 (en) 2012-02-10
JP2011521305A (ja) 2011-07-21
HK1151619A1 (en) 2012-02-03
EP2260485A1 (en) 2010-12-15
RU2527760C2 (ru) 2014-09-10

Similar Documents

Publication Publication Date Title
TWI459374B (zh) 音訊信號解碼器、時間扭曲輪廓資料提供器、方法及電腦程式
BRPI0906319B1 (pt) Decodificador de sinal de áudio, codificador de sinal de áudio, representação de sinal de áudio multi-canal codificado e métodos