TWI585751B - 具有動態範圍控制中有效增益編碼之音訊編碼器裝置及音訊解碼器裝置 - Google Patents
具有動態範圍控制中有效增益編碼之音訊編碼器裝置及音訊解碼器裝置 Download PDFInfo
- Publication number
- TWI585751B TWI585751B TW104109407A TW104109407A TWI585751B TW I585751 B TWI585751 B TW I585751B TW 104109407 A TW104109407 A TW 104109407A TW 104109407 A TW104109407 A TW 104109407A TW I585751 B TWI585751 B TW I585751B
- Authority
- TW
- Taiwan
- Prior art keywords
- dynamic range
- range control
- control frame
- nodes
- node
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 79
- 230000005236 sound signal Effects 0.000 claims description 58
- 238000004590 computer program Methods 0.000 claims description 9
- 230000008929 regeneration Effects 0.000 claims description 5
- 238000011069 regeneration method Methods 0.000 claims description 5
- 230000001172 regenerating effect Effects 0.000 claims description 3
- 101710108306 Bifunctional dihydroflavonol 4-reductase/flavanone 4-reductase Proteins 0.000 description 102
- 101710170824 Dihydroflavonol 4-reductase Proteins 0.000 description 102
- 239000008186 active pharmaceutical agent Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
在此文件之上下文中的動態範圍控制(dynamic range control,DRC)指代一種用於以受控制方式來縮減音訊信號之動態範圍的數位信號處理技術[1]。藉由縮減響亮聲音分量之位準及/或放大音訊信號之軟部分來達成動態範圍之所要縮減。
用於DRC之典型應用係使音訊信號之動態性質適應於收聽環境。舉例而言,當在吵雜環境中收聽音樂時,應縮減動態範圍以便允許整體信號放大而不對所得經放大信號進行削波。在此狀況下,應(例如)借助於限制器來衰減高信號峰值。另外,應相對於響亮部分來放大軟信號分量以便改良其在吵雜收聽環境中之可懂度。
本發明之一目標係提供一種用於在音訊傳輸之上下文中之動態範圍控制的增強型概念。
此目標係由一種音訊編碼器裝置達成,該音訊編碼器裝置包含:一音訊編碼器,其經組配以用於自包含連續音訊訊框之一音訊信號產生一經編碼音訊位元串流;一動態範圍控制編碼器,其經組配以用於自對應於該音訊信號且包含連續動態範圍控制訊框之一動態範圍控制序列產生一經編碼動態範圍控制位元串流,其中該等動態範圍控制訊框中之每一動態範圍控制訊框包含一或多個節點,其中該一或多個節點中之每一節點包含用於該音訊信號之增益資訊及指示該增益資訊所對應之時間點的時間資訊;其中該動態範圍控制編碼器經組配成使得對於該等動態範圍控制訊框中之每一動態範圍控制訊框,該經編碼動態範圍控制位元串流包含一對應位元串流部分;其中該動態範圍控制編碼器經組配以用於執行一移位程序,其中將該等動態範圍控制訊框中之一個參考動態範圍控制訊框的該等節點中之一或多個節點選擇為經移位節點,其中將該一個參考動態範圍控制訊框之該一或多個經移位節點中之每一者的一位元表示嵌入於對應於該一個參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分中,其中將該等動態範圍控制訊框中之該一個參
考動態範圍控制訊框的該等節點中之每一剩餘節點的一位元表示嵌入至對應於該一個參考動態範圍控制訊框之該位元串流部分中。
本發明使用該音訊信號之編碼來解決音訊傳輸之情形,其中並不直接地將該增益資訊應用於該音訊信號,而是連同該經編碼音訊信號一起進行編碼及傳輸。在解碼器處,可解碼該音訊信號及該增益資訊兩者且可將該增益資訊應用於該對應音訊信號。如下文較詳細地所解釋,本發明達成該增益資訊之一有效編碼。更精確地,其避免該經編碼動態範圍控制位元串流中之位元速率峰值。
可藉由一音訊信號x(k)與一時變增益值g(k)之一簡單相乘來表達將動態範圍控制應用於該音訊信號之過程:y(k)=g(k)x(k) (1)
其中k表示一樣本時間索引。該增益g(k)之值可(例如)基於該音訊信號x(k)之均方根的一短期估計而計算。[1]中論述關於用以判定合適增益值之策略的較多細節。在下文中,吾人將該時變增益g(k)稱為一增益序列。
在下文中,解釋動態範圍控制增益序列之該編碼。首先,將該動態範圍控制增益序列劃分成所謂的增益樣本之動態範圍控制訊框,其含有固定數目個增益樣本。通常,將用於該等動態範圍控制訊框之一時間訊框大小選擇為等於該對應音訊編碼器之一音訊訊框的時間大小。在每一動態範圍控制訊框內,較佳地在一均一時間格線上選
擇所謂的節點。
此格線之間隔界定最高可用時間解析度,亦即,兩個節點之間的最小樣本距離等於具有該最高可用時間解析度之樣本。每一節點係由該動態範圍控制訊框內之樣本位置、用於彼位置之該增益資訊(其可被表達為一增益值)及(視情況)關於該等增益值在該等節點位置處之斜率的資訊表示。對於以下論述,將有用的是界定可在一個訊框內選擇之節點之最大數目。
該動態範圍控制編碼器(例如)藉由使用若干對連續增益節點之經量化差分值而編碼來自該等節點之該增益資訊。在該解碼器處,藉由基於該等節點之經傳輸資訊(增益值、該動態範圍控制訊框內之樣本位置及斜率資訊(在適用時))來使用樣條內插或線性內插而儘可能良好地重新建構該原始增益序列。
一種用於編碼該動態範圍控制增益序列之有效方法係使用若干對連續節點之增益差的一經量化值(通常以dB為單位)以及此等節點在該所考慮動態範圍控制訊框內之該等樣本位置的時間差。該斜率資訊通常並不被表示為兩個節點之間的一差。由於在一訊框內並不存在用於第一節點之先前節點,故並不以一差分方式來編碼其增益值,而是明確地編碼該等值。該第一節點之該時間差通常被判定為至該動態範圍控制訊框之開始的偏移。
該編碼器可接著將(例如)一預界定霍夫曼表(碼簿)之一固定碼字指派至若干對節點之該等增益及時間差
中之每一者。
在動態範圍控制解碼器處,解碼該動態範圍控制位元串流且重新建構該等經傳輸節點之該等位置處的該相關資訊(增益值、該動態範圍控制訊框內之樣本位置及斜率資訊(在適用時))。藉由若干對經傳輸及經解碼節點之間的內插來獲得用於一訊框內之該等剩餘增益樣本的該等增益值。若已傳輸該等增益節點之該斜率資訊,則該內插可基於樣條,或替代性地,僅在若干對節點之間的該等增益差可用且捨棄該斜率資訊才使用線性內插。
原則上,動態範圍控制編碼器/解碼器鏈可以兩種模式進行操作。所謂的全訊框模式指代在解碼對應於一參考動態範圍控制訊框之一經接收動態範圍控制位元串流之後可緊接地在內插之後基於該等經解碼節點來判定該參考動態範圍控制訊框之每一樣本位置處之該等增益的狀況。此暗示必須在每一訊框邊界處(亦即,在對應於該參考動態範圍控制訊框之最後樣本的該樣本位置處)傳輸一節點。若該動態範圍控制訊框長度為N,則此意謂該最後經傳輸節點必須位於該參考動態範圍控制訊框內之該樣本位置N處。
本發明避免此缺點,此係由於其基於被稱作「延遲模式」之第二模式。在此狀況下,無需針對該參考動態範圍控制訊框內之該最後樣本位置傳輸一節點。因此,該動態範圍控制解碼器必須等待解碼該參考動態範圍控制訊框之後的動態範圍控制訊框,以便執行在參考動態範圍控
制訊框內之該最後節點之後的所有增益值之該所需內插。此係因為必須知道該後續動態範圍控制訊框之第一節點的資訊以執行該參考動態範圍控制訊框之該最後節點與該後續動態範圍控制訊框之該第一節點之間的該內插,以便經由內插而判定此兩者之間的該增益值。
實務上,由使用該延遲模式以用於編碼該動態範圍控制資訊造成的延遲並非一問題。此係因為通常伴隨該動態範圍控制編碼方案之音訊編解碼器在隨後應用該等編碼及解碼步驟時亦引入一個音訊訊框之一固有延遲。此等音訊編解碼器之重要實例為ISO/IEC 13818-7、進階音訊編碼(MPEG-2 AAC)、ISO/IEC 14496-3、子部分4(MPEG-4 AAC),或ISO/IEC 23003-3、部分3、通用話語及音訊編碼(USAC)。此等音訊編碼方案需要參考音訊訊框及該參考音訊訊框之後的音訊訊框,以便計算(使用一重疊相加結構)對應於該參考動態範圍控制音訊訊框之正確音訊樣本。
重要的是應注意,充分地近似該原始動態範圍控制增益序列所需要之節點之數目在動態範圍控制訊框之間顯著地變化。彼情形係由如下事實引起:與僅必須編碼緩慢改變之增益值的狀況相比較,需要較多節點以表示高度時變增益。此觀察暗示用以傳輸增益序列之所需位元速率可在訊框之間顯著地變化。一些訊框可要求編碼大數目個節點,從而引起高位元速率峰值。此情形尤其是在包含該經編碼動態範圍控制位元串流及該經編碼音訊位元串流之一聯合位元串流中傳輸該音訊信號及該動態範圍控制增益
序列時(其應具有幾乎恆定位元速率)並非合乎需要的。接著,該動態範圍控制相關位元速率中之一峰值縮減用於該音訊編碼器之可用位元速率,此情形常常引起解碼之後的音訊品質的退化。然而,在運用用於動態範圍控制增益序列之該編碼的目前技術水平之方法的情況下,僅藉由縮減經選擇以表示彼訊框內之該增益序列的節點之該數目達成一定訊框中之該動態範圍控制相關位元速率之一縮減。此情形再次可在該原始增益序列與該動態範圍控制解碼過程之後重新建構的增益序列之間導致大誤差。本發明藉由縮減經編碼動態範圍控制位元串流之該等峰值位元速率來克服此等缺點,而不增加該原始序列與該經重新建構動態範圍控制序列之間的該誤差。
在此章節中,呈現根據本發明的動態範圍控制增益序列之該編碼。與並不使用所提出方法之狀況相比較,本發明允許在不改變所得位元串流序列之情況下控制一參考動態範圍控制訊框所需要之該峰值位元速率。該所提出方法利用由目前技術水平之音訊編碼器引入的一個訊框之該固有延遲以藉由將一個訊框內之節點中之一些的傳輸分佈至下一後續動態範圍控制訊框來縮減該等節點之數目的峰值。下文中呈現該所提出方法之細節。
如上文所解釋,當與相對於該等動態範圍控制增益引入一訊框延遲之一音訊編碼方案進行組合時,在應用於該音訊信號之前將經解碼動態範圍控制增益延遲一個訊框。此意謂將該參考動態範圍控制訊框之該等節點應用於
該參考動態範圍控制訊框之後的動態範圍控制訊框處的有效音訊解碼器輸出。此暗示:在該預設延遲模式中,足以在無直接地對該解碼器處之該對應音訊輸出信號之延遲的情況下傳輸該參考動態範圍控制訊框之該等節點連同該參考動態範圍控制訊框之後的該動態範圍控制訊框之該等節點且應用該等對應動態範圍控制增益。
在本發明中利用此事實以便縮減在一個動態範圍控制訊框內傳輸之節點之最大數目。根據本發明,將該參考動態範圍控制訊框之該等節點中之一些移位至該後續動態範圍控制訊框,此可在編碼之前進行。如下文中將論述,該等經移位節點可在該後續動態範圍控制訊框中之該第一節點「之前」以僅用於編碼該等增益差及該斜率資訊。為了編碼時間差資訊,可應用一不同方法。
根據本發明之一較佳實施例,在該參考動態範圍控制訊框之該等節點之一數目大於一預界定臨限值的狀況下起始該移位程序。
根據本發明之一較佳實施例,在該參考動態範圍控制訊框之該等節點之一數目與待嵌入於對應於該參考動態範圍控制訊框之該位元串流部分中的來自該參考動態範圍控制訊框之前的動態範圍控制訊框之經移位節點之一數目的一總和大於一預界定臨限值的狀況下起始該移位程序。
根據本發明之一較佳實施例,在該參考動態範圍控制訊框之該等節點之一數目與待嵌入於對應於該參考動
態範圍控制訊框之該位元串流部分中的來自該參考動態範圍控制訊框之前的該動態範圍控制訊框之經移位節點之一數目的一總和大於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該等節點之一數目的狀況下起始該移位程序。
獨立於起始該移位程序所界定之條件,不應將該參考動態範圍控制訊框之該第一節點移位至該後續動態範圍控制訊框,此係由於其值需要用於在該參考動態範圍控制訊框之該開始處內插該等增益控制值。此外,一節點應僅移位一次,以便在解碼該位元串流時避免一延遲。
根據本發明之一較佳實施例,將該一或多個節點之該時間資訊表示成使得可藉由使用該時間資訊來識別該一或多個經移位節點。
根據本發明之一較佳實施例,該一或多個經移位節點之該時間資訊係由自該各別節點所屬的該動態範圍控制訊框之一開始至該各別節點在該各別節點所屬於的該動態範圍控制訊框內之時間位置之一時間差與大於或等於該各別動態範圍控制訊框之後的該動態範圍控制訊框之時間大小之一偏移值的一總和表示。
根據本發明之一較佳實施例,在對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的一第一位置處的該經移位節點之該位元表示的該增益資訊係由一絕對增益值表示,且其中在該節點之該位元表示之後的一位置處的該經移位節點之每一位元表示的該
增益資訊係由等於該各別經移位節點之該位元表示的一增益值與該各別節點之該位元表示之前的該節點之該位元表示的該增益值之一差的一相對增益值表示,該節點在對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的該第一位置處。
根據本發明之較佳實施例,在該參考動態範圍控制訊框之一或多個經移位節點的該等位元表示嵌入於對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分中的狀況下,在該一或多個經移位節點之該等位元表示的該一或多個位置之後的對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的一第一位置處的該後續動態範圍控制訊框之該節點的該位元表示之該增益資訊係由等於該各別節點之該位元表示的一增益值與該各別節點之該位元表示之前的該經移位節點之該位元表示的一增益值之一差的一相對增益值表示。
根據本發明之一較佳實施例,該等音訊訊框之一時間大小等於該等動態範圍控制訊框之一時間大小。
根據本發明之一較佳實施例,該動態範圍控制訊框中之一者的該一或多個節點係選自一均一時間格線。
根據本發明之一較佳實施例,該一或多個節點中之每一節點包含斜率資訊。
根據本發明之一較佳實施例,該動態範圍控制編碼器經組配以用於使用一熵編碼技術(諸如,霍夫曼編碼或
算術編碼)來編碼該等節點。
該編碼器可將(例如)一預界定霍夫曼表(碼簿)之一固定碼字指派至若干對節點之該等增益及時間差中之每一者。表1及表2中分別給出用於編碼若干對連續節點之該等時間差的合適霍夫曼表之實例。
在本發明之一另外態樣中,該目標係由一種音訊解碼器裝置達成,該音訊解碼器裝置包含:一音訊解碼器,其經組配以用於解碼一經編碼音訊位元串流,以便再生包含連續音訊訊框之一音訊信號;一動態範圍控制解碼器,其經組配以用於解碼一經編碼動態範圍控制位元串流,以便再生對應於該音訊信號且包含連續動態範圍控制訊框之一動態範圍控制序列;其中對於該等動態範圍控制訊框中之每一動態範圍控
制訊框,該經編碼動態範圍控制位元串流包含一對應位元串流部分;其中該經編碼動態範圍控制位元串流包含節點之位元表示,其中該等節點中之一個節點的每一位元表示包含用於該音訊信號AS之增益資訊及指示該增益資訊所對應之時間點的時間資訊;其中該經編碼動態範圍控制位元串流包含選自該等動態範圍控制訊框中之一個參考動態範圍控制訊框的該等節點之經移位節點的位元表示,其嵌入於對應於該一個參考動態範圍控制訊框之後的該動態範圍控制訊框之一位元串流部分中,其中將該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點中之每一剩餘節點的該位元表示嵌入至對應於該一個參考動態範圍控制訊框之該位元串流部分中;且其中該動態範圍控制解碼器經組配以用於解碼該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等剩餘節點中之每一剩餘節點的該位元表示,以便再生該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的每一剩餘節點;用於解碼選自該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點之該等經移位節點中之每一經移位節點的該位元表示,以便再生選自該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點之該等經移位節點中的每一經移位節點;及用於組合該等所再生剩餘節點與該等所再生經移位節點,以便重新
建構該參考動態範圍控制訊框。
該動態範圍控制解碼器接收該動態範圍控制位元串流。可以下列方式來解碼對應於節點資訊(樣本位置、增益值及斜率資訊(在適用時))之該動態範圍控制位元串流:基於(例如)一霍夫曼碼簿中所展示之該等規則,自該經接收碼字判定用於兩個節點之間的一時間差的值(例如,為兩個節點之間的最小距離之一整數倍)。藉由將該時間差值加至針對該先前節點所計算之樣本位置值來獲得該當前經解碼節點之對應樣本位置。
在解碼該參考動態範圍控制訊框之該等節點之後,解碼該後續動態範圍控制訊框之該等節點。
若該後續動態範圍控制訊框內之該所判定樣本位置對應於大於一後續動態範圍控制訊框之長度的一值,則該動態範圍控制解碼器知道當前時間節點資訊指代最初位於該參考動態範圍控制訊框中之一節點。
為了獲得該參考動態範圍控制訊框內之正確樣本位置,自該所計算樣本位置減去一偏移。一實用實例為減去對應於一動態範圍控制訊框之該長度的該值(此暗示該編碼器已將該相同值加至原始樣本位置)。該偏移值之一典型實例為一動態範圍控制訊框之該時間大小。
在解碼該整個後續動態範圍控制訊框中之所有節點的該時間資訊之後且在適用時校正該時間資訊,該解碼器知道多少節點已移位回至該參考動態範圍控制訊框
(而不在該編碼器處明確地提供此資訊)及其在該參考動態範圍控制訊框內位於哪一樣本位置。
該動態範圍控制解碼器進一步藉由解碼該位元串流中之差分增益資訊來判定一經接收訊框之所有節點的該增益值資訊。
自該時間資訊之該解碼步驟,該解碼器知道必須將多少該等經解碼增益值指派給該參考動態範圍控制訊框之該等節點(及指派給的樣本位置)及將哪些增益值指派給該參考動態範圍控制訊框中之節點。
類似於該等增益值之該解碼過程而執行斜率資訊之該解碼及至正確節點之該指派。
在解碼該後續動態範圍控制訊框之所有節點之後,可保證經由內插針對該參考動態範圍控制訊框之每一樣本計算該等增益值所需要之所有節點係可用的。在該內插步驟之後,可將每一樣本之該等動態範圍控制增益值應用於對應正確音訊樣本。
根據本發明之一較佳實施例,該動態範圍控制解碼器經組配以用於藉由使用該時間資訊來識別該一或多個經移位節點。
根據本發明之一較佳實施例,該動態範圍控制解碼器經組配以用於解碼該一或多個經移位節點之該時間資訊,該時間資訊係由自該各別節點所屬的該動態範圍控制訊框之一開始至該各別節點在該各別節點所屬的該動態範圍控制訊框內之時間位置之一時間與大於或等於該各別動
態範圍控制訊框之後的該動態範圍控制訊框之一時間大小之一偏移值的一總和表示。
根據本發明之較佳實施例,該動態範圍控制解碼器經組配以用於解碼在對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的一第一位置處的該經移位節點之該位元表示的該增益資訊,該增益資訊係由絕對增益值表示,且其中在該節點之該位元表示之後的一位置處的該等經移位節點之每一位元表示的該增益資訊係由等於該各別經移位節點之該位元表示的一增益值與該各別節點之該位元表示之前的該節點之該位元表示的該增益值之一差的一相對增益值表示,該節點在對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的該第一位置處
根據本發明之一較佳實施例,該動態範圍控制解碼器經組配以用於解碼在該一或多個經移位節點之該等位元表示之該一或多個位置之後的對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的一第一位置處的該後續動態範圍控制訊框之該節點的該位元表示之該增益資訊,該增益資訊係由等於該各別節點之該位元表示的一增益值與該各別節點之該位元表示之前的該經移位節點之該位元表示的一增益值之一差的一相對增益值表示。
根據本發明之較佳實施例,該等音訊訊框之一時間大小等於該等動態範圍控制訊框之一時間大小。
根據本發明之一較佳實施例,該等動態範圍控制訊框中之一者的該一或多個節點係選自一均一時間格線。
根據本發明之較佳實施例,該一或多個節點中之每一節點包含斜率資訊。
根據本發明之較佳實施例,該動態範圍控制解碼器經組配以用於使用一熵解碼技術來解碼該等節點之該等位元表示。
該目標係進一步由一種系統獲得,該系統包含根據本發明之一音訊編碼器裝置及根據本發明之一音訊解碼器裝置。
本發明進一步提供一種用於操作一音訊編碼器之方法,該方法包含如下步驟:自包含連續音訊訊框之一音訊信號產生一經編碼音訊位元串流;自對應於該音訊信號且包含連續動態範圍控制訊框之一動態範圍控制序列產生經編碼動態範圍控制位元串流,其中該等動態範圍控制訊框中之每一動態範圍控制訊框包含一或多個節點,其中該一或多個節點中之每一節點包含用於該音訊信號之增益資訊及指示該增益資訊所對應之時間點的時間資訊
其中對於該等動態範圍控制訊框中之每一動態範圍控制訊框,該經編碼動態範圍控制位元串流包含一對應位元串流部分;執行一移位程序,其中將該等動態範圍控制訊框中之
一個參考動態範圍控制訊框的該等節點中之一或多個節點選擇為經移位節點,其中將該一個參考動態範圍控制訊框之該一或多個經移位節點中之每一者的一位元表示嵌入於對應於該一個參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分中,其中將該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點中之每一剩餘節點的一位元表示嵌入至對應於該一個參考動態範圍控制訊框之該位元串流部分中。
本發明進一步提供一種用於操作一音訊解碼器之方法,該方法包含如下步驟:解碼一經編碼音訊位元串流,以便再生包含連續音訊訊框之一音訊信號;解碼一經編碼動態範圍控制位元串流,以便再生對應於該音訊信號且包含連續動態範圍控制訊框之一動態範圍控制序列;其中對於該等動態範圍控制訊框中之每一動態範圍控制訊框,該經編碼動態範圍控制位元串流包含一對應位元串流部分;其中該經編碼動態範圍控制位元串流包含節點之位元表示,其中該等節點中之一個節點的每一位元表示包含用於該音訊信號AS之增益資訊及指示該增益資訊所對應之時間點的時間資訊;其中該經編碼動態範圍控制位元串流包含選自該等動態範圍控制訊框中之一個參考動態範圍控制訊框的該等節
點之經移位節點的位元表示,其嵌入於對應於該一個參考動態範圍控制訊框之後的該動態範圍控制訊框之一位元串流部分中,其中將該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點中之每一剩餘節點的該位元表示嵌入至對應於該一個參考動態範圍控制訊框之該位元串流部分中;且其中解碼該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等剩餘節點中之每一剩餘節點的該位元表示,以便再生該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的每一剩餘節點;其中解碼選自該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點之該等經移位節點中的每一經移位節點的該位元表示,以便再生選自該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點之該等經移位節點中的每一經移位節點;且其中組合該等所再生剩餘節點與該等所再生經移位節點,以便重新建構該參考動態範圍控制訊框。
在另一態樣中,本發明提供一種程式,其用於在執行於一處理器上時執行根據本發明之該方法。
1‧‧‧音訊編碼器裝置
2‧‧‧音訊編碼器
3‧‧‧動態範圍控制編碼器
4‧‧‧音訊解碼器裝置
5‧‧‧音訊解碼器
6‧‧‧動態範圍控制解碼器
ABS‧‧‧經編碼音訊位元串流
AS‧‧‧音訊信號
AFP‧‧‧前一音訊訊框
AFR‧‧‧參考音訊訊框
AFS‧‧‧後續音訊訊框
A'0...A'5、B'0...B'2、C'0‧‧‧位元表示
DBS‧‧‧經編碼動態範圍控制位元串流
DS‧‧‧動態範圍控制序列
DFP‧‧‧前一動態範圍控制訊框
DFR‧‧‧參考動態範圍控制訊框
DFS‧‧‧後續動態範圍控制訊框
A0...A5‧‧‧先前動態範圍控制訊框之節點
Ai‧‧‧第n訊框之節點
B0...B2‧‧‧參考動態範圍控制訊框之節點
C0‧‧‧後續動態範圍控制訊框之節點
DFP'‧‧‧對應於先前動態範圍控制訊框之位元串流部分
DFR'‧‧‧對應於參考動態範圍控制訊框之位元串流部分
DFS'‧‧‧對應於後續動態範圍控制訊框之位元串流部分
GA0...GA5‧‧‧先前動態範圍控制訊框之節點的增益資訊
GB0...GB2‧‧‧參考動態範圍控制訊框之節點的增益資訊
GC0‧‧‧後續動態範圍控制訊框之節點的增益資訊
g_A0...g_A5‧‧‧先前動態範圍控制訊框之節點的增益值
g_Ai‧‧‧節點Ai之增益值
g_B0...g_B2‧‧‧參考動態範圍控制訊框之節點的增益值
g_C0‧‧‧後續動態範圍控制訊框之節點的增益值
SA0...SA5‧‧‧先前動態範圍控制訊框之節點的斜率資訊
SB0...SB2‧‧‧參考動態範圍控制訊框之節點的斜率資訊
SC0‧‧‧後續動態範圍控制訊框之節點的斜率資訊
TA0...TA5‧‧‧先前動態範圍控制訊框之節點的時間資訊
t_Ai‧‧‧節點Ai在訊框內之可能節點位置格線上的樣本位置
TB0...TB2‧‧‧參考動態範圍控制訊框之節點的時間資訊
TC0...後續動態範圍控制訊框之節點的時間資訊
t_A0...t_A5‧‧‧先前動態範圍控制訊框之節點的時間差
t_B0...t_B2‧‧‧參考動態範圍控制訊框之節點的時間差
t_C0‧‧‧後續動態範圍控制訊框之節點的時間差
隨後關於隨附圖式來論述本發明之較佳實施例,在圖式中:圖1以示意圖說明根據本發明的音訊編碼器裝置之實施例;
圖2以示意圖說明在音訊編碼之上下文中應用之動態範圍控制的原理;圖3以示意圖說明用於動態範圍控制增益序列之編碼的不同模式;圖4以示意圖說明在音訊編碼之上下文中的動態範圍控制之應用;圖5以示意圖說明根據本發明的用於節點之移位程序;圖6以示意圖說明根據本發明的時間資訊之編碼;圖7以示意圖說明根據本發明的增益資訊之編碼;圖8以示意圖說明根據本發明的斜率資訊之編碼;及圖9以示意圖說明根據本發明的音訊解碼器裝置之實施例。
圖1以示意圖說明根據本發明的音訊編碼器裝置1之實施例。音訊編碼器裝置1包含:音訊編碼器2,其經組配以用於自包含連續音訊訊框AFP、AFR、AFS之音訊信號AS產生經編碼音訊位元串流ABS;動態範圍控制編碼器3,其經組配以用於自對應於音訊信號AS且包含連續動態範圍控制訊框DFP、DFR、DFS之動態範圍控制序列DS產生經編碼動態範圍控制位元串流DBS,其中動態範圍控制訊框DFP、DFR、DFS中之每一動態範圍控制訊框DFP、DFR、DFS包含一或多個節點
A0...A5、B0...B2、C0,其中一或多個節點A0...A5、B0...B2、C0中之每一節點包含用於音訊信號AS之增益資訊GA0...GA5、GB0...GB2、GC0及指示增益資訊GA0...GA5、GB0...GB2、GC0所對應之時間點的時間資訊TA0...TA5、TB0...TB2、TC0;其中動態範圍控制編碼器3經組配成使得對於動態範圍控制訊框DFP、DFR、DFS中之每一動態範圍控制訊框DFP、DFR、DFS,經編碼動態範圍控制位元串流DBS包含對應位元串流部分DFP'、DFR'、DFS';其中動態範圍控制編碼器2經組配以用於執行移位程序,其中將動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2中之一或多個節點B1、B2選擇為經移位節點B1、B2,其中將一個參考動態範圍控制訊框DFR之一或多個經移位節點B1、B2中之每一者的位元表示B'1、B'2嵌入於對應於一個參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分DFS'中,其中將動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2中之每一剩餘節點B0的位元表示B'0嵌入至對應於一個參考動態範圍控制訊框DFR之位元串流部分DFR'中。
與未使用所提出方法之狀況相比較,本發明允許在不改變所得位元串流序列DBS的情況下控制參考動態範圍控制訊框DFR所需要之峰值位元速率。所提出方法利用由目前技術水平之音訊編碼器引入的一個訊框之固有延遲
以藉由將一個訊框內之節點中之一些的傳輸分佈至下一後續動態範圍控制訊框來縮減該等節點之數目的峰值。下文中呈現所提出方法之細節。
如上文所解釋,當與相對於動態範圍控制增益來引入訊框延遲之音訊編碼方案進行組合時,在應用於音訊信號之前將經解碼動態範圍控制增益延遲一個訊框。此意謂將參考動態範圍控制訊框之節點應用於參考動態範圍控制訊框之後的動態範圍控制訊框處之有效音訊解碼器輸出。此暗示:在預設延遲模式中,足以在無直接地對解碼器處之對應音訊輸出信號之延遲的情況下傳輸參考動態範圍控制訊框之節點連同在參考動態範圍控制訊框之後的動態範圍控制訊框之節點且應用對應動態範圍控制增益。
在本發明中利用此事實以便縮減在一個動態範圍控制訊框內傳輸之數目之最大節點。根據本發明,將參考動態範圍控制訊框之節點中之一些移位至後續動態範圍控制訊框,此可在編碼之前進行。如下文中將論述,經移位節點可在後續動態範圍控制訊框中之第一節點「之前」以僅用於編碼增益差及斜率資訊。為了編碼時間差資訊,可應用不同方法。
在圖1所展示之實例中,前一動態範圍控制訊框DFP含有六個節點A0...A5,其中節點A4、A5移位至位元串流部分DFR'中。此外,參考動態範圍控制訊框DFR含有三個節點B0...B2。經移位節點A4、A5及參考動態範圍控制訊框DFR之節點B0...B2之數目的總和等於五,其大於後續動
態範圍控制訊框DFS之節點C0之數目,使得將移位程序起始成使得節點B1、B2移位至位元串流部分DFS'中。儘管動態範圍控制訊框DFS、DFR、DFP內之節點之最大數目等於六,但位元串流部分DFS'、DFR'、DFP'自身內之節點之最大數目等於四,使得避免位元串流峰值。
根據本發明之較佳實施例,音訊訊框AFP、AFR、AFS之時間大小等於動態範圍控制訊框DFP、DFR、DFS之時間大小。
根據本發明之較佳實施例,動態範圍控制訊框DFP、DFR、DFS中之一者的一或多個節點A0...A5、B0...B2、C0係選自均一時間格線。
根據本發明之較佳實施例,動態範圍控制編碼器3經組配以用於使用熵編碼技術來編碼節點A0...A5、B0...B2、C0。
在一另外態樣中,本發明提供一種用於操作音訊編碼器1之方法,該方法包含如下步驟:自包含連續音訊訊框AFP、AFR、AFS之音訊信號AS產生經編碼音訊位元串流ABS;自對應於音訊信號AS且包含連續動態範圍控制訊框DFP、DFR、DFS之動態範圍控制序列DS產生經編碼動態範圍控制位元串流DBS,其中動態範圍控制訊框DFP、DFR、DFS中之每一動態範圍控制訊框DFP、DFR、DFS包含一或多個節點A0...A5、B0...B2、C0,其中一或多個節點A0...A5、B0...B2、C0中之每一節點包含用於音訊信號AS之
增益資訊GA0...GA5、GB0...GB2、GC0及指示該增益資訊所對應之時間點的時間資訊TA0...TA5、TB0...TB2、TC0
其中對於動態範圍控制訊框DFP、DFR、DFS中之每一動態範圍控制訊框DFP、DFR、DFS,經編碼動態範圍控制位元串流DBS包含對應位元串流部分DFP'、DFR'、DFS';執行移位程序,其中將動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2中之一或多個節點B1、B2選擇為經移位節點B1、B2,其中將一個參考動態範圍控制訊框DFR之一或多個經移位節點B1、B2中之每一者的位元表示B'1、B'2嵌入於對應於一個參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分DFS'中,其中將動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2中之每一剩餘節點B0的位元表示B'0嵌入至對應於一個參考動態範圍控制訊框DFR之位元串流部分DFR'中。
圖2以示意圖說明在音訊編碼之上下文中應用之動態範圍控制的原理。
可藉由音訊信號x(k)與時變增益值g(k)之簡單相乘來表達將DRC應用於信號之過程:y(k)=g(k)x(k) (1)
其中k表示樣本時間索引。增益g(k)之值係(例如)基於輸入信號x(k)之均方根的短期估計而計算。[1]中論述關於用以判定合適增益值之策略的較多細節。在下文中,吾人將時變增益g(k)稱為增益序列。
本發明參考音訊信號AS及動態範圍控制序列DS兩者被編碼及傳輸之應用情境。在此狀況下,並不將動態範圍控制增益直接地應用於音訊信號AS,而是連同經編碼音訊信號ABS一起進行編碼及傳輸。在解碼器4處,解碼音訊信號AS及動態範圍控制序列DS兩者,且將動態範圍控制資訊應用於對應音訊信號AS。
在一個態樣中,本發明提供一種系統,其包含根據本發明之音訊編碼器裝置1及根據本發明之音訊解碼器裝置4。
圖3以示意圖說明用於動態範圍控制增益序列之編碼的不同模式,即,全訊框模式(A)及延遲模式(B)。訊框n中接收之增益節點被展示為圓圈,且訊框n+1中接收之增益節點被展示為正方形。實線說明直至DRC訊框n+1之內插式DRC增益。
原則上,動態範圍控制編碼器/解碼器鏈可以兩種模式進行操作。所謂的全訊框模式指代在解碼對應於特定動態範圍控制訊框之經接收動態範圍控制位元串流之後可緊接地在內插之後基於經解碼節點來判定動態範圍控制訊框之每一樣本位置處之增益的狀況。此暗示必須在每一訊框邊界處(亦即,在對應於動態範圍控制訊框之最後樣本的樣本位置處)傳輸節點。若動態範圍控制訊框長度為N,則此意謂最後經傳輸節點必須位於彼訊框內之樣本位置N處。在圖3中之頂部處說明由「A」表示之此情形。如所展示,可緊接地將第n訊框之動態範圍控制增益應用於對應音
訊訊框。
第二模式被稱作「延遲模式」,且其在圖3之下部部分「B」中予以說明。在此狀況下,不存在針對訊框n內之最後樣本位置所傳輸的節點。因此,DRC解碼器必須等待解碼DRC訊框n+1,以便執行在訊框n內之最後節點之後的所有增益值之所需內插。此係因為必須知道訊框n+1之第一節點的資訊以執行訊框n之最後節點與訊框n+1中之第一節點之間的內插以便經由內插而判定此兩者之間的增益值。
圖4以示意圖說明在音訊編碼之上下文中的動態範圍控制之應用,其中音訊編碼器相對於動態範圍編碼方案引入一個訊框延遲。
圖5以示意圖說明根據本發明的用於節點之移位程序。左側展示當使用目前技術水平之方法時的情形,而右側展示所提出方法,其中每一正方形對應於一節點A0...A5、B0...B2、C0。
根據本發明之較佳實施例,在參考動態範圍控制訊框DFR之節點B0...B2之數目大於預界定臨限值的狀況下起始移位程序。
根據本發明之較佳實施例,在參考動態範圍控制訊框DFR之節點B0...B2之數目與待嵌入於對應於參考動態範圍控制訊框DFR之位元串流部分DFR'中的來自在參考動態範圍控制訊框DFR之前的動態範圍控制訊框DFP之經移位節點A4、A5之數目的總和大於預界定臨限值的狀況下起
始移位程序。
根據本發明之較佳實施例,在參考動態範圍控制訊框DFR之節點B0...B2之數目與待嵌入於對應於參考動態範圍控制訊框DFR之位元串流部分DFR'中的來自在參考動態範圍控制訊框DFR之前的動態範圍控制訊框DFP之經移位節點A4、A5之數目的總和大於參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之節點C0之數目的狀況下起始移位程序。
如上文所解釋,當與相對於動態範圍控制訊框引入訊框延遲之音訊編碼方案進行組合時,在應用於音訊信號之前將經解碼動態範圍控制增益延遲一個訊框。在考慮圖5中之左側的情況下,此意謂將第n訊框之節點Ai應用於訊框n+1處之有效音訊解碼器輸出。此暗示:在預設延遲模式中,將足以在直接地對解碼器處之對應音訊輸出信號之延遲的情況下傳輸節點Ai連同訊框n+1中之節點B0且應用對應DRC增益。
在所提出方法中利用此事實以縮減在一個訊框內傳輸之節點之最大數目。圖4中之右側說明此情形。在編碼之前將節點A4及A5移位至訊框n+1,亦即,在給定實例中將訊框n中之節點之最大數目自6縮減至4。如下文中將論述,節點A4及A5在訊框n+1中之第一節點(亦即,B0)「之前」以僅用於編碼增益差及斜率資訊。為了編碼時間差資訊,必須應用不同方法。
圖6以示意圖說明根據本發明的時間資訊之編
碼。
根據本發明之較佳實施例,將一或多個節點A0...A5、B0...B2、C0之時間資訊TA0...TA5、TB0...TB2、TC0表示成使得可藉由使用時間資訊TA4、TA5、TB1、TB2來識別一或多個經移位節點A4、A5、B1、B2。
根據本發明之較佳實施例,一或多個經移位節點A4、A5、B1、B2之時間資訊TA4、TA5、TB1、TB2係由自各別節點A4、A5、B1、B2所屬的動態範圍控制訊框DFP、DFR之開始至各別節點A4、A5、B1、B2在各別節點A4、A5、B1、B2所屬的動態範圍控制訊框DFP、DFR內之時間位置之時間差t_A4、t_A5、t_B1、t_B2與大於或等於各別動態範圍控制訊框DFP、DFR之後的動態範圍控制訊框DFR、DFS之時間大小之偏移值drcFrameSize的總和表示。
首先,吾人考慮若干對節點之間的時間差之編碼。在圖6中,針對根據圖4之實例描繪用於判定用於若干對節點之時間差的情形,其中t_Ai表示節點Ai在訊框內之可能節點位置格線上的樣本位置。如早先所論述,可在均一時間格線上選擇節點,其中此格線之間隔界定最高可用時間解析度deltaTmin。因此,在樣本中給出時間資訊t_Ai,其中兩個節點之間的時間差始終為deltaTmin之整數倍。
以差分方式(亦即,相對於先前節點之位置)來編碼一節點之時間位置資訊。若節點為訊框內之第一節點,則相對於訊框之開始來判定時間差。圖6之左側描繪在未應用節點移位之情況下的情形。在此狀況下,節點A4之差分
時間資訊tDrcDelta_A4被計算為tDrcDelta_A4=t_A4-t_A3。接著使用適當霍夫曼表中之對應項(例如,根據表1或表2)來編碼此差分時間值。作為另一實例,吾人查看節點B0之經編碼時間差。由於其為訊框n+1之第一節點,故相對於訊框之開始來判定對應時間差,亦即,tDrcDelta_B0=t_B0。
吾人現在考慮針對使用節點移位之所提出節點儲集層技術的節點位置之編碼。對於圖6之右側所展示的實例,節點A4及A5已移位至下一訊框以供編碼。節點A0至A3之表示尚未改變,且經編碼時間差因此亦未改變。節點B0之經編碼位置資訊亦如此。然而,現在不同地處理節點A4及節點A5之時間資訊。如圖6所展示,藉由加上偏移drcFrameSize而在編碼器處修改指示節點A4之樣本位置的原始值t_A4。由於所得位置資訊超過在規則編碼之狀況下將可能的最大值,故偏移向解碼器指示必須在先前訊框之上下文內進一步處理對應節點。此外,解碼器知道藉由自經解碼值減去偏移drcFrameSize來獲得原始樣本位置t_A4。
接下來,吾人考慮實際上針對圖6之右側所展示之情形而編碼的時間差資訊之計算。出於編碼效率原因,相對於節點B0來計算節點A4之差分位置資訊。與先前針對圖6之左側所論述的情形相對比,現在根據tDrcDelta_A4=t_A4+drcFrameSize-t_B0(亦即,藉由包括偏移)來計算差分時間資訊。類似地,對於節點A5,吾人獲得tDrcDelta_A5=t_A5+drcFrameSize-t_A4-arcFrameSize,其顯然與
tDrcDelta_A5=t_A5-t_A4相同。使用正確霍夫曼表之對應碼字項(例如,根據表1或表2)來編碼此等差分時間值。
用於解碼時間位置資訊之方法可被概述如下。解碼器基於來自位元串流之對應碼字來提取節點之時間差資訊。藉由將時間差資訊加至先前節點之時間資訊來獲得時間資訊。若所得樣本位置大於drcFrameSize,則解碼器知道必須如同目前節點為先前訊框中之最後節點一樣處理目前節點,亦即,必須將其附加至先前訊框中解碼之節點。藉由自經解碼時間值減去偏移值drcFrameSize來判定正確樣本位置。若在經解碼訊框中出現較多經移位節點,則以類似方式來應用相同處理步驟。
在解碼及校正整個訊框之時間資訊之後,解碼器知道多少節點已移位回至先前訊框(而不在編碼器處明確地提供此資訊)及其在先前訊框內位於哪一樣本位置。將在下文所描述的解碼增益及斜率資訊之上下文中進一步利用關於經移位節點之數目的資訊。
圖7以示意圖說明根據本發明的增益資訊之編碼。
根據本發明之較佳實施例,處於對應於參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分DFS'的第一位置處的經移位節點B1之位元表示B'1的增益資訊GB1係由絕對增益值g_B1表示,且其中在節點B1(其處於對應於參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分DFS'的第一位置處)之位元表
示B'1之後的位置處的經移位節點B2之每一位元表示B'2的增益資訊GB2係由等於各別經移位節點B2之位元表示B'2的增益值g_B2與各別節點B2之位元表示B'2之前的節點B1之位元表示B'1的增益值g_B1的差的相對增益值表示。
根據本發明之較佳實施例,在參考動態範圍控制訊框DFR之一或多個經移位節點B1、B2之位元表示B'1、B'2嵌入於對應於參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分DFS'中的狀況下,處於一或多個經移位節點B1、B2之位元表示B'1、B'2的一或多個位置之後的對應於參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分DFS'的第一位置處的後續動態範圍控制訊框DFS之節點C0的位元表示C'0之增益資訊GC0係由等於各別節點C0之位元表示C'0的增益值g_C0與各別節點C0之位元表示C'0之前的經移位節點B2之位元表示B'2的增益值g_B2的差的相對增益值表示。
在圖7中,針對根據圖5之實例描繪用於判定用於若干對節點之增益差的情形,其中g_Ai表示節點Ai之增益值。
首先,考慮用於節點A4之差分增益值。對於圖7之左側所描繪的無節點儲集層之方法,自前一節點A3與節點A4之增益值差計算差分增益值gainDelta_A4,亦即,gainDelta_A4=g_A4-g_A3。接著使用適當霍夫曼表中之對應項來編碼此差分增益值。此外,吾人考慮圖7之左側上的訊框n+1之第一節點。由於B0為彼訊框之第一節點,故並不
以差分方式而是根據初始增益值gainInitial之特定編碼來編碼其增益值,亦即,將增益值編碼為其實際值:gainDelta_B0=g_B0。
對於右側所展示情形,其中節點A4已移位至下一訊框n+1,經編碼增益資訊之值不同。可看出,在經移位之後,相對於編碼增益差,A4變成訊框n+1中之第一節點。因此,並不以差分方式來編碼其增益值,而是如上文所描述來應用初始增益值之特定編碼。對於左側及右側所展示之兩種情形,A5之差分增益值將保持相同。由於在使用節點儲集層的情況下節點B0現在跟隨節點A5,故將自節點B0及A5之增益差判定其增益資訊,亦即,gainDelta_B0=g_B0-g_A5。應注意,當應用節點儲集層技術時僅判定增益差之方式改變,而每一節點之經重新建構增益值保持相同。明顯地,在解碼訊框n及n+1之整個增益相關資訊之後,針對節點A0至B0所獲得之增益值相同於左側中獲得之增益值,且可「及時」計算節點以用於將DRC增益應用於對應音訊訊框。
如先前段落中所論述,在解碼時間差資訊之後知道經移位節點之數目及其在先前訊框內之樣本位置。如圖6之右側所說明,來自訊框n之經移位節點的增益值自訊框n+1之經接收增益資訊之開始緊接地起動。因此,關於經移位節點之數目的資訊足以使解碼器將每一增益值指派至正確訊框內之正確樣本位置。考慮圖6中之右側所展示的實例,解碼器知道訊框n+1之前兩個經解碼增益值必須附加至
先前訊框之最後增益值,而第三增益值對應於當前訊框中之第一節點的正確增益值。
圖8以示意圖說明根據本發明的斜率資訊之編碼。
根據本發明之較佳實施例,一或多個節點A0...A5、B0...B2、C0中之每一節點A0...A5、B0...B2、C0包含斜率資訊SA0...SA5、SB0...SB2、SC0。
接下來,考慮圖8所說明的斜率資訊之編碼。並非在若干對節點之間以差分方式來編碼節點之斜率資訊,而是針對每一節點獨立地編碼斜率資訊。因此,在使用節點儲集層及不使用節點儲集層之兩種狀況下,斜率相關資訊保持不變。如在編碼增益值之狀況下,對於使用所提出節點移位及不使用所提出節點移位之兩種狀況,用於產生用於斜率資訊之碼字的霍夫曼表保持相同。類似於解碼增益值之狀況而執行斜率資訊至正確訊框內之正確樣本位置的指派。
在針對訊框n+1所接收之所有節點資訊已被解碼且在適用時移位回至前一訊框n之後,可以常見方式來執行用於訊框n的使用樣條函數或線性內插之增益內插且將增益值應用於對應音訊訊框。
圖9以示意圖說明根據本發明的音訊解碼器裝置之實施例。音訊解碼器裝置4包含:音訊解碼器5,其經組配以用於解碼經編碼音訊位元串流ABS以便再生包含連續音訊訊框AFP、AFR、AFS之音訊
信號AS;動態範圍控制解碼器6,其經組配以用於解碼經編碼動態範圍控制位元串流DBS以便再生對應於音訊信號AS且包含連續動態範圍控制訊框DFP、DFR、DFS之動態範圍控制序列DS;其中對於動態範圍控制訊框中之每一動態範圍控制訊框DFP、DFR、DFS,經編碼動態範圍控制位元串流DBS包含對應位元串流部分DFP'、DFR'、DFS';其中經編碼動態範圍控制位元串流DBS包含節點A0...A5、B0...B2、C0之位元表示A'0...A'5、B'0...B'2、C'0,其中該等節點中之一個節點的每一位元表示包含用於音訊信號AS之增益資訊GA0...GA5、GB0...GB2、GC0及指示增益資訊GA0...GA5、GB0...GB2、GC0所對應之時間點的時間資訊TA0...TA5、TB0...TB2、TC0;其中經編碼動態範圍控制位元串流DBS包含選自動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2之經移位節點B1、B2的位元表示B'1、B'2,其嵌入於對應於一個參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分中,其中將動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2中之每一剩餘節點B0的位元表示B'0嵌入至對應於一個參考動態範圍控制訊框DFR之位元串流部分DFR'中;且其中動態範圍控制解碼器6經組配以用於解碼動態範
圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的剩餘節點B'0中之每一剩餘節點B0的位元表示B'0,以便再生動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的每一剩餘節點B0;用於解碼選自動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2中之經移位節點B1、B2中的每一經移位節點B1、B2的位元表示B'1、B'2,以便再生選自動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點的經移位節點B1、B2中之每一經移位節點B1、B2;及用於組合所再生剩餘節點B0與所再生經移位節點B1、B2以便重新建構參考動態範圍控制訊框DFR。
根據本發明之較佳實施例,動態範圍控制解碼器6經組配以用於藉由使用時間資訊TA4、TA5、TB1、TB2來識別一或多個經移位節點A4、A5、B1、B2。
根據本發明之較佳實施例,動態範圍控制解碼器6經組配以用於解碼一或多個經移位節點A4、A5、B1、B2之時間資訊TA4、TA5、TB1、TB2,該時間資訊係由自各別節點A4、A5、B1、B2所屬的動態範圍控制訊框DFP、DFR之開始至各別節點A4、A5、B1、B2在各別節點A4、A5、B1、B2所屬的動態範圍控制訊框DFP、DFR內之時間位置之時間差t_A4、t_A5、t_B1、t_B2與大於或等於各別動態範圍控制訊框DFP、DFR之後的動態範圍控制訊框DFR、DFS之時間大小之偏移值drcFrameSize的總和表示。
根據本發明之較佳實施例,動態範圍控制解碼器
6經組配以用於解碼處於對應於參考動態範圍控制訊框DFR之後的動態控制訊框DFS之位元串流部分DFS'的第一位置處的經移位節點B1之位元表示B'1的增益資訊GB1,該增益資訊係由絕對增益值g_B1表示,且其中在節點B1(其處於對應於參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分DFS'的第一位置處)之位元表示B'1之後的位置處的經移位節點B2之每一位元表示B'2的增益資訊GB2係由等於各別經移位節點B2之位元表示B'2的增益值g_B2與各別節點B2之位元表示B'2之前的節點B1之位元表示B'1的增益值g_B1的差的相對增益值表示。
根據本發明之較佳實施例,動態範圍控制解碼器6經組配以用於解碼處於一或多個經移位節點B1、B2之位元表示B'1、B'2的一或多個位置之後的對應於參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分DFS'的第一位置處的後續動態範圍控制訊框DFS之節點C0的位元表示C'0之增益資訊GC0,其係由等於各別節點C0之位元表示C'0的增益值g_C0與各別節點C0之位元表示C'0之前的經移位節點B2之位元表示B'2的增益值g_B2的差的相對增益值表示。
根據本發明之較佳實施例,音訊訊框AFP、AFR、AFS之時間大小等於動態範圍控制訊框AFP、AFR、AFS之時間大小。
根據本發明之較佳實施例,動態範圍控制訊框DFP、DFR、DFS中之一者的一或多個節點A0...A5、B0...B2、
C0係選自均一時間格線。
根據本發明之較佳實施例,一或多個節點A0...A5、B0...B2、C0中之每一節點A0...A5、B0...B2、C0包含斜率資訊SA0...SA5、SB0...SB2、SC0。
根據本發明之較佳實施例,動態範圍控制解碼器6經組配以用於使用熵解碼技術來解碼節點之位元表示A'0...A'5、B'0...B'2、C'0。
在另一態樣中,本發明提供一種用於操作音訊解碼器之方法,該方法包含如下步驟:解碼經編碼音訊位元串流ABS以便再生包含連續音訊訊框AFP、AFR、AFS之音訊信號AS;解碼經編碼動態範圍控制位元串流DBS以便再生對應於音訊信號AS且包含連續動態範圍控制訊框DFP、DFR、DFS之動態範圍控制序列DS;其中對於動態範圍控制訊框中之每一動態範圍控制訊框DFP、DFR、DFS,經編碼動態範圍控制位元串流DBS包含對應位元串流部分DFP'、DFR'、DFS';其中經編碼動態範圍控制位元串流DBS包含節點A0...A5、B0...B2、C0之位元表示A'0...A'5、B'0...B'2、C'0,其中該等節點中之一個節點的每一位元表示包含用於音訊信號AS之增益資訊GA0...GA5、GB0...GB2、GC0及指示增益資訊GA0...GA5、GB0...GB2、GC0所對應之時間點的時間資訊TA0...TA5、TB0...TB2、TC0;其中經編碼動態範圍控制位元串流DBS包含選自動態
範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2之經移位節點B1、B2的位元表示B'1、B'2,其嵌入於對應於一個參考動態範圍控制訊框DFR之後的動態範圍控制訊框DFS之位元串流部分中,其中將動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2中之每一剩餘節點B0的位元表示B'0嵌入至對應於一個參考動態範圍控制訊框DFR之位元串流部分DFR'中;且其中解碼動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的剩餘節點B'0中之每一剩餘節點B0的位元表示B'0,以便再生動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的每一剩餘節點B0;其中解碼選自動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點B0...B2之經移位節點B1、B2中的每一經移位節點B1、B2之位元表示B'1、B'2,以便再生選自動態範圍控制訊框DFP、DFR、DFS中之一個參考動態範圍控制訊框DFR的節點的經移位節點B1、B2中之每一經移位節點B1、B2;且其中組合所再生剩餘節點B0與所再生經移位節點B1、B2以便重新建構參考動態範圍控制訊框DFR。
關於所描述實施例之解碼器,編碼器及方法,將提到以下內容:儘管已在一設備之上下文中描述一些態樣,但顯
而易見,此等態樣亦表示對應方法之描述,其中區塊或裝置對應於方法步驟或方法步驟之特徵。類似地,方法步驟之上下文中所描述的態樣亦表示對應區塊或項或對應設備之特徵的描述。
取決於某些實施要求,本發明之實施例可以硬體或軟體而實施。可使用數位儲存媒體來執行實施方案,例如,軟碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該媒體上儲存有電子可讀控制信號,該等電子可讀控制信號與可規劃電腦系統合作(或能夠與其合作),使得執行各別方法。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等控制信號能夠與可規劃電腦系統合作,使得執行本文中描述之方法中的一者。
通常,本發明之實施例可被實施為具有程式碼之電腦程式產品,當電腦程式產品執行於電腦上時,程式碼操作性地用於執行該等方法中之一者。程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含用於執行本文所描述之方法中之一者的儲存於機器可讀載體或非暫時性儲存媒體上的電腦程式。
換言之,因此,本發明方法之實施例為具有當電腦程式執行於電腦上時用於執行本文中描述之方法中的一者的程式碼之電腦程式。
因此,本發明方法之一另外實施例為包含記錄於
其上的用於執行本文中描述之方法中的一者的電腦程式之資料載體(或數位儲存媒體,或電腦可讀媒體)。
因此,本發明方法之一另外實施例為表示用於執行本文中描述之方法中的一者之電腦程式之資料串流或信號序列。該資料串流或信號序列可(例如)經組配以經由資料通信連接(例如,經由網際網路)而傳送。
一另外實施例包含經組配或調適以執行本文中描述之方法中的一者的處理構件,例如,電腦或可規劃邏輯裝置。
一另外實施例包含其上安裝有用於執行本文中描述之方法中的一者的電腦程式之電腦。
在一些實施例中,可規劃邏輯裝置(例如,場可規劃閘陣列)可用於執行本文中描述之方法的功能性中之一些或全部。在一些實施例中,場可規劃閘陣列可與微處理器合作,以便執行本文中描述之方法中的一者。通常,有利地由任何硬體設備執行該等方法。
雖然已依據若干實施例而描述本發明,但存在屬於本發明之範疇的更改、排列及等效者。亦應注意,存在實施本發明之方法及組成物的許多替代性方式。因此,希望將以下所附申請專利範圍解譯為包括如屬於本發明之真實精神及範疇的所有此等更改、排列及等效者。
References: [1]D. Giannoulis, M. Massberg, J. D. Reiss, “Digital Dynamic Range Compressor Design - A Tutorial and
Analysis” J. Audio Engineering Society, Vol. 60, No. 6, June 2012. in
1‧‧‧音訊編碼器裝置
2‧‧‧音訊編碼器
3‧‧‧動態範圍控制編碼器
A0...A5‧‧‧先前動態範圍控制訊框之節點
A'0...A'5、B'0...B'2、C'0‧‧‧位元表示
ABS‧‧‧經編碼音訊位元串流
AFP‧‧‧前一音訊訊框
AFR‧‧‧參考音訊訊框
AFS‧‧‧後續音訊訊框
AS‧‧‧音訊信號
B0...B2‧‧‧參考動態範圍控制訊框之節點
C0‧‧‧後續動態範圍控制訊框之節點
DBS‧‧‧經編碼動態範圍控制位元串流
DFS‧‧‧後續動態範圍控制訊框
DFP‧‧‧前一動態範圍控制訊框
DFP'‧‧‧對應於先前動態範圍控制訊框之位元串流部分
DFR‧‧‧參考動態範圍控制訊框
DFR'‧‧‧對應於參考動態範圍控制訊框之位元串流部分
DFS'‧‧‧對應於後續動態範圍控制訊框之位元串流部分
DS‧‧‧動態範圍控制序列
Claims (25)
- 一種音訊編碼器裝置,其包含:一音訊編碼器,其經組配以用於自包含連續音訊訊框之一音訊信號產生一經編碼音訊位元串流;一動態範圍控制編碼器,其經組配以用於自對應於該音訊信號且包含連續動態範圍控制訊框之一動態範圍控制序列產生一經編碼動態範圍控制位元串流,其中該等動態範圍控制訊框中之每一動態範圍控制訊框包含一或多個節點,其中該一或多個節點中之每一節點包含用於該音訊信號之增益資訊及指示該增益資訊所對應之時間點的時間資訊;其中該動態範圍控制編碼器經組配成使得對於該等動態範圍控制訊框中之每一動態範圍控制訊框,該經編碼動態範圍控制位元串流包含一對應位元串流部分;其中該動態範圍控制編碼器經組配以用於執行一移位程序,其中將該等動態範圍控制訊框中之一個參考動態範圍控制訊框的該等節點中之一或多個節點選擇為經移位節點,其中將該一個參考動態範圍控制訊框之該一或多個經移位節點中之每一者的一位元表示嵌入於對應於該一個參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分中,其中將該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點中之每一剩餘節點的一位元表示嵌入至對應於該 一個參考動態範圍控制訊框之該位元串流部分中。
- 如請求項1之音訊編碼器裝置,其中在該參考動態範圍控制訊框之該等節點之一數目大於一預界定臨限值的狀況下起始該移位程序。
- 如請求項1之音訊編碼器裝置,其中在該參考動態範圍控制訊框之該等節點之一數目與待嵌入於對應於該參考動態範圍控制訊框之該位元串流部分中的來自該參考動態範圍控制訊框之前的該動態範圍控制訊框之經移位節點之一數目的一總和大於一預界定臨限值的狀況下起始該移位程序。
- 如請求項1之音訊編碼器裝置,其中在該參考動態範圍控制訊框之該等節點之一數目與待嵌入於對應於該參考動態範圍控制訊框之該位元串流部分中的來自該參考動態範圍控制訊框之前的該動態範圍控制訊框之經移位節點之一數目的一總和大於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該等節點之一數目的狀況下起始該移位程序。
- 如請求項1之音訊編碼器裝置,其中將該一或多個節點之該時間資訊表示成使得可藉由使用該時間資訊來識別該一或多個經移位節點。
- 如請求項5之音訊編碼器裝置,其中該一或多個經移位節點之該時間資訊係由自該各別節點所屬的該動態範圍控制訊框之一開始至該各別節點在該各別節點所屬的該動態範圍控制訊框內之時間位置之一時間差與大 於或等於該各別動態範圍控制訊框之後的該動態範圍控制訊框之一時間大小之一偏移值的一總和表示。
- 如請求項1之音訊編碼器裝置,其中處於對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的一第一位置處的該經移位節點之該位元表示的該增益資訊係由一絕對增益值表示,且其中在該節點之該位元表示之後的一位置處的該經移位節點之每一位元表示的該增益資訊係由等於該各別經移位節點之該位元表示的一增益值與該各別節點之該位元表示之前的該節點之該位元表示的一增益值的一差的一相對增益值表示,該節點處於對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的該第一位置處。
- 如請求項1之音訊編碼器裝置,其中在該參考動態範圍控制訊框之一或多個經移位節點的該等位元表示嵌入於對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分中的狀況下,在該一或多個經移位節點之該等位元表示的該一或多個位置之後的對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的一第一位置處的該後續動態範圍控制訊框之該節點的該位元表示之該增益資訊係由等於該各別節點之該位元表示的一增益值與該各別節點之該位元表示之前的該經移位節點之該位元表示的一增益值的一差的一相對增益值表示。
- 如請求項1之音訊編碼器裝置,其中該等音訊訊框之一時間大小等於該等動態範圍控制訊框之一時間大小。
- 如請求項1之音訊編碼器裝置,其中該動態範圍控制訊框中之一者的該一或多個節點係選自一均一時間格線。
- 如請求項1之音訊編碼器裝置,其中該一或多個節點中之每一節點包含斜率資訊。
- 如請求項1之音訊編碼器裝置,其中該動態範圍控制編碼器經組配以用於使用一熵編碼技術來編碼該等節點。
- 一種音訊解碼器裝置,其包含:一音訊解碼器,其經組配以用於解碼一經編碼音訊位元串流,以便再生包含連續音訊訊框之一音訊信號;一動態範圍控制解碼器,其經組配以用於解碼一經編碼動態範圍控制位元串流,以便再生對應於該音訊信號且包含連續動態範圍控制訊框之一動態範圍控制序列;其中對於該等動態範圍控制訊框中之每一動態範圍控制訊框,該經編碼動態範圍控制位元串流包含一對應位元串流部分;其中該經編碼動態範圍控制位元串流包含多個節點之多個位元表示,其中該等節點中之一個節點的每一位元表示包含用於該音訊信號之增益資訊及指示該增益資訊所對應之時間點的時間資訊;其中該經編碼動態範圍控制位元串流包含選自該等動態範圍控制訊框中之一個參考動態範圍控制訊框 的該等節點之多個經移位節點的多個位元表示,其嵌入於對應於該一個參考動態範圍控制訊框之後的該動態範圍控制訊框之一位元串流部分中,其中將該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點中之每一剩餘節點的該位元表示嵌入至對應於該一個參考動態範圍控制訊框之該位元串流部分中;且其中該動態範圍控制解碼器經組配以用於解碼該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等剩餘節點中之每一剩餘節點的該位元表示,以便再生該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的每一剩餘節點;用於解碼選自該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點之該等經移位節點中之每一經移位節點的該位元表示,以便再生選自該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點之該等經移位節點中的每一經移位節點;及用於組合該等所再生剩餘節點與該等所再生經移位節點,以便重新建構該參考動態範圍控制訊框。
- 如請求項13之音訊解碼器裝置,其中該動態範圍控制解碼器經組配以用於藉由使用該時間資訊來識別該一或多個經移位節點。
- 如請求項13之音訊解碼器裝置,其中該動態範圍控制解碼器經組配以用於解碼該一或多個經移位節點之該時間資訊,該時間資訊係由自該各別節點所屬的該動態範 圍控制訊框之一開始至該各別節點在該各別節點所屬的該動態範圍控制訊框內之時間位置之一時間差與大於或等於該各別動態範圍控制訊框之後的該動態範圍控制訊框之一時間大小之一偏移值的一總和表示。
- 如請求項13之音訊解碼器裝置,其中該動態範圍控制解碼器經組配以用於解碼處於對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的一第一位置處的該經移位節點之該位元表示的該增益資訊,該增益資訊係由一絕對增益值表示,且其中在該節點之該位元表示之後的一位置處的該等經移位節點之每一位元表示的該增益資訊係由等於該各別經移位節點之該位元表示的一增益值與該各別節點之該位元表示之前的該節點之該位元表示的一增益值之一差的一相對增益值表示,該節點處於對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的該第一位置處。
- 如請求項13之音訊解碼器裝置,其中該動態範圍控制解碼器經組配以用於解碼在該一或多個經移位節點之該等位元表示的該一或多個位置之後的對應於該參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分的一第一位置處的該後續動態範圍控制訊框之該節點的該位元表示之該增益資訊,該增益資訊係由等於該各別節點之該位元表示的一增益值與該各別節點之該位元表示之前的該經移位節點之該位元表示的 一增益值之一差的一相對增益值表示。
- 如請求項13之音訊解碼器裝置,其中該等音訊訊框之一時間大小等於該等動態範圍控制訊框之一時間大小。
- 如請求項13之音訊解碼器裝置,其中該等動態範圍控制訊框中之一者的該一或多個節點係選自一均一時間格線。
- 如請求項13之音訊解碼器裝置,其中該一或多個節點中之每一節點包含斜率資訊。
- 如請求項13之音訊解碼器裝置,其中該動態範圍控制解碼器經組配以用於使用一熵解碼技術來解碼該等節點之該等位元表示。
- 一種音訊系統,其包含一如請求項1至12中之一項之音訊編碼器裝置、及一如請求項13至21中之一項之音訊解碼器裝置。
- 一種用於操作音訊編碼器之方法,該方法包含如下步驟:自包含連續音訊訊框之一音訊信號產生一經編碼音訊位元串流;自對應於該音訊信號且包含連續動態範圍控制訊框之一動態範圍控制序列產生一經編碼動態範圍控制位元串流,其中該等動態範圍控制訊框中之每一動態範圍控制訊框包含一或多個節點,其中該一或多個節點中之每一節點包含用於該音訊信號之增益資訊及指示該增益資訊所對應之時間點的時間資訊; 其中對於該等動態範圍控制訊框中之每一動態範圍控制訊框,該經編碼動態範圍控制位元串流包含一對應位元串流部分;執行一移位程序,其中將該等動態範圍控制訊框中之一個參考動態範圍控制訊框的該等節點中之一或多個節點選擇為經移位節點,其中將該一個參考動態範圍控制訊框之該一或多個經移位節點中之每一者的一位元表示嵌入於對應於該一個參考動態範圍控制訊框之後的該動態範圍控制訊框之該位元串流部分中,其中將該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點中之每一剩餘節點的一位元表示嵌入至對應於該一個參考動態範圍控制訊框之該位元串流部分中。
- 一種用於操作音訊解碼器之方法,該方法包含如下步驟:解碼一經編碼音訊位元串流,以便再生包含連續音訊訊框之一音訊信號;解碼一經編碼動態範圍控制位元串流,以便再生對應於該音訊信號且包含連續動態範圍控制訊框之一動態範圍控制序列;其中對於該等動態範圍控制訊框中之每一動態範圍控制訊框,該經編碼動態範圍控制位元串流包含一對應位元串流部分;其中該經編碼動態範圍控制位元串流包含多個節 點之多個位元表示,其中該等節點中之一個節點的每一位元表示包含用於該音訊信號之增益資訊及指示該增益資訊所對應之時間點的時間資訊;其中該經編碼動態範圍控制位元串流包含選自該等動態範圍控制訊框中之一個參考動態範圍控制訊框的該等節點之多個經移位節點的多個位元表示,其嵌入於對應於該一個參考動態範圍控制訊框之後的該動態範圍控制訊框之一位元串流部分中,其中將該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點中之每一剩餘節點的該位元表示嵌入至對應於該一個參考動態範圍控制訊框之該位元串流部分中;且其中該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等剩餘節點中之每一剩餘節點的該位元表示被解碼,以便再生該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的每一剩餘節點;其中選自該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點之該等經移位節點中之每一經移位節點的該位元表示被解碼,以便再生選自該等動態範圍控制訊框中之該一個參考動態範圍控制訊框的該等節點之該等經移位節點中的每一經移位節點;且其中該等所再生剩餘節點與該等所再生經移位節點被組合,以便重新建構該參考動態範圍控制訊框。
- 一種電腦程式,其用於在執行於一處理器上時執行如請 求項23或24中之一項之方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14161605 | 2014-03-25 | ||
PCT/EP2015/055945 WO2015144587A1 (en) | 2014-03-25 | 2015-03-20 | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201543470A TW201543470A (zh) | 2015-11-16 |
TWI585751B true TWI585751B (zh) | 2017-06-01 |
Family
ID=52727126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW104109407A TWI585751B (zh) | 2014-03-25 | 2015-03-24 | 具有動態範圍控制中有效增益編碼之音訊編碼器裝置及音訊解碼器裝置 |
Country Status (20)
Country | Link |
---|---|
US (3) | US10074377B2 (zh) |
EP (1) | EP3123469B1 (zh) |
JP (1) | JP6259930B2 (zh) |
KR (1) | KR101890216B1 (zh) |
CN (2) | CN111326165B (zh) |
AR (1) | AR099836A1 (zh) |
AU (1) | AU2015238519B2 (zh) |
BR (1) | BR112016021382B1 (zh) |
CA (1) | CA2942743C (zh) |
ES (1) | ES2678068T3 (zh) |
MX (1) | MX355089B (zh) |
MY (1) | MY186155A (zh) |
PL (1) | PL3123469T3 (zh) |
PT (1) | PT3123469T (zh) |
RU (1) | RU2678487C2 (zh) |
SG (1) | SG11201607940WA (zh) |
TR (1) | TR201809427T4 (zh) |
TW (1) | TWI585751B (zh) |
WO (1) | WO2015144587A1 (zh) |
ZA (1) | ZA201607193B (zh) |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2581810C (en) | 2004-10-26 | 2013-12-17 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
CN104303229B (zh) | 2012-05-18 | 2017-09-12 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
TR201802631T4 (tr) | 2013-01-21 | 2018-03-21 | Dolby Laboratories Licensing Corp | Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder |
KR102071860B1 (ko) | 2013-01-21 | 2020-01-31 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
CN116665683A (zh) | 2013-02-21 | 2023-08-29 | 杜比国际公司 | 用于参数化多声道编码的方法 |
CN104080024B (zh) | 2013-03-26 | 2019-02-19 | 杜比实验室特许公司 | 音量校平器控制器和控制方法以及音频分类器 |
CN110083714B (zh) | 2013-04-05 | 2024-02-13 | 杜比实验室特许公司 | 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配 |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
US10095468B2 (en) | 2013-09-12 | 2018-10-09 | Dolby Laboratories Licensing Corporation | Dynamic range control for a wide variety of playback environments |
CN105531759B (zh) | 2013-09-12 | 2019-11-26 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
JP6593173B2 (ja) * | 2013-12-27 | 2019-10-23 | ソニー株式会社 | 復号化装置および方法、並びにプログラム |
EP3123469B1 (en) | 2014-03-25 | 2018-04-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
CN110808723B (zh) | 2014-05-26 | 2024-09-17 | 杜比实验室特许公司 | 音频信号响度控制 |
CN112185401B (zh) | 2014-10-10 | 2024-07-02 | 杜比实验室特许公司 | 基于发送无关的表示的节目响度 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW293118B (zh) * | 1995-02-22 | 1996-12-11 | Digital Voice Systems Inc | |
US20130030800A1 (en) * | 2011-07-29 | 2013-01-31 | Dts, Llc | Adaptive voice intelligibility processor |
US20130339037A1 (en) * | 2000-05-23 | 2013-12-19 | Dolby International Ab | Spectral Translation/Folding in the Subband Domain |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2144222C1 (ru) * | 1998-12-30 | 2000-01-10 | Гусихин Артур Владимирович | Способ сжатия звуковой информации и система для его реализации |
US6785655B1 (en) * | 2000-05-15 | 2004-08-31 | Lsi Logic Corporation | Method for independent dynamic range control |
JP4575609B2 (ja) * | 2001-03-13 | 2010-11-04 | 旭化成エレクトロニクス株式会社 | データ変換装置 |
KR100754439B1 (ko) * | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
MX2007000076A (es) * | 2004-07-02 | 2007-03-28 | Nielsen Media Res Inc | Metodos y aparatos para mezclar corrientes comprimidas de bits digitales. |
CN101312041B (zh) * | 2004-09-17 | 2011-05-11 | 广州广晟数码技术有限公司 | 多声道数字音频编码设备及其方法 |
US7991610B2 (en) * | 2005-04-13 | 2011-08-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Adaptive grouping of parameters for enhanced coding efficiency |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
CN101587711B (zh) * | 2008-05-23 | 2012-07-04 | 华为技术有限公司 | 基音后处理方法、滤波器以及基音后处理系统 |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
ES2963744T3 (es) * | 2008-10-29 | 2024-04-01 | Dolby Int Ab | Protección de recorte de señal usando metadatos de ganancia de audio preexistentes |
KR101336891B1 (ko) * | 2008-12-19 | 2013-12-04 | 한국전자통신연구원 | G.711 코덱의 음질 향상을 위한 부호화 장치 및 복호화 장치 |
US8861879B2 (en) * | 2009-09-17 | 2014-10-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding image based on skip mode |
TWI529703B (zh) * | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
US9443534B2 (en) * | 2010-04-14 | 2016-09-13 | Huawei Technologies Co., Ltd. | Bandwidth extension system and approach |
EP2610865B1 (en) * | 2010-08-23 | 2014-07-23 | Panasonic Corporation | Audio signal processing device and audio signal processing method |
EP2759057A2 (en) * | 2011-09-22 | 2014-07-30 | Earsoft Limited | Dynamic range control |
CN104303229B (zh) * | 2012-05-18 | 2017-09-12 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
US9332373B2 (en) * | 2012-05-31 | 2016-05-03 | Dts, Inc. | Audio depth dynamic range enhancement |
US9460729B2 (en) * | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US9607624B2 (en) * | 2013-03-29 | 2017-03-28 | Apple Inc. | Metadata driven dynamic range control |
TWM487509U (zh) * | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
EP3123469B1 (en) | 2014-03-25 | 2018-04-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control |
-
2015
- 2015-03-20 EP EP15711734.2A patent/EP3123469B1/en active Active
- 2015-03-20 AU AU2015238519A patent/AU2015238519B2/en active Active
- 2015-03-20 WO PCT/EP2015/055945 patent/WO2015144587A1/en active Application Filing
- 2015-03-20 ES ES15711734.2T patent/ES2678068T3/es active Active
- 2015-03-20 CN CN201911392325.8A patent/CN111326165B/zh active Active
- 2015-03-20 TR TR2018/09427T patent/TR201809427T4/tr unknown
- 2015-03-20 CA CA2942743A patent/CA2942743C/en active Active
- 2015-03-20 JP JP2016559243A patent/JP6259930B2/ja active Active
- 2015-03-20 PL PL15711734T patent/PL3123469T3/pl unknown
- 2015-03-20 MY MYPI2016001726A patent/MY186155A/en unknown
- 2015-03-20 CN CN201580015978.8A patent/CN106165014B/zh active Active
- 2015-03-20 MX MX2016012421A patent/MX355089B/es active IP Right Grant
- 2015-03-20 BR BR112016021382-3A patent/BR112016021382B1/pt active IP Right Grant
- 2015-03-20 PT PT157117342T patent/PT3123469T/pt unknown
- 2015-03-20 RU RU2016141556A patent/RU2678487C2/ru active
- 2015-03-20 SG SG11201607940WA patent/SG11201607940WA/en unknown
- 2015-03-20 KR KR1020167029370A patent/KR101890216B1/ko active IP Right Grant
- 2015-03-24 TW TW104109407A patent/TWI585751B/zh active
- 2015-03-25 AR ARP150100878A patent/AR099836A1/es active IP Right Grant
-
2016
- 2016-09-22 US US15/272,653 patent/US10074377B2/en not_active Ceased
- 2016-10-19 ZA ZA2016/07193A patent/ZA201607193B/en unknown
-
2019
- 2019-05-06 US US16/404,503 patent/USRE49107E1/en active Active
-
2022
- 2022-05-20 US US17/664,381 patent/US20220277756A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW293118B (zh) * | 1995-02-22 | 1996-12-11 | Digital Voice Systems Inc | |
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
US20130339037A1 (en) * | 2000-05-23 | 2013-12-19 | Dolby International Ab | Spectral Translation/Folding in the Subband Domain |
US20130030800A1 (en) * | 2011-07-29 | 2013-01-31 | Dts, Llc | Adaptive voice intelligibility processor |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI585751B (zh) | 具有動態範圍控制中有效增益編碼之音訊編碼器裝置及音訊解碼器裝置 | |
JP6753499B2 (ja) | 復号化装置および方法、並びにプログラム | |
JP2024147632A (ja) | パラメトリック・マルチチャネル・エンコードのための方法 | |
JP6573640B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
JP2018151639A (ja) | オーディオ装置のための組合せダイナミックレンジ圧縮および誘導クリッピング防止のための概念 | |
KR101650055B1 (ko) | 멀티 채널 신호의 부호화/복호화 장치 및 방법 | |
US9401152B2 (en) | System for maintaining reversible dynamic range control information associated with parametric audio coders | |
JP6728154B2 (ja) | オーディオ信号のエンコードおよびデコード | |
KR20060120108A (ko) | 평활한 크로스페이딩을 용이화하기 위한 오버랩을 갖는프레임 기반의 오디오 전송/저장장치 | |
KR20170078648A (ko) | 멀티채널 오디오 신호의 파라메트릭 인코딩 및 디코딩 |