TWI672691B - 解碼方法 - Google Patents
解碼方法 Download PDFInfo
- Publication number
- TWI672691B TWI672691B TW106118018A TW106118018A TWI672691B TW I672691 B TWI672691 B TW I672691B TW 106118018 A TW106118018 A TW 106118018A TW 106118018 A TW106118018 A TW 106118018A TW I672691 B TWI672691 B TW I672691B
- Authority
- TW
- Taiwan
- Prior art keywords
- quantization
- frame
- scheme
- prediction
- inter
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 230000005236 sound signal Effects 0.000 claims abstract description 11
- 238000013139 quantization Methods 0.000 claims description 389
- 239000013598 vector Substances 0.000 claims description 32
- 230000003595 spectral effect Effects 0.000 claims description 26
- 230000006870 function Effects 0.000 description 116
- 238000010586 diagram Methods 0.000 description 50
- 238000001228 spectrum Methods 0.000 description 23
- 238000004891 communication Methods 0.000 description 19
- 238000012545 processing Methods 0.000 description 13
- 238000005070 sampling Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 12
- 230000006872 improvement Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 6
- 238000013507 mapping Methods 0.000 description 5
- 238000010183 spectrum analysis Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000001453 impedance spectrum Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
- G10L2019/0005—Multi-stage vector quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/164—Feedback from the receiver or from the transmission channel
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
提供一種解碼方法。基於來自包含編碼音訊信號和編碼
語音信號中的至少一個的模式資訊,選擇不具有框間預測的第一解碼方案和具有框間預測的第二解碼方案之一,其中模式資訊為在編碼端以開放迴路方式基於預測誤差獲得。藉由處理器基於所選擇的解碼方案執行解碼位元流,以重建音訊或語音,其中第一解碼方案包括具有區塊約束式的格狀結構去量子化器以及框內預測器,其中位元流為基於來自多個編碼模式中的有聲編碼模式獲得。
Description
與本揭露內容一致的方法以及元件是關於線性預測編碼係數之量子化(quantization)以及去量子化(de-quantization),且更明確而言,是關於一種以低複雜性有效率地量子化線性預測編碼係數之方法、一種使用所述量子化方法之聲音編碼方法、一種去量子化線性預測編碼係數之方法、一種使用所述去量子化方法之聲音解碼方法以及其記錄媒體。
本申請案主張2011年4月21日向美國專利商標局申請之美國臨時申請案第61/477,797號以及2011年5月3日向美國專利商標局申請之美國臨時申請案第61/481,874號的權利,所述兩個臨時申請案之揭露內容以引用的方式全部併入本文中。
在用於對聲音(諸如,語音或音訊)進行編碼之系統中,使用線性預測編碼(Linear Predictive Coding;LPC)係數來表示聲音之短時頻率特性。以如下方式獲得LPC係數:以訊框為單位劃分輸入聲音,且使每訊框之預測誤差之能量最小化。然而,由於LPC係數具有大的動態範圍且所使用之LPC濾波器的特性對LPC係數之量子化誤差非常敏感,因此無法保證LPC濾波器之穩定性。
因此,藉由將LPC係數轉換成易於檢查濾波器之穩定性、對內插有利且具有良好量子化特性的其他係數來執行量子化。大體上較佳的是,藉由將LPC係數轉換成線頻譜頻率(Line Spectral Frequency;LSF)或導抗頻譜頻率(Immittance Spectral Frequency;ISF)係數來執行量子化。詳言之,LPC係數之量子化方法可藉由使用LSF係數在頻域以及時域中的高框間相關性來增加量子化增益。
LSF係數指示短時聲音之頻率特性,且對於輸入聲音之頻率特性迅速改變之訊框,所述訊框之LSF係數亦迅速改變。然而,對於使用LSF係數之高框間相關性的量子化器,由於不能針對迅速改變之訊框執行適當預測,因此量子化器之量子化效能降低。
態樣是提供一種以低複雜性有效率地量子化線性預測編碼(LPC)係數之方法、一種使用所述量子化方法之聲音編碼方法、一種去量子化LPC係數之方法、一種使用所述去量子化方法之聲音解碼方法以及其記錄媒體。
根據一或多個例示性實施例之態樣,提供一種量子化方法,所述量子化方法包括:在考慮預測模式、預測誤差以及傳輸頻道狀態中之至少一者的情況下,藉由選擇不使用框間預測之第一量子化方案以及使用框間預測之第二量子化方案中的一者來量子化輸入信號。
根據一或多個例示性實施例之另一態樣,提供一種編碼方法,所述編碼方法包括:判定輸入信號之編碼模式;藉由根據路徑資訊選擇不使用框間預測之第一量子化方案以及使用框間預測之第二量子化方案中的一者來量子化輸入信號,所述路徑資訊是在考慮預測模式、預測誤差以及傳輸頻道狀態中之至少一者的情況下予以判定;在編碼模式下編碼已量子化之輸入信號;以及產生位元流,所述位元流包含在第一量子化方案中量子化之結果以及在第二量子化方案中量子化之結果中的一者、輸入信號之編碼模式以及與輸入信號之量子化有關的路徑資訊。
根據一或多個例示性實施例之另一態樣,提供一種去量子化方法,所述去量子化方法包括:藉由基於包含於位元流中之路徑資訊選擇不使用框間預測之第一去量子化方案以及使用框間預測之第二去量子化方案中的一者而去量子化輸入信號,所述路徑資訊是在編碼端中在考慮預測模式、預測誤差以及傳輸頻道狀態中之至少一者的情況下予以判定。
根據一或多個例示性實施例之另一態樣,提供一種解碼方法,所述解碼方法包括:對包含於位元流中之線性預測編碼(LPC)參數以及編碼模式進行解碼;藉由基於包含於位元流中之路徑資訊使用不使用框間預測之第一去量子化方案以及使用框間預測之第二去量子化方案中的一者而去量子化經解碼之LPC參數;以及在經解碼之編碼模式下對已去量子化之LPC參數進行解碼,其中路徑資訊是在編碼端中在考慮預測模式、預測誤差以及傳輸頻道狀態中之至少一者的情況下予以判定。
根據一或多個例示性實施例之另一態樣,提供一種判定量子化器類型之方法,所述方法包括:比較輸入信號之位元元率與第一參考值;比較輸入信號之頻寬與第二參考值;比較內部取樣頻率與第三參考值;以及基於所述比較中之一或多者的結果將用於輸入信號之量子化器類型判定為開放迴路類型以及封閉迴路類型中之一者。
根據一或多個例示性實施例之另一態樣,提供一種電子元件,所述電子元件包含:通信單元,所述通信單元接收聲音信號以及經編碼之位元流中的至少一者,或傳輸經編碼之聲音信號以及已恢復之聲音中的至少一者;以及編碼模組,所述編碼模組藉由根據路徑資訊選擇不使用框間預測之第一量子化方案以及使用框間預測之第二量子化方案中的一者來量子化接收到之輸入信號,所述路徑資訊是在考慮預測模式、預測誤差以及傳輸頻道狀態中之至少一者的情況下予以判定,且所述編碼模組在編碼模式下對已量子化之聲音信號進行編碼。
根據一或多個例示性實施例之另一態樣,提供一種電子元件,所述電子元件包含:通信單元,所述通信單元接收聲音信號以及經編碼之位元流中的至少一者,或傳輸經編碼之聲音信號以及已恢復之聲音中的至少一者;以及解碼模組,所述解碼模組對包含於位元流中之線性預測編碼(LPC)參數以及編碼模式進行解碼,所述解碼模組藉由基於包含於位元流中之路徑資訊使用不使用框間預測之第一去量子化方案以及使用框間預測之第二去量子化方案中的一者而去量子化經解碼之LPC參數,且所述解碼模組在經解碼之編碼模式下對已去量子化之LPC參數進行解碼,其中路徑資訊是在編碼端中在考慮預測模式、預測誤差以及傳輸頻道狀態中之至少一者的情況下予以判定。
根據一或多個例示性實施例之另一態樣,提供一種電子元件,所述電子元件包含:通信單元,所述通信單元接收聲音信號以及經編碼之位元流中的至少一者,或傳輸經編碼之聲音信號以及已恢復之聲音中的至少一者;編碼模組,所述編碼模組藉由根據路徑資訊選擇不使用框間預測之第一量子化方案以及使用框間預測之第二量子化方案中的一者來量子化接收到之輸入信號,所述路徑資訊是在考慮預測模式、預測誤差以及傳輸頻道狀態中之至少一者的情況下予以判定,且所述編碼模組在編碼模式下對已量子化之聲音信號進行編碼;以及解碼模組,所述解碼模組對包含於位元流中之線性預測編碼(LPC)參數以及編碼模式進行解碼,所述解碼模組藉由基於包含於位元流中之路徑資訊使用不使用框間預測之第一去量子化方案以及使用框間預測之第二去量子化方案中的一者而去量子化經解碼之LPC參數,且所述解碼模組在經解碼之編碼模式下對已去量子化之LPC參數進行解碼。
藉由參看隨附圖式詳細描述其例示性實施例,以上以及其他態樣將變得更顯而易見。
本發明概念可允許各種種類之改變或修改以及形式上之各種改變,且將在圖式中說明且在說明書中詳細描述特定例示性實施例。然而,應理解,特定例示性實施例並不將本發明概念限於特定揭露形式,而是包含在本發明概念之精神以及技術範疇內的每一修改後的、等效或替換形式。在以下描述中,未詳細描述熟知功能或構造,因為熟知功能或構造之不必要的細節會使本發明模糊。
雖然諸如‘第一’以及‘第二’之術語可用以描述各種元件,但元件不能受術語限制。術語可用以將某一元件與另一元件區分開。
在本申請案中使用之術語僅用以描述特定例示性實施例,且沒有任何意圖要限制本發明概念。雖然在考量本發明概念中之功能的同時選擇儘可能為當前廣泛使用之一般術語作為在本發明概念中使用之術語,但所述一般術語根據一般熟習此項技術者之意圖、司法判例或新術語之出現而可能變化。此外,在特定情況下,可使用本申請者有意選擇之術語,且在此情況下,將在對應的描述中揭露所述術語之含義。因此,在本發明概念中使用之術語不應由術語之簡單名稱來定義,而是由術語之含義以及在本發明概念上之內容來定義。
單數形式之表達包含複數形式之表達,除非兩種表達在上下文中明顯互不相同。在本申請案中,應理解,諸如‘包含’以及‘具有’之術語用以指示所實施之特徵、數目、步驟、操作、元件、零件或其組合之存在,而並不預先排除一或多個其他特徵、數目、步驟、操作、元件、零件或其組合之存在或添加的可能性。
現將隨附圖式更充分地描述本發明概念,隨附圖式中展示了本發明之例示性實施例。圖式中相同的參考數字表示相同的元件,且因此將省略其重複描述。
諸如“中之至少一者”的表達當接在元件之清單前時修飾元件之整個清單而不修飾清單中之個別元件。
圖1為根據例示性實施例的聲音編碼裝置100之方塊圖。
圖1中展示之聲音編碼裝置100可包含預處理器(例如,中央處理單元(central processing unit;CPU))111、頻譜以及線性預測(Linear Prediction;LP)分析器113、編碼模式選擇器115、線性預測編碼(LPC)係數量子化器117、可變模式編碼器119以及參數編碼器121。聲音編碼裝置100的元件中之每一者可由至少一處理器(例如,中央處理單元(central processing unit;CPU))以整合於至少一模組中的方式實施。應注意,聲音可指音訊、語音或其組合。為便於描述,以下描述將稱聲音為語音。然而,應理解,可處理任何聲音。
參看圖1,預處理器111可預處理輸入語音信號。在預處理程式中,可自語音信號移除不需要的頻率分量,或可將語音信號之頻率特性調整為利於編碼。詳細而言,預處理器111可執行高通濾波、預強調或取樣轉換。
頻譜以及LP分析器113可藉由分析頻域中之特性或對經預處理之語音信號執行LP分析來擷取LPC係數。雖然通常每訊框執行一次LP分析,但為獲得額外的聲音品質改良,可每訊框執行兩次或兩次以上LP分析。在此情況下,一次LP分析為針對訊框端之LP(作為習知LP分析而執行),且另一次LP分析可為為獲得聲音品質改良而針對中間子訊框之LP。在此情況下,當前訊框之訊框端指示形成當前訊框之多個子訊框當中的最終子訊框,且先前訊框之訊框端指示形成先前訊框之多個子訊框當中的最終子訊框。舉例而言,一個訊框可由4個子訊框組成。
中間子訊框指示存在於為先前訊框之訊框端的最終子訊框與為當前訊框之訊框端的最終子訊框之間的子訊框當中的一或多個子訊框。因此,頻譜以及LP分析器113可擷取總共兩個或兩個以上的LPC係數集合。當輸入信號為窄頻帶時,LPC係數可使用階數10,當輸入信號為寬頻帶時,可使用階數16至20。然而,LPC係數之維度不限於此。
編碼模式選擇器115可根據多速率來選擇多個編碼模式中之一者。此外,編碼模式選擇器115可藉由使用語音信號之特性(自頻帶資訊、音調資訊或頻域之分析資訊獲得)來選擇多個編碼模式中之一者。此外,編碼模式選擇器115可藉由使用多速率以及語音信號之特性來選擇多個編碼模式中之一者。
LPC係數量子化器117可量子化由頻譜以及LP分析器113擷取之LPC係數。LPC係數量子化器117可藉由將LPC係數轉換成適合於量子化之其他係數來執行量子化。LPC係數量子化器117可在語音信號之量子化前基於第一準則選擇多個路徑中之一者作為語音信號之量子化路徑,所述多個路徑包含不使用框間預測之第一路徑以及使用框間預測之第二路徑,且LPC係數量子化器117藉由根據所選量子化路徑使用第一量子化方案以及第二量子化方案中之一者來量子化語音信號。或者,LPC係數量子化器117可針對第一路徑藉由不使用框間預測之第一量子化方案來量子化LPC係數且針對第二路徑藉由使用框間預測之第二量子化方案來量子化LPC係數,且基於第二準則選擇第一路徑以及第二路徑中之一者的量子化結果。第一準則與第二準則可彼此相同或互不相同。
可變模式編碼器119可藉由對由LPC係數量子化器117量子化之LPC係數進行編碼來產生位元流。可變模式編碼器119可在以由編碼模式選擇器115選擇之編碼模式下對已量子化之LPC係數進行編碼。可變模式編碼器119可以訊框或子訊框為單位對LPC係數之激勵信號進行編碼。
在可變模式編碼器119中使用之編碼演算法之實例可為碼激勵式線性預測(Code-Excited Linear Prediction;CELP)或代數CELP(Algebraic CELP;ACELP)。可根據編碼模式另外使用變換編碼演算法。CELP演算法中用於編碼LPC係數之代表性參數為自適應碼簿索引、自適應碼簿增益、固定碼簿索引以及固定碼簿增益。可儲存由可變模式編碼器119編碼之當前訊框以用於編碼隨後訊框。
參數編碼器121可編碼將由解碼端用於解碼的參數以便將其包含於位元流中。有利的是,編碼對應於編碼模式之參數。可儲存或傳輸由參數編碼器121產生之位元流。
圖2A至圖2D為可由圖1之聲音編碼裝置100之編碼模式選擇器115選擇的各種編碼模式之實例。圖2A以及圖2C為在分配給量子化的位元元之數目大之情況(亦即,高位元率之情況)下分類的編碼模式之實例,且圖2B以及圖2D為在分配給量子化的位元元之數目小之情況(亦即,低位元元率之情況)下分類的編碼模式之實例。
首先,在高位元率之情況下,可針對簡單結構將語音信號分類為一般編碼(Generic Coding;GC)模式以及轉變編碼(Transition Coding;TC)模式,如在圖2A中所示。在此情況下,GC模式包含無聲編碼(Unvoiced Coding;UC)模式以及有聲編碼(Voiced Coding;VC)模式。在高位元率之情況下,可進一步包含無作用編碼(Inactive Coding;IC)模式以及音訊編碼(Audio Coding;AC)模式,如在圖2C中所示。
此外,在低位元元率之情況下,可將語音信號分類成GC模式、UC模式、VC模式以及TC模式,如在圖2B中所示。此外,在低位元元率之情況下,可進一步包含IC模式以及AC模式,如在圖2D中所示。
在圖2A以及圖2C中,當語音信號為具有類似於無聲聲音之特性的無聲聲音或噪音時,可選擇UC模式。當語音信號為有聲聲音時,可選擇VC模式。TC模式可用以編碼具有轉變間隔之信號,在所述轉變間隔中,語音信號之特性迅速改變。GC模式可用以編碼其他信號。UC模式、VC模式、TC模式以及GC模式是基於在ITU-T G.718中揭露的分類準則之定義,但不限於此。
在圖2B以及圖2D中,針對靜音選擇IC模式,且當語音信號之特性接近於音訊時,可選擇AC模式。
可根據語音信號之頻帶對編碼模式作進一步分類。可將語音信號之頻帶分類成(例如)窄頻帶(Narrow Band;NB)、寬頻帶(Wide Band;WB)、超寬頻帶(Super Wide Band;SWB)以及全頻帶(Full Band;FB)。NB可具有約300 Hz至約3400 Hz或約50 Hz至約4000 Hz之頻寬,WB可具有約50 Hz至約7000 Hz或約50 Hz至約8000 Hz之頻寬,SWB可具有約50 Hz至約14000 Hz或約50 Hz至約16000 Hz之頻寬,且FB可具有高達約20000 Hz之頻寬。此處,與頻寬有關之數值是為了方便而設定,且不限於此。此外,與以上描述相比,設定頻帶之分類的方式可更為簡單或更為複雜。
圖1之可變模式編碼器119可藉由使用對應於在圖2A至圖2D中展示之編碼模式的不同編碼演算法來編碼LPC係數。當判定了編碼模式之類型以及編碼模式之數目時,可能需要藉由使用對應於判定之編碼模式的語音信號再次訓練碼簿。
表1展示在4個編碼模式之情況下的量子化方案以及結構之實例。此處,可將不使用框間預測之量子化方法命名為安全網方案,且可將使用框間預測之量子化方法命名為預測方案。此外,VQ表示向量量子化器,且BC-TCQ表示區塊約束式格狀編碼量子化器(block-constrained trellis-coded quantizer)。 [表1]
可根據所應用之位元元率改變編碼模式。如上所述,為了在高位元率情況下使用兩個編碼模式來量子化LPC係數,在GC模式下,每訊框可使用40或41個位元,且在TC模式下,每訊框可使用46個位元。
圖3為根據例示性實施例的LPC係數量子化器300之方塊圖。
圖3中展示之LPC係數量子化器300可包含第一係數轉換器311、加權函數判定器313、導抗頻譜頻率(ISF)/線頻譜頻率(LSF)量子化器315以及第二係數轉換器317。LPC係數量子化器300的組件中之每一者可由至少一處理器(例如,中央處理單元(CPU))以整合於至少一模組中的方式實施。
參看圖3,第一係數轉換器311可將藉由對語音信號之當前或先前訊框之訊框端執行LP分析而擷取的LPC係數轉換成另一格式之係數。舉例而言,第一係數轉換器311可將當前或先前訊框之訊框端的LPC係數轉換成任一格式之LSF係數以及ISF係數。在此情況下,LSF係數或ISF係數指示LPC係數可易於量子化時的格式之實例。
加權函數判定器313可藉由使用自LPC係數轉換而來之LSF係數或ISF係數判定加權函數,所述加權函數與關於當前訊框之訊框端以及先前訊框之訊框端的LPC係數之重要性有關。在選擇量子化路徑或搜尋碼簿索引(藉由碼簿索引,使量子化中之加權誤差最小化)之程式中可使用判定之加權函數。舉例而言,加權函數判定器313可判定每個量值之加權函數以及每個頻率之加權函數。
此外,加權函數判定器313可藉由考慮頻帶、編碼模式以及頻譜分析資訊中之至少一者來判定加權函數。舉例而言,加權函數判定器313可得出每個編碼模式之最佳加權函數。此外,加權函數判定器313可得出每個頻帶之最佳加權函數。另外,加權函數判定器313可基於語音信號之頻率分析資訊得出最佳加權函數。頻率分析資訊可包含頻譜傾斜資訊。以下將更詳細地描述加權函數判定器313。
ISF/LSF量子化器315可量子化自當前訊框之訊框端之LPC係數轉換而來的ISF係數或LSF係數。ISF/LSF量子化器315可在輸入編碼模式下獲得最佳量子化索引。ISF/LSF量子化器315可藉由使用由加權函數判定器313判定之加權函數來量子化ISF係數或LSF係數。ISF/LSF量子化器315可藉由在使用由加權函數判定器313判定之加權函數時選擇多個量子化路徑中之一者來量子化ISF係數或LSF係數。作為量子化之結果,可獲得關於當前訊框之訊框端的ISF係數或LSF係數以及已量子化之ISF(Quantized ISF;QISF)或已量子化之LSF(Quantized LSF;QLSF)係數的量子化索引。
第二係數轉換器317可將QISF或QLSF係數轉換成已量子化之LPC(Quantized LPC;QLPC)係數。
現將描述LPC係數之向量量子化與加權函數之間的關係。
向量量子化指示藉由使用均方誤差距離量測來選擇具有最小誤差的碼簿索引之程式,其中認為向量中之所有項具有相同的重要性。然而,由於在LPC係數中之每一者的重要性不同,因此若重要係數之誤差減小,則最終合成信號的感知品質可增加。因此,當量子化LSF係數時,解碼裝置可藉由將表示LSF係數中之每一者之重要性的加權函數應用於均方誤差距離量測且選擇最佳碼簿索引來增加合成信號的效能。
根據例示性實施例,藉由使用頻率資訊以及ISF或LSF係數之實際頻譜量值,基於ISF或LSF係數中之每一者實際上影響頻譜包絡的事實,可判定每個量值之加權函數。根據例示性實施例,藉由組合每個量值之加權函數與每個頻率之加權函數(其考慮感知特性以及頻域之共振峰分佈),可獲得額外的量子化效率。根據例示性實施例,由於使用了頻域之實際量值,因此可良好地反映所有頻率之包絡資訊,且可正確地得出ISF或LSF係數中之每一者的權數。
根據例示性實施例,當執行自LPC係數轉換而來的ISF或LSF係數之向量量子化時,若每一係數之重要性不同,則可判定指示哪一項在向量中相對更重要之加權函數。此外,可判定能夠藉由分析待編碼的訊框之頻譜而使高能量部分有更高權數之加權函數,以改良編碼之準確性。高頻譜能量指示時域中之高相關性。
描述將此加權函數應用於誤差函數之實例。
首先,若輸入信號之變化高,則當在不使用框間預測的情況下執行量子化時,用於經由QISF係數搜尋碼簿索引之誤差函數可由以下等式1表示。否則,若輸入信號之變化低,則當使用框間預測執行量子化時,用於經由QISF係數搜尋碼簿索引之誤差函數可由等式2表示。碼簿索引指示用於使對應的誤差函數最小化之值。(1)(2)
此處,w(i)表示加權函數,z(i)以及r(i)表示量子化器之輸入,z(i)表示自圖3中之ISF(i)移除平均值後的向量,且r(i)表示自z(i)移除框間預測值後的向量。Ewerr(k)可用以在未執行框間預測的情況下搜尋碼簿,且Ewerr(p)可用以在執行了框間預測的情況下搜尋碼簿。此外,c(i)表示碼簿,且p表示ISF係數之階數,所述階數在NB中通常為10,且在WB中通常為16至20。
根據例示性實施例,編碼裝置可藉由組合每個量值之加權函數(在使用對應於自LPC係數轉換而來的ISF或LSF係數之頻率的頻譜量值時)與每個頻率之加權函數(其考慮感知特性以及輸入信號之共振峰分佈)來判定最佳加權函數。
圖4為根據例示性實施例的加權函數判定器400之方塊圖。將加權函數判定器400與頻譜以及LP分析器410之窗處理器421、頻率映射單元423以及量值計算器425一起展示。
參看圖4,窗處理器421將窗應用於輸入信號。窗可為矩形窗、漢明(Hamming)窗或正弦窗。
頻率映射單元423可將時域中之輸入信號映射至頻域中之輸入信號。舉例而言,頻率映射單元423可經由快速傅立葉變換(Fast Fourier Transform;FFT)或修改後的離散餘弦變換(Modified Discrete Cosine Transform;MDCT)將輸入信號變換至頻域。
量值計算器425可計算關於變換至頻域之輸入信號的頻譜區間(frequency spectrum bin)之量值。頻譜區間之數目可與加權函數判定器400正規化ISF或LSF係數之數目相同。
可將頻譜分析資訊作為由頻譜以及LP分析器410執行得出之結果輸入至加權函數判定器400。在此情況下,頻譜分析資訊可包含頻譜傾斜。
加權函數判定器400可正規化自LPC係數轉換而來之ISF或LSF係數。在第p階ISF係數當中,實際被應用了正規化之範圍為0至第(p-2)階。通常,0至第(p-2)階ISF係數存在於0與π之間。加權函數判定器400可執行正規化的數目K與由頻率映射單元423得出的頻譜區間之數目相同,以使用頻譜分析資訊。
加權函數判定器400可藉由使用頻譜分析資訊來判定每個量值之加權函數W1(n),其中ISF或LSF係數影響中間子訊框之頻譜包絡。舉例而言,加權函數判定器400可藉由使用ISF或LSF係數之頻率資訊以及輸入信號之實際頻譜量值來判定每個量值之加權函數W1(n)。可針對自LPC係數轉換而來之ISF或LSF係數判定每個量值之加權函數W1(n)。
加權函數判定器400可藉由使用對應於ISF或LSF係數中之每一者的頻譜區間之量值來判定每個量值之加權函數W1(n)。
加權函數判定器400可藉由使用對應於ISF或LSF係數中之每一者的頻譜區間之量值以及位於頻譜區間周圍之至少一鄰近頻譜區間來判定每個量值之加權函數W1(n)。在此情況下,加權函數判定器400可藉由擷取每一頻譜區間以及至少一鄰近頻譜區間之代表值來判定與頻譜包絡有關的每個量值之加權函數W1(n)。代表值之實例為對應於ISF或LSF係數中之每一者的頻譜區間以及至少一鄰近頻譜區間之最大值、平均值或中間值。
加權函數判定器400可藉由使用ISF或LSF係數之頻率資訊判定每個頻率之加權函數W2(n)。詳細而言,加權函數判定器400可藉由使用感知特性以及輸入信號之共振峰分佈來判定每個頻率之加權函數W2(n)。在此情況下,加權函數判定器400可根據巴克標度(bark scale)擷取輸入信號之感知特性。接著,加權函數判定器400可基於共振峰分佈之第一共振峰判定每個頻率之加權函數W2(n)。
每個頻率之加權函數W2(n)可導致在超低頻率與高頻率中的權數相對低,且導致在低頻率之頻率間隔(例如,對應於第一共振峰之間隔)中的權數為恆定的。
加權函數判定器400可藉由組合每個量值之加權函數W1(n)與每個頻率之加權函數W2(n)來判定最終加權函數W(n)。在此情況下,加權函數判定器400可藉由將每個量值之加權函數W1(n)乘以每個頻率之加權函數W2(n)或與每個頻率之加權函數W2(n)相加來判定最終加權函數W(n)。
作為另一實例,加權函數判定器400可藉由考慮編碼模式以及輸入信號之頻帶資訊來判定每個量值之加權函數W1(n)以及每個頻率之加權函數W2(n)。
為進行上述操作,加權函數判定器400可藉由檢查輸入信號之頻寬而針對輸入信號之頻寬為NB之情況以及輸入信號之頻寬為WB之情況來檢查輸入信號之編碼模式。當輸入信號之編碼模式為UC模式時,加權函數判定器400可判定在UC模式下之每個量值之加權函數W1(n)以及每個頻率之加權函數W2(n)且對其進行組合。
當輸入信號之編碼模式不為UC模式時,加權函數判定器400可判定且組合在VC模式下之每個量值之加權函數W1(n)以及每個頻率之加權函數W2(n)。
若輸入信號之編碼模式為GC模式或TC模式,則加權函數判定器400可經由與VC模式中相同的程式判定加權函數。
舉例而言,當藉由FFT演算法對輸入信號進行頻率變換時,使用FFT係數之頻譜量值的每個量值之加權函數W1(n)可由以下等式3判定。,Min = Wf(n)之最小值 其中, Wf (n) = 10 log(max(Ebin(norm_isf(n)),Ebin(norm_isf(n) + 1),Ebin(norm_isf(n) - 1))), 其中n = 0、……、M-2,1 ≤ norm _isf(n) ≤ 126 Wf(n) = 10 log(Ebin(norm_isf(n))), 其中norm_isf(n) = 0或127 norm_isf(n) = isf(n)/50,則0 ≤ isf(n) ≤ 6350,且0 ≤ norm _isf(n) ≤ 127, k = 0、……、127 (3)
舉例而言,在VC模式下之每個頻率之加權函數W2(n)可由等式4判定,且在UC模式下之每個頻率之加權函數W2(n)可由等式5判定。可根據輸入信號之特性改變等式4以及5中之常數。,其中norm_isf(n)=[0,5] W2(n) = 1.0 其中norm_isf(n)=[6,20],其中norm_isf(n)=[21,127] (4),其中norm_isf(n)=[0,5],其中norm_isf(n)=[6,127] (5)
最終得出之加權函數W(n)可由等式6判定。 W(n)=W1(n) W2(n),其中n=0、……、M-2 W(M-1) = 1.0 (6)
圖5為根據例示性實施例的LPC係數量子化器之方塊圖。
參看圖5,LPC係數量子化器500可包含加權函數判定器511、量子化路徑判定器513、第一量子化方案515以及第二量子化方案517。由於已在圖4中描述了加權函數判定器511,因此本文中省略其描述。
量子化路徑判定器513可在輸入信號之量子化前基於準則判定:選擇多個路徑中之一者作為輸入信號之量子化路徑,所述多個路徑包含不使用框間預測之第一路徑以及使用框間預測之第二路徑。
當選擇第一路徑作為輸入信號之量子化路徑時,第一量子化方案515可量子化自量子化路徑判定器513提供之輸入信號。第一量子化方案515可包含:第一量子化器(未繪示),用於粗略量子化輸入信號;以及第二量子化器(未繪示),用於精確量子化介於輸入信號與第一量子化器之輸出信號之間的量子化誤差信號。
當選擇第二路徑作為輸入信號之量子化路徑時,第二量子化方案517可量子化自量子化路徑判定器513提供之輸入信號。第一量子化方案515可包含用於對輸入信號之預測誤差以及框間預測值執行區塊約束式格狀編碼量子化的元件,以及框間預測元件。
第一量子化方案515為不使用框間預測之量子化方案,且可被命名為安全網方案。第二量子化方案517為使用框間預測之量子化方案,且可被命名為預測方案。
第一量子化方案515以及第二量子化方案517不限於當前例示性實施例,且可分別藉由使用根據以下描述之各種例示性實施例的第一以及第二量子化方案來實施。
因此,根據高效率互動語音服務之低位元元率至提供優質服務之高位元率,可選擇最佳量子化器。
圖6為根據例示性實施例的量子化路徑判定器之方塊圖。參看圖6,量子化路徑判定器600可包含預測誤差計算器611以及量子化方案選擇器613。
預測誤差計算器611可藉由接收框間預測值p(n)、加權函數w(n)以及移除直流(Direct Current;DC)值後的LSF係數z(n)以各種方法來計算預測誤差。首先,可使用框間預測器(未繪示),其與第二量子化方案(亦即,預測方案)中所使用的相同。此處,可使用自我回歸(Auto-Regressive;AR)方法以及移動平均值(Moving Average;MA)方法中之任一者。用於框間預測的先前訊框之信號z(n)可使用已量子化之值或未量子化之值。此外,可藉由使用或不使用加權函數w(n)而獲得預測誤差。因此,組合之總數為8,其中4個如下:
首先,使用先前訊框之已量子化之信號的加權AR預測誤差可由等式7表示。(7)
第二,使用先前訊框之已量子化之信號的AR預測誤差可由等式8表示。(8)
第三,使用先前訊框之信號z(n)的加權AR預測誤差可由等式9表示。(9)
第四,使用先前訊框之信號z(n)的AR預測誤差可由等式10表示。(10)
在等式7至10中,M表示LSF係數之階數,且當輸入語音信號之頻寬為WB時,M通常為16,且表示AR方法之預測係數。如上所述,通常使用關於緊接在前的訊框之資訊,且可藉由使用自以上描述獲得之預測誤差來判定量子化方案。
此外,對於關於先前訊框之資訊不存在(歸因於先前訊框中之訊框誤差)之情況,可藉由使用緊接在先前訊框前之訊框來獲得第二預測誤差,且可藉由使用第二預測誤差來判定量子化方案。在此情況下,與等式7相比,第二預測誤差可由以下等式11表示。(11)
量子化方案選擇器613藉由使用由預測誤差計算器611獲得之預測誤差以及由編碼模式判定器(圖1之115)獲得之編碼模式中的至少一者來判定當前訊框之量子化方案。
圖7A為說明根據例示性實施例的圖6之量子化路徑判定器之操作之流程圖。作為實例,可將0、1以及2用作預測模式。在預測模式0下,僅可使用安全網方案,且在預測模式1下,僅可使用預測方案。在預測模式2下,可切換安全網方案與預測方案。
將在預測模式0下編碼之信號具有不固定特性。不固定信號在相鄰訊框之間有較大的變化。因此,若對不固定信號執行框間預測,則預測誤差可比原始信號大,其導致量子化器之效能的惡化。將在預測模式1下編碼之信號具有固定特性。因為固定信號在相鄰框之間具有較小的變化,所以其框間相關性較高。藉由在預測模式2下執行混合了不固定特性與固定特性的信號之量子化,可獲得最佳效能。即使信號具有不固定特性以及固定特性兩者,仍可基於混合之比率來設定預測模式0或預測模式1。同時,可經由實驗或經由類比將待在預測模式2下設定的混合之比率預先定義為最佳值。
參看圖7A,在操作711中,判定當前訊框之預測模式為0,亦即,當前訊框之語音信號具有不固定特性。作為操作711中的判定之結果,若預測模式為0(例如,在當前訊框的語音信號之變化較大時,如在TC模式或UC模式下),則由於難以進行框間預測,因此可在操作714中將安全網方案(亦即,第一量子化方案)判定為量子化路徑。
作為操作711中的判定之結果,若預測模式不為0,則在操作712中判定預測模式是否為1,亦即,當前訊框之語音信號是否具有固定特性。作為操作712中的判定之結果,若預測模式為1,則由於框間預測的效能優異,因此可在操作715中將預測方案(亦即,第二量子化方案)判定為量子化路徑。
作為操作712中的判定之結果,若預測模式不為1,則判定預測模式為2是以切換方式使用第一量子化方案與第二量子化方案。舉例而言,在當前訊框之語音信號不具有不固定特性時,亦即,在GC模式或VC模式下的預測模式為2時,可藉由考量預測誤差而將第一量子化方案以及第二量子化方案中之一者判定為量子化路徑。為進行上述操作,在操作713中判定介於當前訊框與先前訊框之間的第一預測誤差是否大於第一臨限值。可經由實驗或經由模擬將第一臨限值預先定義為最佳值。舉例而言,在WB之階數為16之情況下,可將第一臨限值設定為2,085,975。
作為操作713中的判定之結果,若第一預測誤差大於或等於第一臨限值,則可在操作714中將第一量子化方案判定為量子化路徑。作為操作713中的判定之結果,若第一預測誤差不大於第一臨限值,則可在操作715中將預測方案(亦即,第二量子化方案)判定為量子化路徑。
圖7B為說明根據另一例示性實施例的圖6之量子化路徑判定器之操作之流程圖。
參看圖7B,操作731至733與圖7A之操作711至713相同,且進一步包含操作734,在操作734中比較介於緊接在先前訊框前之訊框與當前訊框之間的第二預測誤差與第二臨限值比較。可經由實驗或經由模擬將第二臨限值預先定義為最佳值。舉例而言,在WB之階數為16之情況下,可將第二臨限值設定為(第一臨限值×1.1)。
作為操作734中的判定之結果,若第二預測誤差大於或等於第二臨限值,則可在操作735中將安全網方案(亦即,第一量子化方案)判定為量子化路徑。作為操作734中的判定之結果,若第二預測誤差不大於第二臨限值,則可在操作736中將預測方案(亦即,第二量子化方案)判定為量子化路徑。
雖然預測模式之數目在圖7A以及圖7B中為3個,但本發明不限於此。
同時,除了預測模式或預測誤差之外,亦可進一步使用額外資訊來判定量子化方案。
圖8為根據例示性實施例的量子化路徑判定器之方塊圖。參看圖8,量子化路徑判定器800可包含預測誤差計算器811、頻譜分析器813以及量子化方案選擇器815。
由於預測誤差計算器811與圖6之預測誤差計算器611相同,因此省略其詳細描述。
頻譜分析器813可藉由分析頻譜資訊來判定當前訊框之信號特性。舉例而言,在頻譜分析器813中,可藉由使用頻域中之頻譜量值資訊獲得N(N為大於1之整數)個先前訊框與當前訊框之間的加權距離,且當加權距離大於臨限值時(亦即,當框間變化較大時),可將安全網變化判定為量子化方案。由於待比較之物件隨N增大而增加,因此複雜性隨N增大而增加。可使用以下等式12獲得加權距離D。為以低複雜性獲得加權距離D,可藉由僅使用在由LSF/ISF定義之頻率周圍的頻譜量值來比較當前訊框與先前訊框。在此情況下,可比較在由LSF/ISF定義之頻率周圍的M個頻率區間之量值之平均值、最大值或中間值與先前訊框。,其中M
=16 (12)
在等式12中,加權函數Wk(i)可藉由以上描述之等式3獲得,且與等式3之W1(n)相同。在Dn中,n表示先前訊框與當前訊框之間的差。n=1之情況指示介於緊接在前面之訊框與當前訊框之間的加權距離,且n=2之情況指示介於第二先前訊框與當前訊框之間的加權距離。當Dn之值大於臨限值時,可判定當前訊框具有不固定特性。
量子化方案選擇器815可藉由接收自預測誤差計算器811所提供之預測誤差以及自頻譜分析器813所提供之信號特性、預測模式及傳輸頻道資訊來判定當前訊框之量子化路徑。舉例而言,可給輸入至量子化方案選擇器815的資訊指定優先權,以便在選擇量子化路徑時依序考慮。舉例而言,當高訊框誤差率(Frame Error Rate;FER)模式包含於傳輸頻道資訊中時,可將安全網方案選擇比率設定為相對高,或僅可選擇安全網方案。可藉由調整與預測誤差有關之臨限值來以可變方式設定安全網方案選擇比率。
圖9說明關於在提供編碼解碼器服務時可在網路中傳輸之頻道狀態之資訊。
當頻道狀態差時,頻道誤差增加,且結果,框間變化可能較大,從而導致訊框誤差發生。因此,選擇預測方案作為量子化路徑的選擇比率減小,且安全網方案之選擇比率增大。當頻道狀態極差時,僅可將安全網方案用作量子化路徑。為進行上述操作,以一或多個等級來表達藉由組合複數條傳輸頻道資訊而指示頻道狀態之值。高等級指示頻道誤差之機率高的狀態。最簡單的情況為等級之數目為1的情況,亦即,藉由高FER模式判定器911將頻道狀態判定為高FER模式的情況,如圖9中所展示。由於高FER模式指示頻道狀態非常不穩定,因此藉由使用安全網方案之最高選擇比率或僅使用安全網方案來執行編碼。當等級之數目為多個時,可逐個等級地設定安全網方案之選擇比率。
參看圖9,可經由(例如)4條資訊執行在高FER模式判定器911中判定高FER模式之演算法。詳細而言,4條資訊可為:(1)快速回饋(Fast Feedback;FFB)資訊,其為傳輸至實體層之混合自動重複請求(Hybrid Automatic Repeat Request;HARQ)回饋,(2)慢回饋(Slow Feedback;SFB)資訊,其是自傳輸至比實體層高的層之網路傳訊回饋而來,(3)帶內回饋(In-band Feedback;ISB)資訊,其是自遠端中之EVS解碼器913帶內傳訊而來,以及(4)高敏感性訊框(High Sensitivity Frame;HSF)資訊,其由EVS編碼器915關於將以冗餘方式被傳輸之特定重要訊框選擇。雖然FFB資訊以及SFB資訊與EVS編碼解碼器無關,但ISB資訊以及HSF資訊與EVS編碼解碼器有關,且可能需要特定演算法用於EVS編碼解碼器。
可藉由(例如)以下程式碼表達藉由使用4條資訊將頻道狀態判定為高FER模式之演算法。 定義
在初始化期間設定
演算法
如上,可基於藉由4條資訊中之一或多者處理的分析資訊而命令EVS編碼解碼器進入高FER模式。分析資訊可為(例如):(1)藉由使用SFB資訊自Ns個訊框的計算出之平均誤差率得出之SFBavg,(2)藉由使用FFB資訊自Nf個訊框的計算出之平均誤差率得出之FFBavg,以及(3)藉由使用ISB資訊以及分別使用SFB資訊、FFB資訊以及ISB資訊之臨限值Ts、Tf以及Ti自Ni個訊框的計算出之平均誤差率得出之ISBavg。可判定,基於分別將SFBavg、FFBavg以及ISBavg與臨限值Ts、Tf以及Ti比較之結果來判定EVS編碼解碼器進入高FER模式。對於所有條件,可檢查關於每一編碼解碼器是否通常支援高FER模式之HiOK。
可包含高FER模式判定器911作為EVS編碼器915或另一格式之編碼器的元件。或者,高FER模式判定器911可實施於除EVS編碼器915或另一格式之編碼器的元件以外之另一外部元件中。
圖10為根據另一例示性實施例的LPC係數量子化器1000之方塊圖。
參看圖10,LPC係數量子化器1000可包含量子化路徑判定器1010、第一量子化方案1030以及第二量子化方案1050。
量子化路徑判定器1010基於預測誤差以及編碼模式中之至少一者將包含安全網方案之第一路徑以及包含預測方案之第二路徑中的一者判定為當前訊框之量子化路徑。
當將第一路徑判定為量子化路徑時,第一量子化方案1030在不使用框間預測的情況下執行量子化,且第一量子化方案1030可包含多級向量量子化器(Multi-Stage Vector Quantizer;MSVQ)1041以及晶格向量量子化器(Lattice Vector Quantizer;LVQ)1043。MSVQ 1041可較佳地包含兩級。MSVQ 1041藉由粗略地執行移除DC值後的LSF係數之向量量子化來產生量子化索引。LVQ 1043藉由接收介於自MSVQ 1041輸出之反向QLSF係數與移除DC值後的LSF係數之間的LSF量子化誤差而藉由執行量子化來產生量子化索引。藉由將MSVQ 1041之輸出以及LVQ 1043之輸出相加,且接著將DC值與所述加法結果相加,產生最終QLSF係數。第一量子化方案1030可藉由使用在低位元率下具有優異效能的MSVQ 1041(但碼簿需要大的記憶體)與在低位元率下有效率的LVQ 1043(具有小的記憶體以及低的複雜性)之組合來實施非常有效率的量子化器結構。
當將第二路徑判定為量子化路徑時,第二量子化方案1050使用框間預測執行量子化,且第二量子化方案1050可包含BC-TCQ 1063,BC-TCQ 1063具有框內預測器1065以及框間預測器1061。框間預測器1061可使用AR方法以及MA方法中之任一者。舉例而言,應用一階AR方法。預先定義預測係數,且將選擇為先前訊框中之最佳向量的向量用作預測所用之過去向量。具有框內預測器1065之BC-TCQ 1063量子化自框間預測器1061之預測值獲得的LSF預測誤差。因此,可使在高位元率下具有優異量子化效能的BC-TCQ 1063(具有小的記憶體以及低的複雜性)之特性最大化。
結果,當使用第一量子化方案1030以及第二量子化方案1050時,可根據輸入語音信號之特性而實施最佳量子化器。
舉例而言,當在LPC係數量子化器1000中使用41個位元來量子化在GC模式下且具有8-KHz之WB的語音信號時,除了指示量子化路徑資訊之1個位元外,可將12個位元以及28個位元分別分配給第一量子化方案1030之MSVQ 1041以及LVQ 1043。此外,除了指示量子化路徑資訊之1個位元外,可將40個位元分配給第二量子化方案1050之BC-TCQ 1063。
表2展示將位元分配給具有8-KHz頻帶之WB語音信號之實例。 [表2]
圖11為根據另一例示性實施例的LPC係數量子化器之方塊圖。圖11中展示之LPC係數量子化器1100具有與在圖10中展示之結構相反的結構。
參看圖11,LPC係數量子化器1100可包含量子化路徑判定器1110、第一量子化方案1130以及第二量子化方案1150。
量子化路徑判定器1110基於預測誤差以及預測模式中之至少一者將包含安全網方案之第一路徑以及包含預測方案之第二路徑中的一者判定為當前訊框之量子化路徑。
當選擇第一路徑作為量子化路徑時,第一量子化方案1130在不使用框間預測的情況下執行量子化,且可第一量子化方案1130包含向量量子化器(Vector Quantizer;VQ)1141以及具有框內預測器1145之BC-TCQ 1143。VQ 1141藉由粗略執行移除DC值後的LSF係數之向量量子化來產生量子化索引。BC-TCQ 1143藉由接收介於自VQ 1141輸出之反向QLSF係數與移除DC值後的LSF係數之間的LSF量子化誤差而藉由執行量子化來產生量子化索引。藉由將VQ 1141之輸出以及BC-TCQ 1143之輸出相加,且接著將DC值與所述加法結果相加,產生最終QLSF係數。
當將第二路徑判定為量子化路徑時,第二量子化方案1150使用框間預測執行量子化,且第二量子化方案1150可包含LVQ 1163以及框間預測器1161。可將框間預測器1161實施為與圖10中之框間預測器相同或類似。由LVQ 1163量子化自框間預測器1161之預測值獲得的LSF預測誤差。
因此,由於分配給BC-TCQ 1143的位元元之數目小,因此BC-TCQ 1143具有低複雜性,且由於LVQ 1163在高位元率下具有低複雜性,因此通常可以低複雜性執行量子化。
舉例而言,當在LPC係數量子化器1100中使用41個位元來量子化在GC模式下且具有8-KHz之WB的語音信號時,除了指示量子化路徑資訊之1個位元外,可將6個位元以及34個位元分別分配給第一量子化方案1130之VQ 1141以及BC-TCQ 1143。此外,除了指示量子化路徑資訊之1個位元外,可將40個位元分配給第二量子化方案1150之LVQ 1163。
表3展示將位元分配給具有8-KHz頻帶之WB語音信號之實例。 [表3]
可藉由搜尋使等式13之Ewerr(p)最小化的索引而獲得與在多數編碼模式下使用的VQ 1141有關之最佳索引。(13)
在等式13中,w(i)表示在加權函數判定器(圖3之313)中判定之加權函數,r(i)表示VQ 1141之輸入,且c(i)表示VQ 1141之輸出。亦即,獲得使r(i)與c(i)之間的加權失真最小化的索引。
在BC-TCQ 1143中使用之失真量測d(x, y)可由等式14表示。(14)
根據例示性實施例,可藉由將加權函數wk應用於失真量測d(x, y)來獲得加權失真,如由等式15表示。(15)
亦即,藉由獲得在BC-TCQ 1143之所有級中的加權失真,可獲得最佳索引。
圖12為根據另一例示性實施例的LPC係數量子化器之方塊圖。
參看圖12,LPC係數量子化器1200可包含量子化路徑判定器1210、第一量子化方案1230以及第二量子化方案1250。
量子化路徑判定器1210基於預測誤差以及預測模式中之至少一者將包含安全網方案之第一路徑以及包含預測方案之第二路徑中的一者判定為當前訊框之量子化路徑。
當將第一路徑判定為量子化路徑時,第一量子化方案1230在不使用框間預測的情況下執行量子化,且第一量子化方案1230可包含VQ或MSVQ 1241以及LVQ或TCQ 1243。VQ或MSVQ 1241藉由粗略執行移除DC值後的LSF係數之向量量子化來產生量子化索引。LVQ或TCQ 1243藉由接收介於自VQ或MSVQ 1241輸出之反向QLSF係數與移除DC值後的LSF係數之間的LSF量子化誤差而藉由執行量子化來產生量子化索引。藉由將VQ或MSVQ 1241之輸出以及LVQ或TCQ 1243之輸出相加,且接著將DC值與所述加法結果相加,產生最終QLSF係數。由於VQ或MSVQ 1241具有良好位元誤差率(但VQ或MSVQ 1241具有高複雜性且使用大量記憶體),因此,藉由考量總複雜性,VQ或MSVQ 1241之級數可自1增加至n。舉例而言,當僅使用第一級時,VQ或MSVQ 1241變為VQ,且當使用兩個或兩個以上級時,VQ或MSVQ 1241變為MSVQ。此外,由於LVQ或TCQ 1243具有低複雜性,因此可有效率地量子化LSF量子化誤差。
當將第二路徑判定為量子化路徑時,第二量子化方案1250使用框間預測執行量子化,且第二量子化方案1250可包含框間預測器1261以及LVQ或TCQ 1263。可將框間預測器1261實施為與圖10中之框間預測器相同或類似。由LVQ或TCQ 1263量子化自框間預測器1263之預測值獲得的LSF預測誤差。同樣地,由於LVQ或TCQ 1243具有低複雜性,因此可有效率地量子化LSF預測誤差。因此,通常可以低複雜性執行量子化。
圖13為根據另一例示性實施例的LPC係數量子化器之方塊圖。
參看圖13,LPC係數量子化器1300可包含量子化路徑判定器1310、第一量子化方案1330以及第二量子化方案1350。
量子化路徑判定器1310基於預測誤差以及預測模式中之至少一者將包含安全網方案之第一路徑以及包含預測方案之第二路徑中的一者判定為當前訊框之量子化路徑。
當將第一路徑判定為量子化路徑時,第一量子化方案1330在不使用框間預測的情況下執行量子化,且由於第一量子化方案1330與圖12中展示之第一量子化方案相同,因此省略其描述。
當將第二路徑判定為量子化路徑時,第二量子化方案1350使用框間預測執行量子化,且第二量子化方案1350可包含框間預測器1361、VQ或MSVQ 1363以及LVQ或TCQ 1365。可將框間預測器1361實施為與圖10中之框間預測器相同或類似。由VQ或MSVQ 1363粗略量子化使用框間預測器1361之預測值所獲得的LSF預測誤差。由LVQ或TCQ 1365量子化介於LSF預測誤差與自VQ或MSVQ 1363輸出的已去量子化之LSF預測誤差之間的誤差向量。同樣地,由於LVQ或TCQ 1365具有低複雜性,因此可有效率地量子化LSF預測誤差。因此,通常可以低複雜性執行量子化。
圖14為根據另一例示性實施例的LPC係數量子化器之方塊圖。與圖12中展示之LPC係數量子化器1200相比,LPC係數量子化器1400所具有的差異在於,第一量子化方案1430包含具有框內預測器1445之BC-TCQ 1443,而非LVQ或TCQ 1243,且第二量子化方案1450包含具有框內預測器1465之BC-TCQ 1463,而非LVQ或TCQ 1263。
舉例而言,當在LPC係數量子化器1400中使用41個位元來量子化在GC模式下且具有8-KHz之WB的語音信號時,除了指示量子化路徑資訊之1個位元外,可將5個位元以及35個位元分別分配給第一量子化方案1430之VQ 1441以及BC-TCQ 1143。此外,除了指示量子化路徑資訊之1個位元外,可將40個位元分配給第二量子化方案1450之BC-TCQ 1463。
圖15為根據另一例示性實施例的LPC係數量子化器之方塊圖。圖15中展示之LPC係數量子化器1500為圖13中展示的LPC係數量子化器1300之具體實例,其中第一量子化方案1530之MSVQ 1541以及第二量子化方案1550之MSVQ 1563具有兩級。
舉例而言,當在LPC係數量子化器1500中使用41個位元來量子化在GC模式下且具有8-KHz之WB的語音信號時,除了指示量子化路徑資訊之1個位元外,可將6+6=12個位元以及28個位元分別分配給第一量子化方案1530之兩級MSVQ 1541以及LVQ 1543。此外,可將5+5=10個位元以及30個位元分別分配給第二量子化方案1550之兩級MSVQ 1563以及LVQ 1565。
圖16A以及圖16B為根據其他例示性實施例的LPC係數量子化器之方塊圖。詳言之,分別在圖16A以及圖16B中展示之LPC係數量子化器1610以及1630可用以形成安全網方案,亦即,第一量子化方案。
圖16A中展示之LPC係數量子化器1610可包含VQ 1621以及具有框內預測器1625之TCQ或BC-TCQ 1623,且圖16B中展示之LPC係數量子化器1630可包含VQ或MSVQ 1641以及TCQ或LVQ 1643。
參看圖16A以及圖16B,VQ 1621或VQ或MSVQ 1641用少量位元粗略地量子化整個輸入向量,且TCQ或BC-TCQ 1623或TCQ或LVQ 1643精確地量子化LSF量子化誤差。
當僅將安全網方案(亦即,第一量子化方案)用於每一訊框時,為獲得額外的效能改良,可應用清單維特比演算法(List Viterbi Algorithm;LVA)方法。亦即,由於當僅使用第一量子化方案時,與切換方法相比,複雜性尚有餘地,因此可應用藉由增加搜尋操作中之複雜性而達成效能改良的LVA方法。舉例而言,藉由將LVA方法應用於BC-TCQ,可將其設定成:即使LVA結構之複雜性增加,LVA結構之複雜性仍低於切換結構之複雜性。
圖17A至圖17C為根據其他例示性實施例的LPC係數量子化器之方塊圖,所述LPC係數量子化器特定而言具有使用加權函數的BC-TCQ之結構。
參看圖17A,LPC係數量子化器可包含加權函數判定器1710以及量子化方案1720,量子化方案1720包含具有框內預測器1723之BC-TCQ 1721。
參看圖17B,LPC係數量子化器可包含加權函數判定器1730以及量子化方案1740,量子化方案1740包含具有框內預測器1745以及框間預測器1741之BC-TCQ 1743。此處,可將40個位元分配給BC-TCQ 1743。
參看圖17C,LPC係數量子化器可包含加權函數判定器1750以及量子化方案1760,量子化方案1760包含具有框內預測器1765以及框間預測器1761之BC-TCQ 1763。此處,可將5個位元以及40個位元分別分配給VQ 1761以及BC-TCQ 1763。
圖18為根據另一例示性實施例的LPC係數量子化器之方塊圖。
參看圖18,LPC係數量子化器1800可包含第一量子化方案1810、第二量子化方案1830以及量子化路徑判定器1850。
第一量子化方案1810在不使用框間預測的情況下執行量子化,且可使用MSVQ 1821與LVQ 1823之組合以獲得量子化效能的改良。MSVQ 1821可較佳地包含兩級。MSVQ 1821藉由粗略地執行移除DC值後的LSF係數之向量量子化來產生量子化索引。LVQ 1823藉由接收介於自MSVQ 1821輸出之反向QLSF係數與移除DC值後的LSF係數之間的LSF量子化誤差而藉由執行量子化來產生量子化索引。藉由將MSVQ 1821之輸出以及LVQ 1823之輸出相加,且接著將DC值加與所述加法結果相加,產生最終QLSF係數。第一量子化方案1810可藉由使用在低位元率下具有優異效能的MSVQ 1821與在低位元率下有效率的LVQ 1823之組合來實施非常有效率的量子化器。
第二量子化方案1830使用框間預測執行量子化,且可包含BC-TCQ 1843,BC-TCQ 1843具有框內預測器1845以及框間預測器1841。由具有框內預測器1845之BC-TCQ 1843量子化使用框間預測器1841之預測值所獲得的LSF預測誤差。因此,可使在高位元率下具有優異量子化效能的BC-TCQ 1843之特性最大化。
量子化路徑判定器1850藉由考量預測模式以及加權失真而將第一量子化方案1810之輸出以及第二量子化方案1830之輸出中的一者判定為最終量子化輸出。
結果,當使用第一量子化方案1810以及第二量子化方案1830時,可根據輸入語音信號之特性來實施最佳量子化器。舉例而言,當在LPC係數量子化器1800中使用43個位元來量子化在VC模式下且具有8-KHz之WB的語音信號時,除了指示量子化路徑資訊之1個位元外,可將12個位元以及30個位元分別分配給第一量子化方案1810之MSVQ 1821以及LVQ 1823。此外,除了指示量子化路徑資訊之1個位元外,可將42個位元分配給第二量子化方案1830之BC-TCQ 1843。
表4展示將位元分配給具有8-KHz頻帶之WB語音信號之實例。 [表4]
圖19為根據另一例示性實施例的LPC係數量子化器之方塊圖。
參看圖19,LPC係數量子化器1900可包含第一量子化方案1910、第二量子化方案1930以及量子化路徑判定器1950。
第一量子化方案1910在不使用框間預測的情況下執行量子化,且可使用VQ 1921與具有框內預測器1925之BC-TCQ 1923之組合以獲得量子化效能的改良。
第二量子化方案1930使用框間預測執行量子化,且可包含BC-TCQ 1943,BC-TCQ 1943具有框內預測器1945以及框間預測器1941。
量子化路徑判定器1950使用藉由第一量子化方案1910以及第二量子化方案1930獲得之已最佳量子化之值,藉由接收預測模式以及加權失真,來判定量子化路徑。舉例而言,判定當前訊框之預測模式是否為0,亦即,當前訊框之語音信號是否具有不固定特性。當當前訊框之語音信號的變化較大時(如在TC模式或UC模式下),由於難以進行框間預測,因此總是將安全網方案(亦即,第一量子化方案1910)判為量子化路徑。
若當前訊框之預測模式為1,亦即,若當前訊框之語音信號處於不具有不固定特性之GC模式或VC模式,則量子化路徑判定器1950藉由考量預測誤差將第一量子化方案1910以及第二量子化方案1930中之一者判定為量子化路徑。為進行上述操作,首先考慮第一量子化方案1910之加權失真,使得LPC係數量子化器1900不易受訊框誤差影響。亦即,若第一量子化方案1910的加權失真值小於預定義之臨限值,則不管第二量子化方案1930的加權失真值是多少,均選擇第一量子化方案1910。此外,在加權失真值相同之情況下藉由考慮訊框誤差來選擇第一量子化方案1910,而非簡單地選擇較小加權失真值的量子化方案。若第一量子化方案1910的加權失真值是第二量子化方案1930的加權失真值的幾倍大,則可選擇第二量子化方案1930。可將所述倍數(例如)設定為1.15。因而,當判定了量子化路徑時,傳輸由判定之量子化路徑之量子化方案所產生的量子化索引。
在認為預測模式之數目為3個時,可將其實施為在預測模式為0時選擇第一量子化方案1910、在預測模式為1時選擇第二量子化方案1930且在預測模式為2時選擇第一量子化方案1910以及第二量子化方案1930中之一者,作為量子化路徑。
舉例而言,當在LPC係數量子化器1900中使用37個位元來量子化在GC模式下且具有8-KHz之WB的語音信號時,除了指示量子化路徑資訊之1個位元外,可將2個位元以及34個位元分別分配給第一量子化方案1910之VQ 1921以及BC-TCQ 1923。此外,除了指示量子化路徑資訊之1個位元外,可將36個位元分配給第二量子化方案1930之BC-TCQ 1943。
表5展示將位元分配給具有8-KHz頻帶之WB語音信號之實例。 [表5]
圖20為根據另一例示性實施例的LPC係數量子化器之方塊圖。
參看圖20,LPC係數量子化器2000可包含第一量子化方案2010、第二量子化方案2030以及量子化路徑判定器2050。
第一量子化方案2010在不使用框間預測的情況下執行量子化,且可使用VQ 2021與具有框內預測器2025之BC-TCQ 2023之組合以獲得量子化效能的改良。
第二量子化方案2030使用框間預測執行量子化,且可包含LVQ 2043以及框間預測器2041。
量子化路徑判定器2050使用藉由第一量子化方案2010以及第二量子化方案2030獲得之已最佳量子化之值,藉由接收預測模式以及加權失真,來判定量子化路徑。
舉例而言,當在LPC係數量子化器2000中使用43個位元來量子化在VC模式下且具有8-KHz之WB的語音信號時,除了指示量子化路徑資訊之1個位元外,可將6個位元以及36個位元分別分配給第一量子化方案2010之VQ 2021以及BC-TCQ 2023。此外,除了指示量子化路徑資訊之1個位元外,可將42個位元分配給第二量子化方案2030之LVQ 2043。
表6展示將位元分配給具有8-KHz頻帶之WB語音信號之實例。 [表6]
圖21為根據例示性實施例的量子化器類型選擇器之方塊圖。圖21中展示之量子化器類型選擇器2100可包含位元率判定器2110、頻寬判定器2130、內部取樣頻率判定器2150以及量子化器類型判定器2107。所述元件中之每一者可由至少一處理器(例如,中央處理單元(CPU))以整合於至少一模組中的方式實施。在切換兩個量子化方案之預測模式2下可使用量子化器類型選擇器2100。可包含量子化器類型選擇器2100作為圖1之聲音編碼裝置100之LPC係數量子化器117的元件或圖1之聲音編碼裝置100的元件。
參看圖21,位元率判定器2110判定語音信號之編碼位元元率。可針對所有訊框或以訊框為單位判定編碼位元元率。可取決於編碼位元元率而改變量子化器類型。
頻寬判定器2130判定語音信號之頻寬。可取決於語音信號之頻寬而改變量子化器類型。
內部取樣頻率判定器2150基於在量子化器中使用的頻寬之上限判定內部取樣頻率。當語音信號之頻寬等於或寬於WB(亦即,為WB、SWB或FB)時,內部取樣頻率根據編碼頻寬之上限為6.4 KHz或是8 KHz而變化。若編碼頻寬之上限為6.4 KHz,則內部取樣頻率為12.8 KHz,且若編碼頻寬之上限為8 KHz,則內部取樣頻率為16 KHz。編碼頻寬之上限不限於此。
量子化器類型判定器2107藉由接收位元率判定器2110之輸出、頻寬判定器2130之輸出以及內部取樣頻率判定器2150之輸出而選擇開放迴路以及封閉迴路中之一者作為量子化器類型。當編碼位元元率大於預測參考值、語音信號之頻寬等於或寬於WB且內部取樣頻率為16 KHz時,量子化器類型判定器2107可選擇開放迴路作為量子化器類型。否則,可選擇封閉迴路作為量子化器類型。
圖22為說明根據例示性實施例的選擇量子化器類型之方法之流程圖。
參看圖22,在操作2201中,判定位元率是否大於參考值。在圖22中將參考值設定為16.4 Kbps,但參考值不限於此。作為操作2201中的判定之結果,若位元率等於或小於參考值,則在操作2209中選擇封閉迴路類型。
作為操作2201中的判定之結果,若位元率大於參考值,則在操作2203中判定輸入信號之頻寬是否比NB寬。作為操作2203中的判定之結果,若輸入信號之頻寬為NB,則在操作2209中選擇封閉迴路類型。
作為操作2203中的判定之結果,若輸入信號之頻寬比NB寬,亦即,若輸入信號之頻寬為WB、SWB或FB,則在操作2205中判定內部取樣頻率是否為特定頻率。舉例而言,在圖22中,將所述特定頻率設定為16 KHz。作為操作2205中的判定之結果,若內部取樣頻率不為所述特定參考頻率,則在操作2209中選擇封閉迴路類型。
作為操作2205中的判定之結果,若內部取樣頻率為16 KHz,則在操作2207中選擇開放迴路類型。
圖23為根據例示性實施例的聲音解碼裝置之方塊圖。
參看圖23,聲音解碼裝置2300可包含參數解碼器2311、LPC係數去量子化器2313、可變模式解碼器2315以及後處理器2319。聲音解碼裝置2300可進一步包含誤差恢復器2317。聲音解碼裝置2300的元件中之每一者可由至少一處理器(例如,中央處理單元(CPU))以整合於至少一模組中的方式實施。
參數解碼器2311可自位元流解碼參數,所述參數將被用於解碼。當編碼模式包含於位元流中時,參數解碼器2311可對編碼模式以及對應於編碼模式之參數進行解碼。可根據經解碼之編碼模式來執行LPC係數去量子化以及激勵解碼。
LPC係數去量子化器2313可藉由去量子化包含於LPC參數中的已量子化之ISF或LSF係數、已量子化之ISF或LSF量子化誤差或已量子化之ISF或LSF預測誤差而產生經解碼之LSF係數,且藉由轉換經解碼之LSF係數而產生LPC係數。
可變模式解碼器2315可藉由解碼由LPC係數去量子化器2313產生之LPC係數而產生合成信號。可變模式解碼器2315可根據對應於解碼裝置之編碼裝置,根據如圖2A至圖2D中所展示之編碼模式,來執行解碼。
當作為可變模式解碼器2315之解碼之結果在當前訊框中出現誤差時,誤差恢復器2317(若包含)可恢復或隱藏語音信號之當前訊框。
後處理器(例如,中央處理單元(CPU))2319可藉由執行由可變模式解碼器2315產生的合成信號之各種種類之濾波以及語音品質改良處理而產生最終合成信號(亦即,已恢復之聲音)。
圖24為根據例示性實施例的LPC係數去量子化器之方塊圖。
參看圖24,LPC係數去量子化器2400可包含ISF/LSF去量子化器2411以及係數轉換器2413。
ISF/LSF去量子化器2411可根據包含於位元流中之量子化路徑資訊藉由去量子化包含於LPC參數中的已量子化之ISF或LSF係數、已量子化之ISF或LSF量子化誤差或已量子化之ISF或LSF預測誤差而產生經解碼之ISF或LSF係數。
係數轉換器2413可將作為由ISF/LSF去量子化器2411進行之去量子化之結果所獲得的經解碼之ISF或LSF係數轉換成導抗頻譜對(Immittance Spectral Pair;ISP)或線性頻譜對(Linear Spectral Pair;LSP),且針對每一子訊框執行內插。可藉由使用先前訊框之ISP/LSP以及當前訊框之ISP/LSP來執行內插。係數轉換器2413可將每一子訊框之已去量子化以及已內插之ISP/LSP轉換成LSP係數。
圖25為根據另一例示性實施例的LPC係數去量子化器之方塊圖。
參看圖25,LPC係數去量子化器2500可包含去量子化路徑判定器2511、第一去量子化方案2513以及第二去量子化方案2515。
去量子化路徑判定器2511可基於包含於位元流中之量子化路徑資訊將LPC參數提供至第一去量子化方案2513以及第二去量子化方案2515中之一者。舉例而言,量子化路徑資訊可由1個位元表示。
第一去量子化方案2513可包含用於粗略地去量子化LPC參數之元件以及用於精確地去量子化LPC參數之元件。
第二去量子化方案2515可包含用於執行區塊約束式格狀編碼去量子化之元件以及與LPC參數有關的框間預測元件。
第一去量子化方案2513以及第二去量子化方案2515不限於當前例示性實施例,且可根據對應於解碼裝置之編碼裝置藉由使用上述例示性實施例的第一以及第二量子化方案之逆程式來實施第一去量子化方案2513以及第二去量子化方案2515。
無論量子化方法為開放迴路類型或是封閉迴路類型,均可應用LPC係數去量子化器2500之組態。
圖26為根據例示性實施例的在圖25之LPC係數去量子化器2500中的第一去量子化方案2513以及第二去量子化方案2515之方塊圖。
參看圖26,第一去量子化方案2610可包含:多級向量量子化器(MSVQ)2611,用於藉由使用由編碼端(未繪示)之MSVQ(未繪示)產生的第一碼簿索引而去量子化包含於LPC參數中的已量子化之LSF係數;以及晶格向量量子化器(LVQ)2613,用於藉由使用由編碼端之LVQ(未繪示)產生的第二碼簿索引而去量子化包含於LPC參數中的LSF量子化誤差。藉由將由MSVQ 2611獲得的已去量子化之LSF係數與由LVQ 2613獲得的已去量子化之LSF量子化誤差相加,且接著將平均值(預定DC值)與所述加法結果,產生最終經解碼之LSF係數。
第二去量子化方案2630可包含:區塊約束式格狀編碼量子化器(BC-TCQ)2631,用於藉由使用由編碼端之BC-TCQ(未繪示)產生的第三碼簿索引而去量子化包含於LPC參數中的LSF預測誤差;框內預測器2633;以及框間預測器2635。去量子化程式自各LSF向量當中的最低向量開始,且框內預測器2633藉由使用經解碼之向量產生隨後向量元素之預測值。框間預測器2635藉由使用在先前訊框中經解碼之LSF係數經由框間預測產生預測值。藉由將由BC-TCQ 2631以及框內預測器2633獲得之LSF係數與由框間預測器2635產生之預測值相加,且接著將平均值(預定DC值)與所述加法結果相加,產生最終經解碼之LSF係數。
第一去量子化方案2610以及第二去量子化方案2630不限於當前例示性實施例,且可根據對應於解碼裝置之編碼裝置藉由使用上述例示性實施例的第一以及第二量子化方案之逆程式來實施第一去量子化方案2610以及第二去量子化方案2630。
圖27為說明根據例示性實施例的量子化方法之流程圖。
參看圖27,在操作2710中,在接收到之聲音之量子化前基於預定準則判定接收到之聲音之量子化路徑。在例示性實施例中,可判定不使用框間預測的第一路徑以及使用框間預測的第二路徑中之一者。
在操作2730中,檢查自第一路徑以及第二路徑當中所判定之量子化路徑。
若作為操作2730中的檢查之結果將第一路徑判定為量子化路徑,則在操作2750中使用第一量子化方案量子化接收到之聲音。
另一方面,若作為操作2730中的檢查之結果將第二路徑判定為量子化路徑,則在操作2770中使用第二量子化方案量子化接收到之聲音。
可經由上述各種例示性實施例執行操作2710中之量子化路徑判定程式。可藉由使用上述各種例示性實施例並且分別使用第一以及第二量子化方案來執行操作2750以及2770中之量子化程式。
雖然在當前例示性實施例中將第一以及第二路徑設定為可選擇之量子化路徑,但可設定包含第一以及第二路徑之多個路徑,且可根據多個設定路徑而改變圖27之流程圖。
圖28為說明根據例示性實施例的去量子化方法之流程圖。
參看圖28,在操作2810中,解碼包含於位元流中之LPC參數。
在操作2830中,檢查包含於位元流中之量子化路徑,且在操作2850中判定已檢查之量子化路徑為第一路徑或是第二路徑。
若作為操作2850中的判定之結果,量子化路徑為第一路徑,則在操作2870中藉由使用第一去量子化方案去量子化經解碼之LPC參數。
若作為操作2850中的判定之結果,量子化路徑為第二路徑,則在操作2890中藉由使用第二去量子化方案去量子化經解碼之LPC參數。
可根據對應於解碼裝置之編碼裝置藉由分別使用上述各種例示性實施例的第一以及第二量子化方案之逆程式來執行操作2870以及2890中之去量子化程式。
雖然在當前例示性實施例中將第一以及第二路徑設定為已檢查之量子化路徑,但可設定包含第一以及第二路徑之多個路徑,且可根據多個設定路徑而改變圖28之流程圖。
圖27以及圖28之方法可經程式化,且可由至少一處理元件執行。此外,可以訊框為單位或以子訊框為單位執行例示性實施例。
圖29為根據例示性實施例的包含編碼模組之電子元件之方塊圖。
參看圖29,電子元件2900可包含通信單元2910以及編碼模組2930。此外,電子元件2900可進一步包含儲存單元2950,用於根據聲音位元流之用途而儲存作為編碼之結果所獲得的聲音位元流。此外,電子元件2900可進一步包含麥克風2970。亦即,可視情況包含儲存單元2950以及麥克風2970。電子元件2900可進一步包含任意解碼模組(未繪示),例如,用於執行一般解碼功能之解碼模組或根據例示性實施例之解碼模組。編碼模組2930可由至少一處理器(例如,中央處理單元(CPU))(未繪示)以與包含於電子元件2900中之其他元件(未繪示)整合為一體的方式實施。
通信單元2910可接收自外部提供的聲音或經編碼之位元流中之至少一者,或傳輸經解碼之聲音或作為由編碼模組2930進行的編碼之結果所獲得的聲音位元流中之至少一者。
通信單元2910經組態以經由無線網路(諸如,無線網際網路、無線企業內部網路、無線電話網路、無線區域網路(wireless Local Area Network;WLAN)、Wi-Fi、Wi-Fi Direct(WFD)、第三代(3G)、第四代(4G)、藍芽、紅外線資料協會(Infrared Data Association;IrDA)、射頻識別(Radio Frequency Identification;RFID)、超寬頻(Ultra WideBand;UWB)、Zigbee或近場通信(Near Field Communication;NFC))或有線網路(諸如,有線電話網路或有線網際網路)將資料傳輸至外部電子元件以及自外部電子元件接收資料。
編碼模組2930可藉由以下操作來產生位元流:在聲音之量子化前基於預定準則選擇多個路徑中之一者作為經由通信單元2910或麥克風2970提供的聲音之量子化路徑,所述多個路徑包含不使用框間預測之第一路徑以及使用框間預測之第二路徑;藉由根據所選量子化路徑使用第一量子化方案以及第二量子化方案中之一者來量子化聲音;以及對已量子化之聲音進行編碼。
第一量子化方案可包含:第一量子化器(未繪示),用於粗略量子化聲音;以及第二量子化器(未繪示),用於精確量子化介於聲音與第一量子化器之輸出信號之間的量子化誤差信號。第一量子化方案可包含:MSVQ(未繪示),用於量子化聲音;以及LVQ(未繪示),用於量子化介於聲音與MSVQ之輸出信號之間的量子化誤差信號。此外,可藉由上述各種例示性實施例中之一者實施第一量子化方案。
第二量子化方案可包含:用於執行聲音之框間預測之框間預測器(未繪示)、用於執行預測誤差之框內預測之框內預測器(未繪示),以及用於量子化預測誤差之BC-TCQ(未繪示)。同樣地,可藉由上述各種例示性實施例中之一者實施第二量子化方案。
儲存單元2950可儲存由編碼模組2930產生的經編碼之位元流。儲存單元2950可儲存操作電子元件2900所需要的各種程式。
麥克風2970可提供在編碼模組2930外部的使用者之聲音。
圖30為根據例示性實施例的包含解碼模組之電子元件之方塊圖。
參看圖30,電子元件3000可包含通信單元3010以及解碼模組3030。此外,電子元件3000可進一步包含儲存單元3050,用於根據已恢復之聲音之用途而儲存作為解碼之結果所獲得的已恢復之聲音。此外,電子元件3000可進一步包含揚聲器3070。亦即,可視情況包含儲存單元3050以及揚聲器3070。電子元件3000可進一步包含任意編碼模組(未繪示),例如,用於執行一般編碼功能之編碼模組或根據本發明之例示性實施例之編碼模組。解碼模組3030可由至少一處理器(例如,中央處理單元(CPU))(未繪示)以與包含於電子元件3000中之其他元件(未繪示)整合為一體的方式實施。
通信單元3010可接收自外部提供的聲音或經編碼之位元流中之至少一者,或傳輸作為解碼模組3030之解碼之結果所獲得的已恢復之聲音或作為編碼之結果所獲得的聲音位元流中之至少一者。通信單元3010可實質上實施為圖29之通信單元2910。
解碼模組3030可藉由以下操作來產生已恢復之聲音:對包含於經由通信單元3010提供之位元流中的LPC參數進行解碼;藉由基於包含於位元流中之路徑資訊使用不使用框間預測的第一去量子化方案以及使用框間預測的第二去量子化方案中之一者而去量子化經解碼之LPC參數;以及在經解碼之編碼模式下對已去量子化之LPC參數進行解碼。當編碼模式包含於位元流中時,解碼模組3030可在經解碼之編碼模式下對已去量子化之LPC參數進行解碼。
第一去量子化方案可包含:第一去量子化器(未繪示),用於粗略地去量子化LPC參數;以及第二去量子化器(未繪示),用於精確地去量子化LPC參數。第一去量子化方案可包含:MSVQ(未繪示),用於藉由使用第一碼簿索引而去量子化LPC參數;以及LVQ(未繪示),用於藉由使用第二碼簿索引而去量子化LPC參數。此外,由於第一去量子化方案執行圖29中所描述的第一量子化方案之逆操作,因此可根據對應於解碼裝置之編碼裝置藉由對應於第一量子化方案的上述各種例示性實施例之逆程式中之一者來實施第一去量子化方案。
第二去量子化方案可包含:用於藉由使用第三碼簿索引而去量子化LPC參數之BC-TCQ(未繪示)、框內預測器(未繪示)以及框間預測器(未繪示)。同樣地,由於第二去量子化方案執行圖29中所描述的第二量子化方案之逆操作,因此可根據對應於解碼裝置之編碼裝置藉由對應於第二量子化方案的上述各種例示性實施例之逆程式中之一者來實施第二去量子化方案。
儲存單元3050可儲存由解碼模組3030產生的已恢復之聲音。儲存單元3050可儲存用於操作電子元件3000之各種程式。
揚聲器3070可向外輸出由解碼模組3030產生的已恢復之聲音。
圖31為根據例示性實施例的包含編碼模組以及解碼模組之電子元件之方塊圖。
圖31中展示之電子元件3100可包含通信單元3110、編碼模組3120以及解碼模組3130。此外,電子元件3100可進一步包含儲存單元3140,用於根據聲音位元流或已恢復之聲音之用途而儲存作為編碼之結果所獲得的聲音位元流或作為解碼之結果所獲得的已恢復之聲音。此外,電子元件3100可進一步包含麥克風3150及/或揚聲器3160。編碼模組3120以及解碼模組3130可由至少一處理器(例如,中央處理單元(CPU))(未繪示)以與包含於電子元件3100中之其他元件(未繪示)整合為一體的方式實施。
由於圖31中展示的電子元件3100之元件對應於圖29中展示的電子元件2900之元件或圖30中展示的電子元件3000之元件,因此省略其詳細描述。
圖29、圖30以及圖31中展示的電子元件2900、3000以及3100中之每一者可包含僅語音通信終端機(諸如,電話或行動電話)、僅廣播或音樂元件(諸如,TV或MP3播放器),或著僅語音通信終端機與僅廣播或音樂元件之混合終端機元件,但不限於此。此外,電子元件2900、3000以及3100中之每一者可用作用戶端、伺服器或在用戶端與伺服器之間移位之轉換器。
當電子元件2900、3000或3100為(例如)行動電話時,雖未繪示,但電子元件2900、3000或3100可進一步包含:使用者輸入單元(諸如,小鍵盤)、用於顯示由使用者介面或行動電話處理之資訊的顯示器單元以及用於控制行動電話之功能的處理器(例如,中央處理單元(CPU))。此外,行動電話可進一步包含具有攝像功能(image pickup function)之攝影機單元以及用於執行行動電話之功能之至少一組件。
當電子元件2900、3000或3100為(例如)TV時,雖未繪示,但電子元件2900、3000或3100可進一步包含:使用者輸入單元(諸如,小鍵盤)、用於顯示接收到之廣播資訊的顯示器單元以及用於控制TV之所有功能的處理器(例如,中央處理單元(CPU))。此外,TV可進一步包含用於執行TV之功能的至少一組件。
結合LPC係數之量子化/去量子化所體現的與BC-TCQ有關之內容詳細揭露於美國專利第7630890號(區塊約束式TCQ方法,以及用於在語音編碼系統中使用所述方法來量子化LSF參數之方法以及裝置(Block-constrained TCQ method, and method and apparatus for quantizing LSF parameter employing the same in speech coding system))中。關於LVA方法之內容詳細揭露於美國專利申請案第20070233473號(多路徑格狀編碼量子化方法以及使用所述方法之多路徑格狀編碼量子化器(Multi-path trellis coded quantization method and Multi-path trellis coded quantizer using the same))中。美國專利第7630890號以及美國專利申請案第20070233473號之內容以引用的方式併入本文中。
根據本發明概念,為了有效率地量子化音訊或語音信號,藉由根據音訊或語音信號之特性應用多個編碼模式且根據應用於編碼模式中之每一者的壓縮比將各種數目個位元分配給音訊或語音信號,可在編碼模式中之每一者下選擇具有低複雜性之最佳量子化器。
可將根據例示性實施例的量子化方法、去量子化方法、編碼方法以及解碼方法寫成電腦程式,且可使用電腦可讀記錄媒體將其實施於執行程式之通用數位電腦中。此外,在例示性實施例中可利用之資料結構、程式命令或資料檔案可以各種方式記錄於電腦可讀記錄媒體中。電腦可讀記錄媒體為可儲存資料的任一資料儲存元件,其後可由電腦系統讀取所述資料。電腦可讀記錄媒體之實例包含特定而言經組態以儲存且執行程式命令之磁性記錄媒體(諸如,硬碟、軟碟以及磁帶)、光學記錄媒體(諸如,CD-ROM以及DVD)、磁光記錄媒體(諸如,光讀碟片)以及硬體元件(諸如,ROM、RAM以及快閃記憶體)。電腦可讀記錄媒體亦可為用於傳輸信號的傳輸媒體,在所述信號中指定了程式命令以及資料結構。程式命令之實例可包含藉由編譯程式建立之機器語言碼以及可由電腦經由解譯程式執行之高階語言碼。
雖然本發明概念已參照其例示性實施例特定地展示以及描述,但一般熟習此項技術者應理解,在不脫離如以下申請專利範圍所界定的本發明概念之精神以及範疇之情況下,可在其中進行形式以及細節上的各種改變。
100‧‧‧聲音編碼裝置
111‧‧‧預處理器
113‧‧‧頻譜以及線性預測(LP)分析器
115‧‧‧編碼模式選擇器
117‧‧‧線性預測編碼(LPC)係數量子化器
119‧‧‧可變模式編碼器
121‧‧‧參數編碼器
300‧‧‧LPC係數量子化器
311‧‧‧第一係數轉換器
313‧‧‧加權函數判定器
315‧‧‧導抗頻譜頻率(ISF)/線頻譜頻率(LSF)量子化器
317‧‧‧第二係數轉換器
400‧‧‧加權函數判定器
410‧‧‧頻譜以及LP分析器
421‧‧‧窗處理器
423‧‧‧頻率映射單元
425‧‧‧量值計算器
500‧‧‧LPC係數量子化器
511‧‧‧加權函數判定器
513‧‧‧量子化路徑判定器
515‧‧‧第一量子化方案
517‧‧‧第二量子化方案
600‧‧‧量子化路徑判定器
611‧‧‧預測誤差計算器
613‧‧‧量子化方案選擇器
711‧‧‧操作
712‧‧‧操作
713‧‧‧操作
714‧‧‧操作
715‧‧‧操作
731‧‧‧操作
732‧‧‧操作
733‧‧‧操作
734‧‧‧操作
735‧‧‧操作
736‧‧‧操作
800‧‧‧量子化路徑判定器
811‧‧‧預測誤差計算器
813‧‧‧頻譜分析器
815‧‧‧量子化方案選擇器
911‧‧‧高FER模式判定器
913‧‧‧EVS解碼器
915‧‧‧EVS編碼器
1000‧‧‧LPC係數量子化器
1010‧‧‧量子化路徑判定器
1030‧‧‧第一量子化方案
1041‧‧‧多級向量量子化器(MSVQ)
1043‧‧‧晶格向量量子化器(LVQ)
1050‧‧‧第二量子化方案
1061‧‧‧框間預測器
1063‧‧‧區塊約束式格狀編碼量子化器(BC-TCQ)
1065‧‧‧框內預測器
1100‧‧‧LPC係數量子化器
1110‧‧‧量子化路徑判定器
1130‧‧‧第一量子化方案
1141‧‧‧向量量子化器
1143‧‧‧BC-TCQ
1145‧‧‧框內預測器
1150‧‧‧第二量子化方案
1161‧‧‧框間預測器
1163‧‧‧LVQ
1200‧‧‧LPC係數量子化器
1210‧‧‧量子化路徑判定器
1230‧‧‧第一量子化方案
1241‧‧‧VQ或MSVQ
1243‧‧‧LVQ或TCQ
1250‧‧‧第二量子化方案
1261‧‧‧框間預測器
1263‧‧‧LVQ或TCQ
1300‧‧‧LPC係數量子化器
1310‧‧‧量子化路徑判定器
1330‧‧‧第一量子化方案
1350‧‧‧第二量子化方案
1361‧‧‧框間預測器
1363‧‧‧VQ或MSVQ
1365‧‧‧LVQ或TCQ
1400‧‧‧LPC係數量子化器
1430‧‧‧第一量子化方案
1441‧‧‧VQ
1443‧‧‧BC-TCQ
1445‧‧‧框內預測器
1450‧‧‧第二量子化方案
1463‧‧‧BC-TCQ
1465‧‧‧框內預測器
1500‧‧‧LPC係數量子化器
1530‧‧‧第一量子化方案
1541‧‧‧MSVQ
1543‧‧‧LVQ
1550‧‧‧第二量子化方案
1563‧‧‧MSVQ
1565‧‧‧LVQ
1610‧‧‧LPC係數量子化器
1621‧‧‧VQ
1623‧‧‧TCQ或BC-TCQ
1625‧‧‧框內預測器
1630‧‧‧LPC係數量子化器
1641‧‧‧VQ或MSVQ
1643‧‧‧TCQ或LVQ
1710‧‧‧加權函數判定器
1720‧‧‧量子化方案
1721‧‧‧BC-TCQ
1723‧‧‧框內預測器
1730‧‧‧加權函數判定器
1740‧‧‧量子化方案
1741‧‧‧框間預測器
1743‧‧‧BC-TCQ
1745‧‧‧框內預測器
1750‧‧‧加權函數判定器
1760‧‧‧量子化方案
1761‧‧‧框間預測器
1763‧‧‧BC-TCQ
1765‧‧‧框內預測器
1800‧‧‧LPC係數量子化器
1810‧‧‧第一量子化方案
1821‧‧‧MSVQ
1823‧‧‧LVQ
1830‧‧‧第二量子化方案
1841‧‧‧框間預測器
1843‧‧‧BC-TCQ
1845‧‧‧框內預測器
1850‧‧‧量子化路徑判定器
1900‧‧‧LPC係數量子化器
1910‧‧‧第一量子化方案
1921‧‧‧VQ
1923‧‧‧BC-TCQ
1925‧‧‧框內預測器
1930‧‧‧第二量子化方案
1941‧‧‧框間預測器
1943‧‧‧BC-TCQ
1945‧‧‧框內預測器
1950‧‧‧量子化路徑判定器
2000‧‧‧LPC係數量子化器
2010‧‧‧第一量子化方案
2021‧‧‧VQ
2023‧‧‧BC-TCQ
2025‧‧‧框內預測器
2030‧‧‧第二量子化方案
2041‧‧‧框間預測器
2043‧‧‧LVQ
2050‧‧‧量子化路徑判定器
2100‧‧‧量子化器類型選擇器
2107‧‧‧量子化器類型判定器
2110‧‧‧位元率判定器
2130‧‧‧頻寬判定器
2150‧‧‧內部取樣頻率判定器
2201‧‧‧操作
2203‧‧‧操作
2205‧‧‧操作
2207‧‧‧操作
2209‧‧‧操作
2300‧‧‧聲音解碼裝置
2311‧‧‧參數解碼器
2313‧‧‧LPC係數去量子化器
2315‧‧‧可變模式解碼器
2317‧‧‧誤差恢復器
2319‧‧‧後處理器
2400‧‧‧LPC係數去量子化器
2411‧‧‧ISF/LSF去量子化器
2413‧‧‧係數轉換器
2500‧‧‧LPC係數去量子化器
2511‧‧‧去量子化路徑判定器
2513‧‧‧第一去量子化方案
2515‧‧‧第二去量子化方案
2610‧‧‧第一去量子化方案
2611‧‧‧MSVQ
2613‧‧‧LVQ
2630‧‧‧第二去量子化方案
2631‧‧‧BC-TCQ
2633‧‧‧框內預測器
2635‧‧‧框間預測器
2710‧‧‧操作
2730‧‧‧操作
2750‧‧‧操作
2770‧‧‧操作
2810‧‧‧操作
2830‧‧‧操作
2850‧‧‧操作
2870‧‧‧操作
2890‧‧‧操作
2900‧‧‧電子元件
2910‧‧‧通信單元
2930‧‧‧編碼模組
2950‧‧‧儲存單元
2970‧‧‧麥克風
3000‧‧‧電子元件
3010‧‧‧通信單元
3030‧‧‧解碼模組
3050‧‧‧儲存單元
3070‧‧‧揚聲器
3100‧‧‧電子元件
3110‧‧‧通信單元
3120‧‧‧編碼模組
3130‧‧‧解碼模組
3140‧‧‧儲存單元
3150‧‧‧麥克風
3160‧‧‧揚聲器
圖1為根據例示性實施例的聲音編碼裝置之方塊圖。 圖2A至圖2D為可由圖1之聲音編碼裝置之編碼模式選擇器選擇的各種編碼模式之實例。 圖3為根據例示性實施例的線性預測編碼(LPC)係數量子化器之方塊圖。 圖4為根據例示性實施例的加權函數判定器之方塊圖。 圖5為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖6為根據例示性實施例的量子化路徑選擇器之方塊圖。 圖7A以及圖7B為說明根據例示性實施例的圖6之量子化路徑選擇器之操作之流程圖。 圖8為根據另一例示性實施例的量子化路徑選擇器之方塊圖。 圖9說明關於在提供編碼解碼器服務時可在網路端中傳輸之頻道狀態之資訊。 圖10為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖11為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖12為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖13為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖14為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖15為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖16A以及圖16B為根據其他例示性實施例的LPC係數量子化器之方塊圖。 圖17A至圖17C為根據其他例示性實施例的LPC係數量子化器之方塊圖。 圖18為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖19為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖20為根據另一例示性實施例的LPC係數量子化器之方塊圖。 圖21為根據例示性實施例的量子化器類型選擇器之方塊圖。 圖22為說明根據例示性實施例的量子化器類型選擇方法之操作之流程圖。 圖23為根據例示性實施例的聲音解碼裝置之方塊圖。 圖24為根據例示性實施例的LPC係數去量子化器之方塊圖。 圖25為根據另一例示性實施例的LPC係數去量子化器之方塊圖。 圖26為根據例示性實施例的在圖25之LPC係數去量子化器中的第一去量子化方案以及第二去量子化方案之實例之方塊圖。 圖27為說明根據例示性實施例的量子化方法之流程圖。 圖28為說明根據例示性實施例的去量子化方法之流程圖。 圖29為根據例示性實施例的包含編碼模組之電子元件之方塊圖。 圖30為根據例示性實施例的包含解碼模組之電子元件之方塊圖。 圖31為根據例示性實施例的包含編碼模組以及解碼模組之電子元件之方塊圖。
Claims (4)
- 一種解碼方法,其包括:基於來自包含編碼音訊信號和編碼語音信號中的至少一個的位元流所獲得的量子化路徑資訊,選擇不具有框間預測的第一去量子化方案和具有所述框間預測的第二去量子化方案之一,其中所述量子化路徑資訊為在一編碼端以一開放迴路方式基於一預測誤差獲得;以及藉由處理器基於所選擇的去量子化方案執行解碼包括在所述位元流中的經量子化的導抗頻譜頻率或線頻譜頻率係數,以重建音訊或語音,其中所述第一去量子化方案包括具有區塊約束式的格狀結構去量子化器以及一框內預測器,其中所述位元流為基於來自多個編碼模式中的有聲編碼模式獲得。
- 如申請專利範圍第1項所述的解碼方法,其中所述第二去量子化方案包括具有區塊約束式的一格狀結構去量子化器、一框內預測器以及一框間預測器。
- 一種解碼方法,其包括:基於來自包含編碼音訊信號和編碼語音信號中的至少一個的位元流所獲得的量子化路徑資訊,選擇不具有框間預測的第一去量子化方案和具有所述框間預測的第二去量子化方案之一,其中所述量子化路徑資訊為在一編碼端以一開放迴路方式基於一預測誤差獲得;以及藉由處理器基於所選擇的去量子化方案執行解碼包括在所述位元流中的經量子化的導抗頻譜頻率或線頻譜頻率係數,以重建 音訊或語音,其中所述第一去量子化方案包括具有區塊約束式的格狀結構去量子化器、一框內預測器以及一向量去量子化器,其中所述位元流為基於來自多個編碼模式中的有聲編碼模式獲得。
- 如申請專利範圍第3項所述的解碼方法,其中所述第二去量子化方案包括具有區塊約束式的一格狀結構去量子化器、一框內預測器、一框間預測器以及一向量去量子化器。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161477797P | 2011-04-21 | 2011-04-21 | |
US61/477,797 | 2011-04-21 | ||
US201161481874P | 2011-05-03 | 2011-05-03 | |
US61/481,874 | 2011-05-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201729182A TW201729182A (zh) | 2017-08-16 |
TWI672691B true TWI672691B (zh) | 2019-09-21 |
Family
ID=47042087
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW106118018A TWI672691B (zh) | 2011-04-21 | 2012-04-23 | 解碼方法 |
TW101114409A TWI591621B (zh) | 2011-04-21 | 2012-04-23 | 線性預測編碼係數的量子化方法、聲音編碼方法、線性預測編碼係數的去量子化方法、聲音解碼方法以及記錄媒體 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101114409A TWI591621B (zh) | 2011-04-21 | 2012-04-23 | 線性預測編碼係數的量子化方法、聲音編碼方法、線性預測編碼係數的去量子化方法、聲音解碼方法以及記錄媒體 |
Country Status (15)
Country | Link |
---|---|
US (3) | US8977544B2 (zh) |
EP (2) | EP2700173A4 (zh) |
JP (2) | JP6178305B2 (zh) |
KR (2) | KR101863688B1 (zh) |
CN (3) | CN105719654B (zh) |
AU (3) | AU2012246799B2 (zh) |
BR (3) | BR122020023350B1 (zh) |
CA (1) | CA2833874C (zh) |
MX (2) | MX2013012300A (zh) |
MY (1) | MY185091A (zh) |
RU (3) | RU2647652C1 (zh) |
SG (1) | SG194579A1 (zh) |
TW (2) | TWI672691B (zh) |
WO (1) | WO2012144878A2 (zh) |
ZA (1) | ZA201308709B (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101747917B1 (ko) * | 2010-10-18 | 2017-06-15 | 삼성전자주식회사 | 선형 예측 계수를 양자화하기 위한 저복잡도를 가지는 가중치 함수 결정 장치 및 방법 |
CA2833874C (en) * | 2011-04-21 | 2019-11-05 | Ho-Sang Sung | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium |
CN103620675B (zh) * | 2011-04-21 | 2015-12-23 | 三星电子株式会社 | 对线性预测编码系数进行量化的设备、声音编码设备、对线性预测编码系数进行反量化的设备、声音解码设备及其电子装置 |
CN110047499B (zh) | 2013-01-29 | 2023-08-29 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
EP3614381A1 (en) | 2013-09-16 | 2020-02-26 | Samsung Electronics Co., Ltd. | Signal encoding method and device and signal decoding method and device |
WO2015054813A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Technology Licensing, Llc | Encoder-side options for intra block copy prediction mode for video and image coding |
WO2015054811A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Corporation | Features of intra block copy prediction mode for video and image coding and decoding |
AU2014350366B2 (en) * | 2013-11-13 | 2017-02-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
RU2636697C1 (ru) | 2013-12-02 | 2017-11-27 | Хуавэй Текнолоджиз Ко., Лтд. | Устройство и способ кодирования |
BR112016015080A2 (pt) | 2014-01-03 | 2017-08-08 | Microsoft Technology Licensing Llc | Predição de vetor de bloco em codificação / decodificação de vídeo e imagem |
EP4095854B1 (en) * | 2014-01-15 | 2024-08-07 | Samsung Electronics Co., Ltd. | Weight function determination device and method for quantizing linear prediction coding coefficient |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
MX361228B (es) * | 2014-03-04 | 2018-11-29 | Microsoft Technology Licensing Llc | Inversión de bloque y modo de omisión en predicción de intracopia de bloque. |
KR20240010550A (ko) | 2014-03-28 | 2024-01-23 | 삼성전자주식회사 | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 |
EP3648103B1 (en) * | 2014-04-24 | 2021-10-20 | Nippon Telegraph And Telephone Corporation | Decoding method, decoding apparatus, corresponding program and recording medium |
WO2015170899A1 (ko) | 2014-05-07 | 2015-11-12 | 삼성전자 주식회사 | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 |
US9959876B2 (en) * | 2014-05-16 | 2018-05-01 | Qualcomm Incorporated | Closed loop quantization of higher order ambisonic coefficients |
EP3158734A1 (en) | 2014-06-19 | 2017-04-26 | Microsoft Technology Licensing, LLC | Unified intra block copy and inter prediction modes |
CN111968656B (zh) | 2014-07-28 | 2023-11-10 | 三星电子株式会社 | 信号编码方法和装置以及信号解码方法和装置 |
KR101987565B1 (ko) * | 2014-08-28 | 2019-06-10 | 노키아 테크놀로지스 오와이 | 오디오 파라미터 양자화 |
EP3917146A1 (en) | 2014-09-30 | 2021-12-01 | Microsoft Technology Licensing, LLC | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
CA2991341A1 (en) * | 2015-07-06 | 2017-01-12 | Nokia Technologies Oy | Bit error detector for an audio signal decoder |
WO2018133043A1 (zh) * | 2017-01-20 | 2018-07-26 | 华为技术有限公司 | 量化器与量化方法 |
CN109473116B (zh) * | 2018-12-12 | 2021-07-20 | 思必驰科技股份有限公司 | 语音编码方法、语音解码方法及装置 |
TWI723545B (zh) * | 2019-09-17 | 2021-04-01 | 宏碁股份有限公司 | 語音處理方法及其裝置 |
CN114727109B (zh) * | 2021-01-05 | 2023-03-24 | 腾讯科技(深圳)有限公司 | 多媒体的量化处理方法、装置及编码、解码设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080092770A (ko) * | 2007-04-13 | 2008-10-16 | 한국전자통신연구원 | 트렐리스 부호 양자화 알로리즘을 이용한 광대역 음성부호화기용 lsf 계수 양자화 장치 및 방법 |
Family Cites Families (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62231569A (ja) | 1986-03-31 | 1987-10-12 | Fuji Photo Film Co Ltd | 予測誤差の量子化方法 |
JPH0863198A (ja) * | 1994-08-22 | 1996-03-08 | Nec Corp | ベクトル量子化器 |
JPH08190764A (ja) * | 1995-01-05 | 1996-07-23 | Sony Corp | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 |
FR2729244B1 (fr) * | 1995-01-06 | 1997-03-28 | Matra Communication | Procede de codage de parole a analyse par synthese |
JPH08211900A (ja) * | 1995-02-01 | 1996-08-20 | Hitachi Maxell Ltd | ディジタル音声圧縮方式 |
US5699485A (en) | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
US6889185B1 (en) | 1997-08-28 | 2005-05-03 | Texas Instruments Incorporated | Quantization of linear prediction coefficients using perceptual weighting |
US5966688A (en) * | 1997-10-28 | 1999-10-12 | Hughes Electronics Corporation | Speech mode based multi-stage vector quantizer |
CA2722110C (en) * | 1999-08-23 | 2014-04-08 | Panasonic Corporation | Apparatus and method for speech coding |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
US7167828B2 (en) | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
JP3453116B2 (ja) * | 2000-09-26 | 2003-10-06 | パナソニック モバイルコミュニケーションズ株式会社 | 音声符号化方法及び装置 |
US7031926B2 (en) | 2000-10-23 | 2006-04-18 | Nokia Corporation | Spectral parameter substitution for the frame error concealment in a speech decoder |
JP2002202799A (ja) * | 2000-10-30 | 2002-07-19 | Fujitsu Ltd | 音声符号変換装置 |
US6829579B2 (en) * | 2002-01-08 | 2004-12-07 | Dilithium Networks, Inc. | Transcoding method and system between CELP-based speech codes |
JP3557416B2 (ja) * | 2002-04-12 | 2004-08-25 | 松下電器産業株式会社 | Lspパラメータ符号化復号化装置及び方法 |
EP1497631B1 (en) * | 2002-04-22 | 2007-12-12 | Nokia Corporation | Generating lsf vectors |
US7167568B2 (en) * | 2002-05-02 | 2007-01-23 | Microsoft Corporation | Microphone array signal enhancement |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US8090577B2 (en) * | 2002-08-08 | 2012-01-03 | Qualcomm Incorported | Bandwidth-adaptive quantization |
JP4292767B2 (ja) | 2002-09-03 | 2009-07-08 | ソニー株式会社 | データレート変換方法及びデータレート変換装置 |
CN1186765C (zh) * | 2002-12-19 | 2005-01-26 | 北京工业大学 | 2.3kb/s谐波激励线性预测语音编码方法 |
CA2415105A1 (en) | 2002-12-24 | 2004-06-24 | Voiceage Corporation | A method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding |
KR100486732B1 (ko) * | 2003-02-19 | 2005-05-03 | 삼성전자주식회사 | 블럭제한된 트렐리스 부호화 양자화방법과 음성부호화시스템에있어서 이를 채용한 라인스펙트럼주파수 계수양자화방법 및 장치 |
US7613606B2 (en) * | 2003-10-02 | 2009-11-03 | Nokia Corporation | Speech codecs |
JP4369857B2 (ja) | 2003-12-19 | 2009-11-25 | パナソニック株式会社 | 画像符号化装置および画像符号化方法 |
BRPI0510303A (pt) * | 2004-04-27 | 2007-10-02 | Matsushita Electric Ind Co Ltd | dispositivo de codificação escalável, dispositivo de decodificação escalável, e seu método |
US7970605B2 (en) * | 2005-01-12 | 2011-06-28 | Nippon Telegraph And Telephone Corporation | Method, apparatus, program and recording medium for long-term prediction coding and long-term prediction decoding |
DE602005015426D1 (de) | 2005-05-04 | 2009-08-27 | Harman Becker Automotive Sys | System und Verfahren zur Intensivierung von Audiosignalen |
EP1991986B1 (en) | 2006-03-07 | 2019-07-31 | Telefonaktiebolaget LM Ericsson (publ) | Methods and arrangements for audio coding |
GB2436191B (en) * | 2006-03-14 | 2008-06-25 | Motorola Inc | Communication Unit, Intergrated Circuit And Method Therefor |
RU2395174C1 (ru) * | 2006-03-30 | 2010-07-20 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для декодирования/кодирования сигнала видео |
KR100728056B1 (ko) * | 2006-04-04 | 2007-06-13 | 삼성전자주식회사 | 다중 경로 트랠리스 부호화 양자화 방법 및 이를 이용한다중 경로 트랠리스 부호화 양자화 장치 |
JPWO2007132750A1 (ja) * | 2006-05-12 | 2009-09-24 | パナソニック株式会社 | Lspベクトル量子化装置、lspベクトル逆量子化装置、およびこれらの方法 |
US8532178B2 (en) | 2006-08-25 | 2013-09-10 | Lg Electronics Inc. | Method and apparatus for decoding/encoding a video signal with inter-view reference picture list construction |
US7813922B2 (en) * | 2007-01-30 | 2010-10-12 | Nokia Corporation | Audio quantization |
KR101083383B1 (ko) * | 2007-03-14 | 2011-11-14 | 니폰덴신뎅와 가부시키가이샤 | 부호화 비트 레이트 제어 방법 및 장치, 그 프로그램 및 프로그램을 기록한 기록매체 |
WO2009044346A1 (en) * | 2007-10-05 | 2009-04-09 | Nokia Corporation | System and method for combining adaptive golomb coding with fixed rate quantization |
US20090136052A1 (en) * | 2007-11-27 | 2009-05-28 | David Clark Company Incorporated | Active Noise Cancellation Using a Predictive Approach |
US20090245351A1 (en) * | 2008-03-28 | 2009-10-01 | Kabushiki Kaisha Toshiba | Moving picture decoding apparatus and moving picture decoding method |
US20090319261A1 (en) | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
EP2144230A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
ES2683077T3 (es) | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
CN102177426B (zh) * | 2008-10-08 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 多分辨率切换音频编码/解码方案 |
WO2011042464A1 (en) | 2009-10-08 | 2011-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
TWI435317B (zh) * | 2009-10-20 | 2014-04-21 | Fraunhofer Ges Forschung | 音訊信號編碼器、音訊信號解碼器、用以提供音訊內容之編碼表示型態之方法、用以提供音訊內容之解碼表示型態之方法及使用於低延遲應用之電腦程式 |
CA2833874C (en) * | 2011-04-21 | 2019-11-05 | Ho-Sang Sung | Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium |
CN103620675B (zh) | 2011-04-21 | 2015-12-23 | 三星电子株式会社 | 对线性预测编码系数进行量化的设备、声音编码设备、对线性预测编码系数进行反量化的设备、声音解码设备及其电子装置 |
JP2017137439A (ja) * | 2016-02-04 | 2017-08-10 | 株式会社双葉紙器 | セラミドとセラミド誘導体との製造方法 |
-
2012
- 2012-04-23 CA CA2833874A patent/CA2833874C/en active Active
- 2012-04-23 US US13/453,386 patent/US8977544B2/en active Active
- 2012-04-23 CN CN201610086079.3A patent/CN105719654B/zh active Active
- 2012-04-23 JP JP2014506341A patent/JP6178305B2/ja active Active
- 2012-04-23 WO PCT/KR2012/003128 patent/WO2012144878A2/en active Application Filing
- 2012-04-23 RU RU2017115073A patent/RU2647652C1/ru active
- 2012-04-23 EP EP12774337.5A patent/EP2700173A4/en not_active Ceased
- 2012-04-23 AU AU2012246799A patent/AU2012246799B2/en active Active
- 2012-04-23 SG SG2013078548A patent/SG194579A1/en unknown
- 2012-04-23 TW TW106118018A patent/TWI672691B/zh active
- 2012-04-23 CN CN201610086054.3A patent/CN105513602B/zh active Active
- 2012-04-23 RU RU2013151673A patent/RU2619710C2/ru active
- 2012-04-23 MY MYPI2013701989A patent/MY185091A/en unknown
- 2012-04-23 BR BR122020023350-8A patent/BR122020023350B1/pt active IP Right Grant
- 2012-04-23 CN CN201280031031.2A patent/CN103620676B/zh active Active
- 2012-04-23 MX MX2013012300A patent/MX2013012300A/es active IP Right Grant
- 2012-04-23 BR BR112013027093-4A patent/BR112013027093B1/pt active IP Right Grant
- 2012-04-23 EP EP19170516.9A patent/EP3537438A1/en not_active Withdrawn
- 2012-04-23 MX MX2015005084A patent/MX354812B/es unknown
- 2012-04-23 BR BR122020023363-0A patent/BR122020023363B1/pt active IP Right Grant
- 2012-04-23 TW TW101114409A patent/TWI591621B/zh active
- 2012-04-23 KR KR1020120042183A patent/KR101863688B1/ko active IP Right Grant
-
2013
- 2013-11-20 ZA ZA2013/08709A patent/ZA201308709B/en unknown
-
2015
- 2015-02-18 US US14/624,948 patent/US9626980B2/en active Active
-
2016
- 2016-05-31 AU AU2016203627A patent/AU2016203627B2/en active Active
-
2017
- 2017-04-14 US US15/488,059 patent/US10229692B2/en active Active
- 2017-07-13 JP JP2017137448A patent/JP2017203997A/ja active Pending
- 2017-11-29 AU AU2017268591A patent/AU2017268591B2/en active Active
-
2018
- 2018-02-19 RU RU2018106074A patent/RU2675044C1/ru active
- 2018-05-28 KR KR1020180060688A patent/KR101997038B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080092770A (ko) * | 2007-04-13 | 2008-10-16 | 한국전자통신연구원 | 트렐리스 부호 양자화 알로리즘을 이용한 광대역 음성부호화기용 lsf 계수 양자화 장치 및 방법 |
Non-Patent Citations (3)
Title |
---|
"ITU-T G.718 – Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s", 30 June 2008 (2008-06-30), , https://www.itu.int/rec/dologin_pub.asp?lang=e&id=T-REC-G.718-200806-I!!SOFT-ZST-E&type=items * |
"ITU-T G.718 – Frame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/s", 30 June 2008 (2008-06-30), XP055087883, https://www.itu.int/rec/dologin_pub.asp?lang=e&id=T-REC-G.718-200806-I!!SOFT-ZST-E&type=items |
XP055087883 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI672691B (zh) | 解碼方法 | |
KR101997037B1 (ko) | 선형예측계수 양자화장치, 사운드 부호화장치, 선형예측계수 역양자화장치, 사운드 복호화장치와 전자기기 |