TWI480859B - 縮減複雜性向量索引及解索引技術 - Google Patents
縮減複雜性向量索引及解索引技術 Download PDFInfo
- Publication number
- TWI480859B TWI480859B TW098104662A TW98104662A TWI480859B TW I480859 B TWI480859 B TW I480859B TW 098104662 A TW098104662 A TW 098104662A TW 98104662 A TW98104662 A TW 98104662A TW I480859 B TWI480859 B TW I480859B
- Authority
- TW
- Taiwan
- Prior art keywords
- vector
- vectors
- preamble
- index
- group
- Prior art date
Links
- 239000013598 vector Substances 0.000 title claims description 514
- 238000012545 processing Methods 0.000 claims description 108
- 238000000034 method Methods 0.000 claims description 83
- 230000008569 process Effects 0.000 claims description 39
- 230000008570 general process Effects 0.000 claims description 27
- 238000013139 quantization Methods 0.000 claims description 21
- 238000005457 optimization Methods 0.000 claims description 7
- 230000009471 action Effects 0.000 claims description 5
- 230000006870 function Effects 0.000 description 16
- 238000004590 computer program Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- ACWBQPMHZXGDFX-QFIPXVFZSA-N valsartan Chemical class C1=CC(CN(C(=O)CCCC)[C@@H](C(C)C)C(O)=O)=CC=C1C1=CC=CC=C1C1=NN=NN1 ACWBQPMHZXGDFX-QFIPXVFZSA-N 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/94—Vector quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明是關於向量索引及解索引技術。
用於語音及音訊編碼之低複雜性演算法對於基於行動終端機的通訊是一非常相關的資產。在習知語音及音訊編碼解碼器(例如適應性多速率-寬頻(AMR-WB)或G.嵌入式可變位元率(G.EV-VBR),目前正在ITU-T SG16/Q9中標準化)之幾個狀態中,雖然該等演算法保持編碼效率,但是由於低儲存及低複雜性,結構碼簿是較佳的,例如用於量化。
被用於語音及音訊編碼解碼器之量化方法的碼簿可(例如)基於格子結構,如由S.Ragot、B.Bessette與R.Lefebvre的參考案“Low-complexity multi-rate lattice vector quantization with application to wideband TCX speech coding at 32 kbit/s”(關於聲學、語音以及信號處理的IEEE 國際會議記錄,2004年(ICASSP‘04),加拿大蒙特利爾,2004年5月17-21日,vol.1,第501-504)中所描述的,該參考案之全部內容以參照方式被併入本文。此參考案也較詳細地描述了量化程序。
當多個格子結構被用作碼簿時,用於對該等格點索引的演算法是需要的。
可能將一格子碼簿定義為多個前導類之一集合,每個
前導類之特性在於一前導向量。一前導向量是一n維向量,其分量被排序(例如,漸減地)。接著對應該前導向量的前導類由該前導向量以及透過該前導向量之所有符號置換所獲得的所有向量組成(具有一些可能的限制)。
一種用於對被定義為多個前導類之一並集的一格子之多個點進行索引的演算法可(例如)是對多個前導進行索引的類型。在此脈絡下,詞典編撰的以及二項式演算法以及其他的演算法可被應用,如A.Vasilache與I.Tabus的參考案“Robust indexing of lattices and permutation codes over binary symmetric channels”(In signal Processing vol.83,no.7,第1467-1486頁,2003年)中所描述的,該參考案之全部內容以參照方式被併入本文。
二項式演算法一般較不複雜,因為它們一次考慮幾個向量分量。
已存在可能進一步縮減索引及/或解索引之複雜性的技術。
依據本發明之一第一層面,一種方法被揭露,包含對包含在多組向量中的一組向量中的一輸入向量進行索引。該索引包含在該輸入向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理只可應用於多個輸入向量包含在具有該特性的多組向量中之情形。該索引進一步包含在該輸入向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理。
依據本發明之該第一層面,又一電腦程式被揭露。該電腦程式包含可操作用以使一處理器對包含在多組向量中的一組向量中的一輸入向量進行索引的指令。該索引包含在該輸入向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理只可應用於多個輸入向量包含在具有該特性的多組向量中之情形。該索引進一步包含在該輸入向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理。
依據本發明之該第一層面,具有儲存在其上的此一電腦程式之又一電腦可讀媒體被揭露。該電腦可讀媒體可以是可儲存以電、磁、電磁或光學形式的數位資料之任何媒體。該媒體可固定安裝在一裝置內或可以是一可移除媒體。
依據本發明之該第一層面,又一裝置被揭露,該裝置包含一處理元件,該處理元件被組配成用以對包含在多組向量中的一組向量中的一輸入向量進行索引。該處理元件進一步被組配成用以在需被索引的該輸入向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理只可應用於多個輸入向量包含在具有該特性的多組向量中之情形。該處理元件進一步被組配成用以在需被索引的該輸入向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理。
依據本發明之一第一層面,又一裝置被揭露,該裝置包含用以對包含在多組向量中的一組向量中的一輸入向量進行索引的裝置。該用於索引的裝置包含在該輸入向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理的裝置且該特別處理只可應用於多個輸入向量包含在具有該特性的多組向量中之情形。該用於索引的裝置進一步用以該輸入向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理的裝置。
依據本發明之該第一層面,該輸入向量是需被索引的一向量。該輸入向量包含在一組向量中,該組向量接著包含在多組向量組中。該等向量組可(例如)作為一碼簿,用於(例如)一量化程序。在此一量化程序中,相對於需被量化的一向量,該輸入向量可(例如)被識別為該等向量組中的所有向量之一最接近匹配。
該輸入向量之索引指定一索引給該輸入向量。該索引可(例如)構成一信號。該信號可以輸入向量之標識在兩個實體之間交換。透過該索引,該輸入向量可至少部分在包含其的該等向量組中識別出。該索引可(例如)識別該等向量組中的輸入向量,或者僅在包含該輸入向量的向量組中的輸入向量。此外,該索引可表示該輸入向量之分量的符號。
該輸入向量之索引可(例如)至少產生表示該輸入向量中的值之位置的一位置索引。該索引可另外產生表示該輸入向量之分量之一符號的一符號索引。此外,該索引可產生合併該位置索引與該符號索引的一最終索引,且該最終索引可另外表示包含該輸入向量的前導類。
基於包含該輸入向量的向量組,一不同的處理被執行。若該輸入向量包含在屬於該預定義組群的向量組的一組向量中,則一特別處理被應用。否則,一一般處理被應用。這兩種處理形成該輸入向量之索引的至少一部分。例如,該特別處理與該一般處理可與整個索引流程相關聯,或者可與該索引流程之部分相關聯。
該特別處理適用於包含該輸入向量的該等向量組之一特性。
該特別處理定制用於包含該輸入向量的向量組。這允許改良處理且減少該輸入向量之索引的整個複雜性。
例如,該特別處理之結構相較於一般處理可被簡化,例如藉在一迴圈中執行幾個動作。
同樣良好地,該特別處理之引入可允許減少一般處理之複雜性,例如藉自一般處理排除特定向量組之輸入向量的處理(且將它們包括到特別處理中),使得一般處理可被簡化。這兩個測量導致減少該輸入向量之索引的整體複雜性。
此定制可限制將該特別處理應用於包含在具有該特性的向量組中,即該特別處理可(例如)應用於輸入向量包含在不是該預定義組群的向量組中的向量組中之情形。
該一般處理可能不被限於輸入向量只包含在一特定組群的向量組中的向量組之應用。例如,該一般處理可應用於:輸入向量包含在該等向量組之任何向量組中之情形,或者輸入向量包含在除了該預定義組群的向量組中的向量組之外的該等向量組之任何向量組中。相對於包含在不位於該預定義組群的向量組中的向量組中的輸入向量,後一選擇可允許一般處理之最佳化。
依據本發明之第一層面的一示範性實施例,若該一般處理應用於包含在具有該特性的向量組中的輸入向量,則該一般處理可比應用於相同輸入向量的特別處理更複雜。其中,複雜性可(例如)與計算複雜性及/或儲存要求相關聯。
依據本發明之第一層面的一示範性實施例,包含在該預定義組群的向量組的一組向量中的輸入向量比包含不位於該預定義組群的向量組中的一組向量中的輸入向量被索引的可能性更大。相對於整體複雜性,該特別處理比一般處理(當應用於包含在具有該特性的向量組中的輸入向量)更不複雜可能是特別有用的。該可能性可取決於執行該索引的應用。該可能性可(例如)隨機被決定。
依據本發明之第一層面的一示範性實施例,該等向量組是前導類,且每個前導類包含一不同的前導向量以及該前導向量之多個置換。接著該等前導類之並集可定義一格子,該格子可被用作用於量化的一結構碼簿,例如用於一語音、音訊或視訊編碼解碼器、圖像編碼、資料印象或者應用量化的任何其他領域。
該等前導類可以是有符號,且該索引可至少部分產生表示該輸入向量中的值之位置的一位置索引以及表示該輸入向量之分量的符號之一符號索引。接著,在該特別處理中,該位置索引與該符號索引可在一迴圈中一起被決定。該迴圈可(例如)在該輸入向量之每個分量之間迴圈。對比而言,在一般處理中,該位置索引與該符號索引僅可逐一被決定。該索引也產生合併該位置索引與該符號索引的一最終索引,該最終索引可另外表示包含該輸入向量的前導類。
可選擇地,該等前導類可以是無符號的。接著該索引可僅產生表示該輸入向量中的值之位置的一位置索引。如同此情形,該索引也可產生另外表示包含該輸入向量的前導類之一最終索引。
該特別處理適用於的特性可是該預定義組群的前導類只包含具有其分量僅取一預定義數目的不同值之前導向量的前導類。此預定義數目可(例如)是二。將該特別處理適用於該特性在二項式索引之脈絡下可能特別有用,因為其允許在一迴圈中決定位置索引以及符號索引,而不是逐一決定它們。此外,將該特別處理適用於該特性在二項式索引之脈絡下可是有用的,因為該索引程序僅必須處理一值(第一個)之位置,不必進一步準備以檢查第二個值之位置(該(等)位置由第一個值之位置的固定而固定。
該預定義組群的前導類包含具有其分量只取偶數值的前導向量之一第一子組群的前導類,以及具有其分量只取奇數值的前導向量之一第二子組群的前導類。該特別處理接着規定該輸入向量包含在該第一子組群的前導類之一前導類中的情形與該輸入向量包含在該第二子組群的前導類之一前導類中的情形具有不同的動作。
可選擇地,該特別處理適用於的該特性可是該預定義組群的前導類僅包含具有其分量取一最大數目不同值的前導向量之前導類。例如,該預定義組群的前導類中的該等前導類可具有四值前導向量。以該特別處理處理此等前導類可允許縮減一般處理之複雜性,因為一般處理只可應付具有三個或較少不同值的前導向量之前導類。這貢獻於縮減輸入向量之索引的整體複雜性。
該一般處理可應用於輸入向量包含在除了該預定義組群的向量組中的該等向量組之外的該等向量組中的任何向量組之情形以允許該一般處理之一最佳化。
該輸入向量之索引可在基於由該等前導類定義的一格子碼簿的一量化程序中執行。
依據本發明之第一層面的一示範性實施例,該索引是一二項式索引。在此一二項式索引中,索引是基於將值分配給某一維的一向量中的位置之可能性的數目。
依據本發明之一第二層面,一種方法被揭露,包含基於與一目標向量相關聯的一索引決定包含在多組向量中的一組向量中的該目標向量。該決定包含在該目標向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理只可應用於多個目標向量包含在具有該特性的多組向量中之情形。該決定進一步包含在該目標向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理。
依據本發明之該第二層面,又一電腦程式被揭露,包含可操作用以使一處理器基於與一目標向量相關聯的一索引決定包含在多組向量中的一組向量中的該目標向量之指令。該決定包含在該目標向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理只可應用於多個目標向量包含在具有該特性的多組向量中之情形。該決定進一步包含在該目標向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理。
依據本發明之該第二層面,具有儲存在其上的此一電腦程式之又一電腦可讀媒體被揭露。該電腦可讀媒體可以是可儲存以電、磁、電磁或光學形式的數位資料之任何媒體。該媒體可固定安裝在一裝置內或可以是一可移除媒體。
依據本發明之該第二層面,又一裝置被揭露,包含一處理元件,該處理元件被組配成用以基於與一目標向量相關聯的一索引決定包含在多組向量中的一組向量中的該目標向量。該處理元件進一步被組配成用以在需被決定的該目標向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理只可應用於多個目標向量包含在具有該特性的多組向量中之情形。該處理元件進一步被組配成用以在需被決定的該目標向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理。
依據本發明之該第二層面,又一裝置被揭露,該裝置包含用以基於與一目標向量相關聯的一索引決定包含在多組向量中的一組向量中的該目標向量的裝置。該用於決定的裝置包含用於在該目標向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理的裝置且該特別處理只可應用於多個目標向量包含在具有該特性的多組向量中之情形。該用於決定的裝置進一步包含用於在該目標向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理的裝置。
依據本發明之該第二層面,該目標向量是需基於與該目標向量相關聯的一索引被決定的一向量。該目標向量包含在一組向量中,該組向量接著包含在多組向量中。該等向量組可(例如)作為一碼簿,例如用於一量化程序。在此一量化程序中,相對於需被量化的一向量,該目標向量可(例如)可被識別為該等向量組中的所有向量之一最接近匹配,且可能已被分配一索引(即,可能已經被索引),例如參看本發明之第一層面所揭露的。該索引可(例如)至少部分識別一組向量中的目標向量。另外,該索引可(例如)識別包含該目標向量的向量組,且可進一步表示該目標向量之分量的符號。基於此索引,依據本發明之第二層面,該目標向量可被恢復。這可能需要將索引從執行該目標向量之索引的一實體發送給基於該索引決定該目標向量的一實體。關於此方面,該索引可被認為是在該等實體之間傳送的一信號。該索引可(例如)在一量化期間發生,且基於該索引決定該目標向量,這可被認為是一“解索引”,接著可在一解量化期間發生。
依據本發明之該第二層面,基於包含該目標向量的該等向量組,一不同的處理被執行。若該目標向量包含在屬於該預定義組群的向量組的一組向量中,則應用一特別處理。否則,一一般處理被應用。
該特別處理適用於包含該目標向量的該等向量組之一特性。
在使用該特性下,該特別處理定制於包含該目標向量的該等向量組。這允許改良處理且減少決定該目標向量之整體複雜性。例如,相較於該一般處理,該特別處理之結構可被簡化。此測量導致縮減整體複雜性。然而,該定制可將該特別處理限制應用於目標向量包含在具有該特性的向量組中的情形,即該特別處理可(例如)無法應用於目標向量包含在不位於該預定義組群的向量組中的向量組中之情形。
該一般處理可能無法被限制以應用於目標向量只包含在一特定組群的向量組中之情形。例如,該一般處理可應用於多個目標向量包含在特定組群的向量組之任何向量組中之情形,或者應用於多個目標向量包含在除了該預定義向量組中的該等向量組之外的該等向量組中的任何向量組中之情形。該後一選擇可允許一般處理之至少一些最佳化。
依據本發明之第二層面的一示範性實施例,若該一般處理應用於目標向量包含在具有該特性的向量組中之情形,則該一般處理比應用於相同目標向量之情形的特別處理更複雜。其中,複雜性可能(例如)與計算複雜性及/或儲存要求相關聯。
依據本發明之第二層面的一示範性實施例,包含在該預定義組群的向量組中的一組向量中的目標向量比包含在不位於該預定義組群的向量組中的一組向量中的目標向量具有更大的機率被決定。相對於整體複雜性,該特別處理比該一般處理更不複雜可能特別有用(當應用於目標向量包含在具有該特性的向量組之情形時)。該機率可取決於執行該目標向量之決定的應用(例如,一解量化程式)。該機率可(例如)離線決定。
依據本發明之第二層面的一示範性實施例,該等向量組是前導類,且每個前導類包含一不同的前導向量以及該前導向量之多個置換。
該該特別處理適用於的該特性可是(例如)該預定義組群的前導類只包含具有其分量僅取一預定義數目的不同值的前導向量之前導類。該預定義數目可以是(例如)2。其中,該兩個不同值中的其中一者可(例如)是零。
該目標向量之該決定在基於由該等前導類定義的一格子碼簿的一解量化程序中執行。
該特別處理適用於的特性可同樣良好的是該預定義組群的前導類僅包含具有其分量取一最大數目不同值的前導向量之前導類。例如,該預定義組群的前導類中的該等前導類可具有四值前導向量。以該特別處理處理此等前導類可允許減少一般處理之複雜性,因為該一般處理可能僅處理具有三個或更少不同值的前導向量之前導類。這貢獻於縮減輸入向量之解索引的整體複雜性。
該一般處理可應用於目標向量包含在除了該預定義組群的向量組中的該等向量組之外的該等向量組中的任何向量組之情形以允許該一般處理之一最佳化。
依據本發明之第二層面的一示範性實施例,該索引透過一二項式索引與該目標向量相關聯。在此一二項式索引中,索引是基於將值分配給某一維的向量中的位置之可能性的數目。
依據本發明之一第三層面,一種系統被揭露。該系統包含一第一處理元件,該第一處理元件被組配成用以對包含在多組向量中的一組向量中的一輸入向量進行索引,該第一處理元件更被組配成用以在需被索引的該輸入向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理只可應用於多個輸入向量包含在具有該特性的多組向量中之情形;以及該處理元件進一步被組配成用以在需被索引的該輸入向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理。該系統進一步包含一第二處理元件,該第二處理元件被組配成用以基於與一目標向量相關聯的一索引決定包含在該等向量組中的一組向量中的該目標向量,該第二處理元件進一步被組配成用以在需被決定的該目標向量包含在該等向量組之一預定義組群的一或多組向量中的一組向量中之情形中,執行適用於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理只可應用於多個目標向量包含在具有該特性的多組向量中之情形;以及該處理元件進一步被組配成用以在需被決定的該目標向量不包含在該預定義組群的向量組中的一組向量中之情形中,執行一一般處理。
對於依據本發明之第三層面的系統,相應地應用本發明之第一及第二層面的特性及優點的以上描述。
該第二處理元件可(例如)決定與一索引相關聯的一目標向量,該索引在該第一處理元件對該輸入向量進行索引期間已經被指定給一輸入向量,使得該輸入向量與該目標向量是相等的。該索引可(例如)在該等第一與第二處理元件之間傳送。
該等第一與第二處理元件可(例如)包含在兩個不同的裝置中,其中在包含該第一處理元件的該裝置中,一輸入向量被索引,且其中在包含該第二處理元件的裝置中,與由該第一處理元件決定的索引相關聯的一目標向量被決定。
同樣良好地,該等第一與第二處理元件可包含在相同的裝置中,且可(例如)分別被用於量化及解量化。
本發明之此等及其他層面從參看之後給出的詳細描述將是明顯的且顯而易見的。本發明之特性以及以上給出的其示範性實施例被認為在彼此所有可能的組合中被揭露。
在該等圖式中,顯示:第1圖:G.EV-VBR編碼器之一示意方塊圖;第2圖:一種依據本發明之第一層面的一示範性實施例的用於索引一輸入向量的方法之一流程圖;第3圖:一種依據本發明之第二層面的一示範性實施例的用於基於與目標向量相關聯的一索引決定一目標向量的方法之一流程圖;以及第4圖:能夠實施依據本發明之第一與第二層面的方法之一裝置的一示意方塊圖。
在本發明之以下詳細描述中,本發明之示範性實施例將在提出給G.EV-VBR編碼解碼器或其衍生物的格子量化器之脈絡下的格點之索引以及解索引之脈絡下描述。然而,本發明不限於此編碼解碼器,不限於此特定格子量化器,或不限於格子結構之索引/解索引;本發明同樣可良好地應用於向量之索引以及解索引被需要的所有其他情形。
G.EV-VBR編碼解碼器正在ITU-T SG16/Q9中標準化進程中。其是一種用於具有8、12、16、24以及32kbits/s之編碼位元率的寬頻信號之語音以及音訊嵌入式可調整編碼解碼器。
第1圖是G.EV-VBR編碼器1之一示意方塊圖。前兩層是基於程式碼激勵線性預測(CELP)且被表示為“核心編碼解碼器”(參看核心編碼解碼器單元101)。其餘層通過原始信號100與核心編碼解碼器合成信號之間的差分信號103之修改離散余弦轉換(MDCT)係數(參看MDCT單元104)之編碼獲得,其中該差分信號自加法器102獲得。該等MDCT係數之量化(對於對應位元率24kbit/s的層)正使用一量化器105,基於自來自格子2RE8的前導類獲得的前導類,該格子2RE8是以因數2為調整比例的格子E8之旋轉版本。接著前兩層與位於位元流產生單元106中的其餘層合併。
一般被用於量化的格子可被表示為多個前導類之多個並集。因此,基於格子的量化結構可被描述為多個前導類之並集。
一前導向量是一n維整數向量,其分量被排序(例如,漸減地):
v i
,...,v 1
,v 2
,...,v m
,...,v m
,其中v 1
>v 2
>...v m
,v i N
。
具有n i
個值v i
。對應該前導向量的前導類由通過該前導類之所有符號置換獲得的向量組成,具有一些可能的限制。當該等限制應用時,它們與可能是奇數或偶數的負向量分量之數目相關聯。該前導類中的向量之數目是
其中p是校驗位元,可以是0(沒有符號限制)、+1(偶數數目的負分量)或者-1(奇數數目的負向量)。
舉二項式索引為例,考慮4維前導向量(2,1,1,0)。我們此時考慮沒有考慮符號的置換。
屬於(2,1,1,0)之前導類的向量在以下的表1中給出,其中兩個不同的索引變數被給出:
參看表1之第一變數,可看出在第一組群中(具有索引0-3,即前四個向量,由水平直線表示),該等值1與0之相對位置是相同的,而是值2之位置從一向量改變到另一向量。相同地發生在第二組群(具有索引4-7)內,等等。第一組群與第二組群之間的差異在於在決定具有值2的分量之位置之後如何將具有值1的分量設於三個位置上。該兩個值在三個位置上的可能排列之數目由二項式係數給出。因此,在第一變數中具有三組群,其中在每一組群中,只有值2之位置被改變,使得三組群中的每一組群內具有個向量。
因此,可推斷出列舉一前導類中的向量之一方法是考慮該向量中的不同值(一次一個),且檢查它們的可能位置。對於所考慮的例子(變數1),值2之可能的位置首先被考慮,接著對於剩餘的3個位置,具有值1的分量之位置被考慮。具有值0的分量之位置取決於前兩個值之位置(因為是最後一個值),因此其並不需要被單獨考慮。
表1中的變數2遵循一類似的方法。然而,值2之位置在一組群內不被改變,但是在組群之間被改變。因此,現在具有四組群(分別具有索引0-2、3-5、6-8以及9-11)。在每一組群內,三個向量之不同之處在於值1之排列,值1在三個可能的位置上出現兩次,即。
回看以上提出給在ITU-T SG16/Q9中標準化的G.EV-VBR編碼解碼器的示範性格子量化器,其內定義的前導向量在以下的表2中再現(該等前導向量不同於標準化前導向量一比例因數)。該等前導向量之維度(因此是格子)是八,且具有總的36個前導向量。其中,具有奇數值分量的前導向量具有符號限制。特別地,若所有八個分量之絕對值的總和是四的倍數,則負分量之數目應是偶數,否則應是奇數。例如,具有索引0(1,1,1,1,1,1,1,1)的前導向量具有總和8,其是四的倍數,因此來自對應其的前導類之向量中應具有偶數的-1。具有索引3(3,1,1,1,1,1,1,1)的前導向量具有總和10,其不是4的倍數,因此負分量之數目應為奇數。
用於屬於一前導類的一向量之二項式索引程序可由以下示範性一般索引碼描述,以利用由ITU G.191 ITU-T軟體工具庫2005用戶手冊提供的固定點庫之ANSI-C編寫(用於一般數位信號處理器(DSP)之模擬,例如函數sub()、add()、L_mult0(),move16())。其中,該程式碼之注釋提供在一雙向前斜線“//”之後或在“/*”與“*/”符號之間。
該索引碼是一般的,即其可應用於表2之任何前導類中所包含的輸入向量。
在此索引碼中,該等變數及函數/程序具有以下意義:
‧DIM是格子維度,即8。
‧變數int no_vals_[36]儲存每個前導向量之不同值的數目。
‧變數int no_vals_ind_[36][4]儲存每個前導向量中的每個個別值之數目。
‧變數int vals_[36][4]儲存屬於每個前導向量的值。
‧變數int idx_lead表示需被索引的輸入向量所屬的前導類之索引。
‧變數int abs_cv[8]保持需被索引的輸入向量之絕對值。
‧函數find_pos_elim_fx(int*abs_cv,int dim,int val,int*p)找出在絕對值為abs_cv的dim維向量中具有值val的分量之位置、將它們放入陣列p中,且自向量abs_cv刪除它們,以將其用於準備搜尋下一值。
‧函數find_pos_fx(int*abs_cv,int dim,int val,int*p)與find_pos_elim_fx相同,但是沒有刪除分量。該函數被調用給該前導向量中的倒數第二個值,因為對於最後一個值不需要進一步搜尋,因此不需要刪除具有倒數第二個值的分量。
‧函數int c2idx_fx(int dim,int*p,int no_vals)指定一索引以將no_vals分量定位成總的dim個可能的分量。
例如:
(x x 0 0)索引0
(x 0 x 0)索引1
(x 0 0 x)索引2
(0 x x 0)索引3
(0 x 0 x)索引4
(0 0 x x)索引5
其中no_vals=2,DIM=4以及在四個可能的位置上的兩個“x”之位置被索引。
‧函數int number_fx(int no_vals,int*no_vals_ind_,int dim)計算通過具有no_vals數目的值之一dim維向量之非符號置換獲得的向量之數目,各自具有陣列no_vals_ind_中發生的數目。其對應來自方程式(1)沒有因數2m_|p|
的公式。
以上給出的一般索引碼之功能可自以下例子理解。再次考慮表1之變數2的示範性前導類。在此例子中的前導類是(2,1,1,0),且假設該前導類與idx_lead=5相關聯,雖然(例如)這並不是很重要。此外,假設需被索引的輸入向量是(1,0,2,1),即該例子之維度小於表2(使用8維向量)中的示範性格子量化器。然而由於以上索引碼之一般性,這並沒有關係。
接著以上索引碼中的變數被初始化為以下值:
接著以上索引碼產生以下結果(在每次疊代運算結束時):
作為包含的前導類idx_lead=5(顯示為表1中的變數2)中的輸入向量(1,0,2,1)之索引的最終結果,該(位置)索引7被獲得,其實際上對應前導類5中的向量(1,0,2,1)。
回看以上給出的一般索引碼,除了表示該輸入向量中的值之位置的位置索引之外,與該輸入向量中的非零值之符號相關的資訊應被編碼。符號之索引被計算為:
其中S是需被索引的向量中的非零分量之數目,若第i個非零分量是正,則bi
是0,否則是1。S之值對於一前導類中的所有向量是相同的。
接著最終的索引I(包含位置與符號索引資訊,以及表示包含輸入向量的前導類之資訊)被計算為:
其中,所使用的變數具有以下意義:
‧int idx_sign_max_bit[36]是儲存表示符號索引的位元之數目的一變數。若校驗位為0,其實際上對應向量中的非零值之數目,若校驗位元為+/-1,則對應非零值-1之數目。
‧uint offset_lead[36+1]表示每個前導類之前導偏移。其實際上表示若在第一前導類中具有n1
個向量,在第二前導類中具有n2
個向量等,則offset_lead將是:0、n1
、n1
+n2
...。這樣,表示包含該輸入向量之前導類的資訊可被包括在最後索引I內。
‧最後索引I藉實際上將idx_sign放在被偏移的最後一個idx_sign_max_bits[]位元上而獲得(即,將該等位置索引位元與idx_sign位元串聯,雖然知道idx_sign最多可使用idx_sign_max_bits,且增加目前被索引的向量所屬的前導類之偏移)。
本發明之第一層面提出藉以下步驟縮減以上所描述的一般索引之複雜性:若需被索引的一輸入向量包含在屬於一預定義的前導類組的一前導類中,則施加特別處理,否則施加一般處理。
第2圖是描述了依據本發明之第一層面的一示範性實施例的一輸入向量之索引的方法之一流程圖2。
在一第一步驟200中,一輸入向量被接收。該輸入向量可(例如)在一量化程序期間被決定,例如是一前導類並集的一格子中的所有向量之最接近匹配。包含該輸入向量的前導類之一標識也在步驟200中被接收。舉幾個例子而言,其可(例如)以是該前導類之一索引,或者包含該輸入向量的前導類之前導向量。
在一步驟201中,接著決定該前導類是否包含在一預定義組群之一或多個前導類中。若是此情形,則一特別處理在步驟202被應用。否則,一一般處理在一步驟203被應用。
現在較詳細討論該預定義的前導類組群以及當對包含在此預定義組群的前導類中的多個前導類中的輸入向量進行索引時應用的特別處理之例子。
依據本發明之第一層面的一第一示範性實施例,只有與具有索引20(參看表2)的前導向量相關聯的前導類(即,{6,4,2,0,0,0,0,0})受到一特別處理。因此,該預定義組群的前導類只包含一個前導類,以索引20識別。
特別地,以上所描述的一般索引碼中的函數number_fx()之調用可被以下程式碼替代:
其中,變數C[DIM+1][DIM+1]儲存達到8維的二項式係數。
在此實施例中,該特別處理由在idx_lead等於20之情形中執行的程式碼表示,且一般處理由若idx_lead不等於20被執行的程式碼表示。
在此實施例之脈絡下,發明人已觀察到具有索引20的前導類是具有4個不同值的單一前導。具有索引20的前導向量(是具有四個不同值的唯一向量)強迫表格no_vals_ind_之維度是36 x 4(36個前導類以及每個前導類具有一最大數目的4個不同值),即對於idx_lead=20以及i=3(i在0至3的範圍內),no_vals_ind_[idx_lead][i]僅不同於0。然而,在以上給出的一般索引碼中,此no_vals_ind_之非零值的唯一參考只對於函數number_fx()中的idx_lead=20發生。因此,將該函數number_fx()分成一特別處理(對於具有前導向量索引20的前導類)與一一般處理(對於其餘前導類)是有利的,其中在一般處理中,現在只需要具有36x3維的一表格no_vals_ind_之參考。因此,該特別處理之引入允許最佳化一般處理。
在本發明之第一層面的一第二示範性實施例中,發明人觀察到:在一些實際用途情形中,該等前導類之一小的子集比其他小子集更經常發生。例如對於利用G.EV-VBR編碼解碼器(具有建立在表2之前導向量上的格子結構)中的格子量化器量化的資料,具有索引1的前導向量(即,(2,2,0,0,0,0,0,0)最可能被使用,且一般地,對於其前導向量具有兩個不同值的向量(例如,具有索引1,2,3,4,5,6,9等的前導向量)比其他向量更可能被使用。他們推斷,考慮一種對於該等向量之複雜性特別小的索引方法是合理的。
對於符號之索引的計算,具有用以校驗每個向量分量之符號的一迴圈之需求。個別/特別考慮僅具有兩個不同值的前導向量較不複雜,因為該索引程序處理僅具有一個值(第一個)的位置,不必作出進一步的準備以檢驗後續值之位置。除此之外,大部分僅具有兩個值的前導向量具有一零值(例如參看表2中具有索引1、2、4等的前導向量),因此位置索引之產生可有效地在相同的迴圈中與符號索引之產生耦合。
具有兩類型的具有兩個值的前導,一類型僅具有偶數值(例如參看具有表2中的具有索引1、2、4、5等的前導向量)且另一類型僅具有奇數值(參看索引3、6、9等)。對於第一類型,大部分分量具有值0,而對於第二類型,大部分分量具有值1。
例如,以下特別程序可被用以代替以上所描述的整個一般索引碼以處理具有偶數分量的二值向量。
以一類似的方式,第二類型(具有偶數值的二值向量)可利用(例如)以下程序被個別處理:
因此在本發明之第一層面的第二示範性實施例中,該預定義組群的前導類包含只具有二值前導向量的所有前導類(即,具有前導索引1、2、3、4、5、6、9等的前導類。)。該特別處理由兩個碼片段表示,該兩個碼片段指定了分別具有偶數分量以及奇數分量的二值前導向量之處理,且該一般處理由應用於所有其他前導類的一般索引碼表示(例如,在表2中具有前導向量索引0、7、8、10等的前導類)。其中,需注意到的是,該預定義的組群在此被分成兩個子組群,具有偶數分量的二值前導向量之一第一子組群,以及具有奇數分量的二值前導向量之一第二子組群,且對於該等子組中的每組群,在該特別處理中執行不同的動作。
作為本發明之第一層面的第二示範性實施例的一第一修改,也可將該特別處理分配給具有奇數分量的二值前導向量(例如,具有3、6、9等的索引),以代替執行一般索引碼。接著該預定義組群的前導類將只包含具有偶數分量的二值前導向量之前導類。可選擇地,具有偶數分量的二值前導向量可被分配該特別處理。
作為本發明之第一層面的第二示範性實施例的一第二修改,也可將該特別處理限於只決定位置索引(“index”),或者只決定符號索引(“idx_sign”)。當然,此修改也可應用於本發明之第一層面的第二示範性實施例的第一修改。
本發明之第一層面是關於一輸入向量之索引,其在(例如)量化期間是被需要的。將在以下描述的本發明之第二層面是關於解索引,即基於與一目標向量相關聯的一索引決定(或恢復)該目標向量。
一種用於屬於由表2定義的一前導類之一目標向量之二項式解索引程序可由以下示範性一般解索引碼描述。該解索引碼是一般的,即可應用於包含表2之任何前導類中的目標向量。被用於此解索引碼的變數及函數對應在本發明之第一層面之脈絡下給出的一般索引碼之變數以及函數。該解索引程序接收變數idx_lead(其標示前導類)以及變數index_loc(其表示位置索引(表示目標向量中的值之位置))作為一輸入,且將目標向量cv決定為一輸出。其中,該目標向量之符號未被考慮,其可在一個別程序中恢復。
其中,函數idx2c_fx(int dim,int*p,int no_vals,int index_loc)與以上討論的函數c2idx_fx互補且返回一dim維向量中的no_vals分量之位置p,如index_loc所規定的。
此外,變數int occ_pos[8]記錄具有已解碼的值之分量已被設置在其上的位置。該變數int offset[8]被用以找出該等值之實際位置,因為若(例如)一值已經被設置在一8維向量上,則以下值之位置索引僅相對於7個位置。例如,對於4維前導(2 1 1 0),若當解碼值2之位置得到(x 2 x x)且值1之位置索引是0,則其對應該二值分量之位置(0,1),但是該等值實際上設置在該等位置(0,2)上,因為第一個值2已經在位置1上。
第3圖是描述了依據本發明之第二層面的一示範性實施例的基於與一目標向量相關聯的一索引決定該目標向量之方法的一流程圖3。此方法可(例如)在一解量化程序期間被執行。
在一第一步驟300中,與需被決定的一目標向量相關聯的一索引被接收。該索引可以(例如)是自一前導類之多個向量選擇一向量的一索引,其中該前導類中的該等向量可(例如)被二項式索引。除了該索引之外,包含該目標向量的前導類之一標識被接收。然而,這是可取捨的,因為包含該目標向量的前導類之標識同樣可良好地包含在與該目標向量相關聯的索引內。步驟300中接收的前導類之索引及標識可(例如)自包含所有以下資訊的一索引獲得:該前導類之一標識、與該前導類中的哪一向量應被決定為目標向量有關的資訊,以及該目標向量之符號資訊。
在第3圖之流程圖3中決定的目標向量可(例如)在一量化程序期間被選擇為一格子中的所有向量之一最接近匹配。
在一步驟301,接著決定該前導類是否包含在一或多個前導類之一預定義組群中。若是此情形,則一特別處理在步驟302被應用。否則,一一般處理在一步驟303被應用。
現在較詳細討論該預定義組群的前導類以及當對包含在此預定義組群的前導類之該等前導類中的目標向量進行解索引時所應用的特別處理之例子。
依據本發明之第二層面的一第一示範性實施例,只有與具有索引20(參看表2)的前導向量相關聯的前導類(即,{6,4,2,0,0,0,0,0})受到一特別處理。因此,該預定義組群的前導類只包含一前導類,以索引20標識。
特別地,以上給出的一般解索引碼之第一FOR迴圈(在水平虛線之上)可由以下程式碼代替:
此外,一般解索引碼中的函數number_fx()之調用可由以下程式碼代替:
其中,如以上已經解釋的,該變數C[DIM+1][DIM+1]儲存達到8維的二項式係數。
在此實施例中,該特別處理由在idx_lead等於20之情形中執行的程式碼表示,且該一般處理由若idx_lead不等於20執行的程式碼表示。
在此實施例之脈絡下,發明人已觀察到具有索引20的前導類是具有4個不同值的單一前導。具有索引20的前導向量(是唯一一個具有4個不同值的向量)強迫表no_vals_ind_與表vals_為36x4維(36個前導類且每個前導類具有一最大數目的4個不同值),即no_vals_ind_[idx_lead][i]與vals_[idx_lead][i]只對於idx_lead=20與i=3(在0至3之範圍內)存在。然而,在以上給出的一般解索引碼中,no_vals_idx_與vals_之個別值的唯一參考只對於已被特別程式碼代替的一般解索引碼之部分中的idx_lead=20發生。接著,在該一般解索引碼之其餘部分中,現在僅需要具有36x3維的表no_vals_ind_與vals_之參考。因此,該特別處理之引入允許最佳化一般處理。
依據本發明之第二層面的一第二示範性實施例,該預定義組群的前導類僅包含具有索引為1(參看表2)的前導類向量之前導類,即(2,2,0,0,0,0,0,0)。取代總是執行一一般解索引,即在目標向量包含在任何前導類之情形中可應用的一解索引(已參考以上的一般解索引碼給出),而是(例如)在一目標向量包含在具有索引為1的前導類向量之前導類中之情形中,以下特別處理可被執行,否則僅執行一般處理。注意到的是,如同以上給出的一般解索引碼,以下特別處理僅產生無符號目標向量cv。
在G.EV.VBR編碼解碼器(即,對於基於表2中定義的前導向量之碼簿)以及以16、24及32kbits/s之位元率的語音及音樂資料中,前導向量(2,2,0,0,0,0,0,0)是至今為止最可能的,使得將一特別處理應用於其前導類縮小解索引程序之整體複雜性。
第4圖是可實施依據本發明之第一及第二層面的方法之一裝置4的一示意方塊圖。該裝置可以是(例如)一行動電話、一電腦或任何其他電子裝置。該裝置包含一中央處理單元(CPU)400,該CPU 400存取一程式記憶體401及一記憶體402。該CPU 400可(例如)執行儲存在程式記憶體401中的一電腦程式。其中,程式記憶體401可固定安裝在裝置4中,或者是可移除的。例如,該程式記憶體401可被實施為具有儲存在其內的電腦程式之一電腦可讀媒體。記憶體402可(例如)實施為隨機存取記憶體(RAM)。程式記憶體401及記憶體402同樣可良好地實施為一個單一元件。
CPU 400進一步控制一麥克風驅動器、一揚聲器驅動器403以及一介面405,該麥克風驅動器接著控制一麥克風、該揚聲器驅動器403接著控制一揚聲器,且該介面405可透過該介面405與其他裝置交換資料。該介面405可(例如)實施為一無線電介面。
因此裝置4包含用以建立與另一實體進行基於音訊通訊的所有元件。透過麥克風驅動器404接收的音訊信號可由該CPU 400編碼,且透過介面405發送給另一裝置。同樣良好地,來自其他裝置的音訊資料可透過介面405被接收、被CPU 400解碼且透過揚聲器驅動器403呈現。
其中,為了執行編碼及解碼,裝置4之CPU 400執行一編碼解碼器(例如,G.EV-VBR編碼解碼器)。此編碼解碼器可(例如)實施為儲存在程式記憶體401中的電腦程式。這樣,裝置4可(例如)實施第1圖之結構方塊101、104、105以及106。
CPU 400可被理解為一處理元件,該處理器元件執行輸入向量之索引(依據第2圖之流程圖),且/或基於與該目標向量相關聯的一索引決定一目標向量(依據第3圖之流程圖),且對於此方面,依據本發明之第一及第二層面執行特別處理及一般處理。同樣良好地,該編碼解碼器或其部分可以專用硬體406(例如,一數位信號處理器(DSP)、一場可規劃閘陣列(FPGA)、一特定應用積體電路(ASIC)或任何其他專用硬體)實施,接著該專用硬體406可被理解為執行輸入向量之索引且/或基於與該目標向量相關聯的一索引決定一目標向量的一處理元件,且關於此方面,依據本發明之第一及第二層面執行特別及一般處理。
由CPU 400執行的程式碼也可被視為包含以功能模組之形式的此等處理元件。
本發明在以上已透過示範性實施例被描述。應注意到的是,具有對於該項領域內具有通常知識者顯而易見且在不偏離附加的申請專利範圍之範圍及精神下可實施的可選擇的方法及變化。
1...GEV-VBR編碼器
2...流程圖
3...流程圖
100...原始信號
101...編碼解碼器單元
102...加法器
103...差分信號
104...MDCT單元
105...量化器
106...位元流產生單元
200~203...步驟
300~303...步驟
第1圖:G.EV-VBR編碼器之一示意方塊圖;
第2圖:一種依據本發明之第一層面的一示範性實施例的用於索引一輸入向量的方法之一流程圖;
第3圖:一種依據本發明之第二層面的一示範性實施例的用於基於與目標向量相關聯的一索引決定一目標向量的方法之一流程圖;以及
第4圖:能夠實施依據本發明之第一與第二層面的方法之一裝置的一示意方塊圖。
2...流程圖
200~203...步驟
Claims (16)
- 一種用以對向量進行索引之方法,包含下列步驟:使用一處理器對多組向量中的一組向量中的一輸入向量進行索引,其中進行之該索引包含:在該輸入向量係在該等多組向量之一預定義組群的一或多組向量中的一組向量中之情形中,使用一處理器執行適於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理可應用於多個輸入向量包含在具有該特性的多組向量中之情形,其中該等向量組是前導類,其中每個前導類包含一不同的前導向量以及該前導向量之多個置換;且其中該等前導類是有符號的,且其中該索引產生表示該輸入向量中的多個值之位置的一位置索引以及表示該輸入向量之多個分量之符號的一符號索引,且其中該特別處理、該位置索引以及該符號索引在一迴圈中被一起決定;以及在該輸入向量不在該預定義組群的向量組中的該等向量組中之情形中,使用一處理器執行一個一般處理。
- 如請求項1之方法,其中適於該特別處理的該特性是該預定義組群的前導類包含具有其分量採取一預定義數目的不同值的前導向量之前導類。
- 如請求項1之方法,其中該預定義組群的前導類包含具有其分量取偶數值的前導向量之一第一子組群的前導類,以及具有其分量取奇數值的前導向量之一第二子組 群的前導類,且其中該特別處理規定該輸入向量係在該第一子組群的前導類之一前導類中的情形與該輸入向量係在該第二子組群的前導類之一前導類中的情形具有不同的動作。
- 如請求項1之方法,其中若該一般處理應用於在具有該特性的該等向量組中的輸入向量,則該一般處理會比應用於相同的輸入向量的該特別處理更複雜。
- 如請求項1之方法,其中適於該特別處理的該特性是該預定義組群的前導類包含具有其分量取最大數目不同值的前導向量之前導類。
- 如請求項1之方法,其中該一般處理可應用於輸入向量在除了該預定義組群的向量組中的該等向量組之外的該等多個向量組的任何向量組中之情形,以允許該一般處理之一最佳化。
- 如請求項1之方法,其中該索引是一個二項式索引。
- 如請求項1之方法,其中該輸入向量之該索引係在基於由該等前導類定義的一格子碼簿的一量化程序中執行。
- 一種用以對向量進行索引之裝置,包含:一處理元件,組配來對多組向量中的一組向量中的一輸入向量進行索引,該處理元件進一步組配來在需被索引的該輸入向量係在該等多組向量之一預定義組群的一或多組向量中的一組向量中之情形中,執行適於該預定義組群的向量組中的該等向量組之一特性的一特別處理且該特別處理可應用於多個輸入向量包含在具 有該特性的多組向量中之情形,其中該等向量組是前導類,其中每個前導類包含一不同的前導向量以及該前導向量之多個置換,其中該等前導類是有符號的,且其中該索引產生表示該輸入向量中的多個值之位置的一位置索引以及表示該輸入向量之多個分量之符號的一符號索引,且其中該特別處理、該位置索引以及該符號索引在一迴圈中被一起決定;且該處理元件進一步組配來在需被索引的該輸入向量不在該預定義組群的向量組的該等向量組中之情形中,執行一個一般處理。
- 如請求項9之裝置,其中適於該特別處理的該特性是該預定義組群的前導類包含具有其分量採取一預定義數目的不同值的前導向量之前導類。
- 如請求項9之裝置,其中該預定義組群的前導類包含具有其分量取偶數值的前導向量之一第一子組群的前導類,以及具有其分量取奇數值的前導向量之一第二子組群的前導類,且其中該特別處理規定該輸入向量在該第一子組群的前導類之一前導類中的情形與該輸入向量在該第二子組群的前導類之一前導類中的情形具有不同的動作。
- 如請求項9之裝置,其中若該一般處理應用於在具有該特性的該等向量組中的輸入向量,則該一般處理會比應用於相同的輸入向量的該特別處理更複雜。
- 如請求項9之裝置,其中適於該特別處理的該特性是該預定義組群的前導類包含具有其分量採取一最大數目 不同值的前導向量之前導類。
- 如請求項9之裝置,其中該一般處理可應用於輸入向量係在除了該預定義組群的向量組中的該等向量組之外的該等多個向量組中的任何向量組之情形,以允許該一般處理之一最佳化。
- 如請求項9之裝置,其中該索引是一個二項式索引。
- 如請求項9之裝置,其中該輸入向量之該索引係在基於由該等前導類定義的一格子碼簿的一量化程序中執行。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2008/051901 WO2009100768A1 (en) | 2008-02-15 | 2008-02-15 | Reduced-complexity vector indexing and de-indexing |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200947420A TW200947420A (en) | 2009-11-16 |
TWI480859B true TWI480859B (zh) | 2015-04-11 |
Family
ID=39495330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW098104662A TWI480859B (zh) | 2008-02-15 | 2009-02-13 | 縮減複雜性向量索引及解索引技術 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8762141B2 (zh) |
EP (2) | EP3367381B1 (zh) |
KR (1) | KR101170137B1 (zh) |
CN (1) | CN101981618B (zh) |
AR (1) | AR070125A1 (zh) |
ES (1) | ES2821432T3 (zh) |
PL (1) | PL3367381T3 (zh) |
TW (1) | TWI480859B (zh) |
WO (1) | WO2009100768A1 (zh) |
ZA (1) | ZA201006498B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2559028B1 (en) * | 2010-04-14 | 2015-09-16 | VoiceAge Corporation | Flexible and scalable combined innovation codebook for use in celp coder and decoder |
US9082412B2 (en) * | 2010-06-11 | 2015-07-14 | Panasonic Intellectual Property Corporation Of America | Decoder, encoder, and methods thereof |
CA3025108C (en) | 2010-07-02 | 2020-10-27 | Dolby International Ab | Audio decoding with selective post filtering |
WO2012069886A1 (en) * | 2010-11-26 | 2012-05-31 | Nokia Corporation | Coding of strings |
CN103329198B (zh) | 2010-11-26 | 2015-07-08 | 诺基亚公司 | 低复杂度目标矢量识别 |
US20140052440A1 (en) | 2011-01-28 | 2014-02-20 | Nokia Corporation | Coding through combination of code vectors |
RU2624586C2 (ru) * | 2012-03-29 | 2017-07-04 | Телефонактиеболагет Лм Эрикссон (Пабл) | Векторный квантователь |
KR101996503B1 (ko) * | 2012-04-13 | 2019-07-05 | 삼성디스플레이 주식회사 | 액정표시장치 및 그 제조방법 |
RU2665898C2 (ru) * | 2014-07-28 | 2018-09-04 | Телефонактиеболагет Лм Эрикссон (Пабл) | Поиск формы пирамидального векторного квантователя |
EP3320539A1 (en) | 2015-07-06 | 2018-05-16 | Nokia Technologies OY | Bit error detector for an audio signal decoder |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070168197A1 (en) * | 2006-01-18 | 2007-07-19 | Nokia Corporation | Audio coding |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4493045A (en) | 1981-10-19 | 1985-01-08 | Fairchild Camera & Instrument Corp. | Test vector indexing method and apparatus |
US5105353A (en) | 1987-10-30 | 1992-04-14 | International Business Machines Corporation | Compressed LR parsing table and method of compressing LR parsing tables |
US6084595A (en) | 1998-02-24 | 2000-07-04 | Virage, Inc. | Indexing method for image search engine |
CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
US20070094035A1 (en) | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
-
2008
- 2008-02-15 PL PL18166266T patent/PL3367381T3/pl unknown
- 2008-02-15 EP EP18166266.9A patent/EP3367381B1/en active Active
- 2008-02-15 ES ES18166266T patent/ES2821432T3/es active Active
- 2008-02-15 WO PCT/EP2008/051901 patent/WO2009100768A1/en active Application Filing
- 2008-02-15 CN CN200880128366.XA patent/CN101981618B/zh active Active
- 2008-02-15 KR KR1020107020582A patent/KR101170137B1/ko active IP Right Grant
- 2008-02-15 EP EP08716900.9A patent/EP2260486B1/en not_active Not-in-force
- 2008-02-15 US US12/867,873 patent/US8762141B2/en active Active
-
2009
- 2009-01-08 AR ARP090100047A patent/AR070125A1/es active IP Right Grant
- 2009-02-13 TW TW098104662A patent/TWI480859B/zh active
-
2010
- 2010-09-10 ZA ZA2010/06498A patent/ZA201006498B/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070168197A1 (en) * | 2006-01-18 | 2007-07-19 | Nokia Corporation | Audio coding |
Non-Patent Citations (2)
Title |
---|
A. Vasilache, I. Tăbuș,"Robust indexing of lattices and permutation codes over binary symmetric channels," Signal Processing, vol. 83, no. 7, pp. 1467-1486, 2003 * |
Adriana Vasilache, "ENTROPIC ENCODING OF LATTICE CODEVECTORS BASED ON PRODUCT CODE INDEXING,"16th European Signal Processing Conference (EUSIPCO 2008), Lausanne, Switzerland, August 25-29, 2008, copyright by EURASIP * |
Also Published As
Publication number | Publication date |
---|---|
EP3367381A1 (en) | 2018-08-29 |
CN101981618A (zh) | 2011-02-23 |
KR20100113172A (ko) | 2010-10-20 |
TW200947420A (en) | 2009-11-16 |
KR101170137B1 (ko) | 2012-07-31 |
PL3367381T3 (pl) | 2020-12-14 |
WO2009100768A1 (en) | 2009-08-20 |
EP2260486A1 (en) | 2010-12-15 |
US20110010169A1 (en) | 2011-01-13 |
AR070125A1 (es) | 2010-03-17 |
EP3367381B1 (en) | 2020-09-02 |
CN101981618B (zh) | 2014-06-18 |
ZA201006498B (en) | 2012-02-29 |
US8762141B2 (en) | 2014-06-24 |
EP2260486B1 (en) | 2018-04-18 |
ES2821432T3 (es) | 2021-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI480859B (zh) | 縮減複雜性向量索引及解索引技術 | |
TWI405187B (zh) | 可縮放語音及音訊編碼解碼器、包括可縮放語音及音訊編碼解碼器之處理器、及用於可縮放語音及音訊編碼解碼器之方法及機器可讀媒體 | |
Yi et al. | AHCM: Adaptive Huffman code mapping for audio steganography based on psychoacoustic model | |
US7660720B2 (en) | Lossless audio coding/decoding method and apparatus | |
JP4961042B2 (ja) | 整数変換ベースの符号化及び復号化のためのラウンディング雑音シェーピング | |
EP1576585A1 (en) | Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding | |
CN110874625B (zh) | 一种数据处理方法及装置 | |
US6754624B2 (en) | Codebook re-ordering to reduce undesired packet generation | |
KR20110043684A (ko) | 디지털 신호의 압축 또는 압축해제를 위한 방법, 시스템 및 장치 | |
JP7167335B2 (ja) | 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置 | |
WO2011097963A1 (zh) | 编码方法、解码方法、编码器和解码器 | |
US9425820B2 (en) | Vector quantization with non-uniform distributions | |
CN115019785A (zh) | 流式语音识别方法、装置、电子设备及存储介质 | |
KR20140005201A (ko) | 계층적 인코더에서 개선 스테이지의 개선된 인코딩 | |
EP1668462A2 (en) | A fast codebook selection method in audio encoding | |
WO2013051210A1 (ja) | 符号化装置及び符号化方法 | |
RU2461079C2 (ru) | Упрощенная индексация и деиндексация векторов | |
Moreau | Tools for Signal Compression: Applications to Speech and Audio Coding | |
WO2022201632A1 (ja) | 符号化装置、復号装置、符号化方法、及び、復号方法 | |
JP5544371B2 (ja) | 符号化装置、復号装置およびこれらの方法 | |
CN118335092B (zh) | 基于多尺度残差注意力的语音压缩方法及系统 |