TW563094B - Method and apparatus for high performance low bit-rate coding of unvoiced speech - Google Patents
Method and apparatus for high performance low bit-rate coding of unvoiced speech Download PDFInfo
- Publication number
- TW563094B TW563094B TW090125677A TW90125677A TW563094B TW 563094 B TW563094 B TW 563094B TW 090125677 A TW090125677 A TW 090125677A TW 90125677 A TW90125677 A TW 90125677A TW 563094 B TW563094 B TW 563094B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- sub
- filter
- gain
- random
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000004458 analytical method Methods 0.000 claims abstract description 19
- 238000001914 filtration Methods 0.000 claims description 37
- 238000013139 quantization Methods 0.000 claims description 30
- 238000010606 normalization Methods 0.000 claims description 26
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 6
- 239000012634 fragment Substances 0.000 claims description 4
- 230000008901 benefit Effects 0.000 claims description 3
- 238000011002 quantification Methods 0.000 claims description 2
- 230000003416 augmentation Effects 0.000 claims 1
- 239000010432 diamond Substances 0.000 claims 1
- 229910052741 iridium Inorganic materials 0.000 claims 1
- GKOZUEZYRPOHIO-UHFFFAOYSA-N iridium atom Chemical compound [Ir] GKOZUEZYRPOHIO-UHFFFAOYSA-N 0.000 claims 1
- 238000013507 mapping Methods 0.000 claims 1
- SYHGEUNFJIGTRX-UHFFFAOYSA-N methylenedioxypyrovalerone Chemical compound C=1C=C2OCOC2=CC=1C(=O)C(CCC)N1CCCC1 SYHGEUNFJIGTRX-UHFFFAOYSA-N 0.000 claims 1
- 239000000843 powder Substances 0.000 claims 1
- 238000010792 warming Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 abstract description 6
- 230000005284 excitation Effects 0.000 abstract description 4
- 230000002087 whitening effect Effects 0.000 abstract 1
- 230000004044 response Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 235000021251 pulses Nutrition 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101150101022 ELP2 gene Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- VJYFKVYYMZPMAB-UHFFFAOYSA-N ethoprophos Chemical compound CCCSP(=O)(OCC)SCCC VJYFKVYYMZPMAB-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/93—Discriminating between voiced and unvoiced parts of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Analogue/Digital Conversion (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
563094
發明背景 ι·發明範疇 一揭露的具體實施例係有關於語音處理領域。更明確而 言,揭露的具體實施例係有關未發聲語音片段之低位元率 編碼之一新改良方法及裝置。 IL發明背景 藉由數位技術的聲音傳輸已擴大使用,特別是在遠距離 與數位無線電話應用方面。其次,此可決定在一頻道上最 少;貝料量,而可維持重建語音的良好品質。如果語音只藉 由取樣與數位化傳輸,每秒64k位元(kbps)的一資料率可 用來達成傳統類比電話的一語音品質。然而,藉著在接收 器的適當編碼、傳輸、及再合成之後的語音分析使用,資 料率的一明顯減少便可達成。 藉由擷取與人類語音產生的一模型有關的參數而採用壓 縮語音技術的裝置是稱爲語音編碼器。一語音編碼器可將 語音信號分成許多時間方塊、或分析信號框。語音編碼器 典型包含一編碼器及一解碼器、或一寫解碼器。編碼器可 分析輸入的語音信號框,以擷取某些相關參數,然後將參 灰量化-成.二進位表示,亦即,變成一組位元、或二進位 資料封包。該等資料封包可在通信頻道上傳送給一接收器 及一解碼器。解碼器可處理該等資料封包,可將他們解量 化以產生該等參數,然後使用未量化參數將該等語音信號 框重新分析。 語音編碼器的功能可藉由移除語音全部固有的冗餘而將
裝 訂
563094 A7 _________B7_ 五、發明説明(2 ) 數位語音信號壓縮成一低位元率信號。數位壓縮可藉由代 表一組參數的輸入語音信號框及採用量子化達成,以表示 一組位元的參數。如果輸入語音信號框具有許多位元风, 而且语音编碼器產生的資料封包有許多位元N。,語音編碼 器達成的壓縮因素是Cr=Ni/N。。該挑戰是要保有解碼語音 的高聲音品質,而可達成目標壓縮因素。一語音編碼器的 性能是因下列而定:(1)語音模型、或上述分析與合成處 理組合執行;及(2 )參數量子化處理以每信號框n 〇位元的 一目標位元率執行情況。語音模型的目標如此可使用每個 信號框的一小組參數而補捉語音信號的本質、或目標聲音 品質。 語音編碼器可如同時域編碼器實施,而可藉由採用時間 解析度處理而嘗試補捉時域語音波形,以便每次编碼語音 片段(典型是5微秒(m s)子信號框)。對於每個子信號框而 言,來自一編碼簿空間的高精密可經由在技藝中已知的各 種不同搜尋演算法找到。或者,語音编碼器可如同頻域編 碼器實施,以嘗試使用一組參數(分析)補捉輸入語音信號 框的短期語音頻譜,並且可採用一對應合成處理將語音波 從頻諸參數復原。參數量化器可根據在A. Gersho &
Gray 發表"Quantization and Signal Compression (1992)” 中描 述的已知量子化技術而保持代表碼向量儲存表示法的參 數。 ,眾所週知的時域語音編碼器是在L.B. Rabiner & R.
Schafer 名稱"Digital Processing of Speech Signals" 396-453 -5- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 563094 A7 _____B7 五、發明説明(3 ) (1978)中描述的激勵線性碼預測性(CELp )編碼器,其在 此列出供參考。在一 CELP編碼器中,語音信號的短期相 關性、或冗餘可藉由一線性預測(L p )分析而移除,以找 到一短期話音素濾波器的係數。將短期預測濾波器應用於 輸入的語晋信號框可產生一 L P殘留信號,以使用長期預 測濾波器參數及一隨後隨機編碼簿而進一步模型化及量 化。因此,CELP編碼可將編碼時域語音波形的工作分成 L P短期濾波器係數編碼及將l p殘留編碼的個別工作。時 域編碼能以一固定速率(亦即,使用每信號框有相同數量 位元N〇)、或一可變資料率(其中不同位元率可用於不同類 型的馆號框内容)執行。可變·資料率編碼器可嘗試只使用 所需的位元數量’以便將寫解碼器編碼成可獲得一目標品 質位準。一可變資料率CELP編碼器是在美國專利案號 5,414,796描述,其已轉讓爲目前揭露的具體實施例,而且 在此僅列出供參考。 例如CELP編碼器的時域編碼器典型是決定在每信號框 有大量位元數量N0,以保持時域語音波形的精確性。此 编碼器典型可傳遞每信號框相當大量位元N〇 (例如8 k位元 或以上)提供的良好聲音品質。然而,在低位元率(4 kbps 及以下),時域編碼器不能保持高品質與健全性能,由於 受到可用位7G數量的限制。在低位元率上,受限的編碼簿 空間可抑制波形,以便與傳統時域编碼器的能力匹配,而 可成功使用在較高速率的商業應用。 典型上,CELP方法係採用一短期預測(STp )濾波器及一
563094 A7 B7 五、發明説明(4 ) 長期預測(LTP)濾波器。藉由合成(AbS)方法的分析可使 用在一編碼器,以發現LTP延遲與增益、及最佳的隨機編 碼簿增益與索引。例如提高可變資料率编碼器(EVRC )的 目前最新發展CELP編碼器能以每秒大約8 k位元的一資料 率達成良好品質合成語音。 未發聲語音不會週期性呈現亦是已知的。以傳統CELP 方法將L T P濾波器編碼所消耗的頻寬於未發聲語音是不如 有聲語音有效率,其中語音的週期性較強,而且L T P濾波 是意義深遠的。因此,一更有效率(亦即較低位元率)編碼 方法對於未發聲語音是想要的。 對於以較低位元率編碼而言,頻譜、或頻域、語音編碼 的各種不同方法已發展,其中語音信號可如同頻譜的一時 間變化分析。可參考例如,R· J. McAulay & T.F· Quatieri在 in Speech Coding and Synthesis ch. 4 (W.B. Kleijn & K.K. Paliwal eds·,1995)名稱"Sinusoidal Coding"。在頻譜編碼器 中,目的是使用一組頻譜參數而模型化、或預測語音的每 個輸入信號框的短期語音頻譜,而不是精確模仿時間變化 語音波形。頻譜參數然後可被编碼,而且語音的一輸出信 '無框可4:用解碼參數建立。結果的合成語音不能匹配於最 初輸入語音波形,但是可提供類似良好品質。在技藝中眾 所週知的頻域編碼器範例包括多頻帶激勵编碼器(MBEs) 、正弦轉換编碼器(STCs)、與諧波編碼器(HCs)。此頻域 編碼器可提供具有一小組參數的高品質參數模型,而可在 低位元率上使用最小量位元正確量化。 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 563094 A7 B7 五、發明説明(5 ) 然而,低位元率編碼可利用一有限编碼解析度的明顯限 制、或一有限的编碼簿空間,而限制單一编碼機構的效 力,以使編碼器在相等精確的各種不同背景情況下不能表 示各種不同類型的語音片段。例如,傳統低位元率、頻域 編碼器不能夠傳輸語音信號框的相位資訊。相反地,相位 資訊可藉由使用一隨機、人爲產生的初始相位値與線性插 入技術而重建。可參考例如Η· YanS等人於29 Electronic Letters 856-57 (May 1993)發表"Ouadratic Phase Interpolation for Voiced Speech Synthesis in the MBE Model"。因爲相位 資訊是人爲產生,即使正弦振幅可完全由量子化-非量子 化處理保持,但是由頻域編碼器所產生的輸出語音將不能 與最初輸入語音對準(亦即,主脈衝將不會同步)。因此, 可證明不容易採用任何閉迴路性能測量,例如在頻域編碼 器的信號-雜訊比(SNR)、或靈敏SNR。 以低位元率有效率將語音編碼的一有效技術是多重模式 編碼。多重模式編碼技術已用來執行低資料率語音編碼及 一開迴路模式決定處理。一此多重模式编碼技術是在 Amitava Das 等人的 Speech Coding and Synthesis ch· 7 (W.B. Kleijn & Κ·Κ· Paliwal eds·,1995)名稱"Multimode and Variable-Rate Coding of Speech··中描述。傳統多重模式编 碼器可將不同模式、或編碼-解碼演算法應用到不同類型 的輸入語音信號框。每個模式、或編碼-解碼處理能以最 有效率的方式自訂,以表示某類型的語音片段,例如有聲 語音、未發聲語音、或背景雜訊(非語音)。一外部開迴路 -8 - 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 563094 A7 ______m_ 五、發明説明(6~~) " ""~~'~ 模式決定機構可檢查輸入的語音信號框,及決定何種模式 可運用於信號框。一外部開放式迴路模式決定機構可檢查 輸入語音仏號框,及決定何種模式可運用於信號框。開放 式迴路模式決定典型可藉著從輸入信號框擷取許多參數而 執行,以評估某些暫時與頻譜特性的參數,並且在評估時 可根據模式決定。模式決定如此可達成,而無需預先知道 輸出語音的正確情況,亦即,輸出語音從聲音品質或其他 性能測量的觀點將會是輸入語音。一語音寫解碼器的開放 式迴路模式決定是在美國專利案號5,414,796描述,此專利 已轉讓爲目則揭露的具體實施例,而且在此僅列出供參 考。 多重模式編碼可藉由使用每個信號框、或可變率的相同 位元N〇數量而可以是固定資料率,其中不同位元率可用 於不同模式。可變率編碼的目標是只使用將寫解碼器參數 編碼成可獲得目標品質的一位準所需的位元數量。結果, 與一固定率相同目標聲音品質的較高資料率編碼器能使用 可變位元率(VBR)技術而以一明顯較低平均率獲得。一可 變率語音編碼器是在美國專利案號5,414,796描述,此專利 t — -- 已轉讓爲目前揭露的具體實施例,而且在此僅列出供參 考。 目前有急速上升的研究興趣及強烈的商業需要而發展可 於中間到低元率(亦即,在2.4至4 kbps及以下的範圍)操作 的一高品質語音編碼器。應用區域可包括無線電話、衛星 通信、網際網路電話、各種不同多媒體與語音流應用、語 _ -9- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 563094 A7
:=、及其他語音儲存系、统。在封包損失情況下,驅動 力ϊ於於高能力是f要且對於健全性能是要求^各種不 同最近語音編碼標準化努力是另—直接驅動力#,用以推 動低貝料率語音編碼演算法的研究與發展。一低資料率笋 音編碼器可建立更多通道、或使用者、每_可允許的應用口 頻寬,而且一低資料率語音編碼器與適當通道編碼的一額 外層耦合可適合編碼器規格的整個位元安排,並且在通道 錯誤情況下可傳遞一健全性能。 因此’夕重模式VB R語音编碼是以低位科編碼語音 的一有效機構。傳統多重模式方法需要各種不同片段語音 (例如,未發聲、有聲、轉變)的有效率編碼方法、^ 式、及背景雜訊或靜音模式的設計。語音編碼器的整個性 能是因每個模式可執行的程度而定,而且編碼器的平均率 ,因未發聲、有聲、及語音其他片段的不同模式位元率而 定。爲了要以一低平均率達成目標品質,需要設計有效 率、高性能模式,其中一些必須能以低位元率工作。典型 上,有聲與未發聲語音片段能以高位元率補捉,而且背景 雜訊與靜音片段能以一明顯較低資料率工作的模式表示。 因此,―雖然使用每信號框最少位元數量,但是對於一高性 把低位元率編碼技術可正確補捉一高百分比的未發聲語音 片段是需要的。 °胃 發明概述 雖然使用每仏號框最少位元數量,但是揭露的具體實施 例是針對一高性能低位元率編碼技術可正確補捉一高百分 -10-
563094 A7 _B7 ____ 五、發明説明(8~) 比的未發聲語音片段是需要的。因此,在本發明的一觀點 中,解碼未發聲語音片段之一方法包括藉由使用複數個子 信號框的接收索引而復原一群量化增益;產生一隨機雜訊 信號,包含複數個子信號框之中每一者的亂數;選取複數 個子信號框之中每一者的隨機雜訊信號的最高振幅亂數之 一預定百分比;藉由每個子信號框的復原增益而定標該選 取最高振幅亂數,以產生一定標隨機雜訊信號;帶通濾波 及形成該定標的隨機雜訊信號;及根據一接收濾波器選擇 指示符而選取一第二濾波器,而且使用該選取的濾波器進 一步形成定標的隨機雜訊信號。 圖式之簡單説明 揭露具體實施例的特徵、目的、及優點可從下面連同附 圖的詳細説明而可變得更了解,在圖中的相同參考數字是 表示相同部分,其中: 圖1疋語音編碼器在每端的一通信頻道方塊圖; 圖2 A是使用在一高性能低位元率語音編碼器的一編碼 器方塊圖; 圖2 B是使用在一高性能低位元率語音編碼器的一解碼 ^器方塊@; 圖3係描述使用在圖2 A编碼器的一高性能低位元率未發 聲語音编碼器; 圖4係描述使用在圖2B解碼器的一高性能低位元率未發 聲語音解碼器; 圖5係描述未發聲語音的一高性能低位元率編碼技術的 -11-
563094 A7 _B7_ 五、發明説明(9 ) 编碼步驟流程圖; 圖6係描述未發聲語音的一高性能低位元率編碼技術的 解碼步驟流程圖; 圖7 A是使用在頻帶能量分析的一低通濾波頻率響應 圖; 圖7B是使用在頻帶能量分析的一高通濾波頻率響應 圖; 圖8 A是使用在靈敏濾波的一帶通濾波器之頻率響應 圖; 圖8 B是使用在靈敏濾、波的一初步波形;慮波器之頻率響 應圖; 圖8 C是使用在一最後靈敏濾波的一波形濾波器之頻率 響應圖;及 圖8 D是使用在最後靈敏濾波的另一波形濾波器之頻率 響應圖。 較佳具體實施例之詳細説明 揭露的具體實施例可提供未發聲語音的高性能低位元率 编碼之方法及裝置。未發聲語音信號可數位,並且轉換成 ^取樣的if言號框。未發聲語音的每個信號框可藉著一短期預 測✓慮波器而;慮波’以產生短期信號阻滯。每個信號框可分 成多重子信號框。一增益然後可於每個子信號框計算。這 些增益隨後可量化及傳輸。然後,一區塊的隨機雜訊可= 由下面詳細描述的方法產生及濾波。此濾波隨機雜訊可^ 由量化的子信號框增益而定標,以形成表示短期信號的二 -12-
563094 A7 B7
量化信號。在一解碼器上,一隨機雜訊信號框可在編碼器 上能以隨機雜訊的相同方式產生及濾波。在解碼器的濾波 隨機雜訊然後可由接收的子信號框增益定標,並且通一短 期預測滤波器,以形成代表最初取樣的一合成語音信號 框。 揭露的具體實施例是提供有關多種未發聲語音的一新編 碼技術。在每# 2k位元上,合成的未發聲語音是相當於 需要較高資料率的傳統CELP方法。未發聲語音片段的一 高百分比(大约20%)可根據揭露的具體實施例而編碼。 在圖1中,一第一編碼器丨〇可接收數位化語音取樣 s(n),並且可將取樣s(n)編碼,以便在一傳輸媒體丨2、或 通信頻道1 2上傳送給一第一解碼器1 4。解碼器丨4可將編 碼的語音取樣解碼,並且可將一輸出信號Ssynth(ii)合成。 對於相反方向的傳輸而言,一第二編碼器1 6可編碼數位 化语音取樣s(n) ’而且可在一通信頻道is上傳輸。一第二 解碼器20可接收及解碼該等編碼語音取樣,以產生一合 成輸出語音Ί吕號SsYNTH(n)。 語音取樣s(n)係表示根據在技藝中包括例如脈衝碼調變 (PCM)、壓擴μ-法、或A-法的已知任何各種不同方法而 數位化及量化的語音信號。如技藝所知,語音取樣s(n)是 構成輸入資料的信號框,其中每個信號框包含預定數量的 數位化語音取樣s(n)。在一具體實施例中,8仟赫的一取 樣率可採用,而且每2 0毫秒信號框包含丨6 〇個取樣。在下 述具體實施例中,資料傳輸率可於從8 kbps (全速率)至4 -13- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 563094 A7 B7 五、發明説明(11 kbps (半速率)至2 kbps (四分之一速率)至1 kbps (八分之 一率)的不同信號框而變化。或者,其他資料率可使用。 如在此的使用,術語π全速率”或”高速率”通常可視爲大 於或等於8 kbps的資料率,而且術語”半速率”或”低速率" 的資料率通常是低於或等於4 kbps。改變資料傳輸率是有 益的,因爲較低位元率可選擇性用於包含相當少語音資訊 的信號框。如在技藝中熟諳此技者的了解,其他取樣率、 信號框大小、與資料傳輸率可使用。 第一編碼器1 0及第二解碼器2 0包含一第一語音編碼 器、或語音寫解碼器。同樣地,第二編碼器1 6及第一解 碼器1 4包含一第二語音編碼·器。在技藝中熟諳此技者可 了解到,語音編碼器可使用一數位信號處理器(DSP )、一 特殊應用積體電路(ASIC )、非連續閘邏輯、韌體、或任 何傳統可程式軟體模組、及一微處理機實施。軟體模組可 存在RAM記憶體、快閃記憶體、暫存器、或在技藝中已 知可寫儲存媒體的任何其他形式。或者,任何傳統處理 器、控制器、或狀態機器可取代微處理器。特別爲語音編 碼而設計的ASICs是在美國專利案號5,727,123,其已轉讓 "爲目前揭露的具體實施例,而且在此僅列出供參考,而且 美國專利案號 5,784,532 名稱"APPLICATION SPECIFIC INTEGRATED CIRCUIT (ASIC) FOR PERFORMING RAPID SPEECH COMPRESSION IN A MOBILE TELEPHONE SYSTEM”,其已轉讓爲目前揭露的具體實施例,而且在 此僅列出供參考。 -14- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐)
裝 訂
563094 五、發明説明(12 ) 圖2A是採用目前揭露具體實施例而在圖i 〇〇、描 述的編碼器方塊圖。一語音信號s(n)可藉由一短期預測濾 波器2 0 0濾波。在短期預測濾波器2 〇 〇輸出上的語音本身 s(n)及/或線性預測殘留信號可將輸入提供給一語音分類 器202 。 口& 語音分類器202的輸出可根據語音的一分類模式而將輸 入提供給一開關2 0 3,以允許開關2 〇 3選取一對應模式編 碼器(204、206)。在技藝中熟諳此技者可了解到,語音 分類器202並未局限於發聲及未發聲語音分類,並且亦可 分類轉變、背景雜訊(靜音)、或其他類型語音。 有聲語音編碼器2 〇 4可藉由例如CELp或原型波形插入 (PWI)的任何傳統方法而將有聲語音編碼。 未發聲語音編碼器2〇5可根據下述具體實施例而以一低 位元率而將未發聲語音編碼。未發聲語音編碼器2〇6是根 據一具體實施例而參考圖3描述。 在藉由編碼器204或編碼器2 06編碼之後,多工器2〇8 可形成一封包位元流,其包含用以傳輸的資料封包、語音 模式、及其他編碼參數。 圖2B疋在圖!(14、2〇)描述而採用目前揭露具體實施 例的一解碼器方塊圖。 解多工器2 1 〇可從位元流接收一封包位元流、解多工資 料’並且可復原資料封包、語音模式、及其他编碼參數。 解多工器210的輸出可將輸入提供給一開關211,以允 許開關2 1 1可根據語音的一分類模式而選取一對應模式解 I_____ -15- 本紙張尺度適用中國國家標準((:卿^規格(21〇 7297公釐y 563094 A7 B7
裝
訂
563094 A7
的殘留取樣數量。在一具體音姓〜山 、月里貫施例中,κ=10且N=160 〇 增益G(i) ’ ί=0,···,Κ-1可如下所+ 所TR於每個子信號框計算: Ν/Κ-1 G(i)= J]r^N/K^k)2 ,i=〇,···,K4,及 G(i) ;*=0
J G(i)
NIK 增益量化器3G8可使K個增益量化,而且該等増益 碼簿索㈣後可被傳輸。量子化可藉由使料統線性或向 量量子化方法,或任何變化執行。一具體實施方法是多級 向量量子化。 ' 從LPC濾波器3 04輸出的殘留信號Γ(η)可過過在未定標 頻帶能量分析器3 1 4的一低通濾波器及一高通濾波器。 r(n)、Ε!、Elpl、和Ehpl的能量値可於殘留信號Γ(η)計算。 Ei是殘留信號r(n)的能量。Elpl是殘留信號Γ(η)的低帶能 量。Ehpl是殘留信號r(n)的高帶能量。在一具體實施例 中’未疋標頻帶能量分析器314的低通與高通;慮波器的頻 率響應是分別在圖7Α和圖7Β顯示。能量値El、Elpi、和 Ehpl是依下列計算: 、五丨=^X(n), /=0 ΜιΡ-χ · 、\ ⑻=Σ % (ζ·) + 艺 r(n - y) Ό), η=0,…,Ν·1, 〜-1Σν卜 〇*%(,)+艺咖-力义⑺,!^。,···,!^, ί=1 /=0 -17- 本紙張尺度適用中國國家標準(CNS) Α4規格(210X297公釐)
裝 訂
線 563094 A7 B7 五、發明説明(15 £,Ρ1 ⑺,及 /=0 Ν-1五冲1 =Σ'Ρ (ζ)· ί:0 能量値Ei、Elpl、和Ehpl稍後可在最後波形濾波器3丨6中 用來選取波形濾波器,用以處理一隨機雜訊信號,所以隨 機雜訊信號非常類似最初殘留信號。 亂數產生器310可產生一變化,其亂數範圍是在-;1與1 之間,而用於由LPC分析器3 02所輸出的該等κ個子信號 框之中每一者。亂數選擇器312可相爲選取在每個子信號 框的多數低振幅亂數。最高振幅亂數的百分比可用於每個 子#號框。在一具體實施例中,亂數的百分比是2 5 %。 來自亂數選擇器3 1 2的每個子信號框的亂數輸出然後可 藉由乘法器307而乘以從增益量化器308輸出的子信號框 的相對量化增益。乘法器3 〇 7的定標任意輸出信號h(n) 然後可由靈敏;慮波處理。 若要提南靈敏品質及維持量化未發聲語音的自然性,一 兩步靈敏濾波處理可於定標隨機信號FKn)執行。 在靈敏濾波處理的第一步骤中,定標隨機信號Fi⑷可 通過在靈敏濾波器3 1 8的2個固定濾波器。靈敏;慮波器 3 18的第一固定濾波器是帶通濾波器32〇,可從Fl(n)刪除 低端及高端頻率,以產生信號Fdn)。在一具體實施例 中,帶通濾波器320的頻率響應是在圖8A描述。靈敏遽 波器3 1 8的第二固定濾波器初步波形濾波器3 2 2。藉由元 -18 - 本紙張尺度適用中國國家標準(CNS) A4規格(210X297公釐) 裝 訂
線 563094 A7 B7 五、發明説明(16~) ' 件3 2 0計算的信號?2(n)可通過初步波形濾波器322,以產 生信號?3(n)。在一具體實施例中,初步波形濾波器3 2 2 的頻率響應是在圖8B描述。 藉由元件3 2 0計算的信號F2(n)、及藉由元件3 2 2計算的 ?3(n)可依下列計算: 〜_l Nbr\ 户2⑻=/)*% ⑺ + Σ咖 HpC/),n=0,".,N-l,及 -ί=1 ;=0 户加=卜,)*%(,)+ 色(”-《/)'々·),肛〇,...,附· «=1 ;=0 信號的能量F2(n)和F3(n)的能量可分別如同e2和e3計 算。E2和E3可依下列計算: =々22⑻,及 1=0 五3 =办2⑻· 1=0 - 在靈敏遽波處理的第二步驟中,從初步波形遽波器3 2 2 9 一 -- 輸出的信號6(η)可根據E!和E3而定標,以便具有與從 L P C濾波器3 0 4輸出的最初殘留信號Γ(η)相同的能量。 在定標通帶能量分析器324中,由元件(322)計算的定 標與濾波隨機信號?3(η)可在最初殘留信號Γ(η)上獲得先前 由未定標頻帶能量分析器3 1 4執行的相同頻帶能量分析。 藉由元件322計算的信號p3(n)可依下列計算: 本紙張尺度適財@ @家標準(CNS) M規格(⑽x297公爱) 563094 A7 B7 五、發明説明(17 )
Jf?3 (ji) 111=0,... ,Ν-1. 厂3(η)的低通帶能量是以Εΐρ2表示,而且f3(n)的高通帶能 量是以Ehp2表示。F3(n)的高帶與低帶能量可與r(n)的高帶 與低帶相比較,以決定使用在最後波形濾波器3 1 6的下一 波形遽波器。根據r(n)與F3(n)的比較,沒有進一步濾、波, 或兩固定波形濾波器之中一者可被選取而在r(n)與F3(n)之 間產生最接近匹配。最後濾波器波形(或沒有額外濾波)可 藉著將最初信號的頻帶能量與隨機信號的頻帶能量相比較 而決定。 最初信號的低帶能量與定標預先濾波隨機信號的低帶能 量的比率Ri可依下列計算:
Ri = 10 * log10 (Elpl / Elp2) 0 最初信號的高帶能量與定標預先濾波隨機信號的高帶能 量之比率Rh可依下列計算: f — Rh = * l〇gl〇 (Ehpl / Ehp2) 如果比率Ri小於-3,一高通最後波形滤波器(濾波器2 ) 可用來進一步處理F3(n),以產生F(n)。 如果比率Rh小於-3,一低通最後波形濾波器(濾波器3 ) 可用來進一步處理F3(n),以產生F(n)。 否則,沒有?3(n)的進一步處理可執行,所以?(η)== -20- 本紙張尺度適用中國國家標準(CNS) Α4規格(210 X 297公釐) 563094 A7 B7 五、發明説明(18 ) ?3(n) 〇 來自最後波形濾波器3 1 6的輸出是量化隨意殘留信號 F(n)。信號F(n)可被定標,以便具有與F2(n)相同能量。 高通最後波形濾波器(濾波器2)的頻率響應是在圖8C顯 示。低通最後波形濾波器(濾波器3 )的頻率響應是在圖8 D 顯示。 一遽波器選擇指示符可產生,以表示哪一濾波器(滤波 器2、濾波器3、或沒有濾波器)可選取用於最後濾波。遽 波器選擇指示付隨後可傳輸,所以一解碼器可可重複最後 濾波。在一具體實施例中,濾波器選擇指示符是由2個位 元所組成。 圖4是在圖2描述的高性能低位元率未發聲語音解碼器 2 1 4的一詳細方塊圖。圖4係描述未發聲語音解碼器的一 具體實施例操作的裝置及序列。未發聲語音解碼器可藉由 執行在圖2所述未發聲語音編碼器2 〇 6的相反操作而接收 未發聲資料封包’及合成來自資料封包的未發聲語音。 未發聲資料封包可輸入增益解量化器4〇6。增益解量化 器406可在圖3描述的未發聲編碼器中執行增益量化器 :>08的相反操作。增益解量化器406的輸出是κ個量化未 發聲增益。 亂數產生器402與亂數選擇器4 04的執行是與在圖3未 發聲編碼器中的亂數產生器31〇與亂數選擇器31〇的操作 相同。 來自亂數選擇器4 0 4的每個子信號框的亂數輸出然後可 — -21 - 本纸張尺度適财@ @家標準(CNS) Μ規格(21Q x297公爱) --- 563094 A7 B7 ) 五、發明説明(19 藉由乘法器405而乘以從增益解量化器4〇6輸出的子信號 框的相對量化增益。乘法器4 〇 5的定標隨意信號輸出Fi(n) 然後可由靈敏濾、波處理。 相同於圖3未發聲編碼器的靈敏濾波處理的一兩步骤靈 敏滤波處理可被執行。靈敏濾波器4 〇 8可執行與圖3未發 聲編碼器的靈敏濾波器3丨8相同的操作。隨機信號Fl(n) 可通過靈敏濾波器4 0 8的2個固定濾波器。帶通濾波器 4 0 7與初步波形濾波器4 〇 9是與在圖3未發聲編碼器的靈 敏滤波器3 1 8中所使用帶通濾波器3 2 〇與初步波形濾波器 3 2 2相同。在帶通濾波器4 〇 7與初步波形濾波器4 〇 9之後 的輸出是分別以F2(n)和F3(n)表示。信號F2(n)和F3(n)可依 圖3的未發聲編碼器計算。 信號F3(n)是最後波形濾波器4 1 〇的濾波。最後波形濾波 器410是與在圖3未發聲編碼器中的最後波形濾波器316 相同。高通最後波形、低通最後波形、或不進一步最後遽 波可由最後波形濾波器4 1 0執行,而且可由圖3未發聲編 碼器上所產生的濾波器選擇指示符決定,並且可在解碼器 2 1 4的資料位元封包中接收。來自最後波形濾波器4 1 0的 知出量化殘留信號F(n)可定標,以便具有與F2(n)相同的 能量。 量化隨機信號?(η)是由L P C合成滤波器4 1 2濾波,以產 生合成語音信號?(η)。 一隨後後置濾波器414可運用於合成語音信號ί (η),以 產生最後輸出語音。 -22- 本紙張尺度適用中國國家標準(CNS) Α4規格(210Χ 297公
裝 訂
563094 A7
圖5係描述未發聲語音的一高Λ — 满牛职、问〖生犯低位兀率編碼技術編 碼步驟足一流程圖。 在步驟502 ’ 一未發聲*五立垃 ,^^^^^ π曰編碼姦(未在圖顯示)可提供 ,發聲數位化語音取樣之—資料框。—新資料框可每20 ::提供。在未發聲語音是以每秒8k位元率取樣的一具 月豆貝施例中,一信號框包含i 6 , 錢5〇4。 G個取樣。㈣流程可執行 在步驟5 04 ’資料框是由_Lpc濾波器濾波,以產生一 殘留信號框。控制流程可執行步驟5 0 6。 步驟 5〇6·516 係描述一殘 g? 士妹袖 i、,、,、, ^夕戈田仏唬框的増益計算及量子化 的方法步驟。 殘留信號框是在步驟5 06分成子信號框。在一具體實施 例中,每個信號框可分成每者具有丨6個取樣的丨〇個子信 號框。控制流程可執行步驟5 〇 8。 在步驟5 0 8,一增益可於每個子信號框計算。在一具體 實施例中,1 0個子信號框增益可計算。控制流程可執行 步驟5 1 〇。 在步驟510 ,子仏號框增益可分成子群。在一具體實施 ’例中,1 0個子信號框增益可分成每者具有5個子信號框增 益的2個子群。控制流程可執行步驟5丨2。 在步驟512 ’每個子群的增益可被正常化,以產生每個 子群的正常化因素。在一具體實施例中,2個正常化因素 可於每者具有5個增益的2個子群產生。控制流程可執行 步驟5 1 4。 -23- 本紙張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) A7 B7 五、發明説明(21 ) 在步驟514,於步驟512產生的正常化因素可轉換成對 數湏域、或指數形式,而且然後量化。在一具體實施例 中,一量化正常化因素可產生,此後稱爲索引丨。控制流 程可執行步驟5 1 6。 在步驟516,於步驟512產生的每個子群的正常化增益 可被量化。在一具體實施例,2個子群可量化,以產生2 個量化增益値,此後稱爲索引2與索引3。控制流程可執 行步驟5 1 8。 步驟5 18-520係描述用以產生一隨機量化未發聲語音信 號的方法步驟。 在步驟518,一隨機雜訊信號可於每個子信號框產生。 一最高振幅亂數的預定百分比可於每個子信號框選取。未 ,取的數目是零。在一具體實施例中,選取亂數的百分比 是25%。控制流程可執行步驟5 2 〇。 在步驟5 2 0,選取亂數可於步驟516產生的每個子信號 框藉由量化增益定標《控制流程可執行步驟5 2 2。 步驟522-528係描述隨機信號的靈敏濾波之方法步驟。 步驟522-528的靈敏濾波可提高靈敏品質,及維持隨機量 孔未發聲語音信號的自然性。 在步驟5 2 2,隨機量化未發聲語音信號是帶通濾波,以 刪除高及低端元件。控制流程可執行步驟5 2 4。 在步驟5 24,一固定初步波形濾波器可運用於隨機量化 未發聲語音信號。控制流程可執行步驟5 2 6。 在步驟5 2 6,隨機信號與最初殘留信號的低與高帶能 563094 A7 _____B7 五、發明説明(22 ) 可被分析。控制流程可執行步驟5 2 8。 在步驟528 ’取初殘留信號的能量分析可與隨機信號的 能量分析相比較,以決定隨機信號的進一步濾波是否必 要。根據該分析,不;慮波、或兩預定最後遽波器之中一者 的選取可進一步遽波該隨機信號。兩預定最後濾波器是一 高通最後波形濾波器及一低通最後波形濾波器。一濾波器 選擇指示訊息可產生,以表示最後濾波器(或沒有濾波器) 應用之一解碼器。在一具體實施例中,濾波器選擇指示訊 息是2個位元。控制流程可執行步驟5 3 〇。 在步驟530 ’於步驟514產生的量化正常化因素之一索 引、在步驟516產生的量化子群增益之索引、及在步驟 528產生的濾波器選擇指示訊息可被傳輸。在一具體實施 例中,索引1、索引2、索引3,而且一2位元最後濾波器 選擇指示可被傳輸。藉著包括傳輸量化Lpc參數索引所 舄的位元’一具體實施例的位元率是每秒2k位元。(lpc 參數的量子化不是在揭露具體實施例的範圍内)。 圖6係描述未發聲語音的一高性能低位元率編碼技術解 碼步驟流程圖。 在步%6 02, 一正常化因素索引、量化子群增益索引、 及一最後濾波器選擇指示符合於未發聲語音的一信號框接 收。在一具體實施例中,索引!、索引2、索引3、及一 2 位X濾波器選擇指示可收到。控制流程可執行步驟6 〇 4。 在步驟604,正常化因素可使用正常化因素索引而從查 表復原。正常化因素可從對數領域、或指數形式轉換成線
563094 五、發明説明(23 性領域。控制流程可執行步驟6〇6。 在606步驟,增益可使用增益索引而從查表 的增益可藉由復原的正常 一 ,、 原 ,r AA ^ y · 书化因素而疋標,以復原最初信號 、母固子群的量化增益。控制流程可執行步驟⑽。 :驟60 8 ::隨機雜訊信號可在編碼時於每個子信號 框選取。ί生^振幅亂數之—預定百分㈣於每子信號 框邊取。未選取數目是零。在一具體實施例中,選取亂數 的百分比是25%。控制流程可執行步驟61〇。 在步驟610,選取的亂數可於步驟6〇6復原的每個子信 號框而藉由該等量化增益定標。 步驟612-616係描述解碼随機信號靈敏濾波的方法步 在步驟612,隨機量化未發聲語音信號是帶通濾波,以 刪除咼與低端元件。帶通濾波器是與使用在編碼的帶通濾 波器相同。控制流程可執行步驟6 1 4。 在614步驟’ 一固足初步波形;慮波器可運用於隨機量化 未發聲語音信號。該固定初步波形濾波器是與使用在編碼 的固定初步波形濾波器相同。控制流程可執行步驟6 1 6。 一在步驟6 1 6,根據濾波器選擇指示訊息,沒有濾波器、 或兩預定濾波器之中一者可被選取,以進一步濾波在一最 後波形濾波器的隨機信號。最後波形濾波器的兩預定濾波 器是一高通最後波形濾波器(濾波器2 )及一低通最後波形 濾波器(濾波器3 ),而且是相同於編碼器的高通最後波形 濾波器及低通最後波形濾波器。來自最後波形濾波器的輸 -26- 本紙張尺度適用中國國家標準(CNS) Α4規格(210X 297公釐) 563094
出量化隨機信號可被定標,以便具有與帶通濾波器的信號 輸出相同的能量。量化隨機信號可由一 L p c合成濾波器 遽波,以產生一合成語音信號。一隨後後置濾波器可運用 於合成語音信號,以產生最後解碼輸出語音。 圖7A是在頻帶能量分析器(314、324)的一低通濾波器 的正常化頻率與振幅頻率響應比較圖,該等頻帶能量分析 器可用來分析從編碼器的LPC濾波器(3 04)輸出該殘留信 號r(n)、及從編碼器的初步波形濾波器(3 2 2 )輸出該定標 與濾波隨機信號F3(n)的低帶能量。 圖7 B是在頻帶能量分析器(3 i 4、3 2 4 )的一高通濾波器 的正常化頻率與振幅頻率響應比較圖,該等能量分析器可 用來分析從編碼器的L P C ;慮波器(3 0 4 )輸出該殘留信號 r(n)、及從編碼器的初步波形濾波器(3 2 2 )輸出該定標與 滤波隨機信號?3 (η)的高帶能量。 圖8Α是在帶通濾波器(320、407)的一低帶通最後波形 濾波器的正常化頻率與振幅頻率響應比較圖,該等帶通濾 波器可用來形成從編碼器與解碼器的乘法器(3〇7、4〇5) 輸出的該定標隨機信號FJn)。 圖8B是在初步波形濾波器(322、409)的一高帶通波形 滤波器的正常化頻率與振幅頻率響應的比較圖,該等初步 波形濾波器可用來形成從編碼器與解碼器的帶通濾波器 (320、407)輸出的該定標隨機信號⑷。 凋8 C是在最後波形濾波器(3 1 6、4 1 0 )的一高通最後波 形濾波器的正常化頻率與振幅頻率響應比較圖,該等最後 -27- 本纸張尺度適用中國國家標準(CNS) A4規格(210X297公釐) 563094 A7 B7 五、發明説明(25 ) 波形濾波器可用來形成從編碼器與解碼器的初步波形濾波 器(3 2 2、4 0 9 )輸出的該定標與濾波隨機信號^⑻。 圖8 D是在最後波形遽波器(3 1 6、4 1 0 )的一低通最後波 形濾波器的正常化頻率與振幅頻率響應比較圖,該等最後 波形濾波器可用來形成從編碼器與解碼器的初步波形濾波 器(3 2 2、4 0 9 )輸出的該定標及濾波隨機信號乙⑻。 較佳具體實施例的先前描述的提供允許在技藝中熟諳此 技者可製作或使用揭露的具體實施例。這些具體實施例的 各種不同修改可由在技藝中熟諳此技者了解,而且在此定 義的一般原理可運用於其他具體實施例,而無需使用創作 設施。因此,揭露的具體實施例並未侷限於在此顯示的具 體實施例,而符合在此揭露原理與新特徵的範圍。 β 00 _另_ 有降 月 Η -28 本紙張尺度適用中國國家標準(CNS) Α4規格(210X297公釐)
Claims (1)
- 六、申請專利範圍 之方法, 該方法包含: 1_ 一種用以將未發聲語音片段編碼其中複數個正常化因素之中每一者是與子信 將一殘留信號框分成複數個子信號框 藉由計算複數個子信號框之中每一者 號框增益的該等正常化子群有關; 、將禝數個正常化因素之中每一者轉換成一指數形式, 並且將轉換的複數個正常化因素量化; =子信號框增益的該等正常化子群量化,以產生複數 個1化編碼薄增益,其中該等編碼薄增益之中每一者是 與複數個子群之中一者的編碼薄增益索引有關; 產生一隨機雜訊信號,其包含複數個子信號框之中每 一者的亂數; 選取複數個子信號框之中每一者的隨機雜訊信號的最 南振幅亂數預定百分比; 藉由每個子信號框的量化編碼薄增益而將該等選取最 高振幅亂數定標,以產生一定標隨機雜訊信號; 帶通渡波及形成該定標隨機雜訊信號; 分析該殘留信號框之能量、及該定標隨機信號之能 量’以產生一能量分析; 根據該能量分析而選取一第二濾波器,及使用該選取 遽波器而進一步形成該定標的隨機雜訊信號;及 產生一第二濾波器選擇指示符,以確認該選取的濾波 幸、紙張尺复適用中國國家標準(CNS) A4規格(210 X 297公釐) 561509^.14 年月 ’、、申明專利範園 器。 2· Π請專:範圍第1項之方法,其中將殘留信號框分成 框。固子^破框係包含將一殘留信號分成10個子信號 兮:犯圍第1項之方法,其中將子信號框增益的 個係包含將1G個子信號框增益的-群分成每個具有5個子信號框增益的2個子群。 I二請專利範圍第1項之方法,其中該殘留信號框包含 樣。耄心時間以每秒8千赫取樣每信號框有16〇個取H二專?,圍第1項之方法,其中該最高振幅亂數 預疋百分比是25%。6.如申睛專利範圍第 固第1項之方法,其中兩正常化因素可母者二有5個子信號框編碼薄增益的2個子群中產生。 7·::專利範圍第1項之方法,其中將剛子信號框增 群$化可藉由使用多級向量量子化而執行。_種用L馬未發聲語音片段之方法,該方法包含: :殘遠乜唬框分成子信號框,每個子信號框具有 其有關的一編碼薄增益; 八將該等增益量化,以產生索引;藉由與該子信號框有關的索引而定標與每個子信號 有關的一隨機雜訊百分比; ";執行該定標隨機雜訊之一第一濾波;將该遽波的雜訊與該殘留信號相比較;根據該比較而執行該隨機雜訊之一第二濾波;及 的 於 益 8. 框 -2- 泰紙篆尺度適财關家轉(CNS) A4^(2lQX挪公董) 申請專利範圍 A8 B8 C8 D8 第二濾波選擇指示符,以確認執行的該第二濾 成子::利圍第8項之方法’其中將-殘留信號框分 3 k框包含將_殘留信號框分成丨 揭笔/、間以每秒8千赫取樣每信號框有1 6 0個取 像0m專利範圍第8項之方法,其中該隨機雜訊百分 12:::利粑圍第8項之方法,其中將該等增益量化 產生索引可藉由使用多級向量量子化而執行。 13. -種用以編碼未發聲語音片段之語音編碼器,里包含. 用以將-殘留信號框分成複數個子信號框之裝置. 4::!計算複數個子信號框之中每-者的編碼薄増 ^而建立子信號框增益群之裝置; 之=將子信號框增益的該群分成子信號框增益的子群 用以使子信號框增益的該等子群正常化之裝置以 生複數個正常化因素,其中複數個主常化因素之中每一 者是與子信號框增益的該等正常化子群之十一者有關. 用:將複數個正常化因素之_每_者轉換成—指數形 式’並且將轉換的複數個正常化因素量化之裝置. 1以使子信號框增益的該等量化子群正常:之裝置, 中每一者是與複數個子群之卜碼溥增益之 r 者的編碼溥增益索引有 產生 波 比 以 產 3- 麥·紙誣(戾適Μ〒國國家漂準(CNS) A视、声 A8 . B8 ' C8 - D8 六、申請專利範圍 關; 用以產生一隨機雜訊信號之裝置,其包含複數個子信 號框之中每一者的亂數; 用以選取複數個子信號框之中每一者的該隨機雜訊信 號的最高振幅亂數預定百分比之裝置; 一藉由每個子信號框的量化編碼薄增益而將該等選取最 南振幅亂數定標之裝置,以產生一定標隨機雜訊信號; 用以帶通濾波及形成該定標隨機雜訊信號之裝置; 用以分析该殘留信號框之能量、及該定標隨機信號之 月匕量之裝置’以產生一能量分析; 、根據該能量分析而選取一第二濾波器,及使用該選取 濾波器而進一步形成該定標的隨機雜訊信號之裝置;及 用以產生一第二濾波器選擇指示符,以確認該選取的 濾波器之裝置。 14.如申請專利範圍第13項之語音編碼器,其中用以將一殘 留信號框分成複數個子信號框的裝置包含將一殘留信號 框分成1 0個子信號框的裝置。 a如申請專利範圍第13項之語音編碼器,其中用以將子信 =框增益的該群分成子群的裝置包含將1〇個子信號框增 益的一群分成每者具有5個子信號框增益的2個群。 16·,申請專利範圍第i 3項之語音編碼器,其中用以選取該 ,最高振幅亂數預定百 > 比的t ^包含用以取該等最 高振幅亂數25%的該裝置。 ^如申請專利範圍第13項之語音編碼器’其中使該等子群 正^化的裝置包含用以產生每者具有5個子信號框編碼 -4 - 「’…、成適用中國國家標準(CNS)久4規格(210 X 297公董)裝聊f4f薄增益的2個子群的2個正常化因素。 18.如申請專利範圍第丨 工^ $丄 編碼态,其中用以使哕笪 子#號框增益量化的裝 1史孩專 的該裝置。 $置“用以執仃多級向量量子化 说一種用以編碼未發聲語音片段之語音編竭器,其 二::殘留信號框分成子信號框之裝置,每個子, 唬框/、有與其有關的一編碼薄增益; =以將該等增益量化以產生索引之裝置; 藉由與該子信號框有關的索引而定標與每個 有關的一隨機雜訊百分比之裝置; 七諕框 用以執行該定標隨機雜訊之一第一濾波之裝置; 用以將該濾波的雜訊與該殘留信號相比較之裝置; 其可根據該比較而執行該隨機雜訊之一第二濾波之妒 用以產生一第二濾波選擇指示符,以確認 二濾波之裝置。 仃自’該第 2〇·如申請專利範圍丨9的語音編碼器,其中用以將一殘留信 號框分成子信號框的裝置包含將一殘留信號框分成1〇個 子信號框的該裝置。 21·如申請專利範圍1 9的語音編碼器,其中用以定標一隨機 雜汛百分比的裝置包含定標該最高振幅隨機雜訊25%的 該裝置。 22·如申請專利範圍1 9的語音編碼器,其中用以將該等增益 1化以產生索引的裝置包含多級向量量子化的該裝置。 23. —種用以編碼未發聲語音片段之語音編碼器,其包含: -5- ----- 丨 ;< 297公釐) 563^94 六、申請專利範園 個子ϋ异70件’其配置可將—殘留信號框分成複數 個子“唬框,·可藉著計算複數個子信號框之中每一者的 編碼薄增益而建立_群的子信號框增益;可將子信號框 曰麗群刀成子^號框增益的子群;可使子信號框增益的 ^群㊆化以產生複數個正常化因素,其中複數個正 书化因素之中每一者是與子信號框增益的該等正常化子 群之中的一者有關;而且可將複數個正常化因素之中每 一者轉換成一指數形式; 一增盈$:化器,其配置可使轉換的複數個正常化因素 量化’以產生~量化的正常化因素索引;及使子信號框 增益的該等正常化子群量化,以產生複數個量化編碼薄 增益,其中該等編碼薄增益之中每一者是與複數個子群 之中一子群的編碼薄增益索引有關; 一亂數產生器,其配置可產生一隨機雜訊信號,包含 複數個子信號框之中每一者的亂數; 一亂數選擇器,其配置可選取複數個子信號框之中每 一者的隨機雜訊信號的一最高振幅亂數預定百分比; 一乘法器,其配置可藉由每個子信號框的編碼薄增益 而定標該等選取最高振幅亂數,以產生一定標隨機雜訊 信號; 一帶通濾波器,用以從該定標隨機雜訊信號移除低端 及高端的頻率; 一第一波开〉濾波器,用以將該定標隨機雜訊信號濾 波, 一未定標頻帶能量分析器,其配置可分析該殘留信號 I - 6 - :‘纸張尺度適爲中國國篆標牟(CNS) Ά4規格(210 X 297公楚:) A8 ;# B8 C85_94 六、申請專利範圍 的能量; 一定標頻帶能量分析器,其配置可分析該疋標隨機信 號的能量,及產生該殘留信號的能量與該定標隨機信號 的能量相比較的一關聯能量分析; 一第二波形濾波器,其配置可根據該關聯能1分析而 選取一第二濾波器;進一步可使用選取的遽波器而形成 該定標的隨機雜訊信號;及產生一第二滤波器選擇指示 符,以確認該選取的濾波器。 24·如申請專利範圍第2 3項之語音編碼器,其中該帶通濾波 器及該第一波形濾波器是固定濾波器。 25·如申請專利範圍第2 3項之語音編碼器,其中該第二波形 濾波器是使用2個固定波形濾波器配置。 26·如申請專利範圍第2 3項之語音編碼器,其中該第二波形 濾波器的配置可產生一第二濾波器選擇指示符,以確認 該選取的濾波器,該第二波形濾波器的進一步配置可產 生一 2位元濾波器選擇指示符。 27·如申請專利範圍第2 3項之語音編碼器,其中可將一殘留 #號框分成複數個子信號框的增益計算元件的進一步配 置可將一殘留信號框分成1 〇個子信號框。 28·如申請專利範圍第2 3項之語音編碼器,其中可該子信號 框增益的該群分成子群的該增益計算元件的進一步配置 可將1 0個子信號框增益的一群分成每者具有5個子信號 框增益的2個群。 29.如申凊專利範圍第2 3項之語音編碼器,其中如果進一步 配置可選取該最高振幅亂數25%,該亂數選擇器的配置 本紙狀 fcit 财 a56^)94^ A8 B8便可選取最高振幅亂數預定百分比。 30. 如申清專利範圍第2 3項之語音編碼器,其中可使該等子 群正#化的該增益計算元件的進一步配置可產生每者具 有5個子信號框編碼薄增益的2個子群的正常化因素。 31. 如申請專利範圍第23項之語音編碼器,其中該增益量化 器的進一步配置可執行多級向量量子化。 32. —種用以編碼未發聲語音片段之語音編碼器,其包含: 一增益計算元件,其配置可將殘留信號框分成子信號 框,每個子信號框具有與其有關的一編碼簿增益; 一增益量化器,其配置可使該等增益量化,以產生索 引, 亂數選擇益及乘法器,其配置可藉由與該子信號框 有關的索引而定標與每個子信號框錢@ 一隨機雜訊百 分比; 第靈敏濾波器,其配置可執行該定標隨機雜訊之 一第一濾波; -頻帶能量分析器,*配置可將該濾波雜㉟與該殘留 信號相比較; 一第二波形濾波H,其配置可根據該比較而執行該隨 機雜訊之n波,及產m皮器指示符,以 確認執行的該第二濾波。 33. 如申請專利範圍第32項之語音編碼器,其中將一殘留信 號框分成子信號框的該增益計算元件的進—步配置可將 一殘留信號框分成1 0個子信號框。 34. 如申請專利範圍第 丑 σ 貝之"口 g、,扁碼恣,其中可定標一隨 :丨 -8- L 乂適用中國ϋ表嘌準(CNS) A#規袼(21〇χ 2町公釐) 56309|4 A8 ;^ B8機雜訊百分比的該隨機雜訊選擇器與乘法… 置可定標該最高振幅隨機雜訊25%。 裔、進一步配 35·如申凊專利範圍第3 2項之語 益量化的該增益量化器的進一步配置可:::使該等增 子化。 y罝」執仃多級向量量 36·如申晴專利範圍第3 2項之語音編碼器,复 標隨機雜訊的一第一遽波的該第一靈敏遽波器的::; 西己:可藉由使用一固定帶通濾波器及一固定波形渡波器 而將該定標隨機雜訊濾波。 37.如申請專利範圍第32項之語音編碼器’其中可執行隨機 雜讯的一第二濾波的該第二波形濾波器的進一步配置具 有2個固定濾波器。 38·如申請專利範圍第32項之語音編碼器,其中可產生一第 一濾波器選擇指示符的該第二波形濾波器的進一步配置 可產生一 2位元濾波器選擇指示符。 39. —種用以解碼未發聲語音片段之方法,其包含: 藉由使用複數個子信號框的接收索引而復原一群量化 增益; 產生一隨機雜訊信號,其包含複數個子信號框之中每 一者的亂數; 選取複數個子信號框之中每一者的該隨機雜訊信號的 最高振幅亂數預定百分比; 藉由每個子信號框的該等復原增益而定標該選取的最 鬲振幅亂數,以產生一定標的隨機雜訊信號; 帶通濾波及形成該定標隨機雜訊信號;及 -9 - 私纸張尺度適用中國國家標準(CNS) A4規格(210 X 297公釐) 六、申請專利範圍 根據一接收的濾波器潠摆 - 裔、擇指不符而選取一第二濾波 器,並且使用該選取的滹波$而、# ^ 應及 w M J /愿渡裔而進一步形成該定標的隨 機雜訊信號。 步包含將該定標的 40·如申請專利範圍第3 9項之方法,進 隨機雜訊進一步〉慮波。 ’其中該等複數個子信號 子信號框有1 〇個子信號框 41·如申請專利範圍第3 9項之方法 框包含編碼未發聲語音的每個 的劃分。 43.如申請專利範圍第4 2項之方法 群1 0個子信號框增益分成每一 2個群。 增=:_數個子信號 ’其中該等子群包含將一 者有5個子信號框增益的 44.如申請專利範圍第4 1項之 信號框包含於2 0毫秒時間 有1 6 0個取樣。 方法,其中編碼的未發聲語音 以每秒8千赫取樣的每信號框 其中該最高振幅亂數的 其中該等兩正常化因素 子群中復原。 其中復原一群量化增益 45.如申請專利範圍第3 9項之方法 預定百分比是25%。 46·如申請專利範圍第4 3項之方法, 可於每一者有5個子信號框的2個 47.如申請專利範圍第1項之方法, 可藉由使用多級向量量子化執行 48. 一種用以解碼未發聲語音片段之方法,其包含 將分成子信號框增益的量化增益從與每個 關的接收索引復原; 子信號框有 -10 - ................... ............................ 尺度適用中國國冢標準(CNS) ίϋΐ袼(210 X 297公 56^〇94ι ?糟由與該子信號框有關的索引而將與每個子信號框有 關的一隨機雜訊百分比定標; 執行該定標隨機雜訊之一第一渡波; 執行由一濾波器選擇指示符所決定隨之一 濾波。 一 攸如申請專利範圍第48項之方法,其包含將該定標的隨機 雜訊進一步濾波。 i如中請專利範圍第48項之方法’其中該等子信號框增益 包含編碼未發聲語音的每個信號框有1〇個子信號框 的劃分。 51· ^申請專利範圍第5〇項之方法,其中編碼的未發聲語音 L #U框包含於2 0毫秒時間以每秒8千赫取樣的每信號框 有1 6 0個樣品。 52. 如申請專利範圍第48項之方法,其中該隨機雜訊百分比 是 2 5 〇/〇。 53. 如申請專利範圍第48項之方法,其中該等復原量化增益 可It由多級向量量子化而量化。 54· —種用以解碼未發聲語音片段之語音解碼器,其包含: 藉由使用複數個子信號框的接收索引而復原一群量化 增益之裝置; 用以產生一隨機雜訊信號之裝置,包含複數個子信號 框之中每一者的亂數; 用以選取複數個子信號框之中每一者的該隨機雜訊信 號的最高振幅亂數預定百分比之裝置; 藉由每個子信號框的該等復原增益而定標該選取的最 ^枭.f良尺庹國家標準(CNS) Α4規格 563魬屯14 A8 B8 C8 D8六、申請專利範圍 高振幅亂數以產生一定標隨機雜訊信號之# £ . 用以帶通濾波及形成該定標的隨機雜訊作號之穿 . 其可根據一接收的濾波器選擇指示爲&^ 及 付而選取一第二濾 波器,並且使用該選取的濾波器而進—丰心丄 " ^ 步形成該定標隨 機雜訊信號之裝置。 其包含用以進一 55.如申請專利範圍第5 4項之語音解竭器 步濾波該定標隨機雜訊的裝置。 56·如申請專利範圍第5 4項之語音解碼,甘+ 具中用以選取該 隨機雜訊k说的最1¾振幅亂數預定百八 心白分比的裝置可進一 步包含用以選取該最高振幅亂數25%的震置。 57. —種用以解碼未發聲語音片段之語音解石馬器,其勺人 -增益解量化器,其配置可藉由使用複:個=含號框 的接收索引而復原一群量化增益; b 一亂數產生器’其配置可產生_隨機雜訊信號,包含 複數個子信號框之中每一者的亂數; -亂數選擇器,其配置可選取複數個子信號框之中每 一者的該隨機雜訊信號的最高振幅亂數預定百分比; 一亂數選擇器與乘法器,其配置可藉由每個子信號框 的該等復原增益而定標該選取的最高振幅亂數,以產生 一定標的隨機雜訊信號; 一 ▼通濾波器及第一波形濾波器,以濾波及形成該定 標的隨機雜訊信號;及 一第二波形濾波器,其配置可根據一接收的濾波器選 擇指示符而選取一第二濾波器,並且使用該選取的濾波 器而進一步形成該定標的隨機雜訊信號。 -12- 參.策猿又度適用中國國^:^#(CNS) A4M(21〇X297^) 5mm a 六、申請專利範圍 58. 如申請專利範圍第57項之語音解碼器,其包含可進一 + 濾波该定標隨機雜訊的一後置濾波器。 ^ 59. 如申請專利範圍第5 7項之扭咅銥 ^ ^ ^ 、扣曰解碼态,其中該亂數選擇 :置可選取該隨機雜訊信號的最高振幅縫預定百 二L用而Γ其進一步配置可選取該最高振幅亂數25%。 60. -種用以解碼未發聲語音片段之語音解碼器其包含: 用以將分成子信號框增益的量化增益從與每個子信號 框有關的接收索引復原之裝置; I 藉由與該子信號框有關的索引而定標與每個子信號框 有關的隨機雜訊之百分比之裝置; 用以執行該定標隨機雜訊的一第一濾波之裝置; 用以執行由一濾波器選擇指示符所決定隨機雜訊的一 第》—遽波之裝置。 6L如申請專利範圍第60項之語音解碼器,其包含用以進一 步濾波該定標隨機雜訊的裝置。 62. ,申請專利範圍第6〇項之語音解碼器,其中用以定標與 每子信號框有關的隨機雜訊百分比的裝置是進一步包含 裝置帛以疋;^與每個子信號框有關的隨機雜訊25%。 63. —種用以解碼未發聲語音片段之語音解碼器,苴包含· -增益解量化器,其配置可將分成子信號框增益的量 化增益從與每個子信號框有關的接收索引復原; -亂數選擇器與乘法器’其配置可藉由與該子信號框 有關的索引而冑標與每個子信號框有關的隨機雜訊百分 比; -第-波形濾波器,其配置可執行該定標隨機雜訊的 -13 - 本紙張又度適用中國國家標準(CNS) A4規格(210 X 297公蔆) 563粉4.11 A BCD 六、申請專利範圍 一第一靈敏濾波; 一第二波形濾波器,其配置可執行由一濾波器選擇指 示符所決定隨機雜訊的一第二濾波。 64.如申請專利範圍第6 3項之語音解碼器,其包含一後置濾 波器,用以進一步濾波該定標的隨機雜訊。 65·如申請專利範圍第6 3項之語音解碼器,其中該亂數選擇 器與乘法器的配置可定標與每子信號框有關的隨機雜訊 百分比,而且其進一步配置可定標與每個子信號框有關 的隨機雜訊25%。 -14- τ — L.m—111—·____ι I a·— ‘紙弦尺度適周中國國家標準(CNS) A4規格(210 X 297公釐)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/690,915 US6947888B1 (en) | 2000-10-17 | 2000-10-17 | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
Publications (1)
Publication Number | Publication Date |
---|---|
TW563094B true TW563094B (en) | 2003-11-21 |
Family
ID=24774477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW090125677A TW563094B (en) | 2000-10-17 | 2001-10-17 | Method and apparatus for high performance low bit-rate coding of unvoiced speech |
Country Status (13)
Country | Link |
---|---|
US (3) | US6947888B1 (zh) |
EP (2) | EP1912207B1 (zh) |
JP (1) | JP4270866B2 (zh) |
KR (1) | KR100798668B1 (zh) |
CN (1) | CN1302459C (zh) |
AT (2) | ATE549714T1 (zh) |
AU (1) | AU1345402A (zh) |
BR (1) | BR0114707A (zh) |
DE (1) | DE60133757T2 (zh) |
ES (2) | ES2302754T3 (zh) |
HK (1) | HK1060430A1 (zh) |
TW (1) | TW563094B (zh) |
WO (1) | WO2002033695A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019350B2 (en) | 2004-11-02 | 2011-09-13 | Coding Technologies Ab | Audio coding using de-correlated signals |
TWI455481B (zh) * | 2006-04-27 | 2014-10-01 | Dolby Lab Licensing Corp | 利用聽覺事件之聽覺場景分析與特定響度式檢測來控制音訊動態增益參數之非暫時性電腦可讀取儲存媒體、方法及裝置 |
TWI566239B (zh) * | 2015-01-22 | 2017-01-11 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7257154B2 (en) * | 2002-07-22 | 2007-08-14 | Broadcom Corporation | Multiple high-speed bit stream interface circuit |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
US20060190246A1 (en) * | 2005-02-23 | 2006-08-24 | Via Telecom Co., Ltd. | Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC |
SG161223A1 (en) * | 2005-04-01 | 2010-05-27 | Qualcomm Inc | Method and apparatus for vector quantizing of a spectral envelope representation |
ES2351935T3 (es) * | 2005-04-01 | 2011-02-14 | Qualcomm Incorporated | Procedimiento y aparato para la cuantificación vectorial de una representación de envolvente espectral. |
ES2705589T3 (es) * | 2005-04-22 | 2019-03-26 | Qualcomm Inc | Sistemas, procedimientos y aparatos para el suavizado del factor de ganancia |
US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
JP4827661B2 (ja) * | 2006-08-30 | 2011-11-30 | 富士通株式会社 | 信号処理方法及び装置 |
KR101299155B1 (ko) * | 2006-12-29 | 2013-08-22 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
KR101435411B1 (ko) * | 2007-09-28 | 2014-08-28 | 삼성전자주식회사 | 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치 |
US20090094026A1 (en) * | 2007-10-03 | 2009-04-09 | Binshi Cao | Method of determining an estimated frame energy of a communication |
WO2009114656A1 (en) * | 2008-03-14 | 2009-09-17 | Dolby Laboratories Licensing Corporation | Multimode coding of speech-like and non-speech-like signals |
CN101339767B (zh) | 2008-03-21 | 2010-05-12 | 华为技术有限公司 | 一种背景噪声激励信号的生成方法及装置 |
CN101609674B (zh) * | 2008-06-20 | 2011-12-28 | 华为技术有限公司 | 编解码方法、装置和系统 |
KR101756834B1 (ko) | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
FR2936898A1 (fr) * | 2008-10-08 | 2010-04-09 | France Telecom | Codage a echantillonnage critique avec codeur predictif |
CN101615395B (zh) | 2008-12-31 | 2011-01-12 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
US8670990B2 (en) * | 2009-08-03 | 2014-03-11 | Broadcom Corporation | Dynamic time scale modification for reduced bit rate audio coding |
EP2657933B1 (en) * | 2010-12-29 | 2016-03-02 | Samsung Electronics Co., Ltd | Coding apparatus and decoding apparatus with bandwidth extension |
CN104978970B (zh) | 2014-04-08 | 2019-02-12 | 华为技术有限公司 | 一种噪声信号的处理和生成方法、编解码器和编解码系统 |
CN106157966B (zh) * | 2015-04-15 | 2019-08-13 | 宏碁股份有限公司 | 语音信号处理装置及语音信号处理方法 |
CN116052700B (zh) * | 2022-07-29 | 2023-09-29 | 荣耀终端有限公司 | 声音编解码方法以及相关装置、系统 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62111299A (ja) * | 1985-11-08 | 1987-05-22 | 松下電器産業株式会社 | 音声信号特徴抽出回路 |
JP2898641B2 (ja) * | 1988-05-25 | 1999-06-02 | 株式会社東芝 | 音声符号化装置 |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5734789A (en) | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
JPH06250697A (ja) * | 1993-02-26 | 1994-09-09 | Fujitsu Ltd | 音声符号化方法及び音声符号化装置並びに音声復号化方法及び音声復号化装置 |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
JPH08320700A (ja) * | 1995-05-26 | 1996-12-03 | Nec Corp | 音声符号化装置 |
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
JP3248668B2 (ja) * | 1996-03-25 | 2002-01-21 | 日本電信電話株式会社 | ディジタルフィルタおよび音響符号化/復号化装置 |
JP3174733B2 (ja) * | 1996-08-22 | 2001-06-11 | 松下電器産業株式会社 | Celp型音声復号化装置、およびcelp型音声復号化方法 |
JPH1091194A (ja) * | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
JP4040126B2 (ja) * | 1996-09-20 | 2008-01-30 | ソニー株式会社 | 音声復号化方法および装置 |
US6148282A (en) * | 1997-01-02 | 2000-11-14 | Texas Instruments Incorporated | Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure |
CN1140894C (zh) * | 1997-04-07 | 2004-03-03 | 皇家菲利浦电子有限公司 | 可变位速率语音传输系统 |
FI113571B (fi) * | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
US6480822B2 (en) * | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
US6463407B2 (en) | 1998-11-13 | 2002-10-08 | Qualcomm Inc. | Low bit-rate coding of unvoiced segments of speech |
US6453287B1 (en) * | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
US6324505B1 (en) * | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Amplitude quantization scheme for low-bit-rate speech coders |
JP2007097007A (ja) * | 2005-09-30 | 2007-04-12 | Akon Higuchi | 複数人用ポータブルオーディオ |
JP4786992B2 (ja) * | 2005-10-07 | 2011-10-05 | クリナップ株式会社 | 厨房家具のビルトイン機器およびこれを有する厨房家具 |
-
2000
- 2000-10-17 US US09/690,915 patent/US6947888B1/en not_active Expired - Lifetime
-
2001
- 2001-10-06 BR BR0114707-2A patent/BR0114707A/pt active IP Right Grant
- 2001-10-06 EP EP08001922A patent/EP1912207B1/en not_active Expired - Lifetime
- 2001-10-06 AT AT08001922T patent/ATE549714T1/de active
- 2001-10-06 AT AT01981837T patent/ATE393448T1/de not_active IP Right Cessation
- 2001-10-06 KR KR1020037005404A patent/KR100798668B1/ko active IP Right Grant
- 2001-10-06 EP EP01981837A patent/EP1328925B1/en not_active Expired - Lifetime
- 2001-10-06 DE DE60133757T patent/DE60133757T2/de not_active Expired - Lifetime
- 2001-10-06 CN CNB018174140A patent/CN1302459C/zh not_active Expired - Lifetime
- 2001-10-06 WO PCT/US2001/042575 patent/WO2002033695A2/en active Search and Examination
- 2001-10-06 ES ES01981837T patent/ES2302754T3/es not_active Expired - Lifetime
- 2001-10-06 AU AU1345402A patent/AU1345402A/xx active Pending
- 2001-10-06 ES ES08001922T patent/ES2380962T3/es not_active Expired - Lifetime
- 2001-10-06 JP JP2002537002A patent/JP4270866B2/ja not_active Expired - Fee Related
- 2001-10-17 TW TW090125677A patent/TW563094B/zh not_active IP Right Cessation
-
2004
- 2004-05-13 HK HK04103354A patent/HK1060430A1/xx not_active IP Right Cessation
-
2005
- 2005-02-24 US US11/066,356 patent/US7191125B2/en not_active Expired - Lifetime
-
2007
- 2007-03-13 US US11/685,748 patent/US7493256B2/en not_active Expired - Lifetime
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019350B2 (en) | 2004-11-02 | 2011-09-13 | Coding Technologies Ab | Audio coding using de-correlated signals |
US9768749B2 (en) | 2006-04-27 | 2017-09-19 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9450551B2 (en) | 2006-04-27 | 2016-09-20 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9780751B2 (en) | 2006-04-27 | 2017-10-03 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9774309B2 (en) | 2006-04-27 | 2017-09-26 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9685924B2 (en) | 2006-04-27 | 2017-06-20 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9698744B1 (en) | 2006-04-27 | 2017-07-04 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9742372B2 (en) | 2006-04-27 | 2017-08-22 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9762196B2 (en) | 2006-04-27 | 2017-09-12 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9787269B2 (en) | 2006-04-27 | 2017-10-10 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
TWI455481B (zh) * | 2006-04-27 | 2014-10-01 | Dolby Lab Licensing Corp | 利用聽覺事件之聽覺場景分析與特定響度式檢測來控制音訊動態增益參數之非暫時性電腦可讀取儲存媒體、方法及裝置 |
US11962279B2 (en) | 2006-04-27 | 2024-04-16 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9136810B2 (en) | 2006-04-27 | 2015-09-15 | Dolby Laboratories Licensing Corporation | Audio gain control using specific-loudness-based auditory event detection |
US9768750B2 (en) | 2006-04-27 | 2017-09-19 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9787268B2 (en) | 2006-04-27 | 2017-10-10 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US9866191B2 (en) | 2006-04-27 | 2018-01-09 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US10103700B2 (en) | 2006-04-27 | 2018-10-16 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US10284159B2 (en) | 2006-04-27 | 2019-05-07 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US10523169B2 (en) | 2006-04-27 | 2019-12-31 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US10833644B2 (en) | 2006-04-27 | 2020-11-10 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US11362631B2 (en) | 2006-04-27 | 2022-06-14 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
US11711060B2 (en) | 2006-04-27 | 2023-07-25 | Dolby Laboratories Licensing Corporation | Audio control using auditory event detection |
TWI566239B (zh) * | 2015-01-22 | 2017-01-11 | 宏碁股份有限公司 | 語音信號處理裝置及語音信號處理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1470051A (zh) | 2004-01-21 |
DE60133757D1 (de) | 2008-06-05 |
EP1912207A1 (en) | 2008-04-16 |
KR20030041169A (ko) | 2003-05-23 |
EP1912207B1 (en) | 2012-03-14 |
US6947888B1 (en) | 2005-09-20 |
KR100798668B1 (ko) | 2008-01-28 |
WO2002033695A2 (en) | 2002-04-25 |
ES2380962T3 (es) | 2012-05-21 |
ES2302754T3 (es) | 2008-08-01 |
US20050143980A1 (en) | 2005-06-30 |
DE60133757T2 (de) | 2009-07-02 |
JP4270866B2 (ja) | 2009-06-03 |
WO2002033695A3 (en) | 2002-07-04 |
EP1328925B1 (en) | 2008-04-23 |
ATE549714T1 (de) | 2012-03-15 |
CN1302459C (zh) | 2007-02-28 |
JP2004517348A (ja) | 2004-06-10 |
ATE393448T1 (de) | 2008-05-15 |
AU1345402A (en) | 2002-04-29 |
BR0114707A (pt) | 2004-01-20 |
HK1060430A1 (en) | 2004-08-06 |
US7493256B2 (en) | 2009-02-17 |
EP1328925A2 (en) | 2003-07-23 |
US20070192092A1 (en) | 2007-08-16 |
US7191125B2 (en) | 2007-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW563094B (en) | Method and apparatus for high performance low bit-rate coding of unvoiced speech | |
US9837092B2 (en) | Classification between time-domain coding and frequency domain coding | |
US11721349B2 (en) | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates | |
US8090573B2 (en) | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision | |
US6754630B2 (en) | Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation | |
CN108231083A (zh) | 一种基于silk的语音编码器编码效率提高方法 | |
JP4874464B2 (ja) | 遷移音声フレームのマルチパルス補間的符号化 | |
Drygajilo | Speech Coding Techniques and Standards | |
CN101266798A (zh) | 一种在语音解码器中进行增益平滑的方法及装置 | |
Unver | Advanced Low Bit-Rate Speech Coding Below 2.4 Kbps | |
KR20070063729A (ko) | 음성 부호화장치, 음성 부호화 방법, 이를 이용한 이동통신단말기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MK4A | Expiration of patent term of an invention patent |