TW530296B - Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions - Google Patents
Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions Download PDFInfo
- Publication number
- TW530296B TW530296B TW089122669A TW89122669A TW530296B TW 530296 B TW530296 B TW 530296B TW 089122669 A TW089122669 A TW 089122669A TW 89122669 A TW89122669 A TW 89122669A TW 530296 B TW530296 B TW 530296B
- Authority
- TW
- Taiwan
- Prior art keywords
- patent application
- scope
- item
- predictive
- speech
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000035945 sensitivity Effects 0.000 title abstract description 7
- 230000008859 change Effects 0.000 claims description 6
- 230000004048 modification Effects 0.000 claims 1
- 238000012986 modification Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000013139 quantization Methods 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 239000004575 stone Substances 0.000 description 2
- 206010011469 Crying Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 241000270347 Iguania Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 229940037003 alum Drugs 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Analogue/Digital Conversion (AREA)
Description
五、發明說明(1) !.發明領域 發明背景 本發明一般性地屬於語音處理領 k碼器中降低訊框錯誤敏感度方特別是與於預測性 Π ·背景 又之方法及裝置有關。 利用數位技術來傳送語音已 距離以及數位無線電電話的應用:::㈣,特別是在長 语音的感受品質先決條件下, 更疋如此。在維持重建 訊量因而成為一個課題。如果^ 2出頻道上之傳送最小資 及數位化,那麼資料率就需要卞适的語音僅接受過取樣 到傳統類比電話的聲音品質。麸母秒六十四仟位元方可達 使用適合的編碼技術,傳送,^ 透過浯音分析,然後 成,就可以達到位元率的有效^ =在接收器端的重新合 將語音中有關人類語音發聲=刑^ 音壓縮目的,使用此種技術之、麥數抽取出來以達語 將輸進來之語音信號分割成時間:之為語碼器。語碼器 器一般包含編碼器及解碼器。 j (或分析訊框)。語碼 予以分析,然後抽取某歧相關& ::將輪進來之語音訊框 化成二位元代表,,亦即」::参數,,著將該等參數量 包。透過通訊通道將該等數攄,f個一位兀的數據封 器。解碼器會處理該等數據送至接收器及解碼 該等參數,接著再使用該等已::他們解量化以產生出 成該等語音訊框。 寺已知I化之芬數來重新組合 語焉器可將語音中所有本質上的多餘部份均予以去除, $ 5頁 530296 ---- ., 五、發明說明(2) — =此:將數位化的語音信號壓縮成低位元率信號。將輪入 2:曰訊框用一組參數來代表,並使用量化技術將該等表 =成一組位元,-則上述數位信號的壓縮可達成。若輪 7=框的位兀數為Νι,語碼器所製造出之數據封包的 ^’則該語碼器所達到的壓縮因數c「Ni/N。。挑戰 ·=ΪΪ到壓縮f標的同日寺,仍需使解碼後語音維持在 二m i I益的效能取決於(1)語音模型的優劣或 氘ί二 整體過程的優劣’以及⑺可達到每 好。所以使用語音模型的的目化過程其執行是否良 使我們均能以一小組失數丈」在 對於每一個訊框其可 目標語音品質”數來捕捉到語音信號的本質(或是 或a午在設計語碼 述語音信號的參_包括的f,搜尋到—組可良好描 感受上正確之語音信號日士里j。:組良好的參數在重建出 音、信號功率、頻譜二斤而之糸統頻寬是很小的。基 譜,都是屬於可編石馬的^或參數振峰值)、振幅以及相位頻 語碼器可以施行為時域 用高時間解析度之方法絨m妯°°,士種頒型之編碼器會使 區段之語音(通常是5龙:、"*捉到時域語音之波形並將小 個次訊框則是藉由“域框)予以編碼。對於每-間(⑶debook space)中游I知的各種搜尋法則從碼書空 語碼器另外可以施行2 ㈣地ί表其之代表。 試圖捕捉輸入語音訊框的纩栌’、'。。種颃型之編碼器會 的短時距語音頻譜,找出-址參數
第6 I 530296 五、發明說明(3) 刀析),然彳交使用相對應的合成方法,利用這些頻譜參數 重建出a亥浯音波形。苓數量化器依照描述於a. & 、· Μ· Gray所寫"向虿量化以及信號壓縮,,之已知量化技術, 以預儲之碼向代表來代表該等參數以保存它們。 ,,於L· B· Rabiner & r· w· Schaf er 所寫語音信號之 理(m8)第3 9 6至453頁之碼激線性預測(CELp)編碼 為人所熟知之時域語碼器,在此併入以為參考。在 振峰濾波為之係數。對輸進來 ^五立 測濾波器,會產生出LP殘訊曰 該短時距預 η χ . 〇 此汛號會另予以模型化及量 ,長二距預測遽波_ 化疋故,CELP編碼乃將編碼時域語音 ^ 、 編碼該LP短時距濾波器係數扁’=、工乍/刀割成 時域編碼時可用固定部 :相:;的位元數,。,也可以使用可:::= 此,則不同型式的訊框内容,使 兀羊(方疋如 :的編碼器試圖在僅編碼編解器的二=)。可變 到所希望的語音品質。一個可變率的‘=:,仍可達 於美國專利字號5, 4 1 4, 79 6,在此於r幺 馬為例,描述 項。 此扣派為本發明之參考 像CELP編竭,器這樣的時域編碼器,、雨a 3 位兀數N。的方法來保存時域語音波形的以每訊框具高 為、典型地是以提供出每訊框具非常古二度。這種編碼 吊问位凡數N0的方式(每
第7頁 530296 五、發明說明(4) 秒8仟位元或更咼)來做出優良的語音品質。然而,在低位 元率時,由於可供使用的位元數有限,時域編碼器就無法 維持住咼品質及強固的效能。在低位元率時,有限的碼查 空間箝制了傳統時域編碼器的波形匹配能力,這些傳統的 時域編碼器以往可以非常成功地應用在較高位元率之商業 應用場合。所以雖然隨著時間有所進步,但是許多操作在 低位兀率之CELP編碼系統依然深受感觀上的明顯的失真之 ^•’此失真一般視作為雜訊。 因li b有強烈的研發興趣及商業需要來發展可操 位二率’每秒2.4至4仔位元範圍或更低之 :; 品^碼h此應用的範圍包括了無線電話,衛星 :Ϊ :::活’各種多媒體及語音串流應$,語音郵件, 力量在於,在;Πγ:。驅使發展中低位元率編碼器的 效能的要求1來:容量的需求以及強固 們研究發展低位元率t準化的努力也是驅使人 一個低位元率的語 :貝异法則的另一個驅動力。 更多的頻道(或可說’更匕可在每個可允許使用頻寬中創造出 頻道編碼額外層之位元吏用者),並且一個連接有適當 格之位元預算並可在=二碼益,可適合於所有編碼器規 能。-個低位元率的以:的情況下,#遞出強固的效 (PPP)語碼器,苴 °σ馬為的不範例,是原型基音區間 為可變率語音“ Λ^ΛΤ1 998年12月21日,標題 為本發明之參考。、固應用序號09/217, 314,在此指派
530296 £、發明說吸(5) 在像CELP編碼器' ppp語碼器、以及波形内插編碼哭這 樣的傳統的預測性語碼器中,編碼方法十分仰賴過去。的輸 出。所以,如果解碼-器所接收到的訊框是錯誤的,那声該 解碼器就必須有能力自創該出問題的訊框以做出最佳:; =解碼器典型地乃以前一個輪出訊框作取代。 解碼态必須自創取代品,所以1盘 ^ ^ ^ !玄:2, 下—個訊框到達解碼器的時候,若 二—:ί以預測性的方式所編碼,那麼解碼器盥編碑哭所 <疋的W —個輸出就會是不一 /、、,扁馬扣所 品皙七二五A種情开> 會導致令五立 ;?或语碼器效能的降⑯。語碼器愈仰賴預“:卜曰 (亦即,愈多的訊框是以預測的方式 ^数編碼技術 情形就愈嚴重。是故,有必要一斤#扁馬)’效能降低的 器發生訊框錯誤時,可方法當預測性語碼 發二;對訊框錯誤的敏感度。 本發明係與降低預測性語碼器 ,。於I,本發明之一樣貌為,提T誤敏感度之方法 益攻好是包含至少一個 k仏一语碼器。該語碼 ,的編螞模式;以及一 %式,至少一個非預 器被“:的非預測性編碼模式連接=j性編碼模式 °又。成可根據已編碼語音訊框 、处理器,該處理 :框選擇其編碼的方式 能::型態,為連續的語音 / '式所編碑之語音訊框。 主〆一個以非預測性 叙明之另_樣貌為, 法。該方、土 出一種編踩1 ☆ 方去之步驟最好是包含:連綠届馬i音訊框之方 1以預測性的編碼模 530296 、發明說明(6) ^對曰巩框編碼,連續的數 .^ ^ 辦至少-個語音訊框-上;=的碼步驟之後, 復此二編碼步驟以產;=式予以編碼;重 θ本發明之另-樣貌為,提4:;,語音訊框。 ^含:-能以預測性的編碼模式對。該語竭器最好 匡執行編碼動作之裝置;一能在H、/連績數之語音訊 :預測性編碼模式予以編碼之後連續數之語音訊框 對至少-個語音訊框編碼之裝置.一非預測性的編碼模式 鴂碼之語音訊框,該型態包含至w’、一旎產生多個依型態所 式所編碼之語音訊框。 / •個以非預測性編碼模 法本!樣貌為,提供出-種編碼w框之方 a方去之步驟最好是包含: 曰几框之方 音訊框執行編碼動作,詨 ·,、種編碼型態對多個語 之語音訊框以及至少一個以^二二,少一個以預測性編碼 圖式之簡要說明…生編碼之語音訊框。 圖1是一個兩端均以語碼器 圖。 _、’、、、、°點之通訊通道的方塊 圖2是一個可使用在圖丨語螞器 圖3是一個可使用在圖1語螞^ 編碼器的方塊圖。 圖4是語音編碼決定程序之流%之解碼器的方塊圖。 圖5Α是語音偉號振幅對時間的王57 。 (LP)殘訊振幅對時間的圖表。回表,圖5Β則是線性預測 Λ埯擇型態之語碼器的方塊
圖6是被設計成使用編碼模 5302^() 五、發明說明(乃 圖。 图了之流程圖#日日7 語碼器,甘 / 了如圖6中使用了編碼模式選擇型態之 "所採用的-方法步驟。 圖i中,μ較佳具體實施之詳細說明 之予以編牌第、、扁碼态1 0 0接收數位化的語音樣本S (η)並將 至第一解保1、以於傳送介質102(或通訊通道1〇2)上傳送, 通訊線路,、其/ 。亥傳送介質1 0 2可以是譬如,地面型的
電話與衛3 土台與衛星間之鏈結,或是行動電話或PCS 是編碼::=ΐ通訊通道。該等語音樣本s(n)最好還 明。解石馬二1〇4將Λ指m量化的雜訊’以下會有說 出輸出語之語音樣本予以解碼’合成 P偉i关(n)。解碼的處理過程最好是能使用 用來人5二t碼Ϊ指標來搜尋各種碼書,“決定出最適合 ^ 口 ^輪出語音信號〜_⑷之數值,此過程以下會有 :二:輸,則第二編碼器106會將數位 化=日揼本s(n)予以編碼,並將之傳送於通訊通道ι〇 上。弟二解碼器1 1 0將該等已編碼之語音樣本予以接收 解碼,產生出合成的輸出語音信號^隱(1〇。 該等語音樣本s(n)所代表的是該等已伕照此技藝中 各種方法中的任一種方法數位化及量化之語音信二: 方法包括了譬如,博碼調變(PCM),集縮“律或A律。=[ 此技藝所已知的處理方式,語音樣本s(n)而被規書彳成L : 個的輸入資料訊框,每一個訊框均包含預定數目之該# 1U 數位化之居音樣本s ( η)。這些訊框可以更進一步地再I i
530296 ———— 五、發明說明(8) _^ 示體實施例中’每-個訊框包含四 是八仟赫兹:二二;=實:施例中,所使用的取樣錢率 谏銮曰虹 在以下所5兄明之具體實施例中,資料傳送的 的^ =好是可以隨著不同的訊框而改變。譬如’資料傳、, ΪΪΠ以從全速率變更為半速率、四分之-速率、t: 以,^ Q因為在訊框所内含的語音資訊相對較少時,二 用;r:=r所以可變化的資料傳送速率: 率、訊据 、σ白=、壽人士所知道的,各種的取樣頻 兮笠一小以及貢料傳送速率都是可以使用的。 ^哭,碼器100及第二解碼器110合在一起稱之為第〜 傳送語音信於之^狀罢此-碼為可以使用於任何用以 基地△以$ /二 置,包括譬如,行動或pcs電話、 i t;及第ί是基地台控制器。相類似地,該第二編, 口口 106及弟一解碼器1〇4合在一起 屏螞 :匕:人士應了 •,語碼器 ::二。習於 統的可程式軟體模組及微處理或疋任何傳 模組可以常駐在隨機存取記情;中“種來作。該軟體 器中或是任何米〜 中 决閃圮憶體中、暫在 的處理器、控制二士I寫入儲存媒體。也可以用任何傳續 寸工制态或狀能摟丧&# μ,上 u 1寻统 字號5, 727, 1 23巾戶斤^^/^代5亥微處理器。美國專利 ”考;另外’建槽—曰以 530296
530296 五、發明說明(10) 濾,器2 0 8會產生出一線性預測殘訊R[n],此殘訊町叫代 表著該輸入語音訊框s (n)與根據該已量化的線性預測表 數S所重建出之語音、此兩者間的誤差。線性預測殘訊 R [ η ]、杈式Μ以及已置化線性預測參數a均會被提供至 訊量化模組2 1 2。該殘訊量化模組2丨2就根據這些數 1 出殘訊指標IR及量化的殘訊食[η ]。 衣w 1.3乃一可使用於語碼器中之解碼器3 〇 〇,1包含一 預測參數解碼模組3 0 2,一殘訊解碼模組3〇4,、一 杈組3 0 6以及一線性預測合成濾波器3〇8。模式解碼^ ”、、 3 0 6將模式指標Im予以接收並解碼,產生出模式m。’線性 測麥數解碼模組30 2接收模式从以及線性預測指標工 性 ,測參數解碼模組3 0 2將所接收的數值予以解碼、,L製造泉十 罝化線性預測參數S。殘訊解碼模組3〇4接收殘指 ini票1p以及模式指標Im。殘訊解碼模組3〇4將這:;接 ^的數值予以解碼’ I生出量化殘訊食U]。兮量// 1广η]及量化線性預測參數a會被提 預' = 濾波器3 0 8,此滹浊哭刺田仏/士人1 R〖玍預別合成 音信號s[n]慮皮π。利用此二值合成出已解石馬之輸出語 驟t i二五ί::施例之語碼器乃依囪4流程圖所示之步 步驟4°°,語碼器將_ 後,器前至=本予;=:以 框之能量。奸处旦θ # ^ 邊°口喝裔檢測該訊 &拙—% +匕月b里疋该訊框語音活躍度的度量。钮立户測 的執订乃μ該數位化語音樣本其大小的平方予^^
第14頁 530296 五、發明說明(11) 然後再將相加後的能量與一臨界值作比較。在一呈辟# ::右:臨界值乃是依背景雜訊的變化程度來作調ς二: 字緣41 4,796之美國專利中,就描述了 一個具、交動g品界值之語音活躍度檢測器。有此 擁t的能量可以極低,⑼以可能會錯誤:被 月/?、濰讯來編碼。為避免此種情形的發生, :用:J J樣本的頻譜傾斜來分辨非說話聲語音及背景雜 =,在刖述之字號為5, 414, 了96之美國專利中亦有說 1檢測過訊框的能量之後’語碼器前進至步驟4〇4。步 = 404 ’邊碼器判定該檢測出之訊框能量是否足夠大到可 能内含有語音資訊之訊框。若檢測出之訊框 ^i4〇e'. ° 音戎轉立)太 Λ框為月厅、錄矾加以編碼(即,非語 之?::率:,實施例中’背景雜訊訊框乃以八分 合或超^ Ϊ在步驟4〇4中該檢測出之訊框能量符 A 1 匕以、疋、界位準,則將該訊框歸類為往音,任 螞器前進至步驟408。 J歹力貝局扣曰,浯 在步驟4 0 8中,言五石民的入 》 . 音,亦即,狂$ 51 +判定5亥訊框是否為非說話聲語 Τ印碼為會撿查該訊框的週 ^;r方法包含譬如,使用零交越乂使用二 :關函數⑽FS)。詳細地,如 ==二 :週期性’在先前所提及的字號為5,91 ;= = = 及序號為隱17,⑷μ國應用μ有=Λ Λ
第15頁 )296 五、發明說明(12) 用來分辨說話聲語音及非說話聲語音的方法也併入了電信 工業,會工業暫行標準TIA/EIA IS-127及TIA/EIA IS-733 f二右在步驟4 〇 8中判定該訊框為非說話聲語音,則語碼 =I進至步驟41〇。步驟41〇,語碼器視該訊框為非說話聲 語音=以編碼。在一具體實施例中,非說話聲語音訊框乃 以Γ t彳立元率編碼。若在步驟4 〇 8中判定該訊框不是 非况話耸語音,則語碼器前進至步驟4 1 2。 、在步驟41 2中,語碼器會使用此技藝中已知的週期性檢 /則方法,言如珂述字號為5,9丨丨,丨2 8之美 的方法來判定哕叩柜曰不炎絲叔π 1 ^ ^ ^ 疋省汛杧疋否為轉私的语音。若判定該訊框為 二、曰,則語碼器前進至步驟41 4。步驟4 1 4,語碼器 二=j:i轉移的語音加以編碼(即,該語音正處於從非 移至說話聲語音的狀態)。在-具體實施例 ί;=期1 999年5月7曰,標題為”轉移語音訊框之/ 尽^月之苓考。在另一具體實施例中, 立 全位元率編碼。 得%曰乃以 在步驟412中,若語碼器判定該訊框不是轉移的往立 f進至步驟416。步驟416,語碍器視該訊V為規 加以編碼。在-具體實施例中,說話聲語音乃: ^兀率編碼.,但也有可能以全位元率編碼。不過 此蟄人士會知道,以半位元率編碼之說話立合二' 元率的編妈完全地利用到了說話聲訊框所獨:二匕位 530296 五、發明說明(13) 性話…,不管在編碼該 e 疋 所使用的位元率為何,該說話聲:音:: 的編 :用過去’框中的資-訊來編碼,所以亦稱之為預;Γ ¥於此藝人士會知道,^从η 性預測殘訊,都^依循還是相應的線 Μ表”時間函數顯示出雜訊斤、不非=以 及况忐耸浯音的波形特性。圖5Α圖表中之日士 轉私以 出雜訊、非說話聲語音、轉移 I a Μ則顯示 波形特性。 私以及…耳'線性預測殘訊的 在-具體實施例中’將語碼器5⑽^ 編碼架構選擇型態(如圖6所示),預 : = 訊框㈣低對訊框錯誤情況的敏感度。語碼=的 初始翏數計算模組5 0 2,_分類模組5 04,一控制處:器-5 0 6,多個(Ν個)預測編碼模式5〇8,51〇(為簡化起見,。 個預測㈣模式5G8 ’51Q,其餘的預測編碼模式以 广、H不,且至少一個非預測性編碼模式5 1 2。初始參數 計^吴組5 0 2連接至分類模組5〇4。分類模組5〇4連接至控 制处,器5 0 6以及該各種的編碼模式5〇8' 51〇,512。控制 處理态5 0 6也連接至該各種的編碼模式5 〇 8,5 1 〇,5丨2。 :吾碼器5⑽將已數位化的語音樣本“η)予以接收,輸入 至j =始蒼數矸算模組5 〇 2。初始參數計算模組5 〇 2從該等 語音樣本s (η)中得到各種初始參數,包括譬如,線性預測 係數(LPC)、線頻譜對(LSp)係數、規一化的自相關函數
第17頁 、發明說明(14) (妓Hs)、開迴路落後參數、頻帶能量、零交越比率以及 殘:。這些初始參數的計算與使用,於此技藝中均 序ίΪη’ο/ί穴的專利-字號為5,4U,796之美國專利及應用 二為09/21/,341之美國應用中均有說明。 根5 :始:數f被提供至分類模組504。分類模組5〇4就 予以;:初乂 Γ數,依圖4所述之分類步驟將該語音訊框 二五立/ a。/刀颏結果未被提供至控制處理器5 0 6,而該等 讯框則被提供至該各種編碼模式5〇8,5ι〇,512。 其==;=;巧 5〇8,51Q,512/η //况/動悲地切換於多編碼模式 之間。為母一個訊框選擇適於其的特定編 馬杈式5 0 8 ’ 510 ’ 512以達到最低的位元利用但 】:Ϊ J器(因未:。示)端所重製出之信號也能夠維持在可接 號s(n)的性質隨:::二·:/位元率乃是依語音信 音編碼。…的這種處理過程稱之為可變率語 港ί ^體實施例中’控制處理器5 0 6會根據現時語音訊 等預LUi導入屬於它的預測編碼模式508,510。該 的其中之-是_編碼模式,前 , 虎為5, 4 1 4, 79 6之美國專利中有述及此種編雜 二模式5 0 8 ’ 510中的另-種模式是PPP編碼 模;測編碼模式5°8’510中的又-種模式則可能』 530296
具iii Ή施中,該非預測性編碼模式512是-種稍 、、 、 或低記憶體的編碼架構。該等ff、>丨fvi Μ ^ 碼模式5 0 8,510刖fθ私, 及寻預/則性的編 另一具體實施彻士 疋"強烈預測屬性的編碼架構。在 八 、 中,該非預測性編碼模式5 1 2則是+ ^ π 編碼模式51 2可以Θ辟上 作*仪丄 β兀王非預測性 蛘太r 、λα巷 疋言如,4曰樣本s(n)的PCM編碼、扭立 奴本s(n)的本縮v律編碼或是語音 。 雖鈇圖6呈妒每a ,上 、u夕日J八俘編碼。 …、a b,、肢貫施例中只顯示了一個 512,但習於此藝人士應了解,可使用不= 編碼模組。如果所使用的非預測性編碼模組超過一個,則 可繼不同型式之非預測性編碼模組。上在:二: 體貫施例中’其所使用的非預測性編碼模組不止一個,[ 中有-些或甚至全部的非預測性編碼模組乃是稍呈 ^ 性的編碼模組。在其他的具體實施例中,一些或甚至二 的非預測性編碼模組均為完全非預測性的編碼模組。王σ 在-具體實施例巾,在判決期間,控制處理㈣6最好 是插入該非預測性編碼模式512。該控制處理器5〇6創 長度為F之訊框處理模式形態。在一具體實施例中, 乃依可容忍訊框發生錯誤的最長時間的長度而定。可 的最長時間長度則最好是由粉聽者的主觀觀點來判定。Ζ 另一具體實施例中,該時間長度F乃週期性地由控制處理 器506變更H具體實施例中’該時間長度?則是隨機 性地或假隨機性地由控制處理器5〇6變更。舉個例子,苴 重覆的型態可以是ΡΡΡΝ ’其中Ρ代表預測性的編碼模式/、 530296
53〇296 $、發明說明(17) 數i大於預定臨界值T,則控制處理器前進至步驟β 1 〇。步 碌6 1 0中’控制處理器會以非預測性的或稍具預測屬性的 、、扁碼模式’為下一個語音訊框編碼。隨後,控制處理器回 到步驟6 0 0,再度地將計數變數i設定為零。 口口 習於此藝人士會知道,可將圖7之流程圖修改為合併有 其他種不同的預測性編碼及非預測性(或稍具預測屬性的) 鴣碼重覆型態。譬如,計數變數i可以隨著每一個流程而 有不同的值;或是該計數變數i可在重覆一個預定的流程 次數後有所變動;或是該計數變數丨假隨機性地或隨機性 =變動。或許,譬如,在步驟61〇中,以非預測性編碼模 ^或稍具預測屬性編碼模式加以編碼的是下兩個訊框。或 =屬性編碼模式加以編碼的訊框數可以 i著;是隨=取的數目,或是以-個預先定義的3, ^者母一次的流程而有不同的數目。 二一:,體Λ施:中,圖6之語物00是-個可變率的語 '% σσ 0 U U 其子* 均的位 7Γ 峯 I B Al. λ., 具體實施例中,型熊中所使用7隹持住。在特殊的 1彼此之fm t Γ 預測性編碼模式508,510 ^攸此之間的編碼位元率均相 - 式5 1 2的編碼位元率也盥f彳 而泫非預測性編碼模 一個所採用Λ 編碼模式5 0 δ,5 1 〇中任何 中,預測性編瑪模式5〇8,51。的具體實施例 非預測性編碼模式512的編碼位元則1率相對較低,該 每-輪的F個訊框均插入一個高品;貝對車…所以, 貝低圮憶體或無記憶
530296 五、發明說明(18) 體之編碼架構,在連續的高位元率訊框之間則 一 品質’強烈預測性的低位元率架構,使平 中到咼 降低。雖然此技術應-用在任何預測性語碼哭中得以 的,但應用在只有使用強烈預測性架構 品質之低位元率語碼器中,是特別地有效用。這丄::" 率語碼器,由於其預測性的本質,所以會使位兀 所引起的破壞較為敏感。週期性地插入高位元 性的編碼模式512,同時又維持住該具各羊非預測 之預測性編㈣式5G8,51G ’ %此希^率 好語音品質以及低的平均編碼率。 丨所希主的良 在具體貫施例中,該平均編碼率最好保—兰 的定值(或近似於定值)R,所 /、、、先疋我 中的所右^「仏 所如用的方式則是將一段語音 二斷重覆某已決定的編碼方式型態來加 中pH 均編碼率。舉—個示範型態:ppn,里 t J ^ ^ ' N ^ ^ # ^ ^,J ^ ^ ^ ^ ^ 型態中’第-個訊框乃以R/2的編碼 ,§ .. ^ 方式、,扁碼,弟二個訊框亦以R/2的編碼率, 二:::方式編碼;第三個訊框則是以2R的編碼率,非 斷地重1:i預測屬性的編碼方式編碼。隨後,此型態不 辦地!覆下去。平均的編碼率因而為R。 以不範的型態為PPPN。在此型態中,第一個訊框乃 端#座、碼率預測性的方式編碼;第二個訊框亦以尺的 :】ί :以預測性的方式編码;第三個訊框亦是以R/2的 ’、、…預測性的方式編碼;第四個訊框則是以2R的編碼
第22頁 530296 五、發明說明(19) 率,非預測性或稍具預測屬性的編碼方式編碼。隨後,此 型態不斷地重覆下去。平均的編碼率因而為R。 另一個示範的型態_為P P N P P N。在此型態中,第一個訊框 以R/2的編碼率編碼,第二個訊框以r/2的編碼率編碼,第 二個框以2 R的編碼率編碼,第四個訊框以R / 3的編碼率 編碼,第五個訊框以R/3的編碼率編碼,第六個訊框則以 7 R / 3的編碼率編碼。隨後,此型態不斷地重覆下去。平均 的編碼率因而為R。 另一個示範的型態為PPPNPN。在此型態中,第一個訊框 以R / 3的編碼率編碼,第二個訊框以r / 3的編碼率編碼,第❶ 三個訊框以R/ 3的編碼率編碼,第四個訊框以3R的編碼率 編碼’第五個訊框以R/2的編碼率編碼,第六個訊框則以 3R/2的編碼率編碼。隨後,此型態不斷地重覆下去。平均 的編碼率因而為R。 另一個示範的型態為PPNNPPN。在此型態中,第一個訊 框以R / 3的編碼率編碼,第二個訊框以R / 3的編碼率編碼, 第二個訊框以2 R的編碼率編碼,第四個訊框以2 R的編碼率 編碼’第五個訊框以R/2的編碼率編碼,第六個訊框以r/2 的編碼率編碼,第七個訊框則以4R/3的-編碼率編碼。隨 後,此型態不斷地重覆下去。平均的編碼率因而為r。 習於此藝人士會了解,上述各型態中任一型態的任何圓 形輪流也都是可以使用的。習於此藝人士還應知道,上述 各型態以及其他種的型態均能以用任何的次序相接在一 起,無論是隨機性或假隨機性地選取,還是依本性週期性
第23頁 530296 五、發明說明(20) 地远取均可。習於此蟄人士另應知道,任何的 二:用’只要在此型態的整個時間範圍内(F個吨框)旦平 均的編,率為所希望_的編碼率!^,就可以了。 框)+ 尚位兀率編碼之訊框以非預測性或稍具 J編碼,僅只有在該型態於語音區段中唯 均編碼率R時,才合邕 、’待所欲+ 去。事實上,若:立「 錯誤所產生的影響持續下 框的整數倍,;;二Γΐ不剛好等於該型態的長度-F個訊 訊框均以固定t:;文率的達成方式是將區段中所有的 易文到持續性訊框錯誤的傷害。 及。亥^碼益'就會極 習於此藝人士會了帛,雖然上且- 率之語碼器為施行對參沾 /、肢貝鈿例是以可變 的架構也都是可以使用:對…乂型態為基礎 有益的。如果該固定 猫、、疋率之預測型語碼器也都是 語碼器,那麼訊框錯誤、^型扣碼,是一個低位元率之 響。以非預測性或^ ^二况就會對該語碼器有不利的影 能較以同樣低編碼率::J『式所編碼的訊框其品質可 低。雖然如此,但在—、4性編碼方式所編碼之訊框為 ^ ^ ^ ^ ^ ^ j ^ ^ ~ ^ ^ ^ ^ 框’肖除訊框錯辦所帶來的旦;冑。匡σΡ會為這些F個的訊 至此,已說明了 7、y曰 碼器中使用編碼竿::的方法及裝置,其在預測性 ,擇型態來降低語碼器對訊
第24頁 530296 五、發明說明(21) 況的敏感度。習於此蓺- 輯方塊及運算法則步^ = 了解,此處所說明的各種邏 用電子硬體、電腦;實施,,均可以 些功能是否以硬體或—般性地均為功能性。這 整個系統對設計所做的限制二:的場合以及 言,每一種應用場換性的’對這些功能而 所說明的各種邏輯方塊^::的施仃方式。譬如,此處 實施例,均可以用元步驟以及所揭示的具體 理哭r n q d^ 衣置來施行:譬如,數位行。务老 -(DSP)、特殊應用積體電 L號處 體邏輯、像是暫存哭AFIF()u j SIC)離政的閘或電晶 行-組論令的離散型硬體元件、可執 及處理器。該處理哭最 ^ =何傳統的可程式軟體模組 任何傳統的處里器,但另種作法是使用 = ΐ隨機存取記憶體中、快閃記憶體中、;; ΐ。中任何已知其他形式的可寫入儲存“ 訊、ϋ位:ΐ另應知逼,1亥資料、指令、命令、資 1石就位凡、符號以及可你 — - 是以電壓、電流、電磁波、磁;:;扁說明參考的晶片最好 些東西的任意組“代ΐ。~或粒子、光場或粒子或這 過,:羽ί:2之較佳具體實施例已顯示及說明完畢。不 明之梦、1Γ ί *人士而言,&明顯地,其可在不偏離本發 "月不把圍下’對此處所揭示之具體實施例做各種不
530296
第26頁
Claims (1)
- 530296 _案號89122669 丨¥丫0月:日丨 修正_ I * __ι 六、申請專利範圍 一一&»~ _〇 1 . 一種語碼器,包含: 至少一預測編碼模式; 至少一非預測編碼模式;以及 —處理器,連接至該至少一個的預測編碼模式及該至少 一個的非預測編碼模式,該處理器被設計成根據編碼語音 訊框型態,以選定的編碼模式連績地編碼語音訊框’該型 態包含至少一個以該非預測編碼模式所編碼之語音訊框。 2 .如申請專利範圍第1項之語碼器,其中該至少一個的 非預測編碼模式包含一非預測的編碼模式。 3. 如申請專利範圍第1項之語碼器,其中該至少一個的 非預測編碼模式包含一溫和地預測編碼模式。 4. 如申請專利範圍第1項之語碼器,其中該至少一個的 非預測編碼模式包含一全然非預測編碼模式。 5 ·如申請專利範圍第1項之語碼器,其中該處理器另外 被設計成維持該編碼語音訊框型態的平均編碼率。 6 .如申請專利範圍第1項之語碼器,其中該編碼語音訊 框型態包含多個以該至少一個的預測編碼模式所編碼之語 音訊框,以該至少一個的預測編碼模式所編碼之語音訊框 的數目已由聆聽者預先決定之。 7 ·如申請專利範圍第1項之語碼器,其中該型態乃一重 覆發生之型態。 8.如申請專利範圍第1項之語碼器,其中該型態乃一變 動的型態。 9 . 一種編碼語音訊框之方法,其包含以下之步驟:O:\67\67355-911002.ptc 第29頁 530296 案號 89122669 Λ 修正 六、申請專利範圍 將預定數目之連續語音訊框以預測 於執行過將預定數目之連續語音訊 以編碼之步驟後,以非預測編碼模式 ;以及 重覆該二編碼步驟以便產生多個依 訊框。 1 0 .如申請專利範圍第9項之方法, 發生之型態。 1 1 .如申請專利範圍第9項之方法, 的型態。 1 2 .如申請專利範圍第9項之方法, 式乃一溫和地預測編碼模式。 1 3.如申請專利範圍第9項之方法, 式乃一全然非預測編碼模式。 1 4.如申請專利範圍第9項之方法, 維持該編碼語音訊框型態的平均編碼 1 5 .如申請專利範圍第9項之方法, 音訊框數乃由聆聽者預先決定之。 1 6.如申請專利範圍第9項之方法, 更動該預定的連續語音訊框數。 1 7.如申請專利範圍第1 6項之方法 含週期性地更動該預定的連續語音訊 1 8.如申請專利範圍第1 6項之方法 含隨機性地更動該預定的連續語音訊 編碼模式加以編碼; 框以預測編碼模式加 至少編碼一個訊框; 一型態所編碼之語音 其中該型態乃一重覆 其中該型態乃一變動 其中該非預測編碼模 其中該非預測編碼模 其另外包含之步驟: 率。 其中該預定的連續語 其另外包含之步驟: ,其中該更動步驟包 框數。 ,其中該更動步驟包 框數。O:\67\67355-911002.ptc 第30頁 530296 _案號89122669 年丫°月少日 修正_ 六、申請專利範圍 1 1 9 . 一種語碼器,包含: 將預定數目之連續語音訊框以預測編碼模式加以編碼之 裝置; 在該預定數目之連續語音訊框已以預測編碼模式編碼之 後,以非預測編碼模式至少編碼一個訊框之裝置; 用以產生多個依一型態編碼之語音訊框之裝置,該型態 包含至少一個以非預測編碼模式所編碼之語音訊框。 2 0 ·如申請專利範圍第1 9項之語碼器,其中該型態乃一 重覆發生之型態。 2 1 .如申請專利範圍第1 9項之語碼器,其中該型態乃一 變動的型態。 2 2.如申請專利範圍第1 9項之語碼器,其中該非預測編 碼模式乃一溫和地預測編碼模式。 2 3 .如申請專利範圍第1 9項之語碼器,其中該非預測編 碼模式乃一全然非預測編碼模式。 2 4.如申請專利範圍第1 9項之語碼器,另包含用以維持 該編碼語音訊框型態的平均編碼率之裝置。 2 5 .如申請專利範圍第1 9項之語碼器,其中該預定的連 續語音訊框數乃由聆聽者預先決定之。 2 6 ·如申請專利範圍第1 9項之語碼器,另包含用以更動 該預定連續語音訊框數之裝置。 2 7 .如申請專利範圍第2 6項之語碼器,其中該更動用之 裝置包含用以週期性地更動該預定連續語音訊框數之裝 置。O:\67\67355-911002.ptc 第31頁 530296 案號89122669 年年日 修正 六、申請專利範圍 2 8 .如申請專利範圍第2 6項之語碼器,其中該更動用之 裝置包含用以隨機性地更動該預定的連續語音訊框數之裝 置。 ' 24 . —種編碼語音訊框之方法,其所包含之步驟: 依一型態編碼多個語音訊框,該型態包含至少一個預測 性編碼之語音訊框以及至少一個非預測性編碼之語音訊 框。 3 0 .如申請專利範圍第2 9項之方法,其中該型態乃一重 覆發生之型態。 3 1 .如申請專利範圍第2 9項之方法,其中該型態乃一變 動的型態。 3 2 . —種編碼語音訊框之方法,其所包含之步驟: 依一型態編碼多個語音訊框,該型態包含至少一個強烈 預測性編碼之語音訊框以及至少一個溫和預測性編碼之語 音訊框。 3 3.如申請專利範圍第3 2項之方法,其中該型態乃一重 覆發生之型態。 3 4.如申請專利範圍第3 2項之方法,其中該型態乃一變 動的型態。O:\67\67355-911002.ptc 第32頁
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/429,754 US6438518B1 (en) | 1999-10-28 | 1999-10-28 | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
Publications (1)
Publication Number | Publication Date |
---|---|
TW530296B true TW530296B (en) | 2003-05-01 |
Family
ID=23704610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW089122669A TW530296B (en) | 1999-10-28 | 2001-02-14 | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
Country Status (13)
Country | Link |
---|---|
US (1) | US6438518B1 (zh) |
EP (1) | EP1224663B1 (zh) |
JP (2) | JP4805506B2 (zh) |
KR (2) | KR100804888B1 (zh) |
CN (1) | CN1212607C (zh) |
AT (1) | ATE346357T1 (zh) |
AU (1) | AU1576001A (zh) |
BR (1) | BRPI0015070B1 (zh) |
DE (1) | DE60032006T2 (zh) |
ES (1) | ES2274812T3 (zh) |
HK (1) | HK1051735A1 (zh) |
TW (1) | TW530296B (zh) |
WO (1) | WO2001031639A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019350B2 (en) | 2004-11-02 | 2011-09-13 | Coding Technologies Ab | Audio coding using de-correlated signals |
TWI466102B (zh) * | 2008-06-13 | 2014-12-21 | Nokia Corp | 用以使經編碼音訊資料之錯誤消隱的方法和裝置 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002247137A (ja) * | 2000-04-25 | 2002-08-30 | Canon Inc | 通信装置及び通信方法 |
JP4221537B2 (ja) * | 2000-06-02 | 2009-02-12 | 日本電気株式会社 | 音声検出方法及び装置とその記録媒体 |
US7487083B1 (en) * | 2000-07-13 | 2009-02-03 | Alcatel-Lucent Usa Inc. | Method and apparatus for discriminating speech from voice-band data in a communication network |
US20050234712A1 (en) * | 2001-05-28 | 2005-10-20 | Yongqiang Dong | Providing shorter uniform frame lengths in dynamic time warping for voice conversion |
US7433815B2 (en) * | 2003-09-10 | 2008-10-07 | Dilithium Networks Pty Ltd. | Method and apparatus for voice transcoding between variable rate coders |
US7542899B2 (en) * | 2003-09-30 | 2009-06-02 | Alcatel-Lucent Usa Inc. | Method and apparatus for adjusting the level of a speech signal in its encoded format |
US8111663B2 (en) | 2004-07-20 | 2012-02-07 | Qualcomm Incorporated | Methods and systems for variable rate broadcast with soft handoff |
US20070005347A1 (en) * | 2005-06-30 | 2007-01-04 | Kotzin Michael D | Method and apparatus for data frame construction |
US8090573B2 (en) * | 2006-01-20 | 2012-01-03 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with open loop re-decision |
US8032369B2 (en) * | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
US8346544B2 (en) * | 2006-01-20 | 2013-01-01 | Qualcomm Incorporated | Selection of encoding modes and/or encoding rates for speech compression with closed loop re-decision |
WO2008045846A1 (en) * | 2006-10-10 | 2008-04-17 | Qualcomm Incorporated | Method and apparatus for encoding and decoding audio signals |
US8171380B2 (en) * | 2006-10-10 | 2012-05-01 | Marvell World Trade Ltd. | Adaptive systems and methods for storing and retrieving data to and from memory cells |
US7813922B2 (en) * | 2007-01-30 | 2010-10-12 | Nokia Corporation | Audio quantization |
KR20130036304A (ko) * | 2010-07-01 | 2013-04-11 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
US9263054B2 (en) * | 2013-02-21 | 2016-02-16 | Qualcomm Incorporated | Systems and methods for controlling an average encoding rate for speech signal encoding |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
JP2017009663A (ja) * | 2015-06-17 | 2017-01-12 | ソニー株式会社 | 録音装置、録音システム、および、録音方法 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS637042A (ja) * | 1986-06-27 | 1988-01-12 | Fujitsu Ltd | 符号化伝送装置 |
JPS6444499A (en) * | 1987-08-12 | 1989-02-16 | Fujitsu Ltd | Forecast encoding system for voice |
JPH01293028A (ja) * | 1988-05-20 | 1989-11-27 | Fujitsu Ltd | 音声符号化モード切り替え方式 |
US5568483A (en) * | 1990-06-25 | 1996-10-22 | Qualcomm Incorporated | Method and apparatus for the formatting of data for transmission |
ES2225321T3 (es) | 1991-06-11 | 2005-03-16 | Qualcomm Incorporated | Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos. |
GB9205932D0 (en) * | 1992-03-18 | 1992-04-29 | Philips Electronics Uk Ltd | Method and apparatus for editing an audio signal |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
JP3198637B2 (ja) * | 1992-07-23 | 2001-08-13 | ソニー株式会社 | 画像信号符号化装置及び画像信号符号化方法 |
US5659659A (en) * | 1993-07-26 | 1997-08-19 | Alaris, Inc. | Speech compressor using trellis encoding and linear prediction |
JPH07131793A (ja) * | 1993-11-01 | 1995-05-19 | Toshiba Corp | 映像信号高能率符号化装置 |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
JPH0816200A (ja) * | 1994-06-30 | 1996-01-19 | Olympus Optical Co Ltd | 音声記録装置 |
JPH0818543A (ja) * | 1994-07-01 | 1996-01-19 | Nippon Telegr & Teleph Corp <Ntt> | 可変ビットレート符号化復号化方法、その符号化器及び復号化器 |
TW271524B (zh) * | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
JPH0869298A (ja) * | 1994-08-29 | 1996-03-12 | Olympus Optical Co Ltd | 再生装置 |
JPH0884329A (ja) * | 1994-09-13 | 1996-03-26 | Canon Inc | 画像通信端末装置 |
US5774846A (en) | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
JPH08263099A (ja) * | 1995-03-23 | 1996-10-11 | Toshiba Corp | 符号化装置 |
US6021325A (en) * | 1997-03-10 | 2000-02-01 | Ericsson Inc. | Mobile telephone having continuous recording capability |
US6064954A (en) * | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
JPH1169355A (ja) * | 1997-08-20 | 1999-03-09 | Sharp Corp | 画像伝送装置 |
US6233550B1 (en) * | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US6058359A (en) * | 1998-03-04 | 2000-05-02 | Telefonaktiebolaget L M Ericsson | Speech coding including soft adaptability feature |
JP3529599B2 (ja) * | 1997-09-02 | 2004-05-24 | 株式会社東芝 | 符号化装置における編集可能点挿入方法および符号化装置 |
JPH11220711A (ja) * | 1998-02-03 | 1999-08-10 | Fujitsu Ltd | 多地点会議システム及び会議端末装置 |
JP3539615B2 (ja) * | 1998-03-09 | 2004-07-07 | ソニー株式会社 | 符号化装置、編集装置及び符号化多重化装置並びにそれらの方法 |
AU1524300A (en) * | 1998-11-13 | 2000-06-05 | Qualcomm Incorporated | Closed-loop variable-rate multimode predictive speech coder |
US6324503B1 (en) * | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Method and apparatus for providing feedback from decoder to encoder to improve performance in a predictive speech coder under frame erasure conditions |
KR100711047B1 (ko) * | 2000-02-29 | 2007-04-24 | 퀄컴 인코포레이티드 | 폐루프 멀티모드 혼합영역 선형예측 (mdlp) 음성 코더 |
-
1999
- 1999-10-28 US US09/429,754 patent/US6438518B1/en not_active Expired - Lifetime
-
2000
- 2000-10-26 KR KR1020077025873A patent/KR100804888B1/ko not_active IP Right Cessation
- 2000-10-26 AT AT00978283T patent/ATE346357T1/de not_active IP Right Cessation
- 2000-10-26 WO PCT/US2000/029710 patent/WO2001031639A1/en active IP Right Grant
- 2000-10-26 EP EP00978283A patent/EP1224663B1/en not_active Expired - Lifetime
- 2000-10-26 ES ES00978283T patent/ES2274812T3/es not_active Expired - Lifetime
- 2000-10-26 CN CNB008149712A patent/CN1212607C/zh not_active Expired - Lifetime
- 2000-10-26 BR BRPI0015070A patent/BRPI0015070B1/pt active IP Right Grant
- 2000-10-26 JP JP2001534143A patent/JP4805506B2/ja not_active Expired - Fee Related
- 2000-10-26 KR KR1020027005199A patent/KR100827896B1/ko not_active IP Right Cessation
- 2000-10-26 DE DE60032006T patent/DE60032006T2/de not_active Expired - Lifetime
- 2000-10-26 AU AU15760/01A patent/AU1576001A/en not_active Abandoned
-
2001
- 2001-02-14 TW TW089122669A patent/TW530296B/zh not_active IP Right Cessation
-
2003
- 2003-06-06 HK HK03103998A patent/HK1051735A1/xx not_active IP Right Cessation
-
2011
- 2011-06-08 JP JP2011128162A patent/JP5543405B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8019350B2 (en) | 2004-11-02 | 2011-09-13 | Coding Technologies Ab | Audio coding using de-correlated signals |
TWI466102B (zh) * | 2008-06-13 | 2014-12-21 | Nokia Corp | 用以使經編碼音訊資料之錯誤消隱的方法和裝置 |
Also Published As
Publication number | Publication date |
---|---|
JP2003515178A (ja) | 2003-04-22 |
ES2274812T3 (es) | 2007-06-01 |
BRPI0015070B1 (pt) | 2016-10-11 |
EP1224663B1 (en) | 2006-11-22 |
EP1224663A1 (en) | 2002-07-24 |
AU1576001A (en) | 2001-05-08 |
BR0015070A (pt) | 2002-12-24 |
DE60032006D1 (de) | 2007-01-04 |
KR20070112894A (ko) | 2007-11-27 |
US6438518B1 (en) | 2002-08-20 |
DE60032006T2 (de) | 2007-06-21 |
KR100804888B1 (ko) | 2008-02-20 |
JP4805506B2 (ja) | 2011-11-02 |
WO2001031639A1 (en) | 2001-05-03 |
HK1051735A1 (en) | 2003-08-15 |
JP5543405B2 (ja) | 2014-07-09 |
JP2011237809A (ja) | 2011-11-24 |
CN1212607C (zh) | 2005-07-27 |
KR20020040910A (ko) | 2002-05-30 |
ATE346357T1 (de) | 2006-12-15 |
KR100827896B1 (ko) | 2008-05-07 |
CN1402869A (zh) | 2003-03-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW530296B (en) | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions | |
TW519616B (en) | Method and apparatus for predictively quantizing voiced speech | |
US10249313B2 (en) | Adaptive bandwidth extension and apparatus for the same | |
KR100923891B1 (ko) | 음성 비활동 동안에 보이스 송신 시스템들 사이에상호운용성을 제공하는 방법 및 장치 | |
RU2667382C2 (ru) | Улучшение классификации между кодированием во временной области и кодированием в частотной области | |
JP5413839B2 (ja) | 符号化装置および復号装置 | |
US20020016161A1 (en) | Method and apparatus for compression of speech encoded parameters | |
RU2636685C2 (ru) | Решение относительно наличия/отсутствия вокализации для обработки речи | |
JP2009193073A (ja) | 望ましくないパケット生成を減少する方法および装置 | |
ES2778076T3 (es) | Método y disposición para suavizar ruido estacionario de fondo | |
CN108231083A (zh) | 一种基于silk的语音编码器编码效率提高方法 | |
CN105814629A (zh) | 带宽扩展模式选择 | |
KR20160128871A (ko) | 파라미터 변경에 의해 음색을 변환하는 사용자 맞춤형 음성 보정 방법 및 이를 구현하는 음성 보정 장치 | |
JP2005503574A5 (zh) | ||
CN106165012A (zh) | 使用多个子频带的高频带信号译码 | |
US9418671B2 (en) | Adaptive high-pass post-filter | |
JP4420562B2 (ja) | 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法 | |
US20020095284A1 (en) | System of dynamic pulse position tracks for pulse-like excitation in speech coding | |
Gajjar et al. | Artificial bandwidth extension of speech & its applications in wireless communication systems: A review | |
Bhatt et al. | A novel approach for artificial bandwidth extension of speech signals by LPC technique over proposed GSM FR NB coder using high band feature extraction and various extension of excitation methods | |
Vary et al. | Steganographic wideband telephony using narrowband speech codecs | |
US7233896B2 (en) | Regular-pulse excitation speech coder | |
Bhatt | Implementation and Overall Performance Evaluation of CELP based GSM AMR NB coder over ABE | |
Geiser et al. | Robust wideband enhancement of speech by combined coding and artificial bandwidth extension | |
Gersho | Speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |