TW201034001A - Coding of transitional speech frames for low-bit-rate applications - Google Patents
Coding of transitional speech frames for low-bit-rate applications Download PDFInfo
- Publication number
- TW201034001A TW201034001A TW098137039A TW98137039A TW201034001A TW 201034001 A TW201034001 A TW 201034001A TW 098137039 A TW098137039 A TW 098137039A TW 98137039 A TW98137039 A TW 98137039A TW 201034001 A TW201034001 A TW 201034001A
- Authority
- TW
- Taiwan
- Prior art keywords
- pulse
- frame
- packet
- pitch
- location
- Prior art date
Links
- 238000000034 method Methods 0.000 claims abstract description 94
- 239000013598 vector Substances 0.000 claims description 127
- 230000005284 excitation Effects 0.000 claims description 31
- 230000004044 response Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 8
- 238000012545 processing Methods 0.000 claims description 5
- 230000009471 action Effects 0.000 claims description 4
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 claims 1
- 230000005250 beta ray Effects 0.000 claims 1
- 235000013399 edible fruits Nutrition 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 78
- 238000006243 chemical reaction Methods 0.000 description 37
- 230000001052 transient effect Effects 0.000 description 24
- 230000000737 periodic effect Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 239000001177 diphosphate Substances 0.000 description 7
- 239000001825 Polyoxyethene (8) stearate Substances 0.000 description 6
- 239000001814 pectin Substances 0.000 description 6
- 239000001836 Dioctyl sodium sulphosuccinate Substances 0.000 description 5
- 239000001913 cellulose Substances 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 238000005311 autocorrelation function Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000600 sorbitol Substances 0.000 description 4
- -1 E470 Substances 0.000 description 3
- 239000000711 locust bean gum Substances 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 239000001733 1,4-Heptonolactone Substances 0.000 description 2
- 239000004233 Indanthrene blue RS Substances 0.000 description 2
- 101100522110 Oryza sativa subsp. japonica PHT1-10 gene Proteins 0.000 description 2
- 101100522109 Pinus taeda PT10 gene Proteins 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- HGUFODBRKLSHSI-UHFFFAOYSA-N 2,3,7,8-tetrachloro-dibenzo-p-dioxin Chemical compound O1C2=CC(Cl)=C(Cl)C=C2OC2=C1C=C(Cl)C(Cl)=C2 HGUFODBRKLSHSI-UHFFFAOYSA-N 0.000 description 1
- 239000004255 Butylated hydroxyanisole Substances 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 239000004148 curcumin Substances 0.000 description 1
- 235000021438 curry Nutrition 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 239000004149 tartrazine Substances 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
- 235000012431 wafers Nutrition 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/125—Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
Description
201034001 音調脈波之資訊,任務E43 0在脈波形狀向量之選定之表中 選擇一脈波形狀向量。任務E430可實施為如本文中所描述 之任務T660之執行個體。 表格表選擇任務E420可經組態以比較一基於所估計之音 調週期之值與複數個不同值中之每一者。為了判定如本文 中所描述之一組滯後範圍頻率區間中的哪一者包括所估計 之音調週期’(例如)任務E420可經組態以比較所估計之音 調週期與該組頻率區間中之兩個或兩個以上中之每一者的 上限(或下限)。 向量選擇任務E430可經組態以在脈波形狀向量之選定之 表中選擇能量最接近於待匹配之音調脈波之能量的脈波形 狀向量。在一實例中,任務E430經組態以計算待匹配之音 調脈波與選定之表之每一脈波形狀向量之間的差,且選擇 具有最小能量之對應於該差之脈波形狀向量。在另一實例 中,任務E430經組態以選擇能量最接近於待匹配之音調脈 波之能量的脈波形狀向量。在此等狀況下,可按照平方樣 本之總和計算一序列樣本(諸如,一音調脈波或其他向量) 之能量。 圖43B展示方法M65〇之實施方案M66〇之流程圖該實 施方案M660包括任務E44〇。任務E44〇產生一包括⑷基於 所估計之音調週期之第—值及(B)識別選^之表中的選定 之脈波形狀向量之第二值(例如’表索引)的封包。第一值 可將所估计之音調週期指示為一相對於最小音調週期值 (例如’ 20)之偏移。舉例而言,方法M66〇(例如,任務 144315.doc 201034001 E410)可經組態以藉由自所估計之音調週期減去最小音調 週期值計算第一值。 任務E440可經組態以產生包括各別組不相交之位元位置 中之第一值及第二值的封包。舉例而言,任務E440可經組 態以根據如本文中所描述之具有第一組位元位置及第二組 位元位置之模板產生封包,該第一組位元位置與該第二組 位元位置不相交。在此狀況下,任務E440可實施為如本文 中所描述之封包產生任務E320之執行個體。任務E440之此 類實施方案可經組態以產生包括第一組位元位置中之一音 調脈波位置、第二組位元位置中之第一值及第三組位元位 置中之第二值的封包,該第三組與第一組及第二組不相 交。 圖43C展示方法M650之實施方案M670之流程圖,該實 施方案M670包括任務E450。任務E450自語音信號訊框之 複數個音調脈波中提取一音調脈波。任務E450可實施為如 本文中所描述之任務T640之執行個體。任務E450可經組態 以基於一能量量度選擇音調脈波。舉例而言,任務E450可 經組態以選擇峰值具有最高能量之音調脈波,或具有最高 能量之音調脈波。在方法M670中,向量選擇任務E430可 經組態以選擇最佳地匹配所提取之音調脈波(或基於所提 取之音調脈波之脈波形狀,諸如所提取之音調脈波與另一 所提取之音調脈波之平均值)之脈波形狀向量。 圖46A展示方法M650之實施方案M680之流程圖,該實 施方案M680包括任務E460、E470及E480。任務E460計算 144315.doc -81 - 201034001 一第二語音信號訊框(例如,一LPC殘差之訊框)之一音調 脈波之位置。第一及第二語音信號訊框可來自同一話音通 信會話或可來自不同話音通信會話。舉例而言,第一及第 二語音信號訊框可來自由一人說出之語音信號或可來自各 自由一不同的人說出之兩個不同語音信號。語音信號訊框 可在計算音調脈波位置之前及/或之後經歷其他處理操作 (例如,感知加權)。 基於所計算之音調脈波位置,任務E470選擇脈波形狀向 量之複數個表中之一者。任務E470可實施為如本文中所描 述之任務T620之執行個體。可回應於第二語音信號訊框僅 含有一個音調脈波之判定(例如,藉由任務E460或另外藉 由方法M680進行)執行任務E470。基於來自第二語音信號 訊框之資訊,任務E480在脈波形狀向量之選定之表中選擇 一脈波形狀向量。任務E480可實施為如本文中所描述之任 務T630之執行個體。 圖44A展示用於編碼音調脈波之形狀之裝置MF650的方 塊圖。裝置MF650包括用於估計一語音信號訊框之一音調 週期(例如,如上文參考任務E410、E130、L200及/或E370 之各種實施方案所描述)的構件FE410、用於選擇脈波形狀 向量之一表(例如,如上文參考任務E420及/或T650之各種 實施方案所描述)的構件FE420及用於選擇選定之表中之一 脈波形狀向量(例如,如上文參考任務E430及/或T660之各 種實施方案所描述)的構件FE430。 圖44B展示裝置MF650之實施方案MF660之方塊圖。裝 144315.doc •82- 201034001 置MF660包括用於產生一包括(A)基於所估計之音調週期 之第一值及(B)識別選定之表中的選定之脈波形狀向量之 第二值的封包(例如,如上文參考任務E440所描述)的構件 FE440。圖44C展示裝置MF650之實施方案MF670之方塊 圖,.該實施方案MF670包括用於自語音信號訊框之複數個 音調脈波中提取一音調脈波(例如,如上文參考任務E450 所描述)的構件FE450。 圖46B展示裝置MF650之實施方案MF680之方塊圖。裝 置MF680包括用於計算一第二語音信號訊框之一音調脈波 之位置(例如,如上文參考任務E460所描述)的構件 FE460、用於基於所計算之音調脈波位置選擇脈波形狀向 量之複數個表中之一者(例如,如上文參考任務E470所描 述)的構件FE470及用於基於來自第二語音信號訊框之資訊 在脈波形狀向量之選定之表中選擇一脈波形狀向量(例 如,如上文參考任務E480所描述)的構件FE480。 45A展示用於編碼音調脈波之形狀之裝置A650的方塊 圖。裝置A650包括一經組態以估計一語音信號訊框之一音 調週期(例如,如上文參考任務E410、E130、L200及/或 E370之各種實施方案所描述)之音調週期估計器540。舉例 而言,音調週期估計器540可實施為如本文中所描述之音 調週期估計器130、190或A320之執行個體。裝置A650亦 包括一經組態以基於所估計之音調週期來選擇脈波形狀向 量之一表(例如,如上文參考任務E420及/或T650之各種實 施方案所描述)的向量表選擇器5 50。裝置A650亦包括一經 144315.doc -83- 201034001 組態以基於來自語音信號訊框之至少一音調脈波之資訊來 選擇選定之表中的一脈波形狀向量(例如,如上文參考任 務E43 0及/或T660之各種實施方案所描述)的脈波形狀向量 選擇器560。 圖45B展示裝置A650之實施方案A660之方塊圖,該實施 方案A660包括一經組態以產生一包括(A)基於所估計之音 調週期之第一值及(B)識別選定之表中的選定之脈波形狀 向量之第二值的封包(例如,如上文參考任務E440所描述) 的封包產生器570。封包產生器570可實施為如本文中所描 述之封包產生器170之執行個體。圖45C展示裝置A650之 實施方案A670之方塊圖,該實施方案A670包括一經組態 以自語音信號訊框之複數個音調脈波中提取一音調脈波 (例如,如上文參考任務E450所描述)的音調脈波提取器 580 ° 圖46C展示裝置A650之實施方案A680之方塊圖。裝置 A680包括一經組態以計算一第二語音信號訊框之一音調脈 波之位置(例如,如上文參考任務E460所描述)的音調脈波 位置計算器590。舉例而言,音調脈波位置計算器590可實 施為如本文中所描述之音調脈波位置計算器120或160或終 端峰值定位器A3 10之執行個體。在此狀況下,向量表選擇 器550亦經組態以基於所計算之音調脈波位置選擇脈波形 狀向量之複數個表中之一者(例如,如上文參考任務E470 所描述),且脈波形狀向量選擇器560亦經組態以基於來自 第二語音信號訊框之資訊來選擇脈波形狀向量之選定之表 144315.doc -84· 201034001 中的一脈波形狀向量(例如,如上文參考任務E480所描 述)。 語音編碼器AE10可實施成包括裝置A650。舉例而言, 語音編碼器AE20之第一訊框編碼器104可實施成包括裝置 A650之執行個體以使得音調週期估計器130亦充當估計器 540。第一訊框編碼器104之此類實施方案亦可包括裝置 A400之執行個體(例如,裝置A402之執行個體,以使得封 包產生器170亦充當封包產生器570)。 圖47A展示根據一般組態的解碼音調脈波之形狀之方法 M800的方塊圖。方法M800包括任務D510、D520、D530及 D540。任務D510自一經編碼之語音信號之一封包(例如, 如由方法M660之實施方案產生)提取一經編碼之音調週期 值。任務D5 10可實施為如本文中所描述之任務D480之執 行個體。基於該經編碼之音調週期值,任務D520選擇脈波 形狀向量之複數個表中之一者。任務D530自該封包提取一 索引。基於該索引,任務D540自該選定之表獲得一脈波形 狀向量。 圖47B展示方法M800之實施方案M810之方塊圖,該實 施方案M810包括任務D550及D560。任務D550自該封包提 取一音調脈波位置指示符。任務D5 50可實施為如本文中所 描述之任務D410之執行個體。基於該音調脈波位置指示 符,任務D560將一基於該脈波形狀向量之音調脈波配置於 一激勵信號内。任務D560可實施為如本文中所描述之任務 D430之執行個體。 144315.doc -85- 201034001 圖48A展示方法M800之實施方案M820之方塊圖,該實 施方案M820包括任務D570、D575、D580及D585。任務 D570自一第二封包提取一音調脈波位置指示符。該第二封 包可來自與第一封包相同之話音通信會話或可來自一不同 話音通信會話。任務D570可實施為如本文中所描述之任務 D410之執行個體。基於來自第二封包之音調脈波位置指示 符,任務D575選擇脈波形狀向量之第二複數個表中之— 者。任務D580自該第二封包提取一索引。基於來自第二封 包之索引,任務D585自該第二複數個表中之該選定者獲得 一脈波形狀向量。方法M820亦可經組態以基於所獲得的 脈波形狀向量產生一激勵信號。 圖48B展示用於解碼音調脈波之形狀之裝置MF800的方 塊圖。裝置MF800包括用於自一封包提取一經編碼之音調 週期值(例如’如本文中參考任務D5 10之各種實施方案所 描述)的構件FD510、用於選擇脈波形狀向量之複數個表中 之一者(例如,如本文中參考任務D520之各種實施方案所 描述)的構件FD520、用於自該封包提取一索引(例如,如 本文中參考任務D530之各種實施方案所描述)的構件 FD530及用於自該選定之表獲得一脈波形狀向量(例如,如 本文中參考任務D540之各種實施方案所描述)的構件 FD540 〇 圖49A展示裝置MF800之實施方案MF810之方塊圖。褒 置MF810包括用於自封包提取一音調脈波位置指示符(例 如’如本文中參考任務D550之各種實施方案所描述)的構 144315.doc • 86 - 201034001 件FD5 50及用於將一基於該脈波形狀向量之音調脈波配置 於一激勵信號内(例如,如本文中參考任務D560之各種實 施方案所描述)的構件FD560。 圖49B展示裝置MF800之實施方案MF820之方塊圖。裝 置MF820包括用於自第二封包提取一音調脈波位置指示符 (例如,如本文中參考任務D570之各種實施方案所描述)的 構件FD5 70及用於基於來自第二封包之位置指示符來選擇 脈波形狀向量之第二複數個表中之一者(例如,如本文中 參考任務D575之各種實施方案所描述)的構件FD575。裝 置MF820亦包括用於自第二封包提取一索引(例如,如本文 中參考任務D580之各種實施方案所描述)的構件FD580及 用於基於來自第二封包之索引自該第二複數個表中之該選 定者獲得一脈波形狀向量(例如,如本文中參考任務D585 之各種實施方案所描述)的構件FD585。 圖5 0A展示用於解碼音調脈波之形狀之裝置A800的方塊 圖。裝置A800包括一經組態以自一封包提取一經編碼之音 調週期值(例如,如本文中參考任務D510之各種實施方案 所描述)且自該封包提取一索引(例如,如本文中參考任務 D530之各種實施方案所描述)的封包剖析器610。封包剖析 器610可實施為如本文中所描述之封包剖析器510之執行個 體。裝置A800亦包括一經組態以選擇脈波形狀向量之複數 個表中之一者(例如,如本文中參考任務D520之各種實施 方案所描述)的向量表選擇器620及經組態以自該選定之表 獲得一脈波形狀向量(例如,如本文中參考任務D540之各 144315.doc -87- 201034001 種實施方案所描述)之向量表讀取器63〇。 封包剖析器610亦可蟑έ能 y 左組態以自一第二封包提取一脈波 位置指示符及一索引Mu ’如本文中參考任務D57〇及 D580之各種實施方幸所护 ” 為迷)°向量表選擇器620亦可經組 態以基於來自第二封包之位詈扣-々々七 <位置#日不符來選擇脈波形狀向量
之複數個表中之一者ί你丨如 κ I (J 如本文中參考任務D575之各 種實施方案所描述)。向量砉嘈你$ 衣遠取|§ 63 0亦可經組態以基於 來自第二封包之索引自該第__ X乐一複數個表中之該選定者獲得 -脈波形狀向量(例如’如本文中參考任務膽5之各種實 施方案所描述)。圖_展示裝置編〇之實施方案A8i〇之 方塊圖,該實施方案A810包括—經組態以將__基於該脈波 形狀向量之音調脈波配置於—激勵信號内(例如,如本文 中參考任務D560之各種實施方案所描述)的激勵信號產生 器640。激勵信號產生器64〇可實施為如本文中所描述之激 勵k號產生器310及/或530之執行個體。 §吾音編碼器AE10可實施成包括裝置A8〇〇。舉例而言, s吾音編瑪器AE20之第一訊框編碼器i 〇4可實施成包括裝置 A800之執行個體。第一訊框編碼器ι〇4之此類實施方案亦 可包括裝置A560之執行個體’在此狀況下,封包剖析器 5 10亦可充當封包剖析器620及/或激勵信號產生器53〇亦可 充當激勵信號產生器640。 一根據一組態(例如,根據語音編碼器AE20之實施方案) 之語音編碼器使用三個或四個編碼方案來編碼不同類別之 訊框:如上文所描述之四分之一速率NELP(QNELP)編碼方 144315.doc -88- 201034001 案、四分之一速率PPP(QPPP)編碼方案及轉換訊框編碼方 案。QNELP編碼方案用以編碼無聲訊框及向下瞬變訊框。 QNELP編碼方案或八分之一速率NELP編碼方案可用以編 碼靜寂訊框(例如,背景雜訊)。QPPP編碼方案用以編碼有 聲訊框。轉換訊框編碼方案可用以編碼向上瞬變(亦即, 開始)訊框及瞬變訊框。圖26之表展示用於此四種編碼方 案中之每一者的位元分配之一實例。 現代聲碼器通常執行語音訊框之分類。舉例而言,此類 聲碼器可根據將訊框分類為上文所論述之六種不同類別 (靜寂、無聲、有聲、瞬變、向下瞬變及向上瞬變)中之一 者的方案操作。此等方案之實例描述於美國公開專利申請 案第2002/0111798號(Huang)中。此類分類方案之一實例亦 描述於3GPP2(第三代合作夥伴計劃2)文獻「Enhanced Variable Rate Codec, Speech Service Options 3, 68, and 70 for Wideband Spread Spectrum Digital Systems」(3GPP2 C.S0014-C,2007年 1月,在www.3gpp2.org可線上獲得)章 節4.8(第4-5 7至4-71頁)中。此方案使用圖51之表中所列之 特徵將訊框分類,且此章節以引用的方式併入本文中作為 本文中所描述之「EVRC分類方案」之一實例。 在圖51之表中顯現之參數E、EL及EH可如下計算(針對 160位元訊框): 159 159 159 五=艺52(«) EL^sKn)册=£4(«) w=0 n=0 n=0 5 5 ? 其中及分別為輸入語音信號之經低通濾波(使用 144315.doc -89· 201034001 12階極零低通濾波器)及經高通濾波(使用12階極零高通濾 波器)版本。可用於EVRC分類方案中之其他特徵包括先前 訊框模式決策(「prev_mode」)、先前訊框中之固定有聲語 音之存在(「prev_voiced」)及針對當前訊框之話音活動性 债測結果「curr_va」)。 音調之正規化自相關函數(NACF)。圖52展示用於計算 基於音調之NACF之程序的流程圖。首先,經由具有約100 Hz之3 dB截止頻率之3階高通濾波器對當前訊框之LPC殘 差及下一個訊框(亦稱為預看訊框)之LPC殘差進行濾波。 可能需要使用未經量化之LPC係數值來計算此殘差。接著 用長度為13之有限脈衝回應(FIR)濾波器對經濾波之殘差 進行低通渡波且抽選十分之二(decimated by a factor of two)。由表示經抽選之信號。 用於當前訊框之兩個子訊框之對於k= 1、2,按照nacf(k)= A〇-l γ 40-1 、 sign ^[rd{AQk + ri)rd(40A: + n~lag{k) + /)] [[rd(40A: + ri)rd(40A: + n-lag(k) + /)] \ n=0 J\«=0 > Λ〇-1 V 40-1 λ [(40Λ + (40A: + «)] [ [,“40众 + « - + /)r“40A: + w -細(A:) + z·)] M=0 J\ «==0 / k=l計算當前訊框之兩個子訊框之NACF,其中所有整數i 上進行最大化以使得 1 + max[6, min(0_2 X /ag(A:),l 6)] 1 + max[65min(0.2 x lag(k),16)] --< l < - 2 2 , 其中lag(k)為如由音調估計常式(例如,基於相關之技術)估 計的子訊框k之滯後值。當前訊框之第一及第二子訊框之 此等值亦可分別以nacf_at_pitch[2](亦寫作「nacf_ap[2]」) 144315.doc -90- 201034001 及nacf_ap[3]表示。根據用於先前訊框之第一及第二子訊 框之上述表述計算的NACF值可分別以nacf_ap[0]及 nacf_ap[l]表示。 用於預看訊框之按照nacf(2)= ’80-1 N/80-1
Xkrf(8〇 + «yd(80 + n-〇] ^[^(80 + 72)^(80 + /7-/)] max- ^80-1 Λ/80-1 J][rd(80 + «)rd(80 + «)] [rd (80 + « - i)rd (80A: + n- 〇] 人《=〇 >
計算預看訊框之NACF,其中在所有整數i上進行最大化以 使得 20 …120 2 2 〇 此值亦可以nacf_ap[4]表示。 圖53為說明EVRC分類方案之高階流程圖。可將模式決 策視為基於先前模式決策且基於諸如NACF之特徵之狀態 之間的轉換,其中該等狀態為不同訊框分類。圖54為說明 EVRC分類方案中之狀態之間的可能轉換的狀態圖,其中 標記S、UN、UP、TR、V及DOWN分別表示訊框分類:靜 寂、無聲、向上瞬變、瞬變、有聲及向下瞬變。 可藉由取決於nacf_at_pitch[2](當前訊框之第二子訊框 NACF,亦寫作「nacf_ap[2]」)與臨限值VOICEDTH及 UNVOICEDTH之間的關係而選擇三種不同程序中之一者 來實施EVRC分類方案》跨越圖55及圖56延伸之程式碼清 單描述可在nacf_ap[2]>VOICEDTH時使用之程序。跨越圖 57至圖59延伸之程式碼清單描述可在nacf_ap[2]< 144315.doc 91· 201034001 UNVOICEDTH時使用之程序。跨越圖60至圖63延伸之程 式碼清單描述可在nacf_ap[2]>=UNVOICEDTH且nacf_ ap[2]<=VOICEDTH時使用之程序。 可能需要根據特徵curr_ns_snr之值來變化臨限值 VOICEDTH、LOWVOICEDTH及 UNVOICEDTH之值。舉例 而言’若curr_ns_snr之值不小於SNR臨限值25 dB,則乾淨 語音之以下臨限值可適用:VOICEDTH=0.75、 LOWVOICEDTH=0.5、UNVOICEDTH=0.35 ;且若 curr_ns_snr 之值小於SNR臨限值25 dB,則吵雜語音之以下臨限值 可適用:VOICEDTH=0.65 、 LOWVOICEDTH=0.5 、 UNVOICEDTH=0.35。 訊框之準確分類對於確保低速率聲碼器中之良好品質可 能尤其重要。舉例而言,僅在開始訊框具有至少一相異峰 值或脈波時,可能需要使用如本文中所描述之轉換訊框編 碼模式。此類特徵對於可靠脈波偵測可為重要的,在無此 類特徵之情況下’轉換訊框編碼模式可產生一失真結果。 可能需要使用NELP編碼方案而非ppp或轉換訊框編碼方案 來編碼缺乏至少一相異峰值或脈波之訊框。舉例而言,可 能需要將此類瞬變或向上瞬變訊框重新分類為一無聲訊 框。 此類重新分類可基於一或多個正規化自相關函數 (NACF)值及/或其他特徵。該重新分類亦可基於不用於 EVRC分類方案中之特徵,諸如,訊框之峰值與rmS能量 之比的值(「最大樣本/RMS能量」)及/或訊框中之音調脈 144315.doc -92· 201034001 =際數目(「峰值計數」)。圖64之表中所展示之八個 件中的任何-或多者及/或圖65之表中所展示之十個條 件中的任何-或多者可用於將一向上瞬變訊框重新分 一無聲訊框。圖66之表中所展示之十-個條件中的任何二 或多者及/或圖67之表中所展示之十—個條件中的任何一 或多者可歸將-瞬變訊框重新分類為_無聲訊框。圖⑽ 之表中所展示之四個條件中的任何—或多者可用
聲訊框重新分類為-無聲訊框。亦可能需要將此重新分類 限制於相對無低頻帶雜訊之訊框。舉例而言,僅在 咖及啦之值不小於25 dB時1可能需要根據圖μ、 圖67或圖68中之條件中之任一者或圖66之七個最右側條件 中之任一者將一訊框重新分類。 /目反地’可能需要將一包括至少一相異峰值或脈波之無 聲訊框重新分類為-向上瞬變或瞬變訊框。此類重新分類 可基於-或多個正規化自相關函數(Nacf)值及/或其他特 徵。該重新分類亦可基於不用於咖❻類方案中之特 徵,諸如,訊框之峰值與RMS能量之比的值及/或峰值計 數。圖69之表中所展示之七個條件中的任何—或多者可用 於將-無聲訊框重新分類為一向上瞬變訊框。圖7〇之表中 所展示之九個條件中的任何一或多者可用於將一無聲訊框 重新分類為-瞬變訊框。圖71A之表中所展示之條件可用 於將一向下瞬變訊框重新分類為一有聲訊框。圖7ib之表 中所展示之條件可用於將—向下瞬變訊框重新分類為—瞬 變訊框。 144315.doc 93- 201034001 作為訊框重新分類之一替代,諸如EVRC分類方案之訊 框分類方法可經修改以產生一等於EVRC分類方案與上文 所描述及/或圖64至圖71B中所闡述之重新分類條件中之一 或多者的一組合的分類結果。 圖72展示語音編碼器AE20之實施方案AE30之方塊圖。 編碼方案選擇器C200可經組態以應用一諸如圖55至圖63之 程式碼列表中所描述之EVRC分類方案的分類方案。語音 編碼器AE30包括一經組態以根據上文所描述及/或圖64至 圖71B中所闡述之條件中之一或多者將訊框重新分類的訊 框重新分類器RC10。訊框重新分類器RC10可經組態以自 編碼方案選擇器C200接收一訊框分類及/或其他訊框特徵 之值。訊框重新分類器RC10亦可經組態以計算額外訊框 特徵(例如,峰值與RMS能量之比的值、峰值計數)之值。 或者,語音編碼器AE30可實施成包括編碼方案選擇器 C200之實施方案,該實施方案產生一等於EVRC分類方案 與上文所描述及/或圖64至圖71B中所闡述之重新分類條件 中之一或多者的一組合的分類結果。 圖73A展示語音編碼器AE10之實施方案AE40之方塊圖。 語音編碼器AE40包括一經組態以編碼週期性訊框之週期 性訊框編碼器E70及一經組態以編碼非週期性訊框之非週 期性訊框編碼器E80。舉例而言,語音編碼器AE40可包括 編碼方案選擇器C200之實施方案,該實施經組態以指導選 擇器60a、60b針對分類為有聲、瞬變、向上瞬變或向下瞬 變之訊框選擇週期性訊框編碼器E70,且針對分類為無聲 144315.doc •94- 201034001 或靜寂之訊框選擇非週期性訊框編碼器E80。 圖73B展示週期性訊框編碼器E70之實施方案E72之方塊 圖。編碼器E72包括如本文中所描述之第一訊框編碼器100 及第二訊框編碼器200之實施方案。編碼器E72亦包括經組 態以根據來自編碼方案選擇器C200之分類結果針對當前訊 框選擇編碼器100及200中之一者的選擇器80a、80b。可能 需要組態週期性訊框編碼器以選擇第二訊框編碼器200(例 如,QPPP編碼器)作為用於週期性訊框之預設編碼器。非 週期性訊框編碼器E80可經類似地實施以選擇無聲訊框編 碼器(例如,QNELP編碼器)及靜寂訊框編碼器(例如,八分 之一速率NELP編碼器)中之一者。或者,非週期性訊框編 碼器E80可實施為無聲訊框編碼器UE10之執行個體。 圖74展示週期性訊框編碼器E72之實施方案E74之方塊 圖。編碼器E74包括訊框重新分類器RC10之執行個體,該 執行個體經組態以根據上文所描述及/或圖64至圖71B中所 闡述之條件中之一或多者將訊框重新分類且控制選擇器 80a、80b根據重新分類之結果針對當前訊框選擇編碼器 100及200中之一者。在另一實例中,編碼方案選擇器C200 可組態成包括訊框重新分類器RC10,或執行一等於EVRC 分類方案與上文所描述及/或圖64至圖71B中所闡述之重新 分類條件中之一或多者的一組合的分類方案,且選擇如由 此分類或重新分類指示之第一訊框編碼器100。 可能需要使用如上文所描述之轉換訊框編碼模式來編碼 瞬變及/或向上瞬變訊框。圖75A至圖75D展示可能需要使 144315.doc -95- 201034001 用如本文中所描述之轉換訊框編碼模式的一些典型訊框序 列。在此等實例中,使用轉換訊框編碼模式通常將經指示 以用於以粗體概述之訊框。此類編碼模式通常對具有一相 對恆定之音調週期及尖脈波之完全或部分有聲訊框良好地 執行。然而,當訊框缺乏尖脈波時或當訊框先於發聲之實 際開始時,可能降低經解碼之語音之品質。在—些狀況 下,可能需要跳過或取消使用轉換訊框編碼模式,或以其
他方式延遲使用此編碼模式,直至一稍後訊框(例如,ς 後的訊框)為止。 脈波誤偵測可引起音誤差、遺漏之脈波及/或外來脈波 之插入。該等誤差可導致經解碼之語音中的諸如啪啪聲、 咔噠聲及/或其他不連續性之失真。因此’可能需要驗證 訊框適合轉換訊框編瑪’且當訊框不適合時取消使用轉換 訊框編碼模式可幫助減少該等問題。
可判定-瞬變或向上瞬變訊框不適合轉換訊框編碼模 式。舉例而言’該訊框可能缺乏—相異、尖脈波。在此狀 況下,可能需要使用轉換訊框編碼模式來編碼在該不適合 訊框之後的.第-適合之有聲訊框。舉例而言,若—開始訊 框缺乏一相異尖脈波,則可能需要對之後的第一適合之有 聲訊框執行轉換訊框編碼。此類技術可幫助確保一用於後 續有聲訊框之良好參考。 在二狀況下,使用轉換訊框編碼模式可導致脈波增益 失配問題及/或脈波形狀失配問題。僅有限數目個位元可 用於編碼此等參數,且即使以其他方式指示轉換訊框編 144315.doc -96- 201034001 瑪’當前訊框亦可能不提供一良好參考。取消不必要地使 用轉換訊框編碼模式可幫助減少此等問題。因此,可能需 要驗證轉換訊框編碼模式比另一編碼模式適合於當前訊 框。 對於跳過或取消使用轉換訊框編碼之狀況而言,可能需 要使用轉換訊框編碼模式來編碼之後的第一適合之訊框, 因為此動作可幫助為後續有聲訊框提供一良好參考。舉例 而言,若緊接著之訊框係至少部分有聲的,則可能需要對 緊接著之訊框強制使用轉換訊框編碼。 對轉換訊框編碼之需要及/或訊框對於轉換訊框編碼之 適合性可基於諸如當前訊框分類、先前訊框分類、初始滯 後值(例如,如藉由諸如基於相關之技術之音調估計常式 判疋)、經修改之滯後值(例如,如由諸如方法M2〇〇之脈波 摘測操作判定)、先前訊框之滞後值及/或NACF值之準則來 判定。 可能需要在靠近有聲區段之開始處使用轉換訊框編碼模 式’因為在無良好參考之情況下使用QPPP之結果係不可 預測的。然而,在一些狀況下,可預期QPPP提供比轉換 訊框編碼模式好之結果。舉例而言,在一些狀況下,可預 期使用轉換訊框編碼模式產生一不良參考或甚至引起一比 使用QPPP不適宜之結果。 若轉換訊框編碼對於當前訊框而言不必要’則可能需要 跳過轉換訊框編碼。在此狀況下,可能需要預設至一有聲 編碼模式’諸如QPPP(例如,以保存QPPP之連續性)。不 144315.doc -97- 201034001 必要地使用轉換訊框編碼模式可導致稍後訊框中的脈波增 益及/或脈波形狀之失配的問題(例如,歸因於用於此等特 徵之有限位元預算)。具有有限時間同步之有聲編碼模式 (諸如,QPPP)可能對此等誤差尤其敏感。 在使用轉換訊框編碼方案編碼訊框之後,可能需要檢查 經編碼之結果,且若經編碼之結果不良,則拒絕對訊框使 用轉換訊框編碼。對於大部分無聲且僅在靠近結束處變為 有聲之訊框而言,轉換編碼模式可經組態以在無脈波之情 況下編碼無聲部分(例如,作為零或低值),轉換編碼模式 可經組態以用脈波填充無聲部分之至少一部分。若無聲部 分係在無脈波之情況下經編碼,則訊框可在經解碼之信號 中產生-聽得到的料聲或不連續性。在此狀況下,可能 需要替代地對訊框使用NELp編碼方案。然而,可能需要 避免對㈣區段使用舰P(其可引起失真)。㈣於一訊框 取消轉換編碼模式,則在大多數狀況下,可能需要使用有 聲編碼模式(例如,QPPP)而不是無聲編碼模式(例如, QNELP)來編碼該訊框。如上文所描述,對使用轉換編碼 模式之選擇可實施為轉換編碼模式與有聲編碼模式之間的 選擇。雖然在|良好參考之情況下使用Qppp之結果可 能不可預測(例如’訊框之相位將自先前無聲訊框導出), 但不可能在經解碼之信號中產生一咔噠聲或不連續性。在 ^狀況下’可延期使用轉換編碼模式,直至下—個訊框為 當债測到訊框之間的音調不連續性時,可能需要更動對 144315.doc •98· 201034001 訊框使用轉換編碼模式之決策。在一實例中,任務T7丨〇檢 查以查看與先前訊框之音調連續性(例如,檢查以查看音 調加倍誤差)。若訊框分類為有聲或瞬變,且由脈波偵測 常式指示的用於當前訊框之滞後值遠小於由脈波偵測常式 • 指示的用於先前訊框之滯後值(例如,為其約1/2、1/3或 %)’則該任務取消使用轉換編碼模式之決策。 在另一實例中,任務Τ720檢查以查看音調溢位(與先前 ❹ 訊框相比較)。音調溢位在語音具有導致高於最大容許滯 後之滯後值的極低音調頻率時出現。此類任務可經組態以 在用於先刖訊框之滯後值大(例如,大於丨〇〇個樣本)且由音 調估冲及脈波偵測常式指示的用於當前訊框之滞後值均遠 小於先前音調(例如,小50%以上)時取消使用轉換編碼模 式之決策。在此狀況下,亦可能需要僅保持訊框之最大音 調脈波為單一脈波。或者,可使用先前滯後估計及有聲及 /或相對編碼模式(例如,任務E2〇〇、Qppp)來編碼訊框。 •當偵測到來自兩個不同常式之結果中之不一致時可能 需要更動對訊框使用轉換編碼模式之決策。在一實例中, 任務T730檢查以查看在存在強NACF之情況下|自音調估 計常式及脈波偵測常式之滞後值之一致。第二脈波之音調 下之極高NACF指示-良好音調估計,以使得將不預期兩 個滯後估計之間的不一致。此類任務可經組態以在來自脈 波偵測常式之滯後估計與來自音調估計常式之滯後估計極 不同(例如,大於1.6倍)時取消使用轉換編碼模式之決策。 在另—實例中,任務T740檢查以查看滯後值與終端脈波 144315.doc -99- 201034001 之位置之間的一致性。當如使用滞後估計(其可為峰值之 間的距離之平均值)編碼之峰值位置中之一或多者與對應 實際峰值位置過於不同時’可能需要取消使用轉換訊框編 碼模式之決策。任務T740可經組態以使用終端脈波之位置 及由脈波债測常式计算之滞後值來計算經重建之音調脈波 位置t匕較經重建之位置中之每一者與如由脈波積測演算 法债測之實際音調峰值位置,且在該等差中之任一者過大 (例如,大於8個樣本)時取消使用轉換訊框編碼之決策。 在另實例中,任務T750檢查以查看滞後值與脈波位置 © 之間的一致性。此類任務可經組態以在最終音調峰值距最 終訊框邊界大於一個滞後週期時取消使用轉換訊框編碼之 决策。舉例而言’此類任務可經組態以在最終音調脈波之 位置與訊框之結束之間的距離大於最終滞後估計(例如, 由滯後估計任務L200及/或方法M3〇〇計算之滯後值)時取消 使用轉換訊框編碼之決策。此類條件可指示一脈波誤摘測 或一尚未穩定之滯後。 若當前訊框具有兩個脈波且分類為瞬變,且若該兩個脈® 波之峰值之平方量值的比率大,則可能需要使該兩個脈波 在整個滞後值上相關且除非相關結果大於(或者,不小於). 一對應臨限值,否則拒絕較小峰值。若拒絕較小峰值則 亦可能需要取消對訊框使用轉換訊框編碼之決策。 圖76展示用於可用以取消對訊框使用轉換訊框編碼之決 策的兩個常式之程式碼列表。在此列表中,m〇d—㈣指示 來自脈波偵測常式之滯後值;〇rig—lag指示來自音調估計 144315.doc -100- 201034001 常式之滯後值;pdelay_transient_coding指示來自脈波彳貞測 常式之用於先前訊框之滞後值;PREV_TRANSIENT_ FRAME—E指示轉換編碼模式是否用於先前訊框;且l〇e[0] 指示訊框之最終音調峰值之位置。 圖77展示可用以取消使用轉換訊框編碼之決策之四個不 同條件。在此表中,curr_mode指示當前訊框分類; prev_mode指示用於先前訊框之訊框分類; number_of_pulses指示當前訊框中之脈波之數目; prev_no_of_pulses指示先前訊框中之脈波之數目; pitch_doubling指示是否在當前訊框中偵測到一音調加倍誤 差;delta_lag_intra指示來自音調估計常式與脈波偵測常 式之滯後值之間的差之絕對值(例如,整數)(或,若偵測到 音調加倍,則指示來自音調估計常式之滯後值之一半與來 自脈波偵測常式之滯後值之間的差之絕對值); delta_lag_inter指示先前訊框之最終滞後值與來自音調估 計常式之滞後值之間的差之絕對值(例如,浮點)(或,若偵 測到音調加倍,則指示此滯後值之一半);NEED_TRANS 指示是否在先前訊框之編碼期間指示對當前訊框使用轉換 訊框編碼模式;TRANS_USED指示轉換編碼模式是否用以 編碼先前訊框;且fully_voiced指示終端音調脈波之位置與 訊框之相對端(如由最終滯後值劃分)之間的距離之整數部 分是否等於number_of_pulses減一。臨限值之值之實例包 括T1A=[0.1*(來自脈波偵測常式之滯後值)+0.5]、 Τ1Β = [0·05*(來自脈波偵測常式之滯後值)+0.5]、 144315.doc •101- 201034001 Τ2Α=[0·2*(先前訊框之最終滞後值)]及Τ2Β = [0.15*(先前訊 框之最終滯後值)]。 訊框重新分類器RC10可實施成包括上文針對取消使用 轉換編瑪模式之決策所描述之規定中的—或多者,諸如任 務Τ710至Τ750、圖76中之程式碼列表及圖77中所展示之條 件。舉例而言,訊框重新分類器Rcl〇可經實施以執行如 圖78中所展示之方法^^⑼,且在測試任務仞1〇至丁75〇中 之任一者失敗時取消使用轉換編碼模式之決策。 在如本文中所描述之方法(例如,方法M1〇〇、M2〇〇、 M300、M4〇〇、M5⑼、M55〇、M56〇、、M65〇、 M700或M8GG’或另—常式或程式碼列表)之實施方案的典 型應用中,-邏輯元件(例如,邏輯間)陣列經組態以執行 =方法之各種任務中之一者、_個以上者或甚至全部。該 等任務中之-或多者(可能全部)亦可實施為程式碼(例如, :或:個指令集),具體化於-可由-包括-邏輯元件(例 如,處理器、微處理器、微押 列之機器(例如,電或其他有限狀態機)陣 如,諸如_ & 或執行之電腦程式產品(例 =糾、快閃記憶體或其他非揮發性記 體圮憶體晶片等之—岑吝彻戈亍导 之實施方索夕Μ 儲存媒體)中。此類方法 在此等π可由—個以上此陣列或機器來執行。 社此等或其他實施方案 (諸如,一行動# 了在一用於無線通信之器件 件)内執行該等任務。==有此通信能力之其他器 及/或封包交換式網路通信可經㈣以與電路交換式 (例如,使用諸如VoIP(網路電 1443l5.doc •102- 201034001 話)之一或多個協定)。m __ ’舉例而5 ’此類器件可包括經組態 以傳輸一包括經編碼之邻 ^ 訊框(例如,封包)之信號及/或接收 此類L號之RF電路。此類器件亦可經組態以在叩傳輸之 前對經編碼之訊框或封包執行一或多個其他操作,諸如, 交錯、穿刺、迴旋編竭、錯誤校正編碼及/或應用一或多 層網㈣定及/或在RF接收之後執行該等操作之補充。 參 雖然亦預期無此限制之其他配置,但本文中所描述之裝 置(例如,裝置 A100、A2〇〇、A3〇〇、A4〇〇 a5〇〇、 A560、A600、A6SO、λ Λ Α700、Α800、語音編碼器ΑΕ2〇、語 音解碼II AD20,或其元件)之實施方㈣各種元件可實^ 為駐留(例如)於同一晶只卜七 B u ,, J曰曰片上或一晶片組中之兩個或兩個以 上晶片間的電子及/或光學器件。此類裝置之一或多個元 件可完全或部分地實施為經配置以在邏輯元件(例如,電 晶體、閘)之一或多個固定的或可程式化陣列(諸如,微處 理器、嵌入式處理器、IP核心、數位信號處理器、 FPGA(場可程式化閘陣列)、Assp(特殊應用標準產品)及 ASIC(特殊應用積體電路))上執行的一或多個指令集。 此類裝置之實施方案之一或多個元件有可能用以、執行任 務或執行不直接與該裝置之一操作有關的其他指令集,諸 如與被嵌入該裝置之器件或系統之另一操作有關=任務: 本文中所描述之裝置之實施方案的一或多個元件亦有可能 具有共同結構(例如,用以在不同時間執行對應於不同此 件之程式碼之部分的處理器、經執行以在不同時間執行$ 應於不同元件之任務的指令集或在不同時間執行不同元件 144315.doc -103- 201034001 之操作之電子及/或光學器件的配置)。 提供所描述之組態之上述陳述以使得任何熟習此項技術 者能夠製造或使用本文中所揭示之方法及其他結構。本文 中所展示並描述之流程圖及其他結構僅為實例,且此等結 構之其他變體亦在本發明之範_。對於 修改係可能的,且本文巾所提出之—般㈣同樣可適= 其他組態。 、本文令所描述之組態中之每一者可部分地或完全地實施 為硬連線電路,實施為製造至一特殊應用積體電路中之電 路組態,或實施為載入至非揮發性儲存器中之勒體程式或 自資料儲存媒體栽人或載人至資料儲存媒體中之軟體 (:為機器可讀程式碼)’該程式碼為可由一諸如微處理; 、他數位信號處理單元之邏輯元件陣列執行之指令。資 料健存媒體可為-儲存元件陣m,半導體記憶體 I〆。二不限制)動態或靜態RAM(隨機存取記憶體)、 …己憶體)及/或快閃RAM),或鐵電、磁電阻、雙 二Γ:相變記憶體;或諸如磁碟或光碟之碟片媒體。 應理解,術語「敕魏 , 器揀、-4 體」包括原始碼、組合語言程式碼、機 ‘、、—進制碼、韌體、巨碼(macrocode)、微巧、由 :輯元件陣列執行之任何-或多個指令集或二二 實例之任何組合。 ’及此# 如本=方法中之每一者亦可有形地具體化(例 包括-邏輯元:广:或多個資料儲存媒體中)為可由- 疋件(例如,處理器、措虚;理# 慝理器微處理器、微控制器或 144315.doc 201034001 其他有限狀態機)陣列之機器讀取及/或執行之一或多個指 令集。因此,本發明不意欲限於上文所展示之組態,而應 符合與本文中(包括形成原始揭示内容之一部分的所申請 之附加申請專利範圍中)以任何方式揭示之原理及新穎特 徵一致的最寬範疇。 【圖式簡單說明】 圖1展示語音信號之有聲區段之實例。 圖2 A展示語音區段之隨時間而變之振幅的實例。 圖2B展示LPC殘差之隨時間而變之振幅的實例。 圖3 A展示根據一般組態之語音編碼方法Ml 00之流程 圖。 圖3B展示編碼任務E100之實施方案E102之流程圖。 圖4展示訊框中之特徵之示意性表示。 圖5八展示編碼任務£200之實施方案£202之圖。 圖5B展示方法M100之實施方案M110之流程圖。 φ 圖5C展示方法M100之實施方案M120之流程圖。 圖6A展示根據一般組態之裝置MF100之方塊圖。’ 圖6B展示構件FE100之實施方案FE102之方塊圖。 • 圖7 A展示根據一般組態的解碼語音信號之激勵信號之方 . 法M200的流程圖。 圖7B展示解碼任務D100之實施方案D102之流程圖。 圖8A展示根據一般組態之裝置MF200之方塊圖。 圖8B展示用於解碼的構件FD100之實施方案FD102的流 程圖。 144315.doc -105 - 201034001 圖9A展示語音編碼器ΑΕΙ 0及對應語音解碼器ADI 0。 圖96展示語音編碼器八£10之執行個體入£1(^、八£101?及 語音解碼器AD10之執行個體ADlOa、ADlOb。 圖1 0 A展示根據一般組態的用於編碼語音信號之訊框之 裝置A100的方塊圖。 圖10B展示編碼器100之實施方案102之方塊圖。 圖11A展示根據一般組態的用於解碼語音信號之激勵信 號之裝置A200的方塊圖。 圖11B展示第一訊框解碼器300之實施方案3 02之方塊 圖。 , 圖12A展示語音編碼器AE10之多模式實施方案AE20之方 塊圖。 圖12B展示語音解碼器AD10之多模式實施方案AD20之 方塊圖。 圖13展示殘差產生器R10之方塊圖。 圖14展示用於衛星通信之系統之示意圖。 圖15A展示根據一般組態之方法M300之流程圖。 圖15B展示任務L100之實施方案L102之方塊圖。 圖15C展示任務L200之實施方案L202之流程圖。 圖16 A展示由任務L12 0進行之搜尋之實例。 圖16B展示由任務L130進行之搜尋之實例。 圖17A展示任務L210之實施方案L210a之流程圖。 圖17B展示任務L220之實施方案L220a之流程圖。 圖17C展示任務L230之實施方案L230a之流程圖。 144315.doc -106- 201034001 圖18A至圖18F說明任務L212之反覆之搜尋操作。 圖19A展示用於任務L214之測試條件之表。 圖19B及圖19C說明任務L222之反覆之搜尋操作。 圖20A說明任務L232之搜尋操作。 圖20B說明任務L234之搜尋操作。 " 圖20C說明任務L232之反覆之搜尋操作。 圖21展示任務L300之實施方案L302之流程圖。 圖22A說明任務L320之搜尋操作。 圖22B及圖22C說明任務L320之替代搜尋操作。 圖23展示任務L330之實施方案L332之流程圖。 圖24A展示可供任務L334之實施方案使用之四組不同測 試條件。 圖24B展示任務L338之實施方案L338a之流程圖。 圖25展示任務L300之實施方案L304之流程圖。 圖26展示用於語音編碼器AE10之實施方案之各種編碼 φ 方案的位元分配之表。 圖27A展示根據一般組態之裝置MF300之方塊圖。 圖27B展示根據一般組態之裝置A300之方塊圖。 • 圖27C展示根據一般組態之裝置MF350之方塊圖。 . 圖27D展示根據一般組態之裝置A350之方塊圖。 圖28展示根據一般組態之方法M500之流程圖。 圖29A至圖29D展示160位元訊框之各種區域。 圖30A展示根據一般組態之方法M400之流程圖。 圖30B展示方法M400之實施方案M410之流程圖。 144315.doc -107- 201034001 圖30C展示方法M400之實施方案M420之流程圖。 圖31A展示一封包模板PT10之一實例。 圖31B展示另一封包模板PT20之實例。 圖3 1C說明部分交錯之兩組不相交的位元位置。 圖32A展示方法M400之實施方案M430之流程圖。 圖32B展示方法M400之實施方案M440之流程圖。 圖32C展示方法M400之實施方案M450之流程圖。 圖33A展示根據一般組態之裝置MF400之方塊圖。 圖33B展示裝置MF400之實施方案MF410之方塊圖。 圖33C展示裝置MF400之實施方案MF420之方塊圖。 圖34A展示裝置MF400之實施方案MF430之方塊圖。 圖34B展示裝置MF400之實施方案MF440之方塊圖。 圖34C展示裝置MF400之實施方案MF450之方塊圖。 圖35A展示根據一般組態之裝置A400之方塊圖。 圖35B展示裝置A400之實施方案A402之方塊圖。 圖35C展示裝置A400之實施方案A404之方塊圖。 圖35D展示裝置A400之實施方案A406之方塊圖。 圖36A展示根據一般組態之方法M550之流程圖。 圖36B展示根據一般組態之裝置A560之方塊圖。 圖37展示根據一般組態之方法M560之流程圖。 圖38展示方法M560之實施方案M570之流程圖。 圖39展示根據一般組態之裝置MF560之方塊圖。 圖40展示裝置MF560之實施方案MF570之方塊圖。 圖41展示根據一般組態之方法M600之流程圖。 144315.doc -108- 201034001 圖42A展示將滯後範圍均勻劃分成頻率區間之實例。 圖42B展示將滯後範圍非均勻劃分成頻率區間之實例。 圖43 A展示根據一般組態之方法M650之流程圖。 圖43B展示方法M650之實施方案M660之流程圖。 圖43C展示方法M650之實施方案M670之流程圖。 '圖44A展示根據一般組態之裝置MF650之方塊圖。 圖44B展示裝置MF650之實施方案MF660之方塊圖。 • 圖44C展示裝置MF650之實施方案MF670之方塊圖。 圖45 A展示根據一般組態之裝置A650之方塊圖。 圖45B展示裝置A650之實施方案A660之方塊圖。 圖45C展示裝置A650之實施方案A670之方塊圖。 圖46A展示方法M650之實施方案M680之流程圖。 圖46B展示裝置MF650之實施方案MF680之方塊圖。 圖46C展示裝置A650之實施方案A680之方塊圖。 圖47A展示根據一般組態之方法M800之流程圖。 φ 圖47B展示方法M800之實施方案M810之流程圖。 圖48A展示方法M800之實施方案M820之流程圖。 圖48B展示根據一般組態之裝置MF800之方塊圖。 • 圖49A展示裝置MF800之實施方案MF810之方塊圖。 • 圖49B展示裝置MF800之實施方案MF820之方塊圖。 圖50A展示根據一般組態之裝置A800之方塊圖。 圖50B展示裝置A800之實施方案A810之方塊圖。 圖51展示用於訊框分類方案中之特徵清單。 圖52展示用於計算基於音調之正規化自相關函數之程序 144315.doc -109- 201034001 的流程圖。 圖53為說明訊框分類方案之高階流程圖。 圖54為說明訊框分類方案中之狀態之間的可能轉換的狀 態圖。 圖55至圖56、圖57至圖5 9及圖60至圖63展示訊框分類方 案之三個不同程序之程式碼列表。 圖64至圖71B展示訊框重新分類之條件。 圖72展示語音編碼器AE20之實施方案AE30之方塊圖。 圖73A展示語音編碼器AE10之實施方案AE40之方塊圖。 圖73B展示週期性訊框編碼器E70之實施方案E72之方塊 圖。 圖74展示週期性訊框編碼器E72之實施方案E74之方塊 圖。 圖75A至圖75D展示可能需要使用轉換訊框編碼模式之 的一些典型訊框序列。 圖76展示程式碼列表。 圖77展示用於取消使用轉換訊框編碼之決策之四個不同 條件。 圖78展示根據一般組態之方法M700之圖。 參考標記可能出現在一個以上圖中以指示相同結構。 【主要元件符號說明】 10 衛星 20a 地面台 20b 地面台 144315.doc -110- 201034001
30a 使用者終端機 30b 使用者終端機 40a 網路 40b 網路 50a 選擇器 50b 選擇器 60a 選擇器 60b 選擇器 80a 選擇器 80b 選擇器 90a 選擇器 90b 選擇器 100 第一訊框編碼器 102 編碼器 104 第一訊框編碼器 110 音調脈波形狀選擇器 120 音調脈波位置計算器 130 音調週期估計器 140 增益值計算器 150 峰值偵測器 160 音調脈波位置計算器 170 封包產生器 180 比較器 190 音調週期估計器 144315.doc -Ill - 201034001 200 第二訊框編碼器 204 訊框編碼器 210 音調脈波形狀差別計算器 220 音調脈波差別計算器 250 樣本選擇器 260 距離選擇器 300 第一訊框解碼器 302 解碼器 304 第一訊框解碼器 310 第一激勵信號產生器 312 第一激勵信號產生器 320 合成遽波器 330 第一倍增器 340 第二倍增器 350 峰值選擇器 400 第二訊框解碼器 410 音調脈波形狀計算器 420 音調週期計算器 430 合成滤波器 440 第二激勵信號產生器 510 封包剖析器 520 比較器 530 激勵信號產生器 540 音調週期估計器 144315.doc • 112· 201034001 550 向量表選擇器 560 脈波形狀向量選擇器 570 封包產生器 580 音調脈波提取器 590 音調脈波位置計算器 ' 610 封包剖析器 620 向量表選擇器 630 向量表讀取器 640 激勵信號產生器 A100 裝置 A200 裝置 A300 裝置 A3 10 終端音調峰值定位器 A320 音調滯後估計器 A330 額外音調峰值定位器 φ Α350 裝置 Α400 裝置 Α402 裝置 • Α404 '裝置 , Α406 裝置 Α560 裝置 Α650 裝置 Α660 裝置 Α670 裝置 144315.doc -113- 201034001 A680 裝置 A800 裝置 A810 裝置 AD10 語音解碼器 ADlOa 語音解碼器 AD 10b 語音解碼器 AD20 語音解碼器 AE10 語音編碼器 AE1 Oa 語音編碼器 AElOb 語音編碼器 AE20 語音編碼器 AE30 語音編碼器 AE40 語音編碼器 C100 通信頻道 C110 通信頻道 C120 通信頻道 C200 編碼方案選擇器 C300 編碼方案偵測器 E70 週期性訊框編碼 E72 週期性訊框編碼器 E74 週期性訊框編碼器 E80 非週期性訊框編碼器 FD100 用於解碼第一經編碼之訊框之一部分以 獲得第一激勵信號的構件 144315.doc -114- 201034001 FD102 FD110 FD120 > · FD130 FD140 FD200 FD210 FD220 FD230 FD410 FD420 FD430 用於解碼的構件 用於根據音調脈波位置將時域音調脈波 形狀之第一複本配置於第一激勵信號内 的構件 用於根據音調脈波位置及音調週期將時 域音調脈波形狀之第二複本配置於第一 激勵信號内的構件 用於將該組增益值中之一者施加至時域 音調脈波形狀之第一複本的構件 用於將該組增益值中之一不同者施加至 時域音調脈波形狀之第二複本的構件 用於解碼第二經編碼之訊框之一部分以 獲得第二激勵信號的構件 用於基於時域音調脈波形狀及音調脈波 形狀差別來計算第二音調脈波形狀的構件 用於基於音調週期及音調週期差別來計 异第·一音調週期的構件 用於根據音調脈波位置及第二音調週期 將第二音調脈波形狀之兩個或兩個以上 複本配置於第二激勵信號内的構件 用於自第一封包提取第一值的構件 用於比較第一值與一音調脈波位置模式 值的構件 用於根據第一值將一音調脈波配置於第 144315.doc -115- 201034001 FD440 FD450 FD460 FD470 FD480 FD490 FD510 FD520 FD530 FD540 FD550 FD560 FD570 FD575 一激勵信號内的構件 用於自第二封包提取第二值的構件 用於比較第二值與音調脈波位置模式值 的構件 用於根據第三值將一音調脈波配置於第 二激勵信號内的構件 用於自第二封包提取第三值的構件 用於自第一封包提取第四值的構件 用於基於第四值將另一音調脈波配置於 第一激勵信號内的構件 用於自一封包提取一經編碼之音調週期 值的構件 用於選擇脈波形狀向量之複數個表中之 一者的構件 用於自該封包提取一索引的構件 用於自該選定之表獲得一脈波形狀向量 的構件 用於自封包提取一音調脈波位置指示符 的構件 用於將一基於脈波形狀向量之音調脈波 配置於一激勵信號内的構件 用於自第二封包提取一音調脈波位置指 不符的構件 用於基於來自第二封包之位置指示符來 144315.doc -116- 201034001 FD580 選擇脈波形狀向量之第二複數個表中之 一者的構件 用於自第二封包提取一索引的構件 FD585 用於基於來自第二封包之索引自該第二 複數個表中之該選定者獲得一脈波形狀 向量的構件 FE100 用於編碼語音信號之第一訊框的構件 FE110 用於基於來自第一訊框之至少_音調脈 波之資訊來選擇一組時域音調脈波形狀 中之一者的構件 FE120 用於計算第一訊框之終端音調脈波之位 置的構件 FE130 用於估計第一訊框之音調週期的構件 FE140 用於計算對應於第一訊框之不同音調脈 波之一組增益值的構件 φ FE200 用於編碼語音信號之第二訊框的構件 FE210 用於a十算第二訊框之音調脈波形狀與第 一訊框之音調脈波形狀之間的一音調脈 波形狀差別的構件 FE220 用於計算第二訊框之音調週期與第一訊 框之音調週期之間的一音調週期差別的 構件 FE310 用於計算第一位置的構件 FE320 用於產生第一封包的構件 144315.doc -117- 201034001 FE330 FE340 FE350 FE360 FE370 FE410 FE420 FE430 FE440 FE450 FE460 FE470 FE480 MF100 用於計算第二位置的構件 用於產生第二封包的構件 用於比較第一位置與一臨限值的構件 用於比較第二位置與臨限值的構件 用於估計第一訊框之一音調週期的構件 用於估計一語音信號訊框之一音調週期 的構件 用於選擇脈波形狀向量之一表的構件 用於選擇選定之表中之一脈波形狀向量 的構件 用於產生一包括(A)基於所估計之音調 週期之第一值及(B)識別選定之表中的選 定之脈波形狀向量之第二值的封包的構 件 用於自語音信號訊框之複數個音調脈波 中提取一音調脈波的構件 用於計算一第二語音信號訊框之一音調 脈波之位置的構件 用於基於所計算之音調脈波位置選擇脈 波形狀向量之複數個表中的一者的構件 用於基於來自第二語音信號訊框之資訊 在脈波形狀向量之選定之表中選擇一脈 波形狀向ϊ的構件 裝置 144315.doc -118- 201034001 MF200 裝置 MF300 裝置 MF350 裝置 MF400 裝置 MF410 裝置 MF420 裝置 MF430 裝置 MF440 裝置 MF450 裝置 MF560 裝置 MF570 裝置 MF650 裝置 MF660 裝置 MF670 裝置 MF680 裝置 ❿ MF800 裝置 MF810 裝置 MF820 裝置 • ML100 用於定位訊框之一終端音調峰值的構件 . ML150 用於偵測訊框之一音調峰值的構件 ML200 用於估計訊框之一音調滯後的構件 ML250 用於選擇一候選樣本的構件 ML260 用於選擇一候選距離的構件 ML300 用於定位訊框之額外音調峰值的構件 144315.doc •119- 201034001 ML350 PT10 PT20 RIO R110 R120 R130 R140 R150 R160 RC10 S100 S110 S120 S200 S210 S220 S300 S310 S320 S400 S410 用於選擇候選樣本與一對應於候選距離 之樣本中之一者作為訊框之一音調峰值 的構件 封包模板 封包模板 殘差產生器 LPC分析模組 變換區塊 量化器 反量化器 反變換區塊 白化渡波益 訊框重新分類器 經數位化之語音信號 經數位化之語音信號 經數位化之語音信號 經編碼之信號 經編碼之信號 經編碼之信號 所接收的經編碼之語音信號 所接收的經編碼之語音信號 所接收的經編碼之語音信號 輸出語音信號 輸出語音信號 144315.doc -120- 201034001 S420 輸出語音信號 SL10 LPC參數 SR10 LPC殘差 UD10 無聲訊框解碼器 UE10 無聲訊框編碼器
❿ 144315.doc -121 -
Claims (1)
- 201034001 七、申請專利範園: 1· -種處理語音信號訊框之方法,該方法包含: 計算一第一語音信號訊框内之-第-位置,該第—位 置為關於該訊框之第—樣本及該訊框之最後樣本中的— 者的該訊框之一終端音調脈波之一位置; 產生-S不該第-語音信號訊框a包括該第—位置 第一封包;計算一第二語音信號訊框内之一第二位置,該第二位 置為關於該訊框之該第—樣本及該訊框之該最後樣本= 的一者的該訊框之一終端音調脈波之一位置;及 包括該第二語音信 該第三位置為關於 產生一表示該第二語音信號訊框且 號訊框内之一第三位置的第二封包, 該訊框之該第一樣本及該訊框之該最後樣本中的另一者 的该訊框之該終端音調脈波之一位置。 2.如請求項1之方法,其中該第一語音信號訊框之該終端 音調脈波為該訊框之最終音調脈波且該第一位置為關於 該訊框之該最後樣本之該脈波之一位置,且 其中s亥第二語音信號訊框之該終端音調脈波為該訊框 之該最終音調脈波且該第二位置為關於該訊框之該最後 樣本之該脈波之一位置,且 其中該第三位置為關於該訊框之該第一樣本的該第二 語音信號訊框之該最終音調脈波之一位置。 3.如请求項1之方法,其中該第一封包為與該第二封包相 同之長度,且 144315.doc 201034001 其中該第一封包與該第二封包兩者均符合一具有一第 -組位7〇位置及一第二組位元位置之模板,該第一組位 元位置與該第二組位元位置不相交,且 其中,在該第一封包中,該第一位置佔用該第一組位 兀位置,且在該第二封包中,該第三位置佔用該第二組 位元位置。 4. 如請求項3之方法,其中該方法包含估計該第一語音信 號訊框之一音調週期,且 其中,在該第一封包中,指示該所估計之音調週期之 _ 一組位元佔用該第二組位元位置。 5. 如請求項1之方法,其中該方法包含: 比較該第一位置與一臨限值;及 比較該第二位置與該臨限值, 其中該比較該第一位置與一臨限值之一結果在該第一 位置小於該臨限值時具有一第一狀態且在該第一位置大 於該臨限值時具有一第二狀態,且 其中該比較該第二位置與該臨限值之—結果在該第二 〇 位置小於該臨限值時具有一第一狀態且在該第二位置大 於該臨限值時具有一第二狀態,且 其中該產生一第一封包係回應於該比較該第一位置與 該臨限值之具有該第一狀態之該結果而執行,且 - 其中該產生一第二封包係回應於該比較該第二位置與 該臨限值之具有該第二狀態之該結果而執行。 6. 如請求項1之方法,其中該第一語音信號訊框及該第二 144315.doc -2 - 201034001 語音信號訊框中之每__者之長度大於(2〜)餘元且小於 2 (r+l)個位元,r為一不小於6且不大於9之整數,且 其中4第一位置佔用該第一封包之不大於r個的位元且 其中該第二位置佔用該第二封包之不大於r個的位元。 7. 如請求項6之方法,其中Γ等於7。 8. 如响求項1之方法,其申該第一位置為該第一語音信號 訊框之該终端音調脈波之一峰值的一位置,且 參 其中該第二位置為該第二語音信號訊框之該終端音調 脈波之一峰值的一位置。 9. 一種用於處理語音信號訊框之裝置,該裝置包含: 用於《Ί*舁一第一語音信號訊框内之一第一位置的構 件,該第一位置為關於該訊框之第一樣本及該訊框之最 後樣本中的一者的該訊框之一終端音調脈波之一位置; 用於產生一表示該第一語音信號訊框且包括該第一位 置之第一封包的構件; _ 用於計算一第二語音信號訊框内之一第二位置的構 牛該第—位置為關於該訊框之該第一樣本及該訊框之 該最後樣本中的一者的該訊框之一終端音調脈波之一位 置;及 • 用於產生一表示該第二語音信號訊框且包括該第二語 音信號訊框内之一第三位置的第二封包的構件,該第三 位置為關於該訊框之該第一樣本及該訊框之該最後樣本 中的另一者的該訊框之該終端音調脈波之一位置。 10·如請求項9之裝置,其中用於計算該第一位置之該構件 144315.doc 201034001 經組態以將按照關於該訊框之該最後樣本的該訊框之最 終音調脈波之一位置計算該第一位置,且 其中用於D十算5玄第二位置之該構件經組態以按照關於 該訊框之該最後樣本的該訊框之該最終音調脈波之一位 置計算該第二位置,且 其中该第二位置為關於該訊框之該第一樣本的該第二 語音信號訊框之該最終音調脈波之一位置。 11.如請求項9之裝置,纟中該第一封包為與該第二封包相 同之長度,且 /、中用於產生第一封包之該構件經組態以根據一具 有-第-組位元位置及一第二組位元位置之模板產生該 第一封包,言亥第一組位元位置與該第r組位元位置不相 交,以使得該第一位置佔用該第一組位元位置,且 ”中用於產生第—封包之該構件經組態以根據該模 板產生該第二封包以使得該第三位置佔用該第二組位元 位置。 12.如請求項R裝置’其中該裝置包含用於估計該第一語 音信號訊框之一音調週期的構件,且 其中用於產生-第一封包之該構件經組態以產生該第 -封包以使得指示該所估計之音調週期之一組位元佔用 該第二組位元位置。 13·如請求項9之裝置’其中該裝置包含: 用於比較該第一位置與—臨限值的構件.及 用於比較該第二位置與該臨限值的構件, 144315.doc -4 · 201034001 其中用於比較該第一位置之該構 位置小於該臨限值時具有—第—狀離在該第一 於該臨限值時具有一第二狀態,且〜、且在該第-位置大 二:二於比較該第二位置之該構件之一輸 位置小於該臨限值時具有—第—狀態且在該第二位= 於該臨限值時具有一第二狀態,且 置大 =用於產生一第一封包之該構件經組 於比較該第-位置之該構件之 ^用 而產生該第-封包,且 有”亥第-㈣、的該輸出 用於產生—第二封包之該構件經組態以回應於用 =較該第二位置之該構件之具有該第二狀態的該輸出 而產生該第二封包。 如4求項9之裝置’其中該第_語音信號訊框及該第二 語音信號訊框中之每—者之長度大於㈣個位元且小於 2Λ(Γ+1)個位元,r為一不小於6且不大於9之整數,且 ’、中該第置佔用該第—封包之不大於『個的位元且 其中》亥第—位置佔用該第二封包之不大於r個的位元。 15. -種用於處理語音錢訊框之裝置,該裝置包含: 二音調脈波位置料器,纟經組態以計算一第一語音 L號Λ框内之一第一位置,該第一位置為關於該訊框之 第一樣本及該訊框之最後樣本中的一者的該訊框之一终 端音調脈波之一位置; 一封包產生器,其經組態以產生一表示該第一語音信 號訊框且包括該第一位置之第—封包; 144315.doc 201034001 其中該音舰波位置計算器經組態以計#一第二語音 信號訊框内之-第二位置,該第二位置為關於該訊框之 該第一樣本及該訊框之該最後樣本中的一者的該訊框之 一終端音調脈波之一位置;且 其中該封包產生器經組態以產生一表示該第二語音信 號訊框且包括該第二語音信號訊框内<一第三位置的第 二封包,該第三位置為關於該訊框之該第一樣本及該訊 框之該最後樣本中的另一者的該訊框之該終端音調脈波 之一位置。 16. 17. 如睛求項15之裝置,其中該音調脈波位置計算器經組態 以按照關於該訊框之該最後樣本的該訊框之最終音調脈 波之一位置計算該第一位置,且 其中該音調脈波位置計算器經組態以按照關於該訊框 之该最後樣本的該訊框之該最終音調脈波之一位置計算 該第二位置,且 其中該第三位置為關於該訊框之該第一樣本的該第二 語音信號訊框之該最終音調脈波之一位置。 如請求項15之裝置,其中該第一封包為與該第二封包相 同之長度,且 其中該封包產生器經組態以根據一具有一第一組位元 位置及一第二組位元位置之模板產生該第一封包,該第 一組位兀位置與該第二組位元位置不相交,以使得該第 一位置佔用該第一組位元位置,且 其中該封包產生器經組態以根據該模板產生該第二封 144315.doc 201034001 包以使得該第三位置佔用該第二組位元位置。 18. 如請求項17之裝置,其中該裝置包含一經組態以估計該 第一語音信號訊框之一音調週期之音調週期估計器,且 其中该封包產生器經組態以產生該第一封包以使得指 示°亥所估δ十之音調週期之一組位元佔用該第二組位元位 置。 19. 如請求項15之裝置,其中該裝置包含: φ 一比較器,其經組態以比較該第一位置與一臨限值並 產生一在該第一位置小於該臨限值時具有一第一狀態且 在該第一位置大於該臨限值時具有一第二狀態之第一輸 出, 其中该封包產生器經組態以回應於具有該第一狀態之 該第一輸出而產生該第一封包,且 其中該比較器經組態以比較該第二位置與該臨限值並 產生一在該第二位置小於該臨限值時具有一第一狀態且 ❹ 在該第二位置大於該臨限值時具有一第二狀態之第二輸 出,且 其中該封包產生器經組態以回應於具有該第二狀態之 該第二輸出而產生該第二封包。 .2G.如μ求項15之裝置,其中該第—語音信號訊框及該第二 語音信號訊框中之每—者之長度大於(2~)個位元且小於 2八0*+1)個位元,r為一不小於6且不大於9之整數,且 ’、中該第一位置佔用該第—封包之不大於^個的位元且 其中該第三位置佔用該第二封包之不大於r個的位元。 144315.doc 201034001 21. 一種電腦可讀媒體,其包含在由 理器進行以下動作之指令: 一處理器 執行時使該處 計算一第一語音信號訊框内之一第—相 a 位置,該第一位 置為關於該δίΐ框之第一樣本及該訊框之备你此 取设樣本中的一 者的該訊框之一終端音調脈波之一位置; 產生一表示該第一語音信號訊框且包括 。枯β亥第一位置之 第一封包; 計算一第二語音信號訊框内之一第二位置,該第二位 置為關於該訊框之該第一樣本及該訊框之該最後樣本中 的一者的該訊框之一終端音調脈波之一位置;及 產生一表示該第二語音信號訊框且包括該第二語音作 號訊框内之一第三位置的第二封包,該第三位置為關於 該訊框之該第一樣本及該訊框之該最後樣本中的另一者 的該訊框之該終端音調脈波之一位置。 22. 23. 如晴求項21之電腦可讀媒體,其中使該處理器計算一第 一位置之該等指令包括使該處理器按照關於該訊框之該 最後樣本的該訊框之最終音調脈波之一位置計算該第一 位置的指令,且 其中使該處理器計算一第二位置之該等指令包括使該 處理器按照關於該訊框之該最後樣本的該訊框之該最終 音調脈波之一位置計算該第二位置的指令,且 其中該第三位置為關於該訊框之該第一樣本的該第二 語音信號訊框之該最終音調脈波之一位置。 如請求項21之電腦可讀媒體,其中該第一封包為與該第 144315.doc 201034001 二封包相同之長度,且 其中使該處理器產生一第一封包之該等指令包括使該 處理器根據一具有一第一組位元位置及一第二組位元位 置之模板產生該第一封包的指令,該第一組位元位置與 該第二組位元位置不相交,以使得該第一位置佔用該第 一組位元位置,且 其中使該處理器產生一第二封包之該等指令包括使該 ❿ 處理器根據該模板產生該第二封包以使得該第三位置佔 用該第二組位元位置的指令。 24.如請求項23之電腦可讀媒體,其中該媒體包含在由一處 理器執行時使該處理器估計該第一語音信號訊框之一音 調週期的指令,且 其中使該處理器產生一第一封包之該等指令包括使該 處理器產生e玄第一封包以使得指示該所估計之音調週期 之一組位元佔用該第二組位元位置的指令。 ❹ 25.如請求項21之電腦可讀媒體,其中該媒體包含在由一處 理器執行時使該處理器進行以下動作之指令: 比較該第一位置與一臨限值;及 ' 比較該第二位置與該臨限值, • 其中使該處理器比較該第一位置之該等指令之一輸出 在該第-位置小於該臨限值時具有一第—狀態且在:第 一位置大於該臨限值時具有一第二狀態,且 其中使該處理器比較該第二位置之該等指令之一輪出 在該第二位置小於該臨限值時具有—第一狀態且在該第 144315.doc -9- 201034001 位置大於該臨限值時具有一第二狀態,且 其中使該處理器產生一第―料七 弟封包之該等指令包括使該 處理器回應於使該處理器比較該第_位置之該等指令之 具有該第-狀態之該輸出而產生該第―封包的指令,且 其中使該處理器產生-第二封包之該等指令包括使該 處理器回應於使該處理器比較該第二位置之該等指令之 具有該第二狀態之該輸出而產生該第二封包的指令。 26. 27. 如請求項21之電腦可讀媒體’其中該第-語音信號訊框 及該第二語音信號訊框中之每—者之長度大於個位 元且小於2 (r+Ι)個位元,Γ為一不小於6且不大於9之整 數,且 其中該第-位置佔用該第一封包之不大於r個的位元且 其中該第一位置佔用該第二封包之不大於犷個的位元。 一種解媽一經編碼之語音信號之封包的方法,該方法包 含: 自一符合一具有一第一組位元位置及一第二組位元位 置之模板之第一封包,自該第一組位元位置提取一第一 值,該第一組位元位置與該第二組位元位置不相交; 比較該第一值與一模式值; 回應於該比較該第一值之一結果,根據該第一值將一 音調脈波配置於一第—激勵信號内; 自一符合該模板之第二封包,自該第一組位元位置提 取一第二值; 比較該第二值與該模式值; 144315.doc 201034001 自該第二封包之該第二 —、’且位7L位置k取一第三值;及 回應於該比較該第二值钍 值之、,、Q果,根據該第三值將— 音調脈波配置於一第二激勵信號内。 28.如請求項27之解碼封句夕古 ^ . ^ A 肝%对包之方法,其中該第一值指示相對 於一第一語音信號訊框之最換λ , 个又琅後樣本的一音調脈波之位 置,且 其中該第二值指示相科私 ^ 伯丁相對於一第一 δ吾音信號訊框之第一樣本的一音調脈波之位置。 29.如請求項27之解碼封包之方法,其中該比較該第—值之 該結果在該第-值等於該模式值時具有_第—狀態且否 則具有一第二狀態,且 八中該比較該第_值之該結果在該第二值等於該模式 值時具有一第一&態且否則具有一第二狀態,且 其中該根據該第-值配置一音調脈波係回應於該比較 該第一值之具有該第二狀態之該結果而執行且 其中該根據該第三值配置一音調脈波係回應於該比較 一第二值之具有該第一狀態之該結果而執行。 3〇_如請求項27之解瑪封包之方法,其中該方法包含: 自該第一封包之該第二組位元位置提取—第四值;及 基於該第一值及該第四值,將另一音調脈波配置於該 第一激勵信號内。 31. —種編碼一音調脈波之一形狀之方法,該方法包含: 估計一語音信號訊框之一音調週期; 基於該所估計之音調週期,選擇脈波形狀向量之複數 144315.doc 201034001 個表中之一者;及 基於來自該語音信號訊框之至少—音調脈波之資訊, 在脈波形狀向量之該選定之表中選擇一脈波形狀向量,’ 其中脈波形狀向量之該選定之表中之每一脈波形 量的長度等於一第一值,且 其中脈波形狀向量之該複數個表中之另一者中的每一 脈波形狀向量之長度等於一不同於該第一值之第二值。 32. 如請求項31之方法,其中該方法包含產生—包括㈧―指 示該所估計之音調週期之第一值及(B) 一識別該選定之^ 中的該選定之脈波形狀向量之第二值的封包。 33. 如請求項32之方法,其中該第一值將該所估計之音調週 期才s示為一相對於一最小值之偏移。 34. 如請求項31之方法,其中脈波形狀向量之該複數個表中 之每一者與音調週期值之複數個不同範圍中之一對應者 相關聯,且 ~ 其中該選擇脈波形狀向量之複數個表中之一者包括判 定該複數個不㈣圍中之哪-者包括該所估計之音 期。 如凊求項34之方法,其中,在該複數個不同範圍中包 括最長音調週期之範圍比包括最短音調週期之範圍寬。 青求項31之方法,其中該方法包含基於—能量量度自 該語音信號訊框之複數個音調脈波中選擇一音調脈波,且 其中該基於來自至少一音調脈波之資訊選擇一脈波形 狀向量包括在脈波形狀向量之該選定之表中選擇一在能 144315.doc 201034001 量上最接近於該選定之音調脈波之脈波形狀向量。 37.如叫求項31之方法,其中該方法包含: 判定一第二語音信號訊框内之一音調脈波之—位置;及 基於該所判定之位置,選擇脈波形狀向量之第二複數 個表中之一者。 3 8.如请求項37之方法,其中該方法包含判定該第二語音信 號訊框僅包括一音調脈波。 39. —種用於編碼一音調脈波之一形狀之裝置,該裝置包 含: 用於估計一語音信號訊框之一音調週期的構件; 用於基於該所估計之音調週期選擇脈波形狀向量之複 數個表中之一者的構件;及 用於基於來自該語音信號訊框之至少一音調脈波之資 訊在脈波形狀向量之該選定之表巾選擇—脈波形狀向量 的構件, • 其中脈波形狀向量之該選定之表中之每一脈波形狀向 量的長度等於一第一值,且 其中脈波形狀向量之該複數個表中之另一者中的每一 . 脈波形狀向量之長度等於一不同於該第一值之第二值。 • 40.如請求項39之裝置,其中該裝置包含用於產生一包括(a) 一基於該所估計之音調週期之第一值及(B)一識別該選定 之表中的該選定之脈波形狀向量之第二值的封包的構 件。 .如請求項39之裝置,其中脈波形狀向量之該複數個表中 1443I5.doc 201034001 之每一者與音調週期值之複數個不同範圍中之一對應者 相關聯,且 其中用於選擇脈波形狀向量之複數個表中之一者的該 構件經組態以判定該複數個不同範圍中之哪一者包括該 所估計之音調週期。 42. 如請求項39之裝置,其中該裝置包含用於基於一能量量 度自該語音信號訊框之複數個音調脈波中選擇一音調脈 波的構件,且 其中用於基於來自至少一音調脈波之資訊選擇一脈波 形狀向量之該構件經組態以在脈波形狀向量之該選定之 表中選擇一在能量上最接近於該選定之音調脈波之脈波 形狀向量。 43. 如請求項39之裝置,其中該裝置包含: 用於判疋一第一語音信號訊框僅包括一音調脈波的構 件; 用於判疋該第二語音信號訊框内之該一音調脈波之一 位置的構件;及 用於基於該所判定之位置選擇脈波形狀向量之第二複 數個表中之一者的構件。 44·種電腦可讀媒體,其包含在由一處理器執行時使該處 理器進行以下動作之指令: 估。十一s吾音信號訊框之一音調週期; 基於該所估計之音調週期選擇脈波形狀向量之複數個 表中之一者;及 144315.doc 201034001 基於來自該語音信號訊框之至少一音調脈波之資訊在 脈波形狀向量之該選定之表中選擇一脈波形狀向量, 其中脈波形&向量之該選定之表中之每一^皮形狀向 量的長度等於一第一值,且 其中脈波形狀向量之該複數個表中之另一者中的每一 脈波形狀向量之長度等於一不同於該第一值之第二值。 45·如請求項44之電腦可讀媒體,其中該媒體包含使該處理 φ 器產生一包括(A) 一基於該所估計之音調週期之第一值及 (B)—識別該選定之表中的該選定之脈波形狀向量之第二 值的封包的指令。 46.如請求項44之電腦可讀媒體,其中脈波形狀向量之該複 數個表中之每一者與音調週期值之複數個不同範圍中之 一對應者相關聯,且 其中使該處理器選擇脈波形狀向量之複數個表中之一 者的該等指令包括使該處理器判定該複數個不同範圍中 φ 之哪一者包括該所估計之音調週期的指令。 47_如請求項44之電腦可讀媒體,其中該媒體包含使該處理 器基於一能量量度自該語音信號訊框之複數個音調脈波 ' 中選擇一音調脈波的指令,且 - 其中使該處理器基於來自至少一音調脈波之資訊選擇 一脈波形狀向量之該等指令包括使該處理器在脈波形狀 向量之該選定之表中選擇一在能量上最接近於該選定之 音調脈波之脈波形狀向量的指令。 48.如請求項44之電腦可讀媒體,其中該媒體包含在由一處 144315.doc •15- 201034001 理器執行時使該處理器進行以下動作之指令: 判疋一第二語音信號訊框僅包括一音調脈波; 判定該第二語音信號訊框内之該一音調脈波之一位 置;及 基於該所判定之位置選擇脈波形狀向量之第二複數個 表中之一者。 49. 一種用於編碼一音調脈波之一形狀之裝置,該裝置包 含: 一音調週期估計器,其經組態以估計一語音信號訊框 之一音調週期; 一向量表選擇器,其經組態以基於該所估計之音調週 期選擇脈波形狀向量之複數個表中之一者;及 一脈波形狀向量選擇器,其經組態以基於來自該語音 信號訊框之至少一音調脈波之資訊在脈波形狀向量之該 選定之表中選擇一脈波形狀向量, 一脈波形狀向 其中脈波形狀向量之該選定之表中之每 量的長度等於一第一值,且 之另一者中的每一之第二值的封包。 其中脈波形狀向量之該複數個表中之另 脈波形狀向量之長度等於一不同於該第一 51.如請求項49之裝置, 其中脈波形狀向量之該複數個表中 144315.doc -16- 201034001 之母一者與音調週期值之複數個不同範圍中之一對應者 相關聯,且 其中該向量表選擇器經組態以判定該複數個不同範圍 中之哪一者包括該所估計之音調週期。 52. 如請求項49之裝置,其中該裝置包含一音調脈波選擇 '器,其經組態以基於一能量量度自該語音信號訊框之複 數個音調脈波中選擇一音調脈波,且 φ 其中該脈波形狀向量選擇器經組態以在脈波形狀向量 之该選疋之表中選擇一在能量上最接近於該選定之音調 脈波之脈波形狀向量。 53. 如請求項49之裝置,其中該裝置包含: 一音調脈波位置計算器’其經組態以(A)判定—第二 語音信號訊框僅包括一音調脈波且(B)判定該第二語音信 號訊框内之該一音調脈波之一位置;及 一向量表選擇器,其經組態以基於該所判定之位置選 φ 擇脈波形狀向量之第二複數個表中之一者。 54· —種解碼一音調脈波之一形狀之方法,該方法包含: 自一經編碼之語音信號之一第一封包提取一經編碼之 音調週期值; ' » 基於該經編碼之音調週期值,選擇脈波形狀向量之複 數個表中之一者; 自該第—封包提取一第一索引;及 基於該第一索引,自脈波形狀向量之該選定之表獲得 一脈波形狀向量。 144315.doc -17- 201034001 55. 如請求項54之解瑪之方法,其中該方法包含: 自該第-封包提取-第—音調脈波位置指示符;及 基於該第一音調脈波位置指示符,將-基於該脈波形 狀向量之音調脈波配置於一第一激勵信號内。 56. 如請求項55之解碼之方法,其中該方法包含基於該經編 碼之音調週期值相對於該第一音調脈波將一第二音調脈 波配置於該第一激勵信號内, 其中該第二音調脈波係基於該脈波形狀向量。 57. 如請求項55之解碼之方法,其中該方法包含: 自該語音信號之一第二封包提取一第二音調脈波位置 指示符; 基於該第二音調脈波位置指示符,選擇脈波形狀向量 之第二複數個表中之一者; 自該第二封包提取一第二索引; 基於該第二索引,自該第二複數個表中之該選定者獲 得一第二脈波形狀向量;及 基於該第二音調脈波位置指示符,將一基於該第二脈 波形狀向量之音調脈波配置於一第二激勵信號内。 1443I5.doc 1$.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/261,518 US20090319263A1 (en) | 2008-06-20 | 2008-10-30 | Coding of transitional speech frames for low-bit-rate applications |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201034001A true TW201034001A (en) | 2010-09-16 |
Family
ID=41466937
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW098137039A TW201034001A (en) | 2008-10-30 | 2009-10-30 | Coding of transitional speech frames for low-bit-rate applications |
Country Status (6)
Country | Link |
---|---|
US (1) | US20090319263A1 (zh) |
EP (1) | EP2362964A1 (zh) |
JP (1) | JP2012507751A (zh) |
CN (1) | CN102197423A (zh) |
TW (1) | TW201034001A (zh) |
WO (1) | WO2010056526A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI451746B (zh) * | 2011-11-04 | 2014-09-01 | Quanta Comp Inc | 視訊會議系統及視訊會議方法 |
TWI566238B (zh) * | 2013-07-22 | 2017-01-11 | 弗勞恩霍夫爾協會 | 參數化頻率域音源編解碼器及編解碼方法 |
US10002621B2 (en) | 2013-07-22 | 2018-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US12112765B2 (en) | 2015-03-09 | 2024-10-08 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8259840B2 (en) * | 2005-10-24 | 2012-09-04 | General Motors Llc | Data communication via a voice channel of a wireless communication network using discontinuities |
US8768690B2 (en) * | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
US9245529B2 (en) * | 2009-06-18 | 2016-01-26 | Texas Instruments Incorporated | Adaptive encoding of a digital signal with one or more missing values |
MX2012011532A (es) * | 2010-04-09 | 2012-11-16 | Dolby Int Ab | Codificacion a estereo para prediccion de complejos basados en mdct. |
US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
US8862465B2 (en) * | 2010-09-17 | 2014-10-14 | Qualcomm Incorporated | Determining pitch cycle energy and scaling an excitation signal |
CN104025191A (zh) * | 2011-10-18 | 2014-09-03 | 爱立信(中国)通信有限公司 | 用于自适应多速率编解码器的改进方法和设备 |
US9015039B2 (en) * | 2011-12-21 | 2015-04-21 | Huawei Technologies Co., Ltd. | Adaptive encoding pitch lag for voiced speech |
US9043201B2 (en) * | 2012-01-03 | 2015-05-26 | Google Technology Holdings LLC | Method and apparatus for processing audio frames to transition between different codecs |
US9208798B2 (en) * | 2012-04-09 | 2015-12-08 | Board Of Regents, The University Of Texas System | Dynamic control of voice codec data rate |
CN103426441B (zh) | 2012-05-18 | 2016-03-02 | 华为技术有限公司 | 检测基音周期的正确性的方法和装置 |
US9336789B2 (en) | 2013-02-21 | 2016-05-10 | Qualcomm Incorporated | Systems and methods for determining an interpolation factor set for synthesizing a speech signal |
CN104425037B (zh) * | 2013-08-19 | 2019-07-12 | 恩智浦美国有限公司 | 可重配置电路及其解码器 |
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
CN107430850A (zh) * | 2015-02-06 | 2017-12-01 | 弩锋股份有限公司 | 确定谐波信号的特征 |
US9870785B2 (en) * | 2015-02-06 | 2018-01-16 | Knuedge Incorporated | Determining features of harmonic signals |
JP6501259B2 (ja) * | 2015-08-04 | 2019-04-17 | 本田技研工業株式会社 | 音声処理装置及び音声処理方法 |
CN112151045B (zh) * | 2019-06-29 | 2024-06-04 | 华为技术有限公司 | 一种立体声编码方法、立体声解码方法和装置 |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5127053A (en) * | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5765127A (en) * | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
US5884253A (en) * | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
US5704003A (en) * | 1995-09-19 | 1997-12-30 | Lucent Technologies Inc. | RCELP coder |
JPH09185397A (ja) * | 1995-12-28 | 1997-07-15 | Olympus Optical Co Ltd | 音声情報記録装置 |
JP4063911B2 (ja) * | 1996-02-21 | 2008-03-19 | 松下電器産業株式会社 | 音声符号化装置 |
WO1998006091A1 (fr) * | 1996-08-02 | 1998-02-12 | Matsushita Electric Industrial Co., Ltd. | Codec vocal, support sur lequel est enregistre un programme codec vocal, et appareil mobile de telecommunications |
US6073092A (en) * | 1997-06-26 | 2000-06-06 | Telogy Networks, Inc. | Method for speech coding based on a code excited linear prediction (CELP) model |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
US6973424B1 (en) * | 1998-06-30 | 2005-12-06 | Nec Corporation | Voice coder |
US6480822B2 (en) * | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6754630B2 (en) * | 1998-11-13 | 2004-06-22 | Qualcomm, Inc. | Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6311154B1 (en) * | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
US6324505B1 (en) * | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Amplitude quantization scheme for low-bit-rate speech coders |
US7039581B1 (en) * | 1999-09-22 | 2006-05-02 | Texas Instruments Incorporated | Hybrid speed coding and system |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
US7167828B2 (en) * | 2000-01-11 | 2007-01-23 | Matsushita Electric Industrial Co., Ltd. | Multimode speech coding apparatus and decoding apparatus |
EP1796083B1 (en) * | 2000-04-24 | 2009-01-07 | Qualcomm Incorporated | Method and apparatus for predictively quantizing voiced speech |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
US6760698B2 (en) * | 2000-09-15 | 2004-07-06 | Mindspeed Technologies Inc. | System for coding speech information using an adaptive codebook with enhanced variable resolution scheme |
US7363219B2 (en) * | 2000-09-22 | 2008-04-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US6480821B2 (en) * | 2001-01-31 | 2002-11-12 | Motorola, Inc. | Methods and apparatus for reducing noise associated with an electrical speech signal |
JP2003015699A (ja) * | 2001-06-27 | 2003-01-17 | Matsushita Electric Ind Co Ltd | 固定音源符号帳並びにそれを用いた音声符号化装置及び音声復号化装置 |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US7236927B2 (en) * | 2002-02-06 | 2007-06-26 | Broadcom Corporation | Pitch extraction methods and systems for speech coding using interpolation techniques |
US20040002856A1 (en) * | 2002-03-08 | 2004-01-01 | Udaya Bhaskar | Multi-rate frequency domain interpolative speech CODEC system |
US20050228648A1 (en) * | 2002-04-22 | 2005-10-13 | Ari Heikkinen | Method and device for obtaining parameters for parametric speech coding of frames |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7103538B1 (en) * | 2002-06-10 | 2006-09-05 | Mindspeed Technologies, Inc. | Fixed code book with embedded adaptive code book |
WO2004034379A2 (en) * | 2002-10-11 | 2004-04-22 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US7024358B2 (en) * | 2003-03-15 | 2006-04-04 | Mindspeed Technologies, Inc. | Recovering an erased voice frame with time warping |
US7433815B2 (en) * | 2003-09-10 | 2008-10-07 | Dilithium Networks Pty Ltd. | Method and apparatus for voice transcoding between variable rate coders |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
JP4599558B2 (ja) * | 2005-04-22 | 2010-12-15 | 国立大学法人九州工業大学 | ピッチ周期等化装置及びピッチ周期等化方法、並びに音声符号化装置、音声復号装置及び音声符号化方法 |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US20070174047A1 (en) * | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
US8812306B2 (en) * | 2006-07-12 | 2014-08-19 | Panasonic Intellectual Property Corporation Of America | Speech decoding and encoding apparatus for lost frame concealment using predetermined number of waveform samples peripheral to the lost frame |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8260609B2 (en) * | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
BRPI0718300B1 (pt) * | 2006-10-24 | 2018-08-14 | Voiceage Corporation | Método e dispositivo para codificar quadros de transição em sinais de fala. |
US8768690B2 (en) * | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
US20090319261A1 (en) * | 2008-06-20 | 2009-12-24 | Qualcomm Incorporated | Coding of transitional speech frames for low-bit-rate applications |
-
2008
- 2008-10-30 US US12/261,518 patent/US20090319263A1/en not_active Abandoned
-
2009
- 2009-10-28 WO PCT/US2009/062379 patent/WO2010056526A1/en active Application Filing
- 2009-10-28 EP EP09744879A patent/EP2362964A1/en not_active Withdrawn
- 2009-10-28 JP JP2011534713A patent/JP2012507751A/ja active Pending
- 2009-10-28 CN CN2009801431187A patent/CN102197423A/zh active Pending
- 2009-10-30 TW TW098137039A patent/TW201034001A/zh unknown
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI451746B (zh) * | 2011-11-04 | 2014-09-01 | Quanta Comp Inc | 視訊會議系統及視訊會議方法 |
TWI566238B (zh) * | 2013-07-22 | 2017-01-11 | 弗勞恩霍夫爾協會 | 參數化頻率域音源編解碼器及編解碼方法 |
US10002621B2 (en) | 2013-07-22 | 2018-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US10134404B2 (en) | 2013-07-22 | 2018-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
US10147430B2 (en) | 2013-07-22 | 2018-12-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US10311892B2 (en) | 2013-07-22 | 2019-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding audio signal with intelligent gap filling in the spectral domain |
US10332539B2 (en) | 2013-07-22 | 2019-06-25 | Fraunhofer-Gesellscheaft zur Foerderung der angewanften Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US10332531B2 (en) | 2013-07-22 | 2019-06-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band |
US10347274B2 (en) | 2013-07-22 | 2019-07-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US10515652B2 (en) | 2013-07-22 | 2019-12-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency |
US10573334B2 (en) | 2013-07-22 | 2020-02-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
US10593345B2 (en) | 2013-07-22 | 2020-03-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for decoding an encoded audio signal with frequency tile adaption |
US10847167B2 (en) | 2013-07-22 | 2020-11-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
US10984805B2 (en) | 2013-07-22 | 2021-04-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US11049506B2 (en) | 2013-07-22 | 2021-06-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US11222643B2 (en) | 2013-07-22 | 2022-01-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for decoding an encoded audio signal with frequency tile adaption |
US11250862B2 (en) | 2013-07-22 | 2022-02-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band |
US11257505B2 (en) | 2013-07-22 | 2022-02-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
US11289104B2 (en) | 2013-07-22 | 2022-03-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
US11735192B2 (en) | 2013-07-22 | 2023-08-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
US11769512B2 (en) | 2013-07-22 | 2023-09-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
US11769513B2 (en) | 2013-07-22 | 2023-09-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band |
US11922956B2 (en) | 2013-07-22 | 2024-03-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain |
US11996106B2 (en) | 2013-07-22 | 2024-05-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US12112765B2 (en) | 2015-03-09 | 2024-10-08 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Also Published As
Publication number | Publication date |
---|---|
JP2012507751A (ja) | 2012-03-29 |
US20090319263A1 (en) | 2009-12-24 |
WO2010056526A1 (en) | 2010-05-20 |
CN102197423A (zh) | 2011-09-21 |
EP2362964A1 (en) | 2011-09-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201034001A (en) | Coding of transitional speech frames for low-bit-rate applications | |
CN102203855B (zh) | 用于低位速率应用的译码方案选择 | |
TW201007704A (en) | Coding of transitional speech frames for low-bit-rate applications | |
EP2080193B1 (en) | Pitch lag estimation | |
US5060269A (en) | Hybrid switched multi-pulse/stochastic speech coding technique | |
TWI362031B (en) | Methods, apparatus and computer program product for obtaining frames of a decoded speech signal | |
EP1420390B1 (en) | Interoperable speech coding | |
KR100827896B1 (ko) | 프레임 에러에 대한 민감도를 감소시키기 위하여 코딩 방식 선택 패턴을 사용하는 예측 음성 코더 | |
CN1188832C (zh) | 过滤语言帧的多脉冲内插编码 | |
Breuer et al. | An illustrated methodology for analysis of error tolerance | |
Kroon et al. | A high-quality multirate real-time CELP coder | |
JP2008518264A (ja) | 振幅の包絡線を有するパラメトリックオーディオコーディング | |
CN1262991C (zh) | 跟踪准周期性信号的相位的方法和设备 | |
JP2892462B2 (ja) | コード励振線形予測符号化器 | |
Zhu | Error-tolerance in digital speech recording systems | |
Kroon et al. | A low-complexity toll-quality variable bit rate coder for CDMA cellular systems | |
EP3483878A1 (en) | Audio decoder supporting a set of different loss concealment tools | |
RU2344493C2 (ru) | Кодирование звука с различными длительностями кадра кодирования | |
Görtz | On the combination of redundant and zero-redundant channel error detection in CELP speech-coding | |
Katugampala et al. | Integration of harmonic and analysis by synthesis coders | |
Nasr | Modified very low bit rate coder for wireless messaging applications |