TWI358056B - Systems, methods, and apparatus for frequency-doma - Google Patents
Systems, methods, and apparatus for frequency-doma Download PDFInfo
- Publication number
- TWI358056B TWI358056B TW095144864A TW95144864A TWI358056B TW I358056 B TWI358056 B TW I358056B TW 095144864 A TW095144864 A TW 095144864A TW 95144864 A TW95144864 A TW 95144864A TW I358056 B TWI358056 B TW I358056B
- Authority
- TW
- Taiwan
- Prior art keywords
- waveform
- prototype
- phase shift
- periodic
- radians
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 35
- 230000010363 phase shift Effects 0.000 claims description 74
- 230000000737 periodic effect Effects 0.000 claims description 53
- 230000006870 function Effects 0.000 claims description 28
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000001413 cellular effect Effects 0.000 claims description 2
- 230000007774 longterm Effects 0.000 claims description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 claims 1
- 241000282421 Canidae Species 0.000 claims 1
- 229910052791 calcium Inorganic materials 0.000 claims 1
- 239000011575 calcium Substances 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 claims 1
- 208000011580 syndromic disease Diseases 0.000 claims 1
- 230000001052 transient effect Effects 0.000 claims 1
- 230000014509 gene expression Effects 0.000 description 28
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000013139 quantization Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 230000003595 spectral effect Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000010606 normalization Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 235000012431 wafers Nutrition 0.000 description 3
- 238000003491 array Methods 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 241000282994 Cervidae Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000013405 beer Nutrition 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 235000019640 taste Nutrition 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/097—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using prototype waveform decomposition or prototype waveform interpolative [PWI] coders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
- Measuring Frequencies, Analyzing Spectra (AREA)
- Mobile Radio Communication Systems (AREA)
Description
!358056 九、發明說明: 【發明所屬之技術領域】 本揭示案係關於信號處理。 【先前技術】 原型波形編碼方案通常包括一原 m n ^ % w . 、準知作以支援一平 /月展開的波形。可將該對準計算為 τ 項1成頻域中之—糸而丨 交叉相關性。 T工糸列 【發明内容】 -對準兩個週期性語音波形之方 的複數個第-相移中之每一者進 J於在 該相移的複數個角中之每一者 ()估心
^ 二角函數;及(2) J 於、,坐估s十之三角函數,計算第 ,a 丁异弟及第二相關性度量。第一 相關性度量為⑷兩個週期性語音波形 第一沽开彡盘化、 移位了 5亥相移之 第波形與(Β)兩個週期性語音波形中 一相關性之产詈黎 U中之第二波形之間的 波形中移位了超出,範J()兩個週期性語音 週期性語音波形之第1波开,之::之第一波形與⑼兩個 _ /皮开/之間的一相關性之度量。 料經準兩個週期性語音波形之裝置包括,估計 、隹卜〃於對於"'範圍内的複數個第-相移中之每-者 進打如下動作:任 ^, 寸基於該相移的複數個角中之每一者的 ^ 二角函數。兮驻 # δχ裝置亦包括計算構件,其用於對該複 數個第一相移令 母一者進行以下動作:(】)基於角之經估 之二角函教而計曾势,, 故 a / 7 ^第一相關性度量’該等角係基於該相 )基於角之經估計之三角函數而計算第二相關性度
S •I6837.doc 夏,該等角係基於該相蒋。结 „ .. ^ 多第一相關性度量為(A)兩個週 d性語音波形中移位了嗲 μ相移之第一波形與(B)兩個週期 性語音波形中之第二诘形* Ββ Λ g, .. ^ 波形之間的一相關性之度量。第二相 關性度量為(C)兩個週期性& 土 ^ α Λ『生°。音波形中移位了超出該範圍 之一相移之第一波形盘(D) a 〃(D)兩個週期性語音波形中之二 波形之間的一相關性之度量。 經組態以對準兩個週期,Η 哎期拴语音波形之另一裝置包括一三 角函數估計器,苴麯έ能 — /、,、,,,〜' 以對於一範圍内的複數個第一相 移中之每一者進行如下叙 相 •估計基於該相移的複數個角 中之每一者的至少_= m ^ —角函數。該裝置亦包括一計算器, 經組態以對該複數個笛 , ° 从·, 数個第—相移中之每-者進行如下動 作.(1)基於角之經估钟夕_ 旦 A 二角函數而計算第一相關性度 里’該等角係基於該相, _ 砂及(2)基於角之經估計之三 數而計算第二相關性声旦 一 •^里’ δ亥專角係基於該相移。第一 :關性度量為⑷兩個週期性語音波形中移位了該相移: 波形與⑻兩個週期性語音波形中之第二波形之間的 ::目:性之度量。第二相關性度量為(C)兩個週期性語音 波形中移位了超出該範 已图之相移之第一波形與(D)兩個 週期性語音波形中之坌^ ^ V ;啤個 心T之第二波形之間的一相關性之声旦 【實施方式】 又里。 最現行的語音編碼器 預測編碼(LPC)係數及 留部分佔用大量經編碼 減少編碼餘留部分所需 包括使一語音訊框分解為一組線性 —餘留部分之操作。由於蝙碼該餘 之指號流,因此已開發各種方案以 之位元率。 116837.doc 1358056 對於無聲語音段l & 留部分之全)’可以一隨機雜訊替代餘 户节鹿_王1 "。分。對於有聲語音段(諸如元音),餘留 k號顯示出向度週期性豆 ^其忍味至少一些樣本可被内插。
在:旦^用—諸如媽受激線性預測(celp)之編碼技術以 _里速率下編碼—有聲語音段可能無法保持週期性之 程度。 可用於在低位元率下㈣㈣輸有聲語音區段之編碼方 ”包括原型音高週期(ppp)編碼器及原型波形内插(PWI)編 =。此等編碼方案週期性地在餘留信號中定位具有一個 音高週期之長度的原型波形。在解碼器處,在原型之間若 干週期中内插餘留信號以獲取原始高週期性波形之 似。 通常週期性僅在強有聲區段期間為強的,使得對於強度 #义低的有聲或無聲語音才莫式而言可能甚至不存在音高週 "使用Ppp或pwi編碼器編碼一語音信號之所有區段 (匕括非週期性語音區段)可能產生較差的整體效果。一種 解决辦法為對有聲及無聲語音使用不同編碼方案。舉例而 吕,PPP或PWI方案可用於有聲區段且CELP方案可用於無 聲區段。可根據對語音信號中之週期性的量測來實行編碼 方案之間的切換’可使用零交叉或正規化自相關函數計算 該週期性。 另一解決辦法為將PWI方案擴展為波形内插(WI)方案。 在WI編竭方案中,將原型波形(現稱作代表波形或特徵波 形)分解為一平滑展開波形(SEW)及一快速展開波形 116837.doc 1358056 (REW)。SEW模型化與音高相關之分量而REW模型化變化 更快之分量》此兩個波形通f具有極其不同的感知要求且 可被單獨量化。
除非另有明確敍述,否則術語"原型,,及"原型波形"在本 文中用以包括任何週期性語音波形,諸如包括至少一緩慢 展開波形(SEW)之波形。可用於此等波形之其他術語為"特 徵波形"及"代表波形",其有時用以指示可包括sew與 REW之波形。因此,應瞭解’明確構想及於此揭示了本文 中所描述之原理對PPP、PWI&WI編碼方案的應用。
圖1展示編碼一語音訊框之一餘留信號的方法Ml〇〇。一 訊框為—語音信號之區段’其足夠短而使得其長期頻譜特 徵相對穩定。一典型訊框長度為2〇毫秒。任務T1〇〇擷取該 訊框之音高延遲值(或"音高週期”)£。該操作亦稱作"音高 估計"。對於以8 kHz取樣之語音信號而言,該音高延遲值 通常在約20至約120之範圍内(分別對應於4〇〇 1^及67 Hz之 基頻)。 任務T100可包括判定餘留信號中具有最大絕對值之樣本 之間的平均距離。或者,任務T1 〇〇可經組態以判定會最大 化一訊框或窗之自相關的延遲,該窗諸如為候選音高週期 (例如,先前訊框之音高週期)兩倍大的窗。該自相關操作 之結果亦可用以支援對該訊框為有聲還是無聲進行判定。 在某些狀泥下(尤其對於WI編碼方案),任務T100可包括校 驗第Ζ72及L/3個樣本周圍的局部最大值以避免音高雙倍或 三倍增加》可能藉由對具有較高取樣率之信號(例如,對 116837.doc 1358056 以8 kHz至16 kHz重新取樣之信號)實行音高估計而減小音 高的雙倍或三倍增加。 任務T200自餘留訊框中擷取長度^之原型。任務T2〇〇通 常經組態以自訊框之最後的音高週期中擷取原型。可能需 要破保餘留信號之高能量區域不出現在原型的開始或結束 時’因為此種布局可能會導致鄰近原型之間的不連續性。 在一實例中’任務Τ200經組態以擷取原型以使得在原型開 始及結束時之能量之和得以最小化。在另一實例中,任務 Τ200經組態以擷取原型以使得自原型内具有最高量值(亦 即’主峰值)之樣本至該原型任一端的距離不小於一特定 數目之樣本(例如,六個)或ζ之一特定比例(例如,25%)。 亦"Τ肖b組態任務Τ200以在每個訊框中擷取一個以上原 型。在一 WI編碼方案中,例如,可能需要在每個訊框甲擷 取尚達八個或八個以上原型。在該種狀況下,可能亦需要 獲取更頻繁的音高估計。在某些狀況下,在每訊框中實行 音高擁取一次或兩次,且使用諸如線性内插(對於值相近 之音高值)及/或逐步内插(當鄰近音高值之間的差較大時) 之方法將額外音高值(例如,每訊框總共八個值)内插於被 擷取的音高值之間。 —經榻取之原型5通常在時域中表示成長度Z之序列 *51>],其中樣本指數》6[〇,//_1]及1為音高週期。一原型亦 可在頻域中表示成週期z之—週期性信號。使用一離散傅 立葉級數(DFS)表示法,例如,原型J可表示成基頻丨/^之 »白波的和,每一諧波由各別頻譜對或dfs係數 y幻加
Il6837.doc -10- 權: 体君响cos(亨)澤]sinp—丫 Λ 4=0 ; I ζ 力。⑴ ,)表達式中,走為指示基頻之第Α:個諧波之指數,其中原 分中之咕波在自第零個諧波(女=〇,指示DC分量)及第一個 f波(々1,指不基頻)直至第j_z/2」個諧波(々=“/2」,指示原 里中基頻之最高諸波)的範圍中變動。在表達式(1)中,如 夺域表示法申,樣本指數”具有範圍丨)。然而, 表達式(1)之頻域表示法中,《不必為整數值,以使得表 達式(1)可用以在”之分數值下估計s。 方法Ml 〇〇包括計算一組DFS係數之任務丁3〇〇。舉例而 °任務T300可經組態以根據如下表達式計算DFS係數 aW ' b[k]: 〇[^\ = ζ[λ]^ j[wlc〇s
n'-° 1 z ^ (2a) »=。 、L J, (2b) 其中4〇]等於1/L ’ Z[L/2]等於1/邱為偶數),且明否則等 m。 .ftrt達式(1)中,係數紂〇]為冗餘的,因為對於, 為零。係數对〇]亦可被忽略,因為該係數表示原型 之DC分量,其在感觀上為不相關的。因此任務丁3⑼可經 組態以計算在範圍k几LZV2」]之DFS係數且表達式(1)可簡 116837.doc 丄妁8056 化為如下: ai«:Jcos
L 叩卞屋*1
L
… (3) 窩要波形自一原型平滑展開至下一原型。為了支援原 之間的平滑内插,需要對準鄰近原。舉例而言,可能 要將當前訊框之原型與諸如先前訊框之原型的參考2 ,。該對準亦可支援原型之更有效的量化。對於該參考 型:通常需要使用一將可見於解碼器處之經解碼(例如 解量化)的原型。 ’可藉 一原型 又相關 可在時域中或在頻域中實行原型對準。在時域中 由識別時間移位?實行原型料,該時間移位產生 :循核旋轉式時間移位型式之另一原型之最大交 :^axL/inVl(n + X)m〇dL] ::原型。接著可將經識別的移位,應用於 :χ兩個原型之特徵為時間對準的。在該實二 於备别原型移位參考原型,鈇 態以使得替代實例中該操作經 暂代地將時間移位:應用於當前原型。 在頻域”行原型對準1使得胁 而非按時間對準原型。舉例而t 不同長度原型之對準,因 尹可谷易完成3 時間翹曲以將:之二在實行該操作可能⑸ 1之長度迟配於另-原型的。亦可能肩 I16837.doc 丄⑽056 由在頻域中實行對準操作(尤其對於分數 複雜性的減少。 夕)而達成計算 在頻域中,可藉由識別相移〆實行對準操作, 生一原型與相移型式之另一原型之最大交又相關^:
岐j :argmax V m〇n+l [i] + b„ [k]bn+1 [k})c〇s\~^ (5) • (6"[咏”+, W、[紙+I [A])sin〔亨、 其中指示參考原型之抓“系數且〜+ 指=當前原型之DFS係數。對於在對準範圍内之广值二^
Hi值可為分數)重複該交又相關性以判定使原型之"^的 -之值最大之相移”。圖2展示可用以實行表達式(5)之計 异之偽碼列表的一實例。 itt 儘管頻域中之對準計算可產生優於時域中之該計算 在對於每一對待對準之原型,表達式(5)之估計 十算上精深且可在原型編碼系統中代表整體計算任務之 一顯著部分。 < 。、斤要相位取樣率在對準範圍吵内實行表達式(5) 之計算。或者,—PWI編碼器可經組態以應用-遞回方 案’其中以粗解析度但在整個對準範圍内實行第一系列之 移位。在每一遞回級’將所識別之移位提供為下一級的參 數,該參數讀精朴度但在包括所識狀移位之 準^内實行另-系列之移位。遞回在該等系列之移位以 备解析度π成時結束、然而,該方案可能不適合有聲語 U6837.doc
-13- S 音’因為局部相關最大值比全局相關最大值更有可能被發 現。 方法M100經組態以藉由一不同技術實行一有效對準, 儘管明確涵蓋及藉此揭示了亦包括該遞回之方法麵的 其他實施例。根據該技術之一類實施例,任務τ4〇〇計算原 型之間的-對準以使得為單一組經估計之餘弦及正弦值實 行兩個不同相移之交叉相關性^與由表達式(5)描述之操作 相比,可應用該技術以使一原型對準操作之三角函數估計 值之數目減少約一半。 任務Τ400經組態以使用每一組經估計之餘弦及正弦值計 算對準範圍0分<Ζ内兩個不同相移值r之原型交叉相關性 (可能除對應於〇4π弧度之角的集合以外對表達式(5)進 行如下變更,而開始對開發該技術進行一項闡述: (an [^K+1 m + b„ [Λ]όη+1 [A:])cos| argmax {x6{r,Z,-r}:〇s^/2j} 2τά〇ί、 (K [k]an+, [A] - [A;]6n+I [^])sini^ (6) 在表達式(6)中’使r及Z-r之相移的相關性配對。(應瞭 解’ 6亥配對等效於+r與·r之配對相移)。藉由應用如下三角 怪等式’可利用此等經配對相移之餘弦與正弦之間的關 係: cos(w-v) = coswcosv + sinMsinv, sin(w-v) = sinucosv-cosMsinv 0 (7a) (7b)
將此等恆等式與方程式2J5KL:r) =2nk L 2nkr Ύ 結合,且對 116837.doc • 14· 整數a: ,cos(27r^:)=l 且 sin(2TrA:)=0 可建立 cos 2nk(,L~rf ~~I~~, cos 2jjkr\ ~T), (8a) si r2^z^v_sin^ \ L ) 、 L J 〇 (8b) 結果(8a)及(8b)可用以變更表達式(6)如下。對於在估計 1已圍〇Srsl_L/2」内之每一 r值,相同餘弦及正弦值用以計算 如下兩個表達式(9A)及(9B),且產生最大結果之表達式被 確定為: (α ”[坳„+1 ㈢ ,”+丨 _c〇S(亨) (9A) + (K Wan+] [A] - [k]bn+l [A:])sin^|
(«« [*]«n+, [k] + K [k]bn+, [^])cosi -{bn [k]an+x [k] - an [k]bn+} [^])sini^ψ\ V 力。 (9B) 右產生最大結果之表達式為表達式(9 A)中之一者,則广* 破指定為值r。若產生最大結果之表達式為表達式(9Β)中 之一者,則〆被指定為值-r »因此,可見對於表達式(9α_ Β)中之每一"值,該組經估計之餘弦及正弦值用以計算兩 個不同相移值之交叉相關性^=〇或卜1/2之狀況除外,其中 在表達式(9Α)及(9Β)中之相移值相等。)以此方式或類似方 式,任務Τ400經組態以在相移估計範圍〇skLz/2」内(對應 於r=0或fL/2之集合除外)使用每一組經估計之餘弦及正弦 116837.doc •15· 1358056 值來計异對準範圍内兩個不同相移值^之原型交叉相 關性。圖3展示-偽碼列表之_實例,該偽碼列表可由任 務T400之實施例用以實行表達式(9)之計算。 可能需要在對準前對原型實行頻譜加權。舉例而言,可 能需要使用LPC係數再儲存共振峰結構之某些,其^可能 採用共振峰頻率下一定之去加重。在一種此實施例中任
務T400經組態以將當前原型填零至長度2z'經組態以藉由 一具有零纪憶之加權LPC綜合型濾波器(例如,使用當前訊 框之最後子訊框的LPC係數)而遽波該信號,且經組=以藉 由將經濾波信號之第《個樣本添加至第(w+z)個樣本(〇9U) 而獲取長度L之感觀加權原型。
以上交叉相關性最大化表達式(4)、⑴、⑹及⑼假定原 型具有相等長度。在頻域中,不相等長度之兩個原型可藉 由按頻譜截取較長原型及/或藉由對較短原型填零而得以 正規化。在一 WI編碼方案中,一原型的長度可為另一原型 之長度的約兩倍或三倍(例如,由於音高增至兩倍或三 倍)。在該種狀況下,可藉由插入零振幅諧波而週期性2 擴展較短原型。任務T400可經組態以在原型對準前實行一 或多個此等長度正規化操作。 在以上表達式(5)、(6)及(9)中,應注意此等表達式均包 括,對於原型之每一諧波分量,基於原型之DFS係數,使 每一經估計之餘弦與相同因子相乘,且基於原型之1)1^係 數,使每一經估計之正弦與相同因子相乘。可藉由預先計 算此等因子且儲存該等因子(例如,因子&及^)可達成^十 116837.doc 1358056 算複雜性之進一步減少。以此方式,表達式(5)可簡化為如 下:
ιη\ arg max OSr<i i Inkr') „ . (Ιτύο-Λ Xk cos l L ) +y*sinU JJ (10) 圖4展示使用根據表達式(10)之簡化的原型對準任務之偽 碼列表的一實例。 同樣地’預先計算因子&及可用以簡化表達式(9a b) 如下: L#J「V (2咖、、,.(2淑 Σ, ^cos —r- Sin —— (11A)
“1 L \ L ) \ L
Xk cos 2nkr 丁‘ -^sin 2nkr ~L~ (11B) 圖5展示使用該簡化之任務T400實施例之偽碼列表的一 實例。 任務T500經組態以將對應於最大交叉相關性之相移應用 於當前原型。任務T5 00亦可經組態以對該對準的原型實行 一頻譜加權操作(例如,一知覺加權操作)。 任務T600經組態以量化原型(例如,用於有效傳輸及/或 儲存)。該量化可包括功率及形狀之單獨量化之原型的增 益正規化。另外或其他,該量化可包括將DFS係數分解為 振幅及相位向量以便單獨量化及/或子取樣。該正規化及/ 或分解操作可支援更多有效的向量量化,因為所得向量可 與語音信號之其他原型的此等向量更高度地相關。 116837.doc -17· 1358056 在方法Ml00之另一實施例中,任務T4〇〇經組態以對原 型之不同頻帶單獨實行原型對準,以使得可為不同頻帶之 每—者獲取一不同相移。在該種狀況下,任務Τ5〇〇可經組 態以將各個相移在對應頻帶内應用於原型之諧波分量且 任務Τ600可經組態以根據頻帶劃分而子取樣原型之相位向 量(例如,以使得為每一頻帶編碼一相位值)。 在一 WI編碼方案中,可將一濾波器組(例如,包括一高 通濾波器及一低通濾波器)應用於對準之原型以分離SEW 與REW以供進一步處理及/或單獨量化。
圖6展示操作(包括編碼模式選擇)之流程圖,其可由經组 態以處理用於傳輸之語音樣本之語音編碼器的一實例來實 打。在任務400中,該語音編碼器以連續訊框接收一語音 L號之數位樣本。在接收一指定訊框後,語音編碼器進入 任務402纟任務4〇2中,語音編碼器谓測訊框之能量。該 能量為訊框之語音活動的度量。藉由求和數位化語音樣本 振幅之平方且比較所得能量與—臨限值而實行語音债測。 任務402可以基於背景雜訊之變化程度而調適該臨 限值。—例示性可變臨限值語音活動㈣器在美國專利第 5:414,796號等人,於州年5月9曰頒予)中予以描 述…些無聲語音聲音可為極低能量之樣本,其可能被錯 誤地編碼為背景雜訊。& 了減少發生該誤差之可能性,低 能量樣本之頻譜傾斜(例如,第一反射係數)可用以區別益 聲語音與背景雜訊’如上述美國專利第號中所描 述0 116837.doc -18- 在偵測訊框之能量後’語音編碼器進入任務404 ^在任 務404中’語音編碼器判定所偵測之訊框能量是否足以將 訊框分類為含有語音之資m。若所偵測之訊框能量低於一 預疋臨限值位準,則語音編碼器進入任務4〇6。在任務4〇6 中,語音編碼器將訊框編碼為背景雜訊(亦即,無聲)。在 ’’且先、中,以1/8速率或i kbps編碼背景雜訊訊框。若在任 務04中’所彳貞測之訊框能量滿足或超過預定臨限值位 準則將訊框分類為語音且語音編碼器進入任務408。 在任務408中,語音編碼器判定訊框是否為無聲語音。 舉例而s,任務408可經組態以檢查訊框之週期性。週期 陡判足之各種已知方法包括,例如,使用零交叉及使用正 規化自相關函數(NACF)。特定言之,使用零交叉及NACF 以偵測週期性在美國專利第5,91ΐ9ΐ28號(DeJa⑶於i999 年6月8日頒予)及第6,691,〇84號(Manjunath等人,於2〇〇4年 2月10曰頒予)中予以描述。另外,用以區別有聲語音與無 i "吾音之以上方法併入Telec〇mmunicati〇n化心”
Association Interim Standards TIA/EIA IS-127及 ΤΙΑ/ΕΙΛ IS-733中。若在任務4〇8中判定訊框為無聲語音,則語音 編碼器進入任務4】〇。在任務410中,語音編碼器將該訊框 編碼為無聲語音。在一組態中,以四分之—速率或2,6 kbps編碼無聲語音訊框。若在任務4〇8中判定訊框並非為 無聲語音,則語音編碼器進入任務412。 在任務412中’語音編碼器判定該訊框是否為過渡語 音。任務412可經組態以使用此項技術(例如,在美國專利
116837.doc -19· 1358056 第5,911,128號t所描述)中已知之週期性㈣方法。若判 定訊框為過渡語音,則語音編碼器進入任務414。在任務 414中’將訊框編碼為過渡語音(亦即,自無聲語音過渡至 有聲語音)。在-組態中,根據在美國專利第WO·號 (Das等人’於20(Η年7月1〇日頒予)中所描述之多脈衝内插 編碼方法來編碼該過渡語音訊框。一 CELp方案亦可用以 編碼過渡語音訊框〇在另一相能士 隹为,·且態中,以全速率或13.2 kbps 編碼過渡語音訊框。 若在任務412中,語音編碼器判定該訊框並非為過渡語 音,則語音編碼器進入任務416。在任務416中,語音編碼 器將該訊框編碼為有聲語音。在一組態中,可使用本文中 所描述之一 ppp編碼方案或其他原型編碼方案以二分之一 速率(例如,6.2 kbps)或四分之—速率編碼有聲語音訊框。 亦可能使用PPP或其他編碼方案以全速率(例如,在扑 CELP編碼器中13.2 _或8 kbps)編碼有聲語音訊框。然 而,熟習此項技術者應瞭解以二分之一或四分之—速率編 碼有聲訊框允許編碼器藉由利用有聲訊框之穩態特性而保 存有價值的頻寬。此外,不管用以編瑪有聲語音之速率, 而使用來自之前訊框的資訊有利地編碼有聲語音,且因此 有聲s吾音以可預測方式加以編碼。 圖7A展示根據一所揭示之組態的裝置1〇〇的方塊圖,該 組態可用於-語音編碼器、蜂巢式電話或用於語音編碼 及/或通信之其他裝置中。裂置100包括音高延遲拇取器 110,其經組態以擷取訊框之音高延遲值(或"音高週期 116837.doc •20- 1358056 1 °舉例而言’音高延遲擷取器110可經配置以自一線性預 測(LP)分析模組接收一餘留信號,該模組經組態以將一語 音k號之訊框分解為一組Lpc係數及餘留信號。音高延遲 擷取β 110可經組態以對餘留信號實行本文中所描述之任 務Τ100之實施。在一實例中,音高延遲擷取器11〇經組態 以藉由判定餘留信號中具有最大絕對值之樣本之間的平均 ㈣而取音高週期°或者,音高延遲摘取器110可經組 態以判疋最大化一訊框或窗之自相關的延遲,窗諸如為候 選β问週期(例如,先前訊框之音高週期)兩倍大的窗。該 自相關插作之結果亦可用以支援對該訊框為有_還是無聲 進行判定。在某些狀況下(尤其對於WI編碼方案),音高延 遲榻取器11G可經組態以校驗局部最大約m及個樣本 (例如,以避免使音高增至兩倍或三倍卜 ’ 裝置110包括原型操取器12〇,其經組態以自餘留訊框榻 取長度Z之原型(例如,根據本文中所描述之任務τ細的 :實施例)。原型榻取器120通常經組態以自訊框之最後音 间週期擷取原型。在一實例中,原型擷取器m經组鲅以 擷取原型以使得最小化在原型開始及結束時之能量之:。 在另一實例中,原型擷取^顧組態以榻取原型以使得 自原型内具有最高量值(亦即,主峰值)之樣本至原型任一 端的距離不小於-特定數目之樣本(例如,六個⑷之一 特定比例(例如,25%) » 原型摘取器!20亦可經㈣以每訊框掏取一個以上原 i。在- WI編碼方案中,例如,可能需要原型榻取器⑽ Π 6837.doc •21· 1358056 母訊框擷取高達八個或八個以上原型。在該種狀況下,音 高延遲擷取器110可經組態以每訊框擷取一音高延遲值— -欠或兩次’且使用諸如線性内插(對於值接近之音高值)及/ 或逐步内插(當鄰近音高值之間的差較大時)之方法將額外 音高值(例如,每訊框總共八個值)内插於被擷取的音高值 之間。 裝置100包括係數計算器130,其經組態以計算一組頻譜 係數(例如’ DFS係數)。舉例而言,係數計算器13〇可經組 態以根據以上表達式(2a)及(2b)計算對應於基頻1/ζ之諧波 的一組DFS係數。可能需要係數計算器13〇經組態以計算 一對係數、办…,其中每一灸在範圍女e几|^/2_1;内》 裝置100包括一原型對準器140,其經組態以根據本文中 所描述之任務T400之實施例而計算兩個原型(例如,當前 訊框之一原型與先前訊框之一原型)之間的一對準。舉例 而言,原型對準器140可經組態以計算原型之間的一對準 以使得為單一組經估計之餘弦及正弦值實行兩個不同相移 之交叉相關性。 原型對準器140可經組態以使用每一組經估計之餘弦及 正弦值(可能除對應於0或π弧度之角的集合以外)計算對準 ^圍0分<尤内兩個不同相移r之原型交又相關性。舉例而 言,原型對準器140可經組態以在相移估計範圍 内(對應於r=〇或r=Z/2之集合除外)使用每一組經估計之餘 弦及正弦值來計算對準範圍内兩個不同相移值^之原 型交又相關性。原型對準器14〇可經組態以根據圖3及圖5
116837.doc -22- S 1358056 τ之偽喝列表中任-者實行此等掉作。 圖7Β展示原型對準器140之 「 函數估钟哭, 實知例142的方塊圖。三角 山數估彳态Μ4經組態以在— 内對複數個莖估叶乾圍(例如,〇以4"2」) 兮第 目移巾之每—者進行如下動作:估計基於 算器⑷經电……/者的至少-三角函數。計 個廣刑個第—相移中之每—者計算兩 個原1之間的第—乃笛_ As Η月
應於相對於另—_ — 度量。第—㈣性度量對 一 、 移而移位第一相移(例如,r)之原型中的 :°第二相關性度量對應於相移相對於另一相移而移位 超出估計範圍(例如,心仏广)之原型中的一者。比較器 48厶”·且態以在第一及第二相關性度量中識別最大值。 可他需要原型對準器14〇在對準前對原型實行頻譜加 Λ。在-種此實施例中’原型對準器14〇經組態以將當前 原里:真零至長度、經組態以藉由—具有零記憶之加權 LPC “合型遽波器(例如,使用當前訊框之最後子訊框的 LPC係數)而;慮波該信號,且經組態以藉由將經丨慮》皮信號之 第《個樣本添加至第(„+L)個樣本(〇^<ζ)而獲取長度Ζ之感 觀加權原型。原型對準器140亦可經組態以在計算對準前 對原型中之一或多者實行一或多個本文中所描述之長度正 規化操作。 裝置100包括移相器丨50,其經組態以將對應於由原型對 準器140識別之最大交叉相關性之相移應用於當前原型。 移相器1 50亦可經組態以對經對準之原型實行一頻譜加權 操作’諸如一感觀加權操作(例如’藉由將一諸如感觀加 116837.doc -23- 1358056 權濾波器之濾波器應用於經對準之原型)β 裝置100包括原型量化器160,其經組態以量化原型(例 如,用於有效傳輸及/或儲存該量化可包括原型之增益 正規化以用於功率及形狀之單獨量化。另外或其他量 化可包括將DFS係數分解為振幅及相位向量以便單獨^ 化°原型量化器160可經組態以根據如下方法中任何一者 實行振幅及相位量化:每一分量之標量量化、分量組之向 里1化、多·級量化(向f、標#或混合的)、振巾昌及相位成 對或成對分組地結合量化。 在裝置100之另一實施例中,原型對準器14〇經組態以對 原型之不同頻帶單獨實行原型對準,以使得可為不同頻帶 之每一者獲取一不同相移。在該種狀況下,移相器可 、’至組態以將各個相移在對應頻帶内應用於原型之諧波分 量,且原型量化器160可經組態以根據頻帶劃分而子取樣 原型之相位向量(例如,以使得為每一頻帶編碼一相位 值)。子取樣相位及振幅資訊及PPP編碼及解碼之其他態樣 (例如)在美國專利第6,678,649號(Manjunath ,於2004年1月 1 3曰頒予)中予以論述。 對於在WI編碼方案中之使用,裝置j 〇〇可經組態以包括 一濾波器組(例如,包括一高通濾波器及一低通濾波器), 其經配置以自移相器150接收經對準之原型且經配置以分 離SEW與REW以供進一步處理及/或單獨量化。 裝置100之實施例的各種元件可實施為駐存於(例如)相同 曰曰片上或一晶片組中之兩個或兩個以上晶片之中的電子設 116837.doc •24- 1358056 備及/或光學設備’然而亦涵蓋不具有該限制之其他配 置。該裝置之一或多個元件可整體或部分地實施為一或多 組指令’該等指令經配置以在邏輯元件(例如,電晶體、 閉極)之一或多個固定或可程式化陣列上執行,邏輯元件 諸如,微處理器、嵌入式處理器、IP核心、數位信號處理 器、FPGA(場可程式化閘陣列)、ASSP(特殊應用標準產品) 及ASIC(特殊應用積體電路)。
裝置100之一實施例的一或多個元件可能用以實行任務 或執行不直接與裝置之一操作相關之其他組指令,諸如與 嵌入有該裝置之設備或系統之另一操作相關的任務。裝置 ioo之一實施例的一或多個元件亦可能具有共同結構(例 如,用以在不同時間執行對應於不同元件之程式碼部分的 處理器、經執行以在不同時間實行對應於不同元件之任務 的組指令,或在不同時間對不同元件實行操作之電子設 備及/或光學設備的配置)。
提供所述實施例之上述陳述以使任何熟習此項技術者j 夠製造或使用本文中揭示之方法及其他結構。對此等組j 之各種修改為可能的,且本文中所提供之通用原理亦可』 用於其他組態可自本文瞭解,例如,一組態可部分… 體地實施為-硬連線電路,實施為__被製造為—特殊應戶 積體電路之電路組態’或實施為一被载入至非揮發性儲4 器中之_程式,或作為機器可讀碼自資料儲存媒體載7 或載入至該資料儲存媒财之—軟體程式,該碼為可由達 輯兀件之陣列(諸如一微處理器或其他數位信號處理單元 H6837.doc -25- 1358056 執打的指令,儲存媒體 導體記憶體(其可包括(不限 子凡件之陣列,諸如半 記憶體)、ROM(唯讀 L或靜態RAM(隨機存取 口己隐體)及/或(L±t. 0B γν 阻、雙向、聚合或相變記情體/),或鐵電、磁 碟或光碟。術語"軟體,,/ ’,或一碟片媒體,諸如一磁
瑪、機器碼、二進位 原代碼、組合語言 < m巧、W體、宏碼、捭 件之陣列執行之指令的链碼、可由邏輯元 實例之任何組合。 夕個集。或序列,及此等 本文中所揭示之方法中 > 如,在上文列出之…者亦可切實地實施(例 或夕個資料儲存媒體中)為可由一包 括邏Γ件之陣列(例如,-處理器、微處理器、微控: 器或其他有限狀態機)的機器讀取及/或執行之一或多個指 令集合。因此’本揭示案不欲限制上文所示之組態,而是 應符口 .、在本文中以任何方式揭示之原理及新穎特徵相一 致的最廣泛料’該料包括於所巾請之附屬中請專利範 圍中’該申請專利範圍形成為原始揭示内容之一部分。 【圖式簡單說明】 圖1展不根據一組態之方法河100的流程圖。 圖2展示對準兩個週期性語音波形之方法之偽碼列表的 實例。 圖3展示對準任務T400之一實施例之偽碼列表的實例。 圖4展示對準任務之另一實施例之偽碼列表的實例。 圖5展示對準任務T400之另一實施例之偽碼列表的實 例。 116837.doc -26- 1358056 圖6展示一編碼模式選擇方案之圖。 圖7A展示根據一所揭示組態之裴置ι〇〇的方塊圖。 圖7B展示原型對準器14〇之一實施例〗42的方塊圖。 【主要元件符號說明】
110 120 130 140 142 144 146 音高延遲擷取器 原型擷取器 係數計算器 原型對準器 原型對準器實施例 三角函數估計器 計算器 148 比較器 150 移相器 160 原型量化器
116837.doc -27-
Claims (1)
1358056· 第095144864號專利申請案 中文申請專利範圍替換本(99年10月) 十、申請專利範圍: .一種對準兩個週期性語音波形之方法,該方法包含. 將兩個週期性語音波形之一第一者居中於一估計點 基於一相移估計一角之一三角函數之一結果; 該等角係基於該第一相移;及 ⑴使用該三角函數之該結果計算(A)該兩個週期性語 音波形中移位了一第一相移之該第—波形與(B)該兩個: 期性語音波形中之一第二波形之間的一第一相關性度 量;及 (Π)使用該三角函數之該結果計算(c)該兩個週期性語 音波形中移位了 一第二相移的該第一波形與(D)該兩個週 期性語音波形中之該第二波形之間的一第二相關性产 量, 又 其中該第一與第二相移之強度相等而方向相反。 2.如叫求項1之方法,進一步包含藉由對複數個相移執行 計算⑴與(II)產生一第一與第二複數個相關性度量,及 將對應於在已產生之該等第一相關性度量及已產生之 該等第二相關性度量之中所識別之該最大值的該相移應 用於5亥兩個週期性語音波形中之該第一波形。 月长項1之方法’其中該估計一三角函數之一結果包 含估計~餘弦。 4·如π求項1之方法,其中該估計一三角函數之一結果包 含估計一餘弦及一正弦。 长項1之方法,其中該計算一第一相關性度量包括 116837-991027.doc 1358056 計算(E)經估計之餘弦 之複數個和,及 積與(F)經估計之正弦的乘積 其令該計算-第二相關性度量包括▲十曾 計之餘弦的乘積與⑻該等經估m异⑹該等經估 差。 ^之正弦的乘積之複數個 6·如請求項1之方法,其 第-波形係基於—原…兩個週期性語音波形中之該 音⑼之鬼主、波形,該原型波形係擷取自一語 曰U之-第-時間部分之一餘留部分及 其中該兩個週期性語音 m m ^ 什佑 /中之该第二波形係基於一 -波形,该原型波形係擷取自該語音信號之 間部分之一餘留部分。 , 一時 7.如請求項6之方法,立中每 、 —去沾 ,、中该兩個週期性語音波形中之每 —者的一長度等於該語音 時間部分中之至少一者的 -一- 现之該第一時間部分及該第 高週期 立 ,% 别 〇 8.=求之方法,其中對於該第—相移為複數個㈣ :者,該複數個相移中之每—者對應於該第一心 /皮幵y之一不同諧波頻率。 9·如請求項1之方法,其中該第一 筘 相移為在零弧度至π弧名 之&圍内且包括零弧度本身 中之—者。 弧度本身之複數個㈣ 10·如請求項丨之方法,其中該第二 ^ ^ ^ 相移為在π弧度至 fe圍内且不包括π弧度本身及 移中之—者。 弧度本身之设請 η. 一種非短暫電腦可讀取儲存媒體,其以機器可執行心 116837-99l027.doc 12. 12. 一或多個處理器 編碼,該等機器可執行指令經組態以使 執行如請求項1之方法。 其中該方法 如請求項11之非短暫電腦可讀取儲存媒體, 包含: 13. 14. 15. 藉由對複數個相移執行計算⑴與(Π)產生-第一盘第 二複數個相關性度量,及將對應於該等第一相關性度量 及該等第二相關性度量之令所識別之該最大值的該相移 應用於該兩個週期性語音波形中之該第一皮形。 如請求仙之非短暫電腦可讀取儲存媒體,.其中該估計 二角函數之一結果包含估計一餘弦。 如請求項11之非短暫電腦可讀取儲存媒體其中該估計 一二角函數之一結果包含估計—餘弦及一正弦。 如請求項11之非短暫電腦可讀取儲存媒體,其中該計算 一第一相關性度量包括計算(E)經估計之餘弦的乘積與(F) 經估計之正弦的乘積之複數個和,及 其中該計算一第二相關性度量包括計算(G)該等經估 計之餘弦的乘積與(H)該等經估計之正弦的乘積之複數個 差0 16·如請求項Π之非短暫電腦可讀取儲存媒體,其中該兩個 週期性§吾音波形中之該第一波形係基於一原型波形該 原型波形係擷取自一語音信號之一第一時間部分之一餘 留部分,及 其中該兩個週期性語音波形中之該第二波形係基於一 原型波形,該原型波形係擷取自該語音信號之一第二時 116837-99l027.doc 間部分之一餘留部分。 17. 如請求項11之非短暫電腦可讀取儲存媒體其中該兩個 週期性语音波形中之每一者的一長度等於該語音信號之 該第一時間部分及該第二時間部分中之至少一者的一音 向週期。 18. 如請求項π之非短暫電腦可讀取儲存媒體,其中該第一 相移為在零弧度至π弧度之範圍内且包括零弧度本身及兀 弧度本身之複數個相移中之一者。 19. 如請求項11之非短暫電腦可讀取儲存媒體其中該第二 相移為在兀弧度至2π弧度之範圍内且不包括冗弧度本身及 2π弧度本身之複數個相移中之一者。 2〇' -種經組態以對準兩個週期性語音波形之裝置,該裝置 包含: 居中構件,其用於將兩個週期性語音波形之一第一者 居中於一估計點; 估计構件’其用以基於一相移估計一角之一三角函數 之一結果; ;„十算構件’其用於使用該三角函數之該結果計算⑴(Α) 该兩個週期性語音波形中移位了—第一相移之該第一波 形與(Β)該兩個週期性語音波形中之—第二波形之間的一 第相關I·生度量,及⑺使用該三角函數之該結果計算⑹ §玄兩個週期性語音波形中移位了-第二相移的該第-波 形與⑼該兩個週期性語音波形中之該第二波形之間的一 第二相關性度量。 116837-991027.doc •4- 211358.056 如請求項20之裝置,其中該裝置包含產生構件,其用於 使用該計算構件對複數個相移產生n第二複數相 關性度量’及⑴將對應於在已產生之該等第—相關性度 量及已產生之該等第二相關性度量中所識別之一最大值 的該相移應用於該兩個週期性語音波形中之該第一波 形。
22. 如請求項20之裝置’其中該用於估計一三角函數之估計 構件經組態以估計一餘弦。 23. 如請求項20之裝置,其中該用於估計一三角函數之估計 構件經組態以估計一餘弦及一正弦。 24. 如請求項20之裝置,其中該計算構件經組態以計算該第 一相關性度量以包括(E)經估計之餘弦的乘積與(F)經估 5十之正弦的乘積之複數個和,及
其中该s十异構件經組態以對於該複數個第一相移中之 每一者而計算該第二相關性度量以包括(G)該等經估計之 餘弦的乘積與(H)該等經估計之正弦的乘積之複數個差。 25·如請求項20之裝置,其中該裝置包含一用於擷取一原型 波形之擷取構件,其經組態以⑴自一語音信號之一第一 時間部分之一餘留部分擷取一第一原型波形,及(ii)自該 語音信號之一第二時間部分之一餘留部分擷取一第二原 型波形, 其中該兩個週期性語音波形中之該第一波形係基於該 第一原型波形,及 其中該兩個週期性語音波形中之該第二波形係基於該 116837-991027.doc 1358056 第二原型波形。 26. 如請求項25之裝置,其中該兩個週期性語音波形中之每 一者的一長度等於該語音信號之該第一時間部分及該第 二時間部分中之至少一者的一音高週期。 27. 如請求項20之裝置,其中該第一相移為在零弧度至冗弧 度之範圍内且包括零弧度本身及π弧度本身之複數個相 移中之一者。 28. 如請求項20之裝置,其中該第二相移為在冗弧度至以弧 度之範圍内且不包括π弧度本身及2π弧度本身之複數個 相移中之一者。 29. 如請求項25之裳置,其中該第一相移為複數個相移中之 一者,該等相移之每一者對應至該第—原型波形之—不 同諧波頻率。 30_ —種包括如請求項20之裝置的語音編碼器。 31· —種包括如請求項20之裝置的蜂巢式電話。 32. —種經組態以對準兩個週期性語音波形之裝置,該裝置 包含: 一二角函數估計器,其經組態以基於一相移估計—角 之一三角函數之一結果;及 一計算器,其經組態以:(1)使用該三角函數之該結果 計算(Α)該兩個週期性語音波形中移位了一第—相移之节 第一波形與(Β)該兩個週期性語音波形中之一第二波形之 間的一第一相關性度量;及 (2)使用該三角函數之該結果計算(c)該兩個週期性钙 116837-991027.doc * 6 - 1358.056 曰波形中移位了 —第二相移的該第—波形與⑼該兩個週 期性語音波形中之該第二波形之間的一第二相關性产 量。. 又 33. ^請,項32之裝置,其中該計算器藉由對複數個相移執 订冲异⑴及(2)產生—第一及第二複數個相關性度量, 及將對應於在已產生之該等第—相關性度量及已產生之 该等第二相關性纟4中所識別 < —最大值的該第二相移 φ 應用於該兩個週期性語音波形中之該第一波形。 34. 如請求項32之裝置,其中該三角函數估計器經組態以估 計一餘弦。 35..如請求項32之裝置,其中該三角函數估計器經組態以估 計一餘弦及一正弦。 士叫求項32之裝置,其中該計算器經組態以計算該第一 相關性度量以包括(E)經估計之餘弦的乘積與(f)經估計 之正弦的乘積之複數個和,及 • 其中該計算器經組態以對於該複數個第一相移中之每 -者而計算該第二相關性度量以包括(G)該等經估計之餘 弦的乘積與(H)該等經估計之正弦的乘積之複數個差。 3入如請求項32之裝置,其中該裝置包含—原型操取器該 原型掏取H經組態以⑴自-語音信號之—第—時間部分 之-餘留部分榻取-第-原型波形,及(Η)自該語音信號 之一第二時間部分之一餘留部分擷取—第二原型波形, 其中該兩個週期性語音波形中之該第一波形係基於該 第一原型波形,及 116837-99l027.doc 1358056 其中該兩個週期性語音波形中之該第二波形係基於該 第一原型波形。 38.如請求項37之裝置,其中該兩個週期性語音波形中之每 者的長度等於該§#音信號之該第一時間部分及該第 二時間部分中之至少一者的一音高週期。 39.如請求項37之裝置’其令該第一相移為複數個相移中之 一者,該複數個相移之每一者對應至該第一原型波形之 一不同證波頻率。 40.如請求項32之裝置,其中該第一 度之範圍内且包括零弧度本身及 移中之一者。 相移為在零弧度至π弧 π狐度本身之複數個相 41.如請求項32之裝 度之範圍内且不 相移中之一者。 置,其中該第二相移為在π弧度至2π弧 包括π弧度本身及2π弧度本身之複數個 42. -種包括如請求項32之裝置的語音編碼器 43. -種包括如請求項32之裝置的蜂巢式電話 116837-991027.doc 1358056 第095144864號專利申請案 中文圖式替換頁(99年10月)
厂
!丨9丨!£_ οα寸 I 雏a-δί副Μ Γ
νζ_ 00Ϊ S蜾 L 116837-fig-991027.doc
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US74211605P | 2005-12-02 | 2005-12-02 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200802302A TW200802302A (en) | 2008-01-01 |
TWI358056B true TWI358056B (en) | 2012-02-11 |
Family
ID=38609993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW095144864A TWI358056B (en) | 2005-12-02 | 2006-12-01 | Systems, methods, and apparatus for frequency-doma |
Country Status (7)
Country | Link |
---|---|
US (1) | US8145477B2 (zh) |
EP (1) | EP1955320A2 (zh) |
JP (1) | JP4988757B2 (zh) |
KR (1) | KR101019936B1 (zh) |
CN (1) | CN101317218B (zh) |
TW (1) | TWI358056B (zh) |
WO (1) | WO2007120308A2 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101355626B1 (ko) * | 2007-07-20 | 2014-01-27 | 삼성전자주식회사 | 네트워크 제어 장치 |
US8990094B2 (en) * | 2010-09-13 | 2015-03-24 | Qualcomm Incorporated | Coding and decoding a transient frame |
US8862465B2 (en) * | 2010-09-17 | 2014-10-14 | Qualcomm Incorporated | Determining pitch cycle energy and scaling an excitation signal |
EP2634769B1 (en) * | 2012-03-02 | 2018-11-07 | Yamaha Corporation | Sound synthesizing apparatus and sound synthesizing method |
WO2013142951A1 (en) | 2012-03-29 | 2013-10-03 | Litens Automotive Partnership | Tensioner and endless drive arrangement |
US9036734B1 (en) * | 2013-07-22 | 2015-05-19 | Altera Corporation | Methods and apparatus for performing digital predistortion using time domain and frequency domain alignment |
US9569405B2 (en) * | 2014-04-30 | 2017-02-14 | Google Inc. | Generating correlation scores |
WO2016025812A1 (en) * | 2014-08-14 | 2016-02-18 | Rensselaer Polytechnic Institute | Binaurally integrated cross-correlation auto-correlation mechanism |
US10262677B2 (en) * | 2015-09-02 | 2019-04-16 | The University Of Rochester | Systems and methods for removing reverberation from audio signals |
JP7003119B6 (ja) | 2016-09-13 | 2023-08-18 | リテンズ オートモーティヴ パートナーシップ | Vテンショナ及び無端駆動装置 |
CN114429770A (zh) * | 2022-04-06 | 2022-05-03 | 北京普太科技有限公司 | 一种被测设备的声音数据测试方法及装置 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3638004A (en) * | 1968-10-28 | 1972-01-25 | Time Data Corp | Fourier transform computer |
JP2707564B2 (ja) * | 1987-12-14 | 1998-01-28 | 株式会社日立製作所 | 音声符号化方式 |
US5003604A (en) * | 1988-03-14 | 1991-03-26 | Fujitsu Limited | Voice coding apparatus |
CA1328509C (en) * | 1988-03-28 | 1994-04-12 | Tetsu Taguchi | Linear predictive speech analysis-synthesis apparatus |
ES2225321T3 (es) * | 1991-06-11 | 2005-03-16 | Qualcomm Incorporated | Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos. |
US5884253A (en) * | 1992-04-09 | 1999-03-16 | Lucent Technologies, Inc. | Prototype waveform speech coding with interpolation of pitch, pitch-period waveforms, and synthesis filter |
US5517595A (en) * | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
TW271524B (zh) | 1994-08-05 | 1996-03-01 | Qualcomm Inc | |
JPH08320695A (ja) | 1995-05-25 | 1996-12-03 | Nippon Telegr & Teleph Corp <Ntt> | 標準音声信号発生方法およびこの方法を実施する装置 |
JP3436614B2 (ja) | 1995-08-07 | 2003-08-11 | フクダ電子株式会社 | 音声信号変換装置および超音波診断装置 |
WO1998005029A1 (en) * | 1996-07-30 | 1998-02-05 | British Telecommunications Public Limited Company | Speech coding |
US6754630B2 (en) * | 1998-11-13 | 2004-06-22 | Qualcomm, Inc. | Synthesis of speech from pitch prototype waveforms by time-synchronous waveform interpolation |
US6456964B2 (en) * | 1998-12-21 | 2002-09-24 | Qualcomm, Incorporated | Encoding of periodic speech using prototype waveforms |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6260017B1 (en) * | 1999-05-07 | 2001-07-10 | Qualcomm Inc. | Multipulse interpolative coding of transition speech frames |
US6397175B1 (en) * | 1999-07-19 | 2002-05-28 | Qualcomm Incorporated | Method and apparatus for subsampling phase spectrum information |
US6324505B1 (en) * | 1999-07-19 | 2001-11-27 | Qualcomm Incorporated | Amplitude quantization scheme for low-bit-rate speech coders |
US6665638B1 (en) * | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
KR20030005222A (ko) * | 2001-01-10 | 2003-01-17 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 코딩 |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
US20030028887A1 (en) * | 2001-07-02 | 2003-02-06 | Laurent Frouin | Method to control the copying and/or broadcasting of audiovisual signals transmitted to within a home audiovisual network |
US20030074383A1 (en) * | 2001-10-15 | 2003-04-17 | Murphy Charles Douglas | Shared multiplication in signal processing transforms |
US8355907B2 (en) * | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
-
2006
- 2006-12-01 TW TW095144864A patent/TWI358056B/zh active
- 2006-12-01 EP EP06850862A patent/EP1955320A2/en not_active Ceased
- 2006-12-01 KR KR1020087016188A patent/KR101019936B1/ko active IP Right Grant
- 2006-12-01 WO PCT/US2006/061529 patent/WO2007120308A2/en active Application Filing
- 2006-12-01 US US11/566,039 patent/US8145477B2/en active Active
- 2006-12-01 CN CN2006800449175A patent/CN101317218B/zh active Active
- 2006-12-01 JP JP2008543592A patent/JP4988757B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
WO2007120308A3 (en) | 2008-02-07 |
US8145477B2 (en) | 2012-03-27 |
KR20080085007A (ko) | 2008-09-22 |
US20070185708A1 (en) | 2007-08-09 |
CN101317218A (zh) | 2008-12-03 |
CN101317218B (zh) | 2013-01-02 |
TW200802302A (en) | 2008-01-01 |
WO2007120308A2 (en) | 2007-10-25 |
JP2009518666A (ja) | 2009-05-07 |
JP4988757B2 (ja) | 2012-08-01 |
EP1955320A2 (en) | 2008-08-13 |
KR101019936B1 (ko) | 2011-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI358056B (en) | Systems, methods, and apparatus for frequency-doma | |
US9837092B2 (en) | Classification between time-domain coding and frequency domain coding | |
TWI324335B (en) | Methods of signal processing and apparatus for wideband speech coding | |
US6418408B1 (en) | Frequency domain interpolative speech codec system | |
CN102934163B (zh) | 用于宽带语音编码的系统、方法、设备 | |
TWI362031B (en) | Methods, apparatus and computer program product for obtaining frames of a decoded speech signal | |
KR101785885B1 (ko) | 적응적 대역폭 확장 및 그것을 위한 장치 | |
US6691092B1 (en) | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system | |
TW200912897A (en) | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding | |
Sturmel et al. | Informed source separation using iterative reconstruction | |
PT1719116E (pt) | A comutação de acelp para o modo de codificação tcx | |
ES2687249T3 (es) | Decisión no sonora/sonora para el procesamiento de la voz | |
CN106068534B (zh) | 用于信息编码的概念 | |
BR122020015614B1 (pt) | Método e dispositivo para interpolar parâmetros de filtro de predição linear em um quadro de processamento de sinal sonoro atual seguindo um quadro de processamento de sinal sonoro anterior | |
KR20160097232A (ko) | 블라인드 대역폭 확장의 시스템들 및 방법들 | |
JP2017156767A (ja) | 低または中ビットレートに対する知覚品質に基づくオーディオ分類 | |
US9373337B2 (en) | Reconstruction of a high-frequency range in low-bitrate audio coding using predictive pattern analysis | |
WO2000048169A1 (en) | A method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders | |
ES2703565T3 (es) | Aparato, método, programa y soporte de registro de análisis predictivo lineal | |
CN104854656B (zh) | 在自相关域中利用acelp编码语音信号的装置 | |
US9224402B2 (en) | Wideband speech parameterization for high quality synthesis, transformation and quantization | |
US10950251B2 (en) | Coding of harmonic signals in transform-based audio codecs | |
Giacobello | Sparsity in linear predictive coding of speech | |
Kassim et al. | Compressive sensing based low bit rate speech encoder | |
Muin et al. | Performance analysis of IEEE 1857.2 lossless audio compression linear predictor algorithm |