TW473703B - Bi-directional pitch enhancement in speech coding systems - Google Patents
Bi-directional pitch enhancement in speech coding systems Download PDFInfo
- Publication number
- TW473703B TW473703B TW089113106A TW89113106A TW473703B TW 473703 B TW473703 B TW 473703B TW 089113106 A TW089113106 A TW 089113106A TW 89113106 A TW89113106 A TW 89113106A TW 473703 B TW473703 B TW 473703B
- Authority
- TW
- Taiwan
- Prior art keywords
- speech
- reverse
- voice data
- enhancement
- pitch enhancement
- Prior art date
Links
- 238000012545 processing Methods 0.000 claims description 46
- 238000004891 communication Methods 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 29
- 230000005284 excitation Effects 0.000 claims description 19
- 230000002079 cooperative effect Effects 0.000 claims description 9
- 230000001419 dependent effect Effects 0.000 abstract 1
- 238000012805 post-processing Methods 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 9
- 239000013307 optical fiber Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
473703 經濟部智慧財產局員工消費合作社印製 A7 ______B7_ 五、發明説明(1 ) 相關申請案交互参i 本申請案是根據1 999年7月2日提出之美國臨時申請案-- 背景 1.技術領域 廣義而言,本發明與語音寫碼有關,更明確地說,與 使用音調增強以增進再生語音音質的低位元率寫碼系統有 關。 2.相關技術描述 習用的語音寫碼系統,在碼-激勵線性預測語音寫碼系 統中典型上只使用正向音調增強。這大部分是因爲習用語 音編碼解碼器之子框的大小具有較大的可用頻寬,只使用 正向音調增強即可提供足夠的音質。不過,對語音寫碼系 統中所使用之各種低位元率的通信媒體而言,在合成之後 ,再生語音的音質就無法保持高水準的品質。 習用的語音寫碼系統是在低的位元率下操作,音調落 後,亦即在音調預測產生期間,一般遠短於整個子框的大
V 小,即,它在整個子框中涵蓋的部分較小。此特性對說話 音調較高(較短)的人(如女人或小孩)而言更加明顯。當在低 位元率操作時,習用的激勵碼本結構無法產生夠高的音質 。這主要是因爲語音信號的周期性尙未充分建立,或是從 碼本中擷取的激勵向量不足以產生具有高音質的合成語音 裝 訂 線 (請先閱讀背面之注意事現再¥寫本頁) 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -4 - 473703 經濟部智慧財產局員工消費合作社印製 A7 _______B7五、發明説明(2 ) 信號。 當語音寫碼系統的子框變得更大時,通常與低位元率 的通is系統有關’只執行正向的音調增強會使音質極差。 這是因爲缺少很多脈衝致使子框中有大量的無信號區。在 習用以高位元率操作的語音寫碼系統中(因此具有較短的子 框),典型上,人耳並無法聽出此影響。但幾乎所有以較低 可用位元率語音寫碼的語音寫碼系統的音質都較差。 熟悉此方面技術之人士在參考附圖及本申請案以下的 說明之後,經由本發明與習用及傳統系統的比較,即可瞭 解習用系統的其它限制及缺點。 發明槪述 在使用正向音調增強及反向音調增強的語音寫碼系統 中可發現多種本發明的態樣。在本發明的某實施例中,在 整個語音寫碼系統的--個部分執行正向音調增強及反向音 調增強。例如,在具有語音編碼解碼器的語音寫碼系統中 ,其中語音編碼解碼器包括一編碼器及一解碼器,在語音 編碼解碼器的編碼器及解碼器中都執行正向音調增強及反 向音調增強。另者,在本發明的其它實施例中,正向音調 增強及反向音調增強僅在語音編碼解碼器的解碼器中執行 。如特定的應用決定,正向音調增強及反向音調增強以分 配的方式執行,每一種音調增強,至少部分,在語音編碼 解碼器之編碼器或解碼器其中之一上執行。 在本發明的一特定實施例中,反向音調增強是使用正 I---------^------1T------^ (請先閱讀背面之注意事項—寫本頁) 本紙張尺度適用中國國家標準(CNS ) Λ4規格(21 ο X 297公釐) 473703 經 濟 部 智 慧 財 產 局 %, 消 費 合 作 社 印 製 A7 一 ___B7 五、發明説明(3 ) 向音調增強本身產生。反向音調增強是先前所產生之正向 音調增強的鏡像。另者,在本發明的另一實施例中,反向 音調增強的產生與正向音調增強無關;無論先前是否有正 向音調增強產生,反向音調增強都被產生。 按照本發明所構建的語音寫碼系統,適合使用可用帶 寬受到限制之通信媒體的語音寫碼系統。本發明可以使用 任何一種通信系統,都不會偏離本發明的精神與範圍。這 些通信媒體例如包括(但不限於)無線通信媒體、有線電話通 信媒體、光纖通信媒體及乙太網路。 從以下配合附圖對本發明的詳細描述將可明瞭本發明 的其它態樣、優點及創新特徵。 圖式簡單說明 y圖1是說明按照本發明所構建之語音音調增強系統實施 例的系統槪圖。 V圖2是說明使用按照本發明之語音音調增強之分配式語 音編碼解碼器之實施例的系統槪圖。 、圖3是說明使用按照本發明之語音音調增強之分配式語 音編碼解碼器之另一實施例的系統槪圖。 、圖4是說明使用按照本.發明之語音音調增強之整合式語 音編碼解碼器之另一實施例的系統槪圖。 v圖5的槪圖描繪執行本發明之音調增強之正向及反向預 測脈衝的語音子框。 v圖6的功能方塊圖說明按照本發明使用正向語音音調增 I--------^-------訂------# (請先閲讀背面之注意事吼再—本頁) 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -6 - 473703 A7 ______B7 五、發明説明(4 ) 強產生反向語音音調增強的本發明實施例。 (請先閲讀背面之注意事項再¥寫本頁) 、圖7的功能方塊圖說明按照本發明執行與正向語音音調 增強無關之反向語音音調增強的本發明實施例。 元件表 110語音音調增強系統 11 2音調增強處理電路 I 1 4語音寫碼電路 II 6正向音調增強電路 I 1 8反向音調增強電路 II 9語音處理電路 120非增強語音資料或激勵信號 1 30音調增強語音資料或激勵信號 200分配語音編碼解碼器 220語音編碼器 221音調增強寫碼 222反向脈衝音調預測電路 經濟部智慧財產局員工消費合作社印製 223正向脈衝音調預測電路 225主脈衝寫碼 226符號寫碼 227位置寫碼 229語音處理電路 2 1 0通信鏈結 230語音解碼器 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 473703 經濟部智慧財產局員工消費合作社印製 A7 B7五、發明説明(5 ) 232語音再生電路 234音質補償電路 236語音處理電路 300分配式語音編碼解碼器 320語音編碼器 325主脈衝寫碼 326符號寫碼 3 27位置寫碼 329語音處理電路 3 1 0通信鏈結 330語音解碼器 321音調增強寫碼 322反向脈衝音調預測電路 323正向脈衝音調預測電路 3 3 6語音處理電路 3 32語音再生電路 334音質補償電路 420整合式語音編碼解碼器 422語音編碼器 4 10通信鏈結 424語音解碼器 421音調增強寫碼 422反向脈衝音調預測電路 423正向脈衝音調預測電路 ----------装------1T------ii (請先閲讀背面之注意事項f寫本頁) 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -8 - 473703 A7 ____ B7 五、發明説明(6 ) (請先閱讀背面之注意事項再4寫本頁) 510語音子框 5 00寫碼圖 520主脈衝M〇 530正向預測脈衝 540正向預測脈衝M2 550正向預測脈衝Mh 560反向預測脈衝Μ! 570反向預測脈衝Μ2 發明詳細說明 經濟部智慧財產局員工消費合作社印製 圖1是按照本發明所構建之語音音調增強系統11 0之實 施例100的系統圖。語音音調增強系統11〇包括音調增強處 理電路1 1 2、語音寫碼電路1 1 4、正向音調增強電路11 6、反 向音調增強電路11 8、以及語音處理電路119。語音音調增 強系統110對非增強語音資料或激勵信號120操作,並產生 音調增強語音資料1 30。音調增強語音資料或激勵信號1 30 包含的語音資料具有在相對於語音子框之正向及反向執行 的音調預測及音調增強。在本發明的某些實施例中,語音 音調增強系統11 0僅對激勵信號操作,以及,在本發明的其 它實施例中,語音音調增強系統110僅對語音資料操作。 在本發明的某些實施例中,語音音調增強系統110使用 反向音調增強電路1 1 8獨立產生反向音調預測。另者,正向 音調增強電路1 1 6與反向音調增強電路11 8合作產生語音寫 碼系統的整個音調增強。在本發明的萁它實施例中,使用 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) -9 - 4737D3 經濟部智慧財產局員工消費合作社印製 A7 ___B7 五、發明説明(7 ) 音調增強處理電路1 1 2執行監視正向音調增強電路1 1 6及反 向音調增強電路1 1 8的監督控制操作。語音處理電路1 1 9包 括(但不限於)熟悉語音處理技術之人士所熟知之執行語音資 料操作的語音處理電路。語音寫碼電路114同樣也是包括( 但不限於)熟悉語音寫碼技術之人士所熟知的電路。爲熟悉 語音寫碼技術之人士所熟知的語音寫碼方法包括碼-激勵線 性預測、代數碼-激勵線性預測、及脈衝-式激勵。 、圖2是使用按照本發明之語音音調增強的分配式語音編 碼解碼器200實施例的系統槪圖。分配式語音編碼解碼器 200的語音編碼器220執行音調增強寫碼221。音調增強寫碼 22 1是使用反向脈衝音調預測電路222及正向脈衝音調預測 電路223執行。如本發明另一實施例中的描述,音調增強寫 碼22 1在語音;子框中的正及反方向產生音調預測及音調增強 。分配式語音編碼解碼器200的語音編碼器220也執行語音 信號的主脈衝寫碼225,包括在語音子框中的符號寫碼226 及位置寫碼227。在分配式語音編碼解碼器200的語音編碼 器220中也使用語音處理電路229,使用熟悉語音處理技術 之人士所熟知之執行語音資料操作的方法支援語音處理。 此外,在本發明的某些實施例中,語音處理電路229與反向 脈衝音調預測電路222及正向脈衝音調預測電路223合作操 作。經過處理的語音資料,至少某些範圍被分配式語音編 碼解碼器200的語音編碼器220經由通信鏈結2丨0傳送到分配 式語音編碼解碼器200的語音解碼器230。通信鏈結2 10是可 以傳送語音資料的任何通信媒體,包括但不限於無線通信 本紙張尺度適用中國國家標準(CNS ) Λ4規格(210X297公釐) ^10 - 11 I ! — 批衣 n 1111 ^ 111 n 線 (請先閱讀背面之注意事嘎1¾寫本頁) 473703 經濟部智慧財產局員工消費合作社印製 A7 __B7_________五、發明説明(8 ) 媒體、有線電話通信媒體、光纖通信媒體及乙太網路。通 信鏈結2 10包括可以傳送語音資料的任何通信媒體,都不會 偏離本發明的範圍與精神。分配式語音編碼解碼器200的語 音解碼器230包括語音再生電路232、音質補償電路234及語 音處理電路236。 在本發明的某些實施例中,語音處理電路229與語音處 理電路236在整個分配式語音編碼解碼器200中合作操作語 音資料。另者,語音處理電路229與語音處理電路236分別 在語音編碼器220及語音解碼器230中執行各自的語音處理 功能,獨立地操作語音資料。語音處理電路229與語音解碼 器230包括但不限於熟悉語音處理技術之人士所熟知之執行 語音資料操作的語音處理電路。同樣地,主脈衝寫碼電路 225也包括但不限於熟悉此方面技術之人士所熟知之碼-激 勵線性預測、代數碼-激勵線性預測、及脈衝··式激勵方法的 電路,如本發明在其它實施例中的描述。 '/圖3是使用按照本發明之語音音調增強的分配式語音編 碼解碼器300另一實施例的系統槪圖。分配式語音編碼解碼 器300的語音編碼器320執行語音信號的主脈衝寫碼325,包 括在語音子框中的符號寫碼326及位置寫碼327。在分配式 語音編碼解碼器300的語音編碼器320中也使用語音處理電 路329,使用熟悉語音處理技術之人士所熟知之執行語音資 料操作的方法支援語音處理。經過處理的語音資料.,至少 某些範圍被分配式語音編碼解碼器300的語音編碼器320經 由通信鏈結3 1 0傳送到分配式語音編碼解碼器300的語音解 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) =11 - — I I I n I 訂— — —I 線 (請先閲讀背面之注意事項寫本頁) 473703 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明説明(9 ) 碼器330。通信鏈結310是可以傳送語音資料的任何通信媒 體,包括但不限於無線通信媒體、有線電話通信媒體、光 纖通信媒體及乙太網路。通信鏈結3 10包括可以傳送語音資 料的任何通信媒體,都不會偏離本發明的範圍與精神。分 配式語音編碼解碼器300的語音解碼器330執行音調增強寫 碼321。音調增強寫碼321是使用反向脈衝音調預測電路322 及正向脈衝音調預測電路323執行。如以上對本發明之各實 施例的描述,音調增強寫碼32 1在語音子框的正及反方向產 生音調預測與音調增強。在分配式語音編碼解碼器300的語 音解碼器330中也使用語音處理電路336,使用熟悉語音處 理技術之人士所熟知之執行語音資料操作的方法支援語音 處理。另者,在本發明的某些實施例中,語音處理電路329 也與反向脈衝音調預測電路322及正向脈衝音調預測電路 323合作操作。 在本發明的某些實施例中〃語音處理電路329及語音處 理電路336在整個分配式語音編碼解碼器300中合作操作語 音資料。另者,語音處理電路329與語音處理電路3 36分別 在語音編碼器320及語音解碼器330中執行各自的語音處理 功能’獨立地操作語音資料。語音處理電路329與語音解碼 器3 30包括但不限於熟悉語音處理技術之人士所熟知之執行 語音資料操作的語音處理電路。同樣地,主脈衝寫碼電路 325也包括但不限於熟悉此方面技術之人士所熟知之碼-激 勵線性預測、代數碼-激勵線性預測、及脈衝-式激勵方法的 電路’如本發明在其它實施例中的描述。 I---------1------IT------0 (請先閲讀背面之注意事項再#寫本頁) 本纸張尺度適用中國國家標準(CNS ) A4規格(21〇χ297公釐)_ 12 _ 473703 A7 B7 經濟部智慧財產局員工消費合作社印製 五、發明説明(ίο ) 、/圖4是使用按照本發明之語音音調增強的整合式語音編 碼解碼器420另一實施例400。整合式語音編碼解碼器420包 括語音編碼器422,經由低位元率的通信鏈結4 10與語音解 碼器424通信。低位元率的通信鏈結4 10是可以傳送語音資 料的任何通信媒體,包括但不限於無線通信媒體、有線電 話通信媒體、光纖通信媒體及乙太網路。低位元率的通信 鏈結410包括可以傳送語音資料的任何通信媒體,都不會偏 離本發明的範圍與精神。音調增強寫碼421是在整合式語音 編碼解碼器420中執行。音調增強寫碼421是使用反向脈衝 音調預測電路422及正向脈衝音調預測電路423執行。如以 上對本發明之各實施例的描述,在本發明的某些實施例中 ,反向脈衝音調預測電路422及正向脈衝音調預測電路423 合作操作,在本發明的其它實施例中則是獨立操作。 如實施例400所示,反向脈衝音調預測電路422及正向 脈衝音調預測電路423包含在整個整合式語音編碼解碼器 420中。如有需要,在本發明的某些實施例中,在語音編碼 器422及語音解碼器424每一個中都可包含反向脈衝音調預 測電路422及正向脈衝音調預測電路423。另者,在本發明 的另一實施例中,反向脈衝音調預測電路422或正向脈衝音 調預測電路423其中之一可包含在語音編碼器422或語音解 碼器424其中之一。視特定用途而定,使用者可以選擇將反 向脈衝音調預測電路422及正向脈衝音調預測電路423只放 在語音編碼器422或語音解碼器424其中之一或兩者之中。 在本發明中可以擬想各種實施例,無論是將不同量的反向 ----------裝---- (請先閱讀背面之注意事項再<寫本頁)
,1T 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) · 13 - 473703 經濟部智慧財產局員工消費合作社印製 A7 __B7五、發明説明(11 ) 脈衝音調預測電路422及正向脈衝音調預測電路423放入語 音編碼器422或語音解碼器424中,都不會偏離本發明的精 神與範圍。例如,在本發明的某些實施例中,將反向脈衝 音調預測電路422中的既定部分放入語音編碼器422,並將 反向脈衝音調預測電路422的其餘部分放入語音解碼器424 中。同樣地,在本發明的某些實施例中,將正向脈衝音調 預測電路423中的既定部分放入語音編碼器422,並將正向 脈衝音調預測電路423的其餘部分放入語音解碼器424中。 痛5是一說明語音子框5 10的寫碼圖500,描繪按照本發 明執行的正向音調增強及反向音調增強。使用熟悉語音處 理技術之人士所熟知的任何方法,包括但不限於碼-激勵線 性預測、代數碼·激勵線性預測、合成語音寫碼分析、及脈 衝-式激勵,在語音子框510中產生主脈衝M〇 520。使用各種 語音處理方法,包括上述本發明各種實施例中所使用的方 法,產生正向預測脈衝Ml· 530、正向預測脈衝M2 540、正向 預測脈衝M3 5 50,並放入語音子框510。如前所述,正向預 測脈衝Μ! 5 30、正向預測脈衝M2 5 40、正向預測脈衝Mb 5 50 是使用本發明某些實施例中的各種處理電路產生。此外, 反向預測脈衝Μ! 560及反向預測脈衝M2 570也是按照本發明 產生。 在本發明的某些實施例中,反向預測脈衝Ml 560及反 向預測脈衝M2 5 7 0是使用正向預測脈衝530、正向預測脈 衝“2 540及正向預測脈衝M3 550產生。另者,在本發明的其 它實施例中,反向預測脈衝560及反向預測脈衝M2 570的 I---------^-------1T------線 (請先閲讀背面之注意事項再/'<寫本頁) 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -14 - 473703 A7 B7 五、發明説明(12 ) 產生與正向預測脈衝Μι 530、正向預測脈衝m2 540及正向預 測脈衝550無關。獨立產生反向預測脈衝M, 560芦反向預 測脈衝M2 5 70的例子是在軟體中實施,其中語音子框5 1 〇的 時間刻度保留在軟體中。正向預測脈衝Ml 530、正向預測 脈衝M2 540、正向預測脈衝M3 550、反向預測脈衝560及 反向預測脈衝Μι 570都是使用與產生主脈衝μ。520相同的方 法產生。那就是說,該方法執行一次典型的正向,之後, 語音子框5 1 0在軟體中反轉,該方法再執行一次典型的反向 ’但都使用相同的數學方法,即,僅是資料相對於語音子 框510反轉。 V圖6說明本發明之實施例600的功能方塊圖,它按照本 發明使用正向語音音調增強產生反向語音音調增強。在方 塊6 10處理一語音信號。在方塊620語音資料的主脈衝被寫 碼。在另一方法的方塊655中,語音資料經由通信鏈結傳送 。在使用另一方法方塊655的本發明實施例中,其中,在寫 碼的語音資料被傳送後才執行正向音諷增強與反向音調增 強供語音再生。在方塊630中執行正向音調增強,在方塊 640中執行反向音調增強。在本發明的某些實施例中,方塊 640的反向音調增強是方塊630中所產生之正向音調增強的 鏡像。在其它實施例中,方塊640的反向音調增強不是方塊 630中所產生之正向音調增強的鏡像。在另一方法的方塊 650中,語音資料經由通信鏈結傳送。在使用另一方法方塊 650的本發明實施例中,其中,在供語音再生的寫碼語音資 料被傳送之前,先執行正向音調增強及反向音調增強。在 本紙張尺度適用中國國家標準(CNS ) Α4規格(210X297公釐) -15 - I---------^—— (請先閲讀背面之注意事項再1寫本頁)
,1T 經濟部智慧財產局員工消費合作社印製 473703 經濟部智慧財產局員工消費合作社印製 A7 _______ B7五、發明説明) 方塊660中,語音信號被重建/合成。 在本發明的某些實施例中,在方塊640中所執行的反向 音調增強僅是單純地複製方塊630中所執行的正向音調增強 ’即方塊640的反向音調增強是方塊630所產生之正向音調 增強的鏡像。例如,在方塊63 0執行完正向音調增強之後, 僅單純地複製所得到的音調增強,並在語音子框中反轉, 以在方塊640中產生反向音調增強,使用熟悉語音處理技術 之人士所熟知的任何方法合成及再生語音信號。 7說明本發明之實施例700的功能方塊圖,它按照本 發明執行與正向語音音調增強無關的反向語音音調增強。 在方塊7 10處理一語音信號。在方塊720,語音資料的主脈 衝被寫碼。在另一方法的方塊755中,語音資料經由通信鏈 結傳送。在使用另一方法方塊755的本發明實施例中,其中 ,在寫碼的語音資料被傳送後才執行正向音調增強與反向 音調增強供語音再生。在方塊730中執行正向音調增強,在 方塊740中執行反向音調增強。方塊740的反向音調增強是 在語音資料被反轉後執行;方塊740所執行的反向音調增強 與方塊730所執行的正向音調增強無關。此特定實施例與實 施例600不同,語音資料被反轉以及在方塊740產生的反向 音調增強,如同是處理一組全新的語音資料。反之,在實 施例600中,是使用所得到的音調增強本身,但它是在反方 向延伸。在實施例700的特定實施例中,它如同是爲每一個 子框處理兩組語音資料;一組資料在方塊730被處理以在正 方向產生音調預測,以及一組資料在方塊740被處理以在反 本纸張尺度適用中國國家標準( CNS ) A4規格(210X297公釐) -16 -—'" I I 訂-~ I I 線 (請先閲讀背面之注意事項再^C本頁) 473703 A 7 ____ B7_ 五、發明説明(14 ) 方向產生音調預測,且它們都是在同一個語音資料的子框 中操作。在另一方法的方塊750中,語音資料的資訊經由通 信鏈結傳送。在使用另一方法方塊750的本發明實施例中, 其中,在供語音再生的寫碼語音資料被傳送之前,先執行 方塊730的正向音調增強及方塊740的反向音調增強。在方 塊760中,語音信號被重建/合成。 由於以上對本發明的詳細描述及相關的圖示,熟悉此 .方面技術之人士應可瞭解其它的修改及變化。須瞭解,這 類的修改及變化也都有效果,不會偏離本發明的精神與範 圍。 I I I I II ^ I n I 線 (請先閱讀背面之注意事嗔再4寫本頁) 經濟部智慧財產局員工消費合作社印製 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) -17 -
Claims (1)
- 473703 A8 B8 C8 D8 六、申請專利範圍 一種語音編碼解碼器,對語音資料執行音調增強, 該語音編碼解碼器包括: 一編碼器; 一通信鏈結,與編碼器耦合通信; 一解碼器,經由通信鏈結與編碼器耦合通信; 一正向音調增強電路,包含在語音編碼解碼器中,正 向音調增強電路增進再生之語音資料的音質;以及 一反向音調增強電路,包含在語音編碼解碼器中’反 向音調增強電路增進再生之語音資料的音質。 v2.如申請專利範圍第1項的語音編碼解碼器,其中的反 向音調增強電路包含在語音編碼解碼器的解碼器中。 、3.如申請專利範圍第1項的語音編碼解碼器,其中的反 向音調增強電路分配在語音編碼解碼器的編碼器與解碼器 中〇 4.如申請專利範圍第1項的語音編碼解碼器,其中的正 向音調增強電路與反向音調增強電路共同操作以增進再生 之語音資料的音質。 ·如申請專利範圍第1項的語音編碼解碼器,其中的正 向音調增強電路與反向音調增強電路各自獨立操作以增進 再生之語音資料的音質。 ,6 ·如申請專利範圍第1項的語音編碼解碼器,其中的反 向音調增強電路在語音子框上操作;以及 反向音調增強電路將至少一個反向預測脈衝放到5吾曰 子框內。 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公釐) -18 - (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 · 1 n n I- I 1 1^OJ· n n n n ϋ n ϋ I I .1 I β·· I I - 473703 A8 B8 C8 D8 六、申請專利範圍 、7.—種在語音資料上操作的語音音調增強系統,語音 音調增強系統包括: 一反向音調增強電路,它增進再生之語音資料的音質 ;以及 一語音處理電路,與反向音調增強電路耦合通信,語 音處理電路執行語音資料的操作。 1如申請專利範圍第7項的語音音調增強系統,進一步 包括一正向音調增強電路,與反向音調增強電路耦合通信 ,正向音調增強電路增進再生之語音資料的音質。 #·如申請專利範圍第8項的語音音調增強系統,其中的 正向音調增強電路與反向音調增強電路共同操作以增進再 生之語音資料的音質。 L0.如申請專利範圍第8項的語音音調增強系統,其中的 正向音調增強電路與反向音調增強電路各自獨立操作以增 進再生之語音資料的音質。 4 1.如申請專利範圍第7項的語音音調增強系統,進一步 包括語音編碼解碼器,語音編碼解碼器包括一編碼器與一 解碼器;以及 其中的反向音調增強電路包含在編碼器或解碼器至少 其中之一。 'i 2.如申請專利範圍第7項的語音音調增強系統,進一步 包括語音編碼解碼器,語音編碼解碼器包括一編碼器與一 解碼器;以及 其中的反向音調增強電路分配在編碼器或解碼器之間 本紙張尺度適用中國國家標準(CNS)A4規格(210 x 297公釐) -19 - (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 · I n n I I H ϋ 一,口,· ϋ H — — —— — — I < 473703 A8 B8 C8 D8 "- 六、申請專利範圍 〇 J 3.如申請專利範圍第7項的語音音調增強系統,進一步 包括語音編碼解碼器,語音編碼解碼器包括一編碼器、一 解碼器以及一通信鏈結,通信鏈結通信地耦合編碼器與解 碼器;以及 其中的反向音調增強電路分配在編碼器與解碼器內; 語音資料包括第一部分的語音資料與第二部分的語音 資料; 第一部分語音資料的音質在編碼器中使用反向音調增 強電路增進; 語音資料的第一部分與語音資料的第二部分經由通信 鏈結從編碼器傳送到解碼器;以及 第二部分語音資料的音質在解碼器中使用反向音調增 強電路增進。 14.如申請專利範圍第7項的語音音調增強系統,其中的 語音音調增強系統使用碼-激勵線性預測。 L5·如申請專利範圍第7項的語音音調增強系統,其中的 反向音調增強電路在語音子框上操作;以及 反向音調增強電路在語音子框中至少放入一個反向預 測脈衝。 vi 6·—種對語音資料及激勵信號至少其中之一執行語音 音調增強的方法,方法包括: 對語音資料及激勵信號至少其中之一執行正向音調增 強;以及 (請先閱讀背面之注意事項再填寫本頁) 經濟部智慧財產局員工消費合作社印製 -------I ^--------I I , -------------I--I------- 本紙張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) -20- 4737D3 A8 B8 C8 D8 六、申請專利範圍 對語音資料及激勵信號至少其中之一執行反向音調增 強。 1/7.如申請專利範圍第16項的方法,其中對語音資料及 激勵信號至少其中之一執行正向音調增強以及對語音資料 及激勵信號至少其中之一執行反向音調增強兩者是相互獨 立地執行,用以增進再生之語音資料的音質。 1/8 .如申請專利範圍第16項的方法,其中對語音資料及 激勵信號至少其中之一執行正向音調增強以及對語音資料 及激勵信號至少其中之一執行反向音調增強兩者是相互合 作地執行,用以增進再生之語音資料的音質。 1ν9 ·如申請專利範圍第1 6項的方法,其中對語音資料及 激勵信號至少其中之一執行正向音調增強以及對語音資料 及激勵信號至少其中之一執行反向音調增強是使用語音編 碼解碼器執行。 加.如申請專利範圍第1 6項的方法,進一步包括執行碼 激勵線性預測。 i請先閱讀背面之注意事項再填寫本頁} 經濟部智慧財產局員工消費合作社印製 -I n I n n n n n ϋ I n n n n I n n n n n - 本纸張尺度適用中國國家標準(CNS)A4規格(210 X 297公釐) _ 21 -
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14209299P | 1999-07-02 | 1999-07-02 | |
US09/365,444 US6704701B1 (en) | 1999-07-02 | 1999-08-02 | Bi-directional pitch enhancement in speech coding systems |
Publications (1)
Publication Number | Publication Date |
---|---|
TW473703B true TW473703B (en) | 2002-01-21 |
Family
ID=26839756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW089113106A TW473703B (en) | 1999-07-02 | 2000-07-01 | Bi-directional pitch enhancement in speech coding systems |
Country Status (7)
Country | Link |
---|---|
US (1) | US6704701B1 (zh) |
EP (1) | EP1194925B1 (zh) |
JP (2) | JP4629937B2 (zh) |
CN (1) | CN1186766C (zh) |
DE (1) | DE60014904T2 (zh) |
TW (1) | TW473703B (zh) |
WO (1) | WO2001003125A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100841096B1 (ko) * | 2002-10-14 | 2008-06-25 | 리얼네트웍스아시아퍼시픽 주식회사 | 음성 코덱에 대한 디지털 오디오 신호의 전처리 방법 |
KR100754439B1 (ko) | 2003-01-09 | 2007-08-31 | 와이더댄 주식회사 | 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법 |
WO2006121101A1 (ja) * | 2005-05-13 | 2006-11-16 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置およびスペクトル変形方法 |
CN101266797B (zh) * | 2007-03-16 | 2011-06-01 | 展讯通信(上海)有限公司 | 语音信号后处理滤波方法 |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
US9620134B2 (en) | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10614816B2 (en) | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
US10163447B2 (en) | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
CN109767781A (zh) * | 2019-03-06 | 2019-05-17 | 哈尔滨工业大学(深圳) | 基于超高斯先验语音模型与深度学习的语音分离方法、系统及存储介质 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0291699A (ja) * | 1988-09-28 | 1990-03-30 | Nec Corp | 音声符号化復号化方式 |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
CA2108623A1 (en) * | 1992-11-02 | 1994-05-03 | Yi-Sheng Wang | Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop |
CA2124713C (en) * | 1993-06-18 | 1998-09-22 | Willem Bastiaan Kleijn | Long term predictor |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
WO1997027578A1 (en) * | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
JP2940464B2 (ja) * | 1996-03-27 | 1999-08-25 | 日本電気株式会社 | 音声復号化装置 |
US6161086A (en) * | 1997-07-29 | 2000-12-12 | Texas Instruments Incorporated | Low-complexity speech coding with backward and inverse filtered target matching and a tree structured mutitap adaptive codebook search |
JPH11184500A (ja) * | 1997-12-24 | 1999-07-09 | Fujitsu Ltd | 音声符号化方式及び音声復号化方式 |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
US6240386B1 (en) * | 1998-08-24 | 2001-05-29 | Conexant Systems, Inc. | Speech codec employing noise classification for noise compensation |
US6556966B1 (en) * | 1998-08-24 | 2003-04-29 | Conexant Systems, Inc. | Codebook structure for changeable pulse multimode speech coding |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6574593B1 (en) * | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
US6581032B1 (en) * | 1999-09-22 | 2003-06-17 | Conexant Systems, Inc. | Bitstream protocol for transmission of encoded voice signals |
-
1999
- 1999-08-02 US US09/365,444 patent/US6704701B1/en not_active Expired - Lifetime
-
2000
- 2000-06-30 CN CNB008099723A patent/CN1186766C/zh not_active Expired - Fee Related
- 2000-06-30 JP JP2001508443A patent/JP4629937B2/ja not_active Expired - Lifetime
- 2000-06-30 WO PCT/US2000/018232 patent/WO2001003125A1/en active IP Right Grant
- 2000-06-30 EP EP00943365A patent/EP1194925B1/en not_active Expired - Lifetime
- 2000-06-30 DE DE60014904T patent/DE60014904T2/de not_active Expired - Lifetime
- 2000-07-01 TW TW089113106A patent/TW473703B/zh not_active IP Right Cessation
-
2010
- 2010-10-12 JP JP2010230113A patent/JP2011048387A/ja not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP1194925B1 (en) | 2004-10-13 |
CN1186766C (zh) | 2005-01-26 |
WO2001003125B1 (en) | 2001-02-08 |
JP2003504655A (ja) | 2003-02-04 |
JP2011048387A (ja) | 2011-03-10 |
JP4629937B2 (ja) | 2011-02-09 |
CN1360716A (zh) | 2002-07-24 |
DE60014904D1 (de) | 2004-11-18 |
DE60014904T2 (de) | 2005-12-22 |
EP1194925A1 (en) | 2002-04-10 |
WO2001003125A1 (en) | 2001-01-11 |
US6704701B1 (en) | 2004-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW473703B (en) | Bi-directional pitch enhancement in speech coding systems | |
JP5203930B2 (ja) | 高帯域時間軸伸縮を行うシステム、方法、および装置 | |
EP1160771A1 (en) | Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals | |
KR950035132A (ko) | 인간의 음성을 나타내는 신호를 합상하는 방법 | |
CN101136201A (zh) | 对音频信号中认为丢失的一部分进行替换的系统及方法 | |
KR102208915B1 (ko) | 음성 복호 장치, 음성 부호화 장치, 음성 복호 방법, 음성 부호화 방법, 음성 복호 프로그램, 및 음성 부호화 프로그램 | |
CN101494055A (zh) | 用于码分多址无线系统的方法和装置 | |
TW463143B (en) | Low-bit rate speech encoding method | |
JPH0730496A (ja) | 音声信号復号化装置 | |
TW521265B (en) | Relative pulse position in CELP vocoding | |
TW550540B (en) | Methods and systems for CELP-based speech coding with fine grain scalability | |
TW444437B (en) | A variable encoding rate puncturer | |
JPS6262399A (ja) | 音声高能率符号化方式 | |
Annadana et al. | New Results in Low Bit Rate Speech Coding and Bandwidth Extension | |
JP3451998B2 (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
JP2009271315A (ja) | 音声二次元コードから音声を再生可能な携帯電話機および音声二次元コードを含む二次元コードが表示された印刷物 | |
US7133823B2 (en) | System for an adaptive excitation pattern for speech coding | |
KR100468960B1 (ko) | 음성부호화 시스템의 양방향 피치 강화 시스템 | |
JP3308783B2 (ja) | 音声復号化装置 | |
JP6872056B2 (ja) | 音声復号装置および音声復号方法 | |
JPH0411040B2 (zh) | ||
JP3475958B2 (ja) | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 | |
JP2624972B2 (ja) | 音声合成システム | |
JP2001034297A (ja) | 符号化音声データ変換装置及びその逆変換装置並びに符号化音声データ変換プログラムを記録した媒体及びその逆変換プログラムを記録した媒体 | |
JPS60232600A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GD4A | Issue of patent certificate for granted invention patent | ||
MM4A | Annulment or lapse of patent due to non-payment of fees |