JPH10247098A - 可変レート音声符号化方法、可変レート音声復号化方法 - Google Patents

可変レート音声符号化方法、可変レート音声復号化方法

Info

Publication number
JPH10247098A
JPH10247098A JP9049364A JP4936497A JPH10247098A JP H10247098 A JPH10247098 A JP H10247098A JP 9049364 A JP9049364 A JP 9049364A JP 4936497 A JP4936497 A JP 4936497A JP H10247098 A JPH10247098 A JP H10247098A
Authority
JP
Japan
Prior art keywords
signal
excitation
noise
synthesized
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9049364A
Other languages
English (en)
Inventor
Fumihiro Matsuoka
文啓 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP9049364A priority Critical patent/JPH10247098A/ja
Priority to TW086111418A priority patent/TW403891B/zh
Priority to CA002218118A priority patent/CA2218118C/en
Priority to AU40013/97A priority patent/AU689413B1/en
Priority to KR1019970052792A priority patent/KR100276035B1/ko
Priority to US08/953,437 priority patent/US5875423A/en
Priority to EP97118865A priority patent/EP0863500A3/en
Priority to CN97125590A priority patent/CN1192563A/zh
Publication of JPH10247098A publication Critical patent/JPH10247098A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Abstract

(57)【要約】 【課題】 可変レート音声符号化方法において、適応音
源符号帳インデックスのみの伝送を行う入力音声状態に
おいても、符号化効率を一切劣化させずに音質を改善す
る。 【解決手段】 CELP音声符号化方式の可変レート音
声符号化方法において、入力音声信号に対して歪みが最
小となる第1の合成音声信号を得られるように、音源符
号帳及び雑音音源符号帳より適応音源ベクトル及び第1
の雑音音源ベクトルを選択し、その適応音源ベクトルを
用いて生成される音源信号を用いて仮想的な参照音声信
号を作成し、仮想的な参照音声信号に対して歪みが最小
となる第2の合成音声信号を得られるように、適応音源
ベクトルに対応する第2の雑音音源ベクトルを選択し、
第2の合成音声信号の品質に応じて、第1の雑音音源ベ
クトルに対応する雑音音源符号帳インデックスの送出を
取り止める。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声情報の伝送・
蓄積に用いられる音声符号化方式のうち、可変レート伝
送が比較的容易なCDMA(Code Division Multiple A
ccess )方式を回線多重化方式として用いる無線通信
系、ATM(Asyncronous Transfer Mode )交換を利用
する無線・有線通信系、または音声の蓄積用途などに用
いられる可変レート音声符号化及び復号化方法のうち、
CELP(Code Excited Linear Prediction)音声符号
化方式を基本アルゴリズムにもち音源情報パラメータの
伝送/非伝送を制御して符号化率を可変する可変レート
音声符号化及び可変レート復号化方法に関するものであ
る。
【0002】
【従来の技術】CELP音声符号化方式を基本方式にも
つ従来の可変レート音声符号化方法のうち、音源信号の
伝送/非伝送を処理フレーム単位に判定し、可変レート
化するものとして、特開平7−36495号公報に開示
された可変レート音声符号化装置の方法がある。図9は
その従来の可変レート音声符号化方法の処理フレーム単
位の処理手順を示す。この符号化処理は、処理フレーム
単位に分割された音声信号の入力に対して、順次同一の
処理として実行される。すなわち、今前の処理フレーム
の符号化処理が終了したとすると、次の処理フレームの
音声信号が入力され、ステップSP1から符号化処理が
開始される。まず線形予測分析ステップSP2において
は、音声信号の線形予測分析が行われ、当該処理フレー
ムの音声信号が、スペクトル情報を表す線形予測パラメ
ータとして抽出される。なおこの線形予測パラメータ
は、別途符号化され送出される。
【0003】続いて、音源符号帳探索ステップSP3に
おいて、当該処理フレームにおける入力音声信号に対し
て、歪みが最小となるような合成音声信号を得られるよ
うに、適応音源ベクトル及び雑音音源ベクトルを選択す
る。この処理は過去の駆動音源ベクトルを記憶してお
り、適応音源符号帳及び雑音音源符号帳との出力の最適
な組合せについて、適応音源ベクトル及び雑音音源ベク
トルを加算した信号を、順次線形予測分析ステップSP
2で得られた線形予測パラメータ(量子化後)を用いて
構成される合成フィルタに入力し、出力される合成音信
号と参照音声信号である入力音声信号との間の歪みを最
小にする組合せを選択する、A−b−S(Analysis by
Synthesis )手法によって実現される。
【0004】なお適応音源符号帳は、音声信号のピッチ
周期で時系列的に周期化した適応音源ベクトルを出力す
るもので、雑音音源符号帳は、例えばランダム雑音から
生成される時系列的な雑音音源ベクトルを複数記憶して
出力するものである。ここで、各音源符号帳の構成とし
ては、音源に対するゲインを正規化して時系列的に並べ
たものを符号帳に保持し、ゲインは別途算出付与し符号
化伝送する構成が一般的であるが、以下の説明では各音
源ベクトルは音源ゲインを含んで扱う。またこの過程で
は、A−b−S手法を用いることにより、適応音源ベク
トル及び雑音音源ベクトルの最適な組合せが得られてい
る時点で、それらから得られる合成音信号についても同
時に得られている。
【0005】次に適応音源駆動合成音声信号合成ステッ
プSP4においては、上述した音源符号帳探索ステップ
SP3で選択された適応音源ベクトルのみを用いて、音
源符号帳探索ステップSP3と同じ合成フィルタを用い
て出力する。さらに次の送出判定ステップSP5におい
ては、合成音品質の閾値判定に基づいて雑音音源符号帳
インデックスの伝送を取り止めることにより可変レート
化を実現している。
【0006】すなわちこの送出判定ステップSP5にお
いては、仮想的な合成音について対入力音声のSN比
(信号対雑音比)を算出するSN比算出ステップSP5
aと、このSN比と予め設定してある固定的な閾値との
比較を行う閾値比較ステップSP5bと、この閾値比較
ステップSP5bで雑音音源符号帳インデックスの使用
を取り止めてもその閾値をこえる音声品質が得られると
判断される場合には、送出される符号帳インデックスの
うちから雑音音源符号帳インデックスの伝送を取り止め
る伝送停止ステップSP5cと、その他の場合には全て
の符号帳インデックスを送出する通常送出ステップSP
5dを備えて、これを実現している。
【0007】この送出判定ステップSP5において、当
該処理フレームにおける符号が送出された後、次のステ
ップSP6で当該処理フレームの符号化処理を終了し、
次の処理フレームの処理を再度ステップSP1から開始
し、これを順次繰り返すことで符号化処理を行う。
【0008】因みに、特開平7−36495号公報の可
変レート音声符号化装置では、雑音音源ベクトルのみ用
いて合成される合成音に対しても、上述したと同様の閾
値評価により、適応音源符号帳インデックスの伝送を取
り止める処理を行う。しかしながら、この処理を行うよ
うな入力音声区間は、周期的な情報の欠如した無音区間
にほぼ限定されるため、音声の有音定常区間の音質改善
には寄与されないものである。
【0009】
【発明が解決しようとする課題】CELP音声符号化方
式における適応音源符号帳は、音声のピッチ周期に基づ
く周期的な構造を表現する役割を持ち、一方雑音音源符
号帳は、適応音源符号帳では表現しきれなかった成分、
すなわち音源情報のうちの周期的な成分を除いた残り
を、雑音成分で補う役割を持つ。そして、これらを足し
合わせて生成される音源信号を用いることにより、符号
化後の音源信号の再現性を高め、高品質の合成音を得る
ことが可能となる。
【0010】ここで図9について上述した可変レート音
声符号化方法では、音声の有音定常区間のように音声の
周期性に殆んど変化のない区間において、概ね雑音音源
符号帳インデックスの伝送を取り止め、適応音源符号帳
インデックスのみの伝送を行う処理を行う。ところが、
本来雑音音源ベクトルは適応音源ベクトルだけでは、充
分に表現しきれない周期構造を補う役割を持ち合わせて
いるため、雑音音源ベクトルを全く用いないと、周期構
造についての表現が不十分となり、この区間での音質が
適応音源ベクトル及び雑音音源ベクトルの両方を重畳し
て合成した場合の合成音に比較し、大きく音質が劣化す
る問題があった。
【0011】また、上記のような構成のため、従来の装
置の方法では、別途付加情報を伝送する構成を伴わず
に、雑音音源符号帳インデックスの伝送を取り止め、適
応音源符号帳インデックスのみの伝送を行う動作をする
ような入力音声区間での音質改善の実現が困難であると
いう問題があった。
【0012】さらに図9について上述した可変レート音
声符号化方法では、当該処理フレームにおける入力音声
信号に対して、適応音源ベクトルのみから得られる合成
音について対入力音声信号のSNR(信号対雑音比)を
算出し、これと予め設定した固定的な閾値との比較か
ら、雑音音源符号帳インデックスの送出の有無を決定し
ている。ところが、通常CELP音声符号化方式におい
ては、処理フレーム単位に歪み最小化基準で符号化を行
うため、処理フレーム単位での合成音の入力音声信号に
対するSNRは、連続するフレーム間であっても随時大
きな変化を伴うことになる。従って上述した固定的な閾
値基準では、例えば音声の定常区間等においてさえ、フ
レーム単位に各符号帳インデックスの送出/非送出が入
り乱れることになり、結果として合成音が不安定になる
問題があった。
【0013】この本発明は上述した問題を解消しようと
するものであり、雑音音源符号帳インデックスの伝送を
取り止め、適応音源符号帳インデックスのみの伝送を行
う入力音声状態においても、符号化効率を一切劣化させ
ずに音質を改善し得ると共に、出力合成音声が不安定に
なることを未然に防止し得る可変レート音声符号化方法
及び可変レート音声復号化方法を提供するものである。
【0014】
【課題を解決するための手段】この発明に係る可変レー
ト音声符号化方法では、過去のフレームの音源信号をピ
ッチ周期で繰り返した適応音源ベクトルを格納する適応
音源符号帳と、雑音音源ベクトルを格納する雑音音源符
号帳とを有するCELP音声符号化方式の可変レート音
声符号化方法において、入力音声信号に対して歪みが最
小となる第1の合成音声信号を得られるように、音源符
号帳及び雑音音源符号帳より適応音源ベクトル及び第1
の雑音音源ベクトルを選択し出力する音源符号帳探索ス
テップと、適応音源ベクトルを用いて生成される音源信
号を用いて仮想的な参照音声信号を作成する仮想的参照
音声信号合成ステップと、仮想的な参照音声信号に対し
て歪みが最小となる第2の合成音声信号を得られるよう
に、適応音源ベクトルに対応する第2の雑音音源ベクト
ルを選択する第2の音源符号帳探索ステップと、第2の
合成音声信号の品質に応じて、第1の雑音音源ベクトル
に対応する雑音音源符号帳インデックスの送出を取り止
める符号語送出系列選択ステップを備えようにしたもの
である。
【0015】さらに次の発明に係る可変レート音声符号
化方法では、符号語送出系列選択ステップは、入力音声
信号に対して、第1の合成音声信号と第2の合成音声信
号及び仮想的な参照音声信号の品質を数値的尺度に置き
換える合成音品質尺度化ステップと、合成音品質尺度化
ステップを用いて算出された第1の合成音声信号の品質
と仮想的な参照音声信号の品質を用いて、比較閾値を算
出する閾値算出ステップと、比較閾値と第2の合成音声
信号を比較する閾値比較ステップと、閾値比較ステップ
の比較結果に応じて、第1の雑音音源ベクトルに対応す
る雑音音源符号帳インデックスの送出を取り止めるか否
かを判定する送出判定ステップとを備えるものである。
【0016】また次の発明に係る可変レート音声復号化
方法では、過去のフレームの音源信号をピッチ周期で繰
り返した適応音源ベクトルを格納する適応音源符号帳
と、雑音音源ベクトルを格納する雑音音源符号帳とを有
するCELP音声復号化方式の可変レート音声復号化方
法において、受信した系列に適応音源符号帳インデック
ス及び雑音音源符号帳インデックスが含まれる場合、受
信した適応音源符号帳インデックス及び雑音音源符号帳
インデックスに対応する適応音源ベクトル及び雑音音源
ベクトルの両方を用いて生成される音源を用いて、第1
の合成音を出力する第1の合成音出力ステップと、受信
した系列に雑音音源符号帳インデックスが含まれない場
合、受信した適応音源符号帳インデックスに対応する適
応音源ベクトルを用いて生成される音源を用いて、仮想
的な参照音声信号を合成する仮想的参照音声信号合成ス
テップと、仮想的な参照音声信号に対して歪みが最小と
なる合成音声信号を得られるように、受信した適応音源
符号帳インデックスの示す適応音源ベクトルに応じた雑
音音源ベクトルを選択し、選択結果を用いて合成した第
2の合成音を出力する第2の合成音出力ステップとを備
えるものである。
【0017】
【発明の実施の形態】以下図面を参照しながら、この発
明の実施の形態を詳述する。
【0018】実施の形態1.図1はこの発明による可変
レート音声符号化方法の実施の形態1を示すフローチャ
ートである。図1において、図9で上述した従来の可変
レート音声符号化方法との相違点は、第2の音源符号帳
探索ステップSP14と符号語送出系列選択ステップS
P15である。この第2の音源符号帳探索ステップSP
14は、仮想的な参照音声信号に対して歪みが最小とな
るような第2の合成音声信号を得られるように、適応音
源ベクトルに対応する第2の雑音音源ベクトルを選択す
る処理を実行する。また符号語送出系列選択ステップS
P15は、第2の合成音声信号の品質に従って、第1の
雑音音源ベクトルに対応するインデックス送出を取り止
める処理を実行する。
【0019】さらに符号語送出系列選択ステップSP1
5は、合成音品質尺度化ステップSP15aと、閾値算
出ステップSP15bと、閾値比較ステップSP15c
と、伝送停止ステップSP5d及び通常送出ステップS
P5eからなる。なお線形予測分析ステップSP11
と、音源符号帳探索ステップSP12と、仮想的参照音
声合成ステップSP13については、図9の可変レート
音声符号化方法と同様であるので、以下の動作説明は簡
単に行う。
【0020】次に、可変レート音声符号化方法において
は、処理フレーム単位に分割された音声信号の入力に対
して、順次同一の処理フローで実行される。すなわち、
今前の処理フレームの符号化処理が終了したとすると、
その次の処理フレームの音声信号が入力され、ステップ
SP10から符号化処理が開始される。次の線形予測分
析ステップSP11、音源符号帳探索ステップSP12
及び仮想的参照音声信号合成ステップSP13が実行さ
れる。
【0021】これらの処理は、従来と同様の方法で行わ
れ、線形予測分析ステップSP11では線形予測パラメ
ータが出力される。また次の音源符号帳探索ステップS
P12では、参照音声を入力音声信号とし入力音声信号
との間の歪みが最小となるように、第1の合成音信号を
得るような適応音源ベクトル及び雑音音源ベクトルとが
選択され、第1の合成音信号と共に出力される。さらに
仮想的参照音声信号合成ステップSP13では、仮想的
な参照音声信号が出力される。
【0022】次に第2の音源符号帳探索ステップSP1
4を実行する。この処理においては、上述した仮想的な
合成音声信号に対して、歪み最小となるような第2の合
成音信号が得られるように、再度雑音音源ベクトルを選
択する処理を行う。すなわち、この第2の合成音信号と
仮想的参照音声信号合成ステップSP13で得られた仮
想的な参照音声信号との間の歪みを最小にするように、
音源符号帳探索ステップSP12で得られた適応音源ベ
クトルに対する雑音音源ベクトルの最適な組合せについ
て、A−b−S手法により第2の雑音音源ベクトルとし
て選択し、第2の合成音信号を出力する。
【0023】ここで、この実施の形態1においては、音
源符号帳探索ステップSP12の出力である第1の雑音
音源ベクトルは伝送対象であるが、第2の雑音音源ベク
トルは非伝送となるため、第2の音源符号帳探索ステッ
プSP14では、第2の雑音音源ベクトルの出力を要し
ない。
【0024】次に符号語送出系列選択ステップSP15
において、第1の雑音音源ベクトルを伝送するか否かに
ついて判定を行う。まず合成音品質尺度化ステップSP
15aでは、先の各ステップで出力された第1の合成音
信号、第2の合成音信号及び仮想的参照音声信号につい
て、当該処理フレームの入力音声信号との比較による、
音声品質を数値尺度で算出する。ここで、この数値尺度
はこの実施の形態1においては、各合成音信号と入力音
声信号とのSNR(信号対雑音比)を用いている。
【0025】次に合成音品質尺度化ステップSP15a
で得られた各合成音信号のSNRより、閾値算出ステッ
プSP15bを用いて判定閾値を算出する。この実施の
形態において、判定閾値は以下に述べるように予め用意
した算式を用いて算出する。ここで、この実施の形態に
おけるこの算式は、大量データを用いて、第1の合成音
信号第2の合成音信号及び仮想的参照音声信号と、入力
音声信号とのSNRの統計的性質(平均、分散)を用い
て、定式化を行う方法を用いることで実現できる。
【0026】
【表1】
【0027】表1は、この実施の形態における可変レー
ト音声符号化装置に対する男声/女声各5文章の入力音
声、約 6,000フレームにわたる第1の合成音信号、第2
の合成音信号及び仮想的参照音声信号と、入力音声信号
との各々のフレーム単位のSNRの平均及び分散の例で
ある。この表からも明らかなように、第2の合成音信号
のSNRの平均値は、第1の合成音信号及び仮想的参照
音声信号のSNRの平均値を、約8:2の比に内分する
ような値を取っており、しかもほぼ分散が同じであるこ
とが分かる。
【0028】そこで、例えば各SNRの分散について、
それぞれほぼ等しい値をとることから、この内分比を判
定閾値算出の基準に用いることができる。すなわち、各
処理フレーム単位に第1の合成音信号及び仮想的参照音
声信号の対入力音声信号のSNRを求め、それをある固
定比で内分するような比(表1の例では約8:2)で内
分する内分点の値を、判定閾値として算出する。
【0029】閾値比較ステップSP15cでは、上で算
出された判定閾値と、第2の合成音信号のSNRの比較
を行う。第2の合成音信号のSNRが、算出された判定
閾値を上回る場合に、伝送停止処理ステップSP15d
を用い、第1の雑音音源ベクトルの伝送を取り止め、第
2の合成音信号のSNRが算出された判定閾値を上回る
場合には通常送出処理SP15eを用い、通常通り第1
の雑音音源ベクトルを伝送する。ここで、表1から統計
的にも明らかなように、第1の雑音音源ベクトルを伝送
しない場合でも、第2の合成音信号を用いる事により、
仮想的な参照音声信号を用いる場合に比較し、品質のよ
い合成音声が得られることが判る。
【0030】以上、符号語送出系列選択ステップSP1
5において、当該処理フレームにおける符号が送出され
たのち、次のステップSP16で、当該処理フレームの
符号化処理を終了し、次の処理フレームの処理を、ステ
ップSP10から開始し、これを順次繰り返すことで符
号化処理を進める。
【0031】図2において、この実施の形態1の可変レ
ート音声符号化方法について、その具体的な動作を信号
の流れを用いて説明する。図中1は音声信号入力端、2
は符号出力端である。また3は線形予測分析手段であ
り、4は適応音源符号帳、5は雑音音源符号帳、6は合
成フィルタである。さらに7は最適音源選択手段であ
り、8は符号語送出系列選択手段であり、9は仮想的参
照音声信号用バッファである。10、11、12、13
は使用音源選択スイッチであり、14は合成音出力先選
択スイッチであり、15は参照音声選択スイッチであ
り、16は適応音源ゲイン選択手段であり、17は雑音
適応音源ゲイン選択手段である。また、各信号につい
て、S1は入力音声信号であり、S2は線形予測パラメ
ータであり、S3は仮想的な参照音声信号であり、S4
は第1の合成音信号であり、S5は第2の合成音信号で
あり、S6は音源符号帳選択制御信号である。
【0032】実際上音声信号入力端1からは、入力音声
S2が入力される。また符号出力端2からは、符号語送
出系列選択手段8で選択された、符号系列が出力され
る。線形予測分析手段3には入力音声S1が入力され、
線形予測パラメータS2が出力される。この線形予測パ
ラメータS2は、別途量子化が行われ、符号系列の一部
として送出される。適応音源符号帳4と雑音音源符号帳
5及び適応音源ゲイン選択符号化手段16及び雑音適応
音源ゲイン選択符号化手段17は、音源符号帳選択制御
信号S6の制御を受け、ゲインを含まない適応音源ベク
トル、ゲインを含まない雑音音源ベクトル、適応音源ゲ
イン及び雑音音源ゲインを出力し、選択後、次の選択が
開始されるまでは状態を保持する。なおこの説明におい
ては、ゲインを含まない適応音源ベクトルと適応音源ゲ
イン及びゲインを含まない雑音音源ベクトルと雑音音源
ゲインをまとめて、それぞれ適応音源ベクトル、雑音音
源ベクトルと称しており、その集合をそれぞれ適応音源
符号帳、雑音音源符号帳として表現した。
【0033】また合成フィルタ6は、線形予測パラメー
タS2と適応音源ベクトルあるいは雑音音源信号との組
合せから得られる各音源信号について入力し、仮想的な
参照音声信号S3及び合成音信号S4、S5を合成す
る。最適音源選択手段7は、参照音声信号S1或はS3
と、合成音信号S4、S5の間の歪みを評価しつつ、そ
れが最小になるように、ゲインを含まない適応音源ベク
トル、ゲインを含まない雑音音源ベクトル、適応音源ゲ
イン及び雑音音源ゲインを選択するべく、音源符号帳選
択制御信号S6を調整し出力する。符号語送出系列選択
手段8は、入力信号S1、仮想的な参照音声信号S3、
第1の合成音声信号S4、第2の合成音声信号S5が入
力され、それらの品質と別途算出される閾値の評価から
雑音音源符号帳インデックスの送出を制御する。
【0034】仮想的参照音声信号用バッファ9は、仮想
的な参照音声信号を音源コードブック選択のため一時保
存する。使用音源選択スイッチ10、11、12、13
は、選択対象となる音源ベクトル及びその組合せについ
て制御する。合成音出力先選択スイッチ14は、仮想的
な参照音声信号S3を合成する場合と、第1の合成音声
信号S4、第2の合成音声信号S5を選択合成する場合
において、その出力先を制御する。参照音声選択スイッ
チ15は、音源選択過程における参照音声信号を入力音
声信号S1と仮想的な参照音声信号S3とから選択す
る。適応音源ゲイン選択手段16及び雑音適応音源ゲイ
ン選択手段17は、音源符号帳選択制御信号S6を受け
て各音源ベクトルに付与するゲインを調整する。この際
選択された各ゲインは符号化乃至送出される。
【0035】次にこの実施の形態1の各ステップ毎の動
作について、図1及び図2を用いて説明する。なお図1
の線形予測分析ステップSP11、符号語送出系列選択
ステップSP15は、それぞれ図2における線形予測分
析手段3、符号語送出系列選択手段8に単純に対応する
ので、以下の説明は省略する。まず図1における音源符
号帳探索ステップSP12は、図2において、使用音源
選択スイッチ10、11、12、13及び合成音出力先
選択スイッチ14、参照音声選択スイッチ15を以下の
ように接続して開始する。すなわち使用音源選択スイッ
チ10を接続し、使用音源選択スイッチ11を端子b側
へ接続し、使用音源選択スイッチ12を端子b側へ接続
し、使用音源選択スイッチ13を接続する。さらに合成
音出力先選択スイッチ14を端子b側へ接続し、参照音
声選択スイッチ15を端子b側へ接続することで実現す
る。
【0036】この接続状態における図2の信号フローと
して、合成フィルタ6には適応音源ベクトル及び雑音信
号ベクトルが加算された音源信号が入力され、合成フィ
ルタ6から出力される合成音声信号が、入力音声信号S
1に対して歪み最小となるように音源符号帳選択制御信
号S6を出力し、適応音源ベクトル及び雑音音源ベクト
ルを選択するものとなる。この音源符号帳探索ステップ
SP12の結果、最終的な合成フィルタ6からの合成音
声信号の出力として、第1の合成音声信号S4が得ら
れ、その音源信号となる適応音源ベクトル及び第1の雑
音音源ベクトルが選択されている。
【0037】次に図1の仮想的参照音声信号合成ステッ
プSP13は、図2において使用音源選択スイッチ10
を開放し、使用音源選択スイッチ11を端子a側へ接続
し、使用音源選択スイッチ12を端子a側へ接続し、使
用音源選択スイッチ13を開放する。さらに合成音出力
先選択スイッチ14を端子a側へ接続し、参照音声選択
スイッチ15を端子b側へ接続することで実現する。こ
の接続状態における図2の信号フローとして、合成フィ
ルタ6には音源符号帳探索ステップSP12で選択され
た適応音源ベクトルが音源信号として入力され、仮想的
な参照音声信号S3として出力され、仮想的参照音声信
号用バッファ9に出力されると共に符号語送出系列選択
手段8へ出力される。
【0038】さらに図1の第2の音源符号帳探索ステッ
プSP14は、図2において、使用音源選択スイッチ1
0を接続し、使用音源選択スイッチ11を端子b側へ接
続し、使用音源選択スイッチ12を端子b側へ接続し、
使用音源選択スイッチ13を開放する。さらに合成音出
力先選択スイッチ14を端子b側へ接続し、参照音声選
択スイッチ15を端子a側へ接続することで実現する。
この接続状態における図2の信号フローとして、合成フ
ィルタ6には音源符号帳探索ステップSP12で選択さ
れた適応音源ベクトル及び雑音音源ベクトルが加算され
た音源信号が入力され、合成フィルタ6から出力される
合成音声信号が、仮想的参照音声信号用バッファ9に保
持されている仮想的な参照音声信号S3に対して、歪み
最小となるように音源符号帳選択制御信号S6を出力
し、雑音音源ベクトルを選択するものとなる。この第2
の音源符号帳探索ステップSP14の結果、最終的な合
成フィルタ6からの合成音声信号の出力として、第2の
合成音声信号S5が得られ、第2の雑音音源ベクトルが
選択されている。
【0039】またこの実施の形態1においては、ここま
で雑音音源符号帳として、事前学習或はランダム雑音等
により得られる時系列的なベクトルに対して、インデッ
クスを付して構成される形態を想定して説明したが、雑
音音源符号化手法としてその他に用いられる方法、例え
ば「Fast CELP Coding Based on Algeblic Codes」(J-
P.Adoul, P.Mabilleau, M.Delprat ,S.Morissette著 ,P
roc. ICASSP■87, pp1957-1960,(1987))に記載されて
いるいわゆる代数励振符号を用いる構成としても良い。
【0040】またこの代数励振符号を用いる音声符号化
方式として、「CS-ACELPの基本アルゴリズム」(片岡章
俊、林伸二、守谷健弘、栗原祥子、間野一則著、NTT R&
D, Vol. 45, pp325-330, (1996))に示されるCS−A
CELP(Conjugate-Structure Algebraic )方式があ
り、ITU−T G.729 8kbps標準方式として採用さ
れているが、この方式を符号化の基本アルゴリズムとし
て用いて、この実施の形態1に示す可変レート音声符号
化方法を適用しても良い。このITU−T G.729 8
kbps標準方式における代数励振源は、5msec区間(40サ
ンプル)のサブフレームに対して、4本のパルスの位置
及び極性で表現される。またピッチ周期がサブフレーム
長より短い場合には、これをピッチ周期で繰り返して用
いるピッチ周期化が取り入れられている。また共役構造
(Conjugate-Structure )のゲイン量子化手法が用いら
れており、誤り耐性の強化が施されている。
【0041】ここで図3〜図6は、第2の合成音声信号
を用いることの効果を示すために、このITU−T
G.729方式を基本アルゴリズムとし、代数励振符号を雑
音音源として用いた場合について波形の観測結果をもと
に説明する。なお図中各信号に対する符号は図2と対応
させて付している。今図3のような入力音声信号S1に
対して、図4の第1の合成音信号S4を得る過程におい
て、第1の雑音音源ベクトルは、入力音声信号S1に対
して適応音源ベクトルの周期性表現では不足する成分に
加えて、微細な音源構造についても表現するようなパル
ス列となる。ここで得られる第1の合成音声信号S4
は、入力音声信号S1にもみられる微細な構造に対して
も充分追従している様子が分かる。
【0042】次に図5のように、第1の合成音信号を得
る過程において選択された適応音源ベクトルのみを用い
て、仮想的な参照音声信号S3を合成した場合、フレー
ム内で一定の周期及び振幅を単純に繰り返したのに近い
波形となり入力音声信号S1に現れる周期構造表現の不
足分を表現するに至らない。従来の可変レート音声符号
化方法における雑音音源符号長インデックスの伝送停止
区間では、仮想的な参照音声信号S3を、そのまま合成
音出力として用いるので品質劣化が大きかった。
【0043】一方図6のように第2の合成音声信号S5
においては、適応音源ベクトルの周期性表現の不足分を
第2の雑音音源ベクトルが補うような働きをしており、
微細構造の表現まではいたらないものの、仮想的な参照
音声信号S3に比べ大きく周期性表現が改善されること
が分かる。ここで、第2の雑音音源ベクトルのパルス極
性は、サブフレーム内において仮想的な参照音声信号S
3の同位置の極性を用いることが出来る。従って、代数
励振符号を雑音音源として用いた場合でも、パルス位置
及び極性について、一切の情報を伝送することなく符号
化復号化側で、同一の第2の雑音音源ベクトルを得るこ
とが可能である。
【0044】またCS−ACELP方式に対するこの適
用例においては、代数励振符号の位置及び極性の伝送の
み停止することとし、第1の雑音音源ベクトルの伝送停
止区間では第2の雑音音源ゲインは通常の場合と同様
に、共役構造をもつゲイン量子化を行い伝送する構成と
している。第1の雑音音源ベクトルの伝送停止は、サブ
フレーム単位に判定される。これにより、この適用例で
は第1の雑音音源ベクトルの伝送停止区間では、フレー
ムあたり80ビット中17ビットまたは34ビットの削減が可
能である。
【0045】以上に述べたこの実施の形態1によれば、
仮想的な参照音声信号との歪みが最小となるように、少
なくとも適応音源ベクトルだけでは表現しきれなかった
音源の周期構造について補うような第2の雑音音源ベク
トルを使用することが可能となるので、第1の雑音音源
符号帳インデックスを伝送しない区間においても、合成
音品質の劣化が少なくて済む可変レート音声符号化方法
を実現できる。
【0046】実施の形態2.図7はこの本発明による可
変レート音声復号化方法の実施の形態2を示す。この可
変レート音声復号化方法は、受信系列判別ステップSP
21と、第1の合成音を出力する第1の合成音出力ステ
ップSP22と、仮想的な参照音声信号を合成する仮想
的参照音声信号合成ステップSP23と、第2の合成音
を出力する第2の合成音出力ステップSP24より構成
されている。
【0047】この可変レート音声復号化方法において、
仮想的参照音声信号合成ステップSP23は、実施の形
態1で上述した仮想的参照音声合成ステップSP13と
同様であり、以下の動作説明は簡略化する。またこの発
明の可変レート音声復号化方法は、処理フレーム単位に
受信される受信符号語系列の入力に対し、順次同一の処
理フローで実行される。今、前の処理フレームの復号化
処理が終了したとすると、その次の処理フレームに対応
する受信符号語系列が入力され、ステップSP20から
復号化処理が開始される。
【0048】次に受信系列判別ステップSP21におい
ては、受信系列に雑音音源符号帳インデックスが含まれ
ているかどうかを受信系列長を参考に判別する。この受
信系列判別ステップSP21において、受信系列に雑音
音源符号長インデックスが含まれていると判断された場
合には、第1の合成音出力ステップSP22において合
成音を出力する。この第1の合成音出力ステップSP2
2では、受信した適応音源符号帳インデックス及び雑音
音源符号帳インデックスに対応する適応音源ベクトル及
び雑音音源ベクトルの両方を用いて生成される音源を用
い、同時に受信系列の一部として伝送されている線形予
測パラメータを用いて構成される合成フィルタに入力
し、第1の合成音声信号を得る。
【0049】一方受信系列判別ステップSP21におい
て、受信系列に雑音音源符号長インデックスが含まれて
いないと判断された場合には、以下の手順により、実施
の形態1で説明した符号化側における第2の雑音音源符
号帳探索ステップSP13と同様の処理を行うことによ
り第2の合成音声信号を得る。すなわちまず、仮想的参
照音声信号合成ステップSP23により、受信した適応
音源符号帳インデックスに対応する適応音源ベクトルの
みから得られる仮想的な合成音信号を、同時に受信系列
の一部として伝送されている線形予測パラメータを用い
て構成される合成フィルタに入力し、仮想的な参照音声
信号を得る。
【0050】次に第2の合成音出力ステップSP24に
おいて、仮想的参照音声信号合成ステップSP23で得
られた仮想的な参照音声信号との間の歪みを最小にする
ように、音源符号帳探索ステップSP12で得られた適
応音源ベクトルに対する雑音音源ベクトルの最適な組合
せについて、A−b−S手法により、第2の雑音音源ベ
クトルとして選択し第2の合成音信号を出力する。以上
の各ステップの実行により、当該処理フレームの合成音
声信号が出力されたのち、ステップSP25で当該処理
フレームの復号化処理を終了し、次の処理フレームに対
応する処理をステップSP20から開始し、これを順次
繰り返すことで復号化処理を進める。
【0051】図2との対応部分に同一符号を付けた図8
において、この実施の形態2の可変レート音声復号化方
法について、その具体的な動作を信号の流れを用いて説
明する。図中、18は符号入力端、19は合成音出力端
であり、また20は線形予測パラメータ復号手段、21
は受信系列判別手段、22は入力選択スイッチ、23、
24は音源選択スイッチ、25は合成音選択スイッチで
ある。
【0052】このうち符号入力端18からは、受信され
た符号が入力され、合成音出力端19からは合成音声が
出力される。また線形予測パラメータ復号手段20は受
信系列から線形予測パラメータS2を復号する。受信系
列判別手段21は受信系列長等から雑音符号長インデッ
クスが伝送されたか否かを判断し、また各符号化パラメ
ータ毎に分割出力する。入力選択スイッチ22は、受信
系列判別手段21の判別結果をうけて音源符号帳への制
御信号入力を切り替える。音原選択スイッチ23、24
は、受信系列判別手段21の判別結果をうけて合成フィ
ルタ6に入力される音源信号を切り替える。合成音選択
スイッチ25は、合成フィルタ6で合成された合成音の
出力先を制御する。
【0053】次にこの実施の形態2の各ステップ毎の動
作について、図7及び図8を用いて説明する。なお図7
の受信系列判別ステップSP21は、図8の受信系列判
別手段21と単純に対応するので、以下の説明は省略す
る。まず図7の第1の合成音出力ステップSP27は、
図8において入力選択スイッチ22、音源選択スイッチ
23、24及び合成音選択スイッチ25を以下のように
接続して開始する。すなわち入力選択スイッチ22を端
子bへ接続し、音源選択スイッチ23を端子aへ、音源
選択スイッチ24を端子aへ、合成音選択スイッチ25
を端子aへそれぞれ接続する。この接続状態における図
8の信号フローとして、合成フィルタ6にはそれぞれ伝
送されたインデックスに対応する適応音源ベクトル及び
雑音信号ベクトルが加算された音源信号が入力され、合
成フィルタ6から出力される合成音声信号が、第1の合
成音声信号S4として得られる。
【0054】次に図7の仮想的参照音声信号合成ステッ
プSP22は、図8において入力選択スイッチ22を端
子bへ接続し、音源選択スイッチ23を端子bへ、音源
選択スイッチ24を端子bへ、合成音選択スイッチ25
を端子bへそれぞれ接続することで実現する。この接続
状態における図8の信号フローとして、合成フィルタ6
には伝送されたインデックスに対応する適応音源ベクト
ルが音源信号として入力され、合成フィルタ6から出力
される合成音声信号が、仮想的な参照音声信号S3とし
て得られ、これが仮想的参照音声信号用バッファ9に出
力される。
【0055】次に図7の第2の合成音出力ステップSP
24は、図8において入力選択スイッチ22を端子aへ
接続し、音源選択スイッチ23を端子aへ、音源選択ス
イッチ24を端子aへ、合成音選択スイッチ25を端子
aへそれぞれ接続することで実現する。この接続状態に
おける図8の信号フローとして、合成フィルタ6には伝
送されたインデックスに対応する適応音源ベクトルと、
順次出力される雑音音源ベクトルが加算されたものが音
源信号として入力され、合成フィルタ6から出力される
合成音声信号が、仮想的参照音声信号用バッファ9に対
する歪みを最小とするように第2の雑音音原ベクトルが
選択され、この結果得られた合成音信号が第2の合成音
信号S5として出力される。
【0056】この実施の形態2によれば、雑音音源ベク
トルの伝送停止区間においても、上述した実施の形態1
に示した第2の雑音音源ベクトルを、復号化側で独自に
算出して用いることが可能となり、出力合成音声の品質
を高めることができる可変レート音声復号化方法を実現
できる。
【0057】実施の形態3.上述の実施の形態1におい
ては、合成音品質尺度化ステップSP15aにおいて、
SNR(信号対雑音比)を尺度化基準に用いているが、
ケプストラム距離、バークスペクトル距離等、波形間の
歪みを測定することが可能な数値尺度であれば実施の形
態1と同様に使用することができ、実施の形態1と同様
の効果を得ることができる。
【0058】上述の実施の形態1では、閾値算出ステッ
プSP15b及び閾値比較ステップSP15cにおい
て、SN比単一の尺度に寄る比較判定を行う処理とした
が、上述したような各尺度を複数用いて比較判定する処
理とすることはもちろん可能である。
【0059】上述の実施の形態1では、符号語送出系列
選択ステップSP15において、雑音音源符号帳インデ
ックスの送出の可否判断まで行う構成としたが、符号語
送出系列選択ステップSP15の出力を、送出停止の可
能性を示すフラグ、適応音源符号帳インデックス及び雑
音符号帳インデックスとし、上位のベースバンド信号処
理部等の判断において、最終的な雑音符号帳インデック
スの送出判断とする構成にしても上述の実施の形態1と
同様の効果を得ることができる。
【0060】上述の実施の形態2では、受信系列判別ス
テップSP21において、受信符号長などから、雑音符
号帳インデックスの非伝送を知る構成となっているが、
上位のベースバンド信号処理部等でこれを判定し、フラ
グと共に必要最小限のインデックスを受け取る構成とし
ても、上述の実施の形態2と同様の効果を得ることがで
きる。
【0061】
【発明の効果】以上の通りこの発明によれば、入力音声
信号に対して歪みが最小となる第1の合成音声信号を得
られるように、音源符号帳及び雑音音源符号帳より適応
音源ベクトル及び第1の雑音音源ベクトルを選択し出力
し、その適応音源ベクトルを用いて生成される音源信号
を用いて仮想的な参照音声信号を作成し、その仮想的な
参照音声信号に対して歪みが最小となる第2の合成音声
信号を得られるように、適応音源ベクトルに対応する第
2の雑音音源ベクトルを選択し、第2の合成音声信号の
品質に応じて第1の雑音音源ベクトルに対応する雑音音
源符号帳インデックスの送出を取り止めることにより、
雑音音源符号帳インデックスが非伝送となる場合でも、
復号化側で独自に選択可能であり、かつ共通の雑音音源
ベクトルを使用することができ、品質劣化の少ない符号
化が行える可変レート音声符号化方法を実現できる。
【0062】さらに次の発明によれば、これに加えて、
入力音声信号に対して、第1の合成音声信号と第2の合
成音声信号及び仮想的な参照音声信号の品質を数値的尺
度に置き換え比較閾値を算出し、この比較閾値と第2の
合成音声信号を比較し、その比較結果に応じて、第1の
雑音音源ベクトルに対応する雑音音源符号帳インデック
スの送出を取り止めるか否かを判定することにより、従
来の処理フレーム間で固定的に用いている閾値を用いる
場合に比べ、各処理フレーム単位の合成音品質に見合っ
た判定が行われるので、より安定的な送出判定が行える
可変レート符号化方法を実現できる。
【0063】また次の発明によれば、受信した系列に適
応音源符号帳インデックス及び雑音音源符号帳インデッ
クスが含まれる場合、受信した適応音源符号帳インデッ
クス及び雑音音源符号帳インデックスに対応する適応音
源ベクトル及び雑音音源ベクトルの両方を用いて生成さ
れる音源を用いて、第1の合成音を出力し、受信した系
列に雑音音源符号帳インデックスが含まれない場合、受
信した適応音源符号帳インデックスに対応する適応音源
ベクトルを用いて生成される音源を用いて、仮想的な参
照音声信号を合成し、その仮想的な参照音声信号に対し
て歪みが最小となる合成音声信号を得られるように、受
信した適応音源符号帳インデックスの示す適応音源ベク
トルに応じた雑音音源ベクトルを選択し、選択結果を用
いて合成した第2の合成音を出力することにより、雑音
音源符号帳インデックスが非伝送となる場合でも、独自
に選択可能かつ符号化側で用いているのと共通の雑音音
源ベクトルを使用することが可能となり、品質劣化の少
ない復号化が行える可変レート音声復号化方法を実現で
きる。
【図面の簡単な説明】
【図1】 この発明の実施の形態1として可変レート音
声符号化方法の処理手順を示すフローチャートである。
【図2】 図1の可変レート音声符号化方法の信号の流
れの説明に供するブロック図である。
【図3】 入力音声信号の様態の説明に供する信号波形
図である。
【図4】 第1の合成音声信号の様態の説明に供する信
号波形図である。
【図5】 仮想的な参照音声信号の様態の説明に供する
信号波形図である。
【図6】 第2の合成音声信号の様態の説明に供する信
号波形図である。
【図7】 この発明の実施の形態2として可変レート音
声復号化方法の処理手順を示すフローチャートである。
【図8】 図7の可変レート音声復号化方法の信号の流
れの説明に供するブロック図である。
【図9】 従来の可変レート音声符号化方法の処理手順
を示すフローチャートである。
【符号の説明】
1 音声信号入力端 2 符号出力端 3 線形予測分析手段 4 適応音源符号帳 5 雑音音源符号帳 6 合成フィルタ 7 最適音源選択手段 8 符号語送出系列選択手段 9 仮想的参照音声信号用バッファ 10 使用音源選択スイッチa 11 使用音源選択スイッチb 12 使用音源選択スイッチc 13 使用音源選択スイッチe 14 合成音出力先選択スイッチ 15 参照音声選択スイッチ 16 適応音源ゲイン選択手段 17 雑音適応音源ゲイン選択手段 18 符号入力端 19 合成音出力端 20 線形予測パラメータ復号手段 21 受信系列判別手段 22 入力選択スイッチ 23 音源選択スイッチa 24 音源選択スイッチb 25 合成音選択スイッチ S1 入力音声信号、 S2 線形予測パラメータ S3 仮想的な参照音声信号 S4 第1の合成音信号 S5 第2の合成音信号 S6 音源符号帳選択制御信号

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 過去のフレームの音源信号をピッチ周期
    で繰り返した適応音源ベクトルを格納する適応音源符号
    帳と、雑音音源ベクトルを格納する雑音音源符号帳とを
    有するCELP音声符号化方式の可変レート音声符号化
    方法において、入力音声信号に対して歪みが最小となる
    第1の合成音声信号を得られるように、前記音源符号帳
    及び前記雑音音源符号帳より適応音源ベクトル及び第1
    の雑音音源ベクトルを選択し出力する音源符号帳探索ス
    テップと、前記適応音源ベクトルを用いて生成される音
    源信号を用いて仮想的な参照音声信号を作成する仮想的
    参照音声信号合成ステップと、前記仮想的な参照音声信
    号に対して歪みが最小となる第2の合成音声信号を得ら
    れるように、前記適応音源ベクトルに対応する第2の雑
    音音源ベクトルを選択する第2の音源符号帳探索ステッ
    プと、前記第2の合成音声信号の品質に応じて、前記第
    1の雑音音源ベクトルに対応する雑音音源符号帳インデ
    ックスの送出を取り止める符号語送出系列選択ステップ
    を備え、符号化率を可変するようにした可変レート音声
    符号化方法。
  2. 【請求項2】 前記符号語送出系列選択ステップは、前
    記入力音声信号に対して、前記第1の合成音声信号と前
    記第2の合成音声信号及び前記仮想的な参照音声信号の
    品質を数値的尺度に置き換える合成音品質尺度化ステッ
    プと、前記合成音品質尺度化ステップを用いて算出され
    た前記第1の合成音声信号の品質と前記仮想的な参照音
    声信号の品質を用いて、比較閾値を算出する閾値算出ス
    テップと、前記比較閾値と前記第2の合成音声信号を比
    較する閾値比較ステップと、閾値比較ステップの比較結
    果に応じて、前記第1の雑音音源ベクトルに対応する雑
    音音源符号帳インデックスの送出を取り止めるか否かを
    判定する送出判定ステップとを備えることを特徴とする
    請求項1に記載の可変レート音声符号化方式。
  3. 【請求項3】 過去のフレームの音源信号をピッチ周期
    で繰り返した適応音源ベクトルを格納する適応音源符号
    帳と、雑音音源ベクトルを格納する雑音音源符号帳とを
    有するCELP音声復号化方式の可変レート音声復号化
    方法において、受信した系列に適応音源符号帳インデッ
    クス及び雑音音源符号帳インデックスが含まれる場合、
    受信した前記適応音源符号帳インデックス及び前記雑音
    音源符号帳インデックスに対応する適応音源ベクトル及
    び雑音音源ベクトルの両方を用いて生成される音源を用
    いて、第1の合成音を出力する第1の合成音出力ステッ
    プと、受信した系列に雑音音源符号帳インデックスが含
    まれない場合、受信した適応音源符号帳インデックスに
    対応する適応音源ベクトルを用いて生成される音源を用
    いて、仮想的な参照音声信号を合成する仮想的参照音声
    信号合成ステップと、前記仮想的な参照音声信号に対し
    て歪みが最小となる合成音声信号を得られるように、受
    信した適応音源符号帳インデックスの示す適応音源ベク
    トルに応じた雑音音源ベクトルを選択し、選択結果を用
    いて合成した第2の合成音を出力する第2の合成音出力
    ステップとを備えることを特徴とする可変レート音声復
    号化方法。
JP9049364A 1997-03-04 1997-03-04 可変レート音声符号化方法、可変レート音声復号化方法 Pending JPH10247098A (ja)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP9049364A JPH10247098A (ja) 1997-03-04 1997-03-04 可変レート音声符号化方法、可変レート音声復号化方法
TW086111418A TW403891B (en) 1997-03-04 1997-08-09 The changeable audio encoding and decoding method
CA002218118A CA2218118C (en) 1997-03-04 1997-10-08 Variable rate speech coding method and decoding method
AU40013/97A AU689413B1 (en) 1997-03-04 1997-10-09 Variable rate speech coding method and decoding method
KR1019970052792A KR100276035B1 (ko) 1997-03-04 1997-10-15 가변 레이트 음성 부호화 방법 및 복호화 방법
US08/953,437 US5875423A (en) 1997-03-04 1997-10-17 Method for selecting noise codebook vectors in a variable rate speech coder and decoder
EP97118865A EP0863500A3 (en) 1997-03-04 1997-10-30 Variable rate speech coding method and decoding method
CN97125590A CN1192563A (zh) 1997-03-04 1997-12-24 可变率声音编码方法及可变率声音解码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9049364A JPH10247098A (ja) 1997-03-04 1997-03-04 可変レート音声符号化方法、可変レート音声復号化方法

Publications (1)

Publication Number Publication Date
JPH10247098A true JPH10247098A (ja) 1998-09-14

Family

ID=12828973

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9049364A Pending JPH10247098A (ja) 1997-03-04 1997-03-04 可変レート音声符号化方法、可変レート音声復号化方法

Country Status (8)

Country Link
US (1) US5875423A (ja)
EP (1) EP0863500A3 (ja)
JP (1) JPH10247098A (ja)
KR (1) KR100276035B1 (ja)
CN (1) CN1192563A (ja)
AU (1) AU689413B1 (ja)
CA (1) CA2218118C (ja)
TW (1) TW403891B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003505723A (ja) * 1999-07-19 2003-02-12 クゥアルコム・インコーポレイテッド 音声符号器における目標ビットレートを維持する方法および装置

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1163870C (zh) 1996-08-02 2004-08-25 松下电器产业株式会社 声音编码装置和方法,声音译码装置,以及声音译码方法
DE69721595T2 (de) * 1996-11-07 2003-11-27 Matsushita Electric Ind Co Ltd Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs
US6377918B1 (en) * 1997-03-25 2002-04-23 Qinetiq Limited Speech analysis using multiple noise compensation
US6847960B1 (en) * 1999-03-29 2005-01-25 Nec Corporation Document retrieval by information unit
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
JP2001242896A (ja) * 2000-02-29 2001-09-07 Matsushita Electric Ind Co Ltd 音声符号化/復号装置およびその方法
JP3558031B2 (ja) 2000-11-06 2004-08-25 日本電気株式会社 音声復号化装置
CN100369108C (zh) * 2003-12-18 2008-02-13 诺基亚公司 编码域中的音频增强的方法和设备
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter
KR20170044849A (ko) * 2015-10-16 2017-04-26 삼성전자주식회사 전자 장치 및 다국어/다화자의 공통 음향 데이터 셋을 활용하는 tts 변환 방법

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02272500A (ja) * 1989-04-13 1990-11-07 Fujitsu Ltd コード駆動音声符号化方式
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
DE69328450T2 (de) * 1992-06-29 2001-01-18 Nippon Telegraph & Telephone Verfahren und Vorrichtung zur Sprachkodierung
US5408234A (en) * 1993-04-30 1995-04-18 Apple Computer, Inc. Multi-codebook coding process
SG43128A1 (en) * 1993-06-10 1997-10-17 Oki Electric Ind Co Ltd Code excitation linear predictive (celp) encoder and decoder
JP3685812B2 (ja) * 1993-06-29 2005-08-24 ソニー株式会社 音声信号送受信装置
JP3265726B2 (ja) * 1993-07-22 2002-03-18 松下電器産業株式会社 可変レート音声符号化装置
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
US5450449A (en) * 1994-03-14 1995-09-12 At&T Ipm Corp. Linear prediction coefficient generation during frame erasure or packet loss
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
JP3568255B2 (ja) * 1994-10-28 2004-09-22 富士通株式会社 音声符号化装置及びその方法
JP2697642B2 (ja) * 1994-11-24 1998-01-14 日本電気株式会社 Atm音声符号化装置
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
GB2312360B (en) * 1996-04-12 2001-01-24 Olympus Optical Co Voice signal coding apparatus

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003505723A (ja) * 1999-07-19 2003-02-12 クゥアルコム・インコーポレイテッド 音声符号器における目標ビットレートを維持する方法および装置
JP4782332B2 (ja) * 1999-07-19 2011-09-28 クゥアルコム・インコーポレイテッド 音声符号器における目標ビットレートを維持する方法および装置

Also Published As

Publication number Publication date
KR100276035B1 (ko) 2000-12-15
CN1192563A (zh) 1998-09-09
EP0863500A3 (en) 1999-03-17
TW403891B (en) 2000-09-01
AU689413B1 (en) 1998-03-26
CA2218118C (en) 2001-05-08
KR19980079418A (ko) 1998-11-25
US5875423A (en) 1999-02-23
EP0863500A2 (en) 1998-09-09
CA2218118A1 (en) 1998-09-04

Similar Documents

Publication Publication Date Title
JP4005359B2 (ja) 音声符号化及び音声復号化装置
US7587315B2 (en) Concealment of frame erasures and method
JP2006525533A (ja) 可変ビットレート広帯域通話符号化における利得量子化方法および装置
JPH10187197A (ja) 音声符号化方法及び該方法を実施する装置
MXPA04011751A (es) Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal.
JPH10247098A (ja) 可変レート音声符号化方法、可変レート音声復号化方法
JP3602593B2 (ja) 音声エンコーダ及び音声デコーダ、並びに音声符号化方法及び音声復号化方法
KR20030046451A (ko) 음성 코딩을 위한 코드북 구조 및 탐색 방법
US6826527B1 (en) Concealment of frame erasures and method
US6804639B1 (en) Celp voice encoder
JPH0612098A (ja) 音声符号化装置
JPH11259100A (ja) 励起ベクトルの符号化方法
JPH09160596A (ja) 音声符号化装置
JP2658816B2 (ja) 音声のピッチ符号化装置
JPH10143199A (ja) 音声符号化方法および復号化方法
JPH05265496A (ja) 複数のコードブックを有する音声符号化方法
JPH113099A (ja) 音声符号化復号化システム、音声符号化装置及び音声復号化装置
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JPH10207496A (ja) 音声符号化装置及び音声復号装置
JP3232701B2 (ja) 音声符号化方法
JP4510977B2 (ja) 音声符号化方法および音声復号化方法とその装置
JPH08234795A (ja) 音声符号化装置
JP3296411B2 (ja) 音声符号化方法および復号化方法
JP2000298500A (ja) 音声符号化方法
JP3232728B2 (ja) 音声符号化方法