JP2003036099A - 音声符号化方法及び音声符号化装置 - Google Patents
音声符号化方法及び音声符号化装置Info
- Publication number
- JP2003036099A JP2003036099A JP2002202211A JP2002202211A JP2003036099A JP 2003036099 A JP2003036099 A JP 2003036099A JP 2002202211 A JP2002202211 A JP 2002202211A JP 2002202211 A JP2002202211 A JP 2002202211A JP 2003036099 A JP2003036099 A JP 2003036099A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- code
- drive
- codebook
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
声符号化復号化において、少ない情報量で品質の高い音
声を再生する。 【解決手段】 符号駆動線形予測(CELP)音声符号
化において、スペクトル情報、パワー情報、ピッチ情報
のうち少なくとも1つの符号又は符号化結果を用いて該
符号化区間における音声の雑音性の度合を評価し、評価
結果に応じて異なる駆動符号帳19、20を用いるよう
にした。
Description
タル信号に圧縮符号化復号化する際に使用する音声符号
化・復号化方法及び音声符号化・復号化装置に関し、特
に低ビットレートで品質の高い音声を再生するための音
声符号化方法及び音声復号化方法並びに音声符号化装置
及び音声復号化装置に関する。
符号駆動線形予測(Code-Excited Linear Prediction:
CELP)符号化が代表的であり、その技術について
は、「Code-excited linear prediction(CELP):
High-quality speech at very low bit rates」(M.R.S
hroeder and B.S.Atal著、ICASSP '85, pp.937-940, 19
85)に述べられている。
全体構成の一例を示すもので、図中101は符号化部、
102は復号化部、103は多重化手段、104は分離
手段である。符号化部101は線形予測パラメータ分析
手段105、線形予測パラメータ符号化手段106、合
成フィルタ107、適応符号帳108、駆動符号帳10
9、ゲイン符号化手段110、距離計算手段111、重
み付け加算手段138より構成されている。また、復号
化部102は線形予測パラメータ復号化手段112、合
成フィルタ113、適応符号帳114、駆動符号帳11
5、ゲイン復号化手段116、重み付け加算手段139
より構成されている。
1フレームとして、そのフレームの音声をスペクトル情
報と音源情報に分けて符号化する。まず、CELP音声
符号化方法の動作について説明する。符号化部101に
おいて、線形予測パラメータ分析手段105は入力音声
S101を分析し、音声のスペクトル情報である線形予
測パラメータを抽出する。線形予測パラメータ符号化手
段106はその線形予測パラメータを符号化し、符号化
した線形予測パラメータを合成フィルタ107の係数と
して設定する。
適応符号帳108には、過去の駆動音源信号が記憶され
ており、距離計算手段111から入力される適応符号に
対応して過去の駆動音源信号を周期的に繰り返した時系
列ベクトルを出力する。駆動符号帳109には、例えば
学習用音声とその符号化音声との歪みが小さくなるよう
に学習して構成された複数の時系列ベクトルが記憶され
ており、距離計算手段111から入力される駆動符号に
対応した時系列ベクトルを出力する。適応符号帳10
8、駆動符号帳109からの各時系列ベクトルはゲイン
符号化手段110から与えられるそれぞれのゲインに応
じて重み付け加算手段138で重み付けして加算され、
その加算結果を駆動音源信号として合成フィルタ107
へ供給し符号化音声を得る。距離計算手段111は符号
化音声と入力音声S101との距離を求め、距離が最小
となる適応符号、駆動符号、ゲインを探索する。上記符
号化が終了した後、線形予測パラメータの符号、入力音
声と符号化音声との歪みを最小にする適応符号、駆動符
号、ゲインの符号を符号化結果として出力する。
て説明する。一方復号化部102において、線形予測パ
ラメータ復号化手段112は線形予測パラメータの符号
から線形予測パラメータを復号化し、合成フィルタ11
3の係数として設定する。次に、適応符号帳114は、
適応符号に対応して、過去の駆動音源信号を周期的に繰
り返した時系列ベクトルを出力し、また駆動符号帳11
5は駆動符号に対応した時系列ベクトルを出力する。こ
れらの時系列ベクトルは、ゲイン復号化手段116でゲ
インの符号から復号化したそれぞれのゲインに応じて重
み付け加算手段139で重み付けして加算され、その加
算結果が駆動音源信号として合成フィルタ113へ供給
され出力音声S103が得られる。
音声品質の向上を目的として改良された従来の音声符号
化復号化方法として、「Phonetically-based vector ex
citation coding of speech at 3.6kbps」(S.Wang and
A.Gersho著、ICASSP '89, pp.49-52, 1989)に示され
たものがある。図6との対応手段分に同一符号を付けた
図7は、この従来の音声符号化復号化方法の全体構成の
一例を示し、図中符号化部101において117は音声
状態判定手段、118駆動符号帳切替手段、119は第
1の駆動符号帳、120は第2の駆動符号帳である。ま
た図中復号化手段102において121は駆動符号帳切
替手段、122は第1の駆動符号帳、123は第2の駆
動符号帳である。このような構成による符号化復号化方
法の動作を説明する。まず符号化手段101において、
音声状態判定手段117は入力音声S101を分析し、
音声の状態を例えば有声/無声の2つの状態のうちどち
らであるかを判定する。駆動符号帳切替手段118はそ
の音声状態判定結果に応じて、例えば有声であれば第1
の駆動符号帳119を、無声であれば第2の駆動符号帳
120を用いるとして符号化に用いる駆動符号帳を切り
替え、また、どちらの駆動符号帳を用いたかを符号化す
る。
帳切替手段121は符号化手段101でどちらの駆動符
号帳を用いたかの符号に応じて、符号化手段101で用
いたのと同じ駆動符号帳を用いるとして第1の駆動符号
帳122と第2の駆動符号帳123とを切り替える。こ
のように構成することにより、音声の各状態毎に符号化
に適した駆動符号帳を用意し、入力された音声の状態に
応じて駆動符号帳を切り替えて用いることで再生音声の
品質を向上することができる。
数の駆動符号帳を切り替える従来の音声符号化復号化方
法として特開平8−185198号公報に開示されたも
のがある。これは、適応符号帳で選択したピッチ周期に
応じて、複数個の駆動符号帳を切り替えて用いるもので
ある。これにより、伝送情報を増やさずに入力音声の特
徴に適応した駆動符号帳を用いることができる。
示す従来の音声符号化復号化方法では、単一の駆動符号
帳を用いて合成音声を生成している。低ビットレートで
も品質の高い符号化音声を得るためには、駆動符号帳に
格納する時系列ベクトルはパルスを多く含む非雑音的な
ものとなる。このため、背景雑音や摩擦性子音など雑音
的な音声を符号化、合成した場合、符号化音声はジリジ
リ、チリチリといった不自然な音を発するという問題が
あった。駆動符号帳を雑音的な時系列ベクトルからのみ
構成すればこの問題は解決するが、符号化音声全体とし
ての品質が劣化する。
化復号化方法では、入力音声の状態に応じて複数の駆動
符号帳を切り替えて符号化音声を生成している。これに
より例えば入力音声が雑音的な無声部分では雑音的な時
系列ベクトルから構成された駆動符号帳を、またそれ以
外の有声部分では非雑音的な時系列ベクトルから構成さ
れた駆動符号帳を用いることができ、雑音的な音声を符
号化、合成しても不自然なジリジリした音を発すること
はなくなる。しかし、復号化側でも符号化側と同じ駆動
符号帳を用いるために、新たにどの駆動符号帳を使用し
たかの情報を符号化、伝送する必要が生じ、これが低ビ
ットレート化の妨げになるという問題があった。
数の駆動符号帳を切り替える従来の音声符号化復号化方
法では、適応符号帳で選択されるピッチ周期に応じて駆
動符号帳を切り替えている。しかし、適応符号帳で選択
されるピッチ周期は実際の音声のピッチ周期とは異な
り、その値からだけでは入力音声の状態が雑音的か非雑
音的かを判定できないので、音声の雑音的な部分の符号
化音声が不自然であるという課題は解決されない。
されたものであり、低ビットレートでも品質の高い音声
を再生する音声符号化復号化方法及び装置を提供するも
のである。
めにこの発明の音声符号化方法は、スペクトル情報、パ
ワー情報、ピッチ情報のうち少なくとも1つの符号また
は符号化結果を用いて該符号化区間における音声の雑音
性の度合いを評価し、評価結果に応じて複数の駆動符号
帳のうち1つを選択するようにした。
している時系列ベクトルの雑音性の度合いが異なる複数
の駆動符号帳を備え、音声の雑音性の度合いの評価結果
に応じて、複数の駆動符号帳を切り替えるようにした。
の雑音性の度合いの評価結果に応じて、駆動符号帳に格
納している時系列ベクトルの雑音性の度合いを変化させ
るようにした。
的な時系列ベクトルを格納している駆動符号帳を備え、
音声の雑音性の度合いの評価結果に応じて、駆動音源の
信号サンプルを間引くことにより雑音性の度合いが低い
時系列ベクトルを生成するようにした。
的な時系列ベクトルを格納している第1の駆動符号帳
と、非雑音的なの時系列ベクトルを格納している第2の
駆動符号帳とを備え、音声の雑音性の度合いの評価結果
に応じて、第1の駆動符号帳の時系列ベクトルと第2の
駆動符号帳の時系列ベクトルを重み付けし加算した時系
列ベクトルを生成するようにした。
トル情報、パワー情報、ピッチ情報のうち少なくとも1
つの符号または復号化結果を用いて該復号化区間におけ
る音声の雑音性の度合いを評価し、評価結果に応じて複
数の駆動符号帳のうちの1つを選択するようにした。
している時系列ベクトルの雑音性の度合いが異なる複数
の駆動符号帳を備え、音声の雑音性の度合いの評価結果
に応じて、複数の駆動符号帳を切り替えるようにした。
の雑音性の度合いの評価結果に応じて、駆動符号帳に格
納している時系列ベクトルの雑音性の度合いを変化させ
るようにした。
的な時系列ベクトルを格納している駆動符号帳を備え、
音声の雑音性の度合いの評価結果に応じて、駆動音源の
信号サンプルを間引くことにより雑音性の度合いが低い
時系列ベクトルを生成するようにした。
的な時系列ベクトルを格納している第1の駆動符号帳
と、非雑音的な時系列ベクトルを格納している第2の駆
動符号帳とを備え、音声の雑音性の度合いの評価結果に
応じて、第1の駆動符号帳の時系列ベクトルと第2の駆
動符号帳の時系列ベクトルを重み付けし加算した時系列
ベクトルを生成するようにした。
音声のスペクトル情報を符号化し、符号化結果の1要素
として出力するスペクトル情報符号化部と、このスペク
トル情報符号化部からの符号化されたスペクトル情報か
ら得られるスペクトル情報、パワー情報のうち少なくと
も1つの符号または符号化結果を用いて該符号化区間に
おける音声の雑音性の度合いを評価し、評価結果を出力
する雑音度評価部と、非雑音的な複数の時系列ベクトル
が記憶された第1の駆動符号帳と、雑音的な複数の時系
列ベクトルが記憶された第2の駆動符号帳と、前記雑音
度評価部の評価結果により、第1の駆動符号帳と第2の
駆動符号帳とを切り替える駆動符号帳切替部と、前記第
1の駆動符号帳または第2の駆動符号帳からの時系列ベ
クトルをそれぞれの時系列ベクトルのゲインに応じて重
み付けし加算する重み付け加算部と、この重み付けされ
た時系列ベクトルを駆動音源信号とし、この駆動音源信
号と前記スペクトル情報符号化部からの符号化されたス
ペクトル情報とに基づいて符号化音声を得る合成フィル
タと、この符号化音声と前記入力音声との距離を求め、
距離が最小となる駆動符号、ゲインを探索し、その結果
を駆動符号,ゲインの符号を符号化結果として出力する
距離計算部とを備えた。
クトル情報の符号からスペクトル情報を復号化するスペ
クトル情報復号化部と、このスペクトル情報復号化部か
らの復号化されたスペクトル情報から得られるスペクト
ル情報、パワー情報のうち少なくとも1つの復号化結果
または前記スペクトル情報の符号を用いて該復号化区間
における音声の雑音性の度合いを評価し、評価結果を出
力する雑音度評価部と、非雑音的な複数の時系列ベクト
ルが記憶された第1の駆動符号帳と、雑音的な複数の時
系列ベクトルが記憶された第2の駆動符号帳と、前記雑
音度評価部の評価結果により、第1の駆動符号帳と第2
の駆動符号帳とを切り替える駆動符号帳切替部と、前記
第1の駆動符号帳または第2の駆動符号帳からの時系列
ベクトルをそれぞれの時系列ベクトルのゲインに応じて
重み付けし加算する重み付け加算部と、この重み付けさ
れた時系列ベクトルを駆動音源信号とし、この駆動音源
信号と前記スペクトル情報復号化部からの復号化された
スペクトル情報とに基づいて復号化音声を得る合成フィ
ルタとを備えた。
動線形予測(CELP)音声符号化装置において、スペ
クトル情報、パワー情報、ピッチ情報のうち少なくとも
1つの符号または符号化結果を用いて該符号化区間にお
ける音声の雑音性の度合いを評価する雑音度評価部と、
上記雑音度評価部の評価結果に応じて複数の駆動符号帳
を切り替える駆動符号帳切替部とを備えたことを特徴と
する。
動線形予測(CELP)音声復号化装置において、スペ
クトル情報、パワー情報、ピッチ情報のうち少なくとも
1つの符号または復号化結果を用いて該復号化区間にお
ける音声の雑音性の度合いを評価する雑音度評価部と、
上記雑音度評価部の評価結果に応じて複数の駆動符号帳
を切り替える駆動符号帳切替部とを備えたことを特徴と
する。
明の実施の形態について説明する。
声符号化方法及び音声復号化方法の実施の形態1の全体
構成を示す。図中、1は符号化部、2は復号化部、3は
多重化部、4は分離部である。符号化部1は、線形予測
パラメータ分析部5、線形予測パラメータ符号化部6、
合成フィルタ7、適応符号帳8、ゲイン符号化部10、
距離計算部11、第1の駆動符号帳19、第2の駆動符
号帳20、雑音度評価部24、駆動符号帳切替部25、
重み付け加算部38より構成されている。また、復号化
部2は線形予測パラメータ復号化部12、合成フィルタ
13、適応符号帳14、第1の駆動符号帳22、第2の
駆動符号帳23、雑音度評価部26、駆動符号帳切替部
27、ゲイン復号化部16、重み付け加算部39より構
成されている。図1中5は入力音声S1を分析し、音声
のスペクトル情報である線形予測パラメータを抽出する
スペクトル情報分析部としての線形予測パラメータ分析
部、6はスペクトル情報であるその線形予測パラメータ
を符号化し、符号化した線形予測パラメータを合成フィ
ルタ7の係数として設定するスペクトル情報符号化部と
しての線形予測パラメータ符号化部、19、22は非雑
音的な複数の時系列ベクトルが記憶された第1の駆動符
号帳、20、23は雑音的な複数の時系列ベクトルが記
憶された第2の駆動符号帳、24、26は雑音の度合い
を評価する雑音度評価部、25、27は雑音の度合いに
より駆動符号帳を切り替える駆動符号帳切替部である。
において、線形予測パラメータ分析部5は入力音声S1
を分析し、音声のスペクトル情報である線形予測パラメ
ータを抽出する。線形予測パラメータ符号化部6はその
線形予測パラメータを符号化し、符号化した線形予測パ
ラメータを合成フィルタ7の係数として設定するととも
に、雑音度評価部24へ出力する。次に、音源情報の符
号化について説明する。適応符号帳8には、過去の駆動
音源信号が記憶されており、距離計算部11から入力さ
れる適応符号に対応して過去の駆動音源信号を周期的に
繰り返した時系列ベクトルを出力する。雑音度評価部2
4は、前記線形予測パラメータ符号化部6から入力され
た符号化した線形予測パラメータと適応符号とから、例
えば図2に示すようにスペクトルの傾斜、短期予測利
得、ピッチ変動から該符号化区間の雑音の度合いを評価
し、評価結果を駆動符号帳切替部25に出力する。駆動
符号帳切替部25は前記雑音度の評価結果に応じて、例
えば雑音度が低ければ第1の駆動符号帳19を、雑音度
が高ければ第2の駆動符号帳20を用いるとして符号化
に用いる駆動符号帳を切り替える。
数の時系列ベクトル、例えば学習用音声とその符号化音
声との歪みが小さくなるように学習して構成された複数
の時系列ベクトルが記憶されている。また、第2の駆動
符号帳20には、雑音的な複数の時系列ベクトル、例え
ばランダム雑音から生成した複数の時系列ベクトルが記
憶されており、距離計算部11から入力されるそれぞれ
駆動符号に対応した時系列ベクトルを出力する。適応符
号帳8、第1の駆動音源符号帳19または第2の駆動符
号帳20からの各時系列ベクトルは、ゲイン符号化部1
0から与えられるそれぞれのゲインに応じて重み付け加
算部38で重み付けして加算され、その加算結果を駆動
音源信号として合成フィルタ7へ供給され符号化音声を
得る。距離計算部11は符号化音声と入力音声S1との
距離を求め、距離が最小となる適応符号、駆動符号、ゲ
インを探索する。以上符号化が終了した後、線形予測パ
ラメータの符号、入力音声と符号化音声との歪みを最小
にする適応符号、駆動符号,ゲインの符号を符号化結果
S2として出力する。以上がこの実施の形態1の音声符
号化方法に特徴的な動作である。
部2では、線形予測パラメータ復号化部12は線形予測
パラメータの符号から線形予測パラメータを復号化し、
合成フィルタ13の係数として設定するとともに、雑音
度評価部26へ出力する。次に、音源情報の復号化につ
いて説明する。適応符号帳14は、適応符号に対応し
て、過去の駆動音源信号を周期的に繰り返した時系列ベ
クトルを出力する。雑音度評価部26は、前記線形予測
パラメータ復号化部12から入力された復号化した線形
予測パラメータと適応符号とから符号化部1の雑音度評
価部24と同様の方法で雑音の度合いを評価し、評価結
果を駆動符号帳切替部27に出力する。駆動符号帳切替
部27は前記雑音度の評価結果に応じて、符号化部1の
駆動符号帳切替部25と同様に第1の駆動符号帳22と
第2の駆動符号帳23とを切り替える。
の時系列ベクトル、例えば学習用音声とその符号化音声
との歪みが小さくなるように学習して構成された複数の
時系列ベクトルが、第2の駆動符号帳23には雑音的な
複数の時系列ベクトル、例えばランダム雑音から生成し
た複数の時系列ベクトルが記憶されており、それぞれ駆
動符号に対応した時系列ベクトルを出力する。適応符号
帳14と第1の駆動符号帳22または第2の駆動符号帳
23からの時系列ベクトルは、ゲイン復号化部16でゲ
インの符号から復号化したそれぞれのゲインに応じて重
み付け加算部39で重み付けして加算され、その加算結
果を駆動音源信号として合成フィルタ13へ供給され出
力音声S3が得られる。以上がこの実施の形態1の音声
復号化方法に特徴的な動作である。
音の度合いを符号および符号化結果から評価し、評価結
果に応じて異なる駆動符号帳を用いることにより、少な
い情報量で、品質の高い音声を再生することができる。
9,20,22,23には、複数の時系列ベクトルが記
憶されている場合を説明したが、少なくとも1つの時系
列ベクトルが記憶されていれば、実施可能である。
2つの駆動符号帳を切り替えて用いているが、これに代
え、3つ以上の駆動符号帳を備え、雑音の度合いに応じ
て切り替えて用いるとしても良い。この実施の形態2に
よれば、音声を雑音/非雑音の2通りだけでなく、やや
雑音的であるなどの中間的な音声に対してもそれに適し
た駆動符号帳を用いることができるので、品質の高い音
声を再生することができる。
号を付けた図3は、この発明の音声符号化方法及び音声
復号化方法の実施の形態3の全体構成を示し、図中2
8、30は雑音的な時系列ベクトルを格納した駆動符号
帳、29、31は時系列ベクトルの低振幅なサンプルの
振幅値を零にするサンプル間引き部である。
において、線形予測パラメータ分析部5は入力音声S1
を分析し、音声のスペクトル情報である線形予測パラメ
ータを抽出する。線形予測パラメータ符号化部6はその
線形予測パラメータを符号化し、符号化した線形予測パ
ラメータを合成フィルタ7の係数として設定するととも
に、雑音度評価部24へ出力する。次に、音源情報の符
号化について説明する。適応符号帳8には、過去の駆動
音源信号が記憶されており、距離計算部11から入力さ
れる適応符号に対応して過去の駆動音源信号を周期的に
繰り返した時系列ベクトルを出力する。雑音度評価部2
4は、前記線形予測パラメータ符号化部6から入力され
た符号化した線形予測パラメータと適応符号とから、例
えばスペクトルの傾斜、短期予測利得、ピッチ変動から
該符号化区間の雑音の度合いを評価し、評価結果をサン
プル間引き部29に出力する。
から生成した複数の時系列ベクトルが記憶されており、
距離計算部11から入力される駆動符号に対応した時系
列ベクトルを出力する。サンプル間引き部29は、前記
雑音度の評価結果に応じて、雑音度が低ければ前記駆動
符号帳28から入力された時系列ベクトルに対して、例
えば所定の振幅値に満たないサンプルの振幅値を零にし
た時系列ベクトルを出力し、また、雑音度が高ければ前
記駆動符号帳28から入力された時系列ベクトルをその
まま出力する。適応符号帳8、サンプル間引き部29か
らの各時系列ベクトルは、ゲイン符号化部10から与え
られるそれぞれのゲインに応じて重み付け加算部38で
重み付けして加算され、その加算結果を駆動音源信号と
して合成フィルタ7へ供給され符号化音声を得る。距離
計算部11は符号化音声と入力音声S1との距離を求
め、距離が最小となる適応符号、駆動符号、ゲインを探
索する。以上符号化が終了した後、線形予測パラメータ
の符号、入力音声と符号化音声との歪みを最小にする適
応符号、駆動符号,ゲインの符号を符号化結果S2とし
て出力する。以上がこの実施の形態3の音声符号化方法
に特徴的な動作である。
部2では、線形予測パラメータ復号化部12は線形予測
パラメータの符号から線形予測パラメータを復号化し、
合成フィルタ13の係数として設定するとともに、雑音
度評価部26へ出力する。次に、音源情報の復号化につ
いて説明する。適応符号帳14は、適応符号に対応し
て、過去の駆動音源信号を周期的に繰り返した時系列ベ
クトルを出力する。雑音度評価部26は、前記線形予測
パラメータ復号化部12から入力された復号化した線形
予測パラメータと適応符号とから符号化部1の雑音度評
価部24と同様の方法で雑音の度合いを評価し、評価結
果をサンプル間引き部31に出力する。
列ベクトルを出力する。サンプル間引き部31は、前記
雑音度評価結果に応じて、前記符号化部1のサンプル間
引き部29と同様の処理により時系列ベクトルを出力す
る。適応符号帳14、サンプル間引き部31からの各時
系列ベクトルは、ゲイン復号化部16から与えられるそ
れぞれのゲインに応じて重み付け加算部39で重み付け
して加算され、その加算結果を駆動音源信号として合成
フィルタ13へ供給され出力音声S3が得られる。
列ベクトルを格納している駆動符号帳を備え、音声の雑
音性の度合いの評価結果に応じて、駆動音源の信号サン
プルを間引くことにより雑音性の度合いが低い駆動音源
を生成することにより、少ない情報量で、品質の高い音
声を再生することができる。また、複数の駆動符号帳を
備える必要がないので、駆動符号帳の記憶に要するメモ
リ量を少なくする効果もある。
時系列ベクトルのサンプルを間引く/間引かないの2通
りとしているが、これに代え、雑音の度合いに応じてサ
ンプルを間引く際の振幅閾値を変更するとしても良い。
この実施の形態4によれば、音声を雑音/非雑音の2通
りだけでなく、やや雑音的であるなどの中間的な音声に
対してもそれに適した時系列ベクトルを生成し、用いる
ことができるので、品質の高い音声を再生することがで
きる。
号を付けた図4は、この発明の音声符号化方法及び音声
復号化方法の実施の形態5の全体構成を示し、図中3
2、35は雑音的な時系列ベクトルを記憶している第1
の駆動符号帳、33、36は非雑音的な時系列ベクトル
を記憶している第2の駆動符号帳、34、37は重み決
定部である。
において、線形予測パラメータ分析部5は入力音声S1
を分析し、音声のスペクトル情報である線形予測パラメ
ータを抽出する。線形予測パラメータ符号化部6はその
線形予測パラメータを符号化し、符号化した線形予測パ
ラメータを合成フィルタ7の係数として設定するととも
に、雑音度評価部24へ出力する。次に、音源情報の符
号化について説明する。適応符号帳8には、過去の駆動
音源信号が記憶されており、距離計算部11から入力さ
れる適応符号に対応して過去の駆動音源信号を周期的に
繰り返した時系列ベクトルを出力する。雑音度評価部2
4は、前記線形予測パラメータ符号化部6から入力され
た符号化した線形予測パラメータと適応符号とから、例
えばスペクトルの傾斜、短期予測利得、ピッチ変動から
該符号化区間の雑音の度合いを評価し、評価結果を重み
決定部34に出力する。
ム雑音から生成した複数の雑音的な時系列ベクトルが記
憶されており、駆動符号に対応した時系列ベクトルを出
力する。第2の駆動符号帳33には、例えば学習用音声
とその符号化音声との歪みが小さくなるように学習して
構成された複数の時系列ベクトルが記憶されており、距
離計算部11から入力される駆動符号に対応した時系列
ベクトルを出力する。重み決定部34は前記雑音度評価
部24から入力された雑音度の評価結果に応じて、例え
ば図5に従って、第1の駆動符号帳32からの時系列ベ
クトルと第2の駆動符号帳33からの時系列ベクトルに
与える重みを決定する。第1の駆動符号帳32、第2の
駆動符号帳33からの各時系列ベクトルは上記重み決定
部34から与えられる重みに応じて重み付けして加算さ
れる。適応符号帳8から出力された時系列ベクトルと、
前記重み付け加算して生成された時系列ベクトルはゲイ
ン符号化部10から与えられるそれぞれのゲインに応じ
て重み付け加算部38で重み付けして加算され、その加
算結果を駆動音源信号として合成フィルタ7へ供給し符
号化音声を得る。距離計算部11は符号化音声と入力音
声S1との距離を求め、距離が最小となる適応符号、駆
動符号、ゲインを探索する。この符号化が終了した後、
線形予測パラメータの符号、入力音声と符号化音声との
歪みを最小にする適応符号、駆動符号、ゲインの符号を
符号化結果として出力する。
部2では、線形予測パラメータ復号化部12は線形予測
パラメータの符号から線形予測パラメータを復号化し、
合成フィルタ13の係数として設定するとともに、雑音
度評価部26へ出力する。次に、音源情報の復号化につ
いて説明する。適応符号帳14は、適応符号に対応し
て、過去の駆動音源信号を周期的に繰り返した時系列ベ
クトルを出力する。雑音度評価部26は、前記線形予測
パラメータ復号化部12から入力された復号化した線形
予測パラメータと適応符号とから符号化部1の雑音度評
価部24と同様の方法で雑音の度合いを評価し、評価結
果を重み決定部37に出力する。
号帳36は駆動符号に対応した時系列ベクトルを出力す
る。重み決定部37は前記雑音度評価部26から入力さ
れた雑音度評価結果に応じて、符号化部1の重み決定部
34と同様に重みを与えるとする。第1の駆動符号帳3
5、第2の駆動符号帳36からの各時系列ベクトルは上
記重み決定部37から与えれるそれぞれの重みに応じて
重み付けして加算される。適応符号帳14から出力され
た時系列ベクトルと、前記重み付け加算して生成された
時系列ベクトルは、ゲイン復号化部16でゲインの符号
から復号化したそれぞれのゲインに応じて重み付け加算
部39で重み付けして加算され、その加算結果が駆動音
源信号として合成フィルタ13へ供給され出力音声S3
が得られる。
度合いを符号および符号化結果から評価し、評価結果に
応じて雑音的な時系列ベクトルと非雑音的な時系列ベク
トルを重み付き加算して用いることにより、少ない情報
量で、品質の高い音声を再生することができる。
さらに、雑音の度合いの評価結果に応じてゲインの符号
帳を変更するとしても良い。この実施の形態6によれ
ば、駆動符号帳に応じて最適なゲインの符号帳を用いる
ことができるので、品質の高い音声を再生することがで
きる。
は、音声の雑音の度合いを評価し、その評価結果に応じ
て駆動符号帳を切り替えているが、有声の立ち上がりや
破裂性の子音などをそれぞれ判定、評価し、その評価結
果に応じて駆動符号帳を切り替えても良い。この実施の
形態7によれば、音声の雑音的な状態だけでなく、有声
の立ち上がりや破裂性子音などさらに細かく分類し、そ
れぞれに適した駆動符号帳を用いることができるので、
品質の高い音声を再生することができる。
は、図2に示すスペクトル傾斜、短期予測利得、ピッチ
変動から、符号化区間の雑音の度合いを評価している
が、適応符号帳出力に対するゲイン値の大小を用いて評
価しても良い。
号化方法並びに音声符号化装置及び音声復号化装置によ
れば、スペクトル情報、パワー情報、ピッチ情報のうち
少なくとも1つの符号または符号化結果を用いて該符号
化区間における音声の雑音性の度合いを評価し、評価結
果に応じて異なる駆動符号帳を用いるので、少ない情報
量で品質の高い音声を再生することができる。
び音声復号化方法で、格納している駆動音源の雑音性の
度合いが異なる複数の駆動符号帳を備え、音声の雑音性
の度合いの評価結果に応じて、複数の駆動符号帳を切り
替えて用いるので、少ない情報量で品質の高い音声を再
生することができる。
び音声復号化方法で、音声の雑音性の度合いの評価結果
に応じて、駆動符号帳に格納している時系列ベクトルの
雑音性の度合いを変化させたので、少ない情報量で品質
の高い音声を再生することができる。
び音声復号化方法で、雑音的な時系列ベクトルを格納し
ている駆動符号帳を備え、音声の雑音性の度合いの評価
結果に応じて、時系列ベクトルの信号サンプルを間引く
ことにより雑音性の度合いが低い時系列ベクトルを生成
したので、少ない情報量で品質の高い音声を再生するこ
とができる。
び音声復号化方法で、雑音的な時系列ベクトルを格納し
ている第1の駆動符号帳と、非雑音的な時系列ベクトル
を格納している第2の駆動符号帳とを備え、音声の雑音
性の度合いの評価結果に応じて、第1の駆動符号帳の時
系列ベクトルと第2の駆動符号帳の時系列ベクトルを重
み付け加算した時系列ベクトルを生成したので、少ない
情報量で品質の高い音声を再生することができる。
置の実施の形態1の全体構成を示すブロック図である。
価の説明に供する表である。
置の実施の形態3の全体構成を示すブロック図である。
置の実施の形態5の全体構成を示すブロック図である。
理の説明に供する略線図である。
構成を示すブロック図である。
装置の全体構成を示すブロック図である。
Claims (5)
- 【請求項1】 符号駆動線形予測(Code-Excited Linea
r Prediction:CELP)音声符号化方法において、ス
ペクトル情報、パワー情報、ピッチ情報のうち少なくと
も1つの符号または符号化結果を用いて該符号化区間に
おける音声の雑音性の度合いを評価し、評価結果に応じ
て複数の駆動符号帳のうち1つを選択し、 選択した駆動符号帳から出力された時系列ベクトルを評
価結果に応じた雑音性の度合いを有する時系列ベクトル
に変換して出力することを特徴とする音声符号化方法。 - 【請求項2】 雑音的な時系列ベクトルを格納している
駆動符号帳を備え、音声の雑音性の度合いの評価結果に
応じて、上記時系列ベクトルの信号サンプルを間引くこ
とにより雑音性の度合いが低い時系列ベクトルを生成す
ることを特徴とする請求項1に記載の音声符号化方法。 - 【請求項3】 符号駆動線形予測(CELP)音声符号
化方法において、スペクトル情報、パワー情報、ピッチ
情報のうち少なくとも1つの符号または符号化結果を用
いて該符号化区間における音声の雑音性の度合いを評価
し、駆動符号帳から出力された時系列ベクトルを評価結
果に応じた雑音性の度合を有する時系列ベクトルに変換
して出力することを特徴とする音声符号化方法。 - 【請求項4】 符号駆動線形予測(CELP)音声符号
化装置において、スペクトル情報、パワー情報、ピッチ
情報のうち少なくとも1つの符号または符号化結果を用
いて該符号化区間における音声の雑音性の度合いを評価
する雑音度評価部と、 上記雑音度評価部の評価結果に応じて複数の駆動符号帳
を切り替える駆動符号切替部と、 上記雑音度評価部が評価した評価結果を入力し、上記駆
動符号帳切替部が切り替えた駆動符号帳から出力された
時系列ベクトルを評価結果に応じた雑音性の度合を有す
る時系列ベクトルに変換して出力する雑音度制御部とを
備えたことを特徴とする音声符号化装置。 - 【請求項5】 符号駆動線形予測(CELP)音声符号
化装置において、スペクトル情報、パワー情報、ピッチ
情報のうち少なくとも1つの符号または符号化結果を用
いて該符号化区間における音声の雑音性の度合いを評価
する雑音度評価部と、 上記雑音度評価部が評価した評価結果を入力し、駆動符
号帳から出力された時系列ベクトルを評価結果に応じた
雑音性の度合を有する時系列ベクトルに変換して出力す
る雑音度制御部とを備えたことを特徴とする音声符号化
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002202211A JP3736801B2 (ja) | 1997-12-24 | 2002-07-11 | 音声復号化方法及び音声復号化装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9-354754 | 1997-12-24 | ||
JP35475497 | 1997-12-24 | ||
JP2002202211A JP3736801B2 (ja) | 1997-12-24 | 2002-07-11 | 音声復号化方法及び音声復号化装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000526920A Division JP3346765B2 (ja) | 1997-12-24 | 1998-12-07 | 音声復号化方法及び音声復号化装置 |
Related Child Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003312063A Division JP3563400B2 (ja) | 1997-12-24 | 2003-09-04 | 音声復号化装置及び音声復号化方法 |
JP2004372545A Division JP4170288B2 (ja) | 1997-12-24 | 2004-12-24 | 音声符号化方法及び音声符号化装置 |
JP2005175020A Division JP3746067B2 (ja) | 1997-12-24 | 2005-06-15 | 音声復号化方法及び音声復号化装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003036099A true JP2003036099A (ja) | 2003-02-07 |
JP2003036099A5 JP2003036099A5 (ja) | 2005-08-25 |
JP3736801B2 JP3736801B2 (ja) | 2006-01-18 |
Family
ID=26580127
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002202211A Expired - Lifetime JP3736801B2 (ja) | 1997-12-24 | 2002-07-11 | 音声復号化方法及び音声復号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3736801B2 (ja) |
-
2002
- 2002-07-11 JP JP2002202211A patent/JP3736801B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP3736801B2 (ja) | 2006-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4916521B2 (ja) | 音声復号化方法及び音声符号化方法及び音声復号化装置及び音声符号化装置 | |
JP3746067B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP4800285B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP4510977B2 (ja) | 音声符号化方法および音声復号化方法とその装置 | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP3144284B2 (ja) | 音声符号化装置 | |
JP4170288B2 (ja) | 音声符号化方法及び音声符号化装置 | |
JP3563400B2 (ja) | 音声復号化装置及び音声復号化方法 | |
JP3736801B2 (ja) | 音声復号化方法及び音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041018 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050218 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050218 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20050218 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20050411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050615 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050620 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050929 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20051011 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051021 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081104 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091104 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091104 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101104 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111104 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121104 Year of fee payment: 7 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121104 Year of fee payment: 7 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121104 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131104 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |