JP2003036099A

JP2003036099A - 音声符号化方法及び音声符号化装置

Info

Publication number: JP2003036099A
Application number: JP2002202211A
Authority: JP
Inventors: Tadashi Yamaura; 正山浦
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1997-12-24
Filing date: 2002-07-11
Publication date: 2003-02-07
Anticipated expiration: 2018-12-07
Also published as: JP3736801B2

Abstract

(57)【要約】【課題】音声信号をデジタル信号に圧縮符号化する音
声符号化復号化において、少ない情報量で品質の高い音
声を再生する。【解決手段】符号駆動線形予測（ＣＥＬＰ）音声符号
化において、スペクトル情報、パワー情報、ピッチ情報
のうち少なくとも１つの符号又は符号化結果を用いて該
符号化区間における音声の雑音性の度合を評価し、評価
結果に応じて異なる駆動符号帳１９、２０を用いるよう
にした。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は音声信号をディジ
タル信号に圧縮符号化復号化する際に使用する音声符号
化・復号化方法及び音声符号化・復号化装置に関し、特
に低ビットレートで品質の高い音声を再生するための音
声符号化方法及び音声復号化方法並びに音声符号化装置
及び音声復号化装置に関する。

【０００２】

【従来の技術】従来、高能率音声符号化方法としては、
符号駆動線形予測（Code-Excited Linear Prediction：
ＣＥＬＰ）符号化が代表的であり、その技術について
は、「Code-excited linear prediction（ＣＥＬＰ）：
High-quality speech at very low bit rates」（M.R.S
hroeder and B.S.Atal著、ICASSP '85, pp.937-940, 19
85）に述べられている。

【０００３】図６は、ＣＥＬＰ音声符号化復号化方法の
全体構成の一例を示すもので、図中１０１は符号化部、
１０２は復号化部、１０３は多重化手段、１０４は分離
手段である。符号化部１０１は線形予測パラメータ分析
手段１０５、線形予測パラメータ符号化手段１０６、合
成フィルタ１０７、適応符号帳１０８、駆動符号帳１０
９、ゲイン符号化手段１１０、距離計算手段１１１、重
み付け加算手段１３８より構成されている。また、復号
化部１０２は線形予測パラメータ復号化手段１１２、合
成フィルタ１１３、適応符号帳１１４、駆動符号帳１１
５、ゲイン復号化手段１１６、重み付け加算手段１３９
より構成されている。

【０００４】ＣＥＬＰ音声符号化では、5〜50ms程度を
１フレームとして、そのフレームの音声をスペクトル情
報と音源情報に分けて符号化する。まず、ＣＥＬＰ音声
符号化方法の動作について説明する。符号化部１０１に
おいて、線形予測パラメータ分析手段１０５は入力音声
Ｓ１０１を分析し、音声のスペクトル情報である線形予
測パラメータを抽出する。線形予測パラメータ符号化手
段１０６はその線形予測パラメータを符号化し、符号化
した線形予測パラメータを合成フィルタ１０７の係数と
して設定する。

【０００５】次に音源情報の符号化について説明する。
適応符号帳１０８には、過去の駆動音源信号が記憶され
ており、距離計算手段１１１から入力される適応符号に
対応して過去の駆動音源信号を周期的に繰り返した時系
列ベクトルを出力する。駆動符号帳１０９には、例えば
学習用音声とその符号化音声との歪みが小さくなるよう
に学習して構成された複数の時系列ベクトルが記憶され
ており、距離計算手段１１１から入力される駆動符号に
対応した時系列ベクトルを出力する。適応符号帳１０
８、駆動符号帳１０９からの各時系列ベクトルはゲイン
符号化手段１１０から与えられるそれぞれのゲインに応
じて重み付け加算手段１３８で重み付けして加算され、
その加算結果を駆動音源信号として合成フィルタ１０７
へ供給し符号化音声を得る。距離計算手段１１１は符号
化音声と入力音声Ｓ１０１との距離を求め、距離が最小
となる適応符号、駆動符号、ゲインを探索する。上記符
号化が終了した後、線形予測パラメータの符号、入力音
声と符号化音声との歪みを最小にする適応符号、駆動符
号、ゲインの符号を符号化結果として出力する。

【０００６】次にＣＰＥＬ音声復号化方法の動作につい
て説明する。一方復号化部１０２において、線形予測パ
ラメータ復号化手段１１２は線形予測パラメータの符号
から線形予測パラメータを復号化し、合成フィルタ１１
３の係数として設定する。次に、適応符号帳１１４は、
適応符号に対応して、過去の駆動音源信号を周期的に繰
り返した時系列ベクトルを出力し、また駆動符号帳１１
５は駆動符号に対応した時系列ベクトルを出力する。こ
れらの時系列ベクトルは、ゲイン復号化手段１１６でゲ
インの符号から復号化したそれぞれのゲインに応じて重
み付け加算手段１３９で重み付けして加算され、その加
算結果が駆動音源信号として合成フィルタ１１３へ供給
され出力音声Ｓ１０３が得られる。

【０００７】またＣＥＬＰ音声符号化復号化方法で再生
音声品質の向上を目的として改良された従来の音声符号
化復号化方法として、「Phonetically-based vector ex
citation coding of speech at 3.6kbps」（S.Wang and
A.Gersho著、ICASSP '89, pp.49-52, 1989）に示され
たものがある。図６との対応手段分に同一符号を付けた
図７は、この従来の音声符号化復号化方法の全体構成の
一例を示し、図中符号化部１０１において１１７は音声
状態判定手段、１１８駆動符号帳切替手段、１１９は第
１の駆動符号帳、１２０は第２の駆動符号帳である。ま
た図中復号化手段１０２において１２１は駆動符号帳切
替手段、１２２は第１の駆動符号帳、１２３は第２の駆
動符号帳である。このような構成による符号化復号化方
法の動作を説明する。まず符号化手段１０１において、
音声状態判定手段１１７は入力音声Ｓ１０１を分析し、
音声の状態を例えば有声／無声の２つの状態のうちどち
らであるかを判定する。駆動符号帳切替手段１１８はそ
の音声状態判定結果に応じて、例えば有声であれば第１
の駆動符号帳１１９を、無声であれば第２の駆動符号帳
１２０を用いるとして符号化に用いる駆動符号帳を切り
替え、また、どちらの駆動符号帳を用いたかを符号化す
る。

【０００８】次に復号化手段１０２において、駆動符号
帳切替手段１２１は符号化手段１０１でどちらの駆動符
号帳を用いたかの符号に応じて、符号化手段１０１で用
いたのと同じ駆動符号帳を用いるとして第１の駆動符号
帳１２２と第２の駆動符号帳１２３とを切り替える。こ
のように構成することにより、音声の各状態毎に符号化
に適した駆動符号帳を用意し、入力された音声の状態に
応じて駆動符号帳を切り替えて用いることで再生音声の
品質を向上することができる。

【０００９】また送出ビット数を増加することなく、複
数の駆動符号帳を切り替える従来の音声符号化復号化方
法として特開平８−１８５１９８号公報に開示されたも
のがある。これは、適応符号帳で選択したピッチ周期に
応じて、複数個の駆動符号帳を切り替えて用いるもので
ある。これにより、伝送情報を増やさずに入力音声の特
徴に適応した駆動符号帳を用いることができる。

【００１０】

【発明が解決しようとする課題】上述したように図６に
示す従来の音声符号化復号化方法では、単一の駆動符号
帳を用いて合成音声を生成している。低ビットレートで
も品質の高い符号化音声を得るためには、駆動符号帳に
格納する時系列ベクトルはパルスを多く含む非雑音的な
ものとなる。このため、背景雑音や摩擦性子音など雑音
的な音声を符号化、合成した場合、符号化音声はジリジ
リ、チリチリといった不自然な音を発するという問題が
あった。駆動符号帳を雑音的な時系列ベクトルからのみ
構成すればこの問題は解決するが、符号化音声全体とし
ての品質が劣化する。

【００１１】また改良された図７に示す従来の音声符号
化復号化方法では、入力音声の状態に応じて複数の駆動
符号帳を切り替えて符号化音声を生成している。これに
より例えば入力音声が雑音的な無声部分では雑音的な時
系列ベクトルから構成された駆動符号帳を、またそれ以
外の有声部分では非雑音的な時系列ベクトルから構成さ
れた駆動符号帳を用いることができ、雑音的な音声を符
号化、合成しても不自然なジリジリした音を発すること
はなくなる。しかし、復号化側でも符号化側と同じ駆動
符号帳を用いるために、新たにどの駆動符号帳を使用し
たかの情報を符号化、伝送する必要が生じ、これが低ビ
ットレート化の妨げになるという問題があった。

【００１２】また送出ビット数を増加することなく、複
数の駆動符号帳を切り替える従来の音声符号化復号化方
法では、適応符号帳で選択されるピッチ周期に応じて駆
動符号帳を切り替えている。しかし、適応符号帳で選択
されるピッチ周期は実際の音声のピッチ周期とは異な
り、その値からだけでは入力音声の状態が雑音的か非雑
音的かを判定できないので、音声の雑音的な部分の符号
化音声が不自然であるという課題は解決されない。

【００１３】この発明はかかる課題を解決するためにな
されたものであり、低ビットレートでも品質の高い音声
を再生する音声符号化復号化方法及び装置を提供するも
のである。

【００１４】

【課題を解決するための手段】上述の課題を解決するた
めにこの発明の音声符号化方法は、スペクトル情報、パ
ワー情報、ピッチ情報のうち少なくとも１つの符号また
は符号化結果を用いて該符号化区間における音声の雑音
性の度合いを評価し、評価結果に応じて複数の駆動符号
帳のうち１つを選択するようにした。

【００１５】さらに次の発明の音声符号化方法は、格納
している時系列ベクトルの雑音性の度合いが異なる複数
の駆動符号帳を備え、音声の雑音性の度合いの評価結果
に応じて、複数の駆動符号帳を切り替えるようにした。

【００１６】さらに次の発明の音声符号化方法は、音声
の雑音性の度合いの評価結果に応じて、駆動符号帳に格
納している時系列ベクトルの雑音性の度合いを変化させ
るようにした。

【００１７】さらに次の発明の音声符号化方法は、雑音
的な時系列ベクトルを格納している駆動符号帳を備え、
音声の雑音性の度合いの評価結果に応じて、駆動音源の
信号サンプルを間引くことにより雑音性の度合いが低い
時系列ベクトルを生成するようにした。

【００１８】さらに次の発明の音声符号化方法は、雑音
的な時系列ベクトルを格納している第１の駆動符号帳
と、非雑音的なの時系列ベクトルを格納している第２の
駆動符号帳とを備え、音声の雑音性の度合いの評価結果
に応じて、第１の駆動符号帳の時系列ベクトルと第２の
駆動符号帳の時系列ベクトルを重み付けし加算した時系
列ベクトルを生成するようにした。

【００１９】また次の発明の音声復号化方法は、スペク
トル情報、パワー情報、ピッチ情報のうち少なくとも１
つの符号または復号化結果を用いて該復号化区間におけ
る音声の雑音性の度合いを評価し、評価結果に応じて複
数の駆動符号帳のうちの１つを選択するようにした。

【００２０】さらに次の発明の音声復号化方法は、格納
している時系列ベクトルの雑音性の度合いが異なる複数
の駆動符号帳を備え、音声の雑音性の度合いの評価結果
に応じて、複数の駆動符号帳を切り替えるようにした。

【００２１】さらに次の発明の音声復号化方法は、音声
の雑音性の度合いの評価結果に応じて、駆動符号帳に格
納している時系列ベクトルの雑音性の度合いを変化させ
るようにした。

【００２２】さらに次の発明の音声復号化方法は、雑音
的な時系列ベクトルを格納している駆動符号帳を備え、
音声の雑音性の度合いの評価結果に応じて、駆動音源の
信号サンプルを間引くことにより雑音性の度合いが低い
時系列ベクトルを生成するようにした。

【００２３】さらに次の発明の音声復号化方法は、雑音
的な時系列ベクトルを格納している第１の駆動符号帳
と、非雑音的な時系列ベクトルを格納している第２の駆
動符号帳とを備え、音声の雑音性の度合いの評価結果に
応じて、第１の駆動符号帳の時系列ベクトルと第２の駆
動符号帳の時系列ベクトルを重み付けし加算した時系列
ベクトルを生成するようにした。

【００２４】さらに次の発明の音声符号化装置は、入力
音声のスペクトル情報を符号化し、符号化結果の１要素
として出力するスペクトル情報符号化部と、このスペク
トル情報符号化部からの符号化されたスペクトル情報か
ら得られるスペクトル情報、パワー情報のうち少なくと
も１つの符号または符号化結果を用いて該符号化区間に
おける音声の雑音性の度合いを評価し、評価結果を出力
する雑音度評価部と、非雑音的な複数の時系列ベクトル
が記憶された第１の駆動符号帳と、雑音的な複数の時系
列ベクトルが記憶された第２の駆動符号帳と、前記雑音
度評価部の評価結果により、第１の駆動符号帳と第２の
駆動符号帳とを切り替える駆動符号帳切替部と、前記第
１の駆動符号帳または第２の駆動符号帳からの時系列ベ
クトルをそれぞれの時系列ベクトルのゲインに応じて重
み付けし加算する重み付け加算部と、この重み付けされ
た時系列ベクトルを駆動音源信号とし、この駆動音源信
号と前記スペクトル情報符号化部からの符号化されたス
ペクトル情報とに基づいて符号化音声を得る合成フィル
タと、この符号化音声と前記入力音声との距離を求め、
距離が最小となる駆動符号、ゲインを探索し、その結果
を駆動符号，ゲインの符号を符号化結果として出力する
距離計算部とを備えた。

【００２５】さらに次の発明の音声復号化装置は、スペ
クトル情報の符号からスペクトル情報を復号化するスペ
クトル情報復号化部と、このスペクトル情報復号化部か
らの復号化されたスペクトル情報から得られるスペクト
ル情報、パワー情報のうち少なくとも１つの復号化結果
または前記スペクトル情報の符号を用いて該復号化区間
における音声の雑音性の度合いを評価し、評価結果を出
力する雑音度評価部と、非雑音的な複数の時系列ベクト
ルが記憶された第１の駆動符号帳と、雑音的な複数の時
系列ベクトルが記憶された第２の駆動符号帳と、前記雑
音度評価部の評価結果により、第１の駆動符号帳と第２
の駆動符号帳とを切り替える駆動符号帳切替部と、前記
第１の駆動符号帳または第２の駆動符号帳からの時系列
ベクトルをそれぞれの時系列ベクトルのゲインに応じて
重み付けし加算する重み付け加算部と、この重み付けさ
れた時系列ベクトルを駆動音源信号とし、この駆動音源
信号と前記スペクトル情報復号化部からの復号化された
スペクトル情報とに基づいて復号化音声を得る合成フィ
ルタとを備えた。

【００２６】この発明に係る音声符号化装置は、符号駆
動線形予測（ＣＥＬＰ）音声符号化装置において、スペ
クトル情報、パワー情報、ピッチ情報のうち少なくとも
１つの符号または符号化結果を用いて該符号化区間にお
ける音声の雑音性の度合いを評価する雑音度評価部と、
上記雑音度評価部の評価結果に応じて複数の駆動符号帳
を切り替える駆動符号帳切替部とを備えたことを特徴と
する。

【００２７】この発明に係る音声復号化装置は、符号駆
動線形予測（ＣＥＬＰ）音声復号化装置において、スペ
クトル情報、パワー情報、ピッチ情報のうち少なくとも
１つの符号または復号化結果を用いて該復号化区間にお
ける音声の雑音性の度合いを評価する雑音度評価部と、
上記雑音度評価部の評価結果に応じて複数の駆動符号帳
を切り替える駆動符号帳切替部とを備えたことを特徴と
する。

【００２８】

【発明の実施の形態】以下図面を参照しながら、この発
明の実施の形態について説明する。

【００２９】実施の形態１．図１は、この発明による音
声符号化方法及び音声復号化方法の実施の形態１の全体
構成を示す。図中、１は符号化部、２は復号化部、３は
多重化部、４は分離部である。符号化部１は、線形予測
パラメータ分析部５、線形予測パラメータ符号化部６、
合成フィルタ７、適応符号帳８、ゲイン符号化部１０、
距離計算部１１、第１の駆動符号帳１９、第２の駆動符
号帳２０、雑音度評価部２４、駆動符号帳切替部２５、
重み付け加算部３８より構成されている。また、復号化
部２は線形予測パラメータ復号化部１２、合成フィルタ
１３、適応符号帳１４、第１の駆動符号帳２２、第２の
駆動符号帳２３、雑音度評価部２６、駆動符号帳切替部
２７、ゲイン復号化部１６、重み付け加算部３９より構
成されている。図１中５は入力音声Ｓ１を分析し、音声
のスペクトル情報である線形予測パラメータを抽出する
スペクトル情報分析部としての線形予測パラメータ分析
部、６はスペクトル情報であるその線形予測パラメータ
を符号化し、符号化した線形予測パラメータを合成フィ
ルタ７の係数として設定するスペクトル情報符号化部と
しての線形予測パラメータ符号化部、１９、２２は非雑
音的な複数の時系列ベクトルが記憶された第１の駆動符
号帳、２０、２３は雑音的な複数の時系列ベクトルが記
憶された第２の駆動符号帳、２４、２６は雑音の度合い
を評価する雑音度評価部、２５、２７は雑音の度合いに
より駆動符号帳を切り替える駆動符号帳切替部である。

【００３０】以下、動作を説明する。まず、符号化部１
において、線形予測パラメータ分析部５は入力音声Ｓ１
を分析し、音声のスペクトル情報である線形予測パラメ
ータを抽出する。線形予測パラメータ符号化部６はその
線形予測パラメータを符号化し、符号化した線形予測パ
ラメータを合成フィルタ７の係数として設定するととも
に、雑音度評価部２４へ出力する。次に、音源情報の符
号化について説明する。適応符号帳８には、過去の駆動
音源信号が記憶されており、距離計算部１１から入力さ
れる適応符号に対応して過去の駆動音源信号を周期的に
繰り返した時系列ベクトルを出力する。雑音度評価部２
４は、前記線形予測パラメータ符号化部６から入力され
た符号化した線形予測パラメータと適応符号とから、例
えば図２に示すようにスペクトルの傾斜、短期予測利
得、ピッチ変動から該符号化区間の雑音の度合いを評価
し、評価結果を駆動符号帳切替部２５に出力する。駆動
符号帳切替部２５は前記雑音度の評価結果に応じて、例
えば雑音度が低ければ第１の駆動符号帳１９を、雑音度
が高ければ第２の駆動符号帳２０を用いるとして符号化
に用いる駆動符号帳を切り替える。

【００３１】第１の駆動符号帳１９には、非雑音的な複
数の時系列ベクトル、例えば学習用音声とその符号化音
声との歪みが小さくなるように学習して構成された複数
の時系列ベクトルが記憶されている。また、第２の駆動
符号帳２０には、雑音的な複数の時系列ベクトル、例え
ばランダム雑音から生成した複数の時系列ベクトルが記
憶されており、距離計算部１１から入力されるそれぞれ
駆動符号に対応した時系列ベクトルを出力する。適応符
号帳８、第１の駆動音源符号帳１９または第２の駆動符
号帳２０からの各時系列ベクトルは、ゲイン符号化部１
０から与えられるそれぞれのゲインに応じて重み付け加
算部３８で重み付けして加算され、その加算結果を駆動
音源信号として合成フィルタ７へ供給され符号化音声を
得る。距離計算部１１は符号化音声と入力音声Ｓ１との
距離を求め、距離が最小となる適応符号、駆動符号、ゲ
インを探索する。以上符号化が終了した後、線形予測パ
ラメータの符号、入力音声と符号化音声との歪みを最小
にする適応符号、駆動符号，ゲインの符号を符号化結果
Ｓ２として出力する。以上がこの実施の形態１の音声符
号化方法に特徴的な動作である。

【００３２】次に復号化部２について説明する。復号化
部２では、線形予測パラメータ復号化部１２は線形予測
パラメータの符号から線形予測パラメータを復号化し、
合成フィルタ１３の係数として設定するとともに、雑音
度評価部２６へ出力する。次に、音源情報の復号化につ
いて説明する。適応符号帳１４は、適応符号に対応し
て、過去の駆動音源信号を周期的に繰り返した時系列ベ
クトルを出力する。雑音度評価部２６は、前記線形予測
パラメータ復号化部１２から入力された復号化した線形
予測パラメータと適応符号とから符号化部１の雑音度評
価部２４と同様の方法で雑音の度合いを評価し、評価結
果を駆動符号帳切替部２７に出力する。駆動符号帳切替
部２７は前記雑音度の評価結果に応じて、符号化部１の
駆動符号帳切替部２５と同様に第１の駆動符号帳２２と
第２の駆動符号帳２３とを切り替える。

【００３３】第１の駆動符号帳２２には非雑音的な複数
の時系列ベクトル、例えば学習用音声とその符号化音声
との歪みが小さくなるように学習して構成された複数の
時系列ベクトルが、第２の駆動符号帳２３には雑音的な
複数の時系列ベクトル、例えばランダム雑音から生成し
た複数の時系列ベクトルが記憶されており、それぞれ駆
動符号に対応した時系列ベクトルを出力する。適応符号
帳１４と第１の駆動符号帳２２または第２の駆動符号帳
２３からの時系列ベクトルは、ゲイン復号化部１６でゲ
インの符号から復号化したそれぞれのゲインに応じて重
み付け加算部３９で重み付けして加算され、その加算結
果を駆動音源信号として合成フィルタ１３へ供給され出
力音声Ｓ３が得られる。以上がこの実施の形態１の音声
復号化方法に特徴的な動作である。

【００３４】この実施の形態１によれば、入力音声の雑
音の度合いを符号および符号化結果から評価し、評価結
果に応じて異なる駆動符号帳を用いることにより、少な
い情報量で、品質の高い音声を再生することができる。

【００３５】また、上記実施の形態では、駆動符号帳１
９，２０，２２，２３には、複数の時系列ベクトルが記
憶されている場合を説明したが、少なくとも１つの時系
列ベクトルが記憶されていれば、実施可能である。

【００３６】実施の形態２．上述の実施の形態１では、
２つの駆動符号帳を切り替えて用いているが、これに代
え、３つ以上の駆動符号帳を備え、雑音の度合いに応じ
て切り替えて用いるとしても良い。この実施の形態２に
よれば、音声を雑音／非雑音の２通りだけでなく、やや
雑音的であるなどの中間的な音声に対してもそれに適し
た駆動符号帳を用いることができるので、品質の高い音
声を再生することができる。

【００３７】実施の形態３．図１との対応部分に同一符
号を付けた図３は、この発明の音声符号化方法及び音声
復号化方法の実施の形態３の全体構成を示し、図中２
８、３０は雑音的な時系列ベクトルを格納した駆動符号
帳、２９、３１は時系列ベクトルの低振幅なサンプルの
振幅値を零にするサンプル間引き部である。

【００３８】以下、動作を説明する。まず、符号化部１
において、線形予測パラメータ分析部５は入力音声Ｓ１
を分析し、音声のスペクトル情報である線形予測パラメ
ータを抽出する。線形予測パラメータ符号化部６はその
線形予測パラメータを符号化し、符号化した線形予測パ
ラメータを合成フィルタ７の係数として設定するととも
に、雑音度評価部２４へ出力する。次に、音源情報の符
号化について説明する。適応符号帳８には、過去の駆動
音源信号が記憶されており、距離計算部１１から入力さ
れる適応符号に対応して過去の駆動音源信号を周期的に
繰り返した時系列ベクトルを出力する。雑音度評価部２
４は、前記線形予測パラメータ符号化部６から入力され
た符号化した線形予測パラメータと適応符号とから、例
えばスペクトルの傾斜、短期予測利得、ピッチ変動から
該符号化区間の雑音の度合いを評価し、評価結果をサン
プル間引き部２９に出力する。

【００３９】駆動符号帳２８には、例えばランダム雑音
から生成した複数の時系列ベクトルが記憶されており、
距離計算部１１から入力される駆動符号に対応した時系
列ベクトルを出力する。サンプル間引き部２９は、前記
雑音度の評価結果に応じて、雑音度が低ければ前記駆動
符号帳２８から入力された時系列ベクトルに対して、例
えば所定の振幅値に満たないサンプルの振幅値を零にし
た時系列ベクトルを出力し、また、雑音度が高ければ前
記駆動符号帳２８から入力された時系列ベクトルをその
まま出力する。適応符号帳８、サンプル間引き部２９か
らの各時系列ベクトルは、ゲイン符号化部１０から与え
られるそれぞれのゲインに応じて重み付け加算部３８で
重み付けして加算され、その加算結果を駆動音源信号と
して合成フィルタ７へ供給され符号化音声を得る。距離
計算部１１は符号化音声と入力音声Ｓ１との距離を求
め、距離が最小となる適応符号、駆動符号、ゲインを探
索する。以上符号化が終了した後、線形予測パラメータ
の符号、入力音声と符号化音声との歪みを最小にする適
応符号、駆動符号，ゲインの符号を符号化結果Ｓ２とし
て出力する。以上がこの実施の形態３の音声符号化方法
に特徴的な動作である。

【００４０】次に復号化部２について説明する。復号化
部２では、線形予測パラメータ復号化部１２は線形予測
パラメータの符号から線形予測パラメータを復号化し、
合成フィルタ１３の係数として設定するとともに、雑音
度評価部２６へ出力する。次に、音源情報の復号化につ
いて説明する。適応符号帳１４は、適応符号に対応し
て、過去の駆動音源信号を周期的に繰り返した時系列ベ
クトルを出力する。雑音度評価部２６は、前記線形予測
パラメータ復号化部１２から入力された復号化した線形
予測パラメータと適応符号とから符号化部１の雑音度評
価部２４と同様の方法で雑音の度合いを評価し、評価結
果をサンプル間引き部３１に出力する。

【００４１】駆動符号帳３０は駆動符号に対応した時系
列ベクトルを出力する。サンプル間引き部３１は、前記
雑音度評価結果に応じて、前記符号化部１のサンプル間
引き部２９と同様の処理により時系列ベクトルを出力す
る。適応符号帳１４、サンプル間引き部３１からの各時
系列ベクトルは、ゲイン復号化部１６から与えられるそ
れぞれのゲインに応じて重み付け加算部３９で重み付け
して加算され、その加算結果を駆動音源信号として合成
フィルタ１３へ供給され出力音声Ｓ３が得られる。

【００４２】この実施の形態３によれば、雑音的な時系
列ベクトルを格納している駆動符号帳を備え、音声の雑
音性の度合いの評価結果に応じて、駆動音源の信号サン
プルを間引くことにより雑音性の度合いが低い駆動音源
を生成することにより、少ない情報量で、品質の高い音
声を再生することができる。また、複数の駆動符号帳を
備える必要がないので、駆動符号帳の記憶に要するメモ
リ量を少なくする効果もある。

【００４３】実施の形態４．上述の実施の形態３では、
時系列ベクトルのサンプルを間引く／間引かないの２通
りとしているが、これに代え、雑音の度合いに応じてサ
ンプルを間引く際の振幅閾値を変更するとしても良い。
この実施の形態４によれば、音声を雑音／非雑音の２通
りだけでなく、やや雑音的であるなどの中間的な音声に
対してもそれに適した時系列ベクトルを生成し、用いる
ことができるので、品質の高い音声を再生することがで
きる。

【００４４】実施の形態５．図１との対応部分に同一符
号を付けた図４は、この発明の音声符号化方法及び音声
復号化方法の実施の形態５の全体構成を示し、図中３
２、３５は雑音的な時系列ベクトルを記憶している第１
の駆動符号帳、３３、３６は非雑音的な時系列ベクトル
を記憶している第２の駆動符号帳、３４、３７は重み決
定部である。

【００４５】以下、動作を説明する。まず、符号化部１
において、線形予測パラメータ分析部５は入力音声Ｓ１
を分析し、音声のスペクトル情報である線形予測パラメ
ータを抽出する。線形予測パラメータ符号化部６はその
線形予測パラメータを符号化し、符号化した線形予測パ
ラメータを合成フィルタ７の係数として設定するととも
に、雑音度評価部２４へ出力する。次に、音源情報の符
号化について説明する。適応符号帳８には、過去の駆動
音源信号が記憶されており、距離計算部１１から入力さ
れる適応符号に対応して過去の駆動音源信号を周期的に
繰り返した時系列ベクトルを出力する。雑音度評価部２
４は、前記線形予測パラメータ符号化部６から入力され
た符号化した線形予測パラメータと適応符号とから、例
えばスペクトルの傾斜、短期予測利得、ピッチ変動から
該符号化区間の雑音の度合いを評価し、評価結果を重み
決定部３４に出力する。

【００４６】第１の駆動符号帳３２には、例えばランダ
ム雑音から生成した複数の雑音的な時系列ベクトルが記
憶されており、駆動符号に対応した時系列ベクトルを出
力する。第２の駆動符号帳３３には、例えば学習用音声
とその符号化音声との歪みが小さくなるように学習して
構成された複数の時系列ベクトルが記憶されており、距
離計算部１１から入力される駆動符号に対応した時系列
ベクトルを出力する。重み決定部３４は前記雑音度評価
部２４から入力された雑音度の評価結果に応じて、例え
ば図５に従って、第１の駆動符号帳３２からの時系列ベ
クトルと第２の駆動符号帳３３からの時系列ベクトルに
与える重みを決定する。第１の駆動符号帳３２、第２の
駆動符号帳３３からの各時系列ベクトルは上記重み決定
部３４から与えられる重みに応じて重み付けして加算さ
れる。適応符号帳８から出力された時系列ベクトルと、
前記重み付け加算して生成された時系列ベクトルはゲイ
ン符号化部１０から与えられるそれぞれのゲインに応じ
て重み付け加算部３８で重み付けして加算され、その加
算結果を駆動音源信号として合成フィルタ７へ供給し符
号化音声を得る。距離計算部１１は符号化音声と入力音
声Ｓ１との距離を求め、距離が最小となる適応符号、駆
動符号、ゲインを探索する。この符号化が終了した後、
線形予測パラメータの符号、入力音声と符号化音声との
歪みを最小にする適応符号、駆動符号、ゲインの符号を
符号化結果として出力する。

【００４７】次に復号化部２について説明する。復号化
部２では、線形予測パラメータ復号化部１２は線形予測
パラメータの符号から線形予測パラメータを復号化し、
合成フィルタ１３の係数として設定するとともに、雑音
度評価部２６へ出力する。次に、音源情報の復号化につ
いて説明する。適応符号帳１４は、適応符号に対応し
て、過去の駆動音源信号を周期的に繰り返した時系列ベ
クトルを出力する。雑音度評価部２６は、前記線形予測
パラメータ復号化部１２から入力された復号化した線形
予測パラメータと適応符号とから符号化部１の雑音度評
価部２４と同様の方法で雑音の度合いを評価し、評価結
果を重み決定部３７に出力する。

【００４８】第１の駆動符号帳３５および第２の駆動符
号帳３６は駆動符号に対応した時系列ベクトルを出力す
る。重み決定部３７は前記雑音度評価部２６から入力さ
れた雑音度評価結果に応じて、符号化部１の重み決定部
３４と同様に重みを与えるとする。第１の駆動符号帳３
５、第２の駆動符号帳３６からの各時系列ベクトルは上
記重み決定部３７から与えれるそれぞれの重みに応じて
重み付けして加算される。適応符号帳１４から出力され
た時系列ベクトルと、前記重み付け加算して生成された
時系列ベクトルは、ゲイン復号化部１６でゲインの符号
から復号化したそれぞれのゲインに応じて重み付け加算
部３９で重み付けして加算され、その加算結果が駆動音
源信号として合成フィルタ１３へ供給され出力音声Ｓ３
が得られる。

【００４９】この実施の形態５によれば、音声の雑音の
度合いを符号および符号化結果から評価し、評価結果に
応じて雑音的な時系列ベクトルと非雑音的な時系列ベク
トルを重み付き加算して用いることにより、少ない情報
量で、品質の高い音声を再生することができる。

【００５０】実施の形態６．上述の実施の形態１〜５で
さらに、雑音の度合いの評価結果に応じてゲインの符号
帳を変更するとしても良い。この実施の形態６によれ
ば、駆動符号帳に応じて最適なゲインの符号帳を用いる
ことができるので、品質の高い音声を再生することがで
きる。

【００５１】実施の形態７．上述の実施の形態１〜６で
は、音声の雑音の度合いを評価し、その評価結果に応じ
て駆動符号帳を切り替えているが、有声の立ち上がりや
破裂性の子音などをそれぞれ判定、評価し、その評価結
果に応じて駆動符号帳を切り替えても良い。この実施の
形態７によれば、音声の雑音的な状態だけでなく、有声
の立ち上がりや破裂性子音などさらに細かく分類し、そ
れぞれに適した駆動符号帳を用いることができるので、
品質の高い音声を再生することができる。

【００５２】実施の形態８．上述の実施の形態１〜６で
は、図２に示すスペクトル傾斜、短期予測利得、ピッチ
変動から、符号化区間の雑音の度合いを評価している
が、適応符号帳出力に対するゲイン値の大小を用いて評
価しても良い。

【００５３】

【発明の効果】本発明に係る音声符号化方法及び音声復
号化方法並びに音声符号化装置及び音声復号化装置によ
れば、スペクトル情報、パワー情報、ピッチ情報のうち
少なくとも１つの符号または符号化結果を用いて該符号
化区間における音声の雑音性の度合いを評価し、評価結
果に応じて異なる駆動符号帳を用いるので、少ない情報
量で品質の高い音声を再生することができる。

【００５４】またこの発明によれば、音声符号化方法及
び音声復号化方法で、格納している駆動音源の雑音性の
度合いが異なる複数の駆動符号帳を備え、音声の雑音性
の度合いの評価結果に応じて、複数の駆動符号帳を切り
替えて用いるので、少ない情報量で品質の高い音声を再
生することができる。

【００５５】またこの発明によれば、音声符号化方法及
び音声復号化方法で、音声の雑音性の度合いの評価結果
に応じて、駆動符号帳に格納している時系列ベクトルの
雑音性の度合いを変化させたので、少ない情報量で品質
の高い音声を再生することができる。

【００５６】またこの発明によれば、音声符号化方法及
び音声復号化方法で、雑音的な時系列ベクトルを格納し
ている駆動符号帳を備え、音声の雑音性の度合いの評価
結果に応じて、時系列ベクトルの信号サンプルを間引く
ことにより雑音性の度合いが低い時系列ベクトルを生成
したので、少ない情報量で品質の高い音声を再生するこ
とができる。

【００５７】またこの発明によれば、音声符号化方法及
び音声復号化方法で、雑音的な時系列ベクトルを格納し
ている第１の駆動符号帳と、非雑音的な時系列ベクトル
を格納している第２の駆動符号帳とを備え、音声の雑音
性の度合いの評価結果に応じて、第１の駆動符号帳の時
系列ベクトルと第２の駆動符号帳の時系列ベクトルを重
み付け加算した時系列ベクトルを生成したので、少ない
情報量で品質の高い音声を再生することができる。

【図面の簡単な説明】

【図１】この発明による音声符号化及び音声復号化装
置の実施の形態１の全体構成を示すブロック図である。

【図２】図１の実施の形態１における雑音の度合い評
価の説明に供する表である。

【図３】この発明による音声符号化及び音声復号化装
置の実施の形態３の全体構成を示すブロック図である。

【図４】この発明による音声符号化及び音声復号化装
置の実施の形態５の全体構成を示すブロック図である。

【図５】図４の実施の形態５における重み付け決定処
理の説明に供する略線図である。

【図６】従来のＣＥＬＰ音声符号化復号化装置の全体
構成を示すブロック図である。

【図７】従来の改良されたＣＥＬＰ音声符号化復号化
装置の全体構成を示すブロック図である。

Claims

【特許請求の範囲】

【請求項１】符号駆動線形予測（Code-Excited Linea
r Prediction：ＣＥＬＰ）音声符号化方法において、ス
ペクトル情報、パワー情報、ピッチ情報のうち少なくと
も１つの符号または符号化結果を用いて該符号化区間に
おける音声の雑音性の度合いを評価し、評価結果に応じ
て複数の駆動符号帳のうち１つを選択し、選択した駆動符号帳から出力された時系列ベクトルを評
価結果に応じた雑音性の度合いを有する時系列ベクトル
に変換して出力することを特徴とする音声符号化方法。
【請求項２】雑音的な時系列ベクトルを格納している
駆動符号帳を備え、音声の雑音性の度合いの評価結果に
応じて、上記時系列ベクトルの信号サンプルを間引くこ
とにより雑音性の度合いが低い時系列ベクトルを生成す
ることを特徴とする請求項１に記載の音声符号化方法。
【請求項３】符号駆動線形予測（ＣＥＬＰ）音声符号
化方法において、スペクトル情報、パワー情報、ピッチ
情報のうち少なくとも１つの符号または符号化結果を用
いて該符号化区間における音声の雑音性の度合いを評価
し、駆動符号帳から出力された時系列ベクトルを評価結
果に応じた雑音性の度合を有する時系列ベクトルに変換
して出力することを特徴とする音声符号化方法。
【請求項４】符号駆動線形予測（ＣＥＬＰ）音声符号
化装置において、スペクトル情報、パワー情報、ピッチ
情報のうち少なくとも１つの符号または符号化結果を用
いて該符号化区間における音声の雑音性の度合いを評価
する雑音度評価部と、上記雑音度評価部の評価結果に応じて複数の駆動符号帳
を切り替える駆動符号切替部と、上記雑音度評価部が評価した評価結果を入力し、上記駆
動符号帳切替部が切り替えた駆動符号帳から出力された
時系列ベクトルを評価結果に応じた雑音性の度合を有す
る時系列ベクトルに変換して出力する雑音度制御部とを
備えたことを特徴とする音声符号化装置。
【請求項５】符号駆動線形予測（ＣＥＬＰ）音声符号
化装置において、スペクトル情報、パワー情報、ピッチ
情報のうち少なくとも１つの符号または符号化結果を用
いて該符号化区間における音声の雑音性の度合いを評価
する雑音度評価部と、上記雑音度評価部が評価した評価結果を入力し、駆動符
号帳から出力された時系列ベクトルを評価結果に応じた
雑音性の度合を有する時系列ベクトルに変換して出力す
る雑音度制御部とを備えたことを特徴とする音声符号化
装置。