JP3431655B2

JP3431655B2 - 符号化装置及び復号化装置

Info

Publication number: JP3431655B2
Application number: JP04947493A
Authority: JP
Inventors: 勝志瀬座; 裕久田崎
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1993-03-10
Filing date: 1993-03-10
Publication date: 2003-07-28
Anticipated expiration: 2018-07-28
Also published as: JPH06266399A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、音声をディジタル伝
送あるいは蓄積する場合に用いられる符号化装置、復号
化装置に関するものである。

【０００２】

【従来の技術】入力音声を、スペクトルパラメータと音
源信号に分離して固定時間長のフレーム毎に符号化する
従来の符号化装置、復号化装置は、文献１”声門音源波
モデルを用いた音声の分析合成方式の検討”（瀬座勝
志、田崎裕久、中島邦男、日本音響学会秋季研究発表
会、１−６−１０、ＰＰ２０９−２１０、１９９１）に
より報告されている。この従来法においては、音源信号
の符号化に声門音源波の微分波形上で定義される音源モ
デルを用い、スペクトルパラメータとして自己回帰係数
（以下ＡＲと略す）及び移動平均係数（以下ＭＡと略
す）を用いている。前述した文献では、２〜３Ｋｂｐｓ
程度の低ビットレート音声伝送において高品質な復号音
声を得る方式として声帯音源波モデルを用いた分析合成
方式（ＦＶＱ−ＧＡＲＭＡ）を検討している。そこで
は、声帯音源波モデル、ＡＲパラメータ、及びＭＡパラ
メータを全てベクトル量子化することにより、自然性の
高い復号音声が得られることを明かにしている。しか
し、声帯音源波モデルの予備選択に用いる音源ピーク位
置の抽出誤りや、声帯音源波モデルをマッチングする位
置（音源位置）の伝送を行わないことにより復号音声に
劣化を生ずる場合があった。従来のＦＶＱ−ＧＡＲＭＡ
方式は、声帯音源波モデルでＡＲＭＡフィルタを駆動す
ることによって有声音を生成するものである。声帯音源
波モデルには声帯音源波の微分波形上で定義されるモデ
ルを用いている。符号化部では声帯音源波モデル、ＡＲ
及びＭＡパラメータをベクトル量子化する際に、予備選
択された各コードの全ての組み合わせの中からＳＮＲｓ
ｅｇが最大になる組み合わせをフレームに一組選択す
る。復号化部では各フレームで得られたコードをそれぞ
れ補間しながら合成する。

【０００３】図１４及び図１５は従来の分析合成方式
（ＦＶＱ−ＧＡＲＭＡ）による符号化装置、復号化装置
の構成図である。図１４は符号化部を示し、図１５は復
号化部を示している。図１４及び図１５において、１は
入力音声、１１はＡＲ符号帳、１２はＡＲ符号語、１４
はピッチ周期抽出手段、１５はピッチ周期、１９は音源
開始位置抽出手段、２０は音源開始位置、２１は音源モ
デル符号帳、２２は音源モデル符号語、２３は音源モデ
ル生成手段、２６はＭＡ符号帳、２７はＭＡ符号語、２
９は音源モデル符号帳、３０は音源モデル符号語、３１
は音源モデル生成手段、３４はＭＡ符号帳、３５はＭＡ
符号語、３７は復号音声、４４はＡＲ符号帳、４５はＡ
Ｒ符号語、５６は符号化結果、５７は符号探索手段、５
８は復号化手段、５９は量子化音源信号、６０は量子化
音源信号である。

【０００４】まず、図１４の符号化部について説明す
る。ＡＲ符号帳１１には典型的なＡＲをＡＲ符号語とし
て複数個格納し、ＭＡ符号帳２６には典型的なＭＡをＭ
Ａ符号語として複数個格納し、音源モデル符号帳２１に
は一ピッチ周期の音源信号を表す音源モデルのパラメー
タの典型的なものを音源モデル符号語として複数個格納
してある。ピッチ周期抽出手段１４は入力音声１よりピ
ッチ周期１５を抽出し出力する。音源開始位置抽出手段
１９は先行フレームが無声で当該フレームが有声の場
合、入力音声１より音源開始位置２０を抽出し出力す
る。音源モデル生成手段２３は音源モデル符号帳２１よ
り出力される音源モデル符号語２２より生成される一ピ
ッチ周期の音源信号をピッチ周期１５で繰り返した信号
を生成し、量子化音源信号５９として出力する。符号探
索手段５７は、音源開始位置２０とＡＲ符号語１２と量
子化音源信号５９とＭＡ符号語２７を用いて合成音声を
生成し、入力音声１と合成音声の歪を最小にするＡＲ符
号語とＭＡ符号語と音源符号語の組み合わせを探索し、
符号化結果５６として出力する。

【０００５】図１６は有声音の先頭フレームでの符号探
索手段５７の動作を説明するものである。図において実
線で示される量子化音源信号及び合成音声は当該フレー
ムでの信号を、点線で示される量子化音源信号及び合成
音声は次フレームでの信号を示す。符号探索手段５７
は、有声フレームにおいてピッチ周期を単位とした入力
音声を符号化する。当該フレームが有声音の先頭である
場合は、音源開始位置２０からピッチ周期単位で量子化
音源信号５９を並べた場合に当該フレームを超える範囲
の入力音声１を当該フレームの符号化対象とし、合成音
声を生成する。

【０００６】図１６においては、音源開始位置２０から
ピッチ周期Ｐ１，Ｐ２までが現在のフレームの符号化対
象として合成音声が生成される。符号化はピッチ周期を
単位として行われるため、フレームの区切りとピッチ周
期の区切りは一致せず、この例では、時刻Ｔ３は時刻Ｆ
２とは一致せず、時刻Ｔ３−時刻Ｆ２の時間だけ、現在
のフレームを超えて符号化が行われる。有声音の先頭フ
レーム以外の有声フレームの場合、量子化音源信号５９
を先行フレームでの量子化音源信号に引き続いて当該フ
レームを超えるまで並べて合成音声を生成する。図にお
いては、Ｐ２というピッチ周期の次から次フレームのた
めの音声合成が生成される。すなわち、Ｐ３，Ｐ４，Ｐ
５というピッチ周期を用いて次フレームの符号化が行わ
れ合成音声が生成される。

【０００７】次に図１５の復号化部について説明する。
図においてＡＲ符号帳４４、音源モデル符号帳３１、Ｍ
Ａ符号帳３４は、それぞれ符号化部におけるＡＲ符号帳
１１、音源モデル符号帳２１、ＭＡ符号帳２６と同じも
のである。音源モデル生成手段３１は、ピッチ周期１５
と符号化結果５６に対応する音源モデル符号帳２９内の
音源モデル符号語３０を用いて量子化音源信号６０を生
成する。復号化手段５８は、量子化音源信号６０と符号
化結果５６に対応するＡＲ符号帳４４内のＡＲ符号語４
５とＭＡ符号帳３４内のＭＡ符号語３５を用いて復号音
声３７を生成する。

【０００８】図１７は復号化手段５８の動作を説明する
ものである。復号化手段５８は量子化音源信号６０を当
該フレームの先頭から当該フレームを超えるまで並べて
復号音声３７を生成する。図においては、当該フレーム
の先頭からフレーム周期９１，９２，９３を用いて復号
音声を生成する。復号音声の生成もピッチ周期単位で行
われるため、フレームを超えて復号音声が生成される場
合がある。図１７においては、ピッチ周期９３の終了時
刻Ｓ３はフレームの時刻Ｆ２を超えており、当該フレー
ムの時刻Ｆ２が終了しても当該フレームのための復号音
声が時刻Ｓ３まで生成される。

【０００９】次フレームでは、これまで復号された復号
音声に引き続いて点線で示される量子化音源信号６０を
並べて復号音声３７を生成する。図１７においては、ピ
ッチ周期９４，９５，９６が次フレームの復号音声生成
のために用いられる。この次フレームの復号音声生成も
ピッチ周期単位で行われるため、前のフレームの復号音
声生成が前のフレームを超えて行われる場合には、図１
７次に示すように次フレームにおいても、ずれたまま復
号音声を生成する。

【００１０】

【発明が解決しようとする課題】従来の符号化装置、復
号化装置は、声帯音源波コードの予備選択を音源ピーク
位置と過去のフレームで選択された声帯音源波コードを
基準として行っているが、語頭部分や過度部での音源ピ
ーク位置の自動抽出には誤りが多く、予備選択がうまく
働かない場合があった。図１８（ａ）に残差波形、図１
８（ｂ）（ｃ）に声帯音源波モデルの微分波形を示す。
音源ピーク位置が正しく抽出されている場合（ｂ）に比
べ、誤って抽出された場合（ｃ）は声帯音源波コードの
選択を誤り、ＳＮＲｓｅｇは急速に劣化する。このよう
に、音源信号の符号化に音源モデルを用いた量子化音源
信号のみを使っているために音源モデルの適合の悪い話
者の場合に復号音声の品質が劣化する場合があった。ま
た、ピッチ周期に応じて様態が異なるＭＡと音源モデル
に対して各々固定の符号帳を用いて量子化するために復
号音声の品質が劣化する場合があった。また、符号化部
ではピッチ長を補間により微調整しながら音源を誤り返
した場合にＳＮＲｓｅｇが最大になるように有声音の先
頭の音源位置とそのピッチ長を決定しているが、この音
源位置を復号化部に伝送しない構成のため、符号化部と
復号化部で各コードを補間した結果に大きな差異を生じ
復号音声品質が劣化する例があった。すなわち、復号化
部に有声音の先頭フレームにおける音源開始位置が伝送
されないために、図１６及び図１７に示すように、符号
化部と復号化部において同一フレーム内に含まれる音源
モデルの数が異なる場合がある。この様なフレームにお
いてパワーやピッチ周期の変動が大きいと、復号化部の
第一の量子化音源信号は符号化部の第一の量子化音源信
号との間に大きな差異を生じ、復号音声の品質が劣化す
る場合があった。

【００１１】本発明は上記課題を解消するためになされ
たもので、復号音声の品質を向上させることを目的とし
ている。

【００１２】

【課題を解決するための手段】本発明に係る符号化装置
は、入力音声よりピッチ周期を抽出するピッチ周期抽出
手段と、所定ビット長のスペクトル符号を入力とし、こ
のスペクトル符号に対応する量子化スペクトルパラメー
タを出力するスペクトル符号帳と、所定ビット長の音源
符号を入力とし、この音源符号に応じて一ピッチ周期の
音源信号を生成する音源符号帳と、この音源信号を前記
ピッチ周期で繰り返したものを第一の量子化音源信号と
して出力する音源生成手段と、前記量子化スペクトルパ
ラメータと第一の量子化音源信号から生成した合成音声
と入力音声の歪を最小にするスペクトル符号と音源符号
の組み合わせを探索し、探索結果を第一の符号探索結果
としてその時の歪と共に出力する第一の符号探索手段
と、入力音声に対して符号駆動線形予測（ＣＥＬＰ）符
号化を行ない、その符号化結果を第二の符号探索結果と
してその時の歪と共に出力する第二の符号探索手段と、
前記第一の符号探索結果と前記第二の符号探索結果の
内、より小さい歪を持つ方を当該フレームの符号化結果
として選択し出力するとともに、どちらを選択したのか
を符号化手段選択信号として出力する符号化手段選択手
段とを備えることを特徴とする。

【００１３】本発明に係わる符号化装置は、前記第二の
符号探索手段が、第一の符号探索手段が選択された場合
の第一の量子化音源信号を格納する第一の音源記憶手段
と、第二の符号探索手段が選択された場合の第二の量子
化音源信号を格納する第二の音源記憶手段とを備える適
応音源符号帳を備え、この適応音源符号帳を用いて符号
駆動線形予測（ＣＥＬＰ）符号化を行う時に、第一の音
源記憶手段に格納されている信号と第二の音源記憶手段
に格納されている信号のどちらを使用したら歪が小さく
なるかを比較し、小さい歪となる方を選択して、その選
択結果を第二の符号探索結果に含めて出力することを特
徴とする。

【００１４】

【００１５】また、本発明に係わる符号化装置は、少な
くとも前記スペクトル符号帳と前記音源符号帳の一つ以
上に、ピッチ周期に対応する複数個の副符号帳と、ピッ
チ周期に応じて使用する副符号帳を切り換える副符号帳
切換手段とを備えることを特徴とする。

【００１６】本発明に係わる符号化装置は、上記符号化
装置において、当該フレームが無声フレームから初めて
有声フレームに変わったフレームの場合、有声音が開始
する位置を音源開始位置として入力音声より抽出し、こ
の音源開始位置を当該フレームに先行する無声フレーム
において復号化部に出力する音源開始位置抽出手段を備
えることを特徴とする。

【００１７】本発明に係わる符号化装置は、入力音声
を、スペクトルパラメータと音源信号に分離して固定時
間長のフレーム毎に符号化する符号化装置において、入
力音声よりピッチ周期を抽出するピッチ周期抽出手段
と、当該フレームが無声フレームから有声フレームに変
わったフレームの場合、有声音が開始する位置を音源開
始位置として入力音声より抽出し、この音源開始位置を
当該フレームに先行する無声フレームにおいて復号化部
に出力する音源開始位置抽出手段と、所定ビット長のス
ペクトル符号を入力とし、このスペクトル符号に対応す
る量子化スペクトルパラメータを出力するスペクトル符
号帳と、所定ビット長の音源符号を入力とし、この音源
符号に応じて一ピッチ周期の音源信号を生成する音源符
号帳と、当該フレームが無声フレームから有声フレーム
に変わったフレームの場合には、前記音源開始位置を開
始点として、音源符号帳が出力した音源信号を前記ピッ
チ周期で繰り返したものを量子化音源信号として、他の
有声フレームの場合には、全フレームの量子化音源信号
の終端位置を開始点として、音源符号帳が出力した音源
信号を前記ピッチ周期で繰り返したものを量子化音源信
号として出力する音源生成手段と、前記量子化スペクト
ルパラメータと量子化音源信号から生成した合成音声と
入力音声の歪を最小にするスペクトル符号と音源符号の
組合わせを探索し、探索結果を符号探索結果としてその
時の歪と共に出力する符号探索手段とを備えることを特
徴とする。

【００１８】本発明に係わる復号化装置は、入力音声
を、スペクトルパラメータと音源信号に分離して固定時
間長のフレーム毎に第一の符号探索手段と、第二の符号
探索手段とにより符号化した符号化結果の内、より小さ
い歪を持つ方を当該フレームの符号化結果として入力す
るとともに、どちらを選択したのかを符号化手段選択信
号として入力し、符号化結果を復号化する復号化装置に
おいて、所定ビット長のスペクトル符号を入力とし、こ
のスペクトル符号に対応する量子化スペクトルパラメー
タを出力するスペクトル符号帳と、所定ビット長の音源
符号を入力とし、この音源符号に応じて一ピッチ周期の
音源信号を生成する音源符号帳と、この音源信号を前記
ピッチ周期で繰り返したものを第一の量子化音源信号と
して出力する音源生成手段と、入力された符号化結果に
対応して、前記スペクトル符号帳にスペクトル符号を入
力して量子化スペクトルパラメータを生成し、前記音源
符号帳に音源符号を入力して一ピッチ長の音源信号を生
成し、前記音源生成手段にこの音源信号と前記ピッチ周
期を入力して第一の量子化音源信号を生成し、この量子
化スペクトルパラメータと第一の量子化音源信号を用い
て復号音声を生成する第一の復号化手段と、前記符号化
結果に対応して、符号駆動線形予測（ＣＥＬＰ）復号化
を行なって復号音声を生成する第二の復号化手段と、入
力された符号化手段選択信号に従い第一の復号化手段の
復号音声と第二の復号化手段の復号音声を選択する復号
化手段選択手段とを備えることを特徴とする。

【００１９】本発明に係わる符号化装置は、前記第二の
復号化手段が、第一の量子化音源信号を格納する第一の
音源記憶手段と、第二の量子化音源信号を格納する第二
の音源記憶手段とを備える適応音源符号帳を備え、入力
された符号化結果に従い、第一の音源記憶手段内に格納
されている信号と第二の音源記憶手段内に格納されてい
る信号の一方を選択して用いて、符号駆動線形予測（Ｃ
ＥＬＰ）復号化を行うことを特徴とする。

【００２０】

【００２１】また、本発明に係わる復号化装置は、少な
くとも前記スペクトル符号帳と前記音源符号帳の一つ以
上に、ピッチ周期に対応する複数個の副符号帳と、ピッ
チ周期に応じて使用する副符号帳を切り換える副符号帳
切換手段とを備えることを特徴とする。

【００２２】本発明に係わる復号化装置は、上記復号化
装置において、当該フレームが無声フレームから初めて
有声フレームに変わったフレームの場合の有声音が開始
する位置を音源開始位置として入力し、入力された音源
開始位置に第一の量子化音源信号を同期させて復号音声
を生成するようにした第一の復号化手段を備えることを
特徴とする。

【００２３】本発明に係わる復号化装置は、入力音声
を、スペクトルパラメータと音源信号に分離して固定時
間長のフレーム毎に符号化した符号化結果と当該フレー
ムが無声フレームから有声フレームに変わったフレーム
の場合の有声音が開始する位置を音源開始位置として入
力し、符号化結果を復号化する復号化装置において、所
定ビット長のスペクトル符号を入力とし、このスペクト
ル符号に対応する量子化スペクトルパラメータを出力す
るスペクトル符号帳と、所定ビット長の音源符号を入力
とし、この音源符号に応じて一ピッチ周期の音源信号を
生成する音源符号帳と、当該フレームが無声フレームか
ら有声フレームに変わったフレームの場合には、前記音
源開始位置を開始点として、音源符号帳が出力した音源
信号を前記ピッチ周期で繰り返したものを量子化音源信
号として出力し、他の有声フレームの場合には、全フレ
ームの量子化音源信号の終端位置を開始点として、音源
符号帳が出力した音源信号を前記ピッチ周期で繰り返し
たものを量子化音源信号として出力する音源生成手段
と、入力された符号化結果に対応して、前記スペクトル
符号帳にスペクトル符号を入力して量子化スペクトルパ
ラメータを生成し、前記音源符号帳に音源符号を入力し
て一ピッチ長の音源信号を生成し、前記音源生成手段に
この音源信号と前記ピッチ周期と前記音源開始位置を入
力して量子化音源信号を生成し、この量子化スペクトル
パラメータと量子化音源信号を用いて復号音声を生成す
る復号化手段とを備えることを特徴とする。

【００２４】

【作用】請求項１及び７記載の発明においては、符号化
手段選択手段は第一の符号探索手段と第二の符号探索手
段のうち入力音声と合成音声の歪を小さくする方を選択
して符号化し、復号化する。

【００２５】また、請求項２及び８記載の発明において
は、第二の符号探索手段は適応音源符号帳に保持されて
いる第一の量子化音源信号と第二の量子化音源信号のう
ち入力音声の歪を小さくする信号を適応音源信号として
選択して符号化し、復号化する。

【００２６】また、請求項３、４、９、１０記載の発明
においては、スペクトル符号帳、音源符号帳はピッチ周
期に応じてそれぞれが持っている副符号帳を切り換えて
符号化し、復号化する。

【００２７】また、請求項５、６記載の発明において
は、有声音の先頭のフレームでの音源開始位置を復号化
部に伝送する場合に有声フレームに先行する無声フレー
ムで伝送する。

【００２８】また、請求項１１、１２記載の発明におい
ては、無声フレームから初めて有声フレームに変わった
フレームでの音源開始位置を入力して復号化する。

【００２９】

【実施例】実施例１．図１と図２はこの発明に係わる符号化装置、復号化装置
の一実施例の構成図であり、以下、本発明の動作をこの
図において説明する。なお図１は符号化部を示し、図２
は復号化部を示しており、図１と図２において図８と図
９と同一の部分については同一符号を付し、説明を省略
する。図において、２は駆動音源符号帳、３は駆動音源
符号語、４は駆動音源生成手段、５は駆動音源信号、６
は適応音源符号帳、７は適応音源信号、２５は第一の符
号探索手段、９は第一の量子化音源信号、１０は第二の
量子化音源信号、１３は第二の符号探索結果、１６は復
号化手段選択手段、１７は符号化手段選択信号、１８は
符号化結果、８は第二の符号探索手段、２８は第一の符
号探索結果、３３は第一の復号化手段、３８は符号化手
段選択手段、３９は符号化結果、４０は適応音源符号
帳、４１は適応音源信号、４２は第二の量子化音源信
号、４３は第二の復号化手段、４６は駆動音源符号帳、
４７は駆動音源符号語、４８は駆動音源生成手段、４９
は駆動音源信号である。

【００３０】まず、符号化部について説明する。第一の
符号探索手段２５は、図１０に示すように有声音の先頭
フレームの場合は音源開始位置２０に第一の量子化音源
信号２４を同期させ、この第一の量子化音源信号とＡＲ
符号語１２とＭＡ符号語２７を用いて合成音声を生成
し、それ以外の有声フレームでは、先行フレームで得ら
れた合成音声に引き続いて第一の量子化音源信号２４を
並べて合成音声を生成し、この合成音声と入力音声１の
歪を最小にするＡＲ符号語１２とＭＡ符号語２７と音源
モデル符号語２２の組み合わせを探索し、その探索結果
を符号化結果２８とし、その歪と共に符号化手段選択手
段１６に出力し、またその組み合わせにおける第一の量
子化音源信号２４を第一の量子化音源信号９として適応
音源符号帳６に出力する。

【００３１】駆動音源符号帳２は例えばＬＰＣ残差信号
の中で典型的な一ピッチ周期の信号やガウス性雑音信号
を駆動音源符号語として複数個格納しておく。駆動音源
生成手段４は駆動音源符号帳２内の駆動音源符号語３を
ピッチ周期１５で繰り返した駆動音源信号５を生成す
る。以下この第一の符号探索手段２５が行う動作方式を
ＧＡＲＭＡ方式と呼ぶことにする。

【００３２】第二の符号探索手段８は駆動音源信号５と
適応音源符号帳６内の適応音源信号７より生成される量
子化音源信号とスペクトル符号帳１１内のスペクトル符
号語１２を用いて合成音声を生成し、合成音声と入力音
声１の歪を最小にする駆動音源符号語３とスペクトル符
号語１２の組み合わせを探索し、その探索結果を第二の
符号探索結果１３とし、その歪と共に符号化手段選択手
段１６に出力し、この組み合わせにおける第二の量子化
音源信号１０を適応音源符号帳６に出力する。以下この
第二の符号探索手段８が符号化に用いる方式をＣＥＬＰ
方式と呼ぶことにする。

【００３３】符号化手段選択手段１６は第一の符号探索
結果２８と第二の符号探索結果１３の内で歪の小さい方
を当該フレームにおける符号化結果１８として選択し、
どちらを選択したかを表す符号化手段選択信号１７と前
記符号化結果１８を出力する。

【００３４】図３は適応音源符号帳６の動作を説明した
図である。適応音源符号帳６は当該フレームにおいて第
一の符号探索手段が選択された場合は第一の量子化音源
信号９を音源記憶手段５０に格納し、第二の符号探索手
段が選択された場合は第二の量子化音源信号１０を音源
記憶手段５０に格納し、適応音源信号７として出力す
る。

【００３５】従来の適応音源符号帳６は符号探索手段に
より、量子化音源信号を記憶しているのに対して、この
実施例においては、適応音源符号帳６に記憶する量子化
音源信号を第一の符号探索手段２５により、出力された
第一の量子化音源信号９と第二の符号探索手段８により
出力された第二の量子化音源信号１０のうちから最新の
量子化音源信号を選択し音源記憶手段５０に格納する。
どちらが最新の量子化音源信号であるかは符号化手段選
択手段から出力された符号化手段選択信号１７により判
定することができる。従って、適応音源符号帳６は符号
化手段選択信号１７を入力してスイッチを切り換えるこ
とにより、第一の量子化音源信号９と第二の量子化音源
信号を１０を切り換えて音源記憶手段５０に入力する。
こうして適応音源符号帳６は最新に用いられた量子化音
源信号を第二の符号探索手段に供給することが可能にな
る。

【００３６】次に図２の復号化部１ｂについて説明す
る。図において駆動音源符号帳４６、適応音源符号帳４
０は、それぞれ符号化部１ａにおける駆動音源符号帳
２、適応音源符号帳６と同一のものである。復号化手段
選択手段３８は符号化手段選択信号１７に従い第一の復
号化手段３３と第二の復号化手段４３のどちらかに、符
号化結果１８をそのまま符号化結果３９として出力す
る。

【００３７】第一の復号化手段３３は第一の量子化音源
信号３２と符号化結果３９に対応するＭＡ符号帳３４内
のＭＡ符号語３５とスペクトル符号帳４４内のＡＲ符号
語４５を用いて復号音声３７を生成し、第一の量子化音
源信号３２をそのまま第一の量子化音源信号３６として
適応音源符号帳４０に出力する。

【００３８】駆動音源生成手段４８は、ピッチ周期１５
と符号化結果３９に対応する駆動音源符号帳４６内の駆
動音源符号語４７より駆動音源信号４９を生成する。第
二の復号化手段４３は、適応音源符号帳４０内の適応音
源信号４１と駆動音源信号４９より生成される量子化音
源信号と符号化結果３９に対応するスペクトル符号帳４
４内のＡＲ符号語４５を用いて復号音声３７を生成し、
前記量子化音源信号を適応音源符号帳に第二の量子化音
源信号４２として出力する。

【００３９】以上のようにこの実施例では、第一の符号
化探索手段は音源モデル符号帳２１に格納された音源モ
デルを用いた量子化音源信号のみを用いて符号化を行っ
ている。一方第二の符号探索手段は適応音源符号帳を用
いることにより、直前に符号化した量子化音源信号との
差分を用いることにより符号化を行っている。このよう
にこの符号化の方式が異なるふたつの符号探索手段をそ
れぞれ動作させ、その動作結果を比較することにより、
符号化の歪の小さい方を選択する点がこの実施例の特徴
である。すなわち、この実施例はＧＡＲＭＡ方式とＣＥ
ＬＰ方式の二つの方式を用い、マルチモード化を行い、
ＣＥＬＰ系で用いられている適応コードと駆動音源コー
ドを用いた音源（図１８（ｄ）参照）を用いてＳＮＲｓ
ｅｇを確保し、ＦＶＱ−ＧＡＲＭＡを用いた場合と適応
コードブックと駆動音源コードブックを用いた場合でＳ
ＮＲｓｅｇの良い方を選択して出力することを特徴とす
るものである。そして、ＧＡＲＭＡとＣＥＬＰという異
なる方式を用いて符号化しよりよい結果をもたらす方式
を選択するので、符号化品質がどちらか一方の方式によ
る場合よりも向上する。

【００４０】実施例２．上記実施例１においては、ＧＡＲＭＡ方式とＣＥＬＰ方
式の二つの方式を用いて比較選択する場合を示したが、
二つの符号化方式はこれらの方式に限るものではなく、
その他の方式を利用するものでもかまない。あるいは同
一方式のものであっても、一方に改良を加えたものや変
更を加えたものであってもかまわない。更に、二つの方
式の組み合わせに限らず、三つ以上の方式の組み合わせ
であってもかまわない。

【００４１】実施例３．図４はこの発明に係わる符号化装置、復号化装置の一実
施例における適応音源符号帳６の構成図であり、以下、
適応音源符号帳６の動作をこの図において説明する。図
３と同一の部分は同一番号を付す。適応音源符号帳６は
第一の符号探索手段が選択された場合、第一の量子化音
源信号９を第一の音源記憶手段５１に格納し、第二の符
号探索手段が選択された場合、第二の量子化音源信号１
０を第二の音源記憶手段５２に格納しておく。切換手段
５３は第一の音源記憶手段５１と第二の音源記憶手段５
２に格納されている信号をそれぞれ適応音源信号７とし
て出力する。第二の符号探索手段８は合成音声と入力音
声の歪を小さくする適応音源信号７を選択し、選択結果
を符号探索結果１３に含めて出力する。

【００４２】すなわち第二の符号探索手段８は、選択信
号８ａを適用音源符号帳６に出力し、第一の音源記憶手
段５１と第二の音源記憶手段に記憶された音源信号を切
り換える。第一の音源記憶手段５１は、第一の符号探索
手段から出力された最新の量子化音源信号９を記憶して
いる。第二の音源記憶手段５２は第２の符号探索手段か
ら出力された最新の量子化音源信号を記憶している。第
二の符号探索手段８は選択信号８ａを出力し、符号語切
換手段５３を動作させることにより、第一の音源記憶手
段５１と第二の音源記憶手段５２に記憶されている量子
化音源信号をそれぞれ入力し、両方の量子化音源信号に
基づいて符号化を試みる。その結果、より歪の小さい方
を用いて、符号化を行い符号探索結果として出力する。

【００４３】また復号化部の適応音源符号帳４０は図４
における適応音源符号帳６と同一のものである。復号化
部の第二の復号化手段４３は、符号化結果３９に従い適
応音源信号符号帳４０の中から適応音源信号４１を選択
する。

【００４４】実施例４．上記実施例３においては、二つの符号探索手段がある場
合を示したが、三つ以上の符号探索手段が存在する場合
には、図４に示した適用音源符号帳６の内部には音源記
憶手段がそれぞれの符号探索手段に対応して存在し、切
換手段５３はこれら３つ以上の音源記憶手段に記憶され
た量子化音源信号を切り換える。

【００４５】実施例５．図５はこの発明に係わる符号化装置、復号化装置の一実
施例におけるＭＡ符号帳２６の構成図であり、以下、Ｍ
Ａ符号帳２６の動作をこの図において説明する。図１と
同一の部分は同一番号を付す。ＭＡ符号帳２６は複数の
副符号帳５４を持ち、副符号帳切換手段５５は入力され
たピッチ周期１５に応じて副符号帳の一つを選択し、選
択された副符号帳内のＭＡ符号語２７を出力する。

【００４６】例えば図において、副符号帳１は１５ｍｓ
のピッチ周期に対応するＭＡ符号帳を格納する。また副
符号帳２には１６ｍｓのピッチ周期に対応する符号帳を
格納する。また、副符号帳３には１７ｍｓのピッチ周期
に対応する符号帳を格納する。このようにして１５ｍｓ
から例えば２０ｍｓまでの符号帳を格納しておき、副符
号帳切換手段５５は入力されたピッチ周期１５に基づ
き、副符号帳を選択できる。例えば、ピッチ周期１５が
１６ｍｓである場合には、副符号帳切換手段５５は副符
号帳２を選択しこれをＭＡ符号語２７として出力する。
なお復号化部のＭＡ符号帳３４もＭＡ符号帳２６と同一
の構成である。また、ＡＲ符号帳または音源モデル符号
帳または駆動音源符号帳を図５と同様の構成にすること
も可能である。

【００４７】以上のように、この実施例が特徴とする点
は、ピッチ周期に応じて各符号帳内に複数の符号帳を用
意している点である。音声は例えば、男女の差、あるい
は音声の高低等の特徴を有しているが、入力される音声
が男であるか女であるか、あるいは高いか低いかという
ような特徴はピッチ周期に反映されることが多い。すな
わち、ピッチ周期に応じてＭＡや音源モデルの対応が異
なるという事実がある。このピッチ周期に応じて、複数
のＭＡ符号帳や音源モデル符号帳を用意しておき、ピッ
チ周期に応じた符号帳を用いて量子化するのがこの実施
例の特徴である。

【００４８】実施例６．図６、図７はこの発明に係わる符号化装置、復号化装置
の一実施例の構成図であり、以下、本発明の動作をこの
図において説明する。図６は符号化部を示しており、図
７は復号化部を示している。図１、図２と同一の部分は
同一番号を付し説明を省略する。符号化部では、当該フ
レームが有声音の先頭フレームの場合、音源開始位置２
０を当該フレームに先行する無声フレームにおいて復号
化部に伝送する。すなわち、有音声の先頭フレームを符
号化して伝送する前に音源開始位置２０を符号化して伝
送する。このため、有音声のフレームの伝送が１フレー
ム分遅れることになるが、１フレーム分の伝送の遅れが
あっても復号化部での復号の時刻がずれるだけであり、
復号の品質に影響は少ない。なお、音源開始位置２０の
符号化を有声音の先頭フレームの符号化とともに行って
もよい。ただし、この場合は、有声音の先頭フレームの
符号化情報量が音源開始位置２０の符号化により減少す
る。

【００４９】復号化部では、第一の復号化手段３３が有
声音の先頭フレームを復号することが予め定められてお
り、当該フレームが有声音の先頭フレームの場合、第一
の復号化手段４３は入力された音源開始位置２０から第
一の量子化音源信号３２を並べて復号音声３７を生成す
る。

【００５０】この例を従来例で示した図１７を用いて説
明する。従来例においては、復号動作はフレームの先頭
から行われていたが、この実施例によれば、音源開始位
置２０から復号がスタートするため、図１７に示した時
刻Ｔ１から復号されることになる。従来は時刻Ｆ１から
復号されていたため時刻Ｆ１からＴ１の間の復号は本来
必要無いにも拘らず、合成音声が生じていたのに対し、
この実施例によれば、音源開始位置２０すなわち時刻Ｔ
１から復号が開始されるため、本来必要でない部分の合
成音声がなくなる。また、スタート復号開始位置が一致
するため、ピッチ周期のズレもなくなり、復号音声の品
質が向上する。図１７に示したように、入力音声１のピ
ッチ周期Ｐ１，Ｐ２，Ｐ３は復号音声３７のピッチ周期
Ｑ１，Ｑ２，Ｑ３とズレているため、このズレが復号音
声の品質を劣化させる原因となっている。これに対し、
この実施例によれば、復号音声も音源開始位置２０より
スタートするためピッチ周期は符号化部での合成音声の
ものと同一になり、復号音声の品質を向上させるのに役
立つ。

【００５１】実施例７．上記実施例６においては、音源開始位置２０を第一の復
号化手段３３に入力する場合を示しているが、音源開始
位置２０を第二の復号化手段４３に入力するようにして
もかまわない。実施例６の場合は前述したように第一の
符号化手段が有声音の先頭フレームを復号するというこ
とが前提となっているため、音源開始位置２０を第一の
復号化手段３３にのみ入力すれば良かったが、もし、有
声音の先頭フレームを、第一と第二の符号化手段のいず
れかどちらが符号化するか予め決定されていない場合
は、この符号化手段を符号化部において選択することも
可能である。

【００５２】実施例８．実施例１ないし実施例７では、符号化手段選択手段にお
いて第一の符号探索手段が選択された場合、適応音源符
号帳に第一の量子化音源信号を格納するが、第一の量子
化音源信号でＭＡフィルタを駆動した信号を格納するこ
とも可能である。

【００５３】実施例９．実施例１ないし実施例８ではスペクトルパラメータとし
てＡＲとＭＡを用いているが、ＡＲのみ、ケプストラム
等他のスペクトルパラメータを用いることも可能であ
る。

【００５４】実施例１０．上記実施例５においては、図１または図２に示した符号
化装置、復号化装置に対して用いられる各符号帳に複数
の符号帳を用意する場合を示したが、これら複数の符号
帳をピッチ周期で切り換える方式は、図８及び図９に示
した従来の符号化装置、復号化装置に対しても用いるこ
とができる。すなわち、ピッチ周期１５に応じて符号帳
を選択するという方式は実施例１に示した方式あるいは
従来の方式に拘らず、他の方式に対しても適用すること
が可能である。

【００５５】実施例１１．上記実施例においては、符号化装置、復号化装置として
音声が符号され、かつ復号化される装置の場合について
説明したが、単に符号化のみを行う符号化装置、あるい
は復号化のみを行う復号化装置においても、それぞれの
実施例の符号化部分及び復号化部分を適用することが可
能である。

【００５６】実施例１２．また上記実施例においては、音声を符号化復号化する場
合について説明したが、この発明における音声とは人間
が声道から発声する音声に限らず動物や獣等の人間以外
の生物が発声する声についても適用することが可能であ
る。同様に生物が発声する声に限らず音として入力され
るものであれば、これらの音を符号化復号化する場合に
も適用されることが可能である。例えば、楽器の音や摩
擦音等の音を入力して符号化、復号化する場合でもかま
わない。また、音は人間が知覚出来る場合に限らず人間
の耳には感知できない超音波あるいは低音波等の音であ
ってもかまわない。

【００５７】評価実験例．図８にサブフレーム数が２の場合の本評価実験の構成図
を示す。図においてＭＯＤＥ０はＦＶＱ−ＧＡＲＭＡ方
式を意味し、ＭＯＤＥ１はＣＥＬＰ方式を意味するもの
とする。まずＬＳＰ（ＡＲパラメータ）をフレームに数
組予備選択する。次にそれぞれのＬＳＰに対し、ＳＮＲ
ｓｅｇの良いＭｏｄｅをサブフレーム毎に選択する。最
終的にフレーム全体のＳＮＲｓｅｇを最大にするＬＳＰ
と各サブフレームでのＭＯＤＥの組み合わせが選択され
る。

【００５８】図９にＭＯＤＥ０の内部構成図を示す。Ｍ
ＯＤＥ０はＦＶＱ−ＧＡＲＭＡと同様で、予備選択され
た声帯音源波モデルコードとＭＡコードの全ての組み合
わせの中からＳＮＲｓｅｇを最大にするものを選択す
る。

【００５９】図１０にＭＯＤＥ１の内部構成図を示す。
ＭＯＤＥ１のＣＥＬＰはＭＯＤＥ０と同期をとるために
ピッチ同期の処理とした。まず、適応コードブックの１
ピッチ長を繰り返しベクトルＰとする。なお、前サブフ
レームがＭＯＤＥ０であった場合は声帯音源波モデルで
ＭＡフィルタを駆動したものが適応コードブックとな
る。次に駆動音源コードブックの１ピッチ長を繰り返し
ベクトルＣとする。そしてＳＮＲｓｅｇを最大にするベ
クトルＰとＣのゲインの比を決定する。なお駆動音源コ
ードブックの学習には、短周期予測残差信号を用いた。
無声フレームではサブフレーム長が長いためサブフレー
ムを複数に分割し、白色雑音で駆動する。なお、適応コ
ードブックは使用しない。コードブックの学習には男女
各５名が発声した日本語短文２０文章を用いた。ただし
駆動音源コードブックの学習には、１０文章を用いた。
評価用データには学習外の日本語短文１０文章（学習に
用いなかった男女各５名が異なる１文章ずつを発声）を
用いた。

【００６０】本方式の性能を調べるために図１１の条件
で合成音を作成した。ただし、音源ピーク位置は自動抽
出した。図１２に本方式２．４Ｋｂｐｓ（ＭＧＡＲＭ
Ａ）のＳＮＲｓｅｇとＣＤ（ＣｅｐｓｔｒｕｍＤｉｓ
ｔｏｒｔｉｏｎ）を男女別に示す。この結果をみると男
性の方がＳＮＲｓｅｇとＣＤともに劣っている。これ
は、ピッチ変動が大きい男性においてＭＯＤＥ１が多く
選択され、ＭＯＤＥ１においてピッチ長の補間を行わず
同一ピッチ長による音源の繰り返しを行っているために
音源ピーク位置のずれが大きくなることが主な原因だと
考えられる。

【００６１】本方式の合成音声の主観品質を調べるため
に、図１１に示す条件で合成音声を作成し、被験者６名
による簡単な対比較試験を行った。音源ピーク位置を自
動抽出した本方式２．４Ｋｂｐｓ（ＭＧＡＲＭＡ）と音
源ピーク位置にマニュアルで修正を加えた従来の２．４
ＫｂｐｓＦＶＱ−ＧＡＲＭＡ（ＭＦＶＱ）、音源ピーク
位置を自動抽出した従来の２．４ＫｂｐｓＦＶＱ−ＧＡ
ＲＭＡ（ＡＦＶＱ）及び４．８ＫｂｐｓＣＥＬＰ基本方
式（ＣＥＬＰ）との比較を行った。試験結果を図１３に
示す。

【００６２】本方式はＡＦＶＱより良好であり、音源ピ
ーク位置の抽出誤りに対するロバスト性の向上が確認さ
れた。本方式とＭＦＶＱの比較において本方式が選択さ
れない文章では、部分的に残響感が感じられた。音質の
ばらつきにおいては、ＭＦＶＱより今回方式の方が安定
していることを確認している。音源ピーク位置抽出や補
間の改良によりＭＦＶＱと同等レベルに達すれば４．８
ＫＣＥＬＰと同等の品質が得られることが期待できる。

【００６３】

【発明の効果】以上説明したように、この発明では、符
号化手段選択手段により第二の符号探索手段と第一の符
号探索手段のうち合成音声と入力音声の歪を小さくする
方を選択するため、音源モデルの適合の悪い話者におい
て、復号音声の品質が改善する。

【００６４】また、この発明の適応音源符号帳は適応音
源信号として第一の量子化音源信号と音源信号を格納
し、第二の符号探索手段が合成音声と入力音声の歪を小
さくする方を選択して用いるため、復号音声の品質が改
善する。

【００６５】また、この発明の符号化装置、復号化装置
では、スペクトル符号帳、音源符号帳がピッチ周期に対
応して作成された複数の副符号帳を持ち、この副符号帳
をピッチ周期により切り換えて用いるため、復号音声の
品質が改善する。

【００６６】また、この発明の符号化装置、復号化装置
では、有声音の先頭のフレームでの音源開始位置を有声
フレームに先行する無声フレームで復号化部に出力し、
復号化部の第一の復号化手段が第一の量子化音源信号を
音源開始位置に同期して復号音声を生成するため、有声
フレームの伝送量を増加させずに符号化部の合成音声と
同一の復号音声を生成し、復号音声の品質が改善する。

【００６７】この発明の適応音源符号帳は適応音源信号
として第一の量子化音源信号と音源信号を格納し、弟二
の復号化手段が合成音声と入力音声の歪を小さくする方
を選択して用いるため、復号音声の品質が改善する。

【図面の簡単な説明】

【図１】この発明の実施例１の符号化装置、復号化装置
を示す構成図である。

【図２】この発明の実施例１の符号化装置、復号化装置
を示す構成図である。

【図３】この発明の実施例１の適応音源符号帳を示す構
成図である。

【図４】この発明の実施例３の適応音源符号帳を示す構
成図である。

【図５】この発明の実施例５のＭＡ符号帳を示す構成図
である。

【図６】この発明の実施例６の符号化装置、復号化装置
を示す構成図である。

【図７】この発明の実施例６の符号化装置、復号化装置
を示す構成図である。

【図８】この発明に基づく評価実験の符号化装置、復号
化装置を示す構成図である。

【図９】この発明に基づく評価実験の符号化装置、復号
化装置を示す構成図である。

【図１０】この発明に基づく評価実験の符号化装置、復
号化装置を示す構成図である。

【図１１】この発明に基づく評価実験の条件を示す図で
ある。

【図１２】この発明に基づく評価実験のＳＮＲｓｅｇと
ＣＤを示す図である。

【図１３】この発明に基づく評価実験の結果を示す図で
ある。

【図１４】従来の符号化装置、復号化装置を示す構成図
である。

【図１５】従来の符号化装置、復号化装置を示す構成図
である。

【図１６】従来の符号化装置、復号化装置の符号探索手
段の動作を説明する図である。

【図１７】従来の符号化装置、復号化装置の復号化手段
の動作を説明する図である。

【図１８】従来の符号化装置、復号化装置の問題点を説
明する図である。

【符号の説明】

１入力音声２駆動音源符号帳３駆動音源符号語４駆動音源生成手段５駆動音源信号６適応音源符号帳７適応音源信号８第二の符号探索手段９第一の量子化音源信号１０第二の量子化音源信号１１ＡＲ符号帳１２ＡＲ符号語１３第二の符号探索結果１４ピッチ周期抽出手段１５ピッチ周期１６符号化手段選択手段１７符号化手段選択信号１８符号化結果１９音源開始位置抽出手段２０音源開始位置２１音源モデル符号帳２２音源モデル符号語２３音源モデル生成手段２４第一の量子化音源信号２５第一の符号探索手段２６ＭＡ符号帳２７ＭＡ符号語２８第一の符号探索結果２９音源モデル符号帳３０音源モデル符号語３１音源モデル生成手段３２第一の量子化音源信号３３第一の復号化手段３４ＭＡ符号帳３５ＭＡ符号語３６第一の量子化音源信号３７復号音声３８復号化手段選択手段３９符号化結果４０適応音源符号帳４１適応音源信号４２第二の量子化音源信号４３第二の復号化手段４４ＡＲ符号帳４５ＡＲ符号語４６駆動音源符号帳４７駆動音源符号語４８駆動音源生成手段４９駆動音源信号５０音源記憶手段５１第一の音源記憶手段５２第二の音源記憶手段５３切換手段５４副符号帳５５副符号帳切換手段５６符号化結果５７符号探索手段５８復号化手段５９量子化音源信号６０量子化音源信号

フロントページの続き (56)参考文献特開昭64−44499（ＪＰ，Ａ) 特開平２−84699（ＪＰ，Ａ) 特開平４−51100（ＪＰ，Ａ) 特公昭59−52438（ＪＰ，Ｂ１) (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/12

Claims

(57)【特許請求の範囲】

【請求項１】入力音声を、スペクトルパラメータと音
源信号に分離して固定時間長のフレーム毎に符号化する
符号化装置において、入力音声よりピッチ周期を抽出するピッチ周期抽出手段
と、所定ビット長のスペクトル符号を入力とし、このスペク
トル符号に対応する量子化スペクトルパラメータを出力
するスペクトル符号帳と、所定ビット長の音源符号を入力とし、この音源符号に応
じて一ピッチ周期の音源信号を生成する音源符号帳と、この音源信号を前記ピッチ周期で繰り返したものを第一
の量子化音源信号として出力する音源生成手段と、前記量子化スペクトルパラメータと第一の量子化音源信
号から生成した合成音声と入力音声の歪を最小にするス
ペクトル符号と音源符号の組み合わせを探索し、探索結
果を第一の符号探索結果としてその時の歪と共に出力す
る第一の符号探索手段と、入力音声に対して符号駆動線形予測（ＣＥＬＰ）符号化
を行ない、その符号化結果を第二の符号探索結果として
その時の歪と共に出力する第二の符号探索手段と、前記第一の符号探索結果と前記第二の符号探索結果の
内、より小さい歪を持つ方を当該フレームの符号化結果
として選択し出力するとともに、どちらを選択したのか
を符号化手段選択信号として出力する符号化手段選択手
段とを備える符号化装置であって、前記第二の符号探索手段が、第一の符号探索手段が選択された場合の第一の量子化音
源信号を格納する第一の音源記憶手段と、第二の符号探
索手段が選択された場合の第二の量子化音源信号を格納
する第二の音源記憶手段とを備える適応音源符号帳を備
え、この適応音源符号帳を用いて符号駆動線形予測（ＣＥＬ
Ｐ）符号化を行う時に、第一の音源記憶手段に格納され
ている信号と第二の音源記憶手段に格納されている信号
のどちらを使用したら歪が小さくなるかを比較し、小さ
い歪となる方を選択して、その選択結果を第二の符号探
索結果に含めて出力することを特徴とする符号化装置。
【請求項２】上記符号化装置は、少なくとも前記スペクトル符号帳と前記音源符号帳の1
つ以上に、ピッチ周期に対応する複数個の副符号帳と、
ピッチ周期に応じて使用する副符号帳を切り替える副符
号帳切り替え手段とを備えることを特徴とする請求項１
記載の符号化装置。
【請求項３】上記符号化装置において、当該フレーム
が無声フレームから初めて有声フレームに変わったフレ
ームの場合、有声音が開始する位置を音源開始位置とし
て入力音声より抽出し、この音源開始位置を当該フレー
ムに先行する無声フレームにおいて復号化部に出力する
音源開始位置抽出手段を備えることを特徴とする請求項
１記載の符号化装置。
【請求項４】入力音声を、スペクトルパラメータと音
源信号に分離して固定時間長のフレーム毎に符号化する
符号化装置において、入力音声よりピッチ周期を抽出するピッチ周期抽出手段
と、当該フレームが無声フレームから有声フレームに変わっ
たフレームの場合、有声音が開始する位置を音源開始位
置として入力音声より抽出し、無声フレームから有声フ
レームに変わったフレームを符号化して伝送する前に、
無声フレームから有声フレームに変わったフレームに先
行する無声フレームにおいてこの音源開始位置を符号化
して復号化部に出力する音源開始位置抽出手段と、所定ビット長のスペクトル符号を入力とし、このスペク
トル符号に対応する量子化スペクトルパラメータを出力
するスペクトル符号帳と、所定ビット長の音源符号を入力とし、この音源符号に応
じて一ピッチ周期の音源信号を生成する音源符号帳と、当該フレームが無声フレームから有声フレームに変わっ
たフレームの場合には、前記音源開始位置を開始点とし
て、音源符号帳が出力した音源信号を前記ピッチ周期で
繰り返したものを量子化音源信号として、他の有声フレ
ームの場合には、全フレームの量子化音源信号の終端位
置を開始点として、音源符号帳が出力した音源信号を前
記ピッチ周期で繰り返したものを量子化音源信号として
出力する音源生成手段と、前記量子化スペクトルパラメータと量子化音源信号から
生成した合成音声と入力音声の歪を最小にするスペクト
ル符号と音源符号の組合わせを探索し、探索結果を符号
探索結果としてその時の歪と共に出力する符号探索手段
とを備えることを特徴とする符号化装置。
【請求項５】入力音声を、スペクトルパラメータと音
源信号に分離して固定時間長のフレーム毎に第一の符号
探索手段と、第二の符号探索手段とにより符号化した符
号化結果の内、より小さい歪を持つ方を当該フレームの
符号化結果として入力するとともに、どちらを選択した
のかを符号化手段選択信号として入力し、符号化結果を
復号化する復号化装置において、所定ビット長のスペクトル符号を入力とし、このスペク
トル符号に対応する量子化スペクトルパラメータを出力
するスペクトル符号帳と、所定ビット長の音源符号を入力とし、この音源符号に応
じて一ピッチ周期の音源信号を生成する音源符号帳と、この音源信号を前記ピッチ周期で繰り返したものを第一
の量子化音源信号として出力する音源生成手段と、入力された符号化結果に対応して、前記スペクトル符号
帳にスペクトル符号を入力して量子化スペクトルパラメ
ータを生成し、前記音源符号帳に音源符号を入力して一
ピッチ長の音源信号を生成し、前記音源生成手段にこの
音源信号と前記ピッチ周期を入力して第一の量子化音源
信号を生成し、この量子化スペクトルパラメータと第一
の量子化音源信号を用いて復号音声を生成する第一の復
号化手段と、前記符号化結果に対応して、符号駆動線形予測（ＣＥＬ
Ｐ）復号化を行なって復号音声を生成する第二の復号化
手段と、入力された符号化手段選択信号に従い第一の復号化手段
の復号音声と第二の復号化手段の復号音声を選択する復
号化手段選択手段とを備える復号化装置であって、前記第二の復号化手段が、第一の量子化音源信号を格納
する第一の音源記憶手段と、第二の量子化音源信号を格
納する第二の音源記憶手段とを備える適応音源符号帳を
備え、入力された符号化結果に従い、第一の音源記憶手段内に
格納されている信号と第二の音源記憶手段内に格納され
ている信号の一方を選択して用いて、符号駆動線形予測
（ＣＥＬＰ）復号化を行うことを特徴とする復号化装
置。
【請求項６】上記復号化装置は、少なくとも前記スペクトル符号帳と前記音源符号帳の一
つ以上に、ピッチ周期に対応する複数個の副符号帳と、
ピッチ周期に応じて使用する副符号帳を切り換える副符
号帳切換手段とを備えることを特徴とする請求項５記載
の復号化装置。
【請求項７】上記復号化装置において、当該フレーム
が無声フレームから初めて有声フレームに変わったフレ
ームの場合の有声音が開始する位置を音源開始位置とし
て入力し、入力された音源開始位置に第一の量子化音源
信号を同期させて復号音声を生成するようにした第一の
復号化手段を備えることを特徴とする請求項５記載の復
号化装置。
【請求項８】入力音声を、スペクトルパラメータと音
源信号に分離して固定時間長のフレーム毎に符号化した
符号化結果と当該フレームが無声フレームから有声フレ
ームに変わった有声音の先頭フレームの場合の有声音が
開始する位置を音源開始位置として入力し、符号化結果
を復号化する復号化装置において、所定ビット長のスペクトル符号を入力とし、このスペク
トル符号に対応する量子化スペクトルパラメータを出力
するスペクトル符号帳と所定ビット長の音源符号を入力
とし、この音源符号に応じて一ピッチ周期の音源信号を
生成する音源符号帳と、当該フレームが無声フレームから有声フレームに変わっ
たフレームに先行する無声フレームの場合には、無声フ
レームから有声フレームに変わったフレームに先行する
無声フレームにおいて符号化されている音源開始位置を
復号し、当該フレームが無声フレームから有声フレーム
に変わった有声音の先頭フレームの場合には、前記音源
開始位置を開始点として、音源符号帳が出力した音源信
号を前記ピッチ周期で繰り返したものを量子化音源信号
として出力し、他の有声フレームの場合には、全フレー
ムの量子化音源信号の終端位置を開始点として、音源符
号帳が出力した音源信号を前記ピッチ周期で繰り返した
ものを量子化音源信号として出力する音源生成手段と、入力された符号化結果に対応して、前記スペクトル符号
帳にスペクトル符号を入力して量子化スペクトルパラメ
ータを生成し、前記音源符号帳に音源符号を入力して一
ピッチ長の音源信号を生成し、前記音源生成手段にこの
音源信号と前記ピッチ周期と前記音源開始位置を入力し
て量子化音源信号を生成し、この量子化スペクトルパラ
メータと量子化音源信号を用いて復号音声を生成する復
号化手段とを備えることを特徴とする復号化装置。