JPH06266395A

JPH06266395A - 音声符号化装置および音声復号化装置

Info

Publication number: JPH06266395A
Application number: JP5049475A
Authority: JP
Inventors: Hirohisa Tazaki; 裕久田崎
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1993-03-10
Filing date: 1993-03-10
Publication date: 1994-09-22

Abstract

(57)【要約】【目的】音声信号を音源信号とスペクトル形状情報に
分離して、音源信号から１ピッチ周期長の代表音源を抽
出して符号化と復号化を行う音声符号化装置において、
位相のズレを起こさない代表音源の切り出しを可能とす
る。【構成】音声符号化装置内に、前フレームの代表音源
との相関値と音源信号内のピーク値に基づいて切り出し
を行い、切り出した位置と相関最大の位置のシフト値を
も抽出する代表音源抽出手段１１を備えた。第一の切り
出し手段２５は、音源信号内のピーク値に基づいて音源
信号を切り出す。第二の切り出し手段は前フレームの代
表音源と現フレームの音源信号との相関値を計算し、相
関値が最大となる位置から音源信号を切り出す。選択手
段２７は、いずれか一方の切り出し手段から得られた音
源信号を選択し、代表音源１８として出力する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】この発明は、音声信号をディジタ
ル伝送あるいは蓄積する場合に用いられる音声符号化装
置および音声復号化装置に関するものである。

【０００２】

【従来の技術】音声信号を所定の長さのフレーム毎に分
析して、音源信号とスペクトル形状情報に分離して符号
化を行う音声符号化装置、およびその符号化されたデー
タを復号化して復号音声信号を生成する音声復号化装置
は例えば、特開平２−８４６９９号公報に開示されてい
る。この従来例では、音声信号が有声音の場合にピッチ
周期で類似の波形が繰り返すという特徴を利用し、当該
フレームの音源信号をその中の１ピッチ周期長の信号の
みで代表させることで有声音の部分の符号化特性を改善
するものである。図１８はこの従来の音声符号化装置の
構成を示す構成図である。図において、１は音声信号、
４は有声無声判定手段、５はピッチ周期抽出手段、８は
有声無声情報符号化手段、９はピッチ周期符号化手段、
１２は代表音源符号化手段、１６はピッチ周期、１７は
有声無声情報、２２はピッチ周期符号、２３は有声無声
符号、２０１はスペクトル包絡分析手段、２０２は有声
音源符号化手段、２０３は代表音源切り出し手段、２０
４はスペクトル包絡情報符号化手段、２０５はスペクト
ル包絡情報、２０６は音源信号、２０７は代表音源、２
０８はスペクトル包絡符号、２０９は代表音源符号であ
る。

【０００３】以下、従来の音声符号化装置の動作につい
て説明する。スペクトル包絡分析手段２０１は、入力さ
れた現在のフレームの音声信号１を分析して、スペクト
ル形状情報とパワー情報を合わせたスペクトル包絡情報
２０５を求め、このスペクトル包絡情報２０５と音声信
号１から音源信号２０６を算出する。スペクトル包絡情
報符号化手段２０４は、このスペクトル包絡情報２０５
を符号化して、得られたスペクトル包絡符号２０８を符
号化結果の１つとして出力する。有声無声判定手段４は
音声信号１を分析して、この音声信号１が有声音と無声
音のどちらであるかの判定を行い、結果を有声無声情報
１７として出力する。有声無声情報符号化手段８は、こ
の有声無声情報１７を符号化して、得られた有声無声符
号２３を符号化結果の１つとして出力する。ピッチ周期
抽出手段５は、前記有声無声情報１７が有声音である場
合に、音声信号１に対してピッチ周期分析を行い、得ら
れたピッチ周期１６を出力する。ピッチ周期符号化手段
９は、このピッチ周期１６を符号化して、得られたピッ
チ周期符号２２を符号化結果の１つとして出力する。有
声音源符号化手段２０２内の代表音源切り出し手段２０
３は、ピッチ周期１６が入力された場合、すなわち有声
無声情報１７が有声音であった場合に、音源信号２０６
の振幅最大の位置を基準にして音源信号２０６からピッ
チ周期１６の長さの信号を切り出し、代表音源２０７と
して出力する。有声音源符号化手段２０２内の代表音源
符号化手段１２は、前記代表音源２０７の符号化を行
い、得られた代表音源符号２０９を符号化結果の１つと
して出力する。

【０００４】図１９は特開平２−８４６９９号公報に開
示されている音声復号化装置の構成を示す構成図であ
る。図において、２２はピッチ周期符号、２３は有声無
声符号、１０３は代表音源復号化手段、１０４はピッチ
周期復号化手段、１０５は有声無声情報復号化手段、１
１２は無声音源生成手段、１１３は音源切り換え手段、
１１４は合成手段、１１９はピッチ周期、１２０は有声
無声情報、１２６は無声音復号音源信号、３０１はスペ
クトル包絡情報復号化手段、３０２はフレーム長音源生
成手段、３０３はスペクトル包絡情報、３０４は代表音
源、３０５は有声音復号音源信号、３０６は復号音源信
号、３０７は復号音声信号である。

【０００５】以下、従来の音声復号化装置の動作につい
て説明する。スペクトル包絡情報復号化手段３０１は、
符号化されたデータの１つである入力されたスペクトル
包絡符号２０８を復号化して、得られたスペクトル包絡
情報３０３を出力する。有声無声情報復号化手段１０５
は、符号化されたデータの１つである入力された有声無
声符号２３を復号化して、得られた有声無声情報１２０
を出力する。ピッチ周期復号化手段１０４は、前記有声
無声情報１２０が有声音である場合に、符号化されたデ
ータの１つである入力されたピッチ周期符号２２を復号
化して、得られたピッチ周期１１９を出力する。代表音
源復号化手段１０３は、符号化されたデータの１つであ
る入力された代表音源符号２０９を復号化して、得られ
た代表音源３０４を出力する。フレーム長音源生成手段
３０２は、ピッチ周期１１９が入力された場合、すなわ
ち有声無声情報１２０が有声音であった場合に、前記ピ
ッチ周期１１９毎の間隔で前記代表音源３０４を並べ立
てて、有声音復号音源信号３０５として出力する。無声
音源生成手段１１２は、前記有声無声情報１２０が無声
音である場合に白色雑音を生成して、無声音復号音源信
号１２６として出力する。音源切り換え手段１１３は、
有声音復号音源信号３０５が入力された場合にはこれを
復号音源信号３０６として、無声音復号音源信号１２６
が入力された場合にはこれを復号音源信号３０６として
出力する。合成手段１１４は、前記復号音源信号３０６
とスペクトル包絡情報３０３を用いて復号音声信号３０
７の合成を行う。

【０００６】

【発明が解決しようとする課題】図１８と図１９に示し
たような従来の音声符号化装置および音声復号化装置に
おいては、代表音源切り出し手段２０３の切り出し結果
と、代表音源符号化手段１２における符号化特性が最終
的な復号音声信号３０７の音質に大きな影響を与える。
代表音源切り出し手段２０３における切り出し方法とし
ては、音源信号２０６内の振幅最大の位置を探し、この
直前のゼロ交差点を開始点として１ピッチ周期長の信号
を切り出して代表音源２０７とする方法が特開平２−８
４６９９号公報に開示されているが、振幅最大位置とそ
の直前のゼロ交差点の間の間隔が一定でなく、このため
代表音源２０７内における振幅最大の位置がまちまちと
なり、代表音源符号化手段１２の符号化特性を劣化さ
せ、復号音声信号３０７の品質劣化を引き起こすという
解決すべき課題がある。

【０００７】ゼロ交差点を用いないようにして、代表音
源２０７内における振幅最大位置が所定の位置、例えば
中心に来るように切り出す場合でも、この様な音源信号
２０６の振幅値のみに基づいた切り出し方法では、音源
信号２０６の１ピッチ周期長内に大きな振幅ピークが複
数ある場合や、音源信号２０６が徐々に変化していく場
合などに切り出しが不安定になりやすい。

【０００８】図２０は、上記の従来の音声符号化装置に
おける代表音源２０７の切り出しの様子を説明する説明
図である。前フレームでは、振幅最大位置であるａの位
置を中心にして代表音源が切り出されている。代表音源
の前フレームと現フレームの連続性を高くするために
は、現フレームでは位置ｃを中心として切り出すことが
望ましいと判断される。しかしながら、音源信号２０６
内の振幅最大位置はｂであり、これを中心として代表音
源２０７の切り出しが行われてしまう。この場合、前フ
レームと現フレームの代表音源の間に約４分の１周期の
位相ズレが発生し、これにともなって最終的な復号音声
信号３０７においてフレーム境界近傍の波形の乱れが生
じてしまう。

【０００９】また、代表音源符号化手段１２における符
号化ビット数が少ない場合など、代表音源符号化手段１
２により導入される符号化歪が大きいときに、特に符号
化歪の大きなフレームにおいては、音声復号化装置内の
代表音源３０４が隣接フレーム間で大きく異なるなどし
て復号音声信号３０７に異音を発生する場合がある。更
に、ピッチ周期が非常に大きい場合と小さい場合では、
音源信号２０６の様態がかなり異なっているが、このこ
とを全く考慮していないために復号音声信号３０７が劣
化している場合がある。従来の音声復号化装置では、フ
レーム長音源生成手段３０２において代表音源３０４を
単に並べ立てて復号音源信号３０６としているが、この
方法ではフレーム境界の音源の急変にともなって振幅が
乱れ、異音が発生する場合がある。

【００１０】この発明は、かかる課題を解決するために
なされたものであり、位相のズレを起こさない代表音源
の切り出しを可能とし、符号化歪が大きい場合でも、ピ
ッチ周期が大きい場合も小さい場合にも復号音声信号の
劣化が少ない、良好な音声符号化装置および音声復号化
装置を実現することを目的としている。

【００１１】

【課題を解決するための手段】請求項１記載の発明に係
わる音声符号化装置は、前記音源信号内のピーク値を探
索し、得られたピーク位置を基準として第一の切り出し
音源を抽出する第一の切り出し手段と、１フレーム前が
有声音であった場合に前フレームの代表音源との相関値
を最大にする現フレーム内の音源信号の位置、もしくは
前フレームの代表音源を切り出した位置の音声信号との
相関値を最大にする現フレーム内の音声信号の位置を算
出して、この位置を基準として第二の切り出し音源を抽
出するとともに、その相関値を出力する第二の切り出し
手段と、音源信号を分析して得られる所定の特徴パラメ
ータと前記相関値、もしくはその一方を用いて、第一の
切り出し音源と第二の切り出し音源の何れかを選択して
代表音源とする選択手段を備えた。

【００１２】また請求項２記載の発明の音声符号化装置
は、請求項１記載の構成に加えて、前記選択手段が出力
した代表音源と、前記第二の切り出し手段が出力した第
二の切り出し音源の位置のズレを求め、これをそのま
ま、もしくはピッチ周期で割った余りを算出して音源シ
フト値として出力する音源シフト値算出手段と、これを
符号化する音源シフト値符号化手段を備えた。

【００１３】また請求項３記載の発明の音声符号化装置
は、請求項２記載の構成に加えて、前記音源シフト値算
出手段が出力した音源シフト値のピッチ周期に対する比
率を算出して、この比率を所定の値と比較するシフト値
比較手段と、前記シフト値比較手段が前記比率が所定の
値以上と判定した場合に前記音源シフト値符号化手段を
動作させ、所定の値未満と判定した場合には前記音源シ
フト値符号化手段を動作させずに余剰ビットを代表音源
とスペクトル形状情報、もしくはその一方の符号化に用
いるようにモード制御を行うモード制御手段を備えた。

【００１４】また請求項４記載の発明の音声符号化装置
は、請求項１ないし請求項３記載の構成に加えて、現フ
レームの音源信号内の正および負のピーク値を探索し
て、各ピーク値とそのピーク位置を出力する第一のピー
ク探索手段と、前フレームが有声音であった場合に、第
二の切り出し手段が出力した第二の切り出し音源の所定
区間内の正および負のピーク値を探索し、各ピーク値と
そのピーク位置を出力する第二のピーク探索手段と、前
フレームが有声音でなかった場合に、第一のピーク探索
手段が出力したピーク値の中で絶対値が最大のものを選
択して、そのピーク値とピーク位置を選択ピーク値およ
び選択ピーク位置として出力する第一のピーク選択手段
と、前フレームが有声音であった場合に、前フレームの
選択ピーク値が正であるか負であるかと、第一のピーク
探索手段と第二のピーク探索手段が出力した各ピーク値
に基づいて、この各ピーク値の中からピーク値を１つを
選択して、このピーク値とピーク位置を選択ピーク値お
よび選択ピーク位置として出力する第二のピーク選択手
段と、前記選択ピーク位置に基づいて第一の切り出し音
源を抽出するピーク位置基準切り出し手段を、前記第一
の切り出し手段内に備えた。

【００１５】また請求項５記載の発明の音声符号化装置
は、代表音源を符号化して、得られた代表音源符号と符
号化時の歪を出力する代表音源符号化手段と、過去の代
表音源符号とその符号化時の歪を格納しておく音源記憶
手段と、前記代表音源符号化手段が出力した歪と前記音
源記憶手段に格納されている歪に基づいて、前記代表音
源符号化手段が出力した代表音源符号と前記音源記憶手
段内に格納されている過去の代表音源符号と所定の固定
音源符号のいずれかを選択して音源符号として出力する
音源符号選択手段と、この音源符号選択手段が前記代表
音源符号化手段が出力した代表音源符号を選択した場合
に、その代表音源符号と符号化時の歪を音源記憶手段に
格納する音源更新手段を備えた。

【００１６】また請求項６記載の発明の音声符号化装置
は、現フレームの音源信号をいくつかのカテゴリに分類
する音源分類手段と、各カテゴリの音源信号毎に抽出し
た典型的な代表音源に対して、カテゴリ毎に設定した所
定の信号長を超える部分は削除し、また前記所定の信号
長に足りない部分は０を挿入して信号長を揃えて、得ら
れたものを音源符号語として持つカテゴリ毎の音源符号
帳と、前記音源分類手段が判定したカテゴリに対応した
前記音源符号帳を用いて符号化を行う代表音源符号化手
段を備えた。

【００１７】また請求項７記載の発明の音声復号化装置
は、復号された現フレームの有声無声情報が有声である
場合に、復号された現フレームの各パラメータ、もしく
は前後のフレームの各パラメータを併せて用いて、現フ
レーム内のピッチ周期毎の位置での音源振幅を算出する
振幅算出手段と、この振幅算出手段が出力した音源振幅
を代表音源、もしくはこの代表音源と前後のフレームの
代表音源を現フレーム内のピッチ周期毎の位置で補間し
た補間音源に乗じてピッチ周期間隔に並べ立て、これを
復号音源信号として出力する音源連接手段と、前記復号
音源信号とスペクトル形状情報、もしくは前記スペクト
ル形状情報と前後のフレームのスペクトル形状情報を補
間した補間スペクトル形状情報を用いて復号音声信号を
生成する合成手段を備えた。

【００１８】また請求項８記載の発明の音声復号化装置
は、復号された現フレームの有声無声情報が有声である
場合に、復号された各パラメータ、もしくは前フレーム
の各パラメータを併せて用いて、現フレームの始端の位
置での音源振幅を算出し、第一の音源振幅として出力す
る第一の振幅算出手段と、復号された現フレームの有声
無声情報が有声である場合に、復号された各パラメー
タ、もしくは次フレームの各パラメータを併せて用い
て、現フレームの終端の位置での音源振幅を算出し、第
二の音源振幅として出力する第二の振幅算出手段と、前
記第一の音源振幅と第二の音源振幅を現フレーム内のピ
ッチ周期毎の位置で補間して補間振幅として出力する振
幅補間手段と、代表音源、もしくは前記代表音源と前後
のフレームの代表音源を現フレーム内のピッチ周期毎の
位置で補間した補間音源に前記補間振幅を乗じてピッチ
周期間隔に並べ立て、これを復号音源信号として出力す
る音源連接手段と、前記復号音源信号とスペクトル形状
情報、もしくは前記スペクトル形状情報と前後のフレー
ムのスペクトル形状情報を補間した補間スペクトル形状
情報を用いて復号音声信号を生成する合成手段を備え
た。

【００１９】また請求項９、１０記載の発明の音声復号
化装置は、符号化された代表音源を復号化する代表音源
復号化手段と、符号化されたスペクトル形状情報を復号
化するスペクトル形状情報復号化手段と、符号化された
音源シフト値を復号化する音源シフト値復号化手段と、
その音源シフト値が０でない場合に前記代表音源復号化
手段が出力した代表音源をその音源シフト値に基づいて
シフトさせたシフト音源を生成するシフト音源生成手段
と、このシフト音源に対する音源振幅を算出するシフト
音源振幅算出手段と、前記代表音源復号化手段が出力し
た代表音源に対する音源振幅を算出する振幅算出手段
と、前記シフト音源に前記シフト音源振幅算出手段が出
力したシフト音源に対する音源振幅を乗じたものを始め
に並べ、続くピッチ周期毎の位置に前記代表音源復号化
手段が出力した代表音源に前記振幅算出手段が出力した
音源振幅を乗じたものを並べ立て、これを復号音源信号
として出力する音源連接手段と、前記復号音源信号と復
号されたスペクトル形状情報を用いて復号音声信号を生
成する合成手段を備えた。

【００２０】

【作用】請求項１記載の発明における音声符号化装置
は、前フレームが無声音の場合には、音源信号内のピー
ク値、すなわち正および負の最大値を基準にして代表音
源の切り出しを行い、前フレームが有声音の場合には、
音源信号内のピーク値を基準にして切り出しを行うとと
もに、前フレームの代表音源との相関が最大になる音源
信号内の位置、もしくは前フレームの代表音源を切り出
した位置の音声信号との相関を最大にする音声信号内の
位置を基準にして切り出しを行い、相関値の大きさと音
源信号の様態によって、２つの切り出された信号の一方
を選択して代表音源とする。

【００２１】請求項２記載の発明の音声符号化装置は、
前記相関が最大になる位置を基準にして切り出した信号
と、最終的に選択された代表音源との位置のズレを算出
して、この値、もしくはこの値をピッチ周期で割った余
りを音源シフト値として符号化する。

【００２２】請求項３記載の発明の音声符号化装置は、
音源シフト値が小さい場合にこれを符号化せずに、本来
音源シフト値の符号化のために用いるビットを他のパラ
メータの符号化に用いる。

【００２３】請求項４記載の発明の音声符号化装置は、
前記の音源信号内のピーク値を基準にした切り出しとし
て、前フレームが無声音の場合には、現フレームの音源
信号内の絶対値の最大値を与える位置に基づいて切り出
しを行い、前フレームが有声音の場合には、現フレーム
の音源信号内の正および負の最大値を与える位置と、相
関を最大にする位置によって決定される音源信号内のの
所定の範囲における正および負の最大値を与える位置を
探索して、これらの位置の中の１つに基づいて切り出し
を行う。

【００２４】請求項５記載の発明の音声符号化装置は、
代表音源の符号化時の歪が大きい場合に、最近のフレー
ムで符号化時の歪が小さかったときの代表音源符号、ま
たは固定音源符号を出力する。

【００２５】請求項６記載の発明の音声符号化装置は、
音源信号を複数のカテゴリに分類して、カテゴリ毎の長
さの音源符号語で構成されるカテゴリ毎の符号帳を用い
て符号化を行う。

【００２６】請求項７記載の発明の音声復号化装置は、
復号化された代表音源、スペクトル形状情報、パワー情
報などの各パラメータを用いてピッチ周期毎の位置での
音源振幅を計算し、代表音源もしくはピッチ周期毎の位
置で補間された代表音源とこの音源振幅を順に乗じてい
くことで復号音源信号を生成する。

【００２７】請求項８記載の発明の音声復号化装置は、
復号化された代表音源、スペクトル形状情報、パワー情
報などの各パラメータを用いてフレームの始端と終端で
の音源振幅を計算し、この２つの音源振幅をピッチ周期
毎の位置で補間して用いる。

【００２８】請求項９、１０記載の発明の音声復号化装
置は、音源シフト値を復号化して、代表音源をこの音源
シフト値を用いてシフトさせたシフト音源を生成し、こ
れに対して音源振幅を算出して乗じ、フレームの始めの
復号音源信号とする。

【００２９】

【実施例】

実施例１．従来は、１ピッチ周期長代表残差信号の切り
出しを、現フレーム内の残差信号の振幅ピークのみに着
目して行っていたのに対して、この実施例は、現フレー
ムに於ける１ピッチ周期長代表残差信号の切り出しは、
前フレームとの位相連続性を考慮した区間で行われるべ
きであると考え、前フレームで抽出した１ピッチ周期長
代表残差信号の区間に対応する１ピッチ周期長の原音声
信号と、現フレームの原音声信号との相互相関を計算
し、相互相関値が最大となる区間を、現フレームの１ピ
ッチ周期長残差信号の切り出し区間とするものである。

【００３０】本発明の実施例を図に基づいて説明する。
図１は本発明の実施例である音声符号化装置の全体構成
図である。図において新規な部分は、２のスペクトル分
析手段、３のパワー情報算出手段、６のスペクトル形状
情報符号化手段、７のパワー情報符号化手段、１０の有
声音源符号化手段、１１の代表音源抽出手段、１３のス
ペクトル形状情報、１４の音源信号、１５のパワー情
報、１８の代表音源、１９のパワー情報符号、２０のス
ペクトル形状符号、２１の代表音源符号である。その他
の有声無声判定手段４、ピッチ周期抽出手段５、有声無
声情報符号化手段８、ピッチ周期符号化手段９、代表音
源符号化手段１２は従来のものと同等であり、説明を省
略する。また、図２は本発明の実施例である音声符号化
装置における代表音源抽出手段１１の詳細構成図であ
る。図において、２４はピーク性検定手段、２５は第一
の切り出し手段、２６は第二の切り出し手段、２７は選
択手段、２８は第一の切り出し音源、２９は第二の切り
出し音源、３０はピーク位置、３１はピーク性検定結果
である。

【００３１】以下、図１と図２に示した本発明の一実施
例の動作について説明する。スペクトル分析手段２は、
入力された現在のフレームの音声信号１を分析して、ス
ペクトル形状情報１３を求め、このスペクトル形状情報
１３と音声信号１から音源信号１４を算出する。音源信
号１４の算出は、例えばスペクトル形状情報１３の逆特
性を持つフィルタを構成して、音声信号１をこのフィル
タに通すことにより生成する。スペクトル形状情報符号
化手段６、このスペクトル形状情報１３を符号化して、
得られたスペクトル形状符号２０を符号化結果の１つと
して出力する。パワー情報算出手段３は、音声信号１を
分析して、パワー情報１５を算出する。パワー情報符号
化手段７は、このパワー情報１５を符号化して、得られ
たパワー情報符号１９を符号化結果の一つとして出力す
る。なお従来例では、スペクトル形状情報１３とパワー
情報１５を合わせてスペクトル包絡情報２０５とし、こ
れを符号化していたが、この本発明の実施例では、後述
する音声復号化装置の一実施例がスペクトル形状符号２
０とパワー情報符号１９と独立に用いる構成であるた
め、ここでも独立に処理する構成で説明する。

【００３２】代表音源抽出手段１１内の各手段は、ピッ
チ周期１６が入力された場合、すなわち有声無声情報１
７が有声音であった場合に、以下の動作を行う。まず、
第一の切り出し手段２５は、前記音源信号１４内の振幅
の絶対値が最大となる位置を探索し、この位置をピーク
位置３０として出力するとともに、ピーク位置３０を中
心にしたピッチ周期１６の長さの信号を音源信号１４か
ら切り出し、第一の切り出し音源２８として出力する。
第二の切り出し手段２６は、前フレームの有声無声情報
１７が有声音であった場合に、音源信号１４内の各位置
を中心としたピッチ周期１６の長さの信号と前フレーム
の代表音源１８の相互相関値を順に計算し、最大の相関
値を与えた位置を探索して、その位置を中心としたピッ
チ周期１６の長さの信号を第二の切り出し音源２９とし
て切り出す。

【００３３】ピーク性検定手段２４は、前記ピーク位置
３０における音源信号１４の振幅の絶対値と、音源信号
１４の振幅の絶対値の平均値を比較し、その比率が所定
の値以上の時には音源信号１４のピーク性が高いと判定
し、所定の値未満の時にはピーク性が低いと判定する。
ピーク性とは、その１ピッチ周期長残差信号が、先鋭な
波高ピークを持つか動かを示す指標として、定義される
もので、１ピッチ周期長残差信号の振幅の絶対値の平均
をave ，その１ピッチ周期内の振幅最大値の絶対値をpe
akとするとき、係数λ（λ≧１）を用いて、 peak ≧ λ・ａｖｅを満たすようなｐｅａｋが存在するとき、“ピーク性が
高い”とみなす。そして、その判定結果をピーク性検定
結果３１として出力する。選択手段２７は、前フレーム
が有声音でなかった場合には、第一の切り出し音源２８
をそのまま代表音源１８として出力する。前フレームが
有声音であった場合には、まず第二の切り出し音源２９
を切り出した際の相関値と所定の値を比較する。この相
関値が所定の値以上の時と、ピーク性検定結果３１がピ
ーク性が低いとしている時には、第二の切り出し音源２
９を代表音源１８として出力する。それ以外の時には、
第一の切り出し音源２８をそのまま代表音源１８として
出力する。上記のようにして代表音源抽出手段１１から
出力された代表音源１８を、代表音源符号化手段１２が
符号化して、得られた代表音源符号２１を符号化結果の
一つとして出力する。

【００３４】実施例２．上記実施例１では、スペクトル
分析手段２において、スペクトル形状情報１３と音声信
号１から音源信号１４を算出しているが、図３に示すよ
うに、スペクトル形状符号２０を復号化する手段を備え
て、復号化されたスペクトル形状情報と音声信号１から
音源信号１４を算出する構成も可能である。

【００３５】図３において、１０１はスペクトル形状情
報復号化手段であり、１ａは音源信号生成手段である。
図１に示した音声符号化装置と図３に示した音声符号化
装置の異なる点は、図１の音声符号化装置が符号化前の
スペクトル形状情報１３から音源信号を算出しているの
に対して、図３の音声符号化装置はスペクトル形状情報
１３を一度符号化し、それを復号化したスペクトル形状
情報１１６から音源信号１４を生成している点である。
このように、スペクトル形状情報１３を一度符号化し、
さらに符号化したスペクトル形状情報１１６を用いるこ
とにより、音声復号化装置で用いられるスペクトル形状
情報１１６と同一のスペクトル形状情報を用いて、音声
音源信号を生成することになるため、符号化あるいは復
号化によって生じる符号化誤差を持たない信号によっ
て、音声符号化装置と音声復号化装置が動作することが
可能になる。

【００３６】実施例３．上記実施例１では、第二の切り
出し手段２６が、音源信号１４内の各位置を中心とした
ピッチ周期１６の長さの信号と前フレームの代表音源１
８の相互相関値を順に計算し、最大の相関値を与えた位
置を探索して、その位置を中心としたピッチ周期１６の
長さの信号を第二の切り出し音源２９として切り出して
いるが、音声信号１内の各位置を中心としたピッチ周期
１６の長さの信号と前フレームの代表音源１８を切り出
した位置に対応する音声信号１の相互相関値を順に計算
し、最大の相関値を与えた位置を探索して、その位置を
中心としたピッチ周期１６の長さの音源信号を切り出す
構成も可能である。

【００３７】図４は、この実施例の一例を示す図であ
る。第二の切り出し手段２６は、音源信号１４とピッチ
周期１６以外に音声信号１を入力している。第二の切り
出し手段２６は、音源信号１４の相互相関値を計算する
のではなく、音声信号１を用いて相互相関値を計算し、
最大の相関値を与えた位置を中心としたピッチ周期１６
の長さの音源信号１４を、第二の切り出し音源２９とし
て切り出す。

【００３８】実施例４．上記実施例１では、ピーク性検
定手段２４において、前記ピーク位置３０における音源
信号１４の振幅の絶対値と、音源信号１４の振幅の絶対
値の平均値を比較しているが、ピーク位置３０近傍、例
えばピーク位置３０を含む前後数点の平均振幅を算出し
て、これと音源信号１４の振幅の絶対値の平均値を比較
する構成も可能である。また、ピーク位置３０の位置の
振幅の２乗、もしくはピーク位置３０を含む前後数点の
平均パワーを算出して、これと音源信号１４のパワーを
比較する構成も可能である。

【００３９】実施例５．図５は請求項２の発明の一実施
例である音声符号化装置の有声音源符号化手段１０の詳
細図である。図において新規な部分は、３１の音源シフ
ト値算出手段、３２の音源シフト値符号化手段、３３の
音源シフト値、３４の音源シフト値符号である。その他
の代表音源符号化手段１２、ピーク性検定手段２４、第
一の切り出し手段２５、第二の切り出し手段２６、選択
手段２７は実施例１と同等であり、説明を省略する。全
体構成は、図１に音源シフト値符号化手段３２が付加さ
れたものとなる。

【００４０】以下、図５に示した本発明の一実施例の動
作について説明する。音源シフト値算出手段３１は、第
二の切り出し手段２６が出力した第二の切り出し音源２
９の音源信号１４における位置と、選択手段２７が出力
した代表音源１８の音源信号１４における位置の間のズ
レを算出し、これをピッチ周期１６で割った余りを算出
し、音源シフト値３３として出力する。音源シフト値符
号化手段３２は、音源シフト値３３を符号化して、得ら
れた音源シフト値符号３４を符号化結果の１つとして出
力する。

【００４１】図６は、図２０の音源信号２０６と同じ信
号が音源信号１４として入力されたときの、音源シフト
値算出手段３１の動作を説明するものである。図６の左
側は、前フレームの代表音源として、位置ａを中心とし
た１ピッチ周期長の音源信号が切り出されていることを
示している。現フレームにおいて振幅最大の位置は位置
ｂであり、第一の切り出し手段２５はこの位置ｂを中心
とした１ピッチ周期長の信号を切り出す。また、前フレ
ームの代表音源に対して相関性が最も高いのは位置ｃを
中心とした１ピッチ周期長の信号であり、第二の切り出
し手段２６は位置ｃを中心とした信号を切り出す。今、
選択手段２７が、第一の切り出し手段２５が切り出した
信号、すなわち位置ｂを中心とした信号を代表音源１８
として選択した場合を考える。この時、音源シフト値３
３は、位置ｃと位置ｂの差をピッチ周期で割った余りと
して算出される。なお、図６では、位置ｃと位置ｂの差
がピッチ周期未満のため、そのままの値が音源シフト値
３３となっている。選択手段２７が、第二の切り出し手
段２６が切り出した信号、すなわち位置ｃを中心とした
信号を代表音源１８として選択した場合には、音源シフ
ト値３３は０となる。

【００４２】この音源シフト値３３は、前述したように
音源シフト値符号化手段３２により符号化され、音源シ
フト値符号３４として音声復号化装置に出力される。こ
の音源シフト値符号３４の利用の仕方については、後述
する音声復号化装置の実施例の中で詳細に説明するが、
復号側では最初の１ピッチ分についてシフト長分だけず
らして代表音源の並べ立てを行う。このように、この実
施例はピーク性が低い場合には、相関最大位置の１ピッ
チ周期長区間を代表音源として切り出す。ピーク性が高
い場合には、相関最大１ピッチ周期長区間内のピーク位
置を抽出し、その位置をセンタとする新たな１ピッチ周
期長区間を切り出し、ピーク位置の変位をシフト長とし
て同時に転送する。合成側では、最初の１ピッチ分につ
いて、シフト長分だけずらして音源の並べ立てを開始す
る。

【００４３】また、上記実施例５では代表音源抽出手段
１１は、第一の切り出し手段２５と第二の切り出し手段
２６の両方が存在する場合を説明したが、第一の切り出
し手段２５が存在せず、第二の切り出し手段２６が存在
している場合でも構わない。すなわち、代表音源抽出手
段１１は、第二の切り出し手段２６により、切り出され
た第二の切り出し音源と全フレームの代表音源１８に基
づいて音源シフト値を算出する。

【００４４】実施例６．図７は、請求項３の発明の一実
施例である音声符号化装置の有声音源符号化手段１０の
詳細図である。図において新規な部分は、３５のシフト
値比較手段、３６のモード制御手段、３７の比較結果、
３８のモード信号である。代表音源符号化手段１２、音
源シフト値符号化手段３２は、実施例５と同等のものに
一部機能が追加したものである。代表音源抽出手段１１
は実施例５と同等であり、説明を省略する。全体構成
は、図１の有声音源符号化手段１０の部分が図７の構成
に置き換えられたものとなる。

【００４５】以下、図７に示した本発明の一実施例の動
作について説明する。シフト値比較手段３５は、音源シ
フト値３３のピッチ周期１６に対する比率を求め、この
比率が所定の値以上であるか、所定の値未満であるか比
較した結果を比較結果３７として出力する。モード制御
手段３６は、比較結果３７において比率が所定の値以上
であった場合には、音源シフト値符号化手段３２を動作
させる第一のモードを選択し、比較結果３７において比
率が所定の値未満であった場合には、音源シフト値符号
化手段３２を動作させない第二のモードを選択し、どち
らのモードを選択したかをモード信号３８として符号化
結果の一つとして出力する。

【００４６】音源シフト値符号化手段３２は、前記モー
ド信号３８がその動作を要求している場合に、音源シフ
ト値３３を符号化して、得られた音源シフト値符号３４
を出力する。代表音源符号化手段１２は、前記モード信
号３８が音源シフト値符号化手段３２の動作を要求して
いる場合は、実施例１ないし実施例５と同等の処理を行
い、モード信号３８が音源シフト値符号化手段３２の動
作を要求していない場合には、音源シフト値符号３４の
情報ビット数だけ多い情報ビット数を用いて代表音源１
８を符号化して、得られた代表音源符号２１を符号化結
果の一つとして出力する。

【００４７】例えば、図７に示した有声音源符号化手段
１０の出力として、１５ビットの情報量が与えられてい
る場合、モード信号３８に１ビットを用い、音源信号シ
フト値符号３４に４ビットを用いる場合について考えて
みる。もし、モード信号３８が音源シフト値を符号化す
るモードを示している場合には、音源シフト値符号３４
が４ビットの情報として出力される。従って、代表音源
符号２１は、１０ビットの情報量で符号化される。一
方、モード信号３８が音源シフト値を符号化しないモー
ドを示している場合には、音源シフト値符号３４は出力
されない。従って、代表音源符号２１は１４ビットの情
報量を用いて符号化される。実験では、シフトが生ずる
フレームは全体の１割以下であり、大半のシフトが生じ
ないフレームではシフト長を伝送せず、他のパラメータ
に余ビットを配分できることが分かっている。

【００４８】実施例７．上記実施例６では、モード信号
３８が音源シフト値符号化手段３２の動作を要求しない
場合に、代表音源符号化手段１２の情報ビット数を増や
しているが、スペクトル形状情報符号化手段６、パワー
情報符号化手段７、ピッチ周期符号化手段９における情
報ビット数を増やす構成も可能である。

【００４９】また、前記実施例６においては、代表音源
抽出手段１１は実施例５と同等である場合を説明した
が、前述したように代表音源抽出手段１１には第一の切
り出し手段が存在せず、第二の切り出し手段２６と音源
シフト値算出手段３１が存在する場合であっても構わな
い。

【００５０】実施例８．図８は請求項４の発明の一実施
例である音声符号化装置の第一の切り出し手段２５の詳
細図である。図において新規な部分は、３９の第一のピ
ーク探索手段、４０の第二のピーク探索手段、４１の第
一のピーク選択手段、４２の第二のピーク選択手段、４
３のピーク位置基準切り出し手段、４４のピーク値とピ
ーク位置、４５のピーク値とピーク位置、４６の選択ピ
ーク値と選択ピーク位置、４７の選択ピーク値と選択ピ
ーク位置がある。なお、煩雑となることを避けるために
図示することを省略しているが、ピッチ周期１６は第一
のピーク選択手段４１、第二のピーク選択手段４２、ピ
ーク位置基準切り出し手段４３にも入力されている。全
体構成は、図１ないし図５、図７で記述された実施例１
ないし実施例７の何れかと同じ構成でよい。但し、第二
の切り出し音源２９が第一の切り出し手段２５に入力さ
れており、この第二の切り出し音源２９は、第二のピー
ク探索手段４０に入力されている。

【００５１】以下、図８に示した本発明の一実施例の動
作について説明する。第一のピーク探索手段３９は、ピ
ッチ周期１６が入力された場合、すなわち現フレームの
有声無声情報１７が有声であった場合に、音源信号１４
内の正および負の最大値を探索して、その値と位置をピ
ーク値とピーク位置４４として出力する。第二のピーク
探索手段４０は、ピッチ周期１６と第二の切り出し音源
２９が入力された場合、すなわち前フレームと現フレー
ムが両方とも有声であった場合に、第二の切り出し音源
２９内の所定の範囲内の正および負の最大値を探索し
て、その値と位置をピーク値とピーク位置４５として出
力する。所定の範囲としては、例えば、図６に示した第
二の切り出し音源２９の位置ｃを中心として、前後数サ
ンプルまたはピッチ周期１６の数分の一の前後サンプル
の範囲とする。

【００５２】第一のピーク選択手段４１は、前フレーム
が無声音であった場合に、前記第一のピーク探索手段３
９が出力したピーク値とピーク位置４４の中で絶対値が
最大のものを選択して、選択ピーク値と選択ピーク位置
４６として出力する。第二のピーク選択手段４２は、前
フレームが有声音であった場合に、前フレームにおいて
ピーク位置基準切り出し手段４３が最終的に選択した選
択ピーク値の符号と、前記ピーク値とピーク位置４４と
ピーク値とピーク位置４５の各ピーク値を用いて、前フ
レームの選択ピーク値と同符号であるピークを選択し易
いようにして、また、４４のピークより４５のピークを
選択し易いようにして、また、絶対値の大きなピークを
選択し易いようにして、ピーク値とピーク位置４４とピ
ーク値とピーク位置４５の中から１つを選択して、選択
ピーク値と選択ピーク位置４７として出力する。ピーク
位置基準切り出し手段４３は、選択ピーク値と選択ピー
ク位置４６もしくは選択ピーク値と選択ピーク位置４７
の一方が入力されるので、その選択ピーク位置を中心に
してピッチ周期１６の長さの信号を音源信号１４から切
り出し、第一の切り出し音源２８として出力する。

【００５３】図９は、実施例８の第一の切り出し手段２
５の動作を説明するものである。まず、第一のピーク探
索手段３９は、音源信号１４内の正の最大値を与えるピ
ーク位置ａとその値Ｒａを出力する。また、音源信号１
４内の負の最大値を与えるピーク位置ｂとその値Ｒｂを
出力する。次に、第二のピーク探索手段４０は、第二の
切り出し音源２９の中心位置の前後数サンプルを所定の
範囲Ａとして、この範囲Ａにおいて正の最大値を与える
ピーク位置ｃとその値Ｒｃと負の最大値を与えるピーク
位置ｄとその値Ｒｄを出力する。前フレームが無声であ
る場合には、第一のピーク選択手段４１が、ＲａとＲｂ
の絶対値の大きい方である位置ａを選択して、ピーク位
置基準切り出し手段４３が、この位置ａを中心にした切
り出しを行う。前フレームが有声である場合には、第二
のピーク選択手段４２が、Ｒａ、Ｒｂ、Ｒｃ、Ｒｄの絶
対値と、前フレームの選択ピークの符号を用いて、ａな
いしｄの位置の中から一つの位置を選択し、ピーク位置
基準切り出し手段４３が、この位置を中心にした切り出
しを行う。

【００５４】前述したように第二のピーク選択手段４２
は、前フレームの選択ピーク値と動符号であるピークを
選択する。同様に、第一のピーク探索手段３９からの出
力よりも第二のピーク探索手段４０からの出力を選択す
る。更に、絶対値の大きなピークを選択する。従って、
ａないしｄの振幅の値ＲａないしＲｄに大きな差がな
く、且つ前フレームの選択ピークの符号が正であったと
すれば、この例においては４つの振幅の絶対値の差が少
ないことから、選択ピークの符号と同符号で、第二のピ
ーク探索手段４０の出力である位置ｃが優先的に選択さ
れる。

【００５５】前述した実施例１における代表音源抽出手
段１１内の第一の切り出し手段２５は、音源信号１４内
の振幅の絶対値は最大となる位置を探索し、この位置を
ピーク位置３０として出力するものであったが、この実
施例による第一の切り出し手段２５によれば、第二のピ
ーク探索手段４０が前フレームの選択ピーク値と同符号
であるピークを選択し易いようにしていることにより、
単にピーク値の絶対値の大きなものを選択する場合に比
べて、ピーク位置３０が頻繁に変更されること防ぐこと
になる。また、同様に第二のピーク探索手段は、第一の
ピーク探索手段３９により出力された現フレームの音源
信号１４内の正および負の最大値から求められたピーク
値よりも、第二のピーク探索手段により探索された前フ
レームと最も関係の深い位置から切り出された第二の切
り出し音源内の所定の範囲内の正および負の最大値から
求められたピーク値を選択し易いようにしているため、
相関値を最大にする位置近傍のピークが選択される可能
性が高くなり、代表音源の位相の連続性が改善される。

【００５６】実施例９．図１０は請求項５の発明の一実
施例である音声符号化装置の代表音源の符号化部分の詳
細図である。全体構成は、図１の代表音源符号化手段１
２の部分を、この図１０で置き換えた構成である。図に
おいて新規な部分は、４８の音源符号選択手段、４９の
音源更新手段、５０の音源記憶手段、５１、５３、およ
び５４の代表音源符号化結果、５２は過去の代表音源符
号化結果である。また、代表音源符号化手段１２は、実
施例１の相当部分に対して、出力情報の一部追加があ
る。

【００５７】以下、図１０に示した本発明の一実施例の
動作について説明する。代表音源符号化手段１２は、代
表音源１８を符号化して、得られた代表音源符号とその
符号化歪を代表音源符号化結果５１として出力する。音
源記憶手段５０には、過去の代表音源符号化結果５２を
後述する方法で格納しておく。そして、図１１に示すよ
うに、音源符号選択手段４８は、前記代表音源符号化結
果５１の符号化歪が第一の閾値以上である場合、過去の
代表音源符号化結果５２内の代表音源符号を代表音源符
号２１として出力する。また、前記代表音源符号化結果
５１の符号化歪が第二の閾値（ただし、第一の閾値＞第
二の閾値）以上および過去の代表音源符号化結果５２内
の符号化歪以上である場合に、過去の代表音源符号化結
果５２内の代表音源符号を音源符号５５として出力す
る。上記以外の場合には、代表音源符号化結果５１内の
代表音源符号を代表音源符号２１として出力すると共
に、代表音源符号化結果５１をそのまま代表音源符号化
結果５３として出力する。なお、第二の閾値は第一の閾
値以下に設定する。音源更新手段４９は、前記代表音源
符号化結果５３が入力された場合に、これを代表音源符
号化結果５４として音源記憶手段５０に出力して、音源
記憶手段５０内に格納してある過去の代表音源符号化結
果５２を更新する。

【００５８】このようにして音源記憶手段５０には過去
の代表音源符号化結果５２として、所定の歪以下である
ような代表音源符号化結果が格納されることになる。図
１０に示した代表音源符号化手段１２によれば、符号化
歪が大きい場合には、その歪が大きい代表音源符号化結
果を代表音源符号として出力することを禁止し、過去に
おいて出力した歪の少ない代表音源符号化結果を代表音
源符号として出力することになる。すなわち、音源記憶
手段５０は過去において出力した歪の大きさが許容範囲
内である代表音源符号化結果の最新のものを記憶してお
き、新たに求められた代表音源符号化結果と記憶された
代表音源符号化結果を比較し、より歪の小さいものを代
表音源符号として出力することが可能になる。

【００５９】実施例１０．上記実施例９では、音源符号
選択手段４８が、前記代表音源符号化結果５１の符号化
歪が第一の閾値以上である場合と、前記代表音源符号化
結果５１の符号化歪が第二の閾値および過去の代表音源
符号化結果５２内の符号化歪以上である場合に、過去の
代表音源符号化結果５２内の代表音源符号を代表音源符
号２１として出力する構成となっているが、この条件
に、過去の代表音源符号化結果５２の符号化前の代表音
源と代表音源１８の相互相関値が高い場合に、過去の代
表音源符号化結果５２内の代表音源符号を代表音源符号
２１として出力するという項目を追加した構成も可能で
ある。

【００６０】実施例１１．上記実施例９では、音源符号
選択手段４８が、代表音源符号化結果５１内の代表音源
符号と過去の代表音源符号化結果５２内の代表音源符号
の一方を選択する構成となっている。しかし、前記代表
音源符号化結果５１の符号化歪が第一の閾値以上である
場合に、固定音源符号を代表音源符号２１として出力
し、それ以外の場合には、代表音源符号化結果５１内の
代表音源符号を代表音源符号２１として出力する構成模
可能である。また、前記代表音源符号化結果５１の符号
化歪と過去の代表音源符号化結果５２内の符号化歪が第
一の閾値以上である場合に、固定音源符号を音源符号５
５として出力し、前記代表音源符号化結果５１の符号化
歪が第二の閾値および過去の代表音源符号化結果５２内
の符号化歪以上である場合に、過去の代表音源符号化結
果５２内の代表音源符号を代表音源符号２１として出力
し、その他の場合には、代表音源符号化結果５１内の代
表音源符号を代表音源符号２１として出力すると共に、
代表音源符号化結果５１をそのまま代表音源符号化結果
５３として出力するという構成も可能である。

【００６１】実施例１２．図１１は請求項６の発明の一
実施例である音声符号化装置の有声音源符号化手段１０
の詳細図である。図において新規な部分は、５５の音源
分類手段、５６のカテゴリ毎の音源符号帳、５７のカテ
ゴリ番号、５８の切り換えスイッチ、５９の音源符号語
である。その他の代表音源抽出手段１１と代表音源符号
化手段１２は実施例１ないし実施例１１と同等のもので
あり、説明を省略する。また、全体構成は、実施例１な
いし実施例１１と同じである。

【００６２】以下、図１２に示した本発明の一実施例の
動作について説明する。図において特徴となる点は、音
源分類手段５５が設けられている点である。音源分類手
段は音源信号１４とピッチ周期符号２２と音源シフト値
符号３４を入力する。そして、音源分類手段５５は、ピ
ッチ周期符号２２と音源シフト値符号３４、もしくはそ
の一方を用いて、音源信号１４を複数のカテゴリに分類
し、そのカテゴリ番号５７を出力する。ここでカテゴリ
の種類としては、例えば相関値が低い、高いあるいは、
ピーク値の振幅の絶対値が大きい、小さいあるいは、音
源の切り出しがシフトした、シフトしないというような
カテゴリの種類が挙げられる。あるいは、パワー情報や
スペクトル形状情報の特徴により音源をカテゴリに分類
する場合でも構わない。カテゴリ毎の音源符号帳５６に
は、予め、各カテゴリに分類される典型的な代表音源
を、カテゴリ毎に設定した長さに揃えて、音源符号語と
して格納しておく。所定の長さに揃える方法としては、
代表音源が長い場合にはその両端を切り捨て、代表音源
が短い場合にはその両端に０信号を付加すれば良い。切
り換えスイッチ５８は、音源分類手段５５の出力したカ
テゴリ番号５７に対して、対応するカテゴリ毎の音源符
号帳５６中の１つの音源符号帳に接続する。代表音源符
号化手段１２は、切り換えスイッチ５８を介して入力さ
れる音源符号語５９を用いて符号化を行う。

【００６３】実施例１３．上記実施例１２では、音源分
類手段５５が、ピッチ周期符号２２と音源シフト値符号
３４、もしくはその一方を用いて、複数のカテゴリに分
類しているが、スペクトル形状符号２０、パワー情報符
号１９等の他の符号化結果を併せて用いる構成も可能で
ある。

【００６４】実施例１４．上記実施例１２および実施例
１３では、音源分類手段５５が、代表音源符号２１以外
の符号化結果を用いて、音源信号を複数のカテゴリに分
類しているが、実施例５のピーク性検定手段２４と同様
のピーク値と平均振幅の比率などの音源信号１４を分析
して得られるパラメータを用いて分類を行い、カテゴリ
番号を符号化結果の一つとする構成も可能である。

【００６５】この実施例１４による場合には、カテゴリ
番号を符号化結果の１つとするため、伝送する情報量に
限りがある場合には、このカテゴリ番号のためにその情
報の一部を割かねばならない。しかし、前述した実施例
１２および実施例１３の場合には、ピッチ周期符号２２
および音源シフト値符号３４およびスペクトル形状符号
２０およびパワー情報符号１９等は既に音声符号化装置
から符号化結果の一部として出力されているものである
ため、実施例１４のようにカテゴリ番号を特に符号化し
て出力する必要はなく、既に符号化された情報を用いて
カテゴリを判別することが可能になるという利点があ
る。

【００６６】音声復号化装置おいては、音声符号化装置
で用いられたカテゴリ毎の音源符号帳５６と同様の音源
符号帳を設け、音声符号化装置が用いたカテゴリと同様
のカテゴリの音源符号帳を用いて音声を復号化する。従
って、符号化の過程において、どのカテゴリの音源符号
帳を用いたかを復号化装置に伝送する必要が生ずる。実
施例１２、１３によれば、この符号化装置が用いたカテ
ゴリを特にカテゴリ番号等の特別な符号化結果を用いる
ことなく、復号化装置に伝えることが可能である。

【００６７】実施例１５．上記実施例１ないし実施例１
４では、代表音源抽出手段１１がピッチ周期１６の長さ
の代表音源１８を切り出す構成となっているが、代表音
源１８として所定の長さに揃えた信号を切り出す構成、
もしくはカテゴリ毎の所定の長さに揃えた信号を切り出
す構成も可能である。所定の長さに揃える方法として
は、実施例１３のカテゴリ毎の音源符号帳５６内の音源
符号語に関する方法を用いることができる。すなわち、
代表音源が長い場合にはその両端を切り捨て、代表音源
が短い場合にはその両端に０信号を付加すれば良い。

【００６８】実施例１６．図１３は請求項７の発明の一
実施例である音声復号化装置の全体構成図である。図に
おいて新規な部分は、１０１のスペクトル形状情報復号
化手段、１０２のパワー情報復号化手段、１０６のスペ
クトル形状情報補間手段、１０７の有声音源生成手段、
１０８のパワー情報補間手段、１０９の代表音源補間手
段、１１０の振幅算出手段、１１１の音源連接手段、１
１５の復号音声信号、１１６のスペクトル形状情報、１
１７のパワー情報、１１８の代表音源、１２１の補間ス
ペクトル形状情報、１２２の補間パワー情報、１２３の
補間音源、１２４のピッチ周期毎の振幅情報、１２５の
有声音復号音源信号、１２７の復号音源信号である。な
お、煩雑となることを避けるために図示することを省略
しているが、ピッチ周期１１９は有声音源生成手段１０
７内の全ての手段に入力されている。その他の代表音源
復号化手段１０３、ピッチ周期復号化手段１０４、有声
無声情報復号化手段１０５、無声音源生成手段１１２、
音源切り換え手段１１３、合成手段１１４は従来のもの
と同等であり、説明を省略する。

【００６９】以下、図１３に示した本発明の一実施例の
動作について説明する。スペクトル形状情報復号化手段
１０１は、入力されたスペクトル形状符号２０を復号化
して、得られたスペクトル形状情報１１６を出力する。
スペクトル形状情報補間手段１０６は、現フレームのス
ペクトル形状情報１１６と前フレームもしくは前後のフ
レームのスペクトル形状情報１１６とを各サンプル位置
で補間し、補間スペクトル形状情報１２１として出力す
る。パワー情報復号化手段１０２は、入力されたパワー
情報符号１９を復号化して、得られたパワー情報１１７
を出力する。有声音源生成手段１０７内のパワー情報補
間手段１０８は、現フレームのパワー情報１１７と前フ
レームもしくは前後のフレームのパワー情報１１７とを
ピッチ周期１１９毎の位置で補間し、補間パワー情報１
２２として出力する。

【００７０】有声音源生成手段１０７内の代表音源補間
手段１０９は、現フレームの代表音源１１８と前フレー
ムもしくは前後のフレームの代表音源１１８とをピッチ
周期１１９毎の位置で補間し、補間音源１２３として出
力する。有声音源生成手段１０７内の振幅算出手段１１
０は、前記補間スペクトル形状情報１２１、補間パワー
情報１２２、補間音源１２３を用いて、ピッチ周期毎の
位置での音源に対する振幅を算出し、ピッチ周期毎の振
幅情報１２４として出力する。音源連接手段１１１は、
ピッチ周期毎の位置で補間パワー情報１２２にピッチ周
期毎の振幅情報１２４を乗じて、乗じた結果を順に並べ
立てて、有声音復号音源信号１２５として出力する。

【００７１】図１４は、有声音源生成手段１０７の動作
の説明図である。図中、破線で示されている波形は、前
フレームの音源連接手段１１１における最後の１ピッチ
周期長の補間音源に振幅を乗じたものである。音源連接
手段１１１ではピッチ周期毎に並べ立てを行っていくの
で、この最後の１ピッチ周期長の終端と、図の最上部に
記した現フレームの始端とが通常一致しない。そこで、
音源連接手段１１１内では、最後のピッチ周期長の終端
まで信号の生成を行って、そのフレームの終端位置まで
の信号を有声音復号音源信号１２５として出力するとと
もに、次フレームの始めに残りの部分を出力するように
している。まず、現フレームの１番目のピッチ周期の位
置Ｐ１において、各パラメータの補間を行って、補間ス
ペクトル形状情報１２１、補間パワー情報１２２、補間
音源１２３を算出する。振幅算出手段１１０内では、こ
の補間スペクトル形状情報１２１と補間音源１２３を用
いて、図のように１ピッチ周期長の仮の合成音声を生成
し、合成音声のサンプル当たりの平均パワーと、補間パ
ワー情報１２２が一致するように振幅ｇを決定する。こ
の処理を、後続するピッチ周期毎の位置Ｐ２、Ｐ３にお
いて行って、得られた振幅ｇの系列をピッチ周期毎の振
幅情報１２４とする。音源連接手段１１１では、補間音
源１２３とピッチ周期毎の振幅情報１２４を乗じて、図
中の実線の音源波形のように順に並べ立てていく。

【００７２】この実施例で特徴となる点は、現フレーム
内のピッチ周期毎の位置で音源振幅を算出している点で
ある。この実施例によれば、ピッチ周期毎に振幅情報を
最適に変化させることができるため、入力音声に対して
より忠実な音声の再現が可能になる。また、この１ピッ
チ周期毎の振幅の算出を代表音源を補間した補間音源に
適用することにより、フレーム間の代表音源の間に比較
的大きな差異がある場合でも振幅の不連続の少ない復号
音声信号か生成できる。

【００７３】実施例１７．上記実施例１６では、スペク
トル形状情報１１６、パワー情報１１７、代表音源１１
８を補間する構成となっているが、ピッチ周期１１９を
も補間する構成や、４つのパラメータの内実施例１６以
外の組み合わせの複数のパラメータのみ補間する構成も
可能である。

【００７４】実施例１８．図１５は請求項８の発明の一
実施例である音声復号化装置の有声音源生成手段１０７
の詳細図である。図において新規な部分は、１２８の第
一の振幅算出手段、１２９の第二の振幅算出手段、１３
０の振幅補間手段、１３１の第一の補間パワー情報、１
３２の第二の補間パワー情報、１３３の第一の補間音
源、１３４の第二の補間音源、１３５の第一の補間スペ
クトル情報、１３６の第二の補間スペクトル情報、１３
７の第一の音源振幅、１３８の第二の音源振幅である。
パワー情報補間手段１０８、代表音源補間手段１０９は
実施例１６と補間を行う位置が異なる。なお、煩雑とな
ることを避けるために図示することを省略しているが、
ピッチ周期１１９は、第一の振幅算出手段１２８、第二
の振幅算出手段１２９、振幅補間手段１３０にも入力さ
れている。全体構成は、図１４において、スペクトル形
状情報補間手段１０６から有声音源生成手段１０７への
出力を、第一の補間スペクトル情報１３５と第二の補間
スペクトル情報１３６に変更したものである。

【００７５】以下、図１５に示した本発明の一実施例の
動作について説明する。前述した実施例１６および実施
例１７においては、有声音源生成手段１０７がピッチ周
期１１９毎に振幅を算出する場合について説明したが、
ピッチ周期１１９毎に振幅を算出する場合は、その算出
量が多くなるため、この実施例においては、ピッチ周期
全体ではなくピッチ周期の始めと終りについてのみ振幅
を算出し、その算出量を減少させる場合について説明す
る。

【００７６】パワー情報補間手段１０８は、現フレーム
のパワー情報１１７と前フレームもしくは前後のフレー
ムのパワー情報１１７とを現フレームの始端と終端の位
置で補間し、始端の位置で得られたものを第一の補間パ
ワー情報１３１、終端の位置で得られたものを第二の補
間パワー情報１３２として出力する。

【００７７】代表音源補間手段１０９は、現フレームの
代表音源１１８と前フレームもしくは前後のフレームの
代表音源１１８とをピッチ周期１１９毎の位置で補間
し、補間音源１２３として出力する。また、代表音源補
間手段１０９は、現フレームの代表音源１１８と前フレ
ームもしくは前後のフレームの代表音源１１８とを現フ
レームの始端と終端の位置で補間し、始端の位置で得ら
れたものを第一の補間音源１３３、終端の位置で得られ
たものを第二の補間音源１３４として出力する。

【００７８】スペクトル形状情報補間手段１０６は、現
フレームのと前フレームもしくは前後のフレームの代表
音源１１８とを現フレームの始端と終端の位置で補間
し、始端の位置で得られたものを第一の補間音源１３
３、終端の位置で得られたものを第二の補間音源１３４
として出力する。

【００７９】第一の振幅算出手段１２８は、前記第一の
補間スペクトル情報１３５、第一の補間パワー情報１３
１、第一の補間音源１３３を用いて、現フレームの始端
の位置での音源に対する振幅を算出し、第一の音源振幅
１３７として出力する。第二の振幅算出手段１２９は、
前記第二の補間スペクトル情報１３６、第二の補間パワ
ー情報１３２、第二の補間音源１３４を用いて、現フレ
ームの終端の位置での音源に対する振幅を算出し、第二
の音源振幅１３８として出力する。振幅の算出は、図１
１において説明したように、始端と終端における仮の合
成音を作成して求める。振幅補間手段１３０は、第一の
音源振幅１３７と第二の音源振幅１３８をピッチ周期毎
の位置で補間して、得られたピッチ周期毎の振幅情報１
２４を出力する。

【００８０】このようにこの実施例では、ピッチ周期の
前後においてのみ振幅を算出し、その間の振幅は補間に
より求めているため、前述した実施例１６あるいは実施
例１７に比べて振幅の算出量が減るという利点がある。

【００８１】実施例１９．前述した音声符号化装置の一
実施例として、音源シフト値符号３４を出力する場合を
説明したが、この実施例では音源シフト値符号３４を入
力して音声の復号を行う場合について説明する。

【００８２】図１６は請求項９の発明の一実施例である
音声復号化装置の有声音源生成手段１０７の詳細図であ
る。図において新規な部分は、１３９の音源シフト値復
号化手段、１４０のシフト音源生成手段、１４１のシフ
ト音源振幅算出手段、１４２の音源シフト値、１４３の
シフト音源、１４４のシフト音源振幅である。その他の
パワー情報補間手段１０８、振幅算出手段１１０、音源
連接手段１１１は、実施例１６と同等である。なお、煩
雑となることを避けるために図示することを省略してい
るが、ピッチ周期１１９は、パワー情報補間手段１０
８、振幅算出手段１１０にも入力されている。全体構成
は、図１０に、音源シフト値復号化手段１３９を追加し
た構成である。

【００８３】以下、図１６に示した本発明の一実施例の
動作について説明する。音源シフト値復号化手段１３９
は、音源シフト値符号３４を復号化して、得られた音源
シフト値１４２を出力する。有声音源生成手段１０７内
のシフト音源生成手段１４０は、代表音源１１８に対し
て、その先頭から前記音源シフト値１４２の長さだけ削
除した短い信号を作成して、これをシフト音源１４３と
して出力する。パワー情報補間手段１０８は、現フレー
ムのパワー情報１１７と前フレームもしくは前後のフレ
ームのパワー情報１１７とを、最終的に音源連接手段１
１１においてシフト音源１４３を並べ立てる位置と後続
の代表音源１１８を並べ立てるピッチ周期毎の位置にお
いて補間し、得られた補間パワー情報１２２を出力す
る。

【００８４】シフト音源振幅算出手段１４１は、スペク
トル形状情報１１６、シフト音源１４３、シフト音源１
４３の位置における補間パワー情報１２２を用いて、シ
フト音源振幅１４４に対する振幅を算出し、シフト音源
振幅１４４として出力する。算出の方法は、図１１を用
いて説明した振幅算出手段１１０と同様にすれば良い。
振幅算出手段１１０は、スペクトル形状情報１１６、代
表音源１１８、補間パワー情報１２２を用いて、シフト
音源１４３に後続するピッチ周期毎の位置における音源
振幅を算出して、ピッチ周期毎の振幅情報１２４として
出力する。音源連接手段１１１は、始めにシフト音源１
４３にシフト音源振幅１４４を乗じたものを並べ、続い
て代表音源１１８にピッチ周期毎の振幅情報１２４を乗
じたものを順に並べ立て、有声音復号音源信号１２５と
して出力する。

【００８５】図１７は、実施例１９の有声音源生成手段
１０７の動作を説明するものである。図において、上段
の波形が、前フレームに音源連接手段１１１内において
生成された最後の代表音源にその音源振幅を乗じたもの
であり、下段の波形が現フレームで音源連接手段１１１
内において最終的に生成された信号である。まず、代表
音源１１８の先頭から音源シフト値１４２の長さの部
分、図中では破線の部分が、削除され、これがシフト音
源１４３となる。この破線の部分は図６に示した音源シ
フト値３３（ｃ−ｂ）を示している。図６に示したよう
に、音源の位置ｃから音源の位置ｂにシフトされて代表
音源が符号化されて出力されてきているため、音声を復
号化する場合には、音源の位置ｃから音源の位置ｂにシ
フトした部分だけ音源をシフトさせて復号化する必要が
生じる。そしてこのシフトした部分は前フレームの最後
の代表音源と重なるため、図１８に示したように破線の
部分が削除されることになる。このようにして、音源を
シフトして符号化した場合でも破線の部分を削除するこ
とにより、前フレームの代表音源と現フレーム代表音源
と位相は入力音声と同様なものが復号化される。次に、
位置Ｐ１において補間された各パラメータを用いてシフ
ト音源振幅１４４が算出され、これをシフト音源１４３
に乗じたものを、上段の波形に続けて並べ立てる。次
に、位置Ｐ２と位置Ｐ３において補間された各パラメー
タを用いて、各位置に並べる代表音源１１８に対する音
源振幅を算出し、ピッチ周期毎の振幅情報１２４シフト
音源振幅１４４とする。これを代表音源１１８に乗じた
ものを、続けて並べ立てる。

【００８６】実施例２０．上記実施例１９では、常に音
源シフト値復号化手段１３９が入力される音源シフト値
符号３４を復号化する構成となっているが、モード信号
３８を入力して、このモード信号３８によって、音源シ
フト値復号化手段１３９を動作させるモードと、この音
源シフト値復号化手段１３９を動作させずに音源シフト
値１４２を０とし、スペクトル形状情報復号化手段１０
１、パワー情報復号化手段１０２、代表音源復号化手段
１０３の何れかを通常音源シフト値の符号化に用いるビ
ット数分だけ多いビット数で復号化するモードを切り換
える構成も可能である。

【００８７】実施例２１．上記実施例１６ないし実施例
２０の音声復号化装置内に、音源分類手段５５と同じ音
源分類手段と、カテゴリ毎の音源符号帳５６と同じ音源
符号帳を備えて、前記音源分類手段によって得られたカ
テゴリ番号に対応した音源符号帳を用いて、代表音源１
１８が復号化を行う構成も可能である。

【００８８】実施例２２．上記実施例１６ないし実施例
２０の音声復号化装置内に、カテゴリ毎の音源符号帳５
６と同じ音源符号帳を備えて、カテゴリ番号を入力し
て、このカテゴリ番号に対応した音源符号帳を用いて、
代表音源１１８が復号化を行う構成も可能である。

【００８９】

【発明の効果】以上説明したように請求項１記載の発明
は、音源信号内のピーク位置を基準とした切り出しと、
前フレームの切り出し位置の音源信号または音声信号と
の相関値を最大にする音源信号または音声信号の位置を
基準とした切り出しを行って、相関値の大きさなどによ
って一方を選択するようにしたので、音源信号の１ピッ
チ周期長内に大きな振幅ピークが複数ある場合や、音源
信号が徐々に変化していく場合でも、隣接フレーム間の
位相の連続性が高い安定した代表音源の切り出しができ
る効果がある。この音声符号化装置の符号化結果を用い
て復号音声信号を作成した場合、その音質が改善される
効果がある。

【００９０】請求項２記載の発明は、代表音源の位置と
相関値を最大にする位置のズレを求め、これをそのま
ま、もしくはこれをピッチ周期で割った余りを音源シフ
ト値として算出して、これを符号化するようにしたの
で、隣接フレーム間の位相がほぼ完全に連続した良好な
代表音源の切り出しができる効果がある。この音声符号
化装置の符号化結果を用いて復号音声信号を作成した場
合、その音質が改善される効果がある。

【００９１】請求項３記載の発明は、音源シフト値のピ
ッチ周期に対する比率が大きい場合には音源シフト値の
符号化を行い、小さい場合には音源シフト値を符号化せ
ずに、余剰ビットを他のパラメータの符号化に利用する
ようにしたので、大半のフレームを占める音源シフト値
の符号化が不要な場合の他のパラメータの符号化特性が
改善される効果がある。

【００９２】請求項４記載の発明は、請求項１ないし請
求項３の第一の切り出し手段が、音源信号内の正および
負のピーク値と、相関値を最大にする位置近傍の正およ
び負のピーク値を探索して、各ピーク値と前フレームの
選択ピーク値の符号に基づいて、各ピーク値の中の１つ
を選択して、このピーク位置に基づいて切り出しを行う
ようにしたので、相関値を最大にする位置近傍のピー
ク、前フレームと同符号のピークを選択し易く調節する
ことができ、最終的に切り出される代表音源の位相の連
続性が更に改善される効果がある。

【００９３】請求項５記載の発明は、過去の代表音源符
号と符号化歪を格納しておいて、この過去の符号化歪と
代表音源を符号化したときの符号化歪に基づいて、代表
音源符号と過去の代表音源符号と所定の固定音源符号の
いずれかを選択するようにしたので、代表音源の符号化
ビット数が少なく符号化歪が特に大きいフレームにおい
て、過去の代表音源符号や固定音源符号に置き換えるこ
とが可能となり、この音声符号化装置の符号化結果を用
いて復号音声信号を作成した場合、連続性の悪い音源信
号による異音の発生が少ない復号音声が得られる効果が
ある。

【００９４】請求項６記載の発明は、現フレームの音源
信号をいくつかのカテゴリに分類し、カテゴリ毎に用意
した音源符号帳を用いて符号化を行うようにしたので、
代表音源の符号化特性が改善し、この音声符号化装置の
符号化結果を用いて復号音声信号を作成した場合、復号
音声品質が向上する効果がある。

【００９５】請求項７記載の発明は、代表音源、スペク
トル形状情報、パワー情報などの各パラメータ、もしく
は各パラメータを前後のフレームの値と補間したものを
用いて、現フレーム内のピッチ周期毎の位置での音源振
幅を算出して、これを代表音源、もしくはこれを補間し
た補間音源に乗じてピッチ周期間隔に並べ立てて有声音
復号音源信号を生成するようにしたので、フレーム間の
代表音源の間に比較的大きな差異がある場合でも、フレ
ーム境界近傍に振幅の不連続の少ない復号音声信号が生
成できる効果がある。

【００９６】請求項８記載の発明は、代表音源、スペク
トル形状情報、パワー情報などの各パラメータ、もしく
は各パラメータを前後のフレームの値と補間したものを
用いて、現フレームの始端と終端の位置での音源振幅を
求め、これをピッチ周期毎の位置で補間したものを代表
音源、もしくはこれを補間した補間音源に乗じて順に並
べ立てて有声音復号音源信号を生成するようにしたの
で、請求項７の発明のものに比べて少ない処理量で、同
様にフレーム境界近傍に振幅の不連続の少ない復号音声
信号が生成できる効果がある。

【００９７】請求項９、１０記載の発明は、音源シフト
値が０でない場合に、代表音源を音源シフト値に基づい
てシフトさせたシフト音源を生成し、これと後続の代表
音源に対する各音源振幅を算出して、シフト音源にその
音源振幅を乗じたものと、後続の各代表音源にその音源
振幅を乗じたものを順に並べ立てて有声音復号音源信号
を生成するようにしたので、請求項２の音声符号化装置
が出力した符号化結果をこの発明の音声復号化装置で復
号化する事により、音源の位相の連続性が改善され、良
好な復号音声信号が得られる効果がある。

【図面の簡単な説明】

【図１】この発明の実施例１の全体構成を示す構成図で
ある。

【図２】この発明の実施例１における代表音源抽出手段
１１の詳細構成を示す構成図である。

【図３】この発明の実施例２の全体構成を示す構成図で
ある。

【図４】この発明の実施例３における代表音源抽出手段
１１の詳細構成を示す構成図である。

【図５】この発明の実施例５における有声音源符号化手
段１０の詳細構成を示す構成図である。

【図６】この発明の実施例５における音源シフト値算出
手段３１の動作を説明する説明図である。

【図７】この発明の実施例６における有声音源符号化手
段１１の詳細構成を示す構成図である。

【図８】この発明の実施例８における第一の切り出し手
段２５の詳細構成を示す構成図である。

【図９】この発明の実施例８における第一の切り出し手
段２５の動作を説明する説明図である。

【図１０】この発明の実施例９における代表音源の符号
化部分の詳細構成を示す構成図である。

【図１１】この発明の実施例９における代表音源の符号
化動作を示す図である。

【図１２】この発明の実施例１２における有声音源符号
化手段１０の詳細構成を示す構成図である。

【図１３】この発明の実施例１６の全体構成を示す構成
図である。

【図１４】この発明の実施例１６における有声音源生成
手段１０７の動作を説明する説明図である。

【図１５】この発明の実施例１８における有声音源生成
手段１０７の詳細構成を示す構成図である。

【図１６】この発明の実施例１９における有声音源生成
手段１０７の詳細構成を示す構成図である。

【図１７】この発明の実施例１９における有声音源生成
手段１０７の動作を説明する説明図である。

【図１８】従来の音声符号化装置の構成を示す構成図で
ある。

【図１９】従来の音声復号化装置の構成を示す構成図で
ある。

【図２０】従来の音声符号化装置における代表音源切り
出し手段２０３動作を説明する説明図である。

【符号の説明】

１音声信号２スペクトル分析手段３パワー情報算出手段４有声無声判定手段５ピッチ周期抽出手段６スペクトル形状情報符号化手段７パワー情報符号化手段８有声無声情報符号化手段９ピッチ周期符号化手段１０有声音源符号化手段１１代表音源抽出手段１２代表音源符号化手段１３スペクトル形状情報１４音源信号１５パワー情報１６ピッチ周期１７有声無声情報１８代表音源１９パワー情報符号２０スペクトル形状符号２１代表音源符号２２ピッチ周期符号２３有声無声符号２４ピーク性検定手段２５第一の切り出し手段２６第二の切り出し手段２７選択手段２８第一の切り出し音源２９第二の切り出し音源３０ピーク位置３１音源シフト値算出手段３２音源シフト値符号化手段３３音源シフト値３４音源シフト値符号３５シフト値比較手段３６モード制御手段３７比較結果３８モード信号３９第一のピーク探索手段４０第二のピーク探索手段４１第一のピーク選択手段４２第二のピーク選択手段４３ピーク位置基準切り出し手段４４ピーク値とピーク位置４５ピーク値とピーク位置４６選択ピーク値と選択ピーク位置４７選択ピーク値と選択ピーク位置４８音源符号選択手段４９音源更新手段５０音源記憶手段５１代表音源符号化結果５２過去の代表音源符号化結果５３代表音源符号化結果５４代表音源符号化結果５５音源分類手段５６カテゴリ毎の音源符号帳５７カテゴリ番号５８切り換えスイッチ５９音源符号語１０１スペクトル形状情報復号化手段１０２パワー情報復号化手段１０３代表音源復号化手段１０４ピッチ周期復号化手段１０５有声無声情報復号化手段１０６スペクトル形状情報補間手段１０７有声音源生成手段１０８パワー情報補間手段１０９代表音源補間手段１１０振幅算出手段１１１音源連接手段１１２無声音源生成手段１１３音源切り換え手段１１４合成手段１１５復号音声信号１１６スペクトル形状情報１１７パワー情報１１８代表音源１１９ピッチ周期１２０有声無声情報１２１補間スペクトル形状情報１２２補間パワー情報１２３補間音源１２４ピッチ周期毎の振幅情報１２５有声音復号音源信号１２６無声音復号音源信号１２７復号音源信号１２８第一の振幅算出手段１２９第二の振幅算出手段１３０振幅補間手段１３１第一の補間パワー情報１３２第二の補間パワー情報１３３第一の補間音源１３４第二の補間音源１３５第一の補間スペクトル情報１３６第二の補間スペクトル情報１３７第一の音源振幅１３８第二の音源振幅１３９音源シフト値復号化手段１４０シフト音源生成手段１４１シフト音源振幅算出手段１４２音源シフト値１４３シフト音源１４４シフト音源振幅２０１スペクトル包絡分析手段２０２有声音源符号化手段２０３代表音源切り出し手段２０４スペクトル包絡情報符号化手段２０５スペクトル包絡情報２０６音源信号２０７代表音源２０８スペクトル包絡符号２０９代表音源符号３０１スペクトル包絡情報復号化手段３０２フレーム長音源生成手段３０３スペクトル包絡情報３０４代表音源３０５有声音復号音源信号３０６復号音源信号３０７復号音声信号

Claims

【特許請求の範囲】

【請求項１】音声信号を所定の長さのフレーム毎に分
析して、スペクトル形状情報と音源信号に分離し、音声
信号が有声音である場合に、ピッチ周期を求め、フレー
ム内の音源信号から１ピッチ周期長の代表音源を抽出し
て、この代表音源と、ピッチ周期、スペクトル形状情報
を含む複数のパラメータを符号化する音声符号化装置に
おいて、前記音源信号内のピーク値を探索し、得られたピーク位
置を基準として第一の切り出し音源を抽出する第一の切
り出し手段と、１フレーム前が有声音であった場合に、少なくとも、前
フレームの代表音源との相関値を最大にする現フレーム
内の音源信号の位置、および、前フレームの代表音源を
切り出した位置の音声信号との相関値を最大にする現フ
レーム内の音声信号の位置のいずれかを算出して、この
位置を基準として第二の切り出し音源を抽出するととも
に、その相関値を出力する第二の切り出し手段と、少なくとも、音源信号を分析して得られる所定の特徴パ
ラメータと前記相関値との一方を用いて、第一の切り出
し音源と第二の切り出し音源の何れかを選択して代表音
源とする選択手段を備えたことを特徴とする音声符号化
装置。
【請求項２】音声信号を所定の長さのフレーム毎に分
析して、スペクトル形状情報と音源信号に分離し、音声
信号が有声音である場合に、ピッチ周期を求め、フレー
ム内の音源信号から１ピッチ周期長の代表音源を抽出し
て、この代表音源と、ピッチ周期、スペクトル形状情報
を含む複数のパラメータを符号化する音声符号化装置に
おいて、１フレーム前が有声音であった場合に、少なくとも、前
フレームの代表音源との相関値を最大にする現フレーム
内の音源信号の位置、および、前フレームの代表音源を
切り出した位置の音声信号との相関値を最大にする現フ
レーム内の音声信号の位置のいずれかを算出して、この
位置を基準として切り出し音源を抽出するとともに、そ
の相関値を出力する切り出し手段と、前フレーム代表音源と、前記切り出し手段が出力した切
り出し音源の位置のズレを求め、これをそのまま、もし
くはピッチ周期で割った余りを算出して音源シフト値と
して出力する音源シフト値算出手段と、これを符号化する音源シフト値符号化手段を備えること
を特徴とする音声符号化装置。
【請求項３】前記音源シフト値算出手段が出力した音
源シフト値のピッチ周期に対する比率を算出して、この
比率を所定の値と比較するシフト値比較手段と、前記シフト値比較手段が前記比率が所定の値以上と判定
した場合に前記音源シフト値符号化手段を動作させ、所
定の値未満と判定した場合には前記音源シフト値符号化
手段を動作させないというモード制御を行うモード制御
手段を備えるようにした請求項２記載の音声符号化装
置。
【請求項４】前記第一の切り出し手段は、現フレームの音源信号内の正および負のピーク値を探索
して、各ピーク値とそのピーク位置を出力する第一のピ
ーク探索手段と、前フレームが有声音であった場合に、第二の切り出し手
段が出力した第二の切り出し音源の所定区間内の正およ
び負のピーク値を探索し、各ピーク値とそのピーク位置
を出力する第二のピーク探索手段と、前フレームが有声音でなかった場合に、第一のピーク探
索手段が出力したピーク値の中で絶対値が最大のものを
選択して、そのピーク値とピーク位置を選択ピーク値お
よび選択ピーク位置として出力する第一のピーク選択手
段と、前フレームが有声音であった場合に、前フレームの選択
ピーク値が正であるか負であるかと、第一のピーク探索
手段と第二のピーク探索手段が出力した各ピーク値に基
づいて、この各ピーク値の中からピーク値を１つを選択
して、このピーク値とピーク位置を選択ピーク値および
選択ピーク位置として出力する第二のピーク選択手段
と、前記選択ピーク位置に基づいて第一の切り出し音源を抽
出するピーク位置基準切り出し手段を含む請求項１記載
の音声符号化装置。
【請求項５】音声信号を所定の長さのフレーム毎に分
析して、スペクトル形状情報と音源信号に分離し、音声
信号が有声音である場合に、ピッチ周期を求め、フレー
ム内の音源信号から１ピッチ周期長の代表音源を抽出し
て、この代表音源と、ピッチ周期、スペクトル形状情報
を含む複数のパラメータを符号化する音声符号化装置に
おいて、代表音源を符号化して、得られた代表音源符号と符号化
時の歪を出力する代表音源符号化手段と、過去の代表音源符号とその符号化時の歪を格納しておく
音源記憶手段と、前記代表音源符号化手段が出力した歪と前記音源記憶手
段に格納されている歪に基づいて、前記代表音源符号化
手段が出力した代表音源符号と前記音源記憶手段内に格
納されている過去の代表音源符号と所定の固定音源符号
のいずれかを選択して音源符号として出力する音源符号
選択手段と、この音源符号選択手段が前記代表音源符号化手段が出力
した代表音源符号を選択した場合に、その代表音源符号
と符号化時の歪を音源記憶手段に格納する音源更新手段
を備えることを特徴とする音声符号化装置。
【請求項６】音声信号を所定の長さのフレーム毎に分
析して、スペクトル形状情報と音源信号に分離し、音声
信号が有声音である場合に、ピッチ周期を求め、フレー
ム内の音源信号から１ピッチ周期長の代表音源を抽出し
て、この代表音源と、ピッチ周期、スペクトル形状情報
を含む複数のパラメータを符号化する音声符号化装置に
おいて、現フレームの音源信号をいくつかのカテゴリに分類する
音源分類手段と、各カテゴリの音源信号毎に抽出した典型的な代表音源に
対して、カテゴリ毎に設定した音源符号語を持つカテゴ
リ毎の音源符号帳と、前記音源分類手段が判定したカテゴリに対応した前記音
源符号帳を用いて符号化を行う代表音源符号化手段を備
えることを特徴とする音声符号化装置。
【請求項７】フレーム毎に符号化された代表音源、ス
ペクトル形状情報、ピッチ周期、有声無声情報、パワー
情報を各々復号化し、復号された各パラメータを用いて
復号音声を生成する音声復号化装置において、復号された現フレームの有声無声情報が有声である場合
に、復号された現フレームの各パラメータ、もしくは前
後のフレームの各パラメータを併せて用いて、現フレー
ム内のピッチ周期毎の位置での音源振幅を算出する振幅
算出手段と、この振幅算出手段が出力した音源振幅を代表音源に、も
しくはこの代表音源と前後のフレームの代表音源を現フ
レーム内のピッチ周期毎の位置で補間した補間音源に乗
じてピッチ周期間隔に並べ立て、これを復号音源信号と
して出力する音源連接手段と、前記復号音源信号とスペクトル形状情報、もしくは前記
スペクトル形状情報と前後のフレームのスペクトル形状
情報を補間した補間スペクトル形状情報を用いて復号音
声信号を生成する合成手段を備えることを特徴とする音
声復号化装置。
【請求項８】フレーム毎に符号化された代表音源、ス
ペクトル形状情報、ピッチ周期、有声無声情報、パワー
情報を各々復号化し、復号された各パラメータを用いて
復号音声を生成する音声復号化装置において、復号された現フレームの有声無声情報が有声である場合
に、復号された各パラメータ、もしくは前フレームの各
パラメータを併せて用いて、現フレームの始端の位置で
の音源振幅を算出し、第一の音源振幅として出力する第
一の振幅算出手段と、復号された現フレームの有声無声情報が有声である場合
に、復号された各パラメータ、もしくは次フレームの各
パラメータを併せて用いて、現フレームの終端の位置で
の音源振幅を算出し、第二の音源振幅として出力する第
二の振幅算出手段と、前記第一の音源振幅と第二の音源振幅を現フレーム内の
ピッチ周期毎の位置で補間して補間振幅として出力する
振幅補間手段と、代表音源、もしくは前記代表音源と前後のフレームの代
表音源を現フレーム内のピッチ周期毎の位置で補間した
補間音源に前記補間振幅を乗じてピッチ周期間隔に並べ
立て、これを復号音源信号として出力する音源連接手段
と、前記復号音源信号とスペクトル形状情報、もしくは前記
スペクトル形状情報と前後のフレームのスペクトル形状
情報を補間した補間スペクトル形状情報を用いて復号音
声信号を生成する合成手段を備えることを特徴とする音
声復号化装置。
【請求項９】符号化された代表音源を復号化する代表
音源復号化手段と、符号化されたスペクトル形状情報を復号化するスペクト
ル形状情報復号化手段と、符号化された音源シフト値を復号化する音源シフト値復
号化手段と、その音源シフト値が０でない場合に前記代表音源復号化
手段が出力した代表音源をその音源シフト値に基づいて
シフトさせたシフト音源を生成するシフト音源生成手段
と、シフト音源生成手段が出した前記シフト音源と前記代表
音源復号化手段が出力した代表音源を並べ立て、これを
復号音源信号として出力する音源連接手段と、前記復号音源信号と復号されたスペクトル形状情報を用
いて復号音声信号を生成する合成手段を備えることを特
徴とする音声復号化装置。
【請求項１０】前記音声復号化装置は、前記シフト音
源に対する音源振幅を算出するシフト音源振幅算出手段
と、前記代表音源復号化手段が出力した代表音源に対する音
源振幅を算出する振幅算出手段とを有し、音源連接手段は、前記シフト音源に前記シフト音源振幅
算出手段が出力したシフト音源に対する音源振幅を乗じ
たものを始めに並べ、続くピッチ周期毎の一に前記代表
音源復号化手段が出力した代表音源に前記振幅算出手段
が出力した音源振幅を乗じたものを並べ立て、これを復
号音源信号として出力することを特徴とする請求項９記
載の音声復号化装置。