JP3047761B2

JP3047761B2 - 音声符号化装置

Info

Publication number: JP3047761B2
Application number: JP7013072A
Authority: JP
Inventors: 真一田海; 一範小澤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1995-01-30
Filing date: 1995-01-30
Publication date: 2000-06-05
Anticipated expiration: 2015-06-05
Also published as: CA2167552C; CA2167552A1; JPH08202398A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、音声信号を低遅延、特
に５ｍｓ−１０ｍｓ以下の短いフレーム単位で高品質に
符号化するための音声符号化装置に関するものである。

【０００２】

【従来の技術】音声信号を符号化する方式としては、例
えば、Ｋ．Ｏｚａｗａ氏らによる“Ｍ−ＬＣＥＬＰＳ
ｐｅｅｃｈＣｏｄｉｎｇａｔ４ｋｂ／ｓｗｉｔ
ｈＭｕｌｔｉ−ＭｏｄｅａｎｄＭｕｌｔｉ−Ｃｏ
ｄｅｂｏｏｋ”（ＩＥＩＣＥＴｒａｎｓ．Ｃｏｍｍｕ
ｎ．ｖｏｌ．Ｅ７７−Ｂ，Ｎｏ．９，ｐｐ．１１１４−
１１２１，１９９４年）と題した論文（文献１）などが
知られている。この従来例では、送信側では、フレーム
毎（例えば４０ｍｓ）に音声信号から線形予測（ＬＰ
Ｃ）分析を用いて、音声信号のスペクトル特性を表すス
ペクトルパラメータを抽出し、前記フレーム単位の信号
または前記フレーム単位の信号に聴感重み付けを行なっ
た信号から得た特徴量を計算し、特徴量を用いてモード
判別（例えば、母音部と子音部）を行ない、モード判別
結果に応じてアルゴリズムあるいはコードブックを切り
かえて符号化を行なう。符号化部では、フレームをさら
にサブフレーム（例えば８ｍｓ）に分割し、サブフレー
ム毎に過去の音源信号を基に適応コードブックにおける
パラメータ（ピッチ周期に対応する遅延パラメータとゲ
インパラメータ）を抽出し適応コードブックにより前記
サブフレームの音声信号をピッチ予測し、ピッチ予測し
て求めた残差信号に対して、予め定められた種類の雑音
信号からなる音源コードブック（ベクトル量子化コード
ブック）から最適音源コードベクトルを選択し最適なゲ
インを計算することにより、音源信号を量子化する。音
源コードベクトルの選択の仕方は、選択した雑音信号に
より合成した信号と、前記残差信号との誤差電力を最小
化するように行なう。そして、選択されたコードベクト
ルの種類を表すインデクスとゲインならびに、前記スペ
クトルパラメータと適応コードブックのパラメータをマ
ルチプレクサ部により組み合わせて伝送する。受信側の
説明は省略する。

【０００３】

【発明が解決しようとする課題】前記従来法では、処理
遅延を低減するために、フレーム長を例えば５ｍｓ以下
に低減した場合、モード情報あるいはピッチ抽出、レベ
ル抽出をフレーム単位で求めると、これらの値の時間的
変動が大きいために、不安定で過ったモード切り替え、
あるいは不安定で過ったピッチ抽出、不安定で過ったレ
ベル抽出が生じ、音質劣化が起こるという問題点があっ
た。本発明は、上述の問題を解決し、正しいモード判
別、あるいは正しいピッチ抽出、正しいレベル抽出を提
供し、これらの誤りによる音質劣化を抑制することを目
的とする。

【０００４】

【課題を解決するための手段】第１の発明によれば、音
声信号を予め定めたフレーム単位に区切るフレーム分割
部と、前記音声信号から特徴量を計算しモード判別を行
なうモード判別部と、前記判別結果におうじて前記音声
信号を符号化する音声符号化装置において、現フレーム
及び過去の少なくとも一つのフレームからそれぞれ求め
た少なくとも１種類以上の特徴量と過去の少なくとも一
つのフレームから求めたモード判別情報を用いて、現フ
レームのモード判別をする機能を有することを特徴とす
る音声符号化装置が得られる。

【０００５】また第２の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
１種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、少なくとも１種類以上の特
徴量の時間変化比を特徴量として含めた音声符号化装置
が得られる。

【０００６】また第３の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
１種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、現フレーム又は過去の少な
くとも一つ以上のフレームのいずれかの２フレーム分の
それぞれの特徴量に対し、前記二つの特徴量の比を特徴
量として含めた音声符号化装置が得られる。

【０００７】また第４の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
１種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、ピッチ予測ゲイン、短期予
測ゲイン、レベル、ピッチの少なくとも一種以上を特徴
量として含めることを特徴とする音声符号化装置が得ら
れる。

【０００８】また第４の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
１種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、少なくとも１種類以上の特
徴量の時間変化比を特徴量として含めた音声符号化装置
で、前記特徴量として、ピッチ予測ゲイン、短期予測ゲ
イン、レベル、ピッチの少なくとも一種以上を特徴量と
して含めることを特徴とする音声符号化装置が得られ
る。

【０００９】また第４の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
１種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、現フレームまたは過去の少
なくとも一つ以上のフレームのいずれかの２フレーム分
のそれぞれの特徴量に対し、前記二つの特徴量の比を特
徴量として含めた音声符号化装置で、前記特徴量とし
て、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピッ
チの少なくとも一種以上を特徴量として含めることを特
徴とする音声符号化装置が得られる。

【００１０】また第５の発明（請求項１に係る発明）に
よれば、音声信号を予め定めたフレーム単位に区切るフ
レーム分割部と、前記音声信号から特徴量を計算しモー
ド判別を行なうモード判別部と、前記音声信号からピッ
チを抽出するピッチ抽出部と、前記ピッチ抽出部の出力
を用いて前記音声信号を符号化する際に、前記判別結果
におうじて前記音声信号の符号化方法を切り替える符号
化部を有する音声符号化装置において、現フレーム及び
過去の少なくとも一つのフレームからそれぞれ求めた少
なくとも１種類以上の特徴量と過去の少なくとも一つの
フレームから求めたモード判別情報を用いて、現フレー
ムのピッチを補正するピッチ抽出部を有することを特徴
とする音声符号化装置が得られる。

【００１１】また第６の発明（請求項２に係る発明）に
よれば、前記特徴量として、少なくとも１種類以上の特
徴量の時間変化比を特徴量として含めた音声符号化装置
が得られる。

【００１２】また第７の発明（請求項３に係る発明）に
よれば、前記特徴量として、現フレーム又は過去の少な
くとも一つ以上のフレームのいずれかの２フレーム分の
それぞれの特徴量に対し、前記二つの特徴量の比を特徴
量として含めた音声符号化装置が得られる。

【００１３】また第８の発明（請求項４に係る発明）に
よれば、前記特徴量として、ピッチ予測ゲイン、短期予
測ゲイン、レベル、ピッチの少なくとも一種以上を特徴
量として含めることを特徴とする音声符号化装置が得ら
れる。

【００１４】また第８の発明（請求項４に係る発明）に
よれば、前記特徴量として、少なくとも１種類以上の特
徴量の時間変化比を特徴量として含めた音声符号化装置
で、前記特徴量として、ピッチ予測ゲイン、短期予測ゲ
イン、レベル、ピッチの少なくとも一種以上を特徴量と
して含めることを特徴とする音声符号化装置が得られ
る。

【００１５】また第８の発明（請求項４に係る発明）に
よれば、前記特徴量として、現フレーム又は過去の少な
くとも一つ以上のフレームのいずれかの２フレーム分の
それぞれの特徴量に対し、前記二つの特徴量の比を特徴
量として含めた音声符号化装置で、前記特徴量として、
ピッチ予測ゲイン、短期予測ゲイン、レベル、ピッチの
少なくとも一種以上を特徴量として含めることを特徴と
する音声符号化装置が得られる。

【００１６】また第９の発明（請求項５に係る発明）に
よれば、音声信号を予め定めたフレーム単位に区切るフ
レーム分割部と、前記音声信号から特徴量を計算しモー
ド判別を行なうモード判別部と、前記音声信号からレベ
ルを抽出するレベル抽出部と、前記レベル抽出部の出力
を用いて前記音声信号を符号化する際に、前記判別結果
におうじて前記音声信号の符号化方法を切り替える符号
化部を有する音声符号化装置において、現フレーム及び
過去の少なくとも一つのフレームからそれぞれ求めた少
なくとも１種類以上の特徴量と過去の少なくとも一つの
フレームから求めたモード判別情報を用いて、現フレー
ムのレベルを補正するレベル抽出部を有することを特徴
とする音声符号化装置が得られる。

【００１７】また第１０の発明（請求項６に係る発明）
によれば、前記特徴量として、少なくとも１種類以上の
特徴量の時間変化比を特徴量として含めた音声符号化装
置が得られる。

【００１８】また第１１の発明（請求項７に係る発明）
によれば、前記特徴量として、現フレーム又は過去の少
なくとも一つ以上のフレームのいずれかの２フレーム分
のそれぞれの特徴量に対し、前記二つの特徴量の比を特
徴量として含めた音声符号化装置が得られる。

【００１９】また第１２の発明（請求項８に係る発明）
によれば、前記特徴量として、ピッチ予測ゲイン、短期
予測ゲイン、レベル、ピッチの少なくとも一種以上を特
徴量として含めることを特徴とする音声符号化装置が得
られる。

【００２０】また第１２の発明（請求項８に係る発明）
によれば、前記特徴量として、少なくとも１種類以上の
特徴量の時間変化比を特徴量として含めた音声符号化装
置で、前記特徴量として、ピッチ予測ゲイン、短期予測
ゲイン、レベル、ピッチの少なくとも一種以上を特徴量
として含めることを特徴とする音声符号化装置が得られ
る。

【００２１】また第１２の発明（請求項８に係る発明）
によれば、前記特徴量として、現フレーム又は過去の少
なくとも一つ以上のフレームのいずれかの２フレーム分
のそれぞれの特徴量に対し、前記二つの特徴量の比を特
徴量として含めた音声符号化装置で、前記特徴量とし
て、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピッ
チの少なくとも一種以上を特徴量として含めることを特
徴とする音声符号化装置が得られる。

【００２２】

【作用】前記構成により、現フレームの前後では正しい
モード情報あるいは正しいピッチ抽出、正しいレベル抽
出を示しているが、現フレームのみでこれらの値が過っ
た場合、過去の正しいモード情報あるいは正しいピッチ
抽出、正しいレベル抽出を示すフレームからの情報を現
フレームに適応することにより、現フレームのモード情
報あるいはピッチ抽出、レベル抽出を長い時間長にわた
る情報を用いて補正することができる。従って、音声符
号化処理に正しいモード情報あるいは正しいピッチ、正
しいレベル抽出を提供し、これらの誤りに起因する音質
劣化を抑制できる。

【００２３】

【実施例】第４の発明の“前記特徴量として、ピッチ予
測ゲイン、短期予測ゲイン、レベル、ピッチの少なくと
も一種以上を特徴量として含めることを特徴とする第１
の発明の音声符号化装置”に関わる実施例を図１に示
す。

【００２４】図において、入力端子１００から音声信号
を入力し、フレーム分割回路１１０では音声信号をフレ
ーム（例えば５ｍｓ）毎に分割し、サブフレーム分割回
路１２０では、フレームの音声信号をフレームよりも短
いサブフレーム（例えば２．５ｍｓ）に分割する。

【００２５】スペクトルパラメータ計算回路２００で
は、少なくとも一つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓（例えば２４ｍｓ）を
かけて音声を切り出してスペクトルパラメータをあらか
じめ定められた次数（例えばＰ＝１０次）計算する。こ
こでスペクトルパラメータの計算には、周知のＬＰＣ分
析や、Ｂｕｒｇ分析等を用いることができる。ここで
は、Ｂｅｒｇ分析を用いることとする。Ｂｕｒｇ分析の
詳細については、中溝著による“信号解析とシステム同
定”と題した単行本（コロナ社１９８８年刊）の８２〜
８７頁（文献２）等に記載されているので説明は略す
る。さらにスペクトルパラメータ計算部では、Ｂｕｒｇ
法により計算された線形予測係数α_i（ｉ＝１，…，１
０）を量子化や補間に適したＬＳＰパラメータに変換す
る。ここで、線形予測係数からＬＳＰへの変換は、菅村
他による“線スペクトル対（ＬＳＰ）音声分析合成方法
による音声情報圧縮”と題した論文（電子通信学会論文
誌、Ｊ６４−Ａ、ｐｐ．５９９−６０６、１９８１年）
（文献３）を参照することができる。つまり、第２サブ
フレームでＢｕｒｇ法により求めた線形予測係数を、Ｌ
ＳＰパラメータに変換し、第１サブフレームのＬＳＰを
直線補間により求めて、第１サブフレームのＬＳＰを逆
変換して線形予測係数に戻し、第１、２サブフレームの
線形予測係数α_il（ｉ＝１，…，１０，ｌ＝１，…，
５）を聴感重み付け回路２３０に出力する。また、第
１、２サブフレームのＬＳＰをスペクトルパラメータ量
子化回路２１０へ出力する。

【００２６】スペクトルパラメータ量子化回路２１０で
は、あらかじめ定められたサブフレームのＬＳＰパラメ
ータを効率的に電子化する。以下では、量子化法とし
て、ベクトル量子化を用いるものとし、第２サブフレー
ムのＬＳＰパラメータを量子化するものとする。ＬＳＰ
パラメータのベクトル量子化の手法は周知の手法を用い
ることができる。具体的な方法は例えば、特開平４−１
７１５００号公報（特願平２−２９７６００号）（文献
４）や特開平４−３６３０００号公報（特願平３−２６
１９２５号）（文献５）や、特開平５−６１９９号公報
（特願平３−１５５０４９号）（文献６）や、Ｔ．Ｎｏ
ｍｕｒａｅｔａｌ．，による“ＬＳＰＣｏｄｉｎｇ
ＵｓｉｎｇＶＱ−ＳＶＱＷｉｔｈＩｎｔｅｒｐ
ｏｌａｔｉｏｎｉｎ４．０７５ｋｂｐｓＭ−Ｌ
ＣＥＬＰＳｐｅｅｃｈＣｏｄｅｒ”と題した論文
（Ｐｒｏｃ．ＭｏｂｉｌｅＭｕｌｔｉｍｅｄｉａＣ
ｏｍｍｕｎｉｃａｔｉｏｎｓ，ｐｐ．Ｂ．２．５，１９
９３）（文献７）等を参照できるのでここでは説明は略
する。また、スペクトルパラメータ量子化回路２１０で
は、第２サブフレームで量子化したＬＳＰパラメータを
もとに、第１，２サブフレームのＬＳＰパラメータを復
元する。ここでは、現フレームの第２サブフレームの量
子化ＬＳＰパラメータと１つ過去のフレームの第２サブ
フレームの量子化ＬＳＰを直線補間して、第１，２サブ
フレームのＬＳＰを復元する。ここで、量子化前のＬＳ
Ｐと量子化後のＬＳＰとの誤差電力を最小化するコード
ベクトルを１種類選択した後に、直線補間により第１〜
第４サブフレームのＬＳＰを復元できる。さらに性能を
向上させるためには、前記誤差電力を最小化するコード
ベクトルを複数候補選択したのちに、各々の候補につい
て、累積歪を評価し、累積歪を最小化する候補と補間Ｌ
ＳＰの組を選択するようにすることができる。

【００２７】以上により復元した第１，２サブフレーム
のＬＳＰと第２サブフレームの量子化ＬＳＰをサブフレ
ーム毎に線形予測係数α′_il（ｉ＝１，…，１０，ｌ＝
１，…，５）に変換し、インパルス応答計算回路３１０
へ出力する。また、第２サブフレームの量子化ＬＳＰの
コードベクトルを表すインパルスをマルチプレクサ４０
０に出力する。

【００２８】上記において、直線補間のかわりに、ＬＳ
Ｐの補間パターンをあらかじめ定められたビット数（例
えば２ビット）分用意しておき、これらのパターンの各
々に対して１，２サブフレームのＬＳＰを復元して累積
歪を最小化するコードベクトルと補間パターンの組を選
択するようにしてもよい。このようにすると補間パター
ンのビット数だけ伝送情報が増加するが、ＬＳＰのフレ
ーム内での時間的な変化をより精密に表すことができ
る。ここで、補間パターンは、トレーニング用のＬＳＰ
データを用いてあらかじめ学習して作成してもよいし、
あらかじめ定められたパターンを格納しておいてもよ
い。あらかじめ定められたパターンとしては、例えば、
Ｔ．Ｔａｎｉｇｕｃｈｉｅｔａｌ．による“Ｉｍｐ
ｒｏｖｅｄＣＥＬＰｓｐｅｅｃｈｃｏｄｉｎｇａ
ｔ４ｋｂ／ｓａｎｄｂｅｌｏｗ”と題した論文
（Ｐｒｏｃ．ＩＣＳＬＰ，ｐｐ．４１−４４，１９９
２）（文献８）等に記載のパターンを用いることができ
る。また、さらに性能を改善するためには、補間パター
ンを選択した後に、あらかじめ定められたサブフレーム
において、ＬＳＰの真の値とＬＳＰの補間値との誤差信
号を求め、前記誤差信号をさらに誤差コードブックで表
すようにしてもよい。

【００２９】聴感重み付け回路２３０は、スペクトルパ
ラメータ計算回路２００から、各サブフレーム毎に量子
化前の線形予測係数α_il（ｉ＝１，…，１０，ｌ＝１，
…，５）を入力し、前記文献１にもとづき、サブフレー
ムの音声信号に対して聴感重み付けを行ない、聴感重み
付け信号を出力する。

【００３０】提案型モード判別回路２０００は、聴感重
み付け回路２３０からフレーム単位で聴感重み付け信号
を受け取り、スペクトルパラメータ計算回路２００から
スペクトルパラメータを受け取り、モード判別情報を出
力する。提案型モード判別回路の構成を図２に示す。

【００３１】図２において、入力端子２０１０からフレ
ーム単位に、聴感重み付け信号を入力し、入力端子２０
２０からスペクトルパラメータを入力する。特徴量計算
回路Ａ２０３０では特徴量として、例えばピッチ予測ゲ
インＰＧを計算し出力する。特徴量計算回路Ｂ３０４０
では特徴量として、例えば短期予測ゲインＳＧを計算し
出力する。

【００３２】モード判別回路２０５０では、遅延器２０
６０に格納されている過去の一つ前のフレームのモード
情報に応じて、２０３０の出力値ＰＧと、２０４０の出
力値ＳＧを、あらかじめ定められた複数個のしきいと比
較して、モード判別を行ない、モード情報を出力する。
モード判別回路２０５０は、モード判別結果を適応コー
ドブック回路５００、音源量子化回路３５０へ出力す
る。

【００３３】図１にもどり、応答信号計算回路２４０
は、スペクトルパラメータ計算回路２００から、各サブ
フレーム毎に線形予測係数α_ilを入力し、スペクトルパ
ラメータ量子化回路２１０から、量子化、補間して復元
した線形予測係数α′_ilをサブフレーム毎に入力し、保
存されているフィルタメモリの値を用いて、入力信号ｄ
（ｎ）＝０とした応答信号を１サブフレーム分計算し、
減算器２３５へ出力する。ここで、応答信号ｘ_z（ｎ）
は下式（１）で表される。

【００３４】

【数１】

【００３５】ここで、γは、聴感重み付け量を制御する
重み係数であり、下記の（３）式と同一の値である。

【００３６】減算器２３５は、下式（２）により、聴感
重み付け信号から応答信号を１サブフレーム分減算し、
ｘ′_w（ｎ）を適応コードブック回路３００へ出力す
る。

【００３７】ｘ′_w（ｎ）＝ｘ_w（ｎ）−ｘ_z（ｎ）（２）インパルス応答計算回路３１０は、ｚ変換が下式（３）
で表される重み付けフィルタのインパルス応答ｈ
_w（ｎ）をあらかじめ定められた点数Ｌだけ計算し、適
応コードブック回路３００、音源量子化回路３５０へ出
力する。

【００３８】

【数２】

【００３９】適応コードブック回路５００は、ピッチパ
ラメータを求める。詳細は前記文献２を参照することが
できる。また、適応コードブックによりピッチ予測を下
式（４）に従い行ない、適応コードブック予測算差信号
ｚ（ｎ）を出力する。

【００４０】ｘ（ｎ）＝ｘ′_w（ｎ）−ｂ（ｎ）（４）ここで、ｂ（ｎ）は、適応コードブックピッチ予測信号
であり、下式（５）で表せる。

【００４１】ｂ（ｎ）＝βｖ（ｎ−Ｔ）＊ｈ_w（ｎ）（５）ここで、β、Ｔは、それぞれ、適応コードブックのゲイ
ン、遅延を示す。ｖ（ｎ）は適応コードベクトルであ
る。記号＊は畳み込み演算を示す。

【００４２】不均一パルス数型スパース音源コードブッ
ク３５１は、各々のベクトルの０でない成分の個数が異
なるスパースコードブックである。

【００４３】音源量子化回路３５０では、音源コードブ
ック３５１に格納された音源コードベクトルの全部ある
いは一部に対して、式（６）を最小化するように、最良
の音源コードベクトルｃ_j（ｎ）を選択する。このと
き、最良のコードベクトルを１種選択してもよいし、２
種以上のコードベクトルを選んでおいて、ゲイン量子化
の際に、１種に本選択してもよい。ここでは、２種以上
のコードベクトルを選んでおくものとする。

【００４４】Ｄ_j＝Σ_n（ｚ（ｎ）−γ_jｃ_j（ｎ）ｈ_w（ｎ））² （６）なお、一部の音源コードベクトルに対してのみ、式
（６）を適用するときは、複数個の音源コードベクトル
をあらかじめ予備選択しておき、予備選択された音源コ
ードベクトルに対して、式（６）を適用することもでき
る。

【００４５】ゲイン量子化回路３６５は、ゲインコード
ブック３５５からゲインコードベクトルを読みだし、選
択された音源コードベクトルに対して、式（７）を最小
化するように、音源コードベクトルとゲインコードベク
トルの組み合わせを選択する。

【００４６】Ｄ_j,k＝Σ_n（ｘ_w（ｎ）−β′_kｖ（ｎ−Ｔ）ｈ_w（ｎ）−γ′_kｃ_j（ｎ）ｈ_w（ｎ））² （７）ここで、β′_k、γ′_kは、ゲインコードブック３５５
に格納された２次元ゲインコードブックにおけるｋ番目
のコードベクトルである。選択された音源コードベクト
ルとゲインコードベクトルを表すインデクスをマルチプ
レクサ４００に出力する。

【００４７】重み付け信号計算回路３６０は、スペクト
ルパラメータ計算回路の出力パラメータ及び、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず下式（８）にもとづく
駆動音源信号ｖ（ｎ）を求める。

【００４８】ｖ（ｎ）＝β′_kｖ（ｎ−Ｔ）＋γ′_kｃ_j（ｎ）（８）次に、スペクトルパラメータ計算回路２００の出力パラ
メータ、スペクトルパラメータ量子化回路２１０の出力
パラメータを用いて下式（９）により、重み付け信号ｓ
_w（ｎ）をサブフレーム毎に計算し、応答信号計算回路
２４０へ出力する。

【００４９】

【数３】

【００５０】以上により、第４の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第１の発明の音声符号化装置”に関わる実施
例の説明を終える。

【００５１】第４の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする第
２の発明の音声符号化装置”に関わる実施例を図３に示
す。

【００５２】ここでの発明では、第４の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第１の発明の音声符号化装置”に関わ
る実施例である図１の提案型モード判別回路２０００と
本実施例の提案型モード判別回路の構成が異なるので、
本実施例の提案型モード判別回路の構成を図３を用いて
説明する。

【００５３】提案型モード判別回路は、提案型モード判
別回路２０００と同様に、聴感重み付け回路２３０から
フレーム単位で聴感重み付け信号とスペクトルパラメー
タ計算回路２００よりスペクトルパラメータを受け取
り、モード判別情報を出力する。提案型モード判別回路
の構成を図３に示す。

【００５４】図３において、入力端子３０１０からフレ
ーム単位に、聴感重み付け信号を入力し、入力端子３０
２０からスペクトルパラメータを入力する。

【００５５】特徴量計算回路Ａ３０３０では特徴量とし
て、例えばピッチ予測ゲインＰＧを計算し出力する。特
徴量計算回路Ｂ３０４０では特徴量として、例えばＲＭ
Ｓ比ＲＲを計算し出力する。特徴量計算回路Ｃ３０５０
では特徴量として、例えば短期予測ゲインＳＧと短期予
測ゲイン比ＳＧＲを計算し出力する。

【００５６】モード判別回路３０６０では、遅延器３０
７０に格納された過去の一つ前のフレームのモード情報
に応じて、３０３０の出力値ＰＧと、３０４０の出力値
ＲＲと、３０５０の出力値ＳＧとＳＧＲを、あらかじめ
定められた複数個のしきいと比較して、モード判別を行
ない、モード情報を出力する。モード判別回路３０６０
は、提案型モード判別回路２０００と同様に、モード判
別結果を適応コードブック回路５００、音源量子化回路
３５０へ出力する。

【００５７】特徴量計算回路Ｂ３０４０の構成を図４に
示す。図４において、入力端子４０１０からフレーム単
位に、聴感重み付け信号を入力し、ＲＭＳ計算回路４０
２０でＲＭＳ値Ｒを計算し、この値と遅延器４０３０に
格納された過去のＲＭＳ値とを用いてＲＭＳ計算回路４
０４０でＲＭＳ比ＲＲを計算し、これを出力端子４０５
０により出力する。ここで、ＲＭＳ比ＲＲはフレーム単
位に時間軸をとったときのＲＭＳの変化率である。

【００５８】特徴量計算回路Ｃ３０５０の構成を図５に
示す。図５において、入力端子５０１０からフレーム単
位に、聴感重み付け信号を入力し、入力端子５０２０か
らフレーム単位に、スペクトルパラメータを入力し、短
期予測ゲイン計算回路５０３０で短期予測ゲインＳＧを
計算し、この値を出力端子５０７０により出力する。ま
た、５０３０で計算された短期予測ゲインＳＧと遅延器
５０４０に格納された過去のフレームの短期予測ゲイン
とを用いて短期予測ゲイン比計算回路５０５０で短期予
測ゲイン比を計算し、これを出力端子５０６０により出
力する。

【００５９】以上により、第４の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第２の発明の音声符号化装置”に関わる実施
例の説明を終える。

【００６０】第４の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする第
３の発明の音声符号化装置”に関わる実施例を図９に示
す。

【００６１】ここでの発明では、第４の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第２の発明の音声符号化装置”に関わ
る実施例である図３の特徴量計算回路Ｃ３０５０と本実
施例の特徴量計算回路Ｃの構成が異なるので、本実施例
の特徴量計算回路Ｃの構成を図９を用いて説明する。

【００６２】図９において、入力端子８０１０からフレ
ーム単位に、聴感重み付け信号を入力し、入力端子８０
２０からフレーム単位に、スペクトルパラメータを入力
し、短期予測ゲイン計算回路８０３０で短期予測ゲイン
ＳＧを計算し、この値を出力端子８０７０により出力す
る。また、８０３０で計算された短期予測ゲインＳＧと
遅延器８０５０に格納された２つ前の過去のフレームの
短期予測ゲインとを用いて短期予測ゲイン比計算回路で
短期予測ゲイン比を計算し、これを出力端子８０６０に
より出力する。

【００６３】以上により、第４の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第３の発明の音声符号化装置”に関わる実施
例の説明を終える。

【００６４】第３の発明に関わる実施例を図１０に示
す。

【００６５】ここでの発明では、第４の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第２の発明の音声符号化装置”に関わ
る実施例である提案型モード判別回路と本実施例の提案
型モード判別回路の構成が異なるので、本実施例の提案
型モード判別回路の構成を図１０を用いて説明する。

【００６６】提案型モード判別回路は、聴感重み付け回
路２３０からフレーム単位で聴感重み付け信号とスペク
トルパラメータ計算回路２００よりスペクトルパラメー
タを受け取り、モード判別情報を出力する。提案型モー
ド判別回路の構成を図１０に示す。

【００６７】図１０において、入力端子９０１０からフ
レーム単位に、聴感重み付け信号を入力し、入力端子９
０２０からスペクトルパラメータを入力する。

【００６８】特徴量計算回路Ａ９０３０では特徴量とし
て、例えばピッチ予測ゲインＰＧを計算し出力する。特
徴量計算回路Ｂ９０４０では特徴量として、例えばＲＭ
Ｓ値ＲとＲＭＳ比ＲＲを計算し出力する。特徴量計算回
路Ｃ９０５０では特徴量として、例えば短期予測ゲイン
ＳＧと短期予測ゲイン比ＳＧＲを計算し出力する。

【００６９】モード判別回路９０６０では、遅延器９０
７０に格納された過去の一つ前のフレームのモード情報
に応じて、９０３０の出力値ＰＧと、９０４０の出力値
ＲとＲＲと、９０５０の出力値ＳＧとＳＧＲを、あらか
じめ定められた複数個のしきいと比較して、モード判別
を行ない、モード情報を出力する。モード判別回路９０
６０は、モード判別結果を適応コードブック回路５０
０、音源量子化回路３５０へ出力する。

【００７０】特徴量計算回路Ｂ９０４０の構成を図１１
に示す。図１１において、入力端子１０１０からフレー
ム単位に、聴感重み付け信号を入力し、ＲＭＳ計算回路
１１０２０でＲＭＳ値Ｒを計算し出力端子１１０６０か
ら出力する。また、ＲＭＳ計算回路１１０２０の出力値
Ｒと遅延器２１０３０に格納された過去の２つ前のフレ
ームのＲＭＳ値とを用いてＲＭＳ比計算回路１１０４０
でＲＭＳ比ＲＲを計算し、これを出力端子１１０５０に
より出力する。

【００７１】特徴量計算回路Ｃ９０５０は、第４の発明
の“前記特徴量として、ピッチ予測ゲイン、短期予測ゲ
イン、レベル、ピッチの少なくとも一種以上を特徴量と
して含めることを特徴とする第２の発明の音声符号化装
置”に関わる実施例の図３の特徴量計算回路Ｃ３０５０
と同じである。

【００７２】以上により、第３の発明に関わる実施例の
説明を終える。

【００７３】第２の発明に関わる実施例を図２７に示
す。

【００７４】ここでの発明では、第３の発明に関わる実
施例である図１０の特徴量計算回路Ｂと本実施例の特徴
量計算回路Ｂの構成が異なるので、この構成を図２７を
用いて説明する。

【００７５】提案型モード判別回路は、聴感重み付け回
路２３０からフレーム単位で聴感重み付け信号とスペク
トルパラメータ計算回路２００よりスペクトルパラメー
タを受け取り、モード判別情報を出力する。提案型モー
ド判別回路の構成を図２７に示す。

【００７６】図２７において、入力端子１００１０から
フレーム単位に、聴感重み付け信号を入力し、ＲＭＳ計
算回路１００２０でＲＭＳ値Ｒを計算し出力端子１００
６０から出力する。また、ＲＭＳ計算回路１００２０の
出力値Ｒと遅延器１００３０に格納された過去のフレー
ムのＲＭＳ値とを用いてＲＭＳ比計算回路１００４０で
ＲＭＳ比ＲＲを計算し、これを出力端子１００５０によ
り出力する。ここで、ＲＭＳ比ＲＲはフレーム単位に時
間軸をとったときのＲＭＳの変化率である。

【００７７】以上により、第２の発明に関わる実施例の
説明を終える。

【００７８】第１の発明に関わる実施例を図１２に示
す。

【００７９】ここでの発明では、第４の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第２の発明の音声符号化装置”に関わ
る実施例である図３の提案型モード判別回路と本実施例
の提案型モード判別回路の構成が異なるので、提案型モ
ード判別回路の構成を図１２を用いて説明する。

【００８０】提案型モード判別回路は、聴感重み付け回
路２３０からフレーム単位で聴感重み付け信号とスペク
トルパラメータ計算回路２００よりスペクトルパラメー
タを受け取り、モード判別情報を出力する。

【００８１】特徴量計算回路Ａ１２０３０では特徴量と
して、例えばピッチ予測ゲインＰＧを計算し出力する。
特徴量計算回路Ｂ１２０４０では特徴量として、例えば
ＲＭＳ値Ｒを計算し出力する。特徴量計算回路Ｃ１２０
５０では特徴量として、例えば短期予測ゲインＳＧを計
算し出力する。

【００８２】モード判別回路１２０６０では、遅延器１
２０７０に格納された過去の一つ前のフレームのモード
情報に応じて、１２０３０の出力値ＰＧと、１２０４０
の出力値Ｒと、１２０５０の出力値ＳＧを、あらかじめ
定められた複数個のしきいと比較して、モード判別を行
ない、モード情報を出力する。モード判別回路１２０６
０は、モード判別結果を適応コードブック回路５００、
音源量子化回路３５０へ出力する。

【００８３】以上により、第１の発明に関わる実施例の
説明を終える。

【００８４】第８の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする第
６の発明の音声符号化装置”に関わる実施例を図６に示
す。

【００８５】ここでの発明では、第４の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第１の発明の音声符号化装置”に関わ
る実施例である図１の提案型モード判別回路２０００と
適応コードブック回路５００が、本実施例の提案型モー
ド判別回路４０００と適応コードブック回路５０００の
それぞれに対しその構成が異なるので、本実施例ではこ
れらと提案型ピッチ抽出回路６０００の構成について図
６を用いて説明する。

【００８６】モード判別回路４０００は、聴感重み付け
回路２３０からフレーム単位で聴感重み付け信号を受取
り、ピッチ予測ゲインＰＧを計算し、これを、あらかじ
め定められた複数個のしきいと比較して、モード判別を
行ない、モード情報を出力する。モード判別回路４００
０は、モード判別結果を適応コードブック回路５０００
及び音源量子化回路３５０及び提案型ピッチ抽出回路６
０００へ出力する。

【００８７】提案型ピッチ抽出回路６０００は、聴感重
み付け回路２３０からフレーム単位で聴感重み付け信号
とモード判別回路４０００よりモード判別情報と提案型
ピッチ抽出回路６０００の出力値を受け取り、適応コー
ドブック回路５０００と提案型ピッチ抽出回路６０００
に抽出したピッチＣＰを出力する。

【００８８】提案型ピッチ抽出回路６０００の構成を図
７に示す。

【００８９】図７において、入力端子６０１０からモー
ド判別情報を入力し、入力端子６０２０から聴感重み付
け信号を入力し、入力端子６０７０からピッチを入力す
る。

【００９０】特徴量Ｄ計算回路６０４０では特徴量とし
て、例えば現フレームのピッチＣＰ、過去のフレームの
ピッチＰＰ、ピッチ比ＤＲを計算し出力する。ここで、
ピッチ比ＤＲはフレーム単位に時間軸をとったときのピ
ッチの変化率である。

【００９１】特徴量Ｄ補正計算回路６０５０では、入力
端子６０１０からの現在のモード情報と、遅延器６０３
０に格納された過去の一つ前のフレームのモード情報に
応じて、６０４０の出力値ピッチ比ＤＲをあらかじめ定
められた閾値と比較して、現フレームのピッチＣＰを過
去のフレームのピッチＰＰで補正した値ＣＰＰを出力す
る。

【００９２】特徴量Ｄ計算回路６０４０の構成を図８に
示す。図８において、入力端子７０１０からフレーム単
位に、聴感重み付け信号入力端子７０８０からピッチを
入力し、ピッチ計算回路７０２０でピッチＣＰを計算
し、出力端子７０７０で出力する。また、７０２０で計
算されたピッチＣＰと遅延器７０３０に格納された過去
のフレームのピッチＰＰとを用いてピッチ比計算回路７
０４０でピッチ比ＤＲを計算し、これを出力端子７０６
０により出力する。また、遅延器７０３０に格納された
過去のフレームのピッチＰＰも出力端子７０５０より出
力される。

【００９３】適応コードブック回路５０００は、第１の
発明の適応コードブック回路５００と基本的に同じであ
るが、過去の信号からのピッチの探索範囲を、提案型ピ
ッチ抽出回路６０００により得られたピッチＣＰＰの近
傍とすることを特徴とする。

【００９４】以上により、第８の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第６の発明の音声符号化装置”に関わる実施
例の説明を終える。

【００９５】第８の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする第
５の発明の音声符号化装置”に関わる実施例を図１３に
示す。

【００９６】ここでの発明では、第８の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第６の発明の音声符号化装置”に関わ
る実施例である図７のピッチ抽出回路と本実施例のピッ
チ抽出回路の構成が異なるので、これについて図１３を
用いて説明する。

【００９７】提案型ピッチ抽出回路は、聴感重み付け回
路２３０からフレーム単位で聴感重み付け信号とモード
判別回路４０００よりモード判別情報を受け取り、適応
コードブック回路５０００に抽出したピッチＣＰＰを出
力する。

【００９８】提案型ピッチ抽出回路の構成を図１３に示
す。

【００９９】図１３において、入力端子１３０１０から
モード判別情報を入力し、入力端子１３０２０から聴感
重み付け信号を入力する。

【０１００】特徴量Ｄ計算回路１３０４０では特徴量と
して、例えば現フレームのピッチＣＰを計算し出力す
る。

【０１０１】特徴量Ｄ補正計算回路１３０５０では、入
力端子１３０１０からの現在のモード情報と、遅延器１
３０３０に格納された過去の一つ前のフレームのモード
情報に応じて、現フレームのピッチＣＰを補正した値Ｃ
ＰＰを出力する。

【０１０２】以上により、第８の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第５の発明の音声符号化装置”に関わる実施
例の説明を終える。

【０１０３】第８の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする第
７の発明の音声符号化装置”に関わる実施例を図１４に
示す。

【０１０４】ここでの発明では、第８の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第６の発明の音声符号化装置、に関わ
る実施例である図７の特徴量Ｄ計算回路６０４０と本実
施例の特徴量Ｄ計算回路の構成が異なるので、これにつ
いて図１４を用いて説明する。

【０１０５】特徴量Ｄ計算回路の構成を図１４に示す。
図１４において、入力端子１４０１０からフレーム単位
に、聴感重み付け信号を入力し、ピッチ計算回路１４０
２０でピッチＣＰを計算し、出力端子１４０７０で出力
する。また、１４０２０で計算されたピッチＣＰと遅延
器１４０３０に格納された２つ前の過去のフレームのピ
ッチＰＰＰとを用いてピッチ比計算回路１４０４０でピ
ッチ比ＤＲを計算し、これを出力端子１４０６０により
出力する。また、遅延器１４０３０に格納された過去の
フレームのピッチＰＰも出力端子１４０５０より出力さ
れる。

【０１０６】以上により、第８の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第７の発明の音声符号化装置”に関わる実施
例の説明を終える。

【０１０７】第７の発明に関わる実施例を図１５に示
す。

【０１０８】ここでの発明では、第８の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として求める
ことを特徴とする第７の発明の音声符号化装置”に関わ
る実施例である図７のピッチ抽出回路が、本実施例の提
案型ピッチ抽出回路に対しその構成が異なるので、本実
施例ではこれらの構成について図１５を用いて説明す
る。

【０１０９】提案型ピッチ抽出回路は、聴感重み付け回
路２３０からフレーム単位で聴感重み付け信号とモード
判別回路４０００よりモード判別情報と提案型ピッチ抽
出回路からピッチを受け取り、適応コードブック回路５
０００と提案型ピッチ抽出回路に抽出したピッチＣＰを
出力する。

【０１１０】提案型ピッチ抽出回路の構成を図１５に示
す。

【０１１１】図１５において、入力端子１５０１０から
モード判別情報を入力し、入力端子１５０２０から聴感
重み付け信号を入力する。

【０１１２】特徴量Ｄ計算回路１５０４０では特徴量と
して、例えば現フレームのピッチＣＰ、ピッチ比ＤＲを
計算し出力する。

【０１１３】特徴量Ｄ補正計算回路１５０５０では、入
力端子１５０１０からの現在のモード情報と、遅延器１
５０３０に格納された過去の一つ前のフレームのモード
情報に応じて、１５０４０の出力値ピッチ比ＤＲをあら
かじめ定められた閾値と比較して、現フレームのピッチ
ＣＰをピッチ比ＤＲで補正した値ＣＰＰを出力する。

【０１１４】特徴量Ｄ計算回路１５０４０の構成を図１
６に示す。図１６において、入力端子１６０１０からフ
レーム単位に、聴感重み付け信号を入力し、ピッチ計算
回路１６０２０でピッチＣＰを計算し、出力端子１６０
７０で出力する。また、１６０２０で計算されたピッチ
ＣＰと遅延器２６０３０に格納された２つ前の過去のフ
レームのピッチＰＰとを用いてピッチ比計算回路１６０
４０でピッチ比ＤＲを計算し、これを出力端子１６０６
０により出力する。

【０１１５】以上により、第７の発明に関わる実施例の
説明を終える。

【０１１６】第６の発明に関わる実施例を図１７に示
す。

【０１１７】ここでの発明では、第７の発明に関わる実
施例である図１５の特徴量Ｄ計算回路１５０４０が、本
実施例の提案型ピッチ抽出回路に対しその構成が異なる
ので、本実施例ではこれらの構成について図１７を用い
て説明する。

【０１１８】特徴量Ｄ抽出計算回路の構成を図１７に示
す。図１７において、入力端子１７０１０からフレーム
単位に、聴感重み付け信号と入力端子１７０８０からピ
ッチを入力し、ピッチ計算回路１７０２０でピッチＣＰ
を計算し、出力端子１７０７０で出力する。また、１７
０２０で計算されたピッチＣＰと遅延器１７０３０に格
納された過去のフレームのピッチＰＰとを用いてピッチ
比計算回路１７０４０でピッチ比ＤＲを計算し、これを
出力端子１７０６０により出力する。

【０１１９】以上により、第６の発明に関わる実施例の
説明を終える。

【０１２０】第５の発明に関わる実施例を図１８に示
す。

【０１２１】ここでの発明では、第８の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第６の発明の音声符号化装置”に関わ
る実施例である図６の提案型ピッチ抽出回路６０００と
本実施例の提案型ピッチ抽出回路が異なるため、この構
成についてのみ図１８を用いて説明する。

【０１２２】提案型ピッチ抽出回路は、聴感重み付け回
路２３０からフレーム単位で聴感重み付け信号とモード
判別回路４０００よりモード判別情報と提案型ピッチ抽
出回路よりピッチを受け取り、適応コードブック回路６
０００と提案型ピッチ抽出回路に抽出したピッチＣＰを
出力する。

【０１２３】提案型ピッチ抽出回路の構成を図１８に示
す。

【０１２４】図１８において、入力端子１８０１０から
モード判別情報を入力し、入力端子１８０２０から聴感
重み付け信号を入力し、入力端子１８０７０よりピッチ
を入力する。

【０１２５】特徴量Ｄ計算回路１８０４０では特徴量と
して、例えば現フレームのピッチＣＰ、過去のフレーム
のピッチＰＰを出力する。

【０１２６】特徴量Ｄ補正計算回路１８０５０では、入
力端子１８０１０からの現在のモード情報と、遅延器１
８０３０に格納された過去の一つ前のフレームのモード
情報に応じて、１８０４０の出力値過去のフレームのピ
ッチＰＰをあらかじめ定められた閾値と比較して、現フ
レームのピッチＣＰを過去のフレームのピッチＰＰで補
正した値ＣＰＰを出力する。

【０１２７】特徴量Ｄ計算回路１８０４０の構成を図１
９に示す。図１９において、入力端子１９０１０からフ
レーム単位に、聴感重み付け信号を入力し、ピッチ計算
回路１９０２０でピッチＣＰを計算し、出力端子１９０
７０で出力する。また、１９０２０で計算されたピッチ
ＣＰと遅延器１９０３０に格納された過去のフレームの
ピッチＰＰを出力端子１９０６０により出力する。

【０１２８】第５の発明に関わる実施例の説明を終え
る。

【０１２９】第９の発明に関わる実施例を図２０に示
す。

【０１３０】ここでの発明では、第４の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第１の発明の音声符号化装置”に関わ
る実施例である図１の提案型モード判別回路２０００
が、本実施例の提案型モード判別回路２００００に対し
その構成が異なるので、本実施例ではこれと提案型ＲＭ
Ｓ抽出回路３００００の構成について図２０を用いて説
明する。

【０１３１】モード判別回路２００００は、聴感重み付
け回路２３０からフレーム単位で聴感重み付け信号を受
け取り、ピッチ予測ゲインＰＧを計算し、これを、あら
かじめ定められた複数のしきいと比較して、モード判別
を行ない、モード情報を出力する。モード判別回路２０
０００は、モード判別結果を適応コードブック回路５０
０、提案型ＲＭＳ抽出回路３００００及び音源量子化回
路３５０へ出力する。

【０１３２】提案型ＲＭＳ抽出回路３００００は、フレ
ーム分割回路１１０からフレーム単位で音声信号とモー
ド判別回路２００００よりモード判別情報とＲＭＳコー
ドブック４００００より、幾つかのＲＭＳコードベクト
ルを受け取り、一つのＲＭＳコードベクトルを出力す
る。

【０１３３】提案型ＲＭＳ抽出回路３００００の構成を
図２１に示す。

【０１３４】図２１において、入力端子３１０１０から
モード判別情報を、入力端子３１０２０からフレーム単
位での音声信号を、入力端子３１０８０からＲＭＳコー
ドベクトル信号入力する。

【０１３５】ＲＭＳ計算回路３１０４０ではフレーム単
位でのＲＭＳ値Ｒを計算する。

【０１３６】ＲＭＳ補正計算回路３１０５０では、入力
端子３１０１０からの現在のモード情報と、遅延器３１
０３０に格納された過去の一つ前のフレームのモード情
報に応じて、３１０４０の出力値Ｒをあらかじめ定めら
れた閾値と比較して、現フレームのＲＭＳ値を補正した
値ＩＲを出力する。

【０１３７】ＲＭＳ量子化ベクトル選択回路３１０６０
では、ＲＭＳコードブック４００００の予め格納された
コードベクトルの中から、ＲＭＳ補正計算回路３１０５
０の出力値ＩＲに近いベクトルを選択し、これを出力す
る。

【０１３８】以上により、第９の発明に関わる実施例の
説明を終える。

【０１３９】第１２の発明の“前記特徴量として、ピッ
チ予測ゲイン、短期予測ゲイン、レベル、ピッチの少な
くとも一種以上を特徴量として含めることを特徴とする
第９の発明の音声符号化装置”に関わる実施例を図２２
に示す。

【０１４０】ここでの発明では、第９の発明に関わる実
施例である図２０の提案型ＲＭＳ抽出回路３００００
が、本実施例の提案型ＲＭＳ抽出回路に対しその構成が
異なるので、本実施例ではこの構成について図２２を用
いて説明する。

【０１４１】図２２において、入力端子３２０１０から
モード判別情報を、入力端子３２０２０からフレーム単
位での音声信号を、入力端子３２０８０からＲＭＳコー
ドベクトル信号入力する。

【０１４２】ＲＭＳ計算回路３２０４０ではフレーム単
位でのＲＭＳ値Ｒを計算する。

【０１４３】ＲＭＳ補正計算回路３２０５０では、入力
端子３２０１０からの現在のモード情報と、遅延器３２
０３０に格納された過去の一つ前のフレームのモード情
報と、遅延器３２０９０に格納された過去のフレームの
ＲＭＳ値に応じて、３２０４０の出力値Ｒをあらかじめ
定められた閾値と比較して、現フレームのＲＭＳ値を補
正した値ＩＲを出力する。

【０１４４】ＲＭＳ量子化ベクトル選択回路３２０６０
では、ＲＭＳコードブック４００００の予め格納された
コードベクトルの中から、ＲＭＳ補正計算回路３２０５
０の出力値ＩＲに近いベクトルを選択し、これを出力す
る。

【０１４５】以上により、第１２の発明の“前記特徴量
として、ピッチ予測ゲイン、短期予測ゲイン、レベル、
ピッチの少なくとも一種以上を特徴量として含めること
を特徴とする第９の発明の音声符号化装置”に関わる実
施例の説明を終える。

【０１４６】第１０の発明に関わる実施例を図２３に示
す。

【０１４７】ここでの発明では、第９の発明に関わる実
施例である図２０の提案型ＲＭＳ抽出回路が、本実施例
の提案型ＲＭＳ抽出回路に対しその構成が異なるので、
本実施例ではこれの構成について図２３を用いて説明す
る。

【０１４８】図２３において、入力端子３３０１０から
モード判別情報を、入力端子３３０２０からフレーム単
位での音声信号を、入力端子３３０８０からＲＭＳコー
ドベクトル信号入力する。

【０１４９】ＲＭＳ計算回路３３０４０ではフレーム単
位でのＲＭＳ値Ｒを計算する。

【０１５０】ＲＭＳ補正計算回路３３０５０では、入力
端子３３０１０からの現在のモード情報と、遅延器３３
０３０に格納された過去の一つ前のフレームのモード情
報と、ＲＭＳ計算回路４３０９０に格納されたＲＭＳ比
ＲＲに応じて、３３０４０の出力値Ｒをあらかじめ定め
られた閾値と比較して、現フレームのＲＭＳ値を補正し
た値ＩＲを出力する。

【０１５１】ＲＭＳ比計算回路４３０９０では、ＲＭＳ
計算回路３３０４０の出力値Ｒと遅延器３３０９０に格
納された過去のフレームのＲＭＳ値との比を計算し、こ
れを出力する。

【０１５２】ＲＭＳ量子化ベクトル選択回路３３０６０
では、ＲＭＳコードブック４００００の予め格納された
コードベクトルの中から、ＲＭＳ補正計算回路３３０５
０の出力値ＩＲに近いベクトルを選択し、これを出力す
る。

【０１５３】以上により、第１０の発明に関わる実施例
の説明を終える。

【０１５４】第１２の発明の“前記特徴量として、ピッ
チ予測ゲイン、短期予測ゲイン、レベル、ピッチの少な
くとも一種以上を特徴量として含めることを特徴とする
第１０の発明の音声符号化装置”に関わる実施例を図２
４に示す。

【０１５５】ここでの発明では、第１０の発明に関わる
実施例である図２４の提案型ＲＭＳ抽出回路が、本実施
例の提案型ＲＭＳ抽出回路に対しその構成が異なるの
で、本実施例ではこの構成について図２４を用いて説明
する。

【０１５６】図２４において、入力端子３４０１０から
モード判別情報を、入力端子３４０２０からフレーム単
位での音声信号を、入力端子３４０８０からＲＭＳコー
ドベクトル信号入力する。

【０１５７】ＲＭＳ計算回路３４０４０ではフレーム単
位でのＲＭＳ値Ｒを計算する。

【０１５８】ＲＭＳ補正計算回路３４０５０では、入力
端子３４０１０からの現在のモード情報と、遅延器３４
０３０に格納された過去の一つ前のフレームのモード情
報と、ＲＭＳ比計算回路４４０９０に格納されたＲＭＳ
比ＲＲに応じて、３４０４０の出力値Ｒをあらかじめ定
められた閾値と比較して、現フレームのＲＭＳ値を遅延
器３４０９０に格納された過去のフレームのＲＭＳ値で
補正した値ＩＲを出力する。

【０１５９】ＲＭＳ比計算回路３４０９０では、ＲＭＳ
計算回路３４０４０の出力値Ｒと遅延器３４０９０に格
納された過去のフレームのＲＭＳ値との比を計算し、こ
れを出力する。

【０１６０】ＲＭＳ量子化ベクトル選択回路３４０６０
では、ＲＭＳコードブック４００００の予め格納された
コードベクトルの中から、ＲＭＳ補正計算回路３４０５
０の出力値ＩＲに近いベクトルを選択し、これを出力す
る。

【０１６１】以上により、第１２の発明の“前記特徴量
として、ピッチ予測ゲイン、短期予測ゲイン、レベル、
ピッチの少なくとも一種以上を特徴量として含めること
を特徴とする第１０の発明の音声符号化装置”に関わる
実施例の説明を終える。

【０１６２】第１１の発明に関わる実施例を図２５に示
す。

【０１６３】ここでの発明では、第１１の発明に関わる
実施例である図２４の提案型ＲＭＳ抽出回路が、本実施
例の提案型ＲＭＳ抽出回路に対しその構成が異なるの
で、本実施例ではこれの構成について図２５を用いて説
明する。

【０１６４】図２５において、入力端子３５０１０から
モード判別情報を、入力端子３５０２０からフレーム単
位での音声信号を、入力端子３５０８０からＲＭＳコー
ドベクトル信号入力する。

【０１６５】ＲＭＳ計算回路３５０４０ではフレーム単
位でのＲＭＳ値Ｒを計算する。

【０１６６】ＲＭＳ補正計算回路３５０５０では、入力
端子３５０１０からの現在のモード情報と、遅延器３５
０３０に格納された過去の一つ前のフレームのモード情
報と、ＲＭＳ比計算回路４５０９０に格納されたＲＭＳ
比ＲＲに応じて、３５０４０の出力値Ｒをあらかじめ定
められた閾値と比較して、現フレームのＲＭＳ値を補正
した値ＩＲを出力する。

【０１６７】ＲＭＳ比計算回路４５０９０では、ＲＭＳ
計算回路３５０４０の出力値Ｒと遅延器５５０９０に格
納された過去の２つ前のフレームのＲＭＳ値との比を計
算し、これを出力する。

【０１６８】ＲＭＳ量子化ベクトル選択回路３５０６０
では、ＲＭＳコードブック４００００の予め格納された
コードベクトルの中から、ＲＭＳ補正計算回路３５０５
０の出力値ＩＲに近いベクトルを選択し、これを出力す
る。

【０１６９】以上により、第１１の発明に関わる実施例
の説明を終える。

【０１７０】第１２の発明の“前記特徴量として、ピッ
チ予測ゲイン、短期予測ゲイン、レベル、ピッチの少な
くとも一種以上を特徴量として含めることを特徴とする
第１１の発明の音声符号化装置”に関わる実施例を図２
６に示す。

【０１７１】ここでの発明では、第１１の発明に関わる
実施例である図２５の提案型ＲＭＳ抽出回路が、本実施
例の提案型ＲＭＳ抽出回路に対しその構成が異なるの
で、本実施例ではこの構成について図２６を用いて説明
する。

【０１７２】図２６において、入力端子３６０１０から
モード判別情報を、入力端子３６０２０からフレーム単
位での音声信号を、入力端子３６０８０からＲＭＳコー
ドベクトル信号入力する。

【０１７３】ＲＭＳ計算回路３６０４０ではフレーム単
位でのＲＭＳ値Ｒを計算する。

【０１７４】ＲＭＳ補正計算回路３６０５０では、入力
端子３６０１０からの現在のモード情報と、遅延器３６
０３０に格納された過去の一つ前のフレームのモード情
報と、ＲＭＳ比計算回路４６０９０に格納されたＲＭＳ
比ＲＲに応じて、３６０４０の出力値Ｒをあらかじめ定
められた閾値と比較して、現フレームのＲＭＳ値を遅延
器３６０９０に格納された過去の１つ前のフレームのＲ
ＭＳ値で補正した値ＩＲを出力する。

【０１７５】ＲＭＳ比較計算回路４６０９０では、ＲＭ
Ｓ計算回路３６０４０の出力値Ｒと遅延器５６０９０に
格納された過去の２つ前のフレームのＲＭＳ値との比を
計算し、これを出力する。

【０１７６】ＲＭＳ量子化ベクトル選択回路３６０６０
では、ＲＭＳコードブック４００００の予め格納された
コードベクトルの中から、ＲＭＳ補正計算回路３６０５
０の出力値ＩＲに近いベクトルを選択し、これを出力す
る。

【０１７７】以上により、第１２の発明の”前記特徴量
として、ピッチ予測ゲイン、短期予測ゲイン、レベル、
ピッチの少なくとも一種以上を特徴量として含めること
を特徴とする第１１の発明の音声符号化装置に関わる実
施例の説明を終える。

【０１７８】

【発明の効果】以上説明したように、本発明によれば、
音声符号化装置において、低遅延とするために、フレー
ム長を５ｍｓ−１０ｍｓ以下と短くしても、モード判別
あるいはピッチ抽出、レベル抽出の時間的変動による音
質劣化を起こすことなく、良好な音質を得ることが可能
となりこの利点は極めて大きなものである。

【図面の簡単な説明】

【図１】本発明の一実施例の構成図。

【図２】提案型モード判別回路の構成図。

【図３】提案型モード判別回路の構成図。

【図４】特徴量計算回路Ｂの構成図。

【図５】特徴量計算回路Ｃの構成図。

【図６】本発明の一実施例の構成図。

【図７】提案型ピッチ抽出回路の構成図。

【図８】特徴量Ｄ抽出計算回路の構成図。

【図９】特徴量計算回路Ｃの構成図。

【図１０】提案型モード判別回路の構成図。

【図１１】特徴量計算回路Ｂの構成図。

【図１２】提案型モード判別回路の構成図。

【図１３】ピッチ抽出回路の構成図。

【図１４】特徴量Ｄ計算回路の構成図。

【図１５】ピッチ抽出回路の構成図。

【図１６】特徴量Ｄ抽出計算回路の構成図。

【図１７】提案型ピッチ抽出回路の構成図。

【図１８】提案型ピッチ抽出回路の構成図。

【図１９】特徴量Ｄ抽出計算回路の構成図。

【図２０】本発明の一実施例の構成図。

【図２１】提案型ＲＭＳ抽出回路の構成図。

【図２２】提案型ＲＭＳ抽出回路の構成図。

【図２３】提案型ＲＭＳ抽出回路の構成図。

【図２４】提案型ＲＭＳ抽出回路の構成図。

【図２５】提案型ＲＭＳ抽出回路の構成図。

【図２６】提案型ＲＭＳ抽出回路の構成図。

【図２７】特徴量計算回路Ｂの構成図。

【符号の説明】

１１０フレーム分割回路１２０サブフレーム分割回路２００スペクトルパラメータ計算回路２１０スペクトルパラメータ量子化回路２１１ＬＳＰコードブック２３０重み付け回路２３５減算回路２４０応答信号計算回路３１０インパルス応答計算回路３５０音源量子化回路３５１不均一パルス数型スパース音源コードブック３５５ゲインコードブック３６０重み付け信号計算回路３６５ゲイン量子化回路４００マルチプレクサ５００、５５０適応コードブック回路２０００提案型モード判別回路２０１０フレーム単位の入力端子２０２０スペクトルパラメータの入力端子２０３０フレーム単位の特徴量計算回路２０４０特徴量計算回路Ｂ２０５０モード判別回路２０６０モード情報格納遅延器２０７０モード情報出力端子３０３０特徴量計算回路Ａ３０４０特徴量計算回路Ｂ３０５０特徴量計算回路Ｃ３０６０モード判別回路３０７０遅延器４０００モード判別回路４０２０ＲＭＳ計算回路４０３０遅延器４０４０ＲＭＳ比計算回路５０００適応コードブック回路５０３０短期予測ゲイン計算回路５０４０遅延器５０５０短期予測ゲイン比計算回路６０００提案型ピッチ抽出回路６０３０遅延器６０４０特徴量Ｄ計算回路６０５０特徴量Ｄ補正計算回路７０２０ピッチ計算回路７０３０遅延器７０４０ピッチ比計算回路８０３０短期予測ゲイン計算回路８０４０遅延器８０５０遅延器８０８０短期予測ゲイン比計算回路９０３０特徴量計算回路Ａ９０４０特徴量計算回路Ｂ９０５０特徴量計算回路Ｃ９０６０モード判別回路９０７０遅延器１００２０ＲＭＳ計算回路１００３０遅延器１００４０ＲＭＳ比計算回路１１０２０ＲＭＳ計算回路１１０３０遅延器１１０４０ＲＭＳ比計算回路１２０３０特徴量計算回路Ａ１２０４０特徴量計算回路Ｂ１２０５０特徴量計算回路Ｃ１２０６０モード判別回路１２０７０遅延器１３０３０遅延器１３０４０特徴量Ｄ計算回路１３０５０特徴量Ｄ補正計算回路１４０２０ピッチ計算回路１４０３０遅延器１４０４０ピッチ比計算回路１５０３０遅延器１５０４０特徴量Ｄ計算回路１５０５０特徴量Ｄ抽出計算回路１６０２０ピッチ計算回路１６０３０遅延器１６０４０ピッチ計算回路１７０２０ピッチ計算回路１７０３０遅延器１７０４０ピッチ比計算回路１８０３０遅延器１８０４０特徴量Ｄ計算回路１８０５０特徴量Ｄ抽出計算回路１９０２０ピッチ計算回路１９０３０遅延器２００００提案型モード判別回路２１０３０遅延器２４０３０遅延器２６０３０遅延器３００００提案型ＲＭＳ抽出回路３１０３０遅延器３１０４０ＲＭＳ計算回路３１０５０ＲＭＳ補正計算回路３１０６０ＲＭＳ量子化ベクトル選択回路３２０３０遅延器３２０４０ＲＭＳ計算回路３２０５０ＲＭＳ補正計算回路３２０６０ＲＭＳ量子化ベクトル選択回路３２０９０遅延器３３０３０遅延器３３０４０ＲＭＳ計算回路３３０５０ＲＭＳ補正計算回路３３０６０ＲＭＳ量子化ベクトル選択回路３３０９０遅延器３４０３０遅延器３４０４０ＲＭＳ計算回路３４０５０ＲＭＳ補正計算回路３４０６０ＲＭＳ量子化ベクトル選択回路３４０９０遅延器３５０３０遅延器３５０４０ＲＭＳ計算回路３５０５０ＲＭＳ補正計算回路３５０６０ＲＭＳ量子化ベクトル選択回路３５０９０遅延器３６０３０遅延器３６０４０ＲＭＳ計算回路３６０５０ＲＭＳ補正計算回路３６０６０ＲＭＳ量子化ベクトル選択回路３６０９０遅延器４００００ＲＭＳコードブック４３０９０ＲＭＳ比計算回路４４０９０ＲＭＳ比計算回路４５０９０ＲＭＳ比計算回路４６０９０ＲＭＳ比計算回路５５０９０遅延器５６０９０遅延器

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 19/08 G10L 11/04 G10L 13/00 G10L 19/04

Claims

(57)【特許請求の範囲】

【請求項１】音声信号をあらかじめ定められたフレーム
単位に区切るフレーム分割部と、前記音声信号から信号の短時間的な性質を表す特徴量を
計算しモード判別を行うモード判別部と、前記音声信号
からピッチを抽出するピッチ抽出部と、前記ピッチ抽出
部の出力を用い適応コードブックによりピッチ予測を行
い、ピッチ予測信号を前期音声信号から減算し、減算後
の信号から音源信号を求めて符号化する際に、前記判別
結果に応じて前記適応コードブックの動作や音源信号符
号化の動作を切り替える符号化部を有する音声符号化装
置において、前記ピッチ抽出部は、現フレーム及び過去の少なくとも
一つのフレームからそれぞれ求めたピッチを含む少なく
とも１種類以上の特徴量と、過去の少なくとも一つのフ
レームから求めたモード判別情報を用いて、時間連続性
を考慮しながら現フレームのピッチを補正することを特
徴とする音声符号化装置。
【請求項２】前記特徴量として、少なくとも１種類以上
の特徴量の時間変化比を特徴量として含めた請求項１記
載の音声符号化装置。
【請求項３】前記特徴量として、現フレーム又は過去の
少なくとも一つ以上のフレームのいずれかの２フレーム
分のそれぞれの特徴量に対し、前記二つの特徴量の比を
特徴量として含めた請求項１記載の音声符号化装置。
【請求項４】前記特徴量として、ピッチ予測ゲイン、短
期予測ゲイン、レベル、ピッチの少なくとも一種以上を
特徴量として含めることを特徴とする請求項１、２、ま
たは３記載の音声符号化装置。
【請求項５】音声信号をあらかじめ定められたフレーム
単位に区切るフレーム分割部と、前記音声信号から信号
の短時間的な性質を表す特徴量を計算しモード判別を行
うモード判別部と、前記音声信号から信号の短時間的な
レベルを抽出するレベル抽出部と、前記音声信号からピ
ッチを抽出するピッチ抽出部と、前記ピッチ抽出部の出
力を用い適応コードブックによりピッチ予測を行い、ピ
ッチ予測信号を前期音声信号から減算し、減算後の信号
から音源信号を求めて符号化する際に、前記判別結果に
応じて前記適応コードブックの動作や音源信号符号化の
動作を切りかえる符号化部を有する音声符号化装置にお
いて、前記レベル抽出部は、現フレーム及び過去の少なくとも
一つのフレームからそれぞれ求めたレベルを含む少なく
とも１種類以上の特徴量と、過去の少なくとも一つのフ
レームから求めたモード判別情報を用いて、時間連続性
を考慮しながら現フレームのレベルを補正することを特
徴とする音声符号化装置。
【請求項６】前記特徴量として、少なくとも１種類以上
の特徴量の時間変化比を特徴量として含めた請求項５記
載の音声符号化装置。
【請求項７】前記特徴量として、現フレーム又は過去の
少なくとも一つ以上のフレームのいずれかの２フレーム
分のそれぞれの特徴量に対し、前記二つの特徴量の比を
特徴量として含めた請求項５記載の音声符号化装置。
【請求項８】前記特徴量として、ピッチ予測ゲイン、短
期予測ゲイン、レベル、ピッチの少なくとも一種以上を
特徴量として含めることを特徴とする請求項５、６、ま
たは７記載の音声符号化装置。