JP3047761B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3047761B2
JP3047761B2 JP7013072A JP1307295A JP3047761B2 JP 3047761 B2 JP3047761 B2 JP 3047761B2 JP 7013072 A JP7013072 A JP 7013072A JP 1307295 A JP1307295 A JP 1307295A JP 3047761 B2 JP3047761 B2 JP 3047761B2
Authority
JP
Japan
Prior art keywords
pitch
frame
circuit
signal
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7013072A
Other languages
English (en)
Other versions
JPH08202398A (ja
Inventor
真一 田海
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP7013072A priority Critical patent/JP3047761B2/ja
Application filed by NEC Corp filed Critical NEC Corp
Priority to DE69615227T priority patent/DE69615227T2/de
Priority to DE69609089T priority patent/DE69609089T2/de
Priority to EP99111363A priority patent/EP0944038B1/en
Priority to EP99109387A priority patent/EP0944037B1/en
Priority to DE69615870T priority patent/DE69615870T2/de
Priority to EP96100544A priority patent/EP0723258B1/en
Priority to US08/588,005 priority patent/US5787389A/en
Priority to CA002167552A priority patent/CA2167552C/en
Publication of JPH08202398A publication Critical patent/JPH08202398A/ja
Application granted granted Critical
Publication of JP3047761B2 publication Critical patent/JP3047761B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号を低遅延、特
に5ms−10ms以下の短いフレーム単位で高品質に
符号化するための音声符号化装置に関するものである。
【0002】
【従来の技術】音声信号を符号化する方式としては、例
えば、K.Ozawa氏らによる“M−LCELP S
peech Coding at 4kb/s wit
h Multi−Mode and Multi−Co
debook”(IEICETrans.Commu
n.vol.E77−B,No.9,pp.1114−
1121,1994年)と題した論文(文献1)などが
知られている。この従来例では、送信側では、フレーム
毎(例えば40ms)に音声信号から線形予測(LP
C)分析を用いて、音声信号のスペクトル特性を表すス
ペクトルパラメータを抽出し、前記フレーム単位の信号
または前記フレーム単位の信号に聴感重み付けを行なっ
た信号から得た特徴量を計算し、特徴量を用いてモード
判別(例えば、母音部と子音部)を行ない、モード判別
結果に応じてアルゴリズムあるいはコードブックを切り
かえて符号化を行なう。符号化部では、フレームをさら
にサブフレーム(例えば8ms)に分割し、サブフレー
ム毎に過去の音源信号を基に適応コードブックにおける
パラメータ(ピッチ周期に対応する遅延パラメータとゲ
インパラメータ)を抽出し適応コードブックにより前記
サブフレームの音声信号をピッチ予測し、ピッチ予測し
て求めた残差信号に対して、予め定められた種類の雑音
信号からなる音源コードブック(ベクトル量子化コード
ブック)から最適音源コードベクトルを選択し最適なゲ
インを計算することにより、音源信号を量子化する。音
源コードベクトルの選択の仕方は、選択した雑音信号に
より合成した信号と、前記残差信号との誤差電力を最小
化するように行なう。そして、選択されたコードベクト
ルの種類を表すインデクスとゲインならびに、前記スペ
クトルパラメータと適応コードブックのパラメータをマ
ルチプレクサ部により組み合わせて伝送する。受信側の
説明は省略する。
【0003】
【発明が解決しようとする課題】前記従来法では、処理
遅延を低減するために、フレーム長を例えば5ms以下
に低減した場合、モード情報あるいはピッチ抽出、レベ
ル抽出をフレーム単位で求めると、これらの値の時間的
変動が大きいために、不安定で過ったモード切り替え、
あるいは不安定で過ったピッチ抽出、不安定で過ったレ
ベル抽出が生じ、音質劣化が起こるという問題点があっ
た。本発明は、上述の問題を解決し、正しいモード判
別、あるいは正しいピッチ抽出、正しいレベル抽出を提
供し、これらの誤りによる音質劣化を抑制することを目
的とする。
【0004】
【課題を解決するための手段】第1の発明によれば、音
声信号を予め定めたフレーム単位に区切るフレーム分割
部と、前記音声信号から特徴量を計算しモード判別を行
なうモード判別部と、前記判別結果におうじて前記音声
信号を符号化する音声符号化装置において、現フレーム
及び過去の少なくとも一つのフレームからそれぞれ求め
た少なくとも1種類以上の特徴量と過去の少なくとも一
つのフレームから求めたモード判別情報を用いて、現フ
レームのモード判別をする機能を有することを特徴とす
る音声符号化装置が得られる。
【0005】また第2の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
1種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、少なくとも1種類以上の特
徴量の時間変化比を特徴量として含めた音声符号化装置
が得られる。
【0006】また第3の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
1種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、現フレーム又は過去の少な
くとも一つ以上のフレームのいずれかの2フレーム分の
それぞれの特徴量に対し、前記二つの特徴量の比を特徴
量として含めた音声符号化装置が得られる。
【0007】また第4の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
1種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、ピッチ予測ゲイン、短期予
測ゲイン、レベル、ピッチの少なくとも一種以上を特徴
量として含めることを特徴とする音声符号化装置が得ら
れる。
【0008】また第4の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
1種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、少なくとも1種類以上の特
徴量の時間変化比を特徴量として含めた音声符号化装置
で、前記特徴量として、ピッチ予測ゲイン、短期予測ゲ
イン、レベル、ピッチの少なくとも一種以上を特徴量と
して含めることを特徴とする音声符号化装置が得られ
る。
【0009】また第4の発明によれば、音声信号を予め
定めたフレーム単位に区切るフレーム分割部と、前記音
声信号から特徴量を計算しモード判別を行なうモード判
別部と、前記判別結果におうじて前記音声信号を符号化
する音声符号化装置において、現フレーム及び過去の少
なくとも一つのフレームからそれぞれ求めた少なくとも
1種類以上の特徴量と過去の少なくとも一つのフレーム
から求めたモード判別情報を用いて、現フレームのモー
ド判別をする機能を有することを特徴とする音声符号化
装置で、前記特徴量として、現フレームまたは過去の少
なくとも一つ以上のフレームのいずれかの2フレーム分
のそれぞれの特徴量に対し、前記二つの特徴量の比を特
徴量として含めた音声符号化装置で、前記特徴量とし
て、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピッ
チの少なくとも一種以上を特徴量として含めることを特
徴とする音声符号化装置が得られる。
【0010】また第5の発明(請求項1に係る発明)
よれば、音声信号を予め定めたフレーム単位に区切るフ
レーム分割部と、前記音声信号から特徴量を計算しモー
ド判別を行なうモード判別部と、前記音声信号からピッ
チを抽出するピッチ抽出部と、前記ピッチ抽出部の出力
を用いて前記音声信号を符号化する際に、前記判別結果
におうじて前記音声信号の符号化方法を切り替える符号
化部を有する音声符号化装置において、現フレーム及び
過去の少なくとも一つのフレームからそれぞれ求めた少
なくとも1種類以上の特徴量と過去の少なくとも一つの
フレームから求めたモード判別情報を用いて、現フレー
ムのピッチを補正するピッチ抽出部を有することを特徴
とする音声符号化装置が得られる。
【0011】また第6の発明(請求項2に係る発明)に
よれば、前記特徴量として、少なくとも1種類以上の特
徴量の時間変化比を特徴量として含めた音声符号化装置
が得られる。
【0012】また第7の発明(請求項3に係る発明)に
よれば、前記特徴量として、現フレーム又は過去の少な
くとも一つ以上のフレームのいずれかの2フレーム分の
それぞれの特徴量に対し、前記二つの特徴量の比を特徴
量として含めた音声符号化装置が得られる。
【0013】また第8の発明(請求項4に係る発明)に
よれば、前記特徴量として、ピッチ予測ゲイン、短期予
測ゲイン、レベル、ピッチの少なくとも一種以上を特徴
量として含めることを特徴とする音声符号化装置が得ら
れる。
【0014】また第8の発明(請求項4に係る発明)に
よれば、前記特徴量として、少なくとも1種類以上の特
徴量の時間変化比を特徴量として含めた音声符号化装置
で、前記特徴量として、ピッチ予測ゲイン、短期予測ゲ
イン、レベル、ピッチの少なくとも一種以上を特徴量と
して含めることを特徴とする音声符号化装置が得られ
る。
【0015】また第8の発明(請求項4に係る発明)に
よれば、前記特徴量として、現フレーム又は過去の少な
くとも一つ以上のフレームのいずれかの2フレーム分の
それぞれの特徴量に対し、前記二つの特徴量の比を特徴
量として含めた音声符号化装置で、前記特徴量として、
ピッチ予測ゲイン、短期予測ゲイン、レベル、ピッチの
少なくとも一種以上を特徴量として含めることを特徴と
する音声符号化装置が得られる。
【0016】また第9の発明(請求項5に係る発明)
よれば、音声信号を予め定めたフレーム単位に区切るフ
レーム分割部と、前記音声信号から特徴量を計算しモー
ド判別を行なうモード判別部と、前記音声信号からレベ
ルを抽出するレベル抽出部と、前記レベル抽出部の出力
を用いて前記音声信号を符号化する際に、前記判別結果
におうじて前記音声信号の符号化方法を切り替える符号
化部を有する音声符号化装置において、現フレーム及び
過去の少なくとも一つのフレームからそれぞれ求めた少
なくとも1種類以上の特徴量と過去の少なくとも一つの
フレームから求めたモード判別情報を用いて、現フレー
ムのレベルを補正するレベル抽出部を有することを特徴
とする音声符号化装置が得られる。
【0017】また第10の発明(請求項6に係る発明)
によれば、前記特徴量として、少なくとも1種類以上の
特徴量の時間変化比を特徴量として含めた音声符号化装
置が得られる。
【0018】また第11の発明(請求項7に係る発明)
によれば、前記特徴量として、現フレーム又は過去の少
なくとも一つ以上のフレームのいずれかの2フレーム分
のそれぞれの特徴量に対し、前記二つの特徴量の比を特
徴量として含めた音声符号化装置が得られる。
【0019】また第12の発明(請求項8に係る発明)
によれば、前記特徴量として、ピッチ予測ゲイン、短期
予測ゲイン、レベル、ピッチの少なくとも一種以上を特
徴量として含めることを特徴とする音声符号化装置が得
られる。
【0020】また第12の発明(請求項8に係る発明)
によれば、前記特徴量として、少なくとも1種類以上の
特徴量の時間変化比を特徴量として含めた音声符号化装
置で、前記特徴量として、ピッチ予測ゲイン、短期予測
ゲイン、レベル、ピッチの少なくとも一種以上を特徴量
として含めることを特徴とする音声符号化装置が得られ
る。
【0021】また第12の発明(請求項8に係る発明)
によれば、前記特徴量として、現フレーム又は過去の少
なくとも一つ以上のフレームのいずれかの2フレーム分
のそれぞれの特徴量に対し、前記二つの特徴量の比を特
徴量として含めた音声符号化装置で、前記特徴量とし
て、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピッ
チの少なくとも一種以上を特徴量として含めることを
徴とする音声符号化装置が得られる。
【0022】
【作用】前記構成により、現フレームの前後では正しい
モード情報あるいは正しいピッチ抽出、正しいレベル抽
出を示しているが、現フレームのみでこれらの値が過っ
た場合、過去の正しいモード情報あるいは正しいピッチ
抽出、正しいレベル抽出を示すフレームからの情報を現
フレームに適応することにより、現フレームのモード情
報あるいはピッチ抽出、レベル抽出を長い時間長にわた
る情報を用いて補正することができる。従って、音声符
号化処理に正しいモード情報あるいは正しいピッチ、正
しいレベル抽出を提供し、これらの誤りに起因する音質
劣化を抑制できる。
【0023】
【実施例】第4の発明の“前記特徴量として、ピッチ予
測ゲイン、短期予測ゲイン、レベル、ピッチの少なくと
も一種以上を特徴量として含めることを特徴とする第1
の発明の音声符号化装置”に関わる実施例を図1に示
す。
【0024】図において、入力端子100から音声信号
を入力し、フレーム分割回路110では音声信号をフレ
ーム(例えば5ms)毎に分割し、サブフレーム分割回
路120では、フレームの音声信号をフレームよりも短
いサブフレーム(例えば2.5ms)に分割する。
【0025】スペクトルパラメータ計算回路200で
は、少なくとも一つのサブフレームの音声信号に対し
て、サブフレーム長よりも長い窓(例えば24ms)を
かけて音声を切り出してスペクトルパラメータをあらか
じめ定められた次数(例えばP=10次)計算する。こ
こでスペクトルパラメータの計算には、周知のLPC分
析や、Burg分析等を用いることができる。ここで
は、Berg分析を用いることとする。Burg分析の
詳細については、中溝著による“信号解析とシステム同
定”と題した単行本(コロナ社1988年刊)の82〜
87頁(文献2)等に記載されているので説明は略す
る。さらにスペクトルパラメータ計算部では、Burg
法により計算された線形予測係数αi (i=1,…,1
0)を量子化や補間に適したLSPパラメータに変換す
る。ここで、線形予測係数からLSPへの変換は、菅村
他による“線スペクトル対(LSP)音声分析合成方法
による音声情報圧縮”と題した論文(電子通信学会論文
誌、J64−A、pp.599−606、1981年)
(文献3)を参照することができる。つまり、第2サブ
フレームでBurg法により求めた線形予測係数を、L
SPパラメータに変換し、第1サブフレームのLSPを
直線補間により求めて、第1サブフレームのLSPを逆
変換して線形予測係数に戻し、第1、2サブフレームの
線形予測係数αil(i=1,…,10,l=1,…,
5)を聴感重み付け回路230に出力する。また、第
1、2サブフレームのLSPをスペクトルパラメータ量
子化回路210へ出力する。
【0026】スペクトルパラメータ量子化回路210で
は、あらかじめ定められたサブフレームのLSPパラメ
ータを効率的に電子化する。以下では、量子化法とし
て、ベクトル量子化を用いるものとし、第2サブフレー
ムのLSPパラメータを量子化するものとする。LSP
パラメータのベクトル量子化の手法は周知の手法を用い
ることができる。具体的な方法は例えば、特開平4−1
71500号公報(特願平2−297600号)(文献
4)や特開平4−363000号公報(特願平3−26
1925号)(文献5)や、特開平5−6199号公報
(特願平3−155049号)(文献6)や、T.No
mura et al.,による“LSPCoding
Using VQ−SVQ With Interp
olation in 4.075 kbps M−L
CELP Speech Coder”と題した論文
(Proc.Mobile Multimedia C
ommunications,pp.B.2.5,19
93)(文献7)等を参照できるのでここでは説明は略
する。また、スペクトルパラメータ量子化回路210で
は、第2サブフレームで量子化したLSPパラメータを
もとに、第1,2サブフレームのLSPパラメータを復
元する。ここでは、現フレームの第2サブフレームの量
子化LSPパラメータと1つ過去のフレームの第2サブ
フレームの量子化LSPを直線補間して、第1,2サブ
フレームのLSPを復元する。ここで、量子化前のLS
Pと量子化後のLSPとの誤差電力を最小化するコード
ベクトルを1種類選択した後に、直線補間により第1〜
第4サブフレームのLSPを復元できる。さらに性能を
向上させるためには、前記誤差電力を最小化するコード
ベクトルを複数候補選択したのちに、各々の候補につい
て、累積歪を評価し、累積歪を最小化する候補と補間L
SPの組を選択するようにすることができる。
【0027】以上により復元した第1,2サブフレーム
のLSPと第2サブフレームの量子化LSPをサブフレ
ーム毎に線形予測係数α′il(i=1,…,10,l=
1,…,5)に変換し、インパルス応答計算回路310
へ出力する。また、第2サブフレームの量子化LSPの
コードベクトルを表すインパルスをマルチプレクサ40
0に出力する。
【0028】上記において、直線補間のかわりに、LS
Pの補間パターンをあらかじめ定められたビット数(例
えば2ビット)分用意しておき、これらのパターンの各
々に対して1,2サブフレームのLSPを復元して累積
歪を最小化するコードベクトルと補間パターンの組を選
択するようにしてもよい。このようにすると補間パター
ンのビット数だけ伝送情報が増加するが、LSPのフレ
ーム内での時間的な変化をより精密に表すことができ
る。ここで、補間パターンは、トレーニング用のLSP
データを用いてあらかじめ学習して作成してもよいし、
あらかじめ定められたパターンを格納しておいてもよ
い。あらかじめ定められたパターンとしては、例えば、
T.Taniguchi et al.による“Imp
rovedCELP speech coding a
t 4kb/s and below”と題した論文
(Proc.ICSLP,pp.41−44,199
2)(文献8)等に記載のパターンを用いることができ
る。また、さらに性能を改善するためには、補間パター
ンを選択した後に、あらかじめ定められたサブフレーム
において、LSPの真の値とLSPの補間値との誤差信
号を求め、前記誤差信号をさらに誤差コードブックで表
すようにしてもよい。
【0029】聴感重み付け回路230は、スペクトルパ
ラメータ計算回路200から、各サブフレーム毎に量子
化前の線形予測係数αil(i=1,…,10,l=1,
…,5)を入力し、前記文献1にもとづき、サブフレー
ムの音声信号に対して聴感重み付けを行ない、聴感重み
付け信号を出力する。
【0030】提案型モード判別回路2000は、聴感重
み付け回路230からフレーム単位で聴感重み付け信号
を受け取り、スペクトルパラメータ計算回路200から
スペクトルパラメータを受け取り、モード判別情報を出
力する。提案型モード判別回路の構成を図2に示す。
【0031】図2において、入力端子2010からフレ
ーム単位に、聴感重み付け信号を入力し、入力端子20
20からスペクトルパラメータを入力する。特徴量計算
回路A2030では特徴量として、例えばピッチ予測ゲ
インPGを計算し出力する。特徴量計算回路B3040
では特徴量として、例えば短期予測ゲインSGを計算し
出力する。
【0032】モード判別回路2050では、遅延器20
60に格納されている過去の一つ前のフレームのモード
情報に応じて、2030の出力値PGと、2040の出
力値SGを、あらかじめ定められた複数個のしきいと比
較して、モード判別を行ない、モード情報を出力する。
モード判別回路2050は、モード判別結果を適応コー
ドブック回路500、音源量子化回路350へ出力す
る。
【0033】図1にもどり、応答信号計算回路240
は、スペクトルパラメータ計算回路200から、各サブ
フレーム毎に線形予測係数αilを入力し、スペクトルパ
ラメータ量子化回路210から、量子化、補間して復元
した線形予測係数α′ilをサブフレーム毎に入力し、保
存されているフィルタメモリの値を用いて、入力信号d
(n)=0とした応答信号を1サブフレーム分計算し、
減算器235へ出力する。ここで、応答信号xz (n)
は下式(1)で表される。
【0034】
【数1】
【0035】ここで、γは、聴感重み付け量を制御する
重み係数であり、下記の(3)式と同一の値である。
【0036】減算器235は、下式(2)により、聴感
重み付け信号から応答信号を1サブフレーム分減算し、
x′w (n)を適応コードブック回路300へ出力す
る。
【0037】 x′w (n)=xw (n)−xz (n) (2) インパルス応答計算回路310は、z変換が下式(3)
で表される重み付けフィルタのインパルス応答h
w (n)をあらかじめ定められた点数Lだけ計算し、適
応コードブック回路300、音源量子化回路350へ出
力する。
【0038】
【数2】
【0039】適応コードブック回路500は、ピッチパ
ラメータを求める。詳細は前記文献2を参照することが
できる。また、適応コードブックによりピッチ予測を下
式(4)に従い行ない、適応コードブック予測算差信号
z(n)を出力する。
【0040】 x(n)=x′w (n)−b(n) (4) ここで、b(n)は、適応コードブックピッチ予測信号
であり、下式(5)で表せる。
【0041】 b(n)=βv(n−T)*hw (n) (5) ここで、β、Tは、それぞれ、適応コードブックのゲイ
ン、遅延を示す。v(n)は適応コードベクトルであ
る。記号*は畳み込み演算を示す。
【0042】不均一パルス数型スパース音源コードブッ
ク351は、各々のベクトルの0でない成分の個数が異
なるスパースコードブックである。
【0043】音源量子化回路350では、音源コードブ
ック351に格納された音源コードベクトルの全部ある
いは一部に対して、式(6)を最小化するように、最良
の音源コードベクトルcj (n)を選択する。このと
き、最良のコードベクトルを1種選択してもよいし、2
種以上のコードベクトルを選んでおいて、ゲイン量子化
の際に、1種に本選択してもよい。ここでは、2種以上
のコードベクトルを選んでおくものとする。
【0044】 Dj =Σn (z(n)−γj j (n)hw (n))2 (6) なお、一部の音源コードベクトルに対してのみ、式
(6)を適用するときは、複数個の音源コードベクトル
をあらかじめ予備選択しておき、予備選択された音源コ
ードベクトルに対して、式(6)を適用することもでき
る。
【0045】ゲイン量子化回路365は、ゲインコード
ブック355からゲインコードベクトルを読みだし、選
択された音源コードベクトルに対して、式(7)を最小
化するように、音源コードベクトルとゲインコードベク
トルの組み合わせを選択する。
【0046】 Dj,k =Σn (xw (n)−β′k v(n−T)hw (n)−γ′k j ( n)hw (n))2 (7) ここで、β′k 、γ′k は、ゲインコードブック355
に格納された2次元ゲインコードブックにおけるk番目
のコードベクトルである。選択された音源コードベクト
ルとゲインコードベクトルを表すインデクスをマルチプ
レクサ400に出力する。
【0047】重み付け信号計算回路360は、スペクト
ルパラメータ計算回路の出力パラメータ及び、それぞれ
のインデクスを入力し、インデクスからそれに対応する
コードベクトルを読みだし、まず下式(8)にもとづく
駆動音源信号v(n)を求める。
【0048】 v(n)=β′k v(n−T)+γ′k j (n) (8) 次に、スペクトルパラメータ計算回路200の出力パラ
メータ、スペクトルパラメータ量子化回路210の出力
パラメータを用いて下式(9)により、重み付け信号s
w (n)をサブフレーム毎に計算し、応答信号計算回路
240へ出力する。
【0049】
【数3】
【0050】以上により、第4の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第1の発明の音声符号化装置”に関わる実施
例の説明を終える。
【0051】第4の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする
2の発明の音声符号化装置”に関わる実施例を図3に示
す。
【0052】ここでの発明では、第4の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第1の発明の音声符号化装置”に関わ
る実施例である図1の提案型モード判別回路2000と
本実施例の提案型モード判別回路の構成が異なるので、
本実施例の提案型モード判別回路の構成を図3を用いて
説明する。
【0053】提案型モード判別回路は、提案型モード判
別回路2000と同様に、聴感重み付け回路230から
フレーム単位で聴感重み付け信号とスペクトルパラメー
タ計算回路200よりスペクトルパラメータを受け取
り、モード判別情報を出力する。提案型モード判別回路
の構成を図3に示す。
【0054】図3において、入力端子3010からフレ
ーム単位に、聴感重み付け信号を入力し、入力端子30
20からスペクトルパラメータを入力する。
【0055】特徴量計算回路A3030では特徴量とし
て、例えばピッチ予測ゲインPGを計算し出力する。特
徴量計算回路B3040では特徴量として、例えばRM
S比RRを計算し出力する。特徴量計算回路C3050
では特徴量として、例えば短期予測ゲインSGと短期予
測ゲイン比SGRを計算し出力する。
【0056】モード判別回路3060では、遅延器30
70に格納された過去の一つ前のフレームのモード情報
に応じて、3030の出力値PGと、3040の出力値
RRと、3050の出力値SGとSGRを、あらかじめ
定められた複数個のしきいと比較して、モード判別を行
ない、モード情報を出力する。モード判別回路3060
は、提案型モード判別回路2000と同様に、モード判
別結果を適応コードブック回路500、音源量子化回路
350へ出力する。
【0057】特徴量計算回路B3040の構成を図4に
示す。図4において、入力端子4010からフレーム単
位に、聴感重み付け信号を入力し、RMS計算回路40
20でRMS値Rを計算し、この値と遅延器4030に
格納された過去のRMS値とを用いてRMS計算回路4
040でRMS比RRを計算し、これを出力端子405
0により出力する。ここで、RMS比RRはフレーム単
位に時間軸をとったときのRMSの変化率である。
【0058】特徴量計算回路C3050の構成を図5に
示す。図5において、入力端子5010からフレーム単
位に、聴感重み付け信号を入力し、入力端子5020か
らフレーム単位に、スペクトルパラメータを入力し、短
期予測ゲイン計算回路5030で短期予測ゲインSGを
計算し、この値を出力端子5070により出力する。ま
た、5030で計算された短期予測ゲインSGと遅延器
5040に格納された過去のフレームの短期予測ゲイン
とを用いて短期予測ゲイン比計算回路5050で短期予
測ゲイン比を計算し、これを出力端子5060により出
力する。
【0059】以上により、第4の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第2の発明の音声符号化装置”に関わる実施
例の説明を終える。
【0060】第4の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする
3の発明の音声符号化装置”に関わる実施例を図9に示
す。
【0061】ここでの発明では、第4の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第2の発明の音声符号化装置”に関わ
る実施例である図3の特徴量計算回路C3050と本実
施例の特徴量計算回路Cの構成が異なるので、本実施例
の特徴量計算回路Cの構成を図9を用いて説明する。
【0062】図9において、入力端子8010からフレ
ーム単位に、聴感重み付け信号を入力し、入力端子80
20からフレーム単位に、スペクトルパラメータを入力
し、短期予測ゲイン計算回路8030で短期予測ゲイン
SGを計算し、この値を出力端子8070により出力す
る。また、8030で計算された短期予測ゲインSGと
遅延器8050に格納された2つ前の過去のフレームの
短期予測ゲインとを用いて短期予測ゲイン比計算回路で
短期予測ゲイン比を計算し、これを出力端子8060に
より出力する。
【0063】以上により、第4の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第3の発明の音声符号化装置”に関わる実施
例の説明を終える。
【0064】第3の発明に関わる実施例を図10に示
す。
【0065】ここでの発明では、第4の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第2の発明の音声符号化装置”に関わ
る実施例である提案型モード判別回路と本実施例の提案
型モード判別回路の構成が異なるので、本実施例の提案
型モード判別回路の構成を図10を用いて説明する。
【0066】提案型モード判別回路は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号とスペク
トルパラメータ計算回路200よりスペクトルパラメー
タを受け取り、モード判別情報を出力する。提案型モー
ド判別回路の構成を図10に示す。
【0067】図10において、入力端子9010からフ
レーム単位に、聴感重み付け信号を入力し、入力端子9
020からスペクトルパラメータを入力する。
【0068】特徴量計算回路A9030では特徴量とし
て、例えばピッチ予測ゲインPGを計算し出力する。特
徴量計算回路B9040では特徴量として、例えばRM
S値RとRMS比RRを計算し出力する。特徴量計算回
路C9050では特徴量として、例えば短期予測ゲイン
SGと短期予測ゲイン比SGRを計算し出力する。
【0069】モード判別回路9060では、遅延器90
70に格納された過去の一つ前のフレームのモード情報
に応じて、9030の出力値PGと、9040の出力値
RとRRと、9050の出力値SGとSGRを、あらか
じめ定められた複数個のしきいと比較して、モード判別
を行ない、モード情報を出力する。モード判別回路90
60は、モード判別結果を適応コードブック回路50
0、音源量子化回路350へ出力する。
【0070】特徴量計算回路B9040の構成を図11
に示す。図11において、入力端子1010からフレー
ム単位に、聴感重み付け信号を入力し、RMS計算回路
11020でRMS値Rを計算し出力端子11060か
ら出力する。また、RMS計算回路11020の出力値
Rと遅延器21030に格納された過去の2つ前のフレ
ームのRMS値とを用いてRMS比計算回路11040
でRMS比RRを計算し、これを出力端子11050に
より出力する。
【0071】特徴量計算回路C9050は、第4の発明
の“前記特徴量として、ピッチ予測ゲイン、短期予測ゲ
イン、レベル、ピッチの少なくとも一種以上を特徴量と
して含めることを特徴とする第2の発明の音声符号化装
置”に関わる実施例の図3の特徴量計算回路C3050
と同じである。
【0072】以上により、第3の発明に関わる実施例の
説明を終える。
【0073】第2の発明に関わる実施例を図27に示
す。
【0074】ここでの発明では、第3の発明に関わる実
施例である図10の特徴量計算回路Bと本実施例の特徴
量計算回路Bの構成が異なるので、この構成を図27を
用いて説明する。
【0075】提案型モード判別回路は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号とスペク
トルパラメータ計算回路200よりスペクトルパラメー
タを受け取り、モード判別情報を出力する。提案型モー
ド判別回路の構成を図27に示す。
【0076】図27において、入力端子10010から
フレーム単位に、聴感重み付け信号を入力し、RMS計
算回路10020でRMS値Rを計算し出力端子100
60から出力する。また、RMS計算回路10020の
出力値Rと遅延器10030に格納された過去のフレー
ムのRMS値とを用いてRMS比計算回路10040で
RMS比RRを計算し、これを出力端子10050によ
り出力する。ここで、RMS比RRはフレーム単位に時
間軸をとったときのRMSの変化率である。
【0077】以上により、第2の発明に関わる実施例の
説明を終える。
【0078】第1の発明に関わる実施例を図12に示
す。
【0079】ここでの発明では、第4の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第2の発明の音声符号化装置”に関わ
る実施例である図3の提案型モード判別回路と本実施例
の提案型モード判別回路の構成が異なるので、提案型モ
ード判別回路の構成を図12を用いて説明する。
【0080】提案型モード判別回路は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号とスペク
トルパラメータ計算回路200よりスペクトルパラメー
タを受け取り、モード判別情報を出力する。
【0081】特徴量計算回路A12030では特徴量と
して、例えばピッチ予測ゲインPGを計算し出力する。
特徴量計算回路B12040では特徴量として、例えば
RMS値Rを計算し出力する。特徴量計算回路C120
50では特徴量として、例えば短期予測ゲインSGを計
算し出力する。
【0082】モード判別回路12060では、遅延器1
2070に格納された過去の一つ前のフレームのモード
情報に応じて、12030の出力値PGと、12040
の出力値Rと、12050の出力値SGを、あらかじめ
定められた複数個のしきいと比較して、モード判別を行
ない、モード情報を出力する。モード判別回路1206
0は、モード判別結果を適応コードブック回路500、
音源量子化回路350へ出力する。
【0083】以上により、第1の発明に関わる実施例の
説明を終える。
【0084】第8の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする
6の発明の音声符号化装置”に関わる実施例を図6に示
す。
【0085】ここでの発明では、第4の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第1の発明の音声符号化装置”に関わ
る実施例である図1の提案型モード判別回路2000と
適応コードブック回路500が、本実施例の提案型モー
ド判別回路4000と適応コードブック回路5000の
それぞれに対しその構成が異なるので、本実施例ではこ
れらと提案型ピッチ抽出回路6000の構成について図
6を用いて説明する。
【0086】モード判別回路4000は、聴感重み付け
回路230からフレーム単位で聴感重み付け信号を受取
り、ピッチ予測ゲインPGを計算し、これを、あらかじ
め定められた複数個のしきいと比較して、モード判別を
行ない、モード情報を出力する。モード判別回路400
0は、モード判別結果を適応コードブック回路5000
及び音源量子化回路350及び提案型ピッチ抽出回路6
000へ出力する。
【0087】提案型ピッチ抽出回路6000は、聴感重
み付け回路230からフレーム単位で聴感重み付け信号
とモード判別回路4000よりモード判別情報と提案型
ピッチ抽出回路6000の出力値を受け取り、適応コー
ドブック回路5000と提案型ピッチ抽出回路6000
に抽出したピッチCPを出力する。
【0088】提案型ピッチ抽出回路6000の構成を図
7に示す。
【0089】図7において、入力端子6010からモー
ド判別情報を入力し、入力端子6020から聴感重み付
け信号を入力し、入力端子6070からピッチを入力す
る。
【0090】特徴量D計算回路6040では特徴量とし
て、例えば現フレームのピッチCP、過去のフレームの
ピッチPP、ピッチ比DRを計算し出力する。ここで、
ピッチ比DRはフレーム単位に時間軸をとったときのピ
ッチの変化率である。
【0091】特徴量D補正計算回路6050では、入力
端子6010からの現在のモード情報と、遅延器603
0に格納された過去の一つ前のフレームのモード情報に
応じて、6040の出力値ピッチ比DRをあらかじめ定
められた閾値と比較して、現フレームのピッチCPを過
去のフレームのピッチPPで補正した値CPPを出力す
る。
【0092】特徴量D計算回路6040の構成を図8に
示す。図8において、入力端子7010からフレーム単
位に、聴感重み付け信号入力端子7080からピッチを
入力し、ピッチ計算回路7020でピッチCPを計算
し、出力端子7070で出力する。また、7020で計
算されたピッチCPと遅延器7030に格納された過去
のフレームのピッチPPとを用いてピッチ比計算回路7
040でピッチ比DRを計算し、これを出力端子706
0により出力する。また、遅延器7030に格納された
過去のフレームのピッチPPも出力端子7050より出
力される。
【0093】適応コードブック回路5000は、第1の
発明の適応コードブック回路500と基本的に同じであ
るが、過去の信号からのピッチの探索範囲を、提案型ピ
ッチ抽出回路6000により得られたピッチCPPの近
傍とすることを特徴とする。
【0094】以上により、第8の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第6の発明の音声符号化装置”に関わる実施
例の説明を終える。
【0095】第8の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする
5の発明の音声符号化装置”に関わる実施例を図13に
示す。
【0096】ここでの発明では、第8の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第6の発明の音声符号化装置”に関わ
る実施例である図7のピッチ抽出回路と本実施例のピッ
チ抽出回路の構成が異なるので、これについて図13を
用いて説明する。
【0097】提案型ピッチ抽出回路は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号とモード
判別回路4000よりモード判別情報を受け取り、適応
コードブック回路5000に抽出したピッチCPPを出
力する。
【0098】提案型ピッチ抽出回路の構成を図13に示
す。
【0099】図13において、入力端子13010から
モード判別情報を入力し、入力端子13020から聴感
重み付け信号を入力する。
【0100】特徴量D計算回路13040では特徴量と
して、例えば現フレームのピッチCPを計算し出力す
る。
【0101】特徴量D補正計算回路13050では、入
力端子13010からの現在のモード情報と、遅延器1
3030に格納された過去の一つ前のフレームのモード
情報に応じて、現フレームのピッチCPを補正した値C
PPを出力する。
【0102】以上により、第8の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第5の発明の音声符号化装置”に関わる実施
例の説明を終える。
【0103】第8の発明の“前記特徴量として、ピッチ
予測ゲイン、短期予測ゲイン、レベル、ピッチの少なく
とも一種以上を特徴量として含めることを特徴とする
7の発明の音声符号化装置”に関わる実施例を図14に
示す。
【0104】ここでの発明では、第8の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第6の発明の音声符号化装置、に関わ
る実施例である図7の特徴量D計算回路6040と本実
施例の特徴量D計算回路の構成が異なるので、これにつ
いて図14を用いて説明する。
【0105】特徴量D計算回路の構成を図14に示す。
図14において、入力端子14010からフレーム単位
に、聴感重み付け信号を入力し、ピッチ計算回路140
20でピッチCPを計算し、出力端子14070で出力
する。また、14020で計算されたピッチCPと遅延
器14030に格納された2つ前の過去のフレームのピ
ッチPPPとを用いてピッチ比計算回路14040でピ
ッチ比DRを計算し、これを出力端子14060により
出力する。また、遅延器14030に格納された過去の
フレームのピッチPPも出力端子14050より出力さ
れる。
【0106】以上により、第8の発明の“前記特徴量と
して、ピッチ予測ゲイン、短期予測ゲイン、レベル、ピ
ッチの少なくとも一種以上を特徴量として含めることを
特徴とする第7の発明の音声符号化装置”に関わる実施
例の説明を終える。
【0107】第7の発明に関わる実施例を図15に示
す。
【0108】ここでの発明では、第8の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として求める
ことを特徴とする第7の発明の音声符号化装置”に関わ
る実施例である図7のピッチ抽出回路が、本実施例の提
案型ピッチ抽出回路に対しその構成が異なるので、本実
施例ではこれらの構成について図15を用いて説明す
る。
【0109】提案型ピッチ抽出回路は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号とモード
判別回路4000よりモード判別情報と提案型ピッチ抽
出回路からピッチを受け取り、適応コードブック回路5
000と提案型ピッチ抽出回路に抽出したピッチCPを
出力する。
【0110】提案型ピッチ抽出回路の構成を図15に示
す。
【0111】図15において、入力端子15010から
モード判別情報を入力し、入力端子15020から聴感
重み付け信号を入力する。
【0112】特徴量D計算回路15040では特徴量と
して、例えば現フレームのピッチCP、ピッチ比DRを
計算し出力する。
【0113】特徴量D補正計算回路15050では、入
力端子15010からの現在のモード情報と、遅延器1
5030に格納された過去の一つ前のフレームのモード
情報に応じて、15040の出力値ピッチ比DRをあら
かじめ定められた閾値と比較して、現フレームのピッチ
CPをピッチ比DRで補正した値CPPを出力する。
【0114】特徴量D計算回路15040の構成を図1
6に示す。図16において、入力端子16010からフ
レーム単位に、聴感重み付け信号を入力し、ピッチ計算
回路16020でピッチCPを計算し、出力端子160
70で出力する。また、16020で計算されたピッチ
CPと遅延器26030に格納された2つ前の過去のフ
レームのピッチPPとを用いてピッチ比計算回路160
40でピッチ比DRを計算し、これを出力端子1606
0により出力する。
【0115】以上により、第7の発明に関わる実施例の
説明を終える。
【0116】第6の発明に関わる実施例を図17に示
す。
【0117】ここでの発明では、第7の発明に関わる実
施例である図15の特徴量D計算回路15040が、本
実施例の提案型ピッチ抽出回路に対しその構成が異なる
ので、本実施例ではこれらの構成について図17を用い
て説明する。
【0118】特徴量D抽出計算回路の構成を図17に示
す。図17において、入力端子17010からフレーム
単位に、聴感重み付け信号と入力端子17080からピ
ッチを入力し、ピッチ計算回路17020でピッチCP
を計算し、出力端子17070で出力する。また、17
020で計算されたピッチCPと遅延器17030に格
納された過去のフレームのピッチPPとを用いてピッチ
比計算回路17040でピッチ比DRを計算し、これを
出力端子17060により出力する。
【0119】以上により、第6の発明に関わる実施例の
説明を終える。
【0120】第5の発明に関わる実施例を図18に示
す。
【0121】ここでの発明では、第8の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第6の発明の音声符号化装置”に関わ
る実施例である図6の提案型ピッチ抽出回路6000と
本実施例の提案型ピッチ抽出回路が異なるため、この構
成についてのみ図18を用いて説明する。
【0122】提案型ピッチ抽出回路は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号とモード
判別回路4000よりモード判別情報と提案型ピッチ抽
出回路よりピッチを受け取り、適応コードブック回路6
000と提案型ピッチ抽出回路に抽出したピッチCPを
出力する。
【0123】提案型ピッチ抽出回路の構成を図18に示
す。
【0124】図18において、入力端子18010から
モード判別情報を入力し、入力端子18020から聴感
重み付け信号を入力し、入力端子18070よりピッチ
を入力する。
【0125】特徴量D計算回路18040では特徴量と
して、例えば現フレームのピッチCP、過去のフレーム
のピッチPPを出力する。
【0126】特徴量D補正計算回路18050では、入
力端子18010からの現在のモード情報と、遅延器1
8030に格納された過去の一つ前のフレームのモード
情報に応じて、18040の出力値過去のフレームのピ
ッチPPをあらかじめ定められた閾値と比較して、現フ
レームのピッチCPを過去のフレームのピッチPPで補
正した値CPPを出力する。
【0127】特徴量D計算回路18040の構成を図1
9に示す。図19において、入力端子19010からフ
レーム単位に、聴感重み付け信号を入力し、ピッチ計算
回路19020でピッチCPを計算し、出力端子190
70で出力する。また、19020で計算されたピッチ
CPと遅延器19030に格納された過去のフレームの
ピッチPPを出力端子19060により出力する。
【0128】第5の発明に関わる実施例の説明を終え
る。
【0129】第9の発明に関わる実施例を図20に示
す。
【0130】ここでの発明では、第4の発明の“前記特
徴量として、ピッチ予測ゲイン、短期予測ゲイン、レベ
ル、ピッチの少なくとも一種以上を特徴量として含める
ことを特徴とする第1の発明の音声符号化装置”に関わ
る実施例である図1の提案型モード判別回路2000
が、本実施例の提案型モード判別回路20000に対し
その構成が異なるので、本実施例ではこれと提案型RM
S抽出回路30000の構成について図20を用いて説
明する。
【0131】モード判別回路20000は、聴感重み付
け回路230からフレーム単位で聴感重み付け信号を受
け取り、ピッチ予測ゲインPGを計算し、これを、あら
かじめ定められた複数のしきいと比較して、モード判別
を行ない、モード情報を出力する。モード判別回路20
000は、モード判別結果を適応コードブック回路50
0、提案型RMS抽出回路30000及び音源量子化回
路350へ出力する。
【0132】提案型RMS抽出回路30000は、フレ
ーム分割回路110からフレーム単位で音声信号とモー
ド判別回路20000よりモード判別情報とRMSコー
ドブック40000より、幾つかのRMSコードベクト
ルを受け取り、一つのRMSコードベクトルを出力す
る。
【0133】提案型RMS抽出回路30000の構成を
図21に示す。
【0134】図21において、入力端子31010から
モード判別情報を、入力端子31020からフレーム単
位での音声信号を、入力端子31080からRMSコー
ドベクトル信号入力する。
【0135】RMS計算回路31040ではフレーム単
位でのRMS値Rを計算する。
【0136】RMS補正計算回路31050では、入力
端子31010からの現在のモード情報と、遅延器31
030に格納された過去の一つ前のフレームのモード情
報に応じて、31040の出力値Rをあらかじめ定めら
れた閾値と比較して、現フレームのRMS値を補正した
値IRを出力する。
【0137】RMS量子化ベクトル選択回路31060
では、RMSコードブック40000の予め格納された
コードベクトルの中から、RMS補正計算回路3105
0の出力値IRに近いベクトルを選択し、これを出力す
る。
【0138】以上により、第9の発明に関わる実施例の
説明を終える。
【0139】第12の発明の“前記特徴量として、ピッ
チ予測ゲイン、短期予測ゲイン、レベル、ピッチの少な
くとも一種以上を特徴量として含めることを特徴とする
第9の発明の音声符号化装置”に関わる実施例を図22
に示す。
【0140】ここでの発明では、第9の発明に関わる実
施例である図20の提案型RMS抽出回路30000
が、本実施例の提案型RMS抽出回路に対しその構成が
異なるので、本実施例ではこの構成について図22を用
いて説明する。
【0141】図22において、入力端子32010から
モード判別情報を、入力端子32020からフレーム単
位での音声信号を、入力端子32080からRMSコー
ドベクトル信号入力する。
【0142】RMS計算回路32040ではフレーム単
位でのRMS値Rを計算する。
【0143】RMS補正計算回路32050では、入力
端子32010からの現在のモード情報と、遅延器32
030に格納された過去の一つ前のフレームのモード情
報と、遅延器32090に格納された過去のフレームの
RMS値に応じて、32040の出力値Rをあらかじめ
定められた閾値と比較して、現フレームのRMS値を補
正した値IRを出力する。
【0144】RMS量子化ベクトル選択回路32060
では、RMSコードブック40000の予め格納された
コードベクトルの中から、RMS補正計算回路3205
0の出力値IRに近いベクトルを選択し、これを出力す
る。
【0145】以上により、第12の発明の“前記特徴量
として、ピッチ予測ゲイン、短期予測ゲイン、レベル、
ピッチの少なくとも一種以上を特徴量として含めること
を特徴とする第9の発明の音声符号化装置”に関わる実
施例の説明を終える。
【0146】第10の発明に関わる実施例を図23に示
す。
【0147】ここでの発明では、第9の発明に関わる実
施例である図20の提案型RMS抽出回路が、本実施例
の提案型RMS抽出回路に対しその構成が異なるので、
本実施例ではこれの構成について図23を用いて説明す
る。
【0148】図23において、入力端子33010から
モード判別情報を、入力端子33020からフレーム単
位での音声信号を、入力端子33080からRMSコー
ドベクトル信号入力する。
【0149】RMS計算回路33040ではフレーム単
位でのRMS値Rを計算する。
【0150】RMS補正計算回路33050では、入力
端子33010からの現在のモード情報と、遅延器33
030に格納された過去の一つ前のフレームのモード情
報と、RMS計算回路43090に格納されたRMS比
RRに応じて、33040の出力値Rをあらかじめ定め
られた閾値と比較して、現フレームのRMS値を補正し
た値IRを出力する。
【0151】RMS比計算回路43090では、RMS
計算回路33040の出力値Rと遅延器33090に格
納された過去のフレームのRMS値との比を計算し、こ
れを出力する。
【0152】RMS量子化ベクトル選択回路33060
では、RMSコードブック40000の予め格納された
コードベクトルの中から、RMS補正計算回路3305
0の出力値IRに近いベクトルを選択し、これを出力す
る。
【0153】以上により、第10の発明に関わる実施例
の説明を終える。
【0154】第12の発明の“前記特徴量として、ピッ
チ予測ゲイン、短期予測ゲイン、レベル、ピッチの少な
くとも一種以上を特徴量として含めることを特徴とする
第10の発明の音声符号化装置”に関わる実施例を図2
4に示す。
【0155】ここでの発明では、第10の発明に関わる
実施例である図24の提案型RMS抽出回路が、本実施
例の提案型RMS抽出回路に対しその構成が異なるの
で、本実施例ではこの構成について図24を用いて説明
する。
【0156】図24において、入力端子34010から
モード判別情報を、入力端子34020からフレーム単
位での音声信号を、入力端子34080からRMSコー
ドベクトル信号入力する。
【0157】RMS計算回路34040ではフレーム単
位でのRMS値Rを計算する。
【0158】RMS補正計算回路34050では、入力
端子34010からの現在のモード情報と、遅延器34
030に格納された過去の一つ前のフレームのモード情
報と、RMS比計算回路44090に格納されたRMS
比RRに応じて、34040の出力値Rをあらかじめ定
められた閾値と比較して、現フレームのRMS値を遅延
器34090に格納された過去のフレームのRMS値で
補正した値IRを出力する。
【0159】RMS比計算回路34090では、RMS
計算回路34040の出力値Rと遅延器34090に格
納された過去のフレームのRMS値との比を計算し、こ
れを出力する。
【0160】RMS量子化ベクトル選択回路34060
では、RMSコードブック40000の予め格納された
コードベクトルの中から、RMS補正計算回路3405
0の出力値IRに近いベクトルを選択し、これを出力す
る。
【0161】以上により、第12の発明の“前記特徴量
として、ピッチ予測ゲイン、短期予測ゲイン、レベル、
ピッチの少なくとも一種以上を特徴量として含めること
を特徴とする第10の発明の音声符号化装置”に関わる
実施例の説明を終える。
【0162】第11の発明に関わる実施例を図25に示
す。
【0163】ここでの発明では、第11の発明に関わる
実施例である図24の提案型RMS抽出回路が、本実施
例の提案型RMS抽出回路に対しその構成が異なるの
で、本実施例ではこれの構成について図25を用いて説
明する。
【0164】図25において、入力端子35010から
モード判別情報を、入力端子35020からフレーム単
位での音声信号を、入力端子35080からRMSコー
ドベクトル信号入力する。
【0165】RMS計算回路35040ではフレーム単
位でのRMS値Rを計算する。
【0166】RMS補正計算回路35050では、入力
端子35010からの現在のモード情報と、遅延器35
030に格納された過去の一つ前のフレームのモード情
報と、RMS比計算回路45090に格納されたRMS
比RRに応じて、35040の出力値Rをあらかじめ定
められた閾値と比較して、現フレームのRMS値を補正
した値IRを出力する。
【0167】RMS比計算回路45090では、RMS
計算回路35040の出力値Rと遅延器55090に格
納された過去の2つ前のフレームのRMS値との比を計
算し、これを出力する。
【0168】RMS量子化ベクトル選択回路35060
では、RMSコードブック40000の予め格納された
コードベクトルの中から、RMS補正計算回路3505
0の出力値IRに近いベクトルを選択し、これを出力す
る。
【0169】以上により、第11の発明に関わる実施例
の説明を終える。
【0170】第12の発明の“前記特徴量として、ピッ
チ予測ゲイン、短期予測ゲイン、レベル、ピッチの少な
くとも一種以上を特徴量として含めることを特徴とする
第11の発明の音声符号化装置”に関わる実施例を図2
6に示す。
【0171】ここでの発明では、第11の発明に関わる
実施例である図25の提案型RMS抽出回路が、本実施
例の提案型RMS抽出回路に対しその構成が異なるの
で、本実施例ではこの構成について図26を用いて説明
する。
【0172】図26において、入力端子36010から
モード判別情報を、入力端子36020からフレーム単
位での音声信号を、入力端子36080からRMSコー
ドベクトル信号入力する。
【0173】RMS計算回路36040ではフレーム単
位でのRMS値Rを計算する。
【0174】RMS補正計算回路36050では、入力
端子36010からの現在のモード情報と、遅延器36
030に格納された過去の一つ前のフレームのモード情
報と、RMS比計算回路46090に格納されたRMS
比RRに応じて、36040の出力値Rをあらかじめ定
められた閾値と比較して、現フレームのRMS値を遅延
器36090に格納された過去の1つ前のフレームのR
MS値で補正した値IRを出力する。
【0175】RMS比較計算回路46090では、RM
S計算回路36040の出力値Rと遅延器56090に
格納された過去の2つ前のフレームのRMS値との比を
計算し、これを出力する。
【0176】RMS量子化ベクトル選択回路36060
では、RMSコードブック40000の予め格納された
コードベクトルの中から、RMS補正計算回路3605
0の出力値IRに近いベクトルを選択し、これを出力す
る。
【0177】以上により、第12の発明の”前記特徴量
として、ピッチ予測ゲイン、短期予測ゲイン、レベル、
ピッチの少なくとも一種以上を特徴量として含めること
を特徴とする第11の発明の音声符号化装置に関わる実
施例の説明を終える。
【0178】
【発明の効果】以上説明したように、本発明によれば、
音声符号化装置において、低遅延とするために、フレー
ム長を5ms−10ms以下と短くしても、モード判別
あるいはピッチ抽出、レベル抽出の時間的変動による音
質劣化を起こすことなく、良好な音質を得ることが可能
となりこの利点は極めて大きなものである。
【図面の簡単な説明】
【図1】本発明の一実施例の構成図。
【図2】提案型モード判別回路の構成図。
【図3】提案型モード判別回路の構成図。
【図4】特徴量計算回路Bの構成図。
【図5】特徴量計算回路Cの構成図。
【図6】本発明の一実施例の構成図。
【図7】提案型ピッチ抽出回路の構成図。
【図8】特徴量D抽出計算回路の構成図。
【図9】特徴量計算回路Cの構成図。
【図10】提案型モード判別回路の構成図。
【図11】特徴量計算回路Bの構成図。
【図12】提案型モード判別回路の構成図。
【図13】ピッチ抽出回路の構成図。
【図14】特徴量D計算回路の構成図。
【図15】ピッチ抽出回路の構成図。
【図16】特徴量D抽出計算回路の構成図。
【図17】提案型ピッチ抽出回路の構成図。
【図18】提案型ピッチ抽出回路の構成図。
【図19】特徴量D抽出計算回路の構成図。
【図20】本発明の一実施例の構成図。
【図21】提案型RMS抽出回路の構成図。
【図22】提案型RMS抽出回路の構成図。
【図23】提案型RMS抽出回路の構成図。
【図24】提案型RMS抽出回路の構成図。
【図25】提案型RMS抽出回路の構成図。
【図26】提案型RMS抽出回路の構成図。
【図27】特徴量計算回路Bの構成図。
【符号の説明】
110 フレーム分割回路 120 サブフレーム分割回路 200 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 211 LSPコードブック 230 重み付け回路 235 減算回路 240 応答信号計算回路 310 インパルス応答計算回路 350 音源量子化回路 351 不均一パルス数型スパース音源コードブック 355 ゲインコードブック 360 重み付け信号計算回路 365 ゲイン量子化回路 400 マルチプレクサ 500、550 適応コードブック回路 2000 提案型モード判別回路 2010 フレーム単位の入力端子 2020 スペクトルパラメータの入力端子 2030 フレーム単位の特徴量計算回路 2040 特徴量計算回路B 2050 モード判別回路 2060 モード情報格納遅延器 2070 モード情報出力端子 3030 特徴量計算回路A 3040 特徴量計算回路B 3050 特徴量計算回路C 3060 モード判別回路 3070 遅延器 4000 モード判別回路 4020 RMS計算回路 4030 遅延器 4040 RMS比計算回路 5000 適応コードブック回路 5030 短期予測ゲイン計算回路 5040 遅延器 5050 短期予測ゲイン比計算回路 6000 提案型ピッチ抽出回路 6030 遅延器 6040 特徴量D計算回路 6050 特徴量D補正計算回路 7020 ピッチ計算回路 7030 遅延器 7040 ピッチ比計算回路 8030 短期予測ゲイン計算回路 8040 遅延器 8050 遅延器 8080 短期予測ゲイン比計算回路 9030 特徴量計算回路A 9040 特徴量計算回路B 9050 特徴量計算回路C 9060 モード判別回路 9070 遅延器 10020 RMS計算回路 10030 遅延器 10040 RMS比計算回路 11020 RMS計算回路 11030 遅延器 11040 RMS比計算回路 12030 特徴量計算回路A 12040 特徴量計算回路B 12050 特徴量計算回路C 12060 モード判別回路 12070 遅延器 13030 遅延器 13040 特徴量D計算回路 13050 特徴量D補正計算回路 14020 ピッチ計算回路 14030 遅延器 14040 ピッチ比計算回路 15030 遅延器 15040 特徴量D計算回路 15050 特徴量D抽出計算回路 16020 ピッチ計算回路 16030 遅延器 16040 ピッチ計算回路 17020 ピッチ計算回路 17030 遅延器 17040 ピッチ比計算回路 18030 遅延器 18040 特徴量D計算回路 18050 特徴量D抽出計算回路 19020 ピッチ計算回路 19030 遅延器 20000 提案型モード判別回路 21030 遅延器 24030 遅延器 26030 遅延器 30000 提案型RMS抽出回路 31030 遅延器 31040 RMS計算回路 31050 RMS補正計算回路 31060 RMS量子化ベクトル選択回路 32030 遅延器 32040 RMS計算回路 32050 RMS補正計算回路 32060 RMS量子化ベクトル選択回路 32090 遅延器 33030 遅延器 33040 RMS計算回路 33050 RMS補正計算回路 33060 RMS量子化ベクトル選択回路 33090 遅延器 34030 遅延器 34040 RMS計算回路 34050 RMS補正計算回路 34060 RMS量子化ベクトル選択回路 34090 遅延器 35030 遅延器 35040 RMS計算回路 35050 RMS補正計算回路 35060 RMS量子化ベクトル選択回路 35090 遅延器 36030 遅延器 36040 RMS計算回路 36050 RMS補正計算回路 36060 RMS量子化ベクトル選択回路 36090 遅延器 40000 RMSコードブック 43090 RMS比計算回路 44090 RMS比計算回路 45090 RMS比計算回路 46090 RMS比計算回路 55090 遅延器 56090 遅延器
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/08 G10L 11/04 G10L 13/00 G10L 19/04

Claims (8)

    (57)【特許請求の範囲】
  1. 【請求項1】音声信号をあらかじめ定められたフレーム
    単位に区切るフレーム分割部と、 前記音声信号から信号の短時間的な性質を表す特徴量を
    計算しモード判別を行うモード判別部と、前記音声信号
    からピッチを抽出するピッチ抽出部と、前記ピッチ抽出
    部の出力を用い適応コードブックによりピッチ予測を行
    い、ピッチ予測信号を前期音声信号から減算し、減算後
    の信号から音源信号を求めて符号化する際に、前記判別
    結果に応じて前記適応コードブックの動作や音源信号符
    号化の動作を切り替える符号化部を有する音声符号化装
    置において、前記ピッチ抽出部は、 現フレーム及び過去の少なくとも
    一つのフレームからそれぞれ求めたピッチを含む少なく
    とも1種類以上の特徴量と、過去の少なくとも一つのフ
    レームから求めたモード判別情報を用いて、時間連続性
    を考慮しながら現フレームのピッチを補正することを特
    徴とする音声符号化装置。
  2. 【請求項2】前記特徴量として、少なくとも1種類以上
    の特徴量の時間変化比を特徴量として含めた請求項1記
    載の音声符号化装置。
  3. 【請求項3】前記特徴量として、現フレーム又は過去の
    少なくとも一つ以上のフレームのいずれかの2フレーム
    分のそれぞれの特徴量に対し、前記二つの特徴量の比を
    特徴量として含めた請求項1記載の音声符号化装置。
  4. 【請求項4】前記特徴量として、ピッチ予測ゲイン、短
    期予測ゲイン、レベル、ピッチの少なくとも一種以上を
    特徴量として含めることを特徴とする請求項1、2、ま
    たは3記載の音声符号化装置。
  5. 【請求項5】音声信号をあらかじめ定められたフレーム
    単位に区切るフレーム分割部と、前記音声信号から信号
    の短時間的な性質を表す特徴量を計算しモード判別を行
    うモード判別部と、前記音声信号から信号の短時間的な
    レベルを抽出するレベル抽出部と、前記音声信号からピ
    ッチを抽出するピッチ抽出部と、前記ピッチ抽出部の
    力を用い適応コードブックによりピッチ予測を行い、ピ
    ッチ予測信号を前期音声信号から減算し、減算後の信号
    から音源信号を求めて符号化する際に、前記判別結果に
    応じて前記適応コードブックの動作や音源信号符号化の
    動作を切りかえる符号化部を有する音声符号化装置にお
    いて、前記レベル抽出部は、 現フレーム及び過去の少なくとも
    一つのフレームからそれぞれ求めたレベルを含む少なく
    とも1種類以上の特徴量と、過去の少なくとも一つのフ
    レームから求めたモード判別情報を用いて、時間連続性
    を考慮しながら現フレームのレベルを補正することを特
    徴とする音声符号化装置。
  6. 【請求項6】前記特徴量として、少なくとも1種類以上
    の特徴量の時間変化比を特徴量として含めた請求項5記
    載の音声符号化装置。
  7. 【請求項7】前記特徴量として、現フレーム又は過去の
    少なくとも一つ以上のフレームのいずれかの2フレーム
    分のそれぞれの特徴量に対し、前記二つの特徴量の比を
    特徴量として含めた請求項5記載の音声符号化装置。
  8. 【請求項8】前記特徴量として、ピッチ予測ゲイン、短
    期予測ゲイン、レベル、ピッチの少なくとも一種以上を
    特徴量として含めることを特徴とする請求項5、6、ま
    たは7記載の音声符号化装置。
JP7013072A 1995-01-17 1995-01-30 音声符号化装置 Expired - Fee Related JP3047761B2 (ja)

Priority Applications (9)

Application Number Priority Date Filing Date Title
JP7013072A JP3047761B2 (ja) 1995-01-30 1995-01-30 音声符号化装置
DE69609089T DE69609089T2 (de) 1995-01-17 1996-01-16 Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen
EP99111363A EP0944038B1 (en) 1995-01-17 1996-01-16 Speech encoder with features extracted from current and previous frames
EP99109387A EP0944037B1 (en) 1995-01-17 1996-01-16 Speech encoder with features extracted from current and previous frames
DE69615227T DE69615227T2 (de) 1995-01-17 1996-01-16 Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen
DE69615870T DE69615870T2 (de) 1995-01-17 1996-01-16 Sprachkodierer mit aus aktuellen und vorhergehenden Rahmen extrahierten Merkmalen
EP96100544A EP0723258B1 (en) 1995-01-17 1996-01-16 Speech encoder with features extracted from current and previous frames
US08/588,005 US5787389A (en) 1995-01-17 1996-01-17 Speech encoder with features extracted from current and previous frames
CA002167552A CA2167552C (en) 1995-01-30 1996-01-18 Speech encoder with features extracted from current and previous frames

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7013072A JP3047761B2 (ja) 1995-01-30 1995-01-30 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH08202398A JPH08202398A (ja) 1996-08-09
JP3047761B2 true JP3047761B2 (ja) 2000-06-05

Family

ID=11822957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7013072A Expired - Fee Related JP3047761B2 (ja) 1995-01-17 1995-01-30 音声符号化装置

Country Status (2)

Country Link
JP (1) JP3047761B2 (ja)
CA (1) CA2167552C (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6202046B1 (en) 1997-01-23 2001-03-13 Kabushiki Kaisha Toshiba Background noise/speech classification method
DE60043601D1 (de) 1999-08-23 2010-02-04 Panasonic Corp Sprachenkodierer
US7478042B2 (en) 2000-11-30 2009-01-13 Panasonic Corporation Speech decoder that detects stationary noise signal regions

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3353852B2 (ja) * 1994-02-15 2002-12-03 日本電信電話株式会社 音声の符号化方法

Also Published As

Publication number Publication date
CA2167552C (en) 2001-01-02
CA2167552A1 (en) 1996-07-31
JPH08202398A (ja) 1996-08-09

Similar Documents

Publication Publication Date Title
JP3094908B2 (ja) 音声符号化装置
JP2746039B2 (ja) 音声符号化方式
JP3196595B2 (ja) 音声符号化装置
JPH0353300A (ja) 音声符号化装置
EP1005022B1 (en) Speech encoding method and speech encoding system
JP3266178B2 (ja) 音声符号化装置
KR100561018B1 (ko) 음성 부호화 장치와 방법, 및 음성 복호화 장치와 방법
JP3616432B2 (ja) 音声符号化装置
JPH09319398A (ja) 信号符号化装置
JP3047761B2 (ja) 音声符号化装置
JP3089967B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3144284B2 (ja) 音声符号化装置
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3192051B2 (ja) 音声符号化装置
JP2907019B2 (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JPH08320700A (ja) 音声符号化装置
JP3144244B2 (ja) 音声符号化装置
JPH09319399A (ja) 音声符号化装置
JPH05341800A (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080324

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090324

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090324

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100324

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees