JPH09179593A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH09179593A
JPH09179593A JP7339492A JP33949295A JPH09179593A JP H09179593 A JPH09179593 A JP H09179593A JP 7339492 A JP7339492 A JP 7339492A JP 33949295 A JP33949295 A JP 33949295A JP H09179593 A JPH09179593 A JP H09179593A
Authority
JP
Japan
Prior art keywords
codebook
signal
sound source
spectrum parameter
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7339492A
Other languages
English (en)
Other versions
JP3299099B2 (ja
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP33949295A priority Critical patent/JP3299099B2/ja
Publication of JPH09179593A publication Critical patent/JPH09179593A/ja
Application granted granted Critical
Publication of JP3299099B2 publication Critical patent/JP3299099B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】探索演算量とメモリ量とを減少させても音質の
劣化の少ない音声符号化装置を提供すること。 【解決手段】音源量子化部12が、音源コードブック1
3を探索するときに、音源コードブック13に格納され
たコードベクトルの少なくとも一つについて位置をシフ
トさせながら探索する。音源コードブック全体の伝送す
べきインデクスをBビット、シフト量をAビットとする
と、音源コードブック13は、(B−A)ビットのサイ
ズである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声符号化装置に関
し、特に音声信号を比較的少ない演算量およびメモリ量
で高品質に符号化する音声符号化装置に関する。
【0002】
【従来の技術】音声符号化装置は、音声復号化装置と対
向して使用され、音声符号化装置で符号化した音声を音
声復号化装置が復号するものである。ここで、音声信号
を高能率に符号化する方法としては、例えば、エム・シ
ュレーダー(M.Schroeder )とビー・アタル(B.Atal)
等がアイイーイーイー・プロシーディングス(IEEE Pro
c.)ICASSP-85,1985年、937〜940頁にコード・エ
キサイテド・リニア・プリディクション:ハイ・クオリ
ティ・スピーチ・アット・ベリー・ロウ・ビット・レイ
ツ(Code-excited linear prediction: High quality s
peech at very lowbit rates )と題して発表した論文
(文献1)や、クレイジン(Kleijn)等によるアイイー
イーイー・プロシーディングス(IEEE Proc.)ICASSP-88,
1988年、155〜158頁にインプルーブド・スピーチ
・クオリティ・アンド・エフィシェント・ベクトル・ク
オンタイゼイション・イン・エスイーエルピー(Improve
d speech quality and efficient vector quantization
in SELP) と題して発表した論文(文献2)等に記載さ
れているCELP(Code Excited Linear Prediction Co
ding) が知られている。この方法では、送信側では、フ
レーム毎(例えば20ms)に音声信号から線形予測(LP
C)分析を用いて、音声信号のスペクトル特性を表すス
ペクトルパラメータを抽出し、フレームをさらに複数の
サブフレーム(例えば5ms)に分割し、サブフレーム毎に
過去の音源信号をもとに適応コードブックにおけるパラ
メータ(ピッチ周期に対応する遅延パラメータとゲイン
パラメータ)を抽出し、適応コードブックにより該当の
サブフレームの音声信号をピッチ予測し、ピッチ予測し
て求めた残差信号に対して、音源量子化部では、予め定
められた種類の雑音信号からなる音源コードブック(ベ
クトル量子化コードブック)を格納しており、このコー
ドブックから最適音源コードベクトルを選択し、最適な
ゲインを計算することにより、音源信号を量子化する。
音源コードベクトルの選択の仕方は、選択した雑音信号
により合成した信号と、前述の残差信号との誤差電力を
最小化するように行う。そして選択されたコードベクト
ルの種類を表すインデックスとゲインならびに、スペク
トルパラメータと適応コードブックのパラメータとをマ
ルチプレクサ部により組み合わせて伝送する。受信側の
説明は省略する。
【0003】
【発明が解決しようとする課題】上述した従来の音声符
号化装置は、良好な音質を得るためには、ビットレート
が8kb/s以上必要であった。これは音源コードブックの
ビット数としては、例えば5msサブフレーム当たり10
ビット以上の大規模なコードブックを必要としていた。
このため、音源コードブックの探索や、格納に、多くの
演算量や、多くのメモリ量を必要とするといえ問題点が
あった。例えば、5msサブフレームで10ビットのコー
ドブックを考えると、最も単純な2乗距離で探索して
も、1秒当たり1024x40x200=8,192,000回の乗算回数を
必要とし、また、メモリ量は1024x40=40,240ワードを必
要とした。一方、演算量やメモリ量を下げるために、ビ
ット数を低減化すると、音質が劣化することになるとい
う問題点も発生することになった。
【0004】上述した従来の音声符号化装置で、良好な
符号化音質を得るためにビット数の大きなコードブック
が必要な理由としては、信号の位相関係により、音源信
号波形はサブフレーム内で色々な位相をとりうる点にあ
る。従って、これら異なる位相を音源コードベクトルの
パターンとして表現するためには、ある程度以上大規模
なコードブックを必要とした。
【0005】本発明の目的は、上述の問題を解決し、従
来方式よりも一層少ない探索演算量とメモリ量とで音質
の劣化の少ない音声符号化装置を提供することにある。
【0006】
【課題を解決するための手段】本発明の音声符号化装置
は、入力した音声信号からスペクトルパラメータを求め
て量子化するスペクトルパラメータ計算部と、前記スペ
クトルパラメータを用いて前記音声信号の音源信号を予
め格納してあるコードブックを探索し量子化して出力す
る音源量子化部とを有する音声符号化装置において、前
記音源量子化部が前記コードブックを探索するときにこ
のコードブックに格納してあるコードベクトルの中の少
なくとも一つについて位置をシフトさせながら探索する
機能を有する構成である。
【0007】本発明の音声符号化装置は、入力した音声
信号からスペクトルパラメータを求めて量子化するスペ
クトルパラメータ計算部と、前記スペクトルパラメータ
を用いて前記音声信号の音源信号を予め格納されたコー
ドブックを探索して量子化して出力する音源量子化部と
を有する音声符号化装置において、前記音声信号をフレ
ーム単位に聴感重み付けを行った聴感重み付け信号から
モードを判別しモード情報を出力するモード判別部と、
前記音源量子化部が前記コードブックを探索するときに
予め定められたモードではコードブックに格納されたコ
ードベクトルの少なくとも一つについて位置をシフトさ
せながら探索する機能を有する構成である。
【0008】本発明の音声符号化装置は、入力した音声
信号からスペクトルパラメータを求めて量子化するスペ
クトルパラメータ計算部と、前記スペクトルパラメータ
を用いて前記音声信号の音源信号を予め格納されたコー
ドブックを探索して量子化して出力する音源量子化部と
を有する音声符号化装置において、前記音声信号をフレ
ーム単位に聴感重み付けを行った聴感重み付け信号から
モードを判別しモード情報を出力するモード判別部と、
前記音源量子化部が前記コードブックを探索するときに
前記コードブックに格納されたコードベクトルの少なく
とも一つについて位置をシフトさせる量を前記モード情
報に応じて変化させながら探索する機能を有する構成で
ある。
【0009】本発明の音声符号化装置は、入力した音声
信号からスペクトルパラメータを求めて量子化するスペ
クトルパラメータ計算部と、前記スペクトルパラメータ
を用いて前記音声信号の音源信号を予め格納してあるコ
ードブックを探索し量子化して出力する音源量子化部と
を有する音声符号化装置において、前記音源量子化部が
前記コードブックを探索するときにこのコードブックに
格納された各コードベクトルごとに定める値に従って位
置をシフトさせる量を変化させながら探索する機能を有
する構成である。
【0010】[作用]第1の発明では、音源量子化部に
おいて音源コードブックを探索するときに、少なくとも
一つのコードベクトルのサンプル位置をシフトさせなが
ら探索する。簡単のために、すべてのコードベクトルを
シフトさせながら探索するものとし、コードブック全体
のサイズをBビット、このうちシフト量をAビットで表
すとすれば、格納すべきコードブックのサイズはBビッ
トではなく、B―Aビットとなり、格納に必要なメモリ
を低減化できる。従って、一部のコードベクトルをシフ
トさせる場合にも、メモリ量を従来の方法よりも低減化
できることは明らかである。
【0011】次に音源コードブックの探索法について説
明する。探索には例えば自己相関近似法を使用するもの
とする。この方法では下式の右辺第2項を最大化するよ
うな音源コードベクトルck(n) を選択する。
【0012】
【0013】ここで
【0014】
【0015】である。さらに
【0016】
【0017】である。この方法の詳細は、アイ・トラン
コス(I.Trancoso)等によるアイイーイーイー・プロシー
ディングス(IEEE Proc.)ICASSP-86,1986年、2375〜
2378頁にイフィセント・プロシジャー・フォー・フ
ァインデング・ジ・アプティマム・イノベイション・イ
ン・スタカスティック・コーダーズ (Efficient proced
ures for finding the optimum innovation in stochas
tic coders) と題した論文(文献3)等を参照できるの
で、説明は省略する。
【0018】ここで、位相シフトしたコードベクトル成
分については、分母の値Pkは同一であるので計算は不要
である。従って、分母の計算に必要な演算量はシフトの
ビット数Aだけ低減化される。
【0019】第2の発明では、あらかじめ定められた時
間区間(以下フレームと呼ぶ)の入力音声から特徴量を
求め、フレームの音声を、複数種類のモードのうちの一
つに分類する。以下では、モードの種類は4種類とし、
これはモード情報として2ビットで表して伝送するもの
とする。予め定められたモードの場合に、音源量子化部
において、音源コードブックを探索するときに、少なく
とも一つのコードベクトルのサンプル位置をシフトさせ
ながら探索する。コードベクトルをシフトさせながら探
索する方法を第1の発明と同一である。
【0020】第3の発明では、第2の発明において、モ
ードごとにサンプル位置のシフト量Aを変化させること
を特徴とする。例えば、Aは、モード0では0ビット、
モード1では5ビット、モード2では4ビット、モード
3では3ビットという値をとる。
【0021】第4の発明では、第1の発明の音源量子化
部において、音源コードブックを探索するときに、コー
ドベクトルに応じてサンプル位置のシフト量を変化させ
ながら探索する。ただし、コードブック全体のシフト量
の合計は一定値、例えばAビットとする。
【0022】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
【0023】図1は本発明の第1の実施の形態を示すブ
ロック図である。
【0024】本発明の第1の実施の形態の音声符号化装
置1は、入力した音声信号を予め定める時間長のフレー
ムに分割するフレーム分割回路2と、フレームの音声信
号をフレームよりも短い時間長のサブフレームに分割す
るサブフレーム分割回路3と、フレーム分割回路2の出
力する一連のフレームの音声信号を受信し少なくとも1
つのサブフレームの音声信号に対してサブフレームの時
間長よりも長い窓をかけて音声信号を切り出してスペク
トルパラメータを予め定められた次数まで計算するスペ
クトルパラメータ計算回路4と、線スペクトル対パラメ
ータコードブック(以下LSPコードブックと記す)6
を用いてスペクトルパラメータ計算回路4の計算した予
め定めるサブフレームで量子化したLSPパラメータを
ベクトル量子化するスペクトルパラメータ量子化回路5
と、スペクトルパラメータ計算回路4の計算した複数の
サブフレームの線形予測係数を受け各サブフレームの音
声信号に対して聴感重み付けを行い聴感重み付け信号を
出力する聴感重み付け回路7と、スペクトルパラメータ
計算回路4の計算した複数のサブフレームの線形予測係
数とスペクトルパラメータ量子化回路5が復元した線形
予測係数とを、サブフレームごとに入力し、応答信号を
1サブフレーム分計算し減算器8に出力する応答信号計
算回路9と、スペクトルパラメータ量子化回路5が復元
した線形予測係数を受け、聴感重み付けフィルタのイン
パルス応答を予め定める点数計算するインパルス応答計
算回路10と、出力側から帰還する過去の音源信号と減
算器8の出力信号と聴感重み付けフィルタのインパルス
応答とを入力しピッチに対応する遅延を求め遅延を表す
インテックスを出力する適応コードブック回路11と、
音源コードブック13を用いて音源信号を量子化する音
源量子化回路12と、ゲインコードブック15からゲイ
ンコードベクトルを読みだし最適なゲインコードベクト
ルを選択し、この選択したゲインコードベクトルを表す
インデックスをマルチプレクサ16に出力するゲイン量
子化回路14と、ゲイン量子化回路14の出力を入力し
インデックスからこれに対応するコードベクトルを読み
だし駆動音源信号を求める重み付け信号計算回路17と
からなる。
【0025】次に本装置の動作について説明する。
【0026】まず、入力端子から音声信号を入力し、フ
レーム分割回路2では音声信号をフレーム(例えば 10m
s )ごとに分割し、サブフレーム分割回路3では、フレ
ームの音声信号をフレームよりも短いサブフレーム(例
えば 2.5ms)に分割する。スペクトルパラメータ計算回
路4では、少なくとも一つのサブフレームの音声信号に
対して、サブフレーム長よりも長い窓(例えば 24ms )
をかけて音声を切り出してスペクトルパラメータをあら
かじめ定められた次数(例えば P=10 次)計算する。こ
こでスペクトルパラメータの計算には、周知のLPC分
析や、バーグ(Burg)分析等を用いることができる。ここ
では、バーグ(Burg)分析を用いることとする。バーグ(B
urg)分析の詳細については、中溝著による”信号解析と
システム同定”と題した単行本(コロナ社1988年刊)の
82〜87頁(文献4)等に記載されているので説明は省略
する。
【0027】さらにスペクトルパラメータ計算回路4で
は、バーグ(Burg)法により計算された線形予測係数α
i(i=1,…,10)量子化や補間に適したLSPパラメータに
変換する。ここで、線形予測係数からLSPへの変換
は、菅村他による”線スペクトル対(LSP)音声分析
合成方式による音声情報圧縮”と題した論文(電子通信
学会論文誌、J64-A、pp.599-606、1981年)(文献5)
を参照することができる。例えば、第2,4サブフレー
ムでバーグ(Burg)法により求めた線形予測係数を、LS
Pパラメータに変換し、第1,3サブフレームのLSP
を直線補間により求めて、第1,3サブフレームのLS
Pを逆変換して線形予測係数に戻し、第1〜4サブフレ
ームの線形予測係数αili=1,…,10,l=1,…,5) を聴感重
み付け回路7に出力する。また、第4サブレームのLS
Pをスペクトルパラメータ量子化回路5に出力する。
【0028】スペクルパラメータ量子化回路5では、L
SPレコードブック6を用いてあらかじめ定められたサ
ブフレームのLSPパラメータを効率的にベクトル量子
化し、下式の歪みを最小化する量子化値を出力する。
【0029】
【0030】ここで、LSP(i), QLSP(i)j,W(i)はそれぞ
れ、量子化前のi次目のLSP,LSPコードブック6
のj番目のコードベクトル、重み係数である。
【0031】以下では、第4サブフレームのLSPパラ
メータを量子化するものとする。LSPパラメータのベ
クトル量子化の手法は周知の手法を用いることができ
る。具体的な方法は例えば、特開平4―171500号
公報(文献6)あるいは特開平4―363000号公報
(文献7)や、特開平5―6199号公報(文献8)
や、ティー・ノムラ(T.Nomura)等によるアイイーイーイ
ー・プロシーディングス.モバイル・マルチメディア・
コミュニケーションズ(IEEE Proc.Mobile Multimedia
Communications.)1993年、B.2.5頁にエルエスピー
・コーディング・ユージング・ブイキュー−エスブイキ
ュー・ウイズ・インターポウレーション・イン・4.0
75・ケービーピーエス・エム−エルシーイーエルピー
・スピーチ・コーダー (LSP Coding Using VQ-SVQ Wit
h Interpolation in 4.075 kbps M-LCELP Speech Code
r) と題した論文(文献9)等を参照できるのでここで
は説明は略する。
【0032】また、スペクトルパラメータ量子化回路5
では、第4サブフレームで量子化したLSPパラメータ
をもとに、第1〜第4サブフレームのLSPパラメータ
を復元する。ここでは、現フレームの第4サブフレーム
の量子化LSPパラメータと1つ過去のフレームの第4
サブフレームの量子化LSPを直線補間して、第1〜第
3サブフレームのLSPを復元する。ここで、量子化前
のLSPと量子化後のLSPとの誤差電力を最小化する
コードベクトルを1種類選択した後に、直線補間により
第1〜第4サブフレームのLSPを復元できる。さらに
性能を向上させるためには、誤差電力を最小化するコー
ドベクトルを複数候補選択したのちに、各々の候補につ
いて、累積歪を評価し、累積歪を最小化する候補と補間
LSPの組を選択するようにすることができる。詳細
は、例えば、特願平5―8737号明細書(文献10)
を参照することができる。
【0033】以上により復元した第1ー3サブフレーム
のLSPと第4サブフレームの量子化LSPをサブフレ
ームごとに線形予測係数α'il(i=1,…,10, l=,…,5) に
変換し、インパルス応答計算回路10に出力する。ま
た、第4サブフレームの量子化LSPのコードベクトル
を表すインデクスをマルチプレクサ16に出力する。聴
感重み付け回路7は、スペクトルパラメータ計算回路4
から、各サブフレームごとに量子化前の線形予測係数α
il (i=1,…,10, l=,…,5) を入力し、文献1にもとづ
き、サブフレームの音声信号に対して聴感重み付けを行
い、聴感重み付け信号を出力する。
【0034】応答信号計算回路9は、スペクトルパラメ
ータ計算回路4から、各サブフレームごとに線形予測係
数αilを入力し、スペクトルパラメータ量子化回路5か
ら、量子化、補間して復元した線形予測係数α'il をサ
ブフレームごとに入力し、保存されているフィルタメモ
リの値を用いて、入力信号を零d(n)=0とした応答信号を
1サブフレーム分計算し、減算器8に出力する。ここ
で、応答信号xz(n) は下式で表される。
【0035】
【0036】但し、n-i ≦ 0のときは y(n-i)=p(N+(n-i)) (8) xz(n-i)=sw(N+(n-i)) (9) ここでNはサブフレーム長を示す。γは、聴感重み付け
量を制御する重み係数であり、下記の式(11)と同一の値
である。sw(n) ,p(n)は、それぞれ、重み付け信号計算
回路17の出力信号、後述の式(11)における右辺第1項
のフィルタの分母の項の出力信号をそれぞれ示す。
【0037】減算器8は、下式により、聴感重み付け信
号から応答信号を1サブフレーム分減算し、x'w(n)を適
応コードブック回路11に出力する。 x'w(n)=xw(n)-xz(n) (10) インパルス応答計算回路10は、z 変換が下式で表され
る聴感重み付けフィルタのインパルス応答 hw(n)をあら
かじめ定められた点数Lだけ計算し、適応コードブック
回路11と音源量子化回路12とゲイン量子化回路14
とに出力する。
【0038】
【0039】適応コードブック回路11では、ゲイン量
子化回路14からは過去の音源信号v(n)を、減算器8か
らは出力信号x'w(n)を、インパルス応答計算回路10か
らは聴感重み付けインパルス応答 hw(n)を入力する。ピ
ッチに対応する遅延Tを下式の歪みを最小化するように
求め、遅延を表すインデクスをマルチプレクサ16に出
力する。
【0040】
【0041】ここで、 yw(n−T)=v(n −T)*hw(n) (13) であり、記号*は畳み込み演算を表す。ゲインβを下式
に従い求める。
【0042】
【0043】ここで、女性音や、子供の声に対して、遅
延の抽出精度を向上させるために、遅延を整数サンプル
ではなく、小数サンプル値で求めてもよい。具体的な方
法は、例えば、ピー・クルーン(P.Kroon) 等によるアイ
イーイーイー・プロシーディングス(IEEE Proc.)ICASSP
-90,1990年、661〜664頁にピッチ・プリディクタ
ーズ・ウイズ・ハイ・テンポラル・ソリューション(Pit
ch predictors with high temporal resolution)と題し
て発表した論文(文献11)等を参照することができ
る。
【0044】さらに、適応コードブック回路11では下
式に従いピッチ予測を行い、予測残差信号ew(n) を音源
量子化回路12に出力する。 ew(n) =x'w(n)- βv(n-T)*hw(n) (15) 音源量子化回路12では、作用で述べたように、音源コ
ードブックの探索に特徴がある。
【0045】図2は図1内の音源量子化回路の構成を示
すブロック図である。
【0046】以下の説明では、音源コードブック全体の
伝送すべきインデクスをBビット、シフト量をAビット
とする。
【0047】音源量子化回路12の逆フィルタリング回
路18は、適応コードブック予測残差信号ew(n) および
聴感重み付けインパルス応答hw(n) を入力し、下式の計
算を行う。
【0048】
【0049】音源コードブック13は、(B−A)ビッ
トのサイズである。自己相関計算回路20は、音源コー
ドベクトルck(n) を音源コードブック13から読み出
し、下式を用いて自己相関を計算する。この値は、同一
のコードベクトルに対して位置をシフトしたコードベク
トルについても共通に使用する。
【0050】
【0051】また、下式により、聴感重み付けインパル
ス応答の自己相関も計算する。
【0052】
【0053】位置シフト回路19は、下式により、音源
コードベクトルck(n) の位置を順番にシフトする。 ckl(n) = ck(n + l), l=0,...,2A-1 (19) ここで、Aはシフト量を表すためのビット数を示す。相
互相関計算回路21は、下式に従い相互相関を計算す
る。
【0054】
【0055】2乗計算回路22は、相互相関CCの2乗
を計算する。割算回路23は、CC2と式 (2)のPkとの
割算結果を最大値判別回路24に出力する。最大値判別
回路24は、割算結果の最大を判別し、そのときの音源
コードブック13のインデクスとシフト量を加味した合
計のインデクスをゲイン量子化回路14に出力する。
【0056】ゲイン量子化回路14は、ゲインコードブ
ック15からゲインコードベクトルを読みだし、選択さ
れた音源コードベクトルに対して、下式を最小化するよ
うにゲインコードベクトルを選択する。ここでは、適応
コードブックのゲインと音源のゲインの両者を同時にベ
クトル量子化する例について示す。
【0057】
【0058】ここで、β'k,G'k は、ゲインコードブッ
ク15に格納された2次元ゲインコードブックにおける
k番目のコードベクトルである。選択されたゲインコー
ドベクトルを表すインデクスをマルチプレクサ16に出
力する。
【0059】重み付け信号計算回路17は、スペクトル
パラメータ計算回路4の出力パラメータおよびそれぞれ
のインデクスを入力し、インデクスからそれぞれに対応
するコードベクトルを読みだし、まず下式にもとづき駆
動音源信号v(n)を求める。 v(n)= β'kv(n-T)+G'kck(n) (22) v(n)は適応コードブック回路11に出力される。
【0060】次に、スペクトルパラメータ計算回路4の
出力パラメータおよびスペクトルパラメータ量子化回路
5の出力パラメータを用いて下式により、応答信号(s
w(n))をサブフレームごとに計算し、応答信号計算回路
9に出力する。
【0061】
【0062】以上により、本発明の第1の実施の形態の
説明を終える。
【0063】図3は本発明の第2の実施の形態を示すブ
ロック図である。
【0064】第2の実施の形態である音声符号化装置2
5が、第1の実施の形態と異なる点は、モード判別回路
26を新たに設け、音源量子化回路27の機能の一部を
変更した点である。その他の図1と同一の番号を付した
構成要素は、図1と同じ動作をするので説明は省略す
る。
【0065】モード判別回路26は、聴感重み付け回路
17からフレーム単位で聴感重み付け信号を受取り、モ
ード判別情報を出力する。ここでは、モード判別に、現
在のフレームの特徴量を用いる。特徴量としては、例え
ば、フレームで平均したピッチ予測ゲインを用いる。ピ
ッチ予測ゲインの計算には、例えば下式を用いる。
【0066】
【0067】ここで、Lはフレームに含まれるサブフレ
ームの個数である。Pi,Eiはそれぞれ、i番目のサブフ
レームでの音声パワー、ピッチ予測誤差パワーを示す。
【0068】
【0069】ここで、Tは予測ゲインを最大化する最適
遅延である。
【0070】つぎに、フレーム平均ピッチ予測ゲインG
をあらかじめ定められた複数個のしきい値と比較して複
数種類のモードに分類する。モードの個数としては、例
えば4を用いることができる。モード判別回路26は、
モード判別情報を音源量子化回路27およびマルチプレ
クサ16に出力する。
【0071】音源量子化回路27は、モード判別情報が
予め定められたモードを示す場合に音源コードベクトル
をシフトしながら探索する。
【0072】図4は図3内の音源量子化回路の構成を示
すブロック図である。音源量子化回路27が音源量子化
回路12と異なる点は、位置シフト回路28の機能の一
部を変更した点である。その他の図2と同一の番号を付
した構成要素は、図2と同じ動作を行うので説明は省略
する。
【0073】位置シフト回路28は、モード判別回路2
6からモード情報を入力し、予め定められたモードの場
合に音源コードベクトルの位置のシフトを行うようにす
る。以後の動作は図2の位置シフト回路19と同一であ
る。以上で第2の発明の説明を終了する。
【0074】図5は本発明の第3の実施の形態を示すブ
ロック図である。
【0075】第3の実施の形態である音声符号化装置2
9が、第2の実施の形態と異なる点は、音源量子化回路
30の機能の一部を変更した点である。その他の図3と
同一の番号を付した構成要素は、図3と同じ動作をする
ので説明は省略する。
【0076】図6は図5内の音源量子化回路の構成を示
すブロック図である。音源量子化回路30が音源量子化
回路27と異なる点は、位置シフト回路31の機能の一
部を変更した点である。その他の図2および4と同一の
番号を付した構成要素は、図2および4と同じ動作を行
うので説明は省略する。
【0077】位置シフト回路31は、作用の項で説明し
たようにモード情報を入力し、モードごとにコードベク
トルの位置のシフト量を変化させる。即ち、モードごと
に、シフトに要するビット数Aを変化させる。例えば、
モード0では0ビット、モード1ではA1 ビット、モー
ド2ではA2 ビット、モード3ではA3 ビットという値
をとる。図7は本発明の第4の実施の形態を示すブロッ
ク図である。
【0078】第4の実施の形態である音声符号化装置3
2が、第1の実施の形態と異なる点は、音源量子化回路
33の機能の一部を変更した点である。その他の図1と
同一の番号を付した構成要素は、図1と同じ動作をする
ので説明は省略する。
【0079】図8は図7内の音源量子化回路の構成を示
すブロック図である。音源量子化回路12が音源量子化
回路33と異なる点は、割り当て回路34が、音源コー
ドブック13に格納されたコードベクトルのインデクス
に応じて、位置をシフトさせる量を割り当てる。ただ
し、コードブック全体ではシフト量の合計をAビットと
して定めておく。位置シフト回路35は、割り当て回路
34からシフト量を入力されると、コードベクトルの位
置をシフトさせる。
【0080】以上で本発明の実施例の説明を終える。
【0081】なお、本発明は、上述した実施の形態に限
らず、種々の変形が可能である。例えば、音源コードブ
ックは、従来から使用されているような構成でもよい
し、複数個のパルス列からなる構成でもよい。音源コー
ドブックのコードベクトルは音声信号データを用いてあ
らかじめ学習して構成してもよい。さらに、モード判別
情報を用いて適応コードブック回路、音源コードブック
や、ゲインコードブックを切替える構成とすることも可
能である。
【0082】
【発明の効果】以上説明したように、本発明は、音源量
子化部が、コードブックを探索するときに、コードブッ
クに格納されたコードベクトルの少なくとも一つについ
て位置をシフトさせながら探索することにより、また、
シフトさせる量をモードごとに変化させることにより、
従来の方法と同一のビットレートでも、コードブックの
探索に必要な演算量と、コードブックの格納に必要なメ
モリ量の両者を低減化できるという効果がある。また、
この効果はシフトに費やすビット数を増すことにより増
大するという効果もある。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態を示すブロック図で
ある。
【図2】図1内の音源量子化回路の構成を示すブロック
図である。
【図3】本発明の第2の実施の形態を示すブロック図で
ある。
【図4】図3内の音源量子化回路の構成を示すブロック
図である。
【図5】本発明の第3の実施の形態を示すブロック図で
ある。
【図6】図5内の音源量子化回路の構成を示すブロック
図である。
【図7】本発明の第4の実施の形態を示すブロック図で
ある。
【図8】図7内の音源量子化回路の構成を示すブロック
図である。
【符号の説明】
1,25,29,32 音声符号化装置 2 フレーム分割回路 3 サブフレーム分割回路 4 スペクトルパラメータ計算回路 5 スペクトルパラメータ量子化回路 6 線スペクトル対パラメータコードブック(LSP
コードブック) 7 聴感重み付け回路 8 減算器 9 応答信号計算回路 10 インパルス応答計算回路 11 適応コードブック回路 12,27,30,33 音源量子化回路 13 音源コードブック 14 ゲイン量子化回路 15 ゲインコードブック 16 マルチプレクサ 17 重み付け信号計算回路 18 逆フィルタリング回路 19,28,31,35 位置シフト回路 20 自己相関計算回路 21 相互相関計算回路 22 2乗計算回路 23 割算回路 24 最大値判別回路 26 モード判別回路 34 割り当て回路

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力した音声信号からスペクトルパラメ
    ータを求めて量子化するスペクトルパラメータ計算部
    と、前記スペクトルパラメータを用いて前記音声信号の
    音源信号を予め格納してあるコードブックを探索し量子
    化して出力する音源量子化部とを有する音声符号化装置
    において、前記音源量子化部が前記コードブックを探索
    するときにこのコードブックに格納してあるコードベク
    トルの中の少なくとも一つについて位置をシフトさせな
    がら探索する機能を有することを特徴とする音声符号化
    装置。
  2. 【請求項2】 入力した音声信号からスペクトルパラメ
    ータを求めて量子化するスペクトルパラメータ計算部
    と、前記スペクトルパラメータを用いて前記音声信号の
    音源信号を予め格納されたコードブックを探索して量子
    化して出力する音源量子化部とを有する音声符号化装置
    において、前記音声信号をフレーム単位に聴感重み付け
    を行った聴感重み付け信号からモードを判別しモード情
    報を出力するモード判別部と、前記音源量子化部が前記
    コードブックを探索するときに予め定められたモードで
    はコードブックに格納されたコードベクトルの少なくと
    も一つについて位置をシフトさせながら探索する機能を
    有することを特徴とする音声符号化装置。
  3. 【請求項3】 入力した音声信号からスペクトルパラメ
    ータを求めて量子化するスペクトルパラメータ計算部
    と、前記スペクトルパラメータを用いて前記音声信号の
    音源信号を予め格納されたコードブックを探索して量子
    化して出力する音源量子化部とを有する音声符号化装置
    において、前記音声信号をフレーム単位に聴感重み付け
    を行った聴感重み付け信号からモードを判別しモード情
    報を出力するモード判別部と、前記音源量子化部が前記
    コードブックを探索するときに前記コードブックに格納
    されたコードベクトルの少なくとも一つについて位置を
    シフトさせる量を前記モード情報に応じて変化させなが
    ら探索する機能を有することを特徴とする音声符号化装
    置。
  4. 【請求項4】 入力した音声信号からスペクトルパラメ
    ータを求めて量子化するスペクトルパラメータ計算部
    と、前記スペクトルパラメータを用いて前記音声信号の
    音源信号を予め格納してあるコードブックを探索し量子
    化して出力する音源量子化部とを有する音声符号化装置
    において、前記音源量子化部が前記コードブックを探索
    するときにこのコードブックに格納された各コードベク
    トルごとに定める値に従って位置をシフトさせる量を変
    化させながら探索する機能を有することを特徴とする音
    声符号化装置。
JP33949295A 1995-12-26 1995-12-26 音声符号化装置 Expired - Fee Related JP3299099B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP33949295A JP3299099B2 (ja) 1995-12-26 1995-12-26 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP33949295A JP3299099B2 (ja) 1995-12-26 1995-12-26 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH09179593A true JPH09179593A (ja) 1997-07-11
JP3299099B2 JP3299099B2 (ja) 2002-07-08

Family

ID=18327983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP33949295A Expired - Fee Related JP3299099B2 (ja) 1995-12-26 1995-12-26 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3299099B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000000963A1 (fr) * 1998-06-30 2000-01-06 Nec Corporation Codeur vocal
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
JP2002158589A (ja) * 2000-09-11 2002-05-31 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP2010511901A (ja) * 2007-11-05 2010-04-15 ▲ホア▼▲ウェイ▼技術有限公司 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000000963A1 (fr) * 1998-06-30 2000-01-06 Nec Corporation Codeur vocal
US6973424B1 (en) 1998-06-30 2005-12-06 Nec Corporation Voice coder
WO2001052241A1 (en) * 2000-01-11 2001-07-19 Matsushita Electric Industrial Co., Ltd. Multi-mode voice encoding device and decoding device
US7167828B2 (en) 2000-01-11 2007-01-23 Matsushita Electric Industrial Co., Ltd. Multimode speech coding apparatus and decoding apparatus
US7577567B2 (en) 2000-01-11 2009-08-18 Panasonic Corporation Multimode speech coding apparatus and decoding apparatus
JP2002158589A (ja) * 2000-09-11 2002-05-31 Matsushita Electric Ind Co Ltd 符号化装置および復号化装置
JP4508490B2 (ja) * 2000-09-11 2010-07-21 パナソニック株式会社 符号化装置および復号化装置
JP2010511901A (ja) * 2007-11-05 2010-04-15 ▲ホア▼▲ウェイ▼技術有限公司 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体
JP2013122612A (ja) * 2007-11-05 2013-06-20 ▲ホア▼▲ウェイ▼技術有限公司 符号化方法、符号化器、および、コンピュータ読み取り可能な媒体
US8600739B2 (en) 2007-11-05 2013-12-03 Huawei Technologies Co., Ltd. Coding method, encoder, and computer readable medium that uses one of multiple codebooks based on a type of input signal

Also Published As

Publication number Publication date
JP3299099B2 (ja) 2002-07-08

Similar Documents

Publication Publication Date Title
JP2746039B2 (ja) 音声符号化方式
JP3094908B2 (ja) 音声符号化装置
JP3196595B2 (ja) 音声符号化装置
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP2000163096A (ja) 音声符号化方法及び音声符号化装置
JPH0944195A (ja) 音声符号化装置
JP3308764B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JP3003531B2 (ja) 音声符号化装置
JP3144284B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JP3153075B2 (ja) 音声符号化装置
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP3471542B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP3144244B2 (ja) 音声符号化装置
JP2907019B2 (ja) 音声符号化装置
JPH08194499A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20000704

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080419

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090419

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100419

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110419

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120419

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120419

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130419

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees