JPH09319399A - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JPH09319399A
JPH09319399A JP8154851A JP15485196A JPH09319399A JP H09319399 A JPH09319399 A JP H09319399A JP 8154851 A JP8154851 A JP 8154851A JP 15485196 A JP15485196 A JP 15485196A JP H09319399 A JPH09319399 A JP H09319399A
Authority
JP
Japan
Prior art keywords
circuit
signal
gain
equation
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8154851A
Other languages
English (en)
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP8154851A priority Critical patent/JPH09319399A/ja
Publication of JPH09319399A publication Critical patent/JPH09319399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 ビットレートが低い場合にも、比較的少ない
演算量で音質の劣化の少ない音声符号化装置を提供す
る。 【解決手段】 スペクトルパラメータ計算回路200は
フレーム分割回路110により分割された入力信号から
スペクトルパラメータを求めて量子化する。聴感重み付
け回路230はフレームの音声信号に対して聴感重み付
けを行う。適応コードブック回路580は減算器235
の減算結果を用いて入力信号からあらかじめ定められた
時間間隔毎にピッチ周期を求めるときに前記時間間隔を
分割した複数個の小区間毎にゲインを求めながらピッチ
周期を計算し、予測回路590はピッチ周期を用いて前
記小区間毎にピッチ予測信号を求め、減算器236は減
算器235の減算結果から減算する。音源量子化回路3
50は減算器236の出力である音源信号を音源コード
ブック355を参照して量子化する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は音声符号化装置に関
し、特に音声信号を低いビットレートで高品質に符号化
するための音声符号化装置に関する。
【0002】
【従来の技術】音声信号を高能率に符号化する方式とし
ては、例えば、M.Schroeder and B.
Atalによる”Code−excited line
arprediction:High quality
speech at very low bit r
ates”(Proc.ICASSP,pp.937−
940,1985年)と題した論文(文献1)や、Kl
eijn他による”Improved speech
quality and efficeintvect
or quantization in SELP”
(Proc.ICASSP,pp.155−158,1
988年)と題した論文(文献2)などに記載されてい
るCELP(Code−Excited Linear
Predictive Coding)が知られてい
る。
【0003】この従来の技術では、送信側では、あらか
じめ定められた時間間隔のフレーム毎(例えば20m
s)に、音声信号から線形予測(LPC)分析を用い
て、音声信号のスペクトル特性を表すスペクトルパラメ
ータを抽出する。フレームをさらにサブフレーム(例え
ば5ms)に分割し、サブフレーム毎に過去の音源信号
を基に適応コードブックにおけるパラメータ(ピッチ周
期に対応する遅延パラメータおよびゲインパラメータ)
を抽出し、適応コードブックにより前記サブフレームの
音声信号をピッチ予測する。ピッチ予測して求めた音源
信号に対して、予め定められた種類の雑音信号からなる
音源コードブック(ベクトル量子化コードブック)から
最適な音源コードベクトルを選択し、ゲインコードブッ
クから最適なゲインコードベクトルを探索することによ
り、音源信号を量子化する。音源コードベクトルの選択
の仕方は、選択した雑音信号により合成した信号と、前
記ピッチ予測して求めた音源信号との誤差電力を最小化
するように行う。そして、選択されたコードベクトルの
種類を表すインデクスおよびゲインコードベクトルを示
すインデクスと、前記スペクトルパラメータ,ピッチ周
期に対応する遅延パラメータおよびゲインパラメータと
をマルチプレクサ部により組み合わせて伝送する。受信
側の説明は省略する。
【0004】これらの方法では、パラメータ抽出の時間
関係を整理すると、フレームに対して、スペクトルパラ
メータを求め、フレームを細分化したサブフレームに対
して、適応コードブックのパラメータ,音源コードブッ
クおよびゲインコードブックを求める。
【0005】
【発明が解決しようとする課題】上述した従来の技術で
は、次の2種の問題点があった。第1の問題点は、ビッ
トレートを低減化するために、伝送ビット数の多い適応
コードブックの遅延パラメータの伝送周期を長くとり
(例えば10−20ms)、この区間内でゲインを一定
として遅延パラメータを求めると、適応コードブックの
ピッチ予測性能が低下していた。これは、区間内での入
力信号の変化に充分追従できないためであると考えられ
る。
【0006】第2の問題点は、音源コードブックから最
適な音源コードベクトルを選択するのに多大な演算量を
要するという問題である。これは、文献1や文献2の方
法では、音源コードベクトルを選択するのに、各音源コ
ードベクトルに対して一旦フィルタリングもしくは畳み
込み演算を行い、この演算を音源コードブックに格納さ
れている音源コードベクトルの個数だけ繰り返すことに
起因している。例えば、音源コードブックのビット数が
Bビットで、次元数がNのときは、フィルタリングある
いは畳み込み演算のときのフィルタあるいはインパルス
応答長をKとすると、演算量は1秒当たり、N×K×2
B ×8000/Nだけ必要となる。一例として、B=1
0,N=40,K=10とすると、1秒当たり81,9
20,000回の演算が必要となり、極めて膨大である
ということがわかる。
【0007】音源コードブック探索に必要な演算量を低
減する方法として、従来、種々のものが提案されてい
る。例えば、ACELP(Argebraic Cod
e Excited Linear Predicti
on)方式が提案されている。これについては、例え
ば、C.Laflammeらによる“16kbps w
ideband speech coding tec
hnique basedon algebraic
CELP”と題した論文(Proc.ICASSP,p
p.13−16,1991)(文献3)等を参照するこ
とができる。文献3の方法によれば、音源信号を複数個
のパルスで表し、各パルスの位置をあらかじめ定められ
たビット数で表して伝送する。ここで、各パルスの振幅
は+1.0もしくは−1.0に限定されているため、パ
ルス探索の演算量を大幅に低減化できる。しかし、パル
スの振幅が極めて粗く量子化されたことになるので、性
能も低下していた。
【0008】本発明の目的は、上述の問題を解決し、ビ
ットレートが低い場合にも、比較的少ない演算量で音質
の劣化の少ない音声符号化装置を提供することにある。
【0009】
【課題を解決するための手段】第1の発明の音声符号化
装置は、入力信号からスペクトルパラメータを求めて量
子化するスペクトルパラメータ計算部と、前記スペクト
ルパラメータを用いて前記入力信号からあらかじめ定め
られた時間間隔毎にピッチ周期を求めるときに前記時間
間隔を分割した複数個の小区間毎にゲインを求めながら
ピッチ周期を計算する適応コードブック部と、前記ピッ
チ周期を用いて前記小区間毎にピッチ予測信号を求め前
記入力信号から減算する予測部と、前記予測部の出力で
ある音源信号を量子化する音源量子化部とを有すること
を特徴とする。
【0010】また、第2の発明の音声符号化装置は、第
1の発明の音声符号化装置において、前記入力信号の音
源信号が、振幅が非零の複数個のパルスから構成される
ことを特徴とする。
【0011】さらに、第3の発明の音声符号化装置は、
入力信号からスペクトルパラメータを求めて量子化する
スペクトルパラメータ計算部と、前記入力信号から特徴
量を抽出してモードを判別するモード判別部と、あらか
じめ定められたモードにおいて前記スペクトルパラメー
タを用いて前記入力信号からあらかじめ定められた時間
間隔毎にピッチ周期を求めるときに前記時間間隔を分割
した複数個の小区間毎にゲインを求めながらピッチ周期
を計算する適応コードブック部と、前記ピッチ周期を用
いて前記小区間毎にピッチ予測信号を求め前記入力信号
から減算する予測部と、前記予測部の出力である音源信
号を量子化する音源量子化部とを有することを特徴とす
る。
【0012】さらにまた、第4の発明の音声符号化装置
は、第3の発明の音声符号化装置において、前記入力信
号の音源信号が、振幅が非零の複数個のパルスから構成
されることを特徴とする。
【0013】
【発明の実施の形態】次に、本発明について図面を参照
して説明する。
【0014】図1は、本発明の第1の実施の形態に係る
音声符号化装置の構成を示す回路ブロック図である。本
実施の形態に係る音声符号化装置は、フレーム分割回路
110と、サブフレーム分割回路120と、スペクトル
パラメータ計算回路200と、スペクトルパラメータ量
子化回路210と、コードブック215と、聴感重み付
け回路230と、減算回路235および236と、応答
信号計算回路240と、インパルス応答計算回路310
と、音源量子化回路350と、音源コードブック355
と、ゲインコードブック366と、重み付け信号計算回
路360と、ゲイン量子化回路365と、マルチプレク
サ400と、適応コードブック回路580と、予測回路
590とから構成されている。
【0015】次に、このように構成された第1の実施の
形態に係る音声符号化装置の動作について説明する。
【0016】フレーム分割回路110は、入力端子10
0から音声信号を入力し、音声信号をフレーム(例えば
20ms)毎に分割する。
【0017】スペクトルパラメータ計算回路200は、
フレームの音声信号に対して、フレーム長よりも長い窓
(例えば24ms)をかけて音声を切り出してスペクト
ルパラメータをあらかじめ定められた次数(例えばP=
10次)計算する。ここで、スペクトルパラメータの計
算には、周知のLPC分析,Burg分析等を用いるこ
とができる。ここでは、Burg分析を用いることとす
る。Burg分析の詳細については、中溝著による”信
号解析とシステム同定”と題した単行本(コロナ社,1
988年刊)の第82〜87頁(文献4)等に記載され
ているので説明を省略する。
【0018】さらに、スペクトルパラメータ計算回路2
00は、Burg法により計算された線形予測係数αi
(i=1,…,10)を量子化や補間に適したLSPパ
ラメータに変換する。ここで、線形予測係数からLSP
パラメータへの変換は、菅村他による”線スペクトル対
(LSP)音声分析合成方式による音声情報圧縮”と題
した論文(電子通信学会論文誌,J64−A,pp.5
99−606,1981年)(文献5)を参照すること
ができる。スペクトルパラメータ計算回路200は、フ
レームのLSPパラメータをスペクトルパラメータ量子
化回路210に出力する。
【0019】スペクルパラメータ量子化回路210は、
フレームのLSPパラメータを効率的に量子化する。量
子化法として、ベクトル量子化を用いるものとする。L
SPパラメータのベクトル量子化の手法は、周知の手法
を用いることができる。具体的な方法は、例えば、特開
平4−171500号公報(文献6),特開平4−36
3000号公報(文献7),特開平5−6199号公報
(文献8),T.Nomura他による”LSP Co
ding Using VQ−SVQ With In
terpolation in 4.075kbps
M−LCELPSpeech Coder”と題した論
文(Proc.Mobile Multimedia
Communications,pp.B.2.5,1
993)(文献9)等を参照できる。
【0020】スペクルパラメータ量子化回路210は、
コードブック215を用いて、数1の歪みDj を最小化
するコードベクトルを選択して出力する。
【0021】
【数1】
【0022】数1で、LSP(i),QLSP(i)j
およびW(i)は、量子化前のi次目のLSP,j番目
のコードベクトルおよび重み係数をそれぞれ示す。
【0023】また、スペクトルパラメータ量子化回路2
10は、量子化したLSPパラメータを復元する。
【0024】スペクトルパラメータ量子化回路210
は、以上により復元した量子化LSPパラメータを線形
予測係数α’i (i=1,…,10)に変換し、インパ
ルス応答計算回路310に出力する。また、スペクトル
パラメータ量子化回路210は、量子化LSPパラメー
タのコードベクトルを表すインデクスをマルチプレクサ
400に出力する。
【0025】聴感重み付け回路230は、スペクトルパ
ラメータ計算回路200から各フレーム毎に量子化前の
線形予測係数αi (i=1,…,10)を入力し、前記
文献1にもとづき、フレームの音声信号に対して聴感重
み付けを行い、聴感重み付け信号xw (n)を出力す
る。
【0026】応答信号計算回路240は、スペクトルパ
ラメータ計算回路200から各フレーム毎に線形予測係
数αi を入力し、スペクトルパラメータ量子化回路21
0から量子化および補間して復元した線形予測係数α’
i をフレーム毎に入力し、保存されているフィルタメモ
リの値を用いて、入力信号d(n)を0とした応答信号
z (n)を1フレーム分計算し、減算器235に出力
する。ここで、応答信号xz (n)は、数2で表され
る。
【0027】
【数2】
【0028】ただし、n−i≦0のときは、数3および
数4である。
【0029】
【数3】
【0030】
【数4】
【0031】数2,数3および数4で、Nはフレーム長
を示し、γは聴感重み付け量を制御する重み係数であ
り、下記の数6におけるのと同一の値である。また、s
w (n)およびp(n)は、重み付け信号計算回路36
0から出力される応答信号および後述の数6における右
辺第1項のフィルタの分母の項の出力信号をそれぞれ示
す。
【0032】減算器235は、数5により、聴感重み付
け信号xw (n)から応答信号xz(n)を1フレーム
分減算し、減算結果x’w (n)を適応コードブック回
路580に出力する。
【0033】
【数5】
【0034】インパルス応答計算回路310は、z変換
が数6で表される聴感重み付けフィルタのインパルス応
答hw (n)をあらかじめ定められた点数Lだけ計算
し、適応コードブック回路580,予測回路590,音
源量子化回路350およびゲイン量子化回路365に出
力する。
【0035】
【数6】
【0036】適応コードブック回路580は、重み付け
信号計算回路360からフレーム単位で更新した過去の
音源信号v(n)を、減算器235から減算結果x’w
(n)を、インパルス応答計算回路310からインパル
ス応答hw (n)を入力する。
【0037】適応コードブック回路580は、フレーム
を複数個に分割した小区間毎にゲインを求めながらピッ
チ周期に対応する遅延パラメータTとゲインβi とを数
7の歪みDT を最小化するように求める。以下では、遅
延パラメータTはフレームで一定とし、フレームを4分
割した小区間毎にゲインβi を求めながら、遅延パラメ
ータを計算する。なお、小区間の長さは、後述のサブフ
レーム長と等しくとる。
【0038】
【数7】
【0039】数7で、Tは遅延パラメータ、βi はi番
目の小区間のゲインである。v(n)は過去の音源信号
である。また、QおよびLは、それぞれ、フレームに含
まれる小区間の個数および小区間のサンプル数である。
【0040】ゲインβi は、近似的に数8から計算され
る。
【0041】
【数8】
【0042】数8で、ywi(n−T)は、数9である。
【0043】
【数9】
【0044】数9で、記号*は畳み込み演算を表す。
【0045】数8を数7に代入して、数10が得られ
る。
【0046】
【数10】
【0047】したがって、数10を最小化する、あるい
は、数10の右辺第2項を最大化する遅延パラメータT
を選択し、数8から各小区間におけるゲインβi を求め
ればよい。
【0048】ここで、遅延パラメータTの値は、通常、
音声信号に対しては、16〜143程度まで変化すると
考えられるので、この範囲の全ての遅延パラメータTの
値に対して数10の歪みDT を計算し、数10の歪みD
T を最小にする遅延パラメータTの値を選択すればよ
い。
【0049】また、適応コードブック回路580は、遅
延パラメータTを表すインデクスをマルチプレクサ40
0に出力する。
【0050】女性音や子供の声に対して、遅延パラメー
タTの抽出精度を向上させるために、遅延パラメータT
を整数サンプルではなく、小数サンプル値で求めてもよ
い。具体的な方法については、例えば、P.Kroon
らによる、”Pitch predictors wi
th high temporal resoluti
on”と題した論文(Proc.ICASSP,pp.
661−664,1990年)(文献10)等を参照す
ることができる。
【0051】サブフレーム分割回路120は、減算器2
35の出力である減算結果x’w (n)をサブフレーム
(時間長は例えば5ms)に分割して出力する。
【0052】予測回路590は、フレーム毎に更新され
た過去の音源信号v(n),適応コードブックの遅延パ
ラメータTおよびゲインβi を用いて、サブフレーム毎
にピッチ予測信号βi i (n−T)*hw (n)を求
め、減算器236に出力する。
【0053】減算器236は、数11に従い、サブフレ
ーム毎に前記ピッチ予測信号βi i (n−T)*hw
(n)の減算を行い、減算結果である音源信号z
wi(n)を音源量子化回路350に出力する。
【0054】
【数11】
【0055】音源量子化回路350は、音源信号z
wi(n)を音源コードブック355を用いてサブフレー
ム毎にベクトル量子化する。詳しくは、音源量子化回路
350は、減算器236の出力である減算結果z
wi(n)とインパルス応答計算回路310の出力である
インパルス応答h(n)w とを用いて、数12の歪みD
j を最小化するように、音源コードブック355から音
源コードベクトルcj (n)を探索する。
【0056】
【数12】
【0057】数12で、ψ(n)およびswj(n)は、
数13および数14である。
【0058】
【数13】
【0059】
【数14】
【0060】数14で、記号*は畳み込み演算を示す。
【0061】音源量子化回路350は、選択された音源
コードベクトルのインデクスをマルチプレクサ400に
出力する。
【0062】ゲイン量子化回路365は、ゲインコード
ブック366からゲインコードベクトルを読み出し、選
択された音源コードベクトルに対して、数15の歪みD
t を最小化するゲインコードベクトルを選択する。ここ
では、適応コードベクトルのゲインと音源コードベクト
ルのゲインとをまとめてベクトル量子化する例について
示す。
【0063】
【数15】
【0064】数15で、β’t およびG’t は、ゲイン
コードブック366に格納された2次元ゲインコードベ
クトルにおけるt番目のコードベクトルの要素である。
【0065】ゲイン量子化回路365は、選択されたゲ
インコードベクトルを表すインデクスをマルチプレクサ
400に出力する。
【0066】重み付け信号計算回路360は、量子化さ
れたゲインを表すインデクス,音源コードブック355
のインデクスおよびゲインコードベクトルのインデクス
を入力し、これらのインデクスからそれに対応するコー
ドベクトルを読み出し、まず数16にもとづき駆動音源
信号v(n)を求める。
【0067】
【数16】
【0068】重み付け信号計算回路360は、サブフレ
ーム毎に更新された駆動音源信号vi (n)を予測回路
590に出力し、フレーム毎に更新された駆動音源信号
v(n)を適応コードブック回路580に出力する。
【0069】次に、重み付け信号計算回路360は、ス
ペクトルパラメータ計算回路200の出力パラメータ
(LSPパラメータ)およびスペクトルパラメータ量子
化回路210の出力パラメータ(線形予測係数αi )を
用いて数17により、応答信号swi(n)をサブフレー
ム毎に計算し、フレーム分のサンプル数をまとめて応答
信号計算回路240に出力する。
【0070】
【数17】
【0071】以上により、第1の実施の形態に係る音声
符号化装置の説明を終える。
【0072】図2は、本発明の第2の実施の形態に係る
音声符号化装置の構成を示す回路ブロック図である。第
2の実施の形態に係る音声符号化装置が、図1に示した
第1の実施の形態に係る音声符号化装置と異なるのは、
音源量子化回路500,振幅コードブック540,ゲイ
ン量子化回路550,ゲインコードブック560および
重み付け信号計算回路570である。したがって、その
他の回路等は同様に構成され同様に動作するので、対応
する回路には同一符号を付して詳しい説明を省略する。
【0073】図3を参照すると、音源量子化回路500
は、相関係数計算回路510と、位置計算回路520
と、振幅量子化回路530とから構成されている。
【0074】次に、このように構成された第2の実施の
形態に係る音声符号化装置の動作について、第1の実施
の形態に係る音声符号化装置と相違する点を中心に簡単
に説明する。
【0075】音源量子化回路500は、M個の振幅が非
零のパルス列の位置と振幅とを計算する。
【0076】詳しくは、音源量子化回路500では、図
3に示すように、相関係数計算回路510が、端子50
1および502から減算器236の減算結果zw (n)
およびインパルス応答計算回路310のインパルス応答
w (n)をそれぞれ入力し、数18および数19に従
い、2種の相関係数ψ(n)およびφ(p,q)を計算
し、位置計算回路520および振幅量子化回路530に
出力する。
【0077】
【数18】
【0078】
【数19】
【0079】位置計算回路520は、あらかじめ定めら
れた個数Mの非零の振幅のパルスの位置を計算する。こ
れには、文献3と同様に、各パルス毎に、あらかじめ定
められた位置の候補について、数20で表された評価値
Dを最大化するパルスの位置を求める。
【0080】例えば、位置の候補の例は、サブフレーム
長をN=40、パルスの個数をM=5とすると、表1の
ように表せる。
【0081】
【表1】
【0082】位置計算回路520は、各パルスについて
位置の候補を調べ、数20を最大化する位置を選択す
る。
【0083】
【数20】
【0084】数20で、Ck およびEk は、数21およ
び数22である。
【0085】
【数21】
【0086】
【数22】
【0087】数21および数22で、mk はk番目のパ
ルスの位置を示し、sgn(k)はk番目のパルスの極
性を示す。
【0088】位置計算回路520は、M個のパルスの位
置を振幅量子化回路530に出力する。
【0089】振幅量子化回路530は、パルスの振幅を
振幅コードブック540を用いて量子化する。詳しく
は、振幅量子化回路530は、数23で表された評価値
を最大化する振幅コードベクトルを選択する。
【0090】
【数23】
【0091】数23で、Cj およびEj は、数24およ
び数25である。
【0092】
【数24】
【0093】
【数25】
【0094】数24および数25で、g’kjは、j番目
の振幅コードベクトルにおけるk番目のパルスの振幅を
示す。
【0095】なお、パルスの振幅を量子化するための振
幅コードブック540を、音声信号を用いてあらかじめ
学習して格納しておくこともできる。コードブックの学
習法は、例えば、Lindeらによる“An algo
rithm for vector quantiza
tion design”と題した論文(IEEETr
ans.Commun.,pp.84−95,Janu
ary,1980)(文献12)等を参照できる。
【0096】振幅量子化回路530は、振幅コードベク
トルのインデクスおよび位置の情報を端子503および
504からそれぞれ出力する。
【0097】ゲイン量子化回路550は、ゲインコード
ブック560を用いてパルスのゲインを量子化する。詳
しくは、ゲイン量子化回路550は、数26の歪みDt
を最小化するようなゲインコードベクトルを選択し、選
択したゲインコードベクトルのインデクスをマルチプレ
クサ400に出力する。
【0098】
【数26】
【0099】重み付け信号計算回路570は、量子化さ
れたゲインを表すインデクス,振幅コードブック540
のインデクスおよびゲインコードベクトルのインデクス
を入力し、これらのインデクスからそれに対応するコー
ドベクトルを読み出し、まず数27にもとづき駆動音源
信号vi (n)を求める。
【0100】
【数27】
【0101】重み付け信号計算回路570は、サブフレ
ーム毎に更新された駆動音源信号vi (n)を予測回路
590に出力する。また、重み付け信号計算回路570
は、フレーム毎に更新された駆動音源信号v(n)を適
応コードブック回路580に出力する。
【0102】次に、重み付け信号計算回路570は、ス
ペクトルパラメータ計算回路200の出力パラメータ
(LSPパラメータ)およびスペクトルパラメータ量子
化回路210の出力パラメータ(線形予測係数α’i
を用いて、数28により応答信号sw (n)をサブフレ
ーム毎に計算し、応答信号計算回路240に出力する。
【0103】
【数28】
【0104】図4は、本発明の第3の実施の形態に係る
音声符号化装置の構成を示す回路ブロック図である。本
実施の形態に係る音声符号化装置は、図1に示した第1
の実施の形態に係る音声符号化装置に対して、モード判
別回路900を付加して構成されている。したがって、
対応する回路等には同一符号を付して、それらの詳しい
説明を省略する。
【0105】次に、このように構成された第3の実施の
形態に係る音声符号化装置の動作について、第1の実施
の形態に係る音声符号化装置と相違する点を中心に簡単
に説明する。
【0106】モード判別回路900は、聴感重み付け回
路230からフレーム単位で聴感重み付け信号x
w (n)を受け取り、モード情報を適応コードブック回
路580およびマルチプレクサ400に出力する。
【0107】ここでは、モード判別に、現在のフレーム
の特徴量を用いる。特徴量としては、例えば、フレーム
で平均したピッチ予測ゲインGを用いる。フレーム平均
ピッチ予測ゲインGの計算は、例えば数29を用いる。
【0108】
【数29】
【0109】数29で、Qは、フレームに含まれるサブ
フレームの個数である。Pi およびEi は、数30に示
すi番目のサブフレームでの音声電力および数31に示
すピッチ予測誤差電力をそれぞれ示す。
【0110】
【数30】
【0111】
【数31】
【0112】数31で、T’は、フレーム平均予測ゲイ
ンGを最大化する最適遅延である。
【0113】モード判別回路900は、フレーム平均ピ
ッチ予測ゲインGをあらかじめ定められた複数個のしき
い値と比較して複数種類のモードに分類する。モードの
個数としては、例えば4を用いることができる。
【0114】適応コードブック回路600は、モード情
報を入力し、あらかじめ定められたモードの場合に、図
1の適応コードブック回路580と同様に、小区間(サ
ブフレーム)毎にゲインβi を求めながらフレーム全体
で遅延パラメータTを計算する。
【0115】図5は、本発明の第4の実施の形態に係る
音声符号化装置の構成を示す回路ブロック図である。本
実施の形態に係る音声符号化装置は、図4におけるモー
ド判別回路900を、図2に示した第2の実施の形態に
係る音声符号化装置に付加したものである。したがっ
て、対応する回路等には同一符号を付して、それらの詳
しい説明を省略する。
【0116】本発明は、上述した各実施の形態に限ら
ず、種々の変形が可能である。
【0117】例えば、モード情報を用いて、音源量子化
回路やゲインコードブックを切り替える構成とすること
もできる。
【0118】音源コードブックを用いる場合、数12で
示した歪みDj の小さい順に、複数個のコードベクトル
を選択し、ゲイン量子化回路でゲインを量子化しなが
ら、数15に示した歪みDt を最小化する音源コードベ
クトルとゲインコードベクトルとの組合せを選択しても
よい。
【0119】また、パルス列で音源を表す場合、パルス
の振幅を量子化する際にパルスの位置を複数セット求
め、これらの各々に対して振幅コードブックを探索し、
数22のEk を最小化する組合せを選択してもよい。ま
た、これらの組合せを複数種類ゲイン量子化回路に出力
し、ゲインを量子化しながら、数26で示した歪みDt
を最小化するような位置,振幅コードベクトルおよびゲ
インコードベクトルの組合せを選択してもよい。
【0120】
【発明の効果】以上説明したように、発明によれば、入
力音声からあらかじめ定められた時間間隔(例えばフレ
ーム)毎にピッチ周期に相当する適応コードブックの遅
延パラメータを求めるときに、前記時間間隔内で遅延パ
ラメータは一定としながら、前記時間間隔内でゲインを
一定として求めるのではなく、前記時間間隔を分割した
複数個の小区間(サブフレーム)毎にゲインを求めなが
ら遅延パラメータを計算し、これらのパラメータを用い
てピッチ予測を行い、前記信号の音源信号を量子化する
ことにより、性能を落さずに、ビット数の比較的多い遅
延パラメータの伝送周期を長くとれるため、ビットレー
トを低減化しても音質の劣化が少ないという効果があ
る。
【0121】さらに、本発明によれば、入力信号から特
徴量を抽出してモードを判別し、あらかじめ定められた
モードにおいてのみ、入力信号から特徴量を抽出して信
号のモードを判別し、あらかじめ定められたモードにつ
いてのみ、上記処理を行っているので、高い効果をあげ
ることができる。
【0122】また、本発明によれば、上述に加え、音源
信号が個数Mの振幅が非零のパルス列から構成され、パ
ルスの振幅および位置を求めることにより、音源信号を
量子化する。音源信号を振幅が非零のM個のパルス列で
表しているので、比較的少ない探索演算量で、より良好
な音質が得られる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態に係る音声符号化装
置の構成を示す回路ブロック図である。
【図2】本発明の第2の実施の形態に係る音声符号化装
置の構成を示す回路ブロック図である。
【図3】図2中の音源量子化回路の内部構成を示す回路
ブロック図である。
【図4】本発明の第3の実施の形態に係る音声符号化装
置の構成を示す回路ブロック図である。
【図5】本発明の第4の実施の形態に係る音声符号化装
置の構成を示す回路ブロック図である。
【符号の説明】
110 フレーム分割回路 120 サブフレーム分割回路 200 スペクトルパラメータ計算回路 210 スペクトルパラメータ量子化回路 215 コードブック 230 聴感重み付け回路 235,236 減算回路 240 応答信号計算回路 310 インパルス応答計算回路 350,500 音源量子化回路 355 音源コードブック 360,570 重み付け信号計算回路 365,550 ゲイン量子化回路 366,560 ゲインコードブック 400 マルチプレクサ 510 相関係数計算回路 520 位置計算回路 540 振幅コードブック 560 ゲインコードブック 580,600 適応コードブック回路 590 予測回路 900 モード判別回路

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力信号からスペクトルパラメータを求
    めて量子化するスペクトルパラメータ計算部と、 前記スペクトルパラメータを用いて前記入力信号からあ
    らかじめ定められた時間間隔毎にピッチ周期を求めると
    きに前記時間間隔を分割した複数個の小区間毎にゲイン
    を求めながらピッチ周期を計算する適応コードブック部
    と、 前記ピッチ周期を用いて前記小区間毎にピッチ予測信号
    を求め前記入力信号から減算する予測部と、 前記予測部の出力である音源信号を量子化する音源量子
    化部とを有することを特徴とする音声符号化装置。
  2. 【請求項2】 前記入力信号の音源信号が、振幅が非零
    の複数個のパルスから構成されることを特徴とする請求
    項1記載の音声符号化装置。
  3. 【請求項3】 入力信号からスペクトルパラメータを求
    めて量子化するスペクトルパラメータ計算部と、 前記入力信号から特徴量を抽出してモードを判別するモ
    ード判別部と、 あらかじめ定められたモードにおいて前記スペクトルパ
    ラメータを用いて前記入力信号からあらかじめ定められ
    た時間間隔毎にピッチ周期を求めるときに前記時間間隔
    を分割した複数個の小区間毎にゲインを求めながらピッ
    チ周期を計算する適応コードブック部と、 前記ピッチ周期を用いて前記小区間毎にピッチ予測信号
    を求め前記入力信号から減算する予測部と、 前記予測部の出力である音源信号を量子化する音源量子
    化部とを有することを特徴とする音声符号化装置。
  4. 【請求項4】 前記入力信号の音源信号が、振幅が非零
    の複数個のパルスから構成されることを特徴とする請求
    項3記載の音声符号化装置。
JP8154851A 1996-05-27 1996-05-27 音声符号化装置 Pending JPH09319399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8154851A JPH09319399A (ja) 1996-05-27 1996-05-27 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8154851A JPH09319399A (ja) 1996-05-27 1996-05-27 音声符号化装置

Publications (1)

Publication Number Publication Date
JPH09319399A true JPH09319399A (ja) 1997-12-12

Family

ID=15593298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8154851A Pending JPH09319399A (ja) 1996-05-27 1996-05-27 音声符号化装置

Country Status (1)

Country Link
JP (1) JPH09319399A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008018464A1 (fr) * 2006-08-08 2008-02-14 Panasonic Corporation dispositif de codage audio et procédé de codage audio

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008018464A1 (fr) * 2006-08-08 2008-02-14 Panasonic Corporation dispositif de codage audio et procédé de codage audio
US8112271B2 (en) 2006-08-08 2012-02-07 Panasonic Corporation Audio encoding device and audio encoding method

Similar Documents

Publication Publication Date Title
JP3094908B2 (ja) 音声符号化装置
JP3196595B2 (ja) 音声符号化装置
EP0957472B1 (en) Speech coding apparatus and speech decoding apparatus
EP1005022A1 (en) Speech encoding method and speech encoding system
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3266178B2 (ja) 音声符号化装置
JP3335841B2 (ja) 信号符号化装置
JPH0944195A (ja) 音声符号化装置
EP1093230A1 (en) Voice coder
JP3003531B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
EP1154407A2 (en) Position information encoding in a multipulse speech coder
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
EP1100076A2 (en) Multimode speech encoder with gain smoothing
JP3144284B2 (ja) 音声符号化装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3089967B2 (ja) 音声符号化装置
JP3471542B2 (ja) 音声符号化装置
JPH09319399A (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
JP3092654B2 (ja) 信号符号化装置
JP3144244B2 (ja) 音声符号化装置