JP3137550B2 - 音声符号化・復号化装置 - Google Patents

音声符号化・復号化装置

Info

Publication number
JP3137550B2
JP3137550B2 JP07030625A JP3062595A JP3137550B2 JP 3137550 B2 JP3137550 B2 JP 3137550B2 JP 07030625 A JP07030625 A JP 07030625A JP 3062595 A JP3062595 A JP 3062595A JP 3137550 B2 JP3137550 B2 JP 3137550B2
Authority
JP
Japan
Prior art keywords
power
lpc
spectrum
harmonic
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07030625A
Other languages
English (en)
Other versions
JPH08221098A (ja
Inventor
泉 賢 今
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP07030625A priority Critical patent/JP3137550B2/ja
Publication of JPH08221098A publication Critical patent/JPH08221098A/ja
Application granted granted Critical
Publication of JP3137550B2 publication Critical patent/JP3137550B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声からピッチ周波
数、各高調波の有声無声判定、スペクトル振幅情報の3
つのパラメータにより符号化・復号化を行なう音声符号
化・復号化装置であって、そのスペクトル振幅情報をL
PC(線形予測)係数によって表現し、そのパラメータ
を効率よく符号化・復号化する音声符号化・復号化装置
に関するものである。
【0002】
【従来の技術】近年、ディジタル信号処理技術の発達に
より、ディジタル通信のサービスが多様化し、通信にお
ける伝送容量の制限から、低ビットレート化の要求が高
まっている。高能率音声符号化技術は、その要求を満た
すために欠かすことのできない技術である。ピッチ周波
数、各高調波の有声無声判定、スペクトル振幅情報の3
つのパラメータを符号化するMBE(Multi Band Excit
ed)符号化法は、低ビットレートにおいても良好な音質
が得られる優れた符号化方法として知られている(IEEE
Trans ASSP VOL 36. NO.8. 1988)。また、スペクトル振
幅情報を表すパラメータとしてLPC係数を用いるMB
E符号化法も知られている(Electronics Letters Vol.2
7. No.14. 1991) 。
【0003】以下にスペクトル振幅情報を表すパラメー
タとしてLPC係数を用いるMBE符号化法を用いた符
号化・復号化装置について説明する。まず、図8を参照
にして従来の符号化装置につて説明する。図8におい
て、1は入力音声信号を入力とし、ピッチ周波数を出力
とするピッチ周波数推定部である。2は入力音声信号お
よびピッチ周波数を入力とし、各高調波の有声無声判定
を出力とする有声無声判定部である。3は入力音声信号
を入力とし、LPC係数を出力とするLPC分析部であ
る。4はLPC係数を入力とし、量子化LPC係数を出
力とする量子化器である。5は入力音声信号とLPC係
数を入力とし、LPC予測残差を出力とするLPC逆フ
ィルタである。6はLPC予測残差を入力とし、フレー
ムパワーを出力とするフレームパワー算出部である。7
はフレームパワーを入力とし、量子化フレームパワーを
出力とする量子化器である。8はピッチ周波数、有声無
声判定、量子化LPC係数、量子化フレームパワーを入
力とし、符号を出力するマルチプレクサである。
【0004】次に、図8においてその動作について説明
する。ピッチ周波数推定部1では、入力音声信号からそ
のピッチ周波数を算出する。ピッチ周波数を算出する手
段としては、従来から入力音声信号の相関関数やスペク
トル振幅を利用する方法が知られている。次に、有声無
声判定部2では、入力音声信号のスペクトルを算出し、
ピッチ周波数に基づいて高調波周波数を求め、それらを
もとに各高調波の有声無声判定を行う。各高調波の有声
無声判定方法としては、各高調波を有声と仮定したとき
のスペクトルと入力音声信号のスペクトルの差異をもと
に判定を行う方法が、従来から知られている。LPC分
析部3では、入力音声信号のLPC分析を行い、LPC
係数を算出する。量子化器4では、LPC係数を従来か
ら知られているベクトル量子化などの効率の良い量子化
法で量子化する。LPC逆フィルタ5では、LPC係数
を用いて入力音声信号をLPC逆フィルタに通す。この
結果、入力音声信号のLPC予測残差が得られる。パワ
ー算出部6では、LPC予測残差のパワーのフレーム内
平均値を算出し、それをフレームパワーとして出力す
る。量子化器7では、フレームパワーを、従来から知ら
れているような効率の良い量子化法によって量子化す
る。マルチプレクサ8は、復号化装置に送る情報として
得られた、ピッチ周波数、各高調波の有声無声判定、量
子化LPC係数、量子化フレームパワーを効率よく符号
化する。結果として、符号化されたピッチ周波数、有声
無声判定、LPC係数、フレームパワーが、この符号化
装置の出力として得られる。
【0005】次に、図9を参照して従来の復号化装置に
ついて説明する。図9において、11は符号を入力と
し、ピッチ周波数、有声無声判定、量子化フレームパワ
ー、量子化LPC係数を出力とするデマルチプレクサで
ある。12はピッチ周波数、有声無声判定を入力とし、
MBE合成モードを出力するモード決定部である。13
は量子化LPC係数を入力とし、逆量子化されたLPC
係数を出力とする逆量子化器である。14は逆量子化さ
れたLPC係数を入力とし、スペクトル強調されたLP
C係数を出力とするスペクトル強調部である。15はス
ペクトル強調されたLPC係数を入力とし、各高調波の
振幅乗数を出力とする高調波振幅乗数算出部である。1
6は量子化フレームパワーを入力とし、逆量子化された
フレームパワーを出力とする逆量子化器である。17は
ピッチ周波数と、有声無声判定と、フレームパワーを入
力とし、音源信号を出力とする音源生成部である。18
はMBE合成モードと、音源信号と、各高調波振幅乗数
を入力とし、復号化音声を出力とするMBE合成部であ
る。
【0006】次に、上記図9においてその動作を説明す
る。まず、デマルチプレクサ11では、符号化装置側か
ら送られた符号から、ピッチ周波数、有声無声判定、量
子化されたフレームパワー、量子化されたLPC係数を
それぞれ取り出す。モード決定部12では、ピッチ周波
数と有声無声判定をもとに、従来から用いられているモ
ード決定法でMBE合成モードを決定する。逆量子化器
13は、量子化されたLPC係数を逆量子化する。スペ
クトル強調部14は、LPC係数に対し、出力音声の主
観的な音質を高めるために、従来から知られているよう
なフォルマント強調や高域強調などの処理を加える。高
調波振幅乗数算出部15では、LPC係数をFFTによ
り周波数領域に変換する。求めた各フーリエ係数の絶対
値を求め、逆数をとることにより、合成音声信号のスペ
クトル包絡を得ることができる。合成音声信号の各高調
波の振幅乗数は、ピッチ周波数w0 の整数倍の周波数n
w0 を求め、スペクトル包絡からその周波数成分を抽出
することによって得られる。逆量子化器16は、量子化
されたフレームパワーを逆量子化する。音源生成部17
では、ピッチ周波数と、有声無声判定と、フレームパワ
ーにより、音源を生成する。音源の生成は、まずピッチ
周波数から各高調波の周波数を求め、各高調波の周波数
を算出する。また、有声無声判定をもとに各高調波周波
数ごとに基本音源信号を生成する。これは、従来からそ
の高調波が有声であれば正弦波、無声であれば白色雑音
とする方法が知られている。次にフレームパワーから、
各高調波の音源振幅を推定し、それを基本音源信号に乗
ずることにより音源信号を生成する。MBE合成部18
では、このようにして生成された音源信号と各高調波の
振幅とMBE合成モードをもとに、従来から知られてい
るMBE合成を行い、復号化音声信号を出力する。
【0007】
【発明が解決しようとする課題】しかしながら、上記の
従来の音声符号化・復号化装置では、LPC係数のみか
ら求めたスペクトル包絡から各高調波のパワーを算出し
ているため、LPC係数では表現できないような、より
細かいスペクトル包絡が得られないため、各高調波のパ
ワーが正確に符号化されず、復号化音声の品質が低下す
るという問題を有していた。また、フレーム内で入力音
声信号のパワーが大きく変化しても、それを表現する手
段がないために、追従できず、音の立ち上がり部分など
で復号化音声の品質が低下するという問題を有してい
た。
【0008】本発明は、上記従来の問題を解決するもの
で、高い復号化音声品質を実現する優れた音声符号化・
復号化装置を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は、上記目的を達
成するために、符号化装置に、ピッチ周波数推定部と、
各高調波の有声無声判定をする有声無声判定部と、LP
C(線形予測)分析部と、LPC係数を量子化する量子
化器と、LPC逆フィルタと、LPC予測残差から少な
くとも残差フレームパワー以外の残差情報を取り出す残
差情報算出部と、ピッチ周波数と有声無声判定と量子化
されたLPC係数と残差情報とを符号化するマルチプレ
クサとを備え、復号化装置に、符号からピッチ周波数と
有声無声判定と量子化されたLPC係数と残差情報とを
復号化するデマルチプレクサと、MBE合成モードを決
定するモード決定部と、量子化されたLPC係数を逆量
子化してLPC係数を取り出す逆量子化器と、LPC係
数から各高調波への振幅乗数を求める高調波振幅乗数算
出部と、ピッチ周波数と有声無声周波数と残差情報とか
ら音源信号を生成する音源生成部と、MBE合成部とを
備え、符号化装置における前記残差情報算出部が、フレ
ームパワー算出部と、フレームパワーを量子化する量子
化器と、LPC予測残差を正規化する予測残差正規化部
と、予測残差のパワースペクトルを算出するパワースペ
クトル算出部と、残差に含まれる高調波のパワーを算出
する残差高調波パワー算出部と、残差高調波パワーから
スペクトル補正ベクトルを算出するスペクトル補正ベク
トル算出部と、スペクトル補正ベクトルを量子化する量
子化器とを備え、復号化装置における音源生成部が、残
差情報算出部において求められたフレームパワーとスペ
クトル補正ベクトルを用いて音源を生成し、また、符号
化装置および復号化装置が、それぞれピッチ周波数と有
声無声判定をもとにLPC係数およびスペクトル補正ベ
クトルに対するビット割り当てをフレーム毎に算出する
量子化レベル数算出部を備えるとともに、それぞれLP
C係数を量子化・逆量子化する量子化器・逆量子化器お
よびスペクトル補正ベクトルを量子化・逆量子化する量
子化器・逆量子化器が、それぞれ量子化レベル数算出部
から与えられたフレーム毎に異なる量子化レベルで量子
化・逆量子化を行い、またマルチプレクサおよびデマル
チプレクサが、それぞれ量子化レベル数算出部で求めら
れたビット割り当てに基づき量子化LPC係数および量
子化スペクトル補正ベクトルを符号化・復号化するよう
にしたものである。
【0010】
【作用】上記構成により、符号化装置において、LPC
予測残差から各高調波のパワーを抽出し、復号化装置に
おいて、その各高調波のパワーをもとに音源信号を生成
することで、各高調波のパワーを正確に表現できる。
【0011】また、符号化装置において、LPC予測残
差からフレーム内でのパワーの変化を抽出し、復号化装
置において、そのフレーム内のパワーの変化をもとに音
源信号を生成することで、フレーム内のパワーの変化に
追従することができる。
【0012】
【実施例】
(実施例1)以下、本発明の第1実施例について、図面
を参照しながら説明する。まず、符号化装置について図
1を用いて説明する。図1において、101は入力音声
信号を入力とし、ピッチ周波数を出力とするピッチ周波
数推定部である。102は入力音声信号およびピッチ周
波数を入力とし、各高調波の有声無声判定を出力とする
有声無声判定部である。103は入力音声信号を入力と
し、LPC係数を出力とするLPC分析部である。10
4はLPC係数を入力とし、量子化されたLPC係数を
出力とする量子化器である。105は入力音声信号とL
PC係数を入力とし、LPC予測残差を出力とするLP
C逆フィルタである。106はLPC予測残差を入力と
し、フレームパワーを出力とするフレームパワー算出部
である。107はフレームパワーを入力とし、量子化フ
レームパワーを出力とする量子化器である。108はL
PC予測残差と、フレームパワーを入力とし、正規化予
測残差を出力とする予測残差正規化部である。109は
正規化予測残差を入力とし、予測残差のパワースペクト
ルを出力とする残差パワースペクトル算出部である。1
10は予測残差のパワースペクトルと、ピッチ周波数を
入力とし、残差の各高調波のパワーを出力とする残差高
調波パワー算出部である。111は残差の各高調波のパ
ワーを入力とし、スペクトル補正ベクトルを出力とする
スペクトル補正ベクトル算出部である。112はスペク
トル補正ベクトルを入力とし、量子化スペクトル補正ベ
クトルを出力とする量子化器である。113はフレーム
パワー算出部106から量子化器112までの要素によ
って構成される残差情報算出部である。114は算出さ
れたピッチ周波数、有声無声判定、量子化LPC係数、
量子化フレームパワー、量子化スペクトル補正ベクトル
を入力とし、符号を出力するマルチプレクサである。
【0013】次に、上記図1においてその動作を説明す
る。ピッチ周波数推定部101では、入力音声信号から
そのピッチ周波数を算出する。ピッチ周波数を算出する
手段としては、従来から入力音声信号の相関関数やスペ
クトル振幅を利用する方法が知られている。次に、有声
無声判定部102では、入力音声信号のスペクトルを算
出し、ピッチ周波数に基づいて高調波周波数を求め、そ
れらをもとに各高調波の有声無声判定を行う。各高調波
の有声無声判定方法としては、各高調波を有声と仮定し
たときのスペクトルと入力音声信号のスペクトルの差異
をもとに判定を行う方法が、従来から知られている。L
PC分析部103では、入力音声信号のLPC分析を行
い、LPC係数を算出する。量子化器104では、LP
C係数を量子化する。LPC係数の量子化法としては、
LPC係数をLSP係数に変換し、ベクトル量子化など
の効率の良い量子化法でLSP係数を量子化する方法が
従来から知られている。LPC逆フィルタ105では、
LPC係数を用いて入力音声信号をLPC逆フィルタに
通す。この結果、入力音声信号のLPC予測残差が得ら
れる。
【0014】パワー算出部106では、LPC予測残差
のパワーのフレーム内平均値を算出し、それをフレーム
パワーとして出力する。量子化器107では、フレーム
パワーを、従来から知られているような効率の良い量子
化法によって量子化する。予測残差正規化部108で
は、フレームパワーを用いて、LPC予測残差の正規化
を行う。残差パワースペクトル算出部109では、正規
化されたLPC予測残差を高速フーリエ変換する。この
際、フレーム両端での信号波形の急激な変化によるスペ
クトルへの影響を軽減するために、ハミング窓などの窓
関数をLPC予測残差に乗じるのが望ましい。求められ
た各フーリエ係数を2乗することによって、予測残差の
パワースペクトルを得る。残差高調波パワースペクトル
算出部110では、LPC予測残差に含まれているL個
の高調波のパワーを算出する。ピッチ周波数w0 の整数
倍のL個の周波数nw0 (1≦n≦L)を求め、予測残
差のパワースペクトルからその周波数成分を抽出するこ
とによって高調波のパワーを算出することができる。ま
た、音声信号の全帯域wc を高調波数L個の帯域に分割
し、それぞれの帯域において予測残差のパワースペクト
ルの平均値を算出し、それを各高調波のパワーとすれ
ば、音声の高調波の周波数と、求めたピッチ周波数の整
数倍の周波数との誤差が生じても、より正確に各高調波
のパワーを推定できる。スペクトル補正ベクトル算出部
111では、求められた予測残差の各高調波のパワーか
ら、スペクトル補正ベクトルを算出する。高調波数L
は、ピッチ周波数w0 によって変化するため、これを効
率よく量子化するためには、例えば、L個の高調波の中
から、聴覚的に重要な帯域の高調波を高調波数Lに関わ
らず一定の個数Nだけ選び、それをスペクトル補正ベク
トルとし、量子化器112で、求められたN個のスペク
トル補正ベクトルをN次元のベクトル量子化を用いて量
子化すればよい。マルチプレクサ114は、復号化装置
に送る情報として得られた、ピッチ周波数、各高調波の
有声無声判定、量子化LPC係数、量子化フレームパワ
ー、量子化スペクトル補正情報を効率よく符号化する。
結果として、符号化されたピッチ周波数、有声無声判
定、LPC係数、フレームパワー、スペクトル補正情報
が、この符号化装置の出力として得られる。
【0015】次に、復号化装置について図2を用いて説
明する。図2において、201は符号を入力とし、ピッ
チ周波数、有声無声判定、量子化フレームパワー、量子
化スペクトル補正ベクトル、量子化LPC係数を出力と
するデマルチプレクサである。202はピッチ周波数、
有声無声判定を入力とし、MBE合成モードを出力する
モード決定部である。203は量子化LPC係数を入力
とし、逆量子化されたLPC係数を出力とする逆量子化
器である。204は逆量子化されたLPC係数を入力と
し、スペクトル強調されたLPC係数を出力とするスペ
クトル強調部である。205はスペクトル強調されたL
PC係数を入力とし、各高調波の振幅乗数を出力とする
高調波振幅乗数算出部である。206は量子化フレーム
パワーを入力とし、逆量子化されたフレームパワーを出
力とする逆量子化器である。207は量子化スペクトル
補正ベクトルを入力とし、逆量子化されたスペクトル補
正ベクトルを出力とする逆量子化器である。208はピ
ッチ周波数と、有声無声判定と、フレームパワーと、ス
ペクトル補正ベクトルを入力とし、音源信号を出力とす
る音源生成部である。209はMBE合成モードと、音
源信号と、各高調波振幅乗数を入力とし、復号化音声を
出力とするMBE合成部である。
【0016】次に、上記図2においてその動作を説明す
る。まず、デマルチプレクサ201では、符号化装置側
から送られた符号から、ピッチ周波数、有声無声判定、
量子化されたフレームパワー、量子化されたスペクトル
補正ベクトル、量子化されたLPC係数をそれぞれ取り
出す。モード決定部202では、ピッチ周波数と有声無
声判定をもとに、従来から用いられているモード決定法
でMBE合成モードを決定する。逆量子化器203は、
量子化されたLPC係数を逆量子化する。スペクトル強
調部204は、LPC係数に対し、出力音声の主観的な
音質を高めるために、従来から知られているようなフォ
ルマント強調や高域強調などの処理を加える。なお、こ
のようなスペクトル強調を行う必要がないときは、この
スペクトル強調部を設ける必要はない。高調波振幅乗算
算出部205では、LPC係数をFFTにより周波数領
域に変換する。このとき、フレーム両端での信号波形の
急激な変化によるスペクトルへの影響を軽減するため
に、ハミング窓のような窓関数を乗じるのが望ましい。
求めた各フーリエ係数の絶対値を求め、逆数をとること
により、合成音声信号のスペクトル包絡を得ることがで
きる。合成音声信号の各高調波の振幅乗数は、ピッチ周
波数w0 の整数倍の周波数nw0 を求め、スペクトル包
絡からその周波数成分を抽出することによって得られ
る。また、音声信号の全帯域wcを高調波数L個の帯域
に分割し、それぞれの帯域においてスペクトル包絡の平
均値を算出し、それを各高調波の振幅乗数とすれば、音
声の高調波の周波数と求めたピッチ周波数の整数倍の周
波数との誤差が生じても、より正確に高調波の振幅乗数
が求められる。逆量子化器206は、量子化されたフレ
ームパワーを逆量子化する。逆量子化器207は、量子
化されたスペクトル補正ベクトルを逆量子化する。
【0017】音源生成部208では、ピッチ周波数と、
有声無声判定と、フレームパワーとスペクトル補正ベク
トルにより、音源を生成する。音源の生成は、まずピッ
チ周波数から各高調波の周波数を求め、各高調波の周波
数を算出する。また、有声無声判定をもとに各高調波周
波数ごとに基本音源信号を生成する。これは、従来から
その高調波が有声であれば正弦波、無声であれば白色雑
音とする方法が知られている。次にフレームパワーおよ
びスペクトル補正ベクトルから、各高調波の音源振幅を
推定し、それを基本音源信号に乗ずることにより音源信
号を生成する。各高調波の音源振幅を算出する手段とし
ては、まずスペクトル補正ベクトルから、符号化装置側
で残差に含まれていた各高調波のスペクトルパワーを算
出し、フレームパワーと乗じる。理論的には、この結果
とスペクトル包絡により音声信号のスペクトルが再現さ
れるが、MBE合成を行う場合、前述したように各高調
波ごとに有声と無声の場合でそのモデル化の方法が異な
るため、有声無声判定それぞれのモデルを仮定し、スペ
クトル算出時の窓関数の影響を取り除くことが望まし
い。影響を取り除く方法としては、フレームパワーとス
ペクトル補正ベクトルから求められた音源の振幅に対
し、それぞれのスペクトルモデルを仮定し、窓関数のス
ペクトルをデコンボリューションする方法が考えられ
る。MBE合成部209では、このようにして生成され
た音源信号と各高調波の振幅とMBE合成モードをもと
に、従来から知られているMBE合成を行い、復号化音
声信号を出力する。
【0018】以上のように、本実施例によれば、従来の
符号化装置に、予測残差正規化部108と、残差パワー
スペクトル算出部109と、残差高調波パワー算出部1
10と、スペクトル補正ベクトル算出部111と、スペ
クトル補正ベクトルを量子化する量子化器112とを設
けることにより、LPC分析によって取り除くことがで
きなかった各高調波の細かいスペクトルを表すパラメー
タを算出し符号化して、復号化装置に情報として伝達で
きる。したがって、復号化装置に、このスペクトル補正
ベクトルを考慮した音源生成部208を設けることによ
り、LPC予測残差に含まれる高調波のスペクトルを復
号化時に補正することができるため、合成時の各高調波
のスペクトルをより正確に表現することができ、音声品
質を改善することができる。
【0019】(実施例2)次に、本発明の第2実施例に
ついて、図3を参照しながら説明する。図3は本実施例
における符号化装置の構成を示し、図1に示した第1実
施例の符号化装置と共通の要素には、同一の番号を付し
て重複した説明は省略する。また、本実施例において、
復号化装置は、図2に示した第1実施例の復号化装置と
共通の構成である。
【0020】図3において、115は量子化LPC係数
を入力とし、逆量子化されたLPC係数を出力とする逆
量子化器である。116は量子化フレームパワーを入力
とし、逆量子化したフレームパワーを出力とする逆量子
化器である。本実施例における残差情報算出部113A
は、図1に示した残差情報算出部113に逆量子化器1
16を付加した構成である。逆量子化器115は、量子
化器104によって量子化されたLPC係数を逆量子化
している。この結果、この逆量子化器の出力として得ら
れるLPC係数は、図2の復号化装置における逆量子化
器207の出力と全く等しい値である。この量子化によ
って生じた誤差は、逆フィルタ105の出力である予測
残差に反映される。また、同様に逆量子化116は、量
子化器107によって量子化されたフレームパワーを逆
量子化する。この逆量子化されたフレームパワーは、図
2の復号化装置における逆量子化器206の出力と等し
い値である。この量子化によって生じた誤差は、予測残
差正規化部108の出力である正規化予測算差に反映さ
れる。したがって、これらの量子化誤差は、残差パワー
スペクトル算出部109、残差高調波パワー算出部11
0、スペクトル補正ベクトル算出部111によって計算
され、出力されるスペクトル補正ベクトルに反映され
る。つまり、符号化ビット数を削減し、量子化器104
または量子化器107、あるいはその両方の量子化誤差
が大きくなっても、量子化器112に適当なビット割り
当てを行えば、その誤差を吸収することができる。
【0021】以上のように、本実施例によれば、符号化
装置に、量子化LPC係数を逆量子化する逆量子化器1
15と、量子化フレームパワーを逆量子化する逆量子化
器116とを設け、逆量子されたLPC係数によってL
PC逆フィルタ105を動作させ、逆量子化されたフレ
ームパワーで予測残差正規化部108を動作させること
により、それらの量子化誤差をスペクトル補正ベクトル
によって補正することができ、LPC係数またはフレー
ムパワーもしくはその両方に与えるビット数を減らして
も、スペクトル補正ベクトルに適当なビットを割り当て
れば、その誤差を吸収することができる。また、このこ
とから、各パラメータに対し、柔軟なビット割り当てを
行うことができる。
【0022】(実施例3)次に、本発明の第3実施例に
ついて、図面を参照しながら説明する。まず、符号化装
置について図4を用いて説明する。図1に示した第1実
施例の符号化装置と共通の要素には、同一の番号を付し
て重複した説明は省略する。図4において、117はピ
ッチ周波数と有声無声判定を入力とし、LPC係数量子
化レベル数とスペクトル補正ベクトル量子化レベル数と
量子化ビット割り当てを出力する量子化レベル数算出部
である。118はLPC係数とLPC係数量子化レベル
数を入力とし、量子化LPC係数を出力とするレベル可
変量子化器である。119はスペクトル補正ベクトルと
スペクトル補正ベクトル量子化レベル数を入力とし、量
子化スペクトル補正ベクトルを出力とするレベル可変量
子化器である。120はピッチ周波数と、有声無声判定
と、量子化LPC係数と、量子化フレームパワーと、量
子化スペクトル補正ベクトルを入力とし、符号を出力と
するマルチプレクサである。本実施例における残差情報
算出部113Bは、図1に示した量子化器112の代わ
りにレベル可変量子化器119を設けたものである。
【0023】次に、図4においてその動作を説明する。
量子化レベル数算出部117では、ピッチ周波数と有声
無声判定をもとに、フレーム毎にLPC係数とスペクト
ル補正ベクトルに割り当てるビット数を求め、それに対
応する量子化レベル数を算出する。例えば、ピッチ周波
数が高いとき、高調波数Lの値は小さくなるから、スペ
クトル補正を行なうべき高調波の数が少ないため、LP
C係数の符号化に、より多くのビット数を割り当てられ
る。また反対に、無声部分などホルマントが存在せず、
スペクトル包絡がなだらかに変化するような場合は、ス
ペクトル補正ベクトルに、より多くのビット数を割り当
てたほうが良い場合がある。このように、それぞれのパ
ラメータに割り当てる量子化ビット数の合計、すなわち
量子化レベル数の合計を一定とし、フレーム毎にLPC
係数とスペクトル補正ベクトルの情報量によってビット
数の割り当てを変えることにより、より効果的な符号化
を行うことができる。レベル可変量子化器118は、割
り当てられたビット数に基づくレベル数でLPC係数の
量子化を行う。したがって、例えばコードブックサイズ
の異なる複数のベクトル量子化器を用意すれば、効率よ
く量子化することができる。同様に、レベル可変量子化
器119は、割り当てられたビット数に基づくレベル数
で、スペクトル補正ベクトルを量子化する。マルチプレ
クサ120では、ピッチ周波数、有声無声判定、量子化
フレームパワーとともに、それぞれのビット割り当てに
基づいて、量子化LPC係数および量子化スペクトル補
正ベクトルを符号化する。
【0024】次に、復号化装置について図5を参照して
説明する。図2に示した第1実施例の復号化装置と共通
の要素には、同一の番号を付して重複した説明は省略す
る。図5において、210はピッチ周波数、有声無声判
定を入力とし、LPC係数量子化レベル数とスペクトル
補正ベクトル量子化レベル数とビット割り当てを出力す
る量子化レベル数算出部である。211は符号およびビ
ット割り当てを入力とし、ピッチ周波数、有声無声判
定、量子化LPC係数、量子化フレームパワー、量子化
スペクトル補正ベクトルを出力とするデマルチプレクサ
である。212は量子化LPC係数と、LPC係数量子
化レベル数を入力とし、逆量子化されたLPC係数を出
力するレベル可変逆量子化器である。213は量子化ス
ペクトル補正ベクトルとスペクトル補正ベクトル量子化
レベル数を入力とし、逆量子化されたスペクトル補正ベ
クトルを出力とするレベル可変逆量子化器である。
【0025】次に、図5においてその動作を説明する。
デマルチプレクサ211は、符号からまずピッチ周波数
と、有声無声判定と、量子化フレームパワーを出力す
る。量子化レベル数算出部210では、図4の符号化装
置における量子化レベル数算出部117と全く等しい手
段により、フレーム毎にLPC係数量子化レベル数とス
ペクトル補正ベクトル量子化レベル数と割り当てビット
数を算出する。デマルチプレクサ211は、得られた割
り当てビット数をもとに量子化LPC係数と、量子化ス
ペクトル補正ベクトルを出力する。レベル可変逆量子化
器212では、LPC係数量子化レベル数に基づいてL
PC係数を逆量子化する。このレベル可変逆量子化器2
12は、符号化装置におけるレベル可変量子化器118
に対応する逆量子化器である。同様にレベル可変逆量子
化器213は、符号化装置におけるレベル可変量子化器
119に対応する逆量子化器であり、スペクトル補正ベ
クトル量子化レベル数に基づいて、スペクトル補正ベク
トルを逆量子化する。
【0026】以上のように、本実施例によれば、符号化
装置に、量子化レベル数算出部117と、それに対応す
る、LPC係数を量子化するレベル可変量子化器118
と、スペクトル補正ベクトルを量子化するレベル可変量
子化器119と、マルチプレクサ120とを備え、また
復号化装置に、符号化装置の量子化レベル数算出部11
7と同じ量子化レベル数算出部210と、それに対応す
る、デマルチプレクサ211と、量子化LPC係数を逆
量子化するレベル可変逆量子化器212と、量子化スペ
クトル補正ベクトルを逆量子化するレベル可変逆量子化
器213を備えることにより、フレーム毎にLPC係数
とスペクトル補正ベクトルの情報量によってビット数の
割り当てを変え、より効果的な符号化を行うことがで
き、復号化音声の品質を高めることができる。
【0027】(実施例4)次に、本発明の第4実施例に
ついて、図面を参照しながら説明する。まず、符号化装
置について図6を用いて説明する。図1に示した第1実
施例の符号化装置と共通の要素には、同一の番号を付し
て重複した説明は省略する。図6において、121はL
PC予測残差を入力とし、フレーム内のパワーベクトル
を出力とするパワーベクトル算出部である。122はパ
ワーベクトルを入力とし、量子化パワーベクトルを出力
とする量子化器である。123はピッチ周波数と、有声
無声判定と、量子化LPC係数と、量子化パワーベクト
ルを入力とし、符号を出力とするマルチプレクサであ
る。本実施例における残差情報算出部113Cは、パワ
ースペクトル算出部121と量子化器122とから構成
される。
【0028】次に、図6においてその動作を説明する。
パワーベクトル算出部121は、まずLPC予測残差に
おいてそのフレームを複数のサブフレームに等分割し、
各サブフレームでの平均パワーを算出し、それらを合わ
せてフレームのパワーベクトルとして出力する。量子化
器122では、そのパワーベクトルをベクトル量子化等
の効率のよい量子化法で量子化する。マルチプレクサ1
23では、復号化装置に送る情報として得られた、ピッ
チ周波数、各高調波の有声無声判定、量子化LPC係
数、量子化パワーベクトルを効率よく符号化する。
【0029】次に、復号化装置について図7を用いて説
明する。図2に示した第1実施例の復号化装置と共通の
要素には、同一の番号を付して重複した説明は省略す
る。図7において、214は符号を入力とし、ピッチ周
波数と、有声無声判定と、量子化LPC係数と量子化パ
ワーベクトルを出力するデマルチプレクサである。21
5は量子化パワーベクトルを入力とし、逆量子化された
パワーベクトルを出力する量子化器である。216はM
BEモードと逆量子化されたパワーベクトルを入力と
し、音源を出力とする音源生成部である。
【0030】次に、図7においてその動作を説明する。
デマルチプレクサ214は、符号化装置側から送られた
符号から、ピッチ周波数、有声無声判定、量子化された
LPC係数、量子化されたパワーベクトルをそれぞれ取
り出す。逆量子化器215は、量子化されたパワーベク
トルを逆量子化する。音源生成部216では、パワーベ
クトルとMBE合成モードにより、音源を生成する。音
源の生成は、まずMBE合成モードから各高調波の周波
数を求め、各高調波の周波数を算出する。また、有声無
声判定を抽出するとともに、それをもとに各高調波ごと
に基本音源信号を生成する。これは、従来からその高調
波が有声であれば正弦波、無声であれば白色雑音とする
方法が知られている。次に、それぞれの基本波信号を、
符号化装置のパワーベクトル算出部121と等しい数の
サブフレームに分割し、パワーベクトルから得られる各
サブフレームのパワーを各高調波の対応するサブフレー
ムに乗じることにより音源信号を生成する。このとき、
サブフレーム間で音源信号が滑らかに連続するように、
パワーを補間するのが望ましい。また、MBE合成部2
09で合成を行う場合、各高調波ごとに有声と無声の場
合でそのモデル化の方法が異なるため、有声無声判定そ
れぞれのモデルを仮定し、スペクトル算出時の窓関数の
影響を取り除くことが望ましい。影響を取り除く方法と
しては、フレームパワーとスペクトル補正ベクトルから
求められた音源の振幅に対し、それぞれのスペクトルモ
デルを仮定し、窓関数のスペクトルをデコンボリューシ
ョンする方法が考えられる。
【0031】以上のように、本実施例によれば、符号化
装置にパワーベクトル算出部121と、それを量子化す
る量子化器122と、マルチプレクサ123を備え、復
号化装置にデマルチプレクサ214と、量子化パワーベ
クトルを復号化する逆量子化器215と、音源生成部2
16を備えることにより、音声の立ち上がり時のように
フレーム内でパワーが大きく変化するような場合でも、
フレーム内の複数のサブフレームのそれぞれの平均パワ
ーをパワーベクトルとして復号化装置に送り、パワーの
変化を音源生成時に再現できるので、復号化音声の品質
を高めることができる。
【0032】
【発明の効果】以上のように、本発明によれば、符号化
装置に、残差パワースペクトル算出部と、残差高調波パ
ワー算出部と、スペクトル補正ベクトル算出部と、スペ
クトル補正ベクトルを量子化する量子化器とを設けるこ
とにより、LPC分析によって取り除くことができなか
った各高調波の細かいスペクトルを表すパラメータを算
出し符号化して、復号化装置に情報として伝達できる。
したがって、復号化装置に、このスペクトル補正ベクト
ルを考慮した音源生成部を設けることにより、LPC予
測残差に含まれる高調波のスペクトルを復号化時に補正
することができるため、合成時の各高調波のスペクトル
をより正確に表現することができ、従来と同じビットレ
ートで高い復号化音声品質が得られる優れた音声符号化
・復号化装置を実現できる。
【0033】また、本発明によれば、符号化装置に、量
子化LPC係数を逆量子化する逆量子化器と、量子化フ
レームパワーを逆量子化する逆量子化器とを設け、逆量
子されたLPC係数によってLPC逆フィルタをかけ、
逆量子化されたフレームパワーでLPC予測残差を正規
化することにより、それらの量子化誤差をスペクトル補
正ベクトルによって補正することができ、LPC係数ま
たはフレームパワーもしくはその両方に与えるビット数
を減らしても、スペクトル補正ベクトルに適当なビット
を割り当てれば、その誤差を吸収できる。また、このこ
とから、各パラメータに対し、柔軟なビット割り当てを
行うことができ、従来と同じビットレートで高い復号化
音声品質が得られる優れた音声符号化・復号化装置を実
現できる。
【0034】また、本発明によれば、符号化装置に、量
子化レベル数算出部と、それに対応する、LPC係数を
量子化するレベル可変量子化器と、スペクトル補正ベク
トルを量子化するレベル可変量子化器と、マルチプレク
サとを設け、また復号化装置に、符号化装置の量子化レ
ベル数算出部と同じ量子化レベル数算出部と、それに対
応する、デマルチプレクサと、量子化LPC係数を逆量
子化するレベル可変逆量子化器と、量子化スペクトル補
正ベクトルを逆量子化するレベル可変逆量子化器とを設
けることにより、フレーム毎にLPC係数とスペクトル
補正ベクトルの情報量によってビット数の割り当てを変
更し、より効果的な符号化を行うことができ、従来と同
じビットレートで高い復号化音声品質が得られる優れた
音声符号化・復号化装置を実現できる。
【0035】また、本発明によれば、符号化装置に、パ
ワーベクトル算出部と、それを量子化する量子化器と、
マルチプレクサとを設け、復号化装置にデマルチプレク
サと、量子化パワーベクトルを復号化する逆量子化器
と、音源生成部を設けることにより、音声の立ち上がり
時のようにフレーム内でパワーが大きく変化するような
場合でも、フレーム内の複数のサブフレームのそれぞれ
の平均パワーをパワーベクトルとして復号化装置に送
り、パワーの変化を音源生成時に再現できるので、従来
と同じビットレートで高い復号化音声品質が得られる優
れた音声符号化復号化装置を実現できる。
【図面の簡単な説明】
【図1】本発明の第1実施例における符号化装置のブロ
ック図
【図2】本発明の第1実施例および第2実施例における
復号化装置のブロック図
【図3】本発明の第2実施例における符号化装置のブロ
ック図
【図4】本発明の第3実施例における符号化装置のブロ
ック図
【図5】本発明の第3実施例における復号化装置のブロ
ック図
【図6】本発明の第4実施例における符号化装置のブロ
ック図
【図7】本発明の第4実施例における復号化装置のブロ
ック図
【図8】従来の符号化装置のブロック図
【図9】従来の復号化装置のブロック図
【符号の説明】
101 ピッチ周波数推定部 102 有声無声判定部 103 LPC分析部 104 量子化器 105 LPC逆フィルタ 106 フレームパワー算出部 107 量子化器 108 予測残差正規化部 109 残差パワースペクトル算出部 110 残差高調波パワー算出部 111 スペクトル補正ベクトル算出部 112 量子化器 113、113A、113B、113C 残差情報算出
部 114 マルチプレクサ 115 逆量子化器 116 逆量子化器 117 量子化レベル算出部 118 レベル可変量子化器 119 レベル可変量子化器 120 マルチプレクサ 121 パワーベクトル算出部 122 量子化器 123 マルチプレクサ 201 デマルチプレクサ 202 モード決定部 203 逆量子化器 204 スペクトル強調部 205 高調波振幅乗数算出部 206 逆量子化器 207 逆量子化器 208 音源生成部 209 MBE合成部 210 量子化レベル数算出部 211 デマルチプレクサ 212 レベル可変逆量子化器 213 レベル可変逆量子化器 214 デマルチプレクサ 215 逆量子化器 216 音源生成部

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 符号化装置が、ピッチ周波数推定部と、
    各高調波の有声無声判定をする有声無声判定部と、LP
    C(線形予測)分析部と、LPC係数を量子化する量子
    化器と、LPC逆フィルタと、LPC予測残差から少な
    くとも残差フレームパワー以外の残差情報を取り出す残
    差情報算出部と、ピッチ周波数と有声無声判定と量子化
    されたLPC係数と残差情報とを符号化するマルチプレ
    クサとを備え、復号化装置が、符号からピッチ周波数と
    有声無声判定と量子化されたLPC係数と残差情報とを
    復号化するデマルチプレクサと、MBE合成モードを決
    定するモード決定部と、量子化されたLPC係数を逆量
    子化してLPC係数を取り出す逆量子化器と、LPC係
    数から各高調波への振幅乗数を求める高調波振幅乗数算
    出部と、ピッチ周波数と有声無声周波数と残差情報とか
    ら音源信号を生成する音源生成部と、MBE合成部とを
    備え 符号化装置における前記残差情報算出部が、フレームパ
    ワー算出部と、フレームパワーを量子化する量子化器
    と、LPC予測残差を正規化する予測残差正規化部と、
    予測残差のパワースペクトルを算出するパワースペクト
    ル算出部と、残差に含まれる高調波のパワーを算出する
    残差高調波パワー算出部と、残差高調波パワーからスペ
    クトル補正ベクトルを算出するスペクトル補正ベクトル
    算出部と、スペクトル補正ベクトルを量子化する量子化
    器とを備え、復号化装置における音源生成部が、残差情
    報算出部において求められたフレームパワーとスペクト
    ル補正ベクトルを用いて音源を生成し、また、 符号化装置および復号化装置が、それぞれピッチ周波数
    と有声無声判定をもとにLPC係数およびスペクトル補
    正ベクトルに対するビット割り当てをフレーム毎に算出
    する量子化レベル数算出部を備えるとともに、それぞれ
    LPC係数を量子化・逆量子化する量子化器・逆量子化
    器およびスペクトル補正ベクトルを量子化・逆量子化す
    る量子化器・逆量子化器が、それぞれ量子化レベル数算
    出部から与えられたフレーム毎に異なる量子化レベルで
    量子化・逆量子化を行い、またマルチプレクサおよびデ
    マルチプレクサが、それぞれ量子化レベル数算出部で求
    められたビット割り当てに基づき量子化LPC係数およ
    び量子化スペクトル補正ベクトルを符号化・復号化する
    ことを特徴とする 音声符号化・復号化装置。
JP07030625A 1995-02-20 1995-02-20 音声符号化・復号化装置 Expired - Fee Related JP3137550B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07030625A JP3137550B2 (ja) 1995-02-20 1995-02-20 音声符号化・復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07030625A JP3137550B2 (ja) 1995-02-20 1995-02-20 音声符号化・復号化装置

Publications (2)

Publication Number Publication Date
JPH08221098A JPH08221098A (ja) 1996-08-30
JP3137550B2 true JP3137550B2 (ja) 2001-02-26

Family

ID=12309041

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07030625A Expired - Fee Related JP3137550B2 (ja) 1995-02-20 1995-02-20 音声符号化・復号化装置

Country Status (1)

Country Link
JP (1) JP3137550B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7366661B2 (en) 2000-12-14 2008-04-29 Sony Corporation Information extracting device
EP2555186A4 (en) * 2010-03-31 2014-04-16 Korea Electronics Telecomm CODING METHOD AND DEVICE AND DECODING METHOD AND DEVICE
CN113096670A (zh) * 2021-03-30 2021-07-09 北京字节跳动网络技术有限公司 音频数据的处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
JPH08221098A (ja) 1996-08-30

Similar Documents

Publication Publication Date Title
JP5343098B2 (ja) スーパーフレーム構造のlpcハーモニックボコーダ
JP4506039B2 (ja) 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
KR100304092B1 (ko) 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US8463604B2 (en) Speech encoding utilizing independent manipulation of signal and noise spectrum
US8396706B2 (en) Speech coding
US9263051B2 (en) Speech coding by quantizing with random-noise signal
US20100174532A1 (en) Speech encoding
CN109313908B (zh) 用于对音频信号进行编码的音频编码器以及方法
US6678655B2 (en) Method and system for low bit rate speech coding with speech recognition features and pitch providing reconstruction of the spectral envelope
WO2006041055A1 (ja) スケーラブル符号化装置、スケーラブル復号装置及びスケーラブル符号化方法
US6593872B2 (en) Signal processing apparatus and method, signal coding apparatus and method, and signal decoding apparatus and method
EP2697795B1 (en) Adaptive gain-shape rate sharing
JPH1020888A (ja) 音声符号化・復号化装置
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JPH11184498A (ja) 音声符号化/復号化方法
WO2002021091A1 (fr) Analyseur de signal de bruit, synthetiseur de signal de bruit, procede d'analyse de signal de bruit et procede de synthese de signal de bruit
JP2891193B2 (ja) 広帯域音声スペクトル係数量子化装置
JP3137550B2 (ja) 音声符号化・復号化装置
JP3237178B2 (ja) 符号化方法及び復号化方法
JP2004302259A (ja) 音響信号の階層符号化方法および階層復号化方法
JPH0990989A (ja) 変換符号化方法および変換復号化方法
KR0155798B1 (ko) 음성신호 부호화 및 복호화 방법
JPH07295593A (ja) 音声符号化装置
JPH05173595A (ja) コード励振線形予測符号化方法
KR20000069159A (ko) 음성 신호 부호화 방법 및 그 장치

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees