JPH0537393A - 音声符号化装置 - Google Patents
音声符号化装置Info
- Publication number
- JPH0537393A JPH0537393A JP16450391A JP16450391A JPH0537393A JP H0537393 A JPH0537393 A JP H0537393A JP 16450391 A JP16450391 A JP 16450391A JP 16450391 A JP16450391 A JP 16450391A JP H0537393 A JPH0537393 A JP H0537393A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- low
- encoding
- band
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】
【目的】 6kbps 程度の伝送レートでも高品質の音声
を再生できる音声符号化装置を提供することを目的とす
る。 【構成】 入力音声信号を低域信号と高域信号とに帯域
分割する帯域分割部11と、低域信号の波形を符号化す
る低域波形符号化部12と、高域信号のスペクトラム振
幅を符号化する高域スペクトラム振幅符号化部13およ
び符号化部12,13の出力を多重化して出力端子15
へ出力するマルチプレクサ14を有する音声符号化装
置。
を再生できる音声符号化装置を提供することを目的とす
る。 【構成】 入力音声信号を低域信号と高域信号とに帯域
分割する帯域分割部11と、低域信号の波形を符号化す
る低域波形符号化部12と、高域信号のスペクトラム振
幅を符号化する高域スペクトラム振幅符号化部13およ
び符号化部12,13の出力を多重化して出力端子15
へ出力するマルチプレクサ14を有する音声符号化装
置。
Description
【0001】
【産業上の利用分野】本発明は、低レートの音声符号化
装置に関する。
装置に関する。
【0002】
【従来の技術】音声信号を8kbps 程度の比較的低い伝
送レートで高品質に符号化できる符号化方式の一つとし
て、CELP(Code Excited Linear Prediction)方式が
知られている。CELP方式の詳細は、P.Kroon 氏とE.
F.Deprettcre氏の“A Class ofAnalysis-by-Synthesis
Coding at Rates Between 4.8 and 16kbits/s”,IEEES
AC-6,PP.353-363,February 1988 (文献1)に述べられ
ている。
送レートで高品質に符号化できる符号化方式の一つとし
て、CELP(Code Excited Linear Prediction)方式が
知られている。CELP方式の詳細は、P.Kroon 氏とE.
F.Deprettcre氏の“A Class ofAnalysis-by-Synthesis
Coding at Rates Between 4.8 and 16kbits/s”,IEEES
AC-6,PP.353-363,February 1988 (文献1)に述べられ
ている。
【0003】CELP方式の原理を図5を用いて簡単に
説明する。音声符号化方式として、声道特性をモデル化
した合成フィルタを、音源である声帯をモデル化した駆
動信号により駆動して再生音声信号を合成する過程で得
られる駆動信号の情報を符号化して出力する方式があ
る。CELP方式はこのような音声符号化方式の一つに
分類され、再生音声信号の波形歪、すなわち入力音声信
号に対する再生音声信号の誤差が最小となるように駆動
信号コードブック内から最適な駆動信号を選ぶところに
その特徴がある。
説明する。音声符号化方式として、声道特性をモデル化
した合成フィルタを、音源である声帯をモデル化した駆
動信号により駆動して再生音声信号を合成する過程で得
られる駆動信号の情報を符号化して出力する方式があ
る。CELP方式はこのような音声符号化方式の一つに
分類され、再生音声信号の波形歪、すなわち入力音声信
号に対する再生音声信号の誤差が最小となるように駆動
信号コードブック内から最適な駆動信号を選ぶところに
その特徴がある。
【0004】図5において、パラメータ抽出部2は端子
1から入力される音声信号について20msec程度のフレー
ム毎に線形予測分析を行い、合成フィルタ4のパラメー
タを抽出する。このパラメータをパラメータ符号化部3
で符号化し、その情報を出力端子9に出力する。
1から入力される音声信号について20msec程度のフレー
ム毎に線形予測分析を行い、合成フィルタ4のパラメー
タを抽出する。このパラメータをパラメータ符号化部3
で符号化し、その情報を出力端子9に出力する。
【0005】駆動信号コードブック5は、合成フィルタ
4を駆動する駆動信号を表現するために割り当てられた
ビット数をMとして、予め2M 個の駆動信号ベクトルを
格納している。格納される各々の駆動信号ベクトルを合
成フィルタ4に通過させることにより、短時間区間の再
生信号候補が2M 個合成される。歪計算部6において
は、入力音声信号に対する各々の再生信号候補の波形歪
が計算され、コード選択部7より上記歪が最小となる再
生信号を合成した駆動信号ベクトルに予め付されている
駆動信号コード(Mビット)が出力端子8へ出力され
る。
4を駆動する駆動信号を表現するために割り当てられた
ビット数をMとして、予め2M 個の駆動信号ベクトルを
格納している。格納される各々の駆動信号ベクトルを合
成フィルタ4に通過させることにより、短時間区間の再
生信号候補が2M 個合成される。歪計算部6において
は、入力音声信号に対する各々の再生信号候補の波形歪
が計算され、コード選択部7より上記歪が最小となる再
生信号を合成した駆動信号ベクトルに予め付されている
駆動信号コード(Mビット)が出力端子8へ出力され
る。
【0006】このようにCELP方式では、符号化側か
ら伝送する駆動信号コードと合成フィルタのパラメータ
から合成される再生信号は、原入力音声信号に対する波
形歪が最小となることが符号化側で確認されている。従
って、復号化側においても8kbps 秒程度の伝送レート
においては、波形歪の少ない良好な再生音声を生成する
ことが可能となる。しかし、CELP方式は8kbpsよ
り低い伝送レートでは、駆動信号に割り当てることので
きるビット数が少ないので、再生音声信号の波形歪が知
覚されるようになる。特に、6kbps 程度の低レートに
なると再生音声信号の品質劣化が増大する。
ら伝送する駆動信号コードと合成フィルタのパラメータ
から合成される再生信号は、原入力音声信号に対する波
形歪が最小となることが符号化側で確認されている。従
って、復号化側においても8kbps 秒程度の伝送レート
においては、波形歪の少ない良好な再生音声を生成する
ことが可能となる。しかし、CELP方式は8kbpsよ
り低い伝送レートでは、駆動信号に割り当てることので
きるビット数が少ないので、再生音声信号の波形歪が知
覚されるようになる。特に、6kbps 程度の低レートに
なると再生音声信号の品質劣化が増大する。
【0007】
【発明が解決しようとする課題】上述したように、比較
的低い伝送レートで高品質な符号化ができる音声符号化
方式であるCELP方式は、伝送レートが6kbps 程度
まで低くなると、駆動信号に割り当てるビット数の制限
から高品質の音声符号化を行なえなくなるという問題が
あった。本発明は、6kbps程度の伝送レートでも高品
質の音声を再生できる音声符号化装置を提供することを
目的とする。
的低い伝送レートで高品質な符号化ができる音声符号化
方式であるCELP方式は、伝送レートが6kbps 程度
まで低くなると、駆動信号に割り当てるビット数の制限
から高品質の音声符号化を行なえなくなるという問題が
あった。本発明は、6kbps程度の伝送レートでも高品
質の音声を再生できる音声符号化装置を提供することを
目的とする。
【0008】
【課題を解決するための手段】上述した目的を達成する
ため、本発明の音声符号化装置は入力音声信号を低域信
号と高域信号とに帯域分割する帯域分割手段と、低域信
号を波形符号化する第1の符号化手段と、高域信号のス
ペクトラム振幅を符号化する第2の符号化手段とを有す
ることを特徴とする。
ため、本発明の音声符号化装置は入力音声信号を低域信
号と高域信号とに帯域分割する帯域分割手段と、低域信
号を波形符号化する第1の符号化手段と、高域信号のス
ペクトラム振幅を符号化する第2の符号化手段とを有す
ることを特徴とする。
【0009】また、本発明は入力音声信号に対応する再
生信号を合成するための合成フィルタの駆動信号の情報
を符号化する音声符号化装置において、入力音声信号か
ら合成フィルタのパラメータを抽出するパラメータ抽出
手段と、入力音声信号を低域信号と高域信号に帯域分割
する帯域分割手段と、パラメータ抽出手段により抽出さ
れたパラメータと低域信号に基づいて低域信号に対応す
る再生信号の波形歪がより小さくする駆動信号を選択し
て該駆動信号の低域成分を符号化する第1の符号化手段
と、パラメータ抽出手段により抽出されたパラメータと
高域信号に基づいて駆動信号の高域成分のスペクトラム
振幅を符号化する第2の符号化手段とを有することを特
徴とする。
生信号を合成するための合成フィルタの駆動信号の情報
を符号化する音声符号化装置において、入力音声信号か
ら合成フィルタのパラメータを抽出するパラメータ抽出
手段と、入力音声信号を低域信号と高域信号に帯域分割
する帯域分割手段と、パラメータ抽出手段により抽出さ
れたパラメータと低域信号に基づいて低域信号に対応す
る再生信号の波形歪がより小さくする駆動信号を選択し
て該駆動信号の低域成分を符号化する第1の符号化手段
と、パラメータ抽出手段により抽出されたパラメータと
高域信号に基づいて駆動信号の高域成分のスペクトラム
振幅を符号化する第2の符号化手段とを有することを特
徴とする。
【0010】
【作用】入力音声信号を帯域分割して得られた低域信号
と高域信号のうち、低域信号は従来の符号化と同じよう
に波形符号化され、例えば時間領域の波形歪が最小化す
るように符号化が行われる。これによって、入力音声信
号の低域信号はスペクトラムの振幅特性と位相特性の両
方の情報が保たれる。これに対し、高域信号はスペクト
ラム振幅のみが符号化され、例えば入力音声信号に対し
て再生音声信号の高域成分のスペクトラム振幅特性だけ
が一致するように符号化が行われる。
と高域信号のうち、低域信号は従来の符号化と同じよう
に波形符号化され、例えば時間領域の波形歪が最小化す
るように符号化が行われる。これによって、入力音声信
号の低域信号はスペクトラムの振幅特性と位相特性の両
方の情報が保たれる。これに対し、高域信号はスペクト
ラム振幅のみが符号化され、例えば入力音声信号に対し
て再生音声信号の高域成分のスペクトラム振幅特性だけ
が一致するように符号化が行われる。
【0011】また、合成フィルタの駆動信号の情報を符
号化する場合、本発明では駆動信号の低域成分は低域信
号に対応する再生信号の波形歪が最小化されるように符
号化され、また駆動信号の高域成分はスペクトラム振幅
のみが符号化される。
号化する場合、本発明では駆動信号の低域成分は低域信
号に対応する再生信号の波形歪が最小化されるように符
号化され、また駆動信号の高域成分はスペクトラム振幅
のみが符号化される。
【0012】人間の聴覚は、音の高域スペクトラムの振
幅特性の違いに対しては敏感であるが、位相特性の違い
に対しては鈍感であることが知られている。従って、本
発明では聴感上の品質劣化をもたらすことなく、高域ス
ペクトラムの位相特性に割り当てるビット数が零となる
ことにより、低レートでも高品質な音声符号化が可能と
なる。
幅特性の違いに対しては敏感であるが、位相特性の違い
に対しては鈍感であることが知られている。従って、本
発明では聴感上の品質劣化をもたらすことなく、高域ス
ペクトラムの位相特性に割り当てるビット数が零となる
ことにより、低レートでも高品質な音声符号化が可能と
なる。
【0013】
【実施例】以下、図面を参照して本発明の実施例を説明
する。図1は、本発明の一実施例に係る音声符号化装置
のブロック図である。
する。図1は、本発明の一実施例に係る音声符号化装置
のブロック図である。
【0014】図1に示す音声符号化装置は、帯域分割部
11、低域波形符号化部12、高域スペクトラム振幅符
号化部13およびマルチプレクサ14からなる。端子1
0から入力される入力音声信号は、帯域分割部11で低
域信号と高域信号とに周波数帯域が分割される。この帯
域分割部11は、例えばディジタルフィルタや、離散フ
ーリエ変換などを用いて実現できる。
11、低域波形符号化部12、高域スペクトラム振幅符
号化部13およびマルチプレクサ14からなる。端子1
0から入力される入力音声信号は、帯域分割部11で低
域信号と高域信号とに周波数帯域が分割される。この帯
域分割部11は、例えばディジタルフィルタや、離散フ
ーリエ変換などを用いて実現できる。
【0015】帯域分割部11からの低域信号は、低域波
形符号化部12で波形符号化され、所定の符号化された
パラメータが出力される。ここで、波形符号化とは再生
音声信号の時間領域での歪(入力音声信号に対する再生
音声信号の誤差)を最小化するような符号化全てを指
す。なお、波形符号化は同様の処理をスペクトラム領域
でも行うことが可能である。すなわち、再生音声信号の
スペクトラム振幅および位相の両方の歪を最小化する符
号化を行うことで、等価的に時間領域の歪を最小化でき
るため、この様な符号化も波形符号化と見なすことがで
きる。
形符号化部12で波形符号化され、所定の符号化された
パラメータが出力される。ここで、波形符号化とは再生
音声信号の時間領域での歪(入力音声信号に対する再生
音声信号の誤差)を最小化するような符号化全てを指
す。なお、波形符号化は同様の処理をスペクトラム領域
でも行うことが可能である。すなわち、再生音声信号の
スペクトラム振幅および位相の両方の歪を最小化する符
号化を行うことで、等価的に時間領域の歪を最小化でき
るため、この様な符号化も波形符号化と見なすことがで
きる。
【0016】本実施例では、これらのうち時間領域での
歪を最小化する波形符号化の例で説明する。具体的には
低域波形符号化部12で用いる波形符号化の方式として
は、設定される伝送レートによってADPCM、マルチ
パルス、CELP等の様々な公知の方式を用いることが
できる。CELPについては、前掲の文献1に詳しく述
べられている。
歪を最小化する波形符号化の例で説明する。具体的には
低域波形符号化部12で用いる波形符号化の方式として
は、設定される伝送レートによってADPCM、マルチ
パルス、CELP等の様々な公知の方式を用いることが
できる。CELPについては、前掲の文献1に詳しく述
べられている。
【0017】一方、帯域分割部11からの高域信号は、
高域スペクトラム振幅符号化部13においてスペクトラ
ムの振幅成分の情報だけが抽出され、符号化される。低
域波形符号化部12および高域スペクトラム振幅符号化
部13からの符号化出力はマルチプレクサ14で再生さ
れ、出力端子15へ出力される。
高域スペクトラム振幅符号化部13においてスペクトラ
ムの振幅成分の情報だけが抽出され、符号化される。低
域波形符号化部12および高域スペクトラム振幅符号化
部13からの符号化出力はマルチプレクサ14で再生さ
れ、出力端子15へ出力される。
【0018】図2は、高域スペクトラム振幅符号化部1
3の具体的な構成例を示すブロック図である。図2にお
いて、図1の帯域分割部11から出力される高域信号は
端子20より入力され、パラメータ抽出部21で線形予
測分析(LPC)がなされた後、高域信号のスペクトラ
ム振幅の包絡を表す合成フィルタ(伝達関数HH (z)と
する)のフィルタ係数情報が抽出される。このフィルタ
係数情報は予測フィルタ22に出力され、フィルタ係数
情報は符号化されて端子24に出力される。線形予測分
析としては、自己相関法や共分散法など公知の方法を用
いることができる。この詳細はL.R.Rabiner 氏とR.W.Sc
hafer 氏の共著になる「音声のディジタル信号処理
(上)(下)」(コロナ社)(文献2)に記載されてい
る。
3の具体的な構成例を示すブロック図である。図2にお
いて、図1の帯域分割部11から出力される高域信号は
端子20より入力され、パラメータ抽出部21で線形予
測分析(LPC)がなされた後、高域信号のスペクトラ
ム振幅の包絡を表す合成フィルタ(伝達関数HH (z)と
する)のフィルタ係数情報が抽出される。このフィルタ
係数情報は予測フィルタ22に出力され、フィルタ係数
情報は符号化されて端子24に出力される。線形予測分
析としては、自己相関法や共分散法など公知の方法を用
いることができる。この詳細はL.R.Rabiner 氏とR.W.Sc
hafer 氏の共著になる「音声のディジタル信号処理
(上)(下)」(コロナ社)(文献2)に記載されてい
る。
【0019】予測フィルタ22は、パラメータ抽出部2
1からのフィルタ係数情報より、合成フィルタの逆フィ
ルタとして構成され、その伝達特性は1/HH (z) で与
えられる。この予測フィルタ22は高域信号が入力され
ることにより、予測残差信号を出力する。パワー計算部
23では予測残差信号のパワーが求められ、そのパワー
情報が符号化されて端子24に出力される。この予測残
差信号は通常、白色雑音(但し、低域成分はもたない)
となるので、予測残差信号の高域スペクトラム振幅の情
報は、予測残差信号のパワーだけで記述できることにな
る。
1からのフィルタ係数情報より、合成フィルタの逆フィ
ルタとして構成され、その伝達特性は1/HH (z) で与
えられる。この予測フィルタ22は高域信号が入力され
ることにより、予測残差信号を出力する。パワー計算部
23では予測残差信号のパワーが求められ、そのパワー
情報が符号化されて端子24に出力される。この予測残
差信号は通常、白色雑音(但し、低域成分はもたない)
となるので、予測残差信号の高域スペクトラム振幅の情
報は、予測残差信号のパワーだけで記述できることにな
る。
【0020】従って、予測残差信号のパワー情報と合成
フィルタのパラメータ情報を符号化して伝送すれば、復
号側では復号された高域スペクトラムのパワーと同じに
白色雑音のパワーを設定し、この白色雑音を合成フィル
タ(伝達関数HH (z) )に入力することで、再生高域信
号を得ることができる。
フィルタのパラメータ情報を符号化して伝送すれば、復
号側では復号された高域スペクトラムのパワーと同じに
白色雑音のパワーを設定し、この白色雑音を合成フィル
タ(伝達関数HH (z) )に入力することで、再生高域信
号を得ることができる。
【0021】図3は、本発明の他の実施例に係る音声符
号化装置のブロック図である。この実施例は、合成フィ
ルタの駆動信号の低域成分と高域成分を符号化するもの
であり、パラメータ抽出部31、重み付けフィルタ3
2、帯域分割部33、低域駆動信号波形符号化部34、
高域駆動信号スペクトラム振幅符号化部35およびマル
チプレクサ36からなる。
号化装置のブロック図である。この実施例は、合成フィ
ルタの駆動信号の低域成分と高域成分を符号化するもの
であり、パラメータ抽出部31、重み付けフィルタ3
2、帯域分割部33、低域駆動信号波形符号化部34、
高域駆動信号スペクトラム振幅符号化部35およびマル
チプレクサ36からなる。
【0022】パラメータ抽出部31は、端子30から入
力される音声信号のスペクトラム振幅の包絡を表す合成
フィルタのパラメータ(フィルタ係数情報)を抽出し、
このパラメータ情報をマルチプレクサ36、低域駆動信
号波形符号化部34、高域駆動信号スペクトラム振幅符
号化部35および重み付けフィルタ32へ出力する。パ
ラメータ抽出部31で用いられる線形予測分析の実現方
法は、第1の実施例で述べた通りである。
力される音声信号のスペクトラム振幅の包絡を表す合成
フィルタのパラメータ(フィルタ係数情報)を抽出し、
このパラメータ情報をマルチプレクサ36、低域駆動信
号波形符号化部34、高域駆動信号スペクトラム振幅符
号化部35および重み付けフィルタ32へ出力する。パ
ラメータ抽出部31で用いられる線形予測分析の実現方
法は、第1の実施例で述べた通りである。
【0023】重み付けフィルタ32は、合成フィルタの
伝達特性H(z) をとして、W(z) =H(z/γ) /H(z)
なる伝達特性のフィルタであり、CELP方式ではよく
用いられるものである。ここにO<γ≦1であり、γ=
1とすると重み付けフィルタを用いない構成と等価にな
る。重み付けフィルタ32によって重み付けられた音声
信号は、帯域分割部33で低域信号と高域信号とに周波
数帯域が分割される。帯域分割部33は、例えばディジ
タルフィルタにより構成されるローパスフィルタとハイ
パスフィルタにより実現できる。
伝達特性H(z) をとして、W(z) =H(z/γ) /H(z)
なる伝達特性のフィルタであり、CELP方式ではよく
用いられるものである。ここにO<γ≦1であり、γ=
1とすると重み付けフィルタを用いない構成と等価にな
る。重み付けフィルタ32によって重み付けられた音声
信号は、帯域分割部33で低域信号と高域信号とに周波
数帯域が分割される。帯域分割部33は、例えばディジ
タルフィルタにより構成されるローパスフィルタとハイ
パスフィルタにより実現できる。
【0024】低域駆動信号波形符号化部34は、帯域分
割部33からの低域信号とパラメータ抽出部31からの
合成フィルタのパラメータ情報を入力し、駆動信号の低
域成分の波形符号化を行う。この符号化方式には、例え
ばマルチパルスやCELP方式などの公知の駆動信号符
号化の方法をそのまま適用することができる。この際に
用いる合成フィルタとしては、例えば帯域分割部33で
用いたものと同様の特性のローパスフィルタ(伝達特性
をHLPF (z) とする)によって高域成分を除いたものを
用いることができる。
割部33からの低域信号とパラメータ抽出部31からの
合成フィルタのパラメータ情報を入力し、駆動信号の低
域成分の波形符号化を行う。この符号化方式には、例え
ばマルチパルスやCELP方式などの公知の駆動信号符
号化の方法をそのまま適用することができる。この際に
用いる合成フィルタとしては、例えば帯域分割部33で
用いたものと同様の特性のローパスフィルタ(伝達特性
をHLPF (z) とする)によって高域成分を除いたものを
用いることができる。
【0025】図4は、低域駆動信号符号化部34をCE
LP方式の駆動信号符号化を適用して実現した一例を示
すブロック図である。この低域駆動信号符号化部34
は、インパルス応答計算部41、ローパスフィルタ4
2、コードブック45,46、長期ベクトル量子化部5
0、短期ベクトル量子化部60、加算器44および符号
化部47からなる。コードブック45,46は、長期ベ
クトル量子化部50および短期ベクトル量子化部60で
それぞれ用いられる駆動信号のコードベクトルを格納し
たものである。
LP方式の駆動信号符号化を適用して実現した一例を示
すブロック図である。この低域駆動信号符号化部34
は、インパルス応答計算部41、ローパスフィルタ4
2、コードブック45,46、長期ベクトル量子化部5
0、短期ベクトル量子化部60、加算器44および符号
化部47からなる。コードブック45,46は、長期ベ
クトル量子化部50および短期ベクトル量子化部60で
それぞれ用いられる駆動信号のコードベクトルを格納し
たものである。
【0026】インパルス応答計算部41は、端子40か
ら入力される重み付け合成フィルタ(伝達関数H(z/
γ) )のインパルス応答を計算する。重み付け合成フィ
ルタは、合成フィルタ(伝達関数H(z) )のパラメータ
情報を基に作成される。ローパスフィルタ42は、図3
の帯域分割部33で用いたローパスフィルタと同様の特
性を持ったもので、インパルス応答計算部41で計算さ
れたインパルス応答を入力として、高域成分が除去され
たインパルス応答hLPF (n) を出力する。
ら入力される重み付け合成フィルタ(伝達関数H(z/
γ) )のインパルス応答を計算する。重み付け合成フィ
ルタは、合成フィルタ(伝達関数H(z) )のパラメータ
情報を基に作成される。ローパスフィルタ42は、図3
の帯域分割部33で用いたローパスフィルタと同様の特
性を持ったもので、インパルス応答計算部41で計算さ
れたインパルス応答を入力として、高域成分が除去され
たインパルス応答hLPF (n) を出力する。
【0027】長期ベクトル量子化部50は、適応コード
ブック45内のコードベクトルにゲインを乗じて駆動信
号eL (n) を得るための乗算器51と、駆動信号e
L (n) とインパルス応答hLPF (n) との畳み込みを行っ
て再生ベクトルを合成する合成フィルタ52と、端子4
3よりの低域信号に対する合成フィルタ52の出力信号
の歪を評価するために、両信号の差を求める減算器53
および歪計算部54と、上記の歪が最小となるコードベ
クトルをコードブック45から選択するコード選択部5
5からなる。コード選択部55で選択されたコードベク
トルのコードと乗算器51のゲインの情報は、駆動信号
情報符号化部47へ入力される。乗算器51から出力さ
れる駆動信号eL (n) は、加算器44へも入力される。
低域信号と歪が最小となるときの再生ベクトルとの差信
号である減算器53の出力信号は、短期ベクトル量子化
部60へも入力される。
ブック45内のコードベクトルにゲインを乗じて駆動信
号eL (n) を得るための乗算器51と、駆動信号e
L (n) とインパルス応答hLPF (n) との畳み込みを行っ
て再生ベクトルを合成する合成フィルタ52と、端子4
3よりの低域信号に対する合成フィルタ52の出力信号
の歪を評価するために、両信号の差を求める減算器53
および歪計算部54と、上記の歪が最小となるコードベ
クトルをコードブック45から選択するコード選択部5
5からなる。コード選択部55で選択されたコードベク
トルのコードと乗算器51のゲインの情報は、駆動信号
情報符号化部47へ入力される。乗算器51から出力さ
れる駆動信号eL (n) は、加算器44へも入力される。
低域信号と歪が最小となるときの再生ベクトルとの差信
号である減算器53の出力信号は、短期ベクトル量子化
部60へも入力される。
【0028】短期ベクトル量子化部60は、コードブッ
ク46内のコードベクトルにゲインを乗じて駆動信号e
S (n) を得るための乗算器61と、この駆動信号e
S (n) とインパルス応答hLPF (n) との畳み込みを行っ
て再生ベクトルを合成する合成フィルタ62と、合成フ
ィルタ62の出力信号の歪を評価するために、長期ベク
トル量子化部50内の減算器53からの差信号に対する
合成フィルタ62の出力信号の誤差を求める減算器63
および歪計算部64と、この歪が最小となるコードベク
トルをコードブック46から選択するコード選択部65
からなる。コード選択部65で選択されたコードブック
のコードと乗算器61のゲインの情報は、駆動信号情報
符号化部47へ入力される。
ク46内のコードベクトルにゲインを乗じて駆動信号e
S (n) を得るための乗算器61と、この駆動信号e
S (n) とインパルス応答hLPF (n) との畳み込みを行っ
て再生ベクトルを合成する合成フィルタ62と、合成フ
ィルタ62の出力信号の歪を評価するために、長期ベク
トル量子化部50内の減算器53からの差信号に対する
合成フィルタ62の出力信号の誤差を求める減算器63
および歪計算部64と、この歪が最小となるコードベク
トルをコードブック46から選択するコード選択部65
からなる。コード選択部65で選択されたコードブック
のコードと乗算器61のゲインの情報は、駆動信号情報
符号化部47へ入力される。
【0029】加算器44は駆動信号eS (n) ,eL (n)
をサンプル毎に加算し、その加算値をベクトル化してコ
ードブック45へ格納する。駆動信号情報符号化部47
は、ベクトル量子化部50,60よりのコードベクトル
とゲインの情報を組み合わせて符号化し、端子48を介
して図3のマルチプレクサ36へ出力する。
をサンプル毎に加算し、その加算値をベクトル化してコ
ードブック45へ格納する。駆動信号情報符号化部47
は、ベクトル量子化部50,60よりのコードベクトル
とゲインの情報を組み合わせて符号化し、端子48を介
して図3のマルチプレクサ36へ出力する。
【0030】一方、図3の高域駆動信号スペクトラム振
幅符号化部35は、帯域分割部33からの高域信号を入
力し、駆動信号の高域スペクトラムの振幅成分の情報だ
けを抽出して符号化し、マルチプレクサ36へ出力す
る。高域スペクトラムの包絡情報は既にパラメータ抽出
部31で抽出されているので、高域駆動信号スペクトラ
ム振幅符号化部35では駆動信号のパワー情報だけを抽
出すればよい。パワー情報を抽出するには、例えば第1
の実施例で図2を用いて述べたように、高域信号の予測
残差信号のパワーを求めればよい。すなわち、高域駆動
信号スペクトラム振幅符号化部35は図2のパラメータ
抽出部21を除いた構成で、予測フィルタ22の係数情
報は図3のパラメータ抽出部31から与えることで実現
することができる。
幅符号化部35は、帯域分割部33からの高域信号を入
力し、駆動信号の高域スペクトラムの振幅成分の情報だ
けを抽出して符号化し、マルチプレクサ36へ出力す
る。高域スペクトラムの包絡情報は既にパラメータ抽出
部31で抽出されているので、高域駆動信号スペクトラ
ム振幅符号化部35では駆動信号のパワー情報だけを抽
出すればよい。パワー情報を抽出するには、例えば第1
の実施例で図2を用いて述べたように、高域信号の予測
残差信号のパワーを求めればよい。すなわち、高域駆動
信号スペクトラム振幅符号化部35は図2のパラメータ
抽出部21を除いた構成で、予測フィルタ22の係数情
報は図3のパラメータ抽出部31から与えることで実現
することができる。
【0031】より正確に駆動信号の高域スペクトラム振
幅の情報(パワー情報)を求めるには、高域スペクトラ
ムをいくつかのバンドに分解し、各バンド毎に予測残差
信号のパワーを求める方法がある。さらに精度よく駆動
信号の高域スペクトラム振幅の情報を求める方法とし
て、駆動信号と合成フィルタを用いて合成される再生信
号の高域スペクトラム振幅の歪を最小化する方法があ
る。
幅の情報(パワー情報)を求めるには、高域スペクトラ
ムをいくつかのバンドに分解し、各バンド毎に予測残差
信号のパワーを求める方法がある。さらに精度よく駆動
信号の高域スペクトラム振幅の情報を求める方法とし
て、駆動信号と合成フィルタを用いて合成される再生信
号の高域スペクトラム振幅の歪を最小化する方法があ
る。
【0032】後者の方法について説明する。今、高域信
号を抽出するフィルタの伝達特性をHHPF (ω)、帯域
分割される直前の重み付けられた入力音声信号をX
(ω)、重み付け合成フィルタの伝達特性をH(ω)、
スペクトラム振幅が調整される前の駆動信号をE(ω)
とすると、区間K(Kmin ≦ω≦Kmax )でのスペクト
ラム振幅の歪PK は式(1) で表される。
号を抽出するフィルタの伝達特性をHHPF (ω)、帯域
分割される直前の重み付けられた入力音声信号をX
(ω)、重み付け合成フィルタの伝達特性をH(ω)、
スペクトラム振幅が調整される前の駆動信号をE(ω)
とすると、区間K(Kmin ≦ω≦Kmax )でのスペクト
ラム振幅の歪PK は式(1) で表される。
【0033】
【数1】
【0034】ここで、σK は区間Kの帯域のスペクトラ
ム振幅の調整値を表す。mは、通常1〜2の値が用いら
れる。PK をσK m で偏微分した値を零とおくことによ
り、歪PK を最小にする式(2) の調整値が得られる。
ム振幅の調整値を表す。mは、通常1〜2の値が用いら
れる。PK をσK m で偏微分した値を零とおくことによ
り、歪PK を最小にする式(2) の調整値が得られる。
【0035】
【数2】
式(2) を基に、式(3) に示す帯域のσK を求め符号化す
ることは、当業者であれば容易に実現できる。
ることは、当業者であれば容易に実現できる。
【0036】
【数3】
【0037】従って、式(2) により高域の帯域分割の境
界値の周波数(Kmin やKmax )を与えることにより、
任意の分割方法で高域スペクトラム振幅の調整値σK を
求めることができる。復号される再生高域信号の区間K
でのスペクトラムSH (ω)は、例えば式(4) で求める
ことができる。
界値の周波数(Kmin やKmax )を与えることにより、
任意の分割方法で高域スペクトラム振幅の調整値σK を
求めることができる。復号される再生高域信号の区間K
でのスペクトラムSH (ω)は、例えば式(4) で求める
ことができる。
【0038】
【数4】
【0039】式(4) を用いて逆フーリェ変換により時間
領域の高域再生信号を求め、これをフレーム毎に波形を
滑らかに接続させることにより、聴感上の劣化のない高
域信号を再生することができる。
領域の高域再生信号を求め、これをフレーム毎に波形を
滑らかに接続させることにより、聴感上の劣化のない高
域信号を再生することができる。
【0040】上述の調整値σK を求める際、スペクトラ
ム振幅の歪を評価する前に予め窓をかけてフレーム切り
出しによる不連続の影響を除いてから、式(1) 〜(4) を
用いてもよい。また、式(1)(2)において駆動信号|E
(ω)|=1とおいてσK の値を求めてもよい。さら
に、ハイパスフィルタの伝達特性HHPF (ω)が区間K
内でほぼ1と近似できるならば、|HHPF (ω)|=1
とおいてσKの値を求めてもよい。
ム振幅の歪を評価する前に予め窓をかけてフレーム切り
出しによる不連続の影響を除いてから、式(1) 〜(4) を
用いてもよい。また、式(1)(2)において駆動信号|E
(ω)|=1とおいてσK の値を求めてもよい。さら
に、ハイパスフィルタの伝達特性HHPF (ω)が区間K
内でほぼ1と近似できるならば、|HHPF (ω)|=1
とおいてσKの値を求めてもよい。
【0041】このように本実施例によれば、入力音声信
号のうちの低域信号については、駆動信号の低域成分の
波形情報が符号化されて駆動信号のコードとゲインの情
報として、また高域信号については、スペクトラムの振
幅情報のみが符号化され、これらがマルチプレクサ36
で多重化されて出力される。
号のうちの低域信号については、駆動信号の低域成分の
波形情報が符号化されて駆動信号のコードとゲインの情
報として、また高域信号については、スペクトラムの振
幅情報のみが符号化され、これらがマルチプレクサ36
で多重化されて出力される。
【0042】
【発明の効果】本発明の音声符号化装置では、入力音声
信号のうち低域信号については波形情報、つまりスペク
トラムの振幅と位相の両方の情報を符号化し、高域成分
についてはスペクトラムの振幅情報だけを符号化する
か、あるいは低域信号については低域信号に対応する再
生信号の波形歪が最小化される駆動信号を選択して該駆
動信号の低域成分を符号化し、高域信号については駆動
信号の高域成分のスペクトラム振幅のみを符号化するこ
とにより、高域信号の位相情報に割り当てるビット数を
全て削減できる。
信号のうち低域信号については波形情報、つまりスペク
トラムの振幅と位相の両方の情報を符号化し、高域成分
についてはスペクトラムの振幅情報だけを符号化する
か、あるいは低域信号については低域信号に対応する再
生信号の波形歪が最小化される駆動信号を選択して該駆
動信号の低域成分を符号化し、高域信号については駆動
信号の高域成分のスペクトラム振幅のみを符号化するこ
とにより、高域信号の位相情報に割り当てるビット数を
全て削減できる。
【0043】従って、本発明によれば符号量が大幅に減
少し、例えば6kbps 程度の低レートでも高品質に音声
を伝送することが可能となる。すなわち、人間の聴覚は
高域スペクトラムの位相特性の変化に鈍感であるため
に、このような低伝送レートにおいても、高域スペクト
ラムの位相情報を符号化しないことによる再生音声の品
質劣化が生じないという利点がある。
少し、例えば6kbps 程度の低レートでも高品質に音声
を伝送することが可能となる。すなわち、人間の聴覚は
高域スペクトラムの位相特性の変化に鈍感であるため
に、このような低伝送レートにおいても、高域スペクト
ラムの位相情報を符号化しないことによる再生音声の品
質劣化が生じないという利点がある。
【図1】本発明の一実施例に係る音声符号化装置のブロ
ック図
ック図
【図2】図1における高域スペクトラム振幅符号化部の
構成を示すブロック図
構成を示すブロック図
【図3】本発明の他の実施例に係る音声符号化装置のブ
ロック図
ロック図
【図4】図3における低域駆動信号波形符号化部の構成
を示すブロック図
を示すブロック図
【図5】従来の音声符号化装置のブロック図
11…帯域分割部 12…低域波形
符号化部 13…高域スペクトラム振幅符号化部 31…パラメー
タ抽出部 33…帯域分割部 34…低域駆動
信号波形符号化部 35…高域駆動信号スペクトラム振幅符号化部。
符号化部 13…高域スペクトラム振幅符号化部 31…パラメー
タ抽出部 33…帯域分割部 34…低域駆動
信号波形符号化部 35…高域駆動信号スペクトラム振幅符号化部。
Claims (2)
- 【請求項1】入力音声信号を低域信号と高域信号とに帯
域分割する帯域分割手段と、 前記低域信号を波形符号化する第1の符号化手段と、 前記高域信号のスペクトラム振幅を符号化する第2の符
号化手段とを有することを特徴とする音声符号化装置。 - 【請求項2】入力音声信号に対応する再生音声信号を合
成するための合成フィルタの駆動信号の情報を符号化す
る音声符号化装置において、 前記入力音声信号から前記合成フィルタのパラメータを
抽出するパラメータ抽出手段と、 前記入力音声信号を低域信号と高域信号に帯域分割する
帯域分割手段と、 前記パラメータ抽出手段により抽出されたパラメータと
前記低域信号に基づいて前記低域信号に対応する再生信
号の波形歪をより小さくする駆動信号を選択して該駆動
信号の低域成分を符号化する第1の符号化手段と、 前記パラメータ抽出手段により抽出されたパラメータと
前記高域信号に基づいて前記駆動信号の高域成分のスペ
クトラム振幅を符号化する第2の符号化手段とを有する
ことを特徴とする音声符号化装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16450391A JPH0537393A (ja) | 1991-07-04 | 1991-07-04 | 音声符号化装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16450391A JPH0537393A (ja) | 1991-07-04 | 1991-07-04 | 音声符号化装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0537393A true JPH0537393A (ja) | 1993-02-12 |
Family
ID=15794398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16450391A Pending JPH0537393A (ja) | 1991-07-04 | 1991-07-04 | 音声符号化装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0537393A (ja) |
-
1991
- 1991-07-04 JP JP16450391A patent/JPH0537393A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
JP3566652B2 (ja) | 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法 | |
US5778335A (en) | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding | |
JP4843124B2 (ja) | 音声信号を符号化及び復号化するためのコーデック及び方法 | |
JP4132109B2 (ja) | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 | |
JP3653826B2 (ja) | 音声復号化方法及び装置 | |
JP3234609B2 (ja) | 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化 | |
JP4121578B2 (ja) | 音声分析方法、音声符号化方法および装置 | |
JP4958780B2 (ja) | 符号化装置、復号化装置及びこれらの方法 | |
WO2003091989A1 (en) | Coding device, decoding device, coding method, and decoding method | |
JPH08123494A (ja) | 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置 | |
JPH08123495A (ja) | 広帯域音声復元装置 | |
JP4040126B2 (ja) | 音声復号化方法および装置 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
KR101610765B1 (ko) | 음성 신호의 부호화/복호화 방법 및 장치 | |
JPH09319398A (ja) | 信号符号化装置 | |
JP2000132193A (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
KR100554164B1 (ko) | 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 | |
JP4287840B2 (ja) | 符号化装置 | |
JPH08234795A (ja) | 音声符号化装置 | |
JP3785363B2 (ja) | 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 | |
JPH0537393A (ja) | 音声符号化装置 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP2002169595A (ja) | 固定音源符号帳及び音声符号化/復号化装置 | |
JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 |