JP3515215B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3515215B2
JP3515215B2 JP13129895A JP13129895A JP3515215B2 JP 3515215 B2 JP3515215 B2 JP 3515215B2 JP 13129895 A JP13129895 A JP 13129895A JP 13129895 A JP13129895 A JP 13129895A JP 3515215 B2 JP3515215 B2 JP 3515215B2
Authority
JP
Japan
Prior art keywords
voice
codebook
code
speech
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13129895A
Other languages
English (en)
Other versions
JPH08328595A (ja
Inventor
光男 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP13129895A priority Critical patent/JP3515215B2/ja
Priority to US08/650,830 priority patent/US5864797A/en
Priority to KR1019960018396A priority patent/KR960042522A/ko
Publication of JPH08328595A publication Critical patent/JPH08328595A/ja
Application granted granted Critical
Publication of JP3515215B2 publication Critical patent/JP3515215B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、符号駆動線形予測音
声符号化方式(CELP)、ピッチ同期雑音源符号励振
線形予測音声符号化方式(PSI−CELP)等の音声
符号化装置に関する。
【0002】
【従来の技術】近年、自動車電話、携帯電話の電波帯域
を有効に利用したり、マルチメディア通信における音声
部分の情報量を圧縮するために、低ビットレート音声符
号化の技術が脚光を浴びている。
【0003】この種の音声符号化方式として、符号駆動
線形予測音声符号化方式(CELP:Code Excited Lin
ear Prediction)、ピッチ同期雑音源符号励振線形予測
音声符号化方式(PSI−CELP:Pitch Synchronou
s Innovation Code ExcitedLinear Prediction )等が
既に開発されている。
【0004】CELP符号化方式は、入力音声のスペク
トル包絡に対応する線形フィルタを線形予測分析法によ
り構成し、それを符号帳(コードブック)に蓄えた時系
列符号ベクトルで駆動することにより音声を再生する符
号化方式である。
【0005】PSI−CELP符号化方式では、CEL
P符号化方式に基づいて、予め符号帳(コードブック)
に用意された候補ベクトルを励振源として線形予測フィ
ルタを駆動する方式である。PSI−CELP符号化方
式では、励振源が、音声のピッチ周期に対応する適応コ
ードブック周期に同期して周期化されるという点に特徴
がある。
【0006】図6は、CELP符号化装置の一例を示し
ている。まず、連続した入力音声信号が5〜10ms程
度の一定間隔の区間に分割される。この間隔をここで
は、サブフレームということにする。
【0007】次に、線形予測分析部101によって、入
力音声はサブフレーム単位で線形予測分析され、P次の
線形予測係数αi (i=1,2…P)が計算される。そ
して、得られた線形予測係数αi に基づいて、線形予測
合成フィルタ102が作成される。
【0008】次に、適応コードブック103の探索が行
なわれる。適応コードブック103は、音声の周期成
分、つまりピッチを表現するために用いられる。
【0009】適応コードブック103の入力符号に対応
する出力符号ベクトルは、前サブフレームおよびそれ以
前の線形予測合成フィルタ102の励振信号を、後ろか
ら入力符号に対応する長さ(以下、ラグという)分切り
出し、それをサブフレーム長になるまで繰り返し並べる
ことにより作成される。
【0010】作成された出力符号ベクトルで線形予測合
成フィルタ102が駆動されて、再生音声が作成され
る。そして、入力音声と再生音声との距離(再生音声の
原音声に対する歪)が理論的に最小になるような利得が
再生音声にかけられた後、入力音声と再生音声との距離
が距離計算部105で計算される。
【0011】このような操作が、入力符号ごとに繰り返
され、距離が最小となるような励振ベクトルの符号が選
択される。
【0012】この後、雑音コードブック104の探索が
行なわれる。雑音コードブック104は、適応コードブ
ック103で表現できない音声の変動部分を表現するた
めに用いられる。雑音コードブック104には、通常白
色ガウス性雑音を基調とし、1サブフレーム分の長さの
各種の符号ベクトル(以下、雑音符号ベクトルという)
が予め記憶されている。
【0013】まず、雑音コードブック104に記憶され
ている各種の雑音符号ベクトルのうちから、入力符号に
対応する雑音符号ベクトルが読み出される。次に、適応
コードブックの探索で選ばれた符号ベクトルの影響を除
くために、読み出された雑音符号ベクトルの合成フィル
タ出力は、適応コードブックの探索で選ばれた符号ベク
トルの合成フィルタ出力に対して直交化せしめられ、再
生音声が作成される。そして、入力音声と再生音声との
距離が理論的に最小になるような利得が再生音声にかけ
られた後、入力音声と再生音声との距離が距離計算部1
05で計算される。
【0014】このような操作が、入力符号ごとに繰り返
され、距離が最小となるような励振ベクトルの符号が選
択される。
【0015】適応コードブック103の探索によって選
択された適応コードブック103の入力符号およびそれ
に対応する利得を表す符号、雑音コードブック104の
探索によって選択された雑音コードブック104の入力
符号およびそれに対応する利得を表す符号ならびに線形
予測係数が符号化出力として出力される。
【0016】
【発明が解決しようとする問題点】適応コードブック1
03は、有声部でかつ定常な部分において音声のピッチ
構造を効率的に表現する。しかしながら、前サブフレー
ムの励振信号のパワーがほとんどない場合、現サブフレ
ームが、前サブフレームと異なる成分から構成されてい
る音声の立ち上がり部等の非定常性音声である場合、現
サブフレームが、ピッチ周期を持たない無声部等の雑音
性音声である場合には、適応コードブック103は適当
な符号ベクトルを構成することができず、再生音質を悪
化させてしまうという問題がある。
【0017】このような問題に対処するため、ランダム
成分を出力するコードブックを適応コードブック103
に対して補完的に用意する手法が提案されている。この
ようなコードブックは、雑音コードブックと同様にどの
サブフレームにおいても入力符号に対して固定的な対応
関係にある符号ベクトルを出力する構造を持つため、固
定コードブックと呼ばれる。
【0018】固定コードブックは、適応コードブックと
同時に検索され、歪最小基準によりどちらかの出力ベク
トルが排他的に選択される。つまり、適応コードブック
と固定コードブックとは、互いに補完しあって1つのコ
ードブックとして動作する。
【0019】また、周期的ではあるが前サブフレームの
成分だけでは対応できない成分、すなわち、適応コード
ブックで表せないような有声部の非定常成分を、雑音コ
ードブックによって小さな歪で表現するようにするため
に、適応符号ベクトルの周期に対応させて雑音符号ベク
トルを周期化する手法もすでに提案されている。
【0020】しかしながら、固定コードブックおよび雑
音コードブックに記憶されている符号ベクトルは、そも
そも雑音に対する符号ベクトルであるため、いずれの手
法を用いても、入力音声の周期部分のうち、適応コード
ブックで十分に表現されなかった部分を、表現すること
ができないことがあった。
【0021】この発明は、入力音声の周期部分のうち、
適応コードブックで十分に表現されなかった部分を表現
することが可能となり、再生音声の音質を向上させるこ
とができる音声符号化装置を提供することを目的とす
る。
【0022】
【問題点を解決するための手段】この発明による第1の
音声符号化装置は、入力音声を線形予測分析することに
より音声合成フィルタを構成し、コードブックに蓄積さ
れている符号ベクトルと、音声合成フィルタとに基づい
て音声を再生し、再生された音声と入力音声とに基づい
て音声を符号化する音声符号化装置において、有声音の
ピッチ波形に対する複数種類の符号ベクトルが記憶され
たパルスコードブックが設けられており、インパルス列
の探索によって選択されたインパルス列に基づいて、パ
ルスコードブックから読み出された符号ベクトルが周期
化されることを特徴とする。
【0023】この発明による第2の音声符号化装置は、
入力音声を線形予測分析することにより、音声合成フィ
ルタを構成し、過去の励振信号に対応する符号ベクトル
を記憶する適応コードブックと、雑音に対する符号ベク
トルが記憶された雑音コードブックとを含むコードブッ
クから読み出された符号ベクトルと、音声合成フィルタ
とに基づいて音声を再生し、再生された音声と入力音声
とに基づいて音声を符号化する音声符号化装置におい
て、有声音のピッチ波形に対する複数種類の符号ベクト
ルが記憶されたパルスコードブックが、雑音コードブッ
クに対して補完的に設けられており、パルスコードブッ
クから読み出された符号ベクトルに基づいて再生音声を
作成するにあたっては、入力音声のピッチ周期間隔でイ
ンパルスが発生するインパルス列であって初期位置が互
いに異なる複数種類のインパルス列と、音声合成フィル
タとに基づいて、各インパルス列に対応する再生音声が
それぞれ作成され、再生音声と入力音声との歪が最も小
さくなるインパルス列が選択され、パルスコードブック
から読み出された符号ベクトルが、選択されたインパル
ス列に基づいて周期化されることを特徴とする。
【0024】この発明による第3の音声符号化装置は、
入力音声を線形予測分析することにより、音声合成フィ
ルタを作成する手段、過去の励振信号に対応する符号ベ
クトルが記憶された適応コードブックから、切り出し位
置を変えて複数の符号ベクトルを順次切り出し、切り出
された各符号ベクトルで音声合成フィルタを駆動するこ
とによって、切り出された各符号ベクトルに対応する再
生音声をそれぞれ作成し、再生音声と入力音声との歪が
最も小さくなる符号ベクトルを探索する第1探索手段、
ならびに、雑音に対する複数種類の符号ベクトルが記憶
された雑音コードブックおよび有声音のピッチ波形に対
する複数種類の符号ベクトルが記憶されたパルスコード
ブックから、各符号ベクトルを順次読み出し、読み出さ
れた各符号ベクトルと、音声合成フィルタとに基づい
て、読み出された各符号ベクトルに対応する再生音声を
それぞれ作成し、再生音声と入力音声との歪が最も小さ
くなる符号ベクトルを探索する第2探索手段を備え、第
2探索手段は、パルスコードブックから読み出された符
号ベクトルに基づいて再生音声を作成するにあたり、入
力音声のピッチ周期間隔でインパルスが発生するインパ
ルス列であって初期位置が互いに異なる複数種類のイン
パルス列と、音声合成フィルタとに基づいて、各インパ
ルス列に対応する再生音声をそれぞれ作成し、再生音声
と入力音声との歪が最も小さくなるインパルス列を選択
し、パルスコードブックから読み出された符号ベクトル
を、選択されたインパルス列に基づいて、周期化する手
段を備えていることを特徴とする。
【0025】この発明による第4の音声符号化装置は、
入力音声を線形予測分析することにより、音声合成フィ
ルタを作成する手段、過去の励振信号に対応する符号ベ
クトルが記憶された適応コードブックから、切り出し位
置を変えて複数の符号ベクトルを順次切り出し、切り出
された各符号ベクトルで音声合成フィルタを駆動するこ
とによって、切り出された各符号ベクトルに対応する再
生音声をそれぞれ作成し、各再生音声と入力音声との歪
を算出するとともに、複数種類の符号ベクトルが記憶さ
れた固定コードブックから符号ベクトルを順次読み出
し、読み出された符号ベクトルで音声合成フィルタを駆
動することによって、読み出された各符号ベクトルに対
応する再生音声をそれぞれ作成し、各再生音声と入力音
声との歪を算出し、適応コードブックから切り出された
符号ベクトルおよび固定コードブックから読み出された
符号ベクトルのうち、歪算出結果が最小であるものを探
索する第1探索手段、ならびに、雑音に対する複数の符
号ベクトルが記憶された雑音コードブックおよび有声音
のピッチ波形に対する複数種類の符号ベクトルが記憶さ
れたパルスコードブックから、各符号ベクトルを順次読
み出し、読み出された各符号ベクトルと音声合成フィル
タとに基づいて、読み出された各符号ベクトルに対応す
る再生音声をそれぞれ作成し、再生音声と入力音声との
歪が最も小さくなる符号ベクトルに対する符号を探索す
る第2探索手段を備え、第2探索手段は、パルスコード
ブックから読み出された符号ベクトルに基づいて再生音
声を作成するにあたり、入力音声のピッチ周期間隔でイ
ンパルスが発生するインパルス列であって初期位置が互
いに異なる複数種類のインパルス列と、音声合成フィル
タとに基づいて、各インパルス列に対応する再生音声を
それぞれ作成し、再生音声と入力音声との歪が最も小さ
くなるインパルス列を選択し、パルスコードブックから
読み出された符号ベクトルを、選択されたインパルス列
に基づいて、周期化する手段を備えていることを特徴と
する。
【0026】
【作用】この発明による第1の音声符号化装置では、有
声音のピッチ波形に対する複数種類の符号ベクトルが記
憶されたパルスコードブックが設けられている。インパ
ルス列の探索によって選択されたインパルス列に基づい
て、パルスコードブックから読み出された符号ベクトル
が周期化される。
【0027】この発明の第2の音声符号化装置では、有
声音のピッチ波形に対する複数種類の符号ベクトルが記
憶されたパルスコードブックが、雑音コードブックに対
して補完的に設けられている。パルスコードブックは、
雑音コードブックと同時に探索され、歪最小化基準によ
り、どちらかの出力ベクトルが排他的に選択される。
【0028】パルスコードブックから読み出された符号
ベクトルに基づいて再生音声を作成するにあたっては、
入力音声のピッチ周期間隔でインパルスが発生するイン
パルス列であって初期位置が互いに異なる複数種類のイ
ンパルス列と、音声合成フィルタとに基づいて、各イン
パルス列に対応する再生音声がそれぞれ作成される。再
生音声と入力音声との歪が最も小さくなるインパルス列
が選択される。そして、パルスコードブックから読み出
された符号ベクトルが、選択されたインパルス列に基づ
いて周期化される。
【0029】この発明の第3の音声符号化装置では、入
力音声が線形予測分析されることにより、音声合成フィ
ルタが作成される。過去の励振信号に対応する符号ベク
トルが記憶された適応コードブックから、切り出し位置
を変えて複数の符号ベクトルが順次切り出され、切り出
された各符号ベクトルで音声合成フィルタが駆動される
ことによって、切り出された各符号ベクトルに対応する
再生音声がそれぞれ作成される。そして、再生音声と入
力音声との歪が最も小さくなる符号ベクトルが探索され
る。
【0030】また、雑音に対する複数種類の符号ベクト
ルが記憶された雑音コードブックおよび有声音のピッチ
波形に対する複数種類の符号ベクトルが記憶されたパル
スコードブックから、各符号ベクトルが順次読み出さ
れ、読み出された各符号ベクトルと、音声合成フィルタ
とに基づいて、読み出された各符号ベクトルに対応する
再生音声がそれぞれ作成される。そして、再生音声と入
力音声との歪が最も小さくなる符号ベクトルが探索され
る。
【0031】パルスコードブックから読み出された符号
ベクトルに基づいて再生音声を作成するにあたっては、
入力音声のピッチ周期間隔でインパルスが発生するイン
パルス列であって初期位置が互いに異なる複数種類のイ
ンパルス列と、音声合成フィルタとに基づいて、各イン
パルス列に対応する再生音声がそれぞれ作成される。再
生音声と入力音声との歪が最も小さくなるインパルス列
が選択される。そして、パルスコードブックから読み出
された符号ベクトルが、選択されたインパルス列に基づ
いて周期化される。
【0032】この発明の第4の音声符号化装置では、入
力音声が線形予測分析されることにより、音声合成フィ
ルタが作成される。過去の励振信号に対応する符号ベク
トルが記憶された適応コードブックから、切り出し位置
を変えて複数の符号ベクトルが順次切り出され、切り出
された各符号ベクトルで音声合成フィルタが駆動される
ことによって、切り出された各符号ベクトルに対応する
再生音声がそれぞれ作成される。各再生音声と入力音声
との歪が算出される。また、複数種類の符号ベクトルが
記憶された固定コードブックから符号ベクトルが順次読
み出され、読み出された符号ベクトルで音声合成フィル
タが駆動されることによって、読み出された各符号ベク
トルに対応する再生音声がそれぞれ作成される。各再生
音声と入力音声との歪が算出される。そして、適応コー
ドブックから切り出された符号ベクトルおよび固定コー
ドブックから読み出された符号ベクトルのうち、歪算出
結果が最小であるものが探索される。
【0033】また、雑音に対する複数種類の符号ベクト
ルが記憶された雑音コードブックおよび有声音のピッチ
波形に対する複数種類の符号ベクトルが記憶されたパル
スコードブックから、各符号ベクトルが順次読み出さ
れ、読み出された各符号ベクトルと、音声合成フィルタ
とに基づいて、読み出された各符号ベクトルに対応する
再生音声がそれぞれ作成される。そして、再生音声と入
力音声との歪が最も小さくなる符号ベクトルが探索され
る。
【0034】パルスコードブックから読み出された符号
ベクトルに基づいて再生音声を作成するにあたっては、
入力音声のピッチ周期間隔でインパルスが発生するイン
パルス列であって初期位置が互いに異なる複数種類のイ
ンパルス列と、音声合成フィルタとに基づいて、各イン
パルス列に対応する再生音声がそれぞれ作成される。再
生音声と入力音声との歪が最も小さくなるインパルス列
が選択される。そして、パルスコードブックから読み出
された符号ベクトルが、選択されたインパルス列に基づ
いて周期化される。
【0035】
【実施例】以下、図面を参照して、この発明の実施例に
ついて説明する。
【0036】図1は、音声符号化装置の構成を示してい
る。この音声符号化装置では、線形予測フィルタの励振
源は2つの部分からなる。一方の励振源は、適応コード
ブック4と固定コードブック5から構成され、他方の励
振源は雑音コードブック6とパルスコードブック7とか
ら構成されている。
【0037】適応コードブック4は、既に説明したよう
に、音声の周期成分、つまりピッチを表現するために用
いられる。適応コードブック4には、過去所定長分の線
形予測フィルタの励振信号e(適応符号ベクトル)が記
憶される。
【0038】固定コードブック5は、既に説明したよう
に、前サブフレームの励振信号のパワーがほとんどない
場合、現サブフレームが、前サブフレームと異なる成分
から構成されている音声の立ち上がり部等の非定常性音
声である場合、現サブフレームが、ピッチ周期を持たな
い無声部等の雑音性音声である場合等において、適応コ
ードブック4を補完するために設けられている。固定コ
ードブック5には、それぞれサブブレーム長に相当する
長さの各種の符号ベクトル(固定符号ベクトル)が記憶
されている。
【0039】雑音コードブック6は、既に説明したよう
に、音声の非周期成分を表現するために用いられる。雑
音コードブック6には、それぞれサブブレーム長に相当
する長さの各種の符号ベクトル(雑音符号ベクトル)が
記憶されている。
【0040】パルスコードブック7は、入力音声の周期
部分のうち、適応コードブックで十分に表現されなかっ
た部分を表現するために用いられる。図2は、パルスコ
ードブック7に記憶されている複数の符号ベクトル(パ
ルス符号ベクトル)の例を示している。各パルス符号ベ
クトルとしては、代表的な有声音のピッチ波形に対する
符号ベクトルが用いられる。
【0041】以下、音声符号化装置の動作につい説明す
る。
【0042】連続した入力音声信号が40ms程度の一
定間隔の区間に分割される。この間隔をここでは、フレ
ームということにする。また、1フレーム内の音声信号
が8ms程度の一定間隔の区間に分割される。この間隔
をここでは、サブフレームということにする。
【0043】(1)線形予測分析および線形予測合成フ
ィルタの作成 まず、線形予測分析部1によって1フレーム単位で、入
力音声が線形予測分析される。この例では、線形予測分
析部1によって、1フレームに2回の線形予測分析が行
なわれ、それぞれの分析によって2つの10次の線形予
測係数が求められる。そして、求められた線形予測係数
に基づいて、当該1フレーム内の各サブフレームに対す
る線形予測係数αi (i=1,2…10)がそれぞれ求
められる。得られたサブフレームに対する線形予測係数
αi に基づいて、線形予測合成フィルタ(音声合成フィ
ルタ)3がサブフレーム単位で作成される。
【0044】(2)ピッチ抽出 また、ピッチ抽出部2によって1フレーム単位で入力音
声のピッチ周期Tpが抽出される。
【0045】(3)コードブックの探索 次に、適応コードブック4および固定コードブック5の
探索(適応/固定コードブック探索)と、雑音コードブ
ック6およびパルスコードブック7の探索(雑音/パル
スコードブック探索)とが、サブフレーム単位で行なわ
れる。
【0046】(3−1)適応/固定コードブック探索
【0047】(3−1−1)適応コードブックによる距
離計算 適応/固定コードブック探索においては、まず、適応コ
ードブック4による距離計算が行なわれる。適応コード
ブック4による距離計算においては、まず、適応コード
ブック4の入力符号に対応する出力符号ベクトルが、次
のようにして作成される。
【0048】適応コードブック4に記憶されている前サ
ブフレームおよびそれ以前の線形予測合成フィルタ3の
励振信号(適応符号ベクトル)が、後ろから入力符号に
対応する長さ(以下、ラグという)分切り出される。
【0049】ラグがサブフレーム長より短い場合には、
切り出された適応符号ベクトルが、サブフレーム長にな
るまで繰り返し並べられることにより出力符号ベクトル
が作成される。ラグがサブフレーム長より長い場合に
は、切り出された適応符号ベクトルのうち、その先頭か
らサブフレーム長に相当する長さが切り出されることに
より、出力符号ベクトル作成される。
【0050】各入力符号に対応する長さ(ラグ)は、そ
れぞれ異なる。各入力符号に対応する長さは、ピッチ抽
出部2によって検出されたピッチ周期Tpに相当する長
さに基づいて決定される。ピッチ抽出部2によって検出
されたピッチ周期Tpに相当する長さをL0 とすると、
各入力符号に対応する長さは、L0 を中心とする所定範
囲内から選択された長さとなる。
【0051】作成された出力符号ベクトルで線形予測合
成フィルタ3が駆動されて、再生音声が作成される。そ
して、入力音声と再生音声との距離(再生音声の原音声
に対する歪)が理論的に最小になるような利得が再生音
声にかけられた後、入力音声と再生音声との距離が距離
計算部8で計算される。このような操作が、適応コード
ブック4に対する各入力符号ごとに繰り返された後、固
定コードブック5による距離計算が行なわれる。
【0052】(3−1−2)固定コードブックによる距
離計算 固定コードブック5による距離計算では、固定コードブ
ック5の入力符号に対応する固定符号ベクトルが読み出
される。読み出された固定符号ベクトルで線形予測合成
フィルタ3が駆動されて、再生音声が作成される。そし
て、入力音声と再生音声との距離が理論的に最小になる
ような利得が再生音声にかけられた後、入力音声と再生
音声との距離が距離計算部8で計算される。このような
操作が、固定コードブック5に対する各入力符号ごとに
繰り返される。
【0053】このようにして、適応コードブックによる
距離計算および固定コードブックによる距離計算が行な
われると、計算された距離が最小となる励振ベクトルの
入力符号およびそれに対応する利得が選択される。
【0054】(3−2)雑音/パルスコードブック探索
【0055】(3−2−1)雑音コードブックによる距
離計算 雑音/パルスコードブック探索においては、まず、雑音
コードブック6による距離計算が行なわれる。雑音コー
ドブック6による距離計算では、雑音コードブック6の
入力符号に対応する雑音符号ベクトルが読み出される。
次に、適応/固定コードブック探索で選ばれた符号ベク
トルの影響を除くために、読み出された雑音符号ベクト
ルの合成フィルタ出力は、適応/固定コードブック探索
で選ばれた符号ベクトルの合成フィルタ出力に対して直
交化せしめられ、再生音声が作成される。
【0056】そして、入力音声と再生音声との距離が理
論的に最小になるような利得が再生音声にかけられた
後、入力音声と再生音声との距離が距離計算部8で計算
される。このような操作が、雑音コードブック6に対す
る入力符号ごとに繰り返された後、パルスコードブック
7による距離計算が行なわれる。
【0057】(3−2−2)パルスコードブックによる
距離計算 パルスコードブック7による距離計算を行なうに際して
は、まず、インパルス列の探索が行なわれる。
【0058】このインパルス列の探索においては、ま
ず、ピッチ抽出部2で抽出されたピッチ周期Tpに基づ
いて、インパルス列が作成される。ピッチ抽出部2で抽
出されたピッチ周期Tpに相当する長さが、サブフレー
ム長Tsより短い場合には、図3に示すように、ピッチ
抽出部2で抽出されたピッチ周期間隔でインパルスが発
生し、かつ全長がサブフレーム長Tsに等しいインパル
ス列P0が作成される。
【0059】ピッチ抽出部2で抽出されたピッチ周期T
pに相当する長さが、サブフレーム長Tsより長い場合
には、図4に示すように、1つのインパルスからなるイ
ンパルス列P0が作成される。
【0060】そして、雑音コードブック6から読み出さ
れた雑音符号ベクトルに基づいて再生音声を作成したと
同様の方法で、インパルス列に基づいて再生音声が作成
され、入力音声との距離計算が行なわれる。
【0061】このような処理を図3または図4に示すよ
うに、インパルス列の初期位置が異なる複数のインパル
ス列P0〜Pnに対して行い、最も距離の短いインパル
ス列が選択される。
【0062】この後、パルスコードブック7による距離
計算が行なわれる。パルスコードブック7による距離計
算では、パルスコードブック7の入力符号に対応するパ
ルス符号ベクトルが読み出される。次に、たとえば、図
5に示すように、インパルス列の探索で選択されたイン
パルス列(図5(a))の各インパルス位置に、パルス
コードブック7から読み出されたパルス符号ベクトルを
設定することにより、サブフレーム長に相当する長さの
パルス符号ベクトル(図5(b))が作成される。
【0063】次に、適応/固定コードブック探索で選ば
れた符号ベクトルの影響を除くために、作成されたパル
ス符号ベクトルの合成フィルタ出力は、適応/固定コー
ドブック探索で選ばれた符号ベクトルの合成フィルタ出
力に対して直交化せしめられ、再生音声が作成される。
【0064】そして、入力音声と再生音声との距離が理
論的に最小になるような利得が再生音声にかけられた
後、入力音声と再生音声との距離が距離計算部8で計算
される。このような操作が、パルスコードブック7に対
する入力符号ごとに繰り返される。
【0065】このようにして、雑音コードブックによる
距離計算およびパルスコードブックによる距離計算が行
なわれると、計算された距離が最小となる励振ベクトル
の入力符号およびそれに対応する利得が選択される。
【0066】適応/固定コードブック探索によって選択
されたサブフレーム毎の適応コードブックまたは固定コ
ードブックの入力符号およびそれに対応する利得を表す
符号、雑音/パルスコードブック探索によって選択され
たサブフレーム毎の雑音コードブックまたはパルスコー
ドブックの入力符号およびそれに対応する利得を表す符
号ならびにフレーム毎に計算された2つの線形予測係数
が符号化出力として出力される。
【0067】上記の音声符号化装置においては、現サブ
フレームが、前サブフレームと異なる成分から構成され
ている場合には、たとえば、次のような動作になると考
えられる。つまり、現サブフレームが、前サブフレーム
と異なる成分から構成されている場合には、現サブフレ
ームの適応/固定コードブック探索によって固定コード
ブック5に対する入力符号が選択され、雑音/パルスコ
ードブックの探索によってパルスコードブック7による
入力符号が選択される。
【0068】したがって、適応コードブック4には、適
応/固定コードブック探索によって選択された固定コー
ドブックに基づく励振信号と、雑音/パルスコードブッ
クの探索によって選択されたパルスコードブックに基づ
く励振信号との合成信号が、新たに格納される。
【0069】そして、次のサブフレームの適応/固定コ
ードブック探索では、適応コードブック4に対する符号
が選択され、雑音/パルスコードブックの探索では、雑
音コードブック6による符号が選択される。
【0070】上記実施例では、代表的な有声音のピッチ
波形に対する符号ベクトルが記憶されたパルスコードブ
ック7が、雑音コードブック6に対して補完的に設けら
れているので、入力音声の周期部分のうち、適応コード
ブックで十分に表現されなかった部分を効率良く表現す
ることが可能となる。この結果、再生音声の音質が向上
する。
【0071】また、単純なインパルス列の探索結果に基
づいて、入力音声のピッチ周期に対応するように、パル
スコードブック7から読み出されたパルス符号ベクトル
を周期化しているため、パルスコードブック7から読み
出されたパルス符号ベクトルを周期化するための処理時
間が短縮される。
【0072】なお、適応/固定コードブック探索および
雑音/パルスコードブック探索において、原音声と再生
音声の差をマスキング特性に対応したフィルタ(聴覚重
み付けフィルタ)に通した値に基づいて、距離計算を行
なうようにしてもよい。また、原音声を聴覚重み付けフ
ィルタに通した値と、再生音声を聴覚重み付けフィルタ
に通した値との差に基づいて、距離計算を行なうように
してもよい。
【0073】聴覚重み付けフィルタは、周波数軸上にお
いて音声パワーの大きな部分の歪を軽く、音声パワーの
小さな部分の歪を重く、重み付けする特性を持つフィル
タである。また、マスキング特性とは、人間の聴覚はあ
る周波数成分が大きいとその近くの周波数の音が聞こえ
にくくなる特性をいう。
【0074】
【発明の効果】この発明によれば、代表的な有声音のピ
ッチ波形に対する符号ベクトルが記憶されたパルスコー
ドブックが、雑音コードブックに対して補完的に設けら
れているので、入力音声の周期部分のうち、適応コード
ブックで十分に表現されなかった部分を表現することが
可能となる。この結果、再生音声の音質が向上する。
【0075】また、単純なインパルス列の探索結果に基
づいて、入力音声のピッチ周期に対応するように、パル
スコードブックから読み出されたパルス符号ベクトルを
周期化しているため、パルスコードブックから読み出さ
れたパルス符号ベクトルを周期化するための処理時間が
短縮される。
【図面の簡単な説明】
【図1】音声符号化装置の構成を示すブロック図であ
る。
【図2】パルスコードブックの内容の一例を示す模式図
である。
【図3】インパルス列の例を示す模式図である。
【図4】インパルス列の例を示す模式図である。
【図5】インパルス列の探索によって選択されたインパ
ルス列と、そのインパルス列の各インパルス位置に、パ
ルスコードブックから読み出された符号ベクトルが設定
されることにより作成されたパルス符号ベクトルとを示
す模式図である。
【図6】従来例を示すブロック図である。
【符号の説明】
1 線形予測分析部 2 ピッチ抽出部 3 線形予測合成フィルタ 4 適応コードブック 5 固定コードブック 6 雑音コードブック 7 パルスコードブック 8 距離計算部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平5−165497(JP,A) 特開 平6−195098(JP,A) 特開 平6−130996(JP,A) 特開 平5−289698(JP,A) 特開 昭58−162998(JP,A)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力音声を線形予測分析することにより
    音声合成フィルタを構成し、コードブックに蓄積されて
    いる符号ベクトルと、音声合成フィルタとに基づいて音
    声を再生し、再生された音声と入力音声とに基づいて音
    声を符号化する音声符号化装置において、 有声音のピッチ波形に対する複数種類の符号ベクトルが
    記憶されたパルスコードブックが設けられており、イン
    パルス列の探索によって選択されたインパルス列に基づ
    いて、パルスコードブックから読み出された符号ベクト
    ルが周期化されることを特徴とする音声符号化装置。
  2. 【請求項2】 入力音声を線形予測分析することによ
    り、音声合成フィルタを構成し、過去の励振信号に対応
    する符号ベクトルを記憶する適応コードブックと、雑音
    に対する符号ベクトルが記憶された雑音コードブックと
    を含むコードブックから読み出された符号ベクトルと、
    音声合成フィルタとに基づいて音声を再生し、再生され
    た音声と入力音声とに基づいて音声を符号化する音声符
    号化装置において、 有声音のピッチ波形に対する複数種類の符号ベクトルが
    記憶されたパルスコードブックが、雑音コードブックに
    対して補完的に設けられており、 パルスコードブックから読み出された符号ベクトルに基
    づいて再生音声を作成するにあたっては、入力音声のピ
    ッチ周期間隔でインパルスが発生するインパルス列であ
    って初期位置が互いに異なる複数種類のインパルス列
    と、音声合成フィルタとに基づいて、各インパルス列に
    対応する再生音声がそれぞれ作成され、再生音声と入力
    音声との歪が最も小さくなるインパルス列が選択され、
    パルスコードブックから読み出された符号ベクトルが、
    選択されたインパルス列に基づいて、周期化されること
    を特徴とする音声符号化装置。
  3. 【請求項3】 入力音声を線形予測分析することによ
    り、音声合成フィルタを作成する手段、 過去の励振信号に対応する符号ベクトルが記憶された適
    応コードブックから、切り出し位置を変えて複数の符号
    ベクトルを順次切り出し、切り出された各符号ベクトル
    で音声合成フィルタを駆動することによって、切り出さ
    れた各符号ベクトルに対応する再生音声をそれぞれ作成
    し、再生音声と入力音声との歪が最も小さくなる符号ベ
    クトルを探索する第1探索手段、ならびに、 雑音に対する複数種類の符号ベクトルが記憶された雑音
    コードブックおよび有声音のピッチ波形に対する複数種
    類の符号ベクトルが記憶されたパルスコードブックか
    ら、各符号ベクトルを順次読み出し、読み出された各符
    号ベクトルと、音声合成フィルタとに基づいて、読み出
    された各符号ベクトルに対応する再生音声をそれぞれ作
    成し、再生音声と入力音声との歪が最も小さくなる符号
    ベクトルを探索する第2探索手段を備え、 第2探索手段は、パルスコードブックから読み出された
    符号ベクトルに基づいて再生音声を作成するにあたり、
    入力音声のピッチ周期間隔でインパルスが発生するイン
    パルス列であって初期位置が互いに異なる複数種類のイ
    ンパルス列と、音声合成フィルタとに基づいて、各イン
    パルス列に対応する再生音声をそれぞれ作成し、再生音
    声と入力音声との歪が最も小さくなるインパルス列を選
    択し、パルスコードブックから読み出された符号ベクト
    ルを、選択されたインパルス列に基づいて、周期化する
    手段を備えている音声符号化装置。
  4. 【請求項4】 入力音声を線形予測分析することによ
    り、音声合成フィルタを作成する手段、 過去の励振信号に対応する符号ベクトルが記憶された適
    応コードブックから、切り出し位置を変えて複数の符号
    ベクトルを順次切り出し、切り出された各符号ベクトル
    で音声合成フィルタを駆動することによって、切り出さ
    れた各符号ベクトルに対応する再生音声をそれぞれ作成
    し、各再生音声と入力音声との歪を算出するとともに、
    複数種類の符号ベクトルが記憶された固定コードブック
    から符号ベクトルを順次読み出し、読み出された符号ベ
    クトルで音声合成フィルタを駆動することによって、読
    み出された各符号ベクトルに対応する再生音声をそれぞ
    れ作成し、各再生音声と入力音声との歪を算出し、適応
    コードブックから切り出された符号ベクトルおよび固定
    コードブックから読み出された符号ベクトルのうち、歪
    算出結果が最小であるものを探索する第1探索手段、な
    らびに、 雑音に対する複数の符号ベクトルが記憶された雑音コー
    ドブックおよび有声音のピッチ波形に対する複数種類の
    符号ベクトルが記憶されたパルスコードブックから、各
    符号ベクトルを順次読み出し、読み出された各符号ベク
    トルと音声合成フィルタとに基づいて、読み出された各
    符号ベクトルに対応する再生音声をそれぞれ作成し、再
    生音声と入力音声との歪が最も小さくなる符号ベクトル
    に対する符号を探索する第2探索手段を備え、 第2探索手段は、パルスコードブックから読み出された
    符号ベクトルに基づいて再生音声を作成するにあたり、
    入力音声のピッチ周期間隔でインパルスが発生するイン
    パルス列であって初期位置が互いに異なる複数種類のイ
    ンパルス列と、音声合成フィルタとに基づいて、各イン
    パルス列に対応する再生音声をそれぞれ作成し、再生音
    声と入力音声との歪が最も小さくなるインパルス列を選
    択し、パルスコードブックから読み出された符号ベクト
    ルを、選択されたインパルス列に基づいて、周期化する
    手段を備えている音声符号化装置。
JP13129895A 1995-05-30 1995-05-30 音声符号化装置 Expired - Fee Related JP3515215B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP13129895A JP3515215B2 (ja) 1995-05-30 1995-05-30 音声符号化装置
US08/650,830 US5864797A (en) 1995-05-30 1996-05-20 Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
KR1019960018396A KR960042522A (ko) 1995-05-30 1996-05-29 음성 부호화 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13129895A JP3515215B2 (ja) 1995-05-30 1995-05-30 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH08328595A JPH08328595A (ja) 1996-12-13
JP3515215B2 true JP3515215B2 (ja) 2004-04-05

Family

ID=15054703

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13129895A Expired - Fee Related JP3515215B2 (ja) 1995-05-30 1995-05-30 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3515215B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101615396B (zh) * 2003-04-30 2012-05-09 松下电器产业株式会社 语音编码设备、以及语音解码设备
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치

Also Published As

Publication number Publication date
JPH08328595A (ja) 1996-12-13

Similar Documents

Publication Publication Date Title
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
EP0680033A2 (en) Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders
CA2430111C (en) Speech parameter coding and decoding methods, coder and decoder, and programs, and speech coding and decoding methods, coder and decoder, and programs
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
KR100275429B1 (ko) 음성 부호화 장치
US5864797A (en) Pitch-synchronous speech coding by applying multiple analysis to select and align a plurality of types of code vectors
JP3063668B2 (ja) 音声符号化装置及び復号装置
US5668924A (en) Digital sound recording and reproduction device using a coding technique to compress data for reduction of memory requirements
JP3515215B2 (ja) 音声符号化装置
JP2001075600A (ja) 音声符号化装置および音声復号化装置
JP3515216B2 (ja) 音声符号化装置
JP2829978B2 (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JPS6238500A (ja) 高能率音声符号化方式とその装置
JP3559485B2 (ja) 音声信号の後処理方法および装置並びにプログラムを記録した記録媒体
JP3299099B2 (ja) 音声符号化装置
JP2943983B1 (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP3144284B2 (ja) 音声符号化装置
JP3410931B2 (ja) 音声符号化方法及び装置
JP2001083996A (ja) 音声信号復号方法及び音声信号符号化復号方法
JP3364827B2 (ja) 音声符号化方法、音声復号化方法及び音声符号化復号化方法並びにそれ等の装置
JPH05165497A (ja) コード励振線形予測符号化器及び復号化器
JP2650355B2 (ja) 音声分析合成装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2508002B2 (ja) 音声符号化方法とその装置

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040115

LAPS Cancellation because of no payment of annual fees