JP4179232B2 - 音声符号化装置及び音声復号装置 - Google Patents

音声符号化装置及び音声復号装置 Download PDF

Info

Publication number
JP4179232B2
JP4179232B2 JP2004172285A JP2004172285A JP4179232B2 JP 4179232 B2 JP4179232 B2 JP 4179232B2 JP 2004172285 A JP2004172285 A JP 2004172285A JP 2004172285 A JP2004172285 A JP 2004172285A JP 4179232 B2 JP4179232 B2 JP 4179232B2
Authority
JP
Japan
Prior art keywords
signal
speech
setting
encoding
pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004172285A
Other languages
English (en)
Other versions
JP2004252490A (ja
Inventor
俊之 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004172285A priority Critical patent/JP4179232B2/ja
Publication of JP2004252490A publication Critical patent/JP2004252490A/ja
Application granted granted Critical
Publication of JP4179232B2 publication Critical patent/JP4179232B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

本発明は、音声信号を指定したパラメータで高品質に符号化する音声符号化装置及び音声復号装置(以下音声符号化復号装置と呼ぶ)に関する。
一般に、ビットレートの制御可能な音声符号化復号装置として、例えば、CDMA(Code Division Multiple Access)システムに用いられている“Enhanced Variable Rate Codec,Speech Service Option 3 for Wideband Spread Spectrum Digital Systems”(IS−127,TIA.TR45)と題した標準化勧告仕様書(文献1)に記載された装置(方式)が知られている。
この方式では、入力信号の特徴に応じてビットレートを決定して、この決定結果に応じて予め定められたテーブルからCELP(Code ExcitedLinear Prediction)符号化方式の制御パラメータを設定する。そして、設定制御パラメータに応じて入力信号を符号化している。さらに、この方式では、ビットレートを外部信号により強制的に設定する機能も備えられている。
ここで、図11を参照して、この種の音声符号化復号装置について概説する。図11に示す音声符号化復号装置では、外部信号に応じてビットレートを制御している。
図示の音声符号化復号装置は音声符号化装置及び音声復号装置を備えており、音声符号化装置及び音声復号装置にはそれぞれ符号化パラメータ制御回路51及び55が備えられている。音声符号化装置では、符号化パラメータ制御回路51にビットレートが与えられ、符号化パラメータ制御回路51は、CELP符号化回路52の動作を制御する制御パラメータが複数記載されたテーブル(図示せず:例えば、ビットレートをアドレスとするROM(Read Only Memory))を参照してビットレートに対応する制御パラメータを選択して、この制御パラメータをCELP符号化回路52に出力する。制御パラメータは、CELP符号化における励振信号符号化の処理単位であるサブフレーム長及びビット配分である。
CELP符号化回路52には入力信号(入力音声信号)が与えられており、CELP符号化回路52では入力信号を予め定められたフレーム毎に線形予測分析して、音声信号のスペクトル包絡特性を表す線形予測係数を算出する。そして、そのスペクトル包絡特性に対応する線形予測合成フィルタを駆動して励振信号を算出し、励振信号をそれぞれビット配分に従って符号化する。そして、励振信号の符号化はフレームをさらにサブフレームに分割してサブフレーム毎に行なわれる。このサブフレーム長は前述のようにして符号化パラメータ制御回路51により設定される。
上述の励振信号は、入力信号のピッチ周期を表す周期成分と残りの残差成分とそれらのゲインとによって構成される。入力信号のピッチ周期を表す周期成分は、適応コードブックと呼ばれる過去の励振信号を保持するコードブックに格納された適応コードベクトルとして表され、残差成分は、例えば、J−P.Adoul氏らによる“Fast CELP coding based on algebraic codes”(Proc.ICASSP,pp.1957−1960,1987年)と題した論文(文献2)に記載されたマルチパルス信号として表される。そして、適応コードベクトルとマルチパルス信号をゲインコードブックに保持されたゲインによって重み付け加算して励振信号を生成する。なお、再生信号は励振信号で線形予測合成フィルタを駆動することによって合成することができる。
ここで、適応コードベクトル、マルチパルス信号、及びゲインを選択する際には、再生信号と入力信号との間の誤差信号を聴感重み付けした上での誤差電力が最小となるように選択制御が行われる。そして、CELP符号化回路52では適応コードベクトル、マルチパルス信号、及びゲインに対応するインデックスと線形予測係数に対応するインデックスとをマルチプレクサ53に出力する。
マルチプレクサ53は、適応コードベクトル、マルチパルス信号、及びゲインに対応するインデックスと線形予測係数に対応するインデックスとをフレーム毎にビットストリームに変換して出力する。なお、ビットレートを表す情報はビットストリームのヘッダ部分に格納される。
音声復号装置ではデマルチプレクサ54でビットストリームを受けると、ビットストリームのヘッダ部分に存在するビットレートを表す情報を抽出して、符号化パラメータ制御回路55に出力した後、フレーム毎にビットストリームから適応コードベクトル、マルチパルス信号、及びゲインに対応するインデックスと線形予測係数に対応するインデックスとを抽出し、CELP復号回路56に出力する。
符号化パラメータ制御回路55では、符号化パラメータ制御回路51と同様の処理を行い、入力されたビットレート情報に応じて制御パラメータを選択して、CELP復号回路56に出力する。
CELP復号回路56では、適応コードベクトル、マルチパルス信号、及びゲインに対応するインデックスと線形予測係数に対応するインデックスを用いるとともにサブフレーム長及びビットレートとを用いて、復号処理を行なう。励振信号は、適応コードベクトル及びマルチパルス信号をゲインコードブックに保持されたゲインで重み付け加算して得られる。そして、CELP復号回路56では励振信号で線形予測合成フィルタを駆動して再生信号をとして再生する。
このように、CELP符号化方式において、ビットレートを制御する際には、励振信号符号化の処理単位であるサブフレーム長及びビット配分を制御してビットレートを制御する。
ところで、従来の音声符号化復号装置では、符号化処理単位であるフレーム長が固定値であるため、入力信号サンプルが最初に入力されてから符号化処理が始まるまでの時間として定義される符号化遅延を制御することができないという問題点がある。
さらに、従来の音声符号化復号装置では、マルチパルス信号を生成するために必要なパラメータを予め備えておく必要があり、このため、予め設定されたビットレートにしか対応できないという問題点がある。
本発明によれば、入力音声信号の励振信号を複数のパルスで表して前記励振信号によって前記入力音声信号の線形予測係数で規定された線形予測合成フィルタを励振して得られる再生音声信号と前記入力音声信号との間の歪みを最小化するように前記励振信号を決定する音声符号化手段を有する音声符号化装置であって、少なくとも演算量を制御情報として受け該制御情報に応じて制御パラメータを生成する制御回路を備えており、前記音声符号化手段は前記制御パラメータに応じて前記入力音声信号を符号化するようにしたことを特徴とする音声符号化装置が得られる。
さらに、本発明によれば、入力音声信号の励振信号を複数のパルスで表して前記励振信号によって前記入力音声信号の線形予測係数で規定された線形予測合成フィルタを励振して得られる再生音声信号と前記入力音声信号との間の歪みを最小化するように前記励振信号を決定する音声符号化手段を有する音声符号化装置であって、少なくとも符号化遅延を制御情報として受け該制御情報に応じて制御パラメータを生成する制御回路を備えており、前記音声符号化手段は前記制御パラメータに応じて前記入力音声信号を符号化するようにしたことを特徴とする音声符号化装置が得られる。
つまり、本発明による音声符号化装置では、指定されたビットレートと符号化遅延で符号化するために必要なフレーム長とサブフレーム長とビット配分とを制御パラメータとして生成する符号化パラメータ制御回路を備えており、設定されたフレーム長で入力音声信号をフレームに分割する。そして、マルチパルス生成パラメータ設定回路では指定されたビットレートと符号化遅延からマルチパルス信号を生成するために必要なパラメータを設定する。
符号化パラメータ制御回路でフレーム長とサブフレーム長とビット配分とを生成し、このフレーム長に応じて入力音声信号をフレームに分割しているから、符号化処理単位であるフレーム長を可変にできる。このため、ビットレートに加えて符号化遅延も制御できることになる。
さらに、マルチパルス生成パラメータ設定回路において、マルチパルス信号を生成するためのパラメータを設定することにより、指定できるビットレートの自由度が増加する。このため、対応できるビットレートを予め設定する必要がない。
以上説明したように、本発明では、符号化処理単位であるフレーム長を可変にしてマルチパルス信号の符号化に必要なパラメータを指定されたビットレート及び符号化遅延に基づいて生成するようにしたから、ビットレートだけでなく符号化遅延や演算量も制御できるという効果がある。従って、本発明によれば、テレビ会議システムなどで符号化遅延をできる限り短くしたい場合又は音声メールなどの符号化遅延よりもビットレートをできる限り少なくしたい場合にも、同一の符号化復号装置で対応できるため、符号化復号装置の規模を小さくできる。
以下本発明について図面を参照して説明する。
図1を参照して、図示の音声符号化復号装置は音声符号化装置及び音声復号装置を有しており、音声符号化装置は符号化パラメータ制御回路11、CELP符号化回路12、及びマルチプレクサ13を備えている。一方、音声復号装置はデマルチプレクサ14、符号化パラメータ制御回路15、及びCELP復号回路16を備えている。
音声符号化装置において、符号化パラメータ制御回路11にはビットレート及び符号化遅延が制御情報として与えられ、これらビットレートと符号化遅延とからCELP符号化における分析処理に必要な先読み長を引いてフレーム長を算出する。例えば、符号化遅延が25msで、線形予測分析の先読み長が5msの場合、フレーム長は20msとなる。
さらに、符号化パラメータ制御回路11では、算出したフレーム長に基づいてCELP符号化回路12の動作を制御する制御パラメータが複数記載されたテーブルの中から入力ビットレートに応じて制御パラメータを選択し、CELP符号化回路12に出力する。制御パラメータは、フレーム長とサブフレーム長(例えば、5ms)とビット配分である。CELP符号化回路12には入力信号(入力音声信号)が与えられ、設定されたフレーム長、サブフレーム長、及びビット配分に従って入力信号を符号化する。
ここで、図2も参照して、CELP符号化回路12の動作を説明する。
符号化パラメータ制御回路11によって設定されたフレーム長(F)は、入力端子213を介してフレーム分割回路201及び線形予測係数量子化回路204に入力される。
一方、符号化パラメータ制御回路11によって設定されサブフレーム長(S)は、入力端子214を介してサブフレーム分割回路202、線形予測分析回路203、線形予測係数量子化回路204、聴感重み付け信号作成回路205、聴感重み付け再生信号作成回路206、ターゲット信号作成回路208、適応コードブック探索回路209、マルチパルス探索回路210、及びゲイン探索回路211に入力される。
さらに、符号化パラメータ制御回路11によって設定された各パラメータへのビット配分は、入力端子215を介して線形予測係数量子化回路204、適応コードブック探索回路209、マルチパルス探索回路210、及びゲイン探索回路211に入力される。
フレーム分割回路201は、設定フレーム長(F)に応じて入力信号をフレーム毎に分割して、つまり、フレーム毎にサブフレーム分割回路202に出力する。
サブフレーム分割回路202は、設定サブフレーム長(S)に応じてフレームをさらに分割してサブフレームとし、このサブフレームを線形予測分析回路203及び聴感重み付け信号作成回路205に出力する。
線形予測分析回路203は、サブフレーム分割回路202から与えられた信号(サブフレーム信号)を設定サブフレーム長(S)に基づいてサブフレーム毎に線形予測分析して、線形予測係数a(i),i=1,…,Npを線形予測係数量子化回路204、聴感重み付け信号作成回路205、聴感重み付け再生信号作成回路206、適応コードブック探索回路209、及びマルチパルス探索回路210に出力する。ここで、Npは線形予測分析の次数であり、例えば、10である。線形予測分析法には、自己相関法、共分散法があり、例えば、古井による“ディジタル音声処理”と題された文献(東海大学出版会)(文献3)に詳説されている。
線形予測係数量子化回路204では、サブフレーム毎に得られた線形予測係数を設定フレーム長(F)及び設定サブフレーム長(S)に応じてフレームで一括して量子化する。この際、ビットレートを低減するために、例えば、フレーム内の最後のサブフレームで量子化を行ない、他のサブフレームの量子化値は、当該フレーム及び直前のフレームの量子化値の補間値を用いる手法が利用される。そして、この量子化及び補間は、線形予測係数を線スペクトル対(以後、LSPとする)に変換した後行なわれる。なお、線形予測係数からLSPへの変換は、例えば、菅村他による“線スペクトル対(LSP)音声分析合成方式による音声情報圧縮”と題された論文(電子通信学会論文誌、J64−A、pp.599−606、1981年)(文献4)に記載されている。また、LSPの量子化法は、周知の手法を用いることができる。例えば、LSPの量子化法については、特開平4−171500号公報(文献5)に記載されているので、ここでは説明を省略する。線形予測係数量子化回路204では、量子化LSPを線形予測係数に変換し、量子化線形予測係数a′(i),i=1,…,Npとして聴感重み付け信号作成回路205、聴感重み付け再生信号作成回路206、適応コードブック探索回路209、及びマルチパルス探索回路210とに出力する。
そして、量子化LSPを表すインデックスは出力端子216を介してマルチプレクサ13に出力される。なお、線形予測合成フィルタHs(z)は、数1で表される。
Figure 0004179232
聴感重み付け信号作成回路205では、線形予測係数を用いて、数2で表される聴感重み付けフィルタHw(z)を構成し、サブフレーム内の入力信号で聴感重み付けフィルタを駆動して、聴感重み付け信号を作成する。そして、この聴感重み付け信号をターゲット信号作成回路208に出力する。
Figure 0004179232
ここで、R1、R2は、聴感重み付け量を制御する重み係数である。例えば、R1=0.6、R2=0.9である。
聴感重み付け再生信号作成回路206では、サブフレームバッファ207を介して得られる一つ前のサブフレームの励振信号を用いて同回路内で保持した一つ前のサブフレームの線形予測合成フィルタと聴感重み付け合成フィルタとを駆動して、駆動後の両フィルタの状態をターゲット信号作成回路208に出力する。
ターゲット信号作成回路208では、聴感重み付け再生信号作成回路206から得られた線形予測合成フィルタ及び聴感重み付けフィルタの状態を入力し、両フィルタを継続接続したフィルタの零入力応答を作成して、聴感重み付け信号から減算した後、ターゲット信号として適応コードブック探索回路209、マルチパルス探索回路210、及びゲイン探索回路211に出力する。
適応コードブック探索回路209では、サブフレームバッファ207を介して得られる一つ前のサブフレームの励振信号によって適応コードブックと呼ばれる過去の励振信号を保持するコードブックを更新した後、適応コードブックからピッチdに対応する適応コードベクトルを選択する。ここで、ピッチdがサブフレーム長よりも短い場合には、適応コードブックに格納された過去の励振信号から遅れdのセグメントを切り出し、サブフレーム長になるまで繰り返し接続して適応コードベクトルを作成する。そして、作成した適応コードベクトル信号Ad(n)を用いて、線形予測合成フィルタと聴感重み付けフィルタを零状態で駆動して、再生信号SAd(n)を作成し、数3で表されるターゲット信号X(n)と再生信号SAd(n)との誤差Edを最小とするピッチdを選択する。
Figure 0004179232
ここで、Lは符号化パラメータ制御回路11によって設定されたサブフレーム長である。さらに、適応コードブック探索回路209は、選択されたピッチdを出力端子216を介してマルチプレクサ13に出力するとともに選択された適応コードベクトル信号Ad(n)及びその再生信号SAd(n)をゲイン探索回路211に出力する。また、適応コードブック探索回路209は、再生信号SAd(n)をゲイン探索回路211に出力するとともに再生信号SAd(n)をマルチパルス探索回路210に出力する。
マルチパルス探索回路210では、マルチパルス信号を複数個の非零のパルスから構成する。ここで、各パルスは、パルス毎に予め定められたパルス位置候補から選択される。各パルスの振幅は、極性のみである。例えば、8kHzサンプリングでサブフレーム長が5msの場合(N=40サンプル)、マルチパルス励振信号をP(例えば、5)個のパルスから構成する。P個のパルスは、それぞれ予め定められたM(p),p=0,…,P−1(例えば、各8)個のパルス候補位置から選択される。マルチパルス探索回路210は、パルス数Pと各パルスのM(p)個のパルス候補位置とを組合せたものを復数個保持しており、符号化パラメータ制御回路11によって指定されたビット配分に応じてパルス数Pと各パルスのM(p)個のパルス候補位置との組合せを選択する。選択したパルス数P(チャンネル数に等しい)と各チャンネルのM個のパルス候補位置を用いて、マルチパルス信号Cj(n)を作成し、数4を最小化するマルチパルス信号Cj(n)を選択する。
Figure 0004179232
ここで、X′(n)はターゲット信号X(n)から適応コードベクトルの再生信号SAd(n)を減算した信号であり、数5で与えられる。
Figure 0004179232
なお、数4を最小化する際には、例えば、特願平7−318071号明細書(文献6)に記載された手法を用い演算量を低減する。さらに、マルチパルス探索回路210は、選択されたマルチパルス信号Cj(n)及びその再生信号SCj(n)をゲイン探索回路211に出力するとともに対応するインデックスjを出力端子216を介してマルチプレクサ13に出力する。
さらに、ゲイン探索回路211では、適応コードベクトルの再生信号SAd(n)、マルチパルスの再生信号SCj(n)、及びターゲット信号X(n)を用いて、数6を最小化するようにゲインGA、GCを量子化する。
Figure 0004179232
また、ゲイン探索回路211では、量子化されたゲイン、適応コードベクトル、及びマルチパルス信号を用いて励振信号を作成して、励振信号をサブフレームバッファ207を介して聴感重み付け再生信号作成回路206及び適応コードブック探索回路209に出力し、ゲインに対応するインデックスkを出力端子216を介してマルチプレクサ13に出力する。
再び、図1を参照して、マルチプレクサ13では、量子化LSPを表すインデックス、ピッチとマルチパルス信号のインデックス、及び量子化ゲインを表すインデックスをフレーム毎にビットストリームに変換して出力する。なお、ビットレートと符号化遅延を表す情報は、ビットストリームのヘッダ部分に格納される。
音声復号装置において、デマルチプレクサ14には、ビットストリームが与えられ、デマルチプレクサ14では、ビットストリームのヘッダ部分に存在するビットレートと符号化遅延とを表す情報を符号化パラメータ制御回路15に出力した後、フレーム毎にビットストリームから量子化LSPを表すインデックス、ピッチとマルチパルス信号のインデックス、及び量子化ゲインを表すインデックスを抽出して、CELP復号回路16に出力する。
符号化パラメータ制御回路15は、符号化側の符号化パラメータ制御回路11と同様の動作を行い、入力されたビットレートと符号化遅延に応じて制御パラメータを選択して、CELP復号回路16に出力する。
図3も参照して、CELP復号回路16の動作について説明する。
量子化LSPを表すインデックス、ピッチとマルチパルス信号のインデックス、及び量子化ゲインを表すインデックスは、入力端子227を介して線形予測係数復号回路221、適応コードブック復号回路222、マルチパルス復号回路223、及びゲイン復号回路224に入力される。
符号化パラメータ制御回路15によって設定されたフレーム長は、入力端子228を介して線形予測係数復号回路221及びフレーム統合回路226に入力される。
符号化パラメータ制御回路15によって設定されたサブフレーム長は、入力端子229を介して線形予測係数復号回路221、適応コードブック復号回路222、マルチパルス復号回路223、ゲイン復号回路224、再生信号作成回路225、及びフレーム統合回路226に入力される。
符号化パラメータ制御回路15によって設定されたビット配分は、入力端子230を介して線形予測係数復号回路221、適応コードブック復号回路222、マルチパルス復号回路223、及びゲイン復号回路224に入力される。
線形予測係数復号回路221では、量子化LSPを表すインデックスをフレーム毎に入力して、サブフレーム毎に量子化線形予測係数a′(i),i=1,…,Npを復号し、再生信号合成回路225に出力する。
適応コードブック復号回路222では、サブフレーム毎に入力したピッチから適応コードベクトルを復号して、ゲイン復号回路224に出力する。マルチパルス復号回路223では、サブフレーム毎に入力したインデックスからマルチパルス信号を復号して、ゲイン復号回路224に出力する。
ゲイン復号回路224では、サブフレーム毎に入力したインデックスからゲインを復号して、適応コードベクトル、マルチパルス信号、及びゲインを用いて励振信号を作成して、再生信号合成回路225に出力する。
再生信号合成回路225では、サブフレーム毎に励振信号で線形予測合成フィルタHs(z)を駆動して再生信号を作成し、フレーム統合回路226に出力する。なお、線形予測合成フィルタHs(z)は、前述の数1で表される。フレーム統合回路226は、サブフレーム毎に入力される再生信号をフレーム長分繋げてフレーム毎に出力する。
図4を参照して、本発明による音声符号化復号装置の他の例について説明する。
図示の音声符号化復号装置は音声符号化装置及び音声復号装置を有しており、音声符号化装置は符号化パラメータ制御回路31、CELP符号化回路32、マルチパルス符号化パラメータ設定回路33、及びマルチプレクサ13を備えている。一方、音声復号装置はデマルチプレクサ14、符号化パラメータ制御回路34、CELP復号回路35、及びマルチパルス符号化パラメータ設定回路16を備えている。
音声符号化装置において、符号化パラメータ制御回路31は、ビットレートと符号化遅延とを制御情報として受け、入力されたビットレートと符号化遅延とからCELP符号化における分析処理に必要な先読み長を引いてフレーム長を算出する。また、算出したフレーム長に基づいてCELP符号化回路32の動作を制御する制御パラメータが複数記載されたテーブルの中から入力されたビットレートに応じて制御パラメータを選択して、CELP符号化回路32に出力する。制御パラメータは、フレーム長、サブフレーム長、及びビット配分である。さらに、符号化パラメータ制御回路31は、サブフレーム長及びマルチパルス信号に配分されたビット数をマルチパルス生成パラメータ設定回路33に出力する。
マルチパルス生成パラメータ設定回路33では、入力したサブフレーム長Nとマルチパルス信号のビット数Yとからマルチパルス励振信号の符号化に必要なパルス数P、各パルスのパルス候補位置数M(p)、及びその候補位置を数7及び数8を満たすように算出する。ここで、各パルスのパルス候補位置は、前述の文献2に記載されているように、数列0,2,3,…,N−1をパルス数Pでインターリブした形で設定する。例えば、サブフレーム長が40サンプル(N=40)、マルチパルス信号のビット数が20ビット(Y=20)の場合、パルス数Pは5、パルス候補位置数M(p)は8となる。この際のパルス候補位置の例を表1に示す。
Figure 0004179232
Figure 0004179232
Figure 0004179232
CELP符号化回路32は、符号化パラメータ制御回路31によって設定されたフレーム長、サブフレーム長、及びビット配分と、マルチパルス生成パラメータ設定回路33で設定されたパルス数P、各パルスのパルス候補位置数M(p)、及びその候補位置とに基づいて入力信号を符号化する。
図5も参照して、CELP符号化回路32の動作について説明する。
このCELP符号化回路32は、図2で説明したCELP符号化回路と比べてマルチパルス探索回路の動作のみが異なっている。従って、ここでは、マルチパルス探索回路401の動作についてのみ説明する。
マルチパルス探索回路401は、入力端子217を介してマルチパルス生成パラメータ設定回路33で設定されたパルス数Pと各パルスのM(p)個のパルス候補位置とを入力し、マルチパルス信号Cj(n)を作成して、前述の数4を最小化するマルチパルス信号Cj(n)を選択する。なお、前述のように、数4の最小化の際には、文献6に記載の手法を用いることによってその演算量を低減できる。
また、マルチパルス探索回路401は、選択されたマルチパルス信号Cj(n)及びその再生信号SCj(n)をゲイン探索回路211に出力するとともに対応するインデックスjを出力端子216を介してマルチプレクサ13に出力する。そして、図1に関連して説明したようにして、マルチプレクサ13はビットストリームを出力する。
図4を参照して、音声復号装置において、ビットストリームはデマルチプレクサ14で受信される。そして、図1に関連して説明したように、デマルチプレクサ14は、ビットストリームのヘッダ部分に存在するビットレートと符号化遅延とを表す情報を符号化パラメータ制御回路34に出力した後、フレーム毎にビットストリームから量子化LSPを表すインデックス、ピッチとマルチパルス信号のインデックス、及び量子化ゲインを表すインデックスを抽出して、CELP復号回路35に出力する。
符号化パラメータ設定回路34は、符号化パラメータ制御回路31と同様の動作を行って、制御パラメータを選択して、CELP復号回路35に出力する。
マルチパルス生成パラメータ設定回路36は、符号化側のマルチパルス生成パラメータ設定回路33と同様の動作を行って、マルチパルス励振信号を表すパルス数、各パルスのパルス候補位置数、及びその候補位置とを算出して、CELP復号回路35に出力する。図6も参照して、CELP復号回路35の動作について説明する。
このCELP復号回路35は、図3で説明したCELP復号回路と比べて、マルチパルス復号回路の動作のみが異なっている。従って、ここでは、マルチパルス復号回路402の動作についてのみ説明する。
マルチパルス復号回路402では符号化パラメータ制御回路34によって設定されたサブフレーム長を入力端子229を介して入力し、マルチパルス生成パラメータ設定回路36で設定されたパルス数、各パルスのパルス候補位置数、及びその候補位置を入力端子232を介して入力して、サブフレーム毎に入力したインデックスからマルチパルス信号を復号する。
図7を参照して、本発明による音声符号化装置のさらに他の例について説明する。
図示の音声符号化装置は、符号化パラメータ制御回路61、CELP符号化回路62、及びマルチプレクサ13を備えている。符号化パラメータ制御回路61は、図1で説明した符号化パラメータ制御回路11と同様な動作を行い、入力されたビットレート及び符号化遅延からフレーム長、サブフレーム長、及びビット配分を設定する。さらに、符号化パラメータ制御回路61では入力された演算量からマルチパルス信号の符号化に費やせる演算量であるマルチパルス符号化許容演算量を算出する。これは、予め他のパラメータの符号化に必要な演算量を記憶しておき、入力された演算量からこれらの値を差し引くことにより算出できる。符号化パラメータ制御回路61は、フレーム長、サブフレーム長、及びビット配分とマルチパルス符号化許容演算量とを制御パラメータとしてCELP符号化回路62に出力する。
CELP符号化回路62は、上記のフレーム長、サブフレーム長、及びビット配分とマルチパルス符号化許容演算量とに従って入力信号を符号化する。
図8も参照して、CELP符号化回路62の動作について説明する。
このCELP符号化回路62は、図2で説明したCELP符号化装置と比べて、マルチパルス探索回路の動作のみが異なっている。従って、ここでは、マルチパルス探索回路301についてのみ説明する。
マルチパルス探索回路301は、図2で説明したマルチパルス探索回路210と同様な動作を行って、前述の数4を最小化するマルチパルス信号Cj(n)を選択する。この際に、マルチパルス信号の符号化に費やす演算量が入力端子218を介して入力されたマルチパルス符号化許容演算量を越えないように予備選択を行なう。この予備選択は、数9で表されるElの値が大きいものを選択することにより実現できる。
Figure 0004179232
また、マルチパルス探索回路301は、選択されたマルチパルス信号Cj(n)及びその再生信号SCj(n)をゲイン探索回路211に出力するとともに対応するインデックスjを出力端子216を介してマルチプレクサ13に出力する。
図9を参照して、本発明による音声符号化装置のさらに他の例について説明する。
図示の音声符号化装置は、符号化パラメータ制御回路71、マルチパルス生成パラメータ設定回路33、及びCELP符号化回路72、及びマルチプレクサ13を備えている。
符号化パラメータ制御回路71は、図4で説明した符号化パラメータ制御回路31と同様な動作を行い、入力されたビットレートと符号化遅延とからフレーム長、サブフレーム長、及びビット配分を設定する。さらに、符号化パラメータ制御回路71は、入力された演算量からマルチパルス信号の符号化に費やせる演算量であるマルチパルス符号化許容演算量を算出する。そして、符号化パラメータ制御回路71は、フレーム長、サブフレーム長、及びビット配分とマルチパルス符号化許容演算量とをCELP符号化回路72に出力する。さらに、符号化パラメータ制御回路71は、サブフレーム長とマルチパルス信号に配分されたビット数とをマルチパルス生成パラメータ設定回路33に出力する。
CELP符号化回路72は、符号化パラメータ制御回路71によって設定されたフレーム長、サブフレーム長、及びビット配分とマルチパルス符号化許容演算量と、マルチパルス生成パラメータ設定回路33で設定されたパルス数P、各パルス候補位置数M(p)、及びその候補位置とに応じて入力信号を符号化する。
図10も参照して、CELP符号化回路72の動作について説明する。
このCELP符号化回路72は、図5で説明したCELP符号化装置と比べてマルチパルス探索回路の動作のみが異なっている。従って、ここでは、マルチパルス探索回路501の動作についてのみ説明する。
マルチパルス探索回路501は、図5で説明したマルチパルス探索回路401と同様な動作を行い、数4を最小化するマルチパルス信号Cj(n)を選択する。この際に、マルチパルス信号の符号化に費やす演算量が入力端子218を介して入力されたマルチパルス符号化許容演算量を越えないように予備選択を行なう。また、マルチパルス探索回路501は、選択されたマルチパルス信号Cj(n)及びその再生信号SCj(n)をゲイン探索回路211に出力するとともに対応するインデックスjを出力端子216を介してマルチプレクサ13に出力する。
本発明による音声符号化復号装置の第1の例を示すブロック図である。 図1に示すCELP符号化回路を説明するためのブロック図である。 図1に示すCELP復号回路を説明するためのブロック図である。 本発明による音声符号化復号装置の第2の例を示すブロック図である。 図4に示すCELP符号化回路を説明するためのブロック図である。 図4に示すCELP復号回路を説明するためのブロック図である。 本発明による音声符号化装置の第3の例を示すブロック図である。 図7に示すCELP符号化回路を説明するためのブロック図である。 本発明による音声符号化装置の第4の例を示すブロック図である。 図9に示すCELP符号化回路を説明するためのブロック図である。 従来の音声符号化復号装置の一例を示すブロック図である。
符号の説明
11,15,31,34 符号化パラメータ制御回路
12,32 CELP符号化回路
16,35 CELP復号回路
33,36 マルチパルス符号化パラメータ設定回路

Claims (10)

  1. 入力音声信号の励振信号を複数のパルスから成るマルチパルス信号で表して前記励振信号によって前記入力音声信号の線形予測係数で規定された線形予測合成フィルタを励振して得られる再生音声信号と前記入力音声信号との間の歪みを最小化するように前記励振信号を決定する音声符号化手段を有する音声符号化装置であって、
    少なくとも演算量を制御情報として受け該制御情報に応じて制御パラメータを生成する制御回路と、マルチパルス符号化に利用する演算量に応じマルチパルス信号の構成を表す複数の設定パラメータから前記制御パラメータに応じた設定パラメータを設定する設定回路とを備えており、前記音声符号化手段は前記制御パラメータ及び前記設定パラメータに基づいて前記入力音声信号を符号化するようにしたことを特徴とする音声符号化装置。
  2. 入力音声信号の励振信号を複数のパルスから成るマルチパルス信号で表して前記励振信号によって前記入力音声信号の線形予測係数で規定された線形予測合成フィルタを励振して得られる再生音声信号と前記入力音声信号との間の歪みを最小化するように前記励振信号を決定する音声符号化手段を有する音声符号化装置であって、
    指定されたビットレートと演算量を制御情報として受け該制御情報に応じて制御パラメータを生成する制御回路と、マルチパルス符号化に利用する演算量に応じマルチパルス信号の構成を表す複数の設定パラメータから前記制御パラメータに応じた設定パラメータを設定する設定回路とを備えており、前記音声符号化手段は前記制御パラメータ及び前記設定パラメータに基づいて前記入力音声信号を符号化するようにしたことを特徴とする音声符号化装置。
  3. 符号化音声データを受け、前記符号化音声データから再生音声信号を再生する音声復号装置であって、前記符号化音声データは音声信号の励振信号及び線形予測合成フィルタ係数を有するとともに少なくとも演算量を含み、前記励振信号は複数のパルスから成るマルチパルス信号で表されており、前記演算量に基づいて制御パラメータを生成する制御回路と、マルチパルス符号化に利用する演算量に応じマルチパルス信号の構成を表す複数の設定パラメータから前記制御パラメータに応じた設定パラメータを設定する設定回路と、前記制御パラメータ及び前記設定パラメータに基づいて前記符号化音声データから前記励振信号と前記線形予測合成フィルタ係数を復号して前記励振信号に応じて前記線形予測合成フィルタ係数で規定される線形予測合成フィルタを励振して前記再生音声信号を再生する復号手段とを有することを特徴とする音声復号装置。
  4. 前記設定回路において設定される設定パラメータは、マルチパルス信号のパルス数と各パルスの候補位置数とのその候補位置の少なくともいずれかを含むことを特徴とする請求項1または2に記載の音声符号化装置。
  5. 前記設定回路において設定される設定パラメータは、マルチパルス信号のパルス数と各パルスの候補位置数とのその候補位置の少なくともいずれかを含むことを特徴とする請求項3に記載の音声復号装置。
  6. 入力音声信号の励振信号を複数のパルスから成るマルチパルス信号で表して前記励振信号によって前記入力音声信号の線形予測係数で規定された線形予測合成フィルタを励振して得られる再生音声信号と前記入力音声信号との間の歪みを最小化するように前記励振信号を決定する音声符号化手順を少なくとも含む音声符号化方法であって、
    少なくとも演算量を制御情報として受け該制御情報に応じて制御パラメータを生成する制御手順と、マルチパルス符号化に利用する演算量に応じマルチパルス信号の構成を表す複数の設定パラメータから前記制御パラメータに応じた設定パラメータを設定する設定手順とを含み、前記音声符号化手順において前記制御パラメータ及び前記設定パラメータに基づいて前記入力音声信号を符号化するようにしたことを特徴とする音声符号化方法。
  7. 入力音声信号の励振信号を複数のパルスから成るマルチパルス信号で表して前記励振信号によって前記入力音声信号の線形予測係数で規定された線形予測合成フィルタを励振して得られる再生音声信号と前記入力音声信号との間の歪みを最小化するように前記励振信号を決定する音声符号化手順を少なくとも含む音声符号化方法であって、
    指定されたビットレートと演算量を制御情報として受け該制御情報に応じて制御パラメータを生成する制御手順と、マルチパルス符号化に利用する演算量に応じマルチパルス信号の構成を表す複数の設定パラメータから前記制御パラメータに応じた設定パラメータを設定する設定手順とを含み、前記音声符号化手順は前記制御パラメータ及び前記設定パラメータに基づいて前記入力音声信号を符号化するようにしたことを特徴とする音声符号化方法。
  8. 符号化音声データを受け、前記符号化音声データから再生音声信号を再生する音声復号方法であって、
    前記符号化音声データは音声信号の励振信号及び線形予測合成フィルタ係数を有するとともに少なくとも演算量を含み、前記励振信号は複数のパルスから成るマルチパルス信号で表されており、前記演算量に基づいて制御パラメータを生成する制御手順と、マルチパルス符号化に利用する演算量に応じマルチパルス信号の構成を表す複数の設定パラメータから前記制御パラメータに応じた設定パラメータを設定する設定手順と、前記制御パラメータ及び前記設定パラメータに基づいて前記符号化音声データから前記励振信号と前記線形予測合成フィルタ係数を復号して前記励振信号に応じて前記線形予測合成フィルタ係数で規定される線形予測合成フィルタを励振して前記再生音声信号を再生する復号手順とを含むことを特徴とする音声復号方法。
  9. 前記設定手順において設定される設定パラメータは、マルチパルス信号のパルス数と各パルスの候補位置数とのその候補位置の少なくともいずれかを含むことを特徴とする請求項6または7に記載の音声符号化方法。
  10. 前記設定手順において設定される設定パラメータは、マルチパルス信号のパルス数と各パルスの候補位置数とのその候補位置の少なくともいずれかを含むことを特徴とする請求項8に記載の音声復号方法。
JP2004172285A 2004-06-10 2004-06-10 音声符号化装置及び音声復号装置 Expired - Lifetime JP4179232B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004172285A JP4179232B2 (ja) 2004-06-10 2004-06-10 音声符号化装置及び音声復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004172285A JP4179232B2 (ja) 2004-06-10 2004-06-10 音声符号化装置及び音声復号装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002035066A Division JP3845316B2 (ja) 2002-02-13 2002-02-13 音声符号化装置及び音声復号装置

Publications (2)

Publication Number Publication Date
JP2004252490A JP2004252490A (ja) 2004-09-09
JP4179232B2 true JP4179232B2 (ja) 2008-11-12

Family

ID=33028767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004172285A Expired - Lifetime JP4179232B2 (ja) 2004-06-10 2004-06-10 音声符号化装置及び音声復号装置

Country Status (1)

Country Link
JP (1) JP4179232B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4676929B2 (ja) * 2006-07-19 2011-04-27 日本電信電話株式会社 符号化装置、それらの方法、プログラム及び記録媒体
JP5981909B2 (ja) * 2011-06-15 2016-08-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America パルス位置探索装置、符号帳探索装置、及びこれらの方法

Also Published As

Publication number Publication date
JP2004252490A (ja) 2004-09-09

Similar Documents

Publication Publication Date Title
JP3134817B2 (ja) 音声符号化復号装置
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
JPH0990995A (ja) 音声符号化装置
JPH11327597A (ja) 音声符号化装置及び音声復号化装置
JP3582589B2 (ja) 音声符号化装置及び音声復号化装置
JP3746067B2 (ja) 音声復号化方法及び音声復号化装置
JP3063668B2 (ja) 音声符号化装置及び復号装置
JPH09160596A (ja) 音声符号化装置
JP3329216B2 (ja) 音声符号化装置及び音声復号装置
JP4179232B2 (ja) 音声符号化装置及び音声復号装置
JP3845316B2 (ja) 音声符号化装置及び音声復号装置
US7024355B2 (en) Speech coder/decoder
JP2004126628A (ja) 音声符号化装置及び音声復号装置
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP2001318698A (ja) 音声符号化装置及び音声復号化装置
JP2736157B2 (ja) 符号化装置
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP3153075B2 (ja) 音声符号化装置
JP4238535B2 (ja) 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体
JP2008090311A (ja) 音声符号化方法
JPH06130994A (ja) 音声符号化方法
KR20070116869A (ko) 저-복잡성 코드 여기 선형 예측 인코딩
JP3563400B2 (ja) 音声復号化装置及び音声復号化方法
JPH10149200A (ja) 線形予測符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040610

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050322

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060809

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20070118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070604

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20080606

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080805

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080818

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110905

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120905

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130905

Year of fee payment: 5

EXPY Cancellation because of completion of term