JP5159318B2 - 固定符号帳探索装置および固定符号帳探索方法 - Google Patents

固定符号帳探索装置および固定符号帳探索方法 Download PDF

Info

Publication number
JP5159318B2
JP5159318B2 JP2007549196A JP2007549196A JP5159318B2 JP 5159318 B2 JP5159318 B2 JP 5159318B2 JP 2007549196 A JP2007549196 A JP 2007549196A JP 2007549196 A JP2007549196 A JP 2007549196A JP 5159318 B2 JP5159318 B2 JP 5159318B2
Authority
JP
Japan
Prior art keywords
vector
pulse
filter
fixed codebook
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007549196A
Other languages
English (en)
Other versions
JPWO2007066771A1 (ja
Inventor
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007549196A priority Critical patent/JP5159318B2/ja
Publication of JPWO2007066771A1 publication Critical patent/JPWO2007066771A1/ja
Application granted granted Critical
Publication of JP5159318B2 publication Critical patent/JP5159318B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Description

本発明は、パルス音源を用いる固定符号帳探索装置および固定符号帳探索方法に関する。
固定符号帳ベクトルとして少数のパルスを代数的に配置する代数符号帳は、符号帳用のメモリが不要となり、符号帳探索の演算量を低減することが比較的容易であるので、ITU−T勧告G.729をはじめ、各種の音声符号化標準コーデックで用いられている。
しかし、代数符号帳は、少数のパルスを代数的に配置するだけなので、表現できるベクトルの特性に限界があり、必ずしも充分な符号化品質が得られるとは限らない。そこで、代数符号帳を改良する技術として、パルス拡散と呼ばれる技術がある(例えば、特許文献1参照)。この技術は、パルスに特定形状の拡散ベクトルを畳み込むことにより、代数符号帳によって生成される少数パルス・ベクトルでは表現しにくい特性のベクトルを生成することを可能とする。
また、代数符号帳の探索に必要な演算量は、使用するパルスの数が多ければ多いほど演算量も多くなるので、特にパルス数が多い代数符号帳を使用する場合は演算量を削減する工夫が必要となる。例えばパルス数が10本の場合のようにパルス数が多くなると、組み合わせの数も膨大となり、全探索が現実的でなくなる。このパルス数が多い場合の代数符号帳の演算量を削減するために、合成信号の誤差を最小化する評価関数と線形予測残差信号の誤差を最小化する評価関数とを併用し、符号帳探索の範囲を限定する技術がある(例えば、特許文献2参照)。
この技術では、通常の代数符号帳の探索は、合成信号の誤差を最小化するために、以下の式(1)で表される評価関数Esの最大化を行う。
Figure 0005159318
ここで、xはターゲット・ベクトル、Hは聴覚重み付き合成フィルタのインパルス応答畳み込みを表す下三角行列、cは代数符号帳によって生成される少数パルス・ベクトルをそれぞれ表し、添え字tは行列(またはベクトル)が転置行列(または転置ベクトル)であることを示す。ITU−T勧告G.729等はこの評価式に基づいて符号帳探索を行っている。
特開平10−63300号公報 特表平10−513571号公報
上記式(1)において、cはパルスを立てる位置の要素のみに値を有し、パルスが重ならない場合の絶対値は1であるので、Esの分子項および分母項は、例えばパルス数が3本の場合、それぞれ次式(2)(3)のように表せる。
Esの分子項=S1*Dn[i1]+S2*Dn[i2]+S3*Dn[i3] …(2)
Esの分母項-=φ[i1][i1]+φ[i2][i2]+φ[i3][i3]+2(S1*S2*φ[i1][i2]+S1*S3*φ[i1][i3]+S2*S3*φ[i2][i3]) …(3)
ここで、ベクトルDnは式(1)におけるxHであり、行列φは式(1)におけるH
Hである。また、Snは第nパルスの極性(具体的には正負)を表し、inは第nパルスの位置をそれぞれ表す。
すなわち、ベクトルDnと行列φとを予め求めておき、パルスを立てる位置に応じてDnとφの必要な要素を抜き出して総和をとることで、Esの分子項および分母項の計算が可能である。このように簡易に誤差評価関数の計算を行うことができるのが代数符号帳の特長である。
一方、線形予測残差信号の誤差を最小化する評価関数、すなわち残差領域(residual domain)における誤差を最小化する評価関数Erは、次式(4)で表されると考えられる。
Figure 0005159318
ここで、rは入力信号の線形予測残差ベクトル(理想残差ベクトル)である。このErの最大化によって残差領域での誤差最小化が行われる。
残差領域での誤差最小化は、合成フィルタを介さないので、上記式(1)からフィルタのインパルス応答畳み込み行列Hの部分がなくなった形となる。このような式になると、cは予めパルス本数が決まっている少数のパルス・ベクトルなので、分母項はパルス位置の組み合わせに関わらず定数となる(但し、異なるパルスの位置が重ならない場合)。よって、Erの最大化は分子項の最大化を考えれば良いことになる。
ここで、分子項は、単に理想残差ベクトルからパルスを立てる位置の要素を抜き出して総和をとるだけなので、パルス間の組み合わせを考慮する必要はなく、各パルスが取り得る位置の中で理想残差の振幅が最大となる位置を選べば良い。すなわち、残差領域での誤差最小化は、パルス間の組み合わせを考慮しなくとも、全部の組み合わせを試してみた場合と全く同じ結果を得ることができる。残差領域での誤差が最小であることは合成信号に含まれる誤差を最小化したことと同等ではないが、分母項が評価関数Esの値に与える影響が大きい場合は、Esの分母項を無視して分子項だけで合成領域での誤差最小化を近似する方法より適切な結果を与える。
そこで、2つのベクトルDnとrとを加算したベクトルをパルス位置の予備選択に用いる。ここで、予備選択とは、予め粗い精度でパルス位置の範囲を限定しておくことである。そして、予備選択後に、この範囲内で改めて精度良くパルス位置を決定する。ただし、Dnとrとでは大きさが全く異なるので、双方ともベクトルのエネルギで正規化する等の処理を行った上で足し合わせることが必要である。この加算ベクトルを最大化するパルス位置の組み合わせを予備選択したり、要素が大きくなる位置に相当するパルスを決定して残りのパルス位置を探索するようにしたりして、パルス探索の演算量を削減することができる。
しかしながら、特許文献2に開示の技術に上記パルス拡散技術を適用することを考えた場合、以下のような問題点が発生する。
次式(5)は、かかる場合に使用され得る評価関数Erの一例を示したものである。
Figure 0005159318
ここで、Dは拡散ベクトルを畳み込む行列である。
かかる状況下では、残差領域においてもパルス・ベクトルが拡散フィルタを介すため、誤差最小化のための評価関数の分母項がパルス位置の組み合わせによって変化し、誤差最小化処理を簡易化することができない。すなわち、パルスに拡散ベクトルを畳み込む処理があることの影響を考慮しないと、演算量削減による符号化性能の劣化がパルス拡散技術を用いない通常の代数符号帳における符号化性能の劣化を上回る可能性がある。
本発明の目的は、特許文献2に開示の技術に上記パルス拡散技術を適用する場合でも、誤差最小化処理を簡易化して演算量を削減することにより、符号化性能の劣化を防止することができる固定符号帳探索装置および固定符号帳探索方法を提供することである。
本発明の固定符号帳探索方法は、パルスベクトルに形状ベクトルを畳み込んで固定符号帳ベクトルを生成する固定符号帳を探索する固定符号帳探索方法であって、前記形状ベクトルを畳み込むフィルタの逆特性を有するフィルタを用いて線形予測残差信号をフィルタリングするステップと、前記逆特性を有するフィルタを用いたフィルタリングにより得られた信号とパルスベクトルとの間の誤差を最小化する第一の評価関数を用いて複数のパルス候補を予備選択するステップと、前記複数のパルス候補の組み合わせからなるパルスベクトルに前記形状ベクトルを畳み込んで前記固定符号帳ベクトルを生成するステップと、前記固定符号帳ベクトルに合成フィルタのインパルス応答を畳み込んで合成ベクトルを生成するステップと、ターゲットベクトルと前記合成ベクトルとの誤差を最小化する第二の評価関数を用いて1つのパルスベクトルの探索を行うステップと、を有するようにした。
本発明によれば、誤差最小化処理を簡易化して演算量を削減することにより、固定符号帳探索を高速に行った際の符号化性能の劣化を防止することができる。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
図1は、CELP符号化において、パルス形状の畳み込みを行った場合、すなわちパルスを拡散フィルタに通す処理を行った場合の、パルス音源から合成信号が生成されるまで間の信号の推移を説明するための図である。cは代数符号帳によって生成される少数パルス・ベクトル、Dは拡散ベクトルを畳み込む行列、Hは聴覚重み付き合成フィルタのインパルス応答畳み込みを表す下三角行列をそれぞれ表す。
この図において、cは互いに重ならないパルスによって構成されているので、パルスの本数が決まればパルス・ベクトルのエネルギも固定値である。これに対し、DcおよびHDcは1本のパルスから生成される各成分が互いに重なり合う部分が存在するので、重な
り合う部分の相関関係によりベクトルのエネルギは異なるものとなる。よって、c、Dc、HDcのそれぞれと、各ターゲット・ベクトルとの誤差最小化を考える際、cはベクトルをエネルギで正規化する必要がないが、DcおよびHDcの場合はベクトルのエネルギの違いを考慮して、エネルギで正規化する必要がある。
図2は、各段階のパラメータを用いた場合の評価関数の違いを数式と共に示した図である。下段に示すx、y、zの各々は、上段に示すHDc、Dc、cの各ターゲットとなるベクトルを示す。すなわち、これらのターゲット・ベクトルとの誤差がなければ、符号化歪みがゼロであると言える。
xは通常、入力音声信号に聴覚重み付けフィルタをかけて得られるベクトルであるが、スケーラブル符号化における拡張レイヤでは、このレイヤで符号化対象となる残差信号を聴覚重み付けした領域で表現したベクトルとなる。より具体的には、線形予測により得られる残差信号のような理想的な残差信号(理想残差信号)に、図1に示したように、聴覚重み付け合成フィルタをかけたものとなる。zをパルス形状畳み込みフィルタDに通すとyとなるように、また、yに合成フィルタインパルス応答を畳み込むとxとなるように、パルス形状畳み込み逆フィルタD−1および合成フィルタインパルス応答畳み込み逆フィルタH−1は設計されている。
なお、理想残差信号をyとし、これに合成フィルタインパルス応答畳み込みフィルタをかけてxを求めても良い。
例えば、CELP符号化では、残差領域での符号化誤差の最小化を行うのではなく、合成信号の符号化誤差の最小化を行うので、HDcとxとの誤差最小化を行うことになる。図2に示したように、この最小化は次式(6)に示される評価関数の最大化と等価である。
評価関数=xHDc/cHDc …(6)
ここで、tは行列の転置を表す。
すなわち、式(6)は、xとHDcとの相互相関をHDcのエネルギで正規化したものを最大化することである。この式の分子の最大化は、既に説明したように、予めベクトルxHDを求めておけば高速に行うことが可能である。特に互いにパルス位置が重ならない代数符号帳の場合は、パルスごとにとり得る位置の中でベクトルxHDの要素が最大となる位置を選択すれば良いので、各パルスの位置候補数が等しければ、(パルス数×パルス位置候補数)回の比較で分子項の最大化を行うことができる。しかし、分母項は各パルス間の相関項があるため、各パルス独立に最大化処理を行うことはできず、全てのパルスの組み合わせを考慮する必要がある。このような問題は、Dcとyとの誤差最小化においても同様に発生する。しかし、cとzとの誤差最小化においては、分母項ccは定数であるので、分子項だけで最大化を行うことができる。
そこで、cとzとの誤差最小化によってパルス位置の候補を絞り込み、絞り込んだパルス位置候補のみを用いてxとHDcとの誤差最小化を行い、最終的なパルス・ベクトルを決定する。この際、最終的なxとHDcとの誤差最小化で用いる分子項(xHDc)も併用する。
図3は、本実施の形態に係る固定符号帳探索装置100の主要な構成を示すブロック図である。固定符号帳探索装置100は、上記パルス位置候補の絞込みを行って、パルス探索の高速化を図る。
本実施の形態に係る固定符号帳(FCB)探索装置100は、ターゲット生成部101
、合成フィルタインパルス応答時間軸反転畳み込み部102、パルス形状時間軸反転畳み込み部103、パルス形状畳み込み逆フィルタ104、パルス候補予備選択部105、パルス生成部106、パルス形状畳み込みフィルタ107、合成フィルタインパルス応答畳み込みフィルタ108、およびパルス候補最終選択部109を備える。なお、表現を簡便にするため、「聴覚重み付け合成フィルタ」を単に「合成フィルタ」と表している。
FCB探索装置100の入力である理想残差信号は、ターゲット生成部101とパルス形状畳み込み逆フィルタ104とに入力される。ここで、理想残差信号とは、線形予測残差信号、あるいは、この固定符号帳によってこの残差信号と同じ音源信号を生成することができるなら量子化誤差がゼロになる信号である。
ターゲット生成部101は、図2に示したフィルタHに相当し、理想残差信号に合成フィルタのインパルス応答を畳み込んで、ターゲット・ベクトルを生成し、合成フィルタインパルス応答時間軸反転畳み込み部102へ出力する。ここで、ターゲット・ベクトルは図2に示したxに相当する。
合成フィルタインパルス応答時間軸反転畳み込み部102は、合成フィルタインパルス応答を時間軸上で反転して畳み込む処理(上記式(1)におけるxHの計算)を行い、得られるベクトルをパルス形状時間軸反転畳み込み部103へ出力する。
パルス形状時間軸反転畳み込み部103は、合成フィルタインパルス応答時間軸反転畳み込み部102で求められたベクトル(上記式(1)や(6)におけるxHに相当)に、パルス形状を時間軸上で反転して畳み込む処理(上記式(6)におけるxHDに相当)を行い、この処理によって得られるベクトルをパルス候補予備選択部105およびパルス候補最終選択部109へ出力する。なお、合成フィルタインパルス応答時間軸反転畳み込み部102およびパルス形状時間軸反転畳み込み部103の処理は、双方の処理の組み合わせの結果として上記xHDの計算を行うものであるので、(xH)を先に計算してDを乗じても良いし、(HD)を先に計算してこれをxに乗じても良い。前者の場合は図3を用いた上記の説明の通りであるが、後者の場合は図3の処理ブロック102と103とを一つのブロックにまとめて以下の処理を行うことに相当する。すなわち、合成フィルタインパルス応答にパルス形状を畳み込んだベクトルを算出し、このベクトルをターゲット・ベクトルに時間軸反転して畳み込む処理(上記xHDの計算)を行い、この処理の結果をパルス候補予備選択部105およびパルス候補最終選択部109へ出力する。
パルス形状畳み込み逆フィルタ104は、理想残差信号に逆フィルタをかけて得られる信号をパルス候補予備選択部105へ出力する。なお、パルス形状畳み込み逆フィルタ104は、パルス形状畳み込みフィルタ107の逆特性を有するフィルタであり、図2に示したD−1に相当する。但し、厳密な逆特性を有する必要はなく、近似的な逆特性で良い。また、理想残差信号に逆フィルタをかけて得られる信号は、図2に示したzに相当する。
パルス候補予備選択部105は、パルス形状畳み込み逆フィルタ104から出力されるベクトルzと、パルス形状時間軸反転畳み込み部103から出力されるxHDとがそれぞれ入力され、予備選択するパルスを決定し、この予備選択に関する情報をパルス生成部106へ出力する。
ここで、パルス候補限定部120は、パルス形状畳み込み逆フィルタ104とパルス候補予備選択部105を備え、zとxHDcとを用いてパルス位置の候補を絞り込む処理を行う。これは、cとzとの誤差最小化基準およびxとHDcとの誤差最小化基準の分子項(xHDc)を併用してパルス位置候補の予備選択を行うことである。zはパルス形
状畳み込み逆フィルタ104が理想残差信号から算出し、xHDcはパルス形状時間軸反転畳み込み部103により算出される。例えば、zとxHDcの線形和で定義される評価関数を大きくするパルス位置候補をパルス候補予備選択部105が選択する。
パルス生成部106は、パルス候補予備選択部105から入力される情報に基づいて、限定された組み合わせのパルスからなるパルス・ベクトルを生成し、パルス形状畳み込みフィルタ107へ出力すると共に、出力したパルス・ベクトルを生成するために必要な情報、具体的には各パルスの位置情報と極性情報とをパルス候補最終選択部109へ出力する。
パルス形状畳み込みフィルタ107は、パルス・ベクトルの各パルスに対して形状ベクトルを付与するフィルタであり、行列式で次式(7)のように表される。
Figure 0005159318
なお、ベクトルdは、パルス位置iごとに異なるベクトルであっても良いが、n種類のベクトルをメモリに保持しなければならなかったり、各ベクトルの相関行列を求めるための演算量が大きくなったりするという問題があるため、通常は全ての位置において異なるベクトルdを用いることはしない。
パルス形状畳み込みフィルタ107は、上記式(7)を用いてパルス形状をパルス・ベクトルに畳み込み、得られたベクトルを合成フィルタインパルス応答畳み込みフィルタ108へ出力する。
合成フィルタインパルス応答畳み込みフィルタ108は、パルス形状畳み込みフィルタ107から出力されたベクトルに、合成フィルタのインパルス応答を畳み込み、パルス候補最終選択部109へ出力する。
パルス候補最終選択部109は、合成フィルタインパルス応答畳み込みフィルタ108から合成ベクトルが、パルス形状時間軸反転畳み込み部103からベクトルxHDが、パルス生成部106からパルス位置情報がそれぞれ入力され、既に説明済みの以下の式(6)で表される評価関数の値を算出する。
評価関数=xHDc/cHDc …(6)
なお、合成フィルタインパルス応答畳み込みフィルタ108から入力される合成ベクトルはHDcに相当する。
厳密には、上記評価関数は以下の式(8)となる。
(xHDc)/(cHDc) …(8)
しかし、xHDcが正になるようにパルス極性を事前に限定すれば、分子項の二乗は必要なくなり、極性の組み合わせも事前に決定できるので、演算量を少なくするためにこ
の方法を用いる。
そして、パルス候補最終選択部109は、パルス生成部106が生成する全てのパルス・ベクトルの中から評価関数の値が最大となるパルス・ベクトルを選択し、そのパルス・ベクトルに対応するパルス位置情報をパルス符号情報として出力する。なお、通常はパルス符号情報だけでなく、最終的に選択されたパルス・ベクトル、パルス・ベクトルに合成フィルタインパルス応答を畳み込んだベクトル等も出力する。これらは、後段のゲイン量子化や合成フィルタの状態更新等に利用される。
このように、本実施の形態によれば、理想残差信号にパルス拡散逆フィルタを掛けた信号、すなわちパルス拡散フィルタを介すと理想残差信号となるような信号と、パルス・ベクトルとの誤差を最小化する評価関数を利用し、パルス拡散を適用した代数符号帳の探索を行う。より詳細には、パルス拡散フィルタを介すと理想残差信号となるような信号と、通常の代数符号帳探索における誤差最小化で用いられる評価関数の分子項と、の和ベクトルを用いて符号帳探索の予備選択を行う。
これにより、誤差最小化処理を簡易化して演算量を削減することができるので、固定符号帳探索を高速に行った際の符号化性能の劣化を抑えることができる。
なお、本実施の形態では、パルス・ベクトルにパルス形状ベクトルを畳み込み、その後さらに合成フィルタインパルス応答を畳み込む構成を例にとって説明したが、分子項と同様、合成フィルタインパルス応答にパルス形状ベクトルを畳み込み、先に行列HDに相当するものを求めておくような構成としても良い。これにより、分母項の計算が簡便となる。一般的には、ITU−T勧告G.729で開示されているように、予め行列DHHDに相当するものを求めておき、パルスを立てる位置に関係する要素を抜き出して分母項を計算する。
(実施の形態2)
図4は、本発明の実施の形態2に係る固定符号帳探索装置の主要な構成を示すブロック図である。なお、この固定符号帳探索装置は、実施の形態1に示した固定符号帳探索装置と同様の基本的構成を有しており、同一の構成要素には同一の符号を付し、その説明を省略する。また、基本的動作は同一であるが詳細な点で違いがある構成要素には、同一の番号にアルファベットの小文字を付した符号を付して区別し、適宜説明を加える。
本実施の形態に係る固定符号帳探索装置200は、パルス形状決定部201およびパルス形状畳み込み逆フィルタ算出部202をさらに備え、パルス形状フィルタによって畳み込まれるパルス形状ベクトルを適応的に変化させる。
具体的には、パルス形状決定部201は、適応化パラメータに応じて変化させたパルス形状ベクトルをパルス形状畳み込み逆フィルタ算出部202へ出力する。適応化パラメータの具体例としては、ピッチゲイン等の有声性を表すパラメータ、予め用意されているモード情報を示すフラグ、雑音性の強さを表すパラメータ等が用いられる。
パルス形状畳み込み逆フィルタ算出部202は、パルス形状が適応的に変化するので、パルス形状畳み込みフィルタの逆フィルタをそれに合わせて変化させるため、各パルス形状の対応したフィルタ特性をそれぞれ算出する。
より詳細には、パルス形状畳み込み逆フィルタ算出部202は以下の動作を行う。
例えば、パルス形状畳み込み逆フィルタ算出部202は、パルス形状の適応処理が切り
替え型である場合、すなわち事前に用意された複数種類のパルス形状ベクトルの中から適応的に1つのパルス形状ベクトルを選択する場合は、それぞれのパルス形状ベクトルを畳み込むフィルタの逆フィルタの係数を予め用意しておき、パルス形状決定部201から出力されたパルス形状の情報を用いて、選ばれたパルス形状ベクトルに対応する逆フィルタの係数をパルス形状畳み込み逆フィルタ104aへ出力する。
一方、パルス形状の適応処理が連続型である場合、すなわち適応化パラメータの連続関数としてパルス形状ベクトルが表される場合、パルス形状畳み込み逆フィルタ算出部202は、パルス形状決定部201から出力されるパルス形状ベクトルに基づいて、直接逆フィルタの係数を求めるか(行列Dの逆行列を求めるか)、事前にパルス形状ベクトル畳み込み逆フィルタ104aのフィルタ係数を適応化パラメータの関数として表しておき、パルス形状決定部201から適応化パラメータが入力されるのに伴い、当該関数を用いてパルス形状ベクトル畳み込み逆フィルタのフィルタ係数を算出する。この関数は、適当な次数の多項式で近似したものでも良い。得られたパルス形状畳み込み逆フィルタ104aのフィルタ係数はパルス形状畳み込み逆フィルタ104aへ出力される。
このように、本実施の形態によれば、パルス形状ベクトルを畳み込むフィルタの逆フィルタを、適応化パラメータに基づいて予め用意されたフィルタの中から選択するか、または適応化パラメータの関数を用いて求める構成としたので、パルス・ベクトルに畳み込むパルス形状ベクトルが可変である場合においても、パルス形状ベクトルを畳み込むフィルタの逆フィルタとして適切な特性を有する逆フィルタを用いて実施の形態1と同様の効果を得ることができる。
(実施の形態3)
本発明の実施の形態3は、実施の形態1に示したFCB探索装置100をCELP符号化装置に搭載した場合の一例である。なお、本実施の形態では、FCB探索装置100をFCB探索部305と表記する。
図5は、本実施の形態に係るCELP符号化装置の主要な構成を示すブロック図である。
本実施の形態に係るCELP符号化装置の各部は、以下のように動作する。
前処理部301は、入力音声信号に対し、直流成分カットのためのハイパスフィルタ処理、プリエンファシス処理等のCELP符号化の符号化性能を高めるための処理を行い、前処理後の入力音声信号を線形予測分析部302およびACB探索部304へ出力する。
線形予測分析部302は、入力された前処理後の音声信号の線形予測分析を行い、得られる線形予測係数(LPC)をLPC量子化部303およびACB探索部304へ出力する。
LPC量子化部303は、入力された線形予測係数の量子化を行い、量子化LPCをACB探索部304へ出力する。また、LPCの符号化情報(LPC符号)を多重化部310へ出力する。なお、LPCの量子化は、LSF等のパラメータに変換されて行われるのが一般的である。
ACB探索部304は、ターゲット・ベクトルを生成する機能、適応符号帳を探索する機能、固定符号帳探索に必要なパラメータを算出する機能、適応符号帳を更新する機能、およびフィルタの状態を更新する機能を有する。
ここで、ターゲット・ベクトルは、合成フィルタのゼロ入力応答成分を除去した聴覚重み付け入力音声信号を計算することによって得られる。聴覚重み付けフィルタは、線形予測分析部302から入力されたLPCに重み係数を乗じたものを用いた極零フィルタまたは全極フィルタを用いる。ターゲット・ベクトルは、以下で説明する適応符号帳探索で使用されると共に、ゲイン量子化部306へ出力される。
また、ACB探索部304において行われる適応符号帳探索は、加算部309から入力される過去の量子化音源信号をバッファリングする適応符号帳と、LPC量子化部303より入力された量子化LPCとを用いて計算された合成フィルタのインパルス応答と、前記ターゲット・ベクトルと、を用いて行われる。具体的には、適応符号帳から切り出した適応符号帳音源ベクトルに合成フィルタのインパルス応答を畳み込んだものに最適利得を乗じたものとターゲット・ベクトルとの誤差を最小とする適応符号帳の切り出し位置を決定する。この位置を表すパラメータが適応符号帳符号化情報として多重化部310へ出力される。また、決定された切り出し位置から切り出して生成された適応符号帳音源ベクトルに合成フィルタのインパルス応答を畳み込んだものは、ゲイン量子化で用いられるので、ゲイン量子化部306へ出力される。また、決定された切り出し位置から切り出して生成された適応符号帳音源ベクトルは、増幅器307に出力される。
固定符号帳探索に必要なパラメータとして、前処理後の入力音声信号の線形予測残差信号から適応符号帳成分(前記生成された適応符号帳音源ベクトルに適正利得を乗じたもの)を減じた信号が算出され、FCB探索部305へ出力される。なお、適応符号帳音源ベクトルの適正利得gは、次式(9)で算出する。
Figure 0005159318
ただし、gがゲイン量子化部306で量子化できる範囲外になった場合、例えばgが負の値であったり、1.0を大きく超える値である場合(立ち上がり部等ではgが2.0以上の値になることが多い)は、ゲイン量子化部306で量子化できる範囲の下限値もしくは上限値に設定する。ここで、xはターゲット・ベクトル、Hは聴覚重み付けインパルス応答畳み込み行列、aは適応符号帳音源ベクトルをそれぞれ表している。
適応符号帳の更新と合成フィルタの状態更新は、後述の固定符号帳探索およびゲイン量子化の双方の処理が完了し、量子化音源信号が生成された後に行う。
加算器309から入力される量子化音源信号で適応符号帳の更新を行う。すなわち符号化対象となっている単位時間サンプル分だけ適応符号帳のバッファをシフトして空いたバッファに最新の量子化音源信号を格納する。
また、前記量子化音源信号で合成フィルタを駆動して合成フィルタの状態更新を行うと共に聴覚重み付けフィルタの状態更新を行う。これらフィルタの状態更新はCELP符号化では一般的に行われることであり、ITU−T勧告G.729をはじめ各種の標準コーデックで規定されている方法で行う。
FCB探索部305は、ACB探索部304から固定探索符号帳成分としての理想残差信号が入力される。FCB探索部305の動作は実施の形態1で説明した通りであり、パルス符号を多重化部310へ出力し、選択されたパルス・ベクトルを増幅器308へ出力し、パルス・ベクトルに聴覚重み付けインパルス応答を畳み込んだものをゲイン量子化部306へ出力する。なお、パルス・ベクトルに対して、ピッチフィルタ等を適用しても良い。ピッチフィルタの例としてはITU−T勧告G.729で用いられているピッチプリ
フィルタが挙げられる。
ゲイン量子化部306は、ACB探索部304より、ターゲット・ベクトルと合成フィルタインパルス応答を畳み込んだ適応符号帳音源ベクトルが、FCB探索部305から、合成フィルタインパルス応答を畳み込んだパルス・ベクトルがそれぞれ入力され、次式(10)を最小とするgとgとを決定し、対応する増幅器307、308へそれぞれ出力する。
Figure 0005159318
ここで、xはターゲット・ベクトル、Hは合成フィルタインパルス応答畳み込み行列、aは適応符号帳音源ベクトル、cはパルス・ベクトル(固定符号帳音源ベクトル)、g’は量子化適応符号帳ゲイン、g’は量子化固定符号帳ゲインである。
増幅器307は、ACB探索部304から適応符号帳音源ベクトルが入力され、これにg’を乗じて加算器309に出力する。
増幅器308は、FCB探索部305からパルス音源ベクトル(固定符号帳音源ベクトル)が入力され、これにg’を乗じて加算器309に出力する。
加算器309は、2つの増幅器307、308から入力されたベクトルを加算してACB探索部304へ出力する。
多重化部310は、ACB探索部304から適応符号帳符号が、FCB探索部305からパルス符号(固定符号帳符号)が、ゲイン量子化部306からゲイン符号が、LPC量子化部303からLPC符号がそれぞれ入力され、これらを多重化してビットストリームとして出力する。
このように、本実施の形態の構成によれば、本発明に係る固定符号帳探索装置をCELP符号化に適用することができる。
以上、本発明の各実施の形態について説明した。
本発明に係る固定符号帳探索装置および固定符号帳探索方法は、上記各実施の形態に限定されず、種々変更して実施することが可能である。
本発明に係る固定符号帳探索装置は、移動体通信システムにおける通信端末装置および基地局装置に搭載することが可能であり、これにより上記と同様の作用効果を有する通信端末装置、基地局装置、および移動体通信システムを提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る固定符号帳探索方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る固定符号帳探索装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術の適用等が可能性としてあり得る。
2005年12月9日出願の特願2005−356634の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る固定符号帳探索装置および固定符号帳探索方法は、移動体通信システムにおける通信端末装置、基地局装置等の用途に適用することができる。
パルス音源から合成信号が生成されるまで間の信号の推移を説明するための図 各段階のパラメータを用いた場合の評価関数の違いを数式と共に示した図 実施の形態1に係る固定符号帳探索装置の主要な構成を示すブロック図 実施の形態2に係る固定符号帳探索装置の主要な構成を示すブロック図 実施の形態3に係るCELP符号化装置の主要な構成を示すブロック図

Claims (7)

  1. パルスベクトルに形状ベクトルを畳み込んで固定符号帳ベクトルを生成する固定符号帳を探索する固定符号帳探索方法であって、
    前記形状ベクトルを畳み込むフィルタの逆特性を有するフィルタを用いて線形予測残差信号をフィルタリングするステップと、
    前記逆特性を有するフィルタを用いたフィルタリングにより得られた信号とパルスベクトルとの間の誤差を最小化する第一の評価関数を用いて複数のパルス候補を予備選択するステップと、
    前記複数のパルス候補の組み合わせからなるパルスベクトルに前記形状ベクトルを畳み込んで前記固定符号帳ベクトルを生成するステップと、
    前記固定符号帳ベクトルに合成フィルタのインパルス応答を畳み込んで合成ベクトルを生成するステップと、
    ターゲットベクトルと前記合成ベクトルとの誤差を最小化する第二の評価関数を用いて1つのパルスベクトルの探索を行うステップと、
    を有する固定符号帳探索方法。
  2. 前記第二の評価関数は、
    前記ターゲットベクトルと前記合成ベクトルとの相互相関を前記合成ベクトルのエネルギで正規化した値を含む、
    請求項1記載の固定符号帳探索方法。
  3. 前記第二の評価関数として次式を用いる、
    請求項1記載の固定符号帳探索方法。
    評価関数=xHDc/(cHDc)
    但し、
    x:ターゲットベクトル
    H:聴覚重み付き合成フィルタのインパルス応答畳み込みを表す下三角行列
    D:拡散ベクトルの畳み込み行列
    c:パルスベクトル
    t:転置行列または転置ベクトルであることを示す添字
  4. パルスベクトルに形状ベクトルを畳み込んで固定符号帳ベクトルを生成する固定符号帳を探索する固定符号帳探索装置であって、
    前記形状ベクトルを畳み込むフィルタの逆特性を有し、線形予測残差信号をフィルタリングする逆フィルタと、
    前記逆フィルタを用いたフィルタリングにより得られた信号とパルスベクトルとの誤差を第一の評価関数を用いて最小化し複数のパルス候補を選択する第1選択手段と、
    前記複数のパルス候補の組み合わせからなるパルスベクトルに前記形状ベクトルを畳み込んで前記固定符号帳ベクトルを生成するパルス形状畳み込みフィルタと、
    前記固定符号帳ベクトルに合成フィルタのインパルス応答を畳み込んで合成ベクトルを生成するインパルス応答畳み込みフィルタと、
    ーゲットベクトルと前記合成ベクトルとの誤差を第二の評価関数を用いて最小化し1つのパルスベクトルを選択する第2選択手段と、
    を具備する固定符号帳探索装置。
  5. 適応化パラメータに応じて前記形状ベクトルを決定する決定手段と、
    前記形状ベクトルを畳み込むフィルタの逆特性を算出する算出手段と、
    をさらに具備し、
    前記逆フィルタは、
    前記算出手段によって算出された前記逆特性を用いてフィルタリングする、
    請求項4記載の固定符号帳探索装置。
  6. 請求項4記載の固定符号帳探索装置を具備する通信端末装置。
  7. 請求項4記載の固定符号帳探索装置を具備する基地局装置。
JP2007549196A 2005-12-09 2006-12-08 固定符号帳探索装置および固定符号帳探索方法 Expired - Fee Related JP5159318B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007549196A JP5159318B2 (ja) 2005-12-09 2006-12-08 固定符号帳探索装置および固定符号帳探索方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005356634 2005-12-09
JP2005356634 2005-12-09
JP2007549196A JP5159318B2 (ja) 2005-12-09 2006-12-08 固定符号帳探索装置および固定符号帳探索方法
PCT/JP2006/324587 WO2007066771A1 (ja) 2005-12-09 2006-12-08 固定符号帳探索装置および固定符号帳探索方法

Publications (2)

Publication Number Publication Date
JPWO2007066771A1 JPWO2007066771A1 (ja) 2009-05-21
JP5159318B2 true JP5159318B2 (ja) 2013-03-06

Family

ID=38122916

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007549196A Expired - Fee Related JP5159318B2 (ja) 2005-12-09 2006-12-08 固定符号帳探索装置および固定符号帳探索方法

Country Status (3)

Country Link
US (1) US8352254B2 (ja)
JP (1) JP5159318B2 (ja)
WO (1) WO2007066771A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2515299T3 (pl) * 2009-12-14 2018-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Urządzenie do kwantyzacji wektorowej, urządzenie do kodowania głosu, sposób kwantyzacji wektorowej i sposób kodowania głosu
US8731081B2 (en) * 2011-12-07 2014-05-20 Motorola Mobility Llc Apparatus and method for combinatorial coding of signals
US9105270B2 (en) * 2013-02-08 2015-08-11 Asustek Computer Inc. Method and apparatus for audio signal enhancement in reverberant environment
US20170069306A1 (en) * 2015-09-04 2017-03-09 Foundation of the Idiap Research Institute (IDIAP) Signal processing method and apparatus based on structured sparsity of phonological features

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001027900A (ja) * 1998-03-31 2001-01-30 Matsushita Electric Ind Co Ltd 音源ベクトル生成装置及び音源ベクトル生成方法
JP2001134298A (ja) * 1999-08-24 2001-05-18 Matsushita Electric Ind Co Ltd 音声符号化装置と音声復号化装置、及び音声符号化復号化システム
JP2004126628A (ja) * 2004-01-09 2004-04-22 Nec Corp 音声符号化装置及び音声復号装置
JP2004309686A (ja) * 2003-04-04 2004-11-04 Toshiba Corp 広帯域音声符号化方法及び広帯域音声符号化装置

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4963034A (en) * 1989-06-01 1990-10-16 Simon Fraser University Low-delay vector backward predictive coding of speech
US5754976A (en) 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5701392A (en) * 1990-02-23 1997-12-23 Universite De Sherbrooke Depth-first algebraic-codebook search for fast coding of speech
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5265190A (en) * 1991-05-31 1993-11-23 Motorola, Inc. CELP vocoder with efficient adaptive codebook search
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith
US5602959A (en) * 1994-12-05 1997-02-11 Motorola, Inc. Method and apparatus for characterization and reconstruction of speech excitation waveforms
SE504010C2 (sv) * 1995-02-08 1996-10-14 Ericsson Telefon Ab L M Förfarande och anordning för prediktiv kodning av tal- och datasignaler
JP3174733B2 (ja) 1996-08-22 2001-06-11 松下電器産業株式会社 Celp型音声復号化装置、およびcelp型音声復号化方法
EP1136985B1 (en) * 1996-11-07 2002-09-11 Matsushita Electric Industrial Co., Ltd. Apparatus and method for CELP speech coding and decoding
US6055496A (en) * 1997-03-19 2000-04-25 Nokia Mobile Phones, Ltd. Vector quantization in celp speech coder
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
AU6725500A (en) * 1999-08-23 2001-03-19 Matsushita Electric Industrial Co., Ltd. Voice encoder and voice encoding method
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
WO2003071522A1 (fr) * 2002-02-20 2003-08-28 Matsushita Electric Industrial Co., Ltd. Procede de production de vecteur de source sonore fixe et table de codage de source sonore fixe
US6917914B2 (en) * 2003-01-31 2005-07-12 Harris Corporation Voice over bandwidth constrained lines with mixed excitation linear prediction transcoding
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
WO2006025313A1 (ja) * 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
ATE406652T1 (de) * 2004-09-06 2008-09-15 Matsushita Electric Ind Co Ltd Skalierbare codierungseinrichtung und skalierbares codierungsverfahren
EP1798724B1 (en) * 2004-11-05 2014-06-18 Panasonic Corporation Encoder, decoder, encoding method, and decoding method
US7983904B2 (en) * 2004-11-05 2011-07-19 Panasonic Corporation Scalable decoding apparatus and scalable encoding apparatus
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001027900A (ja) * 1998-03-31 2001-01-30 Matsushita Electric Ind Co Ltd 音源ベクトル生成装置及び音源ベクトル生成方法
JP2001134298A (ja) * 1999-08-24 2001-05-18 Matsushita Electric Ind Co Ltd 音声符号化装置と音声復号化装置、及び音声符号化復号化システム
JP2004309686A (ja) * 2003-04-04 2004-11-04 Toshiba Corp 広帯域音声符号化方法及び広帯域音声符号化装置
JP2004126628A (ja) * 2004-01-09 2004-04-22 Nec Corp 音声符号化装置及び音声復号装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
CSNC201100868141; 安永和敏 他: '"パルス拡散音源を用いた低レート音声符号化"' 日本音響学会平成10年度秋季研究発表会講演論文集-I- , 19980924, p.281-282 *
CSNH199900033007; 安永和敏 他: '"低ビットレート音声符号化方式"' Matsushita Technical Journal Vol.44,No.6, 19981218, p.98-103 *
JPN6012009384; 安永和敏 他: '"低ビットレート音声符号化方式"' Matsushita Technical Journal Vol.44,No.6, 19981218, p.98-103 *
JPN6012009385; 安永和敏 他: '"パルス拡散音源を用いた低レート音声符号化"' 日本音響学会平成10年度秋季研究発表会講演論文集-I- , 19980924, p.281-282 *

Also Published As

Publication number Publication date
WO2007066771A1 (ja) 2007-06-14
US8352254B2 (en) 2013-01-08
US20090292534A1 (en) 2009-11-26
JPWO2007066771A1 (ja) 2009-05-21

Similar Documents

Publication Publication Date Title
JP5419714B2 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
US8452590B2 (en) Fixed codebook searching apparatus and fixed codebook searching method
JPWO2008047795A1 (ja) ベクトル量子化装置、ベクトル逆量子化装置、およびこれらの方法
JP5159318B2 (ja) 固定符号帳探索装置および固定符号帳探索方法
JP5687706B2 (ja) 量子化装置及び量子化方法
JP6644848B2 (ja) ベクトル量子化装置、音声符号化装置、ベクトル量子化方法、及び音声符号化方法
EP2099025A1 (en) Audio encoding device and audio encoding method
JPWO2008018464A1 (ja) 音声符号化装置および音声符号化方法
JP6001451B2 (ja) 符号化装置及び符号化方法
JPH05197399A (ja) ベクトル量子化方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090929

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121211

R150 Certificate of patent or registration of utility model

Ref document number: 5159318

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151221

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R360 Written notification for declining of transfer of rights

Free format text: JAPANESE INTERMEDIATE CODE: R360

R371 Transfer withdrawn

Free format text: JAPANESE INTERMEDIATE CODE: R371

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees