JP4191502B2 - 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム - Google Patents
信号符号化方法、およびこれらの装置、並びに信号符号化プログラム Download PDFInfo
- Publication number
- JP4191502B2 JP4191502B2 JP2003034887A JP2003034887A JP4191502B2 JP 4191502 B2 JP4191502 B2 JP 4191502B2 JP 2003034887 A JP2003034887 A JP 2003034887A JP 2003034887 A JP2003034887 A JP 2003034887A JP 4191502 B2 JP4191502 B2 JP 4191502B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- excitation source
- pulse
- vector
- initial phase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
本発明は、信号の周波数包絡特性を表現するフィルタを励振源信号で励振して得られる信号が、被符号化信号(目的信号)に良く一致するように、フィルタ係数および励振源信号を選定して符号化信号を生成する信号符号化方法、及び装置に関する。
さらに詳しくは、励振源信号を等間隔のパルス列として表現する励振源信号の構成方法とその量子化方法、符号化方法等に関する。
【0002】
【従来の技術】
従来、適応符号帳からフレームあるいはサブフレーム単位に取り出した過去の駆動音源ベクトル(励振源信号)をピッチ周期に対応する周期により繰り返して作成した時系列ベクトル、雑音符号帳から取り出した雑音符号ベクトル、あるいはこれらの両方より得られる時系列ベクトルにより、合成フィルタを駆動して音響信号を再生して入力音響信号ベクトルに対する歪が最小となるように適応符号帳、雑音符号帳の選択を行う信号符号化方法が提案されている。
【0003】
(従来例1)
励振源信号を等間隔のパルス列として表現する励振源信号の構成方法として、代数符号帳がある。これは例えば(非特許文献1)等に示されている。
代数符号帳は生成すべきパルス列の長さ(サンプル点数)Lに対して、L以下のあらかじめ決められたパルス数Nのパルスのみを設定するものであり、このとき各々のパルスはあらかじめ設定可能な位置の候補点および振幅の絶対値が決められており、この制限のなかでもっとも良く再生後の信号を表現するようにパルス位置および極性を選択することにより励振源信号を符号化(すなわち、符号帳ベクトルを選択)するものである。
【0004】
(従来例2)
また、別の方法として、連続する2サンプルのパターンベクトルを、あらかじめ記憶されたパターンの中から選択して用いる方法がある(特許文献1 参照)。
図6を参照して上記の方法の具体例を説明する。
雑音符号帳には5個のパターン符号帳1〜5が設けられ、これら各パターン符号帳にはそれぞれ2サンプルからなる4個のパターンベクトル(1)〜(4)が記憶されている。つまり各パターンベクトルは例えば連続する2サンプル点からなり、その2サンプル点以外のサンプル点はゼロである。各パターン符号帳は、共通のパターンベクトルを保持してもよい。これらパターン符号帳はそれぞれ符号帳検索部(図示せず)からのパターン符号により指定されてパターンベクトルが取り出される。これら取り出されたパターンベクトルはそれぞれ乗算部で符号帳検索制御部(図示せず)からのサイン符号に応じて+1又は−1が乗算され、極性が制御される。これら乗算部の出力はシフト部1〜5で符号帳検索制御部からの位置符号に応じてフレーム内の位置に配置される。この例において、サンプル点40点のうち、第1チャネルのパターン配置位置は(0,1),(10,11),(20,21),(30,31)のいずれかとなり、第2チャネルのパターン配置位置は(2,3),(12,13),(22,23),(32,33)のいずれかとなり、同様に第3〜5チャネルのパターン配置位置は図6(B)に示すようになる。シフト部1〜5の各出力は加算されて1フレームの雑音符号ベクトルとして出力される。すなわち1フレーム分のバッファに対し各極性制御されたパターンベクトルが位置符号に応じたサンプル点に配置され、その際重なる時は加算され、そのバッファから雑音符号ベクトルが出力される。
これは代数符号帳が単一のパルスで表現していたのに対して連続した二つのパルスで表現するものである。これら二つのパルスはその振幅の絶対値を異なって設定することも可能であり、代数符号帳に比べ信号の表現力が高い。
【0005】
【非特許文献1】
J.P.Adoul, “Fast CELP coding based on algebraic codes”,Proc. ICASSP '87,p.p.1957-1960(1987)
【特許文献1】
特開平9−6396号公報「音響信号符号化方法及び音響信号復号化方法」(図1、2)
【0006】
【発明が解決しようとする課題】
従来例1においては、上記選択の過程においてパルス位置と極性の組み合わせが多岐に渡るため、最適なパルス位置と極性の組み合わせを得るためには多くの演算処理を必要とする。また、全てのパルスの振幅の絶対値が等しいため、得られるパルス列が表現可能な信号の種類に限界がある。
従来例2においては、やはりパルス位置および極性を選択する過程においてパルス位置と極性の組み合わせが多岐に渡るため、最適なパルス位置と極性の組み合わせを得るためには多くの演算処理を必要とする。
本発明は、励振源信号の選択において、最適なパルス位置と極性の組み合わせを少ない演算量で決定可能とするものである。
【0007】
【課題を解決するための手段】
本発明は励振源信号、あるいは励振源信号に利得を与えて合成フィルタを駆動することにより励振源ベクトル、利得、合成フィルタ係数などの量子化符号を出力する信号符号化方法、装置において、励振源ベクトルの構成としてp,p+d,p+2d,・・・,p+(N-1)d番目(pは初期位相を表す、但しパルス間隔dとパルス数Nは予め設定されているものとする)にN個のビット位置が設定され、第1番目のパルスの初期位相pと各パルスの振幅をN次元のベクトルと考えてそのベクトルを量子化したインデックスを符号化出力とする。すなわち、本発明は励振源信号を等間隔のパルス列として表現し、パルス列の初期位相と各パルスの量子化された振幅とを用いて再現することで、少ない演算量で最適な励振源信号を選択可能とした。
【0008】
図1に雑音励振源信号符号帳の励振源信号としてパルス数を5とした場合の長さLのパルス列の一例を示す。同図において、パルス#0からパルス#4がそれぞれパルスであり、初期位相はパルス#0(第1番目のパルス)の位置に相当する。またパルス#N(N=0,・・・,4)とパルス#N−1の間隔は全て等しく、あらかじめ決められている。このようなパルス列を一意に表現するためには、初期位相と各パルスの振幅をそれぞれ表現すればよい。
さて、このようなパルス列でフィルタを励振して得られる信号ベクトル
【数1】
は([]tは転置を表す)、パルス数をN、パルス間隔をd、パルス#i(i=0,1,・・・,L−1)の振幅をgi、初期位相をp、フィルタのインパルス応答ベクトルを
【数2】
とすれば、誤差Dを最小とする最適なgiは各初期位相pごとに
【数3】
であり、フィルタのインパルスレスポンスにのみ依存する値である。
【0009】
このことから、まずcm,nで構成される行列Cの逆行列C-1を求め、このC-1を用いて歪Dを最小とする初期位相pとパルス振幅ベクトル
【数4】
最適な励振源信号(最適初期位相と最適振幅ベクトル)を決定することができる。 このときに必要となる演算は初期位相ごとに目的ベクトルxとシフトされたインパルス応答ベクトルとのN回の内積演算と、得られた内積を要素とする内積ベクトルと行列C-1の積演算だけで済む。
求められた入力信号と励振信号の歪を最小にする最適振幅ベクトルをその後振幅ベクトル符号帳を用いてベクトル量子化する。振幅ベクトルの量子化にあたって、最適振幅ベクトルと符号帳ベクトルの歪(自乗誤差)を最小にするものを選択してもよい。このように選択した場合でも音質の劣化を比較的小さく抑えることができる。また、変形実施例として式(4)の最適振幅ベクトルを求めず、直接的に符号帳からベクトルを取り出して励振信号を計算し、それと入力信号の歪を最小にしてもよい。この例においては演算量が多くなる。
【0010】
(実施例1)
実施例1は請求項1、3の発明と対応する。
目的ベクトルxと初期位相pおよび各パルスの振幅giを前述の方法で最適となるように検索し、各パルスの振幅giをパワーで正規化した後に量子化することにより励振源信号を一意に決定できるようにしたものである。
パルス振幅ベクトルgの算出方法の例を図2を参照して説明する。
同図において、シフトベクトル生成部はフィルタインパルス応答ベクトルhと初期位相pとパルス間隔dを用いて各i(i=0,1,・・・,N-1)に対するS(h,p+id)を求める。内積ベクトル生成部は各S(h,p+id)と目的ベクトルxから式(4)右辺第2項で表されるベクトルを生成する。逆ベクトル生成部はフィルタインパルス応答ベクトルhと初期位相pとパルス間隔dを用いて式(4)右辺第1項を生成する。乗算部は式(4)を計算し、パルス振幅ベクトルgを生成する。
【0011】
次に最適となる初期位相pおよびパルス振幅ベクトルgの検索方法を図3を参照して説明する。
同図において、パルス振幅ベクトル生成部は図2の破線で囲まれた部分に相当する。初期位相制御部は取り得る全ての初期位相についてパルス振幅ベクトルが生成されるように初期位相pを制御し、誤差最小化制御部は誤差を最小とする初期位相制御部を制御する。
ベクトル誤差生成部で算出される誤差が最小となるよう制御された後、最適初期位相pbestおよび最適パルス振幅ベクトルgbestがそれぞれ求まる。ここで、最適パルス振幅ベクトルgbest=[g0,g1,g2,・・・,gN-1]tを一旦パワー正規化してgbest/G=[g0/G,g1/G,g2/G,・・・,gN-1/G]t を求めた上で正規化された各gi/Gをベクトル要素量子化部で量子化することにより励振源信号を一意に決定できるようにする。
【0012】
(実施例2)
実施例2は、請求項2、4の発明に対応する。
実施例1において、励振源信号を複数加算して励振源信号を一意に決定できるようにしたものである。その際には、励振源信号ごとに、初期位相p、パルス振幅gを求めて、それらに対応する符号を出力する。また、k(kは自然数)番目の励振源ベクトルを決定した後の誤差信号をk+1番目の励振源決定のための入力信号とする。ここで、パルス本数N、パルス間隔dが励振源ごとに異なるようにすることで、励振源ベクトルのランダム性が確保される。
実施例2を図4を参照して説明する。
同図において単位励振源生成部は図3の破線で囲んだ部分に相当する。パルス列生成部は最適初期位相pbestと最適パルス振幅ベクトルgbestからパルス列を生成する。ここで生成されたパルス列と、目的ベクトルxとの誤差ベクトルが誤差ベクトル生成部で生成され、この誤差ベクトルを次段の単位励振源生成部の目的ベクトルとなるよう構成されている。この例では2段の構成となっているが、さらに段数を増やして構成しても構わない。
【0013】
(実施例3)
実施例3は、請求項2、4に対応する。
実施例1において、励振源信号にゲインを乗じた上で加算して励振源信号を一意に決定できるようにしたものである。実施の例を図5に示す。全体の構成は図4に示した実施例2に記載の発明の実施例と類似であるが、パルス生成部で生成されたパルス列に対してゲインを乗じ、これを新たなパルス列として扱う。
【0014】
(提案例1)
提案例1において、各励振源信号に乗ずべきゲインをあらかじめ記憶したゲインベクトル符号帳を用いてベクトル量子化することによりる励振源信号を一意に決定できるようにしたものである。
【0015】
(提案例2)
実施例又は2において、パルス振幅ベクトルg=[g0,g1,g2,・・・,gN-1]tをあらかじめ記憶したパルス振幅ベクトル符号帳を用いてベクトル量子化することにより励振源信号を一意に決定できるようにしたものである。
【0016】
(実施例4)
実施例4は、請求項5に対応する。
本発明の信号符号化装置は、CPUやメモリ等を有するコンピュータと、利用者端末と、CD−ROM、磁気ディスク装置、半導体メモリ等の機械読み取り可能な記録媒体とから構成することができる。記録媒体に記録された、あるいは伝送された請求項1、2に記載の信号符号化方法を実行させる信号符号化プログラムは、コンピュータに読み取られ、コンピュータの動作を制御し、コンピュータ上に前述した実施の形態における各構成要素を実現する。
【0017】
(提案例3)
実施例1から3の符号化方法に対応する復号化方法及び装置である。
実施例1〜3の信号符号化方法により生成された最適初期位相と最適パルス振幅ベクトル、およびゲインを入力し、予め決められたパルス間隔とパルス本数を用いて励振源信号を生成し、フィルタ係数により設定された信号の周波数包絡特性を表現するフィルタを励振して音声あるいは楽音を再生する。
【0018】
(提案例4)
本提案の信号復号化装置は、CPUやメモリ等を有するコンピュータと、利用者端末と、CD−ROM、磁気ディスク装置、半導体メモリ等の機械読み取り可能な記録媒体とから構成することができる。記録媒体に記録された、あるいは伝送された提案例3に記載の復号化方法を実行させる信号復号化プログラムは、コンピュータに読み取られ、コンピュータの動作を制御し、コンピュータ上に前述した実施の形態における各構成要素を実現する。
【0019】
【発明の効果】
既に示したとおりであり、本発明においては、初期位相ごとに目的ベクトルxとシフトされたインパルス応答ベクトルとのN回の内積演算と、得られた内積を要素とする内積ベクトルと行列C-1の積演算だけで済む。なお代数符号では目的ベクトルの長さL、パルス数Nとした場合、(L/N+1)N回のベクトル加算と(L/N)Nのベクトル減算が必要である。仮にL=20サンプル(8kHzサンプリング換算で2.5ms)、N=5パルスとした場合、代数符号帳では1024回のベクトル加算と256回のベクトル減算が必要である。これに対し本発明では20回の内積演算と4回の5次元正方行列と5次元ベクトルの積、および1回の5次元正方行列の逆行列演算が必要となるのみであり、LおよびNの値が大きい、すなわち大きな長さの目的ベクトルを多くのパルスで表現する際により演算量削減効果が大きくなる。
【図面の簡単な説明】
【図1】雑音励振源信号(パルス数を5とした場合の長さLのパルス列)の例を示す図。
【図2】パルス振幅ベクトル生成部の構成例を示す図。
【図3】最適初期位相/量子化最適パルス振幅ベクトル生成部の構成例を示す図。
【図4】単位励振源生成部を有する励振源生成部の構成例(1)を示す図。
【図5】単位励振源生成部を有する励振源生成部の他の構成例(2)を示す図。
【図6】従来の雑音符号ベクトルの生成を説明する図。
Claims (5)
- 励振源信号により信号の周波数包絡特性を表現するフィルタを励振して音響信号を合成し、入力信号(x)に対する合成された音響信号の歪が最小となるようにフィルタ係数(h)を量子化し、かつ雑音励振源符号帳から励振源信号の選択を行う信号符号化方法において、
上記雑音励振源符号帳中の励振源信号は、所定のパルス間隔(d)と所定の本数( N )のパルス列からなり、各々のパルスの振幅と第1番目のパルスの位置である初期位相(p)とで表現されており、
上記雑音励振源符号帳から励振源信号の選択を行う処理は、
各初期位相毎に各々のパルス振幅(g i i=0,1,・・・, N −1)を次式により求める処理と、
全初期位相のうち上記歪が最小となる初期位相とパルス振幅とを最適初期位相と最適パルス振幅として求める処理と、
上記最適パルス振幅を量子化する処理と、
含むことを特徴とする信号符号化方法。
[0,0・・・0,b 0 ,b 1 ・・・b l−1 ]、
Cm,n=(S(h,m)) t S(h,n)である。 - 励振源信号により信号の周波数包絡特性を表現するフィルタを励振して音響信号を合成し、入力信号に対する合成された音響信号の歪が最小となるようにフィルタ係数を量子化し、かつ雑音励振源符号帳から励振源信号の選択を行う信号符号化方法において、
請求項1に記載の励振源信号を複数加算することにより励振源信号を表現することを特徴とする信号符号化方法。 - 励振源信号により信号の周波数包絡特性を表現するフィルタを励振して音響信号を合成し、入力信号(x)に対する合成された音響信号の歪が最小となるようにフィルタ係数(h)を量子化し、かつ雑音励振源符号帳から励振源信号の選択を行う信号符号化装置において、
上記雑音励振源符号帳中の励振源信号は、所定のパルス間隔(d)と所定の本数( N )のパルス列からなり、各々のパルスの振幅と第1番目のパルスの位置である初期位相(p)とで表現されており、
上記雑音励振源符号帳から励振源信号の選択を行う手段は、
各初期位相毎に各々のパルス振幅(g i i=0,1,・・・, N −1)を次式により求める手段と、
全初期位相のうち上記歪が最小となる初期位相とパルス振幅とを最適初期位相と最適パルス振幅として求める手段と、
上記最適パルス振幅を量子化する手段と、
含むことを特徴とする信号符号化装置。
[0,0・・・0,b 0 ,b 1 ・・・b l−1 ]、
Cm,n=(S(h,m)) t S(h,n)である。 - 励振源信号により信号の周波数包絡特性を表現するフィルタを励振して音響信号を合成し、入力信号に対する合成された音響信号の歪が最小となるようにフィルタ係数を量子化し、かつ雑音励振源符号帳から励振源信号の選択を行う信号符号化装置において、
請求項3に記載の励振源信号を複数加算することにより励振源信号を表現することを特徴とする信号符号化装置。 - 請求項1乃至2のいずれか1項に記載の信号符号化方法をコンピュータに実行させる信号符号化プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003034887A JP4191502B2 (ja) | 2003-02-13 | 2003-02-13 | 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003034887A JP4191502B2 (ja) | 2003-02-13 | 2003-02-13 | 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004246014A JP2004246014A (ja) | 2004-09-02 |
JP4191502B2 true JP4191502B2 (ja) | 2008-12-03 |
Family
ID=33020456
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003034887A Expired - Lifetime JP4191502B2 (ja) | 2003-02-13 | 2003-02-13 | 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4191502B2 (ja) |
-
2003
- 2003-02-13 JP JP2003034887A patent/JP4191502B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2004246014A (ja) | 2004-09-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3134817B2 (ja) | 音声符号化復号装置 | |
JP3346765B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JP3112681B2 (ja) | 音声符号化方式 | |
US6408268B1 (en) | Voice encoder, voice decoder, voice encoder/decoder, voice encoding method, voice decoding method and voice encoding/decoding method | |
JP3180762B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP4008607B2 (ja) | 音声符号化/復号化方法 | |
JP3746067B2 (ja) | 音声復号化方法及び音声復号化装置 | |
JPH09160596A (ja) | 音声符号化装置 | |
JPH10282997A (ja) | 音声符号化装置及び復号装置 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JP4191502B2 (ja) | 信号符号化方法、およびこれらの装置、並びに信号符号化プログラム | |
JPH10242867A (ja) | 音響信号符号化方法 | |
JP2538450B2 (ja) | 音声の励振信号符号化・復号化方法 | |
JPH07101358B2 (ja) | マルチパルス符号化方法および装置 | |
JP3263347B2 (ja) | 音声符号化装置及び音声符号化におけるピッチ予測方法 | |
JP3583945B2 (ja) | 音声符号化方法 | |
JPS6238500A (ja) | 高能率音声符号化方式とその装置 | |
JP2943983B1 (ja) | 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳 | |
JP4510977B2 (ja) | 音声符号化方法および音声復号化方法とその装置 | |
JP2956068B2 (ja) | 音声符号化復号化方式 | |
JPH08234795A (ja) | 音声符号化装置 | |
JP3166697B2 (ja) | 音声符号化・復号装置及びシステム | |
JP3462958B2 (ja) | 音声符号化装置および記録媒体 | |
JP3954716B2 (ja) | 音源信号符号化装置、音源信号復号化装置及びそれらの方法、並びに記録媒体 | |
JPH02282800A (ja) | 音声符号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050124 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070220 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070227 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070426 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080918 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 4 |