JP2014164091A - 符号化装置、復号装置、これらの方法、プログラム、および記録媒体 - Google Patents
符号化装置、復号装置、これらの方法、プログラム、および記録媒体 Download PDFInfo
- Publication number
- JP2014164091A JP2014164091A JP2013034554A JP2013034554A JP2014164091A JP 2014164091 A JP2014164091 A JP 2014164091A JP 2013034554 A JP2013034554 A JP 2013034554A JP 2013034554 A JP2013034554 A JP 2013034554A JP 2014164091 A JP2014164091 A JP 2014164091A
- Authority
- JP
- Japan
- Prior art keywords
- pitch
- sharpening coefficient
- coefficient
- time interval
- period
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】処理対象の時間区間と処理対象よりも前の時間区間との間のピッチ周期の差、あるいは、有声音時間区間である可能性の推定値、あるいは、予測利得に基づいてピッチシャープニング係数を決定し、固定符号帳からの1個以上のパルス系列に対してピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める。
【選択図】図1
Description
非特許文献1では、γの値として、直前のサブフレームで量子化されたピッチ利得を利用していた(非特許文献1の式(48)参照)。
[第一実施形態]
<構成>
図1に例示するように、第一実施形態の符号化装置11は、線形予測分析部111、適応符号帳112、固定符号帳113、周期化処理部114、周期化済み固定符号帳記憶部115、探索制御部116、合成フィルタ117、ピッチシャープニング係数決定部118、およびパラメータ符号化部119を有する。探索制御部116は、ピッチ分析部1161、探索部1162、聴覚重み付けフィルタ1163、および利得量子化部1164を含む。
符号化装置11には、デジタル化され、所定時間区間であるフレームの単位で区分された時系列信号である入力音響信号x(n)(n=0,...,L−1、Lは2以上の整数、各nを「サンプル点」と呼ぶ)が入力される。入力音響信号の例は、音声信号、音楽信号、雑音信号などである。符号化装置11は、入力音響信号x(n)(n=0,...,L−1)を以下のようにフレームごとに符号化する。
線形予測分析部111は、処理対象のフレーム(「現フレーム」と呼ぶ)に属する各サンプル点n=0,...,L−1での入力音響信号x(n)(n=0,...,L−1)の線形予測分析を行い、当該現フレームでの全極型の合成フィルタ117を特定するための係数の量子化値に対応する符号である線形予測情報LPC info(「予測パラメータ」に含まれる)を出力する。すなわち、線形予測分析部111は、フレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応する線形予測係数またはこれと互換な係数を特定する符号である線形予測情報LPC infoを得て出力する。例えば、線形予測分析部111は、現フレームの入力音響信号x(n)(n=0,...,L−1)に対応する線形予測係数a(m)(m=1,...,P、Pは正の整数である線形予測次数)を算出し、線形予測係数a(m)(m=1,...,P)を線スペクトル対係数LSPに変換し、量子化した線スペクトル対係数LSPに対応する符号を線形予測情報LPC infoとして出力する。
固定符号帳113には、零でない単位パルスとその極性との組み合わせからなる値を持つ1個以上の信号と零値を持つ1個以上の信号とから構成される複数個のパルス系列(「サンプル列」に相当)を特定するための情報が格納される。ここでは1フレームが4個のサブフレームに等区分される例を示す。すなわち、L個のサンプル点0,...,L−1からなるフレームは、サンプル点Lf(0),...,Lf(1)−1からなる1番目のサブフレーム(第1サブフレーム)、サンプル点Lf(1),...,Lf(2)−1からなる2番目のサブフレーム(第2サブフレーム)、サンプル点Lf(2),...,Lf(3)−1からなる3番目のサブフレーム(第3サブフレーム)、およびサンプル点Lf(3),...,Lf(4)−1からなる4番目のサブフレーム(第4サブフレーム)に区分される。Lf(0),Lf(1),Lf(2),Lf(3),Lf(4)は、Lf(0)=0,Lf(4)=L,Lf(0)<Lf(1)<Lf(2)<Lf(3)<Lf(4)を満たす正整数である。第1−4サブフレームに対応するパルス系列cf1,cf2,cf3,cf4はそれぞれ以下のように表現される。
cf1=(cf1(Lf(0)),...,cf1(Lf(1)-1))
cf2=(cf2(Lf(1)),...,cf2(Lf(2)-1))
cf3=(cf3(Lf(2)),...,cf3(Lf(3)-1))
cf4=(cf4(Lf(3)),...,cf4(Lf(4)-1))
適応符号帳112には、過去の各時点で生成された励振信号が記憶されている。適応符号帳112は、第1−4サブフレームの各サブフレームで得られるピッチ周期T1,T2,T3,T4に応じて励振信号を遅延させて得られる適応信号成分v(n)(n=0,...,L−1)を出力する。小数精度のピッチ周期を用いて適応信号成分v(n)を表現する場合には、ピッチ周期に応じて遅延させた複数の励振信号に重み付き平均操作を行う補間フィルタが用いられる。
ピッチ分析部1161は、サブフレームごとに、入力音響信号x(n)(n=0,...,L−1)に対応するピッチ周期T1,T2,T3,T4を得て、当該ピッチ周期T1,T2,T3,T4と、当該ピッチ周期T1,T2,T3,T4を特定するピッチ符号(周期性成分符号)CT1,CT2,CT3,CT4と、を出力する。各サブフレームのピッチ符号CT1,CT2,CT3,CT4はそれぞれ均一長である。CT1,CT2,CT3,CT4それぞれのビット数は、互いに同一であってもよいし、互いに異なっていてもよい。なお、ピッチ周期はピッチ符号を復号することにより得られるのでピッチ分析部1161が出力することは必須ではない。ピッチ周期は、サンプル点の間隔の整数倍のみで表現される場合(整数精度)のみならず、サンプル点の間隔の整数倍と小数値(分数値)とを用いて表現される場合(小数精度)もある。また、ピッチ分析部1161は、探索部1162で用いるために、サブフレームごとに、ピッチ利得gp1,gp2,gp3,gp4を求めて出力してもよい。
ピッチシャープニング係数決定部118は、ピッチ周期が安定している度合いの高いサブフレームのピッチシャープニング係数が、ピッチ周期が安定している度合いの低いサブフレームのピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。ピッチ周期が安定している度合いが高い場合は周期性が高いことが想定されるので、ピッチシャープニング係数を大きくし周期化の程度を大きくすることで、品質の向上が期待できる。例えば、処理対象のサブフレーム(現在のサブフレーム)のピッチ周期と処理対象よりも前のサブフレーム(過去のサブフレーム)のピッチ周期との差が小さいほど、ピッチ周期が安定している度合いが高いと言える。
周期化処理部114は、ピッチシャープニング係数決定部118で決定されたピッチシャープニング係数を用いて、固定符号帳113からのパルス系列cf1,cf2,cf3,cf4を適応プリフィルタP(z)に通すことによりピッチの高調波成分が強調されるように補正し、補正後のパルス系列を周期化済みパルス系列として出力する。つまり、固定符号帳113からのパルス系列cfjは以下に従って補正される。
周期化済み固定符号帳記憶部115には、周期化処理部114から出力された周期化済みパルス系列(サンプル列)の候補と、当該周期化済みパルス系列の候補に対応する周期化前の固定符号帳中のパルス系列の候補を特定するための情報(コードインデックス)が格納される。
探索部1162は、サブフレームごとに、周期化済み固定符号帳記憶部115を探索し、入力音響信号x(n)(n=0,...,L−1)に対応する周期化済みパルス系列~cf1,~cf2,~cf3,~cf4(周期化済み固定符号帳記憶部115からのサンプル列)と、当該周期化済みパルス系列~cf1,~cf2,~cf3,~cf4に対応するコードインデックスCf1,Cf2,Cf3,Cf4(周期化済みパルス系列~cf1,~cf2,~cf3,~cf4に対応する周期化前の固定符号帳中のパルス系列を特定するためのコードインデックス)と、を得て出力する。
利得量子化部1164には、ピッチ符号CT1,CT2,CT3,CT4、およびコードインデックスCf1,Cf2,Cf3,Cf4が入力される。利得量子化部1164は、これらを用いてベクトル量子化を行い、サブフレームごとに、量子化されたピッチ利得と量子化された固定符号帳利得との組に対応する符号を得て出力する。以下では、量子化されたピッチ利得を「量子化済ピッチ利得」と表現し、量子化された固定符号帳利得を「量子化済固定符号帳利得」と表現する。また量子化済ピッチ利得gp1^と量子化済固定符号帳利得gc1^の組に対応する符号、量子化済ピッチ利得gp2^と量子化済固定符号帳利得gc2^の組に対応する符号、量子化済ピッチ利得gp3^と量子化済固定符号帳利得gc3^の組に対応する符号、量子化済ピッチ利得gp4^と量子化済固定符号帳利得gc4^の組に対応する符号を「利得符号GAf1,GAf2,GAf3,GAf4」と表現する。すなわち、利得量子化部1164は、第1から第4のサブフレームのそれぞれ(第jサブフレーム)について、ピッチ利得gpjと固定符号帳利得gcjの組をベクトル量子化し、量子化済ピッチ利得gpj^と量子化済固定符号帳利得gcj^の組を特定する利得符号GAfjを得て出力する。
gcj^=γgc^×pgcj^
本発明の利得量子化部1164が行うベクトル量子化では、利得符号帳のインデックスとして可変長符号が割り当てられる。インデックスの選択は、例えば、従来技術と同じく符号化歪み(以下「歪み」という)を最小とする基準に基づいてなされる。つまり、利得量子化部1164は、入力されたピッチ周期Tjまたはピッチ符号CTjと、周期化済みパルス系列~cfjまたはコードインデックスCfjと、に対して、利得符号帳に格納された複数個の符号帳インデックスのうちの何れか1つを選択し、それを利得符号とする。
υ(n)=a(1)×χ(n-1)+a(2)×χ(n-2)+...+a(P)×χ(n-P)
サブフレームがN個のサンプル点S,...,S+N−1(Sは0以上の整数)からなり、サブフレームに属する入力音響信号XをベクトルX=(x(S),...,x(S+N−1))と表現し、サンプル列ZをベクトルZ=(z(S),...,z(S+N−1))と表現し、サンプル列YをベクトルY=(y(S),...,y(S+N−1))と表現し、サンプル列αY+βZと入力音響信号Xとの二乗誤差を指標値D(歪み)と定義すると、指標値Dは以下のように表される。ただし、σTはσの転置を表す。
適応符号帳112は、利得量子化部1164で各サブフレームでの利得符号GAf1,GAf2,GAf3,GAf4が得られると、コードインデックスCf1,Cf2,Cf3,Cf4に対応する周期化済みパルス系列~cf1,~cf2,~cf3,~cf4(周期化済み固定符号帳記憶部115からのサンプル列)の各サンプルに量子化済固定符号帳利得gc1^,gc2^,gc3^,gc4^を乗算して得られるサンプル列と、サブフレームごとにピッチ周期T1,T2,T3,T4に対応するサンプル数だけ過去の励振信号である適応信号成分v(n)(n=0,...,L−1)の各サンプルに量子化済ピッチ利得gp1^,gp2^,gp3^,gp4^を乗算して得られるサンプル列と、を対応するサンプル毎に加算した以下のような励振信号u'(n)(n=0,...,L−1)を得て、適応符号帳112内に記憶する。
u'(n)=gp1^×v(n)+gc1^×~cf1(n)(n=Lf(0),...,Lf(1)-1)
u'(n)=gp2^×v(n)+gc2^×~cf2(n)(n=Lf(1),...,Lf(2)-1)
u'(n)=gp3^×v(n)+gc3^×~cf3(n)(n=Lf(2),...,Lf(3)-1)
u'(n)=gp4^×v(n)+gc4^×~cf4(n)(n=Lf(3),...,Lf(4)-1)
また、線形予測情報LPC info、ピッチ周期符号CT1,CT2,CT3,CT4、コードインデックスCf1,Cf2,Cf3,Cf4、および利得符号GAf1,GAf2,GAf3,GAf4を含む「励振パラメータ」がパラメータ符号化部119に入力される。パラメータ符号化部119は、励振パラメータに対応する符号であるビットストリームBS(符号)を生成して出力する。
符号化装置11(図1)のパラメータ符号化部119から出力されたビットストリームBSは、入力符号として復号装置12(図2)のパラメータ復号部129に入力される。
パラメータ復号部129は、図2に示すように、例えば、パラメータ復号部129a、ピッチ符号復号部129b、および利得符号復号部129cを含む。
パラメータ復号部129aは、ビットストリームBSを入力とし、ビットストリームBSに含まれる線形予測情報LPC info、ピッチ符号CT1,CT2,CT3,CT4、コードインデックスCf1,Cf2,Cf3,Cf4、および利得符号GAf1,GAf2,GAf3,GAf4を得る。得られたLPC infoは合成フィルタ127に入力される。また、ピッチ符号CT1,CT2,CT3,CT4はピッチ符号復号部129bに入力される。コードインデックスCf1,Cf2,Cf3,Cf4は選択部125に入力される。利得符号GAf1,GAf2,GAf3,GAf4は、利得符号復号部129cに入力される。
ピッチ符号復号部129bは、得られたピッチ符号(周期性成分符号)CT1,CT2,CT3,CT4を復号し、復号ピッチ周期T1’,T2’,T3’,T4’を出力する。復号ピッチ周期T1’,T2’,T3’,T4’は、適応符号帳122およびピッチシャープニング係数決定部128に入力される。
利得符号復号部129cは、入力された利得符号GAf1,GAf2,GAf3,GAf4を復号し、復号ピッチ利得gp1^,gp2^,gp3^,gp4^および復号固定符号帳利得gc1^,gc2^,gc3^,gc4^を得て出力する。具体的には、利得符号復号部129cは、例えば、符号化装置11の利得量子化部1164が備えるのと同一の利得符号帳を備える。利得符号復号部129cは、利得符号帳を参照し、入力された利得符号(現在のサブフレームに対応する利得符号)に対応する量子化済ピッチ利得と量子化済固定符号帳利得を復号ピッチ利得gpj^および復号固定符号帳利得gcj^として出力する。
選択部125には、コードインデックスCf1,Cf2,Cf3,Cf4が入力される。選択部125は、入力されたコードインデックスCf1,Cf2,Cf3,Cf4を用い、固定符号帳123に基づき、サブフレームごとに、コードインデックスCf1,Cf2,Cf3,Cf4を復号してパルス系列cf1,cf2,cf3,cf4を得て出力する。固定符号帳123は、符号化装置11が備える固定符号帳113と同一である。
ピッチシャープニング係数決定部128は、符号化装置11のピッチシャープニング係数決定部118と同様の処理により、ピッチシャープニング係数の値を決定する。つまり、ピッチシャープニング係数決定部128は、符号化装置11で用いたものと同じ対応表、もしくは関数を用いてピッチシャープニング係数の値を決定する。ただし、ピッチ周期としては、復号装置12で得た復号ピッチ周期を用いる。その他は、ピッチシャープニング係数決定部118と同じである。
周期化処理部124は、符号化装置11の周期化処理部114と同様の処理により、固定符号帳123からのパルス系列cf1,cf2,cf3,cf4を周期化した周期化済みパルス系列~c’f1,~c’f2,~c’f3,~c’f4を出力する。ただし、ピッチシャープニング係数としては、ピッチシャープニング係数決定部128で決定されたピッチシャープニング係数を用いる。なお、周期化の基準としては、符号化装置11で用いたものと同じ基準を用いるものとする。つまり、符号化装置11において現サブフレームのパルス周期Tjの2倍の周期(2Tj)で周期化処理をした場合(2Fj=2Tjで周期化処理をした場合)は、復号化装置12においても、ピッチ符号復号部129bで得られた復号ピッチ周期Tj’の2倍の周期(2Tj’)で周期化処理を行うものとする。
適応符号帳122は、入力された復号ピッチ周期T1’,T2’,T3’,T4’で特定される適応信号成分v’(n)(n=0,...,L−1)を出力する。
u'(n)=gp1^×v'(n)+gc1^×~c’f1(n)(n=Lf(0),...,Lf(1)-1)
u'(n)=gp2^×v'(n)+gc2^×~c’f2(n)(n=Lf(1),...,Lf(2)-1)
u'(n)=gp3^×v'(n)+gc3^×~c’f3(n)(n=Lf(2),...,Lf(3)-1)
u'(n)=gp4^×v'(n)+gc4^×~c’f4(n)(n=Lf(3),...,Lf(4)-1)
励振信号u’(n)(n=0,...,L−1)に、線形予測情報LPC infoによって特定される全極型の合成フィルタ127が適用され、それによって生成された合成信号x’(n)(n=0,...,L−1)が出力される。
<構成>
図1に例示するように、第二実施形態の符号化装置21は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部218を備え、ピッチシャープニング係数決定部218において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
ピッチシャープニング係数決定部218の処理以外は、第一実施形態の符号化装置11と同じである。
ピッチシャープニング係数決定部218は、現在のサブフレームの音声波形の振幅が大きい時のピッチシャープニング係数が、振幅が小さい時のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数の値を決定する。音声波形の振幅が大きい時は、入力音響信号の周期性が高く、周期化処理による品質向上効果が高くなることが期待される。音声波形の振幅が大きいか否かは、例えば、現在のサブフレームのピッチ周期と過去のサブフレームのピッチ周期との差の符号、すなわち、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも大きいか否かを用いて判断することができる。差の極性(正負の符号)が負(Ti−Ti−τ<0)の場合は、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも小さい、すなわち、ピッチ周期が次第に短くなることを示す。差の正負符号が正の場合(Ti−Ti−τ>0)は、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期よりも大きい、すなわち、ピッチ周期が次第に長くなることを示す。ピッチ周期が次第に短くなるときは音声が高くなる時であり、音声波形の振幅もやや大きくなる傾向にある。反対に次第に長くなるときは音声が低くなる時であるので、音声波形の振幅も小さくなる場合が多い。この現象を反映して、ピッチシャープニング係数決定部は218、現在のサブフレームのピッチ周期が過去のサブフレームのピッチ周期より短い場合のピッチシャープニング係数が、長い場合のピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数の値を決定する。これにより、歪が小さくなり、品質の向上が期待できる。このようなピッチシャープニング係数の決定は、上記の関係を維持するように、予め取りうるピッチ周期の差に対応する値(もしくはその範囲)と、或るサブフレーム(例えば現在のサブフレーム)のピッチ周期の長さとそれよりも過去のサブフレームのピッチ周期の長さとの差に対応するピッチシャープニング係数との値を対応付けた対応表を用いて決定することができる。対応表の例を以下に示す。
第二実施形態の復号装置22におけるピッチシャープニング係数決定部228は、第二実施形態の符号化装置21のピッチシャープニング係数決定部218と同じ基準(関数値、もしくは、対応表)を用いて、ピッチシャープニング係数を決定する。ただし、ピッチ周期としては、復号装置22で得た復号ピッチ周期を用いる。その他は、第一実施形態と同じである。
<構成>
図1に例示するように、第三実施形態の符号化装置31は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部318を備え、ピッチシャープニング係数決定部318において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
第三実施形態の符号化装置31の処理は、ピッチシャープニング係数決定部318の処理以外、第一実施形態と同じである。
ピッチシャープニング係数決定部318は、有声音サブフレームである可能性の高いサブフレームのピッチシャープニング係数が、そうでないサブフレームのピッチシャープニング係数よりも小さくならないように、ピッチシャープニング係数を決定する。人の声は周期性が高いので、有声サブフレームの方がそうでないサブフレームと比較して周期性成分が多く含まれる可能性が高い。そのため、人の声を符号化する場合には、周期化処理による品質向上効果が高いことが期待できる。有声サブフレームである可能性の高さは、例えば、線形予測分析部111で得た現在のフレームに対する線形予測係数から算出される予測利得により判断できる。入力音響信号が有声音の場合、波形の予測利得が大きくなる傾向が強い。予測利得gは、kiを予測次数iでのPARCOR係数とし、pを最高予測次数として
第三実施形態の復号装置32におけるピッチシャープニング係数決定部328は、第三実施形態の符号化装置31のピッチシャープニング係数決定部318と同じ基準(関数値、もしくは、対応表)を用いて、ピッチシャープニング係数を決定する。ただし、ピッチ周期としては、復号装置32で得た復号ピッチ周期を用いる。その他は、第一実施形態と同じである。
<構成>
図1に例示するように、第四実施形態の符号化装置41は、ピッチシャープニング係数決定部118に代えてピッチシャープニング係数決定部418を備え、ピッチシャープニング係数決定部418において、第一実施形態とは異なる基準でピッチシャープニング係数を決定する処理を行うこと以外、第一実施形態の符号化装置11と同じである。
第四実施形態の符号化装置41のピッチシャープニング係数決定部418の処理は、第一実施形態から第三実施形態のピッチシャープニング係数決定部118〜318で用いた処理を組み合わせたものである。その他の処理は、第一実施形態と同じである。
ピッチシャープニング係数決定部418は、第1実施形態から第3実施形態を組み合わせた方法で、ピッチシャープニング係数を決定する。例えば、ピッチシャープニング係数決定部418は、現在のサブフレームのピッチ周期の安定している度合いが高いときのピッチシャープニング係数が、ピッチ周期の安定している度合いが低いときのピッチシャープニング係数より小さくならないように、かつ、有声音サブフレームである可能性が高いときのピッチシャープニング係数がそうでないサブフレームのピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数の値を決定する。例えば、ピッチシャープニング係数決定部418は、現在のサブフレームと過去のサブフレームとのピッチ周期の差の絶対値が小さく、かつ、線形予測分析部で得た予測利得の値に対して単調非減少の関係となる値をピッチシャープニング係数として決定する。対応表の例を表3に示す。予測利得は1以上で現実的には1000程度までの値を取りうる。(g/(g+1))は0.5から約1の値をとる。
復号装置 12〜42
Claims (24)
- 所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
各時間区間について、前記周期化処理部で求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索部と、
を有することを特徴とする符号化装置。 - 前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項1記載の符号化装置。 - 前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項1記載の符号化装置。 - 所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化装置であって、
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列求める周期化処理部と、
各時間区間について、前記周期化処理部で求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索部と、
を有することを特徴とする符号化装置。 - 処理対象の時間区間の入力音響信号を線形予測分析し、処理対象の時間区間の入力音響信号に対応する線形予測係数を算出する線形予測分析部をさらに有し、
前記ピッチシャープニング係数決定部は、前記線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項4記載の符号化装置。 - 所定時間区間ごとに、ピッチ符号を復号して復号ピッチ周期を得るピッチ符号復号部と、
処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
を有することを特徴とする復号装置。 - 前記ピッチシャープニング係数決定部は、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項6記載の復号装置。 - 前記ピッチシャープニング係数決定部は、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項6記載の復号装置。 - 処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定部と、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
を有することを特徴とする復号装置。 - 前記ピッチシャープニング係数決定部は、処理対象の時間区間の線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項9記載の復号装置。 - 所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理部と、
各時間区間について、前記周期化処理ステップで求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索ステップと、
を有することを特徴とする符号化方法。 - 前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期と処理対象よりも前の時間区間のピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項11記載の符号化方法。 - 前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項11記載の符号化方法。 - 所定時間区間ごとに、入力音響信号に対応する、固定符号帳からのサンプル列を特定するコードインデックス、ピッチ周期を特定するピッチ符号、および量子化済固定符号帳利得と量子化済ピッチ利得とに対応する利得符号、を得る符号化方法であって、
処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
各時間区間について、前記周期化処理ステップで求めた複数の周期化済みパルス系列のうち入力音響信号に対応する周期化済みパルス系列に対応するコードインデックスを前記コードインデックスとして出力する探索ステップと、
を有することを特徴とする符号化方法。 - 処理対象の時間区間の入力音響信号を線形予測分析し、処理対象の時間区間の入力音響信号に対応する線形予測係数を算出する線形予測分析ステップをさらに有し、
前記ピッチシャープニング係数決定ステップは、前記線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項14記載の符号化方法。 - 所定時間区間ごとに、ピッチ符号を復号して復号ピッチ周期を得るピッチ符号復号ステップと、
処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差に基づいてピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列を求める周期化処理ステップと、
を有することを特徴とする復号方法。 - 前記ピッチシャープニング係数決定ステップは、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が小さい場合のピッチシャープニング係数が、処理対象の時間区間の復号ピッチ周期と処理対象よりも前の時間区間の復号ピッチ周期との差の絶対値が大きい場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項16記載の復号方法。 - 前記ピッチシャープニング係数決定ステップは、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも短い場合のピッチシャープニング係数が、処理対象の時間区間のピッチ周期が処理対象よりも前の時間区間のピッチ周期よりも長い場合のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項16記載の復号方法。 - 処理対象の時間区間が有声音時間区間である可能性が高い時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないようにピッチシャープニング係数を決定するピッチシャープニング係数決定ステップと、
固定符号帳からの1個以上のパルス系列について、前記ピッチシャープニング係数に対応する周期化を行って周期化済みパルス系列求める周期化処理ステップと、
を有することを特徴とする復号方法。 - 前記ピッチシャープニング係数決定ステップは、処理対象の時間区間の線形予測係数から算出される予測利得に対応する値が大きい時間区間のピッチシャープニング係数が、そうでない時間区間のピッチシャープニング係数よりも小さくならないように、前記ピッチシャープニング係数を決定する
ことを特徴とする請求項19記載の復号方法。 - 請求項11から15の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項16から20の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項11から15の何れかに記載の符号化方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
- 請求項16から20の何れかに記載の復号方法の各ステップをコンピュータに実行させるためのプログラムを格納したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013034554A JP6053145B2 (ja) | 2013-02-25 | 2013-02-25 | 符号化装置、復号装置、これらの方法、プログラム、および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013034554A JP6053145B2 (ja) | 2013-02-25 | 2013-02-25 | 符号化装置、復号装置、これらの方法、プログラム、および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014164091A true JP2014164091A (ja) | 2014-09-08 |
JP6053145B2 JP6053145B2 (ja) | 2016-12-27 |
Family
ID=51614746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013034554A Active JP6053145B2 (ja) | 2013-02-25 | 2013-02-25 | 符号化装置、復号装置、これらの方法、プログラム、および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6053145B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0519796A (ja) * | 1991-07-08 | 1993-01-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声の励振信号符号化・復号化方法 |
-
2013
- 2013-02-25 JP JP2013034554A patent/JP6053145B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0519796A (ja) * | 1991-07-08 | 1993-01-29 | Nippon Telegr & Teleph Corp <Ntt> | 音声の励振信号符号化・復号化方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6053145B2 (ja) | 2016-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5511372B2 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
KR101370017B1 (ko) | Celp 기술에서의 디지털 오디오 신호의 개선된 코딩/디코딩 | |
JP5627144B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラムおよび記録媒体 | |
JP5613781B2 (ja) | 符号化方法、復号方法、符号化装置、復号装置、プログラム及び記録媒体 | |
JP5230444B2 (ja) | 適応音源ベクトル量子化装置および適応音源ベクトル量子化方法 | |
JP2018028700A (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
US20100185442A1 (en) | Adaptive sound source vector quantizing device and adaptive sound source vector quantizing method | |
JP6416363B2 (ja) | 線形予測分析装置、方法、プログラム及び記録媒体 | |
US8200483B2 (en) | Adaptive sound source vector quantization device, adaptive sound source vector inverse quantization device, and method thereof | |
KR101629661B1 (ko) | 복호 방법, 복호 장치, 프로그램 및 그 기록매체 | |
KR101996307B1 (ko) | 부호화 장치, 복호 장치, 이들의 방법, 프로그램 및 기록 매체 | |
JP6053145B2 (ja) | 符号化装置、復号装置、これらの方法、プログラム、および記録媒体 | |
JP5789816B2 (ja) | 符号化装置、この方法、プログラム及び記録媒体 | |
JP5714172B2 (ja) | 符号化装置、この方法、プログラムおよび記録媒体 | |
JP5762636B2 (ja) | 符号化装置、復号装置、これらの方法、プログラム、および記録媒体 | |
JP2011133637A (ja) | 符号化方法、復号方法、符号化装置、復号装置及びプログラム | |
JP2013101212A (ja) | ピッチ分析装置、音声符号化装置、ピッチ分析方法および音声符号化方法 | |
WO2004010416A1 (ja) | 音声符号化復号方式間の符号変換方法及び装置とその記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150602 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160614 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161128 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6053145 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |