JP6629256B2 - 符号化装置、方法及びプログラム - Google Patents

符号化装置、方法及びプログラム Download PDF

Info

Publication number
JP6629256B2
JP6629256B2 JP2017046970A JP2017046970A JP6629256B2 JP 6629256 B2 JP6629256 B2 JP 6629256B2 JP 2017046970 A JP2017046970 A JP 2017046970A JP 2017046970 A JP2017046970 A JP 2017046970A JP 6629256 B2 JP6629256 B2 JP 6629256B2
Authority
JP
Japan
Prior art keywords
code length
unit
signal
processing
quantization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017046970A
Other languages
English (en)
Other versions
JP2018151498A (ja
Inventor
亮介 杉浦
亮介 杉浦
守谷 健弘
健弘 守谷
川西 隆仁
隆仁 川西
登 原田
登 原田
優 鎌本
優 鎌本
康一 古角
康一 古角
淳一 中嶋
淳一 中嶋
丈二 中山
丈二 中山
賢一 野口
賢一 野口
馨亮 長谷川
馨亮 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017046970A priority Critical patent/JP6629256B2/ja
Publication of JP2018151498A publication Critical patent/JP2018151498A/ja
Application granted granted Critical
Publication of JP6629256B2 publication Critical patent/JP6629256B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

この発明は、音信号の符号化技術などの信号処理技術、特に音信号の量子化に必要な量子化幅等のパラメータを決定する技術に関する。
一般的に、可逆符号化においては、図1に示すように、符号化装置の量子化部11が入力信号を等間隔にスカラー量子化することにより量子化信号を得て、可逆符号化部12が量子化信号に基づいてエントロピー符号化等の可逆符号化により符号を与え圧縮することにより信号符号を得て、多重化部13が入力信号に対応する信号符号と量子化幅に対応する符号とを合わせて出力符号として出力する。出力符号は、図2の復号装置に入力符号として入力される。
復号時には、図2に示すように、復号装置の多重分離部21が入力符号から信号符号と量子化幅に対応する符号とを取り出し、可逆復号部22が信号符号を可逆復号したすることにより復号された量子化信号である量子化信号を得て、逆量子化部23が復号量子化信号を逆量子化して元の信号を得る。
特に音声音響信号符号化は優先度の高い通信において用いられることもあり、音信号の各フレームで圧縮後の符号長が目標符号長に確実に収まるように制御することが重要である。そのような条件において、上述の可逆符号化として圧縮効率の高い可変長符号化を用いた場合、前段の量子化の仕方により圧縮後の符号長が必要以上に長くなったり短くなったりする可能性があることから、量子化幅の調節により符号長を制御する必要がある。また、量子化歪も最小限に抑えるため、この量子化幅は目標符号長を超えない中で最も小さいものを選ぶことが好ましい。
こうした最適な量子化幅は可逆符号化を反復的に行うことで探索することが多い。例えば初期値として設定した量子化幅で信号を量子化して可逆符号化で圧縮し、その符号長を算出して、目標の符号長に満たなければ量子化幅を小さく、目標の符号長を超えていれば量子化幅を大きくし、再び元の信号を量子化して可逆符号化を行う。
この際、量子化幅の調節は二分探索的に行ってもよいが、目標符号長からの不足符号長又は超過符号長から量子化幅の調節量を推定することによってより精度よく最適な量子化幅を決定することができる。
Gerald D. T. Schuller, Bin Yu, Dawei Huang, and Bernd Edler, "Perceptual Audio Coding Using Adaptive Pre-and Post-Filters and Lossless Compression", IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, VOL. 10, NO. 6, SEPTEMBER 2002.
しかし、例えば極端にエネルギーが偏った信号などに対してこのような量子化幅の調節を行おうとすると、量子化幅の調節量の推定に誤りが生じ、想定していた符号長の増加又は減少が起きないことがある。このように量子化幅の調節の精度が低下すると、量子化と可逆符号化の処理の必要な反復数が増加してしまい、符号化に必要な演算量の増加に繋がる可能性がある。
この発明は、従来と同程度の圧縮率及び量子化歪での符号化をより少ない演算量で実現する符号化装置、方法及びプログラムを提供することを目的とする。
この発明の一態様による符号化装置は、入力された音信号を所定の量子化幅で量子化することにより量子化信号を得る量子化部と、量子化信号を可逆符号化することにより信号符号を得て、その信号符号の符号長から所定の目標符号長を減算した値である符号長超過量を得る可逆符号化部と、を含み、量子化部及び可逆符号化部の処理は繰り返し行われ、その繰り返し処理では、量子化幅の調節において符号長が変動し得るサンプル数を有効サンプル数として、符号長超過量に応じて有効サンプル数が更新され、その更新された有効サンプル数に応じて所定の量子化幅が更新される。
この発明の一態様による符号化装置は、入力された音信号のビットを下位桁から所定のビット削減量だけ無視することにより量子化信号を得る量子化部と、量子化信号を可逆符号化することにより信号符号を得て、その信号符号の符号長から所定の目標符号長を減算した値である符号長超過量を得る可逆符号化部と、を含み、量子化部及び可逆符号化部の処理は繰り返し行われ、その繰り返し処理では、ビット削減量の調節において符号長が変動し得るサンプル数を有効サンプル数として、符号長超過量と上記有効サンプル数に応じて所定のビット削減量が更新される。
従来と同程度の圧縮率及び量子化歪での符号化をより少ない演算量で実現することができる。
従来の符号化装置の例を示すブロック図。 従来の復号装置の例を示すブロック図。 第一実施形態の符号化装置の例を示すブロック図。 第一実施形態の符号化方法の例を示すブロック図。 第一実施形態の復号装置の例を示すブロック図。 第一実施形態の符号化方法の例を示すブロック図。 第二実施形態の符号化装置の例を示すブロック図。 第二実施形態の符号化方法の例を示すブロック図。 第二実施形態の復号装置の例を示すブロック図。 第二実施形態の符号化方法の例を示すブロック図。
<技術的背景>
量子化された信号を可逆圧縮した結果の符号長から必要な量子化幅を推定する一般的な方法は次の通りである。
N点の信号のサンプルで構成される1フレームの目標符号長をLとし、量子化幅sで信号を等間隔に量子化し可逆符号化で圧縮した結果の符号長をBとすると、サンプル毎に目標符号長から超過している平均ビット数は(B-L)/Nビットとなる。基本的にサンプル値を半分にするとそのサンプル値を記述するのに必要な符号長はおおよそ1ビット減るので、量子化幅sに目標符号長Lからの超過分のビット数から算出した調整量2^((B-L)/N)をかけたものを次の反復で用いる量子化幅とすることで、圧縮後の符号長Bはより目標符号長Lに近づく。この量子化幅の調整量は符号長が目標符号長よりも短い場合は1より小さく、符号長が超過している場合は1より大きな値となる。
上記の方法により多くの場合に精度よく量子化幅を調節できるが、例えば一部のサンプル値のみ0となっているような、値に偏りのある信号に対しては精度が低下してしまうことがある。これは、値が0であるサンプルに関しても、量子化幅を大きくすることにより符号長が短くなることを仮定しているためである。実際は量子化幅をどのような値にしようと0は0のままであり、符号長に変動はない。
これに対して、本発明では例えば、可逆符号化で圧縮した結果の符号長から量子化幅の違いによって符号長が変動し得る有効サンプル数も推定することにより上記の方法の誤りを補正し、より適切な量子化幅を推定する。
i回目(i≧1)の反復における1フレームでの目標符号長からの超過量をCiビットとする。本発明では例えば、前の反復での超過量と現反復での超過量を基に、量子化幅の調節で符号長が変動しうるサンプル数(以下、有効サンプル数)を推定し、量子化幅の調節量に補正をかける。ここで、i回目の反復における有効サンプル数をMiとする。ただしM1=N、つまりMiは1回目の反復ではフレーム長(言い換えれば、1フレームを構成するサンプル数N)と同じとみなす。
まず、1回目の反復では従来法と同様、フレーム内のサンプルが全て量子化幅の調節を受けることにより符号長が変動すると仮定し、超過量をフレーム長で割った値に基づいて上記のように量子化幅に2^(C1/N)をかけて調節し、2回目の反復を行う。2回目の可逆符号化を行った結果の超過分C2ビットが0でなかった場合、これは有効サンプル数がM2(<N)しかなく、実際はフレーム内全体で(C1/N)×M2ビットしか削減されていなかったためであると仮定する。つまり、削減しきれていなかったC1-((C1/N)×M2)ビットが2回目の反復の超過分C2ビットと等価となるとしてM2を次のように推定する。
Figure 0006629256
このように、反復ごとに有効サンプル数を補正しながら量子化幅の調節を行うことで、信号の値の偏った場合においても少ない反復数で最適な量子化幅を決定することができる。各反復における有効サンプル数の補正は上記式と同様に考え、
Figure 0006629256
(i=2,3,…)のように行う。
そして、この調節はサンプル毎の平均符号長超過量Ci/Miビットに基づいて、量子化幅の調節量を2^(Ci/Mi)とする。つまり、i回目の反復での量子化幅siに対してsi+1=si×2^(Ci/Mi)とする。この補正の操作は、量子化による符号長超過量の変動が小さければ小さいほど量子化幅を大きくする方向に調節するものとなる。
<第一実施形態>
以下、図面を参照して、この発明の第一実施形態について説明する。
図3に、第一実施形態の符号化装置の構成例を示す。図5に、第一実施形態の復号装置を示す。
≪符号化装置≫
図3及び図4を参照して、第一実施形態の符号化装置が実行する符号化方法の処理手続きを説明する。
第一実施形態の符号化装置は、図3に示すように、量子化部31、可逆符号化部32、平均符号長超過量算出部33及び多重化部34を例えば備えている。第一実施形態の符号化方法は、第一実施形態の符号化装置の各部が図4及び以下に示すステップE31からステップE34の処理を実行することにより実現される。
第一実施形態の符号化装置は、入力信号に対して以下の量子化部31、可逆符号化部32及び平均符号長超過量算出部33での処理を反復的に行った後、多重化部34での処理を経て符号を出力する。上記反復処理は、例えば、出力符号の符号長が目標符号長以内に収まる中で量子化幅が最小になるか、所定の反復数を超えるまで行う。
[量子化部31]
量子化部31は、符号化装置に入力された音信号X0,X1,…,XN-1をフレーム毎に受け取り、以下のように量子化幅を更新しながら、音信号X0,X1,…,XN-1をその量子化幅で等間隔スカラー量子化して得られる量子化信号^X0,^X1,…,^XN-1を可逆符号化部32に出力する。
すなわち、量子化部31は、入力された音信号を所定の量子化幅で量子化することにより量子化信号を得る(ステップE31)。
量子化幅は1回目の反復では所定の値s1(例えばs1=1)を用いる。2回目以降のi(i=2,3,4,…)回目の反復において量子化部31は、前の反復で可逆符号化部が出力した1サンプルあたりの平均符号長超過量Ci-1/Mi-1を平均符号長超過量算出部33から受け取り、量子化幅siを前の反復で用いた量子化幅si-1に平均符号長超過量に基づく値である2^(Ci-1/Mi-1)を乗算した値で置き換える。
このように、繰り返し処理では量子化幅は平均符号長超過量に応じて更新される。なお、式(1)により符号長超過量に応じて有効サンプル数が更新され、平均符号長超過量は有効サンプル数に基づく値であることを考慮すると、符号長超過量に応じて有効サンプルが更新され、その更新された有効サンプル数に応じて量子化幅が更新されているとも言える。
反復終了時に、量子化部31は、最終的な量子化幅を多重化部34に出力する。
[可逆符号化部32]
可逆符号化部は、i(i=1,2,3,…)回目の反復において量子化部31が出力した量子化信号を受け取り、可逆符号化により量子化信号に対応する信号符号を割り当て、その信号符号の符号長から所定の目標符号長を減算した値である符号長超過量Ciを得て平均符号長超過量算出部33に出力する(ステップE32)。
可逆符号化としては、例えば一般的なエントロピー符号化を用いてもよいし、MPEG-ALS(例えば、参考文献1参照。)、G.711.0(例えば参考文献2参照。)のような既存の可逆符号化方式を用いてもよい。
可逆符号化部32は、反復終了時には、量子化信号に対応する信号符号を多重化部34に出力する。
〔参考文献1〕T. Liebechen, T. Moriya, N. Harada, Y. Kamamoto, and Y. A. Reznik, “The MPEG-4 Audio Lossless Coding (ALS) standard - technology and applications,” in Proc. AES 119th Convention, Paper #6589, Oct., 2005.
〔参考文献2〕ITU-T G.711.0, “Lossless compression of G.711 pulse code
modulation,” 2009.
[平均符号長超過量算出部33]
平均符号長超過量算出部33は、i(i=1,2,3,…)回目の反復において可逆符号化部32が出力した符号長超過量Ciを受け取り、平均符号長超過量Ci/Miを算出して量子化部31に出力する。平均符号長超過量算出部33は、入力された符号長超過量Ciを基に反復的に有効サンプル数Miを以下のように更新して平均符号長超過量を算出する。
1回目の反復では有効サンプル数M1は、フレーム長と同じとする。すなわち、M1=Nとする。2回目以降、前の反復での符号長超過量Ci-1に対して、式(1)と同様、有効サンプル数Mi-1に現反復で入力された符号長超過量Ciと前の反復で入力された符号長超過量Ci-1に基づいた値である (1-(Ci/Ci-1))を乗算したものを有効サンプル数Miとして置き換え更新する。
平均符号長超過量算出部33は、上記のように算出された有効サンプル数Miで、入力された符号長超過量Ciを除算することで平均符号長超過量Ci/Miを得る。
[多重化部34]
多重化部34は、量子化部31が出力した量子化幅と、可逆符号化部32が出力した信号符号とを受け取り、量子化幅に対応する符号と信号符号とを合わせて出力符号として復号装置に出力する(ステップS34)。
≪復号装置≫
図5及び図6を参照して、第一実施形態の復号装置が実行する復号方法の処理手続きを説明する。
第一実施形態の復号装置は、図5に示すように、多重分離部41、可逆復号部42及び逆量子化部43を例えば備えている。第一実施形態の復号装置は、第一実施形態の復号装置の各部が図6及び以下に示すステップD41からステップD43の処理を実行することにより実現される。
[多重分離部41]
多重分離部41は、復号装置に入力された符号を受け取り、受け取った符号に含まれる信号符号を可逆復号部42に、受け取った符号に含まれる、信号符号に対応する量子化幅を逆量子化部43にそれぞれ出力する(ステップD41)。
[可逆復号部42]
可逆復号部42は、多重分離部41が出力した信号符号を受け取り、可逆符号化部32の処理に対応する可逆復号を行い、信号符号に対応する信号を復号量子化信号として逆量子化部43に出力する(ステップD42)。
[逆量子化部43]
逆量子化部43は、可逆復号部42が出力した復号量子化信号と、多重分離部41が出力した量子化幅とを受け取り、例えば従来技術と同様に、量子化幅に対応する値と復号量子化信号の各サンプル値とをサンプル毎に乗算し、逆量子化された信号を得る(ステップD43)。
逆量子化部43は、逆量子化された信号をサンプル数Nのフレーム毎の出力信号として出力する。
<第二実施形態>
以下、図面を参照して、この発明の第二実施形態について説明する。
符号化装置において、量子化幅の大きさに応じてフィルタリングや圧伸などの前処理を入力された信号に施すか否かをフレーム毎に切り替えることでそのフレームに適した量子化を行うことができる。このような場合、処理の切り替えによってフレーム内の統計的性質が変わり、符号長が大きく変動することがある。例えば、量子化幅が一定値を越えた場合にのみ信号の振幅を圧伸することで聴覚的な量子化歪を低減させようとすると、圧伸の処理は一般的に可逆圧縮の効率を下げるため、量子化の反復の中で突然平均符号長超過量が増加することがある。このように、突然平均符号長超過量が増加すると、無駄な反復が増加する可能性や、第一実施形態のような量子化幅の調節では想定外の更新を行ってしまう可能性がある。
そこで、第二実施形態の符号化装置は、量子化幅が閾値を越えた場合に行う前処理よって増加すると予測される符号長を符号長超過量に加算し、その値を基に平均符号長超過量を算出する。
図7に、第一実施形態の符号化装置の構成例を示す。図9に、第一実施形態の復号装置を示す。
≪符号化装置≫
図7及び図8を参照して、第二実施形態の符号化装置が実行する符号化方法の処理手続きを説明する。
第二実施形態の符号化装置は、図7に示すように、量子化部31、可逆符号化部32、平均符号長超過量算出部33、多重化部34及び信号前処理部35を例えば備えている。第一実施形態の符号化方法は、第二実施形態の符号化装置の各部が図8及び以下に示すステップE31からステップE35の処理を実行することにより実現される。
第二実施形態の符号化装置は第一実施形態の符号化装置と同様、量子化部31、可逆符号化部32及び平均符号長超過量算出部33での処理を反復的に行った後、多重化部34での処理を経て符号を出力する。
以下、第一実施形態と異なる部分である信号前処理部35、量子化部31及び平均符号長超過量算出部33について説明する。第二実施形態の可逆符号化部32及び多重化部34は、第一実施形態と同様であるため重複説明を省略する。
[信号前処理部35]
信号前処理部35は、符号化装置に入力されたフレーム毎の音信号X0,X1,…,XN-1、及び、量子化部31が出力した量子化幅を受け取り、量子化幅が所定の閾値を越えていた場合にのみ音信号に対して高域強調フィルタや振幅圧伸など、量子化誤差を聴覚的に低減させるための従来的な処理である信号前処理(単に「前処理」と略記することもある。)を施し、量子化部31へ出力する。
量子化幅が所定の閾値を越えていない場合、信号前処理部35は、入力された音信号をそのまま量子化部31に出力する。
なお、入力時の量子化幅を閾値よりも小さく設定している場合は、信号前処理部35は、量子化部31、可逆符号化部32及び平均符号長超過量算出部33により更新される量子化幅が所定の閾値を超えているかと、信号前処理が既に行われているかを判定し、閾値を超えていて、かつ信号前処理が行われていないと判定された場合に、信号前処理を一回だけ行う。そして、この信号前処理された音信号に基づいて、その後の、量子化部31、可逆符号化部32及び平均符号長超過量算出部33による繰り返し処理が行われる。
入力時の量子化幅を閾値よりも大きく設定している場合は、信号前処理部35は、始めに一回だけ信号前処理を行う。そして、この信号前処理された音信号に基づいて、その後の、量子化部31、可逆符号化部32及び平均符号長超過量算出部33による繰り返し処理が行われる。
[量子化部31]
量子化部31は、信号前処理部35が出力した音信号X0,X1,…,XN-1をその量子化幅で等間隔スカラー量子化して得られる量子化信号^X0,^X1,…,^XN-1を可逆符号化部32に出力する。
量子化部31は、量子化に用いた量子化幅を信号前処理部35、平均符号長超過量算出部33及び多重化部34のそれぞれに出力する。
[平均符号長超過量算出部33]
平均符号長超過量算出部33は、i(i=1,2,3,…)回目の反復において可逆符号化部が出力した符号長超過量Ciを受け取り、その値を基に反復的に有効サンプル数Miを第一実施形態の平均符号長超過量算出部33と同様に更新して平均符号長超過量を算出する。
平均符号長超過量算出部33は、量子化部31が出力した量子化幅を受け取り、各フレームにおいて量子化幅が閾値を越えた場合には符号長超過量Ciに所定の値を加算する。例えば、信号前処理部35が音信号に対してフィルタリングや圧伸を行った場合に、平均符号長超過量算出部33はその処理によって増加すると予想される符号長を符号長超過量Ciに追加する。例えば高域強調フィルタにより平均的にサンプル毎に0.6ビット信号の符号長が増加する傾向にあるのであれば、量子化幅が閾値を越えた場合に符号長超過量Ciに、0.6をフレーム長Nにかけた値0.6Nを加算する。
符号長超過量Ciへの加算量は、音信号から推定してもよい。例えばフィルタリングや圧伸等の信号前処理部35の処理を行う前の信号のエネルギーE、処理後の信号のエネルギーをE’として、その比の2を底とした対数log2(E’/E)を符号長超過量Ciに加算するとしてもよい。これは、信号を符号化するために必要な記述長がおおよそ信号のエネルギーの対数に比例するという周知の事実に基づく。
こうして得られた符号長超過量Ciと有効サンプル数Miを基に平均符号長超過量算出部33は平均符号長超過量Ci/Miを算出し、量子化部31に出力する。
上記加算による符号長超過量の補正は有効サンプル数を考慮しない場合においても、つまり有効サンプル数Miを常にフレーム長Nと等しいとして処理をしている方式においても有効である。
このように、平均符号長超過量算出部33は、所定の量子化幅が所定の閾値を超えた場合には、所定の値と符号長超過量との和を有効サンプル数で割った値と等しい値を平均符号長超過量とする。
例えば、平均符号長超過量算出部33は、所定の量子化幅が所定の閾値を超えた場合には、前処理により増加すると予想される符号長の量が多いほど大きな値と符号長超過量との和を有効サンプル数で割った値と等しい値を平均符号長超過量とする。
ここで、Aを任意の値として、値Aと等しい値とは、値Aと等しい値を得ることができれば、その値Aと等しい値を得るための計算方法は問わないことを意味する。値Aと等しい値を得るための計算方法が複数あるとして、何れの計算方法を用いて値Aと等しい値を計算してもよい。
≪復号装置≫
図9及び図10を参照して、第二実施形態の復号装置が実行する復号方法の処理手続きを説明する。
第二実施形態の復号装置は、図9に示すように、多重分離部41、可逆復号部42、逆量子化部43及び信号後処理部44を例えば備えている。第二実施形態の復号装置は、第一実施形態の復号装置の各部が図10及び以下に示すステップD41からステップD44の処理を実行することにより実現される。
以下、第一実施形態と異なる部分である多重分離部41、逆量子化部43、信号後処理部44について説明する。第二実施形態の可逆復号部42は、第一実施形態と同様であるため重複説明を省略する。
[多重分離部41]
多重分離部41は、復号装置に入力された符号を受け取り、受け取った符号に含まれる信号符号を可逆復号部42に、受け取った符号に含まれる、信号符号に対応する量子化幅を逆量子化部43及び信号後処理部44にそれぞれ出力する(ステップD41)。
[逆量子化部43]
逆量子化部43は、可逆復号部42が出力した復号量子化信号と、多重分離部41が出力した量子化幅とを受け取り、第一実施形態の逆量子化部43と同様に逆量子化された復号信号を得て、信号後処理部44へ出力する(ステップD43)。
[信号後処理部44]
信号後処理部44は、逆量子化部43が出力した復号信号及び多重分離部41が出力した量子化幅を受け取り、量子化幅が閾値を超えていれば符号化装置の信号前処理部35の行った処理に対応する処理を復号信号に対して行い、サンプル数Nのフレーム毎の出力信号として出力する(ステップD44)。
量子化幅が閾値を超えていなければ、信号後処理部44は、復号信号をそのままサンプル数Nのフレーム毎の出力信号として出力する。
ここで、符号化装置の信号前処理部の行った処理に対応する処理とは、例えば信号前処理部で高域強調フィルタを用いたのであればその逆フィルタを適用すること、信号前処理部で振幅圧伸を用いたのであればその圧伸の逆変換を行うことなどを指す。
<変形例>
第一実施形態においても、量子化部31に入力される音信号は、高域強調フィルタや振幅圧伸などの前処理がされた音信号であってもよい。
また、実用上の都合で使用する量子化幅が2のべき乗のもののみに制約される場合にも上記の量子化幅の更新を適用することができる。この場合には、量子化幅の更新の際に平均符号長超過量Ci-1/Mi-1を例えば四捨五入などを用いて整数化したものに基づいて量子化幅の調節量を算出する。
また、量子化部31は、ビット平面上において等間隔スカラー量子化を行ってもよい。この場合、量子化部31は、量子化幅siの代わりにi回目の反復におけるビット削減量biを用い、量子化時には音信号X0,X1,…,XN-1の二進数表現におけるそれぞれの下位桁からビット削減量biビットだけ無視した値を量子化信号^X0,^X1,…,^XN-1とする。b1は、所定の正の整数とする。例えば、b1=0とする。このように、量子化部31は、入力された音信号のビットを下位桁から所定のビット削減量だけ無視することにより量子化信号を得てもよい。
ビット削減量biの更新は、前の反復で用いたビット削減量bi-1に平均符号長超過量算出部33が出力した1サンプルあたりの平均符号長超過量Ci-1/Mi-1を加算したもので置き換えることにより行う。反復終了時に、量子化部31は、量子化幅の代わりにビット削減量を多重化部34に出力する。
量子化部31がビット平面上で量子化を行っている場合には、復号装置の逆量子化部43は、例えば復号量子化信号の二進数表記におけるそれぞれの下位桁にビット削減量の分だけ0を追加することで出力信号を得る。
量子化部31がビット平面上において等間隔スカラー量子化を行う場合の他の処理は、量子化幅を用いて行う上記の第一実施形態又は第二実施形態と同様である。
その他、この発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
<プログラム及び記録媒体>
符号化装置又は復号装置の各部における処理をコンピュータによって実現する場合、符号化装置又は復号装置の各部がが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、その各部の処理がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、各部の処理は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理の少なくとも一部をハードウェア的に実現することとしてもよい。
31 量子化部
32 可逆符号化部
33 平均符号長超過量算出部
34 多重化部
35 信号前処理部
41 多重分離部
42 可逆復号部
43 逆量子化部
44 信号後処理部

Claims (9)

  1. 入力された音信号を所定の量子化幅で量子化することにより量子化信号を得る量子化部と、
    上記量子化信号を可逆符号化することにより信号符号を得て、その信号符号の符号長から所定の目標符号長を減算した値である符号長超過量を得る可逆符号化部と、を含み、
    上記量子化部及び上記可逆符号化部の処理は繰り返し行われ、その繰り返し処理では、量子化幅の調節において符号長が変動し得るサンプル数を有効サンプル数として、上記符号長超過量に応じて有効サンプル数が更新され、その更新された有効サンプル数に応じて上記所定の量子化幅が更新される、
    符号化装置。
  2. 請求項1の符号化装置において、
    音信号に所定の前処理を行い、その前処理後の音信号を上記量子化部への入力とする信号前処理部と、
    上記所定の量子化幅が所定の閾値を超えた場合には、上記前処理により増加すると予想される符号長の量が多いほど大きな値と上記符号長超過量との和を上記有効サンプル数で割った値と等しい値を平均符号長超過量とする平均符号長超過量算出部と、を更に含み、
    上記量子化部、上記可逆符号化部及び上記平均符号長超過量算出部の処理は繰り返し行われ、その繰り返し処理では上記所定の量子化幅は上記平均符号長超過量に応じて更新される、
    符号化装置。
  3. 請求項1の符号化装置において、
    音信号に所定の前処理を行い、その前処理後の音信号を上記量子化部への入力とする信号前処理部と、
    上記所定の量子化幅が所定の閾値を超えた場合には、所定の値と上記符号長超過量との和を上記有効サンプル数で割った値と等しい値を平均符号長超過量とする平均符号長超過量算出部と、を更に含み、
    上記量子化部、上記可逆符号化部及び上記平均符号長超過量算出部の処理は繰り返し行われ、その繰り返し処理では上記所定の量子化幅は上記平均符号長超過量に応じて更新される、
    符号化装置。
  4. 入力された音信号のビットを下位桁から所定のビット削減量だけ無視することにより量子化信号を得る量子化部と、
    上記量子化信号を可逆符号化することにより信号符号を得て、その信号符号の符号長から所定の目標符号長を減算した値である符号長超過量を得る可逆符号化部と、を含み、
    上記量子化部及び上記可逆符号化部の処理は繰り返し行われ、その繰り返し処理では、ビット削減量の調節において符号長が変動し得るサンプル数を有効サンプル数として、上記符号長超過量と上記有効サンプル数に応じて上記所定のビット削減量が更新される、
    符号化装置。
  5. 請求項4の符号化装置において、
    音信号に所定の前処理を行い、その前処理後の音信号を上記量子化部への入力とする信号前処理部と、
    上記所定のビット削減量が所定の閾値を超えた場合には、上記前処理により増加すると予想される符号長の量が多いほど大きな値と上記符号長超過量との和を上記有効サンプル数で割った値と等しい値を平均符号長超過量とする平均符号長超過量算出部と、を更に含み、
    上記量子化部、上記可逆符号化部及び上記平均符号長超過量算出部の処理は繰り返し行われ、その繰り返し処理では上記所定のビット削減量は上記平均符号長超過量に応じて更新される、
    符号化装置。
  6. 請求項4の符号化装置において、
    音信号に所定の前処理を行い、その前処理後の音信号を上記量子化部への入力とする信号前処理部と、
    上記所定のビット削減量が所定の閾値を超えた場合には、所定の値と上記符号長超過量との和を上記有効サンプル数で割った値と等しい値を平均符号長超過量とする平均符号長超過量算出部と、を更に含み、
    上記量子化部、上記可逆符号化部及び上記平均符号長超過量算出部の処理は繰り返し行われ、その繰り返し処理では上記所定のビット削減量は上記平均符号長超過量に応じて更新される、
    符号化装置。
  7. 入力された音信号を所定の量子化幅で量子化することにより量子化信号を得る量子化ステップと、
    上記量子化信号を可逆符号化することにより信号符号を得て、その信号符号の符号長から所定の目標符号長を減算した値である符号長超過量を得る可逆符号化ステップと、を含み、
    上記量子化ステップ及び上記可逆符号化ステップの処理は繰り返し行われ、その繰り返し処理では、量子化幅の調節において符号長が変動し得るサンプル数を有効サンプル数として、上記符号長超過量に応じて有効サンプル数が更新され、その更新された有効サンプル数に応じて上記所定の量子化幅が更新される、
    符号化方法。
  8. 入力された音信号のビットを下位桁から所定のビット削減量だけ無視することにより量子化信号を得る量子化ステップと、
    上記量子化信号を可逆符号化することにより信号符号を得て、その信号符号の符号長から所定の目標符号長を減算した値である符号長超過量を得る可逆符号化ステップと、を含み、
    上記量子化ステップ及び上記可逆符号化ステップの処理は繰り返し行われ、その繰り返し処理では、ビット削減量の調節において符号長が変動し得るサンプル数を有効サンプル数として、上記符号長超過量と上記有効サンプル数に応じて上記所定のビット削減量が更新される、
    符号化方法。
  9. 請求項1から6何れかの符号化装置の各部としてコンピュータを機能させるためのプログラム。
JP2017046970A 2017-03-13 2017-03-13 符号化装置、方法及びプログラム Active JP6629256B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017046970A JP6629256B2 (ja) 2017-03-13 2017-03-13 符号化装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017046970A JP6629256B2 (ja) 2017-03-13 2017-03-13 符号化装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2018151498A JP2018151498A (ja) 2018-09-27
JP6629256B2 true JP6629256B2 (ja) 2020-01-15

Family

ID=63680323

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017046970A Active JP6629256B2 (ja) 2017-03-13 2017-03-13 符号化装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6629256B2 (ja)

Also Published As

Publication number Publication date
JP2018151498A (ja) 2018-09-27

Similar Documents

Publication Publication Date Title
US9343076B2 (en) Methods and systems for generating filter coefficients and configuring filters
US7062445B2 (en) Quantization loop with heuristic approach
US7433824B2 (en) Entropy coding by adapting coding between level and run-length/level modes
US7840403B2 (en) Entropy coding using escape codes to switch between plural code tables
US20070094035A1 (en) Audio coding
JP4548348B2 (ja) 音声符号化装置及び音声符号化方法
RU2719008C1 (ru) Аудиокодер для кодирования аудиосигнала, способ для кодирования аудиосигнала и компьютерная программа, учитывающие детектируемую спектральную область пиков в верхнем частотном диапазоне
EP1187338A2 (en) Method and apparatus for performing variable-size vector entropy coding
EP2012306A1 (en) Encoding method and encoding device
US9425820B2 (en) Vector quantization with non-uniform distributions
CN110491398B (zh) 编码方法、编码装置以及记录介质
JP6629256B2 (ja) 符号化装置、方法及びプログラム
JP5361565B2 (ja) 符号化方法、復号方法、符号化器、復号器およびプログラム
JP2000347679A (ja) オーディオ符号化装置及びオーディオ符号化方法
Wernik et al. Audio lossless encoding with adaptive Context-Dependent Constant Component Removing
JP6712643B2 (ja) サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム
Wernik et al. Lossless Audio Coding using Extended Activity Level Classification Model
JPH08211900A (ja) ディジタル音声圧縮方式
Ulacha et al. A High Efficienct Binary Arithmetic Coder for Lossless Audio Compression
CN116368497A (zh) 利用深度神经网络的自适应块切换
CN116457797A (zh) 使用神经网络处理音频的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180622

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190509

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190514

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191204

R150 Certificate of patent or registration of utility model

Ref document number: 6629256

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150