JP6552986B2 - 音声符号化装置、方法及びプログラム - Google Patents

音声符号化装置、方法及びプログラム Download PDF

Info

Publication number
JP6552986B2
JP6552986B2 JP2016044737A JP2016044737A JP6552986B2 JP 6552986 B2 JP6552986 B2 JP 6552986B2 JP 2016044737 A JP2016044737 A JP 2016044737A JP 2016044737 A JP2016044737 A JP 2016044737A JP 6552986 B2 JP6552986 B2 JP 6552986B2
Authority
JP
Japan
Prior art keywords
signal
quantization
probability
sample
amplitude
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016044737A
Other languages
English (en)
Other versions
JP2017161648A (ja
Inventor
信行 西澤
信行 西澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2016044737A priority Critical patent/JP6552986B2/ja
Publication of JP2017161648A publication Critical patent/JP2017161648A/ja
Application granted granted Critical
Publication of JP6552986B2 publication Critical patent/JP6552986B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声符号化装置、方法及びプログラムに関する。
非特許文献1に記載のMPEGオーディオでは、所謂、サブバンド符号化が使用される。図5は、MPEGオーディオ・レイヤ1又は2の符号化装置の概略図である。なお、以下の処理は、フレームと呼ばれる所定期間の信号を単位として行われる。ディジタルオーディオ信号である入力信号は、フィルタバンク50及び決定部51に入力される。フィルタバンク50は、入力信号を、所定の周波数帯域毎に分割し、各周波数帯域の信号を量子化部52に出力する。一方、決定部51は、人間の聴覚特性に基づき、各周波数帯域の信号の量子化ステップを決定し、決定した量子化ステップを示す量子化ステップ情報を量子化部52に出力する。量子化部52は、量子化ステップ情報に基づき各周波数帯域の信号を量子化して生成部53に出力する。生成部53は、各周波数帯域の量子化後の信号(振幅値列)からビットストリームを生成して出力する。ここで、決定部51は、人間の聴覚心理モデルに基づき量子化ステップを決定する。具体的には、人間の聴感上、信号対雑音比(SNR)が低くても良い周波数帯域に対しては量子化ステップを荒くして量子化ビット数を小さくし、これにより、オーディオ信号の圧縮を行っている。
なお、MPEGオーディオ・レイヤ3の場合には、量子化部52において外部ループと内部ループの2つのループ処理が行われる。具体的には、内部ループにおいて量子化ステップを決定し、外部ループにおいて、聴覚心理モデルに基づき符号化誤差を評価する。
ISO/IEC 11172−3:1993 Information technology――Coding of moving pictures and associated audio for digital storage media at up to about 1.5 Mbit/s――Part 3:Audio
MPEGオーディオ等のサブバンド符号化に基づくオーディオ符号化は、音声信号に限定されないオーディオ信号を符号化の対象としており、音声信号を符号化した場合、音声信号を主な対象とする音声符号化技術よりも高いビットレートを設定しないと、音声符号化技術と同等の品質を得ることができない。しかし、従来のオーディオ符号化であっても、入力が音声信号であることが仮定できれば、符号化の方法を音声信号の特徴に基づき修正することで、ビットレートを低くすることができる。MPEGオーディオ等のオーディオ符号化装置及び復号装置は広く普及しており、音声符号化技術による符号化装置および復号装置よりも低コストで利用できる場合があるので、復号装置については、従来の復号装置をそのまま使用できる様に、従来のオーディオ符号化を修正すれば、低ビットレートの音声伝送を低コストで実現することができる。
本発明は、広く普及したオーディオ符号の復号装置をそのまま使用でき、かつ、ビットレートを当該オーディオ符号より低くできる音声符号化装置、方法及びプログラムを提供するものである。
本発明の一側面によると、音声信号を符号化する音声符号化装置は、前記音声信号を構成する周期成分信号を複数の周波数帯域に分割して各周波数帯域に対応する複数の第1信号を出力する分割手段と、前記複数の第1信号それぞれの量子化ステップを決定する決定手段と、前記決定手段が決定した量子化ステップに基づき第1信号の各サンプルを量子化する量子化手段と、前記音声信号から前記周期成分信号を除いた雑音成分信号について、前記複数の周波数帯域それぞれでのパワーを判定する判定手段と、前記第1信号の量子化誤差によるパワーが、前記第1信号に対応する周波数帯域での前記雑音成分信号のパワーに近づく様に、量子化後の前記第1信号のサンプルの振幅を調整する調整手段と、を備えていることを特徴とする。
広く普及したオーディオ符号の復号装置をそのまま使用でき、かつ、ビットレートを当該オーディオ符号より低くすることができる。
一実施形態による音声符号化装置の構成図。 一実施形態による量子化・重畳部の構成図。 一実施形態による量子化・重畳部の構成図。 一実施形態による量子化・重畳部の構成図。 サブバンド符号化装置の構成図。
以下、本発明の例示的な実施形態について図面を参照して説明する。なお、以下の実施形態は例示であり、本発明を実施形態の内容に限定するものではない。また、以下の各図においては、実施形態の説明に必要ではない構成要素については図から省略する。
<第一実施形態>
図1は、本実施形態による音声符号化装置の概略的な構成図である。なお、以下で説明する処理は、フレームと呼ばれる所定期間の信号を単位として行われる。ディジタル音声信号である入力信号は、まず、分離部10に入力される。分離部10は、入力信号を第1信号と第2信号に分離し、第1信号をフィルタバンク11に出力し、第2信号を量子化・重畳部13に出力する。ここで、第1信号は、音声信号を三角関数の和で近似した信号であり、以下では周期成分信号とも呼ぶ。一方、第2信号は、音声信号から第1信号を減じた信号であり、雑音成分に近い特性を持つため、以下では雑音成分信号とも呼ぶ。また、入力信号は、決定部12にも入力される。フィルタバンク11は、第1信号を、所定の周波数帯域毎に分割し、各周波数帯域に分割された第1信号を量子化・重畳部13に出力する。決定部12は、人間の聴覚特性に基づき、各周波数帯域の信号の量子化ステップを決定し、決定した量子化ステップを示す量子化ステップ情報を量子化・重畳部13に出力する。量子化・重畳部13での処理については後述するが、最終的に、量子化・重畳部13は、第2信号と、決定部12からの量子化ステップ情報に基づき、各周波数帯域に分割された第1信号の各サンプルの振幅値を生成部14に出力する。量子化・重畳部13は、決定部12が決定した量子化ステップを変更する場合があり、量子化ステップを変更した場合、量子化・重畳部13は、変更後の量子化ステップを示す量子化ステップ情報を生成部14に出力する。なお、量子化ステップを変更しなかった場合、量子化・重畳部13は、決定部12からの量子化ステップ情報をそのまま生成部14に出力する。生成部14は、各周波数帯域のサンプルの振幅と量子化ステップ情報に基づきビットストリームを生成して出力する。ここで、決定部12は、人間の聴覚心理モデルに基づき量子化ステップを決定する。具体的には、人間の聴感上、信号対雑音比(SNR)が低くても良い周波数帯域に対しては量子化ステップを荒くして量子化ビット数を小さくする。
図2は、本実施形態による量子化・重畳部13の構成図である。なお、図の簡略化のため、図2において、決定部12からの量子化ステップ情報が量子化部131に入力される状態のみを示しているが、決定部12からの量子化ステップ情報は、図2の各機能ブロックが利用可能となっているものとする。量子化部131は、決定部12からの量子化ステップ情報に従い、帯域分割された第1信号それぞれの量子化を行い、量子化後の各サンプルの振幅を誤差判定部132及び振幅調整部135に出力する。誤差判定部132は、帯域分割された元の第1信号の振幅と、量子化後の振幅との差を各サンプルについて求め、これを量子化誤差として確率計算部134に出力する。
また、第2信号はパワー判定部133に入力される。パワー判定部133は、フレーム期間に渡る第2信号を周波数領域の信号に変換し、フィルタバンク11における周波数帯域それぞれについて信号パワーを求め、各周波数帯域の第2信号のパワーを示すパワー情報を確率計算部134に出力する。確率計算部134は、各サンプルの量子化誤差とパワー情報に基づき、各サンプルに対して、増加確率p(0≦p≦1)と、減少確率q(0≦q≦1)と、維持確率r(0≦r≦1)と、を求める。なお、p+q+r=1である。この増加確率p、減少確率q及び維持確率rの算出方法については後述する。
振幅調整部135は、量子化後のサンプルの振幅を、当該サンプルに対応する増加確率p、減少確率q及び維持確率rに基づき調整し、当該サンプルの調整後の振幅を生成部14に出力する。また、量子化ステップ情報を生成部14に出力する。
続いて、振幅調整部135においてどの様に振幅を調整するかについて説明する。一例として、増加確率pが0.3であり、減少確率qが0.5であり、よって、維持確率rが0.2であるものとする。振幅調整部135は、量子化後のサンプルに対して0以上1以下の一様乱数を生成する。この乱数が0以上0.3以下(つまり、その値の範囲が増加確率pである0.3)であると、振幅調整部135は、当該サンプルの振幅を量子化ステップで1つ分だけ大きくする。一方、乱数が0.3より大きく、かつ、0.8以下(つまり、その値の範囲が減少確率qである0.5)であると、振幅調整部135は、当該サンプルの振幅を量子化ステップで1つ分だけ小さくする。一方、乱数が0.8より大きく、かつ、1.0以下(つまり、その値の範囲が維持確率rである0.2)であると、振幅調整部135は、当該サンプルの振幅を変更しない。
続いて、確率計算部134における、増加確率p、減少確率q及び維持確率rの求め方について説明を行う。なお、以下の処理は、各周波数帯域に対してそれぞれ行う。具体的な例として、1つのフレームには8つのサンプルが存在し、ある周波数帯域の第1信号のサンプルの振幅が、その時間順に68、99、78、14、−57、−98、−87、−30であるものとする。また、パワー情報が、当該フレームにおける当該周波数帯域のパワーが20であることを示し、量子化ステップ情報が、当該フレームにおける当該周波数帯域の量子化ステップが16であることを示しているものとする。
この場合、量子化部131における量子化後の各サンプルの振幅は、64、96、80、16、−64、−96、−80、−32となる。したがって、誤差判定部132が、確率計算部134に出力する各サンプルの量子化誤差は、−4、−3、2、2、−7、2、7、−2となる。この場合、量子化誤差の合計は−3であり、よって、サンプル当たりの量子化誤差、つまり、量子化誤差の平均値は−3/8=−0.375となる。また、量子化誤差によるパワーは、各量子化誤差の2乗の平均値として求めることができ、本例において、各サンプルの量子化誤差の2乗は、16、9、4、4、49、4、49、4である。よって、量子化誤差による2乗誤差の合計値は139であり、量子化誤差によるパワーは17.375となる。
本実施形態においては、振幅調整部135が出力する調整後のサンプルの振幅について、量子化誤差の期待値が0であり、かつ、量子化誤差のパワーの期待値が、パワー情報で示される20になる或いは近づくように、増加確率p、減少確率q及び維持確率rを求める。ここで、振幅調整部135が出力する調整後のサンプルの量子化誤差とは、振幅調整部135の出力と第1信号との差のことを言う。例えば、1番目のサンプルの元の振幅は68であり、量子化部131による量子化後の振幅は64である。ここで、1番目のサンプルについて、量子化ステップを1つだけ増加させるとその振幅は80となり、量子化ステップを1つだけ減少させるとその振幅は48となる。したがって、量子化誤差の期待値を0とすると、以下の式(1)が得られる。
p(80−68)+q(48−68)+r(64−68)=0 (1)
また、量子化誤差のパワーの期待値を雑音成分信号のパワー、つまり、本例では20とすると、以下の式(2)が得られる。
p(80−68)+q(48−68)+r(64−68)=20 (2)
また。上述した様に、増加確率p、減少確率q及び維持確率rには式(3)で示す関係がある。
r=1−p−q (3)
本実施形態では、上記式(1)〜(3)に基づき増加確率p、減少確率q及び維持確率rを求める。なお、本例において、p=0.15625、q=−0.09375、r=0.9375であり、増加確率p、減少確率q及び維持確率rの総てが0以上1以下の値にはならない。例えば、増加確率p、減少確率q及び維持確率rの総てが0以上1以下の値であり、かつ、増加確率p及び減少確率qの和が1以下であれば、上述した様に対応するサンプルの振幅を調整する。しかしながら、本例の様に、増加確率p、減少確率q及び維持確率rとして0未満の値や、1より大きい値が得られた場合、本実施形態では、増加確率p又は減少確率qを0とし、パワーの期待値のみに基づき増加確率p又は減少確率qと、維持確率rを求める。なお、増加確率p及び減少確率qのどちらを0とするかは、実際に予め決めておくことも、ランダムに選択することも、交互に選択することもできる。あるいは、双方を実験的に試みて、量子化誤差の期待値の絶対値が小さくなる方法を選択しても良い。以下では、増加確率p及び減少確率qを纏めて変更確率s(0≦s≦1)と呼ぶものとする。
そうすると、ここでは例として減少確率qの方を0としたとき式(2)及び式(3)は、それぞれ、以下の式(4)及び式(5)になる。
s(80−68)+r(64−68)=20 (4)
r=1−s (5)
上記式(4)及び(5)から変更確率sは0.03125となり、維持確率rは0.96875となる。この場合、振幅調整部135は、発生した乱数の値により確率0.03125でサンプルの振幅を量子化ステップで1だけ増加又は減少させることになる。
なお、本実施形態では、増加確率p、減少確率q及び維持確率rの内、1つでも0未満の値や、1より大きい値があると、増加確率p及び減少確率qのいずれかを0として増加確率p、減少確率q及び維持確率rを求めたが、常に、増加確率p及び減少確率qのいずれかを0として増加確率p、減少確率q及び維持確率rを求める形態であっても良い。つまり、常に上記式(4)及び(5)に基づき変更確率s及び維持確率rを求めてサンプルの振幅を調整する形態とすることができる。この場合、変更確率sに基づき振幅を増加させるのか減少させるのかは予め決めておくことも、ランダムに選択することも、交互に選択することもできる。あるいは、双方を実験的に試みて、量子化誤差の期待値の絶対値が小さくなる方法を選択しても良い。また、本実施形態では、分離部10において入力信号を第1信号と第2信号に分離した。しかしながら、音声符号化装置の外部において第1信号と第2信号とに分離しておき、音声符号化装置は、外部の装置から第1信号と第2信号の両方をそれぞれ受信する形態であって良い。これは、一部の音声合成装置においては、周期成分信号と雑音成分信号をそれぞれ個別に生成するため、そのような音声合成装置で合成した音声を本発明による音声符号化装置で伝送する場合、音声合成装置における周期成分信号と雑音成分信号を、それぞれ本発明における第1成分信号、第2成分信号とすれば、分離部10は必要ないからである。また、本実施形態において、第1信号は音声の周期信号成分であるとしたが、本発明はそれに限定されない。具体的には、帯域分割した結果が、その各帯域において白色雑音と見做せれるような信号を第2信号とすれば良く、この場合、入力信号から第2信号を減じた信号を第1信号とすることができる。例えば、破裂音的な音声区間を対象に、第1信号を単一のインパルスとしても良い。
続いて、本発明における上記処理の考え方について説明する。図5に示すオーディオ符号化装置は、周期成分信号(第1信号)及び雑音成分信号(第2信号)を区別することなく処理を行う。一方、音声信号から周期成分信号を減じることで得られる雑音成分信号は、フィルタバンクにより分割された各周波数帯域においては、白色雑音と見做せる。したがって、本発明においては、周期成分信号を従来のオーディオ符号化と同様に量子化した上で、雑音成分については、その波形を考慮することなく、そのパワーのみを考慮して符号化を行う。具体的には、量子化雑音も白色雑音と見做せるため、周期成分信号を量子化し、量子化雑音が雑音成分信号のパワーに近づく様に、量子化後のサンプルの振幅をサンプル単位でそれぞれ調整する。この構成により、雑音成分を含めた波形に基づき行う符号化に比べて符号化により生じるビット量を減少させ、よって、低ビットレート化を実現することができる。なお、本実施形態では、量子化ステップを1ステップだけ増加又は減少させたが、2ステップだけ増加又は減少させる等、複数ステップだけ増加又は減少させる形態であっても良い。つまり、量子化ステップの整数倍を所定値とし、所定値だけサンプルの振幅を確率的に増減させる構成とすることができる。
以上、各周波数帯域において、周期成分信号のサンプルの振幅を調整して雑音成分信号のパワーを量子化雑音として重畳させる。この構成により音声信号の圧縮率を高めることができる。また、本実施形態における音声符号化装置が出力する信号は、従来のオーディオ符号化の符号化装置と同じであり、よって、従来のオーディオ符号化の復号装置をそのまま使用することが可能になる。
<第二実施形態>
続いて、本実施形態について、第一実施形態との相違点を中心に説明する。本実施形態における音声符号化装置の全体は図1と同様である。図3は、本実施形態による量子化・重畳部13の構成図である。本実施形態と第一実施形態は、確率計算部134において、増加確率p、減少確率q及び維持確率rの内、1つでも0未満の値や、1より大きい値が得られた場合の処理が異なるのみであり、その他の処理は第一実施形態と同様である。
上述した様に、第一実施形態では、増加確率p、減少確率q及び維持確率rの内、1つでも0未満の値や、1より大きい値があると、増加確率p及び減少確率qのいずれかを0として増加確率p、減少確率q及び維持確率rを求めていた。本実施形態では、増加確率p、減少確率q及び維持確率rの内、1つでも0未満の値や、1より大きい値があると、当該フレームにおける量子化ステップをより小さい値に変更する。例えば、量子化ステップを16から8に変更するものとする。この場合、上記例の最初のサンプルの振幅について、量子化ステップを1つだけ増加させると、その振幅は72になり、量子化ステップを1つだけ減少させると、その振幅は56になる。したがって、量子化誤差の期待値を0とし、量子化誤差パワーの期待値を20とすると、以下の式(6)及び(7)が得られる。
p(72−68)+q(56−68)+r(64−68)=0 (6)
p(72−68)+q(56−68)+r(64−68)=20 (7)
式(3)、式(6)及び式(7)より、量子化ステップを小さくすると、増加確率p=0.53125、減少確率q=0.03125、維持確率r=0.4375が得られる。この場合、確率計算部134は、量子化ステップの変更を変更通知信号で振幅調整部135に通知し、振幅調整部135は、変更後の量子化ステップを示す量子化ステップ情報を生成部14に出力する。
<第三実施形態>
続いて、本実施形態について、第一実施形態及び第二実施形態との相違点を中心に説明する。本実施形態における音声符号化装置の全体は図1と同様である。図4は、本実施形態による量子化・重畳部13の構成図である。本実施形態において、確率計算部134には各周波数帯域の量子化後のサンプルの振幅も入力される。そして、確率計算部134は、各周波数帯域について、量子化後のサンプルの振幅の2乗のフレーム内における総和を求め、これを、フレーム内のサンプル数で除することで、当該フレームにおける量子化後の第1信号のパワーを求める。そして求めた第1信号のパワーを、パワー情報が示す当該フレームの雑音成分のパワーと比較する。例えば、求めた第1信号のパワーが、雑音成分信号のパワーより大変小さいと、当該フレームに対応する周波数帯域の信号は、雑音成分信号が支配的であり、周期成分信号については無視しても復号される音声信号の品質はあまり劣化しない。よって、確率計算部134は、例えば、当該フレームにおける量子化後の第1信号のパワーに対する雑音成分信号のパワーの比を求め、この比が閾値以上であると、雑音成分信号のパワーとなるサンプル列と、量子化ステップと、を求めて振幅調整部135に変更通知信号で通知する。このとき、量子化ステップを、決定部12が決定した量子化ステップより大きい値に変更する。振幅調整部135は、変更通知信号により、サンプル列と量子化ステップが通知されると、当該フレームにおいては、量子化部131で量子化されたサンプル列を、確率計算部134から通知されたサンプル列に置換して出力する。また、量子化ステップ情報として、確率計算部134から通知された量子化ステップを出力する。その他の構成は第一実施形態又は第二実施形態と同様である。なお、本実施形態においては、量子化後の第1信号のパワーと雑音成分信号のパワーとを比較したが、量子化前の第1信号のパワーと雑音成分信号のパワーとを比較する構成であっても良い。
以上、本実施形態では、雑音成分が支配的であるフレームの周波数帯域については、雑音成分のパワーに基づき量子化ステップとサンプルの振幅系列を決定する。この構成により、雑音成分が支配的であるフレームの周波数帯域の量子化ステップを大きくすることができ、よって、符号化で生じるビット数を低減して低ビットレート化を実現することができる。
<その他>
MPEGオーディオ・レイヤ3では、量子化後のサンプルについて、可変長符号であるハフマン符号化を更に行う。具体的には、内部ループにおいて量子化ステップを調整しながら量子化を行う。その後、外部ループにおいて、符号化歪みが許容範囲内であるかを判定し、許容範囲内でなければ、再度、内部ループについての処理を行う。
したがって、本発明をMPEGオーディオ・レイヤ3に適用する場合、内部ループにおいて各周波数帯域の第1信号の量子化を行い、総ての量子化後の振幅がハッフマン符号の符号表の範囲内であるか否かを判定し、総ての量子化後の振幅がハッフマン符号の符号表の範囲内であると、上述した様に、量子化雑音のパワーがパワー情報で示されるパワーに近づくように量子化後の振幅を調整すれば良い。
なお、振幅の調整については、上記各実施形態と同様に量子化ステップの整数倍だけ増減させる方法とするが、MPEGオーディオ・レイヤ3の様に量子化後の値を可変長符号化する場合には、調整前のサンプルの振幅に対応する符号語より、符号語の長さが短くなる様に変更することができる。つまり、調整前のサンプルの振幅に対応する符号語よりその符号長が短くなる符号語を選択し、選択した符号語に対応する振幅と元の振幅に基づき変更確率sを求めて確率的にサンプルの振幅を調整する構成とすることができる。或いは、調整前のサンプルの振幅に対応する符号語よりその符号長が短くなり、かつ、振幅が増加する符号語と、調整前のサンプルの振幅に対応する符号語よりその符号長が短くなり、かつ、振幅が減少する符号語を選択し、式(1)〜式(3)に基づき増加確率p及び減少確率qを求めて確率的にサンプルの振幅を調整する構成とすることができる。これにより、ビットレートをより低くすることができる。
なお、本発明による音声符号化装置は、コンピュータを上記音声符号化装置として動作させるプログラムにより実現することができる。これらコンピュータプログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布が可能なものである。
11:フィルタバンク、12:決定部、131:量子化部、133:パワー判定部、135:振幅調整部

Claims (14)

  1. 音声信号を符号化する音声符号化装置であって、
    前記音声信号を構成する周期成分信号を複数の周波数帯域に分割して各周波数帯域に対応する複数の第1信号を出力する分割手段と、
    前記複数の第1信号それぞれの量子化ステップを決定する決定手段と、
    前記決定手段が決定した量子化ステップに基づき第1信号の各サンプルを量子化する量子化手段と、
    前記音声信号から前記周期成分信号を除いた雑音成分信号について、前記複数の周波数帯域それぞれでのパワーを判定する判定手段と、
    前記第1信号の量子化誤差によるパワーが、前記第1信号に対応する周波数帯域での前記雑音成分信号のパワーに近づく様に、量子化後の前記第1信号のサンプルの振幅を調整する調整手段と、
    を備えていることを特徴とする音声符号化装置。
  2. 前記判定手段は、所定期間の前記雑音成分信号について、前記複数の周波数帯域それぞれのパワーを判定し、
    前記調整手段は、前記所定期間の前記第1信号の量子化誤差によるパワーが、前記所定期間の前記第1信号に対応する周波数帯域での前記雑音成分信号のパワーである第1の値に近づく様に、量子化後の前記第1信号のサンプルの振幅を調整することを特徴とする請求項1に記載の音声符号化装置。
  3. 前記調整手段は、前記所定期間の前記第1信号の各サンプルそれぞれについて変更確率sを求め、当該各サンプルの量子化後の振幅を対応する変更確率sで所定値だけ増加又は減少させることで、量子化後の前記第1信号のサンプルの振幅を調整し、
    サンプルの量子化後の振幅を前記所定値だけ増加又は減少させる確率が変更確率sであると、当該サンプルの量子化誤差のパワーの期待値が前記第1の値となる様に、当該サンプルに対応する変更確率sは求められ
    前記所定値は、前記決定手段が決定した量子化ステップの整数倍の値であることを特徴とする請求項2に記載の音声符号化装置。
  4. 前記調整手段は、前記所定期間の前記第1信号の各サンプルそれぞれについて増加確率p及び減少確率qを求め、当該各サンプルの量子化後の振幅を対応する増加確率pで所定値だけ増加させ、対応する減少確率qで前記所定値だけ減少させることで、量子化後の前記第1信号のサンプルの振幅を調整し、
    サンプルの量子化後の振幅を前記所定値だけ増加させる確率が増加確率pであり、かつ、当該サンプルの量子化後の振幅を前記所定値だけ減少させる確率が減少確率qであると、当該サンプルの量子化誤差のパワーの期待値が前記第1の値となり、かつ、当該サンプルの量子化誤差の期待値が0となる様に、当該サンプルに対応する増加確率p及び減少確率qは求められ、
    前記所定値は、前記決定手段が決定した量子化ステップの整数倍の値であることを特徴とする請求項2に記載の音声符号化装置。
  5. 前記調整手段は、前記所定期間の前記第1信号のサンプルの増加確率p又は減少確率qが0より小さいか1より大きい場合、当該サンプルについて変更確率sを求め、当該サンプルの量子化後の振幅を求めた変更確率sで前記所定値だけ増加又は減少させることで、当該サンプルの振幅を調整し、
    当該サンプルの量子化後の振幅を前記所定値だけ増加又は減少させる確率が変更確率sであると、当該サンプルの量子化誤差のパワーの期待値が前記第1の値となる様に、当該サンプルに対応する前記変更確率sは求められることを特徴とする請求項4に記載の音声符号化装置。
  6. 前記調整手段は、前記所定期間の前記第1信号の各サンプルに対応する増加確率p及び減少確率qに0より小さいもの、又は、1より大きいものが含まれる場合、前記所定期間の前記第1信号の各サンプルの増加確率p及び減少確率qが0以上、かつ、1以下となるまで前記量子化ステップを小さくすることを特徴とすることを特徴とする請求項4に記載の音声符号化装置。
  7. 前記所定値は、前記決定手段が決定した量子化ステップの値であることを特徴とする請求項3から6のいずれか1項に記載の音声符号化装置。
  8. 前記調整手段は、前記所定期間の前記第1信号のパワーに対する、前記第1信号に対応する周波数帯域における前記所定期間の前記雑音成分信号のパワーの比が閾値より大きいと、前記決定手段が決定した前記第1信号の量子化ステップをより大きい値に変更することを特徴とする請求項2から7のいずれか1項に記載の音声符号化装置。
  9. 前記調整手段は、前記所定期間の前記第1信号のパワーに対する、前記第1信号に対応する周波数帯域における前記所定期間の雑音成分信号のパワーの比が閾値より大きいと、前記決定手段が決定した前記第1信号の量子化ステップをより大きい値に変更し、前記所定期間の量子化後の前記第1信号を、前記第1信号に対応する周波数帯域における前記雑音成分信号のパワーに対応する振幅のサンプル列に置換することを特徴とする請求項2から7のいずれか1項に記載の音声符号化装置。
  10. 前記調整手段は、量子化後の前記第1信号の少なくとも1つのサンプルの調整後の振幅に対応する符号語の長さが、調整前の振幅に対応する符号語より短くなる様に当該サンプルの振幅を調整することを特徴とする請求項1に記載の音声符号化装置。
  11. 前記音声信号を前記周期成分信号と前記雑音成分信号に分離する分離手段を更に備えていることを特徴とする請求項1から10のいずれか1項に記載の音声符号化装置。
  12. 前記周期成分信号及び前記雑音成分信号それぞれを他の装置から受信することを特徴とする請求項1から10のいずれか1項に記載の音声符号化装置。
  13. 音声符号化装置における音声信号の符号化方法であって
    前記音声信号を構成する周期成分信号を複数の周波数帯域に分割して各周波数帯域に対応する複数の第1信号を出力する分割工程と、
    前記複数の第1信号それぞれの量子化ステップを決定する決定工程と、
    前記決定工程で決定した量子化ステップに基づき第1信号の各サンプルを量子化する量子化工程と、
    前記音声信号から前記周期成分信号を除いた雑音成分信号について、前記複数の周波数帯域それぞれでのパワーを判定する判定工程と、
    前記第1信号の量子化誤差によるパワーが、前記第1信号に対応する周波数帯域での前記雑音成分信号のパワーに近づく様に、量子化後の前記第1信号のサンプルの振幅を調整する調整工程と、
    を含むことを特徴とする符号化方法。
  14. 請求項1から12のいずれか1項に記載の音声符号化装置としてコンピュータを機能させることを特徴とするプログラム。
JP2016044737A 2016-03-08 2016-03-08 音声符号化装置、方法及びプログラム Active JP6552986B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016044737A JP6552986B2 (ja) 2016-03-08 2016-03-08 音声符号化装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016044737A JP6552986B2 (ja) 2016-03-08 2016-03-08 音声符号化装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2017161648A JP2017161648A (ja) 2017-09-14
JP6552986B2 true JP6552986B2 (ja) 2019-07-31

Family

ID=59857904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016044737A Active JP6552986B2 (ja) 2016-03-08 2016-03-08 音声符号化装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP6552986B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
JP6079230B2 (ja) * 2012-12-28 2017-02-15 株式会社Jvcケンウッド 付加情報挿入装置、付加情報挿入方法、付加情報挿入プログラム、付加情報抽出装置、付加情報抽出方法、及び付加情報抽出プログラム

Also Published As

Publication number Publication date
JP2017161648A (ja) 2017-09-14

Similar Documents

Publication Publication Date Title
RU2718421C1 (ru) Устройство аудиодекодирования, устройство аудиокодирования, способ аудиодекодирования, способ аудиокодирования, программа аудиодекодирования и программа аудиокодирования
KR101859246B1 (ko) 허프만 부호화를 실행하기 위한 장치 및 방법
US8237594B2 (en) Encoding apparatus, decoding apparatus, information processing system, and computer-readable storage medium
KR20160120713A (ko) 복호 장치, 부호화 장치, 복호 방법, 부호화 방법, 단말 장치, 및 기지국 장치
JP3255022B2 (ja) 適応変換符号化方式および適応変換復号方式
US20030093266A1 (en) Speech coding apparatus, speech decoding apparatus and speech coding/decoding method
JPWO2013108343A1 (ja) 音声復号装置及び音声復号方法
KR101381602B1 (ko) 계층적 부호화 및 복호화 방법 및 장치
JP6552986B2 (ja) 音声符号化装置、方法及びプログラム
JPS63110830A (ja) 帯域分割符号化復号化装置
JP4335245B2 (ja) 量子化装置、逆量子化装置、音声音響符号化装置、音声音響復号装置、量子化方法、および逆量子化方法
JP2016206244A (ja) 符号化装置、符号化方法、及びプログラム
JP5724338B2 (ja) 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP3692959B2 (ja) 電子透かし情報埋め込み装置
JP2004015537A (ja) オーディオ信号符号化装置
JP6856644B2 (ja) ビデオ情報を用いたオーディオエンコーディング
JP2005004119A (ja) 音響信号符号化装置及び音響信号復号化装置
AL-Rawi ADPCM: US Patents from 2010 to 2016
JPS59214346A (ja) サブバンド符号化方法とその符号化復号器
JPS59211340A (ja) 2チヤンネル同時符号化方法とその符号復号器
JP2008268792A (ja) オーディオ信号符号化装置およびそのビットレート変換装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180308

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190125

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190313

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190703

R150 Certificate of patent or registration of utility model

Ref document number: 6552986

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150