JP2008089983A - 符号化装置 - Google Patents

符号化装置 Download PDF

Info

Publication number
JP2008089983A
JP2008089983A JP2006270729A JP2006270729A JP2008089983A JP 2008089983 A JP2008089983 A JP 2008089983A JP 2006270729 A JP2006270729 A JP 2006270729A JP 2006270729 A JP2006270729 A JP 2006270729A JP 2008089983 A JP2008089983 A JP 2008089983A
Authority
JP
Japan
Prior art keywords
frequency
signal
component
rank
residual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006270729A
Other languages
English (en)
Inventor
Takehiko Kuran
武彦 九蘭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2006270729A priority Critical patent/JP2008089983A/ja
Publication of JP2008089983A publication Critical patent/JP2008089983A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 調和関係がなく入力されるオーディオ信号に対しても高品質な符号化が出来、且つ目的符号量の異なる複数の符号化信号を容易に生成できる符号化装置を実現する。
【解決手段】 分割された各区間信号に含まれる周波数及びその周波数成分の抽出を複数の周波数について行う周波数成分抽出手段13と、オーディオ信号から抽出された周波数成分を除去して残差成分を求める残差成分演算手段14と、抽出した周波数、成分値、及び符号量を記述したランクテーブルを作成するテーブル作成手段16と、所望のランクを選択するランク選択手段18と、ランクテーブルを基に選択されたランクの符号化信号を生成する符号化手段17とを備えて実現した。
【選択図】 図1

Description

本発明は、符号化装置に係り、特に調和関係にないオーディオ信号を任意の符号量で高能率に符号化する符号化装置に関する。
最近になり、符号化効率の高い圧縮符号化方式で符号化してディジタル記録メディアに記録する、インターネットなどの通信路を介してディジタルAV情報を伝送する、さらにはアナログ放送で用いられていた放送チャンネルによりさらに高画質、高音質の情報をマルチチャンネルで放送されるようになってきた。ディジタルオーディオ信号は、さらに高能率で符号化されるとさらに高音質、多チャンネルの記録や伝送が出来ることは望ましい。
従来の、オーディオ信号における符号化方式は時間周波数変換方式を基本とし、周波数領域での信号の偏りや人間の聴覚心理を利用した符号化方式が用いられていた。その時間周波数変換方式による符号化方式で用いられる高速フーリエ変換(FFT)や変形離散コサイン変換(MDCT)等の周波数分析方法は、周期的で調和的な信号を分析する理論であり、信号を観測した観測区間の外では観測区間内の信号が周期的に繰り返すことを仮定している。それらの周波数分析方法では、観測区間によって実際とは異なった多数の周波数成分が抽出されることから、周波数領域信号には既に誤差が含まれたり、符号化効率が低下したりする。周波数分解能が観測区間の長さに反比例することから、過渡的な信号の分析を行う場合でも、観測区間長を余り短くすることができず、周波数分解能が不足し符号化効率が低下したり、観測区間外の波形予測が困難であることから、予測残差の符号化による符号化効率の向上が困難である等の欠点があり、それらを解決できることは好ましい。
一方、調和的でない信号に拡張したフーリエ解析の理論も知られている。この理論は一般調和解析(Generalized Harmonic Analysis: GHA)と呼ばれ、観測区間内で原波形から残差エネルギーが最小となる最も優勢な正弦波を抽出し、残差成分にも同様の処理を繰り返す解析方法である。このため、定常的でない僅かな周波数変動に対しても正確な周波数成分の抽出が可能であり、観測区間長と周波数の分解能は互いに独立して自由な設定が可能で、観測区間を越えて信号の予測が可能であるなどの特徴がある。
特許文献1には、時系列信号から任意の周波数成分の信号を抽出する際に、周波数変調や振幅変調を考慮して、高精度且つ少ない本数での抽出を可能とする様にした信号処理装置が開示されている。信号処理装置でなされる符号化側は、N個のサンプルの時系列信号に対して、周波数分析を行う周波数分析回路と、周波数分析回路の出力である周波数について、その近傍周波数の時間変動及び/又は振幅の時間変動を分析する変調パラメータ解析回路と、変調パラメータ解析回路の出力である周波数変調パラメータ及び/又は振幅変調パラメータに基づいて、残差の総エネルギを最小とする変調信号を抽出し、最終的な残差と変調信号の情報とを出力する変調信号抽出回路とを備えるようにした信号処理装置が開示されている。
特開2002−328697号公報
しかしながら、特許文献1に開示されている信号処理装置では、GHAによりFFTやMDCT(Modified Discrete Cosine Transform)などの調和解析よりも精度の高い周波数分析が可能であるため、周波数分析手段としてGHAを用いているものの、開示されているGHAはFFTなどを用いる場合に比べて、抽出した周波数成分の精度が高く、抽出した周波数成分を符号化するために必要な符号量が、入力信号によってはFFTなどを用いる場合に比べて増大する。GHAの演算時間はFFTなどを用いる場合に比し長い時間が必要である。GHAを用い、高能率な符号化を短い時間で行う信号処理装置を実現することはできなかった。
そこで、本発明は、上記のような問題点を解消するためになされたもので、調和関係がなく入力されるオーディオ信号に対しても高品質な符号化が出来、且つ目的符号量の異なる複数の符号化信号を容易に生成することのできる符号化装置を提供することを目的とする。
本願発明における第1の発明は、入力されるオーディオ信号を所定の区間ごとに分割し、分割して得られた区間信号に含まれる周波数及び当該周波数の成分を一般調和解析により抽出して所定符号量の符号化信号を生成する符号化装置において、前記区間信号に含まれる周波数及び当該周波数の成分を前記一般調和解析によりレベルの大きな周波数成分から順に抽出する周波数成分抽出手段と、前記周波数成分抽出手段により1回目に抽出された周波数成分を前記区間信号から減算して残差信号を得ると共に、2回目以降に抽出された周波数成分を前回得られた残差信号から減算して新たな残差信号を得て、前記区間信号のレベルに対する前記残差信号のレベルの比率である残差レベル率を前記残差信号毎に求める演算手段と、予めランク分けされた複数ある残差レベル率ランクのうちから前記演算手段で求められた残差レベル率が含まれるランクを選択し、当該残差レベル率を与える前記周波数成分抽出手段で抽出した周波数値及び当該周波数の成分値を前記選択された残差レベル率ランクの欄に記述したランクテーブルを前記各区間信号について作成するテーブル作成手段と、前記テーブル作成手段で作成された各区間信号のランクテーブルに記述される周波数値及び当該周波数の成分値を用いて前記符号化信号を生成する際の推定符号量を前記ランク毎に得る符号量推定手段と、前記符号量推定手段でランク毎に得られた推定符号量のうち、前記所定符号量を越えない推定符号量のランクの欄に記述される前記周波数値及び当該周波数の成分値を用いて前記符号化信号を生成する符号化手段と、を備えることを特徴とする符号化装置を提供する。
本発明によれば、区間信号に含まれる周波数及び当該周波数の成分を一般調和解析によりレベルの大きな周波数成分から順に抽出する周波数成分抽出手段と、周波数成分抽出手段により1回目に抽出された周波数成分を区間信号から減算して残差信号を得ると共に、2回目以降に抽出された周波数成分を前回得られた残差信号から減算して新たな残差信号を得て、区間信号のレベルに対する残差信号のレベルの比率である残差レベル率を残差信号毎に求める演算手段と、予めランク分けされた複数ある残差レベル率ランクのうちから演算手段で求められた残差レベル率が含まれるランクを選択し、当該残差レベル率を与える周波数成分抽出手段で抽出した周波数値及び当該周波数の成分値を選択された残差レベル率ランクの欄に記述したランクテーブルを各区間信号について作成するテーブル作成手段と、テーブル作成手段で作成された各区間信号のランクテーブルに記述される周波数値及び当該周波数の成分値を用いて符号化信号を生成する際の推定符号量をランク毎に得る符号量推定手段と、符号量推定手段でランク毎に得られた推定符号量のうち、所定符号量を越えない推定符号量のランクの欄に記述される周波数値及び当該周波数の成分値を用いて符号化信号を生成する符号化手段とを備えるので、調和関係がなく入力されるオーディオ信号に対しても高品質な符号化が出来、且つ目的符号量の異なる複数の符号化信号を容易に生成することのできる符号化装置を実現できる。
以下に本発明の実施例に係る符号化装置について図1〜図7を用いて説明する。
図1は、本発明の実施に係る符号化装置の構成例を示したブロック図である。図2は、本発明の実施に係る符号化装置の入力信号と残差信号とを例示した図である。図3は、本発明の実施に係る符号化装置の要部の信号波形を例示した図である。図4は、本発明の実施に係る符号化装置の要部の信号波形を拡大して例示した図である。図5は、本発明の実施に係る符号化装置の要部のランクテーブル例を例示した図である。図6は、本発明の実施に係る符号化装置の動作例をフローチャートで示した図である。図7は、本発明の実施に係る符号化装置の要部の動作例をフローチャートで示した図である。
その符号化装置は調和関係がなく入力されるオーディオ信号に対しても高品質な符号化が出来、且つ目的符号量の異なる複数の符号化信号を容易に生成することのできる符号化装置を実現するという目的を、区間信号に含まれる周波数及び当該周波数の成分を一般調和解析によりレベルの大きな周波数成分から順に抽出する周波数成分抽出手段と、周波数成分抽出手段により1回目に抽出された周波数成分を区間信号から減算して残差信号を得ると共に、2回目以降に抽出された周波数成分を前回得られた残差信号から減算して新たな残差信号を得て、区間信号のレベルに対する残差信号のレベルの比率である残差レベル率を残差信号毎に求める演算手段と、予めランク分けされた複数ある残差レベル率ランクのうちから演算手段で求められた残差レベル率が含まれるランクを選択し、当該残差レベル率を与える周波数成分抽出手段で抽出した周波数値及び当該周波数の成分値を選択された残差レベル率ランクの欄に記述したランクテーブルを各区間信号について作成するテーブル作成手段と、テーブル作成手段で作成された各区間信号のランクテーブルに記述される周波数値及び当該周波数の成分値を用いて符号化信号を生成する際の推定符号量をランク毎に得る符号量推定手段と、符号量推定手段でランク毎に得られた推定符号量のうち、所定符号量を越えない推定符号量のランクの欄に記述される周波数値及び当該周波数の成分値を用いて符号化信号を生成する符号化手段とを備えるようにして実現した。
符号化装置の構成について述べる。
図1に示す符号化装置1は、フレーム化部11、抽出周波数設定部12、周波数成分抽出部13、残差成分量演算部14、符号量推定部15、テーブル作成部16、可変長符号化部17、ランク選択部18、及び制御部19より構成される。
符号化装置の動作について述べる。
まず、符号化装置1のフレーム化部11は、例えば標本化周波数44.1kHzで標本化されて入力される符号化対象のディジタルオーディオ信号を、順次、例えば1024サンプル毎に分割した分割信号として生成する。抽出周波数設定部12は、分割信号の一般調和解析による抽出周波数の精度を、例えば5Hzとした抽出周波数の設定を行う。即ち、5Hz〜20kHzの周波数範囲について5Hzの周波数精度で周波数成分抽出を行う場合は、4000個(20,000/5=4,000)の周波数が候補周波数として設定される。周波数成分抽出部13はフレーム化部11で得られた分割信号から抽出周波数設定部12で設定される周波数成分を順次除去すると共に除去して得られる残差信号成分を算出し、記憶する。抽出周波数設定部12で設定された全ての周波数に対する残差信号成分を求めた後、最も小さな残差信号成分を与える周波数を特定する。残差成分量演算部14は、分割信号から特定された周波数成分、即ち第1の周波数成分を除去し、第1の残差信号を得る。
抽出周波数設定部12及び周波数成分抽出部13は、第1の残差信号に対し、同様な処理を行い、除去すべき第2の周波数成分を特定する。残差成分量演算部14は、第1の残差信号から第2の周波数成分を除去し、第2の残差信号を得る。同様にして抽出周波数設定部12及び周波数成分抽出部13によりN(Nは3以上の整数)回周波数成分の特定を行った後に、残差成分量演算部14により第Nの残差信号が得られる。制御部19は分割信号の信号レベルと残差信号の信号レベルとを監視しつつ、残差信号の信号レベルが分割信号の信号レベルに比し、例えば−60dBになる迄周波数成分の抽出動作を繰り返させる。
符号量推定部15は周波数成分抽出部13により抽出された周波数の値とその周波数の成分値を用いて符号化信号を生成する場合の符号量を推定する。
テーブル作成部16は、分割信号の信号レベルに対する残差信号の信号レベルが、例えば−20、−30、−40、−50、及び−60dBのレベル以下となる毎に抽出周波数とその成分値の値を記述した成分値テーブルを生成する。例えば、レベル比が−20dB未満−30dB以上とされる欄には、分割信号の信号レベルに対する残差信号の信号レベル比がが−20dB未満−30dB以上となる全ての周波数及びそれらの成分値、並びに符号化時の符号量が記述される。そこに記述される符号量は、残差信号の信号レベルが0〜−20dBの欄に記述される周波数及びその成分、並びに−20〜−30dBの欄に記述される周波数及びその成分を示すために必要な符号量である。
以下、フレーム化部11から得られる次の分割信号について同様な周波数成分抽出を行う。入力信号の全区間について同様な動作を行う。
全区間に対する周波数成分の抽出後、テーブル作成部16は生成された成分値テーブルを基に表示用テーブルの作成を行う。表示用テーブルは分割信号信号に対する残差信号のレベル比に係るランクと、そのランクの符号化信号の符号量に係るテーブルである。そのランクは例えばレベル比−20dB以上を第1ランク、−30dB以上を第2ランク、同様に−60dB以上を第5ランクとする。符号量は、各分割信号毎に符号量推定部15で得られた推定符号量を積算した全推定符号量である。生成された表示用テーブルは符号化装置1の図示しない表示部に表示される。使用者はランクと全推定符号量との関係から所望のランクを図示しない操作部を操作して選択する。可変長符号化部17は、所望のランクの符号化を行うために必要な周波数値、及びその周波数の成分値を示す符号化信号を所定の可変長符号化テーブルを用いて符号化し、生成する。生成された符号化信号は符号化装置1から出力される。
ここで、表示された全推定符号量と、可変長符号化部17で生成されて出力される実際に符号化して得られる符号化信号の符号量との間には誤差が含まれる場合がある。例えば第4ランクを指定して生成した符号化信号の符号量が全推定符号量より大きく、所定容量の記録媒体に記録できない場合などはランク3を指定して符号化信号出力を得る。第1ランク〜第5ランクの符号化信号を得るための成分値テーブルは、既にテーブル作成部16で作成され、記憶されているため周波数抽出の動作を再度行うことなく新たなランクの符号化信号を短時間で生成することが出来る。
予め入力信号の周波数成分抽出を行い、成分値テーブルを作成しておく場合では、入力信号の周波数成分抽出を行うことなく、短時間で任意のランクの符号化出力を生成して出力することが出来るため、符号化を実行した後に符号量を微調整した符号化信号を容易に生成することが出来る。
次に、詳細に説明する。
図2を参照して入力信号と、その信号から最優勢周波数成分を抽出した後の残差信号について述べる。
同図(A)信号のエンベロープ波形は、横軸はサンプル数を単位とする時間であり、縦軸は16ビットで量子化した際の量子化値である。オーディオ信号は演奏楽器がドラム、パーカッション、エレキベース、エレキギターであるフュージョンの演奏開始から3秒程度の信号部分である。時間軸は44.1kHzで標本化される標本値の個数で示してあり、44.1kに相当する箇所が経過時間1秒間の箇所である。量子化値は16ビットで量子化した場合の量子化値であり、−32k〜+32kの間にオーディオ信号が存在していることになる。
同図(B)はその入力信号を、1フレームを1024サンプルでフレーム化して分割信号を生成し、各分割信号から100本づつの最優勢周波数成分を抽出して得られた残差成分の振幅値を示したものである。(B)の縦軸の目盛りは(A)の1/10としてある。即ち、同じ振幅の信号は残差成分が入力信号の1/10(−20dB)であることを示している。残差レベルが−20dBより大きい部分及び小さい部分が存在している。残差レベルを−20dBとして周波数及びその周波数成分を抽出するためには、最優勢周波数成分を抽出する毎に入力信号レベルと残差信号レベルとを比較し、1/10のレベルになるまで周波数の抽出を行う。同様にして、残差成分が入力信号の1/1000(−60dB)となるようにした周波数の抽出を行うこともできる。
図3、図4を参照して、最優勢周波数成分の抽出と残差信号レベル(S/N)の変化について述べる。
図3において、横軸はサンプル数を単位とした時間であり、縦軸は区間信号から抽出した周波数成分を減算した残差信号を区間信号(S)に対する残差信号(N)の比率として示したものである。図2(B)に示した残差は残差レベルの大きい箇所は大きな振幅で示されているのに比し、図3は区間信号に比して残差レベルの大きな部分は小さなS/N比しか得られない箇所であり、小さな振幅で示される。(大小関係が逆である。)
ここで、図3に示す特性は区間信号毎に最優勢周波数成分を抽出しながらその時点ごとのS/Nを求めて表示したものである。従って、特性は1フレームを構成する1024サンプル毎にS/Nが増加しリセットされる鋸歯状波状の特性をしている。
図4は図3の特性の最初の部分の時間軸を拡大して示したものである。
同図において(0)の点は第2番目のフレーム区間の最終サンプル時の第1024サンプル時点で100本の最優勢抽出周波数成分により得られたS/N値(17.5dB)の点である。(1)は第3番目のフレーム区間時の1本目の最優勢抽出周波数成分により得られたS/N値(2dB)の点である。(2)は25本目の最優勢抽出周波数成分により得られたS/N値(8dB)の点である。点(0)と点(1)を結んだ棒線の右側に隣接する棒線は26〜50本目の最優勢抽出周波数成分により得られたS/N値(8〜10dB)の棒線である。その右側の棒線は51〜74本目の最優勢抽出周波数成分により得られたS/N値(10〜12dB)の棒線である。次の棒線は75〜99本目の最優勢抽出周波数成分により得られたS/N値(12〜14dB)の棒線であり、点(3)は第3番目のフレーム区間の最終サンプル時(第1024サンプル時)で100本目の最優勢抽出周波数成分により得られたS/N値(14dB)の点である。
以上は、100本の最優勢抽出周波数成分を抽出した場合に得られるS/N値であり、そのS/N値は、入力信号に純音成分が多いか、又は衝撃性の音響成分が多いかにより異なった値が得られる。
図5を参照してテーブル作成部16で作成されるランクテーブルについて述べる。
ランクテーブルは左側からランク、残差レベル率、表の記述内容、区間信号の順、及び推定符号量が記述される。上側からはランク1〜ランク6として抽出された周波数とその周波数の成分値が記述される。
まずランクは、1〜6が記述されており、それらのランクレベル率は順に1.000〜0.33、0.33〜0.100、0.100〜0.033、・・・、0.0033〜0.0010とされている。表の記述内容は、表中で上下に示される数字は上側が抽出された周波数(Hz)で、下側が区間信号のレベルを1とする場合に抽出された周波数の成分値(×10-4)であることを示している。
区間信号は、入力される例えば標本化周波数44.1kHzで標本化されたオーディオ信号の例えば1024サンプル毎に分割して得られる区間信号の順を示している。このランクテーブルには、第1区間の区間信号のランク1〜3において抽出された周波数値と成分値のそれぞれ3組が記述されている。
第1区間のランク1において、最も大きな成分であるとして最初に抽出された周波数は1050Hzであり、その成分値は区間信号のレベルを1とする場合に抽出された成分は1220×10-4であることを示している。区間信号から1050Hz成分を除去した残差信号を生成する。その残差信号の区間信号に対する比率である残差レベル率が0.33以上である場合に、次に大きなレベルの周波数と成分を抽出する。その結果、周波数が1575Hzであり、成分値が1085×10-4である周波数成分が抽出される。以降、同様にして残差レベル率が0.33未満となるまで周波数、成分値、及び残差信号レベルを求める。残差レベル率が0.33未満となった場合は、得られた周波数1170Hz及び成分値227(×10-4)をランク2の欄に記述する。ランク2の演算は残差レベル率が0.1未満となるまで続けられる。残差レベル率が0.1未満となった場合は、例えば周波数2410Hz、成分値98.2(×10-4)がランク3の位置に記述される。
以下、同様にして残差レベル率が0.001未満となるまで周波数、及びその周波数の成分値が抽出される。第1区間のランク1〜6における周波数、及び成分値が記述される。
以降、同様にして、第2区間、第3区間、・・・、第N 区間まで周波数成分の抽出が行われる。第N区間は、入力されるオーディオ信号の最後の区間である。
次に、推定符号量の算出が行われる。
符号化信号は、抽出された周波数とその成分値を示す符号の羅列でなされる。抽出される周波数は5Hz置きであるので、210、1220の数字により1050(=210×5)Hzの信号が1220×10-4の成分値であることを示すことが出来る。以下、抽出された周波数と成分値を示す符号化信号を生成する場合における推定符号量を求める。推定符号量は残差レベル率毎に演算して得る。
ランク1での推定符号量は、ランクテーブルのランク1に記述される第1〜第N区間の周波数及び成分値の全てを符号化する際に必要なデータ量として推定される。
ランク2での推定符号量は、ランクテーブルのランク1及びランク2に記述される第1〜第N区間の周波数及び成分値の全てを符号化する際に必要なデータ量として推定される。以下同様にしてランク6での推定符号量は、ランク1〜6の全てに記述される第1〜第N区間の周波数及び成分値を符号化する際に必要なデータ量として推定される。
ここで、推定符号量は第1〜第N区間の周波数及び成分値の全てを求めて後に符号化時の符号量を推定するとして述べたが、推定符号量はそれぞれの区間信号毎に求め、第N区間終了時に求められた区間毎の個別の符号量を積算して求めるようにしても良い。
図6を参照して符号化装置1の動作について述べる。
まず、S(ステップ)61にて、ディジタル化された入力信号に対する計測区間を、例えば1区間を1024サンプルとして設定する。S62で入力信号を各計測区間毎に分割して区間信号を生成する。S70で後記の周波数成分抽出を行う。S81で、抽出された周波数と成分値を符号化する際に必要な符号量を推定する。S82で、区間信号から抽出した周波数成分を除去し、残差成分を求める。S83で残差成分の大きさを基に抽出された周波数と成分値を格納する場所に係るランク分けを行う。S84で、ランクテーブルの該当する箇所に求められた周波数値とその成分値とを記述する。S85で、全計測区間の周波数成分抽出やランク分けが終了したかをチェックし、計測が終了していない場合はS61からの動作を繰り返し、全区間を終了した場合にはS86に進む。
S86では、ランク毎に、各計測区間で抽出された周波数値とその成分値に係り、S82で推定された符号量の総計を求める。S87で、ランクテーブルにランクごとの合計符号量を記述する。S88で、ランクテーブルを図示しない表示部に表示する。S89で、図示しない操作部が操作され、ランクが選択された場合はそのランク情報を取得する。S91でランクの選択がなされたかを検出し、検出されない場合はS89の動作を繰り返す。検出された場合は、S92で選択されたランクの符号化信号を、ランクテーブルに記述される周波数値及びその成分値を用いて符号化信号を生成する。S93生成された符号化信号を出力する。S94で、生成されたと異なるランクの符号化信号を出力するかを検出し、出力するとして検出される場合はS89からの動作を繰り返す。ランクテーブルが記憶されている限り、周波数成分抽出等の動作を行うことなく、選択されるランクでの符号化信号を生成して出力することが出来る。
他のランクでの符号化信号を出力しないとして検出される場合は符号化装置の動作を終了させる。
図7を参照し、図6のS70で示した周波数成分抽出について述べる。
まず、S71で、5Hz置きに設定される5Hz〜20kHzの間の周波数1つを選択する。S72で区間信号(原信号)に対するフーリエ係数を算出する。S73で区間信号から算出された周波数の成分値を減算し、残差成分を求める。選択する周波数が例えば20kHzになるまでS71からの流れを繰り返す。次に、S75で求められた4000の候補周波数に対して抽出された複数の信号成分の中で最も信号レベルの大きい最優勢な抽出成分を選択する。S76で区間信号から最優勢成分を除去(減算)して残差を求め、周波数成分抽出の処理ステップを終了する。
一般調和解析は観測区間内の信号から残差信号が最も小さくなるような周波数の正弦波を1つだけ抽出する。次に、抽出された成分を除いた残差信号に対して同様な処理を繰り返し行い、残差信号がある程度小さくなれば分析を終了する。抽出した正弦波により当該観測区間内の信号x(t)は式1のようにf1、f2、・・・、fnのN本の正弦波の重ね合わせで表される。
Figure 2008089983
但し、Sk、Ckは振幅値、tは時間、fは任意の周波数、Nは整数値である。
ここで、x(t)を構成する正弦波の周波数は倍数関係にあるとは限らなく、従ってそれらの正弦波は調和的とは限っていない。従って、ビットストリームには調和的(基本波の整数倍の周波数)とは限らない周波数成分と、それぞれの周波数成分が有効な観測区間の情報が含まれることになる。符号化出力であるビットストリームを、オーディオ信号を構成する周波数値とその成分のレベル値とを直接記述した符号化信号として構成する場合には、ビットストリームを復号化して得られる周波数値の信号をその成分のレベル値に従った振幅の信号として発生させることにより、入力信号の復号が可能である。
符号化装置1により生成される符号化信号は、入力信号の定常性によらない効率的な周波数成分抽出を行うことができることに加え、聴覚レベル以下の信号は符号化しないようにしている。ビットストリームを構成する周波数成分が削減されることによって、符号化効率が大幅に向上する効果も有している。
以上のように、本実施例で示した符号化装置1によれば、区間信号に含まれる周波数及び当該周波数の成分を一般調和解析によりレベルの大きな周波数成分から順に抽出する周波数成分抽出手段13と、周波数成分抽出手段により1回目に抽出された周波数成分を区間信号から減算して残差信号を得ると共に、2回目以降に抽出された周波数成分を前回得られた残差信号から減算して新たな残差信号を得て、区間信号のレベルに対する残差信号のレベルの比率である残差レベル率を残差信号毎に求める演算手段14と、予めランク分けされた複数ある残差レベル率ランクのうちから演算手段で求められた残差レベル率が含まれるランクを選択し、当該残差レベル率を与える周波数成分抽出手段で抽出した周波数値及び当該周波数の成分値を選択された残差レベル率ランクの欄に記述したランクテーブルを各区間信号について作成するテーブル作成手段16と、テーブル作成手段で作成された各区間信号のランクテーブルに記述される周波数値及び当該周波数の成分値を用いて符号化信号を生成する際の推定符号量をランク毎に得る符号量推定手段15と、符号量推定手段でランク毎に得られた推定符号量のうち、所定符号量を越えない推定符号量のランクの欄に記述される周波数値及び当該周波数の成分値を用いて符号化信号を生成する符号化手段17とを備えるので、調和関係がなく入力されるオーディオ信号に対しても高品質な符号化が出来、且つ目的符号量の異なる複数の符号化信号を容易に生成することのできる符号化装置を実現できる。
本発明の実施に係る符号化装置の構成例を示したブロック図である。 本発明の実施に係る符号化装置の入力信号と残差信号とを例示した図である。 本発明の実施に係る符号化装置の要部の信号波形を例示した図である。 本発明の実施に係る符号化装置の要部の信号波形を拡大して例示した図である。 本発明の実施に係る符号化装置の要部のランクテーブルを例示した図である。 本発明の実施に係る符号化装置の動作例をフローチャートで示した図である。 本発明の実施に係る符号化装置の要部の動作例をフローチャートで示した図である。
符号の説明
1 符号化装置
11 フレーム化部
12 抽出周波数設定部
13 周波数成分抽出部
14 残差成分量演算部
15 符号量推定部
16 テーブル作成部
17 可変長符号化部
18 ランク選択部
19 制御部

Claims (1)

  1. 入力されるオーディオ信号を所定の区間ごとに分割し、分割して得られた区間信号に含まれる周波数及び当該周波数の成分を一般調和解析により抽出して所定符号量の符号化信号を生成する符号化装置において、
    前記区間信号に含まれる周波数及び当該周波数の成分を前記一般調和解析によりレベルの大きな周波数成分から順に抽出する周波数成分抽出手段と、
    前記周波数成分抽出手段により1回目に抽出された周波数成分を前記区間信号から減算して残差信号を得ると共に、2回目以降に抽出された周波数成分を前回得られた残差信号から減算して新たな残差信号を得て、前記区間信号のレベルに対する前記残差信号のレベルの比率である残差レベル率を前記残差信号毎に求める演算手段と、
    予めランク分けされた複数ある残差レベル率ランクのうちから前記演算手段で求められた残差レベル率が含まれるランクを選択し、当該残差レベル率を与える前記周波数成分抽出手段で抽出した周波数値及び当該周波数の成分値を前記選択された残差レベル率ランクの欄に記述したランクテーブルを前記各区間信号について作成するテーブル作成手段と、
    前記テーブル作成手段で作成された各区間信号のランクテーブルに記述される周波数値及び当該周波数の成分値を用いて前記符号化信号を生成する際の推定符号量を前記ランク毎に得る符号量推定手段と、
    前記符号量推定手段でランク毎に得られた推定符号量のうち、前記所定符号量を越えない推定符号量のランクの欄に記述される前記周波数値及び当該周波数の成分値を用いて前記符号化信号を生成する符号化手段と、
    を備えることを特徴とする符号化装置。
JP2006270729A 2006-10-02 2006-10-02 符号化装置 Pending JP2008089983A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006270729A JP2008089983A (ja) 2006-10-02 2006-10-02 符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006270729A JP2008089983A (ja) 2006-10-02 2006-10-02 符号化装置

Publications (1)

Publication Number Publication Date
JP2008089983A true JP2008089983A (ja) 2008-04-17

Family

ID=39374195

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006270729A Pending JP2008089983A (ja) 2006-10-02 2006-10-02 符号化装置

Country Status (1)

Country Link
JP (1) JP2008089983A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011133568A (ja) * 2009-12-22 2011-07-07 Victor Co Of Japan Ltd 音声処理装置、音声処理方法および音声処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011133568A (ja) * 2009-12-22 2011-07-07 Victor Co Of Japan Ltd 音声処理装置、音声処理方法および音声処理プログラム

Similar Documents

Publication Publication Date Title
RU2487426C2 (ru) Устройство и способ преобразования звукового сигнала в параметрическое представление, устройство и способ модификации параметрического представления, устройство и способ синтеза параметрического представления звукового сигнала
JP5543640B2 (ja) 複雑さがスケーラブルな知覚的テンポ推定
RU2439720C1 (ru) Способ и устройство для обработки звукового сигнала
US11972768B2 (en) Linear prediction analysis device, method, program, and storage medium
JP6450802B2 (ja) 音声符号化装置および方法
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
JP4769673B2 (ja) オーディオ信号補間方法及びオーディオ信号補間装置
KR20070085788A (ko) 신호 속성들을 사용한 효율적인 오디오 코딩
JP2008089983A (ja) 符号化装置
US10515656B2 (en) Pitch extraction device and pitch extraction method by encoding a bitstream organized into equal sections according to bit values
US20050177257A1 (en) Digital signal processing method, learning method, apparatuses thereof and program storage medium
JP2006505818A (ja) オーディオ成分を生成する方法および装置
US20160035365A1 (en) Sound encoding device, sound encoding method, sound decoding device and sound decoding method
JP4645869B2 (ja) ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
WO2004088634A1 (ja) 音声信号圧縮装置、音声信号圧縮方法及びプログラム
JP2008040452A (ja) 符号化装置及び復号化装置
JP2006211243A (ja) ディジタル信号符号化装置,ディジタル信号符号化方法
JP2004069906A (ja) オーディオ符号化装置
JP6515945B2 (ja) コード抽出装置、および方法
JP2000268509A (ja) 符号化装置
JP2002076904A (ja) 符号化されたオーディオ信号の復号化方法、及び符号化されたオーディオ信号の復号化装置
JP2002111503A (ja) 復号化装置
JP2000268510A (ja) 符号化装置
JP4816107B2 (ja) 音声符号化装置及び音声符号化方法
JP2000357969A (ja) オーディオ信号の符号化装置