JP2008015357A - 符号化装置 - Google Patents

符号化装置 Download PDF

Info

Publication number
JP2008015357A
JP2008015357A JP2006188358A JP2006188358A JP2008015357A JP 2008015357 A JP2008015357 A JP 2008015357A JP 2006188358 A JP2006188358 A JP 2006188358A JP 2006188358 A JP2006188358 A JP 2006188358A JP 2008015357 A JP2008015357 A JP 2008015357A
Authority
JP
Japan
Prior art keywords
gain
information
correlation
signal
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006188358A
Other languages
English (en)
Inventor
Kimio Miseki
公生 三関
Hirokazu Takeuchi
広和 竹内
Shiyouko Osada
将高 長田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006188358A priority Critical patent/JP2008015357A/ja
Publication of JP2008015357A publication Critical patent/JP2008015357A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】低ビットレートに符号化されたバンドの再生音の音質劣化を抑制することが可能な符号化装置を提供する。
【解決手段】形状量子化部31は、目標信号xの各バンドの信号をそれぞれ形状量子化する。ゲイン量子化部32は、形状量子化部31で求めたバンド毎の形状ベクトルの情報と、バンド毎の目標信号xに基づいて、バンド毎のゲインの量子化を行う。ゲイン補正部33aは、目標信号xと再生信号yとの相関φxyがα<φxy<βを満たさない場合は、ゲイン情報の補正は行わず、一方、相関φxyがα<φxy<βを満たす場合には、すなわち目標信号xと再生信号yの両ベクトルがなす角θが所定の範囲にある場合に、量子化されたゲイン情報についての補正を行うようにしたものである。
【選択図】 図1

Description

この発明は、例えば音声信号やオーディオ信号を符号化する符号化装置に関する。
周知のように、従来より音声信号やオーディオ信号の符号化装置では、入力信号を周波数領域の信号に変換して符号化を行う技術が広く用いられている。周波数領域に変換された入力信号は、バンド毎に、形状情報とゲイン情報を用いて符号化される。符号化の際には、マスキング効果を利用し、バンド毎に周波数領域での符号化歪みがマスキングレベルを超えないように符号化する。
マスキング効果によれば、マスキングレベルの大きなバンドは、符号化歪みが比較的大きくても人間には音として歪が知覚されにくいため、その分だけ少数のビットで符号化することができる。その結果、入力信号の符号化に必要な、フレームあたりのトータルのビット数を低減することができる。このため、マスキング効果を利用した符号化は低ビットレート化や符号化効率を上げるために有効な手段となっている。
一方、マスキング効果を利用した符号化や、低ビットレート化に伴って、符号化による歪みが大きいバンドが多くなることが原因で、符号化歪みが大きいバンドでの再生信号の音量が小さくなりやすくなる傾向があり、再生音の音質が劣化するという問題があった。
この問題に対して従来は、目標ベクトルと、理想量子化ベクトルとの大きさや方向に基づいて、予め目標ベクトルを伸長して、伸長された目標ベクトルと理想量子化ベクトルとの間の距離が最小となるようなゲインを探索し、これをゲイン符号化の符号化結果とするものがある(例えば、特許文献1参照)。
また、従来は、原音声信号と符号化信号との間の波形歪みおよびエネルギー歪みを求め、これら両方の歪みを重み付け加算した歪み尺度を用いて、複数の符号化パラメータから最良のものを探索するものがある(例えば、非特許文献1参照)。しかしながら、この手法では、上記の歪み尺度での歪み量を求めて、それが最小となるように、複数の符号化パラメータを探索する必要があるため、演算量が多いという問題があった。
特開2001−044846公報。 ICASSP "AN 8 KBIT/S ACELP CODER WITH IMPROVED BACKGROUND NOISE PERFORMANCE" page25-28 vol.1 15-19 March 1999。
従来の符号化装置では、低ビットレートに符号化されたバンド内の音量が小さくなって、再生音の音質が劣化するという問題があった。
この発明は上記の問題を解決すべくなされたもので、低ビットレートに符号化されたバンドの再生音の音質劣化を抑制することが可能な符号化装置を提供することを目的とする。
上記の目的を達成するために、この発明は、目標信号の形状を量子化して形状情報を出力する第1量子化手段と、目標信号のゲインを量子化してゲイン情報を出力する第2量子化手段と、形状情報に基づいて再生信号を生成する再生信号生成手段と、目標信号と再生信号の相関を求める相関検出手段と、相関を基にゲイン情報を補正する補正手段と、形状情報と、補正手段が補正したゲイン情報とに基づいて、符号化データを生成する符号化データ生成手段とを具備して構成するようにした。
以上述べたように、この発明では、目標信号と、目標信号に基づいて量子化した形状情報に基づく再生信号との相関に基づいて、目標信号のゲインを量子化したゲイン情報を補正するようにしている。
したがって、この発明によれば、相関が例えば所定の範囲にあるなどして、低ビットレート化に伴う音質劣化の虞のある場合に、低ビットレートに符号化されたバンドの再生音の音質劣化を抑制することが可能な符号化装置を提供できる。
以下、図面を参照して、この発明の一実施形態について説明する。
図1は、この発明の第1の実施形態に係わる符号化装置の構成を示すものである。この符号化装置は、バンド分割部10と、マスキングレベル計算部20と、歪み制御部30aと、フォーマッタ40とを備える。
音声信号またはオーディオ信号が入力信号として、バンド分割部10およびマスキングレベル計算部20に入力される。バンド分割部10は、例えばMDCT(Modified Discrete Cosine Transform)変換などによって、入力信号を周波数領域に変換し、バンド毎に分割された目標信号xを得る。この目標信号xは、歪み制御部30aに出力される。
マスキングレベル計算部20は、入力信号に基づいて、人の耳に聞こえない程度の歪みレベル、すなわち歪み量の許容値に相当するマスキングレベルを求める。このマスキングレベルは、歪み制御部30aに出力される。
歪み制御部30aは、形状量子化部31と、ゲイン量子化部32と、ゲイン補正部33aとを備える。歪み制御部30aは、符号化ビットレートやレート制御により設定される所定の符号量の範囲となる条件の下で、各バンド毎の目標信号xを形状量子化部31とゲイン量子化部32を用いて量子化したときの符号化歪みが、マスキングレベル計算部20からのマスキングレベルよりも小さくなるように、形状量子化部31で形状情報を量子化し、ゲイン量子化部32でゲイン情報を量子化する。
この際に、各バンド毎の目標信号xについて、形状情報とゲイン情報の両方の量子化の結果を組み合わせたときの歪みがマスキングレベルよりも小さくなるように形状情報とゲイン情報が選択される構成であれば、形状量子化部31による形状量子化とゲイン量子化部32によるゲイン量子化はどちらを先に行ってもよい。以降の実施例では、形状量子化を行った結果を用いてゲイン量子化を行う方法の一例について説明する。
形状量子化部31は、目標信号xの各バンドの信号の形状をスカラ量子化またはベクトル量子化により量子化するものである。ここでは、ベクトル量子化を用いる方法の例について説明する。形状量子化部31は、量子化された形状を表す、複数の形状ベクトルを記憶している。そして目標信号xの形状をバンド毎にそれぞれ量子化し、バンド毎の形状ベクトルの情報を、ゲイン補正部33aとフォーマッタ40に出力する。
ゲイン量子化部32は、形状量子化部31で求めたバンド毎の形状ベクトルの情報と、バンド毎の目標信号xに基づいて、バンド毎のゲインの量子化を行い、そのゲイン情報とをゲイン補正部33aに出力する。
ゲイン補正部33aは、上記形状情報、上記ゲイン情報および目標信号xに基づいて、ゲイン情報の大きさを補正するものであって、例えば図2に示すように、再生信号算出部331と、相関計算部332と、ゲイン符号補正部333aとを備える。
再生信号算出部331は、上記形状情報および上記ゲイン情報に基づいて、これらの情報から再生される信号である再生信号yを生成し、相関計算部332に出力する。相関計算部332は、目標信号xと再生信号yとの相関φxy(例えばφxy=cosθ=(xy)/(|x||y|)、θは目標信号xと再生信号yの両ベクトルがなす角に相当する)を求め、これをゲイン符号補正部333aに出力する。相関φxyとしては、これに限られるものではなく、xとyの内積なども有効である。
ゲイン符号補正部333aは、相関φxyが予め設定した範囲の値の場合に、ゲイン情報を増大させる補正を行う。具体的な方法の一例としては、相関φxyと予め設定した閾値α、β(>α)との間に、α<φxy<βの関係が成立する場合に、ゲインの大きさが増大する方向にゲイン情報を予め設定した方法で増大させる補正を行い、これを出力する。一方、α<φxy<βの関係が成立しない場合には、補正を行わないゲイン情報を出力する。
フォーマッタ40は、形状情報と、ゲイン符号補正部333aから出力されるゲイン情報に基づいて、所定のフォーマットの符号化データを生成する。
以上のように、上記構成の符号化装置では、目標信号xと再生信号yとの相関φxyが、α<φxy<βを満たさない場合、すなわち図3(a)に示すように、目標信号xと再生信号yの両ベクトルのなす角θが小さかったり、極端に大きい場合には、ゲイン情報の補正は行わないようにする。
一方、相関φxyが、α<φxy<βを満たす場合、すなわち図3(b)に示すように、目標信号xと再生信号yの両ベクトルがなす角θが所定の範囲にある場合に、ゲイン情報の補正を行うことで、目標信号xと同程度の音量レベルになるような再生信号Yが得られるようになる。
したがって、上記構成の符号化装置によれば、相関φxyが所定の範囲にあって、低ビットレート化に伴う音質劣化の虞のある場合に、量子化ベクトルのゲイン補正が行われるので、低ビットレートに符号化されたバンドの再生音の音質劣化を抑制することができる。
次に、この発明の第2の実施形態について説明する。図4は、この発明の第2の実施形態に係わる符号化装置の構成を示すものである。この符号化装置は、バンド分割部10と、マスキングレベル計算部20と、歪み制御部30bと、フォーマッタ40とを備える。図1に示した符号化装置とは、歪み制御部30aの代わりに、歪み制御部30bを設けている点で異なっている。したがって、以下の説明では、歪み制御部30bを中心に説明する。
歪み制御部30bは、形状量子化部31と、ゲイン量子化部32と、ゲイン補正部33bと、Tonality情報取得部34とを備える。
形状量子化部31は、目標信号xの各バンドの信号の形状をスカラ量子化またはベクトル量子化により量子化するものである。ここでは、ベクトル量子化を用いる方法の例について説明する。形状量子化部31は、量子化された形状を表す、複数の形状ベクトルを記憶している。そして目標信号xの形状をバンド毎にそれぞれ量子化し、バンド毎の形状ベクトルの情報を、ゲイン補正部33bとフォーマッタ40に出力する。
ゲイン量子化部32は、形状量子化部31で求めたバンド毎の形状ベクトルの情報と、バンド毎の目標信号xに基づいて、バンド毎のゲインの量子化を行い、そのゲイン情報とをゲイン補正部33bに出力する。
Tonality情報取得部34は、目標信号xの各バンドの信号について、トーン性を検出し、この検出結果をトーン性情報として、ゲイン補正部33bに出力する。
ゲイン補正部33bは、上記形状情報、上記ゲイン情報、上記トーン性情報および目標信号xに基づいて、ゲイン情報の大きさを補正するものであって、例えば図5に示すように、再生信号算出部331と、相関計算部332と、ゲイン符号補正部333bとを備える。
再生信号算出部331は、上記形状情報および上記ゲイン情報に基づいて、これらの情報から再生される信号である再生信号yを生成し、相関計算部332に出力する。相関計算部332は、目標信号xと再生信号yとの相関φxy(例えばφxy=cosθ=(xy)/(|x||y|)、θは目標信号xと再生信号yの両ベクトルがなす角に相当する)を求め、これをゲイン符号補正部333bに出力する。相関φxyとしては、これに限られるものではなく、xとyの内積なども有効である。
ゲイン符号補正部333bは、トーン性情報と相関φxyが予め設定した範囲の値の場合に、ゲイン情報を増大させる補正を行う。具体的な方法の一例としては、相関φxyと予め設定した閾値α、β(>α)との間に、α<φxy<βの関係が成立し、かつトーン性情報が予め設定した閾値th以下のトーン性を示す場合(雑音的な信号の場合)に、ゲインの大きさが増大する方向にゲイン情報を予め設定した方法で増大させる補正を行い、これを出力する。
一方、α<φxy<βの関係が成立しない場合、またはトーン性情報が予め設定した閾値thよりも大きいトーン性を示す場合には、補正を行わないゲイン情報を出力する。閾値thは、雑音的な信号はバンド内でのスペクトル形状の差異が知覚されにくいことを考慮して、設定される値である。
フォーマッタ40は、形状情報と、ゲイン符号補正部333bから出力されるゲイン情報に基づいて、所定のフォーマットの符号化データを生成する。
以上のように、上記構成の符号化装置では、目標信号xと再生信号yとの相関φxyが、α<φxy<βを満たす場合、すなわち図6(a)に示すように、目標信号xと再生信号yの両ベクトルがなす角θが所定の範囲にある場合で、かつトーン性が低い場合に、ゲイン情報の補正を行うことで、目標信号xと同程度の音量レベルになるような再生信号Yが得られるようになる。
一方、相関φxyが、α<φxy<βを満たさない場合、すなわち図6(b)に示すように、目標信号xと再生信号yの両ベクトルがなす角θが小さかったり、極端に大きい場合や、トーン性が高い場合には、ゲイン情報の補正は行わないようにしている。
したがって、上記構成の符号化装置によれば、相関φxyが所定の範囲にあって、かつトーン性が低い場合に、低ビットレート化に伴う音質劣化の虞のあるため、量子化ベクトルのゲイン補正を行うので、低ビットレートに符号化されたバンドの再生音の音質劣化を抑制することができる。
なお、この発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また上記実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
その一例として例えば、上記第2の実施形態では、目標信号xと再生信号yとの相関φxyに加えて、目標信号xのバンド毎のトーン性に応じて、ゲイン情報の補正を行うように構成したが、トーン性に代わって分散やスペクトルの平坦度を表すsfm(spectrum flatness measure)、尖度(カートシス)などを求め、これと相関φxyに応じて、ゲイン情報の補正を行うようにしてもよい。
また、トーン性が非常に低い雑音性の強いバンドに対しては、相関φxyを用いないで、目標信号xと同程度の音量レベルになるように、単にゲイン情報の補正を行うようにすることで、音量の劣化を抑制した再生信号Yが得られるようになる効果がある。
また、ゲイン符号補正部333a,333bは、相関φxyと予め設定した閾値α、βとの間に、α<φxy<βの関係が成立する場合に、ゲインの大きさが増大する方向にゲイン情報を予め設定した方法で増大させる補正を行うものとして説明したが、これに代わって例えば、相関φxyの値に応じて、多段階にゲイン情報を増減するようにしてもよい。
その他、この発明の要旨を逸脱しない範囲で種々の変形を施しても同様に実施可能であることはいうまでもない。
この発明に係わる符号化装置の第1の実施の形態の構成を示す回路ブロック図。 図1に示した符号化装置のゲイン補正部の構成を示す回路ブロック図。 図1に示した符号化装置によるゲイン補正の動作を説明するための図。 この発明に係わる符号化装置の第2の実施の形態の構成を示す回路ブロック図。 図4に示した符号化装置のゲイン補正部の構成を示す回路ブロック図。 図4に示した符号化装置によるゲイン補正の動作を説明するための図。
符号の説明
10…バンド分割部、20…マスキングレベル計算部、30a,30b…歪み制御部、31…形状量子化部、32…ゲイン量子化部、33a,33b…ゲイン補正部、34…Tonality情報取得部、40…フォーマッタ、331…再生信号算出部、332…相関計算部、333a,333b…ゲイン符号補正部、x…目標信号、y…再生信号。

Claims (4)

  1. 目標信号の形状を量子化して形状情報を出力する第1量子化手段と、
    前記目標信号のゲインを量子化してゲイン情報を出力する第2量子化手段と、
    前記形状情報に基づいて再生信号を生成する再生信号生成手段と、
    前記目標信号と前記再生信号の相関を求める相関検出手段と、
    前記相関を基に前記ゲイン情報を補正する補正手段と、
    前記形状情報と、前記補正手段が補正したゲイン情報とに基づいて、符号化データを生成する符号化データ生成手段とを具備することを特徴とする符号化装置。
  2. 目標信号の形状を量子化して形状情報を出力する第1量子化手段と、
    前記目標信号のゲインを量子化してゲイン情報を出力する第2量子化手段と、
    前記形状情報と前記ゲイン情報に基づいて再生信号を生成する再生信号生成手段と、
    前記目標信号と前記再生信号の相関を求める相関検出手段と、
    前記相関を基に前記ゲイン情報を補正する補正手段と、
    前記形状情報と、前記補正手段が補正したゲイン情報とに基づいて、符号化データを生成する符号化データ生成手段とを具備することを特徴とする符号化装置。
  3. さらに、目標信号のトーン性を検出するトーン性検出手段を備え、
    前記補正手段は、前記相関と前記トーン性に応じて、前記ゲイン情報を補正することを特徴とする請求項1または請求項2に記載の符号化装置。
  4. 前記補正手段は、前記相関が予め設定した範囲の値の場合に、前記ゲイン情報を補正し、一方、前記範囲外の値の場合は、前記ゲイン情報をそのまま出力することを特徴とする請求項1または請求項2に記載の符号化装置。
JP2006188358A 2006-07-07 2006-07-07 符号化装置 Pending JP2008015357A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006188358A JP2008015357A (ja) 2006-07-07 2006-07-07 符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006188358A JP2008015357A (ja) 2006-07-07 2006-07-07 符号化装置

Publications (1)

Publication Number Publication Date
JP2008015357A true JP2008015357A (ja) 2008-01-24

Family

ID=39072410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006188358A Pending JP2008015357A (ja) 2006-07-07 2006-07-07 符号化装置

Country Status (1)

Country Link
JP (1) JP2008015357A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001044846A (ja) * 1999-07-26 2001-02-16 Toshiba Corp ベクトル量子化方法と音声符号化方法および装置
JP2001290494A (ja) * 2000-04-05 2001-10-19 Matsushita Electric Ind Co Ltd 登録単語辞書作成方法及びその装置、並びに音声認識方法及びその装置
JP2001298367A (ja) * 2000-04-12 2001-10-26 Nippon Telegr & Teleph Corp <Ntt> オーディオ信号符号化方法、オーディオ信号復号化方法およびオーディオ信号符号化/復号化装置と前記方法を実施するプログラムを記録した記録媒体
JP2005338637A (ja) * 2004-05-28 2005-12-08 Sony Corp オーディオ信号符号化装置及び方法
JP2005345703A (ja) * 2004-06-02 2005-12-15 Casio Comput Co Ltd 音声処理装置及び音声符号化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001044846A (ja) * 1999-07-26 2001-02-16 Toshiba Corp ベクトル量子化方法と音声符号化方法および装置
JP2001290494A (ja) * 2000-04-05 2001-10-19 Matsushita Electric Ind Co Ltd 登録単語辞書作成方法及びその装置、並びに音声認識方法及びその装置
JP2001298367A (ja) * 2000-04-12 2001-10-26 Nippon Telegr & Teleph Corp <Ntt> オーディオ信号符号化方法、オーディオ信号復号化方法およびオーディオ信号符号化/復号化装置と前記方法を実施するプログラムを記録した記録媒体
JP2005338637A (ja) * 2004-05-28 2005-12-08 Sony Corp オーディオ信号符号化装置及び方法
JP2005345703A (ja) * 2004-06-02 2005-12-15 Casio Comput Co Ltd 音声処理装置及び音声符号化方法

Similar Documents

Publication Publication Date Title
AU2018204110B2 (en) Signal processing apparatus and method, and program
KR100941011B1 (ko) 부호화 방법 및 장치, 및 복호 방법 및 장치
JP5773124B2 (ja) 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
JP3881946B2 (ja) 音響符号化装置及び音響符号化方法
JP2013044921A (ja) 符号化装置および方法、並びにプログラム
JPWO2007116809A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
JP2008170554A (ja) オーディオデータ処理装置及び端末装置
WO2006001159A1 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
RU2662693C2 (ru) Устройство декодирования, устройство кодирования, способ декодирования и способ кодирования
JP4786183B2 (ja) 音声復号化装置、音声復号化方法、プログラム、記録媒体
JP4947145B2 (ja) 復号装置、復号方法、及びプログラム
JP4297078B2 (ja) 復号方法及び装置
JP4369140B2 (ja) オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体
JP2008015357A (ja) 符号化装置
JP2002023798A (ja) 音声符号化方法
JPWO2008004649A1 (ja) オーディオ符号化装置、オーディオ符号化方法およびそのプログラム
JP2000250597A (ja) Lsp補正装置,音声符号化装置及び音声復号化装置
JP2009103974A (ja) マスキングレベル算出装置、符号化装置、マスキングレベル算出方法およびマスキングレベル算出プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090622

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110607

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111108