JP2004191821A - ゲイン制御装置及び方法 - Google Patents

ゲイン制御装置及び方法 Download PDF

Info

Publication number
JP2004191821A
JP2004191821A JP2002362032A JP2002362032A JP2004191821A JP 2004191821 A JP2004191821 A JP 2004191821A JP 2002362032 A JP2002362032 A JP 2002362032A JP 2002362032 A JP2002362032 A JP 2002362032A JP 2004191821 A JP2004191821 A JP 2004191821A
Authority
JP
Japan
Prior art keywords
attack
release
gain control
detecting
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002362032A
Other languages
English (en)
Inventor
Kiyohisa Azuma
清久 東
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2002362032A priority Critical patent/JP2004191821A/ja
Publication of JP2004191821A publication Critical patent/JP2004191821A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Control Of Amplification And Gain Control (AREA)

Abstract

【課題】規定個数以上のアタック部及びリリース部を検出した時に、規定個数以内によりプリエコーやポストエコーの発生しやすいアタック部やリリース部を抽出し、ゲイン制御を行うことで再生音の音質劣化を低減する。
【解決手段】入力データ110を分割装置101で複数のサブグループに分割し、各サブグループのレベルの最大値を最大値検出装置102で算出する。各サブグループの最大レベル値を元にアタック部及びリリース部検出装置103で検出したアタック部及びリリース部の個数が規定個数内かどうかを判定装置104が判定し、規定個数以上の場合には閾値算出装置105がアタック部及びリリース部の判定用の閾値を更新して再度検出する。この動作をアタック部及びリリース部が規定個数以内になるまで繰り返し、得られた位置データとゲイン制御補正データとを用いてゲイン関数を算出し、入力データにゲイン制御を施す。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号やオーディオデータの符号化装置、特に符号化の際に行うゲイン制御に関するものである。
【0002】
【従来の技術】
近年、オーディオデータを記録したCD等の光ディスクや磁気テープなどの記録媒体から再生装置でデータを読み出し、記録装置へデータを転送し、そのデータを記録装置で別の記録媒体へ記録することは一般的に行われている。例えば、読み出したオーディオデータをデジタル化した後にMPEG(Moving Picture Experts Coding Group)や、ATRAC(Adaptive Transform Acoustic Coding)等のような圧縮処理を施し、圧縮データの形式で記録媒体に記録する方法も一般的になっている。
【0003】
データ圧縮を行うと、同じ再生時間の音楽や画像データが数分の1から10数分の1のデータ量にまで圧縮できるため、記録媒体の使用量を少なくすることができ、また記録媒体のサイズを小さくすることができるため、録音、録画、再生聞きの大きさを小さくすることが可能となる。また、通信回線を介したオーディオデータの配信においても圧縮したデータを用いることで通信コストを小さくすることが可能となる。
【0004】
多くの音声圧縮方式は圧縮する手段の一つとして、人間には聞こえにくい、聴感上重要度の低い信号成分を圧縮することによってデータ量を減らし、なおかつ再生時の音質を落とさないようにしている。人間の聴覚は周波数特性を持っており、これらの圧縮方式の多くはある単位時間毎にブロック化された時間軸上のオーディオデータに直交変換を施し、周波数軸上のスペクトルデータとした後で聴覚特性と照らし合わせた分析を行っている。これらのスペクトルデータは量子化された後符号化され、符号化データとして記録や伝送が行われる。量子化の際には前述した聴覚特性やデータのレベルの大きさに応じて各帯域毎に適応的に量子化ビットを割り当てる。符号化されたスペクトルデータはこれまでの処理で抽出されたパラメータと共に予め決められているフォーマットに従って多重化され、所定ワード数単位でブロック化されたストリームデータとして記録、伝送される。
【0005】
再生時には記録媒体から読み出されたストリームデータから、フォーマットに準じて符号化スペクトルデータとパラメータとを分離し、パラメータを用いてスペクトルデータを復号化し、逆直交変換を施して時間軸上のオーディオデータに合成することで再生音が生成される。この再生音には、記録時に行った量子化による量子化ノイズが含まれている。特に記録時において、直交変換される前の時間軸上のブロックデータに急峻なレベル変動が存在する場合、このレベル変動部分に起因する量子化ノイズが該当するブロックデータ内の他の部分にも伝播する。
例えば、レベル変化が小さくかつ信号レベルの小さな状態から急に大きな信号レベルの状態に移行(この部分をアタック部と呼ぶ)し、その信号レベルが続くような信号を、所定単位でブロック化して直交変換を施し、その結果のスペクトルデータを量子化して符号化する。この符号化データを復号化し、逆量子化、逆直交変換を施して時間軸上の信号に再生した場合、上記量子化ノイズが発生し、信号レベルの小さい部分でこの量子化ノイズが元の信号レベルより大きい場合には聴取可能となる。これをプリエコーと呼ぶ。
【0006】
一方、反対に大きな信号レベルの状態から急に小さな信号レベルの状態へと移行(この部分をリリース部と呼ぶ)した場合でも同様の事象が発生し、リリース部より後の信号レベルの小さな部分において量子化ノイズのレベルが大きい場合には量子化ノイズを聴取可能となる。これをポストエコーと呼ぶ。
【0007】
プリエコー、ポストエコーの対策として、直交変換時に使用する窓関数を、急峻にレベル変化する部分に対してはレベル変化の少ない定常的な信号の場合と比べて短いものを使用することで、プリエコーやポストエコーの影響する時間軸上の範囲を小さくする方法がある。
【0008】
一方、直交変換の前に、アタック部やリリース部を検出し、レベル変化に応じた係数をオーディオデータに掛けることによってレベル変化を軽減し量子化を行う方法も提案されている。これをゲイン制御と呼んでいる。記録時にはアタック部やリリース部でのゲイン制御量情報と位置情報を符号化スペクトルデータと一緒に多重化し、再生時にゲイン制御量情報と位置情報を用いて元に戻す処理を行う。この方法では、入力信号における急峻なレベル変化の有無に関わらず直交変換時の窓関数やブロック長を切り換える必要がなく、直交変換後のスペクトルデータの分解能を確保できるメリットがある(例えば特許文献1参照。)。
【0009】
ゲイン制御を行った後は直交変換によってスペクトルデータに変換し、正規化、量子化を行ってスペクトルデータを符号化し、再生時に必要なパラメータと共に該当する圧縮方式のフォーマットに従って多重化する。圧縮方式の多くは多重化データのフォーマットが決まっており、複数のパラメータや量子化スペクトルデータがどのような順序でどれだけの個数が配置されているのか予め決められている。また、ゲイン制御も1ブロックのオーディオデータ内でアタック部及びリリース部の検出個数の上限が決まっている場合がある。例えば、1ブロック内で4個所のアタック部及びリリース部が検出可能なフォーマットでの多重化データの例を図12に示す。アタック部やリリース部を検出し、ゲイン制御行ったことを示すフラグは、ゲイン制御を行った場合には1、行わなかった場合には0をセットする。アタック部/リリース部検出フラグが0の時には、多重化データは図12(b)に示すようにゲイン制御は行われていないため位置情報やゲイン制御レベル情報は存在しない。一方、ゲイン制御が行われた時に多重化データは図12(a)に示すようにアタック部/リリース部検出フラグが1とされ、位置情報やゲイン制御レベル情報が存在する。ここでは、1ブロックあたりアタック部及びリリース部は合計4箇所が上限となるため、多重化データ内には4箇所分のパラメータを書き込むエリアが確保されている。
【0010】
そこで、例えば図11に示すような信号が入力され、アタック部を5箇所検出された場合、それぞれのアタック部での位置情報とゲイン制御に伴うゲイン制御レベル情報とを算出し、多重化データは図12(c)に示すように多重化する。再生時にはストリームデータからフォーマットに従ってアタック部/リリース部検出フラグをチェックし、フラグが1なので位置情報及びゲイン制御レベル情報とを読み出す。しかし、フォーマットでは1ブロックあたりのアタック部及びリリース部は4箇所までと決まっているため、5箇所目の位置情報を1箇所目のゲイン制御レベル情報として読み出してしまう。また、4個所分のゲイン制御レベル情報を読み出した後、さらにゲイン制御レベル情報が続いているにも関わらず、次のデータからスペクトル情報として読み出してしまう。このようにして読み出されたパラメータやスペクトルデータは正しく再生されず、ノイズの原因となる。
【0011】
これを防ぐ方法として、アタック部やリリース部を検出する毎に検出個数をカウントしておき、フォーマットでの規定個数に達した時点で検出を終了する方法が考えられる。この方法ならば、算出される位置情報とゲイン制御レベル情報は最大4組となるためフォーマット通りにデータが配置される。
【0012】
【特許文献1】
特開平8−237132号公報
【0013】
【発明が解決しようとする課題】
しかし、このようなゲイン制御においても、アタック部及びリリース部の検出個数が規定個数に達して検出を中断した場所より後に、それまで検出したものより急峻なレベル変化が存在した場合、このレベル変化に対するゲイン制御は行われないために再生時にはプリエコーを生じることとなる。この信号全体を見た場合、最初の4箇所のアタック部にゲイン制御を行うよりも、最後のアタック部にゲイン制御を行う方が再生時のより大きなプリエコーを防ぐ意味においては効果があると考えられるが、上記方法では不可能である。
【0014】
【課題を解決するための手段】
この課題を解決するために本発明の請求項1または請求項3に記載の発明は、オーディオ信号のレベルが急激に大きくなるアタック部を検出するアタック部検出手段と、オーディオ信号のレベルが急激に小さくなるリリース部を検出するリリース部検出手段と、アタック部検出手段とリリース部手段の出力に応じてゲイン制御量を算出もしくは選択するゲイン制御量算出手段と、ゲイン制御量算出手段の出力を用いてオーディオ信号のゲインを制御するゲイン制御実施手段とを備え、アタック部検出手段及びリリース部検出手段は、アタック部及びリリース部の個数の合計が所定の個数より多い場合は、アタック部及びリリース部の検出に用いた閾値を更新してアタック部及びリリース部を検出し直し、アタック部及びリリース部の個数の合計が所定の個数以下になるまで繰り返すことを特徴としたものである。これにより、1ブロック内で検出されるゲイン制御の回数が規定されている時に規定個数以上のゲイン制御ポイントを検出した場合、ゲイン制御のポイントを検出する際の閾値を変動させて再検出させることによって、より重要なゲイン制御ポイントを残しながら規定個数内に収めることができ、なおかつ、規定個数分のゲイン制御ポイントを検出すると検出作業を終了する方法で起こり得るより重要なゲイン制御ポイントの未検出を防ぐという作用を有する。
【0015】
請求項2または請求項4に記載の発明は、オーディオ信号のレベルが急激に大きくなるアタック部を検出するアタック部検出手段と、オーディオ信号のレベルが急激に小さくなるリリース部を検出するリリース部検出手段と、アタック部検出手段とリリース部検出手段の出力に応じてゲイン制御量を算出もしくは選択するゲイン制御量算出手段と、ゲイン制御量算出手段の出力を用いてオーディオ信号のゲインを制御するゲイン制御実施手段とを備え、アタック部検出手段及びリリース部検出手段は、アタック部及びリリース部の個数の合計が所定の個数より多い場合は、アタック部及びリリース部の制御補正情報を比較し、制御補正情報の値の大きい順にアタック部及びリリース部を合計の個数が所定の個数になるまで選択することを特徴としたものである。これにより、1フレーム内で検出されるゲイン制御の回数が規定されている時に規定個数以上のゲイン制御ポイントを検出した場合、ゲイン制御ポイントの数が規定個数以上の場合に検出し直す処理を行わなわずに、より高速にゲイン制御ポイントの選択を行うことが可能であるという作用を有する。
【0016】
【発明の実施の形態】
以下本発明の実施の形態について、図1から図10を用いて説明する。
【0017】
(実施の形態1)
図1は本発明の実施の形態1におけるゲイン制御装置の構成を示すブロック図である。図1において、101は分割装置、102は最大値検出装置、103はアタック部/リリース部検出装置、104は判定装置、105は閾値算出装置、106はゲイン制御実施装置である。また、図3は本発明の実施の形態1におけるゲイン制御方法のフローチャートを示す。図5はアタック部検出処理のフローチャートを示す。図6はリリース部検出処理のフローチャートを示す。さらに、図7は分割装置101及び最大値検出装置102の動作説明図、図8はアタック部/リリース部検出装置103及びゲイン制御実施装置106の動作説明図、図9は本発明の実施の形態1のゲイン制御装置の動作説明図を示す。
【0018】
以上のように構成されたゲイン制御装置及び方法について、図1、図3、図5、図6、図7、図8、図9を用いて説明する。分割装置101にデジタルオーディオデータが入力される。分割装置101ではオーディオデータをN個(Nは2以上の正数)のサブグループ(sg)に分割する(S302)。最大値検出装置102では各サブグループでのレベルの最大値A(i)(0≦i≦N−1)を検出し最大レベルデータとして出力する(S303)。図7(a)及び(b)は、オーディオデータを8つに分割した場合の、分割装置101及び最大値検出装置102の動作を示す。アタック部及びリリース部を判断するための閾値Rthに初期値Riniを代入する(S304)。この閾値Rthを使ってアタック部及びリリース部の検出を行う(S305)。
【0019】
アタック部/リリース部検出装置103では、各サブグループの最大レベルデータを元にしてアタック部及びリリース部を検出する。まずアタック部の検出は、アタック部の検出は1番目のサブグループから、検出されたアタック部の個数Gnumは0として開始する(S502)。k番目(1≦k≦N−1)のサブグループより前にある0番目から(k−1)番目の各サブグループの最大レベル値A(k)の中での最大値Amax(k)を算出する(S503)。このAmax(k)とA(k)との比A(k)/Amax(k)と閾値Rthとを比較し(S504)、A(k)/Amax(k)がRth以上の場合には(S504でFalse)、アタック部と判定され、位置データとしてk、ゲイン制御レベルデータとしてA(k)/Amax(k)がセーブされる(S505)。そして、アタック部の個数Gnumが更新される(S506)。また、A(k)/Amax(k)がRthより小さい場合には(S504でTrue)、現在処理しているサブグループが(N−1)番目まで達しているかどうかを判断する(S507)。達していなければ(S507でFalse)、そのまま次のサブグループの処理へ移る(S508)。もし(N−1)番目ならば(S507でTrue)、アタック検出処理は終了する(S509)。
【0020】
ゲイン制御装置でのリリース部の検出は、リリース部の検出は0番目のサブグループから、アタック部の個数Gnumをそのまま引き継いで開始する(S602)。リリース部の検出は0番目から(N−2)番目の各サブグループについて行われる。j−1番目(0≦j≦N−2)からN番目までの各サブグループの最大レベル値の中での最大値Amax2(j)を算出する(S603)。このAmax2(j)とA(j)との比Amax2(j)/A(j)と閾値Rthとを比較し(S604)、Amax2(j)/A(j)がRth2以上の場合(S604でFaulse)にはリリース部と判定され、位置データとしてj、ゲイン制御レベルデータとしてAmax2(j)/A(j)がセーブされる(S605)。そして、アタック部及びリリース部の個数Gnumが更新される(S606)。また、Amax2(j)/A(j)がRth2より小さい場合(S604でTrue)には、現在処理しているサブグループが(N−2)番目まで達しているかどうかを判断する(S607)。達していなければ(S607でFalse)、そのまま次のサブグループの処理へ移る(S608)。もし(N−2)番目ならば(S607でTrue)、アタック検出処理は終了する(S609)。
【0021】
例えば、各サブグループの最大レベル値が図7(b)に示すように求められている時、Rattは図8(a)、Rrelは図8(b)に示すように求められる。図8(a)での網掛けの値がRthより大きいと判定された場合、位置データとして3、制御レベル情報データとしてA(3)/A(2)が保存される。一方い、図8(b)での網掛けの値が1/Rthより小さいと判定された場合、位置データとして5、制御レベル情報データとしてA(6)/A(5)が保存される。そしてアタック部/リリース部検出個数Gnumは2として保持される。
【0022】
判定装置104にはアタック部及びリリース部の個数の上限値Gmaxが予め設定されている。アタック部及びリリース部の検出(S305)が終了すると、予め定められた1ブロックあたりのアタック部及びリリース部の個数の上限Gmaxと検出個数データであるGnumとを比較する(S306)。検出個数データであるGnumがGmaxよりも大きい場合(S306でTrue)、判定装置104は閾値算出装置105へ閾値再算出指示信号を出力する。閾値再算出指示信号を受信した閾値算出装置105は、最初のゲイン制御の判定に使用した閾値Rthに定数Rcoを足した値Rth+Rcoを新たなゲイン制御判定閾値レベルとして出力する(S307)。アタック部/リリース部検出装置103は判定装置104からゲイン制御再検出指示信号を受信し、新たに閾値算出装置105から受信したゲイン制御判定閾値レベルを元に再度アタック部及びリリース部の検出を行う。つまり、アタック部リリース部の検出はGnumがGmax以下になるまで繰り返されることになる。例えば、Rcoが1の場合、2度目の検出時の閾値Rth+Rcoは3となる。この時の検出結果は図9(e)に示すようになり、アタック部の検出個数Gnumは4となる。検出個数データであるGnumがGmax以下になった場合(S306でFalse)、判定装置104からゲイン制御検出終了信号が出力される。ゲイン制御検出終了信号を受信した制御ポイント検出装置103で算出されたアタック部及びリリース部の位置データ及びゲイン制御レベルデータを出力する。算出された位置データ及びゲイン制御レベルデータを用いて各サブグループのデータに掛けるゲインの算出及びゲインに制御を実施し(S308)、ゲインに制御を行ったデジタルオーディオデータと多重化させるための位置データとゲイン制御レベルデータとを出力する。
【0023】
ゲイン制御装置におけるゲイン制御実施装置106は、アタック部/リリース部検出装置103からの位置データ及びゲイン制御レベルデータを用いて、図8(c)に示すような各サブグループ毎のゲインを算出し、入力デジタルオーディオデータに掛け合わせたゲイン制御データを出力する。ここで、最大値検出装置102から転送された各サブグループの最大レベルデータが図9(a)に示す値とする。閾値算出装置105から設定される最初の閾値Rthが2の場合、各サブグループのRatt及びRrelはそれぞれ図9(b)及び図9(c)のようになる。この時、図9(d)に示すようにリリース部はなくアタック部の検出個数Gnumが5となる。アタック部及びリリース部検出個数Gnumは検出個数データを判定装置104に送出される。
【0024】
以上のように本実施形態によれば、1ブロック内で検出されるゲイン制御の回数が規定されている時に規定個数以上のアタック部やリリース部を検出した場合、各部を検出する際の閾値を変動させて再検出させることによって、より重要なアタック部及びリリース部を残しながら規定個数内に収めることができる。また本実施の形態では、一旦最初の条件で全てのアタック部及びリリース部を検出するため、規定個数分のゲイン制御ポイントを検出すると検出作業を終了する方法で起こり得るより重要なゲイン制御ポイントの未検出を防ぐことが可能である。
【0025】
本実施の形態では、アタック部及びリリース部を再検出する際にレベル値の比に関する閾値を変動させて行ったが、他のパラメータに関する閾値を用いても実施可能である。また、本実施の形態では閾値Rthに対して定数Rcoを足して次の再検出処理の閾値としていたが、別途メモリ上に複数の閾値を保持しておき、ゲイン制御ポイントの再検出作業を繰り返す際にこのメモリ上の閾値データを読み出すような構成にしてもよい。また、閾値の初期値及び再検出時の閾値も一定のものではなく、状況に応じて適応的に変化させることも可能である。本実施の形態では、一例としてアタック部のみが規定個数以上の場合を示したが、アタック部とリリース部とがそれぞれ個別に規定個数を持つ場合でも本実施の形態が適用可能である。
【0026】
(実施の形態2)
図2は本発明の実施の形態2におけるゲイン制御装置の構成を示すブロック図である。図2において、201は分割装置、202は最大値検出装置、203は制御ポイント検出装置、204は判定装置、205はデータ読み取り装置、206はゲイン制御実施装置である。また、図4は本発明の実施の形態2におけるゲイン制御方法のフローチャートを示す。さらに、図10は本発明の実施の形態2のゲイン制御装置の動作説明図である。
【0027】
以上のように構成されたゲイン制御装置について、以下その動作にて図2、図4、図10を用いて説明する。図2中の分割装置201、最大値検出装置202、ゲイン制御実施装置206は、夫々分割装置101、最大値検出装置102、ゲイン制御実施装置106と同じ機能を有する。分割装置201は、1ブロックのデジタルオーディオデータをN個(Nは2以上の正数)のサブグループに分割する(S402)。最大値検出装置202は、各サブグループにおいて最大レベル値A(i)(0≦i≦N−1)を算出し、最大レベルデータとして出力する(S403)。アタック部/リリース部検出装置203は各サブグループの最大レベルデータを元にしてアタック部及びリリース部を検出する(S404)。アタック部及びリリース部の検出処理であるS404はS305と同じである。例えば、ゲイン制御装置において各サブグループの最大値レベルデータが図10(a)に示す値とする。ゲイン制御判定閾値Rthが2の場合、アタック部/リリース部検出装置203ではアタック部を図10(b)に示すように検出し、アタック部/リリース部検出個数Gnumは5となる。アタック部/リリース部検出個数Gnumは検出個数データとして判定装置204へ送られる。
【0028】
判定装置204にはアタック部及びリリース部の上限値Gnumが予め設定されており、検出個数データとGmaxとを比較する(S405)。GnumがGmaxよりも大きい場合(S405でTrue)、各アタック部及びリリース部のゲイン制御レベルデータの大きさを比較し、レベルデータの大きい順にGmax個だけアタック部、リリース部のゲイン制御レベルデータと位置データとを取り出し、各サブグループのデータに掛けるゲインの算出及びゲイン制御を実施し(S406)、ゲイン制御を行ったデジタルオーディオデータと多重化させるための位置データとゲイン制御レベルデータとを出力して終了する(S407)。例えば、上限値Gmaxが4の場合、図10(b)に示すように、検出個数データが上限値Gmaxよりも大きくなり、判定装置204はデータ読み取り装置205へ個数オーバー信号を出力する。個数オーバー信号を受信したデータ読み取り装置205は、一旦アタック部/リリース部検出装置203で算出された全てのゲイン制御ポイントの位置データ及びゲイン制御レベルデータを読み出した後、各のレベルデータの大きさを比較し、図10(c)に示すように、レベルデータの大きい順に4組だけゲイン制御ポイントのパラメータを取り出す。取り出した4組のゲイン制御ポイントの位置データ及びレベルデータを出力する。
【0029】
一方、検出個数データであるGnumがGmax以下の場合は(S405でFalse)、判定装置204からはデータ読み取り装置205へ個数OK信号を出力する。個数オーバー信号は論理値で1、また個数OK信号は論理値で−1が割り当てられているので、データ読み取り装置205は判定装置204からの信号が論理値で1か−1かによって判定装置204からの指示を知ることができる。個数OK信号を受信した場合にはアタック部/リリース部検出装置203から検出されたゲイン制御ポイントの位置データ及びゲイン制御レベルデータを全て読み取り、そのまま出力信号として出力し、終了する(S407)。
【0030】
以上のように本実施形態によれば、1フレーム内で検出されるゲイン制御の回数が規定されている時に規定個数以上のアタック部及びリリース部を検出した場合、既に検出した各部の各パラメータの大きさから、重要度の大きなアタック部及びリリース部を選出することによって、よりプリエコー、ポストエコーに有効アタック部及びリリース部選び規定個数以内に収めることが可能である。第1の実施の形態とは異なり、アタック部及びリリース部の数が規定個数以上の場合に検出し直す処理を行わないため、検出の手順が煩雑な場合には本実施形態の方がより簡便に、より高速にアタック部及びリリース部の選択を行うことが可能である。
【0031】
本実施の形態では、実施の形態1と同様に、一旦最初の条件で全てのアタック部及びリリース部を検出するため、規定個数分のアタック部及びリリース部を検出すると検出作業を終了する方法で起こり得るより重要なアタック部やリリース部の未検出を防ぐことが可能である。本実施の形態では、アタック部やリリース部を再検出する際に各ゲイン制御ポイントのレベル値を比較して行ったが、他のパラメータの場合でも実施可能である。本実施の形態では、アタック部とリリース部を同時に検出しながら行ったが、それぞれ個別に規定個数を持つ場合でも本実施の形態が適用可能である。
【0032】
【発明の効果】
以上のように本発明によれば、時間軸上のオーディオデータからアタック部とリリース部を検出しゲイン制御を行う際に、符号化フォーマット形式等の都合で1ブロック毎に検出するアタック部及びリリース部の個数が規定されている時に、規定個数以上のアタック部及びリリース部を検出した場合でも、よりプリエコーやポストエコーの削減に効果的なアタック部及びリリース部を検出しながら規定個数内に収めることが可能となり、再生音の音質の劣化をより少なくさせられるという有利な効果が得られる。
【図面の簡単な説明】
【図1】本発明の実施の形態1によるゲイン制御装置の構成図
【図2】本発明の実施の形態2によるゲイン制御装置の構成図
【図3】本発明の実施の形態3によるゲイン制御方法のフローチャート
【図4】本発明の実施の形態4によるゲイン制御方法のフローチャート
【図5】アタック部検出処理のフローチャート
【図6】リリース部検出処理のフローチャート
【図7】分割装置及び最大値検出装置の動作説明図
【図8】アタック部/リリース部検出装置及びゲイン制御実施装置の動作説明図
【図9】本発明の実施の形態1のゲイン制御装置の動作説明図
【図10】本発明の実施の形態2のゲイン制御装置の動作説明図
【図11】アタック部を5箇所検出する入力オーディオデータを表した図
【図12】多重化データに対する位置情報やゲイン制御レベル情報を表した図
【符号の説明】
101、201 分割装置
102、202 最大値検出装置
103、203 アタック部/リリース部検出装置
104、204 判定装置
105 閾値算出装置
106、206 ゲイン制御実施装置
205 データ読取装置

Claims (4)

  1. オーディオ信号のレベルが急激に大きくなるアタック部を検出するアタック部検出手段と、オーディオ信号のレベルが急激に小さくなるリリース部を検出するリリース部検出手段と、前記アタック部検出手段と前記リリース部検出手段の出力に応じてゲイン制御量を算出もしくは選択するゲイン制御量算出手段と、前記ゲイン制御量算出手段の出力を用いてオーディオ信号のゲインを制御するゲイン制御実施手段とを備え、前記アタック部検出手段及び前記リリース部検出手段は、アタック部及びリリース部の個数の合計が所定の個数より多い場合は、アタック部及びリリース部の検出に用いた閾値を更新してアタック部及びリリース部を検出し直し、アタック部及びリリース部の個数の合計が所定の個数以下になるまで繰り返すことを特徴とするゲイン制御装置。
  2. オーディオ信号のレベルが急激に大きくなるアタック部を検出するアタック部検出手段と、オーディオ信号のレベルが急激に小さくなるリリース部を検出するリリース部検出手段と、前記アタック部検出手段と前記リリース部検出手段の出力に応じてゲイン制御量を算出もしくは選択するゲイン制御量算出手段と、前記ゲイン制御量算出手段の出力を用いてオーディオ信号のゲインを制御するゲイン制御実施手段とを備え、前記アタック部検出手段及び前記リリース部検出手段は、アタック部及びリリース部の個数の合計が所定の個数より多い場合は、アタック部及びリリース部の制御補正情報を比較し、前記制御補正情報の値の大きい順にアタック部及びリリース部の個数の合計が所定の個数になるまで選択することを特徴とするゲイン制御装置。
  3. オーディオ信号のレベルが急激に大きくなるアタック部を検出するアタック部検出ステップと、オーディオ信号のレベルが急激に小さくなるリリース部を検出するリリース部検出ステップと、前記アタック部検出ステップと前記リリース部検出ステップの検出結果に応じてゲイン制御量を算出または選択する算出選択ステップと、前記算出選択ステップで算出または選択されたゲイン制御量を用いて、オーディオ信号のゲイン制御を行うゲイン制御実施ステップとを備え、アタック部及びリリース部の個数の合計が所定の個数より多い場合は、アタック部及びリリース部の検出に用いた閾値を更新してアタック部及びリリース部を検出し直し、アタック部及びリリース部の個数の合計が所定の個数以下になるまで繰り返すことを特徴とするゲイン制御方法。
  4. オーディオ信号のレベルが急激に大きくなるアタック部を検出するアタック部検出ステップと、オーディオ信号のレベルが急激に小さくなるリリース部を検出するリリース部検出ステップと、前記アタック部検出ステップと前記リリース部検出ステップの検出結果に応じてゲイン制御量を算出または選択する算出選択ステップと、前記算出選択ステップで算出または選択されたゲイン制御量を用いて、オーディオ信号のゲイン制御を行うゲイン制御実施ステップとを備え、アタック部及びリリース部の個数の合計が所定の個数より多い場合は、アタック部及びリリース部の制御補正情報を比較し、前期制御補正情報の値の大きい順にアタック部及びリリース部の個数の合計が所定の個数になるまで選択することを特徴とするゲイン制御方法。
JP2002362032A 2002-12-13 2002-12-13 ゲイン制御装置及び方法 Pending JP2004191821A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002362032A JP2004191821A (ja) 2002-12-13 2002-12-13 ゲイン制御装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002362032A JP2004191821A (ja) 2002-12-13 2002-12-13 ゲイン制御装置及び方法

Publications (1)

Publication Number Publication Date
JP2004191821A true JP2004191821A (ja) 2004-07-08

Family

ID=32760599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002362032A Pending JP2004191821A (ja) 2002-12-13 2002-12-13 ゲイン制御装置及び方法

Country Status (1)

Country Link
JP (1) JP2004191821A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021530933A (ja) * 2018-09-28 2021-11-11 ドルビー ラボラトリーズ ライセンシング コーポレイション シーン切り換え解析器にガイドされる歪み可聴性モデルに基づく動的閾値を有する歪み低減マルチバンド・コンプレッサー

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021530933A (ja) * 2018-09-28 2021-11-11 ドルビー ラボラトリーズ ライセンシング コーポレイション シーン切り換え解析器にガイドされる歪み可聴性モデルに基づく動的閾値を有する歪み低減マルチバンド・コンプレッサー
JP7019099B2 (ja) 2018-09-28 2022-02-14 ドルビー ラボラトリーズ ライセンシング コーポレイション シーン切り換え解析器にガイドされる歪み可聴性モデルに基づく動的閾値を有する歪み低減マルチバンド・コンプレッサー
US11282533B2 (en) * 2018-09-28 2022-03-22 Dolby Laboratories Licensing Corporation Distortion reducing multi-band compressor with dynamic thresholds based on scene switch analyzer guided distortion audibility model

Similar Documents

Publication Publication Date Title
AU2022204314B2 (en) Method and apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals
KR100402189B1 (ko) 오디오신호압축방법
JP3141450B2 (ja) オーディオ信号処理方法
KR100348368B1 (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
JP3334419B2 (ja) ノイズ低減方法及びノイズ低減装置
JP5343032B2 (ja) レベル・モードとラン・レングス/レベル・モードの間での符号化を適応させるエントロピー符号化
EP1072036B1 (en) Fast frame optimisation in an audio encoder
KR20020002241A (ko) 디지털 오디오장치
JP2003005797A (ja) オーディオ信号の符号化方法及び装置、並びに符号化及び復号化システム
KR100682915B1 (ko) 다채널 신호 부호화/복호화 방법 및 장치
US5812982A (en) Digital data encoding apparatus and method thereof
JP2004191821A (ja) ゲイン制御装置及び方法
KR100733192B1 (ko) 디지털 녹화 장치
JP4101123B2 (ja) 符号化装置及び符号化方法
JP3753956B2 (ja) 符号化装置
JP2005062296A (ja) 符号化装置及び符号化方法
JP2794899B2 (ja) 符号化装置
JP2816052B2 (ja) オーディオデータ圧縮装置
JP3692959B2 (ja) 電子透かし情報埋め込み装置
JPH08307277A (ja) 可変レート音声符号化方法及び装置
JPH0787031A (ja) 符号化信号復号化装置
JP2005043761A (ja) 情報量変換装置及び情報量変換システム
JP3200886B2 (ja) オーディオ信号処理方法
KR950003627B1 (ko) 디지탈 오디오 기기의 가청 임계점을 이용한 비트 할당방법
KR19980023632A (ko) 영상신호 압축 부호화 장치