JP4174859B2 - デジタルオーディオ信号のミキシング方法およびミキシング装置 - Google Patents
デジタルオーディオ信号のミキシング方法およびミキシング装置 Download PDFInfo
- Publication number
- JP4174859B2 JP4174859B2 JP20093598A JP20093598A JP4174859B2 JP 4174859 B2 JP4174859 B2 JP 4174859B2 JP 20093598 A JP20093598 A JP 20093598A JP 20093598 A JP20093598 A JP 20093598A JP 4174859 B2 JP4174859 B2 JP 4174859B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- audio signal
- mixing
- digital audio
- energy level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の属する技術分野】
この発明は、圧縮の施された複数のデジタルオーディオ信号のミキシング方法およびミキシング装置に関する。
【0002】
【従来の技術】
デジタルオーディオの分野においては、ある記録媒体に記録されたデジタルオーディオ信号と別の記録媒体に記録されたデジタルオーディオ信号とをミキシングした、内容の新たなデジタルオーディオ信号を作成し、記録媒体に再記録をすることが必要とされる場合がある。
【0003】
この場合、各デジタルオーディオ信号はミニディスクなどのように全体の情報量を削減すべく圧縮された状態で記録媒体に記録されている場合、図11に例示するような方法によりそのミキシングおよび再記録が行われていた。
【0004】
すなわち、まず、圧縮された各デジタルオーディオ信号が各記録媒体から読み出され、この読み出された各デジタルオーディオ信号が伸長手段11〜13によよって各々伸長される。そして、これらの伸長手段11〜13から得られる圧縮前の元のPCM信号に対し、ゲイン調整手段21〜23によって各々所望のゲインが付与され、これらのゲインの付与された各PCM信号が加算手段3によって加算される。そして、この加算により得られた新たなPCM信号に対し、圧縮手段4による圧縮処理が施され、この結果得られる圧縮されたデジタルオーディオ信号が記録手段5により記録媒体に記録される。
【0005】
【発明が解決しようとする課題】
ところで、上述した従来のデジタルオーディオ信号のミキシング方法では、ミキシングすべき信号の全てを伸長する必要があるため、ミキシングを行うための演算処理量が増えてしまうという問題があった。また、従来のミキシング方法では、記録媒体から読み出した各信号を各々伸長し、加算を行った後、再び圧縮するという演算過程を経るが、この演算過程では予め定められた有限の語長で演算が行われるため、丸め処理により情報が失われてしまうという問題が生じる。このような演算過程における情報の消失は特に伸長処理において生じやすい。
【0006】
この発明は、以上説明した事情に鑑みてなされたものであり、圧縮された複数のデジタルオーディオ信号を少ない演算処理量でミキシングすることができ、かつ、その際の信号劣化が少ないデジタルオーディオ信号のミキシング方法およびミキシング装置を提供することを目的としている。
【0007】
【課題を解決するための手段】
この発明は、各々、オーディオ信号を周波数の異なった信号成分に分割し、各信号成分の指数部および仮数部を量子化することにより得られた複数の圧縮デジタルオーディオ信号のミキシング方法において、ミキシング対象である複数の圧縮デジタルオーディオ信号の各々について、当該圧縮デジタルオーディオ信号における元のオーディオ信号の各信号成分の指数部を量子化したデータに基づき、各信号成分が帰属する周波数帯域毎のエネルギレベルを求め、前記複数の圧縮デジタルオーディオ信号間で同一周波数の信号成分同士を加算し、前記複数の圧縮オーディオ信号から各々求めた前記周波数帯域毎のエネルギレベルを同一の周波数帯域同士で合成することにより、ミキシング後のエネルギレベルを前記周波数帯域毎に求め、前記周波数帯域毎に、前記ミキシング後のエネルギレベルを上限とし、人間の聴覚により聴取可能なエネルギレベルの上限である可聴エネルギレベルを下限とするミキシング後の有効量子化領域を求め、前記周波数帯域毎に、前記ミキシング後の有効量子化領域と量子化に使用可能な総ビット数とから該周波数帯域の信号成分のミキシング後の仮数部を表現するためのビット数を求め、前記周波数帯域毎に求められたビット数に従って、前記周波数帯域毎に加算された各信号成分の仮数部の量子化を行うことを特徴とするものである。
【0008】
また、この発明は、オーディオ信号を周波数の異なった複数の信号成分に分割して量子化するに際し、オーディオ信号の発生によって生じるであろうマスキング効果に基づいて量子化の際のビット数の割当を決定する圧縮方法により生成されたデジタルオーディオ信号のミキシング方法およびミキシング装置を提供するものである。
【0009】
かかるミキシング方法およびミキシング装置においては、
A.ミキシング対象である複数のデジタルオーディオ信号の各々について、
a.当該デジタルオーディオ信号によって表された元のオーディオ信号の各信号成分を各々の周波数により分類することにより、各々周波数の異なった複数の周波数帯域に帰属させ、
b.前記デジタルオーディオ信号における元のオーディオ信号の各信号成分の指数部を量子化したデータに基づき、前記複数の周波数帯域毎に元のオーディオ信号の信号成分のエネルギレベルを求め、
c.前記複数の周波数帯域毎に求めた元のオーディオ信号の信号成分のエネルギレベルに基づき、元のオーディオ信号の発生により聴取が妨げられる信号成分のエネルギレベルの上限であるマスキングレベルを求め、
d.前記複数の周波数帯域毎に、当該周波数帯域について求めた信号成分のエネルギレベルを上限とし、前記マスキングレベルまたは人間の聴覚により聴取可能なエネルギレベルの上限である可聴エネルギレベルのうち大きい方を下限とする有効量子化領域を求め、
e.前記各周波数帯域に対応した各有効量子化領域と量子化に使用可能な総ビット数とから前記各周波数帯域に属する各信号成分の仮数部を表現するために使用されているビット数を求め、
f.各周波数帯域について求めた仮数部のビット数に従って前記デジタルオーディオ信号に含まれる前記各周波数帯域に属する信号成分の仮数部を取り出し、
B.前記複数のデジタルオーディオ信号から各々得られた複数の元のオーディオ信号の各信号成分に各々ゲインを付与して加算することにより、ミキシング後のオーディオ信号の各信号成分を求め、
C.前記複数のデジタルオーディオ信号から各々求めた複数の元のオーディオ信号の前記複数の周波数帯域毎の信号成分のエネルギレベルを合成することにより、前記ミキシング後のオーディオ信号の前記複数の周波数帯域毎の信号成分のエネルギレベルを求め、
D.前記複数のデジタルオーディオ信号から各々求めた前記マスキングレベルを合成することにより、前記ミキシング後のオーディオ信号に適用されるマスキングレベルを合成し、
E.前記複数の周波数帯域毎に、前記ミキシング後のオーディオ信号の信号成分のエネルギレベルを上限とし、前記マスキングレベルまたは前記可聴エネルギレベルのうち大きい方を下限とするミキシング後の有効量子化領域を求め、
F.前記複数の周波数帯域についての前記ミキシング後の有効量子化領域と量子化用に使用可能な総ビット数とから前記複数の周波数帯域に各々に属する信号成分の仮数部を表現するためのビット数を各周波数帯域毎に求め、
G.前記各周波数帯域について求めた仮数部のビット数に従って、前記ミキシング後のオーディオ信号の各周波数帯域の信号成分の仮数部の量子化を行うことにより、前記複数のオーディオ信号をミキシングしたものに対応したデジタルオーディオ信号を生成する。
【0010】
【発明の実施の形態】
以下、本発明を更に理解しやすくするため、実施の形態について説明する。
かかる実施の形態は、本発明の一態様を示すものであり、この発明を限定するものではなく、本発明の範囲で任意に変更可能である。
【0011】
A.本発明が適用されるデジタルオーディオ信号の圧縮記録方法および再生方法の例
【0012】
本発明の実施形態の説明に先立ち、その理解を容易にするため、本発明が適用されるデジタルオーディオ信号の圧縮記録方法および再生方法について説明する。
【0013】
A1.デジタルオーディオ信号の圧縮記録処理
図1は、デジタルオーディオ信号の圧縮記録を行う装置の構成例を示すものである。この装置は、帯域分割手段101、有効量子化領域計算手段102、ビット割当決定手段103、量子化手段104および記録手段105により構成されている。これらの各手段は、この装置によって行われる処理の内容をハードウェア的に表したものであるが、各々をハードウェアにより構成するかソフトウェアにより構成するかは任意である。以下、これらの各手段の処理内容を順に説明する。
【0014】
帯域分割手段101は、まず、圧縮対象であるオーディオ信号に対してDCT(離散コサイン変換)処理を施し、オーディオ信号を周波数の異なったN個の信号成分に分割する。図2はある音に対しDCT処理を施すことにより得られた各信号成分を例示したものである。図2において、横軸は周波数を表しており、縦軸に平行に表された多数の実線はDCT処理により得られたN個の信号成分のエネルギレベルを表している。帯域分割手段101は、このようにして得られたN個の信号成分を各々指数部と仮数部とからなる浮動小数点形式のデータによって表現する。
【0015】
有効量子化領域計算手段102は、上記DCT処理により得られたN個の信号成分を量子化する際の有効量子化領域の計算を以下の手順により行う。なお、この有効量子化領域の意味するところについては後述する。
【0016】
まず、上記DCT処理により得られたN個の信号成分をM個のユニットに分けるグルーピングを行う。すなわち、図2に破線で例示するように可聴周波数帯域を複数の周波数帯域に分割し、各信号成分を各々の周波数によりこれらの周波数帯域のいずれか該当するものに帰属させ、同一周波数帯域に属する各信号成分の集合を1つのユニットとするのである。このグルーピングを行うに当って、各周波数帯域(図2における破線)は、同一ユニットに属する各信号成分が相互に臨界帯域幅の範囲内に含まれるように定める。ここで、臨界帯域幅とは、人間の聴覚により弁別可能な音の周波数差をいう。すなわち、周波数の異なった2つの音が同時に鳴る場合において一方の音の周波数を他方の音の周波数に近づけてゆくとある周波数差において異なった2つの音であると認識できなくなるが、このような人間の聴覚によって認識可能な周波数差の下限値を臨界帯域幅と呼ぶものである。この臨界帯域幅は、音の周波数により異なった幅となり、例えば500Hzの音の臨界帯域幅よりは2000Hzの音の臨界帯域幅の方が大きい。
【0017】
次に有効量子化領域計算手段102は、各ユニット毎に、各々に属する各信号成分の指数部を調べ、その最大値を当該ユニットに属する各信号成分の指数部の代表値とする。そして、M個のユニットの指数部の代表値の各々について量子化を行う。
【0018】
次に量子化された各ユニットの指数部の代表値から各ユニット毎に有効量子化領域を計算する。以下、この処理について図3〜図5を参照して説明する。
【0019】
まず、人間の聴覚によって聴き取ることができる音のエネルギの閾値(以下、可聴エネルギレベルという。)は、音の周波数に依存する。図3における曲線111は、このような可聴エネルギレベルの周波数特性を例示するものである。図3には周波数の異なった音A〜Dが示されている。これらの各音が単独で鳴る場合には、音A、BおよびCは可聴エネルギレベル111よりも高いエネルギを有しているので聴き取ることができるが、音Dは可聴エネルギレベル111よりも低いエネルギを有しているので聴き取ることができないということになる。
【0020】
このように1つの音が鳴る場合には、その音が聞こえるか否かは、そのエネルギと可聴エネルギレベル111との関係によることとなる。しかし、ある大きな音が鳴ると、その音の近くの周波数で他の音が鳴っていたとしても、この他の音のエネルギが小さい場合には聞き取れないことがある。すなわち、大きな音が鳴ると、この音と周波数が近く、かつ、エネルギレベルの小さな音の聴取が妨げられるのである。これがマスキング効果である。
【0021】
図4は図3における4つの音A〜Dが同時に鳴った場合に音Aによって生じるマスキング効果を例示するものである。図4において、折れ線112は音Aの鳴音により聴取が妨げられる音のエネルギレベルの上限を示すものである。以下、便宜上、このエネルギレベルの上限をマスキングレベルという。図4に示す例では、音Aに周波数が近い音Bはマスキングレベル112以下のエネルギを有しているので聞こえない可能性が高く、音Aから周波数が離れた音CおよびDはマスキングレベル112を越えるエネルギを有しているので聞こえる可能性が高いということになる。
【0022】
このマスキング効果は同時に鳴る複数の音の各々によって生じる。そこで、これらの各音について、各々によって生じるマスキング効果のマスキングレベルを求め、各マスキングレベルを合成することにより複数の音が同時に鳴る場合のマスキングレベルを求める。そして、各周波数での可聴エネルギレベルをこのようにして得られたマスキングレベルによって修正する(すなわち、マスキングレベルの方が元々の可聴エネルギレベルよりも大きい場合にはマスキングレベルを可聴エネルギレベルとして採用する)。
【0023】
図5における曲線113は、このようにマスキング効果に基づいて修正された実効的な可聴エネルギレベルを例示するものである。図5において、音AおよびCは、実効的な可聴エネルギレベル113を越える高いエネルギを有しているので聞き取り可能であるが、音BおよびDは各々のエネルギが実効的な可聴エネルギレベル113以下であるので聞き取れない可能性が高い、ということになる。
【0024】
ところで、この図5に示す例において、仮に音A〜Dをデジタル信号として記録媒体に記録するものとすると、音AおよびCは、再生すれば人間の聴覚によって聞き取れると考えられるので、なるべく多くのビットを用いて量子化し、量子化雑音の少ない状態で記録するのが好ましい。これに対し、音BおよびDは、たとえ量子化雑音の少ない状態で再生されたとしても聞き取れない可能性が高いので、多数のビットを用いて量子化し記録するのは無益である。
【0025】
有効量子化領域計算手段102は、このような考え方に従い、人間の聴覚特性からみて無駄のないビット数でオーディオ信号の信号成分の量子化を行うべく、上述した有効量子化領域を各ユニット毎に求めるものである。以下、図6を参照し、この方法について説明する。
【0026】
まず、各ユニットの指数部の代表値(M個)から元のオーディオ信号の信号成分のエネルギ121を計算する。次いで、このエネルギ121の分布に基づき元のオーディオ信号に含まれる主要な音(エネルギレベルが高い音)によって生じるマスキング効果のマスキングレベル122を求める。
【0027】
次にこのようにして求めた元のオーディオ信号の信号成分のエネルギ121と、マスキングレベル122と、人間の本来的な可聴エネルギレベル123とに基づき、各ユニット毎に有効量子化領域を計算する。すなわち、各ユニット毎に、当該ユニットにおける信号成分のエネルギレベル121を上限とし、マスキングレベル122または可聴エネルギレベル123のうち大きい方を下限とする領域124を有効量子化領域として求めるのである。このようにして求めた有効量子化領域内の信号成分が後述する量子化の対象とされ、無駄のない量子化が行われるのである。
【0028】
次にビット割当決定手段103、量子化手段104および記録手段105について説明する。各ユニットの仮数部の記録に使用可能な総ビット数は予め定まっている。このため、使用可能な総ビット数を各ユニットに分配し、各ユニットに属する信号成分の仮数部を表現するのに使用することとなる。ビット割当決定手段103は、この各ユニットの信号成分の仮数部に対して割り当てるビット数を決定する。
【0029】
この各ユニット毎の仮数部のビット数は、上述のようにして求めた有効量子化領域内の各信号成分を量子化することができ、かつ、量子化を行った場合の量子化誤差がマスキングレベルまたは可聴エネルギレベルのうち大きい方よりも小さくなるように決定する。マスキングレベルや可聴エネルギレベルよりもエネルギレベルの小さな量子化雑音ならば、たとえ発生したとしても聞き取れない可能性が高いからである。
【0030】
ここで、各ユニットの有効量子化領域が広い場合には、総ビット数が不足することも考えられる。この場合には、エネルギレベルの高いユニットを順次選択し、総ビット数から一定ビット数ずつ取り出して割り当ててゆく方法を採る。すなわち、まず、全ユニットのうち最もエネルギレベルの高い成分を有するユニットを選択し、このユニットに例えば2ビットを割り当て、このユニットの成分のエネルギレベルをこの割り当てたビット数相当(例えば12dB)だけ下げる。このエネルギレベルの修正後、全ユニットのうち最もエネルギレベルの高い成分を有するユニットを選択し、このユニットにビット割り当てを行い、このユニットの成分のエネルギレベルをこの割り当てたビット数相当だけ下げる。以下、総ビット数がなくなるまで同様のことを繰り返すことで各ユニットへのビット割り当てを行うのである。
【0031】
量子化手段104は、このようにして各ユニットに割り当てられたビット数を使用して各ユニットに属する信号成分(N個)の仮数部の量子化を行う。そして、記録手段105は、各ユニットの指数部および量子化後の仮数部を記録媒体に記録する。
【0032】
A2.デジタルオーディオ信号の再生処理
図7は、上記方法により圧縮記録された情報を読み出して伸長し、元のオーディオ信号を再生する装置の構成を示すものである。この装置は、読取手段201、有効量子化領域計算手段202、ビット割当決定手段203、データ再構成手段204および帯域合成手段205からなる。以下、順に説明する。
【0033】
まず、読取手段201は、記録媒体に記録されたM個のユニットの指数部(代表値を量子化したもの)を読み出す。
【0034】
次に、有効量子化領域計算手段202は、この読み出した各ユニットの指数部を用いて、上述した有効量子化領域計算手段102が行ったのと全く同じ方法により各ユニットの有効量子化領域を計算する。すなわち、各ユニットの指数部から元のオーディオ信号のエネルギ分布を計算し、このエネルギ分布から元のオーディオ信号に対応したマスキングレベルを求め、元のオーディオ信号のエネルギ分布とマスキングレベルと可聴エネルギレベルとに基づいて各ユニット毎に有効量子化領域を求めるのである。
【0035】
そして、ビット割当決定手段203は、上述したビット割当決定手段103と全く同じ方法により、各ユニットの有効量子化領域と記録用の総ビット数から、各ユニットの信号成分の仮数部の量子化に使用するビット数を決定する。
【0036】
このようにして圧縮記録時に各ユニットに割り当てられた仮数部の量子化のためのビット数が求められると、読取手段201は、この各ユニットのビット数を基に、各ユニットに属する信号成分の仮数部(N個)を記録媒体から読み出す。
【0037】
データ再構成手段204は、このようにして得られた各ユニットの信号成分の指数部と仮数部から元の成分(N個)を生成する。そして、帯域合成手段205は、これらの信号成分にIDCT(逆離散コサイン変換)処理を施すことにより元のオーディオ信号を合成する。
【0038】
B.本発明の実施形態に係るデジタルオーディオ信号のミキシング処理
図8はこの発明の一実施形態であるデジタルオーディオ信号のミキシング装置の構成を示すものである。このミキシング装置は、上記圧縮記録装置(図1)により複数の記録媒体に記録されたデジタルオーディオ信号を読み出し、これらのデジタルオーディオ信号をミキシングして新たなデジタルオーディオ信号を生成するものである。なお、図8では、説明の便宜のため、3個の記録媒体に記録されたデジタルオーディオ信号のミキシングを行う場合の例を示したが、これと全く同じ原理により、2個あるいは4個以上の記録媒体に記録されたデジタルオーディオ信号のミキシングを行うことも勿論可能である。
【0039】
読取手段301〜303、有効量子化領域計算手段311〜313、ビット割当決定手段321〜323およびデータ再構成手段331〜333は、既に図7を参照して説明したものと全く同じ処理を行う構成要素である。
【0040】
すなわち、このミキシング装置では、3個の記録媒体の各々について次の処理が行われる。まず、読取手段301〜303により各記録媒体から各デジタルオーディオ信号の信号成分の指数部(各ユニット毎の代表値)が読み出され、有効量子化領域計算手段311〜313により各信号成分の指数部から有効量子化領域が求められる。次にビット割当決定手段321〜323により、有効量子化領域と記録用の総ビット数から各ユニットに属する信号成分の仮数部に対するビット割り当てが決定される。次に、各ユニットについて求められた仮数部のビット数を基に、各記録媒体から各ユニットの仮数部(N個)が読み出される。そして、データ再構成手段331〜333により、既に求められた指数部と仮数部から元の信号成分(N個)が生成される。
【0041】
このようにして各記録媒体に記録されたデジタルオーディオ信号から元のオーディオ信号の各信号成分が得られる訳であるが、従来の技術においては、これらの各オーディオ信号の各信号成分にIDCT処理を施し、各々を時間領域の信号(すなわち、PCMデータあるいはアナログ信号)に戻してからミキシングを行った。これに対し、本実施形態では、各記録媒体から再生された各オーディオ信号の各信号成分をそのままの状態でミキシングする。
【0042】
まず、データ再構成手段331〜333により3種類のオーディオ信号の各信号成分が既に得られているので、ミキシング手段340により、これらの各信号成分のミキシングを行う。すなわち、3種類のオーディオ信号の各信号成分にミキシング用のゲインを乗じ、このゲインの付与された各信号成分について同じ周波数に対応したもの同士を加算するのである。この結果、3種類のオーディオ信号をミキシングしたオーディオ信号の各信号成分が得られる。
【0043】
また、データ再構成手段331〜333およびミキシング手段340が上記の各処理を行っている間、これと並行し、有効量子化領域合成手段350およびビット割当決定手段360は以下の処理を行う。
【0044】
有効量子化領域合成手段350は、まず、3種類のオーディオ信号の有効量子化領域の上限およびマスキングレベルを各オーディオ信号に付与するゲインに応じて調整する。すなわち、ゲインの付与により元の状態よりもオーディオ信号のエネルギレベルが増大する場合にはその比率に相当する分だけ有効量子化領域の上限およびマスキングレベルを高エネルギレベル側にシフトし、元の状態よりもエネルギレベルが減衰する場合にはその比率に相当する分だけ有効量子化領域の上限およびマスキングレベルを低エネルギレベル側にシフトするのである。
【0045】
図9において、401〜403はこの調整後の3種類のオーディオ信号の各有効量子化領域の上限を各々例示したものであり、411〜413は調整後のマスキングレベルを各々例示したものである。また、420は可聴エネルギレベルを表している。
【0046】
次に有効量子化領域合成手段350は、これらの有効量子化領域の上限、マスキングレベルおよび可聴エネルギレベルを用いて、ミキシング後のオーディオ信号に適用すべき有効量子化領域を合成する。具体的には、各有効量子化領域401〜403の上限のうち最大のものを選択し、ミキシング後の有効量子化領域の上限とする。また、各マスキングレベル411〜413または可聴エネルギレベルのうち最大のものを選択し、ミキシング後の有効量子化領域の下限とする。このような操作を各ユニット毎に行うことにより、図10に例示するようなミキシング後の有効量子化領域430を求める。
【0047】
次にビット割当決定手段360は、ミキシング後のオーディオ信号の信号成分の仮数部を表現するためのビット数の割り当てを上述した各ユニット毎に決定する。この場合、各ユニットに割り当てるビット数は、量子化対象となる全ての信号成分の仮数部に対応したビット数の総和が記録に使用可能な総ビット数を越えないことを条件に、各ユニットについて求めた各有効量子化領域430に応じたビット数となるように決定する。
【0048】
量子化手段370は、ビット割当決定手段360により各ユニット毎に決定された仮数部のビット数に従い、各ユニットに属するミキシング後のオーディオ信号の信号成分の仮数部の量子化を行う。
【0049】
そして、出力手段380は、以上のようにして得られた信号成分の指数部および仮数部を含むデジタルオーディオ信号を記録媒体に記録し、あるいは外部に送信する。
【0050】
C.他の実施形態
以上、この発明の一実施形態について説明したが、この発明の適用範囲はこれに限定されるものではなく、様々な変形した態様で実施可能である。例えば、上記実施形態では、各デジタルオーディオ信号から求めたマスキングレベル411〜413を合成したものをミキシング後のオーディオ信号に適用されるべきマスキングレベルとして使用したが、各オーディオ信号のエネルギレベル401〜403の最大値をとることによりミキシング後のオーディオ信号のエネルギレベルの分布を求め、このエネルギレベルの分布からミキシング後のオーディオ信号に適用されるべきマスキングレベルを求めてもよい。
【0051】
【発明の効果】
以上説明したように、この発明によれば、各々が任意のオーディオ信号であり、かつ、各々のオーディオ信号を周波数の異なる複数の信号成分に分割し、各信号成分を量子化することにより得られた複数のデジタルオーディオ信号を1つのデジタルオーディオ信号に合成する際に、前記複数のデジタルオーディオ信号間で同一周波数の信号成分同士のミキシングを行い、このミキシングにより得られた各信号成分の量子化を行うことにより複数のデジタルオーディオ信号をミキシングした1つのデジタルオーディオ信号を生成するようにしたので、圧縮された複数のデジタルオーディオ信号を少ない演算処理量でミキシングすることができ、かつ、その際の信号劣化が少なくて済むという効果がある。
【図面の簡単な説明】
【図1】 本発明が適用されるデジタルオーディオ信号の圧縮記録装置の構成例を示す図である。
【図2】 同圧縮記録装置において行われる帯域分割処理の実行例を示す図である。
【図3】 人間の聴覚特性を例示する図である。
【図4】 マスキング効果を説明する図である。
【図5】 マスキング効果を考慮した実効的な聴覚特性を例示する図である。
【図6】 上記圧縮記録装置において行われる有効量子化領域計算処理の内容を示す図である。
【図7】 上記圧縮記録装置によって記録されたデジタルオーディオ信号を再生する装置の構成例を示す図である。
【図8】 この発明の一実施形態であるデジタルオーディオ信号のミキシング装置の構成を示すブロック図である。
【図9】 同実施形態における有効量子化領域合成手段の処理内容を示す図である。
【図10】 同実施形態における有効量子化領域合成手段の処理内容を示す図である。
【図11】 従来のデジタルオーディオ信号のミキシング装置の構成を示すブロック図である。
【符号の説明】
301〜303……読取手段、311〜313……有効量子化領域計算手段、
321〜323……ビット割当決定手段、
331〜333……データ再構成手段、
350……有効量子化領域合成手段、306……ビット割当決定手段、
340……ミキシング手段、370……量子化手段、380……出力手段。
Claims (4)
- 各々、オーディオ信号を周波数の異なった信号成分に分割し、各信号成分の指数部および仮数部を量子化することにより得られた複数の圧縮デジタルオーディオ信号のミキシング方法において、
ミキシング対象である複数の圧縮デジタルオーディオ信号の各々について、当該圧縮デジタルオーディオ信号における元のオーディオ信号の各信号成分の指数部を量子化したデータに基づき、各信号成分が帰属する周波数帯域毎のエネルギレベルを求め、
前記複数の圧縮デジタルオーディオ信号間で同一周波数の信号成分同士を加算し、
前記複数の圧縮オーディオ信号から各々求めた前記周波数帯域毎のエネルギレベルを同一の周波数帯域同士で合成することにより、ミキシング後のエネルギレベルを前記周波数帯域毎に求め、
前記周波数帯域毎に、前記ミキシング後のエネルギレベルを上限とし、人間の聴覚により聴取可能なエネルギレベルの上限である可聴エネルギレベルを下限とするミキシング後の有効量子化領域を求め、前記周波数帯域毎に、前記ミキシング後の有効量子化領域と量子化に使用可能な総ビット数とから該周波数帯域の信号成分のミキシング後の仮数部を表現するためのビット数を求め、
前記周波数帯域毎に求められたビット数に従って、前記周波数帯域毎に加算された各信号成分の仮数部の量子化を行う
ことを特徴とする圧縮デジタルオーディオ信号のミキシング方法。 - 各々、オーディオ信号を周波数の異なった信号成分に分割し、各信号成分の指数部および仮数部を量子化することにより得られた複数のデジタルオーディオ信号のミキシング方法において、
A.ミキシング対象である複数のデジタルオーディオ信号の各々について、
a.当該デジタルオーディオ信号によって表された元のオーディオ信号の各信号成分を各々の周波数により分類することにより、各々周波数の異なった複数の周波数帯域に帰属させ、
b.前記デジタルオーディオ信号における元のオーディオ信号の各信号成分の指数部を量子化したデータに基づき、前記複数の周波数帯域毎に元のオーディオ信号の信号成分のエネルギレベルを求め、
c.前記複数の周波数帯域毎に求めた元のオーディオ信号の信号成分のエネルギレベルに基づき、元のオーディオ信号の発生により聴取が妨げられる信号成分のエネルギレベルの上限であるマスキングレベルを求め、
d.前記複数の周波数帯域毎に、当該周波数帯域について求めた信号成分のエネルギレベルを上限とし、前記マスキングレベルまたは人間の聴覚により聴取可能なエネルギレベルの上限である可聴エネルギレベルのうち大きい方を下限とする有効量子化領域を求め、
e.前記各周波数帯域に対応した各有効量子化領域と量子化に使用可能な総ビット数とから前記各周波数帯域に属する各信号成分の仮数部を表現するために使用されているビット数を求め、
f.各周波数帯域について求めた仮数部のビット数に従って前記デジタルオーディオ信号に含まれる前記各周波数帯域に属する信号成分の仮数部を取り出し、
B.前記複数のデジタルオーディオ信号から各々得られた複数の元のオーディオ信号の各信号成分に各々ゲインを付与して加算することにより、ミキシング後のオーディオ信号の各信号成分を求め、
C.前記複数のデジタルオーディオ信号から各々求めた複数の元のオーディオ信号の前記複数の周波数帯域毎の信号成分のエネルギレベルを合成することにより、前記ミキシング後のオーディオ信号の前記複数の周波数帯域毎の信号成分のエネルギレベルを求め、
D.前記複数のデジタルオーディオ信号から各々求めた前記マスキングレベルを合成することにより、前記ミキシング後のオーディオ信号に適用されるマスキングレベルを合成し、
E.前記複数の周波数帯域毎に、前記ミキシング後のオーディオ信号の信号成分のエネルギレベルを上限とし、前記マスキングレベルまたは前記可聴エネルギレベルのうち大きい方を下限とするミキシング後の有効量子化領域を求め、
F.前記複数の周波数帯域についての前記ミキシング後の有効量子化領域と量子化用に使用可能な総ビット数とから前記複数の周波数帯域に各々に属する信号成分の仮数部を表現するためのビット数を各周波数帯域毎に求め、
G.前記各周波数帯域について求めた仮数部のビット数に従って、前記ミキシング後のオーディオ信号の各周波数帯域の信号成分の仮数部の量子化を行うことにより、前記複数のオーディオ信号をミキシングしたものに対応したデジタルオーディオ信号を生成することを特徴とするデジタルオーディオ信号のミキシング方法。 - 各々、オーディオ信号を周波数の異なった信号成分に分割し、各信号成分の指数部および仮数部を量子化することにより得られた複数の圧縮デジタルオーディオ信号のミキシングを行うミキシング装置において、
ミキシング対象である複数の圧縮デジタルオーディオ信号の各々について、当該圧縮デジタルオーディオ信号における元のオーディオ信号の各信号成分の指数部を量子化したデータに基づき、各信号成分が帰属する周波数帯域毎のエネルギレベルを求めるエネルギレベル算出手段と、
前記複数の圧縮デジタルオーディオ信号間で同一周波数の信号成分同士を加算するミキシング手段と、
前記複数の圧縮オーディオ信号から各々求めた前記周波数帯域毎のエネルギレベルを同一の周波数帯域同士で合成することにより、ミキシング後のエネルギレベルを前記周波数帯域毎に求めるエネルギレベル合成手段と、
前記周波数帯域毎に、前記ミキシング後のエネルギレベルを上限とし、人間の聴覚により聴取可能なエネルギレベルの上限である可聴エネルギレベルを下限とするミキシング後の有効量子化領域を求め、前記周波数帯域毎に、前記ミキシング後の有効量子化領域と量子化に使用可能な総ビット数とから該周波数帯域の信号成分のミキシング後の仮数部を表現するためのビット数を求めるビット割当決定手段と、
前記周波数帯域毎に求められたビット数に従って、前記周波数帯域毎に加算された各信号成分の仮数部の量子化を行う量子化手段と
を具備することを特徴とする圧縮デジタルオーディオ信号のミキシング装置。 - 各々、オーディオ信号を周波数の異なった信号成分に分割し、各信号成分の指数部および仮数部を量子化することにより得られた複数のデジタルオーディオ信号のミキシングを行うミキシング装置において、
A.ミキシング対象である複数のデジタルオーディオ信号の各々に対応して設けられた手段であって、
a.当該デジタルオーディオ信号によって表された元のオーディオ信号の各信号成分を各々の周波数により分類することにより、各々周波数の異なった複数の周波数帯域に帰属させ、
b.前記デジタルオーディオ信号における元のオーディオ信号の各信号成分の指数部を量子化したデータに基づき、前記複数の周波数帯域毎に元のオーディオ信号の信号成分のエネルギレベルを求め、
c.前記複数の周波数帯域毎に求めた元のオーディオ信号の信号成分のエネルギレベルに基づき、元のオーディオ信号の発生により聴取が妨げられる信号成分のエネルギレベルの上限であるマスキングレベルを求め、
d.前記複数の周波数帯域毎に、当該周波数帯域について求めた信号成分のエネルギレベルを上限とし、前記マスキングレベルまたは人間の聴覚により聴取可能なエネルギレベルの上限である可聴エネルギレベルのうち大きい方を下限とする有効量子化領域を求め、
e.前記各周波数帯域に対応した各有効量子化領域と量子化に使用可能な総ビット数とから前記各周波数帯域に属する各信号成分の仮数部を表現するために使用されているビット数を求め、
f.各周波数帯域について求めた仮数部のビット数に従って前記デジタルオーディオ信号に含まれる前記各周波数帯域に属する信号成分の仮数部を取り出す信号成分再生手段と、
B.前記複数のデジタルオーディオ信号から各々得られた複数の元のオーディオ信号の各信号成分に各々ゲインを付与して加算することにより、ミキシング後のオーディオ信号の各信号成分を求めるミキシング手段と、
C.前記複数のデジタルオーディオ信号から各々求めた複数の元のオーディオ信号の前記複数の周波数帯域毎の信号成分のエネルギレベルを合成することにより、前記ミキシング後のオーディオ信号の前記複数の周波数帯域毎の信号成分のエネルギレベルを求めるエネルギレベル合成手段と、
D.前記複数のデジタルオーディオ信号から各々求めた前記マスキングレベルを合成することにより、前記ミキシング後のオーディオ信号に適用されるマスキングレベルを合成するマスキングレベル合成手段と、
E.前記複数の周波数帯域毎に、前記ミキシング後のオーディオ信号の信号成分のエネルギレベルを上限とし、前記マスキングレベルまたは前記可聴エネルギレベルのうち大きい方を下限とするミキシング後の有効量子化領域を求める有効量子化領域合成手段と、
F.前記複数の周波数帯域についての前記ミキシング後の有効量子化領域と量子化用に使用可能な総ビット数とから前記複数の周波数帯域に各々に属する信号成分の仮数部を表現するためのビット数を各周波数帯域毎に求めるビット割当決定手段と、
G.前記各周波数帯域について求めた仮数部のビット数に従って、前記ミキシング後のオーディオ信号の各周波数帯域の信号成分の仮数部の量子化を行うことにより、前記複数のオーディオ信号をミキシングしたものに対応したデジタルオーディオ信号を生成する量子化手段とを具備することを特徴とするデジタルオーディオ信号のミキシング装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20093598A JP4174859B2 (ja) | 1998-07-15 | 1998-07-15 | デジタルオーディオ信号のミキシング方法およびミキシング装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP20093598A JP4174859B2 (ja) | 1998-07-15 | 1998-07-15 | デジタルオーディオ信号のミキシング方法およびミキシング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000029498A JP2000029498A (ja) | 2000-01-28 |
JP4174859B2 true JP4174859B2 (ja) | 2008-11-05 |
Family
ID=16432750
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP20093598A Expired - Fee Related JP4174859B2 (ja) | 1998-07-15 | 1998-07-15 | デジタルオーディオ信号のミキシング方法およびミキシング装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4174859B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9299357B2 (en) | 2013-03-27 | 2016-03-29 | Samsung Electronics Co., Ltd. | Apparatus and method for decoding audio data |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6725110B2 (en) | 2000-05-26 | 2004-04-20 | Yamaha Corporation | Digital audio decoder |
JP2002175098A (ja) * | 2000-09-21 | 2002-06-21 | Matsushita Electric Ind Co Ltd | 符号化装置、符号化方法、プログラムおよびプログラム記録媒体 |
JP2003058198A (ja) * | 2001-08-21 | 2003-02-28 | Canon Inc | 音声出力装置、音声出力方法、及び、プログラム |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
JP5163545B2 (ja) | 2009-03-05 | 2013-03-13 | 富士通株式会社 | オーディオ復号装置及びオーディオ復号方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04161953A (ja) * | 1990-10-25 | 1992-06-05 | Fuji Photo Film Co Ltd | ハロゲン化銀カラー反転写真感光材料 |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
JP3254953B2 (ja) * | 1995-02-17 | 2002-02-12 | 日本ビクター株式会社 | 音声高能率符号化装置 |
JPH08237757A (ja) * | 1995-02-28 | 1996-09-13 | Nippon Television Network Corp | 通信方法及びその装置 |
JP3761639B2 (ja) * | 1995-09-29 | 2006-03-29 | ユナイテッド・モジュール・コーポレーション | オーディオ復号装置 |
JPH09102742A (ja) * | 1995-10-05 | 1997-04-15 | Sony Corp | 符号化方法および装置、復号化方法および装置、並びに記録媒体 |
JP3663555B2 (ja) * | 1996-01-30 | 2005-06-22 | 富士通株式会社 | 多地点会議装置 |
-
1998
- 1998-07-15 JP JP20093598A patent/JP4174859B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9299357B2 (en) | 2013-03-27 | 2016-03-29 | Samsung Electronics Co., Ltd. | Apparatus and method for decoding audio data |
Also Published As
Publication number | Publication date |
---|---|
JP2000029498A (ja) | 2000-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5124068B2 (ja) | ディジタル・サウンド・レコーディングの音量調整の方法 | |
US5864820A (en) | Method, system and product for mixing of encoded audio signals | |
JP3765622B2 (ja) | オーディオ符号化復号化システム | |
JP5585401B2 (ja) | 再生装置、再生方法、提供装置および再生システム | |
JP2001142498A (ja) | ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体 | |
KR20020002241A (ko) | 디지털 오디오장치 | |
JP4174859B2 (ja) | デジタルオーディオ信号のミキシング方法およびミキシング装置 | |
US5864813A (en) | Method, system and product for harmonic enhancement of encoded audio signals | |
JP3580444B2 (ja) | 信号伝送方法および装置、並びに信号再生方法 | |
Stuart | Coding for high-resolution audio systems | |
JPWO2005057550A1 (ja) | 音声圧縮伸張装置 | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
JP4515643B2 (ja) | 磁気テープレコーダでのコピーを防止するためのシステム | |
JP2003243952A (ja) | デジタルオーディオシステム、自動音量調整要素生成方法、自動音量調整方法、自動音量調整要素生成プログラム、自動音量調整プログラム、自動音量調整要素生成プログラムが記録された記録媒体及び自動音量調整プログラムが記録された記録媒体 | |
JP4311541B2 (ja) | オーディオ信号圧縮装置 | |
JP2002109824A (ja) | ディジタル音声信号の記録方法、およびその装置 | |
US8195317B2 (en) | Data reproduction apparatus and data reproduction method | |
JP2002156998A (ja) | オーディオ信号のビットストリーム処理方法、この処理方法を記録した記録媒体、及び処理装置 | |
JPH06289900A (ja) | オーディオ符号化装置 | |
JP2000293199A (ja) | 音声符号化方法および記録再生装置 | |
JP3481918B2 (ja) | オーディオ信号符号化・復号化装置 | |
JPH11330974A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JP2816052B2 (ja) | オーディオデータ圧縮装置 | |
JP2000347697A (ja) | 音声記録再生装置および記録媒体 | |
JP3227948B2 (ja) | 復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070123 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080811 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110829 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120829 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130829 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |