JP3765622B2 - オーディオ符号化復号化システム - Google Patents
オーディオ符号化復号化システム Download PDFInfo
- Publication number
- JP3765622B2 JP3765622B2 JP19844396A JP19844396A JP3765622B2 JP 3765622 B2 JP3765622 B2 JP 3765622B2 JP 19844396 A JP19844396 A JP 19844396A JP 19844396 A JP19844396 A JP 19844396A JP 3765622 B2 JP3765622 B2 JP 3765622B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency component
- circuit
- frequency
- signal
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims description 63
- 238000013139 quantization Methods 0.000 claims description 61
- 230000005236 sound signal Effects 0.000 claims description 31
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000010586 diagram Methods 0.000 description 18
- 230000003044 adaptive effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の属する技術分野】
本発明は、オーディオデータを圧縮して伝送あるいは記録媒体に記録するとともに、圧縮されたオーディオデータを再生の際に伸張するオーディオ符号化復号化システムに関する。
【0002】
【従来の技術】
従来、オーディオ信号の符号化方式については、様々な方式が知られている。その一例として、時間領域の信号を周波数領域の信号に変換する時間/周波数変換を用いてオーディオ信号を変換し、周波数領域で符号化を行う方法がある。時間/周波数変換としては、例えば、サブバンドフィルタやMDCT(Modified Discrete Cosine Transform)を用いた方式が挙げられる。
【0003】
なお、サブバンドフィルタ符号化方式およびMDCT符号化方式の概要については、例えば、MARCEL DEKKAR 社(New York)1991年出版、 FURUI&SONDHI編の“ Adbances in Speech Signal Processing ”の109 ページから140 ページに記載されている。サブバンドフィルタ符号化方式の一例として、MPEGオーディオ方式と呼ばれる国際標準規格であるISO/IEC 11172−3の方式があり、MDCT符号化方式の一例として、AC−3符号化方式がある。
【0004】
図8は、従来のオーディオ符号化装置の一例を示す図である。
図8において、入力端子31に入力されたディジタルオーディオ信号は、時間/周波数変換回路32により、所定時間毎に(この時間間隔を変換ブロック長と呼ぶことにする)時間領域の信号から周波数領域の信号へと変換され、符号化の効率を上げるために複数の周波数帯域に分割される。
【0005】
このようにして変換された周波数領域のオーディオ信号は、量子化回路33に供給される。量子化回路33では、分割された各周波数帯域ごとにフローティング処理と量子化処理とが行われる。ここで、フローティング処理とは、その後の量子化処理の精度を高くするために、上記分割された帯域内の各データに共通の値をかけて、その値を大きくする処理である。なお、量子化精度を考慮しない場合には、このフローティング処理は行われない。
【0006】
具体的には、各帯域に含まれる各データの絶対値が最大のものを探し出し、この最大値が飽和しない、すなわち“1”を越えない範囲でなるべく大きな値とするようなフローティング係数を用いてフローティング処理を行うのが一例としてある。表1に、上記ISO/IEC 11172−3の方式で使用されるフローティング係数の一例を示す。
【0007】
【表1】
【0008】
図8の符号化装置では、表1のフローティング係数の中から適当な値を用いてフローティング処理を行う。例えば、ある周波数帯域内の各データの最大の絶対値が 0.75 であった場合、表1のフローティング係数の中の1つで、その逆数を 0.75 に乗じた値が“1”を越えない範囲で最大となるもの、すなわち 0.79370052598410 をフローティング係数として選択し、そのフローティング係数の逆数を当該帯域内の各データにかけ算することで、フローティング処理を行う。
【0009】
なお、符号化装置内で使用するフローティング係数は、実際には対応するインデックス値(上述の例の場合は“4”)により代表され、伝送される。すなわち、量子化回路33のフローティング処理で選択されたフローティング係数として、インデックス値“4”が多重化回路34に伝送される。復号化の際には、同じフローティング係数の表1を用いることになる。
【0010】
上記入力端子31に入力されたディジタルオーディオ信号は、適応的ビット割り当て回路35へも供給される。適応的ビット割り当て回路35では、入力信号の特性を計算し、その信号特性を用いて各周波数帯域毎のビット割り当て数を決定する。例えば、人の聴覚特性を利用して聞こえにくさに応じて量子化精度を適応的に変化させるように、各周波数成分へのビット割り当て数を決定する。
【0011】
ここで、人の聴覚特性とは、例えば周波数が低い領域では人の聴覚があまり敏感でないため、音量レベルが小さいときには低周波の音が聞きづらくなるという最小可聴特性や、ある周波数スペクトルのピーク近傍の周波数では聴感度が低下するというマスキング特性のことを言う。
【0012】
このように人の聴覚特性を利用してビット割り当てを行っているのは、各周波数成分に対して人の聴覚の聞こえやすさ聞こえにくさをモデル化し、比較的聞こえにくい周波数成分に対してはビット割り当て数を少なくすることで、情報量の削減を実現するためである。
【0013】
上記適応的ビット割り当て回路35で決定されたビット割り当て数は、ビット長情報として量子化回路33に出力される。量子化回路33では、フローティング処理を施した後のデータに対して、各周波数帯域毎に適応的なビット長で量子化を行う。そして、この量子化回路33で量子化されたオーディオデータ、フローティング係数およびビット長情報が多重化回路34で多重化され、符号化データとして出力端子37より出力される。
【0014】
図9は、従来のオーディオ復号化装置の一例を示す図であり、上記図8のオーディオ符号化装置で圧縮されたオーディオデータを伸長するための構成を示す。また、図10は、図9中のオーディオデータ復号回路51の詳しい構成を示す図である。
【0015】
図9において、符号化されたオーディオデータは、入力端子1を介してオーディオデータ復号回路51に入力される。このオーディオデータ復号回路51の入力段には、図10に示すように、多重分離回路11が備えられており、上記符号化されたオーディオデータは、まず最初にこの多重分離回路11に入力される。多重分離回路11では、複数の周波数帯域毎に多重化されている各帯域毎のオーディオデータとフローティング係数とビット長情報とを分離する。
【0016】
ここで分離されたオーディオデータは、逆量子化回路12に供給され、各周波数帯域ごとに逆量子化処理と逆フローティング処理とが行われる。逆量子化処理は、多重分離回路11で分離された各周波数成分毎のビット長情報をもとに行われる。また、逆フローティング処理は、各周波数帯域毎に逆量子化されたデータに対して、多重分離回路11で分離された表1のインデックス値で示されるフローティング係数をかけ算することによって行われる。
【0017】
上記逆量子化回路12で逆量子化処理、逆フローティング処理が施されたオーディオデータは、次に周波数/時間変換回路14で周波数領域の信号から時間領域の信号に変換される。そして、このようにして時間領域の信号へと復号されたディジタルオーディオ信号は、出力端子15を介して次段のDA変換回路3に供給される。
【0018】
上記オーディオデータ復号回路51で再構成されたディジタルオーディオ信号は、DA変換回路3でアナログ信号に変換されるとともに、音量調整回路4で音量レベルが調整された後、出力補正回路52を介して出力端子5から出力される。ここで、音量調整は、オーディオ復号化装置の利用者が、図示しないボリューム等を使って好みの音量に自由に調整するものである。
【0019】
上述したように、人の聴覚には、周波数の低い領域の成分が音量の小さいときに聞こえづらくなるという性質があるため、小音量でオーディオ信号を再生する場合には、低音の周波数成分が削れたように聞こえてしまい、聴感上の音質が悪くなるという現象が生じる。これを解消するために、出力補正回路52では、設定された出力音量情報に応じて低域の周波数成分を強調するような補正がかけられる。
【0020】
【発明が解決しようとする課題】
上述のような出力補正回路52の一例としては、米国特許第4739514号が挙げられる。この特許では、時間領域の信号に対して低周波成分をアナログ処理によって動的補正するバンドパスフィルタを利用している。しかしながら、このような回路では、オペアンプ等のアナログ回路素子を多数必要とし、回路規模が大きく複雑になってしまうという問題があった。
【0021】
また、人の聴覚には、低周波成分だけでなく、高周波成分についても同様に小音量再生時に音が聞こえづらくなるという性質もあるが、上述の特許では、低周波成分しか補正を行っていない。このように、高周波成分に関する補正を行っていないために、低周波成分に関する補正を行っていても全体としては聴感上の音質が悪くなってしまうという問題があった。
【0022】
さらに、オーディオ信号を符号化する際に、上述のような人の聴覚特性を利用してビット割り当てを行っているが、再生時に出力補正回路52で低周波成分を本来の信号成分の性質とは無関係に強調しているため、再生信号が符号化時に計算した聴覚モデルとは異なる性質を持つようになってしまう。このため、低域の量子化雑音が強調されてしまってその量子化雑音が聴感され、聴感上の音質が却って悪くなってしまう場合があるという問題もあった。
【0023】
本発明はこのような問題を解決するための成されたものであり、簡単な回路構成で聴感上の音質が優れた出力補正を実現するオーディオ符号化復号化システムを提供することを目的とする。
【0024】
【課題を解決するための手段】
本発明に係るオーディオ符号化復号化システムは、オーディオ信号を時間/周波数変換処理により周波数領域の信号に変換して量子化処理を用いて符号化する符号化装置と、上記符号化装置によって符号化されたオーディオデータを復号する復号化装置とを有するオーディオ符号化復号化システムであって、上記符号化装置は、上記量子化処理のために各周波数成分の信号に対してビット割り当てを行う際に、人の聴覚特性に基づいて計算されるビット割り当て数よりも多いビット数を低周波成分および高周波成分の信号に対して割り当てるようにするビット割り当て手段を備え、上記復号化装置は、周波数/時間変換処理を行う前の逆量子化処理の際に、周波数領域の信号に対して上記低周波成分および高周波成分を強調補正する補正手段を備えたことを特徴とする。
【0025】
上記復号化装置は、出力音量の調整を行う音量調整手段を更に備え、上記復号化装置内の補正手段は、上記音量調整手段に小音量の出力音量情報が設定されているときに、周波数/時間変換処理を行う前の周波数領域の信号に対して、人の聴覚特性上小音量時に聞こえにくくなる低周波成分および高周波成分を強調補正することが好ましい。
【0026】
上記符号化装置で行われる量子化処理は、フローティング処理を伴う量子化処理であって、上記復号化装置内の補正手段は、逆量子化処理を行う際に上記低周波成分および高周波成分の量子化データ又はフローティング係数を強調補正することが好ましい。
【0036】
符号化装置側において、人の聴覚特性に基づいて計算されるビット割り当て数に対して、追加のビット数が低周波成分および高周波成分の信号に対してあらかじめ割り当てられるようになるので、復号化装置側における強調補正で本来の信号成分とは異なる成分が強調されることによって生じる低周波成分や高周波成分の量子化雑音が抑制されるようになる。
【0037】
【発明の実施の形態】
以下に、本発明の詳細を一実施形態に基づき説明する。
図1は、本実施形態のオーディオ復号化装置の構成を示す図である。また、図2は、図1中に示される補正機能付オーディオデータ復号回路2の詳しい構成例を示す図である。
【0038】
図1において、符号化されたオーディオデータは、入力端子1を介して補正機能付オーディオデータ復号回路2に入力される。補正機能付オーディオデータ復号回路2では、符号化されたオーディオデータの復号を行う。この復号の際、後段の音量調整回路4から設定されている出力音量の大きさを表す出力音量情報を受け取り、後で述べるような補正を行う。
【0039】
この補正機能付オーディオデータ復号回路2で再成されたディジタルオーディオ信号は、DA変換回路3でアナログ信号に変換されるとともに、音量調整回路4で音量レベルが調整された後、出力端子5を介して出力される。ここで、音量調整は、オーディオ復号化装置の利用者が、図示しないボリューム等を使って好みの音量に自由に調整するものである。
【0040】
次に、図2を用いてオーディオデータの復号および補正の方法を詳しく説明する。図2において、上記符号化されたオーディオデータは、入力端子1を介して多重分離回路11に入力される。多重分離回路11では、複数の周波数帯域毎に多重化されている各帯域毎のオーディオデータとビット長情報とを分離する。符号化装置側でフローティング処理が行われている場合は、フローティング係数も分離する。
【0041】
ここで分離されたオーディオデータは、逆量子化回路12に供給され、各周波数帯域ごとに逆量子化処理と逆フローティング処理とが行われる。逆量子化処理は、多重分離回路11で分離された各周波数成分毎のビット長情報をもとに行われる。また、逆フローティング処理は、各周波数帯域毎に逆量子化されたデータに対して、多重分離回路11で分離された表1のインデックス値で示されるフローティング係数をかけ算することによって行われる。
【0042】
上記逆量子化回路12で逆量子化処理、逆フローティング処理が施された周波数領域のオーディオ信号は、補正回路13に供給され、周波数の低い成分と高い成分とに強調補正がかけられる。このようにして補正されたオーディオ信号は、次に周波数/時間変換回路14で周波数領域の信号から時間領域の信号に変換され、このように再構成されたディジタルオーディオ信号が出力端子15を介して次段のDA変換回路3に供給される。
【0043】
ところで、上記補正回路13での補正処理は、入力端子16を介して入力される出力音量情報に応じて所定の周波数成分に強調補正を施すことである。
図3は、この強調補正を実現するための補正回路13の一構成例を示す図であり、この例は、逆量子化回路12で逆量子化処理および逆フローティング処理を行って復号した後のオーディオ信号に対して補正を行う場合を示している。
【0044】
図3において、入力端子21を介して入力された逆量子化されたオーディオ信号は、かけ算回路22へと送られる。また、かけ算回路22には、選択回路24により補正乗数テーブル回路23から読み出された補正乗数も供給される。
【0045】
上記補正乗数テーブル回路23には、出力音量と周波数とに応じた補正乗数が種々記憶されている。つまり、出力音量レベルが小さいときに低周波成分と高周波成分とを強調補正するような補正乗数がテーブル情報として記憶されている。この場合、ある値より小さい出力音量レベルに対して固定の補正乗数(例えば2.0)を記憶するようにしても良いし、出力音量レベルが小さいもの程大きな値の補正乗数を記憶するようにしても良い。
【0046】
選択回路24は、入力端子16より入力される出力音量情報に基づいて、補正乗数テーブル回路23に記憶されている種々の補正乗数の中から何れかを選択し、それを読み出してかけ算回路22に供給する。このとき、低周波成分と高周波成分とで異なる値の補正乗数を読み出して供給するようにしても良い。
【0047】
かけ算回路22は、上記逆量子化されたオーディオ信号と、選択回路24により選択された補正乗数とをかけ算し、その結果得られる補正されたオーディオ信号を出力端子25を介して出力する。ここで、補正の必要がないとき(例えば、出力音量レベルがそれほど小さくないとき、あるいは低周波領域および高周波領域以外の領域であるとき)、つまり補正乗数が1.0であるときは、かけ算処理は行わず、逆量子化されたオーディオ信号をそのまま出力する。
【0048】
なお、この例では、かけ算回路22を示したが、より簡単な構成のシフト回路を用いることも可能である。また、補正乗数テーブル回路23の規模を小さく構成するために、周波数領域で逆量子化されたオーディオ信号を所定の単位毎にブロック化し、補正乗数の値をブロック内で共通化して記憶することで、補正乗数の数を減らすようにすることも可能である。
【0049】
このように、本実施形態では、周波数領域の信号に対して低周波成分と高周波成分とをディジタル処理によって強調補正しているので、従来よりも回路規模を小さく簡単にすることができる。また、本実施形態では、低周波成分だけでなく高周波成分についても強調補正を行っているので、低周波成分の音声も高周波成分の音声も共に聞き取りやすくすることができ、聴感上の音質を向上させることができる。
【0050】
図4は、上記補正機能付オーディオデータ復号回路2の他の構成例を示す図である。
図4において、多重分離回路11で分離されたオーディオデータは、補正を伴う逆量子化回路17に供給され、各周波数帯域ごとに逆量子化処理と逆フローティング処理とが行われる。さらに、この補正を伴う逆量子化回路17では、周波数領域のオーディオ信号に対して、周波数の低い成分と高い成分とに強調補正がかけられる。
【0051】
このようにして補正の施されたオーディオ信号は、次に周波数/時間変換回路14で周波数領域の信号から時間領域の信号に変換され、このように再構成されたディジタルオーディオ信号が出力端子15を介して次段のDA変換回路3に供給される。
【0052】
上記補正を伴う逆量子化回路17での補正処理の方法としては、例えば、▲1▼逆フローティング処理を行う前の逆量子化されたオーディオ信号に対して、出力音量レベルに応じてあらかじめ決められた係数を乗算する方法と、▲2▼フローティング係数に対してあらかじめ決められた係数を乗算する方法とが挙げられる。
【0053】
ここで、上記▲2▼の方法のように、フローティング係数に対して補正処理を施す場合は、更に回路規模の小さい補正回路を構成することが可能である。すなわち、従来例で説明したように、符号化の際にオーディオデータと一緒に多重化されるのは、フローティング係数そのものではなく、参照するテーブルのインデックス値である。
【0054】
そのため、例えば表1に示したテーブルを利用する場合にフローティング係数を2.0倍しようとするときは、補正を行う際にこの多重化されたインデックスの値を3だけ小さくすることにより、フローティング係数に2.0を乗算したことと同様の結果が得られる。この処理では、乗算回路ではなく加算回路だけで補正が可能となるので、回路規模をかなり小さく抑えることができる。
【0055】
図5に、上述のような強調補正処理による周波数成分の変化の様子の一例を示す。例えば、図2に示した補正回路13に、図5(A)のような周波数成分を持つ逆量子化されたオーディオ信号が入力されたとする。この場合、補正回路13では、図5(B)の太線で表した周波数成分を強調補正する。一例としては、1KHz以下の周波数成分と10KHz以上の周波数成分とを4〜10dB強調することにより、小音量再生時の音質を向上させることができる。
【0056】
なお、以上の説明では、本実施形態のオーディオ復号化装置はDA変換回路3を含むものとして、すなわち、オーディオ復号化装置の出力はアナログ信号であるものとして述べたが、これは必ずしも必要なことではなく、装置全体がディジタル回路で構成されていても良い。
【0057】
次に、本実施形態のオーディオ符号化装置の構成例を、図6に示す。
図6において、入力端子31に入力されたディジタルオーディオ信号は、時間/周波数変換回路32により、所定時間毎に時間領域の信号から周波数領域の信号へと変換され、符号化効率を上げるために複数の周波数帯域に分割される。
【0058】
このようにして変換された周波数領域のオーディオ信号は、量子化回路33に供給される。量子化回路33では、分割された各周波数帯域ごとにフローティング処理と量子化処理とが行われる。なお、図6の符号化装置では、表1のフローティング係数の中から適当な値を用いてフローティング処理が行われる。
【0059】
上記入力端子31に入力されたディジタルオーディオ信号は、適応的ビット割り当て回路35へも供給される。適応的ビット割り当て回路35では、入力信号の特性を計算し、その信号特性を用いて各周波数帯域毎のビット割り当て数を決定する。すなわち、人の聴覚特性を利用して聞こえにくさに応じて量子化精度を適応的に変化させるように、各周波数成分へのビット割り当て数を決定する。以上の処理は、図8の従来例と同じである。
【0060】
このように人の聴覚特性を利用してビット割り当てを行った場合、低周波成分と高周波成分との量子化精度が粗くなる。そのため、復号化装置側で上述のような強調補正を行った場合、量子化雑音が強調されて聴感され、音質が却って悪くなってしまう場合がある。これを解決するために、ビット割り当て補正回路36では、低周波成分と高周波成分とに対して追加のビット(例えば1ビット)を割り当てることにより、量子化精度をあらかじめ向上させている。
【0061】
図7は、上記ビット割り当て補正回路36の一構成例を示す図である。
図7において、適応的ビット割り当て回路35より入力端子41を介して入力される各周波数帯域毎の人の聴覚特性に基づくビット割り当て数は、加算回路42へと送られる。
【0062】
また、この加算回路42には、補正ビット数テーブル回路43に各周波数帯域毎に格納されている補正ビット数が読み出し回路44により読み出されて供給される。なお、補正の必要がないときは、補正ビット数は0となる。また、低周波領域と高周波領域とで異なる補正ビット数を設定することも可能である。
【0063】
加算回路42では、周波数帯域毎に、上記人の聴覚特性に基づくビット割り当て数と上記補正ビット数とを加算し、その加算結果を出力端子45より量子化回路33および多重化回路34に出力する。量子化回路33では、フローティング処理を施した後のデータに対して、各周波数帯域毎に補正されたビット長で量子化を行う。
【0064】
なお、図6の構成例では、適応的ビット割り当て回路35とビット割り当て補正回路36とを別個に設けているが、量子化雑音を考慮した補正量も含めたビット割り当て数を初めから設定するようにするビット割り当て回路を1つだけ設けるようにしても良い。
【0065】
このように、本実施形態では、符号化装置側で低周波成分と高周波成分とのビット割り当て数を上方補正した上で、復号化装置側で上述したような強調補正を行うようにしている。これにより、再生時に低周波成分と高周波成分とを本来の信号成分の性質と無関係に強調してしまう従来の不都合を防止することができ、量子化雑音を抑制することができる。
【0066】
【発明の効果】
本発明によれば、オーディオ符号化装置内に、量子化処理のために各周波数成分の信号に対してビット割り当てを行う際に、人の聴覚特性に基づいて計算されるビット割り当て数よりも多いビット数を低周波成分および高周波成分の信号に対して割り当てるようにするビット割り当て手段を備えるとともに、オーディオ復号化装置内に、周波数/時間変換処理を行う前の逆量子化処理の際に、周波数領域の信号に対して上記低周波成分および高周波成分を強調補正する補正手段を備えたので、復号化装置側における強調補正で本来の信号成分とは異なる成分が強調されることによって生じる低周波成分や高周波成分の量子化雑音を抑制することができ、音質を更に向上させることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態によるオーディオ復号化装置の構成例を示すブロック図である。
【図2】図1に示した補正機能付オーディオデータ復号回路の一構成例を示すブロック図である。
【図3】図2に示した補正回路の構成例を示すブロック図である。
【図4】図1に示した補正機能付オーディオデータ復号回路の他の構成例を示すブロック図である。
【図5】強調補正処理による周波数成分の変化の様子の一例を示す図である。
【図6】本発明の一実施形態によるオーディオ符号化装置の構成例を示すブロック図である。
【図7】図6に示したビット割り当て補正回路の構成例を示すブロック図である。
【図8】従来のオーディオ符号化装置の構成例を示すブロック図である。
【図9】従来のオーディオ復号化装置の構成例を示すブロック図である。
【図10】図9に示したオーディオデータ復号回路の構成例を示すブロック図である。
【符号の説明】
2 補正機能付オーディオデータ復号回路
13 補正回路
17 補正を伴う逆量子化回路
22 かけ算回路
23 補正乗数テーブル回路
24 選択回路
36 ビット割り当て補正回路
42 加算回路
43 補正ビット数テーブル回路
44 読み出し回路
Claims (4)
- オーディオ信号を時間/周波数変換処理により周波数領域の信号に変換して量子化処理を用いて符号化する符号化装置と、上記符号化装置によって符号化されたオーディオデータを復号する復号化装置とを有するオーディオ符号化復号化システムであって、上記符号化装置は、上記量子化処理のために各周波数成分の信号に対してビット割り当てを行う際に、人の聴覚特性に基づいて計算されるビット割り当て数よりも多いビット数を低周波成分および高周波成分の信号に対して割り当てるようにするビット割り当て手段を備え、上記復号化装置は、周波数/時間変換処理を行う前の逆量子化処理の際に、周波数領域の信号に対して上記低周波成分および高周波成分を強調補正する補正手段を備えたことを特徴とするオーディオ符号化復号化システム。
- 上記復号化装置は、出力音量の調整を行う音量調整手段を更に備え、上記復号化装置内の補正手段は、上記音量調整手段に小音量の出力音量情報が設定されているときに、周波数/時間変換処理を行う前の周波数領域の信号に対して、人の聴覚特性上小音量時に聞こえにくくなる低周波成分および高周波成分を強調補正することを特徴とする請求項1に記載のオーディオ符号化復号化システム。
- 上記符号化装置で行われる量子化処理は、フローティング処理を伴う量子化処理であって、上記復号化装置内の補正手段は、逆量子化処理を行う際に上記低周波成分および高周波成分の量子化データを強調補正することを特徴とする請求項1または2に記載のオーディオ符号化復号化システム。
- 上記符号化装置で行われる量子化処理は、フローティング処理を伴う量子化処理であって、上記復号化装置内の補正手段は、逆量子化処理を行う際に上記低周波成分および高周波成分のフローティング係数を強調補正することを特徴とする請求項1または2に記載のオーディオ符号化復号化システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19844396A JP3765622B2 (ja) | 1996-07-09 | 1996-07-09 | オーディオ符号化復号化システム |
CN97114604A CN1092420C (zh) | 1996-07-09 | 1997-07-08 | 音频数据解码装置及音频数据编码解码系统 |
US08/889,329 US6240388B1 (en) | 1996-07-09 | 1997-07-08 | Audio data decoding device and audio data coding/decoding system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19844396A JP3765622B2 (ja) | 1996-07-09 | 1996-07-09 | オーディオ符号化復号化システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1028057A JPH1028057A (ja) | 1998-01-27 |
JP3765622B2 true JP3765622B2 (ja) | 2006-04-12 |
Family
ID=16391182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19844396A Expired - Lifetime JP3765622B2 (ja) | 1996-07-09 | 1996-07-09 | オーディオ符号化復号化システム |
Country Status (3)
Country | Link |
---|---|
US (1) | US6240388B1 (ja) |
JP (1) | JP3765622B2 (ja) |
CN (1) | CN1092420C (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000123486A (ja) * | 1998-10-21 | 2000-04-28 | Pioneer Electronic Corp | 記録装置 |
US8618085B2 (en) * | 2000-04-28 | 2013-12-31 | Koasn Biosciences Incorporated | Therapeutic formulations of desoxyepothilones |
WO2003042981A1 (en) * | 2001-11-14 | 2003-05-22 | Matsushita Electric Industrial Co., Ltd. | Audio coding and decoding |
KR101164937B1 (ko) * | 2003-05-28 | 2012-07-12 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 신호의 인식된 라우드니스를 계산 및 조정하는방법, 장치 및 컴퓨터 프로그램 |
CN101048935B (zh) | 2004-10-26 | 2011-03-23 | 杜比实验室特许公司 | 控制音频信号的单位响度或部分单位响度的方法和设备 |
US8199933B2 (en) | 2004-10-26 | 2012-06-12 | Dolby Laboratories Licensing Corporation | Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
TWI397901B (zh) * | 2004-12-21 | 2013-06-01 | Dolby Lab Licensing Corp | 控制音訊信號比響度特性之方法及其相關裝置與電腦程式 |
BRPI0610719B1 (pt) * | 2005-04-18 | 2015-11-24 | Basf Ag | preparação, processo para a produção da mesma, e, uso de preparações |
TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
JP5185254B2 (ja) * | 2006-04-04 | 2013-04-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Mdct領域におけるオーディオ信号音量測定と改良 |
AU2007243586B2 (en) | 2006-04-27 | 2010-12-23 | Dolby Laboratories Licensing Corporation | Audio gain control using specific-loudness-based auditory event detection |
WO2008051347A2 (en) | 2006-10-20 | 2008-05-02 | Dolby Laboratories Licensing Corporation | Audio dynamics processing using a reset |
US8521314B2 (en) * | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
CN101790758B (zh) * | 2007-07-13 | 2013-01-09 | 杜比实验室特许公司 | 用于控制音频信号的信号处理的设备和方法 |
CN102017402B (zh) | 2007-12-21 | 2015-01-07 | Dts有限责任公司 | 用于调节音频信号的感知响度的系统 |
CA2949616C (en) | 2009-03-17 | 2019-11-26 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI556227B (zh) | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8538042B2 (en) * | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
CN102754159B (zh) | 2009-10-19 | 2016-08-24 | 杜比国际公司 | 指示音频对象的部分的元数据时间标记信息 |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
JP6992745B2 (ja) * | 2016-04-19 | 2022-01-13 | 日本電気株式会社 | デジタルフィルタ装置、デジタルフィルタ処理方法およびデジタルフィルタ処理プログラム |
MX2019008250A (es) * | 2017-01-10 | 2019-09-13 | Fraunhofer Ges Forschung | Decodificador de audio, codificador de audio, metodo para proveer una se?al de audio decodificada, metodo para proveer una se?al de audio codificada, flujo de audio, proveedor de flujos de audio y programa de computacion que utiliza un identificador de flujo. |
KR102491646B1 (ko) * | 2017-11-30 | 2023-01-26 | 삼성전자주식회사 | 오디오 신호의 음량에 따라 설정된 해상도에 기반하여, 오디오 신호를 처리하는 방법 및 그 전자 장치 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1119375A (en) * | 1913-04-14 | 1914-12-01 | Eugene H Taylor | Paster for paper-box machines. |
US4739514A (en) * | 1986-12-22 | 1988-04-19 | Bose Corporation | Automatic dynamic equalizing |
US5170437A (en) * | 1990-10-17 | 1992-12-08 | Audio Teknology, Inc. | Audio signal energy level detection method and apparatus |
US5511128A (en) * | 1994-01-21 | 1996-04-23 | Lindemann; Eric | Dynamic intensity beamforming system for noise reduction in a binaural hearing aid |
DE69629986T2 (de) * | 1995-07-27 | 2004-07-15 | Victor Company of Japan, Ltd., Yokohama | Verfahren und Gerät zum Kodieren digitaler akustischer Signale |
US5867503A (en) * | 1996-01-30 | 1999-02-02 | Mitsubishi Denki Kabushiki Kaisha | Digital sound broadcasting receiver and automatic phase controlling method therefor |
US5825826A (en) * | 1996-09-30 | 1998-10-20 | Motorola, Inc. | Method and apparatus for frequency domain ripple compensation for a communications transmitter |
-
1996
- 1996-07-09 JP JP19844396A patent/JP3765622B2/ja not_active Expired - Lifetime
-
1997
- 1997-07-08 US US08/889,329 patent/US6240388B1/en not_active Expired - Lifetime
- 1997-07-08 CN CN97114604A patent/CN1092420C/zh not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US6240388B1 (en) | 2001-05-29 |
JPH1028057A (ja) | 1998-01-27 |
CN1092420C (zh) | 2002-10-09 |
CN1170203A (zh) | 1998-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3765622B2 (ja) | オーディオ符号化復号化システム | |
KR101005731B1 (ko) | 주파수 변환에 기초한 불완전한 스펙트럼을 가진 오디오신호의 스펙트럼을 복구하기 위한 방법 및 장치 | |
US5414795A (en) | High efficiency digital data encoding and decoding apparatus | |
US5553193A (en) | Bit allocation method and device for digital audio signals using aural characteristics and signal intensities | |
US5752224A (en) | Information encoding method and apparatus, information decoding method and apparatus information transmission method and information recording medium | |
JPH08190764A (ja) | ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体 | |
PL182240B1 (pl) | Koder akustyczny wielokanalowy PL PL PL PL PL PL PL PL PL | |
JP2001142498A (ja) | ディジタル信号処理装置および処理方法、ディジタル信号記録装置および記録方法、並びに記録媒体 | |
JPH08223049A (ja) | 信号符号化方法及び装置、信号復号化方法及び装置、情報記録媒体並びに情報伝送方法 | |
US6167093A (en) | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission | |
JP2001343997A (ja) | デジタル音響信号符号化装置、方法及び記録媒体 | |
KR100556505B1 (ko) | 재생 및 기록 장치, 디코딩 장치, 기록 장치, 재생 및 기록 방법, 디코딩 방법, 및 기록 방법 | |
JPH0816195A (ja) | ディジタルオーディオ符号化方法及び装置 | |
JP3557674B2 (ja) | 高能率符号化方法及び装置 | |
US6128593A (en) | System and method for implementing a refined psycho-acoustic modeler | |
US20130085762A1 (en) | Audio encoding device | |
JP3041967B2 (ja) | ディジタル信号符号化装置 | |
JP3291948B2 (ja) | 高能率符号化方法及び装置、並びに伝送媒体 | |
JPH11330974A (ja) | エンコード方法、デコード方法、エンコード装置、デコード装置、ディジタル信号記録方法、ディジタル信号記録装置、記録媒体、ディジタル信号送信方法及びディジタル信号送信装置 | |
JP3089692B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP3186331B2 (ja) | 信号変換方法又は装置、並びに記録媒体 | |
JP3089691B2 (ja) | ディジタルデータの高能率符号化方法 | |
JP3200886B2 (ja) | オーディオ信号処理方法 | |
JP3141853B2 (ja) | オーディオ信号処理方法 | |
JP3225680B2 (ja) | 信号変換方法及び装置、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050412 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050711 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20050802 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051109 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20051212 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060124 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100203 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100203 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120203 Year of fee payment: 6 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120203 Year of fee payment: 6 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130203 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140203 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |