JP3502639B2 - 強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読 - Google Patents
強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読Info
- Publication number
- JP3502639B2 JP3502639B2 JP50553898A JP50553898A JP3502639B2 JP 3502639 B2 JP3502639 B2 JP 3502639B2 JP 50553898 A JP50553898 A JP 50553898A JP 50553898 A JP50553898 A JP 50553898A JP 3502639 B2 JP3502639 B2 JP 3502639B2
- Authority
- JP
- Japan
- Prior art keywords
- stereo
- channel
- prediction
- intensity
- scale factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000001228 spectrum Methods 0.000 title claims description 79
- 230000003595 spectral effect Effects 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000012545 processing Methods 0.000 claims description 35
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 claims description 2
- ASNHGEVAWNWCRQ-UHFFFAOYSA-N 4-(hydroxymethyl)oxolane-2,3,4-triol Chemical compound OCC1(O)COC(O)C1O ASNHGEVAWNWCRQ-UHFFFAOYSA-N 0.000 claims 1
- 230000008569 process Effects 0.000 abstract description 9
- 238000013144 data compression Methods 0.000 abstract description 6
- 230000006978 adaptation Effects 0.000 abstract description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000007906 compression Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/06—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation
- H04B14/066—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM]
- H04B14/068—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM] with adaptive feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
Description
で、特にインテンシティステレオ処理と予測を使ったス
テレオ音響スペクトル値の符号化と解号に関するもので
ある。
イヤー3スタンダードの操作は、デジタル音響信号のデ
ータ率を、例えば12の係数でそれらの品質を著しく落と
すことなく圧縮することができる。
れぞれのチャンネル中の大きな符号化利得を離れて、2
個のチャンネルの相対的余剰性や無関連性は、ステレオ
的の場合にはまた利用可能である。すでに利用されてい
る公知の方法には、いわゆるMSステレオ処理(MSはセン
ターサイド)とかインテンシティステレオ処理(IS処
理)がある。
ルの相対的余剰性を利用している。それは、2個のチャ
ンネルを合わせてそれらの間の違いを計算して、修正チ
ャンネルデータとしてそれぞれ左右のチャンネルに送
る。すなわちMSステレオ処理は、正確に再現する作用を
持っている。
理はステレオの無関連性を利用している。ステレオの無
関連性に関係して、人間の聴覚システムの空間的知覚は
感知した音響信号の周波数に依存している。低周波数に
おいては、2個のステレオ信号中の大きさ情報と位相情
報の両方が、人間の聴覚によって評価され、高周波数成
分の知覚は、主に両方のチャンネルのエネルギーと時間
の包絡面の分析に基づいている。かようにして両チャン
ネルの信号中の正しい位相情報は、空間的知覚には直接
関係はない。インテンシティステレオ処理による音響信
号の余剰データ削減のために、人間の知覚のこの特徴
は、ステレオ的無関連性を使うのに利用されている。
細かい情報を分解できないので、エンコーダーではっき
りした周波数限度のインテンシティから、2個の別々の
ステレオチャンネルL、Rの代わりに、両方のチャンネ
ルに連結エネルギー包絡線を送ることができる。連結エ
ネルギー包絡線に加えて、補助情報としておおまかに定
量化した方向情報も送られる。
チャンネルは部分的にしか送られないので、ビットの節
約は50%にもなる。しかしながらIS処理は、デコーダー
の中には再組立て作用を持ってないことに注意すべきで
ある。
るIS処理では、ステレオ音響スペクトル値のブロック中
ではIS処理は活性化しているという事実は、いわゆるモ
ードイクステンションビットによって示され、それぞれ
のブロックは、それに割り当てられたモードイクステン
ションビットをもっている。
ネルL10とチャンネルR12のステレオ音響スペクトル値
は、合計点14で合計されて、その両チャンネルに対しエ
ネルギー包絡線I=Li+Riを得る。このLiとRiは、いか
なるスケールファクター帯域中のそれぞれのチャンネル
LおよびRのステレオ音響スペクトル値をも表す。既に
述べたごとく、IS処理の使用は、符号化されたステレオ
音響スペクトル値への符号挿入エラーを避けるため、あ
るIS周波数限度においてだけ許されるものである。それ
ゆえ左右のチャンネルは、それぞれ別々に0HzからIS周
波数限度の範囲内で符号化されなければならない。その
様なIS周波数限度は、この発明には関係ない別の算法で
決められる。この周波数限度以上では、エンコーダーが
左チャンネル10と右チャンネル12の合計信号を合計点14
で合計し符号化する。
ール情報18は、例えば左と右の合計信号のようなエネル
ギー包絡面に加えて解号するのに必要であり、それは例
えば符号化された左のチャンネルに送られる。左と右の
チャンネルへのスケールファクターは、例えばMPEGレイ
ヤー2の中で行われる様に、インテンシティステレオ処
理の中で送られる。しかしながらここで述べなければな
らないことは、IS符号化ステレオ音響スペクトル値のMP
EGレイヤー3中のIS処理では、方向情報のインテンシテ
ィが左のチャンネル中だけで送られ、そのスペクトル値
は、以下に述べるごとくこの情報によって再び解号され
ることである。
チャンネルRの符号化スペクトル値に加えて送られる。
デコーダーは解号チャンネルL'20と解号チャンネルR'22
で解号された音響信号値を搬送し、チャンネルRのスケ
ール情報16とチャンネルLのスケール情報18は、はじめ
から符号化されたステレオ音響スペクトル値を解号する
手段として、L乗算器24とR乗算器26の中の各チャンネ
ルのための符号化されたステレオ音響スペクトル値によ
って乗算される。
限度を下回って振り向けられる前に、それぞれのチャン
ネルに対するステレオ音響スペクトル値はいわゆるスケ
ールファクター帯域の中に集められる。この帯域は聴覚
の知覚特性に適合させられる。それぞれの帯域は追加係
数、いわゆるスケールファクターによって増幅され、そ
れは補助情報として特別なチャンネルに送られ、図1の
スケール情報16および18の部分を構成する。これらの要
素は、定量化によって起こされ音響心理面でマスクされ
て聞き取れなくなるような干渉ノイズ形成の原因であ
る。
れる符号化された右チャンネルRの形態を示す。ステレ
オ符号化のインテンシティのいかなる言及もMPEGレイヤ
ー3スタンダードの処理に関係がある。ステレオ音響ス
ペクトル値が集められる個々のスケールファクター帯域
28は、図式的に図2aに示されている。図2aでは、それら
の帯域がはっきりと幅が等しく示されているが、実際は
その幅は聴覚の音響心理の特性の故に等しくはない。
値spを含んでいて、それはIS周波数限界32の下では0で
ない。すなわちIS周波数限界より上の右チャンネルのス
テレオ音響スペクトル値は、すでに(nsp=0スペクト
ル)と述べたごとく0(0 パート)nspにセットされ
る。
の部分を含んでいる。最初に示された情報34の部分は、
IS周波数限界32の下の範囲に対しスケールファクターsk
fを含んでおり、周波数限界より上の範囲に対し方向情
報rinfo36を含んでいる。この方向情報は、インテンシ
ティステレオ処理中のIS符号化周波数範囲のおおまかな
局部的分析を行うのに使われる。従って方向情報rinfo3
6は、インテンシティの位置(is_pos)にも関係して、
スケールファクターの代わりに右チャンネルに送られ
る。再び述べなければならないことは、スケールファク
ター34がスケールファクター帯域28に対応して、IS周波
数限界の下の右チャンネルの中に依然として存在してい
ることである。インテンシティの位置36は、それぞれの
スケールファクター帯域28中の信号源を感知したステレ
オ想像位置(右から左への比率)を示している。IS周波
数限界上のそれぞれの帯域28で、透過ステレオ音響スペ
クトル値の解号された値は、左チャンネルに対してはス
ケールファクターkLとして、右チャンネルに対してはス
ケールファクターkRとして、MPEGレイヤー3処理によっ
てスケール化される。
が妥当な位置を示す値である。右と左のチャンネルは、
次の2個の式のI信号(I=Li+Ri)から導かれる。
響スペクトル値である。ここで述べなければならないの
は、左チャンネルでゼロスペクトルがIS周波数限度32の
上に見られるよりは組合せスペクトルI=Li+Riであ
り、左チャンネルのための方向情報is_posよりは普通の
スケールファクターが存在するが、左チャンネルのフォ
ーマットは、図2aに示される右チャンネルのフォーマッ
トに類似している。右チャンネルにおけるゼロでない定
量化総スペクトル値からゼロ値への移行は、無条件にMP
EGレイヤー3スタンダード内のデコーダーに対しIS周波
数限界を示している。
で左と右のチャンネルの合計値として計算され、移行方
向情報は次の式によって明らかにされる。
それぞれ左と右のチャンネルのスケールファクター帯域
におけるエネルギーである。このエンコーダーとデコー
ダーの公式は左と右のチャンネルにおけるおおよその復
元を与える。
すでに公知である。特に第2の指示すなわち後向き適応
予測が使用される。エンコーダーとデコーダーの中の予
測器には同じ入力信号が入るので、「後向き適応」と
は、予測器係数は送られる必要がないということを意味
する。従ってデコーダーの中の予測手段は、予測係数そ
れ自体を引き出すことができる。
く最新信号の評価値を供給することである。比較的狭い
スペクトルを持った信号である階調信号や、本来のスペ
クトルと評価値の間の相違である予測器エラー信号は、
本来のスペクトルよりも著しく小さく、そのため予測エ
ラー信号はより少ないビットで符号化でき、それによっ
てより本質的なデータ圧縮をする。それゆえこの量子化
した予測エラー信号だけが送られる。デコーダーの予測
器は、それから本来の信号を引き出すことができる。
つ階調でないとき、予測エラー信号は本来の信号よりも
より強くなる。そのとき予測はビットロスをつくる。す
なわち符号化されるべきデータの量が増える。このため
に予測がスケールファクター帯域幅を入り切りする。方
向情報のインテンシティの様に、予測がスケールファク
ター帯域の中で使われているか使われてないかについて
の情報は、補助情報として送られる。
レオ音響スペクトル値の符号化に同時に使われると、次
の様な問題が起こる。
ある。両方のチャンネルと予測エラー信号からの方向情
報のインテンシティへの連結エネルギー包絡線をつくる
ことを探知しないから、この続発は避けられない。既に
述べたごとく、ステレオ音響スペクトル値30を含む右チ
ャンネルは、図2a、2bに示すごとくIS符号化でゼロにセ
ットされる。これらのゼロ値は、右チャンネルに対する
予測器の入力値である。
計算しなければならないから、インテンシティステレオ
周波数限度32の下のスケールファクター帯域28からその
限度の上の帯域へ、その行程が切り換わるときに起こる
ことは、それはいつも同じというわけでなく、音響信号
に応じて連続的に決められなければならないわけだが、
IS周波数限度上の右チャンネルのステレオ音響スペクト
ル値30は急にゼロになることである。しかしながらその
予測器は、ある時間ゼロでない評価を依然として送り、
それゆえ符号化されるべきエラー信号はゼロでない。そ
の結果ゼロでない音響スペクトル値は、右チャンネル12
の中のIS周波数限度上を送られ、実際のインテンシティ
ステレオ処理のための条件の消去となる。
る圧縮に役立つが、予測とインテンシティステレオ符号
化を同時に使う音響信号の符号化と解号には前記のよう
な難しさがあるため、この2個の行程は今まで一緒には
使われなかった。問題なく予測をできるようにするため
に、もしもインテンシティステレオ処理が全く使われな
いと、データ圧縮のためのインテンシティステレオ符号
化の上記利点は生かされない。ほかの可能性は、予測器
によるインテンシティステレオ周波数限度の下のステレ
オ音響スペクトル値だけを圧縮し、インテンシティステ
レオ処理によって例外的にIS周波数限度32上のステレオ
音響スペクトル値を符号化することである。インテンシ
ティステレオ周波数限度上の左チャンネル中のステレオ
音響スペクトル値30の予測は、符号化されるべきデータ
の追加的圧縮を行う。
化する方法と、符号化されたステレオ音響スペクトル値
を解号する方法と、ステレオ音響スペクトル値を符号化
する装置または符号化されたステレオ音響スペクトル値
を解号する装置を提供して、増大したデータの圧縮を可
能にするものである。
クトル値の符号化の方法や、請求項10に記載されたイン
テンシティステレオ処理に部分的に符号化されているス
テレオ音響スペクトル値の解号の方法や予測による部分
的な方法や、請求項13に記載されたステレオ音響スペク
トル値を符号化するための装置や、請求項15に記載され
たインテンシティステレオ処理に部分的に符号化された
予測によって部分的に符号化されたステレオ音響スペク
トル値を解号する装置によって解決される。
オ音響スペクトル値のインテンシティステレオ符号化を
結合して使用することによって可能であるという発見に
基づいている。この目的の為に、もしもステレオ音響ス
ペクトル値に対するインテンシティステレオ符号化が対
応するスケールファクター帯域の中で活性化されたら、
この発明の更なる発展において、予測が右チャンネルに
対して不活性化されなければならない。ステレオ音響ス
ペクトル値がインテンシティステレオ符号化によって符
号化されない場合に正しい予測値が送信される様により
ふさわしい適用をするため、インテンシティステレオ符
号化されたステレオ音響スペクトル値を持つゼロスペク
トルを持った右チャンネルの予測器は、同様に右チャン
ネルに対するインテンシティステレオ解号されたステレ
オ音響スペクトル値を供給されなければならない。これ
が行われないと、予測器は調整の悪い状態になり、その
結果IS符号化が切断されたとき、予測の低下によってデ
ータの圧縮が一時著しく損失をこうむる。
理による符号化により、右チャンネルの予測器は、同様
にある程度作動し続けなければならない。すなわちそれ
は右チャンネルの符号化されないステレオ音響スペクト
ル値を供給されるのである。しかしながら、インテンシ
ティステレオ周波数限度の上のスケールファクター帯域
のためのステレオ音響スペクトル値はゼロに設定される
べきというインテンシティステレオ条件を満足させるた
めに、右チャンネルの予測結果は、ステレオ音響スペク
トル値を符号化用に考慮されてはならない。
い。すなわちある平均周波数を持ったIS符号化スケール
ファクター帯域が、実質的に同じ平均周波数を持った非
IS符号化スケールファクター帯域と互い違いに起こると
きに、予測係数の最新化が可能でなければならない。た
とえばこれは、もしもIS周波数限度が1個のブロックか
ら次のブロックに変わるときか、またはもしもIS周波数
限度上のスケールファクター帯域が1個のブロックの中
でIS符号化され、次のブロック中で図2bに示されるごと
くIS解号されるときである。
ァクター帯域幅になりうるということは既に述べられて
いる。しかし例えばもしも聴衆の喝采があると、そのス
ケールファクター帯域の中の信号は再び階調になり、し
たがって予測は、そのときに符号化されるべきブロック
の中で再活性化されなければならない。ここでまた予測
は、活性化のすぐ後でも高度データ圧縮に対し予測エラ
ー信号がほとんどないような、更なる順応が出来なけれ
ばならない。従ってこの順応においては、予測の「活性
化」、「非活性化」、または「接続」と「断続」の用語
は、予測器が入力値を供給されつづけて、予測がその予
測係数を最新化するのを可能にさせるが、予測の結果は
符号化された信号の中では考慮されないという感覚で使
われる。
付図に照らして詳細に説明する。
ための理論回路図である。
に対するインテンシティステレオ符号化があるときのデ
ータのフォーマットである。
テンシティステレオ符号化があるときのデータのフォー
マットである。
ある。
ある。
号する予測器である。
号するためのデコーダーを示すブロック回路図である。
レオ符号化による右チャンネルRのデータフォーマット
を示す。図2aまたはMPEGレイヤー3処理との違いは、現
在のMPEG2−NBC処理の利用者が、IS周波数限度32の上で
も、それぞれの区域すなわち少なくとも1個のスケール
ファクター帯域に対し、ステレオ音響スペクトル値のス
テレオ符号化のインテンシティを選択的に接続したり接
続を切ったりできる柔軟性を持っていることである。従
ってNBC処理では、IS周波数限度の上でもIS符号化は接
続を切ったり再度接続したりできるから、IS周波数限度
はMPEGレイヤー3に比べて実際には本当の周波数限度で
はない。これはレイヤー3では不可能であった。すなわ
ちIS符号化が1個の区域にあると、IS周波数限度上のス
テレオ音響スペクトル値がスペクトル範囲の最上位に正
しく符号化されることが必須であった。新しいNBC処理
では、IS限度上の全てのスペクトル範囲に対してIS符号
化を活性化させる必要はない。すなわち信号が伝えられ
たらIS符号化の接続が切られるようになるからである。
それゆえIS符号化されたスケールファクター帯域は、符
号化されないスケールファクター帯域と互い違いにな
る。
るスケールファクターは、従来技術の様に方向情報のイ
ンテンシティ36を形成し、それらの値はまた特異なハフ
マン符号化を受ける。すでに述べたごとく、右チャンネ
ルすなわちIS周波数限度32上のスケールファクター帯域
には、ステレオ音響スペクトル値よりもゼロスペクトル
がある。左チャンネルは、IS符号化区域の中に左と右の
チャンネルへの全信号を含む。しかしながらこの全信号
は、それぞれのスケールファクター帯域のエネルギー
が、IS解号の後左チャンネルのエネルギーに等しくなる
様に標準化される。IS符号化がデコーダーの中で使われ
た場合、左チャンネルはそれゆえに不変のまま取り上げ
られ、合計すなわち差異をつくることによって明確に決
められる必要がない。右チャンネルに対するステレオ音
響スペクトル値は、右チャンネルの補助情報の中にある
インテンシティ方向情報is posを使って、左チャンネ
ルのステレオ音響スペクトル値から引き出すことができ
る。
で、その予測器は左ステレオチャンネルLのステレオ音
響スペクトル値が供給可能な入力42を持っている。予測
器40の出力44で、送られるべき予測エラー信号はビット
ストリームに書きこまれ、それは符号化されたステレオ
音響スペクトル値とそれらすなわちスケールファクター
帯域幅上の補助情報の両方を含む。予測エラー信号を量
子化する量子化器46の入力と予測器40の入力42との間に
は、第1の合計装置48があり、それは予測器40の入力42
で入ったステレオ音響スペクトル値と予測器50(予測エ
ラー信号)の出力値間の差を形成する。その名前から類
推して、量子器46はステレオ音響スペクトル値を量子化
し、ビットストリームに量子化した値を書きこむ。その
名前に反して、それはまた同時に量子化を実行し、再量
子化されたステレオ音響スペクトル値が第2の出力47を
経て出力される。
れた入力値を受け取る。
された形で存在する予測エラー信号を、予測器50の出力
値に加える。この予測エラー信号と予測評価の合計は、
従って予測器50の入力値であり、それは次には将来の値
を評価するため、それへの入力値として使われる。
らに備わっている。すでに従来技術の中で述べたごと
く、あるスケールファクター帯域に対して予測をしない
ことは、それらが非階調音響データを含んでないから都
合の良いことである。それにもかかわらず、もしも予測
がそれらの非階調スケールファクター帯域でつくられれ
ば、それはビットロスすなわちその圧縮の代わりに符号
化されるデータの量の増加となる。左チャンネルLに対
する予測は、スイッチ54と56によって切られる。図3aで
は、スイッチ54と56は、左チャンネルのためにつくられ
ているとの予測で描かれている。
り替えられなければならないということである。従って
1個のスイッチを入れて他をそのままにしておくという
ことはないわけである。もしもスイッチ54、56が、図3a
に示す様にPON(PEIN)の位置からPOFF(PAUS)の位置
に移動すると、第1の合計装置はバイパスされ、それに
よってステレオ音響スペクトル値は予測されてないで量
子器46に行き、そこから符号化されたビットストリーム
に記入される。
が作られていないという意味であるが、ステレオ音響ス
ペクトル値は直接予測器を通り越して、予測列と対照し
て予測エラー信号としてでなく実際の値として第2合計
装置52に現れ、予測器Pがステレオ音響スペクトル値に
順応できる様に予測器Pに送られる。スイッチ54がPOFF
の位置にあるときに、もしもスイッチ56がPON位置にあ
ると、合計装置52にある実際の予測信号は、スイッチ56
を経て他の予測信号に加えられ、その結果予測器P50
は、入力信号として2回予測信号を受け、その予測係数
の間違った対応をすることになる。
で、それは第1実施例に似ているがスイッチ54、56の代
わりにひとつだけのスイッチ57がある。
記したようになり、その結果はデータの符号化に使われ
る。しかしながらもしもスイッチ57がPOFFの位置にある
と、図3bの予測器は、不活性化される。すなわち予測が
予測係数に順応するようにされても、予測の結果はデー
タを符号化することには考慮されない。
送られる右チャンネルRのための予測器60と、インテン
シティステレオデコーダー(IS-1)64の両方がある。図
4にあるほかの成分は、図3aのほかの成分と同じで、同
じように作動する。図3bの第2実施例も、また左チャン
ネルに対する予測器として使われるということは、当業
者にとっては明白なことである。しかしながら左チャン
ネルの予測器40と違って、右チャンネルの予測器60は、
第3スイッチ66を持っていて、その作動と使用は次の通
りである。
ンシティステレオ符号化されたステレオ音響スペクトル
値を持つゼロでないエラー信号をつくる。もしもそのエ
ラー信号が右チャンネルのビットストリームに書きこま
れると、右チャンネルのステレオ音響スペクトル値がイ
ンテンシティステレオ周波数限度上のスケールファクタ
ー帯域でゼロに設定されるから、基本的インテンシティ
ステレオ条件は破棄される。しかし非活性化の間に予測
器が正しく右チャンネル中の実際の値に順応できるため
には、ステレオ音響スペクトル値はそれでもそこに供給
されなければならない。しかし、それらはインテンシテ
ィステレオ処理によって符号化されるので、それらはIS
デコーダー64で解号され、予測手段60の予測器50に送ら
れなければならない。従ってISデコーダー64は、入力で
左チャンネルのIS符号化ステレオ音響スペクトル値と、
右チャンネルの補助情報に送られた方向情報のインテン
シティを受け取る。
ィステレオ符号化が行われようとしている状態のスイッ
チ54、56、66が記されている。既に述べた通り、予測は
この状態では切られなければならず、それ故にスイッチ
54と56はPOFFとPONになる。符号化されてないスケール
ファクター帯域は、解号されたデータの量を減らすた
め、左右の両チャンネル中の予測にさらされる。その場
合スイッチ54、56、66は、それぞれPON+ISOFF(I
SAUS)とISOFFの位置に移動する。この発明の好ましい
実施例においては、予測器は実際の左または右のチャン
ネルだけを認識する。従って潜在的MS符号化は量子化器
Q46の中ですなわち予測後に行われる。
し、その結果量子器の出力44に現れるビットストリーム
に書かれた予測エラー信号は、再びそのスイッチを流れ
る。インテンシティステレオデコーダー64は、この場合
にはインテンシティステレオ符号化したデータがないか
ら活性化してない。
ャンネルに対する予測器40と右チャンネルに対する予測
器60に似た構造を持っている。最初に解号されるべきス
テレオ音響スペクトル値は非量子化器Q-172に通じ、量
子化器46に導かれた量子化を取り消す。まだ予測すなわ
ち予測エラー信号を持っている非量子化されたステレオ
音響スペクトル値は、それから再予測器70の入力へ通じ
る。
いる先に記述した装置と同一である。予測器P50の出力
値である再量子化予測エラー信号と予測評価は、合計装
置48でつくられる。もしも第4スイッチ78が図5に示さ
れるPONの位置にあり、処理されようとするデータが予
測にさらされようとすることを示すと、この合計は予測
器P50の次の入力信号として使われ、再予測器70の出力7
6で再予測信号として出力される。このスイッチ78は予
測器P50は、いかなる予測の非活性化にもかかわらず、
いつでもその予測係数に順応することを保証する。
うとするデータが予測にさらされてないということが確
認されると、第4スイッチ78はPOFFに移動し、予測器P
の出力はもはや合計装置48にはつながらない。先に記さ
れた位置とは対称に、量子器は次に、予測エラー信号で
なく接続された予測によって実際のステレオ音響スペク
トル値を量子化する。第1合計装置48から分離した予測
器P50の出力すなわち非活性化された予測器Pによっ
て、符号化されてないステレオ音響スペクトル値は再予
測器76の出力に現れる。それらは時間分離の音響信号を
得るため、従来技術で知られた方法で時間領域に変えら
れる。
測器P50は、図3と4に示された予測器P50と同じであ
る。エンコーダーとデコーダーの中の符合する予測器50
はそれらの入力値と同じ値を正しく受け取るという事実
によって、それぞれの予測器が後向き適応の原理に一致
してそれ自身でそれらを計算できるから、使われた予測
器係数を移す必要はない。「第2オーダー後向き適応」
とは、2個の先行値がつくられた予測のために使われ、
新しい評価をするために従来技術で知られた方法で計算
されたすなわち順応した予測係数によって、操作される
ということである。
と、部分的に予測によって符号化されたステレオ音響ス
ペクトル値を解号する装置の好ましい実施例である。左
Lと右Rチャンネルの中で符号化された値は、それぞれ
の非量子化器72に送られる。例えばM−S符号化された
2個のチャンネルの非量子化値は、M−Sデコーダー80
で解号される。この発明を実行するために、ステレオ音
響スペクトル値がインテンシティステレオ符号化されて
ない範囲の中央処理によって符号化されることは必須で
ないことは、当業者にとっては明らかなことであろう。
しかしながらこれはデータの量を少なくするには有利な
ことである。
化されたステレオ音響スペクトル値は、1以上のスケー
ルファクター帯域中の左チャンネルLで予測符号化を持
っている。その場合には左チャンネルLの第4スイッチ
78は図6のPOFF位置にある。符号化されてない形のステ
レオ音響スペクトル値は、左チャンネルLの第4スイッ
チ78の後ろにある。ふさわしい周波数領域/時間領域変
換器82によって、それらは時間分離の音響信号にかえら
れる。
ネルのステレオ音響スペクトル値が左右のチャンネルの
合計値を含んだインテンシティステレオ符号化を使用し
ている。この発明の好ましい実施例では、それらのエネ
ルギーが左チャンネルのエネルギーに相当する様に標準
化されていて、そのためデコーダー中での復元の必要性
を事前に除去している。しかしながら別のインテンシテ
ィステレオ処理が使われて、左チャンネルでの全信号の
標準化が実行されず、そのためそのエネルギーは本来の
左チャンネルのエネルギーに相当する。この場合には左
チャンネルL中の第4スイッチ78の後ろにあるステレオ
音響スペクトル値は、右チャンネルの補助情報の近くに
含まれるインテンシティステレオ解号にさらされなけれ
ばならず、そこでは方向情報のインテンシティは既に記
した様に存在している。
のステレオ音響スペクトル値は、ISOFFの位置にある第
5スイッチ84と会い、そこでそれらの値は再予測器70に
よって再予測され、PON位置にある第4スイッチ78を通
して周波数領域/時間領域変換器82に送られ、右チャン
ネルに対する時間分離のステレオ音響信号r(t)をつ
くる。
クター帯域の中に存在したら、2個の符号化処理は同時
には使えないからその帯域に対してMS解号は行われな
い、ということは当業者にとっては明白なことである。
IS符号化されたステレオ音響スペクトル値を変えないで
通過させることによって、MSデコーダーは2個のチャン
ネルの補助情報に反応する。
れたステレオ音響スペクトル値はない。右チャンネルR
は、補助情報として方向情報のインテンシティ情報is_p
osを持っているだけである。
ために、左チャンネルLに存在する値は、右チャンネル
の補助情報にアクセスするISデコーダー64の中のIS解号
にさらされる。
置にある第5スイッチ84を通り越して右チャンネルRの
再予測器70に行く。しかしながらそのチャンネルは本質
的にゼロスペクトルを持っているので、IS符号化が存在
するときは、右チャンネルに対するデータは予測にさら
されないから、チャンネルR中の第4スイッチ78はISON
の位置にあり、そのため予測器P50とチャンネルR中の
第1合計装置をバイパスする。ISデコーダー64で解号さ
れる右チャンバRのためのステレオ音響スペクトル値は
予測ができないので、それらは変えられないでスイッチ
84を通って周波数領域/時間領域変換器82の右チャンネ
ルRに送られる。スイッチ78を通る予測器Pの出力は、
不活性化されているので時間分離の解号された音響信号
r(t)を与えるため、その変換器は好ましい実施例で
は、逆のフィルターバンクになる。
そこでは方向情報のインテンシティによってでなく、左
右チャンネルの2個の別々のスケールファクターによっ
て方向情報のインテンシティが送られ、すでに何回も述
べている通り、NBC符号化または解号は下記の理由から
方向情報のインテンシティis_posの移送を要求する。
ール情報を無関係なものとみなす。しかしこれが常に予
測に当てはまるわけではない。すなわち予測の結果、予
測器の出力の予測エラー信号は必ずしもゼロではないか
らである。スケールファクターはそのときには増加しな
ければならず、予測によって量子化される1以上のスケ
ールファクター帯域内のスペクトル値がゼロとみられる
ことが起こる。そのときはNBC処理のシンタックスは、
その場合に移送されるべきスケールファクターを供給し
ない。そのときにはIS符号化されたステレオ音響スペク
トル値に対する方向はなく、それらの値に対するステレ
オイメージの完全な破壊となる。
テンシティを使うと、符号化されたデータの量をさらに
減らすため、その情報の完全な符号化の代わりに特異な
符号化を許すことになる。IS符号化されてない範囲のス
ケールファクターで、一番はじめに現れる値すなわち初
期値は、8ビットに量子化された大きさである。IS符号
化されたステレオ音響スペクトル値では第1の値すなわ
ち初期値はゼロである。ISスケールファクターと「普通
の」スケールファクターは、交互に符号化されたビット
ストリームにあらわれる。従って2個の状態の機械すな
わち特殊PCMエンコーダーが、符号化に必要とされる。
ために、それらは2個の係数の最後の値に注目する。
ー帯域のスケールファクターをあらわし、scf(n−
1)は、前の帯域のスケールファクターを表す。それゆ
えdscf(n)は、符号化されるべき前記大きさにおける
差である。
域nの方向情報のインテンシティis_posに対する最も近
い全数と、最後のスケールファクター帯域n−1のis_p
osとの間の差である。
される。デコーダーに対する式7と8は次の通りであ
る。
のスケールファクター帯域の値をデコーダーの中のそれ
ぞれ実際の差に加えることによって、スケールファクタ
ー値と現在考慮されているスケールファクター帯域の方
向情報のインテンシティを計算する。
Claims (16)
- 【請求項1】スケールファクター帯域(28)中のスケー
ルファクター(34)が付帯されたステレオ音響スペクト
ル値をグルーピングし 一方のチャンネル(L)にはインテンシティステレオ符
号化されたステレオ音響スペクトル値を持たしめ、他方
のチャンネル(R)には値が実質的にゼロであるステレ
オ音響スペクトル値を持たしめるべく、少なくとも1個
のスケールファクター帯域(28)中のステレオ音響スペ
クトル値をインテンシティステレオ符号化し、 スケールファクター帯域(28)中のステレオ音響スペク
トル値がインテンシティステレオ符号化されている場合
には、 スケールファクター帯域(28)中の一方のチャンネル
(L)のインテンシティステレオ符号化されたステレオ
音響スペクトル値をインテンシティステレオ解号(64)
して、 他方のチャンネル(R)についてのインテンシティステ
レオ解号されたステレオ音響スペクトル値を得て、 スケールファクター帯域(28)中の他方のチャンネル
(R)のインテンシティステレオ解号されたステレオ音
響スペクトル値により第1の予測(60)を行い、 他方のチャンネル(R)のステレオ音響スペクトル値が
符号化されるときには第1の予測(60)が考慮されず、 スケールファクター帯域(28)中のステレオ音響スペク
トル値がインテンシティステレオ符号化されていない場
合には、 スケールファクター帯域(28)中の他方のチャンネル
(R)のステレオ音響スペクトル値により第1の予測
(60)を行い、 他方のチャンネル(R)中の符号化されたステレオ音響
スペクトル値を得る ことを特徴とする符号化されたステレオ音響スペクトル
値を得るための、ステレオ音響スペクトル値符号化方
法。 - 【請求項2】さらに現存するインテンシティステレオ符
号化とは独立にステレオ音響スペクトル値の第2の予測
(40)を行って、一方のチャンネル(L)の符号化した
ステレオ音響スペクトル値を形成する ことを特徴とする請求項1に記載の方法。 - 【請求項3】第1と第2の予測(60、40)が二次後向き
適応予測である ことを特徴とする請求項1または2に記載の方法。 - 【請求項4】第1と第2の予測(60、40)の結果が量子
化(46)されて符号化されたビットストリームに書き込
まれる ことを特徴とする請求項1〜3のいずれかに記載の方
法。 - 【請求項5】各スケールファクター帯域(28)について
の非音色ステレオ音響スペクトル値の第1と第2の予測
(60、40)の結果が、選択的に考慮されるかまたは考慮
されない ことを特徴とする請求項1〜4のいずれかに記載の方
法。 - 【請求項6】スケールファクター帯域(28)中のインテ
ンシティステレオ処理によるステレオ音響スペクトル値
の符号化が、その帯域28についてのインテンシティ方向
情報(36)の形成を含む ことを特徴とする請求項1〜5のいずれかに記載の方
法。 - 【請求項7】スケールファクター帯域(28)についての
インテンシティ方向情報が、スタート値から始まって微
分符号化される ことを特徴とする請求項6に記載の方法。 - 【請求項8】インテンシティステレオ符号化されてない
スケールファクター帯域(28)中のステレオ音響スペク
トル値がMS処理によって符号化され、それらの帯域(2
8)に付帯する各チャンネル(L、R)のスケールファ
クターがスタート値から始まって微分符号化される ことを特徴とする請求項1〜7のいずれかに記載の方
法。 - 【請求項9】第1または第2の予測(60、40)が先行入
力値から現行推定値を生成し、 その推定値から各現行の実際値が差し引かれて予測エラ
ー信号を生成し、該信号が現行の実際値の代わりにビッ
トストリーム中に符号化される ことを特徴とする請求項1〜8のいずれかに記載の方
法。 - 【請求項10】一部はインテンシティステレオ処理によ
り一部は第1および第2の予測(60、40)により符号化
されて、かつ補助情報(34)を有したステレオ音響スペ
クトル値を解号する方法であって、 補助情報(34)に基づいて各帯域(28)についてスケー
ルファクター帯域(28)中でグルーピングされたステレ
オ音響スペクトル値のインテンシティステレオ符号化ま
たは第1の予測(60)または第2の予測(40)の存在を
確認し、 第2の予測により符号化されたステレオ音響スペクトル
値を用いて、チャンネル(L)中において、第2の予測
(40)に応じて予測(70)を行って、第2の予測を消去
し、 スケールファクター帯域(28)中にインテンシティステ
レオ符号化が存在する場合には、 一方のチャンネル(L)のインテンシティステレオ符号
化されたステレオ音響スペクトル値のインテンシティス
テレオ解号(64)を実施して、他方のチャンネル(R)
についてインテンシティステレオ解号されたステレオ音
響スペクトル値を形成し、 他方のチャンネル(R)のインテンシティステレオ解号
されたステレオ音響スペクトル値を用いて、第1の予測
(60)に応じて予測(70)を行って、 他方のチャンネル(R)の解号されたステレオ音響スペ
クトル値については、この予測(70)の結果を考慮に入
れず、 スケールファクター帯域(28)中にインテンシティステ
レオ符号化が存在しない場合には、 他方のチャンネル(R)中において第1の予測(60)に
応じて予測(70)を行って、 他方のチャンネル(R)の解号されたステレオ音響スペ
クトル値を形成する ことを特徴とするステレオ音響スペクトル値の解号方
法。 - 【請求項11】第2の予測(40)に応じて予測(70)が
行われても、 一方のチャンネル(L)について帯域(28)中のステレ
オ音響スペクトル値の予測がないということをスケール
ファクター帯域(28)の補助情報34が示す場合には、そ
の結果は考慮されない ことを特徴とする請求項10に記載の方法。 - 【請求項12】第1の予測(60)に応じた予測(70)が
なされても、他方のチャンネル(R)について帯域(2
8)中のステレオ音響スペクトル値の予測はないという
ことをスケールファクター帯域(28)の補助情報が示す
場合には、その結果は考慮されない ことを特徴とする請求項10または11に記載の方法。 - 【請求項13】スケールファクター(34)が付帯するス
ケールファクター帯域(28)中のステレオ音響スペクト
ル値をグルーピングする手段と 一方のチャンネル(L)がインテンシティステレオ符号
化されたステレオ音響スペクトル値を持ち、他方のチャ
ンネル(R)が実質的にゼロであるステレオ音響スペク
トル値を持つように、少なくとも1個のスケールファク
ター帯域中においてステレオ音響スペクトル値をインテ
ンシティステレオ符号化する手段と、 スケールファクター帯域(28)中のインテンシティステ
レオ符号化されたステレオ音響スペクトル値を解号する
インテンシティステレオデコーダー(64)と、 第1〜3のスイッチ手段(54、56、66)を有した他方の
チャンネル(R)中の第1の予測器(60)と、を含んで
なり、 インテンシティステレオ符号化されたステレオ音響スペ
クトル値が存在する場合には第1〜3のスイッチ手段
(54、56、66)は第1の状態(ISON)にあるとともに、
インテンシティステレオ符号化されたステレオ音響スペ
クトル値が存在しない場合には第2の状態(ISOFF)に
あり、 第1〜3のスイッチ手段(54、56、66)が第1の状態
(ISON)にあるときには、インテンシティステレオデコ
ーダー(64)により解号された他方のチャンネル(R)
のステレオ音響スペクトル値を用いて第1の予測器(6
0)が第1の予測をなし、 この際第1のスイッチ手段(54)の状態の故に、符号化
されたステレオ音響スペクトル値については該予測の結
果は考慮に入れず、 第1〜3のスイッチ手段(54、56、66)が第2の状態
(ISOFF)にあるときには、予測器(60)はスケールフ
ァクター帯域(28)中のステレオ音響スペクトル値の第
1の予測をなして、他方のチャンネル(R)の符号化さ
れたステレオ音響スペクトル値を得る ことを特徴とするステレオ音響スペクトル値の符号化装
置。 - 【請求項14】さらにインテンシティステレオ符号化の
存在とは独立に、スケールファクター帯域中のステレオ
音響スペクトル値の第2予測をして、一方のチャンネル
(L)の符号化されたステレオ音響スペクトル値を形成
する第2の予測器(40)を含む ことを特徴とする請求項13に記載の装置。 - 【請求項15】少なくとも一部がインテンシティステレ
オ処理および第1ならびに第2の予測(60、40)により
符号化されたかつ補助情報(34)を有したステレオ音響
スペクトル値を解号する装置であって、 入力端(74)と出力端(76)とを具えた一方のチャンネ
ル(L)のための第1のステレオ音響スペクトル値予測
器(70)と、 入力端(74)と出力端(76)とを具えた他方のチャンネ
ル(R)のための第2のステレオ音響スペクトル値予測
器(70)と、 入出力端を具えたインテンシティステレオデコーダー
(64)と、 インテンシティステレオ符号化されたステレオ音響スペ
クトル値が存在する場合にはインテンシティステレオデ
コーダー(64)の出力端を第2の予測器(70)に接続
し、それらの値がインテンシティステレオ符号化されて
ない場合には第2の予測器(70)の入力端を他方のチャ
ンネル(R)に接続する他方のチャンネル(R)中の第
1の切換え手段(84)と、 ステレオ音響スペクトル値がインテンシティステレオ符
号化されていない場合には他方のチャンネル(R)中の
第2の予測器(70)の出力端(76)を他方のチャンネル
(R)の解号されたステレオ音響スペクトル値のための
出力端に接続し、それらの端がインテンシティステレオ
符号化されている場合には他方のチャンネル(R)中の
第2の予測器(70)の入力端(74)を他方のチャンネル
(R)の解号されたステレオ音響スペクトル値のための
出力端に接続する他方のチャンネル(R)中の第2の切
換え手段(78)を含んでなる ことを特徴とするステレオ音響スペクトル値の解号装
置。 - 【請求項16】一方のチャンネル(L)中の再予測器
(70)が、第3の切換え手段(78)と予測器(50)を有
していて、 該第3の切換え手段(78)が予測器(50)の出力端を第
1のチャンネル(L)から分離し、 再予測器(70)による予測結果が考慮されない ことを特徴とする請求項15に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19628293.4 | 1996-07-12 | ||
DE19628293A DE19628293C1 (de) | 1996-07-12 | 1996-07-12 | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
PCT/EP1997/002875 WO1998003037A1 (de) | 1996-07-12 | 1997-06-03 | Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11514181A JPH11514181A (ja) | 1999-11-30 |
JP3502639B2 true JP3502639B2 (ja) | 2004-03-02 |
Family
ID=7799743
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50553898A Expired - Lifetime JP3502639B2 (ja) | 1996-07-12 | 1997-06-03 | 強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読 |
Country Status (14)
Country | Link |
---|---|
US (1) | US6341165B1 (ja) |
EP (1) | EP0910928B1 (ja) |
JP (1) | JP3502639B2 (ja) |
KR (1) | KR100299528B1 (ja) |
AT (1) | ATE188833T1 (ja) |
AU (1) | AU707665B2 (ja) |
CA (1) | CA2260222C (ja) |
DE (2) | DE19628293C1 (ja) |
DK (1) | DK0910928T3 (ja) |
ES (1) | ES2143312T3 (ja) |
GR (1) | GR3032445T3 (ja) |
NO (1) | NO316972B1 (ja) |
PT (1) | PT910928E (ja) |
WO (1) | WO1998003037A1 (ja) |
Families Citing this family (58)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7177429B2 (en) | 2000-12-07 | 2007-02-13 | Blue Spike, Inc. | System and methods for permitting open access to data objects and for securing data within the data objects |
WO1999033194A1 (en) * | 1997-12-19 | 1999-07-01 | Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. | Method and apparatus for phase estimation in a transform coder for high quality audio |
US6591241B1 (en) * | 1997-12-27 | 2003-07-08 | Stmicroelectronics Asia Pacific Pte Limited | Selecting a coupling scheme for each subband for estimation of coupling parameters in a transform coder for high quality audio |
US7664264B2 (en) | 1999-03-24 | 2010-02-16 | Blue Spike, Inc. | Utilizing data reduction in steganographic and cryptographic systems |
US7475246B1 (en) | 1999-08-04 | 2009-01-06 | Blue Spike, Inc. | Secure personal content server |
FR2821475B1 (fr) * | 2001-02-23 | 2003-05-09 | France Telecom | Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques |
AUPR433901A0 (en) | 2001-04-10 | 2001-05-17 | Lake Technology Limited | High frequency signal construction method |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
ES2237706T3 (es) | 2001-11-29 | 2005-08-01 | Coding Technologies Ab | Reconstruccion de componentes de alta frecuencia. |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7287275B2 (en) | 2002-04-17 | 2007-10-23 | Moskowitz Scott A | Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7016547B1 (en) * | 2002-06-28 | 2006-03-21 | Microsoft Corporation | Adaptive entropy encoding/decoding for screen capture content |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
EP1734511B1 (en) | 2002-09-04 | 2009-11-18 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7318027B2 (en) * | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7688894B2 (en) * | 2003-09-07 | 2010-03-30 | Microsoft Corporation | Scan patterns for interlaced video content |
US7782954B2 (en) * | 2003-09-07 | 2010-08-24 | Microsoft Corporation | Scan patterns for progressive video content |
US7447317B2 (en) | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US7725324B2 (en) * | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US8843378B2 (en) * | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
BRPI0516201A (pt) * | 2004-09-28 | 2008-08-26 | Matsushita Electric Ind Co Ltd | aparelho de codificação escalonável e método de codificação escalonável |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
KR101346120B1 (ko) * | 2005-03-30 | 2014-01-02 | 코닌클리케 필립스 엔.브이. | 오디오 인코딩 및 디코딩 |
JP4610650B2 (ja) * | 2005-03-30 | 2011-01-12 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 多チャンネルオーディオ符号化 |
DE602006011600D1 (de) * | 2005-04-28 | 2010-02-25 | Panasonic Corp | Audiocodierungseinrichtung und audiocodierungsverfahren |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7693709B2 (en) | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
US8599925B2 (en) * | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7933337B2 (en) * | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8184710B2 (en) * | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US8179974B2 (en) * | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
KR102230668B1 (ko) | 2016-01-22 | 2021-03-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 미드/사이드 결정이 개선된 전역 ild를 갖는 mdct m/s 스테레오의 장치 및 방법 |
EP4213147A1 (en) * | 2018-10-26 | 2023-07-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Directional loudness map based audio processing |
JP7383942B2 (ja) * | 2019-09-06 | 2023-11-21 | ヤマハ株式会社 | 車載音響システムおよび車両 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4815132A (en) * | 1985-08-30 | 1989-03-21 | Kabushiki Kaisha Toshiba | Stereophonic voice signal transmission system |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
NL9100173A (nl) * | 1991-02-01 | 1992-09-01 | Philips Nv | Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting. |
KR100263599B1 (ko) * | 1991-09-02 | 2000-08-01 | 요트.게.아. 롤페즈 | 인코딩 시스템 |
DE4136825C1 (ja) * | 1991-11-08 | 1993-03-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De | |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
US5481643A (en) * | 1993-03-18 | 1996-01-02 | U.S. Philips Corporation | Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component |
DE4331376C1 (de) * | 1993-09-15 | 1994-11-10 | Fraunhofer Ges Forschung | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
WO1995012254A1 (en) * | 1993-10-27 | 1995-05-04 | Philips Electronics N.V. | Transmission and reception of a first and a second main signal component |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
DE4437287C2 (de) * | 1994-10-18 | 1996-10-24 | Fraunhofer Ges Forschung | Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
-
1996
- 1996-07-12 DE DE19628293A patent/DE19628293C1/de not_active Expired - Lifetime
-
1997
- 1997-06-03 KR KR1019980710867A patent/KR100299528B1/ko not_active IP Right Cessation
- 1997-06-03 DE DE59701015T patent/DE59701015D1/de not_active Expired - Lifetime
- 1997-06-03 ES ES97927117T patent/ES2143312T3/es not_active Expired - Lifetime
- 1997-06-03 DK DK97927117T patent/DK0910928T3/da active
- 1997-06-03 CA CA002260222A patent/CA2260222C/en not_active Expired - Lifetime
- 1997-06-03 AU AU31722/97A patent/AU707665B2/en not_active Expired
- 1997-06-03 WO PCT/EP1997/002875 patent/WO1998003037A1/de active IP Right Grant
- 1997-06-03 PT PT97927117T patent/PT910928E/pt unknown
- 1997-06-03 US US09/214,655 patent/US6341165B1/en not_active Expired - Lifetime
- 1997-06-03 JP JP50553898A patent/JP3502639B2/ja not_active Expired - Lifetime
- 1997-06-03 AT AT97927117T patent/ATE188833T1/de active
- 1997-06-03 EP EP97927117A patent/EP0910928B1/de not_active Expired - Lifetime
-
1999
- 1999-01-11 NO NO19990107A patent/NO316972B1/no not_active IP Right Cessation
-
2000
- 2000-01-20 GR GR20000400140T patent/GR3032445T3/el unknown
Non-Patent Citations (1)
Title |
---|
ポイント図解式最新MPEG教科書,株式会社アスキー,1994年 8月 1日,167−188 |
Also Published As
Publication number | Publication date |
---|---|
EP0910928A1 (de) | 1999-04-28 |
GR3032445T3 (en) | 2000-05-31 |
KR100299528B1 (ko) | 2001-10-29 |
KR20000022434A (ko) | 2000-04-25 |
DE59701015D1 (de) | 2000-02-17 |
AU707665B2 (en) | 1999-07-15 |
NO990107L (no) | 1999-03-10 |
US6341165B1 (en) | 2002-01-22 |
NO990107D0 (no) | 1999-01-11 |
ATE188833T1 (de) | 2000-01-15 |
ES2143312T3 (es) | 2000-05-01 |
JPH11514181A (ja) | 1999-11-30 |
CA2260222A1 (en) | 1998-01-22 |
NO316972B1 (no) | 2004-07-12 |
PT910928E (pt) | 2000-04-28 |
DK0910928T3 (da) | 2000-05-08 |
DE19628293C1 (de) | 1997-12-11 |
EP0910928B1 (de) | 2000-01-12 |
CA2260222C (en) | 2000-10-17 |
WO1998003037A1 (de) | 1998-01-22 |
AU3172297A (en) | 1998-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3502639B2 (ja) | 強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読 | |
JP3622982B2 (ja) | ステレオ音響スペクトル値の符号化・解読方法 | |
US6502069B1 (en) | Method and a device for coding audio signals and a method and a device for decoding a bit stream | |
EP0918407B1 (en) | Scalable stereo audio encoding/decoding method and apparatus | |
US5488665A (en) | Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels | |
JP3926399B2 (ja) | オーディオ信号コーディング中にノイズ置換を信号で知らせる方法 | |
CN101118747B (zh) | 保真度优化的预回声抑制编码 | |
KR100310081B1 (ko) | 오디오신호코딩방법및장치 | |
JP3343962B2 (ja) | 高能率符号化方法及び装置 | |
JP3352406B2 (ja) | オーディオ信号の符号化及び復号方法及び装置 | |
US20110173005A1 (en) | Efficient Use of Phase Information in Audio Encoding and Decoding | |
JP2001500640A (ja) | オーディオ信号の符号化方法 | |
JP4063508B2 (ja) | ビットレート変換装置およびビットレート変換方法 | |
KR20070001139A (ko) | 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 | |
WO1995034956A1 (fr) | Procede et dispositif de codage de signal, procede et dispositif de decodage de signal, support d'enregistrement et dispositif de transmission de signaux | |
EP1553563B1 (en) | Method and apparatus for converting audio data | |
JP4618873B2 (ja) | オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム | |
Davidson | Digital audio coding: Dolby AC-3 | |
JP3854313B2 (ja) | 複数の情報信号のエンコーディング | |
JPH09135173A (ja) | 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体 | |
Rault et al. | The ISO/MPEG audio musicam family | |
JPH096395A (ja) | 音響再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20031208 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081212 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091212 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091212 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101212 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111212 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121212 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131212 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |