JP3502639B2 - 強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読 - Google Patents

強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読

Info

Publication number
JP3502639B2
JP3502639B2 JP50553898A JP50553898A JP3502639B2 JP 3502639 B2 JP3502639 B2 JP 3502639B2 JP 50553898 A JP50553898 A JP 50553898A JP 50553898 A JP50553898 A JP 50553898A JP 3502639 B2 JP3502639 B2 JP 3502639B2
Authority
JP
Japan
Prior art keywords
stereo
channel
prediction
intensity
scale factor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP50553898A
Other languages
English (en)
Other versions
JPH11514181A (ja
Inventor
グバー,ウヴェ
ディーツ,マルティン
ブランデンバーグ,カールヘインツ
ゲルヘウザー,ヘインツ
ヘル,ユルゲン
クァッケンブッシュ,シュイラー
Original Assignee
フラオホッフェル―ゲゼルシャフト ツル フェルデルングデル アンゲヴァンドテン フォルシュング エー.ヴェー.
エーティー アンド ティー ラボラトリィーズ/リサーチ
ルーセント テクノロジーズ,ベル ラボラトリィーズ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラオホッフェル―ゲゼルシャフト ツル フェルデルングデル アンゲヴァンドテン フォルシュング エー.ヴェー., エーティー アンド ティー ラボラトリィーズ/リサーチ, ルーセント テクノロジーズ,ベル ラボラトリィーズ filed Critical フラオホッフェル―ゲゼルシャフト ツル フェルデルングデル アンゲヴァンドテン フォルシュング エー.ヴェー.
Publication of JPH11514181A publication Critical patent/JPH11514181A/ja
Application granted granted Critical
Publication of JP3502639B2 publication Critical patent/JP3502639B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/06Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation
    • H04B14/066Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM]
    • H04B14/068Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM] with adaptive feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Description

【発明の詳細な説明】 この発明は、音響信号の符号化と解号に関するもの
で、特にインテンシティステレオ処理と予測を使ったス
テレオ音響スペクトル値の符号化と解号に関するもので
ある。
最も進歩した音響符号化と解号の処理、例えばMPEGレ
イヤー3スタンダードの操作は、デジタル音響信号のデ
ータ率を、例えば12の係数でそれらの品質を著しく落と
すことなく圧縮することができる。
例えば左チャンネルLや右チャンネルRのような、そ
れぞれのチャンネル中の大きな符号化利得を離れて、2
個のチャンネルの相対的余剰性や無関連性は、ステレオ
的の場合にはまた利用可能である。すでに利用されてい
る公知の方法には、いわゆるMSステレオ処理(MSはセン
ターサイド)とかインテンシティステレオ処理(IS処
理)がある。
現行技術で公知のMSステレオ処理は、2個のチャンネ
ルの相対的余剰性を利用している。それは、2個のチャ
ンネルを合わせてそれらの間の違いを計算して、修正チ
ャンネルデータとしてそれぞれ左右のチャンネルに送
る。すなわちMSステレオ処理は、正確に再現する作用を
持っている。
MSステレオ処理と違って、インテンシティステレオ処
理はステレオの無関連性を利用している。ステレオの無
関連性に関係して、人間の聴覚システムの空間的知覚は
感知した音響信号の周波数に依存している。低周波数に
おいては、2個のステレオ信号中の大きさ情報と位相情
報の両方が、人間の聴覚によって評価され、高周波数成
分の知覚は、主に両方のチャンネルのエネルギーと時間
の包絡面の分析に基づいている。かようにして両チャン
ネルの信号中の正しい位相情報は、空間的知覚には直接
関係はない。インテンシティステレオ処理による音響信
号の余剰データ削減のために、人間の知覚のこの特徴
は、ステレオ的無関連性を使うのに利用されている。
インテンシティステレオ処理は、高周波数では正確に
細かい情報を分解できないので、エンコーダーではっき
りした周波数限度のインテンシティから、2個の別々の
ステレオチャンネルL、Rの代わりに、両方のチャンネ
ルに連結エネルギー包絡線を送ることができる。連結エ
ネルギー包絡線に加えて、補助情報としておおまかに定
量化した方向情報も送られる。
ステレオ符号化のインテンシティが使われるときは、
チャンネルは部分的にしか送られないので、ビットの節
約は50%にもなる。しかしながらIS処理は、デコーダー
の中には再組立て作用を持ってないことに注意すべきで
ある。
MPEGスタンダードのレイヤー3に今まで採用されてい
るIS処理では、ステレオ音響スペクトル値のブロック中
ではIS処理は活性化しているという事実は、いわゆるモ
ードイクステンションビットによって示され、それぞれ
のブロックは、それに割り当てられたモードイクステン
ションビットをもっている。
公知のIS処理の理論的な表示は、図1に示す。チャン
ネルL10とチャンネルR12のステレオ音響スペクトル値
は、合計点14で合計されて、その両チャンネルに対しエ
ネルギー包絡線I=Li+Riを得る。このLiとRiは、いか
なるスケールファクター帯域中のそれぞれのチャンネル
LおよびRのステレオ音響スペクトル値をも表す。既に
述べたごとく、IS処理の使用は、符号化されたステレオ
音響スペクトル値への符号挿入エラーを避けるため、あ
るIS周波数限度においてだけ許されるものである。それ
ゆえ左右のチャンネルは、それぞれ別々に0HzからIS周
波数限度の範囲内で符号化されなければならない。その
様なIS周波数限度は、この発明には関係ない別の算法で
決められる。この周波数限度以上では、エンコーダーが
左チャンネル10と右チャンネル12の合計信号を合計点14
で合計し符号化する。
チャンネルLのスケール情報16とチャンネルRのスケ
ール情報18は、例えば左と右の合計信号のようなエネル
ギー包絡面に加えて解号するのに必要であり、それは例
えば符号化された左のチャンネルに送られる。左と右の
チャンネルへのスケールファクターは、例えばMPEGレイ
ヤー2の中で行われる様に、インテンシティステレオ処
理の中で送られる。しかしながらここで述べなければな
らないことは、IS符号化ステレオ音響スペクトル値のMP
EGレイヤー3中のIS処理では、方向情報のインテンシテ
ィが左のチャンネル中だけで送られ、そのスペクトル値
は、以下に述べるごとくこの情報によって再び解号され
ることである。
スケール情報16と18は補助情報としてチャンネルLと
チャンネルRの符号化スペクトル値に加えて送られる。
デコーダーは解号チャンネルL'20と解号チャンネルR'22
で解号された音響信号値を搬送し、チャンネルRのスケ
ール情報16とチャンネルLのスケール情報18は、はじめ
から符号化されたステレオ音響スペクトル値を解号する
手段として、L乗算器24とR乗算器26の中の各チャンネ
ルのための符号化されたステレオ音響スペクトル値によ
って乗算される。
IS符号化がIS周波数限度を越えるか、MS符号化がこの
限度を下回って振り向けられる前に、それぞれのチャン
ネルに対するステレオ音響スペクトル値はいわゆるスケ
ールファクター帯域の中に集められる。この帯域は聴覚
の知覚特性に適合させられる。それぞれの帯域は追加係
数、いわゆるスケールファクターによって増幅され、そ
れは補助情報として特別なチャンネルに送られ、図1の
スケール情報16および18の部分を構成する。これらの要
素は、定量化によって起こされ音響心理面でマスクされ
て聞き取れなくなるような干渉ノイズ形成の原因であ
る。
図2aは、例えばMPEGレイヤー3音響符号化処理に使わ
れる符号化された右チャンネルRの形態を示す。ステレ
オ符号化のインテンシティのいかなる言及もMPEGレイヤ
ー3スタンダードの処理に関係がある。ステレオ音響ス
ペクトル値が集められる個々のスケールファクター帯域
28は、図式的に図2aに示されている。図2aでは、それら
の帯域がはっきりと幅が等しく示されているが、実際は
その幅は聴覚の音響心理の特性の故に等しくはない。
図2aの2番目の線は、符号化ステレオ音響スペクトル
値spを含んでいて、それはIS周波数限界32の下では0で
ない。すなわちIS周波数限界より上の右チャンネルのス
テレオ音響スペクトル値は、すでに(nsp=0スペクト
ル)と述べたごとく0(0 パート)nspにセットされ
る。
図2aの3番目の線は、右チャンネルに対し補助情報34
の部分を含んでいる。最初に示された情報34の部分は、
IS周波数限界32の下の範囲に対しスケールファクターsk
fを含んでおり、周波数限界より上の範囲に対し方向情
報rinfo36を含んでいる。この方向情報は、インテンシ
ティステレオ処理中のIS符号化周波数範囲のおおまかな
局部的分析を行うのに使われる。従って方向情報rinfo3
6は、インテンシティの位置(is_pos)にも関係して、
スケールファクターの代わりに右チャンネルに送られ
る。再び述べなければならないことは、スケールファク
ター34がスケールファクター帯域28に対応して、IS周波
数限界の下の右チャンネルの中に依然として存在してい
ることである。インテンシティの位置36は、それぞれの
スケールファクター帯域28中の信号源を感知したステレ
オ想像位置(右から左への比率)を示している。IS周波
数限界上のそれぞれの帯域28で、透過ステレオ音響スペ
クトル値の解号された値は、左チャンネルに対してはス
ケールファクターkLとして、右チャンネルに対してはス
ケールファクターkRとして、MPEGレイヤー3処理によっ
てスケール化される。
kL=is_ratio/(1+is_ratio) (1) および kR=1/(1+is_ratio) (2) is_rationの式は次の通り is_ratio=tan(is_pos・π/12) (3) is_posの値は3ビットに定量化し、0から6までの値
が妥当な位置を示す値である。右と左のチャンネルは、
次の2個の式のI信号(I=Li+Ri)から導かれる。
Ri=I・is_ratio/(1+is_ratio)=I・kL (4) Li=I・1/(1+is_ratio)=I・kR (5) RiとLiはステレオ符号化インテンシティのステレオ音
響スペクトル値である。ここで述べなければならないの
は、左チャンネルでゼロスペクトルがIS周波数限度32の
上に見られるよりは組合せスペクトルI=Li+Riであ
り、左チャンネルのための方向情報is_posよりは普通の
スケールファクターが存在するが、左チャンネルのフォ
ーマットは、図2aに示される右チャンネルのフォーマッ
トに類似している。右チャンネルにおけるゼロでない定
量化総スペクトル値からゼロ値への移行は、無条件にMP
EGレイヤー3スタンダード内のデコーダーに対しIS周波
数限界を示している。
透過チャンネルLはこのようにしてエンコーダーの中
で左と右のチャンネルの合計値として計算され、移行方
向情報は次の式によって明らかにされる。
nint[x]関数は「次の全数」関数を表し、ELとER
それぞれ左と右のチャンネルのスケールファクター帯域
におけるエネルギーである。このエンコーダーとデコー
ダーの公式は左と右のチャンネルにおけるおおよその復
元を与える。
予測の使用はNBCエンコーダーによる符号化と解号で
すでに公知である。特に第2の指示すなわち後向き適応
予測が使用される。エンコーダーとデコーダーの中の予
測器には同じ入力信号が入るので、「後向き適応」と
は、予測器係数は送られる必要がないということを意味
する。従ってデコーダーの中の予測手段は、予測係数そ
れ自体を引き出すことができる。
予測器の作動モードは、基本的には先行入力値に基づ
く最新信号の評価値を供給することである。比較的狭い
スペクトルを持った信号である階調信号や、本来のスペ
クトルと評価値の間の相違である予測器エラー信号は、
本来のスペクトルよりも著しく小さく、そのため予測エ
ラー信号はより少ないビットで符号化でき、それによっ
てより本質的なデータ圧縮をする。それゆえこの量子化
した予測エラー信号だけが送られる。デコーダーの予測
器は、それから本来の信号を引き出すことができる。
予測器の入力信号が、聴衆の拍手の様な音響信号を持
つ階調でないとき、予測エラー信号は本来の信号よりも
より強くなる。そのとき予測はビットロスをつくる。す
なわち符号化されるべきデータの量が増える。このため
に予測がスケールファクター帯域幅を入り切りする。方
向情報のインテンシティの様に、予測がスケールファク
ター帯域の中で使われているか使われてないかについて
の情報は、補助情報として送られる。
もしもインテンシティステレオ符号化や予測が、ステ
レオ音響スペクトル値の符号化に同時に使われると、次
の様な問題が起こる。
インテンシティステレオ計算が予測の前に起こるので
ある。両方のチャンネルと予測エラー信号からの方向情
報のインテンシティへの連結エネルギー包絡線をつくる
ことを探知しないから、この続発は避けられない。既に
述べたごとく、ステレオ音響スペクトル値30を含む右チ
ャンネルは、図2a、2bに示すごとくIS符号化でゼロにセ
ットされる。これらのゼロ値は、右チャンネルに対する
予測器の入力値である。
予測器は、少なくとも1個の先行入力値から評価値を
計算しなければならないから、インテンシティステレオ
周波数限度32の下のスケールファクター帯域28からその
限度の上の帯域へ、その行程が切り換わるときに起こる
ことは、それはいつも同じというわけでなく、音響信号
に応じて連続的に決められなければならないわけだが、
IS周波数限度上の右チャンネルのステレオ音響スペクト
ル値30は急にゼロになることである。しかしながらその
予測器は、ある時間ゼロでない評価を依然として送り、
それゆえ符号化されるべきエラー信号はゼロでない。そ
の結果ゼロでない音響スペクトル値は、右チャンネル12
の中のIS周波数限度上を送られ、実際のインテンシティ
ステレオ処理のための条件の消去となる。
予測とIS処理の同時使用は符号化されるデータの更な
る圧縮に役立つが、予測とインテンシティステレオ符号
化を同時に使う音響信号の符号化と解号には前記のよう
な難しさがあるため、この2個の行程は今まで一緒には
使われなかった。問題なく予測をできるようにするため
に、もしもインテンシティステレオ処理が全く使われな
いと、データ圧縮のためのインテンシティステレオ符号
化の上記利点は生かされない。ほかの可能性は、予測器
によるインテンシティステレオ周波数限度の下のステレ
オ音響スペクトル値だけを圧縮し、インテンシティステ
レオ処理によって例外的にIS周波数限度32上のステレオ
音響スペクトル値を符号化することである。インテンシ
ティステレオ周波数限度上の左チャンネル中のステレオ
音響スペクトル値30の予測は、符号化されるべきデータ
の追加的圧縮を行う。
この発明の問題は、ステレオ音響スペクトル値を符号
化する方法と、符号化されたステレオ音響スペクトル値
を解号する方法と、ステレオ音響スペクトル値を符号化
する装置または符号化されたステレオ音響スペクトル値
を解号する装置を提供して、増大したデータの圧縮を可
能にするものである。
この問題は、請求項1に記載されたステレオ音響スペ
クトル値の符号化の方法や、請求項10に記載されたイン
テンシティステレオ処理に部分的に符号化されているス
テレオ音響スペクトル値の解号の方法や予測による部分
的な方法や、請求項13に記載されたステレオ音響スペク
トル値を符号化するための装置や、請求項15に記載され
たインテンシティステレオ処理に部分的に符号化された
予測によって部分的に符号化されたステレオ音響スペク
トル値を解号する装置によって解決される。
この発明は、増大したデータの圧縮は、予測とステレ
オ音響スペクトル値のインテンシティステレオ符号化を
結合して使用することによって可能であるという発見に
基づいている。この目的の為に、もしもステレオ音響ス
ペクトル値に対するインテンシティステレオ符号化が対
応するスケールファクター帯域の中で活性化されたら、
この発明の更なる発展において、予測が右チャンネルに
対して不活性化されなければならない。ステレオ音響ス
ペクトル値がインテンシティステレオ符号化によって符
号化されない場合に正しい予測値が送信される様により
ふさわしい適用をするため、インテンシティステレオ符
号化されたステレオ音響スペクトル値を持つゼロスペク
トルを持った右チャンネルの予測器は、同様に右チャン
ネルに対するインテンシティステレオ解号されたステレ
オ音響スペクトル値を供給されなければならない。これ
が行われないと、予測器は調整の悪い状態になり、その
結果IS符号化が切断されたとき、予測の低下によってデ
ータの圧縮が一時著しく損失をこうむる。
右チャンネルに対しては、インテンシティステレオ処
理による符号化により、右チャンネルの予測器は、同様
にある程度作動し続けなければならない。すなわちそれ
は右チャンネルの符号化されないステレオ音響スペクト
ル値を供給されるのである。しかしながら、インテンシ
ティステレオ周波数限度の上のスケールファクター帯域
のためのステレオ音響スペクトル値はゼロに設定される
べきというインテンシティステレオ条件を満足させるた
めに、右チャンネルの予測結果は、ステレオ音響スペク
トル値を符号化用に考慮されてはならない。
従って予測の更なる適用は常に可能でなければならな
い。すなわちある平均周波数を持ったIS符号化スケール
ファクター帯域が、実質的に同じ平均周波数を持った非
IS符号化スケールファクター帯域と互い違いに起こると
きに、予測係数の最新化が可能でなければならない。た
とえばこれは、もしもIS周波数限度が1個のブロックか
ら次のブロックに変わるときか、またはもしもIS周波数
限度上のスケールファクター帯域が1個のブロックの中
でIS符号化され、次のブロック中で図2bに示されるごと
くIS解号されるときである。
予測は、高度非階調信号の場合に非活性化スケールフ
ァクター帯域幅になりうるということは既に述べられて
いる。しかし例えばもしも聴衆の喝采があると、そのス
ケールファクター帯域の中の信号は再び階調になり、し
たがって予測は、そのときに符号化されるべきブロック
の中で再活性化されなければならない。ここでまた予測
は、活性化のすぐ後でも高度データ圧縮に対し予測エラ
ー信号がほとんどないような、更なる順応が出来なけれ
ばならない。従ってこの順応においては、予測の「活性
化」、「非活性化」、または「接続」と「断続」の用語
は、予測器が入力値を供給されつづけて、予測がその予
測係数を最新化するのを可能にさせるが、予測の結果は
符号化された信号の中では考慮されないという感覚で使
われる。
ここで、この発明のいくつかの好ましい実施例を、添
付図に照らして詳細に説明する。
図1は、従来技術のインテンシティステレオ符号化の
ための理論回路図である。
図2aは、MPEGレイヤー3スタンダードの右チャンネル
に対するインテンシティステレオ符号化があるときのデ
ータのフォーマットである。
図2bは、MPEG−NBC処理の右チャンネルに対するイン
テンシティステレオ符号化があるときのデータのフォー
マットである。
図3aは、左チャンネルに対する予測器の第1実施例で
ある。
図3bは、左チャンネルに対する予測器の第2実施例で
ある。
図4は、右チャンネルに対する予測器である。
図5は、符号化されたステレオ音響スペクトル値を解
号する予測器である。
図6は、符号化されたステレオ音響スペクトル値を解
号するためのデコーダーを示すブロック回路図である。
図2bは、MPEG2−NBC処理を使ったインテンシティステ
レオ符号化による右チャンネルRのデータフォーマット
を示す。図2aまたはMPEGレイヤー3処理との違いは、現
在のMPEG2−NBC処理の利用者が、IS周波数限度32の上で
も、それぞれの区域すなわち少なくとも1個のスケール
ファクター帯域に対し、ステレオ音響スペクトル値のス
テレオ符号化のインテンシティを選択的に接続したり接
続を切ったりできる柔軟性を持っていることである。従
ってNBC処理では、IS周波数限度の上でもIS符号化は接
続を切ったり再度接続したりできるから、IS周波数限度
はMPEGレイヤー3に比べて実際には本当の周波数限度で
はない。これはレイヤー3では不可能であった。すなわ
ちIS符号化が1個の区域にあると、IS周波数限度上のス
テレオ音響スペクトル値がスペクトル範囲の最上位に正
しく符号化されることが必須であった。新しいNBC処理
では、IS限度上の全てのスペクトル範囲に対してIS符号
化を活性化させる必要はない。すなわち信号が伝えられ
たらIS符号化の接続が切られるようになるからである。
それゆえIS符号化されたスケールファクター帯域は、符
号化されないスケールファクター帯域と互い違いにな
る。
右チャンネルのIS符号化によって1個の区域に送られ
るスケールファクターは、従来技術の様に方向情報のイ
ンテンシティ36を形成し、それらの値はまた特異なハフ
マン符号化を受ける。すでに述べたごとく、右チャンネ
ルすなわちIS周波数限度32上のスケールファクター帯域
には、ステレオ音響スペクトル値よりもゼロスペクトル
がある。左チャンネルは、IS符号化区域の中に左と右の
チャンネルへの全信号を含む。しかしながらこの全信号
は、それぞれのスケールファクター帯域のエネルギー
が、IS解号の後左チャンネルのエネルギーに等しくなる
様に標準化される。IS符号化がデコーダーの中で使われ
た場合、左チャンネルはそれゆえに不変のまま取り上げ
られ、合計すなわち差異をつくることによって明確に決
められる必要がない。右チャンネルに対するステレオ音
響スペクトル値は、右チャンネルの補助情報の中にある
インテンシティ方向情報is posを使って、左チャンネ
ルのステレオ音響スペクトル値から引き出すことができ
る。
図3aは、予測器40の第1実施例を示すダイアグラム
で、その予測器は左ステレオチャンネルLのステレオ音
響スペクトル値が供給可能な入力42を持っている。予測
器40の出力44で、送られるべき予測エラー信号はビット
ストリームに書きこまれ、それは符号化されたステレオ
音響スペクトル値とそれらすなわちスケールファクター
帯域幅上の補助情報の両方を含む。予測エラー信号を量
子化する量子化器46の入力と予測器40の入力42との間に
は、第1の合計装置48があり、それは予測器40の入力42
で入ったステレオ音響スペクトル値と予測器50(予測エ
ラー信号)の出力値間の差を形成する。その名前から類
推して、量子器46はステレオ音響スペクトル値を量子化
し、ビットストリームに量子化した値を書きこむ。その
名前に反して、それはまた同時に量子化を実行し、再量
子化されたステレオ音響スペクトル値が第2の出力47を
経て出力される。
予測器50の入力は、第2の合計装置52によってつくら
れた入力値を受け取る。
この第2の装置は、量子化器46の出力47で再び量子化
された形で存在する予測エラー信号を、予測器50の出力
値に加える。この予測エラー信号と予測評価の合計は、
従って予測器50の入力値であり、それは次には将来の値
を評価するため、それへの入力値として使われる。
予測器40には、第1スイッチ54と第2スイッチ56がさ
らに備わっている。すでに従来技術の中で述べたごと
く、あるスケールファクター帯域に対して予測をしない
ことは、それらが非階調音響データを含んでないから都
合の良いことである。それにもかかわらず、もしも予測
がそれらの非階調スケールファクター帯域でつくられれ
ば、それはビットロスすなわちその圧縮の代わりに符号
化されるデータの量の増加となる。左チャンネルLに対
する予測は、スイッチ54と56によって切られる。図3aで
は、スイッチ54と56は、左チャンネルのためにつくられ
ているとの予測で描かれている。
注意しなければならないことは、スイッチは一緒に切
り替えられなければならないということである。従って
1個のスイッチを入れて他をそのままにしておくという
ことはないわけである。もしもスイッチ54、56が、図3a
に示す様にPON(PEIN)の位置からPOFF(PAUS)の位置
に移動すると、第1の合計装置はバイパスされ、それに
よってステレオ音響スペクトル値は予測されてないで量
子器46に行き、そこから符号化されたビットストリーム
に記入される。
もしもスイッチ54がPOFFの位置にあると、これは予測
が作られていないという意味であるが、ステレオ音響ス
ペクトル値は直接予測器を通り越して、予測列と対照し
て予測エラー信号としてでなく実際の値として第2合計
装置52に現れ、予測器Pがステレオ音響スペクトル値に
順応できる様に予測器Pに送られる。スイッチ54がPOFF
の位置にあるときに、もしもスイッチ56がPON位置にあ
ると、合計装置52にある実際の予測信号は、スイッチ56
を経て他の予測信号に加えられ、その結果予測器P50
は、入力信号として2回予測信号を受け、その予測係数
の間違った対応をすることになる。
図3bは、左チャンネルLに対する予測器の第2実施例
で、それは第1実施例に似ているがスイッチ54、56の代
わりにひとつだけのスイッチ57がある。
もしもスイッチ57がPON位置にあると、予測は上記に
記したようになり、その結果はデータの符号化に使われ
る。しかしながらもしもスイッチ57がPOFFの位置にある
と、図3bの予測器は、不活性化される。すなわち予測が
予測係数に順応するようにされても、予測の結果はデー
タを符号化することには考慮されない。
図4には、入力62を経てステレオ音響スペクトル値が
送られる右チャンネルRのための予測器60と、インテン
シティステレオデコーダー(IS-1)64の両方がある。図
4にあるほかの成分は、図3aのほかの成分と同じで、同
じように作動する。図3bの第2実施例も、また左チャン
ネルに対する予測器として使われるということは、当業
者にとっては明白なことである。しかしながら左チャン
ネルの予測器40と違って、右チャンネルの予測器60は、
第3スイッチ66を持っていて、その作動と使用は次の通
りである。
既に述べたごとく右チャンネルの単一予測は、インテ
ンシティステレオ符号化されたステレオ音響スペクトル
値を持つゼロでないエラー信号をつくる。もしもそのエ
ラー信号が右チャンネルのビットストリームに書きこま
れると、右チャンネルのステレオ音響スペクトル値がイ
ンテンシティステレオ周波数限度上のスケールファクタ
ー帯域でゼロに設定されるから、基本的インテンシティ
ステレオ条件は破棄される。しかし非活性化の間に予測
器が正しく右チャンネル中の実際の値に順応できるため
には、ステレオ音響スペクトル値はそれでもそこに供給
されなければならない。しかし、それらはインテンシテ
ィステレオ処理によって符号化されるので、それらはIS
デコーダー64で解号され、予測手段60の予測器50に送ら
れなければならない。従ってISデコーダー64は、入力で
左チャンネルのIS符号化ステレオ音響スペクトル値と、
右チャンネルの補助情報に送られた方向情報のインテン
シティを受け取る。
図4には、ステレオ音響スペクトル値のインテンシテ
ィステレオ符号化が行われようとしている状態のスイッ
チ54、56、66が記されている。既に述べた通り、予測は
この状態では切られなければならず、それ故にスイッチ
54と56はPOFFとPONになる。符号化されてないスケール
ファクター帯域は、解号されたデータの量を減らすた
め、左右の両チャンネル中の予測にさらされる。その場
合スイッチ54、56、66は、それぞれPON+ISOFF(I
SAUS)とISOFFの位置に移動する。この発明の好ましい
実施例においては、予測器は実際の左または右のチャン
ネルだけを認識する。従って潜在的MS符号化は量子化器
Q46の中ですなわち予測後に行われる。
第3のスイッチ66は、再び量子器46の出力47に接続
し、その結果量子器の出力44に現れるビットストリーム
に書かれた予測エラー信号は、再びそのスイッチを流れ
る。インテンシティステレオデコーダー64は、この場合
にはインテンシティステレオ符号化したデータがないか
ら活性化してない。
図5は、再予測器70の理論的構造を示し、それは左チ
ャンネルに対する予測器40と右チャンネルに対する予測
器60に似た構造を持っている。最初に解号されるべきス
テレオ音響スペクトル値は非量子化器Q-172に通じ、量
子化器46に導かれた量子化を取り消す。まだ予測すなわ
ち予測エラー信号を持っている非量子化されたステレオ
音響スペクトル値は、それから再予測器70の入力へ通じ
る。
第1合計装置48と実際の予測器50は同じ資料を持って
いる先に記述した装置と同一である。予測器P50の出力
値である再量子化予測エラー信号と予測評価は、合計装
置48でつくられる。もしも第4スイッチ78が図5に示さ
れるPONの位置にあり、処理されようとするデータが予
測にさらされようとすることを示すと、この合計は予測
器P50の次の入力信号として使われ、再予測器70の出力7
6で再予測信号として出力される。このスイッチ78は予
測器P50は、いかなる予測の非活性化にもかかわらず、
いつでもその予測係数に順応することを保証する。
ステレオ音響スペクトル値の補助情報から処理されよ
うとするデータが予測にさらされてないということが確
認されると、第4スイッチ78はPOFFに移動し、予測器P
の出力はもはや合計装置48にはつながらない。先に記さ
れた位置とは対称に、量子器は次に、予測エラー信号で
なく接続された予測によって実際のステレオ音響スペク
トル値を量子化する。第1合計装置48から分離した予測
器P50の出力すなわち非活性化された予測器Pによっ
て、符号化されてないステレオ音響スペクトル値は再予
測器76の出力に現れる。それらは時間分離の音響信号を
得るため、従来技術で知られた方法で時間領域に変えら
れる。
ここで注意しなければならないことは、図5と6の予
測器P50は、図3と4に示された予測器P50と同じであ
る。エンコーダーとデコーダーの中の符合する予測器50
はそれらの入力値と同じ値を正しく受け取るという事実
によって、それぞれの予測器が後向き適応の原理に一致
してそれ自身でそれらを計算できるから、使われた予測
器係数を移す必要はない。「第2オーダー後向き適応」
とは、2個の先行値がつくられた予測のために使われ、
新しい評価をするために従来技術で知られた方法で計算
されたすなわち順応した予測係数によって、操作される
ということである。
図6は、部分的にインテンシティステレオ処理の中
と、部分的に予測によって符号化されたステレオ音響ス
ペクトル値を解号する装置の好ましい実施例である。左
Lと右Rチャンネルの中で符号化された値は、それぞれ
の非量子化器72に送られる。例えばM−S符号化された
2個のチャンネルの非量子化値は、M−Sデコーダー80
で解号される。この発明を実行するために、ステレオ音
響スペクトル値がインテンシティステレオ符号化されて
ない範囲の中央処理によって符号化されることは必須で
ないことは、当業者にとっては明らかなことであろう。
しかしながらこれはデータの量を少なくするには有利な
ことである。
この発明の好ましい実施例において、このように符号
化されたステレオ音響スペクトル値は、1以上のスケー
ルファクター帯域中の左チャンネルLで予測符号化を持
っている。その場合には左チャンネルLの第4スイッチ
78は図6のPOFF位置にある。符号化されてない形のステ
レオ音響スペクトル値は、左チャンネルLの第4スイッ
チ78の後ろにある。ふさわしい周波数領域/時間領域変
換器82によって、それらは時間分離の音響信号にかえら
れる。
最初に記したごとく、この発明の実施例は、左チャン
ネルのステレオ音響スペクトル値が左右のチャンネルの
合計値を含んだインテンシティステレオ符号化を使用し
ている。この発明の好ましい実施例では、それらのエネ
ルギーが左チャンネルのエネルギーに相当する様に標準
化されていて、そのためデコーダー中での復元の必要性
を事前に除去している。しかしながら別のインテンシテ
ィステレオ処理が使われて、左チャンネルでの全信号の
標準化が実行されず、そのためそのエネルギーは本来の
左チャンネルのエネルギーに相当する。この場合には左
チャンネルL中の第4スイッチ78の後ろにあるステレオ
音響スペクトル値は、右チャンネルの補助情報の近くに
含まれるインテンシティステレオ解号にさらされなけれ
ばならず、そこでは方向情報のインテンシティは既に記
した様に存在している。
必要であればM−S解号されている右チャンネルR中
のステレオ音響スペクトル値は、ISOFFの位置にある第
5スイッチ84と会い、そこでそれらの値は再予測器70に
よって再予測され、PON位置にある第4スイッチ78を通
して周波数領域/時間領域変換器82に送られ、右チャン
ネルに対する時間分離のステレオ音響信号r(t)をつ
くる。
もしもインテンシティステレオ符号化がスケールファ
クター帯域の中に存在したら、2個の符号化処理は同時
には使えないからその帯域に対してMS解号は行われな
い、ということは当業者にとっては明白なことである。
IS符号化されたステレオ音響スペクトル値を変えないで
通過させることによって、MSデコーダーは2個のチャン
ネルの補助情報に反応する。
すでに述べたごとく、右チャンネルRにはIS符号化さ
れたステレオ音響スペクトル値はない。右チャンネルR
は、補助情報として方向情報のインテンシティ情報is_p
osを持っているだけである。
IS符号化されたステレオ音響スペクトル値を解号する
ために、左チャンネルLに存在する値は、右チャンネル
の補助情報にアクセスするISデコーダー64の中のIS解号
にさらされる。
この様にIS解号された右チャンネルの値は、ISONの位
置にある第5スイッチ84を通り越して右チャンネルRの
再予測器70に行く。しかしながらそのチャンネルは本質
的にゼロスペクトルを持っているので、IS符号化が存在
するときは、右チャンネルに対するデータは予測にさら
されないから、チャンネルR中の第4スイッチ78はISON
の位置にあり、そのため予測器P50とチャンネルR中の
第1合計装置をバイパスする。ISデコーダー64で解号さ
れる右チャンバRのためのステレオ音響スペクトル値は
予測ができないので、それらは変えられないでスイッチ
84を通って周波数領域/時間領域変換器82の右チャンネ
ルRに送られる。スイッチ78を通る予測器Pの出力は、
不活性化されているので時間分離の解号された音響信号
r(t)を与えるため、その変換器は好ましい実施例で
は、逆のフィルターバンクになる。
図1に示したMPEGレイヤー2スタンダードと異なり、
そこでは方向情報のインテンシティによってでなく、左
右チャンネルの2個の別々のスケールファクターによっ
て方向情報のインテンシティが送られ、すでに何回も述
べている通り、NBC符号化または解号は下記の理由から
方向情報のインテンシティis_posの移送を要求する。
左チャンネルがゼロを送るだけだと、その装置はスケ
ール情報を無関係なものとみなす。しかしこれが常に予
測に当てはまるわけではない。すなわち予測の結果、予
測器の出力の予測エラー信号は必ずしもゼロではないか
らである。スケールファクターはそのときには増加しな
ければならず、予測によって量子化される1以上のスケ
ールファクター帯域内のスペクトル値がゼロとみられる
ことが起こる。そのときはNBC処理のシンタックスは、
その場合に移送されるべきスケールファクターを供給し
ない。そのときにはIS符号化されたステレオ音響スペク
トル値に対する方向はなく、それらの値に対するステレ
オイメージの完全な破壊となる。
2個のスケールファクターの代わりに方向情報のイン
テンシティを使うと、符号化されたデータの量をさらに
減らすため、その情報の完全な符号化の代わりに特異な
符号化を許すことになる。IS符号化されてない範囲のス
ケールファクターで、一番はじめに現れる値すなわち初
期値は、8ビットに量子化された大きさである。IS符号
化されたステレオ音響スペクトル値では第1の値すなわ
ち初期値はゼロである。ISスケールファクターと「普通
の」スケールファクターは、交互に符号化されたビット
ストリームにあらわれる。従って2個の状態の機械すな
わち特殊PCMエンコーダーが、符号化に必要とされる。
それぞれの場合、次の式7と8から次の値を計算する
ために、それらは2個の係数の最後の値に注目する。
dscf(n)=scf(n)−scf(n−1) (7) dint_pos=int_pos(n)−int_pos(n−1)(8) scf(n)は、現在考えられているスケールファクタ
ー帯域のスケールファクターをあらわし、scf(n−
1)は、前の帯域のスケールファクターを表す。それゆ
えdscf(n)は、符号化されるべき前記大きさにおける
差である。
同様にdint_posは、考慮されたスケールファクター帯
域nの方向情報のインテンシティis_posに対する最も近
い全数と、最後のスケールファクター帯域n−1のis_p
osとの間の差である。
デコーダーに対するIS方向情報は、同様な方法で計算
される。デコーダーに対する式7と8は次の通りであ
る。
scf(n)=dscf(n)+scf(n−1) (9) int_pos=dint_pos(n)+int_pos(n−1)(10) 2個の特異PCMデコーダーを使ったデコーダーは、前
のスケールファクター帯域の値をデコーダーの中のそれ
ぞれ実際の差に加えることによって、スケールファクタ
ー値と現在考慮されているスケールファクター帯域の方
向情報のインテンシティを計算する。
フロントページの続き (73)特許権者 999999999 ルーセント テクノロジーズ,ベル ラ ボラトリィーズ アメリカ合衆国 07974―0636 ニュー ジャージー,マーレイ ヒル マウンテ ン アベニュー 600 (72)発明者 グバー,ウヴェ ドイツ国デー―91054 エルランゲン シュレイフミュールシュトラーセ 4 (72)発明者 ディーツ,マルティン ドイツ国 デー―90408 ニュルンベル ク クレインレウサー ヴェーグ 47 (72)発明者 ブランデンバーグ,カールヘインツ ドイツ国 デー―91054 エルランゲン ハークシュトラーセ 22 (72)発明者 ゲルヘウザー,ヘインツ ドイツ国 デー―91344 ヴァイシェン フェルド サウゲンドルフ 17 (72)発明者 ヘル,ユルゲン ドイツ国 デー―91054 ビュッケンホ フ アム エイフガルテン 11 (72)発明者 クァッケンブッシュ,シュイラー アメリカ合衆国 07090 ニュージャー ジー ウェストフィールド タマケス ウェイ 744 (56)参考文献 特開 平3−24834(JP,A) 特開 平6−291669(JP,A) 特開 平7−221717(JP,A) 特開 平5−316588(JP,A) ポイント図解式最新MPEG教科書, 株式会社アスキー,1994年 8月 1 日,167−188 (58)調査した分野(Int.Cl.7,DB名) G10L 19/02

Claims (16)

    (57)【特許請求の範囲】
  1. 【請求項1】スケールファクター帯域(28)中のスケー
    ルファクター(34)が付帯されたステレオ音響スペクト
    ル値をグルーピングし 一方のチャンネル(L)にはインテンシティステレオ符
    号化されたステレオ音響スペクトル値を持たしめ、他方
    のチャンネル(R)には値が実質的にゼロであるステレ
    オ音響スペクトル値を持たしめるべく、少なくとも1個
    のスケールファクター帯域(28)中のステレオ音響スペ
    クトル値をインテンシティステレオ符号化し、 スケールファクター帯域(28)中のステレオ音響スペク
    トル値がインテンシティステレオ符号化されている場合
    には、 スケールファクター帯域(28)中の一方のチャンネル
    (L)のインテンシティステレオ符号化されたステレオ
    音響スペクトル値をインテンシティステレオ解号(64)
    して、 他方のチャンネル(R)についてのインテンシティステ
    レオ解号されたステレオ音響スペクトル値を得て、 スケールファクター帯域(28)中の他方のチャンネル
    (R)のインテンシティステレオ解号されたステレオ音
    響スペクトル値により第1の予測(60)を行い、 他方のチャンネル(R)のステレオ音響スペクトル値が
    符号化されるときには第1の予測(60)が考慮されず、 スケールファクター帯域(28)中のステレオ音響スペク
    トル値がインテンシティステレオ符号化されていない場
    合には、 スケールファクター帯域(28)中の他方のチャンネル
    (R)のステレオ音響スペクトル値により第1の予測
    (60)を行い、 他方のチャンネル(R)中の符号化されたステレオ音響
    スペクトル値を得る ことを特徴とする符号化されたステレオ音響スペクトル
    値を得るための、ステレオ音響スペクトル値符号化方
    法。
  2. 【請求項2】さらに現存するインテンシティステレオ符
    号化とは独立にステレオ音響スペクトル値の第2の予測
    (40)を行って、一方のチャンネル(L)の符号化した
    ステレオ音響スペクトル値を形成する ことを特徴とする請求項1に記載の方法。
  3. 【請求項3】第1と第2の予測(60、40)が二次後向き
    適応予測である ことを特徴とする請求項1または2に記載の方法。
  4. 【請求項4】第1と第2の予測(60、40)の結果が量子
    化(46)されて符号化されたビットストリームに書き込
    まれる ことを特徴とする請求項1〜3のいずれかに記載の方
    法。
  5. 【請求項5】各スケールファクター帯域(28)について
    の非音色ステレオ音響スペクトル値の第1と第2の予測
    (60、40)の結果が、選択的に考慮されるかまたは考慮
    されない ことを特徴とする請求項1〜4のいずれかに記載の方
    法。
  6. 【請求項6】スケールファクター帯域(28)中のインテ
    ンシティステレオ処理によるステレオ音響スペクトル値
    の符号化が、その帯域28についてのインテンシティ方向
    情報(36)の形成を含む ことを特徴とする請求項1〜5のいずれかに記載の方
    法。
  7. 【請求項7】スケールファクター帯域(28)についての
    インテンシティ方向情報が、スタート値から始まって微
    分符号化される ことを特徴とする請求項6に記載の方法。
  8. 【請求項8】インテンシティステレオ符号化されてない
    スケールファクター帯域(28)中のステレオ音響スペク
    トル値がMS処理によって符号化され、それらの帯域(2
    8)に付帯する各チャンネル(L、R)のスケールファ
    クターがスタート値から始まって微分符号化される ことを特徴とする請求項1〜7のいずれかに記載の方
    法。
  9. 【請求項9】第1または第2の予測(60、40)が先行入
    力値から現行推定値を生成し、 その推定値から各現行の実際値が差し引かれて予測エラ
    ー信号を生成し、該信号が現行の実際値の代わりにビッ
    トストリーム中に符号化される ことを特徴とする請求項1〜8のいずれかに記載の方
    法。
  10. 【請求項10】一部はインテンシティステレオ処理によ
    り一部は第1および第2の予測(60、40)により符号化
    されて、かつ補助情報(34)を有したステレオ音響スペ
    クトル値を解号する方法であって、 補助情報(34)に基づいて各帯域(28)についてスケー
    ルファクター帯域(28)中でグルーピングされたステレ
    オ音響スペクトル値のインテンシティステレオ符号化ま
    たは第1の予測(60)または第2の予測(40)の存在を
    確認し、 第2の予測により符号化されたステレオ音響スペクトル
    値を用いて、チャンネル(L)中において、第2の予測
    (40)に応じて予測(70)を行って、第2の予測を消去
    し、 スケールファクター帯域(28)中にインテンシティステ
    レオ符号化が存在する場合には、 一方のチャンネル(L)のインテンシティステレオ符号
    化されたステレオ音響スペクトル値のインテンシティス
    テレオ解号(64)を実施して、他方のチャンネル(R)
    についてインテンシティステレオ解号されたステレオ音
    響スペクトル値を形成し、 他方のチャンネル(R)のインテンシティステレオ解号
    されたステレオ音響スペクトル値を用いて、第1の予測
    (60)に応じて予測(70)を行って、 他方のチャンネル(R)の解号されたステレオ音響スペ
    クトル値については、この予測(70)の結果を考慮に入
    れず、 スケールファクター帯域(28)中にインテンシティステ
    レオ符号化が存在しない場合には、 他方のチャンネル(R)中において第1の予測(60)に
    応じて予測(70)を行って、 他方のチャンネル(R)の解号されたステレオ音響スペ
    クトル値を形成する ことを特徴とするステレオ音響スペクトル値の解号方
    法。
  11. 【請求項11】第2の予測(40)に応じて予測(70)が
    行われても、 一方のチャンネル(L)について帯域(28)中のステレ
    オ音響スペクトル値の予測がないということをスケール
    ファクター帯域(28)の補助情報34が示す場合には、そ
    の結果は考慮されない ことを特徴とする請求項10に記載の方法。
  12. 【請求項12】第1の予測(60)に応じた予測(70)が
    なされても、他方のチャンネル(R)について帯域(2
    8)中のステレオ音響スペクトル値の予測はないという
    ことをスケールファクター帯域(28)の補助情報が示す
    場合には、その結果は考慮されない ことを特徴とする請求項10または11に記載の方法。
  13. 【請求項13】スケールファクター(34)が付帯するス
    ケールファクター帯域(28)中のステレオ音響スペクト
    ル値をグルーピングする手段と 一方のチャンネル(L)がインテンシティステレオ符号
    化されたステレオ音響スペクトル値を持ち、他方のチャ
    ンネル(R)が実質的にゼロであるステレオ音響スペク
    トル値を持つように、少なくとも1個のスケールファク
    ター帯域中においてステレオ音響スペクトル値をインテ
    ンシティステレオ符号化する手段と、 スケールファクター帯域(28)中のインテンシティステ
    レオ符号化されたステレオ音響スペクトル値を解号する
    インテンシティステレオデコーダー(64)と、 第1〜3のスイッチ手段(54、56、66)を有した他方の
    チャンネル(R)中の第1の予測器(60)と、を含んで
    なり、 インテンシティステレオ符号化されたステレオ音響スペ
    クトル値が存在する場合には第1〜3のスイッチ手段
    (54、56、66)は第1の状態(ISON)にあるとともに、
    インテンシティステレオ符号化されたステレオ音響スペ
    クトル値が存在しない場合には第2の状態(ISOFF)に
    あり、 第1〜3のスイッチ手段(54、56、66)が第1の状態
    (ISON)にあるときには、インテンシティステレオデコ
    ーダー(64)により解号された他方のチャンネル(R)
    のステレオ音響スペクトル値を用いて第1の予測器(6
    0)が第1の予測をなし、 この際第1のスイッチ手段(54)の状態の故に、符号化
    されたステレオ音響スペクトル値については該予測の結
    果は考慮に入れず、 第1〜3のスイッチ手段(54、56、66)が第2の状態
    (ISOFF)にあるときには、予測器(60)はスケールフ
    ァクター帯域(28)中のステレオ音響スペクトル値の第
    1の予測をなして、他方のチャンネル(R)の符号化さ
    れたステレオ音響スペクトル値を得る ことを特徴とするステレオ音響スペクトル値の符号化装
    置。
  14. 【請求項14】さらにインテンシティステレオ符号化の
    存在とは独立に、スケールファクター帯域中のステレオ
    音響スペクトル値の第2予測をして、一方のチャンネル
    (L)の符号化されたステレオ音響スペクトル値を形成
    する第2の予測器(40)を含む ことを特徴とする請求項13に記載の装置。
  15. 【請求項15】少なくとも一部がインテンシティステレ
    オ処理および第1ならびに第2の予測(60、40)により
    符号化されたかつ補助情報(34)を有したステレオ音響
    スペクトル値を解号する装置であって、 入力端(74)と出力端(76)とを具えた一方のチャンネ
    ル(L)のための第1のステレオ音響スペクトル値予測
    器(70)と、 入力端(74)と出力端(76)とを具えた他方のチャンネ
    ル(R)のための第2のステレオ音響スペクトル値予測
    器(70)と、 入出力端を具えたインテンシティステレオデコーダー
    (64)と、 インテンシティステレオ符号化されたステレオ音響スペ
    クトル値が存在する場合にはインテンシティステレオデ
    コーダー(64)の出力端を第2の予測器(70)に接続
    し、それらの値がインテンシティステレオ符号化されて
    ない場合には第2の予測器(70)の入力端を他方のチャ
    ンネル(R)に接続する他方のチャンネル(R)中の第
    1の切換え手段(84)と、 ステレオ音響スペクトル値がインテンシティステレオ符
    号化されていない場合には他方のチャンネル(R)中の
    第2の予測器(70)の出力端(76)を他方のチャンネル
    (R)の解号されたステレオ音響スペクトル値のための
    出力端に接続し、それらの端がインテンシティステレオ
    符号化されている場合には他方のチャンネル(R)中の
    第2の予測器(70)の入力端(74)を他方のチャンネル
    (R)の解号されたステレオ音響スペクトル値のための
    出力端に接続する他方のチャンネル(R)中の第2の切
    換え手段(78)を含んでなる ことを特徴とするステレオ音響スペクトル値の解号装
    置。
  16. 【請求項16】一方のチャンネル(L)中の再予測器
    (70)が、第3の切換え手段(78)と予測器(50)を有
    していて、 該第3の切換え手段(78)が予測器(50)の出力端を第
    1のチャンネル(L)から分離し、 再予測器(70)による予測結果が考慮されない ことを特徴とする請求項15に記載の装置。
JP50553898A 1996-07-12 1997-06-03 強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読 Expired - Lifetime JP3502639B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19628293.4 1996-07-12
DE19628293A DE19628293C1 (de) 1996-07-12 1996-07-12 Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
PCT/EP1997/002875 WO1998003037A1 (de) 1996-07-12 1997-06-03 Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion

Publications (2)

Publication Number Publication Date
JPH11514181A JPH11514181A (ja) 1999-11-30
JP3502639B2 true JP3502639B2 (ja) 2004-03-02

Family

ID=7799743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50553898A Expired - Lifetime JP3502639B2 (ja) 1996-07-12 1997-06-03 強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読

Country Status (14)

Country Link
US (1) US6341165B1 (ja)
EP (1) EP0910928B1 (ja)
JP (1) JP3502639B2 (ja)
KR (1) KR100299528B1 (ja)
AT (1) ATE188833T1 (ja)
AU (1) AU707665B2 (ja)
CA (1) CA2260222C (ja)
DE (2) DE19628293C1 (ja)
DK (1) DK0910928T3 (ja)
ES (1) ES2143312T3 (ja)
GR (1) GR3032445T3 (ja)
NO (1) NO316972B1 (ja)
PT (1) PT910928E (ja)
WO (1) WO1998003037A1 (ja)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7177429B2 (en) 2000-12-07 2007-02-13 Blue Spike, Inc. System and methods for permitting open access to data objects and for securing data within the data objects
WO1999033194A1 (en) * 1997-12-19 1999-07-01 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Method and apparatus for phase estimation in a transform coder for high quality audio
US6591241B1 (en) * 1997-12-27 2003-07-08 Stmicroelectronics Asia Pacific Pte Limited Selecting a coupling scheme for each subband for estimation of coupling parameters in a transform coder for high quality audio
US7664264B2 (en) 1999-03-24 2010-02-16 Blue Spike, Inc. Utilizing data reduction in steganographic and cryptographic systems
US7475246B1 (en) 1999-08-04 2009-01-06 Blue Spike, Inc. Secure personal content server
FR2821475B1 (fr) * 2001-02-23 2003-05-09 France Telecom Procede et dispositif de reconstruction spectrale de signaux a plusieurs voies, notamment de signaux stereophoniques
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2237706T3 (es) 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7287275B2 (en) 2002-04-17 2007-10-23 Moskowitz Scott A Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7016547B1 (en) * 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
EP1734511B1 (en) 2002-09-04 2009-11-18 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7318027B2 (en) * 2003-02-06 2008-01-08 Dolby Laboratories Licensing Corporation Conversion of synthesized spectral components for encoding and low-complexity transcoding
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7688894B2 (en) * 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
US7782954B2 (en) * 2003-09-07 2010-08-24 Microsoft Corporation Scan patterns for progressive video content
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
BRPI0516201A (pt) * 2004-09-28 2008-08-26 Matsushita Electric Ind Co Ltd aparelho de codificação escalonável e método de codificação escalonável
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
KR101346120B1 (ko) * 2005-03-30 2014-01-02 코닌클리케 필립스 엔.브이. 오디오 인코딩 및 디코딩
JP4610650B2 (ja) * 2005-03-30 2011-01-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 多チャンネルオーディオ符号化
DE602006011600D1 (de) * 2005-04-28 2010-02-25 Panasonic Corp Audiocodierungseinrichtung und audiocodierungsverfahren
US7684981B2 (en) * 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7693709B2 (en) 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7933337B2 (en) * 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8184710B2 (en) * 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8179974B2 (en) * 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
US9293146B2 (en) 2012-09-04 2016-03-22 Apple Inc. Intensity stereo coding in advanced audio coding
KR102230668B1 (ko) 2016-01-22 2021-03-22 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 미드/사이드 결정이 개선된 전역 ild를 갖는 mdct m/s 스테레오의 장치 및 방법
EP4213147A1 (en) * 2018-10-26 2023-07-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Directional loudness map based audio processing
JP7383942B2 (ja) * 2019-09-06 2023-11-21 ヤマハ株式会社 車載音響システムおよび車両

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4815132A (en) * 1985-08-30 1989-03-21 Kabushiki Kaisha Toshiba Stereophonic voice signal transmission system
NL9000338A (nl) * 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
DE4136825C1 (ja) * 1991-11-08 1993-03-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5481643A (en) * 1993-03-18 1996-01-02 U.S. Philips Corporation Transmitter, receiver and record carrier for transmitting/receiving at least a first and a second signal component
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
WO1995012254A1 (en) * 1993-10-27 1995-05-04 Philips Electronics N.V. Transmission and reception of a first and a second main signal component
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
DE4437287C2 (de) * 1994-10-18 1996-10-24 Fraunhofer Ges Forschung Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ポイント図解式最新MPEG教科書,株式会社アスキー,1994年 8月 1日,167−188

Also Published As

Publication number Publication date
EP0910928A1 (de) 1999-04-28
GR3032445T3 (en) 2000-05-31
KR100299528B1 (ko) 2001-10-29
KR20000022434A (ko) 2000-04-25
DE59701015D1 (de) 2000-02-17
AU707665B2 (en) 1999-07-15
NO990107L (no) 1999-03-10
US6341165B1 (en) 2002-01-22
NO990107D0 (no) 1999-01-11
ATE188833T1 (de) 2000-01-15
ES2143312T3 (es) 2000-05-01
JPH11514181A (ja) 1999-11-30
CA2260222A1 (en) 1998-01-22
NO316972B1 (no) 2004-07-12
PT910928E (pt) 2000-04-28
DK0910928T3 (da) 2000-05-08
DE19628293C1 (de) 1997-12-11
EP0910928B1 (de) 2000-01-12
CA2260222C (en) 2000-10-17
WO1998003037A1 (de) 1998-01-22
AU3172297A (en) 1998-02-09

Similar Documents

Publication Publication Date Title
JP3502639B2 (ja) 強度ステレオと予測を使ったステレオ音響スペクトル値の符号化と解読
JP3622982B2 (ja) ステレオ音響スペクトル値の符号化・解読方法
US6502069B1 (en) Method and a device for coding audio signals and a method and a device for decoding a bit stream
EP0918407B1 (en) Scalable stereo audio encoding/decoding method and apparatus
US5488665A (en) Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JP3926399B2 (ja) オーディオ信号コーディング中にノイズ置換を信号で知らせる方法
CN101118747B (zh) 保真度优化的预回声抑制编码
KR100310081B1 (ko) 오디오신호코딩방법및장치
JP3343962B2 (ja) 高能率符号化方法及び装置
JP3352406B2 (ja) オーディオ信号の符号化及び復号方法及び装置
US20110173005A1 (en) Efficient Use of Phase Information in Audio Encoding and Decoding
JP2001500640A (ja) オーディオ信号の符号化方法
JP4063508B2 (ja) ビットレート変換装置およびビットレート変換方法
KR20070001139A (ko) 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들
WO1995034956A1 (fr) Procede et dispositif de codage de signal, procede et dispositif de decodage de signal, support d'enregistrement et dispositif de transmission de signaux
EP1553563B1 (en) Method and apparatus for converting audio data
JP4618873B2 (ja) オーディオ信号符号化方法、オーディオ信号符号化装置、音楽配信方法、および、音楽配信システム
Davidson Digital audio coding: Dolby AC-3
JP3854313B2 (ja) 複数の情報信号のエンコーディング
JPH09135173A (ja) 符号化装置および符号化方法、復号化装置および復号化方法、伝送装置および伝送方法、並びに記録媒体
Rault et al. The ISO/MPEG audio musicam family
JPH096395A (ja) 音響再生装置

Legal Events

Date Code Title Description
A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20031208

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081212

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091212

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091212

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101212

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111212

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121212

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131212

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term