JP4589366B2 - 忠実度最適化可変フレーム長符号化 - Google Patents

忠実度最適化可変フレーム長符号化 Download PDF

Info

Publication number
JP4589366B2
JP4589366B2 JP2007216374A JP2007216374A JP4589366B2 JP 4589366 B2 JP4589366 B2 JP 4589366B2 JP 2007216374 A JP2007216374 A JP 2007216374A JP 2007216374 A JP2007216374 A JP 2007216374A JP 4589366 B2 JP4589366 B2 JP 4589366B2
Authority
JP
Japan
Prior art keywords
signal
mono
sub
encoding
decoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007216374A
Other languages
English (en)
Other versions
JP2008026914A (ja
Inventor
ステファン ブルン,
インイェマル ヨハンソン,
アニセ タレブ,
ダニエル エンストレム,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303501A external-priority patent/SE0303501D0/xx
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2008026914A publication Critical patent/JP2008026914A/ja
Application granted granted Critical
Publication of JP4589366B2 publication Critical patent/JP4589366B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes

Description

本発明は、オーディオ信号の符号化に関し、特に、マルチチャネル・オーディオ信号の符号化に関する。
高いオーディオ品質を維持しつつ低ビットレートでオーディオ信号を送信あるいは記憶することは、市場の高い要求である。具体的には、送信リソースや記憶装置に制約がある場合、低ビットレート動作が本質的なコスト要因となる。これは、たとえば、GSM、UMTS、CDMAなどのモバイル通信システムにおけるストリーミングおよびメッセージングの応用分野では一般的な認識である。
現在のところ、モバイル通信システムに利用されうる標準化されたコーデックで、経済的に関心を引くビットレートにてステレオの高いオーディオ品質を提供するものは存在しない。いまあるコーデックで可能なのは、オーディオ信号のモノラル送信である。ステレオ送信もある程度までは利用可能である。しかしビットレートの制約により、非常に限定されたステレオ表現をせざるをえないのが現状である。
オーディオ信号のステレオ符号化またはマルチチャネル符号化の最も簡単な方式は、異なるチャネルの信号を個々の独立な信号として別々に符号化することである。ステレオFM無線送信において使用され、従来からのモノラル無線受信機との共存を図った他の基本的な方式は、2チャネルの和信号および差信号を送信するというものである。
MPEG−1/2レイヤIIIおよびMPEG−2/4 AACなどの現在のオーディオコーデックは、いわゆるジョイント・ステレオ符号化(joint stereo coding)を使用する。この方法によれば、異なるチャネルの信号は、別々および個々にではなく、共同して処理される。2つの最も一般的に使用されるジョイント・ステレオ符号化方法は、「Mid/Side」(M/S)ステレオ符号化("Mid/Side" (M/S) stereo coding)およびインテンシティ・ステレオ符号化(intensity stereo coding)として知られ、これらは一般に、符号化されるステレオ信号またはマルチチャネル信号のサブバンドに対して適用される。
M/Sステレオ符号化は、チャネル・サブバンドの和信号と差信号を符号化して送信し、それにより、チャネル・サブバンド間の冗長性を利用するという意味では、ステレオFM無線において記述される手順と同様である。M/Sステレオ符号化に基づくエンコーダの構造および動作は、たとえば J. D. ジョンストン(Johnston)による米国特許第5285498号に記載されている。
一方、インテンシティ・ステレオは、ステレオの非関連性を利用することができる。これは、強度がチャネルの中にどのように分布しているかを示すいくつかの位置情報と共に、(異なるサブバンドの)チャネルの結合強度を伝送する。インテンシティ・ステレオは、チャネルのスペクトル振幅情報のみを出力する。位相情報は、伝達されない。この理由および、時間チャネル間情報(より具体的にはチャネル間時間差)がとりわけ低い周波数において主要な音響心理学的関連性を呈するという理由により、インテンシティ・ステレオは、たとえば2kHzより高い周波数においてのみ使用することができる。インテンシティ・ステレオ符号化法は、たとえば、R. ヴェルデュイ(Veldhuis)らによる欧州特許第0497413号に記載されている。
最近開発されたステレオ符号化法が、たとえば、C. フォーラー (Faller) らによる名称「Binaural cue coding applied to stereo and multi channel audio compression」(第112回AES会議、2002年5月、ドイツ、ミュンヘンの会議文献)に記載されている。この方法は、パラメトリック・マルチチャネル・オーディオ符号化法である。基本的な原理は、符号化側において、Nチャネルc1、c2、・・・、cNからの入力信号が、単一のモノラル信号(mono signal)mに組み合わされるものである。モノラル信号は、任意の従来のモノラル・オーディオ・コーデックを使用してオーディオ符号化される。並行して、パラメータが、マルチチャネル像を記述するチャネル信号から導出される。パラメータは符号化され、オーディオ・ビット・ストリームと共に復号化器に送信される。復号化器は、まず、モノラル信号m’を復号化し、次いで、マルチチャネル像のパラメータ記述に基づいてチャネル信号c1’、c2’、・・・、cN’を再生成する。
バイノーラル・キュー符号化(BCC)方法の原理は、符号化されたモノラル信号およびいわゆるBCCパラメータを送信する。BCCパラメータは、元のマルチチャネル入力信号のサブバンドについて、コード化されたチャネル間レベル差およびチャネル間時間差の情報を有する。復号化器は、BCCパラメータに基づいてモノラル信号のサブバンド・レベルおよび位相調節を適用することによって、差チャネル信号を再生成する。M/Sまたはインテンシティ・ステレオなどに対する利点は、時間チャネル間情報を備えるステレオ情報が、はるかにより低いビットレートで送信されることである。しかし、この技法は、符号化器および復号化器の両方において、チャネルの各々について計算が厄介な時間周波数変換を必要とする。
さらに、BCCは、特に低周波数において多くのステレオ情報が拡散する、すなわち、任意の特定の方向からは来ないということに対処していない。ステレオ記録の両チャネルには拡散音場が存在するが、互いに関して位相は大きくずれている。BCCなどのアルゴリズムが、大量の拡散音場を有する記録の影響下にある場合、再生成されたステレオ像は混信し、BCCアルゴリズムは特定の周波数帯域の信号を左または右のみにしかパンすることができないので、左から右にジャンプする。
ステレオ信号を符号化し、かつ拡散音場の良好な再生成を図った一手段としては、FMステレオ放送において使用される技法と非常に類似な符号化方式を使用する、すなわち、モノ(左+右)信号および差(左−右)信号を別々に符号化するものがある。
C. E. ホルト(Holt)らによる米国特許第5434948号に記載されている技法は、モノラル信号および副情報を符号化するために、BCCと同様の技法を使用する。この場合、副情報は、予測フィルタおよびオプションで残差信号からなる。予測フィルタでは、Least-Mean-Squareアルゴリズムによって評価が行われ、モノラル信号に適用される場合にはマルチチャネル・オーディオ信号の予測が可能である。この技法により、マルチチャネル音源に対して非常に低いビットレート符号化を実現することができるが、以下でさらに議論されるように、品質の低下を伴うことになる。
最後に、完全を期すべく、3Dオーディオについて使用される技法について説明しておく。この技法は、いわゆるヘッド関係フィルタ (head-related filters) で音源信号をフィルタリングすることによって、右チャネル信号と左チャネル信号とを合成する。しかし、この技法は、異なる音源信号が分離されることを必要とし、したがって一般に、ステレオまたはマルチチャネル符号化に適用することができない。
米国特許第5285498号 欧州特許第0497413号 C. フォーラー(Faller)ら、"Binaural cue coding applied to stereo and multi-channel audio compression"、第112回AES会議、2002年5月、ドイツ、ミュンヘン 米国特許第5434948号
具体的には主信号および1または2以上の副信号である信号のフレームの符号化に基づく既存の符号化方式に付随する問題は、プリエコー効果の存在である。図7a、bに、そのような異音を示す。曲線100によって示されるような時間進行を有する信号成分を想定する。t0からの開始時、オーディオサンプルに信号成分は存在しない。t1とt2との間の時間tで、信号成分が突然出現する。信号成分が、t2-t1のフレーム長を使用して符号化される場合、信号成分の出現は、曲線101において示されるように、全フレームにわたって「不鮮明」になる。復号が曲線101について行われる場合、信号成分は、信号成分の意図した出現よりΔt前の時間において出現し、「プリエコー」が知覚される。
したがって、本発明の目的は、マルチチャネル・オーディオ信号の聴感品質を向上させることができる符号化方法および装置を提供することであり、特に、プリエコーなどによる異音を回避することである。本発明の他の目的は、必要な処理電力がより小さく、かつより一定な送信ビットレートを有する符号化方法および装置を提供することである。
上記の目的は、添付の特許請求の範囲による方法および装置によって達成される。本発明の第1の側面において、ポリフォニック信号を符号化する符号化方法は、少なくとも第1チャネルおよび第2チャネルの信号に基づいて、主信号を表す符号化パラメータである第1出力信号を生成する第1生成ステップ (210) と、符号化フレーム内において少なくとも前記第1チャネルおよび前記第2チャネルの信号に基づいて、副信号を表す符号化パラメータである第2出力信号を生成する第2生成ステップ (214) とを有し、前記第2生成ステップは、前記主信号の等エネルギ曲線に基づいて前記副信号をスケーリングするスケーリングステップを含むことを特徴とする。
本発明の第2の側面において、ポリフォニック信号を復号化する復号化方法は、主信号を表す符号化パラメータから、復号化した主信号を生成する第1生成ステップ (220) と、副信号を表す符号化パラメータから、復号化した副信号を生成する第2生成ステップ (224) と、少なくとも前記復号化した主信号と前記復号化した副信号とを組み合わせて、少なくとも第1および第2チャネル (a, b; L, R) の信号にするステップ (226) とを有し、前記第2生成ステップ (224) は、前記復号化した主信号の等エネルギ曲線に基づいて前記復号化した副信号をスケーリングするスケーリングステップを含むことを特徴とする。
本発明の第3の側面において、符号化装置 (14) は、少なくとも第1および第2チャネルを有するポリフォニック信号を入力する入力手段 (16; 16A-C) と、少なくとも前記第1および第2チャネルの信号に基づいて、主信号を表す符号化パラメータである第1出力信号を生成する第1生成手段 (38) と、符号化フレーム内において、少なくとも前記第1および第2チャネルの信号に基づいて、副信号を表す符号化パラメータである第2出力信号を生成する第2生成手段 (30) と、出力手段 (52) とを有し、前記第2生成手段 (30) は、前記主信号の等エネルギ曲線に基づいて前記副信号をスケーリングするスケーリング手段を含むことを特徴とする。
他の好適な実施形態では、副信号の符号化は、プリエコーの影響を回避するために、エネルギ曲線スケーリングを有する。さらに、異なる符号化方式は、別々のサブフレームについて異なる符号化手順を有することが可能である。
本発明の第5の側面において、オーディオシステムは、上記第3の側面に係る符号化装置と上記第4の側面に係る復号化装置との少なくともいずれか一方を備える。
本発明の主な利点は、オーディオ信号の聴感上の品質が改善されることである。さらに、本発明により、非常に低いビットレートにおけるマルチチャネル信号送信が可能となる。
(詳細な説明)
図1は、本発明の好適な実施形態に係る典型的なシステム1を示す図である。送信機10は、無線信号5を受信機20に送信することができるように、関連するハードウエアおよびソフトウエアを含むアンテナ12を備える。送信機10は、とりわけマルチチャネル符号化器14を備え、これは、いくつかの入力チャネル16の信号を無線送信に適切な出力信号に変換する。適切なマルチチャネル符号化器14の例については、後ほど詳細に説明する。入力チャネル16の信号は、たとえば、録音に係るディジタル表現のデータファイル、磁気テープ、あるいはオーディオのビニル・ディスク記録など、オーディオ信号記憶装置18から提供を受けることが可能である。入力チャネル16の信号は、たとえば、1セットのマクロフォン19から「ライブ」で提供されてもよい。オーディオ信号がすでにディジタル形式ではない場合には、マルチチャネル符号化器14に入る前にディジタル化される。
受信機20側では、関連するハードウエアおよびソフトウエアを有するアンテナ22が、ポリフォニック・オーディオ信号を表す無線信号5の実際の受信に対処する。ここでは、たとえばエラー訂正などの通常の機能が実施される。復号化器24が、受信された無線信号5を復号化し、それにより、搬送されたオーディオデータをいくつかの出力チャネル26の信号に変換する。出力信号は、たとえば、直ちに出力するためにスピーカ29に提供することができ、あるいは、任意の種類のオーディオ信号記憶装置28に記憶することができる。
システム1は、たとえば、電話会議システム、音声サービスあるいはその他のオーディオアプリケーションを提供するためのシステムでありうる。たとえば電話会議システムなどのいくつかのシステムでは、通信は、二重伝送方式でなければならず、一方、サービス・プロバイダから加入者への楽音の配信などは、基本的には一方向性伝送方式でよい。送信機10から受信機20への信号の送信は、異なる種類の電磁波、ケーブル、またはファイバ、あるいはその組合せによってなど、任意の他の手段によって実施することもできる。
図2aは、本発明による符号化器の一実施形態を示す。この実施形態では、ポリフォニック信号は、入力16Aおよび16Bにおいてそれぞれ受信される2つのチャネルaおよびbを備えるステレオ信号である。チャネルaおよびbの信号は、前処理部32に出力され、そこで異なる信号調整処理を適用することが可能である。前処理部32の出力からの(おそらくは修正された)信号は、加算器34において加算される。この加算器34は、2で加算結果を除算することも行う。このように生成される信号Xmonoは、ステレオ信号の主信号であるが、その理由は、これは、両チャネルからのすべてのデータを基本的に有するからである。したがって、本実施形態では、主信号は純粋な「モノラル」信号を表す。主信号Xmonoは、任意の適切な符号化原理に従って主信号を符号化する主信号符号化部38に提供される。その原理については従来技術を適用可能であるから、本明細書では説明を省略する。主信号符号化部38は、主信号を表す符号化パラメータである出力信号pmonoを出力する。
減算器36において、チャネル信号の差(2で除算される)が、副信号xsideとして提供される。本実施形態では、副信号はステレオ信号の2チャネル間の差を表す。副信号xsideは、副信号符号化部30に提供される。副信号符号化部30の好適な実施形態を以下でさらに説明する。以下で詳しく説明する副信号符号化手順によれば、副信号xsideは、副信号xsideを表す符号化パラメータpsideに変換される。ある実施形態では、この符号化は主信号xmonoの情報も使用して行われる。矢印42は、そのような提供を示し、元の符号化されていない主信号xmonoが使用される。他の実施形態では、副信号符号化部30において使用される主信号情報は、破線44によって示されるように、主信号を表す符号化パラメータpmonoから推測することができる。
主信号xmonoを表す符号化パラメータpmonoは第1出力信号であり、副信号xsideを表す符号化パラメータpsideは第2出力信号である。通常の場合、これら2つの出力信号pmono、psideは、共に完全ステレオ音を表し、マルチプレクサ40で1つの送信信号52に多重化される。しかし、他の実施形態では、第1出力信号pmonoおよび第2出力信号psideの送信は、別々に行われることが可能である。
図2bには、本発明による復号化器24の一実施形態が、ブロック図にて示されている。受信信号54は、主信号情報および副信号情報を表す符号化パラメータを含み、第1入力信号および第2入力信号をそれぞれ分離するデマルチプレクサ56に出力される。第1入力信号は、主信号の符号化パラメータpmonoに対応し、主信号復号化部64に提供される。従来方式では、主信号を表す符号化パラメータpmonoは、符号化器14(図2a)の主信号xmono(図2a)と可能な限り同様であるように復号された主信号x"monoを生成するために使用される。
同様に、副信号に対応する第2入力信号は、副信号復号化部60に供給される。ここで、副信号を表す符号化パラメータpsideは、復号された副信号x"sideを回復するために使用される。いくつかの実施形態では、符号化手順は、矢印によって示されるように、主信号x"monoに関する情報を使用する。
復号された主信号x"monoおよび復号された副信号x"sideは、加算器70に供給される。加算器70は、チャネルaの元の信号の表示である出力信号を出力する。同様に、減算器68によって供給される差が、チャネルbの元の信号の表示である出力信号を出力する。これらのチャネル信号は、従来技術の信号処理手順に従って、後処理部74において後処理されることが可能である。最後に、チャネル信号aおよびbは、復号化器の信号出力26Aおよび26Bより出力される。
概要において述べたように、符号化は基本的に1フレームごとに実行される。フレームは所定時間のオーディオサンプルを有する。図3aの下方部分において、持続時間LのフレームSF2が示されている。ハッチなし部分内のオーディオサンプルは、一緒に符号化される。その先行サンプルおよび後続サンプルは、他のフレームにおいて符号化される。サンプルをフレームに分割することにより、あらゆる場合において、いくつかの不連続性がフレーム境界に生じることになる。音が変化すれば符号化パラメータも変化する。この符号化パラメータの変化は基本的には各フレーム境界ですることになる。これにより、聴感エラーが生じる。これをある程度補償する1つの方式は、符号化されるサンプルだけでなく、ハッチ部分によって示されるように、フレームの境界近傍にあるサンプルにも基づいて符号化することである。そうすることで、異なるフレーム間の移行がより柔軟になる。その代わりに、あるいはその補完として、フレーム境界によって生じる異音を低減するために、補間手法が使用されることもある。しかし、それらの処理はいずれも、大量の追加的な演算量を必要とし、符号化方式によっては、いかなるリソースをもってしても実現困難である可能性もある。
この観点からは、なるべく長いフレームを使用することが望ましいといえる。その理由は、フレーム境界の数が少なくなるからである。また、一般には符号化効率が高くなり、必要な送信ビットレートが最小限になる。しかし、フレーム長を長くすると、プリエコーによる異音やゴースト音が知覚されるという問題が生じる。
代わりに、L/2およびL/4の持続時間をそれぞれ有するSF1またはさらにはSF0などのより短いフレームを使用すると、符号化効率が低下し送信ビットレートが大きくなる可能性があり、しかも、フレーム境界異音の問題が増大することは、当業者には理解されよう。しかし、フレーム長を短くすれば、たとえばゴースト音やプリエコーによる異音による悪影響は小さくなる。符号化誤差を可能な限り最小限に抑えられるように、なるべく短いフレーム長を使用するべきである。
本発明によれば、現在の信号内容に依存した、副信号を符号化するフレーム長を使用することによって、オーディオ聴感品質が改善される。フレーム長が異なることのオーディオ聴感品質への影響は符号化される音の性質に応じて異なるので、信号自体の性質が使用フレーム長に影響を与えるようにすることによって改善することができる。主信号の符号化は、本発明の目的ではないので、詳細な説明は省略する。しかし、主信号に使用されるフレーム長は、副信号に使用されるフレーム長と等しくしてもよいし、等しくしなくてもよい。
いくつかのケースでは、時間変化が小さいために比較的長いフレームを使用して副信号を符号化することが有益な場合がある。コンサートの録音など、大量の拡散音場を有する記録がこのケースにあたる。ステレオのスピーチ会話などの場合には、短いフレームが好ましいであろう。どのフレーム長が好ましいかは、2つの基本的な方式で決定することができる。
本発明による副信号符号化部30の一実施形態が、図3bに示されており、閉ループ決定が使用される。ここでは、長さLの基本的な符号化フレームが使用される。サブフレームのセット80を特徴とするいくつかの符号化方式81が提供される。サブフレームのセット80のそれぞれは、等しいまたは異なる長さの1または2以上のサブフレームを有する。しかし、サブフレームのセット80の全長は、基本的な符号化フレーム長Lに常に等しい。図3bを参照すると、一番上の符号化方式は、長さLの1つのサブフレームのみを備える1セットのサブフレームを特徴とする。次のサブフレームのセットは、長さL/2の2つのフレームを備える。第3のセットは、長さL/4の2つのフレームを備え、これにL/2のフレームが続く。
副信号符号化部30に供給される信号xsideは、すべての符号化方式81によって符号化される。一番上の符号化方式では、基本符号化フレーム全体が符号化される。しかし、他の符号化方式では、信号xsideは、各サブフレームにおいて別々に符号化される。各符号化方式の結果は、セレクタ85に供給される。忠実度測定手段83は、符号化信号のそれぞれについて忠実度尺度を計算する。忠実度尺度は客観的品質値であり、信号対雑音尺度あるいは重み付け信号対雑音比であることが好ましい。各符号化方式に関連付けられる忠実度尺度が比較され、その結果に応じてスイッチング手段87を制御して、最適な忠実度尺度が得られる符号化方式からの副信号を表す符号化パラメータを、副信号符号化部30から出力信号psideとして選択する。
とりうるフレーム長のすべての組み合せを試して、信号対雑音比など、最適な客観的品質が得られるサブフレームのセットを選択することが好ましい。
本実施形態では、使用されるサブフレームの長さは、次式に従い選択される。
lsf=lf/2n
ただし、lsfはサブフレームの長さ、lfは符号化フレームの長さ、nは整数である。本実施形態では、nは、0から3の間において選択される。しかし、セットの全長が一定に維持される限り、任意のフレームの長を使用することが可能である。
図3cにおいて、本発明による副信号符号化部30の他の実施形態が示されている。ここで、フレーム長の決定は、信号の統計に基づく開ループ決定である。すなわち、副信号のスペクトル特性は、どの符号化方式が使用されるかを決定する基礎として使用される。先述と同様に、異なるサブフレームのセットによって特徴付けられる異なる符号化方式が利用可能である。しかし、この実施形態では、セレクタ85は、実際の符号化の前に配置される。入力副信号xsideは、セレクタ85および信号分析部84に入力される。分析の結果はスイッチ86の入力となり、符号化方式81の1つのみが使用される。その符号化方式からの出力は、副信号符号化部30からの出力信号psideでもある。
開ループ決定の利点は、唯一の実際の符号化が実施されることである。しかし、欠点は、信号特性の分析が非常に複雑となる可能性があり、また、スイッチ86において適切な選択肢を与えることができるようになる前に、とりうる振る舞いを予測することが困難である可能性があることである。信号分析部84は多くの音声統計分析を実行する必要がある。符号化方式のあらゆる些少な変化が、統計的振る舞いを混乱させる可能性がある。
閉ループ選択を使用することによって(図3b)、後続のユニットに変化を与えずに符号化方式を変更することが可能である。一方、多くの符号化方式が調査される場合には、演算量が多くなる。
以上のような副信号の可変フレーム長符号化の利点は、微細な時間分解能かつ粗い周波数分解能を選択できる一方、粗い時間分解能かつ微細な周波数分解能を選択することもできる点である。上記の実施形態は、最適にステレオ像を維持できる。
異なる符号化方式において使用される実際の符号化について、いくつかの要件も存在する。具体的には閉ループ選択が使用されるとき、いくつかのある程度の同時符号化を実行する計算リソースは、大きくなければならない。符号化プロセスが複雑になると、より高い計算能力が必要とされる。さらに、送信における低ビットレートも好ましい。
米国特許第5434948号において開示される方法は、フィルタリングされたモノラル信号(主信号)を使用して、副信号または差信号を近似する。フィルタ・パラメータを時間とともに変化させて最適化することが可能である。次いで、副信号の符号化を表すフィルタ・パラメータが送信される。一実施形態では、副残差信号も送信される。多くの場合、そのような手法は、本発明の範囲内において副信号符号化として使用することが可能である。しかし、この手法は、いくつかの欠点を有する。フィルタ係数の量子化およびあらゆる副残差信号は、送信について比較的高いビットレートをしばしば必要とする。その理由は、フィルタの次数が、精確な副信号評価を提供するために高くする必要があるからである。フィルタ自体の評価は、具体的には一過性の大量の音楽の場合、問題である可能性がある。評価誤差は、未修正信号より大きさが大きいことがある修正副信号を与える。これにより、ビットレートに対する要求はより高くなる。さらに、フィルタ係数の新しいセットがNサンプルごとに計算される場合、フィルタ係数は、上述したように、1セットのフィルタ係数から他への移行が滑らかになるように補間する必要がある。フィルタ係数の補間は複雑なタスクであり、補間の誤差が、大きな誤差副信号において出現し、これにより、より高いビットレートが、異なる誤差信号符号化器について必要になる。
補間の必要性を回避する手段は、サンプルごとにフィルタ係数を更新して、バックワード・アダプティブ分析に依拠するものである。これがうまく機能するためには、残りの符号化器のビットレートがかなり高いことが必要である。したがって、これは、低ビットレートステレオ符号化の良好な代替物でとはいえない。
たとえば音楽では非常に一般的である、モノラル信号および差信号がほとんど無相関である場合が存在する。したがって、フィルタの評価、異なる誤差信号符号化器について状況を単に悪化させるさらなる危険性により、非常に厄介になる。
米国第5434948号による解決法は、会議電話システムなど、フィルタ係数が時間について非常に緩慢に変化する場合に、きわめてよく作用する可能性がある。音楽信号の場合には、この手法は非常によくは機能しない。その理由は、ステレオ像を追跡するためにフィルタを非常に迅速に変化させる必要があるからである。これは大きく異なる大きさのサブフレーム長を使用する必要があることを意味し、これは、試験される組合せの数が迅速に増大することを意味する。これは、すべての可能な符号化方式を計算する要件が、非実際的に高くなることを意味する。
したがって、好適な実施形態では、副信号の符号化は、複雑なビットレートを消費する予測フィルタの代わりに、簡単なバランス係数を使用することによって、モノラル信号と副信号との間の冗長性を低減する概念に基づく。したがって、この演算の残差が符号化される。そのような残差の大きさは比較的小さく、その伝送に高いビットレートは必要ではない。この概念は、上述した可変フレーム・セット手法と実際に組み合わされるのに好適である。その理由は、計算の複雑さが軽度であるからである。
可変フレーム長の手法と組み合わされたバランス係数の使用によって、複雑な補間の必要性および、補間により生じる可能性がある関連する問題が解消する。さらに、複雑なフィルタの代わりに簡単なバランス係数を使用することにより、評価に付随する問題がより少なくなる。その理由は、バランス係数の可能な評価誤差の影響がより小さくなるからである。好ましい解決法は、良好な品質を有し、かつ限定されたビットレート要件および計算リソースを有して、パンされた信号および拡散音場を再生成することができる。
図4は、本発明によるステレオ符号化器の好適な実施形態を示す。この実施形態は、図2aに示された実施形態と非常に類似しているが、副信号符号化部30の詳細が明らかにされている。この実施形態の符号化器14は、前処理部を有さず、入力信号は加算器34および減算器36に直接供給される。モノラル信号xmonoは、マルチプレクサ33で、バランス係数gsmで乗算される。乗算されたモノラル信号は、減算器35において、副信号xside、すなわち本質的には2チャネル間の差から減算されて、副残差信号が生成される。バランス係数gsmは、品質基準に従い副残差信号が最小となるよう、最適化部37によってモノラル信号および副信号の内容に基づいて決定される。品質基準は、Least-Mean-Square (LMS) 法に基づくものであることが好ましい。副残差信号は、任意の符号化手順に従って副残差符号化器39において符号化される。副残差符号化器39は、低ビットレート変換符号化器またはCELP(コードブック駆動線形予測)符号化器であることが好ましい。したがって、副信号を表す符号化パラメータpsideは、副残差信号および最適化バランス係数49を表す符号化パラメータpside residualを含む。
図4の実施形態では、副信号の合成に使用されるモノラル信号42は、モノラル符号化器38の対象信号xmonoである。上述したように(図2aと関連して)、モノラル符号化器38の局所合成信号を使用することもできる。後者の場合、全体の符号化遅延が増大する可能性があり、副信号の計算の複雑さも増大する可能性がある。一方、品質は良好となる可能性がある。その理由は、モノラル符号化器生じる符号化誤差を修復することが可能であるからである。
数学的には、基本的な符号化方式は、以下のように記述することができる。ステレオの左チャネルおよび右チャネルをそれぞれ、チャネル信号aおよびbと表記する。チャネル信号は、加算によってモノラル信号とされ、減算によって副信号とされる。その演算は、以下のように記述される。
xmono(n)=0.5 (a(n) + b(n))
xside(n)=0.5 (a(n) - b(n))
xmonoおよびxside信号を2でスケーリングすることが有益である。ここで、xmonoおよびxsideを生成する他の方式が存在することを示す。たとえば、以下を使用することができる。
xmono(n)=γa(n) + (1 - γ)b(n)
xside(n)=γa(n) - (1 - γ)b(n)
0≦γ≦1.0
入力信号のブロックにおいて、修正または副残差信号が、下式に従って計算される。
xside residual(n)=xside(n) - f(xmono, xside)xmono(n)
上式で、f(xmono, xside) は、副信号およびモノラル信号からのNサンプルのブロック、すなわちサブフレームに基づいて、副信号から可能な限り除去しようとするバランス係数関数である。すなわち、バランス係数は、副残差信号を最小とするために使用される。副残差信号がLMSにより最小に抑えられる特別な場合では、これは、副残差信号xside residualのエネルギを最小とすることと等価である。
上述した特別な場合、f(xmono,xside) は、以下のように表される。
Figure 0004589366
ただし、xsideは副信号、xmonoはモノラル信号である。関数は、「frame start」において開始され、「frame end」において終了するブロックに基づくことに留意されたい。
周波数領域の重み付けをバランス係数の計算に追加することが可能である。これは、xside信号およびxmono信号を重み付けフィルタのインパルス応答でたたみ込むことによって実行される。次いで、評価誤差を聞くことが困難な周波数範囲に移動させることが可能である。これは、聴感重み付けと呼ばれる。
関数f(xmono,xside)によって与えられるバランス係数値の量子化バージョンが復号化器に送信される。修正副信号が生成されている場合には、量子化を考慮することが好ましい。したがって、以下の式が達成される。
Figure 0004589366
Qg(..)は、関数f(xmono,xside)によって与えられるバランス係数に適用される量子化関数である。バランス係数は、送信チャネル上において送信される。通常の左右パン信号では、バランス係数は、[-1.0, 1.0]の間に限定される。一方、チャネルが互いに関して位相がずれている場合には、バランス係数は、これらの限界を超えて拡張してもよい。
ステレオ像を安定させるオプション手段として、モノラル信号と副信号との間の正規化相互相関が以下の式によって与えられるように不十分である場合、バランス係数を限定することができる。
Figure 0004589366
ただし、
Figure 0004589366
これらの状況は、たとえば大量の拡散音を有するクラシック音楽やスタジオ音楽では非常に頻繁に生じ、いくつかの場合、aチャネルおよびbチャネルは、モノラル信号が生成されるとき、時には互いにほとんど消去する可能性がある。バランス係数に対する影響は、迅速にジャンプすることがあることであり、これにより、ステレオ像が混信する。上記の修正により、この問題は軽減される。
米国第5434948号のフィルタ・ベースの手法は、同様の問題を有するが、この場合、解決はそれほど簡単ではない。
Esが副残差信号の符号化関数(たとえば、変換符号化器)であり、Emがモノラル信号の符号化関数である場合、復号化器側における復号されたa"信号およびb"信号は、以下のように記述することができる(ここでは、γ=0.5と想定する)。
Figure 0004589366
各フレームについてバランス係数を計算することに由来する1つの重要な利点は、補間の使用が回避されることである。代わりに、通常は、上記で記述されたように、フレーム処理は、重なりフレームで実施される。
バランス係数を使用する符号化原理は、ステレオ像を追跡するために迅速な変化が通常必要とされる楽音信号の場合に特によく動作する。
最近、マルチチャネル符号化が一般的になっている。一例が、DVD映画の5.1チャネル・サラウンド音声である。この場合、チャネルは、前左、前中心、前右、後左、後右、およびサブウーファとして構成される。図5において、本発明によるチャネル間冗長を利用するような構成の3つのフロント・チャネルを符号化する符号化器の実施形態が示されている。
3つのチャネル信号L、C、Rが、3つの入力16A〜Cに供給され、モノラル信号xmonoは、すべての3つの信号の和によって生成される。中心信号xcentreを受信する中心信号符号化部130が追加される。モノラル信号42は、この実施形態では、符号化され、復号されたモノラル信号x"monoであり、マルチプレクサ133においてあるバランス係数gQで乗算される。減算器135において、乗算されたモノラル信号は、中心残差信号を生成するために、中心信号xcentreから減算される。バランス係数gQは、品質基準に従って中心残差信号を最小にするために、最適化部137によってモノラル信号および中心信号の内容に基づいて決定される。中心残差信号は、任意の符号化器手順に従って、中心残差符号化器139において符号化される。中心残差符号化器139は、低ビットレート変換符号化器またはCELP符号化器であることが好ましい。したがって、中心信号を表す符号化パラメータpcentreは、中心残差信号および最適化バランス係数149を表す符号化パラメータpcentre residualを含む。中心残差信号およびスケーリングされたモノラル信号は、加算器235において加算されて、符号化誤差について補償される修正中心信号142を生成する。
副信号xside、すなわち、左Lチャネルと右Rチャネルとの差は、上述の実施形態と同様に、副信号符号化部30に供給される。しかし、ここでは、最適化部37は、中心信号符号化部130によって供給される修正中心信号142にも依存する。したがって、副残差信号は、減算器35において、モノラル信号42、修正中心信号142、および副信号の最適線形組合せとして生成される。
上記で記述された可変フレーム長の概念は、副信号および中心信号のどちらか、または両方に適用することができる。
図6は、図5の符号化部から符号化オーディオ信号を受信するのに適切な復号化器を示す。受信信号54は、主信号を表す符号化パラメータpmono、中心信号を表す符号化パラメータpcentre、および副信号を表す符号化パラメータpsideに分割される。復号化器64において、主信号を表す符号化パラメータpmonoは、主信号x"monoを生成するために使用される。復号化器160において、中心信号を表す符号化パラメータpcentreは、主信号x"monoに基づいてx"centreを生成するために使用される。復号化器60において、副信号を表す符号化パラメータpsideは復号され、主信号x"monoおよび中心信号x"centreに基づいて、副信号x"sideを生成する。
手順は、数学的には以下のように表すことができる。
入力信号xleft, xright, xcentreは、以下に従ってモノラル・チャネルに組み合わされる。
Figure 0004589366
α、β、χは、残りのセクションにおいて、簡単化のために1.0に設定されるが、任意の値に設定することができる。α、β、χの値は、最適品質を達成するために、1つまたは2つのチャネルを強調するように、一定とする、または信号内容に依存するとすることができる。
モノラル信号と中心信号との間の正規化相互相関は、以下のように計算される。
Figure 0004589366
ただし、
Figure 0004589366
xcentreは中心信号、xmonoはモノラル信号である。モノラル信号は、モノラル対象信号から来るが、モノラル符号化器の局所合成を使用することも同様に可能である。
中心残差信号は、以下のように符号化される。
Figure 0004589366
Qg(..)は、バランス係数に適用される量子化関数である。バランス係数は、送信チャネル上で送信される。
Ecが中心残差信号の符号化関数(たとえば変換符号化器)であり、Emがモノラル信号の符号化関数である場合、復号化器側の復号されたx"centre信号は、以下のように記述することができる。
Figure 0004589366
符号化される副残差信号は、以下のようになる。
Figure 0004589366
ただし、gQsmおよびgQscは、下式を最小にするパラメータgsmおよびgscの量子化された値である。
Figure 0004589366
ηは、エラーのLMS最小化のために、たとえば2に等しいとすることができる。gsmおよびgscパラメータは、共同してまたは別々に量子化することができる。
Esが副残差信号の符号化関数である場合、復号されたx"leftおよびx"rightのチャネル信号は、以下のように与えられる。
Figure 0004589366
最も厄介である異音の1つは、プリエコー効果である。図7a、bに、そのような異音を示す。曲線100によって示されるような時間進行を有する信号成分を想定する。t0からの開始時、オーディオサンプルに信号成分は存在しない。t1とt2との間の時間tで、信号成分が突然出現する。信号成分が、t2-t1のフレーム長を使用して符号化される場合、信号成分の出現は、曲線101において示されるように、全フレームにわたって「不鮮明」になる。復号が曲線101について行われる場合、信号成分は、信号成分の意図した出現よりΔt前の時間において出現し、「プリエコー」が知覚される。
プリエコー異音は、長い符号化フレームが使用される場合により強調される。短いフレームを使用することによって、異音はいくらか軽減される。上述したプリエコーの問題に対処する他の方式は、モノラル信号が符号化器側および復号化器側の両方において利用可能であるということを利用する。これにより、モノラル信号のエネルギ曲線に従って副信号をスケーリングすることが可能になる。復号化器側において、逆スケーリングが実施され、したがって、プリエコーの問題はいくらか軽減されることが可能である。
モノラル信号のエネルギ曲線が、以下のように、フレームにわたって計算される。
Figure 0004589366
ただし、w(n)は窓関数である。最も簡単な窓関数は矩形窓であるが、ハミング窓などの他の窓タイプがより好ましい場合がある。
次いで、副残差信号が、以下のようにスケーリングされる。
Figure 0004589366
より一般的な形態では、上記の式は、以下のように書くことができる。
Figure 0004589366
上式で、f(・・・)は、単調連続関数である。復号化器において、エネルギ曲線は、復号モノラル信号について計算され、以下のように復号副信号に適用される。
Figure 0004589366
ある意味ではこのエネルギ曲線スケーリングは、より短いフレーム長の使用の代替であるので、この概念は、上記でさらに記述されているように、可変フレーム長の概念と組み合わされるのに特によく適している。エネルギ曲線スケーリングを適用するいくつかの符号化方式、適用しないいくつかの符号化方式、およびエネルギ曲線スケーリングをあるサブフレーム中にのみ適用するいくつかの符号化方式を有することによって、符号化方式のより柔軟なセットを供給することが可能である。図8において、本発明による信号符号化ユニット30の実施形態が示されている。ここでは、異なる符号化方式81は、エネルギ曲線スケーリングを適用する符号化を表すハッチングされたサブフレーム91、およびエネルギ曲線スケーリングを適用しない符号化手順を表すハッチングされていないサブフレーム92を有する。このようにして、異なる長さのサブフレームだけでなく、異なる符号化原理のサブフレームの組合せも、利用可能である。本説明例では、エネルギ曲線スケーリングの適用は、異なる符号化方式間において異なる。より一般的な場合、任意の符号化原理を類似の方式で可変長概念と組み合わせることができる。
図8の符号化方式のセットは、異なる方式でプリエコー異音などに対処する方式を備える。いくつかの方式では、エネルギ曲線原理によるプリエコー最小化を有するより長いサブフレームが使用される。他の方式では、エネルギ曲線スケーリングを有さないより短いサブフレームが使用される。信号内容に応じて、代替物の1つが、より有利である可能性がある。非常に深刻なプリエコーの場合、エネルギ曲線スケーリングを有する短いサブフレームを使用する符号化方式が必要である可能性がある。
提案した解決法は、全周波数帯域において、あるいは1または2以上の個別サブバンドにおいて使用することができる。サブバンドの使用は、主信号および副信号の両方について、またはそれらの一方について別々に、適用することができる。好適な実施形態では、いくつかの周波数帯域にて副信号を分割する。この理由は、単に、周波数帯域全体においてより、隔離された周波数帯域において可能な冗長性を除去することが容易であるからである。これは、大量のスペクトル内容を有する楽音信号を符号化するとき、特に重要である。
1つの可能な使用は、周波数帯域を上記の方法で所定の閾値より下において符号化する。所定の閾値は、2kHz、または、さらにより好ましくは1kHzとすることが好ましい。対象周波数範囲の残りの部分については、上記の方法で、またはまったく異なる方法で、他の追加の周波数帯域を符号化することができる。
好ましくは低周波数について上記の方法を使用する1つの動機は、一般に、拡散音場が、高周波数においてわずかなエネルギ内容を有するからである。当然の理由は、音吸収が、周波数と共に通常増大するからである。また、拡散音場成分は、より高い周波数では人の聴覚システムについて重要性の劣る役割を果たすようである。したがって、この解決法を(1kHzあるいは2kHzより低い)低周波数において使用し、より高い周波数では、他のより多くのビット効率のよい符号化方式に依拠することが有益である。この方式が低周波数においてのみ適用されるということにより、ビットレートが大きく節約されるが、その理由は、提案された方法に関して必要なビットレートは、必要な帯域幅に比例するからである。ほとんどの場合、モノラル符号化器は、周波数帯域全体を符号化することができ、一方、提案された副信号符号化は、図9に概略的に示されるように、周波数帯域のより低い部分においてのみ実施されることが示唆される。参照符号301は、副信号の本発明による符号化方式を指し、参照符号302は、副信号のあらゆる他の符号化方式を指し、参照符号303は、副信号の符号化方式を指す。
また、いくつかの個別の周波数帯域について提案された方法を使用する可能性も存在する。
図10において、本発明による符号化方法の実施形態の主要ステップが、フローチャートとして示されている。手順は、ステップ200において開始される。ステップ210において、ポリフォニック信号から推測される主信号が符号化される。ステップ212において、異なる長さおよび/または順序のサブフレームを備える符号化方式が提供される。ポリフォニック信号からステップ214において推測される副信号が、存在するポリフォニック信号の実際の信号内容に少なくとも部分的に依存して選択された符号化方式によって符号化される。手順は、ステップ299において終了する。
図11において、本発明による符号化方法の実施形態の主要ステップが、フローチャートとして示されている。手順は、ステップ200において開始される。ステップ220において、受信符号化主信号が復号される。ステップ222において、異なる長さおよび/または順序のサブフレームを備える復号方式が提供される。受信副信号が、選択された符号化方式によってステップ224において復号される。ステップ226において、復号された主信号および副信号は、ポリフォニック信号に組み合わされる。手順は、ステップ299において終了する。
上述した実施形態は、本発明のいくつかの例示として理解されるべきである。当業者であれば、上述の実施形態に対して様々な修正、組合せ、変更を、本発明の範囲から逸脱することなく行うことが可能であろう。具体的には、異なる実施形態の異なる部分的解決法を、技術的に可能であれば、他の構成において組み合わせることができる。いずれにせよ、本発明の範囲は添付の特許請求の範囲によって定義される。
ポリフォニック信号を送信するシステムを示すブロック図である。 送信機における符号化器のブロック図である。 受信機における復号化器のブロック図である。 異なる長さのフレームの符号化を示す図である。 本発明による副信号符号化部の実施形態のブロック図である。 本発明による副信号符号化部の実施形態のブロック図である。 副信号のバランス係数符号化を使用する符号化器の一実施形態のブロック図である。 マルチ信号システムの符号化器の一実施形態のブロック図である。 図5の装置から信号を復号するのに適切な復号化器の一実施形態のブロック図である。 プリエコー異音を示す図である。 プリエコー異音を示す図である。 異なるサブフレームについて異なる符号化原理を使用する、本発明による副信号符号化部の一実施形態のブロック図である。 異なる周波数サブバンドについて異なる符号化原理を使用することを示す図である。 本発明による符号化方法の一実施形態の基本的なステップのフローチャートである。 本発明による復号方法の一実施形態の基本的なステップのフローチャートである。

Claims (17)

  1. 少なくとも第1チャネルおよび第2チャネル (a, b; L, R) の信号に基づいて、主信号 (xmono) を表す符号化パラメータである第1出力信号 (pmono) を生成する第1生成ステップ (210) と、
    符号化フレーム (80) 内において少なくとも前記第1チャネルおよび前記第2チャネル (a, b; L, R) の信号に基づいて、副信号 (xside) を表す符号化パラメータである第2出力信号 (pside) を生成する第2生成ステップ (214) と
    を有する、ポリフォニック信号を符号化する符号化方法であって、
    前記第2生成ステップは、前記主信号 (xmono) のエネルギ曲線に基づいて前記副信号 (xside) をスケーリングするスケーリングステップを含むことを特徴とする符号化方法。
  2. 前記スケーリングステップは、前記主信号 (xmono) のエネルギ曲線の単調連続関数であるファクタによって前記副信号 (xside) をスケーリングすることを特徴とする請求項1に記載の符号化方法。
  3. 前記第2生成ステップは、前記副信号 (xside) と前記主信号 (xmono) とのバランス差に基づいて副残差信号 (xside residual) を生成するステップを含み、前記スケーリングステップは、前記主信号 (xmono) のエネルギ曲線に基づいて前記副残差信号 (xside residual) をスケーリングすることを特徴とする請求項1に記載の符号化方法。
  4. 前記スケーリングステップは、前記主信号 (xmono) の前記エネルギ曲線の単調連続関数であるファクタによって前記副残差信号 (xside residual) を除算することを特徴とする請求項3に記載の符号化方法。
  5. 主信号 (xmono) を表す符号化パラメータ (pmono) から、復号化した主信号 (x"mono) を生成する第1生成ステップ (220) と、
    副信号 (xside) を表す符号化パラメータ (pside) から、復号化した副信号 (x"side) を生成する第2生成ステップ (224) と、
    少なくとも前記復号化した主信号 (x"mono) と前記復号化した副信号 (x"side) とを組み合わせて、少なくとも第1および第2チャネル (a, b; L, R) の信号にするステップ (226) と、
    を有する、ポリフォニック信号を復号化する復号化方法であって、
    前記第2生成ステップ (224) は、前記復号化した主信号 (x"mono) のエネルギ曲線に基づいて前記復号化した副信号 (x"side) をスケーリングするスケーリングステップを含むことを特徴とする復号化方法。
  6. 前記スケーリングステップは、前記復号化した主信号 (x"mono) のエネルギ曲線の単調連続関数であるファクタによって前記復号化した副信号 (x"side) をスケーリングすることを特徴とする請求項に記載の復号化方法。
  7. 前記第2生成ステップ (224) は、復号化した副残差信号 (x"side residual) を生成するステップと、前記復号化した副残差信号 (x"side residual) に基づいて前記復号化した副信号 (x"side) を生成するステップとを含み、前記スケーリングステップは、前記復号化した主信号 (x"mono) のエネルギ曲線に基づいて前記復号化した副残差信号 (x"side residual) をスケーリングすることを特徴とする請求項5に記載の復号化方法。
  8. 前記スケーリングステップは、前記復号化した主信号 (x"mono) のエネルギ曲線の単調連続関数であるファクタによって前記復号化した副残差信号 (x"side residual) を乗じることを特徴とする請求項7に記載の復号化方法。
  9. 少なくとも第1および第2チャネル (a, b; L, R) を有するポリフォニック信号 (a, b; L, R, C) を入力する入力手段 (16; 16A-C) と、
    少なくとも前記第1および第2チャネル (a, b; L, R) の信号に基づいて、主信号 (xmono) を表す符号化パラメータである第1出力信号 (pmono) を生成する第1生成手段 (38) と、
    符号化フレーム (80) 内において、少なくとも前記第1および第2チャネル (a, b; L, R) の信号に基づいて、副信号 (xside) を表す符号化パラメータである第2出力信号 (pside) を生成する第2生成手段 (30) と、
    出力手段 (52) と
    を有する符号化装置 (14) であって、
    前記第2生成手段 (30) は、前記主信号 (xmono) のエネルギ曲線に基づいて前記副信号 (xside) をスケーリングするスケーリング手段を含むことを特徴とする符号化装置。
  10. 前記スケーリング手段は、前記主信号 (xmono) のエネルギ曲線の単調連続関数であるファクタによって前記副信号 (xside) をスケーリングすることを特徴とする請求項9に記載の符号化装置。
  11. 前記第2生成手段は、前記副信号 (xside) と前記主信号 (xmono) とのバランス差に基づいて副残差信号 (xside residual) を生成する手段を含み、前記スケーリング手段は、前記主信号 (xmono) のエネルギ曲線に基づいて前記副残差信号 (xside residual) をスケーリングすることを特徴とする請求項9に記載の符号化装置。
  12. 前記スケーリング手段は、前記主信号 (xmono) の前記エネルギ曲線の単調連続関数であるファクタによって前記副残差信号 (xside residual) を除算することを特徴とする請求項11に記載の符号化装置。
  13. 主信号 (xmono) を表す符号化パラメータ (pmono) および副信号 (xside) を表す符号化パラメータ (pside) を入力する入力手段 (54) と、
    前記主信号 (xmono) を表す前記符号化パラメータ (pmono) から、復号化した主信号 (x"mono) を生成する第1生成手段 (64) と、
    符号化フレーム (80) 内において、前記副信号 (xside) を表す前記符号化パラメータ (pside) から、復号化した副信号 (x"side) を生成する第2生成手段 (60) と、
    少なくとも前記復号化した主信号 (x"mono) と前記復号化した副信号 (x"side) とを組み合わせて、少なくとも第1および第2チャネル (a, b; L, R) の信号にする手段 (68, 70) と、
    出力手段 (26; 26A-C) と
    を有する復号化装置 (24) であって、
    前記第2生成手段 (60) は、前記復号化した主信号 (x"mono) のエネルギ曲線に基づいて前記復号化した副信号 (x"side) をスケーリングするスケーリング手段を含むことを特徴とする復号化装置。
  14. 前記スケーリング手段は、前記復号化した主信号 (x"mono) のエネルギ曲線の単調連続関数であるファクタによって前記復号化した副信号 (x"side) をスケーリングすることを特徴とする請求項13に記載の復号化装置。
  15. 前記第2生成手段 (60) は、復号化した副残差信号 (x"side residual) を生成する手段と、前記復号化した副残差信号 (x"side residual) に基づいて前記復号化した副信号 (x"side) を生成する手段とを含み、前記スケーリング手段は、前記復号化した主信号 (x"mono) のエネルギ曲線に基づいて前記復号化した副残差信号 (x"side residual) をスケーリングすることを特徴とする請求項13に記載の復号化装置。
  16. 前記スケーリング手段は、前記復号化した主信号 (x"mono) のエネルギ曲線の単調連続関数であるファクタによって前記復号化した副残差信号 (x"side residual) を乗じることを特徴とする請求項15に記載の復号化装置。
  17. 請求項9から12までのいずれか1項に記載の符号化装置と、
    請求項13から16までのいずれか1項に記載の復号化装置と、
    の少なくともいずれか一方を備えることを特徴とするオーディオシステム (1) 。
JP2007216374A 2003-12-19 2007-08-22 忠実度最適化可変フレーム長符号化 Expired - Fee Related JP4589366B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE0303501A SE0303501D0 (sv) 2003-12-19 2003-12-19 Filter-based parametric multi-channel coding
SE0400417A SE527670C2 (sv) 2003-12-19 2004-02-20 Naturtrogenhetsoptimerad kodning med variabel ramlängd

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006518596A Division JP4335917B2 (ja) 2003-12-19 2004-12-15 忠実度最適化可変フレーム長符号化

Publications (2)

Publication Number Publication Date
JP2008026914A JP2008026914A (ja) 2008-02-07
JP4589366B2 true JP4589366B2 (ja) 2010-12-01

Family

ID=31996354

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006518596A Expired - Fee Related JP4335917B2 (ja) 2003-12-19 2004-12-15 忠実度最適化可変フレーム長符号化
JP2007216374A Expired - Fee Related JP4589366B2 (ja) 2003-12-19 2007-08-22 忠実度最適化可変フレーム長符号化

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006518596A Expired - Fee Related JP4335917B2 (ja) 2003-12-19 2004-12-15 忠実度最適化可変フレーム長符号化

Country Status (15)

Country Link
EP (2) EP1623411B1 (ja)
JP (2) JP4335917B2 (ja)
CN (2) CN101118747B (ja)
AT (2) ATE371924T1 (ja)
AU (1) AU2004298708B2 (ja)
BR (2) BRPI0419281B1 (ja)
CA (2) CA2527971C (ja)
DE (2) DE602004023240D1 (ja)
HK (2) HK1115665A1 (ja)
MX (1) MXPA05012230A (ja)
PL (1) PL1623411T3 (ja)
RU (2) RU2305870C2 (ja)
SE (1) SE527670C2 (ja)
WO (1) WO2005059899A1 (ja)
ZA (1) ZA200508980B (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2363116C2 (ru) * 2002-07-12 2009-07-27 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
JP4639966B2 (ja) * 2005-05-31 2011-02-23 ヤマハ株式会社 オーディオデータ圧縮方法およびオーディオデータ圧縮回路並びにオーディオデータ伸張回路
EP1908057B1 (en) 2005-06-30 2012-06-20 LG Electronics Inc. Method and apparatus for decoding an audio signal
AU2006266655B2 (en) 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8494667B2 (en) 2005-06-30 2013-07-23 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8108219B2 (en) 2005-07-11 2012-01-31 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US7987097B2 (en) 2005-08-30 2011-07-26 Lg Electronics Method for decoding an audio signal
WO2007055464A1 (en) 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
KR100857112B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
EP1952113A4 (en) 2005-10-05 2009-05-27 Lg Electronics Inc METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
CN101366082B (zh) 2006-02-06 2012-10-03 艾利森电话股份有限公司 可变帧偏移编解码方法、编解码器及无线电通信设备
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US7889103B2 (en) 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
EP2124486A1 (de) * 2008-05-13 2009-11-25 Clemens Par Winkelabhängig operierende Vorrichtung oder Methodik zur Gewinnung eines pseudostereophonen Audiosignals
BR122020009727B1 (pt) 2008-05-23 2021-04-06 Koninklijke Philips N.V. Método
US20110137661A1 (en) * 2008-08-08 2011-06-09 Panasonic Corporation Quantizing device, encoding device, quantizing method, and encoding method
JP5295372B2 (ja) * 2008-09-17 2013-09-18 フランス・テレコム デジタルオーディオ信号におけるプリエコーの減衰
JP5309944B2 (ja) 2008-12-11 2013-10-09 富士通株式会社 オーディオ復号装置、方法、及びプログラム
US8175888B2 (en) 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8200496B2 (en) 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8219408B2 (en) 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8140342B2 (en) 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
CN102171754B (zh) * 2009-07-31 2013-06-26 松下电器产业株式会社 编码装置以及解码装置
US8977546B2 (en) * 2009-10-20 2015-03-10 Panasonic Intellectual Property Corporation Of America Encoding device, decoding device and method for both
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
WO2011076285A1 (en) * 2009-12-23 2011-06-30 Nokia Corporation Sparse audio
US8442837B2 (en) 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
EP2544466A1 (en) * 2011-07-05 2013-01-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
CA2886140C (en) * 2012-11-15 2021-03-23 Ntt Docomo, Inc. Audio coding device, audio coding method, audio coding program, audio decoding device, audio decoding method, and audio decoding program
MY188370A (en) 2015-09-25 2021-12-06 Voiceage Corp Method and system for decoding left and right channels of a stereo sound signal
CN107742521B (zh) 2016-08-10 2021-08-13 华为技术有限公司 多声道信号的编码方法和编码器
CN109215668B (zh) 2017-06-30 2021-01-05 华为技术有限公司 一种声道间相位差参数的编码方法及装置
CN115831130A (zh) 2018-06-29 2023-03-21 华为技术有限公司 立体声信号的编码方法、解码方法、编码装置和解码装置
CN112233682A (zh) * 2019-06-29 2021-01-15 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000513888A (ja) * 1996-06-07 2000-10-17 ザット コーポレーション Btscエンコーダ
JP2001255892A (ja) * 2000-03-13 2001-09-21 Nippon Telegr & Teleph Corp <Ntt> ステレオ信号符号化方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) * 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (nl) * 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
US5694332A (en) * 1994-12-13 1997-12-02 Lsi Logic Corporation MPEG audio decoding system with subframe input buffering
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP2004522198A (ja) * 2001-05-08 2004-07-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化方法
JP2003084790A (ja) * 2001-09-17 2003-03-19 Matsushita Electric Ind Co Ltd 台詞成分強調装置
CN1219415C (zh) * 2002-07-23 2005-09-14 华南理工大学 一种5.1通路环绕声的耳机重发的信号处理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000513888A (ja) * 1996-06-07 2000-10-17 ザット コーポレーション Btscエンコーダ
JP2001255892A (ja) * 2000-03-13 2001-09-21 Nippon Telegr & Teleph Corp <Ntt> ステレオ信号符号化方法

Also Published As

Publication number Publication date
CA2690885A1 (en) 2005-06-30
AU2004298708A1 (en) 2005-06-30
CN101118747B (zh) 2011-02-23
EP1845519A3 (en) 2007-11-07
CA2690885C (en) 2014-01-21
EP1845519B1 (en) 2009-09-16
PL1623411T3 (pl) 2008-01-31
CA2527971C (en) 2011-03-15
BRPI0410856B8 (pt) 2019-10-15
RU2005134365A (ru) 2006-05-27
EP1845519A2 (en) 2007-10-17
CN1816847A (zh) 2006-08-09
HK1115665A1 (en) 2008-12-05
RU2425340C2 (ru) 2011-07-27
BRPI0410856B1 (pt) 2019-10-01
EP1623411A1 (en) 2006-02-08
SE0400417D0 (sv) 2004-02-20
ATE371924T1 (de) 2007-09-15
AU2004298708B2 (en) 2008-01-03
HK1091585A1 (en) 2007-01-19
RU2007121143A (ru) 2008-12-10
BRPI0410856A (pt) 2006-07-04
WO2005059899A1 (en) 2005-06-30
CA2527971A1 (en) 2005-06-30
DE602004008613T2 (de) 2008-06-12
SE527670C2 (sv) 2006-05-09
DE602004008613D1 (de) 2007-10-11
SE0400417L (sv) 2005-06-20
ZA200508980B (en) 2007-03-28
BRPI0419281B1 (pt) 2018-08-14
CN101118747A (zh) 2008-02-06
RU2305870C2 (ru) 2007-09-10
JP2008026914A (ja) 2008-02-07
ATE443317T1 (de) 2009-10-15
MXPA05012230A (es) 2006-02-10
DE602004023240D1 (de) 2009-10-29
JP4335917B2 (ja) 2009-09-30
JP2007529021A (ja) 2007-10-18
CN100559465C (zh) 2009-11-11
EP1623411B1 (en) 2007-08-29

Similar Documents

Publication Publication Date Title
JP4589366B2 (ja) 忠実度最適化可変フレーム長符号化
JP4809370B2 (ja) マルチチャネル音声符号化における適応ビット割り当て
US7809579B2 (en) Fidelity-optimized variable frame length encoding
JP5277508B2 (ja) マルチ・チャンネル音響信号をエンコードするための装置および方法
EP1603117B1 (en) Efficient and scalable parametric stereo coding for low bitrate audio coding applications
JP5455647B2 (ja) オーディオデコーダ
JP5153791B2 (ja) ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
US20090204397A1 (en) Linear predictive coding of an audio signal
US20100046762A1 (en) Efficient and scalable parametric stereo coding for low bitrate audio coding applications
GB2470059A (en) Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
US7725324B2 (en) Constrained filter encoding of polyphonic signals
US20100121633A1 (en) Stereo audio encoding device and stereo audio encoding method
JP4323520B2 (ja) ポリフォニック信号の制約付きフィルタ符号化
AU2007237227B2 (en) Fidelity-optimised pre-echo suppressing encoding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100820

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100909

R150 Certificate of patent or registration of utility model

Ref document number: 4589366

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees