JP2007527543A - Constrained filter coding of polyphonic signals - Google Patents

Constrained filter coding of polyphonic signals Download PDF

Info

Publication number
JP2007527543A
JP2007527543A JP2006518597A JP2006518597A JP2007527543A JP 2007527543 A JP2007527543 A JP 2007527543A JP 2006518597 A JP2006518597 A JP 2006518597A JP 2006518597 A JP2006518597 A JP 2006518597A JP 2007527543 A JP2007527543 A JP 2007527543A
Authority
JP
Japan
Prior art keywords
signal
channel
filter
adaptive filter
constraint
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006518597A
Other languages
Japanese (ja)
Other versions
JP4323520B2 (en
Inventor
ステファン ブルン,
インイェマル ヨハンソン,
アニセ タレブ,
パトリック サンドグレン,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE0303499A external-priority patent/SE0303499D0/en
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2007527543A publication Critical patent/JP2007527543A/en
Application granted granted Critical
Publication of JP4323520B2 publication Critical patent/JP4323520B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Abstract

異なるチャネル(c1〜c)の信号が、1つのモノラル信号(x)に組み合わされる。1つが各チャネル(c1〜c)についてであることが好ましい1セットの適応フィルタが、それぞれのフィルタ適応化ユニット(30:1〜30:N)において導出される。適応フィルタがモノラル信号(x)に適用されるとき、適応フィルタは、知覚制約の下でそれぞれのチャネル(c1〜cN)の信号を再構築する。知覚制約は、ゲイン制約および/またはシェイプ制約である。ゲイン制約により、チャネル(c1〜c)間の相対エネルギの維持が可能になり、一方、シェイプ制約により、スペクトル・ヌルの不必要性を回避することによってさらなる安定性が可能になる。送信されるパラメータは、符号化形態のモノラル信号(x)、およびやはり符号化されていることが好ましい適応フィルタのパラメータ(p1〜pN)である。受信機は、適応フィルタおよび可能であればいくつかの追加の後処理を適用することによって、異なるチャネルの信号を再構築する。Signals of different channels (c 1 to c N ) are combined into one monaural signal (x). One of the adaptive filters of a set is preferably for each channel (c 1 to c N), respectively of the filter adaptation unit (30: 1~30: N) is derived in. When the adaptive filter is applied to the monaural signal (x), the adaptive filter reconstructs the signal for each channel (c 1 -c N ) under perceptual constraints. Perceptual constraints are gain constraints and / or shape constraints. The gain constraint allows the relative energy between the channels (c 1 -c N ) to be maintained, while the shape constraint allows further stability by avoiding the need for spectral nulls. The parameters to be transmitted are the monaural signal (x) in coded form and the parameters (p 1 -p N ) of the adaptive filter that are also preferably coded. The receiver reconstructs the signals on the different channels by applying an adaptive filter and possibly some additional post-processing.

Description

本発明は、オーディオ信号の符号化に関し、特に、マルチチャネル・オーディオ信号の符号化に関する。   The present invention relates to encoding audio signals, and more particularly to encoding multi-channel audio signals.

高いオーディオ品質を維持しつつ低ビットレートでオーディオ信号を送信あるいは記憶することは、市場の高い要求である。具体的には、送信リソースや記憶装置に制約がある場合、低ビットレート動作が本質的なコスト要因となる。これは、たとえば、GSM、UMTS、CDMAなどのモバイル通信システムにおけるストリーミングおよびメッセージングの応用分野では一般的な認識である。   There is a high market demand for transmitting or storing audio signals at a low bit rate while maintaining high audio quality. Specifically, when there are restrictions on transmission resources and storage devices, low bit rate operation is an essential cost factor. This is a common recognition in streaming and messaging applications in mobile communication systems such as GSM, UMTS, CDMA, for example.

現在のところ、モバイル通信システムに利用されうる標準化されたコーデックで、経済的に関心を引くビットレートにてステレオの高いオーディオ品質を提供するものは存在しない。いまあるコーデックで可能なのは、オーディオ信号のモノラル送信である。ステレオ送信もある程度までは利用可能である。しかしビットレートの制約により、非常に限定されたステレオ表現をせざるをえないのが現状である。   At present, there are no standardized codecs that can be used in mobile communication systems that provide high stereo audio quality at economically interesting bit rates. What is possible with the current codec is mono transmission of audio signals. Stereo transmission is also available to some extent. However, due to bit rate restrictions, the current situation is that very limited stereo representations are unavoidable.

オーディオ信号のステレオ符号化またはマルチチャネル符号化の最も簡単な方式は、異なるチャネルの信号を個々の独立な信号として別々に符号化することである。ステレオFM無線送信において使用され、従来からのモノラル無線受信機との共存を図った他の基本的な方式は、2チャネルの和信号および差信号を送信するというものである。   The simplest method of stereo encoding or multi-channel encoding of an audio signal is to separately encode signals of different channels as individual independent signals. Another basic method used in stereo FM radio transmission and coexisting with a conventional monaural radio receiver is to transmit two-channel sum and difference signals.

MPEG−1/2レイヤIIIおよびMPEG−2/4 AACなどの現在のオーディオコーデックは、いわゆるジョイント・ステレオ符号化(joint stereo coding)を使用する。この方法によれば、異なるチャネルの信号は、別々および個々にではなく、共同して処理される。2つの最も一般的に使用されるジョイント・ステレオ符号化方法は、「Mid/Side」(M/S)ステレオ符号化("Mid/Side" (M/S) stereo coding)およびインテンシティ・ステレオ符号化(intensity stereo coding)として知られ、これらは一般に、符号化されるステレオ信号またはマルチチャネル信号のサブバンドに対して適用される。   Current audio codecs such as MPEG-1 / 2 Layer III and MPEG-2 / 4 AAC use so-called joint stereo coding. According to this method, the signals of different channels are processed jointly rather than separately and individually. The two most commonly used joint stereo coding methods are “Mid / Side” (M / S) stereo coding and intensity stereo coding. Known as intensity stereo coding, these are generally applied to the subbands of the stereo signal or multichannel signal to be encoded.

M/Sステレオ符号化は、チャネル・サブバンドの和信号と差信号を符号化して送信し、それにより、チャネル・サブバンド間の冗長性を利用するという意味では、ステレオFM無線において記述される手順と同様である。M/Sステレオ符号化に基づくエンコーダの構造および動作は、たとえば J. D. ジョンストン(Johnston)による米国特許第5285498号に記載されている。   M / S stereo coding is described in stereo FM radio in the sense that it encodes and transmits the sum and difference signals of the channel sub-bands, thereby exploiting the redundancy between the channel and sub-bands. The procedure is the same. The structure and operation of an encoder based on M / S stereo coding is described, for example, in US Pat. No. 5,285,498 by J. D. Johnston.

一方、インテンシティ・ステレオは、ステレオの非関連性を利用することができる。これは、強度がチャネルの中にどのように分布しているかを示すいくつかの位置情報と共に、(異なるサブバンドの)チャネルの結合強度を伝送する。インテンシティ・ステレオは、チャネルのスペクトル振幅情報のみを出力する。位相情報は、伝達されない。この理由および、時間チャネル間情報(より具体的にはチャネル間時間差)がとりわけ低い周波数において主要な音響心理学的関連性を呈するという理由により、インテンシティ・ステレオは、たとえば2kHzより高い周波数においてのみ使用することができる。インテンシティ・ステレオ符号化法は、たとえば、R. ヴェルデュイ(Veldhuis)らによる欧州特許第0497413号に記載されている。   On the other hand, intensity stereo can take advantage of stereo independence. This transmits the combined strength of the channels (in different subbands) along with some position information indicating how the strength is distributed in the channel. Intensity stereo outputs only the spectral amplitude information of the channel. Phase information is not transmitted. For this reason and because time-channel information (more specifically, channel-to-channel time difference) exhibits a major psychoacoustic relevance especially at low frequencies, intensity stereo is only at frequencies above 2 kHz, for example. Can be used. Intensity stereo coding is described, for example, in European Patent No. 0497413 by R. Veldhuis et al.

最近開発されたステレオ符号化法が、たとえば、C. フォーラー (Faller) らによる名称「Binaural cue coding applied to stereo and multi channel audio compression」(第112回AES会議、2002年5月、ドイツ、ミュンヘンの会議文献)に記載されている。この方法は、パラメトリック・マルチチャネル・オーディオ符号化法である。基本的な原理は、符号化側において、Nチャネルc1、c2、・・・、cNからの入力信号が、単一のモノラル信号(mono signal)mに組み合わされるものである。モノラル信号は、任意の従来のモノラル・オーディオ・コーデックを使用してオーディオ符号化される。並行して、パラメータが、マルチチャネル像を記述するチャネル信号から導出される。パラメータは符号化され、オーディオ・ビット・ストリームと共に復号化器に送信される。復号化器は、まず、モノラル信号m’を復号化し、次いで、マルチチャネル像のパラメータ記述に基づいてチャネル信号c1’、c2’、・・・、cN’を再生成する。   A recently developed stereo coding method is, for example, the name “Binaural cue coding applied to stereo and multi channel audio compression” by C. Faller et al. (Conference Literature). This method is a parametric multi-channel audio coding method. The basic principle is that on the encoding side, the input signals from N channels c1, c2,..., CN are combined into a single mono signal m. The mono signal is audio encoded using any conventional mono audio codec. In parallel, parameters are derived from the channel signal that describes the multi-channel image. The parameters are encoded and sent to the decoder along with the audio bit stream. The decoder first decodes the monaural signal m 'and then regenerates the channel signals c1', c2 ', ..., cN' based on the parameter description of the multichannel image.

バイノーラル・キュー符号化(BCC)方法の原理は、符号化されたモノラル信号およびいわゆるBCCパラメータを送信する。BCCパラメータは、元のマルチチャネル入力信号のサブバンドについて、コード化されたチャネル間レベル差およびチャネル間時間差の情報を有する。復号化器は、BCCパラメータに基づいてモノラル信号のサブバンド・レベルおよび位相調節を適用することによって、差チャネル信号を再生成する。M/Sまたはインテンシティ・ステレオなどに対する利点は、時間チャネル間情報を備えるステレオ情報が、はるかにより低いビットレートで送信されることである。   The principle of the binaural cue coding (BCC) method transmits an encoded mono signal and so-called BCC parameters. The BCC parameters have coded inter-channel level difference and inter-channel time difference information for the subbands of the original multi-channel input signal. The decoder regenerates the difference channel signal by applying the subband level and phase adjustment of the mono signal based on the BCC parameters. An advantage over M / S or intensity stereo etc. is that stereo information with time channel information is transmitted at a much lower bit rate.

上述の従来技術のマルチチャネル符号化方法の問題は、良好な品質を提供するためは、高いビットレートを必要とすることである。たとえば、数kbps程度の低ビットレートが適用される場合、インテンシティステレオは、時間チャネル間情報を提供しないとため悪影響を受ける。この情報は、たとえば2kHzより低い低周波数が知覚的に重要であるため、そのような低周波数においてステレオ像を提供することができない。   The problem with the above described prior art multi-channel coding method is that it requires a high bit rate in order to provide good quality. For example, when a low bit rate of about several kbps is applied, intensity stereo is adversely affected because it does not provide time channel information. This information cannot provide a stereo image at such low frequencies, for example, since low frequencies below 2 kHz are perceptually important.

BCCは、たとえば3kbpsの低ビットレートで、低周波数でもマルチチャネル像を再生成することができる。その理由は、時間チャネル間情報も送信するからである。しかし、この技法は、符号化器および復号化器の両方において、チャネルの各々について演算量の多い時間周波数変換を必要とする。さらに、BCCは、純粋に数学的な方式でマッピングを最適化する。しかし、符号化方法に内在する特徴的なアーティファクトは、消滅しない。   BCC can regenerate a multichannel image even at a low frequency, for example, at a low bit rate of 3 kbps. The reason is that information between time channels is also transmitted. However, this technique requires a computationally time-frequency transform for each of the channels in both the encoder and the decoder. Furthermore, BCC optimizes the mapping in a purely mathematical manner. However, the characteristic artifact inherent in the encoding method does not disappear.

C. E. ホルト(Holt)らによる米国特許第5434948号に記載されている技法は、モノラル信号および副情報を符号化するBCCと同様の技法を使用する。この場合、副情報は、予測フィルタおよびオプションで残差信号からなる。予測フィルタでは、Least-Mean-Squareアルゴリズムによって評価が行われ、モノラル信号に適用される場合にはマルチチャネル・オーディオ信号の予測が可能である。この技法により、マルチチャネル音源に対して非常に低いビットレート符号化を実現することができるが、以下でさらに議論されるように、品質の低下を伴うことになる。   The technique described in US Pat. No. 5,434,948 by C. E. Holt et al. Uses a technique similar to BCC for encoding mono signals and side information. In this case, the sub information consists of a prediction filter and optionally a residual signal. In the prediction filter, evaluation is performed by a Least-Mean-Square algorithm, and when applied to a monaural signal, a multi-channel audio signal can be predicted. This technique can achieve very low bit rate coding for multi-channel sound sources, but with a loss of quality, as discussed further below.

上記のフィルタリング手法と同様の手法が、ブリーバート(Breebaart)およびグローネンダール(Groenendaal)によるWO03/090206に記載されている。しかし、この手法は、モノラル信号に適用され、かつ行列演算によりフィルタリング前のモノラル信号と組み合わされる固定フィルタを使用する。行列演算は、受信相関パラメータおよび受信レベル・パラメータに依存する。そのような信号合成の目的は、元の2つのチャネルの相関およびレベル差を回復することである。固有の固定フィルタ演算のために、信号合成は、信号再生成について非常に限定された可能性を有し、信号の特性に適合しない。手法は、現在は時間成分が復号化器に伝達される上記で議論されたインテンシティ・ステレオ符号化の拡張とみなすことができる。さらに、レベルおよび相関パラメータのみが、行列演算によりある程度の適合を可能にする。この演算は、静的フィルタリング済み信号の単なる回転およびスケーリングからなり、したがって、ポリフォニック再生成能力を限定する。この手法の他の欠点は、透明品質へのスケーラビリティを限定する信号対雑音比などの忠実度基準に基づいていないことである。   A technique similar to the above filtering technique is described in WO 03/090206 by Breebaart and Groenendaal. However, this approach uses a fixed filter that is applied to the monaural signal and combined with the monaural signal before filtering by matrix operations. The matrix operation depends on the reception correlation parameter and the reception level parameter. The purpose of such signal synthesis is to recover the correlation and level difference between the original two channels. Due to the inherent fixed filter operation, signal synthesis has very limited possibilities for signal regeneration and does not adapt to the characteristics of the signal. The approach can now be viewed as an extension of the intensity stereo coding discussed above in which the time component is communicated to the decoder. Furthermore, only the level and correlation parameters allow a certain degree of adaptation through matrix operations. This operation consists of mere rotation and scaling of the static filtered signal, thus limiting the polyphonic regeneration capability. Another drawback of this approach is that it is not based on fidelity criteria such as a signal-to-noise ratio that limits scalability to transparent quality.

最後に、完全を期すべく、3Dオーディオについて使用される技法について説明しておく。この技法は、いわゆるヘッド関係フィルタ (head-related filters) で音源信号をフィルタリングすることによって、右チャネル信号と左チャネル信号とを合成する。しかし、この技法は、異なる音源信号が分離されることを必要とし、したがって一般に、ステレオまたはマルチチャネル符号化に適用することができない。   Finally, for completeness, the techniques used for 3D audio are described. This technique combines a right channel signal and a left channel signal by filtering the sound source signal with so-called head-related filters. However, this technique requires that different sound source signals be separated and is therefore generally not applicable to stereo or multi-channel coding.

米国特許第5285498号US Pat. No. 5,285,498 欧州特許第0497413号European Patent No. 0497413 C. フォーラー(Faller)ら、"Binaural cue coding applied to stereo and multi-channel audio compression"、第112回AES会議、2002年5月、ドイツ、ミュンヘンC. Faller et al., “Binaural cue coding applied to stereo and multi-channel audio compression”, 112th AES Conference, May 2002, Munich, Germany 米国特許第5434948号US Pat. No. 5,434,948 WO03/090206WO03 / 090206 欧州特許0965123B1European Patent 0965123B1

予測フィルタは、Least-Mean-Squareの観点で最適であることが知られているが、元のマルチチャネル信号の聴感特性を常に完全に回復する訳ではない。たとえばステレオ符号化の場合、ステレオ像の不安定性が生じる可能性があり、音は、左と右との間で無作為にジャンプする。さらに、スペクトル・ヌルが不安定性を生じさせ、これらの周波数における周波数応答が迷走するフィルタとなる可能性がある。これにより、フィルタは、ある領域において不必要な増幅を行ってしまい、それにより、具体的には信号がローパスフィルタリングまたはハイパスフィルタリングされる場合、非常に厄介な異音を生じる可能性がある。   Prediction filters are known to be optimal from a Least-Mean-Square perspective, but do not always fully restore the audibility characteristics of the original multi-channel signal. For example, in the case of stereo coding, stereo image instability can occur, and sound jumps randomly between left and right. In addition, spectral nulls can cause instability and can be a filter that strays the frequency response at these frequencies. This can cause the filter to perform unnecessary amplification in certain areas, which can result in very nasty noise, particularly if the signal is low or high pass filtered.

本発明の目的は、オーディオ信号の知覚品質を向上させるマルチチャネル符号化の方法および装置を提供することである。本発明の他の目的は、低ビットレートにて上記の方法および装置を提供することである。   It is an object of the present invention to provide a multi-channel coding method and apparatus that improves the perceived quality of an audio signal. Another object of the present invention is to provide the above method and apparatus at a low bit rate.

上記の目的は、添付の特許請求の範囲による方法および装置によって達成される。一般的には、符号化器側において、異なるチャネルの信号は、1つの主信号に組み合わされる。1つが各チャネルについてであることが好ましい1セットの適応フィルタが導出される。フィルタが主信号に適用されるとき、フィルタは、知覚制約の下でそれぞれのチャネルの信号を再構築する。知覚制約は、ゲイン制約および/またはシェイプ制約である。ゲイン制約により、チャネル間の相対エネルギの保存が可能になり、一方、シェイプ制約により、たとえばスペクトル・ヌルの不必要なフィルタリングを回避することによって、ステレオ像の安定が可能になる。送信されるパラメータは、符号化形態にある主信号、およびやはり符号化されることが好ましい適応フィルタのパラメータである。受信機は、適応フィルタおよび可能であればいくつかの追加の処理を適用することによって、異なるチャネルの信号を再構築する。   The above objective is accomplished by a method and device according to the appended claims. In general, on the encoder side, signals from different channels are combined into one main signal. A set of adaptive filters is derived, preferably one for each channel. When the filter is applied to the main signal, the filter reconstructs the signal for each channel under perceptual constraints. Perceptual constraints are gain constraints and / or shape constraints. Gain constraints allow for the preservation of relative energy between channels, while shape constraints allow for stereo image stabilization, for example, by avoiding unnecessary filtering of spectral nulls. The transmitted parameters are the main signal in encoded form and the parameters of the adaptive filter that are also preferably encoded. The receiver reconstructs the signals on the different channels by applying an adaptive filter and possibly some additional processing.

本発明の利点は、オーディオ信号を復号したときの異音が低減されることである。また、必要な送信ビットレートが非常に低レベルに維持される。   An advantage of the present invention is that abnormal noise when an audio signal is decoded is reduced. Also, the required transmission bit rate is maintained at a very low level.

図1は、本発明の好適な実施形態に係る典型的なシステム1を示す図である。送信機10は、無線信号5を受信機20に送信することができるように、関連するハードウエアおよびソフトウエアを含むアンテナ12を備える。送信機10は、とりわけマルチチャネル符号化器14を備え、これは、いくつかの入力チャネル16の信号を無線送信に適切な出力信号に変換する。適切なマルチチャネル符号化器14の例については、後ほど詳細に説明する。入力チャネル16の信号は、たとえば、録音に係るディジタル表現のデータファイル、磁気テープ、あるいはオーディオのビニル・ディスク記録など、オーディオ信号記憶装置18から提供を受けることが可能である。入力チャネル16の信号は、たとえば、1セットのマクロフォン19から「ライブ」で提供されてもよい。オーディオ信号がすでにディジタル形式ではない場合には、マルチチャネル符号化器14に入る前にディジタル化される。   FIG. 1 is a diagram illustrating an exemplary system 1 according to a preferred embodiment of the present invention. The transmitter 10 includes an antenna 12 that includes associated hardware and software so that the radio signal 5 can be transmitted to the receiver 20. The transmitter 10 comprises, among other things, a multi-channel encoder 14, which converts several input channel 16 signals into output signals suitable for wireless transmission. An example of a suitable multi-channel encoder 14 will be described in detail later. The input channel 16 signal may be provided by an audio signal storage device 18, such as a digital representation data file for recording, a magnetic tape, or an audio vinyl disk recording. The signal on the input channel 16 may be provided “live” from a set of microphones 19, for example. If the audio signal is not already in digital form, it is digitized before entering multichannel encoder 14.

受信機20側では、関連するハードウエアおよびソフトウエアを有するアンテナ22が、ポリフォニック・オーディオ信号 (polyphonic audio signals) を表す無線信号5の実際の受信に対処する。ここでは、たとえばエラー訂正などの通常の機能が実施される。復号化器24が、受信された無線信号5を復号化し、それにより、搬送されたオーディオデータをいくつかの出力チャネル26の信号に変換する。出力信号は、たとえば、直ちに出力するためにスピーカ29に提供することができ、あるいは、任意の種類のオーディオ信号記憶装置28に記憶することができる。   On the receiver 20 side, an antenna 22 with associated hardware and software handles the actual reception of the radio signal 5 representing polyphonic audio signals. Here, normal functions such as error correction are implemented. A decoder 24 decodes the received radio signal 5, thereby converting the conveyed audio data into a number of output channel 26 signals. The output signal can be provided to the speaker 29 for immediate output, or can be stored in any type of audio signal storage device 28, for example.

システム1は、たとえば、電話会議システム、音声サービスあるいはその他のオーディオアプリケーションを提供するためのシステムでありうる。たとえば電話会議システムなどのいくつかのシステムでは、通信は、二重伝送方式でなければならず、一方、サービス・プロバイダから加入者への楽音の配信などは、基本的には一方向性伝送方式でよい。送信機10から受信機20への信号の送信は、異なる種類の電磁波、ケーブル、またはファイバ、あるいはその組合せによってなど、任意の他の手段によって実施することもできる。   The system 1 can be, for example, a system for providing a conference call system, voice service or other audio application. In some systems, such as teleconference systems, communication must be a dual transmission system, while the distribution of musical sounds from service providers to subscribers is basically a unidirectional transmission system. It's okay. Transmission of the signal from the transmitter 10 to the receiver 20 may be performed by any other means, such as by different types of electromagnetic waves, cables, or fibers, or combinations thereof.

図2aに、本発明によるマルチチャネル符号化器14の一実施形態を示す。いくつかのチャネル信号 c1, c2, ..., cN がそれぞれ、入力16:1〜16:Nにおいて受信される。   FIG. 2a shows one embodiment of a multi-channel encoder 14 according to the present invention. Several channel signals c1, c2,..., CN are received at inputs 16: 1 to 16: N, respectively.

チャネル信号は、線形結合部34に接続される。本実施形態では、すべてのチャネル信号が、モノラル信号xを形成するように共に合計される。しかし、純粋チャネル信号を含めて、チャネル信号の1または2以上の任意の所定の線形結合を代わりにしようしてもよい。しかし、純粋な和が、数学的な演算を最も簡単にする。モノラル信号xは、入力信号42としてチャネル・フィルタ・セクション130に加えられる。さらに、モノラル信号xは、モノラル信号xを表す符号化パラメータpxを提供するために、モノラル信号符号化器38に供給され、そこで符号化される。モノラル信号符号化器は、任意の適切なモノラル信号符号化技法に従って動作する。多くのそのような技法は、公知の技術を利用可能である。符号化技法の詳細は本発明の実施可能要件としては重要ではないので、説明を省略する。 The channel signal is connected to the linear combination unit 34. In this embodiment, all channel signals are summed together to form a monaural signal x. However, any predetermined linear combination of one or more of the channel signals may be used instead, including pure channel signals. But pure sums make mathematical operations the easiest. The monaural signal x is applied as input signal 42 to the channel filter section 130. Furthermore, the monaural signal x is supplied to a monaural signal encoder 38 and encoded there to provide an encoding parameter p x representing the monaural signal x. The monaural signal encoder operates according to any suitable monaural signal encoding technique. Many such techniques can utilize known techniques. The details of the encoding technique are not important as the enablement requirement of the present invention, and the description is omitted.

チャネル信号は、チャネル・フィルタ・セクション130にも接続される。本実施形態では、各チャネル信号は、それぞれのフィルタ適応化ユニット30:1〜30:Nに接続される。フィルタ適応化ユニットは、モノラル信号xに適用されるとき、それぞれのチャネル信号の再構築を実施する。フィルタ適応化ユニット30:1〜30:Nの係数は、知覚制約の下で最適化された本発明による。しかし、フィルタ適応化ユニット30:1〜30:Nの最適化係数は、2つ以上のチャネル信号の結合最適化において少なくとも部分的に得ることも可能である。   The channel signal is also connected to the channel filter section 130. In this embodiment, each channel signal is connected to a respective filter adaptation unit 30: 1 to 30: N. The filter adaptation unit performs the reconstruction of the respective channel signal when applied to the monaural signal x. The coefficients of the filter adaptation units 30: 1 to 30: N are according to the invention optimized under perceptual constraints. However, the optimization coefficients of the filter adaptation units 30: 1 to 30: N can also be obtained at least partly in the joint optimization of two or more channel signals.

チャネル・フィルタ・セクション130の出力は、Nセットのフィルタ・パラメータp1〜pNを備える。これらのフィルタ・パラメータp1〜pNは、通常、送信に適切であるように別々にまたは一緒に符号化される。フィルタ・パラメータp1〜pNおよびモノラル信号xは、すべてのチャネル信号の再構築を可能にするのに十分である。符号化フィルタ・パラメータp1〜pNおよびモノラル信号xを表す符号化パラメータpxは、本実施形態では、送信に容易であるように、マルチプレクサ40において、出力信号52に多重化される。 The output of the channel filter section 130 comprises N sets of filter parameters p 1 to p N. These filter parameters p 1 -p N are usually encoded separately or together as appropriate for transmission. The filter parameters p 1 to p N and the monaural signal x are sufficient to allow reconstruction of all channel signals. The encoding filter parameters p 1 to p N and the encoding parameter p x representing the monaural signal x are multiplexed with the output signal 52 in the multiplexer 40 in this embodiment so as to facilitate transmission.

図2bは、本発明によるマルチチャネル復号化器24の一実施形態を示す図である。図2bの復号化器24は、図2aの符号化器によって符号化されたマルチチャネル信号を復号するのに適切である。入力信号54が受信され、デマルチプレクサ56に提供され、デマルチプレクサ56は、入力信号を、モノラル信号xを表す符号化パラメータpxおよび符号化フィルタ・パラメータp1〜pNのいくつかのセットに分割する。 FIG. 2b is a diagram illustrating one embodiment of a multi-channel decoder 24 according to the present invention. The decoder 24 of FIG. 2b is suitable for decoding the multi-channel signal encoded by the encoder of FIG. 2a. An input signal 54 is received and provided to a demultiplexer 56, which demultiplexes the input signal into several sets of encoding parameters p x and encoding filter parameters p 1 -p N representing the mono signal x. To divide.

モノラル信号xを表す符号化パラメータpxは、モノラル信号復号化器64に提供され、そこで、モノラル信号xを表す符号化パラメータpxは、図2aにおいて使用された符号化技法と関連する任意の適切な復号技法に従って、複合モノラル信号x"を生成するために使用される。多くのそのような技法は、公知の技術を利用可能である。符号化技術の詳細は本発明の実施可能要件としては重要ではないため、説明を省略する。復号されたモノラル信号x"は、チャネル・フィルタ・セクション160に提供される。 A coding parameter p x representing the monaural signal x is provided to the monaural signal decoder 64, where the coding parameter p x representing the monaural signal x is any arbitrary associated with the coding technique used in FIG. 2a. According to a suitable decoding technique, it is used to generate a composite mono signal x ". Many such techniques are available for known techniques. Details of the encoding technique are as an operational requirement of the present invention. The description is omitted because it is not important. The decoded mono signal x ″ is provided to the channel filter section 160.

復号されたフィルタ・パラメータは、チャネル・フィルタ・セクション160にも提供され、そこで復号されて、チャネル・フィルタ60:1〜60:Nを確定するために使用される。そのように確定されたそれぞれのチャネル・フィルタ60:1〜60:Nは、復号されたモノラル信号x"に適用され、それにより、それぞれのチャネル信号c"1〜c"Nが再構築され、出力26:1〜26:Nにおいて提供される。 The decoded filter parameters are also provided to the channel filter section 160 where they are decoded and used to determine the channel filters 60: 1-60: N. Each channel filter 60: 1-60: N so determined is applied to the decoded mono signal x ", thereby reconstructing each channel signal c" 1- c " N , Provided at outputs 26: 1 to 26: N.

本開示のほとんどの実施形態において、モノラル信号が、符号化または復号においてチャネル信号を再生成するための主信号として使用される。しかし、一般的な手法では、チャネル信号の中から選択された任意の所定の線形結合が、主信号として使用されることが可能である。所定の線形結合の最適な選択肢は、実際の応用分野および実施に依存する。単一のチャネル信号が、可能なそのような所定の線形結合を構成することもできる。   In most embodiments of the present disclosure, a mono signal is used as the main signal for regenerating the channel signal in encoding or decoding. However, in a general approach, any predetermined linear combination selected from among the channel signals can be used as the main signal. The optimal choice for a given linear combination depends on the actual application field and implementation. A single channel signal may constitute such a predetermined linear combination.

本発明によるマルチチャネル符号化器14の他の実施形態が、図3aに示されている。同様の部分が、同様の参照符号によって表記され、相違点のみが以下において議論される。   Another embodiment of a multi-channel encoder 14 according to the present invention is shown in FIG. 3a. Similar parts are denoted by similar reference numerals, and only the differences are discussed below.

線形結合部34は、以前と同様に、チャネル信号の所定の線形結合をモノラル信号符号化器38に提供する。しかし、この実施形態では、モノラル信号xに関連付けられる信号は、代わりに、モノラル信号xを表す符号化パラメータpxの復号バージョンx"である。そのような構成は、閉ループ手法と呼ばれ、以下でさらに記述されるように、モノラル信号符号化の不正確さをある程度補償することを見込む。 The linear combiner 34 provides a predetermined linear combination of the channel signals to the monaural signal encoder 38 as before. However, in this embodiment, the signal associated with the monaural signal x is instead a decoded version x "of the encoding parameter p x representing the monaural signal x. Such a configuration is referred to as a closed loop approach and is described below. We expect to compensate to some extent for inaccuracies in monaural signal encoding, as further described in.

本実施形態の線形結合部34は、また、N-1の所定の線形結合c* 1-c*N-1においてチャネル信号を組み合わせ、これは、チャネル・フィルタ・セクション130への実際の入力信号として作用する。N-1の所定の線形結合c* 1-c*N-1は、互いに線形独立であるべきである。線形結合c* 1-c*N-1は、すべてのチャネル信号からの寄与を備えるとは限らない。「線形結合」という用語は、この文脈では、成分のファクタをゼロに設定することができる特別な場合をも備えるとして使用されるべきである。実際、最も簡単なセットアップでは、線形結合c* 1-c*N-1は、チャネル信号c1-cN-1に同一とすることができる。復号化器側において復号されたモノラル信号x"を使用することによって、元のチャネル信号を回復することができる。 The linear combination 34 of the present embodiment also combines the channel signals in N−1 predetermined linear combinations c * 1 −c * N−1 , which is the actual input signal to the channel filter section 130. Acts as The predetermined linear combinations c * 1 −c * N−1 of N−1 should be linearly independent of each other. The linear combination c * 1- c * N-1 does not necessarily have contributions from all channel signals. The term “linear combination” should be used in this context as also providing a special case where the component factor can be set to zero. In fact, in the most simple setup, linear combinations c * 1 -c * N-1 may be the same in the channel signal c 1 -c N-1. By using the monaural signal x "decoded at the decoder side, the original channel signal can be recovered.

修正されたチャネル信号は、この実施形態では、チャネル・フィルタ・セクション130にも接続され、修正チャネル信号に対応するN-1のセットのフィルタ係数が推測される。フィルタ適応化ユニット30:1〜30:Nの係数は、知覚制約に下で最適化された本発明による。   The modified channel signal is also connected to the channel filter section 130 in this embodiment, and N-1 sets of filter coefficients corresponding to the modified channel signal are inferred. The coefficients of the filter adaptation units 30: 1 to 30: N are according to the invention optimized under perceptual constraints.

チャネル・フィルタ・セクション130の出力は、N-1のセットのフィルタ・パラメータp* 1〜p* N-1を含む。これらのフィルタ・パラメータp* 1〜p* N-1は、通常、送信に最適であるように、別々にまたは共同して符号化される。符号化されたフィルタ・パラメータp* 1-p* N-1およびモノラル信号xを表す符号化パラメータpxは、本実施形態では、別々に送信される。 The output of the channel filter section 130 includes N-1 sets of filter parameters p * 1- p * N-1 . These filter parameters p * 1 ~p * N-1 is normally to be optimal for transmission are encoded separately or jointly. Encoding parameters p x representing encoded filter parameters p * 1 -p * N-1 and the mono signal x is, in this embodiment, is sent separately.

図3bは、本発明によるマルチチャネル復号化器24の他の実施形態を示す。図3bの復号化器は、図3aの符号化器によって符号化されたマルチチャネル信号を復号するのに適切である。モノラル信号xを表す符号化パラメータpxおよび1セットの符号化フィルタ・パラメータp* 1〜p* N-1が受信される。モノラル信号xを表す符号化パラメータpxは、以前の実施形態と同様にモノラル信号復号化器64において復号モノラル信号x"を生成するために使用される。フィルタ・パラメータp* 1〜p* N-1は、同様に、N-1の復号修正チャネル信号c* 1〜c* N-1を得るために、チャネル・フィルタ・セクション160に提供される。次いで、線形結合部74が、修正チャネル信号c* 1〜c* N-1および復号モノラル信号x"から再構築されたチャネル信号c"1〜c"Nを提供するために使用される。 FIG. 3b shows another embodiment of a multi-channel decoder 24 according to the present invention. The decoder of FIG. 3b is suitable for decoding the multi-channel signal encoded by the encoder of FIG. 3a. An encoding parameter p x representing the monaural signal x and a set of encoding filter parameters p * 1 to p * N−1 are received. The encoding parameter p x representing the monaural signal x is used in the monaural signal decoder 64 to generate the decoded monaural signal x ″ as in the previous embodiment. Filter parameters p * 1 to p * N −1 is also provided to the channel filter section 160 to obtain N−1 decoded modified channel signals c * 1 to c * N−1 , then linear combination 74 is applied to the modified channel Used to provide channel signals c " 1 to c" N reconstructed from signals c * 1 to c * N-1 and decoded monaural signal x ".

知覚制約の重要な関連性を理解するために、従来技術のフィルタ符号化の一例が、基本的には米国特許第5434948号を参照して、より詳細に記述される。このマルチチャネル符号化により、残差信号の送信が省略される場合、低ビットレートが可能になる。チャネル再構築フィルタを導出するために、LMSまたは重み付けLMSの概念に基づくエラー最小化手順が、フィルタの出力信号^c(n)が、対象信号c(n)に最適に整合するように、フィルタを計算する。   In order to understand the important relevance of perceptual constraints, an example of prior art filter coding is described in more detail, basically referring to US Pat. No. 5,434,948. This multi-channel coding allows a low bit rate when transmission of residual signals is omitted. In order to derive a channel reconstruction filter, an error minimization procedure based on the concept of LMS or weighted LMS ensures that the filter output signal ^ c (n) is optimally matched to the target signal c (n). Calculate

フィルタを計算するために、いくつかのエラー尺度を使用してもよい。平均2乗誤差または重み付け平均2乗誤差は周知であり、演算量が少なくて済む。LMSの手法によれば、「uc」が「無制約」を指すとして、フィルタ h c uc は、データの1つのフレームについて有効であり、対象信号とフィルタ出力との2乗誤差、すなわち差 ruc(n) = c(n) - ^cuc(n) の2乗を最小限に抑えるように選択される。ただし、nはデータ・フレームのサンプルの指標である。この誤差は、以下のように表される。 Several error measures may be used to calculate the filter. Mean square error or weighted mean square error is well known and requires a small amount of calculation. According to the LMS method, the filter h c uc is effective for one frame of data, and “uc” indicates “unconstrained”, and the square error between the target signal and the filter output, that is, the difference r uc (n) = c (n) -chosen to minimize the square of ^ c uc (n). Here, n is an index of data frame samples. This error is expressed as follows.

Figure 2007527543
Figure 2007527543

これにより、フィルタ係数ベクトル h c uc について以下の線形式システムが得られる。 As a result, the following linear system is obtained for the filter coefficient vector h c uc .

Figure 2007527543
Figure 2007527543

ただし、

Figure 2007527543
は、モノラル信号x(n)の対称共分散行列である。 However,
Figure 2007527543
Is the symmetric covariance matrix of the monaural signal x (n).

Figure 2007527543
Figure 2007527543

上式でrxcは、信号x(n)およびc(n)の相互相関のベクトルである。 In the above equation, rxc is a vector of cross-correlation between signals x (n) and c (n).

Figure 2007527543
Figure 2007527543

しかし、上述したように、知覚特性は、純粋な数学的最小化によって完全には決定されない可能性がある。   However, as mentioned above, the perceptual characteristics may not be completely determined by pure mathematical minimization.

マルチチャネル信号の1つの非常に重要な知覚特性は、エネルギー、および具体的にはマルチチャネル音声信号間の相対レベルである。従来技術の方法によるステレオ符号化の場合、音源が左から右に周期的にジャンプする厄介なステレオ像不安定性が、結果として生じる可能性がある。さらに、唯一のフィルタがステレオ符号化において必要とされるので、左および右の予測に対する直接的な制御が達成されない。本発明によれば、したがって、ゲイン制約が最適化手順中に使用されることが有利である。この文脈では、チャネルあたり1つのフィルタが基本的に必要であることに留意されたい(上記の図2aおよび図2b参照)。   One very important perceptual characteristic of a multichannel signal is the energy and specifically the relative level between the multichannel audio signals. In the case of stereo coding according to prior art methods, a troublesome stereo image instability in which the sound source jumps periodically from left to right can result. In addition, direct control over left and right predictions is not achieved because only one filter is required in stereo coding. According to the invention, it is therefore advantageous that gain constraints are used during the optimization procedure. Note that in this context, one filter per channel is essentially required (see FIGS. 2a and 2b above).

ある状況では、予測されたチャネルは、ある周波数より上または下の周波数内容を有さない可能性がある。これは、たとえば、チャネルがハイパスフィルタリングされる場合、または帯域分割手順から得られる場合に生じる。スペクトル・ヌルは、不安定性を生じて、不必要な増幅および低周波数の異音を生じるフィルタ応答をもたらす可能性がある。したがって、本発明によれば、シェイプ制約が、最適化手順中に使用されることが有利である。   In certain situations, the predicted channel may not have frequency content above or below a certain frequency. This occurs, for example, when the channel is high pass filtered or obtained from a band splitting procedure. Spectral nulls can cause instability and result in a filter response that results in unwanted amplification and low frequency noise. Thus, according to the present invention, shape constraints are advantageously used during the optimization procedure.

図4は、2つのチャネル(ステレオの場合)および線形フィルタ31を有する実施形態における、本発明による符号化器側の制約最小化手順の基本的概念を示す。フィルタ係数h c1を有するチャネルc1の制約に応答するフィルタ31が、最適化ユニット32において制約誤差最小化手順により導出される。フィルタh c1は、この実施形態では2つのチャネル信号c1およびc2の線形結合である組合せチャネル信号、すなわちモノラル信号x(n)を入力として取り入れ、

Figure 2007527543
これから、出力信号^c1(n)を導出する。ファクタγc1およびγc2は、チャネル信号がどのように組み合わされるかを決定する。1つの可能性は、γc1をファクタ2γに設定し、γc2を2(1−γ)に設定するものである。この場合、モノラル信号は、チャネルの重み付け和である。具体的には、適切なセッティングがγ=0.5であり、この場合、両チャネルとも、等しく重み付けされる。他の適切なセッティングは、γc1=−γc2とすることが可能であり、この場合、モノラル信号は、チャネル信号の差である。 FIG. 4 shows the basic concept of the encoder side constraint minimization procedure according to the invention in an embodiment with two channels (in the case of stereo) and a linear filter 31. A filter 31 responsive to the constraint of channel c1 with filter coefficient h c1 is derived in optimization unit 32 by a constraint error minimization procedure. The filter h c1 takes as input the combined channel signal, which in this embodiment is a linear combination of the two channel signals c1 and c2, ie the monaural signal x (n),
Figure 2007527543
From this, the output signal ^ c1 (n) is derived. The factors γ c1 and γ c2 determine how the channel signals are combined. One possibility is to set γ c1 to a factor 2γ and γ c2 to 2 (1-γ). In this case, the monaural signal is a weighted sum of the channels. Specifically, an appropriate setting is γ = 0.5, where both channels are equally weighted. Another suitable setting may be γ c1 = −γ c2 where the mono signal is the difference of the channel signals.

モノラル信号を形成するように個々のチャネル信号を重み付け組み合わせすることは、一般的に、それぞれのチャネル信号のフィルタリング済みバージョンの組合せとすることさえできる。そのような手法は、プリフィルタリングと呼ばれる。これは、手法が励起領域または一般的には重み付け信号領域において実施される場合、有用であることがある。たとえば、チャネルは、モノラル信号のLPC(線形予測コーディング)残差フィルタによってプリフィルタリングすることができる。   The weighted combination of individual channel signals to form a mono signal can generally even be a combination of filtered versions of each channel signal. Such an approach is called pre-filtering. This may be useful if the approach is implemented in the excitation domain or generally in the weighted signal domain. For example, the channel can be pre-filtered with an LPC (Linear Predictive Coding) residual filter of the mono signal.

以下において、モノならびに左チャネルおよび右チャネルは、一般に、実際のモノラル、左、右チャネルのいくつかのプリフィルタリング済みバージョンであると想定される。チャネルを回復するとき、モノラルLPC合成フィルタによるプリフィルタリングのステップが、信号領域に戻るために必要である。   In the following, the mono and left and right channels are generally assumed to be some pre-filtered versions of the actual mono, left and right channels. When recovering the channel, a pre-filtering step with a mono LPC synthesis filter is necessary to return to the signal domain.

以下において、場合γc1=1/2およびγc2=1/2が、より詳細に議論される。 In the following, the cases γ c1 = 1/2 and γ c2 = 1/2 will be discussed in more detail.

h c1がFIR(有限インパルス応答)フィルタである場合、^c1(n)は、信号x(n)の遅延バージョンの線形結合である。 If h c1 is a FIR (finite impulse response) filter, ^ c1 (n) is a linear combination of delayed versions of the signal x (n).

Figure 2007527543
Figure 2007527543

指標セットは、I=[iminKimax]である。フィルタ・パラメータp1は、フィルタ係数h c1を備え、フィルタを確定する必要な追加のデータである可能性がある。 The index set is I = [i min Ki max ]. The filter parameter p 1 may be the additional data needed to determine the filter with the filter coefficient h c1 .

たとえば米国第5434948号に開示されている符号化方法を適用する場合、2つのチャネル信号の差信号は、フィルタによって再生成される。図5において、右信号および左信号は、それぞれ曲線301および302によって示されている。表示は理想的ではなく、フレーム全体にわたって目標差よりわずかに大きな差を与えると想定する。これにより、復号化器側において元の右信号よりわずかに低い再生成右信号303が得られ、元の左信号よりわずかに高い再生成左信号304が得られる。そのような異音は、右チャネルのボリュームが減少し、左チャネルのボリュームが増大するものである。そのような異音がさらに時間について変化する場合、音は、右チャネルと左チャネルとの間において往復して揺動する。ゲイン制約が、そのような状況を改善することが可能である。   For example, when applying the encoding method disclosed in US Pat. No. 5,434,948, the difference signal of the two channel signals is regenerated by a filter. In FIG. 5, the right and left signals are indicated by curves 301 and 302, respectively. It is assumed that the display is not ideal and gives a slightly larger difference than the target difference over the entire frame. As a result, a regenerated right signal 303 slightly lower than the original right signal is obtained on the decoder side, and a regenerated left signal 304 slightly higher than the original left signal is obtained. Such abnormal noise is a decrease in the volume of the right channel and an increase in the volume of the left channel. If such an abnormal sound changes with time, the sound will swing back and forth between the right and left channels. Gain constraints can improve such situations.

ゲイン制約を実施するいくつかの方式がある。1つの可能な手法は、ハード制約、すなわち元のチャネルと評価チャネルとの間の正確なエネルギー整合を有する、または、元のチャネル信号エネルギーに必ずしも等しくない規定されたエネルギーEc1を出力チャネルが有するようなゆるいゲイン制約を課すものである。 There are several ways to implement gain constraints. One possible approach is to have a hard constraint, ie an exact energy match between the original channel and the evaluation channel, or the output channel has a defined energy E c1 that is not necessarily equal to the original channel signal energy. Such a loose gain constraint is imposed.

制約最小化の問題は、ラグランジュの方法、すなわちラグランジュ関数によって容易に解決することができる。   The problem of constraint minimization can be easily solved by the Lagrangian method, that is, the Lagrangian function.

Figure 2007527543
Figure 2007527543

最適な解は、フィルタh c1を与え、これは、次の無制約フィルタに比例する。 The optimal solution gives the filter h c1 , which is proportional to the next unconstrained filter.

Figure 2007527543
Figure 2007527543

比例ファクタは、以下のようになる。   The proportional factor is:

Figure 2007527543
Figure 2007527543

したがって、ゲイン制約フィルタは、
c1 gc=gc1 c1 uc
となる。
Therefore, the gain constraint filter is
h c1 gc = g c1 h c1 uc
It becomes.

本符号化原理が限定周波数帯域において使用される場合、チャネル信号は、図6の曲線305のように見える可能性がある。強度は、周波数f1より下、または周波数f2より上には存在しない。しかし、純粋な数学的最適化により、曲線306が生じ、これは、周波数f1およびf2よりそれぞれ下および上において、ある限定された電力も現れる。そのようなアーティファクトは知覚される。 If this coding principle is used in a limited frequency band, the channel signal may look like the curve 305 in FIG. The intensity does not exist below the frequency f 1 or above the frequency f 2 . However, pure mathematical optimization results in curve 306, which also manifests some limited power below and above frequencies f 1 and f 2 , respectively. Such artifacts are perceived.

あるスペクトル形状をフィルタに課すために、1セットの線形制約が、フィルタに課されなければならない。これらの制約は、一般に、フィルタの係数の数より小さい数であるべきである。   In order to impose a certain spectral shape on the filter, a set of linear constraints must be imposed on the filter. These constraints should generally be less than the number of filter coefficients.

たとえば、0kHzにおいてスペクトル・ヌルの制約を設定することを望む場合、適切な制約は以下のようになる。   For example, if it is desired to set a spectral null constraint at 0 kHz, a suitable constraint is:

Figure 2007527543
Figure 2007527543

一般に、制約の形状は、以下のように、行列およびベクトルによって定式化することができる。   In general, the shape of the constraint can be formulated by a matrix and a vector as follows:

Figure 2007527543
Figure 2007527543

制約最小2乗の理論から、これらの制約を満たす最適なフィルタは以下のようになる。   From the constraint least-squares theory, the optimal filter that satisfies these constraints is:

Figure 2007527543
Figure 2007527543

この制約は、チャネルがある周波数領域において周波数内容を有さないことが経験的に既知であるとき、特に有用である。   This constraint is particularly useful when it is empirically known that the channel has no frequency content in certain frequency regions.

ゲインおよびシェイプの制約は、組み合わせることもできる。そのような場合、以下に従って、シェイプ制約がまず適用され、次いで、ゲイン制約が、ファクタとして追加されることが好ましい。   Gain and shape constraints can also be combined. In such a case, it is preferred that the shape constraint is first applied and then the gain constraint is added as a factor according to the following.

Figure 2007527543
Figure 2007527543

フィルタは無制約フィルタに依存し、後者は従順であるので、c1(n)+c2(n)=2x(n)により、関係は、以下のようになる。   Since the filter depends on the unconstrained filter and the latter is obedient, the relationship is as follows by c1 (n) + c2 (n) = 2x (n).

Figure 2007527543
Figure 2007527543

ただし、δは、同一フィルタ (identity filter) を表す。2つのチャネルに対する制約が同一である場合、有用な特性をシェイプ制約フィルタについて導出することができる。   Here, δ represents the same filter (identity filter). If the constraints on the two channels are the same, useful properties can be derived for the shape constraint filter.

Figure 2007527543
Figure 2007527543

したがって、以下のようになる。 Therefore, it becomes as follows.

Figure 2007527543
Figure 2007527543

この式は、チャネル・フィルタを符号化するとき、ビットレートの低減には有用であるが、その理由は、チャネル・フィルタが、復号化器側において利用可能な量によって関係付けられることを示すからである。   This equation is useful for reducing the bit rate when coding the channel filter, because the channel filter is related by the amount available at the decoder side. It is.

シェイプ制約フィルタ間の関係は、フィルタの合理的な計算にも当てはまる。図7では、2つのチャネルc1、c2の一方のc1が、モノラル信号xを無制約フィルタ131に適用することによって再生成されることが示されている。無制約フィルタの結果は、シェイプ制約セクション132のシェイプ制約に応じて修正される。c1チャネルのシェイプ制約フィルタから、チャネルc2のシェイプ制約フィルタも計算して、各チャネルについてゲイン制約セクション133を分離するために提供することができる。   The relationship between shape constraint filters also applies to the rational calculation of filters. FIG. 7 shows that one of the two channels c 1 and c 2 is regenerated by applying the monaural signal x to the unconstrained filter 131. The result of the unconstrained filter is modified according to the shape constraints in the shape constraint section 132. From the c1 channel shape constraint filter, a channel c2 shape constraint filter may also be calculated and provided to separate the gain constraint section 133 for each channel.

シェイプ制約を適用するために副信号を使用する他の実施形態のより詳細なブロック方式が、図8に示されている。2つのチャネル信号c1およびc2は、線形結合部34の加算手段55、57において、モノラル信号xおよび副信号sに組み合わされる。チャネル・フィルタ・セクション130が、無制約パラメータ・フィルタ131を備え、これは、モノラル信号xに適用されて、副信号^sの評価を再生成する。無制約最適化ユニット33において、フィルタ係数は、sと^sとの間の最小差を与えるように適応される。このようにして得られるフィルタh s ucは、基本的には上記のさらなる議論に従って、シェイプ制約セクション132に提供される。副信号のシェイプ制約フィルタh s scが生成される。ステレオ応用分野におけるチャネル・フィルタ間の関係(1)から、副信号のシェイプ制約フィルタh s scに基づいて、各チャネル信号のシェイプ制約フィルタが計算される。係数ではなく、これらのフィルタが、それぞれの制約セクション133:1、133:2に提供される。各チャネル信号のゲインファクタが計算され、2つのフィルタは、パラメータ符号化セクション66に提供され、そこで、2つのフィルタのパラメータは共同して符号化される。 A more detailed block scheme of another embodiment that uses side signals to apply shape constraints is shown in FIG. The two channel signals c1 and c2 are combined into the monaural signal x and the sub signal s in the adding means 55 and 57 of the linear combination unit 34. The channel filter section 130 comprises an unconstrained parameter filter 131, which is applied to the monaural signal x to regenerate the evaluation of the side signal ^ s. In the unconstrained optimization unit 33, the filter coefficients are adapted to give a minimum difference between s and ^ s. The filter h s uc thus obtained is provided to the shape constraint section 132 basically according to the further discussion above. A side signal shape constraint filter h s sc is generated. From the relationship (1) between the channel filters in the stereo application field, the shape constraint filter of each channel signal is calculated based on the shape constraint filter h s sc of the sub signal. These filters, not coefficients, are provided in the respective constraint sections 133: 1, 133: 2. The gain factor for each channel signal is calculated and the two filters are provided to the parameter encoding section 66 where the parameters of the two filters are encoded jointly.

制約チャネル・フィルタh c1およびh c2を計算した後、これらは、受信機に送信されるように適切な表示において量子化され、符号化される。通常、フィルタの係数は、スカラまたはベクトルの量子化器を使用して量子化され、量子化器指標は送信される。量子化器は、特にこのシナリオにおいてビットレート低減に非常に有益である予測を実施することも可能である。 After computing the constrained channel filters h c1 and h c2 , they are quantized and encoded in an appropriate representation to be transmitted to the receiver. Typically, the filter coefficients are quantized using a scalar or vector quantizer and the quantizer index is transmitted. The quantizer can also perform predictions that are very beneficial for bit rate reduction, especially in this scenario.

フィルタの相補性を利用することにより、ビットレートをさらに低減することが可能であるが、その理由は、フィルタh c1またはh c2の一方だけまたはそれらの線形結合が、量子化されて送信され、一方、ゲインgc1およびgc2は、共同してベクトル量子化され、別々に送信されるからである。そのような送信は、たとえば1kbps程度に低いビットレートにおいて実施することができる。 By utilizing the complementarity of the filter, it is possible to further reduce the bit rate because only one of the filters h c1 or h c2 or their linear combination is quantized and transmitted, On the other hand, gains g c1 and g c2 are jointly vector quantized and transmitted separately. Such transmission can be carried out at a bit rate as low as 1 kbps, for example.

受信機は、送信されたモノラル信号およびチャネル・フィルタをまず復号する。次いで、受信機は、それぞれのチャネル・フィルタによりモノラル信号をフィルタリングすることによって、異なるチャネル信号を再生成する。ステレオの場合、相補性の特性が使用され、係数は、フィルタh c1およびh c2を生成するように再び組み合わされることが好ましい。 The receiver first decodes the transmitted monaural signal and channel filter. The receiver then regenerates a different channel signal by filtering the mono signal with the respective channel filter. In the case of stereo, the complementary property is used and the coefficients are preferably recombined to produce filters h c1 and h c2 .

再構築されたマルチチャネル信号の品質をさらに向上させるある後処理ステップが、異なるチャネル信号の再生成に続くことが可能である。   Certain post-processing steps that further improve the quality of the reconstructed multi-channel signal can follow the regeneration of the different channel signals.

ゲイン制約チャネル・フィルタを計算する前に、シェイプ制約フィルタまたはこれらのフィルタの線形結合のゲインを平滑化することが有益であることがある。   It may be beneficial to smooth the gain of the shape constrained filters or the linear combination of these filters before calculating the gain constrained channel filters.

たとえば、ステレオの場合、等価な副信号フィルタは、以下のようになり(図8において使用されるように)、   For example, for stereo, the equivalent sub-signal filter is as follows (as used in FIG. 8):

Figure 2007527543
Figure 2007527543

異音を低減するために、連続フレーム間のこのフィルタのゲイン差は平滑化され、以下のフィルタを得る。   In order to reduce abnormal noise, the gain difference of this filter between successive frames is smoothed to obtain the following filter:

Figure 2007527543
Figure 2007527543

次いで、チャネル・フィルタは、以下に従って修正される。   The channel filter is then modified according to the following.

Figure 2007527543
Figure 2007527543

このタイプの修正は、シェイプ制約を維持しないが、シェイプ制約は、副信号フィルタについて依然として維持され、これは、ステレオ・コーディングの場合に十分であることを容易に認識することができる。   Although this type of modification does not maintain the shape constraint, it can be readily recognized that the shape constraint is still maintained for the sub-signal filter, which is sufficient for stereo coding.

フィルタに対するゲイン制約は、以前に計算されたチャネル・エネルギ、すなわちEc1、Ec2を想定する。gc1、gc2などのフィルタのゲインを制御し、ゲインを限定することによって不必要な増幅を回避することが重要である。異なるチャネル信号の特性に応じて、チャネルが、全周波数範囲について、またはある周波数帯域において、反対相関されることが行われることが可能である。これにより、モノラル信号が形成されるとき、ある消去につながる。この場合、少なくとも部分的に、かついくつかの周波数帯域において、個々のチャネル情報は失われているので、チャネルゲインが0dBなどのある量より大きいとき、チャネルゲインを限定することが有益である。このゲイン制限を実施する1つの方式は、あるゲインファクタを計算することである。 The gain constraint for the filter assumes the previously calculated channel energy, ie E c1 , E c2 . It is important to avoid unnecessary amplification by controlling the gain of filters such as g c1 and g c2 and limiting the gain. Depending on the characteristics of the different channel signals, it can take place that the channels are cross-correlated for the entire frequency range or in a certain frequency band. This leads to some erasure when a monaural signal is formed. In this case, individual channel information is lost, at least in part and in some frequency bands, so it is beneficial to limit the channel gain when the channel gain is greater than some amount, such as 0 dB. One way to implement this gain limitation is to calculate a certain gain factor.

Figure 2007527543
Figure 2007527543

上式は、2つのチャネルが相関されていない場合、有効モノラル・チャネル・エネルギとモノラル・チャネルのエネルギとの比である。このファクタが0dBより小さいとき、信号消去を有する。この場合、gFは、この消去がどの程度厳密であるかを定量化する。次いで、ゲイン情報を以下のように計算することができる。 The above equation is the ratio of the effective mono channel energy to the mono channel energy when the two channels are not correlated. When this factor is less than 0 dB, it has signal cancellation. In this case, g F quantifies how severe this elimination is. The gain information can then be calculated as follows:

Figure 2007527543
Figure 2007527543

同じ制限が、他のチャネルのゲインに当てはまる。   The same restriction applies to the gain of other channels.

チャネル・フィルタ・パラメータだけが、符号化されて送信される必要があるのではなく、モノラル信号も必要である。チャネル・フィルタ係数を導出するとき、モノラル信号音声符号化を考慮する2つの異なる原理の手法がある。   Not only the channel filter parameters need to be encoded and transmitted, but also a mono signal. When deriving channel filter coefficients, there are two different principle approaches that take into account monaural signal speech coding.

開ループ方式では、フィルタは、元のモノラル信号に基づいて導出される。これは、たとえば、信号42が元のモノラル信号xである図2aの場合である。しかし、復号化器は、量子化されたモノラル信号をチャネルフィルタの入力として使用する。   In the open loop scheme, the filter is derived based on the original mono signal. This is the case for example in FIG. 2a, where the signal 42 is the original monaural signal x. However, the decoder uses the quantized monaural signal as the input of the channel filter.

閉ループ方式では、フィルタの計算は、コード化され、したがってすでに量子化されたモノラル信号に基づく。これは、たとえば、信号44が符号化されたモノラル信号x"である図3aの場合である。この手法は、チャネル・フィルタ設計が、最適な可能な方式でそれぞれのチャネル信号を整合させることだけを目的とするのではないという利点を有する。この手法は、モノラル信号符号化の結果である符号化誤差を軽減することも目的とする。   In the closed-loop scheme, the filter calculation is based on a monaural signal that has been coded and thus already quantized. This is the case, for example, in FIG. 3a, where the signal 44 is an encoded mono signal x ". This approach only allows the channel filter design to match each channel signal in an optimally possible manner. This technique is also aimed at reducing the coding error resulting from the monaural signal coding.

これまで記述された原理は、完全スペクトル、すなわち完全帯域信号に適用可能である。しかし、これは、信号のサブ・バンドに適用可能であることが、同様に、またはさらに有益である。図9は、サブ・バンド処理の原理を示す。いくつかのチャネルc1〜cNが、Kのサブ・バンドSB1、SB2、SBkにおいてそれぞれ分割される。各サブ・バンドのチャネル信号は、それぞれのマルチチャネル符号化部80:1〜80:Kに出力され、そこで、チャネル信号は符号化される。マルチチャネル符号化部80:1〜80:Kの1つまたはいくつかは、本発明によるマルチチャネル符号化部とすることができる。ビットストリーム・コンバイナ82が、符号化信号を共通符号化信号53に組み合わせ、これが送信される。 The principles described so far are applicable to full spectrum, ie full band signals. However, it is equally or more beneficial that this is applicable to the signal sub-bands. FIG. 9 illustrates the principle of sub-band processing. Several channels c 1 to c N are respectively divided in the K sub-bands SB1, SB2 and SBk. Each sub-band channel signal is output to a respective multi-channel encoder 80: 1-80: K, where the channel signal is encoded. One or several of the multi-channel encoders 80: 1 to 80: K may be multi-channel encoders according to the present invention. A bitstream combiner 82 combines the encoded signal with the common encoded signal 53, which is transmitted.

上述されたサブ・バンド処理の利点は、異なるサブチャネルのマルチチャネル符号化を個々に実施して、たとえば割当てビットレート、処理フレーム・サイズ、およびサンプリングレートに関して最適化することができることである。   An advantage of the sub-band processing described above is that multi-channel coding of different sub-channels can be performed individually and optimized, for example with respect to allocation bit rate, processing frame size, and sampling rate.

1つの特別な種類のサブ・バンド処理は、たとえば200Hzより小さい非常に低い周波数についてマルチチャネル符号化を実施しない。これは、この非常に低い周波数帯域では、単なるモノラル信号が送信されることを意味する。この原理は、人のステレオ知覚が、非常に低い周波数では鋭敏さが劣るということを利用する。従来技術およびサブウーフィングから既知である。   One special type of sub-band processing does not perform multi-channel coding for very low frequencies, eg, below 200 Hz. This means that a simple monaural signal is transmitted in this very low frequency band. This principle takes advantage of the fact that human stereo perception is less sensitive at very low frequencies. Known from prior art and subwoofers.

サブ・バンド処理の他の実施形態では、バンド分割は、たとえば、信号を信号周波数成分に分解することを可能にする短時間フーリエ変換(STFT)などの時間周波数変換を使用して実施される。この場合、フィルタリングは、モノラル信号の個々のスペクトル係数と複素係数の単なる乗算になる。   In other embodiments of sub-band processing, band splitting is performed using a time-frequency transform, such as a short-time Fourier transform (STFT) that allows the signal to be decomposed into signal frequency components, for example. In this case, the filtering is simply a multiplication of the individual spectral coefficients of the monaural signal and the complex coefficients.

本発明によるパラメータ・マルチチャネル・コーディング方法は、信号サンプルの固定フレーム処理を通常含む。すなわち、マルチチャネル像を記述するパラメータが導出され、20msなどの符号化フレーム長に対応するレートにて送信される。しかし、パラメータは、符号化フレーム長よりはるかに長い信号フレームから得ることが可能である。適切な選択肢は、そのような分析フレームの長さを、符号化フレーム長より長い値に設定することである。これは、パラメータ計算が、重なり分析フレームで実施されることを示す。   The parametric multi-channel coding method according to the present invention typically includes fixed frame processing of signal samples. That is, parameters describing the multi-channel image are derived and transmitted at a rate corresponding to the encoded frame length such as 20 ms. However, the parameters can be obtained from signal frames that are much longer than the coding frame length. A suitable option is to set the length of such an analysis frame to a value longer than the encoded frame length. This indicates that the parameter calculation is performed in the overlap analysis frame.

これは、図10に示されている。符号化器の分析フレーム83が、図の上部に示されるように、符号化フレーム84よりわずかに長い。そのような重なり分析フレームの結果、パラメータは滑らかに推移する。これは、安定したマルチチャネル音声信号像を提供するために必須である。同じことが、図の中央に示されるように、復号化器側において実施される。したがって、復号化器において、これを考慮して、図の底部において示されるように、合成フレーム85に窓を付けて、重なり86を有して重複追加することが必須である。これにより、各フレームに関連付けられるフィルタ間を滑らかに移行することが可能になる。   This is illustrated in FIG. The encoder analysis frame 83 is slightly longer than the encoding frame 84, as shown at the top of the figure. As a result of such an overlap analysis frame, the parameters transition smoothly. This is essential for providing a stable multi-channel audio signal image. The same is performed at the decoder side, as shown in the middle of the figure. Therefore, in consideration of this, it is indispensable for the decoder to add a duplication with an overlap 86 by adding a window to the synthesized frame 85 as shown at the bottom of the figure. This makes it possible to smoothly transition between filters associated with each frame.

また符号化器において、平滑フィルタ・パラメータの展開を強化することができる。たとえば、低域通過または中間ろ過をフィルタ・パラメータに適用することが可能である。   In the encoder, the development of smoothing filter parameters can be enhanced. For example, low pass or intermediate filtration can be applied to the filter parameters.

従来技術のモノラル音声コーデック、ならびにスピーチ・コーデックは、符号化ノイズのいわゆるノイズシェイピングを実施する。この動作の目的は、信号が高いスペクトル密度を有し、したがって、雑音をより聞こえないようにする周波数に符号化ノイズを移動させることである。ノイズシェイピングは通常、適応的に実施される、すなわち、音声信号に応答して実施される。これは、一般に、モノラル信号に対して実施されるノイズシェイピングは、様々なチャネル信号に必要とされるものとは異なることを意味する。その結果、モノラル音声コーデックにおける適切なノイズシェイピングにもかかわらず、本発明によるその後のチャネルフィルタリングは、モノラル信号の可聴符号化ノイズと比較するとき、再構築されたマルチチャネル信号において可聴符号化の宇治を増大させることになる可能性がある。   Prior art mono speech codecs, as well as speech codecs, perform so-called noise shaping of coding noise. The purpose of this operation is to move the coding noise to a frequency where the signal has a high spectral density and thus makes the noise less audible. Noise shaping is usually performed adaptively, i.e. in response to an audio signal. This generally means that the noise shaping performed on a mono signal is different from that required for various channel signals. As a result, despite proper noise shaping in the mono speech codec, the subsequent channel filtering according to the present invention can be applied to the audible coding of the reconstructed multi-channel signal when compared to the audible coding noise of the mono signal. May increase.

この問題を軽減するために、信号適応ポストフィルタを、受信機の後処理ステップにおいて再構築チャネル信号に適用することが可能である。この場合、任意の従来技術のポストフィルタリング技法を使用することができ、これは、スペクトルの山を強調し、またはスペクトルの谷を深くし、それにより、可聴雑音を低減する。そのような技法の一例が、E.エクデン(Ekudden)らによる欧州特許0965123B1に記載されている。他の簡単な方法は、音声符号化で知られているいわゆるピッチ・ポストフィルタおよびフォルマント・ポストフィルタである。   To alleviate this problem, a signal adaptive post filter can be applied to the reconstructed channel signal in the receiver post-processing step. In this case, any prior art post-filtering technique can be used, which emphasizes spectral peaks or deepens spectral valleys, thereby reducing audible noise. An example of such a technique is E.I. It is described in European Patent 0965123B1 by Ekudden et al. Another simple method is the so-called pitch postfilter and formant postfilter known from speech coding.

図11において、本発明による符号化方法の一実施形態の主要ステップが、フローチャートにより示されている。手順は、ステップ200において開始される。ステップ220において、マルチチャネル信号から推測される好ましくはモノラル信号である主信号が、符号化される。ステップ222において、フィルタ係数が、主信号に適用されるとき、チャネル信号の可能な限り良好な表示を与えるように最適化される。最適化は、知覚制約の下で行われる。次いで、最適係数は、ステップ224において符号化される。手順は、ステップ299において終了する。   In FIG. 11, the main steps of one embodiment of the encoding method according to the invention are shown in a flowchart. The procedure begins at step 200. In step 220, the main signal, preferably a monaural signal inferred from the multi-channel signal, is encoded. In step 222, the filter coefficients are optimized to give the best possible representation of the channel signal when applied to the main signal. Optimization is performed under perceptual constraints. The optimal coefficients are then encoded at step 224. The procedure ends at step 299.

上述した実施形態は、本発明のいくつかの例示として理解されるべきである。当業者であれば、上述の実施形態に対して様々な修正、組合せ、変更を、本発明の範囲から逸脱することなく行うことが可能であろう。具体的には、異なる実施形態の異なる部分的解決法を、技術的に可能であれば、他の構成において組み合わせることができる。いずれにせよ、本発明の範囲は添付の特許請求の範囲によって定義される。   The above-described embodiments should be understood as some examples of the invention. Those skilled in the art will be able to make various modifications, combinations and changes to the above-described embodiments without departing from the scope of the present invention. In particular, different partial solutions of different embodiments can be combined in other configurations where technically possible. In any case, the scope of the present invention is defined by the appended claims.

マルチチャネル信号を送信するシステムのブロック図である。1 is a block diagram of a system for transmitting a multi-channel signal. 本発明による送信機における符号化器の一実施形態のブロック図である。FIG. 4 is a block diagram of an embodiment of an encoder in a transmitter according to the present invention. 本発明による受信機における復号化器の一実施形態のブロック図である。FIG. 4 is a block diagram of an embodiment of a decoder in a receiver according to the present invention. 本発明による送信機における符号化器の他の実施形態のブロック図である。FIG. 6 is a block diagram of another embodiment of an encoder in a transmitter according to the present invention. 本発明による受信機における復号化器の他の実施形態のブロック図である。FIG. 6 is a block diagram of another embodiment of a decoder in a receiver according to the present invention. 本発明によるフィルタ適応化ユニットの一実施形態のブロック図である。FIG. 4 is a block diagram of an embodiment of a filter adaptation unit according to the present invention. 従来技術のシステムにおける副信号の不十分な再生成の影響を示す図である。FIG. 6 illustrates the effect of insufficient regeneration of sub-signals in a prior art system. 従来技術のシステムにおけるスペクトル・ヌルの影響を示す図である。It is a figure which shows the influence of the spectrum null in the system of a prior art. 本発明によるチャネル・フィルタ・セクションにおける組合せ可能性を示すブロック図である。FIG. 6 is a block diagram illustrating combinability in a channel filter section according to the present invention. ステレオ信号の部分組合せ符号化を使用する符号化器の一実施形態のブロック図である。FIG. 3 is a block diagram of an embodiment of an encoder that uses partial combinatorial coding of stereo signals. 周波数サブ・バンドにおける分割の使用を示すブロック図である。FIG. 6 is a block diagram illustrating the use of division in frequency sub-bands. 符号化および復号の重なり分析を示す複合図である。It is a compound figure which shows the overlap analysis of encoding and decoding. 本発明による符号化方法の一実施形態の基本的なステップのフローチャートである。4 is a flowchart of basic steps of an embodiment of an encoding method according to the present invention;

Claims (18)

少なくとも第1チャネルおよび第2チャネルを有するマルチチャネル信号 (c1〜cN) を符号化するための方法であって、
前記マルチチャネル信号 (c1〜cN) の信号の第1所定線形結合である主信号 (x) を表す符号化パラメータ (px) を生成するステップと、
第1適応フィルタ (31; 131, 132, 133:1-2) の最適パラメータ (p1〜pN) を導出するステップと、
前記最適パラメータ (p1〜pN) を符号化するステップと
を有し、
少なくとも第2適応フィルタ (31; 131, 132, 133:1-2) の最適パラメータ (p1〜pN) を導出するステップを更に有し、
前記第1適応フィルタ (31; 131, 132, 133:1-2) が前記第1所定線形結合 (x) に適用されるとき、前記第1適応フィルタ (31; 131, 132, 133:1-2) は、前記第1チャネル (c1〜cN) の信号とフィルタ出力信号との最小差を与えるように導出され、
当該最小差は、第1の基準に従って確定され、
前記第2適応フィルタが前記第1所定線形結合 (x) に適用されるとき、前記第2適応フィルタは、前記第2チャネル (c1〜cN) の信号とフィルタ出力信号との最小差を与えるように導出され、
当該最小差は、第2の基準に従って確定され、
前記第1および第2適応フィルタ (31;131、132、133:1〜2) の各導出ステップは、ゲイン制約およびシェイプ制約の群から選択される少なくとも1つの知覚制約の下で実行される
ことを特徴とする方法。
A method for encoding a multi-channel signal (c 1 -c N ) having at least a first channel and a second channel, comprising:
Generating a coding parameter (p x ) representing a main signal (x) that is a first predetermined linear combination of signals of the multichannel signals (c 1 to c N );
Deriving optimal parameters (p 1 to p N ) of the first adaptive filter (31; 131, 132, 133: 1-2);
Encoding the optimal parameters (p 1 to p N ),
Further comprising deriving optimal parameters (p 1 to p N ) of at least the second adaptive filter (31; 131, 132, 133: 1-2);
When the first adaptive filter (31; 131, 132, 133: 1-2) is applied to the first predetermined linear combination (x), the first adaptive filter (31; 131, 132, 133: 1- 2) is derived to give the minimum difference between the signal of the first channel (c 1 to c N ) and the filter output signal,
The minimum difference is determined according to the first criterion,
When the second adaptive filter is applied to the first predetermined linear combination (x), the second adaptive filter calculates a minimum difference between the signal of the second channel (c 1 to c N ) and the filter output signal. Derived to give,
The minimum difference is determined according to the second criterion,
Each derivation step of the first and second adaptive filters (31; 131,132,133: 1-2) is performed under at least one perceptual constraint selected from the group of gain constraints and shape constraints A method characterized by.
前記第1の基準および前記第2の基準の少なくとも一方は、Least-Mean-Square (LMS) 基準であることを特徴とする請求項1に記載の方法。   The method of claim 1, wherein at least one of the first criterion and the second criterion is a Least-Mean-Square (LMS) criterion. 前記知覚制約は、少なくともゲイン制約であり、前記第1チャネルの信号の全エネルギーに等しい前記フィルタ出力信号の全エネルギーを与えることを目的とすることを特徴とする請求項1または2に記載の方法。   Method according to claim 1 or 2, characterized in that the perceptual constraint is at least a gain constraint and is intended to give the total energy of the filter output signal equal to the total energy of the signal of the first channel. . 前記ゲイン制約は、絶対制約 (absolute constraint)であり、前記適応フィルタ出力信号の前記全エネルギーが、対応するチャネルの信号の全エネルギーに等しいことを要求することを特徴とする請求項3に記載の方法。   4. The gain constraint of claim 3, wherein the gain constraint is an absolute constraint and requires that the total energy of the adaptive filter output signal is equal to the total energy of the corresponding channel signal. Method. 前記ゲイン制約は、軟制約 (soft constraint) であり、適応フィルタが、対応するチャネルの信号の全エネルギーに近い前記適応フィルタ出力信号の前記全エネルギーを与えることを支持することを特徴とする請求項3に記載の方法。   The gain constraint is a soft constraint, supporting that the adaptive filter provides the total energy of the adaptive filter output signal close to the total energy of the signal of the corresponding channel. 3. The method according to 3. 前記ゲイン制約は、ゲイン制約を有さずに導出されたフィルタが乗算されたゲインファクタ (gc1〜gcN) として課されることを特徴とする請求項3に記載の方法。 4. The method of claim 3, wherein the gain constraint is imposed as a gain factor (g c1 to g cN ) multiplied by a filter derived without having a gain constraint. 前記ゲイン制約フィルタ h c gcは、次式によって与えられることを特徴とする請求項6に記載の方法。
Figure 2007527543
ただし、h c ucは、ゲイン制約を有さずに導出された適応フィルタ、Ecは適応フィルタ出力信号の規定エネルギー、^cuc(n)はゲイン制約を有さない主信号x (n) の適応フィルタ出力である。
The method of claim 6, wherein the gain constraint filter h c gc is given by:
Figure 2007527543
Where h c uc is an adaptive filter derived without gain constraints, E c is the specified energy of the adaptive filter output signal, and ^ c uc (n) is the main signal x (n) without gain constraints Is an adaptive filter output.
前記知覚制約は、少なくともシェイプ制約であり、前記適応フィルタに対し所定のスペクトル形状を課すことを特徴とする請求項1から7までのいずれかに記載の方法。   The method according to claim 1, wherein the perceptual constraint is at least a shape constraint and imposes a predetermined spectral shape on the adaptive filter. 前記シェイプ制約は、所定の周波数範囲においてヌル内容を課すことを特徴とする請求項8に記載の方法。   The method of claim 8, wherein the shape constraint imposes null content in a predetermined frequency range. 前記最適パラメータ (p1〜pN) を符号化する前記ステップは、前記第1および第2フィルタの前記最適パラメータを一緒に符号化することを特徴とする請求項1から9までのいずれかに記載の方法。 It said step of encoding the optimal parameters (p 1 ~p N) is in any one of claims 1 to 9, characterized in that encode together said optimal parameters of said first and second filters The method described. パラメータを導出する前記ステップは、
前記マルチチャネル信号 (c1〜cN) の信号の第2所定線形結合 (s; c* 1〜c* N-1) を生成するステップと、
第3フィルタが、前記シェイプ制約の下で前記第1所定線形結合に対して適用されるとき、前記第2所定線形結合と前記フィルタ出力信号との間の最小差を与えるように前記第3フィルタのパラメータを導出するステップと、
前記第1および第2フィルタの前記最適パラメータを前記第3フィルタの最適パラメータの関数として計算するステップと
を含むことを特徴とする請求項1から10までのいずれかに記載の方法。
Said step of deriving parameters comprises:
Generating a; (c * 1 ~c * N -1 s), the multi-channel signal a second predetermined linear combination of (c 1 ~c N) of the signal
When the third filter is applied to the first predetermined linear combination under the shape constraint, the third filter is configured to provide a minimum difference between the second predetermined linear combination and the filter output signal. Deriving parameters of
11. The method according to claim 1, comprising calculating the optimal parameters of the first and second filters as a function of the optimal parameters of the third filter.
パラメータを導出する前記ステップは、前記主信号 (x) を表す前記符号化パラメータ (px) に基づいて実行されることを特徴とする請求項1から11までのいずれかに記載の方法。 Step A method according to any one of claims 1 to 11, wherein said be performed based on the encoding parameters (p x) representing the main signal (x) to derive the parameters. パラメータを導出する前記ステップは、前記第1所定線形結合 (x) に基づいて実行されることを特徴とする請求項1から11までのいずれかに記載の方法。   12. A method according to any of the preceding claims, wherein the step of deriving parameters is performed based on the first predetermined linear combination (x). 前記マルチチャネル信号は、3つ以上のチャネルを有し、前記主信号は、前記3つ以上のチャネルのすべての第1所定線形結合 (x) に基づくものであり、各チャネルの信号は、前記知覚制約の下で最適化された別々の適応フィルタによって表されることを特徴とする請求項1から13までのいずれかに記載の方法。   The multi-channel signal has three or more channels, and the main signal is based on all first predetermined linear combinations (x) of the three or more channels, and the signal of each channel is 14. A method according to any of claims 1 to 13, characterized in that it is represented by a separate adaptive filter optimized under perceptual constraints. 主信号を表す符号化パラメータ (px) および第1適応フィルタ (60:1〜60:N) の符号化最適パラメータを有するポリフォニック信号を復号化するための方法であって、
前記主信号を表す前記符号化パラメータ (px) を復号化するステップと、
前記第1適応フィルタ (60:1〜60:N) を前記復号された主信号 (x") に適用することによって、第1チャネル (c"1〜c"N) の信号を生成するステップと
を有し、
前記符号化パラメータ (px) は、第2適応フィルタ (60:1〜60:N) の符号化最適パラメータをさらに表し、
前記第2適応フィルタ (60:1〜60:N) を前記復号された主信号 (x") に適用することによって、第2チャネル (c"1〜c"N) の信号を生成するステップを更に有し、
前記第1および第2適応フィルタ (30:1〜30:N) は、ゲイン制約およびシェイプ制約の群から選択される少なくとも1つの知覚制約の下で最適化される
ことを特徴とする方法。
A method for decoding a polyphonic signal having a coding parameter (p x ) representing a main signal and a coding optimal parameter of a first adaptive filter (60: 1 to 60: N) comprising:
Decoding the encoding parameter (p x ) representing the main signal;
Applying the first adaptive filter (60: 1 to 60: N) to the decoded main signal (x ") to generate a signal of a first channel (c" 1 to c " N ); Have
The encoding parameter (p x ) further represents an encoding optimal parameter of the second adaptive filter (60: 1 to 60: N),
Applying the second adaptive filter (60: 1 to 60: N) to the decoded main signal (x ") to generate a signal of a second channel (c" 1 to c " N ); In addition,
The method wherein the first and second adaptive filters (30: 1 to 30: N) are optimized under at least one perceptual constraint selected from a group of gain constraints and shape constraints.
復号化された前記主信号 (x") と前記第1チャネル (c"1〜c"N) の信号との所定の線形組み合わせとして、第2チャネル (c"1〜c"N) の信号を生成するステップを有することを特徴とする請求項15に記載の方法。 As a predetermined linear combination of the decoded main signal (x ") and the first channel (c" 1 to c " N ), the second channel (c" 1 to c " N ) The method of claim 15, comprising generating. 少なくとも第1チャネルおよび第2チャネルを備えるマルチチャネル信号 (c1〜cN) を入力する入力手段 (16:1〜16:N) と、
前記入力手段 (16:1〜16:N) に接続され、前記マルチチャネル信号 (c1〜cN) の信号の第1所定線形組み合わせである主信号 (x) を表す符号化パラメータ (px) を生成する手段 (38) と、
第1適応フィルタの最適パラメータを導出する手段 (31; 131, 132, 133:1-2) と、
前記最適パラメータを符号化する手段 (66) と、
出力手段 (52) と
を有し、
第2適応フィルタの最適パラメータを導出する手段 (31; 131, 132, 133:1-2) を更に有し、
前記第1適応フィルタが前記第1所定線形結合 (x) に適用されるとき、前記第1適応フィルタは、前記第1チャネル (c1〜cN) の信号とフィルタ出力信号との最小差を与え、
当該最小差は、第1の基準に従って確定され、
前記第2適応フィルタが前記第1所定線形結合 (x) に対して適用されるとき、前記第2適応フィルタは、前記第2チャネル (c1〜cN) の信号とフィルタ出力信号との最小差を与え、
当該最小差は、第2の基準に従って確定され、
前記第1および第2適応フィルタの最適パラメータを導出する各手段 (31; 131, 132, 133:1-2) は、ゲイン制約およびシェイプ制約の群から選択される少なくとも1つの知覚制約の下で前記最適パラメータを導出するように構成される
ことを特徴とする符号化装置 (14) 。
Input means (16: 1 to 16: N) for inputting a multi-channel signal (c 1 to c N ) comprising at least a first channel and a second channel;
An encoding parameter (p x ) connected to the input means (16: 1 to 16: N) and representing a main signal (x) that is a first predetermined linear combination of the signals of the multichannel signals (c 1 to c N ). ) (38)
Means for deriving optimal parameters of the first adaptive filter (31; 131, 132, 133: 1-2);
Means (66) for encoding said optimal parameters;
Output means (52) and
Means (31; 131, 132, 133: 1-2) for deriving optimal parameters of the second adaptive filter;
When the first adaptive filter is applied to the first predetermined linear combination (x), the first adaptive filter calculates a minimum difference between the signal of the first channel (c 1 to c N ) and the filter output signal. Give,
The minimum difference is determined according to the first criterion,
When the second adaptive filter is applied to the first predetermined linear combination (x), the second adaptive filter is the minimum of the signal of the second channel (c 1 to c N ) and the filter output signal. Give the difference
The minimum difference is determined according to a second criterion,
Each means (31; 131, 132, 133: 1-2) for deriving optimal parameters of the first and second adaptive filters is subject to at least one perceptual constraint selected from a group of gain constraints and shape constraints. An encoding device (14), which is configured to derive the optimum parameter.
主信号 (x) を表す符号化パラメータおよび第1適応フィルタの符号化最適パラメータを入力する入力手段 (54) と、
主信号 (x) を表す前記符号化パラメータ (px) を復号化する手段 (64) と、
前記第1適応フィルタを復号された前記主信号 (x") に適用することによって、第1チャネルの信号を生成する手段 (60:1〜60:N) と
を有し、
前記符号化パラメータ (px) が、第2適応フィルタ (60:1〜60:N) の符号化最適パラメータをさらに表し、
前記第2適応フィルタを復号された前記主信号 (x") に適用することによって、第2チャネルの信号を生成する手段を更に有し、
前記第1および第2適応フィルタは、ゲイン制約およびシェイプ制約の群から選択される少なくとも1つの知覚制約の下で制約される
ことを特徴とする復号化装置 (24) 。
Input means (54) for inputting a coding parameter representing the main signal (x) and a coding optimum parameter of the first adaptive filter;
Means (64) for decoding the encoding parameter (p x ) representing the main signal (x);
Means (60: 1 to 60: N) for generating a first channel signal by applying the first adaptive filter to the decoded main signal (x ");
The encoding parameter (p x ) further represents an encoding optimal parameter of the second adaptive filter (60: 1 to 60: N);
Means for generating a second channel signal by applying the second adaptive filter to the decoded main signal (x ");
The decoding device (24), wherein the first and second adaptive filters are constrained under at least one perceptual constraint selected from a group of a gain constraint and a shape constraint.
JP2006518597A 2003-12-19 2004-12-15 Constrained filter coding of polyphonic signals Expired - Fee Related JP4323520B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE0303499A SE0303499D0 (en) 2003-12-19 2003-12-19 Multi-channel coding using gain-shape constrained filters
SE0400415A SE527713C2 (en) 2003-12-19 2004-02-20 Coding of polyphonic signals with conditional filters
PCT/SE2004/001907 WO2005059901A1 (en) 2003-12-19 2004-12-15 Constrained filter encoding of polyphonic signals

Publications (2)

Publication Number Publication Date
JP2007527543A true JP2007527543A (en) 2007-09-27
JP4323520B2 JP4323520B2 (en) 2009-09-02

Family

ID=31996352

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006518597A Expired - Fee Related JP4323520B2 (en) 2003-12-19 2004-12-15 Constrained filter coding of polyphonic signals

Country Status (8)

Country Link
EP (2) EP2456236A1 (en)
JP (1) JP4323520B2 (en)
DK (1) DK1639580T3 (en)
ES (1) ES2439693T3 (en)
PL (1) PL1639580T3 (en)
PT (1) PT1639580E (en)
SE (1) SE527713C2 (en)
WO (1) WO2005059901A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2008016098A1 (en) * 2006-08-04 2009-12-24 パナソニック株式会社 Stereo speech coding apparatus, stereo speech decoding apparatus, and methods thereof
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434948A (en) 1989-06-15 1995-07-18 British Telecommunications Public Limited Company Polyphonic coding
NL9100173A (en) 1991-02-01 1992-09-01 Philips Nv SUBBAND CODING DEVICE, AND A TRANSMITTER EQUIPPED WITH THE CODING DEVICE.
US5285498A (en) 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
SE9700772D0 (en) 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
WO2003009206A1 (en) * 2001-07-19 2003-01-30 Sungwoo Kim The system and operational method of mobile telecommunication device for electronic cash
WO2003009208A1 (en) * 2001-07-20 2003-01-30 Medical Research Group Method and apparatus for communicating between an ambulatory medical device and a control device via telemetry using randomized data
ATE354161T1 (en) 2002-04-22 2007-03-15 Koninkl Philips Electronics Nv SIGNAL SYNTHESIS

Also Published As

Publication number Publication date
EP2456236A1 (en) 2012-05-23
SE0400415L (en) 2005-06-20
DK1639580T3 (en) 2014-01-13
JP4323520B2 (en) 2009-09-02
ES2439693T3 (en) 2014-01-24
WO2005059901A1 (en) 2005-06-30
PT1639580E (en) 2013-11-19
SE0400415D0 (en) 2004-02-20
EP1639580A1 (en) 2006-03-29
PL1639580T3 (en) 2014-04-30
EP1639580B1 (en) 2013-10-23
SE527713C2 (en) 2006-05-23

Similar Documents

Publication Publication Date Title
JP7193603B2 (en) Decoder system, decoding method and computer program
JP4335917B2 (en) Fidelity optimized variable frame length coding
US9812136B2 (en) Audio processing system
JP4809370B2 (en) Adaptive bit allocation in multichannel speech coding.
KR101183857B1 (en) Method and apparatus to encode and decode multi-channel audio signals
US7809579B2 (en) Fidelity-optimized variable frame length encoding
CN108369810B (en) Adaptive channel reduction processing for encoding multi-channel audio signals
EP1851759A1 (en) Improved filter smoothing in multi-channel audio encoding and/or decoding
US7725324B2 (en) Constrained filter encoding of polyphonic signals
JP4927264B2 (en) Method for encoding an audio signal
JP4323520B2 (en) Constrained filter coding of polyphonic signals
AU2007237227B2 (en) Fidelity-optimised pre-echo suppressing encoding
Schuler Audio Coding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080507

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080717

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080725

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090325

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090508

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090604

R150 Certificate of patent or registration of utility model

Ref document number: 4323520

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120612

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130612

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees