JP2007527543A - Constrained filter coding of polyphonic signals - Google Patents
Constrained filter coding of polyphonic signals Download PDFInfo
- Publication number
- JP2007527543A JP2007527543A JP2006518597A JP2006518597A JP2007527543A JP 2007527543 A JP2007527543 A JP 2007527543A JP 2006518597 A JP2006518597 A JP 2006518597A JP 2006518597 A JP2006518597 A JP 2006518597A JP 2007527543 A JP2007527543 A JP 2007527543A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel
- filter
- adaptive filter
- constraint
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003044 adaptive effect Effects 0.000 claims abstract description 41
- 230000003595 spectral effect Effects 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 69
- 238000009795 derivation Methods 0.000 claims 1
- 230000006978 adaptation Effects 0.000 abstract description 8
- 238000012805 post-processing Methods 0.000 abstract description 3
- 230000005236 sound signal Effects 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 238000001914 filtration Methods 0.000 description 11
- 238000013459 approach Methods 0.000 description 10
- 238000005457 optimization Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000008929 regeneration Effects 0.000 description 4
- 238000011069 regeneration method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000007493 shaping process Methods 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/02—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Abstract
異なるチャネル(c1〜cN)の信号が、1つのモノラル信号(x)に組み合わされる。1つが各チャネル(c1〜cN)についてであることが好ましい1セットの適応フィルタが、それぞれのフィルタ適応化ユニット(30:1〜30:N)において導出される。適応フィルタがモノラル信号(x)に適用されるとき、適応フィルタは、知覚制約の下でそれぞれのチャネル(c1〜cN)の信号を再構築する。知覚制約は、ゲイン制約および/またはシェイプ制約である。ゲイン制約により、チャネル(c1〜cN)間の相対エネルギの維持が可能になり、一方、シェイプ制約により、スペクトル・ヌルの不必要性を回避することによってさらなる安定性が可能になる。送信されるパラメータは、符号化形態のモノラル信号(x)、およびやはり符号化されていることが好ましい適応フィルタのパラメータ(p1〜pN)である。受信機は、適応フィルタおよび可能であればいくつかの追加の後処理を適用することによって、異なるチャネルの信号を再構築する。Signals of different channels (c 1 to c N ) are combined into one monaural signal (x). One of the adaptive filters of a set is preferably for each channel (c 1 to c N), respectively of the filter adaptation unit (30: 1~30: N) is derived in. When the adaptive filter is applied to the monaural signal (x), the adaptive filter reconstructs the signal for each channel (c 1 -c N ) under perceptual constraints. Perceptual constraints are gain constraints and / or shape constraints. The gain constraint allows the relative energy between the channels (c 1 -c N ) to be maintained, while the shape constraint allows further stability by avoiding the need for spectral nulls. The parameters to be transmitted are the monaural signal (x) in coded form and the parameters (p 1 -p N ) of the adaptive filter that are also preferably coded. The receiver reconstructs the signals on the different channels by applying an adaptive filter and possibly some additional post-processing.
Description
本発明は、オーディオ信号の符号化に関し、特に、マルチチャネル・オーディオ信号の符号化に関する。 The present invention relates to encoding audio signals, and more particularly to encoding multi-channel audio signals.
高いオーディオ品質を維持しつつ低ビットレートでオーディオ信号を送信あるいは記憶することは、市場の高い要求である。具体的には、送信リソースや記憶装置に制約がある場合、低ビットレート動作が本質的なコスト要因となる。これは、たとえば、GSM、UMTS、CDMAなどのモバイル通信システムにおけるストリーミングおよびメッセージングの応用分野では一般的な認識である。 There is a high market demand for transmitting or storing audio signals at a low bit rate while maintaining high audio quality. Specifically, when there are restrictions on transmission resources and storage devices, low bit rate operation is an essential cost factor. This is a common recognition in streaming and messaging applications in mobile communication systems such as GSM, UMTS, CDMA, for example.
現在のところ、モバイル通信システムに利用されうる標準化されたコーデックで、経済的に関心を引くビットレートにてステレオの高いオーディオ品質を提供するものは存在しない。いまあるコーデックで可能なのは、オーディオ信号のモノラル送信である。ステレオ送信もある程度までは利用可能である。しかしビットレートの制約により、非常に限定されたステレオ表現をせざるをえないのが現状である。 At present, there are no standardized codecs that can be used in mobile communication systems that provide high stereo audio quality at economically interesting bit rates. What is possible with the current codec is mono transmission of audio signals. Stereo transmission is also available to some extent. However, due to bit rate restrictions, the current situation is that very limited stereo representations are unavoidable.
オーディオ信号のステレオ符号化またはマルチチャネル符号化の最も簡単な方式は、異なるチャネルの信号を個々の独立な信号として別々に符号化することである。ステレオFM無線送信において使用され、従来からのモノラル無線受信機との共存を図った他の基本的な方式は、2チャネルの和信号および差信号を送信するというものである。 The simplest method of stereo encoding or multi-channel encoding of an audio signal is to separately encode signals of different channels as individual independent signals. Another basic method used in stereo FM radio transmission and coexisting with a conventional monaural radio receiver is to transmit two-channel sum and difference signals.
MPEG−1/2レイヤIIIおよびMPEG−2/4 AACなどの現在のオーディオコーデックは、いわゆるジョイント・ステレオ符号化(joint stereo coding)を使用する。この方法によれば、異なるチャネルの信号は、別々および個々にではなく、共同して処理される。2つの最も一般的に使用されるジョイント・ステレオ符号化方法は、「Mid/Side」(M/S)ステレオ符号化("Mid/Side" (M/S) stereo coding)およびインテンシティ・ステレオ符号化(intensity stereo coding)として知られ、これらは一般に、符号化されるステレオ信号またはマルチチャネル信号のサブバンドに対して適用される。 Current audio codecs such as MPEG-1 / 2 Layer III and MPEG-2 / 4 AAC use so-called joint stereo coding. According to this method, the signals of different channels are processed jointly rather than separately and individually. The two most commonly used joint stereo coding methods are “Mid / Side” (M / S) stereo coding and intensity stereo coding. Known as intensity stereo coding, these are generally applied to the subbands of the stereo signal or multichannel signal to be encoded.
M/Sステレオ符号化は、チャネル・サブバンドの和信号と差信号を符号化して送信し、それにより、チャネル・サブバンド間の冗長性を利用するという意味では、ステレオFM無線において記述される手順と同様である。M/Sステレオ符号化に基づくエンコーダの構造および動作は、たとえば J. D. ジョンストン(Johnston)による米国特許第5285498号に記載されている。 M / S stereo coding is described in stereo FM radio in the sense that it encodes and transmits the sum and difference signals of the channel sub-bands, thereby exploiting the redundancy between the channel and sub-bands. The procedure is the same. The structure and operation of an encoder based on M / S stereo coding is described, for example, in US Pat. No. 5,285,498 by J. D. Johnston.
一方、インテンシティ・ステレオは、ステレオの非関連性を利用することができる。これは、強度がチャネルの中にどのように分布しているかを示すいくつかの位置情報と共に、(異なるサブバンドの)チャネルの結合強度を伝送する。インテンシティ・ステレオは、チャネルのスペクトル振幅情報のみを出力する。位相情報は、伝達されない。この理由および、時間チャネル間情報(より具体的にはチャネル間時間差)がとりわけ低い周波数において主要な音響心理学的関連性を呈するという理由により、インテンシティ・ステレオは、たとえば2kHzより高い周波数においてのみ使用することができる。インテンシティ・ステレオ符号化法は、たとえば、R. ヴェルデュイ(Veldhuis)らによる欧州特許第0497413号に記載されている。 On the other hand, intensity stereo can take advantage of stereo independence. This transmits the combined strength of the channels (in different subbands) along with some position information indicating how the strength is distributed in the channel. Intensity stereo outputs only the spectral amplitude information of the channel. Phase information is not transmitted. For this reason and because time-channel information (more specifically, channel-to-channel time difference) exhibits a major psychoacoustic relevance especially at low frequencies, intensity stereo is only at frequencies above 2 kHz, for example. Can be used. Intensity stereo coding is described, for example, in European Patent No. 0497413 by R. Veldhuis et al.
最近開発されたステレオ符号化法が、たとえば、C. フォーラー (Faller) らによる名称「Binaural cue coding applied to stereo and multi channel audio compression」(第112回AES会議、2002年5月、ドイツ、ミュンヘンの会議文献)に記載されている。この方法は、パラメトリック・マルチチャネル・オーディオ符号化法である。基本的な原理は、符号化側において、Nチャネルc1、c2、・・・、cNからの入力信号が、単一のモノラル信号(mono signal)mに組み合わされるものである。モノラル信号は、任意の従来のモノラル・オーディオ・コーデックを使用してオーディオ符号化される。並行して、パラメータが、マルチチャネル像を記述するチャネル信号から導出される。パラメータは符号化され、オーディオ・ビット・ストリームと共に復号化器に送信される。復号化器は、まず、モノラル信号m’を復号化し、次いで、マルチチャネル像のパラメータ記述に基づいてチャネル信号c1’、c2’、・・・、cN’を再生成する。 A recently developed stereo coding method is, for example, the name “Binaural cue coding applied to stereo and multi channel audio compression” by C. Faller et al. (Conference Literature). This method is a parametric multi-channel audio coding method. The basic principle is that on the encoding side, the input signals from N channels c1, c2,..., CN are combined into a single mono signal m. The mono signal is audio encoded using any conventional mono audio codec. In parallel, parameters are derived from the channel signal that describes the multi-channel image. The parameters are encoded and sent to the decoder along with the audio bit stream. The decoder first decodes the monaural signal m 'and then regenerates the channel signals c1', c2 ', ..., cN' based on the parameter description of the multichannel image.
バイノーラル・キュー符号化(BCC)方法の原理は、符号化されたモノラル信号およびいわゆるBCCパラメータを送信する。BCCパラメータは、元のマルチチャネル入力信号のサブバンドについて、コード化されたチャネル間レベル差およびチャネル間時間差の情報を有する。復号化器は、BCCパラメータに基づいてモノラル信号のサブバンド・レベルおよび位相調節を適用することによって、差チャネル信号を再生成する。M/Sまたはインテンシティ・ステレオなどに対する利点は、時間チャネル間情報を備えるステレオ情報が、はるかにより低いビットレートで送信されることである。 The principle of the binaural cue coding (BCC) method transmits an encoded mono signal and so-called BCC parameters. The BCC parameters have coded inter-channel level difference and inter-channel time difference information for the subbands of the original multi-channel input signal. The decoder regenerates the difference channel signal by applying the subband level and phase adjustment of the mono signal based on the BCC parameters. An advantage over M / S or intensity stereo etc. is that stereo information with time channel information is transmitted at a much lower bit rate.
上述の従来技術のマルチチャネル符号化方法の問題は、良好な品質を提供するためは、高いビットレートを必要とすることである。たとえば、数kbps程度の低ビットレートが適用される場合、インテンシティステレオは、時間チャネル間情報を提供しないとため悪影響を受ける。この情報は、たとえば2kHzより低い低周波数が知覚的に重要であるため、そのような低周波数においてステレオ像を提供することができない。 The problem with the above described prior art multi-channel coding method is that it requires a high bit rate in order to provide good quality. For example, when a low bit rate of about several kbps is applied, intensity stereo is adversely affected because it does not provide time channel information. This information cannot provide a stereo image at such low frequencies, for example, since low frequencies below 2 kHz are perceptually important.
BCCは、たとえば3kbpsの低ビットレートで、低周波数でもマルチチャネル像を再生成することができる。その理由は、時間チャネル間情報も送信するからである。しかし、この技法は、符号化器および復号化器の両方において、チャネルの各々について演算量の多い時間周波数変換を必要とする。さらに、BCCは、純粋に数学的な方式でマッピングを最適化する。しかし、符号化方法に内在する特徴的なアーティファクトは、消滅しない。 BCC can regenerate a multichannel image even at a low frequency, for example, at a low bit rate of 3 kbps. The reason is that information between time channels is also transmitted. However, this technique requires a computationally time-frequency transform for each of the channels in both the encoder and the decoder. Furthermore, BCC optimizes the mapping in a purely mathematical manner. However, the characteristic artifact inherent in the encoding method does not disappear.
C. E. ホルト(Holt)らによる米国特許第5434948号に記載されている技法は、モノラル信号および副情報を符号化するBCCと同様の技法を使用する。この場合、副情報は、予測フィルタおよびオプションで残差信号からなる。予測フィルタでは、Least-Mean-Squareアルゴリズムによって評価が行われ、モノラル信号に適用される場合にはマルチチャネル・オーディオ信号の予測が可能である。この技法により、マルチチャネル音源に対して非常に低いビットレート符号化を実現することができるが、以下でさらに議論されるように、品質の低下を伴うことになる。 The technique described in US Pat. No. 5,434,948 by C. E. Holt et al. Uses a technique similar to BCC for encoding mono signals and side information. In this case, the sub information consists of a prediction filter and optionally a residual signal. In the prediction filter, evaluation is performed by a Least-Mean-Square algorithm, and when applied to a monaural signal, a multi-channel audio signal can be predicted. This technique can achieve very low bit rate coding for multi-channel sound sources, but with a loss of quality, as discussed further below.
上記のフィルタリング手法と同様の手法が、ブリーバート(Breebaart)およびグローネンダール(Groenendaal)によるWO03/090206に記載されている。しかし、この手法は、モノラル信号に適用され、かつ行列演算によりフィルタリング前のモノラル信号と組み合わされる固定フィルタを使用する。行列演算は、受信相関パラメータおよび受信レベル・パラメータに依存する。そのような信号合成の目的は、元の2つのチャネルの相関およびレベル差を回復することである。固有の固定フィルタ演算のために、信号合成は、信号再生成について非常に限定された可能性を有し、信号の特性に適合しない。手法は、現在は時間成分が復号化器に伝達される上記で議論されたインテンシティ・ステレオ符号化の拡張とみなすことができる。さらに、レベルおよび相関パラメータのみが、行列演算によりある程度の適合を可能にする。この演算は、静的フィルタリング済み信号の単なる回転およびスケーリングからなり、したがって、ポリフォニック再生成能力を限定する。この手法の他の欠点は、透明品質へのスケーラビリティを限定する信号対雑音比などの忠実度基準に基づいていないことである。 A technique similar to the above filtering technique is described in WO 03/090206 by Breebaart and Groenendaal. However, this approach uses a fixed filter that is applied to the monaural signal and combined with the monaural signal before filtering by matrix operations. The matrix operation depends on the reception correlation parameter and the reception level parameter. The purpose of such signal synthesis is to recover the correlation and level difference between the original two channels. Due to the inherent fixed filter operation, signal synthesis has very limited possibilities for signal regeneration and does not adapt to the characteristics of the signal. The approach can now be viewed as an extension of the intensity stereo coding discussed above in which the time component is communicated to the decoder. Furthermore, only the level and correlation parameters allow a certain degree of adaptation through matrix operations. This operation consists of mere rotation and scaling of the static filtered signal, thus limiting the polyphonic regeneration capability. Another drawback of this approach is that it is not based on fidelity criteria such as a signal-to-noise ratio that limits scalability to transparent quality.
最後に、完全を期すべく、3Dオーディオについて使用される技法について説明しておく。この技法は、いわゆるヘッド関係フィルタ (head-related filters) で音源信号をフィルタリングすることによって、右チャネル信号と左チャネル信号とを合成する。しかし、この技法は、異なる音源信号が分離されることを必要とし、したがって一般に、ステレオまたはマルチチャネル符号化に適用することができない。 Finally, for completeness, the techniques used for 3D audio are described. This technique combines a right channel signal and a left channel signal by filtering the sound source signal with so-called head-related filters. However, this technique requires that different sound source signals be separated and is therefore generally not applicable to stereo or multi-channel coding.
予測フィルタは、Least-Mean-Squareの観点で最適であることが知られているが、元のマルチチャネル信号の聴感特性を常に完全に回復する訳ではない。たとえばステレオ符号化の場合、ステレオ像の不安定性が生じる可能性があり、音は、左と右との間で無作為にジャンプする。さらに、スペクトル・ヌルが不安定性を生じさせ、これらの周波数における周波数応答が迷走するフィルタとなる可能性がある。これにより、フィルタは、ある領域において不必要な増幅を行ってしまい、それにより、具体的には信号がローパスフィルタリングまたはハイパスフィルタリングされる場合、非常に厄介な異音を生じる可能性がある。 Prediction filters are known to be optimal from a Least-Mean-Square perspective, but do not always fully restore the audibility characteristics of the original multi-channel signal. For example, in the case of stereo coding, stereo image instability can occur, and sound jumps randomly between left and right. In addition, spectral nulls can cause instability and can be a filter that strays the frequency response at these frequencies. This can cause the filter to perform unnecessary amplification in certain areas, which can result in very nasty noise, particularly if the signal is low or high pass filtered.
本発明の目的は、オーディオ信号の知覚品質を向上させるマルチチャネル符号化の方法および装置を提供することである。本発明の他の目的は、低ビットレートにて上記の方法および装置を提供することである。 It is an object of the present invention to provide a multi-channel coding method and apparatus that improves the perceived quality of an audio signal. Another object of the present invention is to provide the above method and apparatus at a low bit rate.
上記の目的は、添付の特許請求の範囲による方法および装置によって達成される。一般的には、符号化器側において、異なるチャネルの信号は、1つの主信号に組み合わされる。1つが各チャネルについてであることが好ましい1セットの適応フィルタが導出される。フィルタが主信号に適用されるとき、フィルタは、知覚制約の下でそれぞれのチャネルの信号を再構築する。知覚制約は、ゲイン制約および/またはシェイプ制約である。ゲイン制約により、チャネル間の相対エネルギの保存が可能になり、一方、シェイプ制約により、たとえばスペクトル・ヌルの不必要なフィルタリングを回避することによって、ステレオ像の安定が可能になる。送信されるパラメータは、符号化形態にある主信号、およびやはり符号化されることが好ましい適応フィルタのパラメータである。受信機は、適応フィルタおよび可能であればいくつかの追加の処理を適用することによって、異なるチャネルの信号を再構築する。 The above objective is accomplished by a method and device according to the appended claims. In general, on the encoder side, signals from different channels are combined into one main signal. A set of adaptive filters is derived, preferably one for each channel. When the filter is applied to the main signal, the filter reconstructs the signal for each channel under perceptual constraints. Perceptual constraints are gain constraints and / or shape constraints. Gain constraints allow for the preservation of relative energy between channels, while shape constraints allow for stereo image stabilization, for example, by avoiding unnecessary filtering of spectral nulls. The transmitted parameters are the main signal in encoded form and the parameters of the adaptive filter that are also preferably encoded. The receiver reconstructs the signals on the different channels by applying an adaptive filter and possibly some additional processing.
本発明の利点は、オーディオ信号を復号したときの異音が低減されることである。また、必要な送信ビットレートが非常に低レベルに維持される。 An advantage of the present invention is that abnormal noise when an audio signal is decoded is reduced. Also, the required transmission bit rate is maintained at a very low level.
図1は、本発明の好適な実施形態に係る典型的なシステム1を示す図である。送信機10は、無線信号5を受信機20に送信することができるように、関連するハードウエアおよびソフトウエアを含むアンテナ12を備える。送信機10は、とりわけマルチチャネル符号化器14を備え、これは、いくつかの入力チャネル16の信号を無線送信に適切な出力信号に変換する。適切なマルチチャネル符号化器14の例については、後ほど詳細に説明する。入力チャネル16の信号は、たとえば、録音に係るディジタル表現のデータファイル、磁気テープ、あるいはオーディオのビニル・ディスク記録など、オーディオ信号記憶装置18から提供を受けることが可能である。入力チャネル16の信号は、たとえば、1セットのマクロフォン19から「ライブ」で提供されてもよい。オーディオ信号がすでにディジタル形式ではない場合には、マルチチャネル符号化器14に入る前にディジタル化される。
FIG. 1 is a diagram illustrating an
受信機20側では、関連するハードウエアおよびソフトウエアを有するアンテナ22が、ポリフォニック・オーディオ信号 (polyphonic audio signals) を表す無線信号5の実際の受信に対処する。ここでは、たとえばエラー訂正などの通常の機能が実施される。復号化器24が、受信された無線信号5を復号化し、それにより、搬送されたオーディオデータをいくつかの出力チャネル26の信号に変換する。出力信号は、たとえば、直ちに出力するためにスピーカ29に提供することができ、あるいは、任意の種類のオーディオ信号記憶装置28に記憶することができる。
On the
システム1は、たとえば、電話会議システム、音声サービスあるいはその他のオーディオアプリケーションを提供するためのシステムでありうる。たとえば電話会議システムなどのいくつかのシステムでは、通信は、二重伝送方式でなければならず、一方、サービス・プロバイダから加入者への楽音の配信などは、基本的には一方向性伝送方式でよい。送信機10から受信機20への信号の送信は、異なる種類の電磁波、ケーブル、またはファイバ、あるいはその組合せによってなど、任意の他の手段によって実施することもできる。
The
図2aに、本発明によるマルチチャネル符号化器14の一実施形態を示す。いくつかのチャネル信号 c1, c2, ..., cN がそれぞれ、入力16:1〜16:Nにおいて受信される。
FIG. 2a shows one embodiment of a
チャネル信号は、線形結合部34に接続される。本実施形態では、すべてのチャネル信号が、モノラル信号xを形成するように共に合計される。しかし、純粋チャネル信号を含めて、チャネル信号の1または2以上の任意の所定の線形結合を代わりにしようしてもよい。しかし、純粋な和が、数学的な演算を最も簡単にする。モノラル信号xは、入力信号42としてチャネル・フィルタ・セクション130に加えられる。さらに、モノラル信号xは、モノラル信号xを表す符号化パラメータpxを提供するために、モノラル信号符号化器38に供給され、そこで符号化される。モノラル信号符号化器は、任意の適切なモノラル信号符号化技法に従って動作する。多くのそのような技法は、公知の技術を利用可能である。符号化技法の詳細は本発明の実施可能要件としては重要ではないので、説明を省略する。
The channel signal is connected to the
チャネル信号は、チャネル・フィルタ・セクション130にも接続される。本実施形態では、各チャネル信号は、それぞれのフィルタ適応化ユニット30:1〜30:Nに接続される。フィルタ適応化ユニットは、モノラル信号xに適用されるとき、それぞれのチャネル信号の再構築を実施する。フィルタ適応化ユニット30:1〜30:Nの係数は、知覚制約の下で最適化された本発明による。しかし、フィルタ適応化ユニット30:1〜30:Nの最適化係数は、2つ以上のチャネル信号の結合最適化において少なくとも部分的に得ることも可能である。
The channel signal is also connected to the
チャネル・フィルタ・セクション130の出力は、Nセットのフィルタ・パラメータp1〜pNを備える。これらのフィルタ・パラメータp1〜pNは、通常、送信に適切であるように別々にまたは一緒に符号化される。フィルタ・パラメータp1〜pNおよびモノラル信号xは、すべてのチャネル信号の再構築を可能にするのに十分である。符号化フィルタ・パラメータp1〜pNおよびモノラル信号xを表す符号化パラメータpxは、本実施形態では、送信に容易であるように、マルチプレクサ40において、出力信号52に多重化される。
The output of the
図2bは、本発明によるマルチチャネル復号化器24の一実施形態を示す図である。図2bの復号化器24は、図2aの符号化器によって符号化されたマルチチャネル信号を復号するのに適切である。入力信号54が受信され、デマルチプレクサ56に提供され、デマルチプレクサ56は、入力信号を、モノラル信号xを表す符号化パラメータpxおよび符号化フィルタ・パラメータp1〜pNのいくつかのセットに分割する。
FIG. 2b is a diagram illustrating one embodiment of a
モノラル信号xを表す符号化パラメータpxは、モノラル信号復号化器64に提供され、そこで、モノラル信号xを表す符号化パラメータpxは、図2aにおいて使用された符号化技法と関連する任意の適切な復号技法に従って、複合モノラル信号x"を生成するために使用される。多くのそのような技法は、公知の技術を利用可能である。符号化技術の詳細は本発明の実施可能要件としては重要ではないため、説明を省略する。復号されたモノラル信号x"は、チャネル・フィルタ・セクション160に提供される。
A coding parameter p x representing the monaural signal x is provided to the
復号されたフィルタ・パラメータは、チャネル・フィルタ・セクション160にも提供され、そこで復号されて、チャネル・フィルタ60:1〜60:Nを確定するために使用される。そのように確定されたそれぞれのチャネル・フィルタ60:1〜60:Nは、復号されたモノラル信号x"に適用され、それにより、それぞれのチャネル信号c"1〜c"Nが再構築され、出力26:1〜26:Nにおいて提供される。
The decoded filter parameters are also provided to the
本開示のほとんどの実施形態において、モノラル信号が、符号化または復号においてチャネル信号を再生成するための主信号として使用される。しかし、一般的な手法では、チャネル信号の中から選択された任意の所定の線形結合が、主信号として使用されることが可能である。所定の線形結合の最適な選択肢は、実際の応用分野および実施に依存する。単一のチャネル信号が、可能なそのような所定の線形結合を構成することもできる。 In most embodiments of the present disclosure, a mono signal is used as the main signal for regenerating the channel signal in encoding or decoding. However, in a general approach, any predetermined linear combination selected from among the channel signals can be used as the main signal. The optimal choice for a given linear combination depends on the actual application field and implementation. A single channel signal may constitute such a predetermined linear combination.
本発明によるマルチチャネル符号化器14の他の実施形態が、図3aに示されている。同様の部分が、同様の参照符号によって表記され、相違点のみが以下において議論される。
Another embodiment of a
線形結合部34は、以前と同様に、チャネル信号の所定の線形結合をモノラル信号符号化器38に提供する。しかし、この実施形態では、モノラル信号xに関連付けられる信号は、代わりに、モノラル信号xを表す符号化パラメータpxの復号バージョンx"である。そのような構成は、閉ループ手法と呼ばれ、以下でさらに記述されるように、モノラル信号符号化の不正確さをある程度補償することを見込む。
The
本実施形態の線形結合部34は、また、N-1の所定の線形結合c* 1-c*N-1においてチャネル信号を組み合わせ、これは、チャネル・フィルタ・セクション130への実際の入力信号として作用する。N-1の所定の線形結合c* 1-c*N-1は、互いに線形独立であるべきである。線形結合c* 1-c*N-1は、すべてのチャネル信号からの寄与を備えるとは限らない。「線形結合」という用語は、この文脈では、成分のファクタをゼロに設定することができる特別な場合をも備えるとして使用されるべきである。実際、最も簡単なセットアップでは、線形結合c* 1-c*N-1は、チャネル信号c1-cN-1に同一とすることができる。復号化器側において復号されたモノラル信号x"を使用することによって、元のチャネル信号を回復することができる。
The
修正されたチャネル信号は、この実施形態では、チャネル・フィルタ・セクション130にも接続され、修正チャネル信号に対応するN-1のセットのフィルタ係数が推測される。フィルタ適応化ユニット30:1〜30:Nの係数は、知覚制約に下で最適化された本発明による。
The modified channel signal is also connected to the
チャネル・フィルタ・セクション130の出力は、N-1のセットのフィルタ・パラメータp* 1〜p* N-1を含む。これらのフィルタ・パラメータp* 1〜p* N-1は、通常、送信に最適であるように、別々にまたは共同して符号化される。符号化されたフィルタ・パラメータp* 1-p* N-1およびモノラル信号xを表す符号化パラメータpxは、本実施形態では、別々に送信される。
The output of the
図3bは、本発明によるマルチチャネル復号化器24の他の実施形態を示す。図3bの復号化器は、図3aの符号化器によって符号化されたマルチチャネル信号を復号するのに適切である。モノラル信号xを表す符号化パラメータpxおよび1セットの符号化フィルタ・パラメータp* 1〜p* N-1が受信される。モノラル信号xを表す符号化パラメータpxは、以前の実施形態と同様にモノラル信号復号化器64において復号モノラル信号x"を生成するために使用される。フィルタ・パラメータp* 1〜p* N-1は、同様に、N-1の復号修正チャネル信号c* 1〜c* N-1を得るために、チャネル・フィルタ・セクション160に提供される。次いで、線形結合部74が、修正チャネル信号c* 1〜c* N-1および復号モノラル信号x"から再構築されたチャネル信号c"1〜c"Nを提供するために使用される。
FIG. 3b shows another embodiment of a
知覚制約の重要な関連性を理解するために、従来技術のフィルタ符号化の一例が、基本的には米国特許第5434948号を参照して、より詳細に記述される。このマルチチャネル符号化により、残差信号の送信が省略される場合、低ビットレートが可能になる。チャネル再構築フィルタを導出するために、LMSまたは重み付けLMSの概念に基づくエラー最小化手順が、フィルタの出力信号^c(n)が、対象信号c(n)に最適に整合するように、フィルタを計算する。 In order to understand the important relevance of perceptual constraints, an example of prior art filter coding is described in more detail, basically referring to US Pat. No. 5,434,948. This multi-channel coding allows a low bit rate when transmission of residual signals is omitted. In order to derive a channel reconstruction filter, an error minimization procedure based on the concept of LMS or weighted LMS ensures that the filter output signal ^ c (n) is optimally matched to the target signal c (n). Calculate
フィルタを計算するために、いくつかのエラー尺度を使用してもよい。平均2乗誤差または重み付け平均2乗誤差は周知であり、演算量が少なくて済む。LMSの手法によれば、「uc」が「無制約」を指すとして、フィルタ h c uc は、データの1つのフレームについて有効であり、対象信号とフィルタ出力との2乗誤差、すなわち差 ruc(n) = c(n) - ^cuc(n) の2乗を最小限に抑えるように選択される。ただし、nはデータ・フレームのサンプルの指標である。この誤差は、以下のように表される。 Several error measures may be used to calculate the filter. Mean square error or weighted mean square error is well known and requires a small amount of calculation. According to the LMS method, the filter h c uc is effective for one frame of data, and “uc” indicates “unconstrained”, and the square error between the target signal and the filter output, that is, the difference r uc (n) = c (n) -chosen to minimize the square of ^ c uc (n). Here, n is an index of data frame samples. This error is expressed as follows.
これにより、フィルタ係数ベクトル h c uc について以下の線形式システムが得られる。 As a result, the following linear system is obtained for the filter coefficient vector h c uc .
ただし、
は、モノラル信号x(n)の対称共分散行列である。
However,
Is the symmetric covariance matrix of the monaural signal x (n).
上式でrxcは、信号x(n)およびc(n)の相互相関のベクトルである。 In the above equation, rxc is a vector of cross-correlation between signals x (n) and c (n).
しかし、上述したように、知覚特性は、純粋な数学的最小化によって完全には決定されない可能性がある。 However, as mentioned above, the perceptual characteristics may not be completely determined by pure mathematical minimization.
マルチチャネル信号の1つの非常に重要な知覚特性は、エネルギー、および具体的にはマルチチャネル音声信号間の相対レベルである。従来技術の方法によるステレオ符号化の場合、音源が左から右に周期的にジャンプする厄介なステレオ像不安定性が、結果として生じる可能性がある。さらに、唯一のフィルタがステレオ符号化において必要とされるので、左および右の予測に対する直接的な制御が達成されない。本発明によれば、したがって、ゲイン制約が最適化手順中に使用されることが有利である。この文脈では、チャネルあたり1つのフィルタが基本的に必要であることに留意されたい(上記の図2aおよび図2b参照)。 One very important perceptual characteristic of a multichannel signal is the energy and specifically the relative level between the multichannel audio signals. In the case of stereo coding according to prior art methods, a troublesome stereo image instability in which the sound source jumps periodically from left to right can result. In addition, direct control over left and right predictions is not achieved because only one filter is required in stereo coding. According to the invention, it is therefore advantageous that gain constraints are used during the optimization procedure. Note that in this context, one filter per channel is essentially required (see FIGS. 2a and 2b above).
ある状況では、予測されたチャネルは、ある周波数より上または下の周波数内容を有さない可能性がある。これは、たとえば、チャネルがハイパスフィルタリングされる場合、または帯域分割手順から得られる場合に生じる。スペクトル・ヌルは、不安定性を生じて、不必要な増幅および低周波数の異音を生じるフィルタ応答をもたらす可能性がある。したがって、本発明によれば、シェイプ制約が、最適化手順中に使用されることが有利である。 In certain situations, the predicted channel may not have frequency content above or below a certain frequency. This occurs, for example, when the channel is high pass filtered or obtained from a band splitting procedure. Spectral nulls can cause instability and result in a filter response that results in unwanted amplification and low frequency noise. Thus, according to the present invention, shape constraints are advantageously used during the optimization procedure.
図4は、2つのチャネル(ステレオの場合)および線形フィルタ31を有する実施形態における、本発明による符号化器側の制約最小化手順の基本的概念を示す。フィルタ係数h c1を有するチャネルc1の制約に応答するフィルタ31が、最適化ユニット32において制約誤差最小化手順により導出される。フィルタh c1は、この実施形態では2つのチャネル信号c1およびc2の線形結合である組合せチャネル信号、すなわちモノラル信号x(n)を入力として取り入れ、
これから、出力信号^c1(n)を導出する。ファクタγc1およびγc2は、チャネル信号がどのように組み合わされるかを決定する。1つの可能性は、γc1をファクタ2γに設定し、γc2を2(1−γ)に設定するものである。この場合、モノラル信号は、チャネルの重み付け和である。具体的には、適切なセッティングがγ=0.5であり、この場合、両チャネルとも、等しく重み付けされる。他の適切なセッティングは、γc1=−γc2とすることが可能であり、この場合、モノラル信号は、チャネル信号の差である。
FIG. 4 shows the basic concept of the encoder side constraint minimization procedure according to the invention in an embodiment with two channels (in the case of stereo) and a
From this, the output signal ^ c1 (n) is derived. The factors γ c1 and γ c2 determine how the channel signals are combined. One possibility is to set γ c1 to a factor 2γ and γ c2 to 2 (1-γ). In this case, the monaural signal is a weighted sum of the channels. Specifically, an appropriate setting is γ = 0.5, where both channels are equally weighted. Another suitable setting may be γ c1 = −γ c2 where the mono signal is the difference of the channel signals.
モノラル信号を形成するように個々のチャネル信号を重み付け組み合わせすることは、一般的に、それぞれのチャネル信号のフィルタリング済みバージョンの組合せとすることさえできる。そのような手法は、プリフィルタリングと呼ばれる。これは、手法が励起領域または一般的には重み付け信号領域において実施される場合、有用であることがある。たとえば、チャネルは、モノラル信号のLPC(線形予測コーディング)残差フィルタによってプリフィルタリングすることができる。 The weighted combination of individual channel signals to form a mono signal can generally even be a combination of filtered versions of each channel signal. Such an approach is called pre-filtering. This may be useful if the approach is implemented in the excitation domain or generally in the weighted signal domain. For example, the channel can be pre-filtered with an LPC (Linear Predictive Coding) residual filter of the mono signal.
以下において、モノならびに左チャネルおよび右チャネルは、一般に、実際のモノラル、左、右チャネルのいくつかのプリフィルタリング済みバージョンであると想定される。チャネルを回復するとき、モノラルLPC合成フィルタによるプリフィルタリングのステップが、信号領域に戻るために必要である。 In the following, the mono and left and right channels are generally assumed to be some pre-filtered versions of the actual mono, left and right channels. When recovering the channel, a pre-filtering step with a mono LPC synthesis filter is necessary to return to the signal domain.
以下において、場合γc1=1/2およびγc2=1/2が、より詳細に議論される。 In the following, the cases γ c1 = 1/2 and γ c2 = 1/2 will be discussed in more detail.
h c1がFIR(有限インパルス応答)フィルタである場合、^c1(n)は、信号x(n)の遅延バージョンの線形結合である。 If h c1 is a FIR (finite impulse response) filter, ^ c1 (n) is a linear combination of delayed versions of the signal x (n).
指標セットは、I=[iminKimax]である。フィルタ・パラメータp1は、フィルタ係数h c1を備え、フィルタを確定する必要な追加のデータである可能性がある。 The index set is I = [i min Ki max ]. The filter parameter p 1 may be the additional data needed to determine the filter with the filter coefficient h c1 .
たとえば米国第5434948号に開示されている符号化方法を適用する場合、2つのチャネル信号の差信号は、フィルタによって再生成される。図5において、右信号および左信号は、それぞれ曲線301および302によって示されている。表示は理想的ではなく、フレーム全体にわたって目標差よりわずかに大きな差を与えると想定する。これにより、復号化器側において元の右信号よりわずかに低い再生成右信号303が得られ、元の左信号よりわずかに高い再生成左信号304が得られる。そのような異音は、右チャネルのボリュームが減少し、左チャネルのボリュームが増大するものである。そのような異音がさらに時間について変化する場合、音は、右チャネルと左チャネルとの間において往復して揺動する。ゲイン制約が、そのような状況を改善することが可能である。
For example, when applying the encoding method disclosed in US Pat. No. 5,434,948, the difference signal of the two channel signals is regenerated by a filter. In FIG. 5, the right and left signals are indicated by
ゲイン制約を実施するいくつかの方式がある。1つの可能な手法は、ハード制約、すなわち元のチャネルと評価チャネルとの間の正確なエネルギー整合を有する、または、元のチャネル信号エネルギーに必ずしも等しくない規定されたエネルギーEc1を出力チャネルが有するようなゆるいゲイン制約を課すものである。 There are several ways to implement gain constraints. One possible approach is to have a hard constraint, ie an exact energy match between the original channel and the evaluation channel, or the output channel has a defined energy E c1 that is not necessarily equal to the original channel signal energy. Such a loose gain constraint is imposed.
制約最小化の問題は、ラグランジュの方法、すなわちラグランジュ関数によって容易に解決することができる。 The problem of constraint minimization can be easily solved by the Lagrangian method, that is, the Lagrangian function.
最適な解は、フィルタh c1を与え、これは、次の無制約フィルタに比例する。 The optimal solution gives the filter h c1 , which is proportional to the next unconstrained filter.
比例ファクタは、以下のようになる。 The proportional factor is:
したがって、ゲイン制約フィルタは、
h c1 gc=gc1 h c1 uc
となる。
Therefore, the gain constraint filter is
h c1 gc = g c1 h c1 uc
It becomes.
本符号化原理が限定周波数帯域において使用される場合、チャネル信号は、図6の曲線305のように見える可能性がある。強度は、周波数f1より下、または周波数f2より上には存在しない。しかし、純粋な数学的最適化により、曲線306が生じ、これは、周波数f1およびf2よりそれぞれ下および上において、ある限定された電力も現れる。そのようなアーティファクトは知覚される。
If this coding principle is used in a limited frequency band, the channel signal may look like the
あるスペクトル形状をフィルタに課すために、1セットの線形制約が、フィルタに課されなければならない。これらの制約は、一般に、フィルタの係数の数より小さい数であるべきである。 In order to impose a certain spectral shape on the filter, a set of linear constraints must be imposed on the filter. These constraints should generally be less than the number of filter coefficients.
たとえば、0kHzにおいてスペクトル・ヌルの制約を設定することを望む場合、適切な制約は以下のようになる。 For example, if it is desired to set a spectral null constraint at 0 kHz, a suitable constraint is:
一般に、制約の形状は、以下のように、行列およびベクトルによって定式化することができる。 In general, the shape of the constraint can be formulated by a matrix and a vector as follows:
制約最小2乗の理論から、これらの制約を満たす最適なフィルタは以下のようになる。 From the constraint least-squares theory, the optimal filter that satisfies these constraints is:
この制約は、チャネルがある周波数領域において周波数内容を有さないことが経験的に既知であるとき、特に有用である。 This constraint is particularly useful when it is empirically known that the channel has no frequency content in certain frequency regions.
ゲインおよびシェイプの制約は、組み合わせることもできる。そのような場合、以下に従って、シェイプ制約がまず適用され、次いで、ゲイン制約が、ファクタとして追加されることが好ましい。 Gain and shape constraints can also be combined. In such a case, it is preferred that the shape constraint is first applied and then the gain constraint is added as a factor according to the following.
フィルタは無制約フィルタに依存し、後者は従順であるので、c1(n)+c2(n)=2x(n)により、関係は、以下のようになる。 Since the filter depends on the unconstrained filter and the latter is obedient, the relationship is as follows by c1 (n) + c2 (n) = 2x (n).
ただし、δは、同一フィルタ (identity filter) を表す。2つのチャネルに対する制約が同一である場合、有用な特性をシェイプ制約フィルタについて導出することができる。 Here, δ represents the same filter (identity filter). If the constraints on the two channels are the same, useful properties can be derived for the shape constraint filter.
したがって、以下のようになる。 Therefore, it becomes as follows.
この式は、チャネル・フィルタを符号化するとき、ビットレートの低減には有用であるが、その理由は、チャネル・フィルタが、復号化器側において利用可能な量によって関係付けられることを示すからである。 This equation is useful for reducing the bit rate when coding the channel filter, because the channel filter is related by the amount available at the decoder side. It is.
シェイプ制約フィルタ間の関係は、フィルタの合理的な計算にも当てはまる。図7では、2つのチャネルc1、c2の一方のc1が、モノラル信号xを無制約フィルタ131に適用することによって再生成されることが示されている。無制約フィルタの結果は、シェイプ制約セクション132のシェイプ制約に応じて修正される。c1チャネルのシェイプ制約フィルタから、チャネルc2のシェイプ制約フィルタも計算して、各チャネルについてゲイン制約セクション133を分離するために提供することができる。
The relationship between shape constraint filters also applies to the rational calculation of filters. FIG. 7 shows that one of the two channels c 1 and
シェイプ制約を適用するために副信号を使用する他の実施形態のより詳細なブロック方式が、図8に示されている。2つのチャネル信号c1およびc2は、線形結合部34の加算手段55、57において、モノラル信号xおよび副信号sに組み合わされる。チャネル・フィルタ・セクション130が、無制約パラメータ・フィルタ131を備え、これは、モノラル信号xに適用されて、副信号^sの評価を再生成する。無制約最適化ユニット33において、フィルタ係数は、sと^sとの間の最小差を与えるように適応される。このようにして得られるフィルタh s ucは、基本的には上記のさらなる議論に従って、シェイプ制約セクション132に提供される。副信号のシェイプ制約フィルタh s scが生成される。ステレオ応用分野におけるチャネル・フィルタ間の関係(1)から、副信号のシェイプ制約フィルタh s scに基づいて、各チャネル信号のシェイプ制約フィルタが計算される。係数ではなく、これらのフィルタが、それぞれの制約セクション133:1、133:2に提供される。各チャネル信号のゲインファクタが計算され、2つのフィルタは、パラメータ符号化セクション66に提供され、そこで、2つのフィルタのパラメータは共同して符号化される。
A more detailed block scheme of another embodiment that uses side signals to apply shape constraints is shown in FIG. The two channel signals c1 and c2 are combined into the monaural signal x and the sub signal s in the adding means 55 and 57 of the
制約チャネル・フィルタh c1およびh c2を計算した後、これらは、受信機に送信されるように適切な表示において量子化され、符号化される。通常、フィルタの係数は、スカラまたはベクトルの量子化器を使用して量子化され、量子化器指標は送信される。量子化器は、特にこのシナリオにおいてビットレート低減に非常に有益である予測を実施することも可能である。 After computing the constrained channel filters h c1 and h c2 , they are quantized and encoded in an appropriate representation to be transmitted to the receiver. Typically, the filter coefficients are quantized using a scalar or vector quantizer and the quantizer index is transmitted. The quantizer can also perform predictions that are very beneficial for bit rate reduction, especially in this scenario.
フィルタの相補性を利用することにより、ビットレートをさらに低減することが可能であるが、その理由は、フィルタh c1またはh c2の一方だけまたはそれらの線形結合が、量子化されて送信され、一方、ゲインgc1およびgc2は、共同してベクトル量子化され、別々に送信されるからである。そのような送信は、たとえば1kbps程度に低いビットレートにおいて実施することができる。 By utilizing the complementarity of the filter, it is possible to further reduce the bit rate because only one of the filters h c1 or h c2 or their linear combination is quantized and transmitted, On the other hand, gains g c1 and g c2 are jointly vector quantized and transmitted separately. Such transmission can be carried out at a bit rate as low as 1 kbps, for example.
受信機は、送信されたモノラル信号およびチャネル・フィルタをまず復号する。次いで、受信機は、それぞれのチャネル・フィルタによりモノラル信号をフィルタリングすることによって、異なるチャネル信号を再生成する。ステレオの場合、相補性の特性が使用され、係数は、フィルタh c1およびh c2を生成するように再び組み合わされることが好ましい。 The receiver first decodes the transmitted monaural signal and channel filter. The receiver then regenerates a different channel signal by filtering the mono signal with the respective channel filter. In the case of stereo, the complementary property is used and the coefficients are preferably recombined to produce filters h c1 and h c2 .
再構築されたマルチチャネル信号の品質をさらに向上させるある後処理ステップが、異なるチャネル信号の再生成に続くことが可能である。 Certain post-processing steps that further improve the quality of the reconstructed multi-channel signal can follow the regeneration of the different channel signals.
ゲイン制約チャネル・フィルタを計算する前に、シェイプ制約フィルタまたはこれらのフィルタの線形結合のゲインを平滑化することが有益であることがある。 It may be beneficial to smooth the gain of the shape constrained filters or the linear combination of these filters before calculating the gain constrained channel filters.
たとえば、ステレオの場合、等価な副信号フィルタは、以下のようになり(図8において使用されるように)、 For example, for stereo, the equivalent sub-signal filter is as follows (as used in FIG. 8):
異音を低減するために、連続フレーム間のこのフィルタのゲイン差は平滑化され、以下のフィルタを得る。 In order to reduce abnormal noise, the gain difference of this filter between successive frames is smoothed to obtain the following filter:
次いで、チャネル・フィルタは、以下に従って修正される。 The channel filter is then modified according to the following.
このタイプの修正は、シェイプ制約を維持しないが、シェイプ制約は、副信号フィルタについて依然として維持され、これは、ステレオ・コーディングの場合に十分であることを容易に認識することができる。 Although this type of modification does not maintain the shape constraint, it can be readily recognized that the shape constraint is still maintained for the sub-signal filter, which is sufficient for stereo coding.
フィルタに対するゲイン制約は、以前に計算されたチャネル・エネルギ、すなわちEc1、Ec2を想定する。gc1、gc2などのフィルタのゲインを制御し、ゲインを限定することによって不必要な増幅を回避することが重要である。異なるチャネル信号の特性に応じて、チャネルが、全周波数範囲について、またはある周波数帯域において、反対相関されることが行われることが可能である。これにより、モノラル信号が形成されるとき、ある消去につながる。この場合、少なくとも部分的に、かついくつかの周波数帯域において、個々のチャネル情報は失われているので、チャネルゲインが0dBなどのある量より大きいとき、チャネルゲインを限定することが有益である。このゲイン制限を実施する1つの方式は、あるゲインファクタを計算することである。 The gain constraint for the filter assumes the previously calculated channel energy, ie E c1 , E c2 . It is important to avoid unnecessary amplification by controlling the gain of filters such as g c1 and g c2 and limiting the gain. Depending on the characteristics of the different channel signals, it can take place that the channels are cross-correlated for the entire frequency range or in a certain frequency band. This leads to some erasure when a monaural signal is formed. In this case, individual channel information is lost, at least in part and in some frequency bands, so it is beneficial to limit the channel gain when the channel gain is greater than some amount, such as 0 dB. One way to implement this gain limitation is to calculate a certain gain factor.
上式は、2つのチャネルが相関されていない場合、有効モノラル・チャネル・エネルギとモノラル・チャネルのエネルギとの比である。このファクタが0dBより小さいとき、信号消去を有する。この場合、gFは、この消去がどの程度厳密であるかを定量化する。次いで、ゲイン情報を以下のように計算することができる。 The above equation is the ratio of the effective mono channel energy to the mono channel energy when the two channels are not correlated. When this factor is less than 0 dB, it has signal cancellation. In this case, g F quantifies how severe this elimination is. The gain information can then be calculated as follows:
同じ制限が、他のチャネルのゲインに当てはまる。 The same restriction applies to the gain of other channels.
チャネル・フィルタ・パラメータだけが、符号化されて送信される必要があるのではなく、モノラル信号も必要である。チャネル・フィルタ係数を導出するとき、モノラル信号音声符号化を考慮する2つの異なる原理の手法がある。 Not only the channel filter parameters need to be encoded and transmitted, but also a mono signal. When deriving channel filter coefficients, there are two different principle approaches that take into account monaural signal speech coding.
開ループ方式では、フィルタは、元のモノラル信号に基づいて導出される。これは、たとえば、信号42が元のモノラル信号xである図2aの場合である。しかし、復号化器は、量子化されたモノラル信号をチャネルフィルタの入力として使用する。
In the open loop scheme, the filter is derived based on the original mono signal. This is the case for example in FIG. 2a, where the
閉ループ方式では、フィルタの計算は、コード化され、したがってすでに量子化されたモノラル信号に基づく。これは、たとえば、信号44が符号化されたモノラル信号x"である図3aの場合である。この手法は、チャネル・フィルタ設計が、最適な可能な方式でそれぞれのチャネル信号を整合させることだけを目的とするのではないという利点を有する。この手法は、モノラル信号符号化の結果である符号化誤差を軽減することも目的とする。
In the closed-loop scheme, the filter calculation is based on a monaural signal that has been coded and thus already quantized. This is the case, for example, in FIG. 3a, where the
これまで記述された原理は、完全スペクトル、すなわち完全帯域信号に適用可能である。しかし、これは、信号のサブ・バンドに適用可能であることが、同様に、またはさらに有益である。図9は、サブ・バンド処理の原理を示す。いくつかのチャネルc1〜cNが、Kのサブ・バンドSB1、SB2、SBkにおいてそれぞれ分割される。各サブ・バンドのチャネル信号は、それぞれのマルチチャネル符号化部80:1〜80:Kに出力され、そこで、チャネル信号は符号化される。マルチチャネル符号化部80:1〜80:Kの1つまたはいくつかは、本発明によるマルチチャネル符号化部とすることができる。ビットストリーム・コンバイナ82が、符号化信号を共通符号化信号53に組み合わせ、これが送信される。
The principles described so far are applicable to full spectrum, ie full band signals. However, it is equally or more beneficial that this is applicable to the signal sub-bands. FIG. 9 illustrates the principle of sub-band processing. Several channels c 1 to c N are respectively divided in the K sub-bands SB1, SB2 and SBk. Each sub-band channel signal is output to a respective multi-channel encoder 80: 1-80: K, where the channel signal is encoded. One or several of the multi-channel encoders 80: 1 to 80: K may be multi-channel encoders according to the present invention. A
上述されたサブ・バンド処理の利点は、異なるサブチャネルのマルチチャネル符号化を個々に実施して、たとえば割当てビットレート、処理フレーム・サイズ、およびサンプリングレートに関して最適化することができることである。 An advantage of the sub-band processing described above is that multi-channel coding of different sub-channels can be performed individually and optimized, for example with respect to allocation bit rate, processing frame size, and sampling rate.
1つの特別な種類のサブ・バンド処理は、たとえば200Hzより小さい非常に低い周波数についてマルチチャネル符号化を実施しない。これは、この非常に低い周波数帯域では、単なるモノラル信号が送信されることを意味する。この原理は、人のステレオ知覚が、非常に低い周波数では鋭敏さが劣るということを利用する。従来技術およびサブウーフィングから既知である。 One special type of sub-band processing does not perform multi-channel coding for very low frequencies, eg, below 200 Hz. This means that a simple monaural signal is transmitted in this very low frequency band. This principle takes advantage of the fact that human stereo perception is less sensitive at very low frequencies. Known from prior art and subwoofers.
サブ・バンド処理の他の実施形態では、バンド分割は、たとえば、信号を信号周波数成分に分解することを可能にする短時間フーリエ変換(STFT)などの時間周波数変換を使用して実施される。この場合、フィルタリングは、モノラル信号の個々のスペクトル係数と複素係数の単なる乗算になる。 In other embodiments of sub-band processing, band splitting is performed using a time-frequency transform, such as a short-time Fourier transform (STFT) that allows the signal to be decomposed into signal frequency components, for example. In this case, the filtering is simply a multiplication of the individual spectral coefficients of the monaural signal and the complex coefficients.
本発明によるパラメータ・マルチチャネル・コーディング方法は、信号サンプルの固定フレーム処理を通常含む。すなわち、マルチチャネル像を記述するパラメータが導出され、20msなどの符号化フレーム長に対応するレートにて送信される。しかし、パラメータは、符号化フレーム長よりはるかに長い信号フレームから得ることが可能である。適切な選択肢は、そのような分析フレームの長さを、符号化フレーム長より長い値に設定することである。これは、パラメータ計算が、重なり分析フレームで実施されることを示す。 The parametric multi-channel coding method according to the present invention typically includes fixed frame processing of signal samples. That is, parameters describing the multi-channel image are derived and transmitted at a rate corresponding to the encoded frame length such as 20 ms. However, the parameters can be obtained from signal frames that are much longer than the coding frame length. A suitable option is to set the length of such an analysis frame to a value longer than the encoded frame length. This indicates that the parameter calculation is performed in the overlap analysis frame.
これは、図10に示されている。符号化器の分析フレーム83が、図の上部に示されるように、符号化フレーム84よりわずかに長い。そのような重なり分析フレームの結果、パラメータは滑らかに推移する。これは、安定したマルチチャネル音声信号像を提供するために必須である。同じことが、図の中央に示されるように、復号化器側において実施される。したがって、復号化器において、これを考慮して、図の底部において示されるように、合成フレーム85に窓を付けて、重なり86を有して重複追加することが必須である。これにより、各フレームに関連付けられるフィルタ間を滑らかに移行することが可能になる。
This is illustrated in FIG. The
また符号化器において、平滑フィルタ・パラメータの展開を強化することができる。たとえば、低域通過または中間ろ過をフィルタ・パラメータに適用することが可能である。 In the encoder, the development of smoothing filter parameters can be enhanced. For example, low pass or intermediate filtration can be applied to the filter parameters.
従来技術のモノラル音声コーデック、ならびにスピーチ・コーデックは、符号化ノイズのいわゆるノイズシェイピングを実施する。この動作の目的は、信号が高いスペクトル密度を有し、したがって、雑音をより聞こえないようにする周波数に符号化ノイズを移動させることである。ノイズシェイピングは通常、適応的に実施される、すなわち、音声信号に応答して実施される。これは、一般に、モノラル信号に対して実施されるノイズシェイピングは、様々なチャネル信号に必要とされるものとは異なることを意味する。その結果、モノラル音声コーデックにおける適切なノイズシェイピングにもかかわらず、本発明によるその後のチャネルフィルタリングは、モノラル信号の可聴符号化ノイズと比較するとき、再構築されたマルチチャネル信号において可聴符号化の宇治を増大させることになる可能性がある。 Prior art mono speech codecs, as well as speech codecs, perform so-called noise shaping of coding noise. The purpose of this operation is to move the coding noise to a frequency where the signal has a high spectral density and thus makes the noise less audible. Noise shaping is usually performed adaptively, i.e. in response to an audio signal. This generally means that the noise shaping performed on a mono signal is different from that required for various channel signals. As a result, despite proper noise shaping in the mono speech codec, the subsequent channel filtering according to the present invention can be applied to the audible coding of the reconstructed multi-channel signal when compared to the audible coding noise of the mono signal. May increase.
この問題を軽減するために、信号適応ポストフィルタを、受信機の後処理ステップにおいて再構築チャネル信号に適用することが可能である。この場合、任意の従来技術のポストフィルタリング技法を使用することができ、これは、スペクトルの山を強調し、またはスペクトルの谷を深くし、それにより、可聴雑音を低減する。そのような技法の一例が、E.エクデン(Ekudden)らによる欧州特許0965123B1に記載されている。他の簡単な方法は、音声符号化で知られているいわゆるピッチ・ポストフィルタおよびフォルマント・ポストフィルタである。 To alleviate this problem, a signal adaptive post filter can be applied to the reconstructed channel signal in the receiver post-processing step. In this case, any prior art post-filtering technique can be used, which emphasizes spectral peaks or deepens spectral valleys, thereby reducing audible noise. An example of such a technique is E.I. It is described in European Patent 0965123B1 by Ekudden et al. Another simple method is the so-called pitch postfilter and formant postfilter known from speech coding.
図11において、本発明による符号化方法の一実施形態の主要ステップが、フローチャートにより示されている。手順は、ステップ200において開始される。ステップ220において、マルチチャネル信号から推測される好ましくはモノラル信号である主信号が、符号化される。ステップ222において、フィルタ係数が、主信号に適用されるとき、チャネル信号の可能な限り良好な表示を与えるように最適化される。最適化は、知覚制約の下で行われる。次いで、最適係数は、ステップ224において符号化される。手順は、ステップ299において終了する。
In FIG. 11, the main steps of one embodiment of the encoding method according to the invention are shown in a flowchart. The procedure begins at
上述した実施形態は、本発明のいくつかの例示として理解されるべきである。当業者であれば、上述の実施形態に対して様々な修正、組合せ、変更を、本発明の範囲から逸脱することなく行うことが可能であろう。具体的には、異なる実施形態の異なる部分的解決法を、技術的に可能であれば、他の構成において組み合わせることができる。いずれにせよ、本発明の範囲は添付の特許請求の範囲によって定義される。 The above-described embodiments should be understood as some examples of the invention. Those skilled in the art will be able to make various modifications, combinations and changes to the above-described embodiments without departing from the scope of the present invention. In particular, different partial solutions of different embodiments can be combined in other configurations where technically possible. In any case, the scope of the present invention is defined by the appended claims.
Claims (18)
前記マルチチャネル信号 (c1〜cN) の信号の第1所定線形結合である主信号 (x) を表す符号化パラメータ (px) を生成するステップと、
第1適応フィルタ (31; 131, 132, 133:1-2) の最適パラメータ (p1〜pN) を導出するステップと、
前記最適パラメータ (p1〜pN) を符号化するステップと
を有し、
少なくとも第2適応フィルタ (31; 131, 132, 133:1-2) の最適パラメータ (p1〜pN) を導出するステップを更に有し、
前記第1適応フィルタ (31; 131, 132, 133:1-2) が前記第1所定線形結合 (x) に適用されるとき、前記第1適応フィルタ (31; 131, 132, 133:1-2) は、前記第1チャネル (c1〜cN) の信号とフィルタ出力信号との最小差を与えるように導出され、
当該最小差は、第1の基準に従って確定され、
前記第2適応フィルタが前記第1所定線形結合 (x) に適用されるとき、前記第2適応フィルタは、前記第2チャネル (c1〜cN) の信号とフィルタ出力信号との最小差を与えるように導出され、
当該最小差は、第2の基準に従って確定され、
前記第1および第2適応フィルタ (31;131、132、133:1〜2) の各導出ステップは、ゲイン制約およびシェイプ制約の群から選択される少なくとも1つの知覚制約の下で実行される
ことを特徴とする方法。 A method for encoding a multi-channel signal (c 1 -c N ) having at least a first channel and a second channel, comprising:
Generating a coding parameter (p x ) representing a main signal (x) that is a first predetermined linear combination of signals of the multichannel signals (c 1 to c N );
Deriving optimal parameters (p 1 to p N ) of the first adaptive filter (31; 131, 132, 133: 1-2);
Encoding the optimal parameters (p 1 to p N ),
Further comprising deriving optimal parameters (p 1 to p N ) of at least the second adaptive filter (31; 131, 132, 133: 1-2);
When the first adaptive filter (31; 131, 132, 133: 1-2) is applied to the first predetermined linear combination (x), the first adaptive filter (31; 131, 132, 133: 1- 2) is derived to give the minimum difference between the signal of the first channel (c 1 to c N ) and the filter output signal,
The minimum difference is determined according to the first criterion,
When the second adaptive filter is applied to the first predetermined linear combination (x), the second adaptive filter calculates a minimum difference between the signal of the second channel (c 1 to c N ) and the filter output signal. Derived to give,
The minimum difference is determined according to the second criterion,
Each derivation step of the first and second adaptive filters (31; 131,132,133: 1-2) is performed under at least one perceptual constraint selected from the group of gain constraints and shape constraints A method characterized by.
ただし、h c ucは、ゲイン制約を有さずに導出された適応フィルタ、Ecは適応フィルタ出力信号の規定エネルギー、^cuc(n)はゲイン制約を有さない主信号x (n) の適応フィルタ出力である。 The method of claim 6, wherein the gain constraint filter h c gc is given by:
Where h c uc is an adaptive filter derived without gain constraints, E c is the specified energy of the adaptive filter output signal, and ^ c uc (n) is the main signal x (n) without gain constraints Is an adaptive filter output.
前記マルチチャネル信号 (c1〜cN) の信号の第2所定線形結合 (s; c* 1〜c* N-1) を生成するステップと、
第3フィルタが、前記シェイプ制約の下で前記第1所定線形結合に対して適用されるとき、前記第2所定線形結合と前記フィルタ出力信号との間の最小差を与えるように前記第3フィルタのパラメータを導出するステップと、
前記第1および第2フィルタの前記最適パラメータを前記第3フィルタの最適パラメータの関数として計算するステップと
を含むことを特徴とする請求項1から10までのいずれかに記載の方法。 Said step of deriving parameters comprises:
Generating a; (c * 1 ~c * N -1 s), the multi-channel signal a second predetermined linear combination of (c 1 ~c N) of the signal
When the third filter is applied to the first predetermined linear combination under the shape constraint, the third filter is configured to provide a minimum difference between the second predetermined linear combination and the filter output signal. Deriving parameters of
11. The method according to claim 1, comprising calculating the optimal parameters of the first and second filters as a function of the optimal parameters of the third filter.
前記主信号を表す前記符号化パラメータ (px) を復号化するステップと、
前記第1適応フィルタ (60:1〜60:N) を前記復号された主信号 (x") に適用することによって、第1チャネル (c"1〜c"N) の信号を生成するステップと
を有し、
前記符号化パラメータ (px) は、第2適応フィルタ (60:1〜60:N) の符号化最適パラメータをさらに表し、
前記第2適応フィルタ (60:1〜60:N) を前記復号された主信号 (x") に適用することによって、第2チャネル (c"1〜c"N) の信号を生成するステップを更に有し、
前記第1および第2適応フィルタ (30:1〜30:N) は、ゲイン制約およびシェイプ制約の群から選択される少なくとも1つの知覚制約の下で最適化される
ことを特徴とする方法。 A method for decoding a polyphonic signal having a coding parameter (p x ) representing a main signal and a coding optimal parameter of a first adaptive filter (60: 1 to 60: N) comprising:
Decoding the encoding parameter (p x ) representing the main signal;
Applying the first adaptive filter (60: 1 to 60: N) to the decoded main signal (x ") to generate a signal of a first channel (c" 1 to c " N ); Have
The encoding parameter (p x ) further represents an encoding optimal parameter of the second adaptive filter (60: 1 to 60: N),
Applying the second adaptive filter (60: 1 to 60: N) to the decoded main signal (x ") to generate a signal of a second channel (c" 1 to c " N ); In addition,
The method wherein the first and second adaptive filters (30: 1 to 30: N) are optimized under at least one perceptual constraint selected from a group of gain constraints and shape constraints.
前記入力手段 (16:1〜16:N) に接続され、前記マルチチャネル信号 (c1〜cN) の信号の第1所定線形組み合わせである主信号 (x) を表す符号化パラメータ (px) を生成する手段 (38) と、
第1適応フィルタの最適パラメータを導出する手段 (31; 131, 132, 133:1-2) と、
前記最適パラメータを符号化する手段 (66) と、
出力手段 (52) と
を有し、
第2適応フィルタの最適パラメータを導出する手段 (31; 131, 132, 133:1-2) を更に有し、
前記第1適応フィルタが前記第1所定線形結合 (x) に適用されるとき、前記第1適応フィルタは、前記第1チャネル (c1〜cN) の信号とフィルタ出力信号との最小差を与え、
当該最小差は、第1の基準に従って確定され、
前記第2適応フィルタが前記第1所定線形結合 (x) に対して適用されるとき、前記第2適応フィルタは、前記第2チャネル (c1〜cN) の信号とフィルタ出力信号との最小差を与え、
当該最小差は、第2の基準に従って確定され、
前記第1および第2適応フィルタの最適パラメータを導出する各手段 (31; 131, 132, 133:1-2) は、ゲイン制約およびシェイプ制約の群から選択される少なくとも1つの知覚制約の下で前記最適パラメータを導出するように構成される
ことを特徴とする符号化装置 (14) 。 Input means (16: 1 to 16: N) for inputting a multi-channel signal (c 1 to c N ) comprising at least a first channel and a second channel;
An encoding parameter (p x ) connected to the input means (16: 1 to 16: N) and representing a main signal (x) that is a first predetermined linear combination of the signals of the multichannel signals (c 1 to c N ). ) (38)
Means for deriving optimal parameters of the first adaptive filter (31; 131, 132, 133: 1-2);
Means (66) for encoding said optimal parameters;
Output means (52) and
Means (31; 131, 132, 133: 1-2) for deriving optimal parameters of the second adaptive filter;
When the first adaptive filter is applied to the first predetermined linear combination (x), the first adaptive filter calculates a minimum difference between the signal of the first channel (c 1 to c N ) and the filter output signal. Give,
The minimum difference is determined according to the first criterion,
When the second adaptive filter is applied to the first predetermined linear combination (x), the second adaptive filter is the minimum of the signal of the second channel (c 1 to c N ) and the filter output signal. Give the difference
The minimum difference is determined according to a second criterion,
Each means (31; 131, 132, 133: 1-2) for deriving optimal parameters of the first and second adaptive filters is subject to at least one perceptual constraint selected from a group of gain constraints and shape constraints. An encoding device (14), which is configured to derive the optimum parameter.
主信号 (x) を表す前記符号化パラメータ (px) を復号化する手段 (64) と、
前記第1適応フィルタを復号された前記主信号 (x") に適用することによって、第1チャネルの信号を生成する手段 (60:1〜60:N) と
を有し、
前記符号化パラメータ (px) が、第2適応フィルタ (60:1〜60:N) の符号化最適パラメータをさらに表し、
前記第2適応フィルタを復号された前記主信号 (x") に適用することによって、第2チャネルの信号を生成する手段を更に有し、
前記第1および第2適応フィルタは、ゲイン制約およびシェイプ制約の群から選択される少なくとも1つの知覚制約の下で制約される
ことを特徴とする復号化装置 (24) 。 Input means (54) for inputting a coding parameter representing the main signal (x) and a coding optimum parameter of the first adaptive filter;
Means (64) for decoding the encoding parameter (p x ) representing the main signal (x);
Means (60: 1 to 60: N) for generating a first channel signal by applying the first adaptive filter to the decoded main signal (x ");
The encoding parameter (p x ) further represents an encoding optimal parameter of the second adaptive filter (60: 1 to 60: N);
Means for generating a second channel signal by applying the second adaptive filter to the decoded main signal (x ");
The decoding device (24), wherein the first and second adaptive filters are constrained under at least one perceptual constraint selected from a group of a gain constraint and a shape constraint.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0303499A SE0303499D0 (en) | 2003-12-19 | 2003-12-19 | Multi-channel coding using gain-shape constrained filters |
SE0400415A SE527713C2 (en) | 2003-12-19 | 2004-02-20 | Coding of polyphonic signals with conditional filters |
PCT/SE2004/001907 WO2005059901A1 (en) | 2003-12-19 | 2004-12-15 | Constrained filter encoding of polyphonic signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007527543A true JP2007527543A (en) | 2007-09-27 |
JP4323520B2 JP4323520B2 (en) | 2009-09-02 |
Family
ID=31996352
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006518597A Expired - Fee Related JP4323520B2 (en) | 2003-12-19 | 2004-12-15 | Constrained filter coding of polyphonic signals |
Country Status (8)
Country | Link |
---|---|
EP (2) | EP2456236A1 (en) |
JP (1) | JP4323520B2 (en) |
DK (1) | DK1639580T3 (en) |
ES (1) | ES2439693T3 (en) |
PL (1) | PL1639580T3 (en) |
PT (1) | PT1639580E (en) |
SE (1) | SE527713C2 (en) |
WO (1) | WO2005059901A1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2008016098A1 (en) * | 2006-08-04 | 2009-12-24 | パナソニック株式会社 | Stereo speech coding apparatus, stereo speech decoding apparatus, and methods thereof |
WO2010042024A1 (en) * | 2008-10-10 | 2010-04-15 | Telefonaktiebolaget Lm Ericsson (Publ) | Energy conservative multi-channel audio coding |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434948A (en) | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
NL9100173A (en) | 1991-02-01 | 1992-09-01 | Philips Nv | SUBBAND CODING DEVICE, AND A TRANSMITTER EQUIPPED WITH THE CODING DEVICE. |
US5285498A (en) | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
SE9700772D0 (en) | 1997-03-03 | 1997-03-03 | Ericsson Telefon Ab L M | A high resolution post processing method for a speech decoder |
WO2003009206A1 (en) * | 2001-07-19 | 2003-01-30 | Sungwoo Kim | The system and operational method of mobile telecommunication device for electronic cash |
WO2003009208A1 (en) * | 2001-07-20 | 2003-01-30 | Medical Research Group | Method and apparatus for communicating between an ambulatory medical device and a control device via telemetry using randomized data |
ATE354161T1 (en) | 2002-04-22 | 2007-03-15 | Koninkl Philips Electronics Nv | SIGNAL SYNTHESIS |
-
2004
- 2004-02-20 SE SE0400415A patent/SE527713C2/en unknown
- 2004-12-15 ES ES04809080.7T patent/ES2439693T3/en active Active
- 2004-12-15 PL PL04809080T patent/PL1639580T3/en unknown
- 2004-12-15 EP EP12154099A patent/EP2456236A1/en not_active Ceased
- 2004-12-15 JP JP2006518597A patent/JP4323520B2/en not_active Expired - Fee Related
- 2004-12-15 PT PT48090807T patent/PT1639580E/en unknown
- 2004-12-15 DK DK04809080.7T patent/DK1639580T3/en active
- 2004-12-15 WO PCT/SE2004/001907 patent/WO2005059901A1/en not_active Application Discontinuation
- 2004-12-15 EP EP04809080.7A patent/EP1639580B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP2456236A1 (en) | 2012-05-23 |
SE0400415L (en) | 2005-06-20 |
DK1639580T3 (en) | 2014-01-13 |
JP4323520B2 (en) | 2009-09-02 |
ES2439693T3 (en) | 2014-01-24 |
WO2005059901A1 (en) | 2005-06-30 |
PT1639580E (en) | 2013-11-19 |
SE0400415D0 (en) | 2004-02-20 |
EP1639580A1 (en) | 2006-03-29 |
PL1639580T3 (en) | 2014-04-30 |
EP1639580B1 (en) | 2013-10-23 |
SE527713C2 (en) | 2006-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7193603B2 (en) | Decoder system, decoding method and computer program | |
JP4335917B2 (en) | Fidelity optimized variable frame length coding | |
US9812136B2 (en) | Audio processing system | |
JP4809370B2 (en) | Adaptive bit allocation in multichannel speech coding. | |
KR101183857B1 (en) | Method and apparatus to encode and decode multi-channel audio signals | |
US7809579B2 (en) | Fidelity-optimized variable frame length encoding | |
CN108369810B (en) | Adaptive channel reduction processing for encoding multi-channel audio signals | |
EP1851759A1 (en) | Improved filter smoothing in multi-channel audio encoding and/or decoding | |
US7725324B2 (en) | Constrained filter encoding of polyphonic signals | |
JP4927264B2 (en) | Method for encoding an audio signal | |
JP4323520B2 (en) | Constrained filter coding of polyphonic signals | |
AU2007237227B2 (en) | Fidelity-optimised pre-echo suppressing encoding | |
Schuler | Audio Coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080507 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080717 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080725 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090105 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090325 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090508 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090604 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4323520 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120612 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120612 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130612 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |