JP2003508806A - Transmission system with improved encoder and decoder - Google Patents

Transmission system with improved encoder and decoder

Info

Publication number
JP2003508806A
JP2003508806A JP2001520406A JP2001520406A JP2003508806A JP 2003508806 A JP2003508806 A JP 2003508806A JP 2001520406 A JP2001520406 A JP 2001520406A JP 2001520406 A JP2001520406 A JP 2001520406A JP 2003508806 A JP2003508806 A JP 2003508806A
Authority
JP
Japan
Prior art keywords
signal
audio
segment
deriving
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001520406A
Other languages
Japanese (ja)
Inventor
アルノルダス ダブリュ ジェイ オーメン
ブリンカー アルベルタス シー デン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2003508806A publication Critical patent/JP2003508806A/en
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission

Abstract

(57)【要約】 正弦オーディオエンコーダにおいて、周波数スペクトルの異なる部分を解析するために異なる時間軸を使用することは既知である。従来のエンコーダにおいては、入力信号を多数の副バンドに分割するために副バンドフィルタ処理が使用されている。入力信号を副バンドに分割することにより、2つのバンドの境界における信号成分が両副バンドの信号において表現される結果となることが起こり得る。この信号成分の二重の表現は、これら成分の符号化の際の幾つかの問題につながり得る。本発明によれば、信号成分が多重の表現を有するのを防止する防止手段(46、48、58、68;88、92、96)を使用することが提案される。 (57) Abstract In sine audio encoders it is known to use different time bases to analyze different parts of the frequency spectrum. In conventional encoders, sub-band filtering is used to divide the input signal into a number of sub-bands. Dividing the input signal into sub-bands can result in signal components at the boundaries of the two bands being represented in the signals of both sub-bands. This double representation of the signal components can lead to some problems in encoding these components. According to the invention, it is proposed to use prevention means (46, 48, 58, 68; 88, 92, 96) which prevent the signal components from having multiple representations.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【技術分野】【Technical field】

本発明は、オーディオエンコーダを備える送信器を有する伝送システムに係り
、上記オーディオエンコーダがオーディオ信号を表す入力信号から少なくとも第
1信号セグメントと第2信号セグメントとを導出するセグメント化手段を有し、
上記第1信号セグメントが上記第2信号セグメントより長く、上記オーディオエ
ンコーダが上記第1及び第2信号セグメントから符号化されたオーディオ信号を
導出する手段を有し、前記送信器が伝送媒体を介して受信器に上記の符号化され
たオーディオ信号を送信する送信手段を有し、上記受信器が上記伝送媒体から上
記の符号化されたオーディオ信号を受信する受信手段を有すると共に、該符号化
されたオーディオ信号から復号されたオーディオ信号を導出するオーディオデコ
ーダを更に有するような伝送システムに関する。
The present invention relates to a transmission system comprising a transmitter comprising an audio encoder, said audio encoder comprising segmenting means for deriving at least a first signal segment and a second signal segment from an input signal representing an audio signal,
The first signal segment is longer than the second signal segment, the audio encoder has means for deriving an encoded audio signal from the first and second signal segments, and the transmitter is via a transmission medium. The receiver has transmitting means for transmitting the encoded audio signal, the receiver has receiving means for receiving the encoded audio signal from the transmission medium, and the encoded means It relates to a transmission system further comprising an audio decoder for deriving a decoded audio signal from the audio signal.

【0002】 また、本発明は、送信器、エンコーダ、符号化方法、符号化方法を実行するコ
ンピュータプログラムを担持する有形媒体、及び符号化方法を実行するコンピュ
ータプログラムを伝送する信号にも関する。
The invention also relates to a transmitter, an encoder, a coding method, a tangible medium carrying a computer program for carrying out the coding method, and a signal carrying the computer program for carrying out the coding method.

【0003】[0003]

【背景技術】[Background technology]

請求項1の前置部に記載されたような伝送システムは、米国特許第5,886,276
号から既知である。
A transmission system as described in the preamble of claim 1 is disclosed in US Pat. No. 5,886,276.
It is known from the issue.

【0004】 斯様な伝送システム及びオーディオエンコーダは、オーディオ信号を限られた
伝送容量しか有さない伝送媒体を介して伝送しなければならない又は限られた記
憶容量しか有さない記憶媒体に記憶しなければならないような用途で使用される
。斯様な用途の例としては、インターネット上でのオーディオ信号の伝送、移動
電話から基地局への又はその逆のオーディオ信号の伝送、及びCD−ROM、固
体メモリ又はハードディスク装置へのオーディオ信号の記憶がある。
Such a transmission system and an audio encoder store an audio signal in a storage medium which must be transmitted via a transmission medium having a limited transmission capacity or has a limited storage capacity. Used in applications where it must be. Examples of such applications include the transmission of audio signals over the Internet, the transmission of audio signals from mobile phones to base stations and vice versa, and the storage of audio signals in CD-ROM, solid state memory or hard disk drives. There is.

【0005】 限られたビットレートにおいて良好なオーディオ品質を達成するために、異な
る動作原理のオーディオエンコーダが試されてきた。これらの動作方法のうちの
1つにおいては、伝送されるべきオーディオ信号が、通常10ないし20msの
固定長を有するような複数のセグメントに分割される。これらセグメントの各々
において、オーディオ信号は、振幅、周波数及び多分位相により規定されるシヌ
ソイドであり得るような複数の信号成分により表される。
In order to achieve good audio quality at limited bit rates, audio encoders of different working principles have been tried. In one of these operating methods, the audio signal to be transmitted is divided into a plurality of segments, which typically have a fixed length of 10 to 20 ms. In each of these segments, the audio signal is represented by a plurality of signal components, which may be sinusoids defined by amplitude, frequency and possibly phase.

【0006】 送信器は上記信号成分の振幅及び周波数の表現を受信器に送信する。該送信器
により行われる動作は、チャンネル符号化、インターリーブ及び変調を含むこと
ができる。
The transmitter sends the amplitude and frequency representations of the signal components to the receiver. The operations performed by the transmitter may include channel coding, interleaving and modulation.

【0007】 受信手段は、伝送チャンネルから上記オーディオ信号を表す信号を受信すると
共に、復調、逆インターリーブ及びチャンネル復号のような動作を実行する。デ
コーダは、上記受信手段から上記オーディオ信号の表現を受け取り、前記符号化
された信号により表された複数のシヌソイドを発生すると共にこれらを出力信号
に合成することにより、上記表現から再生オーディオ信号を導出する。
The receiving means receives a signal representing the audio signal from the transmission channel and performs operations such as demodulation, deinterleaving and channel decoding. A decoder derives a reproduced audio signal from the representation by receiving the representation of the audio signal from the receiving means, generating a plurality of sinusoids represented by the encoded signal and combining them into an output signal. To do.

【0008】 これらのオーディオエンコーダの問題は、上記信号セグメントに対する適切な
長さ(時間単位での)を選択することにある。信号セグメントが長いと、信号成
分の決定に関する良好な周波数分解能を得ることは可能となるが、限られた時間
分解能の結果として、前エコー(pre-echo)と呼ばれる現象が起こり得る。前エ
コーは、オーディオ信号の急激なアタックのような事象(イベント)が、斯かる
イベントの実際の発生の前に既に聞こえる場合に発生する。信号セグメントが短
い場合は前エコーに関する問題は発生しないが、低周波数を伴う信号成分の決定
に対する周波数分解能が劇的に低下する。
The problem with these audio encoders lies in choosing the proper length (in time units) for the signal segment. Long signal segments make it possible to obtain good frequency resolution for the determination of signal components, but a phenomenon called pre-echo can occur as a result of the limited temporal resolution. Pre-echo occurs when a sudden attack-like event of an audio signal is already heard before the actual occurrence of such event. The problem with pre-echo does not occur when the signal segment is short, but the frequency resolution for the determination of signal components with low frequencies is dramatically reduced.

【0009】 これを改善するために、上記米国特許においては、入力信号が副バンドフィル
タにより多数の副バンドに分割され、これら副バンドの各々に対して異なる長さ
の信号セグメントが選択される。これら信号セグメントの長さは、対応する副バ
ンドの周波数範囲に逆比例するように選択される。
In order to improve this, in said US patent the input signal is divided into a number of sub-bands by means of sub-band filters and a signal segment of different length is selected for each of these sub-bands. The lengths of these signal segments are chosen to be inversely proportional to the frequency range of the corresponding subband.

【0010】 この方法の問題点は、副バンドの遷移バンド付近に位置する信号成分に対する
符号化品質が他の信号成分に対するものより低い点にある。
The problem with this method is that the coding quality for signal components located near the transition band of the sub-band is lower than that for other signal components.

【0011】[0011]

【発明の開示】DISCLOSURE OF THE INVENTION

本発明の目的は、前記前置部に記載したような伝送システムであって、上記問
題が解決されるような伝送システムを提供することにある。
An object of the present invention is to provide a transmission system as described in the above-mentioned front part, which solves the above-mentioned problems.

【0012】 上記目的を達成するため、本発明による伝送システムは、前記符号化手段が、
符号化されたオーディオ信号に単一信号成分の多重表現が発生するのを防止する
防止手段を有することを特徴とする。
In order to achieve the above object, in the transmission system according to the present invention, the encoding means includes:
It is characterized in that it has a prevention means for preventing multiple representations of a single signal component from occurring in the encoded audio signal.

【0013】 本発明は、従来のシステムにおいては、副バンドフィルタの遷移バンドにおけ
る周波数が入力信号における同一の信号成分の多重表現につながってしまうとい
う認識に基づくものである。これらの多重表現は、送信されるべき信号成分を決
定するために音響心理学的モデルが使用されるような場合には好ましくない。更
に、符号化された信号において2度表現されている信号成分を再構築するのは困
難である。また、多重表現は、信号成分の多重表現がない場合に存在するよりも
大きなビットレートにつながってしまう。
The invention is based on the recognition that in conventional systems the frequencies in the transition band of the subband filter lead to multiple representations of the same signal component in the input signal. These multiple representations are not preferred where a psychoacoustic model is used to determine the signal components to be transmitted. Moreover, it is difficult to reconstruct the signal components that are represented twice in the coded signal. Also, multiple representations lead to higher bit rates than would exist if there were no multiple representations of signal components.

【0014】 単一信号成分のこれら多重表現を防止又は抑圧するために上記防止手段を使用
することにより、関連する問題も除去されることになる。
By using the above prevention measures to prevent or suppress these multiple representations of a single signal component, the associated problems will also be eliminated.

【0015】 本発明の一実施例においては、上記防止手段は前記第1信号セグメントを表す
符号化されたオーディオ信号の一部から合成オーディオ信号を導出する合成手段
と、前記入力信号を表す信号から上記合成オーディオ信号を減算することにより
前記第2信号セグメントを導出する減算手段とを有する。オーディオ信号を表す
信号から第1信号セグメントを表す合成オーディオ信号を減算して第2信号セグ
メントを得ることにより、第1信号セグメントから決定された信号成分が、上記
オーディオ信号を表す信号から削除されるようになる。結果として、これらの信
号成分は第2信号セグメントにおいては存在しないか又は強く減衰される。この
ようにして、前記単一信号成分の多重表現が防止される。
In one embodiment of the invention, the preventing means comprises a combining means for deriving a combined audio signal from a portion of the encoded audio signal representing the first signal segment and a signal representing the input signal. Subtracting means for deriving the second signal segment by subtracting the synthesized audio signal. The signal component determined from the first signal segment is removed from the signal representing the audio signal by subtracting the composite audio signal representing the first signal segment from the signal representing the audio signal to obtain the second signal segment. Like As a result, these signal components are either absent or strongly attenuated in the second signal segment. In this way, multiple representations of the single signal component are prevented.

【0016】 本発明の他の実施例においては、前記セグメント化手段が前記入力信号から他
の信号セグメントを導出するように構成され、該他の信号セグメントは前記第1
信号セグメントより長く、前記オーディオエンコーダは前記符号化されたオーデ
ィオ信号を上記他の信号セグメントにも基づいて導出するように構成され、前記
オーディオエンコーダが更に、上記他の信号セグメントを表す前記符号化された
オーディオ信号の一部から他の合成信号を導出する合成手段と、前記入力信号を
表す信号から上記他の合成オーディオ信号を減算することにより前記第1信号セ
グメントを導出する減算手段とを有している。実験は、セグメント内の周期の数
が大き過ぎることもなく小さ過ぎることもないので、少なくとも3つの異なる長
さを持つ連続するセグメントを使用するのが有利であることを示している。
In another embodiment of the invention the segmenting means is arranged to derive another signal segment from the input signal, the other signal segment being the first signal segment.
Longer than a signal segment, the audio encoder is configured to derive the encoded audio signal also based on the other signal segment, the audio encoder further comprising the encoded signal representing the other signal segment. And a subtracting means for deriving the first signal segment by subtracting the other synthesized audio signal from the signal representing the input signal. ing. Experiments have shown that it is advantageous to use consecutive segments with at least three different lengths, as the number of periods in the segment is neither too large nor too small.

【0017】 本発明の更に他の実施例においては、前記オーディオエンコーダが、フィルタ
処理された信号を前記入力信号から導出するフィルタを有すると共に、該フィル
タ処理された信号から前記第1信号セグメントを導出するように構成される。入
力信号をフィルタ処理することにより、上記入力信号から幾つかの信号成分を除
去して、残りの信号成分の決定を一層信頼性のあるものにすることが可能である
。第1信号セグメントに最早存在しない信号成分は、第2(又は他の)信号セグ
メントに存在し、そこで決定される。結果として、出力信号の一層完全な表現が
得られる。
In yet another embodiment of the invention, the audio encoder comprises a filter for deriving a filtered signal from the input signal and deriving the first signal segment from the filtered signal. To be configured. By filtering the input signal, it is possible to remove some signal components from the input signal, making the determination of the remaining signal components more reliable. Signal components that are no longer present in the first signal segment are present in the second (or other) signal segment and are determined there. As a result, a more complete representation of the output signal is obtained.

【0018】 本発明の更に他の実施例は、前記符号化手段が、音響心理学的スケールで振幅
を表すように構成されていることを特徴とする。振幅を表すために音響心理学的
スケールを使用する結果、伝送チャンネルが一層効率的に使用される。何故なら
、所与のダイナミックレンジを持つ信号を表すのに、より少ないシンボルしか必
要とされないからである。斯様な音響心理学的スケールは、例えば対数スケール
とすることができる。
Yet another embodiment of the present invention is characterized in that the encoding means is arranged to represent amplitude on a psychoacoustic scale. As a result of using a psychoacoustic scale to represent the amplitude, the transmission channel is used more efficiently. This is because less symbols are needed to represent a signal with a given dynamic range. Such a psychoacoustic scale can be, for example, a logarithmic scale.

【0019】[0019]

【発明を実施するための最良の形態】BEST MODE FOR CARRYING OUT THE INVENTION

以下、本発明を、図面を参照して説明する。   Hereinafter, the present invention will be described with reference to the drawings.

【0020】 図1による伝送システムにおいては、送信されるべきオーディオ信号は送信器
2の入力端に供給される。送信器2においては、上記入力信号はオーディオエン
コーダ4に供給される。該オーディオエンコーダ4において、上記入力信号は減
算器12の第1入力端と、解析ユニット8の入力端とに供給される。解析ユニッ
ト8は、その入力信号に存在する正弦信号成分の振幅、位相及び周波数を決定す
る。
In the transmission system according to FIG. 1, the audio signal to be transmitted is supplied to the input of the transmitter 2. In the transmitter 2, the input signal is supplied to the audio encoder 4. In the audio encoder 4, the input signal is supplied to the first input terminal of the subtracter 12 and the input terminal of the analysis unit 8. The analysis unit 8 determines the amplitude, phase and frequency of the sinusoidal signal components present in its input signal.

【0021】 上記正弦信号成分の振幅、位相及び周波数を表す出力信号を帯びる該解析ユニ
ット8の出力端は、合成器10の入力端とマルチプレクサ16の入力端とに接続
されている。上記合成器は、解析ユニット8から入力された振幅、位相及び周波
数に基づいて、複数のシヌソイドからなる合成オーディオ信号を発生する。
The output end of the analysis unit 8 carrying an output signal representing the amplitude, phase and frequency of the sine signal component is connected to the input end of the combiner 10 and the input end of the multiplexer 16. The synthesizer generates a synthetic audio signal composed of a plurality of sinusoids based on the amplitude, phase and frequency input from the analysis unit 8.

【0022】 上記合成オーディオ信号を伝送する上記合成器10の出力は、減算器12の第
2入力端に供給される。該減算器12は、合成器10により発生された上記合成
オーディオ信号を前記入力信号から減算する。
The output of the synthesizer 10 for transmitting the synthesized audio signal is supplied to the second input terminal of the subtracter 12. The subtractor 12 subtracts the synthesized audio signal generated by the synthesizer 10 from the input signal.

【0023】 減算器12の出力信号は、ノイズ解析器14に供給される。このノイズ解析器
14は、その入力におけるノイズ信号のスペクトルを決定する。該ノイズスペク
トルの表現情報はマルチプレクサ16に供給される。マルチプレクサ16は、解
析ユニット8及びノイズ解析器14からの各信号を組み合わせて、複合信号(co
mbined signal)にする。
The output signal of the subtractor 12 is supplied to the noise analyzer 14. This noise analyzer 14 determines the spectrum of the noise signal at its input. The expression information of the noise spectrum is supplied to the multiplexer 16. The multiplexer 16 combines the signals from the analysis unit 8 and the noise analyzer 14 into a composite signal (co
mbined signal).

【0024】 マルチプレクサ16は、好ましくは、解析ユニット8により決定されたどの信
号成分が知覚的に関連するかを決定するために音響心理学的モデルを使用するも
のとする。知覚的に関連のある信号成分のみが送信される。知覚的に関連のある
信号成分を決定する音響心理学的モデルは、周波数ドメインのエンコーダでは普
通に使用されており、従って当業者には既知である。
The multiplexer 16 preferably uses a psychoacoustic model to determine which signal components determined by the analysis unit 8 are perceptually relevant. Only perceptually relevant signal components are transmitted. Psychoacoustic models that determine perceptually relevant signal components are commonly used in frequency domain encoders and are therefore known to those skilled in the art.

【0025】 マルチプレクサ16の出力信号は当該オーディオエンコーダ4の出力信号を構
成している。オーディオエンコーダ4の出力端は送信ユニット6の入力端に接続
され、該送信ユニットは伝送媒体3を介して受信器24に送信するのに適した信
号を発生する。送信ユニット6は、チャンネル符号化、インターリーブ及び変調
のような動作を行う。
The output signal of the multiplexer 16 constitutes the output signal of the audio encoder 4. The output of the audio encoder 4 is connected to the input of a transmission unit 6, which produces a signal suitable for transmission via the transmission medium 3 to the receiver 24. The transmission unit 6 performs operations such as channel coding, interleaving and modulation.

【0026】 伝送媒体3からの信号は、受信器24における受信ユニット18に供給される
。受信ユニット18は、復調、逆インターリーブ及びチャンネル復号のような動
作を行う。
The signal from the transmission medium 3 is supplied to the receiving unit 18 in the receiver 24. The receiving unit 18 performs operations such as demodulation, deinterleaving and channel decoding.

【0027】 受信ユニット18の出力端は、オーディオデコーダ22の入力端に接続されて
いる。該オーディオデコーダ22において、上記受信ユニットからの信号はデマ
ルチプレクサ20に供給され、該デマルチプレクサは解析ユニット8により決定
された正弦信号成分を表す第1信号及び解析器14により決定されたノイズスペ
クトルを表す第2信号を出力する。
The output terminal of the receiving unit 18 is connected to the input terminal of the audio decoder 22. In the audio decoder 22, the signal from the receiving unit is supplied to a demultiplexer 20, which demultiplexes the first signal representing the sinusoidal signal component determined by the analysis unit 8 and the noise spectrum determined by the analyzer 14. And outputs a second signal that represents.

【0028】 上記第1信号はシヌソイド合成器26に供給され、該合成器は上記第1信号か
ら合成信号を導出する。合成器26は、エンコーダ4に使用される合成器10と
同様のものである。上記第2信号はノイズ合成器28に供給され、該合成器は該
第2信号により規定されるスペクトルを持つようなノイズ信号を発生する。これ
は、受信されたスペクトルにIFFTを実行することによりなされ、そこではラ
ンダムな位相がスペクトル成分に割り当てられる。シヌソイド合成器26及びノ
イズ合成器28の出力信号は加算器30により加算され、前記入力オーディオ信
号の複製が得られる。
The first signal is supplied to a sinusoidal combiner 26, which derives a combined signal from the first signal. The combiner 26 is similar to the combiner 10 used in the encoder 4. The second signal is supplied to a noise synthesizer 28, which produces a noise signal having a spectrum defined by the second signal. This is done by performing an IFFT on the received spectrum, where random phases are assigned to the spectral components. The output signals of the sinusoidal synthesizer 26 and the noise synthesizer 28 are added by an adder 30 to obtain a duplicate of the input audio signal.

【0029】 図2の解析ユニット(解析器)8においては、入力信号はセグメント化ユニッ
ト42とローパスフィルタ30の入力端とに供給される。セグメント化ユニット
42は上記入力信号から360サンプルを有するセグメントを選択する。上記入
力信号の44.1kHzなるサンプルレートの場合、これは8.16msなる解析周
期(期間)に相当する。
In the analysis unit (analyzer) 8 of FIG. 2, the input signal is supplied to the segmentation unit 42 and the input end of the low pass filter 30. The segmentation unit 42 selects a segment having 360 samples from the input signal. For a sample rate of 44.1 kHz of the input signal, this corresponds to an analysis period of 8.16 ms.

【0030】 ローパスフィルタ30の出力端はデシメータ32の入力端に接続され、該デシ
メータは上記サンプルレートを3なる係数で低減する。ローパスフィルタ30は
偽信号防止を行うもので、500Hzなる遮断周波数を有する。この遮断周波数は
、偽信号防止に必要とされるものよりもかなり低いが、対応する解析窓内の小さ
な周期数を持つ信号のみが殆ど減衰されずに通過するように設計されている。
The output terminal of the low-pass filter 30 is connected to the input terminal of the decimator 32, and the decimator reduces the sample rate by a factor of 3. The low-pass filter 30 prevents false signals and has a cutoff frequency of 500 Hz. This cutoff frequency is much lower than that required for spurious protection, but is designed so that only signals with a small number of periods within the corresponding analysis window pass with little attenuation.

【0031】 デシメータ32の出力端はセグメント化ユニット40の入力端とローパスフィ
ルタ34の入力端とに接続されている。セグメント化ユニット40は、デシメー
タ32の出力から360サンプルを有するセグメントを選択する。14.7kHzな
る(低下された)サンプルレートの場合、これは24.5msなる解析周期に相
当する。
The output of the decimator 32 is connected to the input of the segmenting unit 40 and the input of the low pass filter 34. The segmentation unit 40 selects a segment having 360 samples from the output of the decimator 32. For a sample rate of 14.7 kHz (decreased), this corresponds to an analysis period of 24.5 ms.

【0032】 ローパスフィルタ34は、165Hzなる遮断周波数を有する。該ローパスフィ
ルタ34の出力端はデシメータ36の入力端に接続され、該デシメータはサンプ
ルレートを再び3なる係数により低減する。デシメータ36の出力端はセグメン
ト化ユニット38の入力端に接続され、該ユニットは256サンプルを有するセ
グメントを選択する。(2倍低減された)4.9kHzなるサンプルレートの場合、
これは52.2msなる解析周期に相当する。
The low pass filter 34 has a cutoff frequency of 165 Hz. The output of the low pass filter 34 is connected to the input of a decimator 36, which again reduces the sample rate by a factor of 3. The output of decimator 36 is connected to the input of segmentation unit 38, which selects the segment having 256 samples. For a sample rate of 4.9 kHz (reduced by a factor of 2),
This corresponds to an analysis cycle of 52.2 ms.

【0033】 セグメント化ユニット38の出力はスペクトル推定ユニット44に供給され、
該ユニットは、ピーク収集(peak picking)及びそれに続くフーリエドメインで
の詳細検索によりスペクトル成分を決定する。正弦成分を推定する幾つかの方法
が、オーディオ符号化の技術分野における当業者により良く知られている。
The output of segmentation unit 38 is provided to spectrum estimation unit 44,
The unit determines the spectral components by peak picking followed by a fine search in the Fourier domain. Several methods of estimating the sinusoidal component are well known to those skilled in the art of audio coding.

【0034】 スペクトル推定ユニット44の出力端は、周波数選択器50の入力端に接続さ
れている。この周波数選択器は、良好に規定された範囲内の周波数成分のみを選
択する。本例においては、選択器50は133Hzなる最大周波数を持つ周波数成
分のみを選択する。より高い周波数を持つスペクトル成分は単に廃棄される。補
正器52は、選択された信号成分の振幅及び位相値を補正する。この補正は、フ
ィルタ34により導入された振幅及び位相の歪みを補償するために必要とされる
。このフィルタの伝達関数は既知であるので、必要とされる補正係数は容易に決
定することができる。
The output end of the spectrum estimation unit 44 is connected to the input end of the frequency selector 50. This frequency selector selects only frequency components within a well-defined range. In this example, the selector 50 selects only the frequency component having the maximum frequency of 133 Hz. Spectral components with higher frequencies are simply discarded. The corrector 52 corrects the amplitude and phase values of the selected signal component. This correction is needed to compensate for the amplitude and phase distortions introduced by the filter 34. Since the transfer function of this filter is known, the required correction factor can be easily determined.

【0035】 補正器52の出力は合成器54に供給され、該合成器は補正器52の出力信号
に基づいて合成音声信号を発生する。該合成器54により供給される合成音声信
号のサンプルレートは、デシメータ32の出力におけるサンプルレートに相当す
る。合成器54により供給された合成オーディオ信号は、減算器46により、セ
グメント化ユニット40の出力信号から減算される。合成器54と減算器46と
の組合せは、本発明による防止手段の一部である。従って、推定ユニット44に
より決定され選択ユニット50により選択された信号成分は、セグメント化手段
40の出力信号から実質的に除去される。
The output of the corrector 52 is supplied to a synthesizer 54, which generates a synthetic voice signal based on the output signal of the corrector 52. The sample rate of the synthesized speech signal supplied by the synthesizer 54 corresponds to the sample rate at the output of the decimator 32. The synthesized audio signal provided by synthesizer 54 is subtracted from the output signal of segmenting unit 40 by subtractor 46. The combination of combiner 54 and subtractor 46 is part of the prevention means according to the invention. Therefore, the signal component determined by the estimation unit 44 and selected by the selection unit 50 is substantially removed from the output signal of the segmentation means 40.

【0036】 減算器46の出力信号はスペクトル推定ユニット55に受け渡され、このユニ
ットは該出力信号におけるスペクトル成分を決定する。次いで、選択ユニット5
6が400Hzより低い周波数を持つ信号成分のみを選択する。
The output signal of subtractor 46 is passed to spectrum estimation unit 55, which determines the spectral components in the output signal. Then the selection unit 5
6 selects only signal components with frequencies below 400 Hz.

【0037】 補正器52及び選択器56の出力端はコンバイナ(combiner)58の入力端に
接続されている。コンバイナ58は、異なる持続期間を持つ信号セグメントから
導出される周波数推定を組み合わせる。より精細な時間軸(短いセグメント)に
おいては、より粗い時間軸におけるのと略同一の周波数を見つけることができる
から、対応する信号成分は単一の信号成分により表すことができる。本例におい
ては、この組合せは、周波数が10−3rad未満しか違わない場合になされる。
コンバイナ58も、上記防止手段の一部である。
The output terminals of the corrector 52 and the selector 56 are connected to the input terminal of a combiner 58. Combiner 58 combines the frequency estimates derived from the signal segments with different durations. In the finer time axis (shorter segments), we can find approximately the same frequencies as in the coarser time axis, so that the corresponding signal components can be represented by a single signal component. In this example, this combination is made when the frequencies differ by less than 10 −3 rad.
The combiner 58 is also a part of the above-mentioned prevention means.

【0038】 コンバイナ58の出力は、フィルタ30の振幅及び位相の歪みを補正するため
に補正器62に受け渡される。補正器62の出力信号は合成器60の入力端に供
給され、該合成器は識別された信号成分に基づいて合成オーディオ信号を発生す
る。合成器60により発生された合成オーディオ信号は、減算器48により、セ
グメント化ユニット42の出力信号から減算される。合成器60と減算器48と
の組合せは、本発明による防止手段の一部である。減算器48の出力信号はスペ
クトル推定ユニット64に受け渡され、該ユニットは、その入力信号における信
号成分を決定する。これら信号成分は補正器62の出力信号と一緒にコンバイナ
68に渡され、該コンバイナは入力信号内で見つかる全てのシヌソイドの表現を
決定する。推定器44により決定されるべきシヌソイドの最大数は5に等しくな
るように選定され、推定器44及び55により一緒に決定されるべきシヌソイド
の最大数は10であり、推定器44、55及び64により決定されるべきシヌソ
イドの合計数は60に等しくなるように決定されている。
The output of combiner 58 is passed to corrector 62 to correct the amplitude and phase distortions of filter 30. The output signal of corrector 62 is provided to the input of combiner 60, which generates a composite audio signal based on the identified signal components. The synthesized audio signal generated by synthesizer 60 is subtracted from the output signal of segmenting unit 42 by subtractor 48. The combination of combiner 60 and subtractor 48 is part of the prevention means according to the invention. The output signal of subtractor 48 is passed to spectrum estimation unit 64, which determines the signal components in its input signal. These signal components, along with the output signal of corrector 62, are passed to combiner 68, which determines the representation of all sinusoids found in the input signal. The maximum number of sinusoids to be determined by the estimator 44 is chosen to be equal to 5, the maximum number of sinusoids to be determined together by the estimators 44 and 55 is 10, and the estimators 44, 55 and 64 are The total number of sinusoids to be determined by is determined to be equal to 60.

【0039】 セグメント化ユニット38、40及び42の出力信号は、異なる長さを有して
いるから、上記解析も異なる時間軸に対して実行される。単一信号成分の多重表
現を抑圧又は防止する防止手段は、ここでは、合成器54及び60、減算器46
及び48、並びにコンバイナ58及び68である。しかしながら、上記合成器と
減算器との組合せのみが防止手段に使用されるか、又はコンバイナのみが防止手
段に使用されることも考えられる。
Since the output signals of the segmentation units 38, 40 and 42 have different lengths, the above analysis is also performed for different time axes. Preventing means for suppressing or preventing multiple representations of a single signal component are here the combiners 54 and 60, the subtractor 46.
And 48 and combiners 58 and 68. However, it is also conceivable that only the combination of the synthesizer and the subtractor mentioned above is used for the prevention means, or only the combiner is used for the prevention means.

【0040】 図3の図には、解析器8で使用される信号セグメントが表示されている。グラ
フ70、71及び72は、時点Tにおける関係する信号セグメントを示してい
る。
In the diagram of FIG. 3, the signal segments used in the analyzer 8 are displayed. Graphs 70, 71 and 72 show the relevant signal segments at time T 1 .

【0041】 グラフ70は時点Tにおいてセグメント化ユニット42の出力端に得られる
セグメントを示している。このセグメントはN=360のサンプルを有している
。グラフ71は時点Tにおいてセグメント化ユニット40の出力端に得られる
セグメントを示している。このセグメントもN=360のサンプルを有している
The graph 70 shows the segments available at the output of the segmentation unit 42 at time T 1 . This segment has N = 360 samples. Graph 71 shows the segments available at the output of segmenting unit 40 at time T 1 . This segment also has N = 360 samples.

【0042】 グラフ72は時点Tにおいてセグメント化ユニット38の出力端に得られる
セグメントを示している。この場合、該セグメントはM=256のサンプルを有
している。これらグラフから、当該解析においては異なる持続期間の信号セグメ
ントが使用されることが明らかである。
The graph 72 shows the segments available at the output of the segmentation unit 38 at time T 1 . In this case, the segment has M = 256 samples. From these graphs it is clear that different duration signal segments are used in the analysis.

【0043】 グラフ73、74及び75は後続の解析時点Tにおける信号セグメントを示
している。全てのセグメントが最短のセグメントの持続期間にわたり右にシフト
されていることが分かる。これは、完全な解析が周期Tで行われるからである。
グラフ76、77及び78は、TよりT遅い、時点Tにおける信号セグメン
トを示している。
Graphs 73, 74 and 75 show signal segments at a subsequent analysis time T 2 . It can be seen that all segments are shifted to the right for the duration of the shortest segment. This is because the complete analysis is done in period T.
Graphs 76, 77 and 78 show the signal segment at time T 3 which is T later than T 2 .

【0044】 図4のノイズ解析器14においては、入力信号はセグメント化手段80、82
及び84の入力端に供給される。セグメント化手段80は上記入力信号から10
24サンプルのセグメントを導出するように構成されている。また、セグメント
化手段82は上記入力信号から512サンプルのセグメントを導出するように構
成され、セグメント化手段84は上記入力信号から256サンプルのセグメント
を導出するように構成されている。
In the noise analyzer 14 of FIG. 4, the input signal is segmented by the segmenting means 80, 82.
And 84 input terminals. The segmenting means 80 uses the input signal 10
It is configured to derive a segment of 24 samples. The segmenting means 82 is also arranged to derive a segment of 512 samples from the input signal and the segmenting means 84 is arranged to derive a segment of 256 samples from the input signal.

【0045】 セグメント化手段80の出力端は、低周波数範囲に関する周波数スペクトルを
決定するためにFFTプロセッサ86の入力端に接続されている。該FFTプロ
セッサ86は1024点のFFTを実行するように構成されている。セグメント
化手段82の出力端は、FFTプロセッサ90の入力端に接続されている。この
FFTプロセッサ90は512点のFFTを実行する。セグメント化手段84の
出力端はFFTプロセッサ94の入力端に接続されている。該FFTプロセッサ
94は256点のFFTを実行する。
The output of the segmenting means 80 is connected to the input of the FFT processor 86 for determining the frequency spectrum for the low frequency range. The FFT processor 86 is configured to perform a 1024 point FFT. The output of the segmenting means 82 is connected to the input of the FFT processor 90. The FFT processor 90 executes 512-point FFT. The output of the segmenting means 84 is connected to the input of the FFT processor 94. The FFT processor 94 performs a 256-point FFT.

【0046】 図1のマルチプレクサ16において音響心理学的モデルを適用するために、ノ
イズスペクトルを、ERBビン(bin)当たりのノイズ電力として表すことが望
ましい。そのようにするために、FFTプロセッサ86、90及び94により決
定されたFFTビンの値は、ERB変換器88、92及び96により18、7及
び18のERBビンに各々変換される。全てのERBビンは異なる周波数範囲を
カバーするので、ERB変換器88、92及び96は信号成分の多重表現を防止
する抑圧手段を構成する。FFTプロセッサ86、90及び94が完全なFFT
を実行せずに、該FFTに対応するERBビンを決定するのに必要な周波数ビン
のみを決定する部分FFTのみを実行することも考えられることが分かる。その
場合、上記抑圧手段はFFTプロセッサ86、90及び94も含む。
To apply the psychoacoustic model in the multiplexer 16 of FIG. 1, it is desirable to represent the noise spectrum as noise power per ERB bin. To do so, the FFT bin values determined by FFT processors 86, 90 and 94 are converted to 18, 7 and 18 ERB bins by ERB converters 88, 92 and 96, respectively. Since all ERB bins cover different frequency ranges, ERB converters 88, 92 and 96 constitute suppression means that prevent multiple representations of signal components. FFT processors 86, 90 and 94 are complete FFTs
It is also conceivable to perform only a partial FFT that determines only the frequency bins necessary to determine the ERB bin corresponding to the FFT, without performing. In that case, the suppression means also include FFT processors 86, 90 and 94.

【0047】 ERB変換器88、92及び96は、各ERBビンに対する値を、当該ERB
により規定される範囲内にあるFFTビン内の電力を加算することにより導出す
る。上記ERB変換器により実行されるべき変換は:
The ERB converters 88, 92 and 96 convert the value for each ERB bin to the corresponding ERB bin.
It is derived by adding the powers in the FFT bins that are within the range defined by The conversions to be performed by the ERB converter are:

【数1】 によりマトリクスの形で書くことができる。(1)式において、Y(n)は各ER
Bビンにおける電力であり、ここでnは当該ERBビンのランク数を表す。Pは
、要素としてFFTビンの電力を含むベクトルであり:
[Equation 1] Can be written in the form of a matrix. In equation (1), Y (n) is each ER
The power in the B bin, where n represents the rank number of the ERB bin. P is a vector containing the power of the FFT bin as an element:

【数2】 として定義することができる。(2)式において、|X(k)|はk番目のFF
Tビンにおける電力である。また、Lは当該FFTに含まれる点の数である。ベ
クトルW(n)はERBビンとFFTビンとの重なりを表す。fがERBビンの
下限を表し、fが該ERBビンの上側周波数を表すとすると、ベクトル要素W
(n,k)は下記のように書くことができる:
[Equation 2] Can be defined as In Expression (2), | X (k) | 2 is the k-th FF
The power in the T bin. L is the number of points included in the FFT. The vector W (n) represents the overlap between the ERB bin and the FFT bin. If f 1 represents the lower limit of the ERB bin and f 2 represents the upper frequency of the ERB bin, the vector element W
(n, k) can be written as:

【数3】 (3)式において、bはFFTビンのサイズであり、f/Lに等しい。全ての
ERBビンを得るためにnに対して異なる値をとると:
[Equation 3] In equation (3), b is the size of the FFT bin and is equal to f s / L. Taking different values for n to get all ERB bins:

【数4】 に従う行列の乗算が得られる。ERBビンにおける電力は、マルチプレクサ16
において使用される音響心理学的モデルにより使用するために、ノイズ解析器1
4の追加の出力端に渡される。
[Equation 4] The matrix multiplication according to is obtained. The power in the ERB bin is
Noise analyzer 1 for use with a psychoacoustic model used in
4 additional outputs.

【0048】 ノイズ合成器28は、ERBビンからFFTビンを得るために、Wの逆変換W
〜を必要とする。この逆数W〜は、Wが決定されたのと同様の方法により得るこ
とができる。この逆数W〜は:
The noise synthesizer 28 inverse transforms W of W to obtain the FFT bin from the ERB bin.
Need ~. This reciprocal W ~ can be obtained in the same way as W was determined. This reciprocal W ~ is:

【数5】 により算出することができる。43のERB電力値が適合手段98に受け渡され
、該手段は三次多項式の上記43個のERB電力値への適合を実行する。従って
、推定された電力は時間的に整列される(これらは、異なる解析セグメントサイ
ズで推定される)。この適合処理の結果、43の係数から4つの係数へデータが
減少する。該適合を実施する前に、ERBビンにおける振幅は、対数目盛り又は
その近似のような音響心理学的目盛り上の値に変換される。
[Equation 5] Can be calculated by The 43 ERB power values are passed to the fitting means 98, which performs the fitting of the cubic polynomial to the 43 ERB power values. Therefore, the estimated powers are aligned in time (these are estimated at different analysis segment sizes). As a result of this fitting process, the data is reduced from 43 coefficients to 4 coefficients. Prior to performing the fit, the amplitudes in the ERB bins are converted to values on a psychoacoustic scale, such as a logarithmic scale or an approximation thereof.

【0049】 合成器28においては、上記43個のERB電力値が上記4つの係数により規
定される三次多項式により算出される。該合成は、丁度前記解析においてなされ
たように、異なるグループのERB電力に対して異なる時間軸で行われる。
In the combiner 28, the 43 ERB power values are calculated by the cubic polynomial defined by the four coefficients. The combination is done on different timeframes for different groups of ERB powers, just as done in the above analysis.

【0050】 以上、本発明を好ましい実施例を参照して説明したが、これらは限定するため
の例ではないと理解されたい。このように、当業者にとっては請求項に記載され
た本発明の範囲から逸脱すること無しに種々の変形例が明らかとなるであろう。
Although the present invention has been described above with reference to preferred embodiments, it should be understood that these are not limiting examples. Thus, various modifications will be apparent to those skilled in the art without departing from the scope of the invention as claimed.

【0051】 一例として、上記実施例においては重なり合っていないが、連続する信号セグ
メントが部分的に重なり合うことも可能である。更に、上記実施例に開示された
別々の防止手段は必ずしも組合せで存在する必要はなく、別々に使用されてもよ
い。
As an example, it is also possible that consecutive signal segments partially overlap, although they do not overlap in the above embodiments. Furthermore, the separate preventive measures disclosed in the above embodiments do not necessarily have to be present in combination and may be used separately.

【0052】 シヌソイドオーディオエンコーダにおいて、周波数スペクトルの異なる部分を
解析するために異なる時間軸を使用することは既知である。従来のエンコーダに
おいては、入力信号を多数の副バンドに分割するために副バンドフィルタ処理が
使用される。
In sinusoidal audio encoders, it is known to use different time axes to analyze different parts of the frequency spectrum. In conventional encoders, subband filtering is used to split the input signal into multiple subbands.

【0053】 入力信号を副バンドに分割することにより、2つの副バンドの境界における信
号成分が、両副バンド信号における表現になることが起こり得る。この信号成分
の二重の表現が、これら成分を符号化する際の幾つかの問題につながる。本発明
によれば、信号成分が多重の表現を有するのを防止するための防止手段(46、
48、58、68;88、92、96)を使用することが提案される。
By splitting the input signal into sub-bands, it is possible that the signal components at the boundary of two sub-bands will be an expression in both sub-band signals. This dual representation of signal components leads to some problems in encoding these components. According to the invention, prevention means (46, for preventing the signal component from having multiple representations)
48, 58, 68; 88, 92, 96).

【図面の簡単な説明】[Brief description of drawings]

【図1】 図1は、本発明を使用することができる伝送システムを示す。[Figure 1]   FIG. 1 shows a transmission system in which the present invention can be used.

【図2】 図2は、図1の伝送システムに使用されるべき本発明によるシヌソイド用の解
析ユニット8を示す。
2 shows an analysis unit 8 for sinusoids according to the invention to be used in the transmission system of FIG.

【図3】 図3は、図2の解析ユニット8で使用される信号セグメントを示す。[Figure 3]   FIG. 3 shows the signal segments used in the analysis unit 8 of FIG.

【図4】 図4は、図1の伝送システムにおいて使用されるべき本発明によるノイズ解析
器14を示す。
FIG. 4 shows a noise analyzer 14 according to the invention to be used in the transmission system of FIG.

【符号の説明】[Explanation of symbols]

2…送信器 3…伝送媒体 4…オーディオエンコーダ 6…送信ユニット 8…解析ユニット 10…合成器 12…減算器 14…ノイズ解析器 16…マルチプレクサ 18…受信ユニット 20…デマルチプレクサ 22…オーディオデコーダ 24…受信器 26…合成器 28…ノイズ合成器 30、34…ローパスフィルタ 32、36…デシメータ 38、40、42…セグメント化ユニット 44、55、64…スペクトル推定ユニット 46、48…減算器 54、60…合成器 58、68…コンバイナ 88、92、96…ERB変換器   2 ... transmitter   3 ... Transmission medium   4 ... Audio encoder   6 ... Transmission unit   8 ... Analysis unit 10 ... Synthesizer 12 ... Subtractor 14 ... Noise analyzer 16 ... Multiplexer 18 ... Receiving unit 20 ... Demultiplexer 22 ... Audio decoder 24 ... Receiver 26 ... Synthesizer 28 ... Noise synthesizer 30, 34 ... Low-pass filter 32, 36 ... Decimator 38, 40, 42 ... Segmentation unit 44, 55, 64 ... Spectrum estimation unit 46, 48 ... Subtractor 54, 60 ... Synthesizer 58, 68 ... Combiner 88, 92, 96 ... ERB converter

───────────────────────────────────────────────────── フロントページの続き (72)発明者 オーメン アルノルダス ダブリュ ジェ イ オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 (72)発明者 デン ブリンカー アルベルタス シー オランダ国 5656 アーアー アインドー フェン プロフ ホルストラーン 6 Fターム(参考) 5D045 DA11 5K041 AA01 CC01 DD01 FF01 HH12─────────────────────────────────────────────────── ─── Continued front page    (72) Inventor Omen Arnordas Doubler             I             Netherlands 5656 aer ind             Fenprof Holstraan 6 (72) Inventor Denblinker Albertus C             Netherlands 5656 aer ind             Fenprof Holstraan 6 F term (reference) 5D045 DA11                 5K041 AA01 CC01 DD01 FF01 HH12

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 オーディオエンコーダを持つ送信器を有し、前記オーディオ
エンコーダはオーディオ信号を表す入力信号から少なくとも第1信号セグメント
と第2信号セグメントとを導出するセグメント化手段を有し、前記第1信号セグ
メントは前記第2信号セグメントより長く、前記オーディオエンコーダは符号化
されたオーディオ信号を前記第1及び第2信号セグメントから導出する符号化手
段を有し、前記送信器は前記符号化されたオーディオ信号を伝送媒体を介して受
信器に送信する送信手段を有し、前記受信器は前記伝送媒体から前記符号化され
たオーディオ信号を受信する受信手段を有すると共に、復号されたオーディオ信
号を前記符号化されたオーディオ信号から導出するオーディオデコーダを更に有
するような伝送システムであって、 前記符号化手段が、前記符号化されたオーディオ信号に単一信号成分の多重表現
が発生するのを防止する防止手段を有することを特徴とする伝送システム。
1. A transmitter having an audio encoder, said audio encoder having segmenting means for deriving at least a first signal segment and a second signal segment from an input signal representative of an audio signal, said first encoder The signal segment is longer than the second signal segment, the audio encoder has coding means for deriving a coded audio signal from the first and second signal segments, and the transmitter has the coded audio. Transmitting means for transmitting a signal to a receiver via a transmission medium, the receiver having receiving means for receiving the encoded audio signal from the transmission medium, and the encoded audio signal In a transmission system further comprising an audio decoder for deriving from the encoded audio signal The transmission system is characterized in that the encoding means has a prevention means for preventing a multiple representation of a single signal component from occurring in the encoded audio signal.
【請求項2】 請求項1に記載の伝送システムにおいて、前記防止手段は、
前記第1信号セグメントを表す前記符号化されたオーディオ信号の一部から合成
オーディオ信号を導出する合成手段と、前記入力信号を表す信号から前記合成オ
ーディオ信号を減算することにより前記第2信号セグメントを導出する減算手段
とを有することを特徴とする伝送システム。
2. The transmission system according to claim 1, wherein the preventing unit is
Combining means for deriving a composite audio signal from a portion of the encoded audio signal representing the first signal segment, and subtracting the composite audio signal from a signal representing the input signal to generate the second signal segment. And a subtraction unit for deriving the transmission system.
【請求項3】 請求項2に記載の伝送システムにおいて、前記セグメント化
手段は前記入力信号から他の信号セグメントを導出するように構成され、前記他
の信号セグメントは前記第1信号セグメントより長く、前記オーディオエンコー
ダは前記符号化されたオーディオ信号を前記他の信号セグメントにも基づいて導
出するように構成され、前記防止手段が、前記他の信号セグメントを表す前記符
号化されたオーディオ信号の一部から他の合成信号を導出する他の合成手段と、
前記入力信号を表す信号から前記他の合成オーディオ信号を減算することにより
前記第1信号セグメントを導出する他の減算手段とを有していることを特徴とす
る伝送システム。
3. The transmission system according to claim 2, wherein the segmenting means is configured to derive another signal segment from the input signal, the other signal segment being longer than the first signal segment, The audio encoder is configured to derive the encoded audio signal also based on the other signal segment, and the preventing means is a portion of the encoded audio signal representing the other signal segment. And another synthesizing means for deriving another synthetic signal from
And a subtraction means for deriving the first signal segment by subtracting the other synthesized audio signal from a signal representing the input signal.
【請求項4】 請求項1に記載の伝送システムにおいて、前記オーディオエ
ンコーダはフィルタ処理された信号を前記入力信号から導出するフィルタを有す
ると共に、該フィルタ処理された信号から前記第1信号セグメントを導出するよ
うに構成されていることを特徴とする伝送システム。
4. The transmission system according to claim 1, wherein the audio encoder has a filter that derives a filtered signal from the input signal, and derives the first signal segment from the filtered signal. A transmission system characterized by being configured to:
【請求項5】 請求項4に記載の伝送システムにおいて、前記フィルタが、
前記第1信号セグメントを低下されたサンプルレートで得るデシメート手段を有
していることを特徴とする伝送システム。
5. The transmission system according to claim 4, wherein the filter is
A transmission system comprising decimating means for obtaining said first signal segment at a reduced sample rate.
【請求項6】 請求項1に記載の伝送システムにおいて、前記符号化手段が
、音響心理学的スケールで振幅を表すように構成されていることを特徴とする伝
送システム。
6. Transmission system according to claim 1, characterized in that the coding means are arranged to represent the amplitude on a psychoacoustic scale.
【請求項7】 オーディオエンコーダを有するような送信器であって、該オ
ーディオエンコーダはオーディオ信号を表す入力信号から少なくとも第1信号セ
グメントと第2信号セグメントとを導出するセグメント化手段を有し、前記第1
信号セグメントは前記第2信号セグメントより長く、前記オーディオエンコーダ
は符号化されたオーディオ信号を前記第1及び第2信号セグメントから導出する
符号化手段を有し、前記送信器は前記符号化されたオーディオ信号を送信する送
信手段を有し、前記符号化手段が、前記符号化されたオーディオ信号に単一信号
成分の多重表現が発生するのを防止する防止手段を有することを特徴とする送信
器。
7. A transmitter having an audio encoder, said audio encoder having segmenting means for deriving at least a first signal segment and a second signal segment from an input signal representing the audio signal, First
The signal segment is longer than the second signal segment, the audio encoder has coding means for deriving a coded audio signal from the first and second signal segments, and the transmitter has the coded audio. A transmitter, comprising transmitting means for transmitting a signal, wherein said encoding means comprises preventing means for preventing a multiple representation of a single signal component from occurring in said encoded audio signal.
【請求項8】 請求項7に記載の送信器において、前記防止手段は、前記第
1信号セグメントを表す前記符号化されたオーディオ信号の一部から合成オーデ
ィオ信号を導出する合成手段と、前記入力信号を表す信号から前記合成オーディ
オ信号を減算することにより前記第2信号セグメントを導出する減算手段とを有
することを特徴とする送信器。
8. The transmitter according to claim 7, wherein the preventing means comprises a combining means for deriving a combined audio signal from a portion of the encoded audio signal representing the first signal segment, and the input. Subtracting means for deriving the second signal segment by subtracting the synthesized audio signal from a signal representing the signal.
【請求項9】 オーディオ信号を表す入力信号から少なくとも第1信号セグ
メントと第2信号セグメントとを導出するセグメント化手段を有するオーディオ
エンコーダであって、前記第1信号セグメントは前記第2信号セグメントより長
く、前記オーディオエンコーダは符号化されたオーディオ信号を前記第1及び第
2信号セグメントから導出する符号化手段を有し、該符号化手段が、前記符号化
されたオーディオ信号に単一信号成分の多重表現が発生するのを防止する防止手
段を有することを特徴とするオーディオエンコーダ。
9. An audio encoder having segmenting means for deriving at least a first signal segment and a second signal segment from an input signal representing an audio signal, the first signal segment being longer than the second signal segment. , The audio encoder has coding means for deriving a coded audio signal from the first and second signal segments, the coding means multiplexing a single signal component into the coded audio signal. An audio encoder having a preventing means for preventing an expression from occurring.
【請求項10】 請求項9に記載のオーディオエンコーダにおいて、前記防
止手段は、前記第1信号セグメントを表す前記符号化されたオーディオ信号の一
部から合成オーディオ信号を導出する合成手段と、前記入力信号を表す信号から
前記合成オーディオ信号を減算することにより前記第2信号セグメントを導出す
る減算手段とを有することを特徴とするオーディオエンコーダ。
10. The audio encoder according to claim 9, wherein the preventing means comprises a synthesizing means for deriving a synthesized audio signal from a part of the encoded audio signal representing the first signal segment, and the input. An audio encoder, the subtraction means deriving the second signal segment by subtracting the synthesized audio signal from a signal representing the signal.
【請求項11】 オーディオ信号を表す入力信号から少なくとも第1信号セ
グメントと第2信号セグメントとを導出するステップを有し、前記第1信号セグ
メントは前記第2信号セグメントより長く、且つ、符号化されたオーディオ信号
を前記第1及び第2信号セグメントから導出するステップを有するようなオーデ
ィオ符号化方法であって、該方法が、前記符号化されたオーディオ信号に単一信
号成分の多重表現が発生するのを防止するステップを有することを特徴とするオ
ーディオ符号化方法。
11. Derivation of at least a first signal segment and a second signal segment from an input signal representing an audio signal, said first signal segment being longer than said second signal segment and encoded. An audio coding method comprising the step of deriving an audio signal from the first and second signal segments, the method generating a multiple representation of a single signal component in the coded audio signal. An audio encoding method comprising the step of preventing
【請求項12】 請求項11に記載の方法において、該方法が、前記第1信
号セグメントを表す前記符号化されたオーディオ信号の一部から合成オーディオ
信号を導出するステップと、前記入力信号を表す信号から前記合成オーディオ信
号を減算することにより前記第2信号セグメントを導出するステップとを有する
ことを特徴とするオーディオ符号化方法。
12. The method of claim 11, wherein the method represents a composite audio signal from a portion of the encoded audio signal representing the first signal segment, the method representing the input signal. Deriving the second signal segment by subtracting the synthesized audio signal from a signal.
【請求項13】 プロセッサが請求項11に記載の方法を実行するのを可能
にするようなコンピュータプログラム。
13. A computer program enabling a processor to carry out the method of claim 11.
【請求項14】 請求項13に記載のコンピュータプログラムを有する有形
媒体。
14. A tangible medium having the computer program of claim 13.
【請求項15】 請求項13に記載のコンピュータプログラムを伝送する信
号。
15. A signal carrying a computer program as claimed in claim 13.
JP2001520406A 1999-08-27 2000-08-24 Transmission system with improved encoder and decoder Withdrawn JP2003508806A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP99202785 1999-08-27
EP99202785.4 1999-08-27
PCT/EP2000/008273 WO2001016941A1 (en) 1999-08-27 2000-08-24 Transmission system with improved encoder and decoder

Publications (1)

Publication Number Publication Date
JP2003508806A true JP2003508806A (en) 2003-03-04

Family

ID=8240580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001520406A Withdrawn JP2003508806A (en) 1999-08-27 2000-08-24 Transmission system with improved encoder and decoder

Country Status (8)

Country Link
US (1) US6654723B1 (en)
EP (1) EP1125282B1 (en)
JP (1) JP2003508806A (en)
KR (1) KR100727276B1 (en)
CN (1) CN1145929C (en)
DE (1) DE60022732T2 (en)
ES (1) ES2248112T3 (en)
WO (1) WO2001016941A1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7930170B2 (en) * 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
JP4622164B2 (en) * 2001-06-15 2011-02-02 ソニー株式会社 Acoustic signal encoding method and apparatus
US8331445B2 (en) 2004-06-01 2012-12-11 Qualcomm Incorporated Method, apparatus, and system for enhancing robustness of predictive video codecs using a side-channel based on distributed source coding techniques

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08223049A (en) * 1995-02-14 1996-08-30 Sony Corp Signal coding method and device, signal decoding method and device, information recording medium and information transmission method
US6091768A (en) * 1996-02-21 2000-07-18 Bru; Bernard Device for decoding signals of the MPEG2 type
US5974376A (en) * 1996-10-10 1999-10-26 Ericsson, Inc. Method for transmitting multiresolution audio signals in a radio frequency communication system as determined upon request by the code-rate selector
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
KR100261254B1 (en) * 1997-04-02 2000-07-01 윤종용 Scalable audio data encoding/decoding method and apparatus
JP3134817B2 (en) * 1997-07-11 2001-02-13 日本電気株式会社 Audio encoding / decoding device
KR100311173B1 (en) * 1998-02-26 2001-12-17 김영환 Apparatus for transmitting and receiving moving picture data and audio data
US6460153B1 (en) * 1999-03-26 2002-10-01 Microsoft Corp. Apparatus and method for unequal error protection in multiple-description coding using overcomplete expansions

Also Published As

Publication number Publication date
CN1335979A (en) 2002-02-13
ES2248112T3 (en) 2006-03-16
DE60022732T2 (en) 2006-06-14
WO2001016941A1 (en) 2001-03-08
KR100727276B1 (en) 2007-06-13
EP1125282B1 (en) 2005-09-21
DE60022732D1 (en) 2005-10-27
US6654723B1 (en) 2003-11-25
EP1125282A1 (en) 2001-08-22
CN1145929C (en) 2004-04-14
KR20010089371A (en) 2001-10-06

Similar Documents

Publication Publication Date Title
US10269362B2 (en) Methods, apparatus and systems for determining reconstructed audio signal
KR970007663B1 (en) Rate control loop processor for perceptual encoder/decoder
KR100209870B1 (en) Perceptual coding of audio signals
KR970007661B1 (en) Method and apparatus for coding audio signals based on perceptual model
EP0564089B1 (en) A method and appartus for the perceptual coding of audio signals
EP0940015B1 (en) Source coding enhancement using spectral-band replication
FI84538C (en) FOERFARANDE FOER TRANSMISSION AV DIGITALISKA AUDIOSIGNALER.
JP4063670B2 (en) Wideband signal transmission system
US5699484A (en) Method and apparatus for applying linear prediction to critical band subbands of split-band perceptual coding systems
US20040153313A1 (en) Method for enlarging the band width of a narrow-band filtered voice signal, especially a voice signal emitted by a telecommunication appliance
RU2256293C2 (en) Improving initial coding using duplicating band
US5687281A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
USRE40280E1 (en) Rate loop processor for perceptual encoder/decoder
US5588089A (en) Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
JP2003508806A (en) Transmission system with improved encoder and decoder
KR100335696B1 (en) Device for communication system and method of using communication system
CA2053133C (en) Method for coding and decoding a sampled analog signal having a repetitive nature and a device for coding and decoding by said method
EP2355094B1 (en) Sub-band processing complexity reduction

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20071106