JP5255699B2 - Apparatus and method for generating bandwidth extension signal - Google Patents
Apparatus and method for generating bandwidth extension signal Download PDFInfo
- Publication number
- JP5255699B2 JP5255699B2 JP2011516992A JP2011516992A JP5255699B2 JP 5255699 B2 JP5255699 B2 JP 5255699B2 JP 2011516992 A JP2011516992 A JP 2011516992A JP 2011516992 A JP2011516992 A JP 2011516992A JP 5255699 B2 JP5255699 B2 JP 5255699B2
- Authority
- JP
- Japan
- Prior art keywords
- patch
- input signal
- signal
- band
- algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Transmitters (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Description
本発明は、オーディオ信号処理に関し、特に入力信号から帯域幅拡張信号を生成するための装置及び方法、及び入力信号及びオーディオ信号に基づいて帯域幅削減信号を生成する方法及び装置に関するものである。 The present invention relates to audio signal processing, and more particularly, to an apparatus and method for generating a bandwidth extension signal from an input signal, and a method and apparatus for generating a bandwidth reduction signal based on the input signal and the audio signal.
オーディオ信号の知覚的適応型符号化、つまりオーディオ信号の効率的な格納と伝送のために実質的なデータレートを削減する符号化は、多くの分野で広く受け入れられてきた。例えば、MPEG−1/2−レイヤ3(MP3)やMPEG−4−AAC(Advanced Audio Coding)などの多数の符号化アルゴリズムが知られている。しかしながら、このために使用される符号化は、特に最低ビットレートで作動される時、主観的なオーディオ品質を低下させ、このような品質低下は、伝送されるべきオーディオ信号の帯域の制限により、主に符号器側の原因で引き起こされる。 Perceptual adaptive coding of audio signals, that is, coding that reduces the effective data rate for efficient storage and transmission of audio signals, has been widely accepted in many fields. For example, many encoding algorithms such as MPEG-1 / 2-layer 3 (MP3) and MPEG-4-AAC (Advanced Audio Coding) are known. However, the encoding used for this degrades subjective audio quality, especially when operated at the lowest bit rate, and such quality degradation is due to bandwidth limitations of the audio signal to be transmitted. This is mainly caused by the encoder side.
このような状況において、特許文献1には、オーディオ信号に符号器側で帯域制限を施し、高品質オーディオ符号器(コア符号器)を用いて前記オーディオ信号の低周波帯域のみを符号化する手法が開示されている。しかし、高周波帯域は非常に粗く、すなわち高周波帯域のスペクトル包絡を再生するパラメータセットによって特徴付けられる。復号器側では、高周波帯域はその後で合成される。この目的のため、ハーモニック転位が用いられ、そこでは復号化されたオーディオ信号の低周波帯域がフィルタバンクに供給される。低周波帯域のフィルタバンクチャンネルは高周波帯域のフィルタバンクチャンネルに接続されるか、又は「パッチ」される。そして、各パッチ済のバンドパス信号には包絡調整が施される。特殊な分析フィルタバンクに属する合成フィルタバンクは、低周波帯域におけるオーディオ信号のバンドパス信号と低周波帯域の包絡調整済みバンドパス信号とを受け取り、これら信号は高周波帯域へとハーモニックにパッチされる。合成フィルタバンクの出力信号は、そのオリジナルな帯域幅と比較して拡張されたオーディオ信号である。そのオリジナルな帯域とは、符号器側から復号器側へと、非常に低いデータレートで作動するコア符号器によって伝送されたものである。特に、フィルタバンクドメインでのフィルタバンク演算とパッチ処理は、高い演算能力を必要とする可能性がある。
In such a situation,
それに代わり、帯域制限されたオーディオ信号の帯域幅拡張のための複雑性を削減した方法は、帯域制限によって消失した情報を近似するため、低周波信号部分(LF)のコピー作用を高周波領域(HF)に用いるものである。このような方法は、非特許文献1〜4及び特許文献2に開示されている。
Instead, the method of reducing the complexity for expanding the bandwidth of the band-limited audio signal approximates the information lost due to the band limitation. Therefore, the copying operation of the low-frequency signal portion (LF) is changed to the high-frequency region (HF). ). Such a method is disclosed in
これら方法において、ハーモニックな転位は実行されず、低周波帯域の連続的なバンドパス信号は、高周波帯域の連続的なフィルタバンクチャンネルへと導入される。この方法によって、オーディオ信号の高周波帯域の粗い近似が達成される。次の段階では、この信号のこの粗い近似は、オリジナル信号から得られた制御情報を使用した後処理(post processing)によってオリジナル信号に同化される。ここで、MPEG−4高効率先進的オーディオ符号化(HE−AAC)標準に記載されているように、例えばスペクトル包絡や逆フィルタリングを適用するためにスケールファクタが用いられ、さらに消失したハーモニクスのための調性適応ノイズフロアの追加及び正弦波信号部分の補足のためにスケールファクタが用いられる。 In these methods, harmonic transposition is not performed and a continuous bandpass signal in the low frequency band is introduced into a continuous filter bank channel in the high frequency band. By this method, a rough approximation of the high frequency band of the audio signal is achieved. In the next stage, this coarse approximation of this signal is assimilated to the original signal by post processing using control information obtained from the original signal. Here, as described in the MPEG-4 High Efficiency Advanced Audio Coding (HE-AAC) standard, for example, scale factors are used to apply spectral envelopes and inverse filtering, and for lost harmonics A scale factor is used to add a tonal adaptive noise floor and to supplement the sinusoidal signal portion.
上述とは別に、次の方法では帯域幅拡張のために位相ボコーダが使用される。スペクトル拡大のために位相ボコーダを適用した場合、周波数ラインは互いにさらに離れることになる。もし、例えば量子化によってギャップがスペクトルに存在する場合、そのギャップは拡大によってさらに増大する。エネルギー適応において、スペクトルに残されたラインは、オリジナル信号における個々のラインに比べて大き過ぎるエネルギーを受け取ることになる。 Apart from the above, the next method uses a phase vocoder for bandwidth expansion. When applying a phase vocoder for spectral broadening, the frequency lines will be further away from each other. If a gap is present in the spectrum, for example by quantization, the gap is further increased by expansion. In energy adaptation, the lines left in the spectrum will receive too much energy compared to the individual lines in the original signal.
図13は、位相ボコーダを用いた帯域幅拡張1300の概略図を示す。この例では、2つのパッチ1312、1314が信号の低周波帯域1302に追加される。前記信号の所謂クロスーバー周波数とも呼ばれる上側カットオフ周波数1320は、隣接パッチ1312の下限周波数であり、前記クロスオーバー周波数の2倍は、隣接パッチ1312の上側カットオフ周波数でかつ次のパッチ1314の下側カットオフ周波数である。位相ボコーダは、前記信号の低周波帯域1302の周波数ラインの周波数を2倍して隣接パッチ1312を取得し、前記信号の低周波帯域1302の周波数ラインの周波数を3倍して次のパッチ1314を取得する。したがって、隣接パッチ1312のスペクトル密度は前記信号の低周波帯域1302のスペクトル密度の1/2であり、次のパッチ1314のスペクトル密度は前記信号の低周波帯域1302のスペクトル密度の1/3である。
FIG. 13 shows a schematic diagram of
帯域(パッチ)のエネルギーをわずか数本の周波数ラインへと集中させることで、オリジナル信号とは異なるような実質的な音質の変化がもたらされる。以前はより多数存在した帯域(周波数ライン)のエネルギーは、より少数の残存する帯域に集約される。 By concentrating the energy of the band (patch) on only a few frequency lines, a substantial change in sound quality that is different from the original signal is brought about. The energy in the band (frequency line) that previously existed more is concentrated in a smaller number of remaining bands.
位相ボコーダとその幾つかの適用例が非特許文献5〜8及び特許文献3に開示されている。 Non-Patent Documents 5 to 8 and Patent Document 3 disclose phase vocoders and some application examples thereof.
前記ギャップを埋めるための1つの手法が特許文献4に開示されている。それは、高い周波数再構築を利用したソース符号化システムを強化するための方法と装置とを含んでいる。この出願は、適応型ノイズ−フロア追加による再構築された高周波帯域における不十分なノイズコンテンツの問題を提示している。ノイズ追加によって前記ギャップを埋めることは可能かもしれないが、オーディオ品質又は主観的品質が十分には向上しない可能性がある。 One technique for filling the gap is disclosed in Patent Document 4. It includes a method and apparatus for enhancing a source coding system that utilizes high frequency reconstruction. This application presents the problem of insufficient noise content in the reconstructed high frequency band with adaptive noise-floor addition. Although it may be possible to fill the gap by adding noise, the audio quality or subjective quality may not be improved sufficiently.
本発明の目的は、帯域幅拡張された信号の主観的品質を向上させるオーディオ信号の帯域幅拡張の概念を提供しようとするものである。 It is an object of the present invention to provide a concept of bandwidth extension of an audio signal that improves the subjective quality of the bandwidth extended signal.
前記目的は、請求項1及び11に係る装置、請求項14に係るオーディオ信号、及び請求項15、16に係る方法によって達成できる。
The object can be achieved by a device according to
本発明の一実施形態は、入力信号から帯域幅拡張信号を生成するための装置を提供する。前記入力信号は、第1の帯域については第1の分解能データによって、第2の帯域については第2の分解能データによって表現され、前記第2の分解能は第1の分解能に比べて低い。前記装置はパッチ生成器と結合器とを備える。前記パッチ生成器は、前記入力信号の第1の帯域から第1のパッチアルゴリズムに従って第1パッチを生成し、かつ前記入力信号の第1の帯域から第2のパッチアルゴリズムに従って第2パッチを生成する。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度よりも高い。前記結合器は、第1パッチと第2パッチと前記入力信号の第1の帯域とを結合し、前記帯域幅拡張信号を得る。帯域幅拡張信号を生成する前記装置は、前記帯域幅拡張信号がスペクトル包絡基準を満たすように、第1のパッチアルゴリズムと第2のパッチアルゴリズムとに従って前記入力信号をスケールするか、又は第1パッチと第2パッチとをスケールする。 One embodiment of the present invention provides an apparatus for generating a bandwidth extension signal from an input signal. The input signal is represented by first resolution data for the first band and second resolution data for the second band, and the second resolution is lower than the first resolution. The apparatus comprises a patch generator and a combiner. The patch generator generates a first patch from a first band of the input signal according to a first patch algorithm, and generates a second patch from the first band of the input signal according to a second patch algorithm. . The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm. The combiner combines the first patch, the second patch, and the first band of the input signal to obtain the bandwidth extension signal. The apparatus for generating a bandwidth extension signal scales the input signal according to a first patch algorithm and a second patch algorithm such that the bandwidth extension signal satisfies a spectral envelope criterion, or a first patch And the second patch.
本発明に係る幾つかの実施形態は、入力信号の帯域幅を拡張するために、低いスペクトル密度(これは、例えばそのパッチが入力信号の低周波帯域に比べて多くのギャップを持つことを意味する)を持つパッチが、高いスペクトル密度(これは、例えばそのパッチが入力信号の低周波帯域に比べてほんの僅か又は全くギャップを持たないことを意味する)を持つパッチと結合される、という中核的考えに基づいている。両方のパッチが入力信号に基づいて生成されるので、入力信号の低周波帯域の高周波帯域への拡張は、オリジナルのオーディオ信号の良好な近似を提供する可能性がある。加えて、第1と第2のパッチは、スペクトル包絡基準を満たすために、生成の前(入力信号のスケーリングによって)又は後でスケールすることができる。なぜなら、オリジナル・オーディオ信号のスペクトル包絡は、入力信号の高周波帯域の再構築のために考慮されるべきだからである。この様にして、帯域幅拡張信号の主観的品質又はオーディオ品質は大幅に向上するであろう。 Some embodiments according to the present invention have a low spectral density (for example, the patch has more gaps compared to the low frequency band of the input signal) in order to extend the bandwidth of the input signal. The core of a patch with a high spectral density (which means, for example, that the patch has little or no gap compared to the low frequency band of the input signal) Is based on the idea. Since both patches are generated based on the input signal, the extension of the input signal to the low frequency band may provide a good approximation of the original audio signal. In addition, the first and second patches can be scaled before generation (by scaling the input signal) or after to meet the spectral envelope criteria. This is because the spectral envelope of the original audio signal should be considered for the reconstruction of the high frequency band of the input signal. In this way, the subjective quality or audio quality of the bandwidth extension signal will be greatly improved.
本発明の幾つかの実施形態では、第1のパッチアルゴリズムはハーモニックなパッチアルゴリズムである。換言すると、第1パッチは入力信号の第1の帯域の周波数の整数倍の周波数のみを含むように生成される。一方、第2のパッチアルゴリズムは、混合型のパッチアルゴリズムであってもよい。この事は、第2パッチが、例えば入力信号の第1の帯域の周波数の整数倍の周波数と、入力信号の第1の帯域の周波数の整数倍ではない周波数とを含むように生成されてもよいことを意味する。従って、第2パッチのスペクトル密度は第1パッチのスペクトル密度より高い。第1パッチと第2パッチとを結合することによって、第1パッチの消失した周波数ラインは、第2パッチの周波数ラインによって満たされる可能性がある。この様にして、第1のパッチアルゴリズムに従ったハーモニックな帯域幅拡張のギャップは、第2パッチによって埋められ、帯域幅拡張信号のオーディオ品質は顕著に向上する。 In some embodiments of the invention, the first patch algorithm is a harmonic patch algorithm. In other words, the first patch is generated so as to include only a frequency that is an integral multiple of the frequency of the first band of the input signal. On the other hand, the second patch algorithm may be a mixed patch algorithm. This means that even if the second patch is generated so as to include, for example, a frequency that is an integer multiple of the frequency of the first band of the input signal and a frequency that is not an integer multiple of the frequency of the first band of the input signal. Means good. Therefore, the spectral density of the second patch is higher than the spectral density of the first patch. By combining the first patch and the second patch, the missing frequency line of the first patch may be filled by the frequency line of the second patch. In this way, the harmonic bandwidth extension gap according to the first patch algorithm is filled by the second patch, and the audio quality of the bandwidth extension signal is significantly improved.
本発明の幾つかの実施形態は、入力信号に基づいて帯域幅削減信号を生成するための装置に関する。この装置は、スペクトル包絡データ決定器と、パッチスケーリング制御データ生成器と、出力インターフェースとを備える。前記スペクトル包絡データ決定器は、入力信号の高周波帯域に基づいてスペクトル包絡データを決定する。前記パッチスケーリング制御データ生成器は、復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、復号器において帯域幅削減信号をスケールするため、又は復号器によって第1パッチと第2パッチとをスケールするための、パッチスケーリング制御データを生成する。そのスペクトル包絡基準は、スペクトル包絡データに基づいている。第1パッチは第1のパッチアルゴリズムに従って前記帯域幅削減信号の低周波帯域から生成され、第2パッチは第2のパッチアルゴリズムに従って前記帯域幅削減信号の低周波帯域から生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度に比べて高い。前記出力インターフェースは、入力信号の低周波帯域とスペクトル包絡データとパワースケーリング制御データとを結合し、前記帯域幅削減信号を得る。さらに、前記出力インターフェースは、前記帯域幅削減信号を伝送又は蓄積のために提供する。 Some embodiments of the invention relate to an apparatus for generating a bandwidth reduction signal based on an input signal. The apparatus comprises a spectral envelope data determiner, a patch scaling control data generator, and an output interface. The spectrum envelope data determiner determines spectrum envelope data based on a high frequency band of an input signal. The patch scaling control data generator is configured to scale the bandwidth reduction signal at the decoder or by the decoder so that the bandwidth extension signal generated by the decoder meets the spectral envelope criterion. Patch scaling control data for scaling the patch is generated. The spectral envelope criterion is based on spectral envelope data. A first patch is generated from the low frequency band of the bandwidth reduction signal according to a first patch algorithm, and a second patch is generated from the low frequency band of the bandwidth reduction signal according to a second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm. The output interface combines the low frequency band of the input signal, spectrum envelope data, and power scaling control data to obtain the bandwidth reduction signal. Further, the output interface provides the bandwidth reduction signal for transmission or storage.
本発明に係る幾つかのさらなる実施形態は、第1の帯域と第2の帯域とを備えるオーディオ信号に関する。第1の帯域は第1分解能データによって表され、第2の帯域は第2分解能データによって表される。第2の分解能は第1分解能より低い。第2の分解能データは、第2の帯域のスペクトル包絡データと、復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、復号器においてオーディオ信号をスケールするための、又は復号器によって第1パッチと第2パッチとをスケールするための、第2の帯域のパッチスケーリング制御データとに基づいている。前記スペクトル包絡基準は、前記スペクトル包絡データに基づいている。第1パッチは第1のパッチアルゴリズムに従ってオーディオ信号の第1の帯域から生成され、第2パッチは第2のパッチアルゴリズムに従ってオーディオ信号の第1の帯域から生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。 Some further embodiments according to the invention relate to an audio signal comprising a first band and a second band. The first band is represented by first resolution data, and the second band is represented by second resolution data. The second resolution is lower than the first resolution. The second resolution data is for scaling the audio signal at the decoder such that the spectral envelope data of the second band and the bandwidth extension signal generated by the decoder meet the spectral envelope criteria, or the decoder Is based on the second band patch scaling control data for scaling the first patch and the second patch. The spectral envelope criterion is based on the spectral envelope data. The first patch is generated from the first band of the audio signal according to the first patch algorithm, and the second patch is generated from the first band of the audio signal according to the second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm.
以下に、本発明の実施形態を添付の図面に従って詳細に説明する。
以下では、実施例の説明における重複を避けるため、同一又は同様な機能特性を持つ対象物や機能部に対して同一の参照符号が用いられ、図面に関するそれらの説明は他の図面に対しても適用される。 In the following, in order to avoid duplication in the description of the embodiments, the same reference numerals are used for objects and functional parts having the same or similar functional characteristics, and those descriptions regarding the drawings are also applied to other drawings. Applied.
図1は、本発明の第1実施形態に従って、入力信号102から帯域幅拡張信号122を生成するための装置100のブロック図を示す。入力信号102は第1の分解能データによって表現された第1帯域と、第2の分解能データによって表現された第2帯域とを持ち、第2分解能は第1分解能より低い。装置100は、結合器120と接続されたパッチ生成器110を備えている。パッチ生成器110は、入力信号102の第1帯域から第1のパッチアルゴリズムに従って第1パッチ112を生成し、かつ入力信号の第1帯域から第2のパッチアルゴリズムに従って第2パッチ114を生成する。第2のパッチアルゴリズムに従って生成された第2パッチ114のスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチ112のスペクトル密度より高い。結合器120は、第1パッチ112と第2パッチ114と入力信号102の第1帯域とを結合し、帯域幅拡張信号122を得る。さらに、帯域幅拡張信号122を生成する装置100は、帯域幅拡張信号122がスペクトル包絡基準を満たすように、第1のパッチアルゴリズムと第2パッチアルゴリズムとに従って入力信号102をスケールするか、又は第1パッチ112と第2パッチ114とをスケールする。
FIG. 1 shows a block diagram of an
スペクトル密度とは、例えば、ある周波数帯域内の異なる周波数又は周波数ラインの密度を意味する。例えば、4kHzと8kHzの周波数部分を持つ0Hz〜10kHzの周波数帯域は、2kHz、4kHz、6kHz、8kHz、10kHzの周波数部分を持つ同じ周波数帯域に比べて、低いスペクトル密度を有する。第1パッチ112のスペクトル密度は、第2パッチのスペクトル密度に比べて低いので、第1パッチ112は第2パッチ114に比べてギャップを含んでいる。そのため、第2パッチ114はこれらギャップを埋めるために使用できる。両パッチは入力信号102の第1帯域に基づいているので、両パッチは入力信号102に対応するオリジナル信号の特性に関係している。従って、帯域幅拡張信号122はオリジナル信号の良好な近似となり、帯域幅拡張信号122の主観的品質又はオーディオ品質は上述の概念を使用することで顕著に改善される。この様にして、より多くのエネルギーが残りのラインの間に分配され、例えば不自然な音を予防できる。
Spectral density means, for example, the density of different frequencies or frequency lines within a certain frequency band. For example, a frequency band from 0 Hz to 10 kHz having a frequency part of 4 kHz and 8 kHz has a lower spectral density than a same frequency band having a frequency part of 2 kHz, 4 kHz, 6 kHz, 8 kHz, and 10 kHz. Since the spectral density of the
例えば、第1のパッチアルゴリズムはハーモニックなパッチアルゴリズムであってもよい。そのため、パッチ生成器110は、入力信号102の第1帯域の周波数の整数倍である周波数だけを含む第1パッチ112を生成してもよい。ハーモニックな帯域幅拡張は、オリジナル信号の調性構造の良好な近似を提供するが、このパッチアルゴリズムはハーモニックな周波数間にギャップを残すであろう。これらギャップは第2パッチによって埋められる可能性がある。例えば、第2パッチアルゴリズムが混合型のパッチアルゴリズムである場合、つまりパッチ生成器110が、入力信号102の第1帯域の周波数の整数倍である周波数(ハーモニックな周波数)だけでなく、入力信号102の第1帯域の周波数の整数倍でない周波数(非ハーモニックな周波数)をも含む第2パッチ114を生成する場合である。非ハーモニックな周波数は、第1パッチ112のギャップを埋めるために使用される。全体の第2パッチ114(ハーモニックな周波数を含む)を第1パッチ112に結合させることもまた可能である。この例では、第1パッチ112及び/又は第2パッチ114を適切にスケールすることによって、第1パッチ112と第2パッチ114のハーモニックな周波数部分の結合によるハーモニックな周波数の拡張が考慮される。
For example, the first patch algorithm may be a harmonic patch algorithm. Therefore, the
第1パッチ112と第2パッチ114は、少なくとも部分的に同じ周波数領域を含む。例えば、第1パッチ112は4kHz〜8kHzに及ぶ周波数帯域を含み、第2パッチ114は6kHz〜10kHzの周波数帯域を含む。本発明による幾つかの実施例では、第1パッチの下側のカットオフ周波数は第2パッチの下側のカットオフ周波数に等しく、かつ第1パッチ112の上側のカットオフ周波数は第2パッチ114の上側のカットオフ周波数に等しい。例えば、両パッチが4kHz〜8kHzに及ぶ周波数帯域を含んでもよい。
The
図2aと図2bは、第1のパッチアルゴリズム212に従う第1パッチ112と、第2のパッチアルゴリズム214に従う第2パッチ114の例を示す。説明を容易にするため、図2aは第1パッチ112のみを示し、図2bは第1パッチ112とそれに対応する第2パッチ114とを示している。図2aは、入力信号102の第1帯域202と、第1のパッチアルゴリズム212に従って生成された2個の第1パッチ112との例200を示している。この例では、1つのパッチが入力信号102の第1帯域202と同じ帯域幅を持つ。この帯域幅は異なっていてもよい。入力信号102の第1帯域202の上側カットオフ周波数220は、「Xover」周波数(クロスオーバー周波数)として示されている。図2aに示された実施例では、各パッチはクロスオーバー周波数Xover220の倍数に等しい周波数で開始している。第1パッチ112内の周波数ラインは、入力信号102の第1帯域202の周波数ラインの整数倍であり、例えば位相ボコーダによって生成することができる。これら第1パッチ112は、入力信号102の第1帯域202に比較して、消失した周波数ラインに対応したギャップを含む。
FIGS. 2 a and 2 b show examples of a
図2bは、2個の対応する第2パッチ114のためのさらなる実施例250を示す。これらパッチは、第2のパッチアルゴリズム214に従って生成され、ハーモニックな周波数と非ハーモニックな周波数とを含む。非ハーモニックな周波数ラインは第1パッチ112のギャップを埋めるために使用できる。第2パッチ114の周波数ラインは、例えば非線形歪みによって生成することができる。
FIG. 2 b shows a
この方法では、前記ギャップは、例えばノイズを用いてギャップを埋めるときのように、任意に埋めることができないかも知れない。前記ギャップは、入力信号の第1帯域の第1の分解能データに基づいて埋められ、従ってオリジナル信号に基づいて埋められる。 In this method, the gap may not be filled arbitrarily, for example when filling the gap with noise. The gap is filled based on the first resolution data of the first band of the input signal and thus filled based on the original signal.
例えば、入力信号102の第1帯域が、高い分解能で符号化されたオリジナルオーディオ信号の低周波帯域に相当してもよい。また、入力信号102の第2帯域が、例えば前記オリジナルオーディオ信号の高周波帯域に相当してもよいし、1つ又は複数のパラメータ、例えばスペクトル包絡データやノイズデータ及び/又は消失した低分解能のハーモニックデータによって量子化されたものでもよい。オリジナルオーディオ信号は、例えば処理前又は符号化前にマイクロホンによって録音されたオーディオ信号であってもよい。
For example, the first band of the
入力信号を第1のパッチアルゴリズム及び第2のパッチアルゴリズムに従ってスケールするという事は、例えば第1パッチが生成される前に第1のパッチアルゴリズムに従って入力信号を一度スケールした後、次にスケールされた入力信号に基づいて第1パッチを生成し、かつ第2パッチが生成される前に第2のパッチアルゴリズムに従って入力信号を一度スケールした後、次にスケールされた入力信号に基づいて第2パッチを生成することを意味し、その結果、第1パッチと第2パッチと入力信号の第1帯域との結合の後では、帯域幅拡張信号がスペクトル包絡基準を満たすようになる。その代わり、帯域幅拡張信号がスペクトル包絡基準を満たすように、第1パッチと第2パッチはそれらの生成の後でスケールされてもよい。第1パッチと第2パッチのスケーリングと組み合わせた、第1のパッチアルゴリズム及び第2のパッチアルゴリズムに従った入力信号のスケーリングも、また可能である。 The scaling of the input signal according to the first patch algorithm and the second patch algorithm means that, for example, after the input signal is scaled once according to the first patch algorithm before the first patch is generated, it is then scaled. A first patch is generated based on the input signal, and after the input signal is scaled once according to the second patch algorithm before the second patch is generated, the second patch is then generated based on the scaled input signal. As a result, after combining the first patch, the second patch, and the first band of the input signal, the bandwidth extension signal satisfies the spectral envelope criterion. Instead, the first and second patches may be scaled after their generation so that the bandwidth extension signal meets the spectral envelope criteria. Scaling of the input signal according to the first and second patch algorithms combined with the scaling of the first and second patches is also possible.
結合器120は、例えば加算器であってもよく、帯域幅拡張信号122は、第1パッチ112と第2パッチ114と入力信号102の第1帯域の重み付き合計であってもよい。
The
スペクトル包絡基準を満たすということは、例えば帯域幅拡張信号のスペクトル包絡が入力信号に含まれたスペクトル包絡データに基づいていることを意味する。スペクトル包絡データは符号器によって生成されてもよいし、オリジナル信号の第2帯域を表してもよい。こうして、帯域幅拡張信号のスペクトル包絡は、オリジナル信号のスペクトル包絡の良好な近似になる。 Satisfying the spectral envelope criterion means that, for example, the spectral envelope of the bandwidth extension signal is based on the spectral envelope data included in the input signal. The spectral envelope data may be generated by an encoder or may represent the second band of the original signal. Thus, the spectral envelope of the bandwidth extension signal is a good approximation of the spectral envelope of the original signal.
前記装置100は、入力信号102の第1帯域を復号化するためのコア復号器を備えていてもよい。
The
パッチ生成器110と結合器120は、例えば特別に設計されたハードウエア、プロセッサ又はマイクロコントローラの一部、又はコンピュータ又はマイクロコントローラ上で実行できように構成されたコンピュータプログラムであってもよい。装置100は、復号器又はオーディオ復号器の一部であってもよい。
図3aは、本発明の一実施例に係る、入力信号102から帯域幅拡張信号122を生成するための装置300のブロック図である。この実施例では、パッチ生成器110は、第1パッチ112を生成するための位相ボコーダ310と、第2パッチ114を生成するための振幅切取り器(amplitude clipper) 320とを備えている。位相ボコーダ310と振幅切取り器320とは、結合器120に接続されている。位相ボコーダ310は、入力オーディオ信号102の第1帯域を拡大させて、ハーモニック周波数を含む第1パッチ112を生成する。非線形の処理ステップにおいて、振幅切取り器320は入力信号102を切り取り、ハーモニック周波数と非ハーモニック周波数とを含む第2パッチ114を生成する。振幅切取り器320に代えて、特性カーブの二次領域において半波整流器、全波整流器、ミキサー又はダイオードを使用し、非線形処理ステップによって入力信号102に基づいて非ハーモニック周波数を生成してもよい。
FIG. 3a is a block diagram of an
図3b、3c及び3dは、非ハーモニック周波数を生成するために切り取られ及び又は整流された入力信号102の例を示す。図3bは切り取られた正弦波状入力信号102の概略波形350を示す。信号を切り取ることで、信号傾斜380の急激な変化の形状を持つ不連続ポイントが発生し、より高い周波数を持つハーモニック部分及び非ハーモニック部分が生成される。
Figures 3b, 3c and 3d show examples of the
上記に代えて、図3cは半波整流された正弦波状入力信号102の概略波形360を示し、これもまた不連続ポイント380が発生している。
Alternatively, FIG. 3 c shows a
さらに、切取りと整流とを組み合わせることも可能である。図3dは、切り取られかつ全波整流された正弦波状入力信号102の概略波形370を示し、様々な不連続ポイント380が発生している。
It is also possible to combine cutting and rectification. FIG. 3d shows a
切取り及び/又は整流、又は不連続ポイント380を生成するための非線形な処理の他の方法を適用することによって、異なる周波数を持つ広範囲なスペクトルが生成される。従って、上述のようなパッチアルゴリズムによって生成されたパッチは、高いスペクトル密度を有することになる。
By applying clipping and / or rectification, or other methods of non-linear processing to generate
図4は、本発明のある実施例に従った、入力信号102から帯域幅拡張信号122を生成するための装置400のブロック図を示す。この装置400は、図3aに示された装置と近似しているが、追加的にスペクトルラインセレクタ(ライン選択器)410を備えている。位相ボコーダ310と振幅切取り器320はスペクトルラインセレクタ410と接続され、スペクトルラインセレクタ410は結合器120と接続されている。スペクトルラインセレクタ410は、第2パッチ114の複数の周波数ラインを選択して、第1パッチを補足する1つの修正された第2パッチ414を得ることができる。第2パッチ114の周波数ラインは、第1パッチ112の対応する周波数ラインが消失した場合に、選択される。換言すると、スペクトルラインセレクタ410は第1パッチ112のギャップを埋めるために第2パッチ114の周波数ラインを選択し、第1パッチ112によって既に含まれた第2パッチの周波数を無視すればよい。この様にして、修正された第2パッチ414は第1パッチ112に既に含まれた周波数におけるギャップを有していてもよい。
FIG. 4 shows a block diagram of an
この実施例では、結合器120は、第1パッチ112と修正された第2パッチ414と入力信号102の第1帯域とを結合させる。
In this embodiment,
スペクトルラインセレクタ410は、例えば(図4に示すように)パッチ生成器110の一部であってもよいし、別のユニットであってもよい。
The
以下では、図5と図6を参照して、本発明に係る位相ボコーダ310の可能な構成例について説明する。図5aはある位相ボコーダのフィルタバンク構成を示し、ここでは、オーディオ信号は入力500へ入力され、出力510から出力される。特に、図5aに概略で示されるフィルタバンクの各チャネルは、帯域通過フィルタ501と下流側の発振器502とを有する。各チャネルから来る全ての発振器の出力信号は、例えば加算器として構成された結合器503により結合され、出力信号が得られる。各フィルタ501は、一方では振幅信号を供給し、他方では周波数信号を供給するように構成されている。これら振幅信号と周波数信号とは時間信号であり、一方の振幅信号はフィルタ501内の時間軸における振幅の変化を示し、他方の周波数信号はフィルタ501により濾波された信号の周波数の変化を示す。
In the following, a possible configuration example of the
図5bはフィルタ501の概略的なセットアップを示す。図5aの各フィルタ501は図5bに示すようにセットアップされても良い。しかし、2つの入力ミキサ551と加算器552とに入力される周波数fiだけはチャネル毎に異なっている。ミキサ551のミキサ出力信号は両方とも低域通過フィルタ553により低域通過濾波されており、これらの低域通過信号は、局部発振器周波数(LO周波数)により生成されたものであるために互いに異なっており、90度づつ位相がずれる。上側の低域通過フィルタ553は直交位相(quadrature)信号554を出力し、下側の低域通過フィルタ553は同相(in-phase)信号555を出力する。これら2つの信号、つまりQ及びIは、矩形表示(rectangular representation)から振幅位相表示(magnitude phase representation)を生成する座標変換器556へと入力される。図5aのそれぞれの時間軸上の絶対値信号又は振幅信号は、出力557において出力される。位相信号は位相アンラッパ(phase unwrapper) 558へと供給される。要素558の出力において、常に0〜360度の間にあるような位相値はもはや存在せず、線形的に増大する位相値が存在する。この「アンラップ」された位相値は、位相/周波数変換器559に供給される。この変換器559は、例えば単純な位相差分計算器として構成され、現時点での位相から以前のある時点における位相を引き算することで、現時点での周波数値を取得してもよく、又は位相派生物の概算を得るための他の手段として構成されてもよい。この周波数値はフィルタチャネルiの一定周波数値fiに加算され、その結果、出力560において、時間的に変化する周波数値が得られる。出力560における周波数値は、直接成分(direct component)=fiと変動成分(alternating component)=周波数偏差とを有し、周波数偏差とは、フィルタチャネル内における信号の現時点の周波数と平均周波数fiとの間の周波数偏差を表す。
FIG. 5 b shows a schematic setup of the
以上、図5a及び図5bを用いて説明したように、位相ボコーダはスペクトル情報と時間情報との分割を行う。スペクトル情報は、各チャネルに周波数の直接成分を供給する特別なチャネル又は周波数fiの中にあり、他方、時間情報は周波数偏差又は時間軸上の振幅変化の中に含まれる。 As described above with reference to FIGS. 5a and 5b, the phase vocoder divides spectrum information and time information. Spectral information is in a special channel or frequency fi that provides a direct component of the frequency to each channel, while time information is contained in frequency deviations or amplitude changes on the time axis.
図5cは、本発明に従って第1パッチを生成するために実行される処理を示し、特に、位相ボコーダ310、さらに詳細には、図5aの中で破線で区画された回路部分で実行される処理を示す。
FIG. 5c shows the processing performed to generate the first patch in accordance with the present invention, in particular the
時間スケーリングのために、例えば各チャンネル内の振幅信号A(t)又は各チャンネル内の周波数信号f(t)が、デシメート(間引き)されるか又は補間(interpolation)される。本発明にとっては有用である、転位を目的として、信号A(t)及び信号f(t)の補間、即ち時間的な拡張または伸張が実行され、伸張済の信号A'(t)及び信号f'(t)が得られる。この際、補間は伸張係数598により制御される。この伸張係数は、例えば位相ボコーダがハーモニック周波数を生成するように選択され得る。位相変化の補間、即ち加算器552により一定周波数を加算する前の値の補間により、図5aにおける個々の各発振器502の周波数は変化しない。しかし、全体的なオーディオ信号の時間的な変化は、係数2により遅くなる。その結果、オリジナルのピッチを有し、時間的に伸張したトーン、即ちハーモニクスを備えたオリジナルの基本波がもたらされる。
For time scaling, for example, the amplitude signal A (t) in each channel or the frequency signal f (t) in each channel is decimated or interpolated. For the purpose of transposition, which is useful for the present invention, interpolation of the signal A (t) and the signal f (t), i.e., time expansion or expansion, is performed, and the expanded signal A ′ (t) and the signal f '(t) is obtained. At this time, the interpolation is controlled by the
図5cに示された信号処理を実行することによって、オーディオ信号は例えば係数2のデシメーションによってそのオリジナルの持続時間へと縮減され、他方、全ての周波数は同時に2倍化される。その結果、係数2によるピッチ転位がもたらされ、オリジナルオーディオ信号と同じ長さ、即ち同数のサンプルを持つオーディオ信号が得られる。 By performing the signal processing shown in FIG. 5c, the audio signal is reduced to its original duration, for example by a decimation factor of 2, while all frequencies are doubled simultaneously. As a result, a pitch shift by a factor of 2 is provided, resulting in an audio signal having the same length as the original audio signal, ie, the same number of samples.
図5aで説明したフィルタ帯域の実施例に代えて、図6に示されるような位相ボコーダにおける変換操作の構成が使用されても良い。ここでは、オーディオ信号698は、時間サンプルのシーケンスとして、FFT(高速フーリエ変換)処理器、又はより一般的には短時間フーリエ変換(STFT)処理器600へと供給される。FFT処理器600は、オーディオ信号の時間ウィンドウ化を実行し、次に、後続のFFTにより振幅スペクトルと位相スペクトルとの両方を計算する。この計算は、オーディオ信号の強くオーバーラップしているブロックに関係する連続したスペクトルのために実行される。
Instead of the filter band embodiment described with reference to FIG. 5a, a transformation operation configuration in a phase vocoder as shown in FIG. 6 may be used. Here, the audio signal 698 is supplied as a sequence of time samples to an FFT (Fast Fourier Transform) processor, or more generally a Short Time Fourier Transform (STFT)
極端な場合には、全ての新たなオーディオ信号サンプルに対して1つの新たなスペクトルを計算しても良いし、例えば20番目の新たなサンプル毎に新たなスペクトルを計算しても良い。2つのスペクトル間にあるサンプルの距離「a」は、好適には制御器602により与えられる。制御器602は、さらにIFFT(逆高速フーリエ変換)処理器604へも出力するよう構成され、この処理器604はオーバーラップ加算操作を実行する。特に、IFFT処理器604は、ある振幅スペクトルと位相スペクトルとに基づいてスペクトル毎に1つのIFFTを実行することで、逆の短時間フーリエ変換を実行し、次に、オーバーラップ加算操作を実行し、その結果として時間信号を得る。このオーバーラップ加算操作は、分析ウィンドウによって導入されるブロッキング効果を除去するものである。
In extreme cases, one new spectrum may be calculated for all new audio signal samples, for example, a new spectrum may be calculated for every 20th new sample. The distance “a” of the sample between the two spectra is preferably given by the
2つのスペクトルがIFFT処理器604により処理される時、2つのスペクトル間の距離bにより時間信号の伸張が実行され、この距離bはFFTスペクトルの生成におけるスペクトル間の距離aよりも長い。基本的な考え方は、単純に分析FFTよりも大きな間隔を有するように、オーディオ信号を逆FFTにより伸張することである。その結果、合成されたオーディオ信号内のスペクトルは、オリジナル・オーディオ信号内よりも遅い速度で変化する。
When the two spectra are processed by the
もし、ブロック606における位相再スケーリングがなかったと仮定すれば、その構成は周波数アーチファクトをもたらすであろう。例えば、単一の周波数binを考え、この周波数に対して45度ずつ連続的に位相値が変化するものとする。つまり、このフィルタ帯域内の信号は、各時間区間毎に一周期の8分の1の割合で、即ち45度ずつ位相が増大することを意味し、ここでの時間区間とは、連続するFFTの間の時間区間である。もし、逆FFTの相互間隔がより遠く離れているならば、45度の位相増大はより長い時間区間に亘って発生するということになる。つまり、この信号部分の周波数が意図せずに変更されたことになる。このようなアーチファクトを無くすため、位相は、オーディオ信号が時間的に伸張された時の係数と正に同一の係数により再スケールされる。各FFTスペクトル値の位相は、このように係数b/aにより増大させられ、その結果、上述の意図しない周波数の変更を無くすことができる。
If it was assumed that there was no phase rescaling in
図5cに示す実施例では、図5aのフィルタバンク構成の中の1つの信号発振器のために振幅/周波数制御信号の補間による伸張が行なわれたが、図6における伸張は、2つのFFTスペクトル間の距離よりも長い2つのIFFTスペクトル間の距離、即ち「a」よりも長い「b」により達成される。しかしながら、アーチファクトを防止するために、比「b/a」により位相再スケーリングが実行される。距離「b」は、例えば位相ボコーダがハーモニックな周波数を生成するように、選択することができる。 In the embodiment shown in FIG. 5c, the amplitude / frequency control signal interpolation was performed for one signal oscillator in the filter bank configuration of FIG. 5a, but the expansion in FIG. 6 is between two FFT spectra. This is achieved by a distance between two IFFT spectra longer than the distance, i.e. "b" longer than "a". However, phase rescaling is performed with the ratio “b / a” to prevent artifacts. The distance “b” can be selected, for example, such that the phase vocoder produces a harmonic frequency.
図7は、入力信号102から帯域幅拡張信号122を生成するための本発明の一実施例に従った装置700のブロック図を示す。この装置700は図1に示された装置と類似しているが、パワー制御器710と第1パワー調整手段720と第2パワー調整手段730とを備える点で異なる。パワー制御器710は第1パワー調整手段720と第2パワー調整手段730とに接続されている。第1パワー調整手段720と第2パワー調整手段730とはパッチ生成器110に接続されている。パワー制御器710は、第1と第2のパッチアルゴリズムに従い、入力信号に含まれたスペクトル包絡データと入力信号に含まれたパッチスケーリング制御データとに基づいて、入力信号のスケーリングを制御してもよい。入力信号に含まれたパッチスケーリング制御データに代えて、少なくとも1つの記憶されたパッチスケーリング制御パラメータを使用してもよい。パッチスケーリング制御パラメータは、パッチスケーリング制御パラメータメモリによって記憶されていてもよく、そのメモリはパワー制御器710又は別のユニットの一部であってもよい。第1パワー調整手段720は入力信号102を第1パッチアルゴリズムに従ってスケールしてもよいし、第2パワー調整手段730は入力信号102を第2パッチアルゴリズムに従ってスケールしてもよい。換言すれば、帯域幅拡張信号がスペクトル包絡基準を満たすように、第1と第2のパッチを生成する前に入力信号102がスケールされてもよい。そのために、スペクトル包絡データが帯域幅拡張信号122のスペクトル包絡を決定し、パッチスケーリング制御データ又はパッチスケーリング制御パラメータが第1パッチ112と第2パッチ114との比を設定するか、若しくは第1パッチ112及び/又は第2パッチ114の絶対値を設定してもよい。第1パワー調整手段720と第2パワー調整手段730は、図7に示すパワー制御器710又は別のユニットの一部であってもよい。パワー制御器710は、また図7に示すパッチ生成器110又は別のユニットの一部であってもよい。パワー調整手段720,730は、例えばパワー制御器710によって制御される増幅器やフィルタであってもよい。
FIG. 7 shows a block diagram of an
上記に代えて、スケーリングがパッチの生成後に行われてもよい。その好適例として、図8は、入力信号102から帯域幅拡張信号122を生成するための本発明の一実施例に係る装置800のブロック図を示す。この装置800は図7に示した装置と類似しているが、パワー調整手段720、730がパッチ生成器110と結合器120との間に配置されている点で異なる。この実施例では、パッチ生成器110は第1パワー調整手段720と第2パワー調整手段730とに接続されている。第1パワー調整手段720と第2パワー調整手段730とは結合器120に接続されている。この様にして、第1パッチ112は第1パッチアルゴリズムに従って第1パワー調整手段720によってスケールされ、第2パッチ114は第2パッチアルゴリズムに従って第2パワー調整手段730によってスケールされ得る。これらパワー調整手段は、上述の通り、スペクトル包絡データとパッチスケーリング制御データ又はパッチスケーリング制御パラメータに基づいて、パワー制御器710によって制御される。
Alternatively, scaling may be performed after the patch is generated. As a preferred example, FIG. 8 shows a block diagram of an
上記に代えて、2つのパッチの一方のみをスケーリング又はパワー調整した後で、結合器120によって両パッチを結合し、かつ結合パッチを入力信号102の第1帯域と結合する前に、結合パッチをスケーリングすることも可能である。換言すれば、2つのパッチ間の所定の比率を達成するように片方のパッチを(例えばパッチスケーリング制御データに基づいて)スケールし、その後、結合パッチを、スペクトル包絡基準を満たすように(例えばスペクトル包絡データに基づいて)スケールしてもよい。
Alternatively, after scaling or power adjusting only one of the two patches, combining the patches by the
パッチスケーリング制御データは、例えば、パワー分配スケーリングのための単なる係数や複数のパラメータを含んでいてもよい。パッチスケーリング制御データは、例えば第2帯域全体又は高周波数全体にわたる第1パッチと第2パッチとのパワー比を示してもよいし、第2帯域全体又は高周波数全体にわたる第1パッチ及び/又は第2パッチのパワーの絶対値を示してもよいし、少なくとも1つのパラメータによって表現されてもよい。それに代えて、パッチスケーリングデータは、スペクトル帯域複製アプリケーションにおけるサブバンド毎のスペクトル包絡データと同様に、第2帯域又は高周波帯域を一緒に構成する複数のサブバンドのそれぞれについて1つの係数を含んでもよい。さらに、このパッチスケーリングデータは、フィルタの変換関数を示してもよい。例えば、第1パッチをスケーリングするためのフィルタの変換関数のパラメータ、及び又は第2パッチをスケーリングするためのフィルタの変換関数のパラメータは、入力信号内に含まれていてもよい。こうして、パラメータは周波数の関数を表してもよい。別の変形例では、パッチスケーリング制御データは、第1パッチと第2パッチの差分関数を表してもよい。この例に従えば、入力信号のスケーリング、又は第1パッチ及び第2パッチのスケーリングは、少なくとも1個のパラメータを含むパッチスケーリング制御データに基づいていてもよい。 The patch scaling control data may include, for example, a simple coefficient for power distribution scaling and a plurality of parameters. The patch scaling control data may indicate, for example, the power ratio of the first patch to the second patch over the entire second band or the entire high frequency, and the first patch and / or the second patch over the entire second band or the entire high frequency. The absolute value of the power of two patches may be indicated, or may be expressed by at least one parameter. Alternatively, the patch scaling data may include one coefficient for each of a plurality of subbands that together comprise a second band or a high frequency band, similar to the spectral envelope data for each subband in a spectral band replication application. . Further, the patch scaling data may indicate a conversion function of the filter. For example, the parameters of the conversion function of the filter for scaling the first patch and / or the parameters of the conversion function of the filter for scaling the second patch may be included in the input signal. Thus, the parameter may represent a function of frequency. In another variation, the patch scaling control data may represent a difference function between the first patch and the second patch. According to this example, the scaling of the input signal or the scaling of the first patch and the second patch may be based on patch scaling control data including at least one parameter.
図9は、本発明の一実施例に従った、入力信号102から帯域幅拡張信号122を生成するための装置900のブロック図を示す。この装置900は図8に示す装置に類似しているが、ノイズ追加器910、消失ハーモニック追加器920、ノイズパワー調整手段940、及び消失ハーモニックパワー調整手段950をさらに含む点が異なる。ノイズ追加器910はノイズパワー調整手段940に接続され、ノイズパワー調整手段940は結合器120に接続されている。消失ハーモニック追加器920は消失ハーモニックパワー調整手段950に接続され、消失ハーモニックパワー調整手段950は結合器120に接続されている。さらに、パワー制御器710はノイズパワー調整手段940と消失ハーモニックパワー調整手段950とに接続されている。ノイズ追加器910は入力信号102に含まれたノイズデータに基づいてノイズパッチ912を生成する。
FIG. 9 shows a block diagram of an
ノイズパッチ912はノイズパワー調整手段940によってスケールされる。パワー制御器710は、入力信号102に含まれたスペクトル包絡データ及び/又はノイズスケーリングデータに基づいてノイズパワー調整手段940を制御する。この様にして、オリジナル信号のノイズは近似され、帯域幅拡張信号のオーディオ品質を改善することができる。
The
消失ハーモニック追加器920は、入力信号に含まれた消失ハーモニックデータに基づいて消失したハーモニックパッチ922を生成する。消失したハーモニックパッチ922は、オリジナル信号の高周波帯域においてのみ発生するハーモニック周波数を含んでもよく、もし入力信号102の第1帯域に関してオリジナル信号の低周波帯域の情報のみが使用可能になるならば、このハーモニック周波数は再生できない可能性がある。消失したハーモニックデータは、これら消失したハーモニクスに関する情報を提供するかも知れない。消失ハーモニックパッチ922は消失ハーモニックパワー調整手段950によってスケールされる。パワー制御器710は、入力信号102に含まれたスペクトル包絡データ又は消失ハーモニックスケーリングデータに基づいて消失ハーモニックパワー調整手段950を制御する。
The lost
結合器120は第1パッチ112と第2パッチ114と入力信号102の第1帯域とノイズパッチ912と消失ハーモニックパッチ922とを結合し、帯域幅拡張信号122を得る。パワー制御器710はパワー調整手段と共に、スペクトル包絡基準を満たすように、スペクトル包絡データに基づいて第1パッチ112と第2パッチ114とノイズパッチ912と消失ハーモニックパッチ922とをスケールする。
The
図10は、本発明の一実施例に従った、入力信号1002に基づいて帯域幅削減信号1032を提供するための装置1000のブロック図を示す。この装置1000は、スペクトル包絡データ決定器1010、パッチスケーリング制御データ生成器1020、及び出力インターフェース1030を備えている。スペクトル包絡データ決定器1010とパッチスケーリング制御データ生成器1020は、出力インターフェース1030と接続されている。スペクトル包絡データ決定器1010は入力信号1002の高周波帯域に基づいてスペクトル包絡データ1012を決定することができる。パッチスケーリング制御データ生成器1020は、復号器で生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、復号器において帯域幅削減信号1032をスケーリングするため、又は当該復号器において第1パッチと第2パッチとをスケーリングするための、パッチスケーリング制御データ1022を生成する。このスペクトル包絡基準はスペクトル包絡データに基づいている。第1パッチは帯域幅削減信号1032の第1帯域から第1のパッチアルゴリズムに従って生成され、第2パッチは帯域幅削減信号1032の第1帯域から第2のパッチアルゴリズムに従って生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。出力インターフェース1030は、入力信号1002の低周波帯域とスペクトル包絡データ1012とパッチスケーリング制御データ1022とを結合し、帯域幅削減信号1032を得る。さらに、出力インターフェース1030は伝送又は蓄積のためにこの帯域幅削減信号1032を供給する。
FIG. 10 shows a block diagram of an
装置1000は、入力信号の低周波帯域を符号化するためのコア符号器を備えていてもよい。コア符号器は、例えば差分符号器、エントロピー符号器又は知覚的オーディオ符号器であってもよい。
前記装置1000は、上述の復号器のための信号を提供する符号器の一部として構成してもよい。パッチスケーリング制御データ1022は、例えば、パワー分配スケーリングのための単純な係数や複数のパラメータを含んでいてもよい。パッチスケーリング制御データは、例えば高周波帯域全体にわたる第1パッチと第2パッチとのパワー比を示してもよいし、高周波領域全体にわたる第1パッチ及び/又は第2パッチのパワーの絶対値を示してもよいし、少なくとも1つのパラメータによって表現されてもよい。それに代えて、パッチスケーリングデータは、スペクトル帯域複製アプリケーションにおけるサブバンド毎のスペクトル包絡データと同様に、高周波帯域を一緒に構成する複数のサブバンドのそれぞれについて決定された1つの係数を含んでもよい。さらに、このパッチスケーリングデータは、フィルタの変換関数を示してもよい。例えば、第1パッチをスケーリングするためのフィルタの変換関数のパラメータ、及び/又は第2パッチをスケーリングするためのフィルタの変換関数のパラメータは、前記パッチスケーリング制御データを生成するために決定されてもよい。こうして、前記パラメータは周波数の関数に基づいて生成される。別の変形例では、第1パッチと第2パッチの差分関数を表すパッチスケーリング制御データを生成してもよい。
The
パッチスケーリング制御データ1022は入力信号1002を分析し、その入力信号1002の分析に基づいてパッチスケーリング制御パラメータメモリに記憶されたパッチスケーリング制御パラメータを選択することによって生成することができ、パッチスケーリング制御データ1022が取得される。
The patch scaling
それに代えて、パッチスケーリング制御データ1022の生成は、合成による分析手段によって実現することもできる。この目的のため、パッチスケーリング制御データ生成器1020は、パッチ生成器(復号器のために描かれたものとして)と比較器とを追加的に備えている。パッチ生成器は、第1パッチを入力信号1002の低周波帯域から第1のパッチアルゴリズムに従って生成し、第2パッチを入力信号1002の低周波帯域から第2のパッチアルゴリズムに従って生成する。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。比較器は第1パッチと第2パッチと入力信号の高周波帯域とを比較し、パッチスケーリング制御データ1022を得る。換言すれば、前述の概念は前記装置1000にも適用される。この様にして、前記装置1000はパッチ同士、又は結合されたパッチと例えばオリジナルオーディオ信号である入力信号とを比較することによって、パッチスケーリング制御データ1022を引き出すことができる。さらに、前記装置1000は、既述のようにスペクトルライン選択器、パワー制御器、ノイズ追加器及び/又は消失ハーモニック追加器を備えていてもよい。この様にして、ノイズデータ、ノイズパッチスケーリング制御データ、消失ハーモニックデータ及び/又は消失ハーモニックパッチスケーリング制御データが合成による分析手法によって引き出すことができる。
Alternatively, the generation of the patch scaling
本発明に係る幾つかの実施例は、第1帯域と第2帯域とを備えたオーディオ信号に関係する。第1帯域は第1の分解能データによって表され、第2帯域は第2の分解能データによって表され、第2の分解能は第1の分解能より低い。第2の分解能データは、第2の帯域のスペクトル包絡データと、復号器で生成された帯域幅拡張信号はスペクトル包絡基準を満たすように、復号器でオーディオ信号をスケーリングするため、又は復号器で第1パッチと第2パッチとをスケーリングするための第2の帯域のパッチスケーリング制御データとに基づいている。スペクトル包絡基準はスペクトル包絡データに基づいている。第1パッチはオーディオ信号の第1帯域から第1のパッチアルゴリズムに従って生成され、第2パッチはオーディオ信号の第1帯域から第2のパッチアルゴリズムに従って生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。 Some embodiments according to the invention relate to an audio signal comprising a first band and a second band. The first band is represented by first resolution data, the second band is represented by second resolution data, and the second resolution is lower than the first resolution. The second resolution data may be used to scale the audio signal at the decoder or at the decoder so that the spectral envelope data of the second band and the bandwidth extension signal generated by the decoder meet the spectral envelope criteria. Based on the second band patch scaling control data for scaling the first patch and the second patch. The spectral envelope criterion is based on spectral envelope data. The first patch is generated from the first band of the audio signal according to the first patch algorithm, and the second patch is generated from the first band of the audio signal according to the second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm.
前記オーディオ信号は、例えばオリジナル信号に基づいた帯域幅削減信号であってもよい。オーディオ信号の第1帯域は、高い分解能で符号化されたオリジナルオーディオ信号の低周波帯域を表してもよい。オーディオ信号の第2帯域は、オリジナルオーディオ信号の高周波帯域を表してもよく、少なくとも2つのパラメータ、すなわちスペクトル包絡データによって表現されたスペクトル包絡パラメータと、パッチスケーリング制御データによって表現されたパッチスケーリング制御パラメータとによって量子化されてもよい。このようなオーディオ信号に基づいて、上述の概念に従う復号器は、公知の概念に比べて改善されたオーディオ品質を持ち、オリジナルオーディオ信号の良好な近似をもたらす帯域幅拡張信号を生成することができる。 The audio signal may be a bandwidth reduction signal based on an original signal, for example. The first band of the audio signal may represent a low frequency band of the original audio signal encoded with high resolution. The second band of the audio signal may represent a high frequency band of the original audio signal, and includes at least two parameters: a spectral envelope parameter expressed by the spectral envelope data and a patch scaling control parameter expressed by the patch scaling control data. And may be quantized. Based on such an audio signal, a decoder according to the above concept can generate a bandwidth extension signal that has an improved audio quality compared to the known concept and provides a good approximation of the original audio signal. .
図11は、本発明の一実施例における、入力信号から帯域幅拡張信号を生成する方法1100のフローチャートを示す。入力信号の第1帯域は第1の分解能データによって表現され、第2帯域は第2の分解能データによって表現され、第2の分解能は第1の分解能より低い。前記方法1100は、第1パッチを生成するステップ1110と、第2パッチを生成するステップ1120と、入力信号をスケールするステップ1130又は第1パッチ及び第2パッチをスケールするステップ1130と、第1パッチと第2パッチと入力信号の第1帯域とを結合するステップ1140とを備え、帯域幅拡張信号を得る。第1パッチは入力信号の第1帯域から第1のパッチアルゴリズムに従って生成1110され、第2パッチは入力信号の第1帯域から第2のパッチアルゴリズムに従って生成1120される。第2のパッチアルゴリズムに従って生成1120された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成1110された第1パッチのスペクトル密度より高い。帯域幅拡張信号がスペクトル包絡基準を満たすように、入力信号が第1のパッチアルゴリズム及び第2のパッチアルゴリズムに従ってスケール1130されるか、又は第1パッチと第2パッチとがスケール1130される。
FIG. 11 shows a flowchart of a
さらに、前記方法1100は、上述の概念に従ったステップによって拡張されてもよい。前記方法1100は、例えばコンピュータやマイクロコントローラ上で動作するコンピュータプログラムとして実現されてもよい。
Further, the
図12は、本発明の一実施例に係る、入力信号に基づいて帯域幅削減信号を提供する方法1200のフローチャートを示す。この方法1200は、入力信号の高周波帯域に基づいてスペクトル包絡データを決定するステップ1210と、パッチスケーリング制御データを生成するステップ1220と、帯域幅削減信号を得るために入力信号の低周波帯域とスペクトル包絡データとパッチスケーリング制御データとを結合するステップ1230と、伝送又は蓄積のために帯域幅削減信号を提供するステップ1240とを有する。パッチスケーリング制御データは、復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、復号器において帯域幅削減信号をスケールするため、又は復号器によって第1パッチと第2パッチとをスケールするために生成1220される。スペクトル包絡基準はスペクトル包絡データに基づいている。第1パッチは帯域幅削減信号の低周波帯域から第1のパッチアルゴリズムに従って生成され、第2パッチは帯域幅削減信号の低周波帯域から第2のパッチアルゴリズムに従って生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。
FIG. 12 shows a flowchart of a
さらに、前記方法1200は、上述の概念に従ったステップによって拡張されてもよい。前記方法1200は、例えばコンピュータやマイクロコントローラ上で動作するコンピュータプログラムとして実現されてもよい。
Further, the
本発明に係る幾つかの実施例は、非線形歪みやより密なスペクトルのためのノイズ充填と結合された帯域幅拡張のために、位相ボコーダを使って帯域幅拡張信号を生成するための装置に関する。スペクトル拡大のために位相ボコーダを適用した場合には、周波数ラインはさらに離間する。スペクトル内にギャップが例えば量子化によって存在する場合には、前記拡大によってギャップはさらに増大する。エネルギー適応において、スペクトル内に残存するラインは大き過ぎるエネルギーを受け取る。このことは、ギャップをノイズや信号の非線形歪みによって得られるさらなるハーモニクスによって充填することで、防止できる。この様にして、より大きなエネルギーが残存するラインの間に分配される。帯域内の僅か数個の周波数ラインへのエネルギー集中によって、不自然な又は金属的な音をもたらす。以前はより多数存在した帯域のエネルギーは、残存する帯域へと合計される。 Some embodiments according to the invention relate to an apparatus for generating a bandwidth extension signal using a phase vocoder for bandwidth extension combined with non-linear distortion and noise filling for denser spectra. . When a phase vocoder is applied for spectral expansion, the frequency lines are further separated. If there are gaps in the spectrum, for example by quantization, the expansion further increases the gaps. In energy adaptation, the lines remaining in the spectrum receive too much energy. This can be prevented by filling the gap with further harmonics obtained by noise or non-linear distortion of the signal. In this way, more energy is distributed among the remaining lines. Energy concentration on just a few frequency lines in the band results in an unnatural or metallic sound. The energy of the band that previously existed is summed into the remaining band.
スペクトル内にギャップはないが、少なくともノイズが存在する場合には、エネルギーの一部はノイズフロアに残っている。非線形歪みの適用により、一方ではスペクトルは歪みによって生成されたノイズによって、他方では歪められるべき信号部分の適切な選択によって導かれたさらなるハーモニック部分によって、再び密にされる。 There are no gaps in the spectrum, but at least if there is noise, some of the energy remains in the noise floor. With the application of non-linear distortion, on the one hand the spectrum is again densified by noise generated by the distortion and on the other hand by further harmonic parts guided by the appropriate selection of signal parts to be distorted.
次に帯域幅拡張信号は、例えば濾波され歪められた信号と、位相ボコーダの助けを借りて生成された信号との重み付き合計であってもよい。換言すれば、帯域幅拡張信号は、第1パッチと第2パッチと入力信号の第1帯域との重み付き合計であってもよい。 The bandwidth extension signal may then be a weighted sum of, for example, a filtered and distorted signal and a signal generated with the help of a phase vocoder. In other words, the bandwidth extension signal may be a weighted sum of the first patch, the second patch, and the first band of the input signal.
本発明に係る幾つかの実施例は、全帯域が利用できる訳ではないような全てのオーディオアプリケーションに適した概念に関する。例えば、デジタルラジオサービス、インターネットストリーミング、又は他のオーディオ通信アプリケーションを使用するオーディオコンテンツの放送のため、上述の概念を適用できる。 Some embodiments according to the invention relate to a concept suitable for all audio applications where not all the bandwidth is available. For example, the concepts described above can be applied for broadcasting audio content using digital radio services, Internet streaming, or other audio communication applications.
本発明を幾つかの実施例に関連して説明してきたが、本発明の趣旨を逸脱しない範囲での修正や置換、等価物であってもよい。本発明の方法や構成の多くの代替方法があることもまた注目すべきである。したがって、添付の請求項は本発明の趣旨に含まれるこれら全ての修正、置換、等価物を包含すると解釈されるべきである。 Although the present invention has been described with reference to several embodiments, modifications, substitutions, and equivalents may be made without departing from the spirit of the present invention. It should also be noted that there are many alternatives to the method and configuration of the present invention. Therefore, the appended claims should be construed to include all these modifications, substitutions, and equivalents included within the spirit of the invention.
特に、状況によって、本発明の構成はソフトウエアとして構成されてもよい点に注目すべきである。本発明は、対応する方法が実行されるように、デジタル記憶媒体、特にプログラム可能なコンピュータシステムと協動して電子的に読み取り可能な制御信号を含むフレキシブルディスクやCDであってもよい。一般に、本発明は、このコンピュータプログラム製品がコンピュータで作動されたとき、本発明方法を実行するために機械読み取り可能なキャリアに記憶されたコンピュータプログラム製品の中に含まれる。換言すれば、本発明は、コンピュータプログラム製品がコンピュータで作動されたとき、本発明方法を実行するためのプログラムコードを有するコンピュータプログラムとして実現される。 In particular, it should be noted that the configuration of the present invention may be configured as software depending on the situation. The invention may be a flexible disk or CD containing control signals that can be read electronically in cooperation with a digital storage medium, in particular a programmable computer system, so that the corresponding method is carried out. In general, the present invention is included in a computer program product stored on a machine readable carrier for performing the method of the present invention when the computer program product is run on a computer. In other words, the present invention is realized as a computer program having a program code for executing the method of the present invention when the computer program product is operated on a computer.
Claims (17)
前記入力信号(102)の第1帯域から第1のパッチアルゴリズムに従って第1パッチ(112)を生成し、かつ入力信号(102)の第1帯域から第2のパッチアルゴリズムに従って第2パッチ(114)を生成するパッチ生成器(110)であって、前記第2のパッチアルゴリズムに従って生成された前記第2パッチ(114)のスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチ(112)のスペクトル密度に比べて高い、パッチ生成器と、
前記第1パッチ(112)と前記第2パッチ(114)と前記入力信号(102)の第1帯域とを結合して前記帯域幅拡張信号(122)を得る結合器(120)と、を備え、
帯域幅拡張信号を生成する前記装置は、前記帯域幅拡張信号がスペクトル包絡基準を満たすように、前記第1のパッチアルゴリズムと第2のパッチアルゴリズムとに従って前記入力信号(102)をスケールするか、又は前記第1パッチ(112)と第2パッチ(114)とをスケールすることを特徴とする装置。 An apparatus (100; 300; 400; 700; 800; 900) for generating a bandwidth extension signal (122) from an input signal (102), wherein the first band of the input signal is represented by first resolution data. The second band is represented by the second resolution data, the second resolution being lower than the first resolution,
A first patch (112) is generated from a first band of the input signal (102) according to a first patch algorithm and a second patch (114) according to a second patch algorithm from the first band of the input signal (102) A patch generator (110) for generating a spectral density of the second patch (114) generated according to the second patch algorithm, wherein the first patch (112) generated according to the first patch algorithm ) With a patch generator that is higher than the spectral density of
A combiner (120) for combining the first patch (112), the second patch (114), and the first band of the input signal (102) to obtain the bandwidth extension signal (122); ,
The apparatus for generating a bandwidth extension signal scales the input signal (102) according to the first patch algorithm and the second patch algorithm such that the bandwidth extension signal satisfies a spectral envelope criterion; Alternatively, the apparatus scales the first patch (112) and the second patch (114).
前記入力信号(1002)の高周波帯域に基づいてスペクトル包絡データ(1012)を決定するスペクトル包絡データ決定器(1010)と、
復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、前記帯域幅削減信号(1032)を前記復号器においてスケールするため、又は前記復号器によって第1パッチと第2パッチとをスケールするためのパッチスケーリング制御データ(1022)を生成するパッチスケーリング制御データ生成器(1020)であって、前記スペクトル包絡基準は前記スペクトル包絡データ(1012)に基づいており、前記第1パッチは前記帯域幅削減信号(1032)の第1帯域から第1のパッチアルゴリズムに従って生成され、前記第2パッチは前記帯域幅削減信号(1032)の第1帯域から第2のパッチアルゴリズムに従って生成され、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高い、パッチスケーリング制御データ生成器と、
前記入力信号(1002)の低周波帯域と、前記スペクトル包絡データ(1012)と、前記パッチスケーリング制御データ(1022)とを結合して前記帯域幅削減信号(1032)を得ると共に、その帯域幅削減信号(1032)を伝送又は蓄積のために提供する出力インターフェース(1030)と、を備えた装置。 An apparatus (1000) for providing a bandwidth reduction signal (1032) based on an input signal (1002), comprising:
A spectral envelope data determiner (1010) for determining spectral envelope data (1012) based on a high frequency band of the input signal (1002);
In order to scale the bandwidth reduction signal (1032) in the decoder so that the bandwidth extension signal generated by the decoder meets the spectral envelope criterion, or by the decoder, the first patch and the second patch A patch scaling control data generator (1020) for generating patch scaling control data (1022) for scaling, wherein the spectral envelope criterion is based on the spectral envelope data (1012), and the first patch is A second patch is generated from a first band of the bandwidth reduction signal (1032) according to a first patch algorithm, and the second patch is generated from a first band of the bandwidth reduction signal (1032) according to a second patch algorithm, Spectrum of the second patch generated according to the patch algorithm of 2 Once again higher than the spectral density of the first patch generated according to the first patch algorithm and the patch scaling control data generator,
The low frequency band of the input signal (1002), the spectral envelope data (1012), and the patch scaling control data (1022) are combined to obtain the bandwidth reduction signal (1032), and the bandwidth reduction An output interface (1030) for providing a signal (1032) for transmission or storage.
前記入力信号(1002)の低周波帯域から第1のパッチアルゴリズムに従って第1パッチを生成し、かつ前記入力信号(1002)の低周波帯域から第2のパッチアルゴリズムに従って第2パッチを生成するパッチ生成器であって、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高い、パッチ生成器と、
前記第1パッチと前記第2パッチと前記入力信号(1002)の高周波帯域とを比較し、前記パッチスケーリング制御データ(1022)を得る比較器と、を備えた装置。 12. The apparatus of claim 11, wherein the patch scaling control data generator is
Patch generation for generating a first patch from a low frequency band of the input signal (1002) according to a first patch algorithm and generating a second patch from a low frequency band of the input signal (1002) according to a second patch algorithm A patch generator, wherein a spectral density of the second patch generated according to the second patch algorithm is higher than a spectral density of the first patch generated according to the first patch algorithm;
A comparator that compares the first patch, the second patch, and a high frequency band of the input signal (1002) to obtain the patch scaling control data (1022);
前記入力信号の第1帯域から第1のパッチアルゴリズムに従って第1パッチを生成するステップ(1110)と、
前記入力信号の第1帯域から第2のパッチアルゴリズムに従って第2パッチを生成するステップ(1120)であって、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高い、ステップと、
前記帯域幅拡張信号がスペクトル包絡基準を満たすように、前記第1のパッチアルゴリズムと第2のパッチアルゴリズムとに従って前記入力信号をスケールするか、又は前記第1パッチと第2パッチとをスケールするステップ(1130)と、
前記第1パッチと前記第2パッチと前記入力信号の第1帯域とを結合して前記帯域幅拡張信号を得るステップ(1140)と、を備える方法。 A method (1100) for generating a bandwidth extension signal from an input signal, wherein the first band of the input signal is represented by first resolution data, the second band is represented by second resolution data, and The resolution of 2 is lower than the first resolution,
Generating (1110) a first patch from a first band of the input signal according to a first patch algorithm;
Generating a first patch from a first band of the input signal according to a second patch algorithm (1120), wherein a spectral density of the second patch generated according to the second patch algorithm is the first patch A step that is higher than the spectral density of the first patch generated according to a patch algorithm;
Scaling the input signal according to the first patch algorithm and the second patch algorithm, or scaling the first patch and the second patch such that the bandwidth extension signal satisfies a spectral envelope criterion. (1130)
Combining the first patch, the second patch, and the first band of the input signal to obtain the bandwidth extension signal (1140).
前記入力信号の高周波帯域に基づいてスペクトル包絡データを決定するステップ(1210)と、
復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、前記帯域幅削減信号を前記復号器においてスケールするため、又は前記復号器によって第1パッチと第2パッチとをスケールするためのパッチスケーリング制御データを生成するステップ(1220)であって、前記スペクトル包絡基準は前記スペクトル包絡データに基づいており、前記第1パッチは前記帯域幅削減信号の第1帯域から第1のパッチアルゴリズムに従って生成され、前記第2パッチは前記帯域幅削減信号の第1帯域から第2のパッチアルゴリズムに従って生成され、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高い、ステップと、
前記入力信号の低周波帯域と、前記スペクトル包絡データと、前記パッチスケーリング制御データとを結合して前記帯域幅削減信号を得るステップ(1230)と、
前記帯域幅削減信号を伝送又は蓄積のために提供するステップ(1240)と、を備える方法。 A method (1200) of providing a bandwidth reduction signal based on an input signal comprising:
Determining spectral envelope data based on a high frequency band of the input signal (1210);
To scale the bandwidth reduction signal at the decoder or to scale the first and second patches by the decoder so that the bandwidth extension signal generated by the decoder meets the spectral envelope criterion Generating (1220) patch scaling control data for the spectrum envelope criteria based on the spectrum envelope data, wherein the first patch is a first patch algorithm from a first band of the bandwidth reduction signal. And the second patch is generated from the first band of the bandwidth reduction signal according to a second patch algorithm, and the spectral density of the second patch generated according to the second patch algorithm is the first patch Compared to the spectral density of the first patch generated according to the patch algorithm High Te, and the step,
Combining the low frequency band of the input signal, the spectral envelope data, and the patch scaling control data to obtain the bandwidth reduction signal (1230);
Providing (1240) the bandwidth reduction signal for transmission or storage.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US7984908P | 2008-07-11 | 2008-07-11 | |
US61/079,849 | 2008-07-11 | ||
PCT/EP2009/004603 WO2010003557A1 (en) | 2008-07-11 | 2009-06-25 | Apparatus and method for generating a bandwidth extended signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011527452A JP2011527452A (en) | 2011-10-27 |
JP5255699B2 true JP5255699B2 (en) | 2013-08-07 |
Family
ID=41162740
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011516992A Active JP5255699B2 (en) | 2008-07-11 | 2009-06-25 | Apparatus and method for generating bandwidth extension signal |
Country Status (18)
Country | Link |
---|---|
EP (1) | EP2291842B1 (en) |
JP (1) | JP5255699B2 (en) |
KR (1) | KR101239812B1 (en) |
CN (1) | CN102105931B (en) |
AR (1) | AR072483A1 (en) |
AU (1) | AU2009267460B2 (en) |
BR (2) | BRPI0910528B1 (en) |
CA (1) | CA2729474C (en) |
CO (1) | CO6541514A2 (en) |
ES (1) | ES2461141T3 (en) |
HK (1) | HK1154112A1 (en) |
MX (1) | MX2011000365A (en) |
MY (1) | MY163454A (en) |
PL (1) | PL2291842T3 (en) |
RU (1) | RU2512090C2 (en) |
TW (1) | TWI415116B (en) |
WO (1) | WO2010003557A1 (en) |
ZA (1) | ZA201009164B (en) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4250290A1 (en) | 2010-01-19 | 2023-09-27 | Dolby International AB | Improved subband block based harmonic transposition |
JP5588025B2 (en) | 2010-03-09 | 2014-09-10 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | Apparatus and method for processing audio signals using patch boundary matching |
JP5854520B2 (en) | 2010-03-09 | 2016-02-09 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | Apparatus and method for improved amplitude response and temporal alignment in a bandwidth extension method based on a phase vocoder for audio signals |
JP5649084B2 (en) | 2010-03-09 | 2015-01-07 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | Apparatus and method for processing transient audio events in an audio signal when changing playback speed or pitch |
TR201904117T4 (en) * | 2010-04-16 | 2019-05-21 | Fraunhofer Ges Forschung | Apparatus, method and computer program for generating a broadband signal using guided bandwidth extension and blind bandwidth extension. |
PL2596497T3 (en) * | 2010-07-19 | 2014-10-31 | Dolby Int Ab | Processing of audio signals during high frequency reconstruction |
DK2617035T3 (en) | 2010-09-16 | 2019-01-02 | Dolby Int Ab | CROSS-PRODUCT-ENHANCED SUBBOND BLOCK BASED HARMONIC TRANSPOSITION |
US8490008B2 (en) * | 2011-11-10 | 2013-07-16 | Research In Motion Limited | Touchscreen keyboard predictive display and generation of a set of characters |
US9251800B2 (en) * | 2011-11-02 | 2016-02-02 | Telefonaktiebolaget L M Ericsson (Publ) | Generation of a high band extension of a bandwidth extended audio signal |
CN102543086B (en) * | 2011-12-16 | 2013-08-14 | 大连理工大学 | Device and method for expanding speech bandwidth based on audio watermarking |
ES2549953T3 (en) * | 2012-08-27 | 2015-11-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for the reproduction of an audio signal, apparatus and method for the generation of an encoded audio signal, computer program and encoded audio signal |
EP2709106A1 (en) | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
EP2830060A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling in multichannel audio coding |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
JP2016038435A (en) | 2014-08-06 | 2016-03-22 | ソニー株式会社 | Encoding device and method, decoding device and method, and program |
RU2589305C1 (en) * | 2014-11-18 | 2016-07-10 | Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военный учебно-научный центр Военно-воздушных сил "Военно-воздушная академия имени профессора Н.Е. Жуковского и Ю.А. Гагарина" (г. Воронеж) Министерства обороны Российской Федерации | High-frequency signal generation method and device for its implementation |
WO2016149085A2 (en) * | 2015-03-13 | 2016-09-22 | Psyx Research, Inc. | System and method for dynamic recovery of audio data and compressed audio enhancement |
EP3121814A1 (en) * | 2015-07-24 | 2017-01-25 | Sound object techology S.A. in organization | A method and a system for decomposition of acoustic signal into sound objects, a sound object and its use |
TWI807562B (en) | 2017-03-23 | 2023-07-01 | 瑞典商都比國際公司 | Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US654988A (en) * | 1900-03-16 | 1900-07-31 | Leonhard Lederer | Process of making acetyl cellulose. |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
RU2256293C2 (en) * | 1997-06-10 | 2005-07-10 | Коудинг Технолоджиз Аб | Improving initial coding using duplicating band |
SE512719C2 (en) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | A method and apparatus for reducing data flow based on harmonic bandwidth expansion |
EP0945852A1 (en) * | 1998-03-25 | 1999-09-29 | BRITISH TELECOMMUNICATIONS public limited company | Speech synthesis |
SE9903553D0 (en) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing conceptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
SE0004163D0 (en) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance or high frequency reconstruction coding methods by adaptive filtering |
US7260541B2 (en) | 2001-07-13 | 2007-08-21 | Matsushita Electric Industrial Co., Ltd. | Audio signal decoding device and audio signal encoding device |
CN1550002A (en) * | 2001-08-31 | 2004-11-24 | 皇家飞利浦电子股份有限公司 | Bandwidth extension of a sound signal |
JP4380174B2 (en) * | 2003-02-27 | 2009-12-09 | 沖電気工業株式会社 | Band correction device |
DE602004016325D1 (en) * | 2003-05-20 | 2008-10-16 | Matsushita Electric Ind Co Ltd | DIOSIGNALBANDES |
JP2005010621A (en) * | 2003-06-20 | 2005-01-13 | Matsushita Electric Ind Co Ltd | Voice band expanding device and band expanding method |
WO2006046587A1 (en) * | 2004-10-28 | 2006-05-04 | Matsushita Electric Industrial Co., Ltd. | Scalable encoding apparatus, scalable decoding apparatus, and methods thereof |
KR100647336B1 (en) * | 2005-11-08 | 2006-11-23 | 삼성전자주식회사 | Apparatus and method for adaptive time/frequency-based encoding/decoding |
JP5141180B2 (en) * | 2006-11-09 | 2013-02-13 | ソニー株式会社 | Frequency band expanding apparatus, frequency band expanding method, reproducing apparatus and reproducing method, program, and recording medium |
-
2009
- 2009-06-25 CA CA2729474A patent/CA2729474C/en active Active
- 2009-06-25 PL PL09776840T patent/PL2291842T3/en unknown
- 2009-06-25 AU AU2009267460A patent/AU2009267460B2/en active Active
- 2009-06-25 CN CN2009801270931A patent/CN102105931B/en active Active
- 2009-06-25 MX MX2011000365A patent/MX2011000365A/en active IP Right Grant
- 2009-06-25 ES ES09776840.2T patent/ES2461141T3/en active Active
- 2009-06-25 BR BRPI0910528-0A patent/BRPI0910528B1/en active IP Right Grant
- 2009-06-25 WO PCT/EP2009/004603 patent/WO2010003557A1/en active Application Filing
- 2009-06-25 MY MYPI2011000040A patent/MY163454A/en unknown
- 2009-06-25 RU RU2011100134/08A patent/RU2512090C2/en active
- 2009-06-25 JP JP2011516992A patent/JP5255699B2/en active Active
- 2009-06-25 EP EP09776840.2A patent/EP2291842B1/en active Active
- 2009-06-25 BR BR122017003818-4A patent/BR122017003818B1/en active IP Right Grant
- 2009-06-25 KR KR1020117000441A patent/KR101239812B1/en active IP Right Grant
- 2009-07-03 TW TW098122551A patent/TWI415116B/en active
- 2009-07-07 AR ARP090102552A patent/AR072483A1/en active IP Right Grant
-
2010
- 2010-12-21 ZA ZA2010/09164A patent/ZA201009164B/en unknown
- 2010-12-29 CO CO10164070A patent/CO6541514A2/en active IP Right Grant
-
2011
- 2011-08-10 HK HK11108364.8A patent/HK1154112A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
WO2010003557A1 (en) | 2010-01-14 |
CN102105931A (en) | 2011-06-22 |
RU2011100134A (en) | 2012-07-20 |
ES2461141T3 (en) | 2014-05-16 |
KR101239812B1 (en) | 2013-03-06 |
AU2009267460B2 (en) | 2013-01-10 |
AU2009267460A1 (en) | 2010-01-14 |
TWI415116B (en) | 2013-11-11 |
CA2729474A1 (en) | 2010-01-14 |
HK1154112A1 (en) | 2012-04-20 |
KR20110033188A (en) | 2011-03-30 |
BRPI0910528B1 (en) | 2020-09-24 |
RU2512090C2 (en) | 2014-04-10 |
BR122017003818A2 (en) | 2019-09-03 |
MY163454A (en) | 2017-09-15 |
CN102105931B (en) | 2013-04-10 |
ZA201009164B (en) | 2011-10-26 |
BRPI0910528A2 (en) | 2018-05-22 |
CA2729474C (en) | 2015-09-01 |
EP2291842B1 (en) | 2014-03-12 |
EP2291842A1 (en) | 2011-03-09 |
TW201007708A (en) | 2010-02-16 |
CO6541514A2 (en) | 2012-10-16 |
BR122017003818B1 (en) | 2024-03-05 |
MX2011000365A (en) | 2011-02-25 |
AR072483A1 (en) | 2010-09-01 |
JP2011527452A (en) | 2011-10-27 |
PL2291842T3 (en) | 2014-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5255699B2 (en) | Apparatus and method for generating bandwidth extension signal | |
JP5192053B2 (en) | Apparatus and method for bandwidth extension of audio signal | |
TWI444991B (en) | Apparatus and method for processing an audio signal using patch border alignment | |
US8880410B2 (en) | Apparatus and method for generating a bandwidth extended signal | |
JP2015526769A (en) | Apparatus and method for reproducing audio signal, apparatus and method for generating encoded audio signal, computer program, and encoded audio signal | |
US20230343356A1 (en) | Apparatus and Method for Generating a Bandwidth Extended Signal | |
KR102619434B1 (en) | Audio processor and method for generating frequency-enhanced audio signals using pulse processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121211 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130326 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130419 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5255699 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160426 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |