JP5255699B2 - Apparatus and method for generating bandwidth extension signal - Google Patents

Apparatus and method for generating bandwidth extension signal Download PDF

Info

Publication number
JP5255699B2
JP5255699B2 JP2011516992A JP2011516992A JP5255699B2 JP 5255699 B2 JP5255699 B2 JP 5255699B2 JP 2011516992 A JP2011516992 A JP 2011516992A JP 2011516992 A JP2011516992 A JP 2011516992A JP 5255699 B2 JP5255699 B2 JP 5255699B2
Authority
JP
Japan
Prior art keywords
patch
input signal
signal
band
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011516992A
Other languages
Japanese (ja)
Other versions
JP2011527452A (en
Inventor
フレデリック ナーゲル
サーシャ デッシュ
マックス ノイエンドルフ
ステファン バイエル
マルク ガイエル
マルクス ローヴァサー
ニコラス レッテルバッハ
ウルリッヒ クレーマー
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2011527452A publication Critical patent/JP2011527452A/en
Application granted granted Critical
Publication of JP5255699B2 publication Critical patent/JP5255699B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Transmitters (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、オーディオ信号処理に関し、特に入力信号から帯域幅拡張信号を生成するための装置及び方法、及び入力信号及びオーディオ信号に基づいて帯域幅削減信号を生成する方法及び装置に関するものである。 The present invention relates to audio signal processing, and more particularly, to an apparatus and method for generating a bandwidth extension signal from an input signal, and a method and apparatus for generating a bandwidth reduction signal based on the input signal and the audio signal.

オーディオ信号の知覚的適応型符号化、つまりオーディオ信号の効率的な格納と伝送のために実質的なデータレートを削減する符号化は、多くの分野で広く受け入れられてきた。例えば、MPEG−1/2−レイヤ3(MP3)やMPEG−4−AAC(Advanced Audio Coding)などの多数の符号化アルゴリズムが知られている。しかしながら、このために使用される符号化は、特に最低ビットレートで作動される時、主観的なオーディオ品質を低下させ、このような品質低下は、伝送されるべきオーディオ信号の帯域の制限により、主に符号器側の原因で引き起こされる。 Perceptual adaptive coding of audio signals, that is, coding that reduces the effective data rate for efficient storage and transmission of audio signals, has been widely accepted in many fields. For example, many encoding algorithms such as MPEG-1 / 2-layer 3 (MP3) and MPEG-4-AAC (Advanced Audio Coding) are known. However, the encoding used for this degrades subjective audio quality, especially when operated at the lowest bit rate, and such quality degradation is due to bandwidth limitations of the audio signal to be transmitted. This is mainly caused by the encoder side.

このような状況において、特許文献1には、オーディオ信号に符号器側で帯域制限を施し、高品質オーディオ符号器(コア符号器)を用いて前記オーディオ信号の低周波帯域のみを符号化する手法が開示されている。しかし、高周波帯域は非常に粗く、すなわち高周波帯域のスペクトル包絡を再生するパラメータセットによって特徴付けられる。復号器側では、高周波帯域はその後で合成される。この目的のため、ハーモニック転位が用いられ、そこでは復号化されたオーディオ信号の低周波帯域がフィルタバンクに供給される。低周波帯域のフィルタバンクチャンネルは高周波帯域のフィルタバンクチャンネルに接続されるか、又は「パッチ」される。そして、各パッチ済のバンドパス信号には包絡調整が施される。特殊な分析フィルタバンクに属する合成フィルタバンクは、低周波帯域におけるオーディオ信号のバンドパス信号と低周波帯域の包絡調整済みバンドパス信号とを受け取り、これら信号は高周波帯域へとハーモニックにパッチされる。合成フィルタバンクの出力信号は、そのオリジナルな帯域幅と比較して拡張されたオーディオ信号である。そのオリジナルな帯域とは、符号器側から復号器側へと、非常に低いデータレートで作動するコア符号器によって伝送されたものである。特に、フィルタバンクドメインでのフィルタバンク演算とパッチ処理は、高い演算能力を必要とする可能性がある。 In such a situation, Patent Document 1 discloses a method in which the audio signal is band-limited on the encoder side and only the low frequency band of the audio signal is encoded using a high-quality audio encoder (core encoder). Is disclosed. However, the high frequency band is very coarse, i.e. characterized by a parameter set that reproduces the spectral envelope of the high frequency band. On the decoder side, the high frequency band is then synthesized. For this purpose, a harmonic transposition is used, in which the low frequency band of the decoded audio signal is supplied to the filter bank. The low frequency band filter bank channel is connected or “patched” to the high frequency band filter bank channel. Envelope adjustment is performed on each patched bandpass signal. A synthesis filter bank belonging to a special analysis filter bank receives the bandpass signal of the audio signal in the low frequency band and the envelope adjusted bandpass signal of the low frequency band, and these signals are harmonically patched to the high frequency band. The output signal of the synthesis filter bank is an audio signal that is expanded compared to its original bandwidth. The original band is that transmitted by the core encoder operating at a very low data rate from the encoder side to the decoder side. In particular, filter bank computation and patch processing in the filter bank domain may require high computing capabilities.

それに代わり、帯域制限されたオーディオ信号の帯域幅拡張のための複雑性を削減した方法は、帯域制限によって消失した情報を近似するため、低周波信号部分(LF)のコピー作用を高周波領域(HF)に用いるものである。このような方法は、非特許文献1〜4及び特許文献2に開示されている。 Instead, the method of reducing the complexity for expanding the bandwidth of the band-limited audio signal approximates the information lost due to the band limitation. Therefore, the copying operation of the low-frequency signal portion (LF) is changed to the high-frequency region (HF). ). Such a method is disclosed in Non-Patent Documents 1 to 4 and Patent Document 2.

これら方法において、ハーモニックな転位は実行されず、低周波帯域の連続的なバンドパス信号は、高周波帯域の連続的なフィルタバンクチャンネルへと導入される。この方法によって、オーディオ信号の高周波帯域の粗い近似が達成される。次の段階では、この信号のこの粗い近似は、オリジナル信号から得られた制御情報を使用した後処理(post processing)によってオリジナル信号に同化される。ここで、MPEG−4高効率先進的オーディオ符号化(HE−AAC)標準に記載されているように、例えばスペクトル包絡や逆フィルタリングを適用するためにスケールファクタが用いられ、さらに消失したハーモニクスのための調性適応ノイズフロアの追加及び正弦波信号部分の補足のためにスケールファクタが用いられる。 In these methods, harmonic transposition is not performed and a continuous bandpass signal in the low frequency band is introduced into a continuous filter bank channel in the high frequency band. By this method, a rough approximation of the high frequency band of the audio signal is achieved. In the next stage, this coarse approximation of this signal is assimilated to the original signal by post processing using control information obtained from the original signal. Here, as described in the MPEG-4 High Efficiency Advanced Audio Coding (HE-AAC) standard, for example, scale factors are used to apply spectral envelopes and inverse filtering, and for lost harmonics A scale factor is used to add a tonal adaptive noise floor and to supplement the sinusoidal signal portion.

上述とは別に、次の方法では帯域幅拡張のために位相ボコーダが使用される。スペクトル拡大のために位相ボコーダを適用した場合、周波数ラインは互いにさらに離れることになる。もし、例えば量子化によってギャップがスペクトルに存在する場合、そのギャップは拡大によってさらに増大する。エネルギー適応において、スペクトルに残されたラインは、オリジナル信号における個々のラインに比べて大き過ぎるエネルギーを受け取ることになる。 Apart from the above, the next method uses a phase vocoder for bandwidth expansion. When applying a phase vocoder for spectral broadening, the frequency lines will be further away from each other. If a gap is present in the spectrum, for example by quantization, the gap is further increased by expansion. In energy adaptation, the lines left in the spectrum will receive too much energy compared to the individual lines in the original signal.

図13は、位相ボコーダを用いた帯域幅拡張1300の概略図を示す。この例では、2つのパッチ1312、1314が信号の低周波帯域1302に追加される。前記信号の所謂クロスーバー周波数とも呼ばれる上側カットオフ周波数1320は、隣接パッチ1312の下限周波数であり、前記クロスオーバー周波数の2倍は、隣接パッチ1312の上側カットオフ周波数でかつ次のパッチ1314の下側カットオフ周波数である。位相ボコーダは、前記信号の低周波帯域1302の周波数ラインの周波数を2倍して隣接パッチ1312を取得し、前記信号の低周波帯域1302の周波数ラインの周波数を3倍して次のパッチ1314を取得する。したがって、隣接パッチ1312のスペクトル密度は前記信号の低周波帯域1302のスペクトル密度の1/2であり、次のパッチ1314のスペクトル密度は前記信号の低周波帯域1302のスペクトル密度の1/3である。 FIG. 13 shows a schematic diagram of bandwidth extension 1300 using a phase vocoder. In this example, two patches 1312, 1314 are added to the low frequency band 1302 of the signal. The upper cutoff frequency 1320, also called the so-called crossover frequency, of the signal is the lower limit frequency of the adjacent patch 1312, and twice the crossover frequency is the upper cutoff frequency of the adjacent patch 1312 and the lower side of the next patch 1314. Cut-off frequency. The phase vocoder obtains the adjacent patch 1312 by doubling the frequency of the frequency line of the low frequency band 1302 of the signal, and triples the frequency of the frequency line of the low frequency band 1302 of the signal to obtain the next patch 1314. get. Therefore, the spectral density of the adjacent patch 1312 is ½ of the spectral density of the low frequency band 1302 of the signal, and the spectral density of the next patch 1314 is 1 / of the spectral density of the low frequency band 1302 of the signal. .

帯域(パッチ)のエネルギーをわずか数本の周波数ラインへと集中させることで、オリジナル信号とは異なるような実質的な音質の変化がもたらされる。以前はより多数存在した帯域(周波数ライン)のエネルギーは、より少数の残存する帯域に集約される。 By concentrating the energy of the band (patch) on only a few frequency lines, a substantial change in sound quality that is different from the original signal is brought about. The energy in the band (frequency line) that previously existed more is concentrated in a smaller number of remaining bands.

位相ボコーダとその幾つかの適用例が非特許文献5〜8及び特許文献3に開示されている。 Non-Patent Documents 5 to 8 and Patent Document 3 disclose phase vocoders and some application examples thereof.

前記ギャップを埋めるための1つの手法が特許文献4に開示されている。それは、高い周波数再構築を利用したソース符号化システムを強化するための方法と装置とを含んでいる。この出願は、適応型ノイズ−フロア追加による再構築された高周波帯域における不十分なノイズコンテンツの問題を提示している。ノイズ追加によって前記ギャップを埋めることは可能かもしれないが、オーディオ品質又は主観的品質が十分には向上しない可能性がある。 One technique for filling the gap is disclosed in Patent Document 4. It includes a method and apparatus for enhancing a source coding system that utilizes high frequency reconstruction. This application presents the problem of insufficient noise content in the reconstructed high frequency band with adaptive noise-floor addition. Although it may be possible to fill the gap by adding noise, the audio quality or subjective quality may not be improved sufficiently.

WO9857436号公報WO9857436 米国特許第5455888号公報US Pat. No. 5,455,888 米国特許第6549884号公報US Pat. No. 6,549,884 WO00/45379号公報WO00 / 45379

M. Dietz, L. Liljeryd, K.Kjorling and 0. Kunz,“Spectral BandReplication, a novel approach in audio coding” in 112th AES Convention, Munich,May 2002M. Dietz, L. Liljeryd, K. Kjorling and 0. Kunz, “Spectral Band Replication, a novel approach in audio coding” in 112th AES Convention, Munich, May 2002 S. Meltzer, R. Bohm and F. Henn,“SBR enhanced audio codecs for digitalbroadcasting such as "Digital Radio Mondiale (DRM)” 112th AES Convention,Munich, May 2002S. Meltzer, R. Bohm and F. Henn, “SBR enhanced audio codecs for digitalbroadcasting such as“ Digital Radio Mondiale (DRM) ”112th AES Convention, Munich, May 2002 T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky,“Enhancing mp3 withSBR: Features and Capabilities of the new mp3PRO Algorithm”in 112th AESConvention, Munich, May 2002T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, “Enhancing mp3 withSBR: Features and Capabilities of the new mp3PRO Algorithm” in 112th AESConvention, Munich, May 2002 International Standard ISO/IEC 14496-3:2001/FPDAM l, “BandwidthExtension,”ISO/IEC, 2002International Standard ISO / IEC 14496-3: 2001 / FPDAM l, “BandwidthExtension,” ISO / IEC, 2002 Frederik Nagel and Sascha Disch,“A Harmonic Bandwidth Extension Methodfor Audio odecs”ICASSP’09Frederik Nagel and Sascha Disch, “A Harmonic Bandwidth Extension Method for Audio odecs” ICASSP’09 M. Puckette. “Phase-locked Vocoder” IEEE ASSP Conference onApplications of Signal Processing to Audio and Acoustics, Mohonk 1995.M. Puckette. “Phase-locked Vocoder” IEEE ASSP Conference on Applications of Signal Processing to Audio and Acoustics, Mohonk 1995. Robel, A.“Transient detection and preservation in the phase vocoder;citeseer.ist.psu.edu/679246.html"Robel, A. “Transient detection and preservation in the phase vocoder; citeseer.ist.psu.edu/679246.html” Laroche L., Dolson M.:“Improved phase vocoder timescale modification ofaudio”, IEEE Trans. Speech and Audio Processing, Vol.7, No.3, pp.323−332Laroche L., Dolson M .: “Improved phase vocoder timescale modification of audio”, IEEE Trans. Speech and Audio Processing, Vol. 7, No. 3, pp. 323-332

本発明の目的は、帯域幅拡張された信号の主観的品質を向上させるオーディオ信号の帯域幅拡張の概念を提供しようとするものである。 It is an object of the present invention to provide a concept of bandwidth extension of an audio signal that improves the subjective quality of the bandwidth extended signal.

前記目的は、請求項1及び11に係る装置、請求項14に係るオーディオ信号、及び請求項15、16に係る方法によって達成できる。 The object can be achieved by a device according to claims 1 and 11, an audio signal according to claim 14, and a method according to claims 15 and 16.

本発明の一実施形態は、入力信号から帯域幅拡張信号を生成するための装置を提供する。前記入力信号は、第1の帯域については第1の分解能データによって、第2の帯域については第2の分解能データによって表現され、前記第2の分解能は第1の分解能に比べて低い。前記装置はパッチ生成器と結合器とを備える。前記パッチ生成器は、前記入力信号の第1の帯域から第1のパッチアルゴリズムに従って第1パッチを生成し、かつ前記入力信号の第1の帯域から第2のパッチアルゴリズムに従って第2パッチを生成する。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度よりも高い。前記結合器は、第1パッチと第2パッチと前記入力信号の第1の帯域とを結合し、前記帯域幅拡張信号を得る。帯域幅拡張信号を生成する前記装置は、前記帯域幅拡張信号がスペクトル包絡基準を満たすように、第1のパッチアルゴリズムと第2のパッチアルゴリズムとに従って前記入力信号をスケールするか、又は第1パッチと第2パッチとをスケールする。 One embodiment of the present invention provides an apparatus for generating a bandwidth extension signal from an input signal. The input signal is represented by first resolution data for the first band and second resolution data for the second band, and the second resolution is lower than the first resolution. The apparatus comprises a patch generator and a combiner. The patch generator generates a first patch from a first band of the input signal according to a first patch algorithm, and generates a second patch from the first band of the input signal according to a second patch algorithm. . The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm. The combiner combines the first patch, the second patch, and the first band of the input signal to obtain the bandwidth extension signal. The apparatus for generating a bandwidth extension signal scales the input signal according to a first patch algorithm and a second patch algorithm such that the bandwidth extension signal satisfies a spectral envelope criterion, or a first patch And the second patch.

本発明に係る幾つかの実施形態は、入力信号の帯域幅を拡張するために、低いスペクトル密度(これは、例えばそのパッチが入力信号の低周波帯域に比べて多くのギャップを持つことを意味する)を持つパッチが、高いスペクトル密度(これは、例えばそのパッチが入力信号の低周波帯域に比べてほんの僅か又は全くギャップを持たないことを意味する)を持つパッチと結合される、という中核的考えに基づいている。両方のパッチが入力信号に基づいて生成されるので、入力信号の低周波帯域の高周波帯域への拡張は、オリジナルのオーディオ信号の良好な近似を提供する可能性がある。加えて、第1と第2のパッチは、スペクトル包絡基準を満たすために、生成の前(入力信号のスケーリングによって)又は後でスケールすることができる。なぜなら、オリジナル・オーディオ信号のスペクトル包絡は、入力信号の高周波帯域の再構築のために考慮されるべきだからである。この様にして、帯域幅拡張信号の主観的品質又はオーディオ品質は大幅に向上するであろう。 Some embodiments according to the present invention have a low spectral density (for example, the patch has more gaps compared to the low frequency band of the input signal) in order to extend the bandwidth of the input signal. The core of a patch with a high spectral density (which means, for example, that the patch has little or no gap compared to the low frequency band of the input signal) Is based on the idea. Since both patches are generated based on the input signal, the extension of the input signal to the low frequency band may provide a good approximation of the original audio signal. In addition, the first and second patches can be scaled before generation (by scaling the input signal) or after to meet the spectral envelope criteria. This is because the spectral envelope of the original audio signal should be considered for the reconstruction of the high frequency band of the input signal. In this way, the subjective quality or audio quality of the bandwidth extension signal will be greatly improved.

本発明の幾つかの実施形態では、第1のパッチアルゴリズムはハーモニックなパッチアルゴリズムである。換言すると、第1パッチは入力信号の第1の帯域の周波数の整数倍の周波数のみを含むように生成される。一方、第2のパッチアルゴリズムは、混合型のパッチアルゴリズムであってもよい。この事は、第2パッチが、例えば入力信号の第1の帯域の周波数の整数倍の周波数と、入力信号の第1の帯域の周波数の整数倍ではない周波数とを含むように生成されてもよいことを意味する。従って、第2パッチのスペクトル密度は第1パッチのスペクトル密度より高い。第1パッチと第2パッチとを結合することによって、第1パッチの消失した周波数ラインは、第2パッチの周波数ラインによって満たされる可能性がある。この様にして、第1のパッチアルゴリズムに従ったハーモニックな帯域幅拡張のギャップは、第2パッチによって埋められ、帯域幅拡張信号のオーディオ品質は顕著に向上する。 In some embodiments of the invention, the first patch algorithm is a harmonic patch algorithm. In other words, the first patch is generated so as to include only a frequency that is an integral multiple of the frequency of the first band of the input signal. On the other hand, the second patch algorithm may be a mixed patch algorithm. This means that even if the second patch is generated so as to include, for example, a frequency that is an integer multiple of the frequency of the first band of the input signal and a frequency that is not an integer multiple of the frequency of the first band of the input signal. Means good. Therefore, the spectral density of the second patch is higher than the spectral density of the first patch. By combining the first patch and the second patch, the missing frequency line of the first patch may be filled by the frequency line of the second patch. In this way, the harmonic bandwidth extension gap according to the first patch algorithm is filled by the second patch, and the audio quality of the bandwidth extension signal is significantly improved.

本発明の幾つかの実施形態は、入力信号に基づいて帯域幅削減信号を生成するための装置に関する。この装置は、スペクトル包絡データ決定器と、パッチスケーリング制御データ生成器と、出力インターフェースとを備える。前記スペクトル包絡データ決定器は、入力信号の高周波帯域に基づいてスペクトル包絡データを決定する。前記パッチスケーリング制御データ生成器は、復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、復号器において帯域幅削減信号をスケールするため、又は復号器によって第1パッチと第2パッチとをスケールするための、パッチスケーリング制御データを生成する。そのスペクトル包絡基準は、スペクトル包絡データに基づいている。第1パッチは第1のパッチアルゴリズムに従って前記帯域幅削減信号の低周波帯域から生成され、第2パッチは第2のパッチアルゴリズムに従って前記帯域幅削減信号の低周波帯域から生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度に比べて高い。前記出力インターフェースは、入力信号の低周波帯域とスペクトル包絡データとパワースケーリング制御データとを結合し、前記帯域幅削減信号を得る。さらに、前記出力インターフェースは、前記帯域幅削減信号を伝送又は蓄積のために提供する。 Some embodiments of the invention relate to an apparatus for generating a bandwidth reduction signal based on an input signal. The apparatus comprises a spectral envelope data determiner, a patch scaling control data generator, and an output interface. The spectrum envelope data determiner determines spectrum envelope data based on a high frequency band of an input signal. The patch scaling control data generator is configured to scale the bandwidth reduction signal at the decoder or by the decoder so that the bandwidth extension signal generated by the decoder meets the spectral envelope criterion. Patch scaling control data for scaling the patch is generated. The spectral envelope criterion is based on spectral envelope data. A first patch is generated from the low frequency band of the bandwidth reduction signal according to a first patch algorithm, and a second patch is generated from the low frequency band of the bandwidth reduction signal according to a second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm. The output interface combines the low frequency band of the input signal, spectrum envelope data, and power scaling control data to obtain the bandwidth reduction signal. Further, the output interface provides the bandwidth reduction signal for transmission or storage.

本発明に係る幾つかのさらなる実施形態は、第1の帯域と第2の帯域とを備えるオーディオ信号に関する。第1の帯域は第1分解能データによって表され、第2の帯域は第2分解能データによって表される。第2の分解能は第1分解能より低い。第2の分解能データは、第2の帯域のスペクトル包絡データと、復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、復号器においてオーディオ信号をスケールするための、又は復号器によって第1パッチと第2パッチとをスケールするための、第2の帯域のパッチスケーリング制御データとに基づいている。前記スペクトル包絡基準は、前記スペクトル包絡データに基づいている。第1パッチは第1のパッチアルゴリズムに従ってオーディオ信号の第1の帯域から生成され、第2パッチは第2のパッチアルゴリズムに従ってオーディオ信号の第1の帯域から生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。 Some further embodiments according to the invention relate to an audio signal comprising a first band and a second band. The first band is represented by first resolution data, and the second band is represented by second resolution data. The second resolution is lower than the first resolution. The second resolution data is for scaling the audio signal at the decoder such that the spectral envelope data of the second band and the bandwidth extension signal generated by the decoder meet the spectral envelope criteria, or the decoder Is based on the second band patch scaling control data for scaling the first patch and the second patch. The spectral envelope criterion is based on the spectral envelope data. The first patch is generated from the first band of the audio signal according to the first patch algorithm, and the second patch is generated from the first band of the audio signal according to the second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm.

以下に、本発明の実施形態を添付の図面に従って詳細に説明する。
入力信号から帯域幅拡張信号を生成するための装置のブロック図である。 生成された第1パッチの概略図である。 生成された第1と第2のパッチの概略図である。 入力信号から帯域幅拡張信号を生成するための装置のブロック図である。 切り取られた正弦波入力信号の概略図である。 半波整流された正弦波入力信号の概略図である。 切り取られかつ全波整流された正弦波入力信号の概略図である。 入力信号から帯域幅拡張信号を生成するための装置のブロック図である。 位相ボコーダのフィルタバンク構成の概略図である。 図5aの中の1つのフィルタの詳細図である。 図5aの中の1つのフィルタチャンネルにおける振幅(大きさ)信号と周波数信号の操作を示す概略図である。 ある位相ボコーダにおける変換操作の構成を概略的に示す図である。 入力信号から帯域幅拡張信号を生成するための装置のブロック図である。 入力信号から帯域幅拡張信号を生成するための装置のブロック図である。 入力信号から帯域幅拡張信号を生成するための装置のブロック図である。 入力信号に基づいて帯域幅削減信号を提供するための装置のブロック図である。 入力信号から帯域幅拡張信号を生成するための方法のフローチャートである。 入力信号に基づいて帯域幅削減信号を提供するための方法のフローチャートである。 公知の帯域幅拡張アルゴリズムの概略図である。
Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.
FIG. 2 is a block diagram of an apparatus for generating a bandwidth extension signal from an input signal. It is the schematic of the produced | generated 1st patch. It is the schematic of the produced | generated 1st and 2nd patch. FIG. 2 is a block diagram of an apparatus for generating a bandwidth extension signal from an input signal. It is the schematic of the cut-out sine wave input signal. It is the schematic of a half wave rectified sine wave input signal. FIG. 3 is a schematic diagram of a sine wave input signal that has been cut and full-wave rectified. FIG. 2 is a block diagram of an apparatus for generating a bandwidth extension signal from an input signal. It is the schematic of the filter bank structure of a phase vocoder. FIG. 5b is a detailed view of one filter in FIG. 5a. FIG. 5b is a schematic diagram illustrating the operation of an amplitude (magnitude) signal and a frequency signal in one filter channel in FIG. 5a. It is a figure which shows schematically the structure of the conversion operation in a certain phase vocoder. FIG. 2 is a block diagram of an apparatus for generating a bandwidth extension signal from an input signal. FIG. 2 is a block diagram of an apparatus for generating a bandwidth extension signal from an input signal. FIG. 2 is a block diagram of an apparatus for generating a bandwidth extension signal from an input signal. FIG. 2 is a block diagram of an apparatus for providing a bandwidth reduction signal based on an input signal. 3 is a flowchart of a method for generating a bandwidth extension signal from an input signal. 3 is a flowchart of a method for providing a bandwidth reduction signal based on an input signal. FIG. 2 is a schematic diagram of a known bandwidth extension algorithm.

以下では、実施例の説明における重複を避けるため、同一又は同様な機能特性を持つ対象物や機能部に対して同一の参照符号が用いられ、図面に関するそれらの説明は他の図面に対しても適用される。 In the following, in order to avoid duplication in the description of the embodiments, the same reference numerals are used for objects and functional parts having the same or similar functional characteristics, and those descriptions regarding the drawings are also applied to other drawings. Applied.

図1は、本発明の第1実施形態に従って、入力信号102から帯域幅拡張信号122を生成するための装置100のブロック図を示す。入力信号102は第1の分解能データによって表現された第1帯域と、第2の分解能データによって表現された第2帯域とを持ち、第2分解能は第1分解能より低い。装置100は、結合器120と接続されたパッチ生成器110を備えている。パッチ生成器110は、入力信号102の第1帯域から第1のパッチアルゴリズムに従って第1パッチ112を生成し、かつ入力信号の第1帯域から第2のパッチアルゴリズムに従って第2パッチ114を生成する。第2のパッチアルゴリズムに従って生成された第2パッチ114のスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチ112のスペクトル密度より高い。結合器120は、第1パッチ112と第2パッチ114と入力信号102の第1帯域とを結合し、帯域幅拡張信号122を得る。さらに、帯域幅拡張信号122を生成する装置100は、帯域幅拡張信号122がスペクトル包絡基準を満たすように、第1のパッチアルゴリズムと第2パッチアルゴリズムとに従って入力信号102をスケールするか、又は第1パッチ112と第2パッチ114とをスケールする。 FIG. 1 shows a block diagram of an apparatus 100 for generating a bandwidth extension signal 122 from an input signal 102 according to a first embodiment of the present invention. The input signal 102 has a first band expressed by the first resolution data and a second band expressed by the second resolution data, and the second resolution is lower than the first resolution. The apparatus 100 includes a patch generator 110 connected to a coupler 120. The patch generator 110 generates a first patch 112 from the first band of the input signal 102 according to the first patch algorithm, and generates a second patch 114 from the first band of the input signal according to the second patch algorithm. The spectral density of the second patch 114 generated according to the second patch algorithm is higher than the spectral density of the first patch 112 generated according to the first patch algorithm. The combiner 120 combines the first patch 112, the second patch 114, and the first band of the input signal 102 to obtain the bandwidth extension signal 122. Further, the apparatus 100 for generating the bandwidth extension signal 122 may scale the input signal 102 according to the first patch algorithm and the second patch algorithm such that the bandwidth extension signal 122 satisfies the spectral envelope criterion, or The first patch 112 and the second patch 114 are scaled.

スペクトル密度とは、例えば、ある周波数帯域内の異なる周波数又は周波数ラインの密度を意味する。例えば、4kHzと8kHzの周波数部分を持つ0Hz〜10kHzの周波数帯域は、2kHz、4kHz、6kHz、8kHz、10kHzの周波数部分を持つ同じ周波数帯域に比べて、低いスペクトル密度を有する。第1パッチ112のスペクトル密度は、第2パッチのスペクトル密度に比べて低いので、第1パッチ112は第2パッチ114に比べてギャップを含んでいる。そのため、第2パッチ114はこれらギャップを埋めるために使用できる。両パッチは入力信号102の第1帯域に基づいているので、両パッチは入力信号102に対応するオリジナル信号の特性に関係している。従って、帯域幅拡張信号122はオリジナル信号の良好な近似となり、帯域幅拡張信号122の主観的品質又はオーディオ品質は上述の概念を使用することで顕著に改善される。この様にして、より多くのエネルギーが残りのラインの間に分配され、例えば不自然な音を予防できる。 Spectral density means, for example, the density of different frequencies or frequency lines within a certain frequency band. For example, a frequency band from 0 Hz to 10 kHz having a frequency part of 4 kHz and 8 kHz has a lower spectral density than a same frequency band having a frequency part of 2 kHz, 4 kHz, 6 kHz, 8 kHz, and 10 kHz. Since the spectral density of the first patch 112 is lower than that of the second patch, the first patch 112 includes a gap as compared to the second patch 114. Therefore, the second patch 114 can be used to fill these gaps. Since both patches are based on the first band of the input signal 102, both patches relate to the characteristics of the original signal corresponding to the input signal 102. Thus, the bandwidth extension signal 122 is a good approximation of the original signal, and the subjective quality or audio quality of the bandwidth extension signal 122 is significantly improved by using the above concept. In this way, more energy is distributed among the remaining lines, for example, unnatural sound can be prevented.

例えば、第1のパッチアルゴリズムはハーモニックなパッチアルゴリズムであってもよい。そのため、パッチ生成器110は、入力信号102の第1帯域の周波数の整数倍である周波数だけを含む第1パッチ112を生成してもよい。ハーモニックな帯域幅拡張は、オリジナル信号の調性構造の良好な近似を提供するが、このパッチアルゴリズムはハーモニックな周波数間にギャップを残すであろう。これらギャップは第2パッチによって埋められる可能性がある。例えば、第2パッチアルゴリズムが混合型のパッチアルゴリズムである場合、つまりパッチ生成器110が、入力信号102の第1帯域の周波数の整数倍である周波数(ハーモニックな周波数)だけでなく、入力信号102の第1帯域の周波数の整数倍でない周波数(非ハーモニックな周波数)をも含む第2パッチ114を生成する場合である。非ハーモニックな周波数は、第1パッチ112のギャップを埋めるために使用される。全体の第2パッチ114(ハーモニックな周波数を含む)を第1パッチ112に結合させることもまた可能である。この例では、第1パッチ112及び/又は第2パッチ114を適切にスケールすることによって、第1パッチ112と第2パッチ114のハーモニックな周波数部分の結合によるハーモニックな周波数の拡張が考慮される。 For example, the first patch algorithm may be a harmonic patch algorithm. Therefore, the patch generator 110 may generate the first patch 112 including only a frequency that is an integer multiple of the frequency of the first band of the input signal 102. While the harmonic bandwidth extension provides a good approximation of the tonal structure of the original signal, this patch algorithm will leave a gap between the harmonic frequencies. These gaps may be filled by the second patch. For example, when the second patch algorithm is a mixed patch algorithm, that is, the patch generator 110 not only has a frequency (harmonic frequency) that is an integer multiple of the frequency of the first band of the input signal 102, but also the input signal 102. This is a case where the second patch 114 including a frequency (non-harmonic frequency) that is not an integral multiple of the frequency of the first band is generated. Non-harmonic frequencies are used to fill the gaps in the first patch 112. It is also possible to couple the entire second patch 114 (including harmonic frequencies) to the first patch 112. In this example, by appropriately scaling the first patch 112 and / or the second patch 114, the expansion of the harmonic frequency by combining the harmonic frequency portions of the first patch 112 and the second patch 114 is considered.

第1パッチ112と第2パッチ114は、少なくとも部分的に同じ周波数領域を含む。例えば、第1パッチ112は4kHz〜8kHzに及ぶ周波数帯域を含み、第2パッチ114は6kHz〜10kHzの周波数帯域を含む。本発明による幾つかの実施例では、第1パッチの下側のカットオフ周波数は第2パッチの下側のカットオフ周波数に等しく、かつ第1パッチ112の上側のカットオフ周波数は第2パッチ114の上側のカットオフ周波数に等しい。例えば、両パッチが4kHz〜8kHzに及ぶ周波数帯域を含んでもよい。 The first patch 112 and the second patch 114 at least partially include the same frequency region. For example, the first patch 112 includes a frequency band ranging from 4 kHz to 8 kHz, and the second patch 114 includes a frequency band from 6 kHz to 10 kHz. In some embodiments according to the present invention, the lower cutoff frequency of the first patch is equal to the lower cutoff frequency of the second patch, and the upper cutoff frequency of the first patch 112 is the second patch 114. Equal to the upper cutoff frequency of. For example, both patches may include a frequency band ranging from 4 kHz to 8 kHz.

図2aと図2bは、第1のパッチアルゴリズム212に従う第1パッチ112と、第2のパッチアルゴリズム214に従う第2パッチ114の例を示す。説明を容易にするため、図2aは第1パッチ112のみを示し、図2bは第1パッチ112とそれに対応する第2パッチ114とを示している。図2aは、入力信号102の第1帯域202と、第1のパッチアルゴリズム212に従って生成された2個の第1パッチ112との例200を示している。この例では、1つのパッチが入力信号102の第1帯域202と同じ帯域幅を持つ。この帯域幅は異なっていてもよい。入力信号102の第1帯域202の上側カットオフ周波数220は、「Xover」周波数(クロスオーバー周波数)として示されている。図2aに示された実施例では、各パッチはクロスオーバー周波数Xover220の倍数に等しい周波数で開始している。第1パッチ112内の周波数ラインは、入力信号102の第1帯域202の周波数ラインの整数倍であり、例えば位相ボコーダによって生成することができる。これら第1パッチ112は、入力信号102の第1帯域202に比較して、消失した周波数ラインに対応したギャップを含む。 FIGS. 2 a and 2 b show examples of a first patch 112 according to the first patch algorithm 212 and a second patch 114 according to the second patch algorithm 214. For ease of explanation, FIG. 2 a shows only the first patch 112, and FIG. 2 b shows the first patch 112 and the corresponding second patch 114. FIG. 2 a shows an example 200 of a first band 202 of the input signal 102 and two first patches 112 generated according to a first patch algorithm 212. In this example, one patch has the same bandwidth as the first band 202 of the input signal 102. This bandwidth may be different. The upper cut-off frequency 220 of the first band 202 of the input signal 102 is shown as the “Xover” frequency (crossover frequency). In the embodiment shown in FIG. 2a, each patch starts at a frequency equal to a multiple of the crossover frequency Xover220. The frequency lines in the first patch 112 are integer multiples of the frequency lines of the first band 202 of the input signal 102 and can be generated, for example, by a phase vocoder. These first patches 112 include a gap corresponding to the lost frequency line as compared to the first band 202 of the input signal 102.

図2bは、2個の対応する第2パッチ114のためのさらなる実施例250を示す。これらパッチは、第2のパッチアルゴリズム214に従って生成され、ハーモニックな周波数と非ハーモニックな周波数とを含む。非ハーモニックな周波数ラインは第1パッチ112のギャップを埋めるために使用できる。第2パッチ114の周波数ラインは、例えば非線形歪みによって生成することができる。 FIG. 2 b shows a further embodiment 250 for two corresponding second patches 114. These patches are generated according to the second patch algorithm 214 and include harmonic and non-harmonic frequencies. Non-harmonic frequency lines can be used to fill the gap in the first patch 112. The frequency line of the second patch 114 can be generated by nonlinear distortion, for example.

この方法では、前記ギャップは、例えばノイズを用いてギャップを埋めるときのように、任意に埋めることができないかも知れない。前記ギャップは、入力信号の第1帯域の第1の分解能データに基づいて埋められ、従ってオリジナル信号に基づいて埋められる。 In this method, the gap may not be filled arbitrarily, for example when filling the gap with noise. The gap is filled based on the first resolution data of the first band of the input signal and thus filled based on the original signal.

例えば、入力信号102の第1帯域が、高い分解能で符号化されたオリジナルオーディオ信号の低周波帯域に相当してもよい。また、入力信号102の第2帯域が、例えば前記オリジナルオーディオ信号の高周波帯域に相当してもよいし、1つ又は複数のパラメータ、例えばスペクトル包絡データやノイズデータ及び/又は消失した低分解能のハーモニックデータによって量子化されたものでもよい。オリジナルオーディオ信号は、例えば処理前又は符号化前にマイクロホンによって録音されたオーディオ信号であってもよい。 For example, the first band of the input signal 102 may correspond to the low frequency band of the original audio signal encoded with high resolution. Further, the second band of the input signal 102 may correspond to, for example, a high frequency band of the original audio signal, and one or more parameters such as spectral envelope data and noise data and / or lost low-resolution harmonics. It may be quantized by data. The original audio signal may be, for example, an audio signal recorded by a microphone before processing or encoding.

入力信号を第1のパッチアルゴリズム及び第2のパッチアルゴリズムに従ってスケールするという事は、例えば第1パッチが生成される前に第1のパッチアルゴリズムに従って入力信号を一度スケールした後、次にスケールされた入力信号に基づいて第1パッチを生成し、かつ第2パッチが生成される前に第2のパッチアルゴリズムに従って入力信号を一度スケールした後、次にスケールされた入力信号に基づいて第2パッチを生成することを意味し、その結果、第1パッチと第2パッチと入力信号の第1帯域との結合の後では、帯域幅拡張信号がスペクトル包絡基準を満たすようになる。その代わり、帯域幅拡張信号がスペクトル包絡基準を満たすように、第1パッチと第2パッチはそれらの生成の後でスケールされてもよい。第1パッチと第2パッチのスケーリングと組み合わせた、第1のパッチアルゴリズム及び第2のパッチアルゴリズムに従った入力信号のスケーリングも、また可能である。 The scaling of the input signal according to the first patch algorithm and the second patch algorithm means that, for example, after the input signal is scaled once according to the first patch algorithm before the first patch is generated, it is then scaled. A first patch is generated based on the input signal, and after the input signal is scaled once according to the second patch algorithm before the second patch is generated, the second patch is then generated based on the scaled input signal. As a result, after combining the first patch, the second patch, and the first band of the input signal, the bandwidth extension signal satisfies the spectral envelope criterion. Instead, the first and second patches may be scaled after their generation so that the bandwidth extension signal meets the spectral envelope criteria. Scaling of the input signal according to the first and second patch algorithms combined with the scaling of the first and second patches is also possible.

結合器120は、例えば加算器であってもよく、帯域幅拡張信号122は、第1パッチ112と第2パッチ114と入力信号102の第1帯域の重み付き合計であってもよい。 The combiner 120 may be, for example, an adder, and the bandwidth extension signal 122 may be a weighted sum of the first band of the first patch 112, the second patch 114, and the input signal 102.

スペクトル包絡基準を満たすということは、例えば帯域幅拡張信号のスペクトル包絡が入力信号に含まれたスペクトル包絡データに基づいていることを意味する。スペクトル包絡データは符号器によって生成されてもよいし、オリジナル信号の第2帯域を表してもよい。こうして、帯域幅拡張信号のスペクトル包絡は、オリジナル信号のスペクトル包絡の良好な近似になる。 Satisfying the spectral envelope criterion means that, for example, the spectral envelope of the bandwidth extension signal is based on the spectral envelope data included in the input signal. The spectral envelope data may be generated by an encoder or may represent the second band of the original signal. Thus, the spectral envelope of the bandwidth extension signal is a good approximation of the spectral envelope of the original signal.

前記装置100は、入力信号102の第1帯域を復号化するためのコア復号器を備えていてもよい。 The apparatus 100 may comprise a core decoder for decoding the first band of the input signal 102.

パッチ生成器110と結合器120は、例えば特別に設計されたハードウエア、プロセッサ又はマイクロコントローラの一部、又はコンピュータ又はマイクロコントローラ上で実行できように構成されたコンピュータプログラムであってもよい。装置100は、復号器又はオーディオ復号器の一部であってもよい。 Patch generator 110 and combiner 120 may be, for example, specially designed hardware, a part of a processor or microcontroller, or a computer program configured to be executed on a computer or microcontroller. The apparatus 100 may be part of a decoder or audio decoder.

図3aは、本発明の一実施例に係る、入力信号102から帯域幅拡張信号122を生成するための装置300のブロック図である。この実施例では、パッチ生成器110は、第1パッチ112を生成するための位相ボコーダ310と、第2パッチ114を生成するための振幅切取り器(amplitude clipper) 320とを備えている。位相ボコーダ310と振幅切取り器320とは、結合器120に接続されている。位相ボコーダ310は、入力オーディオ信号102の第1帯域を拡大させて、ハーモニック周波数を含む第1パッチ112を生成する。非線形の処理ステップにおいて、振幅切取り器320は入力信号102を切り取り、ハーモニック周波数と非ハーモニック周波数とを含む第2パッチ114を生成する。振幅切取り器320に代えて、特性カーブの二次領域において半波整流器、全波整流器、ミキサー又はダイオードを使用し、非線形処理ステップによって入力信号102に基づいて非ハーモニック周波数を生成してもよい。 FIG. 3a is a block diagram of an apparatus 300 for generating a bandwidth extension signal 122 from an input signal 102, according to one embodiment of the present invention. In this embodiment, the patch generator 110 includes a phase vocoder 310 for generating the first patch 112 and an amplitude clipper 320 for generating the second patch 114. The phase vocoder 310 and the amplitude cuter 320 are connected to the coupler 120. The phase vocoder 310 expands the first band of the input audio signal 102 to generate the first patch 112 including the harmonic frequency. In a non-linear processing step, the amplitude clipper 320 cuts the input signal 102 and generates a second patch 114 that includes harmonic and non-harmonic frequencies. Instead of amplitude cutout 320, a half-wave rectifier, full-wave rectifier, mixer or diode may be used in the secondary region of the characteristic curve to generate a non-harmonic frequency based on the input signal 102 by a non-linear processing step.

図3b、3c及び3dは、非ハーモニック周波数を生成するために切り取られ及び又は整流された入力信号102の例を示す。図3bは切り取られた正弦波状入力信号102の概略波形350を示す。信号を切り取ることで、信号傾斜380の急激な変化の形状を持つ不連続ポイントが発生し、より高い周波数を持つハーモニック部分及び非ハーモニック部分が生成される。 Figures 3b, 3c and 3d show examples of the input signal 102 that has been cut and / or rectified to produce non-harmonic frequencies. FIG. 3 b shows a schematic waveform 350 of the truncated sinusoidal input signal 102. By cutting the signal, a discontinuous point having a shape of a sharp change in the signal slope 380 is generated, and a harmonic part and a non-harmonic part having a higher frequency are generated.

上記に代えて、図3cは半波整流された正弦波状入力信号102の概略波形360を示し、これもまた不連続ポイント380が発生している。 Alternatively, FIG. 3 c shows a schematic waveform 360 of the half-wave rectified sinusoidal input signal 102, which also has a discontinuity point 380.

さらに、切取りと整流とを組み合わせることも可能である。図3dは、切り取られかつ全波整流された正弦波状入力信号102の概略波形370を示し、様々な不連続ポイント380が発生している。 It is also possible to combine cutting and rectification. FIG. 3d shows a schematic waveform 370 of the truncated and full-wave rectified sinusoidal input signal 102 where various discontinuity points 380 have occurred.

切取り及び/又は整流、又は不連続ポイント380を生成するための非線形な処理の他の方法を適用することによって、異なる周波数を持つ広範囲なスペクトルが生成される。従って、上述のようなパッチアルゴリズムによって生成されたパッチは、高いスペクトル密度を有することになる。 By applying clipping and / or rectification, or other methods of non-linear processing to generate discontinuous points 380, a broad spectrum with different frequencies is generated. Therefore, the patch generated by the patch algorithm as described above has a high spectral density.

図4は、本発明のある実施例に従った、入力信号102から帯域幅拡張信号122を生成するための装置400のブロック図を示す。この装置400は、図3aに示された装置と近似しているが、追加的にスペクトルラインセレクタ(ライン選択器)410を備えている。位相ボコーダ310と振幅切取り器320はスペクトルラインセレクタ410と接続され、スペクトルラインセレクタ410は結合器120と接続されている。スペクトルラインセレクタ410は、第2パッチ114の複数の周波数ラインを選択して、第1パッチを補足する1つの修正された第2パッチ414を得ることができる。第2パッチ114の周波数ラインは、第1パッチ112の対応する周波数ラインが消失した場合に、選択される。換言すると、スペクトルラインセレクタ410は第1パッチ112のギャップを埋めるために第2パッチ114の周波数ラインを選択し、第1パッチ112によって既に含まれた第2パッチの周波数を無視すればよい。この様にして、修正された第2パッチ414は第1パッチ112に既に含まれた周波数におけるギャップを有していてもよい。 FIG. 4 shows a block diagram of an apparatus 400 for generating a bandwidth extension signal 122 from an input signal 102 according to an embodiment of the present invention. This device 400 is similar to the device shown in FIG. 3 a, but additionally comprises a spectral line selector (line selector ) 410. Phase vocoder 310 and amplitude clipper 320 are connected to spectral line selector 410, which is connected to combiner 120. The spectral line selector 410 can select a plurality of frequency lines of the second patch 114 to obtain a single modified second patch 414 that supplements the first patch. The frequency line of the second patch 114 is selected when the corresponding frequency line of the first patch 112 disappears. In other words, the spectral line selector 410 may select the frequency line of the second patch 114 in order to fill the gap of the first patch 112 and ignore the frequency of the second patch already included by the first patch 112. In this way, the modified second patch 414 may have a gap in the frequency already included in the first patch 112.

この実施例では、結合器120は、第1パッチ112と修正された第2パッチ414と入力信号102の第1帯域とを結合させる。 In this embodiment, combiner 120 combines first patch 112, modified second patch 414, and the first band of input signal 102.

スペクトルラインセレクタ410は、例えば(図4に示すように)パッチ生成器110の一部であってもよいし、別のユニットであってもよい。 The spectral line selector 410 may be part of the patch generator 110, for example (as shown in FIG. 4), or may be a separate unit.

以下では、図5と図6を参照して、本発明に係る位相ボコーダ310の可能な構成例について説明する。図5aはある位相ボコーダのフィルタバンク構成を示し、ここでは、オーディオ信号は入力500へ入力され、出力510から出力される。特に、図5aに概略で示されるフィルタバンクの各チャネルは、帯域通過フィルタ501と下流側の発振器502とを有する。各チャネルから来る全ての発振器の出力信号は、例えば加算器として構成された結合器503により結合され、出力信号が得られる。各フィルタ501は、一方では振幅信号を供給し、他方では周波数信号を供給するように構成されている。これら振幅信号と周波数信号とは時間信号であり、一方の振幅信号はフィルタ501内の時間軸における振幅の変化を示し、他方の周波数信号はフィルタ501により濾波された信号の周波数の変化を示す。 In the following, a possible configuration example of the phase vocoder 310 according to the present invention will be described with reference to FIGS. FIG. 5a shows the filter bank configuration of a phase vocoder, where the audio signal is input to input 500 and output 510. In particular, each channel of the filter bank schematically shown in FIG. 5 a has a bandpass filter 501 and a downstream oscillator 502. The output signals of all the oscillators coming from the respective channels are combined by a combiner 503 configured as an adder, for example, to obtain an output signal. Each filter 501 is configured to supply an amplitude signal on the one hand and a frequency signal on the other hand. These amplitude signal and frequency signal are time signals, one amplitude signal indicates a change in amplitude on the time axis in the filter 501, and the other frequency signal indicates a change in frequency of the signal filtered by the filter 501.

図5bはフィルタ501の概略的なセットアップを示す。図5aの各フィルタ501は図5bに示すようにセットアップされても良い。しかし、2つの入力ミキサ551と加算器552とに入力される周波数fiだけはチャネル毎に異なっている。ミキサ551のミキサ出力信号は両方とも低域通過フィルタ553により低域通過濾波されており、これらの低域通過信号は、局部発振器周波数(LO周波数)により生成されたものであるために互いに異なっており、90度づつ位相がずれる。上側の低域通過フィルタ553は直交位相(quadrature)信号554を出力し、下側の低域通過フィルタ553は同相(in-phase)信号555を出力する。これら2つの信号、つまりQ及びIは、矩形表示(rectangular representation)から振幅位相表示(magnitude phase representation)を生成する座標変換器556へと入力される。図5aのそれぞれの時間軸上の絶対値信号又は振幅信号は、出力557において出力される。位相信号は位相アンラッパ(phase unwrapper) 558へと供給される。要素558の出力において、常に0〜360度の間にあるような位相値はもはや存在せず、線形的に増大する位相値が存在する。この「アンラップ」された位相値は、位相/周波数変換器559に供給される。この変換器559は、例えば単純な位相差分計算器として構成され、現時点での位相から以前のある時点における位相を引き算することで、現時点での周波数値を取得してもよく、又は位相派生物の概算を得るための他の手段として構成されてもよい。この周波数値はフィルタチャネルiの一定周波数値fiに加算され、その結果、出力560において、時間的に変化する周波数値が得られる。出力560における周波数値は、直接成分(direct component)=fiと変動成分(alternating component)=周波数偏差とを有し、周波数偏差とは、フィルタチャネル内における信号の現時点の周波数と平均周波数fiとの間の周波数偏差を表す。 FIG. 5 b shows a schematic setup of the filter 501. Each filter 501 of FIG. 5a may be set up as shown in FIG. 5b. However, only the frequency fi input to the two input mixers 551 and the adder 552 is different for each channel. Both mixer output signals of the mixer 551 are low-pass filtered by the low-pass filter 553, and these low-pass signals are generated by the local oscillator frequency (LO frequency) and are therefore different from each other. Therefore, the phase is shifted by 90 degrees. The upper low-pass filter 553 outputs a quadrature signal 554, and the lower low-pass filter 553 outputs an in-phase signal 555. These two signals, Q and I, are input to a coordinate converter 556 that generates a magnitude phase representation from a rectangular representation. The absolute value signal or amplitude signal on each time axis of FIG. The phase signal is supplied to a phase unwrapper 558. At the output of element 558, there is no longer a phase value that is always between 0 and 360 degrees, and there is a linearly increasing phase value. This “unwrapped” phase value is supplied to a phase / frequency converter 559. The converter 559 may be configured as a simple phase difference calculator, for example, to obtain the current frequency value by subtracting the phase at a previous time from the current phase, or a phase derivative. May be configured as other means for obtaining an approximation of This frequency value is added to the constant frequency value fi of the filter channel i, resulting in a time-varying frequency value at the output 560. The frequency value at the output 560 has a direct component = fi and an alternating component = frequency deviation, which is the difference between the current frequency of the signal in the filter channel and the average frequency fi. Represents the frequency deviation between.

以上、図5a及び図5bを用いて説明したように、位相ボコーダはスペクトル情報と時間情報との分割を行う。スペクトル情報は、各チャネルに周波数の直接成分を供給する特別なチャネル又は周波数fiの中にあり、他方、時間情報は周波数偏差又は時間軸上の振幅変化の中に含まれる。 As described above with reference to FIGS. 5a and 5b, the phase vocoder divides spectrum information and time information. Spectral information is in a special channel or frequency fi that provides a direct component of the frequency to each channel, while time information is contained in frequency deviations or amplitude changes on the time axis.

図5cは、本発明に従って第1パッチを生成するために実行される処理を示し、特に、位相ボコーダ310、さらに詳細には、図5aの中で破線で区画された回路部分で実行される処理を示す。 FIG. 5c shows the processing performed to generate the first patch in accordance with the present invention, in particular the phase vocoder 310, and more particularly the processing performed in the circuit portion partitioned by broken lines in FIG. 5a. Indicates.

時間スケーリングのために、例えば各チャンネル内の振幅信号A(t)又は各チャンネル内の周波数信号f(t)が、デシメート(間引き)されるか又は補間(interpolation)される。本発明にとっては有用である、転位を目的として、信号A(t)及び信号f(t)の補間、即ち時間的な拡張または伸張が実行され、伸張済の信号A'(t)及び信号f'(t)が得られる。この際、補間は伸張係数598により制御される。この伸張係数は、例えば位相ボコーダがハーモニック周波数を生成するように選択され得る。位相変化の補間、即ち加算器552により一定周波数を加算する前の値の補間により、図5aにおける個々の各発振器502の周波数は変化しない。しかし、全体的なオーディオ信号の時間的な変化は、係数2により遅くなる。その結果、オリジナルのピッチを有し、時間的に伸張したトーン、即ちハーモニクスを備えたオリジナルの基本波がもたらされる。 For time scaling, for example, the amplitude signal A (t) in each channel or the frequency signal f (t) in each channel is decimated or interpolated. For the purpose of transposition, which is useful for the present invention, interpolation of the signal A (t) and the signal f (t), i.e., time expansion or expansion, is performed, and the expanded signal A ′ (t) and the signal f '(t) is obtained. At this time, the interpolation is controlled by the expansion coefficient 598. This stretch factor may be selected, for example, so that the phase vocoder generates a harmonic frequency. By interpolating the phase change, i.e., interpolating the value before adding the constant frequency by the adder 552, the frequency of each individual oscillator 502 in FIG. 5a does not change. However, the temporal change in the overall audio signal is delayed by a factor of 2. The result is an original fundamental with an original pitch and a time-extended tone, or harmonics.

図5cに示された信号処理を実行することによって、オーディオ信号は例えば係数2のデシメーションによってそのオリジナルの持続時間へと縮減され、他方、全ての周波数は同時に2倍化される。その結果、係数2によるピッチ転位がもたらされ、オリジナルオーディオ信号と同じ長さ、即ち同数のサンプルを持つオーディオ信号が得られる。 By performing the signal processing shown in FIG. 5c, the audio signal is reduced to its original duration, for example by a decimation factor of 2, while all frequencies are doubled simultaneously. As a result, a pitch shift by a factor of 2 is provided, resulting in an audio signal having the same length as the original audio signal, ie, the same number of samples.

図5aで説明したフィルタ帯域の実施例に代えて、図6に示されるような位相ボコーダにおける変換操作の構成が使用されても良い。ここでは、オーディオ信号698は、時間サンプルのシーケンスとして、FFT(高速フーリエ変換)処理器、又はより一般的には短時間フーリエ変換(STFT)処理器600へと供給される。FFT処理器600は、オーディオ信号の時間ウィンドウ化を実行し、次に、後続のFFTにより振幅スペクトルと位相スペクトルとの両方を計算する。この計算は、オーディオ信号の強くオーバーラップしているブロックに関係する連続したスペクトルのために実行される。 Instead of the filter band embodiment described with reference to FIG. 5a, a transformation operation configuration in a phase vocoder as shown in FIG. 6 may be used. Here, the audio signal 698 is supplied as a sequence of time samples to an FFT (Fast Fourier Transform) processor, or more generally a Short Time Fourier Transform (STFT) processor 600. The FFT processor 600 performs time windowing of the audio signal and then calculates both the amplitude spectrum and the phase spectrum by the subsequent FFT. This calculation is performed for a continuous spectrum related to strongly overlapping blocks of the audio signal.

極端な場合には、全ての新たなオーディオ信号サンプルに対して1つの新たなスペクトルを計算しても良いし、例えば20番目の新たなサンプル毎に新たなスペクトルを計算しても良い。2つのスペクトル間にあるサンプルの距離「a」は、好適には制御器602により与えられる。制御器602は、さらにIFFT(逆高速フーリエ変換)処理器604へも出力するよう構成され、この処理器604はオーバーラップ加算操作を実行する。特に、IFFT処理器604は、ある振幅スペクトルと位相スペクトルとに基づいてスペクトル毎に1つのIFFTを実行することで、逆の短時間フーリエ変換を実行し、次に、オーバーラップ加算操作を実行し、その結果として時間信号を得る。このオーバーラップ加算操作は、分析ウィンドウによって導入されるブロッキング効果を除去するものである。 In extreme cases, one new spectrum may be calculated for all new audio signal samples, for example, a new spectrum may be calculated for every 20th new sample. The distance “a” of the sample between the two spectra is preferably given by the controller 602. The controller 602 is also configured to output to an IFFT (Inverse Fast Fourier Transform) processor 604, which performs an overlap addition operation. In particular, IFFT processor 604 performs an inverse short-time Fourier transform by performing one IFFT per spectrum based on a certain amplitude spectrum and phase spectrum, and then performs an overlap addition operation. As a result, a time signal is obtained. This overlap addition operation removes the blocking effect introduced by the analysis window.

2つのスペクトルがIFFT処理器604により処理される時、2つのスペクトル間の距離bにより時間信号の伸張が実行され、この距離bはFFTスペクトルの生成におけるスペクトル間の距離aよりも長い。基本的な考え方は、単純に分析FFTよりも大きな間隔を有するように、オーディオ信号を逆FFTにより伸張することである。その結果、合成されたオーディオ信号内のスペクトルは、オリジナル・オーディオ信号内よりも遅い速度で変化する。 When the two spectra are processed by the IFFT processor 604, a time signal stretch is performed by the distance b between the two spectra, which is longer than the distance a between the spectra in the generation of the FFT spectrum. The basic idea is to simply decompress the audio signal by inverse FFT so that it has a larger interval than the analysis FFT. As a result, the spectrum in the synthesized audio signal changes at a slower rate than in the original audio signal.

もし、ブロック606における位相再スケーリングがなかったと仮定すれば、その構成は周波数アーチファクトをもたらすであろう。例えば、単一の周波数binを考え、この周波数に対して45度ずつ連続的に位相値が変化するものとする。つまり、このフィルタ帯域内の信号は、各時間区間毎に一周期の8分の1の割合で、即ち45度ずつ位相が増大することを意味し、ここでの時間区間とは、連続するFFTの間の時間区間である。もし、逆FFTの相互間隔がより遠く離れているならば、45度の位相増大はより長い時間区間に亘って発生するということになる。つまり、この信号部分の周波数が意図せずに変更されたことになる。このようなアーチファクトを無くすため、位相は、オーディオ信号が時間的に伸張された時の係数と正に同一の係数により再スケールされる。各FFTスペクトル値の位相は、このように係数b/aにより増大させられ、その結果、上述の意図しない周波数の変更を無くすことができる。 If it was assumed that there was no phase rescaling in block 606, the configuration would result in frequency artifacts. For example, a single frequency bin is considered, and the phase value is continuously changed by 45 degrees with respect to this frequency. In other words, the signal in this filter band means that the phase increases at a rate of 1/8 of one period for each time interval, that is, 45 degrees, and the time interval here is a continuous FFT. Is the time interval between. If the inverse FFTs are farther apart, a 45 degree phase increase will occur over a longer time interval. That is, the frequency of this signal part is changed unintentionally. In order to eliminate such artifacts, the phase is rescaled by a factor that is exactly the same as the factor when the audio signal is stretched in time. The phase of each FFT spectrum value is thus increased by the coefficient b / a, and as a result, the unintended frequency change described above can be eliminated.

図5cに示す実施例では、図5aのフィルタバンク構成の中の1つの信号発振器のために振幅/周波数制御信号の補間による伸張が行なわれたが、図6における伸張は、2つのFFTスペクトル間の距離よりも長い2つのIFFTスペクトル間の距離、即ち「a」よりも長い「b」により達成される。しかしながら、アーチファクトを防止するために、比「b/a」により位相再スケーリングが実行される。距離「b」は、例えば位相ボコーダがハーモニックな周波数を生成するように、選択することができる。 In the embodiment shown in FIG. 5c, the amplitude / frequency control signal interpolation was performed for one signal oscillator in the filter bank configuration of FIG. 5a, but the expansion in FIG. 6 is between two FFT spectra. This is achieved by a distance between two IFFT spectra longer than the distance, i.e. "b" longer than "a". However, phase rescaling is performed with the ratio “b / a” to prevent artifacts. The distance “b” can be selected, for example, such that the phase vocoder produces a harmonic frequency.

図7は、入力信号102から帯域幅拡張信号122を生成するための本発明の一実施例に従った装置700のブロック図を示す。この装置700は図1に示された装置と類似しているが、パワー制御器710と第1パワー調整手段720と第2パワー調整手段730とを備える点で異なる。パワー制御器710は第1パワー調整手段720と第2パワー調整手段730とに接続されている。第1パワー調整手段720と第2パワー調整手段730とはパッチ生成器110に接続されている。パワー制御器710は、第1と第2のパッチアルゴリズムに従い、入力信号に含まれたスペクトル包絡データと入力信号に含まれたパッチスケーリング制御データとに基づいて、入力信号のスケーリングを制御してもよい。入力信号に含まれたパッチスケーリング制御データに代えて、少なくとも1つの記憶されたパッチスケーリング制御パラメータを使用してもよい。パッチスケーリング制御パラメータは、パッチスケーリング制御パラメータメモリによって記憶されていてもよく、そのメモリはパワー制御器710又は別のユニットの一部であってもよい。第1パワー調整手段720は入力信号102を第1パッチアルゴリズムに従ってスケールしてもよいし、第2パワー調整手段730は入力信号102を第2パッチアルゴリズムに従ってスケールしてもよい。換言すれば、帯域幅拡張信号がスペクトル包絡基準を満たすように、第1と第2のパッチを生成する前に入力信号102がスケールされてもよい。そのために、スペクトル包絡データが帯域幅拡張信号122のスペクトル包絡を決定し、パッチスケーリング制御データ又はパッチスケーリング制御パラメータが第1パッチ112と第2パッチ114との比を設定するか、若しくは第1パッチ112及び/又は第2パッチ114の絶対値を設定してもよい。第1パワー調整手段720と第2パワー調整手段730は、図7に示すパワー制御器710又は別のユニットの一部であってもよい。パワー制御器710は、また図7に示すパッチ生成器110又は別のユニットの一部であってもよい。パワー調整手段720,730は、例えばパワー制御器710によって制御される増幅器やフィルタであってもよい。 FIG. 7 shows a block diagram of an apparatus 700 for generating a bandwidth extension signal 122 from an input signal 102 according to one embodiment of the present invention. This apparatus 700 is similar to the apparatus shown in FIG. 1 except that it includes a power controller 710, first power adjustment means 720, and second power adjustment means 730. The power controller 710 is connected to the first power adjustment unit 720 and the second power adjustment unit 730. The first power adjustment unit 720 and the second power adjustment unit 730 are connected to the patch generator 110. The power controller 710 controls the scaling of the input signal based on the spectral envelope data included in the input signal and the patch scaling control data included in the input signal according to the first and second patch algorithms. Good. Instead of the patch scaling control data included in the input signal, at least one stored patch scaling control parameter may be used. The patch scaling control parameter may be stored by a patch scaling control parameter memory, which may be part of the power controller 710 or another unit. The first power adjustment means 720 may scale the input signal 102 according to the first patch algorithm, and the second power adjustment means 730 may scale the input signal 102 according to the second patch algorithm. In other words, the input signal 102 may be scaled before generating the first and second patches so that the bandwidth extension signal meets the spectral envelope criteria. To that end, the spectral envelope data determines the spectral envelope of the bandwidth extension signal 122 and the patch scaling control data or patch scaling control parameter sets the ratio between the first patch 112 and the second patch 114 or the first patch. The absolute value of 112 and / or the second patch 114 may be set. The first power adjustment means 720 and the second power adjustment means 730 may be part of the power controller 710 shown in FIG. 7 or another unit. The power controller 710 may also be part of the patch generator 110 or another unit shown in FIG. The power adjustment units 720 and 730 may be amplifiers or filters controlled by the power controller 710, for example.

上記に代えて、スケーリングがパッチの生成後に行われてもよい。その好適例として、図8は、入力信号102から帯域幅拡張信号122を生成するための本発明の一実施例に係る装置800のブロック図を示す。この装置800は図7に示した装置と類似しているが、パワー調整手段720、730がパッチ生成器110と結合器120との間に配置されている点で異なる。この実施例では、パッチ生成器110は第1パワー調整手段720と第2パワー調整手段730とに接続されている。第1パワー調整手段720と第2パワー調整手段730とは結合器120に接続されている。この様にして、第1パッチ112は第1パッチアルゴリズムに従って第1パワー調整手段720によってスケールされ、第2パッチ114は第2パッチアルゴリズムに従って第2パワー調整手段730によってスケールされ得る。これらパワー調整手段は、上述の通り、スペクトル包絡データとパッチスケーリング制御データ又はパッチスケーリング制御パラメータに基づいて、パワー制御器710によって制御される。 Alternatively, scaling may be performed after the patch is generated. As a preferred example, FIG. 8 shows a block diagram of an apparatus 800 according to one embodiment of the present invention for generating a bandwidth extension signal 122 from an input signal 102. This apparatus 800 is similar to the apparatus shown in FIG. 7 except that power adjustment means 720, 730 are disposed between the patch generator 110 and the coupler 120. In this embodiment, the patch generator 110 is connected to the first power adjustment means 720 and the second power adjustment means 730. The first power adjustment unit 720 and the second power adjustment unit 730 are connected to the coupler 120. In this way, the first patch 112 can be scaled by the first power adjustment means 720 according to the first patch algorithm, and the second patch 114 can be scaled by the second power adjustment means 730 according to the second patch algorithm. As described above, these power adjustment units are controlled by the power controller 710 based on the spectrum envelope data and the patch scaling control data or the patch scaling control parameter.

上記に代えて、2つのパッチの一方のみをスケーリング又はパワー調整した後で、結合器120によって両パッチを結合し、かつ結合パッチを入力信号102の第1帯域と結合する前に、結合パッチをスケーリングすることも可能である。換言すれば、2つのパッチ間の所定の比率を達成するように片方のパッチを(例えばパッチスケーリング制御データに基づいて)スケールし、その後、結合パッチを、スペクトル包絡基準を満たすように(例えばスペクトル包絡データに基づいて)スケールしてもよい。 Alternatively, after scaling or power adjusting only one of the two patches, combining the patches by the combiner 120 and before combining the combined patch with the first band of the input signal 102, Scaling is also possible. In other words, one patch is scaled (e.g., based on patch scaling control data) to achieve a predetermined ratio between the two patches, and then the combined patch is met (e.g., the spectral envelope criteria). It may be scaled (based on the envelope data).

パッチスケーリング制御データは、例えば、パワー分配スケーリングのための単なる係数や複数のパラメータを含んでいてもよい。パッチスケーリング制御データは、例えば第2帯域全体又は高周波数全体にわたる第1パッチと第2パッチとのパワー比を示してもよいし、第2帯域全体又は高周波数全体にわたる第1パッチ及び/又は第2パッチのパワーの絶対値を示してもよいし、少なくとも1つのパラメータによって表現されてもよい。それに代えて、パッチスケーリングデータは、スペクトル帯域複製アプリケーションにおけるサブバンド毎のスペクトル包絡データと同様に、第2帯域又は高周波帯域を一緒に構成する複数のサブバンドのそれぞれについて1つの係数を含んでもよい。さらに、このパッチスケーリングデータは、フィルタの変換関数を示してもよい。例えば、第1パッチをスケーリングするためのフィルタの変換関数のパラメータ、及び又は第2パッチをスケーリングするためのフィルタの変換関数のパラメータは、入力信号内に含まれていてもよい。こうして、パラメータは周波数の関数を表してもよい。別の変形例では、パッチスケーリング制御データは、第1パッチと第2パッチの差分関数を表してもよい。この例に従えば、入力信号のスケーリング、又は第1パッチ及び第2パッチのスケーリングは、少なくとも1個のパラメータを含むパッチスケーリング制御データに基づいていてもよい。 The patch scaling control data may include, for example, a simple coefficient for power distribution scaling and a plurality of parameters. The patch scaling control data may indicate, for example, the power ratio of the first patch to the second patch over the entire second band or the entire high frequency, and the first patch and / or the second patch over the entire second band or the entire high frequency. The absolute value of the power of two patches may be indicated, or may be expressed by at least one parameter. Alternatively, the patch scaling data may include one coefficient for each of a plurality of subbands that together comprise a second band or a high frequency band, similar to the spectral envelope data for each subband in a spectral band replication application. . Further, the patch scaling data may indicate a conversion function of the filter. For example, the parameters of the conversion function of the filter for scaling the first patch and / or the parameters of the conversion function of the filter for scaling the second patch may be included in the input signal. Thus, the parameter may represent a function of frequency. In another variation, the patch scaling control data may represent a difference function between the first patch and the second patch. According to this example, the scaling of the input signal or the scaling of the first patch and the second patch may be based on patch scaling control data including at least one parameter.

図9は、本発明の一実施例に従った、入力信号102から帯域幅拡張信号122を生成するための装置900のブロック図を示す。この装置900は図8に示す装置に類似しているが、ノイズ追加器910、消失ハーモニック追加器920、ノイズパワー調整手段940、及び消失ハーモニックパワー調整手段950をさらに含む点が異なる。ノイズ追加器910はノイズパワー調整手段940に接続され、ノイズパワー調整手段940は結合器120に接続されている。消失ハーモニック追加器920は消失ハーモニックパワー調整手段950に接続され、消失ハーモニックパワー調整手段950は結合器120に接続されている。さらに、パワー制御器710はノイズパワー調整手段940と消失ハーモニックパワー調整手段950とに接続されている。ノイズ追加器910は入力信号102に含まれたノイズデータに基づいてノイズパッチ912を生成する。 FIG. 9 shows a block diagram of an apparatus 900 for generating a bandwidth extension signal 122 from an input signal 102 in accordance with one embodiment of the present invention. This device 900 is similar to the device shown in FIG. 8, except that it further includes a noise adder 910, an erasure harmonic adder 920, a noise power adjustment means 940, and an erasure harmonic power adjustment means 950. The noise adder 910 is connected to the noise power adjustment unit 940, and the noise power adjustment unit 940 is connected to the coupler 120. Vanishing harmonic adder 920 is connected to vanishing harmonic power adjustment means 950, and vanishing harmonic power adjustment means 950 is connected to coupler 120. Further, the power controller 710 is connected to the noise power adjustment means 940 and the disappearance harmonic power adjustment means 950. The noise adder 910 generates a noise patch 912 based on the noise data included in the input signal 102.

ノイズパッチ912はノイズパワー調整手段940によってスケールされる。パワー制御器710は、入力信号102に含まれたスペクトル包絡データ及び/又はノイズスケーリングデータに基づいてノイズパワー調整手段940を制御する。この様にして、オリジナル信号のノイズは近似され、帯域幅拡張信号のオーディオ品質を改善することができる。 The noise patch 912 is scaled by the noise power adjusting means 940. The power controller 710 controls the noise power adjustment unit 940 based on the spectral envelope data and / or noise scaling data included in the input signal 102. In this way, the noise of the original signal is approximated and the audio quality of the bandwidth extension signal can be improved.

消失ハーモニック追加器920は、入力信号に含まれた消失ハーモニックデータに基づいて消失したハーモニックパッチ922を生成する。消失したハーモニックパッチ922は、オリジナル信号の高周波帯域においてのみ発生するハーモニック周波数を含んでもよく、もし入力信号102の第1帯域に関してオリジナル信号の低周波帯域の情報のみが使用可能になるならば、このハーモニック周波数は再生できない可能性がある。消失したハーモニックデータは、これら消失したハーモニクスに関する情報を提供するかも知れない。消失ハーモニックパッチ922は消失ハーモニックパワー調整手段950によってスケールされる。パワー制御器710は、入力信号102に含まれたスペクトル包絡データ又は消失ハーモニックスケーリングデータに基づいて消失ハーモニックパワー調整手段950を制御する。 The lost harmonic adder 920 generates a lost harmonic patch 922 based on the lost harmonic data included in the input signal. The missing harmonic patch 922 may include a harmonic frequency that occurs only in the high frequency band of the original signal, and if only the low frequency band information of the original signal is available for the first band of the input signal 102, this Harmonic frequencies may not be reproducible. Missing harmonic data may provide information about these missing harmonics. The vanishing harmonic patch 922 is scaled by the vanishing harmonic power adjustment means 950. The power controller 710 controls the erasure harmonic power adjustment unit 950 based on the spectral envelope data or the erasure harmonic scaling data included in the input signal 102.

結合器120は第1パッチ112と第2パッチ114と入力信号102の第1帯域とノイズパッチ912と消失ハーモニックパッチ922とを結合し、帯域幅拡張信号122を得る。パワー制御器710はパワー調整手段と共に、スペクトル包絡基準を満たすように、スペクトル包絡データに基づいて第1パッチ112と第2パッチ114とノイズパッチ912と消失ハーモニックパッチ922とをスケールする。 The combiner 120 combines the first patch 112, the second patch 114, the first band of the input signal 102, the noise patch 912, and the erasure harmonic patch 922 to obtain the bandwidth extension signal 122. The power controller 710 scales the first patch 112, the second patch 114, the noise patch 912, and the lost harmonic patch 922 based on the spectral envelope data so as to satisfy the spectral envelope criterion together with the power adjustment unit.

図10は、本発明の一実施例に従った、入力信号1002に基づいて帯域幅削減信号1032を提供するための装置1000のブロック図を示す。この装置1000は、スペクトル包絡データ決定器1010、パッチスケーリング制御データ生成器1020、及び出力インターフェース1030を備えている。スペクトル包絡データ決定器1010とパッチスケーリング制御データ生成器1020は、出力インターフェース1030と接続されている。スペクトル包絡データ決定器1010は入力信号1002の高周波帯域に基づいてスペクトル包絡データ1012を決定することができる。パッチスケーリング制御データ生成器1020は、復号器で生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、復号器において帯域幅削減信号1032をスケーリングするため、又は当該復号器において第1パッチと第2パッチとをスケーリングするための、パッチスケーリング制御データ1022を生成する。このスペクトル包絡基準はスペクトル包絡データに基づいている。第1パッチは帯域幅削減信号1032の第1帯域から第1のパッチアルゴリズムに従って生成され、第2パッチは帯域幅削減信号1032の第1帯域から第2のパッチアルゴリズムに従って生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。出力インターフェース1030は、入力信号1002の低周波帯域とスペクトル包絡データ1012とパッチスケーリング制御データ1022とを結合し、帯域幅削減信号1032を得る。さらに、出力インターフェース1030は伝送又は蓄積のためにこの帯域幅削減信号1032を供給する。 FIG. 10 shows a block diagram of an apparatus 1000 for providing a bandwidth reduction signal 1032 based on an input signal 1002, in accordance with one embodiment of the present invention. The apparatus 1000 includes a spectrum envelope data determiner 1010, a patch scaling control data generator 1020, and an output interface 1030. The spectrum envelope data determiner 1010 and the patch scaling control data generator 1020 are connected to the output interface 1030. The spectrum envelope data determiner 1010 can determine the spectrum envelope data 1012 based on the high frequency band of the input signal 1002. The patch scaling control data generator 1020 scales the bandwidth reduction signal 1032 at the decoder or the first patch at the decoder so that the bandwidth extension signal generated at the decoder satisfies the spectral envelope criterion. Patch scaling control data 1022 for scaling the second patch is generated. This spectral envelope criterion is based on spectral envelope data. The first patch is generated from the first band of the bandwidth reduction signal 1032 according to the first patch algorithm, and the second patch is generated from the first band of the bandwidth reduction signal 1032 according to the second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm. The output interface 1030 combines the low frequency band of the input signal 1002, the spectral envelope data 1012, and the patch scaling control data 1022 to obtain a bandwidth reduction signal 1032. In addition, the output interface 1030 provides this bandwidth reduction signal 1032 for transmission or storage.

装置1000は、入力信号の低周波帯域を符号化するためのコア符号器を備えていてもよい。コア符号器は、例えば差分符号器、エントロピー符号器又は知覚的オーディオ符号器であってもよい。 Apparatus 1000 may comprise a core encoder for encoding the low frequency band of the input signal. The core encoder may be, for example, a differential encoder, an entropy encoder or a perceptual audio encoder.

前記装置1000は、上述の復号器のための信号を提供する符号器の一部として構成してもよい。パッチスケーリング制御データ1022は、例えば、パワー分配スケーリングのための単純な係数や複数のパラメータを含んでいてもよい。パッチスケーリング制御データは、例えば高周波帯域全体にわたる第1パッチと第2パッチとのパワー比を示してもよいし、高周波領域全体にわたる第1パッチ及び/又は第2パッチのパワーの絶対値を示してもよいし、少なくとも1つのパラメータによって表現されてもよい。それに代えて、パッチスケーリングデータは、スペクトル帯域複製アプリケーションにおけるサブバンド毎のスペクトル包絡データと同様に、高周波帯域を一緒に構成する複数のサブバンドのそれぞれについて決定された1つの係数を含んでもよい。さらに、このパッチスケーリングデータは、フィルタの変換関数を示してもよい。例えば、第1パッチをスケーリングするためのフィルタの変換関数のパラメータ、及び/又は第2パッチをスケーリングするためのフィルタの変換関数のパラメータは、前記パッチスケーリング制御データを生成するために決定されてもよい。こうして、前記パラメータは周波数の関数に基づいて生成される。別の変形例では、第1パッチと第2パッチの差分関数を表すパッチスケーリング制御データを生成してもよい。 The apparatus 1000 may be configured as part of an encoder that provides signals for the decoder described above. The patch scaling control data 1022 may include, for example, a simple coefficient for power distribution scaling and a plurality of parameters. The patch scaling control data may indicate, for example, a power ratio between the first patch and the second patch over the entire high frequency band, or indicate an absolute value of the power of the first patch and / or the second patch over the entire high frequency region. Alternatively, it may be expressed by at least one parameter. Alternatively, the patch scaling data may include one coefficient determined for each of a plurality of subbands that together make up the high frequency band, as well as the spectral envelope data for each subband in a spectral band replication application. Further, the patch scaling data may indicate a conversion function of the filter. For example, a parameter of a filter conversion function for scaling the first patch and / or a parameter of a filter conversion function for scaling the second patch may be determined to generate the patch scaling control data. Good. Thus, the parameter is generated based on a function of frequency. In another variation, patch scaling control data representing a difference function between the first patch and the second patch may be generated.

パッチスケーリング制御データ1022は入力信号1002を分析し、その入力信号1002の分析に基づいてパッチスケーリング制御パラメータメモリに記憶されたパッチスケーリング制御パラメータを選択することによって生成することができ、パッチスケーリング制御データ1022が取得される。 The patch scaling control data 1022 can be generated by analyzing the input signal 1002 and selecting a patch scaling control parameter stored in the patch scaling control parameter memory based on the analysis of the input signal 1002. 1022 is acquired.

それに代えて、パッチスケーリング制御データ1022の生成は、合成による分析手段によって実現することもできる。この目的のため、パッチスケーリング制御データ生成器1020は、パッチ生成器(復号器のために描かれたものとして)と比較器とを追加的に備えている。パッチ生成器は、第1パッチを入力信号1002の低周波帯域から第1のパッチアルゴリズムに従って生成し、第2パッチを入力信号1002の低周波帯域から第2のパッチアルゴリズムに従って生成する。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。比較器は第1パッチと第2パッチと入力信号の高周波帯域とを比較し、パッチスケーリング制御データ1022を得る。換言すれば、前述の概念は前記装置1000にも適用される。この様にして、前記装置1000はパッチ同士、又は結合されたパッチと例えばオリジナルオーディオ信号である入力信号とを比較することによって、パッチスケーリング制御データ1022を引き出すことができる。さらに、前記装置1000は、既述のようにスペクトルライン選択器、パワー制御器、ノイズ追加器及び/又は消失ハーモニック追加器を備えていてもよい。この様にして、ノイズデータ、ノイズパッチスケーリング制御データ、消失ハーモニックデータ及び/又は消失ハーモニックパッチスケーリング制御データが合成による分析手法によって引き出すことができる。 Alternatively, the generation of the patch scaling control data 1022 can be realized by analysis means by synthesis. For this purpose, the patch scaling control data generator 1020 additionally comprises a patch generator (as drawn for the decoder) and a comparator. The patch generator generates a first patch from the low frequency band of the input signal 1002 according to the first patch algorithm, and generates a second patch from the low frequency band of the input signal 1002 according to the second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm. The comparator compares the first patch, the second patch, and the high frequency band of the input signal, and obtains patch scaling control data 1022. In other words, the concept described above also applies to the device 1000. In this way, the device 1000 can derive patch scaling control data 1022 by comparing patches or combined patches with an input signal, eg, an original audio signal. Furthermore, the device 1000 may include a spectral line selector, a power controller, a noise adder and / or an erasure harmonic adder as described above. In this manner, noise data, noise patch scaling control data, lost harmonic data, and / or lost harmonic patch scaling control data can be extracted by an analysis technique using synthesis.

本発明に係る幾つかの実施例は、第1帯域と第2帯域とを備えたオーディオ信号に関係する。第1帯域は第1の分解能データによって表され、第2帯域は第2の分解能データによって表され、第2の分解能は第1の分解能より低い。第2の分解能データは、第2の帯域のスペクトル包絡データと、復号器で生成された帯域幅拡張信号はスペクトル包絡基準を満たすように、復号器でオーディオ信号をスケーリングするため、又は復号器で第1パッチと第2パッチとをスケーリングするための第2の帯域のパッチスケーリング制御データとに基づいている。スペクトル包絡基準はスペクトル包絡データに基づいている。第1パッチはオーディオ信号の第1帯域から第1のパッチアルゴリズムに従って生成され、第2パッチはオーディオ信号の第1帯域から第2のパッチアルゴリズムに従って生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。 Some embodiments according to the invention relate to an audio signal comprising a first band and a second band. The first band is represented by first resolution data, the second band is represented by second resolution data, and the second resolution is lower than the first resolution. The second resolution data may be used to scale the audio signal at the decoder or at the decoder so that the spectral envelope data of the second band and the bandwidth extension signal generated by the decoder meet the spectral envelope criteria. Based on the second band patch scaling control data for scaling the first patch and the second patch. The spectral envelope criterion is based on spectral envelope data. The first patch is generated from the first band of the audio signal according to the first patch algorithm, and the second patch is generated from the first band of the audio signal according to the second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm.

前記オーディオ信号は、例えばオリジナル信号に基づいた帯域幅削減信号であってもよい。オーディオ信号の第1帯域は、高い分解能で符号化されたオリジナルオーディオ信号の低周波帯域を表してもよい。オーディオ信号の第2帯域は、オリジナルオーディオ信号の高周波帯域を表してもよく、少なくとも2つのパラメータ、すなわちスペクトル包絡データによって表現されたスペクトル包絡パラメータと、パッチスケーリング制御データによって表現されたパッチスケーリング制御パラメータとによって量子化されてもよい。このようなオーディオ信号に基づいて、上述の概念に従う復号器は、公知の概念に比べて改善されたオーディオ品質を持ち、オリジナルオーディオ信号の良好な近似をもたらす帯域幅拡張信号を生成することができる。 The audio signal may be a bandwidth reduction signal based on an original signal, for example. The first band of the audio signal may represent a low frequency band of the original audio signal encoded with high resolution. The second band of the audio signal may represent a high frequency band of the original audio signal, and includes at least two parameters: a spectral envelope parameter expressed by the spectral envelope data and a patch scaling control parameter expressed by the patch scaling control data. And may be quantized. Based on such an audio signal, a decoder according to the above concept can generate a bandwidth extension signal that has an improved audio quality compared to the known concept and provides a good approximation of the original audio signal. .

図11は、本発明の一実施例における、入力信号から帯域幅拡張信号を生成する方法1100のフローチャートを示す。入力信号の第1帯域は第1の分解能データによって表現され、第2帯域は第2の分解能データによって表現され、第2の分解能は第1の分解能より低い。前記方法1100は、第1パッチを生成するステップ1110と、第2パッチを生成するステップ1120と、入力信号をスケールするステップ1130又は第1パッチ及び第2パッチをスケールするステップ1130と、第1パッチと第2パッチと入力信号の第1帯域とを結合するステップ1140とを備え、帯域幅拡張信号を得る。第1パッチは入力信号の第1帯域から第1のパッチアルゴリズムに従って生成1110され、第2パッチは入力信号の第1帯域から第2のパッチアルゴリズムに従って生成1120される。第2のパッチアルゴリズムに従って生成1120された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成1110された第1パッチのスペクトル密度より高い。帯域幅拡張信号がスペクトル包絡基準を満たすように、入力信号が第1のパッチアルゴリズム及び第2のパッチアルゴリズムに従ってスケール1130されるか、又は第1パッチと第2パッチとがスケール1130される。 FIG. 11 shows a flowchart of a method 1100 for generating a bandwidth extension signal from an input signal in an embodiment of the present invention. The first band of the input signal is represented by first resolution data, the second band is represented by second resolution data, and the second resolution is lower than the first resolution. The method 1100 includes a step 1110 for generating a first patch, a step 1120 for generating a second patch, a step 1130 for scaling an input signal, a step 1130 for scaling a first patch and a second patch, and a first patch. And a step 1140 for combining the second patch and the first band of the input signal to obtain a bandwidth extension signal. The first patch is generated 1110 from the first band of the input signal according to the first patch algorithm, and the second patch is generated 1120 from the first band of the input signal according to the second patch algorithm. The spectral density of the second patch generated 1120 according to the second patch algorithm is higher than the spectral density of the first patch generated 1110 according to the first patch algorithm. The input signal is scaled 1130 according to the first and second patch algorithms, or the first and second patches are scaled 1130 such that the bandwidth extension signal meets the spectral envelope criterion.

さらに、前記方法1100は、上述の概念に従ったステップによって拡張されてもよい。前記方法1100は、例えばコンピュータやマイクロコントローラ上で動作するコンピュータプログラムとして実現されてもよい。 Further, the method 1100 may be extended by steps in accordance with the concepts described above. The method 1100 may be implemented, for example, as a computer program that runs on a computer or microcontroller.

図12は、本発明の一実施例に係る、入力信号に基づいて帯域幅削減信号を提供する方法1200のフローチャートを示す。この方法1200は、入力信号の高周波帯域に基づいてスペクトル包絡データを決定するステップ1210と、パッチスケーリング制御データを生成するステップ1220と、帯域幅削減信号を得るために入力信号の低周波帯域とスペクトル包絡データとパッチスケーリング制御データとを結合するステップ1230と、伝送又は蓄積のために帯域幅削減信号を提供するステップ1240とを有する。パッチスケーリング制御データは、復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、復号器において帯域幅削減信号をスケールするため、又は復号器によって第1パッチと第2パッチとをスケールするために生成1220される。スペクトル包絡基準はスペクトル包絡データに基づいている。第1パッチは帯域幅削減信号の低周波帯域から第1のパッチアルゴリズムに従って生成され、第2パッチは帯域幅削減信号の低周波帯域から第2のパッチアルゴリズムに従って生成される。第2のパッチアルゴリズムに従って生成された第2パッチのスペクトル密度は、第1のパッチアルゴリズムに従って生成された第1パッチのスペクトル密度より高い。 FIG. 12 shows a flowchart of a method 1200 for providing a bandwidth reduction signal based on an input signal according to an embodiment of the present invention. The method 1200 includes a step 1210 of determining spectral envelope data based on a high frequency band of the input signal, a step 1220 of generating patch scaling control data, and a low frequency band and spectrum of the input signal to obtain a bandwidth reduction signal. Combining envelope data and patch scaling control data 1230 and providing a bandwidth reduction signal 1240 for transmission or storage. The patch scaling control data is used to scale the bandwidth reduction signal at the decoder or by the decoder to scale the bandwidth reduction signal so that the bandwidth extension signal generated by the decoder meets the spectral envelope criterion. Generated 1220 to scale. The spectral envelope criterion is based on spectral envelope data. The first patch is generated from the low frequency band of the bandwidth reduction signal according to the first patch algorithm, and the second patch is generated from the low frequency band of the bandwidth reduction signal according to the second patch algorithm. The spectral density of the second patch generated according to the second patch algorithm is higher than the spectral density of the first patch generated according to the first patch algorithm.

さらに、前記方法1200は、上述の概念に従ったステップによって拡張されてもよい。前記方法1200は、例えばコンピュータやマイクロコントローラ上で動作するコンピュータプログラムとして実現されてもよい。 Further, the method 1200 may be extended by steps in accordance with the concepts described above. The method 1200 may be implemented as a computer program that runs on, for example, a computer or microcontroller.

本発明に係る幾つかの実施例は、非線形歪みやより密なスペクトルのためのノイズ充填と結合された帯域幅拡張のために、位相ボコーダを使って帯域幅拡張信号を生成するための装置に関する。スペクトル拡大のために位相ボコーダを適用した場合には、周波数ラインはさらに離間する。スペクトル内にギャップが例えば量子化によって存在する場合には、前記拡大によってギャップはさらに増大する。エネルギー適応において、スペクトル内に残存するラインは大き過ぎるエネルギーを受け取る。このことは、ギャップをノイズや信号の非線形歪みによって得られるさらなるハーモニクスによって充填することで、防止できる。この様にして、より大きなエネルギーが残存するラインの間に分配される。帯域内の僅か数個の周波数ラインへのエネルギー集中によって、不自然な又は金属的な音をもたらす。以前はより多数存在した帯域のエネルギーは、残存する帯域へと合計される。 Some embodiments according to the invention relate to an apparatus for generating a bandwidth extension signal using a phase vocoder for bandwidth extension combined with non-linear distortion and noise filling for denser spectra. . When a phase vocoder is applied for spectral expansion, the frequency lines are further separated. If there are gaps in the spectrum, for example by quantization, the expansion further increases the gaps. In energy adaptation, the lines remaining in the spectrum receive too much energy. This can be prevented by filling the gap with further harmonics obtained by noise or non-linear distortion of the signal. In this way, more energy is distributed among the remaining lines. Energy concentration on just a few frequency lines in the band results in an unnatural or metallic sound. The energy of the band that previously existed is summed into the remaining band.

スペクトル内にギャップはないが、少なくともノイズが存在する場合には、エネルギーの一部はノイズフロアに残っている。非線形歪みの適用により、一方ではスペクトルは歪みによって生成されたノイズによって、他方では歪められるべき信号部分の適切な選択によって導かれたさらなるハーモニック部分によって、再び密にされる。 There are no gaps in the spectrum, but at least if there is noise, some of the energy remains in the noise floor. With the application of non-linear distortion, on the one hand the spectrum is again densified by noise generated by the distortion and on the other hand by further harmonic parts guided by the appropriate selection of signal parts to be distorted.

次に帯域幅拡張信号は、例えば濾波され歪められた信号と、位相ボコーダの助けを借りて生成された信号との重み付き合計であってもよい。換言すれば、帯域幅拡張信号は、第1パッチと第2パッチと入力信号の第1帯域との重み付き合計であってもよい。 The bandwidth extension signal may then be a weighted sum of, for example, a filtered and distorted signal and a signal generated with the help of a phase vocoder. In other words, the bandwidth extension signal may be a weighted sum of the first patch, the second patch, and the first band of the input signal.

本発明に係る幾つかの実施例は、全帯域が利用できる訳ではないような全てのオーディオアプリケーションに適した概念に関する。例えば、デジタルラジオサービス、インターネットストリーミング、又は他のオーディオ通信アプリケーションを使用するオーディオコンテンツの放送のため、上述の概念を適用できる。 Some embodiments according to the invention relate to a concept suitable for all audio applications where not all the bandwidth is available. For example, the concepts described above can be applied for broadcasting audio content using digital radio services, Internet streaming, or other audio communication applications.

本発明を幾つかの実施例に関連して説明してきたが、本発明の趣旨を逸脱しない範囲での修正や置換、等価物であってもよい。本発明の方法や構成の多くの代替方法があることもまた注目すべきである。したがって、添付の請求項は本発明の趣旨に含まれるこれら全ての修正、置換、等価物を包含すると解釈されるべきである。 Although the present invention has been described with reference to several embodiments, modifications, substitutions, and equivalents may be made without departing from the spirit of the present invention. It should also be noted that there are many alternatives to the method and configuration of the present invention. Therefore, the appended claims should be construed to include all these modifications, substitutions, and equivalents included within the spirit of the invention.

特に、状況によって、本発明の構成はソフトウエアとして構成されてもよい点に注目すべきである。本発明は、対応する方法が実行されるように、デジタル記憶媒体、特にプログラム可能なコンピュータシステムと協動して電子的に読み取り可能な制御信号を含むフレキシブルディスクやCDであってもよい。一般に、本発明は、このコンピュータプログラム製品がコンピュータで作動されたとき、本発明方法を実行するために機械読み取り可能なキャリアに記憶されたコンピュータプログラム製品の中に含まれる。換言すれば、本発明は、コンピュータプログラム製品がコンピュータで作動されたとき、本発明方法を実行するためのプログラムコードを有するコンピュータプログラムとして実現される。 In particular, it should be noted that the configuration of the present invention may be configured as software depending on the situation. The invention may be a flexible disk or CD containing control signals that can be read electronically in cooperation with a digital storage medium, in particular a programmable computer system, so that the corresponding method is carried out. In general, the present invention is included in a computer program product stored on a machine readable carrier for performing the method of the present invention when the computer program product is run on a computer. In other words, the present invention is realized as a computer program having a program code for executing the method of the present invention when the computer program product is operated on a computer.

Claims (17)

入力信号(102)から帯域幅拡張信号(122)を生成する装置(100;300;400;700;800;900)であって、前記入力信号の第1帯域が第1の分解能データによって表現され、その第2帯域が第2の分解能データによって表現され、第2の分解能は第1の分解能より低いものにおいて、
前記入力信号(102)の第1帯域から第1のパッチアルゴリズムに従って第1パッチ(112)を生成し、かつ入力信号(102)の第1帯域から第2のパッチアルゴリズムに従って第2パッチ(114)を生成するパッチ生成器(110)であって、前記第2のパッチアルゴリズムに従って生成された前記第2パッチ(114)のスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチ(112)のスペクトル密度に比べて高い、パッチ生成器と、
前記第1パッチ(112)と前記第2パッチ(114)と前記入力信号(102)の第1帯域とを結合して前記帯域幅拡張信号(122)を得る結合器(120)と、を備え、
帯域幅拡張信号を生成する前記装置は、前記帯域幅拡張信号がスペクトル包絡基準を満たすように、前記第1のパッチアルゴリズムと第2のパッチアルゴリズムとに従って前記入力信号(102)をスケールするか、又は前記第1パッチ(112)と第2パッチ(114)とをスケールすることを特徴とする装置。
An apparatus (100; 300; 400; 700; 800; 900) for generating a bandwidth extension signal (122) from an input signal (102), wherein the first band of the input signal is represented by first resolution data. The second band is represented by the second resolution data, the second resolution being lower than the first resolution,
A first patch (112) is generated from a first band of the input signal (102) according to a first patch algorithm and a second patch (114) according to a second patch algorithm from the first band of the input signal (102) A patch generator (110) for generating a spectral density of the second patch (114) generated according to the second patch algorithm, wherein the first patch (112) generated according to the first patch algorithm ) With a patch generator that is higher than the spectral density of
A combiner (120) for combining the first patch (112), the second patch (114), and the first band of the input signal (102) to obtain the bandwidth extension signal (122); ,
The apparatus for generating a bandwidth extension signal scales the input signal (102) according to the first patch algorithm and the second patch algorithm such that the bandwidth extension signal satisfies a spectral envelope criterion; Alternatively, the apparatus scales the first patch (112) and the second patch (114).
請求項1に記載の装置において、前記第1のパッチアルゴリズムはハーモニックなパッチアルゴリズムであり、前記パッチ生成器(110)は、第1パッチ(112)が入力信号(102)の第1帯域の周波数の整数倍の周波数だけを含むように、前記第1パッチ(112)を生成することを特徴とする装置。 The apparatus of claim 1, wherein the first patch algorithm is a harmonic patch algorithm, and the patch generator (110) is configured such that the first patch (112) is a frequency of the first band of the input signal (102). The first patch (112) is generated so as to include only an integral multiple of a frequency. 請求項1又は2に記載の装置において、前記第2のパッチアルゴリズムはハーモニックパッチングアルゴリズムと非ハーモニックパッチングアルゴリズムとの混合型のパッチアルゴリズムであり、前記パッチ生成器(110)は、第2パッチ(114)が入力信号(102)の第1帯域の周波数の整数倍の周波数と、入力信号(102)の第1帯域の周波数の整数倍でない周波数とを含むように、前記第2パッチ(114)を生成することを特徴とする装置。 The apparatus according to claim 1 or 2, wherein the second patch algorithm is a mixed patch algorithm of a harmonic patching algorithm and a non-harmonic patching algorithm, and the patch generator (110) includes a second patch (114). ) Include a frequency that is an integer multiple of the frequency of the first band of the input signal (102) and a frequency that is not an integer multiple of the frequency of the first band of the input signal (102). A device characterized by generating. 請求項1乃至3のいずれかに記載の装置において、前記第1パッチ(112)の下側のカットオフ周波数は前記第2パッチ(114)の下側のカットオフ周波数に等しく、前記第1パッチ(112)の上側のカットオフ周波数は前記第2パッチ(114)の上側のカットオフ周波数に等しいことを特徴とする装置。 4. The apparatus according to claim 1, wherein the lower cutoff frequency of the first patch (112) is equal to the lower cutoff frequency of the second patch (114). The upper cut-off frequency of (112) is equal to the upper cut-off frequency of the second patch (114). 請求項1乃至4のいずれかに記載の装置において、前記第1パッチ(112)を前記第1のパッチアルゴリズムに従って生成する位相ボコーダ(310)を備えることを特徴とする装置。 Apparatus according to any of the preceding claims, characterized in that it comprises a phase vocoder (310) for generating the first patch (112) according to the first patch algorithm. 請求項1乃至5のいずれかに記載の装置において、前記第2パッチ(114)を前記第2のパッチアルゴリズムに従って、前記入力信号(102)の第1帯域を切り取ることで生成する振幅切取り器(320)を備えることを特徴とする装置。 6. An apparatus as claimed in claim 1, wherein the second patch (114) is generated by cutting a first band of the input signal (102) according to the second patch algorithm. 320). 請求項1乃至6のいずれかに記載の装置において、前記第2パッチ(114)の複数の周波数ラインを選択して修正済みの第2パッチ(414)を得るスペクトルライン選択器(410)を備え、前記第1パッチ(112)の対応する周波数ラインが消失した場合にその周波数ラインを選択し、前記結合器(120)は前記第1パッチ(112)と前記修正済みの第2パッチ(414)と前記入力信号(102)の第1帯域とを結合することを特徴とする装置。 7. The apparatus according to claim 1, further comprising a spectral line selector (410) for selecting a plurality of frequency lines of the second patch (114) to obtain a modified second patch (414). When the corresponding frequency line of the first patch (112) disappears, the frequency line is selected, and the combiner (120) selects the first patch (112) and the modified second patch (414). And a first band of the input signal (102). 請求項1乃至7のいずれかに記載の装置において、前記第1及び第2のパッチアルゴリズムに従って前記入力信号(102)のスケーリングを制御し、又は第1パッチ(112)と第2パッチ(114)のスケーリングを制御するパワー制御器(710)を備え、前記パワー制御器(710)は、前記入力信号(102)に含まれたスペクトル包絡データに基づいて、かつ少なくとも1つの記憶されたパッチスケーリング制御パラメータ又は前記入力信号(102)に含まれたパッチスケーリング制御データに基づいて、前記スケーリングを制御することを特徴とする装置。 8. Apparatus according to any of claims 1 to 7, wherein the scaling of the input signal (102) is controlled according to the first and second patch algorithms, or the first patch (112) and the second patch (114). A power controller (710) for controlling the scaling of the input signal (102) based on spectral envelope data contained in the input signal (102) and at least one stored patch scaling control An apparatus for controlling the scaling based on a parameter or patch scaling control data included in the input signal (102). 請求項8に記載の装置において、第1のパッチアルゴリズムに従って入力信号(102)をスケールするか、又は第1パッチ(112)をスケールする第1のパワー調整手段(720)と、第2のパッチアルゴリズムに従って入力信号(102)をスケールするか、又は第2パッチ(114)をスケールする第2のパワー調整手段(730)とを備え、前記パワー制御器(710)は前記第1のパワー調整手段(720)と第2のパワー調整手段(730)とを制御することを特徴とする装置。 9. The apparatus according to claim 8, wherein first power adjusting means (720) for scaling the input signal (102) or scaling the first patch (112) according to a first patch algorithm, and a second patch. Second power adjustment means (730) for scaling the input signal (102) or scaling the second patch (114) according to an algorithm, wherein the power controller (710) is the first power adjustment means. (720) and 2nd power adjustment means (730), The apparatus characterized by the above-mentioned. 請求項8又は9に記載の装置において、ノイズ追加器(910)と消失ハーモニック追加器(920)とを備え、前記ノイズ追加器(910)は前記入力信号に含まれたノイズデータに基づいてノイズパッチ(912)を生成し、前記消失ハーモニック追加器(920)は前記入力信号(102)に含まれた消失ハーモニックデータに基づいて消失ハーモニックパッチ(922)を生成し、前記パワー制御器(710)は前記スペクトル包絡データに基づいて前記ノイズパッチ(912)と消失ハーモニックパッチ(922)のスケーリングを制御し、前記結合器(120)は第1パッチ(112)と第2パッチ(114)と入力信号(102)の第1帯域とノイズパッチ(912)と消失ハーモニックパッチ(922)とを結合して帯域幅拡張信号(122)を取得し、前記パワー制御器(710)は、前記スペクトル包絡基準が満たされるように、前記スペクトル包絡データに基づいて前記第1パッチ(112)、前記第2パッチ(114)、前記ノイズパッチ(912)及び前記消失ハーモニックパッチ(922)のスケーリングを制御することを特徴とする装置。 10. The apparatus according to claim 8 or 9, comprising a noise adder (910) and an erasure harmonic adder (920), wherein the noise adder (910) is a noise based on noise data contained in the input signal. Generating a patch (912), and the erasure harmonic adder (920) generates an erasure harmonic patch (922) based on the erasure harmonic data included in the input signal (102), and the power controller (710) Controls the scaling of the noise patch (912) and the erasure harmonic patch (922) based on the spectral envelope data, and the combiner (120) includes a first patch (112), a second patch (114) and an input signal. Bandwidth combining the first band of (102), the noise patch (912) and the erasure harmonic patch (922) A tension signal (122) is obtained, and the power controller (710) determines the first patch (112) and the second patch (114) based on the spectral envelope data so that the spectral envelope criterion is satisfied. , Controlling the scaling of the noise patch (912) and the disappearing harmonic patch (922). 入力信号(1002)に基づいて帯域幅削減信号(1032)を提供する装置(1000)であって、
前記入力信号(1002)の高周波帯域に基づいてスペクトル包絡データ(1012)を決定するスペクトル包絡データ決定器(1010)と、
復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、前記帯域幅削減信号(1032)を前記復号器においてスケールするため、又は前記復号器によって第1パッチと第2パッチとをスケールするためのパッチスケーリング制御データ(1022)を生成するパッチスケーリング制御データ生成器(1020)であって、前記スペクトル包絡基準は前記スペクトル包絡データ(1012)に基づいており、前記第1パッチは前記帯域幅削減信号(1032)の第1帯域から第1のパッチアルゴリズムに従って生成され、前記第2パッチは前記帯域幅削減信号(1032)の第1帯域から第2のパッチアルゴリズムに従って生成され、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高い、パッチスケーリング制御データ生成器と、
前記入力信号(1002)の低周波帯域と、前記スペクトル包絡データ(1012)と、前記パッチスケーリング制御データ(1022)とを結合して前記帯域幅削減信号(1032)を得ると共に、その帯域幅削減信号(1032)を伝送又は蓄積のために提供する出力インターフェース(1030)と、を備えた装置。
An apparatus (1000) for providing a bandwidth reduction signal (1032) based on an input signal (1002), comprising:
A spectral envelope data determiner (1010) for determining spectral envelope data (1012) based on a high frequency band of the input signal (1002);
In order to scale the bandwidth reduction signal (1032) in the decoder so that the bandwidth extension signal generated by the decoder meets the spectral envelope criterion, or by the decoder, the first patch and the second patch A patch scaling control data generator (1020) for generating patch scaling control data (1022) for scaling, wherein the spectral envelope criterion is based on the spectral envelope data (1012), and the first patch is A second patch is generated from a first band of the bandwidth reduction signal (1032) according to a first patch algorithm, and the second patch is generated from a first band of the bandwidth reduction signal (1032) according to a second patch algorithm, Spectrum of the second patch generated according to the patch algorithm of 2 Once again higher than the spectral density of the first patch generated according to the first patch algorithm and the patch scaling control data generator,
The low frequency band of the input signal (1002), the spectral envelope data (1012), and the patch scaling control data (1022) are combined to obtain the bandwidth reduction signal (1032), and the bandwidth reduction An output interface (1030) for providing a signal (1032) for transmission or storage.
請求項11に記載の装置であって、前記パッチスケーリング制御データ生成器は、
前記入力信号(1002)の低周波帯域から第1のパッチアルゴリズムに従って第1パッチを生成し、かつ前記入力信号(1002)の低周波帯域から第2のパッチアルゴリズムに従って第2パッチを生成するパッチ生成器であって、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高い、パッチ生成器と、
前記第1パッチと前記第2パッチと前記入力信号(1002)の高周波帯域とを比較し、前記パッチスケーリング制御データ(1022)を得る比較器と、を備えた装置。
12. The apparatus of claim 11, wherein the patch scaling control data generator is
Patch generation for generating a first patch from a low frequency band of the input signal (1002) according to a first patch algorithm and generating a second patch from a low frequency band of the input signal (1002) according to a second patch algorithm A patch generator, wherein a spectral density of the second patch generated according to the second patch algorithm is higher than a spectral density of the first patch generated according to the first patch algorithm;
A comparator that compares the first patch, the second patch, and a high frequency band of the input signal (1002) to obtain the patch scaling control data (1022);
請求項11に記載の装置であって、複数のパッチスケーリング制御パラメータを記憶し提供するためのパッチスケーリング制御パラメータメモリを備え、前記パッチスケーリング制御データ生成器(1020)は、前記入力信号(1002)を分析し、かつ入力信号(1002)の分析に基づいて選択された記憶済みのパッチスケーリング制御パラメータに従い、前記パッチスケーリング制御データ(1022)を生成することを特徴とする装置。 12. The apparatus of claim 11, comprising a patch scaling control parameter memory for storing and providing a plurality of patch scaling control parameters, wherein the patch scaling control data generator (1020) is the input signal (1002). And generating the patch scaling control data (1022) according to stored patch scaling control parameters selected based on an analysis of the input signal (1002). 第1の分解能データによって表現された第1帯域と、第2の分解能データによって表現された第2帯域とを備えたオーディオ信号を記録したコンピュータ読み取り可能な記憶媒体であって、前記第2の分解能は前記第1の分解能より低く、前記第2の分解能データは、第2帯域のスペクトル包絡データに基づき、かつ復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、前記復号器において前記オーディオ信号をスケールするため、又は前記復号器によって第1パッチと第2パッチとをスケールするための第2帯域のパッチスケーリング制御データに基づいており、前記スペクトル包絡基準は前記スペクトル包絡データに基づいており、前記第1パッチは前記オーディオ信号の第1帯域から第1のパッチアルゴリズムに従って生成され、前記第2パッチは前記オーディオ信号の第1帯域から第2のパッチアルゴリズムに従って生成され、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高いことを特徴とする、記憶媒体 A computer-readable storage medium storing an audio signal having a first band expressed by first resolution data and a second band expressed by second resolution data, wherein the second resolution Is lower than the first resolution, the second resolution data is based on the spectral envelope data of the second band, and the bandwidth extension signal generated by the decoder satisfies the spectral envelope criterion. Based on second-band patch scaling control data for scaling the audio signal or scaling the first patch and the second patch by the decoder, wherein the spectral envelope reference is based on the spectral envelope data. And the first patch is a first patch algorithm from a first band of the audio signal. And the second patch is generated from a first band of the audio signal according to a second patch algorithm, and the spectral density of the second patch generated according to the second patch algorithm is the first patch. A storage medium characterized by being higher than the spectral density of the first patch generated according to an algorithm. 入力信号から帯域幅拡張信号を生成する方法(1100)であって、前記入力信号の第1帯域が第1の分解能データによって表現され、その第2帯域が第2の分解能データによって表現され、第2の分解能は第1の分解能より低いものにおいて、
前記入力信号の第1帯域から第1のパッチアルゴリズムに従って第1パッチを生成するステップ(1110)と、
前記入力信号の第1帯域から第2のパッチアルゴリズムに従って第2パッチを生成するステップ(1120)であって、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高い、ステップと、
前記帯域幅拡張信号がスペクトル包絡基準を満たすように、前記第1のパッチアルゴリズムと第2のパッチアルゴリズムとに従って前記入力信号をスケールするか、又は前記第1パッチと第2パッチとをスケールするステップ(1130)と、
前記第1パッチと前記第2パッチと前記入力信号の第1帯域とを結合して前記帯域幅拡張信号を得るステップ(1140)と、を備える方法。
A method (1100) for generating a bandwidth extension signal from an input signal, wherein the first band of the input signal is represented by first resolution data, the second band is represented by second resolution data, and The resolution of 2 is lower than the first resolution,
Generating (1110) a first patch from a first band of the input signal according to a first patch algorithm;
Generating a first patch from a first band of the input signal according to a second patch algorithm (1120), wherein a spectral density of the second patch generated according to the second patch algorithm is the first patch A step that is higher than the spectral density of the first patch generated according to a patch algorithm;
Scaling the input signal according to the first patch algorithm and the second patch algorithm, or scaling the first patch and the second patch such that the bandwidth extension signal satisfies a spectral envelope criterion. (1130)
Combining the first patch, the second patch, and the first band of the input signal to obtain the bandwidth extension signal (1140).
入力信号に基づいて帯域幅削減信号を提供する方法(1200)であって、
前記入力信号の高周波帯域に基づいてスペクトル包絡データを決定するステップ(1210)と、
復号器によって生成された帯域幅拡張信号がスペクトル包絡基準を満たすように、前記帯域幅削減信号を前記復号器においてスケールするため、又は前記復号器によって第1パッチと第2パッチとをスケールするためのパッチスケーリング制御データを生成するステップ(1220)であって、前記スペクトル包絡基準は前記スペクトル包絡データに基づいており、前記第1パッチは前記帯域幅削減信号の第1帯域から第1のパッチアルゴリズムに従って生成され、前記第2パッチは前記帯域幅削減信号の第1帯域から第2のパッチアルゴリズムに従って生成され、前記第2のパッチアルゴリズムに従って生成された前記第2パッチのスペクトル密度は前記第1のパッチアルゴリズムに従って生成された前記第1パッチのスペクトル密度に比べて高い、ステップと、
前記入力信号の低周波帯域と、前記スペクトル包絡データと、前記パッチスケーリング制御データとを結合して前記帯域幅削減信号を得るステップ(1230)と、
前記帯域幅削減信号を伝送又は蓄積のために提供するステップ(1240)と、を備える方法。
A method (1200) of providing a bandwidth reduction signal based on an input signal comprising:
Determining spectral envelope data based on a high frequency band of the input signal (1210);
To scale the bandwidth reduction signal at the decoder or to scale the first and second patches by the decoder so that the bandwidth extension signal generated by the decoder meets the spectral envelope criterion Generating (1220) patch scaling control data for the spectrum envelope criteria based on the spectrum envelope data, wherein the first patch is a first patch algorithm from a first band of the bandwidth reduction signal. And the second patch is generated from the first band of the bandwidth reduction signal according to a second patch algorithm, and the spectral density of the second patch generated according to the second patch algorithm is the first patch Compared to the spectral density of the first patch generated according to the patch algorithm High Te, and the step,
Combining the low frequency band of the input signal, the spectral envelope data, and the patch scaling control data to obtain the bandwidth reduction signal (1230);
Providing (1240) the bandwidth reduction signal for transmission or storage.
コンピュータ又はマイクロコントローラ上で作動されたときに、請求項15又は16に記載の方法を実行するためのプログラムコードを備えたコンピュータプログラム。 A computer program comprising program code for executing the method of claim 15 or 16 when run on a computer or microcontroller.
JP2011516992A 2008-07-11 2009-06-25 Apparatus and method for generating bandwidth extension signal Active JP5255699B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7984908P 2008-07-11 2008-07-11
US61/079,849 2008-07-11
PCT/EP2009/004603 WO2010003557A1 (en) 2008-07-11 2009-06-25 Apparatus and method for generating a bandwidth extended signal

Publications (2)

Publication Number Publication Date
JP2011527452A JP2011527452A (en) 2011-10-27
JP5255699B2 true JP5255699B2 (en) 2013-08-07

Family

ID=41162740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011516992A Active JP5255699B2 (en) 2008-07-11 2009-06-25 Apparatus and method for generating bandwidth extension signal

Country Status (18)

Country Link
EP (1) EP2291842B1 (en)
JP (1) JP5255699B2 (en)
KR (1) KR101239812B1 (en)
CN (1) CN102105931B (en)
AR (1) AR072483A1 (en)
AU (1) AU2009267460B2 (en)
BR (2) BRPI0910528B1 (en)
CA (1) CA2729474C (en)
CO (1) CO6541514A2 (en)
ES (1) ES2461141T3 (en)
HK (1) HK1154112A1 (en)
MX (1) MX2011000365A (en)
MY (1) MY163454A (en)
PL (1) PL2291842T3 (en)
RU (1) RU2512090C2 (en)
TW (1) TWI415116B (en)
WO (1) WO2010003557A1 (en)
ZA (1) ZA201009164B (en)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4250290A1 (en) 2010-01-19 2023-09-27 Dolby International AB Improved subband block based harmonic transposition
JP5588025B2 (en) 2010-03-09 2014-09-10 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. Apparatus and method for processing audio signals using patch boundary matching
JP5854520B2 (en) 2010-03-09 2016-02-09 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. Apparatus and method for improved amplitude response and temporal alignment in a bandwidth extension method based on a phase vocoder for audio signals
JP5649084B2 (en) 2010-03-09 2015-01-07 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. Apparatus and method for processing transient audio events in an audio signal when changing playback speed or pitch
TR201904117T4 (en) * 2010-04-16 2019-05-21 Fraunhofer Ges Forschung Apparatus, method and computer program for generating a broadband signal using guided bandwidth extension and blind bandwidth extension.
PL2596497T3 (en) * 2010-07-19 2014-10-31 Dolby Int Ab Processing of audio signals during high frequency reconstruction
DK2617035T3 (en) 2010-09-16 2019-01-02 Dolby Int Ab CROSS-PRODUCT-ENHANCED SUBBOND BLOCK BASED HARMONIC TRANSPOSITION
US8490008B2 (en) * 2011-11-10 2013-07-16 Research In Motion Limited Touchscreen keyboard predictive display and generation of a set of characters
US9251800B2 (en) * 2011-11-02 2016-02-02 Telefonaktiebolaget L M Ericsson (Publ) Generation of a high band extension of a bandwidth extended audio signal
CN102543086B (en) * 2011-12-16 2013-08-14 大连理工大学 Device and method for expanding speech bandwidth based on audio watermarking
ES2549953T3 (en) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for the reproduction of an audio signal, apparatus and method for the generation of an encoded audio signal, computer program and encoded audio signal
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
US9564141B2 (en) * 2014-02-13 2017-02-07 Qualcomm Incorporated Harmonic bandwidth extension of audio signals
JP2016038435A (en) 2014-08-06 2016-03-22 ソニー株式会社 Encoding device and method, decoding device and method, and program
RU2589305C1 (en) * 2014-11-18 2016-07-10 Федеральное государственное казенное военное образовательное учреждение высшего профессионального образования "Военный учебно-научный центр Военно-воздушных сил "Военно-воздушная академия имени профессора Н.Е. Жуковского и Ю.А. Гагарина" (г. Воронеж) Министерства обороны Российской Федерации High-frequency signal generation method and device for its implementation
WO2016149085A2 (en) * 2015-03-13 2016-09-22 Psyx Research, Inc. System and method for dynamic recovery of audio data and compressed audio enhancement
EP3121814A1 (en) * 2015-07-24 2017-01-25 Sound object techology S.A. in organization A method and a system for decomposition of acoustic signal into sound objects, a sound object and its use
TWI807562B (en) 2017-03-23 2023-07-01 瑞典商都比國際公司 Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US654988A (en) * 1900-03-16 1900-07-31 Leonhard Lederer Process of making acetyl cellulose.
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
RU2256293C2 (en) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Improving initial coding using duplicating band
SE512719C2 (en) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd A method and apparatus for reducing data flow based on harmonic bandwidth expansion
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
SE9903553D0 (en) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing conceptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0004163D0 (en) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance or high frequency reconstruction coding methods by adaptive filtering
US7260541B2 (en) 2001-07-13 2007-08-21 Matsushita Electric Industrial Co., Ltd. Audio signal decoding device and audio signal encoding device
CN1550002A (en) * 2001-08-31 2004-11-24 皇家飞利浦电子股份有限公司 Bandwidth extension of a sound signal
JP4380174B2 (en) * 2003-02-27 2009-12-09 沖電気工業株式会社 Band correction device
DE602004016325D1 (en) * 2003-05-20 2008-10-16 Matsushita Electric Ind Co Ltd DIOSIGNALBANDES
JP2005010621A (en) * 2003-06-20 2005-01-13 Matsushita Electric Ind Co Ltd Voice band expanding device and band expanding method
WO2006046587A1 (en) * 2004-10-28 2006-05-04 Matsushita Electric Industrial Co., Ltd. Scalable encoding apparatus, scalable decoding apparatus, and methods thereof
KR100647336B1 (en) * 2005-11-08 2006-11-23 삼성전자주식회사 Apparatus and method for adaptive time/frequency-based encoding/decoding
JP5141180B2 (en) * 2006-11-09 2013-02-13 ソニー株式会社 Frequency band expanding apparatus, frequency band expanding method, reproducing apparatus and reproducing method, program, and recording medium

Also Published As

Publication number Publication date
WO2010003557A1 (en) 2010-01-14
CN102105931A (en) 2011-06-22
RU2011100134A (en) 2012-07-20
ES2461141T3 (en) 2014-05-16
KR101239812B1 (en) 2013-03-06
AU2009267460B2 (en) 2013-01-10
AU2009267460A1 (en) 2010-01-14
TWI415116B (en) 2013-11-11
CA2729474A1 (en) 2010-01-14
HK1154112A1 (en) 2012-04-20
KR20110033188A (en) 2011-03-30
BRPI0910528B1 (en) 2020-09-24
RU2512090C2 (en) 2014-04-10
BR122017003818A2 (en) 2019-09-03
MY163454A (en) 2017-09-15
CN102105931B (en) 2013-04-10
ZA201009164B (en) 2011-10-26
BRPI0910528A2 (en) 2018-05-22
CA2729474C (en) 2015-09-01
EP2291842B1 (en) 2014-03-12
EP2291842A1 (en) 2011-03-09
TW201007708A (en) 2010-02-16
CO6541514A2 (en) 2012-10-16
BR122017003818B1 (en) 2024-03-05
MX2011000365A (en) 2011-02-25
AR072483A1 (en) 2010-09-01
JP2011527452A (en) 2011-10-27
PL2291842T3 (en) 2014-08-29

Similar Documents

Publication Publication Date Title
JP5255699B2 (en) Apparatus and method for generating bandwidth extension signal
JP5192053B2 (en) Apparatus and method for bandwidth extension of audio signal
TWI444991B (en) Apparatus and method for processing an audio signal using patch border alignment
US8880410B2 (en) Apparatus and method for generating a bandwidth extended signal
JP2015526769A (en) Apparatus and method for reproducing audio signal, apparatus and method for generating encoded audio signal, computer program, and encoded audio signal
US20230343356A1 (en) Apparatus and Method for Generating a Bandwidth Extended Signal
KR102619434B1 (en) Audio processor and method for generating frequency-enhanced audio signals using pulse processing

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130326

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130419

R150 Certificate of patent or registration of utility model

Ref document number: 5255699

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160426

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250