JP5150165B2 - Method and system for providing an acoustic signal with extended bandwidth - Google Patents

Method and system for providing an acoustic signal with extended bandwidth Download PDF

Info

Publication number
JP5150165B2
JP5150165B2 JP2007214930A JP2007214930A JP5150165B2 JP 5150165 B2 JP5150165 B2 JP 5150165B2 JP 2007214930 A JP2007214930 A JP 2007214930A JP 2007214930 A JP2007214930 A JP 2007214930A JP 5150165 B2 JP5150165 B2 JP 5150165B2
Authority
JP
Japan
Prior art keywords
bandwidth
signal
broadband
acoustic signal
upper limit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007214930A
Other languages
Japanese (ja)
Other versions
JP2008052277A (en
Inventor
ホーリック ティム
イセル ベルント
ウベ シュミット ゲルハルト
Original Assignee
ニュアンス コミュニケーションズ, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ニュアンス コミュニケーションズ, インコーポレイテッド filed Critical ニュアンス コミュニケーションズ, インコーポレイテッド
Publication of JP2008052277A publication Critical patent/JP2008052277A/en
Application granted granted Critical
Publication of JP5150165B2 publication Critical patent/JP5150165B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Abstract

The invention is directed to a method for providing an acoustic signal with extended bandwidth, comprising automatically determining a current upper and a current lower bandwidth limit of a received acoustic signal, automatically determining at least one complementary signal to complement the received acoustic signal between a predefined lower broadband bandwidth limit and the current lower bandwidth limit and/or between the current upper bandwidth limit and a predefined upper broadband bandwidth limit, wherein the predefined lower broadband bandwidth limit is smaller than the current bandwidth limit and the predefined upper broadband bandwidth limit is larger than the current upper bandwidth limit, automatically assembling the at least one complementary signal and the received acoustic signal to obtain an acoustic signal with extended bandwidth.

Description

本発明は、拡張された帯域幅を有する音響信号、特にスピーチ信号を提供するための方法およびシステムに向けられる。   The present invention is directed to a method and system for providing an acoustic signal, particularly a speech signal, having an extended bandwidth.

アナログまたはデジタル信号経路を介して送信される音響信号は、通常、信号経路が制限された帯域幅のみを有することにより、送信された音響信号が元の信号とは非常に異なるという障害に苦しむ。例えば、従来の電話接続の場合には、8kHzのサンプリングレートが使用され、4kHzの最大の信号帯域幅という結果を生じる。オーディオCDの場合と比較すると、スピーチおよびオーディオの質が非常に減少する。   An acoustic signal transmitted over an analog or digital signal path typically suffers from the obstacle that the transmitted acoustic signal is very different from the original signal because the signal path has only a limited bandwidth. For example, in the case of a conventional telephone connection, a sampling rate of 8 kHz is used, resulting in a maximum signal bandwidth of 4 kHz. Compared to audio CDs, speech and audio quality are greatly reduced.

さらに、多くの種類の送信が、追加の帯域幅制限を示す。アナログ電話接続の場合、300Hzと3.4kHzとの間の周波数のみが、送信される。結果として、3.1kHzの帯域幅のみが利用可能である。   In addition, many types of transmission exhibit additional bandwidth limitations. For analog telephone connections, only frequencies between 300 Hz and 3.4 kHz are transmitted. As a result, only a 3.1 kHz bandwidth is available.

原則として、電話接続の帯域幅が、広帯域またはワイドバンドのデジタルなコーディングおよびデコーディング方法(いわゆる広帯域コーデック)を用いることによって、増加し得る。しかしながら、このような場合、送信者および受信者の双方が、対応するコーディングおよびデコーディング方法をサポートする必要があり、これらは新しい規格のインプリメンテーションを必要とする。   In principle, the bandwidth of a telephone connection can be increased by using wideband or wideband digital coding and decoding methods (so-called wideband codecs). However, in such cases, both the sender and receiver need to support corresponding coding and decoding methods, which require the implementation of new standards.

代替案として、帯域幅拡張のためのシステムは、例えば、非特許文献1または非特許文献2に記載されるように使用され得る。これらのシステムは、既存の電話接続が変更される必要がないように、受信者側のみでインプリメントされるべきである。これらのシステムにおいて、小さい帯域幅を有する入力信号のミッシング周波数コンポーネントが推定され、入力信号に追加される。   As an alternative, a system for bandwidth extension may be used, for example, as described in [1] or [2]. These systems should be implemented only on the recipient side so that existing telephone connections do not need to be changed. In these systems, the missing frequency component of an input signal having a small bandwidth is estimated and added to the input signal.

当該技術の帯域幅拡張システムのこのような状態における構造および対応する信号フローの例が、図6に図示される。通常、下位および上位の周波数範囲の双方が再統合される。   An example of the structure and corresponding signal flow of such a state of the art bandwidth extension system is illustrated in FIG. Usually, both the lower and upper frequency ranges are reintegrated.

ブロック601において、デジタル化された形式で入来するまたは受信される音響信号x(n)は、サブサンプリングおよびブロック抽出によって、処理されることにより、信号ベクトル   In block 601, the incoming or received acoustic signal x (n) in digitized form is processed by subsampling and block extraction to produce a signal vector.

Figure 0005150165
を取得する。ここで、変数nは、時間を示す。この図において、入来信号x(n)は、サンプリングレートを増加させることによって、所望される帯域幅に既に変換されていることが仮定される。この変換ステップにおいて、生成されるべき追加の周波数コンポーネントは無く、このことは、例えば、適切なアンチエイリアシングフィルタエレメントまたはアンチイメージングフィルタエレメントを用いることによって、達成され得る。送信された信号を補正しないために、帯域幅拡張は、ミッシング周波数範囲内のみで行われる。送信方法に依存して、拡張は低周波数(例えば、0から300Hzまで)および/または高周波数(例えば、3400Hzから所望されるサンプリングレートの半分まで)の範囲に関係する。
Figure 0005150165
To get. Here, the variable n indicates time. In this figure, it is assumed that the incoming signal x (n) has already been converted to the desired bandwidth by increasing the sampling rate. In this conversion step, there are no additional frequency components to be generated, which can be achieved, for example, by using suitable anti-aliasing or anti-imaging filter elements. In order not to correct the transmitted signal, the bandwidth extension is performed only within the missing frequency range. Depending on the transmission method, the extension relates to a range of low frequencies (eg, from 0 to 300 Hz) and / or high frequencies (eg, from 3400 Hz to half the desired sampling rate).

ブロック602において、狭帯域のスペクトル包絡線が狭帯域の信号から抽出され、狭帯域の信号は、電話チャネルの帯域幅制限によって制限される。非線形写像を介して、対応する広帯域の包絡線信号が、狭帯域の包絡線から推定される。写像は、例えば、コードブックの組(非特許文献3を参照)またはニュートラルネットワーク(Neutral Networks)(非特許文献4を参照)に基づく。これらの方法において、コードブックのエントリまたはニュートラルネットワークの重みが、大きなプロセッサおよびメモリリソースを要求する学習方法を用いて生成される。   At block 602, a narrowband spectral envelope is extracted from the narrowband signal, and the narrowband signal is limited by the bandwidth limitation of the telephone channel. A corresponding broadband envelope signal is estimated from the narrowband envelope via a non-linear mapping. The mapping is based on, for example, a set of code books (see Non-Patent Document 3) or a neutral network (see Non-Patent Document 4). In these methods, codebook entries or neutral network weights are generated using learning methods that require large processor and memory resources.

さらに、ブロック603において、スペクトル的に平坦な包絡線を有する広帯域またはワイドバンドの励起信号が、狭帯域の信号から生成される。この励起信号は、声帯の後ろで直接的に記録された信号に対応する。すなわち、励起信号は、音声およびピッチについての情報を含むが、通常は形式および構造またはスペクトル形状についての情報を含まない。従って、完全な信号(例えば、スピーチ信号)を引き出すために、励起信号は、スペクトル包絡線を用いて重みづけられる必要がある。励起信号の生成に対して、非線形特性(非特許文献5を参照)(例えば、二光線整流またはスクエアリング)が使用され得る。   Further, at block 603, a broadband or wideband excitation signal having a spectrally flat envelope is generated from the narrowband signal. This excitation signal corresponds to a signal recorded directly behind the vocal cords. That is, the excitation signal contains information about speech and pitch, but usually does not contain information about form and structure or spectral shape. Thus, in order to derive a complete signal (eg, a speech signal), the excitation signal needs to be weighted using a spectral envelope. Non-linear characteristics (see Non-Patent Document 5) (eg, two-beam rectification or squaring) can be used for generating the excitation signal.

帯域幅拡張に対して、励起信号   Excitation signal for bandwidth expansion

Figure 0005150165
は、ブロック604において、包絡線を用いてスペクトル的に着色される。その後、拡張に対して使用されるスペクトル範囲は、ブロック606において帯域消去フィルタを用いて抽出され、信号ベクトル
Figure 0005150165
Are spectrally colored using the envelope at block 604. The spectral range used for the extension is then extracted using a band elimination filter at block 606, and the signal vector

Figure 0005150165
を生じる。帯域消去フィルタは、例えば、200〜3700Hzまでの範囲において有効であり得る。
Figure 0005150165
Produce. The band elimination filter may be effective in the range from 200 to 3700 Hz, for example.

受信された信号の信号ベクトル   The signal vector of the received signal

Figure 0005150165
は、ブロック605において、補足的な帯域通過フィルタを通過する。次いで、信号コンポーネント
Figure 0005150165
Are passed through a supplemental bandpass filter at block 605. Then the signal component

Figure 0005150165
が、追加され、拡張された帯域幅を有する信号ベクトル
Figure 0005150165
Is added and a signal vector with expanded bandwidth

Figure 0005150165
を取得する。ブロック607において、異なる信号ベクトルが、再び組み合わされ、オーバーサンプリングが行われ、信号y(n)を生じる。
Figure 0005150165
To get. At block 607, the different signal vectors are recombined and oversampling is performed, resulting in signal y (n).

これらの従来技術のシステムにおいて、エレメントおよびそれらのパラメータは、一旦インプリメントされると、その後、変更されない。従って、全ての入来する音響信号は、同じ方法で扱われる。
P.Jax著「Enhancement of Bandlimited Speech Signals」、2002年、Algorithms and Theoretical Bounds、学位論文、ドイツ、Aachen E.Larsen、R.M.Aarts著「Audio Bandwidth Extension」、2004年、米国、ニュージャージー州、Hoboken、Wiley J.Epps、W.H.Holmes著「A New Technique for Wideband Enhancement of Coded Narrow−band Speech」、1999年6月、IEEE Workshop on Speech Coding、Conference proceedings、174−176ページ J.M.Valin、R.Lefebvre著「Bandwidth Extension of Narrowband Speech for Low Bit−Rate Wideband Coding」、2000年9月、IEEE Workshop on Speech Coding、Conference Proceedings、130−132ページ U.Kornagel「Spectral Widening of the Excitation Signal for Telephone−Band Speech Enhancement」、2001年9月、IWAENC01、Conference Proceedings、215−218ページ
In these prior art systems, the elements and their parameters are not subsequently changed once implemented. Thus, all incoming acoustic signals are handled in the same way.
P. “Enhancement of Bandlimited Spech Signals” by Jax, 2002, Algorithms and Theoretical Bounds, Dissertation, Aachen, Germany E. Larsen, R.A. M.M. “Audio Bandwidth Extension” by Aarts, 2004, Hoboken, Wiley, New Jersey, USA J. et al. Epps, W.M. H. Holmes, “A New Technology for Wideband Enhancement of Coded Narrow-band Speech”, June 1999, IEEE Workshop on Speech Coding, 17th page, Con17 page. J. et al. M.M. Valin, R.A. Left Bandre, “Bandwidth Extension of Narrowband Speech for Low Bit-Rate Wideband Coding”, September 2000, IEEE Workshop on Speech Coding, Proceed 130 U. Kornagel, “Spectral Widening of the Excitation Signal for Telephone-Band Speech Enhancement”, September 2001, IWAENC01, Conference Proceedings, pages 215-218

従って、本発明の根底にある目的は、拡張された帯域幅を有する音響信号を提供するための、よりフレキシブルな方法および装置を提供することである。   Accordingly, an object underlying the present invention is to provide a more flexible method and apparatus for providing an acoustic signal having an extended bandwidth.

この問題は、項目1に記載の方法および項目16に記載の装置によって解決される。   This problem is solved by the method according to item 1 and the device according to item 16.

本発明に従って、拡張された帯域幅を有する音響信号を提供するための方法であって、該方法は、
(a) 受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限とを自動的に決定することと、
(b) 該受信された音響信号を補足するために、少なくとも1つの補足信号を、所定の広帯域の帯域幅の下限と該現在の帯域幅の下限との間および/または該現在の帯域幅の上限と所定の広帯域の帯域幅の上限との間で自動的に決定することであって、該所定の広帯域の帯域幅の下限は、該現在の帯域幅の下限よりも小さく、該所定の広帯域の帯域幅の上限は、該現在の帯域幅の上限よりも大きい、ことと、
(c) 該少なくとも1つの補足信号と該受信された音響信号とを自動的に組み合わせることにより、拡張された帯域幅を有する音響信号を取得することと
を包含する。
In accordance with the present invention, a method for providing an acoustic signal having an extended bandwidth, the method comprising:
(A) automatically determining an upper limit and a lower limit of the current bandwidth of the received acoustic signal;
(B) in order to supplement the received acoustic signal, at least one supplemental signal between a lower limit of a predetermined wide bandwidth and the lower limit of the current bandwidth and / or of the current bandwidth; Automatically determining between an upper limit and an upper limit of a predetermined wideband bandwidth, wherein the lower limit of the predetermined wideband bandwidth is less than the lower limit of the current bandwidth, and the predetermined wideband bandwidth The bandwidth upper limit is greater than the current bandwidth upper limit,
(C) obtaining an acoustic signal having an extended bandwidth by automatically combining the at least one supplemental signal and the received acoustic signal.

受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限とを決定すること、および現在の帯域幅限界とそれぞれの所定の広帯域(またはワイドバンド)の帯域幅の限界との間で補足信号を決定することによって、本発明に従う方法は、実際に受信される音響信号に対する帯域幅拡張の適合を可能にする。例えば、送信者がISDN電話を使用する場合には、ハンズフリーシステムを有する携帯電話の場合と比較すると、より広い周波数範囲が使用される。それゆえ、受信される音響信号の帯域幅は、それが必要な場合には、生じる信号の質が非常に高くなるように、それらの周波数においてのみ拡張される。   Determining the current bandwidth upper and lower bandwidth limits of the received acoustic signal, and between the current bandwidth limit and the respective predetermined wideband (or wideband) bandwidth limit By determining the supplementary signal at, the method according to the invention allows adaptation of the bandwidth extension to the actually received acoustic signal. For example, if the sender uses an ISDN phone, a wider frequency range is used compared to a mobile phone with a hands-free system. Therefore, the bandwidth of the received acoustic signal is expanded only at those frequencies so that the quality of the resulting signal is very high when it is needed.

このようにすると、一方で、受信される信号が非常に狭い周波数範囲のみをカバーする場合でさえ、スペクトルギャップは発生しない。他方で、相対的に広い周波数範囲をカバーする信号を受信する場合、補足信号を決定する際に、周波数はカットオフされない。   In this way, on the other hand, no spectral gap occurs even if the received signal covers only a very narrow frequency range. On the other hand, when receiving a signal that covers a relatively wide frequency range, the frequency is not cut off when determining the supplemental signal.

受信された音響信号は、デジタル信号であるか、またはデジタル化され得る。上記の方法において、ステップ(a)〜(c)は、受信された音響信号を既定のサンプリングレートに変換するステップに先行され得る。さらに、ステップ(a)〜(c)は、該音響信号、特に変換された音響信号から信号ベクトルを抽出するステップに先行され得る。信号ベクトルは、音響信号をサブサンプリングすることによって取得され得、かつ所定の数のエントリを備え得る。次いで、続いて(やがて)信号ベクトルはオーバーラップし得る。信号ベクトルの使用は、信号のさらなる処理を単純化する。   The received acoustic signal is a digital signal or can be digitized. In the above method, steps (a)-(c) may be preceded by converting the received acoustic signal to a predetermined sampling rate. Furthermore, steps (a) to (c) may be preceded by a step of extracting a signal vector from the acoustic signal, in particular the transformed acoustic signal. The signal vector can be obtained by sub-sampling the acoustic signal and can comprise a predetermined number of entries. The subsequent signal vectors can then overlap. The use of signal vectors simplifies further processing of the signal.

ステップ(a)〜(c)は、受信された音響信号のスペクトルベクトルを決定するステップに先行され得る。特に、ウィンドウ関数が、受信された音響信号の信号ベクトルに適用され得る。例えば、ハニングまたはハミングウィンドウが、使用され得る(K.D.Kammeyer、K.Kroschel著「Digitale Signalverarbeitung」、第4版、1997年、ドイツ、Stuttgart、Teubnerを参照)。信号ベクトル、特に、このようにして重みづけられた信号ベクトルは、離散フーリエ変換を用いて、フーリエ領域に変換され得る。生じるベクトルは、短期のスペクトルベクトルである。これは、フーリエ領域におけるさらなる処理を可能にする。   Steps (a)-(c) may be preceded by determining a spectral vector of the received acoustic signal. In particular, a window function can be applied to the signal vector of the received acoustic signal. For example, Hanning or Hamming windows can be used (see KD Kammeyer, K. Kroschel "Digital Signalverbeitung", 4th edition, 1997, Stuttgart, Tübner). The signal vector, in particular the signal vector thus weighted, can be transformed into the Fourier domain using a discrete Fourier transform. The resulting vector is a short-term spectral vector. This allows further processing in the Fourier domain.

上記の方法において、ステップ(b)は、広帯域のスペクトル包絡線信号および広帯域の励起信号を、広帯域の帯域幅の下限と広帯域の帯域幅の上限との間で決定することにより、スペクトル包絡線信号と励起信号との積が既定の基準に従って受信された音響信号に対応することを包含し得る。   In the above method, step (b) includes determining the spectral envelope signal and the broadband excitation signal between a lower bandwidth limit and an upper bandwidth limit by determining the broadband spectral envelope signal and the broadband excitation signal. And the product of the excitation signal may correspond to an acoustic signal received according to a predetermined criterion.

包絡線信号および励起信号へのこのような分解は、現在の帯域幅の限界を決定することを単純化し、補足信号を決定する際に精度を増加させる。   Such a decomposition into an envelope signal and an excitation signal simplifies the determination of the current bandwidth limit and increases the accuracy in determining the supplemental signal.

ステップ(a)は、決定された広帯域のスペクトル包絡線信号と受信された音響信号の長期のパワースペクトルとを比較することを包含し得る。長期のパワースペクトルは、音響信号の現在の帯域幅の限界を決定するための適切なベースであることが分かる。   Step (a) may include comparing the determined broadband spectral envelope signal to the long-term power spectrum of the received acoustic signal. It can be seen that the long-term power spectrum is a suitable basis for determining the current bandwidth limit of the acoustic signal.

結果として、現在の帯域幅の限界が、このように、受信された音響信号の広帯域のスペクトル包絡線信号を用いてステップ(a)において決定された場合、ステップ(b)において補足信号を決定することは、これらの現在の帯域幅の限界に基づいており、包絡線信号の決定を包含することは、再び、(新しく)該決定された包絡線信号と長期のパワースペクトルとを比較することによって、現在の帯域幅の限界を繰り返し適合させることが可能である。換言すれば、ステップ(a)において現在の帯域幅の限界を決定することは、ステップ(b)に従って決定されたスペクトル包絡線信号を、特に先行するステップにおいて、または方法の先行する繰り返しにおいて使用し得る。   As a result, if the current bandwidth limit is thus determined in step (a) using the broadband spectral envelope signal of the received acoustic signal, the supplemental signal is determined in step (b). This is based on these current bandwidth limitations, and including the determination of the envelope signal is again by comparing the (newly) determined envelope signal with the long-term power spectrum. It is possible to adapt the current bandwidth limits repeatedly. In other words, determining the current bandwidth limit in step (a) uses the spectral envelope signal determined according to step (b), particularly in the preceding step or in the preceding iteration of the method. obtain.

特に、受信された音響信号がフーリエ領域に変換されている場合には、長期のパワースペクトルを決定することは、音響信号に対応するサブバンド信号の絶対値の二乗の一次の帰納的平滑化を行うことを包含し得る。このことは、特に、所望される信号(例えば、スピーチ信号)が、受信される音響信号において検出される場合に限り、なされ得る。   In particular, when the received acoustic signal is transformed into the Fourier domain, determining the long-term power spectrum is a first-order recursive smoothing of the square of the absolute value of the subband signal corresponding to the acoustic signal. It can include doing. This can be done in particular only if the desired signal (eg a speech signal) is detected in the received acoustic signal.

さらに、長期のパワースペクトルは、特に既定の周波数限界内の長期のパワースペクトルに関して、正規化され得る。   Furthermore, the long-term power spectrum can be normalized, particularly with respect to the long-term power spectrum within predetermined frequency limits.

あるいは、長期のパワースペクトルは、時間領域内で決定され得る。このことは、自己相関を決定することおよびLPC解析を行うことによってなされ得、対応する予測係数を取得する。   Alternatively, the long-term power spectrum can be determined in the time domain. This can be done by determining autocorrelation and performing LPC analysis to obtain the corresponding prediction coefficients.

比較するステップは、最小周波数および最大周波数を選択することであって、該周波数に対して、長期のパワースペクトルは、決定された広帯域のスペクトル包絡線のパワースペクトルに既定の定数を足したものよりも大きいか、または等しい、ことを包含し得る。   The step of comparing is to select a minimum frequency and a maximum frequency, for which the long-term power spectrum is greater than the determined broadband spectrum envelope power spectrum plus a predetermined constant. Can be greater than or equal to.

これは、帯域幅の限界を決定するための特に単純で信頼できる方法である。既定の定数は、実験的または理論的なデータに基づいて選択され得る。既定の定数は負の数であり得る。   This is a particularly simple and reliable way to determine bandwidth limits. The predetermined constant can be selected based on experimental or theoretical data. The default constant can be a negative number.

上記の方法において、広帯域のスペクトル包絡線信号を決定することは、既定の基準に従って、コードブックから包絡線信号を選択することを包含し得る。   In the above method, determining a broadband spectral envelope signal may include selecting an envelope signal from a codebook according to predetermined criteria.

コードブックを用いることによって、所望される計算機能力が、包絡線信号を決定するために低減され得る。原則として、異なる種の基準が、コードブックから包絡線信号を選択する場合に使用され得る。特に、既定の距離基準(例えば、ケプストラム距離)を用いることが、特にコードブックエントリがケプストラムベクトルの形式を有する場合に、使用され得る。   By using a codebook, the desired computational power can be reduced to determine the envelope signal. In principle, different kinds of criteria can be used when selecting the envelope signal from the codebook. In particular, using a pre-determined distance criterion (eg, cepstrum distance) can be used, especially if the codebook entry has the form of a cepstrum vector.

特に、包絡線信号を選択することは、受信された音響信号を等化することと、既定の距離基準に従って、等化された音響信号に対して最小の距離を有する、特に最小のケプストラム距離を有する包絡線信号をコードブックから選択することを包含し得る。   In particular, selecting the envelope signal equalizes the received acoustic signal and, in particular, has the smallest distance to the equalized acoustic signal according to a predetermined distance criterion, and in particular the smallest cepstrum distance. It may include selecting an envelope signal having from a code book.

音響信号を等化することは、コードブックからの包絡線信号との比較が単純化され得るように音響信号を変更することを可能にする。特に、受信された音響信号は、生じる信号が、コードブックの学習のために使用される信号の長期のパワースペクトルに対応する長期のパワースペクトルを示すような方法で、等化され得る。等化は、受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限との間の周波数に制限され得;これらの限界の外側では、信号は変更されない。特に、受信された音響信号の等化は、コードブックの学習のために使用される信号の正規化された長期のパワースペクトルを用いて(特に受信された音響信号自身の正規化された長期のパワースペクトルによって割られた正規化された長期のパワースペクトルを用いて)、行われ得る。   Equalizing the acoustic signal allows the acoustic signal to be modified so that the comparison with the envelope signal from the codebook can be simplified. In particular, the received acoustic signal may be equalized in such a way that the resulting signal exhibits a long-term power spectrum corresponding to the long-term power spectrum of the signal used for codebook learning. Equalization may be limited to frequencies between the upper limit of the current bandwidth of the received acoustic signal and the lower limit of the current bandwidth; outside these limits, the signal is not changed. In particular, the equalization of the received acoustic signal is performed using the normalized long-term power spectrum of the signal used for codebook learning (specifically, the normalized long-term power spectrum of the received acoustic signal itself). Can be performed using a normalized long-term power spectrum divided by the power spectrum.

コードブックは、複数の組の対応する包絡線信号を備え得、各組は、広帯域の帯域幅の上限と広帯域の帯域幅の下限との間に、広帯域の包絡線信号を備え、広帯域の帯域幅の下限よりも大きい狭帯域の帯域幅の下限と、広帯域の帯域幅の上限よりも小さい狭帯域の帯域幅の上限との間に、対応する狭帯域の包絡線信号を備えており、包絡線信号を選択することは、既定の距離規準に従って、等化された音響信号に対して最小距離を有する狭帯域の包絡線信号を決定することと、この組の対応する広帯域の包絡線信号を選択することとを包含し得る。   The codebook may comprise a plurality of sets of corresponding envelope signals, each set comprising a broadband envelope signal between a broadband bandwidth upper limit and a broadband bandwidth lower limit, A corresponding narrowband envelope signal is provided between the lower limit of the narrowband bandwidth greater than the lower limit of the width and the upper limit of the narrowband bandwidth smaller than the upper limit of the wideband bandwidth. Selecting a line signal determines a narrowband envelope signal that has a minimum distance to the equalized acoustic signal according to a predetermined distance criterion and determines the corresponding wideband envelope signal of this set. Selecting.

このようにして、狭帯域信号が通常は狭帯域の帯域幅を有する受信された音響信号に、よりきっちりとマッチするので、受信された音響信号とコードブックの要素との間の単純な比較が行われ得る。   In this way, a simple comparison between the received acoustic signal and the codebook elements can be made because the narrowband signal more closely matches the received acoustic signal, which usually has a narrowband bandwidth. Can be done.

包絡線信号を選択するためにケプストラム距離を用いる場合、受信された音響信号(特にその等化された形式)は、ケプストラム領域に変換される必要がある。結果として、包絡線信号を選択するステップは、受信された音響信号のサブバンド信号の二乗された絶対値を決定するステップと、特に二乗された絶対値のベクトルに逆離散フーリエ変換を行うことによって、時間領域における自己相関を決定するステップと、特にレビンソン−ダーバンアルゴリズムを用いて予測係数を決定するステップと、ケプストラム係数を取得するために帰納を行うステップとをさらに包含し得る。   When using cepstrum distance to select an envelope signal, the received acoustic signal (especially its equalized form) needs to be converted into a cepstrum domain. As a result, the step of selecting the envelope signal is to determine the squared absolute value of the subband signal of the received acoustic signal, and in particular by performing an inverse discrete Fourier transform on the squared absolute value vector. , Further including determining autocorrelation in the time domain, determining a prediction coefficient, particularly using a Levinson-Durban algorithm, and performing recursion to obtain a cepstrum coefficient.

ケプストラムベクトルからスペクトル包絡線を決定するために、該方法は、ケプストラムベクトルを予測誤差係数に帰納的に変換するステップと、逆スペクトルを取得するために、既定の数の0を追加し、続いて離散フーリエ変換を行うことによって、予測誤差フィルタベクトルを増加させるステップと、スペクトル包絡線ベクトルを取得するために、各サブバンドコンポーネントの逆数を決定するステップとをさらに包含し得る。   In order to determine the spectral envelope from the cepstrum vector, the method recursively converts the cepstrum vector into prediction error coefficients, and adds a predetermined number of zeros to obtain the inverse spectrum, followed by It may further include increasing the prediction error filter vector by performing a discrete Fourier transform and determining the reciprocal of each subband component to obtain a spectral envelope vector.

上記の方法において、包絡線信号を選択するステップは、現在の帯域幅の下限と現在の帯域幅の上限とに適合されている適合された狭帯域コードブック包絡線信号を提供することによって先行され得る。   In the above method, the step of selecting an envelope signal is preceded by providing an adapted narrowband codebook envelope signal that is adapted to a lower limit of the current bandwidth and an upper limit of the current bandwidth. obtain.

コードブックエントリのこのような適合は、コードブックからの対応する包絡線信号の改良した選択を可能にする。特に、受信された音響信号が、コードブックの元の狭帯域の包絡線信号よりも広い帯域幅を示す場合には、適合は拡張された帯域幅を有する包絡線信号をコードブックにおいて生じる。このようにして、特に摩擦音が、より信頼性を持って検出され得る。   Such adaptation of the codebook entry allows an improved selection of the corresponding envelope signal from the codebook. In particular, if the received acoustic signal exhibits a wider bandwidth than the original narrowband envelope signal of the codebook, the adaptation results in an envelope signal having an extended bandwidth in the codebook. In this way, particularly frictional sounds can be detected more reliably.

提供するステップは、受信された音響信号の長期のパワースペクトルを用いて広帯域のコードブック包絡線信号を処理することを包含し得る。   The providing step may include processing the wideband codebook envelope signal using the long-term power spectrum of the received acoustic signal.

受信された音響信号のパワースペクトルの使用に起因して、音響信号への適切な適合が取得され得る。長期のパワースペクトルは正規化され得;さらに、受信された音響信号の長期のパワースペクトルが、コードブックの学習のために使用される広帯域の信号の正規化された長期のパワースペクトルによって割られ得る。広帯域のコードブック包絡線信号の処理は、現在の帯域幅限界の外側に対してのみ行われ得;帯域幅限界内では、包絡線信号は変更されない。長期のパワースペクトルを用いる処理は、受信された音響信号の長期のパワースペクトルを用いて、広帯域のコードブック包絡線信号ベクトルに重みづけすることを包含し得る。   Due to the use of the power spectrum of the received acoustic signal, an appropriate fit to the acoustic signal can be obtained. The long-term power spectrum can be normalized; furthermore, the long-term power spectrum of the received acoustic signal can be divided by the normalized long-term power spectrum of the broadband signal used for codebook learning . The processing of the wideband codebook envelope signal can only be performed outside the current bandwidth limit; within the bandwidth limit, the envelope signal is not changed. The process using the long-term power spectrum may include weighting the wideband codebook envelope signal vector using the long-term power spectrum of the received acoustic signal.

上記の方法において、広帯域の励起信号を決定することは、予測誤差フィルタリングおよび/または非線形特性に基づき得る。このようにして、適切な励起信号が生成され得る。可能性のある非線形特性は、例えば、U.Kornagel著「Spectral Widening of the Excitation Signal for Telephone−Band Speech Enhancement」において開示される。   In the above method, determining the broadband excitation signal may be based on prediction error filtering and / or non-linear characteristics. In this way, an appropriate excitation signal can be generated. Possible nonlinear characteristics include, for example, U.S. Pat. It is disclosed in Kornagel, “Spectral Widening of the Excitation Signal for Telephone-Band Speech Enhancement”.

上記の方法において、少なくとも1つの補足信号は、決定された広帯域のスペクトル包絡線と、決定された広帯域の励起信号との積に基づき得、ステップ(c)は、現在の帯域幅の下限と現在の帯域幅の上限との間の受信された音響信号と、広帯域の帯域幅の下限と現在の帯域幅の下限との間の帯域、および/または現在の帯域幅の上限と広帯域の帯域幅の上限との間の帯域に制限された少なくとも1つの補足信号を加算することを包含し得る。   In the above method, the at least one supplemental signal may be based on a product of the determined wideband spectral envelope and the determined wideband excitation signal, and step (c) may include a lower bound of the current bandwidth and the current Of the received acoustic signal between the upper bandwidth limit and the bandwidth between the lower bandwidth limit and the lower current bandwidth bandwidth, and / or the current upper bandwidth limit and the wide bandwidth bandwidth. It may include adding at least one supplemental signal limited to a band between the upper limit.

結果として、補足信号は、包絡線信号を用いて励起信号にスペクトル的に着色することに基づく。受信された音響信号の現在の帯域幅の外側にのみ補足信号を加えることによって、拡張された帯域幅を有する生じる信号におけるアーティファクトが回避される。   As a result, the supplemental signal is based on spectrally coloring the excitation signal using the envelope signal. By adding the supplemental signal only outside the current bandwidth of the received acoustic signal, artifacts in the resulting signal with extended bandwidth are avoided.

ステップ(c)はまた、補足信号および/または受信された音響信号のパワーを適合することを包含し得る。このステップで、受信された音響信号のパワーが維持され得る。   Step (c) may also include adapting the power of the supplemental signal and / or the received acoustic signal. In this step, the power of the received acoustic signal can be maintained.

上記の方法において、ステップの少なくとも1つは、ケプストラム領域において行われ得る。特に、コードブックのエントリがケプストラムベクトルである場合には、このことが、該方法をより簡単な方法で行うことを可能にする。   In the above method, at least one of the steps may be performed in a cepstrum region. In particular, if the codebook entry is a cepstrum vector, this allows the method to be performed in a simpler way.

上記の方法のステップ(a)〜ステップ(c)は、既定の時間間隔で繰り返され得る。次いで、現在受信される音響信号への繰り返しの適合は、結果生じる広帯域の信号の恒久的に高い質を導く。   Steps (a) to (c) of the above method can be repeated at predetermined time intervals. The repeated adaptation to the currently received acoustic signal then leads to a permanently high quality of the resulting broadband signal.

上記の方法のステップ(a)〜ステップ(c)は、所望される信号コンポーネント(例えば、スピーチ行動)が、受信された音響信号において検出された場合に限り、繰り返され得る。特に、スピーチ信号の場合において、受信された音響信号の帯域幅の拡張が有利である。結果として、検出されたスピーチ行動に該方法を制限することは、所望される計算機能力を低減し、不完全な適合に起因するアーティファクトの存在を回避する。   Steps (a) to (c) of the above method can be repeated only if the desired signal component (eg, speech behavior) is detected in the received acoustic signal. In particular in the case of speech signals, it is advantageous to expand the bandwidth of the received acoustic signal. As a result, limiting the method to detected speech behavior reduces the desired computational power and avoids the presence of artifacts due to imperfect fits.

本発明はまた、コンピュータ上で実行する場合に、上記の方法のステップを行うためのコンピュータ実行可能な命令を有する1つ以上のコンピュータ読み取り可能な媒体を備えているコンピュータプログラム製品を提供する。   The present invention also provides a computer program product comprising one or more computer-readable media having computer-executable instructions for performing the above-described method steps when executed on a computer.

さらに、拡張された帯域幅を有する音響信号を提供するための装置が提供され、該装置は、
受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限とを自動的に決定するための帯域幅決定手段と、
所定の広帯域の帯域幅の下限と該現在の帯域幅の下限との間および/または該現在の帯域幅の上限と所定の広帯域の帯域幅の上限との間で、該受信された音響信号を補足するために、少なくとも1つの補足信号を自動的に決定するための補足信号手段であって、該所定の広帯域の帯域幅の下限は、該現在の帯域幅の下限よりも小さく、該所定の広帯域の帯域幅の上限は、該現在の帯域幅の上限よりも大きい、補足信号手段と、
該少なくとも1つの補足信号と、該受信された信号を自動的に組み合わせることにより、拡張された帯域幅を有する音響信号を取得する組み合わせ手段と
を備えている。
Further provided is an apparatus for providing an acoustic signal having an extended bandwidth, the apparatus comprising:
Bandwidth determining means for automatically determining an upper limit and a lower limit of the current bandwidth of the received acoustic signal;
The received acoustic signal between a lower limit of a predetermined wide bandwidth and the lower limit of the current bandwidth and / or between an upper limit of the current bandwidth and an upper limit of the predetermined wide bandwidth. To supplement, supplemental signal means for automatically determining at least one supplemental signal, the lower limit of the predetermined wideband bandwidth being less than the lower limit of the current bandwidth, A supplemental signal means, wherein the upper limit of the broadband bandwidth is greater than the upper limit of the current bandwidth;
The at least one supplemental signal and a combination means for acquiring an acoustic signal having an expanded bandwidth by automatically combining the received signal.

上記の方法に類似して、このような装置は、受信される音響信号の帯域幅を拡張するための有利な方法を提供する。特に、受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限との決定および対応する補足信号の決定に起因して、生じる出力信号の質は、固定されたパラメータを有する帯域幅拡張システムの場合と比較すると増加する。   Similar to the method described above, such a device provides an advantageous method for extending the bandwidth of the received acoustic signal. In particular, due to the determination of the current bandwidth upper limit and current bandwidth lower limit of the received acoustic signal and the determination of the corresponding supplemental signal, the quality of the resulting output signal is a band with fixed parameters. Increased compared to the width expansion system.

補足信号手段は、広帯域の帯域幅の上限と広帯域の帯域幅の下限との間で、広帯域のスペクトル包絡線信号および広帯域の励起信号を決定することにより、スペクトル包絡線信号と励起信号との積が、既定の基準に従うと、受信された音響信号に対応するための手段を備え得る。   The supplemental signal means determines the product of the spectral envelope signal and the excitation signal by determining the broadband spectral envelope signal and the broadband excitation signal between the upper bandwidth limit and the lower bandwidth limit. May be provided with means for responding to the received acoustic signal, according to predetermined criteria.

帯域幅決定手段は、決定された広帯域のスペクトル包絡線信号と、受信された音響信号の長期のパワースペクトルとを比較するように構成され得る。   The bandwidth determining means may be configured to compare the determined broadband spectral envelope signal with the long-term power spectrum of the received acoustic signal.

帯域幅決定手段は、最小周波数および最大周波数を選択するように構成され得、該周波数に対して、長期のパワースペクトルは、決定された広帯域のスペクトル包絡線信号のパワースペクトルに既定の定数を足したものよりも大きいか、または等しい。   The bandwidth determination means may be configured to select a minimum frequency and a maximum frequency, for which the long-term power spectrum adds a predetermined constant to the power spectrum of the determined wideband spectral envelope signal. Is greater than or equal to

上記の装置において、広帯域のスペクトル包絡線信号を決定するための手段は、既定の基準に従って、コードブックから包絡線信号を選択するための手段を備え得る。   In the above apparatus, the means for determining the broadband spectral envelope signal may comprise means for selecting the envelope signal from the codebook according to predetermined criteria.

包絡線信号を選択するための手段は、受信された音響信号を等化するように、かつ既定の距離基準に従って、等化された音響信号に対して最小の距離を有する、特にケプストラム距離を有する包絡線信号をコードブックから選択するように構成され得る。   The means for selecting the envelope signal has a minimum distance to the equalized acoustic signal, in particular a cepstrum distance, so as to equalize the received acoustic signal and according to a predetermined distance criterion An envelope signal may be configured to be selected from a code book.

上記の装置において、コードブックは、複数の組の対応する包絡線信号を備え得、各組は、広帯域の帯域幅の下限と広帯域の帯域幅の上限との間に、広帯域の包絡線信号を備え、該広帯域の帯域幅の下限よりも大きい狭帯域の帯域幅の下限と、該広帯域の帯域幅の上限よりも小さい狭帯域の帯域幅の上限との間に、対応する狭帯域の包絡線信号を備えており、包絡線信号を選択するための手段は、既定の距離基準に従って、等化された音響信号に対して最小距離を有する狭帯域の包絡線信号を決定するように、かつこの組の対応する広帯域の包絡線信号を選択するように構成され得る。   In the above apparatus, the codebook may comprise a plurality of sets of corresponding envelope signals, each set having a broadband envelope signal between a lower bandwidth limit and an upper bandwidth limit. A corresponding narrowband envelope between a lower limit of the narrowband bandwidth that is larger than the lower limit of the wideband bandwidth and an upper limit of the narrowband bandwidth that is smaller than the upper limit of the wideband bandwidth. And means for selecting an envelope signal to determine a narrowband envelope signal having a minimum distance relative to the equalized acoustic signal according to a predetermined distance criterion, and A set of corresponding wideband envelope signals may be selected.

広帯域のスペクトル包絡線信号を決定するための手段は、現在の帯域幅の下限および現在の帯域幅の上限に適合されている適合された狭帯域のコードブック包絡線信号を提供するための手段を備え得る。   The means for determining the wideband spectral envelope signal comprises means for providing a adapted narrowband codebook envelope signal that is adapted to a lower limit of the current bandwidth and an upper limit of the current bandwidth. Can be prepared.

提供するための手段は、受信された音響信号の長期のパワースペクトルを用いて、広帯域のコードブック包絡線信号を処理するように構成され得る。   The means for providing may be configured to process the wideband codebook envelope signal using the long-term power spectrum of the received acoustic signal.

上記の装置において、広帯域の励起信号を決定するための手段は、予測誤差フィルタリングおよび/または非線形特性に基づいて広帯域の励起信号を決定するように構成され得る。   In the above apparatus, the means for determining the broadband excitation signal may be configured to determine the broadband excitation signal based on prediction error filtering and / or nonlinear characteristics.

少なくとも1つの補足信号は、決定された広帯域スペクトル包絡線と、決定された励起信号との積に基づき得、組み合わせ手段は、現在の帯域幅の下限と現在の帯域幅の上限との間の受信された音響信号と、広帯域の帯域幅の下限と現在の帯域幅の下限との間および/または現在の帯域幅の上限と広帯域の帯域幅の上限との間に制限されている少なくとも1つの補足信号とを加算するように構成され得る。   The at least one supplemental signal may be based on a product of the determined wideband spectral envelope and the determined excitation signal, and the combining means receives between the lower limit of the current bandwidth and the upper limit of the current bandwidth And / or at least one supplementary restriction between the lower limit of the wide bandwidth and the lower limit of the current bandwidth and / or between the upper limit of the current bandwidth and the upper limit of the wide bandwidth It may be configured to add the signal.

上記の装置において、手段の少なくとも1つは、該手段の機能の少なくとも一部をケプストラム領域において行うように構成され得る。   In the above apparatus, at least one of the means may be configured to perform at least part of the function of the means in the cepstrum region.

上記の装置の手段は、該手段のそれぞれの機能を、既定の時間間隔で繰り返し行うように構成され得る。   The means of the above apparatus may be configured to repeat each function of the means at predetermined time intervals.

装置は、所望の信号検出器、特にスピーチ検出器をさらに備え得、手段は、所望される信号コンポーネントが受信された音響信号において検出された場合に限り、該手段のそれぞれの機能を行うように構成され得る。   The apparatus may further comprise a desired signal detector, in particular a speech detector, so that the means perform the respective function of the means only if the desired signal component is detected in the received acoustic signal. Can be configured.

本発明は、さらに以下の手段を提供する。   The present invention further provides the following means.

(項目1)
拡張された帯域幅を有する音響信号を提供するための方法であって、
(a) 受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限とを自動的に決定することと、
(b) 該受信された音響信号を補足するために、少なくとも1つの補足信号を、所定の広帯域の帯域幅の下限と該現在の帯域幅の下限との間および/または該現在の帯域幅の上限と所定の広帯域の帯域幅の上限との間で自動的に決定することであって、該所定の広帯域の帯域幅の下限は、該現在の帯域幅の下限よりも小さく、該所定の広帯域の帯域幅の上限は、該現在の帯域幅の上限よりも大きい、ことと、
(c) 該少なくとも1つの補足信号と該受信された音響信号とを自動的に組み合わせることにより、拡張された帯域幅を有する音響信号を取得することと
を包含する、方法。
(Item 1)
A method for providing an acoustic signal having an extended bandwidth, comprising:
(A) automatically determining an upper limit and a lower limit of the current bandwidth of the received acoustic signal;
(B) in order to supplement the received acoustic signal, at least one supplemental signal between a lower limit of a predetermined wide bandwidth and the lower limit of the current bandwidth and / or of the current bandwidth; Automatically determining between an upper limit and an upper limit of a predetermined wideband bandwidth, wherein the lower limit of the predetermined wideband bandwidth is less than the lower limit of the current bandwidth, and the predetermined wideband bandwidth The bandwidth upper limit is greater than the current bandwidth upper limit,
(C) obtaining an acoustic signal having an extended bandwidth by automatically combining the at least one supplemental signal and the received acoustic signal.

(項目2)
上記ステップ(b)は、広帯域のスペクトル包絡線信号および広帯域の励起信号を、上記広帯域の帯域幅の下限と上記広帯域の帯域幅の上限との間で決定することにより、スペクトル包絡線信号と励起信号との積が、既定の基準に従って、上記受信された音響信号に対応することを包含する、項目1に記載の方法。
(Item 2)
The step (b) determines the spectral envelope signal and the excitation by determining the broadband spectral envelope signal and the broadband excitation signal between the lower limit of the broadband bandwidth and the upper limit of the broadband bandwidth. A method according to item 1, comprising a product with a signal corresponding to the received acoustic signal according to a predetermined criterion.

(項目3)
上記ステップ(a)は、上記決定された広帯域のスペクトル包絡線信号と、上記受信された音響信号の長期のパワースペクトルとを比較することを包含する、項目2に記載の方法。
(Item 3)
3. The method of item 2, wherein step (a) comprises comparing the determined broadband spectral envelope signal to a long-term power spectrum of the received acoustic signal.

(項目4)
上記比較するステップは、最小周波数および最大周波数を選択することであって、該周波数に対して、上記長期のパワースペクトルは、上記決定された広帯域のスペクトル包絡線信号のパワースペクトルに既定の定数を足したものより大きいか、または等しい、ことを包含する、項目3に記載の方法。
(Item 4)
The comparing step is to select a minimum frequency and a maximum frequency, for which the long-term power spectrum has a predetermined constant on the power spectrum of the determined wideband spectral envelope signal. 4. The method of item 3, comprising greater than or equal to the sum.

(項目5)
上記広帯域のスペクトル包絡線信号を決定することは、既定の基準に従って、コードブックから包絡線信号を選択することを包含する、項目2〜項目4のうちの1項に記載の方法。
(Item 5)
5. A method according to one of items 2 to 4, wherein determining the broadband spectral envelope signal comprises selecting an envelope signal from a codebook according to predetermined criteria.

(項目6)
上記包絡線信号を選択することは、上記受信された音響信号を等化することと、既定の距離基準に従って該等化された音響信号に対して最小距離を有する、特に最小のケプストラム距離を有する包絡線信号を上記コードブックから選択することとを包含する、項目5に記載の方法。
(Item 6)
Selecting the envelope signal equalizes the received acoustic signal and has a minimum distance to the equalized acoustic signal according to a predetermined distance criterion, in particular a minimum cepstrum distance. 6. The method of item 5, comprising selecting an envelope signal from the codebook.

(項目7)
上記コードブックは、複数の組の対応する包絡線信号を備えており、各組は、上記広帯域の帯域幅の上限と上記広帯域の帯域幅の下限との間に、広帯域の包絡線信号を備え、該広帯域の帯域幅の下限よりも大きい狭帯域の帯域幅の下限と、該広帯域の帯域幅の上限よりも小さい狭帯域の帯域幅の上限との間に、対応する狭帯域の包絡線信号を備えており、
包絡線信号を選択することは、上記既定の距離基準に従って、上記等化された音響信号に対して最小距離を有する狭帯域の包絡線信号を決定することと、この組の上記対応する広帯域の包絡線信号を選択することとを包含する、項目6に記載の方法。
(Item 7)
The codebook includes a plurality of sets of corresponding envelope signals, and each set includes a broadband envelope signal between the upper limit of the broadband bandwidth and the lower limit of the broadband bandwidth. A corresponding narrowband envelope signal between a lower limit of the narrowband bandwidth that is larger than the lower limit of the wideband bandwidth and an upper limit of the narrowband bandwidth that is smaller than the upper limit of the wideband bandwidth With
Selecting an envelope signal includes determining a narrowband envelope signal having a minimum distance relative to the equalized acoustic signal according to the predetermined distance criterion, and the corresponding wideband signal of the set. 7. The method of item 6, comprising selecting an envelope signal.

(項目8)
上記包絡線信号を選択するステップは、上記現在の帯域幅の下限および上記現在の帯域幅の上限に適合されている適合された狭帯域のコードブック包絡線信号を提供することによって先行される、項目7に記載の方法。
(Item 8)
The step of selecting the envelope signal is preceded by providing an adapted narrowband codebook envelope signal that is adapted to the lower limit of the current bandwidth and the upper limit of the current bandwidth, 8. The method according to item 7.

(項目9)
上記提供するステップは、上記受信された音響信号の長期のパワースペクトルを用いて、広帯域のコードブック包絡線信号を処理することを包含する、項目8に記載の方法。
(Item 9)
9. The method of item 8, wherein the providing step comprises processing a wideband codebook envelope signal using a long-term power spectrum of the received acoustic signal.

(項目10)
広帯域の励起信号を決定することは、予測誤差フィルタリングおよび/または非線形特性に基づく、項目2〜項目9のうちの1項に記載の方法。
(Item 10)
10. The method according to one of items 2 to 9, wherein determining the broadband excitation signal is based on prediction error filtering and / or nonlinear characteristics.

(項目11)
上記少なくとも1つの補足信号は、上記決定された広帯域のスペクトル包絡線と、上記決定された広帯域の励起信号との積に基づき、上記ステップ(c)は、上記現在の帯域幅の下限と上記現在の帯域幅の上限との間の上記受信された音響信号と、上記広帯域の帯域幅の下限と該現在の帯域幅の下限との間の帯域、および/または該現在の帯域幅の上限と上記広帯域の帯域幅の上限との間の帯域に制限された該少なくとも1つの補足信号とを加算することを包含する、項目2〜項目10のうちの1項に記載の方法。
(Item 11)
The at least one supplemental signal is based on a product of the determined broadband spectral envelope and the determined broadband excitation signal, and the step (c) includes the lower limit of the current bandwidth and the current The received acoustic signal between the upper bandwidth limit and the bandwidth between the lower bandwidth limit and the lower current bandwidth bandwidth and / or the current upper bandwidth bandwidth and the upper bandwidth bandwidth 11. A method according to one of items 2 to 10, comprising summing the at least one supplemental signal limited to a band between a broadband bandwidth upper limit.

(項目12)
上記ステップのうちの少なくとも1つがケプストラム領域において行われる、項目1〜項目11のうちの1項に記載の方法。
(Item 12)
Item 12. The method of item 1 to item 11, wherein at least one of the steps is performed in a cepstrum region.

(項目13)
上記ステップ(a)〜(c)は、既定の時間間隔で繰り返される、項目1〜項目12のうちの1項に記載の方法。
(Item 13)
13. The method according to one of items 1 to 12, wherein the steps (a) to (c) are repeated at predetermined time intervals.

(項目14)
上記ステップ(a)〜(c)は、所望される信号コンポーネント、特にスピーチ行動が、上記受信された音響信号において検出された場合に限り繰り返される、項目1〜項目13のうちの1項に記載の方法。
(Item 14)
Steps (a) to (c) are repeated as described in one of items 1 to 13, only when a desired signal component, in particular speech behavior, is detected in the received acoustic signal. the method of.

(項目15)
コンピュータ上で実行する場合に、項目1〜項目14のうちの1項に記載の上記方法の上記ステップを行うためのコンピュータ実行可能な命令を有する1つ以上のコンピュータ読み取り可能な媒体を備えている、コンピュータプログラム製品。
(Item 15)
One or more computer-readable media having computer-executable instructions for performing the above steps of the method of claim 1 when executed on a computer. , Computer program products.

(項目16)
拡張された帯域幅を有する音響信号を提供するための装置であって、
受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限とを自動的に決定するための帯域幅決定手段と、
所定の広帯域の帯域幅の下限と該現在の帯域幅の下限との間および/または該現在の帯域幅の上限と所定の広帯域の帯域幅の上限との間で、該受信された音響信号を補足するために、少なくとも1つの補足信号を自動的に決定するための補足信号手段であって、該所定の広帯域の帯域幅の下限は、該現在の帯域幅の下限よりも小さく、該所定の広帯域の帯域幅の上限は、該現在の帯域幅の上限よりも大きい、補足信号手段と、
該少なくとも1つの補足信号と、該受信された信号とを自動的に組み合わせることにより、拡張された帯域幅を有する音響信号を取得するための組み合わせ手段と
を備えている、装置。
(Item 16)
An apparatus for providing an acoustic signal having an extended bandwidth, comprising:
Bandwidth determining means for automatically determining an upper limit and a lower limit of the current bandwidth of the received acoustic signal;
The received acoustic signal between a lower limit of a predetermined wide bandwidth and the lower limit of the current bandwidth and / or between an upper limit of the current bandwidth and an upper limit of the predetermined wide bandwidth. To supplement, supplemental signal means for automatically determining at least one supplemental signal, the lower limit of the predetermined wideband bandwidth being less than the lower limit of the current bandwidth, A supplemental signal means, wherein the upper limit of the broadband bandwidth is greater than the upper limit of the current bandwidth;
An apparatus comprising: combining means for obtaining an acoustic signal having an expanded bandwidth by automatically combining the at least one supplemental signal and the received signal.

(項目17)
上記補足信号手段は、上記広帯域の帯域幅の下限と上記広帯域の帯域幅の上限との間で広帯域のスペクトル包絡線信号および広帯域の励起信号を決定することにより、該スペクトル包絡線信号と該励起信号との積が、既定の基準に従って、上記受信された音響信号に対応する手段を備えている、項目16に記載の装置。
(Item 17)
The supplemental signal means determines the spectral envelope signal and the excitation signal by determining a broadband spectral envelope signal and a broadband excitation signal between a lower limit of the broadband bandwidth and an upper limit of the broadband bandwidth. Item 17. The device of item 16, wherein the product with the signal comprises means corresponding to the received acoustic signal according to a predetermined criterion.

(項目18)
上記帯域幅決定手段は、上記決定された広帯域のスペクトル包絡線信号と、上記受信された音響信号の長期のパワースペクトルとを比較するように構成されている、項目17に記載の装置。
(Item 18)
Item 18. The apparatus of item 17, wherein the bandwidth determining means is configured to compare the determined broadband spectral envelope signal with a long-term power spectrum of the received acoustic signal.

(項目19)
上記帯域幅決定手段は、最小周波数および最大周波数を選択するように構成されており、該周波数に対して、上記長期のパワースペクトルは、上記決定された広帯域のスペクトル包絡線信号のパワースペクトルに既定の定数を足したものよりも大きいか、または等しい、項目18に記載の装置。
(Item 19)
The bandwidth determining means is configured to select a minimum frequency and a maximum frequency, and for the frequency, the long-term power spectrum is predetermined as a power spectrum of the determined broadband spectrum envelope signal. Item 19. The device of item 18, wherein the device is greater than or equal to a constant of

(項目20)
広帯域のスペクトル包絡線信号を決定するための上記手段は、既定の基準に従って、コードブックから包絡線信号を選択するための手段を備えている、項目17〜項目19のうちの1項に記載の装置。
(Item 20)
Item 20. The item of items 17-19, wherein the means for determining a broadband spectral envelope signal comprises means for selecting an envelope signal from a codebook according to predetermined criteria. apparatus.

(項目21)
包絡線信号を選択するための上記手段は、上記受信された音響信号を等化するように、かつ既定の距離基準に従って、該等化された音響信号に対して最小の距離を有する、特に最小のケプストラム距離を有する包絡線信号を上記コードブックから選択するように構成されている、項目20に記載の装置。
(Item 21)
The means for selecting an envelope signal has a minimum distance relative to the equalized acoustic signal so as to equalize the received acoustic signal and according to a predetermined distance criterion, in particular a minimum 21. The apparatus of item 20, wherein the apparatus is configured to select an envelope signal having a cepstrum distance of from the codebook.

(項目22)
上記コードブックは、複数の組の対応する包絡線信号を備えており、各組は、上記広帯域の帯域幅の下限と上記広帯域の帯域幅の上限との間に、広帯域の包絡線信号を備え、該広帯域の帯域幅の下限よりも大きい狭帯域の帯域幅の下限と、該広帯域の帯域幅の上限よりも小さい狭帯域の帯域幅の上限との間に、対応する狭帯域の包絡線信号を備えており、
包絡線信号を選択するための上記手段は、上記既定の距離基準に従って、上記等化された音響信号に対して最小距離を有する狭帯域の包絡線信号を決定するように、かつこの組の上記対応する広帯域の包絡線信号を選択するように構成されている、項目21に記載の装置。
(Item 22)
The codebook includes a plurality of sets of corresponding envelope signals, and each set includes a broadband envelope signal between the lower limit of the broadband bandwidth and the upper limit of the broadband bandwidth. A corresponding narrowband envelope signal between a lower limit of the narrowband bandwidth greater than the lower limit of the wideband bandwidth and an upper limit of the narrowband bandwidth smaller than the upper limit of the wideband bandwidth With
The means for selecting an envelope signal is adapted to determine a narrowband envelope signal having a minimum distance relative to the equalized acoustic signal according to the predetermined distance criterion, and for the set of the above Item 22. The device of item 21, wherein the device is configured to select a corresponding broadband envelope signal.

(項目23)
上記広帯域のスペクトル包絡線信号を決定するための手段は、上記現在の帯域幅の下限および上記現在の帯域幅の上限に適合されている適合された狭帯域のコードブック包絡線信号を提供するための手段を備えている、項目22に記載の装置。
(Item 23)
The means for determining the wideband spectral envelope signal provides a adapted narrowband codebook envelope signal that is adapted to the lower limit of the current bandwidth and the upper limit of the current bandwidth. Item 23. The apparatus according to Item 22, comprising the following means.

(項目24)
上記提供するための手段は、上記受信された音響信号の長期のパワースペクトルを用いて、上記広帯域のコードブック包絡線信号を処理するように構成されている、項目23に記載の装置。
(Item 24)
24. The apparatus of item 23, wherein the means for providing is configured to process the broadband codebook envelope signal using a long-term power spectrum of the received acoustic signal.

(項目25)
広帯域の励起信号を決定するための上記手段は、予測誤差フィルタリングおよび/または非線形特性に基づいて該広帯域の励起信号を決定するように構成されている、項目17〜項目24のうちの1項に記載の装置。
(Item 25)
Item 1 to Item 24 wherein the means for determining a broadband excitation signal is configured to determine the broadband excitation signal based on prediction error filtering and / or nonlinear characteristics. The device described.

(項目26)
上記少なくとも1つの補足信号は、上記決定された広帯域のスペクトル包絡線と、上記決定された広帯域の励起信号との積に基づき、上記組み合わせ手段は、上記現在の帯域幅の下限と上記現在の帯域幅の上限との間の上記受信された音響信号と、上記広帯域の帯域幅の下限と該現在の帯域幅の下限との間の帯域、および/または該現在の帯域幅の上限と上記広帯域の帯域幅の上限との間の帯域に制限された該少なくとも1つの補足信号とを加算するように構成されている、項目17〜項目25のうちの1項に記載の装置。
(Item 26)
The at least one supplemental signal is based on a product of the determined broadband spectral envelope and the determined broadband excitation signal, and the combining means includes a lower limit of the current bandwidth and the current bandwidth. The received acoustic signal between the upper limit of the width, the band between the lower limit of the wide bandwidth and the lower limit of the current bandwidth, and / or the upper limit of the current bandwidth and the wide band 26. The apparatus according to one of items 17 to 25, wherein the apparatus is configured to add the at least one supplemental signal limited to a band between an upper bandwidth limit.

(項目27)
上記手段の少なくとも1つは、該手段の機能の少なくとも一部を、上記ケプストラム領域において行うように構成されている、項目16〜項目26のうちの1項に記載の装置。
(Item 27)
27. Apparatus according to one of items 16 to 26, wherein at least one of said means is arranged to perform at least part of the function of said means in said cepstrum region.

(項目28)
上記手段は、該手段のそれぞれの機能を、既定の時間間隔で繰り返し行うように構成されている、項目16〜項目27のうちの1項に記載の装置。
(Item 28)
28. The apparatus according to one of items 16 to 27, wherein the means is configured to repeatedly perform each function of the means at a predetermined time interval.

(項目29)
所望される信号検出器、特にスピーチ検出器をさらに備えており、上記手段は、所望される信号コンポーネントが上記受信された音響信号において検出された場合に限り、該手段のそれぞれの機能を行うように構成されている、項目16〜項目28のうちの1項に記載の装置。
(Item 29)
Further comprising a desired signal detector, in particular a speech detector, said means performing the respective function of said means only if the desired signal component is detected in said received acoustic signal. 29. The apparatus according to one of items 16 to 28, wherein the device is configured as follows.

(摘要)
本発明は、拡張された帯域幅を有する音響信号を提供するための方法に向けられ、該方法は、受信された音響信号の現在の帯域幅の上限と、現在の帯域幅の下限とを自動的に決定することと、受信された音響信号を補足するために、少なくとも1つの補足信号を、所定の広帯域の帯域幅の下限と現在の帯域幅の下限との間および/または現在の帯域幅の上限と所定の広帯域の帯域幅の上限との間で自動的に決定することであって、該所定の広帯域の帯域幅の下限は、該現在の帯域幅の下限よりも小さく、該所定の広帯域の帯域幅の上限は、該現在の帯域幅の上限よりも大きい、ことと、該少なくとも1つの補足信号と該受信された音響信号とを自動的に組み合わせることにより、拡張された帯域幅を有する音響信号を取得することとを包含する。
(Summary)
The present invention is directed to a method for providing an acoustic signal having an extended bandwidth, the method automatically automating a current bandwidth upper limit and a current bandwidth lower limit of a received acoustic signal. In order to determine and supplement the received acoustic signal at least one supplemental signal between a predetermined lower bandwidth limit and a lower current bandwidth limit and / or a current bandwidth The lower limit of the predetermined wideband bandwidth is smaller than the lower limit of the current bandwidth, and the predetermined upper limit of the predetermined wideband bandwidth The broadband bandwidth upper limit is greater than the current bandwidth upper limit, and automatically combining the at least one supplemental signal and the received acoustic signal to increase the expanded bandwidth. Obtaining an acoustic signal having .

本発明のさらなる特徴および利点は、以下に、図面を参照して記載される。   Further features and advantages of the invention are described below with reference to the drawings.

図1は、拡張された帯域幅を有する音響信号を提供するための装置における信号フローの構造を示す。図2は、拡張された帯域幅を有する音響信号を提供するための方法の例を図示するフロー図であり、該方法は、図1に対応する装置によって行われ得る。このことを考慮して、図1および図2は、以下に、同時に記載される。   FIG. 1 shows the structure of signal flow in an apparatus for providing an acoustic signal having an extended bandwidth. FIG. 2 is a flow diagram illustrating an example of a method for providing an acoustic signal having an extended bandwidth, which may be performed by an apparatus corresponding to FIG. In view of this, FIGS. 1 and 2 are simultaneously described below.

ステップ201に従って、音響信号(例えば、スピーチ信号)が、電話線を介して受信される。電話線帯域幅は制限されているので、帯域幅の拡張が、信号の質を向上させるために所望される。従って、既定のより広い帯域幅を取得するために、信号が増加されるべきである。以下に記載される方法は、入力信号のタイプに依存せず、かつ送信線のタイプに依存しない(すなわち電話線が存在する必要がない)帯域幅の拡張のために使用され得ることが理解されるべきである。   According to step 201, an acoustic signal (eg, a speech signal) is received over a telephone line. Since telephone line bandwidth is limited, bandwidth expansion is desired to improve signal quality. Therefore, the signal should be increased to obtain a predefined wider bandwidth. It will be appreciated that the methods described below can be used for bandwidth expansion independent of the type of input signal and independent of the type of transmission line (ie, no telephone line need be present). Should be.

ブロック101によって受信された音響信号x(n)は、既定の広帯域または狭帯域の帯域幅まで、サンプリングレートを増加させることによって、既に予め処理されている。しかしながら、このようにして、追加の周波数コンポーネントは生成されない。このことは、例えば、適切なアンチエイリアシングフィルタまたはアンチイメージングフィルタを用いて達成され得る。この種の帯域幅の拡張は、好ましくは、「ミッシング」周波数領域に対してのみ行われ;アナログの電話線の場合には、これらの領域は0Hzから300Hzまでの間であり得、3400Hzから所望されるサンプリングレートの半分まで(例えば、3700Hzまで)であり得る。   The acoustic signal x (n) received by block 101 has already been pre-processed by increasing the sampling rate to a predetermined wideband or narrowband bandwidth. However, in this way no additional frequency component is generated. This can be accomplished, for example, using a suitable anti-aliasing filter or anti-imaging filter. This type of bandwidth expansion is preferably done only for the “missing” frequency region; in the case of analog telephone lines, these regions can be between 0 Hz and 300 Hz and are desired from 3400 Hz to It can be up to half the sampling rate (eg, up to 3700 Hz).

結果として生じる信号x(n)(nは時間変数を示している)から、信号ベクトル   From the resulting signal x (n), where n represents a time variable, a signal vector

Figure 0005150165
が生成される(ステップ202)。このことは、特定の長さになるまでrごとにサンプリング値をとることによって、達成され得る。従って、Nana個のエレメントを有する信号ベクトルは以下:
Figure 0005150165
Is generated (step 202). This can be achieved by taking a sampling value every r until a specific length is reached. Thus, a signal vector with Nana elements is:

Figure 0005150165
の形式を有する。
Figure 0005150165
Has the form

隣接する信号ベクトル間にオーバーラップが存在し得ることが注意されるべきである。11.025kHzの所望される、または最終的なサンプリングレートに対して、以下の値:
r=64、
ana=256
がとられ得る。
It should be noted that there can be overlap between adjacent signal vectors. For a desired or final sampling rate of 11.025 kHz, the following values:
r = 64,
Nana = 256
Can be taken.

その後(ステップ203)、ウィンドウイング(windowing)手順が、信号ベクトル上で行われることにより、ウィンドウイングされた信号ベクトル   Thereafter (step 203), a windowing procedure is performed on the signal vector so that a windowed signal vector is obtained.

Figure 0005150165
Figure 0005150165

Figure 0005150165
が取得される。
Figure 0005150165
Is acquired.

ウィンドウ行列   Window matrix

Figure 0005150165
は、
Figure 0005150165
Is

Figure 0005150165
の形式の対角行列である。
Figure 0005150165
Is a diagonal matrix of the form

この行列の要素は、異なる種のウィンドウに対応するように選択され得る。典型的なウィンドウは、ハニングまたはハミングウィンドウである。重みつきの信号ベクトルは、離散フーリエ変換:   The elements of this matrix can be selected to correspond to different types of windows. A typical window is a Hanning or Hamming window. The weighted signal vector is a discrete Fourier transform:

Figure 0005150165
を用いて、フーリエ領域に変換される。
Figure 0005150165
Is converted into the Fourier domain.

結果として生じる短期のスペクトルベクトルは、形式:   The resulting short-term spectral vector has the form:

Figure 0005150165
を有し、ここで、Ωμは、周波数変数を示す。
Figure 0005150165
Where Ω μ denotes a frequency variable.

スペクトルベクトルに基づいて、受信された音響信号の長期のパワースペクトルが、ブロック102において決定される(ステップ204)。このような長期のパワースペクトルを推定するためには異なる可能性がある。1つの代替案に従って、一次の帰納的平滑化が、サブバンド信号   Based on the spectral vector, a long-term power spectrum of the received acoustic signal is determined at block 102 (step 204). There are different possibilities for estimating such a long-term power spectrum. According to one alternative, first order recursive smoothing is applied to the subband signal.

Figure 0005150165
の絶対値の二乗において行われる。
Figure 0005150165
This is done in the square of the absolute value of.

Figure 0005150165
好ましくは、時間定数βfreは、1に近い(0≪βfre<1)ように選択されることにより、十分に大きい平均時間が取得される。
Figure 0005150165
Preferably, the time constant β fre is selected to be close to 1 (0 << β fre <1), thereby obtaining a sufficiently large average time.

原則として、上式の1行目に従った帰納的平滑化は、連続的に行われ得る。しかしながら、任意のアーティファクトを避けるために、所望される信号コンポーネントが受信された音響信号内に存在する場合(例えば、スピーチ行動が検出された場合)に限り、帰納的平滑化が行われ得る。この目的のために、スピーチ検出器は、例えば、E.Haensler、G.Schmidt著「Acoustic Echo and Noise Control−A Practical Approach」、米国、ニュージャージー州Hoboken、2004年、Wileyに記載されるように提供され得る。   In principle, the recursive smoothing according to the first line of the above equation can be performed continuously. However, to avoid any artifacts, recursive smoothing can be performed only if the desired signal component is present in the received acoustic signal (eg, when speech behavior is detected). For this purpose, a speech detector is for example described in E.I. Haensler, G.M. As described by Schmidt, “Acoustic Echo and Noise Control-A Practical Approach”, Hoboken, NJ, 2004, Wiley.

さらなる処理を単純化するために、長期のパワースペクトルは、所定の周波数帯域内の長期パワーに正規化され得る。   To simplify further processing, the long-term power spectrum can be normalized to long-term power within a predetermined frequency band.

Figure 0005150165
帯域限界
Figure 0005150165
Bandwidth limit

Figure 0005150165
は、所定の周波数帯域の下限および上限を示す。例えば、この周波数帯域は、本方法が使用されるべきである最小の帯域幅を有する電話帯域に対応し得る(例えば、限界は400Hzおよび3300Hzであり得る)。好ましくは、限界は帯域に対応し、帯域は狭い周波数帯域の周波数帯域より小さいかまたはほぼ等しく、該狭い周波数帯域内で、以下に記載されるコードブックが、学習されている。これらの限界はΩおよびΩによって示されている。
Figure 0005150165
Indicates the lower and upper limits of the predetermined frequency band. For example, this frequency band may correspond to the telephone band having the smallest bandwidth that the method should be used (eg, the limits may be 400 Hz and 3300 Hz). Preferably, the limit corresponds to a band, which is less than or approximately equal to the frequency band of the narrow frequency band, within which the codebook described below is learned. These limits are indicated by Ω l and Ω u .

あるいは、周波数領域における長期のパワースペクトルを決定するために、推定が時間領域において同様に行われ得る。この目的のために、自己相関が、オフセットの約10〜20のサンプリングサイクルに対して推定される。その後、予測係数が、LPC(線形予測コーディング)解析を用いて決定され得る。長期のパワースペクトルは、離散フーリエ関数および除法を介して取得される。   Alternatively, estimation can be done in the time domain as well to determine a long-term power spectrum in the frequency domain. For this purpose, autocorrelation is estimated for approximately 10-20 sampling cycles of offset. The prediction coefficients can then be determined using LPC (Linear Predictive Coding) analysis. The long-term power spectrum is obtained via a discrete Fourier function and division.

ブロック103(ステップ205)において、音響信号は等化される。等化:   In block 103 (step 205), the acoustic signal is equalized. Equalization:

Figure 0005150165
は、上で決定されたスペクトルベクトルに対して行われる。
Figure 0005150165
Is performed on the spectral vector determined above.

等化行列   Equalization matrix

Figure 0005150165
は形式
Figure 0005150165
Is the format

Figure 0005150165
の対角行列であり、エントリ
Figure 0005150165
A diagonal matrix of entries

Figure 0005150165
を有する。上記の数式において、
Figure 0005150165
Have In the above formula,

Figure 0005150165
は、受信された音響信号の現在の帯域幅の下限および上限を示す。従って、アップデートされ等化された信号を取得するために、時間(n−1)における帯域幅の限界は、現在の帯域幅の限界をとる。さらに、
Figure 0005150165
Indicates the lower and upper limits of the current bandwidth of the received acoustic signal. Thus, to obtain an updated and equalized signal, the bandwidth limit at time (n−1) takes the current bandwidth limit. further,

Figure 0005150165
は、広帯域の信号の正規化された長期のパワースペクトルを示し、これは、コードブックの学習のために使用されている。このようなパワースペクトルの正規化は、上記の受信された音響信号の長期のパワースペクトルの場合に類似して行われる。コードブックを学習するために使用されるこのような正規化された長期のパワースペクトルに対する例が、図3に示される。
Figure 0005150165
Indicates the normalized long-term power spectrum of a wideband signal, which is used for codebook learning. Such normalization of the power spectrum is performed similarly to the case of the long-term power spectrum of the received acoustic signal. An example for such a normalized long-term power spectrum used to learn a codebook is shown in FIG.

等化は、最小値および最大値、例えば、
eq,min=−12dB
eq,max=12dB
に制限される。
Equalization is a minimum and maximum value, for example
H eq, min = -12 dB
H eq, max = 12 dB
Limited to

上記から見られ得るように、音響信号は、現在の帯域幅の限界内でのみ1つ前の時間ステップで等化される。これらの帯域幅の外側では、等化は行われない。   As can be seen from the above, the acoustic signal is equalized at the previous time step only within the limits of the current bandwidth. No equalization is performed outside these bandwidths.

以下において、広帯域のスペクトル包絡線を決定することが、より詳細に記載される。受信された音響信号に対応する包絡線信号がコードブックを用いて決定される。使用されるコードブックは、多くのペアの対応する狭帯域および広帯域の包絡線信号を備えている。コードブックは、長期のパワースペクトルの開始に基づいて、大きなデータベースを用いて学習することにより、取得された(Y.Linde,A.Buzo,R.M.Gray「An Algorithm for Vector Quantizer Design」、1980年1月、IEEE Trans.Comm.、COM−28巻、No.1、84−95ページを参照)。   In the following, determining the broadband spectral envelope will be described in more detail. An envelope signal corresponding to the received acoustic signal is determined using a code book. The codebook used has many pairs of corresponding narrowband and wideband envelope signals. The codebook was acquired by learning using a large database based on the start of a long-term power spectrum (Y. Linde, A. Buzo, RM Gray “An Algorithm for Vector Quantizer Design”, January 1980, see IEEE Trans. Comm., COM-28, No. 1, pages 84-95).

図2に示されるように、コードブックエントリは、ステップ206(ブロック104)において適合される。特に、狭帯域のコードブックエントリ   As shown in FIG. 2, the codebook entry is adapted at step 206 (block 104). In particular, narrowband codebook entries

Figure 0005150165
が適合される。
Figure 0005150165
Is adapted.

このことは、コードブックの広帯域のエントリを開始することによって達成される。広帯域の包絡線信号が、ケプストラムベクトル   This is accomplished by initiating a broadband entry in the codebook. The broadband envelope signal is the cepstrum vector

Figure 0005150165
として提供される場合には、対応するスペクトル
Figure 0005150165
If provided as the corresponding spectrum

Figure 0005150165
が決定される。これらの広帯域のスペクトル包絡線に基づいて、適合されたまたは最適化された狭帯域のスペクトルが、重みづけ行列と掛けることによって決定される。
Figure 0005150165
Is determined. Based on these broadband spectral envelopes, an adapted or optimized narrowband spectrum is determined by multiplying with a weighting matrix.

Figure 0005150165
重みづけ行列は、形式:
Figure 0005150165
The weighting matrix has the form:

Figure 0005150165
で、エントリ
Figure 0005150165
And the entry

Figure 0005150165
を有する対角行列である。
Figure 0005150165
Is a diagonal matrix.

その後、ケプストラムベクトルは、結果として生じるスペクトル狭帯域包絡線から決定される。   The cepstrum vector is then determined from the resulting spectral narrowband envelope.

スペクトルベクトルからケプストラムベクトルへ変換することおよびその逆は、ステップ207に関して以下に記載され、ステップ207において、広帯域のスペクトル包絡線が決定される(ブロック105)。   The conversion from a spectral vector to a cepstrum vector and vice versa is described below with respect to step 207, where a broadband spectral envelope is determined (block 105).

音響信号に最良にマッチするコードブックからの広帯域のスペクトル包絡線は、(等化の後に)狭帯域のコードブックエントリと音響信号のスペクトルの包絡線とを比較することによって決定される。狭帯域のコードブックエントリは、音響信号スペクトルに対して小さい距離を有するように選択される。原則として、異なる距離基準が使用され得る。ケプストラム距離は、コードブックエントリがケプストラムベクトルの形式で提供されるので、特に有用である。   The broadband spectral envelope from the codebook that best matches the acoustic signal is determined by comparing the narrowband codebook entry (after equalization) with the spectral envelope of the acoustic signal. The narrowband codebook entry is selected to have a small distance to the acoustic signal spectrum. In principle, different distance criteria can be used. Cepstrum distance is particularly useful because codebook entries are provided in the form of cepstrum vectors.

最適な狭帯域のコードブックエントリが選択された際に、対応する広帯域のコードブックエントリは、受信された音響信号に対する最適な広帯域のスペクトル包絡線として決定される。上記したように、広帯域のコードブックエントリの適合に起因して、最適な狭帯域の包絡線は、非常に信頼できる方法で選択され得る。   When the optimal narrowband codebook entry is selected, the corresponding wideband codebook entry is determined as the optimal wideband spectral envelope for the received acoustic signal. As mentioned above, due to the adaptation of the wideband codebook entry, the optimal narrowband envelope can be selected in a very reliable manner.

特に受信された音響信号のスペクトルベクトルをケプストラムベクトルに変換することは、以下によって達成される。
1.各サブバンド信号
In particular, converting the spectral vector of the received acoustic signal into a cepstrum vector is accomplished by:
1. Each subband signal

Figure 0005150165
の二乗された絶対値を決定すること。
2.このベクトルに逆離散フーリエ変換を適用することであって、時間領域における自己相関の推定を生じること。
3.レビンソン−ダーバンアルゴリズムを用いて、予測係数(約10〜20の次数を有する)を、自己相関から決定すること。
4.次数に関する帰納を行うことによって、予測係数は、ケプストラム係数を決定するために使用される。通常、次数は予測される次数の1.5倍に対応する。
Figure 0005150165
To determine the squared absolute value of.
2. Applying an inverse discrete Fourier transform to this vector, resulting in an estimation of autocorrelation in the time domain.
3. Determining prediction coefficients (having an order of about 10-20) from autocorrelation using the Levinson-Durban algorithm.
4). By performing induction on the order, the prediction coefficients are used to determine the cepstrum coefficients. Usually, the order corresponds to 1.5 times the expected order.

広帯域のコードブックの最適なケプストラムベクトルは、   The optimal cepstrum vector for a wideband codebook is

Figure 0005150165
によって指定される。結果として生じるスペクトル包絡線は、形式:
Figure 0005150165
Specified by. The resulting spectral envelope has the form:

Figure 0005150165
を有する。
Figure 0005150165
Have

ケプストラムベクトルのスペクトルベクトルへの変換は、以下によって達成される。
1.次数に関する帰納を用いて、ケプストラムベクトルを変換する(上記のように)ことにより、予測誤差フィルタ係数を取得すること。
2.既定の数の0によって予測誤差フィルタベクトルを増加させ、続いて離散フーリエ関数を行うことによって、逆スペクトルを取得すること。
3.各サブバンドコンポーネントの逆数を決定することによって、ベクトル
Conversion of the cepstrum vector to a spectral vector is accomplished by:
1. Obtain the prediction error filter coefficients by transforming the cepstrum vector (as described above) using induction on the order.
2. Obtaining the inverse spectrum by incrementing the prediction error filter vector by a predetermined number of zeros followed by a discrete Fourier function.
3. A vector by determining the reciprocal of each subband component

Figure 0005150165
を生成すること。0による除法は、例えば、適切な定数を追加することによって、個別に扱われる必要がある。
Figure 0005150165
To generate. The division by zero needs to be handled individually, for example by adding appropriate constants.

図4は、4組のエントリを有するコードブックの例を図示する。各図において、対応する元の狭帯域の包絡線および対応する適合された狭帯域の包絡線が示される。元の広帯域および狭帯域のコードブックエントリは、ISDN電話接続に対する大きなデータベースに基づいて取得される。この図において見られるように、適合の後に結果として生じる最適化されたエントリは、より高い上限周波数を有する。このことは、改良された摩擦音の検出を可能にする。   FIG. 4 illustrates an example of a codebook having four sets of entries. In each figure, the corresponding original narrowband envelope and the corresponding adapted narrowband envelope are shown. The original broadband and narrowband codebook entries are obtained based on a large database for ISDN telephone connections. As can be seen in this figure, the resulting optimized entry after fitting has a higher upper frequency limit. This allows for improved frictional sound detection.

ステップ208(ブロック103)において、受信された音響信号に対応する励起信号が生成される。この広帯域の励起信号は、スペクトル的に平坦な包絡線を示す。それは、声帯の後ろで直接的に記録された信号に対応する。   In step 208 (block 103), an excitation signal corresponding to the received acoustic signal is generated. This broadband excitation signal exhibits a spectrally flat envelope. It corresponds to a signal recorded directly behind the vocal cords.

広帯域の励起信号を決定するために、まず、等化された短期のスペクトル   To determine the broadband excitation signal, first the equalized short-term spectrum

Figure 0005150165
のスペクトル包絡線が、予測誤差フィルタ係数の形式で推定される。逆離散フーリエ変換をこのスペクトルベクトルに適用することは、対応する時間信号を決定することを可能にする。その後、時間領域におけるベクトルは、予測誤差フィルタによってフィルタされる。対応するフィルタ係数は、先に決定されているフィルタ係数である。
Figure 0005150165
Are estimated in the form of prediction error filter coefficients. Applying an inverse discrete Fourier transform to this spectral vector makes it possible to determine the corresponding time signal. The vectors in the time domain are then filtered by a prediction error filter. The corresponding filter coefficient is a previously determined filter coefficient.

次いで、非線形特性(例えば、双方向整流またはスクエアリング)が、フィルタされた時間領域ベクトルに適用される。このことはミッシング低周波数および高周波数信号コンポーネントを生成する。フーリエ領域における変換は、拡張された励起信号のスペクトル   Non-linear characteristics (eg, bi-directional rectification or squaring) are then applied to the filtered time domain vector. This creates missing low frequency and high frequency signal components. The transform in the Fourier domain is the expanded spectrum of the excitation signal

Figure 0005150165
を提供する。
Figure 0005150165
I will provide a.

あるいは、励起信号を決定することは、時間サブバンドまたはフーリエ領域において同様に行われ得る。この代替案に対する例は、B.Iser、G.Schmidt「Bandwidth Extension of Telephony Speech」、2005年6月、Eurasip Newsletter、16巻、Number2、2〜24ページに見出され得る。   Alternatively, determining the excitation signal can be done in the time subband or Fourier domain as well. Examples for this alternative are Iser, G.M. Schmidt “Bandwidth Extension of Telephony Speech”, June 2005, Europe Newsletter, Volume 16, Number 2, pages 2-24.

以下のステップ209(ブロック107)において、広帯域のスペクトル包絡線および励起信号は、励起信号にスペクトル的に着色するために使用される。このことはサブバンドまたはフーリエ領域における掛け算によって達成され得る:   In the following step 209 (block 107), the broadband spectral envelope and the excitation signal are used to spectrally color the excitation signal. This can be accomplished by multiplication in the subband or Fourier domain:

Figure 0005150165
対角行列
Figure 0005150165
Diagonal matrix

Figure 0005150165
は、形式:
Figure 0005150165
The format:

Figure 0005150165
を有する。
Figure 0005150165
Have

励起信号を生成するときに、非線形性または予測誤差フィルタリングによって、音響信号のパワーは、維持される必要が無い。それゆえ、パワー適合が行われ得る:   When generating the excitation signal, the power of the acoustic signal need not be maintained due to non-linearity or prediction error filtering. Therefore, power adaptation can be performed:

Figure 0005150165
補正率Kは、以下のように選択され得、
Figure 0005150165
The correction factor K can be selected as follows:

Figure 0005150165
ここで
Figure 0005150165
here

Figure 0005150165
は、上記の長期のパワースペクトルの推定における場合と同一の帯域幅の限界を示す。
Figure 0005150165
Indicates the same bandwidth limit as in the long-term power spectrum estimation described above.

現在の帯域幅の限界は、ステップ210(ブロック108)において適合される。1つの可能性に従って、帯域幅の限界は、受信された音響信号のスペクトルと所定の定数を引かれている広帯域のスペクトル包絡線との比較の開始で決定される:   The current bandwidth limit is met at step 210 (block 108). According to one possibility, the bandwidth limit is determined at the start of a comparison between the spectrum of the received acoustic signal and a broadband spectral envelope that is subtracted by a predetermined constant:

Figure 0005150165
パラメータKは、値:
=−12dB
を有し得る。
Figure 0005150165
Parameter K C is, the value:
K C = -12 dB
Can have.

図5において、帯域幅の限界を決定するための例が図示される。上記の中間の限界値は、下げられた広帯域のスペクトル包絡線と受信された音響信号のスペクトルとの間の交点によって与えられる。   In FIG. 5, an example for determining bandwidth limits is illustrated. The above intermediate limit is given by the intersection between the lowered broadband spectral envelope and the spectrum of the received acoustic signal.

これらの中間の限界値は、帰納的に平滑化され、時間的な不完全推定を除去し得る。この場合において、好ましくは、平滑化は、現在の信号フレーム中にスピーチ行動が検出される場合に限り行われる。   These intermediate limits can be smoothed recursively to remove incomplete temporal estimates. In this case, preferably smoothing is performed only if speech behavior is detected in the current signal frame.

Figure 0005150165
次いで、受信された音響信号は、適応帯域通過フィルタを通過し、現在の帯域幅の限界内のコンポーネントのみを保持し(ブロック109)、スペクトルベクトル
Figure 0005150165
The received acoustic signal is then passed through an adaptive bandpass filter, retaining only the components within the current bandwidth limit (block 109), and the spectral vector.

Figure 0005150165
が取得される。同様に、スペクトル的に着色された励起信号は、補足的な適応帯域消去フィルタを通過する(ブロック110)ことにより、ベクトル
Figure 0005150165
Is acquired. Similarly, the spectrally colored excitation signal is passed through a supplemental adaptive band elimination filter (block 110) to produce a vector.

Figure 0005150165
が取得される。
Figure 0005150165
Is acquired.

これら2つのスペクトルベクトルの加算を開始することによって、標準の帯域幅を有する出力信号が生成される(ステップ211):   By starting the addition of these two spectral vectors, an output signal having a standard bandwidth is generated (step 211):

Figure 0005150165
これらのベクトルのコンポーネントは:
Figure 0005150165
These vector components are:

Figure 0005150165
として生成され、ここで、重みづけ行列
Figure 0005150165
Where is the weighting matrix

Figure 0005150165
は、対角行列:
Figure 0005150165
Is a diagonal matrix:

Figure 0005150165
Figure 0005150165

Figure 0005150165
である。
Figure 0005150165
It is.

行列   matrix

Figure 0005150165
の要素は:
Figure 0005150165
The elements of are:

Figure 0005150165
として決定され、補足重みづけ行列の重みは、加算された際に単位行列を生じるように決定される。
Figure 0005150165
And the weights of the supplemental weighting matrix are determined to produce a unit matrix when added.

Figure 0005150165
あるいは、帯域幅限界における遷移が、より平滑な方法で実現され得る。
Figure 0005150165
Alternatively, the transition at the bandwidth limit can be realized in a smoother manner.

結果生じる出力スペクトル   Resulting output spectrum

Figure 0005150165
は、次いで、逆フーリエ変換:
Figure 0005150165
Then the inverse Fourier transform:

Figure 0005150165
を介して時間領域に変換され、結果のベクトルをウィンドウイングすることが続く。特に、Nanaおよびrに対する上記された値およびハニングウィンドウを用いる場合には、このウィンドウ関数が、ウィンドウイングされた時間領域ベクトル:
Figure 0005150165
Followed by windowing the resulting vector. In particular, when using the values and Hanning windows described above for Nana and r, this window function is a windowed time domain vector:

Figure 0005150165
を取得するために再び使用され得る。
Figure 0005150165
Can be used again to get

結果生じる時間領域ベクトルは、次いで、(K.D.Kammeyer、K.Kroschel「Digitale Signalverarbeitung」に記載されるような)オーバーラップ加算法を用いて組み合わされる。   The resulting time domain vectors are then combined using an overlap addition method (as described in KD Kammeyer, K. Kroschel "Digital Signalverbeitung").

本方法の上記のステップにおいて、より複雑なフィルタバンクシステムが、従来の離散フーリエ変換および逆離散フーリエ変換の代わりに使用され得る(例えば、P.P.Vaidyanathan「Multirate Systems and Filter Banks」、Prentice Hall、1992年、米国、ニュージャージー州Englewood Cliffs)。   In the above steps of the method, a more complex filter bank system can be used instead of the conventional discrete Fourier transform and inverse discrete Fourier transform (eg, PP Vaidyanathan “Multirate Systems and Filter Banks”, Parent Hall). 1992, Englewood Cliffs, New Jersey, USA).

上記の変形に対するさらなる代替案も同様に可能である。例えば、フーリエ領域において行われるステップはまた、時間領域においても行われ得る。さらに、音響信号を等化することは、狭帯域のコードブックエントリを適合する際に行われ得る。さらに、上記の等化ステップは、増強させられ得る。例えば、増幅または減衰が、特定の周波数において検出される場合には、それは帯域幅限界内で調節され得る。この場合に、出力ベクトル   Further alternatives to the above variants are possible as well. For example, steps performed in the Fourier domain can also be performed in the time domain. Furthermore, equalizing the acoustic signal can be done in adapting a narrowband codebook entry. Furthermore, the above equalization step can be enhanced. For example, if amplification or attenuation is detected at a particular frequency, it can be adjusted within bandwidth limits. In this case, the output vector

Figure 0005150165
は、重みづけ行列
Figure 0005150165
Is the weighting matrix

Figure 0005150165
を用いて変更される。
Figure 0005150165
It is changed using.

広帯域のスペクトル包絡線に対する上記のコードブック解析に加えて、いわゆる線形写像(B.Iser、G.Schmidt、「Bandwidth Extension of Telephoyny Speech」を参照)が追加的に使用され得る。   In addition to the above codebook analysis for broadband spectral envelopes, so-called linear mappings (see B. Iser, G. Schmidt, “Bandwidth Extension of Telephony Speech”) can additionally be used.

本発明のさらなる変更および変形は、本記載を見ると、当業者にとって明白である。従って、本記載は、単なる例示として、かつ本発明を実行する一般的な方法を当業者に教示する目的のためであるとして解釈されるべきである。本明細書において示され、記載された本発明の形式は、本好ましい実施形態として捉えられるべきであることが理解されるべきである。   Further modifications and variations of the present invention will be apparent to those skilled in the art upon review of this description. Accordingly, this description is to be construed as illustrative only and is for the purpose of teaching those skilled in the art the general manner of carrying out the invention. It should be understood that the form of the invention shown and described herein is to be taken as the presently preferred embodiment.

図1は、拡張された帯域幅を有する音響信号を提供するための装置の例の構造を図示する。FIG. 1 illustrates the structure of an example apparatus for providing an acoustic signal having an extended bandwidth. 図2は、拡張された帯域幅を有する音響信号を提供するための方法の例のフロー図である。FIG. 2 is a flow diagram of an example method for providing an acoustic signal having an extended bandwidth. 図3は、コードブックを学習するための正規化された長期のパワースペクトルの例を図示する。FIG. 3 illustrates an example of a normalized long-term power spectrum for learning a codebook. 図4は、コードブックエントリの例を図示する。FIG. 4 illustrates an example of a codebook entry. 図5は、現在の帯域幅の限界の決定を図示する。FIG. 5 illustrates the determination of the current bandwidth limit. 図6は、従来技術のシステムの構造を図示する。FIG. 6 illustrates the structure of a prior art system.

Claims (23)

拡張された帯域幅を有する音響信号を提供するための方法であって、
(a) 受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限とを自動的に決定することと、
(b) 該受信された音響信号を補足するために、少なくとも1つの補足信号を、所定の広帯域の帯域幅の下限と該現在の帯域幅の下限との間および/または該現在の帯域幅の上限と所定の広帯域の帯域幅の上限との間で自動的に決定することであって、該所定の広帯域の帯域幅の下限は、該現在の帯域幅の下限よりも小さく、該所定の広帯域の帯域幅の上限は、該現在の帯域幅の上限よりも大きい、ことと、
(c) 該少なくとも1つの補足信号と該受信された音響信号とを自動的に組み合わせることにより、拡張された帯域幅を有する音響信号を取得することと
を包含し、
該ステップ(b)は、広帯域のスペクトル包絡線信号および広帯域の励起信号を、該広帯域の帯域幅の下限と該広帯域の帯域幅の上限との間で決定することにより、スペクトル包絡線信号と励起信号との積が、既定の基準に従って、該受信された音響信号に対応するようにすることを包含し、
該ステップ(a)は、該決定された広帯域のスペクトル包絡線信号と、該受信された音響信号のスペクトルとを比較することにより、該現在の帯域幅の上限と該現在の帯域幅の下限とを繰り返し適合させるようにすることを包含し、
該比較するステップは、最小周波数および最大周波数を選択することであって、該周波数に対して、該スペクトルは、該決定された広帯域のスペクトル包絡線信号に既定の定数を足したものより大きいか、または等しい、ことを包含する、方法。
A method for providing an acoustic signal having an extended bandwidth, comprising:
(A) automatically determining an upper limit and a lower limit of the current bandwidth of the received acoustic signal;
(B) in order to supplement the received acoustic signal, at least one supplemental signal between a lower limit of a predetermined wide bandwidth and the lower limit of the current bandwidth and / or of the current bandwidth; Automatically determining between an upper limit and an upper limit of a predetermined wideband bandwidth, wherein the lower limit of the predetermined wideband bandwidth is less than the lower limit of the current bandwidth, and the predetermined wideband bandwidth The bandwidth upper limit is greater than the current bandwidth upper limit,
(C) obtaining an acoustic signal having an extended bandwidth by automatically combining the at least one supplemental signal and the received acoustic signal ;
The step (b) determines the spectral envelope signal and the excitation by determining the broadband spectral envelope signal and the broadband excitation signal between a lower limit of the broadband bandwidth and an upper limit of the broadband bandwidth. Including a product with a signal corresponding to the received acoustic signal according to predetermined criteria,
The step (a) comprises comparing the determined broadband spectral envelope signal with the spectrum of the received acoustic signal to determine the upper limit of the current bandwidth and the lower limit of the current bandwidth. Including repeatedly adapting,
The comparing step is to select a minimum frequency and a maximum frequency, for which the spectrum is greater than the determined wideband spectral envelope signal plus a predetermined constant , Or equal to .
前記広帯域のスペクトル包絡線信号を決定することは、既定の基準に従って、コードブックから包絡線信号を選択することを包含する、請求項に記載の方法。 The method of claim 1 , wherein determining the wideband spectral envelope signal comprises selecting an envelope signal from a codebook according to predetermined criteria. 前記包絡線信号を選択することは、前記受信された音響信号を等化することと、既定の距離基準に従って該等化された音響信号に対して最小距離を有する、特に最小のケプストラム距離を有する包絡線信号を前記コードブックから選択することとを包含する、請求項に記載の方法。 Selecting the envelope signal equalizes the received acoustic signal and has a minimum distance to the equalized acoustic signal according to a predetermined distance criterion, in particular a minimum cepstrum distance. 3. The method of claim 2 , comprising selecting an envelope signal from the codebook. 前記コードブックは、複数の組の対応する包絡線信号を備えており、各組は、前記広帯域の帯域幅の上限と前記広帯域の帯域幅の下限との間に、広帯域の包絡線信号を備え、該広帯域の帯域幅の下限よりも大きい狭帯域の帯域幅の下限と、該広帯域の帯域幅の上限よりも小さい狭帯域の帯域幅の上限との間に、対応する狭帯域の包絡線信号を備えており、
包絡線信号を選択することは、前記既定の距離基準に従って、前記等化された音響信号に対して最小距離を有する狭帯域の包絡線信号を決定することと、この組の前記対応する広帯域の包絡線信号を選択することとを包含する、請求項に記載の方法。
The codebook includes a plurality of sets of corresponding envelope signals, and each set includes a broadband envelope signal between an upper limit of the broadband bandwidth and a lower limit of the broadband bandwidth. A corresponding narrowband envelope signal between a lower limit of the narrowband bandwidth that is larger than the lower limit of the wideband bandwidth and an upper limit of the narrowband bandwidth that is smaller than the upper limit of the wideband bandwidth With
Selecting an envelope signal includes determining a narrowband envelope signal having a minimum distance relative to the equalized acoustic signal according to the predetermined distance criterion, and the corresponding wideband signal of the set. 4. The method of claim 3 , comprising selecting an envelope signal.
前記包絡線信号を選択するステップは、前記現在の帯域幅の下限および前記現在の帯域幅の上限に適合されている適合された狭帯域のコードブック包絡線信号を提供することによって先行される、請求項に記載の方法。 Selecting the envelope signal is preceded by providing an adapted narrowband codebook envelope signal that is adapted to the lower limit of the current bandwidth and the upper limit of the current bandwidth; The method of claim 4 . 前記提供するステップは、前記受信された音響信号の長期のパワースペクトルを用いて、広帯域のコードブック包絡線信号を処理することを包含する、請求項に記載の方法。 6. The method of claim 5 , wherein the providing step includes processing a wideband codebook envelope signal using a long-term power spectrum of the received acoustic signal. 広帯域の励起信号を決定することは、予測誤差フィルタリングおよび/または非線形特性に基づく、請求項〜請求項のうちの1項に記載の方法。 It is based on prediction error filtering and / or non-linear characteristics, the method according to one of the claims 1 to 6 for determining a broadband excitation signal. 前記少なくとも1つの補足信号は、前記決定された広帯域のスペクトル包絡線と、前記決定された広帯域の励起信号との積に基づき、前記ステップ(c)は、前記現在の帯域幅の下限と前記現在の帯域幅の上限との間の前記受信された音響信号と、前記広帯域の帯域幅の下限と該現在の帯域幅の下限との間の帯域、および/または該現在の帯域幅の上限と前記広帯域の帯域幅の上限との間の帯域に制限された該少なくとも1つの補足信号とを加算することを包含する、請求項〜請求項のうちの1項に記載の方法。 The at least one supplemental signal is based on a product of the determined broadband spectral envelope and the determined broadband excitation signal, and the step (c) includes the lower limit of the current bandwidth and the current The received acoustic signal between the upper bandwidth limit and the bandwidth between the lower bandwidth limit and the lower bandwidth limit and / or the current bandwidth upper limit and said at least limited to a band between the upper limit of the bandwidth of the wideband involves adding the single supplemental signal method as recited in one of claims 1 to 7. 前記ステップのうちの少なくとも1つがケプストラム領域において行われる、請求項1〜請求項のうちの1項に記載の方法。 The method according to one of claims 1 to 8 , wherein at least one of the steps is performed in a cepstrum region. 前記ステップ(a)〜(c)は、既定の時間間隔で繰り返される、請求項1〜請求項のうちの1項に記載の方法。 Wherein step (a) ~ (c) are repeated at predetermined time intervals, The method as recited in one of claims 1 to 9. 前記ステップ(a)〜(c)は、所望される信号コンポーネント、特にスピーチ行動が、前記受信された音響信号において検出された場合に限り繰り返される、請求項1〜請求項10のうちの1項に記載の方法。 Wherein step (a) ~ (c) is desired signal component, in particular a speech act, the repeated only if it is detected in the received acoustic signal, one of Claim 1 to claim 10 The method described in 1. コンピュータ上で実行する場合に、請求項1〜請求項11のうちの1項に記載の前記方法の前記ステップを行うためのコンピュータ実行可能な命令を記録したコンピュータ読み取り可能な記録体。 When running on a computer, according to claim 1 wherein the computer-readable recording medium body computer-executable instructions for performing the steps of the method according to one of the claims 11. 拡張された帯域幅を有する音響信号を提供するための装置であって、
受信された音響信号の現在の帯域幅の上限と現在の帯域幅の下限とを自動的に決定するための帯域幅決定手段と、
所定の広帯域の帯域幅の下限と該現在の帯域幅の下限との間および/または該現在の帯域幅の上限と所定の広帯域の帯域幅の上限との間で、該受信された音響信号を補足するために、少なくとも1つの補足信号を自動的に決定するための補足信号手段であって、該所定の広帯域の帯域幅の下限は、該現在の帯域幅の下限よりも小さく、該所定の広帯域の帯域幅の上限は、該現在の帯域幅の上限よりも大きい、補足信号手段と、
該少なくとも1つの補足信号と、該受信された信号とを自動的に組み合わせることにより、拡張された帯域幅を有する音響信号を取得するための組み合わせ手段と
を備えており、
該補足信号手段は、該広帯域の帯域幅の下限と該広帯域の帯域幅の上限との間で広帯域のスペクトル包絡線信号および広帯域の励起信号を決定することにより、該スペクトル包絡線信号と該励起信号との積が、既定の基準に従って、該受信された音響信号に対応するようにする手段を備えており、
該帯域幅決定手段は、該決定された広帯域のスペクトル包絡線信号と、該受信された音響信号のスペクトルとを比較することにより、該現在の帯域幅の上限と該現在の帯域幅の下限とを繰り返し適合させるように構成されており、
該帯域幅決定手段は、最小周波数および最大周波数を選択するように構成されており、該周波数に対して、該スペクトルは、該決定された広帯域のスペクトル包絡線信号に既定の定数を足したものよりも大きいか、または等しい、装置。
An apparatus for providing an acoustic signal having an extended bandwidth, comprising:
Bandwidth determining means for automatically determining an upper limit and a lower limit of the current bandwidth of the received acoustic signal;
The received acoustic signal between a lower limit of a predetermined wide bandwidth and the lower limit of the current bandwidth and / or between an upper limit of the current bandwidth and an upper limit of the predetermined wide bandwidth. To supplement, supplemental signal means for automatically determining at least one supplemental signal, the lower limit of the predetermined wideband bandwidth being less than the lower limit of the current bandwidth, A supplemental signal means, wherein the upper limit of the broadband bandwidth is greater than the upper limit of the current bandwidth;
Combining means for obtaining an acoustic signal having an expanded bandwidth by automatically combining the at least one supplemental signal and the received signal ;
The supplementary signal means determines the spectral envelope signal and the excitation signal by determining a broadband spectral envelope signal and a broadband excitation signal between a lower limit of the broadband bandwidth and an upper limit of the broadband bandwidth. Means for causing a product with the signal to correspond to the received acoustic signal according to a predetermined criterion;
The bandwidth determining means compares the determined broadband spectral envelope signal with the spectrum of the received acoustic signal, thereby determining the upper limit of the current bandwidth and the lower limit of the current bandwidth. Is configured to repeatedly adapt,
The bandwidth determining means is configured to select a minimum frequency and a maximum frequency, for which the spectrum is the determined broadband spectral envelope signal plus a predetermined constant. Greater than or equal to the device.
広帯域のスペクトル包絡線信号を決定するための前記手段は、既定の基準に従って、コードブックから包絡線信号を選択するための手段を備えている、請求項13に記載の装置。 14. The apparatus of claim 13 , wherein the means for determining a broadband spectral envelope signal comprises means for selecting an envelope signal from a codebook according to predetermined criteria. 包絡線信号を選択するための前記手段は、前記受信された音響信号を等化するように、かつ既定の距離基準に従って、該等化された音響信号に対して最小の距離を有する、特に最小のケプストラム距離を有する包絡線信号を前記コードブックから選択するように構成されている、請求項14に記載の装置。 The means for selecting an envelope signal has a minimum distance with respect to the equalized acoustic signal so as to equalize the received acoustic signal and according to a predetermined distance criterion, in particular a minimum 15. The apparatus of claim 14 , wherein the apparatus is configured to select an envelope signal having a cepstrum distance of from the codebook. 前記コードブックは、複数の組の対応する包絡線信号を備えており、各組は、前記広帯域の帯域幅の下限と前記広帯域の帯域幅の上限との間に、広帯域の包絡線信号を備え、該広帯域の帯域幅の下限よりも大きい狭帯域の帯域幅の下限と、該広帯域の帯域幅の上限よりも小さい狭帯域の帯域幅の上限との間に、対応する狭帯域の包絡線信号を備えており、
包絡線信号を選択するための前記手段は、前記既定の距離基準に従って、前記等化された音響信号に対して最小距離を有する狭帯域の包絡線信号を決定するように、かつこの組の前記対応する広帯域の包絡線信号を選択するように構成されている、請求項15に記載の装置。
The codebook includes a plurality of sets of corresponding envelope signals, and each set includes a broadband envelope signal between the lower limit of the broadband bandwidth and the upper limit of the broadband bandwidth. A corresponding narrowband envelope signal between a lower limit of the narrowband bandwidth that is larger than the lower limit of the wideband bandwidth and an upper limit of the narrowband bandwidth that is smaller than the upper limit of the wideband bandwidth With
The means for selecting an envelope signal is adapted to determine a narrowband envelope signal having a minimum distance to the equalized acoustic signal according to the predetermined distance criterion, and the set of the The apparatus of claim 15 , configured to select a corresponding broadband envelope signal.
前記広帯域のスペクトル包絡線信号を決定するための手段は、前記現在の帯域幅の下限および前記現在の帯域幅の上限に適合されている適合された狭帯域のコードブック包絡線信号を提供するための手段を備えている、請求項16に記載の装置。 The means for determining the wideband spectral envelope signal provides a adapted narrowband codebook envelope signal that is adapted to the lower limit of the current bandwidth and the upper limit of the current bandwidth. The apparatus according to claim 16 , comprising: 前記提供するための手段は、前記受信された音響信号の長期のパワースペクトルを用いて、前記広帯域のコードブック包絡線信号を処理するように構成されている、請求項17に記載の装置。 The apparatus of claim 17 , wherein the means for providing is configured to process the wideband codebook envelope signal using a long-term power spectrum of the received acoustic signal. 広帯域の励起信号を決定するための前記手段は、予測誤差フィルタリングおよび/または非線形特性に基づいて該広帯域の励起信号を決定するように構成されている、請求項13〜請求項18のうちの1項に記載の装置。 Said means for determining a broadband excitation signal is configured to determine an excitation signal of the wideband based on prediction error filtering and / or non-linear characteristics, one of claim 13 to claim 18 The device according to item. 前記少なくとも1つの補足信号は、前記決定された広帯域のスペクトル包絡線と、前記決定された広帯域の励起信号との積に基づき、前記組み合わせ手段は、前記現在の帯域幅の下限と前記現在の帯域幅の上限との間の前記受信された音響信号と、前記広帯域の帯域幅の下限と該現在の帯域幅の下限との間の帯域、および/または該現在の帯域幅の上限と前記広帯域の帯域幅の上限との間の帯域に制限された該少なくとも1つの補足信号とを加算するように構成されている、請求項13〜請求項19のうちの1項に記載の装置。 The at least one supplemental signal is based on a product of the determined broadband spectral envelope and the determined broadband excitation signal, and the combining means includes: a lower limit of the current bandwidth; and the current bandwidth The received acoustic signal between the upper bandwidth limit, the bandwidth between the lower bandwidth limit and the lower current bandwidth bandwidth, and / or the current upper bandwidth bandwidth and the wide bandwidth bandwidth. The apparatus according to one of claims 13 to 19 , configured to add the at least one supplemental signal limited to a band between an upper limit of bandwidth. 前記手段の少なくとも1つは、該手段の機能の少なくとも一部をケプストラム領域において行うように構成されている、請求項13〜請求項20のうちの1項に記載の装置。 At least one, at least a part of the function of said means is configured to perform in the cepstral domain, according to one of claims 13 to claim 20 of said means. 前記手段は、該手段のそれぞれの機能を、既定の時間間隔で繰り返し行うように構成されている、請求項13〜請求項21のうちの1項に記載の装置。 The apparatus according to any one of claims 13 to 21 , wherein the means is configured to repeat each function of the means at predetermined time intervals. 所望される信号検出器、特にスピーチ検出器をさらに備えており、前記手段は、所望される信号コンポーネントが前記受信された音響信号において検出された場合に限り、該手段のそれぞれの機能を行うように構成されている、請求項13〜請求項22のうちの1項に記載の装置。 Further comprising a desired signal detector, in particular a speech detector, said means performing the respective function of said means only if a desired signal component is detected in said received acoustic signal. The apparatus according to any one of claims 13 to 22 , which is configured as follows.
JP2007214930A 2006-08-22 2007-08-21 Method and system for providing an acoustic signal with extended bandwidth Expired - Fee Related JP5150165B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP06017456A EP1892703B1 (en) 2006-08-22 2006-08-22 Method and system for providing an acoustic signal with extended bandwidth
EP06017456.2 2006-08-22

Publications (2)

Publication Number Publication Date
JP2008052277A JP2008052277A (en) 2008-03-06
JP5150165B2 true JP5150165B2 (en) 2013-02-20

Family

ID=37000103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007214930A Expired - Fee Related JP5150165B2 (en) 2006-08-22 2007-08-21 Method and system for providing an acoustic signal with extended bandwidth

Country Status (7)

Country Link
EP (1) EP1892703B1 (en)
JP (1) JP5150165B2 (en)
KR (1) KR101433833B1 (en)
CN (1) CN101141533B (en)
AT (1) ATE446572T1 (en)
CA (1) CA2596411A1 (en)
DE (1) DE602006009927D1 (en)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8688441B2 (en) 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8433582B2 (en) 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
JP2010079275A (en) * 2008-08-29 2010-04-08 Sony Corp Device and method for expanding frequency band, device and method for encoding, device and method for decoding, and program
US8463599B2 (en) 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
CN102652336B (en) * 2009-12-28 2015-02-18 三菱电机株式会社 Speech signal restoration device and speech signal restoration method
CN102870156B (en) * 2010-04-12 2015-07-22 飞思卡尔半导体公司 Audio communication device, method for outputting an audio signal, and communication system
ES2790733T3 (en) * 2013-01-29 2020-10-29 Fraunhofer Ges Forschung Audio encoders, audio decoders, systems, methods and computer programs that use increased temporal resolution in the temporal proximity of beginnings or ends of fricatives or affricates
KR20180056032A (en) 2016-11-18 2018-05-28 삼성전자주식회사 Signal processing processor and controlling method thereof
CN107404625B (en) * 2017-07-18 2020-10-16 海信视像科技股份有限公司 Sound effect processing method and device of terminal
KR102093819B1 (en) * 2018-09-10 2020-03-26 한국과학기술연구원 Apparatus and method for separating sound sources

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3483958B2 (en) * 1994-10-28 2004-01-06 三菱電機株式会社 Broadband audio restoration apparatus, wideband audio restoration method, audio transmission system, and audio transmission method
EP0944036A4 (en) 1997-04-30 2000-02-23 Japan Broadcasting Corp Method and device for detecting voice sections, and speech velocity conversion method and device utilizing said method and device
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
AU2001262748A1 (en) 2000-06-14 2001-12-24 Kabushiki Kaisha Kenwood Frequency interpolating device and frequency interpolating method
JP3713200B2 (en) * 2000-11-30 2005-11-02 株式会社ケンウッド Signal interpolation device, signal interpolation method and recording medium
US6889182B2 (en) 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
WO2003019533A1 (en) * 2001-08-24 2003-03-06 Kabushiki Kaisha Kenwood Device and method for interpolating frequency components of signal adaptively
CN1550002A (en) * 2001-08-31 2004-11-24 皇家飞利浦电子股份有限公司 Bandwidth extension of a sound signal
JP4281349B2 (en) * 2001-12-25 2009-06-17 パナソニック株式会社 Telephone equipment
CN1887025A (en) * 2003-12-01 2006-12-27 皇家飞利浦电子股份有限公司 Selective audio signal enhancement
KR20060132697A (en) * 2004-02-16 2006-12-21 코닌클리케 필립스 일렉트로닉스 엔.브이. A transcoder and method of transcoding therefore
ATE429698T1 (en) 2004-09-17 2009-05-15 Harman Becker Automotive Sys BANDWIDTH EXTENSION OF BAND-LIMITED AUDIO SIGNALS

Also Published As

Publication number Publication date
CA2596411A1 (en) 2008-02-22
EP1892703B1 (en) 2009-10-21
EP1892703A1 (en) 2008-02-27
KR20080018132A (en) 2008-02-27
ATE446572T1 (en) 2009-11-15
DE602006009927D1 (en) 2009-12-03
KR101433833B1 (en) 2014-08-27
JP2008052277A (en) 2008-03-06
CN101141533A (en) 2008-03-12
CN101141533B (en) 2013-09-04

Similar Documents

Publication Publication Date Title
JP5150165B2 (en) Method and system for providing an acoustic signal with extended bandwidth
EP1772855B1 (en) Method for extending the spectral bandwidth of a speech signal
AU656787B2 (en) Auditory model for parametrization of speech
US7734462B2 (en) Method and apparatus for extending the bandwidth of a speech signal
US8392184B2 (en) Filtering of beamformed speech signals
JP3591068B2 (en) Noise reduction method for audio signal
JP4423300B2 (en) Noise suppressor
JP4777918B2 (en) Audio processing apparatus and audio processing method
KR101424005B1 (en) Method and apparatus for providing an acoustic signal with extended bandwidth
US5878389A (en) Method and system for generating an estimated clean speech signal from a noisy speech signal
EP1271472A2 (en) Frequency domain postfiltering for quality enhancement of coded speech
JP3881946B2 (en) Acoustic encoding apparatus and acoustic encoding method
WO2011080855A1 (en) Speech signal restoration device and speech signal restoration method
US20110054889A1 (en) Enhancing Receiver Intelligibility in Voice Communication Devices
JP2010055000A (en) Signal band extension device
WO2010066844A1 (en) Regeneration of wideband speech
US5806022A (en) Method and system for performing speech recognition
KR101886775B1 (en) Apparatus and method for improving voice intelligibility based on ptt
JP2012181561A (en) Signal processing apparatus
CN113593599A (en) Method for removing noise signal in voice signal
EP1944761A1 (en) Disturbance reduction in digital signal processing
JP6333043B2 (en) Audio signal processing device
Wang et al. Speech enhancement by bit-rate extension based on Time-frequency simultaneous-constrained Griffin-Lim algorithm
Miyamoto et al. Investigation on latency issues and objective measurements of non-linear blind bandwidth extension
AU754612B2 (en) Method and apparatus for estimating a spectral model of a signal used to enhance a narrowband signal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110728

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120703

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120928

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121203

R150 Certificate of patent or registration of utility model

Ref document number: 5150165

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151207

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees