JP2014507681A - 帯域幅を拡張する方法および装置 - Google Patents

帯域幅を拡張する方法および装置 Download PDF

Info

Publication number
JP2014507681A
JP2014507681A JP2013549697A JP2013549697A JP2014507681A JP 2014507681 A JP2014507681 A JP 2014507681A JP 2013549697 A JP2013549697 A JP 2013549697A JP 2013549697 A JP2013549697 A JP 2013549697A JP 2014507681 A JP2014507681 A JP 2014507681A
Authority
JP
Japan
Prior art keywords
band
bandwidth
low
band signal
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013549697A
Other languages
English (en)
Inventor
▲澤▼新 ▲劉▼
磊 苗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2014507681A publication Critical patent/JP2014507681A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

帯域幅の拡張方法および装置が開示され、この方法は、復号された帯域全体の信号の少なくとも1つのフレームの帯域幅を推定し、復号された狭帯域信号が拡張される必要がある広帯域信号に対応する推定帯域幅を得るステップ(101)と、狭帯域信号から、有効帯域幅より上で推定帯域幅より下の信号を目的として第1の予測復号を実行し、有効帯域幅より上で推定帯域幅より下の狭帯域信号の信号を得るステップ(102)と、推定帯域幅より上の狭帯域信号の信号を目的として第2の予測復号を遂行し、推定帯域幅より上の狭帯域信号の信号を得るステップ(103)とを含む。

Description

関連出願の相互参照
本願は、2011年1月24日出願の、「BANDWIDTH EXPANSION METHOD AND APPARATUS」という名称の中国特許出願第201110025741.1号の優先権を主張するものであり、参照により、その全体を本明細書に組み込む。
本発明は、通信技術の分野に関し、具体的には帯域幅を拡張する方法および装置に関する。
ネットワーク通信では、ネットワーク状態がよいときには、送信側が送ったデータストリーム(例えば音声信号ストリーム)が、ネットワークによって切り詰められることなく、受信側に直接送られ、受信側は、ネットワークで送られたデータストリームに従って復号することにより、帯域全体(whole-band)の信号を得てよく、この信号をユーザに聴かせるように出力する。ネットワーク状態が悪いとき、送信側が送ったデータストリームが、ネットワークによって別の長さに切り詰められる可能性があり、受信側は、低帯域(lower-band)信号を得る、またはネットワークで切り詰めて送られたデータストリームに従って復号することによって帯域全体の信号を得る可能性があり、この信号をユーザに聴かせるように出力する。受信側で信号を出力するとき、低帯域信号と帯域全体の信号の間の切換えがあり、異なる帯域幅の信号の間でこのような切換えが行なわれると、通常、ユーザに対して悪い音響の影響があり、ユーザの経験が低下する。したがって、受信側については、帯域幅の急激な変化を低減し、ユーザに対する音響の影響を低減して、ユーザの体験を改善するように、復号した後の低帯域信号を、帯域全体の信号にさらに拡張する必要がある。
従来技術では、低帯域信号を帯域全体の信号へと拡張するとき、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅としてデフォルトの帯域幅が通常用いられ、これによって、低帯域信号が帯域全体の信号へと拡張されるときユーザに対して聴覚的な影響をもたらし、ユーザの経験が低下する。
前述の不都合に応じて、本発明の実施形態は、ユーザに対する音響の影響を低減してユーザの経験を改善するように、帯域幅を拡張する方法および装置を提供する。
本発明の一実施形態が提供する、帯域幅の拡張方法は、
復号された低帯域信号が拡張される必要がある帯域全体の信号に対応する推定帯域幅を得るように、帯域全体の信号の少なくとも1つの復号されたフレームの帯域幅を推定するステップと、
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分を得るように、低帯域信号の有効帯域幅より上で推定帯域幅より下の帯域の低帯域信号の部分に対して第1の予測復号(predictive decoding)を遂行するステップと、
推定帯域幅より上の低帯域信号の部分を得るように、推定帯域幅より上の帯域の低帯域信号の部分に対して第2の予測復号を遂行するステップとを含む。
したがって、本発明の一実施形態では、推定ユニットおよび予測復号ユニットを含む帯域幅拡張装置が提供され、
推定ユニットは、復号された低帯域信号が拡張される必要がある帯域全体の信号に対応する推定帯域幅を得るように、帯域全体の信号の少なくとも1つの復号されたフレームの帯域幅を推定するように構成されており、
予測復号ユニットは、
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分を得るように、低帯域信号の有効帯域幅より上で推定帯域幅より下の帯域の低帯域信号の部分に対して第1の予測復号を遂行するように構成された第1の予測復号サブユニットと、
推定帯域幅より上の低帯域信号の部分を得るように、推定帯域幅より上の帯域の低帯域信号の部分に対して第2の予測復号を遂行するように構成された第2の予測復号サブユニットとを含む。
本発明の実施形態では、推定帯域幅を得るように、復号された帯域全体の信号の帯域幅が推定される。帯域全体の信号の推定帯域幅は、低帯域信号の現行フレームの推定帯域幅として用いられ、低帯域信号の現行フレームを帯域全体の信号へと拡張するとき、推定帯域幅より上の帯域の信号の部分と、推定帯域幅より下の帯域の信号の部分とに対して、異なる予測復号方法が採用される。推定帯域幅より上の帯域のエネルギーまたは振幅は、推定帯域幅より下の帯域のエネルギーまたは振幅より小さい。本発明の実施形態では、デフォルトの帯域幅を用いるやり方と比較して、追加の信号成分の予測のために導入される音響の悪影響が、推定帯域幅より上の帯域において低減され、それによってユーザに対する音響の影響が低下し、ユーザの経験が改善される。
本発明の実施形態の技術的解決策をより明瞭に説明するために、以下は、本発明の実施形態を説明するのに必要な添付図面について簡単に紹介する。明らかに、以下の説明における添付図面が示すのは、本発明のいくつかの実施形態のみであり、当業者なら、創造的な努力をしなくても、依然としてこれらの添付図面から他の図面を導出し得る。
本発明の一実施形態による帯域幅の拡張方法の概略流れ図である。 図1に示された帯域幅の拡張方法において、推定帯域幅より下の信号を得る方法の概略流れ図である。 図1に示された帯域幅の拡張方法において、推定帯域幅より下の信号を得る方法の概略流れ図である。 図1に示された帯域幅の拡張方法において、推定帯域幅より上の信号を得る方法の概略流れ図である。 図1に示された帯域幅の拡張方法において、推定帯域幅を得る実施例1の概略流れ図である。 図1に示された帯域幅の拡張方法において、推定帯域幅を得る実施例2の概略流れ図である。 図1に示された帯域幅の拡張方法において、推定帯域幅を得る実施例3の概略流れ図である。 図1に示された帯域幅の拡張方法において、推定帯域幅を得る実施例4の概略流れ図である。 本発明の一実施形態による帯域幅拡張装置の概略構造図である。 本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。 本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。 本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。 本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。 本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。 本発明の一実施形態によるさらに別の帯域幅拡張装置の概略構造図である。 本発明の一実施形態によるさらに別の帯域幅拡張装置の概略構造図である。
以下は、本発明の実施形態の技術的解決策を、本発明の実施形態の添付図面を参照しながら明確に説明する。明らかに、説明される実施形態は、本発明の実施形態のすべてではなく単なる一部分である。当業者によって、創造的な努力をすることなく、本発明の実施形態に基づいて達成されるすべての他の実施形態は、本発明の保護範囲に入るものとする。
デジタル信号処理の分野では、音響復号器およびビデオ復号器は、例えば携帯電話、無線装置、携帯情報端末(PDA)、ハンドヘルドコンピュータまたは携帯用コンピュータ、GPSレシーバ/ナビゲータ、カメラ、音響/ビデオプレーヤ、ビデオカメラ、ビデオレコーダ、監視デバイスなどのさまざまな電子デバイスで広く使用されている。このタイプの電子デバイスは、通常、音声および音響のコーデックを含み、音声および音響コーデックは、デジタル回路もしくはDSP (digital signal processor)などのチップによって直接実装されてよく、または、ソフトウェアコードのプロシージャを実行するようにプロセッサを駆動するソフトウェアコードによって実装されてもよい。
例えば、音声および音響のコーデックでは、符号化端末(coding end)は、MDCT変換によって時間領域信号を周波数領域信号に変換し、量子化器によって周波数領域のいくつかの係数またはパラメータを量子化して、量子化係数またはパラメータを、符号ストリームの形で復号端末(decoding end)に転送する。復号端末は、符号ストリームを復号することによって量子化係数またはパラメータを回復し、逆MDCT変換によって、出力用に、周波数領域信号を時間領域信号に変換する。信号切換えが行なわれ、低帯域信号が帯域全体の信号へと拡張されるとき、指標となるパラメータがなく、低帯域信号が拡張される帯域全体の信号に対応する帯域幅を学習することもできないので、拡張によって得られる帯域全体の信号に対応する帯域幅として用いられるのは、デフォルトの帯域幅のみであり、これが、音響の悪影響を招く恐れがある。したがって、低帯域信号が拡張される帯域全体の信号に対応する帯域幅を推定し、次いで、推定帯域幅に従って低帯域信号が拡張されることにより、低帯域信号を帯域全体の信号へと拡張するときに、音響の悪影響を招くのを回避する必要がある。具体的には、帯域全体の信号の、以前の復号されたフレームの帯域幅に従って推定を遂行してよく、得られた推定帯域幅は、低帯域信号の現行フレームが拡張される帯域全体の信号に対応する帯域幅として用いられる。
本発明の実施形態は、ユーザに対する音響の影響を低減してユーザの経験を改善するように、帯域幅を拡張する方法および装置を提供する。
図1を参照して、図1は、本発明の一実施形態による帯域幅の拡張方法の概略流れ図である。図1に示されるように、この方法は以下のステップを含み得る。
推定帯域幅を得るように、帯域全体の信号の少なくとも1つの復号されたフレームの帯域幅を推定するステップ101であって、推定帯域幅が、復号された低帯域信号が拡張される必要がある帯域全体の信号に対応するステップ101。
低帯域信号は、その有効帯域幅が、復号された帯域全体の信号の有効帯域幅より狭い復号信号である。
ネットワーク通信では、低帯域信号と帯域全体の信号は、2つの相対的概念であり、別々の全体の帯域幅を有する2つの信号を参照するのに用いられる。超高帯域全体の信号(ultra-whole-band signal)と帯域全体の信号は帯域全体の信号と称されてよく、帯域全体の信号および低帯域信号は低帯域信号と称されてよい。
本発明の実施形態では、推定帯域幅を得るように、復号された帯域全体の信号の帯域幅を推定するのに複数の別々の方法が用いられてよく、このことは、本発明の実施形態の特定の実施形態を参照しながら後に説明される。
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分を得るように、低帯域信号の有効帯域幅より上で推定帯域幅より下の帯域の低帯域信号の部分に対して第1の予測復号を遂行するステップ102。
推定帯域幅より上の低帯域信号の部分を得るように、推定帯域幅より上の帯域の低帯域信号の部分に対して第2の予測復号を遂行するステップ103。
任意選択の実施方法として、前述のステップ102の特定の実行処理(implementation process)については、図2aに示された以下のステップを含み得る方法が参照されてよい。
復号された帯域全体の信号に含まれる高帯域(high-band)信号のエネルギーまたは振幅の情報を計算し、低帯域信号に含まれる特定の周波数範囲のエネルギーまたは振幅の情報を計算するステップ201a。
任意選択の実施方法として、復号された帯域全体の信号に含まれる高帯域信号のエネルギーまたは振幅の情報を取得し、また、本発明の実施形態の低帯域信号に含まれる特定の周波数範囲のエネルギーまたは振幅の情報を得るように、復号された帯域全体の信号に含まれる高帯域信号および低帯域信号に含まれる特定の周波数範囲が、それぞれ同数の帯域に分割されてよく、各帯域のエネルギーまたは振幅の情報が計算される。
復号された帯域全体の信号に含まれる高帯域信号のエネルギーおよび低帯域信号に含まれる特定の周波数範囲のエネルギーに重み付けすることにより、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号のエネルギーを予測する、または、復号された帯域全体の信号に含まれる高帯域信号の振幅情報および低帯域信号に含まれる特定の周波数範囲の振幅情報に重み付けすることにより、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の振幅情報を予測するステップ202a。
例えば、前述の復号された帯域全体の信号に含まれる高帯域信号のエネルギーまたは振幅の情報をxと想定し、低帯域信号に含まれる特定の周波数範囲のエネルギーまたは振幅の情報をyと想定すると、xおよびyを重み付けするやり方は次式でよく、
z=A×x+B×y、ここで、
zはxおよびyの重み付けされた値を表し、Aはxに対応する重み付け係数を表し、Bはyに対応する重み付け係数を表し、AおよびBは、0≦A、B≦1、およびA+B=1を満たす。
帯域全体の信号に含まれている高帯域信号の励振信号または低帯域信号によって、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号を予測するステップ203a。
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号によって、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分ならびに低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報を回復するステップ204a。
任意選択の実施方法として、前述のステップ102の特定の実施処理については、図2bに示された、以下のステップを含み得る方法が参照されてよい。
復号された帯域全体の信号に含まれる低帯域信号または高帯域信号から予測することにより、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報を得るステップ201b。
復号された帯域全体の信号に含まれている高帯域信号または低帯域信号から予測することにより、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号を得るステップ202b。
本発明の実施形態では、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号は、他の方法で得られてもよく、このことは本発明の実施形態では限定されない。
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号によって、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分ならびに低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報を回復するステップ203b。
前述のエネルギーまたは振幅の情報は、周波数領域の包絡線でよい。
任意選択の実施方法として、前述のステップ103の特定の実行処理については、図3に示された、以下のステップを含み得る方法が参照されてよい。
推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として、推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報より小さいエネルギーまたは振幅を求めるステップ301。
例えば、推定帯域幅より上の復号された帯域全体の信号のエネルギーまたは振幅の情報が、推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として用いられ得る。具体的には、推定帯域幅より上の帯域全体の信号の復号された1つのフレームのエネルギーまたは振幅の情報が、推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として用いられてよく、あるいは、重み付けされたエネルギーまたは振幅の情報が、推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報のエネルギーまたは振幅より小さい限り、推定帯域幅より上の復号された帯域全体の信号の複数のフレームのエネルギーまたは振幅の情報が、重み付けされて、推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として用いられる。あるいは、本発明の実施形態では、あらかじめ設定されたエネルギーまたは振幅の情報が、推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として用いられてもよく、あらかじめ設定されたエネルギーまたは振幅は、推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報のエネルギーまたは振幅より小さい。あるいは、本発明の実施形態では、推定帯域より下の低帯域信号のエネルギーまたは振幅の情報が、減衰されて、推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として用いられてもよい。
低域信号の励振信号またはランダム雑音によって推定帯域幅より上の低域信号の励振信号を予測するステップ302。
推定帯域幅より上の低域信号の励振信号および推定帯域幅より上の低域信号のエネルギーまたは振幅の情報によって、推定帯域幅より上の低域信号の部分を回復するステップ303。
本発明の実施形態では、推定帯域幅を得るように、復号された帯域全体の信号の帯域幅が推定される。帯域全体の信号の推定帯域幅は、低域信号の現行フレームの推定帯域幅として用いられ、低域信号の現行フレームを帯域全体の信号へと拡張するとき、推定帯域幅より上の帯域の信号の部分と、推定帯域幅より下の帯域の信号の部分とに対して、別々の予測復号方法が採用される。推定帯域幅より上の帯域の信号の部分に対して予測復号が遂行されるとき、推定帯域幅より下の低域信号のエネルギーまたは振幅の情報より小さいエネルギーまたは振幅が求められて、推定帯域幅より上の低域信号のエネルギーまたは振幅の情報として用いられ、次いで、推定帯域幅より上の低域信号の励振信号および推定帯域幅より上の低域信号のエネルギーまたは振幅の情報によって、推定帯域幅より上の低域信号の部分が回復される。本発明の実施形態では、デフォルトの帯域幅を用いるやり方と比較して、追加の信号成分の予測のために導入される音響の悪影響が、推定帯域幅より上の帯域において低減され、それによってユーザに対する音響の影響が低下し、ユーザの経験が改善される。
本発明の実施形態では、復号された帯域全体の信号の帯域幅の推定は、ステップ101において、推定帯域幅を得るようにさまざまな方法を用いて実施されてよく、このことは、以下の特定の実施形態を通じて詳細に説明される。
実施形態1
図4を参照して、図4は、本発明の一実施形態によって推定帯域幅を得る方法の概略流れ図であり、この方法は、図1に示された帯域幅の拡張方法に適用されてよい。図4に示されるように、この方法は以下のステップを含み得る。
帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するステップ401。
帯域全体の信号のそれぞれのフレームについて、N個の帯域から1つの帯域を求めるステップ402であって、帯域がこの1つの帯域のエネルギーまたは振幅と、より高い周波数を有する隣接した帯域のエネルギーまたは振幅との比が、第1の既定値より大きい、および/または、この1つの帯域のエネルギーまたは振幅が第2の既定値より大きいことを満たすステップ402。
例えば、(M-1)番目の帯域は、帯域全体の信号の各フレームのN個の帯域から求められてよく、(M-1)番目の帯域のEM-1とM番目の帯域のEMの間の関係が、EM-1>α×EMを満たし、
かつ/または(M-1)番目の帯域のEM-1とThresholdの間の関係が、EM-1>Thresholdを満たし、ここで、
M≦Nであり、EMはM番目の帯域のエネルギーまたは振幅の情報を表し、EM-1は(M-1)番目の帯域のエネルギーまたは振幅の情報を表し、αは1より大きい第1の既定値であり、Thresholdは、所与の帯域内のエネルギーまたは振幅の情報の第2の既定値である。
推定帯域幅として、少なくとも1つの求められた帯域から最大の帯域幅を選択するステップ403。
本発明の実施形態では、求められた帯域のすべてがくまなく調べられてよく、最大の帯域幅が推定帯域幅として選択される。
実施形態1では、判定は、第1の求められた帯域から開始されてよく、以前に求められた帯域の帯域幅より、次に求められた帯域の帯域幅が大きければ、以前に求められた帯域の帯域幅が更新され、そうでなければ、以前に求められた帯域の帯域幅は、低帯域信号が現われるまで不変に保たれ、現在保たれている帯域幅が、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅として用いられてよい。実施形態1では、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅を、より正確に推定してよく、それによって、デフォルトの帯域幅によるユーザに対する音響の影響が回避される。したがって、本発明の実施形態では、ユーザに対する音響の影響が低減され得て、ユーザの経験が改善され得る。
実施形態2
図5を参照すると、図5は、本発明の一実施形態によって推定帯域幅を得る別の方法の概略流れ図であり、この方法は、図1に示された帯域幅の拡張方法に適用されてよい。図5に示されるように、この方法は、以下のステップを含み得る。
帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するステップ501。
帯域全体の信号のそれぞれのフレームについて、N個の帯域から1つの帯域を求めるステップ502であって、帯域がこの1つの帯域のエネルギーまたは振幅と、より高い周波数を有する隣接した帯域のエネルギーまたは振幅との比が、第1の既定値より大きい、および/または、この1つの帯域のエネルギーまたは振幅が第2の既定値より大きいことを満たすステップ502。
例えば、(M-1)番目の帯域は、帯域全体の信号の各フレームのN個の帯域から求められてよく、(M-1)番目の帯域のEM-1とM番目の帯域のEMの間の関係が、EM-1>α×EMを満たし、
かつ/または(M-1)番目の帯域のEM-1とThresholdの間の関係が、EM-1>Thresholdを満たし、ここで、
M≦Nであり、EMはM番目の帯域のエネルギーまたは振幅の情報を表し、EM-1は(M-1)番目の帯域のエネルギーまたは振幅の情報を表し、αは1より大きい第1の既定値であり、Thresholdは、所与の帯域内のエネルギーまたは振幅の情報の第2の既定値である。
少なくとも1つの求められた帯域の平均帯域幅を計算し、推定帯域幅として、この平均帯域幅を用いるステップ503。
実施形態2では、それぞれの求められた帯域の帯域幅が、低帯域信号が現われるまで記録されてよく、また、すべての記録された帯域の帯域幅または記録された帯域の一部分の帯域幅によって、平均帯域幅が計算されてよい。解決策によって得られた平均帯域幅は、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅として用いられる。実施形態2では、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅を、より正確に推定してよく、それによって、デフォルトの帯域幅によるユーザに対する音響の影響が回避される。したがって、本発明の実施形態では、ユーザに対する音響の影響が低減され得て、ユーザの経験が改善され得る。
実施形態3
図6を参照して、図6は、本発明の一実施形態によって推定帯域幅を得る別の方法の概略流れ図であり、この方法は、図1に示された帯域幅の拡張方法に適用されてよい。図6に示されるように、この方法は、以下のステップを含み得る。
帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するステップ601。
帯域全体の信号のそれぞれのフレームについて、N個の帯域から1つの帯域を求めるステップ602であって、帯域がこの1つの帯域のエネルギーまたは振幅と、隣接フレームに対応する帯域のエネルギーまたは振幅との加重和の、この1つの帯域のより高い周波数を有する隣接した帯域のエネルギーまたは振幅と、隣接フレームに対応する帯域のエネルギーまたは振幅との加重和に対する比が、第1の既定値より大きいことを満たすステップ602。
例えば、帯域全体の信号の各フレームのN個の帯域の中のM番目の帯域のエネルギーまたは振幅と、帯域全体の信号のその隣接フレームのN個の帯域のエネルギーまたは振幅との加重和がESUM,Mであり、帯域全体の信号のN個の帯域の中の(M-1)番目の帯域のエネルギーまたは振幅と、帯域全体の信号のその隣接フレームのN個の帯域のエネルギーまたは振幅との加重和がESUM,M-1であって、ESUM,MとESUM,M-1の間の関係がESUM,M-1>α×ESUM,Mを満たし、αは1より大きい第1の既定値であると想定されている。
推定帯域幅として、少なくとも1つの求められた帯域から最大の帯域幅を選択するステップ603。
本発明の実施形態では、求められた帯域のすべてがくまなく調べられてよく、最大の帯域幅が推定帯域幅として選択される。
同様に、実施形態3では、判定は、第1の求められた帯域から開始されてよく、以前に求められた帯域の帯域幅より、次に求められた帯域の帯域幅が大きければ、以前に求められた帯域の帯域幅が更新され、そうでなければ、以前に求められた帯域の帯域幅は、低帯域信号が現われるまで不変に保たれ、現在保たれている帯域幅が、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅として用いられてよい。実施形態3では、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅を、より正確に推定してよく、それによって、デフォルトの帯域幅によるユーザに対する音響の影響が回避される。したがって、本発明の実施形態では、ユーザに対する音響の影響が低減され得て、ユーザの経験が改善され得る。
実施形態4
図7を参照して、図7は、本発明の一実施形態によって推定帯域幅を得る別の方法の概略流れ図であり、この方法は、図1に示された帯域幅の拡張方法に適用されてよい。図7に示されるように、この方法は、以下のステップを含み得る。
帯域全体の信号のそれぞれの復号されたフレームを高周波数から低周波数へと検索し、第1の非ゼロ周波数ポイントを求めて、帯域全体の信号の少なくとも1つのフレームに対応する少なくとも1つの非ゼロ周波数ポイントの帯域幅を得るステップ701。
推定帯域幅として、少なくとも1つの非ゼロ周波数ポイントの帯域幅から最大の帯域幅を選択するステップ702。
同様に、実施形態4では、判定は、第1の求められた周波数ポイントから開始されてよく、以前に求められた周波数ポイントの帯域幅より、次に求められた周波数ポイントの帯域幅が大きければ、以前に求められた周波数ポイントの帯域幅が更新され、そうでなければ、以前に求められた周波数ポイントの帯域幅は、低帯域信号が現われるまで不変に保たれ、現在保たれている帯域幅が、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅として用いられてよい。実施形態4では、低帯域信号が拡張される帯域全体の信号に対応する推定帯域幅を、より正確に推定してよく、それによって、デフォルトの帯域幅によるユーザに対する音響の影響が回避される。したがって、本発明の実施形態では、ユーザに対する音響の影響が低減され得て、ユーザの経験が改善され得る。
本発明の実施形態で提供される帯域幅の拡張方法は、マルチモードの符号化/復号アルゴリズムにも適用され得る。例えば、いくつかのモードでは、符号化の後の符号ストリームには帯域全体の情報が含まれていてよく、復号中に符号ストリームを復号することにより、帯域全体の情報が回復され得る。他のモードでは、符号化の後の符号ストリームが含んでいるのは、低周波数情報の一部分のみであり、復号を通じて符号ストリームを復号することにより、低周波数情報が回復されてよい。高周波数情報は、予測によって得る必要がある。高周波数情報を予測するとき、帯域全体の回復された情報によって帯域幅を推定する必要がある。帯域幅は、実施形態1から実施形態4の任意の方法で推定してよい。
本発明の実施形態で提供される帯域幅の拡張方法は、パケット損失補償アルゴリズムまたはフレーム損失補填アルゴリズムにも適用され得る。フレーム損失が起こると、より優れた復号信号を得るために、前フレームおよび次フレームの情報によって現行の損失フレームの信号を回復する必要がある。同じ問題に関して、復号された前フレームの推定帯域幅によって、回復された信号の帯域幅を求める必要がある。推定帯域幅より下の帯域の信号は、既存のパケット損失補償アルゴリズムまたは既存のフレーム損失補填アルゴリズムによって回復され、推定帯域幅より上の帯域の信号は、前フレームの帯域と同じ帯域の情報によって、または所与の値(given value)によって、または有効帯域幅より下の帯域の現行フレームの情報を減衰させることによって得られる。
図8を参照して、図8は、本発明の一実施形態による帯域幅拡張装置の概略構造図である。本発明の実施形態で提供される帯域幅拡張装置は、さまざまな通信端末に適用されてよく、各種基地局にも適用されてよい。図8に示されるように、この装置は、推定ユニット801および予測復号ユニット802を含んでよい。
推定ユニット801は、推定帯域幅を得るように、帯域全体の信号の少なくとも1つの復号されたフレームの帯域幅を推定するように構成されており、推定帯域幅は、復号された低帯域信号が拡張される必要がある帯域全体の信号に対応し、低帯域信号は、その有効帯域幅が、復号された帯域全体の信号の有効帯域幅より小さい復号信号である。
予測復号ユニット802は、
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分を得るように、低帯域信号の有効帯域幅より上で推定帯域幅より下の帯域の低帯域信号の部分に対して第1の予測復号を遂行するように構成された第1の予測復号サブユニット8021と、
推定帯域幅より上の低帯域信号の部分を得るように、推定帯域幅より上の帯域の低帯域信号の部分に対して第2の予測復号を遂行するように構成された第2の予測復号サブユニット8022とを含んでよい。
本発明の実施形態で提供される帯域幅拡張装置では、推定ユニット801は、推定帯域幅を得るように、復号された帯域全体の信号の帯域幅を推定してよく、予測復号ユニット802は、低帯域信号の現行フレームの推定帯域幅として、帯域全体の信号の推定帯域幅を用いてよく、低帯域信号の現行フレームを帯域全体の信号へと拡張されるとき、推定帯域幅より上の帯域の信号の部分と、推定帯域幅より下の帯域の信号の部分とに対して、異なる予測復号方法が採用される。推定帯域幅より上の帯域のエネルギーまたは振幅は、推定帯域幅より下の帯域のエネルギーまたは振幅より小さい。本発明の実施形態では、デフォルトの帯域幅を用いるやり方と比較して、追加の信号成分の予測のために導入される音響の悪影響が、推定帯域幅より上の帯域において低減され、それによってユーザに対する音響の影響が低下し、ユーザの経験が改善される。
図9も参照すると、図9は、本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。図9に示される帯域幅拡張装置は、図8に示された帯域幅拡張装置を最適化することによって得られる。図9に示される帯域幅拡張装置では、推定ユニット801は、
帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するように構成された分割サブユニット8011と、
帯域全体の信号のそれぞれのフレームについて、N個の帯域から1つの帯域を求めるように構成された判定サブユニット8012であって、この1つの帯域のエネルギーまたは振幅と、より高い周波数を有する隣接した帯域のエネルギーまたは振幅との比が、第1の既定値より大きく、かつ/または第2の既定値より大きく、
例えば、判定サブユニット8012は、(M-1)番目の帯域を、帯域全体の信号の各フレームのN個の帯域から求めてよく、(M-1)番目の帯域のEM-1とM番目の帯域のEMの間の関係が、EM-1>α×EMを満たし、かつ/または(M-1)番目の帯域のEM-1とThresholdの間の関係が、EM-1>Thresholdを満たし、ここで、M≦Nであり、EMはM番目の帯域のエネルギーまたは振幅の情報を表し、EM-1は(M-1)番目の帯域のエネルギーまたは振幅の情報を表し、αは1より大きい第1の既定値であり、Thresholdは、所与の帯域内のエネルギーまたは振幅の情報の第2の既定値である判定サブユニット8012と、
判定サブユニット8012が推定帯域幅として求めた少なくとも1つの帯域から最大の帯域幅を選択するように構成された選択サブユニット8013とを含んでよい。
図10も参照すると、図10は、本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。図10に示される帯域幅拡張装置は、図8に示された帯域幅拡張装置を最適化することによって得られる。図10に示される帯域幅拡張装置では、推定ユニット801は、
帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するように構成された分割サブユニット8014と、
帯域全体の信号のそれぞれのフレームについて、N個の帯域から1つの帯域を求めるように構成された判定サブユニット8015であって、帯域がこの1つの帯域のエネルギーまたは振幅と、より高い周波数を有する隣接した帯域のエネルギーまたは振幅との比が、第1の既定値より大きい、および/または、この1つの帯域のエネルギーまたは振幅が第2の既定値より大きいことを満たす判定サブユニット8015と、
判定サブユニット8015が求めた少なくとも1つの帯域の平均帯域幅を計算して、この平均帯域幅を推定帯域幅として用いるように構成された解明サブユニット8016とを含んでよい。
図11も参照すると、図11は、本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。図11に示される帯域幅拡張装置は、図8に示された帯域幅拡張装置を最適化することによって得られる。図11に示される帯域幅拡張装置では、推定ユニット801は、
帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するように構成された第2の分割サブユニット8017と、
帯域全体の信号のそれぞれのフレームについて、N個の帯域から1つの帯域を求めるように構成された第2の判定サブユニット8018であって、帯域がこの1つの帯域のエネルギーまたは振幅と、隣接フレームに相当する帯域のエネルギーまたは振幅との加重和の、この1つの帯域のより高い周波数を有する隣接した帯域のエネルギーまたは振幅と、隣接フレームに相当する帯域のエネルギーまたは振幅との加重和に対する比が、第1の既定値より大きいことを満たす第2の判定サブユニット8018と、
第2の判定サブユニット8018が推定帯域幅として求めた少なくとも1つの帯域から最大の帯域幅を選択するように構成された第2の選択サブユニット8019とを含んでよい。
図12も参照すると、図12は、本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。図12に示される帯域幅拡張装置は、図8に示された帯域幅拡張装置を最適化することによって得られる。図12に示される帯域幅拡張装置では、推定ユニット801は、
帯域全体の信号のそれぞれの復号されたフレームを高周波数から低周波数へ検索し、第1の非ゼロ周波数ポイントを求めて、帯域全体の信号の少なくとも1つのフレームに対応する少なくとも1つの非ゼロ周波数ポイントの帯域幅を得るように構成された検索サブユニット8020と、
検索サブユニット8020が推定帯域幅として求めた少なくとも1つの非ゼロ周波数ポイントの帯域幅から最大の帯域幅を選択するように構成された選択サブユニット80201とを含んでよい。
図13も参照すると、図13は、本発明の一実施形態による別の帯域幅拡張装置の概略構造図であり、図13に示される帯域幅拡張装置は、推定ユニット1301および予測復号ユニット1302を含んでよい。
推定ユニット1301は、推定帯域幅を得るように、帯域全体の信号の少なくとも1つの復号されたフレームの帯域幅を推定するように構成されており、推定帯域幅は、復号された低帯域信号が拡張される必要がある帯域全体の信号に対応する。
この実施形態では、推定ユニット1301の構造および機能は、図9から図12の任意の推定ユニット801のものと同一である。
予測復号ユニット1302は、
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分を得るように、低帯域信号の有効帯域幅より上で推定帯域幅より下の帯域の低帯域信号の部分に対して第1の予測復号を遂行するように構成された第1の予測復号サブユニット13021と、
推定帯域幅より上の低帯域信号の部分を得るように、推定帯域幅より上の帯域の低帯域信号の部分に対して第2の予測復号を遂行するように構成された第2の予測復号サブユニット13022とを含んでよい。
図13に示されるように、第1の予測復号サブユニット13021は、
復号された帯域全体の信号に含まれる高帯域信号のエネルギーまたは振幅の情報を計算し、低帯域信号に含まれる特定の周波数範囲のエネルギーまたは振幅の情報を計算するように構成された第1の処理サブユニット130211と、
復号された帯域全体の信号に含まれる高帯域信号のエネルギーおよび低帯域信号に含まれる特定の周波数範囲のエネルギーに重み付けすることにより、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号のエネルギーを予測する、または、復号された帯域全体の信号に含まれる高帯域信号の振幅情報および低帯域信号に含まれる特定の周波数範囲の振幅情報に重み付けすることにより、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の振幅情報を予測するように構成されたた第2の処理サブユニット130212と、
帯域全体の信号に含まれている高帯域信号の励振信号または低帯域信号によって、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号を予測するように構成された第3の処理サブユニット130213と、
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号によって、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分ならびに低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報を回復するように構成された第4の処理サブユニット130214とを含んでよい。
第1の処理サブユニット130211は、復号された帯域全体の信号に含まれる高帯域信号および低帯域信号に含まれる特定の周波数範囲を、それぞれ同数の帯域に分割し、各帯域のエネルギーまたは振幅の情報を計算し、復号された帯域全体の信号に含まれる高帯域信号のエネルギーまたは振幅の情報を得て、低帯域信号に含まれる特定の周波数範囲のエネルギーまたは振幅の情報を得るように特に構成されている。
図14も参照すると、図14は、本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。図14に示される帯域幅拡張装置では、第1の予測復号サブユニット13021は、
復号された帯域全体の信号に含まれる低帯域信号または高帯域信号から予測することにより、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報を得るように構成された第5の処理サブユニット130215と、
復号された帯域全体の信号に含まれている高帯域信号または低帯域信号から予測することにより、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号を得るように構成された第6の処理サブユニット130215と、
低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の励振信号によって、低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号の部分ならびに低帯域信号の有効帯域幅より上で推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報を回復するように構成された第7の処理サブユニット130217とを含んでよい。
前述のエネルギーまたは振幅の情報は、周波数領域の包絡線でよい。
図15も参照すると、図15は、本発明の一実施形態による別の帯域幅拡張装置の概略構造図である。図15に示される帯域幅拡張装置は、図8に示された帯域幅拡張装置を最適化することによって得られる。図15に示される帯域幅拡張装置では、第2の予測復号サブユニット13022は、
推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として、推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報より小さいエネルギーまたは振幅を求めるように構成された第1の制御サブユニット130221であって、
任意選択の実施方法として、推定帯域幅より上の復号された帯域全体の信号のエネルギーまたは振幅の情報を、推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として用いる、または、推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報のエネルギーまたは振幅より小さい、あらかじめ設定されたエネルギーまたは振幅の情報を、推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として用いる、または、推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報として、推定帯域幅より下の低帯域信号のエネルギーまたは振幅の情報を減衰させるように構成され得る第1の制御サブユニット130221と、
低帯域信号の励振信号またはランダム雑音によって推定帯域幅より上の低帯域信号の励振信号を予測するように構成された第2の制御サブユニット130222と、
推定帯域幅より上の低帯域信号の励振信号および推定帯域幅より上の低帯域信号のエネルギーまたは振幅の情報によって、推定帯域幅より上の低帯域信号の部分を回復するように構成された第3の制御サブユニット130223とを含んでよい。
この実施形態では、推定ユニット1301の構造および機能は、図9から図12の任意の推定ユニット801のものと同一である。
この実施形態では、第1の予測復号サブユニット13021の構造および機能は、図13または図14の任意の第1の予測復号サブユニット13021のものと同一である。
当業者なら、関連するハードウェアに指示するプログラムによって、これらの実施形態の方法のステップのすべてまたは一部分が実施され得ることを理解するであろう。このプログラムは、フラッシュドライブ、読取り専用メモリ(Read-Only Memory、ROM)、ランダムアクセスメモリ(Random Access Memory、RAM)、磁気ディスク、または光ディスクを含み得るコンピュータ可読記憶媒体に記憶されてよい。
本発明の実施形態で提供される帯域幅の拡張方法および装置が、上記で詳細に紹介されている。本明細書では、本発明の原理および実施方法を例示するのに特定の実例が用いられている。これらの実施形態の前述の説明は、本発明の方法および中核概念の理解を支援するためにのみ用いられるものである。一方、当業者なら、本発明の概念に従って、特定の実施方法および用途の範囲に対する修正形態を作成し得る。結論として、本明細書の内容は、本発明を限定するものとして解釈されないものとする。
801 推定ユニット
8011 分割サブユニット
8012 判定サブユニット
8013 選択サブユニット
8014 分割サブユニット
8015 判定サブユニット
8016 解明サブユニット
8017 第2の分割サブユニット
8018 第2の判定サブユニット
8019 第2の解明サブユニット
802 予測復号ユニット
8020 検索サブユニット
80201 選択サブユニット
8021 第1の予測復号ユニット
8022 第2の予測復号ユニット
1301 推定ユニット
1302 予測復号ユニット
13021 第1の予測復号サブユニット
130211 第1の処理サブユニット
130212 第2の処理サブユニット
130213 第3の処理サブユニット
130214 第4の処理サブユニット
130215 第5の処理サブユニット
130216 第6の処理サブユニット
130217 第7の処理サブユニット
13022 第2の予測復号サブユニット
130221 第1の制御サブユニット
130222 第2の制御サブユニット
130223 第3の制御サブユニット

Claims (18)

  1. 推定帯域幅を得るように、帯域全体の信号の少なくとも1つの復号されたフレームの帯域幅を推定するステップであって、前記推定帯域幅が、復号された低帯域信号が拡張される必要がある帯域全体の信号に対応するステップと、
    前記低帯域信号の有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の部分を得るように、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の帯域の前記低帯域信号の前記部分に対して第1の予測復号を遂行するステップと、
    前記推定帯域幅より上の前記低帯域信号の部分を得るように、前記推定帯域幅より上の帯域の前記低帯域信号の前記部分に対して第2の予測復号を遂行するステップとを含む、帯域幅の拡張方法。
  2. 推定帯域幅を得るように、復号された帯域全体の信号の帯域幅を推定する前記ステップが、
    前記帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するステップと、
    前記帯域全体の信号のそれぞれのフレームについて、前記N個の帯域から1つの帯域を求めるステップであって、前記帯域が前記1つの帯域のエネルギーまたは振幅と、より高い周波数を有する隣接した帯域のエネルギーまたは振幅との比が、第1の既定値より大きい、および/または、この1つの帯域のエネルギーまたは振幅が第2の既定値より大きいことを満たすステップと、
    前記推定帯域幅として、少なくとも1つの求められた帯域から最大の帯域幅を選択するステップとを含む請求項1に記載の方法。
  3. 推定帯域幅を得るように、復号された帯域全体の信号の帯域幅を推定する前記ステップが、
    前記帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するステップと、
    前記帯域全体の信号のそれぞれのフレームについて、前記N個の帯域から1つの帯域を求めるステップであって、前記帯域が前記1つの帯域のエネルギーまたは振幅と、より高い周波数を有する隣接した帯域のエネルギーまたは振幅との比が、第1の既定値より大きい、および/または、この1つの帯域のエネルギーまたは振幅が第2の既定値より大きいことを満たすステップと、
    少なくとも1つの求められた帯域の平均帯域幅を計算し、前記推定帯域幅として前記平均帯域幅を用いるステップとを含む請求項1に記載の方法。
  4. 推定帯域幅を得るように、復号された帯域全体の信号の帯域幅を推定する前記ステップが、
    前記帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するステップと、
    前記帯域全体の信号のそれぞれのフレームについて、前記N個の帯域から1つの帯域を求めるステップであって、前記帯域が前記1つの帯域のエネルギーまたは振幅と、隣接フレームに相当する帯域のエネルギーまたは振幅との加重和の、前記1つの帯域のより高い周波数を有する隣接した帯域のエネルギーまたは振幅と、前記隣接フレームに相当する帯域のエネルギーまたは振幅との加重和に対する比が、第1の既定値より大きいことを満たすステップと、
    前記推定帯域幅として、少なくとも1つの求められた帯域から最大の帯域幅を選択するステップとを含む請求項1に記載の方法。
  5. 推定帯域幅を得るように、復号された帯域全体の信号の帯域幅を推定する前記ステップが、
    前記帯域全体の信号のそれぞれの復号されたフレームを高周波数から低周波数へ検索し、第1の非ゼロ周波数ポイントを求めて、前記帯域全体の信号の少なくとも1つのフレームに対応する少なくとも1つの非ゼロ周波数ポイントの帯域幅を得るステップと、
    前記推定帯域幅として、前記少なくとも1つの非ゼロ周波数ポイントの前記帯域幅から最大の帯域幅を選択するステップとを含む請求項1に記載の方法。
  6. 前記低帯域信号の有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の部分を得るように、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の帯域の前記低帯域信号の前記部分に対して第1の予測復号を遂行する前記ステップが、
    前記復号された帯域全体の信号に含まれる高帯域信号のエネルギーまたは振幅の情報を解明し、前記低帯域信号に含まれる特定の周波数範囲のエネルギーまたは振幅の情報を解明するステップと、
    前記復号された帯域全体の信号に含まれる前記高帯域信号の前記エネルギーおよび前記低帯域信号に含まれる前記特定の周波数範囲の前記エネルギーに重み付けすることにより、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号のエネルギーを予測する、または、前記復号された帯域全体の信号に含まれる前記高帯域信号の振幅情報および前記低帯域信号に含まれる前記特定の周波数範囲の振幅情報に重み付けすることにより、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の振幅情報を予測するステップと、
    前記低帯域信号または前記帯域全体の信号に含まれている前記高帯域信号の励振信号によって、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の励振信号を予測するステップと、
    前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の前記励振信号によって、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の部分、ならびに前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の前記エネルギーまたは前記振幅の情報を回復するステップとを含む請求項1に記載の方法。
  7. 前記復号された帯域全体の信号に含まれる高帯域信号のエネルギーまたは振幅の情報を解明し、前記低帯域信号に含まれる前記特定の周波数範囲のエネルギーまたは振幅の情報を解明する前記ステップが、
    前記復号された帯域全体の信号に含まれる前記高帯域信号、および前記低帯域信号に含まれる前記特定の周波数範囲を、それぞれ同数の帯域に分割するステップと、各帯域のエネルギーまたは振幅の情報を解明するステップと、前記復号された帯域全体の信号に含まれる前記高帯域信号の前記エネルギーまたは前記振幅の情報を得るステップと、前記低帯域信号に含まれる前記特定の周波数範囲の前記エネルギーまたは前記振幅の情報を得るステップとを含む請求項6に記載の方法。
  8. 前記推定帯域幅より上の信号を得るように、前記推定帯域幅より上の帯域の前記低帯域信号の前記部分に対して第2の予測復号を遂行する前記ステップが、
    前記推定帯域幅より上の前記低帯域信号のエネルギーまたは振幅の情報として、前記推定帯域幅より下の前記低帯域信号のエネルギーまたは振幅の情報より小さいエネルギーまたは振幅を求めるステップと、
    前記低帯域信号の励振信号またはランダム雑音によって前記推定帯域幅より上の前記低帯域信号の励振信号を予測するステップと、
    前記推定帯域幅より上の前記低帯域信号の前記励振信号および前記推定帯域幅より上の前記低帯域信号の前記エネルギーまたは前記振幅の情報によって、前記推定帯域幅より上の前記低帯域信号の前記部分を回復するステップとを含む請求項1に記載の方法。
  9. 前記推定帯域幅より上の前記低帯域信号のエネルギーまたは振幅の情報として、前記推定帯域幅より下の前記低帯域信号のエネルギーまたは振幅の情報より小さいエネルギーまたは振幅を求めるステップが、
    前記推定帯域幅より上の前記復号された帯域全体の信号のエネルギーまたは振幅の情報を、前記推定帯域幅より上の前記低帯域信号の前記エネルギーまたは前記振幅の情報として用いるステップ、または
    前記推定帯域幅より下の前記低帯域信号の前記エネルギーまたは前記振幅の情報の前記エネルギーまたは前記振幅より小さい、あらかじめ設定されたエネルギーまたは振幅の情報を、前記推定帯域幅より上の前記低帯域信号の前記エネルギーまたは前記振幅の情報として用いるステップ、または
    前記推定帯域幅より上の前記低帯域信号の前記エネルギーまたは前記振幅の情報として、前記推定帯域幅より下の前記低帯域信号の前記エネルギーまたは前記振幅の情報を減衰させるステップを含む請求項8に記載の方法。
  10. 推定ユニットおよび予測復号ユニットを含む帯域幅拡張装置であって、
    前記推定ユニットが、推定帯域幅を得るように、帯域全体の信号の少なくとも1つの復号されたフレームの帯域幅を推定するように構成されており、前記推定帯域幅が、復号された低帯域信号が拡張される必要がある帯域全体の信号に対応し、
    前記予測復号ユニットが、
    前記低帯域信号の有効帯域幅より上で前記推定帯域幅より下の低帯域信号の部分を得るように、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の帯域の前記低帯域信号の前記部分に対して第1の予測復号を遂行するように構成された第1の予測復号サブユニットと、
    前記推定帯域幅より上の低帯域信号の部分を得るように、前記推定帯域幅より上の帯域の前記低帯域信号の前記部分に対して第2の予測復号を遂行するように構成された第2の予測復号サブユニットとを備える帯域幅拡張装置。
  11. 前記推定ユニットが、
    前記帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するように構成された分割サブユニットと、
    前記帯域全体の信号のそれぞれのフレームについて、前記N個の帯域から1つの帯域を求めるように構成された判定サブユニットあって、前記帯域が前記1つの帯域のエネルギーまたは振幅と、より高い周波数を有する隣接した帯域のエネルギーまたは振幅との比が、第1の既定値より大きい、および/または、この1つの帯域のエネルギーまたは振幅が第2の既定値より大きいことを満たす判定サブユニットと、
    前記判定サブユニットが前記推定帯域幅として求めた少なくとも1つの帯域から最大の帯域幅を選択するように構成された選択サブユニットとを備える請求項10に記載の装置。
  12. 前記推定ユニットが、
    前記帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するように構成された分割サブユニットと、
    前記帯域全体の信号のそれぞれのフレームについて、前記N個の帯域から1つの帯域を求めるように構成された判定サブユニットあって、前記帯域が前記1つの帯域のエネルギーまたは振幅と、より高い周波数を有する隣接した帯域のエネルギーまたは振幅との比が、第1の既定値より大きい、および/または、この1つの帯域のエネルギーまたは振幅が第2の既定値より大きいことを満たす判定サブユニットと、
    前記判定サブユニットが求めた少なくとも1つの帯域の平均帯域幅を計算して、前記平均帯域幅を前記推定帯域幅として用いるように構成された解明サブユニットとを備える請求項10に記載の装置。
  13. 前記推定ユニットが、
    前記帯域全体の信号の復号されたフレームのそれぞれに含まれる高帯域信号を、周波数の昇順に、1より大きい整数のN個の帯域へと分割するように構成された第2の分割サブユニットと、
    前記帯域全体の信号のそれぞれのフレームについて、前記N個の帯域から1つの帯域を求めるように構成された第2の判定サブユニットあって、前記帯域が前記1つの帯域のエネルギーまたは振幅と、隣接フレームに相当する帯域のエネルギーまたは振幅との加重和の、前記1つの帯域のより高い周波数を有する隣接した帯域のエネルギーまたは振幅と、前記隣接フレームに相当する帯域のエネルギーまたは振幅との加重和に対する比が、第1の既定値より大きいことを満たす第2の判定サブユニットと、
    前記第2の判定サブユニットが前記推定帯域幅として求めた少なくとも1つの帯域から最大の帯域幅を選択するように構成された第2の選択サブユニットとを備える請求項10に記載の装置。
  14. 前記推定ユニットが、
    前記帯域全体の信号のそれぞれの復号されたフレームを高周波数から低周波数へ検索し、第1の非ゼロ周波数ポイントを求めて、前記帯域全体の信号の少なくとも1つのフレームに対応する少なくとも1つの非ゼロ周波数ポイントの帯域幅を得るように構成された検索サブユニットと、
    前記検索サブユニットが前記推定帯域幅として求めた前記少なくとも1つの非ゼロ周波数ポイントの帯域幅から最大の帯域幅を選択するように構成された選択サブユニットとを備える請求項10に記載の装置。
  15. 前記第1の予測復号サブユニットが、
    前記復号された帯域全体の信号に含まれる高帯域信号のエネルギーまたは振幅の情報を計算し、前記低帯域信号に含まれる特定の周波数範囲のエネルギーまたは振幅の情報を計算するように構成された第1の処理サブユニットと、
    前記復号された帯域全体の信号に含まれる前記高帯域信号の前記エネルギーおよび前記低帯域信号に含まれる前記特定の周波数範囲の前記エネルギーに重み付けすることにより、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号のエネルギーを予測する、または、前記復号された帯域全体の信号に含まれる前記高帯域信号の振幅情報および前記低帯域信号に含まれる前記特定の周波数範囲の振幅情報に重み付けすることにより、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の振幅情報を予測するように構成された第2の処理サブユニットと、
    前記低帯域信号または前記帯域全体の信号に含まれている前記高帯域信号の励振信号によって、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の励振信号を予測するように構成された第3の処理サブユニットと、
    前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の前記励振信号によって、前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の前記部分ならびに前記低帯域信号の前記有効帯域幅より上で前記推定帯域幅より下の前記低帯域信号の前記エネルギーまたは前記振幅の情報を回復するように構成された第4の処理サブユニットとを備える請求項10に記載の装置。
  16. 前記第1の処理サブユニットが、前記復号された帯域全体の信号に含まれる前記高帯域信号、および前記低帯域信号に含まれる前記特定の周波数範囲を、それぞれ同数の帯域に分割し、各帯域のエネルギーまたは振幅の情報を計算し、前記復号された帯域全体の信号に含まれる前記高帯域信号の前記エネルギーまたは前記振幅の情報を得て、前記低帯域信号に含まれる前記特定の周波数範囲の前記エネルギーまたは前記振幅の情報を得るように構成されている請求項15に記載の装置。
  17. 前記第2の予測復号サブユニットが、
    前記推定帯域幅より上の前記低帯域信号のエネルギーまたは振幅の情報として、前記推定帯域幅より下の前記低帯域信号のエネルギーまたは振幅の情報より小さいエネルギーまたは振幅を求めるように構成された第1の制御サブユニットと、
    前記低帯域信号の励振信号またはランダム雑音によって前記推定帯域幅より上の前記低帯域信号の励振信号を予測するように構成された第2の制御サブユニットと、
    前記推定帯域幅より上の前記低帯域信号の前記励振信号および前記推定帯域幅より上の前記低帯域信号の前記エネルギーまたは前記振幅の情報によって、前記推定帯域幅より上の前記低帯域信号の前記部分を回復するように構成された第3の制御サブユニットとを備える請求項10に記載の装置。
  18. 前記第1の制御サブユニットが、前記推定帯域幅より上の前記復号された帯域全体の信号のエネルギーまたは振幅の情報を、前記推定帯域幅より上の前記低帯域信号の前記エネルギーまたは前記振幅の情報として用いる、または、前記推定帯域幅より下の前記低帯域信号の前記エネルギーまたは前記振幅の情報のエネルギーまたは振幅より小さい、あらかじめ設定されたエネルギーまたは振幅の情報を、前記推定帯域幅より上の前記低帯域信号の前記エネルギーまたは前記振幅の情報として用いる、または、前記推定帯域幅より上の前記低帯域信号の前記エネルギーまたは前記振幅の情報として、前記推定帯域幅より下の前記低帯域信号の前記エネルギーまたは前記振幅の情報を減衰させるように構成されている請求項17に記載の装置。
JP2013549697A 2011-01-24 2011-09-30 帯域幅を拡張する方法および装置 Pending JP2014507681A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2011100257411A CN102610231B (zh) 2011-01-24 2011-01-24 一种带宽扩展方法及装置
CN201110025741.1 2011-01-24
PCT/CN2011/080443 WO2012100557A1 (zh) 2011-01-24 2011-09-30 一种带宽扩展方法及装置

Publications (1)

Publication Number Publication Date
JP2014507681A true JP2014507681A (ja) 2014-03-27

Family

ID=46527553

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013549697A Pending JP2014507681A (ja) 2011-01-24 2011-09-30 帯域幅を拡張する方法および装置

Country Status (6)

Country Link
US (1) US8805695B2 (ja)
EP (1) EP2660812A1 (ja)
JP (1) JP2014507681A (ja)
KR (1) KR20130116922A (ja)
CN (1) CN102610231B (ja)
WO (1) WO2012100557A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
CN104217727B (zh) 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
EP2830052A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
JP6531103B2 (ja) 2013-09-12 2019-06-12 ドルビー・インターナショナル・アーベー Qmfベースの処理データの時間整列
CN107342090B (zh) * 2016-04-29 2020-08-25 华为技术有限公司 一种音频信号编码、解码方法及音频信号编码器、解码器
CN107886966A (zh) * 2017-10-30 2018-04-06 捷开通讯(深圳)有限公司 终端及其优化语音命令的方法、存储装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004512561A (ja) * 2000-10-20 2004-04-22 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) 符号化音響信号の復号に関するエラー隠匿

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
JP2004513399A (ja) 2000-11-09 2004-04-30 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 知覚品質を高める電話スピーチの広帯域拡張
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
KR100503415B1 (ko) * 2002-12-09 2005-07-22 한국전자통신연구원 대역폭 확장을 이용한 celp 방식 코덱간의 상호부호화 장치 및 그 방법
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
JP4679049B2 (ja) * 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7668712B2 (en) 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US8712768B2 (en) 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
UA92742C2 (ru) 2005-04-01 2010-12-10 Квелкомм Инкорпорейтед Способ и устройство для кодирования речевых сигналов с расщеплением полосы
US20070005351A1 (en) * 2005-06-30 2007-01-04 Sathyendra Harsha M Method and system for bandwidth expansion for voice communications
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
CA2558595C (en) * 2005-09-02 2015-05-26 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
EP1772855B1 (en) * 2005-10-07 2013-09-18 Nuance Communications, Inc. Method for extending the spectral bandwidth of a speech signal
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
CN2927247Y (zh) * 2006-07-11 2007-07-25 中兴通讯股份有限公司 语音解码器
DE102008015702B4 (de) * 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
AU2009220341B2 (en) * 2008-03-04 2011-09-22 Lg Electronics Inc. Method and apparatus for processing an audio signal
BRPI0908929A2 (pt) * 2008-03-14 2016-09-13 Panasonic Corp dispositivo de codificação, dispositivo de decodificação, e método dos mesmos
EP2352147B9 (en) * 2008-07-11 2014-04-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus and a method for encoding an audio signal
JP4945586B2 (ja) * 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004512561A (ja) * 2000-10-20 2004-04-22 テレフオンアクチーボラゲツト エル エム エリクソン(パブル) 符号化音響信号の復号に関するエラー隠匿

Also Published As

Publication number Publication date
US20130317831A1 (en) 2013-11-28
EP2660812A1 (en) 2013-11-06
WO2012100557A1 (zh) 2012-08-02
CN102610231B (zh) 2013-10-09
US8805695B2 (en) 2014-08-12
KR20130116922A (ko) 2013-10-24
CN102610231A (zh) 2012-07-25

Similar Documents

Publication Publication Date Title
US10559313B2 (en) Speech/audio signal processing method and apparatus
JP6202545B2 (ja) 帯域幅拡張周波数帯域信号を予測する方法、および復号デバイス
US10089997B2 (en) Method for predicting high frequency band signal, encoding device, and decoding device
US8805695B2 (en) Bandwidth expansion method and apparatus
KR101736705B1 (ko) 오디오 신호를 위한 비트 할당 방법 및 장치
RU2702265C1 (ru) Способ и устройство обработки сигналов
JP6612808B2 (ja) 会話/音声信号処理方法および符号化装置
JP6264673B2 (ja) ロストフレームを処理するための方法および復号器

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140701

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141202