JP2009223210A

JP2009223210A - 信号帯域拡張装置および信号帯域拡張方法

Info

Publication number: JP2009223210A
Application number: JP2008070045A
Authority: JP
Inventors: Takashi Sudo; 隆須藤
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2008-03-18
Filing date: 2008-03-18
Publication date: 2009-10-01

Abstract

【課題】少ない計算量で、音質よく帯域拡張された信号を生成することが可能な信号帯域拡張装置および信号帯域拡張方法を提供する。
【解決手段】帯域拡張処理部３にて帯域拡張処理を行うにあたり、歪み制御処理部４０を設けて、これにより広帯域化処理に並列して、ピークを除去する処理を実施して基本周波数とその倍音の影響を除去して歪み成分を生成し、この歪み成分を用いて、広帯域化処理によって生じた調波構造の歪みを低減するようにしたものである。
【選択図】図２

Description

この発明は、帯域制限された音声や音楽・オーディオなどの信号を広帯域信号に変換する信号帯域拡張装置に関する。

周知のように、音声や音楽・オーディオなどの信号（入力信号）を広帯域に帯域拡張する場合、人工的ではない自然な音に聞こえるようにするためには、帯域拡張された信号（出力信号）が基本周波数とその倍音ごとに周波数領域でピークを持ち、基本周波数の周波数間隔で幾つもの成分が存在する構造（調波構造）を保つ必要がある。従来は、基本周波数を抽出して調波構造を生成する第１の手法（例えば、特許文献１）と、基本周波数を抽出せずに非線形処理などによって調波構造を生成する第２の手法（例えば、非特許文献１）に大別される。

上記第１の手法は、入力信号を線形予測分析し、基本周波数を抽出する。そして、線形予測残差信号を基本周波数の整数倍だけ周波数シフトして、線形予測合成フィルタで合成し、これにより帯域拡張信号を得る。しかしながら、このような手法では、基本周波数の抽出に、大きな計算量が必要である。また、確実な基本周波数の抽出法が存在しないため、不安定な基本周波数の抽出精度が全体音質に大きく影響するという問題がある。

一方、上記非特許文献１に係わる第２の手法は、入力信号を線形予測分析し、線形予測残差信号に半波整流による非線形処理を施し低域拡張する。さらに、線形予測合成フィルタによる合成で、低域拡張信号を得る。この第２の手法では、計算量が小さくて済むものの、非線形処理などによって調波構造の谷が浅くなり、歪みや異音が生成され音質が悪くなるという問題があった。
特開平９−５５７７８号公報日本音響学会講演論文集（平成６年１０月）「電話帯域音声の擬似広帯域化の検討」、１−Ｐ−６、３４９−３５０ページ（富士通研究所）。

従来の信号帯域拡張装置では、計算量が大きかったり、あるいは歪みや異音が生成されたりして音質が悪くなるという問題があった。
この発明は上記の問題を解決すべくなされたもので、少ない計算量で、音質よく帯域拡張された信号を生成することが可能な信号帯域拡張装置および信号帯域拡張方法を提供することを目的とする。

上記の目的を達成するために、この発明は、帯域制限された入力信号の周波数帯域を拡げて広帯域信号に変換する広帯域化手段と、入力信号から歪み成分を生成する歪み成分生成手段と、この歪み成分生成手段が生成した歪み成分に基づいて、広帯域化手段が広帯域化した広帯域信号の歪みを低減する歪み低減手段とを具備して構成するようにした。

以上述べたように、この発明では、帯域制限された信号の周波数帯域を拡げるとともに、この拡げられた周波数帯域に対応する歪み成分を生成し、この歪み成分に基づいて、広帯域化した信号の調波構造の歪みを低減するようにしている。
したがって、この発明によれば、少ない計算量で、音質よく帯域拡張された信号を生成することが可能な信号帯域拡張装置および信号帯域拡張方法を提供できる。

以下、図面を参照して、この発明の一実施形態について説明する。
図１は、この発明の一実施形態に係わる信号帯域拡張装置が適用された通信装置の構成を示すものである。この図に示す通信装置は、例えば携帯電話などの無線通信装置の受信系を示すものであって、無線通信部１と、デコーダ２と、帯域拡張処理部３と、Ｄ／Ａ変換器４とを備えている。

無線通信部１は、移動通信網に収容される無線基地局と無線通信し、そしてこの無線基地局および移動通信網を通じて通信相手局との間に通信リンクを確立して通信する。
デコーダ２は、無線通信部１が通信相手局から受信した受信データを、事前に決められた単位（1フレーム=Nサンプル）ごとに復号して、ディジタルの受話信号x[n] (n=0,1,…N-1)を得る。ただし、この受信データのサンプリング周波数はfs[Hz]とする。このようにして得られたディジタル信号は、フレーム単位で帯域拡張処理部３に出力される。

帯域拡張処理部３は、１フレーム単位で上記受話信号（x[0]〜x[N-1]）に帯域拡張処理を施す。このとき、サンプリング周波数は変更しない。すなわち、帯域拡張処理部３によって、サンプリング周波数fs[Hz]の帯域拡張された受話信号y[n]が１フレーム単位で得られる。なお、帯域拡張処理部３の具体的な構成例については後に詳述する。

D/A変換器４は、上記帯域拡張された受話信号y[n]をアナログ信号y(t)に変換して、スピーカ５に出力する。スピーカ５は、上記アナログ信号に基づく音声信号を音響空間へ拡声出力する。

次に、帯域拡張処理部３の第１の実施形態について説明する。
帯域拡張処理部３は、ある周波数帯域に帯域制限された音声や音楽・オーディオなどの信号（入力信号）を、この信号が持つ周波数帯域を包含する広い周波数帯域の信号に変換することで、高音質な信号を合成するものである。このために、帯域拡張処理部３は、上記入力信号として受話信号x[n]が入力され（入力信号）、この信号にフレーム毎に帯域拡張処理を施して、帯域拡張された広帯域の受話信号y[n]を出力信号として得る。

以下の説明では、入力信号は、fs_nb_low[Hz]からfs_nb_high[Hz]までに帯域制限されているものとし、帯域拡張処理部３の帯域拡張処理によりfs_wb_low[Hz]からfs_wb_high[Hz]までの帯域に拡張されるとする。ただし、fs_wb_low≦fs_nb_low<fs_nb_high≦fs_wb_high<fs/2 を満たすものとする。

また以下の説明では、低域拡張を例に挙げるため、fs_wb_low<fs_nb_low、fs_nb_high=fs_wb_highとして説明し、例えば、fs=8000[Hz]、fs_nb_low=340[Hz]、fs_nb_high=3950[Hz]、fs_wb_low=50[Hz]、fs_wb_high=3950[Hz]とする。帯域制限の周波数帯域やサンプリング周波数については、これに限らない。また、フレーム長をN=160とする。

図２は、この発明に係わる帯域拡張処理部３の第１の実施形態の構成を示すものである。この図に示すように、第１の実施形態の帯域拡張処理部３は、分析処理部１０と、広帯域化処理部２０と、合成処理部３０と、歪み制御処理部４０と、帯域通過フィルタ５０と、信号遅延処理部７０と、信号加算処理部８０とを備える。

分析処理部１０は、線形予測分析部１０１と、逆フィルタ１０２とを備える。
線形予測分析部１０１は、狭帯域に帯域制限された入力信号x[n]が入力され、これを線形予測分析して、M次の線形予測係数LPC[m] (m=0,1…M-1)を得る。具体的には、線形予測分析の対象となる現在のフレームの入力信号x[n]と、このフレームの直前の過去の１フレームの入力信号の合計２フレームを用いる。このデータ長2Nの入力信号x[n] (n=0,1,…2N-1)に対して、窓関数をハミング窓としてデータ長2Nの窓掛けを行い、その信号に対してM次の線形予測分析を行う。

ここでは、例として、次の時刻（フレーム）での入力信号x[n]のシフト幅（Nサンプル）と窓掛けを行った入力信号x[n]のデータ長（2Nサンプル）の比であるオーバーラップは50%としている。ただし、窓掛けに用いる窓関数は、ハミング窓に限定せず、他の対称窓（ハニング窓、ブラックマン窓、ｓｉｎ窓など）あるいは音声符号化処理で用いられるような非対称窓などに適宜変更してよい。またオーバーラップは、50%に限らない。この実施形態では、スペクトル包絡を線形予測係数で表現する場合を例にしているが、線スペクトル対(LSP)や線スペクトル周波数(LSF)、PARCOR係数、メルケプストラム係数などで表現してもよい。

逆フィルタ１０２は、線形予測分析部１０１で得た線形予測係数LPC[m]を用いて逆フィルタを形成し、その逆フィルタに線形予測分析部１０１で窓掛けしたデータ長2Nの入力信号x[n]を入力して、データ長2Nの線形予測残差信号e[n]を得る。

広帯域化処理部２０は、残差広帯域化処理部２０３を備える。残差広帯域化処理部２０３は、逆フィルタ１０２で得たデータ長2Nの線形予測残差信号e[n]に、基本周波数の倍音ごとに周波数領域でピークを持つ構造（調波構造）にする非線形処理を施し、これによって、広帯域化されたデータ長2Nの線形予測残差信号e_wb[n]を得る。調波構造にする非線形処理の一例としては、図３に示すような非線形関数による非線形処理（半波整流）がある。また、調波構造にする非線形処理としては全波整流を用いることもでき、これらの処理に限らない。

例えば、図４（ａ）に、線形予測残差信号e[n]の時間領域での波形の例を示す。この波形に対して図３に示す非線形関数による非線形処理（半波整流）を施して広帯域化された線形予測残差信号e_wb[n]は図４（ｂ）に示す波形になる。この線形予測残差信号e[n]の周波数領域でのパワースペクトルを図５（ｂ）に示す。これに対して、広帯域化された線形予測残差信号e_wb[n]の周波数領域でのパワースペクトルは図５（ｃ）のようになる。一方、この場合の理想的な広帯域信号に対して、仮に線形予測分析した場合の線形予測残差信号の周波数領域でのパワースペクトルを図５（ａ）に示す。

合成処理部３０は、第１の線形予測合成部３０１を備える。第１の線形予測合成部３０１は、上記線形予測係数LPC[m]を用いて線形予測合成フィルタを形成し、その線形予測合成フィルタに広帯域化されたデータ長2Nの線形予測残差信号e_wb[n]を入力して、データ長2Nの第１の広帯域信号y1[n]を合成する。

歪み制御処理部４０は、歪み成分生成処理部４０１と、歪み低減処理部４０２とを備える。また歪み成分生成処理部４０１は、ピーク除去処理部４０１Ａと、第２の線形予測合成部４０１Ｂとを備える。一連の広帯域化処理によって生成された信号である合成処理部３０によって生成された第１の広帯域信号y1[n]における広帯域化処理部２０の残差広帯域化処理部２０３における非線形処理によって生成された調波構造は、周波数領域でのパワーの極大点（調波構造の山）のパワーが理想的な広帯域信号と比較すると小さくなっていたり、周波数領域でのパワーの極小点（調波構造の谷）のパワーが理想的な広帯域信号と比較すると大きくなっていたり、周波数領域でのパワーの極大点とその近傍にあるパワーの極小点のパワー差が理想的な広帯域信号と比較すると小さくなっていたりする。また、このようなことが、複数の周波数領域でのパワーの極大点及び極小点で起きる。一連の広帯域化処理によって生成された信号である合成処理部３０によって生成された第１の広帯域信号y1[n]と理想的な広帯域信号との差異や違いを、歪みあるいは歪み成分と呼ぶ。歪み制御処理部４０は、この歪みを低減し、最終的な帯域拡張された信号が人工的ではない自然な音に聞こえるように制御する。

ピーク除去処理部４０１Ａは、上記データ長2Nの線形予測残差信号e[n]に対して、広帯域化するとともに時間領域の振幅の絶対値が大きいサンプルの振幅を低減することでピーク除去し、データ長2Nのピーク除去された線形予測残差信号p[n]を出力する。

上記線形予測残差信号e[n]には、例えば図４（ａ）に示すように、時間領域の振幅の絶対値が大きいサンプル（パルス）が含まれている。このパルスの一番長い時間間隔がピッチ周期であり、このピッチ周期は、基本周波数の逆数になっている。パルスの短い時間間隔は、倍音に相当する。つまり、上記振幅の絶対値が大きいサンプルは、例えば図５（ｂ）に示すように、周波数領域では基本周波数とその倍音に相当し、周波数領域での単一の山あるいは調波構造の複数の山を構成する。ピーク除去処理部４０１Ａでは、上記線形予測残差信号e[n]の時間領域の振幅の絶対値が大きいサンプルの振幅を低減させることによって、調波構造の山のレベルを谷のレベルまで下げ、調波構造の山と谷のレベル差を圧縮するように処理を行う。理想的な広帯域信号の線形予測残差信号では調波構造の谷におけるパワーは小さいはずであり、ここでは、理想的な広帯域信号の線形予測残差信号と広帯域化処理部２０によって生成された線形予測残差信号e_wb[n]との差異は、例えば図５（ａ）と図５（ｃ）に示すように、広帯域化処理部２０によって生成された線形予測残差信号e_wb[n]のそれぞれの周波数での調波構造の谷のパワー分であると考え、この調波構造の山のレベルが谷のレベルまで下げられた信号を用いて、後述する第２の線形予測合成部４０１Ｂにおいて歪み成分を算出する。

具体的には、ピーク除去処理部４０１Ａは、例えば図６（ａ）や図６（ｂ）に示す非線形関数を用いた非線形処理を施し、広帯域化するとともに時間領域の振幅の絶対値が大きいサンプルの振幅を低減することでピーク除去する。なお、図６中のＡは、閾値を示す。図６（ａ）に示す非線形関数を用いた非線形処理では、時間領域での振幅が０以下である成分を出力する半波整流によって広帯域化し、なおかつ振幅が−Ａより小さい成分は振幅を０に低減することでピーク除去を行う。図６（ｂ）に示す非線形関数を用いた非線形処理では、時間領域での振幅が０以上である成分を出力する半波整流によって広帯域化し、なおかつ振幅がＡより大きい成分は振幅を０に低減することでピーク除去を行う。図４（ａ）に示した線形予測残差信号e[n]の時間領域での波形の例に対して図６（ｂ）に示す非線形関数による非線形処理を施して広帯域化され、ピーク除去された線形予測残差信号p[n]は図４（ｃ）に示す波形になる。なお、図４にも図６（ｂ）に示した非線形関数の閾値Ａを示している。この線形予測残差信号p[n]の周波数領域でのパワースペクトルの例を図５（ｄ）に示す。また、後述する歪み低減処理部４０２において出力される歪みが低減された広帯域信号y2[n]に対して、仮に線形予測分析した場合の線形予測残差信号の周波数領域でのパワースペクトルを図５（ｅ）に示す。

なお、ピーク除去処理部４０１Ａで行われるピーク除去処理に用いる非線形関数（図６参照）は、線形予測残差信号e[n]の振幅、パワーあるいは振幅の絶対値などの最大値などを検出し、これに応じてフレーム毎に動的に変化させてもよい。例えば、フレーム毎に線形予測残差信号e[n]の時間領域での振幅の絶対値の平均値を算出し、振幅の絶対値の平均値に事前に設定された一定値を加算した値を閾値Ａに設定したり、時間領域での振幅の絶対値の平均値と標準偏差σあるいは分散値（σの２乗）を算出し、平均値から２倍のσだけ大きい値を閾値Ａに設定したりしてフレーム毎に変化させてもよい。また、フレーム毎に線形予測残差信号e[n]のパワーの最大値を算出し、事前に設定された一定値をパワーの最大値から減算した値の平方根を閾値Ａと設定してもよい。

また、上記ピーク除去処理は、時間領域の振幅の絶対値が大きいサンプルの振幅を低減させる処理であればよく、非線形フィルタであるメディアンフィルタや、下式（１）のように時間方向に平滑化して更新する平滑化フィルタや、線形フィルタである低域通過フィルタを適用してもよい。ただし、低域通過フィルタは、基本周波数を除去するような通過帯域に設定することが望ましい。このときの基本周波数は、人間の声における基本周波数の範囲（凡そ56[Hz]から500[Hz]まで）に従って、事前に設定されていて構わない。

第２の線形予測合成部４０１Ｂは、上記線形予測係数LPC[m]を用いて線形予測合成フィルタを形成し、その線形予測合成フィルタに上記データ長2Nのピーク除去された線形予測残差信号p[n]を入力して、データ長2Nの広帯域の歪み信号d[n]を合成する。すなわち、理想的な広帯域信号と合成処理部３０によって生成された第１の広帯域信号y1[n]との差異である歪み成分は、広帯域化処理部２０によって生成された線形予測残差信号e_wb[n]のそれぞれの周波数領域での調波構造の谷のパワー分に起因していると考え、この調波構造の山のレベルが谷のレベルまで下げられた信号であるピーク除去された線形予測残差信号p[n]を線形予測合成フィルタに入力することで、歪み成分を表した歪み信号d[n]を算出する。

歪み低減処理部４０２は、データ長2Nの歪み信号d[n]を用いて、データ長2Nの第１の広帯域信号y1[n]に含まれる歪みを低減し、この歪みが低減された広帯域信号を第２の広帯域信号y2[n]として出力する。すなわち歪み低減処理部４０２は、歪み成分を表した歪み信号d[n]を用いて、第１の広帯域信号y1[n]の調波構造の谷のパワーを下げることで調波構造の歪みを低減し、理想的な広帯域信号に近づける処理を行う。

図７は、歪み低減処理部４０２の具体的な構成例であって、この例では、周波数領域変換部４０２Ａ、パワー算出部４０２Ｂ、周波数領域変換部４０２Ｃ、パワー算出部４０２Ｄ、抑圧ゲイン算出部４０２Ｅ、スペクトル抑圧部４０２Ｆ、時間領域変換部４０２Ｇを備える。

周波数領域変換部４０２Ａは、データ長2Nの第１の広帯域信号y1[n]に対して、2N点によるＦＦＴ（Fast Fourier Transform）などの処理を施して周波数領域の信号に変換して、上記第１の広帯域信号y1[n]の周波数スペクトルY1[ω,f]を算出する。以下の説明では、ωは周波数BINの番号を表し、1≦ω≦2Nとする。
パワー算出部４０２Ｂは、第１の広帯域信号y1[n]の周波数スペクトルY1[ω,f]に基づいて、そのパワースペクトル|Y1[ω,f]|^２を算出する。

周波数領域変換部４０２Ｃは、データ長2Nの歪み信号d[n]に対して、2N点によるＦＦＴ（Fast Fourier Transform）などの処理を施して周波数領域の信号に変換して、上記歪み信号d[n]の周波数スペクトルD[ω,f]を算出する。
パワー算出部４０２Ｄは、歪み信号d[n]の周波数スペクトルD[ω,f]に基づいて、そのパワースペクトル|D[ω,f]|^２を算出する。

抑圧ゲイン算出部４０２Ｅは、ウィナー・フィルタ（Wiener Filter）法を用いて、第１の広帯域信号y1[n]のパワースペクトル|Y1[ω,f]|^２と歪み信号d[n]のパワースペクトル|D[ω,f]|^２から、下式（２）に示すように抑圧ゲインG[ω,f]を算出する。

そして抑圧ゲイン算出部４０２Ｅは、上記算出に結果が0≦G[ω,f]≦1を満たすように、G[ω,f]が０より小さければ０として、１より大きければ１とする制約をかける。そして、下式（３）のように周波数ω方向に平滑化して、抑圧ゲインG[ω,f]を更新し、これを出力する。平滑化に用いる係数ε_jは、例えば、[0.1,0.2,0.4,0.2,0.1]のように三角窓による移動平均を行う係数にする。

スペクトル抑圧部４０２Ｆは、第１の広帯域信号y1[n]の周波数スペクトルY1[ω,f]に対して、抑圧ゲインG[ω,f]に基づくスペクトル抑圧を行い、これにより歪み低減された第２の広帯域信号の周波数スペクトルY2[ω,f]を算出する。すなわち、例えば下式（４）に示す演算により、Y2[ω,f]を算出する。なおここで、Y1[ω,f]の位相スペクトルは、Y2[ω,f]の位相スペクトルに引き継がれるものとする。

時間領域変換部４０２Ｇは、第２の広帯域信号の周波数スペクトルY2[ω,f]に対して、ＩＦＦＴ（Inverse Fast Fourier Transform）などの処理を施して、時間領域の信号に変換し、データ長2Nの第２の広帯域信号y2[n]を算出する。

なお、抑圧ゲイン算出部４０２Ｅでは、歪み信号d[n]をノイズ成分と見なして、他の一般的なノイズサプレッサのアルゴリズムを用いることで、抑圧ゲインG[ω,f]を算出することもできる。例えば、スペクトル・サブトラクション（Spectral Subtraction）法（S. F. Boll, “Suppression of acoustic noise in speech using spectral subtraction”, IEEE Trans. Acoustics, Speech, and Signal Processing, vol.ASSP-29, pp.113-120 (1979).）、ウィナー・フィルター（Wiener Filter）法（J. S. Lim, A. V. Oppenheim, “Enhancement and bandwidth compression of noisy speech”, Proc. IEEE Vol.67, No.12, pp.1586-1604, Dec.1979.）および最尤推定（Maximum Likelihood）法（R. J. McAulay, M. L. Malpass, “Speech enhancement using a soft-decision noise suppression filter”, IEEE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-28, no.2, pp.137-145, Apr.1980.）などが適用できる。

また同様に、抑圧ゲイン算出部４０２Ｅでは、１フレーム前の歪み低減された第２の広帯域信号の周波数スペクトルY2[ω,f-1]を用いて、事前ＳＮ比ＳＮＲ_ＰＲＩＯ[ω,f]および事後ＳＮ比ＳＮＲ_ＰＯＳＴ[ω,f]を推定算出して、抑圧ゲインG[ω,f]を精度よく推定する手法（例えば、P. Scalart, J. V. Filho, ”Speech enhancement based on a priori signal to noise estimation”, Proc. ICASSP96, pp.629-632, May 1996.）、ＭＭＳＥ−ＳＴＳＡ（Minimum Mean-Square Error Short-Time Spectral Amplitude estimator）法（Y. Ephraim, D. Malah, “Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator”, IEEE Trans. on Acoustics, Speech, and Signal Processing, vol.ASSP-32, no.6, pp.1109-1121, Dec.1984.）およびJoint MAP法（T. Lotter, P. Vary, “Noise reduction by maximum a posteriori spectral amplitude estimation with super Gaussian speech modeling”, Proc. IWAENC, pp.83-86, Sep.2003.）などがある。

以上のように、歪み低減処理部４０２は周波数BINごとに処理するように説明したが、隣接する複数の周波数BINをまとめてグループを作り、そのグループ単位で処理を行っても構わない。

帯域通過フィルタ５０は、歪み低減処理部４０２が出力するデータ長2Nの第２の広帯域信号y2[n]のうち、その前半であるデータ（データ長N）と、１フレーム前のデータ長2Nの第２の広帯域信号y2[n]の後半のデータ（データ長N）とを、これらのオーバーラップ分を考慮して加算することで、データ長Nの第２の広帯域信号y2[n]を求める。

そして、この求めたデータ長Nの第２の広帯域信号y2[n]に対して帯域通過フィルタ５０は、拡張した周波数帯域のみを通過させるフィルタ処理を施し、これにより通過した信号、すなわち拡張した周波数帯域の信号をデータ長Nの第３の広帯域信号y3[n]として出力する。つまり、この実施例では、上記フィルタ処理により、fs_wb_low[Hz]からfs_nb_low[Hz]までの周波数帯域を通過させて、この周波数帯域の信号が第３の広帯域信号y3[n]として得られる。

信号遅延処理部７０は、データ長Nの入力信号x[n]を所定の時間（Dサンプル分）だけバッファし、入力信号x[n-D]として遅延させて出力することで、帯域通過フィルタ５０から出力される信号とタイミングを合わせる。すなわち、所定の時間（Dサンプル分）は、分析処理部１０への入力から帯域通過フィルタ５０から出力が得られるまでの処理遅延の時間に相当する。この値は、事前に求めておき、Dを常に固定値として用いればよい。

信号加算処理部８０は、信号遅延処理部７０から出力されるデータ長Nの入力信号x[n-D]と、データ長Nの第３の広帯域信号y3[n]とを、共にサンプリング周波数fs[Hz]のままで加算して、データ長Nの広帯域信号y[n]を出力信号として得る。これにより、入力信号x[n-D]は、第３の広帯域信号y3[n]分だけ帯域拡張される。

以上のように、上記構成の信号帯域拡張装置では、帯域拡張処理部３にて帯域拡張処理を行うにあたり、歪み制御処理部４０を設けて、これにより広帯域化処理に並列して、ピークを除去する処理を実施して基本周波数とその倍音の影響を除去して歪み成分を生成し、この歪み成分を用いて、広帯域化処理によって生じた調波構造の歪みを低減するようにしている。

したがって、上記構成の信号帯域拡張装置によれば、音質のよい帯域拡張された信号を生成することができる。また歪み制御処理部４０における計算量は少ないので、信号処理にかかる演算量を増大することもない。

図８にシミュレーションの結果を示す。この図は、fs=8000[Hz]、fs_nb_low=340[Hz]、fs_wb_low[Hz]=50[Hz]、fs_nb_high=fs_wb_high=3950[Hz]としたものであって、入力信号x[n]を音声信号とした場合のパワースペクトルの一例を示すものである。破線が従来の帯域拡張処理によって得られる出力信号のパワースペクトルであり、実線が本発明による帯域拡張処理によって得られる出力信号y[n]のパワースペクトルである。一点鎖線は、帯域拡張前の入力信号x[n]の音声信号のパワースペクトルを示す。この図に示すように、帯域拡張された出力信号y[n]は、50〜340[Hz]において、低域の調波構造で谷が深くなり、また歪みが低減されていることが分かる。

なお、上記実施の形態では、デコーダ２から帯域拡張処理部３に入力信号x[n]のみが入力される構成となっているが、デコーダ２で得られた情報、例えば線形予測係数LPC[m]や線形予測残差信号e[n]などを帯域拡張処理部３で用いるようにしてもよい。このようにすることで、計算量を少なくすることができる。

次に、上記第１の実施形態に係わる帯域拡張処理部３の第１の変形例について説明する。その構成を図９に示す。この図に示すように、第１の変形例は、広帯域化処理部２０と合成処理部３０との間に、第２の歪み制御処理部９０を設けたものである。この第２の歪み制御処理部９０は、周波数領域でのパワースペクトルのピークを強調する処理を実施するピーク強調処理部９０１と、周波数領域でのパワースペクトルのディップを強調する処理を実施するディップ強調処理部９０２とを備える。

ピーク強調処理部９０１は、残差広帯域化処理部２０３から出力された広帯域化されたデータ長2Nの線形予測残差信号e_wb[n]に対してパワースペクトルのピーク強調処理を施し、この処理によって得た信号e_wb1[n]をディップ強調処理部９０２に出力する。

ピーク強調処理部９０１の動作をより具体的に説明すると、ピーク強調処理部９０１は、はじめに広帯域化されたデータ長2Nの線形予測残差信号e_wb[n]を2N点を用いたＦＦＴなどの処理によって周波数領域に変換して、周波数スペクトルE_wb[ω,f]を得る。またピーク強調処理部９０１は、周波数スペクトルE_wb[ω,f]からパワースペクトル|E_wb[ω,f]|^２を算出する。

次に、ピーク強調処理部９０１は、fs_wb_low≦fs・ω/2N[Hz]≦fs_nb_low[Hz]を満たす拡張する周波数帯域について、パワースペクトル|E_wb[ω,f]|^２の平均値E_wb_powthr[f]を算出する。また、ピーク強調処理部９０１は、拡張する周波数帯域の内で、|E_wb[ω,f]|^２＞E_wb_powthr[f]となる周波数帯域でのパワースペクトルの平均値E_wb_powavr1[f]を算出する。

最後に、ピーク強調処理部９０１は、周波数スペクトルE_wb[ω,f]に上記ピーク強調ゲインG’[ω,f]を乗じ、この乗算結果をＩＦＦＴなどによって時間領域に変換して、ピーク強調したデータ長2Nの信号e_wb1[n]を得る。

ディップ強調処理部９０２は、ピーク強調したデータ長2Nの信号e_wb1[n]に対してパワースペクトルのディップ強調処理を施し、この処理によって得た信号e_wb2[n]を合成処理部３０に出力する。

ディップ強調処理部９０２の動作をより具体的に説明すると、ディップ強調処理部９０２は、はじめに広帯域化されたデータ長2Nの線形予測残差信号e_wb[n]を2N点を用いたＦＦＴなどの処理によって周波数領域に変換して、周波数スペクトルE_wb1[ω,f]を得る。またディップ強調処理部９０２は、周波数スペクトルE_wb1[ω,f]からパワースペクトル|E_wb1[ω,f]|^２を算出する。

次に、ディップ強調処理部９０２は、fs_wb_low≦fs・ω/2N[Hz]≦fs_nb_low[Hz]を満たす拡張する周波数帯域について、パワースペクトル|E_wb1[ω,f]|^２の平均値E_wb_powthr1[f]を算出する。また、ディップ強調処理部９０２は、拡張する周波数帯域の内で、|E_wb1[ω,f]|^２＜E_wb_powthr1[f]となる周波数帯域でのパワースペクトルの平均値E_wb_powavr2[f]を算出する。

最後に、ディップ強調処理部９０２は、周波数スペクトルE_wb1[ω,f]に上記ディップ強調ゲインG’’[ω,f]を乗じ、この乗算結果をＩＦＦＴなどによって時間領域に変換して、ディップ強調したデータ長2Nの信号e_wb2[n]を得る。このディップ強調したデータ長2Nの信号e_wb2[n]は、第１の線形予測合成部３０１に出力され、第１の線形予測合成部３０１では第１の実施形態における広帯域化されたデータ長2Nの線形予測残差信号e_wb[n]と同様に処理される。

以上のように、第１の実施形態の第１の変形例では、第２の歪み制御処理部９０を設けることで、拡張する周波数帯域において、線形予測合成前の広帯域化された信号について調波構造の山が盛り上がり谷が深くなり、山と谷がくっきりする。このため、広帯域化処理によって生じた調波構造の歪みをより低減することができ、広帯域化した帯域拡張された信号の音質を向上させることができる。

なお、計算量低減のために、ピーク強調処理部９０１とディップ強調処理部９０２において、ＦＦＴなどによる周波数領域変換処理、ＩＦＦＴなどによる時間領域変換処理およびピーク強調ゲインG’[ω,f]やディップ強調ゲインG’’[ω,f]の演算処理を共通化してもよい。

次に、上記第１の実施形態に係わる帯域拡張処理部３の第２の変形例について説明する。その構成を図１０に示す。この図に示すように、第２の変形例は、第１の線形予測合成部３０１の後段に、周波数領域でのパワースペクトルのディップを強調する処理を実施するディップ強調処理部４０３を設けたものである。

ディップ強調処理部４０３は、第１の線形予測合成部３０１から出力されたデータ長2Nの第１の広帯域信号y1[n]に対してパワースペクトルのディップ強調処理を施し、この処理によって得た信号y0[n]を第１の広帯域信号として歪み低減処理部４０２に出力する。これに対して、歪み低減処理部４０２は、データ長2Nの歪み信号d[n]を用いて、データ長2Nの第１の広帯域信号y0[n]に含まれる歪みを低減し、この歪みが歪み低減された広帯域信号を第２の広帯域信号y2[n]として出力する。

ディップ強調処理部４０３の動作をより具体的に説明すると、ディップ強調処理部４０３は、はじめに広帯域化されたデータ長2Nの線形予測残差信号y1[n]を2N点を用いたＦＦＴなどの処理によって周波数領域に変換して、周波数スペクトルY1[ω,f]を得る。またディップ強調処理部４０３は、周波数スペクトルY1[ω,f]からパワースペクトル|Y1[ω,f]|^２を算出する。

次に、ディップ強調処理部４０３は、fs_wb_low≦fs・ω/2N[Hz]≦fs_nb_low[Hz]を満たす拡張する周波数帯域について、|Y1[ω-1,f]|^２＞|Y1[ω,f]|^２かつ|Y1[ω,f]|^２＜|Y1[ω+1,f]|^２であって隣接周波数BINのパワースペクトルよりも小さい周波数BINを、周波数領域でのパワースペクトルのディップとして抽出する。それから、ディップ強調処理部４０３は、これらの抽出した周波数BINに対してディップ強調ゲインG’’’[ω,f]を例えば0と設定するなど1よりも小さくなるようにし、周波数領域でのパワースペクトルのディップとして抽出しない周波数BINについては、G’’’[ω,f]=1とする。

最後に、ディップ強調処理部４０３は、周波数スペクトルY1[ω,f]に上記ディップ強調ゲインG’’’[ω,f]を乗じ、この乗算結果をＩＦＦＴなどによって時間領域に変換して、ディップ強調したデータ長2Nの信号y0[n]を得る。このディップ強調したデータ長2Nの信号y0[n]は、歪み低減処理部４０２に出力され、歪み低減処理部４０２では第１の実施形態における第１の広帯域信号y1[n]と同様に処理される。

以上のように、第１の実施形態の第２の変形例では、ディップ強調処理部４０３を設けることで、拡張する周波数帯域において、線形予測合成前の広帯域化された信号について調波構造の谷が深くなる。このため、広帯域化処理によって生じた調波構造の歪みを低減することができ、広帯域化した帯域拡張された信号の音質を向上させることができる。

次に、上記第１の実施形態に係わる帯域拡張処理部３の第３の変形例について説明する。その構成を図１１に示す。この図に示すように、第３の変形例は、第２の線形予測合成部４０１Ｂの後段に、低周波数域を強調する処理を実施する低域強調部４０４を設けたものである。

低域強調部４０４は、第２の線形予測合成部４０１Ｂから出力されたデータ長2Nの広帯域の歪み信号d[n]に対して、ディエンファシスフィルタにより、拡張した低域の周波数帯域を含む低周波数域を強調する処理を施して、拡張した低域の周波数帯域が強調されたデータ長2Nの広帯域の歪み信号d0[n]を得ることができる。ディエンファシスフィルタとしては、例えば下式（６）に示す伝達関数を有するフィルタを用いる。

これに対して、歪み低減処理部４０２は、データ長2Nの歪み信号d0[n]を用いて、データ長2Nの第１の広帯域信号y1[n]に含まれる歪みを低減し、この歪みが歪み低減された広帯域信号を第２の広帯域信号y2[n]として出力する。すなわち歪み低減処理部４０２は、歪み成分を表した歪み信号d[n]を用いて、第１の広帯域信号y1[n]の調波構造の谷のパワーを下げることで調波構造の歪みを低減し、理想的な広帯域信号に近づける処理を行う。

以上のように、第１の実施形態の第３の変形例では、歪み成分生成処理部４０１で生成した歪み成分について、拡張した低域の周波数域を強調するようにしているので、拡張する周波数帯域において、聴覚上、耳障りになりやすい低周波数域での調波構造の歪みをより低減させることができ、このために広帯域に帯域拡張された信号の音質を向上させることができる。

次に、上記第１の実施形態に係わる帯域拡張処理部３の第４の変形例について説明する。その構成を図１２に示す。この図に示すように、第４の変形例は、歪み低減処理部４０２を、残差広帯域化処理部２０３と第１の線形予測合成部３０１の間に設けることで、第２の線形予測合成部４０１Ｂを不要としたもので、ピーク除去処理部４０１Ａにて得られる線形予測残差信号p[n]を歪み低減処理部４０２に出力する。

ピーク除去処理部４０１Ａは、上記データ長2Nの線形予測残差信号e[n]に対して、メディアンフィルタや時間方向に平滑化して更新する平滑化フィルタ、あるいは線形フィルタである低域通過フィルタのように、残差広帯域化処理部２０３と相関が低い処理を実施して、これにより広帯域化されるとともに、時間領域の振幅の絶対値が大きいサンプルの振幅を低減することでピーク除去し、データ長2Nのピーク除去された線形予測残差信号p[n]を出力する。ここでは線形予測残差信号のレベルで歪み成分を考えており、理想的な広帯域信号の線形予測残差信号と広帯域化処理部２０によって生成された線形予測残差信号e_wb[n]との差異を歪み成分とし、ピーク除去処理部４０１Ａで得られたデータ長2Nのピーク除去された線形予測残差信号p[n]を歪み成分として用いる。

なお、ピーク除去処理部４０１Ａでの処理は、残差広帯域化処理部２０３での処理となるべく異なるようにすればよいため、残差広帯域化処理部２０３の処理を別の処理に変更することで対応してもよい。

歪み低減処理部４０２は、ピーク除去処理部４０１Ａで得られたデータ長2Nのピーク除去された線形予測残差信号p[n]を用いて、残差広帯域化処理部２０３で得られた広帯域化されたデータ長2Nの線形予測残差信号e_wb[n]に含まれる歪みを低減し、この歪みが歪み低減された信号を、線形予測残差信号ed[n]として出力する。すなわち、歪み低減処理部４０２は、図２に示した構成と入力信号は異なるが、同様の処理を実施する。

第１の線形予測合成部３０１は、上記線形予測係数LPC[m]を用いて線形予測合成フィルタを形成し、その線形予測合成フィルタに広帯域化されたデータ長2Nの線形予測残差信号ed[n]を入力して、データ長2Nの第２の広帯域信号y2[n]を合成し、帯域通過フィルタ５０に出力する。

以上のように、第１の実施形態の第４の変形例では、歪み低減処理部４０２を、第１の線形予測合成部３０１の前段に設けることで、第２の線形予測合成部４０１Ｂを不要としている。したがって、図２に示した構成に比べて線形予測合成の回数を少なくすることができ、演算量を削減することができる。

また、この構成では、ピーク除去処理部４０１Ａが、広帯域化処理とは異なるピーク除去を行って基本周波数とその倍音の影響を除去した歪み成分を生成し、広帯域化処理によって生じた調波構造の歪みを低減するようにしているので、広帯域に帯域拡張された信号の音質を向上させることができる。

次に、帯域拡張処理部３の第２の実施形態について説明する。
以下に述べる帯域拡張処理部３は、第１の実施形態と同様に、ある周波数帯域に帯域制限された音声や音楽・オーディオなどの信号（入力信号）を、この信号が持つ周波数帯域を包含する広い周波数帯域の信号に変換することで、高音質な信号を合成するものである。このために、帯域拡張処理部３は、上記入力信号として受話信号x[n]が入力され、この信号にフレーム毎に帯域拡張処理を施して、帯域拡張された受話信号y[n]を出力信号として得る。

なお、第１の実施形態に係わる帯域拡張処理部３は、デコーダ２で用いたサンプリング周波数fs[Hz]を変更することなく信号処理しているが、これに対して第２の実施形態に係わる帯域拡張処理部３では、サンプリング周波数をfs’[Hz]にアップサンプリングして信号処理する。すなわち、fs < fs’である。

以下の説明では、入力信号は、fs_nb_low[Hz]からfs_nb_high[Hz]までに帯域制限されているものとし、帯域拡張処理部３の帯域拡張処理によりfs_wb_low[Hz]からfs_wb_high[Hz]までの帯域に拡張される。すなわち、fs_wb_low ≦ fs_nb_low < fs_nb_high ≦ fs_wb_high < fs/2 を満たし、さらにfs_nb_high < fs/2 < fs_wb_high < fs’/2 を満たすものとする。

また以下の説明では、高域拡張を例に挙げるため、fs_nb_low=fs_wb_lowとして説明し、fs=8000[Hz]、fs’=16000[Hz]、fs_nb_low=100[Hz]、fs_nb_high=3950[Hz]、fs_wb_low=100[Hz]、fs_wb_high=7950[Hz]とする。帯域制限の周波数帯域やサンプリング周波数については、これに限らない。また、フレーム長をN=160とする。

図１３は、この発明に係わる帯域拡張処理部３の第２の実施形態の構成を示すものである。この図に示すように、第２の実施形態の帯域拡張処理部３は、分析処理部１０と、広帯域化処理部２０と、合成処理部３０と、歪み制御処理部４０と、帯域通過フィルタ５０と、アップサンプリング部６０と、信号遅延処理部７０と、信号加算処理部８０とを備える。なお、以下の説明において、第１の実施形態に係わる帯域拡張処理部３の構成と同様の部分については、必要に応じて適宜省略して説明する。

分析処理部１０は、線形予測分析部１０１と、逆フィルタ１０２とを備える。
線形予測分析部１０１は、狭帯域に帯域制限された入力信号x[n]が入力され、これを線形予測分析して、M次の線形予測係数LPC[m] (m=0,1…M-1)を得る。具体的には、線形予測分析の対象となる現在のフレームの入力信号x[n]と、このフレームの直前の過去の１フレームの入力信号の合計２フレームを用いる。このデータ長2Nの入力信号x[n]に対して、窓関数をハミング窓としてデータ長2Nの窓掛けを行い、その信号に対してM次の線形予測分析を行う。

ここでは、例として、次の時刻（フレーム）での入力信号x[n]のシフト幅（Nサンプル）と窓掛けを行った入力信号x[n]のデータ長（2Nサンプル）の比であるオーバーラップは50%とする。この際、窓掛けに用いる窓関数は、ハミング窓に限定せず、他の対称窓（ハニング窓、ブラックマン窓、ｓｉｎ窓など）あるいは音声符号化処理で用いられるような非対称窓などに適宜変更してよい。またオーバーラップは、50%に限らない。この実施形態では、スペクトル包絡を線形予測係数で表現する場合を例にしているが、線スペクトル対(LSP)や線スペクトル周波数(LSF)、PARCOR係数、メルケプストラム係数などで表現してもよい。

逆フィルタ１０２は、線形予測分析部１０１で得た線形予測係数LPC[m]を用いて逆フィルタを形成し、その逆フィルタに線形予測分析部１０１から出力された窓掛けしたデータ長2Nの入力信号x[n]を入力し、データ長2Nの狭帯域の線形予測残差信号e_nb[n]を得る。

広帯域化処理部２０は、スペクトル包絡広帯域化処理部２０１と、アップサンプリング部２０２と、残差広帯域化処理部２０３とを備える。

スペクトル包絡広帯域化処理部２０１は、線形予測分析部１０１で得た線形予測係数LPC[m]を、fs_wb_low[Hz]からfs_nb_high[Hz]までに対応するM_WB次の広帯域の線形予測係数LPC_WB[m] (m=0,1…M_WB-1)に変換する。ここで、狭帯域の線形予測係数から広帯域の線形予測係数に変換する手法としては、ベクトル量子化(VQ)による符号帳を用いる手法（例えば、吉田, 阿部, ”コードブックマッピングによる狭帯域音声から広帯域音声の生成法”, 信学論(D-II), vol.J78-D-II, No.3, pp.391-399, Mar 1995.）や、GMMを用いる手法（例えば、K. Y. Park, H. S. Kim, ”Narrowband to Wideband Conversion of Speech using GMM based Transformation”, Proc. ICASSP2000, vol.3, pp.1843-1846, Jun 2000.）や、ベクトル量子化(VQ)による符号帳とHMMを用いる手法（例えば、G. Chen, V. Parsa, ”HMM-based Frequency Bandwidth Extension for Speech Enhancement using Line Spectral Frequencies”, Proc. ICASSP2004, vol.1, pp.709-712, 2004.）や、HMMを用いる手法（例えば、S. Yao, C. F. Chan, ”Block-based Bandwidth Extension of Narrowband Speech Signal by using CDHMM”, Proc. ICASSP2005, vol.1, pp.793-796, 2005.）などがあり、どれを用いても構わない。

ここでは例えばGMMを用いる手法として、狭帯域に帯域制限された信号と理想的な広帯域信号をペアとし、そのペアを多数有するデータベースから、事前にM次の狭帯域の線形予測係数LPC[m] (m=0,1…M-1)とM_WB次の広帯域の線形予測係数LPC_WB[m] (m=0,1…M_WB-1)を求め、それをペアとして連結してGMMを構成しておき、入力信号x[n]のM次の線形予測係数LPC[m]に応じて、GMMから２乗誤差最小の基準（ＭＭＳＥ）でM_WB次の広帯域の線形予測係数LPC_WB[m]を出力する方法とする。

アップサンプリング部２０２は、逆フィルタ１０２で得たデータ長2Nの狭帯域の線形予測残差信号e_nb[n]を、サンプリング周波数fs[Hz]からfs’[Hz]にアップサンプリングし、アップサンプリングされたデータ長4Nの線形予測残差信号e[n]を得る。なお、アップサンプリング処理としては、sync関数を畳み込む手法や、1サンプルごとに零挿入してエイリアシングを除去する手法などが考えられる。

残差広帯域化処理部２０３は、アップサンプリング部２０２で得たデータ長4Nの線形予測残差信号e[n]に、図３に示したような非線形関数（半波整流）によって基本周波数の倍音ごとに周波数領域でピークを持つ構造（調波構造）にする非線形処理を施し、これによって、広帯域化されたデータ長4Nの線形予測残差信号e_wb[n]を得る。

合成処理部３０は、第１の線形予測合成部３０１を備える。第１の線形予測合成部３０１は、スペクトル包絡広帯域化処理部２０１で得たLPC_WB[m]を用いて線形予測合成フィルタを形成し、その線形予測合成フィルタに広帯域化されたデータ長4Nの線形予測残差信号e_wb[n]を入力して、データ長4Nの第１の広帯域信号y1[n]を合成する。

ピーク除去処理部４０１Ａは、上記データ長4Nの線形予測残差信号e[n]に対して、例えば図６（ａ）や図６（ｂ）に示した非線形関数を用いて非線形処理を施すものであって、これにより広帯域化されるとともに時間領域の振幅の絶対値が大きいサンプルの振幅を低減して、データ長4Nのピーク除去された線形予測残差信号p[n]を出力する。なお、図６中のＡは、閾値を示す。

上記線形予測残差信号e[n]には、時間領域の振幅の絶対値が大きいサンプル（パルス）が含まれている。このパルスの一番長い時間間隔がピッチ周期であり、このピッチ周期は、基本周波数の逆数になっている。パルスの短い時間間隔は、倍音に相当する。つまり、上記振幅の絶対値が大きいサンプルは、周波数領域では基本周波数とその倍音に相当し、周波数領域での単一の山あるいは調波構造の複数の山を構成するため、ピーク除去処理部４０１Ａによって、上記線形予測残差信号e[n]の時間領域の振幅の絶対値が大きいサンプルの振幅を低減させることによって、調波構造の山のレベルを谷のレベルまで下げ、調波構造の山と谷のレベル差を圧縮する。理想的な広帯域信号の線形予測残差信号では調波構造の谷におけるパワーは小さいはずであり、ここでは、理想的な広帯域信号の線形予測残差信号と広帯域化処理部２０によって生成された線形予測残差信号e_wb[n]との差異は、広帯域化処理部２０によって生成された線形予測残差信号e_wb[n]のそれぞれの周波数領域での調波構造の谷のパワー分であると考え、この調波構造の山のレベルが谷のレベルまで下げられた信号を用いて、後述する第２の線形予測合成部４０１Ｂにおいて歪み成分を算出する。

なお、ピーク除去処理部４０１Ａで行われるピーク除去処理に用いる非線形関数（図６参照）は、線形予測残差信号e[n]の振幅、パワーあるいは振幅の絶対値などの最大値などを検出し、これに応じてフレーム毎に動的に変化させてもよい。例えば、前述の実施例１のように、閾値Aを線形予測残差残差信号のパワーに応じてフレーム毎に変化させてもよい。

また、上記ピーク除去処理は、時間領域の振幅の絶対値が大きいサンプルの振幅を低減させる処理であればよく、前述の実施例１のように、非線形フィルタであるメディアンフィルタや、前述の式（１）のように時間方向に平滑化して更新する平滑化フィルタや、線形フィルタである低域通過フィルタを適用してもよい。ただし、低域通過フィルタは、基本周波数を除去するような通過帯域に設定することが望ましい。

第２の線形予測合成部４０１Ｂは、上記線形予測係数LPC[m]を用いて線形予測合成フィルタを形成し、その線形予測合成フィルタに上記データ長4Nのピーク除去された線形予測残差信号p[n]を入力して、データ長4Nの広帯域の歪み信号d[n]を合成する。すなわち、理想的な広帯域信号と合成処理部３０によって生成された第１の広帯域信号y1[n]との差異である歪み成分は、広帯域化処理部２０によって生成された線形予測残差信号e_wb[n]のそれぞれの周波数での調波構造の谷のパワー分に起因していると考え、この調波構造の山のレベルが谷のレベルまで下げられた信号であるピーク除去された線形予測残差信号p[n]を線形予測合成フィルタに入力することで、歪み成分を表した歪み信号d[n]を算出する。

歪み低減処理部４０２は、データ長4Nの歪み信号d[n]を用いて、データ長4Nの第１の広帯域信号y1[n]に含まれる歪みを低減し、この歪みが歪み低減された広帯域信号を第２の広帯域信号y2[n]として出力する。すわなち、歪み低減処理部４０２は、歪み成分を表した歪み信号d[n]を用いて、第１の広帯域信号y1[n]の調波構造の谷のパワーを下げることで調波構造の歪みを低減し、理想的な広帯域信号に近づける処理を行う。なお、歪み低減処理部４０２は、第１の実施形態と同様に、例えば図７に示すように構成できる。ここではその説明を省略する。

帯域通過フィルタ５０は、歪み低減処理部４０２が出力するデータ長4Nの第２の広帯域信号y2[n]のうち、その前半であるデータ（データ長2N）と、１フレーム前のデータ長4Nの第２の広帯域信号y2[n]の後半のデータ（データ長2N）とを、これらのオーバーラップ分を考慮して加算することで、データ長2Nの第２の広帯域信号y2[n]を求める。

そして、この求めたデータ長2Nの第２の広帯域信号y2[n]に対して帯域通過フィルタ５０は、拡張した周波数帯域のみを通過させるフィルタ処理を施し、これにより通過した信号、すなわち拡張した周波数帯域の信号をデータ長2Nの第３の広帯域信号y3[n]として出力する。つまり、この実施例では、上記フィルタ処理により、fs_nb_high[Hz]からfs_wb_high[Hz]までの周波数帯域が通過して、この周波数帯域の信号が第３の広帯域信号y3[n]として得られる。

アップサンプリング部６０は、狭帯域に帯域制限された入力信号x[n]を、サンプリング周波数fs[Hz]からfs’[Hz]にアップサンプリングし、アップサンプリングされたデータ長2Nの入力信号x_wb[n]を得る。なお、アップサンプリング処理としては、アップサンプリング部２０２と同様に、sync関数を畳み込む手法や、1サンプルごとに零挿入してエイリアシングを除去する手法などが考えられる。

信号遅延処理部７０は、データ長2Nのアップサンプリングされた入力信号x_wb[n]を所定の時間（Dサンプル分）だけバッファし、アップサンプリングされた入力信号x_wb[n-D]として遅延させて出力することで、帯域通過フィルタ５０から出力される信号とタイミングを合わせる。すなわち、所定の時間（Dサンプル分）は、分析処理部１０への入力から帯域通過フィルタ５０から出力が得られるまでの処理遅延の時間から、アップサンプリング部６０での処理における処理遅延の時間を引いた分に相当する。この値は、事前に求めておき、Dを常に固定値として用いればよい。

信号加算処理部８０は、信号遅延処理部７０から出力されるデータ長2Nのアップサンプリングされた入力信号x_wb[n-D]と、データ長2Nの第３の広帯域信号y3[n]とを、共にサンプリング周波数fs’[Hz]のままで加算して、データ長2Nの広帯域信号y[n]を出力信号として得る。これにより、アップサンプリングされた入力信号x_wb[n-D]は、第３の広帯域信号y3[n]分だけ帯域拡張される。

したがって、上記構成の信号帯域拡張装置によれば、アップサンプリングを行う場合でも、音質のよい帯域拡張された信号を生成することができる。また歪み制御処理部４０における計算量は少ないので、信号処理にかかる演算量を増大することもない。

次に、上記第２の実施形態に係わる帯域拡張処理部３の第１の変形例について説明する。その構成を図１４に示す。この図に示すように、アップサンプリング部６０を、分析処理部１０の前段に設けるとともに、アップサンプリング部２０２を除き逆フィルタ１０２の出力が残差広帯域化処理部２０３とピーク除去処理部４０１Ａに入力されるようにしたものである。

線形予測分析部１０１は、アップサンプリング部６０によって入力信号x[n]がアップサンプリングされた入力信号x_wb[n]入力され、これを線形予測分析して、M次の線形予測係数LPC[m] (m=0,1…M-1)を得る。具体的には、線形予測分析の対象となる現在のフレームの入力信号x[n]と、このフレームの直前の過去の１フレームの入力信号の合計２フレームを用いる。このデータ長4Nの入力信号x[n]に対して、ハミング窓による窓掛けを行い、その信号に対してM次の線形予測分析を行う。ここでは、オーバーラップは50%としている。この際、窓掛けやオーバラップ長は適宜変更してよい。

逆フィルタ１０２は、線形予測分析部１０１で得た線形予測係数LPC[m]を用いて逆フィルタを形成し、その逆フィルタに線形予測分析部１０１によって窓掛けしたデータ長4Nの入力信号x_wb[n]を入力し、データ長4Nの線形予測残差信号e[n]を得て、残差広帯域化処理部２０３に出力される。

このような構成であっても、図１３に示した構成と同様に広帯域に帯域拡張された信号の音質を向上させることができるとともに、アップサンプリング部６０を、分析処理部１０の前段に設けることで、アップサンプリング部２０２を不要としている。したがって、図１３に示した構成と比べて、アップサンプリングの処理を少なくすることができ、演算量を削減することができる。

次に、上記第２の実施形態に係わる帯域拡張処理部３の第２の変形例について説明する。その構成を図１５に示す。この図に示すように、第２の変形例は、歪み低減処理部４０２を、残差広帯域化処理部２０３と第１の線形予測合成部３０１の間に設けることで、第２の線形予測合成部４０１Ｂを不要としたもので、ピーク除去処理部４０１Ａにて得られる線形予測残差信号p[n]を歪み低減処理部４０２に出力する。

ピーク除去処理部４０１Ａは、上記データ長4Nの線形予測残差信号e[n]に対して、メディアンフィルタや時間方向に平滑化して更新する平滑化フィルタ、あるいは線形フィルタである低域通過フィルタのように残差広帯域化処理部２０３と相関が低い処理を実施して、これにより広帯域化されるとともに、時間領域の振幅の絶対値が大きいサンプルの振幅を低減することでピーク除去し、データ長4Nのピーク除去された線形予測残差信号p[n]を得る。ここでは線形予測残差信号のレベルで歪み成分を考えており、理想的な広帯域信号の線形予測残差信号と広帯域化処理部２０によって生成された線形予測残差信号e_wb[n]との差異を歪み成分とし、ピーク除去処理部４０１Ａで得られたデータ長4Nのピーク除去された線形予測残差信号p[n]を歪み成分として用いている。

歪み低減処理部４０２は、ピーク除去処理部４０１Ａで得られたデータ長4Nのピーク除去された線形予測残差信号p[n]を用いて、残差広帯域化処理部２０３で得られた広帯域化されたデータ長4Nの線形予測残差信号e_wb[n]に含まれる歪みを低減し、この歪みが歪み低減された信号を、線形予測残差信号ed[n]として出力する。すなわち、歪み低減処理部４０２は、図１３に示した構成と入力信号は異なるが、同様の処理を実施する。

第１の線形予測合成部３０１は、上記線形予測係数LPC_WB[m]を用いて線形予測合成フィルタを形成し、その線形予測合成フィルタに広帯域化されたデータ長4Nの線形予測残差信号ed[n]を入力して、データ長4Nの第２の広帯域信号y2[n]を合成し、帯域通過フィルタ５０に出力する。

以上のように、第２の実施形態の第２の変形例では、歪み低減処理部４０２を、第１の線形予測合成部３０１の前段に設けることで、第２の線形予測合成部４０１Ｂを不要としている。したがって、図１３に示した構成に比べて線形予測合成の回数を少なくすることができ、演算量を削減することができる。

なお、図１４に示した第２の実施形態の第１の変形例のような変形は、図１５に示した第２の実施形態の第２の変形例の構成にも適用できる。その構成を、第２の実施形態の第３の変形例として図１６に示す。
このような構成によれば、図１５に示した構成と同様に広帯域に帯域拡張された信号の音質を向上させることができるとともに、アップサンプリング部６０を、分析処理部１０の前段に設けることで、アップサンプリング部２０２を不要としている。また歪み低減処理部４０２を、第１の線形予測合成部３０１の前段に設けることで、第２の線形予測合成部４０１Ｂを不要としている。

したがって、図１５に示した構成と比べて、アップサンプリングの処理を少なくすることができ、また線形予測合成の回数を少なくすることができ、演算量を削減することができる。

以上の実施形態では、携帯電話などの無線通信装置の受信系に本発明を適用した場合について説明したが、これに限定されるものではなく、例えばディジタルオーディオプレイヤに適用することもできる。ディジタルオーディオプレイヤとしては、近時、携帯電話機やパーソナルコンピュータ、あるいは専用の携帯型音楽再生機も市場に出回っている。

このようなディジタルオーディオプレイヤは、図１に示した無線通信部１に代わって記憶部６を設け、この記憶部６に符号化された音楽（音声）データを記憶し、これをデコーダ２が必要に応じて読み出して復号を行う。
すなわち、記憶部６に蓄えられ、図示しないユーザインタフェースを通じてユーザから再生が要求された再生データは、デコーダ２により、事前に決められた単位（1フレーム=Nサンプル）ごとに読み出され、入力信号x[n] (n=0,1,…N-1)としてディジタル信号に復号される。以下の説明では、入力信号のサンプリング周波数をfs[Hz]とする。

デコーダ２で復号されたディジタル信号は、１フレームごとに帯域拡張処理部３に出力される。帯域拡張処理部３は、ディジタル信号である入力信号x[n]に対して、サンプリング周波数をfs[Hz]のまま１フレームごとに帯域拡張処理を施す。これによって得られた帯域拡張された入力信号y[n]は、１フレームごとにD/A変換器４に出力され、ここでアナログ信号y(t)に変換されスピーカ５より拡声出力される。

第３の実施形態として、本発明を適用したディジタルオーディオプレイヤについて説明する。ディジタルオーディオプレイヤは、図１７に示すように構成される。また帯域拡張処理部３は、例えば図１８に示すように構成される。

図１８に示す帯域拡張処理部３は、ある周波数帯域に帯域制限された音声や音楽・オーディオなどの信号（入力信号）を、この信号が持つ周波数帯域を包含する広い周波数帯域の信号に変換することで、高音質な信号を合成するものである。このために、帯域拡張処理部３は、上記入力信号として信号x[n]が入力され、この入力信号にフレーム毎に帯域拡張処理を施して、帯域拡張された広帯域信号y[n]を出力信号として得る。

以下の説明では、入力信号は、fs_nb_low[Hz]からfs_nb_high[Hz]までに帯域制限されているものとし、帯域拡張処理部３の帯域拡張処理によりfs_wb_low[Hz]からfs_wb_high[Hz]までの帯域に拡張される。すなわち、fs_wb_low ≦ fs_nb_low < fs_nb_high ≦ fs_wb_high < fs/2 を満たすものとする。

また以下の説明では、音楽・オーディオの周波数帯域を考慮し、fs=44100[Hz]、fs_nb_low = 20[Hz]、fs_nb_high=16000[Hz]、fs_wb_low=20[Hz]、fs_wb_high=22000[Hz]とする。帯域制限の周波数帯域やサンプリング周波数については、これに限らない。また、フレーム長をN=512とする。

図１８に示すように、第３の実施形態の帯域拡張処理部３は、広帯域化処理部２０と、歪み制御処理部４０と、帯域通過フィルタ５０と、信号遅延処理部７０と、信号加算処理部８０とを備える。

広帯域化処理部２０は、データ長Nの入力信号x[n]が入力され、これに、図３に示したような非線形関数（半波整流）によって基本周波数の倍音ごとに周波数領域でピークを持つ構造（調波構造）にする非線形処理を施し、これによって、広帯域化されたデータ長Nの第１の広帯域信号y1[n]を得る。図３に示される非線形関数は、倍音ごとに周波数領域でピークを持つ構造に変換する関数であるが、これ以外にも２倍音、３倍音など整数倍の倍音に対応する非線形関数など（例えば、R. M. Aarts, E. Larsen, D. Schobben, ”Improving Perceived Bass and Reconstruction of High Frequencies for Band Limited Signal”, Proc. 1^st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), pp.59-71, Nov 2002.）を用いても構わない。

歪み制御処理部４０は、歪み成分生成処理部４０１と、歪み低減処理部４０２とを備える。また歪み成分生成処理部４０１は、ピーク除去処理部４０１Ａを備える。第１の広帯域信号y1[n]における広帯域化処理部２０の残差広帯域化処理部２０３における非線形処理によって生成された調波構造は、周波数領域でのパワーの極大点（調波構造の山）のパワーが理想的な広帯域信号と比較すると小さくなっていたり、周波数領域でのパワーの極小点（調波構造の谷）のパワーが理想的な広帯域信号と比較すると大きくなっていたり、周波数領域でのパワーの極大点とその近傍にあるパワーの極小点のパワー差が理想的な広帯域信号と比較すると小さくなっていたりする。また、このようなことが、複数の周波数領域でのパワーの極大点及び極小点で起きる。第１の広帯域信号y1[n]と理想的な広帯域信号との差異や違いを、歪みあるいは歪み成分と呼ぶ。歪み制御処理部４０は、この歪みを低減し、最終的な帯域拡張された信号が人工的ではない自然な音に聞こえるように制御する。

ピーク除去処理部４０１Ａは、データ長Nの入力信号x[n]に対して、例えば図６（ａ）や図６（ｂ）に示した非線形関数を用いて非線形処理を施すものであって、これにより広帯域化されるとともに時間領域の振幅の絶対値が大きいサンプルの振幅を低減して、データ長Nのピーク除去された歪み信号d[n]を得る。なお、図６中のＡは、閾値を示す。理想的な広帯域信号では調波構造の谷におけるパワーは小さいはずであり、ここでは、理想的な広帯域信号と広帯域化処理部２０によって生成された第１の広帯域信号y1[n]との差異は、広帯域化処理部２０によって生成された第１の広帯域信号y1[n]のそれぞれの周波数での調波構造の谷のパワー分であると考え、この調波構造の山のレベルが谷のレベルまで下げられた信号を歪み信号d[n]として算出する。

歪み低減処理部４０２は、データ長Nの歪み信号d[n]を用いて、データ長Nの第１の広帯域信号y1[n]に含まれる歪みを低減し、この歪みが歪み低減された広帯域信号を第２の広帯域信号y2[n]として出力する。すなわち、歪み低減処理部４０２は、歪み成分を表した歪み信号d[n]を用いて、第１の広帯域信号y1[n]の調波構造の谷のパワーを下げることで調波構造の歪みを低減し、理想的な広帯域信号に近づける処理を行う。

帯域通過フィルタ５０は、歪み低減処理部４０２が出力するデータ長Nの第２の広帯域信号y2[n]に対して、拡張した周波数帯域のみを通過させるフィルタ処理を施し、これにより通過した信号、すなわち拡張した周波数帯域の信号をデータ長Nの第３の広帯域信号y3[n]として出力する。つまり、この実施例では、上記フィルタ処理により、fs_nb_high[Hz]からfs_wb_high[Hz]までの周波数帯域が通過して、この周波数帯域の信号が第３の広帯域信号y3[n]として得られる。

信号遅延処理部７０は、データ長Nの入力信号x[n]を所定の時間（Dサンプル分）だけバッファし、入力信号x[n-D]として遅延させて出力することで、帯域通過フィルタ５０から出力される信号とタイミングを合わせる。すなわち、所定の時間（Dサンプル分）は、広帯域化処理部２０などへの入力から帯域通過フィルタ５０から出力が得られるまでの処理遅延の時間に相当する。この値は、事前に求めておき、Dを常に固定値として用いればよい。

また、入力信号がモノラル信号ではなくステレオ信号であったとしても、例えばＬ（左）チャネルとＲ（右）チャネルにそれぞれ上記帯域拡張処理部３における帯域拡張処理を施したり、和信号（ＬチャネルとＲチャネルの信号の和）と差信号（ＬチャネルからＲチャネルの信号の差）にそれぞれ上記の帯域拡張処理を施したりすることで同様の効果が得られる。

次に、上記第４の実施形態に係わる帯域拡張処理部３について説明する。その構成を図１９に示す。この図に示す帯域拡張処理部３は、図１７に示したディジタルオーディオプレイヤに適用可能な帯域拡張処理部３であって、図１８に示した帯域拡張処理部３と比べ、アップサンプリング部６０を、広帯域化処理部２０、歪み制御処理部４０および信号遅延処理部７０の前段に設け、各部で扱う信号のサンプリング周波数をfs[Hz]からfs’[Hz]にアップサンプリングしたものである。

以下の説明では、入力信号は、fs_nb_low[Hz]からfs_nb_high[Hz]までに帯域制限されているものとし、帯域拡張処理部３の帯域拡張処理によりfs_wb_low[Hz]からfs_wb_high[Hz]までの帯域に拡張される。すなわち、fs_wb_low ≦ fs_nb_low < fs_nb_high ≦ fs_wb_highを満たすものとする。さらに、fs_nb_high < fs/2 < fs_wb_high < fs’/2を満たすものとする。またこの実施形態では、fs_wb_low = fs_nb_lowとする。
また以下の説明では、音楽・オーディオの周波数帯域を考慮し、fs=32000[Hz]、fs’=44100[Hz]、fs_nb_low = 20[Hz]、fs_nb_high=15900[Hz]、fs_wb_low=20[Hz]、fs_wb_high=22000[Hz]とする。帯域制限の周波数帯域やサンプリング周波数については、これに限らない。また、フレーム長をN=512とする。

アップサンプリング部６０は、fs_nb_high[Hz]に帯域制限された入力信号x[n]を、サンプリング周波数fs[Hz]からfs’[Hz]にアップサンプリングし、アップサンプリングされたデータ長2Nの入力信号x_wb[n]を得る。

広帯域化処理部２０は、アップサンプリングされたデータ長2Nの入力信号x_wb[n]が入力され、これに、図３に示したような非線形関数（半波整流）によって基本周波数の倍音ごとに周波数領域でピークを持つ構造（調波構造）にする非線形処理を施し、これによって、広帯域化されたデータ長2Nの第１の広帯域信号y1[n]を得る。

ピーク除去処理部４０１Ａは、アップサンプリングされたデータ長2Nの入力信号x_wb[n]に対して、例えば図６（ａ）や図６（ｂ）に示した非線形関数を用いて非線形処理を施すものであって、これにより広帯域化されるとともに時間領域の振幅の絶対値が大きいサンプルの振幅を低減して、データ長2Nのピーク除去された歪み信号d[n]を得る。なお、図６中のＡは、閾値を示す。理想的な広帯域信号では調波構造の谷におけるパワーは小さいはずであり、ここでは、理想的な広帯域信号と広帯域化処理部２０によって生成された第１の広帯域信号y1[n]との差異は、広帯域化処理部２０によって生成された第１の広帯域信号y1[n]のそれぞれの周波数での調波構造の谷のパワー分であると考え、この調波構造の山のレベルが谷のレベルまで下げられた信号を歪み信号d[n]として算出する。

歪み低減処理部４０２は、データ長2Nの歪み信号d[n]を用いて、データ長2Nの第１の広帯域信号y1[n]に含まれる歪みを低減し、この歪みが歪み低減された広帯域信号を第２の広帯域信号y2[n]として出力する。すなわち、歪み低減処理部４０２は、歪み成分を表した歪み信号d[n]を用いて、第１の広帯域信号y1[n]の調波構造の谷のパワーを下げることで調波構造の歪みを低減し、理想的な広帯域信号に近づける処理を行う。

帯域通過フィルタ５０は、歪み低減処理部４０２が出力するデータ長2Nの第２の広帯域信号y2[n]に対して、拡張した周波数帯域のみを通過させるフィルタ処理を施し、これにより通過した信号、すなわち拡張した周波数帯域の信号をデータ長2Nの第３の広帯域信号y3[n]として出力する。つまり、この実施例では、上記フィルタ処理により、fs_nb_high[Hz]からfs_wb_high[Hz]までの周波数帯域が通過して、この周波数帯域の信号が第３の広帯域信号y3[n]として得られる。

信号遅延処理部７０は、アップサンプリングされたデータ長2Nの入力信号x_wb[n]を所定の時間（Dサンプル分）だけバッファし、アップサンプリングされた入力信号x_wb[n-D]として遅延させて出力することで、帯域通過フィルタ５０から出力される信号とタイミングを合わせる。すなわち、所定の時間（Dサンプル分）は、広帯域化処理部２０などへの入力から帯域通過フィルタ５０から出力が得られるまでの処理遅延の時間に相当する。この値は、事前に求めておき、Dを常に固定値として用いればよい。

信号加算処理部８０は、信号遅延処理部７０から出力されるアップサンプリングされたデータ長2Nの入力信号x_wb[n-D]と、データ長2Nの第３の広帯域信号y3[n]とを、共にサンプリング周波数fs’[Hz]のままで加算して、データ長2Nの帯域拡張された広帯域信号y[n]を出力信号として得る。これにより、アップサンプリングされた入力信号x_wb[n-D]は、第３の広帯域信号y3[n]分だけ帯域拡張される。

次に、上記第４の実施形態に係わる帯域拡張処理部３の変形例について説明する。その構成を図２０に示す。この図に示すように、この変形例は、ピーク除去処理部４０１Ａの後段に、低周波数域を強調する処理を実施する低域強調部４０４を設けるとともに、歪み低減処理部４０２の前段に、第２の歪み制御処理部９０を設けたものである。この第２歪み制御処理部９０は、周波数領域でのパワースペクトルのピークを強調する処理を実施するピーク強調処理部９０１と、周波数領域でのパワースペクトルのディップを強調する処理を実施するディップ強調処理部９０２とを備える。

ピーク強調処理部９０１は、図９に示した第１の実施例の変形例１で説明したように、広帯域化処理部２０から出力された広帯域化されたデータ長2Nの第１の広帯域信号y1[n]に対して周波数領域でのパワースペクトルのピーク強調処理を施し、この処理によって得た信号をディップ強調処理部９０２に出力する。
ディップ強調処理部９０２は、ピーク強調した信号に対して周波数領域でのパワースペクトルのディップ強調処理を施し、この処理によって得た広帯域信号y0[n]を歪み低減処理部４０２に出力する。

一方、低域強調部４０４は、ピーク除去処理部４０１Ａから出力されたデータ長2Nの広帯域の歪み信号d[n]に対して、ディエンファシスフィルタにより低周波数域を強調する処理を施して、拡張した低周波数域を強調したデータ長2Nの広帯域の歪み信号d0[n]を得る。ディエンファシスフィルタとしては、例えば式（６）に示す伝達関数を有するフィルタを用いる。

これに対して、歪み低減処理部４０２は、データ長2Nの歪み信号d0[n]を用いて、データ長2Nの広帯域信号y0[n]に含まれる歪みを低減し、この歪みが歪み低減された広帯域信号を第２の広帯域信号y2[n]として出力する。

以上のように、第４の実施形態の変形例では、第２の歪み制御処理部９０を設けることで、拡張する周波数帯域において、線形予測合成前の広帯域化された信号について調波構造の山が盛り上がり谷が深くなり、山と谷がくっきりする。このため、広帯域化処理によって生じた調波構造の歪みが低減でき、広帯域化した帯域拡張された信号の音質を向上させることができる。

またこの変形例では、歪み成分生成処理部４０１で生成した歪み成分の低周波数域を強調するようにしているので、拡張する周波数帯域において、聴覚上、耳障りになりやすい低周波数域での調波構造の歪みをより低減させることができ、このために広帯域に帯域拡張された信号の音質を向上させることができる。
なお、この変形例では、低域強調部４０４および第２の歪み制御処理部９０を両方適用しているが、いずれか一方を適用してもその効果が発揮される。

なお、この発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また上記実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。

この発明に係わる信号帯域拡張装置を適用した通信装置の第１の実施の形態の構成を示す回路ブロック図。図１に示した通信装置の第１の実施形態に係わる帯域拡張処理部の構成を示す回路ブロック図。図２に示した広帯域化処理部で用いる非線形関数を説明するための図。図１に示した通信装置の帯域拡張処理部による各信号の時間領域での波形例の図。図１に示した通信装置の帯域拡張処理部による各信号の周波数領域でのパワースペクトル例の図。図２に示した歪み成分生成処理部で用いる非線形関数を説明するための図。図２に示した歪み低減処理部の構成例を示す回路ブロック図。図１に示した通信装置の帯域拡張処理部によるシミュレーション結果を示す図。図２に示した帯域拡張処理部の変形例の構成を示す回路ブロック図。図２に示した帯域拡張処理部の変形例の構成を示す回路ブロック図。図２に示した帯域拡張処理部の変形例の構成を示す回路ブロック図。図２に示した帯域拡張処理部の変形例の構成を示す回路ブロック図。図１に示した通信装置の第２の実施形態に係わる帯域拡張処理部の構成を示す回路ブロック図。図１３に示した帯域拡張処理部の変形例の構成を示す回路ブロック図。図１３に示した帯域拡張処理部の変形例の構成を示す回路ブロック図。図１３に示した帯域拡張処理部の変形例の構成を示す回路ブロック図。この発明に係わる信号帯域拡張装置を適用したディジタルオーディオプレイヤの実施形態の構成を示す回路ブロック図。図１７に示したディジタルオーディオプレイヤの帯域拡張処理部の構成を示す回路ブロック図。この発明に係わる信号帯域拡張装置を適用したディジタルオーディオプレイヤの実施形態の構成を示す回路ブロック図。図１９に示した帯域拡張処理部の変形例の構成を示す回路ブロック図。

符号の説明

１…無線通信部、２…デコーダ、３…帯域拡張処理部、４…Ｄ／Ａ変換器、５…スピーカ、６…記憶部、１０…分析処理部、２０…広帯域化処理部、３０…合成処理部、４０…歪み制御処理部、５０…帯域通過フィルタ、６０…アップサンプリング部、７０…信号遅延処理部、８０…信号加算処理部、９０…第２の歪み制御処理部、１０１…線形予測分析部、１０２…逆フィルタ、２０１…スペクトル包絡広帯域化処理部、２０２…アップサンプリング部、２０３…残差広帯域化処理部、３０１…第１の線形予測合成部、４０１…歪み成分生成処理部、４０１Ａ…ピーク除去処理部、４０１Ｂ…第２の線形予測合成部、４０２…歪み低減処理部、４０２Ａ…周波数領域変換部、４０２Ｂ…パワー算出部、４０２Ｃ…周波数領域変換部、４０２Ｄ…パワー算出部、４０２Ｅ…抑圧ゲイン算出部、４０２Ｆ…スペクトル抑圧部、４０２Ｇ…時間領域変換部、４０３…ディップ強調処理部、４０４…低域強調部、９０１…ピーク強調処理部、９０２…ディップ強調処理部。

Claims

帯域制限された入力信号の周波数帯域を拡げて広帯域信号に変換する広帯域化手段と、
前記入力信号から歪み成分を生成する歪み成分生成手段と、
この歪み成分生成手段が生成した歪み成分に基づいて、前記広帯域化手段が広帯域化した広帯域信号の歪みを低減する歪み低減手段とを具備することを特徴とする信号帯域拡張装置。
前記広帯域化手段は、非線形関数に基づいて、前記入力信号の周波数帯域を拡げることを特徴とする請求項１に記載の信号帯域拡張装置。
前記歪み成分生成手段は、前記広帯域化手段とは異なる非線形関数に基づいて、前記入力信号から歪み成分を生成することによって前記歪み成分を生成することを特徴とする請求項２に記載の信号帯域拡張装置。
前記歪み成分生成手段は、前記入力信号からピークを除去することで前記歪み成分を生成することを特徴とする請求項１または請求項２に記載の信号帯域拡張装置。
前記歪み成分生成手段は、前記入力信号から振幅の絶対値が所定の閾値以上の成分を除いて前記歪み成分を生成することを特徴とする請求項４に記載の信号帯域拡張装置。
前記歪み成分生成手段における前記所定の閾値は、前記入力信号の振幅あるいはパワーに基づいて設定されることを特徴とする請求項５に記載の信号帯域拡張装置。
前記歪み成分生成手段は、前記入力信号を平滑化することによって前記歪み成分を生成することを特徴とする請求項４に記載の信号帯域拡張装置。
さらに、前記歪み成分生成手段が生成した歪み成分に対して、前記広帯域化手段が拡げた周波数帯域を強調する拡張域強調手段を備え、
前記歪み低減手段は、前記拡張域強調手段により強調された歪み成分に基づいて、前記広帯域化手段が広帯域化した広帯域信号の歪みを低減することを特徴とする請求項１乃至請求項７のいずれかに記載の信号帯域拡張装置。
さらに、前記広帯域化手段によって周波数帯域が拡げられた広帯域信号の周波数スペクトルにおけるピークを強調する強調手段を備え、
前記歪み低減手段は、前記歪み成分生成手段が生成した歪み成分に基づいて、前記強調手段によりピークが強調された広帯域信号の歪みを低減することを特徴とする請求項１乃至請求項８のいずれかに記載の信号帯域拡張装置。
さらに、前記広帯域化手段によって周波数帯域が拡げられた広帯域信号の周波数スペクトルにおけるディップを強調する強調手段を備え、
前記歪み低減手段は、前記歪み成分生成手段が生成した歪み成分に基づいて、前記強調手段によりディップが強調された広帯域信号の歪みを低減することを特徴とする請求項１乃至請求項８のいずれかに記載の信号帯域拡張装置。
さらに、前記広帯域化手段によって周波数帯域が拡げられた広帯域信号の周波数スペクトルにおけるピークを強調する第１の強調手段を備え、
さらに、前記第１の強調手段によりピークが強調された広帯域信号の周波数スペクトルにおけるディップを強調する第２の強調手段を備え、
前記歪み低減手段は、前記歪み成分生成手段が生成した歪み成分に基づいて、前記第２の強調手段によりディップが強調された広帯域信号の歪みを低減することを特徴とする請求項１乃至請求項８のいずれかに記載の信号帯域拡張装置。