JP2010066335A - 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体 - Google Patents

信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体 Download PDF

Info

Publication number
JP2010066335A
JP2010066335A JP2008230426A JP2008230426A JP2010066335A JP 2010066335 A JP2010066335 A JP 2010066335A JP 2008230426 A JP2008230426 A JP 2008230426A JP 2008230426 A JP2008230426 A JP 2008230426A JP 2010066335 A JP2010066335 A JP 2010066335A
Authority
JP
Japan
Prior art keywords
signal
frequency
coefficient
low
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008230426A
Other languages
English (en)
Other versions
JP4783412B2 (ja
Inventor
Takeshi Mori
岳至 森
Shigeaki Sasaki
茂明 佐々木
Naka Omuro
仲 大室
Yuusuke Hiwazaki
祐介 日和▲崎▼
Yoichi Haneda
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008230426A priority Critical patent/JP4783412B2/ja
Publication of JP2010066335A publication Critical patent/JP2010066335A/ja
Application granted granted Critical
Publication of JP4783412B2 publication Critical patent/JP4783412B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】狭帯域信号から質の良い擬似広帯域信号を生成する。
【解決手段】狭帯域信号を周波数領域に変換することで、低域信号を生成し、狭帯域信号をパーコール分析することでパーコール係数を求め、入力されたパーコール係数が小さいほど、高域側に比べて低域側の値が大きいゲイン係数を求め、低域信号に前記ゲイン係数を乗算することで、強調低域信号を生成し、低域信号の一部または全部を複製することで、高域信号を生成し、前記強調低域信号を低域側に前記高域信号を高域側に配置し、合わせることで、擬似広帯域周波数信号を生成し、前記擬似広帯域周波数信号を時間領域に変換することで擬似広帯域信号を出力する。
【選択図】図7

Description

この発明は、例えばIPネットワークでの音声通信に用いるものであり、狭帯域信号から擬似的に擬似広帯域信号を求める信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体に関する。
従来からの電話システムで伝送できる音声信号の周波数帯域は、約300Hzから3.4kHzである。従来の電話システムの音声符号化技術の目的は、伝送パラメータ量を最小化することにあり、符号化した音声信号の周波数帯域を超える音声を得ることは不可能である。ところで、最近の音響技術の発展及びディジタル信号処理技術の開発により、日常生活で使われる機器の音声の品質が向上している。このような状況において、例えば電話の音質にも高音質を求める声がある。かかる要求に応える目的で音声擬似広帯域化装置や、その方法が用いられる。
そこで、特許文献1に記載のように、帯域が制限された狭帯域音声信号をより高域の周波数帯域に複製して高域信号として、狭帯域信号と高域信号を合成することで、擬似的に広帯域信号を作成する信号広帯域化方法が提案されている。図1に特許文献1の信号広帯域化方法で用いられる信号広帯域化装置の機能構成例を示す。
図1に示すように、従来技術1の信号広帯域化装置100は、アップサンプリング部101、全波整流部102、STFT分析部103および105、バンドパスフィルタ部104、複製部106、ゲイン調整部107および108、STFT合成部109、加算部110、とで構成されている。
アップサンプリング部101は、例えば8kHzサンプリングされた狭帯域音声信号を、例えば8kHzサンプリングから16kサンプリングの音声信号にアップサンプリングする。全波整流部102は、アップサンプリングされた音声信号を全波整流(非線形処理)し、音声の基本周波数の高調波成分を含む等、狭帯域音声信号と相関が高い広帯域音声信号を得る。STFT分析部103は、一定時間(10〜20msec)経過毎に、全波整流された音声信号をSTFT(短時間フーリエ)分析し、周波数領域音声信号Sを得る。
バンドパスフィルタ部104は、周波数領域音声信号Sに対してバンドパスフィルタリングを行い、狭帯域音声信号に存在しない300Hz以下の複素スペクトル成分を取り出す一方で、60Hz以下の複素スペクトル成分を除去する。すなわち、バンドパスフィルタ部104は、狭帯域音声信号に含まれない低域信号(60〜300Hz)の周波数領域音声信号S’を得る。ゲイン調整部107は、バンドパスフィルタリングされた低域の複素スペクトルに一定のゲインを乗算し、ゲイン調整を行う。
一方、STFT分析部105は、一定時間(10〜20msec)経過毎に、アップサンプリングされた音声信号をSTFT分析し、周波数領域広帯域信号Tを得る。複製部106は、低域の周波数領域広帯域信号Tを、高域の周波数帯域の複素スペクトルとしてコピーする。例えば、10番目から40番目の周波数領域広帯域信号Tが、100番目から130番目の周波数領域広帯域信号Tとして用いられる。また、他の部分の複素スペクトルには、全て0が代入される。これにより、狭帯域音声信号に含まれていない高域周波数領域広帯域信号T’が得られる。ゲイン調整部108は、この高域周波数領域広帯域信号T’に一定の倍率が乗算され、これによりゲイン調整を行う。
STFT合成部109は、ゲイン調整部107よりの周波数領域音声信号S’と、ゲイン調整部108よりの高域周波数領域広帯域信号T’とをSTFT合成する。これにより、狭帯域音声信号に含まれていない低域および高域の音声信号が得られる。
加算部110は、アップサンプリング部101よりの音声信号と、STFT合成部109よりのSTFT合成された音声信号とを加算する。これにより、狭帯域音声信号に含まれていない低域および高域を有する擬似広帯域音声信号が得られる。
特許第3301473号
従来の電話システムで用いられる電話機は、ITU−Tにて標準化されているIRS特性を有するハンドセットにより集音された狭帯域音声信号を符号化し伝送している。ここで、IRS特性とは図2に示すような緩やかな高域通過フィルタ型の周波数特性を指す。つまり、IRS特性が大きい信号とは、低周波数側の強度が小さいということを示す。IRS特性を有するハンドセットにより集音された狭帯域音声信号は低域周波数側(以下、「低域側」という。)の信号が減衰したスペクトル形状になる。つまり、IRS特性が大きいということは低域側が減衰しているということである。このような低域側の信号が減衰した狭帯域音声信号から従来技術1に示す方法により擬似的に広帯域音声を作成すると、作成された広帯域音声は低域が減衰し、聴感上不自然なものになってしまうという問題があった。
この発明の信号広帯域化装置は、周波数変換部と、記憶部と、乗算部と、複製部と、結合部と、周波数逆変換部と、を具備する。周波数変換部は、狭帯域信号を周波数領域に変換することで、低域信号を生成する。記憶部は高域側に比べて低域側の値が大きいゲイン係数を記憶する。乗算部は、低域信号にゲイン係数を乗算することで、強調低域信号を生成する。複製部は、低域信号の一部または全部を複製することで、高域信号を生成する。結合部は、強調低域信号を低域側に高域信号を高域側に配置し、合わせることで、擬似広帯域周波数信号を生成する。周波数逆変換部は、擬似広帯域周波数信号を時間領域に変換することで擬似広帯域信号を出力する。また、ゲイン係数は記憶部に記憶させるのではなく、ゲイン係数を動的に求めるゲイン制御部を設けても良い。
この発明によれば、低域周波数側の信号が減衰した狭帯域信号の低域周波数側の信号に低域ゲインを乗算した後、擬似的に広帯域信号を作成する。これにより、作成された広域帯域信号は周波数特性が平坦で聴感上自然な擬似広帯域化を行うことができる。
以下に、発明を実施するための最良の形態を示す。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。
図3に実施例1の信号広帯域化装置200の機能構成例を示し、図4に処理フローを示す。この例では、信号広帯域化装置200は、周波数変換部210、記憶部290、複製部230、乗算部220、結合部240、周波数逆変換部250、とで構成される。図5に各構成部で生成される信号の周波数スペクトルなどを示す。図5中のA〜Dの図において、横軸は周波数を示し、縦軸は振幅パワーを示す。
まず、狭帯域信号は時間領域の信号であり、D個(Dは1以上の整数)のサンプル数を有するフレームごとに入力端子205に入力される。ここで狭帯域信号とは、周波数帯が狭帯域の信号であり、信号とは、例えば人間の音声の音声信号である。以降の処理はフレーム毎に処置が行われる。また、サンプル数Dは予め定められた値でも良いし、入力された狭帯域信号を分析した結果得られる値でもよい。前者の場合も後者の場合も全フレームでサンプル数Dが同じとなる場合もありえるし、フレーム毎にサンプル数Dは異なる場合もありえる。入力された時間領域の狭帯域信号はIn(t)(t=0、1、...、D−2、D−1)と表すものとする。tは時間のインデックスである。
次に、周波数変換部210は、入力された狭帯域信号In(t)をフレーム毎に、時間領域から周波数領域に変換することで、低域信号InF(k)(k=0、1、...、D−2、D−1)を生成して出力する(ステップS2)。低域信号InF(k)は周波数領域の信号であり、kは周波数インデックスを表し、kの値が小さいほど低周波数の信号を表し、大きいほど高周波数の信号を表す。また、周波数変換の手法の例として、DCT(Discrete Cosine Transform:離散コサイン変換)や、MDCT(Modified Discrete Cosine Transform:変形離散コサイン変換)などを用いれば良い。ただし、MDCTを用いる場合は2フレーム(2D個)の狭帯域信号から1フレームずつオーバーラップしてD個の低域信号を作成する。また、周波数変換部210の出力信号の周波数スペクトルを図5Aに示す。図5A中のαの箇所に示すように、低域信号InF(k)は低域側が減衰している。
記憶部290には予め、低域信号InF(k)の周波数ごとに予め定められたゲイン係数を記憶しておき、当該ゲイン係数は乗算部220に出力される。そして、乗算部220は、低域信号InF(k)にゲイン係数を乗算することで、強調低域信号FLG(k)を生成する(ステップS4)。ここでは、乗算部220は、低域信号InF(k)の全周波数の各周波数ごとにゲイン係数を乗算する手法を説明する。ここで、ゲイン係数をg(k)(k=0、1、...、D−2、D−1)とすると、例えば、以下のように、ゲイン係数を設定する。
g(0)=1.0
g(1)=3.0
g(2)=2.5
g(3)=2.2
g(4)=1.8
g(5)=1.6
g(6)=1.2
g(7)=1.0
g(8)=1.0
g(9)=1.0



g(D−2)=1.0
g(D−1)=1.0
つまり、乗算部220は、FLG(k)=g(0)・InF(0)+g(1)・InF(1)+・・・+g(D−1)・InF(D−1)の演算を行う。ただし演算子「・」は乗算を表す。また、これらのゲイン係数g(k)(k=0、1、...、D−2、D−1)をベクトル表記したものをゲイン係数ベクトルGとすると、Gは以下のように、表すことができる。
G=(1.0、3.0、2.5、2.2、1.8、1.6、1.2、1.0、
1.0、1.0、...、1.0)
つまり、ゲイン係数ベクトルの要素数はD個ある。
低域信号InF(k)(k=0、1、...、D−2、D−1)および強調低域信号FLG(k)(k=0、1、...、D−2、D−1)をベクトル表記したものをそれぞれInF、FLGとすると、乗算部220は以下の式を演算する。
FLG=G*InF
ただし、演算子「*」は内積を示す。このように、ゲイン係数g(k)またはゲイン係数ベクトルGは、高域側(kの値が大きい)に比べて低域側(kの値が小さい)の値が大きいように設定する。上記例では、k=D−2、D−1であればゲイン係数は全て1.0(ゲイン係数は小さい)であり、k=1、2、3であればそれぞれゲイン係数は3.0、2.5、2.2(ゲイン係数は大きい)となり、つまりゲイン係数は高域側に比べて低域側の値が大きくなっている。
また、上記g(k)の例では、g(0)=1.0となっているが、その理由を説明する。通常、機器のノイズ等により、低域信号の最も低域の部分(以下、「最低域部分」という。上記の例ではk=0の部分)の振幅パワーは大きくなることがある。従って、低域信号の最低域部分に乗じられるゲイン係数(上記の例ではg(0))を1.0もしくは1.0に近い値(例えば、0.9)に設定することが好ましい。また、ゲイン係数1.0を乗算するということは、乗算処理を行わないことと同義である。つまり、最低域部分に乗じられるゲイン係数は設定せずに、乗算部220の乗算処理においても、最低域部分については乗算処理は行わないようにしてもよい。つまり、最低域部分の振幅パワーは入力された低域信号の振幅パワーとほぼ等しくなるように、乗算部220は乗算処理を行えばよい。また、上記の例ではk=0の部分のみが最低域部分として説明したが、機器のノイズ等の状況に応じて、最低域部分を変化させた方が良い。例えば、k=0、1、2が最低域部分とした方が良い場合もある。
上記機器のノイズ等により低域信号の最低域部分の振幅パワーが大きくなる状況が多い場合(以下、「ケース1」という。)には、予め、最低域部分のゲイン係数と高域側のゲイン係数とをほぼ等しくする(上記の例では例えばg(0)=1.0)。つまり、ケース1の場合には「高域側に比べて低域側の値が大きいゲイン係数」の文言中の「低域側」とは最低域部分を除くことを意味し、最低域部分のゲイン係数と高域側のゲイン係数とはほぼ等しくなる。
また、上記機器のノイズ等がなく低域信号の最低域部分の振幅パワーが大きくなる状況が少ない場合(以下、「ケース2」という。)には、予め、最低域部分のゲイン係数を最も大きくする(例えばg(0)=3.2)。つまりケース2の場合には、「低域側」とは最低域部分を含むことを意味し、最低域部分のゲイン係数については、他のゲイン係数と比べて最も大きくなる。つまり、「高域側に比べて低域側の値が大きいゲイン係数」についての「低域側」とは最低域部分を含む場合と除く場合があり、両者については、上記機器のノイズ等の状況(上述では、ケース1またはケース2)により予め定めるものであり、設計事項の変更であるといえる。
乗算部220の出力信号である強調低域信号FLG(k)の周波数スペクトルを図5Bに示す。図5B中のβの箇所に示すように、乗算部220の演算により、減衰していた振幅レベルが増幅している。
また、上記では低域信号InF(k)の全周波数の周波数ごとにゲイン係数を乗ずる処理について説明したが、ゲイン係数が1.0になる周波数についてはゲイン係数の乗算を行わなくても良い。その場合は記憶部290に1.0でないゲイン係数と対応する周波数とを記憶しておき、乗算部220に1.0でないゲイン係数と対応する周波数Fの情報も入力すればよい。そして、乗算部220は、1.0でないゲイン係数と、周波数Fについての低域信号との乗算処理を行えばよい。このようにすることで、乗算処理の演算量を削減できる。
一方、複製部230は、低域信号InF(k)の一部または全部を拡張信号とする。そして、当該拡張信号を複製することで、擬似的に高域信号FH(k)(k=0、1、...、D−2、D−1)を生成する(ステップS6)。以下、図5を用いて具体的に説明する。図5では、複製部230が低域信号InF(k)の「一部」を複製する例を示す。図5Aに示すように、複製元の拡張信号(図5Aに記載)の先頭の周波数インデックスをD(ただし、0≦D≦D−1)とし、複製先の高域信号FH(k)(図5Cに記載)の先頭の周波数インデックスをDとし、コピーする拡張信号の係数の数をDとする。ただし、1≦D≦D(図5A参照)、D+D≦D(図5A参照)、D+D≦D(図5C参照)とする。D、D、Dは予め決められた固定値でも良いし、動的に切替えても良い。
図6に複製部230の処理の流れを示す。図6は複写元の低域の周波数範囲が固定値の場合である。まず、D、D、Dの初期値DL0、DW0、DH0を設定する(ステップS131)。そして、周波数インデックスkを高域の信号の最下限であるk=0に設定する(ステップS132)。周波数インデックスk=Dからk=D−1までの高域信号FH(k)には、MINが書き込まれる(ステップS133〜S135)。周波数インデックスkが、k=Dになると高域信号FH(k)には、複製元の先頭の周波数インデックスk=Dの信号の振幅が複製される(ステップS136)。つまり、k−D−D=D−D+D=Dである。したがって、複製元のk=D〜(D+D)の範囲の信号の振幅が、複製先のk=D〜(D+D)の範囲に複製される(ステップS138のNoのループ)。周波数インデックスk=(D+D)〜(D−1)までの範囲の高域信号FH(k)には、MINが書き込まれる(ステップS139〜S141)。この結果、高域信号FH(k)は、以下の式に示すようになる。
FH(k)=MIN (0≦k≦D−1)
=InF(k−D+D) (D≦k≦D+D−1)
=MIN (D+D≦k≦D−1)
ここで、MINの値は0でも良いし、非常に小さな値でも良い。なお、図5C中のγに記載のようにサイン窓等を掛けることで丸みを帯びた形状にすると、生成される擬似広帯域信号(以下で説明する)は聴感上よくなる。また、図5C中のεの部分についても同様の手法で丸みを帯びた形状にしても良い。また、図5の例では、低域信号InF(k)の「一部」を複製する例を説明したが、低域信号InF(k)の「全部」を拡張信号として、当該拡張信号を複製することで、高域信号FH(k)を生成しても良い。また拡張信号の複数部分を分割して複製しても良い。
次に、結合部240は、図5Dに示すように、強調低域信号FLG(k)を低域側に配置し、高域信号FH(k)を高域側に配置し、合わせることで、擬似広帯域周波数信号PsF(k)を生成する(ステップS8)。擬似広帯域周波数信号PsF(k)は以下の式のようになる。
PsF(k)=FLG(k) (0≦k≦D−1)
=FH(k−D) (D≦k≦2D−1)
ここで、PsF(k)の最大値を2D−1としたが、当該最大値は擬似広帯域信号の音質が保たれていれば、最大値を2D−1に限る必要はない。
周波数逆変換部250は、擬似広帯域周波数信号PsF(k)を時間領域に変換することで擬似広帯域信号out(u)(u=0、1、...、2D−1)を出力する(ステップS10)。ここで、行う周波数逆変換(時間領域への変換)は、周波数変換部210における周波数変換に対応した逆変換である。ただし、狭帯域信号In(t)と擬似広帯域信号out(u)とはサンプル数が異なるが。サンプリング周波数が異なるだけで、時間的には完全に対応するものである。例えば、この実施例では、擬似広帯域信号out(u)のサンプリング周波数はIn(t)のサンプリング周波数の2倍であるので、t=0とu=0、t=Dとt=2Dとがそれぞれ同時刻である。
このように、従来の信号広帯域化装置では、IRS特性を有する(狭帯域信号の低域側が減衰している)にもかかわらず、低域側の振幅パワーを増幅させずに処理を行っていた。つまり、図3や図5に記載の乗算部220によるゲイン係数の乗算処理を行っていなかった。従って、従来の信号広帯域化装置から出力される擬似広帯域信号は聴感上不自然な音質になっていた。しかし、この実施例の信号広帯域化装置200では、減衰している低域側にゲイン係数を乗算することで、出力される擬似広帯域信号は、周波数が平坦で聴感上自然な音質になるという顕著な効果を有するようになった。
IRS特性を有する音声信号のように、低域が減衰している狭帯域信号に対しては、実施例1で説明した方法により周波数が平坦で聴感上自然な広帯域信号を擬似的に生成することができる。しかし、IRS特性を有さないハンドセットなど周波数が平坦なハンドセットにより集音された狭帯域信号に対して、実施例1の方法で擬似的に広帯域信号を作成すると、低域の信号の振幅パワーが極端に大きくなってしまい、擬似的に作成した広帯域信号がこもった音になってしまうという問題がある。この問題を解決すべく、この実施例2では入力の狭帯域信号の低域が減衰しているか否かに関わらず、低域の信号の振幅パワーが極端に大きくなったり、また低域の信号の振幅パワーが小さくなりすぎて不自然になったりすることのない高音質な広帯域信号を擬似的に作成する方法を説明する。
図7に実施例2の信号広帯域化装置300の機能構成例を示し、図8に処理フローを示す。信号広帯域化装置300は、信号広帯域化装置100の記憶部290をゲイン制御部360に代替したものである。ゲイン制御部360はこの例では分析部363、ゲイン算出部365により構成されている。
分析部363は、入力端子205に入力された狭帯域信号をパーコール(PARCOR係数:PARtial auto−CORrelation:偏自己相関)分析することでパーコール係数を求め、パーコール係数情報として出力する(ステップS12)。パーコール分析については、「古井さだおき著 音響・音声工学、株式会社近代科学社、1996年3月10日、p131〜p141」等に記載されている。またこの実施例2では、パーコール係数情報をパーコール係数として説明する。パーコール係数は1〜2次の係数を用いると能率的であるが、それ以上の次数のパーコール係数を使用しても良い。また、iをパーコール係数の次数とし、i次のパーコール係数をpとする。次に、パーコール係数はゲイン算出部365に入力される。
ゲイン算出部365は、入力された係数情報が小さいほど、高域側に比べて低域側の値が大きいゲイン係数g(k)を求める(ステップS14)。ここで、「入力された係数情報」とは、分析部363からのパーコール係数の他に、下記の実施例4で説明する対数断面積比、下記の実施例5で説明する補間係数情報、下記の実施例6で説明する差分係数情報である。ゲイン算出部365の好適な構成例として、判定手段3652とゲイン決定手段3654とを有する構成があり、以下、ゲイン算出部365が判定手段3652とゲイン決定手段3654とで構成されているとして説明をする。
判定手段3652は入力された係数情報が小さいほど、IRS特性が大きいと判定する。この実施例では係数情報とは、パーコール係数情報であるが、その他に補間係数情報、差分係数情報である。また、「係数情報であるパーコール係数が大きいほどIRS特性が小さい」という性質は、発明者の度重なる実験の結果、判明したことである。更に、判定手段3652は、パーコール係数が大きいほど、IRS特性が小さいと判断する、としても良い。そして、判定手段3652は、IRS特性の大小を表す情報、例えば、IRS特性判定フラグFを出力する。ここで、ゲイン算出部365が、IRS特性を用いずに入力された係数情報が小さいほど、高域側に比べて低域側の値が大きいゲイン係数g(k)を求めるような構成であれば、IRS特性判定フラグFを生成する必要はない。
また、判定手段3652によるIRS特性の判定の手法例を説明する。(i)第1の手法として、判定手段3652は、パーコール係数が予め定められた閾値より小さければ、IRS特性が大きいと判定し、パーコール係数が予め定められた閾値より大きければ、IRS特性が小さいと判定する。例えば、1次のパーコール係数をpとした場合、閾値Th1を例えば0.885とし、
>Th1の場合・・・IRS特性小
≦Th1の場合・・・IRS特性大、と判定し、IRS特性判定フラグFとして、IRS特性が大きい場合は「1」を出力し、小さい場合は「0」を出力する。
(ii)また、第2の手法として、更に2次のパーコール係数をpとし、閾値Th2を例えば0.875とし、
>Th1、かつ、p>Th2の場合・・・IRS特性小
その他の場合・・・IRS特性強
としても良い。このように、2次以上のパーコール係数の大小を判定することで、より正確なIRS特性の判定を行うことができる。
(iii)また、第3の手法として、IRS特性の大小を複数段階に場合分けすることも可能である。閾値Th3を例えば、0.825とし、
>Th1の場合・・・IRS特性小
Th1≧p>Th3の場合・・・IRS特性中
Th3≧pの場合・・・IRS特性大
とする。IRS特性判定フラグFとして、例えば、IRS特性が大きい場合は「2」中である場合は「1」、小さい場合は「0」を出力することもできる。このように、閾値を複数用いて、IRS特性の大小を判定することで、より細やかな判定を行うことができる。
ゲイン決定手段3654は、IRS特性判定フラグFから判断して、IRS特性が大きいほど、高域側に比べて低域側の値が大きいゲイン係数を求める。また、IRS特性が小さい場合、つまり、狭帯域信号の低域側があまり減衰していない場合には、高域側と低域側の値がほぼ等しいゲイン係数を求める。ゲイン係数の求め方の一例を説明する。例えば、IRS特性の大小に応じたゲイン係数を予め定めておき、ゲイン決定手段3654に保持させる。そして、ゲイン決定手段3654は、入力されたIRS特性判定フラグFからIRS特性の大小を判定して、ゲイン係数を選択すればよい。
例えば、ゲイン決定手段3654は、以下のようなゲイン係数ベクトルG1、G2を保持しておき、IRS特性判定フラグFに応じて乗算部220にG1もしくはG2を出力する。なお、判定手段3652が前記第1の手法((i)の箇所で説明)を用いた場合を説明する。
IRS特性小(F=0)の場合
G1=(1.0、1.2、1.2、1.0、1.0、1.0、1.0、1.0、
1.0、1.0、...、1.0) を出力する。
IRS特性大(F=1)の場合
G2=(1.0、3.0、2.5、2.2、1.8、1.6、1.2、1.0、
1.0、1.0、...、1.0) を出力する。
また、ゲイン決定手段3654は予めゲイン係数ベクトルを保持しておくのではなく、IRS特性判定フラグFから判断して動的にゲイン係数ベクトルを定め、乗算部220に出力しても良い。
このように、入力された狭帯域信号に対してパーコール分析を行い、求められたパーコール係数からゲイン係数を定める。このように、動的にゲイン係数(ゲイン定数ベクトル)を定めて乗算することで、入力された狭帯域信号の低域が減衰しているか否かにかかわらず、低域が大きくなりすぎてこもった音になったり、小さくなりすぎて不自然にならない擬似広帯域信号を生成できる。
実施例2では、分析部363から出力されるパーコール係数情報が、パーコール係数である場合を説明した。しかし、前記第2の手法((ii)の箇所で説明)、第3の手法((iii)の箇所で説明)のように複数の閾値を用いた場合に、Th1(=0.885)、Th2(=0.875)、Th3(=0.825)のように、各閾値が近接する(各閾値間の間隔が小さくなる)ことが実験的に分かっている。そうすると、分析部363はパーコール係数の小数点以下を細かく算出しなければならず、結果として分析部363のパーコール係数を求める演算量が多くなるという問題がある。そこで、この実施例3では、分析部363はパーコール係数情報としてパーコール係数を出力するのではなく、当該パーコール係数から求まる対数断面積比nを出力する。そうすると、判定手段3652の判定処理において、複数の閾値を用いる場合であっても、当該閾値間の間隔を広げることができることが実験的に判明しており、判定手段3652の判定が行いやすくなる。i次の対数断面積比nは例えば、以下の式に求められる。
=log[(1+p)/(1−p)]
そして、対数断面積比nは判定手段3652に入力される。判定手段3652が前記第3の手法を用いる(3つの閾値Th1、Th2、Th3を用いる)場合には、例えば、Th1=2.9、Th2=2.2、Th3=1.7を用いることができ、パーコール係数を用いた場合と比較して閾値間の差を大きくすることができ、結果として判定手段3652は判定処理を行いやすくなる。
実施例2または3で説明した手法により、入力された狭帯域信号の低域が減衰しているか否かによらず、低域が大きくなりこもった音になったり、小さくなりすぎて不自然にならない擬似広帯域信号を生成できる。しかし、実施例2または3で説明した手法には、例えば狭帯域信号が音声の信号である場合に、当該音声の子音部から母音部へ変わるときにはパーコール係数の変動が大きくなってしまうため、低域信号InF(k)に乗算するゲイン係数が頻繁に切り替わってしまい、聴感上耳障りなノイズを発生させてしまうという問題がある。この問題に対し、この実施例4では、ゲイン係数の値が頻繁に切り替わることを抑えることで、聴感上耳障りなノイズを発生させずに高音質な擬似広帯域信号を生成する手法を説明する。
図9にこの実施例4の信号広帯域化装置400の機能構成例を示す。実施例2,3で説明した信号広帯域化装置300と違う点は、ゲイン制御部360がゲイン制御部460に代替されている点である。ゲイン制御部460はゲイン制御部360のゲイン算出部365(判定手段3652)の前段に補間係数計算部464が備えられたものである。
入力されるパーコール係数の変動を抑えるため、補間係数計算部464は、過去に入力されたパーコール係数情報を用いて、現在入力されたパーコール係数情報を補間することで、補間係数情報p^を生成する。補間係数計算部464は例えば、補間係数情報p^として、重み付き和p^を計算する。現在入力されたi次のパーコール係数をpとし、直前に入力されたi次のパーコール係数をdpとすると、補間係数計算部464は例えば、以下の式により重み付き和である補間係数情報p^を計算する。
p^=a1i+a2idp
補間係数情報p^の変動は、パーコール係数の変動よりも小さくでき、結果として、ゲイン係数の値が頻繁に切り替わることを抑えることができる。ここで、i=1の場合、重み係数は例えばa1i=a2i=0.5とすると良い。また、ここでは、入力された全ての次数のパーコール係数について補間係数情報p^を計算する例を説明したが、予め決められた次数(つまり変動が大きい次数)のパーコール係数のみ補間係数情報を計算しても良い。また、上記の例ではdpを直前に入力されたパーコール係数として、処理を行うが、直前よりも過去に入力されたパーコール係数をdpとして処理を行っても良い。また、補間係数計算部464はパーコール係数ではなく、対数断面積比(実施例3で説明)についても処理を行っても良い。そして、ゲイン算出部365(判定手段3652)は、入力された補間係数情報が大きいほど、高域側に比べて低域側の値が大きいゲイン係数を求める。
この実施例4のように、補間係数計算部464により補間係数情報(例えば、入力されたパーコール係数情報および過去に入力されたパーコール係数情報との重み付き和)を求めることで、パーコール係数の変動が大きい場合であっても補間係数情報の変動は小さくできることから、ゲイン係数の値が頻繁に切り替わることを抑えることができ、結果として聴感上耳障りなノイズを発生させずに高音質な擬似広帯域信号を生成できる。
実施例2または3で説明した手法により入力された狭帯域信号の低域が減衰しているか否かによらず、低域が大きくなりこもった音になったり、小さくなりすぎて不自然にならない擬似広帯域信号を生成できる。しかし、例えば、狭帯域信号が女性音声の信号である場合には、パーコール係数の値が他の話者に比べて平均的に小さいため、低域が減衰していなくても、IRS特性は大きいと判定されてしまい、乗算部220のゲイン係数乗算処理により、過剰に低域が強調されてしまうという問題がある。この問題を解決すべく、この実施例5では、パーコール係数の値が平均的に小さい狭帯域信号に対しても高音質な擬似広帯域信号を生成する手法を説明する。
図10に、この実施例5の信号広帯域化装置500の機能構成例を示す。実施例2、3で説明した信号広帯域化装置300と違う点は、ゲイン制御部360がゲイン制御部560に代替されている点である。ゲイン制御部560はゲイン制御部360のゲイン算出部365(判定手段3652)の前段に差分係数計算部565が備えられたものである。
差分係数計算部565は、同フレーム内の異なる次数の係数情報間の差を計算することで、差分係数情報p を生成する。この実施例5において、差分係数計算部565に入力される係数情報とは分析部363からのパーコール係数または、対数断面積比である。入力されたパーコール係数の次数をPKRとし、予め定められた重み係数をb、bi+1とすると、差分係数計算部565は、例えば、以下の式を演算することで、差分係数情報p を生成する。
=b−bi+1i+1(0<i≦PKR−1)
=p (i=PKR)
このように、隣接する次数間(つまり、iとi+1)のパーコール係数の差を取ることが望ましい。そして、差分係数情報p ゲイン算出部365(判定手段3652)に入力され、差分係数情報が大きいほど、高域側に比べて低域側の値が大きいゲイン係数を求める。また、差分係数計算部565は、対数断面積比について処理を行っても良い。
このようにゲイン算出部365は差分係数情報p を用いてゲイン係数を求める(判定手段366が差分係数情報p でIRS特性の大小を判定する)ことで、パーコール係数の平均値が小さい場合であっても、隣接する次数間のパーコール係数の差である差分係数情報p を用いることで、低域が減衰してなくてもIRS特性は大きいと判定されることはなく、結果として過剰に低域が強調されてしまうことはない。
図11にこの実施例6の信号広帯域化装置600の機能構成例を示す。実施例5で説明した信号広帯域化装置500と違う点は、ゲイン制御部560がゲイン制御部660に代替されている点である。ゲイン制御部660はゲイン制御部560の、分析部363の後段でありかつゲイン算出部365(判定手段3652)の前段に補間係数計算部464が設けられている点でゲイン制御部560と異なる。この実施例6の差分係数計算部565に入力される係数情報とは、補間係数計算部464からの補間係数情報である。信号広帯域化装置600のような構成にすることで、実施例4及び実施例5で説明した効果を両方得ることができる。
<ハードウェア構成>
本発明は上述の実施の形態に限定されるものではない。また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、信号広帯域化装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
また、本実施例で説明した信号広帯域化装置は、CPU(Central Processing Unit)、入力部、出力部、補助記憶装置、RAM(Random Access Memory)、ROM(Read Only Memory)及びバスを有している(何れも図示せず)。
CPUは、読み込まれた各種プログラムに従って様々な演算処理を実行する。補助記憶装置は、例えば、ハードディスク、MO(Magneto-Optical disc)、半導体メモリ等であり、RAMは、SRAM(Static Random Access Memory)、DRAM (Dynamic Random Access Memory)等である。また、バスは、CPU、入力部、出力部、補助記憶装置、RAM及びROMを通信可能に接続している。
<ハードウェアとソフトウェアとの協働>
本実施例の信号広帯域化装置は、上述のようなハードウェアに所定のプログラムが読み込まれ、CPUがそれを実行することによって構築される。以下、このように構築される各装置の機能構成を説明する。
信号広帯域化装置の入力部、出力部(いずれも図示せず)は、所定のプログラムが読み込まれたCPUの制御のもと駆動するLANカード、モデム等の通信装置である。周波数変換部210、乗算部220、複製部230、結合部240、周波数逆変換部250、ゲイン制御部360〜660は、所定のプログラムがCPUに読み込まれ、実行されることによって構築される演算部である。記憶部290は上記補助記憶装置として機能する。
従来の信号広帯域化装置の機能構成例を示したブロック図。 IRS特性を示した図。 実施例1の信号広帯域化装置の機能構成例を示したブロック図。 実施例1の信号広帯域化装置の処理フローを示した図。 各構成部から出力される信号の周波数スペクトルを示した図。 複製部の処理フローを示した図。 実施例2の信号広帯域化装置の機能構成例を示したブロック図。 実施例1の信号広帯域化装置の処理フローを示した図。 実施例4の信号広帯域化装置の機能構成例を示したブロック図。 実施例5の信号広帯域化装置の機能構成例を示したブロック図。 実施例6の信号広帯域化装置の機能構成例を示したブロック図。

Claims (16)

  1. 狭帯域信号を周波数領域に変換することで、低域信号を生成する周波数変換部と、
    高域側に比べて低域側の値が大きいゲイン係数を記憶する記憶部と、
    前記低域信号に前記ゲイン係数を乗算することで、強調低域信号を生成する乗算部と、
    前記低域信号の一部または全部を複製することで、高域信号を生成する複製部と、
    前記強調低域信号を低域側に前記高域信号を高域側に配置し、合わせることで、擬似広帯域周波数信号を生成する結合部と、
    前記擬似広帯域周波数信号を時間領域に変換することで擬似広帯域信号を出力する周波数逆変換部と、
    を具備する信号広帯域化装置。
  2. 狭帯域信号を周波数領域に変換することで、低域信号を生成する周波数変換部と、
    前記狭帯域信号をパーコール分析することでパーコール係数を求め、パーコール係数情報として出力する分析部と、
    入力された係数情報が小さいほど、高域側に比べて低域側の値が大きいゲイン係数を求めるゲイン算出部と、
    前記低域信号に前記ゲイン係数を乗算することで、強調低域信号を生成する乗算部と、
    前記低域信号の一部または全部を複製することで、高域信号を生成する複製部と、
    前記強調低域信号を低域側に前記高域信号を高域側に配置し、合わせることで、擬似広帯域周波数信号を生成する結合部と、
    前記擬似広帯域周波数信号を時間領域に変換することで擬似広帯域信号を出力する周波数逆変換部と、
    を具備する信号広帯域化装置。
  3. 請求項2記載の信号広帯域化装置であって、
    前記分析部は、求められたパーコール係数から対数断面積比を求め、前記パーコール係数情報として出力するものであることを特徴とする信号広帯域化装置。
  4. 請求項2または3記載の信号広帯域化装置であって、
    前記ゲイン算出部は、
    入力された係数情報が小さいほど、IRS特性が大きいと判定する判定手段と、
    IRS特性が大きいほど、高域側に比べて低域側の値が大きいゲイン係数を求めるゲイン決定手段と、
    を具備することを特徴とする信号広帯域化装置。
  5. 請求項4記載の信号広帯域化装置であって、
    前記判定手段は、係数情報が予め定められた閾値より小さければIRS特性が大きいと判定することを特徴とする信号広帯域化装置。
  6. 請求項2〜5記載の信号広帯域化装置であって、
    更に、過去に入力されたパーコール係数情報を用いて、現在入力されたパーコール係数情報を補間することで、補間係数情報を生成する補間係数計算部も具備し、
    前記ゲイン算出部は、前記補間係数情報が小さいほど、高域側に比べて低域側の値が大きいゲイン係数を求めるものであることを特徴とする信号広帯域化装置。
  7. 請求項2〜6記載の信号広帯域化装置であって、
    更に、同フレーム内の異なる次数の係数情報間の差を計算することで、差分係数情報を生成する差分係数計算部も具備し、
    前記ゲイン算出部は、前記差分係数情報が大きいほど、高域側に比べて低域側の値が大きいゲイン係数を求めるものであることを特徴とする信号広帯域化装置。
  8. 狭帯域信号を周波数領域に変換することで、低域信号を生成する周波数変換過程と、
    前記低域信号に前記ゲイン係数を乗算することで、強調低域信号を生成する乗算過程と、
    前記低域信号の一過程または全過程を複製することで、高域信号を生成する複製過程と、
    前記強調低域信号を低域側に前記高域信号を高域側に配置し、合わせることで、擬似広帯域周波数信号を生成する結合過程と、
    前記擬似広帯域周波数信号を時間領域に変換することで擬似広帯域信号を出力する周波数逆変換過程と、
    を有する信号広帯域化方法。
  9. 狭帯域信号を周波数領域に変換することで、低域信号を生成する周波数変換過程と、
    前記狭帯域信号をパーコール分析することでパーコール係数を求め、パーコール係数情報として出力する分析過程と、
    入力された係数情報が小さいほど、高域側に比べて低域側の値が大きいゲイン係数を求めるゲイン算出過程と、
    前記低域信号に前記ゲイン係数を乗算することで、強調低域信号を生成する乗算過程と、
    前記低域信号の一過程または全過程を複製することで、高域信号を生成する複製過程と、
    前記強調低域信号を低域側に前記高域信号を高域側に配置し、合わせることで、擬似広帯域周波数信号を生成する結合過程と、
    前記擬似広帯域周波数信号を時間領域に変換することで擬似広帯域信号を出力する周波数逆変換過程と、
    を有する信号広帯域化方法。
  10. 請求項9記載の信号広帯域化方法であって、
    前記分析過程は、求められたパーコール係数から対数断面積比を求め、前記パーコール係数情報として出力するものであることを特徴とする信号広帯域化方法。
  11. 請求項9または10記載の信号広帯域化方法であって、
    前記ゲイン算出過程は、
    入力された係数情報が小さいほど、IRS特性が大きいと判定する判定ステップと、
    IRS特性が大きいほど、高域側に比べて低域側の値が大きいゲイン係数を求めるゲイン決定ステップと、
    を有することを特徴とする信号広帯域化方法。
  12. 請求項11記載の信号広帯域化方法であって、
    前記判定ステップは、係数情報が予め定められた閾値より小さければIRS特性が大きいと判定することを特徴とする信号広帯域化方法。
  13. 請求項9〜12記載の信号広帯域化方法であって、
    更に、過去に入力されたパーコール係数情報を用いて、現在入力されたパーコール係数情報を補間することで、補間係数情報を生成する補間係数計算過程も具備し、
    前記ゲイン算出過程は、前記補間係数情報が小さいほど、高域側に比べて低域側の値が大きいゲイン係数を求めるものであることを特徴とする信号広帯域化方法。
  14. 請求項9〜13記載の信号広帯域化方法であって、
    更に、同フレーム内の異なる次数の係数情報間の差を計算することで、差分係数情報を生成する差分係数計算過程も具備し、
    前記ゲイン算出過程は、前記差分係数情報が大きいほど、高域側に比べて低域側の値が大きいゲイン係数を求めるものであることを特徴とする信号広帯域化方法。
  15. 請求項1〜7何れかに記載の信号広帯域化装置としてコンピュータを動作させるプログラム。
  16. 請求項15記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2008230426A 2008-09-09 2008-09-09 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体 Active JP4783412B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008230426A JP4783412B2 (ja) 2008-09-09 2008-09-09 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008230426A JP4783412B2 (ja) 2008-09-09 2008-09-09 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体

Publications (2)

Publication Number Publication Date
JP2010066335A true JP2010066335A (ja) 2010-03-25
JP4783412B2 JP4783412B2 (ja) 2011-09-28

Family

ID=42192002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008230426A Active JP4783412B2 (ja) 2008-09-09 2008-09-09 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体

Country Status (1)

Country Link
JP (1) JP4783412B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012073295A (ja) * 2010-09-27 2012-04-12 Fujitsu Ltd 音声帯域拡張装置および音声帯域拡張方法
JP2012242470A (ja) * 2011-05-17 2012-12-10 Nippon Telegr & Teleph Corp <Ntt> 信号広帯域化装置、信号広帯域化方法、及びそのプログラム
JP2013511741A (ja) * 2009-11-19 2013-04-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
JP2013130885A (ja) * 2008-12-22 2013-07-04 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
CN112233685A (zh) * 2020-09-08 2021-01-15 厦门亿联网络技术股份有限公司 基于深度学习注意力机制的频带扩展方法及装置
JP2022526403A (ja) * 2019-09-18 2022-05-24 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 周波数帯域拡張方法、装置、電子デバイスおよびコンピュータプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0774642A (ja) * 1993-09-01 1995-03-17 Sharp Corp 線形予測係数補間装置
JPH0786952A (ja) * 1993-09-13 1995-03-31 Nippon Telegr & Teleph Corp <Ntt> 音声の予測符号化方法
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
JP2004266383A (ja) * 2003-02-27 2004-09-24 Oki Electric Ind Co Ltd 帯域補正装置
JP2006162774A (ja) * 2004-12-03 2006-06-22 Matsushita Electric Ind Co Ltd 信号処理装置
JP2007164041A (ja) * 2005-12-16 2007-06-28 Oki Electric Ind Co Ltd 帯域変換信号生成器及び帯域拡張装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0774642A (ja) * 1993-09-01 1995-03-17 Sharp Corp 線形予測係数補間装置
JPH0786952A (ja) * 1993-09-13 1995-03-31 Nippon Telegr & Teleph Corp <Ntt> 音声の予測符号化方法
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
JP2004266383A (ja) * 2003-02-27 2004-09-24 Oki Electric Ind Co Ltd 帯域補正装置
JP2006162774A (ja) * 2004-12-03 2006-06-22 Matsushita Electric Ind Co Ltd 信号処理装置
JP2007164041A (ja) * 2005-12-16 2007-06-28 Oki Electric Ind Co Ltd 帯域変換信号生成器及び帯域拡張装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013130885A (ja) * 2008-12-22 2013-07-04 Nippon Telegr & Teleph Corp <Ntt> 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
JP2013511741A (ja) * 2009-11-19 2013-04-04 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
US9031835B2 (en) 2009-11-19 2015-05-12 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
JP2012073295A (ja) * 2010-09-27 2012-04-12 Fujitsu Ltd 音声帯域拡張装置および音声帯域拡張方法
JP2012242470A (ja) * 2011-05-17 2012-12-10 Nippon Telegr & Teleph Corp <Ntt> 信号広帯域化装置、信号広帯域化方法、及びそのプログラム
JP2022526403A (ja) * 2019-09-18 2022-05-24 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 周波数帯域拡張方法、装置、電子デバイスおよびコンピュータプログラム
JP7297368B2 (ja) 2019-09-18 2023-06-26 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 周波数帯域拡張方法、装置、電子デバイスおよびコンピュータプログラム
CN112233685A (zh) * 2020-09-08 2021-01-15 厦门亿联网络技术股份有限公司 基于深度学习注意力机制的频带扩展方法及装置
CN112233685B (zh) * 2020-09-08 2024-04-19 厦门亿联网络技术股份有限公司 基于深度学习注意力机制的频带扩展方法及装置

Also Published As

Publication number Publication date
JP4783412B2 (ja) 2011-09-28

Similar Documents

Publication Publication Date Title
JP4733727B2 (ja) 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体
JP4945586B2 (ja) 信号帯域拡張装置
CN102822891B (zh) 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序
RU2413191C2 (ru) Системы, способы и устройства для устраняющей разреженность фильтрации
JP3646939B1 (ja) オーディオ復号装置およびオーディオ復号方法
KR101835910B1 (ko) 부호화 장치 및 방법, 복호 장치 및 방법, 및 컴퓨터 판독가능한 기록 매체
JP4818335B2 (ja) 信号帯域拡張装置
US8825476B2 (en) Method and apparatus for encoding and decoding high frequency signal
RU2719543C1 (ru) Устройство и способ для определения предварительно определенной характеристики, относящейся к обработке искусственного ограничения частотной полосы аудиосигнала
KR102423081B1 (ko) 오디오 주파수 신호 복호기에서 주파수 대역 확장을 위한 최적화된 스케일 팩터
US20080140396A1 (en) Model-based signal enhancement system
CN104603873B (zh) 用于在子带域中能自由选择频移的设备、方法和数字存储介质
AU2016253695A1 (en) Frequency band extending device and method, encoding device and method, decoding device and method, and program
JP4783412B2 (ja) 信号広帯域化装置、信号広帯域化方法、そのプログラム、その記録媒体
JP2019168708A (ja) オーディオ信号復号器における改善された周波数帯域拡張
WO2014115225A1 (ja) 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法
WO2013027631A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP5148414B2 (ja) 信号帯域拡張装置
JP5219499B2 (ja) 風雑音低減装置
JP2019090930A (ja) 音源強調装置、音源強調学習装置、音源強調方法、プログラム
Nematollahi et al. Digital speech watermarking based on linear predictive analysis and singular value decomposition
JP5458057B2 (ja) 信号広帯域化装置、信号広帯域化方法、及びそのプログラム
Lukin et al. Adaptive Multiresolution Filter Banks for Image and Audio Processing

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110323

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110628

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110708

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140715

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4783412

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350