JP4818335B2 - 信号帯域拡張装置 - Google Patents
信号帯域拡張装置 Download PDFInfo
- Publication number
- JP4818335B2 JP4818335B2 JP2008222291A JP2008222291A JP4818335B2 JP 4818335 B2 JP4818335 B2 JP 4818335B2 JP 2008222291 A JP2008222291 A JP 2008222291A JP 2008222291 A JP2008222291 A JP 2008222291A JP 4818335 B2 JP4818335 B2 JP 4818335B2
- Authority
- JP
- Japan
- Prior art keywords
- band
- signal
- frequency
- unit
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001228 spectrum Methods 0.000 claims description 103
- 238000000034 method Methods 0.000 claims description 68
- 230000003595 spectral effect Effects 0.000 claims description 68
- 230000008569 process Effects 0.000 claims description 51
- 238000000605 extraction Methods 0.000 claims description 40
- 238000012937 correction Methods 0.000 claims description 22
- 230000001629 suppression Effects 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 claims 1
- 238000005728 strengthening Methods 0.000 claims 1
- 230000003313 weakening effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 description 240
- 230000015572 biosynthetic process Effects 0.000 description 78
- 238000003786 synthesis reaction Methods 0.000 description 78
- 238000004458 analytical method Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 26
- 238000004364 calculation method Methods 0.000 description 21
- 238000005070 sampling Methods 0.000 description 20
- 230000000694 effects Effects 0.000 description 15
- 238000013459 approach Methods 0.000 description 14
- 206010019133 Hangover Diseases 0.000 description 13
- 238000004891 communication Methods 0.000 description 13
- 230000003321 amplification Effects 0.000 description 12
- 238000003199 nucleic acid amplification method Methods 0.000 description 12
- 238000012986 modification Methods 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 239000011159 matrix material Substances 0.000 description 10
- 230000005284 excitation Effects 0.000 description 9
- 101000959200 Lytechinus pictus Actin, cytoskeletal 2 Proteins 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000003860 storage Methods 0.000 description 8
- 238000002910 structure generation Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 102100040006 Annexin A1 Human genes 0.000 description 5
- 101000959738 Homo sapiens Annexin A1 Proteins 0.000 description 5
- 101000929342 Lytechinus pictus Actin, cytoskeletal 1 Proteins 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 238000009826 distribution Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000003584 silencer Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
この発明は上記の問題を解決すべくなされたもので、大きな計算量を必要とすることなく、帯域拡張された信号を原音により忠実に生成することが可能な信号帯域拡張装置を提供することを目的とする。
したがって、この発明によれば、少ない計算量で原音に忠実に帯域拡張された信号を生成することが可能な信号帯域拡張装置を提供できる。
図1(a)は、この発明の一実施形態に係わる信号帯域拡張装置が適用された通信装置の構成を示すものである。この図に示す通信装置は、例えば携帯電話などの無線通信装置の受信系を示すものであって、無線通信部1と、デコーダ2と、帯域拡張処理部3と、D/A変換器4とを備えている。
デコーダ2は、無線通信部1が通信相手局から受信した受信データを、事前に決められた単位(1フレーム=Nサンプル)ごとに復号して、ディジタルの入力信号x[n] (n=0,1,…,N-1)を得る。ここで1フレームをN=160サンプルとする。ただし、この入力信号x[n]は、サンプリング周波数はfs[Hz]でfs_nb_low[Hz]からfs_nb_high[Hz]までに帯域制限された狭帯域の信号である。このようにして得られたディジタルの入力信号x[n]は、フレーム単位で帯域拡張処理部3に出力される。
図2は、この発明に係わる帯域拡張処理部3の第1の実施例の構成を示すものである。第1の実施例では、帯域拡張処理部3の帯域拡張処理で、サンプリング周波数fs[Hz]のまま、fs_wb_low[Hz]からfs_wb_high[Hz]までの帯域に拡張されるものとする。ただし、fs_wb_low ≦ fs_nb_low < fs_nb_high ≦ fs_wb_high < fs/2 を満たすものとする。
調波構造生成判定部1031は、図4に示すように、広帯域化処理部10311と、比較判定部10312とを備える。
なお、周波数領域変換部103121および周波数領域変換部103122は、DFT(Discrete Fourier Transform)や離散コサイン変換(DCT: Discrete Cosine Transform)、ウォルシュ・アダマール変換(WHT: Walsh Hadamard Transform)、ハーレ変換(HT: Harr Transform)、スラント変換(SLT: Slant Transform)、カルーネン・レーベ変換(KLT: Karhunen Loeve Transform)などの周波数領域に変換する他の直交変換を代用することも可能である。
同様に、パワー算出部103124は、上記周波数スペクトルE_wb[ω,f]が入力され、これに基づいてパワースペクトル|E_wb[ω,f]|2を算出する。
まず、例えば男性の音声のように、fs_nb_low[Hz]以下に基本周波数があるような声の高さが低く、入力信号として基本周波数が欠落している音声が入力される場合について説明する。図7を用いて、この場合の比較判定部10312の動作を説明する。この場合、ピーク抽出部103125には、図7(a)に示すようなパワースペクトル|E[ω,f]|2が入力される。これに対して、ピーク抽出部103125は、fs_nb_low[Hz]以上かつfs_serch1[Hz]未満の周波数帯域について、低周波数から順にピーク探索を行うことにより、予め求めておいた全周波数帯域での平均パワースペクトル|E_avr[f]|2以上であるようなピークの周波数ビンとなる周波数ωp[f] [Hz]を抽出する。
まず、以下のようにフレーム毎に、制御情報info[f]を累積加算したsum_flag[f]を算出する。
info1[f]=1の場合、sum_flag[f] = sum_flag[f] + 1
info1[f]=0の場合、sum_flag[f] = sum_flag[f] - 1
次に、語頭での検出を俊敏にするために、以下のようにsum_flag[f]の下限を制御する。
sum_flag[f] < -3の場合は、sum_flag[f] = -3
そして、フレーム単位で頻繁に切り替わらないよう孤立フラグを以下のように反転させる。
info1[f]=1かつsum_flag[f]<0の場合、info1[f]=0
info1[f]=0かつsum_flag[f]>0の場合、info1[f]=1
このようにハングオーバ制御されたinfo1[f]を、info[f]=info1[f]として出力する。
また線形予測合成部105に代わって、図10に示すような線形予測合成部105aを用いてもよい。線形予測合成部105aは、無音化処理部1054と、切替スイッチSW1と、合成処理部1052とを備える。
このような構成であっても、同様の効果を発揮する。
また線形予測合成部105に代わって、図11に示すような線形予測合成部105cを用いてもよい。線形予測合成部105cは、切替スイッチSW3と、合成処理部1052と、フレーム合成処理部1053とを備える。
このような構成であっても、同様の効果を発揮する。また、このような構成によれば、制御情報info[f]=0の場合には、帯域生成判別部103で生成された線形予測残差信号e_wb[n]を第1の広帯域信号y1[n]としてフレーム合成処理部1053に出力するようにするため、合成処理部1052での処理を行わないようにできるので、第1の実施例よりも小さい計算量で、原音により忠実で音質のよい帯域拡張された信号を生成することができるという効果が得られる。
次に、この発明に係わる帯域拡張処理部3の第2の実施例について説明する。図12は、その構成を示すものである。以下の説明では、上述した第1の実施例と同じ構成については同じ番号を付番し、説明を簡明にするために必要に応じて重複する説明を省略する。
信号加算処理部110bは、図13に示すように構成される。すなわち、信号加算処理部110bは、信号加算処理部110と、切替スイッチSW2とを備える。
切替スイッチSW2は、帯域生成判別部103によって得られた、帯域生成するかしないかを示す制御情報info[f]にしたがって切替制御され、帯域生成する場合、すなわち制御情報info[f]=1の場合には、信号加算処理部110で得た広帯域信号y[n]を出力信号として出力し、一方、帯域生成しない場合、すなわち制御情報info[f]=0の場合には、信号遅延処理部109から出力されるデータ長Nの入力信号x[n-D1]を出力信号として出力する。
次に、この発明に係わる帯域拡張処理部3の第3の実施例について説明する。図14は、その構成を示すものである。以下の説明では、前述した実施例と同じ構成については同じ番号を付番し、説明を簡明にするために必要に応じて重複する説明を省略する。
第3の実施例に関わる帯域拡張処理部3では、第1の実施例の帯域拡張処理部3において、線形予測合成部105と帯域通過フィルタ108の間に、ディップ強調処理部106と歪み低減処理部107とを設けるとともに、信号加算処理部110の後段にスペクトル補正部111を設けたものである。
次に、この発明に係わる帯域拡張処理部3の第4の実施例について説明する。図15は、その構成を示すものである。以下の説明では、前述した実施例と同じ構成については同じ番号を付番し、説明を簡明にするために必要に応じて重複する説明を省略する。
第5の実施例に関わる帯域拡張処理部3では、第1の実施例の帯域拡張処理部3において、帯域生成判別部103と線形予測合成部105の間に、パワー制御部115と信号加算処理部116を設けるとともに、有声/無声推定部112と、雑音生成部113と、パワー制御部114とを設けたものである。
雑音生成部113は、有声/無声推定部112の推定結果である推定情報vuv[f]が「無声音」の場合に、一様にランダムな乱数を生成し、それを信号の振幅値にすることにより、白色化された雑音信号wn[n]をデータ長2N分生成して出力する。
パワー制御部115は、逆フィルタ102から出力された狭帯域音源信号であるデータ長2Nの線形予測残差信号e[n]と有音/無声推定部112から出力された1次自己相関係数In[f]に基づいて、帯域生成判別部103(広帯域化処理部10311)で得られた広帯域化されたデータ長2Nの線形予測残差信号e_wb[n]を所定のレベルまで増幅し、信号加算処理部116に出力する。具体的には、まずデータ長2Nの線形予測残差信号e[n]の2乗和を求め、データ長2Nの線形予測残差信号e_wb[n]の2乗和を求め、線形予測残差信号e[n]の2乗和を線形予測残差信号e_wb[n]の2乗和で割って増幅ゲインg3[f]を求める。次に、有声音である程レベルを増幅させるために、1次自己相関係数In[f]の絶対値が1に近づけば1に近づき、1次自己相関係数In[f]の絶対値が0に近づけば0に近づく増幅ゲインg4[f]を求める。そして、増幅ゲインg3[f]とg4[f]を線形予測残差信号e_wb[n]に乗じる。
線形予測合成部105は、狭帯域スペクトルパラメータである線形予測係数LPC[f,d]をそのまま広帯域スペクトルパラメータとして、広帯域スペクトルパラメータと、信号加算処理部116から出力される広帯域音源信号と、制御情報info[f]とに基づいて、データ長Nの第1の広帯域信号y1[n]を合成する。
次に、この発明に係わる帯域拡張処理部3の第5の実施例について説明する。第5の実施例は、第1の実施例と比較して、拡張する帯域において入力信号のピーク成分が欠落しているか否か、つまり帯域制限によって基本周波数の信号成分が欠落した入力信号か否かを判断する判断方法が異なる。第1の実施例では、帯域拡張前の線形予測残差信号のパワースペクトルと帯域拡張後の線形予測残差信号のパワースペクトルとを比較して帯域制限によって基本周波数の信号成分が欠落した入力信号か否かを判断していたが、第5の実施例では、帯域拡張前の線形予測残差信号のパワースペクトルを用いて帯域制限によって基本周波数の信号成分が欠落した入力信号か否かを判断する。
逆フィルタ102は、線形予測分析部101で得た狭帯域スペクトルパラメータである線形予測係数LPC[f,d]を用いて逆フィルタを形成し、その逆フィルタに線形予測分析部101で窓掛けしたデータ長2Nの入力信号wx[n]を入力し、狭帯域音源信号としてデータ長2Nの線形予測残差信号e[n]を得る。この信号e[n]は、狭帯域信号である。
周波数領域変換部203111は、データ長2Nの線形予測残差信号e[n]が入力され、この信号に例えば2N点によるFFT(Fast Fourier Transform)などの処理を施して周波数領域の信号に変換して、線形予測残差信号e[n]の周波数スペクトルE[f,ω]を算出し、パワースペクトル|E[f,ω]|2を算出する。以下の説明では、ωは周波数ビンの番号を表し、1≦ω≦2Nとする。
次に、この発明に係わる帯域拡張処理部3の第6の実施例について説明する。図20は、その構成を示すものであって、前述した実施例の帯域拡張処理部3は、低域拡張を行うものであったが、高域についても拡張を行う機能を備える。以下の説明では、上述した実施例と同じ構成については同じ番号を付番し、説明を簡明にするために必要に応じて重複する説明を省略する。
逆フィルタ102は、線形予測分析部101で得た狭帯域スペクトルパラメータである線形予測係数LPC[f,d]を用いて逆フィルタを形成し、その逆フィルタに線形予測分析部101で窓掛けしたデータ長2Nの入力信号wx[n]を入力して、狭帯域音源信号としてデータ長2Nの線形予測残差信号e[n]を得る。
高域拡張処理部510は、入力信号x[n]に高域拡張処理を施して、入力信号x[n]の周波数帯域よりも高い周波数帯域を拡張した広帯域信号y_hi_wb[n]を生成する。高域拡張処理部510は、例えば図21に示すように構成される。
広帯域化処理部522は、広帯域化処理部10311と同様の処理を実施するものであって、アップサンプリング部521から出力されたデータ長4Nの信号e2_us[n]に非線形処理を施して、有声音では基本周波数の倍音ごとに周波数領域でピークを持つ構造(調波構造)となる広帯域信号に変換する。これによって、広帯域化されたデータ長4Nの線形予測残差信号e2_wb[n]が得られる。
パワー制御部515は、アップサンプリング部521から出力されたデータ長4Nの信号e2_us[n]と有音/無声推定部112から出力された1次自己相関係数In[f]に基づいて、広帯域化処理部522で得られた広帯域化されたデータ長4Nの信号e2_wb[n]を所定のレベルまで増幅し、信号加算処理部516に出力する。具体的には、まずデータ長4Nの信号e2_us[n]の2乗和を求め、データ長4Nの信号e2_wb[n]の2乗和を求め、信号e2_us[n]の2乗和を信号e2_wb[n]の2乗和で割って増幅ゲインg3[f]を求める。次に、有声音である程レベルを増幅させるために、1次自己相関係数In[f]の絶対値が1に近づけば1に近づき、1次自己相関係数In[f]の絶対値が0に近づけば0に近づく増幅ゲインg4[f]を求める。そして、増幅ゲインg3[f]とg4[f]を信号e2_wb[n]に乗じる。
スペクトル包絡広帯域化処理部523は、狭帯域信号のスペクトル包絡を表す狭帯域スペクトルパラメータと広帯域信号のスペクトル包絡を表す広帯域スペクトルパラメータとの対応を事前にモデル化しておき、第2の狭帯域スペクトルパラメータ(ここでは線形予測係数LPC2[f,d])を取得し、このスペクトルパラメータを用いて、モデル化しておいた狭帯域スペクトルパラメータと広帯域スペクトルパラメータとの対応から第2の広帯域スペクトルパラメータ(ここでは線スペクトル周波数LSF_WB[f,d])を求める処理を行う。狭帯域のスペクトル包絡を表すスペクトルパラメータから広帯域のスペクトル包絡を表すスペクトルパラメータに変換する手法としては、ベクトル量子化(VQ)による符号帳を用いる手法(例えば、吉田, 阿部, ”コードブックマッピングによる狭帯域音声から広帯域音声の生成法”, 信学論(D-II), vol.J78-D-II, No.3, pp.391-399, Mar. 1995.)や、GMMを用いる手法(例えば、K. Y. Park, H. S. Kim, ”Narrowband to Wideband Conversion of Speech using GMM based Transformation”, Proc. ICASSP2000, vol.3, pp.1843-1846, Jun. 2000.)や、ベクトル量子化(VQ)による符号帳とHMMを用いる手法(例えば、G. Chen, V. Parsa, ”HMM-based Frequency Bandwidth Extension for Speech Enhancement using Line Spectral Frequencies”, Proc. ICASSP2004, vol.1, pp.709-712, 2004.)や、HMMを用いる手法(例えば、S. Yao, C. F. Chan, ”Block-based Bandwidth Extension of Narrowband Speech Signal by using CDHMM”, Proc. ICASSP2005, vol.1, pp.793-796, 2005.)などがあり、どれを用いても構わない。ここでは、例えばGMM(Gaussian mixture model)を利用する手法を用いるとして、線形予測分析部518で得た第2の狭帯域スペクトルパラメータである線形予測係数LPC2[f,d]を、fs_wb_low[Hz]からfs_wb_high[Hz]までに対応する第2の広帯域スペクトルパラメータであるDwb次の広帯域の線スペクトル周波数LSF_WB[f,d](d=1,…,Dwb)に、事前に線形予測係数LPC2[f,d]と線スペクトル周波数LSF_WB[f,d]の対応をモデル化しておいたGMMを利用して変換する。ここでは例えばDwb=18とする。なお、狭帯域スペクトルパラメータであるスペクトル包絡を表す特徴量データは、線形予測係数限らず、PARCOR係数や反射係数、線スペクトル周波数、ケプストラム係数、メルケプストラム係数などでも構わない。同様に、広帯域のスペクトルパラメータであるスペクトル包絡を表す特徴量データは、線スペクトル周波数に限らず、例えばLPC係数、PARCOR係数や反射係数、ケプストラム係数、メルケプストラム係数などでも構わない。
GMM格納部523bは、事前に学習された混合数Q(ここではQ=64)のGMM λq={wq,μq,Σq}(q=1,…,Q)を格納している。なお、wqはq番目の混合正規分布の混合重みを示し、μqはq番目の混合正規分布の平均ベクトル、Σqはq次数目の混合正規分布の共分散行列(対角共分散行列または全共分散行列)を表している。なお、平均ベクトルμqと共分散行列Σqの成分の数である次数は、Dnb+Dwbである。
また、SW4とSW5を除き、帯域通過フィルタ520に代わって、図24に示すようにフィルタ設定部511と帯域通過フィルタ520aを用いてもよい。また、図24に示すように高域通過フィルタ525と高域通過フィルタ526を追加してもよい。
また図25に示すようにスペクトル補正部111を備えてもよい。
また他の一例として例えば、図1(b)に示すように、ディジタルオーディオプレイヤに適用し、入力信号x[n]として音楽・オーディオ信号を想定する。この場合、例えば、図12と図13における線形予測分析部101と、逆フィルタ部102と、線形予測合成部105とを除いた構成とする。つまり、入力信号x[n]を帯域生成判別103に入力し、帯域生成判別103から出力された広帯域化された信号を帯域通過フィルタ108に入力し、帯域通過フィルタ108から出力された拡張され帯域を抽出した広帯域信号と帯域生成判別103から出力された制御情報info[f]を信号加算処理部110bに入力し、信号加算処理部110bでは制御情報info[f]に応じて帯域通過フィルタ108から出力された広帯域信号を加算したり加算しなかったり制御する。このようにしても同様の効果が得られる。
Claims (15)
- 入力信号に対して帯域を拡張する信号帯域拡張装置であって、
前記入力信号の帯域を拡張する広帯域化手段と、
前記広帯域化手段によって帯域拡張された入力信号が、拡張された帯域において、予め設定した閾値を超えるピーク成分を有する否かを判定する判定手段と、
前記判定手段が、前記ピーク成分を有すると判定した場合には前記広帯域化手段により帯域拡張された信号を用いることで前記入力信号の帯域を拡張し、一方、前記ピーク成分を有さないと判定した場合には前記広帯域化手段により帯域拡張された信号を用いた前記入力信号の帯域拡張を行わない制御手段とを具備することを特徴とする信号帯域拡張装置。 - 入力信号に対して帯域を拡張する信号帯域拡張装置であって、
前記入力信号から異なるピーク周波数を少なくとも2つ抽出するピーク抽出手段と、
前記ピーク抽出手段が抽出したピーク周波数の差に基づいて、拡張する帯域において前記入力信号のピーク成分が欠落しているか否かを判定する判定手段と、
前記判定手段が、前記ピーク成分が欠落していると判定した場合には前記入力信号の帯域を拡張し、一方、前記ピーク成分が欠落していないと判定した場合には前記入力信号の帯域を拡張しない制御手段とを具備することを特徴とする信号帯域拡張装置。 - 前記広帯域化手段は、
前記入力信号を分析して狭帯域スペクトルパラメータと狭帯域音源信号を得る分析手段と、
予め設定した非線形関数に基づいて、前記分析手段によって得られた狭帯域音源信号の帯域を拡張する帯域拡張手段とを備え、
前記判定手段は、前記帯域拡張手段によって帯域拡張された狭帯域音源信号が、拡張された帯域において、予め設定した閾値を超えるピーク成分を有するか否かを判定し、
前記制御手段は、前記判定手段の判定結果と、前記帯域拡張手段の入力と出力の比較結果とに応じて、前記入力信号の帯域拡張を行うことを特徴とする請求項1に記載の信号帯域拡張装置。 - 前記ピーク抽出手段は、
前記入力信号を分析して狭帯域スペクトルパラメータと狭帯域音源信号を得る分析手段と、
前記分析手段によって得られた狭帯域音源信号から異なるピーク周波数を少なくとも2つ抽出する抽出手段とを備え、
前記判定手段は、前記抽出手段が抽出したピーク周波数の差に基づいて、拡張する帯域において前記入力信号のピーク成分が欠落しているか否かを判定することを特徴とする請求項2に記載の信号帯域拡張装置。 - 前記狭帯域音源信号の帯域を拡張した信号を狭帯域スペクトルパラメータと合成する処理を行い広帯域信号を生成する合成手段をさらに備え、
前記制御手段は、帯域拡張する場合には、前記広帯域信号のディップを強調するディップ強調処理を行い、一方、帯域拡張しない場合には、前記ディップ強調処理を行わないことを特徴とする請求項3または請求項4に記載の信号帯域拡張装置。 - 前記制御手段は、
前記入力信号の帯域拡張を行う場合には、前記狭帯域音源信号の帯域を拡張した信号を前記狭帯域スペクトルパラメータと合成し、この合成された信号をフィルタ処理して前記入力信号に加算して出力し、
一方、前記入力信号の帯域拡張を行わない場合には、前記狭帯域音源信号の帯域を拡張した信号をフィルタ処理して前記入力信号に加算して出力することを特徴とする請求項3または請求項4に記載の信号帯域拡張装置。 - 前記制御手段は、
前記入力信号の帯域拡張を行う場合には、前記狭帯域音源信号の帯域を拡張した信号を前記狭帯域スペクトルパラメータと合成し、この合成された信号をフィルタ処理して前記入力信号に加算して出力し、
一方、前記入力信号の帯域拡張を行わない場合には、無音信号を前記狭帯域スペクトルパラメータと合成し、この合成された信号をフィルタ処理して前記入力信号に加算して出力することを特徴とする請求項3または請求項4に記載の信号帯域拡張装置。 - 前記制御手段は、帯域拡張する場合には、前記狭帯域音源信号の帯域を拡張した信号を前記狭帯域スペクトルパラメータとを合成し、この合成された信号から拡張する帯域の成分を抽出して前記入力信号に加算することで帯域拡張を行うことを特徴とする請求項3または請求項4に記載の信号帯域拡張装置。
- 前記制御手段は、帯域拡張する場合には低域を拡張し、一方、帯域拡張しない場合には低域を拡張しないことを特徴とする請求項3乃至請求項8のいずれか1項に記載の信号帯域拡張装置。
- 前記判定手段が判定する前記ピーク成分は前記入力信号の基本周波数であることを特徴とする請求項1乃至請求項9のいずれか1項に記載の信号帯域拡張装置。
- さらに、前記制御手段が低域拡張する場合には、前記狭帯域音源信号に対して帯域通過フィルタをかけて高域を拡張する処理を行い、一方、前記制御手段が低域拡張しない場合には、前記狭帯域音源信号に対して前記帯域通過フィルタをかけずに高域を拡張する処理を行う高域拡張手段を備えることを特徴とする請求項9に記載の信号帯域拡張装置。
- さらに、前記制御手段が低域拡張する場合には、前記狭帯域音源信号に対して帯域通過フィルタをかけて高域を拡張する処理を行い、一方、前記制御手段が低域拡張しない場合には、低域拡張する場合よりもフィルタの低域側の帯域通過特性が広い帯域通過フィルタを前記狭帯域音源信号に対してかけて高域を拡張する処理を行う高域拡張手段を備えることを特徴とする請求項9に記載の信号帯域拡張装置。
- 前記制御手段は、帯域拡張する場合には、帯域拡張しない場合よりも前記拡張する帯域におけるスペクトル補正の度合いを強くすることを特徴とする請求項1乃至請求項12のいずれか1項に記載の信号帯域拡張装置。
- 前記制御手段が帯域拡張する場合には、前記制御手段が帯域拡張しない場合よりも、次のフレームの入力信号に対して低域の雑音抑圧を弱くする雑音抑圧手段を更に有することを特徴とする請求項1乃至請求項13のいずれか1項に記載の信号帯域拡張装置。
- 前記制御手段が帯域拡張する場合には、前記制御手段が帯域拡張しない場合よりも、次のフレームの入力信号に対して低域のピークを強くするピーク強調手段を更に有することを特徴とする請求項1乃至請求項13のいずれか1項に記載の信号帯域拡張装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008222291A JP4818335B2 (ja) | 2008-08-29 | 2008-08-29 | 信号帯域拡張装置 |
US12/549,659 US8244547B2 (en) | 2008-08-29 | 2009-08-28 | Signal bandwidth extension apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008222291A JP4818335B2 (ja) | 2008-08-29 | 2008-08-29 | 信号帯域拡張装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010055000A JP2010055000A (ja) | 2010-03-11 |
JP4818335B2 true JP4818335B2 (ja) | 2011-11-16 |
Family
ID=41726664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008222291A Expired - Fee Related JP4818335B2 (ja) | 2008-08-29 | 2008-08-29 | 信号帯域拡張装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8244547B2 (ja) |
JP (1) | JP4818335B2 (ja) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1569200A1 (en) * | 2004-02-26 | 2005-08-31 | Sony International (Europe) GmbH | Identification of the presence of speech in digital audio data |
EP2211339B1 (en) * | 2009-01-23 | 2017-05-31 | Oticon A/s | Listening system |
ES2936307T3 (es) * | 2009-10-21 | 2023-03-16 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
US8484020B2 (en) * | 2009-10-23 | 2013-07-09 | Qualcomm Incorporated | Determining an upperband signal from a narrowband signal |
WO2011121782A1 (ja) * | 2010-03-31 | 2011-10-06 | 富士通株式会社 | 帯域拡張装置および帯域拡張方法 |
EP2614586B1 (en) * | 2010-09-10 | 2016-11-09 | DTS, Inc. | Dynamic compensation of audio signals for improved perceived spectral imbalances |
US8818797B2 (en) | 2010-12-23 | 2014-08-26 | Microsoft Corporation | Dual-band speech encoding |
RU2725416C1 (ru) | 2012-03-29 | 2020-07-02 | Телефонактиеболагет Лм Эрикссон (Пабл) | Расширение полосы частот гармонического аудиосигнала |
WO2014091581A1 (ja) * | 2012-12-12 | 2014-06-19 | 三菱電機株式会社 | 回路異常検出装置 |
US9258428B2 (en) | 2012-12-18 | 2016-02-09 | Cisco Technology, Inc. | Audio bandwidth extension for conferencing |
CN103971694B (zh) | 2013-01-29 | 2016-12-28 | 华为技术有限公司 | 带宽扩展频带信号的预测方法、解码设备 |
CN105761723B (zh) * | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
CN105225671B (zh) | 2014-06-26 | 2016-10-26 | 华为技术有限公司 | 编解码方法、装置及系统 |
US10431231B2 (en) * | 2017-06-29 | 2019-10-01 | Qualcomm Incorporated | High-band residual prediction with time-domain inter-channel bandwidth extension |
CN111386568B (zh) * | 2017-10-27 | 2023-10-13 | 弗劳恩霍夫应用研究促进协会 | 使用神经网络处理器生成带宽增强的音频信号的装置、方法或计算机可读存储介质 |
US11295726B2 (en) * | 2019-04-08 | 2022-04-05 | International Business Machines Corporation | Synthetic narrowband data generation for narrowband automatic speech recognition systems |
US20230110255A1 (en) * | 2021-10-12 | 2023-04-13 | Zoom Video Communications, Inc. | Audio super resolution |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3189614B2 (ja) * | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JPH0955778A (ja) * | 1995-08-15 | 1997-02-25 | Fujitsu Ltd | 音声信号の広帯域化装置 |
US5970441A (en) * | 1997-08-25 | 1999-10-19 | Telefonaktiebolaget Lm Ericsson | Detection of periodicity information from an audio signal |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
JP4604864B2 (ja) * | 2005-06-14 | 2011-01-05 | 沖電気工業株式会社 | 帯域拡張装置及び不足帯域信号生成器 |
JP5055759B2 (ja) * | 2005-12-16 | 2012-10-24 | 沖電気工業株式会社 | 帯域変換信号生成器及び帯域拡張装置 |
US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
JP2007310298A (ja) * | 2006-05-22 | 2007-11-29 | Oki Electric Ind Co Ltd | 帯域外信号生成装置及び周波数帯域拡張装置 |
-
2008
- 2008-08-29 JP JP2008222291A patent/JP4818335B2/ja not_active Expired - Fee Related
-
2009
- 2009-08-28 US US12/549,659 patent/US8244547B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US8244547B2 (en) | 2012-08-14 |
JP2010055000A (ja) | 2010-03-11 |
US20100057476A1 (en) | 2010-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4818335B2 (ja) | 信号帯域拡張装置 | |
JP5127754B2 (ja) | 信号処理装置 | |
JP4945586B2 (ja) | 信号帯域拡張装置 | |
KR101461774B1 (ko) | 대역폭 확장기 | |
EP1918910B1 (en) | Model-based enhancement of speech signals | |
JP5666444B2 (ja) | 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法 | |
JP6896881B2 (ja) | 音響信号のスペクトル強調処理に関する所定の特性を決定するための装置および方法 | |
JP5148414B2 (ja) | 信号帯域拡張装置 | |
KR20060044629A (ko) | 신경 회로망을 이용한 음성 신호 분리 시스템 및 방법과음성 신호 강화 시스템 | |
CN103854662A (zh) | 基于多域联合估计的自适应语音检测方法 | |
JPH10124088A (ja) | 音声帯域幅拡張装置及び方法 | |
JP2008513848A (ja) | 音声信号の帯域幅を疑似的に拡張するための方法および装置 | |
JP2010539792A (ja) | スピーチ増強 | |
CN101183527A (zh) | 用于对高频信号进行编码和解码的方法和设备 | |
Kornagel | Techniques for artificial bandwidth extension of telephone speech | |
JP2010210758A (ja) | 音声を含む信号の処理方法及び装置 | |
KR20150032390A (ko) | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 | |
JP5443547B2 (ja) | 信号処理装置 | |
JP2009223210A (ja) | 信号帯域拡張装置および信号帯域拡張方法 | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
JP2020190606A (ja) | 音声雑音除去装置及びプログラム | |
JP4603727B2 (ja) | 音響信号分析方法及び装置 | |
JP2019090930A (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
KR101352608B1 (ko) | 음성 신호의 대역폭 확장 방법 및 그 장치 | |
Ding | Speech enhancement in transform domain |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100615 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100824 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110603 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110802 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110830 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140909 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |