JP5423684B2 - 音声帯域拡張装置及び音声帯域拡張方法 - Google Patents

音声帯域拡張装置及び音声帯域拡張方法 Download PDF

Info

Publication number
JP5423684B2
JP5423684B2 JP2010542801A JP2010542801A JP5423684B2 JP 5423684 B2 JP5423684 B2 JP 5423684B2 JP 2010542801 A JP2010542801 A JP 2010542801A JP 2010542801 A JP2010542801 A JP 2010542801A JP 5423684 B2 JP5423684 B2 JP 5423684B2
Authority
JP
Japan
Prior art keywords
spectrum
mapping function
frequency
sound source
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010542801A
Other languages
English (en)
Other versions
JPWO2010070770A1 (ja
Inventor
香緒里 遠藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2010070770A1 publication Critical patent/JPWO2010070770A1/ja
Application granted granted Critical
Publication of JP5423684B2 publication Critical patent/JP5423684B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

本発明は、狭帯域の音声信号から広帯域の音声信号を生成する音声帯域拡張装置及び音声帯域拡張方法に関する。
従来から、伝送のために帯域が狭くなった音声信号の帯域を受話側で擬似的に拡張する技術が研究されている。
帯域を拡張する技術として、まず、音声信号を線形予測分析により音源信号とスペクトル包絡とに分離し、音源信号を全波整流や半波整流などの非線形処理で歪ませて高域信号を生成することで広帯域化する。また、予め学習しておいた狭帯域のスペクトル包絡から広帯域のスペクトル包絡への写像関数を用いてスペクトル包絡を広帯域化する。そして、広帯域化したスペクトル包絡と音源信号とを合成して広帯域信号を生成する技術が知られている。
また、音声信号を線形予測分析により音源信号とスペクトル包絡とに分離し、音源信号の基本周波数を求め、基本周波数の整数倍の周波数だけ高域と低域に音源信号をシフトさせて広帯域化する技術が知られている。
特開平09−101798号公報 特開平09−055778号公報
しかしながら、予め学習によって算出した狭帯域信号から広帯域信号を生成する写像関数は、数多くのデータを用いて平均的な写像関係を学習したものである。よって、平均的な写像関数は、適用する音声信号に対する最適値とは異なり、高音質の広帯域信号を得ることができない。さらに、高音質化を図ろうとすれば、様々な音声信号を記憶しなければならないため、データベースの容量が増大する。
また、音源信号を非線形処理し、基本周波数の整数倍だけ狭帯域の周波数成分を低・高域にシフトして広帯域化する方法では、実際の声は、狭帯域の周波数成分を単純にシフトしたものとは異なるため高音質の広帯域信号を得ることができない。
開示の音声帯域拡張装置は、入力信号を周波数変換してスペクトルを算出する周波数変換手段と、前記スペクトルから高域成分を生成するための写像関数を算出する写像関数算出手段と、前記写像関数に基づいて前記スペクトルの帯域よりも高域のスペクトルを生成し、生成した前記高域のスペクトルと前記周波数変換手段により算出されたスペクトルとを統合することにより、前記周波数変換手段により算出されたスペクトルの帯域よりも広帯域のスペクトルを生成する広帯域スペクトル生成手段と、前記広帯域のスペクトルを周波数逆変換して出力信号を算出する周波数逆変換手段と、前記写像関数に基づいて生成されたスペクトルと、前記周波数変換手段により算出されたスペクトルとの誤差を用いて写像関数の評価値を算出する評価手段と、を備え、前記広帯域スペクトル生成手段は、
前記評価値を用いて前記高域のスペクトルを修正する
開示の実施形態によれば、狭帯域信号のスペクトルから写像関数を算出し、算出した写像関数を用いて狭帯域よりも高域のスペクトルを生成して広帯域化することにより、広帯域信号の高音質化を図ることができる。
実施形態1にかかる音声帯域拡張装置の主要機能構成例を示すブロック図である。 広帯域スペクトル生成手段の主要機能構成例を示すブロック図である。 高域のスペクトルを生成する処理の概念図である。 平滑化処理の一例を示す図である。 実施形態1にかかる音声帯域拡張処理の一例を示すフローチャートである。 実施形態2にかかる音声帯域拡張装置の主要機能構成例を示すブロック図である。 評価値と誤差との関係の一例を示す図である。 広帯域スペクトル生成手段の主要機能構成例を示すブロック図である。 実施形態2にかかる音声帯域拡張処理の一例を示すフローチャートである。 実施形態3にかかる音声帯域拡張装置の主要機能構成例を示すブロック図である。 広帯域スペクトル生成手段の主要機能構成例を示すブロック図である。 狭帯域信号のパワースペクトルを示す図である。 音源信号を広帯域化する例を示す図である。 スペクトル包絡を広帯域化する例を示す図である。 音源信号とスペクトル包絡との合成処理の一例を示す図である。 実施形態3にかかる音声帯域拡張処理の一例を示すフローチャートである。 実施形態4にかかる音声帯域拡張装置の主要機能構成例を示すブロック図である。 広帯域スペクトル生成手段の主要機能構成例を示すブロック図である。 実施形態4にかかる音声帯域拡張処理の一例を示すフローチャートである。
符号の説明
11 周波数変換手段
12,32 写像関数算出手段
13,22,33,42 広帯域スペクトル生成手段
14 周波数逆変換手段
21,41 写像関数評価手段
31 音源・包絡分離手段
131 高域スペクトル生成手段
132,222,332,422 統合手段
221 スペクトル修正手段
331,421 高域分離情報生成手段
333,423 音源・包絡合成手段
以下、図面に基づいて実施形態について説明する。
[実施形態1]
<機能構成>
図1は、実施形態1にかかる音声帯域拡張装置1の主要機能構成例を示すブロック図である。図1に示すように、音声帯域拡張装置1は、周波数変換手段11、写像関数算出手段12、広帯域スペクトル生成手段13、周波数逆変換手段14を含む。
周波数変換手段11は、ネットワークなどを介して送信された音声の入力信号(以下、狭帯域信号ともいう)を取得し、時間周波数変換(以下、周波数変換という)を行って周波数情報(以下、スペクトルという)を算出する。なお、周波数変換は、フーリエ変換や離散コサイン変換などの技術を用いて行う。また、入力信号を300Hz〜3400Hzの狭帯域の信号として説明するが、この帯域に限られるものではない。次に、周波数変換手段11は、算出したスペクトルを写像関数算出手段12及び広帯域スペクトル生成手段13に出力する。
写像関数算出手段12は、周波数変換手段11から取得したスペクトルに対して、低域成分から高域成分を生成するための写像関数を算出する。以下、写像関数の一例を説明する。式(1)は、スペクトルの写像関数のモデルを示す。
Figure 0005423684
ここで、スペクトルの推定値と実際のスペクトルy(xi)との誤差を式(2)により算出する。
Figure 0005423684
モデルのパラメータa,bは、狭帯域信号のスペクトルy(xi)を用いて、式(2)(3)(4)より算出する。ここで、ピッチ周波数θは以下の式で算出する。
Figure 0005423684
θ= freq/a_max (6)
x:入力信号
M:相関係数を算出する区間の長さ(サンプル)
a:相関係数を算出する信号の開始位置
corr(a):ずらし位置がaの場合の相関係数
a_max: 最大相関係数に対応するa
i:信号のインデックス(サンプル)
freq:サンプリング周波数(Hz)
以上、モデルのパラメータa,bを算出することで、入力信号のスペクトルに対して低域成分から高域成分を生成するための写像関数を算出することができる。なお、モデルについては一例を示したにすぎず、上記モデルに限定されるものではない。また、写像関数算出手段12は、算出した写像関数を広帯域スペクトル生成手段13に出力する。
広帯域スペクトル生成手段13は、周波数変換手段11から狭帯域信号のスペクトルを取得し、また、写像関数算出手段12から写像関数を取得する。次に、広帯域スペクトル生成手段13は、取得したスペクトルと写像関数とを用いて狭帯域信号の帯域よりも広帯域のスペクトルを生成する。広帯域スペクトル生成手段13の詳細については図2を用いて説明する。広帯域スペクトル生成手段13は、生成した広帯域のスペクトルを周波数逆変換手段14に出力する。
図2は、広帯域スペクトル生成手段13の主要機能構成例を示すブロック図である。図2に示すように、広帯域スペクトル生成手段13は、高域スペクトル生成手段131、統合手段132を含む。
高域スペクトル生成手段131は、写像関数算出手段12から取得した写像関数に対して狭帯域よりも高域の周波数を入力することで、狭帯域のスペクトルよりも高域のスペクトルを生成する。
統合手段132は、高域スペクトル生成手段131により生成された高域のスペクトルと狭帯域のスペクトルとを統合することで、広帯域のスペクトルを生成する。ここで、狭帯域信号を広帯域化する例について説明する。前提として、狭帯域信号のスペクトルが0〜Tの帯域数の情報を持ち、これを2倍の0〜2Tの帯域数に拡大する例について説明する。
まず、狭帯域信号のスペクトルを、広帯域のスペクトルの狭帯域成分に設定する。
S_w[i] = S_n[i] i= 0,...,T-1 (7)
広帯域のスペクトルの高域成分に、写像関数を用いて生成したスペクトルを設定する。
S_w[i] = S_f[i] i= T,...,2T-1 (8)
ナイキスト周波数の成分は0とする。
S_w[2T] = 0 (9)
S_w[i]:i番目の周波数帯域の広帯域のスペクトル
S_n[i]:i番目の周波数帯域の狭帯域のスペクトル
S_f[i]:写像関数を適用して生成されたi番目の周波数帯域のスペクトル
以上より、狭帯域のスペクトルの帯域数を例えば2倍にして広帯域のスペクトルを生成することができる。
次に、図1に戻り、周波数逆変換手段14は、広帯域スペクトル生成手段13から広帯域のスペクトルを取得し、取得した広帯域のスペクトルに対して周波数時間変換(周波数逆変換)を行い時間領域の出力信号を算出する。
ここで、図3に示す具体例を用いて高域のスペクトルを生成する例について説明する。図3は、高域のスペクトルを生成する処理の概念図である。図3に示すように、0〜4kHzの狭帯域信号から4〜8kHzの高域のスペクトルを生成する処理について説明する。
図3に示す例において、まず、狭帯域信号のスペクトルの帯域(例えば0〜4kHz)から高域(例えば4〜8kHz)のスペクトルを生成するための写像関数を算出する。次に、高域(4〜8kHz)の周波数を写像関数に入力することで高域(4〜8kHz)のスペクトルを生成する。次に、狭帯域信号(0〜4kHz)のスペクトルと、生成した高域(4〜8kHz)のスペクトルとを統合して、広帯域(0〜8kHz)のスペクトルを生成することができる。
ここで、高域のスペクトルを統合する際に、単に統合するだけでなく、以下のような平滑化処理を加えてもよい。この平滑化処理については図4を用いて説明する。図4は、平滑化処理の一例を示す図である。図4に示すように、狭帯域信号の高域の部分のスペクトルを写像関数で生成する(1点鎖線)。次に、もともとの狭帯域信号の高域のスペクトルが、生成されたスペクトル(1点鎖線)に徐々になるように変更することで、境界(4kHz)を滑らかにつなぐようにしてもよい。
具体的には、狭帯域信号の高域のスペクトルが、写像関数を用いて生成されたスペクトルに徐々になるよう重み係数を決定しておく。次に、この重み係数を用いて高域のスペクトルと生成されたスペクトルとの加重平均をとればよい。これにより、境界でスペクトルが不連続になることによる異音の発生を防止することができる。
<動作>
実施形態1にかかる音声帯域拡張装置1の処理について説明する。図5は、実施形態1にかかる音声帯域拡張処理の一例を示すフローチャートである。ステップS11において、周波数変換手段11は、時間領域の入力信号に対して周波数変換(時間周波数変換)を行い、周波数領域のスペクトルを算出する。
次のステップS12において、写像関数算出手段12は、周波数変換手段11により算出されたスペクトルを用いて、スペクトルの低域成分から高域成分を生成するための写像関数を算出する。具体的には前述した通りであり、写像関数となるモデルを与えて、そのパラメータを算出する。
次のステップS13において、広帯域スペクトル生成手段13は、周波数変換手段11により生成されたスペクトルと、写像関数算出手段12により算出された写像関数とを用いて、狭帯域よりも広帯域のスペクトルを生成する。具体的には、まず、高域スペクトル生成手段131により、写像関数に狭帯域よりも高域の周波数を入力して高域のスペクトルを生成する。次に、統合手段132により、狭帯域のスペクトルと高域スペクトル生成手段131により生成された高域のスペクトルとを統合することで広帯域のスペクトルを生成する。
次のステップS14において、周波数逆変換手段14は、広帯域スペクトル生成手段13により生成された広帯域のスペクトルに対して周波数逆変換(周波数時間変換)を行い、時間領域の出力信号を算出する。
以上、実施形態1によれば、狭帯域信号のスペクトルを用いて写像関数を算出し、算出した写像関数を用いて高域のスペクトルを生成して広帯域化することができる。よって、広帯域信号の高音質化を図ることができる。また、入力信号に適合した写像関数を求めることができ、入力信号のスペクトル特性に応じた高域のスペクトルを生成することができる。
また、スペクトルの統合を行う際、平滑化処理を行うようにすれば、スペクトル統合の境界において不連続なスペクトルの発生を防止し、境界においても滑らかなスペクトルを生成することができる。
[実施形態2]
次に、実施形態2にかかる音声帯域拡張装置2について説明する。実施形態2では、算出した写像関数を評価することで、算出された高域のスペクトルの寄与度や採否を評価に基づいて決定することができる。
<機能構成>
図6は、実施形態2にかかる音声帯域拡張装置2の主要機能構成例を示すブロック図である。図6に示す機能において、図1に示す機能と同様の機能のものは同じ符号を付し、その説明を省略する。
図6に示すように、音声帯域拡張装置2は、周波数変換手段11、写像関数算出手段12、写像関数評価手段21、広帯域スペクトル生成手段22、周波数逆変換14を含む。以下、写像関数評価手段21、広帯域スペクトル生成手段22について説明する。
写像関数評価手段21は、写像関数算出手段12により算出された写像関数の性能について評価を行う。例えば、以下のようにして評価値を算出することで写像関数の評価を行う。写像関数評価手段21は、入力信号を周波数変換したスペクトルと、写像関数を適用して生成したスペクトルとの誤差Vを式(10)により算出する。
Figure 0005423684
また、写像関数評価手段21は、式(10)を用いて算出した誤差Vから評価値を求める。例えば、図7を用いて誤差から評価値を算出する。図7は、評価値と誤差との関係の一例を示す図である。
図7に示すように、評価値は0以上1以下の値であり、また、評価値は誤差が大きくなるにつれて小さくなるような関数を予め設定しておく。また、関数の代わりに評価値と誤差との対応テーブルを設定してもよい。
なお、図7に示す評価値と誤差との関係は一例を示すものであり、誤差が大きくなるにつれて評価値が小さくなる関係を満たせばよい。また、誤差が所定値以上大きくなった場合は評価値を0にするなどの条件を加えてもよい。また、誤差の逆数を評価値とする等してもよい。誤差を用いて算出された評価値は、写像関数と共に広帯域スペクトル生成手段22に出力される。
図6に戻り、広帯域スペクトル生成手段22は、狭帯域信号のスペクトルと、写像関数と、評価値とを用いて広帯域化されたスペクトルを生成する。広帯域スペクトル生成手段22の詳細については図8を用いて説明する。
図8は、広帯域スペクトル生成手段22の主要機能構成例を示すブロック図である。図8に示すように、広帯域スペクトル生成手段22は、高域スペクトル生成手段131、スペクトル修正手段221、統合手段222を含む。図8に示す機能において、図2に示す機能と同様の機能のものは同じ符号を付し、その説明を省略する。
スペクトル修正手段221は、高域スペクトル生成手段131により生成された高域のスペクトルに対し、写像関数評価手段21により算出された評価値を用いて修正する。例えば、評価値を高域のスペクトルに乗算する式(11)を用いて修正を行う。
S'w[i] = α × Sw[i] (11)
Sw[i]:写像関数を適用して生成した高域のスペクトル
α:写像関数の評価値
S'w[i]:評価値を用いて修正した高域のスペクトル
写像関数の評価値αは、前述した通り写像関数で生成したスペクトルと狭帯域のスペクトルとの誤差から評価値を算出する関数(又は対応テーブル等)により求める(図7参照)。
次に、統合手段222は、基本的には図2で説明した統合手段132と同様である。異なるところは、統合する高域のスペクトルに、スペクトル修正手段221により修正された高域のスペクトルを用いるところである。これにより、評価値が小さい写像関数を用いて生成された高域のスペクトルは、統合後の広帯域のスペクトルにおいて影響を与えないようにすることができる。
<動作>
実施形態2にかかる音声帯域拡張装置2の処理について説明する。図9は、実施形態2にかかる音声帯域拡張処理の一例を示すフローチャートである。図9に示す処理において、図5に示す処理と同様の処理を行うものは同じ符号を付し、その説明を省略する。
ステップS21において、写像関数評価手段21は、写像関数算出手段12により算出された写像関数の性能について評価する。評価については前述した通り、狭帯域のスペクトルと写像関数を用いて生成されたスペクトルとの誤差を求め、この誤差から評価値を算出することで写像関数の評価を行う。
次のステップS22において、広帯域スペクトル生成手段22は、まず、写像関数を適用することにより生成された高域のスペクトルに対して、写像関数評価手段21により算出された評価値を用いて修正を加える。修正については前述した通り、評価値をスペクトルに乗算して修正を行う。次に、広帯域スペクトル生成手段22は、狭帯域のスペクトルと、修正された高域のスペクトルとを統合して広帯域のスペクトルを生成する。このとき、実施形態1において説明した平滑化処理を加えてもよい。
以上、実施形態2によれば、算出された写像関数の評価値を算出し、この評価値に基づいて、写像関数を用いて生成された高域のスペクトルを修正することができる。つまり、性能が悪い写像関数を用いて生成された高域のスペクトルは、統合後の広帯域のスペクトルにおいて影響を与えないようにすることができる。
[実施形態3]
次に、実施形態3にかかる音声帯域拡張装置3について説明する。実施形態3では、周波数変換後のスペクトルに対して音源信号、スペクトル包絡に分離するところが上記各実施形態とは異なる。
<機能構成>
図10は、実施形態3にかかる音声帯域拡張装置3の主要機能構成例を示すブロック図である。図10に示す機能において、図1に示す機能と同様の機能のものは同じ符号を付し、その説明を省略する。
図10に示すように、音声帯域拡張装置3は、周波数変換手段11、音源・包絡分離手段31、写像関数算出手段32、広帯域スペクトル生成手段33、周波数逆変換14を含む。以下、音源・包絡分離手段31、写像関数算出手段32、広帯域スペクトル生成手段33について説明する。
音源・包絡分離手段31は、周波数変換手段11により算出されたスペクトルを音源信号とスペクトル包絡とに分離する。この分離処理は、線形予測分析やケプストラムリフタなどの技術により行われる。なお、分離された音源信号及び/又はスペクトル包絡を分離情報と呼ぶことにする。また、音源・包絡分離手段31は、分離された分離情報を写像関数算出手段32及び広帯域スペクトル生成手段33に出力する。
写像関数算出手段32は、音源・包絡分離手段31により分離された分離情報に対して、低域成分から高域成分を生成するための写像関数を算出する。ここで、写像関数を算出する分離情報として、音源信号及びスペクトル包絡、音源信号のみ、スペクトル包絡のみの3パターンがある。以下、これらを順に説明する。
(音源信号及びスペクトル包絡の場合)
写像関数算出手段32は、音源信号及びスペクトル包絡それぞれに対して写像関数を算出する。音源信号の写像関数については、上記実施形態で説明したようにスペクトルに対する算出の仕方と同様であるため、ここでは説明を省略する。以下、スペクトル包絡に対する写像関数の算出について説明する。
まず、スペクトル包絡の写像関数として、下記のモデル(12)を与える。
Figure 0005423684
ここで、スペクトル包絡のパワースペクトル推定値と、実際のスペクトル包絡のパワースペクトルz(xi)との誤差を式(13)により算出する。
Figure 0005423684
モデルのパラメータc,d,eは、狭帯域信号のスペクトル包絡のパワースペクトルz(xi)を用いて、式(13)、(14)、(15)、(16)より算出される。これより、モデルのパラメータc,d,eを算出することで、スペクトル包絡に対しての低域成分から高域成分への写像関数を算出することができる。なお、モデルについては一例を示したにすぎず、上記モデルに限定されるものではない。また、写像関数算出手段32は、算出した音源信号及びスペクトル包絡それぞれの写像関数を広帯域スペクトル生成手段33に出力する。
(音源信号のみの場合)
写像関数算出手段32は、音源信号に対して低域成分から高域成分への写像関数を算出する。音源信号の写像関数については、上記実施形態で説明したようにスペクトルに対する算出の仕方と同様であるため、ここでは説明を省略する。また、写像関数算出手段32は、算出した音源信号の写像関数を広帯域スペクトル生成手段33に出力する。
(スペクトル包絡のみの場合)
写像関数算出手段32は、スペクトル包絡に対して低域成分から高域成分への写像関数を算出する。スペクトル包絡の写像関数については、前述した通りモデルを与えて、そのパラメータを算出することで写像関数を算出することができる。また、写像関数算出手段32は、算出したスペクトル包絡の写像関数を広帯域スペクトル生成手段33に出力する。
広帯域スペクトル生成手段33は、音源・包絡分離手段31により分離された分離情報と、写像関数算出手段32により算出された写像関数とを用いて、狭帯域よりも広帯域の分離情報を生成する。次に、広帯域スペクトル生成手段33は、生成した広帯域の分離情報に基づいて広帯域のスペクトルを生成する。ここで、広帯域スペクトル生成手段33の詳細について図11を用いて説明する。
図11は、広帯域スペクトル生成手段33の主要機能構成例を示すブロック図である。図11に示すように、広帯域スペクトル生成手段33は、高域分離情報生成手段331、統合手段332、音源・包絡合成手段333を含む。
高域分離情報生成手段331は、算出された写像関数と狭帯域よりも高域の周波数とを用いて、狭帯域よりも高域の分離情報を生成する。ここで、分離情報は前述した通り、音源信号及びスペクトル包絡、音源信号のみ、スペクトル包絡のみの3パターンあるので、それぞれの場合に場合分けして高域分離情報生成手段331の機能を説明する。
(音源信号及びスペクトル包絡の場合)
高域分離情報生成手段331は、写像関数算出手段32により算出された音源信号、スペクトル包絡それぞれの写像関数に対して、狭帯域よりも高域の周波数を入力して高域の音源信号及びスペクトル包絡を生成する。次に、高域分離情報生成手段331は、生成した高域の音源信号及びスペクトル包絡を統合手段332に出力する。
(音源信号のみの場合)
高域分離情報生成手段331は、写像関数算出手段32により算出された音源信号の写像関数に対して、狭帯域よりも高域の周波数を入力して高域の音源信号を生成する。また、高域分離情報生成手段331は、スペクトル包絡の写像関数は算出されていないため、従来技術と同様に、予め学習された写像関数を用いたり低域を繰り返したりするなどして高域のスペクトル包絡を生成する。次に、高域分離情報生成手段331は、生成した高域の音源信号及びスペクトル包絡を統合手段332に出力する。
(スペクトル包絡のみの場合)
高域分離情報生成手段331は、写像関数算出手段32により算出されたスペクトル包絡の写像関数に対して、狭帯域よりも高域の周波数を入力して高域のスペクトル包絡を生成する。また、高域分離情報生成手段331は、音源信号の写像関数は算出されていないため、従来技術と同様に、予め学習された写像関数を用いたり低域を繰り返したりするなどして高域の音源信号を生成する。次に、高域分離情報生成手段331は、生成した高域の音源信号及びスペクトル包絡を統合手段332に出力する。
統合手段332は、狭帯域の音源信号と、高域分離情報生成手段331により生成された高域の音源信号とを統合する。また、統合手段332は、狭帯域のスペクトル包絡と高域分離情報生成手段331により生成された高域のスペクトル包絡とを統合する。統合方法については実施形態1の統合手段132で前述した通りである。統合された音源信号及びスペクトル包絡は音源・包絡合成手段333に出力される。
音源・包絡合成手段333は、統合されて広帯域化された音源信号及びスペクトル包絡を合成し、広帯域のスペクトルを生成する。具体的には、広帯域の音源信号のスペクトルと広帯域のスペクトル包絡のスペクトルとを用いて式(17)により広帯域信号のスペクトルを算出する。
Sw[i] = SRw[i] × EVw[i] (17)
Sw[i]:i番目の広帯域信号のスペクトル
SRw [i]:i番目の広帯域の音源信号のスペクトル
EVw [i]:i番目の広帯域のスペクトル包絡のスペクトル
なお、ここでは統合手段332、音源・包絡合成手段333の順に処理する例について説明したが、先に音源・包絡合成手段333により合成を行い、次に、統合手段332により統合を行うように構成してもよい。この場合、まず、音源・包絡合成手段333は、狭帯域の音源信号及びスペクトル包絡を合成する。また、音源・包絡分離手段33は、高域分離情報生成手段331により生成された高域の音源信号及びスペクトル包絡を合成する。次に、統合手段332は、合成後における狭帯域のスペクトルと高域のスペクトルとを統合すればよい。また、統合手段333により統合を行う際に、前述した平滑化処理を行うようにしてもよい。
ここで、図12A〜図12C及び図13を用いて、分離情報が音源信号及びスペクトル包絡の場合についての統合、合成処理について具体的に説明する。
図12Aは、狭帯域信号のパワースペクトルを示す図である。この狭帯域信号のパワースペクトルを音源信号とスペクトル包絡とに分離したことを図12B、図12Cにそれぞれ示す。
図12Bは、音源信号を広帯域化する例を示す図である。図12Bに示すように、0〜4kHzの音源信号を用いて低域成分から高域成分を生成するための写像関数が算出され、算出された写像関数を用いて4〜8kHzの音源信号が生成される。生成された音源信号は、狭帯域の音源信号と統合され、広帯域化された音源信号Aとなる。
図12Cは、スペクトル包絡を広帯域化する例を示す図である。図12Cに示すように、0〜4kHzのスペクトル包絡を用いて低域成分から高域成分を生成するための写像関数が算出され、算出された写像関数を用いて4〜8kHzのスペクトル包絡が生成される。生成されたスペクトル包絡は、狭帯域のスペクトル包絡と統合され、広帯域化されたスペクトル包絡Bとなる。
図13は、音源信号とスペクトル包絡との合成処理の一例を示す図である。図13に示すように、図12B、図12Cにそれぞれ示す音源信号Aとスペクトル包絡Bとを合成することにより、広帯域化されたスペクトルが生成される。これより、音源・包絡分離手段31を備える構成であっても、入力信号のスペクトルに基づいて写像関数を算出することができ、現入力信号に適した高域のスペクトルを生成することができる。
<動作>
実施形態3にかかる音声帯域拡張装置3の処理について説明する。図14は、実施形態3にかかる音声帯域拡張処理の一例を示すフローチャートである。図14に示す処理において、図5に示す処理と同様の処理を行うものは同じ符号を付し、その説明を省略する。
ステップS31において、音源・包絡分離手段31は、周波数変換後のスペクトルを、音源信号とスペクトル包絡とに分離する。
次のステップS32において、写像関数算出手段32は、音源・包絡分離手段31により分離された分離情報を用いて低域成分から高域成分を生成するための写像関数を算出する。具体的には前述した通りであり、写像関数となるモデルを与えて、そのパラメータをに算出する。なお、写像関数を算出するパターンとしては、音源信号及びスペクトル包絡の写像関数、音源信号のみの写像関数、スペクトル包絡のみの写像関数の3パターンがある。
次のステップS33において、広帯域スペクトル生成手段33は、まず、写像関数算出手段32により算出された写像関数を用いて、狭帯域よりも高域の分離情報を生成する。このとき、音源信号及びスペクトル包絡に写像関数が算出されていた場合は、それぞれの写像関数を用いて高域の音源信号及びスペクトル包絡を生成する。また、音源信号のみに写像関数が算出されていた場合は、音源信号の写像関数を用いて高域の音源信号を生成する。スペクトル包絡については、従来技術を用いて高域のスペクトル包絡を生成する。また、スペクトル包絡のみに写像関数が算出されていた場合は、スペクトル包絡の写像関数を用いて高域のスペクトル包絡を生成する。音源信号については、従来技術を用いて高域の音源信号を生成する。
次に、広帯域スペクトル生成手段33は、生成された高域の音源信号、スペクトル包絡をそれぞれ、狭帯域の音源信号、スペクトル包絡に統合する。次に、統合された音源信号及びスペクトル包絡を合成することで、広帯域化されたスペクトルを生成する。このとき、実施形態1において説明した平滑化処理を加えてもよい。
以上、実施形態3によれば、狭帯域信号のスペクトルから音源信号、スペクトル包絡に分離し、分離した分離情報を用いて低域成分から高域成分を生成するための写像関数を算出することができる。また、算出した写像関数を用いて高域のスペクトルを生成して広帯域化することにより、広帯域信号の高音質化を図ることができる。また、入力信号に適合した写像関数を求めることができ、入力信号のスペクトル特性に応じた高域のスペクトルを生成することができる。
[実施形態4]
次に、実施形態4にかかる音声帯域拡張装置4について説明する。実施形態4では、分離情報に基づいて算出された写像関数を評価することで、算出された高域のスペクトルの寄与度や採否を評価に基づいて決定することができる。
<機能構成>
図15は、実施形態4にかかる音声帯域拡張装置4の主要機能構成例を示すブロック図である。図15に示す機能において、図1及び図10に示す機能と同様の機能のものは同じ符号を付し、その説明を省略する。
図15に示すように、音声帯域拡張装置4は、周波数変換手段11、音源・包絡分離手段31、写像関数算出手段32、写像関数評価手段41、広帯域スペクトル生成手段42、周波数逆変換14を含む。以下、写像関数評価手段41、広帯域スペクトル生成手段42について説明する。
写像関数評価手段41は、写像関数算出手段32により算出された写像関数の性能の評価を行う。評価の仕方は実施形態2の写像関数評価手段21と同様に行う。つまり、音源信号のみに対して写像関数が算出されていれば、音源信号の写像関数を用いて生成された音源信号と、狭帯域の音源信号との誤差を算出し、誤差から評価値を求めることで写像関数の評価を行う。
この評価は、スペクトル包絡のみの写像関数が算出されている場合、音源信号、スペクトル包絡それぞれの写像関数が算出されている場合も同様に行われる。
広帯域スペクトル生成手段42は、写像関数評価手段41から取得した評価値と写像関数、及び、音源・包絡分離手段31から取得した狭帯域の音源信号及びスペクトル包絡を用いて広帯域のスペクトルを生成する。ここで、広帯域スペクトル生成手段42の詳細について図16を用いて説明する。
図16は、広帯域スペクトル生成手段42の主要機能構成例を示すブロック図である。図16に示す機能において、図11に示す機能と同様の機能のものは同じ符号を付し、その説明を省略する。図16に示すように、広帯域スペクトル生成手段42は、高域分離情報生成手段331、高域分離情報修正手段421、統合手段422、音源・包絡合成手段423を含む。
高域分離情報修正手段421は、高域分離情報生成手段331により生成された狭帯域よりも高域の分離情報に対して、写像関数の評価値を用いて修正を加える。ここで、分離情報は前述した通り、音源信号及びスペクトル包絡、音源信号のみ、スペクトル包絡のみの3パターンあるので、それぞれの場合に場合分けして高域分離情報修正手段421の機能を説明する。
(音源信号及びスペクトル包絡の場合)
高域分離情報修正手段421は、高域分離情報生成手段331により生成された高域の音源信号、スペクトル包絡を、それぞれの写像関数の評価値を用いて修正する。まず、音源信号の修正について説明する。
音源信号の写像関数を用いて生成された高域の音源信号に対し、音源信号の写像関数の評価値を用いて式(18)により修正を加える。
SR'w[i] = β × SRw[i] (18)
SRw[i]:音源信号の写像関数を適用して生成した高域の音源信号
SR'w[i]:評価値を用いて修正した高域の音源信号
β:音源信号の写像関数の評価値
写像関数の評価値βは、写像関数で算出した音源信号と狭帯域信号の音源信号との誤差から評価値を算出する関数(又は対応テーブル)により求める。
次に、スペクトル包絡の修正について説明する。スペクトル包絡の写像関数を適用して生成した高域のスペクトル包絡に対し、スペクトル包絡の写像関数の評価値を用いて式(19)により修正を加える。
SE'w[i] = γ × SEw[i] (19)
SEw[i]:スペクトル包絡の写像関数を適用して生成した高域のスペクトル包絡
SE'w[i]:評価値を用いて修正した高域のスペクトル包絡
γ:スペクトル包絡の写像関数の評価値
写像関数の評価値γは、前述した通り写像関数を用いて生成されたスペクトル包絡と狭帯域信号のスペクトル包絡との誤差から評価値を算出する関数(又は対応テーブル)により求める。
これより、音源信号及びスペクトル包絡それぞれの評価値を用いて修正した高域の音源信号及びスペクトル包絡を生成することができる。次に、高域分離情報修正手段331は、修正した高域の音源信号、スペクトル包絡を統合手段422に出力する。
(音源信号のみの場合)
高域分離情報修正手段421は、高域分離情報生成手段331により生成された音源信号を、音源信号の写像関数の評価値を用いて修正する。修正の仕方は前述した通りである。ここで、スペクトル包絡の写像関数は算出されていないので、高域のスペクトル包絡については修正しない。次に、高域分離情報生成手段331は、修正した高域の音源信号、修正していない高域のスペクトル包絡を統合手段332に出力する。
(スペクトル包絡のみの場合)
高域分離情報修正手段421は、高域分離情報生成手段331により生成されたスペクトル包絡を、スペクトル包絡の写像関数の評価値を用いて修正する。修正の仕方は前述した通りである。ここで、音源信号の写像関数は算出されていないので、高域の音源信号については修正しない。次に、高域分離情報生成手段331は、修正した高域のスペクトル包絡、修正していない高域の音源信号を統合手段332に出力する。
統合手段422は、狭帯域の音源信号と、高域分離情報修正手段421により出力された高域の音源信号とを統合する。また、統合手段332は、狭帯域のスペクトル包絡と高域分離情報修正手段421により出力された高域のスペクトル包絡とを統合する。統合方法については実施形態1の統合手段132で前述した通りである。統合された音源信号及びスペクトル包絡は音源・包絡合成手段423に出力される。
音源・包絡合成手段423は、統合されて広帯域化された音源信号及びスペクトル包絡を合成し、広帯域のスペクトルを生成する。
なお、ここでは統合手段422、音源・包絡合成手段423の順に処理する例について説明したが、先に音源・包絡合成手段423により合成を行い、次に、統合手段422により統合を行うように構成してもよい。この場合、まず、音源・包絡合成手段423は、狭帯域の音源信号及びスペクトル包絡を合成する。また、音源・包絡合成手段423は、高域分離情報修正手段421により出力された高域の音源信号及びスペクトル包絡を合成する。次に、統合手段422は、合成後における狭帯域のスペクトルと高域のスペクトルとを統合すればよい。
また、統合手段423により統合を行う際に、前述した平滑化処理を行うようにしてもよい。以上より、分離情報を用いて算出された写像関数を評価することで、算出された高域のスペクトルの寄与度や採否を評価に基づいて決定することができる。
<動作>
実施形態4にかかる音声帯域拡張装置4の処理について説明する。図17は、実施形態4にかかる音声帯域拡張処理の一例を示すフローチャートである。図17に示す処理において、図5及び図14に示す処理と同様の処理を行うものは同じ符号を付し、その説明を省略する。
ステップS41において、写像関数評価手段41は、写像関数算出手段32により算出された写像関数の性能を評価する。評価については、前述した通り写像関数の評価値を算出することで評価とする。
次のステップS42において、広帯域スペクトル生成手段42は、まず、写像関数算出手段32により算出された写像関数を用いて、狭帯域よりも高域の分離情報を生成する。このとき、音源信号及びスペクトル包絡に写像関数が算出された場合は、それぞれの写像関数を用いて高域の音源信号及びスペクトル包絡を生成する。また、音源信号のみに写像関数が算出された場合は、音源信号の写像関数を用いて高域の音源信号を生成する。スペクトル包絡については、従来技術を用いて高域のスペクトル包絡を生成する。また、スペクトル包絡のみに写像関数が算出された場合は、スペクトル包絡の写像関数を用いて高域のスペクトル包絡を生成する。音源信号については、従来技術を用いて高域の音源信号を生成する。
次に、広帯域スペクトル生成手段42は、写像関数算出手段32により算出された写像関数を用いて生成された音源信号及び/又はスペクトル包絡に対し、写像関数の評価値を用いて修正を加える。従来技術を適用して生成された音源信号又はスペクトル包絡がある場合、この音源信号又はスペクトル包絡については修正を加えない。
次に、広帯域スペクトル生成手段42は、高域の音源信号、スペクトル包絡をそれぞれ、狭帯域の音源信号、スペクトル包絡に統合する。また、広帯域スペクトル生成手段42は、統合された音源信号及びスペクトル包絡を合成することで、広帯域化されたスペクトルを生成する。このとき、実施形態1において説明した平滑化処理を加えてもよい。
以上、実施形態4によれば、スペクトルを音源信号、スペクトル包絡に分離する場合、分離情報に基づいて算出された写像関数を評価することができる。また、生成された高域のスペクトルの寄与度や採否を評価に基づいて決定することができる。
[変形例]
前述した各実施形態における変形例について説明する。各実施形態では、写像関数に関してモデルを与えてそのパラメータを算出することで写像関数を算出することにしていたが、ここでは、線形予測係数を算出する。以下、線形予測係数の求め方について説明する。
式(20)のAは狭帯域信号のスペクトルを並べた行列、bは行列Aの第一行よりも周波数のインデックスがq大きいスペクトルを並べた列ベクトルである。線形予測係数pは、Aの逆行列を算出し、式(23)により算出できる。Aの逆行列は、一般化逆行列など既知の方法によって求める。
線形予測係数pは、狭帯域信号の低域のスペクトルを入力とし、それよりもqだけ高域のスペクトルを予測する係数となっている。
Ap=b (20)
A:m×oの行列(狭帯域信号のスペクトルを並べた行列)
p:線形予測係数(m次元列ベクトル)
b:行列Aの第一行よりも周波数のインデックスがq大きいスペクトルを並べた列ベクトル(o次元列ベクトル)
Figure 0005423684
st:周波数のインデックスがtのスペクトル
Figure 0005423684
次に、算出した線形予測係数を用いて高域のスペクトルを算出する例について説明する。入力信号(狭帯域信号)のスペクトルよりも高域のスペクトルは、式(24)の行列A'に線形予測係数を乗算することで生成される。
A'p=b' (24)
A':m×oの行列(狭帯域信号のスペクトルを並べた行列)
p:線形予測係数(m次元列ベクトル)
b':高域のスペクトル(o次元列ベクトル)
式(24)より、行列A'の第一行よりも周波数のインデックスがq大きいスペクトルが算出される。線形予測係数を用いて生成した高域のスペクトルは次の通りである。
線形予測係数で算出できる範囲(t〜t-o+2q)は、算出結果(b')を設定し、算出できない範囲(t -o+2q〜2T-1)は0とする。
S_f[t-o+1+q+i] = b'[i] i=0,,,,q-1 (25)
S_f[t-o+2q+i] = 0 i=0,,,,2T-1-t+o-2q (26)
S_f[i]:線形予測係数を用いて生成したi番目のスペクトル
t:線形予測係数を適用する狭帯域スペクトルの最大周波数のインデックス
狭帯域信号のスペクトルと、狭帯域よりも高域のスペクトルとの統合は、各実施形態で説明した統合と同様に行えばよい。また、スペクトルの線形予測係数を算出する例について説明したが、音源信号、スペクトル包絡の線形予測係数についても同様にして算出することができる。
これより、線形予測係数を算出して高域のスペクトルを生成する方が、モデルを与えてそのパラメータを算出するよりも、モデルを与える必要がないため、入力信号のスペクトル特性に柔軟に対応して高域のスペクトルを生成することができる。
また、前述した各実施形態で説明した音声帯域拡張処理内容をコンピュータに実行させるためのプログラムとし、このプログラムをサーバ等からインストールして、コンピュータに実行させることにより前述した音声帯域拡張処理を実現させることも可能である。
また、このプログラムを記録媒体(CD−ROMやSDカード等)に記録し、このプログラムが記録された記録媒体をコンピュータや携帯端末に読み取らせて、前述した音声帯域拡張処理を実現させることも可能である。なお、記録媒体は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。また、開示の音声帯域拡張装置は、携帯端末やIP電話機などの機器に対して適用することができる。
以上、実施形態について詳述したが、特定の実施形態に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。

Claims (6)

  1. 入力信号を周波数変換してスペクトルを算出する周波数変換手段と、
    前記スペクトルから高域成分を生成するための写像関数を算出する写像関数算出手段と、
    前記写像関数に基づいて前記スペクトルの帯域よりも高域のスペクトルを生成し、生成した前記高域のスペクトルと前記周波数変換手段により算出されたスペクトルとを統合することにより、前記周波数変換手段により算出されたスペクトルの帯域よりも広帯域のスペクトルを生成する広帯域スペクトル生成手段と、
    前記広帯域のスペクトルを周波数逆変換して出力信号を算出する周波数逆変換手段と
    前記写像関数に基づいて生成されたスペクトルと、前記周波数変換手段により算出されたスペクトルとの誤差を用いて写像関数の評価値を算出する評価手段と、を備え、
    前記広帯域スペクトル生成手段は、
    前記評価値を用いて前記高域のスペクトルを修正する音声帯域拡張装置。
  2. 前記周波数変換手段により算出されたスペクトルを音源信号とスペクトル包絡とに分離する分離手段とを更に備え、
    前記写像関数算出手段は、
    前記分離手段により分離された分離情報を用いて、前記分離情報の低域成分から高域成分を生成するための写像関数を算出し、
    前記広帯域スペクトル生成手段は、
    前記写像関数に基づいて前記スペクトルの帯域よりも高域の分離情報を生成し、生成した前記高域の分離情報と前記分離手段により分離された分離情報とを統合し、統合した分離情報に基づいて前記広帯域のスペクトルを生成する請求項1記載の音声帯域拡張装置。
  3. 前記写像関数に基づいて生成された分離情報と、前記分離手段により分離された分離情報との誤差を用いて写像関数の評価値を算出する評価値算出手段とを更に備え、
    前記広帯域スペクトル生成手段は、
    前記評価値を用いて前記高域の分離情報を修正する請求項記載の音声帯域拡張装置。
  4. 前記分離情報は、前記音源信号及び/又は前記スペクトル包絡である請求項記載の音声帯域拡張装置。
  5. 前記写像関数は、線形予測係数を算出する関数である請求項1乃至いずれか1項に記載の音声帯域拡張装置。
  6. 入力信号を周波数変換してスペクトルを算出する周波数変換段階と、
    前記スペクトルから高域成分を生成するための写像関数を算出する写像関数算出段階と、
    前記写像関数に基づいて前記スペクトルの帯域よりも高域のスペクトルを生成し、生成した前記高域のスペクトルと前記周波数変換段階により算出されたスペクトルとを統合することにより、前記周波数変換段階により算出されたスペクトルの帯域よりも広帯域のスペクトルを生成する広帯域スペクトル生成段階と、
    前記広帯域のスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階と
    前記写像関数に基づいて生成されたスペクトルと、前記周波数変換段階において算出されたスペクトルとの誤差を用いて写像関数の評価値を算出する評価段階とを備え、
    前記広帯域スペクトル生成段階は、
    前記評価値を用いて前記高域のスペクトルを修正する音声帯域拡張方法。
JP2010542801A 2008-12-19 2008-12-19 音声帯域拡張装置及び音声帯域拡張方法 Expired - Fee Related JP5423684B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/073236 WO2010070770A1 (ja) 2008-12-19 2008-12-19 音声帯域拡張装置及び音声帯域拡張方法

Publications (2)

Publication Number Publication Date
JPWO2010070770A1 JPWO2010070770A1 (ja) 2012-05-24
JP5423684B2 true JP5423684B2 (ja) 2014-02-19

Family

ID=42268458

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010542801A Expired - Fee Related JP5423684B2 (ja) 2008-12-19 2008-12-19 音声帯域拡張装置及び音声帯域拡張方法

Country Status (4)

Country Link
US (1) US8781823B2 (ja)
EP (1) EP2360687A4 (ja)
JP (1) JP5423684B2 (ja)
WO (1) WO2010070770A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8468093B2 (en) 2004-03-25 2013-06-18 International Business Machines Corporation Method and system for performing a commercial transaction by using a short message service terminal
JP5772723B2 (ja) * 2012-05-31 2015-09-02 ヤマハ株式会社 音響処理装置および分離マスク生成装置
CN105976830B (zh) 2013-01-11 2019-09-20 华为技术有限公司 音频信号编码和解码方法、音频信号编码和解码装置
US10043535B2 (en) * 2013-01-15 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10045135B2 (en) 2013-10-24 2018-08-07 Staton Techiya, Llc Method and device for recognition and arbitration of an input connection
US10043534B2 (en) 2013-12-23 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
JP6333043B2 (ja) * 2014-04-23 2018-05-30 山本 裕 音声信号処理装置
CN106228991B (zh) 2014-06-26 2019-08-20 华为技术有限公司 编解码方法、装置及系统
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US10121487B2 (en) 2016-11-18 2018-11-06 Samsung Electronics Co., Ltd. Signaling processor capable of generating and synthesizing high frequency recover signal

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
JPH09101798A (ja) * 1995-10-05 1997-04-15 Matsushita Electric Ind Co Ltd 音声帯域拡大方法および音声帯域拡大装置
JP2007310296A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域拡張装置及び方法
JP2008139844A (ja) * 2006-11-09 2008-06-19 Sony Corp 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08130494A (ja) * 1994-10-28 1996-05-21 Fujitsu Ltd 音声信号処理システム
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3696091B2 (ja) * 1999-05-14 2005-09-14 松下電器産業株式会社 オーディオ信号の帯域を拡張するための方法及び装置
JP4792613B2 (ja) 1999-09-29 2011-10-12 ソニー株式会社 情報処理装置および方法、並びに記録媒体
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
KR20010101422A (ko) * 1999-11-10 2001-11-14 요트.게.아. 롤페즈 매핑 매트릭스에 의한 광대역 음성 합성
US6625226B1 (en) * 1999-12-03 2003-09-23 Allen Gersho Variable bit rate coder, and associated method, for a communication station operable in a communication system
JP2002169597A (ja) * 2000-09-05 2002-06-14 Victor Co Of Japan Ltd 音声信号処理装置、音声信号処理方法、音声信号処理のプログラム、及び、そのプログラムを記録した記録媒体
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
CN1235192C (zh) * 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
EP1543307B1 (en) * 2002-09-19 2006-02-22 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
JP2004198485A (ja) * 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
JP4977471B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 符号化装置及び符号化方法
JP4977472B2 (ja) * 2004-11-05 2012-07-18 パナソニック株式会社 スケーラブル復号化装置
WO2006062202A1 (ja) * 2004-12-10 2006-06-15 Matsushita Electric Industrial Co., Ltd. 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法
KR100707186B1 (ko) * 2005-03-24 2007-04-13 삼성전자주식회사 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체
US20090319277A1 (en) * 2005-03-30 2009-12-24 Nokia Corporation Source Coding and/or Decoding
JP5129117B2 (ja) * 2005-04-01 2013-01-23 クゥアルコム・インコーポレイテッド 音声信号の高帯域部分を符号化及び復号する方法及び装置
JP3770901B2 (ja) * 2005-06-22 2006-04-26 三菱電機株式会社 広帯域音声復元方法及び広帯域音声復元装置
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
KR100813259B1 (ko) * 2005-07-13 2008-03-13 삼성전자주식회사 입력신호의 계층적 부호화/복호화 장치 및 방법
US8396717B2 (en) * 2005-09-30 2013-03-12 Panasonic Corporation Speech encoding apparatus and speech encoding method
JP5055759B2 (ja) * 2005-12-16 2012-10-24 沖電気工業株式会社 帯域変換信号生成器及び帯域拡張装置
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US20080300866A1 (en) * 2006-05-31 2008-12-04 Motorola, Inc. Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8295507B2 (en) 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
US8229106B2 (en) * 2007-01-22 2012-07-24 D.S.P. Group, Ltd. Apparatus and methods for enhancement of speech
KR100905585B1 (ko) * 2007-03-02 2009-07-02 삼성전자주식회사 음성신호의 대역폭 확장 제어 방법 및 장치
AU2009221443B2 (en) * 2008-03-04 2012-01-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for mixing a plurality of input data streams
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP4892021B2 (ja) * 2009-02-26 2012-03-07 株式会社東芝 信号帯域拡張装置
JP5126145B2 (ja) * 2009-03-30 2013-01-23 沖電気工業株式会社 帯域拡張装置、方法及びプログラム、並びに、電話端末
US8560330B2 (en) * 2010-07-19 2013-10-15 Futurewei Technologies, Inc. Energy envelope perceptual correction for high band coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0955778A (ja) * 1995-08-15 1997-02-25 Fujitsu Ltd 音声信号の広帯域化装置
JPH09101798A (ja) * 1995-10-05 1997-04-15 Matsushita Electric Ind Co Ltd 音声帯域拡大方法および音声帯域拡大装置
JP2007310296A (ja) * 2006-05-22 2007-11-29 Oki Electric Ind Co Ltd 帯域拡張装置及び方法
JP2008139844A (ja) * 2006-11-09 2008-06-19 Sony Corp 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体

Also Published As

Publication number Publication date
US20110282655A1 (en) 2011-11-17
EP2360687A4 (en) 2012-07-11
EP2360687A1 (en) 2011-08-24
WO2010070770A1 (ja) 2010-06-24
JPWO2010070770A1 (ja) 2012-05-24
US8781823B2 (en) 2014-07-15

Similar Documents

Publication Publication Date Title
JP5423684B2 (ja) 音声帯域拡張装置及び音声帯域拡張方法
EP3324408B1 (en) Efficient combined harmonic transposition
JP4520732B2 (ja) 雑音低減装置、および低減方法
US8271292B2 (en) Signal bandwidth expanding apparatus
JP3189614B2 (ja) 音声帯域拡大装置
JP4818335B2 (ja) 信号帯域拡張装置
US9026435B2 (en) Method for estimating a fundamental frequency of a speech signal
US7406303B2 (en) Multi-sensory speech enhancement using synthesized sensor signal
WO2010024371A1 (ja) 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム
US7957964B2 (en) Apparatus and methods for noise suppression in sound signals
JP5598536B2 (ja) 帯域拡張装置および帯域拡張方法
EP0657873B1 (en) Speech signal bandwidth compression and expansion apparatus, and bandwidth compressing speech signal transmission method, and reproducing method
EP1995723A1 (en) Neuroevolution training system
US20140078867A1 (en) Sound direction estimation device, sound direction estimation method, and sound direction estimation program
RU2648570C2 (ru) Оценка формы коэффициента передачи для улучшенного отслеживания временных характеристик верхнего диапазона
CN110556123A (zh) 频带扩展方法、装置、电子设备及计算机可读存储介质
JP5148414B2 (ja) 信号帯域拡張装置
JP2019512740A (ja) 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング
JP2009223210A (ja) 信号帯域拡張装置および信号帯域拡張方法
JP2002268698A (ja) 音声認識装置と標準パターン作成装置及び方法並びにプログラム
WO2010061505A1 (ja) 発話音声検出装置
JP2012208177A (ja) 帯域拡張装置及び音声補正装置
US20160189725A1 (en) Voice Processing Method and Apparatus, and Recording Medium Therefor
US8588346B2 (en) Doppler frequency estimation system and method
JP6065488B2 (ja) 帯域拡張装置及び方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130507

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131003

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131111

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees