JP5423684B2 - 音声帯域拡張装置及び音声帯域拡張方法 - Google Patents
音声帯域拡張装置及び音声帯域拡張方法 Download PDFInfo
- Publication number
- JP5423684B2 JP5423684B2 JP2010542801A JP2010542801A JP5423684B2 JP 5423684 B2 JP5423684 B2 JP 5423684B2 JP 2010542801 A JP2010542801 A JP 2010542801A JP 2010542801 A JP2010542801 A JP 2010542801A JP 5423684 B2 JP5423684 B2 JP 5423684B2
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- mapping function
- frequency
- sound source
- generated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 40
- 238000001228 spectrum Methods 0.000 claims description 334
- 238000013507 mapping Methods 0.000 claims description 199
- 238000011156 evaluation Methods 0.000 claims description 78
- 238000000926 separation method Methods 0.000 claims description 68
- 238000004364 calculation method Methods 0.000 claims description 27
- 238000006243 chemical reaction Methods 0.000 claims description 27
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 207
- 230000003595 spectral effect Effects 0.000 description 47
- 230000010354 integration Effects 0.000 description 36
- 238000010586 diagram Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 18
- 238000012937 correction Methods 0.000 description 16
- 239000011159 matrix material Substances 0.000 description 12
- 230000002194 synthesizing effect Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000009499 grossing Methods 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 238000007796 conventional method Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Description
前記評価値を用いて前記高域のスペクトルを修正する。
12,32 写像関数算出手段
13,22,33,42 広帯域スペクトル生成手段
14 周波数逆変換手段
21,41 写像関数評価手段
31 音源・包絡分離手段
131 高域スペクトル生成手段
132,222,332,422 統合手段
221 スペクトル修正手段
331,421 高域分離情報生成手段
333,423 音源・包絡合成手段
<機能構成>
図1は、実施形態1にかかる音声帯域拡張装置1の主要機能構成例を示すブロック図である。図1に示すように、音声帯域拡張装置1は、周波数変換手段11、写像関数算出手段12、広帯域スペクトル生成手段13、周波数逆変換手段14を含む。
ここで、スペクトルの推定値と実際のスペクトルy(xi)との誤差を式(2)により算出する。
モデルのパラメータa,bは、狭帯域信号のスペクトルy(xi)を用いて、式(2)(3)(4)より算出する。ここで、ピッチ周波数θは以下の式で算出する。
θ= freq/a_max (6)
x:入力信号
M:相関係数を算出する区間の長さ(サンプル)
a:相関係数を算出する信号の開始位置
corr(a):ずらし位置がaの場合の相関係数
a_max: 最大相関係数に対応するa
i:信号のインデックス(サンプル)
freq:サンプリング周波数(Hz)
以上、モデルのパラメータa,bを算出することで、入力信号のスペクトルに対して低域成分から高域成分を生成するための写像関数を算出することができる。なお、モデルについては一例を示したにすぎず、上記モデルに限定されるものではない。また、写像関数算出手段12は、算出した写像関数を広帯域スペクトル生成手段13に出力する。
S_w[i] = S_n[i] i= 0,...,T-1 (7)
広帯域のスペクトルの高域成分に、写像関数を用いて生成したスペクトルを設定する。
S_w[i] = S_f[i] i= T,...,2T-1 (8)
ナイキスト周波数の成分は0とする。
S_w[2T] = 0 (9)
S_w[i]:i番目の周波数帯域の広帯域のスペクトル
S_n[i]:i番目の周波数帯域の狭帯域のスペクトル
S_f[i]:写像関数を適用して生成されたi番目の周波数帯域のスペクトル
以上より、狭帯域のスペクトルの帯域数を例えば2倍にして広帯域のスペクトルを生成することができる。
実施形態1にかかる音声帯域拡張装置1の処理について説明する。図5は、実施形態1にかかる音声帯域拡張処理の一例を示すフローチャートである。ステップS11において、周波数変換手段11は、時間領域の入力信号に対して周波数変換(時間周波数変換)を行い、周波数領域のスペクトルを算出する。
次に、実施形態2にかかる音声帯域拡張装置2について説明する。実施形態2では、算出した写像関数を評価することで、算出された高域のスペクトルの寄与度や採否を評価に基づいて決定することができる。
図6は、実施形態2にかかる音声帯域拡張装置2の主要機能構成例を示すブロック図である。図6に示す機能において、図1に示す機能と同様の機能のものは同じ符号を付し、その説明を省略する。
また、写像関数評価手段21は、式(10)を用いて算出した誤差Vから評価値を求める。例えば、図7を用いて誤差から評価値を算出する。図7は、評価値と誤差との関係の一例を示す図である。
S'w[i] = α × Sw[i] (11)
Sw[i]:写像関数を適用して生成した高域のスペクトル
α:写像関数の評価値
S'w[i]:評価値を用いて修正した高域のスペクトル
写像関数の評価値αは、前述した通り写像関数で生成したスペクトルと狭帯域のスペクトルとの誤差から評価値を算出する関数(又は対応テーブル等)により求める(図7参照)。
実施形態2にかかる音声帯域拡張装置2の処理について説明する。図9は、実施形態2にかかる音声帯域拡張処理の一例を示すフローチャートである。図9に示す処理において、図5に示す処理と同様の処理を行うものは同じ符号を付し、その説明を省略する。
次に、実施形態3にかかる音声帯域拡張装置3について説明する。実施形態3では、周波数変換後のスペクトルに対して音源信号、スペクトル包絡に分離するところが上記各実施形態とは異なる。
図10は、実施形態3にかかる音声帯域拡張装置3の主要機能構成例を示すブロック図である。図10に示す機能において、図1に示す機能と同様の機能のものは同じ符号を付し、その説明を省略する。
写像関数算出手段32は、音源信号及びスペクトル包絡それぞれに対して写像関数を算出する。音源信号の写像関数については、上記実施形態で説明したようにスペクトルに対する算出の仕方と同様であるため、ここでは説明を省略する。以下、スペクトル包絡に対する写像関数の算出について説明する。
ここで、スペクトル包絡のパワースペクトル推定値と、実際のスペクトル包絡のパワースペクトルz(xi)との誤差を式(13)により算出する。
モデルのパラメータc,d,eは、狭帯域信号のスペクトル包絡のパワースペクトルz(xi)を用いて、式(13)、(14)、(15)、(16)より算出される。これより、モデルのパラメータc,d,eを算出することで、スペクトル包絡に対しての低域成分から高域成分への写像関数を算出することができる。なお、モデルについては一例を示したにすぎず、上記モデルに限定されるものではない。また、写像関数算出手段32は、算出した音源信号及びスペクトル包絡それぞれの写像関数を広帯域スペクトル生成手段33に出力する。
写像関数算出手段32は、音源信号に対して低域成分から高域成分への写像関数を算出する。音源信号の写像関数については、上記実施形態で説明したようにスペクトルに対する算出の仕方と同様であるため、ここでは説明を省略する。また、写像関数算出手段32は、算出した音源信号の写像関数を広帯域スペクトル生成手段33に出力する。
写像関数算出手段32は、スペクトル包絡に対して低域成分から高域成分への写像関数を算出する。スペクトル包絡の写像関数については、前述した通りモデルを与えて、そのパラメータを算出することで写像関数を算出することができる。また、写像関数算出手段32は、算出したスペクトル包絡の写像関数を広帯域スペクトル生成手段33に出力する。
高域分離情報生成手段331は、写像関数算出手段32により算出された音源信号、スペクトル包絡それぞれの写像関数に対して、狭帯域よりも高域の周波数を入力して高域の音源信号及びスペクトル包絡を生成する。次に、高域分離情報生成手段331は、生成した高域の音源信号及びスペクトル包絡を統合手段332に出力する。
高域分離情報生成手段331は、写像関数算出手段32により算出された音源信号の写像関数に対して、狭帯域よりも高域の周波数を入力して高域の音源信号を生成する。また、高域分離情報生成手段331は、スペクトル包絡の写像関数は算出されていないため、従来技術と同様に、予め学習された写像関数を用いたり低域を繰り返したりするなどして高域のスペクトル包絡を生成する。次に、高域分離情報生成手段331は、生成した高域の音源信号及びスペクトル包絡を統合手段332に出力する。
高域分離情報生成手段331は、写像関数算出手段32により算出されたスペクトル包絡の写像関数に対して、狭帯域よりも高域の周波数を入力して高域のスペクトル包絡を生成する。また、高域分離情報生成手段331は、音源信号の写像関数は算出されていないため、従来技術と同様に、予め学習された写像関数を用いたり低域を繰り返したりするなどして高域の音源信号を生成する。次に、高域分離情報生成手段331は、生成した高域の音源信号及びスペクトル包絡を統合手段332に出力する。
Sw[i] = SRw[i] × EVw[i] (17)
Sw[i]:i番目の広帯域信号のスペクトル
SRw [i]:i番目の広帯域の音源信号のスペクトル
EVw [i]:i番目の広帯域のスペクトル包絡のスペクトル
なお、ここでは統合手段332、音源・包絡合成手段333の順に処理する例について説明したが、先に音源・包絡合成手段333により合成を行い、次に、統合手段332により統合を行うように構成してもよい。この場合、まず、音源・包絡合成手段333は、狭帯域の音源信号及びスペクトル包絡を合成する。また、音源・包絡分離手段33は、高域分離情報生成手段331により生成された高域の音源信号及びスペクトル包絡を合成する。次に、統合手段332は、合成後における狭帯域のスペクトルと高域のスペクトルとを統合すればよい。また、統合手段333により統合を行う際に、前述した平滑化処理を行うようにしてもよい。
実施形態3にかかる音声帯域拡張装置3の処理について説明する。図14は、実施形態3にかかる音声帯域拡張処理の一例を示すフローチャートである。図14に示す処理において、図5に示す処理と同様の処理を行うものは同じ符号を付し、その説明を省略する。
次に、実施形態4にかかる音声帯域拡張装置4について説明する。実施形態4では、分離情報に基づいて算出された写像関数を評価することで、算出された高域のスペクトルの寄与度や採否を評価に基づいて決定することができる。
図15は、実施形態4にかかる音声帯域拡張装置4の主要機能構成例を示すブロック図である。図15に示す機能において、図1及び図10に示す機能と同様の機能のものは同じ符号を付し、その説明を省略する。
高域分離情報修正手段421は、高域分離情報生成手段331により生成された高域の音源信号、スペクトル包絡を、それぞれの写像関数の評価値を用いて修正する。まず、音源信号の修正について説明する。
SR'w[i] = β × SRw[i] (18)
SRw[i]:音源信号の写像関数を適用して生成した高域の音源信号
SR'w[i]:評価値を用いて修正した高域の音源信号
β:音源信号の写像関数の評価値
写像関数の評価値βは、写像関数で算出した音源信号と狭帯域信号の音源信号との誤差から評価値を算出する関数(又は対応テーブル)により求める。
SE'w[i] = γ × SEw[i] (19)
SEw[i]:スペクトル包絡の写像関数を適用して生成した高域のスペクトル包絡
SE'w[i]:評価値を用いて修正した高域のスペクトル包絡
γ:スペクトル包絡の写像関数の評価値
写像関数の評価値γは、前述した通り写像関数を用いて生成されたスペクトル包絡と狭帯域信号のスペクトル包絡との誤差から評価値を算出する関数(又は対応テーブル)により求める。
高域分離情報修正手段421は、高域分離情報生成手段331により生成された音源信号を、音源信号の写像関数の評価値を用いて修正する。修正の仕方は前述した通りである。ここで、スペクトル包絡の写像関数は算出されていないので、高域のスペクトル包絡については修正しない。次に、高域分離情報生成手段331は、修正した高域の音源信号、修正していない高域のスペクトル包絡を統合手段332に出力する。
高域分離情報修正手段421は、高域分離情報生成手段331により生成されたスペクトル包絡を、スペクトル包絡の写像関数の評価値を用いて修正する。修正の仕方は前述した通りである。ここで、音源信号の写像関数は算出されていないので、高域の音源信号については修正しない。次に、高域分離情報生成手段331は、修正した高域のスペクトル包絡、修正していない高域の音源信号を統合手段332に出力する。
実施形態4にかかる音声帯域拡張装置4の処理について説明する。図17は、実施形態4にかかる音声帯域拡張処理の一例を示すフローチャートである。図17に示す処理において、図5及び図14に示す処理と同様の処理を行うものは同じ符号を付し、その説明を省略する。
前述した各実施形態における変形例について説明する。各実施形態では、写像関数に関してモデルを与えてそのパラメータを算出することで写像関数を算出することにしていたが、ここでは、線形予測係数を算出する。以下、線形予測係数の求め方について説明する。
Ap=b (20)
A:m×oの行列(狭帯域信号のスペクトルを並べた行列)
p:線形予測係数(m次元列ベクトル)
b:行列Aの第一行よりも周波数のインデックスがq大きいスペクトルを並べた列ベクトル(o次元列ベクトル)
st:周波数のインデックスがtのスペクトル
次に、算出した線形予測係数を用いて高域のスペクトルを算出する例について説明する。入力信号(狭帯域信号)のスペクトルよりも高域のスペクトルは、式(24)の行列A'に線形予測係数を乗算することで生成される。
A'p=b' (24)
A':m×oの行列(狭帯域信号のスペクトルを並べた行列)
p:線形予測係数(m次元列ベクトル)
b':高域のスペクトル(o次元列ベクトル)
式(24)より、行列A'の第一行よりも周波数のインデックスがq大きいスペクトルが算出される。線形予測係数を用いて生成した高域のスペクトルは次の通りである。
S_f[t-o+1+q+i] = b'[i] i=0,,,,q-1 (25)
S_f[t-o+2q+i] = 0 i=0,,,,2T-1-t+o-2q (26)
S_f[i]:線形予測係数を用いて生成したi番目のスペクトル
t:線形予測係数を適用する狭帯域スペクトルの最大周波数のインデックス
狭帯域信号のスペクトルと、狭帯域よりも高域のスペクトルとの統合は、各実施形態で説明した統合と同様に行えばよい。また、スペクトルの線形予測係数を算出する例について説明したが、音源信号、スペクトル包絡の線形予測係数についても同様にして算出することができる。
Claims (6)
- 入力信号を周波数変換してスペクトルを算出する周波数変換手段と、
前記スペクトルから高域成分を生成するための写像関数を算出する写像関数算出手段と、
前記写像関数に基づいて前記スペクトルの帯域よりも高域のスペクトルを生成し、生成した前記高域のスペクトルと前記周波数変換手段により算出されたスペクトルとを統合することにより、前記周波数変換手段により算出されたスペクトルの帯域よりも広帯域のスペクトルを生成する広帯域スペクトル生成手段と、
前記広帯域のスペクトルを周波数逆変換して出力信号を算出する周波数逆変換手段と、
前記写像関数に基づいて生成されたスペクトルと、前記周波数変換手段により算出されたスペクトルとの誤差を用いて写像関数の評価値を算出する評価手段と、を備え、
前記広帯域スペクトル生成手段は、
前記評価値を用いて前記高域のスペクトルを修正する音声帯域拡張装置。 - 前記周波数変換手段により算出されたスペクトルを音源信号とスペクトル包絡とに分離する分離手段とを更に備え、
前記写像関数算出手段は、
前記分離手段により分離された分離情報を用いて、前記分離情報の低域成分から高域成分を生成するための写像関数を算出し、
前記広帯域スペクトル生成手段は、
前記写像関数に基づいて前記スペクトルの帯域よりも高域の分離情報を生成し、生成した前記高域の分離情報と前記分離手段により分離された分離情報とを統合し、統合した分離情報に基づいて前記広帯域のスペクトルを生成する請求項1記載の音声帯域拡張装置。 - 前記写像関数に基づいて生成された分離情報と、前記分離手段により分離された分離情報との誤差を用いて写像関数の評価値を算出する評価値算出手段とを更に備え、
前記広帯域スペクトル生成手段は、
前記評価値を用いて前記高域の分離情報を修正する請求項2記載の音声帯域拡張装置。 - 前記分離情報は、前記音源信号及び/又は前記スペクトル包絡である請求項2記載の音声帯域拡張装置。
- 前記写像関数は、線形予測係数を算出する関数である請求項1乃至4いずれか1項に記載の音声帯域拡張装置。
- 入力信号を周波数変換してスペクトルを算出する周波数変換段階と、
前記スペクトルから高域成分を生成するための写像関数を算出する写像関数算出段階と、
前記写像関数に基づいて前記スペクトルの帯域よりも高域のスペクトルを生成し、生成した前記高域のスペクトルと前記周波数変換段階により算出されたスペクトルとを統合することにより、前記周波数変換段階により算出されたスペクトルの帯域よりも広帯域のスペクトルを生成する広帯域スペクトル生成段階と、
前記広帯域のスペクトルを周波数逆変換して出力信号を算出する周波数逆変換段階と、
前記写像関数に基づいて生成されたスペクトルと、前記周波数変換段階において算出されたスペクトルとの誤差を用いて写像関数の評価値を算出する評価段階とを備え、
前記広帯域スペクトル生成段階は、
前記評価値を用いて前記高域のスペクトルを修正する音声帯域拡張方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2008/073236 WO2010070770A1 (ja) | 2008-12-19 | 2008-12-19 | 音声帯域拡張装置及び音声帯域拡張方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2010070770A1 JPWO2010070770A1 (ja) | 2012-05-24 |
JP5423684B2 true JP5423684B2 (ja) | 2014-02-19 |
Family
ID=42268458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010542801A Expired - Fee Related JP5423684B2 (ja) | 2008-12-19 | 2008-12-19 | 音声帯域拡張装置及び音声帯域拡張方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8781823B2 (ja) |
EP (1) | EP2360687A4 (ja) |
JP (1) | JP5423684B2 (ja) |
WO (1) | WO2010070770A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8468093B2 (en) | 2004-03-25 | 2013-06-18 | International Business Machines Corporation | Method and system for performing a commercial transaction by using a short message service terminal |
JP5772723B2 (ja) * | 2012-05-31 | 2015-09-02 | ヤマハ株式会社 | 音響処理装置および分離マスク生成装置 |
CN105976830B (zh) | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
US10043535B2 (en) * | 2013-01-15 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US10045135B2 (en) | 2013-10-24 | 2018-08-07 | Staton Techiya, Llc | Method and device for recognition and arbitration of an input connection |
US10043534B2 (en) | 2013-12-23 | 2018-08-07 | Staton Techiya, Llc | Method and device for spectral expansion for an audio signal |
JP6333043B2 (ja) * | 2014-04-23 | 2018-05-30 | 山本 裕 | 音声信号処理装置 |
CN106228991B (zh) | 2014-06-26 | 2019-08-20 | 华为技术有限公司 | 编解码方法、装置及系统 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10121487B2 (en) | 2016-11-18 | 2018-11-06 | Samsung Electronics Co., Ltd. | Signaling processor capable of generating and synthesizing high frequency recover signal |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0955778A (ja) * | 1995-08-15 | 1997-02-25 | Fujitsu Ltd | 音声信号の広帯域化装置 |
JPH09101798A (ja) * | 1995-10-05 | 1997-04-15 | Matsushita Electric Ind Co Ltd | 音声帯域拡大方法および音声帯域拡大装置 |
JP2007310296A (ja) * | 2006-05-22 | 2007-11-29 | Oki Electric Ind Co Ltd | 帯域拡張装置及び方法 |
JP2008139844A (ja) * | 2006-11-09 | 2008-06-19 | Sony Corp | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08130494A (ja) * | 1994-10-28 | 1996-05-21 | Fujitsu Ltd | 音声信号処理システム |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3696091B2 (ja) * | 1999-05-14 | 2005-09-14 | 松下電器産業株式会社 | オーディオ信号の帯域を拡張するための方法及び装置 |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
KR20010101422A (ko) * | 1999-11-10 | 2001-11-14 | 요트.게.아. 롤페즈 | 매핑 매트릭스에 의한 광대역 음성 합성 |
US6625226B1 (en) * | 1999-12-03 | 2003-09-23 | Allen Gersho | Variable bit rate coder, and associated method, for a communication station operable in a communication system |
JP2002169597A (ja) * | 2000-09-05 | 2002-06-14 | Victor Co Of Japan Ltd | 音声信号処理装置、音声信号処理方法、音声信号処理のプログラム、及び、そのプログラムを記録した記録媒体 |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
CN1235192C (zh) * | 2001-06-28 | 2006-01-04 | 皇家菲利浦电子有限公司 | 传输系统以及用于接收窄带音频信号的接收机和方法 |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
EP1543307B1 (en) * | 2002-09-19 | 2006-02-22 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and method |
JP2004198485A (ja) * | 2002-12-16 | 2004-07-15 | Victor Co Of Japan Ltd | 音響符号化信号復号化装置及び音響符号化信号復号化プログラム |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
EP1638083B1 (en) * | 2004-09-17 | 2009-04-22 | Harman Becker Automotive Systems GmbH | Bandwidth extension of bandlimited audio signals |
JP4977471B2 (ja) * | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | 符号化装置及び符号化方法 |
JP4977472B2 (ja) * | 2004-11-05 | 2012-07-18 | パナソニック株式会社 | スケーラブル復号化装置 |
WO2006062202A1 (ja) * | 2004-12-10 | 2006-06-15 | Matsushita Electric Industrial Co., Ltd. | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
US20090319277A1 (en) * | 2005-03-30 | 2009-12-24 | Nokia Corporation | Source Coding and/or Decoding |
JP5129117B2 (ja) * | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 音声信号の高帯域部分を符号化及び復号する方法及び装置 |
JP3770901B2 (ja) * | 2005-06-22 | 2006-04-26 | 三菱電機株式会社 | 広帯域音声復元方法及び広帯域音声復元装置 |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
KR100813259B1 (ko) * | 2005-07-13 | 2008-03-13 | 삼성전자주식회사 | 입력신호의 계층적 부호화/복호화 장치 및 방법 |
US8396717B2 (en) * | 2005-09-30 | 2013-03-12 | Panasonic Corporation | Speech encoding apparatus and speech encoding method |
JP5055759B2 (ja) * | 2005-12-16 | 2012-10-24 | 沖電気工業株式会社 | 帯域変換信号生成器及び帯域拡張装置 |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US20080300866A1 (en) * | 2006-05-31 | 2008-12-04 | Motorola, Inc. | Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8295507B2 (en) | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
US8229106B2 (en) * | 2007-01-22 | 2012-07-24 | D.S.P. Group, Ltd. | Apparatus and methods for enhancement of speech |
KR100905585B1 (ko) * | 2007-03-02 | 2009-07-02 | 삼성전자주식회사 | 음성신호의 대역폭 확장 제어 방법 및 장치 |
AU2009221443B2 (en) * | 2008-03-04 | 2012-01-12 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus for mixing a plurality of input data streams |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
JP4892021B2 (ja) * | 2009-02-26 | 2012-03-07 | 株式会社東芝 | 信号帯域拡張装置 |
JP5126145B2 (ja) * | 2009-03-30 | 2013-01-23 | 沖電気工業株式会社 | 帯域拡張装置、方法及びプログラム、並びに、電話端末 |
US8560330B2 (en) * | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
-
2008
- 2008-12-19 JP JP2010542801A patent/JP5423684B2/ja not_active Expired - Fee Related
- 2008-12-19 WO PCT/JP2008/073236 patent/WO2010070770A1/ja active Application Filing
- 2008-12-19 EP EP08878936A patent/EP2360687A4/en not_active Withdrawn
-
2011
- 2011-05-10 US US13/067,120 patent/US8781823B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0955778A (ja) * | 1995-08-15 | 1997-02-25 | Fujitsu Ltd | 音声信号の広帯域化装置 |
JPH09101798A (ja) * | 1995-10-05 | 1997-04-15 | Matsushita Electric Ind Co Ltd | 音声帯域拡大方法および音声帯域拡大装置 |
JP2007310296A (ja) * | 2006-05-22 | 2007-11-29 | Oki Electric Ind Co Ltd | 帯域拡張装置及び方法 |
JP2008139844A (ja) * | 2006-11-09 | 2008-06-19 | Sony Corp | 周波数帯域拡大装置及び周波数帯域拡大方法、再生装置及び再生方法、並びに、プログラム及び記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20110282655A1 (en) | 2011-11-17 |
EP2360687A4 (en) | 2012-07-11 |
EP2360687A1 (en) | 2011-08-24 |
WO2010070770A1 (ja) | 2010-06-24 |
JPWO2010070770A1 (ja) | 2012-05-24 |
US8781823B2 (en) | 2014-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5423684B2 (ja) | 音声帯域拡張装置及び音声帯域拡張方法 | |
EP3324408B1 (en) | Efficient combined harmonic transposition | |
JP4520732B2 (ja) | 雑音低減装置、および低減方法 | |
US8271292B2 (en) | Signal bandwidth expanding apparatus | |
JP3189614B2 (ja) | 音声帯域拡大装置 | |
JP4818335B2 (ja) | 信号帯域拡張装置 | |
US9026435B2 (en) | Method for estimating a fundamental frequency of a speech signal | |
US7406303B2 (en) | Multi-sensory speech enhancement using synthesized sensor signal | |
WO2010024371A1 (ja) | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム | |
US7957964B2 (en) | Apparatus and methods for noise suppression in sound signals | |
JP5598536B2 (ja) | 帯域拡張装置および帯域拡張方法 | |
EP0657873B1 (en) | Speech signal bandwidth compression and expansion apparatus, and bandwidth compressing speech signal transmission method, and reproducing method | |
EP1995723A1 (en) | Neuroevolution training system | |
US20140078867A1 (en) | Sound direction estimation device, sound direction estimation method, and sound direction estimation program | |
RU2648570C2 (ru) | Оценка формы коэффициента передачи для улучшенного отслеживания временных характеристик верхнего диапазона | |
CN110556123A (zh) | 频带扩展方法、装置、电子设备及计算机可读存储介质 | |
JP5148414B2 (ja) | 信号帯域拡張装置 | |
JP2019512740A (ja) | 音声スペクトログラムに基づく構造テンソルを使用して位相情報を復元することによるエンコーディング | |
JP2009223210A (ja) | 信号帯域拡張装置および信号帯域拡張方法 | |
JP2002268698A (ja) | 音声認識装置と標準パターン作成装置及び方法並びにプログラム | |
WO2010061505A1 (ja) | 発話音声検出装置 | |
JP2012208177A (ja) | 帯域拡張装置及び音声補正装置 | |
US20160189725A1 (en) | Voice Processing Method and Apparatus, and Recording Medium Therefor | |
US8588346B2 (en) | Doppler frequency estimation system and method | |
JP6065488B2 (ja) | 帯域拡張装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130628 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130806 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131003 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131029 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131111 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |