JP5547081B2 - 音声復号化方法及び装置 - Google Patents
音声復号化方法及び装置 Download PDFInfo
- Publication number
- JP5547081B2 JP5547081B2 JP2010532409A JP2010532409A JP5547081B2 JP 5547081 B2 JP5547081 B2 JP 5547081B2 JP 2010532409 A JP2010532409 A JP 2010532409A JP 2010532409 A JP2010532409 A JP 2010532409A JP 5547081 B2 JP5547081 B2 JP 5547081B2
- Authority
- JP
- Japan
- Prior art keywords
- signal component
- high frequency
- frequency
- frequency signal
- switching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 123
- 238000007493 shaping process Methods 0.000 claims description 48
- 230000008569 process Effects 0.000 claims description 46
- 230000005236 sound signal Effects 0.000 claims description 45
- 238000012545 processing Methods 0.000 claims description 35
- 230000032683 aging Effects 0.000 claims description 29
- 230000015572 biosynthetic process Effects 0.000 claims description 29
- 238000003786 synthesis reaction Methods 0.000 claims description 29
- 230000003595 spectral effect Effects 0.000 claims description 14
- 230000008859 change Effects 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 10
- 238000001228 spectrum Methods 0.000 claims description 9
- 238000013213 extrapolation Methods 0.000 claims description 5
- 230000036962 time dependent Effects 0.000 claims description 2
- 108010001267 Protein Subunits Proteins 0.000 claims 2
- 102000002067 Protein Subunits Human genes 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 description 24
- 230000007704 transition Effects 0.000 description 22
- 239000010410 layer Substances 0.000 description 18
- 239000012792 core layer Substances 0.000 description 15
- 238000010586 diagram Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
との間の差信号dLB(n)は、知覚重み付けフィルタ(WLB(z))を通過し、信号dw LB(n)が取得される。信号dw LB(n)は、周波数領域への変形離散コサイン変換(MDCT)を受ける。重み付けフィルタWLB(z)は、フィルタの出力信号dw LB(n)と、高域サブバンド入力信号SHB(n)との間のスペクトル連続性を維持するための、利得補償を含む。重み付けされた差信号は、周波数領域に変換される。
を取得し、ポストフィルタリングを実行して
を取得し、この信号は、ハイパスフィルタを通過して、QMFフィルタバンクに到達する。0に設定された高域信号成分を有する、16kHz広帯域信号が合成される。
を復号化する。MDCT変換が、
に対して実行され、高域サブバンド成分スペクトル内の3000Hzよりも高い周波数成分(16kHzサンプリングレートにおける7000Hzよりも高い周波数成分に対応)が0に設定され、次に、逆MDCT変換が実行される。重ね合わせ及びスペクトル反転の後、処理された高域成分が、CELP復号器によって復号化された低域成分
と、QMFフィルタバンク内で合成されて、16kHzのサンプリングレートを有する広帯域信号が取得される。
受信された符号ストリームに対応する音声信号の低域信号成分を、音声信号が第1の帯域幅から、第1の帯域幅よりも狭い第2の帯域幅に切り換わった場合に取得し、
低域信号成分を拡張して高域情報を取得し、
拡張を介して取得された高域情報に対して経時変化フェードアウト処理を実行して、処理された高域信号成分を取得し、
処理された高域信号成分と、取得された低域信号成分とを合成することを含む。
を取得する。
(1)
は、フロア演算を表す。式(1)に従って、切り換えの前のM個のバッファリングされた発話フレームの高域符号化パラメータが、切り換えの後のN個の発話フレームの高域符号化パラメータを推定するために使用されてもよい。切り換えの後のN個の発話フレームの高域信号成分は、TDBWE又はTDAC復号化アルゴリズムを使用して復元されてもよい。実際の適用例の要求に応じて、Mは、N未満の任意の値であってもよい。
(2)
ただし、n=0,...,L−1であり、k=0,...,N−1であり、Lは、フレームの長さを表す。
に対して、経時変化フィルタリングを使用することによって実行されて、周波数領域整形された高域信号成分
が取得されてもよい。
が、経時変化フィルタを通過し、これにより、高域信号成分の周波数帯域が、時間の経過と共に徐々に狭くなる。この実施形態で使用される経時変化フィルタは、−1に固定された零点と、常に変化する極点とを有する、経時変化2次バターワースフィルタである。図6は、経時変化2次バターワースフィルタの極点の変化を示す。経時変化フィルタの極点は、時計回りに移動する。言い換えると、フィルタの通過帯域は、0に達するまで減少する。
rel(k)=rel(i)×(N−k)/N+rel(m)×k/N
img(k)=img(i)×(N−k)/N+img(m)×k/N
H(z)=(1+2z−1+z−2)/(1−2rel(k)z−1+[rel2(k)+img2(k)]z−2)
fad_out_count=min(fad_out_count+1,FAD_OUT_COUNT_MAX)
ただし、FAD_OUT_COUNT_MAXは、移行フェーズ中の連続したサンプルの数である。
は、経時変化フィルタの入力信号であり、
は、経時変化フィルタの出力信号である。
上式で、gain_filterは、フィルタ利得であり、その演算式は、次の通りである。
gain_filter=(1−a1−a2)/4
と、処理された高域信号成分
(ステップS406が実行されない場合は、高域信号成分
)とに対して、合成フィルタリングを実行するために、QMFフィルタバンクが使用されてもよい。このようにして、広帯域から狭帯域への滑らかな移行という特性を満たす、経時変化フェードアウト信号が復元されてもよい。
と、復元された低域信号成分
とが、合成フィルタリングのためにQMFフィルタバンクに一緒に入力されて、フル帯域の復元された信号が取得される。復号化中に広帯域から狭帯域への頻繁な切り換えがある場合でも、本発明に従って処理された、復元された信号は、比較的良好な聴取品質を人間に提供することが可能である。
で表される(j=0,・・・,J−1、Jは分割されたサブバンドの数であり、例えば、G.729.1によるTDBWEアルゴリズムにおける周波数領域エンベロープについては、J=12であり、MDCT領域内の高域エンベロープについては、J=18である)。各サブバンドは、経時変化フェードアウト利得係数gain(k,j)によって重み付けされ、すなわち、
とされる。このようにして、周波数領域内の経時変化フェードアウトスペクトルエンベロープが取得されてもよい。gain(k,j)を計算するための式は、次の通りである。
gain(k,j)=max(0,(J−j)×N−J×k)/(J×N), k=1,...,N;j=0,...,J−1
が取得されてもよい。
を取得する。
Pk=(k/(N−1))Psid_past+(1−k/(N−1))Psid_p_past
(3)
が取得されてもよい。
が、経時変化フィルタを通過し、これにより、高域信号成分の周波数帯域が、時間の経過と共に徐々に狭くなる。図6は、フィルタの極点の変化を示す。復号器が、広帯域コアレイヤを含むSIDフレームを受信するたびに、広帯域−狭帯域切り換えフラグfad_out_flagが0に設定され、フィルタ点のカウンタfad_out_flagが0に設定される。特定の瞬間から開始して、復号器が、広帯域コアレイヤを含まないSIDフレームを受信した場合、狭帯域−広帯域切り換えフラグfad_out_flagが1に設定される。そして、経時変化フィルタが、復元された高域信号成分をフィルタリングするために有効にされる。フィルタの点の数fad_out_countが、fad_out_count<FAD_OUT_COUNT_MAXという条件を満たす場合、経時変化フィルタリングは継続的に実行される。それ以外の場合、経時変化フィルタの処理は停止される。ここで、FAD_OUT_COUNT_MAX=N×Lは、移行の数である(例えば、FAD_OUT_COUNT_MAX=8000)。
rel(k)=rel(i)×(N−k)/N+rel(m)×k/N
img(k)=img(i)×(N−k)/N+img(m)×k/N
H(z)=(1+2z−1+z−2)/(1−2rel(k)z−1+[rel2(k)+img2(k)]z−2)
fad_out_count=min(fad_out_count+1,FAD_OUT_COUNT_MAX)、ここで、FAD_OUT_COUNT_MAXは、移行フェーズ中の連続したサンプルの数である。
は、経時変化フィルタの入力信号であり、
は、経時変化フィルタの出力信号である。
上式で、gain_filterは、フィルタ利得であり、その演算式は、次の通りである。
gain_filter=(1−a1−a2)/4
と、整形された高域信号成分
(ステップS806が実行されない場合は、高域信号成分
)とに対して、合成フィルタリングを実行するために、QMFフィルタバンクが使用されてもよい。このようにして、広帯域から狭帯域への滑らかな移行という特性を満たす、経時変化フェードアウト信号が復元されてもよい。
(j=0,...,J、Jは分割されたサブバンドの数)は、拡張を介して取得された高域信号成分から、TDBWEアルゴリズムを使用することによって抽出されてもよい。各サブバンドの周波数領域エンベロープは、経時変化フェードアウト利得係数gain(k,j)を使用することによって重み付けされ、すなわち、
とされる。このようにして、経時変化フェードアウトスペクトルエンベロープが周波数領域内で取得されてもよい。gain(k,j)を計算するための式は、次の通りである。
gain(k,j)=max(0,(J−j)×N−J×k)/(J×N),
k=1,...,N;j=0,...,J−1
を取得する。
(j=0,...,J−1、J=12)が復元されてもよい。
とされる。このようにして、経時変化フェードアウトスペクトルエンベロープが周波数領域内で取得されてもよい。gain(k,j)を計算するための式は、次の通りである。
gain(k,j)=max(0,(J−j)×N−J×k)/(J×N),
k=1,...,N;j=0,...,J−1
を取得する。
(j=0,...,J−1、J=12)が高域成分をJ個のサブバンドに分割するものである。各サブバンドは、経時変化フェードアウト利得係数gain(k,j)を使用して重み付けされ、言い換えると、
とされる。このようにして、経時変化フェードアウトスペクトルエンベロープが周波数領域内で取得されてもよい。gain(k,j)を計算するための式は、次の通りである。
gain(k,j)=max(0,(J−j)×N−J×k)/(J×N),
k=1,...,N;j=0,...,J−1
のみが復元される。TDAC符号化アルゴリズムはTDBWE符号化のエンハンスメントにすぎない。TDBWE周波数領域エンベロープがあれば、高域信号成分を回復するのに十分である。言い換えると、この実施形態の解決法が有効にされた場合(すなわち、切り換えの後のCOUNTfad_outフレーム以内)、発話フレームは、経時変化フェードアウト動作全体が完了するまで、14kb/sという減少させられたレートで復号化される。切り換えの後のk番目のフレーム(k=1,...,COUNTfad_out−1)のための、復元される高域符号化パラメータは、周波数領域エンベロープ
(j=0,...,J−1)が高域成分をJ個のサブバンドに分割するようなものである。
は、高域信号を、周波数領域内でJ個のサブバンドに分割する。広帯域−狭帯域切り換えフラグfad_out_flagが1であり、かつ、移行フレームカウンタfad_out_frame_countが、fad_out_frame_count<COUNTfad_outという条件を満たす場合、経時変化フェードアウト処理が、切り換えの後のk番目のフレームのために復元された周波数領域エンベロープに対して、式(4)又は(5)又は(6)を使用して実行される。
(4)
(5)
(6)
上式で、
は、x以下の最大の整数を表す。TDBWE復号化アルゴリズムが、処理されたTDBWE周波数領域エンベロープに対して使用されて、経時変化フェードアウト高域信号成分が取得されてもよい。LOW_LEVELは、量子化テーブル内の、周波数領域エンベロープのための可能な最小の値である。例えば、周波数領域エンベロープ
(j=0,...,3)は、マルチレベル量子化技術を使用し、レベル1量子化コードブックは、次の通りである。
であり、ここで、l1(j)は、レベル1量子化ベクトルであり、l2(j)は、レベル2量子化ベクトルである。この実施形態では、
の最小値は、−3.0000+(−12.95541)=−15.95541である。更に、実際の配備では、最小値は、十分に小さな値の選択肢に簡略化されてもよい。
を決定するための上記の方法は、本発明の好ましい実施形態であることに留意されたい。実際の配備では、値は、簡略化されるか、又は、特定の技術的要求に応じた技術的要件を満たす他の値に置き換えられてもよい。それらの変更も本発明の範囲に入る。
Claims (9)
- 復号化装置によって行われる音声信号復号化方法であって、
受信された符号ストリーム内の音声信号の低域信号成分を、前記音声信号が第1の帯域幅から、前記第1の帯域幅よりも狭い第2の帯域幅に切り換わった場合に取得し、
前記低域信号成分を拡張して高域情報を取得し、
拡張を介して取得された前記高域情報に対して経時変化フェードアウト処理を実行して、前記音声信号の処理された高域信号成分を取得し、
前記処理された高域信号成分と、前記取得された低域信号成分とを合成すること
を含み、
前記高域情報に対して経時変化フェードアウト処理を実行することは、
前記高域情報に対してハイブリッド経時変化フェードアウト処理を実行すること
を含み、
前記高域情報に対してハイブリッド経時変化フェードアウト処理を実行することは、
前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、そして、高域信号成分を復号化を介して取得すること、又は、
前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、そして、高域信号成分を復号化を介して取得すること
を更に含む、音声信号復号化方法。 - 前記音声信号の前記低域信号成分を取得する前に、前記方法は、
前記受信された符号ストリームのフレーム構成を判定し、
前記第1の帯域幅から前記第2の帯域幅への前記切り換えが発生したかどうかを、前記フレーム構成に従って検知すること
を更に含む、請求項1に記載の音声信号復号化方法。 - 前記低域信号成分を拡張して高域情報を取得することは、
前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域復号化パラメータである高域情報を取得し、又は、
前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域信号成分である高域情報を取得し、又は、
前記切り換えの後の現在の音声フレームから復号化された低域信号成分を拡張して、高域信号成分を取得すること
を更に含む、請求項1に記載の音声信号復号化方法。 - 前記低域信号成分を、前記切り換えの前に受信された前記高域信号成分のための前記符号化パラメータを使用することによって拡張して、高域情報を取得することは、
前記切り換えの前に受信された音声フレームの高域符号化パラメータをバッファリングし、
現在の音声フレームの高域符号化パラメータを、前記切り換えの後の外挿を使用することによって推定すること
を含む、請求項3に記載の音声信号復号化方法。 - 前記低域信号成分を、前記切り換えの前に受信された前記高域信号成分のための前記符号化パラメータを使用することによって拡張して、高域情報を取得することは、
前記切り換えの前に受信された音声フレームの高域符号化パラメータをバッファリングし、
現在の音声フレームの高域符号化パラメータを、前記切り換えの後の外挿を使用することによって推定し、
外挿を使用して推定された前記高域符号化パラメータを、対応する広帯域復号化アルゴリズムを使用して拡張して、高域信号成分を取得すること
を含む、請求項3に記載の音声信号復号化方法。 - 取得ユニットと、拡張ユニットと、経時変化フェードアウト処理ユニットと、合成ユニットとを備え、
前記取得ユニットは、受信された符号ストリーム内の音声信号の低域信号成分を、前記音声信号が第1の帯域幅から、前記第1の帯域幅よりも狭い第2の帯域幅に切り換わった場合に取得し、前記低域信号成分を前記拡張ユニットに送信するように構成され、
前記拡張ユニットは、前記低域信号成分を拡張して高域情報を取得し、拡張を介して取得された前記高域情報を前記経時変化フェードアウト処理ユニットに送信するように構成され、
前記経時変化フェードアウト処理ユニットは、拡張を介して取得された前記高域情報に対して経時変化フェードアウト処理を実行して、前記音声信号の処理された高域信号成分を取得し、前記処理された高域信号成分を前記合成ユニットに送信するように構成され、
前記合成ユニットは、受信された、前記処理された高域信号成分と、前記取得ユニットによって取得された前記低域信号成分とを合成するように構成され、
前記経時変化フェードアウト処理ユニットは、ハイブリッド処理サブユニットを更に備え、
前記ハイブリッド処理サブユニットは、
拡張を介して取得された前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、そして、高域信号成分を復号化を介して取得するか、又は、
拡張を介して取得された前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、各サブバンドのための符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、そして、高域信号成分を復号化を介して取得し、高域信号成分を前記合成ユニットに送信するように構成された、音声信号復号化装置。 - 処理ユニットと、検知ユニットとを更に備え、
前記処理ユニットは、前記受信された符号ストリームのフレーム構成を判定し、前記符号ストリームの前記フレーム構成を前記検知ユニットに送信するように構成され、
前記検知ユニットは、前記処理ユニットから送信された、前記符号ストリームの前記フレーム構成に従って、前記第1の帯域幅から前記第2の帯域幅への前記切り換えが発生したかどうかを検知し、前記第1の帯域幅から前記第2の帯域幅への前記切り換えが発生した場合に、前記符号ストリームを前記取得ユニットに送信するように構成された、請求項6に記載の音声信号復号化装置。 - 前記拡張ユニットは、第1の拡張サブユニット、第2の拡張サブユニット、及び第3の拡張サブユニットのうちの少なくとも1つを更に備え、
前記第1の拡張サブユニットは、前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域符号化パラメータを取得するように構成され、
前記第2の拡張サブユニットは、前記低域信号成分を、前記切り換えの前に受信された高域信号成分のための符号化パラメータを使用することによって拡張して、高域信号成分を取得するように構成され、
前記第3の拡張サブユニットは、前記切り換えの後の現在の音声フレームから復号化された低域信号成分を拡張して、高域信号成分を取得するように構成された、請求項6に記載の音声信号復号化装置。 - 前記ハイブリッド処理サブユニットは、第5のサブユニット、及び第6のサブユニットのうちの少なくとも1つを更に備え、
前記第5のサブユニットは、
拡張を介して取得された前記高域情報が高域符号化パラメータである場合に、拡張を介して取得された前記高域符号化パラメータに対して、周波数領域整形を、周波数領域高域パラメータ経時変化重み付け法を使用することによって実行して、経時変化フェードアウトスペクトルエンベロープを取得し、
高域信号成分を復号化を介して取得し、
処理された高域信号成分を前記合成ユニットに送信するように構成され、
前記第6のサブユニットは、
拡張を介して取得された前記高域情報が高域信号成分である場合に、拡張を介して取得された前記高域信号成分をサブバンドに分割し、
各サブバンドのための前記符号化パラメータに対して、周波数領域高域パラメータ経時変化重み付けを実行して、経時変化フェードアウトスペクトルエンベロープを取得し、
高域信号成分を復号化を介して取得し、
処理された高域信号成分を前記合成ユニットに送信するように構成された、請求項6に記載の音声信号復号化装置。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710166745.5 | 2007-11-02 | ||
CN200710166745 | 2007-11-02 | ||
CN200710187437 | 2007-11-23 | ||
CN200710187437.0 | 2007-11-23 | ||
CN200810084725A CN100585699C (zh) | 2007-11-02 | 2008-03-14 | 一种音频解码的方法和装置 |
CN200810084725.8 | 2008-03-14 | ||
PCT/CN2008/072756 WO2009056027A1 (fr) | 2007-11-02 | 2008-10-20 | Procédé et dispositif de décodage audio |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013141872A Division JP2013235284A (ja) | 2007-11-02 | 2013-07-05 | 音声復号化方法及び装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011502287A JP2011502287A (ja) | 2011-01-20 |
JP5547081B2 true JP5547081B2 (ja) | 2014-07-09 |
Family
ID=40590539
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010532409A Active JP5547081B2 (ja) | 2007-11-02 | 2008-10-20 | 音声復号化方法及び装置 |
JP2013141872A Pending JP2013235284A (ja) | 2007-11-02 | 2013-07-05 | 音声復号化方法及び装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013141872A Pending JP2013235284A (ja) | 2007-11-02 | 2013-07-05 | 音声復号化方法及び装置 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8473301B2 (ja) |
EP (2) | EP2207166B1 (ja) |
JP (2) | JP5547081B2 (ja) |
KR (1) | KR101290622B1 (ja) |
BR (1) | BRPI0818927A2 (ja) |
RU (1) | RU2449386C2 (ja) |
WO (1) | WO2009056027A1 (ja) |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
DE102008009720A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
KR101423737B1 (ko) * | 2010-01-21 | 2014-07-24 | 한국전자통신연구원 | 오디오 신호의 디코딩 방법 및 장치 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN101964189B (zh) * | 2010-04-28 | 2012-08-08 | 华为技术有限公司 | 语音频信号切换方法及装置 |
US8000968B1 (en) | 2011-04-26 | 2011-08-16 | Huawei Technologies Co., Ltd. | Method and apparatus for switching speech or audio signals |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US8762158B2 (en) * | 2010-08-06 | 2014-06-24 | Samsung Electronics Co., Ltd. | Decoding method and decoding apparatus therefor |
CN102404072B (zh) | 2010-09-08 | 2013-03-20 | 华为技术有限公司 | 一种信息比特发送方法、装置和系统 |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
CN103187065B (zh) | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
CN103295578B (zh) | 2012-03-01 | 2016-05-18 | 华为技术有限公司 | 一种语音频信号处理方法和装置 |
CN103516440B (zh) * | 2012-06-29 | 2015-07-08 | 华为技术有限公司 | 语音频信号处理方法和编码装置 |
KR101757347B1 (ko) | 2013-01-29 | 2017-07-26 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. | 지각적 변환 오디오 코딩에서의 노이즈 채움 |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
PL3011557T3 (pl) | 2013-06-21 | 2017-10-31 | Fraunhofer Ges Forschung | Urządzenie i sposób do udoskonalonego stopniowego zmniejszania sygnału w przełączanych układach kodowania sygnału audio podczas ukrywania błędów |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US9418671B2 (en) * | 2013-08-15 | 2016-08-16 | Huawei Technologies Co., Ltd. | Adaptive high-pass post-filter |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
US9293143B2 (en) | 2013-12-11 | 2016-03-22 | Qualcomm Incorporated | Bandwidth extension mode selection |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
CN104753653B (zh) * | 2013-12-31 | 2019-07-12 | 中兴通讯股份有限公司 | 一种解速率匹配的方法、装置和接收侧设备 |
KR101864122B1 (ko) * | 2014-02-20 | 2018-06-05 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 제어 방법 |
JP6035270B2 (ja) * | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
JP2016038513A (ja) * | 2014-08-08 | 2016-03-22 | 富士通株式会社 | 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
EP3340664A1 (en) | 2015-09-15 | 2018-06-27 | Huawei Technologies Co., Ltd. | Method and network device for establishing a wireless bearer |
WO2018109143A1 (en) * | 2016-12-16 | 2018-06-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods, encoder and decoder for handling envelope representation coefficients |
US10354667B2 (en) | 2017-03-22 | 2019-07-16 | Immersion Networks, Inc. | System and method for processing audio data |
CN110710181B (zh) | 2017-05-18 | 2022-09-23 | 弗劳恩霍夫应用研究促进协会 | 管理网络设备 |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08278800A (ja) * | 1995-04-05 | 1996-10-22 | Fujitsu Ltd | 音声通信システム |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP4132154B2 (ja) * | 1997-10-23 | 2008-08-13 | ソニー株式会社 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
JP4099879B2 (ja) * | 1998-10-26 | 2008-06-11 | ソニー株式会社 | 帯域幅拡張方法及び装置 |
GB2357682B (en) * | 1999-12-23 | 2004-09-08 | Motorola Ltd | Audio circuit and method for wideband to narrowband transition in a communication device |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
FI115329B (fi) | 2000-05-08 | 2005-04-15 | Nokia Corp | Menetelmä ja järjestely lähdesignaalin kaistanleveyden vaihtamiseksi tietoliikenneyhteydessä, jossa on valmiudet useisiin kaistanleveyksiin |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
US7113522B2 (en) | 2001-01-24 | 2006-09-26 | Qualcomm, Incorporated | Enhanced conversion of wideband signals to narrowband signals |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
MXPA03002115A (es) * | 2001-07-13 | 2003-08-26 | Matsushita Electric Ind Co Ltd | DISPOSITIVO DE DECODIFICACION Y CODIFICACION DE SEnAL DE AUDIO. |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US6988066B2 (en) * | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
CA2430923C (en) * | 2001-11-14 | 2012-01-03 | Matsushita Electric Industrial Co., Ltd. | Encoding device, decoding device, and system thereof |
FR2849727B1 (fr) * | 2003-01-08 | 2005-03-18 | France Telecom | Procede de codage et de decodage audio a debit variable |
FI119533B (fi) * | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
ATE429698T1 (de) * | 2004-09-17 | 2009-05-15 | Harman Becker Automotive Sys | Bandbreitenerweiterung von bandbegrenzten tonsignalen |
CN100592389C (zh) * | 2008-01-18 | 2010-02-24 | 华为技术有限公司 | 合成滤波器状态更新方法及装置 |
JP4821131B2 (ja) * | 2005-02-22 | 2011-11-24 | 沖電気工業株式会社 | 音声帯域拡張装置 |
BRPI0607646B1 (pt) * | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
JP4604864B2 (ja) * | 2005-06-14 | 2011-01-05 | 沖電気工業株式会社 | 帯域拡張装置及び不足帯域信号生成器 |
US8150684B2 (en) * | 2005-06-29 | 2012-04-03 | Panasonic Corporation | Scalable decoder preventing signal degradation and lost data interpolation method |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
ATE490454T1 (de) * | 2005-07-22 | 2010-12-15 | France Telecom | Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate |
US7734462B2 (en) * | 2005-09-02 | 2010-06-08 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
EP1772855B1 (en) * | 2005-10-07 | 2013-09-18 | Nuance Communications, Inc. | Method for extending the spectral bandwidth of a speech signal |
US7546237B2 (en) * | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
JP2007271916A (ja) * | 2006-03-31 | 2007-10-18 | Yamaha Corp | 音声データ圧縮装置および伸張装置 |
JP2007310298A (ja) * | 2006-05-22 | 2007-11-29 | Oki Electric Ind Co Ltd | 帯域外信号生成装置及び周波数帯域拡張装置 |
CN2927247Y (zh) * | 2006-07-11 | 2007-07-25 | 中兴通讯股份有限公司 | 语音解码器 |
KR101379263B1 (ko) * | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
KR101377702B1 (ko) * | 2008-12-11 | 2014-03-25 | 한국전자통신연구원 | 가변 대역 코덱 및 그 제어 방법 |
-
2008
- 2008-10-20 EP EP08845741.1A patent/EP2207166B1/en active Active
- 2008-10-20 RU RU2010122326/08A patent/RU2449386C2/ru active
- 2008-10-20 EP EP13168293.2A patent/EP2629293A3/en not_active Withdrawn
- 2008-10-20 KR KR1020107011060A patent/KR101290622B1/ko active IP Right Grant
- 2008-10-20 JP JP2010532409A patent/JP5547081B2/ja active Active
- 2008-10-20 BR BRPI0818927-7A patent/BRPI0818927A2/pt not_active IP Right Cessation
- 2008-10-20 WO PCT/CN2008/072756 patent/WO2009056027A1/zh active Application Filing
-
2010
- 2010-05-01 US US12/772,197 patent/US8473301B2/en active Active
-
2013
- 2013-07-05 JP JP2013141872A patent/JP2013235284A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20100228557A1 (en) | 2010-09-09 |
EP2207166A4 (en) | 2010-11-24 |
JP2011502287A (ja) | 2011-01-20 |
JP2013235284A (ja) | 2013-11-21 |
EP2207166B1 (en) | 2013-06-19 |
BRPI0818927A2 (pt) | 2015-06-16 |
KR20100085991A (ko) | 2010-07-29 |
EP2629293A2 (en) | 2013-08-21 |
RU2449386C2 (ru) | 2012-04-27 |
US8473301B2 (en) | 2013-06-25 |
EP2629293A3 (en) | 2014-01-08 |
WO2009056027A1 (fr) | 2009-05-07 |
EP2207166A1 (en) | 2010-07-14 |
RU2010122326A (ru) | 2011-12-10 |
KR101290622B1 (ko) | 2013-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5547081B2 (ja) | 音声復号化方法及び装置 | |
JP6346322B2 (ja) | フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置 | |
KR101981548B1 (ko) | 시간 도메인 여기 신호를 기초로 하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 | |
KR101940742B1 (ko) | 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법 | |
TWI606440B (zh) | 訊框錯誤隱藏裝置 | |
KR101455915B1 (ko) | 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더 | |
RU2449387C2 (ru) | Способ и устройство для обработки сигнала | |
CN100585699C (zh) | 一种音频解码的方法和装置 | |
CN109155133B (zh) | 音频帧丢失隐藏的错误隐藏单元、音频解码器及相关方法 | |
JP2021502596A (ja) | ピッチラグの選択 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120717 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20130305 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130705 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130716 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20130816 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20131127 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20131202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140514 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5547081 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |