JP2012522272A - 信号ノイズ除去のための方法およびデバイス、ならびに音声周波数復号のためのシステム - Google Patents
信号ノイズ除去のための方法およびデバイス、ならびに音声周波数復号のためのシステム Download PDFInfo
- Publication number
- JP2012522272A JP2012522272A JP2012502425A JP2012502425A JP2012522272A JP 2012522272 A JP2012522272 A JP 2012522272A JP 2012502425 A JP2012502425 A JP 2012502425A JP 2012502425 A JP2012502425 A JP 2012502425A JP 2012522272 A JP2012522272 A JP 2012522272A
- Authority
- JP
- Japan
- Prior art keywords
- spectral coefficient
- adjusted
- frame
- spectral
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000003595 spectral effect Effects 0.000 claims abstract description 360
- 238000001228 spectrum Methods 0.000 claims abstract description 59
- 238000013139 quantization Methods 0.000 claims description 83
- 238000004260 weight control Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 claims description 3
- 230000001052 transient effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 2
- 239000013598 vector Substances 0.000 description 21
- 230000000875 corresponding effect Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000010354 integration Effects 0.000 description 3
- 230000001276 controlling effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000003090 exacerbative effect Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
調整されることになるスペクトル係数が存在するフレームのフレーム間相関関係の程度に従って、その調整されることになるスペクトル係数と高い相関関係を有する少なくとも2つのスペクトル係数を選択するステップと、
その調整されることになるスペクトル係数の予測値を獲得するために、それらの少なくとも2つの選択されたスペクトル係数と、その調整されることになるスペクトル係数とに重み付けを実行するステップと、
その獲得された予測値を使用することによって、復号信号のスペクトルを調整して、調整された復号信号を出力するステップとを含む信号ノイズ除去方法を提供する。
調整されることになるスペクトル係数が存在するフレームのフレーム間相関関係の程度に従って、その調整されることになるスペクトル係数と高い相関関係を有する少なくとも2つのスペクトル係数を選択するように構成された選択ユニットと、
その調整されることになるスペクトル係数の予測値を獲得するために、選択ユニットによって選択された少なくとも2つのスペクトル係数と、その調整されることになるスペクトル係数とに重み付けを実行するように構成された重み付けユニットと、
重み付けユニットによって獲得された予測値を使用することによって、復号信号のスペクトルを調整して、調整された復号信号を出力するように構成された調整および出力ユニットとを含む信号ノイズ除去装置を提供する。
コア復号器が、第1層コードストリームの低周波数情報を復号するように構成され、
BWE復号器が、第2層コードストリームのBWE情報を復号するように構成され、
逆量子化復号器が、残りのビットの第3層コードストリームの高周波数帯域情報を復号および逆量子化するように構成され、
信号ノイズ除去装置が、BWE復号器と逆量子化復号器とによって出力された復号された情報を受信して、その復号された情報内の調整されることになるスペクトル係数を決定し、その調整されることになるスペクトル係数の獲得された予測値に従って、その復号された情報内のスペクトル係数を調整するように構成された音声復号システムを提供する。
図3を参照すると、本発明の一実施形態は、信号ノイズ除去方法を提供する。この方法は、以下のステップを含む。
図4を参照すると、本発明の一実施形態は、信号ノイズ除去方法を提供する。この方法は、以下のステップを含む。
この実施形態は、調整されることになるスペクトル係数に関する重み付け予測を実行するための方法を提供し、異なる重み付けモードで適用可能なスペクトル情報を説明する。このスペクトル情報は、以下の情報を含む。
f[n]=w_inner[0]×f_inner[0]+w_inner[l]×f_inner[1]+…+w_inner[N]×f_inner[N]+w_inter[0]×f_inter[0]+w_inter[1]×f_inter[l]+…+w_inter[N]×f_inter[N] 公式1
この方法実施形態に基づいて、本発明は、信号ノイズ除去装置の一実施形態をさらに提供する。図5を参照すると、この装置は、
調整されることになるスペクトル係数が存在するフレームのフレーム間相関関係の程度に従って、調整されることになるスペクトル係数と高い相関関係を有する少なくとも2つのスペクトル係数を選択するように構成された選択ユニット51と、
調整されることになるスペクトル係数の予測値を獲得するために、選択ユニット51によって選択された少なくとも2つのスペクトル係数とその調整されることになるスペクトル係数とに重み付けを実行するように構成された重み付けユニット52と、
重み付けユニット52によって獲得された予測値を使用することによって、復号信号のスペクトルを調整して、その調整された復号信号を出力するように構成された調整および出力ユニット53とを含む。
スペクトル係数の量子化符号化精度に従って、調整されることになるスペクトル係数を決定するように構成された予測ポイント決定ユニット50であって、この決定された調整されることになるスペクトル係数が、量子化されていないスペクトル係数および/または量子化精度しきい値よりもより低い量子化精度を有するスペクトル係数を含む予測ポイント決定ユニット50をさらに含む。
調整されることになるスペクトル係数が存在するフレームのフレーム間相関関係の程度に従って、3つの重み付けモード、すなわち、高いフレーム間相関関係重み付けモード、低いフレーム間相関関係重み付けモード、および中間のフレーム間相関関係重み付けモードから1つの重み付けモードを選択するように構成された重み付けモード選択モジュール511と、
重み付けモード選択モジュール511によって選択された重み付けモードに従って、調整されることになるスペクトル係数と高い相関関係を有する少なくとも2つのスペクトル係数を決定するように構成された関連スペクトル選択モジュール512とを含む。
高いフレーム間相関関係重み付けモードの場合、以下の情報、すなわち、(1)先のフレームの予測値、(2)先のフレームの量子化されたスペクトル係数、および(3)先のフレームのBWEスペクトル係数のうちの少なくとも1つのタイプの重み付け値に従って、調整されることになるスペクトル係数の予測値を獲得するように構成された高い相関関係重み付けモジュール521、
低いフレーム間相関関係重み付けモードの場合、以下の情報、すなわち(1)現在のフレームの量子化されたスペクトル係数、(2)現在のフレームのBWEスペクトル係数、および(3)現在のフレームの既存の予測値のうちの少なくとも1つのタイプの重み付け値に従って、調整されることになるスペクトル係数の予測値を獲得するように構成された低い相関関係重み付けモジュール522、ならびに
中間のフレーム間相関関係重み付けモードの場合、以下の情報、すなわち、(1)先のフレームまたは現在のフレームの予測値、(2)先のフレームまたは現在のフレームの量子化されたスペクトル係数、および(3)先のフレームまたは現在のフレームのBWEスペクトル係数のうちの少なくとも1つのタイプの重み付け値に従って、調整されることになるスペクトル係数の予測値を獲得するように構成された中間の相関関係重み付けモジュール523のうちのいずれか1つを含む。
調整されることになるスペクトル係数の量子化精度に従って、スペクトル情報の重みを制御するように構成された重み制御ジュール520であって、スペクトル情報の量子化精度が高ければ高いほど、スペクトル情報の対応する重みが大きくなる重み制御ジュール520をさらに含む。
調整されることになるスペクトル係数のエネルギーの上限しきい値と獲得された予測値とに従って、調整されることになるスペクトル係数の修正値を生成して、その修正値を使用することによって、復号信号のスペクトルを調整するように構成された修正モジュール530であって、調整されることになるスペクトル係数の修正値のエネルギーが、調整されることになるスペクトル係数のエネルギーの上限しきい以下である修正モジュール530をさらに含む。
装置実施形態に基づいて、本発明の一実施形態は、音声復号システムを提供する。図6を参照すると、音声復号システムは、コア復号器61と、BWE復号器62と、逆量子化復号器63と、信号ノイズ除去装置60とを含む。コア復号器61は、第1層コードストリームの低周波数情報を復号するように構成される。BWE復号器62は、第2層コードストリームのBWE情報を復号するように構成される。逆量子化復号器63は、残りのビットの第3層コードストリームの高周波数帯域情報を復号および逆量子化するように構成される。
17 周波数サンプル
18 周波数サンプル
50 予測ポイント決定ユニット
51 選択ユニット
52 重み付けユニット
53 調整および出力ユニット
60 信号ノイズ除去装置
61 コア復号器
62 BWE復号器
63 逆量子化復号器
511 重み付けモード選択モジュール
512 関連スペクトル選択モジュール
520 重み制御モジュール
521 高い相関関係重み付けモジュール
522 低い相関関係重み付けモジュール
523 中間の相関関係重み付けモジュール
530 修正モジュール
Claims (16)
- 調整されることになるスペクトル係数が存在するフレームのフレーム間相関関係の程度に従って、前記調整されることになるスペクトル係数と高い相関関係を有する少なくとも2つのスペクトル係数を選択するステップと、
前記調整されることになるスペクトル係数の予測値を獲得するために、前記少なくとも2つの選択されたスペクトル係数と、前記調整されることになるスペクトル係数とに重み付けを実行するステップと、
前記獲得された予測値を使用することによって、復号信号のスペクトルを調整して、調整された復号信号を出力するステップと
を含む信号ノイズ除去方法。 - 前記調整されることになるスペクトル係数が存在する前記フレームの前記フレーム間相関関係の前記程度に従って、前記調整されることになるスペクトル係数と高い相関関係を有する少なくとも2つのスペクトル係数を前記選択するステップの前に、前記方法が、
スペクトル係数の量子化符号化精度に従って、前記調整されることになるスペクトル係数を決定するステップであって、前記決定された調整されることになるスペクトル係数が、量子化されていないスペクトル係数および/または量子化精度しきい値よりも低い量子化精度を有するスペクトル係数を含む、決定するステップを含む、請求項1に記載の方法。 - 前記調整されることになるスペクトル係数が存在する前記フレームの前記フレーム間相関関係の前記程度に従って、前記調整されることになるスペクトル係数と高い相関関係を有する少なくとも2つのスペクトル係数を前記選択するステップが、
前記調整されることになるスペクトル係数が存在する前記フレームの前記フレーム間相関関係の前記程度に従って、3つの重み付けモード、すなわち、高いフレーム間相関関係重み付けモード、低いフレーム間相関関係重み付けモード、および中間のフレーム間相関関係重み付けモードから1つの重み付けモードを選択するステップと、
前記選択された重み付けモードに従って、前記調整されることになるスペクトル係数と高い相関関係を有する前記少なくとも2つのスペクトル係数を決定するステップとを含む、請求項1に記載の方法。 - 前記調整されることになるスペクトル係数の予測値を獲得するために、前記少なくとも2つの選択されたスペクトル係数と前記調整されることになるスペクトル係数とに前記重み付けを実行するステップが、
前記高いフレーム間相関関係重み付けモードの場合、以下の情報、すなわち、先のフレームの予測値、前記先のフレームの量子化されたスペクトル係数、および前記先のフレームの帯域幅拡張(BWE)スペクトル係数のうちの少なくとも1つのタイプの重み付け値に従って、前記調整されることになるスペクトル係数の前記予測値を獲得するステップと、
前記低いフレーム間相関関係重み付けモードの場合、以下の情報、すなわち、現在のフレームの量子化されたスペクトル係数、前記現在のフレームのBWEスペクトル係数、および前記現在のフレームの既存の予測値のうちの少なくとも1つのタイプの重み付け値に従って、前記調整されることになるスペクトル係数の前記予測値を獲得するステップと、
前記中間のフレーム間相関関係重み付けモードの場合、以下の情報、すなわち、前記先のフレームまたは前記現在のフレームの前記予測値、前記先のフレームまたは前記現在のフレームの前記量子化されたスペクトル係数、および前記先のフレームまたは前記現在のフレームの前記BWEスペクトル係数のうちの少なくとも1つのタイプの重み付け値に従って、前記調整されることになるスペクトル係数の前記予測値を獲得するステップとを含む、請求項3に記載の方法。 - 前記調整されることになるスペクトル係数の予測値を獲得するために、前記少なくとも2つの選択されたスペクトル係数と前記調整されることになるスペクトル係数とに前記重み付けを実行するステップが、
前記調整されることになるスペクトル係数の量子化精度に従って、スペクトル情報の重みを制御するステップであって、前記スペクトル情報の前記量子化精度が高ければ高いほど、前記スペクトル情報の対応する重みが大きくなる、制御するステップをさらに含む、請求項4に記載の方法。 - 前記調整されることになるスペクトル係数が存在する前記フレームと前記フレームの先のフレームの両方が調和フレームである場合、前記調整されることになるスペクトル係数が存在する前記フレームが高いフレーム間相関関係を有し、
前記先のフレームに先立つフレームに対応する量子化されたスペクトル係数の振幅が前記先のフレームに対応する量子化されたスペクトル係数の振幅よりも所与の倍数大きい場合、前記調整されることになるスペクトル係数の振幅が、前記調整されることになるスペクトル係数が存在する前記フレームのBWEスペクトル係数の振幅、および前記先のフレームに対応する前記量子化されたスペクトル係数の前記振幅の加重和であり、前記調整されることになるスペクトル係数の符号が、前記調整されることになるスペクトル係数が存在する前記フレームの前記BWEスペクトル係数の符号であり、
前記先のフレームに先立つ前記フレームに対応する前記量子化されたスペクトル係数の前記振幅が前記先のフレームに対応する前記量子化されたスペクトル係数の前記振幅よりも所与の倍数大きくない場合、前記調整されることになるスペクトル係数の前記振幅が、前記先のフレームに先立つ前記フレームに対応する前記量子化されたスペクトル係数の前記振幅、前記先のフレームに対応する前記量子化されたスペクトル係数の前記振幅、および前記調整されることになるスペクトル係数が存在する前記フレームの前記BWEスペクトル係数の前記振幅の加重和であり、前記調整されることになるスペクトル係数の前記符号が、前記調整されることになるスペクトル係数が存在する前記フレームの前記BWEスペクトル係数の前記符号である、請求項1または4に記載の方法。 - 前記調整されることになるスペクトル係数が存在する前記フレームまたは前記フレームの先のフレームが過渡的なフレームである場合、前記調整されることになるスペクトル係数が存在する前記フレームが低いフレーム間相関関係を有し、
前記調整されることになるスペクトル係数の振幅が、調整されることになる周波数サンプルのBWEスペクトル係数の振幅、および隣接する周波数サンプルの量子化されたスペクトル係数の振幅の加重平均値であり、前記加重平均値が前記調整されることになるスペクトル係数の前記振幅の上限しきい値よりも大きい場合、前記調整されることになるスペクトル係数の前記振幅が前記上限しきい値に設定されるように調整され、
前記調整されることになるスペクトル係数の符号が、前記調整されることになる周波数サンプルの前記BWEスペクトル係数の符号である、請求項1または4に記載の方法。 - 前記調整されることになるスペクトル係数が存在する前記フレームと前記フレームの先のフレームの両方が調和フレームである事例、および前記調整されることになるスペクトル係数が存在する前記フレームまたは前記先のフレームが過渡的フレームである事例に属さない事例の場合、前記調整されることになるスペクトル係数が存在する前記フレームが、中間のフレーム間相関関係を有し、
前記調整されることになるスペクトル係数の振幅が、調整されることになる周波数サンプルのBWEスペクトル係数の振幅、前記調整されることになる周波数サンプルの隣接する周波数サンプルのBWEスペクトル係数の振幅、前記調整されることになる周波数サンプルを有する前記フレームの先のフレームに対応する周波数サンプルの量子化されたスペクトル係数の振幅、および前記先のフレームに対応する前記周波数サンプルの隣接する周波数サンプルの量子化されたスペクトル係数の振幅の加重平均値であり、前記加重平均値が前記調整されることになるスペクトル係数の前記振幅の上限しきい値よりも大きい場合、前記調整されることになるスペクトル係数の前記振幅が前記上限しきい値に設定され、
前記調整されることになるスペクトル係数の符号が、前記調整されることになる周波数サンプルの前記BWEスペクトル係数の符号である、請求項1または4に記載の方法。 - 前記獲得された予測値を使用することによって前記復号信号の前記スペクトルを前記調整するステップが、
前記調整されることになるスペクトル係数のエネルギーの上限しきい値と前記獲得された予測値とに従って、前記調整されることになるスペクトル係数の修正値を生成して、前記修正値を使用することによって、前記復号信号の前記スペクトルを調整するステップを含み、前記調整されることになるスペクトル係数の前記修正値のエネルギーが、前記調整されることになるスペクトル係数の前記エネルギーの前記上限しきい値以下である、請求項1に記載の方法。 - 調整されることになるスペクトル係数が存在するフレームのフレーム間相関関係の程度に従って、前記調整されることになるスペクトル係数と高い相関関係を有する少なくとも2つのスペクトル係数を選択するように構成された選択ユニットと、
前記調整されることになるスペクトル係数の予測値を獲得するために、前記選択ユニットによって選択された前記少なくとも2つのスペクトル係数と前記調整されることになるスペクトル係数とに重み付けを実行するように構成された重み付けユニットと、
前記重み付けユニットによって獲得された前記予測値を使用することによって、復号信号のスペクトルを調整して、調整された復号信号を出力するように構成された調整および出力ユニットと
を含む信号ノイズ除去装置。 - 前記スペクトル係数の量子化符号化精度に従って、前記調整されることになるスペクトル係数を決定するように構成された予測ポイント決定ユニットであって、前記決定された調整されることになるスペクトル係数が、量子化されていないスペクトル係数および/または量子化精度しきい値よりも低い量子化精度を有するスペクトル係数を含む、予測ポイント決定ユニット
をさらに含む、請求項10に記載の装置。 - 前記選択ユニットが、
前記調整されることになるスペクトル係数が存在する前記フレームの前記フレーム間相関関係の前記程度に従って、3つの重み付けモード、すなわち、高いフレーム間相関関係重み付けモード、低いフレーム間相関関係重み付けモード、および中間のフレーム間相関関係重み付けモードから1つの重み付けモードを選択するように構成された重み付けモード選択モジュールと、
前記重み付けモード選択モジュールによって選択された前記重み付けモードに従って、前記調整されることになるスペクトル係数と前記高い相関関係を有する前記少なくとも2つのスペクトル係数を決定するように構成された関連スペクトル選択モジュールとを含む、請求項10に記載の装置。 - 前記重み付けユニットが、以下のモジュール、すなわち、
前記高いフレーム間相関関係重み付けモードの場合、以下の情報、すなわち、(1)先のフレームの予測値、(2)前記先のフレームの量子化されたスペクトル係数、および(3)前記先のフレームの帯域幅拡張(BWE)スペクトル係数のうちの少なくとも1つのタイプの重み付け値に従って、前記調整されることになるスペクトル係数の前記予測値を獲得するように構成された高い相関関係重み付けモジュール、
前記低いフレーム間相関関係重み付けモードの場合、以下の情報、すなわち、(1)現在のフレームの量子化されたスペクトル係数、(2)前記現在のフレームのBWEスペクトル係数、および(3)前記現在のフレームの既存の予測値のうちの少なくとも1つのタイプの重み付け値に従って、前記調整されることになるスペクトル係数の前記予測値を獲得するように構成された低相関関係重み付けモジュール、または
前記中間のフレーム間相関関係重み付けモードの場合、以下の情報、すなわち(1)前記先のフレームまたは前記現在のフレームの前記予測値、(2)前記先のフレームまたは前記現在のフレームの前記量子化されたスペクトル係数、および(3)前記先のフレームまたは前記現在のフレームの前記BWEスペクトル係数のうちの少なくとも1つのタイプの重み付け値に従って、前記調整されることになるスペクトル係数の前記予測値を獲得するように構成された中間の相関関係重み付けモジュールのうちのいずれか1つを含む、請求項12に記載の装置。 - 前記重み付けユニットが、
前記調整されることになるスペクトル係数の量子化精度に従って、スペクトル情報の重みを制御するように構成された重み制御モジュールであって、前記スペクトル情報の前記量子化精度が高ければ高いほど、前記スペクトル情報の対応する重みが大きくなる、重み制御モジュールをさらに含む、請求項13に記載の装置。 - 前記調整および出力ユニットが、
前記調整されることになるスペクトル係数のエネルギーの上限しきい値と前記獲得された予測値とに従って、前記調整されることになるスペクトル係数の修正値を生成して、前記修正値を使用することによって、前記復号信号の前記スペクトルを調整するように構成された修正モジュールであって、前記調整されることになるスペクトル係数の前記修正値のエネルギーが、前記調整されることになるスペクトル係数の前記エネルギーの前記上限しきい値以下である修正モジュールを含む、請求項10に記載の装置。 - コア復号器と、帯域幅拡張(BWE)復号器と、逆量子化復号器と、請求項10から15のいずれか一項に記載の信号ノイズ除去装置とを含む音声復号システムであって、
前記コア復号器が、第1層コードストリームの低周波数情報を復号するように構成され、
前記BWE復号器が、第2層コードストリームのBWE情報を復号するように構成され、
前記逆量子化復号器が、残りのビットの第3層コードストリームの高周波数帯域情報を復号および逆量子化するように構成され、
前記信号ノイズ除去装置が、前記BWE復号器と前記逆量子化復号器とによって出力された前記復号された情報を受信し、前記復号された情報内の調整されることになるスペクトル係数を決定し、前記調整されることになるスペクトル係数の獲得された予測値に従って、前記復号された情報内のスペクトル係数を調整するように構成される音声復号システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910133808 | 2009-03-31 | ||
CN200910133808.6 | 2009-03-31 | ||
PCT/CN2009/076155 WO2010111876A1 (zh) | 2009-03-31 | 2009-12-28 | 一种信号去噪的方法和装置及音频解码系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012522272A true JP2012522272A (ja) | 2012-09-20 |
JP5459688B2 JP5459688B2 (ja) | 2014-04-02 |
Family
ID=42827479
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012502425A Active JP5459688B2 (ja) | 2009-03-31 | 2009-12-28 | 復号信号のスペクトルを調整する方法、装置、および音声復号システム |
Country Status (5)
Country | Link |
---|---|
US (1) | US8965758B2 (ja) |
EP (2) | EP2555191A1 (ja) |
JP (1) | JP5459688B2 (ja) |
KR (2) | KR101390433B1 (ja) |
WO (1) | WO2010111876A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
EP2720222A1 (en) | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
US9602841B2 (en) * | 2012-10-30 | 2017-03-21 | Texas Instruments Incorporated | System and method for decoding scalable video coding |
CN105976824B (zh) * | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
CN106463143B (zh) * | 2014-03-03 | 2020-03-13 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
SG11201609834TA (en) | 2014-03-24 | 2016-12-29 | Samsung Electronics Co Ltd | High-band encoding method and device, and high-band decoding method and device |
EP2980792A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
KR20200107125A (ko) * | 2019-03-06 | 2020-09-16 | 삼성전자주식회사 | 간소화된 상관을 위한 전자 장치, 방법, 및 컴퓨터 판독가능 매체 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09261065A (ja) * | 1996-03-25 | 1997-10-03 | Mitsubishi Electric Corp | 量子化装置及び逆量子化装置及び量子化逆量子化システム |
JPH1049200A (ja) * | 1996-08-08 | 1998-02-20 | Fujitsu Ltd | 音声情報圧縮蓄積方法及び装置 |
JP2004206129A (ja) * | 2002-12-23 | 2004-07-22 | Samsung Electronics Co Ltd | 時間−周波数相関性を利用した改善されたオーディオ符号化及び/または復号化方法とその装置 |
WO2006062202A1 (ja) * | 2004-12-10 | 2006-06-15 | Matsushita Electric Industrial Co., Ltd. | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6014544A (ja) | 1983-07-05 | 1985-01-25 | Omron Tateisi Electronics Co | スペクトラム拡散通信の受信回路 |
US5237587A (en) | 1992-11-20 | 1993-08-17 | Magnavox Electronic Systems Company | Pseudo-noise modem and related digital correlation method |
JPH1020011A (ja) | 1996-07-02 | 1998-01-23 | Oki Electric Ind Co Ltd | 方位分析方法及び装置 |
DE69712537T2 (de) | 1996-11-07 | 2002-08-29 | Matsushita Electric Industrial Co., Ltd. | Verfahren zur Erzeugung eines Vektorquantisierungs-Codebuchs |
US5940435A (en) | 1996-11-21 | 1999-08-17 | Dsp Group, Inc. | Method for compensating filtering delays in a spread-spectrum receiver |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
FR2768546B1 (fr) * | 1997-09-18 | 2000-07-21 | Matra Communication | Procede de debruitage d'un signal de parole numerique |
US6548465B2 (en) | 2000-03-10 | 2003-04-15 | General Electric Company | Siloxane dry cleaning composition and process |
US6931373B1 (en) * | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
JP3457293B2 (ja) | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US7447631B2 (en) * | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
JP4311034B2 (ja) * | 2003-02-14 | 2009-08-12 | 沖電気工業株式会社 | 帯域復元装置及び電話機 |
JP4734859B2 (ja) * | 2004-06-28 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
BRPI0607646B1 (pt) * | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
JP4670483B2 (ja) * | 2005-05-31 | 2011-04-13 | 日本電気株式会社 | 雑音抑圧の方法及び装置 |
US8112286B2 (en) * | 2005-10-31 | 2012-02-07 | Panasonic Corporation | Stereo encoding device, and stereo signal predicting method |
FR2898209B1 (fr) * | 2006-03-01 | 2008-12-12 | Parrot Sa | Procede de debruitage d'un signal audio |
JP2008033269A (ja) * | 2006-06-26 | 2008-02-14 | Sony Corp | デジタル信号処理装置、デジタル信号処理方法およびデジタル信号の再生装置 |
JP4769673B2 (ja) * | 2006-09-20 | 2011-09-07 | 富士通株式会社 | オーディオ信号補間方法及びオーディオ信号補間装置 |
JP5294086B2 (ja) * | 2007-02-28 | 2013-09-18 | 日本電気株式会社 | 重み係数学習システム及び音声認識システム |
CN101046964B (zh) * | 2007-04-13 | 2011-09-14 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
CN101067650A (zh) * | 2007-06-08 | 2007-11-07 | 骆建华 | 基于部分频谱数据信号重构的信号去噪方法 |
JP2009047831A (ja) | 2007-08-17 | 2009-03-05 | Toshiba Corp | 特徴量抽出装置、プログラムおよび特徴量抽出方法 |
PT2186089T (pt) * | 2007-08-27 | 2019-01-10 | Ericsson Telefon Ab L M | Método e dispositivo para descodificação espetral percetual de um sinal áudio que inclui preenchimento de buracos espetrais |
-
2009
- 2009-12-28 JP JP2012502425A patent/JP5459688B2/ja active Active
- 2009-12-28 EP EP12190501A patent/EP2555191A1/en not_active Withdrawn
- 2009-12-28 EP EP09842532A patent/EP2407965B1/en active Active
- 2009-12-28 KR KR1020117024686A patent/KR101390433B1/ko active IP Right Grant
- 2009-12-28 KR KR1020137015052A patent/KR101320963B1/ko active IP Right Grant
- 2009-12-28 WO PCT/CN2009/076155 patent/WO2010111876A1/zh active Application Filing
-
2011
- 2011-09-29 US US13/248,725 patent/US8965758B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09261065A (ja) * | 1996-03-25 | 1997-10-03 | Mitsubishi Electric Corp | 量子化装置及び逆量子化装置及び量子化逆量子化システム |
JPH1049200A (ja) * | 1996-08-08 | 1998-02-20 | Fujitsu Ltd | 音声情報圧縮蓄積方法及び装置 |
JP2004206129A (ja) * | 2002-12-23 | 2004-07-22 | Samsung Electronics Co Ltd | 時間−周波数相関性を利用した改善されたオーディオ符号化及び/または復号化方法とその装置 |
WO2006062202A1 (ja) * | 2004-12-10 | 2006-06-15 | Matsushita Electric Industrial Co., Ltd. | 広帯域符号化装置、広帯域lsp予測装置、帯域スケーラブル符号化装置及び広帯域符号化方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2407965B1 (en) | 2012-12-12 |
KR20120000091A (ko) | 2012-01-03 |
KR20130086634A (ko) | 2013-08-02 |
WO2010111876A1 (zh) | 2010-10-07 |
KR101320963B1 (ko) | 2013-10-23 |
US8965758B2 (en) | 2015-02-24 |
EP2555191A1 (en) | 2013-02-06 |
EP2407965A1 (en) | 2012-01-18 |
JP5459688B2 (ja) | 2014-04-02 |
US20120022878A1 (en) | 2012-01-26 |
KR101390433B1 (ko) | 2014-04-29 |
EP2407965A4 (en) | 2012-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5459688B2 (ja) | 復号信号のスペクトルを調整する方法、装置、および音声復号システム | |
JP6937877B2 (ja) | 信号符号化及び復号化方法及び装置 | |
JP6452759B2 (ja) | 先進量子化器 | |
RU2630887C2 (ru) | Звуковые кодирующее устройство и декодирующее устройство | |
CN101853664B (zh) | 一种信号去噪的方法和装置及音频解码系统 | |
KR102380642B1 (ko) | 스테레오 신호 인코딩 방법 및 인코딩 장치 | |
ES2540051T3 (es) | Método y un decodificador para la atenuación de regiones de señal reconstruidas con baja precisión | |
CA2959450C (en) | Audio parameter quantization | |
RU2823174C2 (ru) | Усовершенствованный квантователь | |
RU2828411C2 (ru) | Звуковые кодирующее устройство и декодирующее устройство | |
AL-Rawi | ADPCM: US Patents from 2010 to 2016 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130226 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130515 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131217 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5459688 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |