JP2011508897A - 音声コーデックの品質向上装置およびその方法 - Google Patents

音声コーデックの品質向上装置およびその方法 Download PDF

Info

Publication number
JP2011508897A
JP2011508897A JP2010536838A JP2010536838A JP2011508897A JP 2011508897 A JP2011508897 A JP 2011508897A JP 2010536838 A JP2010536838 A JP 2010536838A JP 2010536838 A JP2010536838 A JP 2010536838A JP 2011508897 A JP2011508897 A JP 2011508897A
Authority
JP
Japan
Prior art keywords
energy
signal
codec
decoded
scaling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010536838A
Other languages
English (en)
Other versions
JP5323084B2 (ja
Inventor
ミ−スク イ
ド−ヨン キム
ビョン−ソン イ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2011508897A publication Critical patent/JP2011508897A/ja
Application granted granted Critical
Publication of JP5323084B2 publication Critical patent/JP5323084B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/34Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
    • H03G3/341Muting when no signals or only weak signals are present
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

音声コーデックの品質向上装置およびその方法が開示される。コアコーデックによってデコードされた信号の第1エネルギーを求め、低帯域音質向上モードによってデコードされた信号の第2エネルギーを求めた後、第1エネルギーがあらかじめ設定された第1しきい値よりも小さいか、または第1エネルギーが第2エネルギーにあらかじめ設定された第2しきい値を乗算した値よりも小さい場合、デコードされた信号の大きさをスケーリングすることにより無音区間の量子化誤差を減少させる。

Description

本発明は、音声コーデックに関し、詳細には音声コーディング時に無音区間の量子化誤差による品質低下を減らすための装置およびその方法に関する。
音声信号を圧縮するモジュールをエンコーダ(encoder)といい、再生するモジュールをデコーダ(decoder)という。最も基本的な音声コーデックは、ITU−T G.711コーデックであって、入力信号を8kHzでサンプリングした後、8ビットで量子化する。このとき、量子化効率を上げるために数1のようにA−lawまたは数2のようにμ−law形態のログ量子化器を使用する。
Figure 2011508897
Figure 2011508897
上記のような従来におけるログ量子化器は、入力信号の大きさにより量子化の間隔が異なる。例えば、大きさが小さい信号は相対的に量子化の間隔を大きくし、発生可能性が高い大きさの信号は量子化の間隔を狭くして量子化の効率を上げる。
一般的に量子化雑音は、全周波数帯域にかけて均等に分布するものと知られている。しかし、人の聴覚的な特性によって信号の大きさが大きい区間にある量子化誤差は信号に埋もれてよく聞こえず、信号の大きさが小さい区間にある量子化誤差は雑音として聞こえる。従って、音声区間のみならず無音区間を効率よくコーディングすることがコーデックの全体性能において重要な影響を及ぼす。すなわち、無音区間における量子化誤差による雑音が全体の音質に影響を与えるおそれがあるためである。
また、コーデックは、入力信号の大きさに応じて性能が異なり得る。音声コーデックの性能を評価するときは主に大きさが異なる−16、−26、−36dBoVの信号に対して性能を評価する。すなわち、コーデックが入力信号の大きさの変化により性能がどのように変化するかを評価する。
G.711やG.722のようなコーデックは、−36dBoVの入力信号に対して量子化誤差による雑音が発生するが、特に無音区間で発生する量子化誤差がコーデックの全体品質を低下させる1つの原因になる。主観的な聴取テストの結果によると、−36dBoV信号に対するMOS(Mean Opinion Score)の点数が−36dBOv信号に比べて高いことが観察される。
本発明が解決しようとする技術的な課題は、音声コーディング時に無音区間の量子化誤差による雑音を減らすことによって、人の耳に無音区間で雑音が聞こえないようにし、全体的な聴取品質を高めることができる音声コーデックの品質向上装置およびその方法を提供することにある。
前述した技術的な課題を解決するための本発明に係る音声コーデックの品質向上装置の一実施形態は、コアコーデックによってデコードされた信号の第1エネルギーを求める第1エネルギー算出部と、前記第1エネルギーがあらかじめ設定された第1しきい値よりも小さい場合、前記デコードされた信号の大きさをスケーリングするスケーリング部と、を備える。
前述した技術的な課題を解決するための本発明に係る音声コーデックの品質向上方法の一実施形態は、コアコーデックによってデコードされた信号の第1エネルギーを求めるステップと、前記第1エネルギーがあらかじめ設定された第1しきい値よりも小さい場合、前記デコードされた信号の大きさをスケーリングするステップと、を含む。
本発明によれば、無音区間の量子化誤差によって発生する雑音を減らし、音声コーデックの品質を向上させることができる。特に、コーデックの入力信号のうち、信号の大きさが小さい場合、無音区間における量子化誤差を減らすことによって聴取品質を向上させることができる。
狭帯域コーデック基盤の広帯域拡張コーデックの一実施形態を示した図である。 G.711コーデックを利用するエンコーダの入力信号およびデコーダの出力信号に対するスペクトルを示した図である。 G.711コーデックを利用するエンコーダの入力信号およびデコーダの出力信号に対するスペクトルを示した図である。 本発明に係る音声コーデックの品質向上装置の一実施形態の構成を示した図である。 本発明に係る音声コーデックの品質向上方法の一実施形態の流れを示した図である。 本発明に係る音声コーデックの品質向上方法の適用有無による、G.711コーデックを利用するデコーダの出力信号に対するスペクトルを示した図である。 本発明に係る音声コーデックの品質向上方法の適用有無による、G.711コーデックを利用するデコーダの出力信号に対するスペクトルを示した図である。
以下、添付の図面を参照して本発明に係る音声コーデックの品質向上装置およびその方法に対して詳細に説明する。
図1は、狭帯域コーデック基盤の広帯域拡張コーデックの一実施形態を示した図である。
同図に示すように、広帯域拡張コーデックは、送信側100および受信側150に区分され、送信側100は、低帯域フィルタ(low−pass filter)105、高帯域フィルタ(high−pass filter)110、 狭帯域コアコーデック(core codec)115、低帯域向上モード(low−band enhancement)120、広帯域拡張モード(wideband extension)125、およびMUX130を備え、受信側150は、DEMUX155、狭帯域コアコーデック160、低帯域向上モード165、広帯域拡張モード170、低帯域フィルタ175、および高帯域フィルタ180を備える。
送信側100に入力される広帯域入力信号は、低帯域フィルタ105および高帯域フィルタ110を介して各々低帯域信号および高帯域信号に分離され、低帯域信号は、狭帯域コアコーデック115および低帯域向上モード120を介してコーディングされ、高帯域信号は、広帯域拡張モード125を介してコーディングされる。狭帯域コアコーデック115、低帯域向上モード120および広帯域拡張モード125を介して各々コーディングされた信号はMUX130によってビットストリームとして出力される。
ここで、低帯域向上モード120は、狭帯域コアコーデック115において示していない低帯域信号をコーディングすることによって、狭帯域信号の品質を向上させる役割をする。
一般的に、低帯域向上モード120は、狭帯域コアコーデック115により動作するアルゴリズムを決定するが、大部分の時間領域において動作するアルゴリズムを使用し、広帯域拡張モードは周波数領域において動作するアルゴリズムを使用する。
受信側150のDEMUX155は、送信側100から出力されたビットストリームを受信し、各々狭帯域コアコーデック160、低帯域向上モード165、および広帯域拡張モード170に出力する。低帯域向上モード165および広帯域拡張モード170の動作の可否は、受信されたビットストリームにより決定される。
受信側150は、広帯域拡張モード170の動作の有無に応じて広帯域信号を出力することができる。出力信号の帯域幅にかかわらず、狭帯域コアコーデック160は基本的に動作する。もし、狭帯域コアコーデック160のみが動作すれば基本的な狭帯域信号を再生することができる。より優れた品質の狭帯域信号を再生するためには狭帯域コアコーデック160と共に低帯域向上モード165も動作しなければならない。また、広帯域信号を出力するためには狭帯域コアコーデック160および広帯域拡張モード170が動作しなければならない。すなわち、受信側において、広帯域出力信号を再生するためには狭帯域コアコーデック160および広帯域拡張モード170の出力信号を加えて出力する。もちろん、より優れた品質の広帯域信号を再生するためには、狭帯域コアコーデック160、低帯域向上モード165の出力信号、および広帯域拡張モード170の出力信号を加えて出力すればよい。
ITU−Tでは、図1に示された構成と類似したG.711をコアコーデックとして使用する広帯域拡張コーデックに対する標準化を進行している。すなわち、ITU−Tの推奨するG.711コーデック基盤の広帯域拡張コーデックは、狭帯域コアコーデック115、160としてG.711を使用し、図1に示された構成で表現することができる。しかし、G.711コーデックは、−36dBoV信号の場合に量子化誤差による雑音が発生する。
図2Aおよび図2Bは、G.711コーデックを利用するエンコーダの入力信号およびデコーダの出力信号に対するスペクトルを示した図である。図2Aは音声信号に対するスペクトルであり、図2Bは無音信号に対するスペクトルである。
図2Aに示すように、音声信号に対して、エンコーダの入力信号200およびデコーダの出力信号210のスペクトルはほとんど一致する。しかし、図2Bに示すように、無音信号に対してエンコーダの入力信号230およびデコーダの出力信号220のスペクトルは不一致なことが分かる。すなわち、音声区間の場合、量子化誤差が小さい一方、無音区間では量子化誤差が大きいことが分かる。かかる量子化誤差は人の耳に雑音として聞こえる。
図3は、本発明に係る音声コーデックの品質向上装置の一実施形態の構成を示した図である。
同図に示すように、本発明に係る音声コーデックの品質向上装置は、第1エネルギー算出部300、第2エネルギー算出部310、およびスケーリング部320で構成される。
第1エネルギー算出部300は、コアコーデックによってデコードされた信号のエネルギー(以下、コアコーデックのエネルギー)を求める。第1エネルギー算出部300は、フレーム単位でコアコーデックのエネルギーを求め、コアコーデックとしてG.711を使用する場合にフレームの大きさはG.711コーデックが使用される環境に応じて異なり得る。すなわち、第1エネルギー算出部300は、各サンプルに対するエネルギーを全て合算して1フレームのエネルギーを求める。
第2エネルギー算出部310は、低帯域向上モードが動作する場合、低帯域向上モードによってデコードされた信号のエネルギー(以下、向上モードのエネルギー)を求める。スケーリング部320は、コアコーデックのエネルギーが所定のしきい値THR1よりも小さい場合、コアコーデックによってデコードされた信号の大きさをスケーリングする。また、スケーリング部320は、コアコーデックのエネルギーが向上モードのエネルギーに所定のしきい値THR2を乗算した値よりも小さい場合、コアコーデックによってデコードされた信号の大きさをスケーリングする。スケーリング部320は、1よりも小さい定数(a)の分だけデコードされた信号の大きさをスケーリングすることが好ましい。また、他の例として、スケーリング部320は、現フレームのエネルギー(コアコーデックのエネルギーまたは向上モードのエネルギー)に以前フレームのエネルギー(コアコーデックのエネルギーまたは向上モードのエネルギー)を加えた値に比例する1よりも小さい利得(gain)をデコードされた信号に乗算してスケーリングすることによって、スケーリングによる急な変化を防止できる。
この場合、スケーリング部320は、以前スケーリングの大きさを考慮してスケーリングの大きさを求めることができる。すなわち、スケーリング部320は、現フレームのエネルギーおよび以前フレームのエネルギーに基づいて求めた利得の一定比率と以前スケーリングの大きさの一定比率とを加えることによって、スケーリングの大きさを求めることができる。スケーリングはサンプル単位で行なうことはいうまでもない。
スケーリング部320は、デコードされた信号のエネルギーの大部分が高帯域に存在する場合、スケーリングを行なわない場合もある。例えば、広帯域拡張モードによってデコードされた信号のエネルギーがコアコーデックのエネルギーまたは向上モードのエネルギーより、あらかじめ設定された一定の大きさ以上よりも大きい場合、スケーリング部320はスケーリングを行なわない。
スケーリングのために使用されるしきい値THR1、THR2およびスケーリングの大きさ(a)などは実験によって求めることができ、このような値は本発明の実施形態によって多様に変更されて使用され得る。
図4は、本発明に係る音声コーデックの品質向上方法の一実施形態に対する流れを示した図である。
同図に示すように、本発明に係る音声コーデックの品質向上装置(以下、装置)は、コアコーデックによってデコードされた信号のエネルギー(以下、コアコーデックのエネルギー)をフレーム単位で算出するS400。フレームの大きさは、コーデックの種類およびコーデックが適用される環境に応じて多様に決定され得る。図1に示したように、狭帯域音声コーデックを利用した広帯域拡張コーデックに本発明を適用する場合、低帯域向上モードが存在し得る。したがって、装置は低帯域向上モードが動作中であるかを確認するS410。
低帯域向上モードが動作中の場合S410、装置は低帯域向上モードによってデコードされた信号のエネルギー(以下、向上モードのエネルギー)を算出するS430。そして、装置はコアコーデックのエネルギーが向上モードのエネルギーに所定のしきい値THR1を乗算した値よりも小さいか、またはコアコーデックのエネルギーが所定のしきい値THR2よりも小さい場合S440、コアコーデックによってデコードされた信号の大きさをa(1よりも小さい定数)の分だけスケーリングするS450。
低帯域向上モードが動作中でなければS410、装置はコアコーデックのエネルギーが所定のしきい値THR2よりも小さい場合S420、デコードされた信号をスケーリングするS450。スケーリングは、現フレームのエネルギー(コアコーデックのエネルギーまたは向上モードのエネルギー)に以前フレームのエネルギー(コアコーデックのエネルギーまたは向上モードのエネルギー)を加えた値に比例する1よりも小さい利得をデコードされた信号に乗算して行なうことによって、スケーリングによる急な変化を防止できる。この場合、現フレームのエネルギーおよび以前フレームのエネルギーに基づいて求めた利得の一定比率および以前スケーリングの大きさの一定比率を加えることによって、スケーリングの大きさを求めることができる。
しきい値THR1、THR2およびスケーリングの大きさなどは、前述の説明のような実験によってあらかじめ求められた値である。
図5Aおよび図5Bは、本発明に係る音声コーデックの品質向上方法の適用の有無によるG.711コーデックを利用するデコーダの出力信号に対するスペクトルを示した図である。図5Aは音声信号に対するスペクトルであり、図5Bは無音信号に対するスペクトルである。
図5Aに示すように、音声信号に対して本発明に係る音声コーデックの品質向上方法が適用される前のデコーダ出力信号500と、本発明に係る方法が適用された場合のデコーダ出力信号510とのスペクトルは一致する。
図5Bに示すように、無音信号に対して本発明に係る音声コーデックの品質向上方法が適用される前のデコーダ出力信号520よりも、本発明に係る方法が適用された場合のデコーダ出力信号530の大きさが小さくなることが分かる。すなわち、無音区間においてデコーダの出力信号レベルが低くなり、量子化誤差が減少することが分かる。
本発明は、コンピュータで読出し可能な記録媒体にコンピュータが読出し可能なコードとして具現することも可能である。コンピュータが読出し可能な記録媒体は、コンピュータシステムによって読出し可能なデータが保存されるすべての種類の記録装置を含む。コンピュータが読出し可能な記録媒体の一例として、ROM、RAM、CD−ROM、磁気テープ、フロッピーディスク、光データの保存装置などがあり、また、キャリアウェーブ(例えばインターネットを介した伝送)による表示の形態で具現されるものも含む。また、コンピュータが読出し可能な記録媒体は、ネットワークに接続したコンピュータシステムに分散され、分散方式によりコンピュータが読出し可能なコードが保存かつ実行されることができる。
以上、本発明に係る好ましい実施形態を主に説明した。本発明が属する技術分野における通常の知識を有する者は、本発明が本発明の本質的な特性から離脱しない範囲内で変形された形態で具現され得ることを理解すべきである。したがって、開示された実施形態は限定的な観点でなく、説明的な観点で考慮すべきである。本発明の範囲は、前述した説明でなく、特許請求の範囲に示されており、それと同等な範囲内にあるすべての差異点は本発明に含まれていると解釈すべきであろう。

Claims (12)

  1. コアコーデックによってデコードされた信号の第1エネルギーを求める第1エネルギー算出部と、
    前記第1エネルギーがあらかじめ設定された第1しきい値よりも小さい場合、前記デコードされた信号の大きさをスケーリングするスケーリング部と
    を備えることを特徴とする音声コーデックの品質向上装置。
  2. 低帯域音質向上モードによってデコードされた信号の第2エネルギーを求める第2エネルギー算出部をさらに備え、
    前記スケーリング部は、前記第1エネルギーが前記第2エネルギーにあらかじめ設定された第2しきい値を乗算した値よりも小さい場合、前記コアコーデックによってデコードされた信号の大きさをスケーリングすることを特徴とする請求項1に記載の音声コーデックの品質向上装置。
  3. 前記第1エネルギー算出部は、フレーム単位で前記第1エネルギーを算出することを特徴とする請求項1に記載の音声コーデックの品質向上装置。
  4. 前記スケーリング部は、前記デコードされた信号を1よりも小さい定数でスケーリングすることを特徴とする請求項1に記載の音声コーデックの品質向上装置。
  5. 前記スケーリング部は、前記コアコーデックによってデコードされた信号の以前フレームのエネルギーと現フレームのエネルギーとの和に比例する1よりも小さい利得を前記現フレームの信号に乗算することを特徴とする請求項1に記載の音声コーデックの品質向上装置。
  6. コアコーデックによってデコードされた信号の第1エネルギーを求めるステップと、
    前記第1エネルギーがあらかじめ設定された第1しきい値よりも小さい場合、前記デコードされた信号の大きさをスケーリングするステップと
    を含むことを特徴とする音声コーデックの品質向上方法。
  7. 低帯域音質向上モードによってデコードされた信号の第2エネルギーを求めるステップと、
    前記第1エネルギーが前記第2エネルギーにあらかじめ設定された第2しきい値を乗算した値よりも小さい場合、前記コアコーデックによってデコードされた信号の大きさをスケーリングするステップと
    をさらに含むことを特徴とする請求項6に記載の音声コーデックの品質向上方法。
  8. 前記第1エネルギーは、フレーム単位で算出されることを特徴とする請求項6に記載の音声コーデックの品質向上方法。
  9. 前記スケーリングするステップは、前記デコードされた信号を1よりも小さい定数でスケーリングするステップを含むことを特徴とする請求項6に記載の音声コーデックの品質向上方法。
  10. 前記スケーリングするステップは、前記コアコーデックによってデコードされた信号の以前フレームのエネルギーと現フレームのエネルギーとの和に比例する1よりも小さい利得を前記現フレームの信号に乗算するステップを含むことを特徴とする請求項6に記載の音声コーデックの品質向上方法。
  11. コアコーデックによってデコードされた信号の第1エネルギーを求めるステップと、
    前記第1エネルギーがあらかじめ設定された第1しきい値よりも小さい場合、前記デコードされた信号の大きさをスケーリングするステップと
    を実行するためのプログラムを記録したコンピュータで読出し可能な記録媒体。
  12. 低帯域音質向上モードによってデコードされた信号の第2エネルギーを求めるステップと、
    前記第1エネルギーが前記第2エネルギーにあらかじめ設定された第2しきい値を乗算した値よりも小さい場合、前記コアコーデックによってデコードされた信号の大きさをスケーリングするステップと
    を実行するための請求項11に記載のプログラムを記録したコンピュータで読出し可能な記録媒体。
JP2010536838A 2007-12-06 2008-11-28 音声コーデックの品質向上装置およびその方法 Active JP5323084B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR10-2007-0126371 2007-12-06
KR20070126371 2007-12-06
KR10-2008-0008590 2008-01-28
KR20080008590A KR101235830B1 (ko) 2007-12-06 2008-01-28 음성코덱의 품질향상장치 및 그 방법
PCT/KR2008/007024 WO2009072777A1 (en) 2007-12-06 2008-11-28 Apparatus and method of enhancing quality of speech codec

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2012278581A Division JP5390690B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法
JP2012278582A Division JP5395250B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法

Publications (2)

Publication Number Publication Date
JP2011508897A true JP2011508897A (ja) 2011-03-17
JP5323084B2 JP5323084B2 (ja) 2013-10-23

Family

ID=40990094

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2010536838A Active JP5323084B2 (ja) 2007-12-06 2008-11-28 音声コーデックの品質向上装置およびその方法
JP2012278581A Active JP5390690B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法
JP2012278582A Active JP5395250B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2012278581A Active JP5390690B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法
JP2012278582A Active JP5395250B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法

Country Status (6)

Country Link
US (3) US9135925B2 (ja)
EP (3) EP2560163A1 (ja)
JP (3) JP5323084B2 (ja)
KR (2) KR101235830B1 (ja)
CN (1) CN101636785B (ja)
WO (1) WO2009072777A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2780962C (en) 2009-11-19 2017-09-05 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for loudness and sharpness compensation in audio codecs
KR20120034863A (ko) * 2010-10-04 2012-04-13 삼성전자주식회사 이동통신 단말기에서 오디오 신호 처리 방법 및 장치
JP6098149B2 (ja) * 2012-12-12 2017-03-22 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
CN107896356B (zh) * 2017-10-27 2020-03-03 广州小鹏汽车科技有限公司 一种fm控制系统的音频控制方法及系统
US20200083501A1 (en) * 2018-09-10 2020-03-12 Apple Inc. Plug connector having a low profile and resilient flange

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152395A (ja) * 1993-11-29 1995-06-16 Nec Corp 雑音抑圧方式
JPH07307632A (ja) * 1994-05-13 1995-11-21 Alpine Electron Inc オーディオ装置
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JPH11330977A (ja) * 1998-03-11 1999-11-30 Matsushita Electric Ind Co Ltd オ―ディオ信号符号化装置、オ―ディオ信号復号化装置、及び、オ―ディオ信号符号化・復号化装置
JP3437264B2 (ja) * 1994-07-07 2003-08-18 パナソニック モバイルコミュニケーションズ株式会社 雑音抑圧装置
JP2004272292A (ja) * 1997-12-08 2004-09-30 Mitsubishi Electric Corp 音信号加工方法
JP2004302258A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音声復号化装置および音声復号化方法

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473366A (en) * 1992-11-17 1995-12-05 Canon Kabushiki Kaisha Television-telephone apparatus having a message-keeping function and an automatic response transmission function
JPH07193548A (ja) * 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
EP1041539A4 (en) * 1997-12-08 2001-09-19 Mitsubishi Electric Corp METHOD AND DEVICE FOR PROCESSING THE SOUND SIGNAL
KR100304092B1 (ko) * 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
WO2000007178A1 (en) 1998-07-31 2000-02-10 Conexant Systems, Inc. Method and apparatus for noise elimination through transformation of the output of the speech decoder
WO2001030049A1 (fr) 1999-10-19 2001-04-26 Fujitsu Limited Unite de traitement et de reproduction de son vocaux reçus
US6725190B1 (en) * 1999-11-02 2004-04-20 International Business Machines Corporation Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope
JP3594854B2 (ja) * 1999-11-08 2004-12-02 三菱電機株式会社 音声符号化装置及び音声復号化装置
US6510409B1 (en) * 2000-01-18 2003-01-21 Conexant Systems, Inc. Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
WO2003077235A1 (en) * 2002-03-12 2003-09-18 Nokia Corporation Efficient improvements in scalable audio coding
US7519530B2 (en) * 2003-01-09 2009-04-14 Nokia Corporation Audio signal processing
KR100506224B1 (ko) 2003-05-07 2005-08-05 삼성전자주식회사 이동 통신 단말기에서 노이즈 제어장치 및 방법
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
KR100647290B1 (ko) 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
US7752039B2 (en) * 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US8055783B2 (en) * 2005-08-22 2011-11-08 Utc Fire & Security Americas Corporation, Inc. Systems and methods for media stream processing
KR100728289B1 (ko) * 2005-11-02 2007-06-13 삼성전자주식회사 광대역 무선 접속 시스템의 대역폭 처리 방법 및 그 장치
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
US7454335B2 (en) * 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US7757103B2 (en) * 2006-12-20 2010-07-13 Intel Corporation Method and apparatus to estimate energy consumed by central processing unit core
US8553757B2 (en) * 2007-02-14 2013-10-08 Microsoft Corporation Forward error correction for media transmission
US8386266B2 (en) * 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07152395A (ja) * 1993-11-29 1995-06-16 Nec Corp 雑音抑圧方式
JPH07307632A (ja) * 1994-05-13 1995-11-21 Alpine Electron Inc オーディオ装置
JP3437264B2 (ja) * 1994-07-07 2003-08-18 パナソニック モバイルコミュニケーションズ株式会社 雑音抑圧装置
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP2004272292A (ja) * 1997-12-08 2004-09-30 Mitsubishi Electric Corp 音信号加工方法
JPH11330977A (ja) * 1998-03-11 1999-11-30 Matsushita Electric Ind Co Ltd オ―ディオ信号符号化装置、オ―ディオ信号復号化装置、及び、オ―ディオ信号符号化・復号化装置
JP2004302258A (ja) * 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音声復号化装置および音声復号化方法

Also Published As

Publication number Publication date
US9135926B2 (en) 2015-09-15
EP2560162A1 (en) 2013-02-20
US20130066627A1 (en) 2013-03-14
KR101235830B1 (ko) 2013-02-21
US20130073282A1 (en) 2013-03-21
WO2009072777A1 (en) 2009-06-11
EP2229675A4 (en) 2012-03-07
US9135925B2 (en) 2015-09-15
JP5323084B2 (ja) 2013-10-23
JP5390690B2 (ja) 2014-01-15
EP2560163A1 (en) 2013-02-20
US20100057449A1 (en) 2010-03-04
KR101235829B1 (ko) 2013-02-21
CN101636785A (zh) 2010-01-27
US9142222B2 (en) 2015-09-22
CN101636785B (zh) 2012-02-08
JP5395250B2 (ja) 2014-01-22
JP2013084002A (ja) 2013-05-09
KR20110068961A (ko) 2011-06-22
JP2013101366A (ja) 2013-05-23
KR20090060100A (ko) 2009-06-11
EP2229675A1 (en) 2010-09-22

Similar Documents

Publication Publication Date Title
JP5395250B2 (ja) 音声コーデックの品質向上装置およびその方法
JP6423460B2 (ja) フレームエラー隠匿装置
US9870781B2 (en) Device and method for reducing quantization noise in a time-domain decoder
US20090180531A1 (en) codec with plc capabilities
EP1312075B1 (en) Method for noise robust classification in speech coding
US20200160873A1 (en) Decoding device, encoding device, decoding method, and encoding method
US20050144017A1 (en) Device and process for encoding audio data
US20080255860A1 (en) Audio decoding apparatus and decoding method
JP2004184975A (ja) 少ない計算量で高周波数成分を復元するオーディオデコーディング方法及び装置
US20100329470A1 (en) Audio information processing apparatus and method
JP2005003835A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム
JP2009239437A (ja) オーディオ信号伝送システム
JP2005351977A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120629

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120927

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121004

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121029

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20121129

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20121206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130118

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130418

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130517

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130614

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130716

R150 Certificate of patent or registration of utility model

Ref document number: 5323084

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250