JP5395250B2 - 音声コーデックの品質向上装置およびその方法 - Google Patents

音声コーデックの品質向上装置およびその方法 Download PDF

Info

Publication number
JP5395250B2
JP5395250B2 JP2012278582A JP2012278582A JP5395250B2 JP 5395250 B2 JP5395250 B2 JP 5395250B2 JP 2012278582 A JP2012278582 A JP 2012278582A JP 2012278582 A JP2012278582 A JP 2012278582A JP 5395250 B2 JP5395250 B2 JP 5395250B2
Authority
JP
Japan
Prior art keywords
energy
codec
signal
scaling
band
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012278582A
Other languages
English (en)
Other versions
JP2013084002A (ja
Inventor
ミ−スク イ
ド−ヨン キム
ビョン−ソン イ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Electronics and Telecommunications Research Institute ETRI
Original Assignee
Electronics and Telecommunications Research Institute ETRI
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Electronics and Telecommunications Research Institute ETRI filed Critical Electronics and Telecommunications Research Institute ETRI
Publication of JP2013084002A publication Critical patent/JP2013084002A/ja
Application granted granted Critical
Publication of JP5395250B2 publication Critical patent/JP5395250B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/34Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
    • H03G3/341Muting when no signals or only weak signals are present
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data
    • G11B2020/10555Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は音声コーデックに関し、詳細には音声コーディング時に無音区間の量子化誤差による品質低下を減らすための装置およびその方法に関する。
音声信号を圧縮するモジュールをエンコーダ(encoder)といい、再生するモジュールをデコーダ(decoder)という。最も基本的な音声コーデックは、ITU−T G.711コーデックであって、入力信号を8kHzでサンプリングした後、8ビットで量子化する。このとき、量子化効率を上げるために数1のようにA−lawまたは数2のようにμ−law形態のログ量子化器を使用する。
Figure 0005395250
Figure 0005395250
上記のような従来におけるログ量子化器は、入力信号の大きさにより量子化の間隔が異なる。例えば、大きさが小さい信号は相対的に量子化の間隔を大きくし、発生可能性が高い大きさの信号は量子化の間隔を狭くして量子化の効率を上げる。
一般的に量子化雑音は、全周波数帯域にかけて均等に分布するものと知られている。しかし、人の聴覚的な特性によって信号の大きさが大きい区間にある量子化誤差は信号に埋もれてよく聞こえず、信号の大きさが小さい区間にある量子化誤差は雑音として聞こえる。したがって、音声区間のみならず無音区間を効率よくコーディングすることがコーデックの全体性能において重要な影響を及ぼす。すなわち、無音区間における量子化誤差による雑音が全体の音質に影響を与えるおそれがあるためである。
また、コーデックは、入力信号の大きさに応じて性能が異なり得る。音声コーデックの性能を評価するときは主に大きさが異なる−16、−26、−36dBoVの信号に対して性能を評価する。すなわち、コーデックが入力信号の大きさの変化により性能がどのように変化するかを評価する。
G.711やG.722のようなコーデックは、−36dBoVの入力信号に対して量子化誤差による雑音が発生するが、特に無音区間で発生する量子化誤差がコーデックの全体品質を低下させる1つの原因になる。主観的な聴取テストの結果によると、−36dBoV信号に対するMOS(Mean Opinion Score)の点数が−36dBOv信号に比べて高いことが観察される。
本発明が解決しようとする技術的な課題は、音声コーディング時に無音区間の量子化誤差による雑音を減らすことによって、人の耳に無音区間で雑音が聞こえないようにし、全体的な聴取品質を高めることができる音声コーデックの品質向上装置およびその方法を提供することにある。
前述した技術的な課題を解決するための本発明に係る音声コーデックの品質向上装置の一実施形態は、低帯域コーデックによってデコードされた信号の第1エネルギーを求める第1エネルギー算出部と、前記第1エネルギーがあらかじめ設定された第1しきい値よりも小さい場合、前記デコードされた信号の大きさをスケーリングするスケーリング部と、を備える。
前述した技術的な課題を解決するための本発明に係る音声コーデックの品質向上方法の一実施形態は、低帯域コーデックによってデコードされた信号の第1エネルギーを求めるステップと、前記第1エネルギーがあらかじめ設定された第1しきい値よりも小さい場合、前記デコードされた信号の大きさをスケーリングするステップと、を含む。
本発明によれば、無音区間の量子化誤差によって発生する雑音を減らし、音声コーデックの品質を向上させることができる。特に、コーデックの入力信号のうち、信号の大きさが小さい場合、無音区間における量子化誤差を減らすことによって聴取品質を向上させることができる。
狭帯域コーデック基盤の広帯域拡張コーデックの一実施形態を示した図である。 G.711コーデックを利用するエンコーダの入力信号およびデコーダの出力信号に対するスペクトルを示した図である。 G.711コーデックを利用するエンコーダの入力信号およびデコーダの出力信号に対するスペクトルを示した図である。 本発明に係る音声コーデックの品質向上装置の一実施形態の構成を示した図である。 本発明に係る音声コーデックの品質向上方法の一実施形態の流れを示した図である。 本発明に係る音声コーデックの品質向上方法の適用有無による、G.711コーデックを利用するデコーダの出力信号に対するスペクトルを示した図である。 本発明に係る音声コーデックの品質向上方法の適用有無による、G.711コーデックを利用するデコーダの出力信号に対するスペクトルを示した図である。
以下、添付の図面を参照して本発明に係る音声コーデックの品質向上装置およびその方法に対して詳細に説明する。
図1は、狭帯域コーデック基盤の広帯域拡張コーデックの一実施形態を示した図である。
同図に示すように、広帯域拡張コーデックは、送信側100および受信側150に区分され、送信側100は、低帯域フィルタ(low−pass filter)105、高帯域フィルタ(high−pass filter)110、 低帯域コーデック(low−band codec)115、低帯域向上モード(low−band enhancement)120、広帯域拡張モード(wideband extension)125、およびMUX130を備え、受信側150は、DEMUX155、低帯域コーデック160、低帯域向上モード165、広帯域拡張モード170、低帯域フィルタ175、および高帯域フィルタ180を備える。
送信側100に入力される広帯域入力信号は、低帯域フィルタ105および高帯域フィルタ110を介して各々低帯域信号および高帯域信号に分離され、低帯域信号は、低帯域コーデック115および低帯域向上モード120を介してコーディングされ、高帯域信号は、広帯域拡張モード125を介してコーディングされる。低帯域コーデック115、低帯域向上モード120および広帯域拡張モード125を介して各々コーディングされた信号はMUX130によってビットストリームとして出力される。
ここで、低帯域向上モード120は、低帯域コーデック115において示していない低帯域信号をコーディングすることによって、狭帯域信号の品質を向上させる役割をする。
一般的に、低帯域向上モード120は、低帯域コーデック115により動作するアルゴリズムを決定するが、大部分の時間領域において動作するアルゴリズムを使用し、広帯域拡張モードは周波数領域において動作するアルゴリズムを使用する。
受信側150のDEMUX155は、送信側100から出力されたビットストリームを受信し、各々低帯域コーデック160、低帯域向上モード165、および広帯域拡張モード170に出力する。低帯域向上モード165および広帯域拡張モード170の動作の可否は、受信されたビットストリームにより決定される。
受信側150は、広帯域拡張モード170の動作の有無に応じて広帯域信号を出力することができる。出力信号の帯域幅にかかわらず、低帯域コーデック160は基本的に動作する。もし、低帯域コーデック160のみが動作すれば基本的な狭帯域信号を再生することができる。より優れた品質の狭帯域信号を再生するためには低帯域コーデック160と共に低帯域向上モード165も動作しなければならない。また、広帯域信号を出力するためには低帯域コーデック160および広帯域拡張モード170が動作しなければならない。すなわち、受信側において、広帯域出力信号を再生するためには低帯域コーデック160および広帯域拡張モード170の出力信号を加えて出力する。もちろん、より優れた品質の広帯域信号を再生するためには、低帯域コーデック160、低帯域向上モード165の出力信号、および広帯域拡張モード170の出力信号を加えて出力すればよい。
ITU−Tでは、図1に示された構成と類似したG.711を低帯域コーデックとして使用する広帯域拡張コーデックに対する標準化を進行している。すなわち、ITU−Tの推奨するG.711コーデック基盤の広帯域拡張コーデックは、低帯域コーデック115、160としてG.711を使用し、図1に示された構成で表現することができる。しかし、G.711コーデックは、−36dBoV信号の場合に量子化誤差による雑音が発生する。
図2Aおよび図2Bは、G.711コーデックを利用するエンコーダの入力信号およびデコーダの出力信号に対するスペクトルを示した図である。図2Aは音声信号に対するスペクトルであり、図2Bは無音信号に対するスペクトルである。
図2Aに示すように、音声信号に対して、エンコーダの入力信号200およびデコーダの出力信号210のスペクトルはほとんど一致する。しかし、図2Bに示すように、無音信号に対してエンコーダの入力信号230およびデコーダの出力信号220のスペクトルは不一致なことが分かる。すなわち、音声区間の場合、量子化誤差が小さい一方、無音区間では量子化誤差が大きいことが分かる。かかる量子化誤差は人の耳に雑音として聞こえる。
図3は、本発明に係る音声コーデックの品質向上装置の一実施形態の構成を示した図である。
同図に示すように、本発明に係る音声コーデックの品質向上装置は、第1エネルギー算出部300、第2エネルギー算出部310、およびスケーリング部320で構成される。
第1エネルギー算出部300は、低帯域コーデックによってデコードされた信号のエネルギー(以下、低帯域コーデックのエネルギー)を求める。第1エネルギー算出部300は、フレーム単位で低帯域コーデックのエネルギーを求め、低帯域コーデックとしてG.711を使用する場合にフレームの大きさはG.711コーデックが使用される環境に応じて異なり得る。すなわち、第1エネルギー算出部300は、各サンプルに対するエネルギーをすべて合算して1フレームのエネルギーを求める。
第2エネルギー算出部310は、低帯域向上モードが動作する場合、低帯域向上モードによってデコードされた信号のエネルギー(以下、向上モードのエネルギー)を求める。
スケーリング部320は、低帯域コーデックのエネルギーが所定のしきい値THR1よりも小さい場合、低帯域コーデックによってデコードされた信号の大きさをスケーリングする。また、スケーリング部320は、低帯域コーデックのエネルギーが向上モードのエネルギーに所定のしきい値THR2を乗算した値よりも小さい場合、低帯域コーデックによってデコードされた信号の大きさをスケーリングする。スケーリング部320は、1よりも小さい定数(a)の分だけデコードされた信号の大きさをスケーリングすることが好ましい。また、他の例として、スケーリング部320は、現フレームのエネルギー(低帯域コーデックのエネルギーまたは向上モードのエネルギー)に以前フレームのエネルギー(低帯域コーデックのエネルギーまたは向上モードのエネルギー)を加えた値に比例する1よりも小さい利得(gain)をデコードされた信号に乗算してスケーリングすることによって、スケーリングによる急な変化を防止できる。
この場合、スケーリング部320は、以前スケーリングの大きさを考慮してスケーリングの大きさを求めることができる。すなわち、スケーリング部320は、現フレームのエネルギーおよび以前フレームのエネルギーに基づいて求めた利得の一定比率と以前スケーリングの大きさの一定比率とを加えることによって、スケーリングの大きさを求めることができる。スケーリングはサンプル単位で行なうことはいうまでもない。
スケーリング部320は、デコードされた信号のエネルギーの大部分が高帯域に存在する場合、スケーリングを行なわない場合もある。例えば、広帯域拡張モードによってデコードされた信号のエネルギーが低帯域コーデックのエネルギーまたは向上モードのエネルギーより、あらかじめ設定された一定の大きさ以上よりも大きい場合、スケーリング部320はスケーリングを行なわない。
スケーリングのために使用されるしきい値THR1、THR2およびスケーリングの大きさ(a)などは実験によって求めることができ、このような値は本発明の実施形態によって多様に変更されて使用され得る。
図4は、本発明に係る音声コーデックの品質向上方法の一実施形態に対する流れを示した図である。
同図に示すように、本発明に係る音声コーデックの品質向上装置(以下、装置)は、低帯域コーデックによってデコードされた信号のエネルギー(以下、低帯域コーデックのエネルギー)をフレーム単位で算出するS400。フレームの大きさは、コーデックの種類およびコーデックが適用される環境に応じて多様に決定され得る。図1に示したように、狭帯域音声コーデックを利用した広帯域拡張コーデックに本発明を適用する場合、低帯域向上モードが存在し得る。したがって、装置は低帯域向上モードが動作中であるかを確認するS410。
低帯域向上モードが動作中の場合S410、装置は低帯域向上モードによってデコードされた信号のエネルギー(以下、向上モードのエネルギー)を算出するS430。そして、装置は低帯域コーデックのエネルギーが向上モードのエネルギーに所定のしきい値THR1を乗算した値よりも小いか、または低帯域コーデックのエネルギーが所定のしきい値THR2よりも小さい場合S440、低帯域コーデックによってデコードされた信号の大きさをa(1よりも小さい定数)の分だけスケーリングするS450。
低帯域向上モードが動作中でなければS410、装置は低帯域コーデックのエネルギーが所定のしきい値THR2よりも小さい場合S420、デコードされた信号をスケーリングするS450。スケーリングは、現フレームのエネルギー(低帯域コーデックのエネルギーまたは向上モードのエネルギー)に以前フレームのエネルギー(低帯域コーデックのエネルギーまたは向上モードのエネルギー)を加えた値に比例する1よりも小さい利得をデコードされた信号に乗算して行なうことによって、スケーリングによる急な変化を防止できる。この場合、現フレームのエネルギーおよび以前フレームのエネルギーに基づいて求めた利得の一定比率および以前スケーリングの大きさの一定比率を加えることによって、スケーリングの大きさを求めることができる。
しきい値THR1、THR2およびスケーリングの大きさなどは、前述の説明のような実験によってあらかじめ求められた値である。
図5Aおよび図5Bは、本発明に係る音声コーデックの品質向上方法の適用の有無によるG.711コーデックを利用するデコーダの出力信号に対するスペクトルを示した図である。図5Aは音声信号に対するスペクトルであり、図5Bは無音信号に対するスペクトルである。
図5Aに示すように、音声信号に対して本発明に係る音声コーデックの品質向上方法が適用される前のデコーダ出力信号500と、本発明に係る方法が適用された場合のデコーダ出力信号510とのスペクトルは一致する。
図5Bに示すように、無音信号に対して本発明に係る音声コーデックの品質向上方法が適用される前のデコーダ出力信号520よりも、本発明に係る方法が適用された場合のデコーダ出力信号530の大きさが小さくなることが分かる。すなわち、無音区間においてデコーダの出力信号レベルが低くなり、量子化誤差が減少することが分かる。
本発明は、コンピュータで読出し可能な記録媒体にコンピュータが読出し可能なコードとして具現することも可能である。コンピュータが読出し可能な記録媒体は、コンピュータシステムによって読出し可能なデータが保存されるすべての種類の記録装置を含む。コンピュータが読出し可能な記録媒体の一例として、ROM、RAM、CD−ROM、磁気テープ、フロッピーディスク、光データの保存装置などがあり、また、キャリアウェーブ(例えばインターネットを介した伝送)による表示の形態で具現されるものも含む。また、コンピュータが読出し可能な記録媒体は、ネットワークに接続したコンピュータシステムに分散され、分散方式によりコンピュータが読出し可能なコードが保存かつ実行されることができる。
以上、本発明に係る好ましい実施形態を主に説明した。本発明が属する技術分野における通常の知識を有する者は、本発明が本発明の本質的な特性から離脱しない範囲内で変形された形態で具現され得ることを理解すべきである。したがって、開示された実施形態は限定的な観点でなく、説明的な観点で考慮すべきである。本発明の範囲は、前述した説明でなく、特許請求の範囲に示されており、それと同等な範囲内にあるすべての差異点は本発明に含まれていると解釈すべきであろう。

Claims (8)

  1. 低帯域(low−band)コーデック及び広帯域拡張モードを含む音声コーデックの品質向上装置であって、
    前記低帯域コーデックによってデコードされた信号のエネルギーを求めるエネルギー算出部と、
    前記エネルギー算出部により求められたエネルギーが所定のしきい値以下である場合、前記デコードされた信号の大きさを1よりも小さい利得でスケーリングするスケーリング部と、
    を備え、
    前記利得は、少なくとも、
    前記デコードされた信号の以前フレームのエネルギーと現フレームのエネルギーとに基づいた特定利得に予め設定された比率を乗算した値と、
    以前利得に予め設定された比率を乗算した値とを加算して算出され
    前記スケーリング部は、
    高帯域と低帯域とにおけるエネルギーの比率に基づいてスケーリング可否を決定することを特徴とする音声コーデックの品質向上装置。
  2. 前記スケーリング部は、
    前記デコードされた信号の大きさに対してサンプル単位でスケーリングを行なうことを特徴とする請求項1に記載の音声コーデックの品質向上装置。
  3. 前記スケーリング部は、
    前記広帯域拡張モードによってデコードされた信号のエネルギーが前記低帯域コーデックによってデコードされた信号のエネルギーより予め設定された所定大きさ以上に大きい場合、スケーリングを行なわないことを特徴とする請求項1に記載の音声コーデックの品質向上装置。
  4. 前記エネルギー算出部は、
    フレーム単位で前記エネルギーを算出することを特徴とする請求項1に記載の音声コーデックの品質向上装置。
  5. 低帯域(low−band)コーデック及び広帯域拡張モードを含む音声コーデックの品質向上方法であって、
    前記低帯域コーデックによってデコードされた信号のエネルギーを求めるステップと、
    前記求められたエネルギーが所定のしきい値以下である場合、前記デコードされた信号の大きさを1よりも小さい利得でスケーリングするステップと、
    を含み、
    前記利得は、少なくとも、
    前記デコードされた信号の以前フレームのエネルギーと現フレームのエネルギーとに基づいた特定利得に予め設定された比率を乗算した値と、
    以前利得に予め設定された比率を乗算した値とを加算して算出され
    前記デコードされた信号の大きさを1よりも小さい利得でスケーリングするステップは、
    高帯域と低帯域とにおけるエネルギーの比率に基づいてスケーリング可否を決定するステップを含むことを特徴とする音声コーデックの品質向上方法。
  6. 前記デコードされた信号の大きさを1よりも小さい利得でスケーリングするステップは、
    前記デコードされた信号の大きさに対してサンプル単位でスケーリングを行なうステップを含むことを特徴とする請求項に記載の音声コーデックの品質向上方法。
  7. 前記デコードされた信号の大きさを1よりも小さい利得でスケーリングするステップは、
    前記広帯域拡張モードによってデコードされた信号のエネルギーが前記低帯域コーデックによってデコードされた信号のエネルギーより予め設定された所定大きさ以上に大きい場合、スケーリングを行なわないステップを含むことを特徴とする請求項に記載の音声コーデックの品質向上方法。
  8. 前記低帯域コーデックによってデコードされた信号のエネルギーを求めるステップは、
    フレーム単位で前記エネルギーを算出するステップを含むことを特徴とする請求項に記載の音声コーデックの品質向上方法。
JP2012278582A 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法 Active JP5395250B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2007-0126371 2007-12-06
KR20070126371 2007-12-06
KR20080008590A KR101235830B1 (ko) 2007-12-06 2008-01-28 음성코덱의 품질향상장치 및 그 방법
KR10-2008-0008590 2008-01-28

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2010536838A Division JP5323084B2 (ja) 2007-12-06 2008-11-28 音声コーデックの品質向上装置およびその方法

Publications (2)

Publication Number Publication Date
JP2013084002A JP2013084002A (ja) 2013-05-09
JP5395250B2 true JP5395250B2 (ja) 2014-01-22

Family

ID=40990094

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2010536838A Active JP5323084B2 (ja) 2007-12-06 2008-11-28 音声コーデックの品質向上装置およびその方法
JP2012278582A Active JP5395250B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法
JP2012278581A Active JP5390690B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2010536838A Active JP5323084B2 (ja) 2007-12-06 2008-11-28 音声コーデックの品質向上装置およびその方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2012278581A Active JP5390690B2 (ja) 2007-12-06 2012-12-20 音声コーデックの品質向上装置およびその方法

Country Status (6)

Country Link
US (3) US9135925B2 (ja)
EP (3) EP2560163A1 (ja)
JP (3) JP5323084B2 (ja)
KR (2) KR101235830B1 (ja)
CN (1) CN101636785B (ja)
WO (1) WO2009072777A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5812998B2 (ja) * 2009-11-19 2015-11-17 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオコーデックにおけるラウドネスおよびシャープネスの補償のための方法および装置
KR20120034863A (ko) * 2010-10-04 2012-04-13 삼성전자주식회사 이동통신 단말기에서 오디오 신호 처리 방법 및 장치
JP6098149B2 (ja) * 2012-12-12 2017-03-22 富士通株式会社 音声処理装置、音声処理方法および音声処理プログラム
CN104301064B (zh) 2013-07-16 2018-05-04 华为技术有限公司 处理丢失帧的方法和解码器
CN106683681B (zh) 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
CN107896356B (zh) * 2017-10-27 2020-03-03 广州小鹏汽车科技有限公司 一种fm控制系统的音频控制方法及系统
US20200083501A1 (en) * 2018-09-10 2020-03-12 Apple Inc. Plug connector having a low profile and resilient flange

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473366A (en) * 1992-11-17 1995-12-05 Canon Kabushiki Kaisha Television-telephone apparatus having a message-keeping function and an automatic response transmission function
JP2739811B2 (ja) * 1993-11-29 1998-04-15 日本電気株式会社 雑音抑圧方式
JPH07193548A (ja) 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
JP3322479B2 (ja) * 1994-05-13 2002-09-09 アルパイン株式会社 オーディオ装置
JP3437264B2 (ja) * 1994-07-07 2003-08-18 パナソニック モバイルコミュニケーションズ株式会社 雑音抑圧装置
JPH0846517A (ja) * 1994-07-28 1996-02-16 Sony Corp 高能率符号化及び復号化システム
JP4230414B2 (ja) * 1997-12-08 2009-02-25 三菱電機株式会社 音信号加工方法及び音信号加工装置
WO1999030315A1 (fr) 1997-12-08 1999-06-17 Mitsubishi Denki Kabushiki Kaisha Procede et dispositif de traitement du signal sonore
JP3344962B2 (ja) * 1998-03-11 2002-11-18 松下電器産業株式会社 オーディオ信号符号化装置、及びオーディオ信号復号化装置
KR100304092B1 (ko) 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
WO2000007178A1 (en) 1998-07-31 2000-02-10 Conexant Systems, Inc. Method and apparatus for noise elimination through transformation of the output of the speech decoder
WO2001030049A1 (fr) 1999-10-19 2001-04-26 Fujitsu Limited Unite de traitement et de reproduction de son vocaux reçus
US6725190B1 (en) * 1999-11-02 2004-04-20 International Business Machines Corporation Method and system for speech reconstruction from speech recognition features, pitch and voicing with resampled basis functions providing reconstruction of the spectral envelope
JP3594854B2 (ja) * 1999-11-08 2004-12-02 三菱電機株式会社 音声符号化装置及び音声復号化装置
US6510409B1 (en) * 2000-01-18 2003-01-21 Conexant Systems, Inc. Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US6691085B1 (en) 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US20040002856A1 (en) * 2002-03-08 2004-01-01 Udaya Bhaskar Multi-rate frequency domain interpolative speech CODEC system
AU2002246280A1 (en) * 2002-03-12 2003-09-22 Nokia Corporation Efficient improvements in scalable audio coding
US7519530B2 (en) * 2003-01-09 2009-04-14 Nokia Corporation Audio signal processing
JP4365610B2 (ja) * 2003-03-31 2009-11-18 パナソニック株式会社 音声復号化装置および音声復号化方法
KR100506224B1 (ko) * 2003-05-07 2005-08-05 삼성전자주식회사 이동 통신 단말기에서 노이즈 제어장치 및 방법
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
KR100647290B1 (ko) 2004-09-22 2006-11-23 삼성전자주식회사 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
US7752039B2 (en) * 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US20060224381A1 (en) * 2005-04-04 2006-10-05 Nokia Corporation Detecting speech frames belonging to a low energy sequence
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US8055783B2 (en) * 2005-08-22 2011-11-08 Utc Fire & Security Americas Corporation, Inc. Systems and methods for media stream processing
KR100728289B1 (ko) * 2005-11-02 2007-06-13 삼성전자주식회사 광대역 무선 접속 시스템의 대역폭 처리 방법 및 그 장치
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
US7454335B2 (en) 2006-03-20 2008-11-18 Mindspeed Technologies, Inc. Method and system for reducing effects of noise producing artifacts in a voice codec
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US7757103B2 (en) * 2006-12-20 2010-07-13 Intel Corporation Method and apparatus to estimate energy consumed by central processing unit core
US8553757B2 (en) * 2007-02-14 2013-10-08 Microsoft Corporation Forward error correction for media transmission
US8386266B2 (en) * 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec

Also Published As

Publication number Publication date
EP2560162A1 (en) 2013-02-20
US20100057449A1 (en) 2010-03-04
CN101636785B (zh) 2012-02-08
EP2229675A1 (en) 2010-09-22
WO2009072777A1 (en) 2009-06-11
JP5323084B2 (ja) 2013-10-23
US20130073282A1 (en) 2013-03-21
JP2013101366A (ja) 2013-05-23
US9135926B2 (en) 2015-09-15
EP2560163A1 (en) 2013-02-20
US20130066627A1 (en) 2013-03-14
US9142222B2 (en) 2015-09-22
EP2229675A4 (en) 2012-03-07
JP2013084002A (ja) 2013-05-09
KR20110068961A (ko) 2011-06-22
JP2011508897A (ja) 2011-03-17
KR101235829B1 (ko) 2013-02-21
JP5390690B2 (ja) 2014-01-15
KR101235830B1 (ko) 2013-02-21
KR20090060100A (ko) 2009-06-11
CN101636785A (zh) 2010-01-27
US9135925B2 (en) 2015-09-15

Similar Documents

Publication Publication Date Title
JP5395250B2 (ja) 音声コーデックの品質向上装置およびその方法
JP6423460B2 (ja) フレームエラー隠匿装置
EP1334484B1 (en) Enhancing the performance of coding systems that use high frequency reconstruction methods
RU2638744C2 (ru) Устройство и способ для уменьшения шума квантования в декодере временной области
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
KR20010021226A (ko) 디지털 음향 신호 부호화 장치, 디지털 음향 신호 부호화방법 및 디지털 음향 신호 부호화 프로그램을 기록한 매체
US11257506B2 (en) Decoding device, encoding device, decoding method, and encoding method
EP1312075B1 (en) Method for noise robust classification in speech coding
US20090180531A1 (en) codec with plc capabilities
JP2007333785A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
US7725323B2 (en) Device and process for encoding audio data
US20080255860A1 (en) Audio decoding apparatus and decoding method
JP2009239437A (ja) オーディオ信号伝送システム
JP2005003835A (ja) オーディオ信号符号化装置、オーディオ信号符号化方法、及びプログラム
JP2005351977A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130423

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130723

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130816

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130917

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131017

R150 Certificate of patent or registration of utility model

Ref document number: 5395250

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250