JP2014505907A - 不活性相の間のノイズ合成を用いるオーディオコーデック - Google Patents
不活性相の間のノイズ合成を用いるオーディオコーデック Download PDFInfo
- Publication number
- JP2014505907A JP2014505907A JP2013553903A JP2013553903A JP2014505907A JP 2014505907 A JP2014505907 A JP 2014505907A JP 2013553903 A JP2013553903 A JP 2013553903A JP 2013553903 A JP2013553903 A JP 2013553903A JP 2014505907 A JP2014505907 A JP 2014505907A
- Authority
- JP
- Japan
- Prior art keywords
- background noise
- audio
- audio signal
- data stream
- phase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
Abstract
【選択図】図1
Description
ランダム発生器294の出力は、QMF合成フィルタバンク288へ接続され、QMF合成フィルタバンク288の出力には時間領域において無音相と活性相からなる再構成されたオーディオ信号が現れる。
σN 2(m,k)=β(m,k)・σN 2(m-1,k)+(1−β(m,k))・σN 2(m,k) (1)
ここで、σX 2(m,k)はフレームm及び帯域kにおける入力信号の電力スペクトル密度を示し、σN 2(m,k)はノイズ電力推定を指し、β(m,k)は各帯域及び各フレームの平滑化量を別々に制御する忘却係数(必ず、0から1までの間)である。ノイズフロア情報を用いて活動ステータスを反映しようとすると、ノイズフロア情報は、不活性期間(即ち、電力スペクトルがノイズフロアに近いとき)の間は小値をとるべきであるのに対して、活性フレームの間はさらなる平滑化(理想的には、σN 2(m,k)は一定を維持)を適用するために、高値が選択されるべきである。これを達成するためには、次式(2)のように、忘却係数を計算することによって軟判定が行うことができる。
ここで、σNF 2はノイズフロア電力であり、αは制御パラメータである。αの値が高いほど忘却係数は大きくなり、故に、全体として平滑化が進む。
Claims (29)
- オーディオエンコーダであって、
活性相(24)の間に、入力オーディオ信号に基づいて、パラメトリック背景ノイズ推定を連続的に更新するように構成された背景ノイズ推定器(12)と、
前記活性相の間に、前記入力オーディオ信号をデータストリームに符号化するためのエンコーダ(14)と、
前記入力オーディオ信号に基づいて、前記活性相(24)に続く不活性相(28)の入口を検出するように構成された検出器(16)と、を備え、
該オーディオエンコーダは、前記不活性相の入口が検出されると、前記検出された不活性相に先行する前記活性相の間に連続的に更新された前記パラメトリック背景ノイズ推定を前記データストリームに符号化するように構成されているオーディオエンコーダ。 - 前記背景ノイズ推定器(12)は、前記パラメトリック背景ノイズ推定の連続的な更新において、前記入力オーディオ信号内のノイズ成分と有益な信号成分とを区別し、かつ前記パラメトリック背景ノイズ推定を前記ノイズ成分からだけで決定するように構成されている請求項1に記載のオーディオエンコーダ。
- 前記エンコーダ(14)は、前記入力オーディオ信号を前記データストリーム(30)に符号化する符号化において、前記入力オーディオ信号を線形予測係数と励振信号に予測符号化し、かつ前記励振信号を変換符号化し、前記線形予測係数を符号化するように構成されている請求項1又は2に記載のオーディオエンコーダ。
- 前記背景ノイズ推定器(12)は、前記活性相の間、前記励振信号を用いて前記パラメトリック背景ノイズ推定を更新するように構成されている請求項3に記載のオーディオエンコーダ。
- 前記背景ノイズ推定器は、前記パラメトリック背景ノイズ推定の更新において、前記励振信号における局所的極小を識別し、かつ前記局所的極小において、前記パラメトリック背景ノイズ推定を導出すべく前記励振信号の統計分析を実行するように構成されている請求項3又は4に記載のオーディオエンコーダ。
- 前記エンコーダは、前記入力信号の符号化において、前記入力オーディオ信号のより低い周波数部分を符号化すべく予測及び/又は変換符号化を用い、かつ前記入力オーディオ信号のより高い周波数部分のスペクトル包絡線を符号化すべくパラメトリック符号化を用いるように構成されている請求項1から5のいずれか一項に記載のオーディオエンコーダ。
- 前記エンコーダは、前記入力信号の符号化において、前記入力オーディオ信号のより低い周波数部分を符号化すべく予測及び/又は変換符号化を用い、かつ前記入力オーディオ信号のより高い周波数部分のスペクトル包絡線を符号化すべくパラメトリック符号化を用いること、又は前記入力オーディオ信号の前記より高い周波数部分を符号化せずにおくことを選択するように構成されている請求項1から6のいずれか一項に記載のオーディオエンコーダ。
- 前記エンコーダは、不活性相における前記予測及び/又は変換符号化ならびに前記パラメトリック符号化を中断するか、又は前記予測及び/又は変換符号化を中断し、かつ前記入力オーディオ信号の前記より高い周波数部分の前記スペクトル包絡線の前記パラメトリック符号化を前記活性相における前記パラメトリック符号化の使用よりも低い時間/周波数分解能で実行するように構成されている請求項6又は7に記載のオーディオエンコーダ。
- 前記エンコーダは、前記入力オーディオ信号を、前記より低い周波数部分を形成するサブバンドの集合と、前記より高い周波数部分を形成するサブバンドの集合とにスペクトル分解するためにフィルタバンクを用いる請求項6、7又は8に記載のオーディオエンコーダ。
- 前記背景ノイズ推定器は、前記活性相において、前記入力オーディオ信号の前記より低い周波数部分及びより高い周波数部分に基づいて前記パラメトリック背景ノイズ推定を更新するように構成されている請求項9に記載のオーディオエンコーダ。
- 前記背景ノイズ推定器は、前記パラメトリック背景ノイズ推定の更新において、前記入力オーディオ信号の前記より低い周波数部分及びより高い周波数部分における局所的極小を識別し、かつ前記局所的極小において、前記パラメトリック背景ノイズ推定を導出すべく前記入力オーディオ信号の前記より低い周波数部分及びより高い周波数部分の統計分析を実行するように構成されている請求項10に記載のオーディオエンコーダ。
- 前記ノイズ推定器は、前記不活性相の間であっても前記背景ノイズ推定の連続的な更新を継続するように構成され、
該オーディオエンコーダは、前記不活性相の間に連続的に更新された前記パラメトリック背景ノイズ推定の更新を断続的に符号化するように構成されている請求項1から11に記載のオーディオエンコーダ。 - 該オーディオエンコーダは、前記パラメトリック背景ノイズ推定の前記更新を一定の時間間隔又は可変の時間間隔で断続的に符号化するように構成されている請求項12に記載のオーディオエンコーダ。
- 不活性相(88)に先行する活性相(86)を少なくとも1つ含むデータストリームを復号して前記データストリームからオーディオ信号を再構成するためのオーディオデコーダであって、該オーディオデコーダは、
前記活性相(86)の間に前記データストリーム(104)からのパラメトリック背景ノイズ推定を連続的に更新するように構成された背景ノイズ推定器(90)と、
前記活性相の間に前記データストリームから前記オーディオ信号を再構成するように構成されたデコーダ(92)と、
パラメータランダム発生器(94)と、
前記不活性相(88)の間に前記パラメトリック背景ノイズ推定に依存して前記パラメータランダム発生器(94)を制御することによって、前記不活性相(88)の間の前記オーディオ信号を合成するように構成された背景ノイズ発生器(96)と、を備えたオーディオデコーダ。 - 前記背景ノイズ推定器(90)は、前記パラメトリック背景ノイズ推定の連続的な更新において、前記活性相(86)において前記データストリーム(104)から再構成されたバージョンの前記オーディオ信号におけるノイズ成分と有益な信号成分とを区別し、かつ前記パラメトリック背景ノイズ推定を前記ノイズ成分からだけで決定するように構成されている請求項14に記載のオーディオデコーダ。
- 前記デコーダ(92)は、前記データストリームからの前記オーディオ信号の再構成において、前記データストリームに変換符号化された励振信号を、同じく前記データストリームに符号化された線形予測係数に従って整形するように構成されている請求項14又は15に記載のオーディオデコーダ。
- 前記背景ノイズ推定器(90)は、前記励振信号を用いて前記パラメトリック背景ノイズ推定を更新するように構成されている請求項16に記載のオーディオデコーダ。
- 前記背景ノイズ推定器は、前記パラメトリック背景ノイズ推定の更新において、前記励振信号における局所的極小を識別し、かつ前記局所的極小において、前記パラメトリック背景ノイズ推定を導出すべく前記励振信号の統計分析を実行するように構成されている請求項16又は17に記載のオーディオデコーダ。
- 前記デコーダは、前記オーディオ信号の再構成において、前記データストリームから前記オーディオ信号のより低い周波数部分を再構成すべく予測及び/又は変換復号を用い、かつ前記オーディオ信号のより高い周波数部分を合成するように構成されている請求項1から18のいずれか一項に記載のオーディオデコーダ。
- 前記デコーダは、前記オーディオ信号の前記より高い周波数部分を、前記データストリームにパラメトリックに符号化された、前記入力オーディオ信号の前記より高い周波数部分のスペクトル包絡線から合成するように、又は前記オーディオ信号の前記より高い周波数部分を、前記より低い周波数部分に基づいてブラインド帯域幅拡張により合成するように構成されている請求項19に記載のオーディオデコーダ。
- 前記デコーダは、不活性相において前記予測及び/又は変換復号を中断し、前記活性相における前記スペクトル包絡線に従って前記オーディオ信号の前記より低い周波数部分の複製をスペクトル的に形成することにより前記オーディオ信号の前記より高い周波数部分の前記合成を実行し、かつ前記不活性相における前記スペクトル包絡線に従って前記合成されたオーディオ信号の複製をスペクトル的に形成するように構成されている請求項20に記載のオーディオデコーダ。
- 前記デコーダは、前記より低い周波数部分のサブバンド集合、及び前記より高い周波数部分のサブバンド集合から前記入力オーディオ信号をスペクトル的に構成するために逆フィルタバンクを備えている請求項20又は21に記載のオーディオデコーダ。
- 該オーディオデコーダは、前記不活性相の入口を、前記データストリームが中断される度に、かつ/又は前記データストリームが前記入口を示す信号がくる度に検出するように構成されている請求項14から22までのいずれか一項に記載のオーディオデコーダ。
- 前記背景ノイズ発生器(96)は、活性相から不活性相への移行直後の前記データストリームにパラメトリック背景ノイズ推定情報が存在しない場合だけ前記背景ノイズ推定器により連続的に更新された前記パラメトリック背景ノイズに依存して、前記不活性相(88)の間に前記パラメータランダム発生器(94)を制御することにより、前記不活性相(88)の間の前記オーディオ信号を合成するように構成されている請求項14から23のいずれか一項に記載のオーディオデコーダ。
- 前記背景ノイズ推定器(90)は、前記パラメトリック背景ノイズ推定の連続的な更新において、前記デコーダ(92)から再構成された前記オーディオ信号のスペクトル分解を用いるように構成されている請求項14から24のいずれか一項に記載のオーディオデコーダ。
- 前記背景ノイズ推定器(90)は、前記パラメトリック背景ノイズ推定の連続的な更新において、前記デコーダ(92)から再構成された前記オーディオ信号のQMFスペクトルを用いるように構成されている請求項14から請求項25のいずれか一項に記載のオーディオデコーダ。
- オーディオ符号化方法であって、
活性相(24)の間に入力オーディオ信号に基づいてパラメトリック背景ノイズ推定を連続的に更新することと、
前記活性相の間に前記入力オーディオ信号をデータストリームに符号化することと、
前記入力オーディオ信号に基づいて前記活性相(24)に続く不活性相(28)の入口を検出することと、
前記不活性相の前記入口が検出されると、前記検出された不活性相に先行する前記活性相の間に連続的に更新された前記パラメトリック背景ノイズ推定を前記データストリームに符号化することと、を含むオーディオ符号化方法。 - 不活性相(88)に先行する活性相(86)を少なくとも1つ含むデータストリームを復号して前記データストリームからオーディオ信号を再構成するためのオーディオ復号方法であって、該オーディオ復号方法は、
前記活性相(86)の間に前記データストリーム(104)からのパラメトリック背景ノイズ推定を連続的に更新することと、
前記活性相の間に前記データストリームから前記オーディオ信号を再構成することと、
前記不活性相(88)の間に前記パラメトリック背景ノイズ推定に依存してパラメータランダム発生器(94)を制御することにより、前記不活性相(88)の間の前記オーディオ信号を合成することと、を含むオーディオ復号方法。 - コンピュータ上で実行されると、請求項26から28のいずれか一項に記載の方法を実行するためのプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161442632P | 2011-02-14 | 2011-02-14 | |
US61/442,632 | 2011-02-14 | ||
PCT/EP2012/052462 WO2012110481A1 (en) | 2011-02-14 | 2012-02-14 | Audio codec using noise synthesis during inactive phases |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014505907A true JP2014505907A (ja) | 2014-03-06 |
JP5969513B2 JP5969513B2 (ja) | 2016-08-17 |
Family
ID=71943599
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013553903A Active JP5969513B2 (ja) | 2011-02-14 | 2012-02-14 | 不活性相の間のノイズ合成を用いるオーディオコーデック |
Country Status (17)
Country | Link |
---|---|
US (1) | US9153236B2 (ja) |
EP (1) | EP2676264B1 (ja) |
JP (1) | JP5969513B2 (ja) |
KR (1) | KR101613673B1 (ja) |
CN (1) | CN103534754B (ja) |
AR (1) | AR085224A1 (ja) |
CA (2) | CA2903681C (ja) |
ES (1) | ES2535609T3 (ja) |
HK (1) | HK1192641A1 (ja) |
MX (1) | MX2013009303A (ja) |
MY (1) | MY160272A (ja) |
PL (1) | PL2676264T3 (ja) |
RU (1) | RU2586838C2 (ja) |
SG (1) | SG192718A1 (ja) |
TW (1) | TWI480857B (ja) |
WO (1) | WO2012110481A1 (ja) |
ZA (1) | ZA201306873B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017524157A (ja) * | 2014-07-28 | 2017-08-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 快適雑音生成モード選択のための装置および方法 |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
US8892046B2 (en) * | 2012-03-29 | 2014-11-18 | Bose Corporation | Automobile communication system |
SG11201504810YA (en) * | 2012-12-21 | 2015-07-30 | Fraunhofer Ges Forschung | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
PL3054446T3 (pl) * | 2013-01-29 | 2024-02-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder audio, dekoder audio, sposób dostarczania kodowanej informacji audio, sposób dostarczania zdekodowanej informacji audio, program komputerowy i kodowana reprezentacja, stosujące adaptacyjne względem sygnału rozszerzenie szerokości pasma |
CN106169297B (zh) | 2013-05-30 | 2019-04-19 | 华为技术有限公司 | 信号编码方法及设备 |
WO2014192604A1 (ja) * | 2013-05-31 | 2014-12-04 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
BR112016010197B1 (pt) | 2013-11-13 | 2021-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador para codificar um sinal áudio, sistema de transmissão de áudio e método para determinar os valores de correção |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
EP2922056A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation |
EP2922054A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
EP2922055A1 (en) | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information |
KR20150117114A (ko) * | 2014-04-09 | 2015-10-19 | 한국전자통신연구원 | 잡음 제거 장치 및 방법 |
EP3511935B1 (en) | 2014-04-17 | 2020-10-07 | VoiceAge EVS LLC | Method, device and computer-readable non-transitory memory for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
US9870780B2 (en) | 2014-07-29 | 2018-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Estimation of background noise in audio signals |
TWI758146B (zh) * | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
KR102152004B1 (ko) * | 2015-09-25 | 2020-10-27 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 선형 예측 코딩을 사용하여 감소된 배경 잡음을 갖는 오디오 신호를 인코딩하기 위한 인코더 및 방법 |
US10079023B2 (en) * | 2015-09-25 | 2018-09-18 | Microsemi Semiconductor (U.S.) Inc. | Comfort noise generation apparatus and method |
PL3568853T3 (pl) | 2017-01-10 | 2021-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio, enkoder audio, sposób dostarczania dekodowanego sygnału audio, sposób dostarczania enkodowanego sygnału audio, strumień audio, moduł dostarczania strumienia audio i program komputerowy używający identyfikator strumienia |
CN109841222B (zh) * | 2017-11-29 | 2022-07-01 | 腾讯科技(深圳)有限公司 | 音频通信方法、通信设备及存储介质 |
US11264014B1 (en) * | 2018-09-23 | 2022-03-01 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
US11694708B2 (en) * | 2018-09-23 | 2023-07-04 | Plantronics, Inc. | Audio device and method of audio processing with improved talker discrimination |
US11109440B2 (en) * | 2018-11-02 | 2021-08-31 | Plantronics, Inc. | Discontinuous transmission on short-range packet-based radio links |
US20220148611A1 (en) * | 2019-03-10 | 2022-05-12 | Kardome Technology Ltd. | Speech enhancement using clustering of cues |
US11545172B1 (en) * | 2021-03-09 | 2023-01-03 | Amazon Technologies, Inc. | Sound source localization using reflection classification |
CN113571072B (zh) * | 2021-09-26 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 一种语音编码方法、装置、设备、存储介质及产品 |
WO2024056701A1 (en) * | 2022-09-13 | 2024-03-21 | Telefonaktiebolaget Lm Ericsson (Publ) | Adaptive stereo parameter synthesis |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1039898A (ja) * | 1996-07-22 | 1998-02-13 | Nec Corp | 音声信号伝送方法及び音声符号復号化システム |
JPH10190498A (ja) * | 1996-11-15 | 1998-07-21 | Nokia Mobile Phones Ltd | 不連続伝送中に快適雑音を発生させる改善された方法 |
JP2000357000A (ja) * | 1999-06-15 | 2000-12-26 | Matsushita Electric Ind Co Ltd | 雑音信号符号化装置および音声信号符号化装置 |
JP2003501925A (ja) * | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP2007065636A (ja) * | 2005-08-31 | 2007-03-15 | Motorola Inc | 音声通信システムにおいて快適雑音を生成する方法および装置 |
Family Cites Families (146)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1675100A2 (en) | 1991-06-11 | 2006-06-28 | QUALCOMM Incorporated | Variable rate vocoder |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
KR100419545B1 (ko) | 1994-10-06 | 2004-06-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다른코딩원리들을이용한전송시스템 |
JP3304717B2 (ja) | 1994-10-28 | 2002-07-22 | ソニー株式会社 | ディジタル信号圧縮方法及び装置 |
EP0720316B1 (en) | 1994-12-30 | 1999-12-08 | Daewoo Electronics Co., Ltd | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
US5754733A (en) | 1995-08-01 | 1998-05-19 | Qualcomm Incorporated | Method and apparatus for generating and encoding line spectral square roots |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
JP3622365B2 (ja) | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
JPH10124092A (ja) * | 1996-10-23 | 1998-05-15 | Sony Corp | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
ES2247741T3 (es) | 1998-01-22 | 2006-03-01 | Deutsche Telekom Ag | Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio. |
GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6317117B1 (en) | 1998-09-23 | 2001-11-13 | Eugene Goff | User interface for the control of an audio spectrum filter processor |
US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
JP4024427B2 (ja) | 1999-05-24 | 2007-12-19 | 株式会社リコー | 線形予測係数抽出装置、線形予測係数抽出方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
WO2001065544A1 (en) | 2000-02-29 | 2001-09-07 | Qualcomm Incorporated | Closed-loop multimode mixed-domain linear prediction speech coder |
US6757654B1 (en) | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
US6701772B2 (en) | 2000-12-22 | 2004-03-09 | Honeywell International Inc. | Chemical or biological attack detection and mitigation system |
US7610205B2 (en) | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US20040142496A1 (en) | 2001-04-23 | 2004-07-22 | Nicholson Jeremy Kirk | Methods for analysis of spectral data and their applications: atherosclerosis/coronary heart disease |
US7206739B2 (en) | 2001-05-23 | 2007-04-17 | Samsung Electronics Co., Ltd. | Excitation codebook search method in a speech coding system |
US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
CA2365203A1 (en) * | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
JP3815323B2 (ja) | 2001-12-28 | 2006-08-30 | 日本ビクター株式会社 | 周波数変換ブロック長適応変換装置及びプログラム |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
CN100492492C (zh) | 2002-09-19 | 2009-05-27 | 松下电器产业株式会社 | 音频解码设备和方法 |
KR100711280B1 (ko) * | 2002-10-11 | 2007-04-25 | 노키아 코포레이션 | 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치 |
US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
ATE486348T1 (de) * | 2003-06-30 | 2010-11-15 | Koninkl Philips Electronics Nv | Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch |
US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
RU2374703C2 (ru) | 2003-10-30 | 2009-11-27 | Конинклейке Филипс Электроникс Н.В. | Кодирование или декодирование аудиосигнала |
CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
EP1852851A1 (en) | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
AU2004319556A1 (en) | 2004-05-17 | 2005-11-24 | Nokia Corporation | Audio encoding with different coding frame lengths |
US7649988B2 (en) * | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
TWI253057B (en) | 2004-12-27 | 2006-04-11 | Quanta Comp Inc | Search system and method thereof for searching code-vector of speech signal in speech encoder |
US7519535B2 (en) | 2005-01-31 | 2009-04-14 | Qualcomm Incorporated | Frame erasure concealment in voice communications |
US9047860B2 (en) | 2005-01-31 | 2015-06-02 | Skype | Method for concatenating frames in communication system |
US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
NZ562188A (en) | 2005-04-01 | 2010-05-28 | Qualcomm Inc | Methods and apparatus for encoding and decoding an highband portion of a speech signal |
WO2006126843A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
PL1897085T3 (pl) * | 2005-06-18 | 2017-10-31 | Nokia Technologies Oy | System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy |
EP1895511B1 (en) | 2005-06-23 | 2011-09-07 | Panasonic Corporation | Audio encoding apparatus, audio decoding apparatus and audio encoding information transmitting apparatus |
KR100851970B1 (ko) | 2005-07-15 | 2008-08-12 | 삼성전자주식회사 | 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7536299B2 (en) | 2005-12-19 | 2009-05-19 | Dolby Laboratories Licensing Corporation | Correlating and decorrelating transforms for multiple description coding systems |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
CN101371296B (zh) | 2006-01-18 | 2012-08-29 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
EP1989702A4 (en) | 2006-01-18 | 2012-03-14 | Lg Electronics Inc | DEVICE AND METHOD FOR CODING AND DECODING A SIGNAL |
US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
US20070253577A1 (en) | 2006-05-01 | 2007-11-01 | Himax Technologies Limited | Equalizer bank with interference reduction |
DE602007003023D1 (de) | 2006-05-30 | 2009-12-10 | Koninkl Philips Electronics Nv | Linear-prädiktive codierung eines audiosignals |
US7873511B2 (en) | 2006-06-30 | 2011-01-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
WO2008013788A2 (en) | 2006-07-24 | 2008-01-31 | Sony Corporation | A hair motion compositor system and optimization techniques for use in a hair/fur pipeline |
US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
US20080147518A1 (en) | 2006-10-18 | 2008-06-19 | Siemens Aktiengesellschaft | Method and apparatus for pharmacy inventory management and trend detection |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
ES2383217T3 (es) | 2006-12-12 | 2012-06-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo |
FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
RU2356046C2 (ru) | 2007-06-13 | 2009-05-20 | Государственное образовательное учреждение высшего профессионального образования "Самарский государственный университет" | Способ получения капиллярных колонок и устройство для его осуществления |
KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
EP2186088B1 (en) | 2007-08-27 | 2017-11-15 | Telefonaktiebolaget LM Ericsson (publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
WO2009033288A1 (en) | 2007-09-11 | 2009-03-19 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
EP2346030B1 (en) | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
BR122021009252B1 (pt) | 2008-07-11 | 2022-03-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador e decodificador de áudio para estruturas de codificação de sinais de áudio amostrados |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
MY181247A (en) | 2008-07-11 | 2020-12-21 | Frauenhofer Ges Zur Forderung Der Angenwandten Forschung E V | Audio encoder and decoder for encoding and decoding audio samples |
RU2536679C2 (ru) | 2008-07-11 | 2014-12-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
EP2144171B1 (en) | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
WO2010003532A1 (en) | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
PL2146344T3 (pl) | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
WO2010031049A1 (en) | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
US8798776B2 (en) | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
CA2739736C (en) | 2008-10-08 | 2015-12-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-resolution switched audio encoding/decoding scheme |
KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
EP2382625B1 (en) | 2009-01-28 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, encoded audio information, methods for encoding and decoding an audio signal and computer program |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
US8805694B2 (en) | 2009-02-16 | 2014-08-12 | Electronics And Telecommunications Research Institute | Method and apparatus for encoding and decoding audio signal using adaptive sinusoidal coding |
PL2234103T3 (pl) | 2009-03-26 | 2012-02-29 | Fraunhofer Ges Forschung | Urządzenie i sposób manipulacji sygnałem audio |
RU2557455C2 (ru) | 2009-06-23 | 2015-07-20 | Войсэйдж Корпорейшн | Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
BR122020024236B1 (pt) | 2009-10-20 | 2021-09-14 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E. V. | Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio e programa de computador para uso em aplicações de baixo retardamento |
MX2012004593A (es) | 2009-10-20 | 2012-06-08 | Fraunhofer Ges Forschung | Codec multimodo de audio y codificacion de celp adaptada a este. |
CN102081927B (zh) * | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
WO2011147950A1 (en) | 2010-05-28 | 2011-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low-delay unified speech and audio codec |
MY159444A (en) | 2011-02-14 | 2017-01-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Encoding and decoding of pulse positions of tracks of an audio signal |
-
2012
- 2012-02-14 CA CA2903681A patent/CA2903681C/en active Active
- 2012-02-14 WO PCT/EP2012/052462 patent/WO2012110481A1/en active Application Filing
- 2012-02-14 EP EP12706002.8A patent/EP2676264B1/en active Active
- 2012-02-14 JP JP2013553903A patent/JP5969513B2/ja active Active
- 2012-02-14 CA CA2827335A patent/CA2827335C/en active Active
- 2012-02-14 AR ARP120100479A patent/AR085224A1/es active IP Right Grant
- 2012-02-14 PL PL12706002T patent/PL2676264T3/pl unknown
- 2012-02-14 CN CN201280015995.8A patent/CN103534754B/zh active Active
- 2012-02-14 TW TW101104682A patent/TWI480857B/zh active
- 2012-02-14 RU RU2013141934/08A patent/RU2586838C2/ru active
- 2012-02-14 KR KR1020137024142A patent/KR101613673B1/ko active IP Right Grant
- 2012-02-14 MX MX2013009303A patent/MX2013009303A/es active IP Right Grant
- 2012-02-14 ES ES12706002.8T patent/ES2535609T3/es active Active
- 2012-02-14 SG SG2013060959A patent/SG192718A1/en unknown
- 2012-02-14 MY MYPI2013701422A patent/MY160272A/en unknown
-
2013
- 2013-08-13 US US13/966,087 patent/US9153236B2/en active Active
- 2013-09-12 ZA ZA2013/06873A patent/ZA201306873B/en unknown
-
2014
- 2014-06-20 HK HK14105892.2A patent/HK1192641A1/xx unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1039898A (ja) * | 1996-07-22 | 1998-02-13 | Nec Corp | 音声信号伝送方法及び音声符号復号化システム |
JPH10190498A (ja) * | 1996-11-15 | 1998-07-21 | Nokia Mobile Phones Ltd | 不連続伝送中に快適雑音を発生させる改善された方法 |
JP2003501925A (ja) * | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
JP2000357000A (ja) * | 1999-06-15 | 2000-12-26 | Matsushita Electric Ind Co Ltd | 雑音信号符号化装置および音声信号符号化装置 |
JP2007065636A (ja) * | 2005-08-31 | 2007-03-15 | Motorola Inc | 音声通信システムにおいて快適雑音を生成する方法および装置 |
Non-Patent Citations (1)
Title |
---|
JPN6014028712; '"A SILENCE COMPRESSION SCHEME FOR G.729 OPTIMIZED FOR TERMINALS CONFORMING TO RECOMMENDATION V.70"' ITU-T Recommendation G.729 - Annex B , 199611, pp.1-16, INTERNATIONAL TELECOMMUNICATION UNION * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017524157A (ja) * | 2014-07-28 | 2017-08-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 快適雑音生成モード選択のための装置および方法 |
US10089993B2 (en) | 2014-07-28 | 2018-10-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for comfort noise generation mode selection |
US11250864B2 (en) | 2014-07-28 | 2022-02-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for comfort noise generation mode selection |
Also Published As
Publication number | Publication date |
---|---|
US9153236B2 (en) | 2015-10-06 |
MX2013009303A (es) | 2013-09-13 |
KR101613673B1 (ko) | 2016-04-29 |
SG192718A1 (en) | 2013-09-30 |
US20130332175A1 (en) | 2013-12-12 |
ZA201306873B (en) | 2014-05-28 |
CA2827335A1 (en) | 2012-08-23 |
PL2676264T3 (pl) | 2015-06-30 |
AU2012217161B2 (en) | 2015-11-12 |
CN103534754A (zh) | 2014-01-22 |
CA2903681C (en) | 2017-03-28 |
TWI480857B (zh) | 2015-04-11 |
MY160272A (en) | 2017-02-28 |
EP2676264A1 (en) | 2013-12-25 |
CA2903681A1 (en) | 2012-08-23 |
TW201250671A (en) | 2012-12-16 |
AU2012217161A1 (en) | 2013-09-26 |
ES2535609T3 (es) | 2015-05-13 |
KR20130138362A (ko) | 2013-12-18 |
WO2012110481A1 (en) | 2012-08-23 |
RU2013141934A (ru) | 2015-03-27 |
AR085224A1 (es) | 2013-09-18 |
JP5969513B2 (ja) | 2016-08-17 |
EP2676264B1 (en) | 2015-01-28 |
CA2827335C (en) | 2016-08-30 |
RU2586838C2 (ru) | 2016-06-10 |
CN103534754B (zh) | 2015-09-30 |
HK1192641A1 (en) | 2014-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5969513B2 (ja) | 不活性相の間のノイズ合成を用いるオーディオコーデック | |
JP6643285B2 (ja) | オーディオ符号器及びオーディオ符号化方法 | |
EP2866228B1 (en) | Audio decoder comprising a background noise estimator | |
AU2012217161B9 (en) | Audio codec using noise synthesis during inactive phases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131009 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131009 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140605 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140708 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20141002 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20141009 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150707 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20150924 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160105 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160707 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5969513 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |