JP2004519736A - 位相スメアリング及び位相デスメアリングフィルタを有するadpcm音声コーディングシステム - Google Patents
位相スメアリング及び位相デスメアリングフィルタを有するadpcm音声コーディングシステム Download PDFInfo
- Publication number
- JP2004519736A JP2004519736A JP2002580311A JP2002580311A JP2004519736A JP 2004519736 A JP2004519736 A JP 2004519736A JP 2002580311 A JP2002580311 A JP 2002580311A JP 2002580311 A JP2002580311 A JP 2002580311A JP 2004519736 A JP2004519736 A JP 2004519736A
- Authority
- JP
- Japan
- Prior art keywords
- phase
- coding system
- speech
- encoder
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001914 filtration Methods 0.000 claims abstract description 28
- 230000006978 adaptation Effects 0.000 claims abstract description 9
- 230000000694 effects Effects 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 17
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000003044 adaptive effect Effects 0.000 abstract 1
- 230000003595 spectral effect Effects 0.000 description 14
- 238000013139 quantization Methods 0.000 description 9
- 239000000523 sample Substances 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005316 response function Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 239000012723 sample buffer Substances 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/04—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/06—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
Description
【発明の属する技術分野】
本発明は、音声エンコーダと、該音声エンコーダと協働する音声デコーダとを備える音声コーディングシステムであって、前記音声エンコーダが、前処理器と、量子化器及びステップサイズ適応手段を備えるADPCM(適応差分パルス符号変調)エンコーダとを有し、前記音声デコーダが、前記ADPCMエンコーダにおけるのと類似したステップサイズ適応手段及びデコーダを備えるADPCMデコーダと、後処理器とを有するような、音声コーディングシステムに関する。
【0002】
【従来の技術】
近接マイク音声録音は、電話の送受話器のように、音声源(口)のマイクとの距離を最小化することにより音声信号に対する室内の音響効果を低減又は除去することが知られている。これら音声信号が前処理されたADPCMエンコーダ等の標準的なP2CM音声コーディングシステムで処理されると、より遠い距離から録音するときと比較したときの近接マイク音声録音のパルス様の特徴を再生することに関する問題が発生する。ADPCMコーダは、その入力信号、つまり、サンプリングされた音声入力信号と予測された量子化値との間の差が、量子化器入力信号に適応されたステップサイズで量子化されるような量子化器を備える。近接マイク音声録音におけるパルス状領域においては、ADPCMコーダの量子化器のための入力信号は、量子化器がそのステップサイズを適応させるのに高過ぎ且つ速過ぎるかも知れない。室内における反響は時間に亘って音声信号のエネルギーをスメアリングし、ステップサイズのより緩やかな適応を可能にする。
【0003】
従って、パルス状信号に関してP2CM音声コーディングシステムの性能を向上するためには、ADPCMエンコーダ入力信号は、量子化器への入力において短時間のフレームでの急速エネルギー増加が無くなるような態様で処理されなければならない。しかし、音声デコーダの出力は、如何なるアーチファクトも無くオリジナルのように聞こえなければならない。よって、室内効果をシミュレーションしてオリジナル録音の遠距離バージョンを作成し、このコーディングをこの信号に適用する、という選択肢は十分に良好なものではない。
【0004】
【発明が解決しようとする課題】
本発明の目的は、上記の問題を軽減させ、特にパルス状音声信号に対して、改良された録音及び再生を伴う音声コーディングシステムを提供することである。
【0005】
【課題を解決するための手段】
本発明によれば、冒頭段落で述べたような音声コーディングシステムは、前記前処理器が、前記量子化器の入力における高い及び/又は速いエネルギー変化の効果を平滑化する位相スメアリングフィルタリング手段を備え、前記後処理器が、前記位相スメアリングフィルタリング手段と逆のフィルタリング手段を備える、ことを特徴とする。
【0006】
位相スメアリングフィルタリングは時間領域で行うことができるが、このフィルタリングは、前処理器及び後処理器が、スペクトル振幅ワーピング(warping)手段及びこのようなワーピングの効果を取り消す(undo)手段をそれぞれ備える場合には、周波数領域で行うことが好ましい。これは、前記ワーピング手段及び逆ワーピング(unwarping)手段は周波数領域で動作可能だからである。従って、特に、位相スメアリング及びワーピングは同一処理ブロックで実行され、逆位相スメアリング及び逆ワーピングも同様に同一処理ブロックで実行される。位相スメアリングは線形プロセスである一方、スペクトル振幅ワーピングは非線形プロセスであるので、両プロセスは互いに統合されず、周波数領域で連続して行われる。つまり、フィルタされた信号がワーピングの対象となる。スペクトル振幅ワーピングはそれ自体知られている。1997年のICASSP Vol. 1のp.335−338のR. Lefebre及びC. Laflammeによる”Spectral Amplitude Warping (SAW) for Noise Spectrum Shaping in Audio Coding”を参照されたい。
【0007】
本発明のこれらの及び他の側面は、この後に説明される図面及び実施例を参照して説明され、明らかにされる。
【0008】
【発明の実施の形態】
図1のP2CM音声コーディングシステムはエンコーダ1及びデコーダ2により構成される。エンコーダ1は前処理器3及びADPCMエンコーダ4を有し、デコーダ2はADPCMデコーダ5及び後処理器6を備える。ADPCMエンコーダ4は図2Aに示され、ADPCMデコーダ5は図2Bに示される。
【0009】
例として、P2CM音声エンコーダ1ではPCM入力信号は例えば10ミリ秒のフレームに分けられる。例えば8kHzのサンプリング周波数ではフレームは80個のサンプルから構成される。各サンプルは例えば16ビットにより表される。この入力信号は前処理器3に供給され、これに応答して得られる出力信号はADPCMエンコーダ4に供給される。ADPCMエンコーダ4に対する他の入力信号はコーデックモード信号CMSにより形成され、該コーデックモード信号はADPCMエンコーダ4のビットストリーム出力中のコード語へのビット割り当てを決定する。ADPCMエンコーダ4は前処理された信号フレーム中の各サンプルに対するコード語を生成させる。次にコード語は、(この例では80個のコードの)フレームに入れられる。選択されたコーデックモードに依存して、生じるビットストリームは例えば11.2, 12.8, 16, 19.2, 21.6, 24又は32 kbits/sのビットレートを有する。
【0010】
P2CM音声デコーダ2では、ADPCMデコーダ5の入力はコードフレーム及びコーデックモードのビットストリームにより形成される。本例ではコードフレームは80個のコードから構成され、これらはADPCMデコーダ5によりデコードされ80個のサンプルのPCM出力フレームを形成し、該PCM出力フレームは後処理器6で後処理に供される。
【0011】
前処理器3では、生じる信号がコーディングによりよく適するように信号特性が変化させられる。前処理はエンコードの前に信号スペクトルを修正する。従って、非線形変換、例えば平方根変換がスペクトル振幅に適用されてよい。「スペクトル振幅ワーピング」と呼ばれるこのような変換により、比較的小さなスペクトル振幅が比較的強いスペクトル振幅に対して増加して、重要な部分をADPCMエンコーダ4で導入された量子化ノイズより上に保持する。このような態様で信号スペクトルを修正するために、前処理器3は、音声信号の時間領域サンプルのフレームを周波数領域に変換するための時間−周波数変換ユニットと、スペクトル振幅ワーピング手段と、ワーピングされた音声信号を周波数領域から時間領域へ変換するための周波数−時間変換ユニットと、を備える処理装置7を有する。この変換は、送信されるべき追加のビットの必要無しにP2CM音声デコーダの側において反転可能である。従って、後処理器6は、音声信号の時間領域サンプルのフレームを周波数領域に変換するための時間−周波数変換ユニットと、前処理器においてエンコーダ側で行われたスペクトル振幅ワーピングの効果を取り消すための手段と、逆ワーピングされた音声信号を周波数領域から時間領域へ変換するための周波数−時間変換ユニットと、を備える処理手段8を有する。
【0012】
図2Aに示されるADPCMエンコーダ4は量子化ブロック9、ステップサイズ適応ブロック10、デコーダブロック11及び予測ブロック12を有する。ADPCMエンコーダ4に対する入力は前処理器3により供給されるサンプリングされた音声信号である。サンプルnが値s(n)を有するとき、各入力値s(n)に対してこの値と推定(予測)値s(n−1)との間の違いはエラー信号e(n)として取られ、該エラー信号は次に量子化ブロック9により量子化されエンコードされて、出力コードc(n)を与える。出力コードc(n)は、送信又は伝送されるビットストリームを形成し、これはP2CM音声コーダのADPCMデコーダ5により受信される。図1ではこれは破線13により示される。出力コードc(n)はブロック10により量子化ステップサイズΔnの適応のためにも用いられ、また、デコーダブロック11により量子化されたエラー信号e’(n)を得るためにも用いられる。量子化エラー信号e’(n)は予測値s(n−1)に加えられ、量子化入力値s’(n)を生じさせる。s’(n)は予測ブロック12によりその予測係数を適応させるのに用いられる。
【0013】
ADPCMデコーダ5はただのエンコーダ4のサブセットである。該ADPCMデコーダ5は受信された量子化コードc(n)をビットストリームから読み、エンコーダと同じものを用いてその内部変数を更新する。従って、ADPCMデコーダ5は、ステップサイズ適応ブロック14、デコーダブロック15及び予測ブロック16を有する。デコーダブロック15の出力は量子化エラー信号e’(n)であり、これは予測値s(n−1)に加えられた後、量子化音声信号s’(n)を与える。
【0014】
図2A及び2Bに更には示されていないが、コーデックモード信号CMSは、ADPCMエンコーダ4中のデコーダブロック11に対して、及び、ADPCMデコーダ5中にデコーダブロック15に対しても、入力信号を形成する。
【0015】
上記のADPCMエンコーダ及びデコーダの代わりに他のエンコーダ及びデコーダも適用可能である。
【0016】
説明の導入部で既に述べたように、より遠い距離からの録音と比較したときの近接マイク録音の特徴のような、パルスを再生することに関する問題が発生する。近接マイク録音中のパルス状領域において、量子化ブロック9への入力信号は、量子化器がそのステップサイズΔnを適応させるのに高過ぎ且つ速過ぎるようになる。
【0017】
本発明によれば、この問題に対する解決策は、P2CM音声エンコーダ1で位相スメアリングフィルタを用いることである。このフィルタはオールパス特性を有し、これは、全周波数に対する信号エネルギーが変わらないことを意味する。P2CM音声デコーダ2の同一のフィルタの時間反転型を用いることによりオリジナルのフィルタされていない形に戻ることも容易である。図1は位相スメアリングフィルタ17を示す。これの入力はP2CM音声エンコーダ1のPCM入力信号により形成される一方、フィルタされた出力信号は処理ブロック7に供給される。位相スメアリングフィルタ17で有限インパルス応答(FIR)フィルタリング操作が、p(m)をフィルタインパルス応答、Lをフィルタ長さ、s(n)を入力信号、そしてsp(n)をフィルタされた出力信号として、
【数3】
に従って実行される。逆位相スメアリングは、P2CM音声デコーダ2中の処理ブロック8の出力において同一のフィルタを用いて逆位相スメアリングフィルタ18により、
【数4】
に従って逆の時間的順序で行われ、ここでsp’(n)は入力信号で、s’(n)はフィルタされた出力信号である。この操作は出力における長さLの全遅延を生じる。コーダが通信、例えば電話サービスに用いられたとき大きな処理遅延は望ましくない。従って、フィルタ長さLは可能な限り小さく保持されるべきである。
【0018】
時間領域のフィルタリングは比較的大きなフィルタ長さを必要とするため、フィルタリングは周波数領域で実行することが好ましい。以下で、各周波数成分に対して一定の振幅及び変化する相を用いてフィルタが周波数領域で構成されるような位相スメアリングフィルタの例が与えられる。このフィルタの周波数応答は次式に従う。
【数5】
(ここで0≦k≦1/2N)
実数データを得るためには負の周波数軸は対称的でなくてはならず:
【数6】
(ここで1/2N<k<N)
ここでR及びIはそれぞれスペクトルの実部及び虚部である。時間領域への変換は次式に従う。
【数7】
(ここで−1/2L≦n<1/2L)
DFT(離散フーリエ変換)長さN及びフィルタ長さLは両者とも同一の値に設定されることができる。実はこのフィルタは、周波数が0とナイキスト周波数fNとの間で線形的に増加する正弦波である。フィルタ特性は図3A〜3Dに示される。図3Aは振幅−時間依存性を、図3Bは振幅−周波数依存性を、図3Cは周波数−時間依存性を、そして、図3Dは周波数に対する接続された位相(unwrapped phase)の関係を、示す。
【0019】
このフィルタはかなり良好に動作するが、理想的ではない。フィルタの設計には2つの基準が考慮される。1つは、一般的に音声中の低周波(1kHzより下)は、声門パルス形状のため既に時間に対してスメアリングされているということである。もう1つは、高周波(3kHzより上)では、音声のエネルギーが比較的低いということである。また、300〜3400Hzの電話での話など多くのアプリケーション領域で行われるバンドパスフィルタリングは、1〜3kHzでより多く位相スメアリングを適用することにより利用可能なフィルタ長さのより効率的な使用を示唆する。
【0020】
従って、所望の実施例では、位相スメアリングフィルタの発生のために以下の周波数応答がP2CMで用いられる。
【数8】
(ここで0≦k≦1/2N)
定数Aは、所望のスメアリングに依存し、特にフィルタ長さ、よって、用いられているウィンドウ処理(windowing)に、依存する。このようなフィルタの特性は図4A〜4Dに示される。これらの図は図3A〜3Dに対応する。
【0021】
DFT長さは256に設定されてよい。実効フィルタ長さは約96(12ミリ秒)である。このフィルタ長さでは、定数Aの好適な選択は6.44である。96という値は前/後処理器の入力ウィンドウ長さ(256)と出力ウィンドウ長さ(160)との間の差から来る。これは、処理ブロック7中の位相スメアリングフィルタへの包含及び処理ブロック8の逆フィルタへの包含を可能にし、これは以下でより詳細に説明される。
【0022】
図5は前処理器3のブロック図を示す。前処理器は、入力ウィンドウ形成ユニット19と、FFTユニット20と、位相スメアリングフィルタリング及びスペクトル振幅ワーピングユニット21と、逆FFT(IFFT)ユニット22と、出力ウィンドウ形成ユニット23と、重複及び加算ユニット24とを有する。本例では、入力ウィンドウ形成ユニット19の80個のサンプル入力フレームは、256個のサンプルのバッファに移動させられ入力ウィンドウs(n)を形成する(図6を参照のこと)。入力ウィンドウタイプは入力ウィンドウと同一長さを持つ長方形であるため、重み付けにおいて他の操作は必要でない。スペクトルS(k)は256ポイントのFFT20を用いて計算される。信号S(k)を位相スメアリング及びスペクトル振幅ワーピングに連続的に供した後、得られた信号Sfw(k)はIFFT22で変換され、これによりこの信号の時間表示sfw(n)を得る。2つの連続的なフレームの間で円滑な変換を可能にするため、重複−加算が20msのハニング出力ウィンドウで用いられる(160サンプル)。この出力ウィンドウは256個のサンプルのFFTバッファ中で中心合わせされる。32サンプルの余分の遅延が、このプロセスの全遅延としてフレーム長さの倍数(160サンプル)を得るために加えられる。この配列遅延は、前処理器が、前処理器と後処理器との間の同期化データフレーミングを保証するためにのみ必要である。後処理器の構成は、ユニット21に対応するユニットではスペクトル振幅ワーピングの影響が取り消され、次に逆位相スメアリングフィルタが適用されるという違いの他は前処理器と同一である。スペクトル振幅ワーピング及び逆ワーピングは両者とも周波数領域で機能するため、位相スメアリング及び対応する逆プロセスも周波数領域で実行されることができる。フィルタ処理のための時間領域から周波数領域への正確な変換は別個の処理ブロックを示すべきだが、これは、存在するワーピング/逆ワーピングブロック内への包含により近似されることができる。この態様で、フィルタの処理時間が低減されるだけでなく、余分の処理遅延も除去されることができる。式(A)及び(B)の時間領域フィルタリング操作は、前処理器に対しては式(G)の周波数領域フィルタリング操作、及び、後処理器に対しては式(H)の操作に、置換される。
【数9】
及び
【数10】
ここで0≦k≦1/2Nである。S(k)、P(k)及びSp(k)は、式(A)及び(B)中の対応する関数s(n)、p(n)及びsp(k)のフーリエ変換であり、R及びIはこれらの信号の実部及び虚部である。
【0023】
フィルタリングに対する別の処理ブロックへのこの近似は欠点を有することが明らかであろう。前処理器中のスペクトル振幅ワーピング操作は未処理入力ウィンドウからの振幅値を用いて行われ、後処理器中の逆ワーピング操作はこの信号の位相スメアリングされたものからの振幅値を用いて行われる。連続するフレーム間の相関が低ければ、これはアーチファクトを導入しかねない。しかし、実際上は、この相関は、この近似による品質劣化は無視できるほどであるのに十分高いようである。
【0024】
後処理器の出力において追加された余分な遅延を削減することにより他の簡略化が実行される。この遅延は、前処理器及び後処理器への入力を同期化するために導入された。挿入された位相スメアリングのため、この同期化は、各周波数成分が異なった遅延を有するためこれ以上可能ではない。
【0025】
上述の実施例は、P2CM音声エンコーダ及びデコーダの信号処理手段上でランすることが可能なコンピュータプログラムの形であってよいアルゴリズムにより実現される。これまでの図で特定のプログラム可能な機能を実行するユニットを示す部分は、これらユニットがコンピュータプログラムのサブパーツであるとみなされるべきである。
【0026】
説明された発明は説明された実施例に制限されない。これらの変形も可能である。特に、説明された実施例で述べられた周波数応答関数及び値は例として与えられたものであり、他の周波数応答関数及び値が可能であることが分かるであろう。
【図面の簡単な説明】
【図1】時間領域で動作可能な、位相スメアリングフィルタリング手段及び逆位相スメアリングフィルタリング手段をそれぞれ含む前処理及び後処理のための手段を備えるP2CMコーディングシステムのブロック図。
【図2A】ADPCMエンコーダのブロック図。
【図2B】ADPCMデコーダのブロック図。
【図3A】位相スメアリングフィルタの第1の実施例の種々の特徴。
【図3B】位相スメアリングフィルタの第1の実施例の種々の特徴。
【図3C】位相スメアリングフィルタの第1の実施例の種々の特徴。
【図3D】位相スメアリングフィルタの第1の実施例の種々の特徴。
【図4A】位相スメアリングフィルタの第2の実施例の種々の特徴。
【図4B】位相スメアリングフィルタの第2の実施例の種々の特徴。
【図4C】位相スメアリングフィルタの第2の実施例の種々の特徴。
【図4D】位相スメアリングフィルタの第2の実施例の種々の特徴。
【図5】位相スメアリングが周波数領域で動作可能な、P2CM音声エンコーダ及びデコーダのための前/後処理器のブロック図。
【図6】前処理器のフレーミング及びウィンドウ処理。
Claims (7)
- 音声エンコーダと、該音声エンコーダと協働する音声デコーダと、を備える音声コーディングシステムであって、前記音声エンコーダが、前処理器と、量子化器及びステップサイズ適応手段を備えるADPCMエンコーダとを有し、前記音声デコーダが、前記ADPCMエンコーダにおけるのと類似したステップサイズ適応手段及びデコーダを備えるADPCMデコーダと、後処理器とを有するような、音声コーディングシステムにおいて、前記前処理器が、前記量子化器の入力における高い及び/又は速いエネルギー変化の効果を平滑化する位相スメアリングフィルタリング手段を備え、前記後処理器が、前記位相スメアリングフィルタリング手段とは逆のフィルタリング手段を備える、ことを特徴とする音声コーディングシステム。
- 請求項1に記載の音声コーディングシステムであって、前記前及び後処理器は、音声信号の時間領域サンプルのフレームを周波数領域に変換するための時間−周波数変換ユニットと、前記周波数領域のサンプルを処理するための処理手段と、後者の処理されたサンプルを前記時間領域に変換するための周波数−時間変換ユニットとを有し、前記前処理器中の前記処理手段は位相スメアリングフィルタリング及びワーピング手段を備え、前記後処理器中の前記処理手段は逆ワーピング手段及び逆位相スメアリングフィルタリング手段を備える、ことを特徴とする音声コーディングシステム。
- 請求項2に記載の音声コーディングシステムであって、前記位相スメアリングフィルタリング手段は、前記周波数ドメイン中でほぼ一定の振幅特性及び変化する位相特性の両方を持つフィルタを有することを特徴とする音声コーディングシステム。
- 請求項2又は3に記載の音声コーディングシステムであって、前記前処理器中で前記フィルタリング手段及び前記ワーピング手段は順に結合されていることを特徴とする音声コーディングシステム。
- 請求項2、3又は4に記載の音声コーディングシステムであって、前記後処理器中で前記逆ワーピング手段及び前記逆フィルタリング手段は順に結合されていることを特徴とする音声コーディングシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP01201301 | 2001-04-09 | ||
PCT/IB2002/001009 WO2002082426A1 (en) | 2001-04-09 | 2002-03-27 | Adpcm speech coding system with phase-smearing and phase-desmearing filters |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004519736A true JP2004519736A (ja) | 2004-07-02 |
Family
ID=8180123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002580311A Pending JP2004519736A (ja) | 2001-04-09 | 2002-03-27 | 位相スメアリング及び位相デスメアリングフィルタを有するadpcm音声コーディングシステム |
Country Status (9)
Country | Link |
---|---|
US (1) | US20020173949A1 (ja) |
EP (1) | EP1395982B1 (ja) |
JP (1) | JP2004519736A (ja) |
KR (1) | KR20030009517A (ja) |
CN (1) | CN1221941C (ja) |
AT (1) | ATE323935T1 (ja) |
DE (1) | DE60210766T2 (ja) |
ES (1) | ES2261637T3 (ja) |
WO (1) | WO2002082426A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI226035B (en) * | 2003-10-16 | 2005-01-01 | Elan Microelectronics Corp | Method and system improving step adaptation of ADPCM voice coding |
AU2006208529B2 (en) | 2005-01-31 | 2010-10-28 | Microsoft Technology Licensing, Llc | Method for weighted overlap-add |
TWI285568B (en) * | 2005-02-02 | 2007-08-21 | Dowa Mining Co | Powder of silver particles and process |
JP2009501353A (ja) * | 2005-07-14 | 2009-01-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号合成 |
KR101356972B1 (ko) | 2009-04-08 | 2014-02-05 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 위상값 평활화를 이용하여 다운믹스 오디오 신호를 업믹스하는 장치, 방법 및 컴퓨터 프로그램 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5558612A (en) * | 1978-10-26 | 1980-05-01 | Kokusai Denshin Denwa Co Ltd <Kdd> | Delay circuit |
JPS587935A (ja) * | 1981-07-07 | 1983-01-17 | Kokusai Denshin Denwa Co Ltd <Kdd> | トランスバーサル形スミアデスミアフイルタ |
NL8700075A (nl) * | 1987-01-14 | 1988-08-01 | Philips Nv | Datatransmissiestelsel voorzien van versmeringsfilters. |
US5231484A (en) * | 1991-11-08 | 1993-07-27 | International Business Machines Corporation | Motion video compression system with adaptive bit allocation and quantization |
US5511095A (en) * | 1992-04-15 | 1996-04-23 | Sanyo Electric Co., Ltd. | Audio signal coding and decoding device |
US5754974A (en) * | 1995-02-22 | 1998-05-19 | Digital Voice Systems, Inc | Spectral magnitude representation for multi-band excitation speech coders |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
AU3372199A (en) * | 1998-03-30 | 1999-10-18 | Voxware, Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
-
2002
- 2002-03-27 DE DE60210766T patent/DE60210766T2/de not_active Expired - Lifetime
- 2002-03-27 KR KR1020027016633A patent/KR20030009517A/ko active IP Right Grant
- 2002-03-27 ES ES02708594T patent/ES2261637T3/es not_active Expired - Lifetime
- 2002-03-27 AT AT02708594T patent/ATE323935T1/de not_active IP Right Cessation
- 2002-03-27 EP EP02708594A patent/EP1395982B1/en not_active Expired - Lifetime
- 2002-03-27 CN CNB028011287A patent/CN1221941C/zh not_active Expired - Fee Related
- 2002-03-27 JP JP2002580311A patent/JP2004519736A/ja active Pending
- 2002-03-27 WO PCT/IB2002/001009 patent/WO2002082426A1/en active IP Right Grant
- 2002-04-04 US US10/116,600 patent/US20020173949A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
KR20030009517A (ko) | 2003-01-29 |
EP1395982A1 (en) | 2004-03-10 |
US20020173949A1 (en) | 2002-11-21 |
WO2002082426A1 (en) | 2002-10-17 |
DE60210766T2 (de) | 2007-02-08 |
CN1221941C (zh) | 2005-10-05 |
CN1461469A (zh) | 2003-12-10 |
ES2261637T3 (es) | 2006-11-16 |
DE60210766D1 (de) | 2006-05-24 |
ATE323935T1 (de) | 2006-05-15 |
EP1395982B1 (en) | 2006-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4824734B2 (ja) | 減衰率を取得する方法および装置 | |
JP6336086B2 (ja) | 適合的帯域幅拡張およびそのための装置 | |
US6496795B1 (en) | Modulated complex lapped transform for integrated signal enhancement and coding | |
RU2419171C2 (ru) | Способ переключения скорости передачи битов при аудиодекодировании с масштабированием скорости передачи битов и масштабированием полосы пропускания | |
EP1046153B1 (en) | A system and method for encoding voice while suppressing acoustic background noise | |
US9020813B2 (en) | Speech enhancement system and method | |
TW416044B (en) | Adaptive filter and filtering method for low bit rate coding | |
EP1451811B1 (en) | Low bit rate codec | |
KR20050004897A (ko) | 디코딩된 음성의 피치 증대를 위한 방법 및 장치 | |
US20110054889A1 (en) | Enhancing Receiver Intelligibility in Voice Communication Devices | |
JP2015522847A (ja) | デジタル音声信号における効果的なプレエコー減衰 | |
CN113140225A (zh) | 语音信号处理方法、装置、电子设备及存储介质 | |
US20030065507A1 (en) | Network unit and a method for modifying a digital signal in the coded domain | |
CA2244008A1 (en) | Nonlinear filter for noise suppression in linear prediction speech pr0cessing devices | |
JP2003533902A5 (ja) | ||
EP1109154B1 (en) | Linear predictive coding based acoustic echo cancellation | |
WO2001003316A1 (en) | Coded domain echo control | |
JP2009512895A (ja) | スペクトル・ダイナミックスに基づく信号コーディング及びデコーディング | |
WO1998006090A1 (en) | Speech/audio coding with non-linear spectral-amplitude transformation | |
JP2004519736A (ja) | 位相スメアリング及び位相デスメアリングフィルタを有するadpcm音声コーディングシステム | |
EP1103953A2 (en) | Method for concealing erased speech frames | |
EP1521240A1 (en) | Speech coding method applying echo cancellation by modifying the codebook gain | |
JP6718670B2 (ja) | Adpcmコーデックでのパケット損失隠蔽方法及びplc回路を備えるadpcm復号器 | |
EP1944761A1 (en) | Disturbance reduction in digital signal processing | |
JP2016105168A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20041118 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050325 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20070323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070605 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070905 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070912 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20071003 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20071011 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20071205 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20080424 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081118 |