JP2004513399A - 知覚品質を高める電話スピーチの広帯域拡張 - Google Patents
知覚品質を高める電話スピーチの広帯域拡張 Download PDFInfo
- Publication number
- JP2004513399A JP2004513399A JP2002541669A JP2002541669A JP2004513399A JP 2004513399 A JP2004513399 A JP 2004513399A JP 2002541669 A JP2002541669 A JP 2002541669A JP 2002541669 A JP2002541669 A JP 2002541669A JP 2004513399 A JP2004513399 A JP 2004513399A
- Authority
- JP
- Japan
- Prior art keywords
- speech signal
- lsf
- input
- frequency range
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000011159 matrix material Substances 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 15
- 230000003595 spectral effect Effects 0.000 claims description 30
- 238000001228 spectrum Methods 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 6
- 238000001914 filtration Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 abstract description 13
- 238000003786 synthesis reaction Methods 0.000 abstract description 13
- 238000012545 processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
本発明は、ある周波数範囲を有する狭帯域スピーチ信号の線スペクトル周波数を、高域周波数範囲及び狭帯域スピーチ信号の周波数範囲を含む広帯域スピーチ信号の線スペクトル周波数に拡張する方法と、入力におけるスピーチ信号の周波数範囲を拡張するシステムとに関する。本発明のシステムは、出力と、システムの入力に接続されるアップサンプラと、線形予測係数及び反射係数を決定する入力分析手段とを含み、入力分析手段の入力はシステムの入力に接続され、アップサンプラは、第1のフィルタの入力に接続される出力を含み、第1のフィルタは出力を含み、線形予測係数に基づいてフィルタリングを行うよう構成され、第1のフィルタの出力は、出力を含む第2のフィルタの入力に接続される出力を有するスペクトル折り重ね手段の入力に接続され、第2のフィルタは線形予測係数に基づいてフィルタリングを行うよう構成され、第2のフィルタの出力はシステムの出力に接続されてスピーチ信号の周波数範囲を拡張する。
【0002】
このような方法及びシステムは、Peter Jax及びPeter Varyによる出版物「wideband extension of telephone speech using a hidden Markov model」(IEEE Workshop on Speech coding, September 2000, Wisconsin)から公知である。ここでは、狭帯域入力信号は、有限数のスピーチ音声に分類され、広帯域スペクトル包絡についての情報が、予め訓練された符号帳から得られる。符号帳探索アルゴリズムには、隠れマルコフモデルに基づいた統計学的なアプローチが使用される。隠れマルコムモデルは、帯域幅が制限されたスピーチの異なる特徴を考慮に入れ、平均2乗誤差の基準を小さくする。このアルゴリズムは、1つの広帯域符号帳しか必要でなく、本質的に、狭帯域周波数範囲におけるシステムのトランスペアレンシーを保証する。エンハンスされたスピーチは、入力スピーチよりかなり大きい帯域幅を有する。このアルゴリズムは、符号帳LPC係数を、第1のフィルタ、即ち、逆フィルタに適用することによって広帯域信号全体を形成する。第1のフィルタは入力信号に作用し、フィルタリングされ、且つ、次に、スペクトル的に折り重ねられた信号を、第2のフィルタ、即ち、合成フィルタに供給する。この合成フィルタも符号帳LPC係数を受信し、広帯域信号を出力に供給する。これらの2つのフィルタの伝達関数は互いに逆なので、狭帯域信号はシステムによってトランスペアレントに処理される。
【0003】
この広帯域拡張方法は、第1のフィルタによって供給されるフィルタリングされた信号は、スペクトル的に折り重ねられた後で、高域スピーチ信号を形成するよう第2のフィルタに最適な信号を供給するのに十分に平坦ではないという不利点を有する。
【0004】
本発明は、スペクトル的に折り重ねられた後で、逆フィルタに最適な信号が供給される、狭帯域スピーチ信号を広帯域スピーチ信号に拡張する方法を提供することを目的とする。
【0005】
本発明は、以下の段階を適用することによって上述した目的を達成する。
【0006】
狭帯域スピーチ信号の周波数範囲において広帯域スピーチ信号の線スペクトル周波数に向かうよう訓練することによって得られるマトリクスを適用することによって、広帯域スピーチ信号の拡張された周波数範囲の線スペクトル周波数を得る段階と、
狭帯域スピーチ信号の線スペクトル周波数を、狭帯域スピーチ信号の周波数範囲における広帯域スピーチ信号の線スペクトル周波数にマッピングする段階と、
高域周波数範囲の線スペクトル周波数を、狭帯域スピーチ信号の線スペクトル周波数に組み合わせる段階。
【0007】
このようにすると、狭帯域スピーチ信号のLSFは、処理されることなく、広帯域スピーチ信号の等価の低域LSFに直接マッピングされ、一方、広帯域信号の高域周波数範囲は、狭帯域スピーチ信号のLSFにマトリクスを適用することによって形成される。高域LSFのマッピングが低域LSFに影響を及ぼさないので、最適に平坦な信号が第1のフィルタから得られる。スペクトル的に折り重ねられた後に、折り重ねられた信号のスペクトルは平坦なままであり、合成フィルタに最適な入力信号を供給する。
【0008】
高域LSFを得る1つの方法は、狭帯域スピーチ信号の周波数範囲において広帯域スピーチ信号の線スペクトル周波数に向かうよう訓練することによって得られるマトリクスを適用することである。更に、独立した処理によって、高域信号の合成を更に最適化するよう多数のマトリクスを使用することが可能である。
【0009】
線スペクトル周波数は、LPC分析フィルタのインパルス応答を偶関数及び奇関数に分解することによって得られる。この拡張技術では、LSFは入力された狭帯域信号から推定される。LSFは、8kHzでサンプリングされる狭帯域スピーチ信号の4kHzの帯域幅において0乃至πに配置される。対応する広帯域スピーチが、狭帯域LPCモデルの2倍のオーダを有するLPCモデルを使用してモデル化されると仮定すると、狭帯域LSFは、広帯域LSFの低域範囲0乃至π/2を表す。従って、広帯域スピーチ信号の低域LSFは、2で除算される狭帯域LSFとして与えられる。
【0010】
上述したように狭帯域スピーチから得られる低域LSFを合成に使用し、高域LSFは対応する広帯域スピーチから得られる、広帯域スピーチのシミュレーションにおいて、非常に良好な出力品質が得られる。
【0011】
高域LSFは、マトリクスを使用して低域LSFから得ることができる。マトリクスは訓練によって得られ、且つ、1回だけ設定されればよい。幾つかのマトリクスを得ることも可能であり、各マトリクスは、処理される信号のタイプに特定のものである。このようなマトリクスが得られると、広帯域LPC係数は以下のように得られる。
【0012】
まず、狭帯域スピーチ信号の線形予測及び反射係数が推定される。次に、LSFがこの線形予測から計算される。LSFは2つに分割され、アレイアペンダ及び高域LSF推定器に直接供給される。高域LSF推定器は、1組のマトリクスから選択される1つのマトリクスを分割されたLSFに適用する。マトリクスの選択は、処理されている信号のタイプに基づいている。
【0013】
選択されたマトリクスを分割されたLSFに適用する結果、1組の高域LSFが得られる。高域LSFは次に、アレイアペンダに供給される。アレイアペンダは、高域LSFを低域LSFに付加して、広帯域LSFを形成する。広帯域LSFの結果としてのアレイは、広帯域LPCを算出することを可能にし、この広帯域LPCは、Jaxによって開示されるようなシステムにおいて広帯域スピーチ信号の合成に使用される。LSF及びLPC係数は、スピーチ信号の周波数範囲を拡張する様々な方法及びシステムの基礎を形成し、そのスピーチシステムの知覚品質を改善する。従って、本発明に説明するように、狭帯域LSF及びLPC係数の広帯域LSF及びLPC係数への拡張は、スピーチ信号の周波数範囲を拡張する他のシステムにも使用することができる。
【0014】
スピーチ信号の周波数範囲の拡張は、チャネルリソースが節約されるべきであり、スピーチは狭い帯域幅で送信されるシステムの受信端末に使用される。システムの例としては、移動電話機、ビデオ会議端末、及び、インターネット電話端末が挙げられる。
【0015】
本発明を、以下の図面に基づいて説明する。
【0016】
図1は、周波数拡張のためのシステムのセクションを示し、ここで、広帯域LSFが決定される。このシステムのセクションは、入力分析手段3の入力19を介し、狭帯域スピーチ信号を受信する。入力分析手段3によって、狭帯域スピーチ信号に基づいて、線形予測及び反射係数が決定される。入力分析手段3は、線形予測係数を、接続21を介し線スペクトル周波数推定器5に供給する。線スペクトル推定器は、線スペクトル周波数LSFを乗算器7に供給する。乗算器7では、LSFは0.5を乗ずることによって2つに分けられる。乗算器7は分割されたLSFを出力に供給する。分割されたLSFは、アレイアペンダ11及び高域LSF推定器9の両方に供給される。高域LSF推定器9は、乗算器7から受信した分割されたLSFにマトリクスを適用することによって高域LSFを推定する。使用するマトリクスを決定するには、マトリクスセレクタ15は入力29を介して、受信した狭帯域スピーチ信号に関する情報を受信し、マトリクスリスト17から1つのマトリクスを選択する。マトリクスセレクタ15が受信する、受信した狭帯域スピーチ信号に関する情報とは、反射係数k1及びk2である。入力分析手段は、これらの反射係数k1及びk2を、LPC係数を決定するときと同時に得る。従って、反射係数k1及びk2は、狭帯域スピーチ信号に基づいている。高域LSF推定器9は、推定した高域LSFをアレイアペンダ11に供給し、ここでは、高域LSFは低域LSFに付加される。狭帯域、即ち、低域LSF及び高域LSFが付加されると、結果として得られるLSFは広帯域LSFである。この広帯域LSFは、アレイアペンダ11によって線形予測決定器13に供給され、ここでは、広帯域LPC係数が、スピーチ符号化の分野では標準的な方法を使用して決定される。広帯域LPC係数は次に出力37に供給されて、図4に説明するように、逆フィルタ、合成フィルタ、及び、スペクトルの折り重ねによって、合成を介し広帯域スピーチ信号を形成するよう一般的な方法で使用される。
【0017】
入力分析手段3によって供給される全ての反射係数のうち最初の2つの反射係数k1及びk2は、スピーチ信号を分類するのに使用される。反射係数k1及びk2がどの反射係数のクラスタに関連付けられるか決定することによって分類される。マトリクスセレクタ15による、例えば、ベイズ探索(bayesian search)といった探索に基づいて、マトリクスMが、所定のマトリクスからなるマトリクスリスト17から選択される。所定のマトリクスは、狭帯域スピーチ信号の周波数範囲において広帯域スピーチ信号の線スペクトル周波数に向かうよう訓練することにより得られる。
【0018】
マトリクスセレクタ15は、選択されたマトリクスか、どのマトリクスが選択されたかを指示する情報を、図1に示す高域LSF推定器9に供給する。反射係数k1及びk2、又は、どのマトリクスが選択されるかに関する情報は、スピーチコーダから得て、スピーチコーダをスピーチデコーダに接続するチャネルを介しスピーチデコーダに送信されることも可能である。この場合、情報は、計算されることなく高域LSF推定器に直接供給されうる。正確な実施には、周波数拡張システムが、デコーダの一部であり、スピーチデコーダによって受信される符号化スピーチデータにアクセスすることができるか、又は、狭帯域スピーチ信号を処理するスタンドアロン式のシステムであるか否かに依存する。スタンドアロン式システムである場合、全ての必要なパラメータ、即ち、LPC、LSF、k1、k2は、システム自体によって決められなければならない。システムがスピーチデコーダの一部である場合、パラメータはデコーダから直接得られるか又は受信した符号化スピーチ信号中に含まれる。
【0019】
図2は、広帯域LPC係数に基づいて反射係数クラスタk1及びk2を決定するシステムを示す。図1に示す入力分析手段3から得られる狭帯域スピーチLPC係数は、線スペクトル周波数推定器51に供給される。結果として得られるLSFは、乗算器53によってLSFに0.5を乗じることによって2つに分割される。従って、結果として得られるLSFは広帯域LSFである。これらの分割されたLSFに基づいて、LPC推定器55によって広帯域線形予測係数が計算される。LPC係数は、反射係数推定器57によって使用され、広帯域反射係数が計算される。反射係数推定器57によって供給される全ての反射係数のうち最初の2つの反射係数k1及びk2は、スピーチ信号を分類するのに使用される。マトリクスセレクタ59による、例えば、ベイズ探索といった探索に基づいて、所定のマトリクスからなるマトリクスリスト61から1つのマトリクスMが選択される。所定のマトリクスは、狭帯域スピーチ信号の周波数範囲において広帯域スピーチ信号の線スペクトル周波数に向かうよう訓練することによって得られる。
【0020】
マトリクスセレクタ59は選択されたマトリクスか、又は、どのマトリクスが選択されたかを指示する情報のいずれかを、図1に示す高域LSF推定器9に供給する。広帯域反射係数k1及びk2、又は、どのマトリクスが選択されるべきかについての情報は、スピーチコーダから得て、スピーチコーダとスピーチデコーダを接続するチャネルを介しスピーチデコーダに送信されることも可能である。この場合、情報は、計算されることなく、高域LSF推定器に直接供給されうる。正確な実施には、周波数拡張システムが、デコーダの一部であり、スピーチデコーダによって受信される符号化スピーチデータにアクセスすることができるか、又は、狭帯域スピーチ信号を処理するスタンドアロン式のシステムであるか否かに依存する。スタンドアロン式システムである場合、全ての必要なパラメータ、即ち、LPC、LSF、k1、k2は、システム自体によって決められなければならない。システムがスピーチデコーダの一部である場合、パラメータはデコーダから直接得られるか又は受信した符号化スピーチ信号中に含まれる。
【0021】
図3は、反射係数クラスタk1及びk2に対応する振幅スペクトル包絡形状を示す。振幅スペクトル包絡形状の有限の組があり、各形状は互いから異なり、それにより、高域スピーチ信号をモデル化することが可能となる。各形状は、特定のマトリクス(M1、M2、M3、M4)に対応し、従って、特定の反射係数クラスタk1及びk2に対応する。マトリクスは、この反射係数k1及びk2に基づいて選択される。
【0022】
図4は、スピーチ信号の周波数範囲を拡張するシステムの全体図である。
【0023】
図4に示すスピーチ信号の周波数範囲を拡張するシステムは、入力において狭帯域スピーチ信号を受信し、受信した信号をアップサンプラ71及び入力分析手段6に供給する。入力分析手段6は、図1に示す入力分析手段3及びLSF決定器5の組合せに相当する。入力分析手段6から広帯域LPC推定器13のセクションは、図1に示すサブシステムに相当する。図4中の高域LSF推定器9によって使用されるべきマトリクスの決定は、図1又は図2で説明したのと同様の方法で達成される。図4は、図1の実施例を含む。図1及び図4の対応する構成要素は、同一の参照符号を有する。
【0024】
アップサンプラ71は、アップサンプリングされた信号を第1のフィルタに供給する。第1のフィルタは、アップサンプリングされた信号にフィルタリングを施す。第1のフィルタは、線形予測決定器13によって供給される広帯域LPCパラメータを使用する。広帯域LPCパラメータは、図1で説明したのと同様の方法で得られる。
【0025】
第1のフィルタ、即ち、逆フィルタは、フィルタリングされた信号をスペクトル的に折り重ねる折り重ね(spectral folding)手段85に供給する。スペクトル折り重ね手段では、フィルタリングされた信号の周波数範囲がスペクトル的な折り重ねによって拡張される。フィルタリングされ、且つ、スペクトル的に折り重ねられた信号は合成フィルタ87に使用され、広帯域LPC係数を使用しながら広帯域出力信号を生成するので、逆フィルタの出力におけるフィルタリングされた信号はスペクトル的に平坦であり、スペクトル折り重ねの後、及び、合成フィルタ87によってフィルタリングされる前に、フィルタリング信号の高域部がスペクトル的に平坦のままであることを保証することが重要である。0.5が乗算された後に、低域LSFを直接逆フィルタ81に供給することによって、合成フィルタ87には最適な信号が供給されることができ、その結果、広帯域信号における最適な高域信号が得られる。合成フィルタ87は、第1のフィルタと同一のLPC係数を使用して、フィルタリングされ且つスペクトル的に折り重ねられた信号にフィルタリングを施し、システムの出力に、拡張された周波数範囲を有する出力信号を供給する。
【図面の簡単な説明】
【図1】
本発明のスピーチデコーダを示す図である。
【図2】
広帯域LPC係数から得られる反射係数の分類を決定するシステムを示す図である。
【図3】
反射係数クラスタ(k1、k2)に対応する振幅スペクトル包絡形状を示す図である。
【図4】
スピーチ信号の周波数範囲を拡張するシステム全体を示す図である。
Claims (9)
- ある周波数範囲を有する狭帯域スピーチ信号の線スペクトル周波数を、高域周波数範囲と上記狭帯域スピーチ信号の上記ある周波数範囲とを含む広帯域スピーチ信号の線スペクトル周波数に拡張する方法であって、
上記狭帯域スピーチ信号の上記ある周波数範囲、即ち、上記狭帯域スピーチ信号の上記線スペクトル周波数において広帯域スピーチ信号の線スペクトル周波数に向かうよう訓練することによって得られるマトリクスを適用することによって、上記広帯域スピーチ信号の上記高域周波数範囲の線スペクトル周波数を得る段階と、
上記狭帯域スピーチ信号の上記線スペクトル周波数を、上記狭帯域スピーチ信号の上記ある周波数範囲における上記広帯域スピーチ信号の線スペクトル周波数にマッピングする段階と、
上記高域周波数範囲の上記線スペクトル周波数を、上記狭帯域スピーチ信号の上記線スペクトル周波数に組み合わせる段階とを含む方法。 - 上記マトリクスは、上記狭帯域スピーチ信号から得られる反射係数に基づいて、所定のマトリクスからなるリストから選択されることを特徴とする請求項1記載の狭帯域スピーチ信号の線スペクトル周波数を拡張する方法。
- 上記マトリクスは、広帯域線形予測係数から得られる反射係数に基づいて、所定のマトリクスからなるリストから選択されることを特徴とする請求項1記載の狭帯域スピーチ信号の線スペクトル周波数を拡張する方法。
- 入力におけるスピーチ信号の周波数範囲を拡張するシステムであって、
出力と、上記システムの上記入力に接続されるアップサンプラと、線形予測係数及び反射係数を決定する入力分析手段とを含み、
上記入力分析手段の入力は、上記システムの上記入力に接続され、
上記アップサンプラは、第1のフィルタの入力に接続される出力を含み、
上記第1のフィルタは出力を含み、線形予測係数に基づいてフィルタリングを行うよう構成され、
上記第1のフィルタの上記出力は、出力を含む第2のフィルタの入力に接続される出力を有するスペクトル折り重ね手段の入力に接続され、
上記第2のフィルタは、上記線形予測係数に基づいてフィルタリングを行うよう構成され、
上記第2のフィルタの上記出力は、上記システムの上記出力に接続されてスピーチ信号の周波数範囲を拡張するシステムであって、
上記入力分析手段の上記入力における上記スピーチ信号の線スペクトル周波数を供給可能な上記入力分析手段の出力は、乗算器の入力に接続され、
上記乗算器は、上記スピーチ信号の上記線スペクトル周波数を2で乗算し、上記2で乗算された線スペクトル周波数を、アレイアペンダ及び高域LSF推定器に供給し、
上記アレイアペンダは、上記高域LSF推定器によって供給される高域LSFを、上記2で乗算された上記線スペクトル周波数に付加し、
上記アレイアペンダは、上記第1のフィルタ及び上記第2のフィルタに線形予測係数を供給する出力を含む線形予測係数決定器の入力に接続される出力を有することを特徴とするシステム。 - 上記高域LSF推定器は、上記2で乗算された線スペクトル周波数にマトリクスを適用することによって上記高域LSFを決定するよう構成されることを特徴とする請求項4記載のスピーチ信号の周波数範囲を拡張するシステム。
- 上記システムは、所定のマトリクスからなるリストから上記マトリクスを選択できることを特徴とする請求項5記載のスピーチ信号の周波数範囲を拡張する方法。
- 上記システムは、上記狭帯域スピーチ信号から得られる反射係数に基づいて、上記マトリクスを選択することを特徴とする請求項6記載のスピーチ信号の周波数範囲を拡張するシステム。
- 上記システムは、広帯域LPC係数から得られる反射係数に基づいて、上記マトリクスを選択することを特徴とする請求項7記載のスピーチ信号の周波数範囲を拡張するシステム。
- 請求項4記載のスピーチ信号の周波数範囲を拡張するシステムを有する移動電話機。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00203937 | 2000-11-09 | ||
PCT/EP2001/013137 WO2002039430A1 (en) | 2000-11-09 | 2001-11-09 | Wideband extension of telephone speech for higher perceptual quality |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004513399A true JP2004513399A (ja) | 2004-04-30 |
JP2004513399A5 JP2004513399A5 (ja) | 2009-06-18 |
Family
ID=8172246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002541669A Pending JP2004513399A (ja) | 2000-11-09 | 2001-11-09 | 知覚品質を高める電話スピーチの広帯域拡張 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7346499B2 (ja) |
EP (1) | EP1336175A1 (ja) |
JP (1) | JP2004513399A (ja) |
KR (1) | KR100865860B1 (ja) |
CN (1) | CN1216368C (ja) |
WO (1) | WO2002039430A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013508783A (ja) * | 2009-10-23 | 2013-03-07 | クゥアルコム・インコーポレイテッド | 狭帯域信号から「より上の帯域」の信号を決定すること |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
KR20060090995A (ko) * | 2003-10-23 | 2006-08-17 | 마쓰시다 일렉트릭 인더스트리얼 컴패니 리미티드 | 스펙트럼 부호화 장치, 스펙트럼 복호화 장치, 음향 신호송신 장치, 음향 신호 수신장치 및 이들의 방법 |
DE602006012637D1 (de) * | 2005-04-01 | 2010-04-15 | Qualcomm Inc | Vorrichtung und Verfahren für die Teilband-Sprachkodierung |
TR201821299T4 (tr) * | 2005-04-22 | 2019-01-21 | Qualcomm Inc | Kazanç faktörü yumuşatma için sistemler, yöntemler ve aparat. |
US7944995B2 (en) * | 2005-11-14 | 2011-05-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Variable bandwidth receiver |
EP1970900A1 (en) * | 2007-03-14 | 2008-09-17 | Harman Becker Automotive Systems GmbH | Method and apparatus for providing a codebook for bandwidth extension of an acoustic signal |
KR101221918B1 (ko) * | 2007-11-21 | 2013-01-15 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
US9947340B2 (en) | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
EP2559026A1 (en) * | 2010-04-12 | 2013-02-20 | Freescale Semiconductor, Inc. | Audio communication device, method for outputting an audio signal, and communication system |
CN102610231B (zh) * | 2011-01-24 | 2013-10-09 | 华为技术有限公司 | 一种带宽扩展方法及装置 |
PL3040988T3 (pl) | 2011-11-02 | 2018-03-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Dekodowanie audio w oparciu o wydajną reprezentację współczynników autoregresji |
KR102271852B1 (ko) * | 2013-11-02 | 2021-07-01 | 삼성전자주식회사 | 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3189598B2 (ja) * | 1994-10-28 | 2001-07-16 | 松下電器産業株式会社 | 信号合成方法および信号合成装置 |
DE69619284T3 (de) * | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
FR2742568B1 (fr) * | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
EP0994464A1 (fr) * | 1998-10-13 | 2000-04-19 | Koninklijke Philips Electronics N.V. | Procédé destiné à génére un signal large bande a partir d'un signal en bande étroite, appareil pour realiser un tel procédé et equipement téléphonique comportant un tel appareil |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
-
2001
- 2001-11-09 JP JP2002541669A patent/JP2004513399A/ja active Pending
- 2001-11-09 US US10/169,497 patent/US7346499B2/en not_active Expired - Fee Related
- 2001-11-09 KR KR1020027008816A patent/KR100865860B1/ko not_active IP Right Cessation
- 2001-11-09 CN CN018061702A patent/CN1216368C/zh not_active Expired - Fee Related
- 2001-11-09 EP EP01983583A patent/EP1336175A1/en not_active Withdrawn
- 2001-11-09 WO PCT/EP2001/013137 patent/WO2002039430A1/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013508783A (ja) * | 2009-10-23 | 2013-03-07 | クゥアルコム・インコーポレイテッド | 狭帯域信号から「より上の帯域」の信号を決定すること |
Also Published As
Publication number | Publication date |
---|---|
EP1336175A1 (en) | 2003-08-20 |
US7346499B2 (en) | 2008-03-18 |
CN1216368C (zh) | 2005-08-24 |
CN1416563A (zh) | 2003-05-07 |
KR20020071929A (ko) | 2002-09-13 |
KR100865860B1 (ko) | 2008-10-29 |
US20020193988A1 (en) | 2002-12-19 |
WO2002039430A1 (en) | 2002-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7359854B2 (en) | Bandwidth extension of acoustic signals | |
KR101214684B1 (ko) | 대역폭 확장 시스템에서 고-대역 에너지를 추정하기 위한 방법 및 장치 | |
JP5551258B2 (ja) | 狭帯域信号から「より上の帯域」の信号を決定すること | |
RU2674922C1 (ru) | Декодер речи, кодер речи, способ декодирования речи, способ кодирования речи, программа декодирования речи и программа кодирования речи | |
JP2779886B2 (ja) | 広帯域音声信号復元方法 | |
JP5714180B2 (ja) | パラメトリックオーディオコーディング方式の鑑識検出 | |
US20070005351A1 (en) | Method and system for bandwidth expansion for voice communications | |
JP2004513399A (ja) | 知覚品質を高める電話スピーチの広帯域拡張 | |
KR20120055746A (ko) | 오디오 신호의 대역폭 확장 방법 및 장치 | |
JP2006323388A (ja) | 低帯域音響信号から広帯域音響信号を構築する方法 | |
WO2005117517A2 (en) | Neuroevolution-based artificial bandwidth expansion of telephone band speech | |
JPH09101798A (ja) | 音声帯域拡大方法および音声帯域拡大装置 | |
CN110556121B (zh) | 频带扩展方法、装置、电子设备及计算机可读存储介质 | |
Kornagel | Techniques for artificial bandwidth extension of telephone speech | |
Qian et al. | Combining equalization and estimation for bandwidth extension of narrowband speech | |
Xiong et al. | Spectro-Temporal SubNet for Real-Time Monaural Speech Denoising and Dereverberation. | |
JP3230782B2 (ja) | 広帯域音声信号復元方法 | |
Soon et al. | Bandwidth extension of narrowband speech using cepstral analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20041108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070703 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20070919 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20070927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071225 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090106 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20090330 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20090508 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20100108 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100729 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100803 |