JP2003514263A - マッピング・マトリックスを用いた広帯域音声合成 - Google Patents

マッピング・マトリックスを用いた広帯域音声合成

Info

Publication number
JP2003514263A
JP2003514263A JP2001537049A JP2001537049A JP2003514263A JP 2003514263 A JP2003514263 A JP 2003514263A JP 2001537049 A JP2001537049 A JP 2001537049A JP 2001537049 A JP2001537049 A JP 2001537049A JP 2003514263 A JP2003514263 A JP 2003514263A
Authority
JP
Japan
Prior art keywords
signal
voice
received
characteristic
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001537049A
Other languages
English (en)
Inventor
ミエ,ジル
ジェリット,アンディ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philips Electronics NV filed Critical Philips Electronics NV
Publication of JP2003514263A publication Critical patent/JP2003514263A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 本発明は、拡張帯域音声信号(100〜3,400Hz)を得るために、電話帯域(若しくは狭帯域:300〜3,400Hz)音声信号から、広帯域信号(100〜7,000Hz)を生成するシステムを説明する。この技術は、信号の自然さと聞いた時の快適さを、現在のすべての電話システムとの互換性を維持しながら増加させるという利点を特に有する。説明される技術は、線形予測音声コーダについて着想された。このようにして、この音声信号は、スペクトラム包絡信号と短期残存信号とに分割される。両信号は、個別に拡張され、拡張帯域信号を作成するために再結合される。

Description

【発明の詳細な説明】
【0001】 (発明の属する技術分野) 本発明は、ディジタル通信システムに係り、特に、受信端において、例えば電
話帯域(300〜3,400Hz)などの狭帯域において受信された音声信号を
、(例えば100〜7,000Hzの)広帯域における拡張音声信号に拡張する
ことを可能にするシステムに関する。
【0002】 (背景) 現在のほとんどの通信システムは、300〜3,400Hzに制限された音声
帯域幅を送信する。これは電話会話には十分であるが、自然の音声帯域幅はより
広い(100〜7,000Hz)。実際、低帯域(100〜300Hz)及び高
帯域(3,400〜7,000Hz)は、聞き心地及び音声の自然さにとって重
要であると共に、話し手の声をより良く認識するのにも重要である。これらの周
波数帯域の電話受信器における再生成は、通信システムにおける音声品質を著し
く向上させることを可能にする。その上、携帯電話が用いられている時、電話会
話中、音声がしばしば特に背景雑音によって邪魔される。更に、電話網は、交換
台によって演奏される音楽を送信し得る。よって、低帯域及び高帯域を生成する
システムは、音声に可能な限りフィットさせるべきであると共に、雑音を減らし
、音楽主体品質を向上させることを可能にするべきである。
【0003】 米国特許第5,581,652号は、低周波数に向けた音声信号のスペクトラ
ム包絡を拡張するコード・ブック・マッピング方法を説明している。この方法に
よれば、低帯域合成フィルタ係数は、Y.Linde、A.Buzo、R.M.
Gray:「An algorithm for Vector Quanti
zer Design」、IEEE Transactions on Com
munications、Vol. COM−28、No 1、 1980年1
月、による記事に説明されているベクトル量子化を用いるトレーニング手順のお
かげで、狭帯域分析フィルタ係数から生成される。このトレーニング手順は、2
つの異なるコード・ブック:拡張周波数帯域用の拡張版及び狭帯域用の狭い版、
を計算することができる。前記狭いコード・ブックは、ベクトル量子化を用いて
、拡張コード・ブックから計算され、拡張コード・ブックの各ベクトルは、狭帯
域コード・ブックのベクトルにリンクされている。次いで、低帯域合成フィルタ
の係数は、これらコード・ブックから計算される。
【0004】 しかし、この方法は、ガチャガチャという背景音の生成に原因となるいくつか
の欠点を提供する。第一に、複数の合成フィルタ形状は、コード・ブックのサイ
ズに対して制限される。第二に、拡張帯域における抽出ベクトルは、狭帯域音声
信号の線形予測から得られるベクトルと相互相関を全く持たない。こうして、受
信端における信号品質を向上させるために、拡張マトリックスと呼ばれる別の方
法が開発された。
【0005】 (発明の開示) 本発明の目的は、信号の自然さ及びより良い信号品質をもたらす聞き心地を向
上させるために、受信端において、狭帯域音声信号をより広い帯域音声信号に拡
張する方法を提供することである。
【0006】 本発明によれば、受信音声信号は、該信号に拡張マトリックスが適用される前
に、特定の音声特性について検知される。前記拡張マトリックスは、前記検知さ
れた特性に応じた係数を有する。
【0007】 本発明の好ましい実施形態において、発声と呼ばれる前記特定の特性は、受信
音声信号における有声音/無声音の検知された存在に関する。これは、1995
にElsevierによって発行された、W.B.Kleijn及びK.K.P
aliwalによるマニュアル「Speech Coding and Syn
thesis」において説明されているものなどの既知の方法によって検知され
得る。次いで、該マトリックスは、βベースから計算される。前記データベース
は、C.L.Lawson及びR.J.Hansonによって、マニュアル「S
olving Least Squares Problems」、Prent
ice−Hall、1974、において説明されている線形予測コーディング(
LPC)パラメータに基づく最小二乗誤り基準に基づくアルゴリズム、又は、A
cademic Press、Londonによって1981年に発行された、
P.E.Gill及びW.Murray及びM.H.Wrightによる、「P
ractical Optimization」において説明されている制約最
小二乗方法に基づくアルゴリズム、を適用することによって、検知された発声に
ついて分割される。
【0008】 (発明の実施の形態) 本発明及び本発明を実施するのに選択的に用いられ得る追加機能は、以下に説
明される図面を参照することで明らかにされる。
【0009】 図1は、本発明に係るシステムの一例を示す。このシステムは、携帯電話シス
テムであり、送信媒体3を通じて音声信号を通信し得る、少なくとも1つの送信
部分1(例えば、基地局)と、少なくとも1つの受信部分2(例えば、携帯電話
)とを有する。
【0010】 本発明は、更に、受信器(図2及び3)と、受信部分2における送信された音
声信号の音声品質を向上させる方法(図4)とにも関する。
【0011】 音声生成は、しばしば、以下のようなソース・フィルタによってモデル化され
る。このフィルタは、音声信号の短期スペクトラム包絡を表す。この合成フィル
タは、音声サンプル間の短期相互相関を表す、オーダPの「オール・ポール」フ
ィルタである。一般的に、Pは、狭帯域音声に対しては10に等しく、広帯域音
声(100〜7,000Hz)に対しては20に等しい。このフィルタ係数は、
引用されたマニュアル、W.B.Kleijn及びK.K.Paliwalによ
る「Speech Coding and Synthesis」、に説明され
る線形予測(LP)によって得ることができる。よって、この合成フィルタは、
「LP合成フィルタ」と呼ばれる。
【0012】 ソース信号は、このフィルタに与えられるため、励起信号とも呼ばれる。音声
分析において、それは、音声信号とその短期予測との差に対応する。この場合、
残留信号と呼ばれるこの信号は、音声を合成フィルタの逆である「LP逆フィル
タ」でフィルタリングすることによって得られる。このソース信号は、しばしば
、ピッチ周波数における発声音声用パルス及び非発声音声用白色雑音によって近
似される。
【0013】 このモデルは、高帯域生成(3,400〜7,000Hz)と同様に低帯域信
号生成(100〜300Hz)に対して適用する、図2に示す、得られた結果を
互いに加算する処理の前に、この結果を2つの補完的部分に分割することによっ
て、広帯域合成を単純化することを可能にする。
【0014】 狭帯域音声スペクトラム包絡から広帯域スペクトラム包絡を生成する間、合成
フィルタ係数を得ることは問題である。これは、狭帯域音声信号SNBの線形予
測分析11によって作られ、包絡拡張12が合成フィルタ13を制御し、拒絶フ
ィルタリング14が原狭帯域音声信号からより良く抽出される狭帯域信号を拒絶
する。原狭帯域音声信号SNB及びLP分析ブロック11から、広帯域励起信号
は、合成フィルタ13を励起させるために、生成される。
【0015】 狭帯域残留(若しくはその派生)からの広帯域励起信号の生成は、受信信号S
NBを最大16回サンプリングし、原信号から狭帯域を得るために帯域通過フィ
ルタリング17を行うことによって、為される。
【0016】 ソース・フィルタ方法のほとんどは、低帯域合成フィルタを決定するのに同じ
原理を用いる。第一の工程において、音声信号包絡スペクトラム・パラメータは
、LP分析11によって抽出される。これらパラメータは、適切な表現領域に変
換される。次いで、低帯域合成フィルタ・パラメータ13を得るために、関数が
適用される。各方法の特性は、原則として、低帯域LP合成フィルタを生成する
ために採用されたこの関数の選択に存在する。励起信号の決定は、低帯域の最大
拒絶レベルが通信規格によって特定されていない時にも重要である。この場合、
受信された低帯域残留からの送信の前に音声信号の低帯域残留を復元しようとす
る方法は、きわめて危険性が高い。なぜなら、信号対量子化雑音比は、この周波
数帯域において未知であるからである。
【0017】 本発明の主旨は、狭帯域スペクトラム包絡から拡張帯域スペクトラム包絡を導
くための線形関数を生成することである。本発明に係る、この関数を生成する方
法は、図4に関連して、以下に説明される。
【0018】 図3は、受信信号のコンテントに関して異なる線形関数を適用するために、発
声検知を導入した、本発明に係る好ましい実施形態を示す。低帯域拡張スキーム
の外観が与えられる。これは、高帯域拡張に対して適用する。この実施形態にお
いて、Sは、例えば0〜4kHzの、狭帯域音声を示す。例えば0〜8kHz
である合成された広帯域音声は、Sで示される。狭帯域音声は、音声フレーム
と呼ばれる20msのセグメントに分割される。
【0019】 発声検知器21は、フレームを分類するために、狭帯域音声セグメントを用い
る。このフレームは、有声音、無声音、移行、若しくは沈黙のいずれかである。
この分類は、発声判断と呼ばれ、図3に発声として示される。発声検知は、後に
説明される。この発声判断は、マッピング・マトリックス22を選択するのに用
いられる。高いオーダの包絡推定を有するための、LPC分析フィルタ23のオ
ーダは40である。現音声フレーム及び計算されたLPCパラメータを用いて、
狭帯域残留信号が生成される。
【0020】 包絡及び残留は、並行して拡張される。包絡を拡張するために、LPC歩あら
メータは、まず、LSFパラメータに変換される。発声判断を用いて、マッピン
グ・マトリックス22が選択される。発声判断:有声音、無声音、移行、及び沈
黙に応じて、4つの異なるマッピング・マトリックスがある。このマッピング・
マトリックスは、図4に関連して説明されるオフライン・トレーニング中に生成
される。狭帯域LSFベクトル及び適切なマッピング・マトリックスを用いて、
拡張された広帯域LSFが計算される。このLSFベクトルは、次いで、合成フ
ィルタ24において用いられる直接的な形であるLPCパラメータに変換される
【0021】 LPC分析結果を用いる広帯域励起生成ブロック25は、合成フィルタ24を
励起させるために用いられる。狭帯域信号Sは、広帯域信号Sを完了するた
めの帯域通過フィルタリング27前にゼロを加えることによって最大26回サン
プリングされる。
【0022】 残留拡張は、高いオーダのLPC分析が用いられる場合、より良く実行する。
この理由のため、システムは、40番目のオーダのLPC分析を用いる。狭帯域
及び広帯域LPCベクトルの両方のオーダは40である。包絡拡張の性能が徐々
に下がっても、上記システムの品質全体は、高いオーダのLPCベクトルによっ
て増加する。
【0023】 発声判断のために、(TNハーモニー)に説明されるアルゴリズムが用いられ
る。このアルゴリズムは、10msセグメントを有声音若しくは無声音のいずれ
かに分類する。エネルギ閾値が、沈黙フレームを示すために、加えられる。よっ
て、20msのフレームに対して、発声判断が2回行われる。これら2回の発声
判断に基づいて、フレームが分類される。
【0024】 以下のテーブルは、4カテゴリーにおける分類が2つの発声判断に応じてどの
ように為されるのかを示している。
【0025】
【表1】 フレームの発声判断は、マッピング・マトリックスを選択すること、及び無声
音の場合にゲイン・スケーリングを適用することに用いられる。図3に示す好ま
しい実施形態を実施する方法は、図4に関して説明される。このアルゴリズムは
、2つの主段階を起動することを要求する。1つ目の段階は、拡張マトリックス
が受信端における帯域幅を拡張するために計算されるトレーニング段階である。
2つ目は、携帯電話ハンドセットなどのターゲット製品上で帯域幅拡張アルゴリ
ズムを単に実行する。
【0026】 図4は、トレーニング段階に関し、狭帯域LSF空間41から拡張帯域LSF
空間42へのLSF拡張を示す。狭帯域空間41において、原LSFパスは、実
線で表され、ベクトル数量化LSFジャンプは、非実線で表される。拡張帯域空
間42において、マトリックス拡張されたLSFパスは、実線で表され、コード
・ブック・マッピングされたLSF重心ジャンプは非実線で表される。拡張マト
リックスのみが近接性及び連続性を保つ。
【0027】 拡張マトリックスは、図5に示されるように、例えば16kHzで音声学的に
バランスされた音声サンプルから、生成される。この工程は、ボックス31乃至
38で、示される。
【0028】 工程31:音声サンプルは、例えば、広帯域窓と呼ばれる20ms連続窓(3
20サンプル)、に分割される。
【0029】 工程32:これら音声サンプルは、(4kHzを超える周波数を除去するため
に)ローパス・フィルタによってフィルタリングされる。
【0030】 工程33:フィルタリングされた音声サンプルは、次いで、8kHzにダウン
サンプリングされる。
【0031】 工程34:ダウンサンプリングされた音声サンプルは、狭帯域及び広帯域窓間
に所定の窓インデックスに対して一致を有するように、狭帯域窓と呼ばれる20
ms連続窓(160サンプル)に分割される。
【0032】 工程35:各狭若しくは広帯域窓は、有声音、無声音、移行、沈黙などの音の
存在などの音声基準について分類される。
【0033】 工程36:各窓に対して、例えば40オーダなどの高いオーダのLSFベクト
ルが計算される。
【0034】 工程37:各狭帯域LSFベクトル及びそれに対応する広帯域LSFベクトル
は、有声音、無声音、移行、沈黙など間のクラスタに入れられる。
【0035】 工程38:各クラスタに対して、拡張マトリックスが以下のように計算される
。これらマトリックスは、有声音:M_V、無声音:M_UV、移行:M_T、
及び沈黙:M_S、で示され、そのクラスについて、狭帯域LSFベクトルから
広帯域LSFベクトルを決定する。例えば、狭帯域有声音LSFベクトルLSF
_NBについて、広帯域LSFベクトルLSG_WBは、以下のように計算され
る。 LSF_WB=M_V×LSF_NB 発声検知に代わり、音素モデル若しくはベクトル量子化に基づく認識などの他
の音声信号特性が、受信信号の異なる分類を為すために、検知され得る。
【0036】 本発明の好ましい実施形態に係る工程38における拡張マトリックスの作成は
、狭帯域スペクトラム包絡から拡張帯域スペクトラム包絡を導くために、以下に
説明される。
【0037】 拡張帯域LSFを
【0038】
【数1】 と示し、狭帯域LSFベクトルを
【0039】
【数2】 と示す。両方ともPオーダであり、ここで、W(i)は、i番目の狭帯域LS
Fを表し、W(i)は、i番目の拡張帯域LSFを表す。拡張マトリックスM
は、W =W ・Mによって以下のように定義される。ここで、Mは、P×
Pマトリックスであり、その係数はm(k,k)で示され、1≦k≦Pである。
【0040】
【数3】 このようにして、スペクトラム包絡拡張は、狭帯域LSFベクトルに拡張され
たスペクトラム包絡LSFベクトルを与える拡張マトリックスを乗じることによ
って計算される。狭帯域及び拡張帯域空間における連続LSFのパスを示す図5
に示すように、拡張マトリックスは、以下の興味深い特性を有する広帯域LSF
ベクトルを提供することを可能にする。 − 広帯域LSFベクトルは、狭帯域LSFと相互相関がある。 − 狭帯域LSFの連続展開は、拡張帯域LSFの連続展開を導く。 − 拡張帯域LSF設定サイズは、無限である。
【0041】 原拡張帯域LSFのこれら特性は、コード・ブック・マッピング方法と共に保
存されなかった。式(1)は、マトリックスMを予め計算しておくことを要求す
る。
【0042】 本発明の第一の実施形態によれば、マトリックスMは、S.Haykin、「
Adaptive Filter Theory」、3rd edition、
Prentice Hall、1996、によるマニュアルに説明されている最
小二乗(LS)アルゴリズムを用いて、計算される。
【0043】 この場合、式(1)は、まず、 W=W・M (2) に展開される。ここで、
【0044】
【数4】 であり、Wekは、k番目の拡張帯域ベクトルであり、k=[1・・・N]であ
る。
【0045】 このようにして、W及びWの各行は、狭帯域LSF及びその対応する拡張
帯域LSFに対応する。次いで、Mが以下の式(3)によって計算される。
【0046】
【数5】 式(3)が最小二乗センスにおける最良の推定を提供するにもかかわらず、こ
れは、おそらく、LSF空間に適用されるべき最良の拡張マトリックスではない
。実際、LSF空間は、ベクトル空間の構造を持たない。よって、(3)は、L
SF空間に属さない拡張ベクトルを導きやすい。これは、かなりの数の拡張ベク
トルがLSF空間に落ちなかったシミュレーションによって確認された。LSF
空間は、以下の条件によって保証されている。
【0047】
【数6】 続いて、2つの可能性が生じる。 ・スペクトラム包絡表示空間をベクトル空間(例えばLAR)の構造を有するよ
うに変える。 ・拡張マトリックスの計算中に(4)を反映させる制約を適用する。 LSFは、スペクトラム包絡に対する好ましい表示空間であるため、第二の可能
性を選択することを決定する。
【0048】 本発明の第二の実施形態によれば、式(3)は、以下の式(5)によって置換
される。
【0049】
【数7】 この制約は、LSF係数が負でないことを確実にする。(5)を解くために用い
られた、非負最小二乗(NNLS)と呼ばれるアルゴリズムは、C.L.Law
son及びR.J.Hansonによって、マニュアル「Solving Le
ast Squares Problems」、Prentice−Hall、
1974、において説明されている。
【0050】 しかし、このアルゴリズムが2つの決定を有する。 − すべてのマトリックス要素が正であることが強要されるため、非常に厳格で
ある。 − LSFオーダリングを保証しない。
【0051】 続けて、このマトリックスは、拡張処理の性能を制限するため、最適なもので
はない。その上、計算されたWは、式(4)の制約に従わない。これは、不安
定なフィルタを導く。これを回避するために、拡張帯域LSFベクトルは、人工
的に安定化される必要がある。
【0052】 非公式なリスニング・テストは、NNLSアルゴリズムは元気を与える性能を
提供したことを示したにもかかわらず、Mは異なって決定されなければならない
【0053】 本発明の好ましい実施形態によれば、制約最小二乗(CLS)アルゴリズムが
用いられる。ここでは、最適化は、ベクトル上で計算されなければならない。よ
って、Mのコラムを連結させる必要がある。
【0054】 (1)から、
【0055】
【数8】 が導かれ、次いで、
【0056】
【数9】 が導かれ得る。ここで、
【0057】
【数10】 であり、又、
【0058】
【数11】 である。
【0059】 ここで、式(4)の制約は、
【0060】
【数12】 によって変形され、次いで、
【0061】
【数13】 によって変形され得る。 ここで、
【0062】
【数14】 であり、
【0063】
【数15】 である。
【0064】 すべての取得に対して、それは、
【0065】
【数16】 に対応する。
【0066】 このようにして、マトリックスは、CLSアルゴリズム:
【0067】
【数17】 から計算され得る。ここで、Cx≦dであり、且つ、
【0068】
【数18】
【0069】
【数19】
【0070】
【数20】
【0071】
【数21】
【0072】
【数22】 である。
【0073】 広帯域励起生成は、従来技術として引用した米国特許第5,581,652号
において説明されているものなどの方法を用いて成され得る。
【図面の簡単な説明】
【図1】 本発明に係るシステムを示す概略図である。
【図2】 本発明に係る広帯域合成を示す受信器の概略ブロック図である。
【図3】 本発明の好ましい実施形態に係る受信器の概略ブロック図である。
【図4】 本発明に係る方法を示すブロック図である。
【図5】 狭帯域及び拡張帯域空間における連続LSFのパスを示す概略図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジェリット,アンディ オランダ国,5656 アーアー アインドー フェン,プロフ・ホルストラーン 6

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 所定の帯域幅で音声信号を送信する、少なくとも1つの送信
    器及び受信信号の帯域幅を拡張する手段を有する1つの受信器を有する通信シス
    テムであって、 前記受信器は、 前記受信信号をフィルタリングするための制御パラメータを有するフィルタリ
    ング手段と、 該受信音声信号の音声特性を検知し、前記検知された音声特性に関して前記制
    御パラメータを選択する特定音声検知器とを有することを特徴とするシステム。
  2. 【請求項2】 請求項1記載の通信システムであって、 前記音声特性は、発声であることを特徴とするシステム。
  3. 【請求項3】 請求項1記載の通信システムであって、 前記制御パラメータは、マッピング・マトリックスの係数であることを特徴と
    するシステム。
  4. 【請求項4】 所定の帯域幅を有する音声信号を受信し、前記受信信号の帯
    域幅を拡張する手段を有する受信器であって、 前記受信信号をフィルタリングするための制御パラメータを有するフィルタリ
    ング手段と、 該受信音声信号の音声特性を検知し、前記検知された音声特性に関して前記制
    御パラメータを選択する特定音声検知器とを有することを特徴とする受信器。
  5. 【請求項5】 受信端において、受信信号の帯域幅を拡張する方法であって
    、 受信音声信号の特性を検知する音声検知工程と、 該受信信号の音声パラメータを抽出する線形予測分析工程と、 該受信音声信号の検知された特性について、マッピング拡張マトリックスを選
    択する選択工程と、 LPC分析結果及び選択されたマトリックスに応じて計算された係数を有する
    フィルタを用いて、該受信信号をフィルタリングするフィルタリング工程とを有
    することを特徴とする方法。
  6. 【請求項6】 請求項4記載の受信器用のコンピュータ・プログラム製品で
    あって、 該受信器内にロードされた時に、該受信器に請求項5記載の方法を実行させる
    命令群を計算するコンピュータ・プログラム製品。
  7. 【請求項7】 コンピュータ・プログラムを実行する信号であって、 該コンピュータ・プログラムは、 受信音声信号の特性を検知する音声検知工程と、 該受信信号の音声パラメータを抽出する線形予測分析工程と、 該受信音声信号の検知された特性について、マッピング拡張マトリックスを選
    択する選択工程と、 LPC分析結果及び選択されたマトリックスに応じて計算された係数を有する
    フィルタを用いて、該受信信号をフィルタリングするフィルタリング工程とを実
    行するように設計されていることを特徴とする信号。
JP2001537049A 1999-11-10 2000-11-01 マッピング・マトリックスを用いた広帯域音声合成 Pending JP2003514263A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP99402808 1999-11-10
EP99402808.2 1999-11-10
PCT/EP2000/010761 WO2001035395A1 (en) 1999-11-10 2000-11-01 Wide band speech synthesis by means of a mapping matrix

Publications (1)

Publication Number Publication Date
JP2003514263A true JP2003514263A (ja) 2003-04-15

Family

ID=8242175

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001537049A Pending JP2003514263A (ja) 1999-11-10 2000-11-01 マッピング・マトリックスを用いた広帯域音声合成

Country Status (6)

Country Link
US (1) US6681202B1 (ja)
EP (1) EP1147515A1 (ja)
JP (1) JP2003514263A (ja)
KR (1) KR20010101422A (ja)
CN (1) CN1335980A (ja)
WO (1) WO2001035395A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009300707A (ja) * 2008-06-13 2009-12-24 Sony Corp 情報処理装置および方法、並びにプログラム
JP2013508783A (ja) * 2009-10-23 2013-03-07 クゥアルコム・インコーポレイテッド 狭帯域信号から「より上の帯域」の信号を決定すること

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI119576B (fi) * 2000-03-07 2008-12-31 Nokia Corp Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
JP3467469B2 (ja) * 2000-10-31 2003-11-17 Necエレクトロニクス株式会社 音声復号装置および音声復号プログラムを記録した記録媒体
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7113522B2 (en) * 2001-01-24 2006-09-26 Qualcomm, Incorporated Enhanced conversion of wideband signals to narrowband signals
US7289461B2 (en) * 2001-03-15 2007-10-30 Qualcomm Incorporated Communications using wideband terminals
CN1235192C (zh) 2001-06-28 2006-01-04 皇家菲利浦电子有限公司 传输系统以及用于接收窄带音频信号的接收机和方法
JP2003044098A (ja) * 2001-07-26 2003-02-14 Nec Corp 音声帯域拡張装置及び音声帯域拡張方法
JP4433668B2 (ja) * 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
EP1604354A4 (en) * 2003-03-15 2008-04-02 Mindspeed Tech Inc VOICE INDEX CONTROLS FOR CELP LANGUAGE CODING
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US8712768B2 (en) * 2004-05-25 2014-04-29 Nokia Corporation System and method for enhanced artificial bandwidth expansion
DE602005013906D1 (de) * 2005-01-31 2009-05-28 Harman Becker Automotive Sys Bandbreitenerweiterung eines schmalbandigen akustischen Signals
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
US7844453B2 (en) * 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8005671B2 (en) * 2006-12-04 2011-08-23 Qualcomm Incorporated Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
US8935158B2 (en) 2006-12-13 2015-01-13 Samsung Electronics Co., Ltd. Apparatus and method for comparing frames using spectral information of audio signal
KR100860830B1 (ko) * 2006-12-13 2008-09-30 삼성전자주식회사 음성 신호의 스펙트럼 정보 추정 장치 및 방법
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US7912729B2 (en) 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
WO2010035972A2 (en) * 2008-09-25 2010-04-01 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
US8831958B2 (en) * 2008-09-25 2014-09-09 Lg Electronics Inc. Method and an apparatus for a bandwidth extension using different schemes
GB2466201B (en) 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
JP5423684B2 (ja) * 2008-12-19 2014-02-19 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
US8958510B1 (en) * 2010-06-10 2015-02-17 Fredric J. Harris Selectable bandwidth filter
US10043535B2 (en) 2013-01-15 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
US10045135B2 (en) 2013-10-24 2018-08-07 Staton Techiya, Llc Method and device for recognition and arbitration of an input connection
US20150170655A1 (en) * 2013-12-15 2015-06-18 Qualcomm Incorporated Systems and methods of blind bandwidth extension
US10043534B2 (en) * 2013-12-23 2018-08-07 Staton Techiya, Llc Method and device for spectral expansion for an audio signal
CN106098073A (zh) * 2016-05-23 2016-11-09 苏州大学 一种基于频谱映射的端到端语音加解密系统
CN106024000B (zh) * 2016-05-23 2019-12-24 苏州大学 一种基于频谱映射的端到端语音加解密方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
JP2779886B2 (ja) 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP4005154B2 (ja) * 1995-10-26 2007-11-07 ソニー株式会社 音声復号化方法及び装置
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
JP4132154B2 (ja) * 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
US6415252B1 (en) * 1998-05-28 2002-07-02 Motorola, Inc. Method and apparatus for coding and decoding speech

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009300707A (ja) * 2008-06-13 2009-12-24 Sony Corp 情報処理装置および方法、並びにプログラム
JP2013508783A (ja) * 2009-10-23 2013-03-07 クゥアルコム・インコーポレイテッド 狭帯域信号から「より上の帯域」の信号を決定すること

Also Published As

Publication number Publication date
KR20010101422A (ko) 2001-11-14
CN1335980A (zh) 2002-02-13
WO2001035395A1 (en) 2001-05-17
EP1147515A1 (en) 2001-10-24
US6681202B1 (en) 2004-01-20

Similar Documents

Publication Publication Date Title
JP2003514263A (ja) マッピング・マトリックスを用いた広帯域音声合成
EP0718820B1 (en) Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
EP1252621B1 (en) System and method for modifying speech signals
RU2257556C2 (ru) Квантование коэффициентов усиления для речевого кодера линейного прогнозирования с кодовым возбуждением
Jax et al. Wideband extension of telephone speech using a hidden Markov model
CN1750124B (zh) 带限音频信号的带宽扩展
KR101461774B1 (ko) 대역폭 확장기
JP2956548B2 (ja) 音声帯域拡大装置
JP5232151B2 (ja) パケットベースのエコー除去および抑制
JPH10124088A (ja) 音声帯域幅拡張装置及び方法
CN101141533B (zh) 用于提供具有扩展带宽的声音信号的方法和系统
JP3189598B2 (ja) 信号合成方法および信号合成装置
Pulakka et al. Speech bandwidth extension using gaussian mixture model-based estimation of the highband mel spectrum
KR20080080893A (ko) 음성신호의 대역폭 확장 제어 방법 및 장치
Qian et al. Combining equalization and estimation for bandwidth extension of narrowband speech
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
Laaksonen et al. Artificial bandwidth expansion method to improve intelligibility and quality of AMR-coded narrowband speech
Zhang et al. A CELP variable rate speech codec with low average rate
JPH10254473A (ja) 音声変換方法及び音声変換装置
Beritelli et al. Adaptive robust speech processing based on acoustic noise estimation and classification
JPH0284700A (ja) 音声符号化復号化装置
Saranya et al. Design of a VOCODER using instants of significant excitation
WO1993021627A1 (en) Digital signal coding
Schroeter et al. Speaker adaptation in articulatory speech analysis by synthesis
Mahale et al. New Distance Measure for Monaural Model-based Sound Separation