JP2003522964A - 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法 - Google Patents
背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法Info
- Publication number
- JP2003522964A JP2003522964A JP2000547612A JP2000547612A JP2003522964A JP 2003522964 A JP2003522964 A JP 2003522964A JP 2000547612 A JP2000547612 A JP 2000547612A JP 2000547612 A JP2000547612 A JP 2000547612A JP 2003522964 A JP2003522964 A JP 2003522964A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- background noise
- speech signal
- speech
- synthesized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 57
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 52
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 12
- 230000005284 excitation Effects 0.000 claims description 18
- 230000005236 sound signal Effects 0.000 claims description 10
- 238000004891 communication Methods 0.000 abstract description 15
- 230000000694 effects Effects 0.000 abstract description 11
- 230000002238 attenuated effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 13
- 230000006870 function Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Image Processing (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Description
通信の分野に関する。
耳の全般的な聴覚経験に固有のものである。図1は、典型的な録音された会話の
アナログ音波100を示し、これは、音声通信によって生じる音声群104〜1
08とともに背景または周囲のノイズ信号102を含む。音声通信の伝送、受信
および記憶の技術的分野では、音声群104〜108の符号化および復号化には
いくつかの異なった技術が存在する。音声群104〜108の符号化および復号
化の技術の1つは、符号励起線形予測(CELP)コーダなど、分析合成符号化
システム(analysis-by-synthesis coding system)を用いるものであり、たと
えば国際電気通信連合(International Telecommunication Union、ITU)推
奨G.729を参照されたい。
0の一般的な概略ブロック図を示す。図1の音声群104〜108の符号化およ
び復号化のための分析合成システム200は、対応する合成ユニット220とと
もに分析ユニット204を利用する。分析ユニット204は、CELPコーダな
どの、分析合成タイプの音声コーダを表わす。符号励起線形予測コーダは、通信
ネットワークおよび記憶容量の制約に見合うために中間のまたは低いビットレー
トで音声群104〜108を符号化する方法の1つである。
、入力信号として図1のアナログ音波100を受取る。マイクロホン206は、
受取ったアナログ音波100を、アナログ−デジタル(A/D)サンプラ回路2
08に出力する。アナログ−デジタルサンプラ208は、アナログ音波100を
、サンプリングされたデジタル音声信号(離散的時間期間にわたってサンプリン
グされている)に変換し、これは線形予測係数(LPC)抽出器210およびコ
ードブック214に出力される。
プリングされたデジタル音声信号から線形予測係数を抽出する。隣接する音声サ
ンプルどうしの間の短期相関に関連する線形予測係数は、サンプリングされたデ
ジタル音声信号の声道を表わす。決定された線形予測係数は次に、上述のとおり
、インデックスを備えるルックアップテーブルを用いてLPC抽出器210によ
って量子化される。LPC抽出器210は次に、量子化された線形予測係数のイ
ンデックス値とともに、サンプリングされたデジタル音声信号の残余をピッチ抽
出器212に伝送する。
リングされたデジタル音声信号内のピッチ周期どうしの間に存在する長期相関を
除去する。言い換えれば、ピッチ抽出器212は、受取ったサンプリングされた
デジタル音声信号から周期性を除去し、その結果白色残差音声信号が得られる。
決定されたピッチ値は次に、上述のとおり、インデックスを備えるルックアップ
テーブルを用いてピッチ抽出器212によって量子化される。ピッチ抽出器21
2は次に、量子化された線形予測係数および量子化されたピッチのインデックス
値を記憶装置/伝送ユニット216に伝送する。
たデジタルパターンを含む。コードブック214は通常、当業者には公知である
ように、最良の代表ベクトルを与え、何らかの知覚される態様で残差信号を量子
化するために検索される。選択されたコードワードまたはベクトルは典型的には
、固定の励起コードワードと呼ばれる。受取った信号を表わす最良のコードワー
ドを決定した後、コードブック回路214はまた、受取った信号の利得係数を計
算する。決定された利得係数は次に、インデックスを備えるルックアップテーブ
ルを用いてコードブック214によって量子化されるが、これは当業者には周知
の量子化方式である。コードブック214は次に、量子化された利得のインデッ
クス値とともに決定されたコードワードのインデックスを、記憶装置/伝送器ユ
ニット216に伝送する。
ク218を介して合成ユニット220にピッチ、利得、線形予測係数のインデッ
クス値およびコードワードを伝送するが、これらはすべて、受取ったアナログ音
波信号100を表わすものである。合成ユニット220は、記憶装置/伝送器2
16から受取った異なったパラメータを復号化し、合成音声信号を得る。人が合
成音声信号を聞くことを可能にするために、合成ユニット220は、合成音声信
号をスピーカ222に出力する。
。分析ユニット204が中間または低いビットレートでアナログ音波100をサ
ンプリングした場合、合成ユニット220によって発生され、スピーカ222に
よって出力された符号化音声は、自然に聞こえない。図3は、合成ユニット22
0によってスピーカ222に出力された合成音声信号300の例を示す。合成音
声信号300は、音声群304〜308とともに背景ノイズ302を含む。合成
音声300内には、音声群304〜308内で発生された、減衰された背景ノイ
ズ302があることに注目されたい。この現象の理由は、分析ユニットコーダ2
04は、アナログ音波100の図1の音声群104〜108をモデリングするた
めに特に調整されており、音声群104〜108内に存在する背景ノイズ102
を適切に再生することができないということである。したがって、合成音声信号
300がスピーカ222によって出力されたとき、これは、音声群304〜30
8の初めおよび終わりで生じる、背景ノイズ302の振幅における突然の変化の
ために、人の耳には不自然に聞こえる。
ニットによって中間または低いビットレートで符号化された音声信号を考慮する
と、人の耳に自然かつ現実的に聞こえる合成音声信号を合成ユニットが出力する
ことを可能とするシステムを提供することが有利であろう。この発明は、この利
点を提供する。
テムおよび方法を含む。たとえば、この発明は、通信ネットワークを介して符号
化音声信号を受取り、次に、その中に含まれる異なったパラメータを復号化しか
つ合成し、合成音声信号を発生する。この発明は、合成音声信号内に表わされる
非音声期間を決定する。決定された非音声期間は次に、シミュレートされた背景
ノイズを出力信号に注入するために利用される。さらに、非音声期間はまた、シ
ミュレートされた背景ノイズを合成音声信号の音声期間といつ組合せるべきかを
決定するために、この発明によって使用される。この発明の結果得られた出力信
号は、音声期間どうしの間に実質的に存在する背景ノイズとは対照的に、背景ノ
イズの連続的な存在のために、人の耳にはより自然かつ現実的に聞こえる向上さ
れた合成音声信号である。
の方法は、(a)合成音声部分および合成背景ノイズ部分を有する合成音声信号
を発生するステップを含み、受取られた符号化音声信号に基づく合成音声信号は
、線形予測係数、ピッチ係数、励起コードワードおよびエネルギ(利得)を含み
、さらにこの方法は、(b)合成音声信号の合成背景ノイズ部分に対応する符号
化音声信号から抽出されたエネルギおよび線形予測係数のサブセットを用いて背
景ノイズ信号を生成するステップと、(c)背景ノイズ信号および合成音声信号
を組合せ、自然に聞こえる出力合成音声信号を発生するステップとを含む。
施例を例示し、この説明とともに、この発明の原理を説明する役割を果たす。
テムおよび方法の以下の詳細な説明では、この発明を完全に理解するために、多
くの具体的詳細が述べられる。しかしながら、この発明はこれらの具体的詳細な
しに実施可能であることは、当業者には明らかである。他の場合には、周知の方
法、処理、構成要素および回路は、この発明の局面を不必要にわかりにくくしな
いように詳細には記載されない。
発明が動作する通信および記憶装置のための、音声を符号化し復号化するために
用いられる分析合成システム400の一般的な概略を示す。分析ユニット402
は、背景ノイズとともに音声通信の表示を構成する信号である会話信号412を
受取る。この発明における分析ユニット402のある実施例は、先に記載された
図2の分析ユニット204と同じ電気的構成要素および動作を有する。分析ユニ
ット402は、会話信号412を、音声部分および背景ノイズ部分を含むデジタ
ルの(圧縮された)符号化音声信号414に符号化する。受取った会話信号41
2を符号化した後、分析ユニット402は、符号化音声信号414を通信ネット
ワーク406を介して受信機416(たとえば電話または携帯電話)に伝送する
か、または、記憶装置404(たとえば、磁気または光学記録装置または留守番
電話)に伝送することが可能である。
音声信号414を合成ユニット408に転送する。合成ユニット408は、受信
した符号化音声信号414によって表わされる合成音声信号を発生する。加えて
、この発明に従って、合成ユニット408は、受信した符号化音声信号414内
に表わされる受信した背景ノイズを利用して、シミュレートされた背景ノイズを
生成し、これは合成音声信号と適切に組合される。合成ユニット408から結果
として得られた出力信号は、信号の音声期間中およびそれらの間に連続したレベ
ルの背景ノイズを有する向上された合成音声信号である。スピーカ410は、合
成ユニット408から受取った向上された合成音声信号を出力するが、これは、
音声期間どうしの間に実質的に存在する背景ノイズとは対照的に、背景ノイズが
連続しているために人の耳にはより現実的かつ自然に聞こえる。
、いかなる符号化音声信号414をも記憶する記憶能力を提供し、後からある所
望のときにこれを再生することができる。この発明に従う記憶装置404のある
実施例は、ランダムアクセスメモリ(RAM)ユニット、フロッピーディスク、
ハードドライブメモリユニットまたはデジタル留守番電話メモリである。記憶さ
れた符号化音声信号414が後に再生されると、これは記憶装置404から合成
ユニット418にまず出力される。合成ユニット418は、上述した合成ユニッ
ト408と同じ機能を果たす。合成ユニット418から得られる出力信号は、信
号の音声期間中およびそれらの間に連続したレベルの背景ノイズを有する、向上
された合成音声信号である。スピーカ420は、合成ユニット408から受取っ
た向上された合成音声信号を出力するが、これは人の耳にはより現実的かつ自然
に聞こえる。
の実施例に従う図4の合成ユニット408のある実施例である。合成回路500
のデコーダ回路502は、通信ネットワーク406を介して符号化音声信号41
4を受信する構成要素である。デコーダ回路502は次に、音声通信412を表
わす、符号化音声信号414内で受取られる異なったパラメータを復号化しかつ
合成する。音声信号414は、符号化された線形予測係数(LPC)、ピッチ係
数、固定の励起コードワードおよびエネルギを含む。符号化音声信号414内に
含まれるエネルギから利得係数を得ることが可能であることが認められる。デコ
ーダ回路502は、線形予測係数およびエネルギの両方を含む信号510を、ノ
イズ生成器回路504に伝送する。さらに、デコーダ回路502は、合成音声信
号512を、加算器回路508および音声活性検出器(VAD)回路506の両
方に伝送する。合成音声信号512は、合成音声部分および合成背景ノイズ部分
を含む。この発明に従うデコーダ回路502のある実施例は、ソフトウェアで実
現される。
よびエネルギのサブセットを利用し、シミュレートされた背景ノイズ信号516
を発生し、これは加算器回路508に伝送される。加算器回路508は、出力信
号518を人の耳により自然に聞こえるようにするために、シミュレートされた
背景ノイズ信号516を合成音声信号512の合成音声部分に加算する。さらに
、加算器回路508は、合成音声信号516の非音声部分または合成背景ノイズ
部分をその出力に通過させ、これは自然に聞こえる出力合成音声信号518の一
部となる。加算器回路508は、以下に記載する音声活性検出器回路506によ
って伝送される信号514の受信に基づいて、どの機能を果たすかが異なってい
る。この発明に従うと、ノイズ生成器回路504および加算器回路508もまた
、ソフトウェアで実現可能である。
る合成された非音声期間(たとえば合成背景ノイズのみの期間)を合成音声期間
から区別する。音声活性検出器回路506が合成音声信号512の非音声期間を
決定すると、これは、信号514としてノイズ生成器回路504および加算器回
路508の両方に表示を伝送する。ノイズ生成器回路504は、信号514を利
用し、シミュレートされた背景ノイズ信号516の発生の際にこれを支援する。
この発明に従う音声活性検出器回路506のある実施例は、ソフトウェアで実現
される。
を左右し、自然な音の出力合成音声信号518を発生する。具体的には、信号5
14内に含まれる非音声期間は、受取った合成音声信号512内に含まれる合成
非音声期間をその出力にいつ通過させるかを、加算器回路508に示す。さらに
、信号514内に含まれる音声期間は、受取った合成音声信号512内に含まれ
る合成音声期間と受取ったシミュレートされた背景ノイズ信号516とをいつ加
算するべきかを、加算器回路508に示す。
う図4の合成ユニット408の別の実施例である。合成回路600は、図5の合
成回路500と類似しているがただし、これは音声活性検出器回路506を含ま
ない。デコーダ回路502、ノイズ生成器回路504および加算器回路508は
各々、一般的には、図5を参照して上述したのと同じ機能を果たす。付加機能を
行なう合成回路600内の構成要素は、デコーダ回路502のみである。デコー
ダ回路502が、合成音声信号512の非音声期間を示す信号514を発生する
ために、図4の分析ユニット402は、図5の音声活性検出器回路506と同じ
機能を果たす音声活性検出器回路も含む。分析ユニット402内に位置する音声
活性検出器回路によって決定される非音声期間データは次に、符号化音声信号4
14内に含まれる。
02のある実施例のブロック図を示す。励起コードブック回路702、ピッチ合
成フィルタ回路704および線形予測係数合成フィルタ回路706は各々、図4
の通信ネットワーク406を介して転送された符号化音声信号414を受取る。
励起コードブック回路702は、固定の励起コードワードを受取り、受取った符
号化音声信号414内に表わされたその利得値によって乗算された対応するデジ
タル信号パターンを信号710として発生する。励起コードブック回路702は
次に、信号710をピッチ合成フィルタ回路704に伝送する。この発明に従う
励起コードブック回路702のある実施例は、ソフトウェアで実現される。
符号化されたピッチ係数を受取り、対応する復号化されたピッチ信号を発生し、
出力信号712を発生するために、これを受取った信号710と合成する。線形
予測係数合成フィルタ回路706は、符号化音声信号414内に含まれる符号化
された線形予測係数を受取り、これは、「合成」されてから信号712に加えら
れ、合成音声信号512を発生する。線形予測係数合成フィルタ回路706はま
た、エネルギおよび線形予測係数を含む信号510を、図5および図6のノイズ
生成器回路504に出力する。この発明に従うと、ピッチ合成フィルタ回路70
4および線形予測係数合成フィルタ回路706もまた、ソフトウェアで実現可能
である。
路504のある実施例のブロック図を示す。移動平均回路806は、図5の音声
活性検出器506から非音声信号514を受取り、かつ図7の線形予測係数合成
フィルタ回路706からエネルギおよび線形予測係数を含む信号510を受取る
構成要素である。信号514は、信号510の線形予測係数およびエネルギ内に
存在する非音声期間(たとえば合成背景ノイズのみの期間)を、移動平均回路8
06に示す。移動平均回路806は次に、信号510内に表わされる背景ノイズ
期間に対応する受取った線形予測係数の移動平均値を決定する。さらに、移動平
均回路806は、信号510内に表わされる背景ノイズ期間に対応するエネルギ
の移動平均値も決定する。したがって、移動平均回路806は、非音声期間の合
成背景ノイズに対応する、エネルギの決定された移動平均および線形予測係数の
決定された移動平均値を連続的に記憶する。移動平均回路806は次に、両方の
記憶された移動平均値のコピーを信号812として、線形予測係数合成フィルタ
回路804に出力する。
タ回路706内に位置付けることも可能である。さらに、別の実施例では、移動
平均回路806を線形予測係数合成フィルタ回路706内に部分的に位置付ける
ことも可能であり、一方で残りの回路構成を図8のノイズ生成器回路504内に
位置づける。具体的には、背景ノイズの、線形予測係数の移動平均値およびエネ
ルギの移動平均値を決定する移動平均回路806の回路構成は、線形予測係数合
成フィルタ回路706内に位置付けられ、一方で、移動平均回路806の記憶回
路は、ノイズ生成器回路504内に位置付けられる。この発明に従う移動平均回
路806のある実施例は、ソフトウェアで実現される。
、これは線形予測係数合成フィルタ回路804に出力される。この発明に従う白
色ノイズ生成器回路802のある実施例は、乱数生成器回路である。この発明に
従う白色ノイズ生成器回路802の別の実施例は、ソフトウェアで実現される。
線形予測係数合成フィルタ回路804は、受取った信号810および812を用
いて、シミュレートされた背景ノイズ信号516を発生し、これは図5および図
6の加算器回路508に出力される。この発明に従う線形予測係数合成フィルタ
回路804のある実施例は、ソフトウェアで実現される。
0によってそれぞれ出力されるより自然に聞こえる合成音声信号518を示す。
自然に聞こえる出力合成音声信号518は、背景ノイズ902および合成音声群
904〜908を含む。背景ノイズ902は、合成音声群904〜908中およ
びそれらの間に連続して存在することに注目されたい。この発明によってシミュ
レートされた背景ノイズを合成音声群904〜908とを組合せることによって
、向上された合成音声信号518は、人の耳に自然かつ現実的に聞こえる。
これは、余すところないまたはこの発明を開示された正確な態様に限定するもの
ではなく、明らかに、多くの変形および変更が上記教示に鑑みて可能である。実
施例は、この発明の原理およびその実践的適用を最もよく説明するために選択さ
れ記載され、これによって当業者が、企図された特定の使用に適合するようなさ
まざまな変形でこの発明およびさまざまな実施例を最良に利用することを可能と
する。この発明の範囲は、前掲の特許請求の範囲およびその等価によって定義さ
れることが意図される。
のアナログ音波を示す図である。
の一般的な概略ブロック図である。
音声信号を示す図である。
システムの一般的概略図である。
成ユニットのある実施例のブロック図である。
成ユニットの別の実施例のブロック図である。
従うデコーダ回路のある実施例のブロック図である。
従うノイズ生成器回路のある実施例のブロック図である。
然に聞こえる合成音声信号の図である。
Claims (20)
- 【請求項1】 背景ノイズが共存する符号化音声の品質を向上させるための
方法であって、前記方法は、 (a) 合成音声部分および合成背景ノイズ部分を有する合成音声信号を発生
するステップを含み、受取った符号化音声信号に基づく前記合成音声信号は、線
形予測係数、ピッチ係数、励起コードワードおよびエネルギを含み、さらに、 (b) 前記合成音声信号の前記合成背景ノイズ部分に対応する前記符号化音
声信号から抽出される前記エネルギのサブセットおよび前記線形予測係数のサブ
セットを用いて背景ノイズ信号を発生するステップと、 (c) 前記背景ノイズ信号と前記合成音声信号とを組合せて、自然に聞こえ
る出力合成音声信号を発生するステップとを含む、方法。 - 【請求項2】 前記符号化音声信号は、音声部分および背景ノイズ部分を含
む、請求項1に記載の方法。 - 【請求項3】 前記ステップ(c)は、前記合成音声信号の前記合成音声部
分と前記背景ノイズ信号とを組合せ、前記自然に聞こえる出力合成音声信号を発
生するステップを含む、請求項2に記載の方法。 - 【請求項4】 前記ステップ(b)は、前記合成音声信号の前記合成背景ノ
イズ部分に対応する前記線形予測係数のサブセットの移動平均値および前記エネ
ルギのサブセットの移動平均値を決定するステップをさらに含み、前記移動平均
値は、前記背景ノイズ信号を発生するために用いられる、請求項2に記載の方法
。 - 【請求項5】 前記ステップ(b)は、白色ノイズ信号を発生するステップ
をさらに含み、前記白色ノイズ信号は、前記背景ノイズ信号を発生するために用
いられる、請求項4に記載の方法。 - 【請求項6】 前記白色ノイズ信号は、乱数生成器回路によって発生される
、請求項5に記載の方法。 - 【請求項7】 前記ステップ(a)は、 前記符号化音声信号の前記励起コードワードを用いて前記励起コードワードに
対応するデジタル信号パターンを発生するステップと、 前記デジタル信号パターンを用いて前記合成音声信号を部分的に合成するステ
ップと、 前記符号化音声信号の前記ピッチ係数を用いて前記合成音声信号を部分的に合
成するステップと、 前記符号化音声信号の前記線形予測係数を用いて前記合成音声信号を部分的に
合成するステップとをさらに含む、請求項6に記載の方法。 - 【請求項8】 背景ノイズが共存する符号化音声の品質を向上させるための
方法であって、前記方法は、 (a) 合成音声部分および合成背景ノイズ部分を含む合成音声信号を発生す
るステップを含み、受取った符号化音声信号に基づく前記合成音声信号は、線形
予測係数、ピッチ係数、励起コードワードおよびエネルギを含み、さらに、 (b) 前記合成音声信号の前記合成背景ノイズ部分および前記合成音声部分
を決定するステップと、 (c) 前記合成音声信号の前記合成背景ノイズ部分に対応する前記符号化音
声信号から抽出される前記線形予測係数のサブセットおよび前記エネルギのサブ
セットを用いて背景ノイズ信号を発生するステップと、 (d) 前記合成音声信号の前記合成音声部分のみと前記背景ノイズ信号とを
組合せて、自然に聞こえる出力合成音声信号を発生するステップとを含む、方法
。 - 【請求項9】 前記ステップ(c)は、前記合成音声信号の前記合成背景ノ
イズ部分に対応する前記線形予測係数のサブセットの移動平均値および前記エネ
ルギのサブセットの移動平均値を決定するステップをさらに含み、前記移動平均
値は、前記背景ノイズ信号を発生するために用いられる、請求項8に記載の方法
。 - 【請求項10】 前記ステップ(c)は、白色ノイズ信号を発生するステッ
プをさらに含み、前記白色ノイズ信号は、前記背景ノイズ信号を発生するために
用いられる、請求項9に記載の方法。 - 【請求項11】 前記白色ノイズ信号は、乱数生成器回路によって発生され
る、請求項10に記載の方法。 - 【請求項12】 前記ステップ(a)は、 前記符号化音声信号の前記励起コードワードを用いて前記励起コードワードに
対応するデジタル信号パターンを発生するステップと、 前記デジタル信号パターンを用いて前記合成音声信号を部分的に合成するステ
ップと、 前記符号化音声信号の前記ピッチ係数を用いて前記合成音声信号を部分的に合
成するステップと、 前記符号化音声信号の前記線形予測係数を用いて前記合成音声信号を部分的に
合成するステップとをさらに含む、請求項10に記載の方法。 - 【請求項13】 背景ノイズが共存する符号化音声の品質を向上させるため
の装置であって、前記装置は、 線形予測係数、ピッチ係数、励起コードワードおよびエネルギを含む符号化音
声信号を受取るよう結合されるデコーダ回路を含み、合成音声信号を発生するた
めの前記デコーダ回路は、合成音声部分および合成背景ノイズ部分を有し、さら
に、 前記デコーダ回路に結合され、前記合成音声信号の前記合成背景ノイズ部分に
対応する前記線形予測係数のサブセットおよび前記エネルギのサブセットを用い
て背景ノイズ信号を発生するためのノイズ生成器回路を含み、前記線形予測係数
のサブセットおよび前記エネルギのサブセットは、前記デコーダ回路によって前
記符号化音声信号から抽出され、さらに、 前記デコーダ回路から前記合成音声信号を受取り前記ノイズ生成器から前記背
景ノイズ信号を受取るよう結合される加算器手段を含み、前記加算器手段は、前
記背景ノイズ信号と前記合成音声信号とを組合せて自然に聞こえる出力合成音声
信号を発生する、装置。 - 【請求項14】 前記符号化音声信号は、音声部分および背景ノイズ部分を
含む、請求項13に記載の装置。 - 【請求項15】 前記加算器手段は、前記合成音声信号の前記合成音声部分
と前記背景ノイズ信号とを組合せて前記自然に聞こえる出力合成音声信号を発生
する、請求項14に記載の装置。 - 【請求項16】 前記合成音声信号の前記線形予測係数および前記エネルギ
を受取るよう結合され、前記合成音声信号の前記合成背景ノイズ部分に対応する
前記エネルギのサブセットの移動平均値および前記線形予測係数のサブセットの
移動平均値を決定するための移動平均回路をさらに含み、前記ノイズ生成器回路
は、前記移動平均値を用いて前記背景ノイズ信号を発生する、請求項14に記載
の装置。 - 【請求項17】 前記ノイズ生成器回路は、白色ノイズ信号を発生するため
の白色ノイズ生成器回路をさらに含み、前記ノイズ生成器回路は、前記白色ノイ
ズ信号を用いて前記背景ノイズ信号を発生する、請求項16に記載の装置。 - 【請求項18】 前記白色ノイズ生成器回路は、乱数生成器回路である、請
求項17に記載の装置。 - 【請求項19】 前記ノイズ生成器回路は、前記移動平均値を受取るよう前
記移動平均回路に結合される第1の線形予測係数合成フィルタ回路をさらに含み
、前記第1の線形予測係数合成フィルタ回路は、前記白色ノイズ信号を受取るよ
う前記白色ノイズ生成器回路にさらに結合され、前記第1の線形予測係数合成フ
ィルタ回路は、前記白色ノイズ信号および前記移動平均値を用いて前記背景ノイ
ズ信号を発生する、請求項17に記載の装置。 - 【請求項20】 前記デコーダ回路は、 前記符号化音声信号を受取るよう結合され、前記符号化音声信号の前記励起コ
ードワードを用いて前記励起コードワードに対応するデジタル信号パターンを発
生する励起コードブック回路をさらに含み、前記デコーダ回路は、前記デジタル
信号パターンを用いて前記合成音声信号を部分的に合成し、さらに、 前記符号化音声信号を受取るよう結合され、前記ピッチ係数を用いて前記合成
音声信号を部分的に合成するピッチ合成フィルタ回路と、 前記符号化音声信号を受取るよう結合され、前記線形予測係数および前記エネ
ルギを用いて前記合成音声信号を部分的に合成する第2の線形予測係数合成フィ
ルタ回路とをさらに含む、請求項19に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/075,365 | 1998-05-05 | ||
US09/075,365 US6122611A (en) | 1998-05-11 | 1998-05-11 | Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise |
PCT/US1999/009764 WO1999057715A1 (en) | 1998-05-05 | 1999-05-04 | A system and method to improve the quality of coded speech coexisting with background noise |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003522964A true JP2003522964A (ja) | 2003-07-29 |
JP4420562B2 JP4420562B2 (ja) | 2010-02-24 |
Family
ID=22125228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000547612A Expired - Fee Related JP4420562B2 (ja) | 1998-05-11 | 1999-05-04 | 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6122611A (ja) |
EP (1) | EP1076895B1 (ja) |
JP (1) | JP4420562B2 (ja) |
AT (1) | ATE232008T1 (ja) |
DE (1) | DE69905152T2 (ja) |
WO (1) | WO1999057715A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105210148A (zh) * | 2012-12-21 | 2015-12-30 | 弗劳恩霍夫应用研究促进协会 | 用以在低比特率下模型化背景噪声的舒缓噪声添加技术 |
US9583114B2 (en) | 2012-12-21 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3365360B2 (ja) * | 1999-07-28 | 2003-01-08 | 日本電気株式会社 | 音声信号復号方法および音声信号符号化復号方法とその装置 |
JP2001242896A (ja) * | 2000-02-29 | 2001-09-07 | Matsushita Electric Ind Co Ltd | 音声符号化/復号装置およびその方法 |
US20030093270A1 (en) * | 2001-11-13 | 2003-05-15 | Domer Steven M. | Comfort noise including recorded noise |
US8874437B2 (en) * | 2005-03-28 | 2014-10-28 | Tellabs Operations, Inc. | Method and apparatus for modifying an encoded signal for voice quality enhancement |
US8000958B2 (en) * | 2006-05-15 | 2011-08-16 | Kent State University | Device and method for improving communication through dichotic input of a speech signal |
US20070270987A1 (en) * | 2006-05-18 | 2007-11-22 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
BRPI0807703B1 (pt) | 2007-02-26 | 2020-09-24 | Dolby Laboratories Licensing Corporation | Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador |
US20090154718A1 (en) * | 2007-12-14 | 2009-06-18 | Page Steven R | Method and apparatus for suppressor backfill |
JP5538425B2 (ja) | 2008-12-23 | 2014-07-02 | コーニンクレッカ フィリップス エヌ ヴェ | スピーチ取り込み及びスピーチレンダリング |
US8589153B2 (en) * | 2011-06-28 | 2013-11-19 | Microsoft Corporation | Adaptive conference comfort noise |
CN107945813B (zh) * | 2012-08-29 | 2021-10-26 | 日本电信电话株式会社 | 解码方法、解码装置、和计算机可读取的记录介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02288520A (ja) * | 1989-04-28 | 1990-11-28 | Hitachi Ltd | 背景音再生機能付き音声符号復号方式 |
US5327457A (en) * | 1991-09-13 | 1994-07-05 | Motorola, Inc. | Operation indicative background noise in a digital receiver |
SE9500858L (sv) * | 1995-03-10 | 1996-09-11 | Ericsson Telefon Ab L M | Anordning och förfarande vid talöverföring och ett telekommunikationssystem omfattande dylik anordning |
FR2739995B1 (fr) * | 1995-10-13 | 1997-12-12 | Massaloux Dominique | Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
US5864799A (en) * | 1996-08-08 | 1999-01-26 | Motorola Inc. | Apparatus and method for generating noise in a digital receiver |
-
1998
- 1998-05-11 US US09/075,365 patent/US6122611A/en not_active Expired - Lifetime
-
1999
- 1999-05-04 DE DE69905152T patent/DE69905152T2/de not_active Expired - Lifetime
- 1999-05-04 AT AT99920339T patent/ATE232008T1/de not_active IP Right Cessation
- 1999-05-04 WO PCT/US1999/009764 patent/WO1999057715A1/en active IP Right Grant
- 1999-05-04 JP JP2000547612A patent/JP4420562B2/ja not_active Expired - Fee Related
- 1999-05-04 EP EP99920339A patent/EP1076895B1/en not_active Expired - Lifetime
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105210148A (zh) * | 2012-12-21 | 2015-12-30 | 弗劳恩霍夫应用研究促进协会 | 用以在低比特率下模型化背景噪声的舒缓噪声添加技术 |
JP2016500453A (ja) * | 2012-12-21 | 2016-01-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 |
US9583114B2 (en) | 2012-12-21 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
JP2018084834A (ja) * | 2012-12-21 | 2018-05-31 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 |
US10147432B2 (en) | 2012-12-21 | 2018-12-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Comfort noise addition for modeling background noise at low bit-rates |
US10339941B2 (en) | 2012-12-21 | 2019-07-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Comfort noise addition for modeling background noise at low bit-rates |
CN111145767A (zh) * | 2012-12-21 | 2020-05-12 | 弗劳恩霍夫应用研究促进协会 | 解码器及用于产生和处理编码频比特流的系统 |
US10789963B2 (en) | 2012-12-21 | 2020-09-29 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Comfort noise addition for modeling background noise at low bit-rates |
JP2021092816A (ja) * | 2012-12-21 | 2021-06-17 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 |
JP7297803B2 (ja) | 2012-12-21 | 2023-06-26 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 |
CN111145767B (zh) * | 2012-12-21 | 2023-07-25 | 弗劳恩霍夫应用研究促进协会 | 解码器及用于产生和处理编码频比特流的系统 |
Also Published As
Publication number | Publication date |
---|---|
EP1076895B1 (en) | 2003-01-29 |
DE69905152D1 (de) | 2003-03-06 |
ATE232008T1 (de) | 2003-02-15 |
JP4420562B2 (ja) | 2010-02-24 |
WO1999057715A1 (en) | 1999-11-11 |
DE69905152T2 (de) | 2003-11-20 |
EP1076895A1 (en) | 2001-02-21 |
US6122611A (en) | 2000-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5226777B2 (ja) | 音声信号中に埋め込まれた隠れデータの回復 | |
JP4927257B2 (ja) | 可変レートスピーチ符号化 | |
JP4550289B2 (ja) | Celp符号変換 | |
US6466904B1 (en) | Method and apparatus using harmonic modeling in an improved speech decoder | |
EP1145228A1 (en) | Periodic speech coding | |
CN101006495A (zh) | 语音编码装置、语音解码装置、通信装置以及语音编码方法 | |
KR20070028373A (ko) | 음성음악 복호화 장치 및 음성음악 복호화 방법 | |
JP2009069856A (ja) | 音声コーデックにおける擬似高帯域信号の推定方法 | |
JP2002533963A (ja) | 符号化通信信号の性能改良のための符号化された改良特性 | |
TW530296B (en) | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions | |
JPH1145100A (ja) | フィルタリング方法と低ビット速度音声通信システム | |
JPH0713600A (ja) | 駆動同期時間符号化ボコーダおよび方法 | |
JP4420562B2 (ja) | 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法 | |
JP5027966B2 (ja) | 入力信号をボコーディングする方法および装置およびそのためのコンピュータ読み出し可能信号を有する媒体を含む製造物品 | |
EP0779732A2 (en) | Multi-point voice conferencing system over a wide area network | |
US6104994A (en) | Method for speech coding under background noise conditions | |
US20130085751A1 (en) | Voice communication system encoding and decoding voice and non-voice information | |
US7089180B2 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
JPH028900A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復合化装置 | |
Sluijter et al. | State of the art and trends in speech coding | |
JP3006790B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
JP2946528B2 (ja) | 音声符号化復号化方法及びその装置 | |
JPH034300A (ja) | 音声符号化復号化方式 | |
JPH01293400A (ja) | 音声符号化復号化方法並びに音声符号化装置及び音声復号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060711 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20061010 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20061017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070105 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20070911 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091201 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121211 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131211 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |