JP2004512561A - 符号化音響信号の復号に関するエラー隠匿 - Google Patents
符号化音響信号の復号に関するエラー隠匿 Download PDFInfo
- Publication number
- JP2004512561A JP2004512561A JP2002537001A JP2002537001A JP2004512561A JP 2004512561 A JP2004512561 A JP 2004512561A JP 2002537001 A JP2002537001 A JP 2002537001A JP 2002537001 A JP2002537001 A JP 2002537001A JP 2004512561 A JP2004512561 A JP 2004512561A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- signal
- data
- frequency
- previous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Abstract
Description
(発明の背景および従来技術)
本発明は、概して、部分的に喪失あるいは損傷を受けた音響信号を表す符号化データによって引き起こされた、復号音響信号におけるエラーの隠匿(concealment)に関するものである。特に、本発明は、伝送媒体から符号化された情報の形でデータを受信する方法およびエラー隠匿装置に関するものである。これらは上記請求項1および39にそれぞれ記載されている。本発明は、また、上記請求項41および42にそれぞれ記載されている、符号化された情報の形で受信したデータから音響信号を生成するための復号器、および、上記請求項37に記載のコンピュータ・プログラム、上記請求項38に記載のコンピュータ読取り可能媒体、に関するものである。
【0002】
音響および音声コーデック(codec=coder and decoder、符号器および復号器)に対しては多くの応用がある。符号化および復号化体系は、例えば、テレビ会議システムや固定および移動通信システムにおける音響信号のビット速度効率伝送に使用されている。音声コーデックは安全な電話技術および音声保存のために使用することができる。
【0003】
特に、移動通信応用においては、コーデックは、困難なチャネル条件のもとで動作しなければならないことがある。最適でない伝送条件においては、音声信号を表す符号化ビットが伝送器と受信器との間のどこかで乱されるかあるいは喪失することがある。現在の移動通信システムとインターネット応用技術との音声コーデックの大部分は、ブロックに関連して動作している。例えば、GSM(汎ヨーロッパデジタル移動通信システム)、WCDMA(広帯域符号分割多元接続)、TDMA(時分割多元接続)およびIS95(国際標準95)等がそうである。ブロック関連動作とは、音響源信号が、例えば20msの特定の長さの音声コーデック・フレームに分割されることを意味する。音声コーデック・フレームにおける情報は、それから、ひとつの単位として符号化される。しかし、音声コーデック・フレームは通常、例えば5msの長さのサブ・フレームにさらに分割される。サブ・フレームは、GSM FRコーデック(FR=フル・レート)、GSM EFRコーデック(EFR=拡張フル・レート)、GSM AMRコーデック(AMR=適応マルチ・レート)、ITU G.729コーデック(ITU=国際電気通信連合)およびEVRC(拡張フルレート・コーデック)における合成ろ波器励振の符号化のような、特定のパラメータに対する符号化単位となる。
【0004】
上記のコーデックは、励振パラメータの他に、例えば、LPCパラメータ(LPC=線形予測符号化)、LTP遅れ(LTP=長期予測)および様々な利得パラメータのような他のパラメータによって、音響信号をモデル化する。これらのパラメータの特定のビットは、復号音響信号の知覚音質に関して非常に重要な情報を表す。このようなビットが伝送中に乱された場合、復号音響信号の音質は、少なくとも一時的に、人間の聞き手には比較的音質が悪いと知覚される。従って、対応する音声コーデック・フレームのパラメータにエラーがある場合、これらのパラメータを使用せずに先に受信された正しいパラメータを代わりに使用することが有益である。このエラー隠匿技術は、最適でない条件のチャネルによって音響信号が伝送される多くのシステムにおいて、様々な形式で応用されている。
【0005】
エラー隠匿方法は、通常、比較的ゆっくり変化する音声コーデック・パラメータを止めることによって、喪失あるいは損傷された音声コーデック・フレームの影響を緩和することを目的としている。このようなエラー隠匿は、例えば、GSM EFRコーデックおよびGSM AMRコーデックにおけるエラー隠匿装置によって実現される。例えば、音声コーデック・フレームが喪失したあるいは損傷を受けて、LPC利得およびLPC遅れパラメータを繰り返す場合である。しかし、複数の連続する音声コーデック・フレームが喪失したあるいは損傷を受けた場合、減衰因子を持つ利得パラメータを繰り返すことや、長期平均に近づけられたLPCパラメータを繰り返すことを含む、様々なミューティング技術が適用される。さらに、ひとつ以上の損傷を受けたフレームを受信した後に最初に正しく受信したフレームのパワー・レベルは、損傷を受けたフレームを受信する前の最新の正しく受信したフレームのパワー・レベルに制限される。このことにより、音声合成ろ波器および適応コードブックが損傷を受けたフレームを受信する間に誤った状態に設定されることにより起こることがある、復号音声信号における望ましくない影響が緩和される。
【0006】
以下に、送信器と受信器の間を伝送される際に喪失あるいは損傷を受けた音声コーデック・フレームの望ましくない影響を緩和する他の手段および態様を述べる。
【0007】
米国特許第5,907,822号は、デジタル音声フレーム・エラーを隠すために、過去の信号履歴データを失われたデータ・セグメントに挿入する、損失耐久音声復号器を開示している。音声圧縮パラメータの1ステップ外挿のための逆伝搬法によって訓練された多層フィードフォワード型人工神経回路網は、フレームが喪失した場合に必要なパラメータを抽出し、代替フレームを生成する。
【0008】
欧州特許第B1,0 665 161号は、音声復号器における喪失フレームの影響を隠すための装置および方法を開示している。この文献は、フレームが失われた場合に背景の音を決定するための閾値の更新を制限するための、音声アクティベート検知器の使用を提案している。事後ろ波器は通常、復号信号のスペクトルを偏向させる。しかし、フレームが失われた場合、事後ろ波器の係数は更新されない。
【0009】
米国特許第5,909,663号は、複数の連続する損傷音声フレームを受信した際に同じパラメータを繰り返し使用することを避けることによって、復号音声信号の知覚音質を高める、音声符号器を開示している。このことは、励振信号に雑音構成要素を加えること、励振信号の代わりに雑音構成要素を使用すること、あるいは、複数の励振信号を含む雑音コードブックから励振信号を任意に読むことによって、実現される。
【0010】
狭帯域コーデックのための既知のエラー隠匿方法は、一般に、乱された音声コーデック・フレームの間、単に、最新の損傷を受けていない受信音声コーデック・フレームからの特定のスペクトル・パラメータを繰り返すことによって、ほとんどの環境において満足のいく結果をもたらしている。実際には、この処理は、損傷を受けていない音声コーデック・フレームが新たに受信されるまで、復号音声信号のスペクトルの振幅および形を暗黙に維持している。音声信号のスペクトルの振幅および形をこのように保存することによって、復号器における励振信号がスペクトル的に平らである(あるいは白色(white))こともまた暗黙に推定される。
【0011】
しかし、このことはいつも正しいとは限らない。代数的符号励振線形予測コーデック(ACELP;Algebric Code Excited Linear Predictive−codec)は、例えば、白色ではない励振信号を生成する。さらに、励振信号のスペクトル形は、音声コーデック・フレームによって様々に変化することがある。最新の損傷を受けていない受信音声コーデック・フレームからのスペクトル・パラメータを単純に繰り返すことは、復号音響信号のスペクトルに突然の変化をもたらし、音質を低めることになる可能性がある。
【0012】
特に、CELP符号化規範に従った広帯域音声コーデックには、上記の問題があることが知られている。これらのコーデックにおいて、合成ろ波器励振のスペクトル形は、音声コーデック・フレームによってさらに大きく変化することがあるからである。
【0013】
(発明の概要)
本発明の目的は、上記の問題を軽減する音声符号化を提供することである。
【0014】
本発明のひとつの態様によると、本発明の目的は、符号化された情報の形でデータを受信し、上記のような方法でそのデータを復号して音響信号を生成することによって達成される。この方法は、損傷を受けたデータを受信した場合、第1の復元信号に基づいて第2の復元信号を生成することを特徴とする。第2の復元信号は、第1の復元信号のスペクトルを調整した形のスペクトルを有し、そのスペクトルと先の復元信号のスペクトルとの間のスペクトル形に関する偏差は、第1の復元信号のスペクトルと先の復元信号のスペクトルとの間の対応する偏差より小さい。
【0015】
本発明の他の態様によると、本発明の目的は、コンピュータの内部記憶装置に直接ロード可能なコンピュータ・プログラムによって達成される。このプログラムは、コンピュータ上で実行するとき上記の方法を実現するソフトウェアを有している。
【0016】
本発明のさらなる態様によると、本発明の目的は、コンピュータに上記の方法を実行させるプログラムを記憶した、コンピュータ読取り可能媒体によって達成される。
【0017】
本発明の他の態様によると、本発明の目的は、始めに述べたエラー隠匿装置によって達成される。このエラー隠匿装置は、損傷を受けたデータを受信した場合、スペクトル訂正装置が第1の復元信号に基づいて、第2の復元スペクトルのスペクトル形が、第1の復元信号に基づくスペクトルよりも先の復元信号のスペクトルからのスペクトル形に関する偏差が小さくなるように、第2の復元スペクトルを生成することを特徴とする。
【0018】
本発明の他の態様によると、本発明の目的は、符号化された情報の形で受信したデータから音響信号を生成するための復号器によって達成される。復号器は、少なくともひとつのパラメータを生成する第1のエラー隠匿装置を含む。復号器はまた、音声コーデック・フレ−ムと第1のエラー隠匿装置からの少なくともひとつのパラメータを受信し、それらに応答して音響信号を生成する音声復号器を含む。さらに、復号器は、上記のエラー隠匿装置を含み、ここで、第1の復元信号は音声復号器によって生成された復号音声信号を構成し、第2の復元信号は拡張音響信号を構成する。
【0019】
本発明のさらなる態様によると、本発明の目的は、符号化された情報の形で受信したデータから音響信号を生成するための復号器によって達成される。復号器は、少なくともひとつのパラメータを生成する第1のエラー隠匿装置を含む。復号器はまた、音声コーデック・パラメータと少なくともひとつのパラメータを受信し、第1のエラー隠匿装置からの少なくともひとつのパラメータに応答して励振信号を生成する、励振生成器を含む。最後に、復号器は、上記のエラー隠匿装置をふくみ、ここで、第1の復元信号は励振生成器によって生成された励振信号を構成し、第2の復元信号は拡張励振信号を構成する。
【0020】
データが喪失したり損傷を受けたデータを受信した場合に上記のように復元スペクトルを明白に生成することによって、損傷を受けていないデータを受信する期間と損傷を受けたデータを受信する期間との間のスペクトルの移行を円滑に行うことができる。このことは、例えばACELP符号化体系を含む高度な広帯域コーデックの場合特に、復号信号の拡張知覚音質を高めることになる。
【0021】
本発明を、付随する図面を参照しながら、例示として開示される好ましい実施例によって以下に詳細に説明する。
【0022】
(本発明の好ましい実施例の説明)
図1は、本発明によるエラー隠匿装置100を表すブロック図である。エラー隠匿装置100の目的は、受信データが損傷を受けていたり喪失している場合に、受信データから復号した拡張信号zn Eを生成することである。拡張復号信号zn Eは、励振パラメータのような音声信号のパラメータを表すか、あるいは、拡張復号信号zn Eそれ自体が音響信号である。装置100は、受信データから得られた第1の復元信号ynを受信する第1の変成器101を含む。第1の復元信号ynは時間領域における信号とみなされ、第1の変成器101は、第1の復元信号ynの最新の受信時間セグメントの第1の復元周波数変成Ynを、第1のスペクトルの形で規則的に生成する。通常、各セグメントは受信信号の信号フレームに対応する。
【0023】
第1のスペクトルYnは、スペクトル訂正装置102に送られ、スペクトル訂正装置102は、第1のスペクトルYnに基づき第2の復元スペクトルZn Eを生成する。第2の復元スペクトルZn Eは、スペクトル形に関して、第1の復元信号ynに基づくスペクトルよりも先の復元信号のスペクトルからの差異が小さくなるように、生成される。
【0024】
このことを説明するために、図2を参照されたい。図2において、音響信号を表す符号化された情報を含む連続する信号フレームF(1)−F(5)が示されている。信号フレームF(1)−F(5)は、それぞれ規則的な間隔t1、t2、t3、t4、t5で送信器によって生成される。
【0025】
しかし、信号フレームF(1)−F(5)は同じ規則的な間隔で受信器に到着する必要はなく、また、受信器が信号フレームF(1)−F(5)を復号する前に正しい順序に再編成することができる程の小さい遅れで到着する限り、同じ順序で到着する必要もない。しかし簡便化のために、ここでは信号フレームF(1)−F(5)は送信器によって生成されたのと同じ順序で規則正しく到着するものと仮定する。最初の3つの信号フレームF(1)−F(3)は、損傷されることなく、つまりそれらが含む情報において何のエラーも無く到着する。しかし第4のフレームF(4)は損傷を受け、あるいは復号装置に到着する前に完全に失われている。次に続く信号フレームF(5)はまた、損傷なしに到着する。
【0026】
図3は、図2における信号フレームF(1)−F(5)に基づく復号音響信号z(t)を示している。時間領域tにおける音響信号z(t)は、第1の時間事例t1と第2の時間事例t2との間の第1の信号フレームF(1)に含まれる情報に基づき生成されている。同様に、音響信号z(t)は、第2の信号フレームF(2)と第3の信号フレームF(3)と、における情報に基づき第4の時間事例t4まで生成される。実際の場合、送信器側における間隔t1からt5と、受信器側における対応する時間事例t1からt5の間には、符号化の遅れ、伝送時間および復号の遅れがあるためにずれが存在する。しかし、簡便化のため、この事実もまたここでは無いものとする。
【0027】
しかし、第4の時間事例t4においては、音響信号z(t)の基となる受信情報が存在しない、あるいは、信頼できる情報が存在しない。従って、音響信号z’(t4)−z’(t5)は、第4の時間事例t4と第5の時間事例t5との間に第1のエラー隠匿装置によって生成された復元信号フレームFrec(4)に基づいている。図3に示されるように、復元信号フレームFrec(4)から得られた音響信号z(t)は、隣接する信号フレームF(3)およびF(5)から得られた音響信号z(t)の部分とは異なる波形性質を示している。
【0028】
図4は、1組のスペクトルZ1、Z2、Z3、Z’4 およびZ5を示している。これらのスペクトルは、図3における復号音響信号z(t)の各セグメントz(t1)−z(t2)、z(t2)−z(t3)、z(t3)−z(t4)、z’(t4)−z’(t5)に対応している。復号音響信号z(t)は、第3の時間事例t3と第4の時間事例t4との間の時間領域tにおいて比較的平らであり、従って、比較的強い低周波成分を有している。これは、エネルギーの大部分を低周波数領域に持つ、対応するスペクトルZ3によって表されている。対照的に、復元信号フレームFrec(4)に基づく音響信号z’(t4)−z’(t5)のスペクトルは、比較的より多くのエネルギーを高周波数帯域に持ち、時間領域tにおける信号z’(t4)−z’(t5)は比較的速い振幅の変化を示している。最新の損傷を受けていない受信信号フレームF(3)に基づく復号音響信号のスペクトルZ3と、復元信号フレームFrec(4)に基づく復号音響信号のスペクトルZ’4との対照的なスペクトル形は、音響信号において望ましくない影響を及ぼし、人間の聴き手は音質が悪いと感じる。
【0029】
図5はスペクトルを表す拡大図であり、最新の損傷を受けていない受信信号フレームF(3)に基づく復号音響信号のスペクトルZ3と、復元信号フレームFrec(4)に基づく復号音響信号のスペクトルZ’4とがそれぞれ実線で示されている。スペクトル訂正装置102によって生成された第2の復元スペクトルZn Eはこの図において、点線で示されている。スペクトルZn Eのスペクトル形は、復元信号フレームFrec(4)に基づく復号音響信号のスペクトルZ’4よりも最新の損傷を受けていない受信信号フレームF(3)に基づく復号音響信号のスペクトルZ3からの偏差が小さい。例えば、スペクトルZn Eは、より低周波数領域に近い位置にある。
【0030】
図1に戻って説明すると、第2の変成器103は第2の復元スペクトルZn Eを受信し、逆周波数変成を実行し、時間領域における拡張復号信号を構成する対応する第2の復元信号zn Eを生成する。図3は、この信号zE(t4)−zE(t5)を、波形性質を表す点線で示している。この信号の波形性質は、復元信号フレームFrec(4)に基づく音響信号z’(t4)−z’(t5)よりも、最新の損傷を受けていない受信信号フレームF(3)から復号された音響信号z(t3)−z(t4)に似ている。
【0031】
第2の復元スペクトルZn Eは、復元信号フレームFrec(4)に対応する第1のスペクトルYnの位相、つまり、Yn/|Yn|(Ynは第1のスペクトルを表し、|Yn|は第1のスペクトルの振幅を表す)を訂正スペクトルCnと掛け合せることによって生成される。実際にはこの計算は、数式:Zn E=Cn・Yn/|Yn|に従って実行することができる。
【0032】
本発明の望ましい実施例によると、訂正スペクトルCnは、先に受信された損傷を受けていないデータF(n−1)から以下のように生成される。スペクトル訂正装置102は、第1に、図4および図5におけるZ3、図3におけるF(3)に対応する、先に受信された損傷を受けていないデータF(n−1)から生成された信号の先のスペクトルYn−1を生成する。それから、スペクトル訂正装置102は、先のスペクトルYn−1の振幅スペクトル|Yn−1|を生成する。
【0033】
本発明の他の好ましい実施例によると、訂正スペクトルCnは、先に受信された損傷を受けていないデータF(n−1)から生成された信号の先のスペクトルYn−1を生成することによって生成される。生成されたスペクトルはそれから、ろ波器にかけられ、ろ波された先のスペクトルH(Yn−1)となる。最後に、ろ波された先のスペクトルH(Yn−1)の振幅スペクトル|H(Yn−1)|が生成される。
【0034】
ろ波により、先のスペクトルYn−1に多くの代替的修正を行うことができる。しかし、ろ波の全体的な目的は常に、先の損傷を受けていない信号フレームから復号された信号のスペクトルの平滑化された繰返しである対応するスペクトルを持つ信号を、生成することである。低域ろ波は、従って、適当な代替方法のひとつである。他の方法は、ケプストラム領域における平滑化である。この方法は、先の振幅スペクトル|Yn−1|(対数でも可能)をケプストラム領域に変成し、特定の大きさ(例えば5から7)から上のケプストラム係数を捨てて、周波数領域に再び変成することを含むことができる。他の非線形ろ波方法は、先のスペクトルYn−1を少なくとも2つの周波数副帯域f1−fMに分割し、それぞれの周波数帯域f1−fM内の元のスペクトル係数の平均係数値を計算することである。最後に、元のスペクトル係数は、それぞれの平均係数値で置き換えられる。結果として、周波数帯域全体が平滑化される。周波数副帯域f1−fMは、先のスペクトルYn−1を等しい大きさのセグメントに分割した等距離であってもよいし、あるいは、(例えばバークあるいはメル・スケール周波帯域分割に従って)非等距離であってもよい。人間の聴覚は、周波数解析および音の大きさの知覚に関してほぼ対数的であるので、スペクトルYn−1の非等距離対数分割が望ましい。
【0035】
さらに、周波数副帯域は、互いに部分的に重複していてもよい。その結果の重複領域の係数値は、この場合、まず各周波数副帯域を窓関数と掛け合せ、次に各重複領域における窓関数で計算された隣接する周波数副帯域の係数値を合算することによって得られる。窓関数は、重複していない周波数領域においては一定の振幅を有し、隣接する周波数副帯域が重複する上下推移領域においては振幅は徐々に減少する。
【0036】
本発明の他の好ましい実施例において、第2の復元信号のスペクトルZn Eは、いわゆる目標ミューティング・スペクトル|Y0|と関連して訂正スペクトルCnの動的範囲を減少させることによって生成される。目標ミューティング・スペクトル|Y0|は、例えば、音響源信号の長期平均値を表す。
【0037】
目標ミューティング・スペクトル|Y0|に関連して訂正スペクトルCnの動的範囲を減少させることは、以下の数式に従って実行することができる。
【数1】
ここで、Yn−1は先の復元信号フレーム(このフレームは必ずしも損傷を受けていない信号フレームである必要はなく、先に復元された損傷あるいは喪失した信号フレームであってもよいことに注意されたい)のスペクトルを表し、|Y0|は目標ミューティング・スペクトルを表し、kはベキ指数、例えば2を表し、comp(x)は圧縮関数を表す。圧縮関数は、入力変数の絶対値よりも小さい絶対値を持つことを特徴とする。つまり、|comp(x)|<|x|である。従って、減衰因子η<1は圧縮関数comp(x)=η・xの単純な例を構成する。
【0038】
減衰因子ηは、GSM AMR標準におけるように7つの異なる状態を持つことができる状態機械によって与えられることが望ましい。減衰因子ηは、以下の値を持つ状態変数s、η(s)の関数として説明することができる。
【表1】
状態変数は、損傷を受けていないデータの1区画を受信すると0に設定され、損傷を受けたデータの最初の1区画を受信すると1に設定される。損傷を受けたデータの最初の1区画を受信した後に、損傷を受けたデータの後続の区画を受信した場合、状態変数sは受信した損傷を受けたデータの各区画毎に、状態6まで1状態づつ増やされる。状態6において損傷を受けたデータのさらなる区画が受信された場合、状態変数は状態6のままである。状態6において損傷を受けていないデータの1区画が受信されると、状態変数は状態5に設定され、状態5において損傷を受けていないデータの後続の1区画が受信されると、状態変数は0にリセットされる。
【0039】
本発明の他の好ましい実施例によると、第2の復元信号のスペクトルZn Eは、標準化目標ミューティング・スペクトルに関連して訂正スペクトルCnの動的範囲を減少させることによって生成される。このことは以下の数式を計算することによって実行することができる。
【数2】
ここで‖Yn−1‖は、先の復元信号フレームのスペクトルのLk標準を表す。ベクトルYn−1={y1,y2,...,ym}のLk標準‖Yn−1‖は、以下の数式によって得られる。
【数3】
ここで、kはベキ指数であり、yiはYn−1のi番目のスペクトル係数である。さらに、Cs nは、以下の数式に従って得られる。
【数4】
ここで、|Y0|は目標ミューティング・スペクトルを表し、‖Y0‖kは使用されるLk標準に従った目標ミューティング・スペクトルのベキを表し、kはベキ指数、例えば2であり、comp(x)は圧縮関数を表す。
【0040】
本発明の好ましい実施例によると、訂正スペクトルCnは、線形標準Lkに従った目標ベキ‖Y0‖kに関連して先の復元信号フレームのスペクトルの振幅を圧縮することによって生成される。ここでベキ指数kは例えば2である。
【0041】
一般に、この圧縮は以下の数式を計算することによって達成される。
【数5】
ここで|Yn−1|は先の復元信号フレームのスペクトルの振幅を表し、‖Y0‖kはLk標準に従った目標ミューティング・ベキを表し、kは例えば2であるベキ指数であり、comp(x)は圧縮関数を表す。
【0042】
本発明の好ましい実施例によると、訂正スペクトルCnは、以下の関係式によって表される。
【数6】
ここでηは減衰因子<1を表し、|Yn−1|は先の復元信号フレームのスペクトルの振幅をあらわす。
【0043】
この場合においても、減衰因子ηは7つの異なる状態0から6を有する状態機械によって与えられることが望ましい。さらに、上記と同様のη(s)の値および状態機械の規則を適用することができる。
【0044】
本発明の好ましい実施例によると、訂正スペクトルCnは、まず、先の復元信号フレームのスペクトルYn−1を生成し、それから、対応する振幅スペクトル|Yn−1|を生成し、最後に、振幅スペクトル|Yn−1|の部分m(つまりm番目の副帯域)を適応ミューティング因子γmと掛け合わせることによって、生成される。単純な例として、完全なスペクトルを有するひとつの帯域(つまりm=1)のみを使用することがある。
【0045】
適応ミューティング因子γmは、以下の数式に従って、先の復元信号フレームおよび損傷を受けた受信データF(n)から得ることができる。
【数7】
ここで、“low(m)”は復元データから復号された信号のスペクトルの副帯域fmの低周波数帯域境界に対応する周波数係数指数を表し、“high(m)”は復元データから復号された信号のスペクトルの副帯域fmの高周波数帯域境界に対応する周波数係数指数を表し、|Yn(k)|は第1のスペクトルにおけるk番目の周波数要素を表す係数の振幅を表し、|Yn−1(k)|は先のスペクトルにおけるk番目の周波数要素を表す係数の振幅を表す。
【0046】
さらに、スペクトルを細分する必要はない。従ってスペクトルは、復元データから復号された信号の全周波数帯域の境界に対応する係数指数を持つ、ひとつの副帯域fmのみを持つことができる。しかし、副帯域が分割される場合、バーク・スケール周波帯域分割あるいはメル・スケール周波帯域分割に従って分割されることが望ましい。
【0047】
本発明の好ましい実施例によると、訂正スペクトルCnは、閾値周波数より上の周波数要素のみに影響を与える。実行する際の便宜のために、この閾値周波数は、特定の閾値係数に対応するように選択される。訂正スペクトルCnは、従って、以下の式によって表される。
【数8】
Cn(k)=|Yn(k)| k≦閾値係数 の場合
Cn(k)=γ・|Yn−1(k)| k>閾値係数 の場合
ここで、Cn(k)は訂正スペクトルCnにおけるk番目の周波数要素を表す係数kの振幅を表し、|Yn(k)|は第1のスペクトルにおけるk番目の周波数要素を表す係数kの振幅を表し、|Yn−1(k)|は先のスペクトルにおけるk番目の周波数要素を表す係数の振幅を表し、γは適応ミューティング因子<1を表す。
【0048】
適応ミューティング因子γは、例えば、第1のスペクトルYnのベキ|Yn|2と先のスペクトルYn−1のベキ|Yn−1|2の比率の平方根として選択することができる。つまり、以下の式のようになる。
【数9】
【0049】
適応ミューティング因子γはまた、特定の周波数帯域に対して、以下の式に従って得ることができる。
【数10】
ここで、“low”は復元データから復号された信号のスペクトルの低周波数帯域境界に対応する周波数係数指数を表し、“high”は復元データから復号された信号のスペクトルの高周波数帯域境界に対応する周波数係数指数を表し、|Yn(k)|は第1のスペクトルにおけるk番目の周波数要素を表す係数の振幅を表し、|Yn−1(k)|は先のスペクトルにおけるk番目の周波数要素を表す係数の振幅を表す。通常、低周波数帯域境界は0kHzであり、高周波数帯域境界は2kHzである。訂正スペクトルCn(k)を表す上記数式における閾値周波数は、高周波数帯域境界に一致してもよいが、必ずしも一致する必要はない。本発明の好ましい実施例では、閾値周波数は3kHzである。
【0050】
第1のエラー隠匿装置は一般に、周波数帯域の低周波数部分において最も効果的であるので、本発明によるミューティング動作もこの帯域において最も効果的である。従って、第1のスペクトルYnにおける高周波数帯域パワーと低周波数帯域パワーとの比率を、先の信号フレームの対応する比率と等しくなるよう強制することによって、第1のエラー隠匿装置からのミューティングを周波数帯域のより高い部分に拡張することができる。
【0051】
最新技術によるエラー隠匿方法においては、喪失あるいは損傷を受けたフレームの後の最初のフレームのパワーレベルを、エラーあるいは喪失が起こる前に受信した最新の損傷を受けていない信号フレームのパワーレベルに限定することが共通の特徴である。本発明においても同様の原則を適用することが有益であり、従って、訂正スペクトルCnの副帯域のパワーは、先に受信された損傷を受けていないデータF(n−1)の対応する副帯域のパワーに制限される。副帯域は、例えば、(閾値係数kによって表される)閾値周波数より上の周波数要素を表す係数として定義することができる。このように振幅を制限することによって、フレームが消去された後の最初のフレームにおいて高周波数帯域から低周波数帯域へのエネルギー比率が誤って生成されないことが保証される。振幅の制限は、以下の式によって表すことができる。
【数11】
ここで、σh,prevgoodは、最新に受信された損傷を受けていない信号フレームF(N−1)から得られた信号フレームのパワーの根を表し、σh,nは現在の信号フレームから得られた信号フレームのパワーの根を表し、|Yn(k)|は現在の信号フレームから得られたスペクトルにおけるk番目の周波数要素を表す係数kの振幅を表す。
【0052】
本発明は主に音声信号の符号化に関して使用するよう意図しているので、第1の復元信号は音響信号であることが望ましい。さらに、符号化された音声信号は信号フレーム、より正確にはいわゆる音声コーデック・フレームに分割される。音声コーデック・フレームは、さらに音声コーデック・サブ・フレームに分割され、これらのサブ・フレームもまた、本発明によるエラー隠匿装置の動作に対する基礎となる。損傷を受けたデータは、特定の音声コーデックあるいは音声コーデック・サブ・フレームが喪失したかあるいは少なくともひとつのエラーを伴って受信されたかによって、決定される。
【0053】
図6は、音響信号aが第1の復元信号yとして提供されるエラー隠匿装置100を含むCELP復号器を表すブロック図である。
【0054】
復号器は、損傷を受けた音声フレームFが受信された場合あるいは音声フレームFが喪失した場合に、少なくともひとつのパラメータp1を生成する、第1のエラー隠匿装置603を含む。データ品質決定装置601は、全ての入力音声フレームFを、例えば巡回冗長チェック(CRC)によって検査し、特定の音声フレームFが正しく受信されたか誤って受信されたかを決定する。損傷を受けていない音声フレームFは、データ品質決定装置601を通って音声復号器602に進み、そこで音響信号aがその出力上に生成され閉鎖スイッチ605を通る。
【0055】
データ品質決定装置601が損傷あるいは喪失した音声フレームFを検知した場合、装置601は、第1のエラー隠匿装置603を起動し、エラー隠匿装置603は損傷を受けた音声フレームFの第1の復元の基礎となるパラメータp1を少なくともひとつ生成する。音声復号器602は、それから、復元音声フレームに応答して第1の復元音声信号aを生成する。データ品質決定装置は601はまた、エラー隠匿装置100を起動し、スイッチ605を開く。従って、第1の復元音声信号aは、信号yとしてエラー隠匿装置100へと渡り、上記方法に従って音響信号aは更に改良される。その結果の改良音響信号aは、そのスペクトルがスペクトル形に関して、第1の復元音声信号のスペクトルよりも、先に受信された損傷を受けていない音声フレームFから生成された音響信号aからの偏差が小さくなるようにスペクトル的に調整された信号ZEとして出力される。
【0056】
図7は、本発明によるエラー隠匿装置の他の応用を表すブロック図である。ここで、データ品質決定装置701は、音響源信号の重要な性質を表す入力パラメータSを受信する。パラメータSが損傷を受けていない場合(例えばCRCによって決定される)、それらの信号は励振生成器702に渡される。励振生成器702は、励振信号eをスイッチ705を通して合成ろ波器704に配信し、合成ろ波器704は音響信号aを生成する。
【0057】
しかし、データ品質決定装置701がパラメータSが損傷あるいは喪失していると判断すると、第1のエラー隠匿装置703を起動し、エラー隠匿装置703は少なくともひとつのパラメータp2を生成する。励振生成器702は、少なくともひとつのパラメータp2を受信し、それに応答して第1の復元励振信号eを生成する。データ品質決定装置701はまた、スイッチ705を開き、エラー隠匿装置100を起動する。この結果、励振信号eは、第1の復元信号yとしてエラー隠匿装置100に受信される。エラー隠匿装置100は、これに応答し、そのスペクトルがスペクトル形に関して、第1の復元励振信号のスペクトルよりも、先に受信された損傷を受けていない音声フレームFから生成された励振信号eからの偏差が小さくなるようにスペクトル的に調整された第2の復元信号ZEを生成する。
【0058】
本発明の好ましい実施例によると、第1のエラー隠匿装置703はまた、少なくともひとつのパラメータciをエラー隠匿装置100に渡す。この転送は、データ品質決定装置701によって制御される。
【0059】
要約のために、本発明の方法の概要を、図8における流れ図を参照して説明する。データは第1のステップ801において受信される。続くステップ802で受信データが損傷を受けているかいないかを検査し、データが損傷を受けていない場合、処理はステップ803へと続く。このステップで、後に使用するためにデータが保存される。それから続くステップ804で、データは源信号それ自体、パラメータ、あるいは励振信号のような源信号に関連する信号の推定に復号される。この後、処理は新しいデータを受信するためにステップ801に戻る。
【0060】
ステップ802において受信データが損傷を受けていると検知された場合、処理はステップ805に続き、ステップ803において先に保存されていたデータが取出される。実際、多くの連続するデータ区画が損傷を受けたり喪失していることがあり、取出すデータは、現在の喪失あるいは損傷されたデータの直前のデータである必要はない。しかし、取出すデータは最新の損傷を受けていない受信データである。このデータは、続くステップ806で使用され、第1の復元信号が生成される。第1の復元信号は、(もしあれば)現在の受信データと、保存された先のデータの少なくともひとつのパラメータに基づく。最後に、ステップ807は、第1の復元信号に基づき、そのスペクトル形が、第1の復元信号のスペクトルよりも、先に受信された損傷を受けていないデータのスペクトルからの偏差が小さくなるように、第2の復元信号を生成する。
【0061】
他の可能性として、ステップ808を含むことができる。ステップ808は、現在の復元フレームに基づくデータを生成し保存する。このデータは、直後のフレームが消去されている場合、ステップ805において取出すことができる。
【0062】
本発明の上記方法および上記実施例は、コンピュータの内部記憶装置に直接ロード可能なコンピュータ・プログラムによって実行することができる。このようなプログラムは、コンピュータ上で実行する際に上記ステップを実行するためのソフトウェアを含んでいる。コンピュータは、当然ながら、どんな読取り可能媒体上にも保存することができる。
【0063】
さらに、本発明によるエラー隠匿装置100を、周波数領域においてろ波を実行する音声コーデックのためのいわゆる拡張装置と共に配置することが有益である。これらの装置は共に、周波数領域において同様に動作し、時間領域への逆周波数変換を含む。
【0064】
上記の第2の復元信号は、周波数領域におけるろ波操作によって得られた訂正振幅スペクトルCnを使用して生成されるが、対応する時間領域ろ波器を代わりに使用することによって、同様のろ波を時間領域において実行することができる。訂正振幅スペクトルCnに近い周波数応答を有するろ波器を得るために、既知の他の方法を適用することができる。
【0065】
本明細書において文言“含む”あるいは“含んでいる”が使用されるとき、記述されている特徴、整数、ステップあるいは構成要素の存在を示すものと理解されたい。しかし、この文言はひとつ以上の他の特徴、整数、ステップあるいは構成要素の存在を排除するものではない。
【0066】
本発明は、図示された上記実施例に限定されるものではなく、本発明の請求項の範囲内において自由に変更することができる。
【図面の簡単な説明】
【図1】
本発明によるエラー隠匿装置を表す概要ブロック図である。
【図2】
音響信号を表す符号化された情報を含む連続した信号フレームを表す図である。
【図3】
図2に示された信号フレームにおける符号化された情報に基づく、復号音響信号を表す図である。
【図4】
図2に示された信号フレームに対応する図3に示された復号音響信号のセグメントに対する一連のスペクトルを表す図である。
【図5】
本発明により、先の損傷を受けていないデータ、損傷を受けたデータの第1の復元および損傷を受けたデータの第2の復元に基づき生成されたスペクトルを表す図である。
【図6】
本発明によるエラー隠匿装置の第1の実施例を表すブロック図である。
【図7】
本発明によるエラー隠匿装置の第2の実施例を表すブロック図である。
【図8】
本発明による方法の概要を表す流れ図である。
Claims (42)
- 伝送媒体から符号化情報の形でデータ(F(1)−F(5))を受信し、当該データを音響信号(z(t))に復号する方法において、データが喪失あるいは損傷を受けたデータ(F(4))を受信した場合の前記方法は、
先の復元信号(F(3))の少なくともひとつのパラメータ(p1;p2)に基づき復元データ(Frec(4))を生成するステップと、
前記復元データ(Frec(4))から第1の復元信号(z’(t4)−z’(t5))を生成するステップであって、当該第1の復元信号(z’(t4)−z’(t5))が第1のスペクトル(Z’4)を有する前記ステップと、
を含み、
前記第1の復元信号(z’(t4)−z’(t5))に基づき、第2の復元信号(zE(t4)−zE(t5))のスペクトル(Z4 E)が前記第1のスペクトル(Z’4)よりも、先の復元信号(z(t3)−z(t4))のスペクトル(Z3)からスペクトル形に関する偏差が小さくなるように、前記第1のスペクトル(Z’4)を調整することによって、第2の復元信号(zE(t4)−zE(t5))を生成することを特徴とする、前記方法。 - 請求項1に記載の方法において、前記先の復元信号(z(t3)−z(t4))の前記スペクトル(Z3)が、先に受信された損傷を受けていないデータ(F(3))から生成されることを特徴とする、前記方法。
- 請求項1あるいは請求項2に記載の方法において、前記スペクトル調整が、前記復元データから生成された前記第1のスペクトルの位相スペクトルを、訂正スペクトル(Cn)と掛け合わせることを含むことを特徴とする、前記方法。
- 請求項3あるいは請求項4に記載の方法において、前記第2の復元信号のスペクトル(Zn E)が、数式:Cn・Yn/|Yn|によって得られることを特徴とする、前記方法であって、
ここで、Cnは訂正スペクトルを表し、
Ynは第1のスペクトルを表し、
|Yn|は第1のスペクトルの振幅を表す、前記方法。 - 請求項3あるいは請求項4に記載の方法において、前記訂正スペクトル(Cn)は、先の復元信号の先のスペクトルを生成するステップと、
当該先のスペクトルの振幅スペクトルを生成するステップと、
によって生成されることを特徴とする、前記方法。 - 請求項5に記載の方法において、前記先の復元信号(z(t3)−z(t4))の前記スペクトル(Z3)が、先に受信された損傷を受けていないデータ(F(3))から生成されることを特徴とする、前記方法。
- 請求項3あるいは請求項4のいずれかひとつに記載の方法において、前記訂正スペクトル(Cn)が、
前記先に受信された損傷を受けていないデータから生成された信号の先のスペクトルを生成するステップと、
前記先のスペクトルをろ波することによってろ波された先のスペクトルを生成するステップと、
前記ろ波された先のスペクトルの振幅スペクトルを生成するステップと、
によって生成されることを特徴とする、前記方法。 - 請求項7に記載の方法において、前記ろ波が低域ろ波を含むことを特徴とする、前記方法。
- 請求項7に記載の方法において、前記ろ波がケプストラム領域における平滑化を含むことを特徴とする、前記方法。
- 請求項7に記載の方法において、前記ろ波が、
先のスペクトルを少なくとも2つの周波数副帯域に分割するステップと、
前記各周波数副帯域に対して、前記各周波数副帯域内における元のスペクトル係数の平均係数値を計算するステップと、
各前記周波数副帯域に対して、元のスペクトル係数を対応する前記平均係数値に置き換えるステップと、
を含むことを特徴とする、前記方法。 - 請求項10に記載の方法において、前記周波数副帯域が等距離であることを特徴とする、前記方法。
- 請求項10あるいは請求項11に記載の方法において、前記周波数副帯域が少なくとも部分的に重複することを特徴とする、前記方法。
- 請求項12に記載の方法において、前記周波数副帯域の重複領域における結果としての係数値が、
各前記周波数帯域を窓関数と掛け合わせることによって、対応する窓周波数副帯域を生成するステップと、
各重複領域における隣接する前記窓周波数副帯域の係数値を合算するステップと、
によって生成されることを特徴とする、前記方法。 - 請求項13に記載の方法において、前記窓関数が、重複していない周波数領域においては一定の振幅を有し、隣接する周波数副帯域が重複している上下推移領域においては徐々に減少する振幅を有することを特徴とする、前記方法。
- 請求項3あるいは請求項4に記載の方法において、前記第2の復元信号の前記スペクトル(Zn E)を、前記訂正スペクトル(Cn)の動的範囲を目標ミューティング・スペクトルに関して減少させることによって生成することを特徴とする、前記方法。
- 請求項16に記載の方法において、前記圧縮関数が数式η・xによって表される減衰関数であることを特徴とする、前記方法であって、
ここで、ηは減衰因子<1を表し、
xは圧縮される値を表す、前記方法。 - 請求項3あるいは請求項4に記載の方法において、前記第2の復元信号の前記スペクトル(Zn E)を、前記訂正スペクトル(Cn)の動的範囲を標準化目標ミューティング・スペクトルに関して減少させることによって生成することを特徴とする、前記方法。
- 請求項3あるいは請求項4に記載の方法において、先の復元信号の先のスペクトルの振幅を目標ミューティング・スペクトルのベキに関連して圧縮することによって、前記訂正スペクトル(Cn)を、生成することを特徴とする、前記方法。
- 請求項21に記載の方法において、前記訂正スペクトル(Cn)をη・|Yn−1|の関係に従って生成することを特徴とする、前記方法であって、
ここで、ηは減衰因子<1を表し、
|Yn−1|は先の復元信号フレームのスペクトルの振幅を表す、前記方法。 - 請求項17あるいは請求項22のいずれかひとつに記載の方法において、前記減衰因子ηが7つの状態を有する状態機械によって与えられ、η(s)の関係によって表されることを特徴とする、前記方法であって、
ここで、η(s)は状態変数に依存し、
s=0 に対して η(s)=1、
s∈[1,5]に対して η(s)=0.98、
s=6 に対して η(s)=0.7、を与えられ、
状態変数は損傷を受けていないデータを受信すると0に設定され、
状態変数は損傷を受けたデータの1区画を受信すると1に設定され、
状態変数は損傷を受けたデータの最初の区画を受信した後に受信する損傷データの後続の各区画毎に1状態増加され、
状態6において、損傷を受けたデータを受信すると状態変数は6に維持され、損傷を受けていないデータを受信すると状態変数は状態5に設定される、前記方法。 - 請求項3あるいは請求項4に記載の方法において、前記訂正スペクトル(Cn)を、
先の復元信号フレームのスペクトルを生成するステップと、
前記先の復元信号フレームの前記スペクトルの振幅を生成するステップと、
前記振幅スペクトルの少なくともひとつの周波数帯域を、少なくともひとつの適応ミューティング因子と掛け合わせるステップと、
によって生成することを特徴とし、
更に、前記少なくともひとつの適応ミューティング因子が、前記先の復元信号フレームから得られ、前記先の復元信号フレームの前記スペクトルの少なくともひとつの周波数副帯域に関して生成されることを特徴とする、前記方法。 - 請求項10、請求項24あるいは請求項25のいずれかひとつに記載の方法において、前記先のスペクトルおよび前記第1のスペクトルがそれぞれ、バーク・スケール周波帯域分割に従って少なくとも2つの周波数副帯域に分割されることを特徴とする、前記方法。
- 請求項10、請求項24あるいは請求項25のいずれかひとつに記載の方法において、前記先のスペクトルおよび前記第1のスペクトルがそれぞれ、メル・スケール周波帯域分割に従って少なくとも2つの周波数副帯域に分割されることを特徴とする、前記方法。
- 請求項3あるいは請求項4に記載の方法において、前記訂正スペクトル(Cn)が、特定の閾値係数に対応する、閾値周波数より上の周波数成分のみに影響を与えることを特徴とする、前記方法。
- 請求項28に記載の方法において、前記訂正スペクトル(Cn)が、
Cn(k)=|Yn(k)| k ≦ 閾値係数 の場合、
Cn(k)=γ・|Yn−1(k)| k > 閾値係数 の場合、
によって表されることを特徴とする、前記方法であって、
ここで、Cn(k)は訂正スペクトル(Cn)におけるk番目の周波数成分を表す
係数の振幅を表し、
|Yn(k)|は第1のスペクトルにおけるk番目の周波数成分を表す係数
の振幅を表し、
|Yn−1(k)|は先のスペクトルにおけるk番目の周波数成分を表す係数の
振幅を表し、
γmは適応ミューティング因子<1を表す、前記方法。 - 請求項28から請求項30のいずれかに記載の方法において、前記訂正スペクトル(Cn)の少なくともひとつの副帯域のパワーが、閾値周波数より上の周波数要素を表す係数に関して、先に受信された損傷を受けていないデータの少なくともひとつの副帯域のパワーに制限されることを特徴とする、前記方法。
- 請求項1から請求項31のいずれかひとつに記載の方法において、前記第1の復元信号(z’(t4)−z’(t5))および前記第2の復元信号(zE(t4)−zE(t5))が音響信号(a)であることを特徴とする、前記方法。
- 請求項1から請求項31のいずれかひとつに記載の方法において、前記第1の復元信号(z’(t4)−z’(t5))および前記第2の復元信号(zE(t4)−zE(t5))が励振信号(e)であることを特徴とする、前記方法。
- 請求項1から請求項33のいずれかひとつに記載の方法において、前記データは信号フレーム(F(1)−F(5))に分割され、特定の信号フレームが喪失したかあるいは少なくともひとつのエラーを伴って受信されたかによって前記データが損傷を受けたデータかどうかが決定されることを特徴とする、前記方法。
- 請求項34に記載の方法において、ひとつの前記信号フレームがひとつの音声コーデック・フレームを構成することを特徴とする、前記方法。
- 請求項34に記載の方法において、ひとつの前記信号フレームがひとつの音声コーデック・サブ・フレームを構成することを特徴とする、前記方法。
- コンピュータの内部記憶装置に直接ロード可能なコンピュータ・プログラムであって、当該プログラムがコンピュータ上で実行するとき、請求項1から請求項36のいずれかひとつに記載の方法を実行するためのソフトウェアを含む、前記コンピュータ・プログラム。
- コンピュータ読取り可能媒体であって、プログラムを記憶し、当該プログラムが請求項1から請求項36のいずれかひとつに記載の方法をコンピュータに実行させるように作られている、前記媒体。
- データが喪失したりあるいは損傷を受けたデータを受信した場合に、符号化情報の形で受信したデータから復号した信号を拡張するためのエラー隠匿装置であって、
該エラー隠匿装置は、
受信データ(F(n))から復号した第1の復元信号(yn)を受信するための入力と、第1の復元周波数変換(Yn)を提供するための出力と、を有する第1の変成器(101)と、
前記第1の復元周波数変換(Yn)を受信するための入力と、第2の復元スペクトル(Zn E)を提供するための出力と、を有するスペクトル訂正装置(102)と、
前記第2の復元スペクトル(Zn E)を受信するための入力と、第2の復元信号(zn E)を提供するための出力と、を有する第2の変成器(103)と、
を含み、
前記スペクトル訂正装置(102)は、前記第2の復元スペクトル信号(Zn E)が前記第1の復元信号(yn)に基づくスペクトル(Z’4)よりも先の復元信号(yn−1)のスペクトル(Z3)からのスペクトル形に関する偏差が小さくなるような前記第1の復元信号(yn)に基づいて、前記第2の復元スペクトル信号(Zn E)を生成することを特徴とする、前記エラー隠匿装置。 - 請求項39に記載のエラー隠匿装置において、先の復元信号(z(t3)−z(t4))のスペクトル(Z3)が、先に受信された損傷を受けていないデータ(F(3))から生成されることを特徴とする、前記エラー隠匿装置。
- 符号化情報の形で受信したデータから音響信号を生成するための復号器であって、
該復号器は、
少なくともひとつのパラメータ(p1)を生成し出力するための第1のエラー隠匿装置(603)と、
音声コーデック・フレーム(F)を受信するための第1の入力と、前記少なくともひとつのパラメータ(p1)を受信するための第2の入力と、前記少なくともひとつのパラメータ(p1)に応答して音響信号(a)を提供するための出力とを有する音声復号器(602)と、
を含み、
更に、前記復号器は請求項37に記載のエラー隠匿装置を含み、前記第1の復元信号(yn)が前記音声復号器(602)によって生成された復号された音声信号を構成し、前記第2の復元信号(zn E)が拡張音響信号を構成することを特徴とする、前記復号器。 - 符号化情報の形で受信したデータから音響信号を生成するための復号器であって、
該復号器は、
少なくともひとつのパラメータ(p2)を生成し出力するための第1のエラー隠匿装置(703)と、
音声コーデック・パラメータ(S)を受信するための第1の入力と、前記少なくともひとつのパラメータ(p2)を受信するための第2の入力と、前記少なくともひとつのパラメータ(p2)に応答して励振信号(e)を提供するための出力と、を有する励振生成器(702)と、
を含み、
更に、前記復号器は請求項37に記載のエラー隠匿装置を含み、前記第1の復元信号(yn)が前記励振生成器(702)によって生成された励振信号を構成し、前記第2の復元信号(zn E)が拡張励振信号を構成することを特徴とする、前記復号器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00850171.0 | 2000-10-20 | ||
EP00850171A EP1199709A1 (en) | 2000-10-20 | 2000-10-20 | Error Concealment in relation to decoding of encoded acoustic signals |
PCT/SE2001/001921 WO2002033694A1 (en) | 2000-10-20 | 2001-09-07 | Error concealment in relation to decoding of encoded acoustic signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004512561A true JP2004512561A (ja) | 2004-04-22 |
JP5193413B2 JP5193413B2 (ja) | 2013-05-08 |
Family
ID=8175679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002537001A Expired - Fee Related JP5193413B2 (ja) | 2000-10-20 | 2001-09-07 | 符号化音響信号の復号に関するエラー隠匿 |
Country Status (10)
Country | Link |
---|---|
US (1) | US6665637B2 (ja) |
EP (2) | EP1199709A1 (ja) |
JP (1) | JP5193413B2 (ja) |
KR (1) | KR100882752B1 (ja) |
CN (1) | CN1288621C (ja) |
AT (1) | ATE409939T1 (ja) |
AU (2) | AU2001284608B2 (ja) |
CA (1) | CA2422790A1 (ja) |
DE (1) | DE60136000D1 (ja) |
WO (1) | WO2002033694A1 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008111991A (ja) * | 2006-10-30 | 2008-05-15 | Ntt Docomo Inc | 復号装置、符号化装置、復号方法及び符号化方法 |
JP2009116332A (ja) * | 2007-11-05 | 2009-05-28 | Huawei Technologies Co Ltd | 信号処理方法、処理装置および音声復号器 |
US7957961B2 (en) | 2007-11-05 | 2011-06-07 | Huawei Technologies Co., Ltd. | Method and apparatus for obtaining an attenuation factor |
JP2014507681A (ja) * | 2011-01-24 | 2014-03-27 | ▲ホア▼▲ウェイ▼技術有限公司 | 帯域幅を拡張する方法および装置 |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7068851B1 (en) * | 1999-12-10 | 2006-06-27 | Ricoh Co., Ltd. | Multiscale sharpening and smoothing with wavelets |
US7013267B1 (en) * | 2001-07-30 | 2006-03-14 | Cisco Technology, Inc. | Method and apparatus for reconstructing voice information |
US7206986B2 (en) * | 2001-11-30 | 2007-04-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Method for replacing corrupted audio data |
US7328151B2 (en) * | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
US20040073690A1 (en) | 2002-09-30 | 2004-04-15 | Neil Hepworth | Voice over IP endpoint call admission |
US7359979B2 (en) | 2002-09-30 | 2008-04-15 | Avaya Technology Corp. | Packet prioritization and associated bandwidth and buffer management techniques for audio over IP |
US7729267B2 (en) | 2003-11-26 | 2010-06-01 | Cisco Technology, Inc. | Method and apparatus for analyzing a media path in a packet switched network |
US7835916B2 (en) * | 2003-12-19 | 2010-11-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Channel signal concealment in multi-channel audio systems |
KR100587953B1 (ko) * | 2003-12-26 | 2006-06-08 | 한국전자통신연구원 | 대역-분할 광대역 음성 코덱에서의 고대역 오류 은닉 장치 및 그를 이용한 비트스트림 복호화 시스템 |
US7809556B2 (en) * | 2004-03-05 | 2010-10-05 | Panasonic Corporation | Error conceal device and error conceal method |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
EP1603262B1 (en) * | 2004-05-28 | 2007-01-17 | Alcatel | Multi-rate speech codec adaptation method |
US7978827B1 (en) | 2004-06-30 | 2011-07-12 | Avaya Inc. | Automatic configuration of call handling based on end-user needs and characteristics |
CN101010730B (zh) * | 2004-09-06 | 2011-07-27 | 松下电器产业株式会社 | 可扩展解码装置以及信号丢失补偿方法 |
EP1638337A1 (en) | 2004-09-16 | 2006-03-22 | STMicroelectronics S.r.l. | Method and system for multiple description coding and computer program product therefor |
US8966551B2 (en) | 2007-11-01 | 2015-02-24 | Cisco Technology, Inc. | Locating points of interest using references to media frames within a packet flow |
US9197857B2 (en) | 2004-09-24 | 2015-11-24 | Cisco Technology, Inc. | IP-based stream splicing with content-specific splice points |
KR100612889B1 (ko) * | 2005-02-05 | 2006-08-14 | 삼성전자주식회사 | 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치 |
US8160868B2 (en) * | 2005-03-14 | 2012-04-17 | Panasonic Corporation | Scalable decoder and scalable decoding method |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
CN101213590B (zh) | 2005-06-29 | 2011-09-21 | 松下电器产业株式会社 | 可扩展解码装置及丢失数据插值方法 |
KR100723409B1 (ko) * | 2005-07-27 | 2007-05-30 | 삼성전자주식회사 | 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치 |
KR101040160B1 (ko) * | 2006-08-15 | 2011-06-09 | 브로드콤 코포레이션 | 패킷 손실 후의 제한되고 제어된 디코딩 |
US7738383B2 (en) * | 2006-12-21 | 2010-06-15 | Cisco Technology, Inc. | Traceroute using address request messages |
US7706278B2 (en) * | 2007-01-24 | 2010-04-27 | Cisco Technology, Inc. | Triggering flow analysis at intermediary devices |
ES2642091T3 (es) * | 2007-03-02 | 2017-11-15 | Iii Holdings 12, Llc | Dispositivo de codificación de audio y dispositivo de decodificación de audio |
US7936695B2 (en) | 2007-05-14 | 2011-05-03 | Cisco Technology, Inc. | Tunneling reports for real-time internet protocol media streams |
US8023419B2 (en) | 2007-05-14 | 2011-09-20 | Cisco Technology, Inc. | Remote monitoring of real-time internet protocol media streams |
US8428953B2 (en) * | 2007-05-24 | 2013-04-23 | Panasonic Corporation | Audio decoding device, audio decoding method, program, and integrated circuit |
US7835406B2 (en) * | 2007-06-18 | 2010-11-16 | Cisco Technology, Inc. | Surrogate stream for monitoring realtime media |
US7817546B2 (en) | 2007-07-06 | 2010-10-19 | Cisco Technology, Inc. | Quasi RTP metrics for non-RTP media flows |
EP2289065B1 (en) * | 2008-06-10 | 2011-12-07 | Dolby Laboratories Licensing Corporation | Concealing audio artifacts |
US8218751B2 (en) * | 2008-09-29 | 2012-07-10 | Avaya Inc. | Method and apparatus for identifying and eliminating the source of background noise in multi-party teleconferences |
US8301982B2 (en) | 2009-11-18 | 2012-10-30 | Cisco Technology, Inc. | RTP-based loss recovery and quality monitoring for non-IP and raw-IP MPEG transport flows |
CN102648493B (zh) * | 2009-11-24 | 2016-01-20 | Lg电子株式会社 | 音频信号处理方法和设备 |
US8819714B2 (en) | 2010-05-19 | 2014-08-26 | Cisco Technology, Inc. | Ratings and quality measurements for digital broadcast viewers |
US8774010B2 (en) | 2010-11-02 | 2014-07-08 | Cisco Technology, Inc. | System and method for providing proactive fault monitoring in a network environment |
US8559341B2 (en) | 2010-11-08 | 2013-10-15 | Cisco Technology, Inc. | System and method for providing a loop free topology in a network environment |
EP2458585B1 (en) * | 2010-11-29 | 2013-07-17 | Nxp B.V. | Error concealment for sub-band coded audio signals |
US8982733B2 (en) | 2011-03-04 | 2015-03-17 | Cisco Technology, Inc. | System and method for managing topology changes in a network environment |
US8670326B1 (en) | 2011-03-31 | 2014-03-11 | Cisco Technology, Inc. | System and method for probing multiple paths in a network environment |
US8724517B1 (en) | 2011-06-02 | 2014-05-13 | Cisco Technology, Inc. | System and method for managing network traffic disruption |
US8830875B1 (en) | 2011-06-15 | 2014-09-09 | Cisco Technology, Inc. | System and method for providing a loop free topology in a network environment |
US9450846B1 (en) | 2012-10-17 | 2016-09-20 | Cisco Technology, Inc. | System and method for tracking packets in a network environment |
KR101855021B1 (ko) * | 2013-02-05 | 2018-05-04 | 텔레폰악티에볼라겟엘엠에릭슨(펍) | 오디오 프레임 손실 은폐 |
KR101987894B1 (ko) * | 2013-02-12 | 2019-06-11 | 삼성전자주식회사 | 보코더 잡음 억제 방법 및 장치 |
KR101475894B1 (ko) * | 2013-06-21 | 2014-12-23 | 서울대학교산학협력단 | 장애 음성 개선 방법 및 장치 |
BR112015031343B1 (pt) | 2013-06-21 | 2021-12-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método que realizam conceitos aperfeiçoados para tcx ltp |
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
CN104751849B (zh) * | 2013-12-31 | 2017-04-19 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
JP6472600B2 (ja) * | 2014-03-18 | 2019-02-20 | 株式会社アストロスケール | 宇宙用装置、デブリ除去システム及びデブリ除去方法 |
CN107369455B (zh) | 2014-03-21 | 2020-12-15 | 华为技术有限公司 | 语音频码流的解码方法及装置 |
NO2780522T3 (ja) * | 2014-05-15 | 2018-06-09 | ||
WO2020164753A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and decoding method selecting an error concealment mode, and encoder and encoding method |
CN111009257B (zh) * | 2019-12-17 | 2022-12-27 | 北京小米智能科技有限公司 | 一种音频信号处理方法、装置、终端及存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL8400728A (nl) * | 1984-03-07 | 1985-10-01 | Philips Nv | Digitale spraakcoder met basisband residucodering. |
US5630011A (en) * | 1990-12-05 | 1997-05-13 | Digital Voice Systems, Inc. | Quantization of harmonic amplitudes representing speech |
DE69232729T2 (de) * | 1991-05-29 | 2003-04-24 | Pacific Microsonics Inc | Verbesserungen in Systemen zum Erreichen von grösserer Frequenz-Auflösung |
SE503547C2 (sv) * | 1993-06-11 | 1996-07-01 | Ericsson Telefon Ab L M | Anordning och förfarande för döljande av förlorade ramar |
SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
CA2142391C (en) * | 1994-03-14 | 2001-05-29 | Juin-Hwey Chen | Computational complexity reduction during frame erasure or packet loss |
US5615298A (en) * | 1994-03-14 | 1997-03-25 | Lucent Technologies Inc. | Excitation signal synthesis during frame erasure or packet loss |
KR970011728B1 (ko) * | 1994-12-21 | 1997-07-14 | 김광호 | 음향신호의 에러은닉방법 및 그 장치 |
US5701390A (en) * | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
JPH1091194A (ja) * | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6041297A (en) * | 1997-03-10 | 2000-03-21 | At&T Corp | Vocoder for coding speech by using a correlation between spectral magnitudes and candidate excitations |
US5907822A (en) * | 1997-04-04 | 1999-05-25 | Lincom Corporation | Loss tolerant speech decoder for telecommunications |
FR2762464B1 (fr) * | 1997-04-16 | 1999-06-25 | France Telecom | Procede et dispositif de codage d'un signal audiofrequence par analyse lpc "avant" et "arriere" |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
FR2774827B1 (fr) * | 1998-02-06 | 2000-04-14 | France Telecom | Procede de decodage d'un flux binaire representatif d'un signal audio |
US6810377B1 (en) * | 1998-06-19 | 2004-10-26 | Comsat Corporation | Lost frame recovery techniques for parametric, LPC-based speech coding systems |
US6377915B1 (en) * | 1999-03-17 | 2002-04-23 | Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. | Speech decoding using mix ratio table |
DE19921122C1 (de) * | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
-
2000
- 2000-10-20 EP EP00850171A patent/EP1199709A1/en not_active Withdrawn
-
2001
- 2001-09-07 CA CA002422790A patent/CA2422790A1/en not_active Abandoned
- 2001-09-07 AU AU2001284608A patent/AU2001284608B2/en not_active Ceased
- 2001-09-07 EP EP01963679A patent/EP1327242B1/en not_active Expired - Lifetime
- 2001-09-07 DE DE60136000T patent/DE60136000D1/de not_active Expired - Fee Related
- 2001-09-07 AT AT01963679T patent/ATE409939T1/de not_active IP Right Cessation
- 2001-09-07 KR KR1020037004048A patent/KR100882752B1/ko active IP Right Grant
- 2001-09-07 JP JP2002537001A patent/JP5193413B2/ja not_active Expired - Fee Related
- 2001-09-07 AU AU8460801A patent/AU8460801A/xx active Pending
- 2001-09-07 WO PCT/SE2001/001921 patent/WO2002033694A1/en active IP Right Grant
- 2001-09-07 CN CNB018175899A patent/CN1288621C/zh not_active Expired - Fee Related
- 2001-10-19 US US09/982,028 patent/US6665637B2/en not_active Expired - Lifetime
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008111991A (ja) * | 2006-10-30 | 2008-05-15 | Ntt Docomo Inc | 復号装置、符号化装置、復号方法及び符号化方法 |
JP2009116332A (ja) * | 2007-11-05 | 2009-05-28 | Huawei Technologies Co Ltd | 信号処理方法、処理装置および音声復号器 |
JP4586090B2 (ja) * | 2007-11-05 | 2010-11-24 | 華為技術有限公司 | 信号処理方法、処理装置および音声復号器 |
US7957961B2 (en) | 2007-11-05 | 2011-06-07 | Huawei Technologies Co., Ltd. | Method and apparatus for obtaining an attenuation factor |
US8320265B2 (en) | 2007-11-05 | 2012-11-27 | Huawei Technologies Co., Ltd. | Method and apparatus for obtaining an attenuation factor |
JP2014507681A (ja) * | 2011-01-24 | 2014-03-27 | ▲ホア▼▲ウェイ▼技術有限公司 | 帯域幅を拡張する方法および装置 |
Also Published As
Publication number | Publication date |
---|---|
CN1288621C (zh) | 2006-12-06 |
CA2422790A1 (en) | 2002-04-25 |
DE60136000D1 (de) | 2008-11-13 |
WO2002033694A1 (en) | 2002-04-25 |
KR20030046463A (ko) | 2003-06-12 |
ATE409939T1 (de) | 2008-10-15 |
EP1327242A1 (en) | 2003-07-16 |
AU2001284608B2 (en) | 2007-07-05 |
EP1327242B1 (en) | 2008-10-01 |
KR100882752B1 (ko) | 2009-02-09 |
EP1199709A1 (en) | 2002-04-24 |
CN1470049A (zh) | 2004-01-21 |
JP5193413B2 (ja) | 2013-05-08 |
AU8460801A (en) | 2002-04-29 |
US20020072901A1 (en) | 2002-06-13 |
US6665637B2 (en) | 2003-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5193413B2 (ja) | 符号化音響信号の復号に関するエラー隠匿 | |
AU2001284608A1 (en) | Error concealment in relation to decoding of encoded acoustic signals | |
RU2419891C2 (ru) | Способ и устройство эффективной маскировки стирания кадров в речевых кодеках | |
US6810377B1 (en) | Lost frame recovery techniques for parametric, LPC-based speech coding systems | |
DE60220485T2 (de) | Verfahren und Vorrichtung zur Verschleierung von Rahmenausfall von prädiktionskodierter Sprache unter Verwendung von Extrapolation der Wellenform | |
CN105765651B (zh) | 使用错误隐藏提供经解码的音频信息的音频解码器及方法 | |
US6654716B2 (en) | Perceptually improved enhancement of encoded acoustic signals | |
EP1141946B1 (en) | Coded enhancement feature for improved performance in coding communication signals | |
MXPA04011751A (es) | Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal. | |
KR101398189B1 (ko) | 음성수신장치 및 음성수신방법 | |
JP5222452B2 (ja) | 音響信号の符号化の知覚的改善 | |
EP3217398B1 (en) | Advanced quantizer | |
AU2001284607A1 (en) | Perceptually improved enhancement of encoded acoustic signals | |
AU2001284606A1 (en) | Perceptually improved encoding of acoustic signals | |
US10672411B2 (en) | Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110617 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20110920 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20110928 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111017 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111024 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111117 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120703 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121003 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121011 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121105 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121112 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121203 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130204 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5193413 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160208 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |