JP2007065679A - 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替 - Google Patents

音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替 Download PDF

Info

Publication number
JP2007065679A
JP2007065679A JP2006273448A JP2006273448A JP2007065679A JP 2007065679 A JP2007065679 A JP 2007065679A JP 2006273448 A JP2006273448 A JP 2006273448A JP 2006273448 A JP2006273448 A JP 2006273448A JP 2007065679 A JP2007065679 A JP 2007065679A
Authority
JP
Japan
Prior art keywords
frame
speech
bad
decoder
spectral
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006273448A
Other languages
English (en)
Inventor
Jari Maekinen
メキネン、ヤリ
Hannu J Mikkola
イー ミッコラ、ハッヌ
Janne Vainio
ヴァイノ、ヤッネ
Jani Rotola-Pukkila
ロトラ−プッキラ、ヤニ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=22915004&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2007065679(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2007065679A publication Critical patent/JP2007065679A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Abstract

【課題】合成音声を提供する際に複合器によって複合化されるフレーム中のフレームエラーの影響を隠蔽するための方法および装置の提供。
【解決手段】音声複合器によって通信チャネル経由で受信された不良フレームの影響を前記不良フレーム(劣化フレームまたは損失フレームのいずれかである不良フレーム)のパラメータの値を、最近受信した有効フレームの少なくとも部分的な適応平均値にもとづく値で代替することによって隠蔽される。しかしながら、(損失フレームに対向する)劣化フレームの場合、もし前記不良フレームが所定の基準を満たせば、不良フレーム自体を使用する。隠蔽の目的は、不良フレームに最も適したパラメータを見つけだし、合成音声の主体的品質を可能な限り高くすることである。
【選択図】図7

Description

本発明は、音声復号器(speech decoder)に関し、より詳しくは音声復号器によって受信される不良フレームを処理するために用いられる方法に関する。
デジタルセルラシステムにおいて、ビットストリーム(bit stream)が、無線で移動局を基地局と接続している通信チャネルを介して送信されると言われる。ビットストリームは、音声フレームを含むフレームで構成されている。送信中にエラーが生じるか否かは、現在のチャネルの条件に依存する。エラーを含んで検出された音声フレームは単に不良フレーム(bad frame)と呼ばれる。従来技術においては、不良フレームの場合、過去の(誤差のない音声フレームの)正しいパラメータから導出される音声パラメータが不良フレームの音声パラメータに代替される。このような代替を行なうことにより不良フレームを処理する目的は、音声品質における顕著な劣化を引き起こさずに、エラーのある音声フレームの原型が損なわれた音声パラメータを隠すことである。
近年の音声コーデック(codec)は、音声信号を短い断片、すなわち、前記フレームにおいて処理することによって動作する。音声コーデックの典型的なフレーム長は20msであり、8kHzのサンプリング周波数を仮定すると160音声サンプルに相当する。いわゆる広帯域コーデックにおいて、フレーム長は再び20msとすることができるが、16kHzのサンプリング周波数を仮定すると320の音声サンプルに対応できる。フレームはさらに複数のサブフレームに分割されてもよい。
あらゆるフレームに対し、符号器(encoder)は入力信号のパラメータ表示を決定する。パラメータは量子化されたのち、デジタル形式で通信チャネルを伝わって送信される。復号器は受信したパラメータにもとづき合成された音声信号を生成する(図1参照)。
抽出された典型的な符号化パラメータのセットは、短期間の予測において使用されるスペクトルパラメータ(いわゆる線形予測符号化パラメータ、またはLPC)、信号の長期間予測に使用されるパラメータ(いわゆる長期予測パラメータ、またはLTP)、種々の利得パラメータ、および最後に励振パラメータを含んでいる。
線形予測符号化と呼ばれるものは、通信チャネルで送信するために音声の符号化に広範に使用され成功している方法である。線形予測符号化は声道(vocal tract)の周波数形状の特性を表す。LPCパラメータ化することにより音声の短い断片のスぺクトル形状を特徴づける。LPCパラメータは、LSF(線スペクトル周波数)、または同等に、ISP(イミッタンススペクトル対)として表すことができる。IPSは逆フィルタ変換関数A(z)を、1つは偶対称性、他の1つは奇対称性を有する2つの変換関数のセットに分解することによって得られる。当該ISPは、イミッタンススペクトル周波数(ISF)とも呼ばれ、z単位円上のこれらの多項式の根である。線スペクトル対(線スペクトル周波数とも呼ばれる)は、イミッタンススペクトル対と同じ方法で定義することができる。これらの表示の差異はLPフィルタ係数を別のLPCパラメータ表示(LSPまたはISP)に変換する変換アルゴリズムである。
ときに、符号化された音声パラメータが送信される通信チャネルの状態がよくなく、ビットストリームのエラー、すなわちフレームエラー(そして不良フレーム)を引き起こすことがある。損失したフレーム(lost frame)および劣化したフレーム(corrupted frame)という2種類のフレームエラーが存在する。劣化したフレームの場合、特定の音声セグメント(典型的に20msの時間)を記述するいくつかのパラメータのみが損なわれる。フレーム損失型フレームエラーにおいては、あるフレームが全体的に劣化するか、またはまったく受信されないかのいずれかである。
通常のインターネット接続により時々提供されるような、パケットにもとづく音声通信のための送信システム(1つのフレームが通常単一パケットとして伝えられるシステム)においては、データパケット(またはフレーム)が目的の受信機に決して到着しないか、またはデータパケット(またはフレーム)の到着が非常に遅く、会話音声の同時性のために使用できないということがあり得る。このようなフレームは損失フレーム(lost frame)と呼ばれる。このような状況における劣化フレーム(corrupted frame)は、確かに受信機に(通常単一パケット内で)到着するが、たとえばサイクリック冗長チェック(cyclic redundancy check:CRC)により表示されるようにエラー状態にあるいくつかのパラメータを含んだフレームである。これは、移動体通信接続のグローバルシステム(GSM)接続における接続などのような、通常回路切替接続(circuit-switched connection)における状況である。GSMにおいては劣化フレームにおけるビットエラー率(BER)は、典型的には5%以下である。
こうして、不良フレームの2つの場合(劣化フレームおよび損失フレーム)に対して、不良フレームの発生に対する最適な訂正の応答方法が異なることがわかる。劣化フレームの場合、パラメータについて低い信頼性の情報が存在し、損失フレームの場合、情報が入手できないために異なる応答が存在する。
従来技術によれば、受信された音声フレームにエラーが検出されたとき、代替およびミューティング手続が開始される。不良フレームの音声パラメータは、過去の有効なフレーム(good frame)の減衰値か修正値により代替される。もっとも、エラーを含んだフレームから、たとえば、符号励振線形予測パラメータ(CELP)、または、より簡単には励振パラメータなど、最小限の重要なパラメータのいくつかが使用される。
従来技術によるいくつかの方法において、パラメータ履歴と呼ばれるバッファが(受信機において)使用され、バッファにはエラーなく受信された最新の音声パラメータが格納される。あるフレームがエラーなく受信されるとき、パラメータ履歴は更新され、フレームによって伝えられた音声パラメータは復号化に使用される。不良フレームがCRCチェックまたは他のあるエラー検出方法によって検出されると、不良フレームインジケータ(BFI)が真に設定されて、パラメータの隠蔽(concealment)(対応する不良フレームの代替およびミューティング)が始まる。従来技術におけるパラメータの隠蔽の方法は、劣化フレームの隠蔽のためにパラメータ履歴を用いる。前記のように、受信されたフレームが不良フレームとして区別(BFIが真に設定)されるとき、不良フレームからのいくつかの音声パラメータは使用されてもよい。たとえば、ETSI(欧州電気通信標準化機構)規格06.91において与えられるGSM AMR(adaptive multi-rate)音声コーデックの劣化フレーム代替のための対応策例では、チャネルからの励振ベクトルが常時使用される。音声フレームが損なわれる(たとえば、いくつかのIPにもとづく送信システムにおけるなどの、フレームが使用されるにはあまりに遅く到着する状況も含む)ときは、使用すべき損失フレームからいかなるパラメータも明らかに利用できない。
いくつかの従来のシステムにおいて、受信されたすぐ前の良好なスペクトルパラメータは、一定の所定平均値に向かいわずかにシフトされたのち、不良フレームのスペクトルパラメータの代わりに代替される。GSM06.91ETSI基準によれば、隠蔽はLSFフォーマットでなされ、つぎのアルゴリズム
i=0からN−1に対し、
Figure 2007065679
で与えられる。ここで、α=0.95であり、Nは使用される線形予測(LP)フィルタの次数である。量LSF_q1は、第2サブフレームの量子化されたLSFベクトルであり、量LSF_q2は、第4サブフレームの量子化されたLSFベクトルである。第1および第3サブフレームのLSFベクトルは、前記2つのベクトルから補間される。(フレームnにおける第1サブフレームのLSFベクトルは、フレームn−1すなわち過去のフレームにおける第4サブフレームのLSFベクトルから補間される)量past_LSF_qは、過去フレームからの量LSF_q2である。量mean_LSFは成分が予め決められた定数のベクトルであり、その成分は復号化された音声シーケンスに依存しない。一定の成分を有する量mean_LSFは、一定の音声スペクトルを生成する。
そのような従来技術システムは、常にスペクトル係数を一定量、ここではmean_LSF(i)として示される量に向かってシフトさせる。その一定量は長時間かつ数個の連続的なトーカ(talker)にわたり平均することによって構成される。したがって、そのようなシステムは妥協的解決策を提示するのみであって、特別な話者または状況のための最適な解決策も提示しない。妥協の代償は、合成された音声における悩ましいアーチファクト(artifact)を放置することと、合成音声がどう聞こえるかという点で(すなわち、合成音声の品質という点で)音声をより自然にすることとのあいだにある。
劣化した音声フレームの場合、改善されたスペクトルパラメータ代替、もしかすると音声パラメータ履歴およびエラーを含むフレーム両方の解析に基づく代替が必要とされている。エラーを含む音声フレームの適切な代替は、ビットストリームから生成される合成音声の品質に重大な効果を有する。
したがって、本発明は、合成音声を提供する際に復号器によって復号化されるフレーム中のフレームエラーの影響を隠蔽するための方法および対応する装置を提供し、フレームは通信チャネルを伝わって復号器へ提供され、各フレームは音声を合成する際に復号器によって使用されるパラメータを提供し、その方法は、フレームが不良フレームであるか否かを判断するステップと、最も最近に受信された有効なフレームの所定数のスペクトルパラメータの少なくとも部分的な適応(adaptive)平均値に基づいて不良フレームのパラメータの代替を与えるステップとを有する。
本発明の別の態様では、その方法が、不良フレームが定常的音声を伝達するのか、それとも非定常的音声を伝達するのかを判断するステップを含み、加えて、不良フレームが定常的音声を伝達するのか、あるいは非定常的音声を伝達するのかに依存する方法で不良フレームに代替を提供するステップが実行される。本発明のさらに追加の態様では、定常的音声を伝達する不良フレームの場合、不良フレームの代替を提供するステップは、最も最近受信された有効なフレームの所定数のパラメータの平均値を使用して実行される。本発明の別のさらなる態様では、非定常的音声を伝達する不良フレームの場合、不良フレームに代替を与えるステップが、多くとも、所定数の最も最近受信された有効なフレームのパラメータの平均値の所定の部分を使用して実行される。
本発明の別の追加態様では、その方法は、不良フレームが所定の基準を満たすかどうかを判断し、満たす場合には、不良フレームを代替する代わりに不良フレームを使用するステップも含む。このようなステップを有する本発明のさらなる追加の態様では、所定の基準は、4つの比較、つまりフレーム間比較、フレーム内比較、2点比較、および単一点比較のうちの1または2以上を行なうことを含んでいる。
別の観点から、本発明は、合成音声を提供する際に復号器によって復号化されるフレーム中のフレームエラーの影響を隠す方法であり、フレームは通信チャネルを伝わって復号器に提供され、それぞれのフレームが音声を合成する際に復号器によって使用されるパラメータを提供し、フレームが不良フレームであるか否かを判断するステップと、過去のイミタンススペクトル周波数(ISF)が以下により与えられる部分的適応平均値に向けてシフトされる、不良フレームのパラメータの代替を提供する工程とを含み、
Figure 2007065679
ここで、α=0.9であり、
ISFq(i)は、カレントフレームのISFベクトルのi番目の成分であり、
past_ISFq(i)は、過去のフレームからのISFベクトルのi番目の成分であり、ISFmean(i)は適応平均値と一定の所定平均値ISFベクトルの組み合わせであるベクトルのi番目の成分であり、つぎの式、
Figure 2007065679
を用いて計算される。ここで、β=0.75であり、
Figure 2007065679
であり、ISFadaptive_mean(i)は、
BFI=0の場合に必ず更新され、ここでBFIは不良フレームインジケータであり、ISFconst_mean(i)はISFベクトルの長期平均値から形成されるベクトルのi番目の成分である、
本発明の前記および他の目的、特徴および優位点は、添付図面と関連して提示される以後の詳細な説明を検討することから明らかになるだろう。
本発明にしたがって、音声信号が通信路を通って送信された後に不良フレームが復号器によって検出されるとき(図1)、音声信号の劣化したスペクトルパラメータは、通信チャネルを通って最近通信されたスペクトルパラメータの分析に基づいて(他のスペクトルパラメータで劣化したパラメータの代わりに代替することにより)隠される。不良フレームの劣化したスペクトルパラメータを効果的に隠すことは、劣化したスペクトルパラメータがアーチファクト(明らかに音声ではない可聴音)を引き起こす可能性があるためだけではなく、以後のエラーのない音声フレームの主観的品質(subjective quality)が(少なくとも線形予測量子化が使用されるときに)低下するために重要である。
本発明による分析は、線スペクトル周波数(LSF)などのスペクトルパラメータのスペクトル影響(spectral impact)の局所化した性質も利用する。LSFのスペクトル影響は、1つのLSFパラメータが量子化およびコード化プロセスによって逆に変化する場合に、LPスペクトルがLSFパラメータによって表される周波数の近くだけで変化し、スペクトルの残りを未変更のまま残すという点で局所化していると言われている。
損失フレームまたは劣化フレームのいずれかに対する一般的発明
本発明によれば、アナライザは、過去に受信された音声パラメータの履歴に基づき、不良フレームの場合のスペクトルパラメータ隠蔽を判断する。アナライザは、復号化される音声信号の種類(つまり、それが定常的であるか、それとも非定常的であるか)を判断する。音声パラメータの履歴は、復号化された音声信号(定常的として、または非定常的として、および詳細には有声か、有声ではないか)を分類するために使用される。使用される履歴は、おもにLTPおよびスペクトルパラメータの最も最近の値から導き出すことができる。
定常的音声信号および有声音声信号という用語は、実際には同義である。有声音声シーケンスは、通常、相対的に定常的な信号であるが、無声の音声シーケンスは通常定常的な信号ではない。われわれは、その専門用語がより正確であるため、定常的音声信号および非定常的音声信号という専門用語を明細書中で使用する。
フレームは、フレームに対応する音声のフレームで示されるように、総励振(total excitation)のパワーに対する適応型励振(adaptive excitation)のパワーの比率にしたがって有声または無声(および、定常的または非定常的とも)として分類できる(フレームは、適応型励振と総励振の両方ともがそれにしたがって構成されるパラメータを含む。このようにした後に、総パワーが計算できる)。
音声シーケンスが定常的である場合、前述したように、劣化したスペクトルパラメータを隠す従来の技術による方法は特に効果的なものではない。これは定常的な隣接スペクトルパラメータがゆっくりと変化するため、過去の有効なスペクトル値(劣化したり、損失していないスペクトル値)は通常次のスペクトル係数にとって有効な推定値であり、さらに具体的には、従来の技術が不良スペクトルパラメータの代わりに(それらを隠すために)使用する、定数平均値に向かって動かされる過去のフレームからのスペクトルパラメータより優れている。図2は、定常的音声信号(およびより具体的にはに有声音声信号)について、スペクトルパラメータの1つの例としてLSTの特性を示す。図2は、定常的音声の隣接フレームのLSF係数[0...4kHz]を示しており、Y軸は周波数で、X軸はフレームであり、LSFが定常的音声についてフレームからフレームへ相対的にゆっくりと変化することを示している。
定常的音声セグメントのあいだ、本発明により以下のアルゴリズムを使用して隠蔽が(損失フレームまたは劣化フレームのどちらかについて)実行される。
i=0からN−1(フレーム内の要素)に対し、
Figure 2007065679
ここで、αは概ね0.95であり得て、NはLPフィルタの次数であり、Kは適応長である。LSF_q1(i)は第2ブフレームの量子化されたLSFのベクトルであり、LSF_q2(i)は、第4サブフレームの量子化されたLSFベクトルである。第1サブフレームと第3サブフレームのLSFベクトルは、これら2つのベクトルから補間される。量past_LSF_qood(i)(0)は、過去の有効なフレームからの量LSF_q2(i-1)の値に等しい。量past_LSF_good(i)(n)は、n+1回前の有効なフレーム(つまり、現在の不良フレームにn+1フレーム分先行する)からのLSFパラメータのベクトルの成分である。最後に、量adaptive_mean_LSF(i)は、過去の有効なLSFベクトルの平均値(算術平均)である(つまり、それはベクトル量の成分であり、各成分は過去の有効なLSFベクトルの対応する成分の平均である)。
本発明の適応平均法が、従来の技術の方法と比較して合成音声の主観的品質を改善することが立証された。立証は、音声がエラーを誘発する通信チャネルを通して送信されるシミュレーションを使用した。不良フレームが検出されるたびに、スペクトル誤差が計算された。スペクトル誤差は、元のスペクトルから、不良フレームのあいだに隠蔽に使用されたスペクトルを差し引くことによって得られた。絶対誤差は、スペクトル誤差から絶対値を取ることにより計算される。図4および図5は、それぞれ従来の技術の場合と、本発明の方法の場合のLSFの絶対偏差エラーのヒストグラムを示している。最適な誤差の隠蔽はゼロに近い誤差を有する。つまり、誤差がゼロに近いとき、隠蔽に使用されるスペクトルパラメータは元の(劣化しているか、あるいは損失している)スペクトルパラメータに非常に近い。図4および図5のヒストグラムから分かるように、本発明の適応平均法(図5)は、定常的音声シーケンスのあいだ、従来の技術の方法(図4)よりうまく誤差を隠している。
前述されたように、非定常的信号(つまり、より不正確には無声信号)のスペクトル係数は、図3に示されるように、隣接するフレーム間で変動する。図3は、非定常的音声の場合の隣接するフレームのLSFを示し、Y軸が周波数であり、X軸がフレームのグラフである。このような場合、最適な隠蔽方法は定常的音声信号の場合でと同じではない。非定常的音声の場合、本発明は、以下のアルゴリズム(非定常的アルゴリズム)にしたがって、不良(劣化している、または損失している)非定常的音声セグメントに隠蔽を提供する。つまり、
i=0からN−1に対し、
Figure 2007065679
であり、この場合、NはLPフィルタの次数であり、αは通常約0.90であり、LSF_q1(i)とLSF_q2(i)は式(2.1)におけるように、カレントフレームのLSFベクトルの2つの集合であり、past_LSF_q(i)は過去の有効なフレームからのLSF_q2(i)であり、partly_adaptive_mean_LSF(i)は適応平均LSFベクトルと平均LSFベクトルの組み合わせであり、adaptive_mean_LSF(i)は最新のK個の有効なLSFベクトル(BFIが設定されていないときに更新される)の平均であり、mean_LSF(i)は定数平均値LSFであり、音声を合成するために使用されるコーデックの設計プロセス中に生成される。それは、いくつかの音声データベースの平均LSFである。パラメータβは約0.75である。βは、通常、非定常と対比して音声が定常的である程度を表すために使用される値である(それは、固定コードブック励振エネルギー(fixed codebook excitation energy)に対する長期予測励振エネルギーの比率に基づき、つまりさらに正確には、以下の公式を使用して計算されることもある。つまり、
Figure 2007065679
であり、この場合
Figure 2007065679
ここで、energypitchはピッチ励振(pitch excitation)のエネルギーであり、energyinnovationは革新コード励振(innovation code excitation)のエネルギーである。エネルギーの大部分が長期予測励振にあるとき、復号化される音声は、たいていは定常的である。エネルギーの大部分が固定コードブック励振にあるときには、音声は、たいていは非定常的である)。
β=1.0である場合、式(2.3)は、従来の技術である式(1.0)に変わる。β=0.0である場合、式(2.3)は、定常的セグメントについて本発明によって使用される式(2.1)に変わる。(複雑度を妥当なレベルに保つことが重要である応用例における)複雑度に敏感なインプリメンテーションの場合には、定常的セグメントと非定常的セグメントの両方について、βをなんらかの妥協値、たとえば0.75に固定することができる。損失フレームに対するスペクトルパラメータ隠蔽。
損失フレームの場合、過去のスペクトルパラメータの情報だけを使用できる。代替されるべきスペクトルパラメータは、たとえばスペクトル値およびLTP(長期予測)値のパラメータ履歴に基づいた基準にしたがって計算される。LTPパラメータは、LTP(長期予測)利得およびLTP(長期予測)遅延値を含む。LTP(長期遅延予測)は、カレントフレームの過去のフレームに対する相関性を表す。たとえば、代替されるべきスペクトルパラメータを計算するために使用される基準は、最後の有効なLSFが適応LSF平均値によって修正されるべきか、または従来の技術におけるように定数平均値によって修正されるべきかという状況を区別できる。
特に劣化フレーム用の代替スペクトルパラメータ隠蔽
音声フレームが(損失しているのとは対照的に)劣化しているとき、本発明の隠蔽手順をさらに最適化することができる。このような場合、スペクトルパラメータは、音声復号器で受信されるときに完全にまたは部分的に正しい場合があり得る。たとえば、(通常のTCP/IPインターネット接続におけるように)パケットをベースにした接続では、TCP/IP型の接続を使用する場合、通常すべての不良フレームが損失フレームであるために、劣化フレームの隠蔽方法は通常可能ではない。しかしながら、回路切替式のGSMまたはEDGE接続でのような他の種類の接続の場合、本発明の劣化フレームの隠蔽方法を使用することができる。したがって、パケット切替接続(packet switched connection)の場合、以下の代替方法を使用することはできないが、回路切替接続の場合、このような接続では、不良フレームは少なくともときおり(および実際には通常)劣化フレームだけであるため、以下の代替方法を使用することができる。
CRCチェックまたはチャネル復号化プロセスで使用される他のエラー検出機構の後にBFIフラグが設定されるとき、GSMの仕様にしたがって不良フレームが検出される。エラー検出機構は、主観的に最上位の(most significant)ビット、つまり合成音声の品質に最大の影響を及ぼすビットにおけるエラーを検出するために使用される。いくつかの従来の技術の方法では、フレームが不良フレームであることが示されているとき、これらの最上位のビットは使用されない。しかしながら、フレームは(BFIフラグを設定するには1つでも十分であるが)数個のビットエラーしか有さないことがあるため、たとえビットの大部分が正しくても、フレーム全体を廃棄することがあり得る。CRCチェックは、単にフレームが誤ったフレームを有するか否かを検出するだけであるが、BER(ビット誤り率)の推定は行なわない。図6は、不良フレームが検出されるときにビットがどのように従来の技術にしたがって分類されるのかを示す。図6では、CRCチェックに含まれるフレームのいくつかのビットが破壊され、したがってBFIが1に設定される条件で、単一のフレームが一度に1ビットづつ(左から右へ)通信チャネル上を復号器へ通信中として示されている。
図6から分かるように、受信されたフレームが多くの正しいビットを含むことがあっても(フレーム中のBERは、チャネル条件が相対的に良好であるときには通常小さい)、従来の技術はそれらを使用しない。対照的に、本発明は、受信されたパラメータが劣化しているのかどうかを推定しようと試み、パラメータが劣化していない場合には、発明された方法はそれらを使用する。
表1は、適応マルチレート(AMR)広帯域(WB)復号器の例における本発明による劣化フレーム隠蔽の背景にある考え方を明示している。
Figure 2007065679
AMR WB(適応マルチレート広帯域)復号器の場合、毎秒12.65kbitのモードは、チャネル搬送波対干渉比(channel carrier to interference ratio:C/I)が約9dBから10dBの範囲内にあるときに使用するのに優れた選択肢である。表1から、GMSK(ガウス最小シフトキーイング)変調方式を使用するC/Iが9dBから10dBの範囲にあるGSMチャネル状況の場合に、受信された不良フレームの約35%から50%が完全に正しいスペクトルを有することが分かる。また、すべての不良フレームスペクトルパラメータ係数の約75%から85%が正しい。前述されたように、スペクトル影響の局所化した性質のため、スペクトルパラメータ情報を不良フレームで使用することができる。C/Iが6dBから8dBの範囲内、または範囲以下であるチャネル状況は非常に質が悪いので、毎秒12.65kbitのモードを使用してはならない。代わりに、他のなんらかのさらに低いモードを使用しなければならない。
劣化フレームの場合の本発明の基本的な考えは、(後述される)基準にしたがって、劣化フレームからのチャネルビットが、その劣化フレームを復号化するために使用されるということである。スペクトル係数の基準は、復号化される信号の音声パラメータの過去の値に基づいている。不良フレームが検出されるとき、受信されたLSFまたはチャネル上で通信された他のスペクトルパラメータは、基準が満たされる場合に使用される。言い換えると、受信されたLSFが基準を満たす場合、それらは、丁度フレームが不良フレームでない場合にそれらが使用されるように、復号化の際に使用される。それ以外の場合、つまりチャネルからのLSFが基準を満たさない場合、不良フレームのスペクトルは、式(2.1)または(2.2)を使用して前述の隠蔽方法にしたがって計算される。スペクトルパラメータを受け入れるための基準は、たとえば、いわゆるItakura-Saito法スペクトル距離の計算などのスペクトル距離計算を使用して実現され得る(たとえば、ジョン・アール・デラー・ジュニア、ジョン・エイチ・エル・ハンセンおよびジョン・ジー・プロアキス,「音声信号の離散時間処理(Discrete-Time Processing of Speech Signals)」、IEEEプレス,2000年,p.329参照)。
チャネルからスペクトルパラメータを受け入れるための基準は、定常的音声信号の場合には非常に厳格でなければならない。図3に図示されるように、スペクトル係数は定常的シーケンス中、(その名のとおりに)非常に安定しているので、定常的音声信号の劣化しているLSF(または他の音声パラメータ)が通常容易に検出できる。(というのは、定常的音声信号の劣化しているLSF(または他の音声パラメータ)は、それらが劣化していない隣接フレームのLSFと劇的に異なることに基づいて、劣化していないLSFから区別可能であるからである)他方、非定常的音声信号の場合、基準はそれほど厳格である必要はない。つまり、非定常的音声信号のスペクトルは、より大きな変化量を有することができる。非定常的音声(つまり、多かれ少なかれ無声音声)の場合、音声パラメータが正しいかどうかに関わりなく可聴アーチファクトが起こりにくいため、非定常的音声信号の場合、正しいスペクトルパラメータの正確さは可聴アーチファクトに関して厳格ではない。言い換えると、たとえスペクトルパラメータのビットが劣化しても、いくつかの劣化しているビットを含む非定常的音声のスペクトルパラメータは通常可聴アーチファクトを発生しないために、それらは依然として基準にしたがって許容できる。本発明にしたがって、合成音声の主観的品質は、受信されたLSFについてのすべての入手可能な情報を使用することによって、および伝達されている音声の特性にしたがってどのLSFを使用するのかを選択することによって劣化フレームの場合にできる限り小さく減ぜられなければならない。
したがって、本発明は劣化フレームを隠す方法を含んでいるが、本発明は、非定常的音声を伝達する劣化フレームの場合に、代替策として、満たされるならば劣化フレームをそのまま復号器に使用させる基準を使用することを包含する。言い換えれば、たとえBFIが設定されていても、フレームが使用されるであろう。該基準は、本質的には、使用できる劣化フレームと、使用できない劣化フレームを区別するために使用される閾値である。その閾値は、劣化フレームのスペクトルパラメータが最も最近受信された有効なフレームのスペクトルパラメータとどの程度異なるのかに基づく。
劣化している可能性のあるスペクトルパラメータを使用することは、おそらく、劣化しているLTP遅延値などの他の劣化しているパラメータを使用することより可聴アーチファクトに敏感である。このため、おそらく劣化しているスペクトルパラメータを使用するかどうかを判断するために使用される基準は特に信頼性がなければならない。いくつかの実施の形態では、基準として(過去のフレームの対応するスペクトルパラメータからの)最大スペクトル距離を使用するのが有利である(疑わしいスペクトルパラメータが最大スペクトル距離を超えて使用されるべきではない)。このような実施形態では、閾値と比較するべきスペクトル距離を定量化するため、周知のItakura-Saito法距離計算が使用できるであろう。代わりに、劣化している可能性があるスペクトルパラメータを使用するかどうかを判断するために、スペクトルパラメータの固定された統計値または適応的統計値が使用できるであろう。また、基準を作成するためには利得パラメータなどの他の音声パラメータも使用できるであろう(他の音声パラメータが、最も最近の有効フレーム内の値と比較して、カレントフレーム内で大幅に異ならない場合、受信されたスペクトルパラメータも基準を満たしたのであれば、おそらくスペクトルパラメータを使用して大丈夫である。言い換えると、受信されたスペクトルパラメータを使用するかどうかを判断する適切な基準を設定するため、追加成分として、LTP利得などの他のパラメータを使用することができる。他の音声パラメータの履歴が、音声特性の認知改善のために使用できる。たとえば、履歴が、復号化された音声シーケンスに定常的特性があるのか、あるいは非定常的特性があるのかを判断するために使用できる。復号化された音声シーケンスの特性が既知である場合には、劣化フレームからおそらく正しいスペクトルパラメータを検出することはさらに容易であり、どの種類のスペクトルパラメータ値が受信された劣化フレームで伝達されたと考えられるのかを推定することがさらに容易である)。
好ましい実施形態の本発明にしたがって、およびここでは図8を参照すると、劣化フレームについてスペクトルパラメータを使用するかどうかを判断するための基準は、前述されたようにスペクトル距離という概念に基づいている。さらに具体的には、劣化フレームのLSF係数を受け入れるための基準が満たされているかどうかを判断するために、受信機のプロセッサは、所定数の初期の最も最近のフレームのLSF係数とともにLSFバッファに格納される、最後の有効なフレームのLSF係数と比較して、どのくらい多くのLSF係数が周波数軸に沿って移動したのかをチェックするアルゴリズムを実行する。
好適な実施形態による基準は、4つの比較、つまりフレーム間比較、フレーム内比較、2点比較および単一点比較のうちの1または2以上を行なうことを含む。
第1比較であるフレーム間比較では、劣化フレームに隣接するフレーム内のLSFベクトル要素間の差異が過去のフレームの対応する差異と比較される。差異は以下のように決定される。つまり、
Figure 2007065679
ここで、Pはフレームのスペクトル係数の数であり、Ln(i)は劣化フレームのi番目のLSF要素であり、Ln-1(i)は劣化フレームの前のフレームのi番目のLSF要素である。kがLSFバッファの長さである場合に、もし差異dn(i)がdn-1(i)、dn-2(i)、...、dn-k(i)と比べて高すぎると、劣化フレームのLSF要素、Ln(i)は廃棄される。
第2の比較であるフレーム内比較は、同じフレーム内の隣接するLSFベクトル要素間の差異の比較である。n番目のフレームの候補i番目のLSF要素、Ln(i)と、n番目のフレームの(i-1)番目のLSF要素Ln-1(i)との差異は以下のように決定される。つまり、
Figure 2007065679
ここで、Pはスペクトル係数の数であり、en(i)はLSF要素間の距離である。距離は、フレームのすべてのLSFベクトル要素のあいだで計算される。もし差異en(i)がen-1(i)、en-2(i)、...,en-k(i)と比べて大きすぎる、あるいは小さすぎる場合には、LSF要素Ln(i)とLn(i-1)のうちの1つまたは他方、あるいは両方とも廃棄されるであろう。
第3の比較である2点比較は、候補LSF要素Ln(i)を含むクロスオーバが発生したかどうか、つまり候補要素より次数で低い要素Ln(i-1)が候補LSF要素Ln(i)より大きな値を有するかどうかを判断する。クロスオーバは、1または2以上のきわめて劣化しているLSF値を示す。通常すべての交差するLSF要素が廃棄される。
第4の比較である単一点比較は、候補LSFベクトル要素Ln(i)の値を、ともにLSFバッファから計算される最小LSF要素、Lmin(i)、および最大LSF要素Lmax(i)と比較し、それが最小LSF要素と最大LSF要素によってくくられる範囲の外にある場合には候補LSF要素を廃棄する。
劣化フレームのLSF要素が(前記または他の基準に基づいて)廃棄される場合は、LSF要素の新しい値が式(2.2)を使用するアルゴリズムにしたがって計算される。
ここで図7を参照すると、本発明の全体的な方法のフローチャートが示され、定常的音声フレームと非定常的音声フレームに対する、および失われた非定常的音声フレームと対照的に劣化したフレームに対するさまざまな規定を示している。
説明
本発明は、移動局または移動ネットワーク要素のどちらかの音声復号器で応用できる。本発明は、エラーを含む伝送チャネルを有するシステムで使用される任意の音声復号器にも応用できる。
発明の範囲
前述の装置が本発明の原則の応用を例証するにすぎないことが理解されるべきである。特に、本発明は具体的な説明のために線スペクトル対を使用して図示され、説明されてきたが、本発明が、イミタンススペクトル対などの他の同等なパラメータを使用することも包含することが理解される必要がある。多数の変型および代替装置は、本発明の精神および範囲を逸脱することなく当業者により考案されてよく、添付される請求項はこのような変型および装置をカバーすることを目的とする。
音声信号およびオーディオ信号を送信または記憶する従来の技術によるシステムの構成要素のブロック図である。 定常的音声の場合に隣接するフレームのLSF係数[0...4kHz]を示すグラフであり、Y軸は周波数で、X軸がフレームである。 非定常的音声の場合に隣接するフレームのLSF係数[0...4kHz]を示すグラフであり、Y軸が周波数であり、X軸がフレームである。 従来の技術による方法の絶対スペクトル偏差エラーを示すグラフである。 (本発明が従来の技術の方法より優れた代替をスペクトルパラメータに提供することを示す)本発明の絶対スペクトル偏差エラーを示すグラフであり、(最も有望な残差を示す)グラフ中の最高のバーはほぼゼロである。 不良フレーム検出時に、なんらかの従来の技術にしたがってビットがどのように分類されるのかを示す概略流れ図である。 本発明の全体的な方法のフローチャートである。 エラーを有するとして示されるフレームのLSF(線スペクトル周波数)が許容できるかどうかを判断するために使用される基準の態様を示す2つのグラフのセットである。

Claims (4)

  1. 合成音声を提供する復号器によって復号化されるフレームにおけるフレームエラーの効果を隠蔽する方法であって、前記フレームが通信チャネルを伝わって復号器に供給され、各フレームが、音声を合成する際に復号器によって使用されるスペクトルパラメータを提供し、
    a)フレームが不良フレームであるか否かを判断するステップと、
    b)最も最近に以前に受信された有効フレームのスペクトルパラメータのみに基づいて、最も最近に以前に受信された有効なフレームの所定数の前記スペクトルパラメータの少なくとも部分的な適応的平均値を含む不良フレームのスペクトルパラメータの代替を与えるステップと、
    c)前記不良フレームが定常的音声または非定常的音声のいずれを伝達するかを判断するステップをさらに含み、前記不良フレームの代替を与えるステップが、前記不良フレームが定常的音声または非定常的音声のいずれを伝達するかに依存する方法で実行されるステップと
    を含む方法。
  2. 合成音声を提供する復号器によって復号化されるフレームにおけるフレームエラーの効果を隠蔽する装置であって、前記フレームが通信チャネルを伝わって復号器に供給され、各フレームが、音声を合成する際に復号器によって使用されるスペクトルパラメータを提供し、
    a)フレームが不良フレームであるか否かを判断する手段と、
    b)最も最近に以前に受信された有効フレームのスペクトルパラメータのみに基づいて、最も最近に以前に受信された有効なフレームの所定数のスペクトルパラメータの少なくとも部分的な適応平均値を含む前記不良フレームのスペクトルパラメータの代替を与える手段と
    c)前記不良フレームが定常的音声または非定常的音声のいずれを伝達するかを判断する手段をさらに備え、前記不良フレームの代替を与える手段が、前記不良フレームが定常的音声または非定常的音声のいずれを伝達するかに依存する方法で代替を実行する手段
    を備える装置。
  3. 合成音声を提供する復号器によって復号化されるフレームにおけるフレームエラーの効果を隠蔽する方法であって、前記フレームが通信チャネルを伝わって復号器に供給され、各フレームが、音声を合成する際に復号器によって使用されるスペクトルパラメータを提供し、
    a)フレームが不良フレームであるか否かを判断するステップと、
    b)前記フレームが不良フレームであった場合、該不良フレームが所定の基準を満たすか否かを判断するステップと、
    c)前記不良フレームが所定の基準を満たす場合、該不良フレームを使用して前記不良フレームのスペクトルパラメータの代替を与えるステップとを含み、前記所定の基準が、フレーム間比較、フレーム内比較、2点比較および単一点比較の4つの比較のうち、1または2以上を行なうことを含む方法。
  4. 合成音声を提供する復号器によって復号化されるフレームにおけるフレームエラーの効果を隠蔽する装置であって、前記フレームが通信チャネルを伝わって復号器に供給され、各フレームが、音声を合成する際に復号器によって使用されるスペクトルパラメータを提供し、
    a)フレームが不良フレームであるか否かを判断する手段と、
    b)前記フレームが不良フレームであった場合、該不良フレームが所定の基準を満たすか否かを判断する手段と、
    c)前記不良フレームが所定の基準を満たす場合、該不良フレームを使用して前記不良フレームのスペクトルパラメータの代替を与える手段とを含み、前記所定の基準が、フレーム間比較、フレーム内比較、2点比較および単一点比較の4つの比較のうち、1または2以上を行なうことを含む装置。
JP2006273448A 2000-10-23 2006-10-04 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替 Pending JP2007065679A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US24249800P 2000-10-23 2000-10-23

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002538420A Division JP2004522178A (ja) 2000-10-23 2001-10-17 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替

Publications (1)

Publication Number Publication Date
JP2007065679A true JP2007065679A (ja) 2007-03-15

Family

ID=22915004

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2002538420A Pending JP2004522178A (ja) 2000-10-23 2001-10-17 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替
JP2006273448A Pending JP2007065679A (ja) 2000-10-23 2006-10-04 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2002538420A Pending JP2004522178A (ja) 2000-10-23 2001-10-17 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替

Country Status (14)

Country Link
US (2) US7031926B2 (ja)
EP (1) EP1332493B1 (ja)
JP (2) JP2004522178A (ja)
KR (1) KR100581413B1 (ja)
CN (1) CN1291374C (ja)
AT (1) ATE348385T1 (ja)
AU (1) AU1079902A (ja)
BR (2) BR0114827A (ja)
CA (1) CA2425034A1 (ja)
DE (1) DE60125219T2 (ja)
ES (1) ES2276839T3 (ja)
PT (1) PT1332493E (ja)
WO (1) WO2002035520A2 (ja)
ZA (1) ZA200302778B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013527479A (ja) * 2009-06-29 2013-06-27 オーディエンス,インコーポレイテッド 破損したオーディオ信号の修復

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6609118B1 (en) * 1999-06-21 2003-08-19 General Electric Company Methods and systems for automated property valuation
US6968309B1 (en) * 2000-10-31 2005-11-22 Nokia Mobile Phones Ltd. Method and system for speech frame error concealment in speech decoding
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP2004151123A (ja) * 2002-10-23 2004-05-27 Nec Corp 符号変換方法、符号変換装置、プログラム及びその記憶媒体
US20040143675A1 (en) * 2003-01-16 2004-07-22 Aust Andreas Matthias Resynchronizing drifted data streams with a minimum of noticeable artifacts
US7835916B2 (en) * 2003-12-19 2010-11-16 Telefonaktiebolaget Lm Ericsson (Publ) Channel signal concealment in multi-channel audio systems
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
WO2005106848A1 (ja) * 2004-04-30 2005-11-10 Matsushita Electric Industrial Co., Ltd. スケーラブル復号化装置および拡張レイヤ消失隠蔽方法
ATE352138T1 (de) * 2004-05-28 2007-02-15 Cit Alcatel Anpassungsverfahren für ein mehrraten-sprach- codec
US7971121B1 (en) * 2004-06-18 2011-06-28 Verizon Laboratories Inc. Systems and methods for providing distributed packet loss concealment in packet switching communications networks
EP1788556B1 (en) * 2004-09-06 2014-06-04 Panasonic Corporation Scalable decoding device and signal loss concealment method
US7409338B1 (en) * 2004-11-10 2008-08-05 Mediatek Incorporation Softbit speech decoder and related method for performing speech loss concealment
US7596143B2 (en) * 2004-12-16 2009-09-29 Alcatel-Lucent Usa Inc. Method and apparatus for handling potentially corrupt frames
CA2596341C (en) * 2005-01-31 2013-12-03 Sonorit Aps Method for concatenating frames in communication system
KR100612889B1 (ko) * 2005-02-05 2006-08-14 삼성전자주식회사 선스펙트럼 쌍 파라미터 복원 방법 및 장치와 그 음성복호화 장치
GB0512397D0 (en) * 2005-06-17 2005-07-27 Univ Cambridge Tech Restoring corrupted audio signals
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
WO2007043642A1 (ja) * 2005-10-14 2007-04-19 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置、スケーラブル復号装置、およびこれらの方法
US8438018B2 (en) * 2006-02-06 2013-05-07 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for speech coding in wireless communication systems
US7457746B2 (en) 2006-03-20 2008-11-25 Mindspeed Technologies, Inc. Pitch prediction for packet loss concealment
US8280728B2 (en) * 2006-08-11 2012-10-02 Broadcom Corporation Packet loss concealment for a sub-band predictive coder based on extrapolation of excitation waveform
KR101040160B1 (ko) * 2006-08-15 2011-06-09 브로드콤 코포레이션 패킷 손실 후의 제한되고 제어된 디코딩
AU2007318506B2 (en) 2006-11-10 2012-03-08 Iii Holdings 12, Llc Parameter decoding device, parameter encoding device, and parameter decoding method
KR101292771B1 (ko) 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
KR100862662B1 (ko) * 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
KR101291193B1 (ko) 2006-11-30 2013-07-31 삼성전자주식회사 프레임 오류은닉방법
CN100578618C (zh) * 2006-12-04 2010-01-06 华为技术有限公司 一种解码方法及装置
CN101226744B (zh) 2007-01-19 2011-04-13 华为技术有限公司 语音解码器中实现语音解码的方法及装置
KR20080075050A (ko) * 2007-02-10 2008-08-14 삼성전자주식회사 오류 프레임의 파라미터 갱신 방법 및 장치
ES2642091T3 (es) * 2007-03-02 2017-11-15 Iii Holdings 12, Llc Dispositivo de codificación de audio y dispositivo de decodificación de audio
US8165224B2 (en) 2007-03-22 2012-04-24 Research In Motion Limited Device and method for improved lost frame concealment
EP1973254B1 (en) * 2007-03-22 2009-07-15 Research In Motion Limited Device and method for improved lost frame concealment
WO2008146466A1 (ja) * 2007-05-24 2008-12-04 Panasonic Corporation オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路
EP2189976B1 (en) * 2008-11-21 2012-10-24 Nuance Communications, Inc. Method for adapting a codebook for speech recognition
US8751229B2 (en) * 2008-11-21 2014-06-10 At&T Intellectual Property I, L.P. System and method for handling missing speech data
CN101615395B (zh) * 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
JP2010164859A (ja) * 2009-01-16 2010-07-29 Sony Corp オーディオ再生装置、情報再生システム、オーディオ再生方法、およびプログラム
US20100185441A1 (en) * 2009-01-21 2010-07-22 Cambridge Silicon Radio Limited Error Concealment
US8676573B2 (en) * 2009-03-30 2014-03-18 Cambridge Silicon Radio Limited Error concealment
US8316267B2 (en) * 2009-05-01 2012-11-20 Cambridge Silicon Radio Limited Error concealment
CN101894565B (zh) * 2009-05-19 2013-03-20 华为技术有限公司 语音信号修复方法和装置
WO2011065741A2 (ko) * 2009-11-24 2011-06-03 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
JP5724338B2 (ja) * 2010-12-03 2015-05-27 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
CA2833874C (en) 2011-04-21 2019-11-05 Ho-Sang Sung Method of quantizing linear predictive coding coefficients, sound encoding method, method of de-quantizing linear predictive coding coefficients, sound decoding method, and recording medium
CN103620675B (zh) * 2011-04-21 2015-12-23 三星电子株式会社 对线性预测编码系数进行量化的设备、声音编码设备、对线性预测编码系数进行反量化的设备、声音解码设备及其电子装置
JP6024191B2 (ja) * 2011-05-30 2016-11-09 ヤマハ株式会社 音声合成装置および音声合成方法
CN104011793B (zh) * 2011-10-21 2016-11-23 三星电子株式会社 帧错误隐藏方法和设备以及音频解码方法和设备
KR20130113742A (ko) * 2012-04-06 2013-10-16 현대모비스 주식회사 오디오 데이터 디코딩 방법 및 장치
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
CN103117062B (zh) * 2013-01-22 2014-09-17 武汉大学 语音解码器中帧差错隐藏的谱参数代替方法及系统
CN104995673B (zh) * 2013-02-13 2016-10-12 瑞典爱立信有限公司 帧错误隐藏
US9842598B2 (en) * 2013-02-21 2017-12-12 Qualcomm Incorporated Systems and methods for mitigating potential frame instability
PL3011557T3 (pl) 2013-06-21 2017-10-31 Fraunhofer Ges Forschung Urządzenie i sposób do udoskonalonego stopniowego zmniejszania sygnału w przełączanych układach kodowania sygnału audio podczas ukrywania błędów
KR102132326B1 (ko) * 2013-07-30 2020-07-09 삼성전자 주식회사 통신 시스템에서 오류 은닉 방법 및 장치
CN103456307B (zh) * 2013-09-18 2015-10-21 武汉大学 音频解码器中帧差错隐藏的谱代替方法及系统
JP5981408B2 (ja) 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
CN104751849B (zh) * 2013-12-31 2017-04-19 华为技术有限公司 语音频码流的解码方法及装置
EP2922055A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using individual replacement LPC representations for individual codebook information
EP2922056A1 (en) * 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using power compensation
EP2922054A1 (en) 2014-03-19 2015-09-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation
CN104934035B (zh) 2014-03-21 2017-09-26 华为技术有限公司 语音频码流的解码方法及装置
CN108011686B (zh) * 2016-10-31 2020-07-14 腾讯科技(深圳)有限公司 信息编码帧丢失恢复方法和装置
US10784988B2 (en) 2018-12-21 2020-09-22 Microsoft Technology Licensing, Llc Conditional forward error correction for network data
US10803876B2 (en) * 2018-12-21 2020-10-13 Microsoft Technology Licensing, Llc Combined forward and backward extrapolation of lost network data
CN111554308B (zh) * 2020-05-15 2024-10-15 腾讯科技(深圳)有限公司 一种语音处理方法、装置、设备及存储介质

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5406532A (en) * 1988-03-04 1995-04-11 Asahi Kogaku Kogyo Kabushiki Kaisha Optical system for a magneto-optical recording/reproducing apparatus
JP3104400B2 (ja) * 1992-04-27 2000-10-30 ソニー株式会社 オーディオ信号符号化装置及び方法
JP3085606B2 (ja) * 1992-07-16 2000-09-11 ヤマハ株式会社 ディジタルデータの誤り補正方法
JP2746033B2 (ja) * 1992-12-24 1998-04-28 日本電気株式会社 音声復号化装置
JP3123286B2 (ja) * 1993-02-18 2001-01-09 ソニー株式会社 ディジタル信号処理装置又は方法、及び記録媒体
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
JP3404837B2 (ja) * 1993-12-07 2003-05-12 ソニー株式会社 多層符号化装置
US5502713A (en) 1993-12-07 1996-03-26 Telefonaktiebolaget Lm Ericsson Soft error concealment in a TDMA radio system
CA2142391C (en) 1994-03-14 2001-05-29 Juin-Hwey Chen Computational complexity reduction during frame erasure or packet loss
JP3713288B2 (ja) 1994-04-01 2005-11-09 株式会社東芝 音声復号装置
JP3416331B2 (ja) 1995-04-28 2003-06-16 松下電器産業株式会社 音声復号化装置
SE506341C2 (sv) 1996-04-10 1997-12-08 Ericsson Telefon Ab L M Metod och anordning för rekonstruktion av en mottagen talsignal
JP3583550B2 (ja) 1996-07-01 2004-11-04 松下電器産業株式会社 補間装置
EP0906664B1 (en) * 1997-04-07 2006-06-21 Koninklijke Philips Electronics N.V. Speech transmission system
US6810377B1 (en) 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6373842B1 (en) * 1998-11-19 2002-04-16 Nortel Networks Limited Unidirectional streaming services in wireless systems
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
EP1095370A1 (en) 1999-04-05 2001-05-02 Hughes Electronics Corporation Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013527479A (ja) * 2009-06-29 2013-06-27 オーディエンス,インコーポレイテッド 破損したオーディオ信号の修復

Also Published As

Publication number Publication date
AU2002210799B2 (en) 2005-06-23
US7529673B2 (en) 2009-05-05
CN1291374C (zh) 2006-12-20
CA2425034A1 (en) 2002-05-02
WO2002035520A2 (en) 2002-05-02
DE60125219T2 (de) 2007-03-29
EP1332493B1 (en) 2006-12-13
BRPI0114827B1 (pt) 2018-09-11
KR100581413B1 (ko) 2006-05-23
AU1079902A (en) 2002-05-06
US20020091523A1 (en) 2002-07-11
ZA200302778B (en) 2004-02-27
KR20030048067A (ko) 2003-06-18
BR0114827A (pt) 2004-06-15
DE60125219D1 (de) 2007-01-25
US7031926B2 (en) 2006-04-18
PT1332493E (pt) 2007-02-28
ATE348385T1 (de) 2007-01-15
CN1535461A (zh) 2004-10-06
ES2276839T3 (es) 2007-07-01
EP1332493A2 (en) 2003-08-06
WO2002035520A3 (en) 2002-07-04
US20070239462A1 (en) 2007-10-11
JP2004522178A (ja) 2004-07-22

Similar Documents

Publication Publication Date Title
JP2007065679A (ja) 音声復号器におけるフレームエラー隠蔽に対する改善されたスペクトルパラメータ代替
US7877253B2 (en) Systems, methods, and apparatus for frame erasure recovery
TWI484479B (zh) 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
KR101092167B1 (ko) 피치-조정 및 비-피치-조정 코딩을 이용한 신호 인코딩
KR100563293B1 (ko) 음성 복호화에서 음성 프레임 오류 은폐를 위한 방법 및시스템
US20130185084A1 (en) Systems, methods, apparatus, and computer-readable media for bit allocation for redundant transmission
EP2535893A1 (en) Device and method for frame lost concealment
JP2004508597A (ja) オーディオ信号における伝送エラーの抑止シミュレーション
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
Gomez et al. Recognition of coded speech transmitted over wireless channels
US20040138878A1 (en) Method for estimating a codec parameter
AU2002210799B8 (en) Improved spectral parameter substitution for the frame error concealment in a speech decoder
Mertz et al. Voicing controlled frame loss concealment for adaptive multi-rate (AMR) speech frames in voice-over-IP.
AU2002210799A1 (en) Improved spectral parameter substitution for the frame error concealment in a speech decoder

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091006

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091009

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091106

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091111

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100302