JP2003532354A - レート判定誤りとそのアーティファクトの低減方法及び装置 - Google Patents
レート判定誤りとそのアーティファクトの低減方法及び装置Info
- Publication number
- JP2003532354A JP2003532354A JP2001581273A JP2001581273A JP2003532354A JP 2003532354 A JP2003532354 A JP 2003532354A JP 2001581273 A JP2001581273 A JP 2001581273A JP 2001581273 A JP2001581273 A JP 2001581273A JP 2003532354 A JP2003532354 A JP 2003532354A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- rate
- frame rate
- full
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 230000007704 transition Effects 0.000 claims description 17
- 230000001755 vocal effect Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 13
- 230000005284 excitation Effects 0.000 description 20
- 238000004891 communication Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 7
- 230000011664 signaling Effects 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000000116 mitigating effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102100031083 Uteroglobin Human genes 0.000 description 1
- 108090000203 Uteroglobin Proteins 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
Description
りを低減すると共に、残ったあらゆるレート判定誤りから生じるオーディオアー
ティファクトを軽減するための方法と装置に関する。
対象情報が、音声であれデータであれ、無線電話と基地局などの通信資源間で通
信チャネル上において搬送される。暫定標準規格IS−95Bに準拠するCDM
Aベースの通信システム等のブロードバンドスペクトル拡散通信システムにおい
ては、拡散符号が通信チャネルの定義に用いられる。
例えば、音声呼出しの場合、各音声フレ−ムのデータレートは、音声アクティビ
ティに基づいて変化する。ユーザが通話中、音声情報は圧縮されフルレートで通
常送られる。単語と単語の間及び文と文の間では、データレートが通常8分の1
のレートになる。2分の1レートと4分の1レートもまた、通話状態から静音状
態への遷移の際や、信号情報を多重化したり、システム容量を増やしたりするた
めに、データレートを低減する必要がある場合に用いられる。データサービス呼
出しにおいて、フル、2分の1、4分の1、及び8分の1レートのフレームを、
ユーザ要求情報のデータレートに基づいて選択することができる。
テムでは、順方向誤り訂正技術を用いる。順方向リンクと見なす基地局対移動局
加入者装置の方向では、IS−95には、巡回冗長検査(CRC)ビットの追加
、畳み込み符号化、データ再送、インターリーブが含まれる。データ再送は、畳
み込み符号化を行って、大気インターフェイス上のデータレートが一定になった
後、サブレートフレーム(2分の1、4分の1、8分の1レート)上で行われる
。
測できない。受信器は、各許容フレームレートに対する復号化機構を適用し、受
信データフレームの何らかの特性に注目し、フレームがそれで送信された可能性
のあるフレームレートを判定する必要がある。通常用いられる特性は、記号誤り
レート(SER)、CRC検証、ビタビ復号器品質ビットである。SERとは、
畳み込み復号化によって修復された情報シーケンスを再符号化し、受信記号とは
異なることが判った再符号化チャネル記号の数を累積して得られる畳み込み符号
化データ中の記号誤り数の見積である。いくつかのフレームレート、すなわちI
S−95の場合のフル及び2分の1レートは、CRCコードワードによって保護
されている。これらは、データに対してある種の縮退巡回符号化を行うことによ
って、送信器が生成する。その結果生じるCRCは畳み込み符号化され、データ
と共に送信される。受信器はまた、受信された畳み込み復号化データのCRCを
生成し、そのCRCを送信器が付加したCRCと比較する。通常、ビタビ復号器
は畳み込み復号化に用いる。復号化されたデータシーケンスに加えて、ビタビ復
号器は、復号化シーケンスが有効データシーケンスから大きくずれていないかど
うかを表す品質ビットを示す場合もある。
ズム(RDA)を用いる受信器のレート判定器が行う。判定器は、各復号器から
の復号化特性を用いて、どんなレートで受信フレームが送信されたか、及び/又
はそのフレームが使用可能であるかどうかを判定する。フレームに含まれるビッ
ト誤りが非常に多い場合やそのレートを判定できない場合、そのフレームは消失
フレームであると宣言する。通常、RDAは、一連の規則に従ってレートを判定
する。例えば、このような規則には以下のようなものがある。
SERfullthreshold AND SEReighth<SEReighththreshold THEN FRAME_RATE=EIGHTH
も誤りを犯しやすい。例えば、8分の1レートフレームとして送信したフレーム
が、受信器ではフルレートフレームと誤って解釈されることがある。これらの誤
判定レートの影響は深刻であり、時には音声呼出しにおいて深刻なオーディオア
ーティファクトが生じたり、データ呼出しの場合データスループットが減少した
りすることがある。このレート誤判定は、送信されるフレームの内容、大気イン
ターフェイス上の干渉条件及び受信器の判定器の性能とを含む多くの様々な要因
に依存することがわかっている。IS−95で用いられ又この技術分野では既知
のFECプロトコルもまた、送信されるサブレートフレームと可能な限りフルレ
ートに近いフレームの間で適切な符号距離を提供する上で最適ではないことがわ
かっている。例えば、無音状態において、CDMAシステムで用いられる強化型
可変レートコーデック(EVRC)は、16ビットの8分の1レートフレーム0
740Hに収束し、このフレームを何度も再送することが確認されている。IS
−95FEC方式のシミュレーションによって、この8分の1レートフレームは
、8分の1レート畳み込み符号器とデータ中継器を通過する場合、フルレート復
号器によって、非常に小さいSERで復号化されることがわかる。符号化フレー
ムが、パワー制御ビットによって穿刺され、大気インターフェイス上で幾つかの
ビット誤りの影響を受ける場合、CRCもまた通過できることが確認されている
。上述の判定器の規則に示すように、通常、CRC通過と低SERの条件は、受
信フレームが有効なフルレートフレームであると宣言するのに充分である。
誤フルレートフレームの内容と、音声復号化後それらが高い音声利得や高周波等
に対応しているかどうかに依存する。しかしながら、大気インターフェイス消失
の音声への影響を減ずるために用いる誤り軽減技術もまた音声アーティファクト
に悪い影響を及ぼすことがわかっている。 従って、通信システムにおけるレート判定誤りとそれらの音声への影響を低減
するための方法と装置が必要である。
する。本方法は、音声フレームのフレームレートの有効性を判定し、その有効性
の判定に基づき少なくとも1つの音声復号器フィルタ状態の変更を含む。適用可
能な音声復号器フィルタは、これらに限定はしないが、ピッチフィルタ、声域フ
ィルタ、ポストフィルタを含む。有効性判定は、現フレームのフレームレートと
前受信フレームのそれとの比較に基づくことができる。特に、信号情報を含まな
いフルレートフレームの後で8分の1レートフレームを受信する場合、そのフレ
ームは無効であると見なされる。また本発明によって、同一フレームレートの連
続フレーム数に基づいて記号誤り閾値を調整できる。これらの閾値を調整するこ
とによって、レート判定誤りの数が減り、従ってその結果生じる音声の音声品質
が改善される。
づきそのフィルタの状態を、初期化を含み、変更できる音声復号器を含む装置を
提供する。本発明はまた、フレームレートが同じである連続フレーム数に基づき
記号誤り閾値を調整する手段も提供する。
示すように、基地局制御装置(BSC)10は、移動交換局(MSC)12と通
信状態にあり、MSC12は更にPSTN8と通信状態にある。好適な実施形態
において、本通信システムは符号分割多重接続(CDMA)セルラ無線電話シス
テムを採用しているが、然るべきどのような通信システムでも本発明の利用が可
能なことを当業者は認識し得るであろう。
を含む。音声符号器20は、音声サンプルをデータレート64キロビット/秒で
MSC12から受信し、本技術分野では良く知られている、強化型可変レートコ
ーデック(EVRC)等の音声圧縮アルゴリズムを用いてデータレートを低減す
る。音声符号器20は、受信音声の各20mS部分が符号化される適切なデータ
レートを選択するレートセレクタ26を含む。通常、その結果生じた圧縮音声フ
レームのデータレートは、サンプリングされた音声内での音声アクティビティレ
ベルに依存する。EVRCの場合、有効フレームレートとして、フルレート、2
分の1レート、8分の1レートの3つがある。通常、フルレートフレームは、有
効音声の発話時生成され、8分の1レートフレームは、静音時に生成される。通
常、2分の1レートフレームは、通話状態から静音状態への遷移中又はMUX2
4が命令した場合に生成される。EVRCの場合、フルレート音声フレームの後
に8分の1レート音声フレームが続くことはできないため、通話状態から静音状
態への遷移は全て2分の1レート音声フレームを含む。
割を担う。これらの信号メッセージは、MUX24によって、音声符号器20か
らの符号化済音声フレームと、いくつかの追加制御情報とで多重化され、フル、
2分の1、又は8分の1レートトラフィックフレームを形成する。この追加制御
情報は、トラフィックフレームレートを規定するパラメータを含む。次に、その
トラフィックフレームは、通信リンク28を介して、送信器局(BTS)30に
送られる。
レームレートを示す制御信号34を生成する。制御信号34によって制御される
スイッチ36は、フルレートCRC38、2分の1レートCRC40、又は無C
RC41がトラフィックフレームに付加されるかどうかを判定する。次に、トラ
フィックフレームは、データ中継器44に渡される前に1/2レート畳み込み符
号器42を通過する。データ中継器は、2分の1や8分の1レートフレーム等の
サブレートフレームを選択し、全フレームが同じビット数を含むようにそれらを
アップサンプリングする。8分の1レートフレームの場合、各受信ビットは7回
繰返される。同様に、2分の1レートフレームの場合、各ビットは1回繰返され
る。データ中継器42を通過した後、各フレームには384ビット含まれる。
ーバ46を通過する。これによって、大気インターフェイス60上のバースト誤
りに対するフレームの復元力が改善される。次に、フレーム内の所定位置の32
ビットが、パワー制御情報ビットによって置き換えられる。このプロセスは、パ
ワー制御穿刺機能48によって実行される。その結果生じるフレームは、大気イ
ンターフェイス60上での送信用としてパワー増幅器50に渡される。フレーム
に用いる送信パワーは、部分的に制御信号34に依存する。次に、フレームは、
ビット誤りを含む可能性のある状態で、移動局装置70が受信する。
ーバ102は、RFフロントエンド100から384個の記号を受信する。各記
号は、対応する送信ビットが0又は1のいずれであったかに関する信頼水準であ
る。これらの信頼水準は、ソフト決定値であると見なされる。例えば、4ビット
のソフト決定システムにおいて、0000は、送信ビットが0であったという非
常に高い確率を表し、1111は、ビットが1であったという非常に高い確率を
表す。1001は、送信ビットが1であったことを連想させるが、RFフロント
エンド100の信頼度は低い。デインターリーバ102は記号のスクランブルを
解除し、そのフレームを複数の復号経路に渡す。復号経路は、図1のMUX24
によって受信フレームが元々送られた各トラフィックフレームレートに対して存
在している。複数の復号経路が必要な理由は、受信器がトラフィックフレームレ
ートを推定で知ることができないためである。EVRC場合、フルレート、2分
の1レート、8分の1レートの3つのフレームレートが可能である。
6から成る。この8分の1レート結合器104は、8個の連続記号の各グループ
を1つの記号に結合して、図1のデータ中継器44が導入するデータの繰返しを
補償する。畳み込み復号器106は、フレームの誤り訂正に用いられるが、16
個のデータビットと記号誤りレートSEReighthの見積を出力する。2分の1レ
ート復号経路は、2分の1レート結合器110、畳み込み復号器112、CRC
検査器114から成る。畳み込み復号器112は、80のデータビット、SERhalf 、受信CRCを出力する。そのCRCをCRC検査器114が検査し、その
結果であるCRChalfは判定器のレート判定アルゴリズム(RDA)に渡される
。フルレート復号経路は、畳み込み復号器120とCRC検査器122から成る
。畳み込み復号器120は、172のデータビット、SERfull、受信CRCを
出力する。そのCRCをCRC検査器122が検査し、その結果であるCRCfu ll は判定器150に渡される。判定器150は、送信フレームのレートを判定し
、音声復号器155への送信用として然るべく復号されたフレームを選択する。
音声復号器155は、この技術分野では既知の音声アルゴリズムを用いて受信音
声を復元する役割を果たす。復元アルゴリズムは、フレームレートに依存する。
の使用方法は、この技術分野では既知である。しかしながら、既述したように、
判定器150は誤りが生じやすく、フレームのレートを誤判定する場合がある。
本発明の好適な実施形態に基づいて、判定器150は、誤判定を低減し、また誤
判定発生時の音声への影響を低減するための他の論理回路を含む。本発明の好適
な実施形態に基づき、判定器150から音声復号器155へ制御信号が提供され
る。判定器150が、以前受信したフレームが誤判定されたと確証した場合、制
御信号160は、音声復号器155にその内蔵デジタルフィルタを初期化するよ
うに命令する。
ートから8分の1レートに直接遷移することはできない。標準規格によれば、少
なくとも1つの2分の1レートフレームを、フルレートから8分の1レートに遷
移する間のどこかで送信しなければならない。例として図3は、フルレートから
8分の1レートへの一般的な遷移並びにフレームレートの判定誤りに起因する遷
移を示す。一連のフルレートフレーム200−206は、音声アクテビティに対
応して、BTS30が送信し、判定器150が正確に受信する。静音状態への遷
移中、ボコーダアルゴリズムが課すレート遷移規則を満たすために、音声符号器
20が2分の1レートフレーム208を生成して、判定器150が正確に受信す
る。2分の1レートフレーム208に続いて、一連の8分の1レートフレーム2
10−220が正確に受信される。フレーム222は、元々8分の1レートフレ
ームとして音声符号器20が生成するが、判定器150がフルレートフレームで
あると誤判定している。判定器150がフレームレートを誤判定した場合、音声
復号器152に、一連の8分の1レートフレーム210−220の後、単一フル
レートフレーム222が渡され、その後、次の一連の8分の1レートフレーム2
26−232が続く。しかしながら、音声復号器152は、フルレートから8分
の1レートに遷移する間のどこかで、2分の1レートフレーム224の受信を要
求する。その結果、この技術分野では既知のように、音声復号器152は、それ
に続く有効8分の1レートフレーム226を消失フレームとして宣言する。他の
実施形態において、判定器150は、レート低減違反を検知し、フレームが消失
フレームであると宣言する場合がある。この技術分野では既知のボコーダ消去処
理が、消失フレームの前に受信されたフレームからのパラメータ情報を使用する
段階を含むことから、ボコーダアルゴリズムによる強制消去によって、元々の誤
判定から変則的に生成されるあらゆる音声を長引かせるという影響を及ぼす。誤
判定の場合、繰り返し用いられるパラメータは、不正な誤判定フレームから生じ
、従って不正フレームの影響が拡大する。
レームレート履歴に基づき判定器150が用いるSER閾値の調整から成る。連
続8分の1レートフレーム期間T8 の後、フルレートフレームのSER閾値をS
ERFT1 からSERFT2 まで下げて、フルレート畳み込み復号器120から受信
したSERfullによって測定される高いフレーム品質で、次のフルレートフレー
ムを受信する必要がある。更に8分の1レートSER閾値をSERET1 からSE
RET2 まで上げて、8分の1畳み込み復号器106から受信したSERE によっ
て測定される、より低いフレーム品質で次の8分の1レートフレームを受信する
必要がある。改善された判定器150の第2部分は、音声復号器152への制御
経路を導入し、ボコーダアルゴリズム内においてフィルタ状態をクリーンにする
ことができる。これは、存続するあらゆる誤判定の音声への影響を最小限にする
のに有益である。
テップ300から開始するが、ここでは、フルレートCRC検査器122から受
信したフルレートCRCの合/否状態をテストする。CRCfullが有効性テスト
に不合格であったと判定される場合、フレームは、フルレートフレームとしての
可能性を持った候補から除外され、論理フローはステップ316に進み、他のフ
レームレートの有効性を検査する。CRCfullが有効性テストに合格したと判定
される場合、論理フローはステップ302に進み、ここで、フルレート畳み込み
復号器120から受信したSERfullが評価される。SERfullが公称閾値SE
RFT1 を超える場合、フレームは、フルレートフレームとしての可能性を持った
候補から除外され、論理フローはステップ316に進み、他のフレームレートの
有効性を検査する。SERfullが公称閾値SERFT1 以下である場合、論理フロ
ーはステップ304に進み、ここで、そのフレームは評価され、信号トラフィッ
クを含むかどうか判定される。このことは、ステップ308において、より厳し
いSERFT2 閾値テストを受ける信号トラフィックの形態でクリティカル呼出し
処理情報を含むフレームを回避するために必要である。IS−95BのCDMA
標準規格の場合、この情報は、混合型ビット(MMビット)、トラフィック型ビ
ット(TTビット)、一対のトラフィック型ビット(TMビット)の形態で、畳
み込み復号化フレームの最初の数ビットに含まれる。これらのビットの定義及び
使用方法は、この技術分野では良く知られている。
フレームは有効フルレートフレームと見なされ、論理フローは、ステップ312
に進む。フレームが信号情報を含まないと判定される場合は、論理フローはステ
ップ306に進み、ここで、連続8分の1レートフレームカウンタC8 が閾値T8 と比較される。C8 が閾値T8 よりも大きい場合、より厳しい2次SER閾値
SERFT2 は検査されず、論理フローはステップ310に進み、ここで、フレー
ムは有効フルレートフレームであると宣言される。C8 が閾値T8 以下である場
合、論理フローはステップ308に進み、ここで、フルレート畳み込み復号器1
20から受信したSERfullは、より厳しい2次閾値SERFT2 と比較される。
この2次閾値は、許容記号誤り数の点で、無信号フルレートフレームが有効であ
るとの宣言を更に困難にするために用いられる。このことによって、第1フルレ
ートフレーム又は非フルレートフレーム間隔に続く一連のフルレートフレームが
通常要求されるより低い記号誤りレートを有することが必要である。
ムはフルレートフレームとして見なしことから除外され、論理フローはステップ
316に進み、ここで、他のフレームレートが検査される。SERfullがSERFT2 以下である場合、論理フローはステップ310に進み、ここで、連続8分の
1レートフレームカウンタC8 がゼロに初期化され、連続フルレートカウンタが
インクリメントされる。論理フローはステップ312まで続き、ここで、フレー
ムレートはフルレートに設定される。
は経路の1つに従ってステップ316へ進み、ここで、フレームの2分の1レー
トの有効性が検討される。ステップ316において、2分の1レートCRC検査
器114から受信した2分の1レートCRCの合/否状態がテストされる。CR
Chalfが有効性テストで不合格になったと判定される場合、フレームは、2分の
1レートフレームとしての可能性を持った候補から除外され、論理フローはステ
ップ324に進み、他のフレームレートの有効性を検査する。CRChalfが有効
性テストに合格したと判定される場合、論理フローはステップ318に進み、こ
こで、フルレート畳み込み復号器120から受信したSERhalfが評価される。
SERhalfが閾値SERHT以下である場合、論理フローはステップ330に進み
、ここで、連続8分の1レートフレーム及び連続フルレートフレームカウンタが
ゼロに初期化される。次に、論理フローはステップ322に進み、ここで、フレ
ームレートは2分の1レートに設定される。ステップ318において、SERha lf が閾値SERHTを超える場合、フレームは2分の1レートフレームとして見な
すことから除外され、論理フローはステップ324に進み、ここで、他のフレー
ムレートが検査される。
い場合、論理フローはステップ324に至る経路の1つに従って進む。ステップ
324において、8分の1レート畳み込み復号器から受信したSEReighthが評
価される。SEReighthが通常の閾値SERET1 以下である場合、論理フローは
、ステップ334に進む。SEReighthが通常の閾値SERET1 を超える場合、
論理フローはステップ326に進み、ここで、連続8分の1レートフレームカウ
ンタC8 が閾値T8 と比較される。C8 がT8 以下である場合、論理フローがス
テップ330に進むと、フレームは、フルレートフレーム、2分の1レートフレ
ーム、8分の1レートフレームのいずれかであると当然見なすことができないた
め、消失フレームとして宣言される。C8 が閾値T8 を超える場合、論理フロー
はステップ328に進み、ここで、SEReighthは緩和された閾値SERET2 と
比較される。SEReighthが緩和された閾値SERET2 を超える場合、論理フロ
ーはステップ330に進み、ここで、連続フルレートフレームカウンタがゼロに
初期化され、そしてステップ332に進み、ここで、フレームが消失フレームと
して宣言される。SEReighthが緩和された閾値SERET 2 以下である場合、
連続フルレートカウンタ値が評価されるステップ334を初めとして、論理フロ
ーが進み、フレームレートは8分の1レートとして宣言される。
ートフレームだけが現8分の1レートフレームの前に受信されたことを表す値1
に設定された場合、論理フローはステップ336に進み、ここで、ボコーダフィ
ルタ初期化指示が起動される。このことは、前に受信したフレームがフルレート
フレームであると誤って宣言した可能性のある判定によるものである。CFが1
以外の値である場合、論理フローはステップ336を飛び越してステップ338
に進み、ここで、連続フルレートカウンタCFはゼロに初期化され、連続8分の
1レートカウンタはインクリメントされる。論理フローはステップ340まで続
き、ここで、フレームレートが8分の1レートであると宣言される。
ルレートフレーム222又は8分の1レートフレーム226が誤判定されたかど
うか決定する。この場合、パラメータWSERf ullとWSEReighthの計算と
比較を行うことができる。例えば、WSERfullについては、WSERfull=Wfull *SERfullと計算し、WSEReighthについては、WSEReighth=Wei ghth *SEReighthと計算することができる。WSERfullの値がWSEReigh th の値を超える場合、誤判定フレームが8分の1レートフレーム226ではなく
フルレートフレーム222であるという決定をし、「フィルタ初期化」のフラグ
を「真」に設定することができる。WSERfullの値がWSEReighth以下であ
る場合、誤判定フレームが、現8分の1レートフレーム226であるという決定
をし、「フィルタ初期化」のフラグを設定せず、現8分の1レートフレームを消
失フレームとして宣言することができる。
音声生成モデルを実現する。音声符号器で用いるモデルとして1つ考えられるも
のは、この技術分野で既知の多くのアルゴリズムが基づく符号励起型線形予測モ
デル(CELP)である。CELPに基づくこのようなボコーダアルゴリズムの
1つには、EVRCボコーダアルゴリズムがある。図5は、EVRC音声復号器
の音声生成構成要素を示すが、然るべきどのような音声復号器でも本発明の利用
が可能なことを当業者は認識し得るであろう。励起信号シーケンスは、音声フレ
ーム内で送信されたパラメータ並びにそれ以前の復号化フレームからの情報に部
分的に基づきそれぞれの励起成分を生成する固定励起400と適応励起412か
ら構成される。固定コードブック励起400は、多重パルス励起方式に基づいて
音声復号器が再度生成する。パルス情報402は、固定コードブック励起400
が、所定の間隔でいくつかのパルスから成る対応する励起シーケンスに変換する
。次に、このシーケンスは、単一タップ有限インパルス応答(FIR)フィルタ
を用いてフィルタ処理し(406)、励起シーケンスのピッチ性能を強化する。
その次に、その結果生じるシーケンスは、利得係数408で乗算し(410)、
総固定励起シーケンスを生成する。適応コードブック励起412は、音声モデル
のピッチ成分を生成する役割を果たす。この励起は、以前結合された励起サンプ
ルの履歴から、音声フレームで送信されるピッチ周期遅延パラメータを用いて音
声復号器によって生成される。次に、その結果生じるシーケンスは、音声フレー
ムの一部として送信される利得パラメータ416で乗算し(414)、励起シー
ケンスの総適応コードブック成分を生成する。その2つの励起成分は加算され(
418)、総励起シーケンスを生成する。励起シーケンスを一旦生成すると、人
間の音声生成システムである声域をモデル化した全極型フィルタ1/A(Z)4
20を用いてそれをフィルタ処理する。次に、その結果生じる合成音声シーケン
スは、合成音声シーケンスの知覚品質を強化するようにしたポストフィルタW(
Z)422によってフィルタ処理される。
から受信したフィルタ初期化制御を用いて、フィルタ状態を如何に初期化できる
かを示す。フィルタ初期化指示430を判定器150から受信すると、音声復号
器は、各種のフィルタ412/420/422の状態を初期化する。この動作に
よれば、消去処理によって、元々の誤判定の影響が後続のフレームとフィルタ状
態メモリへ拡大しないことが保証される。
ために用いるピッチフィルタを含む。このフィルタは、フィルタ初期化指示43
0が受信されるとクリアされる以前結合された励起サンプルのメモリから成る。
声域フィルタ420とポストフィルタ422もまた、初期誤判定から音声への影
響を拡大し得る何らかのフィルタメモリを含んでおり、これらのフィルタも初期
化される。前フレームからのメモリは用いないことから、固定コードブックピッ
チ強化フィルタを初期化する必要があることに留意されたい。フィルタ初期化動
作に加えて、音声復号器は、判定器150が前フルレートフレームを誤って復号
したとの認識に基づき、課されたレート遷移規則を無視する。
形態の1つとして、新たに励起利得パラメータ408/416を初期化し、レー
ト遷移規則を通常通り実行できる。利得パラメータ408/416を初期化する
ことにより、音声復号器は、確実に声域フィルタ420への励起信号を完全に無
効にし、これによって誤判定とレート遷移起因の消去処理とによる音声への影響
を軽減する。
れる背景信号間において更に知覚的に良好な遷移を生成する状態にフィルタ41
2/420/422を初期設定することができる。このようなフィルタ状態初期
化の1つとして、フィルタ状態をフレーム誤判定前に存在する状態にリロードす
ることができる。
す。各グラフは、3つの音声フレームを含む時間線から構成されている。第1グ
ラフは、アーティファクト軽減方式を用いない場合のフルレートフレーム誤判定
の音声への影響を示す。3つの音声フレームは、誤判定フレーム500のフレー
ム、レート遷移規則502により生じる消去処理のフレーム、及びフィルタ状態
メモリ504の延長影響のフレームから成る。
いて実現する音声改善例を示す。第1フレーム506は、RDA検出段をすり抜
けた誤判定の影響を示す。第2フレーム508と第3フレーム510は、フィル
タ状態を初期化し、検出された誤判定に対するレート遷移規則を音声復号器に無
視させることによって、そのすり抜けた誤判定の影響がどの程度含まれているか
を示す。これによって、アーティファクトの継続期間が全体的に改善されること
になり、また人間の聴覚器官に対して不快な音声の影響が小さくなる。
実施形態は、以下の請求項で述べる本発明を説明するためのものであって、本発
明の広い範囲を制限しようとするものではない。
ロック図である。
図である。
ズムの動作のフロー図である。
ク図である。
り後に受ける音声アーティファクトを示す図である。
Claims (10)
- 【請求項1】 第1フレームを受信する段階と、 前記第1フレームの第1フレームレートを判定する段階と、 誤り判定を生成するために、前記第1フレームレートが誤っているかどうか判
定する段階と、 前記誤り判定に基づき音声復号器フィルタの状態を更新する段階と、 を含むことを特徴とする方法。 - 【請求項2】 請求項1に記載の方法であって、前記第1フレームレートが
誤っているかどうか判定する段階は、 第2フレームを受信する段階と、 前記第2フレームの第2フレームレートを判定する段階と、 比較値を生成するために、前記第2フレームレートを前記第1フレームレート
と比較する段階と、 前記比較値に基づき、前記第1フレームレートが誤っているかどうか判定する
段階と、 を含むことを特徴とする方法。 - 【請求項3】 請求項2に記載の方法であって、前記比較値に基づき、前記
第1フレームレートが誤っているかどうか判定する段階は、 前記第1フレームレートから前記第2フレームレートへの遷移が無効であるか
どうかを判定する段階を含むことを特徴とする方法。 - 【請求項4】 請求項2に記載の方法であって、前記第1フレームレートを
判定する段階は、フルレートフレームを判定する段階を含み、また、前記第2フ
レームレートを判定する段階は、8分の1レートフレームを判定する段階を含む
ことを特徴とする方法。 - 【請求項5】 請求項1に記載の方法であって、前記第1フレームレートを
判定する段階は、フル、2分の1、4分の1、8分の1フレームレートから成る
群から、前記第1フレームレートを判定する段階を含むことを特徴とする方法。 - 【請求項6】 請求項1に記載の方法であって、前記音声復号器フィルタの
状態を更新する段階は、前記音声復号器フィルタの状態をゼロに設定する段階を
含むことを特徴とする方法。 - 【請求項7】 請求項1に記載の方法であって、前記音声復号器フィルタの
状態を更新する段階は、ピッチフィルタ、声域フィルタ、及びポストフィルタか
ら成る群から、フィルタの状態を更新する段階を含むことを特徴とする方法。 - 【請求項8】 請求項1に記載の方法であって、前記第1フレームが信号フ
レームであるかどうか判定する段階を含むことを特徴とする方法。 - 【請求項9】 フレームレートの有効性を判定する手段と、 前記フレームレートの有効性に基づきフィルタの状態を変更するための、前記
判定手段に接続された音声復号器と、 を含むことを特徴とする装置。 - 【請求項10】 請求項15に記載の装置であって、 情報フレームのフレームレートの有効性を判定する前記手段は、前記フレーム
レートを前情報フレームのフレームレートと比較する手段を含むことを特徴とす
る装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US20079500P | 2000-05-01 | 2000-05-01 | |
US60/200,795 | 2000-05-01 | ||
US09/767,522 | 2001-01-23 | ||
US09/767,522 US7080009B2 (en) | 2000-05-01 | 2001-01-23 | Method and apparatus for reducing rate determination errors and their artifacts |
PCT/US2001/014025 WO2001084540A1 (en) | 2000-05-01 | 2001-05-01 | Method and apparatus for reducing rate determination errors and their artifacts |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003532354A true JP2003532354A (ja) | 2003-10-28 |
JP4825944B2 JP4825944B2 (ja) | 2011-11-30 |
Family
ID=26896094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001581273A Expired - Lifetime JP4825944B2 (ja) | 2000-05-01 | 2001-05-01 | レート判定誤りとそのアーティファクトの低減方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7080009B2 (ja) |
JP (1) | JP4825944B2 (ja) |
WO (1) | WO2001084540A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590096B2 (en) | 2000-12-04 | 2009-09-15 | Qualcomm Incorporated | Method and apparatus for improved detection of rate errors in variable rate receivers |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7133823B2 (en) * | 2000-09-15 | 2006-11-07 | Mindspeed Technologies, Inc. | System for an adaptive excitation pattern for speech coding |
JP4591939B2 (ja) * | 2001-05-15 | 2010-12-01 | Kddi株式会社 | 適応的符号化伝送装置および受信装置 |
JP4149143B2 (ja) * | 2001-06-13 | 2008-09-10 | 富士通株式会社 | 移動通信システムのシグナリング通信方法 |
US7023880B2 (en) * | 2002-10-28 | 2006-04-04 | Qualcomm Incorporated | Re-formatting variable-rate vocoder frames for inter-system transmissions |
US7406096B2 (en) * | 2002-12-06 | 2008-07-29 | Qualcomm Incorporated | Tandem-free intersystem voice communication |
KR100421082B1 (ko) * | 2003-02-05 | 2004-03-04 | (주)미라콤테크놀로지 | 이동단말 또는 이동단말 기능을 수행하는 장치를 이용하여동일한 무선 채널에 복수의 서비스를 다중화하여 동시에제공하는 서비스 제공 방법 |
US20040165560A1 (en) * | 2003-02-24 | 2004-08-26 | Harris John M. | Method and apparatus for predicting a frame type |
US7499403B2 (en) * | 2003-05-07 | 2009-03-03 | Alcatel-Lucent Usa Inc. | Control component removal of one or more encoded frames from isochronous telecommunication stream based on one or more code rates of the one or more encoded frames to create non-isochronous telecommunications stream |
US7809091B2 (en) * | 2006-01-05 | 2010-10-05 | Broadcom Corporation | Method and system for decoding single antenna interference cancellation (SAIC) and redundancy processing adaptation using frame process |
US7168023B2 (en) * | 2004-12-30 | 2007-01-23 | Motorola, Inc. | Method and apparatus for full rate erasure handling in CDMA |
US8295362B2 (en) | 2006-01-05 | 2012-10-23 | Broadcom Corporation | Method and system for redundancy-based decoding of video content |
US7809090B2 (en) * | 2005-12-28 | 2010-10-05 | Alcatel-Lucent Usa Inc. | Blind data rate identification for enhanced receivers |
KR20080003537A (ko) * | 2006-07-03 | 2008-01-08 | 엘지전자 주식회사 | 이동 단말기의 통화 중 노이즈 제거 방법 및 이를 위한이동 단말기 |
WO2009037852A1 (ja) * | 2007-09-21 | 2009-03-26 | Panasonic Corporation | 通信端末装置、通信システムおよび通信方法 |
CN101604525B (zh) * | 2008-12-31 | 2011-04-06 | 华为技术有限公司 | 基音增益获取方法、装置及编码器、解码器 |
US8745474B2 (en) * | 2010-07-30 | 2014-06-03 | Michael Anthony Maiuzzo | Method and apparatus for determining bits in a convolutionally decoded output bit stream to be marked for erasure |
US8583996B2 (en) * | 2010-07-30 | 2013-11-12 | Michael Anthony Maiuzzo | Method and apparatus for determining bits in a convolutionally decoded output bit stream to be marked for erasure |
CN112767956B (zh) * | 2021-04-09 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 音频编码方法、装置、计算机设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0763902A1 (en) * | 1995-09-15 | 1997-03-19 | Nokia Mobile Phones Ltd. | Methods and apparatus for performing rate determination based on the growth of a path metric in a Viterbi decoder |
WO1998013941A1 (en) * | 1996-09-25 | 1998-04-02 | Qualcomm Incorporated | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters |
JPH11163962A (ja) * | 1997-11-25 | 1999-06-18 | Toshiba Corp | 可変レート通信システム、送信装置および受信装置 |
JP2001503233A (ja) * | 1996-10-30 | 2001-03-06 | クゥアルコム・インコーポレイテッド | 可変レートデータをデコードする方法及び装置 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0076234B1 (de) * | 1981-09-24 | 1985-09-04 | GRETAG Aktiengesellschaft | Verfahren und Vorrichtung zur redundanzvermindernden digitalen Sprachverarbeitung |
US4617676A (en) * | 1984-09-04 | 1986-10-14 | At&T Bell Laboratories | Predictive communication system filtering arrangement |
SG70558A1 (en) * | 1991-06-11 | 2000-02-22 | Qualcomm Inc | Variable rate vocoder |
US5517511A (en) * | 1992-11-30 | 1996-05-14 | Digital Voice Systems, Inc. | Digital transmission of acoustic signals over a noisy communication channel |
US6092230A (en) * | 1993-09-15 | 2000-07-18 | Motorola, Inc. | Method and apparatus for detecting bad frames of information in a communication system |
US6141353A (en) * | 1994-09-15 | 2000-10-31 | Oki Telecom, Inc. | Subsequent frame variable data rate indication method for various variable data rate systems |
FI105001B (fi) * | 1995-06-30 | 2000-05-15 | Nokia Mobile Phones Ltd | Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin |
US6205130B1 (en) * | 1996-09-25 | 2001-03-20 | Qualcomm Incorporated | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters |
US5751725A (en) * | 1996-10-18 | 1998-05-12 | Qualcomm Incorporated | Method and apparatus for determining the rate of received data in a variable rate communication system |
US6397177B1 (en) * | 1999-03-10 | 2002-05-28 | Samsung Electronics, Co., Ltd. | Speech-encoding rate decision apparatus and method in a variable rate |
US6584438B1 (en) * | 2000-04-24 | 2003-06-24 | Qualcomm Incorporated | Frame erasure compensation method in a variable rate speech coder |
US6804218B2 (en) * | 2000-12-04 | 2004-10-12 | Qualcomm Incorporated | Method and apparatus for improved detection of rate errors in variable rate receivers |
-
2001
- 2001-01-23 US US09/767,522 patent/US7080009B2/en not_active Expired - Lifetime
- 2001-05-01 JP JP2001581273A patent/JP4825944B2/ja not_active Expired - Lifetime
- 2001-05-01 WO PCT/US2001/014025 patent/WO2001084540A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0763902A1 (en) * | 1995-09-15 | 1997-03-19 | Nokia Mobile Phones Ltd. | Methods and apparatus for performing rate determination based on the growth of a path metric in a Viterbi decoder |
WO1998013941A1 (en) * | 1996-09-25 | 1998-04-02 | Qualcomm Incorporated | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters |
JP2001503233A (ja) * | 1996-10-30 | 2001-03-06 | クゥアルコム・インコーポレイテッド | 可変レートデータをデコードする方法及び装置 |
JPH11163962A (ja) * | 1997-11-25 | 1999-06-18 | Toshiba Corp | 可変レート通信システム、送信装置および受信装置 |
Non-Patent Citations (1)
Title |
---|
JPN7008001362, Enhanced Variable Rate Codec,Speech Service Option 3 for Wideband Spread Spectrum Digital Systems −A, 199912, p.4, 3GPP2 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7590096B2 (en) | 2000-12-04 | 2009-09-15 | Qualcomm Incorporated | Method and apparatus for improved detection of rate errors in variable rate receivers |
US8243695B2 (en) | 2000-12-04 | 2012-08-14 | Qualcomm Incorporated | Method and apparatus for improved detection of rate errors in variable rate receivers |
Also Published As
Publication number | Publication date |
---|---|
US20030182108A1 (en) | 2003-09-25 |
WO2001084540A1 (en) | 2001-11-08 |
US7080009B2 (en) | 2006-07-18 |
JP4825944B2 (ja) | 2011-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4825944B2 (ja) | レート判定誤りとそのアーティファクトの低減方法及び装置 | |
JP5059795B2 (ja) | 可変レート受信器におけるレートエラーの改良された検出のための方法および装置 | |
KR100344513B1 (ko) | Tdma무선시스템에서의소프트에러보정 | |
KR100424207B1 (ko) | 프레임의 프레임 속도를 결정하기 위한 장치 및 방법 | |
US6170073B1 (en) | Method and apparatus for error detection in digital communications | |
RU2120668C1 (ru) | Устройство и способ маскирования ошибок | |
US6205130B1 (en) | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters | |
US7184954B1 (en) | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters | |
AU2002219914A1 (en) | Method and system for validating detected rates of received variable rate speech frames | |
EP2101433A2 (en) | Method and apparatus for digital communication | |
US7788092B2 (en) | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters | |
JP4841789B2 (ja) | 受信機内の復号誤りを軽減するための符号化方法とシステム | |
JPH0715353A (ja) | 音声復号化装置 | |
Wen Xu et al. | An Adaptive Multirate Speech Codec Proposed for the GSM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080501 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110201 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110607 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110613 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20110531 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110901 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4825944 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140922 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |