JP2001506764A - 遠隔通信システムにおける方法および配置 - Google Patents

遠隔通信システムにおける方法および配置

Info

Publication number
JP2001506764A
JP2001506764A JP51355198A JP51355198A JP2001506764A JP 2001506764 A JP2001506764 A JP 2001506764A JP 51355198 A JP51355198 A JP 51355198A JP 51355198 A JP51355198 A JP 51355198A JP 2001506764 A JP2001506764 A JP 2001506764A
Authority
JP
Japan
Prior art keywords
frame
sid
background noise
unit
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP51355198A
Other languages
English (en)
Other versions
JP2001506764A5 (ja
Inventor
ヒューゴ,インガマー ジョハンソン,
Original Assignee
テレフォンアクチボラゲット エルエム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフォンアクチボラゲット エルエム エリクソン(パブル) filed Critical テレフォンアクチボラゲット エルエム エリクソン(パブル)
Publication of JP2001506764A publication Critical patent/JP2001506764A/ja
Publication of JP2001506764A5 publication Critical patent/JP2001506764A5/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 本発明は、本発明は、不連続的に動作する、即ち、音声情報(FS)と背景ノイズ(FSID)とを交互に表すデータを処理する線形予測音声デコーダにおいて快適なノイズを生成する方法に関する。背景ノイズ記述パラメータを含む受信データフレーム(F(n))の復号化の際に、音声信号(FS[m+1])の直前に受信していたこれらK個のデータフレーム(FSID[m])が除かれ、代わりに、前に受信していた1つ以上の背景ノイズ記述フレーム(FSID[m-1])で置き換えられる。音声フレームシーケンス(FS[m+1],…,FS[m+1+j])の直後に受信したM個の背景ノイズ記述フレーム(FSID[m+j+2])もまた前記復号化の間に取り残され、前記音声フレームシーケンス(FS[m+1],…,FS[m+1+j])の直前に受信した1つ以上の背景ノイズ記述フレーム(FSID[m+j+2])で置き換えられる。これにより、背景ノイズ情報の劣化を抑えることができ、受信側には最適な快適なノイズが生成される。

Description

【発明の詳細な説明】 遠隔通信システムにおける方法および配置 [技術分野] 本発明は、不連続的に動作する、即ち、音声情報と背景ノイズとを交互に表す データを処理する線形予測音声デコーダにおいて快適なノイズを生成する方法に 関する。 本発明は、さらに前記方法を実行する配置に関する。 [従来の技術] VOX(Voice Operated Transmission)原理による不連続音声符号化において、音 声がアクティブであることを検出するユニット、即ち、所謂VAD(Voice Activity Detector)ユニットは受信した各音シーケンスに対して受信した音情報が人間の 音声を表すか否かを判断する。このVADユニットは2つの異なる状態を持つこと ができる。第1の状態は現時点の音が人間の音声として分類できた場合であり、 第2の状態はある音が音声ではないと分類できた場合である。 VADユニットは、ある音シーケンスが音声であると検出した場合には第1の状 態信号を生成し、音声符号化器は符号化音声情報を含む所謂音声フレームを出力 するように制御される。他方、ある音シーケンスがVADユニットにより人間の音 声ではないあるタイプの音であると判断された場合には、VADユニットは第2の 状態信号を生成して、SIDフレーム生成器が制御されてN個のフレーム毎に所謂S ID(=Silence Descriptor)フレームを生成する。データを送信すべき中間のN-1個 の区間には、SIDフレーム生成器も音声フレーム生成器もいかなる情報も生成せ ずに、送信機は沈黙する。 SIDフレームは、背景ノイズの評価レベルに関する情報と、送信側の評価ノイ ズスペタトルとを含む。 上記方法は、例えば携帯通信システムにおいて携帯端末機のバッテリエネルギ を節約するために用いられ、あるkjチャネルが音声情報の送信を行う必要がな い場合には、その無線バンド幅を管理する、即ち無線エネルギの送信電力を最小 にする。この方法は、しかしながら、音声接続毎に使用されるバンド幅を最小化 しなければならないときには、他のタイプの無線通信システムでも適用可能であ る。 不連続音声の符号化の技術分野では、VADユニットが非音声を検出したときに 、音声符号化器に、N番目のフレーム毎にSIDフレームを送出せしめることが知 られている。例えばGSM(=Glabal System for Mboile Communication)システムな どの既知の応用分野では、1秒当たり約2つのSIDフレームが送出される。 SIDフレームに含まれるパラメータとしては、評価された背景ノイズレベルと ノイズスペクトルとがあり、これらは、現時点の評価値の平均、ならびに、複数 の前フレームからの評価として計算される。受信機はN-1個の中間データ位置に ついて受信パラメータ値の間で挿入を行って、送信側での背景ノイズが均等に変 化する表現を受信機側で得るようにしている。 VADユニットが第1の状態信号から第2の状態信号を生成するように変化する と、即ち、音声検出状態から無音声の検出状態に変化すると、通常、ある決めら れた長さの時間間隔T1、所謂ハングオーバが適用されて、音声符号化器ユニット は、受信した音情報が人間の音声であるかのように音声フレームを送り続ける。 そのハングオーバ時間T1の経過後も、VADユニットは音声無しを登録し続け、そ れからSIDフレームが生成される。 この方法の理由は、とりわけ、センテンス内での音声の小休止は音声無しとし て変換されるべきでありながら、しかし、この状況でも音声フレーム発生器は活 動すべきであるということである。ハングオーバを適用することは、しかしなが ら、高エネルギの過渡ノイズを起こすことの問題を解決することにはならない。 この過渡ノイズにより、VADユニットが音声と誤認識する懼れがあり、もしこれ が発生すると、音声フレーム発生器のパラメータはこの過渡ノイズのスペクトル 特性に適合することとなって、その結果、音声フレーム発生器の状態を大きく損 ねることとなる。このハングオーバを用いるための前提条件は、それ故に、前の 音声シーケンスが第2の所定時間T2よりも長いことである。 VADユニットが第2の状態信号の生成から第1の状態信号の生成に変化した ときに、即ち、音声無し検出から音声有りを検出すると、通常は、対処処置は執 られずに、直ちに音声フレーム発生器が作動する。 欧州特許出願EP-A1-0544101では、受信側で、送信音声シーケンスを表す受信 フレームの中から背景ノイズレベルをいかに再構成することができるかについて の例を与えている。特許文献WO-A1-95-15550は、複数の履歴フレーム(現フレー ムと、所謂ノイズのみのフレームの中からの2つまでの将来フレーム)について 、背景ノイズレベルの平均値を計算する方法を記述している。続けて、計算され た背景ノイズレベルが受信音声信号から除去されて、どのノイズ内容が最小であ るかを示す結果信号が形成される。 VADユニットが第1の状態信号から第2の状態信号を生成するように変化する と、即ち、音声有り状態から音声無しの検出状態に変化すると、最後に受信した SIDフレーム、即ち、フレームパラメータが将に処理し終えた音声シーケンスに より影響を受けるという懼れがある。このパラメータは現フレームと複数の前フ レームの平均値として決定される。GSM標準では、この問題は、その前フレーム シーケンスが短くてハングオーバが行われなかったのであれば、即ち、その音声 シーケンスが時間T2よりも短かったならば、新たなSIDフレームを送らないこと により解決していた。代わりに、このような状況では、前記音声シーケンスの直 前に送られたSIDフレームのコピーを送出するようにしている。ETSI,TCH-HS,GSM 勧告6.41,“Discontinuous Transmission DTX for Half Rate Speech Traffic C hannels”を参照。 このGSM標準によると、VADユニットが第2の状態信号の生成から第1の状態信 号の生成に変化したときに、即ち、音声無し検出から音声有りを検出したときに 、送信側では、その最後に送出したSIDフレームが用いることができるように、 そのSIDフレームがセーブされる。このSIDフレーム内のパラメータは、しかしな がら、始まっている音声シーケンスからの音によりそのパラメータが影響される ので誤る懼れがある。このリスクは、もしVADユニットの状態信号がSIDフレーム が送られた直後に変化したならば、特に大きなものとなる。もし背景ノイズレベ ルが高いならば、VADユニットは状態信号を送信側で音声情報に より動機づけられる場合よりももっと頻繁に変更することとなる。これは、この 条件下ではある音声音は音声無しと誤認識されるからである。 [発明の開示] 本発明の目的は、VADユニットの状態信号が、前述の第1状態から第2状態へ 変化するときと、第2状態から第1状態に変化するときとにおいて、SIDフレー ムのパラメータが悪化するのを最小にするものである。 本発明は、欠陥SIDフレームが、即ち、ある意味でパラメータが誤りであるよ うなSIDフレームが受信側で起こす問題に解決を与えるものである。 本発明は、SIDフレームの平均値における高い過渡ノイズの影響を減少させて 、この過渡ノイズが受信側で影響を与えるのを防止することを目的とする。 これは、提案された方法によると、背景ノイズを記述し音声フレームの直前に 受信される1つ以上のSIDフレームを、実際の背景ノイズの計算に含めない。代 わりに、より早くに受信していた1つ以上のSIDフレームが実際の背景ノイズの 計算に用いられる。本発明のこの方法は請求の範囲第1項から明らかなように上 記のように特徴づけられる。 好適な実施形態によると、音声フレームに最も近く先行するSIDフレームが、 前記の実際の背景ノイズの計算から除外される。本発明のこの方法は請求の範囲 第2項から明らかなように上記のように特徴づけられる。 提案装置は、その課題が受信データフレームから音声信号を再構成するデータ 受信器である。このデータフレームとは、音声フレームでも、送信側における背 景ノイズを記述するフレームであっても良い。この装置は、下記の構成からなる 他のユニットを制御するための制御ユニットと、音声フレームを格納するための 第1のメモリユニットと、背景ノイズ記述フレームを格納するための第2のメモ リユニットと、受信データフレームを夫々のメモリユニットに導くデータフレー ム振向けユニットと、受信データから音声信号を再構成する再構成ユニットとを 具備する。前記制御ユニットには、前記第2のメモリユニット内の、そこからデ ータのシフトが行われる最初と最後の記憶位置とを制御するメモリシフトユニッ トが設けられている。シフトされたデータ、即ち、背景ノイズ記述フレームは、 送信音信号を再構成するために、受信された音声フレームと共に復号化ユニット に送られる。その間でデータシフトが行われる記憶位置を通して、音声信号の再 構成の際に、送信ノイズデータのどの部分を考慮すべきかを選択することができ る。本発明のこの方法は請求の範囲第6項から明らかなように上記のように特徴 づけられる。 提案方法及び装置は、不連続の音声通信を用いる通信システムのための、簡単 で効率的な復号化アルゴリズムを実現するものである。これは、解決が、1つに は、送信機が適用するVADやVOXアルゴリズムから独立していること、2つには、 ハングオーバ時間、即ち、音声符号化器がVADユニットが非音声を登録しようと も音声フレームを送り続ける時間間隔が比較的短く保持されていることによる。 [図面の簡単な説明] 図1は、VADユニットと音声符号化器の従来例の構成を示す図。 図2aと図2bは、VADユニットにより制御される音声符号化器からデータフ レームを送出する際に、従来例にかかるハングオーバを適用するときの変化を示 す図。 図3は、従来の図2a,図2bに示されたハングオーバ時間、あるシーケンス の音声情報を送出する間にでたフレームの送出にどのように影響するかを示す図 。 図4は、入力の音信号が音声無し区間が先行した音声シーケンスを含む場合に おいて、従来法により送信されるデータフレームを示す図。 図5は、入力の音声シーケンスが音声無し区間を伴う場合に、従来法により送 信されるデータフレームを示す図。 図6aは、従来例のVADユニットが音信号の変動に応じて第1と第2の状態信 号とをいかに切り替える例を示す図。 図6bは、図6aに示された例に従って音声符号化器ユニットが音情報を受信 する場合に、音声符号化器ユニットが送り出すデータフレームを示す図。 図6cは、図6aのような場合に、示唆された方法に従って受信側の符号化器 が、その音信号の再構成の間に、図6bのどのデータフレームを使用するかを示 す図。 図7は、本発明による装置構成を示すブロック図。 本発明を、好適な実施形態の助けと、添付図面を参照することによって詳細に 説明されるであろう。 [好適な実施形態] 図1は、従来例にかかるVADユニット110と音声符号化器ユニット12の構 成を示し、ここで、VADユニット110は音情報Sの各受信シーケンスに対して その音が人間の声を表すか否かを決定する。VADユニット110が,その音シー ケンスSが音声を表すことを検出したならば、第1の状態信号が音声符号化器1 20の音声フレーム発生器121に送られる。この音声フレーム発生器121は 前記音シーケンスSに基づいた符号化された音声情報を含む音声フレームFSを送 出するように制御される。一方、VADユニット110がその音シーケンスを音声 でないと判断した場合には、第2状態信号2が音声符号化器ユニット120内の SID発生器122に送られる。SID発生器122は、音シーケンスSに基づいてN 番目のフレーム毎にSIDフレームFSIDを送るように制御される。このFSIDは周波 数スペクトルと音Sのエネルギレベルとを含む。N-1回のデータ送出の可能な間 は、SIDフレーム発生器は何の情報も生成しない。音声フレームFSとSIDフレーム FSIDとは、生成される毎に結合ユニット123に送られて、そこで、フレームFS ,FSIDはデータフレームFの形態で共通出力上に渡される。 図2aにおいて、入力信号として音信号を入力するVADユニットからの出力信 号VAD(t)のタイミングチャートが示されている。同図の縦軸に沿ってVADユニッ トが出力する状態信号1または2が示され、一方、横軸は時間tである。図2b は、従来技術に従った、上記のVADユニットにより制御される音声符号化器によ り生成されるデータフレームF(t)を示す。同図の縦軸はデータフレームF(t)のタ イプを示し、即ち、実際のフレームが音声フレームFSもしくはSIDフレームFSID のいずれかを示し、横軸は時間tを表す。VADユニットが人間の音声を検出し、 それで、第1の状態信号が生成され、音声符号化器が音声フレームFSを生成する 。最初の時刻t1で音声信号が止まり、VADユニットは第2状態信 号2に変更させる。第2の時刻t2でハングオーバ時間T1はタイムアウトし、音声 符号化器はSIDフレームFSIDを生成し始める。 図3a,図3bは図2a,図2bと同じパラメータを示すが、この場合は、VA Dユニットへの入力信号は、短い休止を含む音声信号によりまず形成される。こ の音信号は終了時点で強力な過渡性の背景ノイズにさらされる。時刻t3で、VAD ユニットは音信号が音声無しを検出し、それ故に、第2状態信号2を生成する。 ハングオーバ時間T1よりも短い時間内に音声信号が継続して、それで、VADユニ ットが第1状態信号を生成し続ける。この音声の休止はハングオーバ時間T1より も短いので、音声符号化器は、SIDフレームFSIDを送出すること無く、音声フレ ームFSを送出し続ける。時刻t4で、音声が停止し、そのために、VADユニットは 第2の状態信号2を生成する。ハングオーバ時間T1の後の時点t5でVADユニット は音声無しを登録し続ける。これにより、音声符号化器ユニットに、音声フレー ムFSの代わりにSIDフレームFSIDを生成することを開始せしめる。いくらか後の 時点t6で、その音信号は、長さが所定の最小時間幅t2よりも短くて強力な音イン パルスを含むとする。VADユニットは、この音信号を誤って人間音声と認識し、 そのために第1状態信号1が作られる。その音インパルスが前記最小時間T2より も短かったならばハングオーバは行われない。しかし、音声符号化器ユニットは 、その音インパルスが弱くなるとすぐに、SIDフレームを送り続ける。 図4には、入力音信号が導入部で非音声区間を、続いて音声シーケンスを含む 場合において、従来法に従って生成され送出されるデータフレームF(n)が示され ている。第1背景ノイズ記述フレームF(0)が第1のデータフレームFSID[0]とし て送出される。第2背景ノイズ記述フレームFSID[1]がNデータフレーム回数後 に第2のデータフレームF(N)として送出される。データフレームが送られたであ ろうN-1回の中間の機会において、送信機は沈黙し情報は送られない。その代わ りに、復号化器が、この間に、受信側で、第N-1背景ノイズ記述パラメータを挿 入することになる。図では、これは波線のバーとして表されている。さらにN回 のデータフレーム回後に、データフレームF(2N)が第3背景ノイズ記述データフ レ ームFSID[2]として送出される。音声フレームFS[3]が次のデータフレームF(2N+1 )として送出される。このときはVADユニットが音声情報を登録し続けているから である。VADユニットは、次のj個のデータフレーム回数の間に音声を登録し続 ける、これにより、音声符号化器はこの間にj個の音声フレームFS[3]〜FS[3+j] を送出する。 図5は、入力音信号が音声シーケンスとそれに続く非音声とからなるときに従 来の手法に従って生成され送信されるデータフレームF(n)の構成を示す。VADユ ニットが音声情報を検出している限りは、音声符号化器は音声フレームFS[3]〜FS [3+j]を送出する。VADユニットが非音声を検出し、ハングオーバ時間がタイム アウトする限りは、音声符号化器ユニットは・番目のデータフレーム機会毎にSI Dフレームの送出を開始する。この例では、第1のSIDユニットFSID[j+4]がデー タフレームF(x+1)Nとして送出される。N個のデータフレーム機会の後に、第2 のSIDフレームFSID[j+5]がデータフレームF(x+2)Nとして送出される。データフ レームを送出できたであろうに、反対に送信機が沈黙していた中間のN-1回の間 に、受信側の復号化器は、同図に波線のバーとして、第N-1背景ノイズ記述パラ メータを挿入する。さらにN個のデータフレーム機会の後に、第3の背景ノイズ 記述フレームFSID[j+6]がデータフレームF(x+3)Nとして送出される。 図6aは、従来技術のVADユニットの状態信号VAD(t)が、VADユニットへの音入 力信号が非音声→音声→非音声の順からなるときにおける、状態の切り替わり方 を示している。同図の縦軸は状態信号1,2を示し、横軸は時間軸tを示す。 図6bは、図6aに示したVADユニットと同じ入力を与える公知の音声符号化 器から送られてきたデータフレームF(n)のタイプを示す。データフレームFS,FS ID のタイプは縦軸に沿って示され、横軸に沿ってはデータフレームの順番数nが 示されている。 図6cは、図6bで言及された音声符号化器により復号化された音信号を構成 する間に、従来の受信機により考慮されたデータフレームF'(n)を示す。音声フ レームFS,FSIDのタイプが縦軸で示され、横軸はそのデータフレームの順序数n を 表す。 VADユニットは非音声を検出すると、そのために、音声符号化器ユニットは、 n番目のデータフレームのタイミング毎に1つのSIDフレーム、FSID[m-2],FSID [m-1],FSID[m]を生成するように制御される。第1の時点t7においてVADユニッ トが音声情報を検出する場合には、状態信号を第2状態2から第1状態1に変更 する。同時に、音声符号化器ユニットは、出力信号F(n)として、SIDフレームFSI D の代わりにFS[m+1],…,FS[m+1+j]を音声フレームを送る。他の時点であるt8 では、VADユニットは再度非音声を検出し、この結果、音声符号化器ユニットは ハングオーバ時間後にSIDフレームFSID[m+j+2],FSID[m+j+3],FSID[m+j+4]をN 回目のデータフレーム時点毎に夫々生成する。 受信側の復号化ユニットが受信データフレームを復号化するときは、前記音声 フレームFS[m+1],…,FS[m+1+j]のシーケンスの直前に送出された第1の所定数 K個のSIDフレームFSID[m]が使用されない。これらのSIDフレームFSID[m]のパラ メータは、開始音声シーケンスから音により影響されてきた、それ故に、実際の 背景ノイズに関して誤った記述を与える。この例では、Kは1と仮定され、それ 故に、最初の音声フレームFS[m+1]の直前に送られたSIDフレームFSID[m]のみが 音信号を構成する間に考慮される。このSIDフレームFSID[m]のパラメータを考慮 する代わりに、直先行するSIDフレームFSID[m-1]のうちの少なくとも1つのもの からの対応するパラメータが用いられる。図6cでは、この事実はF'(m-1)のコ ピーで置き換えられたF'のm番目のデータフレームにより示されている。 受信データフレームの復号化の間は、所定の数M個のSIDフレームFSID[m+j+2] ,FSID[m+j+3],…が、これらは音声フレームシーケンスFS[m+1],…,FS[m+1+j ]の直後に送られたものであるが、同じように使用されない、なぜならば、これ らのSIDフレームFSID[m+j+21,FSID[m+j+3],…のパラメータは、最近の近い音 声シーケンスにより妨害されてきたからである。図示の例では、Mは1であるよ うに仮定されており、この仮定は、最後の音声フレームFS[m+1+j]の直後に送ら れるSIDフレームFSID[m+J+2]だけが、音信号を再構成する間に考慮されな いことを意味する。SIDフレームFSID[m+j+2]のパラメータを考慮することの代わ りに、SIDフレームFSID[m-1]の少なくとも1つのうちの対応パラメータが(これ らのパラメータは音声シーケンスFS[m+1],…,FS[m+1+j]の前に送られるもので あるが)用いられる。考慮可能な最後に送られたSIDフレームは、多くとも、順 序数を有してもよい。この順序数は前記第1の音声フレームFS[m+1]よりもK+1少 ない、即ち、m+1-K+1=m-Kである。この例ではKは1であると仮定されているの で、FSID[m-1]はここで用いることができる最後に送られたSIDフレームである。 図6cでは、このことはF'(m-1)のコピーで置き換えられたF'の順序数m+j+2を有 するデータフレームにより示されている。 本発明にかかる方法を実行する装置のブロック図が図7に示されている。入力 のデータフレームFは一部がデータフレーム制御ユニット710に送られ、一部 が制御ユニット720に送られる。制御ユニット720の中央ユニット721は 、各受信フレーム毎に、実際のデータフレームFが音声フレームFであるのか、 背景ノイズ記述フレームFSIDであるのかを検出する。制御ユニット721からの 第1の制御信号c1はデータフレーム振向け(directing)ユニットを制御して入力 データフレームFを、そのデータフレームFが音声フレームFSであれば第1のメ モリユニット730に送りせしめ、一方、該フレームFが背景ノイズ記述フレー ムFSIDであれば第2のメモリユニット740に送りせしめる。 音声フレームFSの入力があると、制御信号c1は第1の値に、例えば1に設定さ れ、背景ノイズ記述フレームFSIDの入力があると、制御信号c1は別の値に、例え ば0に設定される。中央ユニット721は第2の制御信号c2を生成する。この制 御信号c2は、第2メモリユニット740内の当該メモリからのデータ読出を行う メモリ位置pを与えるために、メモリシフトユニット722を制御する。復号化 ユニット760は、受信側において、送信側で生成された音信号Sを再構成する 。この音信号SはデータフレームFにより受信側に送信されていたものである。 人間の音声FSを表すデータフレームFが、送信音声情報の再構成のために、第1 のメモリユニット730から復号化ユニット760に取り込まれる。送信側での 背景ノイズを再構成する際に、データフレームFが、背景ノイズ記述フレー ムFSIDを含む第2のメモリユニット740から取り出される。音声フレームFSは それがメモリユニット730に記憶されたときと同じ順序で、即ち、ファースト ・イン・ファースト・アウトで読み出される。その一方、背景ノイズ記述フレー ムの読出は、図6a乃至図6cに関連して説明した方法に従って制御信号c2で制 御されて行われる。再構成された音信号Sの基礎となり、復号化ユニット760 への入力信号を形成するるデータフレームF'は,従って、受信したデータフレー ムFとは若干異なっている。何故なら、音声フレームシーケンスFSの前のK個の 背景ノイズ記述フレームFSIDと、その音声フレームシーケンスFSの後のとM個の 背景ノイズ記述フレームFSIDとが除去され、更に、より早くに受信されていた背 景ノイズ記述フレームFSIDのコピーで置き換えられているからであるにる。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(GH,KE,LS,MW,S D,SZ,UG,ZW),EA(AM,AZ,BY,KG ,KZ,MD,RU,TJ,TM),AL,AM,AT ,AU,AZ,BA,BB,BG,BR,BY,CA, CH,CN,CU,CZ,DE,DK,EE,ES,F I,GB,GE,GH,HU,ID,IL,IS,JP ,KE,KG,KP,KR,KZ,LC,LK,LR, LS,LT,LU,LV,MD,MG,MK,MN,M W,MX,NO,NZ,PL,PT,RO,RU,SD ,SE,SG,SI,SK,SL,TJ,TM,TR, TT,UA,UG,UZ,VN,YU,ZW

Claims (1)

  1. 【特許請求の範囲】 1. 音声情報(S)が送信側から受信側へ送信される際に与えられた音声接続に 対する音声情報(S)が、音声フレーム(FS)と背景ノイズ記述フレーム(FSID)とを 含む不連続のデータフレームの形式で送信され、前記受信した背景ノイズ記述フ レーム(FSID)から背景ノイズを受信側で形成する遠隔通信システムであって、 送信側での背景ノイズを記述するパラメータは、2つ以上の受信した背景ノイズ 記述フレーム(FSID)内の情報内容の間での補間により計算される遠隔通信シス テムでの方法において、 ある与えられたデータフレーム(F(2N))についての背景ノイズを記述する前記 パラメータの計算において、 音声フレーム(FS[3])に直接に先行するK個の背景ノイズ記述フレーム(FSI D [2])を除去し、 1つ以上の早くに受信した背景ノイズ記述フレーム(FSID[0],FSID[1])を用い ることを特徴とする方法。 2. K=1であることを特徴とする請求の範囲第1項に記載の方法。 3. 背景ノイズを記述するパラメータの前記計算の際に、 音声フレーム(FS[3]‐FS[3+j])の受信シーケンスの直後に続くM個の背景ノ イズ記述フレーム(FSID[j+4],FSID[j+5])を前記計算から除き、 前記音声フレーム(FS[3]‐FS[3+j])の前記受信シーケンスの前に受信されて いた背景ノイズフレームの(FSID)のM個の背景ノイズ記述フレーム(FSID[0],FS ID [1])を計算に用いることを特徴とする請求の範囲第1項又は第2項に記載の方 法。 4. M=1であることを特徴とする請求の範囲第3項に記載の方法。 5. 前記パラメータは背景ノイズのパワーレベルとスペクトル分散を示すこと を特徴とする請求の範囲第1項乃至第4項のいずれかに記載の方法。 6. 音声フレーム(FS)と背景ノイズ記述フレーム(FSID)とから形成される受信 データフレーム(F)から再構成音声信号を生成する装置であって、 制御ユニット(720)と、 音声フレーム(FS)を格納するための第1のメモリユニット(730)と、 背景ノイズ記述フレーム(FSID)を格納するための第2のメモリユニット(7 40)と、 受信データフレーム(F)を、実際のデータフレーム(F)が音声フレーム(FS)であ る場合には前記第1のメモリユニットに導き、背景ノイズ記述フレーム(FSID) である場合には前記第2のメモリユニットに導くデータフレーム振向けユニット (710)と、 データフレーム(F)が復号化され再構成された音声信号(S)を形成する復号化ユ ニット(760)、 とを有した装置であって、前記制御ユニット(720)は、 前記第2のメモリユニット(740)内の、そこから背景ノイズ記述フレーム (FSID)を前記復号化ユニット(760)への読出が行われる記憶位置(p)を制 御するためのメモリシフトユニット(722)を具備することを特徴とする装置 。
JP51355198A 1996-09-13 1997-09-05 遠隔通信システムにおける方法および配置 Withdrawn JP2001506764A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9603332A SE507370C2 (sv) 1996-09-13 1996-09-13 Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
SE9603332-9 1996-09-13
PCT/SE1997/001491 WO1998011536A1 (en) 1996-09-13 1997-09-05 Method and arrangement in a telecommunication system

Publications (2)

Publication Number Publication Date
JP2001506764A true JP2001506764A (ja) 2001-05-22
JP2001506764A5 JP2001506764A5 (ja) 2005-05-12

Family

ID=20403869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51355198A Withdrawn JP2001506764A (ja) 1996-09-13 1997-09-05 遠隔通信システムにおける方法および配置

Country Status (5)

Country Link
US (1) US5978761A (ja)
JP (1) JP2001506764A (ja)
AU (1) AU4142397A (ja)
SE (1) SE507370C2 (ja)
WO (1) WO1998011536A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6240383B1 (en) * 1997-07-25 2001-05-29 Nec Corporation Celp speech coding and decoding system for creating comfort noise dependent on the spectral envelope of the speech signal
US7072832B1 (en) 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6256606B1 (en) * 1998-11-30 2001-07-03 Conexant Systems, Inc. Silence description coding for multi-rate speech codecs
KR100317810B1 (ko) * 1998-12-31 2001-12-22 서평원 디지털 계위 구조의 리프레머 및 프레임 손실 검사 장치
JP3451998B2 (ja) * 1999-05-31 2003-09-29 日本電気株式会社 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体
JP3670217B2 (ja) * 2000-09-06 2005-07-13 国立大学法人名古屋大学 雑音符号化装置、雑音復号装置、雑音符号化方法および雑音復号方法
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
GB0129369D0 (en) * 2001-12-07 2002-01-30 Filtrona United Kingdom Ltd Method and apparatus for marking articles
US7746797B2 (en) * 2002-10-09 2010-06-29 Nortel Networks Limited Non-intrusive monitoring of quality levels for voice communications over a packet-based network
CA2697920C (en) 2007-08-27 2018-01-02 Telefonaktiebolaget L M Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
CN110010141B (zh) 2013-02-22 2023-12-26 瑞典爱立信有限公司 用于音频编码中的dtx拖尾的方法和装置

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
GB2256351B (en) * 1991-05-25 1995-07-05 Motorola Inc Enhancement of echo return loss
JP2518765B2 (ja) * 1991-05-31 1996-07-31 国際電気株式会社 音声符号化通信方式及びその装置
DE69233502T2 (de) * 1991-06-11 2006-02-23 Qualcomm, Inc., San Diego Vocoder mit veränderlicher Bitrate
JP3167385B2 (ja) * 1991-10-28 2001-05-21 日本電信電話株式会社 音声信号伝送方法
JPH07129195A (ja) * 1993-11-05 1995-05-19 Nec Corp 音声復号化装置
UA41913C2 (uk) * 1993-11-30 2001-10-15 Ейті Енд Ті Корп. Спосіб шумозаглушення у системах зв'язку
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
FI100932B (fi) * 1995-04-12 1998-03-13 Nokia Telecommunications Oy Äänitaajuussignaalien lähetys radiopuhelinjärjestelmässä
FI105001B (fi) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech
US5794199A (en) * 1996-01-29 1998-08-11 Texas Instruments Incorporated Method and system for improved discontinuous speech transmission
US5881373A (en) * 1996-08-28 1999-03-09 Telefonaktiebolaget Lm Ericsson Muting a microphone in radiocommunication systems

Also Published As

Publication number Publication date
SE9603332D0 (sv) 1996-09-13
WO1998011536A1 (en) 1998-03-19
SE9603332L (sv) 1998-03-14
US5978761A (en) 1999-11-02
SE507370C2 (sv) 1998-05-18
AU4142397A (en) 1998-04-02

Similar Documents

Publication Publication Date Title
US5812965A (en) Process and device for creating comfort noise in a digital speech transmission system
EP0843301B1 (en) Methods for generating comfort noise during discontinous transmission
EP1747556B1 (en) Supporting a switch between audio coder modes
US6101466A (en) Method and system for improved discontinuous speech transmission
JP3182032B2 (ja) 音声符号化通信方式及びその装置
US20070206645A1 (en) Method of dynamically adapting the size of a jitter buffer
JPH11514168A (ja) 不連続送信における音声デコーダのハングオーバー期間を評価する方法および音声エンコーダおよびトランシーバ
US8296132B2 (en) Apparatus and method for comfort noise generation
US6873954B1 (en) Method and apparatus in a telecommunications system
WO2008148321A1 (fr) Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil
JP2707564B2 (ja) 音声符号化方式
JP2001506764A (ja) 遠隔通信システムにおける方法および配置
JP2002525666A (ja) Celp符号化/復号方法と装置
JPH07123242B2 (ja) 音声信号復号化装置
KR100792209B1 (ko) 디지털 오디오 패킷 손실을 복구하기 위한 방법 및 장치
JP2861889B2 (ja) 音声パケット伝送システム
US5555546A (en) Apparatus for decoding a DPCM encoded signal
JP4437052B2 (ja) 音声復号化装置および音声復号化方法
US6134519A (en) Voice encoder for generating natural background noise
JPH07131767A (ja) 動画像符号化復号化方式
JP2900987B2 (ja) 無音圧縮音声符号化復号化装置
JPH0651799A (ja) 音声メッセージ符号化装置と復号化装置とを同期化させる方法
JP3593183B2 (ja) 音声復号装置
JP2002099299A (ja) 無音圧縮音声符号化復号化装置
JP2001094507A (ja) 擬似背景雑音生成方法

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040902

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040902

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060609