JP3781495B2 - ディジタル音声伝送システムの快適ノイズを作る方法と装置 - Google Patents
ディジタル音声伝送システムの快適ノイズを作る方法と装置 Download PDFInfo
- Publication number
- JP3781495B2 JP3781495B2 JP30694396A JP30694396A JP3781495B2 JP 3781495 B2 JP3781495 B2 JP 3781495B2 JP 30694396 A JP30694396 A JP 30694396A JP 30694396 A JP30694396 A JP 30694396A JP 3781495 B2 JP3781495 B2 JP 3781495B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- signal
- invalid
- speech
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005540 biological transmission Effects 0.000 title claims description 89
- 238000000034 method Methods 0.000 title claims description 89
- 238000001228 spectrum Methods 0.000 claims abstract description 89
- 230000005284 excitation Effects 0.000 claims description 90
- 230000008569 process Effects 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 19
- 238000013139 quantization Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 12
- 230000007613 environmental effect Effects 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 238000005311 autocorrelation function Methods 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 6
- 230000002194 synthesizing effect Effects 0.000 claims description 4
- 230000003595 spectral effect Effects 0.000 abstract description 5
- 238000005259 measurement Methods 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 description 18
- 230000007774 longterm Effects 0.000 description 12
- 230000015572 biosynthetic process Effects 0.000 description 10
- 238000003786 synthesis reaction Methods 0.000 description 10
- 238000001514 detection method Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04J—MULTIPLEX COMMUNICATION
- H04J3/00—Time-division multiplex systems
- H04J3/17—Time-division multiplex systems in which the transmission channel allotted to a first user may be taken away and re-allotted to a second user if the first user becomes inactive, e.g. TASI
- H04J3/175—Speech activity or inactivity detectors
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
Description
【発明の属する技術分野】
本発明は、不連続な音声のディジタル送信のためのシステムにおける快適ノイズ(Comfort noise)の生成の方法と装置とに関するものである。
【0002】
【従来の技術】
一般的に言って、不連続な音声の送信のためのシステムは音声活性化モジュールを備えているが、これは音声信号の有無に関する合図を与えることを可能にする。前記のシステムで与えられる音声信号は従ってその前か後に適当な無音を伴った上記の音声信号から成る。無音か休止が検出されると、送信システムは送信速度を下げるか単純に送信を停止するかを命令される。
通信の環境ノイズが高いときは、無効期間の間に、特性の突然の抑制もしくは緩和という、聞く側にとって非常に不愉快な効果を生じ、この効果はおそらく通信が中断したという印象を引き起こすであろう。さらに、音声信号は時に明瞭さの限界にまで達する。
上記の欠点を直すには、かなり最近になって提案されているのが無効期間の間に送信が妨害される前に当面の背景ノイズを再現するような合成信号を挿入する方法である。一例として、全速度および半速度の欧州自動車ラジオ・システムのための仕様作成の状況において実行された結果を引用する。
【0003】
全速度欧州自動車ラジオ・システムにより「ETSI GSM 06.12勧告」の主題が作られた。このシステムには快適ノイズ発生器CNGが含まれている。さらにこれには20ms毎に260ビット以上の符号化済みのパラメータ・フレームを作り出す音声符号化器が含まれている。音声活性検出器は各フレームにおいて、フレームの有効あるいは無効な特質/符号に関する合図を与える。励起ブロックの強度パラメータと符号化器のLPC分析から発せられる対数領域比(LAR)とが、環境ノイズの周波数スペクトル(LAR)のレベルあるいは強度と包絡線に関する合図を供給する。快適ノイズ生成器は指定された数の連続するフレームに渡ってこれらのパラメータの平均を取り、音声符号化器で使われる量子化手続きによってこれらを量子化し、無音記述フレームであるSIDフレーム(無音銘記述子)を生成する。そのようなフレームが有効フレームの終わりと各無効期間の480ms毎に生成される。SIDフレームは符号化され、SIDフレームであることの印をはっきりさせるSIDの符号語を供給され、それから復号化器に向けて送信される。快適ノイズは復号化器において、無作為に励起のパラメータの符号を引き出し、長期予測の利得符号の零点規正をし、LPC分析と励起ブロックの強度に対応する符号をSIDフレームの符号でもって置き換える。無効フレームの復号化が次に音声フレームと同様に行われる。そのような装置において、快適ノイズ発生器のモジュールは音声符号化器や復号化器の外部にあるが、このことの長所は無効フレームの処理の複雑さが増加することを犠牲にしてもシステムのモジュール化が促進されることである:符号化器におけるSIDフレームの計算と励起の符号の無作為配列とが音声フレームの通常の処理に加えられる。さらに、送信側における音声符号化器のみにある復号化器と、受信側における遠距離復号化器とは、符号化器の動作がシステムとは独立しているので無効期間の後はもはや同期しない。半速度欧州自動車ラジオ・システムには、また全速度システムに似た構成の快適ノイズ生成器があり、これについては「ETSI GSM 06.22及び06.20勧告」を参照されたい。全速度システムのCNG生成器による手続きと同様な方法によって、CNG生成器は8つの連続するフレームに渡って環境ノイズのスペクトルを評価するために、入力信号、音声信号の自動相関を使用する。エネルギーに関して、これらの8フレーム分のエネルギーを考慮し、実際のエネルギーとパラメータGSに対して見積もられたエネルギーの比のパラメータを量子化する。「ETSI GSM 06.20勧告」を参照されたい。さらに、音声符号化器は遠距離復号化器と同期して無効期間の間、動作するように変えられ、乱数発生器は無効領域の各開始時に再初期化される。
【0004】
最後に、多速度符号化器を与えられたシステムが提案されており、この動作は特殊な動きのモード時においてCNGの動作に似ている。それらの中に、以下の出版物に記載される多速度符号化器が引用されうる、A.De JACO,W.GARDNER,P.JACOBS,CHONG LEE著「QCELP:The North American CDMA Digital Cellular Variable Speech Coding Standard」Proc.IEEE Workshop on Speech Coding for Telecom, Quebec, Oct.1993, pp.5−6。そのようなシステムにおいて音声活性検出タイプの装置は送信に必要な速度を決定する。標本毎に1,1/2,1/4,1/8の4種の速度比が可能である。送信は妨害されず、送信されるパラメータはLPC係数によるスペクトルの包絡線と、励起エネルギーに関する指標とである。これらのパラメータは各フレーム毎に送信され、最も遅い速度のシステムはCNG生成器によるのと類似の機能を示す。
【0005】
さらに、A.GROSSMANが以下の書物で記したシステムが引用され得る。「A High Performance Audio Codec forVideoconferencing」ICSPAT, Santa Clara, Oct.93,pp.1039−1042。そのような可変速度の広帯域システムにおいては、変換済みの係数をノイズ符号により置き換える手続きが使われる。しかし、信号のスペクトル包絡線が再び送信され、フレーム内部のスムージングが行われる。
【0006】
【発明が解決しようとする課題】
この発明によれば、音声のディジタル送信のためのシステムにおける快適ノイズを生成する方法と装置の目的は、合成の質の程度を高速度システムのそれに比肩するまで到達させ、一方、システムの送信速度を高度に減速されたものと同じくらいにまで許すことである。
本発明のもうひとつの目的はさらに、良質の、環境媒体を代表し、一方この生成を確かにするために送信されるデータの量と速度を最適化する快適ノイズを生成することである。
【0007】
【課題を解決するための手段】
不連続音声のデジタル送信をするシステムで快適ノイズを作る方法と装置において、符号化済みの音声信号が有効期間の間に送信され、この有効期間の間に有効フレームが送信され、各有効期間の後には無効期間が続き、無効期間の間には少なくとも無効フレームが送信されるような方法と装置が本発明の主題であり、それらがあるところにおいて顕著であり、無効期間を検出した時にその送信端において以下の各項をそれぞれ備え、
− 快適ノイズを記述する一組の符号化済みのパラメータから成る無音記述フレームの生成と送信をし、この無音記述フレームはこの有効期間に続く無効期間の最初の無音記述フレームとなるものであり、
この無効期間の連続する各現在の無効フレームに対して、
− この無効フレームの周波数スペクトルを分析し蓄積し、
− この現在の無効フレームの周波数スペクトルを基準用と現フレーム周波数スペクトルを認識する基準によって、基準用周波数スペクトルと比較し、
− この現在の無効フレームの間、基準用と現フレーム周波数スペクトルが無い時の基準によって、送信を、特に新しい無音記述フレームの送信を延期し、
− この現在の無効フレームの間、新しい無音記述フレームの生成と送信を行い、これにより快適ノイズの送信速度を、先行する無音記述フレームの間に見積もられた基準用スペクトルとは異なる周波数スペクトルを持つ無音記述フレームの送信速度にまで減ずることを可能にする。
本発明の主題であり、音声復号化器と接続され、受信端において、以下の各項を備えそれらがあるところにおいて同様に顕著であるような方法と装置。
− 復号化済みのパラメータを生成するために、各連続する無音記述フレームに対し、快適ノイズを記述する符号済みのパラメータの組を復号化し、
− 音声復号化器のレベルにおいて、復号化済みのパラメータの処理の後に、対応する快適ノイズを合成する。
【0008】
【発明の実施の形態】
従来技術に関する図1は別にして、下記の図を見て説明を読むと、より良く理解されるであろう。
− 図2は、送信端において本発明の主題に従って快適ノイズを生成する処理を実行させる一連の必須のステップを図解によって表している。
− 図3は、無音記述フレームの好ましいモードをフローチャート様式で表している。
− 図4は、受信端において本発明の主題に従って快適ノイズを生成する処理を実行させる一連の必須のステップを図解によって表している。
− 図5は、音声符号化器がLPCフィルタを備えた予測型である場合に、快適ノイズを生成する処理を実行させる一連の必須のステップを図解によって表している。
− 図6は、本発明の主題に従って、送信端において快適ノイズを生成する装置の図を機能ブロックの様式で図解により表している。
− 図7は、本発明の主題に従って、音声符号化器が予測型であるようなより特殊な場合に、送信端において快適ノイズを生成する装置の図を機能ブロックの様式で図解により表している。
− 図8は、図7で表される装置で使われている快適ノイズ生成器の具体例の詳細を表している。
− 図9は、無音記述フレームに対し、送信あるいは非送信命令信号を作る一連のステップの組を、機能フローチャートの様式で表している。
− 図10は、無音記述フレームの作成とコーディングと送信の一連のステップの組を、機能フローチャートの様式で表している。
− 図11は、一実施形態に従って励起信号を作る一連のステップの組を、機能フローチャートの様式で表している。
− 図12は、本発明の主題に従って、受信端において快適ノイズを生成する装置の図を機能ブロックの様式で図解により表している。
− 図13は、図12で表される装置で使われている快適ノイズ生成器の具体化の詳細を表している。
【0009】
本発明の主題である快適ノイズの生成の処理は先に述べられた図と共に、より詳細に記述されるであろう。
処理特有の話をする前に、最初に、従来技術に関する図1と共に思い出されるのは、音声のディジタル送信のためのシステムにおける従来からある快適ノイズ生成用装置は送信端において音声符号化器に加えて音声活性復号化器と先述したVADとCNG生成器とを含んでいる。この組み合わせは送信端において、送信チャネルについての記述中に先にかかれている方法の内の一つに従って、無音記述フレームかSIDフレームを周期的に送信することを可能にしている。
受信端において、送信端で使われる音声符号化器もまた予測型の符号化器である時に、予測型の復号化器である音声復号化器は、送信された時に音声信号を各SIDフレーム別に復号化し、受信端においてCNG生成器の効により対応する快適ノイズをつくることを可能にしている。
【0010】
このようにして、図2でさらに表されたように、音声のディジタル送信は不連続モードで実行され、従って符号化済みの音声信号フレームが送信される連続的な有効期間から成るこの送信は、無効期間がインターカットされ、その間に送信される音声信号フレームは無い。これらの期間のそれぞれの時間は、送信が非同期であるという特徴からその長さが任意である。
このようにして、前記の図2でさらに述べるように、本発明の手段である快適ノイズを生成する処理は本発明の主題であって送信端で実行され無効期間の検出の後に続く。無効期間の検出は、例えばタイムディレーが掛けられた音声活性検出器VADにより与えられる信号を基準として実行され得るもので、無効期間が効果的に通過するように上記に対して時間遅れが加えられる。この時間遅れはまた、検出期間の時間を考慮するように、図2に表されるように、発明に従って処理の正確な実行が確かにされるように調節され得るものである。上述の図2において、検出期間は、関連する有効期間に続いて点線で区切られる間隔によって表される。
【0011】
各無効期間の検出に続いて、本発明の主題である処理は、上述の検出期間の終わりである図2のステップ100において、SIDかあるいは無音記述フレームを生成し送信する。この無音記述フレームは快適ノイズを記述する一組の符号化済みのパラメータから成る。事実、この無音記述フレームは上記の有効期間と検出期間に続く無効期間の最初の無効フレームを構成する。
かくして、さらに図2において述べられるように、本発明の主題である処理は次に、この無効期間における連続する現在の無効フレームの各々に対してステップ101においてこれに関した現在の無効フレームの周波数スペクトルを分析し蓄積することにある。前記無効フレームにおける周波数スペクトルは、ステップ102において基準周波数スペクトルと比較される。これを得るための処理のないようは後述する。
基準用と現在フレームの周波数スペクトルが同一である場合は、上述のステップ102で表現されているように、発明に関する処理は送信、特に新しい無音記述フレーム,SIDフレームの送信を遅らせるか、基準用と現在フレームの周波数スペクトルが同一で無い場合は、ステップ100における生成と送信において、このステップ100は各SIDフレームに対してこの現無効フレームの間の新しい無音記述フレームである最初のSIDフレームで使用されたのと同じ手法に従って実行される。図2において、新フレームの送信の延期は、基準用と現フレーム周波数スペクトルが同一である場合は基準104を持つものと示される。
【0012】
概して、本発明の主題である処理は、快適ノイズの送信速度を、その周波数スペクトルが先行する無音記述フレームのそれと異なるような無音記述フレームの速度にまで減じることを可能にすると示している。
本発明の主題であるところの快適ノイズを生成する処理の特殊な具体例において、基準用周波数スペクトルは各無音記述フレームの生成中に得られる環境ノイズの周波数スペクトルから作られ得ると示している。このようにして、図2で表されるような本発明の主題である処理は、各SIDフレームの基準用周波数スペクトルを得ることを可能にするところの環境ノイズを蓄積するステップである103を包含し得ると理解される。
【0013】
本発明の主題である処理の初期化に関して、無音記述フレームに対する送信決定はこの場合、現フレームの周波数スペクトルと基準用スペクトルの比較に依存しないので、無効期間の最初の無効フレームに対し、基準用スペクトルの使用は的外れであると示されている。この最初のSIDフレームの間、この基準用スペクトルであるSfrは見積りがされるか、好都合に、SIDフレームを工夫するために計算される基準用スペクトルから直に得られ、また、連続的な無効フレームの処理のために蓄積される。この基準用スペクトルは、無効フレームの最初のSIDフレームにおいて初期化に使用されたのと同じ方法により、送られてきた新しい無音記述フレームを使ってリフレッシュされる。
SIDフレーム毎に計算され、また基準用周波数スペクトルを構成し得る周波数スペクトルの見積りは図3と共に記述されるであろう実施形態に従って実行され得る。
【0014】
図3の具体化において、本発明の主題であるところの処理は、各SIDフレームを環境ノイズの変更に適合させ、それに従いSIDフレームを作る時にこれらの変更のある特殊な要素を考慮に入れることを過去にもそうであったように可能にするところの特別手続きに従って各無音記述フレームやSIDフレームを確定することにある。
かくして、図3に表されたように、各無音記述フレームを達成する手続きは過去の平均周波数スペクトルを確定するために、連続的な無効フレームの平均周波数スペクトルを決定してなるステップを含み得るものであり、このステップは図3中の1041を参照されたい。
この場合、過去の平均周波数のスペクトルSmpは式(3)を満足する。
【数3】
この式(3)において、複数の無効な連続するフレームに対して、SF1,SFi,SFnと記述されたものは、その周波数スペクトルはSFcと記述されるところの現在の無効フレームに先行し、この過去の平均周波数スペクトルはn個の連続する無効フレームのn個の周波数スペクトルに渡る算術平均に対応する。
【0015】
SIDフレームの生成は次のステップ1042において実行される。
上述のステップ1042は過去の平均周波数スペクトルの同一性と、式(4)に表される現在の無効フレームの周波数スペクトルとのテストから成る。
【数4】
同一性の基準は比較される周波数スペクトルの厳格な同一性には対応せず、対応の法則か基準を確立することが可能であると示されている。このステップは、実際、周波数スペクトルの局所的不動性の測定を実行することが可能にする。
上記の周波数スペクトルが同一かどうかの基準に基づいて、本発明の主題である処理は、無音記述フレームSIDと過去の平均スペクトルSFmpの1043を選び、また上記の周波数スペクトルが同一でない場合は、1044において対応する現在の無効フレームの周波数スペクトルを選ぶ。
この動作のモードは特別に有利な方法でもって現在の各無効フレームの無音スペクトルを見積もることを可能にするが、この時そのようなフレームが局所的不動性スペクトル領域に属するかあるいは非不動性スペクトル領域に属するかによる。
【0016】
もちろん、過去の平均スペクトルの計算結果が任意であるような連続的な無効フレームの数であるnは、たとえば後者は100msの単位で対応する時間間隔を得るために等しく取られ得る。さらに、このように構成される無音記述フレームSIDは送信に先だって量子化の処理を受けさせられると示されている。
不連続音声のディジタル送信のためのシステムで快適ノイズを生成する処理のより詳細な記述は、本発明の主題に従って受信端において図4と共に与えられる。
もちろん、受信端において、発明に従う処理は、既述の処理によってSIDフレームを送ることを含んでいると示される。
図4を参照して、発明に関する処理は、各連続的無音記述フレームに対してステップ200において復号化済みのパラメータを生成するために、快適ノイズを記述する符号化済みのパラメータの組を復号化し、それから、音声複合化器のレベルで復号化済みのパラメータを処理した後、音声複合化器がステップ201において対応する快適ノイズを合成することを可能にするようなパラメータを合成することとから成る。特に、復号化済みのパラメータの処理は適当な特別の再符号化からなることが可能だと示している。
【0017】
一般に、快適ノイズを生成する処理は、本発明の主題であり、それぞれ送信端と受信端とで用いられる音声符号化器と音声復号化器とが予測型である場合に、有利に実施されると示している。
そのような場合には、復号化された信号は励起信号にフィルタを掛けることにより得られ、この信号は今後LPCフィルタと呼ぶところのLPC合成フィルタによって、新規の辞書と随意に長期励起とから始まる。
本発明の主題である処理は、快適ノイズを作るために信号の合成を実行することを可能にするところのLPCフィルタを励起するために、白色ノイズに似た特徴のスペクトルを持つ励起信号を生成することから成る。
そのような場合には、環境ノイズのスペクトルを表すパラメータは、スペクトルの包絡線に対してLPCフィルタの係数によって、また上記のスペクトルのレベルに対して励起信号のエネルギーによって与えられる。
【0018】
本発明の主題である処理は、送信端において、図2と共に既述の必須ステップを再使用する。
そのような処理は、図5と共に記述し表現されており、ここでは無音記述フレームの送信に関する動作に関連して指標’が付けられている同様のステップを含んでいる。
図5で表される発明による処理の実施の特別なモードに従って、実施される処理は、片方でLPCフィルタの不動性あるいは他方で励起エネルギーの不動性に対してSIDフレームを送信するかあるいはそのようなフレームを送信しないかという決定の基準を作る。
このようにして、ステップ100’の最初のSIDフレームの送信に続いて、図5に実施され記述されている処理はFcと表されている現フレームのLPCフィルターを101’の現フレームFcと比較し、また102’の現フレームFcをステップ103’に従い先行するSIDフレームの間に得られ蓄積される基準フィルターFrと比較することにある。
【0019】
ステップ102’で先述のフィルタが同一でない場合はステップ100’において新しいSIDフレームが送信される。ステップ100’,101’,102’,103’は実質的に図2のステップ100,101,102,103から変更されない。
反対に、もし現フィルタに関するフィルタFcと基準フィルタに関するフィルタFrとが同一であるなら、図5に描かれている実際の処理は、ステップ104’aにおいて現フレームの励起エネルギーの見積りをし、ステップ104’cにおいて上述の現フレームの励起エネルギーEcを先行するSIDフレームの間に見積もった基準エネルギーErとを比較することにある。この見積りは図5中のステップ104’bとして表されている。
【0020】
ステップ104’cのテストに応じて現フレームの励起エネルギーと基準エネルギーとの比較が重要である場合には、この比較はしきい値E0に関するこれらのエネルギーの差異の比較にあり、その処理は前に記述されているステップ100’へと帰ることにより新しいSIDフレームを生成し送信することにある。逆に、もしステップ104’cのテストに応じて、上述の励起エネルギー間の差異が重要でない場合には、その処理は図2中のステップ104dと同様にステップ104’dにおいてフレームの送信を遅らせることにある。
図5に表されている本発明の主題である処理の実施の文脈において、LPCフィルタの比較をするために、特にLPCフィルタを量子化するベクトル法によって実施される距離の判断基準を用いることが可能であると示される。上述の距離は、板倉−斉藤距離や最大可能性の距離や、例えばLPC係数や組になったスペクトル・ラインや対数領域から発するパラメータに渡って計算されるユークリッド距離から成ることが可能である。
【0021】
励起信号のエネルギー不動性の特徴に関して、人間聴取システムの感度の直線性の欠如は、符号化器で使われる利得量子化器において開発される。この理由により、上に書かれている符号化の手続きは、好ましくは、現フレームの励起エネルギーEcと、これらのエネルギーの量子化索引を基礎に基準エネルギーErとを比較する。手順を単純化するために、使われている量子化器はSIDフレーム中の符号化済みのエネルギーの計算に役立つ。
LPCフィルタやSID無音記述フレームの励起エネルギーを見積もったりする手続きは、後の記述において対応する快適ノイズ生成器の特別な具体例の状況で書かれる。
励起信号の計算に関して、本発明の主題である処理は、ホワイトノイズのと似た特徴を持つスペクトルを備え平均エネルギーが復号化器に送信されるような励起信号を生成することを要求し、この励起信号を合成する簡単な方法は単一の確率濃度を持ち振幅を与えられ、例えば送信されたエネルギーから計算されることにある。
【0022】
他の方法は、音声符号化器に用いられたのと同じ種類の無作為に描いた励起によって合成することにあり、この二番目の方法の長所は受信部の復号化器の外部にモジュールを構成する可能性にある。他方、知覚的見地から言って、先行する復号化済みのフレームの中断の危険性はより小さいが、これは励起がタイプを突然変えることは無いからである。二番目の上述した方法の元の具体化は対応する装置の特別な具体例の状況における記述の中で後に記される。
本発明の主題に従って不連続な音声のディジタル送信のためのシステムにおける快適ノイズの生成の装置に関して、この装置はもちろん上述したようにそのような快適ノイズを生成する処理を実施するものであるが、より詳細な記述は図6と共に与えられる。
かくして、特に図6で描かれているように、上述の装置には、符号1の音声符号化器を組み合わされて、モジュール2があり、これは各有効期間に続く検出期間の間、各有効期間の終わりを検出するものである。例えば、モジュール2は従来からのタイプであり音声符号化器1と接続され論理信号を与えるような音声活性符号化器から成るが、この論理信号はVADinと記され、符号化済みの音声フレームが送信されるところの活性期間と無音記述フレームが送信されるところの不活性期間もしくは逆にフレームが送信されないような期間を示す。
【0023】
さらに、同じ図6に描かれているように、符号3のCNG生成器が一方で音声符号化器1と組み合わされ、他方で音声活性モジュール2と組み合わされる。多重化器4は、一方で音声符号化器1から与えられる符号化済みの音声フレームを受け取り、またCNG生成器3から与えられる符号化済みの無音記述フレームやSIDフレームから成る信号を受け取るが、後者の信号はそれぞれこの同じCNG生成器3により与えられる送信のタイプを表す信号とVADoutとである。概して、本発明の主題である図6に描かれるような装置は、発明に従って処理と共に記述される手続きの原理を再使用する。CNG生成器3は、無効期間の間に快適ノイズを記述する符号化済みのパラメータの組から成る無音記述フレームを生成し、条件によっては送信するモジュール3aと、現無効フレームの各々の周波数スペクトルを分析し蓄積するモジュール3bと、現無効フレームの周波数スペクトルを基準用と現フレーム周波数スペクトルとが同一であるか否かによって特別な命令信号を与えるような基準周波数スペクトルとを比較するモジュール3cと、それぞれ送信されないフレームと無音記述フレーム目印の有効フレームを符号化する3レベルを備えた信号VADoutを毎フレーム与える現フレームに対し送信タイプを見積もるためのモジュール3dとを含んでいる。
【0024】
モジュール3dは片方で音声活性を検出するモジュール2により作られる信号を受信し、他方で下で示されるようなモジュール3cにより作られる比較信号を受信する。現フレームが有効である時、モジュール3dは信号VADoutのこの目印を再送信する。別な方法で、現フレームが有効期間の最初の無効フレームである場合、モジュール3dは信号VADoutに無音記述フレームの目印に対応する値を割り当て、こうして、新らしい無音記述フレームの送信を許可する。もし、現フレームが無音記述フレームであり、しかし無効領域の最初の無効フレームでない場合は、モジュール3cは現フレームの周波数スペクトルを基準周波数スペクトルと比較し、これらのスペクトルが同一であるか否かにより、それぞれ、送信されないか無音記述フレームの目印かを表す信号CMPを与える。この場合には、信号CMPに基づいてモジュール3dは、送信の合図の信号VADoutを符号化し、これは基準用と現フレームの周波数スペクトルが同一である時に送信を延期し、かつ、これらのスペクトルが同一でない時に新しい無音記述フレームの送信を実行することを可能にする。
【0025】
モジュール3aと3bは音声符号化器と、ある数のSgと表される音声符号化器管理信号を交換する。入力において、これらのモジュールは周波数スペクトルの評価ができるようなデータを受け取るが、モジュール3bは現フレームのデータを、モジュール3cは現フレームの前のある数のデータを受け取り、出力において、音声複合化器の要求に応じて、モジュール3aは、音声複合化器に適切なように信号を転送し、この信号は受信端に置かれた音声符号化器と非同期にならないようにメモリを再更新することが可能なものである。
入力において、モジュール3aはモジュール3bで作られた現フレームの周波数スペクトルであるところの信号SFcをも受信する。
【0026】
快適ノイズを生成する装置のより詳しい説明は図7と共に特別に有利な場合についてなされるであろう。この図において、音声生成器1は予測型の音声符号化器であり各音声フレームに対して、LPCフィルタ係数の数に基づいて定義されるところの分析等級MのLPC分析モジュールを含んでおり、特に音声信号の自動相関機能Acfの(M+1)係数を作りだすが、パラメータMはLpcと表記されLPCフィルタの代表であり、各フレームに対し先行フレームLpcパラメータを用いて予測符号化の方法の助けを借りて符号化される。Lpcパラメータの予測符号化は現装置の動作には必要ではない、がそれでも後者の設計には再衝撃がある。パラメータLpcの予測符号化を使わない符号化器の場合には、装置の簡略化がたやすく可能である。
音声符号化器1は、合成化分析手法の助けを借りて、例えば後に続くExcと表記される励起信号を計算し蓄積するが、これはLPC合成フィルタを励起するために複合化器において計算されるものと同一である。
【0027】
図7は、上で図6において表現された装置の一般的なアーキテクチャを再使用している。CNG生成器3は予測型の音声符号化器1から、音声信号の自動相関機能Acfと、先行フレームのパラメータLpcと、適切には励起信号Excを部分的に構成し先行フレームから発せられる励起信号Exc(n)のある数のサンプルとを受信する。上記のサンプルの採用は快適ノイズの合成に関して、予測型符号化器の長期予測に使われていると述べられている。
本発明の主題に従って実施されているCNG生成器3のより詳細な記述は図8と共になされるであろう。この具体化は音声符号化器が予測型である場合に対応する。
このようにして、図8で分かるように、本発明の主題である装置と特にCNG生成器3にはモジュール30が含まれ、これは現フレームに関するパラメータを計算し、音声信号Acfに対する自動相関機能信号を受信し、出力として現フレームPcのパラメータに対応する信号を作り出す。これらのパラメータは現フィルタFcと現励起エネルギーEcとを含んでいる。
【0028】
CNG生成器3はまた図8に示すように、決定用モジュール31を含んでおり、これは符号化済みのフレームもしくは無音記述フレーム、SIDフレームを送信し、あるいは送信を止めて音声活性信号VADinと現フレームPcに関するパラメータと後に記すモジュール32により与えられる基準用パラメータPrとを受信する。このモジュール31は3レベルを持ちVADoutと記されるところの送信タイプ信号を出力するが、最初のレベルはVADout=0で現無効フレームの間に送信が全く無い場合のものであり、すなわちVADin=0は音声活性検出モジュール2により与えられる信号であり、二番目のレベルはVADout=1で活性期間の間の符号化済みの音声フレームの送信に対応し、三番目のレベルはVADout=2で無効期間中のSIDフレームの送信に対応し、すなわちVADin=0である。
【0029】
CNG生成器3はまた、条件によって入力信号VADoutに基づいて、各SIDフレームで計算される基準用パラメータPrに対応する信号を計算するようなモジュール32を含んでいる。これらのパラメータは基準用フィルタFrと基準用励起エネルギーErとを含んでいる。このモジュールは入力として自動相関信号Acfと現フレームPcのパラメータとを受信する。
CNG生成器3は次にモジュール33を含み、これは符号化済みの形式で無音記述フレームSIDを生成し、送信タイプ信号VADoutと基準用パラメータPrに対応する信号と、条件によっては符号化済みの無音記述フレーム信号を与える。
CNG生成器3は次にモジュール34を含み、このモジュールは励起信号Excを生成し、送信タイプ信号VADoutと基準用パラメータPrに対応する信号とそれに特例として採用された生成方法に従ってある数の音声符号化器により与えられる励起信号の過去のサンプルであるExcpasとを受信する。このモジュールは条件によっては信号VADoutに基づいて現フレームExcのための励起信号を与える。
【0030】
CNG生成器3は最後にモジュール35を含み、このモジュールは再更新されたフィルタ用パラメータLpcを記述する信号を生成し、送信タイプ信号VADoutと基準用パラメータPrに対応する信号と音声符号化器により与えられる信号とを受信し、先行フレームのパラメータLpcを記述しVADoutの条件によりこの信号を現フレームLpcrに合わせ再更新する。
CNG生成モジュール3の動作は以下の様である。
入力において、CNG生成モジュール3は音声活性検出複合化器2により与えられるフレーム0が無効でフレーム1が有効だという目印のVADinを受信する。このモジュールはまた音声符号化器モジュール1から各フレームに対して以下のものを受信する。
− 現フレームの音声信号のための自動相関機能信号Acf、
− 少なくとも先行フレームに関するパラメータLpcを記述し、Lpcを参照し少なくとも符号化器1の先行フレームのパラメータLpcに対応するような信号、ここでパラメータは音声符号化器の予測量子化器により使用される、
− 適切な過去の励起信号。
【0031】
CNG生成モジュール3は出力として各フレーム毎に先述した3レベルの送信タイプ信号VADoutを作り出す。
無音記述フレームSIDに対して、CNG生成器3はさらにSIDフレームを構成するところの無音を挿入する符号化済みのパラメータを作り出す。
無効フレームに対して、すなわち音声活性モジュール2により与えられる活性信号VADinは0に等しい時、CNG生成モジュール3は追加として適切に現フレームExcに対する励起信号と再更新されたパラメータLpcに対する信号Lpcrとを供給する。
CNG生成器3の総合的な動作は以下のように要約できる。
− もし信号VADinが1に等しいなら、そのフレームは有効でありCNG生成器3は単にVADout=1であるこの目印を通り過ぎる。
− そうでないとモジュール30は最初に現フレームPcに関してパラメータを評価する。
【0032】
次に、モジュール31は現フレームが送信されるべきか送信されるべきSIDフレームを構成するのかを決定する。
− もし現フレームが有効期間後の最初の無効フレームであるとすると、これはSIDフレームであり、
− さもないと、モジュール31はモジュール32により作られた基準用パラメータPrを使い先行SIDフレームにおいて基準用パラメータを計算し現フレームがSIDフレームであるかどうかを確定する。
もし現フレームがSIDフレームであるなら、VADout=2であり、そうでないときはVADout=0である。
上記の両方の場合において、すなわちVADout=0または2なら、モジュール34は現フレームExcに関して励起信号を生成しそして更新し、モジュール35はパラメータLpcの代表的信号を更新する。
符号化済みの音声フレームあるいは無音記述フレーム,SIDフレームの送信用もしくは送信の停止を決定するモジュール31の動きのモードのより詳細な記述は、図9と共に与えられる。
【0033】
先行フレームに関する信号VADinのテスト1020は、t−1の指標が付いて、現フレームが最初の無効フレームかどうかを決定する、つまり、VADin(t)=0に対しVADin(t−1)=1の時、1021において信号VADout=2となる、すなわちSIDフレームを送信する決定を行う。
逆に、テスト1020に対してNOの場合には、すなわちVADin(t−1)=0の時、先行フレームは無効で現フレームに関するLPCフィルタは式(5)からステップ1022で計算される。
【数5】
この式において、係数at(i)は前に述べた自動相関信号Acfの自動相関係数から計算されるLPCフィルタの係数を示すとされ、iは各係数の指標を示す。
【0034】
このフィルタの値は先行SIDフレームの間、蓄積される転送機能Aref(z)を持った基準用フィルタと比較されるが、これは発明に沿って処理の実施に関連して前記してある。この比較は上述した板倉−斉藤距離の助けを借りて達成される。この距離はしきい値と比較され、これは対数の計算の必要がなくなり、割算を排除でき、しきい値との比較は下の式(6)により実行される。
【数6】
上述の式において、Errtは残りのLPC信号の2乗の和である、現フレームの残りのLPCエネルギーを示し、この残りのエネルギーはレビンソン/ダービン法によりフィルタを計算するための手順によって得られ、RArefは式(7)を満足する基準用フィルタAref(z)の係数の自動相関から引き出される機能を示している。
【数7】
【0035】
式(6)において等しくないことが分かると、LPCフィルタは基準用フィルタに近いと認められず、現フレームは新しいSIDフレームでありVADout=2として定義される。
さもないと:同じステップ1022において、現フレームEtの励起エネルギーを見積もる処理が、LPC残余エネルギーErrtに基づいて行われる。現励起エネルギーの見積りを得るために、残りのLPCエネルギーErrtは学習により見積もられたCEと表される因子を乗ぜられる。これらのエネルギーの平均はmフレームに渡って計算されるが、mは例えば100msから200msの時間間隔に対応した整数で、式(8)に従って量子化の処理が実行されQ(.)と表記される。
【数8】
ここで、i(t)は現フレームを構成するm個の連続的フレームの平均エネルギーを表す量子化指標を示しており、この演算は図9中のステップ1023において実行される。
【0036】
上記のフレーム数mは各無効領域の初めに1に初期化され、指定された最大値までフレーム毎に足されていく。上記の演算1023には演算1024が続き、ここでは現フレームのLPCパラメータと上で述べた基準用フィルターAref(z)を比較する。上記のテスト1024の答がYESなら、信号VADoutはステップ1027において2に設定され、SIDフレームの送信を許可する。テスト1024への答がNOなら、テスト1025が実行され、このテスト1025は、先の式(8)で得られたエネルギーの平均の量子化値に対するテストであり、現フレームに対する量子化指標i(t)は先行するSIDフレームの間に得られ式(9)によりIrefと表される基準用フレームのそれと比較される。
【数9】
【0037】
テスト1025の答がYESなら、不等性が満足され、励起のエネルギー・レベルが変更され現フレームはSIDフレームと定義される。
テスト1025の答がNOなら、現フレームは非送信フレーム1026と定義され、信号VADoutは0に等しくなる。
無音記述フレームの動きのモードや符号化済みのSIDフレームや生成モジュール31のより詳しい記述は図10と共に与えられる。
一般的に、SIDフレームを符号化するときには、新らしい基準用フィルターAref(z)が計算されると示されている。
最後に、この処理を実行するために、転送機能がApast(z)と表される過去の平均的LPCフィルターがステップ1100において式(10)に従い評価される。
【数10】
このフィルターは上でAcfと表される現フレームに先行するところのP1フレームの信号自動相関の和によって計算される。このフィルターの係数の自動相関計算Rapastは上記の式(7)により与えられる方法に従って実行される。
【0038】
局所的な不動性のテストは図9と共に記されたテスト1024と同様の方法で上で述べた式(4)に従って1101において実行される。テスト1101に対するしきい値はしきい値1に等しい特殊な値である。上記のテスト1101の答がYESならば、ステップ1103は、式Aref(z)=At(z)に関する基準用フィルターとして現フィルターを選ぶことが可能になり、基準用フィルターRArefの新しい自動相関機能が計算される。
テスト1101の答がNOならば、過去の平均フィルターが式Aref(z)=Apast(z)に従って基準用フィルターとして選ばれ、基準用フィルターの係数の自動相関機能が式(A)に従い、再更新される。
RAref(i)=RApast(i),i=0→M. −−− 式(A)
【0039】
量子化ステップ1104は、先に選ばれた基準用フィルター1104を表すパラメータに基づいて行なわれ、量子化処理は符号化器により使われる手順に従って実行され、こうして得られた符号は符号化済みフレームへと挿入される。
ステップ1105において、1023で既に計算され量子化された励起エネルギーが対応するSIDフレームに挿入され、基準用エネルギーIrefとして蓄積される。
励起信号の合成に関して、Irefは基準用エネルギーの量子化指標を表し、grefは標本毎の平均エネルギーの2乗根に等しいところの再蓄積された利得を表し、次の式(11)を通して得られる。
【数11】
ここで、Q-1は逆量子化処理を示す。
現フレームの利得gtは次により与えられる:
・無効期間の開始時に、gt=gref
・無効期間中に、gt=α×gt-1+(1−α)×gref
この式において、αは0と1の間にある実数の係数である。
本発明の主題である処理の実施に関する記述中で上述した最初の方法において、標本の無作為な引き出しによって励起信号の合成は実行され得る。この場合、フレームのN個の励起標本は[−gt×√3,gt×√3]の間に単一の方法の無作為生成器によって引き出される。
【0040】
励起信号を合成する二番目の方法は、励起信号Excを特徴づけるパラメータの符号を無作為に引き出し、これらの符号を復号化器に直接与えることにある。この方法には、復号化器において快適ノイズ生成器を自主的に設置してもよいという長所があり、有効フレームと快適ノイズの間でトグルした時の励起信号中の考えられる不連続性を排除する。励起のパラメータ符号は、現フレームに合わせて復号化された励起エネルギーは必要とするエネルギーすなわち標本毎の平均エネルギーに対応するNgt 2、gt 2と、N個の標本がこのフレームを構成するために得るエネルギーを表Ngt 2とに対応するように適合させられなければならないであろう。最も簡単には、音声符号化器が長期予測を使用するとき、あるいは同じように過去の励起の標本を用いた適合化辞書を使用するとき、LTP励起つまり長期予測励起の最小の量子化利得をを選ぶことによりこの励起を抑えるが、ここでの利得は一般にゼロもしくはほとんどゼロである。作られた励起は、事実上革新的なまでに減らされて、そのエネルギーは容易に制御される。しかし、多くの音声符号化器にとって、長期予測を抑えることにより、その特徴は白色ノイズとは異なるようなスペクトル的に貧弱な励起を作り出し、それによって復号化器によって合成される快適ノイズの品質は影響される。LTP励起を使用し、LTP励起と新規とを加えることにより得られる総体的励起の利得を制御することが可能になる特別に有利な方法が図11と共に記される。
【0041】
この方法に関して、最初に述べておきたいのは、音声符号化器はCNGモジュール3に対して過去のフレームから発したExcpas励起信号の標本いくつか分、先行していなければならず、この信号は図8において、点線により表現されている。
この具体化において、N個の標本のフレームは励起パラメータが計算され符号化されるところのL個の標本のN/L個のブロックに分割される。音声符号化器の要求によって、これらのブロックは再分され、長期励起の符号の計算期間は必ずしも新規発明のそれとは対応しない。
【0042】
図11において、ステップ1201はN/L個の標本の完全さに関連して計数用変数jを0に初期化することを可能にする。
nが0からN−1までの標本Exc(n)の標本から成る励起信号Excは、現フレームに対してeLTP(n)と表される長期予測励起と、βu(n)と表されるところでu(n)は新規波形を表しβは逆量子化後の利得を表す新規励起との線形結合として定義され、各ブロックに対し、上記の利得はこのように作られた励起エネルギーを制御するような方法で調整するよう求められる。
指標jの各ブロックに対して、長期励起のパラメータの符号はステップ1202において無作為に引き出される。後者のエネルギーを制限するために、長期励起の利得符号に対して強制は好ましい。信号eLTP(n)のL個の標本は、kが0からL−1まで変化するところのn=jL+1を用いて、ブロック全体に渡り音声符号化器に与えられる過去の信号Excpasの標本を用いることにより得られる。
【0043】
次に、新規励起信号がステップ1203において、新規波形の符号を無作為に引き出すことにより得られる。kが0からL−1まで変化するn=jL+kを用いてブロック全体に渡って、波形のL個の標本が得られる。
ステップ1204では、新規励起の利得である量子化指標indと、従って逆量子化処理を通して関連する利得βとを求めることが可能である。ブロック全体に渡り求める値gt 2にできるだけ近い標本あたりの平均エネルギーを得ることを可能にするような指標が式(12)によって選ばれるであろう。
【数12】
ここで利得βは新規発明の励起利得の量子化器の復元値の組を通り抜ける。
現方法の変形は、長期励起と新規励起の利得がベクトル量子化器により一緒に量子化されるような場合に、以下のようになる:ステップ1202において、励起eLTP(n)はLTP遅延を表す符号を無作為に引き出すことにより利得を1に等しくする。式(12)は式(13)へと変更される。
【数13】
逆量子化された利得β1,β2はベクトル量子化器の辞書を調査することにより二つ一緒に選択される。
【0044】
ステップ1204の後にはステップ1205が続き、ここでは現ブロックの標本に対してExcを計算することにより励起信号Excが更新される。計数変数jの増加を行うステップ1206に続く、ステップ1207におけるこのjの値のテストにより、フレームを構成する標本の組に対する励起信号を得る作業を終えることが可能になる。
受信端における不連続音声のディジタル送信システムにおける快適ノイズの生成用装置のより詳しい記述は図12と13と共に与えられる。
図12に表されるように、この装置は受信端においてモジュール5を持ち、このモジュールは快適ノイズあるいはより特別には連続する各無音記述フレームにおいて、この快適ノイズを記述する符号化済みパラメータの組を復号化することが示される。
【0045】
このモジュール5は音声復号化器と組み合わせられ、これはこのモジュール5により処理される現フレームのタイプに関連する合図を受信し、これはVADと表記され、送信端において符号化済み無音記述フレームやSIDフレームと同様に生成される3レベルの信号VADoutの合図を再生産する。さらに、復号化器との同期を確かにする管理信号Sgを音声復号化器から受信する。
モジュール5は現フレームに関する快適ノイズPBcを記述するパラメータを作るのを可能にする。
一方で、音声信号復号化器は符号化済み音声フレームを受信し、他方で、現フレームに関する快適ノイズPBcのパラメータを記述する信号を記述する。また、上図においてdecoded signalと名付けられた合成済み音声信号を合成により与える。
図12に登場するモジュール5は図12において音声信号復号化器が予測型復号化器により構成されるような場合についてより詳しく記述される。復号化モジュール5は、少なくとも、一つの逆多重化器50があり、送信済みの符号化済み無音記述フレーム信号を受信し、LPCフィルター用パラメータを記述する符号化済み信号を与えるが、この信号は合成済みの励起信号のレベルを記述するところの量子化済み利得指標信号irefと同様に、図13において、Lpccと表される現フレームに関連する。
【0046】
さらに、逆量子化モジュール51が与えられるが、これは上記の量子化済み利得指標信号を受信し、grefと表される逆量子化利得信号を与える。
計算モジュール52が与えられるが、これは現フレームに関連してLPCフィルタ用パラメータを記述しLpccと表される符号化済みの信号と、LPCフィルター用パラメータを記述し少なくとも先行フレームに関するところのLpcと表される信号と、VADと表されるフレーム送信タイプ・キューとを受信する。計算モジュール52は、更新済みのLPC信号を現フレームのLPCパラメータと共に与える。
【0047】
最後に、励起生成モジュール53が与えられるが、これは逆量子化利得信号grefと、もし適切なら過去の励起信号と、フレーム・タイプ・キューVADとを受信し、現フレームExcに関する励起信号を与える。
復号化モジュール5は、フレームが有効でない時にのみ動作する。
入力において、モジュール5は、0の時非送信フレーム、2の時SIDフレームであるような信号と、フレームがSIDフレームの時にそのフレームの符号化済みパラメータとを受信する。音声復号化器は他方で以下のデータを供給する:
− 少なくとも予測型の量子化器により使用される先行フレームに関するLPCパラメータと、先行フレームのこれらのLPCパラメータに関するところのLpcと表される信号、
− 過去の励起信号Excpasと、長期予測器の記憶蓄積。
出力として、復号化モジュール5は各無効フレームに対して、励起信号ExcのN個の新しい標本と逆量子化の後のLpcと表される新しいLPCパラメータとを作り出す。
【0048】
音声復号化器はこれらのデータを使って無効フレームの合成を実行する。
信号VAD=2の時、SIDフレームのパラメータLpccと量子化済みのエネルギーのためのirefとが復号化され蓄積される。このステップにおいて蓄積されるパラメータはLpcrefとgrefと表される。
VAD=0の時、計算用モジュール52は復号化器により与えられる過去のパラメータLpcを用いてLpcrefに量子化と逆量子化をすることによりLPCパラメータの新しい組を計算するが、逆量子化された利得grefは変更されず、また現フレームgtに関する利得は上で述べられた式によって更新される。
双方の場合において、モジュール53は現フレームに関する新しい励起Excを上述の一つあるいは他の方法により計算し、それを音声復号化器に送信するがここでは無効フレームの復号化済み信号の合成を行う。
【0049】
快適ノイズ復号化モジュール5は総合的に自律的であり復号化器の外部に導入可能であると示されるであろう。この場合において、使用される手続きは、このモジュールへ復号化器の基本的な機能を移すことにより同じである。
最後に、特殊な具体化において、ここで上述したパラメータの実際の値は以下の表のようであり、周波数8khzにおいて取った1フレームN=240個の標本に対するものである。
【表1】
更新因子CEと上記の値はITUにより標準化されているG723予測型符号化器に応用されているが、これはSTNビデオ電話法の予測型符号化器である。
不連続音声のディジタル送信のための装置において快適ノイズを生成する高性能の処理と装置はこれで記述された。
【0050】
本発明の主題である処理と装置は、無効期間の間の信号の分析に基づいて、後者の特性が変わった時にノイズを再生成するのに使われるところのパラメータをリフレッシュする手続きが実行される限りにおいて特別に有利である。SIDフレームをすばやく処理することは最初の無効フレームに限定されないし、定期的に再生産もされず、装置そのものにより命令され、このようにして送信されるべきデータ量を最適化している間の快適ノイズの良質を保証することを可能にしている。
それらは、SIDフレームを作ることができるようなパラメータを見積もるために、後者の変更を元に戻すところの環境ノイズの不動性の有無を考慮する効果的な方法を実施する時に顕著である。
エネルギー不動性の見積りのための予測型音声符号化器に関連するより特殊な場合において、本発明の主題である処理は量子化済みの励起信号のエネルギーの比較を行い、そうして量子化器の知覚的特質から簡便な方法で効果を得ることを可能にしている。
【0051】
最後に、励起波を合成する二番目の方法を実施する場合において、本発明の主題である処理が新規の辞書に加えてLTP適合化辞書を使う手段を提案しており、送信されるエネルギーに利得を合わせられるよう方法が開発される。こうして作られた励起波形は一般に新規辞書のみを用いるものよりも豊富なスペクトルを持っている。
最後に、全体に、より良質のノイズを実施し生成することができ、これは平均送信速度が低い時にも計算の中庸な複雑さを犠牲にして合成される。
【図面の簡単な説明】
【図1】従来例の構成説明図である。
【図2】送信端において、本発明の主題に従って快適ノイズを生成する処理を実施する必須のステップの連続である。
【図3】フローチャート形式の、快適無音記述フレームの一実施モードである。
【図4】受信端において、本発明の主題に従って快適ノイズを生成する処理を実施する必須のステップの連続である。
【図5】音声復号化器が予測型でありLPCフィルタを使用している場合の、快適ノイズを生成する処理を実施する必須のステップの連続である。
【図6】送信端において、本発明の主題に従って快適ノイズを生成する装置の機能ブロックの形式による図である。
【図7】送信端において、本発明の主題に従って快適ノイズを生成する装置の機能ブロックの形式による図であり、音声符号化器が予測型であるところのより特殊な場合である。
【図8】図7で表した装置の中で使われている快適ノイズ生成器の具体例の詳細を示している。
【図9】機能フローチャート形式で、無音記述フレームに対し送信/非送信の命令信号を生成する連続的ステップの組を示している。
【図10】機能フローチャート形式で、無音記述フレームの生成と符号化と送信とを行う連続的ステップの組を示している。
【図11】機能フローチャート形式で、一実施形態に従い、励起信号を生成する連続的ステップの組を示している。
【図12】機能ブロックの形式で、受信端において実施形態の主題に従って快適ノイズを生成する装置の図を示している。
【図13】図12で表した装置の中で使われている快適ノイズ生成器の具体例の詳細を示している。
【符号の説明】
1…音声符号化器
2…VAD(音声活性化符号化器)
3…MUX(多重化器)
4…CNG生成器
Claims (8)
- 不連続音声のデジタル送信をするシステムにおいて快適ノイズを作り、符号化済みの音声信号が有効期間の間に送信され、この有効期間の間に有効フレームが送信され、各有効期間の後には無効期間が続き、無効期間の間には少なくとも無効フレームが送信される方法であって、この方法は、この方法が存在するところの送信元で、無効期間を検出した時に、
− 快適ノイズを記述する一組の符号化済みのパラメータ群から成る無音記述フレームの生成と送信をし、この無音記述フレームはこの有効期間に続く無効期間の最初の無音記述フレームを構成するものであり;
また、この無効期間中の全ての連続する現在の無効フレームに対して:
− この現在の無効フレームの周波数スペクトルを分析して蓄積し;
− この現在の無効フレームの周波数スペクトルを基準周波数スペクトルと比較し、
また、基準用と現フレーム周波数スペクトルとが同一である場合の判定基準に基づいて:
− 送信の延期を行う、特にこの現在の無効フレームの間における新しい無音記述フレームの延期を行い、
また、基準用と現フレーム周波数スペクトルとが同一でない場合の判定基準に基づいて:
− この現在の無効フレーム中に新しい無音記述フレームを生成と送信をするが、これにより快適ノイズの送信速度比を単に無音記述フレームのそれまで減ずることが可能になるが、この無音記述フレームの周波数スペクトルは先行する無音記述フレームの間に見積もった基準用のスペクトルとは異なる、
ことを特徴とするディジタル音声伝送システムにおける快適ノイズ生成方法。 - 各無音記述フレームが生成される時に見積もられ蓄積される環境ノイズの周波数スペクトルから基準用周波数スペクトルが作られることを特徴とする請求項1記載のディジタル音声伝送システムにおける快適ノイズ生成方法。
- 不連続音声の送信をするシステムで快適ノイズを生成するための無音記述フレームを作り、符号化済みの音声信号が有効期間の間に転送され
、この有効期間の間に有効フレームが送信され、各有効期間の後には無効期間が続き、無効期間の間には少なくとも無効フレームが送信される処理であって、
− 現在の無効フレームの前の連続する複数の無効フレームの周波数スペクトルの部分的な不動性の測定を行い;
− 過去の平均周波数スペクトルを確定するために、過去の平均周波数スペクトルと現在の無効フレームの周波数スペクトルとが同一である場合とない場合の判断基準に基づいて連続する無効フレームの平均周波数スペクトルを決定し、
− 無音記述フレームを計算するために、上記の過去の平均周波数スペクトルと、上記の現在の無効フレームとをそれぞれ選択し、これによって上記の現在の無効フレームは部分的に不動スペクトル領域かまたは非不動スペクトル領域に属するという事実を勘案して、各無音記述フレームに対して無音スペクトルの見積りを行うことが可能になる、
の各処理から構成されることを特徴とするディジタル音声伝送システムにおける快適ノイズ生成方法。 - 不連続音声のデジタル送信をするシステムにおいて快適ノイズを作る処理において、音声信号が有効期間の間に送信され、この有効期間の間に有効フレームが送信され、各有効期間の後には無効期間が続き、無効期間の間には少なくとも無効フレームが送信され、無音記述フレームは送信元において送信される請求項1記載の方法において、この処理が存在するところの送信元で音声復号化器と関連して、
− 各々の連続的な無音記述フレームに対して、復号化されたパラメータを生成するために快適ノイズを記述する、符号化済みのセットのパラメータを生成し、
− 音声復号化器のレベルで、復号化したパラメータの処理の後で、対応する快適ノイズを合成する、
ことを特徴とするディジタル音声伝送システムにおける快適ノイズ生成方法。 - 不連続音声のデジタル送信をするシステムにおいて快適ノイズを作り、符号化済みの音声信号が有効期間の間に転送され、この有効期間の間に有効フレームが送信され、各有効期間の後には無効期間が続き、無効期間の間には少なくとも無効フレームが送信され、この装置が存在するところの送信元で
、快適ノイズ生成器を構成する装置であって、
− 無効期間を検出する際に、快適ノイズを記述する符号化済みの一組のパラメータを構成し、この無音記述フレームはこの有効期間に続く無効期間の最初の無音記述フレームを構成するような無音記述フレームを生成し条件付きで送信するための手段;
− この無効期間の全ての連続する現在の無効フレームの周波数スペクトルを分析して蓄積する手段;
− 基準用のと現在のとのフレーム周波数スペクトルが同一である場合とない場合との判断基準に基づいた特別なコマンド信号を与えるところの基準周波数スペクトルを、この現在の無効フレームの周波数スペクトルと比較する手段;
− この現在の無効フレームの間に新しい無音記述フレームの送信をそれぞれ可能にしたり不可能にしたりする命令を発したり、比較手段によって与えられる上記の特別な命令信号を受け取ったりする手段により、送信、特に基準用および現フレームの周波数スペクトルが同一である場合に新しい無音記述フレームの送信を延ばすことが可能になり、また、基準用および現フレームの周波数スペクトルの同一でない場合に新しい無音記述フレームの送信を実行することも可能になり、これらによって、快適ノイズの送信速度は、その周波数スペクトルが、先行する無音記述フレームの間に見積もられた基準用スペクトルとは異なるところの単なる無音記述フレームの送信速度にまで減ずる
を特徴とするディジタル音声伝送システムにおける快適ノイズ生成装置。 - 音声活性化信号を配信する音声活性化装置と、先行するフレームに関するLPCフィルタのパラメータを記述する信号と、条件付きで上記の装置に含まれ快適ノイズ生成器を構成する少なくとも一つの先行するフレームの励起信号とであるところの音声信号のために自動相関機能信号を配信するLPCフィルタによって音声信号の分析を行う予測音声符号化器とを含み、
− 現フレームに関し、音声信号用に自動相関機能信号を受信し、現フレームのパラメータに対応する信号を作るところのパラメータを計算するモジュール;
− 符号化済みのフレームや無音記述フレームを送ったり、送信を停止したりする決定モジュールにおいて、このモジュールは上記の音声活性化信号と、現フレームに関するパラメータと基準用パラメータとに対応する信号を受信し、3レベルを持つフレーム送信タイプ信号を与える、その第一レベルは現在の無効フレームの間の送信の全体的欠信に対応し、第二レベルは有効フレームの間の符号化済みの音声フレームの送信に対応し、第三レベルは無効フレームの間の無音記述フレームの送信に対応するところのモジュール;
− 基準用パラメータの条件付き計算のためのモジュールにおいて、このモジュールは音声信号と現フレームのパラメータに対応する信号とのための自動相関機能信号を入力として受信し、基準用パラメータ信号を与えるところのモジュール;
− 基準用パラメータに対応する信号である送信タイプ信号を受信し、条件付きで基準用パラメータ信号を与えるような符号化済みの無音記述フレーム生成モジュール;
− 励起信号を生成し、送信タイプ信号と条件によっては音声符号化器から供給される過去の励起信号とを受信し、また、フレーム送信タイプ信号の条件によっては現フレームに対する励起信号を与えるところのモジュール;
− 更新されたLPCフィルタのパラメータを記述する信号を生成し、音声符号化器により与えられる先行するフレームのLPCパラメータを記述する信号であるところのフレーム送信タイプ信号を受信し、また、フレーム送信タイプ信号の条件によっては現フレームに対する更新済みのLPCパラメータを記述する信号を与えるようなモジュール
を特徴とする請求項5記載のディジタル音声伝送システムにおける快適ノイズ生成装置。 - 不連続音声のデジタル送信をするシステムで快適ノイズを作り、音声信号が有効期間の間に送信され、この有効期間の間に有効フレームが送信され、各有効期間の後には無効期間が続き、無効期間の間には少なくとも無音記述フレームが送信端で送信される請求項1の方法において、
この装置が受信端で包含するところの連続する各無音記述フレームにおける復号化手段により特徴付けられるが、上記の手段は処理済みの現フレームのタイプに関する合図と符号化済みの無音記述フレーム信号と音声復号化器からの音声復号化器との同期動作を保証する管理信号とを受信し、また上記の復号化手段は一方で符号化済みの音声フレームと、他方では現フレームに関する快適ノイズを記述する上記の信号と内部接続されており、上記の音声復号化器は音声信号の合成により各々合成された快適ノイズを配信するところのディジタル音声伝送システムにおける快適ノイズ生成装置。 - 上記の音声信号復号化器が予測型の復号化器により作られるような場合に、上記の復号化手段が少なくとも
− 送信された符号化済みの無音記述フレーム信号を受信し、現フレームに関するLPCフィルタのパラメータを記述する符号化済みの信号と合成された励起信号を記述する量子化済みの利得索引信号を与える逆多重化器;
− 量子化済みの利得索引信号を受信し、逆量子化済みの利得信号を与えるところの逆量子化モジュール;
− 現フレームに関連するLPCフィルタのパラメータを記述する符号化信号を受信し、この信号は少なくとも先行するフレームとフレーム送信タイプの合図に関するLPCフィルタのパラメータを記述する信号であり、現フレームに関連するLPCパラメータで更新された信号を与えるような計算モジュール;
− 逆量子化済みの利得信号を、条件によっては過去の励起信号とフレーム送信タイプの合図とを受信し、また、現フレームに関する励起信号を送るところの励起生成モジュール
を有することを特徴とする請求項7に記載のディジタル音声伝送システムにおける快適ノイズ生成装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9512039A FR2739995B1 (fr) | 1995-10-13 | 1995-10-13 | Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole |
FR9512039 | 1995-10-13 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004012387A Division JP4422500B2 (ja) | 1995-10-13 | 2004-01-20 | ディジタル音声伝送システムの快適ノイズを作る方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09179590A JPH09179590A (ja) | 1997-07-11 |
JP3781495B2 true JP3781495B2 (ja) | 2006-05-31 |
Family
ID=9483505
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP30694396A Expired - Lifetime JP3781495B2 (ja) | 1995-10-13 | 1996-10-14 | ディジタル音声伝送システムの快適ノイズを作る方法と装置 |
JP2004012387A Expired - Lifetime JP4422500B2 (ja) | 1995-10-13 | 2004-01-20 | ディジタル音声伝送システムの快適ノイズを作る方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004012387A Expired - Lifetime JP4422500B2 (ja) | 1995-10-13 | 2004-01-20 | ディジタル音声伝送システムの快適ノイズを作る方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5812965A (ja) |
EP (3) | EP1320087B1 (ja) |
JP (2) | JP3781495B2 (ja) |
KR (1) | KR100357254B1 (ja) |
CN (1) | CN1104710C (ja) |
DE (3) | DE69637612D1 (ja) |
FR (1) | FR2739995B1 (ja) |
HK (2) | HK1057939A1 (ja) |
Families Citing this family (59)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5978756A (en) * | 1996-03-28 | 1999-11-02 | Intel Corporation | Encoding audio signals using precomputed silence |
SE507370C2 (sv) * | 1996-09-13 | 1998-05-18 | Ericsson Telefon Ab L M | Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare |
US6269331B1 (en) * | 1996-11-14 | 2001-07-31 | Nokia Mobile Phones Limited | Transmission of comfort noise parameters during discontinuous transmission |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
JP3575967B2 (ja) * | 1996-12-02 | 2004-10-13 | 沖電気工業株式会社 | 音声通信システムおよび音声通信方法 |
KR100205251B1 (ko) * | 1996-12-09 | 1999-07-01 | 정선종 | 코드분할 다중접속 기지국에서의 음성 부호화 장치 및 방법 |
FR2758676A1 (fr) * | 1997-01-21 | 1998-07-24 | Philips Electronics Nv | Methode de reduction des clics dans un systeme de transmission de donnees |
EP0887958B1 (en) * | 1997-06-23 | 2003-01-22 | Liechti Ag | Method for the compression of recordings of ambient noise, method for the detection of program elements therein, devices and computer program therefor |
US6347081B1 (en) * | 1997-08-25 | 2002-02-12 | Telefonaktiebolaget L M Ericsson (Publ) | Method for power reduced transmission of speech inactivity |
US6023674A (en) * | 1998-01-23 | 2000-02-08 | Telefonaktiebolaget L M Ericsson | Non-parametric voice activity detection |
US6122611A (en) * | 1998-05-11 | 2000-09-19 | Conexant Systems, Inc. | Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6192335B1 (en) * | 1998-09-01 | 2001-02-20 | Telefonaktieboiaget Lm Ericsson (Publ) | Adaptive combining of multi-mode coding for voiced speech and noise-like signals |
US6256606B1 (en) | 1998-11-30 | 2001-07-03 | Conexant Systems, Inc. | Silence description coding for multi-rate speech codecs |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6519260B1 (en) | 1999-03-17 | 2003-02-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Reduced delay priority for comfort noise |
US7423983B1 (en) * | 1999-09-20 | 2008-09-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
US6381568B1 (en) | 1999-05-05 | 2002-04-30 | The United States Of America As Represented By The National Security Agency | Method of transmitting speech using discontinuous transmission and comfort noise |
GB2350532B (en) * | 1999-05-28 | 2001-08-08 | Mitel Corp | Method to generate telephone comfort noise during silence in a packetized voice communication system |
JP3451998B2 (ja) * | 1999-05-31 | 2003-09-29 | 日本電気株式会社 | 無音声符号化を含む音声符号化・復号装置、復号化方法及びプログラムを記録した記録媒体 |
US7161931B1 (en) * | 1999-09-20 | 2007-01-09 | Broadcom Corporation | Voice and data exchange over a packet based network |
DE69931783T2 (de) | 1999-10-18 | 2007-06-14 | Lucent Technologies Inc. | Verbesserung bei digitaler Kommunikationseinrichtung |
GB2356538A (en) * | 1999-11-22 | 2001-05-23 | Mitel Corp | Comfort noise generation for open discontinuous transmission systems |
US6615170B1 (en) * | 2000-03-07 | 2003-09-02 | International Business Machines Corporation | Model-based voice activity detection system and method using a log-likelihood ratio and pitch |
GB0007655D0 (en) * | 2000-03-29 | 2000-05-17 | Simoco Int Ltd | Digital transmission |
EP1279164A1 (de) * | 2000-04-28 | 2003-01-29 | Deutsche Telekom AG | Verfahren zur berechnung einer sprachaktivitätsentscheidung (voice activity detector) |
US6898195B1 (en) * | 2000-05-09 | 2005-05-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for sustaining conversational services in a packet switched radio access network |
SE518941C2 (sv) * | 2000-05-31 | 2002-12-10 | Ericsson Telefon Ab L M | Anordning och förfarande relaterande till kommunikation av tal |
EP1179819A1 (en) * | 2000-08-11 | 2002-02-13 | Lucent Technologies Inc. | Efficient comfort noise transmission |
US6807525B1 (en) * | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
EP1204093A1 (en) * | 2000-11-02 | 2002-05-08 | Lucent Technologies Inc. | Discontinuous comfort noise transmission |
US6662155B2 (en) * | 2000-11-27 | 2003-12-09 | Nokia Corporation | Method and system for comfort noise generation in speech communication |
GB2370206A (en) * | 2000-12-15 | 2002-06-19 | Ericsson Telefon Ab L M | Storing a speech signal, e.g. in a mobile telephone |
US6631139B2 (en) * | 2001-01-31 | 2003-10-07 | Qualcomm Incorporated | Method and apparatus for interoperability between voice transmission systems during speech inactivity |
US20030120484A1 (en) * | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US20030212550A1 (en) * | 2002-05-10 | 2003-11-13 | Ubale Anil W. | Method, apparatus, and system for improving speech quality of voice-over-packets (VOP) systems |
US7746797B2 (en) * | 2002-10-09 | 2010-06-29 | Nortel Networks Limited | Non-intrusive monitoring of quality levels for voice communications over a packet-based network |
EP1414024A1 (en) * | 2002-10-21 | 2004-04-28 | Alcatel | Realistic comfort noise for voice calls over packet networks |
US7406096B2 (en) * | 2002-12-06 | 2008-07-29 | Qualcomm Incorporated | Tandem-free intersystem voice communication |
EP1582079B1 (en) * | 2002-12-16 | 2008-09-10 | Research In Motion Limited | Method and apparatus for reducing power consumption in cdma communication device |
US7436786B2 (en) * | 2003-12-09 | 2008-10-14 | International Business Machines Corporation | Telecommunications system for minimizing the effect of white noise data packets for the generation of required white noise on transmission channel utilization |
US20060149536A1 (en) * | 2004-12-30 | 2006-07-06 | Dunling Li | SID frame update using SID prediction error |
PL1897085T3 (pl) * | 2005-06-18 | 2017-10-31 | Nokia Technologies Oy | System i sposób adaptacyjnej transmisji parametrów szumu łagodzącego w czasie nieciągłej transmisji mowy |
KR100785471B1 (ko) | 2006-01-06 | 2007-12-13 | 와이더댄 주식회사 | 통신망을 통해 가입자 단말기로 전송되는 오디오 신호의출력 품질 개선을 위한 오디오 신호의 처리 방법 및 상기방법을 채용한 오디오 신호 처리 장치 |
CN101087319B (zh) * | 2006-06-05 | 2012-01-04 | 华为技术有限公司 | 一种发送和接收背景噪声的方法和装置及静音压缩系统 |
US20080059161A1 (en) * | 2006-09-06 | 2008-03-06 | Microsoft Corporation | Adaptive Comfort Noise Generation |
CN101303855B (zh) * | 2007-05-11 | 2011-06-22 | 华为技术有限公司 | 一种舒适噪声参数产生方法和装置 |
CN101483042B (zh) | 2008-03-20 | 2011-03-30 | 华为技术有限公司 | 一种噪声生成方法以及噪声生成装置 |
CN101309487B (zh) * | 2008-07-15 | 2011-05-11 | 华为技术有限公司 | 一种语音帧的处理方法、系统和基站 |
US8913512B2 (en) * | 2008-10-16 | 2014-12-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Telecommunication apparatus, method, and computer program controlling sporadic data transmissions |
US20100260273A1 (en) * | 2009-04-13 | 2010-10-14 | Dsp Group Limited | Method and apparatus for smooth convergence during audio discontinuous transmission |
CN102034476B (zh) * | 2009-09-30 | 2013-09-11 | 华为技术有限公司 | 语音帧错误检测的方法及装置 |
JP5719922B2 (ja) * | 2010-04-13 | 2015-05-20 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | サンプルごとに正確なオーディオ信号表現のための方法、エンコーダ及びデコーダ |
US20110273213A1 (en) * | 2010-05-06 | 2011-11-10 | Qualcomm Incorporated | Method and apparatus to dynamically adjust a clock rate in a mobile device |
CN104217723B (zh) | 2013-05-30 | 2016-11-09 | 华为技术有限公司 | 信号编码方法及设备 |
US9185506B1 (en) * | 2013-12-16 | 2015-11-10 | Amazon Technologies, Inc. | Comfort noise generation based on noise estimation |
EP2980801A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
GB2532041B (en) | 2014-11-06 | 2019-05-29 | Imagination Tech Ltd | Comfort noise generation |
US10978096B2 (en) * | 2017-04-25 | 2021-04-13 | Qualcomm Incorporated | Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5276765A (en) * | 1988-03-11 | 1994-01-04 | British Telecommunications Public Limited Company | Voice activity detection |
PT89978B (pt) * | 1988-03-11 | 1995-03-01 | British Telecomm | Aparelho detector da actividade vocal e aparelho telefonico movel que o contem |
JPH0236628A (ja) * | 1988-07-27 | 1990-02-06 | Toshiba Corp | 音声信号の送信方式及び送受信方式 |
US5537509A (en) * | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
JPH04312048A (ja) * | 1991-04-11 | 1992-11-04 | Matsushita Electric Ind Co Ltd | 音声パケットシステム |
JP2518765B2 (ja) * | 1991-05-31 | 1996-07-31 | 国際電気株式会社 | 音声符号化通信方式及びその装置 |
JP2897551B2 (ja) * | 1992-10-12 | 1999-05-31 | 日本電気株式会社 | 音声復号化装置 |
JPH06282297A (ja) * | 1993-03-26 | 1994-10-07 | Idou Tsushin Syst Kaihatsu Kk | 音声符号化方式 |
JPH0750631A (ja) * | 1993-08-05 | 1995-02-21 | Toshiba Corp | 擬似背景雑音発生機能を備えたディジタル無線通信装置 |
SE501981C2 (sv) * | 1993-11-02 | 1995-07-03 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
JP3182032B2 (ja) * | 1993-12-10 | 2001-07-03 | 株式会社日立国際電気 | 音声符号化通信方式及びその装置 |
JPH08254997A (ja) * | 1995-03-16 | 1996-10-01 | Fujitsu Ltd | 音声符号化・復号化方法 |
-
1995
- 1995-10-13 FR FR9512039A patent/FR2739995B1/fr not_active Expired - Lifetime
-
1996
- 1996-10-10 DE DE69637612T patent/DE69637612D1/de not_active Expired - Lifetime
- 1996-10-10 EP EP03005562A patent/EP1320087B1/fr not_active Expired - Lifetime
- 1996-10-10 EP EP03018358A patent/EP1372289B1/fr not_active Expired - Lifetime
- 1996-10-10 EP EP96402150A patent/EP0768770B1/fr not_active Expired - Lifetime
- 1996-10-10 DE DE69637565T patent/DE69637565D1/de not_active Expired - Lifetime
- 1996-10-10 DE DE1996631318 patent/DE69631318T2/de not_active Expired - Lifetime
- 1996-10-11 KR KR1019960045255A patent/KR100357254B1/ko not_active IP Right Cessation
- 1996-10-11 US US08/731,381 patent/US5812965A/en not_active Expired - Lifetime
- 1996-10-11 CN CN96121678.6A patent/CN1104710C/zh not_active Expired - Lifetime
- 1996-10-14 JP JP30694396A patent/JP3781495B2/ja not_active Expired - Lifetime
-
2003
- 2003-12-16 HK HK03109153A patent/HK1057939A1/xx not_active IP Right Cessation
-
2004
- 2004-01-20 JP JP2004012387A patent/JP4422500B2/ja not_active Expired - Lifetime
- 2004-06-17 HK HK04104421.7A patent/HK1062506A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JPH09179590A (ja) | 1997-07-11 |
FR2739995A1 (fr) | 1997-04-18 |
EP0768770A1 (fr) | 1997-04-16 |
EP1372289A2 (fr) | 2003-12-17 |
KR100357254B1 (ko) | 2003-01-10 |
EP0768770B1 (fr) | 2004-01-14 |
HK1057939A1 (en) | 2004-04-23 |
CN1155801A (zh) | 1997-07-30 |
US5812965A (en) | 1998-09-22 |
CN1104710C (zh) | 2003-04-02 |
DE69637565D1 (de) | 2008-07-24 |
JP4422500B2 (ja) | 2010-02-24 |
EP1372289A3 (fr) | 2006-05-17 |
EP1372289B1 (fr) | 2008-07-23 |
EP1320087A2 (fr) | 2003-06-18 |
HK1062506A1 (en) | 2004-11-05 |
FR2739995B1 (fr) | 1997-12-12 |
JP2004177978A (ja) | 2004-06-24 |
DE69631318T2 (de) | 2004-11-18 |
DE69631318D1 (de) | 2004-02-19 |
EP1320087A3 (fr) | 2006-05-17 |
EP1320087B1 (fr) | 2008-06-11 |
DE69637612D1 (de) | 2008-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3781495B2 (ja) | ディジタル音声伝送システムの快適ノイズを作る方法と装置 | |
KR102636424B1 (ko) | 스테레오 사운드 신호의 좌측 및 우측 채널들을 디코딩하는 방법 및 시스템 | |
US6766293B1 (en) | Method for signalling a noise substitution during audio signal coding | |
JP4504414B2 (ja) | 冗長性低減方法 | |
KR100346066B1 (ko) | 오디오신호 코딩방법 | |
US6104996A (en) | Audio coding with low-order adaptive prediction of transients | |
US4890325A (en) | Speech coding transmission equipment | |
EP0911807B1 (en) | Sound synthesizing method and apparatus, and sound band expanding method and apparatus | |
US6295009B1 (en) | Audio signal encoding apparatus and method and decoding apparatus and method which eliminate bit allocation information from the encoded data stream to thereby enable reduction of encoding/decoding delay times without increasing the bit rate | |
JP6849619B2 (ja) | 低ビットレートで背景ノイズをモデル化するためのコンフォートノイズ付加 | |
JP2003076394A (ja) | 音声符号変換方法及び装置 | |
US5649052A (en) | Adaptive digital audio encoding system | |
US6721712B1 (en) | Conversion scheme for use between DTX and non-DTX speech coding systems | |
KR20050061615A (ko) | 손실 프레임을 처리하기 위한 음성 통신 시스템 및 방법 | |
WO2008148321A1 (fr) | Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil | |
JP2001511917A (ja) | 伝送エラーの修正を伴う音声信号の復号方法 | |
US6424942B1 (en) | Methods and arrangements in a telecommunications system | |
JP4216364B2 (ja) | 音声符号化/復号化方法および音声信号の成分分離方法 | |
CN1132327C (zh) | 产生舒适噪声的设备和包括其部件的语音编解码器 | |
JPH10210043A (ja) | 音声符号化復号化システム | |
US6012025A (en) | Audio coding method and apparatus using backward adaptive prediction | |
JPH0236628A (ja) | 音声信号の送信方式及び送受信方式 | |
US6134519A (en) | Voice encoder for generating natural background noise | |
RU2394284C1 (ru) | Способ сжатия и восстановления речевых сигналов для систем кодирования с переменной скоростью передачи | |
JPS6134697B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20040511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060307 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100317 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110317 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110317 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120317 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130317 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140317 Year of fee payment: 8 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |