JP5351206B2 - 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法 - Google Patents

非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法 Download PDF

Info

Publication number
JP5351206B2
JP5351206B2 JP2011085342A JP2011085342A JP5351206B2 JP 5351206 B2 JP5351206 B2 JP 5351206B2 JP 2011085342 A JP2011085342 A JP 2011085342A JP 2011085342 A JP2011085342 A JP 2011085342A JP 5351206 B2 JP5351206 B2 JP 5351206B2
Authority
JP
Japan
Prior art keywords
background noise
signal
frame
noise
noise ratio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011085342A
Other languages
English (en)
Other versions
JP2011199875A (ja
Inventor
クレイグ グレアー,スティーブン
グルネイ,フィリップ
ジェリネク,ミラン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2011199875A publication Critical patent/JP2011199875A/ja
Application granted granted Critical
Publication of JP5351206B2 publication Critical patent/JP5351206B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Description

本発明の例示実施例は,概略非連続音声送信のためのシステム及び方法に関し,より特定すれば非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法に関する。
非連続送信(DTX)は移動体通信システムにおいて用いられ,無音声期間に無線送信器をオフにする。DTXを利用することによって移動機の電力が節約され,バッテリ再充電が必要になる時間を延ばすことができる。また一般干渉レベルが減少し,そのため伝送品質が改善できる。しかし無音声期間にチャネルが完全に切断されると,通常は音声と共に送信される背景ノイズもなくなる。その結果通信の受信端で不自然な音響信号(無音)が生じる。
無音声期間に送信を完全にオフにする代わりに,背景ノイズを特徴付けるパラメータが発生され,無音挿入記述子(SID)フレームが低頻度で無線インタフェースを介して送信されるいくつかの技法が開発された。これらのパラメータはしばしば擬似背景ノイズ(Comfort noise(CN))パラメータと呼ばれ,受信側で送信側の背景ノイズのスペクトル及び時間内容を可能な限りよく反映する背景ノイズを再発生させることができる。擬似背景ノイズパラメータは,通常音声符号化パラメータのサブセット,特に合成フィルタ係数及び利得パラメータを含む。
従来CNパラメータは,図1に示すように無音声期間に固定頻度で無線インタフェースを介して送信される。ここでこれらのパラメータを含むSIDフレームは,非活性音声期間中,4フレームごとに送信される。より特定すれば,例えばGSM(登録商標)セルラ通信システムの全レート(FR)及び強化FR(EFR)音声チャネルにおいて,CNパラメータは24フレームに1回(すなわち480msごと)の頻度で送信される。これは,CNパラメータが1秒に約2回だけ更新されることを意味する。適応複数速度(AMR)及び広帯域AMR(AMR−WB)システムにおいては逆に,1秒に約6回のCNパラメータ更新頻度に対して,8フレームに1回の頻度(すなわち160msごと)でCNパラメータが送信される。この低送信頻度では背景ノイズのスペクトル及び時間特性を正確に表すことができず,そのためDTXにおいては,背景ノイズの品質にいくらかの品質劣化が生じることは避けられない。しかし送信頻度を増加させると,音声パラメータ及びCNパラメータの総合送信頻度を減少させ,DTXの利点が減少する。
本発明の例示実施例の種々の態様を更に理解するためには,次に掲げる参考文献のうち1又は複数を参照されたい。
"Discontinuous Transmission (DTX) for Enhanced Full Rate (EFR) Speech Traffic Channels",第3世代パートナシッププロジェクト,Services and System Aspects技術仕様グループ,3GPP TS 46.081,2004年12月 C.B.Southcott, et al.,"Voice Control of the Pan-European Digital Mobile Radio System",Global Telecommunications Conference 1989,及び展示会"Communications Technology for the 1990s and Beyond",GLOBECOM '89,IEEE,vol.2,pp. 1070-1074,1989年11月27〜20日 "Adaptive Multi-Rate (AMR) Speech Codec; Source Controlled Rate Operation",第3世代パートナシッププロジェクト,Services and System Aspects技術仕様グループ,3GPP TS 26.093,2003年3月 "Adaptive Multi-Rate-Wideband (AMR-WB) Speech Codec; Source Controlled Rate Operation",第3世代パートナシッププロジェクト,Services and System Aspects技術仕様グループ,3GPP TS 26.193,2004年12月
前述の背景から,本発明の例示実施例は,SIDフレーム,CNパラメータメッセージ又はそれらの類似物(これらのメッセージは,ここでは一般性を失うことなくSIDフレームと呼ぶこととする)のような擬似背景ノイズ(CN)パラメータの適応送信のための改善されたシステム及び方法を提供する。本発明の例示実施例によれば,SIDフレームが送信される頻度は,現在の音声対背景ノイズ(すなわち信号対ノイズ)比(SNR)のような現在のノイズ値を用いて適応させ,又は選択的に制御することができる。これに関して,移動体端末の動作中,音声活性度検知器のような端末エンティティがSNRの現在値を推定することができる。このSNR値を用いて,DTX送信器(例えばTX−DTXプロセッサ)のような移動体端末エンティティが,音声信号の非活性期間にDTX送信器がSIDフレームを送信する頻度を選択的に設定することができる。(例えば20dB以上の)高SNRにおいては,低頻度(例えば50フレームごと)でSIDフレームを送信するようにTX−DTXを構成することができ,それによってわずかな品質劣化だけで平均データ速度を大幅に減少させることができる。反対に(例えば20dB以下の)低SNRでは,擬似背景ノイズが可能な限り自然に保たれるように高頻度(例えば12フレームごと)でSIDフレームを送信するようにTX−DTXを構成することができる。
本発明の例示実施例の一態様によれば,無音声期間に擬似背景ノイズパラメータを含むフレーム(例えばSIDフレーム)が散在する音声フレームを送信することを含む,非連続送信モードにおける音声信号送信のための少なくとも1つのエンティティを含む装置が提供される。エンティティは,現在のノイズ値を推定するための第1エンティティ(例えば音声活性度検知器VAD)を含む。例えば第1エンティティを,活性音声の長期エネルギ及び背景ノイズの長期エネルギを用いて,現在の信号対ノイズ比(SNR)又は逆SNRを推定するようにすることができる。また例えば第1エンティティを,活性音声の長期エネルギ及び背景ノイズの長期エネルギの関数,並びにその関数に適用する調整係数を用いて現在の信号対ノイズ比を推定するようにすることもできる。
第1エンティティに加えてこの装置は,無音声期間に擬似背景ノイズパラメータを含むフレームが送信される頻度を上記の推定した現在のノイズ値を用いて選択的に制御するための第2エンティティ(例えばTX−DTX)を含む。例えば第2エンティティは,第1ノイズ値に対応する最小値と,上記第1ノイズ値より低い(代替例においては第1ノイズ値より高い)第2ノイズ値に対応する最大値との間で,上記頻度を変化させることによって,上記頻度を選択的に制御するようにすることができる。上記第2エンティティを,上記頻度を上記の推定したSNRのような上記の推定した現在のノイズ値が増加するとき減少させ,上記の推定した現在のノイズ値が減少するとき増加させることによって選択的に制御するようにすることができる。あるいは上記の推定した現在のノイズ値が推定した逆SNRを含むときのような別の例においては,上記第2エンティティを,上記頻度を上記の推定したSNRのような上記の推定した現在のノイズ値が増加するとき増加させ,上記の推定した現在のノイズ値が減少するとき減少させることによって選択的に制御するようにすることができる。
より特定すれば,上記第2エンティティは,上記推定した現在のノイズ値を用いて間隔(頻度の逆数)を計算するようになっており,上記擬似背景ノイズパラメータを含むフレームは上記の計算した間隔で送信することができる。非活性期間中の上記フレームについて,上記第2エンティティは計算した間隔の終わりに達したかどうかを判定し,上記計算した間隔の終わりに達したとき擬似背景ノイズパラメータを含むフレームを送信するように更になっている。又は検出した背景ノイズレベル変位が最大変位を超えているときのように,計算した間隔の終わりに達しなかったとき擬似背景ノイズパラメータを含むフレームを送信する指示を受信するようになっている。
本発明の別の態様によれば,方法及び計算機プログラム製品が提供される。上述のとおり,また以降で説明するとおり,本発明の例示実施例の装置と,方法と,計算機プログラム製品とは,先行技法の問題を解決し,追加の利点を提供することができる。
音声通信における不活性期間に固定間隔で送信される無音挿入記述子(SID)フレームを簡単に示す図である。 移動体ネットワークと,公衆交換電話ネットワークと,データネットワークと,を含む本発明の一例示実施例による通信システムの簡単なブロック図である。 本発明の一例示実施例による移動体端末の簡単なブロック図である。 本発明の例示実施例による非連続送信(DTX)技法によって動作する移動体端末の機能ブロック図である。 本発明の一例示実施例による擬似背景ノイズパラメータを適応的に送信する方法の種々のステップを示すフローチャートである。
このように本発明を一般的な用語で説明したが,ここで添付の必ずしも正確な縮尺では描かれていない図面を参照する。
以降,本発明の好ましい実施例が示されている添付の図面を参照して本発明をより詳細に説明する。しかし本発明は多くの異なった形態で実施してもよく,ここに述べる実施例に限定されると考えるのは望ましくない。むしろこれらの実施例は,この開示が完全であるように提供され,当業者に本発明の範囲を完全に伝えるものである。全体を通して類似の番号は類似の要素を指すものとする。
図2を参照すると,本発明の例示実施例によって構成された無線通信ネットワークの機能図が示されている。図2に示すように,本発明の例示実施例のネットワークは携帯電話機のような移動体端末10を含む。しかしここに示し,以降で説明する携帯電話機は,本発明の例示実施例によって恩恵を得る移動体端末の1種別を単に示すものであることを理解するのが望ましく,したがって本発明の範囲を制限するものと捕らえることは望ましくない。移動体端末のいくつかの実施例を示し,以降で例として説明するが,ポータブルデジタルアシスタント(PDA)と,ポケベル(pager)と,追跡デバイスと,ラップトップ計算機と,ほかの種別の音声及びテキスト通信システムと,のようなほかの種別の移動体端末も直ちに本発明の例示実施例を用いることができる。更に本発明の例示実施例のシステム及び方法は,主として移動体通信アプリケーションに関して説明する。しかし本発明の例示実施例のシステム及び方法は,移動体通信業界及び移動体通信業界外双方の種々の別のアプリケーションにも利用することができる。
図に示すように移動体端末10はいくつかの異なる無線通信技法によって信号を送受信するためのアンテナトランスジューサ12を含む。より特定すれば,移動体端末は例えば1又は複数のセルラネットワークと,パーソナル通信サービス(PCS)ネットワークと,その類似物と,における基地又は基地局(BS)14と信号を送受信するためのアンテナトランスジューサを含んでもよい。基地局は,セルラネットワークを運用するために必要な移動体通信交換センタ(MSC)16及びほかのユニットを含むセルラネットワークの一部である。MSCは,移動体端末が発着呼を行うとき移動体端末との間で呼及びメッセージを経路制御することができる。MSCはまた,端末がセルラネットワークに登録されたとき,移動体端末との間のメッセージ転送を制御し,移動体端末のためにメッセージセンタ(図示されていない)との間のメッセージ転送を制御する。当業者であれば理解するであろうが,セルラネットワークはまた公衆地上移動体ネットワーク(PLMN)18も指す。
PLMN18は,いくつかの異なるセルラ通信技法によって通信を提供することができる。これに関してPLMNは,いくつかの第1世代(1G)通信技法,第2世代(2G)通信技法,2.5G通信技法,及び/又は第3世代(3G)通信技法のうちいずれか,及び/又は本発明の実施例によって運用することができるいくつかのほかのセルラ通信技法のうちいずれか,によって運用することができる。例えばPLMNは,GSM(世界移動体通信システム)通信技法,IS−136(時間分割多元接続TDMA)通信技法,IS−95(符号分割多元接続CDMA)通信技法,cdma2000通信技法,又はEDGE(強化データGSM環境)通信技法によって運用することができるものであってもよい。追加又は代替として,PLMNは例えば1×EV−DO(TIA/EIA/IS-856)及び/又は1×EV−DVを含む高速パケットデータ(HRPD)通信技法のような,1又は複数の強化された3G無線通信技法によって運用できるものであってもよい。更にPLMNは,例えばGPRS(はん用無線パケットサービス)技法,GPRSを用いた技法(例えばはん用移動体通信システムUMTS),又はその類似物によって運用できるものであってもよい。
MSC16,したがってPLMN18も,公衆交換電話ネットワーク(PSTN)20に接続され,PSTNは次に有線及び/又は無線電話機のような1つの,又は通常は多数の,回線交換固定端末22に接続される。PSTNはいくつかの種々の技法のうちいずれかによって音声通信を提供することができる。例えばPSTNは,64kbps(CCITT(ITU−T))のような時分割多重(TDM)技法,及び/又は56kbps(ANSI)のようなパルス符号変調(PCM)技法によって運用してもよい。
PLMN18(MSC16を介して)及びPSTN20は,インターネットプロトコル(IP)ネットワーク24のようなパケット交換ネットワークに接続され,電気的に接続され,又は電気的に通信することができる。PLMN及びPSTNは直接IPネットワークに接続することができるが,一実施例においては,PLMN及びPSTNは対応するゲートウェイ(GTW)26によって間接的にIPネットワークに接続される。IPネットワークは1又は複数のパケット交換固定端末28に接続してもよい。更にIPネットワークは,1又は複数の無線接続点(AP)30に接続してもよく,APには端末10のようなデバイスが接続できる。これに関して端末は,無線構内ネットワーク(WLAN)(例えばIEEE802.11)技法,Bluetooth(登録商標)技法,及び/又は超広帯域(UWB)技法のような低電力無線周波(LPRF)技法のような,いくつかの異なる方法のうちいずれかによってAPと接続してもよい。
次に図3を参照すると,本発明の例示実施例によって恩恵を得る移動体端末10のブロック図が示されている。移動体端末は,ここでより詳細に説明する本発明の例示実施例による1又は複数の機能を実行する種々の手段を含む。しかし移動体端末は,本発明の精神及び範囲を逸脱することなく,1又は複数の類似の機能を実行する代替手段を含んでもよいことを理解されたい。より特定すれば例えば図3に示すように,移動体端末は送信器32と,受信器34と,プロセッサ,コントローラ36又はその類似物のような,送信器及び受信器とそれぞれ信号を送受信する手段と,を含むことができる。これらの信号は,適用可能なセルラシステムの無線インタフェース標準による信号通知情報,並びにユーザ音声及び/又はユーザ発生データも含む。これに関して移動体端末は,1又は複数の無線インタフェース標準と,通信プロトコルと,変調種別と,接続種別と,によって動作できるものであってよい。より特定すれば,移動体端末はいくつかの第1世代通信プロトコル,第2世代通信プロトコル,及び/又は第3世代通信プロトコル,又はその類似物のうちいずれかによって動作できるものであってよい。例えば移動体端末は,第2世代(2G)無線通信プロトコルIS−136(TDMA),GSM及びIS−95(CDMA),並びに1×EV−DO及び1×EV−DVのような第3世代通信プロトコルによって動作できるものであってよい。いくつかの狭帯域AMPS(NAMPS)移動体端末及びTACS移動体端末もまた,2モード電話機又は多モード電話機(例えばデジタル及びアナログ電話機又はTDMA,CDMA及びアナログ電話機)として,本発明の教示が役に立つ。
コントローラ36は,移動体端末10の音声機能及び論理機能を実現するために必要な回路を含むことを理解されたい。例えばコントローラは,デジタル信号プロセッサと,マイクロプロセッサデバイスと,種々のアナログデジタル変換器,デジタルアナログ変換器及びほかの支援回路と,からなってもよい。移動体端末の制御機能及び信号処理機能は,これらのデバイスにそれぞれが対応する機能によって割り当てられる。このようにコントローラはまた,変調及び送信に先だってメッセージ及びデータを畳み込み符号化し,インタリーブする機能も含む。更にコントローラは,メモリに記憶することができる1又は複数のソフトウェアプログラムを操作する機能を含んでもよい。
移動体端末10はまた,通常のイヤホン又はスピーカ38と,リンガ40と,マイクロホン42と,ディスプレイ44と,ユーザ入力インタフェースと,を含むユーザインタフェースを備え,それらのすべてがコントローラ36に接続している。ユーザ入力インタフェースは,移動体端末がデータを受信できるようにするものであり,キーパッド46,タッチスクリーン(図示していない),又はほかの入力デバイスのような,移動体端末がデータを受信できるようにするいくつかのデバイスのうちいずれかを備えてもよい。キーパッドを含む実施例においては,キーパッドは通常の数字キー(0〜9)及び関連キー(#,*),並びに移動体端末を操作するためのほかのキーを含む。
移動体端末10はまた,加入者識別情報モジュール(SIM)48,着脱可能ユーザ識別情報モジュール(R−UIM),又はその類似物のようなメモリを含んでもよい。それらは通常,移動体通信加入者に関する情報要素を記憶する。SIMに加えて移動体端末10はほかのメモリを含んでもよい。これに関して移動体端末は,データ一時記憶のためのキャッシュエリアを含む揮発性ランダムアクセスメモリ(RAM)のような揮発性メモリ50を含んでもよい。移動体端末はまた,ほかの不揮発性メモリ52も含んでよく,それは組み込みであってもよいし,及び/又は着脱可能であってもよい。不揮発性メモリは,追加又は代替として,EEPROM,フラッシュメモリ,又はその類似物を備えてもよい。これらのメモリは,移動体端末の機能を実現するために移動体端末が用いる,いくつかの情報素片及びデータのうちいずれかを記憶することができる。例えばメモリは,MSC16などに対して移動体端末を唯一に識別することができる,国際移動体装置識別(IMEI)符号のような識別子を含んでもよい。
更に移動体端末10は,赤外線送受信器54又は別の局所データ転送デバイスを含んでもよく,それでデータは1又は複数のAP30を介してほかのデバイスと共有及び/又はほかのデバイスから取得することができる。データ共有は,データの遠隔共有も同様であるが,いくつかの別の技法によって提供することができる。例えば移動体端末は,ほかの無線周波送受信器とデータを共有することができる1又は複数の無線周波送受信器56を含んでもよく,それによってここに説明したとおりのWLANインタフェース及び/又はWANインタフェースとして機能することができる。追加又は代替として移動体端末は,Bluetooth(登録商標)特別委員会(Special Interest Group)が開発したBluetooth(登録商標)ブランドの無線技術を用いてデータを共有してもよい。
次に図4を参照すると,本発明の例示実施例による,DTX技法によって運用される移動体端末10の機能ブロック図を示している。図示されているように,マイクロホン42が音響信号を電気信号に変換し,電気信号は音声エンコーダ58に供給される。音声エンコーダは,TX−DTXプロセッサ60に転送される1又は複数の音声パラメータを生成するように,低速度で音声符号化を実行する。次にTX−DTXプロセッサは,マイクロホンが生成した信号が音声を含むか,単に背景ノイズを含むかに関係なく,毎回正常送信モードで音声フレームを転送する。音声フレームは無線ユニット62に送信され,無線ユニットは,送受信器及び無線経路が必要とするほかのコンポーネント及び機能を備える。無線ユニットは,BS14,AP30,又はその類似物への無線インタフェースを介した無線周波アップリンク信号として音声フレームを送信する。
移動体端末10は,BS14が送信したコマンドでDTXモードを指示される。移動体端末がDTXモードのときは,音声活性度検出器(VAD)64がマイクロホン42の発生した信号を分析して,マイクロホン42の発生した信号が音声を含むか,単に背景ノイズを含むか,を判定する。例えばGSM通信技法が規定するように,VADはマイクロホンの発生した信号のエネルギ及びスペクトル変化をより詳細に分析する。その分析結果を用いてVADはVADフラグを発生し,その状態が,信号が音声を含む(VAD=1)か,単に背景ノイズを含む(VAD=0)か,を示す。VADフラグがセットされている(VAD=1)ときは,送信側において非連続送信を担当する機能,すなわちTX−DTXプロセッサ60(送信DTX)は正常音声フレームを送信する。VADフラグがセットされていない(VAD=0)ときは,反対にTX−DTXはSIDフレームを送信し,それは受信側で発生されることになる擬似背景ノイズ(CN)のための背景ノイズ情報を含む。
VADフラグの状態がセットされている状態からセットされていない状態に変化したとき,すなわち信号に音声が検出されなかったときは,TX−DTX60は背景ノイズのパラメータを計算するために必要な所定数のフレームの後に,音声エンコーダ58が配信した符号化音声フレームの送信からSIDフレームの発生に切り替える。TX−DTXが無線ユニット62へ配信するフレームの制御ビット内のSP(音声)フラグは,送信フレームが正常音声フレームを含む(SP=1)か,SIDフレームを含む(SP=0)か,を示す。無線ユニット62は,最終音声フレームの後に1個のSIDフレーム(SP=0)を送信し,その後に無線経路への送信を終了する。TX−DTXプロセッサ60は,VADフラグがセットされていない間は,無線ユニットにノイズ情報を含むSIDフレームを発生し続ける。そして無線ユニットは,受信側におけるノイズパラメータ更新のために,これらのフレームを無線経路に転送し続ける。種々の例において,ノイズパラメータを更新するこれらのSIDフレームは擬似背景ノイズ更新(CNU)フレームと呼ばれる。その後VAD64が音声エンコーダ58のパラメータから音声を検出したときは,VADはVADフラグをセットし,それによってTX−DTXプロセッサが音声フレーム(SP=1)の連続送信を再開するように指示する。
TX−DTXプロセッサ60は,音声エンコーダ58が配信した音声フレームをSIDフレームに変換するか,又は移動体端末内の別個の擬似背景ノイズ発生器(CNG)エンコーダ(図示していない)を用いるか,それと通信することによって,背景ノイズを表すSIDフレームを発生する。例えばTX−DTXプロセッサは,背景ノイズのレベル及びスペクトラムの情報を提供する正常音声パラメータから,これらのパラメータをノイズパラメータとして選択してもよい。いくつかの音声フレーム期間に対応する平均値を,更にこれらパラメータ内に含めてもよい。各音声フレームは,これら音声フレーム期間に共通に対応する値をそれによって計算できる,対応するいくつかのパラメータを含んでもよい。次にこれらのノイズパラメータは上述の方法でSIDフレームによって無線経路に送信される。VAD64が音声を検出したとき,ほかの場合には送信するすべてのパラメータを送信する代わりに,それらパラメータの一部を1又は複数のゼロビットを含むSID符号で置き換えてもよい。ほかの不必要なパラメータも,値ゼロに符号化してもよい。
移動体端末10の受信側において,無線ユニット62がBS14,AP30又はその類似物から無線周波ダウンリンク信号(ダウンリンクフレームを含む)を受信する。無線ユニットはダウンリンク信号からダウンリンクフレームを分離して,受信側において非連続送信を担当するRX−DTXプロセッサ65(受信DTX)にダウンリンクフレームを与える。移動体端末が正常送信モードのときは,RX−DTXプロセッサは受信音声フレームを音声デコーダ66に転送し,デコーダは受信パラメータから音声復号を実行する。復号した音声信号は,スピーカ38で音響信号に変換される。移動体端末がDTXモードのときは,RX−DTXプロセッサは無線ユニットから受信したフレームを,通常はダウンリンクフレームが正常音声フレームを含むか,SIDフレームを含むか,によって,いくつかの異なる方法で処理する。これに関してRX−DTXは,フレームのSPフラグを用いてフレーム種別を判定することができる。SPフラグがセットされている(SP=1)ときは,RX−DTXは音声フレームを音声デコーダに転送する。SPフラグがセットされていない(SP=0)ときは,RX−DTXはスピーカ38に直接信号を供給するために,音声デコーダ66にSIDフレームが搬送した受信擬似背景ノイズ(CN)パラメータを用いて発生した符号化音声フレームを配信するか,移動体端末内の内部CNGデコーダを用いるか,又は別個のCNGデコーダ(図示していない)と通信するか,のいずれかの状態にシフトする。RX−DTXは,新規SIDフレームを受信するたびに,擬似背景ノイズを発生する際に用いるパラメータを更新する。音声デコーダは,スピーカによって送信側で生じたのと同様の音響背景ノイズに変換される信号を生成することによって,「ノイズ」を含む音声フレームを復号する。背景ノイズによって生じる音声と,完全な無音との間の変動は聞き手に非常に不愉快なものかもしれないが,このようにしてDTXモードでは避けることができる。
図3及び4に関する移動体端末10の説明から,移動体端末の要素は,ハードウェア及び/又はファームウェア,単独及び/又は計算機プログラム製品の制御下,のようないくつかの種々の手段によって実現できることを理解されたい。したがって一般に移動体端末は,1又は複数のクライアントアプリケーションの種々の機能を実行する1又は複数の論理要素すなわちエンティティを含むことができる。明察のとおり,論理要素はいくつかの異なる方法のうちいずれかによって組み込むことができる。これに関して,移動体端末の機能を実行する論理要素は,1又は複数の集積回路全体若しくは移動体端末,若しくはより特定すれば例えば移動体端末のコントローラ36と通信する集積回路アセンブリに実装できる。集積回路の設計は,一般に高度に自動化された過程である。これに関して,論理レベルの設計を,すぐにエッチングして半導体基板上に形成できる半導体回路設計に変換する複雑で強力なソフトウェアツールが利用できる。これらのソフトウェアツールは,よく確立された設計規則及び予め記憶された設計モジュールの膨大なライブラリを用いて,半導体チップ上に自動的に導体を配線し,コンポーネントを配置する。半導体回路の設計が完了すると,得られた設計は標準化された電子形式(例えばOpus,GDSII又はその類似物)で半導体製造設備,又は「ファブ」(fab)に送信することができる。
背景技術の項に示したとおり通常のDTX技法においては,擬似背景ノイズ(CN)パラメータを含むSIDフレームは,図1に示すように無音声期間に固定頻度で無線インタフェースを介して送信される。しかし低送信頻度においては,背景ノイズのスペクトラム特性及び時間特性は正確に表現できず,背景ノイズのいくらかの品質低下につながる。しかし送信頻度を上げると,音声フレーム及びSIDフレームの総合送信頻度を減少させ,DTXの利点を減少させる。したがって本発明の例示実施例によれば,無音声期間のSIDフレーム送信頻度,音声不活性期間,又はその類似物は,現在の音声対背景ノイズ(すなわち信号対ノイズ)比(SNR)のような現在のノイズ値を用いて選択的に制御できる。本発明の例示実施例は,それ自体信号品質に与える損害を減少させながら平均データ速度を減少できる利点をよりよく実現できる。
次に図5を参照すると,本発明の一例示実施例によるCNパラメータを適応的に送信する方法(SIDフレームで送信されるものとして,一般性を失わずに説明されている)における種々のステップが示されている。ブロック68に示すように音声送信の際に,移動体端末10の音声エンコーダ58はマイクロホン42が発生した信号の音声符号化を実行し,一方VAD64は上述したような方法でこれらの信号を分析する。これもまた上述したとおり,VADはこの信号分析結果を用いて,ブロック74及び76に示すようにVADフラグがセットされている(VAD=1)ときはTX−DTX60が正常音声フレームを送信するようにVADフラグを発生することができる。しかしVADフラグがセットされていないときは,TX−DTXは受信側において発生されることになる擬似背景ノイズ(CN)のための背景ノイズについての情報を含むSIDフレームを送信する。
本発明の例示実施例によってSIDフレームを送信するために,VAD64(又は別の移動体端末エンティティ)はSNR(又は逆SNR)を,いくつかの異なる方法のうちいずれかのような方法で計算又は推定することができる。例えば一例示実施例においてVADは,(有声又は無声の)活性音声の長期エネルギ(LTEactive)又は活性有声音声だけの長期エネルギ(LTEvoiced),及び背景ノイズの長期エネルギ(LTEinactive)を用いて(例えばデシベルで表した)SNRを推定する。このような例においてVADは,ブロック70に示すように,いくつかの異なる方法のうちいずれかのような方法で最初に長期エネルギを推定してSNRを推定することができる。例えばVADは,「非活性」(VAD=0)とVADによって記されたフレームから背景ノイズの長期エネルギを推定することができる。反対にVADは,「活性」(VAD=1)と記されたフレームから活性音声の長期エネルギを推定することができる。あるいはVADは,有声「活性」フレームだけから活性音声の長期エネルギを推定することができる。そのような例においてVADは,活性音声のエネルギを得るためにそのような有声フレームのエネルギに調整係数を与えることができる。
より特定すればVAD64(又はほかの移動体端末エンティティ)は,例えば同一の活性度クラス(すなわち不活性,活性,等)に属するある数のフレームのエネルギを直接平均することによって,背景ノイズ又は活性音声の長期エネルギを推定することができる。しかしこれら2信号のレベルに起こりうる変化(evolution)を考慮に入れるため,VADはまた再帰法も実施することができる。長期エネルギの再帰推定については,現在のフレームのエネルギFrameEnergyを用いた典型的推定式は次のように表される。
不活性フレーム(現在のフレームが不活性のとき)のエネルギは,
LTEinactive=alpha×LTEinactive+(1−alpha)×FrameEnergy (1)
有声フレーム(現在のフレームが有声のとき)のエネルギは,
LTEvoiced=alpha×LTEvoiced+(1−alpha)×FrameEnergy (2)
式(1)及び(2)において,alphaは通常0と1との間の値を持つ忘却係数(forgetting factor)を表し,固定であってもよいし,(例えばエネルギ変化によって)可変であってもよい。より特定すれば,例えば値alphaは,増加ノイズレベル又は減少音声レベルに対しては0.99(緩適応),若しくは減少ノイズレベル又は増加音声レベルに対しては0.90(急適応)を選択することができる。
活性又は有声音声の長期エネルギ(LTEactive又はLTEvoiced)及び背景ノイズの長期エネルギ(LTEinactive)を推定した後,VAD64はブロック72に示すとおり対応する長期エネルギを用いて現在のSNR値を計算又は推定できる。VADが活性音声の長期エネルギを推定したとき,例えばVADは次の式によって現在のSNR(dB表記)を計算できる。
SNR(n)=10.0log10(LTEactive/LTEinactive) (3)
一方,VADが有声音声の長期エネルギを推定したときは,VADは次の式などによって,有声フレームの長期エネルギだけを用いて推定したSNRに直接調整係数を適用することができる。
SNR(n)=10.0log10(LTEvoiced/LTEinactive)−Delta (4)
式(4)において,DeltaはSNRバイアスを表す。SNRバイアスDeltaはいくつかの別の方法のうちいずれかに設定できるが,一例示実施例においてはDeltaは28dBに設定される。この値は,有声フレームの長期エネルギと,活性フレームの長期エネルギとの比から事前に実験的に決定されたものである。
TX−DTX60(又は別の移動体端末エンティティ)は不活性期間(VAD=0)にSIDを送信する前に,SIDフレーム送信頻度を例えば高SNR値(又は低逆SNR値)に対応する最小値と,低SNR値(又は高逆SNR値)に対応する最大値との間で線形に変化させることによって,現在のSNR値に適応させることができる。SIDフレーム送信頻度はSIDフレームが送信される間隔の逆数である。これに関してTX−DTXはブロック78に示すとおり,間隔SIDintervalを現在のSNR値に適応させる,すなわち現在のSNR値を用いて間隔を計算することができる。一適応技法によれば,SIDintervalの値は,例えば低SNR値(SNRLOW)に対応する最小間隔値(INTMIN)と,高SNR値(SNRHIGH)に対応する最大間隔値(INTMAX)との間を線形に変化させることができる。より特定すればSIDinterval値は例えば次のとおり現在のSNR値に適応させることができる。
SIDinterval=INTMIN+(INTMAX−INTMIN)×(SNR(n)−SNRLOW)/(SNRHIGH−SNRLOW) (6)
ここでINTMIN≦SIDinterval≦INTMAXである。値INTMINと,SNRLOWと,INTMAXと,SNRHIGHとは,いくつかの別の方法のうちいずれかによって選択できるが,一例示実施例においてはこれらの値は次のように選択される。
INTMIN=12
SNRLOW=10dB
INTMAX=50
SNRHIGH=25dB
どの程度正確にSIDintervalが現在のSNR値に適応しているかには関係なく,TX−DTX60(又は別の移動体端末エンティティ)は不活性期間のフレームについて,SIDinterval値を用いてその時点でSIDフレームを送信するか,そのフレームをスキップするかを判定することができる。より特定すればブロック80に示すとおり,例えば不活性期間のフレームについてTX−DTXは,2つの連続するSIDフレームの間の現在の間隔の終わりに達したかどうかを最初に判定することができる。これに関してTX−DTXが最後のSIDフレームを送信してから経過したフレーム間隔数が値SIDinterval以上であるとき,TX−DTXはブロック88に示すとおり新規SIDフレームを送信することができる。
更にVAD64(又は別の移動体端末エンティティ)はブロック80に示すとおり,SID間隔の間などで(例えば現在のSID間隔の終わりに達したとき)背景ノイズレベルの急な及び/又は重要な変化を検出するためにいくつかのステップを実行することができる。より特定すれば,VADは例えば次の条件によって背景ノイズレベルの急な及び/又は重要な変化を検出することができる。
10.0log10(FrameEnergy)−10.0log10(FrameEnergyLastSID)>MAXENER_VAR (7)
ここでFrameEnergyLastSIDは,TX−DTXが送信した最後のSIDフレームのエネルギを表す。また前の式においてMAXENER_VARは最大エネルギ変化を表し,通常値は4.0dBである。あるいは条件(7)におけるエネルギ測定値は,次の条件(8)などによって,背景ノイズの局所エネルギバーストの際にCNGモデルを更新することを避けるために,それらに対応する長期エネルギで置き換えることができる。
10.0log10(LTEinactive)−10.0log10(LTEinactive_LastSID)>MAXENER_VAR (8)
ここでLTEinactive_LastSIDは,最後のSIDフレームの長期エネルギを表す。次に,条件(7)(又は条件(8))が満たされたとき,VADはTX−DTX(TX−DTXの受信指示)が新規SIDフレームを送信するように指示することができる(ブロック88参照)。そうでなければブロック86に示すとおり現在の不活性フレームはスキップされ,TX−DTXは新規SIDフレームを送信しない。
ブロック82に示されているとおり,VAD64(又は別の移動体端末エンティティ)が急な,及び/又は重要な変化を検出したときは,背景ノイズの長期エネルギLTEinactiveを現在のフレームのエネルギFrameEnergyにリセットすることができるが,必須ではない。またTX−DTX60が新規SIDフレームを送信するように指示されたときは,最後に送信されたSIDフレームのエネルギFrameEnergyLastSID(条件(7)のとき),又はLTEinactive_LastSID(条件(8)のとき)は,ブロック84に示すとおり現在のフレームのエネルギFrameEnergyにリセットすることができるが,必須ではない。
上記のとおり,TX−DTX60と,VAD64と,別の移動体端末エンティティとは,符号化信号の各フレームについて上述の各ステップを実行する。しかしこれらのエンティティが最初に動作する前に,VAD及び/又はTX−DTXが用いるいくつかの内部変数を以降の利用のために初期化してもよい。例えば有声フレームの長期エネルギLTEvoiced及び不活性フレームの長期エネルギLTEinactiveは,既定値(例えば0)に初期化してもよい。最後に送信されたSIDフレームのエネルギFrameEnergyLastSID(条件(7)のとき),又はLTEinactive_LastSID(条件(8)のとき)は,既定値(例えば0)に初期化してもよい。またSID間隔値SIDintervalは,既定値(例えば8)に初期化してもよい。
更に,長期エネルギLTEvoiced及びLTEinactiveの測定,並びに結果としてSNRの測定において十分なフレームが考慮されることを保証するために,VAD64は有声フレーム及び不活性フレームの2つのカウンタを用いてもよい。次にこれらのカウンタは既定値(例えば0)に初期化してもよい。したがって動作中に推定式(1)又は(2)のうち1つが実行されるたびに,対応するフレームカウンタを1だけ増加させてもよい。したがって,双方のカウンタが最小値(例えば50)になるまえにSID間隔の適応を停止するようにVADを構成してもよい。
本発明の例示実施例の改善された効率を検証するために,3GPP2 VMR−WB(可変速度マルチモード広帯域)音声符号化フレームワークにおける本発明の前述の実施例の実装を考えることにする。表1に通常のVMR−WBエンコーダ(「標準DTX」,8不活性フレームごとに1SIDフレームが送信される)に関するDTXフレーム(すなわちTX−DTX60が送信しないフレーム)の割合と,本発明の前述の実施例によって構成したVMR−WBエンコーダ(「可変DTX])に関するDTXフレーム(すなわちTX−DTX60が送信しないフレーム)の割合と,の比較を示す。
Figure 0005351206
これから分かるように,本発明の例示実施例を実装することによってTX−DTXは,不活性期間に送信するフレームがより少なくなるように制御することができ,SNRの増加に対してフレームの増加割合がより少ない。このように本発明の例示実施例は,不活性期間に送信されるフレームの減少がSNRの増加と結合しているので,信号品質に与える影響を減少させながら,更に平均データ速度を減少させることができる。
本発明の例示実施例を参照して前に説明したとおり,無音声期間のSIDフレームの送信頻度,不活性音声期間,又はその類似物を,現在のSNRを用いて選択的に制御することができる。しかし送信頻度は,現在のSNRに加えて,又はその代わりに現在のノイズ値を表すいくつかのほかの値のうちの任意の1つ又は複数を用いて選択的に制御してもよいことを理解されたい。前に示唆したとおり,例えばSIDフレームの送信頻度は現在の逆SNRを用いて選択的に制御してもよい。また例えばSIDフレームの送信頻度は,SNRから判定できる現在のノイズ値を用いて選択的に制御してもよく,ノイズの定常性測定は,それ自身は当業者には周知の事項である。この場合,システム及び方法は前に説明したとおりに動作するが,明察のとおり上記の例示の値のうち1又は複数は修正してもよい。
本発明の例示実施例を示し,説明したが,本発明の精神及び範囲を逸脱することなく,いくつかの別の方法のうちいずれかによって,活性音声と不活性音声とを分類及び/又は符号化することができ,及び/又はSIDフレームを発生できることを理解されたい。例えば代替実施例においては,完全な「情報源エンコーダ」は,音声エンコーダ58と,TX−DTX60(CNGエンコーダを含む)と,VAD64との機能を実行するために,マイクロホン42と無線ユニット62との間に置いてもよい。そのような実施例においては,活性音声期間に情報源エンコーダが入力音声フレームごとに1フレームを無線ユニットに供給することができる。不活性期間には反対に,CNGエンコーダが前に説明したものと同一の方法などで,現在のSNR値を用いて時折1フレームを無線ユニットに供給することができる。しかしこの実施例においては,SNR計算と,SID更新頻度適応と,新SIDを送信する判断とは,すべてCNGエンコーダが行うことができる。
本発明の一例示態様によれば,移動体端末10のようなシステムの1又は複数のエンティティが実行する機能は,上述したものを含むハード及び/又はファームウェアのような種々の手段によって,単独及び/又は計算機プログラム製品の制御下で実行することができる。本発明の例示実施例の1又は複数の機能を実行する計算機プログラム製品は,不揮発性記憶媒体のような計算機可読記憶媒体と,計算機可読記憶媒体に組み込まれた一連の計算機命令のような計算機可読プログラムコード部を含むソフトウェアと,を含む。
これに関して図5に本発明の例示実施例によるシステム,方法及び計算機プログラム製品のフローチャートを示す。フローチャートの各ブロック又はステップと,フローチャート内の各ブロックの組合せとは,ハードウェア,ファームウェア及び/又は1又は複数の計算機プログラム命令を含むソフトウェアのような種々の手段によって実現することができる。明察のとおりそのような計算機プログラム命令はどれも,計算機又はほかのプログラム可能装置(すなわちハードウェア)に組み込まれて機械をなし,それによって計算機又はほかのプログラム可能装置上で実行される命令が,フローチャートのブロック又はステップに規定された機能を実現する手段を作り出すことができる。またこれらの計算機プログラム命令は,計算機又はほかのプログラム可能装置が特定の方法で機能するように指示することができる計算機可読メモリに記憶することができ,それによって計算機可読メモリに記憶された命令が,フローチャートのブロック又はステップに規定された機能を実現する命令手段を含む製造物を作り出すことができる。また計算機プログラム命令は,計算機又はほかのプログラム可能装置に組み込まれて,計算機又はほかのプログラム可能装置上で実行される一連の操作ステップが計算機で実現された処理を作り出すようにし,それによって計算機又はほかのプログラム可能装置上で実行される命令がフローチャートのブロック又はステップに規定された機能を実現するステップを提供することができる。
したがってフローチャートの各ブロック又はステップは,規定した機能を実行する手段の組合せと,規定した機能を実行するステップの組合せと,規定した機能を実行するプログラム命令手段と,に対応する。また,フローチャートの1又は複数のブロック又はステップと,フローチャートの各ブロック又はステップの組合せとは,規定した機能又はステップを実行する特定用途ハードウェアによる計算機システム,若しくは特定用途ハードウェアと計算機命令との組合せによって実現できる。
上述の説明及び添付の図面から,本発明のいくつかの実施例は擬似背景ノイズ(CN)パラメータを適応的に送信することができるシステムに関することは明白である。本発明の実施例は更に,擬似背景ノイズ(CN)パラメータを適応的に送信することができる方法に関し,その方法は(1)少なくとも1つの活性期間及び少なくとも1つの不活性期間を含む非連続送信を実施するステップであって,非連続送信を実施するステップは少なくとも1つの不活性期間の少なくとも1つの時点で少なくとも1つのノイズパラメータの組を送信するステップと,(2)現在のノイズ値を推定するステップと,(3)現在のノイズ値を用いて間隔を計算するステップであって,ノイズパラメータの組が計算した間隔で送信されるステップと,を有する。
当業者であれば本発明の多くの修正物及び別の実施例が思い浮かぶであろうが,それらは本発明に属し,前述の説明及び添付の図面に提示された教示が役立つものである。したがって本発明は開示した特定の実施例に限定するものではなく,修正物及び別の実施例も本願請求項の範囲に含まれるように意図していることを理解されたい。ここで特定の用語を用いたが,それらは共通かつ説明的な意味でだけ用いられており,限定のためではない。

Claims (24)

  1. プロセッサ及びメモリを備えた装置であって、該メモリは実行可能命令を記憶し、該実行可能命令は前記プロセッサによって実行されることによって前記装置に、
    無音声期間中に擬似背景ノイズパラメータを有するフレームが散在する音声フレームの送信を含む、非連続送信モードによる送信のために音声信号を準備するステップと、
    信号対雑音比を受信するステップと、
    擬似背景ノイズパラメータを有する前記フレームが前記無音声期間に送信されるレートを選択的に制御するステップであって、前記信号対雑音比が増加するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが減少し、前記信号対雑音比が減少するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが増加する、ステップと、
    を実行させる、装置。
  2. 前記信号対雑音比を受信するステップは、活性音声の長期エネルギ及び背景ノイズの長期エネルギを用いて推定された現在の信号対ノイズ比を受信するステップを含む、請求項1に記載の装置。
  3. 前記信号対雑音比を受信するステップは、活性な音声の長期エネルギ及び背景ノイズの長期エネルギの関数並びに該関数に適用される調整係数を用いて推定された現在の信号対ノイズ比を受信するステップを含む、請求項1に記載の装置。
  4. 前記レートを選択的に制御するステップは、第1ノイズ値に対応する最小値と、前記第1ノイズ値より低い第2ノイズ値に対応する最大値との間で前記レートを変化させるステップを含む請求項1に記載の装置。
  5. 前記レートを選択的に制御するステップは、前記信号対雑音比に基づいて間隔を計算するステップを含み、
    前記フレームは前記の計算した間隔で送信される擬似背景ノイズパラメータを含み、
    非活性期間中に前記フレームに対して、前記メモリは実行可能命令を記憶し、該実行可能命令は前記プロセッサによって実行されることによって、前記装置に
    計算した間隔の終わりに達したかどうかを判定するステップと、
    前記計算した間隔の終わりに達したとき、擬似背景ノイズパラメータを有するフレームを送信するよう指示するステップ、
    あるいは、検出した背景ノイズレベル変位が最大変位を超えたとき、前記計算した間隔の終わりに達する前に、擬似背景ノイズパラメータを有するフレームの送信を準備する指示を受信するステップと、
    を更に実行させる、請求項1に記載の装置。
  6. 無音声期間中に擬似背景ノイズパラメータを有するフレームが散在する音声フレームの送信を含む、非連続送信モードによる送信のために音声信号を準備するための少なくとも1つの手段を備えた装置であって、
    前記少なくとも1つの手段は、
    信号対雑音比を受信するための第1手段と、
    擬似背景ノイズパラメータを有する前記フレームが前記無音声期間に送信されるレートを、選択的に制御する第2手段と、を含み、
    前記信号対雑音比が増加するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが減少し、前記信号対雑音比が減少するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが増加する、装置。
  7. 無音声期間中に擬似背景ノイズパラメータを有するフレームが散在する音声フレームの送信を含む、非連続送信モードによる送信のために音声信号を準備するように構成された少なくとも1つの回路を備えた装置であって、
    該少なくとも1つの回路は、信号対雑音比を受信するように構成された第1回路と、擬似背景ノイズパラメータを有する前記フレームが前記無音声期間に送信されるレートを選択的に制御するように構成された第2回路と、を備え、
    前記信号対雑音比が増加するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが減少し、前記信号対雑音比が減少するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが増加する、装置。
  8. 信号対雑音比を受信するように構成される前記第1回路は、活性音声の長期エネルギ及び背景ノイズの長期エネルギを用いて推定された現在の信号対雑音比を受信するようにさらに構成されている、請求項7に記載の装置。
  9. 前記レート選択的に制御するように構成された前記第2回路は、第1ノイズ値に対応する最小値と、前記第1ノイズ値より低い第2ノイズ値に対応する最大値との間で前記レートを変化させるようにさらに構成されている、請求項7に記載の装置。
  10. 音声送信の際、音声フレームを送信するように構成した送信器を備えた装置であって、 前記送信器は無音声期間中に擬似背景ノイズパラメータを有するフレームが散在する前記音声フレームを送信するように構成され、
    前記送信器は、選択的に制御されるレートで、前記無音声期間に前記擬似背景ノイズパラメータを有する前記フレームを送信するように構成され、
    前記送信器は、信号対雑音比に基づいて、前記の音声送信の際、1又は複数の時点において、前記レートを選択的に制御するように構成され、
    前記信号対雑音比が増加するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが減少し、前記信号対雑音比が減少するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが増加する、装置。
  11. 前記レートの制御が基づく前記信号対雑音比は、活性音声の長期エネルギ及び背景ノイズの長期エネルギを用いて推定される、請求項10に記載の装置。
  12. 前記レートの制御が基づく前記信号対雑音比は、活性な音声の長期エネルギ及び背景ノイズの長期エネルギの関数を用いて、および、該関数に適用される調整係数を用いて推定される、請求項10に記載の装置。
  13. 前記送信器は、第1ノイズ値に対応する最小値と、前記第1ノイズ値より低い第2ノイズ値に対応する最大値との間で前記レートを変化させることによって選択的に制御されるレートで前記擬似背景ノイズパラメータを含むフレームを送信するように構成される、請求項10に記載の装置。
  14. 無音声期間中に擬似背景ノイズパラメータを有するフレームが散在する音声フレームの送信を含む非連続送信モードによる送信のために音声信号を準備するステップと、
    前記の音声送信の際、1又は複数の時点において、信号対雑音比を受信するステップと、
    擬似背景ノイズパラメータを有する前記フレームが前記無音声期間に送信されるレートを選択的に制御する選択制御ステップであって、前記信号対雑音比が増加するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが減少し、前記信号対雑音比が減少するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが増加する、ステップと、
    を含む方法。
  15. 前記信号対雑音比を受信するステップは、活性音声の長期エネルギ及び背景ノイズの長期エネルギを用いて推定された現在の信号対ノイズ比を受信するステップを含む、請求項14に記載の方法。
  16. 前記信号対雑音比を受信するステップは、活性な音声の長期エネルギ及び背景ノイズの長期エネルギの関数を用いて、推定された現在の信号対ノイズ比を受信するステップを含む、請求項14に記載の方法。
  17. 前記現在の信号対ノイズ比を受信するステップは、前記関数に調整係数が適用された現在の信号対ノイズ比を受信するステップを含む、請求項16に記載の方法。
  18. 前記選択制御ステップは、第1ノイズ値に対応する最小値と、前記第1ノイズ値より低い第2ノイズ値に対応する最大値との間で前記レートを変化させるステップを含む請求項14に記載の方法。
  19. 前記選択制御ステップは、前記信号対雑音比に基づいて間隔を計算するステップを含み、
    前記フレームは前記の計算した間隔で送信される擬似背景ノイズパラメータを含み、
    非活性期間中に前記フレームに対して、前記方法は、計算した間隔の終わりに達したかどうかを判定するステップと、
    前記計算した間隔の終わりに達したとき、擬似背景ノイズパラメータを有するフレームを送信するよう指示するステップ、
    あるいは、検出した背景ノイズレベル変位が最大変位を超えたとき、前記計算した間隔の終わりに達する前に、擬似背景ノイズパラメータを有するフレームを送信する指示を受信する指示受信ステップと、を含む、請求項14に記載の方法。
  20. 前記背景ノイズレベル変位は、現在のフレームのエネルギと、擬似背景ノイズパラメータを有する最後に送信したフレームのエネルギと、の対数差を用いて検出する、ステップを含む請求項19に記載の方法。
  21. 前記背景ノイズレベル変位は、背景ノイズの長期エネルギと、
    擬似背景ノイズパラメータを有する最後に送信したフレームの長期エネルギと、の間での対数差を用いて検出するステップを含む請求項19に記載の方法。
  22. 計算機可読プログラムコード部が記憶された計算機可読記憶媒体であって、前記計算機可読プログラムコード部は、プロセッサによって実行することによって装置に
    無音声期間中に擬似背景ノイズパラメータを有するフレームが散在する音声フレームの送信を含む、非連続送信モードによる送信のために音声信号を準備するステップと、
    信号対雑音比を受信するステップと、
    擬似背景ノイズパラメータを有する前記フレームが前記無音声期間に送信されるレートを選択的に制御する選択制御ステップであって、前記信号対雑音比が増加するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが減少し、前記信号対雑音比が減少するとき前記擬似背景ノイズパラメータを有する前記フレームの送信レートが増加する、ステップと、
    を実行させる、計算機可読記憶媒体。
  23. 前記信号対雑音比を受信するステップは、活性音声の長期エネルギ及び背景ノイズの長期エネルギを用いて推定された現在の信号対ノイズ比を受信するステップを含む、請求項22に記載の計算機可読記憶媒体。
  24. 前記選択制御ステップは、第1ノイズ値に対応する最小値と、前記第1ノイズ値より低い第2ノイズ値に対応する最大値との間で前記レートを変化させるステップを含む、請求項22に記載の計算機可読記憶媒体。
JP2011085342A 2005-06-18 2011-04-07 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法 Active JP5351206B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US69142005P 2005-06-18 2005-06-18
US60/691,420 2005-06-18

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2008515313A Division JP2008546341A (ja) 2005-06-18 2006-06-15 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法

Publications (2)

Publication Number Publication Date
JP2011199875A JP2011199875A (ja) 2011-10-06
JP5351206B2 true JP5351206B2 (ja) 2013-11-27

Family

ID=37591556

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008515313A Withdrawn JP2008546341A (ja) 2005-06-18 2006-06-15 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
JP2011085342A Active JP5351206B2 (ja) 2005-06-18 2011-04-07 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2008515313A Withdrawn JP2008546341A (ja) 2005-06-18 2006-06-15 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法

Country Status (12)

Country Link
US (1) US7693708B2 (ja)
EP (1) EP1897085B1 (ja)
JP (2) JP2008546341A (ja)
CN (1) CN101213591B (ja)
CA (1) CA2609945C (ja)
ES (1) ES2629727T3 (ja)
HK (1) HK1117631A1 (ja)
MY (1) MY144785A (ja)
PL (1) PL1897085T3 (ja)
TW (1) TWI327852B (ja)
WO (1) WO2006136901A2 (ja)
ZA (1) ZA200800461B (ja)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8284707B2 (en) * 2006-11-07 2012-10-09 Qualcomm Incorporated Hybrid power-saving mechanism for VoIP services
CN101622668B (zh) * 2007-03-02 2012-05-30 艾利森电话股份有限公司 电信网络中的方法和装置
JP2009063928A (ja) * 2007-09-07 2009-03-26 Fujitsu Ltd 補間方法、情報処理装置
CN101335003B (zh) 2007-09-28 2010-07-07 华为技术有限公司 噪声生成装置、及方法
US8514754B2 (en) * 2007-10-31 2013-08-20 Research In Motion Limited Methods and apparatus for use in controlling discontinuous transmission (DTX) for voice communications in a network
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
US8972247B2 (en) * 2007-12-26 2015-03-03 Marvell World Trade Ltd. Selection of speech encoding scheme in wireless communication terminals
US8374097B2 (en) * 2008-02-08 2013-02-12 Texas Instruments Incorporated Fast DRX for DL speech transmission in wireless networks
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
DE102008009718A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
DE102008009720A1 (de) 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
KR101317813B1 (ko) * 2008-03-31 2013-10-15 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
KR101335417B1 (ko) * 2008-03-31 2013-12-05 (주)트란소노 노이지 음성 신호의 처리 방법과 이를 위한 장치 및 컴퓨터판독 가능한 기록매체
JP5270762B2 (ja) * 2008-10-16 2013-08-21 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 無音挿入記述子(sid)の散発的な信号を制御する装置および方法
US8320553B2 (en) 2008-10-27 2012-11-27 Apple Inc. Enhanced echo cancellation
WO2011049515A1 (en) * 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and voice activity detector for a speech encoder
KR20120034863A (ko) * 2010-10-04 2012-04-13 삼성전자주식회사 이동통신 단말기에서 오디오 신호 처리 방법 및 장치
CN102143605B (zh) * 2011-01-20 2016-02-24 中兴通讯股份有限公司 一种无线局域网中手机电视业务数据共享的方法和系统
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
BR112013020588B1 (pt) 2011-02-14 2021-07-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho e método para codificação de uma parte de um sinal de áudio utilizando uma detecção transiente e um resultado de qualidade
PT2676267T (pt) 2011-02-14 2017-09-26 Fraunhofer Ges Forschung Codificação e descodificação de posições de pulso de faixas de um sinal de áudio
MX2012013025A (es) 2011-02-14 2013-01-22 Fraunhofer Ges Forschung Representacion de señal de informacion utilizando transformada superpuesta.
CN105304090B (zh) 2011-02-14 2019-04-09 弗劳恩霍夫应用研究促进协会 使用对齐的前瞻部分将音频信号编码及解码的装置与方法
TWI484479B (zh) 2011-02-14 2015-05-11 Fraunhofer Ges Forschung 用於低延遲聯合語音及音訊編碼中之錯誤隱藏之裝置和方法
PL2676266T3 (pl) 2011-02-14 2015-08-31 Fraunhofer Ges Forschung Układ kodowania na bazie predykcji liniowej wykorzystujący kształtowanie szumu w dziedzinie widmowej
SG192718A1 (en) * 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Audio codec using noise synthesis during inactive phases
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
US8751223B2 (en) * 2011-05-24 2014-06-10 Alcatel Lucent Encoded packet selection from a first voice stream to create a second voice stream
US8589153B2 (en) 2011-06-28 2013-11-19 Microsoft Corporation Adaptive conference comfort noise
CN102903364B (zh) * 2011-07-29 2017-04-12 中兴通讯股份有限公司 一种进行语音自适应非连续传输的方法及装置
EP2552172A1 (en) 2011-07-29 2013-01-30 ST-Ericsson SA Control of the transmission of a voice signal over a bluetooth® radio link
CN102543090B (zh) * 2011-12-31 2013-12-04 深圳市茂碧信息科技有限公司 一种应用于变速率语音和音频编码的码率自动控制系统
US9065576B2 (en) * 2012-04-18 2015-06-23 2236008 Ontario Inc. System, apparatus and method for transmitting continuous audio data
US8868415B1 (en) * 2012-05-22 2014-10-21 Sprint Spectrum L.P. Discontinuous transmission control based on vocoder and voice activity
AU2013366552B2 (en) 2012-12-21 2017-03-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
PT2936487T (pt) * 2012-12-21 2016-09-23 Fraunhofer Ges Forschung Geração de um ruído de conforto com alta resolução espetrotemporal em transmissão descontínua de sinais de áudio
ES2844223T3 (es) 2013-02-22 2021-07-21 Ericsson Telefon Ab L M Métodos y aparatos para retención DTX en codificación de audio
US9179404B2 (en) * 2013-03-25 2015-11-03 Qualcomm Incorporated Method and apparatus for UE-only discontinuous-TX smart blanking
CN104217723B (zh) * 2013-05-30 2016-11-09 华为技术有限公司 信号编码方法及设备
KR102026792B1 (ko) * 2013-07-12 2019-09-30 삼성전자 주식회사 D2d 탐색 수행 방법 및 그 방법을 사용하는 단말
CN103687067A (zh) * 2013-12-27 2014-03-26 北京赢销通软件技术有限公司 一种基于无线网络的设备发现和实时通信的方法
US9775110B2 (en) * 2014-05-30 2017-09-26 Apple Inc. Power save for volte during silence periods
EP2980790A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
CN104378474A (zh) * 2014-11-20 2015-02-25 惠州Tcl移动通信有限公司 一种降低通话输入噪音的移动终端及其方法
US20160323425A1 (en) * 2015-04-29 2016-11-03 Qualcomm Incorporated Enhanced voice services (evs) in 3gpp2 network
US10477470B2 (en) 2016-02-08 2019-11-12 Qualcomm Incorporated Systems and methods for silent period operation during wireless communication
ES2956797T3 (es) * 2018-06-28 2023-12-28 Ericsson Telefon Ab L M Determinación de parámetros de ruido de confort adaptable
US11109440B2 (en) * 2018-11-02 2021-08-31 Plantronics, Inc. Discontinuous transmission on short-range packet-based radio links
US10855841B1 (en) * 2019-10-24 2020-12-01 Qualcomm Incorporated Selective call notification for a communication device
CN113571072B (zh) * 2021-09-26 2021-12-14 腾讯科技(深圳)有限公司 一种语音编码方法、装置、设备、存储介质及产品

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI103700B1 (fi) * 1994-09-20 1999-08-13 Nokia Mobile Phones Ltd Samanaikainen puheen ja datan siirto matkaviestinjärjestelmässä
FI110826B (fi) * 1995-06-08 2003-03-31 Nokia Corp Akustisen kaiun poisto digitaalisessa matkaviestinjärjestelmässä
FR2739995B1 (fr) * 1995-10-13 1997-12-12 Massaloux Dominique Procede et dispositif de creation d'un bruit de confort dans un systeme de transmission numerique de parole
US6823303B1 (en) * 1998-08-24 2004-11-23 Conexant Systems, Inc. Speech encoder using voice activity detection in coding noise
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
US6519260B1 (en) * 1999-03-17 2003-02-11 Telefonaktiebolaget Lm Ericsson (Publ) Reduced delay priority for comfort noise
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US6807525B1 (en) * 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
EP1204093A1 (en) * 2000-11-02 2002-05-08 Lucent Technologies Inc. Discontinuous comfort noise transmission
EP1346553B1 (en) * 2000-12-29 2006-06-28 Nokia Corporation Audio signal quality enhancement in a digital network
KR100894287B1 (ko) 2001-10-19 2009-04-21 인터디지탈 테크날러지 코포레이션 다운링크에서 전체 dtx 동작 모드 동안 개선된 전력절감을 위한 시스템
AU2003278013A1 (en) * 2002-10-11 2004-05-04 Voiceage Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7027496B2 (en) * 2003-04-04 2006-04-11 Nokia Corporation Method and apparatus providing unbiased signal-to-noise ratio estimation and its application to discontinuous transmission detection
US7587211B2 (en) * 2005-12-21 2009-09-08 Broadcom Corporation Method and system for adaptive multi rate (AMR) and measurements downlink adaptation

Also Published As

Publication number Publication date
CN101213591A (zh) 2008-07-02
ES2629727T3 (es) 2017-08-14
CN101213591B (zh) 2013-07-24
EP1897085A2 (en) 2008-03-12
HK1117631A1 (en) 2009-01-16
WO2006136901A2 (en) 2006-12-28
WO2006136901A3 (en) 2007-03-08
CA2609945C (en) 2012-12-04
PL1897085T3 (pl) 2017-10-31
US7693708B2 (en) 2010-04-06
MY144785A (en) 2011-11-15
ZA200800461B (en) 2008-12-31
JP2011199875A (ja) 2011-10-06
TWI327852B (en) 2010-07-21
CA2609945A1 (en) 2006-12-28
EP1897085B1 (en) 2017-05-31
US20060293885A1 (en) 2006-12-28
JP2008546341A (ja) 2008-12-18

Similar Documents

Publication Publication Date Title
JP5351206B2 (ja) 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
JP4897173B2 (ja) ノイズ抑制
JP4110726B2 (ja) 聴力補正式の携帯電話機
FI116180B (fi) Menetelmä ja laite signaalien ryhmäkoodauksen suorittamiseksi
JP5129201B2 (ja) 広帯域信号の狭帯域信号への強化された変換
JP4643517B2 (ja) 音声通信システムにおいて快適雑音を生成する方法および装置
US10049684B2 (en) Audio bandwidth selection
US10218856B2 (en) Voice signal processing method, related apparatus, and system
US20230410820A1 (en) Adaptive comfort noise parameter determination
ES2371455T3 (es) Pre-procesamiento de datos digitales de audio para codecs de audio de móvil.
JP2006527528A (ja) 音声チャネルを介してデータを伝送するための方法及び装置
US20070129022A1 (en) Method for adjusting mobile communication activity based on voicing quality
US7542897B2 (en) Condensed voice buffering, transmission and playback
US20130155924A1 (en) Coded-domain echo control
Holma et al. Performance of adaptive multirate (AMR) voice in GSM and WCDMA
US6711259B1 (en) Method and apparatus for noise suppression and side-tone generation
CN112002338A (zh) 一种优化音频编码量化次数的方法及系统
JP3603469B2 (ja) 音声品質改善装置
JP2018049124A (ja) 無線通信装置、無線通信システム、及びノイズ軽減方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130404

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130723

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130822

R150 Certificate of patent or registration of utility model

Ref document number: 5351206

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250