JP2003505987A - 音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント - Google Patents

音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント

Info

Publication number
JP2003505987A
JP2003505987A JP2001513146A JP2001513146A JP2003505987A JP 2003505987 A JP2003505987 A JP 2003505987A JP 2001513146 A JP2001513146 A JP 2001513146A JP 2001513146 A JP2001513146 A JP 2001513146A JP 2003505987 A JP2003505987 A JP 2003505987A
Authority
JP
Japan
Prior art keywords
data
frame
receiving device
value
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001513146A
Other languages
English (en)
Other versions
JP4485724B2 (ja
Inventor
アリ ラカニエミ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of JP2003505987A publication Critical patent/JP2003505987A/ja
Application granted granted Critical
Publication of JP4485724B2 publication Critical patent/JP4485724B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Telephonic Communication Services (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Telephone Function (AREA)

Abstract

(57)【要約】 一般に、この発明は、ディジタル無線システムに用いられる音声符号化及び復号化と、送信装置及び受信装置の間で不連続送信を使用する電気通信システムにおいて必要とされる処理能力を減少させることができる方法とに関する。特に、本発明の方法は、送信装置及び受信装置の間で異なる符号化方法を使用する2つの電気通信システムを整合させるために使用される。この方法では、送信装置により送信される信号は信号路において受信装置に適するようにされ、第1ステップにおいて、受信されたデータ・パラメータ(101)の各データ・フレームについて少なくとも2つの内容識別子を含む少なくとも1つの情報パラメータが形成される。次のステップにおいて、受信されたフレームのデータ・パラメータ(101)から原データに対応するデータが合成され、その後に、その合成されたデータは受信装置に適する符号化方法で記録されるべく送信される。最終ステップでは、記録中に、情報パラメータの前記内容識別子の少なくとも1つの値に基づいてフレームの少なくとも幾つかのデータ・パラメータ(107)が更新され、該情報パラメータの少なくとも1つの他の内容識別子の値に基づいて全ての記録されているデータ・フレームから受信装置へ送信されるべきフレームが選択される。更に、本発明はネットワーク・エレメントに関し、それは、上記の方法を実行するように構成されている。

Description

【発明の詳細な説明】
【0001】 一般に、この発明はディジタル無線システムに用いられる音声符号化及び復号
化に関し、特に送信装置と受信装置との間に不連続送信を用いる電気通信システ
ムにおける所要の処理能力を減少させることのできる方法に関する。
【0002】 最新の音声符号化技術に用いられる装置においては、音声符復号器は、音声フ
レーム又はジャスト・フレームと呼ばれる期間を単位として音声信号を処理する
。ここで符復号器(codec)という用語は、音声を符号化することのできる装置
を意味する。好ましくは、それは、符号化アルゴリズムと、それを音声信号に対
して実行するための手段とを含む。音声符復号器の代表的なフレーム長さは20
msであり、それは8kHzのサンプリング周波数において160サンプルに相
当する。音声フレームは一般に10msから30msまで変化する。各音声フレ
ームは音声符号器において処理され、それらのフレームについて一定の符号化パ
ラメータが形成されて復号器へ送られる。復号器は、それらのパラメータにより
合成された音声信号を形成する。
【0003】 GSM(Global System for Mobile communications(移動通信用汎用方式)
)等のディジタルセルラー電話システム(方式)では、多くの音声符号化規格に
おいても定義されている不連続送信方法(DTX、Discontinuous Transmission
)が一般に使用される。不連続送信方法は、一般に、ユーザーが話さないとき、
即ち送信装置が送信するべきものを何も持っていないときの殆どにわたって端末
装置の送信装置部分がオフにされることを意味する。その目的は、沈黙を伝える
だけの信号を送信すると他の同時無線接続との不要な干渉を引き起こすので、端
末装置の平均電力消費量を減少させ、無線周波数の利用を改善することである。
或る調査によると、実際の音声データを含んでいるのは送信されるデータの僅か
40%に過ぎない。残りの部分は沈黙又はバックグラウンドノイズである。従っ
て、実際の音声を含んでいないフレームが除去される不連続送信方法は多くの利
益を提供する。第1に、“余分の”フレームは全く符号化されないので、符号器
の処理負荷を減少させることができる。第2に、送信されるべきフレームの数が
減らされたとき、装置の電力消費量も減らされる。更に、送信されるべきデータ
から“余分の”フレームが除去されるとき、ネットワークの負荷を減少させるこ
とができる。
【0004】 不連続送信方法では音声検出のために音声活動検出(Voice Activity Detecti
on(VAD))と呼ばれる操作が使用される。例えば、音声活動検出器が送信さ
れるべき各フレームを調べるように構成され、その調べに基づいてフレームが音
声データを含んでいるか否か断定されることとなるように音声活動検出が行われ
る。音声活動検出器の動作はその内部変数に基づいており、該検出器の出力は好
ましくは1ビットであり、それはVADフラグと呼ばれる。VADフラグの値1
は、処理されるべき音声がある状態に対応し、値0はユーザーが沈黙している状
態に対応する。フラグが上がっているときには、フレームは音声データを含んで
いて、それは送信されることができる。対応的に、VADフラグが下がっている
ときには、フレームを完全に除去することができる。
【0005】 不連続送信方法には1つの欠点がある。送信が中断されるとき、音声を含んで
いるフレーム中に存在するバックグラウンドノイズも消滅する。これは、受信端
で非常に不快な効果を引き起こすことがある。不連続送信方法では、送信の中断
が急速に且つ不規則な間隔で生じることがあり、受信装置は急速に変化する音声
レベルを不安なものとして経験する。特にバックグラウンドノイズのレベルが高
いとき、送信の中断は話を理解することをいっそう困難にすることさえある。従
って、フレームが受信端へ全く送られないときでも、送信装置のバックグラウン
ドノイズに似ている快適ノイズ(Comfort Noise(CN))と呼ばれる合成ノイ
ズを受信装置で作るのが有利である。
【0006】 快適ノイズの作成は、例えば、初めにVADフラグの値が1から0へ変化する
ときにバックグラウンドノイズを含んでいる幾つかのフレームによって実際のバ
ックグラウンドノイズのレベルを推定するように、行われる。不連続送信モード
に関する決定を行うエレメントは、それらの幾つかのフレームを音声フレームと
して受信装置へ送る。音声バーストが終わっているけれども音声フレームの送信
が未だオフにされていない期間はハングオーバー期間と呼ばれる。ハングオーバ
ー期間中に送信されるフレームは、バックグラウンドノイズにより生じるデータ
だけを含んでいるので、快適ノイズのパラメータはそれらのフレームにより安全
に決定されることができる。快適ノイズ・パラメータを受信装置へ送信するため
に沈黙記述子(Silence Descriptor (SID))フレームが有利に使用される。SI
Dフレームのパラメータの値は、定期的に、且つ少なくともバックグラウンドノ
イズのレベルが変化するときに、更新される。実際には、SIDフレームは少な
くとも次の2つの方法で使用されることができる。第1に、SIDフレームはハ
ングオーバー期間の直後に送信される。その後、SIDフレームは定期的に送信
される。この様な仕組みは、例えば、GSMシステムの音声符復号器に使用され
る。もう一つの可能性は、SIDフレームをハングオーバー期間の直後に送信し
、符号器がバックグラウンドノイズの特性の変化を検出したときに限って次のS
IDフレームを送信することである。
【0007】 理想的事態では、送信端末装置と受信端末装置との両方が同じ音声符号化方法
を使用する。この様な場合には、符号化される音声は他の符号化方法に適するよ
うに変更されなくても良い。しかし、実際には、これはしばしば必要となる。こ
の様な事態では、符号化される音声データはトランスコーダーにより別様に符号
化される。トランスコーダーは、送信装置と受信装置との間の信号路のどのポイ
ントに置かれても良い。
【0008】 従来技術のトランスコーダーは、典型的には図1に示されているように実現さ
れる。トランスコーダーの入力は、送信装置により送信される入力パラメータ1
01から成る。トランスコーダーの不連続送受信ブロック102は、受信された
パラメータが音声或いは快適ノイズを含んでいるか推定するように構成される。
フレームの内容に関する情報は、例えば、SP(Speech Present(音声存在))
フラグ103により音声符号器104に送られる。更に、フレームは音声復号器
104にも送られる。フレームの復号化方法はSPフラグ103の値に依存する
。復号化後、合成された音声又は快適ノイズがトランスコーダーの内部バッファ
ー回路105に送られる。バッファー回路105の内容の記録は、バッファー回
路105が充分な量のデータを包含したときに開始される。データが記録される
とき、始めにフレームが音声或いはバックグラウンドノイズを含んでいるか調べ
るために音声活動検出器106が使用される。フレームが含んでいるデータの質
に基づいて、音声活動検出器106はVADフラグ107を形成し、それに値を
与える。更に、それは、VADフラグ107の値と、それに到着したフレームと
をそのまま前方へ音声符号器108へ送る。VADフラグ107の値はトランス
コーダーの送信ユニット110にも与えられる。音声符号器108は、それに到
来するデータを処理し、符号化されたデータのパラメータ109を送信ユニット
110に送る。送信ユニット110は、受け取ったVADフラグ107の値に基
づいて、どのフレームをネットワークに送べきであり、且つどのフレームを送る
べきでないか調べる。信号を受け取る端末装置の受信ブロックに快適ノイズの発
生を続けさせるために、快適ノイズを含む幾つかのフレームを受信装置に送るこ
ともでき、快適ノイズを含むそれらのフレームのパラメータは、必要なときには
、音声符号器108で更新されている。
【0009】 従来技術の解決策における問題は、音声活動検出器が2回使用されるという事
実である。始めに、それは送信端末装置の符号化回路で使用され、その後に再び
トランスコーダーで使用される。実際には、このことは、従来技術の解決策では
同じ音声活動検出手続きが同じデータ・フローに対して2回実行されるので、音
声データが送信されるときに不要な計算手続きが実行されることを意味する。
【0010】 この発明の目的は、従来技術の上記問題を除去することである。
【0011】 本発明の目的は、フレームの内容の質を簡単な方法で調べる手段となるトラン
スコーダーの構成を実現することにより達成され、それで処理能力の過度の使用
が回避される。
【0012】 送信装置と受信装置との間で不連続送信方法を使用する電気通信システムにお
いて2つの異なる符号化方法を整合させる本発明の方法は、信号路において送信
装置により送信された信号が受信装置に適するものとされ: − データフレームについて、少なくとも2つの内容識別子を含む少なくとも1
つの情報パラメータが、受信されたデータ・パラメータから形成され; − 原データに対応するデータは、受信されたフレームのデータ・パラメータか
ら合成され; − その合成されたデータは、受信装置に適する符号化方法で記録されるべく送
信され; − 記録中に、フレームの少なくとも幾つかのデータ・パラメータは該内容識別
子の少なくとも1つの値に基づいて更新され; − 少なくとも1つの他の内容識別子の値に基づいて、該受信装置へ送られるべ
きフレームが、全ての記録されたデータフレームから選択されることを特徴とす
る。
【0013】 送信装置と受信装置との間で不連続送信方法を使用する電気通信システムにお
いて2つの異なる符号化方法を整合させるように構成されている本発明のネット
ワーク・エレメントは、信号路において該送信装置により送信される信号がネッ
トワーク・エレメントにより受信装置に適するようにされ、それは: − 受信されたデータ・パラメータのデータフレームについて少なくとも2つの
内容識別子を含む少なくとも1つの情報パラメータを形成するための手段と; − 受信されたフレームのデータ・パラメータから、該データの原内容に対応す
る合成されたデータを形成するための手段と; − 該受信装置に適する符号化方法で、その合成されたデータを記録するための
手段と; − 該内容識別子の少なくとも1つの値に基づいて少なくとも幾つかのフレーム
のデータ・パラメータを更新するための手段と; − 全ての記録されたデータフレームから該内容識別子の少なくとも1つの他の
値に基づいて該受信装置へ送られるべきフレームを選択するための手段とを含む
ことを特徴とする。
【0014】 本発明の好ましい実施態様が従属クレームに記載されている。
【0015】 本発明に従って、音声活動検出を実行するための手続きは、信号路から、好ま
しくはトランスコーダーから、除去される。この様な構成により、トランスコー
ダーの構造を簡単化することができ、他の目的のために処理能力をとっておくこ
とができる。フレームの内容に関する情報は、好ましくは少なくとも2つの異な
る内容識別子を含む少なくとも1つの情報パラメータによって、前方へ送信され
るべきフレームに関する決定を行うエレメントに送られる。
【0016】 次に、添付図面を参照して本発明を詳しく説明する。
【0017】 図においては、対応する部分について同じ参照番号及びマーキングが使用され
ている。図1については、従来技術の説明と関連して前述した。
【0018】 図2は、本発明のトランスコーダーの好ましい実施態様を示している。該トラ
ンスコーダーは、送信端で音声信号から形成されたパラメータ101をその入力
として受け取る。該トランスコーダーの受信ブロック102は、受け取ったデー
タを処理して、そのSPフラグ103を形成する。SPフラグ103は、受信さ
れたフレームが音声データを含むのか快適ノイズを含むのかを示す。ここで音声
データは実際の音声信号であるか或いはバックグラウンドノイズである。例えば
、SPフラグ103の値が1であるときには、そのフレームは音声データ或いは
バックグラウンドノイズを含んでおり、SPフラグ103の値が0であるときに
はそのフレームは快適ノイズを含んでいる。ここで快適ノイズを含むフレームは
上の記述に従ってSIDフレームと呼ばれる。SPフラグ103に加えて、受信
ブロック102は、受信されたフレームからHOフラグ201を決定する。その
フレームがハングオーバー期間後の第1のフレームであるならばHOフラグ20
1に値1が与えられることができ、さもなければその値は0である。ハングオー
バー期間中の送信でバックグラウンドノイズが送信されたことをHOフラグが示
すということは当業者にとっては明らかなことであり、そのバックグラウンドノ
イズにより、SIDフレームに含まれているパラメータを更新することができる
。SPフラグ103とHOフラグ201とは好ましくはバッファー回路105に
送られる。一定のフレームのSPフラグ103の値も、該フレームに含まれるデ
ータ・パラメータと共に復号器104に送られる。復号器104は、それに到達
したフレームのデータ・パラメータを復号化して合成された音声データにすると
共にその合成された音声フレーム或いは快適ノイズ・フレームを内部バッファー
回路105に送るように構成されている。復号器104により使用される復号化
方法は、好ましくは、SPフラグ103の値による。バッファー回路105の後
の音声符号器108は、バッファー回路105の中にあるHOフラグ201及び
SPフラグ103及びそれらに関連する合成されたデータフレームを読むように
構成されている。音声符号器108は、例えば従来技術の解決策と対応する方法
で、即ち充分なデータがバッファー回路105に供給されたときに、データの記
録を開始する。音声符号器108は、SIDフレームに含まれている快適ノイズ
のデータ・パラメータを更新することもできる。音声符号器108は、データか
ら形成されたパラメータ107及びSPフラグ103を送信ユニット110に送
る。送信ユニット110は、各フレームのSPフラグ103の値を調べ、少なく
とも音声データを含むフレームのパラメータを前方に送る。好ましくは、これら
のフレームに加えて、快適ノイズ・パラメータを含む幾つかのフレームが受信装
置に送られ、受信装置はそれらを使って不快な受信効果を最小限にすることがで
きる。復号器104と符号器108とが異なる符復号器を使用するように構成さ
れ得ることは当業者にとっては明らかなことである。
【0019】 2つのフラグ、SPフラグ103とHOフラグ201とは別々の内容識別子で
あるということを上で述べてあり、それらを使って、例えば、各フレームに含ま
れているデータの種類を示すことができる。該内容識別子に含まれている情報を
1つのパラメータのもとに集めることができるということは当業者にとっては明
らかなことである。この様なパラメータは、例えば、情報パラメータと呼ばれる
ことがあり、それは16進数等であって良い。情報パラメータ構成では、例えば
、該パラメータの値の第1ビットはSPフラグ103の値を示し、第2ビットは
HOフラグ201の値を示し、これらのビットの値は互いに独立して変更される
ことができる。この様に情報パラメータは1つの値を持つことができ、その値の
いろいろな部分を調べることによっていろいろな内容識別子の値を見いだすこと
ができる。必要なときには、他の対応するフラグの値を情報パラメータに含める
ことができることは当業者にとっては明らかなことであり、例えば、それらの値
は音声符号化における他の目的のために必要となることがある。情報パラメータ
は、上記の目的に適する如何なる記数法等に属することもできる。
【0020】 図3aは、フレームの内容により、本発明で使用される内容識別子即ちSPフ
ラグ103及びHOフラグ201,のモードをタイミング図の形で示している。
ここで示されている代表的実施態様では、始めの3つのフレームは音声データを
含んでおり、ここでSPフラグ103の値は1である。この実施態様では、これ
らのフレームに続いてハングオーバー期間があり、それは全部で4フレーム続き
、このときもSPフラグ103の値は1である。ハングオーバー期間の間、音声
バーストは終わっているけれども、送信は未だ中断されていない。バックグラウ
ンドノイズは該フレームで有利に送られ、それにより、バックグラウンドノイズ
から形成される快適ノイズについて新しいあり得るパラメータを定義することが
できる。実際の音声データを含むフレームの後にハングオーバー期間があるとき
、音声符号器108のために定義をするためにHOフラグ201を有利に使用し
得ることは当業者にとっては明らかなことである。このハングオーバー期間に属
するフレームはバックグラウンドノイズを含んでおり、これらのフレームに含ま
れている情報に基づいてSIDフレームの快適ノイズ・パラメータを更新するこ
とができる。SIDフレームの送信中、SPフラグ103及びHOフラグ201
の値はゼロである。音声或いはバックグラウンドノイズなどの、何らかのデータ
を含むフレームが送信されるべき信号になったとき、該フラグは上の記述に従っ
て正しい値に上がる。
【0021】 図3bは本発明のもう一つの構成のタイミング図を示しており、この場合、S
Pフラグ103及びHOフラグ201のモードは、図3aの場合とは異なる態様
で落ち着くようになっている。この代表的場合には、始めの3つのフレームは音
声データを包含していて、SPフラグ103の値は1である。この実施態様では
、それらのフレームの次にハングオーバー期間があり、それは全部で4フレーム
続き、そのときもSPフラグ103の値は1である。ハングオーバー期間中、音
声バーストは終わっているけれども、送信は未だ中断されていない。該フレーム
でバックグラウンドノイズが有利に送信され、それにより、バックグラウンドノ
イズから形成される快適ノイズについてあり得る新しいパラメータを定義するこ
とができる。この代表的実施態様では、HOフラグ201は、ハングオーバー期
間の第1フレームが送信される番になったときに立ち上がるようになっている。
ハングオーバー期間の第1フレームの識別は、例えば、受信ブロック102にお
いて計画されることができる。この代表的実施態様では、HOフラグ201は、
ハングオーバー期間後の第1SIDフレームまで立ち上がったままに保たれる。
上記フラグのモードは、それらが該フラグが使用される各アプリケーションに最
適であるように構成されることができることは当業者にとっては明らかなことで
ある。
【0022】 上記の構成は、従来技術の解決策と比べて明らかな利益を提供する。一般に、
音声活動検出のために使用されるアルゴリズムはしばしば非常に複雑であり、従
って非常に実行しにくい。1つの余分な音声活動検出をとばすことにより、信号
処理を全体として単純化することができ、そして処理能力を他の動作のためにと
っておくことができる。本発明の構成は、2つ以上のトランスコーダーが1つの
装置に統合されている場合に特に有利である。その場合、処理能力の全体として
の節約は、相当なものである。ある試験に従って、例えばGSMシステムに使用
される全速(Full Rate (FR))符復号器の場合には、音声活動検出の1決定の削
減は、処理の複雑さを相当減少させている。
【0023】 本発明の構成により提供されるもう一つの利点も、より簡単な実施と関連して
いる。即ち、音声活動検出は各符復号器で同じであるけれども、音声活動検出器
が実現される方法において違いがあって良い。従来技術の構成では、一定の符復
号器により作られる快適ノイズがもう一つの符復号器の音声活動検出器において
音声として解釈されるということがあり得るが、その場合にはシステムに不要な
負荷がかかる。特に、音声として分類されるフレームより単純な方法でノイズ等
として分類されるフレームを符復号器が符号化することがしばしばあるというこ
とに注意しなければならない。従って、ノイズを含むフレームが音声として分類
されたならば、このフレームのためにより大量の処理能力が使用され、プロセス
がより重くなる。音声活動検出をトランスコーダーから出しておくことによって
、不要な大処理力を使用させる結果をもたらすこの様な問題を回避することがで
きる。
【0024】 本発明についての上の記述では、いろいろな符復号器におけるフレーム時間は
同じであるということが仮定されている。いろいろな符復号器間のフレーム時間
が異なる場合にも本発明の構成を有利に使用することができる。例えば、20m
sのフレーム時間の符復号器Aがトランスコーダーに到来するデータのために使
用されていると仮定しよう。データがそれに送られるべきところのシステムは、
例えば30msのフレーム時間の符復号器Bを使用する。本発明の構成では、こ
の様な場合には、例えば、バッファー回路105でデータにおいてSPフラグ及
びHOフラグに10msの間隔を置かせることによって、フレーム時間の整合を
実現することができる。符復号器Aのデータが符復号器Bのデータに変更される
とき、復号器は各フレームについて2つのSP及びHOフラグをバッファー回路
105に書く。対応的に、音声符号器がバッファー回路105からデータを読む
とき、それは好ましくはフレームにつき3つのSP及びHOフラグを、即ち全部
で30msを、読む。これら3対のフラグに基づいて、トランスコーダーは新し
いフレームを音声又はノイズとして分類し、その分類に基づいてSPフラグに値
を与える。最も簡単な場合、その分類は、該SPフラグのうちの少なくとも2つ
が上がっているならば新しいSPフラグの値も1であるという基準に基づくこと
ができる。SP及びHOフラグのいろいろな組み合わせなど、他のあり得る解決
策を分類に用いることもできるということは当業者にとっては明らかなことであ
る。もしトランスコーダーが他の方向に動作するならば、復号器は3対のフラグ
をバッファー回路に書き込み、そのうち音声符号器は好ましくは1フレームにつ
き2対のフラグを読む。データ・フローにおいて該フラグを前述のとは異なる間
隔を置いて配列し得ることは当業者にとっては明らかなことである。好ましくは
、その間隔は、符復号器Aと符復号器Bとのフレームの間隔が共に該間隔で割り
切れるような間隔である。
【0025】 HOフラグの値に影響を及ぼすハングオーバー期間が符復号器によることは当
業者にとっては明らかなことである。例えば、GSMシステムのFR符復号器の
ハングオーバー期間は20msの4フレームであり、例えば規格ITU-T G.723.1
で提示されている符復号器では、ハングオーバー期間は30msの6フレームで
ある。本発明の方法では、異なるハングオーバー期間の長さに起因するあり得る
問題を回避することができる。例えば、符復号器Aのハングオーバー期間が符復
号器Bにより作られるハングオーバー期間より一時的に長くても、音声符号器は
必要なときにはハングオーバー期間の余分の部分を除去することができるので、
問題はない。一方、符復号器Aのハングオーバー期間が符復号器Bのハングオー
バー期間より一時的に短ければ、必要なときには、ハングオーバー期間を音声符
号器において増大させることができる。これは、例えば、ハングオーバー期間中
に快適ノイズを含む同じフレームを新しいフレームに対して使用することによっ
て実現されることができる。
【0026】 次の節において、GSMネットワーク等の移動通信ネットワークにおける本発
明の装置の応用について論じる。トランスコーダーは、好ましくはネットワーク
・エレメントに接続されている端末装置間に置かれる。GSMネットワークでは
、例えば、TRAU(Transcoder/Rate Adaptor Unit(トランスコーダー/レー
ト・アダプター・ユニット))と呼ばれる独立したネットワーク・エレメントが
配置されている。一般的に言って、TRAUユニットのタスクは、いろいろな信
号を使ってネットワーク同士を整合させることである。このことは、例えば、信
号転送速度がシステムに適合させられることを意味する。更に、音声は、他の音
声符号化システムを使ってそれをネットワークへ送信するのに適するようにする
ためにTRAUにおいて記録される。図4は、移動通信ネットワークにおける本
発明の好ましい実施態様でのTRAU305の位置を示している。このTRAU
305は、受信されたフレームが音声パラメータを含むのか或いは快適ノイズ・
パラメータを含むのかを示すために該パラメータからSPフラグを決定すること
ができるように受信された音声パラメータを処理するための手段308を含んで
いる。更に、TRAU305は手段308を含んでおり、これにより、ハングオ
ーバー期間後の第1フレームを示すために受信されたパラメータからHOフラグ
を決定することができる。更に、TRAU305は、例えば、予め同意された符
復号器で音声を復号化するための手段309を含んでいる。TRAU305は手
段310も含んでおり、これへ、合成された音声データ及びSP及びHOフラグ
を一時的に移動させることができる。更に、TRAU305は手段311を含ん
でおり、これにより、バッファー回路から前記情報を読み出し、その情報に従っ
て他の符復号器により記録することができ、この手段311により、必要なとき
には快適ノイズを含むフレームのパラメータを更新することができる。更に、T
RAU305は手段312を含んでおり、これへ、符号化されているデータのパ
ラメータとSPフラグとを移動させることができ、この手段312において、前
方へ送られるべきフレームを例えばSPフラグの値に基づいて選択することがで
きる。好ましい実施態様では、TRAU305は、音声データを包含しているフ
レームだけを前方へ送る。与えられた手段をマイクロプロセッサ回路等であると
理解し得ることは当業者にとっては明らかなことであり、それは、例えば、入力
されたプログラムによって上記の動作を実行する。好ましくは該マイクロプロセ
ッサはメモリーを備えており、それに、例えば音声データとフラグの値とを一時
的に蓄積しておくことができる。
【0027】 図4に示されているTRAU305は、移動通信ネットワークの基地送受信局
(BTS)304と関連して配置されている。図4は、移動通信ネットワークの
基地局コントローラ(BSC)及び移動交換センター(MSC)も示している。
図4において線301,302及び303により示されているように、該ネット
ワーク・エレメントは別々の動作ユニットである。図5は、対応するネットワー
ク・エレメントを示している。この代表的実施態様では、TRAU305は基地
局コントローラ306の直ぐ近くに配置されている。図6は、TRAU305を
独立した動作ユニットとして移動交換センター307と関連させて配置する第3
の可能性を示している。TRAU305を他の考えられるネットワーク・エレメ
ントに配置することもできることは当業者にとっては明らかなことである。本発
明のトランスコーダーをネットワーク・トポロジーにおいてどの様に置くことが
できるかを論じるとき、GSMシステムのネットワーク・エレメントはこの解説
において例として用いられている。ここで示されているものと対応する動作を実
行するために本発明のトランスコーダーをTRAU305以外の他のネットワー
ク・エレメントに、またGSM以外の他のシステムに配置し得ることは明らかで
ある。
【0028】 上で使用された用語は例として用いられているのであり、その唯一の目的は本
発明の方法の応用を明らかにすることであるあることは当業者にとっては明らか
なことである。本発明の構成をGSM以外の他のシステムに用いることもできる
。特に有利なことに、上記の方法は、添付の請求項により定義される範囲内で、
音声を符号化し復号化する如何なるシステムにも応用される。
【図面の簡単な説明】
【図1】 従来技術のトランスコーダーのブロック図である。
【図2】 本発明の1実施態様のトランスコーダーを示している。
【図3a】 フレームの内容を示すために本発明のトランスコーダーのフラグ・ビットを用
いる幾つかの可能性を示している。
【図3b】 フレームの内容を示すために本発明のトランスコーダーのフラグ・ビットを用
いる幾つかの可能性を示している。
【図4】 本発明のトランスコーダーが応用されている第1ネットワーク構成を示してい
る。
【図5】 本発明のトランスコーダーが応用されているもう一つのネットワーク構成を示
している。
【図6】 本発明のトランスコーダーが応用されている第3のネットワーク構成を示して
いる。
【手続補正書】
【提出日】平成14年1月16日(2002.1.16)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正の内容】
【特許請求の範囲】
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,MZ,SD,SL,SZ,TZ,UG ,ZW),EA(AM,AZ,BY,KG,KZ,MD, RU,TJ,TM),AE,AG,AL,AM,AT, AU,AZ,BA,BB,BG,BR,BY,BZ,C A,CH,CN,CR,CU,CZ,DE,DK,DM ,DZ,EE,ES,FI,GB,GD,GE,GH, GM,HR,HU,ID,IL,IN,IS,JP,K E,KG,KP,KR,KZ,LC,LK,LR,LS ,LT,LU,LV,MA,MD,MG,MK,MN, MW,MX,MZ,NO,NZ,PL,PT,RO,R U,SD,SE,SG,SI,SK,SL,TJ,TM ,TR,TT,TZ,UA,UG,US,UZ,VN, YU,ZA,ZW 【要約の続き】 タの少なくとも1つの他の内容識別子の値に基づいて全 ての記録されているデータ・フレームから受信装置へ送 信されるべきフレームが選択される。更に、本発明はネ ットワーク・エレメントに関し、それは、上記の方法を 実行するように構成されている。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 送信装置と受信装置との間で不連続送信方法を使用する電気
    通信システムにおいて2つの異なる符号化方法を整合させる方法であって、信号
    路において送信装置により送信された信号が受信装置に適するものとされ: データフレームについて、少なくとも2つの内容識別子を含む少なくとも1つ
    の情報パラメータが受信されたデータ・パラメータ(101)から形成され; 原データに対応するデータは、受信されたフレームのデータ・パラメータ(1
    01)から合成され; その合成されたデータは、受信装置に適する符号化方法で記録されるべく送信
    され; 記録中に、フレームの少なくとも幾つかのデータ・パラメータ(107)は該
    情報パラメータの前記内容識別子の少なくとも1つの値に基づいて更新され; − 該情報パラメータの少なくとも1つの他の内容識別子の値に基づいて、該受
    信装置へ送られるべきフレームが、全ての記録されたデータフレームから選択さ
    れることを特徴とする方法。
  2. 【請求項2】 更新されるべきフレームのデータ・パラメータ(107)は
    、バックグラウンドノイズを記述するデータ・パラメータであることを特徴とす
    る請求項1に記載の方法。
  3. 【請求項3】 該情報パラメータの前記内容識別子のうちの少なくとも1つ
    の値はハングオーバー期間後の第1フレームに関する情報を含むことを特徴とす
    る請求項1に記載の方法。
  4. 【請求項4】 該情報パラメータの前記内容識別子のうちの少なくとも1つ
    の他のものの値は、該フレームの内容に関する情報を含むことを特徴とする請求
    項1に記載の方法。
  5. 【請求項5】 送信装置と受信装置との間で不連続送信方法を使用する電気
    通信システムにおいて2つの異なる符号化方法を整合させるネットワーク・エレ
    メントであって、信号路において該送信装置により送信される信号がネットワー
    ク・エレメントにより受信装置に適するようにされ、それは: 受信されたデータ・パラメータ(101)のデータフレームについて少なくと
    も2つの内容識別子を含む少なくとも1つの情報パラメータを形成するための手
    段(308)と; 受信されたフレームのデータ・パラメータ(101)から、該データの原内容
    に対応する合成されたデータを形成するための手段(309)と; 該受信装置に適する符号化方法で、その合成されたデータを記録するための手
    段(311)と; 前記情報パラメータの内容識別子のうちの少なくとも1つの値に基づいて少な
    くとも幾つかのフレームのデータ・パラメータを更新するための手段(311)
    と; 全ての記録されたデータフレームから該情報パラメータの該内容識別子の少な
    くとも1つの他の値に基づいて該受信装置へ送られるべきフレームを選択するた
    めの手段(312)とを含むことを特徴とするネットワーク・エレメント。
  6. 【請求項6】 それはトランスコーダー/レート・アダプター・ユニット(
    TRAU)(305)であることを特徴とする請求項5に記載のネットワーク・
    エレメント。
JP2001513146A 1999-07-14 2000-07-14 音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント Expired - Fee Related JP4485724B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FI991605 1999-07-14
FI991605A FI991605A (fi) 1999-07-14 1999-07-14 Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti
PCT/FI2000/000647 WO2001008136A1 (en) 1999-07-14 2000-07-14 Method for decreasing the processing capacity required by speech encoding and a network element

Publications (2)

Publication Number Publication Date
JP2003505987A true JP2003505987A (ja) 2003-02-12
JP4485724B2 JP4485724B2 (ja) 2010-06-23

Family

ID=8555076

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001513146A Expired - Fee Related JP4485724B2 (ja) 1999-07-14 2000-07-14 音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント

Country Status (9)

Country Link
US (1) US7016834B1 (ja)
EP (1) EP1218875B1 (ja)
JP (1) JP4485724B2 (ja)
CN (1) CN1159699C (ja)
AT (1) ATE242909T1 (ja)
AU (1) AU6283900A (ja)
DE (1) DE60003326T2 (ja)
FI (1) FI991605A (ja)
WO (1) WO2001008136A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514300A (ja) * 2005-11-02 2009-04-02 ノキア コーポレイション 非アクティブユーザプレーン中のトラフィック生成
JP2010538515A (ja) * 2007-08-31 2010-12-09 ノキア コーポレイション Amr−wbdtx同期化を提供するためのシステムおよび方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
FI114129B (fi) 2001-09-28 2004-08-13 Nokia Corp Konferenssipuhelujärjestely
CN1703736A (zh) * 2002-10-11 2005-11-30 诺基亚有限公司 用于源控制可变比特率宽带语音编码的方法和装置
EP1808852A1 (en) * 2002-10-11 2007-07-18 Nokia Corporation Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs
WO2004095424A1 (ja) 2003-04-22 2004-11-04 Nec Corporation 符号変換方法及び装置とプログラム並びに記録媒体
WO2006104576A2 (en) * 2005-03-24 2006-10-05 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8209187B2 (en) * 2006-12-05 2012-06-26 Nokia Corporation Speech coding arrangement for communication networks
CN101184279B (zh) * 2007-12-11 2011-12-07 中兴通讯股份有限公司 一种实现gsm系统码型变换的方法及系统
US20100002699A1 (en) * 2008-07-01 2010-01-07 Sony Corporation Packet tagging for effective multicast content distribution
CN101783142B (zh) * 2009-01-21 2012-08-15 北京工业大学 转码方法、装置和通信设备
CN102781075B (zh) * 2011-05-12 2016-08-24 中兴通讯股份有限公司 一种降低移动终端通话功耗的方法及移动终端

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9205932D0 (en) * 1992-03-18 1992-04-29 Philips Electronics Uk Ltd Method and apparatus for editing an audio signal
US5555546A (en) * 1994-06-20 1996-09-10 Kokusai Electric Co., Ltd. Apparatus for decoding a DPCM encoded signal
FI101439B1 (fi) * 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
FI110826B (fi) 1995-06-08 2003-03-31 Nokia Corp Akustisen kaiun poisto digitaalisessa matkaviestinjärjestelmässä
FI960404A (fi) * 1996-01-29 1997-07-30 Nokia Telecommunications Oy Puheen siirto matkaviestinverkossa
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US5867574A (en) * 1997-05-19 1999-02-02 Lucent Technologies Inc. Voice activity detection system and method
FI116642B (fi) * 1998-02-09 2006-01-13 Nokia Corp Puheparametrien käsittelymenetelmä, puhekoodauksen käsittely-yksikkö ja verkkoelementti
CA2351571C (en) * 1998-11-24 2008-07-22 Telefonaktiebolaget Lm Ericsson Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009514300A (ja) * 2005-11-02 2009-04-02 ノキア コーポレイション 非アクティブユーザプレーン中のトラフィック生成
JP2010538515A (ja) * 2007-08-31 2010-12-09 ノキア コーポレイション Amr−wbdtx同期化を提供するためのシステムおよび方法

Also Published As

Publication number Publication date
ATE242909T1 (de) 2003-06-15
FI991605A (fi) 2001-01-15
CN1159699C (zh) 2004-07-28
WO2001008136A1 (en) 2001-02-01
EP1218875B1 (en) 2003-06-11
DE60003326D1 (de) 2003-07-17
EP1218875A1 (en) 2002-07-03
US7016834B1 (en) 2006-03-21
DE60003326T2 (de) 2004-05-06
AU6283900A (en) 2001-02-13
JP4485724B2 (ja) 2010-06-23
CN1364287A (zh) 2002-08-14

Similar Documents

Publication Publication Date Title
JP3826185B2 (ja) 不連続送信における音声デコーダのハングオーバー期間を評価する方法および音声エンコーダおよびトランシーバ
EP1290679B1 (en) Method and arrangement for changing source signal bandwidth in a telecommunication connection with multiple bandwidth capability
EP1074125B1 (en) Alternating speech and data transmission in digital communications systems
AU705619B2 (en) Transcoder with prevention of tandem coding of speech
US7319703B2 (en) Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
RU2242095C2 (ru) Эффективная внутриполосная передача сигналов для осуществления прерывистой передачи и изменений конфигураций систем связи с многоскоростной адаптивной передачей сигналов
JP4659216B2 (ja) 忠実度改善のためのコンフォートノイズ変動特性に基づく音声符号化
JP4624992B2 (ja) 音声チャネルを介してデータを伝送するための方法及び装置
JP2003505987A (ja) 音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント
JPH11507488A (ja) デジタル移動通信システムの音響エコーを除去する方法及び装置
JPH11503581A (ja) 移動電話システムにおいて音声周波数信号を送信する方法
JP2002503045A (ja) デコード方法、スピーチコード処理ユニット及びネットワーク要素
JP2002543636A (ja) パケット通信のヘッダ圧縮状態の更新
JP2002501225A (ja) 適応形後置フィルタを備えた復号化方法およびシステム
JP2002540441A (ja) 音声信号の改善された音声/雑音選別のための複合信号活動検出
JP3464371B2 (ja) 不連続伝送中に快適雑音を発生させる改善された方法
US20030101049A1 (en) Method for stealing speech data frames for signalling purposes
JP2002524961A (ja) 送信方法及び無線システム
JP2002524965A (ja) 送信方法及び無線システム
JP2003522982A (ja) レート決定符号化
JP5006975B2 (ja) 背景雑音情報の復号化方法および背景雑音情報の復号化手段
JP2001506470A (ja) 移動電話システムにおけるtrauフレームの識別
JP2001524279A (ja) セルラー無線システムにおける冗長情報のフィルタ除去
JP3173639B2 (ja) 背景雑音更新システムおよび方法
JPH10126858A (ja) 通信装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090820

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091119

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100225

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100325

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees