JP4485724B2 - 音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント - Google Patents
音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント Download PDFInfo
- Publication number
- JP4485724B2 JP4485724B2 JP2001513146A JP2001513146A JP4485724B2 JP 4485724 B2 JP4485724 B2 JP 4485724B2 JP 2001513146 A JP2001513146 A JP 2001513146A JP 2001513146 A JP2001513146 A JP 2001513146A JP 4485724 B2 JP4485724 B2 JP 4485724B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- frame
- encoded
- parameter
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000012545 processing Methods 0.000 title abstract description 13
- 230000005540 biological transmission Effects 0.000 claims abstract description 30
- 206010019133 Hangover Diseases 0.000 claims description 28
- 230000000694 effects Effects 0.000 description 18
- 238000001514 detection method Methods 0.000 description 10
- 238000010295 mobile communication Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Telephone Function (AREA)
Description
一般に、この発明はディジタル無線システムに用いられる音声符号化及び復号化に関し、特に送信装置と受信装置との間に不連続送信を用いる電気通信システムにおける所要の処理能力を減少させることのできる方法に関する。
【0002】
最新の音声符号化技術に用いられる装置においては、音声符復号器は、音声フレーム又はジャスト・フレームと呼ばれる期間を単位として音声信号を処理する。ここで符復号器(codec)という用語は、音声を符号化することのできる装置を意味する。好ましくは、それは、符号化アルゴリズムと、それを音声信号に対して実行するための手段とを含む。音声符復号器の代表的なフレーム長さは20msであり、それは8kHzのサンプリング周波数において160サンプルに相当する。音声フレームは一般に10msから30msまで変化する。各音声フレームは音声符号器において処理され、それらのフレームについて一定の符号化パラメータが形成されて復号器へ送られる。復号器は、それらのパラメータにより合成された音声信号を形成する。
【0003】
GSM(Global System for Mobile communications(移動通信用汎用方式))等のディジタルセルラー電話システム(方式)では、多くの音声符号化規格においても定義されている不連続送信方法(DTX、Discontinuous Transmission)が一般に使用される。不連続送信方法は、一般に、ユーザーが話さないとき、即ち送信装置が送信するべきものを何も持っていないときの殆どにわたって端末装置の送信装置部分がオフにされることを意味する。その目的は、沈黙を伝えるだけの信号を送信すると他の同時無線接続との不要な干渉を引き起こすので、端末装置の平均電力消費量を減少させ、無線周波数の利用を改善することである。或る調査によると、実際の音声データを含んでいるのは送信されるデータの僅か40%に過ぎない。残りの部分は沈黙又はバックグラウンドノイズである。従って、実際の音声を含んでいないフレームが除去される不連続送信方法は多くの利益を提供する。第1に、“余分の”フレームは全く符号化されないので、符号器の処理負荷を減少させることができる。第2に、送信されるべきフレームの数が減らされたとき、装置の電力消費量も減らされる。更に、送信されるべきデータから“余分の”フレームが除去されるとき、ネットワークの負荷を減少させることができる。
【0004】
不連続送信方法では音声検出のために音声活動検出(Voice Activity Detection(VAD))と呼ばれる操作が使用される。例えば、音声活動検出器が送信されるべき各フレームを調べるように構成され、その調べに基づいてフレームが音声データを含んでいるか否か断定されることとなるように音声活動検出が行われる。音声活動検出器の動作はその内部変数に基づいており、該検出器の出力は好ましくは1ビットであり、それはVADフラグと呼ばれる。VADフラグの値1は、処理されるべき音声がある状態に対応し、値0はユーザーが沈黙している状態に対応する。フラグが上がっているときには、フレームは音声データを含んでいて、それは送信されることができる。対応的に、VADフラグが下がっているときには、フレームを完全に除去することができる。
【0005】
不連続送信方法には1つの欠点がある。送信が中断されるとき、音声を含んでいるフレーム中に存在するバックグラウンドノイズも消滅する。これは、受信端で非常に不快な効果を引き起こすことがある。不連続送信方法では、送信の中断が急速に且つ不規則な間隔で生じることがあり、受信装置は急速に変化する音声レベルを不安なものとして経験する。特にバックグラウンドノイズのレベルが高いとき、送信の中断は話を理解することをいっそう困難にすることさえある。従って、フレームが受信端へ全く送られないときでも、送信装置のバックグラウンドノイズに似ている快適ノイズ(Comfort Noise(CN))と呼ばれる合成ノイズを受信装置で作るのが有利である。
【0006】
快適ノイズの作成は、例えば、初めにVADフラグの値が1から0へ変化するときにバックグラウンドノイズを含んでいる幾つかのフレームによって実際のバックグラウンドノイズのレベルを推定するように、行われる。不連続送信モードに関する決定を行うエレメントは、それらの幾つかのフレームを音声フレームとして受信装置へ送る。音声バーストが終わっているけれども音声フレームの送信が未だオフにされていない期間はハングオーバー期間と呼ばれる。ハングオーバー期間中に送信されるフレームは、バックグラウンドノイズにより生じるデータだけを含んでいるので、快適ノイズのパラメータはそれらのフレームにより安全に決定されることができる。快適ノイズ・パラメータを受信装置へ送信するために沈黙記述子(Silence Descriptor (SID))フレームが有利に使用される。SIDフレームのパラメータの値は、定期的に、且つ少なくともバックグラウンドノイズのレベルが変化するときに、更新される。実際には、SIDフレームは少なくとも次の2つの方法で使用されることができる。第1に、SIDフレームはハングオーバー期間の直後に送信される。その後、SIDフレームは定期的に送信される。この様な仕組みは、例えば、GSMシステムの音声符復号器に使用される。もう一つの可能性は、SIDフレームをハングオーバー期間の直後に送信し、符号器がバックグラウンドノイズの特性の変化を検出したときに限って次のSIDフレームを送信することである。
【0007】
理想的事態では、送信端末装置と受信端末装置との両方が同じ音声符号化方法を使用する。この様な場合には、符号化される音声は他の符号化方法に適するように変更されなくても良い。しかし、実際には、これはしばしば必要となる。この様な事態では、符号化される音声データはトランスコーダーにより別様に符号化される。トランスコーダーは、送信装置と受信装置との間の信号路のどのポイントに置かれても良い。
【0008】
従来技術のトランスコーダーは、典型的には図1に示されているように実現される。トランスコーダーの入力は、送信装置により送信される入力パラメータ101から成る。トランスコーダーの不連続送受信ブロック102は、受信されたパラメータが音声或いは快適ノイズを含んでいるか推定するように構成される。フレームの内容に関する情報は、例えば、SP(Speech Present(音声存在))フラグ103により音声符号器104に送られる。更に、フレームは音声復号器104にも送られる。フレームの復号化方法はSPフラグ103の値に依存する。復号化後、合成された音声又は快適ノイズがトランスコーダーの内部バッファー回路105に送られる。バッファー回路105の内容の記録は、バッファー回路105が充分な量のデータを包含したときに開始される。データが記録されるとき、始めにフレームが音声或いはバックグラウンドノイズを含んでいるか調べるために音声活動検出器106が使用される。フレームが含んでいるデータの質に基づいて、音声活動検出器106はVADフラグ107を形成し、それに値を与える。更に、それは、VADフラグ107の値と、それに到着したフレームとをそのまま前方へ音声符号器108へ送る。VADフラグ107の値はトランスコーダーの送信ユニット110にも与えられる。音声符号器108は、それに到来するデータを処理し、符号化されたデータのパラメータ109を送信ユニット110に送る。送信ユニット110は、受け取ったVADフラグ107の値に基づいて、どのフレームをネットワークに送べきであり、且つどのフレームを送るべきでないか調べる。信号を受け取る端末装置の受信ブロックに快適ノイズの発生を続けさせるために、快適ノイズを含む幾つかのフレームを受信装置に送ることもでき、快適ノイズを含むそれらのフレームのパラメータは、必要なときには、音声符号器108で更新されている。
【0009】
従来技術の解決策における問題は、音声活動検出器が2回使用されるという事実である。始めに、それは送信端末装置の符号化回路で使用され、その後に再びトランスコーダーで使用される。実際には、このことは、従来技術の解決策では同じ音声活動検出手続きが同じデータ・フローに対して2回実行されるので、音声データが送信されるときに不要な計算手続きが実行されることを意味する。
【0010】
この発明の目的は、従来技術の上記問題を除去することである。
【0011】
本発明の目的は、フレームの内容の質を簡単な方法で調べる手段となるトランスコーダーの構成を実現することにより達成され、それで処理能力の過度の使用が回避される。
【0012】
送信装置と受信装置との間で不連続送信方法を使用する電気通信システムにおいて2つの異なる符号化方法を整合させる本発明の方法は、信号路において送信装置により送信された信号が受信装置に適するものとされ:
− データフレームについて、少なくとも2つの内容識別子を含む少なくとも1つの情報パラメータが、受信されたデータ・パラメータから形成され;
− 原データに対応するデータは、受信されたフレームのデータ・パラメータから合成され;
− その合成されたデータは、受信装置に適する符号化方法で記録されるべく送信され;
− 記録中に、フレームの少なくとも幾つかのデータ・パラメータは該内容識別子の少なくとも1つの値に基づいて更新され;
− 少なくとも1つの他の内容識別子の値に基づいて、該受信装置へ送られるべきフレームが、全ての記録されたデータフレームから選択されることを特徴とする。
【0013】
送信装置と受信装置との間で不連続送信方法を使用する電気通信システムにおいて2つの異なる符号化方法を整合させるように構成されている本発明のネットワーク・エレメントは、信号路において該送信装置により送信される信号がネットワーク・エレメントにより受信装置に適するようにされ、それは:
− 受信されたデータ・パラメータのデータフレームについて少なくとも2つの内容識別子を含む少なくとも1つの情報パラメータを形成するための手段と;
− 受信されたフレームのデータ・パラメータから、該データの原内容に対応する合成されたデータを形成するための手段と;
− 該受信装置に適する符号化方法で、その合成されたデータを記録するための手段と;
− 該内容識別子の少なくとも1つの値に基づいて少なくとも幾つかのフレームのデータ・パラメータを更新するための手段と;
− 全ての記録されたデータフレームから該内容識別子の少なくとも1つの他の値に基づいて該受信装置へ送られるべきフレームを選択するための手段とを含むことを特徴とする。
【0014】
本発明の好ましい実施態様が従属クレームに記載されている。
【0015】
本発明に従って、音声活動検出を実行するための手続きは、信号路から、好ましくはトランスコーダーから、除去される。この様な構成により、トランスコーダーの構造を簡単化することができ、他の目的のために処理能力をとっておくことができる。フレームの内容に関する情報は、好ましくは少なくとも2つの異なる内容識別子を含む少なくとも1つの情報パラメータによって、前方へ送信されるべきフレームに関する決定を行うエレメントに送られる。
【0016】
次に、添付図面を参照して本発明を詳しく説明する。
【0017】
図においては、対応する部分について同じ参照番号及びマーキングが使用されている。図1については、従来技術の説明と関連して前述した。
【0018】
図2は、本発明のトランスコーダーの好ましい実施態様を示している。該トランスコーダーは、送信端で音声信号から形成されたパラメータ101をその入力として受け取る。該トランスコーダーの受信ブロック102は、受け取ったデータを処理して、そのSPフラグ103を形成する。SPフラグ103は、受信されたフレームが音声データを含むのか快適ノイズを含むのかを示す。ここで音声データは実際の音声信号であるか或いはバックグラウンドノイズである。例えば、SPフラグ103の値が1であるときには、そのフレームは音声データ或いはバックグラウンドノイズを含んでおり、SPフラグ103の値が0であるときにはそのフレームは快適ノイズを含んでいる。ここで快適ノイズを含むフレームは上の記述に従ってSIDフレームと呼ばれる。SPフラグ103に加えて、受信ブロック102は、受信されたフレームからHOフラグ201を決定する。そのフレームがハングオーバー期間後の第1のフレームであるならばHOフラグ201に値1が与えられることができ、さもなければその値は0である。ハングオーバー期間中の送信でバックグラウンドノイズが送信されたことをHOフラグが示すということは当業者にとっては明らかなことであり、そのバックグラウンドノイズにより、SIDフレームに含まれているパラメータを更新することができる。SPフラグ103とHOフラグ201とは好ましくはバッファー回路105に送られる。一定のフレームのSPフラグ103の値も、該フレームに含まれるデータ・パラメータと共に復号器104に送られる。復号器104は、それに到達したフレームのデータ・パラメータを復号化して合成された音声データにすると共にその合成された音声フレーム或いは快適ノイズ・フレームを内部バッファー回路105に送るように構成されている。復号器104により使用される復号化方法は、好ましくは、SPフラグ103の値による。バッファー回路105の後の音声符号器108は、バッファー回路105の中にあるHOフラグ201及びSPフラグ103及びそれらに関連する合成されたデータフレームを読むように構成されている。音声符号器108は、例えば従来技術の解決策と対応する方法で、即ち充分なデータがバッファー回路105に供給されたときに、データの記録を開始する。音声符号器108は、SIDフレームに含まれている快適ノイズのデータ・パラメータを更新することもできる。音声符号器108は、データから形成されたパラメータ107及びSPフラグ103を送信ユニット110に送る。送信ユニット110は、各フレームのSPフラグ103の値を調べ、少なくとも音声データを含むフレームのパラメータを前方に送る。好ましくは、これらのフレームに加えて、快適ノイズ・パラメータを含む幾つかのフレームが受信装置に送られ、受信装置はそれらを使って不快な受信効果を最小限にすることができる。復号器104と符号器108とが異なる符復号器を使用するように構成され得ることは当業者にとっては明らかなことである。
【0019】
2つのフラグ、SPフラグ103とHOフラグ201とは別々の内容識別子であるということを上で述べてあり、それらを使って、例えば、各フレームに含まれているデータの種類を示すことができる。該内容識別子に含まれている情報を1つのパラメータのもとに集めることができるということは当業者にとっては明らかなことである。この様なパラメータは、例えば、情報パラメータと呼ばれることがあり、それは16進数等であって良い。情報パラメータ構成では、例えば、該パラメータの値の第1ビットはSPフラグ103の値を示し、第2ビットはHOフラグ201の値を示し、これらのビットの値は互いに独立して変更されることができる。この様に情報パラメータは1つの値を持つことができ、その値のいろいろな部分を調べることによっていろいろな内容識別子の値を見いだすことができる。必要なときには、他の対応するフラグの値を情報パラメータに含めることができることは当業者にとっては明らかなことであり、例えば、それらの値は音声符号化における他の目的のために必要となることがある。情報パラメータは、上記の目的に適する如何なる記数法等に属することもできる。
【0020】
図3aは、フレームの内容により、本発明で使用される内容識別子即ちSPフラグ103及びHOフラグ201,のモードをタイミング図の形で示している。ここで示されている代表的実施態様では、始めの3つのフレームは音声データを含んでおり、ここでSPフラグ103の値は1である。この実施態様では、これらのフレームに続いてハングオーバー期間があり、それは全部で4フレーム続き、このときもSPフラグ103の値は1である。ハングオーバー期間の間、音声バーストは終わっているけれども、送信は未だ中断されていない。バックグラウンドノイズは該フレームで有利に送られ、それにより、バックグラウンドノイズから形成される快適ノイズについて新しいあり得るパラメータを定義することができる。実際の音声データを含むフレームの後にハングオーバー期間があるとき、音声符号器108のために定義をするためにHOフラグ201を有利に使用し得ることは当業者にとっては明らかなことである。このハングオーバー期間に属するフレームはバックグラウンドノイズを含んでおり、これらのフレームに含まれている情報に基づいてSIDフレームの快適ノイズ・パラメータを更新することができる。SIDフレームの送信中、SPフラグ103及びHOフラグ201の値はゼロである。音声或いはバックグラウンドノイズなどの、何らかのデータを含むフレームが送信されるべき信号になったとき、該フラグは上の記述に従って正しい値に上がる。
【0021】
図3bは本発明のもう一つの構成のタイミング図を示しており、この場合、SPフラグ103及びHOフラグ201のモードは、図3aの場合とは異なる態様で落ち着くようになっている。この代表的場合には、始めの3つのフレームは音声データを包含していて、SPフラグ103の値は1である。この実施態様では、それらのフレームの次にハングオーバー期間があり、それは全部で4フレーム続き、そのときもSPフラグ103の値は1である。ハングオーバー期間中、音声バーストは終わっているけれども、送信は未だ中断されていない。該フレームでバックグラウンドノイズが有利に送信され、それにより、バックグラウンドノイズから形成される快適ノイズについてあり得る新しいパラメータを定義することができる。この代表的実施態様では、HOフラグ201は、ハングオーバー期間の第1フレームが送信される番になったときに立ち上がるようになっている。ハングオーバー期間の第1フレームの識別は、例えば、受信ブロック102において計画されることができる。この代表的実施態様では、HOフラグ201は、ハングオーバー期間後の第1SIDフレームまで立ち上がったままに保たれる。上記フラグのモードは、それらが該フラグが使用される各アプリケーションに最適であるように構成されることができることは当業者にとっては明らかなことである。
【0022】
上記の構成は、従来技術の解決策と比べて明らかな利益を提供する。一般に、音声活動検出のために使用されるアルゴリズムはしばしば非常に複雑であり、従って非常に実行しにくい。1つの余分な音声活動検出をとばすことにより、信号処理を全体として単純化することができ、そして処理能力を他の動作のためにとっておくことができる。本発明の構成は、2つ以上のトランスコーダーが1つの装置に統合されている場合に特に有利である。その場合、処理能力の全体としての節約は、相当なものである。ある試験に従って、例えばGSMシステムに使用される全速(Full Rate (FR))符復号器の場合には、音声活動検出の1決定の削減は、処理の複雑さを相当減少させている。
【0023】
本発明の構成により提供されるもう一つの利点も、より簡単な実施と関連している。即ち、音声活動検出は各符復号器で同じであるけれども、音声活動検出器が実現される方法において違いがあって良い。従来技術の構成では、一定の符復号器により作られる快適ノイズがもう一つの符復号器の音声活動検出器において音声として解釈されるということがあり得るが、その場合にはシステムに不要な負荷がかかる。特に、音声として分類されるフレームより単純な方法でノイズ等として分類されるフレームを符復号器が符号化することがしばしばあるということに注意しなければならない。従って、ノイズを含むフレームが音声として分類されたならば、このフレームのためにより大量の処理能力が使用され、プロセスがより重くなる。音声活動検出をトランスコーダーから出しておくことによって、不要な大処理力を使用させる結果をもたらすこの様な問題を回避することができる。
【0024】
本発明についての上の記述では、いろいろな符復号器におけるフレーム時間は同じであるということが仮定されている。いろいろな符復号器間のフレーム時間が異なる場合にも本発明の構成を有利に使用することができる。例えば、20msのフレーム時間の符復号器Aがトランスコーダーに到来するデータのために使用されていると仮定しよう。データがそれに送られるべきところのシステムは、例えば30msのフレーム時間の符復号器Bを使用する。本発明の構成では、この様な場合には、例えば、バッファー回路105でデータにおいてSPフラグ及びHOフラグに10msの間隔を置かせることによって、フレーム時間の整合を実現することができる。符復号器Aのデータが符復号器Bのデータに変更されるとき、復号器は各フレームについて2つのSP及びHOフラグをバッファー回路105に書く。対応的に、音声符号器がバッファー回路105からデータを読むとき、それは好ましくはフレームにつき3つのSP及びHOフラグを、即ち全部で30msを、読む。これら3対のフラグに基づいて、トランスコーダーは新しいフレームを音声又はノイズとして分類し、その分類に基づいてSPフラグに値を与える。最も簡単な場合、その分類は、該SPフラグのうちの少なくとも2つが上がっているならば新しいSPフラグの値も1であるという基準に基づくことができる。SP及びHOフラグのいろいろな組み合わせなど、他のあり得る解決策を分類に用いることもできるということは当業者にとっては明らかなことである。もしトランスコーダーが他の方向に動作するならば、復号器は3対のフラグをバッファー回路に書き込み、そのうち音声符号器は好ましくは1フレームにつき2対のフラグを読む。データ・フローにおいて該フラグを前述のとは異なる間隔を置いて配列し得ることは当業者にとっては明らかなことである。好ましくは、その間隔は、符復号器Aと符復号器Bとのフレームの間隔が共に該間隔で割り切れるような間隔である。
【0025】
HOフラグの値に影響を及ぼすハングオーバー期間が符復号器によることは当業者にとっては明らかなことである。例えば、GSMシステムのFR符復号器のハングオーバー期間は20msの4フレームであり、例えば規格ITU-T G.723.1で提示されている符復号器では、ハングオーバー期間は30msの6フレームである。本発明の方法では、異なるハングオーバー期間の長さに起因するあり得る問題を回避することができる。例えば、符復号器Aのハングオーバー期間が符復号器Bにより作られるハングオーバー期間より一時的に長くても、音声符号器は必要なときにはハングオーバー期間の余分の部分を除去することができるので、問題はない。一方、符復号器Aのハングオーバー期間が符復号器Bのハングオーバー期間より一時的に短ければ、必要なときには、ハングオーバー期間を音声符号器において増大させることができる。これは、例えば、ハングオーバー期間中に快適ノイズを含む同じフレームを新しいフレームに対して使用することによって実現されることができる。
【0026】
次の節において、GSMネットワーク等の移動通信ネットワークにおける本発明の装置の応用について論じる。トランスコーダーは、好ましくはネットワーク・エレメントに接続されている端末装置間に置かれる。GSMネットワークでは、例えば、TRAU(Transcoder/Rate Adaptor Unit(トランスコーダー/レート・アダプター・ユニット))と呼ばれる独立したネットワーク・エレメントが配置されている。一般的に言って、TRAUユニットのタスクは、いろいろな信号を使ってネットワーク同士を整合させることである。このことは、例えば、信号転送速度がシステムに適合させられることを意味する。更に、音声は、他の音声符号化システムを使ってそれをネットワークへ送信するのに適するようにするためにTRAUにおいて記録される。図4は、移動通信ネットワークにおける本発明の好ましい実施態様でのTRAU305の位置を示している。このTRAU305は、受信されたフレームが音声パラメータを含むのか或いは快適ノイズ・パラメータを含むのかを示すために該パラメータからSPフラグを決定することができるように受信された音声パラメータを処理するための手段308を含んでいる。更に、TRAU305は手段308を含んでおり、これにより、ハングオーバー期間後の第1フレームを示すために受信されたパラメータからHOフラグを決定することができる。更に、TRAU305は、例えば、予め同意された符復号器で音声を復号化するための手段309を含んでいる。TRAU305は手段310も含んでおり、これへ、合成された音声データ及びSP及びHOフラグを一時的に移動させることができる。更に、TRAU305は手段311を含んでおり、これにより、バッファー回路から前記情報を読み出し、その情報に従って他の符復号器により記録することができ、この手段311により、必要なときには快適ノイズを含むフレームのパラメータを更新することができる。更に、TRAU305は手段312を含んでおり、これへ、符号化されているデータのパラメータとSPフラグとを移動させることができ、この手段312において、前方へ送られるべきフレームを例えばSPフラグの値に基づいて選択することができる。好ましい実施態様では、TRAU305は、音声データを包含しているフレームだけを前方へ送る。与えられた手段をマイクロプロセッサ回路等であると理解し得ることは当業者にとっては明らかなことであり、それは、例えば、入力されたプログラムによって上記の動作を実行する。好ましくは該マイクロプロセッサはメモリーを備えており、それに、例えば音声データとフラグの値とを一時的に蓄積しておくことができる。
【0027】
図4に示されているTRAU305は、移動通信ネットワークの基地送受信局(BTS)304と関連して配置されている。図4は、移動通信ネットワークの基地局コントローラ(BSC)及び移動交換センター(MSC)も示している。図4において線301,302及び303により示されているように、該ネットワーク・エレメントは別々の動作ユニットである。図5は、対応するネットワーク・エレメントを示している。この代表的実施態様では、TRAU305は基地局コントローラ306の直ぐ近くに配置されている。図6は、TRAU305を独立した動作ユニットとして移動交換センター307と関連させて配置する第3の可能性を示している。TRAU305を他の考えられるネットワーク・エレメントに配置することもできることは当業者にとっては明らかなことである。本発明のトランスコーダーをネットワーク・トポロジーにおいてどの様に置くことができるかを論じるとき、GSMシステムのネットワーク・エレメントはこの解説において例として用いられている。ここで示されているものと対応する動作を実行するために本発明のトランスコーダーをTRAU305以外の他のネットワーク・エレメントに、またGSM以外の他のシステムに配置し得ることは明らかである。
【0028】
上で使用された用語は例として用いられているのであり、その唯一の目的は本発明の方法の応用を明らかにすることであるあることは当業者にとっては明らかなことである。本発明の構成をGSM以外の他のシステムに用いることもできる。特に有利なことに、上記の方法は、添付の請求項により定義される範囲内で、音声を符号化し復号化する如何なるシステムにも応用される。
【図面の簡単な説明】
【図1】 従来技術のトランスコーダーのブロック図である。
【図2】 本発明の1実施態様のトランスコーダーを示している。
【図3a】 フレームの内容を示すために本発明のトランスコーダーのフラグ・ビットを用いる幾つかの可能性を示している。
【図3b】 フレームの内容を示すために本発明のトランスコーダーのフラグ・ビットを用いる幾つかの可能性を示している。
【図4】 本発明のトランスコーダーが応用されている第1ネットワーク構成を示している。
【図5】 本発明のトランスコーダーが応用されているもう一つのネットワーク構成を示している。
【図6】 本発明のトランスコーダーが応用されている第3のネットワーク構成を示している。
Claims (6)
- 送信装置と受信装置との間で不連続送信方法を使用する電気通信システムにおいて2つの異なる符号化方法を整合させる方法であって:
複数の受信され符号化されたデータフレームからの少なくとも1つのデータフレームから、少なくとも2つの内容識別子を含む情報パラメータを発生し;
前記少なくとも1つのデータフレームからの符号化されたデータ・パラメータを合成されたデータ信号へ復号化し;
前記合成されたデータ信号を符号化され合成されたデータ・パラメータ・フレームへ記録し、該記録は前記受信装置における復号器に対応する符号器を用いて実行されるものであり;
前記情報パラメータの前記少なくとも2つの内容識別子のうちの少なくとも1つに基づいて、少なくとも幾つかの前記符号化され合成されたデータ・パラメータ・フレームから少なくとも幾つかのデータ・パラメータを更新し;
前記情報パラメータの前記少なくとも2つの内容識別子のうちの他の少なくとも1つに基づいて、少なくとも幾つかの前記符号化され合成されたデータ・パラメータ・フレームを選択し、該選択された前記符号化され合成されたデータ・パラメータ・フレームを前記受信装置へ送ることを特徴とする方法。 - 少なくとも幾つかの前記符号化され合成されたデータ・パラメータ・フレームからの前記少なくとも幾つかのデータ・パラメータは、バックグラウンドノイズを記述するデータ・パラメータであることを特徴とする請求項1に記載の方法。
- 前記情報パラメータの前記少なくとも2つの内容識別子のうちの少なくとも1つはハングオーバー期間後の第1フレームに関する情報を含むことを特徴とする請求項1に記載の方法。
- 前記情報パラメータの前記少なくとも2つの内容識別子のうちの他の少なくとも1つは、前記符号化され合成されたデータ・パラメータ・フレームの内容に関する情報を含むことを特徴とする請求項1に記載の方法。
- 送信装置と受信装置との間で不連続送信方法を使用する電気通信システムにおいて2つの異なる符号化方法を整合させるネットワーク・エレメントであって、前記ネットワーク・エレメントは:
複数の受信され符号化されたデータフレームからの少なくとも1つのデータフレームから、少なくとも2つの内容識別子を含む情報パラメータを発生するように構成された発生手段(308)と;
前記少なくとも1つのデータフレームからの符号化されたデータ・パラメータを合成されたデータ信号へ復号化するように構成された復号手段(309)と;
前記受信装置における復号器に対応する符号器を用いて、前記合成されたデータ信号を符号化され合成されたデータ・パラメータ・フレームへ記録するように構成された記録手段(311)と;
前記情報パラメータの前記少なくとも2つの内容識別子のうちの少なくとも1つに基づいて、少なくとも幾つかの前記符号化され合成されたデータ・パラメータ・フレームから少なくとも幾つかのデータ・パラメータを更新するように構成された更新手段(311)と;
前記情報パラメータの前記少なくとも2つの内容識別子のうちの他の少なくとも1つに基づいて、少なくとも幾つかの前記符号化され合成されたデータ・パラメータ・フレームを選択し、該選択された前記符号化され合成されたデータ・パラメータ・フレームを前記受信装置へ送るように構成された選択・送信手段(312)とを含むことを特徴とするネットワーク・エレメント。 - 前記ネットワーク・エレメントはトランスコーダー/レート・アダプター・ユニット(TRAU)(305)であることを特徴とする請求項5に記載のネットワーク・エレメント。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI991605 | 1999-07-14 | ||
FI991605A FI991605A (fi) | 1999-07-14 | 1999-07-14 | Menetelmä puhekodaukseen ja puhekoodaukseen tarvittavan laskentakapasi teetin vähentämiseksi ja verkkoelementti |
PCT/FI2000/000647 WO2001008136A1 (en) | 1999-07-14 | 2000-07-14 | Method for decreasing the processing capacity required by speech encoding and a network element |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003505987A JP2003505987A (ja) | 2003-02-12 |
JP4485724B2 true JP4485724B2 (ja) | 2010-06-23 |
Family
ID=8555076
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001513146A Expired - Fee Related JP4485724B2 (ja) | 1999-07-14 | 2000-07-14 | 音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント |
Country Status (9)
Country | Link |
---|---|
US (1) | US7016834B1 (ja) |
EP (1) | EP1218875B1 (ja) |
JP (1) | JP4485724B2 (ja) |
CN (1) | CN1159699C (ja) |
AT (1) | ATE242909T1 (ja) |
AU (1) | AU6283900A (ja) |
DE (1) | DE60003326T2 (ja) |
FI (1) | FI991605A (ja) |
WO (1) | WO2001008136A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4518714B2 (ja) * | 2001-08-31 | 2010-08-04 | 富士通株式会社 | 音声符号変換方法 |
FI114129B (fi) | 2001-09-28 | 2004-08-13 | Nokia Corp | Konferenssipuhelujärjestely |
WO2004034379A2 (en) * | 2002-10-11 | 2004-04-22 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
EP1808852A1 (en) * | 2002-10-11 | 2007-07-18 | Nokia Corporation | Method of interoperation between adaptive multi-rate wideband (AMR-WB) and multi-mode variable bit-rate wideband (VMR-WB) codecs |
DE602004025688D1 (de) | 2003-04-22 | 2010-04-08 | Nec Corp | Codeumsetzungsverfahren und einrichtung, programm und aufzeichnungsmedium |
WO2006104555A2 (en) * | 2005-03-24 | 2006-10-05 | Mindspeed Technologies, Inc. | Adaptive noise state update for a voice activity detector |
US8045542B2 (en) | 2005-11-02 | 2011-10-25 | Nokia Corporation | Traffic generation during inactive user plane |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US8209187B2 (en) * | 2006-12-05 | 2012-06-26 | Nokia Corporation | Speech coding arrangement for communication networks |
US8090588B2 (en) * | 2007-08-31 | 2012-01-03 | Nokia Corporation | System and method for providing AMR-WB DTX synchronization |
CN101184279B (zh) * | 2007-12-11 | 2011-12-07 | 中兴通讯股份有限公司 | 一种实现gsm系统码型变换的方法及系统 |
US20100002699A1 (en) * | 2008-07-01 | 2010-01-07 | Sony Corporation | Packet tagging for effective multicast content distribution |
CN101783142B (zh) * | 2009-01-21 | 2012-08-15 | 北京工业大学 | 转码方法、装置和通信设备 |
CN102781075B (zh) * | 2011-05-12 | 2016-08-24 | 中兴通讯股份有限公司 | 一种降低移动终端通话功耗的方法及移动终端 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9205932D0 (en) | 1992-03-18 | 1992-04-29 | Philips Electronics Uk Ltd | Method and apparatus for editing an audio signal |
US5555546A (en) * | 1994-06-20 | 1996-09-10 | Kokusai Electric Co., Ltd. | Apparatus for decoding a DPCM encoded signal |
FI101439B (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
FI110826B (fi) | 1995-06-08 | 2003-03-31 | Nokia Corp | Akustisen kaiun poisto digitaalisessa matkaviestinjärjestelmässä |
FI960404A (fi) * | 1996-01-29 | 1997-07-30 | Nokia Telecommunications Oy | Puheen siirto matkaviestinverkossa |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US5867574A (en) | 1997-05-19 | 1999-02-02 | Lucent Technologies Inc. | Voice activity detection system and method |
FI116642B (fi) | 1998-02-09 | 2006-01-13 | Nokia Corp | Puheparametrien käsittelymenetelmä, puhekoodauksen käsittely-yksikkö ja verkkoelementti |
MY141074A (en) * | 1998-11-24 | 2010-03-15 | Ericsson Telefon Ab L M | Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems |
-
1999
- 1999-07-14 FI FI991605A patent/FI991605A/fi unknown
-
2000
- 2000-07-14 CN CNB008102953A patent/CN1159699C/zh not_active Expired - Fee Related
- 2000-07-14 US US10/030,667 patent/US7016834B1/en not_active Expired - Fee Related
- 2000-07-14 EP EP00949507A patent/EP1218875B1/en not_active Expired - Lifetime
- 2000-07-14 AT AT00949507T patent/ATE242909T1/de not_active IP Right Cessation
- 2000-07-14 WO PCT/FI2000/000647 patent/WO2001008136A1/en active IP Right Grant
- 2000-07-14 AU AU62839/00A patent/AU6283900A/en not_active Abandoned
- 2000-07-14 DE DE60003326T patent/DE60003326T2/de not_active Expired - Lifetime
- 2000-07-14 JP JP2001513146A patent/JP4485724B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
ATE242909T1 (de) | 2003-06-15 |
US7016834B1 (en) | 2006-03-21 |
EP1218875A1 (en) | 2002-07-03 |
AU6283900A (en) | 2001-02-13 |
DE60003326T2 (de) | 2004-05-06 |
DE60003326D1 (de) | 2003-07-17 |
CN1364287A (zh) | 2002-08-14 |
JP2003505987A (ja) | 2003-02-12 |
EP1218875B1 (en) | 2003-06-11 |
CN1159699C (zh) | 2004-07-28 |
FI991605A (fi) | 2001-01-15 |
WO2001008136A1 (en) | 2001-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4485724B2 (ja) | 音声符号化及び復号化に必要な処理能力を減少させる方法とネットワーク・エレメント | |
RU2151430C1 (ru) | Имитатор шума, управляемый детектированием активности речи | |
EP1074125B1 (en) | Alternating speech and data transmission in digital communications systems | |
US8432935B2 (en) | Tandem-free intersystem voice communication | |
JP4624992B2 (ja) | 音声チャネルを介してデータを伝送するための方法及び装置 | |
EP1290679B1 (en) | Method and arrangement for changing source signal bandwidth in a telecommunication connection with multiple bandwidth capability | |
JPH11514168A (ja) | 不連続送信における音声デコーダのハングオーバー期間を評価する方法および音声エンコーダおよびトランシーバ | |
JPH11507488A (ja) | デジタル移動通信システムの音響エコーを除去する方法及び装置 | |
IL160410A (en) | Method and system for efficiently transmitting encoded communication signals | |
JPH11503581A (ja) | 移動電話システムにおいて音声周波数信号を送信する方法 | |
JPH11331068A (ja) | ワイヤレス局セット | |
JPH11503593A (ja) | 交換機間接続のための送信装置 | |
EP0963651B1 (en) | Apparatus for storing voice messages in a wireless telephone system | |
EP2172039B1 (en) | Continued telecommunication with weak links | |
WO2002037878A2 (en) | Method and apparatus for speech quality controlled tandem operation in packet switched networks | |
US20030101049A1 (en) | Method for stealing speech data frames for signalling purposes | |
CN101622711B (zh) | 用于无声插入描述符(sid)转换的方法、系统 | |
JP2008276476A (ja) | 情報処理装置 | |
US20130155924A1 (en) | Coded-domain echo control | |
CN108429851B (zh) | 一种跨平台信源语音加密的方法及装置 | |
AU730955B2 (en) | A method of receiving signals, in particular signaling | |
JP5006975B2 (ja) | 背景雑音情報の復号化方法および背景雑音情報の復号化手段 | |
KR20050029728A (ko) | 스피치를 저장, 전송 및 재생하기 위하여 포즈 프레임을 식별하여 제외하는 방법 및 장치 | |
JPH10126858A (ja) | 通信装置 | |
JPH1065642A (ja) | 音声・データ多重化装置及び音声・データ多重化プログラムを記録した記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090820 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091119 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100225 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100325 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130402 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |