JP4004431B2 - Packet sending apparatus, index value calculation method and program for priority used in the same - Google Patents

Packet sending apparatus, index value calculation method and program for priority used in the same Download PDF

Info

Publication number
JP4004431B2
JP4004431B2 JP2003119829A JP2003119829A JP4004431B2 JP 4004431 B2 JP4004431 B2 JP 4004431B2 JP 2003119829 A JP2003119829 A JP 2003119829A JP 2003119829 A JP2003119829 A JP 2003119829A JP 4004431 B2 JP4004431 B2 JP 4004431B2
Authority
JP
Japan
Prior art keywords
block
priority
index value
packet
dividing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003119829A
Other languages
Japanese (ja)
Other versions
JP2004328354A (en
Inventor
祐介 日和▲崎▼
丈太朗 池戸
徹 森永
岳至 森
大輔 徳元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003119829A priority Critical patent/JP4004431B2/en
Publication of JP2004328354A publication Critical patent/JP2004328354A/en
Application granted granted Critical
Publication of JP4004431B2 publication Critical patent/JP4004431B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Communication Control (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、インターネットを始めとするパケット通信ネットワーク、特に今後普及するであろう音声動画データ統合ネットワークにおいて、ピーク伝送レートが高くバースト的にトラヒックが発生する一般的な「データ通信」と、遅延時間が品質劣化に直接結びついてしまう「音声通信」や「動画通信」を効率良く混在させることを可能とするパケット送出装置、これらに用いる優先度に関する指標値の算出方法及びプログラムに関する。
【0002】
【従来の技術】
従来、音声動画通信などのリアルタイム(実時間)通信をインターネットで実現する際、一定の間隔でパケットが常に伝送される必要がある。そのようなデータは通常RTP(Real Time Protocol)(例えばIETF-RFC1889:RTP:A Transport Protocol for Real-Time Applications,1996. Services Field(DS Field)in the IPv4 and IPv6 Headers,1998.参照)というプロトコル(通信手順)を用いて伝送されるが、このプロトコルはUDP(User Datagram Protocol)上に実装されているのでTCP(Transmission Control Protocol)パケットとは異なり再送が行なわれない。ネットワーク上で輻輳などの理由でパケットが破棄された場合(パケットロスが生じた場合)、受信側では音切れや画像の乱れが顕著に知覚されてしまう。
それに対して、ファイル転送やWWW(World Wide Web)などの従来からインターネットで使用されているサービスは、データのやりとりの時にのみバースト的にトラヒックが発生するイベント型の通信であり、TCPパケットとして実装されているため、もしパケット破棄が生じても再送を試みる仕組が備わっている。これはインターネットがベストエフォート型のネットワークであることに起因する。
【0003】
こうして比較すると、常にデータの伝送されている必要があるリアルタイム通信とイベント型の通信は親和性が低く、お互いに阻害する立場にあることが分る。それを解決するため、与えられたネットワークやシステム資源(音声、映像など)を用いて最大の効果が得られるように、各メディアの品質(アプリケーション品質)を調整することを、インターネットで動的に制御する技術、いわゆるインターネットQoS(Quality of Service)制御技術として、DiffServ(非特許文献1,2参照)が注目されている。この手法は特にネットワークに入るパケットを予め優先度でクラス分けしておき、ネットワーク輻輳時に各ノードで優先度の低いパケットから破棄することによって、優先度の高いパケットの送信先への到達性を向上させるという仕組みである。例えば音声動画通信に優先度を高く設定すれば、RTPのパケットロスは起きにくくなり、データ通信に低い優先度を設定してTCPの再送する機能を用いて全体的に安定した接続を実現することが可能となる。
【0004】
優先度はIP(Internet Protocol)パケットがDSドメインと呼ばれる単一の優先制御ポリシーを持つIP伝送網に到着した場合、エッジノードと呼ばれるゲートウェイで優先度のラベリングがなされ、DSドメイン内の各ノードでは、ゲートウェイで付けられた優先度で各パケットに対する輻輳時の処理がなされる。このとき優先度は従来においてはTOSフィールドと呼ばれているヘッダ部分に書き込まれるが、エッジノードは送信元アドレス、送信先アドレス、IPポート番号でそのパケットの重要度を判別する。
従来、この技術はフロー(一連の情報)毎に優先度が割当てられる仕組みとなっており、例えばファイル転送(例FTP)やWWWなどのサービスには別々の(well known)ポート番号が割当てられているため、サービスそのものを区別することが可能となっている。
【0005】
また、従来の符号化技術としては、音声の有無に着目したVAD(Voice Activity Detection)(例えば3GPP:ETSI TS 146 032,“Digital cellular telecommunications system(Phase 2+);Voice Activity Detection(VAD),2002参照)あるいはボイススイッチと呼ばれる機能があり、これを用いて伝送する必要がある有声部分と無声部分を区別することが可能であるが、条件によっては判別誤りによって品質が劣化することがある。
また、近年では音声信号ブロックを時間方向では20msあるいはそれよりも小さい単位で処理を行い、周波数帯域や品質方向に符号化データを積み重ねることによってスケーラブル(あるいはエンベデッド)な、つまり各種周波数帯域又は/及び各種品質の符号を出力することができる音声符号化器が提案されている(例えば非特許文献3、4参照)。
また、各音声ブロックの優先度を演算する方法および装置を用いることによって聴感的な品質を落さずに効率良く音声パケット伝送を可能とする技術が提案されている(例えば非特許文献5参照)。
【0006】
図12に示すように広帯域音声信号は入力端子11からの各サンプルがディジタル値とされた音声ディジタル信号(以下音声信号と記す)s[n]はこの種の一般的な符号化器と同様に5ミリ秒から20ミリ秒の単位のフレームにフレーム分割部12で分割され、(nは離散的時刻)つまりNサンプルごと、例えば32kHzサンプリングの音声信号であれば、N=160サンプルからN=640サンプルごとに分割される。更に帯域分割部16で帯域通過フィルタを用いてF個の複数帯域に分割されブロックとされる。この帯域の分割方法は、音声信号s[n]が例えば16kHzサンプリングであれば上下各4kHz帯域(F=2)に分割し、32kHzサンプリングであればF=3で0〜4kHz帯域と、4kHz〜8kHz帯域と、8kHz〜16kHz帯域というようにウェーブレットで分割しても良いし、F=4で総て等間隔に各4kHz帯域に分割しても良い。各フレームごとに帯域分割された各ブロックの音声信号は個々の符号化器で、固定時間長(フレーム)ごとに符号化される。このときの音声ブロック(パケット)の分割イメージを図13に示す。図13の例はF=3でフレームごとに各帯域の信号がそれぞれブロック(パケット)とされ、フレームごとに3つのブロック(パケット)が生成されることになる。
図12に示す例では音声信号を上、下2帯域に分割し、2つのブロックとした場合で、分離された低域音声信号s1[n]、高域音声信号s2[n]はそれぞれ低域符号化部13L 、高域符号化部13H で符号化される。また低域音声信号s1[n]、高域音声信号s2[n]はそれぞれ低域優先度決定部14L 、高域優先度決定部14H に入力され、ブロックごとのパケット優先度がそれぞれ決定される。
【0007】
低域優先度決定部14L の具体例を図14に示す。そのi番目のフレームの低域帯域のブロック(1,i)の音声信号s1[n]の特徴量を、複数の説明変数生成部141L ,142L ,143L でそれぞれ説明変数x1[1,i],x2[1,i],x3[1,i]として生成する。i番目の低域帯域の処理ブロック(1,i)の説明変数xj[1,i]として、そのブロックの音声信号s1[n]を入力して、その絶対電力を説明変数生成部141L で次式(1)を計算して求める。
x1[1,i]=(1/N)Σn=1 Ns1[Ni+n]2 (1)
あるいは、次式(2)に示すように絶対電力の対数表現としてx1[1,i]を求める。
x1[1,i]=log10((1/N)Σn=1 Ns1[Ni+n]2) (2)
説明変数生成部142L では説明変数生成部141 L よりの説明変数x1[1,i]と、前フレーム(i−1)の低域ブロック(1,i−1)の説明変数x1[1,i−1]を入力して現フレームの電力の前フレームの電力に対する比を次式(3)により計算して説明変数x2[1,i]を出力する。
x2[1,i]=x1[1,i]/(x1[1,i−1]) (3)
前フレームのそのブロックの説明変数x1[1,i−1]を前フレームバッファ142aに格納しておき、式(3)の計算を計算部142bで行い、現フレームのブロック(1,i)の説明変数x1[1,i]で前フレームバッファ142aに保持する説明変数を更新する。
【0008】
更に説明変数生成部143L では音声信号s1[n]を入力して、その自己相関関数(ρ[n])の最大値(周期性)を次式(4)により計算して説明変数x3[1,i]とする。
x3[1,i]=max(ρi[k]) (4)
ここで正規化された自己相関関数ρ[n]は、次式(5)を用いて計算する。
ρi[k]=Σn=0 N(s1[Ni+n])(s1[Ni+n+k])/
Σn=0 N(s1[Ni+n])2 (5)
kは1,2,…とし、kの最大値は音声信号s[n]のピッチ周期相当程度とする。この時、自己相関関数をアップサンプリングして、つまり補間してより正確な値を計算するようにした方が良い結果が得られる。
これら求めた説明変数x1[1,i],x2[1,i],x3[1,i]を指標値計算部144L で線形結合して指標値y[1,i]を求める。つまり例えば次式(6)、(7)を計算する。
y[1,i]=α0+Σj=1 3αjxj[1,i]^ (6)
xj[1,i]^は説明変数xjの確率分布の平均を0、分散を1に正規化したもの、つまり次式(7)で求まる。
xj[1,i]^=(xj[1,i]−xj′)/γj (7)
xj′,γjはそれぞれ説明変数xjの平均値、標準偏差である。
【0009】
これらの線形結合係数α0〜α3は重回帰分析(例えば奥野忠一他:多変量解析法(改訂版),日科技連,1981参照)を用いて事前に最適化した偏回帰係数値を用いる。例えば1つのパケット(ブロック)を消失させたときの受聴者が主観評価したMOS値をy[1,i]′とした時、このy[1,i]′と、式(6)により計算された指標値y[1,i]との誤差が最小となるように、最小自乗法を用いて、係数αjを求める。α0はMOS値1〜5の平均値である。ここでMOS値1は「非常に悪い」、MOS値5は「非常に良い」と対応する。
係数α0〜α3は、このように決められるから、αjの絶対値が大きいことはその説明変数(特徴量)がパケット(ブロック)消失時の主観評価品質に大きく影響し、αjの絶対値が小さければその説明変数(特徴量)はパケット(ブロック)消失時の主観評価品質への影響が比較的小さいことになる。つまり主観評価品質への影響度が大きい程、係数αjが大きくなるようにαjが決定されている。また指標値y[1,i]は複数の説明変数(特徴量)x1[1,i]〜x3[1,i]を係数α1〜α3を用いて線形結合させたものであるから、1つの説明変数(特徴量)のみにて、パケット(ブロック)消失の主観評価品質に与える影響の程度よりも、より正しく、影響の程度を示すことになる。主観評価品質に対して大きく影響を与えるブロック、この場合音声であるから聴感的に重要なものは指標値y[1,i]が小さくなり、重要でないものは指標値が大きくなる傾向になる。
【0010】
図14中の指標値計算部144L において、各説明変数x1〜x3はそれぞれ正規化部144a1〜144a3で正規化され、正規化説明変数x1^〜x3^は乗算部144b1〜144b3で係数α1〜α3がそれぞれ乗算され、これら乗算結果と定数α0は加算部144c1,144c2により加算されて指標値y[1,i]が出力される。
こうして求められた指標値y[1,i]は、量子化部145L でスカラ量子化され、離散的な値、例えば0,1,…,7の何れかの値の優先度p[1,i]が出力される。つまり一般的に指標値の小さいブロック(パケット)は高優先度のものへ、大きいものは低優先度のものへと写像する。写像は以下のような関数で表わすことができる。
p[1,i]=f(y[1,i]) (8)
このとき用いる写像関数f(y)は、パケットを総優先度ステップ数に写像するスカラ量子化を用いればよい。このときの量子化のしきい値は、指標値y[1,i]を等確率で分割する方法や、指標値y[1,i]の範囲を等分割するなどの方法がある。
【0011】
同様にして高域優先度決定部14H で指標値
y[2,i]=α0+Σj=1 4αjxj[2,i]^
xj[2,i]^=(xj[2,i]−xj[2]′)/γj[2]
が計算され、更に優先度p[2,i]=f2(y[2,i])が出力される。パケット送出部15は、低域符号化部13L よりの符号化符号P[1,i]と優先度p[1,i]が1つのパケットとして、また符号化部13H よりの符号化符号P[2,i]と優先度p[2,i]が1つのパケットとして送出される。
なお一般にF個に帯域分割された場合、i番目フレームf番目帯域のブロック(f,i)の指標値y[f,i]は
y[f,i]=α0+Σj=1 3αjxj[f,i]^
xj[f,i]^=(xj[f,i]−xj[f]′)/γj[f]
により計算され、優先度p[f,i]はff(y[f,i])により求められる。
【0012】
【非特許文献1】
IETF-RFC2474:Definition of the Differentiated Services Field(DS Field)in the IPv4 and IPv6 Headers,1998.
【非特許文献2】
IETF-RFC2475:An architecture for Differentiated Services,1998.
【非特許文献3】
森 岳至 他3名著 「パケット通信向け低遅延広帯域音声符号化法の検討」電子情報通信学会 2003年春季全国大会予稿集 第1分冊 327−328頁
【非特許文献4】
池戸 丈太朗 他5名著 「等間隔パルス列による雑音励振源符号帳」 電子情報通信学会 2003年春季全国大会予稿集 第173頁
【非特許文献5】
森永 徹 他2名著 「時間および帯域分割された音声ブロックの聴覚的重要度について」 音響学会2003年春季全国大会予稿集 第178頁
【0013】
【発明が解決しようとする課題】
DiffServの問題点は、高優先度のトラヒックの割合いが多い状態で輻輳が起きた場合であり、そのような時には高優先度のパケットでも破棄されるという状態が起きてしまう。今後、音声や動画伝送などのリアルタイム性を要求されるトラヒックが増加すればそのような状態になることは容易に類推できる。こうしたとき、音声の場合、従来技術のVADやボイススイッチを用いると判別誤りが起きる可能性があるため、品質劣化が起きる可能性がある。また無声部分は一切伝送されないため、臨場感のある通信は望めない。
また従来のVoIPによる音声伝送では、通常20msという時間ブロックごとに符号化処理などを行って1つのパケットとしてまとめて伝送する。20msという時間は子音の音素をまるごと含むことができるほどの長さであり、そのパケット損失が発生した場合、音素そのものが損失してしまい会話が不明瞭となる。
また、先に述べた非特許文献5に示す技術では優先度が低いパケットを破棄しても聴感的な品質の劣化が少ないが、パケットにはヘッダ情報が付加されるため、1つのブロックを1パケットに対応づけて伝送することになり、効率が悪く、このヘッダのオーバーヘッドによるトラヒックの増加が問題になる。例えばIPネットワークはヘッダが非常に大きく、圧縮効率の良い符号化方式を用いると、1ブロックの情報の符号化符号に対して、オーバーヘッドになってしまう。具体的にはIP+UDP+RTPによるパケットの場合、ヘッダは合計400バイト以上になり、一方、符号化符号は8kbit/sのビットレートとすると、20msおきに出力される符号は20バイトであり、ヘッダはペイロードの20倍となる。
【0014】
【課題を解決するための手段】
この発明のパケット送出方法の一面によれば、ディジタル信号をフレーム毎に分割し、前記フレーム毎のディジタル信号を複数の帯域のブロックに分割して帯域毎のブロックを生成し、前記各ブロック毎に、全帯域の絶対電力の総和に対する該ブロックの絶対電力の比を1つの特徴量として含む複数の特徴量を求め、前記各ブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求めて優先度に関する指標値を算出する。
【0015】
この発明のパケット送出方法の他面によれば、ディジタル信号をフレーム毎に分割し、前記フレーム毎のディジタル信号を複数の品質に基づいたブロックに分割し、前記各ブロック毎に、該ブロックの入力信号と符号化誤差信号との比の対数値を1つの特徴量として含む複数の特徴量を求め、前記各ブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求めて優先度に関する指標値の算出する。
又、この発明のパケット送出方法の更なる他面によれば、ディジタル信号をフレーム毎に分割し、前記フレーム毎のディジタル信号を複数の帯域及び複数の品質のブロックに分割し、前記各ブロック毎に、全帯域の絶対電力の総和に対する該ブロックの絶対電力の比と、該ブロックの入力信号と符号化誤差信号との比の対数値と、をそれぞれ特徴量として含む複数の特徴量を求め、前記各ブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求めて優先度に関する指標値を算出する。
【0016】
音声や動画が必ずしも聴感および視覚的に重要な情報を常に伝送しているわけではないことに着目した。例えば、音声の無音や高域部分は必ずしも常に伝送していなくとも品質への影響は少ない。また、動画でも画像状態にあまり変化がない場合、間の画像を間引いても視覚的な影響は少ない。つまり、この仕組みを更に効率良く音声動画通信で利用するために、ディジタル信号を品質や周波数帯域で分割したブロックごとに符号化し、つまりスケーラブル符号化し、各ブロックごとの符号化符号に優先度を付与し、その同じ優先度のついたブロックを1つのパケットに集約することによって伝送する。このとき、優先度は従来のようにフロー毎に一意に定まるのではなく、音声や動画像の状態に応じて動的に変化する。
前記優先度としては、ディジタル信号をフレームごとに分割し、その分割されたフレームごとのディジタル信号を符号化し、上記符号化に基づく特徴量又は/及び上記ディジタル信号の特徴量を説明変数として求め、上記説明変数の複数個を線形結合して指標値を求め、その指標値を量子化して優先度とすることが好ましい。
【0017】
【発明の実施の形態】
ネットワーク的に遠距離にある端末間のパケット通信は基幹網を経由して行われる。ここでネットワーク的に遠距離とは、物理的な距離と対応されず、伝送される際にパケットが経由するノードの数が多いことである。
図1にこの発明が適用されるシステム構成例を示す。基幹網100には他の通信網から通信を受信する入側装置(ゲートウェイ)110、他の通信網へ通信を送出する出側装置120,130が設けられている。他の通信網からの通信を受信し、他の通信網への通信を送出する両機能を備える装置(ゲートウェイ)もある。入側装置110は複数の端末210,220,230と接続することができ、出側装置120は端末240,250と接続することができ、出側装置130は端末260と、また他の基幹網140と接続することができる。
【0018】
入側装置110では例えば図2に示すように端末210,220,230から受信したパケットは分配部111で優先度ごとに分配されて優先度別バッファ1121 ,…,1124 に格納される。この例では優先度pが1〜4の場合である。これら分配された優先度ごとのパケットの複数個が1つのパケットに集約パケットとして、パケット構築部1131 ,…,1134 で集約構築される。その際に、各集約パケットは、その元のパケットの少なくとも送信元情報と受信先(宛先)情報を含む個別ヘッダHP とそのパケットのペイロードとが組とされ、1つの集約パケットに、基幹網100内の伝送に必要とする基幹網ヘッダHS が付けられる。
【0019】
例えば図3Aに示すように、端末210から端末240への優先度pが1〜4のパケットPAD1 ,…,PAD4 、端末220から端末250への優先度pが1〜4のパケットPBE1 ,…,PBE4 、端末230から端末260への優先度pが1〜4のパケットPCF1 ,…,PCF4 を受信したとする。優先度pが1のパケットを集約した集約パケットSPを構築するパケット構築部1131 では、優先度別バッファ1121 からパケットPAD1 、パケットPBE1 、パケットPCF1 を取り出し、基幹網100内の同一の出側装置120へ伝送させるものを集め、個別ヘッダ生成部113aで端末240への受信先情報を含む個別ヘッダHPDを生成し、この個別ヘッダHPDと、パケットPAD1 のペイロードとの組を作り、同様に端末250への受信先情報を含む個別ヘッダHPEとパケットPBE1 のペイロードとの組を作り、以下同様に図に示していないが、個別ヘッダとペイロードとの組を作る。
図3Bに示すように、これらの個別ヘッダペイロードの組を集めて1つのペイロード(集約ペイロード)としてこれに対し、基幹網100内を入側装置110から出側装置120への伝送に必要な基幹網ヘッダHS1をIPヘッダ生成部113bで生成して付けて1つの集約パケットSP12,1を構築する。この基幹網ヘッダHS1には優先度pが1であることを示す情報も含まれている。
【0020】
他のパケット構築部1132 ,…,1134 においても、それぞれ優先度pが2,…,4のパケットについて、各個別ヘッダHP とペイロードの組を集約し、基幹網ヘッダHS1,HS4をそれぞれ付けた集約パケットSP12,2,…,SP12,4を構築する。
基幹網100を入側装置110から出側装置130へ伝送させるパケットPCF1 ,…,PCF4 なども、それぞれ同一優先度のものを集め、その個別ヘッダとペイロードの組を集約ペイロードとし、これに基幹網ヘッダHS を付けて集約パケットSP13,1などを構築する。これらの集約パケットSPは送信部114より基幹網100内に送信される。個別ヘッダHpは受信先情報と送信元情報よりなるため、64バイト程度でよく、基幹網ヘッダHsは前述したように例えば200バイト以上であり、これと比較して個別ヘッダHpの情報量は可成り小さく、ディジタル信号をその各ブロックごとの符号のパケットとして伝送する場合と比較してヘッダのオーバーヘッドによるトラヒックの増加は著しく改善されることになる。
更にこの実施形態では各端末から送信されるパケットPAD,PBE,PCFなどはそれぞれディジタル信号がスケーラブル符号化され、所定区間ごとに同一優先度の信号ブロック符号をまとめて1つのパケットとしたものである。
【0021】
例えば図4に示すようにフレーム分割された音声信号を、F個の帯域に帯域分割部16で分割し、これら1〜F番目の帯域信号をそれぞれ符号化部131 〜13F で符号化すると共に優先度決定部141 〜14F でそれぞれ優先度を決定する。これら符号化符号P[1,i]〜P[F,i]と優先度p[1,i]〜p[F,i]をパケット集約部19に供給し、所定フレーム数ごとに、同一優先度の符号をまとめて、1つのパケットとして、送出部15より送出する。
入力音声信号s[n]を例えばウェーブレット分析を用いた0−4kHz,4kHz−8kHz,8−16kHzのF=3帯域に分割し、5msで時間方向に分割し、時間20msごとにパケット送出するものとする。各パケット送出番号tにおけるフレーム番号i=1,…,4とし、フレーム番号iの帯域番号fの信号ブロックの符号化符号をP[f,i]と、優先度をp[f,i]とそれぞれ表わす。各第t番目の送出区間における各ブロックの符号P[f,i]と優先度p[f,i]が図5Aに示すようになった場合パケット集約部19では図5Bに示すように、同じ優先度をもつブロックをそれぞれ集約してその優先度の情報を含むヘッダを持つ1つのパケットとする。この例では優先度p=4のブロック(1,2)及び(1,3)の符号P[1,2],P[1,3]をまとめ、かつその各符号P[1,2],P[1,3]の帯域−時間座標上の位置情報、つまり所定複数フレーム内のブロックの位置情報(1,2),(1,3)を優先度p=4の情報を含むヘッダを付けたパケットに組み込む。優先度p=3のパケットには符号P[2,2],P[1,4]とその位置情報(2,2),(1,4)を組み込み、優先度3の情報を含むヘッダを付けて1つのパケットとする。以下同様に同一優先度の符号をまとめ、その位置情報と共に1つのパケットとして組み込む。
【0022】
こうして同一の優先順位をもつ符号が集約されたパケットは、この例では20ms毎にネットワークへと送出される。このとき、ネットワークの状況に応じて、優先度が低いパケットは品質への影響が少ないので、送出しなくても良い。また、ネットワークの各ノードにおいてトラフィックの混雑状況に応じて低い優先度のパケットは破棄されても通信品質への影響は最小限に留められる。
基幹網100内を伝送され、出側装置120に受信された集約パケットSPは例えば図6に示すように、パケット分解部121でそのペイロードは各受信端末ごとに分解され、その分解されたペイロードをペイロードとし、これにヘッダHを付けて各1つのパケットにパケット再構成部122で行って、対応端末へ送信部123により送信する。
例えば図3に示した例では、図7Aに示す集約パケットSP12,1,…,SP12,4が出側装置120に受信される。集約パケットSP12,1はそのペイロードはその各個別ヘッダHPEに基づき、図7Bに示すように受信先情報が端末240に対する情報、つまり図3A中のパケットPAD1 のペイロードと、受信先情報が端末250に対する情報、つまり図3A中のパケットPBE1 のペイロードに分解され、端末220への情報に、その集約パケットSP12,1の優先度を含むヘッダを付けてパケットPAD1 を再構成し、また端末230への情報にヘッダを付けてパケットPBE1 を再構成する。
【0023】
前述したように、この実施形態では、端末から送出されるパケットは同一優先度のブロック符号がまとめられたものである。従って受信端末において図8に示すようにパケット分解部21でt番目の送出区間の全てのパケット、図5の場合は優先度p=1〜p=4の4つのパケットP[1,t]〜P[4,t]を図5に示した組み立てと逆の手順を経て帯域−時間座標上に再構成し、各帯域符号P[1,i]〜P[F,i]を復号化部221 〜22F でそれぞれ帯域音声復号に復号する。このとき、受信側に到達しなかった低い優先度の符号がある場合は、基本的にはその符号に対する復号化部の動作を停止する。高優先度の符号が到達しない場合は、フレーム(ブロック)消失対策をブロック消失補償部231 〜23F の対応する部分で行い、品質低下を避ける。このようにして復号され、必要に応じて消失補償された各帯域音声信号は帯域合成部24で合成されて再生音声信号s[n]として出力される。なおパケット分解部21よりブロック消失情報がブロック消失補償部231 〜23F へ供給されている。このブロック消失補償は公知の技術により行えばよい。
【0024】
変形例
図12に示したように帯域分割してブロックとする場合、その説明変数として更に、4[1,i]を加えてもよい。即ち図14中に破線で示すように説明変数生成部146L でこの帯域の絶対電力x1[f,i]と、他帯域の絶対電力とが入力されてこの帯域の絶対電力の総電力に対する比が次式(9)により計算され、説明変数x4[f,i]として出力される。
x4[f,i]=x1[f,i]/Σf=1 Fx1[f,i] (9)
図14の例ではF=2であるから、低域のx1[1,i]と高域のx1[2,i]により
x4[1,i]=x1[1,i]/(x1[1,i]+x1[2,i])
が計算される。
指標値計算部144L で説明変数x1[1,i],x2[1,i],x3[1,i],x4[1,i]が線形結合され、次式による指標値y[1,i]が計算され、更に量子化されて優先度p[1,i]が出力される。
y[1,i]=α0+Σj=1 4αjxj[1,i]^
xj[1,i]^=(xj[1,i]−xj[1]′)/γj[1]
ブロック分割は品質に基づき行ってもよい。この場合の音声ブロック(パケット)の分割イメージは図13中に括弧書きで品質qとフレームとの関係を示すようになる。またQ=2段構成の、一般的な固定処理時間単位で音声信号を符号化する場合の機能構成を図9に示す。
【0025】
音声信号s[n]はフレーム分割部12でフレーム単位で分割され、1段目符号化部131 でフレームごとに符号化されると共に1段目優先度決定部141 で優先度p[1,i]が決定される。1段目符号化部131 よりの符号化符号P[1,i]は1段目復号化部171 で復号化され、この復号化信号が音声信号から減算部181 で差し引かれて、1段目の残差信号(符号化誤差信号)e1[n]が生成される。この残差信号は2段目符号化部132 でフレームごとに符号化されると共に2段目優先度決定部142 で優先度p2[2,i]が決定される。2段目符号化部132 よりの符号化符号P[2,i]は2段目復号化部172 で復号化され、その復号化信号が、1段目の残差信号e1[n]から減算部182 で差し引かれて2段目残差信号e2[n]が生成される。
1段目優先度決定部141 の具体例を図10に示す。図14に示した優先度決定部14L と同様に、絶対電力の説明変数x1[1,i]と前フレーム電力比の説明変数x2[1,i]と、自己相関関数最大値の説明変数x3[1,i]とがそれぞれ説明変数生成部1411 と1421 と1431 で生成される。更に説明変数生成部14で符号P[1,i]の品質、例えば信号に対する雑音比が説明変数x5[1,i]として生成される。即ち信号電力計算部147aでS=Σn=1 Ns[Ni+n]2 が計算され、また雑音計算部147bでE=Σn=1 Ne1[Ni+n]2が計算され、これらの比の対数log10 E/Sが対数割算部147cで計算され、その結果が説明変数x5[1,i]として出力される。
【0026】
これら4個の説明変数は指標計算部1441 で線形結合されて指標値y[1,i]が計算される。例えば先の場合と同様に正規化部144aj(j=1,…,4)で説明変数xj[1,i]がそれぞれ正規化され、その正規化値xj[1,i]^が線形結合y[1,i]=α0+Σj=1 4αjxj[1,i]^,xj[1,i]^=(xj[1,i]−xj[1]′)γjされる。この指標値y[1,i]は量子化部1451 で量子化され、1段目優先度p[1,i]が出力される。
2段目優先度p[2,i]も同様に求められる。この場合は図10中に括弧書きで示しているように、1段目残差信号e1[n]の代りに2段目残差信号e2[n]がそれぞれ入力され、これら信号に対して同様に処理され、2段目優先度p[2,i]が出力される。
【0027】
パケット送出部15(図)では1段目符号P[1,i]と優先度p[1,i]を1つのパケットとし、2段目符号P[2,i]と優先度p[2,i]を1つのパケットとして出力する。
この説明変数x5[q,i](q=1,2,…,Q)は、符号化に基づく特徴量といえる。これを求める計算式は一般的に示すと以下となる。
x5[q,i]=log10n=1 Neq[Ni+n]2 /Σn=1 Ns[Ni+n]2)
この場合の線形結合係数α5は−0.1程度が考えられる。qが大きいものは高品質の信号の再生には必要であるが、トラヒックが輻輳している状態では品質よりも伝送される情報の意味内容がより重要であるから、qが大きいパケットはx5[q,i]が小さくなり、かつα5が比較的小さいから優先度にあまり関与しないようになる。
【0028】
一般的なスケーラブル複数帯域符号化器の場合は、説明変数x1[f,i],x2[f,i],x3[f,i],x4[f,i],x5[q,i]を用いて指標値y[f,q,i]の演算を行なう。このときの音声ブロック(パケット)の分割イメージを図11に示す。
つまり各種サンプリング周波数、各種サンプル量子化精度(振幅ビット数)の組合せをもつ各品質の音声信号に符号化する、いわゆるスケーラブル符号化の場合で、図11はサンプリング周波数は3段階、量子化精度(品質)も3段階とした場合で周波数帯域がf=1,f=2,f=3の3帯域に分割され、振幅ビット長がq=1,q=2,q=3の3領域に分割され、互いに直交する周波数軸(帯域番号)と品質軸(振幅ビット分割番号)と時間軸(フレーム番号)で表わされていた3次元空間における1つの信号ブロック(パケット)として[f,q,i]で識別される。
この場合の各説明変数はそれぞれ次式で求める。帯域f、品質(ビット分割番号)qの音声信号をsfqと表わす。
x1[f,q,i]=(1/N)Σn=1 Nsfq[Ni+n]2
又はx1[f,q,i]=log10((1/N)Σn=1 Nsfq[Ni+n]2
x2[f,q,i]=x1[f,q,i]/x1[f,q,i−1]
x3[f,q,i]=max(ρf,q,i[k])
ρf,q,i[k]=Σn=0 N(sfq[Ni+n])(sfq[Ni+n+k])
/Σn=0 N(sfq[Ni+n])2
x4[f,q,i]=x1[f,q,i]/Σf=1 Fx1[f,q,i]
x5[f,q,i]=log10n=1 Nefq[Ni+n]2 /Σn=1 Nsfq[Ni+n]2)
指標値y[f,q,i]=α0+Σj=1 5αjxj[f,q,i]
優先度p[f,q,i]=ff,q(y[f,q,i])
【0029】
このようにして決定された優先度p[f,q,i]と対応する符号化符号P[f,q,i]とを1つの組とする。この場合も所定のフレーム数ごとに、同一優先度のブロック符号をその位置情報と共にまとめて1つのパケットとして送出する。
上述ではこの発明を音声信号に適用したが、音楽信号、映像信号にも適用できる。また符号化に基づく特徴量の説明変数としては次のものなども考えられる。例えば、予測符号化を用いた音声符号化器によっては語頭などのパケットが破棄されると、その後の音声品質(SN比)が著しく劣化する可能性がある。そのような破棄されることによって伝播するSN比の劣化も説明変数xj(m,i)としてもよい。音声信号の特徴量の説明変数、符号化に基づく特徴量の説明変数の何れも上述した例に限らず、各種のものを使用することができる。
上述した端末、入側装置、出側装置はコンピュータにより機能させることもできる。その場合はその装置としてコンピュータを機能させるためのプログラムを、CD−ROM、磁気ディスクなどの記録媒体から当該装置のコンピュータにインストールし、あるいは通信回線を介してダウンロードして実行させればよい。
【0030】
【発明の効果】
この発明によればパケットに優先度を付けて伝送するため、ネットワークに輻輳が起きていない場合は通常の通信と同じように品質は最高品質で伝送が可能となる。これに対し、ネットワークに輻輳が起きた場合、優先度の低いパケットは破棄が起きるが品質の劣化は最低限に抑えることも可能である。こうすることによって全体的にネットワークの効率的な利用が可能となる。このような仕組には、狭帯域音声通信ではペイロードがヘッダより小さいためヘッダなどのオーバーヘッドをある程度考慮する必要があるが、ネットワーク側で集約や分配をヘッダのオーバヘッドによるトラヒックの増加が抑圧される。また、広帯域楽音通信や動画通信はパケットのペイロードの大きさがヘッダよりも大きくなるので、集約や分配の仕組を使わなくともネットワークを有効に使用することができる。
【図面の簡単な説明】
【図1】この発明が適用されるネットワークの例を示す図。
【図2】図1中の入側装置110の機能構成例を示す図。
【図3】図1中の入側装置110における複数の受信パケットと集約した集約パケットの例を示す図。
【図4】端末におけるパケット送出装置の機能構成例を示す図。
【図5】図4中のパケット集約部19における集約の様子の例を示す図。
【図6】図1中の出側装置120の機能構成例を示す図。
【図7】出側装置における集約パケットと分解再生成されたパケットの例を示す図。
【図8】端末におけるパケット受信装置の機能構成例を示す図。
【図9】パケット送出装置の他の機能構成例を示すブロック図。
【図10】図9中の1段目優先度決定部141 の具体的機能構成例を示すブロック図。
【図11】品質−帯域−時間の3次元座標に信号をブロック分割する例を示す図。
【図12】従来のパケット送出装置の機能構成例を示すブロック図。
【図13】帯域−時間の2次元座標に信号をブロック分割する例を示す図。
【図14】図12中の低域優先度決定部14L の具体的機能構成例を示すブロック図。
[0001]
BACKGROUND OF THE INVENTION
  The present invention relates to a general “data communication” in which a peak transmission rate is high and traffic is generated in a burst manner in a packet communication network including the Internet, particularly an audio-video data integrated network that will be widely used in the future, and a delay time. Packet transmission that enables efficient mixing of "voice communication" and "video communication" that directly leads to quality degradationDevice, index value calculation method for priority used in these devicesAnd the program.
[0002]
[Prior art]
Conventionally, when real-time (real-time) communication such as audio-video communication is realized on the Internet, packets need to be transmitted at regular intervals. Such data is usually a protocol called RTP (Real Time Protocol) (see, for example, IETF-RFC1889: RTP: A Transport Protocol for Real-Time Applications, 1996. Services Field (DS Field) in the IPv4 and IPv6 Headers, 1998)). Although it is transmitted using (communication procedure), since this protocol is implemented on UDP (User Datagram Protocol), retransmission is not performed unlike a TCP (Transmission Control Protocol) packet. When a packet is discarded on the network due to congestion or the like (when a packet loss occurs), sound interruption and image disturbance are perceived remarkably on the receiving side.
In contrast, services that have been used on the Internet, such as file transfer and WWW (World Wide Web), are event-type communications that generate traffic in bursts only when data is exchanged, and are implemented as TCP packets. Therefore, there is a mechanism for attempting retransmission even if a packet is discarded. This is because the Internet is a best-effort network.
[0003]
From this comparison, it can be seen that real-time communication and event-type communication, which always require data transmission, have low affinity and are in a position to inhibit each other. In order to solve this problem, it is possible to dynamically adjust the quality of each media (application quality) on the Internet so that the maximum effect can be obtained using the given network and system resources (voice, video, etc.). DiffServ (see Non-Patent Documents 1 and 2) is attracting attention as a control technology, so-called Internet QoS (Quality of Service) control technology. This method improves the reachability of high priority packets to the destination by classifying packets entering the network according to priority in advance and discarding packets with low priority at each node during network congestion. It is a mechanism of letting. For example, if a high priority is set for audio-video communication, RTP packet loss is unlikely to occur, and a low priority is set for data communication, and a stable connection is realized using a TCP retransmission function. Is possible.
[0004]
When the IP (Internet Protocol) packet arrives at an IP transmission network having a single priority control policy called a DS domain, the priority is labeled at a gateway called an edge node, and each node in the DS domain The processing at the time of congestion for each packet is performed with the priority assigned by the gateway. At this time, the priority is conventionally written in a header portion called a TOS field, but the edge node determines the importance of the packet by the source address, destination address, and IP port number.
Conventionally, this technique has a mechanism in which a priority is assigned to each flow (a series of information). For example, services such as file transfer (eg FTP) and WWW are assigned different (well known) port numbers. Therefore, it is possible to distinguish the service itself.
[0005]
Further, as a conventional coding technique, VAD (Voice Activity Detection) focusing on the presence or absence of speech (for example, 3GPP: ETSI TS 146 032, “Digital cellular telecommunications system (Phase 2+); Voice Activity Detection (VAD), 2002) There is a function called a voice switch, and it is possible to distinguish between voiced and unvoiced parts that need to be transmitted using this function, but depending on the conditions, quality may deteriorate due to discrimination errors.
In recent years, a speech signal block is processed in units of 20 ms or less in the time direction, and encoded data is stacked in the frequency band or quality direction, thereby being scalable (or embedded), that is, various frequency bands and / or Speech encoders that can output codes of various qualities have been proposed (see, for example, Non-Patent Documents 3 and 4).
In addition, a technique has been proposed that enables efficient voice packet transmission without degrading auditory quality by using a method and apparatus for calculating the priority of each voice block (see, for example, Non-Patent Document 5). .
[0006]
As shown in FIG. 12, a wideband audio signal is an audio digital signal (hereinafter referred to as an audio signal) s [n] in which each sample from the input terminal 11 is a digital value, as in this type of general encoder. If the frame is divided into frames of 5 to 20 milliseconds by the frame dividing unit 12 (n is a discrete time), that is, every N samples, for example, a sound signal of 32 kHz sampling, N = 160 samples to N = 640 Divided for each sample. Further, the band dividing unit 16 divides the signal into F multiple bands using a band pass filter to form blocks. For example, if the audio signal s [n] is 16 kHz sampling, the band is divided into upper and lower 4 kHz bands (F = 2), and if it is 32 kHz sampling, F = 3 and the 0 to 4 kHz band and 4 kHz to 4 kHz. It may be divided by wavelets such as 8 kHz band and 8 kHz to 16 kHz band, or may be divided into 4 kHz bands at equal intervals with F = 4. The audio signal of each block divided into bands for each frame is encoded for each fixed time length (frame) by an individual encoder. FIG. 13 shows a divided image of the voice block (packet) at this time. In the example of FIG. 13, F = 3 and the signal of each band is made into a block (packet) for each frame, and three blocks (packets) are generated for each frame.
In the example shown in FIG. 12, the audio signal is divided into two upper and lower bands to form two blocks, and the separated low frequency audio signal s1 [n] and high frequency audio signal s2 [n] Encoding unit 13LThe high frequency encoding unit 13HIt is encoded with. Further, the low frequency audio signal s1 [n] and the high frequency audio signal s2 [n] are respectively assigned to the low frequency priority determining unit 14L, High frequency priority determination unit 14HThe packet priority for each block is determined.
[0007]
  Low frequency priority determination unit 14L A specific example is shown in FIG. The feature quantity of the audio signal s1 [n] of the block (1, i) in the low band of the i-th frame is converted into a plurality of explanatory variable generators 141.L 142L , 143L Are generated as explanatory variables x1 [1, i], x2 [1, i], x3 [1, i], respectively. As the explanatory variable xj [1, i] of the processing block (1, i) of the i-th low-frequency band, the audio signal s1 [n] of that block is input, and the absolute power is input to the explanatory variable generating unit 141.L The following equation (1) is calculated and obtained.
    x1 [1, i] = (1 / N) Σn = 1 Ns1 [Ni + n]2            (1)
  Alternatively, as shown in the following equation (2), x1 [1, i] is obtained as a logarithmic expression of absolute power.
    x1 [1, i] = logTen((1 / N) Σn = 1 Ns1 [Ni + n]2(2)
  Explanation variable generator 142L Then, the explanatory variable generation unit 141 L Input explanatory variable x1 [1, i] and the explanatory variable x1 [1, i-1] of the low-frequency block (1, i-1) of the previous frame (i-1). The ratio to the power of the previous frame is calculated by the following equation (3), and the explanatory variable x2 [1, i] is output.
    x2 [1, i] = x1 [1, i] / (x1 [1, i-1]) (3)
  The explanatory variable x1 [1, i-1] of the block of the previous frame is stored in the previous frame buffer 142a, the calculation of Expression (3) is performed by the calculation unit 142b, and the block (1, i) of the current frame is calculated. The explanatory variable held in the previous frame buffer 142a is updated with the explanatory variable x1 [1, i].
[0008]
Further, the explanatory variable generation unit 143LThen, the speech signal s1 [n] is input, and the maximum value (periodicity) of the autocorrelation function (ρ [n]) is calculated by the following equation (4) to be an explanatory variable x3 [1, i].
x3 [1, i] = max (ρi[k]) (4)
Here, the normalized autocorrelation function ρ [n] is calculated using the following equation (5).
ρi[k] = Σn = 0 N(S1 [Ni + n]) (s1 [Ni + n + k]) /
Σn = 0 N(S1 [Ni + n])2                                    (5)
k is 1, 2,..., and the maximum value of k is approximately equivalent to the pitch period of the audio signal s [n]. At this time, a better result can be obtained by up-sampling the autocorrelation function, that is, by interpolating and calculating a more accurate value.
The calculated explanatory variables x1 [1, i], x2 [1, i], x3 [1, i] are used as the index value calculation unit 144.LTo obtain an index value y [1, i]. That is, for example, the following equations (6) and (7) are calculated.
y [1, i] = α0 + Σj = 1 Threeαjxj [1, i] ^ (6)
xj [1, i] ^ is obtained by normalizing the probability distribution of the explanatory variable xj to 0 and the variance to 1, that is, the following equation (7).
xj [1, i] ^ = (xj [1, i] −xj ′) / γj (7)
xj ′ and γj are the average value and standard deviation of the explanatory variable xj, respectively.
[0009]
As these linear combination coefficients α0 to α3, partial regression coefficient values optimized in advance using multiple regression analysis (see, for example, Taichi Okuno et al .: Multivariate analysis method (revised version), Nikka Giren, 1981) are used. For example, when the MOS value subjectively evaluated by the listener when erasing one packet (block) is y [1, i] ′, this y [1, i] ′ is calculated by Equation (6). The coefficient αj is obtained using the method of least squares so that the error from the index value y [1, i] is minimized. α0 is an average value of MOS values 1 to 5. Here, MOS value 1 corresponds to “very bad” and MOS value 5 corresponds to “very good”.
Since the coefficients α0 to α3 are determined in this way, the fact that the absolute value of αj is large greatly affects the subjective evaluation quality when the explanatory variable (feature) is lost in the packet (block), and the absolute value of αj is small. For example, the explanatory variable (feature amount) has a relatively small influence on the subjective evaluation quality when the packet (block) is lost. That is, αj is determined so that the coefficient αj increases as the degree of influence on the subjective evaluation quality increases. The index value y [1, i] is obtained by linearly combining a plurality of explanatory variables (feature quantities) x1 [1, i] to x3 [1, i] using coefficients α1 to α3. Only the explanatory variable (feature amount) indicates the degree of influence more correctly than the degree of influence of the packet (block) loss on the subjective evaluation quality. A block that greatly affects the subjective evaluation quality. In this case, since the sound is important, the index value y [1, i] is small for those that are audibly important, and the index value tends to be large for those that are not important.
[0010]
The index value calculation unit 144 in FIG.L, The explanatory variables x1 to x3 are normalized by the normalizing units 144a1 to 144a3, respectively, and the normalized explanatory variables x1 ^ to x3 ^ are respectively multiplied by the coefficients α1 to α3 by the multiplying units 144b1 to 144b3. The constant α0 is added by the adders 144c1 and 144c2, and the index value y [1, i] is output.
The index value y [1, i] obtained in this way is the quantization unit 145.LAnd the priority p [1, i] of any one of discrete values, for example, 0, 1,..., 7 is output. That is, generally, a block (packet) with a small index value is mapped to a high-priority block, and a large index value is mapped to a low-priority block. The mapping can be expressed by the following function.
p [1, i] = f (y [1, i]) (8)
The mapping function f (y) used at this time may use scalar quantization that maps the packet to the total priority step number. The quantization threshold at this time includes a method of dividing the index value y [1, i] with equal probability and a method of equally dividing the range of the index value y [1, i].
[0011]
Similarly, the high frequency priority determination unit 14HIndex value at
y [2, i] = α0 + Σj = 1 Fourαjxj [2, i] ^
xj [2, i] ^ = (xj [2, i] −xj [2] ′) / γj [2]
Is calculated, and priority p [2, i] = f2(y [2, i]) is output. The packet sending unit 15 includes a low frequency encoding unit 13LEncoding code P [1, i] and priority p [1, i] from one packet, and encoding unit 13HThe encoded code P [2, i] and the priority p [2, i] are transmitted as one packet.
In general, when the band is divided into F, the index value y [f, i] of the block (f, i) of the i-th frame and the f-th band is
y [f, i] = α0 + Σj = 1 Threeαjxj [f, i] ^
xj [f, i] ^ = (xj [f, i] −xj [f] ′) / γj [f]
And the priority p [f, i] is ff(y [f, i]).
[0012]
[Non-Patent Document 1]
IETF-RFC2474: Definition of the Differentiated Services Field (DS Field) in the IPv4 and IPv6 Headers, 1998.
[Non-Patent Document 2]
IETF-RFC2475: An architecture for Differentiated Services, 1998.
[Non-Patent Document 3]
Takeshi Mori and 3 other authors "Study of low-delay wideband speech coding method for packet communications" IEICE 2003 Annual Meeting Proceedings Vol. 327-328
[Non-Patent Document 4]
Taketaro Ikedo and 5 other authors “Noise Excitation Source Codebook Using Equally-spaced Pulse Trains” Proceedings of the 2003 IEICE Spring Conference, page 173
[Non-Patent Document 5]
Toru Morinaga and two other authors “On the auditory importance of time- and band-divided speech blocks” Proceedings of the Acoustical Society of Japan 2003 Spring, page 178
[0013]
[Problems to be solved by the invention]
  The problem with DiffServ is when congestion occurs with a high percentage of high-priority traffic. In such a case, a high-priority packet is discarded. In the future, if traffic that requires real-time performance such as voice and moving image transmission increases, it can be easily inferred that such a state will occur. In such a case, in the case of voice, there is a possibility that a determination error may occur if a conventional VAD or voice switch is used, so that quality degradation may occur. In addition, since the silent part is not transmitted at all, it is not possible to expect a realistic communication.
  In the conventional voice transmission by VoIP, encoding processing is performed for each time block of 20 ms, and the packets are transmitted as a single packet. The time of 20 ms is long enough to contain the entire phoneme of the consonant, and when the packet loss occurs, the phoneme itself is lost and the conversation becomes unclear.
  Further, in the technique described in Non-Patent Document 5 described above, even if a packet having a low priority is discarded, the perceptual quality degradation is small. However, since header information is added to the packet, one block is set to 1 The transmission is performed in association with the packet, so that the efficiency is low, and an increase in traffic due to the overhead of the header becomes a problem. For example, an IP network has a very large header, and if an encoding method with good compression efficiency is used, it becomes an overhead for an encoding code of one block of information. Specifically, if the packet is IP + UDP + RTP, the header is total400On the other hand, if the encoded code has a bit rate of 8 kbit / s, the code output every 20 ms is 20 bytes, and the header is 20 times the payload.
[0014]
[Means for Solving the Problems]
  According to one aspect of the packet transmission method of the present invention,A digital signal is divided for each frame, the digital signal for each frame is divided into a plurality of band blocks, and a block for each band is generated. A plurality of feature amounts including an absolute power ratio as one feature amount are obtained, and for each of the blocks, a linear combination of the plurality of feature amounts is obtained as an index value relating to the priority of the block, and an index value relating to the priority is obtained. calculate.
[0015]
  According to another aspect of the packet transmission method of the present invention,The digital signal is divided for each frame, the digital signal for each frame is divided into blocks based on a plurality of qualities, and the logarithmic value of the ratio between the input signal of the block and the encoding error signal is calculated for each block. A plurality of feature amounts included as one feature amount are obtained, and for each block, a linear combination of the plurality of feature amounts is obtained as an index value related to the priority of the block, and an index value related to the priority is calculated.
  According to still another aspect of the packet transmission method of the present invention, the digital signal is divided into frames, the digital signal for each frame is divided into a plurality of bands and a plurality of quality blocks, and each block is divided. A plurality of feature amounts each including a ratio of the absolute power of the block to the sum of absolute powers of all bands and a logarithmic value of the ratio of the input signal of the block and the encoding error signal, respectively, as feature amounts; For each block, a linear combination of the plurality of feature quantities is obtained as an index value related to the priority of the block, and an index value related to the priority is calculated.
[0016]
We focused on the fact that audio and video do not always transmit auditory and visually important information. For example, sound silence and high-frequency parts are not necessarily transmitted even if they are not always transmitted. In addition, when there is not much change in the image state even with a moving image, even if the image between them is thinned, there is little visual influence. In other words, in order to use this mechanism in audio-video communications more efficiently, digital signals are encoded for each block divided by quality and frequency band, that is, scalable encoding is performed, and priority is given to the encoding code for each block. Then, the blocks having the same priority are transmitted by aggregating them into one packet. At this time, the priority is not uniquely determined for each flow as in the prior art, but dynamically changes according to the state of the voice or moving image.
As the priority, the digital signal is divided for each frame, the digital signal for each divided frame is encoded, and the feature amount based on the encoding or / and the feature amount of the digital signal is obtained as an explanatory variable, Preferably, an index value is obtained by linearly combining a plurality of the explanatory variables, and the index value is quantized to be a priority.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
Packet communication between terminals located at a long distance in terms of network is performed via a backbone network. Here, the long distance in terms of network means that the number of nodes through which a packet passes is large when it is transmitted without corresponding to a physical distance.
FIG. 1 shows a system configuration example to which the present invention is applied. The backbone network 100 is provided with an incoming device (gateway) 110 that receives communication from another communication network, and outgoing devices 120 and 130 that send communication to the other communication network. There is also an apparatus (gateway) having both functions of receiving communication from another communication network and sending communication to the other communication network. The ingress device 110 can be connected to a plurality of terminals 210, 220, 230, the egress device 120 can be connected to terminals 240, 250, and the egress device 130 can be connected to the terminal 260 and other backbone networks. 140 can be connected.
[0018]
In the ingress device 110, for example, as shown in FIG. 2, the packets received from the terminals 210, 220, and 230 are distributed by the distribution unit 111 according to priority, and the priority buffer 112 is received.1, ..., 112FourStored in In this example, the priority p is 1 to 4. A plurality of the packets for each distributed priority are aggregated into one packet, and the packet construction unit 1131, ..., 113FourIt is constructed in an aggregate. At that time, each aggregated packet has an individual header H including at least transmission source information and reception destination (destination) information of the original packet.PAnd the payload of the packet are combined into one aggregate packet, which is a backbone header H required for transmission within the backbone 100SIs attached.
[0019]
  For example, as shown in FIG. 3A, a packet P having a priority p of 1 to 4 from the terminal 210 to the terminal 240.AD1 , ..., PAD4 , Packet P with a priority p of 1 to 4 from terminal 220 to terminal 250BE1 , ..., PBE4 , Packet P with a priority p of 1 to 4 from terminal 230 to terminal 260CF1 , ..., PCF4 Is received. A packet construction unit 113 that constructs an aggregate packet SP in which packets having a priority p of 1 are aggregated.1 Then, the priority buffer 1121 To packet PAD1 , Packet PBE1 , Packet PCF1 Are collected and transmitted to the same outgoing device 120 in the backbone network 100, and an individual header H including destination information to the terminal 240 is obtained by the individual header generator 113a.PDAnd this individual header HPDAnd packet PAD1 The individual header H including the receiver information to the terminal 250 is also created.PEAnd packet PBE1 Although not shown in the figure, a pair of an individual header and a payload is created.
  These individual headers, as shown in FIG. 3BWhenA set of payloads is collected as one payload (aggregated payload), and a backbone header H required for transmission from the ingress device 110 to the egress device 120 in the backbone network 100S1Is generated and attached by the IP header generation unit 113b, and one aggregate packet SP is attached.12,1Build up. This backbone header HS1Includes information indicating that the priority p is 1.
[0020]
Other packet construction unit 1132, ..., 113Four, Each individual header H for packets with priority p of 2,.PAnd the payload set are aggregated, and the backbone header HS1, HS4Packet SP with each12,2, ..., SP12,4Build up.
Packet P for transmitting the backbone network 100 from the ingress device 110 to the egress device 130CF1, ..., PCF4Are collected with the same priority, and a set of the individual header and the payload is used as an aggregate payload, which is added to the backbone network header H.SWith aggregate packet SP13,1Build etc. These aggregated packets SP are transmitted from the transmitter 114 into the backbone network 100. Individual header HpIs composed of the receiver information and the sender information, so it may be about 64 bytes, and the backbone header HsIs, for example, 200 bytes or more as described above, and the individual header H is compared with this.pTherefore, the increase in traffic due to the overhead of the header is remarkably improved as compared with the case where the digital signal is transmitted as a packet of a code for each block.
Furthermore, in this embodiment, the packet P transmitted from each terminalAD, PBE, PCFAnd the like are obtained by scalable coding digital signals and combining signal block codes having the same priority for each predetermined section into one packet.
[0021]
For example, as shown in FIG. 4, the frame-divided audio signal is divided into F bands by the band dividing unit 16, and these 1st to Fth band signals are respectively encoded by the encoding unit 13.1~ 13FAnd the priority determination unit 141~ 14FTo determine the priority. These encoded codes P [1, i] to P [F, i] and priorities p [1, i] to p [F, i] are supplied to the packet aggregating unit 19 and are given the same priority every predetermined number of frames. The codes of the degrees are collected and sent from the sending unit 15 as one packet.
The input audio signal s [n] is divided into 0-4 kHz, 4 kHz-8 kHz, and 8-16 kHz F = 3 bands using, for example, wavelet analysis, divided in the time direction at 5 ms, and transmitted in packets every 20 ms And The frame number i = 1,..., 4 in each packet transmission number t, the encoding code of the signal block of the band number f of the frame number i is P [f, i], and the priority is p [f, i]. Represent each. When the code P [f, i] and the priority p [f, i] of each block in each t-th transmission section are as shown in FIG. 5A, the packet aggregating unit 19 is the same as shown in FIG. 5B. Assume that each block having priority is aggregated into one packet having a header including information on the priority. In this example, the codes P [1,2] and P [1,3] of the blocks (1,2) and (1,3) with the priority p = 4 are put together, and the respective codes P [1,2], Position information on the band-time coordinate of P [1,3], that is, position information (1, 2), (1, 3) of a block in a predetermined plurality of frames is attached with a header including information of priority p = 4 Incorporate in the packet. The packet of priority p = 3 incorporates codes P [2,2], P [1,4] and their position information (2,2), (1,4), and includes a header including priority 3 information. Add one packet. In the same manner, codes having the same priority are collected and incorporated as one packet together with the position information.
[0022]
In this example, packets in which codes having the same priority are aggregated are sent to the network every 20 ms. At this time, a packet having a low priority has little influence on the quality according to the state of the network, and therefore does not need to be transmitted. Further, even if a low-priority packet is discarded in each node of the network according to traffic congestion, the influence on communication quality is kept to a minimum.
For example, as shown in FIG. 6, the aggregated packet SP transmitted through the backbone network 100 and received by the outgoing device 120 is decomposed by the packet decomposing unit 121 for each receiving terminal. A payload H is added to the payload, and each packet is processed by the packet reconstruction unit 122 and transmitted to the corresponding terminal by the transmission unit 123.
For example, in the example shown in FIG. 3, the aggregate packet SP shown in FIG. 7A.12,1, ..., SP12,4Is received by the outgoing device 120. Aggregated packet SP12,1The payload is its individual header HPE7B, the destination information is information for the terminal 240, that is, the packet P in FIG.AD1And the destination information is information for the terminal 250, that is, the packet P in FIG.BE1Of the aggregate packet SP into the information to the terminal 220.12,1Packet P with a header containing the priority ofAD1And the packet P with the header added to the information to the terminal 230BE1Reconfigure.
[0023]
As described above, in this embodiment, the packet transmitted from the terminal is a group of block codes having the same priority. Therefore, in the receiving terminal, as shown in FIG. 8, all packets in the t-th transmission section are shown in the packet disassembling unit 21, and in the case of FIG. 5, four packets P [1, t] with priority p = 1 to p = 4. P [4, t] is reconstructed on band-time coordinates through the reverse procedure of the assembly shown in FIG. 5, and each band code P [1, i] to P [F, i] is decoded by the decoding unit 22.1~ 22FTo decode each band audio. At this time, if there is a low priority code that has not reached the receiving side, basically the operation of the decoding unit for that code is stopped. If the high priority code does not arrive, the block (block) loss countermeasure is taken as a block loss compensation unit 23.1~ 23FTo avoid quality degradation. Each band audio signal decoded in this manner and subjected to erasure compensation as necessary is synthesized by the band synthesizing unit 24 and output as a reproduced audio signal s [n]. It should be noted that the block erasure information is received from the packet disassembly unit 21 by the block erasure compensation unit 231~ 23FHas been supplied to. This block disappearance compensation may be performed by a known technique.
[0024]
Modified example
When the block is divided into bands as shown in FIG. 12, 4 [1, i] may be further added as an explanatory variable. That is, as shown by a broken line in FIG.LThen, the absolute power x1 [f, i] of this band and the absolute power of other bands are input, and the ratio of the absolute power of this band to the total power is calculated by the following equation (9), and the explanatory variable x4 [f, i].
x4 [f, i] = x1 [f, i] / Σf = 1 Fx1 [f, i] (9)
In the example of FIG. 14, F = 2, so that x1 [1, i] in the low band and x1 [2, i] in the high band
x4 [1, i] = x1 [1, i] / (x1 [1, i] + x1 [2, i])
Is calculated.
Index value calculation unit 144LThe explanatory variables x1 [1, i], x2 [1, i], x3 [1, i], x4 [1, i] are linearly combined, and the index value y [1, i] according to the following equation is calculated: Further, it is quantized and the priority p [1, i] is output.
y [1, i] = α0 + Σj = 1 Fourαjxj [1, i] ^
xj [1, i] ^ = (xj [1, i] −xj [1] ′) / γj [1]
Block division may be performed based on quality. In this case, the audio block (packet) divided image shows the relationship between the quality q and the frame in parentheses in FIG. Further, FIG. 9 shows a functional configuration when a speech signal is encoded in a general fixed processing time unit with a Q = 2 stage configuration.
[0025]
The audio signal s [n] is divided by the frame dividing unit 12 in units of frames, and the first-stage encoding unit 131Are encoded for each frame and the first-stage priority determination unit 141The priority p [1, i] is determined. First stage encoding unit 131The encoded code P [1, i] from the first stage decoding unit 171And the decoded signal is subtracted from the audio signal 18.1The first stage residual signal (encoding error signal) e1 [n] is generated. This residual signal is supplied to the second stage encoding unit 13.2Are encoded for each frame and the second-stage priority determination unit 142The priority p2 [2, i] is determined. Second stage encoding unit 132The encoded code P [2, i] from the second stage decoding unit 172And the decoded signal is subtracted from the first stage residual signal e1 [n].2Is subtracted to generate the second stage residual signal e2 [n].
First stage priority determination unit 141A specific example is shown in FIG. Priority determining unit 14 shown in FIG.LSimilarly, the explanatory variable x1 [1, i] of the absolute power, the explanatory variable x2 [1, i] of the previous frame power ratio, and the explanatory variable x3 [1, i] of the autocorrelation function maximum value are respectively explanatory variables. Generation unit 1411And 1421And 1431Is generated. Furthermore, the explanatory variable generation unit 14 generates the quality of the code P [1, i], for example, the noise ratio to the signal, as the explanatory variable x5 [1, i]. That is, S = Σ in the signal power calculation unit 147a.n = 1 Ns [Ni + n]2And E = Σ in the noise calculation unit 147bn = 1 Ne1 [Ni + n]2Is the logarithm of these ratiosTenE / S is calculated by the logarithmic division unit 147c, and the result is output as the explanatory variable x5 [1, i].
[0026]
  These four explanatory variables are index calculation unit 144.1 The index value y [1, i] is calculated by linear combination. For example, as in the previous case, the normalization unit 144aj (j = 1,..., 4) normalizes the explanatory variables xj [1, i], respectively, and the normalized value xj [1, i] ^ is linearly combined y [1, i] = α0 + Σj = 1 Fourαjxj [1, i] ^, xj [1, i] ^ = (xj [1, i] −xj [1] ′) γj. The index value y [1, i] is the quantization unit 145.1 And the first stage priority p [1, i] is output.
  The second-stage priority p [2, i] is obtained in the same manner. In this case figure10As shown in parentheses, the second-stage residual signal e2 [n] is input instead of the first-stage residual signal e1 [n], and these signals are processed in the same manner. The stage priority p [2, i] is output.
[0027]
  Packet sending unit 15 (FIG.4), The first-stage code P [1, i] and the priority p [1, i] are one packet, and the second-stage code P [2, i] and the priority p [2, i] are one packet. Output as.
  This explanatory variable x5 [q, i] (q = 1, 2,..., Q) can be said to be a feature quantity based on encoding. A general formula for calculating this is as follows.
    x5 [q, i] = logTenn = 1 Neq [Ni + n]2 / Σn = 1 Ns [Ni + n]2)
  In this case, the linear combination coefficient α5 can be about −0.1. A packet having a large q is necessary for reproduction of a high-quality signal. However, since the semantic content of information transmitted is more important than the quality when traffic is congested, a packet having a large q is x5 [ q, i] becomes small, and α5 is relatively small, so that the priority is not so much involved.
[0028]
In the case of a general scalable multi-band encoder, the explanatory variables x1 [f, i], x2 [f, i], x3 [f, i], x4 [f, i], x5 [q, i] are set. The index value y [f, q, i] is calculated using the calculation. FIG. 11 shows a divided image of the voice block (packet) at this time.
That is, in the case of so-called scalable coding in which audio signals of various quality having combinations of various sampling frequencies and various sample quantization accuracy (number of amplitude bits) are shown, FIG. 11 shows three sampling frequencies and quantization accuracy ( (Quality) is also divided into three stages, the frequency band is divided into three bands of f = 1, f = 2, and f = 3, and the amplitude bit length is divided into three areas of q = 1, q = 2, and q = 3 As a single signal block (packet) in a three-dimensional space represented by a frequency axis (band number), a quality axis (amplitude bit division number), and a time axis (frame number) orthogonal to each other, [f, q, i].
Each explanatory variable in this case is obtained by the following equation. An audio signal of band f and quality (bit division number) q is represented as sfq.
x1 [f, q, i] = (1 / N) Σn = 1 Nsfq [Ni + n]2
Or x1 [f, q, i] = logTen((1 / N) Σn = 1 Nsfq [Ni + n]2)
x2 [f, q, i] = x1 [f, q, i] / x1 [f, q, i-1]
x3 [f, q, i] = max (ρf, q, i[k])
ρf, q, i[k] = Σn = 0 N(Sfq [Ni + n]) (sfq [Ni + n + k])
/ Σn = 0 N(Sfq [Ni + n])2
x4 [f, q, i] = x1 [f, q, i] / Σf = 1 Fx1 [f, q, i]
x5 [f, q, i] = logTenn = 1 Nefq [Ni + n]2/ Σn = 1 Nsfq [Ni + n]2)
Index value y [f, q, i] = α0 + Σj = 1 Fiveαjxj [f, q, i]
Priority p [f, q, i] = ff, q(y [f, q, i])
[0029]
The priority p [f, q, i] determined in this way and the corresponding encoded code P [f, q, i] are taken as one set. Also in this case, block codes having the same priority are bundled together with the position information and transmitted as one packet every predetermined number of frames.
Although the present invention has been applied to audio signals in the above description, it can also be applied to music signals and video signals. In addition, the following may be considered as explanatory variables of feature amounts based on encoding. For example, depending on the speech coder using predictive coding, if a packet such as a word head is discarded, the speech quality (S / N ratio) thereafter may be significantly degraded. The degradation of the S / N ratio that is propagated by such discarding may also be used as the explanatory variable xj (m, i). The explanatory variable of the feature amount of the audio signal and the explanatory variable of the feature amount based on the encoding are not limited to the above-described examples, and various types can be used.
The above-described terminal, entry-side device, and exit-side device can be functioned by a computer. In that case, a program for causing the computer to function as the device may be installed in a computer of the device from a recording medium such as a CD-ROM or a magnetic disk, or downloaded via a communication line and executed.
[0030]
【The invention's effect】
According to the present invention, since packets are transmitted with priority, when the network is not congested, transmission can be performed with the highest quality as in normal communication. On the other hand, when congestion occurs in the network, packets with low priority are discarded, but quality degradation can be minimized. In this way, the network can be efficiently used as a whole. In such a mechanism, since the payload is smaller than the header in narrowband voice communication, it is necessary to consider the overhead such as the header to some extent, but aggregation and distribution on the network side are suppressed from increasing traffic due to the header overhead. Also, in broadband musical tone communication and video communication, the size of the packet payload is larger than the header, so the network can be used effectively without using an aggregation or distribution mechanism.
[Brief description of the drawings]
FIG. 1 is a diagram showing an example of a network to which the present invention is applied.
FIG. 2 is a diagram showing a functional configuration example of an entry side device 110 in FIG. 1;
FIG. 3 is a diagram showing an example of aggregated packets aggregated with a plurality of received packets in the ingress device 110 in FIG. 1;
FIG. 4 is a diagram illustrating a functional configuration example of a packet transmission device in a terminal.
FIG. 5 is a diagram showing an example of a state of aggregation in the packet aggregation unit 19 in FIG. 4;
6 is a diagram showing a functional configuration example of an exit side device 120 in FIG. 1;
FIG. 7 is a diagram showing an example of aggregated packets and decomposed / regenerated packets in the outgoing device.
FIG. 8 is a diagram illustrating a functional configuration example of a packet reception device in a terminal.
FIG. 9 is a block diagram showing another functional configuration example of the packet transmission device.
10 is a first-stage priority determination unit 14 in FIG. 9;1The block diagram which shows the specific example of a function structure of these.
FIG. 11 is a diagram illustrating an example of dividing a signal into three-dimensional coordinates of quality-bandwidth-time.
FIG. 12 is a block diagram showing a functional configuration example of a conventional packet transmission device.
FIG. 13 is a diagram showing an example of dividing a signal into two-dimensional coordinates of band-time.
14 is a low-frequency priority determination unit 14 in FIG. 12;LThe block diagram which shows the specific example of a function structure of these.

Claims (7)

ディジタル信号をフレーム毎に分割するフレーム分割部と、A frame dividing unit for dividing the digital signal into frames,
前記フレーム毎のディジタル信号を複数の帯域に分割して帯域毎のブロックを生成する帯域分割部と、A band dividing unit that divides the digital signal for each frame into a plurality of bands to generate blocks for each band;
前記各ブロック毎に、該ブロックの信号を符号化した符号を生成する符号化部と、For each block, an encoding unit that generates a code obtained by encoding a signal of the block;
前記各ブロック毎に、全帯域の絶対電力の総和に対する該ブロックの絶対電力の比を1つの特徴量として含む複数の特徴量を求める説明変数生成部と、For each block, an explanatory variable generation unit that obtains a plurality of feature amounts including a ratio of the absolute power of the block to the total absolute power of all bands as one feature amount;
前記各ブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求める指標値計算部と、An index value calculation unit that obtains a linear combination of the plurality of feature quantities as an index value related to the priority of the block for each block;
前記各ブロック毎に、前記指標値を量子化して優先度を求める優先度決定部と、A priority determination unit that quantizes the index value and obtains a priority for each block;
所定フレーム数毎に、同一の優先度の符号をまとめたパケットを生成するパケット送出部と、A packet sending unit for generating a packet in which codes of the same priority are collected for each predetermined number of frames;
を具備することを特徴とするパケット送出装置。A packet transmission device comprising:
ディジタル信号をフレーム毎に分割するフレーム分割部と、A frame dividing unit for dividing the digital signal into frames,
前記フレーム毎のディジタル信号を複数の品質に基づくブロックに分割する手段と、Means for dividing the digital signal for each frame into blocks based on a plurality of qualities;
前記各ブロック毎に、該ブロックの信号を符号化した符号を生成する符号化部と、For each block, an encoding unit that generates a code obtained by encoding a signal of the block;
前記各ブロック毎に、該ブロックの入力信号と符号化誤差信号との比の対数値を1つの特徴量として含む複数の特徴量を求める説明変数生成部と、An explanatory variable generator for obtaining a plurality of feature quantities including a logarithmic value of the ratio between the input signal of the block and the encoding error signal as one feature quantity for each block;
前記ブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求める指標値計算部と、For each block, an index value calculation unit for obtaining a linear combination of the plurality of feature quantities as an index value related to the priority of the block;
前記各ブロック毎に、前記指標値を量子化して優先度を求める優先度決定部と、A priority determination unit that quantizes the index value and obtains a priority for each block;
所定フレーム数毎に、同一の優先度の符号をまとめたパケットを生成するパケット送出部と、A packet sending unit for generating a packet in which codes of the same priority are collected for each predetermined number of frames;
を具備することを特徴とするパケット送出装置。A packet transmission device comprising:
ディジタル信号をフレーム毎に分割するフレーム分割部と、A frame dividing unit for dividing the digital signal into frames,
前記フレームのディジタル信号を複数の帯域のブロックに分割する帯域分割部と、A band dividing unit for dividing the digital signal of the frame into blocks of a plurality of bands;
前記帯域毎のブロック毎に、該ブロックの信号を複数の品質に基づくブロックに分割する手段と、Means for dividing the signal of the block into blocks based on a plurality of qualities for each block of the band;
前記各帯域の品質のブロック毎に、該ブロックの信号を符号化した符号を生成する符号化部と、For each block of the quality of each band, an encoding unit that generates a code obtained by encoding the signal of the block;
前記各帯域の品質のブロック毎に、全帯域の絶対電力の総和に対する該ブロックの絶対電力の比と、該ブロックの入力信号と符号化誤差信号との比の対数値とを、それぞれ特徴量として含む複数の特徴量を求める説明変数生成部と、For each block of quality of each band, the ratio of the absolute power of the block to the sum of the absolute power of all bands and the logarithm of the ratio of the input signal of the block and the encoding error signal are used as feature quantities, respectively. An explanatory variable generator for obtaining a plurality of feature quantities including:
前記各帯域の品質のブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求める指標値計算部と、An index value calculation unit for obtaining a linear combination of the plurality of feature quantities as an index value relating to the priority of the block for each block of the quality of each band;
前記各帯域の品質のブロック毎に、前記指標値を量子化して優先度を求める優先度決定部と、For each block of the quality of each band, a priority determination unit that quantizes the index value to obtain a priority;
前記各帯域の品質のブロック毎に、同一の優先度の符号をまとめたパケットを生成するパケット送出部と、A packet sending unit that generates a packet in which codes of the same priority are collected for each block of the quality of each band;
を具備することを特徴とするパケット送出装置。A packet transmission device comprising:
パケット送出装置が決定する優先度に関する指標値を算出する方法であって、A method for calculating an index value related to a priority determined by a packet transmission device,
ディジタル信号をフレーム毎に分割するステップと、Dividing the digital signal into frames,
前記フレーム毎のディジタル信号を複数の帯域に分割してブロックを生成するステップと、Dividing the digital signal for each frame into a plurality of bands to generate a block;
前記各ブロック毎に、全帯域の絶対電力の総和に対する該ブロックの絶対電力の比を1つの特徴量として含む複数の特徴量を求めるステップと、For each of the blocks, obtaining a plurality of feature amounts including a ratio of the absolute power of the block to the sum of absolute powers of all bands as one feature amount;
前記各ブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求めるステップと、Obtaining, for each block, a linear combination of the plurality of feature quantities as an index value relating to the priority of the block;
を含む優先度に関する指標値の算出方法。Of calculating index values related to priority including
パケット送出装置が決定する優先度に関する指標値を算出する方法であって、A method for calculating an index value related to a priority determined by a packet transmission device,
ディジタル信号をフレーム毎に分割するステップと、Dividing the digital signal into frames,
前記フレーム毎のディジタル信号を複数の品質に基づいて分割したブロックを生成するステップと、Generating a block obtained by dividing the digital signal for each frame based on a plurality of qualities;
前記各ブロック毎に、該ブロックの入力信号と符号化誤差信号との比の対数値を1つの特徴量として含む複数の特徴量を求めるステップと、Obtaining a plurality of feature quantities including a logarithmic value of a ratio between the input signal of the block and the encoding error signal as one feature quantity for each block;
前記各ブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求めるステップと、Obtaining, for each block, a linear combination of the plurality of feature quantities as an index value relating to the priority of the block;
を含む優先度に関する指標値の算出方法。Of calculating index values related to priority including
パケット送出装置が決定する優先度に関する指標値を算出する方法であって、A method for calculating an index value related to a priority determined by a packet transmission device,
ディジタル信号をフレーム毎に分割するステップと、Dividing the digital signal into frames,
前記フレーム毎のディジタル信号を複数の帯域及び複数の品質に基づいて分割したブロックを生成するステップと、Generating a block obtained by dividing the digital signal for each frame based on a plurality of bands and a plurality of qualities;
前記各ブロック毎に、全帯域の絶対電力の総和に対する該ブロックの絶対電力の比と、該ブロックの入力信号と符号化誤差信号との比の対数値と、をそれぞれ特徴量として含む複数の特徴量を求めるステップと、A plurality of features each including a ratio of the absolute power of the block to the sum of absolute powers of all bands and a logarithmic value of the ratio of the input signal of the block and the encoding error signal as feature quantities for each block. Determining the quantity;
前記各ブロック毎に、前記複数の特徴量の線形結合を該ブロックの優先度に関する指標値として求めるステップと、Obtaining, for each block, a linear combination of the plurality of feature quantities as an index value relating to the priority of the block;
を含む優先度に関する指標値の算出方法。Of calculating index values related to priority including
請求項4乃至6のいずれかに記載した優先度に関する指標値の算出方法の各ステップをコンピュータに実行させるためのプログラム。The program for making a computer perform each step of the calculation method of the index value regarding the priority in any one of Claim 4 thru | or 6 .
JP2003119829A 2003-04-24 2003-04-24 Packet sending apparatus, index value calculation method and program for priority used in the same Expired - Fee Related JP4004431B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003119829A JP4004431B2 (en) 2003-04-24 2003-04-24 Packet sending apparatus, index value calculation method and program for priority used in the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003119829A JP4004431B2 (en) 2003-04-24 2003-04-24 Packet sending apparatus, index value calculation method and program for priority used in the same

Publications (2)

Publication Number Publication Date
JP2004328354A JP2004328354A (en) 2004-11-18
JP4004431B2 true JP4004431B2 (en) 2007-11-07

Family

ID=33498942

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003119829A Expired - Fee Related JP4004431B2 (en) 2003-04-24 2003-04-24 Packet sending apparatus, index value calculation method and program for priority used in the same

Country Status (1)

Country Link
JP (1) JP4004431B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7548562B2 (en) * 2004-12-14 2009-06-16 Agilent Technologies, Inc. High speed acquisition system that allows capture from a packet network and streams the data to a storage medium

Also Published As

Publication number Publication date
JP2004328354A (en) 2004-11-18

Similar Documents

Publication Publication Date Title
JP6151405B2 (en) System, method, apparatus and computer readable medium for criticality threshold control
Gibson Speech coding methods, standards, and applications
KR20190076933A (en) Method and apparatus for frame erasure concealment for a multi-rate speech and audio codec
TWI464734B (en) Systems and methods for preventing the loss of information within a speech frame
JP5706445B2 (en) Encoding device, decoding device and methods thereof
US8386266B2 (en) Full-band scalable audio codec
JPWO2005106848A1 (en) Scalable decoding apparatus and enhancement layer erasure concealment method
JPWO2006025313A1 (en) Speech coding apparatus, speech decoding apparatus, communication apparatus, and speech coding method
CA2408890C (en) System and methods for concealing errors in data transmission
US8874437B2 (en) Method and apparatus for modifying an encoded signal for voice quality enhancement
US8787490B2 (en) Transmitting data in a communication system
Herrero Modeling and comparative analysis of Forward Error Correction in the context of multipath redundancy
JP2003316391A (en) Device and method for decoding voice
Dong et al. A multiple description speech coder based on AMR-WB for mobile ad hoc networks
JP3722366B2 (en) Packet configuration method and apparatus, packet configuration program, packet decomposition method and apparatus, and packet decomposition program
JP4414705B2 (en) Excitation signal encoding apparatus and excitation signal encoding method
JP4004431B2 (en) Packet sending apparatus, index value calculation method and program for priority used in the same
Balam et al. Multiple descriptions and path diversity for voice communications over wireless mesh networks
JP2005114814A (en) Method, device, and program for speech encoding and decoding, and recording medium where same is recorded
Li et al. Comparison and optimization of packet loss recovery methods based on AMR-WB for VoIP
JP3920796B2 (en) Digital signal packet output method, apparatus and program thereof
Petracca et al. Voice transmission over 802.11 wireless networks using analysis-by-synthesis packet classification
CN113259058B (en) Apparatus and method for transmitting and receiving voice data in wireless communication system
KR20050027272A (en) Speech communication unit and method for error mitigation of speech frames
Kataoka et al. Scalable wideband speech coding using G. 729 as a component

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050721

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20050721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070807

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070821

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100831

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110831

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120831

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130831

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees