JP2004274454A - ディジタル信号パケット出力方法、その装置及びプログラム - Google Patents

ディジタル信号パケット出力方法、その装置及びプログラム Download PDF

Info

Publication number
JP2004274454A
JP2004274454A JP2003063445A JP2003063445A JP2004274454A JP 2004274454 A JP2004274454 A JP 2004274454A JP 2003063445 A JP2003063445 A JP 2003063445A JP 2003063445 A JP2003063445 A JP 2003063445A JP 2004274454 A JP2004274454 A JP 2004274454A
Authority
JP
Japan
Prior art keywords
priority
packet
digital signal
frame
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003063445A
Other languages
English (en)
Other versions
JP3920796B2 (ja
Inventor
Yuusuke Hiwazaki
祐介 日和▲崎▼
Toru Morinaga
徹 森永
Jiyoutarou Ikedo
丈太朗 池戸
Takeshi Mori
岳至 森
Daisuke Tokumoto
大輔 徳元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003063445A priority Critical patent/JP3920796B2/ja
Publication of JP2004274454A publication Critical patent/JP2004274454A/ja
Application granted granted Critical
Publication of JP3920796B2 publication Critical patent/JP3920796B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Communication Control (AREA)

Abstract

【課題】主観評価と対応した優先度を、なめらかな段階で決定可能にする。
【解決手段】ディジタル信号をフレームごとに絶対電力X1と、前フレーム電力比X2、自己相関関数最大値X3を求め、これらX1,X2,X3を線形結合して指標値yを求め、これを量子化して優先度pとし、これと対応フレームの符号化符号とを組としてパケット化する。線形結合の係数α1,α2,α3を、フレームが消失した時に、再生信号に与える主観評価に与える影響を考慮して決定する。
【選択図】 図2

Description

【0001】
【発明の属する技術分野】
この発明は、インターネットを始めとするパケット通信ネットワークにおいて音声、音楽、映像などディジタル信号をパケットとして組立て出力する方法、その装置及びプログラムに関するものである。
【0002】
【従来の技術】
与えられたネットワークやシステム資源(音声、映像など)を用いて最大の効果が得られるように、各メディアの品質(アプリケーション品質)を調整することを、インターネットで動的に制御する技術、いわゆるインターネットQoS(Quality of Service)制御技術として、DiffServ(非特許文献1,2)が注目されている。この手法は特にネットワークに入るパケットを予め優先度でクラス分けしておき、輻輳時に各ネットワークノードで優先度の低いパケットから破棄する仕組みである。この仕組みを音声通信で利用するためには、音声の処理単位(すなわちパケット)毎に優先度が演算されているようにしておけば有効なネットワークの活用ができる。
【0003】
従来の音声信号伝送に用いられているVAD(Voice Activity Detection)(非特許文献3)は、基本的には音声信号の有無の制御に主眼が置かれ、音声区間と非音声区間と2つの粗い区別しかなかった。つまり従来の音声信号パケットにおいては、音声区間を高い優先度とし、無音区間を低い優先度とする2段階しかなかった。
【0004】
【非特許文献1】
IETF−RFC2474:Definition of the Differentiated Services Field(DS Field)in the IPv4 and IPv6 Headers,1998.
【非特許文献2】
IETF−RFC2475:An architecture for Differentiated Services,1998.
【非特許文献3】
3GPP:ETSI TS 146 032,“Digital cellular telecommunications system(Phase 2+);Voice Activity Detection(VAD),2002
【0005】
【発明が解決しようとする課題】
今後普及するであろう音声、音楽、映像とデータとの統合ネットワーク環境では、一般的なピーク伝送レートの高い「データ通信」と、伝送レートが低くとも遅延時間が品質劣化に直接結びついてしまう「音声、音楽、映像通信」とが効率良く混在する必要がある。この場合なめらかな段階の優先度をもつパケットを生成して音声、楽音や映像などを品質を落さずに効率良く伝送を可能とすることが望まれる。
この発明の目的は音声、音楽、映像などのディジタル信号を、なめらかな段階を持つ優先度を与えたパケットを生成出力するディジタル信号パケット送出方法、その装置及びプログラムを提供することにある。
【0006】
【課題を解決するための手段】
この発明の方法によればディジタル信号をフレームごとに分割し、その分割されたフレームごとのディジタル信号を符号化し、上記符号化に基づく特徴量又は/及び上記ディジタル信号の特徴量を説明変数として求め、上記説明変数の複数個を線形結合して指標値を求め、その指標値を量子化して優先度を求め、この優先度と上記符号化の符号とをパケットとして出力する。
この発明の装置によればディジタル信号をフレームごとに分割するフレーム分割部と、分割されたフレームごとのディジタル信号を符号化する符号化部と、上記符号化に基づく特徴量、及び/又は上記分割されたフレームごとのディジタル信号の特徴量を説明変数として生成する複数の説明変数生成部と、上記複数の説明変数を線形結合して指標値を計算する指標値計算部と、上記指標値を量子化して優先度を生成する量子化部と、上記優先度及び上記符号化部よりの符号をパケットとして出力するパケット送出部とを具備する。
【0007】
この発明のプログラムは前記ディジタル信号パケット出力方法の各ステップをコンピュータに実行させるためのプログラムである。
更に好ましくはディジタル信号をフレームごとに複数帯域に分割し、各帯域ごとのディジタル信号を符号化し、フレーム及び帯域ごとに符号化に基づく特徴量、及び/又は帯域ごとの各ディジタル信号の特徴量の複数個を説明変数として求め、これら説明変数を1次結合して1つの指標値を求め、その指標値を量子化し優先度を求め、フレーム及び帯域ごとのその優先度及び符号化符号を組とし、少くともその組の1つを含むパケットとして出力する。フレームが消失した場合に、その説明変数が主観評価値に与える影響度を線形結合の各係数と対応づけて決定する。
【0008】
【発明の実施の形態】
以下にこの発明の実施の形態を音声ディジタル信号のパケット生成について述べるが、この発明は映像や音楽のディジタル信号のパケット生成にも適用できる。
第1実施形態
図1にこの発明の第1実施形態を示す。入力端子11からの各サンプルがディジタル値とされた音声ディジタル信号(以下音声信号と記す)s[n]はこの種の一般的な符号化器と同様に5ミリ秒から20ミリ秒の単位のフレームにフレーム分割部12で分割され、各フレームごとに、つまり音声信号s[n](nは離散的時刻)がまとめてNサンプル毎に符号化部13で符号化される。例えば32kHzサンプリングの音声信号であれば、N=160サンプルからN=640サンプルである。またフレームごとにパケットの優先度を優先度決定部14で決定する。優先度決定部14の具体例を図2に示す。この例ではそのフレームの音声信号s[n]の特徴量を、複数の説明変数生成部141,142,143でそれぞれ説明変数x1[i],x2[i],x3[i]として生成する。i番目の処理フレームの説明変数xj[i]として、そのフレームの音声信号s[n]を入力して、その絶対電力を説明変数生成部141で次式(1)を計算して求める。
【0009】
x1[i]=(1/N)Σn=1 s[Ni+n] (1)
あるいは、次式(2)に示すように絶対電力の対数表現としてx1[i]を求める。
x1[i]=log10((1/N)Σn=1 s[Ni+n]) (2)
説明変数生成部142では説明変数生成部141よりの説明変数x1[i]と、前フレーム(i−1)の説明変数x1[i−1]を入力して現フレームの電力の前フレームの電力に対する比を次式(3)により計算して説明変数x2[i]を出力する。
【0010】
x2[i]=x1[i]/(x1[i−1]) (3)
前フレームの説明変数x1[i−1]を前フレームバッファ142aに格納しておき、式(3)の計算を計算部142bで行い、現フレームの説明変数x1[i]で前フレームバッファ142aに保持する説明変数を更新する。
更に説明変数生成部143では音声信号s[n]を入力して、その自己相関関数(ρ[n])の最大値(周期性)を次式(4)により計算して説明変数x3[i]とする。
【0011】
x3[i]=max(ρ[k]) (4)
ここで正規化された自己相関関数ρ[n]は、次式(5)を用いて計算する。
ρ[k]=Σn=0 (s[Ni+n])(s[Ni+n+k])/
Σn=0 (s[Ni+n]) (5)
kは1,2,…とし、kの最大値は音声信号s[n]のピッチ周期相当程度とする。この時、自己相関関数をアップサンプリングして、つまり補間してより正確な値を計算するようにした方が良い結果が得られる。
【0012】
これら求めた説明変数x1[i],x2[i],x3[i]を指標値計算部144で線形結合して指標値y[i]を求める。つまり例えば次式(6)、(7)を計算する。
y[i]=α0+Σj=1 αjxj[i]^ (6)
xj[i]^は説明変数xjの確率分布の平均を0、分散を1に正規化したもの、つまり次式(7)で求まる。
xj[i]^=(xj[i]−xj′)/γj (7)
xj′,γjはそれぞれ説明変数xjの平均値、標準偏差である。
【0013】
これらの線形結合係数α0,α1は重回帰分析(例えば奥野忠一他:多変量解析法(改訂版),日科技連,1981参照)を用いて事前に最適化した偏回帰係数値を用いる。例えば1つのパケット(フレーム)を消失させたときの受聴者が主観評価したMOS値をy[i]′とした時、このy[i]′と、式(6)により計算された指標値y[i]との誤差が最小となるように、最小自乗法を用いて、係数αjを求める。α0はMOS値1〜5の平均値である。ここでMOS値1は「非常に悪い」、MOS値5は「非常に良い」と対応する。
【0014】
係数α0〜α3は、このように決められるから、αjの絶対値が大きいことはその説明変数(特徴量)がパケット(フレーム)消失時の主観評価品質に大きく影響し、αjの絶対値が小さければその説明変数(特徴量)はパケット(フレーム)消失時の主観評価品質への影響が比較的小さいことになる。つまり主観評価品質への影響度が大きい程、係数αjが大きくなるようにαjが決定されている。また指標値y[i]は複数の説明変数(特徴量)x1[i]〜x3[i]を係数α1〜α3を用いて線形結合させたものであるから、1つの説明変数(特徴量)のみにて、パケット(フレーム)消失の主観評価品質に与える影響の程度よりも、より正しく、影響の程度を示すことになる。主観評価品質に対して大きく影響を与えるフレーム、この場合音声であるから聴感的に重要なものは指標値y[i]が小さくなり、重要でないものは指標値が大きくなる傾向になる。
【0015】
図2中の指標値計算部144において、各説明変数x1〜x3はそれぞれ正規化部144a1〜144a3で正規化され、正規化説明変数x1^〜x3^は乗算部144b1〜144b3で係数α1〜α3がそれぞれ乗算され、これら乗算結果と定数α0は加算部144c1,144c2により加算されて指標値y[i]が出力される。
こうして求められた指標値y[i]は、量子化部145でスカラ量子化され、離散的な値、例えば0,1,…,7の何れかの値の優先度p[i]が出力される。つまり一般的に指標値の小さいパケットは高優先度のものへ、大きいものは低優先度のものへと写像する。写像は以下のような関数で表わすことができる。
【0016】
p[i]=f(y[i]) (8)
このとき用いる写像関数f(y)は、パケットを総優先度ステップ数に写像するスカラ量子化を用いればよい。このときの量子化のしきい値は、指標値y[i]を等確率で分割する方法や、指標値y[i]の範囲を等分割するなどの方法がある。
線形結合係数の各値は例えばα1=−0.37、α2=−0.1、α3=−0.2であり、その絶対値が大きい程、主観評価品質への影響が大きい。これらの3つの説明変数(特徴量)において絶対電力が大きいフレームが消失すると、主観評価品質への影響が最も大きい、これは音声信号中の大きなレベルのフレームが消失すれば大きな影響を与えることを意味している。自己相関関数の最大値が大きいフレームが消失すると主観評価品質への影響は次に大きい。このことは、そのフレームの絶対電力が小さくても、音声信号があれば、自己相関関数の最大値が大きくなり、そのように音声信号を含むフレームが消失は小さい絶対電力でも比較的大きく影響することを意味している。
【0017】
従って、説明変数x1〜x3のうち少なくともx1とx3を用い、更にx2も用いると、一層なめらかな段階をもつ優先度p[i]が得られ、そのフレームの消失の主観評価品質への影響がより正確になる。以上の具体例は係数が負の値であり、評価値y[i]が小さい程、高い優先度p[i]とされる。
このようにして各フレームごとに決定された優先度p[i]は符号化部13よりのそのフレームiの符号P[i]と、パケット送出部15(図1)でパケットとして組立てられて出力される。
【0018】
第2実施形態
この第2実施形態は広帯域音声信号を複数帯域に分割して符号化を行なう場合にこの発明を適用したものである。
図3に示すように広帯域音声信号はフレーム分割部12で一定区間ごとのフレームに分割され、帯域分割部16で帯域通過フィルタを用いてF個の複数帯域に分割される。この帯域の分割方法は、音声信号s[n]が例えば16kHzサンプリングであれば上下各4kHz帯域(F=2)に分割し、32kHzサンプリングであればF=3で0〜4kHz帯域と、4kHz〜8kHz帯域と、8kHz〜16kHz帯域というようにウェーブレットで分割しても良いし、F=4で総て等間隔に各4kHz帯域に分割しても良い。各帯域分割された音声信号は個々の符号化器で、固定時間長(フレーム)ごとに符号化される。このときの音声ブロック(パケット)の分割イメージを図4に示す。図4の例はF=3でフレームごとに各帯域の信号がそれぞれブロック(パケット)とされ、フレームごとに3つのブロック(パケット)が生成されることになる。
【0019】
図3に示す例では音声信号を上、下2帯域に分割した場合で、分離された低域音声信号s1[n]、高域音声信号s2[n]はそれぞれ低域符号化部13、高域符号化部13で符号化される。また低域音声信号s1[n]、高域音声信号s2[n]はそれぞれ低域優先度決定部14、高域優先度決定部14に入力され、フレームごとのパケット優先度がそれぞれ決定される。
低域優先度決定部14の具体例を図5に示す。図5において図2と対応する機能構成部分に、同一番号に添字「」を付けてある。低域音声信号s1[n]は説明変数生成部141で式(1)又は(2)と同様に絶対電力又はその対数が計算されて説明変数x1[1,i]が生成される。説明変数生成部142で式(3)と同様に前フレーム電力比が計算されて説明変数x2[1,i]が生成される。また説明変数生成部143で式(4)、(5)と同様に自己相関関数の最大値が計算されて、説明変数x3[1,i]が生成される。
【0020】
更にこの実施形態では説明変数生成部146でこの帯域の絶対電力x1[f,i]と、他帯域の絶対電力とが入力されてこの帯域の絶対電力の総電力に対する比が次式(9)により計算され、説明変数x4[f,i]として出力される。
x4[f,i]=x1[f,i]/Σf=1 x1[f,i] (9)
図5の例ではF=2であるから、低域のx1[1,i]と高域のx1[2,i]により
x4[1,i]=x1[1,i]/(x1[1,i]+x1[2,i])
が計算される。
【0021】
指標値計算部144で説明変数x1[1,i],x2[1,i],x3[1,i],x4[1,i]が線形結合され、次式による指標値y[1,i]が計算される。
y[1,i]=α0+Σj=1 αjxj[1,i]^
xj[1,i]^=(xj[1,i]−xj[1]′)/γj[1]
この指標値y[1,i]は量子化部145で量子化され、優先度p[1,i]=f(y[1,i])が出力される。
【0022】
同様にして高域優先度決定部14で指標値
y[2,i]=α0+Σj=1 αjxj[2,i]^
xj[2,i]^=(xj[2,i]−xj[2]′)/γj[2]
が計算され、更に優先度p[2,i]=f(y[2,i])が出力される。パケット送出部15は、低域符号化部13よりの符号化符号P[1,i]と優先度p[1,i]が1つのパケットとして、また符号化部13よりの符号化符号P[2,i]と優先度p[2,i]が1つのパケットとして送出される。
【0023】
なお一般にF個に帯域分割された場合、f番目の帯域の指標値y[f,i]は
y[f,i]=α0+Σj=1 αjxj[f,i]^
xj[f,i]^=(xj[f,i]−xj[f]′)/γj[f]
により計算され、優先度p[f,i]はf(y[f,i])により求められる。
係数α4は例えば−0.43であり、α1より大とされる。つまり分割された帯域のフレームの全帯域電力に対する比が大きいことは、その部分に大きな電力の音声信号成分があることになりα1〜α4中で優先度を最も高くすることが好ましいことを意味している。
【0024】
第3実施形態
第3実施形態は単一帯域の品質スケーラブル符号化器、つまり各種の品質の符号化を行うことができる符号化器を用いて音声を符号化する場合にこの発明を適用した実施形態である。この場合の音声ブロック(パケット)の分割イメージは図4中に括弧書きで品質qとフレームとの関係を示すようになる。またQ=2段構成の、一般的な固定処理時間単位で音声信号を符号化する場合にこの発明を適用した機能構成を図6に示す。
【0025】
音声信号s[n]はフレーム分割部12でフレーム単位で分割され、1段目符号化部13でフレームごとに符号化されると共に1段目優先度決定部14で優先度p[1,i]が決定される。1段目符号化部13よりの符号化符号P[1,i]は1段目復号化部17で復号化され、この復号化信号が音声信号から減算部18で差し引かれて、1段目の残差信号(符号化誤差信号)e1[n]が生成される。この残差信号は2段目符号化部13でフレームごとに符号化されると共に2段目優先度決定部14で優先度p2[2,i]が決定される。2段目符号化部13よりの符号化符号P[2,i]は2段目復号化部17で復号化され、その復号化信号が、1段目の残差信号e1[n]から減算部18で差し引かれて2段目残差信号e2[n]が生成される。
【0026】
1段目優先度決定部14の具体例を図7に示す。図2に示した優先度決定部14と同様に、絶対電力の説明変数x1[1,i]と前フレーム電力比の説明変数x2[1,i]と、自己相関関数最大値の説明変数x3[1,i]とがそれぞれ説明変数生成部141と142と143で生成される。
この第3実施形態では更に説明変数生成部14で符号P[1,i]の品質、例えば信号に対する雑音比が説明変数x5[1,i]として生成される。即ち信号電力計算部147aでS=Σn=1 s[Ni+n]が計算され、また雑音計算部147bでE=Σn=1 e1[Ni+n]が計算され、これらの比の対数log10 E/Sが対数割算部147cで計算され、その結果が説明変数x5[1,i]として出力される。
【0027】
これら4個の説明変数は指標計算部144で線形結合されて指標値y[1,i]が計算される。例えば先の場合と同様に正規化部144aj(j=1,…,4)で説明変数xj[1,i]がそれぞれ正規化され、その正規化値xj[1,i]^が線形結合y[1,i]=α0+Σj=1 αjxj[1,i]^,xj[1,i]^=(xj[1,i]−xj[1]′)γjされる。この指標値y[1,i]は量子化部145で量子化され、1段目優先度p[1,i]が出力される。
【0028】
2段目優先度p[2,i]も同様に求められる。この場合は図7中に括弧書きで示しているように、1段目残差信号e1[n]の代りに2段目残差信号e2[n]がそれぞれ入力され、これら信号に対して同様に処理され、2段目優先度p[2,i]が出力される。
パケット送出部15(図6)では1段目符号P[1,i]と優先度p[1,i]を1つのパケットとし、2段目符号P[2,i]と優先度p[2,i]を1つのパケットとして出力する。
【0029】
この説明変数x5[q,i](q=1,2,…,Q)は、符号化に基づく特徴量といえる。これを求める計算式は一般的に示すと以下となる。
x5[q,i]=log10(Σn=1 eq[Ni+n]/Σn=1 s[Ni+n]
この場合の線形結合係数α5は−0.1程度が考えられる。qが大きいものは高品質の信号の再生には必要であるが、トラヒックが輻輳している状態では品質よりも伝送される情報の意味内容がより重要であるから、qが大きいパケットはx5[q,i]が小さくなり、かつα5が比較的小さいから優先度にあまり関与しないようになる。
【0030】
第4実施形態
一般的なスケーラブル複数帯域符号化器の場合は、第1実施形態に挙げた説明変数x1[i],x2[i],x3[i]の他に、第2実施形態に挙げた説明変数x4[f,i]と第3実施形態に挙げた説明変数x5[q,i]の双方を用いて指標値y[f,q,i]の演算を行なう。このときの音声ブロック(パケット)の分割イメージを図8に示す。
つまり各種サンプリング周波数、各種サンプル量子化精度(振幅ビット数)の組合せをもつ各品質の音声信号に符号化する、いわゆるスケーラブル符号化の場合で、図8はサンプリング周波数は3段階、量子化精度(品質)も3段階とした場合で周波数帯域がf=1,f=2,f=3の3帯域に分割され、振幅ビット長がq=1,q=2,q=3の3領域に分割され、互いに直交する周波数帯軸(帯域番号)と品質軸(振幅ビット分割番号)と時間軸(フレーム番号)で表わされていた3次元空間における1つの信号ブロック(パケット)として[f,q,i]で識別される。
【0031】
この場合の各説明変数はそれぞれ次式で求める。帯域f、品質(ビット分割番号q)の音声信号をsfqと表わす。
x1[f,q,i]=(1/N)Σn=1 sfq[Ni+n]
又はx1[f,q,i]=log10((1/N)Σn=1 sfq[Ni+n]
x2[f,q,i]=x1[f,q,i]/x1[f,q,i−1]
x3[f,q,i]=max(ρf,q,i[k])
ρf,q,i[k]=Σn=0 (sfq[Ni+n])(sfq[Ni+n+k])/Σn=0 (sfq[Ni+n])
x4[f,q,i]=x1[f,q,i]/Σf=1 x1[f,q,i]
x5[f,q,i]=log10(Σn=1 efq[Ni+n]/Σn=1 sfq[Ni+n]
指標値y[f,q,i]=α0+Σj=1 αjxj[f,q,i]
優先度p[f,q,i]=ff,q(y[f,q,i])
このようにして決定された優先度p[f,q,i]と対応する符号化符号P[f,q,i]とを1つのパケットとして送出する。
【0032】
第5実施形態
上述においては分割された各音声ブロックごとその符号化符号と優先度とを組として1パケットとして出力したが、第5実施形態では同一優先度の信号ブロックの符号をまとめて1つのパケットとして送出する。
例えば図9に示すようにフレーム分割された音声信号を、F個の帯域に帯域分割部16で分割し、これら1〜F番目の帯域信号をそれぞれ符号化部13〜13で符号化すると共に優先度決定部14〜14でそれぞれ優先度を決定する。この第5実施形態ではこれら符号化符号P[1,i]〜P[F,i]と優先度p[1,i]〜p[F,i]をパケット集約部19に供給し、所定フレーム数ごとに、同一優先度の符号をまとめて、1つのパケットとして、送出部15より送出する。
【0033】
入力音声信号s[n]を例えばウェーブレット分析を用いた0−4kHz,4kHz−8kHz,8−16kHzのF=3帯域に分割し、5msで時間方向に分割し、時間20msごとにパケット送出するものとする。各パケット送出番号tにおけるフレーム番号i=1,…,4とし、フレーム番号iの帯域番号fの信号ブロックの符号化符号をP[f,i]と、優先度をp[f,i]とそれぞれ表わす。各第t番目の送出区間における各ブロックの符号P[f,i]と優先度p[f,i]が図10Aに示すようになった場合パケット集約部19では図10Bに示すように、同じ優先度をもつブロックをそれぞれ集約して1つのパケットとする。この例では優先度p=4のブロック(1,2)及び(1,3)の符号P[1,2],P[1,3]をまとめ、かつその各符号P[1,2],P[1,3]の帯域−時間座標上の位置情報(1,2),(1,3)を優先度p=4のパケットに組み込む。優先度p=3のパケットには符号P[2,2],P[1,4]とその位置情報(2,2),(1,4)を組み込む。以下同様に同一優先度の符号をまとめ、その位置情報と共に1つのパケットとして組み込む。
【0034】
こうして同一の優先順位をもつ符号が集約されたパケットは、この例では20ms毎にネットワークへと送出される。このとき、ネットワークの状況に応じて、優先度が低いパケットは品質への影響が少ないので、送出しなくても良い。また、ネットワークの各ノードにおいてトラフィックの混雑状況に応じて低い優先度のパケットは破棄されても通話品質への影響は最小限に留められる。
こうして、ネットワークに送出されたパケットは、受信側において図11に示すようにパケット分解部21でt番目の送出区間の全てのパケット、図10の場合は優先度p=1〜p=4の4つのパケットP[1,t]〜P[4,t]を図10に示した組み立てと逆の手順を経て帯域−時間座標上に再構成し、各帯域符号P[1,i]〜P[F,i]を復号化部22〜22でそれぞれ帯域音声復号に復号する。このとき、受信側に到達しなかった低い優先度の符号がある場合は、基本的にはその符号に対する復号化部の動作を停止する。高優先度の符号が到達しない場合は、フレーム(ブロック)消失対策をブロック消失補償部23〜23の対応する部分で行い、品質低下を避ける。このようにして復号され、必要に応じて消失補償された各帯域音声信号は帯域合成部24で合成されて再生音声信号s[n]として出力される。なおパケット分解部21よりブロック消失情報がブロック消失補償部23〜23へ供給されている。このブロック消失補償は公知の技術により行えばよい。
【0035】
図8に示したように音声信号を3次元座標(空間)にブロック化する第4実施形態の場合も所定のフレーム数ごとに、同一優先度のブロック符号をその位置情報と共にまとめて1つのパケットとして送出するようにしてもよい。
上述ではこの発明を音声信号に適用したが、音楽信号、映像信号にも適用できる。また符号化に基づく特徴量の説明変数としては次のものなども考えられる。例えば、予測符号化を用いた音声符号化器によっては語頭などのパケットが破棄されると、その後の音声品質(SN比)が著しく劣化する可能性がある。そのような破棄されることによって伝播するSN比の劣化も説明変数xj(m,i)としてもよい。音声信号の特徴量の説明変数、符号化に基づく特徴量の説明変数の何れも上述した例に限らず、各種のものを使用することができる。
【0036】
上述したこの発明のディジタル信号パケット送出装置はコンピュータにより機能させることもできる。その場合は上述したこの発明の方法の各ステップをコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスクなどの記録媒体から当該装置のコンピュータにインストールし、あるいは通信回線を介してダウンロードして実行させればよい。
【0037】
【発明の効果】
フレームが消失した時のその再生信号の主観品質評価は、その信号の一つの物理量(例えば絶対的な電力)のみから求まるものではないが、この発明によれば信号の特徴量の説明変数及び/又は符号化に基づく特徴量の説明変数の複数を用いて、各々のパケットの優先度を決定するための指標値を計算しているため優先度を適切なものとすることができ、かつ優先度の段階をなめらかなものとすることができ、優先度の段階数を多くすることができる。
【0038】
また優先度が妥当でない場合、新たに説明変数を付け加えてあるいは入れ替えて優先度分けの精度を向上させることも可能である。
この優先度の決定は、説明変数xj[m,i]の数が増えても、優先度を求める指標値y[m,i]が簡単な1次結合で表現できるから比較的容易に説明変数の追加、変更をすることができ、拡張性に富む。
説明変数の設定が拡張性に富むこと、つまり単一の値から求めることでなく性能が向上できること、指標値を優先度に量子化するしきい値の決定そのものを重回帰分析を用いて自動化することによって容易に求めることができる。
【図面の簡単な説明】
【図1】この発明の第1実施形態の機能構成例を示すブロック図。
【図2】図1中の優先度決定部14の具体的機能構成例を示すブロック図。
【図3】この発明の第2実施形態の機能構成例を示すブロック図。
【図4】信号を帯域−時間座標のブロックに分割した例を示す図。
【図5】図3中の低域優先度決定部14の具体的機能構成例を示すブロック図。
【図6】この発明の第3実施形態の機能構成例を示すブロック図。
【図7】図6中の1段目優先度決定部14の具体的機能構成例を示すブロック図。
【図8】この発明の第4実施形態に用いる品質−帯域−時間の3次元座標に信号をブロック分割する例を示す図。
【図9】この発明の第5実施形態の機能構成例を示すブロック図。
【図10】図9中のパケット集約部19の処理を説明するための図。
【図11】図9に示したパケット送出装置と対応するパケット受信装置の機能構成例を示すブロック図。

Claims (3)

  1. ディジタル信号をフレームごとに分割し、
    その分割されたフレームごとのディジタル信号を符号化し、
    上記符号化に基づく特徴量又は/及び上記ディジタル信号の特徴量を説明変数として求め、
    上記説明変数の複数個を線形結合して指標値を求め、
    その指標値を量子化して優先度を求め、
    この優先度と上記符号化の符号とをパケットとして出力するディジタル信号パケット出力方法。
  2. ディジタル信号をフレームごとに分割するフレーム分割部と、
    上記分割されたフレームごとのディジタル信号を符号化する符号化部と、
    上記符号化に基づく特徴量、及び/又は上記分割されたフレームごとのディジタル信号の特徴量を説明変数として生成する複数の説明変数生成部と、
    上記複数の説明変数を線形結合して指標値を計算する指標値計算部と、
    上記指標値を量子化して優先度を生成する量子化部と、
    上記優先度及び上記符号化部よりの符号をパケットとして出力するパケット送出部と、
    を具備するディジタル信号パケット出力装置。
  3. 請求項1記載のディジタル信号パケット出力方法の各ステップをコンピュータに実行させるためのプログラム。
JP2003063445A 2003-03-10 2003-03-10 ディジタル信号パケット出力方法、その装置及びプログラム Expired - Lifetime JP3920796B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003063445A JP3920796B2 (ja) 2003-03-10 2003-03-10 ディジタル信号パケット出力方法、その装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003063445A JP3920796B2 (ja) 2003-03-10 2003-03-10 ディジタル信号パケット出力方法、その装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2004274454A true JP2004274454A (ja) 2004-09-30
JP3920796B2 JP3920796B2 (ja) 2007-05-30

Family

ID=33125019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003063445A Expired - Lifetime JP3920796B2 (ja) 2003-03-10 2003-03-10 ディジタル信号パケット出力方法、その装置及びプログラム

Country Status (1)

Country Link
JP (1) JP3920796B2 (ja)

Also Published As

Publication number Publication date
JP3920796B2 (ja) 2007-05-30

Similar Documents

Publication Publication Date Title
JP4963963B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法
RU2418324C2 (ru) Поддиапазонный речевой кодекс с многокаскадными таблицами кодирования и избыточным кодированием
KR101246991B1 (ko) 오디오 신호 처리 방법
JP5658307B2 (ja) ディジタルメディアの効率的コーディング用のバンドを入手するための周波数セグメント化
US7383180B2 (en) Constant bitrate media encoding techniques
US7340394B2 (en) Using quality and bit count parameters in quality and rate control for digital audio
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
JP5706445B2 (ja) 符号化装置、復号装置およびそれらの方法
JP2010020346A (ja) 音声信号および音楽信号を符号化する方法
US11443751B2 (en) Phase reconstruction in a speech decoder
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
JP4033840B2 (ja) 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体
JP2000267699A (ja) 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
JP2013084002A (ja) 音声コーデックの品質向上装置およびその方法
JP2003316391A (ja) 音声復号装置及び音声復号方法
JPH09152896A (ja) 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置
JP3722366B2 (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
US10847172B2 (en) Phase quantization in a speech encoder
JP3920796B2 (ja) ディジタル信号パケット出力方法、その装置及びプログラム
JP2005114814A (ja) 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体
JP4004431B2 (ja) パケット送出装置、及びこれらに用いる優先度に関する指標値の算出方法とそのプログラム
JP2007072264A (ja) 音声量子化方法、音声量子化装置、プログラム
JP3496618B2 (ja) 複数レートで動作する無音声符号化を含む音声符号化・復号装置及び方法
JP2005004119A (ja) 音響信号符号化装置及び音響信号復号化装置
JP2000196452A (ja) オーディオ信号符号化方法及び復号化方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050126

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061018

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070215

R150 Certificate of patent or registration of utility model

Ref document number: 3920796

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110223

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120223

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130223

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term