JPH07334191A - パケット音声復号方法 - Google Patents

パケット音声復号方法

Info

Publication number
JPH07334191A
JPH07334191A JP6123712A JP12371294A JPH07334191A JP H07334191 A JPH07334191 A JP H07334191A JP 6123712 A JP6123712 A JP 6123712A JP 12371294 A JP12371294 A JP 12371294A JP H07334191 A JPH07334191 A JP H07334191A
Authority
JP
Japan
Prior art keywords
packet
voice
decoded
signal
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6123712A
Other languages
English (en)
Other versions
JP3240832B2 (ja
Inventor
Kazunori Mano
一則 間野
Hiroshi Konishi
宏志 小西
Naka Oomuro
仲 大室
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP12371294A priority Critical patent/JP3240832B2/ja
Publication of JPH07334191A publication Critical patent/JPH07334191A/ja
Application granted granted Critical
Publication of JP3240832B2 publication Critical patent/JP3240832B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Error Detection And Correction (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【目的】 切断、遅延、消失音韻なく音声を出力する。 【構成】 パケットP3 の復号音声V3 の終了時に、パ
ケットP4 の遅延により復号音声V4 が得られないと、
その前の音声から補間音声V3 ′を出力し、遅延パケッ
トP4 が受信されると、その復号音声V4 を出力し、そ
の音声V4 以後における無音区間を圧縮し、補間音声V
3 ′の長さ分だけ、パケットP5 ,P6 の各復号音声V
5 ,V6 中の無音区間を圧縮して、信号V5 #,V6
を出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声信号が符号化さ
れ、その符号化情報がパケット化して伝送されてきたパ
ケットを受信復号して音声信号を出力するパケット音声
復号方法に関する。
【0002】
【従来の技術】まず、パケットによる音声の送受につい
て説明する。図10に示すように、端子1より入力した
音声信号は、入力バッファ2に格納されたのち、符号化
部3で音声符号化される。その符号化音声は、送信バッ
ファ4に一時的に蓄えられたのち、パケットとして端子
5からパケット網11に送出される。送出パケットは、
受信器の入力端子6で受信し、受信バッファ7に一時的
に蓄えられたのち、復号部8で復号される。その復号音
声は出力バッファ9に送られ、端子10より音声出力さ
れる。ここで使用する音声符号化方式としては、サンプ
ルごとの符号化方式あるいは、複数サンプルのブロック
符号化方式のいずれでもよい。例えば、線形PCM,I
TU−T勧告G.711(μ則PCM)やG.726
(ADPCM),G.728(LD−CELP)といった方式やCE
LP(Code Excited Linear Prediction:符号励振線形
予測)符号化方式でもよい。
【0003】パケット送受のタイミングを図11に示
す。図10中の端子5から送信される10個の送信パケ
ットP1 〜P10(a)に対し、端子6で受信される受信
パケット(b)は時間的に遅れるが、この図では全ての
パケットP1 〜P10が同一遅れで到着し、つまり最初の
受信パケットP1 の到達時刻から予期される到着時刻に
それぞれ遅れることなく到着した場合を示している。こ
の受信パケットを復号した端子10からの音声出力は図
11(c)のようになる。このように全ての受信パケッ
トが遅れないで到着した場合には、出力音声信号(c)
に切断等の劣化は生じない。
【0004】ところが、図12(a)に示すように、受
信パケットP4 ,P8 が到着予定時刻t4 ,t8 よりも
遅延して到着した場合には、復号出力音声信号は図12
(b)に示すように、パケットP3 の復号音声信号V3
とパケットP4 の復号音声信号V4 との間に切断が生
じ、同様に復号音声信号V7 とV8 との間に切断が生じ
る。
【0005】この従来のパケット受信復号処理は図13
に示すように、音声パケットを受信し(S1 ),その各
音声パケットを復号し(S2 ),その復号音声信号をバ
ッファリングし(S3 ),そのバッファに復号音声信号
があるかを調べ(S4 ),音声信号があればその音声信
号を出力し(S5 ),音声信号がなければ無音が出力さ
れる(S6 )。このように受信パケットから音声を復号
して出力するが、音声出力時点で出力する音声がない場
合には、遅れてきたパケットが出力されるまでは、零
(無音)出力とし、図12(b)に示すようになり、か
つパケットP4 ,P8 の遅延により、出力音声に切断区
間ができ、また、その切断区間の累積時間がそのまま出
力音声の累積遅延時間となってしまう。
【0006】このような音声切断を防ぐため従来におい
ては、初期音声出力時刻を遅くし、想定されるパケット
の遅れを吸収し、連続的に音声出力が可能となる程度に
十分大きな出力バッファを用意することが提案されてい
る。この場合には、例えば図12(c)に示すように初
期復号音声信号V1 を出力する時刻を十分な時間T3
らせて、切断がなくなる。しかし、音声出力の遅延が大
きくなり、会話を想定した低遅延の音声通信としては不
適合である。
【0007】従来において出力遅延のない復号方法とし
ては、図14に示す処理が提案されている。つまり音声
パケットを受信し(S1 ),その音声パケットが予定時
刻より遅れた遅延パケットであるか否かを判定し
(S2)、遅延パケットでなければそのパケットを復号処
理し(S3 ),バッファリングし(S4 ),その復号音
声出力する(S5 )。遅延パケットの場合は、そのパケ
ットを欠落したものとみなして、無音を出力する
(S6 )。この場合は図12(d)に示すように、出力
遅延はないが、遅れて復号ができないパケットP4 の音
声信号V4 と、パケットP8の音声信号V8 と相当する
区間は、それぞれ切断区間T4 ,T5 となってしまう。
【0008】そこで、従来において図15にブロック構
成を示し、その処理手順を図16に示すように、現在フ
レームの復号に間に合わないパケットは欠落したものと
して扱い、現フレームより先に到着したパケットのフレ
ーム音声から外挿補間によって、現在フレームの復号音
声とする方法が提案されている。つまり制御部20で現
在フレームの復号すべき情報パケットの到達の有無を受
信バッファ7について監視し、必要なパケットが遅れて
いる場合には、制御部20は、スイッチ22を切り換え
る出力バッファ9の入力側を復号部8の出力側から補間
部21の出力側に接続して、補間部21では既に得られ
ている復号音声情報を用いて補間音声を生成する。図1
6に示すように、音声パケットを受信し(S1 ),それ
が予定時刻より遅れた遅延パケットか否かを調べ
(S2 ),遅延パケットでなければ音声復号化し
(S3 ),バッファリングし(S4 ),その後、音声信
号を出力する(S5 )。遅延パケットであれば既に受信
されている復号音声信号による補間処理を行って
(S7 ),バッファリングする(S4 )。
【0009】音声の補間方法としては、例えば特公昭6
1−7779号「音声瞬断時補間受信装置」に示す手法
を用いることができる。この手法は受信音声信号の周期
を測定するピッチ周期検出手段をもち、補間が必要な場
合には、得られたピッチ周期に基づいて補間の開始時点
から必要な時間だけピッチ周期前の信号を繰り返す。ま
た、R.V.Coxらの“Robust CELP coders for noisy
backgrounds and noisy channels",IEEE Proc. ICASSP
-89, pp.739-742(1989) にCELP系の音声符号化方式
での補間方法が述べられている。つまり、CELP系の
音声符号化方式では、音声符号化情報として線形予測係
数、ピッチ周期、利得、励振符号が伝送される。あるフ
レームを補間する場合には、前のフレームの各パラメー
タを繰り返して使用すればよい。さらに、補間区間が長
い場合には、少しずつ利得を小さくしてもよい。
【0010】図15,図16に示す補間をする場合の出
力音声の様子を図12(e)に示す。つまり図12
(d)中のパケットP4 の遅延に基づく切断区間T4
その直前の復号音声信号V3 を利用した補間音声信号V
3 ′で補間され、同様にパケットP8 の遅延に基づく切
断区間T5 は直前の復号音声信号V7 から作られた補間
信号V7 ′で補間される。この方法では、先に到着した
フレームだけから欠落したパケットを補間している。従
って、現在フレームの音声内容がその直前のフレームの
内容と変わらずに、同じ音韻が継続する場合には問題は
ない。しかし、欠落したパケットの中だけに含まれてい
た音韻があった場合には、その内容を補間によって復元
することはできない。
【0011】また従来において音声補間の場合、図17
(a)に示すようにパケットPK による復号音声信号V
K が終わった時刻t0 にはパケットPK+1 の遅延のた
め、その遅延時間と対応する区間Ti はパケットPK
らの補間音声信号VK ′が補間され、その補間区間Ti
の終了時点t1 に遅延パケットPK+1 の復号音声信号V
K+1 (図17(b))をそのまま接続するとt0 とt1
には何らの制約がないので、その接続した信号は図17
(c)に示すように、接続点t1 の前後で不連続にな
り、ピッチの周期性も乱れてしまう。また補間時間Ti
だけ遅れた音声出力となる。さらに復号に既に受信され
た信号を利用する場合は、補間音声VK ′を利用して遅
延パケットPK+1 を復号することになり、送信側では補
間音声のことを考慮して符号化して送信することは不可
能であるから、送信側(符号器側)と受信側(復号器
側)とで復号過程が異なり、送信側と同じ音声を復号す
ることができなくなってしまう。
【0012】
【発明が解決しようとする課題】先に説明したように、
従来のパケット音声復号方法において、音声補間しない
切断区間のある復号音声とする場合は、ぶつぶつととぎ
れた聴感的に非常に劣化した音声となってしまう。ま
た、バッファリングによる方法により、切断を少なくす
る場合は大きな時間遅れが必要となり、実時間の音声対
話が不自由になる。さらに、遅延パケットを欠落パケッ
トとして補間する場合は、その遅延パケット中にだけあ
った音韻は補間できず、正しい音声内容を復元できな
い。
【0013】この発明の目的は、上記の欠点を解決する
ためのもので、ある制限時間内のパケット遅延であれ
ば、遅延したフレーム音韻の欠落をなくし、スムーズな
補間音声を出力して切断区間をなくし、かつ、時間遅延
が大きくならないパケット音声復号方法を提供すること
にある。
【0014】
【課題を解決するための手段】この発明では、パケット
が遅れた場合には、まず補間によって得た補間音声信号
を、その前の音声信号に続けて出力し、その後、予め定
めた制限時間内に遅れたパケットが到着した場合には、
それを復号し、その復号音声信号を補間音声信号の後に
接続させるが、請求項1の発明では、遅れたパケット
が、遅れないで到着した場合にその復号音声信号の終了
まで、遅れた音声パケットの復号音声を時間軸圧縮して
接続させ、請求項2の発明では、遅れたパケットの全て
を復号し、その復号音声信号以後における無音区間を、
補間音声に用いた時間分だけ圧縮して時間調整を行い、
請求項3の発明では、請求項2の発明においてさらに遅
れたパケットの有音区間も時間圧縮して、これと無音区
間での圧縮との両者で補間音声区間分の時間調整を行
う。
【0015】請求項1,請求項2あるいは請求項3のい
ずれかに記載されるパケット音声復号方法において、補
間音声にピッチ周期性があるときに、遅延パケットの音
声を接続する場合には、補間音声の開始時刻からピッチ
周期の整数倍の時刻までを補間音声区間とし(請求項4
の発明)、パケットの復号に過去の復号音声が必要な場
合には、遅れたパケットの復号に補間音声信号の直前の
音声情報を用い(請求項5の発明)、補間音声信号と遅
延パケットの復号音声信号との接続を、これら両信号に
補間用の窓関数をそれぞれ乗じて加算して行う(請求項
6の発明)。
【0016】
【作 用】請求項1の発明では、パケットが遅れるとそ
のパケットが到着して、復号されるまでの間、先に到着
したパケットの符号化音声情報から補間音声が出力さ
れ、音声の切断がなくなり、切断による品質劣化が防げ
る。また遅れた音声パケットが到着して、復号音声信号
を接続することにより、音韻を失うことなく、音声内容
を確実に再生することができる。しかも、この遅れたパ
ケットの復号音声信号は時間軸圧縮されているから、音
声遅延の累積がない。
【0017】請求項2の発明では、パケットが遅れると
そのパケットが到着して、復号されるまでの間、先に到
着したパケットの符号化音声情報から補間音声が出力さ
れ、音声の切断がなくなり、切断による品質劣化を防ぐ
ことができる。また遅れた音声パケットが到着して、復
号音声信号が接続されるため、そのパケットに存在する
音声内容を確実に再生することができる。さらに、この
復号音声信号以後の音声信号の無音区間が時間軸圧縮さ
れるため、音声の遅延が累積していくということがな
い。
【0018】請求項3の発明では、パケットが遅れると
そのパケットが到着して、復号されるまでの間、先に到
着したパケットの符号化音声情報から補間音声が出力さ
れ、音声の切断がなくなり、切断による品質劣化を防ぐ
ことができる。遅れた音声パケットが到着して、その復
号音声信号が接続されることにより、そのパケットに存
在する音声内容を確実に再生することができる。さら
に、この復号音声信号以後の音声信号の無音区間および
有音区間において、時間軸圧縮が行われることにより、
音声の遅延が累積していくということがない。
【0019】請求項1,請求項2あるいは請求項3のい
ずれかに記載されるパケット音声復号方法において、請
求項4の発明では、補間音声にピッチ周期性があるとき
に、遅延パケットの音声を接続する場合には、補間音声
の開始時刻からピッチ周期の整数倍の時刻までを補間音
声とされるため、補間音声の開始時刻の波形と補間終了
時刻の波形とが1ピッチの同じ位置になるので、それ以
後に遅延パケットの復号音声を接続しても接続境界で不
連続となることがない。請求項5の発明では遅延パケッ
トの復号に過去の復号音声が必要な場合には、補間する
直前の音声情報を用いて復号されるため、音声補間処理
は受信側のみであるが、後続の音声復号処理に影響を与
えることがなく、後続の復号音声としては送信側と同じ
波形が生成される。請求項6の発明では、補間音声と遅
延パケット復号音声を補間用の窓関数を乗じて接続する
ことにより、補間途中で音声が変化した場合でも、連続
的に重み付け加算されるので、接続境界の不連続性が弱
まる。
【0020】
【実施例】請求項1の実施例 図1に、請求項1の発明の実施例が適用された音声パケ
ット通信の受信側ブロック構成を、図15と対応する部
分に同一符号を付けて示す。図1において、端子6より
受信したパケットは、受信バッファ7に蓄えられ、送信
パケット順に並べ変えられる。制御部30では、図2に
示す流れ図に示すように、音声パケットを受信すると
(S1 ),復号しようとする音声パケットが遅れている
かどうかを判断する(S2 ),受信バッファ7よりのパ
ケットは復号部8で、順番に符号化情報を復号して復号
音声信号を生成する。遅延パケットでない場合には、そ
の復号音声信号は切換え器33,34の各接点N側を通
じて出力バッファ9に送られ、出力バッファ9を経て端
子10より音声信号が出力される。図2の流れ図では、
遅れていないパケットが音声復号処理され(S3 ),さ
らにバッファリングされた後(S4 ),音声は出力され
る(S5 )。
【0021】制御部30が遅延パケットであると判断し
た場合には、図2に示すように、補間部31でその遅延
パケットが到着し、復号するまで音声補間処理を行う
(S6)。この場合の補間処理は、〔従来の技術〕の項
で述べた波形のピッチ周期抽出に基づく繰り返し処理、
またはCELP系の場合には前の伝送パラメータを繰り
返して使用する。
【0022】この音声補間は遅延パケットが到来するま
で行われ(S7 ),遅延パケットが到来すると、その遅
延パケットが音声復号処理され(S8 ),その復号音声
信号は時間軸圧縮部32で時間軸圧縮され、その圧縮さ
れた信号は、その遅延パケットが遅れることなく到来し
たときのその復号音声信号の終了時刻まで、切換え器3
3,34の各接点A側を通じて出力バッファ9に出力さ
れ(S4 ),補間音声に続けて端子10より出力される
(S5 )。
【0023】ここで使用する時間軸圧縮方法としては、
例えばD.Malah氏の論文:" Time-Domain Algorithms
for Harmonic Bandwidth Reduction and Time Scaling
ofSpeech Signals", IEEE Trans. on Asouctics, Spee
ch, and Signal Processing,vol. ASSP-27, No.2, pp.1
21-133,(1979)にある時間領域調波構造伸縮(TDHS :Tim
e Domain Harmonic Scaling) アルゴリズム、または同
様な手法である森田・板倉氏の研究会資料:“自己相関
法による音声の時間軸での伸縮方式とその評価”,電子
情報通信学会電気音響研究会技術報告EA86−5(1
986)のアルゴリズムを利用する。これらは、ピッチ
周期単位で前後の波形に重み付け窓をかけ、その区間を
重ね合わせることによって時間軸圧縮する。図3にTD
HSアルゴリズムによる2:1の圧縮の様子を示す。ま
ず、図3(a)に示す音声信号からピッチ周期Tp を求
め、次に例えば同図(b)に示すように時刻t1 からそ
れぞれ1ピッチ周期Tp 前後の各時刻t0 ,t1 に直線
的に0より1になる重み付け窓関数を同図(a)の2ピ
ッチ周期の音声信号に乗じて、時刻t0 〜t1 ,t 1
2 の各音声波形を同図(c)の波形とし、これら両波
形を重ね合わせ加算して、同図(d)に示す1ピッチ周
期Tp の時間軸圧縮音声信号を得る。またピッチ周期が
ない区間に対しても、適当な周期で重ね合わせを行うこ
とにより時間軸圧縮を行う。
【0024】図4(a)に示すように、図12(a)と
同様にパケットP4 ,P8 が遅れた場合は、図1,図2
による処理により出力される出力音声信号は図4(b)
に示すようになる。パケットP4 が遅れたため、パケッ
トP3 の復号音声信号V3 が終了した時点t3eにパケッ
トP4 の復号音声信号V4 が間に合わず、それまでの音
声信号から生成された補間音声信号V3 ′が復号音声信
号V3 に連続して出力され、その後、この例では時刻t
5 にパケットP4 の復号音声信号V4 が得られ、その時
間圧縮音声信号V4 * が補間音声信号V3 ′と連続して
出力され、遅れたパケットP4 が予期された正しい時刻
に到着したとした時のその復号音声信号V4 の終了時刻
4eになると圧縮音声信号V4 * の送出を停止して、次
のパケットP4 の復号音声信号V5 を時点t4eから出力
する。つまり、この例ではパケットP4 が到着予定時刻
より所定時間以上遅れると、パケットP3 の復号音声信
号V3 が終了してしまい、その終了時刻t3eにパケット
4 の復号音声信号V4 が間に合わなくなり、補間音声
信号を出力し、遅れたパケットP4 の復号音声信号V4
が、パケットP4 が遅れないときの復号音声信号V4
終了時刻t4e前に得られると、復号音声信号V4 の圧縮
音声信号V4 * を、これが得られてから時刻t4eまで出
力する。
【0025】この場合、圧縮音声信号V4 * の挿入区間
5 〜t4eは1ピッチ周期TP の圧縮音声信号V4 *
始めをt5 に合わせ、または1ピッチ周期TP の圧縮音
声信号V4 * の終わりをt4eに合わせるようにするとよ
い。同様にしてパケットP7の復号音声信号V7 が終了
した時刻t7eに、パケットP8 の復号音声信号が間に合
わず、補間音声信号V7 ′で補間され、遅延パケットP
8 の受信で、この例では時刻t9 過ぎから遅れないで受
信された場合のパケットP8 の復号音声信号の終了時刻
8eまで復号音声信号V8 の圧縮音声信号V8 * が出力
される。このようにして補間音声によって切断区間がな
く、また圧縮音声信号V4 * ,V8 * が出力されるので
復号音声信号V4 ,V8 の各音韻内容が失われることは
ない。また補間音声信号V3 ′と圧縮音声信号V4 *
の合計の時間長が1つのパケットの復号音声信号長に一
致するので最終的な出力音声の遅延はないので、音声対
話通信が可能である。
【0026】請求項2の実施例 図5に、請求項2の発明の実施例が適用された音声パケ
ット通信の受信側ブロック構成図を示す。この場合は復
号部8の出力側は補間部41と、無音区間検出部42
と、無音区間時間軸圧縮部44と、スイッチの接点Nと
に接続され、無音区間時間軸圧縮部44の出力側はスイ
ッチ44の接点Aに接続される。制御部40では、図6
のフロー図に示すように、音声パケットを受信し
(S1 ),その後、これから復号しようとする音声パケ
ットが遅れているかどうかを判断する(S 2 )。遅延パ
ケットでない場合には、復号化処理をし(S3 ),その
復号音声信号に無音区間があるかを調べ(S4 ),無音
区間でなければ出力バッファ9に復号音声信号を送り
(S5 ),無音区間があれば圧縮処理が必要かを調べ
(S6 ),圧縮処理が必要でなければ復号音声信号を切
換え器43,45の各接点Nを通じて出力バッファ9へ
送り(S5 ),出力端子10へ出力される(S7 )。
【0027】ステップS2 において遅延パケットであっ
た場合には、遅延パケットが到着し、復号するまで音声
補間処理を行う(S8 ,S9 )。この場合の補間処理
は、従来の技術の項で述べた波形のピッチ周期抽出に基
づく繰り返し処理、またはCELP系の場合には前の伝
送パラメータを繰り返して使用して行う。その補間中
に、遅延パケットが得られると音声復号処理を行い(S
10),補間音声信号に続けて出力バッファ9を経て、端
子10より出力する。このままでは出力音声に切断区間
はできないが、補間に要した時間だけ出力が遅れてく
る。そこで、無音区間検出部42で、復号音声信号の無
音区間検出を行い、無音区間が検出され(S4 ),かつ
圧縮処理を必要とする場合(S6 )は、無音区間時間軸
圧縮部44で無音復号音声信号を補間に要した時間だけ
圧縮する(S11)。これにより、出力遅延をなくすこと
ができる。
【0028】無音区間検出に関しては、送信パケットに
予め無音か無音でないかの識別子が付与してある場合に
はその識別子を使用する。識別子がない場合には、受信
側で例えば現在フレームのパワPC と有音区間の平均パ
ワPV とのパワ比(PC /P V )が一定しきい値以下で
あれば無音区間であると判断する。無音区間の時間軸圧
縮法としては、圧縮に必要な時間分をそのまま復号音声
信号から切断して切断前後の無音区間を接続させるだけ
でよい。無音区間に、背景雑音等が含まれている場合に
は、図3に示した時間軸圧縮において、ピッチ周期TP
のかわりに、予め決めた特定の周期をとり、重み付け窓
をかけて重ね合わせてもよい。1パケットの無音区間が
補間音声の時間に比較して短ければ、複数区間に分けて
無音区間圧縮を適用することにより、各区間での圧縮率
が低くなり、音声劣化も少ない。
【0029】図4(c)に、図4(a)の受信パケット
に対する本実施例の出力音声タイミングを示す。ここ
で、パケットP4 の遅れにより時刻t3eから補間音声信
号V3′を補間し、時刻t5 に遅れたパケットP4 の復
号音声信号V4 が得られると、これを直ちに補間音声信
号V3 ′に続け、その全ての復号音声信号V4 を出力
し、その後の復号音声信号中のV5 とV6 との無音区間
を圧縮し、V5 ,V6 より短い信号V5 ♯,V6 ♯とし
て補間音声信号V3 ′の長さ分を吸収している。同様に
パケットP8 の遅れにより、補間信号V7 ′を補間し、
パケットP8 の復号信号V8 が得られると、そのV8
全体を補間信号V7 ′に続けさせ、その直後の復号音声
信号V9 には無音区間がなく、さらにその後の復号音声
信号V10中の無音区間を補間信号V7 ′の長さだけ圧縮
し、圧縮音声信号V10♯とした場合である。このように
して補間音声信号によって切断区間がなく、また遅延パ
ケットP4 とP8 の各復号音声信号V4 ,V8 がそのま
ま出力されるので音韻内容が失われることはない。ま
た、補間音声信号V3 ′,V7 ′に要した時間長を音声
信号V5 ♯,V6 ♯,V10♯の無音区間圧縮時間と同じ
にしているので、最終的な出力音声の遅延はなく、実時
間での音声対話通信が可能である。
【0030】請求項3の実施例 図7に、請求項3の発明の実施例を適用した音声パケッ
ト通信の受信側ブロック構成図を示す。図7において、
復号部8の出力側は無音/有音区間判定部52と、無音
区間時間軸圧縮部54と、有音区間時間軸圧縮部55
と、切換え器53の接点Nとに接続され、無音区間時間
軸圧縮部54の出力側、有音区間時間軸圧縮部55の出
力側にそれぞれ切換え器53の接点A1 ,A2 に接続さ
れている。制御部50は図8に示す流れ図に示すよう
に、パケットを受信すると(S1 ),これから復号しよ
うとする音声パケットが遅れているかどうかを判断し
(S2 ),遅延パケットでない場合は音声復号処理して
復号音声信号を生成し(S3 ),その復号音声信号が無
音区間かの判定がされ(S4 ),無音区間でも、有音区
間のいずれでもそれぞれ圧縮処理を必要とするかが調べ
られ(S5 ,S6 ),いずれも圧縮処理を必要としない
場合は出力バッファ9に復号音声信号が送出され
(S7 ),出力バッファ9を経て端子10より音声信号
が出力される(S8 )。
【0031】ステップS2 で遅延パケットであった場合
には、遅延パケットが到着し、音声信号を復号するま
で、音声補間処理が行われる(S9 ,S10),この場合
の補間処理は、従来の技術の項で述べた波形のピッチ周
期抽出に基づく繰り返し処理、またはCELP系の場合
には前の伝送パラメータを繰り返して使用する。その補
間中に、遅延パケットが到来し、その音声復号処理がな
されると(S11),補間音声信号に続けて出力バッファ
9を経て、端子10より復号音声信号が出力される。こ
の処理だけでは、出力音声に切断区間はできないが、補
間に要した時間だけ出力が遅れてくる。そこで、無音/
有音区間判定部52で復号音声の無音/有音の判定が行
われ、無音と判定された音声信号に対しては(S4 ),
圧縮処理を必要とする場合は(S6 ),無音区間時間軸
圧縮部54で補間に要した時間を圧縮する(S12)。ま
たステップS4 で有音と判定された音声信号に対して
は、圧縮処理を必要とする場合は(S5 ),有音区間時
間軸圧縮部55で補間に要した時間を圧縮する
(S13)。これにより出力遅延をなくすことができる。
【0032】無音/有音区間判定部52では、送信パケ
ットに予め無音か有音かの識別子が付与してある場合に
はその識別子を使用する。識別子がない場合には、受信
側で例えば現在区間のパワPC と有音区間の平均パワP
V との比(PC /PV )が一定しきい値以下であれば無
音区間であるとし、そうでなければ有音区間とする。無
音区間の時間軸圧縮法としては、圧縮に必要な時間分を
そのまま復号音声信号から切断して切断前後の無音区間
を接続させるだけでよい。無音区間に、背景雑音等が含
まれている場合には、図3に示した時間軸圧縮におい
て、ピッチ周期T P のかわりに予め決めた特定の周期を
とり、重み付け窓をかけて重ね合わせてもよい。有音区
間の圧縮法は、ここでは請求項1の発明の実施例で述べ
た図3に示したTDHSによる時間軸圧縮法を用いる。
【0033】補間時間が長く、後続の一区間(1パケッ
トの復号音声信号期間)での圧縮時間が補間音声の時間
に比較して短時間しかとれない場合には、複数区間に分
けて無音/有音区間圧縮を適用することにより、各区間
での時間軸圧縮すべき時間の割合すなわち、圧縮率が低
くなり、音声劣化も少ない処理が可能である。図4
(d)に、図4(a)の受信パケットに対する本実施例
の出力音声タイミングを示す。ここで図4(c)と対応
する部分に同一符号をつけてあり、補間音声信号V3
にパケットP4 の復号音声信号V4 を接続するが、この
例では復号音声信号V4 の有音信号が時間軸圧縮され、
圧縮信号V4 * が接続される。ただし、図4(b)と異
なり、復号音声信号V4 の圧縮信号を途中で断にするこ
となく、全てを用いる。この圧縮時間だけでは補間信号
3 ′の時間長には不足で、その後の復号音声信号
5 ,V6 中の各無音区間が圧縮され、無音圧縮信号V
5♯,V6 ♯として順次接続され、有音圧縮信号V4 *
と無音圧縮信号V5 ♯,V 6 ♯との各圧縮時間の合計が
補間信号V3 ′の時間長と等しくされている。同様に補
間信号V7 ′以後の復号音声信号V8 ,V9 ,V10中の
8 ,V9 についてはそれぞれ有音時間軸圧縮した信号
8 * ,V9 * として、V10については無音区間を圧縮
した信号V10♯とし、これら3つの復号音声信号の圧縮
時間の合計が補間信号V7 ′の長さと等しくされてい
る。この場合も、有音圧縮信号V8 * ,V9 * はそれぞ
れ復号音声信号V8 ,V9 のそれぞれの圧縮信号を切断
することなく、全てが用いられる。
【0034】このようにして補間音声信号によって切断
区間がなく、また遅延パケットV4 * とV8 * が出力さ
れているので音韻内容が失われることはない。また補間
音声信号V3 ′とV7 ′に要した時間長が信号V5 ♯,
6 ♯,V10♯とV4 * ,V 8 * ,V9 * との無音/有
音区間圧縮時間の合計と同じにするので、最終的な出力
音声の遅延はなく、実時間での音声対話通信が可能であ
る。
【0035】他の請求項の実施例 図1,図5,図7におけるそれぞれの切り換え/接続部
34,45,56としては単なる切換えスイッチを示し
たが、補間音声信号と遅延パケットの復号音声信号との
接続は次のようにすることもできる。即ち、請求項4の
発明では補間音声信号にピッチ周期性があるときは、例
えば図9(a),(b)に示すように補間音声信号
K ′の開始時刻t0 からピッチ周期TP の整数倍(T
i =nxTP,例ではn=2)の時刻t1 までを補間音
声信号VK ′とする。すると、補間音声信号VK ′の開
始時刻t0 の波形と、補間終了時刻t1 の波形とが1ピ
ッチの同じ位置に対応するので、それ以後に、遅延パケ
ットの復号音声信号VK+1 を接続しても接続境界t1
図10(c)に示すように大きな不連続にならない。
【0036】遅延パケットの復号音声信号VK+1 を生成
する際に、過去の復号音声が必要な場合には、補間信号
K ′は使用せずに、遅延がなかったと仮定して補間開
始時点t0 に続くとして、その直前の音声情報、つまり
復号音声信号VK を用いて復号する(請求項5の発
明)。こうすることにより、受信側で遅延パケットが生
じても後続の音声復号に補間音声信号による影響がな
く、送信側と同じ音声を出力することができる。
【0037】さらに、補間音声信号VK ′と遅延パケッ
ト復号音声VK+1 とを図9(a),(b)に示すように
補間用の窓関数、つまり被接続信号である補間音声信号
Kは接続の時刻t1 から漸次減少し、逆に接続信号で
ある復号音声信号VK+1 は接続時刻t1 から漸次1にな
るような各窓関数をそれぞれに乗じて加算して接続する
ことにより、補間途中で音声信号が変化した場合でも、
連続的に重み付け加算されるので、接続境界t1 の不連
続性を弱めることが可能となり、接続による品質劣化を
抑制できる(請求項6の発明)。
【0038】
【発明の効果】以上説明したように、この発明ではある
制限時間内のパケット遅延であれば、遅延分の間だけ、
前に到着したパケットの復号音声信号により音声信号を
補間し、そのあとで遅延パケットの復号音声信号を接続
し、その際にその復号音声信号自体またはそれ以後の無
音区間、あるいは無音および有音区間で、時間軸圧縮を
行うので、遅延したフレーム音韻の欠落をなくし、円滑
な補間音声信号を出力し、かつ、時間遅延が大きくなら
ないパケット音声復号方法を実現でき、その効果は極め
て大きい。
【図面の簡単な説明】
【図1】請求項1の発明を適用した受信装置の例を示す
ブロック図。
【図2】その受信復号処理手順の例を示す流れ図。
【図3】時間軸圧縮処理を説明するための波形図。
【図4】受信パケット例(a)に対する請求項1,2,
3の各発明による音声信号の出力例(b),(c),
(d)を示す図。
【図5】請求項2の発明を適用した受信装置の例を示す
ブロック図。
【図6】その受信復号処理手順の例を示す流れ図。
【図7】請求項3の発明を適用した受信装置の例を示す
ブロック図。
【図8】その受信復号処理手順の例を示す流れ図。
【図9】補間音声信号と遅延パケットの復号音声信号と
の接続方法である請求項4乃至6の発明を説明するため
の波形図。
【図10】音声信号のパケット送受信伝送系の一般的構
成を示すブロック図。
【図11】その送信パケットと、受信パケットと、復号
音声信号との関係を示す図。
【図12】遅延パケットと、これに対する従来の各種復
号音声信号との関係を示す図。
【図13】従来の受信パケット復号処理手順を示す流れ
図。
【図14】従来の遅延パケットを含む復号処理手順を示
す流れ図。
【図15】従来の遅延パケットに対する音声補間をする
復号装置を示すブロック図。
【図16】その従来の処理手順を示す流れ図。
【図17】従来の補間音声信号と遅延パケット復号音声
信号との接続を説明するための波形図。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 到着予定時刻よりも所定時間以上パケッ
    トが遅れると、先に到着したパケットの符号化情報から
    補間処理によって音声信号を生成してそれまでの出力音
    声信号と連続させて出力し、 上記遅れたパケットが、その次のパケットの到着予定時
    刻前に受信されると、その遅れたパケットの復号音声を
    時間軸圧縮して、それが本来の到着予定時刻に到着した
    場合の復号音声出力の最終時刻まで、上記補間音声信号
    に続けて出力することを特徴とするパケット音声復号方
    法。
  2. 【請求項2】 到着予定時刻よりも所定時間以上パケッ
    トが遅れると、先に到着したパケットの符号化情報から
    補間処理によって音声信号を生成して、それまでの出力
    音声信号と連続させて出力し、 上記遅れたパケットが予め決められた時間以内に受信さ
    れると、その遅れたパケットの復号音声信号を上記補間
    音声信号に続けて出力させ、 その復号音声信号以後におけるパケットの復号音声信号
    中の無音区間を、上記補間音声信号の時間長分圧縮する
    ことを特徴とするパケット音声復号方法。
  3. 【請求項3】 上記遅延パケットの復号音声信号を上記
    補間音声信号に続けて出力した以後のパケットの復号音
    声信号中の有音区間も時間圧縮して上記無音区間の圧縮
    との合計で上記補間音声信号の時間長分とすることを特
    徴とする請求項2記載のパケット音声復号方法。
  4. 【請求項4】 上記補間音声信号にピッチ周期性がある
    ときは、上記補間音声信号の区間を、上記ピッチ周期の
    整数倍とすることを特徴とする請求項1乃至3のいずれ
    かに記載のパケット音声復号方法。
  5. 【請求項5】 パケットの復号にその過去の音声情報を
    必要とする場合は、上記遅れたパケットの復号に、上記
    補間音声信号の直前の音声情報を用いることを特徴とす
    る請求項1乃至3のいずれかに記載のパケット音声復号
    方法。
  6. 【請求項6】 上記補間音声信号と、上記遅れたパケッ
    トの復号音声信号との上記接続を、補間用窓関数を上記
    補間音声信号および上記復号音声信号とに乗算して互い
    に加算して行うことを特徴とする請求項1乃至3のいず
    れかに記載のパケット音声復号方法。
JP12371294A 1994-06-06 1994-06-06 パケット音声復号方法 Expired - Lifetime JP3240832B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12371294A JP3240832B2 (ja) 1994-06-06 1994-06-06 パケット音声復号方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12371294A JP3240832B2 (ja) 1994-06-06 1994-06-06 パケット音声復号方法

Publications (2)

Publication Number Publication Date
JPH07334191A true JPH07334191A (ja) 1995-12-22
JP3240832B2 JP3240832B2 (ja) 2001-12-25

Family

ID=14867497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12371294A Expired - Lifetime JP3240832B2 (ja) 1994-06-06 1994-06-06 パケット音声復号方法

Country Status (1)

Country Link
JP (1) JP3240832B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002515612A (ja) * 1998-05-14 2002-05-28 テレフオンアクチーボラゲツト エル エム エリクソン 遅延パケット隠蔽方法および装置
JP2002196795A (ja) * 2000-12-26 2002-07-12 Matsushita Electric Ind Co Ltd 音声復号装置及び音声符号化・復号装置
WO2002095731A1 (fr) * 2001-05-22 2002-11-28 Fujitsu Limited Processeur de signaux vocaux
JP2002542520A (ja) * 1999-04-19 2002-12-10 エイ・ティ・アンド・ティ・コーポレーション パケットロス又はフレーム消去隠蔽を実行するための方法及び装置
JP2005274917A (ja) * 2004-03-24 2005-10-06 Mitsubishi Electric Corp 音声復号装置
US7349330B1 (en) 2000-03-27 2008-03-25 Oki Electric Industry Co., Ltd. Packet receiver with the influence of jitter and packet losses reduced before a buffer becomes idle due to data delays and packet receiving method using the same
JP2008182380A (ja) * 2007-01-23 2008-08-07 Alpine Electronics Inc オーディオ装置
JP2009205014A (ja) * 2008-01-31 2009-09-10 Fujitsu Ten Ltd デジタルデータ処理装置および音響再生装置
JP2011521290A (ja) * 2008-05-22 2011-07-21 華為技術有限公司 フレーム損失隠蔽の方法及び装置
US8185386B2 (en) 1999-04-19 2012-05-22 At&T Intellectual Property Ii, L.P. Method and apparatus for performing packet loss or frame erasure concealment
US8731908B2 (en) 1999-04-19 2014-05-20 At&T Intellectual Property Ii, L.P. Method and apparatus for performing packet loss or frame erasure concealment
US9026433B2 (en) 2011-02-01 2015-05-05 Oki Electric Industry Co., Ltd. Voice quality measurement device, method and computer readable medium

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4651194B2 (ja) * 1998-05-14 2011-03-16 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 遅延パケット隠蔽方法および装置
JP2002515612A (ja) * 1998-05-14 2002-05-28 テレフオンアクチーボラゲツト エル エム エリクソン 遅延パケット隠蔽方法および装置
JP4975213B2 (ja) * 1999-04-19 2012-07-11 エイ・ティ・アンド・ティ・コーポレーション フレーム消去隠蔽処理装置
JP2011013697A (ja) * 1999-04-19 2011-01-20 At & T Corp 受信器において実行される方法および受信器
JP2002542518A (ja) * 1999-04-19 2002-12-10 エイ・ティ・アンド・ティ・コーポレーション パケットロス又はフレーム消去隠蔽を実行するための方法及び装置
US8612241B2 (en) 1999-04-19 2013-12-17 At&T Intellectual Property Ii, L.P. Method and apparatus for performing packet loss or frame erasure concealment
JP2014206761A (ja) * 1999-04-19 2014-10-30 エイ・ティ・アンド・ティ・コーポレーションAt&T Corp. フレーム消去隠蔽を実行するための装置
JP2013238894A (ja) * 1999-04-19 2013-11-28 At & T Corp フレーム消去隠蔽を実行するための装置
US9336783B2 (en) 1999-04-19 2016-05-10 At&T Intellectual Property Ii, L.P. Method and apparatus for performing packet loss or frame erasure concealment
JP2012230419A (ja) * 1999-04-19 2012-11-22 At & T Corp パケットロス又はフレーム消去隠蔽を実行するための方法及び装置
JP2011043844A (ja) * 1999-04-19 2011-03-03 At & T Corp 受信器において実行される方法および受信器
JP2002542520A (ja) * 1999-04-19 2002-12-10 エイ・ティ・アンド・ティ・コーポレーション パケットロス又はフレーム消去隠蔽を実行するための方法及び装置
US8423358B2 (en) 1999-04-19 2013-04-16 At&T Intellectual Property Ii, L.P. Method and apparatus for performing packet loss or frame erasure concealment
JP2015180972A (ja) * 1999-04-19 2015-10-15 エイ・ティ・アンド・ティ・コーポレーションAt&T Corp. フレーム消去隠蔽を実行するための装置
US8185386B2 (en) 1999-04-19 2012-05-22 At&T Intellectual Property Ii, L.P. Method and apparatus for performing packet loss or frame erasure concealment
US8731908B2 (en) 1999-04-19 2014-05-20 At&T Intellectual Property Ii, L.P. Method and apparatus for performing packet loss or frame erasure concealment
US7349330B1 (en) 2000-03-27 2008-03-25 Oki Electric Industry Co., Ltd. Packet receiver with the influence of jitter and packet losses reduced before a buffer becomes idle due to data delays and packet receiving method using the same
JP2002196795A (ja) * 2000-12-26 2002-07-12 Matsushita Electric Ind Co Ltd 音声復号装置及び音声符号化・復号装置
WO2002095731A1 (fr) * 2001-05-22 2002-11-28 Fujitsu Limited Processeur de signaux vocaux
JP2005274917A (ja) * 2004-03-24 2005-10-06 Mitsubishi Electric Corp 音声復号装置
JP2008182380A (ja) * 2007-01-23 2008-08-07 Alpine Electronics Inc オーディオ装置
JP4726088B2 (ja) * 2008-01-31 2011-07-20 富士通テン株式会社 デジタルデータ処理装置および音響再生装置
JP2009205014A (ja) * 2008-01-31 2009-09-10 Fujitsu Ten Ltd デジタルデータ処理装置および音響再生装置
US8457115B2 (en) 2008-05-22 2013-06-04 Huawei Technologies Co., Ltd. Method and apparatus for concealing lost frame
JP2011521290A (ja) * 2008-05-22 2011-07-21 華為技術有限公司 フレーム損失隠蔽の方法及び装置
US9026433B2 (en) 2011-02-01 2015-05-05 Oki Electric Industry Co., Ltd. Voice quality measurement device, method and computer readable medium

Also Published As

Publication number Publication date
JP3240832B2 (ja) 2001-12-25

Similar Documents

Publication Publication Date Title
US6389006B1 (en) Systems and methods for encoding and decoding speech for lossy transmission networks
US7577565B2 (en) Adaptive voice playout in VOP
US7319703B2 (en) Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts
EP1382143B1 (en) Methods for changing the size of a jitter buffer and for time alignment, communications system, receiving end, and transcoder
EP0544101B1 (en) Method and apparatus for the transmission of speech signals
KR101023460B1 (ko) 신호 처리 방법, 처리 장치 및 음성 디코더
US5873058A (en) Voice coding-and-transmission system with silent period elimination
US7206986B2 (en) Method for replacing corrupted audio data
WO2005109401A1 (ja) 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム
JPWO2005117366A1 (ja) 音声パケット再生方法、音声パケット再生装置、音声パケット再生プログラム、記録媒体
JP3240832B2 (ja) パケット音声復号方法
JP2002534922A (ja) マルチメディア信号を伝送する伝送システム
JPH07129195A (ja) 音声復号化装置
JP3722366B2 (ja) パケット構成方法及び装置、パケット構成プログラム、並びにパケット分解方法及び装置、パケット分解プログラム
KR101011320B1 (ko) 스피치를 저장, 전송 및 재생하기 위하여 포즈 프레임을 식별하여 제외하는 방법 및 장치
JPH08314497A (ja) 無音圧縮音声符号化復号化装置
JPH09116571A (ja) 音声パケット伝送システム
KR100591544B1 (ko) VoIP 시스템을 위한 프레임 손실 은닉 방법 및 장치
JP4437052B2 (ja) 音声復号化装置および音声復号化方法
JP3487158B2 (ja) 音声符号化伝送システム
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
JPH10326100A (ja) 音声録音方法及び音声再生方法及び音声録音再生装置
US20040138878A1 (en) Method for estimating a codec parameter
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JPH1022936A (ja) 補間装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071019

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081019

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091019

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101019

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111019

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121019

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131019

Year of fee payment: 12

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term