JPH0263333A - 音声符号化・復号化装置 - Google Patents

音声符号化・復号化装置

Info

Publication number
JPH0263333A
JPH0263333A JP63215620A JP21562088A JPH0263333A JP H0263333 A JPH0263333 A JP H0263333A JP 63215620 A JP63215620 A JP 63215620A JP 21562088 A JP21562088 A JP 21562088A JP H0263333 A JPH0263333 A JP H0263333A
Authority
JP
Japan
Prior art keywords
packet
data
frame
audio
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63215620A
Other languages
English (en)
Inventor
Norimasa Kudo
工藤 憲昌
Hiroshi Masuda
浩 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Engineering Corp
Toshiba Corp
Original Assignee
Toshiba Engineering Corp
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Engineering Corp, Toshiba Corp filed Critical Toshiba Engineering Corp
Priority to JP63215620A priority Critical patent/JPH0263333A/ja
Publication of JPH0263333A publication Critical patent/JPH0263333A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は所定のフレーム単位で圧縮符号化し、パケット
伝送すると共に伝送される音声情報を効果的に再生する
ことのできる音声符号化・復号化装置に関する。
(従来の技術) 近年、高効率な情報伝送形態としてパケット伝送が注目
されており、音声情報の通信にあっても、この種のパケ
ット通信ネットワークを介して高効率な通信を行うこと
が試みられている。
そして、通常のデータ伝送におけるパケット通信にあっ
ては、ネットワーク内での伝送路の違いによるパケット
の追越し発生、すなわち、第4図に示すようにネットワ
ークN内では複数の伝送ルートかあり、複雑の度合いか
ら送出パケット毎に伝送ルートが異なる等のために端末
Aよりの送信されるパケットの送出順序と受信端末Bで
の受信時のパケット順序が変わることが多々ある。そし
て、このようなパケット順序の入替わりに対処すべく、
バッファリングによるパケット順序の並べ替えや、パケ
ットの再送等の処置が講じられる。
ところで音声信号のパケット伝送においては、誤り再送
等を用いることによる伝送情報の正確性よりもむしろ会
話の自然性が重要であることとから、リアルタイム性を
維持すべくパケットの順序の入替わりが生じた場合には
送信順序の古い方を棄却することによって時間的に前後
のない状態でパケットデータを復号処理し、音声信号を
再生すると云ったことが行われる。つまり、ネットワー
ク上のメモリのオーバフローによるパケット抜けやネッ
トワーク内の伝送経路の違いによるパケットの追い越し
等を、パケットの再送やバッファリングによる順序再生
を行うよりも遅れたパケットは捨てて最新の音声パケッ
トを伝達する方が会話の自然性を保てるので、このよう
な方式を採用している。しかしこのようなパケットの棄
却を行った場合、棄却によるパケット抜けに起因して再
生音声信号波形に不連続部分が生じ、この不連続部分で
耳障りな音が発生したり、また再生音声の明瞭度が低下
する等の不具合が生じた。
そこで従来では、例えば第3図(a)に示すように入力
される音声信号X  を所定の周期です(n) ンブリングし、ディジタル化してX  とし、こ(n) のサンプリング音声信号X  をM点毎にフレー(n) 部分解し、連続するL個のフレームに亙って各フレーム
での音声信号X  を1つづつ順に抽出しくn) てパケット化し、これを伝送するようにしている。
即ち、フレーム番号をR(0≦g<L)、各フレーム内
でのデータ・インデックスをm(0≦m≦M)とし、フ
レーム化された信号をxF(II)、m)と表わすもの
とすると、前述したサンプリング音声信号X  は (n) X xr(R、m>    (M−f) +IIりとして会
←巧示すことができる。これらフレーム化された信号を
パケット化して伝送するときに、M点おきに抽出したデ
ータをもとに次のようにしてブロック化し、パケット送
信データ■、■、・・・■)と(7ている。
■  ’ xr(0,0)’   f’(1,0)’ 
    [’(L−1,0)’・・・ ・・・ X ■ ’ xr(0,1)’  f(1,1)’    
 f’(L−1,1)’・・・ ・・・ X e ’ xf(0,M−1)’ xf(1,M−1)’
 ”’ 狗(L−1,M−1)’送信データ■、■、・
・・Oは第3図においてはフレームN、N+1.N+2
.・・・にあわせて、簡略化して表現してあり、例えば
、(N、0)。
(N+1.、O)、・・・(N+L−1,O)はxr(
0,0)=  r(1,0)’ ”’ xf’(L−1
,0)”対応し′CI、ゝる。
尚、第3図(b)はN時点以降のブロックをまとめて示
している。復号化部では、伝送されてきたデータXf’
(1)、I)からデータの並び替えを行−・てX  を
生成する。この様にすると、第3図(h)(n) に示しているように、送信データ■が抜けてしまっても
第3図(C)に示すように各再生されたフレーム内では
「1データサンプルの抜け」にとどまり、前後データサ
ンプルから抜けた部分を適切に補間処理を行うことによ
り良好な音声が得られる。
しかしながら、 (1)パケット伝送では受信先アドレス、ヘッダ等のオ
ーバーヘッドがあるため、伝送の効率上、]パケット長
をあまり短かくできず、従って従来の方法では音声フレ
ームの個数りを大きくする必要がある。この場合、伝送
する前にL個の音声フレームを蓄積する必要があり、入
力から復号までの遅延時間が長くなる。
(2)ADPCM、ADM等の送信データが全て同じ意
味の情報である圧縮符号化(これらは圧縮比率がl/2
程度である)にしか適用できず、この場合では復号音声
の劣化は少なくない。
(3)第5図は、フレーム処理を行う圧縮符号化(圧縮
比率が1/4以下が可能)の送信データのフレーム構成
を示しており、この圧縮符号化による送信を利用すると
高効率で伝送可能となる。
しかし、このようなフレーム処理が施された音響データ
のパケット伝送にあっては、各パケットはフィールド毎
に異なる意味の情報を持つことになる。それ故、パケッ
ト抜けが生じても前述した捕間処理等の対策を全く講じ
ることができないと云う問題がある。
(発明が解決しようとする課8) 音声のパケット伝送においては、リアルタイム性が重要
であることから、送信順序と異なる順序でパケットが着
信する場合、送信順序の古い方を棄却することによって
時間的に前後のない状態でパケットデータを復号処理し
、音声信号を再生すると云ったことが行われる。つまり
、ネットワーク上のメモリのオーバフローによるパケッ
ト抜()やネットワーク内の伝送経路の違いによるパケ
ットの追い越し等を、パケットの再送やバッファリング
による順序再生よりも遅れたパケットは捨てて最新の音
声パケットを伝達する方が会話の自然性を保てるので、
このような方式を採用している。しかしこのようなパケ
ットの棄却を行った場合、棄却によるパケット抜けに起
因して再生音声信号波形に不連続部分が生じ、この不連
続部分で耳障りな音が発生したり、また再生音声の明瞭
度が低下する等の不具合が生じる。
そこで従来では、例えば第3図(a)に示すように人力
される音声信号X  を所定の周期です(n) ンブリングし、ディジタル化してX  とし、こ(n) のサンプリング音声信号X  をM点毎にフレー(n) 部分解し、連続するL個のフレームに亙って各フレーム
での音声信号X  を1つづつ順に抽出しくn) てパケット化し、これを伝送するようにしている。
そして、受信側(復号装置)では、このようにしてパケ
ット伝送されるデータをMパケットについて並替えし、
前述した音声データの系列を復元した後、その音声信号
の再生を行っている。すなわち、複数のフレームタイミ
ングに分散させ、一つのパケットには複数フレームそれ
ぞれにおけるある順位の音声サンプルを集めたかたちで
まとめ、段数フレームをそれぞれの1音声サンプルずつ
を単位に複数回にわたって送ることによって伝送を完成
させることによりパケット抜けの影響を1音声サンプル
分の抜は程度で済むようにしている。
このような対策を施すことにより、例えばその一部にパ
ケット抜けか生じても再生データ・フレムでの音声信号
X  の欠落は各フレームにお(n) いてそれぞれ1サンプルに止まり、その前後のデータか
ら補間処理等により補うことが可能となる。
この結果、パケット伝送した音声の品質を確保すること
が可能となり、また前述したような耳障りな音の発生を
防ぐことが可能となる。
然1=、乍ら、パケット伝送にあっては受信先アドレス
やヘッダ等のオーバーヘッドがあることから、伝送効率
上、その1パケツト長をあまり短くすることはできない
。従って上述した手法を採用する為には、伝送効率のう
えから成る程度音声フレームの個数りを大きく設定する
と、パケット伝送に際してLフレームに亙る音声データ
を蓄積する必要があるので、入力音声をパケット送信す
るまで、また受信パケットを復号して音声信号を再生す
るまでに多大な時間遅延が生じることが否めない。
しかもこのような方式での音声パケットの伝送は、AD
PCM、ADM等の送信データがフレーム内で同じ意味
を持つ情報での圧縮符号化(圧縮比率が1/2程度)に
しか適用することができず、また予測残差信号に対して
従来方式を適用しても、その予測残差信号の補間の効率
が小さく、復号音声の劣化が無視できない。
一方、第5図に示すようなフレーム構成を採用して音声
情報をフレーム単位で圧縮符号化し、これをパケット伝
送することが考えられている。このような形態を採用す
れば各フレーム毎に高効率な圧縮符号化方式が可能とな
り、例えばフレーム単位で圧縮比率1/4以下の圧縮符
号化を実現することが可能となる。しかしこのようなフ
レーム処理が施された音声データのパケット伝送にあっ
ては、各パケットはフィールド毎に異なる意味の情報を
持つことになる。これ故、パケット抜けが生じても前述
した補間処理等の対策を全く講じることができないと云
う問題がある。
そこでこの発明の目的とするところは、パケット抜けに
対応できると共に遅延時間を少なくして、しかも音声信
号の効率的なパケット伝送を可能とする実用性の高い音
声復号化装置を提供することにある。
[発明の構成コ (課題を解決するための手段) 上記目的を達成するため、本発明は次のように構成する
。すなわち、所定の周期でサンプ・リングされた音声信
号を所定のサンプリング数からなるフレーム単位で圧縮
符号化してパケット伝送に供すると共にパケット伝送さ
れた情報を受けて、復号し前記音声信号を再生する音声
符号化・復号化装置において、 フレーム単位の音声信号圧縮符号化データを複数のフレ
ームタイミングに分けると共にこれらを他のフレームの
分割データと組合わせたフレーム構成として出力し、パ
ケット伝送に供する符号化部と、 パケット伝送された圧縮符号化データの系列を複数フレ
ームにまたがって連続的に予測し、該予測したデータを
出力するフレーム間予測部と、受信パケットの連続性か
らパケット抜けを検出する検出手段と、この検出手段に
よりパケット抜けが検出されたとき、受信データに代え
て前記フレーム間予測部にて予測されたデータ系列を用
い、パケット抜けが検出されないときは受信データを用
いるように制御する制御手段と、 前記受信された圧縮符号化データと前記フレーム間予測
部の出力データのうち前記制御手段の制御により定まる
一つを用いて音声信号の復号再生を行う復号再生手段と
を具備して構成する。
(作用) このような構成において、送信すべき音声信号は、所定
周期でサンプリングし、圧縮符号化すると共に符号化部
はこの圧縮符号化データを複数のフレームタイミングに
分けて送出し、パケット伝送する。そして、パケット伝
送され受信された圧縮符号化データの系列をフレーム間
予測部により?U fiフレームにまたがって連続的に
予測し、該予測したデータを出力すると共にまた検出手
段により受信パケットの連続性からパケット抜けを検出
し、一方、制御手段は、この検出手段によりパケット抜
けが検出されたとき、受信データに代えて前記フレーム
間予測部にて予測されたデータ系列を用い、パケット抜
けが検出されないときは受信データを用いるように制御
出力を発生する。そして、復号再生手段は前記受信した
圧縮符号化データと前記フレーム間予測部の出力データ
のうち前記制御手段の制御により定まる一つを用いて音
声信号の復号再生を行う。
このように符号化部では送信すべき音声信号は1フレ一
ム単位でデータを圧縮符号化し、これを分割して複数フ
レームタイミングに分けると共にこれらを他のフレーム
の分割したデータと組合わせたフレーム構成として送出
するようにし、また復号化部では、フレーム間予測手段
により受信データのフレームにまたがってデータの系列
を子、l+j11し、出力しく具体的には受信データの
補間パラメータから復号あるいは、合成パラメータを生
成する)、またパケットの監視をしてパケット抜けを調
べる制御手段によりパケット抜けかを判定し、パケット
抜けならばフレーム間予測手段からの補間パラメータと
受信データのパラメータとから音声を復号あるいは合成
させ、パケット抜けが無いならば送出された複数フレー
ムの受信データの復号パラメータから音声を復号させる
よう復号再生手段を制御するようにしたものである。
この結果、パケット抜けが生じた場合であっても、次の
パケットで補うことができ、また、連続してパケットが
抜けて1フレ一ム分のデータが欠落してもその欠落部分
の音声符号を効果的に補うことができ、耳障りな音の発
生を防いで復号再生音声の品質を確保することが可能と
なる。また所定のフレーム単位で圧縮符号化されたデー
タ・パケットに個々に対処してその復号化処理を行うの
で、複数のパケットに亙ってデータ系列の並替え笠の処
理を施す必要がないことから、時間的な遅延が問題とな
ることもなくなる。
(実施例) 以下、図面を参照して本発明の一実施例につき説明する
尚、本文では音声の圧縮符号化データから出力音声を再
生する際に、予7111]残差系列を量子化し、そのm
子化データを逆量子化して音声を再生することを復号と
記し、予測残差系列を音声の生成機構に基づき、パルス
列あるいは白色雑音にモデル化し、これらから音声を再
生することを合成と記すものとする。
第1図は本発明の一実施例に係る音声復号化装置を備え
て構成される音声パケット伝送システムの概略構成図で
あり、1は符号化装置を備えたパケット送信部部、2は
復号化装置を備えたパケット受信部である。このパケッ
ト送信部1とパケット受信部2とは所定のパケット伝送
路3を介して相互に接続される。尚、パケット伝送路3
は、バケット交換機や種々のパケット通信網により構築
されることば云うまでもない。
この第1図において、音声のパケット伝送の根底となる
パケット送信部1について先ず説明すると、このパケッ
ト送信部1では入力音声信号をA/D変換器11を介し
て所定の周期でサンプリングしてディジタル化し、所定
のフレーム単位での圧縮符号化とそのパケット送信に供
せられる音声データX  の系列として取込んでいる。
(n) パケット送信部]−における符号化部は、ピッチ分析部
12にて上記音声データX  の基本周波(n) 数成分をピッチ情報として分析し、その分析結果に従い
ピッチ予M1部13にて長時間での音程を予測し、冗長
成分の除去を行う。つまり音声の長時間に亙る相関に従
ってその冗長成分の除去を行う。
次に音声の近接(短時間)相関を除去すべく、LPG分
析部14にて近接予測係数を分析し、その結果に従って
近接予測部 15にて近接予測を行う。
以上のピッチ予測および近接予測により除去することの
できなかった音声の冗長成分(予測残差)に対して、次
に電力分析部]6にて所定のフレーム内(所定のサンプ
ル数のまとまり)でその電力情報を求め、この電力情報
を用いて正規化部17にて」−2予測残差を正規化(1
/Δ倍)する。しかる後、この正規化された予測残差を
量子化部18にてご子化し、その量子化コードe  を
求(n) める。更にこの量子化コードを遅延部10により所定の
遅延を加えてマルチプレクサ19に送る。
このような一連の処理により求められた前記ピッチ情報
、近接予測係数、電力情報(以上3情報をサイド情報と
呼ぶ)、正規化予測残差信号の量子化コードe  をマ
ルチプレクサ(MPX)(n) 〕9にて、第5図に示すフレーム構成に多重化し、第6
図に示すようにパケットJにはその予測残差部に一つ前
のフレームJ−1の予測残差を、また、パケットJ+1
には一つ前のフレームJの予測残差をと云った具合に一
つ前のフレームの予測残差を入れたかたちでパケット化
される。そしてこの圧縮符号化された情報が1つのパケ
ット・データとして前記伝送路3を介して送信される。
尚、以上の音声の符号化処理は、所定のフレーム単位で
圧縮符号化処理を実行する従来の音声コーデックと基本
的に同様なものであるが、ヒ述のようなパケット構成と
するために遅延部10を設けた点のみ異なる。
さて、このようにして所定のフレーム単位で圧縮符号化
されて上記パケット送信部1から順に上記形式のデータ
と化されてパケット伝送されてくるデータから前記音声
信号X  を復号再生する(n) パケット受信部2の復号化装置の構成は次のようになっ
ている。
この復号化装置は、基本的には−に連した如くフレーム
単位で圧縮符号化された情報を復号すべく、デマルチプ
レクサ(以下、DEMPXと称する)21にて受信パケ
ットから前記ピッチ情報、近接予測係数、電力情報、正
規化予測残差信号の量子化コードe  をそれぞれ分解
抽出し、逆量子化(n) 部22に上記量子化コードe  を与えて正規化(n) 予測残差信号を求める。そしてこの再生された正規化予
測残差信号と前記電力情報とから正規化復元部23にて
残差信号を復元し、この残差信号に対して近接予測合成
部24およびピッチ合成部25にて前記近接予測係数お
よびピッチ情報を合。
成して前記音声信号X  を再生復元し、これを(n) D/A変換器26にてアナログ音声信号に復元して再生
出力する如く構成される。これらの基本構成については
、従来の復号化装置と全く同様である。
そしてこの復号化装置にあっては、受信パケットデータ
を分解して分配する前記DEMPX21により分配され
た「ピッチ情報」、「近接予測係数」、「電力情報」、
および前記逆量子化部22により、予測残差である「量
子化コードi  」(n) から求められた正規化予測残差信号に従い、フレーム単
位で将来の受信データを複数のフレーム間に亙って予測
するフレーム間予測部31、および前記DEMPX21
を介して所定の時間内に次のパケットが受信されるか否
かを検出し、その検出結果に従ってセレクタ33や前記
ピッチ情報、近接予測係数、電力情報に対する処理部3
4,35゜36をそれぞれ動作制御する制御部32、そ
して各処理部34,35.36に入力する上記ピッチ情
報、近接予測係数、電力情報をそれぞれ一時的に保持し
、フレーム毎にずれていたこれら保持した情報と予測残
差の情報とを合わせるための第1〜第3の遅延部37〜
39を設けている点を特徴としている。
遅延部37,38.39はそれぞれ入力されたデータを
記憶する記憶要素で構成され、復号化処理に当って1フ
レームタイミング分ずらして読み出すことにより、デー
タの対応をとるがその制御は制御部32が受は持ってい
る。
パケット伝送される音声情報の受信時には成る時間間隔
内で連続的にパケットが伝送されると云う性質から、制
御部32では、成るタイミングでのパケットの受信から
次のパケットが受信されるまでの時間を監視し、パケッ
ト抜けが生じたか否かを検出している。
そしてパケット抜けが検出されたとき、制御部32は前
記セレクタ33や処理部34,35゜36をそれぞれ切
替制御し、前述した受信パケット・データからの音声デ
ータの復号処理に代えて上記フレーム間予測部31によ
り予測したパラメータを各処理部23,24.25に入
力し、これによって得られる擬似予測残差信号、擬似ピ
ッチ情報、擬似近接予測係数、擬似電力情報の合成パラ
メータと、受信データからの出力信号を復号したパラメ
ータを用いて音声データを復号処理するように制御する
ものとなっている。
さてこのような擬似予測残差信号、擬似ピッチ情報、擬
似近接予測係数、擬似電力情報をそれぞれ複数フレーム
に亙って予DIするフレーム間予測部31は、基本的に
は音声情報の統計的な性質が20〜30 m5ec程度
の時間、離れた音声信号間を比較した場合、両者は殆ん
ど変化することがないと云う性質を利用して、現在およ
び過去の受信データから将来(次のフレーム)の受信デ
ータを予測するものである。この予測処理は学習的に行
われる。
即ち、フレーム間予測部31はピッチ情報、近接予測係
数、ri電力情報ついては A(N+1) ” f(A(N) ”(N−1) ”(
N−k) ”’(N) )E    閣A     −
A (N)     (N)     (N)A(N+1)
  ’現時点Nに耐する(N+1)時点の予測 f(A、A、  ・・・A、E) (N)     (N−1)      (N−k) 
    (N);現時点および過去の受信データから (N+1)時点を予測する線形関数 E   ;予測値と受信データとの差 (N) としてフレーム間での予測を行う。また正規化残差信号
については、現在および過去の受信データから、パルス
列、白色雑音、或いはその両者の線形結合にモデル化し
たものと、実際の受信データとから学習して予測する。
このフレーム間予測について更に詳しく説明すると、音
声信号はその生成機構から2変換面上で次のように表現
することができる。
S  朧σEAP (z)      (z)   (z)   (z)S
(z);音声信号S  の2変換 (n) a2  ;残差信号の電力 E  ;残差信号e  の2変換 (z)       (n) A  :近接予測係数列の2変換 (z) P  ;ピッチ予7IP+係数の2変換(z) ここで、上記σ、E   、A   、P   のそ(
z)   (z)   (z) れぞれについて過去の受信フレームのデータから現在の
フレーム・データを予測する場合について述べる。尚、
受信フレームをメモリに蓄積することにより、過去、将
来の受信フレームからパケット抜けの生じたフレーム・
データを予測する場合にも同様に適用できる。
過去の受信フレームのデータから現フレームして受信さ
れるであろう残差信号E   [n−0〜L(n) n−1]を予測するには過去の残差信号e1、−1(n
)から次のようにして予測できる。
eL(n)″a1..8p(n)+βL 5n(n) 
 ”’ ”’ (1)但し、S  は白色雑音(係数列
) n(n) そして、k  からk  までのeL−1(。)につi
ax        min いての正規化自己相関の最大値αLは β −(1−eL)βL−1 S−1(n−0);インパルス信号 p(n) 0(no) この残差信号e  は有声か無声かによりその(n) 性質を異にし、有声音の場合にはインバ少ス性の信号と
して、また無声音の場合には白色雑音に近似される。ま
た前記αLの計算に用いられる残差信号eL−1(n)
は、実際には前記逆量子化部22で求められる逆量子化
値eL−L(n)であり、デマルチプレクサ21によっ
て抽出され、メモリに絨積された量子化符号からプロセ
ッサにより逆量子化して求められる。逆量子化の手順は
公知であるため、ここでは説明はしない。尚、逆量子化
値eL−1(。)は上記残差信号eL−1(□)の有声
音の度合いを示すパラメータである。そしてこのノくラ
メータαLは上述したeL、−](n)とαI、−1と
から求められることになる。
またβ は↑   の無声音の度合いを示すバL   
L−1(n) ラメータであり、αI、とβLとから求められる。
一方、前記残差信号の電力σ  は +Δσ       ・・・・・・ (2)1、  L
−I    L−1 として計算される。但し、Δσ  は、σ  とL−I
    L−2 σl7−1 との差分てあり、(σL−2L−1)から
−σ 求められる。
これに対して近接予測係数a[n−0〜P;L(n) Pは予14111次数]は、フレーム間での予測を行い
易いパラメータであるLSPパラメータに変換し、この
LSPパラメータにより予測を行い、その後、α1.(
。)に再変換する方法をとる。近接予測係数とLSPパ
ラメータとの間の変換操作については、“斉藤、中田著
「音声情報処理の基礎jオーム社刊”等に述べられてお
り、必要ならばこれを参照することとして、ここでは触
れない。LSPパラメータの予測は下式で行える。
LSP     −α  (LSP       −L
SP      )L、m     L     L−
1,III+l      I、−1+n+βLΔL 
S P L−1+m  ・・・・・・ (3)但し、上
式においてLSPL−、。は(L−1)番目のフレーム
におけるm番目のLSPパラメータであり、またΔL 
S P L−1+。はLSP    とL−2,m LSP    との差分である。尚、mmQ〜PでL−
1,ω ある ここで上記LSPパラメータは“電子通信学会論文誌(
A)捩合はか「線スペクトル対(LSP)音声分析合成
方式による音声情報圧縮」 (昭56−08)”にもあ
るように声音の場合には、隣接したLSPパラメータr
LSP    Jとり、m+1 rLSP   J(あるmについて)が非常に近いり、
m 値となり、無声の場合には各mについて隣接のLSPパ
ラメータは近い値とならないと云う性質があることが知
られている。上述した第(3)式に示す予測処理におけ
る第1項は有声音の場合の予測であり、第2項は無声音
の場合の予測であって、当該第(3)式はその線形結合
となっている。
そのため、有声yから無声音に推移するまたはその逆の
ケースのように有声音と無声音の両方の性質を持った場
合では、良好な予測を行うことかできる。
更にピッチ情報(ピッチゲインG、ピッチ周期m)につ
いては、そのピッチゲインGをG  −G   +ΔG
L−1・・・・・・ (4)L   L−1 として予測し、またそのピッチ周期mについては+6m
      ・・・・・・ (5)L   L−I  
  L−1 として予IJIする。但し、 ΔG   −G   −G L−L    L−2L−1 ’ mL−I    L−2L−1 −m       −m である。
第2図は上述した予測処理の処理手順を示すもので、先
ずデマルチプレクサ21を介して受信されたパケット・
データを取込むことから予測処理か開始される(ステッ
プS1)、そして逆量子化部22で求められた子側残差
信号e  から正規化自己相関を計算しくステップS2
)、その最大値を求める(ステップS3)。その後前述
したようにα およびβLを求め、第(1)式に従って
残差信号の予測値e  を求める(ステップS4)。
L(n) その後、更に前述した第(2)式、第(3)式。
第(4)式、第(5)式にそれぞれ従ってσL。
LSP   、G、m  をそれぞれ予測する(スL、
Ill   L   L チップS5〜S7)。
以上の予測処理をフレーム単位で順次実行する。
そして前記制御部32でパケット抜けが検出されたか否
かを判定しくステップS8)、パケット抜は検出時には
上述した如く予測された情報を用いて音声データの復号
処理を実行する(ステップS9)。
このように本装置は符号化部では送信すべき音声信号は
1フレ一ム単位でサイド情報と予測残差よりなる圧縮符
号に変換し、これをサイド情報と予測残差に分けると共
にこれらのうち、一方を次のパケットタイミングに分け
て送出する。これはサイド情報、予測残差の両方につい
てフレーム間予測するよりも、一方はフレーム間予測、
他方は受信データの方が復号あるいは合成音声が向上す
るからである。また復号化部では、フレーム間予側手段
により受信データのフレームにまたがってデータの系列
を予el L、出力しく具体的には受信データの補間パ
ラメータから復号あるいは、合成パラメータを生成する
)、またパケットの監視をしてパケット抜けを調べる制
御手段によりパケット抜けかを判定し、パケット抜けな
らばフレーム間予側手段からの補間パラメータと受信デ
ータのパラメータとから音声を復号あるいは合成させ、
パケット抜けが無いならば送出された複数フレームの受
信データの復号パラメータから音声を復号させるように
復号再生手段を制御するようにしたものである。
この結果、パケット抜けが生じた場合であっても、その
欠落部分の音声符号を効果的に補うことができ、耳障り
な音の発生を防いで復号再生音声の品質を確保すること
が可能となる。また所定のフレーム単位で圧縮符号化さ
れたデータ・パケットに個々に対処してその復号化処理
を行なうので、複数のパケットに亙ってデータ系列の並
び替え等の処理を施す必要がないので、時間的な遅延が
問題となることもない。
また前述した従来例に示されるように複数フレームに亙
ってパケット・データを蓄積した後に復号処理を行う必
要がないので、時間的な遅延の問題がなく、会話の自然
性を良好に保つことが可能となる。また上述した復号化
方式におけるフレーム間予測、所謂ボコーダにおけるパ
ラメータ生成である為、その処理量の増大はさほどでは
ない。
しかも少工のハードウェアによって簡易に実現すること
ができる等の実用上多大なる効果が得られる。
尚、本発明は上述した実施例に限定されるものではなく
、例えばパケット抜けが生じたときは復号音声と合成音
声との接続部分で不連続点が生じるが、両者の音声を適
宜に処理して不連続部分を生じないようにしても良く、
また、フレーム間予測のアルゴリズム等はその旨を逸脱
しない範囲で種々変形可能である。
[発明の効果] 以上説明したように本発明によれば、遅延時間の問題を
効果的に回避し、フレーム単位での圧縮符号化による音
声のパケット伝送を可能とし、しかもパケット抜けを効
果的に補って品質の高い音声情報の復号再生を可能とす
る等の実用上多大なる効果が得られる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る音声復号化装置を用い
て構成されるパケット伝送システムの概略的な構成図、
第2図は実施例装置において特徴的な作用を呈するフレ
ーム間予測部の概略的な処理手続きの流れを示す図、第
3図は従来の音声パケット伝送における問題点を説明す
る為の図、第4図はパケット通信網の概略を示す図、第
5図はフレーム単位での圧縮符号化による伝送パケット
のフレーム構成を示す図、第6図はパケットのフレーム
接続構成を示す図である。 1・・・パケット送信部、2・・・パケット受信部、1
0.37,38.39・・・遅延部、21・・・デマル
チプレクサ、22・・・逆量子化部、31・・・フレー
ム間予測部、32・・・制御部、33・・・セレクタ、
34゜35゜ 36・・・処理部。

Claims (1)

  1. 【特許請求の範囲】 所定の周期でサンプリングされた音声信号を所定のサン
    プリング数からなるフレーム単位で圧縮符号化してパケ
    ット伝送に供すると共にパケット伝送された情報を受け
    て、復号し前記音声信号を再生する音声符号化・復号化
    装置において、フレーム単位の音声信号圧縮符号化デー
    タを複数のフレームタイミングに分けると共にこれらを
    他のフレームの分割したデータと組合わせたフレーム構
    成として出力し、パケット伝送に供する符号化部と、 パケット伝送された圧縮符号化データの系列を複数フレ
    ームにまたがって連続的に予測し、該予測したデータを
    出力するフレーム間予測部と、受信パケットの連続性か
    らパケット抜けを検出する検出手段と、この検出手段に
    よりパケット抜けが検出されたとき、受信データに代え
    て前記フレーム間予測部にて予測されたデータ系列を用
    い、パケット抜けが検出されないときは受信データを用
    いるよう制御する制御手段と、 前記受信された圧縮符号化データと前記フレーム間予測
    部の出力データのうち前記制御手段の制御により定まる
    一つを用いて音声信号の復号再生を行う復号再生手段と
    を具備したことを特徴とする音声符号化・復号化装置。
JP63215620A 1988-08-30 1988-08-30 音声符号化・復号化装置 Pending JPH0263333A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63215620A JPH0263333A (ja) 1988-08-30 1988-08-30 音声符号化・復号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63215620A JPH0263333A (ja) 1988-08-30 1988-08-30 音声符号化・復号化装置

Publications (1)

Publication Number Publication Date
JPH0263333A true JPH0263333A (ja) 1990-03-02

Family

ID=16675421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63215620A Pending JPH0263333A (ja) 1988-08-30 1988-08-30 音声符号化・復号化装置

Country Status (1)

Country Link
JP (1) JPH0263333A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009290529A (ja) * 2008-05-29 2009-12-10 Toa Corp ストリーミングデータ補償方法およびデジタル信号受信装置
US8254935B2 (en) 2002-09-24 2012-08-28 Fujitsu Limited Packet transferring/transmitting method and mobile communication system
US9227758B2 (en) 2010-11-12 2016-01-05 @Vance B.V. Auxiliary transport unit and method for use thereof

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8254935B2 (en) 2002-09-24 2012-08-28 Fujitsu Limited Packet transferring/transmitting method and mobile communication system
JP2009290529A (ja) * 2008-05-29 2009-12-10 Toa Corp ストリーミングデータ補償方法およびデジタル信号受信装置
US9227758B2 (en) 2010-11-12 2016-01-05 @Vance B.V. Auxiliary transport unit and method for use thereof

Similar Documents

Publication Publication Date Title
JP4473869B2 (ja) 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム
EP1589330A1 (en) Audio packet vanishment concealing device, audio packet vanishment concealing method, reception terminal, and audio communication system
JPH09321783A (ja) 音声符号化伝送システム
TWI587284B (zh) Sound encoding device
JP2008261904A (ja) 符号化装置、復号化装置、符号化方法および復号化方法
JP2002162998A (ja) パケット修復処理を伴なう音声符号化方法
US7302385B2 (en) Speech restoration system and method for concealing packet losses
JP3566931B2 (ja) 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
JP4831138B2 (ja) 音声信号伝送装置、音声信号受信装置及び音声信号伝送システム
JPH0263333A (ja) 音声符号化・復号化装置
US5148486A (en) Voice decoding device
KR100594599B1 (ko) 수신단 기반의 패킷 손실 복구 장치 및 그 방법
KR100591544B1 (ko) VoIP 시스템을 위한 프레임 손실 은닉 방법 및 장치
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
JP3487158B2 (ja) 音声符号化伝送システム
JP2904427B2 (ja) 欠落音声補間装置
US7693151B2 (en) Method and devices for providing protection in packet switched communications networks
JPH021661A (ja) パケット補間方式
Tosun et al. Dynamically adding redundancy for improved error concealment in packet voice coding
JPH01248200A (ja) 音声復号化装置
KR19990053837A (ko) 오디오 신호의 에러 은닉 방법과 그 장치
JPH10333698A (ja) 音声符号化方法、音声復号化方法、音声符号化装置、及び記録媒体
JP4367446B2 (ja) 音声信号伝送方法、音声信号復号方法及び音声符号化方法
JP4367453B2 (ja) 音声信号伝送方法及び音声信号復号方法
JP4367452B2 (ja) 音声信号伝送方法及び音声信号復号方法