JP3240825B2 - 音声補間方法 - Google Patents

音声補間方法

Info

Publication number
JP3240825B2
JP3240825B2 JP09880294A JP9880294A JP3240825B2 JP 3240825 B2 JP3240825 B2 JP 3240825B2 JP 09880294 A JP09880294 A JP 09880294A JP 9880294 A JP9880294 A JP 9880294A JP 3240825 B2 JP3240825 B2 JP 3240825B2
Authority
JP
Japan
Prior art keywords
information
packet
voice
time
coded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09880294A
Other languages
English (en)
Other versions
JPH07306698A (ja
Inventor
宏志 小西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP09880294A priority Critical patent/JP3240825B2/ja
Publication of JPH07306698A publication Critical patent/JPH07306698A/ja
Application granted granted Critical
Publication of JP3240825B2 publication Critical patent/JP3240825B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は送信側で入力音声信号
をフレームごとに符号化し、その符号化音声情報を複数
フレームごとにパケット化して送信し、受信側で受信パ
ケットの符号化音声情報を復号、再生して音声信号を得
ると共に、符号化音声情報がないフレーム区間は過去の
音声情報で補間する音声補間方法に関する。
【0002】
【従来の技術】音声信号をフレームごとに符号化し、そ
の符号化音声信号を複数のフレームをまとめてパケット
として伝送する通信網においては、網内で生じる不規則
な遅延、例えばパケットごとに異なるルートを通るため
に生じる異なる遅延のために、受信側にパケットが一定
時間内に到達せずにパケットの欠落を生じることがあ
る。そのため受信側において欠落パケット部分の音声信
号を再生できなくなり、聴感上の音声品質の劣化が生じ
る。このパケット欠落問題を解決するために、従来より
いくつか欠落音声の補間方法が提案されている。その中
でも、特許公開出願番号:特開平5−88697で提案
されている適応予測符号化(APC)方式、マルチパル
ス駆動型線形予測符号化(MPC)方式もしくはコード
駆動型線形予測符号化(CELP)方式等のピッチ分析
を持つ音声符号化方式に適用可能な欠落音声補間方法を
説明する。
【0003】即ちAPC方式についてみると、これは送
信側で、入力音声信号の短時間スペクトル包絡を表す短
時間相関(フオルマント相関)を短時間予測器(フオル
マント予測器)を用いて取り除き、更に有声音などにお
いてピッチ周期ごとに波形が繰り返されるという長時間
相関(ピッチ相関)を長時間予測器(ピッチ予測器)を
用いて取り除き、その結果の残差信号を量子化、符号化
し、前記予測情報と共に送信する。
【0004】受信側においては図3に示すように、入力
端子11からの入力符号化音声信号は多重分離回路12
で残差信号量子化情報と、長時間予測情報と、短時間予
測情報とに分離され、これら分離された残差信号量子化
情報から残差信号復号器13で残差信号が復号され、長
時間予測情報から長時間予測係数復号器14で長時間予
測係数が復号され、短時間予測情報から短時間予測係数
復号器15で短時間予測係数が復号される。復号された
残差信号はスイッチ16を通じて加算器17及び長時間
予測器18よりなる長時間合成フィルタ19へ供給さ
れ、長時間合成フィルタ19の出力は加算器21及び短
時間予測器22からなる短時間合成フィルタ23へ供給
される。復号された長時間予測係数は長時間予測器18
に設定され、つまり長時間合成フィルタ19のフィルタ
係数が設定され、また復号された短時間予測係数は短時
間予測器22に設定され、つまり短時間合成フィルタ2
3のフィルタ係数が設定される。
【0005】従って復号された残差信号に、除去された
長時間相関が長時間合成フィルタ19で付加され、更に
除去された短時間相関が短時間合成フィルタ23で付加
されて、音声信号が再生されて出力端子24へ出力され
る。入力符号音声信号が所定時間内に到達しないと、つ
まりパケットが欠落すると、端子25からの欠落情報に
よりスイッチ16がオフとされ、長時間予測器18,短
時間予測器22には直前のパケットにおける長時間予測
係数、短時間予測係数がそれぞれ設定される。従って直
前のパケットの長時間合成フィルタ19の出力が帰還作
用により自己駆動として用いられて合成出力され、これ
が短時間合成フィルタ23で短時間合成され、欠落パケ
ットに対する音声信号の補間が行われる。
【0006】1フレームの時間は符号化方式により異な
るが通常5〜30msであり、パケット長も各種あるが、
例えば図4Aに示すように3フレームごとに1パケット
として送出され、従って例えばフレームF3 〜F5 の符
号化音声よりなるパケットP 1 が、その直前のパケット
0 の最後のフレームF2 の復号、再生が終了する時点
3 より前に受信されると、フレームF2 の復号、再生
音声信号にパケットP 1 の復号、再生音声信号を連続さ
せることができる。しかしパケットP2 のように、パケ
ットP1 の復号、再生が終了する時刻t6 よりも前であ
るパケットP2の再生予定時刻、例えばt5 までに受信
されないと、パケット欠落として、その直前のフレーム
2 を再生してその音声信号F2',F2'' ,F2'''を代
用して補間処理を行っている。
【0007】一方、音声信号中には無音や有声音の定常
部など冗長な部分が多く含まれており、全ての音声情報
を伝達するのでは伝送効率が悪くなる。この点から無音
データを圧縮して伝送効率を上げる音声情報圧縮方法が
特願平5−244201号公報で提案されていた。即
ち、この圧縮方法はパケットが有音部の先頭パケット、
有音部の末尾パケット、その他の有音部、無音部の先頭
パケット、その他の無音部かを判別し、有音部の先頭パ
ケットに有音部先頭情報を、有音部の末尾に有音部末尾
情報を、またそれぞれの有音部には有音部における順序
情報を、無音部の先頭パケットに無音部先頭情報をそれ
ぞれ付加して伝送し、その他の無音部を廃棄することに
より有効音声データのみを伝送し、受信側では、有音部
の順序情報に従って有音部を再生し、無音部先頭情報を
検出すると、その無音部情報を次の有音部が受信される
まで繰り返し再生する。
【0008】
【発明が解決しようとする課題】特開平5−88697
号公報で提案されている欠落音声補間方法によれば良好
な補間品質が得られるが、音声の冗長問題が考慮されて
なく、伝送効率が悪く、問題があった。特開平5−24
4201号公報で提案されている圧縮方法は無音部の圧
縮がなされるが、有声音定常部については圧縮の適用が
なされてなく、それだけ伝送効率の向上が十分ではな
く、かつ受信側で、圧縮された無音部の伸張の処理と、
欠落パケットの検出補間処理とを全く独立した処理で行
っているため、全体の処理が複雑になってしまう問題が
あった。
【0009】
【課題を解決するための手段】請求項1の発明によれば
各パケットごとに、その符号化音声情報は、その入力音
声信号の入力時刻を示す情報を付加し、受信側で受信し
た時刻情報と符号化音声情報のフレーム数とから符号化
音声情報がないフレーム区間を検出し、その検出したフ
レーム区間を、過去の音声情報で補間する。
【0010】請求項2の発明では、請求項1の発明にお
いて入力音声信号の無音区間や有声音定常部などの冗長
部については、その最初のフレームの符号化音声情報の
みを送信する。請求項4の発明によれば、受信パケット
から得た時刻情報と、符号化音声情報のフレーム数とか
ら符号化音声情報がないフレーム区間を検出し、その検
出フレーム区間を過去の音声情報で補間する。
【0011】
【実施例】図1に請求項1の発明の実施例を適用したシ
ステムを示す。送信側30においてマイクロホン31か
らの入力音声信号は音声符号化情報生成手段32でAP
C方式、MPC方式、CECP方式などによりフレーム
(例えば5〜30ミリ秒)ごとに符号化され、この符号
化音声情報は時刻付音声パケット生成手段33で複数フ
レームごとにパケット化され、かつその際にその符号化
音声情報の入力音声の符号化時刻を示す時刻情報も付加
される。各パケットのデータ部に符号化音声情報とその
時刻情報とが含まれる。
【0012】入力音声信号は例えば図2Aに示すように
フレームごとにF0 ,F1 ,F2 …と符号化され、この
符号化音声情報は、図2Bに示すように3フレームごと
にその時の符号化時刻を示す情報を含んでパケット化さ
れる。つまりパケットP0 は時刻情報t0 と符号化音声
情報F0 ,F1 ,F2 がデータ部に含まれ、次のパケッ
トP1 は時刻情報t3 と符号化音声情報F3 ,F4 ,F
5 とがデータ部に含まれる。時刻情報t1 ,t2 ,t3
…は符号化時におけるその時の時計の時刻、何時、何
分、何秒、何ミリ秒を使用するに場合に限らず、符号化
時のフレーム番号を時刻情報としてもよい。
【0013】送信側30で生成されたパケットP1 ,P
2 ,P3 …は伝送路34へ送出され、受信側35で伝送
路34から受信されたパケットは無情報区間検出手段3
6で時刻情報抽出手段37により、各パケットのデータ
部内時刻情報が抽出され、時刻管理手段38により、各
抽出された時刻情報と、各パケットのフレーム数(パケ
ット長)とから符号化音声情報がないフレーム区間(無
情報区間)が検出される。一方、バッファ39におい
て、各受信パケットのデータ部から符号化音声情報が検
出されて、一時蓄えられた後、音声復号/補間再生手段
41へ供給される。音声復号/補間再生手段41は入力
された符号化音声情報を復号、再生すると共に無情報区
間については過去の音声情報により補間がなされる。音
声復号/補間再生手段41から再生された音声信号はス
ピーカ42へ供給されて放声される。
【0014】例えば図2Bに示したパケットP1
2 ,P3 …が送信され、これらが図2Cに示すように
受信された場合、パケットP0 の符号化音声情報F0
1 ,F 2 が図2Dに示すように音声信号として復号、
再生され、またその時刻情報t0と、そのパケットの符
号化音声情報のフレーム数、この例では固定パケット長
でフレーム数3とから次のパケットP1 の再生開始予定
時刻、この例では時刻t3から符号化音声情報F3 の再
生音声信号が出力される必要から、例えば時刻t2を検
出し、かつ次に受信されたパケットP1 からその時刻情
報t3 を知り、パケットが正常に受信されているか否か
の判断がなされる。なお、受信パケットはバッファ39
に一時蓄えられ、再生音声信号のスピーカへの送出時刻
0 はパケットP0 を受信した時刻から適当に遅らした
時刻を、受信側での時刻t0 に設定する。
【0015】同様にしてパケットP1 から時刻情報t3
を知り、かつ符号化音声情報F3 ,F4 ,F5 について
の復号、再生がなされる。受信側の時刻がt5 となった
が、つまり次のパケットP2 の再生を開始すべき時刻に
なったが、パケットP2 が遅延受信され、または欠落と
なり、パケットP3 が受信されると、その時刻情報t 9
と先に検出した時刻情報t3 と、パケットのフレーム数
3とから、時刻t6 〜t9 は無情報区間と判定し、この
区間は過去の音声情報で補間し、音声信号F5',F5''
,F5'''を出力する。例えばこの無情報区間には切り
換え信号を、図4に示した音声復号/補間再生手段41
へ供給してスイッチ16をオフにすればよい。つまり、
帰還形の音声合成フィルタはその直前のフレームの復号
フィルタ係数を設定し、かつそのフィルタを自己駆動型
とする。
【0016】上述ではパケット長を固定にしたが、パケ
ット長を可変としてもよい。例えば図2Eに示すよう
に、パケットP0 は符号化音声情報F0 ,F1 ,F2
時刻情報t0 と、フレーム数3とがデータ部に設けら
れ、パケットP1 は符号化音声情報F3 〜F7 と、時刻
情報t3 と、フレーム数5とがデータ部に設けられ、パ
ケットP2 は符号化音声情報F8 〜F11と、時刻情報t
8 と、フレーム数4とがデータ部に設けられ、以下同様
である。
【0017】このように送信パケットに対する受信側の
処理は前述の場合とほゞ同様で、図2Fに示すようにパ
ケットが受信されると、再生音声は図2Gに示すように
なる。例えばパケットP2 が大きく遅延または欠落した
場合、パケットP1 の時刻情報t3 と、フレーム数5と
から次のパケットP2 の再生開始時刻情報t7 にパケッ
トP2 が受信されていないことを検出し、または前記時
刻情報t3 と、フレーム数5と、次の受信パケットP3
の時刻情報t12とから、時刻t8 〜t12の4フレームは
無情報区間と判定され、この無情報区間に対する補間が
なされ、補間音声F7',F7'' ,F7''',F7'''' が出
力される。
【0018】請求項2の発明では、入力音声信号中の無
音部または有声音定常部などの冗長部については、その
最初のフレームの符号化音声情報のみを送出する。例え
ば図3Aに示すように、符号化音声情報中のF4
5 ,F6 ,F7 が無音部、有声音定常部などの冗長部
であるとする。そのパケット化によりパケットP0 のデ
ータ部に、符号化音声情報F0 ,F1 ,F2 と時刻情報
0 と、フレーム数3とが設定され、次のパケットP1
は符号化音声情報F3 ,F4 と、時刻情報t3 と、フレ
ーム数2とをデータ部に設定する。こゝで符号化音声情
報F4 は冗長部の最初のフレームであって、これより以
後の冗長部の符号化音声情報F5 ,F6 ,F 7 を省略
し、このF4 がパケットP1 の符号化音声情報の最後と
する。符号化音声情報F5 〜F7 が省略されるため、次
のパケットP2 には冗長部の直後の符号化音声情報F8
から例えばF11までと、時刻情報t8 と、フレーム数4
とがデータ部に設定される。
【0019】このように冗長部が圧縮された符号化音声
情報のパケットから音声信号を再生する処理は前述のパ
ケット遅延乃至欠落の場合と同様に、時刻情報と、フレ
ーム数とから無情報区間を検出して、その検出した無情
報区間に対し、補間処理を行えばよい。即ち図3Bに示
した例の場合、この送信パケットP0 ,P1 ,P2 …を
受信すると、パケットP1 の時刻情報t2 と、フレーム
数2と、次のパケットP2 の時刻情報t8 とから、符号
化音声情報F4 からF8 までの3フレームの区間は符号
化音声情報がない無情報区間と判定され、前述と同様
に、つまり図4に示した場合と同様に、過去の音声から
その無情報区間についての補間音声F4',F4'',
4'''が作られて出力される。
【0020】上述のように固定パケット長において冗長
部を圧縮する場合は、図3Aに示した符号化音声情報に
対し、3フレームごとにパケット化する場合は、図3D
に示すように、各パケット中のフレーム数は省略され、
データ部には各3フレームの符号化音声情報と、時刻情
報とが設定される。パケットP1 ではその3フレームの
符号化音声情報の最後のものF5 は冗長部のものである
から、それ以後のその冗長部の符号化音声情報F6 ,F
7 を省略する。従って、次のパケットP2 は冗長部の直
後の符号化音声情報F8 を含む3フレーム分F8
9 ,F10と、時刻情報t8 とでデータ部が構成され
る。受信側での復号、再生と補間とは先に述べた場合と
同様である。この場合は圧縮率は下がる場合があるが、
フレーム数を送る必要がない。
【0021】上述においては時刻情報をパケットのデー
タ部に設定したが、冗長部の圧縮を行わない場合はパケ
ットのヘッダ部に設けられているパケット送出時刻乃
至、パケット番号を利用してもよい。つまりパケット送
出時刻は入力音声信号の符号化時刻と対応するからであ
る。上述における音声復号/再生手段41としては図4
に示した構成のみならず、特開平5−88697号公報
中に示している各種の手法、その他の手法を用いてもよ
い。
【0022】
【発明の効果】以上述べたように、この発明によれば受
信パケットの時刻情報とパケットのフレーム数とから、
無情報区間を検出し、その検出無情報区間を過去の音声
信号から補間することにより良品質の再生音声信号を得
ることができる。更に、パケット欠落、遅延、無音区
間、有声音定常部のような冗長部を圧縮でき、この圧縮
の伸張を、パケット欠落に対する補間処理と全く同様に
行われ、パケット欠落に対する処理と、音声信号の圧縮
に対する伸張処理とを区別することなく行われ、音声復
号、再生/補間処理の手順が全体として簡単になる。
【図面の簡単な説明】
【図1】請求項1の発明の実施例が適用されたシステム
を示すブロック図。
【図2】Aは送信側の符号化音声情報系列の例を示す
図、Bはそれをパケット化した音声パケット系列の例を
示す図、Cは受信側の受信パケット系列の例を示す図、
Dは再生音声の系列を示す図、Eはパケット化音声パケ
ット系列の例を示す図、Fはその受信パケット系列の例
を示す図、Gはその再生音声系列を示す図である。
【図3】Aは冗長部を含む符号化音声情報系列の例を示
す図、Bはその冗長部を圧縮した音声パケットの系列を
示す図、Cはその受信側の再生音声系列を示す図、Dは
冗長部を圧縮した音声パケット系列の他の例を示す図で
ある。
【図4】従来の欠落音声補間装置の例を示すブロック
図。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 19/00

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 送信側で入力音声信号をフレームごとに
    符号化し、その符号化音声情報を複数フレームごとにパ
    ケット化して送信し、 受信側で受信パケットの符号化音声情報を復号、再生し
    て音声信号を得ると共に、符号化音声情報がないフレー
    ム区間を過去の音声情報で補間する音声補間方法におい
    て、 送信側で各パケットごとに、その符号化音声情報にその
    入力音声信号の入力時刻を示す情報を付加し、 受信側で受信した時刻情報と符号化音声情報のフレーム
    数とから上記符号化音声情報がないフレーム区間を検出
    することを特徴とする音声補間方法。
  2. 【請求項2】 送信側で、各パケットごとにその符号化
    音声情報のフレーム数を付加し、入力音声信号の無音区
    間や有声音定常部などの冗長部については、その最初の
    フレームの符号化音声情報のみを送信することを特徴と
    する請求項1記載の音声補間方法。
  3. 【請求項3】 送信側で、各パケット長を固定とし、入
    力音声信号の冗長部についてはその最初のフレームか
    ら、それが収容されるパケットで収容される以後のその
    冗長部の符号化音声情報を廃棄することを特徴とする請
    求項1記載の音声補間方法。
  4. 【請求項4】 符号化音声情報をフレームごとにパケッ
    トとして受信し、そのパケットの符号化音声情報を復
    号、再生して音声信号を得ると共に、符号化音声情報が
    ないフレーム区間を過去の音声情報で補間する音声補間
    方法において、 受信パケットから得た時刻情報と、符号化音声情報のフ
    レーム数とから上記符号化音声情報がないフレーム区間
    を検出することを特徴とする音声補間方法。
  5. 【請求項5】 符号化音声情報の復号、再生を、帰還形
    の音声合成フィルタを用いて行い、上記検出した符号化
    音声情報がない区間で、その直前のフレームの復号フィ
    ルタ係数を上記音声合成フィルタに設定し、かつその音
    声合成フィルタを自己駆動として上記補間を行うことを
    特徴とする請求項1乃至4記載の音声補間方法。
JP09880294A 1994-05-12 1994-05-12 音声補間方法 Expired - Fee Related JP3240825B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09880294A JP3240825B2 (ja) 1994-05-12 1994-05-12 音声補間方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09880294A JP3240825B2 (ja) 1994-05-12 1994-05-12 音声補間方法

Publications (2)

Publication Number Publication Date
JPH07306698A JPH07306698A (ja) 1995-11-21
JP3240825B2 true JP3240825B2 (ja) 2001-12-25

Family

ID=14229484

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09880294A Expired - Fee Related JP3240825B2 (ja) 1994-05-12 1994-05-12 音声補間方法

Country Status (1)

Country Link
JP (1) JP3240825B2 (ja)

Also Published As

Publication number Publication date
JPH07306698A (ja) 1995-11-21

Similar Documents

Publication Publication Date Title
JP3167385B2 (ja) 音声信号伝送方法
JP4518714B2 (ja) 音声符号変換方法
JPH09321783A (ja) 音声符号化伝送システム
KR101826375B1 (ko) 재생에 선행하여 베이스 층 및 적어도 하나의 강화 층을 포함하는 층화된 계층적 비트 스트림을 검색하기 위한 방법 및 장치
JPH0730496A (ja) 音声信号復号化装置
JP3566931B2 (ja) 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
JP3240825B2 (ja) 音声補間方法
JP3050978B2 (ja) 音声符号化方法
JP4618634B2 (ja) 圧縮オーディオデータ処理方法
JPH0236628A (ja) 音声信号の送信方式及び送受信方式
KR100591544B1 (ko) VoIP 시스템을 위한 프레임 손실 은닉 방법 및 장치
KR100542435B1 (ko) 패킷 망에서의 프레임 손실 은닉 방법 및 장치
JP2904427B2 (ja) 欠落音声補間装置
JP3240824B2 (ja) 欠落音声補間方法
JP4597360B2 (ja) 音声復号装置及び音声復号方法
Tosun et al. Dynamically adding redundancy for improved error concealment in packet voice coding
JP2002252644A (ja) 音声パケット通信装置及び音声パケット通信方法
JPH10174065A (ja) 画像音声多重化データ編集方法およびその装置
JP2935213B2 (ja) 音声情報伝送方式
JPH07334197A (ja) 音声符号化装置
JP3865254B2 (ja) 音声符号化方法及び音声復号方法
JP3856330B2 (ja) 音声符号化方法及び音声復号方法
JP4151033B2 (ja) 音声符号化方法及び音声復号方法
JP3865258B2 (ja) 音声符号化方法及び音声復号方法
JP3864985B2 (ja) 音声符号化方法及び音声復号方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071019

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081019

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees