JP2005274917A

JP2005274917A - 音声復号装置

Info

Publication number: JP2005274917A
Application number: JP2004087478A
Authority: JP
Inventors: Shigeaki Suzuki; 茂明鈴木; Wataru Fushimi; 渉伏見; Yukimasa Sugino; 幸正杉野
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2004-03-24
Filing date: 2004-03-24
Publication date: 2005-10-06

Abstract

【課題】ADPCM符号化による伝送装置では、符号化データ欠落時、その欠落データを補間データにより補償するが、データ欠落から音声データへの復旧後しばらくの間は、正常な音声信号が出力されず、場合によっては不快な異常音を出力する。
【解決手段】符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、検出手段からの出力で符号化データの欠落部分に応じて補間信号を生成する補間信号生成手段と、上記補間信号を欠落部分に挿入する切り替え手段と、上記切り替え手段を制御して、補間信号の挿入を欠落部分より所定時間長くする制御手段とを備えることで受信符号化データの欠落状態から復旧した直後においても異常音を出力しない。
【選択図】図１

Description

この発明は、符号化された音声信号等を復号する音声復号器に関するものである。

近年のＩＰ（ＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ）通信の発展により、電話音声信号やファクシミリ信号をＩＰパケット化して伝送するＶｏＩＰ（ＶｏｉｃｅｏｖｅｒＩＰ）技術に代表される、音声パケット通信技術が注目されている。パケット網においては網の輻輳などが原因でパケット損失が生じることがあり、このため、受信側において音声信号の一部が欠落することになる。この問題を解決するために、従来、欠落した音声データを補間する方式が提案されている。

具体的には下記の通りである。
パケットロス検出部は、パケットロスが発生しているか否かを判断し、パケットロスが発生している場合に出力レジスタに対して検出信号を与える。また、入力された受信符号化データをそのままパケットロス補間部に与える。パケットロス補間部は、パケットロスが生じていない場合には、入力された受信符号化データをそのままＡＤＰＣＭ復号部及びコードレジスタに与える。他方、パケットロスが生じている場合には、パケットロス補間部は、コードレジスタから与えられた補間用符号化データ列をパケットロス期間に挿入してＡＤＰＣＭ復号部及びコードレジスタに与える。

コードレジスタは、パケットロス補間部から出力されたロス部分のない符号化データ列を格納する。格納する符号化データ量は、少なくとも後述するテンプレート期間及びサーチウィンドウ期間の合成期間に相当する符号化データ量（サンプル数）である。また、コードレジスタは、パターンマッチング回路から与えられた期間情報が指示する期間の符号化データ列をパケットロス補間部に与えるものである。ＡＤＰＣＭ復号部は、ステップサイズ適応制御部、逆量子化器、加算器及び予測器から構成されており、パケットロス補間部から与えられた符号化データ列に対して復号処理して音声信号（デジタル信号）を得てデジタル／アナログ変換回路及び出力レジスタに出力する。

出力レジスタは、ＡＤＰＣＭ復号部から出力された音声信号を格納するものである。格納する音声信号量（サンプル数）は、少なくとも後述するテンプレート期間及びサーチウィンドウ期間の合成期間に相当する量である。出力レジスタは、パケットロス検出部からパケットロスの検出信号が与えられると、格納しているテンプレート期間の音声信号列及びサーチウィンドウ期間の音声信号列をパターンマッチング回路に与えるものである。パターンマッチング回路は、テンプレート期間の音声信号列との相関が最も高い（テンプレート期間の音声信号列に最も類似している）サーチウィンドウ期間内の期間をパターンマッチング処理によって確定し、補間させる符号化データ列の期間を決定してその期間情報をコードレジスタに与えるものである（特許文献１を参照）。

特開平５−２０７０６４号公報（段落番号［００３５］から［００５２］、図１）

従来の音声復号装置は以上のように構成されており、符号化データの欠落部分に代り、過去の受信符号化データを復号部に与えることで音声信号の補間を実現している。ところで、ADPCM符号化の原理は、予測器が過去の再生信号を基に次の信号を予測し、予測した信号と新たな入力信号との差分のみを符号化データとして伝送することによって伝送データの情報量を圧縮するというものである。従って、ADPCM符号化データを出力する側の装置に存在する符号化部にも、復号部と同様な予測器が存在し、上述の原理に基づいた情報圧縮が正常に機能するためには、符号化部と復号部の予測器が全く同じ予測信号を出力する必要がある。

ところで、パケットロスが発生して符号化データが欠落した場合に、欠落した符号化データの代りに復号部に与えられる補間データは、符号化部が出力する符号化データとは異なる。従って、復号部における予測器と符号化部における予測器とは異なった状態になる。そして、符号化データの欠落から復旧し、正常な符号化データが復号部に与えられ始めても、符号化部と復号部との予測器の状態がすぐには一致せず、しばらくの時間は異なった状態が継続し、やがて同じ状態へと収束する。従って、受信符号化データの欠落から復旧した直後からしばらくの間は、予測器の状態不一致が原因となって復号部から正常な音声信号が出力されず、場合によっては信号レベルが異常に大きくなるなど、不快な異常音を出力してしまうという課題があった。

この発明は上記のような課題を解決するためになされたもので、受信符号化データの欠落が発生し、これが復旧した直後においても、異常音が出力されることのない音声復号装置を得ることを目的とする。

この発明に係る音声復号装置は、符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、検出手段からの出力で符号化データの欠落部分に応じて補間信号を生成する補間信号生成手段と、上記補間信号を欠落部分に挿入する信号選択手段と、上記信号選択手段を制御して、補間信号の挿入を欠落部分より所定時間長くする制御手段を備えたものである。

この発明によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、補間信号生成手段は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、復号装置は復旧後の信号を出力するのではなく,補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。

以下、この発明の実施の形態を説明する。
実施の形態１．
図１はこの発明の実施の形態１による音声復号装置を示す構成図である。図において、パケット分解部１は受信パケットを分解し受信符号化データを抜き出して出力する。音声復号部９は、パケット分解部１より入力した受信符号化データを復号し、音声信号を出力する。パケット損失検出部５１は、受信パケットを監視して受信符号化データの欠落を検出し、検出信号を出力する。検出状態制御部２は、パケット損失検出部５１からの検出信号を入力し、補間信号生成部５０と信号選択部３を制御する制御信号を出力する。補間信号生成部５０は、検出状態制御部２からの制御信号に基づいて、補間信号を出力すべき時間を認識し、音声復号部９より入力する音声信号を基に補間信号を生成する。信号選択部３は、検出状態制御部２から入力する制御信号に基づいて、音声復号部９からの入力信号と補間信号生成部５０からの入力信号との切替を行う。

以下、図２を用いてパケット損失が発生した場合の動作を説明する。この図は、上から順に、パケット損失検出部５１、検出状態制御部２、音声復号部９、補間信号生成部５０、及び、信号選択部３の出力信号を示したものである。図において、符号化データは10ms単位でパケット化されるものとしており、音声復号部９、補間信号生成部５０、信号選択部３の出力信号に付与されたN、N＋１、…、N＋４は、１パケット分、すなわち１０ｍｓ分を１ブロックとして、以下の説明用に番号付けをしたものである。

受信パケットの欠落が検出されると、パケット損失検出部５１からの符号化データ欠落検出信号が「検出」状態となる。音声復号部９は、この符号化データ欠落検出信号が「検出」状態の間、復号動作を停止して音声信号を出力しない。そして、検出状態制御部２は、パケット損失検出部５１からの符号化データ欠落検出信号が「検出」の状態、及び、パケット損失検出部５１からの符号化データ欠落検出信号が「検出」から「非検出」の状態に遷移してから所定時間（図においては10ms）、制御信号を補間信号側とし、それ以外の時間は制御信号を復号部側とする。補間信号生成部５０は、検出状態制御部２から入力する制御信号が補間信号側になっている間、補間信号を出力する。信号選択部３は、検出状態制御部２から入力する制御信号が復号部側になっている間に音声復号部９からの入力信号を選択し、検出状態制御部２から入力する制御信号が補間信号側になっている間には補間信号生成部５０からの入力信号を選択して出力する。

上述のように、符号化側と復号化側の予測器の状態不一致によって音声復号部９が出力する音声信号が異常音となり得るのは、受信符号化データ欠落状態から復旧した直後からしばらくの間であり、図２において、音声復号部がN+3番目の音声信号を出力している時間である。図２を見れば分る通り、音声復号部９がN+3番目の音声信号を出力している間も補間信号生成部５０が並行動作して補間信号が生成され、信号選択部３は補間信号を選択するようになっているため、異常音は出力されなくなることが分る。

なお、補間信号生成部５０による補間信号生成方法については、例えばITU-T勧告G.711 Appendix Iに記述される方法を使用することが可能である。図３にその原理を示す。まず、この方法では、補間信号生成部５０は、過去に音声復号部９が出力した音声信号を一定時間分保持しておく。そして音声信号が欠落した場合、まず、欠落する直前の音声信号の自己相関を演算し、音声信号の繰り返し周期を求める。そして、音声信号の欠落が開始した点から繰り返し周期分のサンプルを遡って抜き出し、これを繰り返して出力することによって補間信号を生成する。なお、図３には最終的な出力信号、すなわち信号選択部３の出力波形を併せて示している。

以上で明らかなように、この実施の形態１によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、補間信号生成部５０は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。

実施の形態２．
図４はこの発明の実施の形態２による音声復号装置を示す構成図であり、図において、図１と同一符号は同一または相当部分を示す。
乗算部３１、３２、乗算係数算出部３３及び加算部３４は、信号選択部３の内部構成要素である。乗算係数算出部３３は、検出状態制御部２から入力する検出信号に応じて、音声復号部９の出力信号に対する乗算係数αと、補間信号生成部５０の出力信号に対する乗算係数βを算出する。乗算部３１は補間信号生成部５０の出力信号に対して乗算係数βを乗算し、乗算結果を出力する。乗算部３２は音声復号部９の出力信号に対して乗算係数αを乗算し、乗算結果を出力する。加算部３４は、乗算部３１の出力信号と乗算部３２の出力信号を加算して出力する。

次に、図５を用いて、音声復号装置の動作を説明する。図５は、上から順に、パケット損失検出部５１の出力信号、検出状態制御部２の出力信号、音声復号部９の出力信号、補間信号生成部５０の出力信号、乗算係数α、乗算係数β、及び、信号選択部３の出力信号を示したものである。

受信パケットの欠落が検出されると、パケット損失検出部５１からの符号化データ欠落検出信号が「検出」状態となる。音声復号部９は、この符号化データ欠落検出信号が「検出」状態の間、復号動作を停止して音声信号を出力しない。そして、検出状態制御部２は、パケット損失検出部５１からの符号化データ欠落検出信号が「検出」の状態、及び、パケット損失検出部５１からの符号化データ欠落検出信号が「検出」から「非検出」の状態に遷移してから所定時間（図においては10ms）、出力制御信号を補間信号側とし、それから更に所定時間（図においては10ms）は出力制御信号を過渡状態側とし、それ以外の時間は出力制御信号を復号部側とする。補間信号生成部５０は、検出状態制御部２から入力する制御信号が復号部側以外になっている間、補間信号を出力する。

信号選択部３における乗算係数算出部３３は、検出状態制御部２から入力する制御信号によって、乗算係数α、βを次のように算出する。まず、検出状態制御部２から入力する制御信号が復号部側であるときα＝１、β＝０とし、補間信号側であるときはα＝０、β＝１とする。そして、検出状態制御部２から入力する制御信号が過渡状態の場合、αを徐々に増大させ、βを徐々に減少させ、１０ｍｓの間にαが０から１に、βが１から０に変化するようにする。10ms間の音声信号のサンプル数は80サンプルであるので、1サンプル毎にα＝α＋０．０１２５、β＝β−０．０１２５という演算をすることとなる。乗算部３１は、補間信号生成部５０の出力信号にβを乗算して加算部３４に出力し、乗算部３２は、音声復号部９の出力信号にαを乗算して加算部３４に出力し、加算部３４はこれらを加算して出力する。

この結果、検出状態制御部の出力が復号部側にあるとき、α＝１、β＝０であるので、加算部３４の出力は音声復号部９の出力信号と同一となり、検出状態制御部の出力が補間信号側にあるとき、α＝０、β＝１であるので、加算部３４の出力は補間信号生成部５０の出力信号と同一となる。検出状態制御部の出力が過渡状態にあるときは、αが徐々に増大しβが徐々に減少するので、加算部３４の出力は、10msの間に補間信号生成部５０の出力信号から音声復号部９の出力信号へと徐々に切り替わることになる。

このような切り替えをするメリットは、以下の通りである。補間信号の生成方法は図３に示した通りであるが、ここで、音声信号の周期性がサンプル周期の整数倍でないと、音声復号部９の出力信号と補間信号生成部５０の出力信号とを切り替えた点において出力波形が不連続となり、クリック音が聞こえることになる。これは、特に、補間信号から復号された音声信号に切り替える点で顕著に発生し易い。何故なら、補間信号は算出した周期分の信号を抜き出してこれを繰返し挿入することによって生成されるので、時間が経過するほど実周期と算出周期との誤差が蓄積されるためである。従って、上述のように補間信号から復号された音声信号へ徐々に切り替えるようにすると、このクリック音の発生を防止することが可能となる。

以上で明らかなように、この実施の形態２によれば、受信符号化データが欠落した後に、欠落状態から復旧した場合、補間信号生成部５０は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにし、さらに補間信号から復号された音声信号に切り替える際は補間信号を徐々に減少し、音声信号を徐々に増大することにより、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果に加え、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果をも奏する。

実施の形態３．
図６はこの発明の実施の形態３による音声復号装置を示す構成図であり、この実施の形態３は、補間信号から復号された音声信号への切り替えが漸次に行われるだけでなく、補間を開始する際にも漸次復号された音声信号から補間信号に切り替えるようにするものである。
図において、図４と同一符号は同一または相当部分を示す。データ遅延部８１、８２、検出状態制御部２、及び、乗算係数算出部３３以外の動作は、図４に示した音声復号装置と同様である。データ遅延部８１は符号化データを一定時間δだけ遅延させ、データ遅延部８２はパケット損失検出部５１が出力する検出信号をデータ遅延部８１と同じ時間δ遅延させる。

検出状態制御部２と乗算係数算出部３３の動作については、図７を用いて説明する。検出状態制御部２は、パケット損失検出部５１からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δだけ、即ちデータ遅延部８１の遅延時間δだけ出力信号を過渡状態１とする。その後、パケット損失検出部５１からの検出信号が「検出」となっている時間長に所定時間（図においては１０ｍｓ）を加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間（図においては１０ｍｓ）出力信号を過渡状態２とし、最終的に出力信号を復号部側に戻す。

乗算係数算出部３３は、検出状態制御部２から入力する制御信号によって、乗算係数α、βを次のように算出する。まず、検出状態制御部２から入力する制御信号が復号部側であるときα＝１、β＝０とし、補間信号側であるときはα＝０、β＝１とする。そして、検出状態制御部２から入力する制御信号が過渡状態２の場合、αを徐々に増大させ、βを徐々に減少させ、１０ｍｓの間にαが０から１に、βが１から０に変化するようにする。１０ｍｓ間の音声信号のサンプル数は80サンプルであるので、1サンプル毎にα＝α＋０．０１２５、β＝β−０．０１２５という演算をすることとなる。逆に、検出状態制御部２から入力する制御信号が過渡状態１の場合、αを徐々に減少させ、βを徐々に増大させる。具体的には一定時間δの間にαが０から１に、βが１から０に変化するようにする。この間の音声信号のサンプル数がｘサンプルであるとすると、1サンプル毎にα＝α＋１／ｘ、β＝β−１／ｘという演算をすることとなる。

以上で明らかなように、この実施の形態３によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、補間信号生成部５０は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
また、この実施の形態３によれば、補間信号から復号された音声信号に切り替わる際は補間信号を徐々に減少し、音声信号を徐々に増大することにより、切り替わり時に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態３によれば、音声復号部への受信符号化データの入力をδ遅延させ、受信符号化データの欠落時に復号された音声信号から補間信号に切り替わる際、この遅延時間δの間、復号された音声信号を徐々に減少し、補間信号を徐々に増加させるので、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果も奏する。

実施の形態４．
図８はこの発明の実施の形態４による音声復号装置を示す構成図であり、図において、図６と同一符号は同一または相当部分を示す。
信号レベル算出部４と検出状態制御部２以外については、図６に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。信号レベル算出部４は、データ遅延部８２から出力されるパケット損失検出信号が検出状態以外のとき、信号選択部３が出力する音声信号のレベルを算出し、算出結果を検出状態制御部２に出力する。データ遅延部８２から出力されるパケット損失検出信号が検出状態のときは、上記算出を停止し、直前の算出結果を保持して検出状態制御部２に出力する。

検出状態制御部２は、パケット損失検出部５１からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δだけ出力信号を過渡状態１とする。その後、パケット損失検出部５１からの検出信号が「検出」となっている時間長に時間ｔを加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間（図においては１０ｍｓ）出力信号を過渡状態２とし、最終的に出力信号を復号部側に戻す。上記時間ｔの求め方は、信号レベル算出部４から入力される算出結果が大きい場合に長く、小さい場合に短くなるように決定する。

以上のような音声復号装置の動作が、図６に示した音声復号装置の動作と異なる点は、補間を延長する時間ｔが可変であるかどうかの違いである。図８に示す音声復号装置は、補間を開始する直前の信号レベルが小さい場合には補間の延長時間を短く、信号レベルが大きい場合には補間の延長時間を長くする。信号レベルが低い場合には符号化データ欠落後に復旧した直後に音声復号部９から出力される異常音のレベルも低くなるか、もしくは異常音が発生しないものと考えられる。異常音が発生しないのであれば、信号レベルが低い場合には早いタイミングで補間信号から音声復号部９の出力信号に切り替えた方が望ましいと言える。

以上で明らかなように、この実施の形態４によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、補間信号生成部５０は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
また、この実施の形態４によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態４によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更にまた、この実施の形態４によれば、異常音が発生しないようなレベルの低い音声信号を出力する際には、より早く通常の復号した音声信号を出力出来るという効果を奏する。

実施の形態５．
図９はこの発明の実施の形態５による音声復号装置を示す構成図であり、図において、図６と同一符号は同一または相当部分を示す。
損失時間算出部７と検出状態制御部２以外については、図６に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。損失時間算出部７は、パケット損失検出部５１から出力されるパケット損失検出信号が検出状態にある時間を算出し、算出結果を検出状態制御部２に出力する。ここで、パケット損失検出信号が非検出状態にある場合は、その前の算出結果を維持して検出状態制御部２に出力する。

検出状態制御部２は、パケット損失検出部５１からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δだけ出力信号を過渡状態１とする。その後、パケット損失検出部５１からの検出信号が「検出」となっている時間長に時間ｔを加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間（図においては１０ｍｓ）出力信号を過渡状態２とし、最終的に出力信号を復号部側に戻す。上記時間ｔの求め方は、損失時間算出部７から入力される算出結果が大きい場合に長く、小さい場合に短くなるように決定する。

以上のような音声復号装置の動作が、図６に示した音声復号装置の動作と異なる点は、補間を延長する時間であるｔが可変であるかどうかの違いである。図８に示す音声復号装置は、符号化データの欠落時間長が短い場合には補間を延長する時間を短く、符号化データの欠落時間長が長い場合には補間を延長する時間を長くする。一般に、符号化データの欠落時間長が短い場合には、符号化部と復号部との予測器の誤差が小さいため、符号化データ欠落後に復旧した直後に音声復号部９から出力される異常音が早く収束するか、もしくは異常音が発生しないものと考えられる。異常音が発生しないのであれば、符号化データの欠落時間長が短い場合には早いタイミングで補間信号から音声復号部９の出力信号に切り替えた方が望ましいと言える。

以上で明らかなように、この実施の形態５によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
また、この実施の形態５によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態５によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更にまた、この実施の形態５によれば、符号化データの欠落時間が短く異常音が早く収束するような場合、より早く通常の復号した音声信号を出力出来るという効果を奏する。

実施の形態６．
図１０はこの発明の実施の形態６による音声復号装置を示す構成図であり、図において、図８及び図９と同一符号は同一または相当部分を示す。
検出状態制御部２以外については、図８及び図９に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。検出状態制御部２は、パケット損失検出部５１からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δ、即ちデータ遅延部８１、８２の遅延時間δだけ出力信号を過渡状態１とする。その後、パケット損失検出部５１からの検出信号が「検出」となっている時間長に時間ｔを加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間（図においては１０ｍｓ）出力信号を過渡状態２とし、最終的に出力信号を復号部側に戻す。上記時間ｔの求め方については、信号レベル算出部４から入力される算出結果が大きい場合に長く、小さい場合に短くなるように、また、損失時間算出部７から入力される算出結果が大きい場合に長く、小さい場合に短くなるように決定する。

以上のような音声復号装置の動作が、図８に示した音声復号装置の動作と異なる点は、補間を延長する時間であるｔの求め方の違いである。
図１０に示す音声復号装置は、検出状態制御部２により補間を開始する直前の信号レベルが小さい場合には補間の延長時間を短く、信号レベルが大きい場合には補間の延長時間を長くする。更に、符号化データの欠落時間長が短い場合には補間を延長する時間を短く、符号化データの欠落時間長が長い場合には補間を延長する時間を長くする。信号レベルが低い場合には符号化データ欠落後に復旧した直後に音声復号部９から出力される異常音のレベルも低くなるか、もしくは異常音が発生しないものと考えられる。一般に、符号化データの欠落時間長が短い場合には、符号化部と復号部との予測器の誤差が小さいため、符号化データ欠落後に復旧した直後に音声復号部９から出力される異常音が早く収束するか、もしくは異常音が発生しないものと考えられる。このようなことから、異常音が発生しないのであれば、信号レベルが低い場合と符号化データの欠落時間長が短い場合には、早いタイミングで補間信号から音声復号部９の出力信号に切り替えた方が望ましいと言える。

以上で明らかなように、この実施の形態５によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
更に、この実施の形態５によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態５によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態５によれば、符号化データの欠落時間が短く異常音が早く収束するような場合と、異常音が発生しないようなレベルの低い音声信号を出力する場合には、より早く通常の復号した音声信号を出力出来るという効果を奏する。

実施の形態７．
以上説明した実施の形態は何れも音声復号部９で復号後の信号を補間信号生成部５０で補間信号を生成し、出力音声信号として出力するものであるが、図１１に示すように音声信号復号部９の前段に、補間信号生成部５０、検出状態制御部２、信号選択部３を備え、音声信号復号部９が入力する信号を受信符号化データの欠落が補間された信号にしても、受信符号化データの欠落状態から復旧した直後において異常音を出力しないという同様の効果を奏することは明らかである。
なお、補間信号から受信音声信号に復旧する場合は、実施の形態１と同様に検出状態制御部２からの信号により補間信号生成部５０は出力を継続し、信号選択部３は検出状態制御部２からの信号によって所定期間補間信号生成部５０の出力を音声信号復号部９に入力させる。

また、補間信号生成部５０における欠落信号の補間方法は、例えば特許文献１（特開平５−２０７０６４号公報）に示されたような方式を用いることによっても可能である。
さらに、実施の形態２〜６においても、この実施の形態と同様に音声信号復号部９に入力する信号を受信符号化データの欠落が補間され、かつ各実施の形態に記載されたような作用を行う信号にするよう構成することもできる。

この発明は、音声パケット通信装置に適用されることで、通信装置から不快な異常音が出力されることがないのでユーザは違和感なく操作が行える。

この発明の実施の形態１による音声復号装置を示す構成図である。実施の形態１における音声復号装置の動作の説明図である。 ITU-T勧告G.711 Appendix I記述の補間信号生成方法の説明図である。この発明の実施の形態２による音声復号装置を示す構成図である。実施の形態２における音声復号装置の動作の説明図である。この発明の実施の形態３による音声復号装置を示す構成図である。実施の形態３における音声復号装置の動作の説明図である。この発明の実施の形態４による音声復号装置を示す構成図である。この発明の実施の形態５による音声復号装置を示す構成図である。この発明の実施の形態６による音声復号装置を示す構成図である。この発明の実施の形態７による音声復号装置を示す構成図である。

符号の説明

１：パケット分解部、２：検出状態制御部、３：信号選択部、４：信号レベル算出部、９：音声復号部、５１：パケット損失検出部、５０：補間信号生成部、３１、３２：乗算部、３３：乗算係数、３４：加算部、３３：乗算係数算出部、８１、８２：データ遅延部。

Claims

符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、符号化データの欠落部分に応じて補間音声信号を生成する補間信号生成手段と、上記復号手段の出力信号と上記補間信号生成手段の出力信号とを切り替える信号選択手段と、上記検出手段の検出信号に応じて上記信号選択手段を制御する制御手段を備え、制御手段は上記補間信号生成手段の出力信号が出力される期間を符号化データの欠落状態から正常状態に復旧した後の所定時間延長するように上記信号選択手段を動作させることを特徴とする音声復号装置。
符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、符号化データの欠落部分に応じて補間データを生成する補間信号生成手段と、上記符号化データと上記補間信号生成手段の補間データとを切り替え、上記復号手段に入力させる信号選択手段と、上記検出手段の検出信号に応じて上記信号選択手段を制御する制御手段を備え、制御手段は上記補間信号生成手段の補間データが出力される期間を符号化データの欠落状態から正常状態に復旧した後の所定時間延長するように上記信号選択手段を動作させることを特徴とする音声復号装置。
上記信号選択手段は、補間信号生成手段の出力信号から復号手段の出力信号、または符号化データへの切り替えを、補間信号生成手段の出力信号と復号手段の出力信号、または符号化データに比率を乗算して、両出力を加算し、且つ、復号手段の出力信号、または符号化データの比率を徐々に高めて出力するよう動作する構成にされたことを特徴とする請求項１または２記載の音声復号装置。
符号化データを遅延させて復号手段に入力させる遅延手段を備え、上記信号選択手段は、復号手段の出力信号または符号化データから補間信号生成手段の出力信号への切り替えを、補間信号生成手段の出力信号と復号手段の出力信号、または符号化データに比率を乗算して、両出力を加算し、且つ、復号手段の出力信号または符号化データの比率を上記遅延手段の遅延時間内で徐々に小さくして補間信号生成手段の出力信号への切り替える構成にされたことを特徴とする請求項１または２記載の音声復号装置。
上記制御手段は、符号化データの欠落状態から正常状態に復旧した後に補間信号生成手段の出力信号が出力される延長時間を、符号化データを復号した音声信号のレベルに応じて変更することを特徴とする請求項１または２記載の音声復号装置。
上記制御手段は、符号化データの欠落状態から正常状態に復旧した後に補間信号生成手段の出力信号が出力される延長時間を、符号化データの欠落時間長に応じて変更することを特徴とする請求項１または２記載の音声復号装置。
上記制御手段は、符号化データの欠落状態から正常状態に復旧した後に補間信号生成手段の出力信号が出力される延長時間を、符号化データの欠落時間長と符号化データを復号した音声信号のレベルとに応じて変更することを特徴とする請求項１または２記載の音声復号装置。