JP2005274917A - 音声復号装置 - Google Patents
音声復号装置 Download PDFInfo
- Publication number
- JP2005274917A JP2005274917A JP2004087478A JP2004087478A JP2005274917A JP 2005274917 A JP2005274917 A JP 2005274917A JP 2004087478 A JP2004087478 A JP 2004087478A JP 2004087478 A JP2004087478 A JP 2004087478A JP 2005274917 A JP2005274917 A JP 2005274917A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- encoded data
- unit
- interpolation
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】ADPCM符号化による伝送装置では、符号化データ欠落時、その欠落データを補間データにより補償するが、データ欠落から音声データへの復旧後しばらくの間は、正常な音声信号が出力されず、場合によっては不快な異常音を出力する。
【解決手段】符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、検出手段からの出力で符号化データの欠落部分に応じて補間信号を生成する補間信号生成手段と、上記補間信号を欠落部分に挿入する切り替え手段と、上記切り替え手段を制御して、補間信号の挿入を欠落部分より所定時間長くする制御手段とを備えることで受信符号化データの欠落状態から復旧した直後においても異常音を出力しない。
【選択図】図1
【解決手段】符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、検出手段からの出力で符号化データの欠落部分に応じて補間信号を生成する補間信号生成手段と、上記補間信号を欠落部分に挿入する切り替え手段と、上記切り替え手段を制御して、補間信号の挿入を欠落部分より所定時間長くする制御手段とを備えることで受信符号化データの欠落状態から復旧した直後においても異常音を出力しない。
【選択図】図1
Description
この発明は、符号化された音声信号等を復号する音声復号器に関するものである。
近年のIP(Internet Protocol)通信の発展により、電話音声信号やファクシミリ信号をIPパケット化して伝送するVoIP(Voice over IP)技術に代表される、音声パケット通信技術が注目されている。パケット網においては網の輻輳などが原因でパケット損失が生じることがあり、このため、受信側において音声信号の一部が欠落することになる。この問題を解決するために、従来、欠落した音声データを補間する方式が提案されている。
具体的には下記の通りである。
パケットロス検出部は、パケットロスが発生しているか否かを判断し、パケットロスが発生している場合に出力レジスタに対して検出信号を与える。また、入力された受信符号化データをそのままパケットロス補間部に与える。パケットロス補間部は、パケットロスが生じていない場合には、入力された受信符号化データをそのままADPCM復号部及びコードレジスタに与える。他方、パケットロスが生じている場合には、パケットロス補間部は、コードレジスタから与えられた補間用符号化データ列をパケットロス期間に挿入してADPCM復号部及びコードレジスタに与える。
パケットロス検出部は、パケットロスが発生しているか否かを判断し、パケットロスが発生している場合に出力レジスタに対して検出信号を与える。また、入力された受信符号化データをそのままパケットロス補間部に与える。パケットロス補間部は、パケットロスが生じていない場合には、入力された受信符号化データをそのままADPCM復号部及びコードレジスタに与える。他方、パケットロスが生じている場合には、パケットロス補間部は、コードレジスタから与えられた補間用符号化データ列をパケットロス期間に挿入してADPCM復号部及びコードレジスタに与える。
コードレジスタは、パケットロス補間部から出力されたロス部分のない符号化データ列を格納する。格納する符号化データ量は、少なくとも後述するテンプレート期間及びサーチウィンドウ期間の合成期間に相当する符号化データ量(サンプル数)である。また、コードレジスタは、パターンマッチング回路から与えられた期間情報が指示する期間の符号化データ列をパケットロス補間部に与えるものである。ADPCM復号部は、ステップサイズ適応制御部、逆量子化器、加算器及び予測器から構成されており、パケットロス補間部から与えられた符号化データ列に対して復号処理して音声信号(デジタル信号)を得てデジタル/アナログ変換回路及び出力レジスタに出力する。
出力レジスタは、ADPCM復号部から出力された音声信号を格納するものである。格納する音声信号量(サンプル数)は、少なくとも後述するテンプレート期間及びサーチウィンドウ期間の合成期間に相当する量である。出力レジスタは、パケットロス検出部からパケットロスの検出信号が与えられると、格納しているテンプレート期間の音声信号列及びサーチウィンドウ期間の音声信号列をパターンマッチング回路に与えるものである。パターンマッチング回路は、テンプレート期間の音声信号列との相関が最も高い(テンプレート期間の音声信号列に最も類似している)サーチウィンドウ期間内の期間をパターンマッチング処理によって確定し、補間させる符号化データ列の期間を決定してその期間情報をコードレジスタに与えるものである(特許文献1を参照)。
従来の音声復号装置は以上のように構成されており、符号化データの欠落部分に代り、過去の受信符号化データを復号部に与えることで音声信号の補間を実現している。ところで、ADPCM符号化の原理は、予測器が過去の再生信号を基に次の信号を予測し、予測した信号と新たな入力信号との差分のみを符号化データとして伝送することによって伝送データの情報量を圧縮するというものである。従って、ADPCM符号化データを出力する側の装置に存在する符号化部にも、復号部と同様な予測器が存在し、上述の原理に基づいた情報圧縮が正常に機能するためには、符号化部と復号部の予測器が全く同じ予測信号を出力する必要がある。
ところで、パケットロスが発生して符号化データが欠落した場合に、欠落した符号化データの代りに復号部に与えられる補間データは、符号化部が出力する符号化データとは異なる。従って、復号部における予測器と符号化部における予測器とは異なった状態になる。そして、符号化データの欠落から復旧し、正常な符号化データが復号部に与えられ始めても、符号化部と復号部との予測器の状態がすぐには一致せず、しばらくの時間は異なった状態が継続し、やがて同じ状態へと収束する。従って、受信符号化データの欠落から復旧した直後からしばらくの間は、予測器の状態不一致が原因となって復号部から正常な音声信号が出力されず、場合によっては信号レベルが異常に大きくなるなど、不快な異常音を出力してしまうという課題があった。
この発明は上記のような課題を解決するためになされたもので、受信符号化データの欠落が発生し、これが復旧した直後においても、異常音が出力されることのない音声復号装置を得ることを目的とする。
この発明に係る音声復号装置は、符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、検出手段からの出力で符号化データの欠落部分に応じて補間信号を生成する補間信号生成手段と、上記補間信号を欠落部分に挿入する信号選択手段と、上記信号選択手段を制御して、補間信号の挿入を欠落部分より所定時間長くする制御手段を備えたものである。
この発明によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、補間信号生成手段は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、復号装置は復旧後の信号を出力するのではなく,補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
以下、この発明の実施の形態を説明する。
実施の形態1.
図1はこの発明の実施の形態1による音声復号装置を示す構成図である。図において、パケット分解部1は受信パケットを分解し受信符号化データを抜き出して出力する。音声復号部9は、パケット分解部1より入力した受信符号化データを復号し、音声信号を出力する。パケット損失検出部51は、受信パケットを監視して受信符号化データの欠落を検出し、検出信号を出力する。検出状態制御部2は、パケット損失検出部51からの検出信号を入力し、補間信号生成部50と信号選択部3を制御する制御信号を出力する。補間信号生成部50は、検出状態制御部2からの制御信号に基づいて、補間信号を出力すべき時間を認識し、音声復号部9より入力する音声信号を基に補間信号を生成する。信号選択部3は、検出状態制御部2から入力する制御信号に基づいて、音声復号部9からの入力信号と補間信号生成部50からの入力信号との切替を行う。
実施の形態1.
図1はこの発明の実施の形態1による音声復号装置を示す構成図である。図において、パケット分解部1は受信パケットを分解し受信符号化データを抜き出して出力する。音声復号部9は、パケット分解部1より入力した受信符号化データを復号し、音声信号を出力する。パケット損失検出部51は、受信パケットを監視して受信符号化データの欠落を検出し、検出信号を出力する。検出状態制御部2は、パケット損失検出部51からの検出信号を入力し、補間信号生成部50と信号選択部3を制御する制御信号を出力する。補間信号生成部50は、検出状態制御部2からの制御信号に基づいて、補間信号を出力すべき時間を認識し、音声復号部9より入力する音声信号を基に補間信号を生成する。信号選択部3は、検出状態制御部2から入力する制御信号に基づいて、音声復号部9からの入力信号と補間信号生成部50からの入力信号との切替を行う。
以下、図2を用いてパケット損失が発生した場合の動作を説明する。この図は、上から順に、パケット損失検出部51、検出状態制御部2、音声復号部9、補間信号生成部50、及び、信号選択部3の出力信号を示したものである。図において、符号化データは10ms単位でパケット化されるものとしており、音声復号部9、補間信号生成部50、信号選択部3の出力信号に付与されたN、N+1、…、N+4は、1パケット分、すなわち10ms分を1ブロックとして、以下の説明用に番号付けをしたものである。
受信パケットの欠落が検出されると、パケット損失検出部51からの符号化データ欠落検出信号が「検出」状態となる。音声復号部9は、この符号化データ欠落検出信号が「検出」状態の間、復号動作を停止して音声信号を出力しない。そして、検出状態制御部2は、パケット損失検出部51からの符号化データ欠落検出信号が「検出」の状態、及び、パケット損失検出部51からの符号化データ欠落検出信号が「検出」から「非検出」の状態に遷移してから所定時間(図においては10ms)、制御信号を補間信号側とし、それ以外の時間は制御信号を復号部側とする。補間信号生成部50は、検出状態制御部2から入力する制御信号が補間信号側になっている間、補間信号を出力する。信号選択部3は、検出状態制御部2から入力する制御信号が復号部側になっている間に音声復号部9からの入力信号を選択し、検出状態制御部2から入力する制御信号が補間信号側になっている間には補間信号生成部50からの入力信号を選択して出力する。
上述のように、符号化側と復号化側の予測器の状態不一致によって音声復号部9が出力する音声信号が異常音となり得るのは、受信符号化データ欠落状態から復旧した直後からしばらくの間であり、図2において、音声復号部がN+3番目の音声信号を出力している時間である。図2を見れば分る通り、音声復号部9がN+3番目の音声信号を出力している間も補間信号生成部50が並行動作して補間信号が生成され、信号選択部3は補間信号を選択するようになっているため、異常音は出力されなくなることが分る。
なお、補間信号生成部50による補間信号生成方法については、例えばITU-T勧告G.711 Appendix Iに記述される方法を使用することが可能である。図3にその原理を示す。まず、この方法では、補間信号生成部50は、過去に音声復号部9が出力した音声信号を一定時間分保持しておく。そして音声信号が欠落した場合、まず、欠落する直前の音声信号の自己相関を演算し、音声信号の繰り返し周期を求める。そして、音声信号の欠落が開始した点から繰り返し周期分のサンプルを遡って抜き出し、これを繰り返して出力することによって補間信号を生成する。なお、図3には最終的な出力信号、すなわち信号選択部3の出力波形を併せて示している。
以上で明らかなように、この実施の形態1によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、補間信号生成部50は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
実施の形態2.
図4はこの発明の実施の形態2による音声復号装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示す。
乗算部31、32、乗算係数算出部33及び加算部34は、信号選択部3の内部構成要素である。乗算係数算出部33は、検出状態制御部2から入力する検出信号に応じて、音声復号部9の出力信号に対する乗算係数αと、補間信号生成部50の出力信号に対する乗算係数βを算出する。乗算部31は補間信号生成部50の出力信号に対して乗算係数βを乗算し、乗算結果を出力する。乗算部32は音声復号部9の出力信号に対して乗算係数αを乗算し、乗算結果を出力する。加算部34は、乗算部31の出力信号と乗算部32の出力信号を加算して出力する。
図4はこの発明の実施の形態2による音声復号装置を示す構成図であり、図において、図1と同一符号は同一または相当部分を示す。
乗算部31、32、乗算係数算出部33及び加算部34は、信号選択部3の内部構成要素である。乗算係数算出部33は、検出状態制御部2から入力する検出信号に応じて、音声復号部9の出力信号に対する乗算係数αと、補間信号生成部50の出力信号に対する乗算係数βを算出する。乗算部31は補間信号生成部50の出力信号に対して乗算係数βを乗算し、乗算結果を出力する。乗算部32は音声復号部9の出力信号に対して乗算係数αを乗算し、乗算結果を出力する。加算部34は、乗算部31の出力信号と乗算部32の出力信号を加算して出力する。
次に、図5を用いて、音声復号装置の動作を説明する。図5は、上から順に、パケット損失検出部51の出力信号、検出状態制御部2の出力信号、音声復号部9の出力信号、補間信号生成部50の出力信号、乗算係数α、乗算係数β、及び、信号選択部3の出力信号を示したものである。
受信パケットの欠落が検出されると、パケット損失検出部51からの符号化データ欠落検出信号が「検出」状態となる。音声復号部9は、この符号化データ欠落検出信号が「検出」状態の間、復号動作を停止して音声信号を出力しない。そして、検出状態制御部2は、パケット損失検出部51からの符号化データ欠落検出信号が「検出」の状態、及び、パケット損失検出部51からの符号化データ欠落検出信号が「検出」から「非検出」の状態に遷移してから所定時間(図においては10ms)、出力制御信号を補間信号側とし、それから更に所定時間(図においては10ms)は出力制御信号を過渡状態側とし、それ以外の時間は出力制御信号を復号部側とする。補間信号生成部50は、検出状態制御部2から入力する制御信号が復号部側以外になっている間、補間信号を出力する。
信号選択部3における乗算係数算出部33は、検出状態制御部2から入力する制御信号によって、乗算係数α、βを次のように算出する。まず、検出状態制御部2から入力する制御信号が復号部側であるときα=1、β=0とし、補間信号側であるときはα=0、β=1とする。そして、検出状態制御部2から入力する制御信号が過渡状態の場合、αを徐々に増大させ、βを徐々に減少させ、10msの間にαが0から1に、βが1から0に変化するようにする。10ms間の音声信号のサンプル数は80サンプルであるので、1サンプル毎にα=α+0.0125、β=β−0.0125という演算をすることとなる。乗算部31は、補間信号生成部50の出力信号にβを乗算して加算部34に出力し、乗算部32は、音声復号部9の出力信号にαを乗算して加算部34に出力し、加算部34はこれらを加算して出力する。
この結果、検出状態制御部の出力が復号部側にあるとき、α=1、β=0であるので、加算部34の出力は音声復号部9の出力信号と同一となり、検出状態制御部の出力が補間信号側にあるとき、α=0、β=1であるので、加算部34の出力は補間信号生成部50の出力信号と同一となる。検出状態制御部の出力が過渡状態にあるときは、αが徐々に増大しβが徐々に減少するので、加算部34の出力は、10msの間に補間信号生成部50の出力信号から音声復号部9の出力信号へと徐々に切り替わることになる。
このような切り替えをするメリットは、以下の通りである。補間信号の生成方法は図3に示した通りであるが、ここで、音声信号の周期性がサンプル周期の整数倍でないと、音声復号部9の出力信号と補間信号生成部50の出力信号とを切り替えた点において出力波形が不連続となり、クリック音が聞こえることになる。これは、特に、補間信号から復号された音声信号に切り替える点で顕著に発生し易い。何故なら、補間信号は算出した周期分の信号を抜き出してこれを繰返し挿入することによって生成されるので、時間が経過するほど実周期と算出周期との誤差が蓄積されるためである。従って、上述のように補間信号から復号された音声信号へ徐々に切り替えるようにすると、このクリック音の発生を防止することが可能となる。
以上で明らかなように、この実施の形態2によれば、受信符号化データが欠落した後に、欠落状態から復旧した場合、補間信号生成部50は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにし、さらに補間信号から復号された音声信号に切り替える際は補間信号を徐々に減少し、音声信号を徐々に増大することにより、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果に加え、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果をも奏する。
実施の形態3.
図6はこの発明の実施の形態3による音声復号装置を示す構成図であり、この実施の形態3は、補間信号から復号された音声信号への切り替えが漸次に行われるだけでなく、補間を開始する際にも漸次復号された音声信号から補間信号に切り替えるようにするものである。
図において、図4と同一符号は同一または相当部分を示す。データ遅延部81、82、検出状態制御部2、及び、乗算係数算出部33以外の動作は、図4に示した音声復号装置と同様である。データ遅延部81は符号化データを一定時間δだけ遅延させ、データ遅延部82はパケット損失検出部51が出力する検出信号をデータ遅延部81と同じ時間δ遅延させる。
図6はこの発明の実施の形態3による音声復号装置を示す構成図であり、この実施の形態3は、補間信号から復号された音声信号への切り替えが漸次に行われるだけでなく、補間を開始する際にも漸次復号された音声信号から補間信号に切り替えるようにするものである。
図において、図4と同一符号は同一または相当部分を示す。データ遅延部81、82、検出状態制御部2、及び、乗算係数算出部33以外の動作は、図4に示した音声復号装置と同様である。データ遅延部81は符号化データを一定時間δだけ遅延させ、データ遅延部82はパケット損失検出部51が出力する検出信号をデータ遅延部81と同じ時間δ遅延させる。
検出状態制御部2と乗算係数算出部33の動作については、図7を用いて説明する。検出状態制御部2は、パケット損失検出部51からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δだけ、即ちデータ遅延部81の遅延時間δだけ出力信号を過渡状態1とする。その後、パケット損失検出部51からの検出信号が「検出」となっている時間長に所定時間(図においては10ms)を加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間(図においては10ms)出力信号を過渡状態2とし、最終的に出力信号を復号部側に戻す。
乗算係数算出部33は、検出状態制御部2から入力する制御信号によって、乗算係数α、βを次のように算出する。まず、検出状態制御部2から入力する制御信号が復号部側であるときα=1、β=0とし、補間信号側であるときはα=0、β=1とする。そして、検出状態制御部2から入力する制御信号が過渡状態2の場合、αを徐々に増大させ、βを徐々に減少させ、10msの間にαが0から1に、βが1から0に変化するようにする。10ms間の音声信号のサンプル数は80サンプルであるので、1サンプル毎にα=α+0.0125、β=β−0.0125という演算をすることとなる。逆に、検出状態制御部2から入力する制御信号が過渡状態1の場合、αを徐々に減少させ、βを徐々に増大させる。具体的には一定時間δの間にαが0から1に、βが1から0に変化するようにする。この間の音声信号のサンプル数がxサンプルであるとすると、1サンプル毎にα=α+1/x、β=β−1/xという演算をすることとなる。
以上で明らかなように、この実施の形態3によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、補間信号生成部50は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
また、この実施の形態3によれば、補間信号から復号された音声信号に切り替わる際は補間信号を徐々に減少し、音声信号を徐々に増大することにより、切り替わり時に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態3によれば、音声復号部への受信符号化データの入力をδ遅延させ、受信符号化データの欠落時に復号された音声信号から補間信号に切り替わる際、この遅延時間δの間、復号された音声信号を徐々に減少し、補間信号を徐々に増加させるので、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果も奏する。
また、この実施の形態3によれば、補間信号から復号された音声信号に切り替わる際は補間信号を徐々に減少し、音声信号を徐々に増大することにより、切り替わり時に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態3によれば、音声復号部への受信符号化データの入力をδ遅延させ、受信符号化データの欠落時に復号された音声信号から補間信号に切り替わる際、この遅延時間δの間、復号された音声信号を徐々に減少し、補間信号を徐々に増加させるので、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果も奏する。
実施の形態4.
図8はこの発明の実施の形態4による音声復号装置を示す構成図であり、図において、図6と同一符号は同一または相当部分を示す。
信号レベル算出部4と検出状態制御部2以外については、図6に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。信号レベル算出部4は、データ遅延部82から出力されるパケット損失検出信号が検出状態以外のとき、信号選択部3が出力する音声信号のレベルを算出し、算出結果を検出状態制御部2に出力する。データ遅延部82から出力されるパケット損失検出信号が検出状態のときは、上記算出を停止し、直前の算出結果を保持して検出状態制御部2に出力する。
図8はこの発明の実施の形態4による音声復号装置を示す構成図であり、図において、図6と同一符号は同一または相当部分を示す。
信号レベル算出部4と検出状態制御部2以外については、図6に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。信号レベル算出部4は、データ遅延部82から出力されるパケット損失検出信号が検出状態以外のとき、信号選択部3が出力する音声信号のレベルを算出し、算出結果を検出状態制御部2に出力する。データ遅延部82から出力されるパケット損失検出信号が検出状態のときは、上記算出を停止し、直前の算出結果を保持して検出状態制御部2に出力する。
検出状態制御部2は、パケット損失検出部51からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δだけ出力信号を過渡状態1とする。その後、パケット損失検出部51からの検出信号が「検出」となっている時間長に時間tを加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間(図においては10ms)出力信号を過渡状態2とし、最終的に出力信号を復号部側に戻す。上記時間tの求め方は、信号レベル算出部4から入力される算出結果が大きい場合に長く、小さい場合に短くなるように決定する。
以上のような音声復号装置の動作が、図6に示した音声復号装置の動作と異なる点は、補間を延長する時間tが可変であるかどうかの違いである。図8に示す音声復号装置は、補間を開始する直前の信号レベルが小さい場合には補間の延長時間を短く、信号レベルが大きい場合には補間の延長時間を長くする。信号レベルが低い場合には符号化データ欠落後に復旧した直後に音声復号部9から出力される異常音のレベルも低くなるか、もしくは異常音が発生しないものと考えられる。異常音が発生しないのであれば、信号レベルが低い場合には早いタイミングで補間信号から音声復号部9の出力信号に切り替えた方が望ましいと言える。
以上で明らかなように、この実施の形態4によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、補間信号生成部50は音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
また、この実施の形態4によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態4によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更にまた、この実施の形態4によれば、異常音が発生しないようなレベルの低い音声信号を出力する際には、より早く通常の復号した音声信号を出力出来るという効果を奏する。
また、この実施の形態4によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態4によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更にまた、この実施の形態4によれば、異常音が発生しないようなレベルの低い音声信号を出力する際には、より早く通常の復号した音声信号を出力出来るという効果を奏する。
実施の形態5.
図9はこの発明の実施の形態5による音声復号装置を示す構成図であり、図において、図6と同一符号は同一または相当部分を示す。
損失時間算出部7と検出状態制御部2以外については、図6に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。損失時間算出部7は、パケット損失検出部51から出力されるパケット損失検出信号が検出状態にある時間を算出し、算出結果を検出状態制御部2に出力する。ここで、パケット損失検出信号が非検出状態にある場合は、その前の算出結果を維持して検出状態制御部2に出力する。
図9はこの発明の実施の形態5による音声復号装置を示す構成図であり、図において、図6と同一符号は同一または相当部分を示す。
損失時間算出部7と検出状態制御部2以外については、図6に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。損失時間算出部7は、パケット損失検出部51から出力されるパケット損失検出信号が検出状態にある時間を算出し、算出結果を検出状態制御部2に出力する。ここで、パケット損失検出信号が非検出状態にある場合は、その前の算出結果を維持して検出状態制御部2に出力する。
検出状態制御部2は、パケット損失検出部51からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δだけ出力信号を過渡状態1とする。その後、パケット損失検出部51からの検出信号が「検出」となっている時間長に時間tを加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間(図においては10ms)出力信号を過渡状態2とし、最終的に出力信号を復号部側に戻す。上記時間tの求め方は、損失時間算出部7から入力される算出結果が大きい場合に長く、小さい場合に短くなるように決定する。
以上のような音声復号装置の動作が、図6に示した音声復号装置の動作と異なる点は、補間を延長する時間であるtが可変であるかどうかの違いである。図8に示す音声復号装置は、符号化データの欠落時間長が短い場合には補間を延長する時間を短く、符号化データの欠落時間長が長い場合には補間を延長する時間を長くする。一般に、符号化データの欠落時間長が短い場合には、符号化部と復号部との予測器の誤差が小さいため、符号化データ欠落後に復旧した直後に音声復号部9から出力される異常音が早く収束するか、もしくは異常音が発生しないものと考えられる。異常音が発生しないのであれば、符号化データの欠落時間長が短い場合には早いタイミングで補間信号から音声復号部9の出力信号に切り替えた方が望ましいと言える。
以上で明らかなように、この実施の形態5によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
また、この実施の形態5によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態5によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更にまた、この実施の形態5によれば、符号化データの欠落時間が短く異常音が早く収束するような場合、より早く通常の復号した音声信号を出力出来るという効果を奏する。
また、この実施の形態5によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態5によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更にまた、この実施の形態5によれば、符号化データの欠落時間が短く異常音が早く収束するような場合、より早く通常の復号した音声信号を出力出来るという効果を奏する。
実施の形態6.
図10はこの発明の実施の形態6による音声復号装置を示す構成図であり、図において、図8及び図9と同一符号は同一または相当部分を示す。
検出状態制御部2以外については、図8及び図9に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。検出状態制御部2は、パケット損失検出部51からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δ、即ちデータ遅延部81、82の遅延時間δだけ出力信号を過渡状態1とする。その後、パケット損失検出部51からの検出信号が「検出」となっている時間長に時間tを加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間(図においては10ms)出力信号を過渡状態2とし、最終的に出力信号を復号部側に戻す。上記時間tの求め方については、信号レベル算出部4から入力される算出結果が大きい場合に長く、小さい場合に短くなるように、また、損失時間算出部7から入力される算出結果が大きい場合に長く、小さい場合に短くなるように決定する。
図10はこの発明の実施の形態6による音声復号装置を示す構成図であり、図において、図8及び図9と同一符号は同一または相当部分を示す。
検出状態制御部2以外については、図8及び図9に示した音声復号装置の相当部分と全く同様な動作を行うため説明を省略する。検出状態制御部2は、パケット損失検出部51からの検出信号が「非検出」から「検出」状態に遷移すると、それから一定時間δ、即ちデータ遅延部81、82の遅延時間δだけ出力信号を過渡状態1とする。その後、パケット損失検出部51からの検出信号が「検出」となっている時間長に時間tを加えた時間長だけ、出力信号を補間信号側とする。更に、所定時間(図においては10ms)出力信号を過渡状態2とし、最終的に出力信号を復号部側に戻す。上記時間tの求め方については、信号レベル算出部4から入力される算出結果が大きい場合に長く、小さい場合に短くなるように、また、損失時間算出部7から入力される算出結果が大きい場合に長く、小さい場合に短くなるように決定する。
以上のような音声復号装置の動作が、図8に示した音声復号装置の動作と異なる点は、補間を延長する時間であるtの求め方の違いである。
図10に示す音声復号装置は、検出状態制御部2により補間を開始する直前の信号レベルが小さい場合には補間の延長時間を短く、信号レベルが大きい場合には補間の延長時間を長くする。更に、符号化データの欠落時間長が短い場合には補間を延長する時間を短く、符号化データの欠落時間長が長い場合には補間を延長する時間を長くする。信号レベルが低い場合には符号化データ欠落後に復旧した直後に音声復号部9から出力される異常音のレベルも低くなるか、もしくは異常音が発生しないものと考えられる。一般に、符号化データの欠落時間長が短い場合には、符号化部と復号部との予測器の誤差が小さいため、符号化データ欠落後に復旧した直後に音声復号部9から出力される異常音が早く収束するか、もしくは異常音が発生しないものと考えられる。このようなことから、異常音が発生しないのであれば、信号レベルが低い場合と符号化データの欠落時間長が短い場合には、早いタイミングで補間信号から音声復号部9の出力信号に切り替えた方が望ましいと言える。
図10に示す音声復号装置は、検出状態制御部2により補間を開始する直前の信号レベルが小さい場合には補間の延長時間を短く、信号レベルが大きい場合には補間の延長時間を長くする。更に、符号化データの欠落時間長が短い場合には補間を延長する時間を短く、符号化データの欠落時間長が長い場合には補間を延長する時間を長くする。信号レベルが低い場合には符号化データ欠落後に復旧した直後に音声復号部9から出力される異常音のレベルも低くなるか、もしくは異常音が発生しないものと考えられる。一般に、符号化データの欠落時間長が短い場合には、符号化部と復号部との予測器の誤差が小さいため、符号化データ欠落後に復旧した直後に音声復号部9から出力される異常音が早く収束するか、もしくは異常音が発生しないものと考えられる。このようなことから、異常音が発生しないのであれば、信号レベルが低い場合と符号化データの欠落時間長が短い場合には、早いタイミングで補間信号から音声復号部9の出力信号に切り替えた方が望ましいと言える。
以上で明らかなように、この実施の形態5によれば、受信符号化データが欠落した後、欠落状態から復旧した場合、音声復号部の動作と並行して所定時間は補間信号の生成を継続し、補間信号を出力するようにしたので、受信符号化データの欠落状態から復旧した直後においても異常音を出力しないという効果を奏する。
更に、この実施の形態5によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態5によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態5によれば、符号化データの欠落時間が短く異常音が早く収束するような場合と、異常音が発生しないようなレベルの低い音声信号を出力する場合には、より早く通常の復号した音声信号を出力出来るという効果を奏する。
更に、この実施の形態5によれば、補間信号から復号された音声信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態5によれば、復号された音声信号から補間信号に切り替わる際に生じる可能性のあるクリック音の出力を防止できるという効果を奏する。
更に、この実施の形態5によれば、符号化データの欠落時間が短く異常音が早く収束するような場合と、異常音が発生しないようなレベルの低い音声信号を出力する場合には、より早く通常の復号した音声信号を出力出来るという効果を奏する。
実施の形態7.
以上説明した実施の形態は何れも音声復号部9で復号後の信号を補間信号生成部50で補間信号を生成し、出力音声信号として出力するものであるが、図11に示すように音声信号復号部9の前段に、補間信号生成部50、検出状態制御部2、信号選択部3を備え、音声信号復号部9が入力する信号を受信符号化データの欠落が補間された信号にしても、受信符号化データの欠落状態から復旧した直後において異常音を出力しないという同様の効果を奏することは明らかである。
なお、補間信号から受信音声信号に復旧する場合は、実施の形態1と同様に検出状態制御部2からの信号により補間信号生成部50は出力を継続し、信号選択部3は検出状態制御部2からの信号によって所定期間補間信号生成部50の出力を音声信号復号部9に入力させる。
以上説明した実施の形態は何れも音声復号部9で復号後の信号を補間信号生成部50で補間信号を生成し、出力音声信号として出力するものであるが、図11に示すように音声信号復号部9の前段に、補間信号生成部50、検出状態制御部2、信号選択部3を備え、音声信号復号部9が入力する信号を受信符号化データの欠落が補間された信号にしても、受信符号化データの欠落状態から復旧した直後において異常音を出力しないという同様の効果を奏することは明らかである。
なお、補間信号から受信音声信号に復旧する場合は、実施の形態1と同様に検出状態制御部2からの信号により補間信号生成部50は出力を継続し、信号選択部3は検出状態制御部2からの信号によって所定期間補間信号生成部50の出力を音声信号復号部9に入力させる。
また、補間信号生成部50における欠落信号の補間方法は、例えば特許文献1(特開平5−207064号公報)に示されたような方式を用いることによっても可能である。
さらに、実施の形態2〜6においても、この実施の形態と同様に音声信号復号部9に入力する信号を受信符号化データの欠落が補間され、かつ各実施の形態に記載されたような作用を行う信号にするよう構成することもできる。
さらに、実施の形態2〜6においても、この実施の形態と同様に音声信号復号部9に入力する信号を受信符号化データの欠落が補間され、かつ各実施の形態に記載されたような作用を行う信号にするよう構成することもできる。
この発明は、音声パケット通信装置に適用されることで、通信装置から不快な異常音が出力されることがないのでユーザは違和感なく操作が行える。
1:パケット分解部、2:検出状態制御部、3:信号選択部、4:信号レベル算出部、9:音声復号部、51:パケット損失検出部、50:補間信号生成部、31、32:乗算部、33:乗算係数、34:加算部、33:乗算係数算出部、81、82:データ遅延部。
Claims (7)
- 符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、符号化データの欠落部分に応じて補間音声信号を生成する補間信号生成手段と、上記復号手段の出力信号と上記補間信号生成手段の出力信号とを切り替える信号選択手段と、上記検出手段の検出信号に応じて上記信号選択手段を制御する制御手段を備え、制御手段は上記補間信号生成手段の出力信号が出力される期間を符号化データの欠落状態から正常状態に復旧した後の所定時間延長するように上記信号選択手段を動作させることを特徴とする音声復号装置。
- 符号化データを復号する復号手段と、符号化データが欠落したことを検出する検出手段と、符号化データの欠落部分に応じて補間データを生成する補間信号生成手段と、上記符号化データと上記補間信号生成手段の補間データとを切り替え、上記復号手段に入力させる信号選択手段と、上記検出手段の検出信号に応じて上記信号選択手段を制御する制御手段を備え、制御手段は上記補間信号生成手段の補間データが出力される期間を符号化データの欠落状態から正常状態に復旧した後の所定時間延長するように上記信号選択手段を動作させることを特徴とする音声復号装置。
- 上記信号選択手段は、補間信号生成手段の出力信号から復号手段の出力信号、または符号化データへの切り替えを、補間信号生成手段の出力信号と復号手段の出力信号、または符号化データに比率を乗算して、両出力を加算し、且つ、復号手段の出力信号、または符号化データの比率を徐々に高めて出力するよう動作する構成にされたことを特徴とする請求項1または2記載の音声復号装置。
- 符号化データを遅延させて復号手段に入力させる遅延手段を備え、上記信号選択手段は、復号手段の出力信号または符号化データから補間信号生成手段の出力信号への切り替えを、補間信号生成手段の出力信号と復号手段の出力信号、または符号化データに比率を乗算して、両出力を加算し、且つ、復号手段の出力信号または符号化データの比率を上記遅延手段の遅延時間内で徐々に小さくして補間信号生成手段の出力信号への切り替える構成にされたことを特徴とする請求項1または2記載の音声復号装置。
- 上記制御手段は、符号化データの欠落状態から正常状態に復旧した後に補間信号生成手段の出力信号が出力される延長時間を、符号化データを復号した音声信号のレベルに応じて変更することを特徴とする請求項1または2記載の音声復号装置。
- 上記制御手段は、符号化データの欠落状態から正常状態に復旧した後に補間信号生成手段の出力信号が出力される延長時間を、符号化データの欠落時間長に応じて変更することを特徴とする請求項1または2記載の音声復号装置。
- 上記制御手段は、符号化データの欠落状態から正常状態に復旧した後に補間信号生成手段の出力信号が出力される延長時間を、符号化データの欠落時間長と符号化データを復号した音声信号のレベルとに応じて変更することを特徴とする請求項1または2記載の音声復号装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004087478A JP2005274917A (ja) | 2004-03-24 | 2004-03-24 | 音声復号装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004087478A JP2005274917A (ja) | 2004-03-24 | 2004-03-24 | 音声復号装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005274917A true JP2005274917A (ja) | 2005-10-06 |
Family
ID=35174671
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004087478A Pending JP2005274917A (ja) | 2004-03-24 | 2004-03-24 | 音声復号装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005274917A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008013135A1 (fr) | 2006-07-27 | 2008-01-31 | Nec Corporation | Dispositif de décodage de données audio |
JP2008033232A (ja) * | 2007-02-16 | 2008-02-14 | Nec Corp | 音声データ復号装置及び音声データ変換装置 |
WO2008111158A1 (ja) * | 2007-03-12 | 2008-09-18 | Fujitsu Limited | 音声波形補間装置および方法 |
JP4983606B2 (ja) * | 2005-12-21 | 2012-07-25 | 日本電気株式会社 | 符号変換装置及びそれに用いる符号変換方法並びにそのプログラム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01224800A (ja) * | 1988-03-04 | 1989-09-07 | Nec Corp | 残差駆動型音声合成装置 |
JPH07334191A (ja) * | 1994-06-06 | 1995-12-22 | Nippon Telegr & Teleph Corp <Ntt> | パケット音声復号方法 |
JPH11243421A (ja) * | 1998-02-25 | 1999-09-07 | Kokusai Electric Co Ltd | デジタル音声通信方法及びシステム |
JP2001228896A (ja) * | 2000-02-14 | 2001-08-24 | Iwatsu Electric Co Ltd | 欠落音声パケットの代替置換方式 |
JP2001339368A (ja) * | 2000-03-22 | 2001-12-07 | Toshiba Corp | 誤り補償回路及び誤り補償機能を備えた復号装置 |
-
2004
- 2004-03-24 JP JP2004087478A patent/JP2005274917A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01224800A (ja) * | 1988-03-04 | 1989-09-07 | Nec Corp | 残差駆動型音声合成装置 |
JPH07334191A (ja) * | 1994-06-06 | 1995-12-22 | Nippon Telegr & Teleph Corp <Ntt> | パケット音声復号方法 |
JPH11243421A (ja) * | 1998-02-25 | 1999-09-07 | Kokusai Electric Co Ltd | デジタル音声通信方法及びシステム |
JP2001228896A (ja) * | 2000-02-14 | 2001-08-24 | Iwatsu Electric Co Ltd | 欠落音声パケットの代替置換方式 |
JP2001339368A (ja) * | 2000-03-22 | 2001-12-07 | Toshiba Corp | 誤り補償回路及び誤り補償機能を備えた復号装置 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4983606B2 (ja) * | 2005-12-21 | 2012-07-25 | 日本電気株式会社 | 符号変換装置及びそれに用いる符号変換方法並びにそのプログラム |
WO2008013135A1 (fr) | 2006-07-27 | 2008-01-31 | Nec Corporation | Dispositif de décodage de données audio |
US8327209B2 (en) | 2006-07-27 | 2012-12-04 | Nec Corporation | Sound data decoding apparatus |
JP2008033232A (ja) * | 2007-02-16 | 2008-02-14 | Nec Corp | 音声データ復号装置及び音声データ変換装置 |
WO2008111158A1 (ja) * | 2007-03-12 | 2008-09-18 | Fujitsu Limited | 音声波形補間装置および方法 |
JPWO2008111158A1 (ja) * | 2007-03-12 | 2010-06-24 | 富士通株式会社 | 音声波形補間装置および方法 |
JP5233986B2 (ja) * | 2007-03-12 | 2013-07-10 | 富士通株式会社 | 音声波形補間装置および方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4473869B2 (ja) | 音響信号のパケット通信方法、送信方法、受信方法、これらの装置およびプログラム | |
KR102110853B1 (ko) | 음성 부호화 장치, 음성 부호화 방법, 음성 부호화 프로그램, 음성 복호 장치, 음성 복호 방법 및 음성 복호 프로그램 | |
JP2008058667A (ja) | 信号処理装置および方法、記録媒体、並びにプログラム | |
JPH01155400A (ja) | 音声符号化方式 | |
JP2010136420A (ja) | 長期予測符号化方法、長期予測復号化方法、これら装置、及びそのプログラム | |
US20010029451A1 (en) | Speech decoding unit and speech decoding method | |
US7793202B2 (en) | Loss compensation device, loss compensation method and loss compensation program | |
JP2005274917A (ja) | 音声復号装置 | |
WO2009064829A1 (en) | Method and apparatus for managing speech decoders | |
JP4572755B2 (ja) | 復号化装置,復号化方法及びデジタル音声通信システム | |
JP2003050598A (ja) | 音声復号装置 | |
JP4678440B2 (ja) | 音声データ復号装置 | |
JP2006279809A (ja) | 音声再生装置および音声再生方法 | |
JP3977784B2 (ja) | リアルタイムパケット処理装置及びその方法 | |
JP3487158B2 (ja) | 音声符号化伝送システム | |
JP5011913B2 (ja) | 差分符号化信号復号装置 | |
US5706393A (en) | Audio signal transmission apparatus that removes input delayed using time time axis compression | |
JPH1013239A (ja) | 復号処理装置およびその復号処理方法 | |
JP2005142856A (ja) | 受信装置および方法 | |
JP5056049B2 (ja) | 音声データ復号装置 | |
JP5056048B2 (ja) | 音声データ復号装置 | |
JP2005143013A (ja) | 復号装置 | |
JP2000244949A (ja) | Dtmf信号伝送装置 | |
JPH01248200A (ja) | 音声復号化装置 | |
JPH0613990A (ja) | 音声復号装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070306 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100129 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100601 |