JP2017032906A

JP2017032906A - 音声信号復号装置および音声信号復号方法

Info

Publication number: JP2017032906A
Application number: JP2015155009A
Authority: JP
Inventors: 江原　宏幸; Hiroyuki Ebara; 宏幸江原
Original assignee: Panasonic Intellectual Property Management Co Ltd
Current assignee: Panasonic Intellectual Property Management Co Ltd
Priority date: 2015-08-05
Filing date: 2015-08-05
Publication date: 2017-02-09
Anticipated expiration: 2035-08-05
Also published as: WO2017022151A1; US20180182407A1; US10347266B2; JP6516099B2

Abstract

【課題】正常な復号信号の再生に影響を与えずに、符号化信号の誤りに起因する大音量の異常音の再生を回避することができる音声信号復号装置および音声信号復号方法を提供する。
【解決手段】ＣＥＬＰ方式で符号化された符号化信号の適応符号帳符号を用いて適応符号帳ベクトルを生成する適応符号帳復号部１０２と、符号化信号の固定符号帳符号を用いて固定符号帳ベクトルを生成する固定符号帳復号部１０３と、適応符号帳ベクトルと固定符号帳ベクトルとの振幅比、あるいはエネルギー比を算出する比算出部１０７と、振幅比、あるいはエネルギー比が所定のしきい値を超えるか否かを判定する判定部１０９と、振幅比、あるいはエネルギー比が所定のしきい値を超えると判定された場合に、適応符号帳ベクトルと固定符号帳ベクトルとを加算した励振信号を減衰させる減衰器１１０と、を有する。
【選択図】図１

Description

本発明は、符号化された音声信号を復号する音声信号復号装置および音声信号復号方法に関する。

従来、音声を符号化することによりデータ圧縮を行う音声符号化の技術は、例えば携帯電話、ＶｏＩＰ（Voice over Internet Protocol）、放送、記録等の様々な分野で使用されており、広く普及している。また、符号化情報を暗号化して通信時の秘匿性を高める場合がある。この場合、種々の音声符号化技術により符号化された符号化信号を取り出すためにまず暗号の復号処理を行い、その後符号化信号から音声信号を復号することで再生できるようになる。

暗号化された符号化信号に対して暗号の復号処理がなされるまでの間に、暗号化された符号化信号の一部が失われたり、ノイズや伝送不良による誤りが発生したりすることによって、暗号の復号ができず、符号化情報を正常に復号できない場合がある。また、暗号の鍵に関する情報に誤りがある場合は、暗号の復号後の符号化情報にも誤りが生じてしまうため、復号される音声信号が著しく損なわれたものとなる。そして、符号化情報が正常に復号されなかった場合に、復号信号が過大振幅を有すると、当該信号を再生したとき、大音量の異常音が発生されることがある。なお、暗号化を行わない場合には、符号化信号が復号されるまでの間に、伝送路上等で符号化信号に直接誤りが混入することによって、前述のような状況が発生することがある。

このような誤りを回避するための技術として、例えば、特許文献１には、符号化信号に暗号化ヘッダを付加し、復号時に暗号化ヘッダを除去するとともに、暗号化ヘッダに含まれる符号化に使用した暗号化アルゴリズムの情報に基づいて復号を行う復号化装置が開示されている。

さらに、特許文献２には、音声符号情報を暗号対象データと非暗号対象データに分割し、非暗号対象データに基づいて生成した初期ベクトルと所定の鍵とを用いて音号対象データを暗号化し、これらを結合して復号装置に送信し、復号時には非暗号対象データを分離して初期ベクトルを生成し、所定の鍵とともにこれらを用いて復号を行う暗号化装置および復号装置が開示されている。

また、誤りに起因する大音量の異常音の発生を回避するための技術として、例えば特許文献３には、復号した音声信号のレベルが所定のしきい値より高い場合に、当該音声信号の出力を停止する音声抑制装置が開示されている。

特開２００７−２２１８０７号公報特開２００８−２８３４１５号公報特開平７−５８６８７号公報

しかしながら、特許文献１に開示された復号化装置では、暗号化ヘッダの追加により符号化信号の情報量が増えてしまう。情報量の増大を回避するため暗号化ヘッダの情報量を小さいものとすると、ヘッダ長が短くなり、誤り検出性能が低くなってしまう。

また、特許文献２に開示された暗号化装置および復号装置では、非暗号対象データは暗号化されないまま暗号化装置から復号装置に送られるので、セキュリティ上の問題がある。

さらに、特許文献３に開示された音声抑制装置では、単に復号信号のレベルのみを参照して、レベルがしきい値より大きい場合に出力停止しているので、元々の音声信号のレベルが大きい場合にも再生されない恐れがある。

このようなことから、正常な復号信号の再生に影響を与えずに、信号の誤りに起因する大音量の異常音の再生を回避することができる音声信号復号装置が要望されている。

本発明の目的は、正常な復号信号の再生に影響を与えずに、信号の誤りに起因する大音量の異常音の再生を回避することができる音声信号復号装置および音声信号復号方法を提供することである。

本発明の音声信号復号装置は、ＣＥＬＰ方式で符号化された符号化信号の適応符号帳符号を用いて適応符号帳復号成分を生成する適応符号帳復号部と、前記符号化信号の固定符号帳符号を用いて固定符号帳復号成分を生成する固定符号帳復号部と、前記適応符号帳復号成分と前記固定符号帳復号成分との振幅比、あるいはエネルギー比を算出する比算出部と、前記比算出部が算出した振幅比、あるいはエネルギー比が所定のしきい値を超えるか否かを判定する判定部と、前記判定部により前記振幅比、あるいはエネルギー比が所定のしきい値を超えると判定された場合に、前記適応符号帳復号成分と前記固定符号帳復号成分とを加算した励振信号を減衰させる減衰器と、を有する。

本発明の音声信号復号方法は、ＣＥＬＰ方式で符号化された符号化信号の適応符号帳成分を用いて適応符号帳復号成分を生成する適応符号帳復号ステップと、前記符号化信号の固定符号帳成分を用いて固定符号帳復号成分を生成する固定符号帳復号ステップと、前記適応符号帳復号成分と前記固定符号帳復号成分との振幅比、あるいはエネルギー比を算出する比算出ステップと、前記振幅比、あるいはエネルギー比が所定のしきい値を超えるか否かを判定する判定ステップと、前記振幅比、あるいはエネルギー比が所定のしきい値を超えると判定された場合に、前記適応符号帳復号成分と前記固定符号帳復号成分とを加算した励振信号を減衰させる減衰ステップと、を有する。

本発明によれば、正常な復号信号の再生に影響を与えずに、符号化信号の誤りに起因する大音量の異常音の再生を回避することができる。

本発明の実施の形態に係る音声信号復号装置の構成の一例を示す図ＡＣＢ／ＦＣＢ振幅比について例示した図音声信号復号装置の動作例を示すフローチャート音声信号復号装置の動作例を示すフローチャート

以下、本発明の実施の形態について詳細に説明する。図１は、本発明の実施の形態に係る音声信号復号装置１００の構成の一例を示す図である。図１に示す音声信号復号装置１００は、ＣＥＬＰ（Code-Excited Linear Prediction：符号励振線形）と呼ばれる音声符号化方式で符号化された符号化信号を復号するものである。

人間の音声は、声帯の振動により発生した音が、のど、口腔、鼻腔等を含む声道により共振することで発生する。ＣＥＬＰは、音声の生成過程に基づいて、音声信号を声帯の振動による音源成分と、声道での共振による音の変化による成分（スペクトル包絡成分）との２つの成分に分けてパターン化を行うことにより音声信号の情報量を圧縮するものである。すなわち、ＣＥＬＰでは、符号化時には、符号帳に予め用意された多くのパターンの中から、入力された音声信号の２つの成分のそれぞれと似たパターンが抽出され、抽出したパターンに定義されている符号を利用して音声信号の符号化が行われる。そして、復号時には、符号化信号から復号された２つの成分が合成されることによって復号信号が得られる。

図１に示す音声信号復号装置１００において、図示しない符号化装置によってＣＥＬＰ方式により符号化された音声信号である符号化信号は、多重分離部１０１により適応符号帳符号、固定符号帳符号、利得符号、線形予測係数符号に分離される。音声信号復号装置１００は、フレーム単位で符号化信号の復号を行う。

適応符号帳符号は適応符号帳復号部１０２に、固定符号帳符号は固定符号帳復号部１０３に、利得符号は利得復号部１０４に、線形予測係数符号は合成フィルタ１１１に、それぞれ入力される。

適応符号帳復号部１０２は、適応符号帳符号で特定される適応符号帳ベクトルを生成し、生成した適応符号帳ベクトルを増幅器１０５に出力する。適応符号帳（Adaptive Code Book：ＡＣＢ）は、過去に生成された励振信号であり、後述する加算器１０８から出力される励振信号を使用する。なお、適応符号帳ベクトルが本発明の適応符号帳復号成分に対応している。

固定符号帳復号部１０３は、固定符号帳符号で指定される固定符号帳ベクトルを生成し、生成した固定符号帳ベクトルを増幅器１０６に出力する。固定符号帳（Fixed Code Book：ＦＣＢ）は、予め決められた複数の波形データを生成するものである。具体的には、固定符号帳は、所定数のガウス雑音系列のベクトルを格納したメモリであったり、所定の位置に配置できるパルスの位置と極性の組み合わせにより所定の種類のパルスベクトルを生成するものであったり、音源信号の特徴的な形状を表すために予め用意された所定数のベクトルを格納したメモリであったり、それらの組み合わせであったりする。なお、固定符号帳ベクトルが本発明の固定符号帳復号成分に対応している。

利得復号部１０４は、利得符号を復号して適応府符号帳利得と固定符号帳利得を生成し、適応符号帳利得を増幅器１０５に、固定符号帳利得を増幅器１０６に、それぞれ出力する。

増幅器１０５は、適応符号帳復号部１０２から出力された適応符号帳ベクトルに利得復号部１０４から出力された適応符号帳利得を乗算し、乗算結果の適応符号帳ベクトルを比算出部１０７および加算器１０８に出力する。

増幅器１０６は、固定符号帳復号部１０３から出力された固定符号帳ベクトルに利得復号部１０４から出力された固定符号帳利得を乗算し、乗算結果を比算出部１０７および加算器１０８に出力する。

比算出部１０７は、増幅器１０５から出力された乗算結果の適応符号帳ベクトルと、増幅器１０６から出力された乗算結果の固定符号帳ベクトルとの振幅比（ＡＣＢ／ＦＣＢ振幅比）を算出し、算出したＡＣＢ／ＦＣＢ振幅比を判定部１０９に出力する。あるいは、比算出部１０７は、乗算結果の適応符号帳ベクトルと、乗算結果の固定符号帳ベクトルとのエネルギー比を算出するようにしてもよい。

加算器１０８は、増幅器１０５から出力された乗算結果の適応符号帳ベクトルと、増幅器１０６から出力された乗算結果の固定符号帳ベクトルとを加算して励振信号を生成し、適応符号帳復号部１０２および減衰器１１０に出力する。

判定部１０９は、比算出部１０７から出力されたＡＣＢ／ＦＣＢ振幅比（あるいはエネルギー比、以下同様）が所定のしきい値より大きい場合に、検出信号を減衰器１１０に出力する。判定部１０９は、ＡＣＢ／ＦＣＢ振幅比が所定のしきい値以下の場合は、検出信号を出力しない。ここで、ＡＣＢ／ＦＣＢ振幅比が所定のしきい値より大きい場合とは、例えば符号化信号の誤りによりランダム信号が生成された場合、すなわち異常な復号信号である場合である。すなわち、判定部１０９は、ＡＣＢ／ＦＣＢ振幅比が所定のしきい値より大きいか否かを判定することにより、あるフレームの復号信号が正常であるか否かを判定している。

ここで、判定部１０９による判定の意味について説明する。図２は、ＡＣＢ／ＦＣＢ振幅比について例示した図である。図２（ａ）は、周期性が強い信号の例として、スイープ信号の符号化信号を復号した場合のＡＣＢ／ＦＣＢ振幅比について例示している。例えば図２（ａ）に示すように、スイープ信号の場合、ＡＣＢ／ＦＣＢ振幅比は、おおよそ５０以下の値となる。これは固定周波数の正弦波信号を用いた場合でも同様である。換言すれば、誤りのない符号化情報の復号で発生しうるＡＣＢ／ＦＣＢ振幅比は、おおよそ５０以下の値となる。

一方、図２（ｂ）は、乱数で生成した符号化信号を復号した場合のＡＣＢ／ＦＣＢ振幅比について例示している。乱数系列を符号化信号として復号した場合、ＡＣＢ／ＦＣＢ振幅比は、図２（ｂ）に示すように５０を大幅に超える値が多く出現する。ＡＣＢ／ＦＣＢ振幅比が５０を大幅に超える場合とは、適応符号帳ベクトルの振幅と比較して固定符号帳ベクトルの振幅が極端に低い場合である。なお、このような符号化結果が得られるケースとして考えられるのは、符号化装置への入力信号が周期性の極めて強い正弦波のような信号である場合である。

上述したように、誤りのない符号化情報の復号で発生しうるＡＣＢ／ＦＣＢ振幅比は、おおよそ５０以下の値となる。従って、判定部１０９においては、所定のしきい値を５０に設定し、ある符号化信号のＡＣＢ／ＦＣＢ振幅比がしきい値である５０以下である場合に、その符号化信号は誤りがないと判定する。反対に、判定部１０９において、ある符号化信号のＡＣＢ／ＦＣＢ振幅比がしきい値である５０を超える場合には、その符号化信号には誤りがあると判定する。なお、しきい値を５０とすることは一例であり、本発明はこれに限定されない。しきい値は、例えば固定小数点演算で実装する場合は，２のべき乗として６４としてもよい。なお、適用先のＣＥＬＰコーデックに応じて最適なしきい値は異なる可能性があるので、適宜設定できるようにしてもよい。

図１の説明に戻る。減衰器１１０は、判定部１０９から検出信号が出力された場合、すなわち当該フレームの復号信号が異常であると判定された場合には、加算器１０８から出力された励振信号の信号レベルを減衰して合成フィルタ１１１に出力する。減衰器１１０が励振信号を減衰させる量については、本発明では限定しないが、例えば１／１０まで減衰するようにすればよい。また、減衰器１１０は、判定部１０９から検出信号が出力されなかった場合、すなわち当該フレームの復号信号が正常である場合は、励振信号をそのまま合成フィルタ１１１に出力する。

合成フィルタ１１１は、多重分離部１０１から出力された線形予測係数符号に基づいて線形予測（Linear Predictive Coding：ＬＰＣ）フィルタを生成し、当該ＬＰＣフィルタを合成フィルタとして減衰器１１０から出力された励振信号を整形し、復号音声信号として出力する。

このように、音声信号復号装置１００は、入力された符号化信号の各フレームにおいて、ＡＣＢ／ＦＣＢ振幅比を算出し、当該振幅比が所定のしきい値を超える場合には当該フレームを正常でないと判定して当該フレームの信号レベルを減衰させる。このため、正常でないフレームの復号信号が再生されることにより大音量の異常音が発生する事態を回避することができる。

ただし、正常でないフレームのＡＣＢ／ＦＣＢ振幅比は、必ずしも所定のしきい値を超えるとは限らない。図２（ｂ）に示すように、正常でないフレームでも、ＡＣＢ／ＦＣＢ振幅比が所定のしきい値である５０以下の値をとる場合が存在する。しかしながら、例えば伝送不良等による符号化信号の誤りに起因して正常でないフレームが発生した場合には、数フレーム間に亘って正常でないフレームが連続する場合が多い。このような場合には、連続した正常でないフレームのＡＣＢ／ＦＣＢ振幅比のいずれかが所定のしきい値を超える可能性が高い。従って、音声信号復号装置１００は正常でないフレームの連続した部位を高確率で検出することができるので、正常でないフレームの復号信号が再生されることにより大音量の異常音が発生する事態を高精度で回避することができる。

このように、正常でないフレームは連続する場合が多いため、減衰器１１０は、あるフレームにおいて判定部１０９から検出信号が出力された場合、すなわち当該フレームが正常でない場合、当該フレームに加えて、その後所定数のフレームの復号信号を減衰するようにすることが好ましい。このような処理によって、例えば正常でないフレームが連続しているにもかかわらず、あるフレーム以後のフレームのＡＣＢ／ＦＣＢ振幅比が所定の値以下であり、判定部１０９が正常でないと判定できない場合でも、減衰器１１０が当該フレームの励振信号を強制的に減衰することによって、正常でないフレームの復号信号が再生されることにより大音量の異常音が発生する事態を高精度で回避することができる。なお、減衰器１１０が減衰する所定数のフレームの数については本発明では限定しない。

なお、符号化信号において、正常なフレームが連続する中で、正常でないフレームが１つのみ存在する場合には、上記したように、音声信号復号装置１００は当該正常でないフレームを正常でないと判定することができるとは限らない。しかしながら、正常ではない符号化信号が１フレームのみ存在したとしても、このフレームでは適応符号帳利得が異常に大きくなっているわけではないので、当該フレームの復号音声信号を再生した時大音量の異常音が再生される可能性は低い。また、大音量になったとしても、音声信号として再生した場合に再生される時間は１フレームと非常に短いため、致命的な大音量の異常音として知覚される事態には成り難いと考えられる。

ただし、適応符号帳復号部１０２が正常でないフレームの後の正常な数フレームを復号するとき、正常でないフレームの励振信号が適応符号帳として使用されることになる。このため、入力フレームが正常であったとしても、正常でないフレームの後の数フレーム間は、適応符号帳復号部１０２の後段の信号が正常でない可能性がある。このような場合には、正常でないフレームが数フレーム連続するため、そのいずれかが適応符号帳利得が異常に大きくなるフレームである可能性が高く、判定部１０９によってそのフレームを問題なく検出することができる。これにより、減衰器１１０が正常でないフレームの励振信号の信号レベルを減衰させるので、誤りの影響が伝播する場合においても適応符号帳成分が異常に大きくなる場合を検出して大音量の異常音を発生する事態を回避することができる。

以下、音声信号復号装置１００の動作例について説明する。図３および図４は、音声信号復号装置１００の動作例を示すフローチャートである。

まず、音声復号信号装置１００は、動作開始時に、カウンタｃｎｔおよび異常検出フラグｆｌｇ［０：ｎｆ−１］をクリアする（０にする）（ステップＳ１）。カウンタｃｎｔは、過去ｎｆセグメントの中でＡＣＢ／ＦＣＢ振幅比がしきい値を超えたセグメントの数をカウントするカウンタである。異常検出フラグｆｌｇ［０：ｎｆ−１］は、現在のセグメントを含む過去ｎｆセグメントにおいて、ＡＣＢ／ＦＣＢ振幅比がしきい値を超えたか否かを示すフラグを格納するメモリである。ｆｌｇ［０：ｎｆ−１］には、しきい値を超えると１、超えないと０が格納される。また、セグメントは、適応符号帳を復号する単位になる時間長（ブロック長）である。セグメントはフレームと置換してもよいが、１フレームが複数のサブフレームに分割されており、サブフレーム毎に復号がなされる場合は、セグメントはサブフレームに相当する。また、セグメント数ｎｆは、しきい値を超えるＡＣＢ／ＦＣＢ振幅比がその中に存在するか否かを判定する単位となるセグメント数であり、例えば１５である。

多重分離部１０１は、入力された符号化信号を、セグメント毎に適応符号帳符号、固定符号帳符号、利得符号、線形予測係数符号に分離する（ステップＳ２）。適応符号帳復号部１０２は、適応符号帳符号を用いて適応符号帳ベクトルを生成する。また、固定符号帳復号部１０３は、固定符号帳符号を用いて固定符号帳ベクトルを生成する。また、利得復号部１０４は、利得信号を復号して適応府符号帳利得と固定符号帳利得を生成する（ステップＳ３）。ステップＳ３において、適応符号帳復号部１０２、固定符号帳復号部１０３、および利得復号部１０４の処理の順番については本発明では限定しない。これらの処理は同時に行われてもよいし、所定の順番で行われてもよい。

次に、増幅器１０５は、適応符号帳ベクトルに適応符号帳利得を乗算し、乗算結果の適応符号帳ベクトルを生成する。また、増幅器１０６は、固定符号帳ベクトルに固定符号帳利得を乗算し、乗算結果の固定符号帳ベクトルを生成する（ステップＳ４）。ステップＳ４において、増幅器１０５および１０６の処理の順番については本発明では限定しない。これらの処理は同時に行われてもよいし、所定の順番で行われてもよい。

そして、比算出部１０７は、乗算結果の適応符号帳ベクトルと、乗算結果の固定符号帳ベクトルとの振幅比（ＡＣＢ／ＦＣＢ振幅比）を算出する（ステップＳ５）。加算器１０８は、乗算結果の適応符号帳ベクトルと、乗算結果の固定符号帳ベクトルとを加算して励振信号を生成する（ステップＳ６）。なお、ステップＳ５とステップＳ６とは、いずれが先に行われてもよいし、あるいは同時に行われてもよい。

この時点で、音声復号信号装置１００は、カウンタｃｎｔから最も過去の異常検出フラグｆｌｇ［ｎｆ−１］を減じるとともに、異常検出フラグｆｌｇ［］の内容を１つずつシフトする（ステップＳ７）。これにより、カウンタｃｎｔの範囲内から最も古いセグメントを排除し、現セグメントを範囲内に含める準備をする。

判定部１０９は、現セグメントのＡＣＢ／ＦＣＢ振幅比が所定のしきい値、例えば５０より大きいか否かを判定する（ステップＳ８）。ＡＣＢ／ＦＣＢ振幅比が所定のしきい値より大きい場合、フローはステップＳ９に進み、そうでない場合、ステップＳ１０に進む。

判定部１０９により、現セグメントのＡＣＢ／ＦＣＢ振幅比が所定のしきい値より大きいと判定された場合、現セグメントは異常であるため、現セグメントの異常検出フラグｆｌｇ［０］を１にする（ステップＳ９）。一方、判定部１０９により、ＡＣＢ／ＦＣＢ振幅比が所定のしきい値以下であると判定された場合、現セグメントは異常ではないため、現セグメントの異常検出フラグｆｌｇ［０］は０とする（ステップＳ１０）。そして、現セグメントの異常検出フラグｆｌｇ［０］をカウンタｃｎｔに加算し、カウンタｃｎｔを最新の状態に更新する（ステップＳ１１）。

そして、音声復号信号装置１００は、カウンタｃｎｔが０より大きいか否かを判定する（ステップＳ１２）。カウンタｃｎｔが０より大きい場合、フローはステップＳ１３に進み、そうでない（カウンタｃｎｔが０である）場合、ステップＳ１４に進む。

カウンタｃｎｔが０より大きい場合、現セグメントを含む過去のｎｆセグメントの中に異常が検出すされたセグメントが少なくとも１つあったことを意味するため、減衰器１１０はステップＳ６において生成された励振信号を所定倍、例えば１／１０に減衰する（ステップＳ１３）。そして、合成フィルタ１１１は、線形予測係数符号に基づいてＬＰＣフィルタを生成し、これを合成フィルタとして励振信号から復号音声信号を生成する（ステップＳ１４）。これにより、正常でないフレームの励振信号の信号レベルが減衰された復号音声信号が出力される。

一方、カウンタｃｎｔが０である場合、現セグメントを含む過去のｎｆセグメントの中には、異常が検出されたセグメントが１つもなかったことを意味するため、ステップＳ１４において、減衰されていない励振信号に基づいた復号音声信号が生成される。このため、正常なフレームの信号レベルは減衰されず、正常な音量の復号音声信号を生成することができる。

そして、音声信号復号装置１００は、現セグメントが符号化信号の最後まで到達したか否かの判定を行う（ステップＳ１５）。現セグメントが符号化信号の最後まで到達した場合、符号化信号に対する復号が終了したとして、音声信号復号装置１００は処理を終了する。そうでない場合、セグメントを１つ進めてステップＳ２に戻る。

以上説明したように、本発明の実施の形態に係る音声信号復号装置１００は、ＣＥＬＰ方式で符号化された符号化信号の適応符号帳符号を用いて適応符号帳ベクトルを生成する適応符号帳復号部１０２と、符号化信号の固定符号帳符号を用いて固定符号帳ベクトルを生成する固定符号帳復号部１０３と、適応符号帳ベクトルと固定符号帳ベクトルとの振幅比、あるいはエネルギー比を算出する比算出部１０７と、比算出部１０７が算出した振幅比、あるいはエネルギー比が所定のしきい値を超えるか否かを判定する判定部１０９と、判定部１０９により振幅比、あるいはエネルギー比が所定のしきい値を超えると判定された場合に、適応符号帳ベクトルと固定符号帳ベクトルとを加算した励振信号を減衰させる減衰器１１０と、を有する。

ＣＥＬＰでは、適応符号帳ベクトルと比較して固定符号帳ベクトルの値が極端に低くならないことが実験的に確認されており、あるフレームにおけるＡＣＢ／ＦＣＢ振幅比、あるいはエネルギー比が所定のしきい値を超える場合、すなわち、適応符号帳ベクトルの振幅と比較して固定符号帳ベクトルの振幅が極端に低い場合、当該フレームの復号信号が正常な信号ではないことがほぼ確定する。従って、本発明の実施の形態に係る音声信号復号装置１００は、上記した構成により、あるフレームにおけるＡＣＢ／ＦＣＢ振幅比、あるいはエネルギー比が当該しきい値を超える場合には、当該フレームの復号信号が正常ではないと判定し、当該フレームの励振信号を減衰させる。このため、正常でないフレームの復号信号が再生されることにより大音量の異常音が発生する事態を高精度で回避することができる。

また、本発明の実施の形態に係る音声信号復号装置１００において、減衰器１１０は、判定部１０９により振幅比、あるいはエネルギー比が所定のしきい値を超えると判定されたフレームが存在した場合に、当該フレームの後の所定数のフレームの励振信号を減衰させる。このため、音声信号復号装置１００によれば、例えば正常でないフレームが連続しているにもかかわらず、あるフレーム以後のフレームのＡＣＢ／ＦＣＢ振幅比、あるいはエネルギー比が所定の値以下であり、正常でないと判定できない場合でも、当該フレームの励振信号を強制的に減衰することによって、正常でないフレームの復号信号が再生されることにより大音量の異常音が発生する事態を高精度で回避することができる。

また、本発明の実施の形態に係る音声信号復号装置１００において、合成フィルタ１１１の前段に減衰器１１０により励振信号を減衰する構成を有する。合成フィルタ１１１の後段に減衰器を入れると、フレーム境界において信号の不連続性を生じてしまう。しかしながら、合成フィルタ１１１の前段に減衰器１１０を配置し、フレーム境界に不連続を生じる減衰後の信号で合成フィルタ１１１を駆動することにより、フレーム間で連続性を保った復号音声信号を生成できる。つまり、音声信号復号装置１００によれば、上記したように合成フィルタ１１１の前段で減衰処理を行っているため、フレーム間の不連続を生ずることがない。

本発明は、ＣＥＬＰ方式で符号化された音声信号を復号する音声信号復号装置に好適である。

１００音声信号復号装置
１０１多重分離部
１０２適応符号帳復号部
１０３固定符号帳復号部
１０４利得復号部
１０５増幅器
１０６増幅器
１０７比算出部
１０８加算器
１０９判定部
１１０減衰器
１１１合成フィルタ

Claims

ＣＥＬＰ方式で符号化された符号化信号の適応符号帳符号を用いて適応符号帳復号成分を生成する適応符号帳復号部と、
前記符号化信号の固定符号帳符号を用いて固定符号帳復号成分を生成する固定符号帳復号部と、
前記適応符号帳復号成分と前記固定符号帳復号成分との振幅比、あるいはエネルギー比を算出する比算出部と、
前記比算出部が算出した振幅比、あるいはエネルギー比が所定のしきい値を超えるか否かを判定する判定部と、
前記判定部により前記振幅比、あるいはエネルギー比が所定のしきい値を超えると判定された場合に、前記適応符号帳復号成分と前記固定符号帳復号成分とを加算した励振信号を減衰させる減衰器と、
を有する音声信号復号装置。
前記符号化信号をフレーム毎に前記適応符号帳符号および前記固定符号帳符号に分離する多重分離部をさらに有する、
請求項１に記載の音声信号復号装置。
前記減衰器は、前記判定部により前記振幅比、あるいはエネルギー比が所定のしきい値を超えると判定されたフレームが存在した場合に、当該フレームの後の所定数のフレームの励振信号を減衰させる、
請求項２に記載の音声信号復号装置。
前記減衰器により減衰された励振信号を整形して復号音声信号を生成する合成フィルタをさらに有する、
請求項１に記載の音声信号復号装置。
ＣＥＬＰ方式で符号化された符号化信号の適応符号帳成分を用いて適応符号帳復号成分を生成する適応符号帳復号ステップと、
前記符号化信号の固定符号帳成分を用いて固定符号帳復号成分を生成する固定符号帳復号ステップと、
前記適応符号帳復号成分と前記固定符号帳復号成分との振幅比、あるいはエネルギー比を算出する比算出ステップと、
前記振幅比、あるいはエネルギー比が所定のしきい値を超えるか否かを判定する判定ステップと、
前記振幅比、あるいはエネルギー比が所定のしきい値を超えると判定された場合に、前記適応符号帳復号成分と前記固定符号帳復号成分とを加算した励振信号を減衰させる減衰ステップと、
を有する音声信号復号方法。