JP5142727B2 - 音声復号装置および音声復号方法 - Google Patents

音声復号装置および音声復号方法 Download PDF

Info

Publication number
JP5142727B2
JP5142727B2 JP2007552944A JP2007552944A JP5142727B2 JP 5142727 B2 JP5142727 B2 JP 5142727B2 JP 2007552944 A JP2007552944 A JP 2007552944A JP 2007552944 A JP2007552944 A JP 2007552944A JP 5142727 B2 JP5142727 B2 JP 5142727B2
Authority
JP
Japan
Prior art keywords
frame
pulse waveform
sound source
signal
periodic pulse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007552944A
Other languages
English (en)
Other versions
JPWO2007077841A1 (ja
Inventor
拓也 河嶋
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2007552944A priority Critical patent/JP5142727B2/ja
Publication of JPWO2007077841A1 publication Critical patent/JPWO2007077841A1/ja
Application granted granted Critical
Publication of JP5142727B2 publication Critical patent/JP5142727B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、音声復号装置および音声復号方法に関する。
近年、VoIP(Voice over IP)に代表されるベストエフォート型の音声通信が一般的になってきた。このような音声通信では、一般に伝送帯域は保証されないため、一部のフレームが伝送途中で損失し、音声復号装置では、符号化データの一部が受信できず欠落する可能性がある。例えば、輻輳等によって通信路のトラヒックが飽和すると、伝送途中で一部のフレームが破棄されて符号化データが失われる。このようなフレーム損失が発生した場合でも、音声復号装置では、そのフレーム損失により生じた無音部分を聴覚的に違和感の少ない音声で埋めて補償(隠蔽)する必要がある。
フレーム損失補償の従来技術としては、有音フレームと無音フレームとで損失補償処理を切り替えるものがある(例えば、特許文献1参照)。この従来技術では、損失したフレームが有音フレームのときは、その損失フレームの直前のフレームのパラメータを繰り返し用いるようなフレーム損失補償処理がなされる。一方、損失したフレームが無音フレームのときは、雑音符号帳からの音源信号に雑音信号を付加したり、雑音符号帳からの音源信号をランダムに選択するようなフレーム損失補償処理がなされ、波形形状が同じ音源信号が連続して用いられることによる聴覚的に違和感の強い復号音声の発生を抑えている。
特開平10−91194号公報
しかし、有音フレームの損失に対する上記従来技術のフレーム損失補償では、図1に示すように、損失したフレーム(第nフレーム)の直前のフレーム(第n−1フレーム)に破裂性子音(例えば、‘p’,‘k’,‘t’)のような立ち上がり部分の振幅が非常に大きい子音が存在する区間があると、フレーム損失補償にその部分が繰り返し用いられることで、フレーム損失補償されたフレーム(第nフレーム)において、大きなビープ音等、聴覚的に違和感の強い復号音声が発生してしまう。破裂性子音の他、背景雑音等、損失したフレームの直前のフレームに、突発的かつ局所的に大きな振幅を持つ音声が存在する区間があると、同様に聴覚的に違和感の強い復号音声が発生してしまう。
また、無音フレームの損失に対する上記従来技術のフレーム損失補償では、図2に示すように、直前のフレーム(第n−1フレーム)の音声とは特性が異なる雑音信号により損失フレーム(第nフレーム)全体が補償されるため、復号音声の明瞭度が低下し、フレーム全体として聴覚的にノイズが目立つ復号音声となってしまう。
このように、上記従来技術のフレーム損失補償には、復号音声に聴覚的な劣化が生じることがあるという問題がある。
本発明の目的は、聴覚的に自然で、かつ、ノイズが目立たない復号音声が得られるフレーム損失補償を行うことができる音声復号装置および音声復号方法を提供することである。
本発明の音声復号装置は、過去の音源信号を蓄積する蓄積手段と、ピッチラグに基づいて選択した過去の音源信号を出力する適応符号帳と、雑音信号を出力する雑音符号帳と、前記適応符号帳から出力された音源信号と前記雑音符号帳から出力された雑音信号とを加算する加算手段と、第nフレーム(nは自然数)が消失した場合に、第n−1フレームの音源信号とピッチ情報を用いて、前記第n−1フレームの音源信号において非周期性パルス波形が存在する区間を検出する検出手段と、前記加算手段から出力された第n−1フレームの信号の前記非周期性パルス波形が存在する区間において、前記非周期性パルス波形を抑圧する抑圧手段と、前記非周期性パルス波形が抑圧された前記第n−1フレームの信号に対して合成フィルタによる合成を行って前記第nフレームの復号音声を得る合成手段と、を具備する構成を採る。
本発明によれば、聴覚的に自然で、かつ、ノイズが目立たない復号音声が得られるフレーム損失補償を行うことができる。
以下、本発明の実施の形態について、添付図面を参照して説明する。
(実施の形態1)
図3は、本発明の実施の形態1に係る音声復号装置10の構成を示すブロック図である。以下、伝送途中で第nフレームが損失し、第nフレームの直前の第n−1フレームを用いて第nフレームの損失を補償(隠蔽)する場合を例にとって説明する。つまり、損失した第nフレームの復号の際に、第n−1フレームの音源信号をピッチ周期で繰り返し用いる場合について説明する。
本実施の形態に係る音声復号装置10は、第n−1フレームに、周期的に繰り返されることがない、すなわち、非周期的で、かつ、局所的に振幅が大きい波形(以下「非周期性パルス波形」という)が存在する区間(以下「非周期性パルス波形区間」という)がある場合、第n−1フレームのうち非周期性パルス波形区間の音源信号のみを雑音信号で置換して非周期性パルス波形を抑圧するものである。
図3において、LPC復号部11は、線形予測係数(LPC)の符号化データを復号して、復号した線形予測係数を出力する。
適応符号帳12は、過去の音源信号を蓄積しており、ピッチラグに基づいて選択した過去の音源信号をピッチゲイン乗算部13に出力するとともに、ピッチ情報を非周期性パルス波形検出部19に出力する。適応符号帳12が蓄積する過去の音源信号は、非周期性パルス波形抑圧部17での処理がなされた後の音源信号である。なお、適応符号帳12は、非周期性パルス波形抑圧部17での処理がなされる前の音源信号を蓄積してもよい。
雑音符号帳14は、適応符号帳12では表現しきれない雑音的な信号成分を表現するための信号(雑音信号)を生成して出力する。雑音符号帳14での雑音信号は、パルスの位置や振幅を代数的に表現されたものが用いられることが多い。雑音符号帳14は、パルスの位置や振幅に関するインデックス情報に基づき、パルスの位置や振幅を決定することで雑音信号を生成する。
ピッチゲイン乗算部13は、適応符号帳12から入力された音源信号にピッチゲインを乗じ、乗算結果を出力する。
コードゲイン乗算部15は、雑音符号帳14から入力された雑音信号にコードゲインを乗じ、乗算結果を出力する。
加算部16は、ピッチゲイン乗算後の音源信号とコードゲイン乗算後の雑音信号とを加算した音源信号を出力する。
非周期性パルス波形抑圧部17は、第n−1フレームのうち非周期性パルス波形区間にある音源信号を雑音信号で置換することにより非周期性パルス波形を抑圧する。非周期性パルス波形抑圧部17の詳細については後述する。
音源記憶部18は、非周期性パルス波形抑圧部17での処理がなされた後の音源信号を記憶している。
非周期性パルス波形検出部19は、非周期性パルス波形がビープ音等の聴覚的に違和感の強い復号音声の発生原因となるため、第nフレームの損失補償の際に第nフレームにおいてピッチ周期で繰り返し用いられることとなる第n−1フレームにおいて非周期性パルス波形区間を検出し、その区間を示す区間情報を出力する。この検出は、音源記憶部18に記憶された音源信号と、適応符号帳12から出力されるピッチ情報とを用いて行われる。非周期性パルス波形検出部19の詳細については後述する。
合成フィルタ20は、LPC復号部11によって復号された線形予測係数を用い、非周期性パルス波形抑圧部17からの第n−1フレームの音源信号を駆動音源として合成フィルタによる合成を行う。この合成により得られる信号が、音声復号装置10における第nフレームの復号音声信号となる。なお、この合成により得られる信号に対してポストフィルタリング処理を行ってもよい。この場合、ポストフィルタリング処理後の信号が、音声復号装置10の出力となる。
次いで、非周期性パルス波形検出部19の詳細について説明する。図4は、非周期性パルス波形検出部19の構成を示すブロック図である。
ここで、第n−1フレームの音源信号の自己相関値が大きい場合はその周期性が高く、損失した第nフレームも同様に周期性が高い音源信号が存在した区間(例えば、母音の区間)と考えられるため、第nフレームのフレーム損失補償には、第n−1フレームの音源信号をピッチ周期に従って繰り返し用いた方が良好な復号音声を得ることができる。一方、第n−1フレームの音源信号の自己相関値が小さい場合はその周期性が低く、第n−1フレームに非周期性パルス波形区間が存在する可能性があるため、第nフレームのフレーム損失補償に第n−1フレームの音源信号をピッチ周期に従って繰り返し用いると、ビープ音等、聴覚的に違和感の強い復号音声が発生してしまう。
そこで、非周期性パルス波形検出部19は、以下のようにして非周期性パルス波形区間を検出する。
自己相関値算出部191は、音源記憶部18からの第n−1フレームの音源信号と、適応符号帳12からのピッチ情報とから、第n−1フレームの音源信号におけるピッチ周期での自己相関値を、第n−1フレームの音源信号の周期性の度合いを示す値として算出する。つまり、自己相関値が大きいほど周期性が高く、自己相関値が小さいほど周期性が低いことを示す。
自己相関値算出部191は、式(1)〜(3)に従って自己相関値を算出する。式(1
)〜(3)において、exc[ ]は第n−1フレームの音源信号、PITMAXは音声復号装置10がとり得るピッチ周期の最大値、T0はピッチ周期長(ピッチラグ)、exccorrは自己相関値候補、excpowはピッチ周期パワー、exccorrmaxは自己相関値候補中の最大値(最大自己相関値)、定数τは最大自己相関値の探索範囲を表す。自己相関値算出部191は、式(3)により示される最大自己相関値を判定部193に出力する。
Figure 0005142727
Figure 0005142727
Figure 0005142727
一方、最大値検出部192は、音源記憶部18からの第n−1フレームの音源信号と、適応符号帳12からのピッチ情報とから、ピッチ周期内の音源振幅の第1最大値を式(4),(5)に従って検出する。式(4)に示すexcmax1は音源振幅の第1最大値である。また、式(5)に示すexcmax1posは第1最大値の時のjの値であり、第n−1フレーム内での第1最大値の時間軸上の位置を表す。
Figure 0005142727
Figure 0005142727
また、最大値検出部192は、ピッチ周期内で第1最大値の次に大きい音源振幅の第2最大値を検出する。最大値検出部192は、第1最大値を検出対象から除外した上で、第1最大値同様、式(4),(5)に従った検出を行えば、音源振幅の第2最大値(excmax2)および第n−1フレーム内での第2最大値の時間軸上の位置(excmax2pos)を検出することができる。なお、第2最大値を検出する際には、その検出精度を高めるために、第1最大値の周辺(例えば、第1最大値の前後2サンプル)も検出対象から除外するとさらによい。
そして、最大値検出部192での検出結果が判定部193に出力される。
判定部193は、まず、自己相関値算出部191で得られた最大自己相関値が閾値ε以上か否か判定する。つまり、判定部193は、第n−1フレームの音源信号の周期性の度合いが閾値以上か否か判定する。
そして、判定部193は、最大自己相関値が閾値ε以上であれば、第n−1フレームには非周期性パルス波形区間が存在しないと判定し、以降の処理を中止する。一方、最大自己相関値が閾値ε未満であれば、第n−1フレームに非周期性パルス波形区間が存在する
可能性があるため、判定部193は、以降の処理を継続して行う。
すなわち、判定部193は、最大自己相関値が閾値ε未満であれば、さらに、音源振幅の第1最大値と第2最大値との差(第1最大値−第2最大値)または比(第1最大値/第2最大値)が閾値η以上か否か判定する。非周期性パルス波形区間では音源信号の振幅が局所的に大きくなっていると考えられるため、判定部193は、その差または比が閾値η以上であれば、その第1最大値の位置が含まれる区間を非周期性パルス波形区間Λとして検出し、区間情報を非周期性パルス波形抑圧部17に出力する。ここでは、第1最大値の位置を中心にした対象な区間(第1最大値の位置を中心に両側各々0〜3サンプル程度が適当)を非周期性パルス波形区間Λとする。なお、非周期性パルス波形区間Λを必ずしも第1最大値の位置を中心にした対象な区間とする必要はなく、例えば、第1最大値に後続するサンプルをより多く含めて非対称な区間としてもよい。また、第1最大値を中心として音源振幅が連続して閾値以上である区間を非周期性パルス波形区間Λとし、非周期性パルス波形区間Λを可変としてもよい。
次いで、非周期性パルス波形抑圧部17の詳細について説明する。図5は、非周期性パルス波形抑圧部17の構成を示すブロック図である。非周期性パルス波形抑圧部17は、以下のようにして、第n−1フレーム中の非周期性パルス波形区間においてのみ非周期性パルス波形を抑圧する。
図5において、パワー算出部171は、第n−1フレームの音源信号の1サンプルあたりの平均パワーPavgを式(6)に従って算出し、調整係数算出部174に出力する。このとき、パワー算出部171は、非周期性パルス波形検出部19からの区間情報に従って、第n−1フレーム中、非周期性パルス波形区間にある音源信号を除外して平均パワーを算出する。式(6)において、excavg[ ]はexc[ ]における非周期性パルス波形区間内の振幅をすべて0にしたものである。
Figure 0005142727
雑音信号生成部172は、ランダム雑音信号を生成して、パワー算出部173および乗算部175に出力する。生成したランダム雑音信号にピーク波形が含まれるのは好ましくないため、雑音信号生成部172は、ランダムな範囲を制限してもよく、また、生成後のランダム雑音信号に対してクリッピング処理等を施してもよい。
パワー算出部173は、ランダム雑音信号の1サンプルあたりの平均パワーRavgを式(7)に従って算出し、調整係数算出部174に出力する。式(7)において、randはランダム雑音信号系列を表し、フレーム単位(またはサブフレーム単位)で更新される。
Figure 0005142727
調整係数算出部174は、ランダム雑音信号の振幅を調整するための係数(振幅調整係
数)βを式(8)に従って算出し、乗算部175に出力する。
Figure 0005142727
乗算部175は、式(9)に示すように、ランダム雑音信号に振幅調整係数βを乗算する。この乗算により、ランダム雑音信号の振幅が、第n−1フレーム中の非周期性パルス波形区間以外の音源信号の振幅と同等に調整される。乗算部175は、振幅調整後のランダム雑音信号aftrandを置換部176に出力する。
Figure 0005142727
置換部176は、非周期性パルス波形検出部19からの区間情報に従って、図6に示すように、第n−1フレーム中の音源信号のうち、非周期性パルス波形区間にある音源信号のみを振幅調整後のランダム雑音信号に置き換えて出力する。置換部176は、第n−1フレーム中の非周期性パルス波形区間以外の音源信号はそのまま出力する。この置換部176の動作を式によって示すと式(10)のようになる。式(10)において、aftexcが置換部176から出力される音源信号となる。また、図7に、式(10)で表される置換部176の動作を図示する。
Figure 0005142727
このように、本実施の形態では、第n−1フレーム中で非周期性パルス波形区間にある音源信号のみを振幅調整後のランダム雑音信号に置き換えるため、第n−1フレームの音源信号の特性をほぼ維持したまま、非周期性パルス波形のみを抑圧することができる。よって、本実施の形態によれば、第n−1フレームを用いて第nフレームのフレーム損失補償を行う場合に、フレーム損失補償に非周期性パルス波形が繰り返し用いられることで発生するビープ音等の聴覚的に違和感の強い復号音声の発生を抑えつつ、第n−1フレームと第nフレームとの間で復号音声のパワーの連続性を保つことができ、音質の変化や音切れ感が少ない復号音声を得ることができる。また、本実施の形態では、第n−1フレーム全体をランダム雑音信号で置き換えることはせず、第n−1フレーム中で非周期性パルス波形区間においてのみ音源信号をランダム雑音信号に置き換える。よって、本実施の形態によれば、第n−1フレームを用いて第nフレームのフレーム損失補償を行う場合に、聴覚的に自然で、かつ、ノイズが目立たない復号音声を得ることができる。
なお、第n−1フレームの音源信号に代えて、第n−1フレームの復号音声を用いて非周期性パルス波形区間を検出することも可能である。
また、連続して損失したフレームの数が多くなるほど閾値εおよびηを小さくして、非周期性パルス波形が検出されやすくするようにしてもよい。また、連続して損失したフレームの数が多くなるほど非周期性パルス波形区間の長さを長くして、データ損失時間が長くなるほど音源信号をより白色化させるようにしてもよい。
また、置換に用いる信号として、ランダム雑音信号の他、第n−1フレームの非周期性パルス波形区間以外での周波数特性を持つように生成された信号等の有色雑音、第n−1フレームの無音区間における定常な区間の音源信号、ガウス雑音等を用いてもよい。
また、上記説明では、第n−1フレームの非周期性パルス波形をランダム雑音信号に置換した上で、損失した第nフレームの復号の際に、第n−1フレームの音源信号をピッチ周期で繰り返し用いる構成について説明したが、非周期性パルス波形区間以外からランダムに音源信号を取り出して使用する構成としてもよい。
また、平均振幅や平滑化した信号パワーから振幅の上限閾値を算出し、その上限閾値を越える区間またはその周辺区間にある音源信号をランダム雑音信号により置換してもよい。
また、音声符号化装置において、非周期性パルス波形区間を検出し、その区間情報を音声復号装置に伝送してもよい。このようにすることで、音声復号装置では、より正確な非周期性パルス波形区間を得ることができ、フレーム損失補償の性能をさらに高めることができる。
(実施の形態2)
本実施の形態に係る音声復号装置は、第n−1フレームの非周期性パルス波形区間以外の音源信号に対し位相をランダムにする処理(位相ランダマイズ)を施すものである。
本実施の形態に係る音声復号装置では、非周期性パルス波形抑圧部17の動作のみが実施の形態1と相違するため、その相違点についてのみ、以下説明する。
非周期性パルス波形抑圧部17は、まず、第n−1フレームにおいて非周期性パルス波形区間以外の音源信号に対して周波数領域への変換を行う。
ここで非周期性パルス波形区間にある音源信号を除外するのは、以下の理由による。すなわち、非周期性パルス波形は破裂性子音のように高域に偏った周波数特性を示し、その周波数特性は非周期性パルス波形区間以外での周波数特性とは異なると考えられるため、非周期性パルス波形区間以外の音源信号を用いてフレーム損失補償を行った方がより聴覚的に自然な復号音声を得ることができるからである。
次いで、フレーム損失補償に非周期性パルス波形を繰り返し用いることを防ぐため、非周期性パルス波形抑圧部17は、周波数領域に変換後の音源信号に対し位相ランダマイズを行う。
次いで、非周期性パルス波形抑圧部17は、位相ランダマイズ後の音源信号を時間領域に逆変換する。
そして、非周期性パルス波形抑圧部17は、逆変換後の音源信号の振幅を第n−1フレーム中の非周期性パルス波形区間以外の音源信号の振幅と同等に調整する。
このようにして得られた第n−1フレームの音源信号は、実施の形態1同様、第n−1フレームの音源信号の特性をほぼ維持したまま、非周期性パルス波形のみが抑圧された信号となる。よって、本実施の形態によれば、実施の形態1同様、第n−1フレームを用いて第nフレームのフレーム損失補償を行う場合に、フレーム損失補償に非周期性パルス波形が繰り返し用いられることで発生するビープ音等の聴覚的に違和感の強い復号音声の発生を抑えつつ、第n−1フレームと第nフレームとの間で復号音声のパワーの連続性を保
つことができ、音質の変化や音切れ感が少ない復号音声を得ることができる。
このように、本実施の形態によっても、第n−1フレームを用いて第nフレームのフレーム損失補償を行う場合に、聴覚的に自然で、かつ、ノイズが目立たない復号音声を得ることができる。
なお、第n−1フレームの音源信号の極性は維持したまま、振幅だけをランダムにする方法でも、第n−1フレームの音源信号の周波数的特徴を第nフレームに反映させることができる。
以上、本発明の実施の形態について説明した。
なお、非周期性パルス波形の抑圧方法として、非周期性パルス波形区間にある音源信号をそれ以外の区間にある音源信号よりも強く抑圧する方法を用いることもできる。
また、伝送単位として1フレームまたは複数フレームで構成されるパケットが用いられるネットワーク(例えば、IPネットワーク等)に本発明を適用する場合には、上記各実施の形態における「フレーム」を「パケット」と読み替えればよい。
また、上記説明では第n−1フレームを用いて第nフレームの損失を補償する場合を例にとって説明したが、第nフレームより前に受信されたフレームを用いて第nフレームの損失を補償する音声復号のすべてにおいて上記同様にして本発明を実施することができる。
また、上記各実施の形態に係る音声復号装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することにより、上記同様の作用、効果を有する無線通信移動局装置、無線通信基地局装置、および移動体通信システムを提供することができる。
また、上記説明では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明をソフトウェアで実現することも可能である。例えば、本発明に係る音声復号方法のアルゴリズムをプログラミング言語によって記述し、このプログラムをメモリに記憶しておいて情報処理手段によって実行させることにより、本発明に係る音声復号装置と同様の機能を実現することができる。
また、上記各実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部または全てを含むように1チップ化されても良い。
また、ここではLSIとしたが、集積度の違いによって、IC、システムLSI、スーパーLSI、ウルトラLSI等と呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路または汎用プロセッサで実現しても良い。LSI製造後に、プログラム化することが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続もしくは設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらに、半導体技術の進歩または派生する別技術により、LSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行っても良い。バイオ技術への適用等が可能性としてあり得る。
2005年12月27日出願の特願2005−375401の日本出願に含まれる明細書、図面および要約書の開示内容は、すべて本願に援用される。
本発明に係る音声復号装置および音声復号方法は、移動体通信システムにおける無線通信移動局装置や無線通信基地局装置等の用途に適用することができる。
従来の音声復号装置の動作説明図 従来の音声復号装置の動作説明図 実施の形態1に係る音声復号装置の構成を示すブロック図 実施の形態1に係る非周期性パルス波形検出部の構成を示すブロック図 実施の形態1に係る非周期性パルス波形抑圧部の構成を示すブロック図 実施の形態1に係る音声復号装置の動作説明図 実施の形態1に係る置換部の動作説明図

Claims (5)

  1. 過去の音源信号を蓄積する蓄積手段と、
    ピッチラグに基づいて選択した過去の音源信号を出力する適応符号帳と、
    雑音信号を出力する雑音符号帳と、
    前記適応符号帳から出力された音源信号と前記雑音符号帳から出力された雑音信号とを加算する加算手段と、
    第nフレーム(nは自然数)が消失した場合に、第n−1フレームの音源信号とピッチ情報を用いて、前記第n−1フレームの音源信号において非周期性パルス波形が存在する区間を検出する検出手段と、
    前記加算手段から出力された第n−1フレームの信号の前記非周期性パルス波形が存在する区間において、前記非周期性パルス波形を抑圧する抑圧手段と、
    前記非周期性パルス波形が抑圧された前記第n−1フレームの信号に対して合成フィルタによる合成を行って前記第nフレームの復号音声を得る合成手段と、
    を具備する音声復号装置。
  2. 前記検出手段は、前記第n−1フレームにおいて、音源信号の最大自己相関値が閾値未満であり、かつ、音源振幅の第1最大値と第2最大値との差または比が閾値以上である場合に、前記第1最大値が存在する区間を前記非周期性パルス波形が存在する区間として検出する、
    請求項1記載の音声復号装置。
  3. 前記抑圧手段は、前記第n−1フレームにおいて、前記非周期性パルス波形を雑音信号で置換して前記非周期性パルス波形を抑圧する、
    請求項1記載の音声復号装置。
  4. 前記抑圧手段は、前記第n−1フレームにおいて、前記非周期性パルス波形が存在する区間以外にある音源信号の位相をランダムにして前記非周期性パルス波形を抑圧する、
    請求項1記載の音声復号装置。
  5. ピッチラグに基づいて選択された過去の音源信号と雑音信号とを加算する加算工程と、
    第nフレーム(nは自然数)が消失した場合に、第n−1フレームの音源信号とピッチ情報を用いて、前記第n−1フレームの音源信号において非周期性パルス波形が存在する区間を検出する検出工程と、
    前記加算工程で生成された第n−1フレームの信号の前記非周期性パルス波形が存在する区間において、前記非周期性パルス波形を抑圧する抑圧工程と、
    前記非周期性パルス波形が抑圧された前記第n−1フレームの信号に対して合成フィルタによる合成を行って前記第nフレームの復号音声を得る合成工程と、
    を具備する音声復号方法。
JP2007552944A 2005-12-27 2006-12-26 音声復号装置および音声復号方法 Expired - Fee Related JP5142727B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007552944A JP5142727B2 (ja) 2005-12-27 2006-12-26 音声復号装置および音声復号方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005375401 2005-12-27
JP2005375401 2005-12-27
PCT/JP2006/325966 WO2007077841A1 (ja) 2005-12-27 2006-12-26 音声復号装置および音声復号方法
JP2007552944A JP5142727B2 (ja) 2005-12-27 2006-12-26 音声復号装置および音声復号方法

Publications (2)

Publication Number Publication Date
JPWO2007077841A1 JPWO2007077841A1 (ja) 2009-06-11
JP5142727B2 true JP5142727B2 (ja) 2013-02-13

Family

ID=38228194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007552944A Expired - Fee Related JP5142727B2 (ja) 2005-12-27 2006-12-26 音声復号装置および音声復号方法

Country Status (3)

Country Link
US (1) US8160874B2 (ja)
JP (1) JP5142727B2 (ja)
WO (1) WO2007077841A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5664291B2 (ja) * 2011-02-01 2015-02-04 沖電気工業株式会社 音声品質観測装置、方法及びプログラム
CN102446509B (zh) * 2011-11-22 2014-04-09 中兴通讯股份有限公司 增强抗丢包的音频编解码方法及系统
CN104380377B (zh) * 2012-06-14 2017-06-06 瑞典爱立信有限公司 用于可缩放低复杂度编码/解码的方法和装置
KR101854815B1 (ko) * 2012-10-10 2018-05-04 광주과학기술원 분광장치 및 분광방법
PL3584791T3 (pl) * 2012-11-05 2024-03-18 Panasonic Holdings Corporation Urządzenie do kodowania mowy/dźwięku oraz sposób kodowania mowy/dźwięku

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04264597A (ja) * 1991-02-20 1992-09-21 Fujitsu Ltd 音声符号化装置および音声復号装置
JPH10222196A (ja) * 1997-02-03 1998-08-21 Gotai Handotai Kofun Yugenkoshi 音声符号化における波形利得見積方法
JP2000267700A (ja) * 1999-03-17 2000-09-29 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP2001051698A (ja) * 1999-08-06 2001-02-23 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
WO2002071389A1 (fr) * 2001-03-06 2002-09-12 Ntt Docomo, Inc. Procede et dispositif d'interpolation de donnees sonores, procede et dispositif de creation d'informations relatives aux donnees sonores, procede et dispositif de transmission des informations d'interpolation des donnees sonores, et programme et support d'enregistrement correspondants
JP2004020676A (ja) * 2002-06-13 2004-01-22 Hitachi Kokusai Electric Inc 音声符号化/復号化方法及び音声符号化/復号化装置

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE503547C2 (sv) * 1993-06-11 1996-07-01 Ericsson Telefon Ab L M Anordning och förfarande för döljande av förlorade ramar
SE501340C2 (sv) * 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
SE502244C2 (sv) * 1993-06-11 1995-09-25 Ericsson Telefon Ab L M Sätt och anordning för avkodning av ljudsignaler i ett system för mobilradiokommunikation
US5574825A (en) * 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
US5615298A (en) * 1994-03-14 1997-03-25 Lucent Technologies Inc. Excitation signal synthesis during frame erasure or packet loss
US5550543A (en) * 1994-10-14 1996-08-27 Lucent Technologies Inc. Frame erasure or packet loss compensation method
JP2647034B2 (ja) * 1994-11-28 1997-08-27 日本電気株式会社 電荷結合素子の製造方法
US5732389A (en) * 1995-06-07 1998-03-24 Lucent Technologies Inc. Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures
JPH1091194A (ja) 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
EP0899720B1 (en) 1997-08-28 2004-12-15 Texas Instruments Inc. Quantization of linear prediction coefficients
US6889185B1 (en) * 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6810377B1 (en) * 1998-06-19 2004-10-26 Comsat Corporation Lost frame recovery techniques for parametric, LPC-based speech coding systems
US6377915B1 (en) * 1999-03-17 2002-04-23 Yrp Advanced Mobile Communication Systems Research Laboratories Co., Ltd. Speech decoding using mix ratio table
US6678267B1 (en) * 1999-08-10 2004-01-13 Texas Instruments Incorporated Wireless telephone with excitation reconstruction of lost packet
US6775649B1 (en) * 1999-09-01 2004-08-10 Texas Instruments Incorporated Concealment of frame erasures for speech transmission and storage system and method
US6826527B1 (en) * 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6968309B1 (en) * 2000-10-31 2005-11-22 Nokia Mobile Phones Ltd. Method and system for speech frame error concealment in speech decoding
JP3472279B2 (ja) 2001-06-04 2003-12-02 パナソニック モバイルコミュニケーションズ株式会社 音声符号化パラメータ符号化方法及び装置
US7711563B2 (en) * 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
US7308406B2 (en) * 2001-08-17 2007-12-11 Broadcom Corporation Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform
US7379865B2 (en) * 2001-10-26 2008-05-27 At&T Corp. System and methods for concealing errors in data transmission
DE60230666D1 (de) * 2001-11-29 2009-02-12 Panasonic Corp Verfahren zur beseitigung von kodierungsverzerrung und verfahren zur videokodierung und -dekodierung
KR100929078B1 (ko) * 2001-11-29 2009-11-30 파나소닉 주식회사 코딩 왜곡 제거 방법
US7302385B2 (en) * 2003-07-07 2007-11-27 Electronics And Telecommunications Research Institute Speech restoration system and method for concealing packet losses
US7324937B2 (en) * 2003-10-24 2008-01-29 Broadcom Corporation Method for packet loss and/or frame erasure concealment in a voice communication system
WO2006025313A1 (ja) * 2004-08-31 2006-03-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
JP4732730B2 (ja) * 2004-09-30 2011-07-27 パナソニック株式会社 音声復号装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04264597A (ja) * 1991-02-20 1992-09-21 Fujitsu Ltd 音声符号化装置および音声復号装置
JPH10222196A (ja) * 1997-02-03 1998-08-21 Gotai Handotai Kofun Yugenkoshi 音声符号化における波形利得見積方法
JP2000267700A (ja) * 1999-03-17 2000-09-29 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
JP2001051698A (ja) * 1999-08-06 2001-02-23 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化復号方法および装置
WO2002071389A1 (fr) * 2001-03-06 2002-09-12 Ntt Docomo, Inc. Procede et dispositif d'interpolation de donnees sonores, procede et dispositif de creation d'informations relatives aux donnees sonores, procede et dispositif de transmission des informations d'interpolation des donnees sonores, et programme et support d'enregistrement correspondants
JP2004020676A (ja) * 2002-06-13 2004-01-22 Hitachi Kokusai Electric Inc 音声符号化/復号化方法及び音声符号化/復号化装置

Also Published As

Publication number Publication date
JPWO2007077841A1 (ja) 2009-06-11
WO2007077841A1 (ja) 2007-07-12
US20090234653A1 (en) 2009-09-17
US8160874B2 (en) 2012-04-17

Similar Documents

Publication Publication Date Title
KR100391527B1 (ko) 음성 부호화 장치, 기록 매체, 음성 복호화 장치, 신호 처리용 프로세서, 음성 부호화 복호화 시스템, 통신용 기지국, 통신용 단말 및 무선 통신 시스템
EP2176860B1 (en) Processing of frames of an audio signal
US7664650B2 (en) Speech speed converting device and speech speed converting method
EP1775717B1 (en) Speech decoding apparatus and compensation frame generation method
US7831420B2 (en) Voice modifier for speech processing systems
JP4846712B2 (ja) スケーラブル復号化装置およびスケーラブル復号化方法
KR100488080B1 (ko) 멀티모드 음성 인코더
EP3352169B1 (en) Unvoiced decision for speech processing
ES2656022T3 (es) Detección y codificación de altura tonal muy débil
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
JP2010286853A (ja) 合成による分析celp型音声符号化のための適応型ウィンドウ
JPWO2007052612A1 (ja) ステレオ符号化装置およびステレオ信号予測方法
CN101180676A (zh) 用于谱包络表示的向量量化的方法和设备
US20100169082A1 (en) Enhancing Receiver Intelligibility in Voice Communication Devices
JP5142727B2 (ja) 音声復号装置および音声復号方法
KR20040042903A (ko) 일반화된 분석에 의한 합성 스피치 코딩 방법 및 그방법을 구현하는 코더
EP2951824B1 (en) Adaptive high-pass post-filter
JPH1097294A (ja) 音声符号化装置
JPWO2007037359A1 (ja) 音声符号化装置および音声符号化方法
WO2010098130A1 (ja) トーン判定装置およびトーン判定方法
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
JP3785363B2 (ja) 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法
JP2992998B2 (ja) 音声符号化復号化装置
JP5511839B2 (ja) トーン判定装置およびトーン判定方法
JPH02160300A (ja) 音声符号化方式

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121030

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121120

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151130

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5142727

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees