JP4437052B2 - 音声復号化装置および音声復号化方法 - Google Patents

音声復号化装置および音声復号化方法 Download PDF

Info

Publication number
JP4437052B2
JP4437052B2 JP2004125943A JP2004125943A JP4437052B2 JP 4437052 B2 JP4437052 B2 JP 4437052B2 JP 2004125943 A JP2004125943 A JP 2004125943A JP 2004125943 A JP2004125943 A JP 2004125943A JP 4437052 B2 JP4437052 B2 JP 4437052B2
Authority
JP
Japan
Prior art keywords
frame
decoding
speech
signal
compensation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004125943A
Other languages
English (en)
Other versions
JP2005309096A (ja
Inventor
宏幸 江原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2004125943A priority Critical patent/JP4437052B2/ja
Publication of JP2005309096A publication Critical patent/JP2005309096A/ja
Application granted granted Critical
Publication of JP4437052B2 publication Critical patent/JP4437052B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

本発明は、CELP方式の音声復号化装置および音声復号化方法に関する。
インターネット通信に代表されるパケット通信においては、音声データをのせたパケットが伝送路において消失する等により受信側の復号化装置で符号化情報を復号できない場合、このパケット消失を受信装置のユーザに知覚させにくくするために、パケット消失の隠蔽(補償)処理を行うことが一般的である(例えば、特許文献1参照)。
特許文献1に開示された隠蔽処理は、ITU−T勧告G.729に則っており、主として、合成フィルタ係数を繰り返し使用する処理、ピッチ利得と固定符号帳利得とを徐々に減衰させる処理、固定符号帳利得予測器の内部状態を徐々に減衰させる処理、および、消失したフレームの直前の正常なフレームにおける有声/無声のモード判定結果に基づき、適応符号帳か固定符号帳かどちらか一方のみを用いて音源信号を生成する処理からなる。この隠蔽処理の特徴の一つは、ポストフィルタで行われるピッチ分析結果を用いて、ピッチ予測利得の大小で有声モード/無声モードを判別し、有声モードの場合は適応符号帳のみを用いて隠蔽処理(音源生成)を行い、無声モードの場合は固定符号帳のみを用いて隠蔽処理(音源生成)を行うことである。より詳細には、消失フレーム直前の正常フレームが有声音であるか無声音であるかを判別し、この判別結果を消失フレームにも適用し、例えば、正常フレームが有声音であれば、消失フレームも有声音であると仮定して、有声音に適した隠蔽処理をこの消失フレームに対し施す。
このように、音声フレームの有声/無声のモード判定結果に応じて、使用する符号帳を切り替えることによって、音声フレームの有声部の隠蔽処理において雑音感が生じるのを回避することができ、また、音声フレームの無声部の隠蔽処理において不要な周期性を生成することを防止できる。
また、送信装置側が複数種類の補償処理機能を有し、送信前のフレームについて(これらが伝送中に損失するものと仮定して)全種類の補償処理を行い、最も補償結果の良かった補償処理方法を受信装置に通知するものもある(例えば、特許文献2参照)。
特開平9−120298号公報 特開2002−162998号公報
しかしながら、特許文献1で開示された隠蔽処理においては、例えば、送信側の各音声フレームが、図8(a)に示すように「… -無声-無声-立ち上がり-有声-有声-有声- …」というシーケンスになっていて、これらのフレームの伝送中に「立ち上がり」フレーム(無声から有声への切り替わりフレーム)が消失した場合には、受信側の隠蔽処理は、図8(b)に示すように行われる。すなわち、復号処理P2は、符号化パラメータF(n−1)から復号音声S(n−1)を生成し、この処理の過程で得られるいくつかのパラメータS2を隠蔽処理P3に受け渡す。隠蔽処理P3は、直前の復号処理P2で得られた(復号音声の合成に用いられた)パラメータS2を用いて復号音声S(n)を生成する。換言すると、消失フレームの隠蔽処理は、この消失フレーム直前の「無声」フレームの復号処理で得られるパラメータに基づいて行われるため、無声的(雑音的)信号を生成することになる。
また、適応符号帳を用いるCELP方式では、過去に生成(復号)した音源信号を適応符号帳に記憶しておいて、この符号帳に記憶された音源信号を用いて現在の入力信号に対する音源信号を表すモデルを用いるので、図8(b)に示すような消失フレーム直後の「有声」フレームでは、消失フレームにおいて生成された無声的(雑音的)な音源信号を記憶している適応符号帳S3を用いて復号処理P4が行われることになる。そのため、消失フレーム直後の「有声」フレームでは、復号される信号が雑音的になり主観品質が大きく劣化するという問題がある。また、CELP方式の音声復号化処理では、適応符号帳に記憶された音源信号を再帰的に用いるため、さらに後続の正常フレームの復号信号も雑音的になることが多い。即ち、復号処理P4によって生成された雑音的な音源信号は再び適応符号帳に記憶されて次のフレームでの復号処理P5に用いられるため(復号処理P6についても同様)、後続の「有声」フレームに雑音的信号の影響が伝播する(有声信号が雑音的になってつぶれてしまう)問題がある。
例えば、特許文献2に開示された方法を用いれば、かかる問題は発生しないが、この方法では、送信装置における処理が増大し、また、補償処理方法の通知に通信システムのシステムリソースを消費するという問題がある。
本発明は、かかる点に鑑みてなされたものであり、音声モードの切り替わりにおいて音声フレームを消失した場合に、消失フレーム以降の音声フレームにおける主観品質の劣化を軽減することができ、また、送信装置の処理を増大させず、通信システムのリソース消費が増加しない音声復号化装置および音声復号化方法を提供することを目的とする。
本発明の音声復号化装置は、入力された音声フレームの音声モードを判定する第1の判定手段と、前記音声フレームが正常フレームであるか消失フレームであるかを判定する第2の判定手段と、正常フレームに対しCELP方式の復号化を施す復号化手段と、消失フレームにおいて、雑音的信号から有声的信号への音声モードの切り替わりがあるか否かを、前記第1および第2の判定手段の判定結果に基づいて検出する検出手段と、消失フレームにおける前記音声モードの切り替わりが検出された場合、前記復号化手段で使用される適応符号帳の内容を一部または全部リセットするリセット手段と、を具備し、前記復号化手段は、リセット後の前記適応符号帳を用いて、音声モードの切り替わりが検出された消失フレームの後の正常フレームの復号化を行う構成を採る。
この構成によれば、消失フレーム以降の音声フレームにおける主観品質の劣化を軽減することができる。
本発明の音声復号化装置は、上記の構成において、消失フレームの前の正常フレームに基づいて、この消失フレームの補償フレームを生成する第1の補償手段と、前記第1の補償手段によって生成された補償フレームに基づいて、前記消失フレームの後の正常フレームの補償フレームを生成する第2の補償手段と、を具備し、前記復号化手段は、リセット後の適応符号帳を用いて生成される音声フレームと、前記第2の補償手段によって生成される補償フレームと、の双方を用いて、前記消失フレームの後の正常フレームの復号化フレームを生成する構成を採る。
本発明の音声復号化装置は、上記の構成において、前記復号化手段は、リセット後の適応符号帳を用いて生成される前記音声フレームの後半に重み付けする第1の重み付け手段と、前記第2の補償手段によって生成される補償フレームの前半に重み付けする第2の重み付け手段と、後半に重み付けがされた前記音声フレームと前半に重み付けがされた前記補償フレームとを加算して、前記復号化フレームを生成する加算手段と、を具備する構成を採る。
これらの構成によれば、消失フレーム後の音声フレームに及ぼす雑音的信号の影響を最低限に抑えることができる。
本発明の通信端末装置は、上記いずれかに記載の音声復号化装置を具備する構成を採る。
この構成によれば、上記と同様の作用効果を有する通信端末装置を提供することができる。
本発明の音声復号化方法は、雑音的信号を生成するフレーム消失隠蔽処理がされた後の有声定常フレームに対し、前記雑音的信号がバッファリングされている適応符号帳の内容の一部または全部をリセットしてから、この有声定常フレームの復号化を行うようにした。
この方法によれば、消失フレーム以降の音声フレームにおける主観品質の劣化を軽減することができる。
以上説明したように、本発明によれば、音声フレーム、音声パケット等の音声データを消失した以降の音声データの主観品質の劣化を軽減することができる。また、本発明によれば、送信装置の処理は増大せず、通信システムのリソース消費も増加しない(通信に必要なビットレートの増加もない)。
以下、本発明の実施の形態について、添付図面を参照して詳細に説明する。なお、ここでは、符号化/復号化の対象が、音声信号である場合を例にとって説明する。
(実施の形態1)
図1は、本発明の実施の形態1に係る音声復号化装置の主要な構成を示すブロック図である。
本実施の形態に係る音声復号化装置は、パケット分離部101と、隠蔽パラメータ生成部102と、復号化処理部103と、フレームクラス分類部104と、復号化処理判定部105と、を備える。
本実施の形態に係る音声復号化装置の各部は、以下の動作を行う。
パケット分離部101は、入力された復号対象の符号化パケットを音声符号化情報とフレーム消失情報との2つの情報に分離し、この2つの情報を復号化処理部103へ出力する。また、パケット分離部101は、フレーム消失情報を隠蔽パラメータ生成部102および復号化処理判定部105の双方へ出力する。ここで、音声符号化情報とは、送信側の音声符号化装置(図示せず)から出力される符号化ビットストリームのことである。また、フレーム消失情報とは、復号対象の符号化フレームが消失フレームであるか否かを示す情報のことである。例えば、符号化パケットが消失された場合には、このパケットが含むフレームの全てが消失フレームに該当する。
隠蔽パラメータ生成部102は、パケット分離部101から出力されたフレーム消失情報に従い、復号対象のフレームが消失フレームである場合、フレームクラス情報(音声モードを示す情報)をフレームクラス分類部104から取得し、フレームクラスに応じた隠蔽処理を行なう。隠蔽処理によって生成されたパラメータは復号化処理部103へ出力される。なお、隠蔽処理は復号化処理部103によって過去に復号されたパラメータを用いて行なわれ、過去に復号したパラメータとしては、ピッチラグ、ピッチゲイン、固定符号帳ゲイン、スペクトルパラメータ(線形予測係数、線スペクトル対等)、復号信号の零交差率、復号信号のエネルギ等が挙げられるが、これらのパラメータに限定されるものではない。また、隠蔽処理の方法についても上記に限定されず、過去の復号によって得られた情報を用いて隠蔽処理を行うものであればどのようなものであっても良い。
復号化処理部103は、パケット分離部101から出力されたフレーム消失情報に従って、符号化フレームが正常な場合(消失フレームでない場合)は、パケット分離部101から出力された符号化情報の復号処理を行って復号音声信号を音声復号化装置の外部へ出力すると共に、復号処理によって得られる復号情報をフレームクラス分類部104へ出力する。なお、この出力される復号情報は、得られる復号情報の一部だけであっても良い。この復号化処理を以下「復号化処理A」と呼ぶこととする。
一方、符号化フレームが消失フレームである場合は、復号化処理部103は、過去に復号した情報を隠蔽パラメータ生成部102へ出力する(復号化処理部103は、フレーム消失隠蔽処理に用いる各種パラメータを記憶するためのバッファを備えていて、その情報を出力する)。隠蔽パラメータ生成部102は、入力された過去の復号化情報を用いて隠蔽処理用パラメータを生成して復号化処理部103へ出力する。復号化処理部103は、隠蔽処理用パラメータを隠蔽パラメータ生成部102から取得し、復号化処理を行い、復号音声信号を出力する。この復号化処理(隠蔽処理)を以下「復号化処理B」と呼ぶこととする。符号化フレームが消失フレームである場合、復号化処理部103からフレームクラス分類部104へは、パケット分離部101から入力されたフレーム消失情報のみが出力される。すなわち、正常フレームでは復号化処理Aで得られる復号化情報を用いてフレームクラス分類処理が行なわれるが、消失フレームでは先にフレームクラス分類処理が行われてから復号化処理Bが行なわれるためである(フレームクラス分類処理は、実質的には直前フレームのフレームクラス情報を繰り返し的に使用する)。
ただし、符号化フレームが正常であっても(消失フレームでない場合であっても)、1つ前に復号したフレームが消失フレームであった場合は、復号化処理部103は、上記いずれの処理とも異なる処理を行う場合がある。この処理(以下「復号化処理C」と呼ぶこととする)については、後ほど詳細に説明する。
フレームクラス分類部104は、現フレームが正常な場合(消失フレームでない場合)、復号化処理部103から出力された各種復号情報(復号ピッチラグ、復号ピッチゲイン、復号固定符号帳ゲイン、復号線形予測係数、復号線スペクトル対、復号信号の零交差率、復号信号のエネルギ等)に基づいて、復号対象の符号化フレームのクラス分類を行い、分類結果(フレームクラス)を復号化処理判定部105および隠蔽パラメータ生成部102にそれぞれ出力する。一方、現フレームが消失フレームである場合、フレームクラス分類部104は、直前の正常フレームにおけるクラス分類結果を現フレームのクラス分類結果として繰り返し用いる。なお、消失フレームが連続する場合は、フレームクラス番号を徐々に下げる(雑音的な方向へ変えていく)ようにしても良い。
復号化処理判定部105は、フレームクラス分類部104から出力されたフレームクラス情報と、パケット分離部101から出力されたフレーム消失情報とに従い、復号する現フレームが正常フレームで、かつ直前に復号したフレームが消失フレームであった場合に、現フレームのフレームクラスと、過去のフレームのフレームクラス情報とに基づいて、現フレームに対し行うべき復号化処理方法を判定し、判定によって選択された復号化処理方法を復号化処理部103へ通知する。
図2は、フレームクラス分類部104において使用されるフレームクラス分類の一例を示した表である。
フレームクラス分類部104において、各符号化フレームは、有声性の度合いに応じて複数のフレームクラスに分類される。なお、ここでは、各符号化フレームが3つのフレームクラス(0、1、2)に分類される場合を例にとって説明しており、また、フレームクラス分類に使用されるアルゴリズムはどのようなものであっても良い。
図3は、復号化処理判定部105の内部構成を詳しく示したブロック図である。この復号化処理判定部105は、保持部121と、フレームクラス切り替わり判定部122と、復号化処理選択部123と、を備える。
保持部121は、フレームクラス分類部104から出力されたフレームクラス情報を一定期間保持し、フレームクラス切り替わり判定部122が必要時に過去のフレームクラス情報を取得できるようにする。なお、現フレームのフレームクラス情報は、フレームクラス分類部104から取得することができる。また、過去のフレームクラス情報としては、直前のフレームのフレームクラス情報、もしくは、最後に受信された正常フレームのフレームクラス情報が用いられる。
フレームクラス切り替わり判定部122は、フレームクラス分類部104から出力される現フレームのフレームクラス情報と、保持部121から出力される過去のフレームのフレームクラス情報と、を比較することにより、雑音的信号(無声音)から有声定常信号(有声音)への切り替わり、有声定常信号から雑音的信号への切り替わり等のフレームクラスの切り替わりを判定し、この判定結果を復号化処理選択部123へ出力する。
復号化処理選択部123は、フレームクラス切り替わり判定部122の判定結果に基づいて、各復号化処理の選択肢の中から現フレームに対し行うべき復号化処理を選択し、選択結果を復号化処理部103へ出力する。
図4は、復号化処理選択部123において行われる、現フレームの復号化処理の選択方法の具体的な手順を示すフロー図である。
復号化処理選択部123は、パケット分離部101から出力されるフレーム消失情報に基づいて、現フレームが消失フレームに該当するか否かを判断する(ST1100)。そして、現フレームが消失フレームの場合には、復号化処理選択部123は、前述した復号化処理B(隠蔽処理)を選択する(ST1200)。
ST1100において、現フレームが消失フレームでない場合は、復号化処理選択部123は、この消失フレームの前のフレームが消失フレームに該当するか否か判断する(ST1300)。前フレームが消失フレームである場合には、復号化処理選択部123は、さらにフレームクラス切り替わり判定部122の判定結果を確認し、雑音的信号から有声定常信号へのフレームクラス切り替わりがあったか否か確認する(ST1400)。このフレームクラス切り替わりがあった場合には、復号化処理選択部123は、復号化処理C、すなわち、後述のOLA(オーバラップ・アッド)処理をこのフレームに対し選択する(ST1500)。
一方、ST1300において、前フレームが消失フレームでなかった場合、または、ST1400において、フレームクラスの切り替わりがなかった場合には、復号化処理選択部123は、前述した復号化処理Aをこのフレームに対し選択する(ST1600)。
以上の処理により、復号化処理選択部123において、現フレームに対する復号化処理が決定される。
次いで、再度、図3を参照しながら、以上の手順をより詳細に説明する。
復号化処理選択部123は、パケット分離部101から出力されるフレーム消失情報を保持するための保持バッファ(図示せず)を内部に備え、パケット分離部101からフレーム消失情報が出力される度にこの内容を更新する。すなわち、この保持バッファには、直前のフレームが消失フレームであったか否かの情報が保持されている。なお、この保持バッファの初期値には、適当な情報(例えば、正常フレームであることを示す情報等)が設定されている。
現フレームが消失フレームである(または、現フレームが消失パケットの中に含まれるフレームである)場合、復号化処理選択部123は、この情報をパケット分離部101から通知され、無条件に現フレームに対し復号化処理B(隠蔽処理)を選択すると共に、パケット分離部101から出力されたフレーム消失情報で内部の保持バッファを更新する。このとき、保持部121も、フレームクラス分類部104から出力されたフレームクラス情報で保持内容を更新する(後述するように、消失フレームではこの更新は必須ではない)。そして、復号化処理選択部123が、選択した復号化処理を出力することによって、復号化処理判定部105の判定処理は終了する。
現フレームが消失フレームでない(正常フレームの)場合、復号化処理選択部123は、この情報をパケット分離部101から通知され、まず、内部の保持バッファの内容、すなわち、直前フレームのフレーム消失情報を参照し、前フレームが消失フレームであったか否か確認する。
そして、直前フレームも消失フレームでなかった場合(正常フレームの場合)、復号化処理選択部123は、現フレームに対し復号化処理A(通常の復号化処理方法)を選択すると共に、パケット分離部101から出力されたフレーム消失情報で内部の保持バッファを更新する。そして、復号化処理選択部123が、選択した復号化処理を出力することによって、復号化処理判定部105の判定処理は終了する。このとき、保持部121の保持内容(フレームクラス情報)の更新は、フレームクラス分類部104からの出力(現フレームのフレームクラス情報)で行なわれる。フレームクラス分類部104は、復号化処理Aの過程で、クラス分類処理に必要な復号情報が得られた段階で、復号化処理部103から必要な復号化情報を取得し、フレームクラス分類処理を行って結果を保持部121に出力する。フレーム切り替わり判定部122での判定処理は行う必要がない。
一方、内部の保持バッファの内容を確認した結果、直前フレームが消失フレームであった場合、復号化処理選択部123は、さらに、フレームクラス切り替わり判定部122から判定結果を受け取り、雑音的信号から有声定常信号へのフレームクラス切り替わりがあったか否か確認の上、現フレームに対する復号化処理を選択し、また、パケット分離部101から出力されたフレーム消失情報で保持バッファの内容を更新する。そして、復号化処理選択部123が、選択した復号化処理を出力することによって、復号化処理判定部105の判定処理は終了する。このとき、保持部121の保持内容の更新は、フレームクラス分類部104からの出力(現フレームのフレームクラス情報)で行なわれる。フレームクラス分類部104は、復号化処理部103で行なわれる、復号化処理Aと復号化処理Cに共通な復号処理(フレームクラス分類に必要な復号情報を得る処理は、復号化処理Aと復号化処理Cとで共通であり、現フレームが正常フレームである場合は、無条件にこの共通の処理が復号化処理部103にて行なわれ、フレームクラス分類処理に必要な復号化情報がフレームクラス分類部104へ出力される)によって得られる復号情報を取得し、フレームクラス分類処理を行って分類結果を保持部121およびフレームクラス切り替わり判定部122へ出力する。
なお、保持部121で保持されるフレームクラス情報は、少なくとも過去1フレーム分以上とする。例えば、過去1フレーム分だけフレームクラス情報が保持されるとした場合、保持部121は、パケット分離部101から出力されるフレーム消失情報に従い、正常フレーム時にのみ、フレームクラス情報を更新し、フレーム消失時は更新せずに保持するだけにする。このようにすると、消失フレームが連続した場合でも、複数フレームのフレームクラス情報を保持せずに、最後に受信した正常フレームのフレームクラス情報を保持することができる。
図5は、図3に示したフレームクラス切り替わり判定部122が使用する判定ルールを示した表である。
例えば、図2に示したように、3種類のフレームクラスを示す数値として、有声性の低い順に0、1、2を割り当てたとすると、フレームクラス切り替わり判定部122は、前フレーム(直前フレームもしくは最後に受信した正常フレーム)のフレームクラス番号Aと現フレームのフレームクラスB番号とに基づいてフレームクラスの切り替わりを判定する。具体的には、(B−A)の式を求め、この値が0以外の値を示すときフレームクラスが切り替わっていると判断することができる。また、この方法を用いれば、(B−A)の値が2のときは、雑音的信号から有声定常信号へとフレームクラスが変わったということも特定できる。
図6は、図1に示した復号化処理部103の内部構成を詳しく示したブロック図である。
復号化処理部103は、パラメータ復号部111と、音声生成部112と、状態保存部113と、2つの窓掛け部(114−1、114−2)と、バッファ115と、加算器116と、4つの切り替えスイッチ(SW1〜SW4)と、を備える。
パラメータ復号部111は、パケット分離部101から出力された音声符号化情報の各種パラメータを復号し、フレームクラス分類部104と隠蔽パラメータ生成部102と切り替えスイッチSW1とに出力する。
切り替えスイッチSW1は、パケット分離部101から出力された消失フレーム情報に従い、音声生成部112の入力を切り替える。具体的には、正常フレームであった場合、パラメータ復号部111から出力される各パラメータを音声生成部112へ入力し、正常フレームでなかった場合、隠蔽パラメータ生成部102から出力される各パラメータを音声生成部112へ入力する。
音声生成部112は、復号化処理判定部105から出力された復号化処理方法の切り替え情報に従い、オーバラップ・アッド処理(復号化処理C)を行う場合のみ音声生成開始前の内部状態(合成フィルタ状態、LSP予測器状態、ゲイン予測器状態等)を状態保存部113へ出力する。また、音声生成部112は、復号化処理判定部105から出力された復号化処理方法の切り替え情報に従い、切り替えスイッチSW1を介して入力された各パラメータを用いて音声生成(復号)処理を行い、復号音声信号を切り替えスイッチSW2へ出力する。
切り替えスイッチSW2は、通常の復号化処理の場合(復号化処理AまたはBの場合)、出力を切り替えスイッチSW3に接続する。このとき、切り替えスイッチSW3は、出力を切り替えスイッチSW4に接続し、生成された音声信号がそのまま復号装置の外部へ復号音声信号として出力される。
一方、オーバラップ・アッド処理(復号化処理C)を行う場合、音声生成部112は、同一フレームに対し2回の音声生成処理を行う。1回目の音声生成処理では、音声生成部112は、復号化処理B(隠蔽処理)を行なって補償フレームを生成する。なお、この補償フレームは、前フレーム(消失フレームの補償フレーム)に基づいて生成された信号である。このとき、切り替えスイッチSW3は、音声生成部112からSW2を介して出力される信号をバッファ115に接続し、生成された音声信号を一旦バッファ115に保存する。
2回目の音声生成処理では、音声生成部112は、復号化処理A(通常の復号化処理)を行なって音声信号を生成する。このとき、音声生成部112は、フレーム間の不連続を緩和するために状態保存部113から現フレームの音声生成を行う前の状態を取得し、音声生成処理を行う。ただし、2回目の音声生成処理では、音声生成部112内部の適応符号帳をリセット(零クリア)してから音声生成処理を行う。このような処理を行うことで、前フレームで生成された雑音的な音源信号が後続の有声フレームに伝播することを防ぐことができる。そして、切り替えスイッチSW2は、出力を窓掛け部114−2へ接続し、再生成された音声信号を窓掛け部114−2へ出力する。また、バッファ115に保存された音声信号、すなわち最初に生成された音声信号は、窓掛け部114−1へ出力される。
窓掛け部114(114−1、114−2)は、オーバラップ・アッド処理に使用される一般的な窓関数を信号に乗算(窓掛け)する回路であり、三角窓やハニング窓等を用いて窓掛けを行う。窓掛け部114−1はフェードアウト、窓掛け部114−2はフェードインするためのものであり、2つの窓を加算すると1.0になるように設計する。2つの窓のオーバラップ長は、1フレーム(またはサブフレーム)全体でもよいし、これより短くても良い。窓掛けされた2種類の信号は、加算器116で加算され、切り替えスイッチSW4を介して復号音声信号として出力される。
既に説明した通り、図3に示した復号化処理選択部123は、フレームクラス切り替わり判定部122において算出される(B−A)の値が2だった場合、すなわち、雑音的信号から有声定常音への切り替わりがあった場合、さらに、この切り替わりが消失フレームにおいて起こっていれば、上記のオーバラップ・アッド処理を選択する。
これは、既述の通り、CELP方式の復号化は、過去に復号した(生成した)音源信号を適応符号帳として用いるため、前フレームにおけるフレームの消失隠蔽処理で雑音的信号に基づいて音源信号が生成された場合、現フレームではその雑音的信号が記憶されている適応符号帳を用いて復号化処理を行うことになるからである。よって、現フレームに対しては通常と異なる復号化処理が必要であるが、雑音的信号の影響を断つ目的でCELPの適応符号帳をリセットし、リセット後のパラメータだけを用いてCELPによる復号化を行うことは、不連続や音切れを生じやすくなるため望ましくない。
そこで、復号化処理部103は、CELPの適応符号帳をリセットしつつも、このリセット後の適応符号帳を用いて生成される復号化信号はフェードインさせ、一方、雑音的信号に基づいて生成される補償フレームはフェードアウトさせ、これらの信号を少なくとも一部が重複するように加算する。これにより、雑音的信号に基づいて生成される補償フレームに対しては、フレーム前半に比重を掛け、一方、リセット後の適応符号帳を用いて生成される復号化信号に対しては、フレーム後半に比重を掛けることができ、消失フレーム後の音声フレームに及ぼす雑音的信号の影響を最低限に抑えることができる。また、このとき、2つの信号は滑らかに接続されるので、不連続感や音切れも生じ難くなる。
一方、復号化処理選択部123は、(B−A)の値が2以外のときは、フレームクラスの切り替わりがなかったか、または、切り替わりがあっても雑音的信号から有声定常音への切り替わり以外の切り替わりであることを示しているので、通常の復号化処理(復号化処理A)を選択する。
なお、(B−A)の値が2であっても、現フレームの固定符号帳成分のエネルギが前フレームの復号信号のエネルギに比べて十分大きい場合は、通常の復号化処理であってもあまり問題がないので、その際は、復号化処理選択部123は、通常の復号化処理(復号化処理A)を選択するようにしても良い。
また、フレームクラス情報以外の音声分析情報を用いて最終的な復号化処理を決定するようにしても良い。
さらに、(B−A)の値が1のときは、状況によっては通常の復号化処理を選択しない方が良い場合もある。例えば、前フレームAが中間的フレームとして隠蔽処理が行なわれても隠蔽処理によって生成された音源信号が雑音的であった場合は、復号化処理選択部123は、フレームクラス情報以外の音声分析情報を用いて最終的な復号化処理を選択するようにしても良い。
このように、本実施の形態によれば、消失フレーム直前のフレームが雑音的信号を表すフレームクラスであって、かつ、消失フレーム直後のフレームが有声定常信号を表すクラスである場合、通常のフレーム消失隠蔽処理によって生成される補償信号と、CELP適応符号帳の各パラメータの一部または全てをリセットしてから復号化処理を行って生成される復号信号と、をオーバラップ・アッドして得られる信号を消失フレーム直後の正常フレームとする。
換言すると、本実施の形態は、雑音的信号を生成するフレーム消失隠蔽処理後の有声定常フレームに対して、雑音的な信号がバッファリングされている適応符号帳の内容をクリアしてから、この有声定常フレームの復号処理を行う。
上記の構成を採ることにより、消失フレームで生成された雑音的信号が適応符号帳に保持されていることの影響が伝播して、有声定常フレームにおいて雑音感のある音声信号が生成され続けることを回避することができる。すなわち、フレーム消失隠蔽処理が後続する正常フレームの復号結果に影響を及ぼすことを最小限に抑えることができる。
図7は、本実施の形態に係る音声復号化装置が、無線通信システムに適用された場合の無線送受信装置の構成を示すブロック図である。
この無線通信システムは、無線送信装置300および無線受信装置310を備える。
無線送信装置300は、入力装置301、A/D変換装置302、音声符号化装置303、信号処理装置304、RF変調装置305、送信装置306、およびアンテナ307を備える。
A/D変換装置302の入力端子は、入力装置301に接続されている。音声符号化装置303の入力端子は、A/D変換装置302の出力端子に接続されている。信号処理装置304の入力端子は、音声符号化装置303の出力端子に接続されている。RF変調装置305の入力端子は、信号処理装置304の出力端子に接続されている。送信装置306の入力端子は、RF変調装置305の出力端子に接続されている。アンテナ307は、送信装置306の出力端子に接続されている。
入力装置301は、音声信号を受けてこれを電気信号であるアナログ音声信号に変換し、A/D変換装置302に与える。A/D変換装置302は、入力装置301からのアナログの音声信号をディジタル音声信号に変換し、これを音声符号化装置303へ与える。音声符号化装置303は、A/D変換装置302からのディジタル音声信号を符号化して音声符号化ビット列を生成し信号処理装置304に与える。信号処理装置304は、音声符号化装置303からの音声符号化ビット列にチャネル符号化処理やパケット化処理及び送信バッファ処理等を行った後、その音声符号化ビット列をRF変調装置305に与える。RF変調装置305は、信号処理装置304からのチャネル符号化処理等が行われた音声符号化ビット列の信号を変調して送信装置306に与える。送信装置306は、RF変調装置305からの変調された音声符号化信号をアンテナ307を介して電波(RF信号)として送出する。
無線送信装置300においては、A/D変換装置302を介して得られるディジタル音声信号に対して数十msのフレーム単位で処理が行われる。システムを構成するネットワークがパケット網である場合には、1フレーム又は数フレームの符号化データを1つのパケットに入れこのパケットをパケット網に送出する。なお、上記ネットワークが回線交換網の場合には、パケット化処理や送信バッファ処理は不要である。
無線受信装置310は、アンテナ311、受信装置312、RF復調装置313、信号処理装置314、音声復号化装置315、D/A変換装置316、および出力装置317を備える。
受信装置312の入力端子は、アンテナ311に接続されている。RF復調装置313の入力端子は、受信装置312の出力端子に接続されている。信号処理装置314の入力端子は、RF復調装置313の出力端子に接続されている。音声復号化装置315の入力端子は、信号処理装置314の出力端子に接続されている。D/A変換装置316の入力端子は、音声復号化装置315の出力端子に接続されている。出力装置317の入力端子は、D/A変換装置316の出力端子に接続されている。
受信装置312は、アンテナ311を介して音声符号化情報を含んでいる電波(RF信号)を受けてアナログの電気信号である受信音声符号化信号を生成し、これをRF復調装置313に与える。アンテナ311を介して受けた電波(RF信号)は、伝送路において信号の減衰や雑音の重畳がなければ、無線送信装置300において送出された電波(RF信号)と全く同じものになる。
RF復調装置313は、受信装置312からの受信音声符号化信号を復調し信号処理装置314に与える。信号処理装置314は、RF復調装置313からの受信音声符号化信号のジッタ吸収バッファリング処理、パケット組みたて処理およびチャネル復号化処理等を行い、受信音声符号化ビット列を音声復号化装置315に与える。音声復号化装置315は、信号処理装置314からの受信音声符号化ビット列の復号化処理を行って復号音声信号を生成しD/A変換装置316へ与える。D/A変換装置316は、音声復号化装置315からのディジタル復号音声信号をアナログ復号音声信号に変換して出力装置317に与える。出力装置317は、D/A変換装置316からのアナログ復号音声信号を空気の振動に変換し音波として人間の耳に聞こえる様に出力する。
本発明に係る音声復号化装置は、上記実施の形態に限定されず、種々変更して実施することが可能である。
本発明に係る音声復号化装置は、移動体通信システムにおける移動局装置(通信端末装置)および基地局装置に搭載することも可能であり、これにより上記と同様の作用効果を有する移動局装置(通信端末装置)および基地局装置を提供することができる。
なお、ここでは、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
本発明に係る音声復号化装置および音声復号化方法は、移動体通信システムにおける通信端末装置等の用途に適用できる。
実施の形態1に係る音声復号化装置の主要な構成を示すブロック図 実施の形態1に係るフレームクラス分類部において使用されるフレームクラス分類の一例を示した表 実施の形態1に係る復号化処理判定部の内部構成を詳しく示したブロック図 実施の形態1に係る復号化処理選択部の復号化処理選択方法の手順を示すフロー図 実施の形態1に係るフレームクラス切り替わり判定部が使用する判定テーブルの内容を示した図 実施の形態1に係る復号化処理部の内部構成を詳しく示したブロック図 本実施の形態に係る無線送受信装置の構成を示すブロック図 音声フレームシーケンスの一例を示す図
符号の説明
101 パケット分離部
102 隠蔽パラメータ生成部
103 復号化処理部
104 フレームクラス分類部
105 復号化処理判定部
111 パラメータ復号部
112 音声生成部
113 状態保存部
114 窓掛け部
121 保持部
122 フレームクラス切り替わり判定部
123 復号化処理選択部

Claims (5)

  1. 入力された音声フレームの音声モードを判定する第1の判定手段と、
    前記音声フレームが正常フレームであるか消失フレームであるかを判定する第2の判定手段と、
    正常フレームに対しCELP方式の復号化を施す復号化手段と、
    消失フレームにおいて、雑音的信号から有声的信号への音声モードの切り替わりがあるか否かを、前記第1および第2の判定手段の判定結果に基づいて検出する検出手段と、
    消失フレームにおける前記音声モードの切り替わりが検出された場合、前記復号化手段で使用される適応符号帳の内容を一部または全部リセットするリセット手段と、
    を具備し、
    前記復号化手段は、
    リセット後の前記適応符号帳を用いて、音声モードの切り替わりが検出された消失フレームの後の正常フレームの復号化を行う、
    ことを特徴とする音声復号化装置。
  2. 消失フレームの前の正常フレームに基づいて、この消失フレームの補償フレームを生成する第1の補償手段と、
    前記第1の補償手段によって生成された補償フレームに基づいて、前記消失フレームの後の正常フレームの補償フレームを生成する第2の補償手段と、
    を具備し、
    前記復号化手段は、
    リセット後の適応符号帳を用いて生成される音声フレームと、前記第2の補償手段によって生成される補償フレームと、の双方を用いて、前記消失フレームの後の正常フレームの復号化フレームを生成する、
    ことを特徴とする請求項1記載の音声復号化装置。
  3. 前記復号化手段は、
    リセット後の適応符号帳を用いて生成される前記音声フレームの後半に重み付けする第1の重み付け手段と、
    前記第2の補償手段によって生成される補償フレームの前半に重み付けする第2の重み付け手段と、
    後半に重み付けがされた前記音声フレームと前半に重み付けがされた前記補償フレームとを加算して、前記復号化フレームを生成する加算手段と、
    を具備することを特徴とする請求項2記載の音声復号化装置。
  4. 請求項1から請求項3のいずれかに記載の音声復号化装置を具備することを特徴とする通信端末装置。
  5. 雑音的信号を生成するフレーム消失隠蔽処理がされた後の有声定常フレームに対し、前記雑音的信号がバッファリングされている適応符号帳の内容の一部または全部をリセットしてから、この有声定常フレームの復号化を行う、
    ことを特徴とする音声復号化方法。
JP2004125943A 2004-04-21 2004-04-21 音声復号化装置および音声復号化方法 Expired - Fee Related JP4437052B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004125943A JP4437052B2 (ja) 2004-04-21 2004-04-21 音声復号化装置および音声復号化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004125943A JP4437052B2 (ja) 2004-04-21 2004-04-21 音声復号化装置および音声復号化方法

Publications (2)

Publication Number Publication Date
JP2005309096A JP2005309096A (ja) 2005-11-04
JP4437052B2 true JP4437052B2 (ja) 2010-03-24

Family

ID=35437954

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004125943A Expired - Fee Related JP4437052B2 (ja) 2004-04-21 2004-04-21 音声復号化装置および音声復号化方法

Country Status (1)

Country Link
JP (1) JP4437052B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4751245B2 (ja) * 2006-06-20 2011-08-17 パナソニック株式会社 音声伝送装置および音声伝送方法
US8908882B2 (en) * 2009-06-29 2014-12-09 Audience, Inc. Reparation of corrupted audio signals
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
WO2016040885A1 (en) 2014-09-12 2016-03-17 Audience, Inc. Systems and methods for restoration of speech components
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones

Also Published As

Publication number Publication date
JP2005309096A (ja) 2005-11-04

Similar Documents

Publication Publication Date Title
US8725501B2 (en) Audio decoding device and compensation frame generation method
US6968309B1 (en) Method and system for speech frame error concealment in speech decoding
JP4218134B2 (ja) 復号装置及び方法、並びにプログラム提供媒体
US6230124B1 (en) Coding method and apparatus, and decoding method and apparatus
US9123328B2 (en) Apparatus and method for audio frame loss recovery
JPWO2006025313A1 (ja) 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
JP4733939B2 (ja) 信号復号化装置及び信号復号化方法
JPH06202696A (ja) 音声復号化装置
JP4445328B2 (ja) 音声・楽音復号化装置および音声・楽音復号化方法
US10607624B2 (en) Signal codec device and method in communication system
JP2004138756A (ja) 音声符号化装置、音声復号化装置、音声信号伝送方法及びプログラム
JP4558734B2 (ja) 信号復号化装置
US7502735B2 (en) Speech signal transmission apparatus and method that multiplex and packetize coded information
JP4437052B2 (ja) 音声復号化装置および音声復号化方法
JP4414705B2 (ja) 音源信号符号化装置、及び音源信号符号化方法
JP4597360B2 (ja) 音声復号装置及び音声復号方法
JP4065383B2 (ja) 音声信号送信装置、音声信号受信装置及び音声信号伝送システム
JP2005534984A (ja) 音声フレームのエラー軽減用の音声通信ユニットおよび方法
EP1164577A2 (en) Method and apparatus for reproducing speech signals

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100104

R150 Certificate of patent or registration of utility model

Ref document number: 4437052

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees