本発明は、モノラル−ステレオスケーラブル構成を有するステレオ音声符号化において、符号化データの伝送中にパケット損失(フレーム消失)が生じた際に高品質な消失フレーム補償を行うステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法に関する。
移動体通信やIP(Internet Protocol)通信での伝送帯域の広帯域化、サービスの多様化に伴い、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の環境音を忠実に伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が識別できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号化が必須となる。
また、IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データを復号することが可能な構成をいう。
よって、ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側において選択可能な、モノラル−ステレオ間でのスケーラブル構成(モノラル−ステレオスケーラブル構成)を有する符号化が望まれる。
このようなスケーラブル符号化においては、ステレオ信号を和信号(モノラル信号)と差信号(サイド信号)にして符号化する場合が多く、非特許文献1には、サイド信号のフレームが消失した場合の消失フレーム補償の技術が開示されている。非特許文献1開示の技術においては、サイド信号を低域部、中域部および高域部に分けて符号化を行い、低域部に対しては、過去の復号サイド信号を用いたスペクトルの外挿を行うことによりサイド信号の消失フレームを補償する。また、中域部に対しては、過去のサイド信号の符号化パラメータ(フィルタパラメータやチャネルゲイン)の値を減衰させたものを用いて復号を行うことにより消失フレームを補償する。なお、低域部に対しては、フレーム消失率が高いほど、補償されるフレームのサイド信号をより強く減衰させている。
3GPP TS26.290 V7.0.0, 2007, Chapter6.5.2
しかしながら、上記の非特許文献1記載の技術によれば、ステレオ信号のチャネル間の相関が高い場合には補償性能が十分なものの、ステレオ信号のチャネル間相関が低い場合には、補償性能が低下してしまう。例えば、2つのマイクそれぞれを用いた2つの話者の音声からなるステレオ音声をスケーラブル符号化する場合、チャネル間の相関は低くなり、ステレオ拡張部の符号化情報量が多くなる。このため、復号側において復号された過去のサイド信号、またはサイド信号の符号化パラメータからの外挿のみによって消失フレームを補償すれば、補償されたフレームにおいて得られるサイド信号の品質は劣化してしまう。
本発明の目的は、ステレオ信号のチャネル間相関が低い場合でも、消失フレームの補償性能を改善して復号音声の品質を向上させることができるステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法を提供することである。
本発明のステレオ音声復号装置は、音声符号化装置において第1チャネル信号と第2チャネル信号との加算を用いて得られるモノラル信号が符号化されたモノラル符号化データを復号してモノラル復号信号を生成するモノラル復号手段と、前記音声符号化装置において前記第1チャネル信号と前記第2チャネル信号との差分を用いて得られるサイド信号が符号化されたサイド信号符号化データを復号してサイド復号信号を生成し、前記モノラル復号信号と前記サイド復号信号とを用いて第1チャネル復号信号と第2チャネル復号信号とからなるステレオ復号信号を生成するステレオ復号手段と、過去フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いて算出されたチャネル間相関とチャネル内相関とをそれぞれ比較用閾値と比較する比較手段と、現フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いてチャネル間補償を行い、チャネル間補償信号を生成するチャネル間補償手段と、現フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号を用いてチャネル内補償を行い、チャネル内補償信号を生成するチャネル内補償手段と、前記比較手段における比較結果に基づいて前記チャネル間補償信号または前記チャネル内補償信号の何れかを補償信号として選択する補償信号選択手段と、現フレームの前記サイド信号符号化データが消失しなかった場合には前記ステレオ復号信号を出力し、現フレームの前記サイド信号符号化データが消失した場合には前記補償信号を出力する出力信号切替手段を、を具備する構成を採る。
本発明のステレオ音声符号化装置は、第1チャネル信号と第2チャネル信号との加算を用いて得られるモノラル信号を符号化するモノラル信号符号化手段と、第1チャネル信号と第2チャネル信号との差分を用いて得られるサイド信号を符号化するサイド信号符号化手段と、過去フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いて算出されたチャネル間相関とチャネル内相関とをそれぞれ閾値と比較し、比較結果に基づき音声復号装置においてチャネル間補償またはチャネル内補償の何れを用いて消失フレーム補償を行うかを判定する判定手段と、を具備する構成を採る。
本発明の消失フレーム補償方法は、音声符号化装置において第1チャネル信号と第2チャネル信号との加算を用いて得られるモノラル信号が符号化されたモノラル符号化データを復号してモノラル復号信号を生成するステップと、前記音声符号化装置において前記第1チャネル信号と前記第2チャネル信号との差分を用いて得られるサイド信号が符号化されたサイド信号符号化データを復号してサイド復号信号を生成し、前記モノラル復号信号と前記サイド復号信号とを用いて第1チャネル復号信号と第2チャネル復号信号とからなるステレオ復号信号を生成するステップと、過去フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いて算出されたチャネル間相関とチャネル内相関とをそれぞれ比較用閾値と比較する比較ステップと、現フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いてチャネル間補償を行い、チャネル間補償信号を生成するステップと、現フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号を用いてチャネル内補償を行い、チャネル内補償信号を生成するステップと、前記比較ステップにおける比較結果に基づいて前記チャネル間補償信号または前記チャネル内補償信号の何れかを補償信号として選択するステップと、現フレームの前記サイド信号符号化データが消失しなかった場合には前記ステレオ復号信号を出力し、現フレームの前記サイド信号符号化データが消失した場合には前記補償信号を出力するステップと、を有するようにした。
本発明によれば、ステレオ信号のチャネル間相関が低い場合でも、消失フレームの補償性能を改善して復号音声の品質を向上させることができる。
本発明の実施の形態1に係る音声復号装置の主要な構成を示すブロック図
図1に示した補償信号切替判定部の内部の構成を示すブロック図
図1に示したチャネル間補償部の内部の構成を示すブロック図
図1に示したチャネル内補償部の内部の構成を示すブロック図
図4に示したチャネル信号波形外挿部の内部の構成を示すブロック図
本発明の実施の形態1に係るチャネル間補償の動作を概念的に説明するための図
本発明の実施の形態1に係るチャネル内補償の動作を概念的に説明するための図
本発明の実施の形態2に係るチャネル内補償部の内部の構成を示すブロック図
本発明の実施の形態3に係るチャネル内補償部の内部の構成を示すブロック図
本発明の実施の形態4に係る音声符号化装置の主要な構成を示すブロック図
本発明の実施の形態4に係る音声復号装置の主要な構成を示すブロック図
本発明の実施の形態5に係る音声符号化装置の主要な構成を示すブロック図
本発明の実施の形態5に係る音声復号装置の主要な構成を示すブロック図
以下、モノラル−ステレオの2階層のスケーラブル構成を有する音声符号化を例にとり、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
以下の説明では、ステレオ音声信号が第1チャネルと第2チャネルとの2つのチャネルからなる場合を例にとり、フレーム単位での動作を前提にして説明する。ここで、第1チャネルと第2チャネルとは、例えば左(L)チャネルと右(R)チャネルとをそれぞれ指す。
本発明の実施の形態1に係る音声符号化装置(図示せず)は、ステレオ音声信号の第1チャネル信号と第2チャネル信号とを用い、下記の式(1)および式(2)に従ってモノラル信号M(n)およびサイド信号S(n)それぞれを生成する。そして、本実施の形態に係る音声符号化装置は、モノラル信号M(n)およびサイド信号S(n)それぞれを符号化してモノラル信号符号化データおよびサイド信号符号化データを生成し、本実施の形態に係る音声復号装置に伝送する。
式(1)および式(2)において、nは信号のサンプル番号を示し、Nは1フレームのサンプル数を示す。また、S_ch1(n)は第1チャネル信号を示し、S_ch2(n)は第2チャネル信号を示す。
図1は、本発明の実施の形態1に係る音声復号装置100の主要な構成を示すブロック図である。図1に示す音声復号装置100は、音声符号化装置から伝送されるモノラル信号符号化データおよびサイド信号符号化データを復号する音声復号部110と、サイド信号符号化データの消失フレーム補償を行う消失フレーム補償部120と、サイド信号符号化データのフレーム消失の有無に応じて音声復号装置100の出力信号を切り替える出力信号切替部130とを備える。
音声復号部110は、コアレイヤと拡張レイヤの2レイヤ構造を有し、コアレイヤはモノラル信号復号部101からなり、拡張レイヤはステレオ信号復号部102からなる。
消失フレーム補償部120は、遅延部103、補償信号切替判定部104、チャネル間補償部105、チャネル内補償部106、および補償信号切替部107を備える。
モノラル信号復号部101は、音声符号化装置から伝送されるモノラル信号符号化データを復号して、得られるモノラル復号信号Md(n)をステレオ信号復号部102、補償信号切替判定部104、チャネル間補償部105、チャネル内補償部106、および出力信号切替部130に出力する。
ステレオ信号復号部102は、音声符号化装置から伝送されるサイド信号符号化データを復号してサイド復号信号Sd(n)を得る。また、ステレオ信号復号部102は、サイド復号信号Sd(n)とモノラル信号復号部101から入力されるモノラル復号信号Md(n)とを用い、下記の式(3)および式(4)に従って第1チャネル復号信号Sds_ch1(n)および第2チャネル復号信号Sds_ch2(n)を算出する。ステレオ信号復号部102は、算出した第1チャネル復号信号Sds_ch1(n)と第2チャネル復号信号Sds_ch2(n)とからなるステレオ復号信号を遅延部103および出力信号切替部130に出力する。なお、以下では、第1チャネル復号信号Sds_ch1(n)および第2チャネル復号信号Sds_ch2(n)を、ステレオ復号信号Sds_ch1(n)、Sds_ch2(n)とも表記する。
遅延部103は、ステレオ信号復号部102から入力されるステレオ復号信号Sds_ch1(n)、Sds_ch2(n)を1フレーム遅延させ、また、1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)を補償信号切替判定部104、チャネル間補償部105、およびチャネル内補償部106に出力する。なお、以下では、1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)を、それぞれ、1フレーム前の第1チャネル復号信号Sdp_ch1(n)(又は「ch1信号」)、第2チャネル復号信号Sdp_ch2(n)(又は「ch2信号」)とも表記する。
補償信号切替判定部104は、遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)と、モノラル信号復号部101から入力されるモノラル復号信号Md(n)とを用いてチャネル間相関度およびチャネル内相関度を算出する。補償信号切替判定部104は、算出したチャネル間相関度およびチャネル内相関度に基づき、チャネル間補償部105で得られるチャネル間補償信号とチャネル内補償部106で得られるチャネル内補償信号との何れをステレオ補償信号とするかを判定し、その判定結果を示す切替フラグを補償信号切替部107に出力する。なお、補償信号切替判定部104の詳細については後述する。
チャネル間補償部105は、モノラル信号符号化データおよびサイド信号符号化データとは別途入力されるフレーム消失フラグに基づき、符号化データの伝送中に現フレームのサイド信号符号化データが消失したか否かを判定する。フレーム消失フラグとは、フレーム消失の有無を通知するフラグであり、音声復号装置100の外部に配置されているフレーム消失検出部(図示せず)から通知される。
チャネル間補償部105は、現フレームのサイド信号符号化データが消失した(フレーム消失あり)と判定した場合には、モノラル信号復号部101から入力される現フレームのモノラル復号信号と遅延部103から入力される1フレーム前のステレオ復号信号とを用いてモノラル復号信号とステレオ復号信号の各チャネル(第1チャネルおよび第2チャネル)とのチャネル間予測パラメータを算出し、算出したチャネル間予測パラメータを用いてチャネル間補償を行う。チャネル間補償部105は、チャネル間補償により得られた現フレームのチャネル間補償信号を補償信号切替部107に出力する。なお、チャネル間補償部105の詳細については後述する。
チャネル内補償部106は、音声復号装置100の外部から入力されるフレーム消失フラグに基づき、符号化データの伝送中に現フレームのサイド信号符号化データが消失したか否かを判定する。現フレームのサイド信号符号化データが消失したと判定した場合には、チャネル内補償部106は、1フレーム前の第1チャネル復号信号Sdp_ch1(n)、第2チャネル復号信号Sdp_ch2(n)、およびモノラル信号復号部101から入力されるモノラル復号信号Md(n)を用い、波形外挿によるチャネル内補償を行って現フレームの第1チャネル内補償信号Sd_ch1(n)および第2チャネル内補償信号Sd_ch2(n)を生成する。チャネル内補償部106は、チャネル内補償により生成される現フレームの第1チャネル内補償信号Sd_ch1(n)および第2チャネル内補償信号Sd_ch2(n)からなるチャネル内補償信号を補償信号切替部107に出力する。なお、チャネル内補償部106は、モノラル信号復号部101からモノラル復号信号Md(n)が入力されない場合もあり、チャネル内補償部106の詳細については後述する。
補償信号切替部107は、補償信号切替判定部104から入力される切替フラグに基づき、チャネル間補償部105で得られるチャネル間補償信号とチャネル内補償部106で得られるチャネル内補償信号との何れかをステレオ補償信号Sr_ch1(n)、Sr_ch2(n)として出力信号切替部130に出力する。
出力信号切替部130は、音声復号装置100がモノラル信号の復号のみを行う場合には、フレーム消失フラグの値にかかわらずモノラル信号復号部101から入力されるモノラル復号信号Md(n)を出力信号として出力する。
一方、音声復号装置100がステレオ信号の復号を行い、フレーム消失ありを示すフレーム消失フラグが入力される場合には、出力信号切替部130は、消失フレーム補償部120から入力されるステレオ補償信号Sr_ch1(n)、Sr_ch2(n)をそのまま出力信号として出力する。
また、音声復号装置100がステレオ信号の復号を行い、フレーム消失無し(正常受信)を示すフレーム消失フラグが入力される場合には、出力信号切替部130は、1フレーム前のフレーム消失の有無によって異なる処理を行う。具体的には、1フレーム前のサイド信号符号化データも消失せず正常受信された場合には、出力信号切替部130は、ステレオ信号復号部102から入力されるステレオ復号信号Sds_ch1(n)、Sds_ch2(n)をそのまま出力信号として出力する。一方、1フレーム前のサイド信号符号化データが消失した場合には、フレーム間の不連続性を解消するためにオーバラップ加算処理を行う。オーバラップ加算処理の一例として、例えば下記の式(5)および式(6)に従って出力信号を構成するSout_ch1(n)およびSout_ch2(n)を算出する。具体的には、1フレーム前の消失フレームの補償においてフレーム長Nよりもオーバラップ区間長Lだけ追加のステレオ補償信号Sr_ch1(n)(n=0,1,…,L−1)およびSr_ch2(n)(n=0,1,…,L−1)を生成しておき、この追加のステレオ補償信号を現フレームの頭からLサンプル長の区間にオーバラップし、出力信号Sout_ch1(n)、Sout_ch1(n)を得る。
図2は、補償信号切替判定部104の内部の構成を示すブロック図である。
図2において、遅延部141は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)を1フレーム遅延させ、また、1フレーム前のモノラル復号信号Mdp(n)をチャネル間相関算出部142に出力する。
チャネル間相関算出部142は、遅延部141から入力される1フレーム前のモノラル復号信号Mdp(n)と遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)とを用い、下記の式(7)および式(8)に従ってモノラル信号と各チャネル信号との間の相互相関c_icc1、c_icc2を算出する。
そして、チャネル間相関算出部142は、下記の式(9)に従ってc_icc1とc_icc2との平均値c_iccを求め、チャネル間相関平均値として切替フラグ生成部144に出力する。
チャネル内相関算出部143は、遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)を用い、下記の式(10)および式(11)に従って各チャネル復号信号の自己相関(すなわちピッチ相関)c_ifc1、c_ifc2を算出する。
式(10)および式(11)において、Tch1およびTch2はそれぞれ第1チャネル信号および第2チャネル信号のピッチ周期を示す。なお、サンプル番号nが負となる場合は、過去のフレームまでさかのぼることを示す。
そして、チャネル内相関算出部143は、下記の式(12)に従ってc_ifc1とc_ifc2との平均値c_ifcを求め、チャネル内相関平均値として切替フラグ生成部144に出力する。
切替フラグ生成部144は、チャネル間相関算出部142から入力されるチャネル間相関平均値c_iccとチャネル内相関算出部143から入力されるチャネル内相関平均値c_ifcとを用い、下記の式(12)に従って切替フラグFlg_sを生成し、補償信号切替部107に出力する。
式(12)に示すように、切替フラグ生成部144は、チャネル内相関平均値c_ifcが閾値TH_ifcより高く、チャネル間相関平均値が閾値TH_iccより低い場合には、切替フラグFlg_sの値を「1」にし、それ以外の場合には、切替フラグFlg_sの値を「0」にする。ここで、切替フラグFlg_sの値が「1」である場合には、チャネル間補償による補償性能が低く、チャネル内補償による補償性能が高いことを示し、補償信号切替部107において、チャネル内補償部106から入力されるチャネル内補償信号をステレオ補償信号として出力する。一方、切替フラグFlg_sの値が「0」である場合には、チャネル間補償による補償性能が高いか、または、チャネル内補償による補償性能が低いことを示し、補償信号切替部107において、チャネル間補償部105から入力されるチャネル間補償信号をステレオ補償信号として出力する。
図3は、チャネル間補償部105の内部の構成を示すブロック図である。
図3において、遅延部151は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)を1フレーム遅延させ、また1フレーム前のモノラル復号信号Mdp(n)をチャネル間予測パラメータ算出部152に出力する。
チャネル間予測パラメータ算出部152は、遅延部151から入力される1フレーム前のモノラル復号信号Mdp(n)と、遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)とを用いてチャネル間予測パラメータを算出し、チャネル間予測部153に出力する。例えば、チャネル間予測部153において下記の式(13)および式(14)に示すようなチャネル間予測を行う場合には、チャネル間予測パラメータ算出部152は、下記の式(15)および式(16)に示すDist1、Dist2それぞれを最小にするFIR(Finite Impulse Response)型のフィルタ係数a1(k)、a2(k)(k=0,1,2,…,P)をチャネル間予測パラメータとして求める。
式(13)および式(14)において、チャネル予測信号Spr_ch1(n)、Spr_ch2(n)は、例えば、チャネル間予測パラメータとしてFIR型のフィルタ係数列a1(k)、a2(k)を用い、1フレーム前のモノラル復号信号Mdp(n)から1フレーム前の各チャネル復号信号Sdp_ch1(n)、Sdp_ch2(n)を予測した場合に得られる各チャネル予測信号を示す。また、式(15)および式(16)において、Dist1、Dist2は、ステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)とステレオ予測信号Spr_ch1(n)、Spr_ch2(n)との2乗誤差を示す。
チャネル間予測部153は、入力されるフレーム消失フラグが消失ありを示す場合には、チャネル間予測パラメータ算出部152から入力されるチャネル間予測パラメータa1(k)、a2(k)(k=0,1,2,…,P)を用い、下記の式(17)および式(18)に従って現フレームのモノラル復号信号Md(n)から現フレームのステレオ復号信号を予測し、それにより得られるステレオ予測信号をチャネル間補償信号(第1チャネル間補償信号Sk_ch1(n)、第2チャネル間補償信号Sk_ch2(n))として補償信号切替部107に出力する。
なお、フレーム消失フラグを参照し、フレームが連続して消失する場合には、チャネル間予測部153は、出力するチャネル間補償信号の振幅を、連続して消失したフレーム数に応じて減衰するようにしても良い。
図4は、チャネル内補償部106の内部の構成を示すブロック図である。なお、ここでは、チャネル内補償部106は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)を用いずチャネル内補償を行う場合を例にとり説明する。
図4において、チャネル内補償部106は、ステレオ信号分離部161、チャネル信号波形外挿部162、チャネル信号波形外挿部163、およびステレオ信号合成部164を備える。
ステレオ信号分離部161は、遅延部103から入力される1フレーム前のステレオ復号信号を第1チャネル復号信号Sdp_ch1(n)および第2チャネル復号信号Sdp_ch2(n)に分離してチャネル信号波形外挿部162およびチャネル信号波形外挿部163に出力する。
チャネル信号波形外挿部162は、ステレオ信号分離部161から入力される1フレーム前の第1チャネル復号信号Sdp_ch1(n)を用いて波形外挿によるチャネル内補償処理を行い、得られる第1チャネル内補償信号Sd_ch1(n)をステレオ信号合成部164に出力する。
チャネル信号波形外挿部163は、ステレオ信号分離部161から入力される1フレーム前の第2チャネル復号信号Sdp_ch2(n)を用いて波形外挿によるチャネル内補償処理を行い、得られる第2チャネル内補償信号Sd_ch2(n)をステレオ信号合成部164に出力する。なお、チャネル信号波形外挿部162およびチャネル信号波形外挿部163の詳細については後述する。
ステレオ信号合成部164は、チャネル信号波形外挿部162から入力される第1チャネル内補償信号Sd_ch1(n)とチャネル信号波形外挿部163から入力される第2チャネル内補償信号Sd_ch2(n)とを用いて合成を行ない、得られるステレオ合成信号をチャネル内補償信号として補償信号切替部107に出力する。
図5は、チャネル信号波形外挿部162の内部の構成を示すブロック図である。
LPC分析部621は、ステレオ信号分離部161から入力される1フレーム前の第1チャネル復号信号Sdp_ch1(n)に対して線形予測分析を行い、得られる線形予測係数(LPC:Linear Predictive Coefficients)をLPC逆フィルタ622とLPC合成部625とに出力する。
LPC逆フィルタ622は、LPC分析部621から入力されるLPC係数を用いて、ステレオ信号分離部161から入力される1フレーム前の第1チャネル復号信号Sdp_ch1(n)に対してLPC逆フィルタリング処理を行い、得られるLPC残差信号をピッチ分析部623とLPC残差波形外挿部624とに出力する。
ピッチ分析部623は、LPC逆フィルタ622から入力されるLPC残差信号に対してピッチ分析を行い、得られるピッチ周期およびピッチ予測ゲインをLPC残差波形外挿部624に出力する。
LPC残差波形外挿部624は、入力されるフレーム消失フラグが消失ありを示す場合には、ピッチ分析部623から入力されるピッチ周期およびピッチ予測ゲインを用い、LPC逆フィルタ622から入力される1フレーム前のLPC残差信号を用いて波形外挿を行って現フレームのLPC残差信号を生成する。波形外挿は例えば、1フレーム前のLPC残差信号から1ピッチ周期分の周期波形を切り出し、ピッチ予測ゲインを乗じながら周期的に配置したり、ピッチ周期とピッチ予測ゲインをパラメータとするピッチ予測フィルタによるフィルタ処理を1フレーム前のLPC残差信号に対して適用することによって外挿波形を生成する。
なお、例えば無声音信号や音声の存在しない非音声区間(雑音信号区間)のような、LPC残差信号のピッチ周期性が低いフレームにおいては、LPC残差波形外挿部624は、ピッチ周期波形による外挿信号に雑音成分の信号を加算するか、またはピッチ周期波形による外挿信号の代わりに雑音成分の信号で置換を行っても良い。また、フレーム消失フラグを参照し、フレームが連続して消失する場合には、LPC残差波形外挿部624は、生成した外挿信号の振幅を、連続して消失したフレーム数に応じて減衰するようにしても良い。
LPC合成部625は、LPC分析部621から入力される線形予測係数(LPC)と、LPC残差波形外挿部624から入力される現フレームのLPC残差信号とを用いてLPC合成処理を行い、得られる合成信号を第1チャネル内補償信号としてステレオ信号合成部164に出力する。
チャネル信号波形外挿部163の内部の構成および動作はチャネル信号波形外挿部162と基本的に同様であり、チャネル信号波形外挿部162の処理対象は第1チャネル復号信号であるのに対し、チャネル信号波形外挿部163の処理対象は第2チャネル復号信号である点のみにおいて相違する。このため、チャネル信号波形外挿部163の内部の構成および動作についての詳細な説明を省略する。
図6および図7は、音声復号装置100におけるチャネル間補償およびチャネル内補償の動作を概念的に説明するための図である。
図6は、チャネル間補償の動作を概念的に示す図である。図6に示すように、チャネル間相関が大きい場合、すなわち、切替フラグ生成部144において、値が「0」である切替フラグFlg_sを生成した場合には、チャネル間補償部105において生成される信号、すなわち、現フレームのモノラル復号信号を基にチャネル間補償を行って得られる、現フレームの第1チャネル間補償信号および第2チャネル間補償信号からなるチャネル間補償信号を、補償信号切替部107で選択する。
図7は、チャネル内補償の動作を概念的に示す図である。図7に示すように、チャネル内相関が大きい場合、すなわち、切替フラグ生成部144において、値が「1」の切替フラグFlg_sを生成した場合には、チャネル内補償部106において生成される信号、すなわち、過去フレームの第1チャネル復号信号と第2チャネル復号信号とを基にチャネル内補償を行って得られる、現フレームの第1チャネル内補償信号および第2チャネル内補償信号からなるチャネル内補償信号を、補償信号切替部107で選択する。
このように、本実施の形態によれば、モノラル−ステレオスケーラブル構成の音声復号装置は、音声符号化装置から伝送される現フレームのサイド信号符号化データが消失した場合には、過去フレームの復号信号を用いて算出されたチャネル間相関とチャネル内相関とを閾値と比較し、比較結果に応じてステレオ補償信号をチャネル間補償信号またはチャネル内補償信号のうち、補償性能がより高い何れかに切り替えるため、復号音声の品質を向上させることができる。すなわち、チャネル間相関が低い場合でも、チャネル内相関も考慮し、そのチャネル内相関が高い場合には、チャネル信号内で過去のチャネル信号からの外挿を行うことにより、補償による劣化を抑え、ステレオ感を維持した補償を行え、復号音声の品質を向上させることができる。
なお、本実施の形態においては、チャネル間相関およびチャネル内相関の算出、チャネル内補償などに用いる過去フレームとして、過去1フレーム分のみのフレームを用いる場合を例にとって説明したが、本発明はこれに限定されず、過去の2フレーム以上のフレームを用いてチャネル間相関およびチャネル内相関の算出、チャネル内補償などを行っても良い。
また、本実施の形態では、現フレームのサイド信号符号化データが消失した場合には、チャネル間補償部105とチャネル内補償部106との両方とも動作し、それぞれ生成したチャネル間補償信号とチャネル内補償信号との何れかを補償信号切替部107により選択される場合を例にとって説明したが、本発明はこれに限定されず、補償信号切替判定部104の判定結果により、チャネル間補償部105とチャネル内補償部106との何れか一方のみが動作するようにしても良い(例えば、補償信号切替部107を、チャネル間補償部105及びチャネル内補償部106の前段に配置する構成など)。
また、本実施の形態では、現フレームのモノラル信号符号化データが正常に受信されサイド信号符号化データのみが消失した場合を例にとって説明したが、本発明はこれに限定されず、モノラル信号符号化データとサイド信号符号化データとの両方ともが消失した場合にも適用することができる。この場合は、まず、モノラル信号復号部101において任意の消失フレーム補償方法によりモノラル復号信号を補償する。そして、得られたモノラル補償信号を用いて、本実施の形態に説明した補償信号切替方法によりステレオ補償信号を生成すれば良い。
また、本実施の形態では、切替フラグ生成部144が、上述の式(12)に従って切替フラグFlg_sを生成し、補償信号切替部107に出力する場合を例にとって説明したが、本発明はこれに限定されず、式(12)の切替フラグFlg_sの値が「0」に該当する場合を、さらに、チャネル間相関平均値が閾値TH_iccより高い場合(Flg_sの値を「0」とする)と、低い場合(Flg_sの値を「2」とする、また、この場合はチャネル内相関平均値c_ifcも閾値TH_ifcより低い)とに場合分けし、各々別々のFlg_sの値を出力するようにしても良い。そして、チャネル間補償部105が、Flg_sの値が「0」の場合には、上記で説明したものと同様な動作をし、一方、Flg_sの値が「2」の場合には、チャネル間相関も低くチャネル間補償性能も高くないとみなされるため、チャネル間補償によるステレオ補償信号の各チャネル補償信号をモノラル復号信号により近い信号に補正するか、または、モノラル復号信号そのものを補償信号として出力するようにしても良い。
また、本実施の形態では、チャネル間相関算出部142が、1フレーム前のモノラル復号信号と各チャネル復号信号それぞれとの相互相関の平均値を算出する場合を例にとって説明したが、本発明はこれに限定されず、1フレーム前の第1チャネル復号信号と第2チャネル復号信号との相互相関を算出しても良く、また、チャネル間補償部105で行われるチャネル間予測において得られる予測ゲイン値を算出しても良い。ここで、予測ゲイン値とは、モノラル復号信号を基に第1チャネル復号信号を予測した第1チャネル予測信号の予測ゲインと、モノラル復号信号を基に第2チャネル復号信号を予測した第2チャネル予測信号の予測ゲインとの平均値を指す。
また、本発明はチャネル間相関算出部142において、1フレーム前のモノラル復号信号と各チャネル復号信号それぞれとの相互相関c_icc1およびc_icc2を算出する際に、モノラル復号信号と各チャネル復号信号それぞれとの遅延差をさらに考慮しても良い。すなわち、チャネル間相関算出部142は、モノラル復号信号と各チャネル復号信号それぞれとの相互相関または類似性などを最大にする遅延差分だけ、一方の信号をシフトしてから相互相関を求めても良い。
また、本発明はチャネル間相関算出部142において、1フレーム前のモノラル復号信号と各チャネル復号信号とを帯域分割した後の信号に対して相互相関を求めても良い。
また、本実施の形態では、チャネル内相関算出部143が、第1チャネル信号および第2チャネル信号それぞれのピッチ周期Tch1およびTch2を用い、上記の式(10)および式(11)に従ってチャネル内相関を算出する場合を例にとって説明したが、本発明はこれに限定されず、チャネル内相関算出部143は、上記の式(10)および式(11)のTch1およびTch2として、ピッチ周期の代わりに、各チャネル復号信号の自己相関c_ifc1、c_ifc2、または上記の式(10)および式(11)の分子項を最大にする遅延値を用いても良い。
または、本実施の形態では、チャネル内相関算出部143が、第1チャネル復号信号および第2チャネル復号信号を対象として上記の式(10)および式(11)に従って各チャネル復号信号の自己相関を算出する場合を例にとって説明したが、本発明はこれに限定されず、チャネル内相関算出部143は、第1チャネル復号信号および第2チャネル復号信号それぞれのLPC残差信号を対象として上記の式(10)および式(11)に従って各チャネル復号信号の自己相関を算出しても良い。
また、本実施の形態では、チャネル間補償部105が、上記の式(13)および式(14)および式(17)および式(18)に示す形態の予測を行う場合を例にとって説明したが、本発明はこれに限定されず、チャネル間補償部105は、信号間の遅延差および振幅比のみを用いた予測、または、遅延差と上記FIR型のフィルタ係数との組み合わせを用いた予測を行っても良い。
また、本実施の形態では、チャネル間補償部105が、チャネル間補償の動作としてチャネル間予測を行う場合を例にとって説明したが、本発明はこれに限定されず、チャネル間予測以外の任意の手法でチャネル間補償を行っても良い。例えば、チャネル間補償部105は、過去フレームのステレオ信号復号部102の処理で得られた復号パラメータを利用して現フレームのステレオ復号信号を算出しても良い。または、チャネル間補償部105は、まず、過去のサイド信号符号化データを復号したサイド復号信号を用いて現フレームのサイド復号信号を補償してから、現フレームのステレオ復号信号を算出しても良い。
また、本実施の形態では、チャネル内補償部106が、チャネル内補償処理として、LPC残差信号に対し波形外挿を行う場合を例にとって説明したが、本発明はこれに限定されず、チャネル内補償処理として、ステレオ復号信号に対し、直接波形外挿を行っても良い。
また、本実施の形態では、チャネル内補償部106が、チャネル内補償処理用に、ピッチパラメータまたはLPCパラメータを算出する場合を例にとって説明したが、本発明はこれに限定されず、モノラル信号復号部101における現フレームの復号過程でモノラル信号に対するピッチパラメータまたはLPCパラメータなどが得られる場合には、チャネル内補償部106は、これらをチャネル内補償処理に用いても良い。この場合、これらのパラメータをチャネル内補償部106において新たに算出する必要がないため、演算量の削減が可能となる。
また、本実施の形態では、音声復号装置100が、チャネル間相関度およびチャネル内相関度に応じてチャネル内補償信号とチャネル間補償信号とを切り替える場合を例にとって説明したが、本発明はこれに限定されず、チャネル間相関およびチャネル内相関に応じたチャネル内補償信号とチャネル間補償信号との重み付け和で補償信号を生成しても良い。チャネル間相関およびチャネル内相関に応じた重み付けとしては、例えば、チャネル間相関が高いほどチャネル間補償信号の重みを大きくし、逆に、チャネル内相関が高いほどチャネル内補償信号の重みを大きくする。
(実施の形態2)
実施の形態1では、チャネル内補償部106において、第1チャネル復号信号および第2チャネル復号信号それぞれのチャネル内補償を行った。これに対し、本発明の実施の形態2では、第1チャネル復号信号および第2チャネル復号信号のうち、チャネル内相関が高い一方のチャネル信号のみに対しチャネル内補償を行い、得られたチャネル内補償信号と、モノラル復号信号とを用いて他方のチャネル信号を算出する。
本実施の形態に係る音声復号装置(図示せず)は、実施の形態1に示した音声復号装置100(図1参照)と基本的に同様であり、チャネル内補償部106の代わりにチャネル内補償部206を備える点のみにおいて相違する。
図8は、本実施の形態に係るチャネル内補償部206の内部の構成を示すブロック図である。なお、チャネル内補償部206は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)をさらに用いてチャネル内補償を行う。
図8に示すチャネル内補償部206は、図4に示したチャネル内補償部106が備えるステレオ信号分離部161に加え、チャネル内相関算出部261、波形外挿チャネル決定部262、スイッチ263、チャネル信号波形外挿部264、他チャネル補償信号算出部265、およびステレオ信号合成部266をさらに備える。
チャネル内相関算出部261は、遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)を用い、上記の式(10)および式(11)に従って各チャネル復号信号の自己相関(すなわちピッチ相関)c_ifc1、c_ifc2を算出して波形外挿チャネル決定部262に出力する。
波形外挿チャネル決定部262は、チャネル内相関算出部261から入力される第1チャネル復号信号の自己相関c_ifc1および第2チャネル復号信号の自己相関c_ifc2を比較し、自己相関がより高い方のチャネルを波形外挿チャネルと決定し、決定結果をスイッチ263に出力する。以下、波形外挿チャネル決定部262において、第1チャネルを波形外挿チャネルとして決定した場合を例にとって説明する。
スイッチ263は、波形外挿チャネル決定部262から入力される波形外挿チャネル決定結果に基づき、ステレオ信号分離部161から入力される第1チャネル復号信号Sdp_ch1(n)および第2チャネル復号信号Sdp_ch2(n)の中から波形外挿チャネルと決定されたチャネル、本例では第1チャネルの復号信号Sdp_ch1(n)をチャネル信号波形外挿部264に出力する。
チャネル信号波形外挿部264は、本発明の実施の形態1に示したチャネル信号波形外挿部162(図5参照)と基本的に同様であり、波形外挿の処理対象がスイッチ263から入力される何れかのチャネル(本例では第1チャネル)である点において、チャネル信号波形外挿部162と相違する。チャネル信号波形外挿部264は、波形外挿により得られた第1チャネル内補償信号Sd_ch1(n)を他チャネル補償信号算出部265とステレオ信号合成部266に出力する。
他チャネル補償信号算出部265は、チャネル信号波形外挿部264から入力される第1チャネル内補償信号Sd_ch1(n)と、モノラル信号復号部101から入力されるモノラル復号信号Md(n)とを用い、下記の式(19)に従って第2チャネル内補償信号Sd_ch2(r)を算出し、ステレオ信号合成部266に出力する。
ステレオ信号合成部266は、チャネル信号波形外挿部264から入力される第1チャネル内補償信号Sd_ch1(n)と、他チャネル補償信号算出部265から入力される第2チャネル内補償信号Sd_ch2(n)とを用いて合成を行ない、得られるステレオ合成信号をチャネル内補償信号として補償信号切替部107に出力する。
このように、本実施の形態によれば、モノラル−ステレオスケーラブル構成の音声復号装置は、音声符号化装置から伝送される現フレームのサイド信号符号化データが消失した場合には、過去フレームの復号信号を用いて算出されたチャネル間相関とチャネル内相関とをそれぞれ閾値と比較した結果に基づき、ステレオ補償信号をチャネル間補償信号またはチャネル内補償信号のうち、補償性能がより高い何れかに切り替える。また、モノラル−ステレオスケーラブル構成の音声復号装置は、さらに各チャネル内の自己相関を比較し、自己相関が高いチャネル、すなわちチャネル内補償の性能が高いことが見込めるチャネル内相関の高いチャネルのみにおいてチャネル内補償を行い、他チャネルに対してはチャネル内補償を行う代わりに、正しく復号されているモノラル復号信号を用いてモノラル信号と各チャネル信号との信号間の関係から補償信号を生成することで、消失フレームの補償品質をさらに向上させることができ、復号音声の品質を向上させることができる。
(実施の形態3)
実施の形態3に係る音声復号装置は、実施の形態1に示したチャネル内補償方法により得られたステレオ補償信号を用いてモノラル信号を生成し、生成されたモノラル信号と、正常に受信されたモノラル信号符号化データから得られたモノラル復号信号との類似度を算出する。そして、類似度が予め設定されたレベル以下である場合には、音声復号装置はモノラル復号信号でステレオ補償信号を代用する。
図9は、本実施の形態に係るチャネル内補償部306の内部の構成を示すブロック図である。なお、図9に示すチャネル内補償部306は、図1に示したチャネル内補償部106に対して、さらにモノラル補償信号生成部361、類似度判定部362、ステレオ信号複製部363、およびスイッチ364を備える。
モノラル補償信号生成部361は、チャネル信号波形外挿部162から入力される第1チャネル内補償信号Sd_ch1(n)と、チャネル信号波形外挿部163から入力される第2チャネル内補償信号Sd_ch2(n)と、を用い、下記の式(20)に従ってモノラル補償信号Mr(n)を算出して類似度判定部362に出力する。
類似度判定部362は、モノラル補償信号生成部361から入力されるモノラル補償信号Mr(n)と、モノラル信号復号部101から入力されるモノラル復号信号Md(n)との類似度を算出し、さらに算出された類似度が閾値以上であるか否かを判定し、判定結果をスイッチ364に出力する。ここで、モノラル補償信号Mr(n)と、モノラル復号信号Md(n)との類似度としては、例えば、この2つの信号間の相互相関、またはこの2つの信号間の平均誤差の逆数、またはこの2つの信号間の誤差の2乗和の逆数、または2つの信号間のSNR(いずれかの信号に対する、信号間の誤差信号のSNR:Signal to Noise ratio)を用いる。
ステレオ信号複製部363は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)を両チャネルの補償信号として複製し、生成されるステレオ複製信号をスイッチ364に出力する。
スイッチ364は、類似度判定部362から入力される判定結果に基づき、モノラル補償信号Mr(n)と、モノラル復号信号Md(n)との類似度が閾値以上である場合には、ステレオ信号合成部164から入力されるステレオ合成信号をチャネル内補償信号として出力し、モノラル補償信号Mr(n)と、モノラル復号信号Md(n)との類似度が閾値より低い場合には、ステレオ信号複製部363から入力されるステレオ複製信号をチャネル内補償信号として出力する。
このように、本実施の形態によれば、音声復号装置のチャネル内補償処理においては、波形外挿により得られる第1チャネル内補償信号と第2チャネル内補償信号とを用いて生成されるモノラル補償信号と、モノラル信号符号化データの復号により得られるモノラル復号信号との類似度が閾値以上である場合には、波形外挿により得られる第1チャネル内補償信号と第2チャネル内補償信号とを用いた合成を行ってチャネル内補償信号を得、上記類似度が閾値より低い場合には、モノラル復号信号を両チャネルに複製して得られるチャネル内補償信号を得る。このように、チャネル内補償時に、モノラル復号信号を利用して補償性能の検証を行う、すなわち、チャネル内補償により得られるステレオ補償信号を用いて算出したモノラル補償信号と、正しく復号されているモノラル復号信号との間の波形の類似度を参照し、その類似度が低い場合はチャネル内補償が適切に行われなかったと判定し、得られたステレオ補償信号を補償信号には用いないことで、チャネル内補償により起こり得る補償性能の低下を回避し、音声復号装置のチャネル内補償の性能をさらに向上させることができ、復号音声の品質を向上させることができる。
(実施の形態4)
実施の形態4では、ステレオ補償信号の切替の判定を符号化側において行い、判定結果を復号側に伝送する。
図10は、本実施の形態に係る音声符号化装置400の主要な構成を示すブロック図である。
図10において、音声符号化装置400は、モノラル信号生成部401、モノラル信号符号化部402、サイド信号符号化部403、補償信号切替判定部404、および多重化部405を備える。
モノラル信号生成部401は、入力されるステレオ音声信号の第1チャネル信号S_ch1(n)および第2チャネル信号S_ch2(n)を用い、上記の式(1)および式(2)に従ってモノラル信号M(n)およびサイド信号S(n)生成する。モノラル信号生成部401は、生成されるモノラル信号M(n)をモノラル信号符号化部402に出力し、サイド信号S(n)をサイド信号符号化部403に出力する。
モノラル信号符号化部402は、モノラル信号生成部401から入力されるモノラル信号M(n)を符号化し、生成されるモノラル信号符号化データを多重化部405に出力する。
サイド信号符号化部403は、モノラル信号生成部401から入力されるサイド信号S(n)を符号化し、生成されるサイド信号符号化データを、後述する音声復号装置500に出力する。
補償信号切替判定部404は、実施の形態1に示した補償信号切替判定部104(図2参照)と基本的に同様であり、1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)およびモノラル復号信号Mdp(n)の代わりに、現フレームのステレオ信号S_ch1(n)、S_ch2(n)およびモノラル信号M(n)を用いて補償信号切替の判定を行う点のみにおいて補償信号切替判定部104と相違する。つまり、補償信号切替判定部404は、現フレームのステレオ信号S_ch1(n)、S_ch2(n)およびモノラル信号M(n)を用いて算出したチャネル間相関度およびチャネル内相関度に基づき、チャネル間補償部105で得られるチャネル間補償信号とチャネル内補償部106で得られるチャネル内補償信号との何れをステレオ補償信号とするかを判定し、判定結果を示す切替フラグを多重化部405に出力する。
多重化部405は、モノラル信号符号化部402から入力されるモノラル信号符号化データと、補償信号切替判定部404から入力される切替フラグとを多重し、得られる多重データを、モノラル信号符号化レイヤのデータとして、後述する音声復号装置500に出力する。
図11は、本発明の実施の形態4に係る音声復号装置500の主要な構成を示すブロック図である。なお、図11に示す音声復号装置500は、図1に示した音声復号装置100と基本的に同様であり、補償信号切替判定部104を備えず、多重データ分離部501を備え、切替フラグが多重データ分離部501から補償信号切替部107に出力される点において音声復号装置100と相違する。また、消失フレーム補償部520は、補償信号切替判定部104を備えない点で、消失フレーム補償部120と構成が異なるため、異なる符号を付す。
多重データ分離部501は、音声符号化装置400から伝送される多重データをモノラル信号符号化データと切替フラグとに分離し、モノラル信号符号化データをモノラル信号復号部101に出力し、切替フラグを補償信号切替部107に出力する。
このように、本実施の形態によれば、音声符号化装置において、現フレームのステレオ信号およびモノラル信号を用いてチャネル間相関およびチャネル内相関を算出し現フレームの補償信号の切替の判定を行い、判定結果を音声復号装置に伝送するため、フレーム消失が生じる当該フレームでのチャネル間およびチャネル内相関に応じて、より正確な切替判定を行うことができ、復号音声の品質を向上させることができる。
また、判定フラグをモノラル信号符号化データに多重してモノラル信号符号化レイヤのデータとして伝送することで、復号側で、モノラル信号符号化レイヤのデータのみを受信でき、ステレオ信号符号化レイヤのデータが受信できない場合でも、切替フラグの情報を受信することができ、上記に示すより正確な切替判定を行うことができ、復号音声の品質を向上させることができる。
なお、本実施の形態に係る音声復号装置は、本実施の形態に係る音声符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明したが、本発明はこれに限定されず、本実施の形態に係る音声復号装置が受信して処理するビットストリームは、この音声復号装置で処理可能なビットストリームを生成可能な音声符号化装置が送信したものであれば良い。
(実施の形態5)
実施の形態5では、ステレオ補償信号の切替の判定を符号化側において行い、判定結果を復号側に伝送する実施の形態4において、判定結果をサイド信号符号化データと多重化して伝送する。
図12は、本実施の形態に係る音声符号化装置600の主要な構成を示すブロック図である。
図12において、音声符号化装置600は、モノラル信号生成部401、モノラル信号符号化部402、サイド信号符号化部403、補償信号切替判定部404、および多重化部605を備える。
本実施の形態に係る音声符号化装置600は、実施の形態4に示した音声符号化装置400(図10参照)と基本的に同様であり、多重化部405に代えて多重化部605を備える点のみにおいて相違する。なお、図12の本実施の形態に係る音声符号化装置600において、図10と共通する構成部分には、図10と同一の符号を付して詳しい説明を省略する。
多重化部605は、サイド信号符号化部403から入力されるサイド信号符号化データと、補償信号切替判定部404から入力される切替フラグとを多重し、得られる多重データを、ステレオ信号符号化レイヤのデータとして、後述する音声復号装置700に出力する。
次に、本実施の形態に係る音声符号化装置600おいて、サイド信号符号化部403が変換符号化方式を用いてサイド信号を符号化する場合の、サイド信号符号化部403、補償信号切替判定部404および多重化部605の動作について説明する。
サイド信号符号化部403は、モノラル信号生成部401から入力される現フレーム(第nフレームとする)のサイド信号を、変換符号化方式を用いて符号化し、生成されるサイド信号符号化データを多重化部605に出力する。
補償信号切替判定部404は、現フレームのステレオ信号S_ch1(n)、S_ch2(n)およびモノラル信号M(n)を用いて現フレーム(第nフレーム)に対する補償信号の切替判定を行い、その判定結果を示す切替フラグを多重化部605に出力する。
多重化部605は、サイド信号符号化部403から入力される、現フレームに対するサイド信号符号化データと、補償信号切替判定部404から入力される現フレームに対する切替フラグとを多重し、得られる多重データを、後述する音声復号装置700に出力する。
図13は、本発明の実施の形態5に係る音声復号装置700の主要な構成を示すブロック図である。なお、図13に示す音声復号装置700は、図11に示した実施の形態4における音声復号装置500と基本的に同様であり、多重データ分離部701が、多重データをサイド信号符号化データと切替フラグとに分離して出力する点において音声復号装置500と相違する。
次に、本実施の形態に係る音声復号装置700において、ステレオ信号復号部102が変換符号化方式によりステレオ信号を復号する場合の動作について説明する。
ステレオ信号復号部102から出力されたステレオ復号信号は、変換符号化方式を用いた符号化および復号において変換窓の重ね合わせ加算のために、遅延部103によって1フレーム遅延される。現フレーム(第nフレーム)に対応するフレーム消失フラグが消失ありを示し、現フレームの受信データ(サイド信号符号化データ)がフレーム消失した場合、その影響は前フレーム(第n−1フレーム)および現フレーム(第nフレーム)の2フレームに影響を及ぼし、2フレーム分の補償が必要になる。
その際、補償信号切替部107において、前フレームの補償は、前フレームの多重データから分離された、前フレームに対応する切替フラグに基づき行われ、前フレームのステレオ補償信号が出力信号切替部130に出力される。また、補償信号切替部107において、現フレームの補償は、次フレーム(第n+1フレーム)の多重データから分離された、次フレームに対応する切替フラグが示す補償モードに基づき行われ、現フレームのステレオ補償信号が出力信号切替部130に出力される。このように、補償信号切替部107は、補償対象フレームに応じて定められた対応フレームの切替フラグを参照して、チャネル間補償部105で得られるチャネル間補償信号とチャネル内補償部106で得られるチャネル内補償信号との何れかをステレオ補償信号として出力信号切替部130に出力する。
このように、本実施の形態によれば、音声復号装置において、ステレオ信号復号部102が変換符号化方式により復号を行う場合、現フレームの受信データがフレーム消失すると、前フレームに対応する切替フラグが示す補償モードに基づき前フレームの補償を行うので、フレーム消失による補償対象フレーム(前フレーム)でのチャネル間およびチャネル内相関に応じて、より正確な切替判定に基づき補償を行うことができ、復号音声の品質を向上させることができる。
なお、本実施の形態に係る音声復号装置は、現フレームがフレーム消失した場合には、前フレームの補償を行い前フレームのステレオ補償信号を生成・出力し、次フレームで、現フレーム(次フレームから見ると前フレーム)の補償を行い現フレームのステレオ補償信号を生成・出力するため、当該補償方法により新たな追加遅延は生じない。
また、本実施の形態に係る音声復号装置は、本実施の形態に係る音声符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明したが、本発明はこれに限定されず、本実施の形態に係る音声復号装置が受信して処理するビットストリームは、この音声復号装置で処理可能なビットストリームを生成可能な音声符号化装置が送信したものであれば良い。
以上、本発明の各実施の形態について説明した。
なお、本発明に係る音声復号装置、音声符号化装置および消失フレーム補償方法は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。
例えば、上記各本実施の形態では、音声符号化装置において上記の式(1)および式(2)に従ってモノラル信号およびサイド信号を生成する場合を例にとって説明したが、本発明はこれに限定されず、上記モノラル信号およびサイド信号は他の方法により求められても良い。
また、上記各実施の形態に係る消失フレーム補償方法は、ある一部の帯域、例えば7kHz以下の低域にのみ適用し、他の帯域、例えば7kHzより高い高域に対しては別の消失フレーム補償方法を適用しても良い。
また、上記各実施の形態においては、チャネル内補償処理に必要なピッチパラメータやLPCパラメータを現フレーム(補償フレーム)のモノラル復号信号から求めても良い。また、チャネル内相関は、現フレームと1フレーム前のモノラル復号信号とを用いて算出しても良い。このように、1フレーム前のステレオ復号信号の代わりに補償フレームのモノラル復号信号を用いることにより、より推定精度の高い補償のためのパラメータを得ることができる。
また、比較に用いる閾値、レベル等は、固定値であっても、条件等により適宜設定される可変の値であっても良く、比較が実行されるまでに予め設定された値であれば良い。
また、上記各実施の形態では、符号化側では、ステレオ信号符号化としてサイド信号を符号化し、復号側では、サイド信号符号化データを復号してステレオ復号信号を生成する場合を例に説明したが、ステレオ信号の符号化方法はこれに限らない。例えば、符号化側で、モノラル信号符号化部において符号化した後に、局部復号したモノラル復号信号と入力のステレオ信号(第1チャネル信号および第2チャネル信号)を符号化して得られるステレオ信号符号化データを復号側へ伝送し、復号側でそのステレオ信号符号化データおよびモノラル復号信号から、第1チャネル復号信号および第2チャネル復号信号を復号してステレオ復号信号として出力するようにしても良い。この場合でも、上記のいずれの実施の形態においても同様のフレーム補償を行うことができる。
また、上記各実施の形態に係る音声復号装置および音声符号化装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2007年12月28日出願の特願2007−339852及び2008年5月30日出願の特願2008−143936に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。
本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置等の用途に適用できる。
本発明は、モノラル−ステレオスケーラブル構成を有するステレオ音声符号化において、符号化データの伝送中にパケット損失(フレーム消失)が生じた際に高品質な消失フレーム補償を行うステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法に関する。
移動体通信やIP(Internet Protocol)通信での伝送帯域の広帯域化、サービスの多様化に伴い、音声通信において高音質化、高臨場感化のニーズが高まっている。例えば、今後、テレビ電話サービスにおけるハンズフリー形態での通話、テレビ会議における音声通信、多地点で複数話者が同時に会話を行うような多地点音声通信、臨場感を保持したまま周囲の環境音を忠実に伝送できるような音声通信などの需要が増加すると見込まれる。その場合、モノラル信号より臨場感があり、また複数話者の発話位置が識別できるような、ステレオ音声による音声通信を実現することが望まれる。このようなステレオ音声による音声通信を実現するためには、ステレオ音声の符号化が必須となる。
また、IPネットワーク上での音声データ通信において、ネットワーク上のトラフィック制御やマルチキャスト通信実現のために、スケーラブルな構成を有する音声符号化が望まれている。スケーラブルな構成とは、受信側で部分的な符号化データからでも音声データを復号することが可能な構成をいう。
よって、ステレオ音声を符号化し伝送する場合にも、ステレオ信号の復号と、符号化データの一部を用いたモノラル信号の復号とを受信側において選択可能な、モノラル−ステレオ間でのスケーラブル構成(モノラル−ステレオスケーラブル構成)を有する符号化が望まれる。
このようなスケーラブル符号化においては、ステレオ信号を和信号(モノラル信号)と差信号(サイド信号)にして符号化する場合が多く、非特許文献1には、サイド信号のフレームが消失した場合の消失フレーム補償の技術が開示されている。非特許文献1開示の技術においては、サイド信号を低域部、中域部および高域部に分けて符号化を行い、低域部に対しては、過去の復号サイド信号を用いたスペクトルの外挿を行うことによりサイド信号の消失フレームを補償する。また、中域部に対しては、過去のサイド信号の符号化パラメータ(フィルタパラメータやチャネルゲイン)の値を減衰させたものを用いて復号を行うことにより消失フレームを補償する。なお、低域部に対しては、フレーム消失率が高いほど、補償されるフレームのサイド信号をより強く減衰させている。
3GPP TS26.290 V7.0.0, 2007, Chapter6.5.2
しかしながら、上記の非特許文献1記載の技術によれば、ステレオ信号のチャネル間の相関が高い場合には補償性能が十分なものの、ステレオ信号のチャネル間相関が低い場合には、補償性能が低下してしまう。例えば、2つのマイクそれぞれを用いた2つの話者の音声からなるステレオ音声をスケーラブル符号化する場合、チャネル間の相関は低くなり、ステレオ拡張部の符号化情報量が多くなる。このため、復号側において復号された過去のサイド信号、またはサイド信号の符号化パラメータからの外挿のみによって消失フレームを補償すれば、補償されたフレームにおいて得られるサイド信号の品質は劣化してしま
う。
本発明の目的は、ステレオ信号のチャネル間相関が低い場合でも、消失フレームの補償性能を改善して復号音声の品質を向上させることができるステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法を提供することである。
本発明のステレオ音声復号装置は、音声符号化装置において第1チャネル信号と第2チャネル信号との加算を用いて得られるモノラル信号が符号化されたモノラル符号化データを復号してモノラル復号信号を生成するモノラル復号手段と、前記音声符号化装置において前記第1チャネル信号と前記第2チャネル信号との差分を用いて得られるサイド信号が符号化されたサイド信号符号化データを復号してサイド復号信号を生成し、前記モノラル復号信号と前記サイド復号信号とを用いて第1チャネル復号信号と第2チャネル復号信号とからなるステレオ復号信号を生成するステレオ復号手段と、過去フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いて算出されたチャネル間相関とチャネル内相関とをそれぞれ比較用閾値と比較する比較手段と、現フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いてチャネル間補償を行い、チャネル間補償信号を生成するチャネル間補償手段と、現フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号を用いてチャネル内補償を行い、チャネル内補償信号を生成するチャネル内補償手段と、前記比較手段における比較結果に基づいて前記チャネル間補償信号または前記チャネル内補償信号の何れかを補償信号として選択する補償信号選択手段と、現フレームの前記サイド信号符号化データが消失しなかった場合には前記ステレオ復号信号を出力し、現フレームの前記サイド信号符号化データが消失した場合には前記補償信号を出力する出力信号切替手段を、を具備する構成を採る。
本発明のステレオ音声符号化装置は、第1チャネル信号と第2チャネル信号との加算を用いて得られるモノラル信号を符号化するモノラル信号符号化手段と、第1チャネル信号と第2チャネル信号との差分を用いて得られるサイド信号を符号化するサイド信号符号化手段と、過去フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いて算出されたチャネル間相関とチャネル内相関とをそれぞれ閾値と比較し、比較結果に基づき音声復号装置においてチャネル間補償またはチャネル内補償の何れを用いて消失フレーム補償を行うかを判定する判定手段と、を具備する構成を採る。
本発明の消失フレーム補償方法は、音声符号化装置において第1チャネル信号と第2チャネル信号との加算を用いて得られるモノラル信号が符号化されたモノラル符号化データを復号してモノラル復号信号を生成するステップと、前記音声符号化装置において前記第1チャネル信号と前記第2チャネル信号との差分を用いて得られるサイド信号が符号化されたサイド信号符号化データを復号してサイド復号信号を生成し、前記モノラル復号信号と前記サイド復号信号とを用いて第1チャネル復号信号と第2チャネル復号信号とからなるステレオ復号信号を生成するステップと、過去フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いて算出されたチャネル間相関とチャネル内相関とをそれぞれ比較用閾値と比較する比較ステップと、現フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号とを用いてチャネル間補償を行い、チャネル間補償信号を生成するステップと、現フレームの前記モノラル復号信号と過去フレームの前記ステレオ復号信号を用いてチャネル内補償を行い、チャネル内補償信号を生成するステップと、前記比較ステップにおける比較結果に基づいて前記チャネル間補償信号または前記チャネル内補償信号の何れかを補償信号として選択するステップと、現フレームの前記サイド信号符号化データが消失しなかった場合には前記ステレオ復号信号を出力し、現フレームの前記サイド信号符号化データが消失した場合には前記補償信号を出力するステップと、を有するようにした。
本発明によれば、ステレオ信号のチャネル間相関が低い場合でも、消失フレームの補償性能を改善して復号音声の品質を向上させることができる。
以下、モノラル−ステレオの2階層のスケーラブル構成を有する音声符号化を例にとり、本発明の実施の形態について、添付図面を参照して詳細に説明する。
(実施の形態1)
以下の説明では、ステレオ音声信号が第1チャネルと第2チャネルとの2つのチャネルからなる場合を例にとり、フレーム単位での動作を前提にして説明する。ここで、第1チャネルと第2チャネルとは、例えば左(L)チャネルと右(R)チャネルとをそれぞれ指す。
本発明の実施の形態1に係る音声符号化装置(図示せず)は、ステレオ音声信号の第1チャネル信号と第2チャネル信号とを用い、下記の式(1)および式(2)に従ってモノラル信号M(n)およびサイド信号S(n)それぞれを生成する。そして、本実施の形態に係る音声符号化装置は、モノラル信号M(n)およびサイド信号S(n)それぞれを符号化してモノラル信号符号化データおよびサイド信号符号化データを生成し、本実施の形態に係る音声復号装置に伝送する。
式(1)および式(2)において、nは信号のサンプル番号を示し、Nは1フレームのサンプル数を示す。また、S_ch1(n)は第1チャネル信号を示し、S_ch2(n)は第2チャネル信号を示す。
図1は、本発明の実施の形態1に係る音声復号装置100の主要な構成を示すブロック図である。図1に示す音声復号装置100は、音声符号化装置から伝送されるモノラル信号符号化データおよびサイド信号符号化データを復号する音声復号部110と、サイド信
号符号化データの消失フレーム補償を行う消失フレーム補償部120と、サイド信号符号化データのフレーム消失の有無に応じて音声復号装置100の出力信号を切り替える出力信号切替部130とを備える。
音声復号部110は、コアレイヤと拡張レイヤの2レイヤ構造を有し、コアレイヤはモノラル信号復号部101からなり、拡張レイヤはステレオ信号復号部102からなる。
消失フレーム補償部120は、遅延部103、補償信号切替判定部104、チャネル間補償部105、チャネル内補償部106、および補償信号切替部107を備える。
モノラル信号復号部101は、音声符号化装置から伝送されるモノラル信号符号化データを復号して、得られるモノラル復号信号Md(n)をステレオ信号復号部102、補償信号切替判定部104、チャネル間補償部105、チャネル内補償部106、および出力信号切替部130に出力する。
ステレオ信号復号部102は、音声符号化装置から伝送されるサイド信号符号化データを復号してサイド復号信号Sd(n)を得る。また、ステレオ信号復号部102は、サイド復号信号Sd(n)とモノラル信号復号部101から入力されるモノラル復号信号Md(n)とを用い、下記の式(3)および式(4)に従って第1チャネル復号信号Sds_ch1(n)および第2チャネル復号信号Sds_ch2(n)を算出する。ステレオ信号復号部102は、算出した第1チャネル復号信号Sds_ch1(n)と第2チャネル復号信号Sds_ch2(n)とからなるステレオ復号信号を遅延部103および出力信号切替部130に出力する。なお、以下では、第1チャネル復号信号Sds_ch1(n)および第2チャネル復号信号Sds_ch2(n)を、ステレオ復号信号Sds_ch1(n)、Sds_ch2(n)とも表記する。
遅延部103は、ステレオ信号復号部102から入力されるステレオ復号信号Sds_ch1(n)、Sds_ch2(n)を1フレーム遅延させ、また、1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)を補償信号切替判定部104、チャネル間補償部105、およびチャネル内補償部106に出力する。なお、以下では、1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)を、それぞれ、1フレーム前の第1チャネル復号信号Sdp_ch1(n)(又は「ch1信号」)、第2チャネル復号信号Sdp_ch2(n)(又は「ch2信号」)とも表記する。
補償信号切替判定部104は、遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)と、モノラル信号復号部101から入力されるモノラル復号信号Md(n)とを用いてチャネル間相関度およびチャネル内相関度を算出する。補償信号切替判定部104は、算出したチャネル間相関度およびチャネル内相関度に基づき、チャネル間補償部105で得られるチャネル間補償信号とチャネル内補償部106で得られるチャネル内補償信号との何れをステレオ補償信号とするかを判定し、その判定結果を示す切替フラグを補償信号切替部107に出力する。なお、補償信号切替判定部104の詳細については後述する。
チャネル間補償部105は、モノラル信号符号化データおよびサイド信号符号化データとは別途入力されるフレーム消失フラグに基づき、符号化データの伝送中に現フレームのサイド信号符号化データが消失したか否かを判定する。フレーム消失フラグとは、フレーム消失の有無を通知するフラグであり、音声復号装置100の外部に配置されているフレーム消失検出部(図示せず)から通知される。
チャネル間補償部105は、現フレームのサイド信号符号化データが消失した(フレーム消失あり)と判定した場合には、モノラル信号復号部101から入力される現フレームのモノラル復号信号と遅延部103から入力される1フレーム前のステレオ復号信号とを用いてモノラル復号信号とステレオ復号信号の各チャネル(第1チャネルおよび第2チャネル)とのチャネル間予測パラメータを算出し、算出したチャネル間予測パラメータを用いてチャネル間補償を行う。チャネル間補償部105は、チャネル間補償により得られた現フレームのチャネル間補償信号を補償信号切替部107に出力する。なお、チャネル間補償部105の詳細については後述する。
チャネル内補償部106は、音声復号装置100の外部から入力されるフレーム消失フラグに基づき、符号化データの伝送中に現フレームのサイド信号符号化データが消失したか否かを判定する。現フレームのサイド信号符号化データが消失したと判定した場合には、チャネル内補償部106は、1フレーム前の第1チャネル復号信号Sdp_ch1(n)、第2チャネル復号信号Sdp_ch2(n)、およびモノラル信号復号部101から入力されるモノラル復号信号Md(n)を用い、波形外挿によるチャネル内補償を行って現フレームの第1チャネル内補償信号Sd_ch1(n)および第2チャネル内補償信号Sd_ch2(n)を生成する。チャネル内補償部106は、チャネル内補償により生成される現フレームの第1チャネル内補償信号Sd_ch1(n)および第2チャネル内補償信号Sd_ch2(n)からなるチャネル内補償信号を補償信号切替部107に出力する。なお、チャネル内補償部106は、モノラル信号復号部101からモノラル復号信号Md(n)が入力されない場合もあり、チャネル内補償部106の詳細については後述する。
補償信号切替部107は、補償信号切替判定部104から入力される切替フラグに基づき、チャネル間補償部105で得られるチャネル間補償信号とチャネル内補償部106で得られるチャネル内補償信号との何れかをステレオ補償信号Sr_ch1(n)、Sr_ch2(n)として出力信号切替部130に出力する。
出力信号切替部130は、音声復号装置100がモノラル信号の復号のみを行う場合には、フレーム消失フラグの値にかかわらずモノラル信号復号部101から入力されるモノラル復号信号Md(n)を出力信号として出力する。
一方、音声復号装置100がステレオ信号の復号を行い、フレーム消失ありを示すフレーム消失フラグが入力される場合には、出力信号切替部130は、消失フレーム補償部120から入力されるステレオ補償信号Sr_ch1(n)、Sr_ch2(n)をそのまま出力信号として出力する。
また、音声復号装置100がステレオ信号の復号を行い、フレーム消失無し(正常受信)を示すフレーム消失フラグが入力される場合には、出力信号切替部130は、1フレーム前のフレーム消失の有無によって異なる処理を行う。具体的には、1フレーム前のサイド信号符号化データも消失せず正常受信された場合には、出力信号切替部130は、ステレオ信号復号部102から入力されるステレオ復号信号Sds_ch1(n)、Sds_ch2(n)をそのまま出力信号として出力する。一方、1フレーム前のサイド信号符号化データが消失した場合には、フレーム間の不連続性を解消するためにオーバラップ加算
処理を行う。オーバラップ加算処理の一例として、例えば下記の式(5)および式(6)に従って出力信号を構成するSout_ch1(n)およびSout_ch2(n)を算出する。具体的には、1フレーム前の消失フレームの補償においてフレーム長Nよりもオーバラップ区間長Lだけ追加のステレオ補償信号Sr_ch1(n)(n=0,1,…,L−1)およびSr_ch2(n)(n=0,1,…,L−1)を生成しておき、この追加のステレオ補償信号を現フレームの頭からLサンプル長の区間にオーバラップし、出力信号Sout_ch1(n)、Sout_ch1(n)を得る。
図2は、補償信号切替判定部104の内部の構成を示すブロック図である。
図2において、遅延部141は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)を1フレーム遅延させ、また、1フレーム前のモノラル復号信号Mdp(n)をチャネル間相関算出部142に出力する。
チャネル間相関算出部142は、遅延部141から入力される1フレーム前のモノラル復号信号Mdp(n)と遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)とを用い、下記の式(7)および式(8)に従ってモノラル信号と各チャネル信号との間の相互相関c_icc1、c_icc2を算出する。
そして、チャネル間相関算出部142は、下記の式(9)に従ってc_icc1とc_icc2との平均値c_iccを求め、チャネル間相関平均値として切替フラグ生成部144に出力する。
チャネル内相関算出部143は、遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)を用い、下記の式(10)および式(11)に従って各チャネル復号信号の自己相関(すなわちピッチ相関)c_ifc1
、c_ifc2を算出する。
式(10)および式(11)において、Tch1およびTch2はそれぞれ第1チャネル信号および第2チャネル信号のピッチ周期を示す。なお、サンプル番号nが負となる場合は、過去のフレームまでさかのぼることを示す。
そして、チャネル内相関算出部143は、下記の式(12)に従ってc_ifc1とc_ifc2との平均値c_ifcを求め、チャネル内相関平均値として切替フラグ生成部144に出力する。
切替フラグ生成部144は、チャネル間相関算出部142から入力されるチャネル間相関平均値c_iccとチャネル内相関算出部143から入力されるチャネル内相関平均値c_ifcとを用い、下記の式(12)に従って切替フラグFlg_sを生成し、補償信号切替部107に出力する。
式(12)に示すように、切替フラグ生成部144は、チャネル内相関平均値c_ifcが閾値TH_ifcより高く、チャネル間相関平均値が閾値TH_iccより低い場合には、切替フラグFlg_sの値を「1」にし、それ以外の場合には、切替フラグFlg_sの値を「0」にする。ここで、切替フラグFlg_sの値が「1」である場合には、チャネル間補償による補償性能が低く、チャネル内補償による補償性能が高いことを示し、補償信号切替部107において、チャネル内補償部106から入力されるチャネル内補償信号をステレオ補償信号として出力する。一方、切替フラグFlg_sの値が「0」である場合には、チャネル間補償による補償性能が高いか、または、チャネル内補償による補償性能が低いことを示し、補償信号切替部107において、チャネル間補償部105から入力されるチャネル間補償信号をステレオ補償信号として出力する。
図3は、チャネル間補償部105の内部の構成を示すブロック図である。
図3において、遅延部151は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)を1フレーム遅延させ、また1フレーム前のモノラル復号信号Mdp(n)をチャネル間予測パラメータ算出部152に出力する。
チャネル間予測パラメータ算出部152は、遅延部151から入力される1フレーム前のモノラル復号信号Mdp(n)と、遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)とを用いてチャネル間予測パラメータを算出し、チャネル間予測部153に出力する。例えば、チャネル間予測部153において下記の式(13)および式(14)に示すようなチャネル間予測を行う場合には、チャネル間予測パラメータ算出部152は、下記の式(15)および式(16)に示すDist1、Dist2それぞれを最小にするFIR(Finite Impulse Response)型のフィルタ係数a1(k)、a2(k)(k=0,1,2,…,P)をチャネル間予測パラメータとして求める。
式(13)および式(14)において、チャネル予測信号Spr_ch1(n)、Spr_ch2(n)は、例えば、チャネル間予測パラメータとしてFIR型のフィルタ係数列a1(k)、a2(k)を用い、1フレーム前のモノラル復号信号Mdp(n)から1フレーム前の各チャネル復号信号Sdp_ch1(n)、Sdp_ch2(n)を予測した場合に得られる各チャネル予測信号を示す。また、式(15)および式(16)において、Dist1、Dist2は、ステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)とステレオ予測信号Spr_ch1(n)、Spr_ch2(n)との2乗誤差を示す。
チャネル間予測部153は、入力されるフレーム消失フラグが消失ありを示す場合には、チャネル間予測パラメータ算出部152から入力されるチャネル間予測パラメータa1(k)、a2(k)(k=0,1,2,…,P)を用い、下記の式(17)および式(18)に従って現フレームのモノラル復号信号Md(n)から現フレームのステレオ復号信号を予測し、それにより得られるステレオ予測信号をチャネル間補償信号(第1チャネル間補償信号Sk_ch1(n)、第2チャネル間補償信号Sk_ch2(n))として補償信号切替部107に出力する。
なお、フレーム消失フラグを参照し、フレームが連続して消失する場合には、チャネル間予測部153は、出力するチャネル間補償信号の振幅を、連続して消失したフレーム数に応じて減衰するようにしても良い。
図4は、チャネル内補償部106の内部の構成を示すブロック図である。なお、ここでは、チャネル内補償部106は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)を用いずチャネル内補償を行う場合を例にとり説明する。
図4において、チャネル内補償部106は、ステレオ信号分離部161、チャネル信号波形外挿部162、チャネル信号波形外挿部163、およびステレオ信号合成部164を備える。
ステレオ信号分離部161は、遅延部103から入力される1フレーム前のステレオ復号信号を第1チャネル復号信号Sdp_ch1(n)および第2チャネル復号信号Sdp_ch2(n)に分離してチャネル信号波形外挿部162およびチャネル信号波形外挿部163に出力する。
チャネル信号波形外挿部162は、ステレオ信号分離部161から入力される1フレーム前の第1チャネル復号信号Sdp_ch1(n)を用いて波形外挿によるチャネル内補償処理を行い、得られる第1チャネル内補償信号Sd_ch1(n)をステレオ信号合成部164に出力する。
チャネル信号波形外挿部163は、ステレオ信号分離部161から入力される1フレーム前の第2チャネル復号信号Sdp_ch2(n)を用いて波形外挿によるチャネル内補償処理を行い、得られる第2チャネル内補償信号Sd_ch2(n)をステレオ信号合成部164に出力する。なお、チャネル信号波形外挿部162およびチャネル信号波形外挿部163の詳細については後述する。
ステレオ信号合成部164は、チャネル信号波形外挿部162から入力される第1チャネル内補償信号Sd_ch1(n)とチャネル信号波形外挿部163から入力される第2チャネル内補償信号Sd_ch2(n)とを用いて合成を行ない、得られるステレオ合成信号をチャネル内補償信号として補償信号切替部107に出力する。
図5は、チャネル信号波形外挿部162の内部の構成を示すブロック図である。
LPC分析部621は、ステレオ信号分離部161から入力される1フレーム前の第1チャネル復号信号Sdp_ch1(n)に対して線形予測分析を行い、得られる線形予測係数(LPC:Linear Predictive Coefficients)をLPC逆フィルタ622とLPC合成部625とに出力する。
LPC逆フィルタ622は、LPC分析部621から入力されるLPC係数を用いて、ステレオ信号分離部161から入力される1フレーム前の第1チャネル復号信号Sdp_ch1(n)に対してLPC逆フィルタリング処理を行い、得られるLPC残差信号をピッチ分析部623とLPC残差波形外挿部624とに出力する。
ピッチ分析部623は、LPC逆フィルタ622から入力されるLPC残差信号に対してピッチ分析を行い、得られるピッチ周期およびピッチ予測ゲインをLPC残差波形外挿部624に出力する。
LPC残差波形外挿部624は、入力されるフレーム消失フラグが消失ありを示す場合には、ピッチ分析部623から入力されるピッチ周期およびピッチ予測ゲインを用い、LPC逆フィルタ622から入力される1フレーム前のLPC残差信号を用いて波形外挿を行って現フレームのLPC残差信号を生成する。波形外挿は例えば、1フレーム前のLPC残差信号から1ピッチ周期分の周期波形を切り出し、ピッチ予測ゲインを乗じながら周期的に配置したり、ピッチ周期とピッチ予測ゲインをパラメータとするピッチ予測フィルタによるフィルタ処理を1フレーム前のLPC残差信号に対して適用することによって外挿波形を生成する。
なお、例えば無声音信号や音声の存在しない非音声区間(雑音信号区間)のような、LPC残差信号のピッチ周期性が低いフレームにおいては、LPC残差波形外挿部624は、ピッチ周期波形による外挿信号に雑音成分の信号を加算するか、またはピッチ周期波形による外挿信号の代わりに雑音成分の信号で置換を行っても良い。また、フレーム消失フラグを参照し、フレームが連続して消失する場合には、LPC残差波形外挿部624は、生成した外挿信号の振幅を、連続して消失したフレーム数に応じて減衰するようにしても良い。
LPC合成部625は、LPC分析部621から入力される線形予測係数(LPC)と、LPC残差波形外挿部624から入力される現フレームのLPC残差信号とを用いてLPC合成処理を行い、得られる合成信号を第1チャネル内補償信号としてステレオ信号合成部164に出力する。
チャネル信号波形外挿部163の内部の構成および動作はチャネル信号波形外挿部162と基本的に同様であり、チャネル信号波形外挿部162の処理対象は第1チャネル復号信号であるのに対し、チャネル信号波形外挿部163の処理対象は第2チャネル復号信号である点のみにおいて相違する。このため、チャネル信号波形外挿部163の内部の構成および動作についての詳細な説明を省略する。
図6および図7は、音声復号装置100におけるチャネル間補償およびチャネル内補償の動作を概念的に説明するための図である。
図6は、チャネル間補償の動作を概念的に示す図である。図6に示すように、チャネル間相関が大きい場合、すなわち、切替フラグ生成部144において、値が「0」である切替フラグFlg_sを生成した場合には、チャネル間補償部105において生成される信号、すなわち、現フレームのモノラル復号信号を基にチャネル間補償を行って得られる、現フレームの第1チャネル間補償信号および第2チャネル間補償信号からなるチャネル間補償信号を、補償信号切替部107で選択する。
図7は、チャネル内補償の動作を概念的に示す図である。図7に示すように、チャネル内相関が大きい場合、すなわち、切替フラグ生成部144において、値が「1」の切替フラグFlg_sを生成した場合には、チャネル内補償部106において生成される信号、すなわち、過去フレームの第1チャネル復号信号と第2チャネル復号信号とを基にチャネル内補償を行って得られる、現フレームの第1チャネル内補償信号および第2チャネル内補償信号からなるチャネル内補償信号を、補償信号切替部107で選択する。
このように、本実施の形態によれば、モノラル−ステレオスケーラブル構成の音声復号装置は、音声符号化装置から伝送される現フレームのサイド信号符号化データが消失した場合には、過去フレームの復号信号を用いて算出されたチャネル間相関とチャネル内相関とを閾値と比較し、比較結果に応じてステレオ補償信号をチャネル間補償信号またはチャネル内補償信号のうち、補償性能がより高い何れかに切り替えるため、復号音声の品質を
向上させることができる。すなわち、チャネル間相関が低い場合でも、チャネル内相関も考慮し、そのチャネル内相関が高い場合には、チャネル信号内で過去のチャネル信号からの外挿を行うことにより、補償による劣化を抑え、ステレオ感を維持した補償を行え、復号音声の品質を向上させることができる。
なお、本実施の形態においては、チャネル間相関およびチャネル内相関の算出、チャネル内補償などに用いる過去フレームとして、過去1フレーム分のみのフレームを用いる場合を例にとって説明したが、本発明はこれに限定されず、過去の2フレーム以上のフレームを用いてチャネル間相関およびチャネル内相関の算出、チャネル内補償などを行っても良い。
また、本実施の形態では、現フレームのサイド信号符号化データが消失した場合には、チャネル間補償部105とチャネル内補償部106との両方とも動作し、それぞれ生成したチャネル間補償信号とチャネル内補償信号との何れかを補償信号切替部107により選択される場合を例にとって説明したが、本発明はこれに限定されず、補償信号切替判定部104の判定結果により、チャネル間補償部105とチャネル内補償部106との何れか一方のみが動作するようにしても良い(例えば、補償信号切替部107を、チャネル間補償部105及びチャネル内補償部106の前段に配置する構成など)。
また、本実施の形態では、現フレームのモノラル信号符号化データが正常に受信されサイド信号符号化データのみが消失した場合を例にとって説明したが、本発明はこれに限定されず、モノラル信号符号化データとサイド信号符号化データとの両方ともが消失した場合にも適用することができる。この場合は、まず、モノラル信号復号部101において任意の消失フレーム補償方法によりモノラル復号信号を補償する。そして、得られたモノラル補償信号を用いて、本実施の形態に説明した補償信号切替方法によりステレオ補償信号を生成すれば良い。
また、本実施の形態では、切替フラグ生成部144が、上述の式(12)に従って切替フラグFlg_sを生成し、補償信号切替部107に出力する場合を例にとって説明したが、本発明はこれに限定されず、式(12)の切替フラグFlg_sの値が「0」に該当する場合を、さらに、チャネル間相関平均値が閾値TH_iccより高い場合(Flg_sの値を「0」とする)と、低い場合(Flg_sの値を「2」とする、また、この場合はチャネル内相関平均値c_ifcも閾値TH_ifcより低い)とに場合分けし、各々別々のFlg_sの値を出力するようにしても良い。そして、チャネル間補償部105が、Flg_sの値が「0」の場合には、上記で説明したものと同様な動作をし、一方、Flg_sの値が「2」の場合には、チャネル間相関も低くチャネル間補償性能も高くないとみなされるため、チャネル間補償によるステレオ補償信号の各チャネル補償信号をモノラル復号信号により近い信号に補正するか、または、モノラル復号信号そのものを補償信号として出力するようにしても良い。
また、本実施の形態では、チャネル間相関算出部142が、1フレーム前のモノラル復号信号と各チャネル復号信号それぞれとの相互相関の平均値を算出する場合を例にとって説明したが、本発明はこれに限定されず、1フレーム前の第1チャネル復号信号と第2チャネル復号信号との相互相関を算出しても良く、また、チャネル間補償部105で行われるチャネル間予測において得られる予測ゲイン値を算出しても良い。ここで、予測ゲイン値とは、モノラル復号信号を基に第1チャネル復号信号を予測した第1チャネル予測信号の予測ゲインと、モノラル復号信号を基に第2チャネル復号信号を予測した第2チャネル予測信号の予測ゲインとの平均値を指す。
また、本発明はチャネル間相関算出部142において、1フレーム前のモノラル復号信
号と各チャネル復号信号それぞれとの相互相関c_icc1およびc_icc2を算出する際に、モノラル復号信号と各チャネル復号信号それぞれとの遅延差をさらに考慮しても良い。すなわち、チャネル間相関算出部142は、モノラル復号信号と各チャネル復号信号それぞれとの相互相関または類似性などを最大にする遅延差分だけ、一方の信号をシフトしてから相互相関を求めても良い。
また、本発明はチャネル間相関算出部142において、1フレーム前のモノラル復号信号と各チャネル復号信号とを帯域分割した後の信号に対して相互相関を求めても良い。
また、本実施の形態では、チャネル内相関算出部143が、第1チャネル信号および第2チャネル信号それぞれのピッチ周期Tch1およびTch2を用い、上記の式(10)および式(11)に従ってチャネル内相関を算出する場合を例にとって説明したが、本発明はこれに限定されず、チャネル内相関算出部143は、上記の式(10)および式(11)のTch1およびTch2として、ピッチ周期の代わりに、各チャネル復号信号の自己相関c_ifc1、c_ifc2、または上記の式(10)および式(11)の分子項を最大にする遅延値を用いても良い。
または、本実施の形態では、チャネル内相関算出部143が、第1チャネル復号信号および第2チャネル復号信号を対象として上記の式(10)および式(11)に従って各チャネル復号信号の自己相関を算出する場合を例にとって説明したが、本発明はこれに限定されず、チャネル内相関算出部143は、第1チャネル復号信号および第2チャネル復号信号それぞれのLPC残差信号を対象として上記の式(10)および式(11)に従って各チャネル復号信号の自己相関を算出しても良い。
また、本実施の形態では、チャネル間補償部105が、上記の式(13)および式(14)および式(17)および式(18)に示す形態の予測を行う場合を例にとって説明したが、本発明はこれに限定されず、チャネル間補償部105は、信号間の遅延差および振幅比のみを用いた予測、または、遅延差と上記FIR型のフィルタ係数との組み合わせを用いた予測を行っても良い。
また、本実施の形態では、チャネル間補償部105が、チャネル間補償の動作としてチャネル間予測を行う場合を例にとって説明したが、本発明はこれに限定されず、チャネル間予測以外の任意の手法でチャネル間補償を行っても良い。例えば、チャネル間補償部105は、過去フレームのステレオ信号復号部102の処理で得られた復号パラメータを利用して現フレームのステレオ復号信号を算出しても良い。または、チャネル間補償部105は、まず、過去のサイド信号符号化データを復号したサイド復号信号を用いて現フレームのサイド復号信号を補償してから、現フレームのステレオ復号信号を算出しても良い。
また、本実施の形態では、チャネル内補償部106が、チャネル内補償処理として、LPC残差信号に対し波形外挿を行う場合を例にとって説明したが、本発明はこれに限定されず、チャネル内補償処理として、ステレオ復号信号に対し、直接波形外挿を行っても良い。
また、本実施の形態では、チャネル内補償部106が、チャネル内補償処理用に、ピッチパラメータまたはLPCパラメータを算出する場合を例にとって説明したが、本発明はこれに限定されず、モノラル信号復号部101における現フレームの復号過程でモノラル信号に対するピッチパラメータまたはLPCパラメータなどが得られる場合には、チャネル内補償部106は、これらをチャネル内補償処理に用いても良い。この場合、これらのパラメータをチャネル内補償部106において新たに算出する必要がないため、演算量の削減が可能となる。
また、本実施の形態では、音声復号装置100が、チャネル間相関度およびチャネル内相関度に応じてチャネル内補償信号とチャネル間補償信号とを切り替える場合を例にとって説明したが、本発明はこれに限定されず、チャネル間相関およびチャネル内相関に応じたチャネル内補償信号とチャネル間補償信号との重み付け和で補償信号を生成しても良い。チャネル間相関およびチャネル内相関に応じた重み付けとしては、例えば、チャネル間相関が高いほどチャネル間補償信号の重みを大きくし、逆に、チャネル内相関が高いほどチャネル内補償信号の重みを大きくする。
(実施の形態2)
実施の形態1では、チャネル内補償部106において、第1チャネル復号信号および第2チャネル復号信号それぞれのチャネル内補償を行った。これに対し、本発明の実施の形態2では、第1チャネル復号信号および第2チャネル復号信号のうち、チャネル内相関が高い一方のチャネル信号のみに対しチャネル内補償を行い、得られたチャネル内補償信号と、モノラル復号信号とを用いて他方のチャネル信号を算出する。
本実施の形態に係る音声復号装置(図示せず)は、実施の形態1に示した音声復号装置100(図1参照)と基本的に同様であり、チャネル内補償部106の代わりにチャネル内補償部206を備える点のみにおいて相違する。
図8は、本実施の形態に係るチャネル内補償部206の内部の構成を示すブロック図である。なお、チャネル内補償部206は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)をさらに用いてチャネル内補償を行う。
図8に示すチャネル内補償部206は、図4に示したチャネル内補償部106が備えるステレオ信号分離部161に加え、チャネル内相関算出部261、波形外挿チャネル決定部262、スイッチ263、チャネル信号波形外挿部264、他チャネル補償信号算出部265、およびステレオ信号合成部266をさらに備える。
チャネル内相関算出部261は、遅延部103から入力される1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)を用い、上記の式(10)および式(11)に従って各チャネル復号信号の自己相関(すなわちピッチ相関)c_ifc1、c_ifc2を算出して波形外挿チャネル決定部262に出力する。
波形外挿チャネル決定部262は、チャネル内相関算出部261から入力される第1チャネル復号信号の自己相関c_ifc1および第2チャネル復号信号の自己相関c_ifc2を比較し、自己相関がより高い方のチャネルを波形外挿チャネルと決定し、決定結果をスイッチ263に出力する。以下、波形外挿チャネル決定部262において、第1チャネルを波形外挿チャネルとして決定した場合を例にとって説明する。
スイッチ263は、波形外挿チャネル決定部262から入力される波形外挿チャネル決定結果に基づき、ステレオ信号分離部161から入力される第1チャネル復号信号Sdp_ch1(n)および第2チャネル復号信号Sdp_ch2(n)の中から波形外挿チャネルと決定されたチャネル、本例では第1チャネルの復号信号Sdp_ch1(n)をチャネル信号波形外挿部264に出力する。
チャネル信号波形外挿部264は、本発明の実施の形態1に示したチャネル信号波形外挿部162(図5参照)と基本的に同様であり、波形外挿の処理対象がスイッチ263から入力される何れかのチャネル(本例では第1チャネル)である点において、チャネル信号波形外挿部162と相違する。チャネル信号波形外挿部264は、波形外挿により得ら
れた第1チャネル内補償信号Sd_ch1(n)を他チャネル補償信号算出部265とステレオ信号合成部266に出力する。
他チャネル補償信号算出部265は、チャネル信号波形外挿部264から入力される第1チャネル内補償信号Sd_ch1(n)と、モノラル信号復号部101から入力されるモノラル復号信号Md(n)とを用い、下記の式(19)に従って第2チャネル内補償信号Sd_ch2(r)を算出し、ステレオ信号合成部266に出力する。
ステレオ信号合成部266は、チャネル信号波形外挿部264から入力される第1チャネル内補償信号Sd_ch1(n)と、他チャネル補償信号算出部265から入力される第2チャネル内補償信号Sd_ch2(n)とを用いて合成を行ない、得られるステレオ合成信号をチャネル内補償信号として補償信号切替部107に出力する。
このように、本実施の形態によれば、モノラル−ステレオスケーラブル構成の音声復号装置は、音声符号化装置から伝送される現フレームのサイド信号符号化データが消失した場合には、過去フレームの復号信号を用いて算出されたチャネル間相関とチャネル内相関とをそれぞれ閾値と比較した結果に基づき、ステレオ補償信号をチャネル間補償信号またはチャネル内補償信号のうち、補償性能がより高い何れかに切り替える。また、モノラル−ステレオスケーラブル構成の音声復号装置は、さらに各チャネル内の自己相関を比較し、自己相関が高いチャネル、すなわちチャネル内補償の性能が高いことが見込めるチャネル内相関の高いチャネルのみにおいてチャネル内補償を行い、他チャネルに対してはチャネル内補償を行う代わりに、正しく復号されているモノラル復号信号を用いてモノラル信号と各チャネル信号との信号間の関係から補償信号を生成することで、消失フレームの補償品質をさらに向上させることができ、復号音声の品質を向上させることができる。
(実施の形態3)
実施の形態3に係る音声復号装置は、実施の形態1に示したチャネル内補償方法により得られたステレオ補償信号を用いてモノラル信号を生成し、生成されたモノラル信号と、正常に受信されたモノラル信号符号化データから得られたモノラル復号信号との類似度を算出する。そして、類似度が予め設定されたレベル以下である場合には、音声復号装置はモノラル復号信号でステレオ補償信号を代用する。
図9は、本実施の形態に係るチャネル内補償部306の内部の構成を示すブロック図である。なお、図9に示すチャネル内補償部306は、図1に示したチャネル内補償部106に対して、さらにモノラル補償信号生成部361、類似度判定部362、ステレオ信号複製部363、およびスイッチ364を備える。
モノラル補償信号生成部361は、チャネル信号波形外挿部162から入力される第1チャネル内補償信号Sd_ch1(n)と、チャネル信号波形外挿部163から入力される第2チャネル内補償信号Sd_ch2(n)と、を用い、下記の式(20)に従ってモノラル補償信号Mr(n)を算出して類似度判定部362に出力する。
類似度判定部362は、モノラル補償信号生成部361から入力されるモノラル補償信号Mr(n)と、モノラル信号復号部101から入力されるモノラル復号信号Md(n)
との類似度を算出し、さらに算出された類似度が閾値以上であるか否かを判定し、判定結果をスイッチ364に出力する。ここで、モノラル補償信号Mr(n)と、モノラル復号信号Md(n)との類似度としては、例えば、この2つの信号間の相互相関、またはこの2つの信号間の平均誤差の逆数、またはこの2つの信号間の誤差の2乗和の逆数、または2つの信号間のSNR(いずれかの信号に対する、信号間の誤差信号のSNR:Signal to Noise ratio)を用いる。
ステレオ信号複製部363は、モノラル信号復号部101から入力されるモノラル復号信号Md(n)を両チャネルの補償信号として複製し、生成されるステレオ複製信号をスイッチ364に出力する。
スイッチ364は、類似度判定部362から入力される判定結果に基づき、モノラル補償信号Mr(n)と、モノラル復号信号Md(n)との類似度が閾値以上である場合には、ステレオ信号合成部164から入力されるステレオ合成信号をチャネル内補償信号として出力し、モノラル補償信号Mr(n)と、モノラル復号信号Md(n)との類似度が閾値より低い場合には、ステレオ信号複製部363から入力されるステレオ複製信号をチャネル内補償信号として出力する。
このように、本実施の形態によれば、音声復号装置のチャネル内補償処理においては、波形外挿により得られる第1チャネル内補償信号と第2チャネル内補償信号とを用いて生成されるモノラル補償信号と、モノラル信号符号化データの復号により得られるモノラル復号信号との類似度が閾値以上である場合には、波形外挿により得られる第1チャネル内補償信号と第2チャネル内補償信号とを用いた合成を行ってチャネル内補償信号を得、上記類似度が閾値より低い場合には、モノラル復号信号を両チャネルに複製して得られるチャネル内補償信号を得る。このように、チャネル内補償時に、モノラル復号信号を利用して補償性能の検証を行う、すなわち、チャネル内補償により得られるステレオ補償信号を用いて算出したモノラル補償信号と、正しく復号されているモノラル復号信号との間の波形の類似度を参照し、その類似度が低い場合はチャネル内補償が適切に行われなかったと判定し、得られたステレオ補償信号を補償信号には用いないことで、チャネル内補償により起こり得る補償性能の低下を回避し、音声復号装置のチャネル内補償の性能をさらに向上させることができ、復号音声の品質を向上させることができる。
(実施の形態4)
実施の形態4では、ステレオ補償信号の切替の判定を符号化側において行い、判定結果を復号側に伝送する。
図10は、本実施の形態に係る音声符号化装置400の主要な構成を示すブロック図である。
図10において、音声符号化装置400は、モノラル信号生成部401、モノラル信号符号化部402、サイド信号符号化部403、補償信号切替判定部404、および多重化部405を備える。
モノラル信号生成部401は、入力されるステレオ音声信号の第1チャネル信号S_ch1(n)および第2チャネル信号S_ch2(n)を用い、上記の式(1)および式(2)に従ってモノラル信号M(n)およびサイド信号S(n)生成する。モノラル信号生成部401は、生成されるモノラル信号M(n)をモノラル信号符号化部402に出力し、サイド信号S(n)をサイド信号符号化部403に出力する。
モノラル信号符号化部402は、モノラル信号生成部401から入力されるモノラル信
号M(n)を符号化し、生成されるモノラル信号符号化データを多重化部405に出力する。
サイド信号符号化部403は、モノラル信号生成部401から入力されるサイド信号S(n)を符号化し、生成されるサイド信号符号化データを、後述する音声復号装置500に出力する。
補償信号切替判定部404は、実施の形態1に示した補償信号切替判定部104(図2参照)と基本的に同様であり、1フレーム前のステレオ復号信号Sdp_ch1(n)、Sdp_ch2(n)およびモノラル復号信号Mdp(n)の代わりに、現フレームのステレオ信号S_ch1(n)、S_ch2(n)およびモノラル信号M(n)を用いて補償信号切替の判定を行う点のみにおいて補償信号切替判定部104と相違する。つまり、補償信号切替判定部404は、現フレームのステレオ信号S_ch1(n)、S_ch2(n)およびモノラル信号M(n)を用いて算出したチャネル間相関度およびチャネル内相関度に基づき、チャネル間補償部105で得られるチャネル間補償信号とチャネル内補償部106で得られるチャネル内補償信号との何れをステレオ補償信号とするかを判定し、判定結果を示す切替フラグを多重化部405に出力する。
多重化部405は、モノラル信号符号化部402から入力されるモノラル信号符号化データと、補償信号切替判定部404から入力される切替フラグとを多重し、得られる多重データを、モノラル信号符号化レイヤのデータとして、後述する音声復号装置500に出力する。
図11は、本発明の実施の形態4に係る音声復号装置500の主要な構成を示すブロック図である。なお、図11に示す音声復号装置500は、図1に示した音声復号装置100と基本的に同様であり、補償信号切替判定部104を備えず、多重データ分離部501を備え、切替フラグが多重データ分離部501から補償信号切替部107に出力される点において音声復号装置100と相違する。また、消失フレーム補償部520は、補償信号切替判定部104を備えない点で、消失フレーム補償部120と構成が異なるため、異なる符号を付す。
多重データ分離部501は、音声符号化装置400から伝送される多重データをモノラル信号符号化データと切替フラグとに分離し、モノラル信号符号化データをモノラル信号復号部101に出力し、切替フラグを補償信号切替部107に出力する。
このように、本実施の形態によれば、音声符号化装置において、現フレームのステレオ信号およびモノラル信号を用いてチャネル間相関およびチャネル内相関を算出し現フレームの補償信号の切替の判定を行い、判定結果を音声復号装置に伝送するため、フレーム消失が生じる当該フレームでのチャネル間およびチャネル内相関に応じて、より正確な切替判定を行うことができ、復号音声の品質を向上させることができる。
また、判定フラグをモノラル信号符号化データに多重してモノラル信号符号化レイヤのデータとして伝送することで、復号側で、モノラル信号符号化レイヤのデータのみを受信でき、ステレオ信号符号化レイヤのデータが受信できない場合でも、切替フラグの情報を受信することができ、上記に示すより正確な切替判定を行うことができ、復号音声の品質を向上させることができる。
なお、本実施の形態に係る音声復号装置は、本実施の形態に係る音声符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明したが、本発明はこれに限定されず、本実施の形態に係る音声復号装置が受信して処理するビットストリームは
、この音声復号装置で処理可能なビットストリームを生成可能な音声符号化装置が送信したものであれば良い。
(実施の形態5)
実施の形態5では、ステレオ補償信号の切替の判定を符号化側において行い、判定結果を復号側に伝送する実施の形態4において、判定結果をサイド信号符号化データと多重化して伝送する。
図12は、本実施の形態に係る音声符号化装置600の主要な構成を示すブロック図である。
図12において、音声符号化装置600は、モノラル信号生成部401、モノラル信号符号化部402、サイド信号符号化部403、補償信号切替判定部404、および多重化部605を備える。
本実施の形態に係る音声符号化装置600は、実施の形態4に示した音声符号化装置400(図10参照)と基本的に同様であり、多重化部405に代えて多重化部605を備える点のみにおいて相違する。なお、図12の本実施の形態に係る音声符号化装置600において、図10と共通する構成部分には、図10と同一の符号を付して詳しい説明を省略する。
多重化部605は、サイド信号符号化部403から入力されるサイド信号符号化データと、補償信号切替判定部404から入力される切替フラグとを多重し、得られる多重データを、ステレオ信号符号化レイヤのデータとして、後述する音声復号装置700に出力する。
次に、本実施の形態に係る音声符号化装置600おいて、サイド信号符号化部403が変換符号化方式を用いてサイド信号を符号化する場合の、サイド信号符号化部403、補償信号切替判定部404および多重化部605の動作について説明する。
サイド信号符号化部403は、モノラル信号生成部401から入力される現フレーム(第nフレームとする)のサイド信号を、変換符号化方式を用いて符号化し、生成されるサイド信号符号化データを多重化部605に出力する。
補償信号切替判定部404は、現フレームのステレオ信号S_ch1(n)、S_ch2(n)およびモノラル信号M(n)を用いて現フレーム(第nフレーム)に対する補償信号の切替判定を行い、その判定結果を示す切替フラグを多重化部605に出力する。
多重化部605は、サイド信号符号化部403から入力される、現フレームに対するサイド信号符号化データと、補償信号切替判定部404から入力される現フレームに対する切替フラグとを多重し、得られる多重データを、後述する音声復号装置700に出力する。
図13は、本発明の実施の形態5に係る音声復号装置700の主要な構成を示すブロック図である。なお、図13に示す音声復号装置700は、図11に示した実施の形態4における音声復号装置500と基本的に同様であり、多重データ分離部701が、多重データをサイド信号符号化データと切替フラグとに分離して出力する点において音声復号装置500と相違する。
次に、本実施の形態に係る音声復号装置700において、ステレオ信号復号部102が
変換符号化方式によりステレオ信号を復号する場合の動作について説明する。
ステレオ信号復号部102から出力されたステレオ復号信号は、変換符号化方式を用いた符号化および復号において変換窓の重ね合わせ加算のために、遅延部103によって1フレーム遅延される。現フレーム(第nフレーム)に対応するフレーム消失フラグが消失ありを示し、現フレームの受信データ(サイド信号符号化データ)がフレーム消失した場合、その影響は前フレーム(第n−1フレーム)および現フレーム(第nフレーム)の2フレームに影響を及ぼし、2フレーム分の補償が必要になる。
その際、補償信号切替部107において、前フレームの補償は、前フレームの多重データから分離された、前フレームに対応する切替フラグに基づき行われ、前フレームのステレオ補償信号が出力信号切替部130に出力される。また、補償信号切替部107において、現フレームの補償は、次フレーム(第n+1フレーム)の多重データから分離された、次フレームに対応する切替フラグが示す補償モードに基づき行われ、現フレームのステレオ補償信号が出力信号切替部130に出力される。このように、補償信号切替部107は、補償対象フレームに応じて定められた対応フレームの切替フラグを参照して、チャネル間補償部105で得られるチャネル間補償信号とチャネル内補償部106で得られるチャネル内補償信号との何れかをステレオ補償信号として出力信号切替部130に出力する。
このように、本実施の形態によれば、音声復号装置において、ステレオ信号復号部102が変換符号化方式により復号を行う場合、現フレームの受信データがフレーム消失すると、前フレームに対応する切替フラグが示す補償モードに基づき前フレームの補償を行うので、フレーム消失による補償対象フレーム(前フレーム)でのチャネル間およびチャネル内相関に応じて、より正確な切替判定に基づき補償を行うことができ、復号音声の品質を向上させることができる。
なお、本実施の形態に係る音声復号装置は、現フレームがフレーム消失した場合には、前フレームの補償を行い前フレームのステレオ補償信号を生成・出力し、次フレームで、現フレーム(次フレームから見ると前フレーム)の補償を行い現フレームのステレオ補償信号を生成・出力するため、当該補償方法により新たな追加遅延は生じない。
また、本実施の形態に係る音声復号装置は、本実施の形態に係る音声符号化装置が送信したビットストリームを受信して処理を行う場合を例にとって説明したが、本発明はこれに限定されず、本実施の形態に係る音声復号装置が受信して処理するビットストリームは、この音声復号装置で処理可能なビットストリームを生成可能な音声符号化装置が送信したものであれば良い。
以上、本発明の各実施の形態について説明した。
なお、本発明に係る音声復号装置、音声符号化装置および消失フレーム補償方法は、上記各実施の形態に限定されず、種々変更して実施することが可能である。例えば、各実施の形態は、適宜組み合わせて実施することが可能である。
例えば、上記各本実施の形態では、音声符号化装置において上記の式(1)および式(2)に従ってモノラル信号およびサイド信号を生成する場合を例にとって説明したが、本発明はこれに限定されず、上記モノラル信号およびサイド信号は他の方法により求められても良い。
また、上記各実施の形態に係る消失フレーム補償方法は、ある一部の帯域、例えば7k
Hz以下の低域にのみ適用し、他の帯域、例えば7kHzより高い高域に対しては別の消失フレーム補償方法を適用しても良い。
また、上記各実施の形態においては、チャネル内補償処理に必要なピッチパラメータやLPCパラメータを現フレーム(補償フレーム)のモノラル復号信号から求めても良い。また、チャネル内相関は、現フレームと1フレーム前のモノラル復号信号とを用いて算出しても良い。このように、1フレーム前のステレオ復号信号の代わりに補償フレームのモノラル復号信号を用いることにより、より推定精度の高い補償のためのパラメータを得ることができる。
また、比較に用いる閾値、レベル等は、固定値であっても、条件等により適宜設定される可変の値であっても良く、比較が実行されるまでに予め設定された値であれば良い。
また、上記各実施の形態では、符号化側では、ステレオ信号符号化としてサイド信号を符号化し、復号側では、サイド信号符号化データを復号してステレオ復号信号を生成する場合を例に説明したが、ステレオ信号の符号化方法はこれに限らない。例えば、符号化側で、モノラル信号符号化部において符号化した後に、局部復号したモノラル復号信号と入力のステレオ信号(第1チャネル信号および第2チャネル信号)を符号化して得られるステレオ信号符号化データを復号側へ伝送し、復号側でそのステレオ信号符号化データおよびモノラル復号信号から、第1チャネル復号信号および第2チャネル復号信号を復号してステレオ復号信号として出力するようにしても良い。この場合でも、上記のいずれの実施の形態においても同様のフレーム補償を行うことができる。
また、上記各実施の形態に係る音声復号装置および音声符号化装置を、移動体通信システムにおいて使用される無線通信移動局装置や無線通信基地局装置等の無線通信装置に搭載することも可能である。
また、上記実施の形態では、本発明をハードウェアで構成する場合を例にとって説明したが、本発明はソフトウェアで実現することも可能である。
また、上記実施の形態の説明に用いた各機能ブロックは、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されてもよいし、一部又は全てを含むように1チップ化されてもよい。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサーを利用してもよい。
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適用等が可能性としてありえる。
2007年12月28日出願の特願2007−339852及び2008年5月30日出願の特願2008−143936に含まれる明細書、図面及び要約書の開示内容は、すべて本願に援用される。
本発明は、移動体通信システムやインターネットプロトコルを用いたパケット通信システム等における通信装置等の用途に適用できる。
本発明の実施の形態1に係る音声復号装置の主要な構成を示すブロック図
図1に示した補償信号切替判定部の内部の構成を示すブロック図
図1に示したチャネル間補償部の内部の構成を示すブロック図
図1に示したチャネル内補償部の内部の構成を示すブロック図
図4に示したチャネル信号波形外挿部の内部の構成を示すブロック図
本発明の実施の形態1に係るチャネル間補償の動作を概念的に説明するための図
本発明の実施の形態1に係るチャネル内補償の動作を概念的に説明するための図
本発明の実施の形態2に係るチャネル内補償部の内部の構成を示すブロック図
本発明の実施の形態3に係るチャネル内補償部の内部の構成を示すブロック図
本発明の実施の形態4に係る音声符号化装置の主要な構成を示すブロック図
本発明の実施の形態4に係る音声復号装置の主要な構成を示すブロック図
本発明の実施の形態5に係る音声符号化装置の主要な構成を示すブロック図
本発明の実施の形態5に係る音声復号装置の主要な構成を示すブロック図