本発明の信号分析制御システムの実施の形態について図面を参照して詳細に説明する。
図1を参照し、本発明の信号分析制御システムの第一の実施の形態について説明する。本発明の信号分析制御システムは、送信部10と受信部15とが伝送路で接続された構成である。送信部10は、複数音源から構成される入力信号を受信し、伝送信号を出力する。伝送信号は、伝送路を介して、受信部15に入力される。受信部15は、伝送信号を受信し、出力信号を出力する。また、送信部、伝送路、受信部をそれぞれ、録音部、蓄積媒体、再生部としてもよい。
送信部10は、符号化部100、信号分析部101及び多重化部102から構成される。入力信号は、符号化部100及び信号分析部101に入力される。信号分析部101は、入力信号に含まれる各音源に対応した構成要素の関係を表す分析情報を算出する。信号分析部101は、分析情報を多重化部102に出力する。符号化部100は、入力信号を符号化する。符号化部100は、符号化信号を多重化部102に出力する。多重化部102は、符号化部100から入力される符号化信号と信号分析部101から入力される分析情報とを多重化する。多重化部102は、多重化された信号を伝送信号として伝送路に出力する。
受信部15は、復号部150、信号制御部151及び分離部152から構成される。まず、伝送信号は分離部152に入力される。分離部152は、伝送信号を主信号と分析情報に分離する。続いて、分離部152は、主信号を復号部150に、分析情報を信号制御部151にそれぞれ出力する。復号部150は、主信号を復号し、復号信号を生成する。そして、復号部150は、復号信号を信号制御部151に出力する。ここで、復号信号は一般的な複数音源から構成されるものである。信号制御部151は、分離部152から受信した分析情報に基づいて、復号部150から受けた復号信号を、各音源に対応した構成要素ごとに操作する。信号制御部151は、操作された信号を出力信号として出力する。信号制御部151は、各音源に対応した構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作してもよい。
続いて、図2を参照して、符号化部100の構成例を詳細に説明する。符号化部100は、入力信号を受信し、符号化信号を出力する。符号化部100は、変換部110と量子化部111とから構成される。まず、入力信号が、変換部110に入力される。次に、変換部110は、入力信号を周波数成分に分解し、第一の変換信号を生成する。変換部110は、第一の変換信号を量子化部111に出力する。そして、量子化部111は、第一の変換信号を量子化し、符号化信号として出力する。
変換部110は、複数の入力信号サンプルをまとめて、1ブロックを構成し、このブロックに対して周波数変換を適用する。周波数変換の例としては、フーリエ変換、コサイン変換、KL(カルーネンレーベ)変換などが知られている。これらの変換の具体的な演算に関連する技術及びその性質は、非特許文献2(1990年、「ディジタル・コーディング・オブ・ウェーブフォームス」、プレンティス・ホール(DIGITAL CODING OF WAVEFORMS, PRINCIPLES AND APPLICATIONS TO SPEECH AND VIDEO, PRENTICE-HALL, 1990.))に開示されている。
変換部110はまた、1ブロックの入力信号サンプルを窓関数で重み付けした結果に対して、前述の変換を適用することができる。このような窓関数としては、ハミング、ハニング(ハン)、ケイザー、ブラックマンなどの窓関数が知られている。また、さらに複雑な窓関数を用いることもできる。これらの窓関数に関連する技術は、非特許文献3(1975年、「ディジタル・シグナル・プロセシング」、プレンティス・ホール(DIGITAL SIGNAL PROCESSING, PRENTICE-HALL, 1975.))及び非特許文献4(1993年、「マルチレートシステムズ・アンド・フィルタバンクス」、プレンティス・ホール(MULTIRATE SYSTEMS AND FILTER BANKS, PRENTICE-HALL, 1993.))に開示されている。
変換部110が複数の入力信号サンプルから1ブロックを構成する際に、各ブロックに重なり(オーバラップ)を許容してもよい。例えば、ブロック長の30%のオーバラップを適用する場合には、あるブロックに属する信号サンプルの最後30%は、次のブロックに属する信号サンプルの最初30%として複数のブロックで重複して用いられる。オーバラップを有するブロック化と変換に関連する技術は、非特許文献2に開示されている。
さらに、変換部110は、帯域分割フィルタバンクで構成してもよい。帯域分割フィルタバンクは、複数の帯域通過フィルタから構成される。帯域分割フィルタバンクは、受信した入力信号を複数の周波数帯域に分割して、量子化部111に出力する。帯域分割フィルタバンクの各周波数帯域は等間隔であってもよいし、不等間隔であってもよい。不等間隔に帯域分割することによって、低域では狭い帯域に分割して時間分解能を低く、高域では広い帯域に分割して時間分解能を高くすることができる。不等間隔分割の代表例には、低域に向かって帯域が逐次半分になるオクターブ分割や人間の聴覚特性に対応した臨界帯域分割などがある。帯域分割フィルタバンクとその設計法に関連する技術は、非特許文献4に開示されている。
量子化部111は、入力された信号の冗長性を除去し、符号化信号を出力する。冗長性を除去する方法としては、入力された信号の相関が最小となるように制御する。さらに、マスキング効果などの聴覚特性を利用し、聴覚上認知されない信号成分を除去してもよい。量子化方法としては、線形量子化、非線形量子化などの量子化方法が知られている。量子化された信号は、ハフマン符号化などを用いてさらに、冗長性を取り除くことができる。
図3を参照して、復号部150の構成例を詳細に説明する。復号部150は、主信号を受信し、復号信号を出力する。復号部150は、逆量子化部160と逆変換部161とから構成される。逆量子化部160は、受信した各周波数の主信号を逆量子化し、複数の周波数成分から構成される第一の変換信号を生成する。そして、逆量子化部160は、第一の変換信号を逆変換部161に出力する。逆変換部161は、第一の変換信号を逆変換して、復号信号を生成する。そして逆変換部161は、復号信号を出力する。
逆変換部161が適用する逆変換は、変換部110が適用する変換と対応する逆変換が選択されることが望ましい。例えば、変換部110が、複数の入力信号サンプルをまとめて1ブロックを構成し、このブロックに対して周波数変換を適用するときには、逆変換部161は同一数のサンプルに対して対応する逆変換を適用する。また、変換部110が複数の入力信号サンプルから1ブロックを構成する際に、各ブロックに重なり(オーバラップ)を許容する場合には、これに対応して、逆変換部161は逆変換後の信号に対して同一のオーバラップを適用する。さらに、変換部110を帯域分割フィルタバンクで構成するときには、逆変換部161を帯域合成フィルタバンクで構成する。帯域合成フィルタバンクとその設計法に関連する技術は、非特許文献4に開示されている。
図2及び図3の符号化部100と復号部150の説明では、内部に変換部を含む変換符号化を想定して説明したが、パルス符号変調(PCM)、適応差分パルス符号変調(ADPCM)、さらにCELPなどに代表される分析合成符号化を適用してもよい。PCM/ADPCMに関連する技術は非特許文献2に開示されている。また、CELPに関連する技術は非特許文献5(1985年3月、アイ・イー・イー・イー・インターナショナル・カンファレンス・オン・アクースティック・スピーチ・アンド・シグナル・プロセシング、25.1.1、 (IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 25.1.1, MAR, 1985, pp.937-940) 937〜940ページ)に開示されている。
また、符号化部100は、符号化処理を行わずに入力信号をそのまま多重化部102へ出力し、復号部150は、復号処理を行わずに主信号をそのまま信号制御部151に入力してもよい。この構成により、符号化・復号処理に伴う信号の歪をなくすことができる。さらに、無歪の圧縮・伸張処理を符号化部100および復号部150で行うように構成してもよい。この構成により、信号制御部151は、入力信号に歪を生じさせることなく復号信号を受信することができる。
図4を参照し、信号分析部101の構成例を詳細に説明する。信号分析部101は、入力信号を受信し、分析情報を出力する。信号分析部101は、変換部120と分析情報生成部121とから構成される。変換部120は、受信した入力信号を周波数成分に分解し、第二の変換信号を生成する。変換部120は、第二の変換信号を分析情報生成部121に出力する。分析情報生成部121は、第二の変換信号を音源に対応した構成要素に分解し、複数の構成要素間の関係を表す分析情報を生成する。そして、分析情報生成部121は、分析情報を出力する。また、分析情報生成部121は、第二の変換信号を複数の構成要素から構成される構成要素群に分解し、分析情報を計算してもよい。信号分析部101は、分析情報に冗長性があるときには、分析情報を符号化してもよい。これにより、分析情報の冗長性を最小化することが出来る。変換部120における変換の方式に関しては、変換部110における変換の方式を用いてもよい。
図5を参照して、信号制御部151の構成例を詳細に説明する。信号制御部151は、復号信号と分析情報とを受信し、出力信号を出力する。信号制御部151は、変換部171、信号処理部172及び逆変換部173から構成される。変換部171は、受信した復号信号を周波数成分に分解し、第二の変換信号を生成する。信号制御部151は、第二の変換信号を信号処理部172に出力する。信号処理部172は、第二の変換信号を、分析情報を用いて音源に対応した構成要素に分解し、複数の構成要素間の関係を変更し、修正復号信号を生成する。そして、信号処理部172は、修正復号信号を逆変換部173に出力する。また、信号処理部172は、複数の構成要素から構成される構成要素群に分解し、複数の構成要素間の関係を変更してもよい。分析情報生成部121において分析情報が符号化されている場合には、信号処理部172は復号処理を行ってから上記の処理を行う。逆変換部173は、修正復号信号を逆変換し、出力信号を生成する。そして、逆変換部173は出力信号を出力する。逆変換部173における逆変換の方式に関しては、逆変換部161における逆変換の方式を用いることが出来る。
以上説明したように、本発明の第一の実施の形態によれば、送信部から出力される入力信号の分析情報に基づいて、受信部で複数音源から構成される入力信号を各音源に対応した構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。
続いて、本発明の第二の実施の形態について詳細に説明する。本発明の第二の実施の形態は、音源として目的音と背景音とから構成される入力信号を制御するものである。第二の実施の形態の構成は図1で表される。第一の実施の形態とは、信号分析部101と信号制御部151の構成が異なる。信号分析部101は、目的音と背景音とから構成される入力信号とを受信し、目的音と背景音との関係を表す情報を分析情報として多重化部102に出力する。また、信号制御部151は、復号信号と分析情報とを受信し、目的音と背景音を制御して出力信号を生成し、出力する。
第一の実施例は、信号分析部101が、分析情報として抑圧係数を計算する。抑圧係数は、目的音と背景音とから構成される入力信号に作用させることによって、背景音を抑圧するものである。信号制御部151は抑圧係数を用いて復号信号を制御する。信号分析部101の構成は図4で表される。本実施例の分析計情報計算部121の構成は、第一の実施の形態の分析計情報計算部121と異なる。また、信号制御部151は図5で表される。本実施例の信号処理部172の構成は、第一の実施の形態の信号制御部151と異なる。
図6を参照して、分析情報生成部121の構成例を詳細に説明する。分析情報生成部121は、第二の変換信号を受信し、分析情報として抑圧係数を出力する。分析情報生成部121は、背景音推定部200と背景音情報生成部202とから構成される。背景音推定部200は、第二の変換信号を受信し、背景音の推定を行い、背景音の情報を生成する。背景音推定部200は、背景音の情報を背景音情報生成部202に出力する。背景音の情報としては、背景音の振幅絶対値やエネルギ、背景音と入力信号との振幅比やエネルギ比及びこれらの平均値などがある。背景音情報生成部202は、第二の変換信号と背景音の情報とを受信する。背景音情報生成部202は、第二の変換信号と背景音の情報とに基づいて、抑圧係数を計算する。そして、背景音情報生成部202は、抑圧係数又は符号化された抑圧係数を分析情報として出力する。
図7を参照して、背景音情報生成部202の構成例を詳細に説明する。背景音情報生成部202は、第二の変換信号と背景音の情報とを受信し、分析情報として抑圧係数を出力する。背景音情報生成部202は、抑圧係数計算部201と抑圧係数符号化部2021から構成される。抑圧係数計算部201は、第二の変換信号と背景音の情報とを用いて、背景音を抑圧するための適切な抑圧係数を計算する。そして、抑圧係数計算部201は、抑圧係数を抑圧係数符号化部2021に出力する。抑圧係数の計算方法に関連する技術としては、非特許文献6(1984年12月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第32巻、第6号、 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.32, NO. 6, PP. 1109-1121, Dec. 1984) 1109〜1121ページ)に最小平均二乗誤差短時間スペクトル振幅に基づく方法(MMSE STSA)、非特許文献7(1985年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第33巻、第2号、 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.33, NO. 2, PP. 443-445, Apr. 1985) 443〜445ページ)に最小平均二乗誤差対数スペクトル振幅に基づく方法(MMSE LSA)、非特許文献8(2005年7月、ユーラシップ・ジャーナル・オン・アプライド・シグナル・プロセシング、第2005巻、第7号、 (EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, VOLUME 2005, Issue 7, JUL, 2005, pp.1110-1126.)1110〜1126ページ)に最小平均二乗誤差短時間スペクトル振幅に基づく方法(MMSE STSA)などが開示されている。
抑圧係数符号化部2021は、抑圧係数を受け、符号化する。抑圧係数符号化部2021は、符号化された抑圧係数を分析情報として出力する。抑圧係数符号化部2021は、線形量子化、非線形量子化などの量子化を行い、ハフマン符号化などにより符号化された抑圧係数を出力する。これにより、抑圧係数の冗長性を除去することが出来る。また、抑圧係数符号化部2021は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、抑圧係数を分析情報として出力してもよい。
次に、図8を参照して、信号処理部172の構成例を詳細に説明する。信号処理部172は、第二の変換信号と分析情報とを受信し、修正復号信号を出力する。信号処理部172は、抑圧係数再構成部250と乗算器251とから構成される。第二の変換信号が乗算器251に入力され、分析情報が抑圧係数再構成部250に入力される。抑圧係数再構成部250は、入力された分析情報を用いて抑圧係数を再構成し、抑圧係数を乗算器251に出力する。乗算器251は、第二の変換信号と抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を逆変換部173に出力する。
図9を参照して、抑圧係数再構成部250の構成例を詳細に説明する。抑圧係数再構成部250は、分析情報として符号化された抑圧係数を受信し、抑圧係数を出力する。抑圧係数再構成部250は、抑圧係数復号部260から構成される。抑圧係数復号部260は、受信した抑圧係数を復号する。抑圧係数が符号化されていないときには、抑圧係数復号部260は、復号動作を行わず、抑圧係数を出力する。
第二の実施例では、信号分析部101が分析情報として信号対背景音比を計算する。これに対応して、信号制御部151は、信号対背景音比に基づいて抑圧係数を計算する。信号制御部151は、この抑圧係数を用いて復号信号を制御する。これにより、目的音と背景音とから構成される入力信号において、背景音が抑圧された信号を得ることが出来る。
まず、信号分析部101について説明する。信号分析部101は、第一の実施例と同じく、図4で表される。本実施例と第一の実施例とを比較すると、図6で示される分析情報生成部121に含まれる背景音情報生成部202の構成が異なる。
図10を参照して、本実施例の背景音生成部202について詳細に説明する。背景音情報生成部202は、第二の変換信号と背景音の情報とを受信し、分析情報として符号化された信号対背景音比を出力する。背景音情報生成部202は、抑圧係数計算部201、信号対背景音比計算部203、及び信号対背景音比符号化部204から構成される。抑圧係数計算部201は、第二の変換信号と背景音の情報とを用いて、背景音を抑圧するための適切な抑圧係数を計算する。そして、抑圧係数計算部201は、信号対背景音比計算部203に抑圧係数を出力する。抑圧係数の計算方法は、図7に示される第一の実施例の抑圧係数計算部201の計算方法を用いることが出来る。信号対背景音比計算部203は、入力された抑圧係数Gを用いて、信号対背景音比Rを計算する。入力信号をX、目的音をS、背景音をNとすると、次の関係が成立する。
[数3]
この定義によるRは、背景音が雑音であるときに、事前信号対雑音比(事前SNR)として知られている。式[数1]と[数2]を[数3]に代入すると、
信号対背景音比計算部203は、計算した信号対背景音比Rを信号対背景音比符号化部204に出力する。信号対背景音比符号化部204は、入力された信号対背景音比Rを符号化する。信号対背景音比符号化部204は、符号化された信号対背景音比Rを分析情報として出力する。符号化処理の詳細については、抑圧係数符号化部2021における符号化処理と同様の符号化処理を用いることが出来る。これにより、信号対背景音比Rの冗長性を除去することが出来る。また、信号対背景音比符号化部204は、情報量を削減する必要がない場合には、信号対背景音比Rの符号化処理を行わずに、信号対背景音比を分析情報として出力してもよい。
次に、本実施例の信号制御部151について詳細に説明する。信号制御部151は、第一の実施例と同じく、図5で表される。本実施例と第一の実施例とは、図8に示される信号処理部172に含まれる抑圧係数再構成部250の構成が異なる。
図11を参照して、抑圧係数再構成部250の構成例を詳細に説明する。抑圧係数再構成部250は、符号化された信号対背景音比Rを分析情報として受信し、抑圧係数Gを出力する。抑圧係数再構成部250は、信号対背景音比復号部261と抑圧係数変換部262から構成される。信号対背景音比復号部261は、受信した符号化された信号対背景音比Rを復号し、信号対背景音比Rを抑圧係数変換部262に出力する。信号対背景音比Rが符号化されていないときには、信号対背景音比復号部261は、復号動作を行わず、信号対背景音比を出力する。抑圧係数変換部262は、信号対背景音比Rを抑圧係数Gに変換する。そして、抑圧係数変換部262は、抑圧係数Gを出力とする。RからGへの変換は、[数4]に基づいて行う。[数4]をGについて解くと、
また、図12を参照して、背景音情報生成部202の他の構成例を詳細に説明する。図10に示される背景音情報生成部202と比較すると、本構成例の背景音情報生成部202は抑圧係数計算部201を備えていない点が異なる。図12に示される背景音情報生成部202の構成では、信号対背景音比Rの定義として、[数3]の代わりに[数6]が用いられる。この定義によるRは、背景音が雑音であるときに、事後信号対雑音比(事後SNR)として知られている。
[数6]
すなわち、本構成例は、背景音が雑音である場合には、事前SNRに代えて事後SNRを分析情報として用いる構成である。[数6]のRは、抑圧係数Gを必要とせず、入力信号と背景音とから計算される。これにより、信号対背景音比計算部207は、第二の変換信号と背景音の情報とに基づいて、信号対背景音比を計算することができる。そして、信号対背景音比計算部207は、信号対背景音比を信号対背景音比符号化部204に出力する。信号対背景音比符号化部204の動作は、図10に示される信号対背景音比符号化部204の動作と同様であるので説明は省略する。
一方、[数1]と[数2]を[数6]に代入し、SとNが無相関であると仮定すると、
[数7]
を得る。すなわち、信号対背景音比計算部203において、[数7]を用いて信号対背景音比Rを計算しても良い。
本構成例において、受信側の図8に示される抑圧係数再構成部250は、上述の構成例と同じく、図11で表される。信号対背景音比復号部261は、受信した符号化された信号対背景音比Rを復号し、信号対背景音比Rを抑圧係数変換部262に出力する。抑圧係数変換部262は、信号対背景音比Rを抑圧係数Gに変換して、抑圧係数Gを出力する。RからGへの変換は、[数8]に基づいて行う。すなわち、[数7]をGについて解くと、
続いて第三の実施例について説明する。第三の実施例は、信号分析部101が背景音そのものを分析情報として出力する。これに対応して、信号制御部151は背景音を用いて復号信号を制御する。
まず、信号分析部101について説明する。信号分析部101は、第一の実施例と同じく、図4で表される。本実施例の分析情報生成部121の構成は、図6に示される第一の実施例の分析情報生成部121の構成と異なる。
図13を参照して、本実施例の分析情報生成部121の構成例について詳細に説明する。図6に示される第一の実施例の分析情報生成部121の構成例と比較すると、背景音情報生成部202が背景音符号化部205で構成されている。本構成例の分析情報生成部121は、第二の変換信号を受信し、分析情報として符号化された背景音を出力する。本構成例の分析情報生成部121は、背景音推定部200と背景音符号化部205とから構成される。本構成例の背景音推定部200は、背景音そのものを、背景音符号化部205に出力する。背景音符号化部205は、入力された背景音を符号化して出力する。これにより、背景音の冗長性を除去することが出来る。また、背景音符号化部205は、情報量を削減する必要がない場合には、背景音の符号化処理を行わずに、背景音を分析情報として出力してもよい。
符号化処理については、抑圧係数符号化部2021と同様の符号化処理を用いることが出来る。
次に、信号制御部151について説明する。信号制御部151は、第一の実施例と同じく、図5で表される。信号処理部172の構成は、図8に示される第一の実施例の信号処理部172の構成と異なる。
図14を参照して、本実施例の信号処理部172の構成例を詳細に説明する。図8に示される第一の実施例の信号処理部172の構成例と比較すると、抑圧係数再構成部250が抑圧係数計算部252で構成されている。信号処理部172は、第二の変換信号と分析情報として符号化された背景音を受信し、修正復号信号を出力する。信号処理部172は、抑圧係数計算部252と乗算器251とから構成される。第二の変換信号が抑圧係数計算部252及び乗算器251に入力され、符号化された背景音が分析情報として抑圧係数計算部252に入力される。抑圧係数計算部252は、背景音と第二の変換信号とに基づいて抑圧係数を計算する。そして、抑圧係数計算部252は、抑圧係数を乗算器251に出力する。乗算器251は、第二の変換信号と抑圧係数とを乗算し、修正復号信号を逆変換部173に出力する。
さらに、図15を参照して、抑圧係数計算部252の構成を詳細に説明する。抑圧係数計算部252は、背景音復号部263と抑圧係数生成部264から構成される。背景音復号部263は、分析情報として符号化された背景音を受信する。そして、背景音復号部263は、符号化された背景音を復号し、背景音を抑圧係数生成部264に出力する。背景音が符号化されていないときには、背景音復号部263は、復号動作を行わず、背景音を出力する。抑圧係数生成部264は、背景音と第二の変換信号とを受信する。そして、抑圧係数生成部264は、背景音と第二の変換信号とに基づいて背景音を抑圧するための適切な抑圧係数を計算する。この抑圧係数の計算は、図10に示される抑圧係数計算部201と同様の計算方法を用いてもよい。抑圧係数生成部264は、抑圧係数を出力する。抑圧係数の計算方法に関連する技術としては、前述の非特許文献6、非特許文献7、又は非特許文献8に開示されている技術がある。
さらに、図16を参照して信号処理部172の他の構成例を詳細に説明する。信号処理部172は、第二の変換信号と符号化された背景音とを受信し、背景音が除去された信号を修正復号信号として出力する。本構成例の信号処理部172は、背景音復号部263と減算器253とで構成されている。第二の変換信号が減算器253に入力され、分析情報として符号化された背景音が背景音復号部263に入力される。背景音復号部263は、符号化された背景音を復号し、背景音を減算器253に出力する。分析情報が符号化されていない背景音である場合には、背景音復号部263は不要である。減算器253は、第二の変換信号から背景音を減算する。そして、減算器253は、背景音が除去された信号を修正復号信号として出力する。背景音が雑音である場合、この減算はスペクトル減算として知られている。スペクトル減算に関連する技術が、非特許文献9(1979年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第27巻、第2号、 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.27, NO. 2, PP. 113-120, April 1979) 113〜120ページ)に開示されている。
また、減算器253には、減算に加えて、付加機能を含めることもできる。例えば、付加機能として、減算結果が負になるときにこれをゼロあるいは微小な正の値に補正する機能、減算結果の最小値を正の値に設定するリミッタ機能、又は背景音情報に対して係数を乗算したり定数を加算したりすることで修正してから減算する機能が挙げられる。
さらに、本実施の形態において、送信部10は、入力信号が複数チャンネルで構成される場合、上記の第一乃至第三の実施例の分析情報をチャンネル毎に独立に算出してもよい。また、送信部10は、入力信号の全チャンネルの和を算出し、和信号から全チャンネルで共通の分析情報を算出してもよい。あるいは、送信部10は、入力信号を複数のグループに分割して、各グループの入力信号の和を算出し、その和信号からグループで共通の分析情報を算出してもよい。これに対応して、受信部15は、各チャンネルに対応する分析情報を用いて復号信号を制御する。
また、上記の第一の実施例乃至第三の実施例で説明した分析情報は、複数の周波数帯域で共通の分析情報として算出されてもよい。たとえば、送信部10は、等間隔に周波数帯域を分割し、分割した周波数帯域毎に分析情報を算出してもよい。さらに、送信部10は、人間の聴覚特性にあわせ、低周波数帯域は細かく分割し、高周波数帯域は荒く分割し、分割した単位で分析情報を算出してもよい。これにより、分析情報の情報量を削減することができる。
以上説明したように、本発明の第二の実施の形態によれば、送信部で信号の分析を行うので、目的音と背景音とから構成される入力信号を制御することができる。さらに、送信部で抑圧係数又は信号対背景音比といった分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することが出来る。
続いて、図17を参照して、本発明の第三の実施の形態について詳細に説明する。本発明の第三の実施の形態において、受信部35は信号制御情報を受信できる構成を有し、特定の音源だけを独立に制御することができる。図17に示される第三の実施の形態と図1に示される第一の実施の形態とを比較すると、受信部15に含まれる信号制御部151が受信部35に含まれる信号制御部350で構成されている。また、本実施例において、送信部、伝送路、受信部をそれぞれ、録音部、蓄積媒体、再生部としてもよい。以降、図1と重複する部分の説明は省略する。
図18を参照して、信号制御部350の構成例について詳細に説明する。信号制御部350は、変換部171、信号処理部360及び逆変換部173から構成される。第一の実施の形態と比較すると、信号制御部151に含まれる信号処理部172が、本実施の形態では信号処理部360で構成されている。信号制御部350は、分析情報と信号制御情報とを受信し、出力信号を出力する。信号制御部350は、信号制御情報と分析情報とに基づいて、復号部150から受けた復号信号を、各音源に対応した構成要素ごとに操作する。また、信号制御部350は、各音源に対応した構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作することも可能である。信号処理部360は、変換部171からの第二の変換信号と信号制御情報とを受信する。信号処理部360は、分析情報と信号制御情報とに基づいて、第二の変換信号の周波数成分の構成要素を制御し、修正復号信号を生成する。信号処理部360は、修正復号信号を逆変換部173に出力する。
さらに、具体的には、信号処理部360は、分析情報に基づいて、周波数毎の分析パラメータを導出する。そして、信号処理部360は、第二の変換信号を、分析パラメータに基づいて、音源に対応した構成要素に分解する。さらに、信号処理部360は、信号制御情報に基づく周波数毎のパラメータに応じて、複数の構成要素間の関係を変更した修正復号信号を作成する。信号処理部360は、修正復号信号を逆変換部173に出力する。また、信号処理部360は、分析パラメータに基づいて、複数の構成要素から構成される構成要素群に分解してもよい。
続いて、修正復号信号の作成方法について、具体的に説明する。
ある周波数帯域fにおける復号信号の周波数成分(つまり、第二の変換信号)をXk(f), k=1,2,…,P(Pは復号信号のチャンネル数)、構成要素の周波数成分をYj(f), j=1,2,・・・,M(Mは構成要素数)、信号制御情報に基づいて修正した構成要素の周波数成分をY’j(f)、修正復号信号をX’k(f)とすると、分析パラメータにより規定される変換関数F501と、信号制御情報により規定される変換関数F502を用いて次の関係が成立する。
[数11]
ここで、変換関数F
503は修正構成要素を修正復号信号に変換する関数である。
また、関数F500、F501、F502、F503を統合して
[数12]
とすることもできる。このとき、変換関数F
504は分析パラメータと信号制御情報により規定される。
上記変換関数の具体例として、周波数帯域fの分析パラメータB(f)を、
[数13]
と表し、信号制御情報に応じて定まる周波数毎のパラメータA(f)を
[数15]
と表せる。すなわち、復号信号を修正復号信号に変換する行列はD(f)×A(f)×B(f)として計算できる。ここで、D(f)は任意のP行M列の行列であり、例えば、D(f)としてB(f)の逆行列を用いることができる。なお、[数15]から明らかなように、D(f)としてB(f)の逆行列を用いることは修正構成要素を修正復号信号に変換する操作として妥当である。
信号制御情報は、利用者によって外部から入力されることとしてもよい。例えば、外部から入力される信号制御情報としては、受信部に予め登録されていた利用者の嗜好などの個人情報、受信部の動作状態(スピーカをオフにしてあるなどの外部環境情報を含む)、受信部の種類や形式、電源や電池の利用状態や残量、アンテナの種類や状態(折りたたまれているなどの形状、向きなど)がある。また、信号制御情報は、別の形式で自動的に獲得されることとしてもよい。信号制御情報は、受信部内部または近傍に設置されたセンサを経由して、自動的に獲得されることとしてもよい。例えば、自動的に獲得される信号制御情報としては、外部雑音量、明るさ、時間帯、地理的な位置、気温、映像との同期情報、カメラを通じたバーコード情報などがある。
本発明の第三の実施の形態によれば、受信部で受けた信号制御情報に基づいて、特定の音源だけを独立に制御することができる。また、送信部で信号の分析を行い、受信部にて複数音源から構成される入力信号を各音源に対応した構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部の信号分析に係る演算量を削減することが出来る。
本発明の第四の実施の形態は、受信部に入力される信号制御情報を用いて、目的音と背景音とから構成される入力信号を目的音と背景音とを独立に制御する。図17を参照して、本実施の形態を詳細に説明する。本実施の形態と第二の実施の形態とを比較すると、図1に示される受信部15に含まれる信号制御部151が図17に示される受信部35に含まれる信号制御部350で構成されている。また、本実施の形態においては、信号制御情報が信号制御部350に入力されている。信号制御情報については、第三の実施の形態において用いたものと同様であり、説明は省略する。さらに、図18を参照して、信号制御部350の構成を説明する。信号制御部350は、変換部171、信号処理部360及び逆変換部173から構成される。第二の実施の形態と比較すると、図5に示される信号制御部151に含まれる信号処理部172が、本実施の形態では信号処理部360で構成されている。
続いて、第一の実施例について説明する。第一の実施例は、分析情報として抑圧係数を用いるものである。
図19を参照して、信号処理部360の構成例について詳細に説明する。第二の実施の形態と比較すると、信号処理部360は、図8に示される信号処理部172に含まれる抑圧係数再構成部250が抑圧係数再構成部450で構成されている。抑圧係数再構成部450は、外部から信号制御情報を受信している。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
信号処理部360は、第二の変換信号、分析情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、抑圧係数再構成部450と乗算器451とから構成される。第二の変換信号が乗算器451に入力され、分析情報と信号制御情報とが抑圧係数再構成部450に入力される。抑圧係数再構成部450は、入力された分析情報と信号制御情報とを用いて修正抑圧係数を生成する。修正抑圧係数は、信号制御情報を用いて分析情報として受信した抑圧係数を修正したものである。抑圧係数再構成部450は、修正抑圧係数を乗算器451に出力する。乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成する。乗算器451は、修正復号信号を逆変換部173に出力する。
図20を参照して、第一の実施例の抑圧係数再構成部450の構成を詳細に説明する。抑圧係数再構成部450は、抑圧係数修正部460を含む。第二の実施の形態の図9に示される抑圧係数再構成部250は、抑圧係数修正部460を含まない。抑圧係数修正部460は、外部から入力された信号制御情報を用いて、抑圧係数を修正する。この信号制御情報は、既に第三の実施の形態において用いたものと同様であり、説明は省略する。
抑圧係数再構成部450は、分析情報として符号化された抑圧係数と信号制御情報とを受信し、修正抑圧係数を出力する。抑圧係数再構成部450は、抑圧係数復号部260と抑圧係数修正部460から構成される。抑圧係数復号部260は、受信した抑圧係数を復号する。抑圧係数が符号化されていないときには、抑圧係数復号部260は、復号動作を行わず、抑圧係数を抑圧係数修正部460に出力する。抑圧係数修正部460は、外部から入力された信号制御情報を用いて、入力された抑圧係数を修正する。抑圧係数修正部460は、修正抑圧係数を出力する。
図21を参照して、抑圧係数修正部460の第一の構成例を詳細に説明する。抑圧係数修正部460は、抑圧係数と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、乗算器470から構成される。乗算器470は、抑圧係数と信号制御情報との積を計算し、修正抑圧係数を出力する。本構成例では、信号制御情報は、抑圧係数に対する倍率が入力される。このような構成により、簡易な信号制御情報により抑圧係数を制御することができる。
図22を参照して、抑圧係数修正部460の第二の構成例を詳細に説明する。抑圧係数修正部460は、抑圧係数と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、比較部471から構成される。比較部471は、抑圧係数と信号制御情報を比較して、その比較結果に応じた信号を出力する。例えば、比較部471は、最大比較を行う場合は、抑圧係数と信号制御情報との大きい方の値を出力する。また、比較部471は、最小比較を行うこととしてもよい。これらの場合には、信号制御情報は、抑圧係数の最大値または最小値が入力される。このような構成により、出力信号の範囲を予め規定することができ、想定外の信号が出力されて音質を損ねることを回避できる。
図23を参照して、抑圧係数修正部460の第三の構成例を詳細に説明する。抑圧係数修正部460の第三の構成例は、上述の第一の構成例と第二の構成例とを組み合わせたものである。抑圧係数修正部460は、抑圧係数と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、乗算器470、比較部471、指定抑圧係数制御部472及びスイッチ473から構成される。指定抑圧係数制御部472は、信号制御情報を乗算器470、比較部471、又はスイッチ473に出力する。ここで、信号制御情報には、乗算器470で使用する抑圧係数の倍率と、比較部471で使用する抑圧係数の最大値または最小値とを少なくとも含む。さらに、信号制御情報には、スイッチ473における選択のための制御情報が含まれても良い。指定抑圧係数制御部472は、信号制御情報として抑圧係数の倍率を受信した場合は、抑圧係数の倍率を乗算器470に出力する。乗算器470は、抑圧係数と抑圧係数の倍率との積を計算し、修正抑圧係数をスイッチ473に出力する。指定抑圧係数制御部472は、信号制御情報として抑圧係数の最大値または最小値を受信した場合は、抑圧係数の最大値または最小値を比較部471に出力する。比較部471は、抑圧係数と抑圧係数の最大値または最小値とを比較して、その比較結果に応じた信号を修正抑圧係数としてスイッチ473に出力する。指定抑圧係数制御部472は、選択のための制御情報を受信した場合は、制御情報をスイッチ47に出力する。スイッチ473は、指定抑圧係数制御部472から制御情報が入力された場合、その信号制御情報に応じて、乗算器470の出力または比較部471の出力のいずれかを選択して出力する。
次に、第二の実施例について説明する。第二の実施例は、目的音と背景音との構成比である信号対背景音比を分析情報として用いるものである。第二の実施例の信号処理部360は、図19で示される第一の実施例の信号処理部と同様であるが、抑圧係数再構成部450の構成が異なる。
図24を参照して、第二の実施例の抑圧係数再構成部450の構成例を詳細に説明する。図11に示す第二の実施の形態の抑圧係数再構成部250と比較すると、本構成例の抑圧係数再構成部450は、信号対背景音比修正部461をさらに含んでいる。
抑圧係数再構成部450は、符号化された信号対背景音比と信号制御情報とを受信し、修正抑圧係数を出力する。抑圧係数再構成部450は、信号対背景音比復号部261、信号対背景音比修正部461及び抑圧係数変換部262から構成される。信号対背景音比復号部261は、受信した符号化された信号対背景音比を復号し、信号対背景音比を信号対背景音比修正部461に出力する。信号対背景音比が符号化されていないときには、信号対背景音比復号部261は、復号動作を行わず、信号対背景音比を出力する。信号対背景音比修正部461は、外部から受けた信号制御情報を用いて、入力された信号対背景音比を修正し、修正信号対背景音比を生成する。信号対背景音比の修正については、第一の実施例における抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として信号対背景音比の倍率を入力することにより信号対背景音比を修正してもよい。また、信号制御情報として信号対背景音比の最大値または最小値を入力することにより信号対背景音比を修正しても良い。さらに、信号制御情報として信号対背景音比の倍率により修正された信号対背景音比と信号対背景音比の最大値または最小値により修正された信号対背景音比とを選択する制御情報を入力することにより修正してもよい。信号対背景音比修正部461は、修正信号対背景音比を抑圧係数変換部262に出力する。抑圧係数変換部262は、修正信号対背景音比を抑圧係数に変換し、修正抑圧係数を出力する。信号対背景音比を抑圧係数に変換する方法は、図11に示される抑圧係数変換部262と同様の変換方法を用いても良い。第二の実施例では、信号制御情報によって信号対背景音比を修正した後、修正信号対背景音比抑圧係数に変換する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
さらに、第三の実施例について説明する。上述の第二の実施例と比較すると、第三の実施例は信号対背景音比を抑圧係数に変換してから、信号制御情報によって抑圧係数を修正する構成である。
図25を参照して、第三の実施例の抑圧係数再構成部450を詳細に説明する。図11に示す第二の実施の形態の抑圧係数再構成部250と比較すると、本実施例の抑圧係数再構成部450は、抑圧係数修正部460をさらに含んでいる。
抑圧係数再構成部450は、符号化された信号対背景音比と信号制御情報とを受信し、修正抑圧係数を出力する。抑圧係数再構成部450は、信号対背景音比復号部261、抑圧係数変換部262及び抑圧係数修正部460から構成される。信号対背景音比復号部261は、符号化された信号対背景音比を受信し、復号する。信号対背景音比復号部261は、信号対背景音比を抑圧係数変換部262に出力する。抑圧係数変換部262は、復号された信号対背景音比を抑圧係数に変換する。抑圧係数変換部262は、抑圧係数を抑圧係数修正部460に出力する。抑圧係数修正部460は、外部から受けた信号制御情報を用いて、背景音情報変換部262から入力された抑圧係数を修正する。抑圧係数修正部460は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。抑圧係数修正部460の構成は、図20に示される第一の実施例の抑圧係数修正部460と同様のものであり、説明は省略する。
続いて、第四の実施例について説明する。第四の実施例は、分析情報として背景音そのものを用いる場合の構成例である。図26を参照して、第四の実施例の信号処理部360の第一の構成例を詳細に説明する。図14に示される第二の実施例の信号処理部172の抑圧係数計算部252が、本実施例の信号処理部360において抑圧係数計算部452で構成されている。抑圧係数計算部452は、外部から信号制御情報を受信している。
信号処理部360は、第二の変換信号、符号化された背景音及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、抑圧係数計算部452と乗算器251とから構成される。第二の変換信号が抑圧係数計算部452及び乗算器251に入力され、符号化された背景音が分析情報として抑圧係数計算部452に入力される。抑圧係数計算部452は、符号化された背景音、第二の変換信号及び信号制御情報に基づいて修正抑圧係数を計算する。そして、抑圧係数計算部452は、修正抑圧係数を乗算器251に出力する。乗算器251は、第二の変換信号と抑圧係数とを乗算し、修正復号信号を逆変換部173に出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
図27を参照して、抑圧係数計算部452の構成例を詳細に説明する。抑圧係数計算部452は、第二の変換信号、符号化された背景音及び信号制御情報を受信し、抑圧係数を出力する。抑圧係数計算部452は、背景音復号部263、背景音修正部464、抑圧係数生成部264から構成される。
背景音復号部263は、符号化された背景音を受信し、復号する。背景音復号部263は、復号された背景音を背景音修正部464に出力する。背景音が符号化されていないときには、背景音復号部263は、復号動作を行わず、背景音を背景音修正部464に出力する。背景音修正部464は、外部から入力された信号制御情報を用いて、背景音を修正する。背景音の修正については、第一の実施例における抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として背景音の倍率を入力することにより背景音を修正してもよい。また、信号制御情報として背景音の最大値または最小値を入力することにより背景音を修正しても良い。さらに、信号制御情報として背景音の倍率により修正された背景音と背景音の最大値または最小値により修正された背景音とを選択する制御情報を入力することにより修正してもよい。背景音修正部464は、修正された背景音を抑圧係数生成部264に出力する。抑圧係数生成部264は、第二の変換信号と修正された背景音を用いて背景音を抑圧するための適切な抑圧係数を計算する。この抑圧係数の計算は、図10に示される抑圧係数計算部201と同様の計算方法を用いてもよい。抑圧係数生成部264は、抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
図28を参照して、信号処理部360の第二の構成例を詳細に説明する。本構成例の信号処理部360は、背景音復号部263、背景音修正部464及び減算器253で構成される。信号処理部360は、第二の変換信号、符号化された背景音及び信号制御情報を受信し、背景音が制御された信号を出力する。
第二の変換信号が減算器253に入力される。また、符号化された背景音が分析情報として背景音復号部263に入力される。背景音復号部263は、入力された符号化された背景音を復号する。そして、背景音復号部263は、復号された背景音を背景音修正部464に出力する。背景音が符号化されていないときには、背景音復号部263は、復号動作を行わず、背景音を出力する。背景音修正部464は、信号制御情報を用いて背景音情報を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器253に出力する。減算器253は、第二の変換信号から修正背景音を減算し、減算結果を出力する。
次に、第五の実施例について説明する。第四の実施例と比較すると、本実施例は、復号された背景音から抑圧係数を生成した後、信号制御情報によって抑圧係数を修正する構成である。
図29を参照して、抑圧係数計算部452について詳細に説明する。抑圧係数計算部452は、第二の変換信号、符号化された背景音及び信号制御情報を受信し、修正抑圧係数を出力する。抑圧係数計算部452は、背景音復号部263、抑圧係数生成部264、抑圧係数修正部460から構成される。
背景音復号部263は、符号化された背景音を受信し、復号する。そして、背景音復号部263は、復号された背景音を抑圧係数生成部264に出力する。抑圧係数生成部264は、第二の変換信号と復号された背景音とから抑圧係数を生成する。この抑圧係数の計算は、図10に示される抑圧係数計算部201と同様の計算方法を用いてもよい。そして、抑圧係数生成部264は、抑圧係数を抑圧係数修正部460に出力する。抑圧係数修正部460は、受信した信号制御情報を用いて、抑圧係数を修正し、修正抑圧計数を生成する。抑圧係数の修正については、図23で示される抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として抑圧係数の倍率を入力することにより修正してもよい。また、信号制御情報として抑圧係数の最大値または最小値を入力することにより修正しても良い。さらに、信号制御情報として抑圧係数の倍率と抑圧係数の最大値または最小値とを選択する制御情報を入力することにより修正してもよい。抑圧係数修正部460は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
以上説明したように、本発明の第四の実施の形態によれば、送信部(または録音部)で信号の分析を行うので、信号の制御だけを行う受信部の演算量を削減して、目的音と背景音から構成される入力信号を制御することができる。また、受信部で受けた信号制御情報を用いて、特定の音源だけを独立に制御することができる。
図30を参照し、本発明の第五の実施の形態を説明する。図30と第三の実施の形態を表す図17を比較すると、受信部35が受信部55で構成される点で異なる。受信部55は、伝送信号と信号制御情報と構成要素レンダリング情報を入力とし、複数のチャンネルから構成される出力信号を出力する。第三の実施の形態と比較して、構成要素レンダリング情報も入力とする点、出力信号が複数のチャンネルから構成される信号である点、が異なる。
構成要素レンダリング情報とは、復号信号に含まれる構成要素と受信部55の出力信号との関係を周波数成分毎に表した情報である。たとえば、復号信号に混合されている各構成要素の定位情報を表す。音像をぼかしたりして定位感を操作するための情報を含んでいてもよい。
構成要素レンダリング情報を利用することにより、構成要素ごとに各チャンネルへの出力信号を制御することができる。各構成要素は、特定の1つのチャンネル(例えばスピーカ)から出力してもよいし、複数のチャンネルに分配して出力してもよい。
受信部55は、第三の実施の形態で説明した図17の受信部35と比較すると、信号制御部350が出力信号生成部550で構成される点で異なる。出力信号生成部550は、復号信号、分析情報、信号制御情報に加えて、構成要素レンダリング情報も入力される。
以下、本実施の形態の特徴である出力信号生成部550の構成例について説明する。第一の構成例を図31、第二の構成例を図32、第三の構成例を図33に示す。
図31を参照すると、第一の構成例における出力信号生成部550は、信号制御部560、構成要素情報変換部561、レンダリング部562とから構成される。本構成例では、レンダリング部562に入力される修正復号信号が、信号制御情報に基づき、あらかじめ構成要素ごとに操作された信号であることを特徴としている。
信号制御部560は、復号信号と分析情報を入力とする。まず、分析情報を復号し各周波数成分に対応した分析パラメータを生成する。次に、分析パラメータに基づいて復号信号を各構成要素に分解する。さらに、信号制御情報を用いて各構成要素を操作して修正構成要素を生成し、生成した修正構成要素を再構成して、再構成した信号を修正復号信号としてレンダリング部562へ出力する。また、信号制御部560は、修正復号信号と修正構成要素との関係を周波数成分毎に表した修正パラメータを生成し、構成要素情報変換部561にも出力する。ここで、復号信号は一般的な複数音源から構成されるものである。
なお、信号制御部560の他の動作例として、修正構成要素を生成せずに、分析パラメータと信号制御情報を用いて、復号信号を修正復号信号に変換してもよい。その場合は、修正復号信号に変換するさいに使用した修正パラメータを構成要素情報変換部561に出力する。
以下に、信号制御部560の動作の具体例を説明する。
ある周波数帯域fにおける復号信号の周波数成分をXk(f), k=1,2,…,P(Pは復号信号のチャンネル数)、構成要素の周波数成分をYj(f), j=1,2, …,M(Mは構成要素数)、信号制御情報に基づいて修正した構成要素の周波数成分をY’j(f)、修正復号信号をX’(f)とすると、分析パラメータにより規定される変換関数F501と、信号制御情報により規定される変換関数F502を用いて次の関係が成立する。
[数11]
ここで、変換関数F
503は修正構成要素を修正復号信号に変換する関数であり、修正パラメータは変換関数F
503の逆関数を表すパラメータとなる。
他の動作例として上述したように、関数F
500、F
501、F
502、F
503を統合して
[数12]
としてもよい。このとき、変換関数F
504は分析パラメータと信号制御情報と修正パラメータにより規定される。
上記変換の具体例として、周波数帯域fの分析パラメータB(f)を、
[数13]
と表し、信号制御情報A(f)を
[数15]
と表せる。すなわち、復号信号を修正復号信号に変換する行列はD(f)×A(f)×B(f)として計算できる。ここで、D(f)は任意のP行M列の行列であり、修正パラメータをE(f)とすると、
[数16]
となる。例えば、D(f)としてB(f)の逆行列を用いると、修正パラメータはE(f)=B(f)となる。なお、[数15]から明らかなように、D(f)としてB(f)の逆行列を用いることは修正構成要素を修正復号信号に変換する操作として妥当である。
構成要素情報変換部561は、信号制御部560から出力された修正パラメータを用いて、入力端子を介して供給された構成要素レンダリング情報をレンダリング情報に変換し、レンダリング情報をレンダリング部562に出力する。
構成要素レンダリング情報をレンダリング情報に変換する具体例として、構成要素レンダリング情報U(f)とレンダリング情報W(f)を、
[数17]
と表すと、W(f)=U(f)×E(f)とすることができる。ここで、Qは出力信号のチャンネル数である。
なお、レンダリング情報は修正復号信号と出力信号生成部550の出力信号との関係を周波数成分毎に表した情報であり、信号間のエネルギ差、時間差や相関などを用いて表すことができる。レンダリング情報の一例として非特許文献10(2007年、アイエスオー/アイイシー 23003-1:2007 パート1 エムペグ サラウンド、(ISO/IEC 23003-1:2007 Part 1 MPEG Surround))に開示された情報が知られている。
レンダリング部562は、構成要素情報変換部561から出力されたレンダリング情報を用いて、信号制御部560から出力された修正復号信号を変換して出力信号を生成し、出力信号生成部550の出力信号として出力する。
変換の方法として、非特許文献10に開示された方法が知られている。非特許文献10に開示されているMPEG Surroundデコーダを用いた場合、レンダリング情報としてMPEG Surroundデコーダに供給されるデータストリームを出力する。なお、MPEG Surroundデコーダ内で使用するパラメータをデータストリームに変換することなくレンダリング部に供給してもよい。
上記では、信号制御部560の出力として、周波数成分に分解された修正復号信号が、レンダリング部562に供給されている構成について説明したが、信号制御部560の出力において、修正復号信号が逆変換され時間信号としてレンダリング部562に供給される場合、レンダリング部562では、時間信号を周波数成分に分解してから処理を行う。レンダリング部562の出力は、周波数成分に分解された信号を逆変換した信号を出力信号として出力する。
出力信号の周波数成分をVk(f), k=1,2,…,Q(Qは出力信号のチャンネル数)とし、
[数18]
とすると、レンダリング部の動作は、V(f)=W(f)×X’(f)となる。
次に、第二の構成例を説明する。図32を参照すると、第二の構成例における出力信号生成部550は、構成要素情報変換部563とレンダリング部562とから構成される。本構成例では、レンダリング情報に構成要素ごとの制御を行うための情報を含ませ、レンダリング部562で、構成要素ごとの操作を実現することを特徴とする。
構成要素情報変換部563は、分析情報と信号制御情報と構成要素レンダリング情報を入力とする。まず、分析情報を復号し、各周波数成分に対応した分析パラメータを生成する。次に、分析パラメータと信号制御情報とから修正分析パラメータを計算し、修正分析パラメータと構成要素レンダリング情報とから、復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を計算し、レンダリング部562に出力する。
なお、構成要素情報変換部563の他の動作例として、修正分析パラメータを生成せずに、分析パラメータと信号制御情報と構成要素レンダリング情報とから復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を生成してもよい。
上記変換の具体例として、周波数帯域fの修正分析パラメータB’(f)を、
[数19]
とすると、
修正分析パラメータB’(f)は、A(f)×B (f)として計算できる。さらに、[数17]で表されるレンダリング情報W(f)は、構成要素レンダリング情報U(f)と修正分析パラメータB’(f)を用いて、W(f)=U(f)×B’(f)とすることができる。他の動作例として上述したように、修正分析パラメータB’(f)を計算せずに、W(f)=U(f)×A(f)×B (f)としてもよい。
レンダリング部562の動作は、本実施の形態の第一の構成例で説明した動作と同じである。具体的には、V(f)=W(f)×X (f)となる。
このような構成にすることにより、復号信号に含まれる各構成要素を制御するための情報をレンダリング情報に含めることができる。
次に第三の構成例を説明する。図33を参照すると、第三の構成例における出力信号生成部550は、構成要素情報変換部564とレンダリング部562と信号制御部565とから構成される。本構成例では、復号信号をレンダリングした信号を用いて、信号制御情報に基づき各構成要素を操作することを特徴とする。
構成要素情報変換部564は、分析情報と構成要素レンダリング情報を入力とし、レンダリング情報を出力する。初めに、分析情報を復号し、各周波数成分に対応した分析パラメータを生成する。次に、分析パラメータと構成要素レンダリング情報とから、復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を計算する。上記変換の具体例として、[数13]および[数17]で定義した分析パラメータB(f)と構成要素レンダリング情報U(f)とから、レンダリング情報W(f)は、W(f)=U(f)×B(f)とすることができる。
レンダリング部562は、復号信号とレンダリング情報とから、レンダリング信号を生成し、信号制御部565に対して出力する。レンダリング部562は、本実施の形態の第一の構成例において説明したとおりである。ある周波数帯域fにおけるレンダリング信号の周波数成分をIk(f), k=1,2,…,Q(Qは出力信号のチャンネル数)とすると、レンダリング信号は、I(f)=[I1(f) I2(f) … IQ(f)]T= W(f)×X (f)となる。
信号制御部565は、レンダリング信号と構成要素レンダリング情報と信号制御情報とから、出力信号を生成する。出力信号V(f)は、構成要素レンダリング情報と信号制御情報により規定される変換関数F505を用いて次の関係が成立する。
[数20]
上記変換の具体例として、[数14]と[数17]で定義した信号制御情報A(f)と構成要素レンダリング情報U(f)を用いると、[数20]は、
以上説明したように、本発明の第五の実施の形態によれば、受信部において、分析情報に基づいて、入力信号の各音源に対応した構成要素ごとに独立に制御することができる。また、構成要素レンダリング情報に基づいて、各構成要素の定位を制御することができる。また、信号制御情報に基づいて、特定の音源だけを独立に制御することもできる。
さらに、送信部で分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
本発明の第六の実施の形態を説明する。本実施の形態は、音源として目的音と背景音の混在した入力信号を対象とし、伝送信号と構成要素レンダリング情報と信号制御情報を用いて、目的音と背景音を制御する。本実施の形態は、第五の実施の形態と同じく、図30で表されるが、信号分析部101と出力信号生成部550の構成で異なる点がある。そこで、以下、信号分析部101と出力信号生成部550について詳細に説明する。
本実施の形態における第一の実施例は、分析情報が抑圧係数の場合である。図30において、信号分析部101が分析情報として抑圧係数を出力する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき抑圧係数を用いて復号信号を制御する。信号分析部101の構成については第二の実施の形態における第一の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部550について詳細に説明する。
抑圧係数を用いて目的音と背景音を制御する図30の出力信号生成部550の構成は、第五の実施の形態における出力信号生成部550の第二の構成例と同じく図32で表されるが、構成要素情報変換部563の構成で異なる点がある。そこで、以下、構成要素情報変換部563について説明する。
図34に構成要素情報変換部563の構成例を示す。構成要素情報変換部563は、構成要素パラメータ生成部651とレンダリング情報生成部652とから構成される。構成要素パラメータ生成部651は、分析情報から各周波数成分に対応した抑圧係数を再構成し、信号制御情報に基づき構成要素パラメータを算出し、レンダリング情報生成部652へ供給する。
上記変換の具体例として、周波数帯域fの各周波数成分に対応した抑圧係数をgi(f) , i=1,2,…,P(Pは復号信号のチャンネル数)とし、目的音を制御するための信号制御情報をAmain(f)、背景音を制御するための信号制御情報をAsub(f)とすると、構成要素パラメータH(f)は、
レンダリング情報生成部652は、構成要素パラメータと構成要素レンダリング情報に基づき、復号信号と出力信号の関係を表すレンダリング情報を出力する。上記変換の具体例として、[数17]においてM=2の場合を考えると、レンダリング情報W(f)は、W(f)=U(f) ×H(f)とすることができる。
なお、構成要素情報変換部563の他の構成例として、図34における構成要素パラメータ生成部651とレンダリング情報生成部652を統合することもできる。この場合、分析情報を復号して各周波数成分に対応した抑圧係数を算出し、抑圧係数と信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報をレンダリング部652する。
上記変換の具体例として、[数17]においてM=2の場合を考えると、レンダリング情報W(f)は、
本実施の形態における第二の実施例は、分析情報が信号対背景音比の場合である。図30において、信号分析部101が分析情報として信号対背景音比を出力する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき、信号対背景音比を用いて復号信号を制御する。第一の実施例とは、信号分析部101と出力信号生成部550の構成が異なるのみである。信号対背景音比を分析情報として算出する信号分析部101は、第二の実施の形態における第二の実施例において詳細に説明しているため、説明は省略する。以下、出力信号生成部550の動作について詳細に説明する。
信号対背景音比を用いて目的音と背景音を制御する図30の出力信号生成部550の構成は、第一の実施例と同じく図32及び図34で表される。第一の実施例と比較して、本実施例は、図34の構成要素パラメータ生成部651の構成が異なる。そこで、以下、構成要素パラメータ生成部651について説明する。
構成要素パラメータ生成部651は、分析情報を復号し各周波数成分に対応した信号対背景音比を算出し、信号対背景音比から信号制御情報に基づき、目的音と背景音を制御するための構成要素パラメータを算出し、レンダリング情報生成部652へ供給する。たとえば、第二の実施の形態において説明したように、信号対背景音比を抑圧係数に変換した後、第一の実施例で説明したように、[数22]を用いて信号制御情報に基づいて構成要素パラメータを算出することができる。また、他の方法として、第四の実施の形態で説明したように、信号対背景音比を信号制御情報に基づいて操作し、操作した信号対背景音比を抑圧係数に変換してから構成要素パラメータを算出してもよい。この場合、変換された抑圧係数をg’i(f)とすると、構成要素パラメータH(f)は、
図32の構成要素情報変換部563の他の構成例として、図34における構成要素パラメータ生成部651とレンダリング情報生成部652を統合することもできる。この場合、分析情報を復号して各周波数成分に対応した信号対背景音比を算出し、信号対背景音比と信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。具体例として、たとえば、第二の実施の形態において説明したように、信号対背景音比を抑圧係数に変換した後、第一の実施例で説明したように、[数23]を用いて抑圧係数と信号制御情報と構成要素レンダリング情報とからレンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。また、他の方法として、第四の実施の形態で説明したように、信号対背景音比を信号制御情報に基づいて操作し、操作した信号対背景音比を抑圧係数に変換してから、変換した抑圧係数と構成要素レンダリング情報とからレンダリング情報を算出してもよい。この場合、レンダリング情報W(f)は、
本実施の形態における第三の実施例は、分析情報が背景音の場合である。図30を参照すると、信号分析部101が分析情報として背景音を計算する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき、背景音を用いて復号信号を制御する。第一の実施例とは、信号分析部101と出力信号生成部550における構成が異なるのみである。背景音を、分析情報として算出する信号分析部101は、第二の実施の形態における第三の実施例において詳細に説明しているため、説明は省略する。よって、以下、出力信号生成部550の動作について詳細に説明する。
背景音を用いて目的音と背景音を制御する図30の出力信号生成部550の構成例を図35に示す。図35は、図32に示す第一の実施例とは、構成要素情報変換部563が構成要素情報変換部655で構成されている点が異なる。以下、構成要素情報変換部655について説明する。
構成要素情報変換部655は、復号信号と分析情報と信号制御情報と構成要素レンダリング情報を入力とし、復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を生成しレンダリング部562に対して出力する。図36に構成要素情報変換部655の構成例を示す。構成要素情報変換部655は、変換部171と構成要素パラメータ生成部653とレンダリング情報生成部652とから構成される。変換部171は、復号信号を各周波数成分に分解して第二の変換信号を生成し、第二の変換信号を構成要素パラメータ生成部653に対して出力する。
構成要素パラメータ生成部653は、第二の変換信号と分析情報と信号制御情報を入力とする。分析情報を復号して背景音を算出し、第二の変換信号と背景音とから信号制御情報に基づいて、目的音と背景音を制御するための構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。
以下、構成要素パラメータの算出方法の具体例を示す。第一の方法では、第二の実施の形態における第三の実施例で説明したように、背景音と第二の変換信号とから抑圧係数を算出する。さらに、抑圧係数に対して[数22]を適用して、信号制御情報に基づいて構成要素パラメータを算出する。第二の方法では、第四の実施の形態の第四の実施例、第五の実施例で説明した方法で、背景音と信号制御情報と第二の変換信号とから抑圧係数を算出する。上述の方法により算出された抑圧係数に対して、[数24]を適用して構成要素パラメータを計算する。
なお、図35の構成要素情報変換部655の他の構成例として、図36における構成要素パラメータ生成部653とレンダリング情報生成部652を統合することもできる。この場合、各周波数成分に対応した第二の変換信号と、分析情報を復号した各周波数成分に対応した背景音と、信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。
以下、レンダリング情報の算出方法の具体例を示す。第一の方法では、第二の実施の形態における第三の実施例で説明したように、背景音から、復号信号を用いて抑圧係数を算出する。さらに、[数23]を用いて抑圧係数と信号制御情報と構成要素レンダリング情報とからレンダリング情報を算出する。第二の方法では、第四の実施の形態の第四の実施例、第五の実施例で説明した方法で、背景音と信号制御情報と第二の変換信号とから抑圧係数を算出する。上述の方法により算出された抑圧係数に対して、[数25]を用いて抑圧係数と構成要素レンダリング情報とからレンダリング情報を算出する。
以上説明したように、本発明の第六の実施の形態によれば、受信部において、分析情報に基づいて、目的音と背景音とから構成される入力信号を独立に制御することができる。また、構成要素レンダリング情報に基づいて、目的音と背景音の定位を制御することができる。また、信号制御情報に基づいて、特定の音源だけを独立に制御することもできる。
さらに、送信部で分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
図37を参照し、本発明の第七の実施の形態を説明する。図37と第五の実施の形態を表す図30とを比較すると、図30の受信部55が、図37では受信部75で構成されている点で異なる。受信部75は、伝送信号と構成要素レンダリング情報を入力とし、複数のチャンネルから構成される信号を出力信号として出力する。第五の実施の形態における受信部55とは、信号制御信号を入力としない点と、出力信号生成部550が出力信号生成部750で構成されている点で異なる。なお、本実施の形態における構成要素レンダリング情報は、復号信号に含まれる各構成要素を操作するための情報を含んでいてもよい。出力信号生成部750は、音源に対応した各構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作することも可能である。
受信部75は、第五の実施の形態で説明した受信部55と比較すると、出力信号生成部550が出力信号生成部750で構成されている点で異なる。以下、本実施の形態の特徴である出力信号生成部750の構成例について説明する。
図38に、図37の出力信号生成部750の構成例を示す。出力信号生成部750は、構成要素情報変換部760とレンダリング部562とから構成される。出力信号生成部750は、第五の実施の形態における図32に示す出力信号生成部550とは、構成要素情報変換部563が構成要素情報変換部760で構成されている点で異なる。以下、構成要素情報変換部760の構成例について説明する。
構成要素情報変換部760は、分析情報と構成要素レンダリング情報を入力とし、レンダリング情報を出力する。まず、分析情報を復号して各周波数成分に対応する分析パラメータを算出する。さらに、分析パラメータと構成要素レンダリング情報を用いて、復号信号と出力信号生成部750の出力信号の関係を周波数成分毎に表すレンダリング情報を生成する。
上記変換の具体例として、レンダリング情報W(f)は、[数13]と[数17]を用いて、W(f)= U(f)×B(f)と表すことができる。なお、B(f)は周波数帯域fの分析パラメータ、U(f)は構成要素レンダリング情報である。
本構成例では、レンダリング情報に構成要素ごとの制御を行うための情報を含ませ、レンダリング部562で、構成要素ごとの操作を実現することを特徴とする。
以上説明したように、本発明の第七の実施の形態によれば、受信部において、分析情報に基づいて、入力信号の各音源に対応した構成要素ごとに独立に制御することができる。また、構成要素レンダリング情報に基づいて、各構成要素の定位を制御することができる。
さらに、送信部で分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
本発明の第八の実施の形態を説明する。本実施の形態は、音源として目的音と背景音の混在した入力信号を対象とし、受信部に供給された構成要素レンダリング情報を用いて、目的音と背景音を独立に制御し、目的音と背景音の定位を制御することができる。本実施の形態は、第七の実施の形態と同じく、図37で表されるが、信号分析部101と出力信号生成部750の構成が異なる。以下、信号分析部101と出力信号生成部750について詳細に説明する。
本実施の形態における第一の実施例は、分析情報が抑圧係数の場合である。送信部10における信号分析部101が、分析情報として抑圧係数を出力する。これに対応して、出力信号生成部750は、構成要素レンダリング情報と抑圧係数を用いて復号信号を制御する。抑圧係数を分析情報として用いた場合の信号分析部101については第二の実施の形態における第一の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
抑圧係数を用いて目的音と背景音を制御する図37の出力信号生成部750の構成例は、第七の実施の形態の出力信号生成部750と同じく図38で表されるが、構成要素情報変換部760の構成が異なる。構成要素情報変換部760の構成例を図39に示す。構成要素情報変換部760は、構成要素パラメータ生成部851とレンダリング情報生成部652とから構成される。
構成要素パラメータ生成部851は、分析情報を入力とする。分析情報を復号して各周波数成分に対応した抑圧係数を再構成し、構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。この変換の具体例として、周波数帯域fの各周波数成分に対応した抑圧係数をgi(f)とすると、構成要素パラメータH(f)は、[数22]において、Amain(f)=1、Asub(f)=1の場合となる。すなわち、
[数26]
となる。レンダリング情報生成部652については、第六の実施の形態において、図34を用いて説明したとおりであるため、説明を省略する。
本実施の形態における第二の実施例は、分析情報が信号対背景音比の場合である。送信部10における信号分析部101が、分析情報として信号対背景音比を出力する。これに対応して、出力信号生成部750は、構成要素レンダリング情報に基づき、信号対背景音比を用いて復号信号を制御する。信号対背景音比を分析情報として用いた場合の信号分析部101については第二の実施の形態における第二の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
信号対背景音比を用いて目的音と背景音を制御する図37の出力信号生成部750の構成例は、第一の実施例と同じく図38で表される。本実施例と第一の実施例では、構成要素情報変換部760の構成を表す図39の構成要素パラメータ生成部851の構成が異なる。以下、構成要素パラメータ生成部851について説明する。
構成要素パラメータ生成部851は、分析情報を入力とし、分析情報を復号し各周波数成分に対応した信号対背景音比を算出する。さらに、信号対背景音比から構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。構成要素パラメータの算出方法としては、例えば、第二の実施の形態における第二の実施例で説明したように、信号対背景音比を抑圧係数に変換する。さらに、本実施の形態における第一の実施例で説明したように、[数26]を用いて、抑圧係数から構成要素パラメータを算出する。
本実施の形態における第三の実施例は、分析情報が背景音の場合である。送信部10における信号分析部101が、分析情報として背景音を出力する。これに対応して、出力信号生成部750は、背景音と構成要素レンダリング情報に基づき復号信号を制御する。信号対背景音比を分析情報として用いた場合の信号分析部101については第二の実施の形態における第三の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
背景音を用いて目的音と背景音を制御する図37の出力信号生成部750の構成例を図40に示す。図40は、図38の第一の実施例とは、構成要素情報変換部760が構成要素情報変換部761で構成されている点が異なる。レンダリング情報生成部652は、図34を用いて既に説明しているため、説明を省略する。
構成要素情報変換部761は、復号信号と分析情報と構成要素レンダリング情報とから復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を生成しレンダリング部562に供給する。図41に構成要素情報変換部761の構成例を示す。構成要素情報変換部761は、変換部171と構成要素パラメータ生成部853とレンダリング情報生成部652とから構成される。変換部171は、復号信号を各周波数成分に分解して第二の変換信号を生成し、第二の変換信号を、構成要素パラメータ生成部853に供給する。
構成要素パラメータ生成部853は、分析情報と第二の変換信号を入力とする。分析情報を復号し背景音を算出し、第二の変換信号と背景音に基づいて構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。構成要素パラメータの算出方法としては、例えば、第二の実施の形態における第三の実施例において説明したように、背景音を抑圧係数に変換する。さらに、本実施の形態における第一の実施例で説明したように、[数26]を用いて抑圧係数から構成要素パラメータを算出する。
以上説明したように、本発明の第八の実施の形態によれば、受信部において、分析情報に基づいて、目的音と背景音とから構成される入力信号を独立に制御することができる。また、構成要素レンダリング情報に基づいて、目的音と背景音の定位を制御することができる。
さらに、送信部で抑圧係数又は信号対背景音比といった分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
図42を参照して本発明の第九の実施の形態を詳細に説明する。図1に示される本発明の第一の実施の形態と比較すると、第一の実施の形態における送信部10が送信部90で構成されている。さらに、送信部10に含まれる信号分析部101が、送信部90に含まれる信号分析部900で構成されている。また、信号分析部900には、入力信号と符号化部100からの符号化信号が入力されている。
また、第二の実施の形態及び第八の実施の形態において、送信部10に含まれる信号分析部101を本実施の形態の信号分析部900で構成することとしてもよい。この場合、入力信号と符号化部100からの符号化信号が信号分析部900に入力されるようにすればよい。
第九の実施の形態によると、信号分析部900が符号化部において発生した量子化歪みの影響を考慮に入れた分析を行うことにより、受信部15において復号を行う際に発生する量子化歪みを低減することが可能になる。
図43を参照して、信号分析部900の第一の構成例について詳細に説明する。
信号分析部900は、入力信号と符号化部100からの符号化信号とから分析情報を生成する。符号化信号は量子化歪みの加わった信号であるので、量子化歪み量を考慮して分析情報を生成することが出来る。
信号分析部900は、入力信号と符号化部100からの符号化信号を受信し、分析情報を出力する。信号分析部900は、変換部120、復号部150、量子化歪み計算部910、分析情報生成部911及び変換部920から構成される。
入力信号は、変換部120に入力される。また、符号化部100からの符号化信号は、復号部150に入力される。
復号部150は、符号化部100から入力された符号化信号の復号を行う。復号部150は、復号信号を変換部920へ出力する。変換部920では、復号信号を周波数成分へと分解する。変換部920は、周波数成分分解された復号信号を量子化歪み計算部910へ出力する。
変換部120は、入力信号を周波数成分へと分解する。変換部120は、周波数成分分解された入力信号を量子化歪み部910および分析情報生成部911へ出力する。量子化歪み計算部910は、周波数成分分解された復号信号と周波数成分分解された入力信号とを比較し、量子化歪み量を周波数成分ごとに計算する。例えば、周波数成分分解された復号信号の各周波数成分の大きさと周波数成分分解された入力信号の各周波数成分の大きさとの差を、その周波数における量子化歪みとしてもよい。量子化歪み計算部910は、各周波数の量子化歪み量を分析情報生成部911に出力する。
分析情報生成部911は、変換部120から周波数成分分解された入力信号を受信し、量子化歪み計算部910から各周波数の量子化歪み量を受信する。分析情報生成部911は、周波数成分分解された入力信号について、各周波数成分に対応した入力信号を音源に対応した構成要素ごとに分解する。そして、分析情報生成部911は、複数の構成要素間の関係を表す分析情報を生成する。分析情報生成部911は、分析情報を出力する。また、周波数成分分解された入力信号について、分析情報生成部911は、複数の構成要素から構成される構成要素群に分解することとしてもよい。
分析情報生成部911は、量子化歪み量を考慮し、受信部における復号の際に、量子化歪みが低減されるように分析情報の計算を行う。例えば、分析情報生成部911は、周波数成分分解された入力信号の各周波数成分の大きさとその周波数における量子化歪みの大きさとから、量子化歪みが聴覚マスキングされるように、分析情報を計算してもよい。ここで、分析情報生成部911は、聴覚マスキングにおいて、周波数成分の大きさが大きい周波数の周辺周波数では、小さい成分は聞こえにくくなることを利用してもよい。各周波数成分の大きさから周辺周波数において聞こえにくくなる成分の大きさをマスキング特性とする。分析情報生成部911は、マスキング特性を全周波数において計算する。分析情報生成部911は、各周波数において、量子化歪みの影響を考慮して分析情報の補正を行う。マスキング特性より量子化歪みの大きさが小さい場合には、量子化歪みが聞こえにくい。この場合には、量子化歪みの影響が少ないので、分析情報生成部911は、分析情報の補正は行わない。マスキング特性より量子化歪みの大きさが大きい場合は、マスキングされない。この場合には、分析情報生成部911は、量子化歪みを低減させるように分析情報を補正する。例えば、分析情報として抑圧係数を用いる場合は、量子化歪みも背景音と同時に抑圧するように小さめの抑圧係数としてもよい。
以上のように、分析情報生成部911が分析情報を補正することにより、受信部において復号を行った際に量子化歪みが聴覚マスキングされ、歪や雑音が低減される。
これまで聴覚マスキングを考慮して量子化歪みを低減するような分析情報の補正について説明してきた。しかし、聴覚マスキングを考慮せず、全ての周波数において量子化歪みを低減するように分析情報を補正する構成でもよい。
図44を参照して、信号分析部900の第二の構成例を詳細に説明する。
信号分析部900は、入力信号と符号化部100からの符号化信号を受信し、分析情報を出力する。信号分析部900は、変換部120、復号部150、量子化歪み計算部910、分析情報生成部912及び変換部920から構成される。
入力信号は、変換部120に入力される。また、符号化部100からの符号化信号は、復号部150に入力される。
復号部150は、符号化部100から入力された符号化信号の復号を行う。復号部150は、復号信号を変換部920へ出力する。変換部920では、復号信号を周波数成分へと分解する。変換部920は、周波数成分分解された復号信号を量子化歪み計算部910と分析情報生成部912とに出力する。
変換部120は、入力信号を周波数成分へと分解する。変換部120は、周波数成分分解された入力信号を量子化歪み計算部910へ出力する。量子化歪み計算部910は、周波数成分分解された復号信号と周波数成分分解された入力信号とを比較し、量子化歪み量を周波数成分ごとに計算する。例えば、周波数成分分解された復号信号の各周波数成分の大きさと周波数成分分解された入力信号の各周波数成分の大きさとの差を、その周波数における量子化歪みとしてもよい。量子化歪み計算部910は、各周波数の量子化歪み量を分析情報生成部912に出力する。
分析情報生成部912は、変換部920から周波数成分分解された復号信号を受信し、量子化歪み計算部910から各周波数の量子化歪み量を受信する。分析情報生成部912は、周波数成分分解された復号信号について、各周波数成分に対応した入力信号を音源に対応した構成要素ごとに分解する。そして、分析情報生成部912は、複数の構成要素間の関係を表す分析情報を生成する。分析情報生成部912は、量子化歪みを低減されるように補正された分析情報を出力する。量子化歪みが低減されるような分析情報の計算については、第一の構成例と同様であるので、説明は省略する。
以上説明したように、信号分析部900の第一の構成例及び第二の構成例は、符号化部100において発生した符号化歪みの効果を低減するように分析情報の生成を行うことにより、受信部15において復号を行う際に発生する量子化歪みを低減することができるという効果を有する。
続いて、本発明の第十の実施の形態について説明する。本発明の第十の実施の形態は、音源として目的音と背景音とから構成される入力信号を制御するものである。本発明の第十の実施の形態の構成は、本発明の第九の実施の形態の構成と同様に図42および図43で示される。本実施の形態は、図43における本発明の第九の実施の形態の構成の分析情報生成部911の構成が異なる。
図45を参照して、本発明の第十の実施の形態における分析情報生成部911の構成例を詳細に説明する。図6に示される分析情報生成部121と図45に示される分析情報生成部911とを比較すると、量子化歪み計算部910からの各周波数の量子化歪み量が入力される点が異なっている。さらに、分析情報生成部121に含まれる背景音推定部200が、分析情報生成部911に含まれる背景音推定部1020で構成されている。図6、図43の説明と重複する部分の説明は省略する。
分析情報生成部911は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信し、分析情報を出力する。分析情報生成部911は、背景音情報生成部202と背景音推定部1020とから構成される。
背景音推定部1020は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信する。背景音推定部1020は、量子化歪み量を考慮し、背景音の推定を行う。たとえば、背景音推定部1020は、推定した背景音に量子化歪みを加算したものを推定背景音として、分析情報生成部121に含まれる背景音推定部200と同様の処理を行うことができる。背景音推定部1020は、量子化歪みが考慮された背景音の情報を背景音情報生成部202に出力する。背景音情報生成部202は、背景音の情報に基づいて、分析情報を生成する。そして、背景音情報生成部202は、量子化歪みが考慮された分析情報を出力する。
受信部15は、量子化歪みが考慮された分析情報に基づいて、復号信号の制御を行う。この構成により、復号信号の制御において、量子化歪みを考慮した高品質な制御を行うことが出来る。さらに、受信部15において復号を行う際に発生する量子化歪みを低減することができるという効果を有する。
さらに、本発明の第十の実施の形態の説明において、背景音情報生成部202は、分析情報として抑圧係数、信号対背景音比又は背景音そのものを出力することとしてもよい。
分析情報として抑圧係数を符号化し、出力する場合には、図43における分析情報生成部911は、抑圧係数を算出し、符号化する。抑圧係数を出力するために、分析情報生成部911における背景音情報生成部202として図7に示される構成を用いてもよい。この場合、図42における受信部15の信号制御部151は、抑圧係数による復号信号の制御に対応した構成とする。
分析情報として信号対背景音比を符号化し、出力する場合には、図43における分析情報生成部911は、信号対背景音比を算出し、符号化する。信号対背景音比を符号化するために、分析情報生成部911における背景音情報生成部202として図10に示される構成や、図12に示される構成を用いてもよい。この場合、図42における受信部15の信号制御部151は、信号対背景音比による復号信号の制御に対応した構成とする。
分析情報として背景音そのものを符号化し、出力する場合には、図43における分析情報生成部911は、背景音推定部1020で推定した推定背景音を符号化し、出力する。
図46を参照して、分析情報として背景音そのものを出力する分析情報生成部911の構成例について説明する。本構成例の分析情報生成部911は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信し、符号化された背景音を出力する。分析情報生成部911は、背景音符号化部205と背景音推定部1020とから構成される。背景音推定部1020の動作については、図45の説明と重複するので省略する。また、背景音符号化部205の動作については、図13の説明と重複するので省略する。
この場合、図42における受信部15の信号制御部151は、背景音による復号信号の制御に対応した構成とする。
以上、本発明の第十の実施の形態は、量子化歪みが考慮された抑圧係数、信号対背景音比又は背景音に基づいて、復号信号の制御を行う。この構成により、復号信号の制御において、量子化歪みを考慮した高品質な制御を行うことが出来る。さらに、受信部15において復号を行う際に発生する量子化歪みや符号化歪みを低減することができるという効果を有する。
次に、本発明の第十一の実施の形態について説明する。本発明の第十一の実施の形態は、送信側部における演算量と、分析情報に基づいて受信側部で各音源に対応した構成要素ごとの制御に係る演算量を低減する。
図47を参照して、本発明の第十一の実施の形態を説明する。図1に示す本発明の第一の実施の形態と、図47に示す本発明の第十一の実施の形態とは、送信部10が送信部13で構成されている点、受信部15が受信部18で構成されている点で異なる。この構成により、本発明の第十一の実施の形態は、送信部の中にある変換部を共用し、受信部の中にある変換部を共用することができる。この結果、送信部13及び受信部18の演算量を低減することが出来る。
図1に示される送信部10と図47に示される送信部13は、符号化部100が符号化部1100で構成されている点、信号分析部101が、信号分析部1101で構成されている点で異なる。本実施例では、符号化部1100が周波数成分分解された入力信号を信号分析部1101に出力している。
図48を参照して、符号化部1100の構成例を詳細に説明する。図2に示される符号化部100と図48に示される符号化部1100とは、変換部110の出力である第一の変換信号が、信号分析部1101へ出力される点で異なる。変換部110及び量子化部111の動作については図2と重複するので、説明は省略する。ここで、符号化部1100の演算量は、図2に示される符号化部100と出力される信号が異なるのみであるので、符号化部100の演算量とほぼ同一である。
図49を参照して、信号分析部1101の構成例を詳細に説明する。図4に示す信号分析部101と図49に示される信号分析部1101とは、信号分析部101に含まれている変換部120が削除されている点である。分析情報生成部121の動作については、図4の説明と重複するので省略する。
信号分析部1101は、符号化部1100から第一の変換信号を受信する。受信した第一の変換信号は分析情報生成部121へ入力される。ここで、図48に示される符号化部1100内の変換部110と、図4に示される信号分析部101内の変換部120とを比較すると、変換部に供給される入力信号が同一であり、変換部の動作が同一ならば、各々の出力である第一の変換信号と第二の変換信号は同一となる。そのため、変換部110と変換部120の動作が同一である場合、信号分析部1101では変換部120を削除し、信号分析部1101が出力する第一の変換信号を第二の変換信号として使用することが出来る。この構成により、信号分析部1101の演算量は、変換部120の演算量に相当する分だけ、信号分析部101よりも削減される。
受信部について、図1に示される受信部15と図47に示される受信部18と復号部150が復号部1150で構成されている点と、信号制御部151が信号制御部1151で構成されている点で異なる。
図50を参照して、復号部1150の構成例を説明する。図3に示される復号部150と復号部1150とは、復号部1150において逆変換部161が削除されている点で異なる。逆量子化部160の動作については、図3の説明と重複するので省略する。図3に示される復号部150は、逆量子化部160が出力する第一の変換信号を逆変換部161により時間領域信号に逆変換し、復号信号として図5に示される変換部171に出力している。図5では、変換部171が復号信号を受信し、第二の変換信号に変換する処理を行っている。ここで、上述の通り、変換部110と変換部120の動作が同一である場合、第一の変換信号を第二の変換信号として使用することが出来る。これにより、本実施例の形態において、復号部1150は、逆量子化部160の出力する第一の変換信号を信号制御部1151に含まれる信号処理部172に出力している。従って、本実施の形態において、逆変換部161が削除されている。
図51を参照して、信号制御部1151の構成例を詳細に説明する。図5に示される信号制御部151と図51に示される信号制御部1151とは、信号制御部1151において変換部171が削除されている点で異なる。信号処理部172及び逆変換部173の動作については、図5の説明と重複するので省略する。
図5の信号制御部151は、時間領域信号として入力された復号信号が変換部171により第二の変換信号に変換され、信号処理部172に出力している。上述の通り、変換部110と変換部120の動作が同一である場合、第一の変換信号を第二の変換信号として使用することが出来る。これにより、信号制御部1151に含まれる信号処理部172は、逆量子化部160の出力する第一の変換信号を受信することができる。従って、本実施例において、変換部171が取り除かれている。
ここで、信号制御部1151に復号部1150から入力される信号に着目すると、図1に示される第一の実施の形態と図47に示される第十一の実施の形態とは、逆量子化部160が出力する信号が、逆変換部161および変換部171を通じたか否かの違いがある。第一の変換信号を第二の変換信号として使用できる場合において、第一の実施の形態及び第十一の実施の形態のいずれも、逆量子化部160が出力する信号の周波数成分と信号制御処理部172に入力される信号の周波数成分は同じである。従って、信号制御部1151内の信号処理部172は、図5に示される信号処理部172と同一の結果を出力する。また、復号部1150の演算量は、図3に示される逆変換部161の演算量に相当する分だけ、復号部150よりも削減されている。さらに、信号制御部1151の演算量は、図5に示される変換部171の演算量に相当する分だけ、信号制御部151よりも削減されている。
以上、本発明の第十一の実施の形態は、本発明の第一の実施の形態の効果に加えて、変換部120、逆変換部161及び変換部160のそれぞれの演算量に相当する分だけ、第一の実施の形態よりも演算量が削減されるという効果を有する。さらに、第十一の実施の形態の演算量削減の構成は、本発明の第二の実施の形態から第十の実施の形態に適用することが可能である。これにより、各実施の形態は、本発明の第十一の実施の形態と同様の演算量削減の効果を有する。
以上、これまでは、本発明の第一の実施の形態から第十一の実施の形態において複数の音源から構成される入力信号を分析し、分析情報を算出し、受信側で分析情報に基づいて復号信号を制御する方法について説明してきた。ここで、具体例を用いてさらに詳細を説明する。入力信号は、利用方法によって異なるが、例えば、音声、楽器音などがある。この他、音による監視を目的とする場合は、各機械が発生する動作音や、操作者の音声や足音などがある。
入力信号に複数の構成要素がある場合、本発明に係る信号分析制御システムは、入力信号を分析し、分析した結果を分析情報として符号化する構成である。構成要素が複数ある場合、図1に示される構成と同様の構成が適用される。信号分析部101および、信号制御部151の構成、信号分析部101が多重化部102へ出力する情報、分離部152から信号制御部151に送られる情報ついてそれぞれ詳細に説明する。
図52を参照して、信号分析部101の第二の構成例を詳細に説明する。信号分析部101の第二の構成例は、構成要素が複数ある場合に適用する構成である。この信号分析部101は、音環境分析部1210と音環境情報符号化部1211とから構成されている。音環境分析部1210は、入力信号に含まれる複数の構成要素の情報を分析する。音環境分析部1210は、構成要素分析情報を音環境情報符号化部1211へ出力する。音環境情報符号化部1211は、音環境分析部1210から入力された構成要素分析情報を符号化する。そして、音環境情報符号化部1211は、符号化された構成要素分析情報を図1に示される多重化部102へ出力する。ここで、図1に示される多重化部102は、音環境情報符号化部1211から入力された構成要素分析情報に対応した多重化を行う。
音環境分析部1210についてさらに詳細に説明する。
音環境分析部1210における複数音源の情報の分析の方法としては、様々な方法を用いることが可能である。例えば、複数音源の情報の分析の方法として、非特許文献11(2005年、「スピーチ・エンハンスメント」、シュプリンガー、(Speech Enhancement, Springer, 2005, pp. 371--402)、371ページから402ページ)に記載されている信号分離の方法を用いてもよい。また、複数音源の情報の分析の方法としては、音情景分析、コンピューテーショナル・オーディトリィ・シーン・アナリシス(Computational Auditory Scene Analysis)、単一入力信号分離、シングル・チャンネル・シグナル・セパレーション、などと呼ばれる信号分離の手法を用いてもよい。これらの信号分離の手法により、音環境分析部1210は、入力信号を複数の各構成要素に分離する。さらに、音環境分析部1210は、分離された各構成要素から出力すべき構成要素分析情報に変換して出力する。この構成要素分析情報は、様々な形式で出力することが可能である。例えば、構成要素分析情報としては、背景音を抑圧するための抑圧係数や、各周波数成分におけるそれぞれの構成要素の割合や、それぞれの構成要素そのものの信号の各周波数成分の大きさがある。構成要素の割合には、例えば、入力信号との振幅比、入力信号とのエネルギ比、及びこれらの平均値などが含まれる。信号の各周波数成分の大きさには、例えば、振幅絶対値、エネルギ、及びこれらの平均値などが含まれる。また、信号分離の方法によっては、信号分離の途中において、出力すべき分析結果そのもの、または、出力すべき分析結果に容易に変換可能な信号が得られる。その場合は、信号分離を最後まで行わずに、信号分離を行う途中から出力すべき分析結果を得る処理を行うことも可能である。
図53を参照して、信号制御部151の構成例を詳細に説明する。信号制御部151の構成例は、構成要素が複数ある場合に適用する構成である。信号制御部151は、音環境情報復号部1212および音環境情報処理部1213から構成されている。信号制御部151は、復号部150からの復号信号、分離部152から分析情報を符号化した信号を受信する。音環境情報復号部1212は、分離部152から受信した分析情報を符号化した信号を復号する。音環境情報復号部1212は、復号した分析情報を出力して音環境情報処理部1213へ出力する。分析情報は、図52に示される信号分析部101に含まれる音環境分析部1210が出力した分析情報に相当する。音環境情報処理部1213は、音環境情報復号部1212から入力された分析情報に基づいて、復号信号の制御を行う。この制御の方法は、制御の目的によって異なる。例えば、第二の実施の形態と同様に、背景音を抑圧する制御を行ってもよい。
以上、入力信号に含まれる構成要素が複数ある場合、本発明を適用し、本発明の第一の実施の形態における効果を得ることができる。
以上、本発明の第一の実施の形態を、入力信号に含まれる構成要素が複数ある場合に適用される構成を例に説明してきた。第二の実施の形態から第十一の実施の形態に対しても、同様に信号分析部および信号制御部または出力信号生成部を変更してもよい。また、第五の実施の形態から第八の実施の形態の構成のように、各構成要素の出力を複数のチャンネルから構成される出力信号に定位させる制御を行ってもよい。
さらに、入力信号のチャンネル数が複数である場合は、本発明の信号分析部101における分析の方法として、指向性制御、ビームフォーミング(Beamforming)、ブラインド信号源分離(Blind Source Separation)や、独立成分分析(Independent Component Analysis)と呼ばれる手法を用いてもよい。特に、入力信号のチャンネル数が目的音数より多い場合には、上述の背景音情報の推定方法や第十三の実施の形態における分析の方法を用いず、指向性制御、ビームフォーミング(Beamforming)、ブラインド信号源分離(Blind Source Separation)や、独立成分分析(Independent Component Analysis)のみを用いて、分析を行ってもよい。例えば、指向性制御およびビームフォーミングに関連する技術は、非特許文献12(2001年、「マイクロホン・アレイズ」、シュプリンガー、(Microphone Arrays, Springer, 2001))、及び非特許文献13(2005年、「スピーチ・エンハンスメント」、シュプリンガー、(Speech Enhancement, Springer, 2005, pp. 229--246)、229ページから246ページ)に開示されている。また、ブラインド信号源分離および独立成分分析の方法に関連する技術は、非特許文献14(2005年、「スピーチ・エンハンスメント」、シュプリンガー、(Speech Enhancement, Springer, 2005, pp. 271−369)、271ページから369ページ)に開示されている。
上述の分析の方法を用いる場合、本発明の第一の実施の形態には、図1に示される構成が適用される。さらに、信号分析部101の構成、信号制御部151の構成、信号分析部101が多重化部102へ出力する情報、および、分離部152から信号制御部151に送られる情報について詳細に説明する。入力信号は複数チャンネルの信号である。基本的な動作は、第一の実施の形態の動作と同様であり、図1と重複するので説明は省略する。
図54を参照して、信号分析部101の第三の構成例を詳細に説明する。信号分析部101の第三の構成例は、入力信号のチャンネル数が複数である場合に対応している。本構成例の信号分析部101は、入力信号の分析の方法として、独立成分分析の方法を用いる。本構成例の信号分析部101は、入力信号に含まれる各音源に対応した構成要素の信号分離のためのフィルタ係数を分析情報として出力する。
信号分析部101は、信号分離分析部1200と分離フィルタ符号化部とから構成されている。信号分離分析部1200は、独立成分分析の方法により、分離フィルタ係数を算出する。分離フィルタ係数は、入力信号に含まれる各音源に対応した構成要素の信号分離を行うために用いられるフィルタ係数である。そして、信号分離分析部1200は、分離フィルタ係数を分離フィルタ符号化部1201へ出力する。分離フィルタ符号化部1201は、信号分離分析部1200から入力された分離フィルタ係数を符号化する。分離フィルタ符号化部1201は、符号化分離フィルタ係数を分析情報として出力する。
図55を参照して、信号制御部151の第三の構成例を詳細に説明する。信号制御部151の第三の構成例は、入力信号のチャンネル数が複数である場合に対応している。
信号制御部151は、分離フィルタ復号部1202とフィルタ1203とから構成されている。分離フィルタ復号部1202は、分離部152から分析情報として符号化された分離フィルタ係数を受信する。そして、分離フィルタ復号部1202は、符号化分離フィルタ係数を復号し、分離フィルタ係数をフィルタ1203へ出力する。フィルタ1203は、復号部150から複数チャンネルの復号信号を受信し、分離フィルタ復号部1202から分離フィルタ係数を受信する。そして、フィルタ1203は、複数チャンネルの復号信号に対し、分離フィルタ係数に基づくフィルタ処理を行う。フィルタ1203は、各音源に対応した構成要素の信号が分離された信号を出力する。
以上説明したとおり、入力信号のチャンネル数が複数である場合、本発明の信号分析制御システムは、入力信号の分析を送信部で行っている。この構成により、入力信号のチャンネル数が複数である場合にも、送信部での信号分析情報に基づいて、受信部で複数音源から構成される入力信号を各音源に対応した構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。
また、図54及び図55に示された構成例は、入力信号の分析情報として分離フィルタのフィルタ係数を用いたが、第一の実施の形態から第十一の実施の形態において用いた分析情報を用いてもよい。そのためには、図54に示される信号分離分析部1200は、分離フィルタの算出し、分離フィルタを用いた信号分離を行う構成にすればよい。それにより、分離フィルタ符号化部1201は、図52に示される音環境情報符号化部1211で構成される。
さらに、信号分析部101における入力信号の分析の方法としては、独立成分分析だけでなく、非特許文献12乃至15に開示されている方法を用いてもよい。また、これらの分析の方法を、本発明の第一の実施の形態乃至第十一の実施の形態における分析の方法に組み合わせて用いてもよい。さらに、分析の方法によっては、分析の途中で、出力すべき分析結果、または、出力すべき分析結果に容易に変換可能な信号が得られる。その場合は、分析を最後まで行わずに分析結果を出力するように分析の処理を変更してもよい。
図56を参照して、本発明の第十二の実施の形態を説明する。第一の実施の形態乃至第十一の実施の形態まで、一方向通信のみを考慮してきた。すなわち、端末に内蔵された送信部から、別の端末に内蔵された受信部との間での通信について説明してきた。第十二の実施の形態は、双方向の通信を考慮し、一台の送受信端末に本発明を適用した送信部と受信部の両方を内蔵しているものである。ここで送信部と受信部の両方を内蔵する本発明を適応した端末としては、第一の実施の形態乃至第十一の実施の形態のいずれかの送信部および受信部を組み合わせて用いてもよい。本発明の第十二の実施の形態では、送信部と受信部の両方を持つことにより、テレビ会議端末や携帯電話などの双方向通信に利用した際に、本発明の効果が得られる。
放送など、一方向の音声通信が行われる場合にも本発明の信号分析制御システムを適用することができる。放送局の送信端末は、例えば、少なくとも図1に示される送信部10を有すればよい。放送局とは、放送免許を持つ放送局のみならず、多地点テレビ会議のメイン会場など、音声を送信し、受信をほとんど行わない地点を含む。この場合の送信端末には、本発明の第二の実施の形態乃至第十一の実施の形態における送信部のいずれを用いてもよい。
また、受信のみを行う地点においても、本発明の信号分析制御システムを適用することができる。受信のみを行う地点における受信端末では、例えば、少なくとも図1に示される受信部15を有すればよい。この受信端末には、本発明の第二の実施の形態乃至第十一の実施の形態における受信部のいずれを用いてもよい。
さらに、図57を参照して、本発明の第十三の実施の形態に基づく信号処理装置を詳細に説明する。本発明の第十三の実施の形態は、プログラム制御により動作するコンピュータ1300、1301から構成される。コンピュータは、中央処理装置、プロセッサ、データ処理装置のいずれでもよい。
コンピュータ1300は、第一の実施の形態乃至第十二の実施の形態のいずれかに係る処理を行い、入力信号を受け伝送信号を出力するためのプログラムに基づき動作する。一方、コンピュータ1301は、第一の実施の形態乃至第十二の実施の形態のいずれかに係る処理を行い、伝送信号を受け、出力信号を出力するためのプログラムに基づき動作する。なお、第十二の実施の形態で説明した送信部および受信部を両方もつ場合、送信処理と受信処理を同一のコンピュータを用いて処理を実行してもよい。
上記で説明してきた第一の実施の形態乃至第十三の実施の形態では、送信部、伝送路、受信部の動作として説明してきたが、それぞれ、録音部、蓄積媒体、再生部と置き換えてもよい。たとえば、図1に示す送信部10は、伝送信号をビットストリームとして蓄積媒体に出力し、蓄積媒体にビットストリームを記録してもよい。また、受信部15は、蓄積媒体に記録されているビットストリームを取出し、ビットストリームを復号して処理を行うことにより出力信号を生成してもよい。
以上好ましい実施の形態及び実施の形態をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施の形態に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
以上の如く、第1の発明は、複数の構成要素を含む入力信号を受ける信号受信部と、前記入力信号から前記複数の構成要素間の関係を表す分析情報を生成する信号分析部を含むことを特徴とする信号分析装置である。
また、第2の発明は、上記第1の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第3の発明は、上記第1の発明において、前記信号分析部は、前記入力信号が周波数成分に分解された変換信号を生成する変換部と、前記変換信号を前記複数の構成要素に分解し、前記分析情報を生成する分析情報生成部とを含むことを特徴とする。
また、第4の発明は、上記第3の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第5の発明は、上記第4の発明において、前記分析情報生成部は、前記変換信号から背景音を推定する背景音推定部と、前記変換信号と前記推定された背景音とから背景音を抑圧するための抑圧係数を生成する背景音情報生成部とを含むことを特徴とする。
また、第6の発明は、上記第4の発明において、前記分析情報生成部は、前記変換信号から背景音を推定する背景音推定部と、前記変換信号と前記推定された背景音とから目的音と背景音との比を生成する背景音情報生成部とを含むことを特徴とする。
また、第7の発明は、上記第4の発明において、前記分析情報生成部は、前記変換信号から背景音を推定する背景音推定部を含むことを特徴とする。
また、第8の発明は、複数の構成要素を含む信号と前記複数の構成要素間の関係を表す分析情報とを受ける信号受信部と、前記分析情報に基づいて、前記複数の構成要素間の関係を制御する信号制御部とを含むことを特徴とする信号制御装置である。
また、第9の発明は、上記第8の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第10の発明は、上記第8の発明において、前記信号制御部は、前記信号が周波数成分に分解された変換信号を生成する変換部と、前記分析情報に基づいて、前記変換信号に含まれる前記複数の構成要素間の関係を制御する信号処理部とを含むことを特徴とする。
また、第11の発明は、上記第10の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第12の発明は、上記第11の発明において、前記分析情報は前記背景音を抑圧するための抑圧係数を含み、前記信号処理部は、前記変換信号と前記抑圧係数とを乗算する乗算部を含むことを特徴とする。
また、第13の発明は、上記第11の発明において、前記分析情報は前記目的音と前記背景音との比を表す目的音背景音比情報を含み、前記信号処理部は、前記目的音背景音比情報から前記背景音を抑圧するための抑圧係数を生成する抑圧係数生成部と、前記変換信号と前記抑圧係数とを乗算する乗算部を含むことを特徴とする。
また、第14の発明は、上記第11の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記信号処理部は、前記背景音情報から前記背景音を抑圧するための抑圧係数を生成する抑圧係数生成部と、前記変換信号と前記抑圧係数とを乗算する乗算部とを含むことを特徴とする。
また、第15の発明は、上記第11の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記信号処理部は、前記背景音情報に基づいて前記変換信号から前記背景音を減算する減算部を含むことを特徴とする。
また、第16の発明は、複数の構成要素を含む信号と前記複数の構成要素間の関係を表す分析情報とを受ける信号受信部と、特定の構成要素を制御する信号制御情報を受け、前記分析情報と前記信号制御情報に基づいて前記複数の構成要素を制御する信号制御部とを含むことを特徴とする信号制御装置である。
また、第17の発明は、上記第16の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第18の発明は、上記第16の発明において、前記信号制御部は、前記信号が周波数成分に分解された変換信号を生成する変換部と、前記分析情報と前記信号制御情報とに基づいて、前記変換信号に含まれる前記複数の構成要素を制御する信号処理部とを含むことを特徴とする。
また、第19の発明は、上記第18の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第20の発明は、上記第19の発明において、前記分析情報は前記背景音を抑圧するための抑圧係数を含み、前記信号処理部は、前記信号制御情報に基づいて前記抑圧係数を修正する抑圧係数修正部と、前記変換信号と前記修正抑圧係数とを乗算する乗算部とを含むことを特徴とする。
また、第21の発明は、上記第20の発明において、前記抑圧係数修正部は、前記抑圧係数と前記信号制御情報とを乗算する乗算部を含むことを特徴とする。
また、第22の発明は、上記第20の発明において、前記抑圧係数修正部は、前記抑圧係数と前記信号制御情報とを比較する比較部を含むことを特徴とする。
また、第23の発明は、上記第20の発明において、前記抑圧係数修正部は、前記抑圧係数と前記信号制御情報とを乗算する乗算部と、前記抑圧係数と前記信号制御情報とを比較する比較部と、前記信号制御情報に基づいて、前記乗算部の結果と前記比較部の結果とを選択する選択部とを含むことを特徴とする。
また、第24の発明は、上記第23の発明において、前記信号制御情報は、抑圧係数の最大値または最小値の少なくともいずれか一方を含むことを特徴とする。
また、第25の発明は、上記第19の発明において、前記分析情報は前記目的音と前記背景音との比を表す目的音背景音比情報を含み、前記信号処理部は、前記信号制御情報に基づいて、前記目的音背景音比情報を修正する目的音背景音比情報修正部と、前記修正目的本背景音比を抑圧係数に変換する抑圧係数変換部と、前記変換信号と前記抑圧係数とを乗算する乗算部とを含むことを特徴とする。
また、第21の発明は、上記第19の発明において、前記分析情報は前記目的音と前記背景音との比を表す目的音背景音比情報を含み、前記信号処理部は、前記目的本背景音比を抑圧係数に変換する抑圧係数変換部と、前記信号制御情報に基づいて前記抑圧係数を修正する抑圧係数修正部と、前記変換信号と前記修正抑圧係数とを乗算する乗算部とを含むことを特徴とする。
また、第27の発明は、上記第19の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記信号処理部は、前記信号制御情報に基づいて前記背景音情報を修正する背景音情報修正部と、前記修正背景音情報を抑圧係数に変換する抑圧係数変換部と、前記変換信号と前記抑圧係数とを乗算する乗算部とを含むことを特徴とする。
また、第28の発明は、上記第19の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記信号処理部は、前記背景音情報を抑圧係数に変換する抑圧係数変換部と、前記信号制御情報に基づいて前記抑圧係数を修正する抑圧係数修正部と、前記変換信号と前記修正抑圧係数とを乗算する乗算部とを含むことを特徴とする。
また、第29の発明は、上記第19の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記信号処理部は、前記信号制御情報に基づいて前記背景音情報を修正する背景音情報修正部と、前記変換信号から前記修正背景音情報を減算する減算部とを含むことを特徴とする。
また、第30の発明は、複数の構成要素を含む信号と前記複数の構成要素間の関係を表す分析情報とを受ける信号受信部と、前記構成要素の出力を制御する構成要素レンダリング情報を受け、前記分析情報と前記構成要素レンダリング情報とに基づいて、前記構成要素を制御し出力信号を生成する出力信号生成部とを含むことを特徴とする信号制御装置である。
また、第31の発明は、上記第30の発明において、前記出力信号制御部は、前記分析情報に基づいて前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換する構成要素情報変換部を含むことを特徴とする。
また、第32の発明は、上記第30の発明において、前記出力信号生成部は、特定の構成要素を制御する信号制御情報を受け、前記信号制御情報と前記分析情報と前記構成要素レンダリング情報とに基づいて前記構成要素を制御し出力信号を生成することを特徴とする。
また、第33の発明は、上記第32の発明において、前記出力信号生成部は、前記信号と前記分析情報とに基づいて、前記信号と前記構成要素との関係を表すパラメータを生成し前記信号制御情報に基づいて前記パラメータを修正する信号制御部と、前記修正パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換する構成要素情報変換部とを含むことを特徴とする。
また、第34の発明は、上記第32の発明において、前記出力信号生成部は、前記分析情報と前記信号制御情報とに基づいて前記信号と前記構成要素との関係を表すパラメータを生成し、前記信号制御情報に基づいて前記パラメータを修正する信号制御部と、前記修正パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換する構成要素情報変換部とを含むことを特徴とする。
また、第35の発明は、上記第33又は第34の発明において、前記レンダリング情報に基づいて前記信号を変換して前記出力信号を生成するレンダリング部を備えることを特徴とする。
また、第36の発明は、上記第30の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第37の発明は、上記第35の発明において、前記出力信号制御部は、前記分析情報に基づいて前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換する構成要素情報変換部を含むことを特徴とする。
また、第38の発明は、上記第36の発明において、前記分析情報は前記背景音を抑圧するための抑圧係数を含み、前記出力信号生成部は、前記抑圧係数に基づいて、前記構成要素を制御する構成要素パラメータを生成する信号制御部と、前記構成要素パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換する構成要素情報変換部とを含むことを特徴とする。
また、第39の発明は、上記第36の発明において、前記分析情報は前記目的音と前記背景音との比を表す目的音背景音比情報を含み、前記出力信号生成部は、前記目的音背景音比情報に基づいて、前記構成要素を制御する構成要素パラメータを生成する信号制御部と、前記構成要素パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換する構成要素情報変換部とを含むことを特徴とする。
また、第40の発明は、上記第36の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記出力信号生成部は、前記信号と前記背景音情報に基づいて、前記構成要素を制御する構成要素パラメータを生成する信号制御部と、前記構成要素パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換する構成要素情報変換部とを含むことを特徴とする。
また、第41の発明は、上記第38から第40いずかに発明において、前記レンダリング情報に基づいて、前記信号を変換して前記出力信号を生成するレンダリング部を備えることを特徴とする。
また、第42の発明は、複数の構成要素を含む入力信号から、前記複数の構成要素間の関係を表す分析情報を生成することを特徴とする。
また、第43の発明は、上記第42の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第44の発明は、上記第42の発明において、前記入力信号が周波数成分に分解された変換信号を生成し、前記変換信号を前記複数の構成要素に分解し、前記分析情報を生成することを特徴とする。
また、第45の発明は、上記第44の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第46の発明は、上記第45の発明において、前記分析情報として、前記変換信号から背景音を推定し、前記変換信号と前記推定された背景音とから背景音を抑圧するための抑圧係数を生成することを特徴とする。
また、第47の発明は、上記第44の発明において、前記分析情報として、前記変換信号から背景音を推定し、前記変換信号と前記推定された背景音とから目的音と背景音との比を生成することを特徴とする。
また、第48の発明は、上記第44の発明において、前記変換信号から背景音を推定することを特徴とする。
また、第49の発明は、複数の構成要素を含む信号と前記複数の構成要素間の関係を表す分析情報とを受信し、前記分析情報に基づいて、前記複数の構成要素間の関係を制御することを特徴とする。
また、第50の発明は、上記第49の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第51の発明は、上記第49の発明において、前記信号が周波数成分に分解された変換信号を生成し、前記分析情報に基づいて、前記変換信号に含まれる前記複数の構成要素間の関係を制御することを特徴とする。
また、第52の発明は、上記第51の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第53の発明は、上記第49の発明において、前記分析情報は前記背景音を抑圧するための抑圧係数を含み、前記変換信号と前記抑圧係数とを乗算し、この乗算結果に基づいて制御することを特徴とする。
また、第54の発明は、上記第52の発明において、前記分析情報は前記目的音と前記背景音との比を表す目的音背景音比情報を含み、前記目的音背景音比情報から前記背景音を抑圧するための抑圧係数を生成し、前記変換信号と前記抑圧係数とを乗算し、この乗算結果に基づいて制御することを特徴とする。
また、第55の発明は、上記第52の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記背景音情報から前記背景音を抑圧するための抑圧係数を生成し、前記変換信号と前記抑圧係数とを乗算し、この乗算結果に基づいて制御することを特徴とする。
また、第56の発明は、上記第52の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記背景音情報に基づいて前記変換信号から前記背景音を減算し、この減算結果に基づいて制御することを特徴とする。
また、第57の発明は、複数の構成要素を含む信号と、前記複数の構成要素間の関係を表す分析情報と、特定の構成要素を制御する信号制御情報とを受け、前記分析情報と前記信号制御情報に基づいて前記複数の構成要素を制御することを特徴とする信号制御方法である。
また、第58の発明は、上記第57の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第59の発明は、上記第57の発明において、前記信号が周波数成分に分解された変換信号を生成し、前記分析情報と前記信号制御情報とに基づいて、前記変換信号に含まれる前記複数の構成要素を制御することを特徴とする。
また、第60の発明は、上記第52の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第61の発明は、上記第60の発明において、前記分析情報は前記背景音を抑圧するための抑圧係数を含み、前記信号制御情報に基づいて、前記抑圧係数を修正し、前記変換信号と前記修正抑圧係数とを乗算し、この乗算結果に基づいて制御することを特徴とする。
また、第62の発明は、上記第61の発明において、前記抑圧係数と前記信号制御情報とを乗算し、抑圧係数を修正することを特徴とする。
また、第63の発明は、上記第61の発明において、前記抑圧係数と前記信号制御情報とを比較し、抑圧係数を修正することを特徴とする。
また、第64の発明は、上記第61の発明において、前記抑圧係数と前記信号制御情報とを乗算し、前記抑圧係数と前記信号制御情報とを比較し、前記信号制御情報に基づいて、前記乗算部の結果と前記比較部の結果とのいずれかを用いて修正することを特徴とする。
また、第65の発明は、上記第61の発明において、前記信号制御情報は、抑圧係数の最大値または最小値の少なくともいずれか一方を含むことを特徴とする。
また、第66の発明は、上記第60の発明において、前記分析情報は前記目的音と前記背景音との比を表す目的音背景音比情報を含み、前記信号制御情報に基づいて、前記目的音背景音比情報を修正し、前記修正目的本背景音比を抑圧係数に変換し、前記変換信号と前記抑圧係数とを乗算し、この乗算結果に基づいて制御することを特徴とする。
また、第67の発明は、上記第60の発明において、前記分析情報は前記目的音と前記背景音との比を表す目的音背景音比情報を含み、前記目的本背景音比を抑圧係数に変換し、前記信号制御情報に基づいて前記抑圧係数を修正し、前記変換信号と前記修正抑圧係数とを乗算し、この乗算結果に基づいて制御することを特徴とする。
また、第68の発明は、上記第60の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記信号制御情報に基づいて前記背景音情報を修正し、前記修正背景音情報を抑圧係数に変換し、前記変換信号と前記抑圧係数とを乗算し、この乗算結果に基づいて制御することを特徴とする。
また、第69の発明は、上記第60の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記背景音情報を抑圧係数に変換し、前記信号制御情報に基づいて前記抑圧係数を修正し、前記変換信号と前記修正抑圧係数とを乗算し、この乗算結果に基づいて制御することを特徴とする。
また、第70の発明は、上記第60の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記信号制御情報に基づいて前記背景音情報を修正し、前記変換信号から前記修正背景音情報を減算し、この減算結果に基づいて制御することを特徴とする。
また、第71の発明は、複数の構成要素を含む信号と、前記複数の構成要素間の関係を表す分析情報と、前記構成要素の出力を制御する構成要素レンダリング情報とを受け、前記分析情報と前記構成要素レンダリング情報とに基づいて、前記構成要素を制御して出力信号を生成することを特徴とする信号制御方法である。
また、第72の発明は、上記第71の発明において、前記分析情報に基づいて前記構成要素レンダリング情報を、前記信号と前記出力信号との関係を表すレンダリング情報に変換することを特徴とする。
また、第73の発明は、上記第71の発明において、特定の構成要素を制御する信号制御情報を受け、前記信号制御情報と前記分析情報と前記構成要素レンダリング情報とに基づいて、前記構成要素を制御して出力信号を生成することを特徴とする。
また、第74の発明は、上記第73の発明において、前記信号と前記分析情報とに基づいて、前記信号と前記構成要素との関係を表すパラメータを生成し、前記信号制御情報に基づいて前記パラメータを修正し、前記修正パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換することを特徴とする。
また、第75の発明は、上記第73の発明において、前記分析情報と前記信号制御情報とに基づいて前記信号と前記構成要素との関係を表すパラメータを生成し、前記信号制御情報に基づいて前記パラメータを修正し、前記修正パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換することを特徴とする。
また、第76の発明は、上記第74又は第75の発明において、前記レンダリング情報に基づいて、前記信号を変換して前記出力信号を生成することを特徴とする。
また、第77の発明は、上記第71の発明において、前記構成要素は、目的音と背景音とを含むことを特徴とする。
また、第78の発明は、上記第76の発明において、前記分析情報に基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換することを特徴とする。
また、第79の発明は、上記第77の発明において、前記分析情報は前記背景音を抑圧するための抑圧係数を含み、前記抑圧係数に基づいて、前記構成要素を制御する構成要素パラメータを生成し、前記構成要素パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換することを特徴とする。
また、第80の発明は、上記第77の発明において、前記分析情報は前記目的音と前記背景音との比を表す目的音背景音比情報を含み、前記目的音背景音比情報に基づいて、前記構成要素を制御する構成要素パラメータを生成し、前記構成要素パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換することを特徴とする。
また、第81の発明は、上記第77の発明において、前記分析情報は前記背景音を表す背景音情報を含み、前記信号と前記背景音情報に基づいて、前記構成要素を制御する構成要素パラメータを生成し、前記構成要素パラメータに基づいて、前記構成要素レンダリング情報を前記信号と前記出力信号との関係を表すレンダリング情報に変換することを特徴とする。
また、第82の発明は、上記第79から第81の発明のいずれかにおいて、前記レンダリング情報に基づいて、前記信号を変換して前記出力信号を生成することを特徴とする。
また、第83の発明は、複数の構成要素を含む信号を受ける信号受信部と、前記信号から前記複数の構成要素間の関係を表す分析情報を生成する信号分析部と、前記複数の構成要素を含む信号と前記分析情報とを受ける信号受信部と、前記分析情報に基づいて前記複数の構成要素間の関係を制御する信号制御部とを含むことを特徴とするシステムである。
また、第84の発明は、複数の構成要素を含む信号を受ける信号受信部と、前記信号から前記複数の構成要素間の関係を表す分析情報を生成する信号分析部と、前記複数の構成要素を含む信号と前記分析情報とを受ける信号受信部と、特定の構成要素を制御する信号制御情報を受け、前記分析情報と前記信号制御情報とに基づいて、前記複数の構成要素を制御する信号制御部とを含むことを特徴とするシステムである。
また、第85の発明は、複数の構成要素を含む信号を受ける信号受信部と、前記信号から前記複数の構成要素間の関係を表す分析情報を生成する信号分析部と、前記複数の構成要素を含む信号と前記分析情報とを受ける信号受信部と、前記構成要素の出力を制御する構成要素レンダリング情報を受け、前記分析情報と前記構成要素レンダリング情報とに基づいて前記構成要素を制御し出力信号を生成する出力信号生成部とを含むことを特徴とするシステムである。
また、第86の発明は、複数の構成要素を含む入力信号を受ける信号受信処理と、前記入力信号から前記複数の構成要素間の関係を表す分析情報を生成する信号分析処理とを情報処理装置に実行させることを特徴とする。
また、第87の発明は、複数の構成要素を含む信号と前記複数の構成要素間の関係を表す分析情報とを受ける信号受信処理と、前記分析情報に基づいて前記複数の構成要素間の関係を制御する信号制御処理とを含むことを特徴とする信号制御プログラムである。
また、第88の発明は、複数の構成要素を含む信号と前記複数の構成要素間の関係を表す分析情報とを受ける信号受信処理と、特定の構成要素を制御する信号制御情報を受け、前記分析情報と前記信号制御情報に基づいて前記複数の構成要素を制御する信号制御処理とを情報処理装置に実行させることを特徴とする信号制御プログラムである。
また、第89の発明は、複数の構成要素を含む信号と前記複数の構成要素間の関係を表す分析情報とを受ける信号受信処理と、前記構成要素の出力を制御する構成要素レンダリング情報を受け、前記分析情報と前記構成要素レンダリング情報とに基づいて前記構成要素を制御し出力信号を生成する出力信号生成処理とを含むことを特徴とする信号制御プログラムである。
本出願は、2007年6月27日に出願された日本出願特願2007−168544号を基礎とする優先権を主張し、その開示の全てをここに取り込む。