JPWO2009087923A1 - 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム - Google Patents

信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム Download PDF

Info

Publication number
JPWO2009087923A1
JPWO2009087923A1 JP2009548889A JP2009548889A JPWO2009087923A1 JP WO2009087923 A1 JPWO2009087923 A1 JP WO2009087923A1 JP 2009548889 A JP2009548889 A JP 2009548889A JP 2009548889 A JP2009548889 A JP 2009548889A JP WO2009087923 A1 JPWO2009087923 A1 JP WO2009087923A1
Authority
JP
Japan
Prior art keywords
signal
background sound
information
component
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009548889A
Other languages
English (en)
Inventor
野村 俊之
俊之 野村
嶋田 修
修 嶋田
昭彦 杉山
昭彦 杉山
宝珠山 治
治 宝珠山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2009087923A1 publication Critical patent/JPWO2009087923A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

送信部の入力信号を分析して分析情報を生成するための信号分析部と、分析情報を用いて受信部の入力信号を制御する信号制御部とを備えていることを特徴とする。

Description

本発明は、複数の音源から構成される入力信号を、信号に含まれる構成要素ごとに制御するための信号分析および信号制御の方法、装置、並びにコンピュータプログラムに関する。
複数の音源が所望音声と背景雑音とから構成される入力信号の背景雑音を抑圧するシステムとして、雑音抑圧システム(以下、ノイズサプレッサという。)が知られている。ノイズサプレッサは、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムである。一般的に、ノイズサプレッサは、周波数領域に変換した入力信号を用いて雑音成分のパワースペクトルを推定し、入力信号から雑音成分の推定パワースペクトルを差し引く。これにより、所望の音声信号に混在する雑音が抑圧される。さらに、これらのノイズサプレッサは、雑音成分のパワースペクトルを継続的に推定することにより、非定常な雑音の抑圧にも適用される。このようなノイズサプレッサに関連する技術としては、例えば、特許文献1に記載されている技術がある。(以下、第一の関連技術という。)
通常、第一の関連技術ノイズサプレッサは、通信に利用される場合、符号化器の前処理として機能する。ノイズサプレッサの出力は符号化されて、通信路を伝送される。受信部では、信号が復号されて可聴信号が生成される。第一の関連技術の1入力の雑音抑圧システムでは、一般的に、抑圧しきれずに残留する残留雑音と、出力される強調音声の歪はトレードオフの関係にある。残留雑音を減らすと歪が増え、歪を減らすと残留雑音が増える。それぞれの利用者によって、残留雑音と歪のバランスの最適状態は異なる。しかし、ノイズサプレッサが符号化器の前にある、すなわち送信部にある構成では、利用者は残留雑音と歪のバランスを自分の好みに合うように調整することができない。
この問題を解決する構成として、非特許文献1に開示された図69に示される受信側ノイズサプレッサが知られている。(以下、第二の関連技術という。)第二の関連技術の構成は、送信部ではなく受信部に雑音抑圧部9501が含まれている。雑音抑圧部9501は、復号器から入力された信号に対する雑音抑圧処理を行う。このため、利用者が残留雑音と歪のバランスを自分の好みに合うように調整することができる。
特開2002−204175号公報 2007年1月、アイ・イー・イー・イー・インターナショナル・カンファレンス・オン・コンシューマー・エレクトロニクス、6.1−4、第2号(IEEE INTERNATIONAL CONFERENCE ON CONSUMER ELECTRONICS, 6.1-4, JAN, 2007)
上述の第一の関連技術では、利用者が残留雑音と歪のバランスを自分の好みに合うように調整することができないという問題がある。この問題を解決する手段として、上述の第二の関連技術がある。
しかし、第二の関連技術では、第一の関連技術で送信部が行っていた雑音抑圧処理を受信部が行うため、受信部の演算量が増大するという問題がある。さらに、第二の関連技術では、受信部にノイズサプレッサ以外の重要な機能があるときには、ノイズサプレッサ機能を組み込むことができない、あるいはノイズサプレッサ機能を組み込むことにより他の機能を組み込むことができないという問題がある。これは、一般的に受信部の総演算量に制約があるためである。また、受信部(または再生部)の演算量が多く、音質や受信機機能の制限による利便性の低下を引き起こす。さらに、第一の関連技術及び第二の関連技術の構成も、音声と背景雑音の分離を目的としており、一般的な信号の分離には適用できないという問題がある。
そこで、本発明は上記課題に鑑みて発明されたものであって、その目的は、少ない演算量で受信部を構成でき、あらゆる種類の入力信号に対して入力信号を構成する要素ごとに独立に制御することのできる信号分析制御システムを提供することである。
上記課題を解決する本発明は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、前記信号と前記分析情報とを多重化して多重化信号を生成することを特徴とする信号分析方法である。
また、上記課題を解決する本発明は、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号を受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記補正値に基づいて前記構成要素制御情報を補正し、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御することを特徴とする信号制御方法である。
また、上記課題を解決する本発明は、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号と構成要素レンダリング情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正し、前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御することを特徴とする信号制御方法である。
また、上記課題を解決する本発明は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、前記信号と前記分析情報とを多重化して多重化信号を生成し、前記多重化信号を受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記補正値に基づいて前記構成要素制御情報を補正し、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御することを特徴とする信号分析制御方法である。
また、上記課題を解決する本発明は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、前記信号と前記分析情報とを多重化して多重化信号を生成し、前記多重化信号と構成要素レンダリング情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記補正値に基づいて前記構成要素制御情報を補正し、前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御することを特徴とする信号分析制御方法である。
また、上記課題を解決する本発明は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と、を含むことを特徴とする信号分析装置である。
また、上記課題を解決する本発明は、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御部と、を含むことを特徴とする信号制御装置である。
また、上記課題を解決する本発明は、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、構成要素レンダリング情報を受け、前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御部と、を含むことを特徴とする信号制御装置である。
また、上記課題を解決する本発明は、信号分析装置と信号制御装置とを含む信号分析制御システムであって、前記信号分析装置は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と、を含み、前記信号制御装置は、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御部と、を含むことを特徴とする信号分析制御システムである。
また、上記課題を解決する本発明は、信号分析装置と信号制御装置とを含む信号分析制御システムであって、前記信号分析装置は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と、を含み、前記信号制御装置は、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、構成要素レンダリング情報を受け、前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御部と、を含むことを特徴とする信号分析制御システムである。
また、上記課題を解決する本発明は、コンピュータに、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、を実行させることを特徴とする信号分析プログラムである。
また、上記課題を解決する本発明は、コンピュータに、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御処理と、を実行させることを特徴とする信号制御プログラムである。
また、上記課題を解決する本発明は、コンピュータに、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、構成要素レンダリング情報を受け、前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御処理と、を実行させることを特徴とする信号制御プログラムである。
また、上記課題を解決する本発明は、コンピュータに、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御処理と、を実行させることを特徴とする信号分析制御プログラムである。
また、上記課題を解決する本発明は、コンピュータに、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、構成要素レンダリング情報を受け、前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御処理と、を実行させることを特徴とする信号分析制御プログラムである。
すなわち、本発明の信号分析および信号制御の方法、装置、並びにコンピュータプログラムでは、送信部(または録音部)で信号を分析して分析情報を求め、受信部(または再生部)で分析情報を用いて信号を制御することを特徴とする。
より具体的には、送信部(または録音部)の入力信号を分析して分析情報を生成するための信号分析部と、分析情報を前記入力信号と多重化して伝送信号を生成する多重化部と、前記伝送信号を分析情報と主信号に分離する分離部と、前記分析情報を用いて受信部(または再生部)の入力信号を制御する信号制御部とを備えていることを特徴とする。
上述した手段によれば、本発明は、送信部で信号の分析を行うので、受信部において信号分析に係る演算量を削減することが出来る。さらに、本発明は、送信部で得られた信号分析情報に基づいて、受信部で複数音源から構成される入力信号を各音源に対応した構成要素ごとに制御することができる。
本発明の第一の実施の形態を示すブロック図 符号化部100の構成例 復号部150の構成例 信号分析部101の構成例 信号制御部151の構成例 分析情報計算部121の構成例 分析情報計算部121の構成例 信号処理部172の構成例 分析情報計算部121の構成例 分析情報計算部121の構成例 信号処理部172の構成例 信号処理部172の構成例 分析情報計算部121の構成例 分析情報計算部121の構成例 分析情報計算部121の構成例 分析情報計算部121の構成例 信号処理部172の構成例 信号処理部172の構成例 信号処理部172の構成例 信号処理部172の構成例 本発明の第三の実施の形態を示すブロック図 信号制御部350の構成例 信号処理部360の構成例 背景音情報修正部460の構成例 背景音情報修正部460の構成例 背景音情報修正部460の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 信号処理部360の構成例 本発明の第五の実施の形態を示すブロック図 出力信号生成部550の構成例 出力信号生成部550の構成例 出力信号生成部550の構成例 構成要素情報変換部563の構成例 出力信号生成部550の構成例 構成要素情報変換部655の構成例 本発明の第七の実施の形態を示すブロック図 出力信号生成部750の構成例 構成要素情報変換部760の構成例 出力信号生成部750の構成例 構成要素情報変換部761の構成例 本発明の第九の実施の形態を示すブロック図 信号分析部900の構成例 信号分析部900の構成例 分析情報計算部911の構成例 分析情報計算部911の構成例 分析情報計算部911の構成例 本発明の第十一の実施の形態を示すブロック図 符号化部1100の構成例 信号分析部1101の構成例 復号部1150の構成例 信号制御部1151の構成例 信号分析部101の構成例 信号制御部151の構成例 信号分析部101の構成例 信号制御部151の構成例 本発明の第十二の実施の形態を示すブロック図 本発明の第十三の実施の形態を示すブロック図 信号制御情報に対する係数補正下限値の倍率の関係を示す図 信号制御情報と目的音存在確率に対する係数補正下限値の倍率の関係を示す図 従来例を示すブロック図
符号の説明
1 送受信部
10, 13, 90 送信部
15, 18, 35, 55, 75 受信部
100, 1100 符号化部
101, 900, 1101 信号分析部
102 多重化部
110, 120, 171, 920 変換部
111 量子化部
121, 911 分析情報計算部
150, 1150 復号部
151, 350, 1151 信号制御部
152 分離部
160 逆量子化部
161, 173 逆変換部
172, 360 信号処理部
200, 1020, 1021, 1022, 2051, 2052 背景音推定部
2011, 2012 抑圧係数計算部
202 背景音情報生成部
203, 2071, 2072 信号対背景音比計算部
2041, 2042 信号対背景音比符号化部
2061, 2062 背景音符号化部
251, 451, 470 乗算器
253 減算器
260, 2611, 2612 背景音情報復号部
2621, 2622 背景音情報変換部
2631, 2632, 2651, 2652 背景音復号部
2641, 2642 抑圧係数生成部
460 背景音情報修正部
461 抑圧係数修正部
466 下限値修正部
471 比較部
472 指定背景音制御部
473 スイッチ
550, 750 出力信号生成部
560, 565 信号制御部
561, 563, 564, 655, 760, 761 構成要素情報変換部
562 レンダリング部
651, 653, 851, 853 構成要素パラメータ生成部
652 レンダリング情報生成部
910 量子化雑音計算部
1200 信号分離分析部
1201 分離フィルタ符号化部
1202 分離フィルタ復号部
1203 フィルタ
1210 音環境分析部
1211 音環境情報符号化部
1212 音環境情報復号部
1213 音環境情報処理部
1300, 1301 コンピュータ
2021, 2022 抑圧係数符号化部
本発明の信号分析制御システムの実施の形態について図面を参照して詳細に説明する。
図1を参照し、本発明の信号分析制御システムの第一の実施の形態について説明する。本発明の信号分析制御システムは、送信部10と受信部15とが伝送路を介して接続された構成である。送信部10は、複数音源から構成される入力信号を受信し、伝送信号を出力する。伝送信号は、伝送路を介して、受信部15に入力される。受信部15は、伝送信号を受信し、出力信号を出力する。また、送信部、伝送路、受信部をそれぞれ、録音部、蓄積媒体、再生部としてもよい。
送信部10は、符号化部100、信号分析部101及び多重化部102から構成される。入力信号は、符号化部100及び信号分析部101に入力される。入力信号は、複数の構成要素を含んでいてもよい。信号分析部101は、入力信号に含まれる各構成要素に対応した構成要素の関係を表す分析情報を算出する。分析情報には、構成要素を制御する情報、構成要素制御情報を含んでいてもよい。信号分析部101は、分析情報を多重化部102に出力する。符号化部100は、入力信号を符号化する。符号化部100は、符号化信号を多重化部102に出力する。多重化部102は、符号化部100から入力される符号化信号と信号分析部101から入力される分析情報とを多重化する。多重化部102は、多重化された信号を伝送信号として伝送路に出力する。
受信部15は、復号部150、信号制御部151及び分離部152から構成される。まず、伝送信号は分離部152に入力される。分離部152は、伝送信号を主信号と分析情報に分離する。続いて、分離部152は、主信号を復号部150に、分析情報を信号制御部151にそれぞれ出力する。復号部150は、主信号を復号し、復号信号を生成する。そして、復号部150は、復号信号を信号制御部151に出力する。ここで、復号信号は一般的な複数音源から構成されるものである。信号制御部151は、分離部152から受信した分析情報に基づいて、復号部150から受けた復号信号を、各音源に対応した構成要素ごとに操作する。信号制御部151は、操作された信号を出力信号として出力する。信号制御部151は、各音源に対応した構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作してもよい。
続いて、図2を参照して、符号化部100の構成例を詳細に説明する。符号化部100は、入力信号を受信し、符号化信号を出力する。符号化部100は、変換部110と量子化部111とから構成される。まず、入力信号が、変換部110に入力される。次に、変換部110は、入力信号を周波数成分に分解し、第一の変換信号を生成する。変換部110は、第一の変換信号を量子化部111に出力する。そして、量子化部111は、第一の変換信号を量子化し、符号化信号として出力する。
変換部110は、複数の入力信号サンプルをまとめて、1ブロックを構成し、このブロックに対して周波数変換を適用する。周波数変換の例としては、フーリエ変換、コサイン変換、KL(カルーネンレーベ)変換などが知られている。これらの変換の具体的な演算に関連する技術及びその性質は、非特許文献2に開示されている。
<非特許文献2> 1990年、「ディジタル・コーディング・オブ・ウェーブフォームス」、プレンティス・ホール (DIGITAL CODING OF WAVEFORMS, PRINCIPLES AND APPLICATIONS TO SPEECH AND VIDEO, PRENTICE-HALL, 1990.)
変換部110はまた、1ブロックの入力信号サンプルを窓関数で重み付けした結果に対して、前述の変換を適用することができる。このような窓関数としては、ハミング、ハニング(ハン)、ケイザー、ブラックマンなどの窓関数が知られている。また、さらに複雑な窓関数を用いることもできる。これらの窓関数に関連する技術は、非特許文献3及び4に開示されている。
<非特許文献3> 1975 年、「ディジタル・シグナル・プロセシング」、プレンティス・ホール (DIGITAL SIGNAL PROCESSING, PRENTICE-HALL, 1975.)
<非特許文献4> 1993 年、「マルチレートシステムズ・アンド・フィルタバンクス」、プレンティス・ホール (MULTIRATE SYSTEMS AND FILTER BANKS, PRENTICE-HALL, 1993.)
変換部110が複数の入力信号サンプルから1ブロックを構成する際に、各ブロックに重なり(オーバラップ)を許容してもよい。例えば、ブロック長の30%のオーバラップを適用する場合には、あるブロックに属する信号サンプルの最後30%は、次のブロックに属する信号サンプルの最初30%として複数のブロックで重複して用いられる。オーバラップを有するブロック化と変換に関連する技術は、非特許文献2に開示されている。
さらに、変換部110は、帯域分割フィルタバンクで構成してもよい。帯域分割フィルタバンクは、複数の帯域通過フィルタから構成される。帯域分割フィルタバンクは、受信した入力信号を複数の周波数帯域に分割して、量子化部111に出力する。帯域分割フィルタバンクの各周波数帯域は等間隔であってもよいし、不等間隔であってもよい。不等間隔に帯域分割することによって、低域では狭帯域に分割して時間分解能を低く、高域では広い帯域に分割して時間分解能を高くすることができる。不等間隔分割の代表例には、低域に向かって帯域が逐次半分になるオクターブ分割や人間の聴覚特性に対応した臨界帯域分割などがある。帯域分割フィルタバンクとその設計法に関連する技術は、非特許文献4に開示されている。
量子化部111は、入力された信号の冗長性を除去し、符号化信号を出力する。冗長性を除去する方法としては、入力された信号の相関が最小となるように制御する。さらに、マスキング効果などの聴覚特性を利用し、聴覚上認知されない信号成分を除去してもよい。量子化方法としては、線形量子化、非線形量子化などの量子化方法が知られている。量子化された信号は、ハフマン符号化などを用いてさらに、冗長性を取り除くことができる。
図3を参照して、復号部150の構成例を詳細に説明する。復号部150は、主信号を受信し、復号信号を出力する。復号部150は、逆量子化部160と逆変換部161とから構成される。逆量子化部160は、受信した各周波数の主信号を逆量子化し、複数の周波数成分から構成される第一の変換信号を生成する。そして、逆量子化部160は、第一の変換信号を逆変換部161に出力する。逆変換部161は、第一の変換信号を逆変換して、復号信号を生成する。そして逆変換部161は、復号信号を出力する。
逆変換部161が適用する逆変換は、変換部110が適用する変換と対応する逆変換が選択されることが望ましい。例えば、変換部110が、複数の入力信号サンプルをまとめて1ブロックを構成し、このブロックに対して周波数変換を適用するときには、逆変換部161は同一数のサンプルに対して対応する逆変換を適用する。また、変換部110が複数の入力信号サンプルから1ブロックを構成する際に、各ブロックに重なり(オーバラップ)を許容する場合には、これに対応して、逆変換部161は逆変換後の信号に対して同一のオーバラップを適用する。さらに、変換部110を帯域分割フィルタバンクで構成するときには、逆変換部161を帯域合成フィルタバンクで構成する。帯域合成フィルタバンクとその設計法に関連する技術は、非特許文献4に開示されている。
図2及び図3の符号化部100と復号部150 の説明では、内部に変換部を含む変換符号化を想定して説明したが、パルス符号変調(PCM)、適応差分パルス符号変調(ADPCM)、さらにCELPなどに代表される分析合成符号化を適用してもよい。PCM/ADPCMに関連する技術は非特許文献2に開示されている。また、CELPに関連する技術は非特許文献5に開示されている。
<非特許文献5> 1985年3月、アイ・イー・イー・イー・インターナショナル・カンファレンス・オン・アクースティック・スピーチ・アンド・シグナル・プロセシング、25.1.1、 (IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, 25.1.1, MAR, 1985, pp.937-940) 937〜940ページ
また、符号化部100は、符号化処理を行わずに入力信号をそのまま多重化部102へ出力し、復号部150は、復号処理を行わずに主信号をそのまま信号制御部151に入力してもよい。この構成により、符号化・復号処理に伴う信号の歪をなくすことができる。さらに、無歪の圧縮・伸張処理を符号化部100および復号部150で行うように構成してもよい。この構成により、信号制御部151は、入力信号に歪を生じさせることなく復号信号を受信することができる。
図4を参照し、信号分析部101の構成例を詳細に説明する。信号分析部101は、入力信号を受信し、分析情報を出力する。信号分析部101は、変換部120と分析情報計算部121とから構成される。変換部120は、受信した入力信号を周波数成分に分解し、第二の変換信号を生成する。変換部120は、第二の変換信号を分析情報計算部121に出力する。分析情報計算部121は、第二の変換信号を音源に対応した構成要素に分解し、複数の構成要素間の関係を表す分析情報を生成する。そして、分析情報計算部121は、分析情報を出力する。また、分析情報計算部121は、第二の変換信号を複数の構成要素から構成される構成要素群に分解し、分析情報を計算してもよい。信号分析部101は、分析情報に冗長性があるときには、分析情報を符号化してもよい。これにより、分析情報の冗長性を最小化することが出来る。変換部120における変換の方式に関しては、変換部110における変換の方式を用いてもよい。
図5を参照して、信号制御部151の構成例を詳細に説明する。信号制御部151は、復号信号と分析情報とを受信し、出力信号を出力する。信号制御部151は、変換部171、信号処理部172及び逆変換部173から構成される。変換部171は、受信した復号信号を周波数成分に分解し、第二の変換信号を生成する。変換部171は、第二の変換信号を信号処理部172に出力する。信号処理部172は、第二の変換信号を、分析情報を用いて音源に対応した構成要素に分解し、複数の構成要素間の関係を変更し、修正復号信号を生成する。そして、信号処理部172は、修正復号信号を逆変換部173に出力する。また、信号処理部172は、複数の構成要素から構成される構成要素群に分解し、複数の構成要素間の関係を変更してもよい。分析情報計算部121において分析情報が符号化されている場合には、信号処理部172は復号処理を行ってから上記の処理を行う。逆変換部173は、修正復号信号を逆変換し、出力信号を生成する。そして、逆変換部173は出力信号を出力する。逆変換部173における逆変換の方式に関しては、逆変換部161における逆変換の方式を用いることが出来る。
以上説明したように、本発明の第一の実施の形態によれば、送信部から出力される入力信号の分析情報に基づいて、受信部で複数音源から構成される入力信号を各音源に対応した構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。
続いて、本発明の第二の実施の形態について詳細に説明する。本発明の第二の実施の形態では、複数音源から構成される入力信号の一例として、目的音と背景音とから構成される入力信号を用いて説明する。第二の実施の形態の構成は図1で表される。第一の実施の形態とは、信号分析部101と信号制御部151の構成が異なる。信号分析部101は、目的信号または主信号と背景信号とから構成される入力信号とを受信し、目的信号または主信号と背景信号との関係を表す情報を分析情報として多重化部102に出力する。ここで、入力信号は、目的音と背景音とから構成される信号でもよい。さらに、分析情報は、主信号と背景信号とを制御する情報を含んでいてもよい。また、信号制御部151は、復号信号と分析情報とを受信し、目的信号または主信号と背景信号を制御して出力信号を生成し、出力する。信号制御部151は、目的音と背景から構成される信号を出力信号として出力してもよい。以下、目的音と背景音から構成される信号を用いて説明する。
第一の実施例は、信号分析部101が、分析情報または構成要素制御情報として抑圧係数情報を計算する。抑圧係数情報は、背景音を抑圧するために目的音と背景音とから構成される入力信号に作用される情報である。信号制御部151は抑圧係数情報を用いて復号信号を制御する。信号分析部101の構成は図4で表される。本実施例の分析情報計算部121の構成は、第一の実施の形態の分析情報計算部121と異なる。また、信号制御部151は図5で表される。本実施例の信号処理部172の構成は、第一の実施の形態の信号処理部172と異なる。
まず、図6を参照して、分析情報計算部121の構成例を詳細に説明する。分析情報計算部121は、第二の変換信号を受信し、分析情報として抑圧係数情報を出力する。分析情報計算部121は、背景音推定部200と抑圧係数計算部2011と抑圧係数符号化部2021から構成される。
背景音推定部200は、第二の変換信号を受信し、背景音の推定を行い、背景音推定結果を生成する。背景音推定部200は、背景音推定結果を抑圧係数計算部2011に出力する。背景音推定結果としては、背景音の振幅絶対値やエネルギ、背景音と入力信号との振幅比やエネルギ比及びこれらの平均値、区間最大値、区間最小値などがある。
抑圧係数計算部2011は、第二の変換信号と背景音推定結果とを用いて、抑圧係数を補正する補正値を計算する。つまり、抑圧係数計算部2011は、背景音を抑圧するための抑圧係数の補正値として係数補正下限値とを計算する。そして、抑圧係数計算部2011は、抑圧係数と係数補正下限値を抑圧係数符号化部2021に出力する。一般的に、抑圧係数が小さくなりすぎると背景音を抑圧後の信号歪が増加する。そこで、抑圧係数の下限値を表す係数補正下限値を用いると、信号歪の過剰な増加を避けることができる。係数補正下限値は、あらかじめ特定の値をメモリに記憶しておいてもよいし、背景音推定結果に応じて計算しても良い。このような計算には、メモリに記憶された複数の値から適切な値を選択する操作も含む。係数補正下限値は、背景音推定結果が小さいときに小さくなるように設定すると良い。背景音推定結果が小さいときは、入力信号において目的音が支配的であることを表し、構成要素の操作において歪を生じにくいためである。抑圧係数の計算方法に関連する技術としては、非特許文献6に開示されている最小平均二乗誤差短時間スペクトル振幅に基づく方法(MMSE STSA)、非特許文献7に開示されている最小平均二乗誤差対数スペクトル振幅に基づく方法(MMSE LSA)、非特許文献8に開示されている最尤スペクトル振幅推定に基づく方法などを用いてもよい。係数補正下限値の計算方法の一例として、特許文献1に開示されている方法を用いてもよい。なお、係数補正下限値を逐次計算する代わりに、メモリに固定値を記憶しておき、これを逐次読み出して利用することも可能である。
<非特許文献6> 1984年12月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第32巻、第6号、(IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.32, NO. 6, PP. 1109-1121, Dec. 1984) 1109〜1121ページ
<非特許文献7> 1985年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第33巻、第2号、 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.33, NO. 2, PP. 443-445, Apr. 1985) 443〜445ページ
<非特許文献8> 2005年7月、ユーラシップ・ジャーナル・オン・アプライド・シグナル・プロセシング、第2005巻、第7号、 (EURASIP JOURNAL ON ADVANCES IN SIGNAL PROCESSING, VOLUME 2005, Issue 7, JUL, 2005, pp.1110-1126.)1110〜1126ページ
抑圧係数符号化部2021は、抑圧係数と係数補正下限値を受け、それぞれを符号化する。抑圧係数符号化部2021は、抑圧係数と係数補正下限値を符号化し、符号化結果を抑圧係数情報として出力する。符号化については、すでに量子化部111に関して説明した内容と同様の方法を用いてもよい。符号化により、抑圧係数と係数補正下限値の冗長性を除去することが出来る。また、抑圧係数符号化部2021は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、抑圧係数と係数補正下限値を抑圧係数情報として出力してもよい。
次に、図8を参照して、信号処理部172の構成例を詳細に説明する。信号処理部172は、第二の変換信号と、分析情報として抑圧係数情報を受信し、修正復号信号を出力する。信号処理部172は、抑圧係数復号部260と乗算器251とから構成される。
抑圧係数復号部260は、受信した抑圧係数情報から抑圧係数と係数補正下限値とを復号し、抑圧係数と係数補正下限値とから補正抑圧係数を算出し、補正抑圧係数を乗算器251に出力する。抑圧係数と係数補正下限値とが符号化されていないときには、抑圧係数復号部260は、復号処理を行わず、抑圧係数と係数補正下限値とから直接、補正抑圧係数を算出する。抑圧係数と係数補正下限値とから補正抑圧係数を算出する方法は、特許文献1に開示されている方法を用いてもよい。特許文献1に開示されている方法は、抑圧係数と係数補正下限値とを比較する方法である。抑圧係数が係数補正下限値より大きい場合は、補正抑圧係数として抑圧係数を出力する。また、抑圧係数が係数補正下限値より小さい場合は、補正抑圧係数として係数補正下限値を出力する。乗算器251は、第二の変換信号と補正抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
第二の実施例では、信号分析部101が分析情報または構成要素制御情報として信号対背景信号比情報を計算する。また、信号分析部101は分析情報として信号対背景音比情報を計算してもよい。以下は、信号対背景音比を用いて説明する。これに対応して、信号制御部151は、信号対背景音比情報を用いて復号信号を制御する。これにより、目的音と背景音とから構成される入力信号において、背景音が抑圧された信号を得ることが出来る。
まず、信号分析部101について説明する。信号分析部101は、第一の実施例と同じく、図4で表される。本実施例と第一の実施例とを比較すると、分析情報計算部121の構成が異なり、分析情報として信号対背景音比情報を出力する。
図9を参照して、本実施例の分析情報計算部121について詳細に説明する。分析情報計算部121は、第二の変換信号を受信し、分析情報として信号対背景音比情報を出力する。分析情報計算部121は、背景音推定部200と抑圧係数計算部2011と信号対背景音比計算部203と信号対背景音比符号化部2041から構成される。
背景音推定部200は、第一の実施例と同様に、第二の変換信号を受信し、背景音の推定を行い、背景音推定結果を生成する。そして、背景音推定部200は、背景音推定結果を抑圧係数計算部2011に出力する。
抑圧係数計算部2011は、第二の変換信号と背景音推定結果とを用いて、背景音を抑圧するための抑圧係数の補正値として係数補正下限値を計算する。そして、抑圧係数計算部2011は、信号対背景音比計算部203に抑圧係数を出力し、係数補正下限値を信号対背景音比符号化部2041に出力する。抑圧係数と係数補正下限値の計算方法は、図6に示される第一の実施例の抑圧係数計算部2011の計算方法を用いてもよい。信号対背景音比計算部203は、入力された抑圧係数Gを用いて、信号対背景音比Rを計算する。入力信号をX、目的音をS、背景音をNとすると、次の関係が成立する。
[数1]
Figure 2009087923
[数2]
Figure 2009087923
[数3]
Figure 2009087923
この定義によるRは、背景音が雑音であるときに、事前信号対雑音比(事前SNR)として知られている。式[数1]と[数2]を[数3]に代入すると、
[数4]
Figure 2009087923
を得る。
信号対背景音比計算部203は、計算した信号対背景音比Rを信号対背景音比符号化部2041に出力する。信号対背景音比符号化部2041は、入力された信号対背景音比Rと係数補正下限値とを符号化する。信号対背景音比符号化部2041は、符号化された信号対背景音比Rと係数補正下限値とを信号対背景音比情報として出力する。符号化処理の詳細については、抑圧係数符号化部2021における符号化処理と同様の符号化処理を用いることが出来る。これにより、信号対背景音比R及び係数補正下限値の冗長性を除去することが出来る。また、信号対背景音比符号化部2041は、情報量を削減する必要がない場合には、信号対背景音比R及び係数補正下限値の符号化処理を行わずに、信号対背景音比と係数補正下限値とを信号対背景音比情報として出力してもよい。
さらに、[数4]から明らかなように、係数補正下限値に代えて、信号対背景音比Rに関する下限値、すなわち信号対背景音比下限値を用いてもよい。すなわち、抑圧係数Gが小さくなるときに、信号対背景音比Rも同様に小さくなる。これは、変換を用いて、抑圧係数Gの下限値を信号対背景音比Rの下限値に換算すると、信号対背景音比Rが過剰に小さくなることを防止できることを表している。このときには、抑圧係数計算部2011は、抑圧係数と信号対背景音比下限値を計算する。信号対背景音比下限値は、図6に示される第一の実施例の抑圧係数計算部2011における抑圧係数下限値と同様に、信号対背景音比に応じて算出される。抑圧係数計算部2011は、信号対背景音比計算部203に抑圧係数を出力し、信号対背景音比下限値を信号対背景音比符号化部2041に出力する。信号対背景音比符号化部2041は、入力された信号対背景音比Rと信号対背景音比下限値を符号化する。信号対背景音比符号化部2041は、符号化された信号対背景音比Rと信号対背景音比下限値を信号対背景音比情報として出力する。
次に、信号制御部151について詳細に説明する。信号制御部151は、第一の実施例と同じく、図5で表される。本実施例と第一の実施例とは、信号処理部172の構成が異なる。
図11を参照して、信号処理部172の構成例を詳細に説明する。信号処理部172は、第二の変換信号と分析情報として信号対背景音比情報とを受信し、修正復号信号を出力する。信号処理部172は、信号対背景音比復号部2611と抑圧係数変換部2621と乗算器251とから構成される。
信号対背景音比復号部2611は、受信した信号対背景音比情報から信号対背景音比Rと係数補正下限値を復号し、抑圧係数変換部2621に出力する。信号対背景音比Rと係数補正下限値が符号化されていないときには、信号対背景音比復号部2611は、復号処理を行わず、信号対背景音比Rと係数補正下限値を直接出力する。
抑圧係数変換部2621は、信号対背景音比Rを抑圧係数Gに変換する。その後、抑圧係数変換部2621は、抑圧係数Gと係数補正下限値とを比較する。抑圧係数Gが係数補正下限値より大きい場合は、抑圧係数変換部2621は補正抑圧係数として抑圧係数Gを出力する。また、抑圧係数Gが係数補正下限値より小さい場合は、抑圧係数変換部2621は補正抑圧係数として係数補正下限値を出力する。信号対背景音比Rから抑圧係数Gへの変換は、[数4]に基づいて行う。[数4]をGについて解くと、
[数5]
Figure 2009087923
を得る。
乗算器251は、第二の変換信号と補正抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
係数補正下限値に代えて、信号対背景音比下限値を用いる場合には、図11に示される信号対背景音比復号部2611は、受信した信号対背景音比情報から信号対背景音比Rと信号対背景音比下限値とを復号し、抑圧係数変換部2621に出力する。信号対背景音比Rと信号対背景音比下限値が符号化されていないときには、信号対背景音比復号部2611は、復号処理を行わず、信号対背景音比Rと信号対背景音比下限値を直接出力する。抑圧係数変換部2621は、信号対背景音比Rと信号対背景音比下限値から補正信号対背景音比を求める。さらに、抑圧係数変換部2621は、補正信号対背景音比をRとして[数5]を適用し、得られたGを補正抑圧係数として乗算器251へ出力する。
続いて、図13を参照して、分析情報計算部121の他の構成例を詳細に説明する。図9に示される分析情報計算部121と比較すると、本構成例の分析情報計算部121は抑圧係数計算部2011を備えていない点が異なる。また、信号対背景音比計算部2071は、第二の変換信号と背景音推定結果とに基づいて、信号対背景音比と係数補正下限値を計算する。図13に示される分析情報計算部121において、信号対背景音比Rの定義として、[数3]の代わりに[数6]が用いられる。この定義による信号対背景音比Rは、背景音が雑音であるときに、事後信号対雑音比(事後SNR)として知られている。
[数6]
Figure 2009087923
すなわち、本構成例は、背景音が雑音である場合には、事前SNRに代えて事後SNRを分析情報として用いる構成である。[数6]のRは、抑圧係数Gを必要とせず、入力信号と背景音とから計算される。これにより、信号対背景音比計算部2071は、第二の変換信号と背景音推定結果とに基づいて、信号対背景音比を計算することができる。なお、係数補正下限値は、図6に示される第一の実施例の抑圧係数計算部2011と同様の方法で算出できる。そして、信号対背景音比計算部2071は、信号対背景音比と係数補正下限値を信号対背景音比符号化部2041に出力する。信号対背景音比符号化部2041の動作は、図9に示される信号対背景音比符号化部2041の動作と同様であるので説明は省略する。
係数補正下限値に代えて、信号対背景音比Rに関する信号対背景音比下限値を用いてもよい。この場合、信号対背景音比計算部2071は、第二の変換信号と背景音推定結果とに基づいて、信号対背景音比と信号対背景音比下限値を計算する。信号対背景音比計算部2071は、信号対背景音比と信号対背景音比下限値とを信号対背景音比符号化部2041に出力する。信号対背景音比符号化部2041は、入力された信号対背景音比Rと信号対背景音比下限値とを符号化する。信号対背景音比符号化部2041は、符号化された信号対背景音比Rと信号対背景音比下限値とを信号対背景音比情報として出力する。
一方、[数1]と[数2]を[数6]に代入し、SとNが無相関であると仮定すると、
[数7]
Figure 2009087923
を得る。すなわち、信号対背景音比計算部203において、[数7]を用いて信号対背景音比Rを計算しても良い。
本構成例において、受信側の信号処理部172は、上述の構成例と同じく、図11で表される。信号対背景音比復号部2611は、受信した信号対背景音比情報から信号対背景音比Rと係数補正下限値とを復号し、信号対背景音比Rと係数補正下限値を抑圧係数変換部2621に出力する。抑圧係数変換部2621は、信号対背景音比Rを抑圧係数Gに変換し、抑圧係数Gと係数補正下限値とから補正抑圧係数を算出する。その後、抑圧係数変換部2621は、補正抑圧係数を出力する。信号対背景音比Rから抑圧係数Gへの変換は、[数8]に基づいて行う。すなわち、
[数7]をGについて解くと、
[数8]
Figure 2009087923
を得る。
係数補正下限値に代えて、信号対背景音比Rに関する信号対背景音比下限値を用いる場合には、信号対背景音比復号部2611は、受信した信号対背景音比情報から信号対背景音比Rと信号対背景音比下限値とを復号し、補正信号対背景音比を求める。また、信号対背景音比復号部2611は、補正信号対背景音比を抑圧係数変換部2621に出力する。抑圧係数変換部2621は、補正信号対背景音比をRとして[数8]を適用し、得られたGを抑圧係数として乗算器251へ出力する。
続いて第三の実施例について説明する。第三の実施例は、信号分析部101が背景音情報を分析情報または構成要素制御情報として出力する。これに対応して、信号制御部151は背景音情報を用いて復号信号を制御する。これにより、目的音と背景音とから構成される入力信号において、背景音が抑圧された信号を得ることが出来る。
まず、信号分析部101について説明する。信号分析部101は、第一の実施例と同じく、図4で表される。本実施例の分析情報計算部121の構成が第一の実施例と異なり、分析情報として背景音情報を出力する。
図15を参照して、本実施例の分析情報計算部121の構成例について詳細に説明する。分析情報計算部121は、背景音推定部2051と背景音符号化部2061とから構成される。分析情報計算部121は、第二の変換信号を受信し、分析情報として背景音情報を出力する。
背景音推定部2051は、第一の実施例の背景音推定部200と同様にして、第二の変換信号を受信し、背景音の推定を行う。そして、背景音推定部2051は、背景音推定結果を生成する。また、背景音推定部2051は図6に示される第一の実施例の抑圧係数計算部2011と同様にして補正値として係数補正下限値を算出する。背景音推定部2051は、背景音推定結果と係数補正下限値を、背景音符号化部2061に出力する。
背景音符号化部2061は、入力された背景音推定結果と係数補正下限値とを符号化し、符号化された背景音推定結果と係数補正下限値とを背景音情報として出力する。符号化処理については、抑圧係数符号化部2021と同様の符号化処理を用いることが出来る。これにより、背景音推定結果及び係数補正下限値の冗長性を除去することが出来る。また、背景音符号化部2061は、情報量を削減する必要がない場合には、背景音推定結果と係数補正下限値の符号化処理を行わずに、背景音推定結果と係数補正下限値とを背景音情報として出力してもよい。
補正値として、係数補正下限値に代えて背景音上限値を用いてもよい。背景音に上限値を設定することによって、背景音推定結果に上限が設定される。第二の復号信号に対して作用させる背景音に上限が存在すると、得られた修正復号信号に下限が生じる。すなわち、修正復号信号における歪を低減することができる。この場合、背景音推定部2051は、第二の変換信号に基づいて、背景音と背景音上限値とを計算する。背景音上限値は、あらかじめ特定の値をメモリに記憶しておいてもよいし、背景音推定結果に応じて計算しても良い。このような計算には、メモリに記憶された複数の値から適切な値を選択する操作も含む。背景音上限値は、背景音推定結果が小さいときに大きくなるように設定すると良い。背景音推定結果が小さいときは、入力信号において目的音が支配的であることを表し、構成要素の操作において歪を生じにくいためである。背景音推定部2051は、背景音と背景音上限値とを背景音符号化部2061に出力する。背景音符号化部2061は、入力された背景音と背景音上限値を符号化する。背景音符号化部2061は、符号化された背景音と背景音上限値を背景音情報として出力する。
次に、信号制御部151について説明する。信号制御部151は、第一の実施例と同じく、図5で表される。本実施例と第一の実施例とは、信号処理部172の構成が異なる。
図17を参照して、信号処理部172の構成例を詳細に説明する。信号処理部172は、第二の変換信号と分析情報として背景音情報とを受信し、修正復号信号を出力する。信号処理部172は、背景音復号部2631と抑圧係数生成部2641と乗算器251とから構成される。
背景音復号部2631は、分析情報として背景音情報を受信し、背景音情報から背景音推定結果と係数補正下限値とを復号する。背景音復号部2631は、背景音推定結果と係数補正下限値とを抑圧係数生成部2641に出力する。背景音推定結果と係数補正下限値とが符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音推定結果と係数補正下限値とを出力する。
抑圧係数生成部2641は、背景音推定結果と係数補正下限値と第二の変換信号とを受信する。そして、抑圧係数生成部2641は、背景音推定結果と第二の変換信号とに基づいて背景音を抑圧するための抑圧係数を計算する。この抑圧係数の計算は、図9に示される抑圧係数計算部2011と同様の計算方法を用いてもよい。さらに、抑圧係数生成部2641は、抑圧係数と係数補正下限値とから補正抑圧係数を算出し、補正抑圧係数を出力する。抑圧係数の計算方法の技術としては、前述の非特許文献6、非特許文献7、又は非特許文献8に開示されている技術を用いてもよい。
乗算器251は、第二の変換信号と補正抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2631は、分析情報として背景音情報を受信し、背景音情報から背景音推定結果と背景音上限値を復号する。背景音復号部2631は、背景音推定結果と背景音上限値を抑圧係数生成部2641に出力する。背景音推定結果と背景音上限値が符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音推定結果と背景音上限値を出力する。
抑圧係数生成部2641は、背景音推定結果と背景音上限値と第二の変換信号とを受信する。また、抑圧係数生成部2641は、背景音推定結果を背景音上限値を用いて修正し、修正背景音推定結果を生成する。修正背景音推定結果は、背景音推定結果が背景音上限値を超えるときには背景音上限値に設定し、超えないときには背景音推定結果そのものに設定する。
さらに、抑圧係数生成部2641は、修正背景音推定結果と第二の変換信号とに基づいて背景音を抑圧するための抑圧係数を計算し、乗算器251に出力する。抑圧係数をMMSE STSAで計算する場合、抑圧後の信号に残留する背景音のパワーが確率的に最小となることが、非特許文献6に開示されている。
乗算器251は、第二の変換信号と抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
さらに、図19を参照して信号処理部172の他の構成例を詳細に説明する。信号処理部172は、第二の変換信号と背景音情報とを受信し、背景音が減算された信号を修正復号信号として出力する。本構成例の信号処理部172は、背景音復号部2652と減算器253とで構成されている。第二の変換信号が減算器253と背景音復号部2652に入力され、分析情報として背景音情報が背景音復号部2652に入力される。背景音復号部2652は、背景音情報から背景音推定結果と係数補正下限値とを復号し、第二の変換信号と係数補正下限値とから信号下限値を算出する。そして、背景音復号部2652は、背景音推定結果と信号下限値とから背景音を算出し、背景音を減算器253に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と係数補正下限値から背景音を算出する。減算器253は、第二の変換信号から背景音を減算する。そして、減算器253は、背景音が抑圧された信号を修正復号信号として出力する。なお、信号下限値は修正復号信号の下限値を表す。背景音復号部2652は、後段の減算器253の出力である修正復号信号が信号下限値を下回らないように背景音を算出する。背景音が雑音である場合、この減算はスペクトル減算として知られている。スペクトル減算に関連する技術が、非特許文献9に開示されている。また、信号下限値に関連する技術も非特許文献9に開示されている。
<非特許文献9> 1979年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第27巻、第2号、 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.27, NO. 2, PP. 113-120, April 1979) 113〜120ページ
また、減算器253には、減算に加えて、付加機能を含めることもできる。例えば、減算器253に、減算結果が負になるときにこれをゼロあるいは微小な正の値に補正する機能、減算結果の最小値を正の値に設定するリミッタ機能、又は背景音情報に対して係数を乗算したり定数を加算したりすることで修正してから減算する機能などを付加してもよい。
係数補正下限値に代えて背景音上限値を用いる場合には、背景音復号部2652は、分析情報として背景音情報を受信し、背景音情報から背景音推定結果と背景音上限値を復号する。背景音復号部2652は、背景音推定結果と背景音上限値とを用いて第一の修正背景音推定結果を算出する。第一の修正背景音推定結果は、背景音推定結果が背景音上限値を超えるときには背景音上限値に設定し、超えないときには背景音推定結果そのものに設定する。また、背景音復号部2652は、第二の変換信号と第一の修正背景音推定結果から背景音を算出し、減算器253に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と背景音上限値から背景音を算出する。減算器253は、第二の変換信号から背景音を減算する。そして、減算器253は、背景音が抑圧された信号を修正復号信号として出力する。
背景音は、例えば第二の変換信号と第一の修正背景音推定結果とから求めた信号対背景音比に対応した修正量で、第一の修正背景音推定結果を修正して求めることができる。このような修正としては、修正量の加算や修正係数の乗算を用いてもよく、加算量(減算量)や修正係数の大小が、信号対背景音比に対応して制御される。特に、信号対背景音比が小さいときに第一の修正背景音推定結果が小さくなるように修正して背景音を算出することは、出力される修正復号信号の歪を低減する効果がある。
本実施例の他の構成として、背景音復号部2652において信号下限値を算出する代わりに、信号分析部101内の分析情報計算部121において信号下限値を算出して、背景音情報を背景音推定結果と信号下限値としても良い。本実施例の分析情報計算部121の構成例を、図15を参照して説明する。分析情報計算部121は、背景音推定部2051と背景音符号化部2061とから構成される。分析情報計算部121は、第二の変換信号を受信し、分析情報として背景音情報を出力する。背景音推定部2051は、第一の実施例の背景音推定部200と同様にして、第二の変換信号を受信し、背景音の推定を行い、背景音推定結果を生成する。また、背景音推定部2051は第二の変換信号と背景音推定結果から信号下限値を算出する。背景音推定部2051は、背景音推定結果と信号下限値とを、背景音符号化部2061に出力する。背景音符号化部2061は、入力された背景音推定結果と信号下限値とを符号化し、符号化された背景音推定結果と信号下限値とを背景音情報として出力する。符号化処理については、抑圧係数符号化部2021と同様の符号化処理を用いることが出来る。これにより、背景音推定結果及び信号下限値の冗長性を抑圧することが出来る。また、背景音符号化部2061は、情報量を削減する必要がない場合には、背景音推定結果及び信号下限値の符号化処理を行わずに、背景音推定結果と信号下限値とを背景音情報として出力してもよい。
信号制御部151内の信号処理部172の構成例を図20を参照し説明する。信号処理部172は、第二の変換信号と背景音情報とを受信し、背景音が減算された信号を修正復号信号として出力する。本構成例の信号処理部172は、背景音復号部2651と減算器253とで構成されている。第二の変換信号が減算器253に入力され、分析情報として背景音情報が背景音復号部2651に入力される。背景音復号部2651は、背景音情報から背景音推定結果と信号下限値とを復号する。また、背景音復号部2651は、背景音推定結果と信号下限値とから背景音を算出し、背景音を減算器253に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と信号下限値とから背景音を算出する。減算器253は、第二の変換信号から背景音を減算する。そして、減算器253は、背景音が減算された信号を修正復号信号として出力する。
第四の実施例は、信号分析部101が分析情報として抑圧係数情報を計算する。第一の実施例との違いは、抑圧係数情報として抑圧係数と係数補正下限値とに加えて新たに主信号存在確率が含まれる点である。ここで、主信号存在確率は目的音存在確率であってもよい。以下、目的音存在確率を用いて説明する。これに対応して、信号制御部151は抑圧係数情報を用いて復号信号を制御する。これにより、目的音と背景音とから構成される入力信号において、背景音が抑圧された信号を得ることが出来る。
まず、信号分析部101について説明する。信号分析部101は、第一の実施例と同じく、図4で表される。本実施例と第一の実施例とを比較すると、分析情報計算部121の構成が異なる。
図7を参照して、本実施例の分析情報計算部121について詳細に説明する。分析情報計算部121は、第二の変換信号を受信し、分析情報として抑圧係数情報を出力する。分析情報計算部121は、背景音推定部200と抑圧係数計算部2012と抑圧係数符号化部2022から構成される。
背景音推定部200は、第一の実施例と同様に、第二の変換信号を受信し、背景音の推定を行い、背景音推定結果を生成し、抑圧係数計算部2012に出力する。
抑圧係数計算部2012は、第二の変換信号と背景音推定結果とを用いて、背景音を抑圧するための抑圧係数と係数補正下限値と目的音存在確率とを計算する。目的音存在確率は、入力信号中に目的音がどの程度含まれているかを表し、例えば、目的音と背景音の振幅やパワーの比によって表すことができる。この比そのもの、短時間平均、最大値、最小値などを、目的音存在確率として用いても良い。そして、抑圧係数計算部2012は、抑圧係数と係数補正下限値と目的音存在確率とを抑圧係数符号化部2022に出力する。抑圧係数の計算方法として、前述の非特許文献6、非特許文献7、又は非特許文献8に開示されている技術などを用いてもよい。係数補正下限値と目的音存在確率の計算方法は、特許文献1に開示されている方法を用いてもよい。なお、係数補正下限値を逐次計算する代わりに、メモリに固定値を記憶しておき、これを逐次読み出して利用してもよい。
抑圧係数符号化部2022は、抑圧係数と係数補正下限値と目的音存在確率とを受け、それぞれを符号化する。抑圧係数符号化部2022は、符号化された抑圧係数と係数補正下限値と目的音存在確率とを、抑圧係数情報として出力する。符号化の詳細については、上述の量子化部111において説明した方法を用いる。符号化により、抑圧係数、係数補正下限値及び目的音存在確率の冗長性を除去することが出来る。また、抑圧係数符号化部2022は、情報量を削減する必要がない場合には、これらの符号化処理を行わずに、抑圧係数と係数補正下限値と目的音存在確率とを抑圧係数情報として出力してもよい。
次に、信号制御部151について説明する。信号制御部151は、第一の実施例と同じく、図5で表される。本実施例と第一の実施例とは、信号処理部172の構成が異なる。
図8を参照して、信号処理部172の構成例を詳細に説明する。信号処理部172は、第二の変換信号と分析情報として抑圧係数情報とを受信し、修正復号信号を出力する。信号処理部172は、抑圧係数復号部260と乗算器251とから構成される。
抑圧係数復号部260は、受信した抑圧係数情報から抑圧係数と係数補正下限値と目的音存在確率とを復号し、抑圧係数と係数補正下限値と目的音存在確率とから補正抑圧係数を算出する。抑圧係数と係数補正下限値と目的音存在確率とが符号化されていないときには、抑圧係数復号部260は、復号処理を行わず、抑圧係数と係数補正下限値と目的音存在確率とから直接補正抑圧係数を算出する。抑圧係数と係数補正下限値と目的音存在確率とから補正抑圧係数を算出する方法は、特許文献1に開示されている方法を用いてもよい。乗算器251は、第二の変換信号と補正抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
第五の実施例では、信号分析部101が分析情報として信号対背景音比情報を計算する。第二の実施例との違いは、信号対背景音比情報として信号対背景音比と係数補正下限値とに加えて新たに目的音存在確率が含まれる点である。これに対応して、信号制御部151は、信号対背景音比情報を用いて復号信号を制御する。これにより、目的音と背景音とから構成される入力信号において、背景音が抑圧された信号を得ることが出来る。
まず、信号分析部101について説明する。信号分析部101は、第一の実施例と同じく、図4で表される。本実施例と第一の実施例とを比較すると、分析情報計算部121の構成が異なる。
図10を参照して、本実施例の分析情報計算部121について詳細に説明する。分析情報計算部121は、第二の変換信号を受信し、分析情報として信号対背景音比情報を出力する。分析情報計算部121は、背景音推定部200と抑圧係数計算部2012と信号対背景音比計算部203と信号対背景音比符号化部2042とから構成される。
背景音推定部200は、第一の実施例と同様に、第二の変換信号を受信し、背景音の推定を行る。そして、背景音推定部200は、背景音推定結果を生成する。そして、背景音推定部200は、背景音推定結果を、抑圧係数計算部2012に出力する。
抑圧係数計算部2012は、第二の変換信号と背景音推定結果とを用いて、背景音を抑圧するための抑圧係数と係数補正下限値と目的音存在確率とを計算する。そして、抑圧係数計算部2012は、信号対背景音比計算部203に抑圧係数を出力し、係数補正下限値と目的音存在確率とを信号対背景音比符号化部2042に出力する。抑圧係数と係数補正下限値と目的音存在確率との計算方法は、図7に示される第一の実施例の抑圧係数計算部2012の計算方法を用いるてもよい。信号対背景音比計算部203は、入力された抑圧係数Gを用いて、信号対背景音比Rを[数4]に基づいて計算する。
信号対背景音比計算部203は、[数4]により計算した信号対背景音比Rを信号対背景音比符号化部2042に出力する。信号対背景音比符号化部2042は、入力された信号対背景音比Rと係数補正下限値と目的音存在確率とを符号化する。信号対背景音比符号化部2042は、符号化された信号対背景音比Rと係数補正下限値と目的音存在確率とを信号対背景音比情報として出力する。符号化処理の詳細については、抑圧係数符号化部2022における符号化処理と同様の符号化処理を用いることが出来る。これにより、信号対背景音比R、係数補正下限値及び目的音存在確率の冗長性を除去することが出来る。また、信号対背景音比符号化部2042は、情報量を削減する必要がない場合には、信号対背景音比Rと係数補正下限値と目的音存在確率との符号化処理を行わずに、信号対背景音比と係数補正下限値と目的音存在確率とを信号対背景音比情報として出力してもよい。
さらに、第二の実施例と同様に、係数補正下限値に代えて、信号対背景音比Rに関する信号対背景音比下限値を用いてもよい。すなわち、抑圧係数Gが小さくなるときに、信号対背景音比Rも同様に小さくなる。これは、適切な変換を用いて抑圧係数Gの下限値を信号対背景音比Rの下限値に換算すると、信号対背景音比Rが過剰に小さくなることを防止できることを表している。このときには、抑圧係数計算部2012は、抑圧係数と信号対背景音比下限値と目的音存在確率とを計算する。図6に示される第一の実施例の抑圧係数計算部2011における抑圧係数下限値と同様に、信号対背景音比下限値は信号対背景音比に応じて算出できる。抑圧係数計算部2012は、信号対背景音比計算部203に抑圧係数を出力し、信号対背景音比下限値と目的音存在確率とを信号対背景音比符号化部2042に出力する。信号対背景音比符号化部2042は、入力された信号対背景音比Rと信号対背景音比下限値と目的音存在確率とを符号化する。信号対背景音比符号化部2042は、符号化された信号対背景音比Rと信号対背景音比下限値と目的音存在確率とを信号対背景音比情報として出力する。
次に、信号制御部151について説明する。信号制御部151は、第一の実施例と同じく、図5で表される。本実施例と第一の実施例とは、信号処理部172の構成が異なる。
図12を参照して、信号処理部172の構成例を詳細に説明する。信号処理部172は、第二の変換信号と、分析情報として信号対背景音比情報を受信し、修正復号信号を出力する。信号処理部172は、信号対背景音比復号部2612と抑圧係数変換部2622と乗算器251とから構成される。
信号対背景音比復号部2612は、受信した信号対背景音比情報から信号対背景音比Rと係数補正下限値と目的音存在確率とを復号し、信号対背景音比Rと係数補正下限値と目的音存在確率とを抑圧係数変換部2622に出力する。信号対背景音比Rと係数補正下限値と目的音存在確率とが符号化されていないときには、信号対背景音比復号部2612は、復号処理を行わず、信号対背景音比Rと係数補正下限値と目的音存在確率とを直接出力する。
抑圧係数変換部2622は、信号対背景音比Rを抑圧係数Gに変換し、抑圧係数Gと係数補正下限値と目的音存在確率とから補正抑圧係数を算出する。そして、抑圧係数変換部2622は、補正抑圧係数を出力とする。信号対背景音比Rから抑圧係数Gへの変換は、[数4]に基づいて行う。
乗算器251は、第二の変換信号と補正抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
係数補正下限値に代えて信号対背景音比下限値を用いる場合には、信号対背景音比復号部2612は、受信した信号対背景音比情報から信号対背景音比Rと信号対背景音比下限値と目的音存在確率とを復号し、抑圧係数変換部2622に出力する。信号対背景音比Rと信号対背景音比下限値と目的音存在確率とが符号化されていないときには、信号対背景音比復号部2612は復号処理を行わず、信号対背景音比Rと信号対背景音比下限値と目的音存在確率とを直接出力する。抑圧係数変換部2622は、信号対背景音比Rと信号対背景音比下限値と目的音存在確率とから補正信号対背景音比を求める。さらに、抑圧係数変換部2622は、補正信号対背景音比をRとして[数5]を適用し、得られたGを補正抑圧係数として乗算器251へ出力する。
続いて、図14を参照して、分析情報計算部121の他の構成例を詳細に説明する。図10に示される分析情報計算部121と比較すると、本構成例の分析情報計算部121は抑圧係数計算部2012を備えていない点が異なる。また、本構成例の信号対背景音比計算部2072は、第二の変換信号と背景音推定結果とに基づいて、信号対背景音比と係数補正下限値と目的音存在確率を計算する。図14に示される分析情報計算部121の構成では、信号対背景音比Rの定義として、[数3]の代わりに[数6]が用いられる。
すなわち、本構成例は、背景音が雑音である場合には、事前SNRに代えて事後SNRを分析情報として用いる構成である。[数6]のRは、抑圧係数Gを必要とせず、入力信号と背景音とから計算される。これにより、信号対背景音比計算部2072は、第二の変換信号と背景音推定結果とに基づいて、信号対背景音比を計算することができる。なお、係数補正下限値と目的音存在確率は、図7に示される第一の実施例の抑圧係数計算部2012と同様にして算出できる。そして、信号対背景音比計算部2072は、信号対背景音比と係数補正下限値と目的音存在確率を信号対背景音比符号化部2042に出力する。信号対背景音比符号化部2042の動作は、図10に示される信号対背景音比符号化部2042の動作と同様であるので説明は省略する。信号対背景音比計算部203において、[数7]を用いて信号対背景音比Rを計算しても良い。
係数補正下限値に代えて、信号対背景音比Rに関する信号対背景音比下限値を用いてもよい。この場合、信号対背景音比計算部2072は、第二の変換信号と背景音推定結果とに基づいて、信号対背景音比と信号対背景音比下限値と目的音存在確率とを計算する。信号対背景音比計算部2072は、信号対背景音比と信号対背景音比下限値と目的音存在確率とを信号対背景音比符号化部2042に出力する。信号対背景音比符号化部2042は、入力された信号対背景音比Rと信号対背景音比下限値と目的音存在確率とを符号化する。信号対背景音比符号化部2042は、符号化された信号対背景音比Rと信号対背景音比下限値と目的音存在確率を信号対背景音比情報として出力する。
本構成例において、受信側の信号処理部172は、上述の構成例と同じく、図12で表される。信号対背景音比復号部2612は、受信した信号対背景音比情報から信号対背景音比Rと係数補正下限値と目的音存在確率を復号し、信号対背景音比Rと係数補正下限値と目的音存在確率とを抑圧係数変換部2622に出力する。抑圧係数変換部2622は、信号対背景音比Rを抑圧係数Gに変換し、抑圧係数Gと係数補正下限値と目的音存在確率とから補正抑圧係数を算出し、補正抑圧係数を出力する。信号対背景音比Rから抑圧係数Gへの変換は、[数8]に基づいて行う。
係数補正下限値に代えて、信号対背景音比Rに関する信号対背景音比下限値を用いる場合には、信号対背景音比復号部2612は、受信した信号対背景音比情報から信号対背景音比Rと信号対背景音比下限値と目的音存在確率とを復号し、信号対背景音比Rを信号対背景音比下限値と目的音存在確率で補正して、補正信号対背景音比を求める。また、信号対背景音比復号部2612は、補正信号対背景音比を抑圧係数変換部2622に出力する。抑圧係数変換部2622は、補正信号対背景音比をRとして[数8]を適用し、得られたGを抑圧係数として乗算器251へ出力する。
続いて第六の実施例について説明する。第六の実施例は、信号分析部101が背景音情報を分析情報として出力する。第三の実施例との違いは、背景音情報として背景音推定結果と係数補正下限値に加えて新たに目的音存在確率が含まれる点である。これに対応して、信号制御部151は背景音情報を用いて復号信号を制御する。これにより、目的音と背景音とから構成される入力信号において、背景音が抑圧された信号を得ることが出来る。
まず、信号分析部101について説明する。信号分析部101は、第一の実施例と同じく、図4で表される。本実施例の分析情報計算部121の構成が第一の実施例と異なる。
図16を参照して、本実施例の分析情報計算部121の構成例について詳細に説明する。分析情報計算部121は、背景音推定部2052と背景音符号化部2062とから構成さる。分析情報計算部121は、第二の変換信号を受信し、分析情報として背景音情報を出力する。背景音推定部2052は、第一の実施例の背景音推定部200と同様にして、第二の変換信号を受信し、背景音の推定を行い、背景音推定結果を生成する。また、背景音推定部2052は図7に示される第一の実施例の抑圧係数計算部2012と同様にして係数補正下限値と目的音存在確率とを算出する。背景音推定部2052は、背景音推定結果と係数補正下限値と目的音存在確率とを、背景音符号化部2062に出力する。背景音符号化部2062は、入力された背景音推定結果と係数補正下限値と目的音存在確率とを符号化し、符号化された背景音推定結果と係数補正下限値と目的音存在確率とを背景音情報として出力する。符号化処理については、抑圧係数符号化部2022と同様の符号化処理を用いることが出来る。これにより、背景音推定結果、係数補正下限値及び目的音存在確率の冗長性を除去することが出来る。また、背景音符号化部2062は、情報量を削減する必要がない場合には、背景音推定結果と係数補正下限値と目的音存在確率との符号化処理を行わずに、背景音推定結果と係数補正下限値と目的音存在確率を背景音情報として出力してもよい。
係数補正下限値に代えて、背景音上限値を用いてもよい。この場合、背景音推定部2052は、第二の変換信号に基づいて、背景音と背景音上限値と目的音存在確率とを計算する。背景音推定部2052は、背景音と背景音上限値と目的音存在確率を背景音符号化部2062に出力する。背景音符号化部2062は、入力された背景音と背景音上限値と目的音存在確率とを符号化する。背景音符号化部2062は、符号化された背景音と背景音上限値と目的音存在確率とを背景音情報として出力する。
次に、信号制御部151について説明する。信号制御部151は、第一の実施例と同じく、図5で表される。本実施例と第一の実施例とは、信号処理部172の構成が異なる。
図18を参照して、信号処理部172の構成例を詳細に説明する。信号処理部172は、第二の変換信号と、分析情報として背景音情報を受信し、修正復号信号を出力する。信号処理部172は、背景音復号部2632と抑圧係数生成部2642と乗算器251とから構成される。
背景音復号部2632は、背景音情報から背景音推定結果と係数補正下限値と目的音存在確率とを復号し、背景音推定結果と係数補正下限値と目的音存在確率とを抑圧係数生成部2642に出力する。背景音推定結果と係数補正下限値と目的音存在確率とが符号化されていないときには、背景音復号部2632は、復号処理を行わず、背景音推定結果と係数補正下限値と目的音存在確率とを出力する。
抑圧係数生成部2642は、背景音推定結果と係数補正下限値と目的音存在確率と第二の変換信号とを受信する。そして、抑圧係数生成部2642は、背景音推定結果と第二の変換信号とに基づいて背景音を抑圧するための抑圧係数を計算する。この抑圧係数の計算は、図10に示される抑圧係数計算部2012と同様の計算方法を用いてもよい。さらに、抑圧係数生成部2642は、抑圧係数と係数補正下限値と目的音存在確率とから補正抑圧係数を算出し、補正抑圧係数を出力する。補正抑圧係数の計算方法としては、前述の非特許文献6、非特許文献7、又は非特許文献8に開示されている方法などを用いてもよい。
乗算器251は、第二の変換信号と補正抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2632は分析情報として背景音情報とを受信し、背景音情報から背景音推定結果と背景音上限値と目的音存在確率とを復号する。背景音復号部2632は、背景音推定結果と背景音上限値と目的音存在確率とを抑圧係数生成部2642に出力する。背景音推定結果と背景音上限値と目的音存在確率とが符号化されていないときには、背景音復号部2632は、復号処理を行わず、背景音推定結果と背景音上限値と目的音存在確率を出力する。
抑圧係数生成部2642は、背景音推定結果と背景音上限値と目的音存在確率と第二の変換信号とを受信する。また、抑圧係数生成部2642は、背景音推定結果を背景音上限値と目的音存在確率とを用いて修正し、修正背景音推定結果を算出する。さらに、抑圧係数生成部2642は、修正背景音推定結果と第二の変換信号とに基づいて背景音を抑圧するための抑圧係数を計算し、乗算器251に出力する。乗算器251は、第二の変換信号と抑圧係数とを乗算し、修正復号信号を生成する。乗算器251は、修正復号信号を出力する。
さらに、図19を参照して信号処理部172の他の構成例を詳細に説明する。信号処理部172は、第二の変換信号と背景音情報とを受信し、背景音が減算された信号を修正復号信号として出力する。本構成例の信号処理部172は、背景音復号部2652と減算器253とで構成されている。第二の変換信号が減算器253と背景音復号部2652とに入力され、分析情報として背景音情報が背景音復号部2652に入力される。背景音復号部2652は、背景音情報から背景音推定結果と係数補正下限値と目的音存在確率とを復号し、第二の変換信号と係数補正下限値と目的音存在確率とから信号下限値を算出し、背景音推定結果と信号下限値とから背景音を算出し、背景音を減算器253に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と係数補正下限値と目的音存在確率とから背景音を算出する。減算器253は、第二の変換信号から背景音を減算する。そして、減算器253は、背景音が抑圧された信号を修正復号信号として出力する。なお、信号下限値は修正復号信号の下限値を表す。そして、背景音復号部2652は、後段の減算器253の出力である修正復号信号が信号下限値を下回らないように背景音を算出する。背景音が雑音である場合、この減算はスペクトル減算として知られている。スペクトル減算に関連する技術が、非特許文献9に開示されている。信号下限値に関連する技術も非特許文献9に開示されている。
また、減算器253には、減算に加えて、付加機能を含めることもできる。例えば、減算気253に、減算結果が負になるときにこれをゼロあるいは微小な正の値に補正する機能、減算結果の最小値を正の値に設定するリミッタ機能、又は背景音情報に対して係数を乗算したり定数を加算したりすることで修正してから減算する機能などを付加してもよい。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2652は、分析情報として背景音情報を受信し、背景音情報から背景音推定結果と背景音上限値と目的音存在確率を復号する。背景音復号部2652は、背景音推定結果と背景音上限値と目的音存在確率を用いて第一の修正背景音推定結果を算出する。また、背景音復号部2652は、第二の変換信号と第一の修正背景音推定結果から背景音を算出し、減算器253に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と背景音上限値と目的音存在確率から背景音を算出する。減算器253は、第二の変換信号から背景音を減算する。そして、減算器253は、背景音が抑圧された信号を修正復号信号として出力する。
背景音は、例えば第二の変換信号と第一の修正背景音推定結果から求めた信号対背景音比とに対応した修正量で、第一の修正背景音推定結果を修正して求めることができる。このような修正としては、修正量の加算や修正係数の乗算を用いてもよく、加算量(減算量)や修正係数の大小が、信号対背景音比に対応して制御される。特に、信号対背景音比が小さいときに第一の修正背景音推定結果が小さくなるように修正して背景音を算出することは、出力される修正復号信号の歪を低減する効果がある。
本実施例において、背景音復号部2652において信号下限値を算出する代わりに、信号分析部101内の分析情報計算部121において信号下限値を算出して、背景音情報を背景音推定結果と信号下限値と目的音存在確率としても良い。本実施例の分析情報計算部121の構成例を、図16を参照して説明する。分析情報計算部121は、背景音推定部2052と背景音符号化部2062とから構成される。分析情報計算部121は、第二の変換信号を受信し、分析情報として背景音情報を出力する。背景音推定部2052は、第一の実施例の背景音推定部200と同様にして、第二の変換信号を受信し、背景音の推定を行い、背景音推定結果を生成する。また、背景音推定部2052は第二の変換信号と背景音推定結果から信号下限値を算出する。背景音推定部2052は、背景音推定結果と信号下限値と目的音存在確率とを、背景音符号化部2062に出力する。背景音符号化部2062は、入力された背景音推定結果と信号下限値と目的音存在確率とを符号化し、符号化された背景音推定結果と信号下限値と目的音存在確率とを背景音情報として出力する。符号化処理については、抑圧係数符号化部2022と同様の符号化処理を用いることが出来る。これにより、背景音推定結果、信号下限値及び目的音存在確率の冗長性を除去することが出来る。また、背景音符号化部2062は、情報量を削減する必要がない場合には、背景音推定結果と信号下限値と目的音存在確率の符号化処理を行わずに、背景音推定結果と信号下限値と目的音存在確率とを背景音情報として出力してもよい。
信号制御部151内の信号処理部172の構成例を図20を参照し説明する。信号処理部172は、第二の変換信号と背景音情報とを受信し、背景音が抑圧された信号を修正復号信号として出力する。本構成例の信号処理部172は、背景音復号部2651と減算器253とで構成されている。第二の変換信号が減算器253に入力され、分析情報として背景音情報が背景音復号部2651に入力される。背景音復号部2651は、背景音情報から背景音推定結果と信号下限値と目的音存在確率とを復号し、背景音推定結果と信号下限値と目的音存在確率とから背景音を算出し、背景音を減算器253に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と信号下限値と目的音存在確率とから背景音を算出する。減算器253は、第二の変換信号から背景音を減算する。そして、減算器253は、背景音が抑圧された信号を修正復号信号として出力する。
さらに、本実施の形態において、送信部10は、入力信号が複数チャンネルで構成される場合、上記の第一乃至第六の実施例の分析情報をチャンネル毎に独立に算出してもよい。また、送信部10は、入力信号の全チャンネルの和を算出し、和信号から全チャンネルで共通の分析情報を算出してもよい。あるいは、送信部10は、入力信号を複数のグループに分割して、各グループの入力信号の和を算出し、その和信号からグループで共通の分析情報を算出してもよい。これに対応して、受信部15は、各チャンネルに対応する分析情報を用いて復号信号を制御する。
また、上記の第一の実施例乃至第六の実施例で説明した分析情報は、複数の周波数帯域で共通の分析情報として算出されてもよい。たとえば、送信部10は、等間隔に周波数帯域を分割し、分割した周波数帯域毎に分析情報を算出してもよい。さらに、送信部10は、人間の聴覚特性にあわせ、低周波数帯域は細かく分割し、高周波数帯域は荒く分割し、分割した単位で分析情報を算出してもよい。これにより、分析情報の情報量を削減することができる。
以上説明したように、本発明の第二の実施の形態によれば、送信部で信号の分析を行うので、目的音と背景音とから構成される入力信号を制御することができる。さらに、送信部で抑圧係数又は信号対背景音比といった分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することが出来る。
続いて、図21を参照して、本発明の第三の実施の形態について詳細に説明する。本発明の第三の実施の形態において、受信部35は信号制御情報を受信できる構成を有し、特定の音源だけを独立に制御することができる。図21に示される第三の実施の形態と図1に示される第一の実施の形態とを比較すると、受信部15に含まれる信号制御部151が受信部35に含まれる信号制御部350で構成されている。また、本実施例において、送信部、伝送路、受信部をそれぞれ、録音部、蓄積媒体、再生部としてもよい。以降、図1と重複する部分の説明は省略する。
図22を参照して、信号制御部350の構成例について詳細に説明する。信号制御部350は、変換部171、信号処理部360及び逆変換部173から構成される。第一の実施の形態と比較すると、信号制御部151に含まれる信号処理部172が、本実施の形態では信号処理部360で構成されている。信号制御部350は、分析情報と信号制御情報とを受信し、出力信号を出力する。信号制御部350は、信号制御情報と分析情報とに基づいて、復号部150から受けた復号信号を、各音源に対応した構成要素ごとに操作する。また、信号制御部350は、各音源に対応した構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作することも可能である。信号処理部360は、変換部171からの第二の変換信号と信号制御情報とを受信する。信号処理部360は、分析情報と信号制御情報とに基づいて、第二の変換信号の周波数成分の構成要素を制御し、修正復号信号を生成する。信号処理部360は、修正復号信号を逆変換部173に出力する。
さらに、具体的には、信号処理部360は、分析情報に基づいて、周波数毎の分析パラメータを導出する。そして、信号処理部360は、第二の変換信号を、分析パラメータに基づいて、音源に対応した構成要素に分解する。さらに、信号処理部360は、信号制御情報に基づく周波数毎のパラメータに応じて、複数の構成要素間の関係を変更した修正復号信号を作成する。信号処理部360は、修正復号信号を逆変換部173に出力する。また、信号処理部360は、分析パラメータに基づいて、複数の構成要素から構成される構成要素群に分解してもよい。
続いて、修正復号信号の作成方法について、具体的に説明する。
ある周波数帯域fにおける復号信号の周波数成分(つまり、第二の変換信号)をXk(f), k=1,2,…,P(Pは復号信号のチャンネル数)、構成要素の周波数成分をYj(f), j=1,2,・・・,M(Mは構成要素数)、信号制御情報に基づいて修正した構成要素の周波数成分をY’j(f)、修正復号信号をX’k(f)とすると、分析パラメータにより規定される変換関数F501と、信号制御情報により規定される変換関数F502を用いて次の関係が成立する。
[数9]
Yj(f)=F501(X1(f), X2(f),…, XP(f))
[数10]
Y’j(f)=F502(Yj(f))
[数11]
X’ k(f)=F503(Y’j(f))
ここで、変換関数F503は修正構成要素を修正復号信号に変換する関数である。
また、関数F500、F501、F502、F503を統合して
[数12]
X’(f)=F504(X(f))
とすることもできる。このとき、変換関数F504は分析パラメータと信号制御情報により規定される。
上記変換関数の具体例として、周波数帯域fの分析パラメータB(f)を、
[数13]
Figure 2009087923
と表し、信号制御情報に応じて定まる周波数毎のパラメータA(f)を
[数14]
Figure 2009087923
と表すと、[数9]から[数12]は
[数15]
Figure 2009087923
と表せる。すなわち、復号信号を修正復号信号に変換する行列はD(f)×A(f)×B(f)として計算できる。ここで、D(f)は任意のP行M列の行列であり、例えば、D(f)としてB(f)の逆行列を用いることができる。なお、[数15]から明らかなように、D(f)としてB(f)の逆行列を用いることは修正構成要素を修正復号信号に変換する操作として妥当である。
信号制御情報は、利用者によって外部から入力されることとしてもよい。例えば、外部から入力される信号制御情報としては、受信部に予め登録されていた利用者の嗜好などの個人情報、受信部の動作状態(スピーカをオフにしてあるなどの外部環境情報を含む)、受信部の種類や形式、電源や電池の利用状態や残量、アンテナの種類や状態(折りたたまれているなどの形状、向きなど)がある。また、信号制御情報は、別の形式で自動的に獲得されることとしてもよい。信号制御情報は、受信部内部または近傍に設置されたセンサを経由して、自動的に獲得されることとしてもよい。例えば、自動的に獲得される信号制御情報としては、外部雑音量、明るさ、時間帯、地理的な位置、気温、映像との同期情報、カメラを通じたバーコード情報などがある。
本発明の第三の実施の形態によれば、受信部で受けた信号制御情報に基づいて、特定の音源だけを独立に制御することができる。また、送信部で信号の分析を行い、受信部にて複数音源から構成される入力信号を各音源に対応した構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部の信号分析に係る演算量を削減することが出来る。
本発明の第四の実施の形態は、受信部に入力される信号制御情報を用いて、目的音と背景音とから構成される入力信号を目的音と背景音とを独立に制御する。図21を参照して、本実施の形態を詳細に説明する。本実施の形態と第二の実施の形態とを比較すると、図1に示される受信部15に含まれる信号制御部151が図21に示される受信部35に含まれる信号制御部350で構成されている。また、本実施の形態においては、信号制御情報が信号制御部350に入力されている。信号制御情報については、第三の実施の形態において用いたものと同様であり、説明は省略する。さらに、図22を参照して、信号制御部350の構成を説明する。信号制御部350は、変換部171、信号処理部360及び逆変換部173から構成される。第二の実施の形態と比較すると、図5に示される信号制御部151に含まれる信号処理部172が、本実施の形態では信号処理部360で構成されている。信号処理部360は外部から信号制御情報を受信している。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
続いて、第一の実施例について説明する。第一の実施例は、分析情報として抑圧係数情報を用いるものである。
図23を参照して、信号処理部360の構成例について詳細に説明する。信号処理部360は、第二の変換信号、分析情報である抑圧係数情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、抑圧係数復号部260と抑圧係数修正部460と乗算器451とから構成される。
抑圧係数復号部260は、受信した抑圧係数情報から抑圧係数と係数補正下限値とを復号し、抑圧係数と係数補正下限値とから補正抑圧係数を算出する。抑圧係数と係数補正下限値とが符号化されていないときには、抑圧係数復号部260は、復号処理を行わず、抑圧係数と係数補正下限値とから補正抑圧係数を算出する。補正抑圧係数の算出方法は図8を用いて第二の実施の形態の第一の実施例で説明した通りである。抑圧係数復号部260は、補正抑圧係数を抑圧係数修正部460に出力する。抑圧係数修正部460は、外部から入力された信号制御情報を用いて、入力された補正抑圧係数を修正することにより修正抑圧係数を算出し、出力する。乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成する。乗算器451は、修正復号信号を出力する。
図24を参照して、抑圧係数修正部460の第一の構成例を詳細に説明する。抑圧係数修正部460は、補正抑圧係数と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、乗算器470から構成される。乗算器470は、補正抑圧係数と信号制御情報との積を計算し、修正抑圧係数を出力する。本構成例では、信号制御情報は、補正抑圧係数に対する倍率として入力される。このような構成により、簡易な信号制御情報により補正抑圧係数を制御することができる。
図25を参照して、抑圧係数修正部460の第二の構成例を詳細に説明する。抑圧係数修正部460は、補正抑圧係数と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、比較部471から構成される。比較部471は、補正抑圧係数と信号制御情報を比較して、その比較結果に応じた信号を出力する。例えば、比較部471は、最大比較を行う場合は、補正抑圧係数と信号制御情報との大きい方の値を出力する。また、比較部471は、最小比較を行い、補正抑圧係数と信号制御情報との小さい方の値を出力してもよい。これらの場合には、信号制御情報には、補正抑圧係数の最大値または最小値が入力される。このような構成により、出力信号の範囲を予め規定することができ、想定外の信号が出力されて音質を損ねることを回避できる。
図26を参照して、抑圧係数修正部460の第三の構成例を詳細に説明する。抑圧係数修正部460の第三の構成例は、上述の第一の構成例と第二の構成例とを組み合わせたものである。抑圧係数修正部460は、補正抑圧係数と信号制御情報とを受信し、修正抑圧係数を出力する。本構成例の抑圧係数修正部460は、乗算器470、比較部471、指定抑圧係数制御部472及びスイッチ473から構成される。指定抑圧係数制御部472は、信号制御情報を乗算器470、比較部471、又はスイッチ473に出力する。ここで、信号制御情報には、乗算器470で使用する補正抑圧係数の倍率と、比較部471で使用する抑圧係数の最大値または最小値とを少なくとも含む。さらに、信号制御情報には、スイッチ473における選択のための制御情報が含まれても良い。指定抑圧係数制御部472は、信号制御情報として補正抑圧係数の倍率を受信した場合は、補正抑圧係数の倍率を乗算器470に出力する。乗算器470は、補正抑圧係数と補正抑圧係数の倍率との積を計算し、修正抑圧係数をスイッチ473に出力する。指定抑圧係数制御部472は、信号制御情報として抑圧係数の最大値または最小値を受信した場合は、抑圧係数の最大値または最小値を比較部471に出力する。比較部471は、補正抑圧係数と抑圧係数の最大値または最小値とを比較して、その比較結果に応じた信号を修正抑圧係数としてスイッチ473に出力する。指定抑圧係数制御部472は、選択のための制御情報を受信して、制御情報をスイッチ473に出力する。スイッチ473は、指定抑圧係数制御部472から入力された信号制御情報に応じて、乗算器470の出力または比較部471の出力のいずれかを選択して出力する。
第三の構成例では、補正抑圧係数に倍率を作用させて修正抑圧係数を求める機能と、補正抑圧係数に抑圧係数の最大値と最小値を作用させて修正抑圧係数を求める機能とを、信号制御情報で適宜選択して実現してもよい。この構成により、前記第一の構成例と前記第二の構成例の効果を併せて実現することができる。
第一の実施例の信号処理部360の他の構成を説明する。上述の構成では信号制御情報により抑圧係数を修正していたが、本構成は信号制御情報により係数補正下限値を修正する点が異なる。信号処理部360は、抑圧係数情報と信号制御情報とを受信し、修正抑圧係数を出力する。信号処理部360は、受信した抑圧係数情報から抑圧係数と係数補正下限値とを復号し、外部から入力された信号制御情報を用いて係数補正下限値を修正する。信号処理部360は、抑圧係数と修正された係数補正下限値とから修正抑圧係数を算出する。修正抑圧係数の算出方法は図8を用いて第二の実施の形態の第一の実施例で説明した通りである。
以下、係数補正下限値の修正方法を説明する。小さな抑圧係数は背景音を強力に抑圧するが、同時に目的音の一部も抑圧する。つまり、一般に、残留背景音と出力信号歪との大きさはトレードオフの関係にあり、小さな残留背景音と小さな出力信号歪とを同時に満たすことはできない。このため、過小な抑圧係数を用いると出力される目的音に含まれる歪が増加する。そこで、係数補正下限値で抑圧係数の最小値を保証し、出力信号における歪の最大値を一定の範囲に収める必要がある。そこで、過剰な抑圧による出力信号歪の増加を避けるためにある程度の残留背景音を許容する、若しくは、十分小さな残留背景音のために過剰な抑圧による出力信号歪を許容するかのどちらかを受け入れる必要がある。係数補正下限値はこのトレードオフを制御するために用いられている。従って、係数補正下限値を信号制御情報により修正することにより、残留背景音と出力信号歪の大きさとのトレードオフを制御することができる。このような構成により、信号制御情報により抑圧係数を容易に制御することができる。
本構成例において、例えば、信号制御情報として許容される残留背景音の大きさが入力されてもよい。この場合、許容される残留背景音の大きさから係数補正下限値の倍率を生成し、係数補正下限値の倍率を係数補正下限値に乗算することにより係数補正下限値を修正しても良い。この場合の信号制御情報に対する係数補正下限値の倍率の関係の一例を図67に示す。図67は、信号制御情報が大きい場合に係数補正下限値の倍率が大きくなる、右肩上がりの特性を有している。係数補正下限値の倍率が大きい場合は、係数補正下限値は増幅されて利用される。このために、より大きな係数補正下限値を用いたことと等価になる。
すなわち、より大きな残留雑音を許容し、出力信号歪を小さくする。反対に、係数補正下限値の倍率が大きい場合には、係数補正下限値の効果は弱められる。これは、より強力な抑圧が実行されることを意味する。図67において、信号制御情報が1の場合は、残留背景音を許容することを表し、出力信号歪は最小になる。一方、信号制御情報が0の場合は、出力信号歪を許容することを表し、残留背景音は最小になる。
次に、第二の実施例について説明する。第二の実施例は、目的音と背景音との構成比である信号対背景音比情報を分析情報として用いるものである。
図27を参照して、第二の実施例の信号処理部360の構成例を詳細に説明する。信号処理部360は、第二の変換信号、分析情報である信号対背景音比情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、信号対背景音比復号部2611と信号対背景音比修正部461と抑圧係数変換部2621と乗算器451とから構成される。
信号対背景音比復号部2611は、受信した信号対背景音比情報から信号対背景音比と係数補正下限値を復号し、信号対背景音比を信号対背景音比修正部461に出力し、係数補正下限値を抑圧係数変換部2621に出力する。信号対背景音比と係数補正下限値が符号化されていないときには、信号対背景音比復号部2611は、復号処理を行わず、信号対背景音比と係数補正下限値を出力する。
信号対背景音比修正部461は、外部から受けた信号制御情報を用いて、入力された信号対背景音比を修正し、修正信号対背景音比を生成する。信号対背景音比の修正については、第一の実施例における抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として信号対背景音比の倍率を入力することにより信号対背景音比を修正してもよい。また、信号制御情報として信号対背景音比の最大値または最小値を入力することにより信号対背景音比を修正しても良い。さらに、信号制御情報として信号対背景音比の倍率により修正された信号対背景音比と信号対背景音比の最大値または最小値により修正された信号対背景音比とを選択する制御情報を入力することにより修正してもよい。信号対背景音比修正部461は、修正信号対背景音比を抑圧係数変換部2621に出力する。
抑圧係数変換部2621は、修正信号対背景音比を抑圧係数に変換し、抑圧係数と係数補正下限値から修正抑圧係数を算出する。抑圧係数変換部2621は、修正抑圧係数を出力する。信号対背景音比を抑圧係数に変換する方法は、図11に示される抑圧係数変換部2621と同様の変換方法を用いても良い。抑圧係数と係数補正下限値から修正抑圧係数を算出する方法は図8を用いて第二の実施の形態の第一の実施例で説明した通りである。第二の実施例では、信号制御情報によって信号対背景音比を修正した後、修正信号対背景音比を抑圧係数に変換する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成し、修正復号信号を出力する。
第二の実施例の信号処理部360の第二の構成例を説明する。上述の構成とは異なり、信号制御情報により係数補正下限値を修正する点を特徴とする。信号処理部360は、信号対背景音比情報と信号制御情報とを受信し、修正抑圧係数を出力する。信号処理部360は、信号対背景音比復号部2611と同様にして、受信した信号対背景音比情報から信号対背景音比と係数補正下限値とを復号する。また、信号処理部360は、本実施の形態の第一の実施例において図67を用いて説明したように、信号制御情報を用いて係数補正下限値を修正する。さらに、信号処理部360は、抑圧係数変換部2621と同様にして、復号された信号対背景音比と修正された係数補正下限値とから修正抑圧係数を算出する。
係数補正下限値に代えて、信号対背景音比下限値を用いる場合には、信号対背景音比復号部2611は、受信した信号対背景音比情報から信号対背景音比と信号対背景音比下限値とを復号し、信号対背景音比を信号対背景音比修正部461に出力し、信号対背景音比下限値を抑圧係数変換部2621に出力する。信号対背景音比と信号対背景音比下限値とが符号化されていないときには、信号対背景音比復号部2611は、復号処理を行わず、信号対背景音比と信号対背景音比下限値とを直接出力する。
信号対背景音比修正部461は、外部から受けた信号制御情報を用いて、入力された信号対背景音比を修正し、修正信号対背景音比を生成する。信号対背景音比修正部461は、修正信号対背景音比を抑圧係数変換部2621に出力する。
抑圧係数変換部2621は、修正信号対背景音比と信号対背景音比下限値とから補正信号対背景音比を求める。さらに、補正信号対背景音比をRとして[数5]を適用し、得られたGを修正抑圧係数として乗算器251へ出力する。
第二の実施例の信号処理部360の第三の構成例を説明する。上述の第二の構成例と比較すると、第三の構成例は信号対背景音比を抑圧係数に変換してから、信号制御情報によって抑圧係数を修正する点を特徴とする。
図29を参照して、第二の実施例の信号処理部360の第三の構成例を詳細に説明する。信号処理部360は、第二の変換信号、分析情報である信号対背景音比情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、信号対背景音比復号部2611と抑圧係数変換部2621と抑圧係数修正部460と乗算器451とから構成される。
信号対背景音比復号部2611は、受信した信号対背景音比情報から信号対背景音比と係数補正下限値を復号する。信号対背景音比復号部2611は、信号対背景音比と係数補正下限値を抑圧係数変換部2621に出力する。
抑圧係数変換部2621は、復号された信号対背景音比と係数補正下限値を補正抑圧係数に変換する。抑圧係数変換部2621は、補正抑圧係数を抑圧係数修正部460に出力する。
抑圧係数修正部460は、外部から受けた信号制御情報を用いて、背景音情報変換部2621から入力された補正抑圧係数を修正する。抑圧係数修正部460は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。抑圧係数修正部460の構成は、図23に示される第一の実施例の抑圧係数修正部460と同様のものであり、説明は省略する。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成し、修正復号信号を出力する。
係数補正下限値に代えて、信号対背景音比下限値を用いる場合には、信号対背景音比復号部2611は、受信した信号対背景音比情報から信号対背景音比と信号対背景音比下限値とを復号し、信号対背景音比と信号対背景音比下限値とを抑圧係数変換部2621に出力する。信号対背景音比と信号対背景音比下限値とが符号化されていないときには、信号対背景音比復号部2611は、復号処理を行わず、信号対背景音比と信号対背景音比下限値とを直接出力する。
抑圧係数変換部2621は、信号対背景音比と信号対背景音比下限値とから補正信号対背景音比を求める。さらに、補正信号対背景音比をRとして[数5]を適用し、得られたGを抑圧係数として抑圧係数修正部460に出力する。抑圧係数修正部460は、外部から受けた信号制御情報を用いて入力された抑圧係数を修正し、修正抑圧係数を生成する。抑圧係数修正部460は、修正抑圧係数を乗算器451に出力する。
続いて、第三の実施例について説明する。第三の実施例は、分析情報として背景音情報を用いる場合の構成例である。
図31を参照して、第三の実施例の信号処理部360の第一の構成例を詳細に説明する。信号処理部360は、第二の変換信号、背景音情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、背景音復号部2631と背景音修正部464と抑圧係数生成部2641と乗算器451とから構成される。
背景音復号部2631は、受信した背景音情報から背景音推定結果と係数補正下限値を復号し、背景音推定結果を背景音修正部464に出力し、係数補正下限値を抑圧係数生成部2641に出力する。背景音推定結果と係数補正下限値が符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音推定結果と係数補正下限値を出力する。
背景音修正部464は、背景音推定結果を用いて背景音を算出し、外部から入力された信号制御情報により修正する。背景音の修正については、第一の実施例における抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として背景音の倍率を入力することにより背景音を修正してもよい。また、信号制御情報として背景音の最大値または最小値を入力することにより背景音を修正しても良い。さらに、信号制御情報として背景音の倍率により修正された背景音と背景音の最大値または最小値により修正された背景音とを選択する制御情報を入力することにより修正してもよい。背景音修正部464は、修正された背景音を抑圧係数生成部2641 に出力する。
抑圧係数生成部2641は、第二の変換信号と修正された背景音と係数補正下限値を用いて背景音を抑圧するための修正抑圧係数を計算する。この抑圧係数の計算は、図9に示される抑圧係数計算部2011と同様の計算方法を用いてもよい。抑圧係数生成部2641は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成する。乗算器451は、修正復号信号を出力する。
図32を参照して、第三の実施例の信号処理部360の第二の構成を説明する。第一の構成とは異なり、信号制御情報により係数補正下限値を修正する点を特徴とする。信号処理部360は、背景音情報と信号制御情報とを受信し、修正抑圧係数を出力する。信号処理部360は、背景音復号部2631と同様にして、受信した背景音情報から背景音推定結果と係数補正下限値とを復号する。また、信号処理部360は、本実施の形態の第一の実施例において図67を用いて説明したように、信号制御情報を用いて係数補正下限値を修正する。さらに、信号処理部360は、抑圧係数生成部2641と同様にして、第二の変換信号と背景音推定結果と修正された係数補正下限値とから修正抑圧係数を算出する。信号処理部360は、背景音復号部2631と下限値修正部466と抑圧係数生成部2641と乗算器451とから構成される。
背景音復号部2631は、受信した背景音情報から背景音推定結果と係数補正下限値とを復号し、背景音推定結果を抑圧係数生成部2641に出力し、係数補正下限値を下限値修正部466に出力する。背景音推定結果と係数補正下限値が符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音推定結果と係数補正下限値とを抑圧係数生成部2641と下限値修正部466とに出力する。
下限値修正部466は、外部から入力された信号制御情報により、係数補正下限値を修正する。係数補正下限値の修正については、第一の実施例における抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として係数補正下限値の倍率を入力することにより係数補正下限値を修正してもよい。また、信号制御情報として係数補正下限値の最大値または最小値を入力することにより係数補正下限値を修正しても良い。さらに、信号制御情報として係数補正下限値の倍率により修正された係数補正下限値と係数補正下限値の最大値または最小値により修正された係数補正下限値とを選択する制御情報を入力することにより修正してもよい。下限値修正部466は、修正された係数補正下限値を抑圧係数生成部2641に出力する。
抑圧係数生成部2641は、第二の変換信号と背景音推定結果と修正された係数補正下限値を用いて背景音を抑圧するための修正抑圧係数を計算する。この抑圧係数の計算は、図9に示される抑圧係数計算部2011と同様の計算方法を用いてもよい。抑圧係数生成部2641は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成する。乗算器451は、修正復号信号を出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2631は、受信した背景音情報から背景音と背景音上限値とを復号し、背景音を抑圧係数生成部2641に出力し、背景音上限値を下限値修正部466に出力する。背景音と背景音上限値とが符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音と背景音上限値とを直接、抑圧係数生成部2641と下限値修正部466とに出力する。
下限値修正部466は、外部から受けた信号制御情報を用いて、入力された背景音上限値を修正し、修正背景音上限値を生成する。下限値修正部466は、修正背景音上限値を抑圧係数生成部2641に出力する。
抑圧係数生成部2641は、第二の変換信号と修正背景音上限値と背景音とを用いて、背景音を抑圧するための修正抑圧係数を計算する。抑圧係数生成部2641は、修正抑圧係数を乗算器451へ出力する。
図34を参照して、信号処理部360の第三の構成を詳細に説明する。第三の構成は、背景音を第二の変換信号から減算することによって修正復号信号を算出する点が、第一の構成と異なる。本構成例の信号処理部360は、背景音復号部2652、背景音修正部464及び減算器453で構成される。信号処理部360は、第二の変換信号、背景音情報及び信号制御情報を受信し、背景音が制御された修正復号信号を出力する。
第二の変換信号は、減算器453と背景音復号部2652とに入力される。また、背景音情報が分析情報として背景音復号部2652に入力される。背景音復号部2652は、背景音情報から背景音推定結果と係数補正下限値とを復号し、第二の変換信号と係数補正下限値とから信号下限値を算出し、背景音推定結果と信号下限値とから背景音を算出し、背景音を背景音修正部464に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と信号下限値とから背景音を算出する。背景音修正部464は、信号制御情報を用いて背景音を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器453に出力する。減算器453は、第二の変換信号から修正背景音を減算し、背景音が抑圧された信号を修正復号信号として減算結果を出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2652は、分析情報として背景音情報を受信し、背景音情報から背景音推定結果と背景音上限値とを復号する。背景音復号部2652は、背景音推定結果と背景音上限値とを用いて第一の修正背景音推定結果を算出する。また、背景音復号部2652は、第二の変換信号と第一の修正背景音推定結果とから背景音を算出し、背景音を背景音修正部464に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と背景音上限値とから背景音を算出する。。背景音修正部464は、信号制御情報を用いて背景音を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器453に出力する。減算器453は、第二の変換信号から修正背景音を減算し、背景音が抑圧された信号を修正復号信号として出力する。
図35を参照して、信号処理部360の第四の構成例を詳細に説明する。第四の構成例は、背景音復号部2652において信号下限値を算出する代わりに、第二の実施の形態の第三の実施例で説明したように、信号分析部101内の分析情報計算部121において信号下限値を算出して、背景音情報を背景音推定結果と信号下限値とする点が、第三の構成と異なる。
信号処理部360は、第二の変換信号と背景音情報とを受信し、背景音が抑圧された信号を修正復号信号として出力する。本構成例の信号処理部360 は、背景音復号部2651と背景音修正部464と減算器453とで構成されている。第二の変換信号が減算器453に入力され、分析情報として背景音情報が背景音復号部2651に入力される。背景音復号部2651は、背景音情報から背景音推定結果と信号下限値とを復号し、背景音推定結果と信号下限値とから背景音を算出し、背景音を背景音修正部464に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と信号下限値とから背景音を算出する。背景音修正部464は、信号制御情報を用いて背景音を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器453に出力する。減算器453は、第二の変換信号から修正背景音を減算し、背景音が抑圧された信号を修正復号信号として出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2652は、分析情報として背景音情報を受信し、背景音情報から背景音推定結果と背景音上限値とを復号する。背景音復号部2652は、背景音推定結果と背景音上限値とを用いて第一の修正背景音推定結果を算出する。また、背景音復号部2652は、第二の変換信号と第一の修正背景音推定結果とから背景音を算出し、背景音を背景音修正部464に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と背景音上限値とから背景音を算出する。背景音修正部464は、信号制御情報を用いて背景音を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器453に出力する。減算器453は、第二の変換信号から修正背景音を減算し、背景音が除去された信号を修正復号信号として出力する。
図36を参照して、信号処理部360の第五の構成例を詳細に説明する。本構成は、復号された背景音から抑圧係数を生成した後、信号制御情報によって抑圧係数を修正する点が、第一の構成と異なる。本構成例の信号処理部360は、第二の変換信号、背景音情報及び信号制御情報を受信し、背景音が制御された修正復号信号を出力する。信号処理部360は、背景音復号部2631、抑圧係数生成部2641、抑圧係数修正部460と乗算器451から構成される。
背景音復号部2631は、背景音情報から背景音推定結果と係数補正下限値とを復号し、背景音推定結果と係数補正下限値とを抑圧係数生成部2641に出力する。
抑圧係数生成部2641は、第二の変換信号と背景音推定結果と係数補正下限値とから補正抑圧係数を生成する。この計算は、図9に示される抑圧係数計算部2011と同様の計算方法を用いてもよい。そして、抑圧係数生成部2641は、補正抑圧係数を抑圧係数修正部460に出力する。
抑圧係数修正部460は、受信した信号制御情報を用いて、補正抑圧係数を修正し、修正抑圧係数を生成する。抑圧係数の修正については、図26で示される抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として補正抑圧係数の倍率を入力することにより修正してもよい。また、信号制御情報として抑圧係数の最大値または最小値を入力することにより修正しても良い。さらに、信号制御情報として補正抑圧係数の倍率と抑圧係数の最大値または最小値とを選択する制御情報を入力することにより修正してもよい。抑圧係数修正部460は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成し、修正復号信号を出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2631は、受信した背景音情報から背景音と背景音上限値とを復号し、背景音と背景音上限値を抑圧係数生成部2641に出力する。背景音と背景音上限値とが符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音と背景音上限値を直接出力する。
抑圧係数生成部2641は、第二の変換信号と背景音と背景音上限値とを用いて、背景音を抑圧するための抑圧係数を計算する。抑圧係数生成部2641は、抑圧係数修正部460へ出力する。
抑圧係数修正部460は、外部から受けた信号制御情報を用いて入力された抑圧係数を修正し、修正抑圧係数を生成する。抑圧係数修正部460は、修正抑圧係数を乗算器451に出力する。
続いて、第四の実施例について説明する。第四の実施例は、分析情報として抑圧係数情報を用いるものである。第一の実施例との違いは、抑圧係数情報として抑圧係数と係数補正下限値に加えて新たに目的音存在確率が含まれる点である。
図23を参照して、信号処理部360の構成例について詳細に説明する。信号処理部360は、第二の変換信号、分析情報である抑圧係数情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、抑圧係数復号部260と抑圧係数修正部460と乗算器451とから構成される。
抑圧係数復号部260は、受信した抑圧係数情報から抑圧係数と係数補正下限値と目的音存在確率とを復号し、抑圧係数と係数補正下限値と目的音存在確率とから補正抑圧係数を算出する。抑圧係数と係数補正下限値とが符号化されていないときには、抑圧係数復号部260は復号処理を行わず、抑圧係数と係数補正下限値と目的音存在確率とから補正抑圧係数を算出する。補正抑圧係数の算出方法は図8を用いて第二の実施の形態の第四の実施例で説明した通りである。抑圧係数復号部260は、補正抑圧係数を抑圧係数修正部460に出力する。抑圧係数修正部460は、外部から入力された信号制御情報を用いて、入力された補正抑圧係数を修正することにより修正抑圧係数を算出し、出力する。補正抑圧係数の修正については、第一の実施例において説明した通りである。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成する。乗算器451は、修正復号信号を出力する。
第四の実施例の信号処理部360の第二の構成例を説明する。第一の構成では信号制御情報により抑圧係数を修正していたが、本構成は信号制御情報と目的音存在確率とにより係数補正下限値を修正する点が異なる。信号処理部360は、抑圧係数情報と信号制御情報とを受信し、修正復号信号を出力する。信号処理部360は、受信した抑圧係数情報から抑圧係数と係数補正下限値とを復号し、外部から入力された信号制御情報と目的音存在確率とを用いて係数補正下限値を修正し、抑圧係数と修正された係数補正下限値とから修正抑圧係数を算出する。修正抑圧係数の算出方法は図8を用いて第二の実施の形態の第四の実施例で説明した通りである。
また、第一の実施例で説明したように、係数補正下限値を信号制御情報により修正することにより、残留背景音と出力信号歪の大きさとのトレードオフを制御することができる。さらに、このトレードオフは信号の特性、すなわち信号の主成分が音声であるか背景音であるかによって異なるため、目的音存在確率を用いることにより信号特性に適した制御が可能となる。より具体的には、目的音存在確率に基づいて、音声区間では低歪を優先した抑圧を、非音声区間では低残留背景音を優先した抑圧を行うことにより、背景音区間における小さな残留背景音と音声区間とにおける小さな出力信号歪を両立することができる。
本構成例では、例えば、信号制御情報として許容される残留背景音の大きさが入力さてもよい。この場合、許容される残留背景音の大きさから係数補正下限値の倍率を生成し、目的音存在確率に応じて係数補正下限値の倍率の生成方法を切り替える。そして、生成された係数補正下限値の倍率を係数補正下限値に乗算することにより係数補正下限値を修正しても良い。この場合の信号制御情報に対する係数補正下限値の倍率の関係の一例を図68に示す。図68を図67と比較すると、図68は、目的音存在確率に対応して複数の特性が存在する点が異なる。目的音存在確率を固定すると、図68は図67と同等になる。すなわち、図68の特性は、図67の特性を目的音存在確率に応じて変化させたものである。図68も図67と同様に、信号制御情報が1の場合は、残留背景音を許容することを表し、出力信号歪を最小が最小になる。一方、信号制御情報が0の場合は、出力信号歪を許容することを表し、残留背景音を最小になる。
次に、第五の実施例について説明する。第五の実施例は、目的音と背景音との構成比である信号対背景音比情報を分析情報として用いるものである。第二の実施例との違いは、信号対背景音比情報として信号対背景音比と係数補正下限値とに加えて新たに目的音存在確率が含まれる点である。
図28を参照して、信号処理部360の構成例について詳細に説明する。信号処理部360は、第二の変換信号、分析情報である信号対背景音比情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、信号対背景音比復号部2612と信号対背景音比修正部461と抑圧係数変換部2622と乗算器451とから構成される。
信号対背景音比復号部2612は、受信した信号対背景音比情報から信号対背景音比と係数補正下限値と目的音存在確率とを復号し、信号対背景音比を信号対背景音比修正部461に出力し、係数補正下限値と目的音存在確率とを抑圧係数変換部2622に出力する。信号対背景音比と係数補正下限値と目的音存在確率とが符号化されていないときには、信号対背景音比復号部2612は復号処理を行わず、信号対背景音比と係数補正下限値と目的音存在確率とを出力する。
信号対背景音比修正部461は、外部から受けた信号制御情報を用いて、入力された信号対背景音比を修正し、修正信号対背景音比を生成する。信号対背景音比の修正については、第一の実施例における抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として信号対背景音比の倍率を入力することにより信号対背景音比を修正してもよい。また、信号制御情報として信号対背景音比の最大値または最小値を入力することにより信号対背景音比を修正しても良い。さらに、信号制御情報として信号対背景音比の倍率により修正された信号対背景音比と信号対背景音比の最大値または最小値により修正された信号対背景音比とを選択する制御情報を入力することにより修正してもよい。信号対背景音比修正部461は、修正信号対背景音比を抑圧係数変換部2622に出力する。
抑圧係数変換部2622は、修正信号対背景音比を抑圧係数に変換し、抑圧係数と係数補正下限値と目的音存在確率とから修正抑圧係数を算出し、修正抑圧係数を出力する。信号対背景音比を抑圧係数に変換する方法は、図12に示される抑圧係数変換部2622と同様の変換方法を用いても良い。抑圧係数と係数補正下限値と目的音存在確率とから修正抑圧係数を算出する方法は図8を用いて第二の実施の形態の第四の実施例で説明した通りである。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成し、修正復号信号を出力する。
第五の実施例の信号処理部360の第二の構成例を説明する。第一の構成とは異なり、信号制御情報と目的音存在確率とにより係数補正下限値を修正する点を特徴とする。信号処理部360は、信号対背景音比情報と信号制御情報とを受信し、修正抑圧係数を出力する。信号処理部360は、信号対背景音比復号部2612と同様にして、受信した信号対背景音比情報から信号対背景音比と係数補正下限値と目的音存在確率とを復号する。また、信号処理部360は、本実施の形態の第四の実施例において図68を用いて説明したように、信号制御情報と目的音存在確率とを用いて係数補正下限値を修正する。さらに、信号処理部360は、復号された信号対背景音比と修正された係数補正下限値とから修正抑圧係数を算出する。
係数補正下限値に代えて、信号対背景音比下限値を用いる場合には、信号対背景音比復号部2612は、受信した信号対背景音比情報から信号対背景音比と信号対背景音比下限値と目的音存在確率とを復号し、信号対背景音比を信号対背景音比修正部461に出力し、信号対背景音比下限値と目的音存在確率とを抑圧係数変換部2621に出力する。信号対背景音比と信号対背景音比下限値と目的音存在確率とが符号化されていないときには、信号対背景音比復号部2612は復号処理を行わず、信号対背景音比と信号対背景音比下限値と目的音存在確率とを直接出力する。
信号対背景音比修正部461は、外部から受けた信号制御情報を用いて、入力された信号対背景音比を修正し、修正信号対背景音比を生成する。信号対背景音比修正部461は、修正信号対背景音比を抑圧係数変換部2622に出力する。
抑圧係数変換部2622は、修正信号対背景音比と信号対背景音比下限値から補正信号対背景音比を求める。さらに、補正信号対背景音比をRとして[数5]を適用し、得られたGを修正抑圧係数として乗算器451へ出力する。
図30を参照して、第五の実施例の信号処理部360の第三の構成を詳細に説明する。第三の構成は、信号対背景音比を抑圧係数に変換してから、信号制御情報によって抑圧係数を修正する点で、第二の構成と異なる。信号処理部360は、第二の変換信号、分析情報である信号対背景音比情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、信号対背景音比復号部2612と抑圧係数変換部2622と抑圧係数修正部460と乗算器451とから構成される。
信号対背景音比復号部2612は、受信した信号対背景音比情報から信号対背景音比と係数補正下限値と目的音存在確率とを復号する。信号対背景音比復号部2612は、信号対背景音比と係数補正下限値と目的音存在確率とを抑圧係数変換部2622に出力する。
抑圧係数変換部2622は、復号された信号対背景音比と係数補正下限値と目的音存在確率とを補正抑圧係数に変換する。抑圧係数変換部2622は、補正抑圧係数を抑圧係数修正部460に出力する。
抑圧係数修正部460は、外部から受けた信号制御情報を用いて、背景音情報変換部2622から入力された補正抑圧係数を修正する。抑圧係数修正部460は、修正抑圧係数を出力する。抑圧係数修正部460の構成は、図23に示される第四の実施例の抑圧係数修正部460と同様のものであり、説明は省略する。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成し、修正復号信号を出力する。
係数補正下限値に代えて、信号対背景音比下限値を用いる場合には、信号対背景音比復号部2612は、受信した信号対背景音比情報から信号対背景音比と信号対背景音比下限値と目的音存在確率とを復号し、信号対背景音比と信号対背景音比下限値と目的音存在確率とを抑圧係数変換部2622に出力する。信号対背景音比と信号対背景音比下限値と目的音存在確率とが符号化されていないときには、信号対背景音比復号部2612は、復号処理を行わず、信号対背景音比と信号対背景音比下限値と目的音存在確率とを直接出力する。
抑圧係数変換部2622は、信号対背景音比と信号対背景音比下限値と目的音存在確率とから補正信号対背景音比を求める。さらに、補正信号対背景音比をRとして[数5]を適用し、得られたGを抑圧係数として抑圧係数修正部460に出力する。抑圧係数修正部460は、外部から受けた信号制御情報を用いて入力された抑圧係数を修正し、修正抑圧係数を生成する。抑圧係数修正部460は、修正抑圧係数を乗算器451に出力する。
続いて、第六の実施例について説明する。第六の実施例は、分析情報として背景音情報を用いる場合の構成例である。第三の実施例との違いは、信号対背景音比情報として信号対背景音比と係数補正下限値とに加えて新たに目的音存在確率が含まれる点である。
図33を参照して、信号処理部360の構成例を詳細に説明する。信号処理部360は、第二の変換信号、背景音情報及び信号制御情報を受信し、修正復号信号を出力する。信号処理部360は、背景音復号部2632と背景音修正部464と抑圧係数生成部2642と乗算器451とから構成される。
背景音復号部2632は、受信した背景音情報から背景音推定結果と係数補正下限値と目的音存在確率とを復号し、背景音推定結果を背景音修正部464に出力し、係数補正下限値と目的音存在確率とを抑圧係数生成部2642に出力する。背景音推定結果と係数補正下限値と目的音存在確率とが符号化されていないときには、背景音復号部2632は、復号処理を行わず、背景音推定結果と係数補正下限値と目的音存在確率とを出力する。
背景音修正部464は、背景音推定結果を用いて背景音を算出し、外部から入力された信号制御情報により修正する。背景音の修正については、第六の実施例における抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として背景音の倍率を入力することにより背景音を修正してもよい。また、信号制御情報として背景音の最大値または最小値を入力することにより背景音を修正しても良い。さらに、信号制御情報として背景音の倍率により修正された背景音と背景音の最大値または最小値により修正された背景音とを選択する制御情報を入力することにより修正してもよい。背景音修正部464は、修正された背景音を抑圧係数生成部2642に出力する。
抑圧係数生成部2642は、第二の変換信号と修正された背景音と係数補正下限値と音声存在確と率を用いて背景音を抑圧するための修正抑圧係数を計算する。この抑圧係数の計算は、図10に示される抑圧係数計算部2012と同様の計算方法を用いてもよい。抑圧係数生成部2642は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。乗算器451は、第二の変換信号と抑圧係数とを乗算し、修正復号信号を出力する。
図32を参照して、第三の実施例の信号処理部360の第二の構成を説明する。第一の構成とは異なり、信号制御情報により係数補正下限値を修正する点を特徴とする。信号処理部360は、背景音情報と信号制御情報とを受信し、修正抑圧係数を出力する。信号処理部360は、背景音復号部2631と同様にして、受信した背景音情報から背景音推定結果と係数補正下限値と目的音存在確率とを復号する。また、信号処理部360は、本実施の形態の第四の実施例において図68を用いて説明したように、信号制御情報と目的音存在確率とを用いて係数補正下限値を修正する。さらに、信号処理部360は、抑圧係数生成部2641と同様にして、第二の変換信号と背景音推定結果と修正された係数補正下限値とから修正抑圧係数を算出する。信号処理部360は、背景音復号部2631と下限値修正部466と抑圧係数生成部2641と乗算器451とから構成される。
背景音復号部2631は、受信した背景音情報から背景音推定結果と係数補正下限値と目的音存在確率とを復号し、背景音推定結果を抑圧係数生成部2641に出力し、係数補正下限値と目的音存在確率を下限値修正部466に出力する。背景音推定結果と係数補正下限値と目的音存在確率とが符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音推定結果と係数補正下限値と目的音存在確率とを抑圧係数生成部2641と下限値修正部466に出力する。
下限値修正部466は、外部から入力された信号制御情報と目的音存在確率とにより、係数補正下限値を修正する。係数補正下限値の修正については、第一の実施例における抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として係数補正下限値の倍率を入力することにより係数補正下限値を修正してもよい。また、信号制御情報として係数補正下限値の最大値または最小値を入力することにより係数補正下限値を修正しても良い。さらに、信号制御情報として係数補正下限値の倍率により修正された係数補正下限値と係数補正下限値の最大値または最小値とにより修正された係数補正下限値とを選択する制御情報を入力することにより修正してもよい。下限値修正部466は、修正された係数補正下限値を抑圧係数生成部2641に出力する。
抑圧係数生成部2641は、第二の変換信号と背景音推定結果と修正された係数補正下限値を用いて背景音を抑圧するための修正抑圧係数を計算する。この抑圧係数の計算は、図9に示される抑圧係数計算部2011と同様の計算方法を用いてもよい。抑圧係数生成部2641は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
乗算器451は、第二の変換信号と修正抑圧係数とを乗算し、修正復号信号を生成する。乗算器451は、修正復号信号を出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2631は、受信した背景音情報から背景音と背景音上限値と目的音存在確率とを復号し、背景音を抑圧係数生成部2641に出力し、背景音上限値と目的音存在確率を下限値修正部466とに出力する。背景音と背景音上限値と目的音存在確率が符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音と背景音上限値と目的音存在確率とを直接、抑圧係数生成部2641と下限値修正部466とに出力する。
下限値修正部466は、外部から受けた信号制御情報と目的音存在確率を用いて、入力された背景音上限値を修正し、修正背景音上限値を生成する。下限値修正部466は、修正背景音上限値を抑圧係数生成部2641に出力する。
抑圧係数生成部2641は、第二の変換信号と修正背景音上限値とを用いて、背景音を抑圧するための修正抑圧係数を計算する。抑圧係数生成部2641は、修正抑圧係数を乗算器451へ出力する。
図34を参照して、信号処理部360の第三の構成例を詳細に説明する。本構成例の信号処理部360は、背景音復号部2652、背景音修正部464及び減算器453で構成される。信号処理部360は、第二の変換信号、背景音情報及び信号制御情報を受信し、修正復号信号を出力する。
第二の変換信号が減算器453と背景音復号部2652とに入力される。また、背景音情報が分析情報として背景音復号部2652に入力される。背景音復号部2652は、背景音情報から背景音推定結果と係数補正下限値と目的音存在確率とを復号する。そして、背景音復号部2652は、第二の変換信号と係数補正下限値と目的音存在確率とから信号下限値を算出し、背景音推定結果と信号下限値から背景音を算出する。その後、背景音復号部2652は、背景音を背景音修正部464に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と信号下限値とから背景音を算出する。背景音修正部464は、信号制御情報を用いて背景音を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器453に出力する。減算器453は、第二の変換信号から修正背景音を減算し、背景音が抑圧された信号を修正復号信号として出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2652は、分析情報として背景音情報を受信し、背景音情報から背景音推定結果と背景音上限値とを復号する。背景音復号部2652は、背景音推定結果と背景音上限値を用いて第一の修正背景音推定結果を算出する。また、背景音復号部2652は、第二の変換信号と第一の修正背景音推定結果とから背景音を算出し、背景音を背景音修正部464に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と背景音上限値とから背景音を算出する。背景音修正部464は、信号制御情報を用いて背景音を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器453に出力する。減算器453は、第二の変換信号から修正背景音を減算し、背景音が抑圧された信号を修正復号信号として出力する。
図35を参照して、信号処理部360の第四の構成を詳細に説明する。第四の構成は、背景音復号部2652において信号下限値を算出する代わりに、第二の実施の形態の第三の実施例で説明したように、信号分析部101内の分析情報計算部121において信号下限値を算出して、背景音情報を背景音推定結果と信号下限値とする点が、第三の構成と異なる。
信号処理部360は、第二の変換信号と背景音情報とを受信し、背景音が抑圧された信号を修正復号信号として出力する。本構成例の信号処理部360 は、背景音復号部2651と背景音修正部464と減算器453とで構成されている。第二の変換信号が減算器453に入力され、分析情報として背景音情報が背景音復号部2651に入力される。背景音復号部2651は、背景音情報から背景音推定結果と信号下限値と目的音存在確率とを復号し、背景音推定結果と信号下限値と目的音存在確率とから背景音を算出し、背景音を背景音修正部464に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と信号下限値と目的音存在確率とから背景音を算出する。背景音修正部464は、信号制御情報を用いて背景音を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器453に出力する。減算器453は、第二の変換信号から修正背景音を減算し、背景音が抑圧された信号を修正復号信号として出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2652は、分析情報として背景音情報を受信し、背景音情報から背景音推定結果と背景音上限値と目的音存在確率とを復号する。背景音復号部2652は、背景音推定結果と背景音上限値とを用いて第一の修正背景音推定結果を算出する。また、背景音復号部2652は、第二の変換信号と第一の修正背景音推定結果と目的音存在確率とから背景音を算出し、背景音を背景音修正部464に出力する。背景音情報が符号化されていない場合には、復号処理せずに背景音推定結果と背景音上限値と目的音存在確率とから背景音を算出する。背景音修正部464は、信号制御情報を用いて背景音を修正し、修正背景音を生成する。背景音修正部464は、修正背景音を減算器453に出力する。減算器453は、第二の変換信号から修正背景音を減算し、背景音が抑圧された信号を修正復号信号として出力する。
図37を参照して、信号処理部360の第五の構成例を詳細に説明する。第四の構成と比較すると、本構成は、復号された背景音から抑圧係数を生成した後、信号制御情報によって抑圧係数を修正する点が特徴である。本構成例の信号処理部360は、第二の変換信号、背景音情報及び信号制御情報を受信し、背景音が制御された信号を出力する。信号処理部360は、背景音復号部2632、抑圧係数生成部2642、抑圧係数修正部460と乗算器451から構成される。
背景音復号部2632は、背景音情報から背景音推定結果と係数補正下限値と目的音存在確率を復号し、背景音推定結果と係数補正下限値と目的音存在確率を抑圧係数生成部2642に出力する。
抑圧係数生成部2642は、第二の変換信号と背景音推定結果と係数補正下限値と目的音存在確率とから補正抑圧係数を生成する。この計算は、図10に示される抑圧係数計算部2012と同様の計算方法を用いてもよい。そして、抑圧係数生成部2642は、補正抑圧係数を抑圧係数修正部460に出力する。
抑圧係数修正部460は、受信した信号制御情報を用いて、補正抑圧係数を修正し、修正抑圧係数を生成する。抑圧係数の修正については、図26で示される抑圧係数修正部460と同様の修正方法を適用することとしてもよい。すなわち、信号制御情報として補正抑圧係数の倍率を入力することにより修正してもよい。また、信号制御情報として抑圧係数の最大値または最小値を入力することにより修正しても良い。さらに、信号制御情報として補正抑圧係数の倍率と抑圧係数の最大値または最小値とを選択する制御情報を入力することにより修正してもよい。抑圧係数修正部460は、修正抑圧係数を出力する。信号制御情報は、第三の実施の形態において用いたものと同様であり、説明は省略する。
乗算器451は、第二の変換信号と抑圧係数とを乗算し、修正復号信号を出力する。
係数補正下限値に代えて、背景音上限値を用いる場合には、背景音復号部2631は、受信した背景音情報から背景音と背景音上限値と目的音存在確率とを復号し、背景音と背景音上限値と目的音存在確率とを抑圧係数生成部2641に出力する。背景音と背景音上限値と目的音存在確率とが符号化されていないときには、背景音復号部2631は、復号処理を行わず、背景音と背景音上限値と目的音存在確率とを直接出力する。
抑圧係数生成部2641は、第二の変換信号と背景音と背景音上限値と目的音存在確率とを用いて、背景音を抑圧するための抑圧係数を計算する。抑圧係数生成部2641は、抑圧係数修正部460へ出力する。
抑圧係数修正部460は、外部から受けた信号制御情報を用いて入力された抑圧係数を修正し、修正抑圧係数を生成する。抑圧係数修正部460は、修正抑圧係数を乗算器451に出力する。
以上説明したように、本発明の第四の実施の形態によれば、送信部(または録音部)で信号の分析を行うので、信号の制御だけを行う受信部の演算量を削減して、目的音と背景音から構成される入力信号を制御することができる。また、受信部で受けた信号制御情報を用いて、特定の音源だけを独立に制御することができる。
図38を参照し、本発明の第五の実施の形態を説明する。図38と第三の実施の形態を表す図21を比較すると、受信部35が受信部55で構成される点で異なる。受信部55は、伝送信号と信号制御情報と構成要素レンダリング情報を入力とし、複数のチャンネルから構成される出力信号を出力する。第三の実施の形態と比較して、構成要素レンダリング情報も入力とする点、出力信号が複数のチャンネルから構成される信号である点、が異なる。
構成要素レンダリング情報とは、復号信号に含まれる構成要素と受信部55の出力信号との関係を周波数成分毎に表した情報である。たとえば、復号信号に混合されている各構成要素の定位情報を表す。音像をぼかしたりして定位感を操作するための情報を含んでいてもよい。
構成要素レンダリング情報を利用することにより、構成要素ごとに各チャンネルへの出力信号を制御することができる。各構成要素は、特定の1つのチャンネル(例えばスピーカ)から出力してもよいし、複数のチャンネルに分配して出力してもよい。
受信部55は、第三の実施の形態で説明した図21の受信部35と比較すると、信号制御部350が出力信号生成部550で構成される点で異なる。出力信号生成部550は、復号信号、分析情報、信号制御情報に加えて、構成要素レンダリング情報も入力される。
以下、本実施の形態の特徴である出力信号生成部550の構成例について説明する。第一の実施例を図39、第二の実施例を図40、第三の実施例を図41に示す。
第一の実施例では、レンダリング部562に入力される修正復号信号が、信号制御情報に基づき、あらかじめ構成要素ごとに操作された信号であることを特徴としている。図39を参照すると、第一の実施例における出力信号生成部550は、信号制御部560、構成要素情報変換部561、レンダリング部562とから構成される。
信号制御部560は、復号信号と分析情報を入力とする。まず、分析情報を復号し各周波数成分に対応した分析パラメータを生成する。次に、分析パラメータに基づいて復号信号を各構成要素に分解する。さらに、信号制御情報を用いて各構成要素を操作して修正構成要素を生成し、生成した修正構成要素を生成して、生成した信号を修正復号信号としてレンダリング部562へ出力する。また、信号制御部560は、修正復号信号と修正構成要素との関係を周波数成分毎に表した修正パラメータを生成し、構成要素情報変換部561にも出力する。ここで、復号信号は一般的な複数音源から構成されるものである。
なお、信号制御部560の他の動作例として、修正構成要素を生成せずに、分析パラメータと信号制御情報を用いて、復号信号を修正復号信号に変換してもよい。その場合は、修正復号信号に変換するさいに使用した修正パラメータを構成要素情報変換部561に出力する。
以下に、信号制御部560の動作の具体例を説明する。
ある周波数帯域fにおける復号信号の周波数成分をXk(f), k=1,2,…,P(Pは復号信号のチャンネル数)、構成要素の周波数成分をYj(f), j=1,2,・・・,M(Mは構成要素数)、信号制御情報に基づいて修正した構成要素の周波数成分をY’j(f)、修正復号信号をX’(f)とすると、分析パラメータにより規定される変換関数F501と、信号制御情報により規定される変換関数F502を用いて次の関係が成立する。
[数9]
Yj(f)=F501(X1(f), X2(f),…, XP(f))
[数10]
Y’j(f)=F502(Yj(f))
[数11]
X’(f)=F503(Y’j(f))
ここで、変換関数F503は修正構成要素を修正復号信号に変換する関数であり、修正パラメータは変換関数F503の逆関数を表すパラメータとなる。
他の動作例として記述したように、関数F500、F501、F502、F503を統合して
[数12]
X’(f)=F504(X(f))
としてもよい。このとき、変換関数F504は分析パラメータと信号制御情報と修正パラメータにより規定される。
上記変換の具体例として、周波数帯域fの分析パラメータB(f)を、
[数13]
Figure 2009087923
と表し、信号制御情報A(f)を
[数14]
Figure 2009087923
と表すと、[数9]から[数12]は
[数15]
Figure 2009087923
と表せる。すなわち、復号信号を修正復号信号に変換する行列はD(f)×A(f)×B(f)として計算できる。ここで、D(f)は任意のP行M列の行列であり、修正パラメータをE(f)とすると、
[数16]
Figure 2009087923
となる。例えば、D(f)としてB(f)の逆行列を用いると、修正パラメータはE(f)=B(f)となる。なお、[数15]から明らかなように、D(f)としてB(f)の逆行列を用いることは修正構成要素を修正復号信号に変換する操作として妥当である。
構成要素情報変換部561は、信号制御部560から出力された修正パラメータを用いて、入力端子を介して供給された構成要素レンダリング情報をレンダリング情報に変換し、レンダリング情報をレンダリング部562に出力する。
構成要素レンダリング情報をレンダリング情報に変換する具体例として、構成要素レンダリング情報U(f)とレンダリング情報W(f)を、
[数17]
Figure 2009087923
と表すと、W(f)=U(f)×E(f)とすることができる。ここで、Qは出力信号のチャンネル数である。
なお、レンダリング情報は修正復号信号と出力信号生成部550の出力信号との関係を周波数成分毎に表した情報であり、信号間のエネルギ差、時間差や相関などを用いて表すことができる。レンダリング情報の一例として非特許文献10に開示された情報が知られている。
<非特許文献10> 2007年、アイエスオー/アイイシー 23003-1:2007 パート1 エムペグ サラウンド、(ISO/IEC 23003-1:2007 Part 1 MPEG Surround)
レンダリング部562は、構成要素情報変換部561から出力されたレンダリング情報を用いて、信号制御部560から出力された修正復号信号を変換して出力信号を生成し、出力信号生成部550の出力信号として出力する。
変換の方法として、非特許文献10に開示された方法が知られている。非特許文献10に開示されているMPEG Surroundデコーダを用いた場合、レンダリング情報としてMPEG Surroundデコーダに供給されるデータストリームを出力する。なお、MPEG Surroundデコーダ内で使用するパラメータをデータストリームに変換することなくレンダリング部に供給してもよい。
上記では、信号制御部560の出力として、周波数成分に分解された修正復号信号が、レンダリング部562に供給されている構成について説明したが、信号制御部560の出力において、修正復号信号が逆変換され時間信号としてレンダリング部562に供給される場合、レンダリング部562では、時間信号を周波数成分に分解してから処理を行う。レンダリング部562の出力は、周波数成分に分解された信号を逆変換した信号を出力信号として出力する。
出力信号の周波数成分をVk(f), k=1,2,…,Q(Qは出力信号のチャンネル数)とし、
[数18]
Figure 2009087923
とすると、レンダリング部の動作は、V(f)=W(f)×X’(f)となる。
次に、第二の実施例を説明する。第二の実施例は、レンダリング情報に構成要素ごとの制御を行うための情報を含ませ、レンダリング部562で、構成要素ごとの操作を実現することを特徴とする。図40を参照すると、第二の実施例における出力信号生成部550は、構成要素情報変換部563とレンダリング部562とから構成される。
構成要素情報変換部563は、分析情報と信号制御情報と構成要素レンダリング情報を入力とする。まず、分析情報を復号し、各周波数成分に対応した分析パラメータを生成する。次に、分析パラメータと信号制御情報とから修正分析パラメータを計算し、修正分析パラメータと構成要素レンダリング情報とから、復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を計算し、レンダリング部562に出力する。
なお、構成要素情報変換部563の他の動作例として、修正分析パラメータを生成せずに、分析パラメータと信号制御情報と構成要素レンダリング情報とから復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を生成してもよい。
上記変換の具体例として、周波数帯域fの修正分析パラメータB’(f)を、
[数19]
Figure 2009087923
とすると、
修正分析パラメータB’(f)は、A(f)×B (f)として計算できる。さらに、[数17]で表されるレンダリング情報W(f)は、構成要素レンダリング情報U(f)と修正分析パラメータB’(f)を用いて、W(f)=U(f)×B’(f)とすることができる。他の動作例として上述したように、修正分析パラメータB’(f)を計算せずに、W(f)=U(f)×A(f)×B (f)としてもよい。
レンダリング部562の動作は、本実施の形態の第一の構成例で説明した動作と同じである。具体的には、V(f)=W(f)×X (f)となる。
このような構成にすることにより、復号信号に含まれる各構成要素を制御するための情報をレンダリング情報に含めることができる。
次に第三の実施例を説明する。第三の実施例は、復号信号をレンダリングした信号を用いて、信号制御情報に基づき各構成要素を操作することを特徴とする。図41を参照すると、第三の実施例における出力信号生成部550は、構成要素情報変換部564とレンダリング部562と信号制御部565とから構成される。
構成要素情報変換部564は、分析情報と構成要素レンダリング情報を入力とし、レンダリング情報を出力する。初めに、分析情報を復号し、各周波数成分に対応した分析パラメータを生成する。次に、分析パラメータと構成要素レンダリング情報とから、復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を計算する。上記変換の具体例として、[数13]および[数17]で定義した分析パラメータB(f)と構成要素レンダリング情報U(f)とから、レンダリング情報W(f)は、W(f)=U(f)×B (f)とすることができる。
レンダリング部562は、復号信号とレンダリング情報とから、レンダリング信号を生成し、信号制御部565に対して出力する。レンダリング部562は、本実施の形態の第一の構成例において説明したとおりである。ある周波数帯域fにおけるレンダリング信号の周波数成分をIk(f), k=1,2,…,Q(Qは出力信号のチャンネル数)とすると、レンダリング信号は、I(f)=[I1(f) I2(f) … IQ(f)]T= W(f)×X (f)となる。
信号制御部565は、レンダリング信号と構成要素レンダリング情報と信号制御情報とから、出力信号を生成する。出力信号V(f)は、構成要素レンダリング情報と信号制御情報により規定される変換関数F505を用いて次の関係が成立する。
[数20]
V(f)=F505(I(f))
上記変換の具体例として、[数14]と[数17]で定義した信号制御情報A(f)と構成要素レンダリング情報U(f)を用いると、[数20]は、
[数21]
Figure 2009087923
と表せる。
以上説明したように、本発明の第五の実施の形態によれば、受信部において、分析情報に基づいて、入力信号の各音源に対応した構成要素ごとに独立に制御することができる。また、構成要素レンダリング情報に基づいて、各構成要素の定位を制御することができる。また、信号制御情報に基づいて、特定の音源だけを独立に制御することもできる。
さらに、送信部で分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
本発明の第六の実施の形態を説明する。本実施の形態は、音源として目的音と背景音の混在した入力信号を対象とし、伝送信号と構成要素レンダリング情報と信号制御情報を用いて、目的音と背景音を制御する。本実施の形態は、第五の実施の形態と同じく、図38で表されるが、信号分析部101と出力信号生成部550の構成で異なる点がある。そこで、以下、信号分析部101と出力信号生成部550について詳細に説明する。
本実施の形態における第一の実施例は、分析情報が抑圧係数情報の場合である。図38において、信号分析部101が分析情報として抑圧係数情報を出力する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき、抑圧係数情報を用いて復号信号を制御する。信号分析部101の構成については第二の実施の形態における第一の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部550について詳細に説明する。
抑圧係数情報を用いて目的音と背景音を制御する図38の出力信号生成部550の構成は、第五の実施の形態における出力信号生成部550の第二の実施例と同じく図40で表されるが、構成要素情報変換部563の構成で異なる点がある。そこで、以下、構成要素情報変換部563について説明する。
図42に構成要素情報変換部563の構成例を示す。構成要素情報変換部563は、構成要素パラメータ生成部651とレンダリング情報生成部652とから構成される。構成要素パラメータ生成部651は、抑圧係数情報から抑圧係数と係数補正下限値を復号し、各周波数成分に対応した補正抑圧係数を生成し、信号制御情報に基づき構成要素パラメータを算出し、レンダリング情報生成部652へ供給する。なお、補正抑圧係数の算出方法は第二の実施の形態の第一の実施例で説明した通りである。
上記変換の具体例として、周波数帯域fの各周波数成分に対応した補正抑圧係数をgi(f) , i=1,2,…,P(Pは復号信号のチャンネル数)とし、目的音を制御するための信号制御情報をAmain(f)、背景音を制御するための信号制御情報をAsub(f)とすると、構成要素パラメータH(f)は、
[数22]
Figure 2009087923
と表せる。
レンダリング情報生成部652は、構成要素パラメータと構成要素レンダリング情報に基づき、復号信号と出力信号の関係を表すレンダリング情報を出力する。上記変換の具体例として、[数17]においてM=2の場合を考えると、レンダリング情報W(f)は、W(f)=U(f) ×H(f)とすることができる。
なお、構成要素情報変換部563の他の構成例として、図42における構成要素パラメータ生成部651とレンダリング情報生成部652を統合することもできる。この場合、抑圧係数情報から抑圧係数と係数補正下限値を復号し、各周波数成分に対応した補正抑圧係数を算出し、補正抑圧係数と信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報を出力する。
上記変換の具体例として、[数17]においてM=2の場合を考えると、レンダリング情報W(f)は、
[数23]
Figure 2009087923
と表せる。
本実施の形態における第二の実施例は、分析情報が信号対背景音比情報の場合である。図38において、信号分析部101が分析情報として信号対背景音比情報を出力する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき、信号対背景音比情報を用いて復号信号を制御する。第一の実施例とは、信号分析部101と出力信号生成部550の構成が異なるのみである。信号対背景音比情報を分析情報として算出する信号分析部101は、第二の実施の形態における第二の実施例において詳細に説明しているため、説明は省略する。以下、出力信号生成部550の動作について詳細に説明する。
信号対背景音比情報を用いて目的音と背景音を制御する図38の出力信号生成部550の構成は、第一の実施例と同じく図40及び図42で表される。第一の実施例と比較して、本実施例は、図42の構成要素パラメータ生成部651の構成が異なる。そこで、以下、構成要素パラメータ生成部651について説明する。
構成要素パラメータ生成部651は、信号対背景音比情報から信号対背景音比と係数補正下限値を復号し、各周波数成分に対応した信号対背景音比を算出し、信号対背景音比から信号制御情報に基づき、目的音と背景音を制御するための構成要素パラメータを算出し、レンダリング情報生成部652へ供給する。たとえば、第二の実施の形態において説明したように、信号対背景音比と係数補正下限値から補正抑圧係数を算出した後、第一の実施例で説明したように、[数22]を用いて信号制御情報に基づいて構成要素パラメータを算出することができる。また、他の方法として、第四の実施の形態で説明したように、信号対背景音比を信号制御情報に基づいて操作し、操作した信号対背景音比と係数補正下限値から修正抑圧係数に変換した後、構成要素パラメータを算出してもよい。この場合、変換された修正抑圧係数をg’i(f)とすると、構成要素パラメータH(f)は、
[数24]
Figure 2009087923
となる。
図40の構成要素情報変換部563の他の構成例として、図42における構成要素パラメータ生成部651とレンダリング情報生成部652を統合することもできる。この場合、信号対背景音比情報から信号対背景音比と係数補正下限値を復号し、各周波数成分に対応した信号対背景音比を算出し、信号対背景音比と係数補正下限値と信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。具体例として、たとえば、第二の実施の形態において説明したように、信号対背景音比と係数補正下限値から補正抑圧係数を算出した後、第一の実施例で説明したように、[数23]を用いて補正抑圧係数と信号制御情報と構成要素レンダリング情報とからレンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。また、他の方法として、第四の実施の形態で説明したように、信号対背景音比を信号制御情報に基づいて操作し、操作した信号対背景音比と係数補正下限値を修正抑圧係数に変換してから、変換した修正抑圧係数と構成要素レンダリング情報とからレンダリング情報を算出してもよい。この場合、レンダリング情報W(f)は、
[数25]
Figure 2009087923
となる。
第一または第二の実施例において、構成要素情報変換部563で抑圧係数情報あるいは信号対背景音比情報と、信号制御情報及び構成要素レンダリング情報とからレンダリング情報を算出する際に、第四の実施の形態に記載したように抑圧係数情報あるいは信号対背景音比情報の中に含まれる係数補正下限値を信号制御情報により修正した後、修正した係数補正下限値と抑圧係数から修正抑圧係数を算出し、修正抑圧係数と構成要素レンダリング情報を用いて[数25]によりレンダリング情報を算出することもできる。
本実施の形態における第三の実施例は、分析情報が背景音情報の場合である。図38を参照すると、信号分析部101が分析情報として背景音情報を計算する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき、背景音情報を用いて復号信号を制御する。第一の実施例とは、信号分析部101と出力信号生成部550における構成が異なるのみである。背景音情報を、分析情報として算出する信号分析部101は、第二の実施の形態における第三の実施例において詳細に説明しているため、説明は省略する。よって、以下、出力信号生成部550の動作について詳細に説明する。
背景音情報を用いて目的音と背景音を制御する図38の出力信号生成部550の構成例を図43に示す。図43は、図40に示す第一の実施例とは、構成要素情報変換部563が構成要素情報変換部655で構成されている点が異なる。以下、構成要素情報変換部655について説明する。
構成要素情報変換部655は、復号信号と背景音情報と信号制御情報と構成要素レンダリング情報を入力とし、復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を生成しレンダリング部562に対して出力する。図44に構成要素情報変換部655の構成例を示す。構成要素情報変換部655は、変換部171と構成要素パラメータ生成部653とレンダリング情報生成部652とから構成される。変換部171は、復号信号を各周波数成分に分解して第二の変換信号を生成し、第二の変換信号を構成要素パラメータ生成部653に対して出力する。
構成要素パラメータ生成部653は、第二の変換信号と背景音情報と信号制御情報を入力とする。背景音情報を復号して背景音推定結果と係数補正下限値を算出し、第二の変換信号と背景音推定結果と係数補正下限値とから信号制御情報に基づいて、目的音と背景音を制御するための構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。
以下、構成要素パラメータの算出方法の具体例を示す。第一の方法では、第二の実施の形態における第三の実施例で説明したように、背景音推定結果と係数補正下限値と第二の変換信号とから補正抑圧係数を算出する。さらに、補正抑圧係数に対して[数22]を適用して、信号制御情報に基づいて構成要素パラメータを算出する。第二の方法では、第四の実施の形態の第四の実施例、第五の実施例で説明した方法で、背景音推定結果と係数補正下限値と信号制御情報と第二の変換信号とから修正抑圧係数を算出する。上述の方法により算出された修正抑圧係数に対して、[数24]を適用して構成要素パラメータを計算する。
なお、図43の構成要素情報変換部655の他の構成例として、図44における構成要素パラメータ生成部653とレンダリング情報生成部652を統合することもできる。この場合、各周波数成分に対応した第二の変換信号と、背景音情報を復号した各周波数成分に対応した背景音推定結果と係数補正下限値と、信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。
以下、レンダリング情報の算出方法の具体例を示す。第一の方法では、第二の実施の形態における第三の実施例で説明したように、背景音推定結果と係数補正下限値から、復号信号を用いて補正抑圧係数を算出する。さらに、[数23]を用いて補正抑圧係数と信号制御情報と構成要素レンダリング情報とからレンダリング情報を算出する。第二の方法では、第四の実施の形態の第四の実施例、第五の実施例で説明した方法で、背景音推定結果と係数補正下限値と信号制御情報と第二の変換信号とから修正抑圧係数を算出する。上述の方法により算出された修正抑圧係数に対して、[数25]を用いて抑圧係数と構成要素レンダリング情報とからレンダリング情報を算出する。
第三の実施例において、構成要素情報変換部655で背景音情報と信号制御情報及び構成要素レンダリング情報と第二の変換信号とからレンダリング情報を算出する際に、第四の実施の形態に記載したように背景音情報の中に含まれる係数補正下限値を信号制御情報により修正した後、修正した係数補正下限値と背景音推定結果と第二の変換信号とから修正抑圧係数を算出し、修正抑圧係数と構成要素レンダリング情報を用いて[数25]によりレンダリング情報を算出することもできる。
本実施の形態における第四の実施例は、分析情報が抑圧係数情報の場合である。第一の実施例では、構成要素パラメータを抑圧係数と係数補正下限値に基づいて生成していた。第四の実施例では、構成要素パラメータを抑圧係数と係数補正下限値と目的音存在確率に基づいて生成する点が第一の実施例と異なる。図38において、信号分析部101が分析情報として抑圧係数情報を出力する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき、抑圧係数情報を用いて復号信号を制御する。信号分析部101の構成については第二の実施の形態における第四の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部550について詳細に説明する。
抑圧係数情報を用いて目的音と背景音を制御する図38の出力信号生成部550の構成は、第五の実施の形態における出力信号生成部550の第二の構成例と同じく図40で表されるが、構成要素情報変換部563の構成で異なる点がある。そこで、以下、構成要素情報変換部563について説明する。
図42に構成要素情報変換部563の構成例を示す。構成要素情報変換部563は、構成要素パラメータ生成部651とレンダリング情報生成部652とから構成される。構成要素パラメータ生成部651は、抑圧係数情報から抑圧係数と係数補正下限値と目的音存在確率とを復号し、各周波数成分に対応した補正抑圧係数を生成し、信号制御情報に基づき構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。なお、補正抑圧係数の算出方法は第二の実施の形態の第一の実施例で説明した通りである。
上記変換の具体例として、周波数帯域fの各周波数成分に対応した補正抑圧係数をgi(f) , i=1,2,…,P(Pは復号信号のチャンネル数)とし、目的音を制御するための信号制御情報をAmain(f)、背景音を制御するための信号制御情報をAsub(f)とすると、構成要素パラメータH(f)は、[数22]で表せる。
レンダリング情報生成部652は、構成要素パラメータと構成要素レンダリング情報に基づき、復号信号と出力信号の関係を表すレンダリング情報を出力する。上記変換の具体例として、[数17]においてM=2の場合を考えると、レンダリング情報W(f)は、W(f)=U(f) ×H(f)とすることができる。
なお、構成要素情報変換部563の他の構成例として、図42における構成要素パラメータ生成部651とレンダリング情報生成部652を統合することもできる。この場合、抑圧係数情報から抑圧係数と係数補正下限値と目的音存在確率とを復号し、各周波数成分に対応した補正抑圧係数を算出し、補正抑圧係数と信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報をレンダリング部652する。
上記変換の具体例として、[数17]においてM=2の場合を考えると、レンダリング情報W(f)は、[数23]で表せる。
本実施の形態における第五の実施例は、分析情報が信号対背景音比情報の場合である。第二の実施例では、構成要素パラメータを抑圧係数と係数補正下限値に基づいて生成していた。第五の実施例では、構成要素パラメータを抑圧係数と係数補正下限値と目的音存在確率に基づいて生成する点が第二の実施例と異なる。図38において、信号分析部101が分析情報として信号対背景音比情報を出力する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき、信号対背景音比情報を用いて復号信号を制御する。第四の実施例とは、信号分析部101と出力信号生成部550の構成が異なるのみである。信号対背景音比情報を分析情報として算出する信号分析部101は、第二の実施の形態における第五の実施例において詳細に説明しているため、説明は省略する。以下、出力信号生成部550の動作について詳細に説明する。
信号対背景音比情報を用いて目的音と背景音を制御する図38の出力信号生成部550の構成は、第一の実施例と同じく図40及び図42で表される。第一の実施例と比較して、本実施例は、図42の構成要素パラメータ生成部651の構成が異なる。そこで、以下、構成要素パラメータ生成部651について説明する。
構成要素パラメータ生成部651は、信号対背景音比情報から信号対背景音比と係数補正下限値と目的音存在確率とを復号し、各周波数成分に対応した信号対背景音比を算出し、信号対背景音比から信号制御情報に基づき、目的音と背景音とを制御するための構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。たとえば、第二の実施の形態において説明したように、信号対背景音比と係数補正下限値と目的音存在確率とから補正抑圧係数を算出した後、第一の実施例で説明したように、[数22]を用いて信号制御情報に基づいて構成要素パラメータを算出することができる。また、他の方法として、第四の実施の形態で説明したように、信号対背景音比を信号制御情報に基づいて操作し、操作した信号対背景音比と係数補正下限値と目的音存在確率とから修正抑圧係数に変換した後、構成要素パラメータを算出してもよい。この場合、変換された修正抑圧係数をg’i(f)とすると、構成要素パラメータH(f)は、[数24]となる。
図40の構成要素情報変換部563の他の構成例として、図42における構成要素パラメータ生成部651とレンダリング情報生成部652を統合することもできる。この場合、構成要素情報変換部563は、信号対背景音比情報から信号対背景音比と係数補正下限値と目的音存在確率とを復号し、各周波数成分に対応した信号対背景音比を算出する。そして、構成要素情報変換部563は、信号対背景音比と係数補正下限値と目的音存在確率と信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。具体例として、たとえば、第二の実施の形態において説明したように、信号対背景音比と係数補正下限値と目的音存在確率とから補正抑圧係数を算出した後、第四の実施例で説明したように、[数23]を用いて補正抑圧係数と信号制御情報と構成要素レンダリング情報とからレンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。また、他の方法として、第四の実施の形態で説明したように、信号対背景音比を信号制御情報に基づいて操作し、操作した信号対背景音比と係数補正下限値と目的音存在確率とを修正抑圧係数に変換してから、変換した修正抑圧係数と構成要素レンダリング情報とからレンダリング情報を算出してもよい。この場合、レンダリング情報W(f)は、[数25]となる。
第四または第五の実施例において、構成要素情報変換部563で抑圧係数情報あるいは信号対背景音比情報と、信号制御情報及び構成要素レンダリング情報とからレンダリング情報を算出するとき、第四の実施の形態に記載した方法を用いてもよい。すなわち、構成要素情報変換部563が、抑圧係数情報あるいは信号対背景音比情報の中に含まれる係数補正下限値を目的音存在確率と信号制御情報とを用いて修正した後、修正された係数補正下限値と抑圧係数とから修正抑圧係数を算出し、修正抑圧係数と構成要素レンダリング情報を用いて[数25]によりレンダリング情報を算出する方法である。
本実施の形態における第六の実施例は、分析情報が背景音情報の場合である。第三の実施例では、構成要素パラメータを抑圧係数と係数補正下限値に基づいて生成していた。第六の実施例では、構成要素パラメータを抑圧係数と係数補正下限値と目的音存在確率に基づいて生成する点が第三の実施例と異なる。図38を参照すると、信号分析部101が分析情報として背景音情報を計算する。これに対応して、出力信号生成部550は、信号制御情報と構成要素レンダリング情報に基づき、背景音情報を用いて復号信号を制御する。第四の実施例とは、信号分析部101と出力信号生成部550における構成が異なるのみである。背景音情報を、分析情報として算出する信号分析部101は、第二の実施の形態における第六の実施例において詳細に説明しているため、説明は省略する。よって、以下、出力信号生成部550の動作について詳細に説明する。
背景音情報を用いて目的音と背景音を制御する図38の出力信号生成部550の構成例を図43に示す。図43は、図40に示す第四の実施例とは、構成要素情報変換部563が構成要素情報変換部655で構成されている点が異なる。以下、構成要素情報変換部655について説明する。
構成要素情報変換部655は、復号信号と背景音情報と信号制御情報と構成要素レンダリング情報とを受信し、復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報とを生成しレンダリング部562に対して出力する。図44に構成要素情報変換部655の構成例を示す。構成要素情報変換部655は、変換部171と構成要素パラメータ生成部653とレンダリング情報生成部652とから構成される。変換部171は、復号信号を各周波数成分に分解して第二の変換信号を生成し、第二の変換信号を構成要素パラメータ生成部653に対して出力する。
構成要素パラメータ生成部653は、第二の変換信号と背景音情報と信号制御情報とを受信する。背景音情報を復号して背景音推定結果と係数補正下限値と目的音存在確率を算出し、第二の変換信号と背景音推定結果と係数補正下限値と目的音存在確率とから信号制御情報に基づいて、目的音と背景音を制御するための構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。
以下、構成要素パラメータの算出方法の具体例を示す。第一の方法では、第二の実施の形態における第六の実施例で説明したように、背景音推定結果と係数補正下限値と目的音存在確率と第二の変換信号とから補正抑圧係数を算出する。さらに、補正抑圧係数に対して[数22]を適用して、信号制御情報に基づいて構成要素パラメータを算出する。第二の方法では、第四の実施の形態の第九の実施例、第十の実施例で説明した方法で、背景音推定結果と係数補正下限値と目的音存在確率と信号制御情報と第二の変換信号とから修正抑圧係数を算出する。上述の方法により算出された修正抑圧係数に対して、[数24]を適用して構成要素パラメータを計算する。
なお、図43の構成要素情報変換部655の他の構成例として、図44における構成要素パラメータ生成部653とレンダリング情報生成部652を統合することもできる。この場合、各周波数成分に対応した第二の変換信号と、背景音情報を復号した各周波数成分に対応した背景音推定結果と係数補正下限値と目的音存在確率と、信号制御情報と構成要素レンダリング情報とから、レンダリング情報を計算し、レンダリング情報をレンダリング部562に出力する。
以下、レンダリング情報の算出方法の具体例を示す。第一の方法では、第二の実施の形態における第六の実施例で説明したように、背景音推定結果と係数補正下限値と目的音存在確率とから、復号信号を用いて補正抑圧係数を算出する。さらに、[数23]を用いて補正抑圧係数と信号制御情報と構成要素レンダリング情報とからレンダリング情報を算出する。第二の方法では、第四の実施の形態の第九の実施例、第十の実施例で説明した方法で、背景音推定結果と係数補正下限値と目的音存在確率と信号制御情報と第二の変換信号とから修正抑圧係数を算出する。上述の方法により算出された修正抑圧係数に対して、[数25]を用いて抑圧係数と構成要素レンダリング情報とからレンダリング情報を算出する。
第六の実施例において、構成要素情報変換部655で背景音情報と信号制御情報と構成要素レンダリング情報と第二の変換信号とからレンダリング情報を算出する際に、第四の実施の形態に記載したように背景音情報の中に含まれる係数補正下限値を、同じく目的音存在確率と、信号制御情報とにより修正した後、修正した係数補正下限値と背景音推定結果と第二の変換信号とから修正抑圧係数を算出し、修正抑圧係数と構成要素レンダリング情報を用いて[数25]によりレンダリング情報を算出することもできる。
第六の実施の形態は、その実施例が第二の実施の形態および第四の実施の形態に対応しており、すでに説明したように、係数補正下限値に代えて、背景音上限値、信号対背景音比下限値、背景音上限値を用いてもよい。
以上説明したように、本発明の第六の実施の形態によれば、受信部において、分析情報に基づいて、目的音と背景音とから構成される入力信号を独立に制御することができる。また、構成要素レンダリング情報に基づいて、目的音と背景音の定位を制御することができる。また、信号制御情報に基づいて、特定の音源だけを独立に制御することもできる。
さらに、送信部で分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
本発明の第七の実施の形態は、構成要素レンダリング情報に信号の分離を制御するための、すなわち構成要素を独立に制御するための信号制御情報を含むものである。図45を参照し、本発明の第七の実施の形態を説明する。図45と第五の実施の形態を表す図38とを比較すると、図38の受信部55が、図45では受信部75で構成されている点で異なる。受信部75は、伝送信号と構成要素レンダリング情報とを入力とし、複数のチャンネルから構成される信号を出力信号として出力する。第五の実施の形態における受信部55とは、信号制御信号を入力としない点と、出力信号生成部550が出力信号生成部750で置換されている点で異なる。なお、本実施の形態における構成要素レンダリング情報は、復号信号に含まれる各構成要素を操作するための情報を含んでいてもよい。出力信号生成部750は、音源に対応した各構成要素の代わりに、複数の構成要素からなる構成要素群を単位として操作することも可能である。以下、本実施の形態の特徴である出力信号生成部750の構成例について説明する。
図46に、図45の出力信号生成部750の構成例を示す。出力信号生成部750は、構成要素情報変換部760とレンダリング部562とから構成される。出力信号生成部750は、第五の実施の形態における図40に示す出力信号生成部550とは、構成要素情報変換部563が構成要素情報変換部760で構成されている点で異なる。以下、構成要素情報変換部760の構成例について説明する。
構成要素情報変換部760は、分析情報と構成要素レンダリング情報を入力とし、レンダリング情報を出力する。まず、分析情報を復号して各周波数成分に対応する分析パラメータを算出する。さらに、分析パラメータと構成要素レンダリング情報を用いて、復号信号と出力信号生成部750の出力信号の関係を周波数成分毎に表すレンダリング情報を生成する。
上記変換の具体例として、レンダリング情報W(f)は、[数13]と[数17]を用いて、W(f)= U(f)×B(f)と表すことができる。なお、B(f)は周波数帯域fの分析パラメータ、U(f)は構成要素レンダリング情報である。
本構成例では、レンダリング情報に構成要素ごとの制御を行うための情報を含ませ、レンダリング部562で、構成要素ごとの操作を実現することを特徴とする。このため、制御を行うための情報の種類が削減され、制御が容易になる。
第六の実施の形態は、その実施例が第二の実施の形態および第四の実施の形態に対応しており、すでに説明したように、係数補正下限値に代えて、背景音上限値、信号対背景音比下限値、背景音上限値を用いるてもよい。
以上説明したように、本発明の第七の実施の形態によれば、受信部において、分析情報に基づいて、入力信号の各音源に対応した構成要素ごとに独立に制御することができる。また、構成要素レンダリング情報に基づいて、各構成要素の定位を制御することができる。
さらに、送信部で分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
本発明の第八の実施の形態は、音源として目的音と背景音の混在した入力信号を対象とし、受信部に供給された構成要素レンダリング情報を用いて、目的音と背景音を独立に制御し、目的音と背景音の定位を制御することができる。本実施の形態は、第七の実施の形態と同じく、図45で表されるが、信号分析部101と出力信号生成部750の構成が異なる。以下、信号分析部101と出力信号生成部750について詳細に説明する。
本実施の形態における第一の実施例は、分析情報が抑圧係数情報の場合である。送信部10における信号分析部101が、分析情報として抑圧係数情報を出力する。これに対応して、出力信号生成部750は、構成要素レンダリング情報と抑圧係数情報を用いて復号信号を制御する。抑圧係数情報を分析情報として用いた場合の信号分析部101については第二の実施の形態における第一の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
抑圧係数情報を用いて目的音と背景音を制御する図45の出力信号生成部750の構成例は、第七の実施の形態の出力信号生成部750と同じく図46で表されるが、構成要素情報変換部760の構成が異なる。構成要素情報変換部760の構成例を図47に示す。構成要素情報変換部760は、構成要素パラメータ生成部851とレンダリング情報生成部652とから構成される。
構成要素パラメータ生成部851は、抑圧係数情報を入力とする。抑圧係数情報を復号して各周波数成分に対応した抑圧係数と係数補正下限値とを算出する。さらに、抑圧係数と係数補正下限値から構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。この変換の具体例として、周波数帯域fの各周波数成分に対応した補正抑圧係数をgi(f)とすると、構成要素パラメータH(f)は、[数22]において、Amain(f)=1、Asub(f)=1の場合となる。すなわち、
[数26]
Figure 2009087923
となる。レンダリング情報生成部652については、第六の実施の形態において、図42を用いて説明したとおりであるため、説明を省略する。
本実施の形態における第二の実施例は、分析情報が信号対背景音比情報の場合である。送信部10における信号分析部101が、分析情報として信号対背景音比情報を出力する。これに対応して、出力信号生成部750は、構成要素レンダリング情報に基づき、信号対背景音比情報を用いて復号信号を制御する。信号対背景音比情報を分析情報として用いた場合の信号分析部101については第二の実施の形態における第二の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
信号対背景音比情報を用いて目的音と背景音を制御する図45の出力信号生成部750の構成例は、第一の実施例と同じく図46で表される。本実施例と第一の実施例では、構成要素情報変換部760の構成を表す図47の構成要素パラメータ生成部851の構成が異なる。以下、構成要素パラメータ生成部851について説明する。
構成要素パラメータ生成部851は、信号対背景音比情報を入力とし、信号対背景音比情報を復号し各周波数成分に対応した信号対背景音比と係数補正下限値を算出する。さらに、信号対背景音比と係数補正下限値から構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。構成要素パラメータの算出方法としては、例えば、第二の実施の形態における第二の実施例で説明したように、信号対背景音比と係数補正下限値を補正抑圧係数に変換する。さらに、本実施の形態における第一の実施例で説明したように、[数26]を用いて、抑圧係数から構成要素パラメータを算出する。
本実施の形態における第三の実施例は、分析情報が背景音情報の場合である。第一の実施例では、構成要素パラメータを抑圧係数と係数補正下限値に基づいて生成していた。第四の実施例では、構成要素パラメータを抑圧係数と係数補正下限値と目的音存在確率に基づいて生成する点が第一の実施例と異なる。送信部10における信号分析部101が、分析情報として背景音情報を出力する。これに対応して、出力信号生成部750は、背景音情報と構成要素レンダリング情報に基づき復号信号を制御する。信号対背景音比情報を分析情報として用いた場合の信号分析部101については第二の実施の形態における第三の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
背景音情報を用いて目的音と背景音を制御する図45の出力信号生成部750の構成例を図48に示す。図48は、図46の第一の実施例とは、構成要素情報変換部760が構成要素情報変換部761で構成されている点が異なる。レンダリング情報生成部652は、図42を用いて既に説明しているため、説明を省略する。
構成要素情報変換部761は、復号信号と背景音情報と構成要素レンダリング情報とから復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を生成しレンダリング部562に供給する。図49に構成要素情報変換部761の構成例を示す。構成要素情報変換部761は、変換部171と構成要素パラメータ生成部853とレンダリング情報生成部652とから構成される。変換部171は、復号信号を各周波数成分に分解して第二の変換信号を生成し、第二の変換信号を、構成要素パラメータ生成部853に供給する。
構成要素パラメータ生成部853は、背景音情報と第二の変換信号を入力とする。背景音情報を復号し背景音推定結果と係数補正下限値を算出し、第二の変換信号と背景音推定結果と係数補正下限値に基づいて構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。構成要素パラメータの算出方法としては、例えば、第二の実施の形態における第三の実施例において説明したように、背景音推定結果と係数補正下限値を補正抑圧係数に変換する。さらに、本実施の形態における第一の実施例で説明したように、[数26]を用いて補正抑圧係数から構成要素パラメータを算出する。
本実施の形態における第四の実施例は、分析情報が抑圧係数情報の場合である。送信部10における信号分析部101が、分析情報として抑圧係数情報を出力する。これに対応して、出力信号生成部750は、構成要素レンダリング情報と抑圧係数情報を用いて復号信号を制御する。抑圧係数情報を分析情報として用いた場合の信号分析部101については第二の実施の形態における第四の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
抑圧係数情報を用いて目的音と背景音を制御する図45の出力信号生成部750の構成例は、第七の実施の形態の出力信号生成部750と同じく図46で表されるが、構成要素情報変換部760の構成が異なる。構成要素情報変換部760の構成例を図47に示す。構成要素情報変換部760は、構成要素パラメータ生成部851とレンダリング情報生成部652とから構成される。
構成要素パラメータ生成部851は、抑圧係数情報を入力とする。抑圧係数情報を復号して各周波数成分に対応した抑圧係数と係数補正下限値と目的音存在確率とを算出する。さらに、抑圧係数と係数補正下限値と目的音存在確率とから構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。この変換の具体例として、周波数帯域fの各周波数成分に対応した補正抑圧係数をgi(f)とすると、構成要素パラメータH(f)は、[数22]において、Amain(f)=1、Asub(f)=1の場合となる。すなわち、[数26]となる。レンダリング情報生成部652については、第六の実施の形態において、図42を用いて説明したとおりであるため、説明を省略する。
本実施の形態における第五の実施例は、分析情報が信号対背景音比情報の場合である。第二の実施例では、構成要素パラメータを抑圧係数と係数補正下限値に基づいて生成していた。第五の実施例では、構成要素パラメータを抑圧係数と係数補正下限値と目的音存在確率に基づいて生成する点が第二の実施例と異なる。送信部10における信号分析部101が、分析情報として信号対背景音比情報を出力する。これに対応して、出力信号生成部750は、構成要素レンダリング情報に基づき、信号対背景音比情報を用いて復号信号を制御する。信号対背景音比情報を分析情報として用いた場合の信号分析部101については第二の実施の形態における第五の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
信号対背景音比情報を用いて目的音と背景音を制御する図45の出力信号生成部750の構成例は、第四の実施例と同じく図46で表される。本実施例と第四の実施例では、構成要素情報変換部760の構成を表す図47の構成要素パラメータ生成部851の構成が異なる。以下、構成要素パラメータ生成部851について説明する。
構成要素パラメータ生成部851は、信号対背景音比情報を入力とし、信号対背景音比情報を復号し各周波数成分に対応した信号対背景音比と係数補正下限値と目的音存在確率とを算出する。さらに、信号対背景音比と係数補正下限値と目的音存在確率から構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。構成要素パラメータの算出方法としては、例えば、第二の実施の形態における第五の実施例で説明したように、信号対背景音比と係数補正下限値と目的音存在確率とを補正抑圧係数に変換する。さらに、本実施の形態における第一の実施例で説明したように、[数26]を用いて、抑圧係数から構成要素パラメータを算出する。
本実施の形態における第六の実施例は、分析情報が背景音情報の場合である。第三の実施例では、構成要素パラメータを抑圧係数と係数補正下限値に基づいて生成していた。第六の実施例では、構成要素パラメータを抑圧係数と係数補正下限値と目的音存在確率に基づいて生成する点が第三の実施例と異なる。送信部10における信号分析部101が、分析情報として背景音情報を出力する。これに対応して、出力信号生成部750は、背景音情報と構成要素レンダリング情報に基づき復号信号を制御する。信号対背景音比情報を分析情報として用いた場合の信号分析部101については第二の実施の形態における第六の実施例において詳細に説明しているため、説明を省略する。以下、出力信号生成部750の動作について詳細に説明する。
背景音情報を用いて目的音と背景音を制御する図45の出力信号生成部750の構成例を図48に示す。図48は、図46の第四の実施例とは、構成要素情報変換部760が構成要素情報変換部761で構成されている点が異なる。レンダリング情報生成部652は、図42を用いて既に説明しているため、説明を省略する。
構成要素情報変換部761は、復号信号と背景音情報と構成要素レンダリング情報とから復号信号と出力信号の関係を周波数成分毎に表したレンダリング情報を生成し、レンダリング部562に出力する。図49に構成要素情報変換部761の構成例を示す。構成要素情報変換部761は、変換部171と構成要素パラメータ生成部853とレンダリング情報生成部652とから構成される。変換部171は、復号信号を各周波数成分に分解して第二の変換信号を生成し、第二の変換信号を、構成要素パラメータ生成部853に出力する。
構成要素パラメータ生成部853は、背景音情報と第二の変換信号を受信する。構成要素パラメータ生成部853は、背景音情報を復号し、背景音推定結果と係数補正下限値と目的音存在確率とを算出する。そして、構成要素パラメータ生成部853は、第二の変換信号と背景音推定結果と係数補正下限値と目的音存在確率とに基づいて構成要素パラメータを算出し、レンダリング情報生成部652へ出力する。構成要素パラメータの算出方法としては、例えば、第二の実施の形態における第六の実施例において説明したように、背景音推定結果と係数補正下限値と目的音存在確率を補正抑圧係数に変換する。さらに、本実施の形態における第一の実施例で説明したように、[数26]を用いて補正抑圧係数から構成要素パラメータを算出する。
以上説明したように、本発明の第八の実施の形態によれば、受信部において、分析情報に基づいて、目的音と背景音とから構成される入力信号を独立に制御することができる。また、構成要素レンダリング情報に基づいて、目的音と背景音の定位を制御することができる。
さらに、送信部で抑圧係数又は信号対背景音比といった分析情報の計算を行うので、受信部は分析情報の計算に係る演算量を削減することができる。
本発明の第九の実施の形態は、符号化部において発生した量子化歪みの影響を考慮に入れた分析を行うことを特徴とする。図50を参照して本発明の第九の実施の形態を詳細に説明する。図1に示される本発明の第一の実施の形態と比較すると、第一の実施の形態における送信部10が送信部90で置換されている。さらに、送信部10に含まれる信号分析部101が、送信部90に含まれる信号分析部900で置換されている。また、信号分析部900には、入力信号と符号化部100からの符号化信号が入力されている。
また、第二の実施の形態及び第八の実施の形態において、送信部10に含まれる信号分析部101を本実施の形態の信号分析部900で置換することとしてもよい。この場合、入力信号と符号化部100からの符号化信号が信号分析部900に入力されるようにすればよい。
第九の実施の形態によると、信号分析部900が符号化部において発生した量子化歪みの影響を考慮に入れた分析を行うことにより、受信部15において復号を行う際に発生する量子化歪みを低減することが可能になる。
図51を参照して、信号分析部900の第一の構成例について詳細に説明する。信号分析部900は、入力信号と符号化部100からの符号化信号を受信し、分析情報を出力する。信号分析部900は、入力信号と符号化部100からの符号化信号とから分析情報を生成する。符号化信号は量子化歪みの加わった信号であるので、量子化歪み量を考慮して分析情報を生成することが出来る。
信号分析部900は、入力信号と符号化部100からの符号化信号を受信し、分析情報を出力する。信号分析部900は、変換部120、復号部150、量子化歪み計算部910、分析情報計算部911及び変換部920から構成される。
入力信号は、変換部120に入力される。また、符号化部100からの符号化信号は、復号部150に入力される。
復号部150は、符号化部100から入力された符号化信号の復号を行う。復号部150は、復号信号を変換部920へ出力する。変換部920では、復号信号を周波数成分へと分解する。変換部920は、周波数成分分解された復号信号を量子化歪み計算部910へ出力する。
変換部120は、入力信号を周波数成分へと分解する。変換部120は、周波数成分分解された入力信号を量子化歪み部910および分析情報計算部911へ出力する。量子化歪み計算部910は、周波数成分分解された復号信号と周波数成分分解された入力信号とを比較し、量子化歪み量を周波数成分ごとに計算する。このために、通常は変換部920と変換部120とは、同一の変換を実行する。これらが同一の変換を実行しない場合には、少なくとも量子化歪計算部910において、同等の信号の間で量子化歪を計算することができるように、周波数帯域や変換成分などの整合をとる処理が必要となる。量子化歪の計算は、例えば、周波数成分分解された復号信号の各周波数成分の大きさと周波数成分分解された入力信号の各周波数成分の大きさとの差をとることでその周波数における量子化歪みとしてもよい。量子化歪み計算部910は、各周波数の量子化歪み量を分析情報計算部911に出力する。
分析情報計算部911は、変換部120から周波数成分分解された入力信号を受信し、量子化歪み計算部910から各周波数の量子化歪み量を受信する。分析情報計算部911は、周波数成分分解された入力信号について、各周波数成分に対応した入力信号を音源に対応した構成要素ごとに分解する。そして、分析情報計算部911は、複数の構成要素間の関係を表す分析情報を生成する。分析情報計算部911は、分析情報を出力する。また、周波数成分分解された入力信号について、分析情報計算部911は、複数の構成要素から構成される構成要素群に分解することとしてもよい。
分析情報計算部911は、量子化歪み量を考慮し、受信部における復号の際に、量子化歪みが低減されるように分析情報の計算を行う。例えば、分析情報計算部911は、周波数成分分解された入力信号の各周波数成分の大きさとその周波数における量子化歪みの大きさとから、量子化歪みが聴覚マスキングされるように、分析情報を計算してもよい。ここで、分析情報計算部911は、聴覚マスキングにおいて、周波数成分の大きさが大きい周波数の周辺周波数では、小さい成分は聞こえにくくなることを利用してもよい。各周波数成分の大きさから周辺周波数において聞こえにくくなる成分の大きさをマスキング特性とする。分析情報計算部911は、マスキング特性を全周波数において計算してもよいし、特定の周波数帯域だけで計算してもよい。分析情報計算部911は、各周波数において、量子化歪みの影響を考慮して分析情報の補正を行う。マスキング特性より量子化歪みの大きさが小さい場合には、量子化歪みが聞こえにくい。この場合には、量子化歪みの影響が少ないので、分析情報計算部911は、分析情報の補正は行わない。マスキング特性より量子化歪みの大きさが大きい場合は、マスキングされない。この場合には、分析情報計算部911は、量子化歪みを低減させるように分析情報を補正する。例えば、分析情報として抑圧係数を用いる場合は、量子化歪みも背景音と同時に抑圧するように小さめの抑圧係数としてもよい。
以上のように、分析情報計算部911が分析情報を補正することにより、受信部において復号を行った際に量子化歪みが聴覚マスキングされ、歪や雑音が低減される。
これまで聴覚マスキングを考慮して量子化歪みを低減するような分析情報の補正について説明してきた。しかし、聴覚マスキングを考慮せず、全ての周波数において量子化歪みを低減するように分析情報を補正する構成でもよい。
図52を参照して、信号分析部900の第二の構成例を詳細に説明する。
信号分析部900は、入力信号と符号化部100からの符号化信号を受信し、分析情報を出力する。信号分析部900は、変換部120、復号部150、量子化歪み計算部910、分析情報計算部912及び変換部920から構成される。
入力信号は、変換部120に入力される。また、符号化部100からの符号化信号は、復号部150に入力される。
復号部150は、符号化部100から入力された符号化信号の復号を行う。復号部150は、復号信号を変換部920へ出力する。変換部920では、復号信号を周波数成分へと分解する。変換部920は、周波数成分分解された復号信号を量子化歪み計算部910と分析情報計算部912とに出力する。
変換部120は、入力信号を周波数成分へと分解する。変換部120は、周波数成分分解された入力信号を量子化歪み計算部910へ出力する。量子化歪み計算部910は、周波数成分分解された復号信号と周波数成分分解された入力信号とを比較し、量子化歪み量を周波数成分ごとに計算する。このために、通常は変換部920と変換部120は、同一の変換を実行する。これらが同一の変換を実行しない場合には、少なくとも量子化歪計算部910において、同等の信号の間で量子化歪を計算することができるように、周波数帯域や変換成分などの整合をとる処理が必要となる。量子化歪の計算は、例えば、周波数成分分解された復号信号の各周波数成分の大きさと周波数成分分解された入力信号の各周波数成分の大きさとの差をとることで、その周波数における量子化歪みとしてもよい。量子化歪み計算部910は、各周波数の量子化歪み量を分析情報計算部912に出力する。
分析情報計算部912は、変換部920から周波数成分分解された復号信号を受信し、量子化歪み計算部910から各周波数の量子化歪み量を受信する。分析情報計算部912は、周波数成分分解された復号信号について、各周波数成分に対応した入力信号を音源に対応した構成要素ごとに分解する。そして、分析情報計算部912は、複数の構成要素間の関係を表す分析情報を生成する。分析情報計算部912は、量子化歪みを低減されるように補正された分析情報を出力する。量子化歪みが低減されるような分析情報の計算については、第一の構成例と同様であるので、説明は省略する。
以上説明したように、信号分析部900の第一の構成例及び第二の構成例は、符号化部100において発生した符号化歪みの効果を低減するように分析情報の生成を行う。このため受信部15において復号を行う際に発生する量子化歪みを低減することができるという効果を有する。
続いて、本発明の第十の実施の形態について説明する。本発明の第十の実施の形態は、音源として目的音と背景音とから構成される入力信号を制御するものである。本発明の第十の実施の形態の構成は、本発明の第九の実施の形態の構成と同様に図50および図51で示される。第九の実施の形態と第十の実施の形態は、図51における本発明の第九の実施の形態の構成の分析情報計算部911の構成が異なる。以下、図51の説明と重複する部分の説明は省略する。
図53を参照して、本発明の第十の実施の形態における分析情報計算部911の構成例を詳細に説明する。分析情報計算部911は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信し、分析情報を出力する。分析情報計算部911は、背景音情報生成部202と背景音推定部1020とから構成される。
背景音推定部1020は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信する。背景音推定部1020は、量子化歪み量を考慮し、背景音の推定を行う。たとえば、背景音推定部1020は、推定した背景音に量子化歪みを加算したものを推定背景音として、分析情報計算部121に含まれる背景音推定部200と同様の処理を行ってもよい。背景音推定部1020は、量子化歪みが考慮された背景音推定結果を背景音情報生成部202に出力する。背景音情報生成部202は、背景音推定結果に基づいて、分析情報を生成する。そして、背景音情報生成部202は、量子化歪みが考慮された分析情報を出力する。なお、背景音情報生成部202は、分析情報として抑圧係数又は信号対背景音比に係数補正下限値、あるいは、係数補正下限値及び目的音存在確率を加えたものを出力することとしてもよい。この場合、背景音情報生成部202は、第二の実施の形態で説明した抑圧係数計算部2011、2012と、抑圧係数符号化部2021、2022と信号対背景音比計算部203、2071、2072と、信号対背景音比符号化部2041、2042などから構成される。
図54を参照して、本発明の第十の実施の形態における分析情報計算部911の第二の構成例を詳細に説明する。本構成例は分析情報として背景音推定結果に加えて係数補正下限値を算出する。分析情報計算部911は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信し、分析情報を出力する。分析情報計算部911は、背景音符号化部2061と背景音推定部1021とから構成される。
背景音推定部1021は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信する。背景音推定部1021は、量子化歪み量を考慮し、背景音の推定を行う。たとえば、背景音推定部1021は、推定した背景音に量子化歪みを加算したものを推定背景音として、分析情報計算部121に含まれる背景音推定部2051と同様の処理を行ってもよい。背景音推定部1021は、量子化歪みが考慮された背景音推定結果と係数補正下限値とを背景音符号化部2061に出力する。係数補正下限値は、あらかじめ特定の値をメモリに記憶しておいてもよいし、背景音推定結果に応じて計算しても良い。このような計算には、メモリに記憶された複数の値から適切な値を選択する操作も含む。係数補正下限値は、背景音推定結果が小さいときに小さくなるように設定すると良い。背景音推定結果が小さいときは、入力信号において目的音が支配的であることを表し、構成要素の操作において歪を生じにくいためである。背景音符号化部2061は図15を用いて説明した通りである。
図55を参照して、本発明の第十の実施の形態における分析情報計算部911の第三の構成例を詳細に説明する。本構成例は分析情報として背景音推定結果に加えて係数補正下限値と目的音存在確率とを用いる。分析情報計算部911は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信し、分析情報を出力する。分析情報計算部911は、背景音符号化部2062と背景音推定部1022とから構成される。
背景音推定部1022は、周波数成分分解された入力信号と各周波数の量子化歪み量とを受信する。背景音推定部1022は、量子化歪み量を考慮し、背景音の推定を行う。たとえば、背景音推定部1022は、推定した背景音に量子化歪みを加算したものを推定背景音として、分析情報計算部121に含まれる背景音推定部2052と同様の処理を行うことができる。背景音推定部1022は、量子化歪みが考慮された背景音推定結果と係数補正下限値と目的音存在確率とを背景音符号化部2062に出力する。係数補正下限値の設定法は、第二の構成例において説明した通りである。目的音存在確率は、例えば、目的音と背景音の振幅やパワーの比によって表すことができる。この比をそのもの、短時間平均、最大値、最小値などを、目的音存在確率として用いても良い。背景音符号化部2062は図16を用いて説明した通りである。
受信部15は、量子化歪みが考慮された分析情報に基づいて、復号信号の制御を行う。この構成により、復号信号の制御において、量子化歪みを考慮した高品質な制御を行うことが出来る。さらに、受信部15において復号を行う際に発生する量子化歪みを低減することができるという効果を有する。
以上、本発明の第十の実施の形態は、量子化歪みが考慮された抑圧係数、信号対背景音比又は背景音に加えて、係数補正下限値、あるいは、係数補正下限値及び目的音存在確率に基づいて、復号信号の制御を行う。この構成により、復号信号の制御において、量子化歪みを考慮した高品質な制御を行うことが出来る。さらに、受信部15において復号を行う際に発生する量子化歪みや符号化歪みを低減することができるという効果を有する。
次に、本発明の第十一の実施の形態について説明する。本発明の第十一の実施の形態は、信号分析部900に含まれる複数の変換部を符号化部100に含まれる変換部と共用することによって、送信側部における演算量と、分析情報に基づいて受信側部で各音源に対応した構成要素ごとの制御に係る演算量を低減する。
図56を参照して、本発明の第十一の実施の形態を説明する。図1に示す本発明の第一の実施の形態と、図56に示す本発明の第十一の実施の形態とは、送信部10が送信部13で構成されている点、受信部15が受信部18で構成されている点で異なる。この構成により、本発明の第十一の実施の形態は、送信部の中にある変換部を共用し、受信部の中にある変換部を共用することができる。この結果、送信部13及び受信部18の演算量を低減することが出来る。
図1に示される送信部10と図56に示される送信部13は、符号化部100が符号化部1100で構成されている点、信号分析部101が、信号分析部1101で構成されている点で異なる。本実施例では、符号化部1100が周波数成分分解された入力信号を信号分析部1101に出力している。
図57を参照して、符号化部1100の構成例を詳細に説明する。図2に示される符号化部100と図57に示される符号化部1100とは、変換部110の出力である第一の変換信号が、信号分析部1101へ出力される点で異なる。変換部110及び量子化部111の動作については図2と重複するので、説明は省略する。ここで、符号化部1100の演算量は、図2に示される符号化部100と出力される信号が異なるのみであるので、符号化部100の演算量とほぼ同一である。
図58を参照して、信号分析部1101の構成例を詳細に説明する。図4に示す信号分析部101と図58に示される信号分析部1101とは、信号分析部101に含まれている変換部120が削除されている点が異なる。
信号分析部1101は、符号化部1100から第一の変換信号を受信する。受信した第一の変換信号は分析情報計算部121へ入力される。ここで、図57に示される符号化部1100内の変換部110と、図4に示される信号分析部101内の変換部120とを比較すると、変換部に供給される入力信号が同一であり、変換部の動作が同一ならば、各々の出力である第一の変換信号と第二の変換信号は同一となる。そのため、変換部110と変換部120の動作が同一である場合、信号分析部1101では変換部120を削除し、信号分析部1101が出力する第一の変換信号を第二の変換信号として使用することが出来る。この構成により、信号分析部1101の演算量は、変換部120の演算量に相当する分だけ、信号分析部101よりも削減される。分析情報計算部121の動作については、図4の説明と重複するので省略する。
図1に示される受信部15と図56に示される受信部18は、復号部150が復号部1150で置換されている点と、信号制御部151が信号制御部1151で置換されている点で異なる。
図59を参照して、復号部1150の構成例を説明する。図3に示される復号部150と復号部1150とは、復号部1150において逆変換部161が削除されている点で異なる。逆量子化部160の動作については、図3の説明と重複するので省略する。図3に示される復号部150は、逆量子化部160が出力する第一の変換信号を逆変換部161により時間領域信号に逆変換し、復号信号として図5に示される変換部171に出力している。図5では、変換部171が復号信号を受信し、第二の変換信号に変換する処理を行っている。ここで、上述の通り、変換部110と変換部120の動作が同一である場合、第一の変換信号を第二の変換信号として使用することが出来る。これにより、本実施例の形態において、復号部1150は、逆量子化部160の出力する第一の変換信号を信号制御部1151に含まれる信号処理部172に出力する。従って、本実施の形態において、逆変換部161を削除することができる。
図60を参照して、信号制御部1151の構成例を詳細に説明する。図5に示される信号制御部151と図60に示される信号制御部1151とは、信号制御部1151において変換部171が削除されている点で異なる。信号処理部172及び逆変換部173の動作については、図5の説明と重複するので省略する。
図5の信号制御部151は、時間領域信号として入力された復号信号が変換部171により第二の変換信号に変換され、信号処理部172に出力している。上述の通り、変換部110と変換部120の動作が同一である場合、第一の変換信号を第二の変換信号として使用することが出来る。これにより、信号制御部1151に含まれる信号処理部172は、逆量子化部160の出力する第一の変換信号を受信することができる。従って、本実施例において、変換部171を取り除くことができる。
ここで、信号制御部1151に復号部1150から入力される信号に着目すると、図1に示される第一の実施の形態と図56に示される第十一の実施の形態とは、逆量子化部160が出力する信号が、逆変換部161および変換部171を経由しているか否かの違いがある。第一の変換信号を第二の変換信号として使用できる場合において、第一の実施の形態及び第十一の実施の形態のいずれも、逆量子化部160が出力する信号の周波数成分と信号制御処理部172に入力される信号の周波数成分は同じである。従って、信号制御部1151内の信号処理部172は、図5に示される信号処理部172と同一の結果を出力する。また、復号部1150の演算量は、図3に示される逆変換部161の演算量に相当する分だけ、復号部150よりも削減されている。さらに、信号制御部1151の演算量は、図5に示される変換部171の演算量に相当する分だけ、信号制御部151よりも削減されている。
以上、本発明の第十一の実施の形態は、本発明の第一の実施の形態の効果に加えて、変換部120、逆変換部161及び変換部160のそれぞれの演算量に相当する分だけ、第一の実施の形態よりも演算量が削減されるという効果を有する。さらに、第十一の実施の形態の演算量削減の構成は、本発明の第二の実施の形態から第十の実施の形態に適用することが可能である。これにより、各実施の形態は、本発明の第十一の実施の形態と同様の演算量削減の効果を有する。
以上、これまでは、本発明の第一の実施の形態から第十一の実施の形態において複数の音源から構成される入力信号を分析し、分析情報を算出し、受信側で分析情報に基づいて復号信号を制御する方法について説明してきた。ここで、具体例を用いてさらに詳細を説明する。入力信号は、利用方法によって異なるが、例えば、音声、楽器音などがある。この他、音による監視を目的とする場合は、各機械が発生する動作音や、操作者の音声や足音などがある。
入力信号に複数の構成要素がある場合、本発明に係る信号分析制御システムは、入力信号を分析し、分析した結果を分析情報として符号化する構成である。構成要素が複数ある場合、図1に示される構成と同様の構成が適用される。信号分析部101および、信号制御部151の構成、信号分析部101が多重化部102へ出力する情報、分離部152から信号制御部151に送られる情報について、それぞれ詳細に説明する。
図61を参照して、信号分析部101の第二の構成例を詳細に説明する。信号分析部101の第二の構成は、構成要素が複数ある場合に適用する。この信号分析部101は、音環境分析部1210と音環境情報符号化部1211とから構成されている。音環境分析部1210は、複数の要素から構成される信号を受けて、入力信号に含まれる複数の構成要素の情報を分析する。音環境分析部1210は、構成要素分析情報を音環境情報符号化部1211へ出力する。音環境情報符号化部1211は、音環境分析部1210から入力された構成要素分析情報を符号化する。そして、音環境情報符号化部1211は、符号化された構成要素分析情報を図1に示される多重化部102へ出力する。ここで、図1に示される多重化部102は、音環境情報符号化部1211から入力された構成要素分析情報に対応した多重化を行う。
音環境分析部1210についてさらに詳細に説明する。音環境分析部1210における複数音源の情報の分析の方法としては、様々な方法を用いることが可能である。例えば、複数音源の情報の分析の方法として、非特許文献11に記載されている信号分離の方法を用いてもよい。また、複数音源の情報の分析の方法としては、音情景分析、コンピューテーショナル・オーディトリィ・シーン・アナリシス(Computational Auditory Scene Analysis)、単一入力信号分離、シングル・チャンネル・シグナル・セパレーション、などと呼ばれる信号分離の手法を用いてもよい。これらの信号分離の手法により、音環境分析部1210は、入力信号を複数の各構成要素に分離する。さらに、音環境分析部1210は、分離された各構成要素から出力すべき構成要素分析情報に変換して出力する。この構成要素分析情報は、様々な形式で出力することが可能である。例えば、構成要素分析情報としては、背景音を抑圧するための抑圧係数や、各周波数成分におけるそれぞれの構成要素の割合や、それぞれの構成要素そのものの信号の各周波数成分の大きさがある。構成要素の割合には、例えば、入力信号との振幅比、入力信号とのエネルギ比、及びこれらの平均値、最大値、最小値などが含まれる。信号の各周波数成分の大きさには、例えば、振幅絶対値、エネルギ、及びこれらの平均値などが含まれる。また、信号分離の方法によっては、信号分離の途中において、出力すべき分析結果そのもの、または、出力すべき分析結果に容易に変換可能な信号が得られる。その場合は、信号分離を最後まで行わずに、信号分離を行う途中から出力すべき分析結果を得る処理を行うことも可能である。
<非特許文献11> 2005年、「スピーチ・エンハンスメント」、シュプリンガー、(Speech Enhancement, Springer, 2005, pp. 371--402)、371ページから402ページ
図62を参照して、信号制御部151の構成例を詳細に説明する。図62に示す信号制御部151の構成例は、構成要素が複数ある場合に適用する構成である。信号制御部151は、音環境情報復号部1212および音環境情報処理部1213から構成されている。信号制御部151は、復号部150からの復号信号、分離部152から分析情報を符号化した信号を受信する。音環境情報復号部1212は、分離部152から符号化された分析情報を受信して、分析情報を復号する。音環境情報復号部1212は、復号した分析情報を、音環境情報処理部1213へ出力する。この分析情報は、図61に示される信号分析部101に含まれる音環境分析部1210が出力した分析情報に相当する。音環境情報処理部1213は、音環境情報復号部1212から入力された分析情報に基づいて、復号信号の制御を行う。この制御の方法は、制御の目的によって異なる。例えば、第二の実施の形態と同様に、背景音を抑圧する制御を行ってもよい。また、個々の構成要素に利得を与えて強調・減衰させ、位相を変化させて定位を修正することも可能である。
以上、入力信号に含まれる構成要素が複数ある場合、本発明を適用し、本発明の第一の実施の形態における効果を得ることができる。
以上、本発明の第一の実施の形態を、入力信号に含まれる構成要素が複数ある場合に適用される構成を例に説明してきた。第二の実施の形態から第十一の実施の形態に対しても、同様に信号分析部および信号制御部または出力信号生成部を変更してもよい。また、第五の実施の形態から第八の実施の形態の構成のように、各構成要素の出力を複数のチャンネルから構成される出力信号に定位させる制御を行ってもよい。
さらに、入力信号のチャンネル数が複数である場合は、本発明の信号分析部101における分析の方法として、指向性制御、ビームフォーミング(Beamforming)、ブラインド信号源分離(Blind Source Separation)や、独立成分分析(Independent Component Analysis)と呼ばれる手法を用いてもよい。特に、入力信号のチャンネル数が目的音数より多い場合には、上述の背景音情報の推定方法や第十三の実施の形態における分析の方法を用いず、指向性制御、ビームフォーミング(Beamforming)、ブラインド信号源分離(Blind Source Separation)や、独立成分分析(Independent Component Analysis)のみを用いて、分析を行ってもよい。例えば、指向性制御およびビームフォーミングに関連する技術は、非特許文献12および非特許文献13に開示されている。また、ブラインド信号源分離および独立成分分析の方法に関連する技術は、非特許文献14に開示されている。
<非特許文献12> 2001年、「マイクロホン・アレイズ」、シュプリンガー、(Microphone Arrays, Springer, 2001)
<非特許文献13> 2005年、「スピーチ・エンハンスメント」、シュプリンガー、(Speech Enhancement, Springer, 2005, pp. 229--246)、229ページから246ページ
<非特許文献14> 2005年、「スピーチ・エンハンスメント」、シュプリンガー、(Speech Enhancement, Springer, 2005, pp. 271 - 369)、271ページから369ページ
上述の分析方法を用いる場合、本発明の第一の実施の形態には、図1に示される構成が適用される。さらに、信号分析部101の構成、信号制御部151の構成、信号分析部101が多重化部102へ出力する情報、および、分離部152から信号制御部151に送られる情報について詳細に説明する。入力信号は複数チャンネルの信号である。基本的な動作は、第一の実施の形態の動作と同様であり、図1と重複するので説明は省略する。
図63を参照して、信号分析部101の第三の構成例を詳細に説明する。信号分析部101の第三の構成例は、入力信号のチャンネル数が複数である場合に対応している。本構成例の信号分析部101は、入力信号の分析の方法として、独立成分分析を用いる。本構成例の信号分析部101は、入力信号に含まれる各音源に対応した構成要素を分離するためのフィルタ係数を分析情報として出力する。
信号分析部101は、信号分離分析部1200と分離フィルタ符号化部とから構成されている。信号分離分析部1200は、独立成分分析により、分離フィルタ係数を算出する。分離フィルタ係数は、入力信号に含まれる各音源に対応した構成要素の信号分離を行うために用いられるフィルタ係数である。そして、信号分離分析部1200は、分離フィルタ係数を分離フィルタ符号化部1201へ出力する。分離フィルタ符号化部1201は、信号分離分析部1200から入力された分離フィルタ係数を符号化する。分離フィルタ符号化部1201は、符号化分離フィルタ係数を分析情報として出力する。
図64を参照して、信号制御部151の第三の構成例を詳細に説明する。信号制御部151の第三の構成例は、入力信号のチャンネル数が複数である場合に対応している。
信号制御部151は、分離フィルタ復号部1202とフィルタ1203とから構成されている。分離フィルタ復号部1202は、分離部152から符号化された分離フィルタ係数を分析情報として受信する。そして、分離フィルタ復号部1202は、符号化分離フィルタ係数を復号し、分離フィルタ係数をフィルタ1203へ出力する。フィルタ1203は、復号部150から複数チャンネルの復号信号を受信し、分離フィルタ復号部1202から分離フィルタ係数を受信する。そして、フィルタ1203は、複数チャンネルの復号信号に対し、分離フィルタ係数に基づくフィルタ処理を行う。フィルタ1203は、各音源に対応した構成要素の信号が分離された信号を出力する。
以上説明したとおり、入力信号のチャンネル数が複数である場合、本発明の信号分析制御システムは、入力信号の分析を送信部で行っている。この構成により、入力信号のチャンネル数が複数である場合にも、送信部での信号分析情報に基づいて、受信部で複数音源から構成される入力信号を各音源に対応した構成要素ごとに制御することができる。さらに、送信部で信号の分析を行うので、受信部は信号分析に係る演算量を削減することが出来る。
また、図63及び図64に示された構成例は、入力信号の分析情報として分離フィルタの係数を用いたが、第一の実施の形態から第十一の実施の形態において用いた分析情報を用いてもよい。そのためには、図63に示される信号分離分析部1200は、分離フィルタ係数を算出し、分離フィルタを用いた信号分離を行う構成にすればよい。それにより、分離フィルタ符号化部1201は、図61に示される音環境情報符号化部1211で構成される。
さらに、信号分析部101における入力信号の分析の方法としては、独立成分分析だけでなく、非特許文献12乃至15に開示されている方法を用いてもよい。また、これらの分析の方法を、本発明の第一の実施の形態乃至第十一の実施の形態における分析の方法に組み合わせて用いてもよい。さらに、分析の方法によっては、分析の途中で、出力すべき分析結果、または、出力すべき分析結果に容易に変換可能な信号が得られる。その場合は、分析を最後まで行わずに分析結果を出力するように分析の処理を変更してもよい。
図65を参照して、本発明の第十二の実施の形態を説明する。第一の実施の形態乃至第十一の実施の形態まで、一方向通信のみを考慮してきた。すなわち、端末に内蔵された送信部から、別の端末に内蔵された受信部との間での通信について説明してきた。第十二の実施の形態は、双方向の通信を考慮し、一台の送受信端末に本発明を適用した送信部と受信部の両方を内蔵しているものである。ここで送信部と受信部の両方を内蔵する本発明を適応した端末としては、第一の実施の形態乃至第十一の実施の形態のいずれかの送信部および受信部を組み合わせて用いてもよい。本発明の第十二の実施の形態では、送信部と受信部の両方を持つことにより、テレビ会議端末や携帯電話などの双方向通信に利用した際に、本発明の効果が得られる。
放送など、一方向の音声通信が行われる場合にも本発明の信号分析制御システムを適用することができる。放送局の送信端末は、例えば、少なくとも図1に示される送信部10を有すればよい。放送局とは、放送免許を持つ放送局のみならず、多地点テレビ会議のメイン会場など、音声を送信し、受信をほとんど行わない地点を含む。この場合の送信端末には、本発明の第二の実施の形態乃至第十一の実施の形態における送信部のいずれを用いてもよい。
また、受信のみを行う地点においても、本発明の信号分析制御システムを適用することができる。受信のみを行う地点における受信端末では、例えば、少なくとも図1に示される受信部15を有すればよい。この受信端末には、本発明の第二の実施の形態乃至第十一の実施の形態における受信部のいずれを用いてもよい。
さらに、図66を参照して、本発明の第十三の実施の形態に基づく信号処理装置を詳細に説明する。本発明の第十三の実施の形態は、プログラム制御により動作するコンピュータ1300、1301から構成される。コンピュータは、中央処理装置、プロセッサ、データ処理装置のいずれでもよい。
コンピュータ1300は、第一の実施の形態乃至第十二の実施の形態のいずれかに係る処理を行い、入力信号を受け伝送信号を出力するためのプログラムに基づき動作する。一方、コンピュータ1301は、第一の実施の形態乃至第十二の実施の形態のいずれかに係る処理を行い、伝送信号を受け、出力信号を出力するためのプログラムに基づき動作する。なお、第十二の実施の形態で説明した送信部および受信部を両方もつ場合、送信処理と受信処理を同一のコンピュータを用いて処理を実行してもよい。
上記で説明してきた第一の実施の形態乃至第十三の実施の形態では、送信部、伝送路、受信部の動作として説明してきたが、それぞれ、録音部、蓄積媒体、再生部と置き換えてもよい。たとえば、図1に示す送信部10は、伝送信号をビットストリームとして蓄積媒体に出力し、蓄積媒体にビットストリームを記録してもよい。また、受信部15は、蓄積媒体に記録されているビットストリームを取出し、ビットストリームを復号して処理を行うことにより出力信号を生成してもよい。
以上の如く、本発明の第1の態様は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、前記信号と前記分析情報とを多重化して多重化信号を生成することを特徴とする信号分析方法である。
第2の態様は、上記態様において、前記補正値は、前記構成要素制御情報の下限値であることを特徴とする。
第3の態様は、上記態様において、前記補正値は、前記構成要素制御情報の上限値であることを特徴とする。
第4の態様は、上記態様において、前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする。
第5の態様は、上記態様において、前記構成要素制御情報は、前記背景信号を抑圧する抑圧係数を含むことを特徴とする。
第6の態様は、上記態様において、前記構成要素制御情報は、信号対背景信号比を含むことを特徴とする。
第7の態様は、上記態様において、前記構成要素制御情報は、推定背景信号を含むことを特徴とする。
第8の態様は、上記態様において、前記分析情報は主信号存在確率を含むことを特徴とする。
第9の態様は、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号を受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記補正値に基づいて前記構成要素制御情報を補正し、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御することを特徴とする信号制御方法である。
第10の態様は、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号と構成要素レンダリング情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正し、前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御することを特徴とする信号制御方法である。
第11の態様は、上記態様において、前記補正値は、前記構成要素制御情報の下限値であることを特徴とする。
第12の態様は、上記態様において、前記補正値は、前記構成要素制御情報の上限値であることを特徴とする。
第13の態様は、上記態様において、さらに信号制御情報を受け、前記補正値を修正し、前記修正された補正値に基づいて前記構成要素制御情報を補正することを特徴とする。
第14の態様は、上記態様において、前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする。
第15の態様は、上記態様において、前記構成要素制御情報は、抑圧係数を含むことを特徴とする。
第16の態様は、上記態様において、前記構成要素制御情報は、信号対背景音比を含むことを特徴とする。
第17の態様は、上記態様において、前記構成要素制御情報は、推定背景音を含むことを特徴とする。
第18の態様は、上記態様において、前記分析情報は主信号存在確率を含むことを特徴とする。
第19の態様は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、前記信号と前記分析情報とを多重化して多重化信号を生成し、前記多重化信号を受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記補正値に基づいて前記構成要素制御情報を補正し、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御することを特徴とする信号分析制御方法である。
第20の態様は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、前記信号と前記分析情報とを多重化して多重化信号を生成し、前記多重化信号と構成要素レンダリング情報とを受け、前記多重化信号から前記信号と前記分析情報とを生成し、前記補正値に基づいて前記構成要素制御情報を補正し、前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御することを特徴とする信号分析制御方法である。
第21の態様は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部とを含むことを特徴とする信号分析装置である。
第22の態様は、上記態様において、前記補正値は、前記構成要素制御情報の下限値であることを特徴とする。
第23の態様は、上記態様において、前記補正値は、前記構成要素制御情報の上限値であることを特徴とする。
第24の態様は、上記態様において、前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする。
第25の態様は、上記態様において、前記構成要素制御情報は、前記背景信号を抑圧する抑圧係数を含むことを特徴とする。
第26の態様は、上記態様において、前記構成要素制御情報は、信号対背景信号比を含むことを特徴とする。
第27の態様は、上記態様において、前記構成要素制御情報は、推定背景信号を含むことを特徴とする。
第28の態様は、上記態様において、前記分析情報は主信号存在確率を含むことを特徴とする。
第29の態様は、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御部と、を含むことを特徴とする信号制御装置である。
第30の態様は、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、構成要素レンダリング情報を受け、前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御部と、を含むことを特徴とする信号制御装置である。
第31の態様は、上記態様において、前記補正値は、前記構成要素制御情報の下限値であることを特徴とする。
第32の態様は、上記態様において、前記補正値は、前記構成要素制御情報の上限値であることを特徴とする。
第33の態様は、上記態様において、構成要素制御情報補正部は、さらに信号制御情報を受け、前記補正値を修正し、前記修正された補正値に基づいて前記構成要素制御情報を補正することを特徴とする。
第34の態様は、上記態様において、前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする。
第35の態様は、上記態様において、前記構成要素制御情報は、抑圧係数を含むことを特徴とする。
第36の態様は、上記態様において、前記構成要素制御情報は、信号対背景音比を含むことを特徴とする。
第37の態様は、上記態様において、前記構成要素制御情報は、推定背景音を含むことを特徴とする。
第38の態様は、上記態様において、前記分析情報は主信号存在確率を含むことを特徴とする。
第39の態様は、信号分析装置と信号制御装置とを含む信号分析制御システムであって、前記信号分析装置は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と、を含み、前記信号制御装置は、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御部と、を含むことを特徴とする信号分析制御システムである。
第40の態様は、信号分析装置と信号制御装置とを含む信号分析制御システムであって、前記信号分析装置は、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と、を含み、前記信号制御装置は、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、構成要素レンダリング情報を受け、前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御部と、を含むことを特徴とする信号分析制御システムである。
第41の態様は、コンピュータに、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、を実行させることを特徴とする信号分析プログラムである。
第42の態様は、前記補正値は、前記構成要素制御情報の下限値であることを特徴とする。
第43の態様は、上記態様において、前記補正値は、前記構成要素制御情報の上限値であることを特徴とする。
第44の態様は、上記態様において、前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする。
第45の態様は、上記態様において、前記構成要素制御情報は、前記背景信号を抑圧する抑圧係数を含むことを特徴とする。
第46の態様は、上記態様において、前記構成要素制御情報は、信号対背景信号比を含むことを特徴とする。
第47の態様は、上記態様において、前記構成要素制御情報は、推定背景信号を含むことを特徴とする。
第48の態様は、上記態様において、前記分析情報は主信号存在確率を含むことを特徴とする。
第49の態様は、コンピュータに、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御処理と、を実行させることを特徴とする信号制御プログラムである。
第50の態様は、コンピュータに、複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、構成要素レンダリング情報を受け、前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御処理と、を実行させることを特徴とする信号制御プログラムである。
第51の態様は、上記態様において、前記補正値は、前記構成要素制御情報の下限値であることを特徴とする。
第52の態様は、上記態様において、前記補正値は、前記構成要素制御情報の上限値であることを特徴とする。
第53の態様は、上記態様において、構成要素制御情報補正処理は、さらに信号制御情報を受け、前記補正値を修正し、前記修正された補正値に基づいて前記構成要素制御情報を補正することを特徴とする。
第54の態様は、上記態様において、前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする。
第55の態様は、上記態様において、前記構成要素制御情報は、抑圧係数を含むことを特徴とする。
第56の態様は、上記態様において、前記構成要素制御情報は、信号対背景音比を含むことを特徴とする。
第57の態様は、上記態様において、前記構成要素制御情報は、推定背景音を含むことを特徴とする。
第58の態様は、上記態様において、前記分析情報は主信号存在確率を含むことを特徴とする。
第59の態様は、コンピュータに、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御処理と、を実行させることを特徴とする信号分析制御プログラムである。
第60の態様は、コンピュータに、複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、構成要素レンダリング情報を受け、前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御処理と、を実行させることを特徴とする信号分析制御プログラムである。
以上好ましい実施の形態、実施例及び態様をあげて本発明を説明したが、本発明は必ずしも上記実施の形態及び実施の形態に限定されるものではなく、その技術的思想の範囲内において様々に変形し実施することが出来る。
本出願は、2008年1月11日に出願された日本出願特願2008−3933号を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明によれば、信号分析又は制御を行う装置、信号分析又は制御をコンピュータに実現するためのプログラムといった用途に適用できる。

Claims (60)

  1. 複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、
    前記信号と前記分析情報とを多重化して多重化信号を生成することを特徴とする信号分析方法。
  2. 前記補正値は、前記構成要素制御情報の下限値であることを特徴とする請求項1に記載の信号分析方法。
  3. 前記補正値は、前記構成要素制御情報の上限値であることを特徴とする請求項1に記載の信号分析方法。
  4. 前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする請求項1乃至3のいずれか1項に記載の信号分析方法。
  5. 前記構成要素制御情報は、前記背景信号を抑圧する抑圧係数を含むことを特徴とする請求項4に記載の信号分析方法。
  6. 前記構成要素制御情報は、信号対背景信号比を含むことを特徴とする請求項4に記載の信号分析方法。
  7. 前記構成要素制御情報は、推定背景信号を含むことを特徴とする請求項4に記載の信号分析方法。
  8. 前記分析情報は主信号存在確率を含むことを特徴とする請求項1乃至7のいずれか1項に記載の信号制御方法。
  9. 複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号を受け、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記補正値に基づいて前記構成要素制御情報を補正し、
    前記補正された構成要素制御情報に基づき前記信号の構成要素を制御することを特徴とする信号制御方法。
  10. 複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号と構成要素レンダリング情報とを受け、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正し、
    前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御することを特徴とする信号制御方法。
  11. 前記補正値は、前記構成要素制御情報の下限値であることを特徴とする請求項9または10のいずれかに記載の信号制御方法。
  12. 前記補正値は、前記構成要素制御情報の上限値であることを特徴とする請求項9または10のいずれかに記載の信号制御方法。
  13. さらに信号制御情報を受け、前記補正値を修正し、
    前記修正された補正値に基づいて前記構成要素制御情報を補正することを特徴とする請求項9乃至12に記載の信号制御方法。
  14. 前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする請求項9乃至13のいずれか1項に記載の信号制御方法。
  15. 前記構成要素制御情報は、抑圧係数を含むことを特徴とする請求項14に記載の信号制御方法。
  16. 前記構成要素制御情報は、信号対背景音比を含むことを特徴とする請求項14に記載の信号制御方法。
  17. 前記構成要素制御情報は、推定背景音を含むことを特徴とする請求項14に記載の信号制御方法。
  18. 前記分析情報は主信号存在確率を含むことを特徴とする請求項9乃至17のいずれか1項に記載の信号制御方法。
  19. 複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、
    前記信号と前記分析情報とを多重化して多重化信号を生成し、
    前記多重化信号を受け、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記補正値に基づいて前記構成要素制御情報を補正し、
    前記補正された構成要素制御情報に基づき前記信号の構成要素を制御することを特徴とする信号分析制御方法。
  20. 複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成し、
    前記信号と前記分析情報とを多重化して多重化信号を生成し、
    前記多重化信号と構成要素レンダリング情報とを受け、
    前記多重化信号から前記信号と前記分析情報とを生成し、
    前記補正値に基づいて前記構成要素制御情報を補正し、
    前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御することを特徴とする信号分析制御方法。
  21. 複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、
    前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と、
    を含むことを特徴とする信号分析装置。
  22. 前記補正値は、前記構成要素制御情報の下限値であることを特徴とする請求項21に記載の信号分析装置。
  23. 前記補正値は、前記構成要素制御情報の上限値であることを特徴とする請求項21に記載の信号分析装置。
  24. 前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする請求項20乃至23のいずれか1項に記載の信号分析装置。
  25. 前記構成要素制御情報は、前記背景信号を抑圧する抑圧係数を含むことを特徴とする請求項24に記載の信号分析装置。
  26. 前記構成要素制御情報は、信号対背景信号比を含むことを特徴とする請求項24に記載の信号分析装置。
  27. 前記構成要素制御情報は、推定背景信号を含むことを特徴とする請求項24に記載の信号分析装置。
  28. 前記分析情報は主信号存在確率を含むことを特徴とする請求項21乃至27のいずれか1項に記載の信号分析。
  29. 複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、
    前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御部と、
    を含むことを特徴とする信号制御装置。
  30. 複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、
    構成要素レンダリング情報を受け、前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御部と、
    を含むことを特徴とする信号制御装置。
  31. 前記補正値は、前記構成要素制御情報の下限値であることを特徴とする請求項29または30のいずれかに記載の信号制御装置。
  32. 前記補正値は、前記構成要素制御情報の上限値であることを特徴とする請求項29または30のいずれかに記載の信号制御装置。
  33. 構成要素制御情報補正部は、さらに信号制御情報を受け、前記補正値を修正し、前記修正された補正値に基づいて前記構成要素制御情報を補正することを特徴とする請求項29乃至32に記載の信号制御装置。
  34. 前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする請求項29乃至33のいずれか1項に記載の信号制御装置。
  35. 前記構成要素制御情報は、抑圧係数を含むことを特徴とする請求項34に記載の信号制御装置。
  36. 前記構成要素制御情報は、信号対背景音比を含むことを特徴とする請求項34に記載の信号制御装置。
  37. 前記構成要素制御情報は、推定背景音を含むことを特徴とする請求項34に記載の信号制御装置。
  38. 前記分析情報は主信号存在確率を含むことを特徴とする請求項29乃至37のいずれか1項に記載の信号制御装置。
  39. 信号分析装置と信号制御装置とを含む信号分析制御システムであって、
    前記信号分析装置は、
    複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、
    前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と、
    を含み、前記信号制御装置は、
    前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、
    前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御部と、
    を含むことを特徴とする信号分析制御システム。
  40. 信号分析装置と信号制御装置とを含む信号分析制御システムであって、
    前記信号分析装置は、
    複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析部と、
    前記信号と前記分析情報とを多重化して多重化信号を生成する多重化部と、
    を含み、前記信号制御装置は、
    前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離部と、
    前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正部と、
    構成要素レンダリング情報を受け、前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御部と、
    を含むことを特徴とする信号分析制御システム。
  41. コンピュータに、
    複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、
    前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、
    を実行させることを特徴とする信号分析プログラム。
  42. 前記補正値は、前記構成要素制御情報の下限値であることを特徴とする請求項41に記載の信号分析プログラム。
  43. 前記補正値は、前記構成要素制御情報の上限値であることを特徴とする請求項41に記載の信号分析プログラム。
  44. 前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする請求項41乃至43のいずれか1項に記載の信号分析プログラム。
  45. 前記構成要素制御情報は、前記背景信号を抑圧する抑圧係数を含むことを特徴とする請求項44に記載の信号分析プログラム。
  46. 前記構成要素制御情報は、信号対背景信号比を含むことを特徴とする請求項44に記載の信号分析プログラム。
  47. 前記構成要素制御情報は、推定背景信号を含むことを特徴とする請求項44に記載の信号分析プログラム。
  48. 前記分析情報は主信号存在確率を含むことを特徴とする請求項41乃至47のいずれか1項に記載の信号分析プログラム。
  49. コンピュータに、
    複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、
    前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御処理と、
    を実行させることを特徴とする信号制御プログラム。
  50. コンピュータに、
    複数の構成要素を含む信号と前記信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報とを含む多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記分析情報に含まれる前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、
    構成要素レンダリング情報を受け、前記補正された前記構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御処理と、
    を実行させることを特徴とする信号制御プログラム。
  51. 前記補正値は、前記構成要素制御情報の下限値であることを特徴とする請求項49または50のいずれかに記載の信号制御プログラム。
  52. 前記補正値は、前記構成要素制御情報の上限値であることを特徴とする請求項49または50のいずれかに記載の信号制御プログラム。
  53. 構成要素制御情報補正処理は、さらに信号制御情報を受け、前記補正値を修正し、前記修正された補正値に基づいて前記構成要素制御情報を補正することを特徴とする請求項49乃至52に記載の信号制御プログラム。
  54. 前記複数の構成要素は、主信号と背景信号とを含むことを特徴とする請求項49乃至53のいずれか1項に記載の信号制御プログラム。
  55. 前記構成要素制御情報は、抑圧係数を含むことを特徴とする請求項46に記載の信号制御プログラム。
  56. 前記構成要素制御情報は、信号対背景音比を含むことを特徴とする請求項46に記載の信号制御プログラム。
  57. 前記構成要素制御情報は、推定背景音を含むことを特徴とする請求項46に記載の信号制御プログラム。
  58. 前記分析情報は主信号存在確率を含むことを特徴とする請求項49乃至57のいずれか1項に記載の信号制御プログラム。
  59. コンピュータに、
    複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、
    前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、
    前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、
    前記補正された構成要素制御情報に基づき前記信号の構成要素を制御する信号制御処理と、
    を実行させることを特徴とする信号分析制御プログラム。
  60. コンピュータに、
    複数の構成要素を含む信号の構成要素を制御するための構成要素制御情報と前記構成要素制御情報を補正する補正値とを含む分析情報を生成する信号分析処理と、
    前記信号と前記分析情報とを多重化して多重化信号を生成する多重化処理と、
    前記多重化信号から前記信号と前記分析情報とを生成する多重化信号分離処理と、
    前記補正値に基づいて前記構成要素制御情報を補正する構成要素制御情報補正処理と、
    構成要素レンダリング情報を受け、前記補正された構成要素制御情報と前記構成要素レンダリング情報とに基づき前記信号の構成要素を制御する信号制御処理と、
    を実行させることを特徴とする信号分析制御プログラム。
JP2009548889A 2008-01-11 2008-12-26 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム Pending JPWO2009087923A1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2008003933 2008-01-11
JP2008003933 2008-01-11
PCT/JP2008/073698 WO2009087923A1 (ja) 2008-01-11 2008-12-26 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム

Publications (1)

Publication Number Publication Date
JPWO2009087923A1 true JPWO2009087923A1 (ja) 2011-05-26

Family

ID=40853046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009548889A Pending JPWO2009087923A1 (ja) 2008-01-11 2008-12-26 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム

Country Status (5)

Country Link
US (1) US20100283536A1 (ja)
EP (1) EP2242046A4 (ja)
JP (1) JPWO2009087923A1 (ja)
CN (1) CN101911183A (ja)
WO (1) WO2009087923A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8509092B2 (en) * 2008-04-21 2013-08-13 Nec Corporation System, apparatus, method, and program for signal analysis control and signal control
US20130246060A1 (en) * 2010-11-25 2013-09-19 Nec Corporation Signal processing device, signal processing method and signal processing program
US9538286B2 (en) 2011-02-10 2017-01-03 Dolby International Ab Spatial adaptation in multi-microphone sound capture

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222789A (ja) * 1992-10-21 1994-08-12 Sextant Avionique 音声検出方法
JP2001526414A (ja) * 1997-12-12 2001-12-18 クゥアルコム・インコーポレイテッド ボコーダにより制御されるagcを有するオーディオコーデック
WO2002080148A1 (fr) * 2001-03-28 2002-10-10 Mitsubishi Denki Kabushiki Kaisha Dispositif eliminateur de bruit
JP2004514179A (ja) * 2000-11-14 2004-05-13 コーディング テクノロジーズ アクチボラゲット 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
JP2004163696A (ja) * 2002-11-13 2004-06-10 Sony Corp 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
JP2006211255A (ja) * 2005-01-27 2006-08-10 Sony Corp 情報処理装置および回収基板
JP2006337415A (ja) * 2005-05-31 2006-12-14 Nec Corp 雑音抑圧の方法及び装置
JP2007094388A (ja) * 2005-09-26 2007-04-12 Samsung Electronics Co Ltd 音声区間検出装置及び音声区間検出方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08102687A (ja) * 1994-09-29 1996-04-16 Yamaha Corp 音声送受信方式
US7415120B1 (en) * 1998-04-14 2008-08-19 Akiba Electronics Institute Llc User adjustable volume control that accommodates hearing
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
JP4282227B2 (ja) 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
US7630396B2 (en) * 2004-08-26 2009-12-08 Panasonic Corporation Multichannel signal coding equipment and multichannel signal decoding equipment
JP4836720B2 (ja) * 2006-09-07 2011-12-14 株式会社東芝 ノイズサプレス装置
JP5394931B2 (ja) * 2006-11-24 2014-01-22 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の復号化方法及びその装置
KR20080082917A (ko) * 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06222789A (ja) * 1992-10-21 1994-08-12 Sextant Avionique 音声検出方法
JP2001526414A (ja) * 1997-12-12 2001-12-18 クゥアルコム・インコーポレイテッド ボコーダにより制御されるagcを有するオーディオコーデック
JP2004514179A (ja) * 2000-11-14 2004-05-13 コーディング テクノロジーズ アクチボラゲット 適応ろ波による高周波復元符号化方法の知覚性能の強化方法
WO2002080148A1 (fr) * 2001-03-28 2002-10-10 Mitsubishi Denki Kabushiki Kaisha Dispositif eliminateur de bruit
JP2004163696A (ja) * 2002-11-13 2004-06-10 Sony Corp 音楽情報符号化装置及び方法、音楽情報復号装置及び方法、並びにプログラム及び記録媒体
JP2006211255A (ja) * 2005-01-27 2006-08-10 Sony Corp 情報処理装置および回収基板
JP2006337415A (ja) * 2005-05-31 2006-12-14 Nec Corp 雑音抑圧の方法及び装置
JP2007094388A (ja) * 2005-09-26 2007-04-12 Samsung Electronics Co Ltd 音声区間検出装置及び音声区間検出方法

Also Published As

Publication number Publication date
EP2242046A4 (en) 2013-10-30
US20100283536A1 (en) 2010-11-11
EP2242046A1 (en) 2010-10-20
WO2009087923A1 (ja) 2009-07-16
CN101911183A (zh) 2010-12-08

Similar Documents

Publication Publication Date Title
JP5773124B2 (ja) 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
JP4944029B2 (ja) オーディオデコーダおよびオーディオ信号の復号方法
JP5302980B2 (ja) 複数の入力データストリームのミキシングのための装置
JP5292498B2 (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP5282906B2 (ja) 多地点接続装置、信号分析及び装置と、その方法及びプログラム
WO2010005050A1 (ja) 信号分析装置、信号制御装置及びその方法と、プログラム
KR20080039445A (ko) 멀티 채널 음향 신호 처리 장치
JP5668923B2 (ja) 信号分析制御システム及びその方法と、信号制御装置及びその方法と、プログラム
WO2009157213A1 (ja) 音響信号復号装置および音響信号復号装置におけるバランス調整方法
WO2009087923A1 (ja) 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム
JP5556175B2 (ja) 信号分析装置と、信号制御装置と、そのシステム、方法及びプログラム
JP2006337767A (ja) 低演算量パラメトリックマルチチャンネル復号装置および方法
KR101077437B1 (ko) Stfd용 헤드셋에서의 음질 개선 시스템 및 그 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110901

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131028

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140402