JP2019537751A

JP2019537751A - 可変閾値を使用してオーディオ信号を分解するための装置および方法

Info

Publication number: JP2019537751A
Application number: JP2019526480A
Authority: JP
Inventors: アダミ・アレクサンダー; ハル・ユルゲン; ディッシュ・ザシャ; ギド・フロリン
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2016-11-17
Filing date: 2017-11-16
Publication date: 2019-12-26
Anticipated expiration: 2037-11-16
Also published as: KR20190082928A; JP6911117B2; US11869519B2; EP3324406A1; BR112019009952A2; CN110114827B; CA3043961A1; ES2837007T3; WO2018091618A1; RU2734288C1; KR102391041B1; EP3542361A1; MX2019005738A; US20190272836A1; US11158330B2; US20210295854A1; EP3542361B1; CN110114827A; CA3043961C

Abstract

オーディオ信号を背景成分信号と前景成分信号に分解するための装置であって、オーディオ信号値のブロックの時間シーケンスを生成するためのブロック生成器（１１０）と、オーディオ信号の現在のブロックの特性を決定し、ブロックのシーケンスの少なくとも２つのブロックを含むブロックのグループ内の特性の変動を決定するためのオーディオ信号分析器（１２０）と、現在のブロックを背景部分（１４０）と前景部分（１５０）に分離するための分離器（１３０）であって、分離器（１３０）は、現在のブロックの特性が分離閾値と所定の関係にあるとき、変動に基づいて分離閾値を決定して（１８２）現在のブロックを背景成分信号（１４０）と前景成分信号（１５０）に分離する分離器（１３０）とを備える。

Description

本発明は、オーディオ処理に関し、具体的には、オーディオ信号の背景成分信号と前景成分信号への分解に関する。

オーディオ信号処理を対象とした多量の参考文献が存在し、これらの参考文献のいくつかは、オーディオ信号分解に関する。例示的な参考文献は、以下の通りである。

［１］Ｓ．ＤｉｓｃｈａｎｄＡ．Ｋｕｎｔｚ，ＡＤｅｄｉｃａｔｅｄＤｅｃｏｒｒｅｌａｔｏｒｆｏｒＰａｒａｍｅｔｒｉｃＳｐａｔｉａｌＣｏｄｉｎｇｏｆＡｐｐｌａｕｓｅ−ＬｉｋｅＡｕｄｉｏＳｉｇｎａｌｓ．Ｓｐｒｉｎｇｅｒ−Ｖｅｒｌａｇ，Ｊａｎｕａｒｙ２０１２，ｐｐ．３５５−３６３

［２］Ａ．Ｋｕｎｔｚ，Ｓ．Ｄｉｓｃｈ，Ｔ．Ｂａｅｃｋｓｔｒｏｅｍ，ａｎｄＪ．Ｒｏｂｉｌｌｉａｒｄ，“ＴｈｅＴｒａｎｓｉｅｎｔＳｔｅｅｒｉｎｇＤｅｃｏｒｒｅｌａｔｏｒＴｏｏｌｉｎｔｈｅＵｐｃｏｍｉｎｇＭＰＥＧＵｎｉｆｉｅｄＳｐｅｅｃｈａｎｄＡｕｄｉｏＣｏｄｉｎｇＳｔａｎｄａｒｄ，” ｉｎ１３１ｓｔＣｏｎｖｅｎｔｉｏｎｏｆｔｈｅＡＥＳ，ＮｅｗＹｏｒｋ，ＵＳＡ，２０１１

［３］Ａ．Ｗａｌｔｈｅｒ，Ｃ．Ｕｈｌｅ，ａｎｄＳ．Ｄｉｓｃｈ，“ＵｓｉｎｇＴｒａｎｓｉｅｎｔＳｕｐｐｒｅｓｓｉｏｎｉｎＢｌｉｎｄＭｕｌｔｉ−ｃｈａｎｎｅｌＵｐｍｉｘＡｌｇｏｒｉｔｈｍｓ，” ｉｎＰｒｏｃｅｅｄｉｎｇｓ，１２２ｎｄＡＥＳＰｒｏＡｕｄｉｏＥｘｐｏａｎｄＣｏｎｖｅｎｔｉｏｎ，Ｍａｙ２００７

［４］Ｇ．Ｈｏｔｈｏ，Ｓ．ｖａｎｄｅＰａｒ，ａｎｄＪ．Ｂｒｅｅｂａａｒｔ，“Ｍｕｌｔｉｃｈａｎｎｅｌｃｏｄｉｎｇｏｆａｐｐｌａｕｓｅｓｉｇｎａｌｓ”，ＥＵＲＡＳＩＰＪ．Ａｄｖ．ＳｉｇｎａｌＰｒｏｃｅｓｓ，ｖｏｌ．２００８，Ｊａｎ．２００８．［Ｏｎｌｉｎｅ］．Ａｖａｉｌａｂｌｅ：ｈｔｔｐ：／／ｄｘ．ｄｏｉ．ｏｒｇ／１０．１１５５／２００８／５３１６９

［５］Ｄ．ＦｉｔｚＧｅｒａｌｄ，“Ｈａｒｍｏｎｉｃ／ＰｅｒｃｕｓｓｉｖｅＳｅｐａｒａｔｉｏｎＵｓｉｎｇＭｅｄｉａｎＦｉｌｔｅｒｉｎｇ，” ｉｎＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１３ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＤｉｇｉｔａｌＡｕｄｉｏＥｆｆｅｃｔｓ（ＤＡＦｘ−１０），Ｇｒａｚ，Ａｕｓｔｒｉａ，２０１０

［６］Ｊ．Ｐ．Ｂｅｌｌｏ，Ｌ．Ｄａｕｄｅｔ，Ｓ．Ａｂｄａｌｌａｈ，Ｃ．Ｄｕｘｂｕｒｙ，Ｍ．Ｄａｖｉｅｓ，ａｎｄＭ．Ｂ．Ｓａｎｄｌｅｒ，“ＡＴｕｔｏｒｉａｌｏｎＯｎｓｅｔＤｅｔｅｃｔｉｏｎｉｎＭｕｓｉｃＳｉｇｎａｌｓ，” ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＳｐｅｅｃｈａｎｄＡｕｄｉｏＰｒｏｃｅｓｓｉｎｇ，ｖｏｌ．１３，ｎｏ．５，ｐｐ．１０３５−１０４７，２００５

［７］Ｍ．ＧｏｔｏａｎｄＹ．Ｍｕｒａｏｋａ，“Ｂｅａｔｔｒａｃｋｉｎｇｂａｓｅｄｏｎｍｕｌｔｉｐｌｅ−ａｇｅｎｔａｒｃｈｉｔｅｃｔｕｒｅ − ａｒｅａｌ−ｔｉｍｅｂｅａｔｔｒａｃｋｉｎｇｓｙｓｔｅｍｆｏｒａｕｄｉｏｓｉｇｎａｌｓ，” ｉｎＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２ｎｄＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＭｕｌｔｉａｇｅｎｔＳｙｓｔｅｍｓ，１９９６，ｐｐ．１０３−１１０

［８］Ａ．Ｋｌａｐｕｒｉ，“Ｓｏｕｎｄｏｎｓｅｔｄｅｔｅｃｔｉｏｎｂｙａｐｐｌｙｉｎｇｐｓｙｃｈｏａｃｏｕｓｔｉｃｋｎｏｗｌｅｄｇｅ，” ｉｎＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ），ｖｏｌ．６，１９９９，ｐｐ．３０８９−３０９２ｖｏｌ．６。

さらに、国際公開第２０１０／０１７９６７号パンフレットは、入力オーディオ信号を前景信号部である第１の分解された信号と背景信号部である第２の分解された信号に分解するための意味デコンポーザ（ｓｅｍａｎｔｉｃｄｅｃｏｍｐｏｓｅｒ）を備える、入力オーディオ信号に基づいて空間出力マルチチャネルオーディオ信号を決定するための装置を開示している。さらに、レンダラは、振幅パンニングを使用して前景信号部分をレンダリングし、無相関化によって背景信号部分をレンダリングするように構成される。最後に、第１のレンダリングされた信号および第２のレンダリングされた信号は、空間出力マルチチャネルオーディオ信号を得るために処理される。

さらに、参考文献［１］および［２］は、過渡ステアリングデコリレータ（ｔｒａｎｓｉｅｎｔｓｔｅｅｒｉｎｇｄｅｃｏｒｒｅｌａｔｏｒ）を開示している。

まだ公開されていないヨーロッパ出願第１６１５６２００．４号は、高分解能エンベロープ処理を開示している。高分解能エンベロープ処理は、主に拍手、雨滴の音などの多数の密集した過渡事象からなる信号の改良されたコーディングのためのツールである。エンコーダ側では、ツールは、入力信号を分析し、過渡事象の高周波数部を減衰させ、したがって時間的に平坦化し、ステレオ信号では１〜４ｋｂｐｓなどの少量の付加情報を生成することによって、実際の知覚的オーディオコーデックの前に高い時間分解能を有するプリプロセッサとして機能する。デコーダ側では、ツールは、符号化中に生成された付加情報を利用して、過渡事象の高周波数部をブーストし、したがって時間的に整形することによって、オーディオコーデックの後にポストプロセッサとして機能する。

アップミックスは、通常、直接信号部と周囲信号部への信号分解を伴い、直接信号は、ラウドスピーカ間でパンされ、周囲部は、無相関化され、所与の数のチャネルにわたって分散される。周囲信号内にトランジェントのような直接成分が残っていると、アップミックスされたサウンドシーンにおいて結果として知覚される雰囲気が損なわれる。［３］では、周囲信号内で検出されたトランジェントを低減する過渡検出および処理が提案されている。過渡検出のために提案された１つの方法は、ある特定のブロックが抑制されるべきか否かを判定するための、１つの時間ブロックのビンの周波数重み付け合計と重み付けされた長時間移動平均との比較を含む。

［４］では、拍手信号の効率的な空間オーディオコーディングが扱われている。提案されたダウンミックスおよびアップミックス方法はすべて、完全な拍手信号に対して機能する。

さらに、参考文献［５］は、メディアンフィルタを水平方向および垂直方向にスペクトログラムに適用することによって、信号がハーモニックおよびパーカッシブ信号成分に分離されるハーモニック／パーカッシブ分離を開示している。

参考文献［６］は、立ち上がり検出に関するエンベロープフォロワまたはエネルギーフォロワなどの周波数領域手法、時間領域手法を含むチュートリアルを表す。参考文献［７］は、電力の急激な増加などの周波数領域での電力追跡を開示しており、参考文献［８］は、立ち上がり検出を目的とした新規尺度を開示している。

国際公開第２０１０／０１７９６７号パンフレットヨーロッパ出願第１６１５６２００．４号

従来技術の参考文献に記載されているような信号の前景信号部と背景信号部への分離は、そのような既知の手順が結果信号または分解された信号のオーディオ品質を低下させる可能性があるという事実により、不利である。

本発明の目的は、オーディオ信号を背景成分信号と前景成分信号に分解することを目的とした改良された概念を提供することである。

この目的は、請求項１に記載のオーディオ信号を背景成分信号と前景成分信号に分解するための装置、請求項２０に記載のオーディオ信号を背景成分信号と前景成分信号に分解するための方法、または請求項２１に記載のコンピュータプログラムによって達成される。

一態様では、オーディオ信号を背景成分信号と前景成分信号に分解するための装置は、オーディオ信号値のブロックの時間シーケンスを生成するためのブロック生成器と、ブロック生成器に接続されたオーディオ信号分析器と、ブロック生成器およびオーディオ信号分析器に接続された分離器とを備える。第１の態様によれば、オーディオ信号分析器は、オーディオ信号の現在のブロックのブロック特性およびブロックのグループの平均特性を決定するように構成され、ブロックのグループは、先行のブロック、現在のブロックおよび後続のブロック、あるいはさらに先行のブロックまたはさらに後続のブロックなどの少なくとも２つのブロックを含む。

分離器は、現在のブロックのブロック特性と平均特性との比率に応じて、現在のブロックを背景部分と前景部分に分離するように構成される。したがって、背景成分信号は、現在のブロックの背景部分を含み、前景成分信号は、現在のブロックの前景部分を含む。したがって、現在のブロックは、背景または前景として単に判定されるわけではない。代わりに、現在のブロックは、実際には、ゼロ以外の背景部分とゼロ以外の前景部分に分離される。この手順は、典型的には、前景信号が信号に単独では存在せず、常に背景信号成分に結合されるという状況を反映する。したがって、本発明は、この第１の態様によれば、ある特定の閾値処理が実行されるか否かに関わらず、閾値なしで、またはある特定の閾値が比率によって達成されるときのいずれかで実際の分離が行われる場合、前景部分に加えて背景部分が常に残るという状況を反映する。

さらに、分離は、非常に特定的な分離尺度、すなわち、現在のブロックのブロック特性と少なくとも２つのブロックから導出された、すなわち、ブロックのグループから導出された平均特性との比率によって行われる。したがって、ブロックのグループのサイズに応じて、非常にゆっくりと変化する移動平均、または非常に急速に変化する移動平均を設定することができる。ブロックのグループのブロック数が多い場合、移動平均は、比較的ゆっくりと変化し、ブロックのグループのブロック数が少ない場合、移動平均は、非常に急速に変化する。さらに、現在のブロックからの特性とブロックのグループにわたる平均特性との間の関係の使用は、知覚的状況、すなわち、平均に対するこのブロックの特性間の比率がある特定の値にあるとき、個人がある特定のブロックを前景成分を含むものとして知覚する状況を反映する。しかしながら、この態様によれば、このある特定の値は、必ずしも閾値である必要はない。代わりに、比率自体は、現在のブロックの背景部分と前景部分への定量的な分離を実行するためにすでに使用されている可能性がある。比率が高いと、現在のブロックの大部分が前景部分となり、比率が低いと、現在のブロックのほとんどまたはすべてが背景部分に残り、現在のブロックは前景部分が少ないか、または前景部分がまったくないという状況になる。

好ましくは、振幅に関連する特性が決定され、現在のブロックのエネルギーなどのこの振幅に関連する特性は、ブロックのグループの平均エネルギーと比較されて比率を得て、それに基づいて分離が実行される。分離に応じて背景信号が残ることを確実にするために、利得係数が決定され、次にこの利得係数は、ある特定のブロックの平均エネルギーが背景またはノイズ様の信号内にどの程度残っているか、およびどの部分が、例えば、クラップ信号または雨滴信号などのような過渡信号であり得る前景信号部分に入るかを制御する。

第１の態様に加えてまたは第１の態様とは別に使用することができる本発明のさらなる第２の態様では、オーディオ信号を分解するための装置は、ブロック生成器と、オーディオ信号分析器と、分離器とを備える。オーディオ信号分析器は、オーディオ信号の現在のブロックの特性を分析するように構成される。オーディオ信号の現在のブロックの特性は、第１の態様に関して説明したような比率であり得るが、あるいは、平均化なしで現在のブロックからのみ導出されるブロック特性でもあり得る。さらに、オーディオ信号分析器は、ブロックのグループ内の特性の変動を決定するように構成され、ブロックのグループは、少なくとも２つのブロック、好ましくは、現在のブロックを伴うまたは伴わない少なくとも２つの先行のブロック、または現在のブロックを伴うまたは伴わない少なくとも２つの後続のブロック、またはやはり現在のブロックを伴うまたは伴わない少なくとも２つの先行のブロック、少なくとも２つの後続のブロックの両方を含む。好ましい実施形態では、ブロックの数は、３０を超え、さらには４０を超える。

さらに、分離器は、現在のブロックを背景部分と前景部分に分離するように構成され、この分離器は、信号分析器によって決定された変動に基づいて分離閾値を決定し、現在のブロックの特性が分離閾値以上などの分離閾値と所定の関係にあるときに現在のブロックを分離するように構成される。当然、閾値が一種の逆数であると定義されている場合、所定の関係は、より小さい関係またはより小さいもしくは等しい関係であり得る。したがって、閾値処理は、特性が分離閾値との所定の関係内にあるとき、背景部分と前景部分への分離が実行されるように常に実行され、特性が分離閾値との所定の関係内にないとき、分離は、まったく実行されない。

ブロックのグループ内の特性の変動に応じて可変閾値を使用する第２の態様によれば、分離は、完全分離、すなわち、分離が実行されるときにオーディオ信号値のブロック全体が前景成分に導入されるか、または可変分離閾値に対する所定の関係が満たされないときにオーディオ信号値のブロック全体が背景信号部分に類似することになり得る。好ましい実施形態では、この態様は、可変閾値が特性と所定の関係にあることが判明するとすぐに、非バイナリ分離が実行され、すなわち、オーディオ信号値の一部分のみが前景信号部分に入れられ、残りの部分が背景信号に残されるという点で第１の態様と組み合わされる。

好ましくは、前景信号部分と背景信号部分への部分的な分離は、利得係数に基づいて決定され、すなわち、同じ信号値は、最終的には前景信号部分と背景信号部分との間にあるが、異なる部分内の信号値のエネルギーは、互いに異なり、最終的には現在のブロック自体のブロック特性、または現在のブロックのブロック特性と現在のブロックと関連付けられるブロックのグループの平均特性との間の現在のブロックの比率などの特性に依存する分離利得によって決定される。

可変閾値の使用は、個人が前景信号部分を非常に定常的な信号からの小さな偏差であっても、すなわち、ある特定の信号が非常に定常的であると考えられるとき、すなわち、大きな変動を有さないときにさえ知覚する状況を反映する。その場合、わずかな変動であっても、前景信号部分であるとすでに知覚されている。しかしながら、強く変動する信号が存在するとき、強く変動する信号自体が背景信号成分であると知覚され、この変動パターンからの小さな偏差は、前景信号部分であるとは知覚されないように思われる。平均または予想値からのより強い偏差だけが、前景信号部分であると知覚される。したがって、分散が小さい信号には非常に小さい分離閾値を使用し、分散が大きい信号にはより高い分離閾値を使用することが好ましい。しかしながら、逆数が考慮されるとき、状況は上記と反対である。

両方の態様、すなわち、ブロック特性と平均特性との間の比率に基づいて前景信号部分と背景信号部分に非バイナリ分離を行う第１の態様、およびブロックのグループ内の特性の変動に応じて可変閾値を含む第２の態様は、互いに別々に使用することができ、あるいは共に、すなわち、互いに組み合わせて使用することもできる。後者の代替案は、後述するように好ましい実施形態を構成する。

本発明の実施形態は、入力信号が個々の処理を適用することができる２つの信号成分に分解され、処理された信号が再合成されて出力信号を形成するシステムに関する。拍手および他の過渡信号は、明確かつ個々に知覚可能な過渡クラップ事象とよりノイズ様の背景信号との重ね合わせとして見ることができる。そのような信号の前景信号密度と背景信号密度との比率などの特性を修正するために、個々の処理を各信号部に適用することができることが有利である。加えて、人間の知覚によって引き起こされる信号分離が得られる。さらに、概念は、送信側などの信号特性を測定し、受信側でそれらの特性を復元する測定デバイスとしても使用することができる。

本発明の実施形態は、マルチチャネル空間出力信号を生成することを専ら目的としていない。モノラル入力信号が分解され、個々の信号部は、処理されてモノラル出力信号に再合成される。いくつかの実施形態では、概念は、第１または第２の態様で定義されるように、可聴信号の代わりに測定値または付加情報を出力する。

加えて、分離は、意味的側面よりも知覚的側面および好ましくは定量的な特性または値に基づく。

実施形態によれば、分離は、考慮された短い時間フレーム内の平均エネルギーに対する瞬間エネルギーの偏差に基づく。そのような時間フレームの平均エネルギーに近いかまたはそれを下回るエネルギーレベルを有する過渡事象は、背景と実質的に異なるものとして知覚されないが、高いエネルギー偏差を有する事象は、背景信号から区別することができる。この種の信号分離は、原理を採用し、過渡事象に対する人間の知覚に近い処理と、背景事象よりも前景事象に対する人間の知覚に近い処理とを可能にする。

続いて、本発明の好ましい実施形態を添付の図面に関して説明する。

第１の態様による比率に依存するオーディオ信号を分解するための装置のブロック図である。第２の態様による可変分離閾値に依存するオーディオ信号を分解するための概念の一実施形態のブロック図である。第１の態様、第２の態様または両方の態様によるオーディオ信号を分解するための装置のブロック図である。第１の態様、第２の態様または両方の態様によるオーディオ信号分析器および分離器の好ましい図である。第２の態様による信号分離器の一実施形態を示す図である。第１の態様、第２の態様による、かつ異なる閾値を参照することによるオーディオ信号を分解するための概念の説明を示す図である。第１の態様、第２の態様または両方の態様による現在のブロックのオーディオ信号値を前景成分と背景成分に分離するための２つの異なる方法を示す図である。ブロック生成器によって生成された重なり合うブロック、および分離後の時間領域の前景成分信号および背景成分信号の生成の概略図である。生の変動の平滑化に基づいて可変閾値を決定するための第１の代替案を示す図である。生の閾値の平滑化に基づく可変閾値の決定を示す図である。（平滑化された）変動を閾値にマッピングするための様々な関数を示す図である。第２の態様において必要とされる変動を決定するための好ましい実施態様を示す図である。分離、前景処理および背景処理、ならびにその後の信号の再合成に関する一般的な概観を示す図である。メタデータを伴うまたは伴わない信号特性の測定および復元を示す図である。エンコーダ−デコーダの使用例のブロック図である。

図１ａは、オーディオ信号を背景成分信号と前景成分信号に分解するための装置を示す。オーディオ信号は、オーディオ信号入力１００に入力される。オーディオ信号入力は、ライン１１２で出力されるオーディオ信号値のブロックの時間シーケンスを生成するためのブロック生成器１１０に接続される。さらに、装置は、オーディオ信号の現在のブロックのブロック特性を決定し、加えて、ブロックのグループの平均特性を決定するためのオーディオ信号分析器１２０を備え、ブロックのグループは、少なくとも２つのブロックを含む。好ましくは、ブロックのグループは、少なくとも１つの先行のブロックまたは少なくとも１つの後続のブロック、加えて、現在のブロックを含む。

さらに、装置は、現在のブロックのブロック特性と平均特性との比率に応じて、現在のブロックを背景部分と前景部分に分離するための分離器１３０を備える。したがって、現在のブロックのブロック特性と平均特性との比率が特性として使用され、それに基づいてオーディオ信号値の現在のブロックの分離が実行される。特に、信号出力１４０における背景成分信号は、現在のブロックの背景部分を含み、前景成分信号出力１５０における前景成分信号出力は、現在のブロックの前景部分を含む。図１ａに示す手順は、ブロックごとに実行され、すなわち、ブロックの時間シーケンスのうちの１つのブロックが次々に処理され、最終的に入力１００で入力されたオーディオ信号値のブロックのシーケンスが処理されると、図３に関して後述するように、背景成分信号の対応するブロックのシーケンスおよび前景成分信号の同じブロックのシーケンスがライン１４０、１５０に存在する。

好ましくは、オーディオ信号分析器は、現在のブロックのブロック特性として振幅に関連する尺度を分析するように構成され、加えて、オーディオ信号分析器１２０は、同様にブロックのグループの振幅に関連する特性を追加的に分析するように構成される。

好ましくは、現在のブロックの電力測定値またはエネルギー測定値、およびブロックのグループの平均電力測定値または平均エネルギー測定値は、オーディオ信号分析器によって決定され、現在のブロックのこれら２つの値の間の比率は、分離を実行するために分離器１３０によって使用される。

図２は、第１の態様による図１ａの分離器１３０によって実行される手順を示す。ステップ２００は、必ずしも比率である必要はないが、例えばブロック特性のみであってもよい、第１の態様による比率または第２の態様による特性の決定を表す。

ステップ２０２において、分離利得が比率または特性から計算される。その後、ステップ２０４における閾値比較を任意に実行することができる。閾値比較がステップ２０４で実行されると、その結果、特性は閾値と所定の関係にあることになる。この場合、制御は、ステップ２０６に進む。しかしながら、ステップ２０４において、特性が所定の閾値に関係していないと決定されると、分離は実行されず、制御はブロックのシーケンスの次のブロックに進む。

第１の態様によれば、ステップ２０４における閾値比較を実行してもよく、またはあるいは、破線２０８で示すように実行しなくてもよい。ブロック２０４において、特性が分離閾値と所定の関係にあると決定されると、またはライン２０８の代わりに、いずれにせよステップ２０６が実行されると、オーディオ信号は、分離利得を使用して重み付けされる。この目的のために、ステップ２０６は、入力オーディオ信号のオーディオ信号値を時間表現、または好ましくは、ライン２１０で示されるようなスペクトル表現で受け取る。そして、分離利得の適用に応じて、前景成分Ｃが図２の直下の式で示すように算出される。具体的には、ｇ_Ｎと比率Ψの関数である分離利得は直接使用されず、異なる形で、すなわち、関数が１から減算される。あるいは、背景成分Ｎは、ｇ_Ｎ／Ψ（ｎ）の関数によってオーディオ信号Ａ（ｋ、ｎ）を実際に重み付けすることによって直接計算することができる。

図２は、すべて分離器１３０によって実行することができる前景成分および背景成分を計算するためのいくつかの可能性を示す。１つの可能性は、両方の成分が分離利得を使用して計算されることである。代替案は、前景成分のみが分離利得を使用して計算され、背景成分Ｎが２１０に示すようにオーディオ信号値から前景成分を減算することによって計算されることである。しかしながら、他の代替案は、背景成分Ｎがブロック２０６によって分離利得を使用して直接計算され、次に背景成分Ｎがオーディオ信号Ａから減算されて最終的に前景成分Ｃを得ることである。したがって、図２は、背景成分および前景成分を計算するための３つの異なる実施形態を示すが、これらの代替案の各々は、分離利得を使用したオーディオ信号値の重み付けを少なくとも含む。

続いて、可変分離閾値に依存する本発明の第２の態様を説明するために図１ｂが示される。

第２の態様を表す図１ｂは、ブロック生成１１０に入力されるオーディオ信号１００に依存し、ブロック生成器は、接続ライン１２２を介してオーディオ信号分析器１２０に接続される。さらに、オーディオ信号は、さらなる接続ライン１１１を介して直接オーディオ信号分析器に入力することができる。オーディオ信号分析器１２０は、一方ではオーディオ信号の現在のブロックの特性を決定し、加えて、ブロックのグループ内の特性の変動を決定するように構成され、ブロックのグループは、少なくとも２つのブロックを含み、好ましくは、少なくとも２つの先行のブロックまたは２つの後続のブロック、または少なくとも２つの先行のブロック、少なくとも２つの後続のブロックおよび現在のブロックを同様に含む。

現在のブロックの特性と特性の変動の両方は、接続ライン１２９を介して分離器１３０に転送される。次いで、分離器は、現在のブロックを背景部分と前景部分に分離し、背景成分信号１４０および前景成分信号１５０を生成するように構成される。特に、分離器は、第２の態様に従って、オーディオ信号分析器によって決定された変動に基づいて分離閾値を決定し、現在のブロックの特性が分離閾値と所定の関係にあるときに現在のブロックを背景成分信号部分と前景成分信号部分に分離するように構成される。しかしながら、現在のブロックの特性が（可変）分離閾値と所定の関係にないとき、現在のブロックの分離は実行されず、現在のブロック全体が背景成分信号１４０として転送または使用されるか、または割り当てられる。

具体的には、分離器１３０は、第１の変動の第１の分離閾値および第２の変動の第２の分離閾値を決定するように構成され、第１の分離閾値は、第２の分離閾値よりも小さく、第１の変動は、第２の変動よりも小さく、所定の関係は、「より大きい」である。

一例が図４ｃの左側部分に示されており、第１の分離閾値は、４０１に示され、第２の分離閾値は、４０２に示され、第１の変動は、５０１に示され、第２の変動は、５０２に示される。特に、分離閾値を表す上側区分線形関数４１０を参照し、図４ｃの下側区分線形関数４１２は、後述する解放閾値を示す。図４ｃは、閾値が、変動を増大させるために、増大する閾値が決定されるようなものである状況を示す。しかしながら、例えば、図４ｃに対する逆閾値がとられるように状況が実施される場合、状況は、分離器が第１の変動の第１の分離閾値および第２の変動の第２の分離閾値を決定するように構成されるようなものであり、第１の分離閾値は、第２の分離閾値よりも大きく、第１の変動は、第２の変動よりも小さく、この状況では、所定の関係は、図４ｃに示す第１の代替案のように「より大きい」ではなく「より小さい」である。

ある特定の実施態様に応じて、分離器１３０は、図４ｃの左側部分または右側部分に示す関数が記憶されるテーブルアクセスを使用して、または第１の分離閾値４０１と第２の分離閾値４０２との間を補間する単調補間関数に従って（可変）分離閾値を決定するように構成され、その結果、第３の変動５０３に対して第３の分離閾値４０３が得られ、第４の変動５０４に対して第４の閾値が得られ、第１の分離閾値４０１は、第１の変動５０１と関連付けられ、第２の分離閾値４０２は、第２の変動５０２と関連付けられ、第３および第４の変動５０３、５０４は、それらの値に関して、第１および第２の変動の間に位置し、第３および第４の分離閾値４０３、４０４は、それらの値に関して、第１および第２の分離閾値４０１、４０２の間に位置する。

図４ｃの左側部分に示すように、単調補間は、線形関数であるか、または図４ｃの右側部分に示すように、単調補間関数は、三次関数または１よりも大きい次数の任意のべき乗関数である。

図６は、拍手信号の分離、処理および処理された信号の合成のトップレベルブロック図を示す。

特に、図６に詳細に示される分離段６００は、入力オーディオ信号ａ（ｔ）を背景信号ｎ（ｔ）と前景信号ｃ（ｔ）に分離し、背景信号は、背景処理段６０２に入力され、前景信号は、前景処理段６０４に入力され、処理に続いて、信号ｎ’（ｔ）とｃ’（ｔ）の両方は、結合器６０６によって結合されて処理された信号ａ’（ｔ）が最終的に得られる。

好ましくは、入力信号ａ（ｔ）の明確に知覚可能なクラップｃ（ｔ）とよりノイズ様の背景信号ｎ（ｔ）への信号分離／分解に基づいて、分解された信号部の個々の処理が実現される。処理後、修正された前景および背景信号ｃ’（ｔ）およびｎ’（ｔ）は再合成され、出力信号ａ’（ｔ）が得られる。

図１ｃは、好ましい拍手分離段のトップレベル図を示す。拍手モデルは、式１で与えられ、かつ図１ｆに示されており、拍手信号Ａ（ｋ、ｎ）は、明確かつ個々に知覚可能な前景クラップＣ（ｋ、ｎ）とよりノイズ様の背景信号Ｎ（ｋ、ｎ）との重ね合わせからなる。信号は、高い時間分解能の周波数領域で考慮され、ｋおよびｎは、それぞれ短時間周波数変換の離散周波数ｋおよび時間ｎインデックスを表す。

特に、図１ｃのシステムは、ブロック生成器としてのＤＦＴプロセッサ１１０、図１ａまたは図１ｂのオーディオ信号分析器１２０および分離器１３０の機能を有する前景検出器、ならびに図２のステップ２０６に関して説明した機能を実行する重み付け器１５２、および図２のステップ２１０に示す機能を実施する減算器１５４などのさらなる信号分離器段を示す。さらに、対応する周波数領域表現から、時間領域前景信号ｃ（ｔ）と背景信号ｎ（ｔ）を合成する信号合成器が提供され、信号合成器は、各信号成分に対して、ＤＦＴブロック１６０ａ、１６０ｂを含む。

拍手入力信号ａ（ｔ）、すなわち、背景成分と、拍手成分とを含む入力信号は、信号スイッチ（図１ｃには図示せず）ならびに前景検出器１５０に供給され、信号特性に基づいて、前景クラップに対応するフレームが識別される。検出器段１５０は、信号スイッチに供給される分離利得ｇ_ｓ（ｎ）を出力し、明確かつ個々に知覚可能なクラップ信号Ｃ（ｋ、ｎ）およびさらなるノイズ線信号Ｎ（ｋ、ｎ）にルーティングされる信号量を制御する。信号スイッチは、ブロック１７０に示され、バイナリスイッチ、すなわち、ある特定のフレームまたは時間／周波数タイル、すなわち、ある特定のフレームのある特定の周波数ビンだけが第２の態様に従ってＣまたはＮにルーティングされることを示している。第１の態様によれば、利得は、スペクトル表現Ａ（ｋ、ｎ）の各フレームまたはいくつかの周波数ビンを前景成分と背景成分に分離するために使用され、その結果、利得ｇ_ｓ（ｎ）に従って、第１の態様によるブロック特性と平均特性との間の比率に依存し、フレーム全体または少なくとも１つまたは複数の時間／周波数タイルまたは周波数ビンは、信号ＣおよびＮの各々の対応するビンが同じ値を有するが、振幅の関係がｇ_ｓ（ｎ）に依存する異なる振幅を有するように分離される。

図１ｄは、オーディオ信号分析器の機能を具体的に示す前景検出器１５０のより詳細な実施形態を示す。一実施形態では、オーディオ信号分析器は、図１ｃのＤＦＴ（離散フーリエ変換）ブロック１１０を有するブロック生成器によって生成されたスペクトル表現を受け取る。さらに、オーディオ信号分析器は、ブロック１７０においてある特定の所定のクロスオーバ周波数でハイパスフィルタリングを実行するように構成される。次に、図１ａまたは図１ｂのオーディオ信号分析器１２０は、ブロック１７２においてエネルギー抽出手順を実行する。エネルギー抽出手順は、現在のブロックの瞬間または現在のエネルギーΦ_ｉｎｓｔ（ｎ）および平均エネルギーΦ_ａｖｇ（ｎ）をもたらす。

次に、図１ａまたは図１ｂの信号分離器１３０は、１８０に示すように比率を決定し、加えて、適応または非適応閾値を決定し、対応する閾値処理操作１８２を実行する。

さらに、第２の態様による適応閾値処理操作が実行されると、オーディオ信号分析器は、ブロック１７４に示すようにエンベロープ変動推定を追加的に実行し、変動尺度ｖ（ｎ）は、分離器、特に、適応閾値処理ブロック１８２に転送され、後述するように利得ｇ_ｓ（ｎ）が最終的に得られる。

前景信号検出器の内部のフローチャートが、図１ｄに示されている。上位経路のみが考慮される場合、これは適応閾値処理を行わない場合に対応し、一方、下位経路も考慮に入れられる場合は適応閾値処理が可能である。前景信号検出器に供給された信号は、ハイパスフィルタリングされ、その平均
および瞬間
エネルギーが推定される。信号Ｘ（ｋ、ｎ）の瞬間エネルギーは、
によって与えられ、式中、‖・‖は、ベクトルノルムを表し、平均エネルギーは、以下によって与えられる：

式中、ｗ（ｎ）は、ウィンドウ長
の瞬時エネルギー推定値に適用される重み付けウィンドウを表す。別個のクラップが入力信号内でアクティブであるかどうかに関する指標として、瞬間エネルギーと平均エネルギーとのエネルギー比率
は、以下に従って使用される；

適応閾値処理を行わないより単純な場合、エネルギー比率がアタック閾値
を超える時点では、入力信号から別個のクラップ部を抽出する分離利得は１に設定され、その結果、ノイズ様の信号がこれらの時点ではゼロである。ハード信号の切り替えを伴うシステムのブロック図が、図１ｅに示されている。ノイズ様の信号で信号のドロップアウトを回避する必要がある場合、補正項を利得から減算することができる。良好な出発点は、入力信号の平均エネルギーをノイズ様の信号内に残すことである。これは、利得から
または
を減算することによって行われる。平均エネルギーの量はまた、平均エネルギーがノイズ様の信号内に残る量を制御する利得
を導入することによっても制御することができる。これにより、一般的な形式の分離利得が得られる：

さらなる実施形態では、上記の式は、以下の式によって置き換えられる：
注：
の場合、固有のクラップにルーティングされる信号の量は、信号に依存する軟判定をもたらすエネルギー比率
および固定利得
にのみ依存する。よく調整されたシステムでは、エネルギー比率がアタック閾値を超える期間は、実際の過渡事象のみを捕捉する。場合によっては、アタックが発生した後のより長い期間の時間フレームを抽出することが望ましい場合がある。これは、例えば、アタック後に分離利得がゼロに戻る前にエネルギー比率
が減少しなければならないレベルを示す解放閾値
を導入することによって行うことができる：

さらなる実施形態では、直前の式は、以下の式によって置き換えられる：
代替的ではあるがより静的な方法は、アタックが検出された後にある特定の数のフレームを別個のクラップ信号に単にルーティングすることである。

閾値処理の柔軟性を高めるために、閾値は、信号適応的に選択することができ、その結果それぞれ
および
が得られる。閾値は、拍手入力信号のエンベロープの変動の推定値によって制御され、高い変動は、明確かつ個々に知覚可能なクラップの存在を示し、低い変動ほど、よりノイズ様の定常的な信号を示す。変動推定は、時間領域ならびに周波数領域で行うことができる。この場合の好ましい方法は、周波数領域で推定を行うことである：

式中、ｖａｒ（・）は、分散計算を表す。より安定した信号を得るために、推定された変動は、ローパスフィルタリングによって平滑化され、最終的なエンベロープ変動推定値が得られる

式中、＊は、畳み込みを表す。エンベロープ変動の対応する閾値へのマッピングは、マッピング関数
および
によって行うことができ、以下のようになる

一実施形態では、マッピング関数は、閾値の線形補間に対応するクリップされた一次関数として実現することができる。このシナリオの構成は、図４ｃに示されている。さらにまた、一般的に三次マッピング関数またはより高次の関数を使用することもできる。具体的には、鞍点を使用して、まばらな拍手と密集した拍手に対して定義された値の間の変動値に対する追加の閾値レベルを定義することができる。これは、図４ｃの右側に例示的に示されている。

分離された信号は、以下によって得ることができる
図１ｆは、図１ａおよび図１ｂの機能ブロックに関連して、概観で上述した式を示す。

さらに、図１ｆは、ある特定の実施形態に応じて、閾値が適用されない、単一の閾値、または二重の閾値が適用される状況を示す。

さらに、図１ｆの式（７）〜式（９）に関して示すように、適応閾値を使用することができる。当然、単一の閾値が単一の適応閾値として使用される。そして、式（８）のみがアクティブになり、式（９）はアクティブにならない。しかしながら、ある特定の好ましい実施形態では、第１の態様および第２の態様の特徴を共に実施して、二重の適応閾値処理を実行することが好ましい。

さらに、図７および図８は、本発明のある特定の用途をどのように実施することができるかに関するさらなる実施態様を示す。

特に、図７の左側部分は、背景成分信号または前景成分信号の信号特性を測定するための信号特性測定器７００を示す。特に、信号特性測定７００は、前景成分信号を使用して前景密度計算部を示すブロック７０２で前景密度を決定するように構成され、あるいは、またはそれに加えて、信号特性測定器は、元の入力信号ａ（ｔ）に関して前景の割合を計算する前景隆起計算部７０４を使用して前景隆起計算を実行するように構成される。

あるいは、図７の右側部分に示すように、前景プロセッサ６０４および背景プロセッサ６０２が存在し、これらのプロセッサは、図６とは対照的に、図７の左側部分によって導出されるメタデータであり得る、または前景処理および背景処理を実行するための任意の他の有用なメタデータであり得るある特定のメタデータΘに依存する。

分離された拍手信号部は、過渡信号のある特定の（知覚的に引き起こされる）特性を測定することができる測定段に供給することができる。そのような使用例の例示的な構成が、図７ａに示されており、総信号エネルギーに対する明確かつ個々に知覚可能な前景クラップの密度ならびに前景クラップのエネルギー割合が推定される。

前景密度
の推定は、１秒あたりの事象レート、すなわち１秒あたりの検出されたクラップの数を数えることによって行うことができる。前景隆起
は、推定された前景クラップ信号Ｃ（ｎ）とＡ（ｎ）とのエネルギー比率によって与えられる：

測定された信号特性の復元のブロック図が、図７ｂに示されており、Θおよび破線は、付加情報を表す。

前述の実施形態では、信号特性は測定されただけであったが、システムが信号特性を修正するために使用される。一実施形態では、前景処理は、減少した数の検出された前景クラップを出力することができ、その結果、得られる出力信号のより低い密度に対する密度修正を行う。別の実施形態では、前景処理は、例えば、前景クラップ信号の遅延バージョンをそれ自体に追加することによって増加した数の前景クラップを出力することができ、その結果、増加した密度に対する密度修正を行う。さらに、それぞれの処理段階で重みを適用することによって、前景クラップとノイズ様の背景のバランスを修正することができる。加えて、両方の経路におけるフィルタリング、リバーブの追加、遅延などのような任意の処理を使用して、拍手信号の特性を修正することができる。

図８はさらに、前景成分信号および背景成分信号を符号化し、送信または記憶のために前景成分信号の符号化された表現および背景成分信号の別々の符号化された表現を得るためのエンコーダ段に関する。特に、前景エンコーダは、８０１に示され、背景エンコーダは、８０２に示される。別々に符号化された表現８０４および８０６は、別々の表現および復号化された表現を最終的に復号化する前景デコーダ８１０および背景デコーダ８１２からなるデコーダ側デバイス８０８に転送され、次に結合器６０６によって結合されて復号化された信号ａ’（ｔ）を最終的に出力する。

続いて、さらなる好ましい実施形態を図３に関して説明する。特に、図３は、時間ライン３００に与えられた入力オーディオ信号の概略図を示し、概略図は、適時に重なり合うブロックの状況を示す。図３には、５０％の重なり範囲３０２が存在する状況が示されている。５０％を超える、または５０％未満の部分が重なる５０％以下の重なり範囲を有する多重重なり範囲など、他の重なり範囲も使用可能である。

図３の実施形態では、ブロックは、典型的には、６００未満のサンプリング値を有し、好ましくは、高い時間分解能を得るために２５６のみまたは１２８のみのサンプリング値を有する。

例示的に示された重なり合うブロックは、例えば、重なり範囲内で先行のブロック３０３または後続のブロック３０５と重なる現在のブロック３０４からなる。したがって、ブロックのグループが少なくとも２つの先行のブロックを含むとき、このブロックのグループは、現在のブロック３０４に関する先行のブロック３０３と、図３の順序番号３で示すさらなる先行のブロックとからなる。さらに、そして同様に、ブロックのグループが（時間的に）少なくとも２つの後続のブロックを含むとき、これらの２つの後続のブロックは、順序番号６で示す後続のブロック３０５と、順序番号７で示すさらなるブロック７とを含む。

これらのブロックは、例えば、好ましくは、前述のＤＦＴまたはＦＦＴ（高速フーリエ変換）などの時間スペクトル変換も実行するブロック生成器１１０によって形成される。

時間スペクトル変換の結果は、スペクトルブロックのシーケンスＩ〜ＶＩＩＩであり、ブロック１１０の下の図３に示す各スペクトルブロックは、時間ライン３００の８つのブロックのうちの１つに対応する。

好ましくは、次に周波数領域で、すなわち、オーディオ信号値がスペクトル値であるスペクトル表現を使用して、分離が実行される。分離に続いて、同じくブロックＩ〜ＶＩＩＩからなる前景スペクトル表現、およびＩ〜ＶＩＩＩからなる背景表現が得られる。当然、閾値処理操作に応じて、必ずしも分離１３０の後の前景表現の各ブロックがゼロとは異なる値を有するということではない。しかしながら、好ましくは、背景成分のスペクトル表現における各ブロックは、背景信号成分のエネルギーのドロップアウトを回避するために、ゼロとは異なる値を有することが少なくとも本発明の第１の態様によって確かめられる。

各成分、すなわち、前景成分および背景成分について、図１ｃに関して説明したようにスペクトル時間変換が実行され、その後の重なり範囲３０２に対するフェードアウト／フェードインは、ブロック１６１ａおよびブロック１６１ｂに示すように両方の成分、それぞれ前景および背景成分に対して実行される。したがって、最終的には、前景信号と背景信号の両方は、分離前の元のオーディオ信号と同じ長さＬを有する。

好ましくは、図４ｂに示すように、変動または閾値を計算する分離器１３０は、平滑化される。

特に、ステップ４００は、４００において示すように、現在のブロックについての一般的な特性またはブロック特性と平均特性との間の比率の決定を示す。

ブロック４０２において、現在のブロックに関して生の変動が計算される。ブロック４０４において、ブロック４０２および４０４の出力によって、生の変動のシーケンスを得るために先行または後続のブロックに対する生の変動が計算される。ブロック４０６において、シーケンスは、平滑化される。したがって、ブロック４０６の出力には、平滑化された変動のシーケンスが存在する。平滑化されたシーケンスの変動は、ブロック４０８に示すように対応する適応閾値にマッピングされ、それによって現在のブロックに対する可変閾値が得られる。

変動を平滑化するのとは対照的に、閾値が平滑化される代替の実施形態が図４ｂに示されている。このために、同じく、現在のブロックの特性／比率がブロック４００に示すように決定される。

ブロック４０３において、整数ｍによって示される各現在のブロックについて、例えば、図１ｆの式６を使用して変動のシーケンスが計算される。

ブロック４０５において、図１ｆの式７とは対照的に、変動のシーケンスは式８および式９に従って生の閾値のシーケンスにマッピングされるが、変動は平滑化されていない。

ブロック４０７において、現在のブロックに対する（平滑化された）閾値を最終的に得るために、生の閾値のシーケンスが平滑化される。

続いて、ブロックのグループ内の特性の変動を計算するための異なる方法を例示するために、図５をより詳細に説明する。

同じく、ステップ５００において、現在のブロック特性と平均ブロック特性との間の特性または比率が計算される。

ステップ５０２において、ブロックのグループについての特性／比率に対する平均、または一般に期待値が計算される。

ブロック５０４において、特性／比率と平均値／期待値との間の差が計算され、ブロック５０６に示すように、差の加算、または差から導出されるある特定の値が正規化を用いて好ましくは実行される。平方差を足し合わせると、ステップ５０２、５０４、５０６のシーケンスは、式６に関して概説したように分散の計算を反映する。しかしながら、例えば、大きさの差または２とは異なる他のべき乗の差を足し合わせると、特性と平均／期待値との間の差から導出される異なる統計値が変動として使用される。

しかしながら、あるいは、ステップ５０８に示すように、隣接するブロックに対する時間経過特性／比率の間の差も計算され、変動尺度として使用される。したがって、ブロック５０８は、平均値に依存せず、一方のブロックから他方のブロックへの変化に依存する変動を決定し、図６に示すように、隣接するブロックの特性の間の差は、分散とは異なる変動から別の値を最終的に得るために、二乗、その大きさ、またはそのべき乗のいずれかで足し合わせることができる。図５に関して説明したものとは異なる他の変動尺度も同様に使用することができることは、当業者には明らかである。

続いて、以下の実施例とは別々に、または以下の実施例のいずれかと組み合わせて使用することができる実施形態の実施例を定義する。

１．オーディオ信号（１００）を背景成分信号（１４０）と前景成分信号（１５０）に分解するための装置であって、
オーディオ信号値のブロックの時間シーケンスを生成するためのブロック生成器（１１０）と、
前記オーディオ信号の現在のブロックのブロック特性を決定し、ブロックのグループの平均特性を決定するためのオーディオ信号分析器（１２０）であって、前記ブロックのグループは、少なくとも２つのブロックを含むオーディオ信号分析器（１２０）と、
前記現在のブロックの前記ブロック特性と前記ブロックのグループの前記平均特性との比率に応じて、前記現在のブロックを背景部分と前景部分に分離するための分離器（１３０）とを備え、
前記背景成分信号（１４０）は、前記現在のブロックの前記背景部分を含み、前記前景成分信号（１５０）は、前記現在のブロックの前記前景部分を含む、装置。

２．前記オーディオ信号分析器が、前記現在のブロックの前記特性として振幅に関連する尺度を分析し、前記ブロックのグループの前記平均特性として前記振幅に関連する特性を分析するように構成される、
実施例１に記載の装置。

３．前記オーディオ信号分析器（１２０）が、前記現在のブロックの電力測定値またはエネルギー測定値、および前記ブロックのグループの平均電力測定値または平均エネルギー測定値を分析するように構成される、
実施例１または２に記載の装置。

４．前記分離器（１３０）が、前記比率から分離利得を計算し、前記分離利得を使用して前記現在のブロックの前記オーディオ信号値を重み付けして前記現在フレームの前記前景部分を得て、前記背景信号が残りの信号を構成するように前記背景成分を決定するように構成され、または
前記分離器が、前記比率から分離利得を計算し、前記分離利得を使用して前記現在のブロックの前記オーディオ信号値を重み付けして前記現在のフレームの前記背景部分を得て、前記前景成分信号が残りの信号を構成するように前記前景成分を決定するように構成される、
実施例１〜３のいずれか１つに記載の装置。

５．前記分離器（１３０）が、ゼロとは異なる所定の重み付け係数を使用する前記比率を重み付けすることを使用して分離利得を計算するように構成される、
実施例１〜４のいずれか１つに記載の装置。

６．前記分離器（１３０）が、項１−（ｇ_Ｎ／Ψ（ｎ）^ｐ）または（ｍａｘ（１−（ｇ_Ｎ／Ψ（ｎ）））^ｐを使用して前記分離利得を計算するように構成され、式中、ｇＮは、所定の係数であり、Ψ（ｎ）は、前記比率であり、ｐは、ゼロよりも大きく整数または非整数であるべき乗であり、式中、ｎは、ブロックインデックスであり、式中、ｍａｘは、最大関数である、
実施例５に記載の装置。

７．前記分離器（１３０）が、前記現在のブロックの比率が前記閾値と所定の関係にあるときに前記現在のブロックの前記比率を閾値と比較し、前記現在のブロックを分離するように構成され、前記分離器（１３０）が、さらなるブロックを分離しないように構成され、前記さらなるブロックが、前記さらなるブロックが前記背景成分信号（１４０）に完全に属するように前記閾値との前記所定の関係を有さない比率を有する、
実施例１〜６のいずれか１つに記載の装置。

８．前記分離器（１３０）が、前記後続のブロックの前記比率をさらなる解放閾値と比較することを使用して時間内に前記現在のブロックに続く後続のブロックを分離するように構成され、
前記さらなる解放閾値が、前記閾値と前記所定の関係にないブロック比率が前記さらなる解放閾値と前記所定の関係にあるように設定される、
実施例７に記載の装置。

９．前記所定の関係が、「より大きい」であり、前記解放閾値が、分離閾値よりも小さく、または
前記所定の関係が、「より小さい」であり、前記解放閾値が、前記分離閾値よりも大きい、
実施例８に記載の装置。

１０．前記ブロック生成器（１１０）が、オーディオ信号値の適時に重なり合うブロックを決定するように構成され、または
前記時間的に重なり合うブロックが、６００以下のいくつかのサンプリング値を有する、
実施例１〜９のいずれか１つに記載の装置。

１１．前記ブロック生成器が、時間領域オーディオ信号の周波数領域へのブロックごとの変換を実行して各ブロックのスペクトル表現を得るように構成され、
前記オーディオ信号分析器が、前記現在のブロックの前記スペクトル表現を使用して前記特性を計算するように構成され、
前記分離器（１３０）が、前記スペクトル表現を前記背景部分と前記前景部分に分離し、同じ周波数に対応する前記背景部分と前記前景部分のスペクトルビンについて、各々がゼロとは異なるスペクトル値を有するように構成され、同じ周波数ビン内の前記前景部分の前記スペクトル値と前記背景部分の前記スペクトル値との関係が、前記比率に依存する、
実施例１〜１０のいずれか１つに記載の装置。

１２．前記ブロック生成器（１１０）が、前記時間領域の前記周波数領域へのブロックごとの変換を実行して各ブロックのスペクトル表現を得るように構成され、
時間隣接ブロックが、重なり合う範囲（３０２）で重なり合っており、
前記装置が、前記背景成分信号を合成し、前記前景成分信号を合成するための信号合成器（１６０ａ、１６１ａ、１６０ｂ、１６１ｂ）をさらに備え、前記信号合成器が、前記背景成分信号および前記前景成分信号について、ならびに前記重なり合う範囲内の時間隣接ブロックのクロスフェード（１６１ａ、１６１ｂ）時間表現について周波数−時間変換（１６１ａ、１６０ａ、１６０ｂ）を実行し、時間領域前景成分信号および別々の時間領域背景成分信号を得るように構成される、
実施例１〜１１のいずれか１つに記載の装置。

１３．前記オーディオ信号分析器（１２０）が、前記ブロックのグループのブロックの個々の特性の重み付け加算を使用して前記ブロックのグループの前記平均特性を決定するように構成される、
実施例１〜１２のいずれか１つに記載の装置。

１４．前記オーディオ信号分析器（１２０）が、前記ブロックのグループのブロックの個々の特性の重み付け加算を実行するように構成され、前記現在のブロックに時間的に近いブロックの特性の重み付け値が、前記現在のブロックに時間的に近くないさらなるブロックの特性の重み付け値よりも大きい、
実施例１〜１３のいずれか１つに記載の装置。

１５．前記オーディオ信号分析器（１２０）が、前記ブロックのグループが対応するブロックの前の少なくとも２０個のブロック、または前記現在のブロックの後の少なくとも２０個のブロックを含むように前記ブロックのグループを決定するように構成される、
実施例１３または１４に記載の装置。

１６．前記オーディオ信号分析器が、前記ブロックのグループのブロックの数に応じて、または前記ブロックのグループの前記ブロックの重み付け値に応じて正規化値を使用するように構成される、
実施例１〜１５のいずれか１つに記載の装置。

１７．前記背景成分信号または前記前景成分信号の少なくとも１つの信号特性を測定するための信号特性測定器（７０２、７０４）をさらに備える、
実施例１〜１６のいずれか１つに記載の装置。

１８．前記信号特性測定器が、前記前景成分信号を使用して前景密度（７０２）を決定するか、または前記前景成分信号および前記オーディオ入力信号を使用して前景隆起（７０４）を決定するように構成される、
実施例１７に記載の装置。

１９．前記前景成分信号が、クラップ信号を含み、前記装置が、クラップの数を増やすかもしくはクラップの数を減らすことによって、または重みを前記前景成分信号もしくは前記背景成分信号に適用することによって前記前景成分信号を修正し、前記前景クラップ信号とノイズ様の信号である前記背景成分信号との間のエネルギー関係を修正するための信号特性修正器をさらに備える、
実施例１〜１８のいずれか１つに記載の装置。

２０．前記オーディオ信号を、前記オーディオ信号のチャネルの数よりも大きい出力チャネルの数を有する表現にアップミックスするためのブラインドアップミキサをさらに備え、
前記アップミキサが、前記前景成分信号を前記出力チャネルに空間的に分配するように構成され、多数の出力チャネルの前記前景成分信号が、相関され、前記背景成分信号を前記出力チャネルにスペクトル的に分配し、前記出力チャネルの前記背景成分信号が、前記前景成分信号よりも相関が低いか、または互いに相関がない、
実施例１〜１９のいずれか１つに記載の装置。

２１．前記前景成分信号および前記背景成分信号を別々に符号化し、送信または記憶または復号化のために前記前景成分信号の符号化された表現（８０４）および前記背景成分信号の別々の符号化された表現（８０６）を得るためのエンコーダ段（８０１、８０２）をさらに備える、
実施例１〜２０のいずれか１つに記載の装置。

２２．オーディオ信号（１００）を背景成分信号（１４０）と前景成分信号（１５０）に分解する方法であって、
オーディオ信号値のブロックの時間シーケンスを生成すること（１１０）と、
前記オーディオ信号の現在のブロックのブロック特性を決定し、ブロックのグループの平均特性を決定すること（１２０）であって、前記ブロックのグループは、少なくとも２つのブロックを含むことと、
前記現在のブロックの前記ブロック特性と前記ブロックのグループの前記平均特性との比率に応じて、前記現在のブロックを背景部分と前景部分に分離すること（１３０）とを含み、
前記背景成分信号（１４０）は、前記現在のブロックの前記背景部分を含み、前記前景成分信号（１５０）は、前記現在のブロックの前記前景部分を含む、方法。

続いて、上記の実施例とは別々に、または上記の実施例のいずれかと組み合わせて使用することができるさらなる実施例を説明する。

１．オーディオ信号を背景成分信号と前景成分信号に分解するための装置であって、
オーディオ信号値のブロックの時間シーケンスを生成するためのブロック生成器（１１０）と、
前記オーディオ信号の現在のブロックの特性を決定し、前記ブロックのシーケンスの少なくとも２つのブロックを含むブロックのグループ内の前記特性の変動を決定するためのオーディオ信号分析器（１２０）と、
前記現在のブロックを背景部分（１４０）と前景部分（１５０）に分離するための分離器（１３０）であって、前記分離器（１３０）は、前記現在のブロックの前記特性が前記分離閾値と所定の関係にあるとき、前記変動に基づいて分離閾値を決定して（１８２）前記現在のブロックを前記背景成分信号（１４０）と前記前景成分信号（１５０）に分離するか、または前記現在のブロックの前記特性が前記分離閾値と前記所定の関係にあるとき、前記現在のブロック全体を前景成分信号として決定するか、または前記現在のブロックの前記特性が前記分離閾値と前記所定の関係にないとき、前記現在のブロック全体を背景成分信号として決定するように構成される分離器（１３０）とを備える、装置。

２．前記分離器（１３０）が、第１の変動（５０１）の第１の分離閾値（４０１）および第２の変動（５０２）の第２の分離閾値（４０２）を決定するように構成され、
前記第１の分離閾値（４０１）が、前記第２の分離閾値（４０２）よりも小さく、前記第１の変動（５０１）が、前記第２の変動（５０２）よりも小さく、前記所定の関係が、より大きいであり、または
前記第１の分離閾値が、前記第２の分離閾値よりも大きく、前記第１の変動が、前記第２の変動よりも小さく、前記所定の関係が、より小さいである、
実施例１に記載の装置。

３．前記分離器（１３０）が、テーブルアクセスを使用して、または第１の分離閾値（４０１）と第２の分離閾値（４０２）との間を補間する単調補間関数を使用して前記分離閾値を決定し、第３の変動（５０３）について、第３の分離閾値（４０３）が得られ、第４の変動（５０４）について、第４の分離閾値（４０４）が得られるように構成され、前記第１の分離閾値（４０１）が、第１の変動（５０１）と関連付けられ、前記第２の分離閾値（４０２）が、第２の変動（５０２）と関連付けられ、
前記第３の変動（５０３）および前記第４の変動が、それらの値に対して、前記第１の変動（５０１）と前記第２の変動（５０２）との間に位置し、前記第３の分離閾値（４０３）および前記第４の分離閾値（４０４）が、それらの値に対して、前記第１の分離閾値（４０１）と前記第２の分離閾値（４０２）との間に位置する、
実施例１または２に記載の装置。

４．前記単調補間関数が、一次関数、二次関数、三次関数、または３よりも大きい次数を有するべき乗関数である、
実施例３に記載の装置。

５．前記分離器（１３０）が、前記現在のブロックに対する前記特性の前記変動に基づいて、生の分離閾値（４０５）を決定し、少なくとも１つの先行または後続のブロックの前記変動に基づいて、少なくとも１つのさらなる生の分離閾値（４０５）を決定し、生の分離閾値のシーケンスを平滑化することによって前記現在のブロックの前記分離閾値を決定する（４０７）ように構成され、前記シーケンスが、前記生の分離閾値と、前記少なくとも１つのさらなる生の分離閾値とを含み、または
前記分離器（１３０）が、前記現在のブロックの前記特性の生の変動（４０２）を決定し、加えて、先行または後続のブロックの生の変動を計算する（４０４）ように構成され、前記分離器（１３０）が、前記現在のブロックの前記生の変動と、前記先行または前記後続のブロックの前記少なくとも１つのさらなる生の変動とを含む生の変動のシーケンスを平滑化して平滑化された変動のシーケンスを得て、前記現在のブロックの平滑化された変動に基づいて分離閾値を決定するように構成される、
実施例１〜４のいずれか１つに記載の装置。

６．前記オーディオ信号分析器（１２０）が、前記ブロックのグループの各ブロックの特性を計算して特性のグループを得ること、および前記特性のグループの分散を計算することによって前記変動を決定するように構成され、前記変動が、前記特性のグループの前記分散に対応するか、または前記分散に依存する、
実施例１〜５のいずれか１つに記載の装置。

７．前記オーディオ信号分析器（１２０）が、平均または予想特性（５０２）、および前記特性のグループの前記特性と前記平均または予想特性との間の差（５０４）を使用して前記変動を計算するように、または
時間内に後続の前記特性のグループの特性の間の差（５０８）を使用して前記変動を計算することによって構成される、
実施例１〜６のいずれか１つに記載の装置。

８．前記オーディオ信号分析器（１２０）が、前記現在のブロックに先行する少なくとも２つのブロックまたは前記現在のブロックに後続する少なくとも２つのブロックを含む前記特性のグループ内の前記特性の前記変動を計算するように構成される、
実施例１〜７のいずれか１つに記載の装置。

９．前記オーディオ信号分析器（１２０）が、少なくとも３０個のブロックからなる前記ブロックのグループ内の前記特性の前記変動を計算するように構成される、
実施例１〜８のいずれか１つに記載の装置。

１０．前記オーディオ信号分析器（１２０）が、前記現在のブロックのブロック特性と少なくとも２つのブロックを含むブロックのグループの平均特性との比率として前記特性を計算するように構成され、
前記分離器（１３０）が、前記比率を、前記ブロックのグループ内の前記現在のブロックと関連付けられる前記比率の前記変動に基づいて決定された前記分離閾値と比較するように構成される、
実施例１〜９のいずれか１つに記載の装置。

１１．前記オーディオ信号分析器（１２０）が、前記平均特性の前記計算のために、および前記変動の前記計算のために、同じブロックのグループを使用するように構成される、
実施例１０に記載の装置。

１２．前記オーディオ信号分析器が、前記現在のブロックの前記特性として振幅に関連する尺度を分析し、前記ブロックのグループの前記平均特性として前記振幅に関連する特性を分析するように構成される、
実施例１〜１１のいずれか１つに記載の装置。

１３．前記分離器（１３０）が、前記特性から分離利得を計算し、前記分離利得を使用して前記現在のブロックの前記オーディオ信号値を重み付けして前記現在フレームの前記前景部分を得て、前記背景信号が残りの信号を構成するように前記背景成分を決定するように構成され、または
前記分離器が、前記特性から分離利得を計算し、前記分離利得を使用して前記現在のブロックの前記オーディオ信号値を重み付けして前記現在のフレームの前記背景部分を得て、前記前景成分信号が残りの信号を構成するように前記前景成分を決定するように構成される、
実施例１〜１２のいずれか１つに記載の装置。

１４．前記分離器（１３０）が、前記後続のブロックの前記特性をさらなる解放閾値と比較することを使用して時間内に前記現在のブロックに続く後続のブロックを分離するように構成され、
前記さらなる解放閾値が、前記閾値と前記所定の関係にない特性が前記さらなる解放閾値と前記所定の関係にあるように設定される、
実施例１〜１３のいずれか１つに記載の装置。

１５．前記分離器（１３０）が、前記現在のブロックの前記特性が前記解放閾値とさらなる所定の関係にあるとき、前記変動に基づいて前記解放閾値を決定し、前記後続のブロックを分離するように構成される、
実施例１４に記載の装置。

１６．前記所定の関係が、「より大きい」であり、前記解放閾値が、前記分離閾値よりも小さく、または
前記所定の関係が、「より小さい」であり、前記解放閾値が、前記分離閾値よりも大きい、
実施例１４または１５に記載の装置。

１７．前記ブロック生成器（１１０）が、オーディオ信号値の適時に重なり合うブロックを決定するように構成され、または
前記適時に重なり合うブロックが、６００以下のいくつかのサンプリング値を有する、
実施例１〜１６のいずれか１つに記載の装置。

１８．前記ブロック生成器が、時間領域オーディオ信号の周波数領域へのブロックごとの変換を実行して各ブロックのスペクトル表現を得るように構成され、
前記オーディオ信号分析器が、前記現在のブロックの前記スペクトル表現を使用して前記特性を計算するように構成され、
前記分離器（１３０）が、前記スペクトル表現を前記背景部分と前記前景部分に分離し、同じ周波数に対応する前記背景部分と前記前景部分のスペクトルビンについて、各々がゼロとは異なるスペクトル値を有するように構成され、同じ周波数ビン内の前記前景部分の前記スペクトル値と前記背景部分の前記スペクトル値との関係が、前記特性に依存する、
実施例１〜１７のいずれか１つに記載の装置。

１９．前記オーディオ信号分析器（１２０）が、前記現在のブロックの前記スペクトル表現を使用して前記特性を計算し、前記ブロックのグループの前記スペクトル表現を使用して前記現在のブロックの前記変動を計算するように構成される、
実施例１〜１８のいずれか１つに記載の装置。

２０．オーディオ信号を背景成分信号と前景成分信号に分解するための方法であって、
オーディオ信号値のブロックの時間シーケンスを生成すること（１１０）と、
前記オーディオ信号の現在のブロックの特性を決定し、前記ブロックのシーケンスの少なくとも２つのブロックを含むブロックのグループ内の前記特性の変動を決定すること（１２０）と、
前記現在のブロックを背景部分（１４０）と前景部分（１５０）に分離すること（１３０）であって、分離閾値は、前記変動に基づいて決定され、前記現在のブロックは、前記現在のブロックの前記特性が前記分離閾値と所定の関係にあるとき、前記背景成分信号（１４０）と前記前景成分信号（１５０）に分離され、または前記現在のブロック全体は、前記現在のブロックの前記特性が前記分離閾値と前記所定の関係にあるとき、前景成分信号として決定され、または前記現在のブロック全体を決定することは、前記現在のブロックの前記特性が前記分離閾値と前記所定の関係にないとき、背景成分信号として決定されることとを含む、方法。

本発明で符号化されたオーディオ信号は、デジタル記憶媒体もしくは非一時的記憶媒体に記憶することができ、または無線伝送媒体もしくはインターネットなどの有線伝送媒体などの伝送媒体に送信することができる。

いくつかの態様は装置の文脈で説明されているが、これらの態様はまた、対応する方法の説明を表し、ブロックまたはデバイスが方法ステップまたは方法ステップの特徴に対応することは明らかである。同様に、方法ステップの文脈で説明された態様はまた、対応する装置の対応するブロックまたは項目または特徴の説明を表す。

ある特定の実施態様要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実施することができる。実施態様は、電子的に読み取り可能な制御信号が記憶され、それぞれの方法が実行されるようにプログラマブルコンピュータシステムと協働する（または協働することができる）デジタル記憶媒体、例えばフロッピーディスク、ＤＶＤ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはＦＬＡＳＨメモリを使用して実行されてもよい。

本発明によるいくつかの実施形態は、本明細書に記載の方法の１つが実行されるように、プログラマブルコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを備える。

一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実施することができ、プログラムコードは、コンピュータプログラム製品がコンピュータで実行されるときに方法の１つを実行するように動作可能である。プログラムコードは、例えば機械可読キャリアに記憶することができる。

他の実施形態は、機械可読キャリアまたは非一時的記憶媒体に記憶された、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを備える。

言い換えれば、本発明の方法の一実施形態は、したがって、コンピュータプログラムがコンピュータで実行されるときに、本明細書に記載の方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを記録したデータキャリア（またはデジタル記憶媒体、またはコンピュータ可読媒体）である。

したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えばデータ通信接続を介して、例えばインターネットを介して転送されるように構成されてもよい。

さらなる実施形態は、本明細書に記載の方法の１つを実行するように構成または適合された処理手段、例えばコンピュータ、またはプログラマブルロジックデバイスを備える。

さらなる実施形態は、本明細書に記載の方法の１つを実行するためのコンピュータプログラムをインストールしたコンピュータを備える。

いくつかの実施形態では、プログラマブルロジックデバイス（例えばフィールドプログラマブルゲートアレイ）を使用して、本明細書に記載の方法の機能の一部またはすべてを実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法の１つを実行するためにマイクロプロセッサと協働することができる。一般に、方法は、好ましくは、任意のハードウェア装置によって実行される。

上述の実施形態は、本発明の原理を説明するための例示にすぎない。本明細書に記載の構成および詳細の修正および変形は、当業者にとって明らかであるものと理解される。したがって、差し迫った特許請求の範囲だけによって制限され、本明細書の実施形態の記載および説明によって示される具体的な詳細によって制限されないことが意図される。

Claims

オーディオ信号を背景成分信号と前景成分信号に分解するための装置であって、
オーディオ信号値のブロックの時間シーケンスを生成するためのブロック生成器（１１０）と、
前記オーディオ信号の現在のブロックの特性を決定し、前記ブロックのシーケンスの少なくとも２つのブロックを含むブロックのグループ内の前記特性の変動を決定するためのオーディオ信号分析器（１２０）と、
前記現在のブロックを背景部分（１４０）と前景部分（１５０）に分離するための分離器（１３０）であって、前記分離器（１３０）は、前記現在のブロックの前記特性が前記分離閾値と所定の関係にあるとき、前記変動に基づいて分離閾値を決定して（１８２）前記現在のブロックを前記背景成分信号（１４０）と前記前景成分信号（１５０）に分離するか、または前記現在のブロックの前記特性が前記分離閾値と前記所定の関係にあるとき、前記現在のブロック全体を前景成分信号として決定するか、または前記現在のブロックの前記特性が前記分離閾値と前記所定の関係にないとき、前記現在のブロック全体を背景成分信号として決定するように構成される分離器（１３０）と
を備える、装置。
前記分離器（１３０）が、第１の変動（５０１）の第１の分離閾値（４０１）および第２の変動（５０２）の第２の分離閾値（４０２）を決定するように構成され、
前記第１の分離閾値（４０１）が、前記第２の分離閾値（４０２）よりも小さく、前記第１の変動（５０１）が、前記第２の変動（５０２）よりも小さく、前記分離閾値との前記所定の関係が、前記分離閾値よりも大きく、または
前記第１の分離閾値が、前記第２の分離閾値よりも大きく、前記第１の変動が、前記第２の変動よりも小さく、前記分離閾値との前記所定の関係が、前記分離閾値よりも小さい、
請求項１に記載の装置。
前記分離器（１３０）が、テーブルアクセスを使用して、または第１の分離閾値（４０１）と第２の分離閾値（４０２）との間を補間する単調補間関数を使用して前記分離閾値を決定し、第３の変動（５０３）について、第３の分離閾値（４０３）が得られ、第４の変動（５０４）について、第４の分離閾値（４０４）が得られるように構成され、前記第１の分離閾値（４０１）が、第１の変動（５０１）と関連付けられ、前記第２の分離閾値（４０２）が、第２の変動（５０２）と関連付けられ、
前記第３の変動（５０３）および前記第４の変動が、それらの値に対して、前記第１の変動（５０１）と前記第２の変動（５０２）との間に位置し、前記第３の分離閾値（４０３）および前記第４の分離閾値（４０４）が、それらの値に対して、前記第１の分離閾値（４０１）と前記第２の分離閾値（４０２）との間に位置する、
請求項１または２に記載の装置。
前記単調補間関数が、一次関数、二次関数、三次関数、または３よりも大きい次数を有するべき乗関数である、
請求項３に記載の装置。
前記分離器（１３０）が、前記現在のブロックに対する前記特性の前記変動に基づいて、生の分離閾値（４０５）を決定し、少なくとも１つの先行または後続のブロックの前記変動に基づいて、少なくとも１つのさらなる生の分離閾値（４０５）を決定し、生の分離閾値のシーケンスを平滑化することによって前記現在のブロックの前記分離閾値を決定する（４０７）ように構成され、前記シーケンスが、前記生の分離閾値と、前記少なくとも１つのさらなる生の分離閾値とを含み、または
前記分離器（１３０）が、前記現在のブロックの前記特性の生の変動（４０２）を決定し、加えて、先行または後続のブロックの生の変動を計算する（４０４）ように構成され、前記分離器（１３０）が、前記現在のブロックの前記生の変動と、前記先行または前記後続のブロックの前記少なくとも１つのさらなる生の変動とを含む生の変動のシーケンスを平滑化して平滑化された変動のシーケンスを得て、前記現在のブロックの平滑化された変動に基づいて分離閾値を決定するように構成される、
請求項１〜４のいずれか一項に記載の装置。
前記オーディオ信号分析器（１２０）が、前記ブロックのグループの各ブロックの特性を計算して特性のグループを得ること、および前記特性のグループの分散を計算することによって前記変動を決定するように構成され、前記変動が、前記特性のグループの前記分散に対応するか、または前記分散に依存する、
請求項１〜５のいずれか一項に記載の装置。
前記オーディオ信号分析器（１２０）が、平均または予想特性（５０２）、および前記特性のグループの前記特性と前記平均または予想特性との間の差（５０４）を使用して前記変動を計算するように、または
時間内に後続の前記特性のグループの特性の間の差（５０８）を使用して前記変動を計算することによって構成される、
請求項１〜６のいずれか一項に記載の装置。
前記オーディオ信号分析器（１２０）が、前記現在のブロックに先行する少なくとも２つのブロックまたは前記現在のブロックに後続する少なくとも２つのブロックを含む前記特性のグループ内の前記特性の前記変動を計算するように構成される、
請求項１〜７のいずれか一項に記載の装置。
前記オーディオ信号分析器（１２０）が、少なくとも３０個のブロックからなる前記ブロックのグループ内の前記特性の前記変動を計算するように構成される、
請求項１〜８のいずれか一項に記載の装置。
前記オーディオ信号分析器（１２０）が、前記現在のブロックのブロック特性と少なくとも２つのブロックを含むブロックのグループの平均特性との比率として前記特性を計算するように構成され、
前記分離器（１３０）が、前記比率を、前記ブロックのグループ内の前記現在のブロックと関連付けられる前記比率の前記変動に基づいて決定された前記分離閾値と比較するように構成される、
請求項１〜９のいずれか一項に記載の装置。
前記オーディオ信号分析器（１２０）が、前記平均特性の前記計算のために、および前記変動の前記計算のために、同じブロックのグループを使用するように構成される、
請求項１０に記載の装置。
前記オーディオ信号分析器が、前記現在のブロックの前記特性として振幅に関連する尺度を分析し、前記ブロックのグループの前記平均特性として前記振幅に関連する特性を分析するように構成される、
請求項１〜１１のいずれか一項に記載の装置。
前記分離器（１３０）が、前記特性から分離利得を計算し、前記分離利得を使用して前記現在のブロックの前記オーディオ信号値を重み付けして前記現在フレームの前記前景部分を得て、前記背景信号が残りの信号を構成するように前記背景成分を決定するように構成され、または
前記分離器が、前記特性から分離利得を計算し、前記分離利得を使用して前記現在のブロックの前記オーディオ信号値を重み付けして前記現在のフレームの前記背景部分を得て、前記前景成分信号が残りの信号を構成するように前記前景成分を決定するように構成される、
請求項１〜１２のいずれか一項に記載の装置。
前記分離器（１３０）が、前記後続のブロックの前記特性をさらなる解放閾値と比較することを使用して時間内に前記現在のブロックに続く後続のブロックを分離するように構成され、
前記さらなる解放閾値が、前記閾値と前記所定の関係にない特性が前記さらなる解放閾値と前記所定の関係にあるように設定される、
請求項１〜１３のいずれか一項に記載の装置。
前記分離器（１３０）が、前記現在のブロックの前記特性が前記解放閾値とさらなる所定の関係にあるとき、前記変動に基づいて前記解放閾値を決定し、前記後続のブロックを分離するように構成される、
請求項１４に記載の装置。
前記所定の関係が、「より大きい」であり、前記解放閾値が、前記分離閾値よりも小さく、または
前記所定の関係が、「より小さい」であり、前記解放閾値比率が、前記分離閾値よりも大きい、
請求項１４または１５に記載の装置。
前記ブロック生成器（１１０）が、オーディオ信号値の適時に重なり合うブロックを決定するように構成され、または
前記適時に重なり合うブロックが、６００以下のいくつかのサンプリング値を有する、
請求項１〜１６のいずれか一項に記載の装置。
前記ブロック生成器が、時間領域オーディオ信号の周波数領域へのブロックごとの変換を実行して各ブロックのスペクトル表現を得るように構成され、
前記オーディオ信号分析器が、前記現在のブロックの前記スペクトル表現を使用して前記特性を計算するように構成され、
前記分離器（１３０）が、前記スペクトル表現を前記背景部分と前記前景部分に分離し、同じ周波数に対応する前記背景部分と前記前景部分のスペクトルビンについて、各々がゼロとは異なるスペクトル値を有するように構成され、同じ周波数ビン内の前記前景部分の前記スペクトル値と前記背景部分の前記スペクトル値との関係が、前記特性に依存する、
請求項１〜１７のいずれか一項に記載の装置。
前記オーディオ信号分析器（１２０）が、前記現在のブロックの前記スペクトル表現を使用して前記特性を計算し、前記ブロックのグループの前記スペクトル表現を使用して前記現在のブロックの前記変動を計算するように構成される、
請求項１〜１８のいずれか一項に記載の装置。
オーディオ信号を背景成分信号と前景成分信号に分解する方法であって、
オーディオ信号値のブロックの時間シーケンスを生成すること（１１０）と、
前記オーディオ信号の現在のブロックの特性を決定し、前記ブロックのシーケンスの少なくとも２つのブロックを含むブロックのグループ内の前記特性の変動を決定すること（１２０）と、
前記現在のブロックを背景部分（１４０）と前景部分（１５０）に分離すること（１３０）であって、分離閾値は、前記変動に基づいて決定され、前記現在のブロックは、前記現在のブロックの前記特性が前記分離閾値と所定の関係にあるとき、前記背景成分信号（１４０）と前記前景成分信号（１５０）に分離され、または前記現在のブロック全体は、前記現在のブロックの前記特性が前記分離閾値と前記所定の関係にあるとき、前景成分信号として決定され、または前記現在のブロック全体を決定することは、前記現在のブロックの前記特性が前記分離閾値と前記所定の関係にないとき、背景成分信号として決定されることと
を含む、方法。
コンピュータまたはプロセッサで行われるとき、請求項２０に記載の方法を実行するためのコンピュータプログラム。