JP2005507584A

JP2005507584A - サウンドアルゴリズムの選定方法とその装置

Info

Publication number: JP2005507584A
Application number: JP2003533646A
Authority: JP
Inventors: シュルツ・ドナルト
Original assignee: グルンデイッヒ・アクチエンゲゼルシヤフト
Priority date: 2001-09-29
Filing date: 2002-09-30
Publication date: 2005-03-17
Anticipated expiration: 2022-09-30
Also published as: WO2003030588A2; WO2003030588A3; CN1689372B; DE10148351A1; US7206414B2; ES2356226T3; US20050129251A1; EP1430750B1; EP1430750A2; JP4347048B2; ATE488101T1; DE10148351B4; DE50214765D1; CN1689372A

Abstract

【課題】この発明は、オーディオ信号を処理するために、サウンドアルゴリズムを選定する方法に関する。
【解決手段】オーディオ信号が解析されて、この解析にもとづき、オーディオ信号の種類が検出される。オーディオ信号の音楽信号またはその他の信号としての分類が行われ、この分類にもとづいて、このオーディオ信号をさらに処理し、その後に出力するために、異なるサウンドアルゴリズムが利用される。

Description

【技術分野】
【０００１】
この発明は、請求項１と２８の上位概念の特徴にもとづく、オーディオ信号を処理するために、サウンドアルゴリズム（Klangalgorithmus）を選定する方法およびその装置に関する。
【背景技術】
【０００２】
現在のハイファイ音響設備には、ステレオのオーディオ信号を、二つ以上のスピーカーに分配するか、あるいは別の方法で立体音響を生成することを可能とする、様々なサウンドプログラムが供給される。すなわち、これらのオーディオ信号は、例えば、オーディオ信号の復号化後には、５つの個別のオーディオチャネルに分割され、所謂「バーチャライザー（Virtualizer ）」によって、ただ二つのスピーカーで再生するために利用される。特にヘッドフォンで再生するためにオーディオ信号を変換する、特別な「バーチャライザー」も周知である。
【０００３】
このための最も知られた方法の一つは、所謂「ドルビープロロジック（Dolby Pro Logic ）」方式であり、それは、映画素材で用いられており、基本的にサウンドのローカリゼーション（Localization）に影響を与えることができるものである。すなわち、通常は、人の声をセンターチャネルで再生し、その他の音をリアスピーカーからだけ出すことができる。
【０００４】
さらに、空間音響を擬似するために利用される包括的な種類の方式がある。そのような方式の良く見かける表示は、「ホール」、「スタジアム」、「ジャズ」、「クラブ」などである。これらの音楽信号を最適化する方式においては、「ドルビープロロジック」方式を利用すると可能である、音声信号（歌声）をセンタースピーカーからだけ聞くこと、または音楽信号をリアスピーカーからだけ出力するのは、望ましくはない。
【０００５】
ドルビープロロジックIIと呼ばれる、ドルビープロロジックの後継の方式では、映画モード以外に、これらの違いを考慮した音楽用のモードが規定されている。
【０００６】
特許文献１により、音声の符号化方式が周知である。そこでは、係数（Koeffizient ）の離散的なスペクトルを得るために、音声ウィンドウ（Sprachfenster ）の離散的な変換が行われる。離散的なスペクトルの近似的な包絡線は、多数の下位バンド（Unterband ）の各々において算出され、各下位バンドの規定された包絡線をデジタル符号化するために利用される。サブバンド内において、各等級化された係数は、異なるビット長の多数の量子化器の少なくとも一つで、一定数のビットに換算される。各下位バンドに用いられる量子化器は、各音声ウィンドウに対して、下位バンドに関するエネルギー密度の評価と音声ウィンドウに関する量子化ひずみ誤りの評価に依存して、０以上の一定のビット数として、ビットの割り当てを計算することによって決められる。
【０００７】
特許文献２により、一つ以上の信号を表す入力サンプリング値をフィルター処理するための信号解析システムが周知である。入力サンプリング値を時間領域の信号サンプリング値ブロック（Zeitbereichs-Signalabtastwertbloecke）にグループ化するための入力バッファ手段を配備している。入力サンプリング値は、解析ウィンドウで重み付けされた（ananalysefenster-gewichtet）サンプリング値である。その他に、時間領域の信号サンプリング値ブロックに対する応答としてのスペクトル情報を生成するための解析手段があり、その際このスペクトル情報は、基本的に時間領域・信号・サンプリング値ブロックに適用される、偶数蓄積型時間領域・エイリアシング解消・変換（geradzahlig gestapelted Zeitbereichs-Aliasingaufhebungs-Transformation）に対応する、スペクトル係数を有する。このスペクトル係数は、基本的に拡張離散コサイン変換の係数または拡張離散サイン変換の係数である。この解析手段は、拡張サンプリング値ブロックを生成するための順方向−前変換手段（Vorwaerts-Vor-Transformationsmittel ）および周波数領域の変換係数を生成するための順方向−変換手段（Vorwaerts-Transformationsmittel ）を有する。
【０００８】
特許文献３により、符号化、伝送または記憶、ならびに回復に関する、オーディオ信号の適応処理用の符号化装置が周知であり、その際ノイズレベルが信号振幅レベルとともに変動する。それは、第一と第二の信号、あるいはこれらの第一と第二の信号の和と差のどちらかを出力する形で、入力信号に反応する処理装置である。これらの第一と第二の信号は、四つから二つのオーディオ信号マトリックスの二つのマトリックス符号化されたオーディオ信号に対応し、その際この処理装置は、第一と第二の信号、あるいはこれらの第一と第二の信号の和と差のどちらが出力されているのかを示す制御信号も生成する。
【０００９】
特許文献４により、複数の供給チャネル（Lieferkanal ）のフォーマットを持つ情報を受信するための受信手段、受信手段に対応して、各供給チャネルにもとづくフォーマットを解除した表現を生成するためのフォーマット解除手段、ならびにフォーマットを解除した表現にもとづき出力信号を生成するための合成手段から構成された復号器が周知である。これらのフォーマット解除手段と合成手段の間には、分配手段が配置されており、それは、フォーマット解除手段に反応して、一つ以上の中間信号を生成し、その際少なくとも一つの中間信号は、フォーマットを解除した表現の中の二つ以上の情報を組み合わせることによって生成される。この合成手段は、各中間信号に対する応答として、それぞれ出力信号を生成する。
【００１０】
特許文献５により、二つ以上のオーディオチャネルを符号化するための符号器が周知である。この符号器は、サブバンド信号を生成するためのサブバンド装置、一つ以上の合成信号を作成するための混合装置、ならびに対応する合成信号に関する制御情報を生成するための手段を有する。その他に、この符号器は、一つ以上の合成信号にビットを割り当てることにより、符号化した情報を生成するための符号化装置を有する。さらに、これらの符号化した情報と制御情報を出力信号に統合するためのフォーマット化装置がある。
【００１１】
特許文献６により、音声符号器が周知である。この音声符号器は、係数の離散的な変換スペクトルを生成するために、到着する音声信号の離散フーリエ変換を実行するためのフーリエ変換装置、正規化された、より平坦なスペクトルを生成し、離散的なスペクトルを修正するための関数を符号化するために、変換スペクトルを修正するための正規化装置を有する。その他に、スペクトルの少なくとも一部を符号化するための装置がある。この正規化装置は、係数の複数の下位バンドの各々における離散的なスペクトルの近似的な包絡線を規定し、係数の各下位バンドの規定された包絡線を符号化するための装置（４４）、ならびに係数の当該の下位バンドの規定された包絡線に対して相対的に、各スペクトル係数を等級化するための装置を有する。
【００１２】
しかし、これらの周知の発明のすべてにおいては、サウンドアルゴリズムの選定が、手動で設定されることが欠点である。例えば、その時にセットされたテレビチャネルのテレビの音がドルビープロロジックIIの復号器によって処理され、テレビチャネルが音楽放送と映画またはニュースとの間で何度も切り換えられる場合、各切り換えの際に、例えば音楽モードと映画モード間のように、オーディオデータを処理する個別のオーディオサウンドアルゴリズム間を手動で切り換えなければならない。
【特許文献１】
欧州特許発明第０４８１３７４号明細書
【特許文献２】
欧州特許発明第０５８７７３３号明細書
【特許文献３】
欧州特許発明第０６６４９４３号明細書
【特許文献４】
欧州特許発明第０５１９０５５号明細書
【特許文献５】
欧州特許発明第０５２００６８号明細書
【特許文献６】
欧州特許発明第０２０８７１２号明細書
【発明の開示】
【発明が解決しようとする課題】
【００１３】
この発明の課題は、自律的にオーディオ信号にサウンドアルゴリズムを割り当てる方法と装置を提示することである。
【課題を解決するための手段】
【００１４】
この発明は、請求項１と２８の特徴により、この課題を解決している。この発明の有利な構成および改良構成は、従属請求項、明細書ならびに図面に提示されている。
【００１５】
この発明は、オーディオ信号の種類を識別し、このオーディオ信号の種類の識別にもとづき、サウンドアルゴリズムの自動設定を行うことによって、この課題を解決している。このオーディオ信号の種類の識別のために、異なる尺度が規定され、評価される。
【００１６】
第一の尺度として、その時点でオーディオ信号にどの程度の音量があるかが判定される。この音量の判定は、以下のとおり行われる。
【００１７】
レフトとライトのオーディオチャネルのサンプリング値が、２乗されて、合算され、そしてその結果の信号が、ローパスフィルタでフィルタ処理される。このローパスフィルタは、有利には約３Ｈｚの遮断周波数を有する。有利には、例えば、５秒の規定の継続時間に渡って、この時間範囲において、オーディオ信号の極小値と極大値が検出される。この場合、その時点に存在するデシベルでのダイナミックレンジは、これらの二つの値の対数の差分の１０倍に対応する。
【００１８】
この発明の別の有利な構成においては、レフトとライトのオーディオチャネルの音量が、別々に算定される。別の観点では、より大きなダイナミックレンジを持つオーディオチャネルだけがさらに利用される。
【００１９】
２乗する代わりに、絶対値の計算を行い、それに続く極大値を求める際のローパスフィルタ処理に代わって、短い継続時間、例えば、１／３秒の継続時間に渡ってレベル判定を実施し、それに続いて、このレベル値を用いて、音量を算定するための極大値と極小値を求めるという可能性もある。
【００２０】
例えば、音声の休止時間には、信号レベルが大きく低下するので、映画素材では、大きなレベル上昇と、そのために大きなダイナミックレンジが存在する。しかし、音楽信号は、通常約２０ｄＢ以下のダイナミックレンジしか持たない。検出したダイナミックレンジを閾値と比較することによって、意外に簡単な方法で、対応する尺度を得ることができる。ダイナミックレンジが、閾値より大きい場合には、この尺度は、値−１（映画モード）に、そうでなければ値１（音楽モード）に設定される。さらに、この厳格な区分の代わりに、スライド式の尺度が判定される。そのために、ダイナミックレンジが、関数によって、数値範囲［−１．０..１．０］にマッピングされる。このための簡単な関数の一つは、閾値から、検出されたダイナミックレンジを差し引き、その結果を閾値で割って、さらにその値を数値範囲［−１．０..１．０］内に納めることである。以下においては、この値をＭ１と表示する。ダイナミックレンジが０であれば、Ｍ１は１と算出されて、この閾値に対応するダイナミックレンジでは、Ｍ１は０と算出され、このことは、すなわち中間的であると評価され、閾値の二倍以上のダイナミックレンジでは、Ｍ１は−１．０と算出される。さらに、この尺度が長い信号休止時間に反応することを避けるために、例えば、それ以前のある一定時間間隔（有利な構成では約５分）内に発生した最大値以下３０ｄｂにある最小値を前提条件として設ける。この場合、比較レベルとしては、ダイナミックレンジ検出時に得られた最大値を利用する。この値が、最小値より小さい場合には、ダイナミックレンジから算出される尺度Ｍ１を−１．０に設定する。スライド式転換に関して、最大レベル以下４０ｄＢから最大レベル以下２０ｄＢまでの数値範囲をとることができる。そして、最大レベル以下４０ｄＢより大きい値では、Ｍ１を−１に設定して、最大レベル以下２０ｄＢより小さい値では、変更しないままとし、これらの間の値では、それに応じて、これらの二つの境界時の値間での線形的な補間をとる。
【００２１】
別の尺度としては、オーディオ信号の周期性（以下において、Ｍ２と表示する）が利用される。標準とする文献により、オーディオ信号の周期性を判定するための多くの方法が周知である。非常に簡単な方法は、レフトチャネルとライトチャネルのサンプリング値を２乗して、合算し、そしてその結果の信号を約５０Ｈｚの遮断周波数を持つローパスフィルターでフィルター処理することである。それから、この信号内で極大値を求める。レベルの極大値が、１／３秒と１秒との間にある音楽に関して典型的な時間間隔で周期的に発生することが確認された場合には、この尺度Ｍ２は、１に設定され、そうでなければ−１に設定される。
【００２２】
音楽信号は、そのような尺度として、スペクトルの推移によっても同定することができる。すなわち、例えば、管楽器および弦楽器は、容易に検出可能な非常に特徴的なスペクトルを持っている。そのようなスペクトルの推移を検出した場合には、尺度Ｍ３を１に設定し、そうでなければ、０に設定する。この場合、このようなスペクトルが存在しないということは、音楽信号が存在しないということを自動的には意味しないので、−１の値は、利用されない。それゆえ、この尺度は、音楽の検出に対する判定だけに機能することができる。
【００２３】
未知の楽器も、それらがポリフォニーで演奏される、すなわち二つ以上の音が同時に聞こえる場合には、スペクトルで同定することができる。この場合、その楽器に特有のスペクトルが、異なる周波数において数倍化されて存在する。この場合、異なる人の声のスペクトルが、区別され、ある時点では一人が一つの音の高さだけを発声することができるので、音声と混同することは起こりえない。このようなスペクトルの位置関係が検出された場合には、尺度Ｍ４は、値１に設定され、そうでなければ、この前に尺度Ｍ３に関して記載したように、値０に設定される。より一層正確な判定は、これらの音の周波数を比較することによって可能である。音楽である場合、これらは、高い確率で互いに音楽的な関係がある、すなわち２の１２乗根を整数回累乗したものと等しい係数によってのみ区別される。このような音を検出しようとする場合、メロディーを識別することによっても、すなわち音の高さを監視することによって、音楽の時間における、これらの楽器を検出することができる。
【００２４】
音楽信号の場合、通常複数の楽器が演奏され、それらの周波数挙動は、相互に補完し合い、重なり合わない形で、互いに同調し合うので、音楽信号では、比較的平坦な周波数の推移を観測することができる。周波数の推移の平坦なことは、同じく音楽の存在に対する尺度として用いられる。そのために、入力信号のレベル、特にライトオーディオチャネルとレフトオーディオチャネルの合計が、異なる周波数帯、特に２０Ｈｚから２００Ｈｚ、２００Ｈｚから２ｋＨｚ、および２ｋＨｚから２０ｋＨｚの周波数帯において検出される。これらのレベルの各々から、最大レベルが検出され、その値が、これらの帯域の数と掛け算される。その値から、個別の帯域のレベルが引き算される。この場合、より大きな値が得られた場合、そのことから、それは、スペクトルで言うと、電力が狭い帯域に集中し、そのためおそらく音楽ではないということを意味する。この尺度（以下において、Ｍ５と表示する）を見出すために、最大値から最小値までの数値範囲を、数値範囲［−１．０..１．０］に線形的にマッピングする。この範囲以外の値は、境界値にマッピングされる。
【００２５】
同様の尺度は、一定の最低レベルを持つスペクトルの極大値の数から導き出すことができる。多数の楽器が存在する場合、このような極大値も多く存在する。存在する極大値の数は、別の尺度Ｍ６を判定するために、直接数値範囲［−１．０..１．０］に線形的にマピングされる。
【００２６】
サウンド素材の解析以外に、ソースにより、そのサウンド素材を推定することができる。すなわち、例えば、ラジオ放送またはＣＤの再生の場合、それが音楽信号である可能性が非常に高い。それに対して、ＡＣ３で符号化されたＤＶＤの再生の場合、それは、むしろ映画である。それゆえ、各ソースには、個々の尺度が与えられる、すなわち、例えば、ＣＤソースは、値０．５を、ＤＶＤは値−０．３を与えられる。この尺度は、Ｍ７と表示される。
【００２７】
Ｍ１からＭ７までの個々の尺度から、総合尺度ＭＧが算定される。そのために、Ｍ１からＭ７までのすべての尺度を個々の係数で重み付けして、合算する。Ｍ１は、非常に大きな意味を持っているので、その他のＭ２からＭ７までの尺度と比べて、最も大きな係数で評価される。この発明の以降の記述においては、尺度Ｍ１は、係数１で、Ｍ２は、係数０．５で、Ｍ３，Ｍ４，Ｍ５，Ｍ６およびＭ７は、それぞれ単に係数０．２で、重み付けする。そして、０より小さい総合尺度ＭＧの値は、映画モードで再生されることが求められる、音楽の無い信号に対応し、０より大きい値は、音楽モードが使用されることが求められる、音楽信号に分類される。この値が、より大きな負または正になるほど、この分類は、より明確なものとなる。
【００２８】
境界時、すなわち０に近いＭＧの値における頻繁な切り換えを避けるために、ヒステリシスを利用する。これは、ＭＧが０より大きい値（例えば、０．３）を上回った時に、初めて映画モードから音楽モードへの切り換えが行われることを意味する。音楽モードから映画モードへの切り換えは、０より小さい値（例えば、−０．３）を下回った時に、初めて行われる。
【００２９】
映画モードと音楽モード間の切り換えは、利用者が設定可能な遅延時間および惰性を伴って行われる。信号の形式は、遅延時間に対応する継続時間の間、一定でなければならず、そうでない場合には再生モードの切り換えは行われない。そして、この遅延時間後に、時定数に対応する惰性を伴って、モード間の転換が行われ、それによってそうしない時に場合によっては発生する聞き取れるくらいの信号の跳びを回避することができるとともに、一つのモードから別のモードへの移行が、気づかれない形で構成することができる。標準的には、この時定数は、約１０秒である。非常に短い時定数で、信号の休止時間内に切り換えを実施することが試みられる。多くの場合、例えば、テレビで、チャネルが切り換えられ、テレビのオーディオ信号が再生された直後には、利用者によって予め選定された遅延時間および惰性の時定数が、さらに低減されることが求められている。このような状況は、対応するオーディオ処理がテレビ内に収納されているか、またはテレビが、対応する情報を別の隣接する装置に送る場合には、簡単に確認することができる。このような切り換えプロセスは、不意に発生する信号の休止時間によっても識別することができ、そのような休止時間は、装置内での切り換えプロセス時に、常にこの装置に関して特有の継続時間を持つものである。
【００３０】
さらに、この切り換え時には、通常同期が外れるので、画像信号にもとづくチャネル切り換えの検出が可能である。すなわち、同期の喪失から、チャネルの切り換えも推定することができる。そして、チャネル切り換えを検出した場合、遅延時間が０に設定され、時定数が、例えば３秒の時間に低減される。次に、それに続くサウンド素材の第一の判定と、所望のモードへの転換のための相応の長さの時間後に、再び標準の遅延時間と長い時定数に変更することができる。
【００３１】
この遅延時間と惰性は、またＭＧの絶対値に従って変更される。非常に大きな絶対値は、非常に明確な分類に対応し、それゆえそのような場合には、より早期の切り換えが可能である。
【００３２】
音楽信号の再生のために、異なるサウンドプログラムを利用することができる。例えば、レフトとライトの入力信号間の差分信号をリアスピーカーに出力して、フロントチャネルに影響を与えないようにすることが可能である。さらに、この差分信号を、両チャネルに対して個別に前処理することもでき、それには通常全通過フィルターが用いられる。こうすることによって、リアスピーカーの相関の解除（Dekorrelation ）を実現することができる。これに代わって、音楽信号の場合には、しばしば「ホール」と呼ばれるサウンドプログラムを用いることができる。この場合、差分信号に加えて、オリジナルの信号および差分信号の残響部分も、すべてのスピーカーに出力される。このような音楽信号に適したサウンドプログラムはすべて、ステレオの拡がりが最大限に保たれたままである、すなわち、フロントセンタースピーカーには信号が全く、あるいはほんの僅かしか出力されず、有効なマトリックス化も行われないということ、すなわち、入力チャネルの差分信号が、それらの合算値に比べて大きい場合には、フロントチャネルに対するレベルは低下されないということが共通している。
【００３３】
音楽以外の信号の場合には、例えばDolby Pro Logic または同様の方法が用いられる。この場合、一つには、入力の差分信号が合算信号と比べて大きなレベルをとる場合には、フロントチャネルのレベルが低減される。さらに、この差分信号が非常に小さい場合には、人の声を中央に配置するために、フロントライトチャネルとフロントレフトチャネルの信号は、フロントセンターチャネルに迂回される。
【００３４】
５スピーカー構成の代わりに、さらに多くのスピーカーを利用することも可能であり、その場合には、例えば差分信号が、三つのリアスピーカーに出力される。
【発明を実施するための最良の形態】
【００３５】
以下においては、具体的な実施例をもとに、この発明を説明する。この実施例は、この発明にもとづく装置を示している。
【００３６】
この発明にもとづく装置Ｖは、信号入力Ｅ、入力ソース情報Ｑおよび信号出力Ａを有する。入力Ｅを介して、装置Ｖにオーディオデータが供給される。特に、ステレオ・オーディオデータ、すなわち、２チャネル方式でのオーディオデータが供給される。これらのデータが、アナログ形式で供給される場合には、前置した装置で、オーディオ信号のチャネル分離とデジタル化が行われる。そこで、この装置Ｖには、デジタルデータが供給される。けれども、この装置Ｖは、例えばＡＣ３フォーマットの、多チャネルのオーディオデータも処理できるような形で拡張されている。装置Ｖ８，Ｖ４，Ｖ５，Ｖ６およびＶ７は、ＦＦＴの代わりに多重フィルターを利用した相応の類似の変化形態により実現される場合、あるいはこれらの特性の評価を行わない場合には、完全に類似した形で実現することが可能である。
【００３７】
入力Ｅを介して装置Ｖに供給されるオーディオ信号は、別の異なる装置Ｖ１〜Ｖ１０に同時に供給される。
【００３８】
これらの装置Ｖ１〜Ｖ７は、入力・オーディオ信号を評価して、それぞれ尺度へのマッピングのために、別の装置ＶＭ１〜ＶＭ６に供給する。
【００３９】
この場合、装置ＶＭ１は尺度１へのマッピング、装置ＶＭ２は尺度２へのマッピング等々のために、機能するものである。
【００４０】
さらに、装置Ｖ１は、ダイナミックレンジを検出するために、装置Ｖ２は、レベルを判定するために、装置Ｖ３は、周期性を検出するために、装置Ｖ４は、特に楽器の、周波数スペクトルを検出するために、装置Ｖ５は、オーディオ信号の周波数の推移の平坦性を判定するために、装置Ｖ６は、周波数スペクトルにおける極大値の数を検出するために、装置Ｖ７は、周波数スペクトルにおける類似するスペクトル構造の成分を検出するために、装置Ｖ８は、オーディオ信号を時間領域から周波数領域へ変換するために、装置Ｖ９は、音楽信号を処理するために、装置Ｖ１０は、別の信号を処理するために、装置Ｖ１１は、切り換えプロセスを検出するために、ならびに装置Ｖ１２は、切り換え速度を制御するために係数へマッピングするために機能するものである。
【００４１】
装置ＭＶ１〜ＭＶ７から得られた尺度は、重み係数Ｇ１〜Ｇ７で重み付けされ、合算される。このようにして得られた総合尺度は、またもや装置Ｖ１１とＶ１２によって重み付けされ、ヒステリシス装置Ｈに送られる。このヒステリシス装置Ｈは、この総合尺度が、予め定義した値を上回った、あるいは下回った場合に、直ぐに映画モードから音楽モードへの切り換え、およびその逆が行われるのを防止するものである。これに続いて、この総合尺度は、有利には範囲［−０．５..１．５］内に納める積分器Ｉと、範囲［０..１．０］内に納めるための装置Ｂに供給される。
【００４２】
装置Ｖ９とＶ１０から出てくるオーディオ信号は、積分器Ｉと装置Ｂを介して供給される総合尺度によって重み付けされて、合算される。このようにして、相応のオーディオ処理モードが選定される。
【図面の簡単な説明】
【００４３】
【図１】この発明にもとづく装置のブロック図
【符号の説明】
【００４４】
Ａ出力（５チャネル）
Ｂ範囲［０..１．０］に納めるための装置
Ｅ入力
Ｇ１，Ｇ２，Ｇ３，Ｇ４，Ｇ５，Ｇ６，Ｇ７，Ｇ８，Ｇ９重み係数
Ｈヒステリシス装置
Ｉ積分器
Ｑ入力ソース情報
ＶＭ１尺度１にマッピングするための装置
ＶＭ２尺度２にマッピングするための装置
ＶＭ３尺度３にマッピングするための装置
ＶＭ４尺度４にマッピングするための装置
ＶＭ５尺度５にマッピングするための装置
ＶＭ６尺度６にマッピングするための装置
ＶＭ７尺度７にマッピングするための装置
Ｖ１ダイナミックレンジ検出のための装置
Ｖ２レベル判定のための装置
Ｖ３周期性検出のための装置
Ｖ４楽器の周波数スペクトル検出のための装置
Ｖ５周波数推移の平坦性判定のための装置
Ｖ６周波数スペクトルにおける極大値数検出のための装置
Ｖ７周波数スペクトルにおける類似スペクトル構造成分検出のための装置
Ｖ８周波数領域への変換のための装置
Ｖ９音楽信号の処理のための装置
Ｖ１０その他の信号の処理のための装置
Ｖ１１切り換えプロセスの検出のための装置
Ｖ１２切り換え速度の制御のための係数へのマッピングのための装置

Claims

オーディオ信号を処理するために、サウンドアルゴリズムを選択する方法において、
オーディオ信号が解析されて、この解析にもとづき、オーディオ信号の種類が検出され、その際このオーディオ信号の音楽信号またはその他の信号としての分類が行われ、この分類にもとづいて、このオーディオ信号をさらに処理し、その後に出力するために、異なるサウンドアルゴリズムが利用されることを特徴とする方法。
当該のオーディオ信号が、ステレオのオーディオ信号であることを特徴とする請求項１に記載の方法。
当該のオーディオ信号が、少なくとも二つのオーディオチャネルから構成されることを特徴とする請求項１から３までのいずれか一つに記載の方法。
音楽信号の場合に、十分にまたは完全にステレオの拡がりを持つサウンドプログラムが選択されることを特徴とする請求項１から３までのいずれか一つに記載の方法。
音楽信号の場合に、フロントチャネルのレベル低減を全くまたは僅かしか行わないサウンドプログラムが選択されることを特徴とする請求項１から３までのいずれか一つに記載の方法。
音楽以外の信号の場合に、ドルビープロロジック方式と同様の処理を行うサウンドプログラムが選択されることを特徴とする請求項１から３までのいずれか一つに記載の方法。
当該のオーディオ信号の分類に従って、音楽および映画素材に関する設定パラメータが自動的に選定されることを特徴とする請求項１から６までのいずれか一つに記載の方法。
フロントセンターチャネルのフロントレフトおよびフロントライトチャネルへの迂回が行われ、この迂回の度合いが個別に行われることを特徴とする請求項７に記載の方法。
当該のオーディオ信号の分類のために、当該のオーディオ信号からの異なる尺度（Ｍ１〜Ｍ６）および／または当該のオーディオ信号のソース（Ｍ７）が検出され、これらの検出された尺度（Ｍ１〜Ｍ７）が異なる程度で重み付けされて、総合尺度（ＭＧ）が検出され、この総合尺度にもとづいて、当該のオーディオ信号の分類が行われることを特徴とする請求項１から８までのいずれか一つに記載の方法。
当該のオーディオ信号の分類のために、第一の尺度（Ｍ１）として、入力信号のダイナミックレンジおよび／またはそのレベルが用いられることを特徴とする請求項９に記載の方法。
当該のオーディオ信号の分類のために、第二の尺度（Ｍ２）として、オーディオ信号の周期性が用いられることを特徴とする請求項９または１０に記載の方法。
当該のオーディオ信号の分類のために、第三の尺度（Ｍ３）として、音楽に特有の信号スペクトルの存在が用いられることを特徴とする請求項９から１１までの一つに記載の方法。
管楽器および弦楽器に特有の信号スペクトルが識別されることを特徴とする請求項１２に記載の方法。
当該のオーディオ信号の分類のために、第四の尺度（Ｍ４）として、オーディオ信号の周波数推移の平坦性が用いられることを特徴とする請求項９から１３までの一つに記載の方法。
当該のオーディオ信号の分類のために、第五の尺度（Ｍ５）として、スペクトルにおいて一定の最低レベルを持つものと見なされる極大値の数が用いられることを特徴とする請求項９から１４までの一つに記載の方法。
当該のオーディオ信号の分類のために、第六の尺度（Ｍ６）として、スペクトルにおいて異なる周波数での類似したスペクトル構造の存在が用いられることを特徴とする請求項９から１５までの一つに記載の方法。
当該のオーディオ信号の分類のために、第七の尺度（Ｍ７）として、音楽信号のソースの種類が用いられることを特徴とする請求項９から１６までの一つに記載の方法。
当該のオーディオ信号のソースが、ＣＤ、ＤＶＤ、データファイル、ラジオ放送信号受信機、オーディオ放送信号受信機、衛星放送信号受信機、ケーブル放送信号受信機、テレビ放送受信機であることを特徴とする請求項１７に記載の方法。
当該のデータファイルが、ＭＰ３ファイルであることを特徴とする請求項１８に記載の方法。
当該のオーディオ信号用の総合尺度（ＭＧ）が、当該の個別の尺度（Ｍ１〜Ｍ７）を重み付けして合算することによって算出されることを特徴とする請求項１から１９までの一つに記載の方法。
当該の総合尺度（ＭＧ）を評価する際に、ヒステリシスが利用され、それによって、境界での僅かな変動による頻繁な切り換えが回避されることを特徴とする請求項１から２０までの一つに記載の方法。
当該のオーディオ信号の分類が、設定可能な継続時間の間に一定であった場合に、初めて別のサウンドアルゴリズムへの切り換えが行われることを特徴とする請求項１から２１までの一つに記載の方法。
当該のサウンドアルゴリズムが相互に転換され、その転換する時間が利用者によって設定可能であることを特徴とする請求項２２に記載の方法。
当該のオーディオ信号の分類において、継続時間が算定され、総合尺度（ＭＧ）が明確な分類をもたらす場合には、総合尺度（ＭＧ）に従って、一つのサウンドアルゴリズムから別のサウンドアルゴリズムに転換する時間が低減されることを特徴とする請求項２２または２３に記載の方法。
ソース信号の切り換え事象が識別され、その場合には、当該のオーディオ信号の分類における継続時間および一つのサウンドアルゴリズムから別のサウンドアルゴリズムに転換するための時間が低減されることを特徴とする請求項２２から２４までの一つに記載の方法。
不意に発生する信号の休止時間への切り換え事象が、識別されることを特徴とする請求項２５に記載の方法。
画像信号の同期外れへの切り換え事象が、識別されることを特徴とする請求項２５に記載の方法。
請求項１から２７までのいずれか一つに記載の方法を実行するための装置。