JP6562572B2 - ステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置及び方法 - Google Patents

ステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置及び方法 Download PDF

Info

Publication number
JP6562572B2
JP6562572B2 JP2017530733A JP2017530733A JP6562572B2 JP 6562572 B2 JP6562572 B2 JP 6562572B2 JP 2017530733 A JP2017530733 A JP 2017530733A JP 2017530733 A JP2017530733 A JP 2017530733A JP 6562572 B2 JP6562572 B2 JP 6562572B2
Authority
JP
Japan
Prior art keywords
panning
audio signal
stereo
signal
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017530733A
Other languages
English (en)
Other versions
JP2018505583A (ja
Inventor
ゲイジャー、ユルゲン
グロッシェ、ピーター
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2018505583A publication Critical patent/JP2018505583A/ja
Application granted granted Critical
Publication of JP6562572B2 publication Critical patent/JP6562572B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

本発明は、オーディオ信号処理、特に、ステレオイメージの幅を含む、ステレオ信号のステレオイメージ修正の分野に関する。
ステレオ信号の知覚される空間幅/ステレオイメージを修正(特に、増加)することができるいくつかの異なる解決手段が知られている。
ステレオ拡張アプローチの1つのファミリは、時間ドメインにおいて実行可能な単純線形処理に依存する。特に、ステレオ信号ペアは、中間(両方のチャネルの和)及び側方(差)信号に変換可能である。そこで、中間に対する側方の割合が増加し、変換が戻されて、ステレオペアを得る。その効果は、ステレオ幅を増加させる。ステレオ幅は、理論上、ラウドスピーカスパンより大きく拡張されることもできるが、これらの方法の帰属は、主に、「内部」ステレオ修正アプローチに分類されることができる。演算の複雑性は非常に低いが、このような方法にはいくつかの短所がある。音源は、ステレオステージの中で再配分されるのみならず、異なる様に、スペクトル的に重み付けもされる。すなわち、ステレオ信号のスペクトルコンテンツは、拡張プロセスを介して修正される。これは、音質を劣化させることがある。例えば、(側方信号に含まれる)残響のレベルが増加し、(音声のような)中心にパニングされた音源のレベルが減少することがある。このようなアプローチの例が、EP 06 772 35B1 及びUS 6 507 657B1に見られる。
ステレオ拡張のための他のアプローチが、「外部」ステレオ修正として分類可能なクロストークキャンセレーション(CTC)である。CTCの目標は、ステレオ幅をラウドスピーカスパン角度より大きく増加させること、換言すると、ラウドスピーカスパン角度を仮想的に増加させることである。このために、このような方法は、ステレオ信号をフィルタリングし、左側ラウドスピーカから右耳への経路をキャンセルし、逆もまた同様にしようとする試みである。しかしながら、このようなアプローチは、例えば、信号がステレオステージ全体を用いない場合、信号における制限を克服することができない。さらに、CTCは、音質歪みのアーチファクト(すなわち、スペクトル歪み)を導入し、これが、リスニング体験を悪化させる。さらに、CTCは、比較的小さいスイートスポットにのみ作用する。これは、望ましい効果が、小さいリスニングエリアでのみ知覚可能であることを意味する。CTCの一例が、US6928168B2に示される。
本発明の目的は、第1のオーディオ信号及び第2のオーディオ信号を含むステレオ信号のステレオイメージを修正することである。
この目的は、独立請求項に記載の特徴によって実現される。さらに、実装形式は、従属請求項、詳細な説明及び図から明らかである。
第1の態様によれば、本発明は、第1のオーディオ信号及び第2のオーディオ信号を含むステレオ信号のステレオイメージを修正するオーディオ信号処理装置に関する。オーディオ信号処理装置は、周波数帯域幅内にあるステレオ信号の時間周波数セグメントの少なくとも全てのパニング指標にマッピング関数を適用し、これにより、修正されたパニング指標を提供するように構成されるパニング指標修正器を含む。少なくとも全てのパニング指標は、ステレオ信号の時間周波数セグメントのパニング位置を特定する。
装置は、修正されたパニング指標に基づいて、第1のオーディオ信号及び第2のオーディオ信号の時間周波数信号セグメントに対して、修正されたパニング利得を決定するように構成される第1のパニング利得決定器と、修正されたパニング利得と時間及び周波数において修正されたパニング利得に対応する第1のオーディオ信号及び第2のオーディオ信号のパニング利得との間の割合に従って、ステレオ信号を再パニングし、これにより、再パニングされたステレオ信号を提供するように構成される再パニング器と、をさらに含む。本明細書において用いられるように、パニング利得は、例えば、これらが両方とも同じ時間周波数ビン又はセグメントに対する値を含む場合に、互いに対応する。
従って、ステレオ信号のステレオイメージは、ステレオ信号のスペクトルエネルギを再配分することによって修正される。この技術により、修正されていないステレオ信号に対して、拡張又は縮小されたステレオイメージを有し得る再パニングされたステレオ信号は、望ましくないアーチファクト又はスペクトル歪みを含まない。
第1の態様に係るオーディオ信号処理装置の第1の実装形式において、パニング指標修正器は、少なくとも全てのパニング指標に、非線形マッピング関数を適用するように構成される。
第1の態様に係るオーディオ信号処理装置の第2の実装形式において、マッピング関数は、シグモイド関数に基づく。
非線形マッピング関数(シグモイドマッピング関数を含む)は、ステレオイメージの中心ではなく、より側方に向かってパニングされる音源に対する人間の定位分解能の減少のような、知覚的に動機付けられる曲線を含んでよい。これらの機能は、ステレオイメージ内における音源のクラスタリングをさらに回避してよい。
第1の態様に係るオーディオ信号処理装置の第3の実装形式又は第1の態様のいずれかの前述の実装形式において、マッピング関数は、
として表され、又はこれに基づく。ここで、Ψ(m,k)は、パニング指標を示し、Ψ'(m,k)は、修正されたパニング指標を示し、aは、マッピング関数曲率を制御する。
第1の態様に係るオーディオ信号処理装置の第4の実装形式又は第1の態様のいずれかの前述の実装形式において、パニング指標修正器は、少なくとも全てのパニング指標に、多項式マッピング関数を適用するように構成される。多項式マッピング関数は、複雑な分析関数に対して、複雑性を低減させてよい(例えば、除算及び指数関数を加算及び乗算と置換する)。
第1の態様に係るオーディオ信号処理装置の第5の実装形式又は第1の態様のいずれかの前述の実装形式において、再パニング器は、以下の式
に従って、ステレオ信号を再パニングするように構成される。ここで、X(m,k)は、第1のオーディオ信号の時間周波数信号セグメントを示す。X(m,k)は、第2のオーディオ信号の時間周波数信号セグメントを示す。
'(m,k)は、再パニングされたステレオ信号の再パニングされた第1のオーディオ信号の時間周波数信号セグメントを示す。
'(m,k)は、再パニングされたステレオ信号の再パニングされた第2のオーディオ信号の時間周波数信号セグメントを示し、
(m,k)は、第1のオーディオ信号に対する時間周波数信号セグメントのパニング利得を示し、
(m,k)は、第2のオーディオ信号に対する時間周波数信号セグメントのパニング利得を示し、
g'(m,k)は、第1のオーディオ信号に対する時間周波数信号セグメントの修正されたパニング利得を示し、
g'(m,k)は、第2のオーディオ信号に対する時間周波数信号セグメントの修正されたパニング利得を示す。
第1の態様に係るオーディオ信号処理装置の第6の実装形式又は第1の態様のいずれかの前述の実装形式において、第1のパニング利得決定器は、以下の式
に基づいて、修正されたパニング利得を決定するように構成される。
第1の態様に係るオーディオ信号処理装置の第7の実装形式又は第1の態様のいずれかの前述の実装形式において、パニング指標修正器は、少なくとも約1500Hzであるオーディオ信号に対する値を有するステレオ信号の時間周波数セグメントの全てのパニング指標に、マッピング関数を適用するように構成される。これにより、知覚的に動機付けられる態様で、処理された周波数範囲の限定による演算の複雑性を低減させる。従って、この閾値を下回る周波数は、ステレオイメージに対して知覚される拡張又は縮小効果の多くを失うことなく、変化せずに残存することができる。
第1の態様に係るオーディオ信号処理装置の第8の実装形式又は第1の態様の第1から第6の実装形式のいずれかにおいて、パニング指標修正器は、ステレオ信号の時間周波数セグメントの全てのパニング指標に対してマッピング関数を適用するように構成される。
第1の態様に係るオーディオ信号処理装置の第9の実装形式又は第1の態様のいずれかの前述の実装形式において、指標修正器は、マッピング関数の曲線を選択するためのパラメータを受信するようにさらに構成される。これにより、ユーザは、ステレオイメージ修正のタイプ(例えば、線形又は非線形マッピング関数)及びステレオイメージ修正が適用される度合い(例えば、マッピング関数曲線の曲率)の少なくとも1つを選択することができる。
第1の態様に係るオーディオ信号処理装置の第10の実装形式又は第1の態様のいずれかの前述の実装形式において、オーディオ信号処理装置は、時間及び周波数において対応する第1のオーディオ信号及び第2のオーディオ信号の時間周波数信号セグメント値の比較に基づいて、少なくとも全てのパニング指標を決定するように構成されるパニング指標決定器、及び少なくとも全てのパニング指標に基づいて、第1のオーディオ信号及び第2のオーディオ信号の時間周波数信号セグメントに対して、パニング利得を決定するように構成される第2のパニング利得決定器の少なくとも1つをさらに含む。
前述の実装形式に係るオーディオ信号処理装置の第11の実装形式において、第1のパニング利得決定器及び第2のパニング利得決定器の少なくとも1つは、多項式関数を用いる。これにより、その関数の近似による正弦及び余弦関数を多項式関数と置換することに起因する演算の複雑性が低減される。
第1の態様に係るオーディオ信号処理装置の第12の実装形式又は第1の態様のいずれかの前述の実装形式において、装置は、ステレオ信号を、時間ドメインから周波数ドメインに変換するように構成される1つ又は複数の時間対周波数ユニット、及び再パニングされたステレオ信号を、周波数ドメインから時間ドメインに変換するように構成される1つ又は複数の周波数対時間ユニットの少なくとも1つをさらに含む。
第1の態様に係るオーディオ信号処理装置の第13の実装形式又は第1の態様のいずれかの前述の実装形式において、装置は、再パニングされたステレオ信号の第1のオーディオ信号と第2のオーディオ信号との間のクロストークをキャンセルするように構成されるクロストークキャンセラをさらに含む。再パニングされたステレオ信号は、ステレオシステムを介して再現可能である潜在的な最大ステレオイメージのより多くを取り上げ、従って、ステレオシステムのラウドスピーカより大きく拡張するように知覚されるステレオイメージの形成において、クロストークキャンセレーションに対してより有効なステレオ信号をもたらす。
第2の態様によれば、本発明は、第1のオーディオ信号及び第2のオーディオ信号を含むステレオ信号のステレオイメージを修正するためのオーディオ信号処理方法に関する。方法は、パニング指標及びパニング利得を取得する段階であって、取得されたパニング指標は、ステレオ信号の時間周波数セグメントに対するパニング位置を特定し、取得されたパニング利得は、第1のオーディオ信号及び第2のオーディオ信号の時間周波数信号セグメントに対するパニング位置を特定する、段階と、周波数帯域幅内にあるステレオ信号の時間周波数セグメントの取得されたパニング指標の少なくとも全てにマッピング関数を適用し、これにより、修正されたパニング指標を提供する段階と、修正されたパニング指標に基づいて、第1のオーディオ信号及び第2のオーディオ信号の時間周波数信号セグメントに対して、修正されたパニング利得を決定する段階と、修正されたパニング利得と、時間及び周波数において修正されたパニング利得に対応する取得されたパニング利得との間の割合に従って、ステレオ信号を再パニングする段階と、を含む。
オーディオ信号処理方法は、オーディオ信号処理装置によって実行可能である。オーディオ信号処理方法のさらなる特徴は、いずれかの実装形式のオーディオ信号処理装置の機能によって実行されてよい。
第3の態様によれば、本発明は、コンピュータ上で実行された場合に、当該方法を実行するプログラムコードを備えるコンピュータプログラムに関する。
オーディオ信号処理装置は、コンピュータプログラムを実行するようにプログラム可能に構成されてよい。本発明は、ハードウェア及び/又はソフトウェアで実装されてよい。
本発明の実施形態は、以下の図に関連して説明される。
様々なステレオイメージ幅の図である。 様々なステレオイメージ幅の図である。 様々なステレオイメージ幅の図である。 実施形態に係るステレオ信号の時間周波数信号セグメントのパニング指標を修正するためのオーディオ信号処理装置の図を示す。
ステレオイメージを拡張するためのマッピング曲線の可能な実装形式を示すグラフである。 ステレオイメージを拡張するためのマッピング曲線の可能な実装形式を示すグラフである。 ステレオイメージを拡張するためのマッピング曲線の可能な実装形式を示すグラフである。
実施形態に係るステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置の図を示す。
実施形態に係るステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置の図を示す。
実施形態に係るステレオ信号のステレオイメージを修正するためのオーディオ信号処理方法の図を示す。
図1Aから1Cは、様々なステレオイメージ幅の図である。特に、図1Aは、最も広い可能なステレオイメージより狭い未処理のステレオ信号によって生成されたステレオイメージ幅の例を示す。図1B及び1Cは、それぞれ、ステレオイメージの内部及び外部の拡張を示す。
媒体(例えば、音楽又は映画)のステレオ録音は、仮想のステレオサウンドステージ又はステレオイメージ内に分散された異なる音源を含む。音源は、ステレオペアのラウドスピーカ間距離によって定義及び限定されるステレオイメージ幅内に配置されてよい。例えば、振幅のパニングは、ステレオイメージ内の任意の空間に音源を配置するために用いられてよい。場合により、最も広い可能なステレオイメージは、ステレオ録音に用いられない。このような場合、ステレオシステムが生成可能な最も広い可能なステレオイメージを活用すべく、音源の空間分布を修正することが望ましい。これにより、知覚されるステレオ効果が向上し、より深いリスニング体験がもたらされる。
ステレオペアのスピーカが互いから遠く離れて配置される場合のような、ステレオイメージを縮小することが望ましい他の適用シナリオが存在することがある。
図1Aのステレオイメージに対して、ステレオイメージの内部拡張が、図1Bによって示される。クロストークキャンセレーション(CTC)を利用可能な外部拡張が、図1Cによって示される。外部拡張は、知覚されるステレオイメージをラウドスピーカスパンより大きく拡張することを試みる。実施形態は、相補的な内部及び外部のステレオ修正のための装置及び方法を含んでよく、従って、より良い効果を実現し、リスニング体験をさらに向上させるように、組み合わせられてよい。
実施形態は、ステレオイメージを内部的に修正(例えば、縮小又は拡張)するための装置及び方法をさらに含んでよい。ステレオ信号から、ステレオイメージ内における音源の位置を特定する、時間及び周波数から独立した測定値(例えば、パニング指標)が抽出されてよい。
当業者は、パニング指標、及びこれらの指標をどのように算出するかを認識している。本発明は、特に、周波数帯域幅内にあるステレオ信号の時間周波数セグメントの少なくとも全てのパニング指標にマッピング関数を適用すること(例えば、これらの指標をマッピングすること)によって、従来技術から乖離する。すなわち、周波数帯域幅(例えば、1.5から22kHz)内にあるスペクトルコンテンツを含む時間周波数セグメントは、ステレオ信号を内部的に修正するように修正されてよい。周波数帯域幅は、ステレオ信号の帯域幅より大きくてよく、これと同じでよく、又はこれより小さくてよい。
例えば、マッピング関数は、スピーカ間の距離全体を広げるようにステレオイメージを拡張すべく、全ての時間周波数ビンのパニング指標に適用されてよい。異なるマッピング関数が、図3から5の説明において、より詳細に説明される。
本発明の1つの利点は、パニング指標の修正が、時間及び周波数から独立していてよい、従って、ステレオ信号のコンテンツから独立していてよいことである。信号の一部が修正ステレオイメージにおいて再配分されるだけなので、ステレオ信号の全体的なスペクトル分布は、変化しない。その結果、音質歪みのアーチファクト(スペクトル歪み)は導入されない。パニング指標修正は、ステレオイメージ拡張の場合、より広いステレオイメージをもたらす。ここで、音源は、より側方/スピーカの境界に向かい、かつ、ステレオイメージの中心から離れて動かされる。
さらに、実施形態は、従来技術に対して、修正されたステレオ信号に対して知覚的に影響を与える(例えば、歪みを追加する)ことなく、ステレオイメージ修正の演算の複雑性を低減させることができる。このために、パニング指標を修正するマッピング関数は、多項式関数を介して近似されてよい。そこで、マッピング曲線の分析式を評価する代わりに、多項式関数が評価される。多項式関数を評価する演算の複雑性は、マッピング曲線の分析式に対するものより低いので、これにより、システムの複雑性が全体的に低減される。
同様に、マッピング曲線は、分析式又は多項式関数に従って、パニング指標をマッピングするルックアップテーブル(LUT)として実装されてよい。
実施形態は、ステレオ信号からパニング指標を抽出することを含む。パニング指標を抽出するためのアプローチが、米国特許第7,257,231B1において説明されている。高速フーリエ変換(FFT)のような時間周波数変換の後で、パニング指標は、ステレオ信号の各時間周波数セグメントに対して算出されてよい。時間周波数信号セグメントは、所与の時間及び周波数間隔における信号の表現に対応する。例えば、時間周波数信号セグメントは、所与の時間セグメントに対して生成される(複雑な)周波数サンプルに対応してよい。従って、各時間周波数信号セグメントは、対応するセグメントにFFTを適用することによって生成されるFFTビン値であってよい。
パニング指標は、ステレオ信号の左右のチャネル(又は第1及び第2のチャネル)間の関係から導出される。人間の聴覚機構は、音源の定位のために2つの耳における信号間の時間及びレベル差を用いるが、パニング指標は、レベル差のみに基づいてよい。各時間周波数信号セグメントに対して、パニング指標は、ステレオステージ(すなわち、ステレオイメージにおいて時間周波数信号セグメントが「出現」する場所)において対応する角度を特定する。
図2は、実施形態に係るステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置200の図を示す。装置200は、パニング指標修正器202を含む。パニング指標修正器202は、周波数帯域幅内にあるステレオ信号の時間周波数セグメントの少なくとも全てのパニング指標Ψ(m,k)にマッピング関数を適用し、これにより、修正されたパニング指標を提供するように構成される。
例えば、入力されたパニング指標Ψ(m,k)は、時間及び周波数から独立して修正され、従って、修正されたパニング指標Ψ'(m,k)を取得してよい。
修正は、ステレオイメージを縮小又は拡張することを含む。例えば、ステレオイメージ自体がラウドスピーカスパンによって限定されるので、「用いられる」ステレオイメージの一部(例えば、パニングするオーディオ信号のスペクトル分布と比較した、ステレオシステムを介して生成可能な知覚される幅の量)が、拡張されてよい。結果として、異なるステレオシステムは、例えば、ステレオラウドスピーカ間の距離に起因する、異なる修正曲線を用いてよい。
すなわち、パニング指標を修正する1つの実現態様は、異なる様にパニングされた音源を、より側方に向けて動かし、従って、ステレオイメージにおける分布を「引き延ばす」ことである。
サウンドイメージの用いられる幅の拡張又は最適化は、いくつかの用途に有用である。いくつか信号は、全体が適用可能なステレオイメージを用いなくてよく、分布の拡張は、望ましくないアーチファクトを拡張されたステレオ信号に導入することなく、より深いリスニング体験をもたらすことができる。
他の用途は、拡張された信号をクロストークキャンセレーション(CTC)又は同様の技術でさらに処理することであり、これは、典型的には、知覚されるステレオイメージを、ラウドスピーカの距離より大きく拡張する音響心理モデルに依存する。この目標は、しかしながら、完全には実現されていない。この場合、入力信号の内部拡張は、CTCの実際の制限を克服し、音源の空間分布が正確に維持されるより広いステレオイメージに寄与することができる。
さらに、特定のリスニングのセットアップは、ステレオイメージの修正を必要とすることがある。例えば、従来のステレオ再生セットアップにおいて、ラウドスピーカスパンは、(最適なステレオリスニング条件と比較して)広すぎることがあり、用いられる信号のステレオステージを縮小し、準最適なラウドスピーカセットアップを補償することが有益なことがある。
従って、実施形態は、ラウドスピーカ間、及びリスニングスポットと2つのラウドスピーカの各々との間の距離情報を取得することを含んでよい。
ステレオイメージを拡張するために、パニング指標修正器202は、音源をステレオイメージのより側方に向けて動かすべく、(時間及び周波数から独立した)パニング指標の絶対値を増加させる必要がある。理想的には、知覚される「穴」(例えば、音源が存在しない場所)がサウンドイメージ内に形成されない。また、いくつかの音源が共にクラスタリングされるステレオイメージにおいて、スポットが形成されてはならない。
数学的用語で言うと、これらの2つの要件は、例えば、全単射マッピング関数によって満たされる。他の基準は、安定した、単調に増加する関数を有することであってよい。マッピング曲線/関数の他の要件は、中心にパニングされる全ての音源が、中心に残されるべきことであってよい。
さらに、マッピング曲線は、人間の聴覚能力に関する音響心理的な知見を利用してよい。例えば、人間の定位の差異に対する角度分解能は、側方(約15度)と比較して、ステレオイメージの中心(約1度)で高い。
そこで、時間及び周波数から独立してパニング指標を修正し、理想的には、上述された特性のいくつか又は全てを満たすマッピング曲線又はマッピング関数が、必要とされてよい。
図3から5は、ステレオイメージを拡張するためのマッピング曲線の可能な実装形式を示すグラフである。パニング指標は対称なので、0と1との間の範囲のみが説明されることがあるが、−1と0との間の範囲が、対称な曲線又は関数を介して適宜処理されてよい。勿論、パニング指標は、−1から1に加えて、他の値の範囲を用いてよい。
ステレオ拡張のための1つの可能な実装形式は、定数でパニング指標を乗算し、これを最大の1に限定することである。
ここで、pは、幅の増加の傾きを制御する係数である。異なる再パニング係数pによって得られたいくつかの曲線が、図3に示される。パニング指標修正器202は、図3に示される(例えば、導出又は近似された)1つ又は複数の曲線に従って、又はこれに基づいて、入力されたパニング指標を修正してよい。
この実装形式の利点は、再パニング曲線が単純なことである。しかしながら、図3の曲線は、全単射関数を表さない。曲線における屈曲より大きいパニング指標を有する全ての音源が、最大パニング指標の1にマッピングされる。
ステレオイメージを拡張するためのマッピング曲線の1つの可能な実装形式が、図4によってグラフ形式で示される。パニング指標修正器202は、図4に示される(例えば、導出又は近似された)1つ又は複数の曲線に従って、又はこれに基づいて、入力されたパニング指標を修正してよい。
図4に示される曲線は、区分的線形であり、図4においてそれぞれ0.1及び0.8である低屈曲点b及び高屈曲点bによって制御され、かつ、勾配pによっても制御される。bより小さいパニング指標は、修正されていない。勾配pは、bより大きく、出力されたパニング指標bまでのパニング指標に適用される。これより上では、勾配は、関数が点(1,1)に到達する態様で決定される。このような曲線のファミリは、中心に(又は中心近くに)パニングされる音源が修正されておらず、かつ、曲線が全単射であるという要件を満たす。しかしながら、曲線は区分的線形であり、従って、屈曲を有するので、修正されたパニング指標分布において不自然なクラスタリングを引き起こすことがある。
シグモイド関数に基づく(例えば、導出もしくは近似される)、又はシグモイド関数として表される他の実装形式は、上述の制限を克服することができる。図5に表示された曲線は、安定しており、屈曲がなく、全単射関数を表す。パニング指標修正器202は、図5に示される1つ又は複数の曲線に従って、又はこれに基づいて、入力されたパニング指標を修正してよい。
曲線の分析式は、以下の通り導出されてよい。曲線は、シグモイド関数に基づく。
これは、曲線の仮の形を表す。パラメータa=2−1は、曲線を制御し、pの増加は、曲線の拡張効果を増加させる。曲線を点(0,0)及び(1,1)に一致させるべく、アフィン変換が適用され、その結果、曲線の最終形となる。
これは、pから導出されるパラメータaによって、なおも制御される。この曲線式は、ここで、前述の要件を満たす。例えば、人間に見られる角度分解能定位(例えば、単に顕著な角度差)は、この曲線式と共に利用される。0から1のスケールにおいて、(中心にパニングされる音源に対応する)より小さいパニング指標はわずかに増加するが、より大きいパニング指標に対しては、知覚される差をもたらすべく、より大きい増加が必要とされる。
説明されたように、全てのパニング指標修正曲線は、ここで、0と1との間の範囲のパニング指標に対してのみ定義される。−1と0との間の範囲に対する適用は、関数のミラーリング(特に、座標系の横座標及び縦座標においてミラーリング)された形の直線である。分析式において、−1と0との間のパニング指標範囲をカバーすべく、式(3)は、以下の通り修正されてよい。
さらに、全ての曲線は、ステレオ拡張の代わりに、対角軸y=xにおけるミラーリングによって、ステレオ縮小に適用されてもよい。これは、式(3)の逆関数によって得ることができる。
ここで、範囲
である。
パニング指標修正器202は、図3から5に示される(例えば、導出又は近似された)1つ又は複数の曲線に従って、又はこれに基づいて、入力されたパニング指標を修正してよい。例えば、パニング指標修正器202は、1つの曲線のみを用いるように構成されてよい。パニング指標修正器202は、1つのマッピング関数のみを用いるように構成されてよい。パニング指標修正器202は、ユーザ入力を受信するように構成されてよい。ここで、マッピング関数曲率は制御され(例えば、pに関するパラメータを受信すること)、及び/又は、マッピング関数の選択(例えば、図3から5に関するマッピング関数の1つ)が選択される。
パニング指標修正器202は、いくつかの態様で、マッピング関数を実装してよい。例えば、一実装形式は、パニング指標をマッピングするために、式(3)又は(4)を直接用いる。
他の実装形式は、式(3)又は(4)(すなわち、多項式マッピング関数)における複雑な分析関数の多項式近似を介して、演算の複雑性を低減させる。例えば、望ましいマッピング曲線に対する多項式関数の最小二乗適合は、より効率的な実装をもたらす。多項式の次数は、制御されてよい。多項式係数は、一度演算され、格納されてよい。ランタイム中に、多項式は、曲線の分析式の代わりに評価される。式(3)の分析式における除算及び指数関数は、チップ実装において非常に高価となり得る。これらをいくつかの加算及び乗算によって置換することにより、演算の複雑性を低減させる助けとなる。
他の実装形式は、処理された周波数範囲を限定することによって、演算の複雑性を低減させる。パニング指標修正は周波数から独立して実行されてよいが、人間の聴覚システムの特定の能力は、演算の複雑性を低減させるために利用可能である。実施形態は、振幅パニングを用い、従って、主に、おおよそ1500Hz又はこれより高い周波数の音源の定位に用いられる両耳間のレベル差に依存する。従って、この閾値を下回る周波数は、ステレオ拡張効果の多くを失うことなく、変化せずに残存することができる。
他の実装形式は、ルックアップテーブルを介して、マッピング関数を実装する。この場合、関数は、離散化される。
図6は、実施形態に係るステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置600の図を示す。パニング利得決定器602は、修正されたパニング指標Ψ'(m,k)を受信する。これは、上述されたように、パニング指標修正器202によって修正されてよい。パニング利得決定器604は、例えば、ステレオ信号から抽出された、修正されていないパニング指標Ψ(m,k)を受信する。
パニング利得決定器602及び604の各々は、受信されたパニング指標に基づいて、パニング利得を生成する。前述されたように、各パニング指標は、ステレオイメージ内における特定の位置を特定する。所与のパニング指標(Ψ(m,k)又はΨ'(m,k))に対して、ステレオチャネル利得は、一実装形式において、エネルギー保存パニング法を用いるパニング利得決定器604及び604によって、決定されてよい。
ここで、g(m,k)及びg(m,k)は、それぞれ、入力ステレオ信号のm及びkによって決定された時間周波数ビンに対して、左(例えば、第1の入力信号)及び右(例えば、第2の入力信号)チャネルに対する利得を示す。パニング利得決定器602は、エネルギー保存パニング法を用いて、修正されたパニング利得g'(m,k)及びg'(m,k)を算出してよい。
パニング利得決定器602及び604の一実装形式において、多項式近似は、例えば、近似による正弦及び余弦関数を多項式関数と置換することによって、式(6)に従ってパニング利得を算出するために用いられてよい。
この点において、特定の時間周波数ビン(すなわち、ステレオ信号の時間周波数セグメント)に含まれる信号は、再パニング器606を介して修正ステレオイメージを形成するように動かされてよい。再パニング器606は、パニング利得、修正されたパニング利得、及びパニング利得の基礎となる入力ステレオ信号を受信してよい。再パニング器606の一実装形式において、再パニング器606は、以下の式を用いて、修正ステレオイメージを有するステレオ信号を生成する。
ここで、X(m,k)、X(m,k)は、入力ステレオ信号であり、X'(m,k)及びX'(m,k)は、修正ステレオイメージを有する出力ステレオ信号である。
装置600は、再パニングされたステレオ信号((X'(m,k)及びX'(m,k))の第1のオーディオ信号と第2のオーディオ信号との間のクロストークをキャンセルし、ラウドスピーカの距離より大きく拡張するように知覚されるステレオイメージを有するステレオ信号(XCTC (m,k)及びXCTC (m,k))を出力するように構成されるクロストークキャンセラ608をさらに含んでよい。
図7は、実施形態に係るステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置700の図を示す。入力ステレオ信号(x(t)、x(t))は、時間対周波数ユニット702を介して、周波数ドメイン信号(X(m,k)、X(m,k))に変換される。
時間周波数変換の後で、例えば、米国特許第7,257,231B1において説明される方法を用いて、パニング指標決定器704を介して、パニング指標がステレオペアX(m,k)、X(m,k)から抽出される。
パニング指標を抽出するためのこの方法は、信号X(m,k)とX(m,k)との間の振幅の類似性に基づく。例えば、特定の時間周波数ビンにおける類似性がより低い場合、この時間周波数ビンに対応する音源は、1つの側方、すなわち、2つの入力信号の一方の方向に、よりパニングされる。パニング指標決定器704の一実装形式において、類似度指標Ψ(m,k)は、以下の通り算出される。
ここで、分母の項はそれぞれ、ステレオ入力信号の第1(左)及び第2(右)の信号における信号エネルギである。この類似度指標は、X(m,k)及びX(m,k)に関連して対称である。従って、この類似度指標は、曖昧さを招き、それ自体で、信号がパニングされる方向(例えば、左又は右)を示すことができない。曖昧さを解決すべく、エネルギー差
が用いられてよい。インジケータは、パニング指標を得るべく、エネルギー差から導出され、
類似度指標Ψ(m,k)と組み合わせられる。
本実装形式において、パニング指標決定器704は、−1から1の適用可能範囲を有するパニング指標を提供する。ここで、−1は、第1の入力信号(左)に完全にパニングされる信号を示し、0は、中心にパニングされる信号に対応し、1は、第2の入力信号(右)に完全にパニングされる信号を示す。ステレオイメージ内で知覚される角度は、パニング指標によって特定される。
パニング指標修正器202は、上述されたように、受信されたパニング指標を修正してよい。一実装形式は、ユーザ入力インタフェース705を含む。これは、ステレオイメージ修正(例えば、マッピング関数曲率)の度合いを制御する、及び/又は、パニング修正のタイプを選択する(例えば、図3から5に示される曲線のファミリに対応するパニング修正技術の1つを選択する)パラメータを提供してよい。
パニング利得決定器602及び604は、上述されたように、パニング利得を生成してよい。これは、次に、上述されたように、修正ステレオイメージ(すなわち、再パニングされたステレオ信号)を有する出力ステレオ信号を生成する再パニング器606に供給されてよい。出力ステレオ信号は、周波数対時間ユニット706によって時間ドメインに変換され、従って、時間ドメイン出力ステレオ信号x'(t)及びx'(t)を出力する。
装置700の一実装形式において、時間ドメイン信号は、ブロックサイズ512又は1024、サンプリングレート48kHzの高速フーリエ変換を用いて、ユニット702を介して周波数ドメインに変換されてよい。発明者らは、パニング指標修正器202によって用いられるパニング指標のマッピング関数に対して、多項式近似が多項式次数3に設定され、パニング利得決定器602及び604によって用いられるパニング利得の算出に対して2に設定された場合に、精度及び複雑性の低減において良好なトレードオフを見出している。再パニングパラメータp=4及び多項式次数3に対して、多項式係数は、[a]=[4.5214 −8.4350 4.8328 0.1724]であってよい。多項式関数は、次に、パニング指標修正器によって、Ψ'=a・Ψ+a・Ψ+a・Ψ+aとして用いられてよい。
実施形態は、図7に示される全ての特徴を含んでよいが、再パニング器606のみを含んでもよい。例えば、ビットストリームは、パニング利得、修正されたパニング利得、及び周波数ドメイン入力ステレオ信号を含んでよく、これらの全ては、再パニング器606に供給されてよい。他の変形において、パニング指標は、ビットストリームに含まれてよく、従って、パニング指標決定器704は、必要ではないことがある。
図8は、実施形態に係るステレオ信号のステレオイメージを修正するためのオーディオ信号処理方法の図を示す。
段階800は、パニング指標及びパニング利得を取得する段階を含む。取得されたパニング指標は、入力ステレオ信号のステレオ信号の時間周波数セグメントに対するパニング位置を特定し、取得されたパニング利得は、入力ステレオ信号の第1のオーディオ信号及び第2のオーディオ信号の時間周波数信号セグメントに対するパニング位置を特定する。当該指標及び利得は、上述されたように、ビットストリームから直接取得され、もしくは、入力ステレオ信号に基づいて算出されてよく、又は、これらの組み合わせであってよい。
段階802は、周波数帯域幅内にあるステレオ信号の時間周波数セグメントの取得されたパニング指標の少なくとも全てにマッピング関数を適用する段階を含む。段階804は、修正されたパニング指標に基づいて、第1のオーディオ信号及び第2のオーディオ信号の時間周波数信号セグメントに対して、修正されたパニング利得を決定する段階を含む。
段階806は、修正されたパニング利得と、時間及び周波数において修正されたパニング利得に対応する取得されたパニング利得との間の割合に従って、入力ステレオ信号を再パニングする段階を含む。すなわち、パニング利得は、例えば、これらが両方とも同じ時間周波数ビン又はセグメントに対する値を含む場合に、互いに対応する。
本発明の実施形態は、コンピュータシステム上で動作し、かつ、コンピュータシステムのようなプログラム可能な装置上で動作する場合に本発明に係る方法の段階を実行する、又は、本発明に係るデバイス又はシステムの機能を実行するようにプログラム可能な装置を有効化するためのコード部分を少なくとも含む、コンピュータプログラムで実装されてよい。
コンピュータプログラムは、特定のアプリケーションプログラム及び/又はオペレーティングシステムのような命令のリストである。コンピュータプログラムは、例えば、サブルーチン、関数、手順、オブジェクト方法、オブジェクト実装、実行可能アプリケーション、アプレット、サーブレット、ソースコード、オブジェクトコード、共有ライブラリ/動的負荷ライブラリ及び/又はコンピュータシステム上で実行するために設計された他の命令シーケンスの1つ又は複数を含んでよい。
コンピュータプログラムは、コンピュータ可読記憶媒体の内部に格納されてよく、又は、コンピュータ可読送信媒体を介してコンピュータシステムに送信されてよい。コンピュータプログラムの全て又はいくつかは、永久的に、取り外し可能に、又は遠隔的に情報処理システムに連結される一時的又は非一時的コンピュータ可読媒体に提供されてよい。コンピュータ可読媒体は、例えば、限定的ではなく、いくつか例を挙げると、任意の数の以下の媒体、すなわち、ディスク及びテープ記憶媒体を含む磁気記憶媒体、コンパクトディスク媒体(例えば、CD−ROM、CD−R等)及びデジタルビデオディスク記憶媒体のような光記憶媒体、フラッシュメモリ、EEPROM、EPROM、ROMのような半導体ベースのメモリユニットを含む不揮発性メモリ記憶媒体、強磁性デジタルメモリ、MRAM、レジスタ、バッファ又はキャッシュ、メインメモリ、RAM等を含む揮発性記憶媒体、ならびにコンピュータネットワーク、ポイントツーポイント電気通信機器、及び搬送波送信媒体を含むデータ送信媒体を含んでよい。
コンピュータ処理は、典型的には、プログラム又はプログラムの一部、現在のプログラム値及び状態情報、ならびにプロセスの実行を管理するオペレーティングシステムによって用いられるリソースの実行又は動作を含む。オペレーティングシステム(OS)は、コンピュータリソースの共有を管理し、これらのリソースにアクセスするために用いられるインタフェースを有するプログラマを提供するソフトウェアである。オペレーティングシステムは、システムデータ及びユーザ入力を処理し、タスク及び内部システムリソースをユーザ及びシステムのプログラムに対するサービスとして割り当て及び管理することによって、応答する。
コンピュータシステムは、例えば、少なくとも1つの処理ユニット、関連付けられたメモリ及び多数の入力/出力(I/O)デバイスを含んでよい。コンピュータプログラムを実行する場合に、コンピュータシステムは、コンピュータプログラムに従って情報を処理し、I/Oデバイスを介して、その結果である出力情報を生成する。
本明細書で説明される接続は、例えば、中間デバイスを介して、それぞれのノード、ユニット又はデバイスから、又はこれらに対して、信号を転送するために適切な任意のタイプの接続であってよい。従って、異なるものとして示唆又は説明されない限り、接続は、例えば、直接接続であってよく、又は間接接続であってよい。接続は、単一の接続、複数の接続、単方向接続、又は双方向接続であるものを参照して、図示又は説明されてよい。しかしながら、異なる実施形態は、接続の実装を変化させてよい。例えば、双方向接続ではなく、別個の単方向接続が用いられてよく、逆もまた同様である。また、複数の接続は、複数の信号を連続的に、又は時間多重化の態様で転送する単一の接続と置換されてよい。同様に、複数の信号を伝送する単一の接続は、これらの信号のサブセットを伝送する様々な異なる接続に分離されてよい。従って、信号を転送するために、多数の選択肢が存在する。
当業者であれば、論理ブロック間の境界が例示に過ぎず、代替的な実施形態は、論理ブロック又は回路要素を併合してよく、又は、様々な論理ブロック又は回路要素に機能の代替的な分解を課してよいことを認識しよう。従って、本明細書に示されるアーキテクチャは例示に過ぎず、実際には、同じ機能を実現する多数の他のアーキテクチャが実装可能であることを理解されたい。
従って、同じ機能を実現するためのコンポーネントの任意の構成が、望ましい機能が実現されるように、効果的に「関連付けられ」ている。従って、特定の機能を実現するために組み合わせられた本明細書における任意の2つのコンポーネントは、アーキテクチャ又は中間コンポーネントに関わらず、望ましい機能が実現されるように、互いに「関連付けられ」るものと理解されてよい。同様に、このように関連付けられた任意の2つのコンポーネントは、望ましい機能を実現するように、互いに「動作可能に接続」又は「動作可能に連結」されたものと見られてもよい。
さらに、当業者であれば、上述されたオペレーションの間の境界が、例示に過ぎないことを認識しよう。複数のオペレーションは、単一のオペレーションに組み合わせられてよく、単一のオペレーションは、さらなるオペレーションに分散されてよく、オペレーションは、時間的に少なくとも部分的に重複して実行されてよい。さらに、代替的な実施形態は、特定のオペレーションの複数の例を含んでよく、オペレーションの順序は、様々な他の実施形態において変更されてよい。
また、例えば、これらの例又はその一部は、物理的回路、又は任意の適切なタイプのハードウェア記述言語のような、物理的回路に互換可能な論理表現のソフト又はコード表現として実装されてよい。
また、本発明は、プログラム固定ハードウェアで実装される物理的なデバイス又はユニットに限定されるものではなく、本願においてコンピュータシステムとして一般的に示される、メインフレーム、ミニコンピュータ、サーバ、ワークステーション、パーソナルコンピュータ、ノートパッド、パーソナルデジタルアシスタント、電子ゲーム、自動車用及び他の埋め込みシステム、携帯電話及び様々な他の無線デバイスのような、適切なプログラムコードに従って動作することによって望ましいデバイスの機能を実行可能なプログラム可能デバイス又はユニットに適用されてもよい。
しかしながら、他の修正、変形及び代替例も可能である。本明細書及び図面は、従って、限定的な意味ではなく、例示とみなされるべきである。

Claims (16)

  1. 第1のオーディオ信号及び第2のオーディオ信号を含むステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置であって、
    周波数帯域幅内にあるステレオ信号の時間周波数セグメントの少なくとも全てのパニング指標にマッピング関数を適用し、これにより、修正されたパニング指標を提供するパニング指標修正器であって、前記少なくとも全てのパニング指標は、前記ステレオ信号の時間周波数セグメントに対するパニング位置を特定する、パニング指標修正器と、
    前記修正されたパニング指標に基づいて、前記第1のオーディオ信号及び前記第2のオーディオ信号の時間周波数信号セグメントに対して、修正されたパニング利得を決定する第1のパニング利得決定器と、
    前記修正されたパニング利得と、時間及び周波数において前記修正されたパニング利得に対応する前記第1のオーディオ信号及び前記第2のオーディオ信号のパニング利得との間の割合に従って、前記ステレオ信号を再パニングし、これにより、再パニングされたステレオ信号を提供する再パニング器と、
    を備えるオーディオ信号処理装置。
  2. 前記パニング指標修正器は、前記少なくとも全てのパニング指標に、非線形マッピング関数を適用する、請求項1に記載のオーディオ信号処理装置。
  3. 前記マッピング関数は、シグモイド関数に基づく、請求項1又は2に記載のオーディオ信号処理装置。
  4. 前記マッピング関数は、
    として表され、又はこれに基づき、
    Ψ(m,k)は、パニング指標を示し、Ψ'(m,k)は、修正されたパニング指標を示し、aは、マッピング関数曲率を制御する、請求項3に記載のオーディオ信号処理装置。
  5. 前記パニング指標修正器は、前記少なくとも全てのパニング指標に、多項式マッピング関数を適用する、請求項1から4のいずれか1項に記載のオーディオ信号処理装置。
  6. 前記再パニング器は、式
    に従って、前記ステレオ信号を再パニングするように構成され、
    (m,k)は、前記第1のオーディオ信号の時間周波数信号セグメントを示し、
    (m,k)は、前記第2のオーディオ信号の時間周波数信号セグメントを示し、
    '(m,k)は、前記再パニングされたステレオ信号の再パニングされた第1のオーディオ信号の時間周波数信号セグメントを示し、
    '(m,k)は、前記再パニングされたステレオ信号の再パニングされた第2のオーディオ信号の時間周波数信号セグメントを示し、
    (m,k)は、前記第1のオーディオ信号に対する時間周波数信号セグメントのパニング利得を示し、
    (m,k)は、前記第2のオーディオ信号に対する時間周波数信号セグメントのパニング利得を示し、
    g'(m,k)は、前記第1のオーディオ信号に対する時間周波数信号セグメントの修正されたパニング利得を示し、
    g'(m,k)は、前記第2のオーディオ信号に対する時間周波数信号セグメントの修正されたパニング利得を示す、
    請求項1から5のいずれか1項に記載のオーディオ信号処理装置。
  7. 前記第1のパニング利得決定器は、式
    に基づいて、前記修正されたパニング利得を決定する、請求項1から6のいずれか1項に記載のオーディオ信号処理装置。
  8. 前記パニング指標修正器は、少なくとも約1500Hzであるオーディオ信号に対する値を有するステレオ信号の時間周波数セグメントの全てのパニング指標に、前記マッピング関数を適用する、請求項1から6のいずれか1項に記載のオーディオ信号処理装置。
  9. 前記パニング指標修正器は、前記ステレオ信号の時間周波数セグメントの全てのパニング指標に、前記マッピング関数を適用する、請求項1から7のいずれか1項に記載のオーディオ信号処理装置。
  10. 前記パニング指標修正器は、さらに、前記マッピング関数の曲線を選択するためのパラメータを受信する、請求項1から9のいずれか1項に記載のオーディオ信号処理装置。
  11. 時間及び周波数において対応する前記第1のオーディオ信号及び前記第2のオーディオ信号の時間周波数信号セグメント値の比較に基づいて、前記少なくとも全てのパニング指標を決定するパニング指標決定器、及び
    前記少なくとも全てのパニング指標に基づいて、前記第1のオーディオ信号及び前記第2のオーディオ信号の時間周波数信号セグメントに対して、パニング利得を決定する第2のパニング利得決定器
    の少なくとも1つをさらに備える、請求項1から10のいずれか1項に記載のオーディオ信号処理装置。
  12. 前記第1のパニング利得決定器及び前記第2のパニング利得決定器の少なくとも1つは、多項式関数を用いる、請求項11に記載のオーディオ信号処理装置。
  13. 前記ステレオ信号を、時間ドメインから周波数ドメインに変換する1つ又は複数の時間対周波数ユニット、及び
    前記再パニングされたステレオ信号を、前記周波数ドメインから前記時間ドメインに変換する1つ又は複数の周波数対時間ユニット
    の少なくとも1つをさらに備える、請求項1から12のいずれか1項に記載のオーディオ信号処理装置。
  14. 前記再パニングされたステレオ信号の第1のオーディオ信号と第2のオーディオ信号との間のクロストークをキャンセルするクロストークキャンセラをさらに備える、請求項1から13のいずれか1項に記載のオーディオ信号処理装置。
  15. 第1のオーディオ信号及び第2のオーディオ信号を含むステレオ信号のステレオイメージを修正するためのオーディオ信号処理方法であって、
    パニング指標及びパニング利得を取得する段階であって、前記取得されたパニング指標は、ステレオ信号の時間周波数セグメントに対するパニング位置を特定し、前記取得されたパニング利得は、前記第1のオーディオ信号及び前記第2のオーディオ信号の時間周波数信号セグメントに対するパニング位置を特定する、段階と、
    周波数帯域幅内にある前記ステレオ信号の時間周波数セグメントの前記取得されたパニング指標の少なくとも全てにマッピング関数を適用し、これにより、修正されたパニング指標を提供する段階と、
    前記修正されたパニング指標に基づいて、前記第1のオーディオ信号及び前記第2のオーディオ信号の前記時間周波数信号セグメントに対して、修正されたパニング利得を決定する段階と、
    前記修正されたパニング利得と、時間及び周波数において前記修正されたパニング利得に対応する前記取得されたパニング利得との間の割合に従って、前記ステレオ信号を再パニングする段階と、
    を備えるオーディオ信号処理方法。
  16. コンピュータ上で実行された場合に、請求項15に記載の方法を実行するためのプログラムコードを備えるコンピュータプログラム。
JP2017530733A 2015-04-24 2015-04-24 ステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置及び方法 Active JP6562572B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2015/058879 WO2016169608A1 (en) 2015-04-24 2015-04-24 An audio signal processing apparatus and method for modifying a stereo image of a stereo signal

Publications (2)

Publication Number Publication Date
JP2018505583A JP2018505583A (ja) 2018-02-22
JP6562572B2 true JP6562572B2 (ja) 2019-08-21

Family

ID=52998155

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017530733A Active JP6562572B2 (ja) 2015-04-24 2015-04-24 ステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置及び方法

Country Status (13)

Country Link
US (1) US10057702B2 (ja)
EP (1) EP3216234B1 (ja)
JP (1) JP6562572B2 (ja)
KR (1) KR101944758B1 (ja)
CN (1) CN107534823B (ja)
AU (1) AU2015392163B2 (ja)
BR (1) BR112017022925B1 (ja)
CA (1) CA2983471C (ja)
MX (1) MX2017013642A (ja)
MY (1) MY196134A (ja)
RU (1) RU2683489C1 (ja)
WO (1) WO2016169608A1 (ja)
ZA (1) ZA201707181B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3373604B1 (en) * 2017-03-08 2021-09-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for providing a measure of spatiality associated with an audio stream
KR102418168B1 (ko) * 2017-11-29 2022-07-07 삼성전자 주식회사 오디오 신호 출력 장치 및 방법, 이를 이용한 디스플레이 장치
US10674266B2 (en) * 2017-12-15 2020-06-02 Boomcloud 360, Inc. Subband spatial processing and crosstalk processing system for conferencing
US10565973B2 (en) * 2018-06-06 2020-02-18 Home Box Office, Inc. Audio waveform display using mapping function
US20240163626A1 (en) * 2022-11-11 2024-05-16 Bang & Olufsen, A/S Adaptive sound image width enhancement

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3427393A (en) 1992-12-31 1994-08-15 Desper Products, Inc. Stereophonic manipulation apparatus and method for sound image enhancement
US5661808A (en) * 1995-04-27 1997-08-26 Srs Labs, Inc. Stereo enhancement system
JP3740670B2 (ja) 1997-05-20 2006-02-01 株式会社河合楽器製作所 ステレオ音像拡大装置
US7231060B2 (en) 1997-08-26 2007-06-12 Color Kinetics Incorporated Systems and methods of generating control signals
US6928168B2 (en) 2001-01-19 2005-08-09 Nokia Corporation Transparent stereo widening algorithm for loudspeakers
US7257231B1 (en) 2002-06-04 2007-08-14 Creative Technology Ltd. Stream segregation for stereo signals
US7970144B1 (en) * 2003-12-17 2011-06-28 Creative Technology Ltd Extracting and modifying a panned source for enhancement and upmix of audio signals
US7991176B2 (en) * 2004-11-29 2011-08-02 Nokia Corporation Stereo widening network for two loudspeakers
JP4940671B2 (ja) * 2006-01-26 2012-05-30 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
GB0710878D0 (en) * 2007-06-06 2007-07-18 Skype Ltd Method of transmitting data in a communication system
JP5298649B2 (ja) * 2008-01-07 2013-09-25 株式会社コルグ 音楽装置
US8129606B2 (en) * 2009-12-04 2012-03-06 Roland Corporation Musical tone signal-processing apparatus
WO2011151771A1 (en) * 2010-06-02 2011-12-08 Koninklijke Philips Electronics N.V. System and method for sound processing
KR101871234B1 (ko) 2012-01-02 2018-08-02 삼성전자주식회사 사운드 파노라마 생성 장치 및 방법

Also Published As

Publication number Publication date
CN107534823A (zh) 2018-01-02
KR20170092669A (ko) 2017-08-11
BR112017022925A2 (pt) 2018-07-24
US20170272881A1 (en) 2017-09-21
MY196134A (en) 2023-03-16
US10057702B2 (en) 2018-08-21
CA2983471C (en) 2019-11-26
MX2017013642A (es) 2018-07-06
WO2016169608A1 (en) 2016-10-27
AU2015392163B2 (en) 2018-12-20
JP2018505583A (ja) 2018-02-22
AU2015392163A1 (en) 2017-11-23
EP3216234A1 (en) 2017-09-13
KR101944758B1 (ko) 2019-02-01
EP3216234B1 (en) 2019-09-25
CN107534823B (zh) 2020-04-28
RU2683489C1 (ru) 2019-03-28
BR112017022925B1 (pt) 2022-09-13
CA2983471A1 (en) 2016-10-27
ZA201707181B (en) 2018-11-28

Similar Documents

Publication Publication Date Title
JP6251809B2 (ja) サウンドステージ拡張用の装置及び方法
JP6562572B2 (ja) ステレオ信号のステレオイメージを修正するためのオーディオ信号処理装置及び方法
RU2650026C2 (ru) Устройство и способ для многоканального прямого-окружающего разложения для обработки звукового сигнала
JP6968376B2 (ja) ステレオ仮想バス拡張
US9264838B2 (en) System and method for variable decorrelation of audio signals
US9743215B2 (en) Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
US9820072B2 (en) Producing a multichannel sound from stereo audio signals
CN113273225B (zh) 音频处理
CN106941006B (zh) 用于音频信号的分离和低音增强的方法、装置和系统
US11962992B2 (en) Spatial audio processing
JP2017212732A (ja) チャンネル数変換装置およびプログラム
JP6832095B2 (ja) チャンネル数変換装置およびそのプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190722

R150 Certificate of patent or registration of utility model

Ref document number: 6562572

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250