JP6444436B2 - 音響信号のレンダリング方法、その装置及び該コンピュータ可読記録媒体 - Google Patents

音響信号のレンダリング方法、その装置及び該コンピュータ可読記録媒体 Download PDF

Info

Publication number
JP6444436B2
JP6444436B2 JP2016575113A JP2016575113A JP6444436B2 JP 6444436 B2 JP6444436 B2 JP 6444436B2 JP 2016575113 A JP2016575113 A JP 2016575113A JP 2016575113 A JP2016575113 A JP 2016575113A JP 6444436 B2 JP6444436 B2 JP 6444436B2
Authority
JP
Japan
Prior art keywords
channel
altitude
rendering
output
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016575113A
Other languages
English (en)
Other versions
JP2017523694A (ja
Inventor
ジョン,サン−ベ
キム,ソン−ミン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2017523694A publication Critical patent/JP2017523694A/ja
Application granted granted Critical
Publication of JP6444436B2 publication Critical patent/JP6444436B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/05Application of the precedence or Haas effect, i.e. the effect of first wavefront, in order to improve sound-source localisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音響信号をレンダリングする方法及びその装置に係り、さらに詳細には、入力チャンネルの高度が標準レイアウトによる高度より高いか、あるいは低い場合、高度パンニング係数または高度フィルタ係数を修正することにより、音像の位置及び音色をさらに正確に再現するためのレンダリング方法及びその装置に関する。
立体音響とは、音の高低、音色だけではなく、方向や距離感まで再生し、臨場感を有するようにし、音源が生じた空間に位置していない聴取者に、方向感、距離感及び空間感を知覚させる空間情報を付加した音響を意味する。
22.2チャネルのようなチャネル信号を、5.1チャネルにレンダリングする場合、二次元出力チャネルを介して、三次元立体音響を再生することができるが、入力チャネルの高度角が、基準高度角と差がある場合、基準高度角によって決定されたレンダリングパラメータを利用して、入力信号をレンダリングする場合、音像の歪曲が発生することになる。
前述のように、22.2チャネルのようなマルチチャネル信号、を5.1チャネルにレンダリングする場合、二次元出力チャネルを利用して、三次元音響信号を再生することができるが、入力チャネルの高度角、が基準高度角と差がある場合、基準高度角によって決定されたレンダリングパラメータを利用して、入力信号をレンダリングする場合、音像の歪曲が発生することになる。
本発明は、前述の従来技術の問題点を解決し、入力チャネルの高度が基準高度より高いか、あるいは低い場合でも、音像の歪曲を減らすことをその目的にする。
前記目的を達成するための本発明の代表的な構成は、次の通りである。
前記技術的課題を解決するための本発明の一実施形態による、音響信号をレンダリングする方法は、複数個の出力チャネルに変換される複数個の入力チャネルを含むマルチチャネル信号を受信する段階と、各出力チャネルが、基準高度角で、高度感ある音像を提供するように、正面高さ(frontal height)入力チャネルに、所定の遅延を付加する段階と、付加された遅延に基づいて、正面高さ入力チャネルに係わる高度レンダリングパラメータを修正する段階と、修正された高度レンダリングパラメータに基づいて、正面高さ入力チャネルに対して遅延された高度レンダリングされたサラウンド出力チャネルを生成することにより、前後混同(front-back confusion)を防止する段階と、を含む。
本発明の他の実施形態によれば、複数個の出力チャネルは、水平チャネルである。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータは、パンニングゲイン及び高度フィルタ係数のうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、前記正面高さチャネルは、CH_U_L030,CH_U_R030,CH_U_L045,CH_U_R045及びCH_U_000チャネルのうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、サラウンド出力チャネルは、CH_M_L110及びCH_M_R110のうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、所定の遅延は、サンプリングレートに基づいて決定される。
前記技術的課題を解決するための本発明の一実施形態による、音響信号をレンダリングする装置は、複数個の出力チャネルに変換される複数個の入力チャネルを含むマルチチャネル信号を受信する受信部と、各出力チャネルが、基準高度角で、高度感ある音像を有する正面高さ入力チャネルに所定の遅延を付加し、付加された遅延に基づいて、正面高さ入力チャネルに係わる高度レンダリングパラメータを修正するレンダリング部と、修正された高度レンダリングパラメータに基づいて、正面高さ入力チャネルに対して遅延された高度レンダリングサラウンド出力チャネルを生成することにより、前後混同を防止する出力部と、を含む。
本発明の他の実施形態によれば、複数個の出力チャネルは、水平チャネルである。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータは、パンニングゲイン及び高度フィルタ係数のうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、前記正面高さ入力チャネルは、CH_U_L030,CH_U_R030,CH_U_L045,CH_U_R045及びCH_U_000チャネルのうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、前記正面高さチャネルは、CH_U_L030,CH_U_R030,CH_U_L045,CH_U_R045及びCH_U_000チャネルのうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、所定の遅延は、サンプリングレートに基づいて決定される。
前記技術的課題を解決するための本発明の一実施形態による、音響信号をレンダリングする方法は、複数個の出力チャネルに変換される複数個の入力チャネルを含むマルチチャネル信号を受信する段階と、各出力チャネルが、基準高度角で、高度感ある音像を提供するように、高く入力チャネルに係わる高度レンダリングパラメータを獲得する段階と、基準高度角以外の所定の高度角を有する高さ入力チャネルに対して高度レンダリングパラメータを更新する段階と、を含み、高度レンダリングパラメータを更新する段階は、トップフロントセンター(top front center)の高さ入力チャネルをサラウンド出力チャネルにパンニングするパンニングゲインを更新する段階を含む。
本発明のさらに他の実施形態によれば、複数個の出力チャネルは、水平チャネル(horizontal channel)である。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータは、パンニングゲイン及び高度フィルタ係数のうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータを更新する段階は、基準高度角及び所定の高度角に基づいて、パンニングゲインを更新する段階を含む。
本発明のさらに他の実施形態によれば、所定の高度角が基準高度角より小さい場合、更新された高度パンニングゲインのうち所定の高度角を有する出力チャネルと同側にある出力チャネルに適用される更新された高度パンニングゲインは、更新前の高度パンニングゲインより大きく、入力チャネルそれぞれに適用される更新された高度パンニングゲインの二乗の和は、1になる。
本発明のさらに他の実施形態によれば、所定の高度角が基準高度角より大きい場合、更新された高度パンニングゲインのうち所定の高度角を有する出力チャネルと同側にある出力チャネルに適用される更新された高度パンニングゲインは、更新前の高度パンニングゲインより小さく、入力チャネルそれぞれに適用される更新された高度パンニングゲインの二乗の和は、1になる。
前記技術的課題を解決するための本発明の一実施形態による、音響信号をレンダリングする装置は、複数個の出力チャネルに変換される複数個の入力チャネルを含むマルチチャネル信号を受信する受信部と、各出力チャネルが、基準高度角で、高度感ある音像を提供するように、高さ入力チャネルに係わる高度レンダリングパラメータを獲得し、基準高度角以外の所定の高度角を有する高さ入力チャネルに対して、高度レンダリングパラメータを更新するレンダリング部と、を含み、更新された高度レンダリングパラメータは、トップフロントセンター(top front center)の高さ入力チャネルをサラウンド出力チャネルにパンニングするパンニングゲインを含む。
本発明のさらに他の実施形態によれば、複数個の出力チャネルは、水平チャネル(horizontal channel)である。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータは、パンニングゲイン及び高度フィルタ係数のうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、更新された高度レンダリングパラメータは、基準高度角及び所定の高度角に基づいて更新されたパンニングゲインを含む。
本発明のさらに他の実施形態によれば、所定の高度角が基準高度角より小さい場合、更新された高度パンニングゲインのうち所定の高度角を有する出力チャネルと同側にある出力チャネルに適用される更新された高度パンニングゲインは、更新前の高度パンニングゲインより大きく、入力チャネルそれぞれに適用される更新された高度パンニングゲインの二乗の和は、1になる。
本発明のさらに他の実施形態によれば、所定の高度角が基準高度角より大きい場合、更新された高度パンニングゲインのうち所定の高度角を有する出力チャネルと同側にある出力チャネルに適用される更新された高度パンニングゲインは、更新前の高度パンニングゲインより小さく、入力チャネルそれぞれに適用される更新された高度パンニングゲインの二乗の和は、1になる。
前記技術的課題を解決するための本発明の一実施形態による、音響信号をレンダリングする方法は、複数個の出力チャネルに変換される複数個の入力チャネルを含むマルチチャネル信号を受信する段階と、各出力チャネルが、基準高度角で、高度感ある音像を提供するように、高さ入力チャネルに係わる高度レンダリングパラメータを獲得する段階と、基準高度角以外の所定の高度角を有する高さ入力チャネルに対して、高度レンダリングパラメータを更新する段階と、を含み、高度レンダリングパラメータを更新する段階は、高さ入力チャネルの位置に基づいて、低周波帯域を含む周波数範囲に対して更新されたパンニングゲインを獲得する段階を含む。
本発明の他の実施形態によれば、更新されたパンニングゲインは、背面(rear)高さ入力チャネルに係わるパンニングゲインである。
本発明のさらに他の実施形態によれば、複数個の出力チャネルは、水平チャネル(horizontal channel)である。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータは、パンニングゲイン及び高度フィルタ係数のうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータを更新する段階は、基準高度角及び所定の高度角に基づいて、高度フィルタ係数に加重値を適用する段階を含む。
本発明のさらに他の実施形態によれば、加重値は、所定の高度角が基準高度角より小さい場合、高度フィルタ特徴が緩慢に示されるように決定され、所定の高度角が基準高度角より大きい場合、高度フィルタ特徴が強く示されるように決定される。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータを更新する段階は、基準高度角及び所定高度角に基づいて、パンニングゲインを更新する段階を含む。
本発明のさらに他の実施形態によれば、所定高度角が基準高度角より小さい場合、更新された高度パンニングゲインのうち、所定高度角を有する出力チャネルと同側にある出力チャネルに適用される更新された高度パンニングゲインは、更新前の高度パンニングゲインより大きく、入力チャネルそれぞれに適用される更新された高度パンニングゲインの二乗の和は、1になる。
本発明のさらに他の実施形態によれば、所定高度角が基準高度角より大きい場合、更新された高度パンニングゲインのうち、所定高度角を有する出力チャネルと同側にある出力チャネルに適用される更新された高度パンニングゲインは、更新前の高度パンニングゲインより小さく、入力チャネルそれぞれに適用される更新された高度パンニングゲインの二乗の和は、1になる。
前記技術的課題を解決するための本発明の一実施形態による、音響信号をレンダリングする装置は、複数個の出力チャネルに変換される複数個の入力チャネルを含むマルチチャネル信号を受信する受信部と、各出力チャネルが、基準高度角で、高度感ある音像を提供するように、高さ入力チャネルに係わる高度レンダリングパラメータを獲得し、基準高度角以外の所定高度角を有する高さ入力チャネルに対して、高度レンダリングパラメータを更新するレンダリング部と、を含み、更新された高度レンダリングパラメータは、高さ入力の位置に基づいて、低周波帯域を含む周波数範囲に対して更新されたパンニングゲインを含む。
本発明の他の実施形態によれば、更新されたパンニングゲインは、背面(rear)高さ入力チャネルに係わるパンニングゲインである。
本発明のさらに他の実施形態によれば、複数個の出力チャネルは、水平チャネル(horizontal channel)である。
本発明のさらに他の実施形態によれば、高度レンダリングパラメータは、パンニングゲイン及び高度フィルタ係数のうち少なくとも一つを含む。
本発明のさらに他の実施形態によれば、更新された高度レンダリングパラメータは、基準高度角及び所定高度角に基づいて、加重値が適用された高度フィルタ係数を含む。
本発明のさらに他の実施形態によれば、加重値は、所定高度角が基準高度角より小さい場合、高度フィルタ特徴が緩慢に示されるように決定され、所定高度角が基準高度角より大きい場合、高度フィルタ特徴が強く示されるように決定される。
本発明のさらに他の実施形態によれば、更新された高度レンダリングパラメータは、基準高度角及び所定高度角に基づいて更新されたパンニングゲインを含む。
本発明のさらに他の実施形態によれば、所定高度角が基準高度角より小さい場合、前記更新された高度パンニングゲインのうち、所定高度角を有する出力チャネルと同側にある出力チャネルに適用される更新された高度パンニングゲインは、更新前の高度パンニングゲインより大きく、入力チャネルそれぞれに適用される更新された高度パンニングゲインの二乗の和は、1になる。
本発明のさらに他の実施形態によれば、所定高度角が基準高度角より大きい場合、前記更新された高度パンニングゲインのうち、所定高度角を有する出力チャネルと同側にある出力チャネルに適用される更新された高度パンニングゲインは、更新前の高度パンニングゲインより小さく、入力チャネルそれぞれに適用される更新された高度パンニングゲインの二乗の和は、1になる。
一方、本発明の一実施形態によれば、前述の方法を実行するためのプログラム、及び前記プログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
それ以外にも、本発明を具現するための他の方法、他のシステム及び前記方法を実行するためのコンピュータプログラムを記録するコンピュータ可読記録媒体がさらに提供される。
本発明によれば、入力チャネルの高度が基準高度より高いか、あるいは低い場合でも、音像の歪曲が少なくなるように、立体音響信号をレンダリングすることができる。また、本発明によれば、サラウンド出力チャネルによる前後混同現象を防止することができる。
一実施形態による立体音響再生装置の内部構造を示すブロック図である。 一実施形態による立体音響再生装置の構成のうちレンダラの構成を示すブロック図である。 一実施形態による、複数個の入力チャネルが複数個の出力チャネルにダウンミックスされる場合の各チャネルのレイアウトに係わる図面である。 出力チャネルの標準レイアウトと設置レイアウトとの間に位置偏差がある場合、一実施形態によるパンニング部を示す図面である。 一実施形態による立体音響再生装置の構成のうち、デコーダ及び立体音響レンダラの構成を示すブロック図である。 一実施形態によるチャネルレイアウトにおいて、アッパレイヤの高度によるアッパレイヤチャネルのレイアウトを示した図面である。 一実施形態によるチャネルレイアウトにおいて、アッパレイヤの高度によるアッパレイヤチャネルのレイアウトを示した図面である。 一実施形態によるチャネルレイアウトにおいて、アッパレイヤの高度によるアッパレイヤチャネルのレイアウトを示した図面である。 一実施形態において、チャネルの高度による音像の変化、及び高度フィルタの変化を示した図面である。 一実施形態において、チャネルの高度による音像の変化、及び高度フィルタの変化を示した図面である。 一実施形態において、チャネルの高度による音像の変化、及び高度フィルタの変化を示した図面である。 一実施形態において、立体音響信号をレンダリングする方法のフローチャートである。 一実施形態において、入力チャネルの高度角が臨界値以上であるとき、左右音像が逆転される現象を示した図面である。 一実施形態による、水平チャネル及び正面高さチャネルを図示する図面である。 一実施形態による正面高さチャネルの認識確率に係わる図面である。 一実施形態による、前後混同を防止するための方法のフローチャートである。 一実施形態による、サラウンド出力チャネルに遅延が追加された、水平チャネル及び正面高さチャネルを図示する図面である。 一実施形態による、水平チャネル及び正面中央チャネル(TFCチャネル)を図示する図面である。
後述する本発明に係わる詳細な説明は、本発明が実施される特定実施形態を例示として図示する添付図面を参照する。かような実施形態は、当業者が本発明を実施するのに十分であるように詳細に説明される。本発明の多様な実施形態は、互いに異なるが、相互排他的である必要はないということが理解されなければならない。
例えば、本明細書に記載されている特定形状、構造及び特性は、本発明の精神及び範囲を外れずに、一実施形態から他の実施形態に変更されても具現される。また、それぞれの実施形態内の個別構成要素の位置または配置も、本発明の精神及び範囲を外れずに、変更されもするということが理解されなければならない。従って、後述する詳細な説明は、限定的な意味としてなされるものではなく、本発明の範囲は、特許請求の範囲の請求項が請求する範囲、及びそれと均等な全ての範囲を包括すると受け入れられなければならない。
図面において、類似した参照符号は、多くの側面にわたって、同一であるか、あるいは類似した構成要素を示す。そして、図面において、本発明を明確に説明するために、説明と関係ない部分は省略し、明細書全体を通じて、類似した部分については、類似した図面符号を付した。
以下、本発明が属する技術分野で当業者が本発明を容易に実施することができるように、本発明の多くの実施形態について、添付された図面を参照して詳細に説明する。しかし、本発明は、さまざまに異なる形態に具現され、ここで説明する実施形態に限定されるものではない。
明細書全体において、ある部分が他の部分と「連結」されているとするとき、それは、「直接連結」されている場合だけではなく、その中間に、他の素子を挟んで「電気的に連結」されている場合も含む。また、ある部分がある構成要素を「含む」とするとき、それは、特別に反対となる記載がない限り、他の構成要素を除くものではなく、他の構成要素をさらに含んでもよいということを意味する。
以下、添付された図面を参照し、本発明について詳細に説明する。
図1は、一実施形態による立体音響再生装置の内部構造を示すブロック図である。
一実施形態による立体音響再生装置100は、複数個の入力チャネルが再生される複数個の出力チャネルにミキシング(mixing)されたマルチチャネル(multi-channel)音響信号を出力することができる。このとき、出力チャネルの個数が、入力チャネルの個数よりさらに少なければ、入力チャネルは、出力チャネルの個数に合わせてダウンミキシング(downmixing)される。
立体音響とは、音の高低、音色だけではなく、方向や距離感まで再生して臨場感を有するようにし、音源が生じた空間に位置していない聴取者に、方向感、距離感及び空間感を知覚させる空間情報を付加した音響を意味する。
以下の説明において、音響信号の出力チャネルは、音響が出力されるスピーカの個数を意味する。出力チャネル数が多いほど、音響が出力されるスピーカの個数が多くなる。一実施形態による立体音響再生装置100は、入力チャネル数が多いマルチチャネル音響信号が、出力チャネル数が少ない環境で出力されて再生されるように、マルチチャネル音響入力信号を再生される出力チャネルにレンダリングしてミキシングすることができる。このとき、マルチチャネル音響信号は、高度音響(elevated sound)を出力することができるチャネルを含んでもよい。
該高度音響を出力することができるチャネルは、高度感を感じることができるように、聴取者の頭上に位置したスピーカを介して、音響信号を出力することができるチャネルを意味する。水平面チャネルは(horizontal channel)、聴取者と水平面に位置したスピーカを介して、音響信号を出力することができるチャネルを意味する。
前述の、出力チャネル数が少ない環境は、高度音響を出力することができる出力チャネルを含まず、水平面上に配置されたスピーカを介して、音響を出力することができる環境を意味する。
また、以下の説明において、水平面チャネルは、水平面上に配置されたスピーカを介して出力される音響信号を含むチャネルを意味する。オーバーヘッドチャネル(overhead channel)は、水平面ではない高度上に配置されて高度音を出力することができるスピーカを介して出力される音響信号を含むチャネルを意味する。
図1を参照すれば、一実施形態による立体音響再生装置100は、オーディオコア110、レンダラ120、ミキサ130及び後処理部140を含んでもよい。
一実施形態による立体音響再生装置100は、マルチチャネル入力音響信号をレンダリングし、ミキシングして再生される出力チャネルに出力することができる。例えば、マルチチャネル入力音響信号は、22.2チャネル信号であり、再生される出力チャネルは、5.1チャネルまたは7.1チャネルでもある。立体音響再生装置100は、マルチチャネル入力音響信号の各チャネルを対応させる出力チャネルを決定することによってレンダリングを行い、再生されるチャネルと対応した各チャネルの信号を合わせ、最終信号として出力することにより、レンダリングされたオーディオ信号をミキシングすることができる。
エンコーディングされた音響信号は、オーディオコア110に、ビットストリーム形態で入力され、オーディオコア110は、音響信号がエンコーディングされた方式に適するデコーダツールを選択し、入力された音響信号をデコーディングする。
レンダラ120は、マルチチャネル入力音響信号を、チャネル及び周波数によって、マルチチャネル出力チャネルにレンダリングすることができる。レンダラ120は、マルチチャネル音響信号に対して、オーバーヘッドチャネル及び水平面チャネルによる信号を、それぞれ三次元(3D:3−dimensional)レンダリング及び二次元(2D:two-dimensional)レンダリングすることができる。レンダラの構成及び具体的レンダリング方法については、以下の図2でさらに詳細に説明する。
ミキサ130は、レンダラ120によって、水平チャネルと対応した各チャネルの信号を合わせ、最終信号として出力することができる。ミキサ130は、所定区間別に、各チャネルの信号をミキシングすることができる。例えば、ミキサ130は、1フレーム別に、各チャネルの信号をミキシングすることができる。
一実施形態によるミキサ130は、再生される各チャネルにレンダリングされた信号のパワー値に基づいてミキシングすることができる。言い換えれば、ミキサ130は、再生される各チャネルにレンダリングされた信号のパワー値に基づいて、最終信号の振幅、または最終信号に適用されるゲイン(gain)を決定することができる。
後処理部140は、ミキサ130の出力信号を、各再生装置(スピーカまたはヘッドホンなど)に合わせ、マルチバンド信号に対する動的範囲制御及びバイノーラル方式(binauralizing)などを遂行する。後処理部140で出力された出力音響信号は、スピーカなどの装置を介して出力され、出力音響信号は、各構成部の処理によって、2Dまたは3Dに再生される。
図1に図示された一実施形態による立体音響再生装置100は、オーディオデコーダの構成を中心に図示されており、付随的な構成は省略されている。
図2は、一実施形態による立体音響再生装置の構成のうちレンダラの構成を示すブロック図である。
レンダラ120は、フィルタリング部121とパンニング部123とから構成される。
フィルタリング部121は、デコーディングされた音響信号を、位置によって音色などを補正し、頭伝達関数(HRTF:head-related transfer function)フィルタを利用して、入力音響信号をフィルタリングすることができる。
フィルタリング部121は、オーバーヘッドチャネルを3Dレンダリングするために、頭部伝達関数(HRTF)フィルタを通過したオーバーヘッドチャネルを、周波数によって、それぞれ異なる方法によってレンダリングすることができる。
HRTFフィルタは、両耳間のレベル差(ILD:interaural level differences)や、両耳間で音響時間が到逹する時間差(ITD:interaural time differences)などの単純な経路差だけではなく、頭表面での回折、耳介による反射など複雑な経路上の特性が、音の到来方向によって変化する現象によって立体音響を認識する。HRTFフィルタは、音響信号の音質を変化させることによって立体音響が認識されるように、オーバーヘッドチャネルに含まれた音響信号を処理することができる。
パンニング部123は、入力音響信号を、各出力チャネルに対してパンニングさせるために、各周波数帯域別、各チャネル別に適用されるパンニング係数を求めて適用する。音響信号に対するパンニングは、2つの出力チャネル間の特定位置に音源をレンダリングするために、各出力チャネルに印加する信号の大きさを制御することを意味する。パンニング係数は、パンニングゲインという用語と混用が可能である。
パンニング部123は、オーバーヘッドチャネル信号のうち低周波信号については、add to the closest channel方法によってレンダリングし、高周波信号については、マルチチャネルパンニング(multichannel panning)方法によってレンダリングすることができる。マルチチャネルパンニング方法によれば、マルチチャネル音響信号の各チャネルの信号が、各チャネル信号にレンダリングされるチャネルごとに互いに異なるように設定されたゲイン値が適用され、少なくとも1つの水平面チャネルにそれぞれレンダリングされる。ゲイン値が適用された各チャネルの信号は、ミキシングを介して合わされることにより、最終信号として出力される。
低周波信号は、回折性が強いので、マルチチャネルパンニング方法によって、マルチチャネル音響信号の各チャネルを、多くのチャネルにそれぞれ分けてレンダリングせず、1つのチャネルだけにレンダリングしても、聴取者が聞くとき、類似した音質を有することができる。従って、一実施形態による立体音響再生装置100は、低周波信号をadd to the closest channel方法によってレンドリングすることにより、1つの出力チャネルに多くのチャネルがミキシングされることによって生じる音質劣化を防止することができる。すなわち、1つの出力チャネルに、多くのチャネルがミキシングされれば、各チャネル信号間の干渉によって、音質が増幅されたり低減されたりして劣化されるので、1つの出力チャネルに、1つのチャネルをミキシングすることにより、音質劣化を防止することができる。
add to the closest channel方法によれば、マルチチャネル音響信号の各チャネルは、多くのチャネルに分けてレンダリングする代わりに、再生されるチャネルのうち最も近いチャネルにレンダリングされる。
また、立体音響再生装置100は、周波数によって異なる方法によってレンダリングを行うことにより、スイートスポット(sweet spot)を、音質劣化なしに広げることができる。すなわち、回折特性が強い低周波信号については、add to the closest channel方法によってレンダリングすることにより、1つの出力チャネルに、多くのチャネルがミキシングされることによって生じる音質劣化を防止することができる。スイートスポットとは、聴取者が、歪曲されていない立体音響を最適に聴取することができる所定範囲を意味する。
スイートスポットが広いほど、聴取者は、広い範囲で歪曲されていない立体音響を最適に聴取することができ、聴取者がスイートスポットに位置しない場合、音質または音像などが歪曲された音響を聴取することがある。
図3は、一実施形態による、複数個の入力チャネルが、複数個の出力チャネルにダウンミックスされる場合の各チャネルのレイアウトに係わる図面である。
三次元映像のように、実際と同一であるか、あるいはさらに誇張された現場感及び没入感を提供するために、三次元立体映像と共に、三次元立体音響を提供するための技術が開発されている。立体音響は、音響信号自体が音の高低及び空間感を有する音響を意味することにより、かような立体音響を再生するためには、最小2個以上のラウドスピーカ、すなわち、出力チャネルが必要である。また、HRTFを利用するバイノーラル(binaural)立体音響を除いては、音の高低感、距離感及び空間感をさらに正確に再現するために、多い数の出力チャネルを必要とする。
従って、2チャネル出力を有するステレオシステムに続き、5.1チャネルシステム、Auro 3Dシステム、Holman 10.2チャネルシステム、ETRI/Samsung 10.2チャネルシステム、NHK22.2チャネルシステムなど多様なマルチチャネルシステムが提案されて開発されている。
図3は、22.2チャネルの立体音響信号を、5.1チャネルの出力システムで再生する場合について説明するための図面である。
5.1チャネルシステムは、5チャネルサラウンドマルチチャネルサウンドシステムの一般的な名称であり、家庭のホームシアタ及び劇場用サウンドシステムとして、最も普遍的に普及されて使用されているシステムである。全ての5.1チャネルは、FL(front left)チャネル、C(center)チャネル、FR(front right)チャネル、SL(surround left)チャネル及びSR(surround right)チャネルを含む。図3から分かるところのように、5.1チャネルの出力は、いずれも同じ平面上に存在するために、物理的には、二次元システムに該当し、5.1チャネルシステムにおいて、三次元立体音響信号を再生するためには、再生される信号に立体感を付与するためのレンダリング過程を経なればならない。
5.1チャネルシステムは、映画だけではなく、DVD(digital versatile disc)映像、DVD音響、SACD(super audio compact disc)またはデジタル放送に至るまで多様な分野で広く使用されている。しかし、5.1チャネルシステムが、たとえステレオシステムに比べ、向上した空間感を提供するとしても、さらに広い聴取空間の形成において、さまざまな制約がある。特に、スイートスポットが狭く形成され、高度角(elevation angle)を有する垂直音像を提供することができないために、劇場のように広い聴取空間には適さない。
NHKで提案した22.2チャネルシステムは、図3のように、3層の出力チャネルからなる。アッパレイヤ(upper layer)310は、VOG(voice of god),T0,T180,TL45,TL90,TL135,TR45,TR90及びTR45チャネルを含む。このとき、各チャネル名の最前のTというインデックスは、アッパレイヤを意味し、LまたはRというインデックスは、それぞれ左側または右側を意味し、後の数字は、中心チャネル(center channel)からの方位角(azimuth angle)を意味する。アッパレイヤは、またトップレイヤとも呼ばれる。
VOGチャネルは、聴取者の頭上に存在するチャネルであり、90°の高度角を有し、方位角はない。ただし、VOGチャネルは、位置が少しだけよじれても、方位角を有し、高度角が90°ではない値を有することになるので、それ以上VOGチャネルではなくなる。
ミドルレイヤ(middle layer)320は、既存5.1チャネルのような平面において、5.1チャネルの出力チャネル以外に、ML60,ML90,ML135,MR60,MR90及びMR135チャネルを含む。このとき、各チャネル名の最も前のMというインデックスは、ミドルレイヤを意味し、後ろの数字は、中心(center)チャネルからの方位角を意味する。
ローレイヤ(low layer)330は、L0,LL45,LR45チャネルを含む。このとき、各チャネル名の最も前のLというインデックスは、ローレイヤを意味し、後ろの数字は、中心(center)チャネルからの方位角を意味する。
22.2チャネルにおいて、ミドルレイヤは、水平チャネル(horizontal channel)と呼ばれ、方位角0°または方位角180°に該当するVOG,T0,T180,T180,M180,L及びCチャネルは、垂直チャネル(vertical channel)と呼ばれる。
22.2チャネル入力信号を5.1チャネルシステムで再生する場合、最も一般的な方法は、ダウンミックス数式を利用して、チャネル間で信号を分配することができる。または、仮想の高度感を提供するレンダリングを行い、5.1チャネルシステムで高度感を有する音響信号を再生する。
図4は、出力チャネルの標準レイアウトと、設置レイアウトとの間に位置偏差がある場合、一実施形態によるパンニング部を示す図面である。
マルチチャネル立体音響信号を、入力信号のチャネル数より少ない出力チャネルで再生する場合、本来の音像が歪曲され、かような歪曲を補正するために、さまざまな技術が研究されている。
一般的なレンダリング技術は、スピーカ、すなわち、出力チャネルが標準レイアウトに合わせて設置された場合を基準に、レンダリングを行うようになっている。しかし、出力チャネルが、標準レイアウトと正確に一致するように設置されていない場合、音像位置の歪曲及び音色の歪曲が発生する。
音像の歪曲は、大きく見て、高度感の歪曲、位相角の歪曲があるが、ある程度低いレベルでは、大きく敏感ではない。しかし、両耳が左右に位置する身体的な特性上、左−中央−右の音像が変わる場合、音像歪曲をさらに敏感に認知することができる。特に、正面の音像については、さらに敏感に認知することになる。
従って、図3のように、22.2チャネルを5.1チャネルに再現する場合、左右にあるチャネルより、0°または180°に位置するVOG、T0、T180、T180、M180、L及びCのようなチャネルは、音像がよじれないように、特に留意しなければならない。
オーディオ入力信号をパンニングするときは、基本的に2段階の過程を経る。最初の段階は、入力されたマルチチャネル信号に対して、出力チャネルの標準レイアウトによってパンニング係数を計算を行う段階であり、初期化(initializing)過程に該当する。2番目の段階は、出力チャネルが、実際に設置されたレイアウトに基づいて計算された係数を修正する段階である。かようなパンニング係数修正段階を経れば、出力信号の音像がさらに正確な位置に存在することになる。
従って、パンニング部123の処理のためには、オーディオ入力信号以外にも、出力チャネルの設置レイアウト、及び出力チャネルの標準レイアウトに係わる情報が必要である。Lチャネル及びRチャネルからCチャネルをレンダリングする場合であるならば、オーディオ入力信号は、Cで再生されなければならない入力信号を、オーディオ出力信号は、設置レイアウトによって、Lチャネル及びRチャネルで出力された修正されたパンニング信号を意味する。
方位偏差(azimuth deviation)のみを考慮する二次元パンニング方法は、出力チャネルの標準レイアウトと設置レイアウトとの間に、高度偏差(elevation deviation)がある場合、高度偏差による効果を補正することができない。従って、出力チャネルの標準レイアウトと設置レイアウトとの間に、高度偏差がある場合であるならば、図4でのように、高度効果補正部124を介して、高度偏差による高度上昇効果を補正しなければならない。
図5は、一実施形態による立体音響再生装置の構成のうち、デコーダ及び立体音響レンダラの構成を示すブロック図である。図5を参照すれば、一実施形態による立体音響再生装置100は、デコーダ110及び立体音響レンダラ120の構成を中心に図示されており、それ以外の構成は、省略されている。
立体音響再生装置に入力された音響信号は、エンコーディングされた信号でであり、ビットストリームの形態で入力される。デコーダ110は、入力音響信号に対して、音響信号がエンコーディングされた方式に適するデコーダツールを選択し、入力された音響信号をデコーディングし、デコーディングされた音響信号を立体音響レンダラ120に伝達する。
立体音響レンダラ120は、フィルタ係数及びパンニング係数を獲得し、更新する初期化部125、及びフィルタリングとパンニングとを行うレンダリング部127から構成される。
レンダリング部127は、デコーダに伝達された音響信号に対して、フィルタリング及びパンニングを行う。空間音色フィルタリング部1271は、音の位置に係わる情報を処理し、レンダリングされた音響信号が所望位置で再生されるようにし、空間位置パンニング部1272は、音の音色に係わる情報を処理し、レンダリングされた音響信号が所望位置に適する音色を有するようにする。
空間音色フィルタリング部1271及び空間位置パンニング部1272は、図2で説明したフィルタリング部121及びパンニング部123と類似した機能を遂行する。ただし、図2のフィルタリング部及びパンニング部123は、簡略化して示した図面において、初期化部などフィルタ係数及びパンニング係数を求めるための構成が省略されたものであるということに留意しなければならない。
このとき、フィルタリングを行うためのフィルタ係数、及びパンニングを行うためのパンニング係数は、初期化部125から伝達される。初期化部125は、高度レンダリングパラメータ獲得部1251及び高度レンダリングパラメータ更新部1252から構成される。
高度レンダリングパラメータ獲得部1251は、出力チャネル、すなわち、ラウドスピーカの構成及び配置を利用して、高度レンダリングパラメータの初期値を獲得する。このとき、高度レンダリングパラメータの初期値は、標準レイアウトによる出力チャネルの構成、及び高度レンダリング設定による入力チャネルの構成に基づいて、高度レンダリングパラメータの初期値を算出するか、あるいは入力/出力チャネル間のマッピング関係によって、既保存の初期値を読み取る。高度レンダリングパラメータは、空間音色フィルタリング部1251で利用するためのフィルタ係数、または空間位置パンニング部1252で利用するためのパンニング係数を含んでもよい。
しかし、前述のように、高度レンダリングのための高度設定値に、入力チャネルの設定及び偏差が存在することがある。かような場合、固定された高度設定値を利用すれば、本来の入力立体音響信号を、入力チャネルと構成が異なる出力チャネルを介して、さらに類似して立体的に再生する仮想レンダリングの目的を達成し難い。
一例として、高度感が非常に高い場合、音像が小さく、音質が劣化される現象が生じ、高度感が非常に低い場合、仮想レンダリングの効果を感じ難いという問題が生じる。従って、ユーザの設定によって、または入力チャネルに適する仮想レンダリング程度によって、高度感の調節が必要である。
高度レンダリングパラメータ更新部1252は、高度レンダリングパラメータ獲得部1251で獲得した高度レンダリングパラメータの初期値を、入力チャネルの高度情報、またはユーザ設定高度に基づいて、高度レンダリングパラメータを更新する。このとき、もし出力チャネルのスピーカレイアウトが、標準レイアウトと比較し、偏差が存在するならば、それによる影響を補正するための過程が追加される。このときの出力チャネルの偏差は、高度角または方位角の差による偏差情報を含んでもよい。
初期化部125で獲得されて更新された高度レンダリングパラメータを利用して、レンダリング部127において、フィルタリング及びパンニングを終えた出力音響信号は、各出力チャネルに対応するスピーカを介して再生される。
図6ないし図8は、一実施形態によるチャネルレイアウトにおいて、アッパレイヤの高度によるアッパレイヤチャネルのレイアウトを示した図面である。
入力チャネル信号が22.2チャネルの立体音響信号であり、図3のようなレイアウトによって配置されるとすれば、入力チャネルのうちアッパレイヤは、高度角によって図4のようなレイアウトを有する。このとき、高度角は、それぞれ0°、25°、35°及び45°である場合を仮定し、高度角が90°に該当するVOGチャネルは、省略されている。高度角が0°であるアッパレイヤチャネルは、水平面(ミドルレイヤ)320に存在するのである。
図6は、アッパレイヤチャネルを正面から見たときのチャネル配置を示している。図6について説明すれば、8個のアッパレイヤチャネルが、それぞれ45°ずつの方位角差を有する場合であるので、垂直チャネル軸を基準に、正面からアッパレイヤチャネルを見れば、TL90チャネル及びTR90チャネルを除いた残りの6つのチャネルは、それぞれTL45チャネル及びTL135チャネル、T0チャネル及びT180チャネル、TR45チャネル及びTR135チャネルが二つずつ重なって示されることになる。それは、図8と比較して説明すれば、さらに明確に分かるであろう。
図7は、アッパレイヤチャネルを上から見たときのチャネル配置を示している。図8は、アッパレイヤチャネル配置を三次元で示したものである。8個のアッパレイヤチャネルが、それぞれ45°ずつの方位角差を有して等間隔に配置されていることを確認することができる。
高度レンダリングを介して、立体音響に再生されるコンテンツが、例えば、高度角35°を有するように固定されているならば、全ての入力音響信号に対して、35°の高度角で高度レンダリングを行ってもよく、最適の結果を得ることができるであろう。
しかし、コンテンツによって、当該コンテンツの立体音響に対する高度角が異なるように適用され、図6ないし図8で確認することができるように、チャネルの高度によって、各チャネルの位置及び距離などが異なり、それによる信号の特性も異なる。
従って、固定された高度角で仮想レンダリングを行う場合、音像の歪曲が発生し、最適のレンダリング性能を得るためには、入力立体音響信号の高度角、すなわち、入力チャネルの高度角を考慮したレンダリングを行うことが必要である。
図9ないし図11は、一実施形態において、チャネルの高度による音像の変化、及び高度フィルタの変化を示した図面である。図9は、高さチャネルの高度が、それぞれ0°、35°及び45°である場合、各チャネルの位置を示した図面である。図9の図面は、聴取者の後ろから見た様子であり、図面に表示されたチャネルは、それぞれML90チャネルまたはTL90チャネルである。高度角が0°である場合は、水平面に存在するチャネルであり、ML90チャネルに該当し、高度角が35°及び45°である場合は、アッパレイヤチャネルであり、TL90チャネルに該当する。
図10は、図9でのように位置する各チャネルにおいて、音響信号が出力されるとき、聴取者の両耳に感じられる信号差について説明するための図面である。
高度角がないML90において、音響信号が出力されるとすれば、原則上、左耳でのみ音響信号が認識され、右耳では、音響信号が認識されない。
しかし、高度が高くなるほど、左耳で認識される音響信号と、右耳で認識する音響信号との差は、だんだんと小さくなり、チャネルの高度角がだんだんと増大し、高度角が90°になれば、聴取者の頭上にあるチャネル、すなわち、VOGチャネルになり、両耳に同一音響信号が認識されることになる。
従って、高度角による、両耳が認識する音響信号に対する変化は、図10でのように示されるのである。
高度角が0°であるときの、両耳で認識する音響信号について説明すれば、左耳でのみ音響信号を認識し、右耳では、音響信号を認識することができない。かような場合、ILD(interaural level difference)及びITD(interaural time difference)が最大になり、聴取者は、左側水平面チャネルに存在するML90チャネルの音像として認識することになるのである。
高度角が35°であるとき、両耳で認識する音響信号、及び高度角が45°であるとき、両耳で認識する音響信号の差について説明すれば、高度角が高くなるにつれ、両耳で認識する音響信号の差が小さくなり、かような差によって、聴取者は、出力音響信号において、高度感の差を感じることができるのである。
高度角35°であるチャネルの出力信号は、高度角45°であるチャネルの出力信号に比べ、音像及びスイートスポットが広く、音質が自然な特徴を有し、高度角45°であるチャネルの出力信号は、高度角が35°であるチャネルの出力信号に比べ、音像が狭くなり、スイートスポットも狭くなるが、強さ没入感を提供する音場感を得ることができるという特徴がある。
先に言及したように、高度角が高くなるほど高度感が高くなり、没入感が強まるが、音像の幅は狭くなる。かような現象は、高度角が高くなるほど、チャネルの物理的位置がだんだんと内側に入り、結局、聴取者に近くなるからである。
従って、高度角の変化による、パンニング係数の更新は、次のように決定される。高度角が高くなるほど音像が広くなるように、パンニング係数を更新し、高度角が低くなるほど音像が狭くなるように、パンニング係数を更新する。
例えば、仮想レンダリングのための基本設定高度角が45°であり、高度角を35°に低くして仮想レンダリングを行う場合を仮定する。かような場合、レンダリングする仮想チャネルと同側(ipsilateral)出力チャネルに適用するレンダリングパンニング係数を増大させ、残りのチャネルに適用するパンニング係数は、パワーノーマライズ(power normalization)を介して決定する。
具体的な説明のために、22.2チャネルの入力マルチチャネル信号を、5.1チャネルの出力チャネル(スピーカ)を介して再生する場合を仮定する。かような場合、入力チャネルのうち仮想レンダリングが適用される、高度角を有する22.2チャネルの入力チャネルは、CH_U_000 T0、CH_U_L45 TL45、CH_U_R45 TR45、CH_U_L90 TL90、CH_U_R90 TR90、CH_U_L135 TL135、CH_U_R135 TR135、CH_U_180 T180、CH_T_000 VOGの9個チャネルになり、5.1チャネルの出力チャネルは、水平面上に存在するCH_M_000、CH_M_L030、CH_M_R030、CH_M_L110、CH_R_110の5個チャネルになる(ウーファーチャネルは除外)。
かように、5.1出力チャネルを利用して、CH_U_L45チャネルをレンダリングする場合、基本設定高度角が45°であり、高度角を35°に低くするならば、CH_U_L45チャネルと同側にある出力チャネルであるCH_M_L030、及びCH_M_L110に適用されるパンニング係数を3dB増加させるように更新し、残りの3つのチャネルのパンニング係数は減少させ、
を満足させるように更新するのである。このとき、Nは、任意の仮想チャネルをレンダリングするための出力チャネルの個数を意味し、gは、各出力チャネルに適用されるパンニング係数を意味する。
かような過程は、各高さ入力チャネルに対して、それぞれ遂行されなければならない。
反対に、仮想レンダリングのための基本設定高度角が45°であるが、高度角55°に高めて仮想レンダリングを行う場合を仮定する。かような場合、レンダリングする仮想チャネルと同側出力チャネルに適用するレンダリングパンニング係数を低減させ、残りのチャネルに適用するパンニング係数は、パワーノーマライズを介して決定する。
先に例として挙げた5.1出力チャネルを利用して、CH_U_L45チャネルをレンダリングする場合、基本設定高度角が45°であるが、55°に高くするならば、CH_U_L45チャネルと同側にある出力チャネルであるCH_M_L030、及びCH_M_L110に適用されるパンニング係数を3dB低減させるように更新し、残りの3つのチャネルのパンニング係数は増加させ、
を満足させるように更新するのである。このとき、Nは、任意の仮想チャネルをレンダリングするための出力チャネルの個数を意味し、gは、各出力チャネルに適用されるパンニング係数を意味する。
ただし、かように高度感を高くする場合は、パンニング係数更新によって、左右音像が逆転しないように留意する必要があり、それについては、図8で説明する。
以下、図11を参照し、音色フィルタ係数を更新する方法について説明する。
図11は、チャネルの高度角が35°である場合、及び高度角が45°である場合、周波数による音色フィルタの特徴を示した図面である。図11から分かるように、高度角が45°であるチャネルの音色フィルタは、高度角が35°であるチャネルの音色フィルタに比べ、高度角による特徴がさらに大きく示されるということを確認することができる。
結局、基準高度角よりさらに大きい高度角を有するように、仮想レンダリングを行う場合、基準高度角に対してレンダリングを行うとき、大きさ(magnitude)を増大させなければならない周波数帯域(本来のフィルタ係数が、1より大きい帯域)については、さらに大きく増加(更新されたフィルタ係数を、1より大きく増加)させ、大きさを減少させなければならないする周波数帯域(本来のフィルタ係数が、1より小さい帯域)については、さらに小さく減少(更新されたフィルタ係数を、1より小さく減少)させるのである。
かようなフィルタ大きさ特徴をデシベル(decibel)スケールで示せば、図11でのように、出力信号の大きさを増大させなければならない周波数帯域では、正の値であり、出力信号の大きさを低減させなければならない周波数帯域では、負の値を有することになる。また、図11で確認することができるように、高度角が低いほど、フィルタ大きさの形態(shape)が平ら(plat)になるように示される。
水平面チャネルを利用して、高さチャネルを仮想レンダリングする場合、高度角が低いほど、水平面チャネルの信号と類似した音色を有し、高度角が高くなるほど、高度感の変化が大きく示されるために、高度角が高くなるほど、音色フィルタによる影響を大きくし、高度角上昇による高度感効果を強調するのである。反対に、高度角が低くなるほど、音色フィルタによる影響を低減させ、高度感効果を低下させることができる。
従って、高度角の変化による、フィルタ係数の更新は、本来のフィルタ係数を基本設定高度角、及び実際にレンダリングする高度角に基づいた加重値を利用して更新する。
仮想レンダリングのための基本設定高度角が45°であり、基本高度角より低い35°でレンダリングを行って高度感を低くする場合であるならば、図11の45°のフィルタに該当する係数が初期値として決定されており、35°のフィルタに該当する係数に更新されなければならないのである。
従って、基本設定高度角である45°に比べ、低い高度角である35°にレンダリングして高度感を低くする場合であるならば、周波数帯域によるフィルタの谷と床とが、いずれも45°のフィルタに比べ、緩慢に修正されるように、フィルタ係数が更新されなければならないのである。
反対に、基本設定高度角が45°であるが、基本高度角より高い55°にレンダリングを行って高度感を高くする場合であるならば、周波数帯域によるフィルタの谷と床とがいずれも45°のフィルタに比べ、強く修正されるようにフィルタ係数が更新されなければならないのである。
図12は、一実施形態において、立体音響信号をレンダリングする方法のフローチャートである。
レンダラは、複数個の入力チャネルを含むマルチチャネル音響信号を受信する(1210)。入力されたマルチチャネル音響信号は、レンダリングを介して、複数個の出力チャネル信号に変換され、入力チャネルの数より、出力チャネルの数がさらに少ないダウンミックスの、例えば、22.2チャネルを有する入力信号が、5.1チャネルを有する出力信号に変換されるのである。
かように、三次元の立体音響入力信号を、二次元の出力チャネルを利用してレンダリングする場合、水平面入力チャネルについては、一般レンダリングが適用され、高度角を有する高さチャネルについては、高度感を付与するための仮想レンダリングが適用される。
レンダリングを行うためには、フィルタリングに利用されるフィルタ係数、及びパンニングに利用されるパンニング係数が必要である。このとき、初期化過程において、出力チャネルの標準レイアウト、及び仮想レンダリングのための基本設定高度角によって、レンダリングパラメータを獲得する(1220)。基本設定高度角は、レンダラによって多様に決定されるが、かように固定された高度角で仮想レンダリングを行う場合、ユーザの趣向によって、または入力信号の特性によって、仮想レンダリングの満足度及び効果が落ちるという結果が示される。
従って、出力チャネルの構成が、当該出力チャネルの標準レイアウッワ偏差が存在するか、あるいは仮想レンダリングを行わなければならない高度がレンダラの基本設定高度と異なるのであるならば、レンダリングパラメータを更新する(1230)。
このとき、更新されるレンダリングパラメータは、フィルタ係数の初期値に、高度角偏差に基づいて決定された加重値を付与して更新されたフィルタ係数、または入力チャネルの高度と、基本設定高度との大きさ比較結果によって、パンニング係数の初期値を増加または減少させて更新されたパンニング係数を含んでもよい。
フィルタ係数及びパンニング係数を更新する具体的な方法は、図9ないし図11で詳細に説明したので省略する。ただし、更新されたフィルタ係数及びパンニング係数は、追加して修正されたり拡張されたりするが、それについては追ってさらに詳細に説明する。
もし出力チャネルのスピーカレイアウトが、標準レイアウトと比べ、偏差が存在するのであるならば、それによる影響を補正するための過程が追加されるが、それに係わる具体的な方法の説明は省略する。このときの出力チャネルの偏差は、高度角または方位角差による偏差情報を含んでもよい。
図13は、一実施形態において、入力チャネルの高度角が臨界値以上であるとき、左右音像が逆転される現象を示した図面である。
両耳に到逹した音の時間差、大きさ差、周波数特性差によって、音像の位置を区別する。両耳に到逹した信号特性の差が大きいときは、その位置をさらに容易に把握するだけではなく、少しの誤差が発生しても、音像の前後あるいは左右の混同は起きない。しかし、頭の真後ろ近辺や真ん前近辺に位置する仮想音源は、両耳に到逹する時間差及び大きさ差がほとんどないので、周波数特性差だけでその位置を認知しなければならない。
図10の場合と同様に、図13は、聴取者の後ろから見た様子であり、四角で表示されたチャネルは、CH_U_L90チャネルである。このとき、CH_U_L90の高度角がφであるとすれば、φが増加するほど、聴取者の左耳及び右耳に到逹する音響信号のILD及びITDは、だんだんと小さくなり、両耳で認識する音響信号は、類似した音像を有することになる。高度角φの最大値が90°であり、φが90°になれば、聴取者の頭上に存在するVOGチャネルになり、両耳に同一音響信号が受信されることになる。
図13の左側図面のように、φが相当大きい値を有するならば、高度感が高くなり、強さ没入感を提供する音場感を感じることができる。しかし、高度感が高くなるにつれ、音像が狭くなり、スイートスポットが狭く形成されるので、聴取者の位置が少しだけ移動するか、あるいはチャネルが少しだけずれる場合でも、音像の左右逆転現象が示される。
図13の右側図面は、聴取者が左側に若干移動した場合、聴取者とチャネルとの位置を示した図面である。チャネル高度角φが大きい値を有し、高度感が高く形成された場合であるので、聴取者が若干移動しても、左右チャネルの相対的な位置が大きく変化するようになり、最悪の場合、左側チャネルにもかかわらず、右耳に到逹する信号がさらに大きく認識され、図13の右側図面のように、音像の左右反転が発生する。
レンダリング過程においては、高度感を付与することより、音像の左右バランス(balance)を維持し、音像の左右位置を定位させることがより重要な課題であるので、かような状況が発生しないためには、仮想レンダリングのための高度角を、一定範囲以下に制限することが必要である。
従って、レンダリングのための基本設定高度角より、さらに高い高度感を得るために、高度角を上昇させる場合、パンニング係数を低下させなければならないが、一定値以下では小さくならないように、パンニング係数の最小臨界値を設定する必要がある。
例えば、60°以上のレンダリング高度を、60°以上に上昇させた場合でも、強制的に、臨界高度角60°に対して更新されたパンニング係数を適用し、パンニングを行うならば、音像の左右逆転現象を防止することができる。
仮想レンダリングを利用して、立体音響を生成すれば、サラウンドチャネルの再生成分によって、音響信号の前後混同(front-back confusion)現象が生じる。前後混同現象とは、立体音響において、仮想音源が前方(front)に存在するか、後方(back)に存在するかということを判断することができない現象を意味する。
図13では、聴取者が移動した場合を仮定したが、音像が高くなるほど、聴取者が移動せずとも、個々人の聴覚器官の特性によって、音像の左右混同または前後混同が発生する可能性が高いという点は、当業者に自明であろう。
以下では、高度レンダリングパラメータ、すなわち、高度パンニング係数及び高度フィルタ係数を初期化して更新する具体的な方法について説明する。
高さ入力チャネルiinの高度角elvが35°より大きいとき、iinが正面(frontal)チャネルである場合(方位角−90°〜+90°)であるならば、更新された高度フィルタ係数
は、数式(1)ないし数式(3)によって決定される。
一方、高さ入力チャネルiinの高度角elvが35°より大きいとき、iinが背面(rear)チャネルである場合(方位角−180°〜−90°または90°〜180°)であるならば、更新された高度フィルタ係数
は、数式(4)ないし数式(6)によって決定される。
このとき、fは、k番目周波バンドのノーマライズされた中心周波数であり、fは、サンプリング周波数であり、
は、基準高度角であるときの高度フィルタ係数初期値である。
高度レンダリングのための高度角が基準高度角ではない場合、TBCチャネル(CH_U_180)及びVOGチャネル(CH_T_000)を除いた他の高さ入力チャネルに係わる高度パンニング係数も、更新されなければならない。
基準高度角(elevation angle)が35°であり、iinがTFCチャネル(CH_U_000)である場合であるならば、更新された高度パンニング係数
および
は、それぞれ数式(7)及び数式(8)のように決定される。
このとき、
は、基準高度角35°であり、TFCチャネルを仮想レンダリングするためのSL出力チャネルのパンニング係数
は、基準高度角35°であり、TFCチャネルを仮想レンダリングするためのSRチャネルのパンニング係数である。
TFCチャネルは、高度感を制御するために、左右チャネルゲインを調節することが不可能であるので、、正面(frontal)チャネルに対する背面(rear)チャネルである、SLチャネル及びSRチャネルに係わるゲインの比率を調節し、高度感を制御するのである。さらに詳細な内容は後述する。
TFCチャネル以外のチャネルについては、高さ入力チャネルの高度角が基準高度角である35°より大きいとき、g(elv)とg(elv)とのゲイン差によって、入力チャネルと同側チャネルのゲインは低減され、入力チャネルと異側(contralateral)チャネルのゲインは増加される。
例えば、入力チャネルがCH_U_L045チャネルであるならば、入力チャネルと同側にある出力チャネルは、CH_M_L030及びCH_M_L110であり、入力チャネルと異側にある出力チャネルは、CH_M_R030及びCH_M_R110になる。
以下では、入力チャネルが側面チャネルである場合、または正面チャネルであるか、あるいは背面チャネルである場合、g(elv)及びg(elv)を求め、そこから高度パンニングゲインを更新する具体的な方法について説明する。
高度角elvを有する入力チャネルが、側面チャネル(方位角−110°〜−70°または70°〜110°)であるとき、g(elv)及びg(elv)は、それぞれ数式(9)及び数式(10)によって決定される。
高度角elvを有する入力チャネルが、正面チャネル(方位角−70°〜+70°)または背面チャネル(方位角−180°〜−110°または110°〜180°)であるとき、g(elv)及びg(elv)は、それぞれ数式(11)及び数式(12)によって決定される。
数式(9)ないし数式(12)によって得られた、g(elv)及びg(elv)に基づいて、高度パンニング係数を更新することができる。
入力チャネルと同側にある出力チャネルに係わる更新された高度パンニング係数
及び入力チャネルと異側にある出力チャネルに係わる更新された高度パンニング係数
は、それぞれ数式(13)及び数式(14)によって決定される。
出力信号のエネルギーレベルを一定すに維持するために、数式(13)及び数式(14)によって得られたパンニング係数は、数式(15)及び数式(16)によってパワーノーマライズされる。
かように、入力チャネルのパンニング係数の二乗の和が1になるように、パワーノーマライズ過程を経ることにより、パンニング係数更新前出力信号のエネルギーレベルと、パンニング係数更新後出力信号のエネルギーレベルとを同一に維持することができる。
及び

において、Hというインデックスは、高周波領域においてのみ、高度パンニング係数が更新されるということを示す。数式(13)及び数式(14)の更新された高度パンニング係数は、高周波帯域2.8kHz〜10kHz帯域においてのみ適用される。しかし、サラウンドチャネルに対して、高度パンニング係数を更新するときには、高周波帯域のみではなく、低周波帯域についても、高度パンニング係数を更新する。
高度角elvを有する入力チャネルが、サラウンドチャネル(方位角−160°〜−110°または110°〜160°)であるとき、2.8kHz以下の低周波帯域において、入力チャネルと同側にある出力チャネルに係わる更新された高度パンニング係数
及び入力チャネルと異側にある出力チャネルに係わる更新された高度パンニング係数
は、それぞれ式(17)及び式(18)によって決定される。
高周波帯域と同様に、低周波帯域の更新された高度パンニングゲインも、出力信号のエネルギーレベルを一定に維持するために、数式(15)及び数式(16)によって得られたパンニング係数は、数式(19)及び数式(20)によってパワーノーマライズされる。
かように、入力チャネルのパンニング係数の二乗の和が1になるように、パワーノーマライズ過程を経ることにより、パンニング係数更新前出力信号のエネルギーレベルと、パンニング係数更新後出力信号のエネルギーレベルとを同一に維持することができる。
図14ないし図17は、一実施形態による、音像の前後混同を防止するための方法について説明するための図面である。図14は、一実施形態による、水平チャネル及び正面高さチャネルを図示している。
図14に図示された実施形態によれば、出力チャネルは、5.0チャネル(ウーファーチャネルは図示せず)であり、正面高さ入力チャネルを、かような水平出力チャネルにレンダリングする場合を仮定する。5.0チャネルは、水平面1410に存在し、FC(front center)チャネル、FL(front left)チャネル、FR(front right)チャネル、SL(surround left)チャネル及びSR(surround right)チャネルを含む。
正面高さチャネルは、図4において、アッパレイヤ1420に該当するチャネルであり、図14の実施形態においては、TFC(top front center)(正面高さ中心)チャネル、TFL(top front left)(正面高さ左)チャネル及びTFR(top front right)(正面高さ右)チャネルを含む。
図14に図示された実施形態において、入力チャネルが22.2チャネルであると仮定すれば、24チャネルの入力信号をレンダリング(ダウンミックス)し、5チャネルの出力信号を生成する。このとき、5チャネル出力信号には、24チャネルの入力信号それぞれに該当する成分が、レンダリング規則によって配分されている。従って、出力チャネルであるFC(front center)(正面中心)チャネル、FL(front left)(正面左)チャネル、FR(front right)(正面右)チャネル、SL(surround left)(左サラウンド)チャネル及びSR(surround right)(右サラウンド)チャネルの信号は、入力信号それぞれに該当する成分を含む。
このとき、正面高さチャネル及び水平面チャネルの個数、方位角及び高さチャネルの高度角は、チャネルレイアウトによって多様に決定される。入力チャネルが、22.2チャネルまたは22.0チャネルであるならば、正面高さチャネルは、CH_U_L030、CH_U_R030、CH_U_L045、CH_U_R045及びCH_U_000のうち少なくとも一つを含んでもよい。出力チャネルが、5.0チャネルまたは5.1チャネルであるならば、サラウンドチャネルは、CH_M_L110及びCH_M_R110のうち少なくとも一つを含んでもよい。
ただし、入出力マルチチャネルが標準レイアウトによらないとしても、各チャネルの高度角及び方位角によって、多様なマルチチャネルレイアウト構成が可能であるということは、当業者に自明である。
水平面出力チャネル(horizontal channel)を利用して、高さ入力チャネル(height channel)信号を仮想レンダリングする場合、サラウンド出力チャネルは、音に高度感を付し、音像の高度を高くする役割を行う。従って、正面高さ入力チャネルの信号を、水平面チャネルである5.0出力チャネルに仮想レンダリングする場合、サラウンド出力チャネルであるSLチャネル及びSRチャネル出力信号によって、高度感が付与されて調節される。
しかし、HRTFは、人ごとに固有特性を有するので、正面高さチャネルに仮想レンダリングされた信号が、聴取者のHRTF特性によって、後ろから聞こえるように認識される前後混同現象が発生することもある。
図15は、一実施形態による、正面高さチャネルの認識確率に係わる図面である。図15は、水平出力チャネルを利用して、正面高さチャネル、TFRチャネルを仮想レンダリングした場合、ユーザが音像の位置(前後)を認識する確率を示した図面である。図15において、ユーザの認識する高さは、高さチャネル1420であり、円の大きさは、確率の高さと比例する。
図15について説明すれば、本来の仮想レンダリングされたチャネルの位置である右側45°で音像を認識するユーザが最も多いが、かなりのユーザは、右側45°ではない他の位置で音像を認識する。先に言及したように、かような現象は、個々人のHRTF特性が異なるためであり、あるユーザの場合は、右側90°よりさらに偏り、後方に音像が存在すると認識するということを確認することができる。
HRTFは、頭周辺任意の位置に位置した音源から鼓膜までの音の伝達経路を、数学的伝達関数で表現したものを意味し、頭中心に対する音源の相対的位置や、人の頭と外耳(pinna)の大きさや形状によって非常に異なる。正確な仮想音源の描写のためには、対象になる人のHRTFを一つ一つ測定して使用しなければならないが、これは、現実的に困難であるので、一般的には、人体に類似したマネキンの鼓膜位置にマイクを設けて測定した非個別化された(non-individualized)HRTFを使用する。
かような非個別化されたHRTFを利用して仮想音源を再現した場合、個人の頭や外耳が、マネキンまたはダミーヘッドマイクロフォンシステム(dummy head microphone system)と合わない場合、音像定位と係わる多様な問題が生じる。水平面上で感じられる角度の誤差は、個人の頭サイズを考慮して補正が可能であるが、高度感に発生する誤差または前後混同現象は、外耳の大きさと形状とが個々人ごとに異なるために発生する問題であるので、それの補正は容易ではない。
先に言及したように、頭の大きさ及び形態などによって、個々人ごとに固有HRTFを有するが、それぞれの聴取者ごとに、互いに異なるHRTFを適用することは、現実的に困難である。従って、非個別化されたHRTF、すなわち、共通HRTFを使用することになるが、かような場合、前後混同現象が発生する可能性がある。
このとき、サラウンド出力チャネル信号に所定の時間遅延(time delay)を付与すれば、前後混同現象を防止することができる。
音は、全ての人に同一に認識されるものではなく、周辺環境や聴取者の心理状態によっても、互いに異なるように聞こえることになる。それは、音が伝播される空間での物理的現象は、聴取者に主観的であって感覚的に認識されるからである。かように、聴取者の主観的または心理的な要因に基づいて認識することになる音響信号を心理音響(psychoacoustic)という。該心理音響には、音圧、周波数、時間などの物理的変数以外にも、大きさ(loudness)、ピッチ(pitch)、音色(timble)、及び音に係わる経験などの主観的変数が影響を及ぼす。
心理音響では、各状況によるさまざまな効果が示されるが、代表的なものとして、マスキング効果、カクテル効果、方向知覚効果、距離知覚効果及び先行音効果などがある。心理音響に基づいた技術は、聴取者にさらに適切な音響信号を提供するために、多様な分野で応用されている。
先行音効果(precedence effect)は、ハース効果(Hass effect)ともいい、互いに異なる音が1msないし30msの時間差に順次に生じる場合、最も先に音がした方向から音がすると聴取者に認識される現象をいう。しかし、2つの音の発生時間が50ms以上差があれば、それぞれ異なる方向と認知される。
例えば、音像が定位された状態において、右側チャネルの出力信号を遅延させれば、音像が左に移り、右側で再生される信号と認識されるが、かような現象を先行音効果またはハース効果という。
サラウンド出力チャネルは、音像に高度感を付与するために使用されるが、図15に図示されているように、一部聴取者には、サラウンド出力チャネル信号によって、正面チャネル(frontal channel)の信号が背面から聞こえるように認識される、前後混同(front-back confusion)現象が発生することになる。
先に言及した先行音効果を利用すれば、かような問題を解決することができる。正面高さ入力チャネルを再生するためのサラウンド出力チャネル信号に、所定の時間遅延を付加すれば、正面高さチャネル入力信号を再生する出力信号のうち、正面を基準に、−90°〜+90°に存在する正面出力チャネルの信号より、正面を基準に、−180°〜−90°または+90°〜+180°に存在するサラウンド出力チャネルの信号がさらに遅く再生される。
従って、聴取者固有のHRTFによって、正面入力チャネルの音響信号が背面で再生されるように認識される場合でも、先行効果によって、音響信号が先に再生される正面で再生されるように認識することになるのである。
図16は、一実施形態による、前後混同を防止するための方法のフローチャートである。
レンダラは、複数個の入力チャネルを含むマルチチャネル音響信号を受信する(1610)。入力されたマルチチャネル音響信号は、レンダリングを介して、複数個の出力チャネル信号に変換され、入力チャネルの数より出力チャネルの数がさらに少ないダウンミックスの、例えば、22.2チャネルを有する入力信号が、5.1チャネルまたは5.0チャネルを有する出力信号に変換される。
かように、三次元の立体音響入力信号を、二次元の出力チャネルを利用してレンダリングする場合、水平面入力チャネルについては、一般レンダリングが適用され、高度角を有する高さチャネルについては、高度感を付与するための仮想レンダリングが適用される。
レンダリングを行うためには、フィルタリングに利用されるフィルタ係数、及びパンニングに利用されるパンニング係数が必要である。このとき、初期化過程において、出力チャネルの標準レイアウト、及び仮想レンダリングのための基本高度角によって、レンダリングパラメータを獲得する。基本高度角は、レンダラによって多様に決定されるが、ユーザの趣向、または入力信号の特性によって、基本高度角ではない所定高度角にで設定することにより、仮想レンダリングの満足度及び効果を向上させることができる。
サラウンドチャネルによる前後混同現象を防止するために、正面高さチャネルに係わるサラウンド出力チャネルに、時間遅延を追加する(1620)。
正面高さ入力チャネルを再生するためのサラウンド出力チャネル信号に、所定の時間遅延を付加すれば、正面高さチャネル入力信号を再生する出力信号のうち、正面を基準に、−90°〜+90°に存在する正面出力チャネルの信号より、正面を基準に、−180°〜−90°または+90°〜+180°に存在するサラウンド出力チャネルの信号がさらに遅く再生される。
従って、聴取者固有のHRTFによって、正面入力チャネルの音響信号が背面で再生されるように認識される場合でも、先行効果によって、音響信号が先に再生される正面で再生されるように認識することになる。
かように、正面高さチャネルに係わるサラウンド出力チャネルを遅延させて再生するために、レンダラは、サラウンド出力チャネルに追加された遅延に基づいて、高度レンダリングパラメータを修正する(1630)。
高度レンダリングパラメータが修正されれば、レンダラは、修正された高度レンダリングパラメータに基づいて、高度レンダリングされたサラウンド出力チャネルを生成する(1640)。具体的に説明すれば、修正された高度レンダリングパラメータを高さ入力チャネル信号に適用してレンダリングすることにより、サラウンド出力チャネル信号を生成する。かように、修正された高度レンダリングパラメータに基づいて、正面高さ入力チャネルに対して遅延された高度レンダリングサラウンド出力チャネルは、サラウンド出力チャネルによる前後混同を防止することができる。
サラウンド出力チャネルに適用される時間遅延は、約2.7ms、距離上約91.5cmが適当であり、それは、48kHzで128サンプル、すなわち、2QMF(quadrature mirror filter)サンプルに該当する。ただし、前後混同を防止するために、サラウンド出力チャネルに追加される遅延は、サンプリングレートと再生環境によって異なる。
このとき、出力チャネルの構成が、当該出力チャネルの標準レイアウトと偏差が存在するか、あるいは仮想レンダリングを行わなければならない高度がレンダラの基本設定高度と異なるものであるならば、それに基づいて、レンダリングパラメータを更新する。更新されるレンダリングパラメータは、フィルタ係数の初期値に、高度角偏差に基づいて決定された加重値を付与して更新されたフィルタ係数、または入力チャネルの高度と、基本設定高度との高さ比較結果によって、パンニング係数の初期値を増大または減少させて更新されたパンニング係数を含んでもよい。
もし空間高度レンダリングされる正面高さ入力チャネルが存在するのであるならば、正面入力チャネルの遅延されたQMFサンプルが、入力QMFサンプルに加えられ、ダウンミックスマトリックスは、修正された係数に拡張される。
所定の正面高さ入力チャネルに時間遅延を付加し、レンダリング(ダウンミックス)マトリックスを修正する具体的な方法は、次の通りである。
入力チャネルの個数がNinである場合[1 Nin]チャネルのうちi番目入力チャネルについて、i番目入力チャネルが高さ入力チャネル(CH_U_L030、CH_U_L045、CH_U_R030、CH_U_R045及びCH_U_000)のうち一つであるならば、入力チャネルのQMFサンプル遅延、及び遅延されたQMFサンプルは、数式(21)及び数式(22)でのように決定される。
delay = round(fs*0.003/64) (21)
このとき、fsは、サンプリング周波数を示し、
は、k番目バンドのn番目QMFサブバンドサンプルを示す。サラウンド出力チャネルに適用される時間遅延は、約2.7ms、距離上約91.5cmが適し、それは、48kHzにおいて128サンプル、すなわち、2 QMFサンプルに該当する。ただし、前後混同を防止するために、サラウンド出力チャネルに追加される時間遅延は、サンプリングレート及び再生環境によって異なる。
修正されたレンダリング(ダウンミックス)マトリックスは、数式(23)ないし数式(25)でのように決定される。
Nin = Nin + 1 (25)
このとき、MDMXは、高度レンダリングのためのダウンミックスマトリックスを示し、MDMX2は、一般レンダリングのためのダウンミックスマトリックスを示し、Noutは、出力チャネルの個数を示す。
各入力チャネルに係わるダウンミックスマトリックスを完成するために、Ninを1ずつ増加させ、数式(3)及び数式(4)の過程を反復する。1つの入力チャネルに係わるダウンミックスマトリックスを獲得するためには、各出力チャネルに係わるダウンミックスパラメータを獲得しなければならない。
i番目入力チャネルに係わるj番目出力チャネルのダウンミックスパラメータは、次のように決定される。
出力チャネルの個数がNoutである場合[1 Nout]チャネルのうち、j番目出力チャネルについて、j番目出力チャネルがサラウンドチャネル(CH_M_L110またはCH_M_R110)のうち一つであるならば、出力チャネルに適用されるダウンミックスパラメータは、数式(26)のように決定される。
出力チャネルの個数Noutについて、[1 Nout]のうち、j番目出力チャネルについて、もしj番目出力チャネルがサラウンドチャネル(CH_M_L110またはCH_M_R110)ではないならば、出力チャネルに適用されるダウンミックスパラメータは、数式(27)のように決定される。
もし出力チャネルのスピーカレイアウトが、標準レイアウトと比較し、偏差が存在するものであるならば、それによる影響を補正するための過程が追加されるが、それに係わる具体的な方法の説明は省略する。そのときの出力チャネルの偏差は、高度角差または方位角差による偏差情報を含んでもよい。
図17は、一実施形態による、サラウンド出力チャネルに遅延が追加された、水平チャネル及び正面高さチャネルを図示している。図17に図示された実施形態は、図14に図示された実施形態と同様に、出力チャネルは、5.0チャネル(ウーファーチャネル図示せず)であり、正面高さ入力チャネルをかような水平出力チャネルにレンダリングする場合を仮定する。5.0チャネルは、水平面1410に存在し、FC(front center)チャネル、FL(front left)チャネル、FR(front right)チャネル、SL(surround left)チャネル及びSR(surround right)チャネルを含む。
正面高さチャネルは、図4において、アッパレイヤ1420に該当するチャネルであり、図14の実施形態においては、TFC(top front center)チャネルみ、TFL(top front left)チャネル及びTFR(top front right)チャネルを含む。
図17に図示された実施形態は、図14に図示された実施形態と同様に、入力チャネルが22.2チャネルであると仮定すれば、24チャネルの入力信号をレンダリング(ダウンミックス)し、5チャネルの出力信号を生成する。このとき、5チャネル出力信号には、24チャネルの入力信号それぞれに該当する成分が、レンダリング規則によって配分されている。従って、出力チャネルである、FCチャネル、FLチャネル、FRチャネル、SLチャネル及びSRチャネルの信号は、入力信号それぞれに該当する成分を含む。
このとき、正面高さチャネル及び水平面チャネルの個数、方位角、及び高さチャネルの高度角は、チャネルレイアウトによって多様に決定される。入力チャネルが22.2チャネルまたは22.0チャネルであるならば、正面高さチャネルは、CH_U_L030、CH_U_R030、CH_U_L045、CH_U_R045及びCH_U_000のうち少なくとも一つを含んでもよい。出力チャネルが5.0チャネルまたは5.1チャネルであるならば、サラウンドチャネルは、CH_M_L110及びCH_M_R110のうち少なくとも一つを含んでもよい。
ただし、入出力マルチチャネルが標準レイアウトによるものではないとしても、各チャネルの高度角及び方位角によって、多様なマルチチャネルレイアウト構成が可能であるということは、当業者に自明であろう。
このとき、SLチャネル及びSRチャネルによって発生する前後混同現象を防止するために、サラウンド出力チャネルを介してレンダリングされる正面高さ入力チャネルに対して、所定の遅延を付加する。修正された高度レンダリングパラメータに基づいて、正面高さ入力チャネルに対して遅延された高度レンダリングサラウンド出力チャネルは、サラウンド出力チャネルによる前後混同を防止することができる。
遅延が付加した音響信号、及び付加された遅延に基づいて修正された高度レンダリングパラメータを求める方法は、数式(1)ないし数式(7)に示されている。先に図16の実施形態において、それについて詳細に説明したので、図17の実施形態においては、それに係わる詳細な説明は省略する。
サラウンド出力チャネルに適用される時間遅延は、約2.7ms、距離上約91.5cmが適し、それは、48kHzにおいて、128サンプル、すなわち、2 QMFサンプルに該当する。ただし、前後混同を防止するために、サラウンド出力チャネルに追加される遅延は、サンプリングレート及び再生環境によって異なる。
図18は、一実施形態による、水平チャネル及び正面中央チャネル(TFCチャネル)を図示している。図18に図示された実施形態によれば、出力チャネルは、5.0チャネル(ウーファーチャネル図示せず)であり、TFC(top front center)チャネルをかような水平出力チャネルにレンダリングする場合を仮定する。5.0チャネルは、水平面1810に存在し、FC(front center)チャネル、FL(front left)チャネル、FR(front right)チャネル、SL(surround left)チャネル及びSR(surround right)チャネルを含む。TFCチャネルは、図4において、アッパレイヤ1820に該当するチャネルであり、方位角は、0°であり、所定高度角に位置する場合を仮定する。
先に言及したように、音像の左右逆転が発生しないようにすることは、音響信号をレンダリングする方法で非常に重要である。水平出力チャネルにおいて、高度角を有する高さ入力チャネルをレンダリングするためには、仮想レンダリングを行わなければならず、レンダリングを介して、マルチチャネル入力チャネル信号は、マルチチャネル出力信号にパンニングされる。
特定高度で高度感を提供する仮想レンダリングのために、各パンニング係数及びフィルタ係数を決定することになるが、TFCチャネル入力信号は、聴取者の正面、すなわち、中心(center)に音像が位置しなければならないので、FLチャネル及びFRチャネルのパンニング係数は、TFCチャネルの音像が正面に存在するように決定される。
出力チャネルのレイアウトが、標準レイアウトによる場合であるならば、FLチャネル及びFRチャネルのパンニング係数は、同一でなければならず、SLチャネル及びSRチャネルのパンニング係数も、同一でなければならないのである。
かように、TFC入力チャネルをレンダリングするための左右側チャネルのパンニング係数は、同一でなければならないので、TFC入力チャネルの高度感を調節するために、左右側チャネルのパンニング係数を調節することが不可能である。従って、TFC入力チャネルをレンダリングして高度感を付与するためには、前後(front−rear)チャネル間のパンニング係数を調節する。
基準高度角(elevation angle)が35°であり、レンダリングするTFC入力チャネルの高度角がelvであるとすれば、TFC入力チャネルを、高度角elvで仮想レンダリングをするためのSLチャネル及びSRチャネルのパンニング係数は、それぞれ数式(28)及び数式(29)でのように決定される。
このとき、G_vH0,5(iin)は、基準高度角35°で仮想レンダリングを行うためのSLチャネルのパンニング係数であり、G_vH0,6(iin)は、基準高度角35°で仮想レンダリングを行うためのSRチャネルのパンニング係数である。iinは、高さ入力チャネルに係わるインデックスであり、数式(28)及び数式(29)は、高さ入力チャネルがTFCチャネルである場合のパンニング係数の初期値と、更新されたパンニング係数との関係を示す。
ここで、出力信号のエネルギーレベルを一定に維持するために、数式(28)及び数式(29)によって得られたパンニング係数をそのまま使用せず、数式(30)及び数式(31)によってパワーノーマライズして使用する。
かように、入力チャネルのパンニング係数の二乗の和が1になるように、パワーノーマライズ過程を経ることにより、パンニング係数更新前出力信号のエネルギーレベルと、パンニング係数更新後出力信号のエネルギーレベルとを同一に維持することができる。
以上で説明した本発明による実施形態は、多様なコンピュータ構成要素を介して実行されるプログラム命令語の形態に具現され、コンピュータ可読記録媒体に記録される。前記コンピュータ可読記録媒体は、プログラム命令語、データファイル、データ構造などを、単独でまたは組み合わせて含んでもよい。前記コンピュータ可読記録媒体に記録されるプログラム命令語は、本発明のために特別に設計されて構成されたものでもあり、コンピュータソフトウェア分野の当業者に公知されて使用可能なものでもある。コンピュータ可読記録媒体の例としては、ハードディスク、フロッピー(登録商標)ディスク及び磁気テープのような磁気媒体;CD−ROM(compact disc read only memory)及びDVD(digital versatile disc)のような光記録媒体;フロプティカルディスク(floptical disk)のような磁気・光媒体(magneto-optical medium);及びROM(read only memory)、RAM(random access memory)、フラッシュメモリのような、プログラム命令語を保存して実行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例としては、コンパイラによって作われるような機械語コードだけではなく、インタープリタなどを使用して、コンピュータによって実行される高級言語コードも含まれる。ハードウェア装置は、本発明による処理を行うために、1以上のソフトウェアモジュールに変更され、その逆も同様である。
以上、本発明について、具体的な構成要素ような特定事項、限定された実施形態及び図面によって説明したが、それらは、本発明のさらに全般的な理解の一助とするために提供されたものであるのみ、本発明は、前述の実施形態に限定されるものではなく、本発明が属する技術分野で当業者であるならば、かような記載から多様な修正及び変更を図ることができるであろう。
従って、本発明の思想は、前述の実施形態に限って決められるものではなく、特許請求の範囲だけではなく、該特許請求の範囲と均等であるか、あるいはそれらから等価的に変更された全ての範囲は、本発明の思想の範疇に属するものであるとすることができる。

Claims (15)

  1. 音響信号を高度レンダリングする方法において、
    さ入力チャネル信号を含むマルチチャネル信号を受信する段階と、
    前記マルチチャネル信号に対する第1高度レンダリングパラメータを獲得する段階と、
    前記高さ入力チャネル信号のラベルが正面高さチャネルラベルのうち1つである場合、前記高さ入力チャネル信号に、所定の遅延を付加して遅延された高さ入力チャネル信号を獲得する段階と、
    前記高さ入力チャネル信号のラベルが前記正面高さチャネルラベルのうち1つである場合、サラウンドチャネルラベルである2つの出力チャネル信号のラベルに基づいて、前記遅延された高さ入力チャネル信号に係わる第2高度レンダリングパラメータを獲得する段階と、
    前記高さ入力チャネル信号のラベルが前記正面高さチャネルラベルのうち1つである場合、複数個の出力チャネル信号を出力するために、前記第1高度レンダリングパラメータ及び前記第2高度レンダリングパラメータに基づいて、前記マルチチャネル信号、及び前記遅延された高さ入力チャネル信号を高度レンダリングする段階と、を含む音響信号をレンダリングする方法。
  2. 前記複数個の出力チャネル信号は、水平チャネル信号であることを特徴とする請求項1に記載の音響信号をレンダリングする方法。
  3. 高度レンダリングパラメータは、パンニングゲイン及び高度フィルタ係数のうち少なくとも一つを含むことを特徴とする請求項1に記載の音響信号をレンダリングする方法。
  4. 前記正面高さチャネルラベルは、
    CH_U_L030,CH_U_R030,CH_U_L045,CH_U_R045及びCH_U_000チャネルのうち少なくとも一つを含むことを特徴とする請求項1に記載の音響信号をレンダリングする方法。
  5. 前記サラウンドチャネルラベルは、
    CH_M_L110及びCH_M_R110を含むことを特徴とする請求項1に記載の音響信号をレンダリングする方法。
  6. 前記所定の遅延は、前記マルチチャネル信号のサンプリングレートに基づいて決定されることを特徴とする請求項1に記載の音響信号をレンダリングする方法。
  7. 前記所定の遅延は、次のような方程式
    によって決定され、このとき、前記fは、前記マルチチャネル信号のサンプリングレートであることを特徴とする請求項6に記載の音響信号をレンダリングする方法。
  8. 音響信号をレンダリングする装置において、
    さ入力チャネル信号を含むマルチチャネル信号を受信する受信部と、
    前記マルチチャネル信号に対する第1高度レンダリングパラメータを獲得し、
    前記高さ入力チャネル信号のラベルが正面高さチャネルラベルのうち1つである場合、前記高さ入力チャネル信号に、所定の遅延を付加して遅延された高さ入力チャネル信号を獲得し、
    前記高さ入力チャネル信号のラベルが前記正面高さチャネルラベルのうち1つである場合、サラウンドチャネルラベルである2つの出力チャネル信号のラベルに基づいて、前記遅延された高さ入力チャネル信号に対する第2高度レンダリングパラメータを獲得し、
    前記高さ入力チャネル信号のラベルが前記正面高さチャネルラベルのうち1つである場合、複数個の出力チャネル信号を出力するために、前記第1高度レンダリングパラメータ及び前記第2高度レンダリングパラメータに基づいて、前記マルチチャネル信号、及び前記遅延された高さ入力チャネル信号を高度レンダリングする、高度レンダリング部と、
    を含む音響信号をレンダリングする装置。
  9. 前記複数個の出力チャネル信号は、水平チャネル信号であることを特徴とする請求項8に記載の音響信号をレンダリングする装置。
  10. 高度レンダリングパラメータは、パンニングゲイン及び高度フィルタ係数のうち少なくとも一つを含むことを特徴とする請求項に記載の音響信号をレンダリングする装置。
  11. 前記正面高さチャネルラベルは、
    CH_U_L030,CH_U_R030,CH_U_L045,CH_U_R045及びCH_U_000チャネルのうち少なくとも一つを含むことを特徴とする請求項8に記載の音響信号をレンダリングする装置。
  12. 前記サラウンドチャネルラベルは、
    CH_M_L110及びCH_M_R110を含むことを特徴とする請求項8に記載の音響信号をレンダリングする装置。
  13. 前記所定の遅延は、前記マルチチャネル信号のサンプリングレートに基づいて決定されることを特徴とする請求項8に記載の音響信号をレンダリングする装置。
  14. 前記所定の遅延は、次のような方程式
    によって決定され、このとき、前記fは、前記マルチチャネル信号のサンプリングレートであることを特徴とする請求項13に記載の音響信号をレンダリングする装置。
  15. 請求項1に記載の方法を実行するためのコンピュータプログラムを記録するコンピュータ可読記録媒体。
JP2016575113A 2014-06-26 2015-06-26 音響信号のレンダリング方法、その装置及び該コンピュータ可読記録媒体 Active JP6444436B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462017499P 2014-06-26 2014-06-26
US62/017,499 2014-06-26
PCT/KR2015/006601 WO2015199508A1 (ko) 2014-06-26 2015-06-26 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018220950A Division JP6600733B2 (ja) 2014-06-26 2018-11-27 音響信号のレンダリング方法、その装置及び該コンピュータ可読記録媒体

Publications (2)

Publication Number Publication Date
JP2017523694A JP2017523694A (ja) 2017-08-17
JP6444436B2 true JP6444436B2 (ja) 2018-12-26

Family

ID=54938492

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016575113A Active JP6444436B2 (ja) 2014-06-26 2015-06-26 音響信号のレンダリング方法、その装置及び該コンピュータ可読記録媒体
JP2018220950A Active JP6600733B2 (ja) 2014-06-26 2018-11-27 音響信号のレンダリング方法、その装置及び該コンピュータ可読記録媒体

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018220950A Active JP6600733B2 (ja) 2014-06-26 2018-11-27 音響信号のレンダリング方法、その装置及び該コンピュータ可読記録媒体

Country Status (11)

Country Link
US (3) US10021504B2 (ja)
EP (1) EP3163915A4 (ja)
JP (2) JP6444436B2 (ja)
KR (4) KR102294192B1 (ja)
CN (3) CN106797524B (ja)
AU (3) AU2015280809C1 (ja)
BR (2) BR122022017776B1 (ja)
CA (2) CA2953674C (ja)
MX (2) MX365637B (ja)
RU (2) RU2656986C1 (ja)
WO (1) WO2015199508A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
CN106303897A (zh) * 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
JP6918777B2 (ja) * 2015-08-14 2021-08-11 ディーティーエス・インコーポレイテッドDTS,Inc. オブジェクトベースのオーディオのための低音管理
JP2019518373A (ja) * 2016-05-06 2019-06-27 ディーティーエス・インコーポレイテッドDTS,Inc. 没入型オーディオ再生システム
WO2018144850A1 (en) * 2017-02-02 2018-08-09 Bose Corporation Conference room audio setup
KR102483470B1 (ko) * 2018-02-13 2023-01-02 한국전자통신연구원 다중 렌더링 방식을 이용하는 입체 음향 생성 장치 및 입체 음향 생성 방법, 그리고 입체 음향 재생 장치 및 입체 음향 재생 방법
CN109005496A (zh) * 2018-07-26 2018-12-14 西北工业大学 一种hrtf中垂面方位增强方法
EP3726858A1 (en) * 2019-04-16 2020-10-21 Fraunhofer Gesellschaft zur Förderung der Angewand Lower layer reproduction
US11943600B2 (en) 2019-05-03 2024-03-26 Dolby Laboratories Licensing Corporation Rendering audio objects with multiple types of renderers
US11341952B2 (en) 2019-08-06 2022-05-24 Insoundz, Ltd. System and method for generating audio featuring spatial representations of sound sources
TWI735968B (zh) * 2019-10-09 2021-08-11 名世電子企業股份有限公司 音場型自然環境音效系統
CN112911494B (zh) * 2021-01-11 2022-07-22 恒大新能源汽车投资控股集团有限公司 一种音频数据处理方法、装置及设备
DE102021203640B4 (de) * 2021-04-13 2023-02-16 Kaetel Systems Gmbh Lautsprechersystem mit einer Vorrichtung und Verfahren zum Erzeugen eines ersten Ansteuersignals und eines zweiten Ansteuersignals unter Verwendung einer Linearisierung und/oder einer Bandbreiten-Erweiterung

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3427393A (en) * 1992-12-31 1994-08-15 Desper Products, Inc. Stereophonic manipulation apparatus and method for sound image enhancement
US7480389B2 (en) * 2001-03-07 2009-01-20 Harman International Industries, Incorporated Sound direction system
US7928311B2 (en) * 2004-12-01 2011-04-19 Creative Technology Ltd System and method for forming and rendering 3D MIDI messages
KR100708196B1 (ko) * 2005-11-30 2007-04-17 삼성전자주식회사 모노 스피커를 이용한 확장된 사운드 재생 장치 및 방법
KR101336237B1 (ko) 2007-03-02 2013-12-03 삼성전자주식회사 멀티 채널 스피커 시스템의 멀티 채널 신호 재생 방법 및장치
KR101312470B1 (ko) * 2007-04-26 2013-09-27 돌비 인터네셔널 에이비 출력 신호 합성 장치 및 방법
EP2154911A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
CN102273233B (zh) * 2008-12-18 2015-04-15 杜比实验室特许公司 音频通道空间转换
JP2011211312A (ja) * 2010-03-29 2011-10-20 Panasonic Corp 音像定位処理装置及び音像定位処理方法
KR20120004909A (ko) * 2010-07-07 2012-01-13 삼성전자주식회사 입체 음향 재생 방법 및 장치
JP2012049652A (ja) * 2010-08-24 2012-03-08 Panasonic Corp マルチチャネルオーディオ再生装置およびマルチチャネルオーディオ再生方法
WO2012031605A1 (en) * 2010-09-06 2012-03-15 Fundacio Barcelona Media Universitat Pompeu Fabra Upmixing method and system for multichannel audio reproduction
US20120155650A1 (en) 2010-12-15 2012-06-21 Harman International Industries, Incorporated Speaker array for virtual surround rendering
JP5867672B2 (ja) * 2011-03-30 2016-02-24 ヤマハ株式会社 音像定位制御装置
KR102160248B1 (ko) * 2012-01-05 2020-09-25 삼성전자주식회사 다채널 음향 신호의 정위 방법 및 장치
US9516446B2 (en) * 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
RU2635884C2 (ru) 2012-09-12 2017-11-16 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для предоставления улучшенных характеристик направленного понижающего микширования для трехмерного аудио
WO2014058275A1 (ko) * 2012-10-11 2014-04-17 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
CA3036880C (en) 2013-03-29 2021-04-27 Samsung Electronics Co., Ltd. Audio apparatus and audio providing method thereof
MX357405B (es) * 2014-03-24 2018-07-09 Samsung Electronics Co Ltd Metodo y aparato de reproduccion de señal acustica y medio de grabacion susceptible de ser leido en computadora.
KR102343453B1 (ko) 2014-03-28 2021-12-27 삼성전자주식회사 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체

Also Published As

Publication number Publication date
KR102362245B1 (ko) 2022-02-14
US10484810B2 (en) 2019-11-19
CN110213709A (zh) 2019-09-06
CA2953674A1 (en) 2015-12-30
BR122022017776B1 (pt) 2023-04-11
AU2017279615A1 (en) 2018-01-18
US20190239021A1 (en) 2019-08-01
JP2019062548A (ja) 2019-04-18
WO2015199508A1 (ko) 2015-12-30
AU2019200907A1 (en) 2019-02-28
EP3163915A1 (en) 2017-05-03
US10021504B2 (en) 2018-07-10
CN106797524B (zh) 2019-07-19
AU2017279615B2 (en) 2018-11-08
KR20160001712A (ko) 2016-01-06
MX2019006683A (es) 2019-08-21
CN110418274B (zh) 2021-06-04
KR102294192B1 (ko) 2021-08-26
RU2018112368A (ru) 2019-03-01
US10299063B2 (en) 2019-05-21
RU2018112368A3 (ja) 2021-09-01
US20180295460A1 (en) 2018-10-11
RU2759448C2 (ru) 2021-11-12
EP3163915A4 (en) 2017-12-20
CN110213709B (zh) 2021-06-15
KR102529122B1 (ko) 2023-05-04
AU2019200907B2 (en) 2020-07-02
BR112016030345A2 (ja) 2017-08-22
KR20220019746A (ko) 2022-02-17
CN106797524A (zh) 2017-05-31
KR102423757B1 (ko) 2022-07-21
BR112016030345B1 (pt) 2022-12-20
AU2015280809C1 (en) 2018-04-26
US20170223477A1 (en) 2017-08-03
JP6600733B2 (ja) 2019-10-30
CA3041710A1 (en) 2015-12-30
MX365637B (es) 2019-06-10
KR20220106087A (ko) 2022-07-28
CN110418274A (zh) 2019-11-05
RU2656986C1 (ru) 2018-06-07
MX2017000019A (es) 2017-05-01
AU2015280809B2 (en) 2017-09-28
CA3041710C (en) 2021-06-01
JP2017523694A (ja) 2017-08-17
KR20210110253A (ko) 2021-09-07
AU2015280809A1 (en) 2017-02-09
CA2953674C (en) 2019-06-18

Similar Documents

Publication Publication Date Title
JP6600733B2 (ja) 音響信号のレンダリング方法、その装置及び該コンピュータ可読記録媒体
JP6772231B2 (ja) 音響信号のレンダリング方法、該装置、及びコンピュータ可読記録媒体
KR102302672B1 (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
TW201246060A (en) Audio spatialization and environment simulation
KR20160141793A (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
RU2777511C1 (ru) Способ и устройство для рендеринга акустического сигнала и машиночитаемый носитель записи
Pfanzagl-Cardone The Art and Science of 3D Audio Recording

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181030

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181127

R150 Certificate of patent or registration of utility model

Ref document number: 6444436

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250