JP4620468B2 - Audio reproduction system and method for reproducing an audio signal - Google Patents

Audio reproduction system and method for reproducing an audio signal Download PDF

Info

Publication number
JP4620468B2
JP4620468B2 JP2004552700A JP2004552700A JP4620468B2 JP 4620468 B2 JP4620468 B2 JP 4620468B2 JP 2004552700 A JP2004552700 A JP 2004552700A JP 2004552700 A JP2004552700 A JP 2004552700A JP 4620468 B2 JP4620468 B2 JP 4620468B2
Authority
JP
Japan
Prior art keywords
audio
speaker
signal
reproduction
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2004552700A
Other languages
Japanese (ja)
Other versions
JP2006507727A (en
Inventor
フランク メルヒオール
トーマス レーダー
ミヒャエル ベッキンガー
サンドラ ブリックス
トーマス シュポーラー
ハイモ クッシュバッハ
ベルトホルト シュレンカー
カルステン ラント
Original Assignee
フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2006507727A publication Critical patent/JP2006507727A/en
Application granted granted Critical
Publication of JP4620468B2 publication Critical patent/JP4620468B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic Arrangements (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Abstract

An audio playback system is divided into a central wavefield synthesis module (10) and a multitude of decentrally arranged loudspeaker modules (12a-12e). Synthesis signals for the individual loudspeakers and corresponding items of channel information, which are assigned to the synthesis signals, are calculated in the central wavefield synthesis module. The synthesis signals for a loudspeaker together with associated items of channel information are then transmitted to corresponding loudspeaker modules via a transmission link (16a-16e). Each loudspeaker module receives the synthesis signals and associated items of channel information that are intended for the loudspeaker assigned to the loudspeaker module. A decentralized audio rendering and digital-to-analog conversion takes place inside the loudspeaker modules in order to decentrally generate the actual analog loudspeaker signals in spatial proximity to each loudspeaker. The division into a central wavefield synthesis module and a multitude of decentralized loudspeaker modules enables the production of audio playback systems that can be scaled with regard to price in order to offer different size systems, which can be scaled in terms of price, for, in particular, cinema playback spaces that vary greatly in size.

Description

本発明は、オーディオ再生システムに関し、特に映画館等可変サイズの再生室に使用するのに適したオーディオ再生システムであって、波面合成(wave-field synthesis)に基づくオーディオ再生システムに関する。   The present invention relates to an audio playback system, and more particularly to an audio playback system suitable for use in a variable-size playback room such as a movie theater, and an audio playback system based on wave-field synthesis.

家電製品の分野では、新しい技術および革新的な製品に対する要望が高まっており、新しいマルチメディアシステムが成功するための重要な前提条件は、それらが最適な機能と能力とをそれぞれ提供することである。これは、デジタル技術と特にコンピュータ技術とによって達成される。例として、改善された現実的な視聴覚的印象を提供する機器等が挙げられる。従来のオーディオシステムは、自然環境だけでなく仮想環境の空間的音再生の品質においても著しい弱点を有する。   In the field of consumer electronics, there is a growing demand for new technologies and innovative products, and an important prerequisite for the success of new multimedia systems is that they provide optimal functions and capabilities, respectively. . This is achieved by digital technology and in particular computer technology. Examples include devices that provide improved realistic audiovisual impressions. Conventional audio systems have significant weaknesses not only in the natural environment but also in the quality of spatial sound reproduction in a virtual environment.

オーディオ信号のマルチチャネルスピーカ再生の方法は長年にわたって公知であり、標準化されてきた。全ての共通する技術は、スピーカの場所とリスナーの位置との両方が既に伝送フォーマットに組み込まれているという欠点を有する。リスナーに対するスピーカの誤った配設により、オーディオ品質は著しく低下する。最適な音響は再生室の小さな領域、いわゆるスイートスポットでのみ可能である。   Methods of multichannel speaker reproduction of audio signals have been known and standardized for many years. All common technologies have the disadvantage that both the speaker location and the listener location are already incorporated into the transmission format. Audio quality is significantly degraded due to incorrect placement of speakers relative to the listener. Optimal sound is possible only in a small area of the reproduction room, the so-called sweet spot.

オーディオ再生における優れた自然的空間的印象ならびに強力なエンクロージャは、新しい技術の助けにより得ることができる。この技術、いわゆる波面合成(WFS)の基礎は、デルフト工科大学で研究され、80年代後半に初めて発表された(非特許文献1)。   An excellent natural spatial impression in audio reproduction as well as a powerful enclosure can be obtained with the help of new technology. The basis of this technology, so-called wavefront synthesis (WFS), was studied at Delft University of Technology and was first published in the late 80s (Non-patent Document 1).

この方法は算出操作および伝送速度(transmission rates)に関して多大な要件を必要とするため、波面合成は実際にはこれまでほとんど利用されてこなかった。今日、この技術の利用を特定の用途において可能にするのは、マイクロプロセッサ技術およびオーディオ符号化の分野における進歩が必須となる。最初の製品化は、プロの分野においては来年には実現すると期待される。さらに数年以内に、波面合成を用いた最初の製品が消費者市場に登場するであろう。   Since this method requires tremendous requirements for calculation operations and transmission rates, wavefront synthesis has been rarely used in practice. Today, advances in the field of microprocessor technology and audio coding are essential to enable the use of this technology in specific applications. The first commercialization is expected in the professional field next year. Within a few years, the first products using wavefront synthesis will appear in the consumer market.

WFSの基本的概念は、波動理論に関するホイヘンスの原理(Huygens principle)の応用に基づいている。即ち、波動によって捉えられる全ての点は、球面状または円状に伝播する要素波 (elementary wave)の始点である。   The basic concept of WFS is based on the application of Huygens principle on wave theory. That is, all points captured by the wave are the starting points of elementary waves that propagate in a spherical or circular shape.

音響学に応用すると、いかなる形状の入来波面(incoming wave-front)も、相互に隣接して配置された多数のスピーカ(いわゆるスピーカアレイ)によって再生することができる。最も単純な事例で、単一の点音源を再生し、スピーカが線形配置である場合、時間遅延と振幅スケーリングとを持つ各スピーカのオーディオ信号は、個々のスピーカの放射された音場(emitted sound fields)が適切にオーバレイするように供給されなければならない。複数の音源がある場合、各スピーカに対する寄与が各音源について別個に算出され、結果として得られる信号が加算される。再生される音源が反射壁を持つ室内にある場合、スピーカアレイを介し、反射もまた追加的な音源として再生されなければならない。したがって、算出に係る手間は、音源の個数、録音室の反射特性、およびスピーカの個数に強く依存する。   When applied to acoustics, any shape of incoming wave-front can be reproduced by a large number of speakers (so-called speaker arrays) arranged adjacent to each other. In the simplest case, when a single point source is played and the speakers are in a linear arrangement, the audio signal of each speaker with time delay and amplitude scaling is the emitted sound field of the individual speaker. fields) must be supplied to overlay properly. When there are multiple sound sources, the contribution to each speaker is calculated separately for each sound source and the resulting signals are added. If the sound source to be reproduced is in a room with a reflecting wall, the reflection must also be reproduced as an additional sound source via the speaker array. Therefore, the labor involved in the calculation strongly depends on the number of sound sources, the reflection characteristics of the recording room, and the number of speakers.

この技術の特に優れた点は、広範囲にわたる再生室で自然な空間的音響印象が可能になることである。公知の技術とは対照的に、音源からの方向および距離が非常に正確に再生される。限られた程度ではあるが、現実のスピーカアレイとリスナーとの間に仮想音源を位置づけることさえもできる。   The particular advantage of this technique is that it allows a natural spatial acoustic impression in a wide reproduction room. In contrast to known techniques, the direction and distance from the sound source is reproduced very accurately. To a limited extent, a virtual sound source can even be positioned between the actual speaker array and the listener.

波面合成は周辺の条件が既知である場合にはうまく機能するが、条件が変化するとき、および現実の周辺条件と一致しない周辺条件に基づいて波面合成が実行されるときには、ばらつきが発生する。   Wavefront synthesis works well when the surrounding conditions are known, but variation occurs when the conditions change and when wavefront synthesis is performed based on surrounding conditions that do not match the actual surrounding conditions.

周辺条件は周辺のインパルス応答によっても表現することができる。   The ambient condition can also be expressed by a peripheral impulse response.

これを以下の例に関してより詳細に説明する。反射が望ましくない壁に対し、スピーカが音源信号を放射すると仮定する。この単純な例では、波面合成を使用することによる室補償(room compensation)は、次のようなものであろう。即ち、まず壁によって反射された音響信号が再びスピーカに到達するのはいつか、およびこの反射音響信号がどれだけの振幅を有するかを決定するために、この壁の反射が決定される。この壁からの反射が望ましくない場合、波面合成は、次のような方法でこの壁からの反射を除去する可能性を提供する。即ち、対応する振幅を有するスピーカに対し、原オーディオ信号に加えて、この反射信号と位相が逆の信号を与え、その結果、前方補償波(forward compensation wave)が反射波を除去し、上述の周辺における上述の壁からの反射を除去するようにする。この方法は、まず周辺のインパルス応答を算出し、これら周辺のインパルス応答に基づいて壁の状態および位置を決定することによって実行可能であり、この時、壁は入射音響(incident sound)を反射する音源を意味するミラー源と解釈される。   This will be explained in more detail with respect to the following example. Assume that the speaker emits a sound source signal against a wall where reflection is not desired. In this simple example, room compensation by using wavefront synthesis would be as follows: That is, the reflection of this wall is first determined to determine when the acoustic signal reflected by the wall reaches the speaker again and how much amplitude the reflected acoustic signal has. If reflection from this wall is not desired, wavefront synthesis offers the possibility of removing reflection from this wall in the following manner. In other words, in addition to the original audio signal, a signal having a phase opposite to that of the reflected signal is given to the speaker having the corresponding amplitude, and as a result, the forward compensation wave (forward compensation wave) removes the reflected wave. The reflection from the above-mentioned wall in the periphery is removed. This method can be performed by first calculating the surrounding impulse responses and determining the state and position of the wall based on these surrounding impulse responses, at which time the wall reflects incident sound. Interpreted as a mirror source meaning sound source.

まずこれら周辺のインパルス応答を測定し、次いで、オーディオ信号とオーバレイするスピーカに印加されるべき補償信号を算出する際には、この壁からの反射の除去操作は、これらの周辺にいるリスナーが、音響に関してはこの壁が全く存在しない印象を持つように実行される。   When measuring the impulse response of these surroundings first, and then calculating the compensation signal to be applied to the speaker that overlays the audio signal, the removal of reflections from this wall is performed by listeners around these surroundings. With regard to sound, it is executed so as to have the impression that this wall does not exist at all.

しかし、過剰補償または過少補償が行なわれないように、室のインパルス応答を正確に決定することが、反射波の最適補償には不可欠である。   However, accurate determination of the chamber impulse response is essential for optimal compensation of reflected waves so that no over- or under-compensation is performed.

このように、波面合成は、広い再生範囲にわたる仮想音源の正確なマッピングを可能にする。同時に波面合成は、録音技師および音響技師に対し、複合音響シーンの設計のための新たな技術的および創造的潜在力を提供する。80年代の末にデルフト工科大学で開発された波面合成(WFSまたは音場合成ともいう)は、音響再生のホログラフィック手法を表わす。キルヒホッフ・ヘルムホルツ積分はこのための基礎となる。それは、閉鎖された容積内の任意の音場が、この容積の表面上の単極子(monopole)および双極子(dipole)音源(スピーカアレイ)の分布を介して生成されることが可能であることを示している。これについての詳細は、非特許文献2および非特許文献3に見ることができる。   Thus, wavefront synthesis allows for accurate mapping of virtual sound sources over a wide reproduction range. At the same time, wavefront synthesis provides recording engineers and acoustic engineers with new technical and creative potential for the design of composite acoustic scenes. Wavefront synthesis (also known as WFS or sound case) developed at the Delft University of Technology at the end of the 1980s represents a holographic method of sound reproduction. The Kirchhoff-Helmholtz integral is the basis for this. It means that any sound field within a closed volume can be generated via the distribution of monopole and dipole sound sources (speaker arrays) on the surface of this volume Is shown. Details of this can be found in Non-Patent Document 2 and Non-Patent Document 3.

波面合成では、仮想位置にある仮想音源によって放射されるオーディオ信号から、スピーカアレイの全てのスピーカに対し合成信号が算出される。このとき、振幅および位相に関し、スピーカアレイに存在する個々のスピーカから出力される音波の重畳から結果的に生じる波が、仮想位置にあるこの仮想音源が実位置にある現実の音源であった場合にこの仮想音源から発生するであろう波と一致するように、合成信号が形成される。   In wavefront synthesis, a synthesized signal is calculated for all speakers in the speaker array from an audio signal radiated by a virtual sound source at a virtual position. At this time, with respect to amplitude and phase, when the resultant wave from the superposition of sound waves output from individual speakers existing in the speaker array is a real sound source at the virtual position, this virtual sound source at the virtual position The synthesized signal is formed so as to coincide with the wave that will be generated from this virtual sound source.

通常、複数の仮想音源が異なる仮想位置に存在する。合成信号の算出は全ての仮想位置にある全ての仮想音源に対して実行され、通常、1つの仮想音源から結果的に複数のスピーカへの合成信号が得られる。したがって、1つのスピーカから見ると、このスピーカは異なる仮想音源から生じる複数の合成信号を受信することになる。線形重畳原理(linear superposition principle)によって可能となるこれらの音源の重畳の結果、スピーカによって実際に放射される再生信号が生成される。   Usually, a plurality of virtual sound sources are present at different virtual positions. The calculation of the synthesized signal is executed for all virtual sound sources at all virtual positions, and usually a synthesized signal to a plurality of speakers is obtained from one virtual sound source. Therefore, when viewed from one speaker, the speaker receives a plurality of synthesized signals generated from different virtual sound sources. As a result of the superposition of these sound sources enabled by the linear superposition principle, a reproduction signal that is actually radiated by the loudspeaker is generated.

スピーカアレイが大きければ大きい程、すなわち、個別スピーカがより多く設けられる程、波面合成の可能性をよりよく利用することができる。しかし、通常はチャネル情報も考慮しなければならないので、これは波面合成装置が実行しなければならない演算動作をも増大させる。つまり、基本的に全ての仮想音源から全てのスピーカまでの個別の伝送チャネルが存在する事を意味し、また、基本的に全ての仮想音源から全てのスピーカに対する合成信号が生成され、その結果、全てのスピーカが、仮想音源の個数に等しい個数の合成信号をそれぞれ得る場合も存在し得ることを意味する。   The larger the speaker array, that is, the more individual speakers are provided, the better the possibility of wavefront synthesis. However, this also increases the computational operations that the wavefront synthesizer must perform, since typically channel information must also be taken into account. In other words, it basically means that there are individual transmission channels from all virtual sound sources to all speakers, and basically, synthetic signals for all speakers are generated from all virtual sound sources. This means that there may be cases where all the speakers obtain the same number of synthesized signals as the number of virtual sound sources.

特に、映画館への適用においては仮想音源が移動する可能性もあり、波面合成の可能性が低減されてしまう理由としては、合成信号の算出と、チャネル情報の算出と、チャネル情報および合成信号の組合せによる再生信号の生成とのために、多大な算出操作が求められる点を挙げることができる。   In particular, there is a possibility that a virtual sound source may move in the application to a movie theater, and the reason why the possibility of wavefront synthesis is reduced is as follows: calculation of composite signal, calculation of channel information, channel information and composite signal It can be mentioned that a large amount of calculation operation is required for the generation of the reproduction signal by the combination.

その上、オーディオ再生の品質は、設けるスピーカの個数と共に高まることもここで留意する必要がある。これは、スピーカアレイに存在するスピーカが多ければ多い程、オーディオ再生品質がより高くかつ現実的になることを意味する。   Moreover, it should be noted here that the quality of audio reproduction increases with the number of speakers provided. This means that the more speakers that are present in the speaker array, the higher and realistic the audio playback quality will be.

上記シナリオでは、個々のスピーカのために完全にレンダリングされアナログデジタル変換された再生信号は、例えば二線式回線を介して波面合成中央ユニットから個々のスピーカへと伝送されることができる。これは、全てのスピーカが同期して動作することがほぼ保証されるので、同期目的のためのさらなる手段が不要であるという利点を有する。しかし他方では、波面合成中央ユニットは、常に特定の再生室および固定数のスピーカによる再生のためにしか作製することができない。これは、全ての再生室のために個々の波面合成中央ユニットを作製しなければないことを意味する。また、オーディオ再生信号の算出を、特に多数のスピーカおよび多数の仮想音源に関し、少なくとも部分的に並行しかつリアルタイムでそれぞれ実行しなければならないので、多大な量の演算能力を提供しなければならないことを意味する。   In the above scenario, a fully rendered and analog-digital converted playback signal for an individual speaker can be transmitted from the wavefront synthesis central unit to the individual speaker via, for example, a two-wire line. This has the advantage that no further means for synchronization purposes are required since it is almost guaranteed that all speakers operate in synchronism. On the other hand, however, the wavefront synthesis central unit can always be made only for reproduction by a specific reproduction room and a fixed number of speakers. This means that an individual wavefront synthesis central unit must be created for every regeneration chamber. In addition, the calculation of the audio reproduction signal must be executed at least partially in parallel and in real time, particularly with respect to a large number of speakers and a large number of virtual sound sources, so that a large amount of computing power must be provided. Means.

特に映画館用に意図されたオーディオ再生システムに関しては、映画館の再生室はそのサイズに関して著しく多様であるという問題がある。映画館には、中には非常に大型の映画スクリーンを持つものがあり、かつ/または同時に、大型スクリーンで上映される映画ほどの多数の観客を持たない映画のために設けられた複数の小型映画スクリーンを持つものもある。しかし、異なる映画館は異なる大きさの再生室を持ち、特にオーディオ再生が映画館だけではなく、例えばコンサートホールについても考慮される場合、その差異は100倍程度にもなり得る。   Particularly with audio playback systems intended for movie theaters, there is the problem that the playback rooms of movie theaters are remarkably diverse with respect to their size. Some cinemas have very large movie screens and / or several smaller ones provided for movies that do not have as many spectators as movies shown on a large screen. Some have a movie screen. However, different movie theaters have different sized playback rooms, and the difference can be as much as 100 times, especially when audio playback is considered not only for movie theaters but also for concert halls, for example.

そのような様々なオーディオ再生室に、波面合成に基づくオーディオ再生システムを設けるためには、例えば、個別の波面合成中央ユニットを全ての再生室用に作製しなければならず、それは個別生産になるので、価格の点から受け入れられない。   In order to provide an audio playback system based on wavefront synthesis in such various audio playback rooms, for example, individual wavefront synthesis central units must be made for all the playback rooms, which would be individually produced So unacceptable in terms of price.

一方、最大限に装備された波面合成中央ユニットを構築することも可能であろう。すなわち、接続可能なスピーカ、つまりアナログ信号出力の個数に関して対応可能であり、内部には、最大個数のアナログ出力、つまり、接続可能な最大個数のスピーカ用に設計された演算処理装置を含む装置が考えられる。   On the other hand, it would be possible to construct a fully equipped wavefront synthesis central unit. That is, it is possible to cope with the number of connectable speakers, that is, the number of analog signal outputs. Inside, there is a device including an arithmetic processing unit designed for the maximum number of analog outputs, that is, the maximum number of connectable speakers. Conceivable.

しかし、そのようなシステムは、小規模の再生室用のオーディオ再生システムが、非常に大規模の再生室用のオーディオ再生システムとほぼ同じ価格を持つことにつながり、それはおそらく小規模の再生室の運営者には受け入れられないであろう。オーディオ再生システムの提供者にとっては、特に中ないし小規模の再生室に関心を向ける必要がある。つまり、例えば私的居室または小規模のレストランおよびバー等の「最小規模」の再生室についても関心を向ける必要がある。   However, such a system would lead to an audio playback system for a small playback room having almost the same price as an audio playback system for a very large playback room, which is probably in a small playback room. It will not be accepted by the operator. For audio playback system providers, there is a particular need to focus on medium to small playback rooms. In other words, attention should be paid to “smallest” reproduction rooms such as private rooms or small restaurants and bars.

したがって、上述した最大限ユニット構築の可能性は不利であり、急激な市場の受入れはすぐには期待できない。
Berkhout, A.J.; de Vries, D.; Vogel, P.: Acoustic Control by Wave-field Synthesis. JASA 93, 1993) M.M.Boone, E.N.G. Verheijen, P.F. v.Tol, "Spatial Sound-Field Reproduction by Wave-Field Synthesis", Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc., Vol. 43, No. 12, December 1995 Diemer de Vries, “Sound Reinforcement by Wavefield Synthesis: Adaption of the Synthesis Operator to the Loudspeaker Directivity Characteristics”, Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc., Vol. 44, No. 12, December 1996
Therefore, the possibility of constructing the maximum unit described above is disadvantageous, and rapid market acceptance cannot be expected immediately.
(Berkhout, AJ; de Vries, D .; Vogel, P .: Acoustic Control by Wave-field Synthesis. JASA 93, 1993) MMBoone, ENG Verheijen, PF v. Tol, "Spatial Sound-Field Reproduction by Wave-Field Synthesis", Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc., Vol. 43, No. 12 , December 1995 Diemer de Vries, “Sound Reinforcement by Wavefield Synthesis: Adaption of the Synthesis Operator to the Loudspeaker Directivity Characteristics”, Delft University of Technology Laboratory of Seismics and Acoustics, Journal of J. Audio Eng. Soc., Vol. 44, No. 12 , December 1996

本発明の目的は、市場に高く受け入れられるオーディオ再生の基本概念を提供することである。   An object of the present invention is to provide a basic concept of audio reproduction that is highly accepted by the market.

この目的は、請求項1に記載のオーディオ再生システム、請求項19に記載のオーディオ信号を再生するための方法、または請求項20に記載のコンピュータプログラムによって達成される。   This object is achieved by an audio reproduction system according to claim 1, a method for reproducing an audio signal according to claim 19, or a computer program according to claim 20.

本発明は、市場の受入れを達成しようとするオーディオ再生システムは拡縮可能でなければならないという知見に基づく。しかし、この拡縮可能性は、提供される演算能力に対して発揮するだけではなく、オーディオ再生システムの価格に対して影響を及ぼさなければならない。換言すると、これは、大規模な再生室用のオーディオ再生システムは、小規模な再生室用のオーディオ再生システムよりも高価になり得ることを意味する。さらに換言すると、小規模再生室用のオーディオ再生システムは、大規模再生室用のオーディオ再生システムより著しく安価でなければならない。   The present invention is based on the finding that audio playback systems that seek to achieve market acceptance must be scalable. However, this scaleability not only exerts on the computing power provided, but also has an impact on the price of the audio playback system. In other words, this means that an audio playback system for a large playback room can be more expensive than an audio playback system for a small playback room. In other words, an audio playback system for a small playback room must be significantly less expensive than an audio playback system for a large playback room.

上述した最大限ユニット構築の概念では、規模による価格差はわずかであった。なぜなら、価格差は個別スピーカの個数によってのみ発生するが、多数のスピーカが量産されているという事実と、再生室を備える建物の中へ統合させるという新規概念のため、そのようなスピーカは安価に提供されることができるからである。   In the concept of maximum unit construction described above, the price difference depending on the scale was small. Because the price difference only occurs depending on the number of individual speakers, but because of the fact that many speakers are mass-produced and the new concept of integrating into a building with a reproduction room, such speakers are inexpensive. Because it can be provided.

本発明によれば、オーディオ再生システムは、中央波面合成モジュールと、中央波面合成モジュールに分散的に接続される多くの個別スピーカモジュールとに分割される。   According to the present invention, the audio reproduction system is divided into a central wavefront synthesis module and a number of individual speaker modules connected in a distributed manner to the central wavefront synthesis module.

中央波面合成モジュールは、複数のオーディオトラックを有するオーディオ信号を受信し、一方では合成信号を算出し、かつ他方では仮想位置から現実のスピーカ位置までのチャネルのためのチャネル情報を算出する。   The central wavefront synthesis module receives an audio signal having a plurality of audio tracks, calculates a composite signal on the one hand, and calculates channel information for a channel from the virtual position to the actual speaker position on the other hand.

さらに、中央波面合成モジュールは、各スピーカによって再生されるべき1つまたは複数の合成信号を各スピーカに供給するだけでなく、上記1つまたは複数の合成信号の発信源となる仮想位置または仮想音源からそれぞれのスピーカまでのオーディオチャネルに関するチャネル情報をも提供するように構成される。ここで経験的に、エネルギー値(energy content)が特定のしきい値を上回る合成信号を全てのスピーカが受信する事例は非常にまれにしか起きないことから、有効なデータレート伝送制限が既に取得されている。したがって、本発明の中央波面合成モジュールは、個別スピーカにとって有効な合成信号のみおよびこの合成信号のためのチャネル情報のみを、分散スピーカモジュールに対して供給する選択肢を既に有することになる。   Further, the central wavefront synthesis module not only supplies one or more synthesized signals to be reproduced by each speaker to each speaker, but also a virtual position or virtual sound source serving as a source of the one or more synthesized signals. Are configured to provide channel information regarding audio channels from to each speaker. Here, empirically, it is very rare for all speakers to receive a composite signal whose energy content exceeds a certain threshold, so a valid data rate transmission limit has already been obtained. Has been. Thus, the central wavefront synthesis module of the present invention already has the option of supplying only the synthesized signal that is valid for the individual speakers and only the channel information for this synthesized signal to the distributed speaker module.

本発明のスピーカモジュールは分散的に実現化され、スピーカに直結され、好ましくはスピーカにそれぞれ空間的に近接して配置される。全てのスピーカモジュールは受信器を備え、各スピーカに対する1つまたは複数の合成信号とこの合成信号に関連するチャネル情報とを受信する。さらに、全てのスピーカモジュールはレンダリング手段を備え、上記合成信号とこの供給された合成信号に関連するチャネル情報とを使用して、スピーカの再生信号を算出する。さらに、各スピーカモジュールは、好ましくは1つのデジタル増幅器を有する信号処理手段と、別のデジタル信号処理手段と、それぞれのスピーカに供給されるアナログスピーカ信号を再生信号により生成するためのデジタル・アナログ変換器とを備える。中央波面合成モジュールおよび分散スピーカモジュールを接続するために、複数の伝送経路が設けられ、各伝送経路は中央波面合成モジュールから個別スピーカまで延びている。   The speaker module of the present invention is realized in a distributed manner, is directly connected to the speaker, and is preferably disposed spatially close to the speaker. All speaker modules are equipped with a receiver to receive one or more combined signals for each speaker and channel information associated with the combined signals. Further, all the speaker modules are provided with a rendering means, and calculate a reproduction signal of the speaker by using the synthesized signal and channel information related to the supplied synthesized signal. Further, each speaker module preferably has a signal processing means having one digital amplifier, another digital signal processing means, and a digital-to-analog conversion for generating an analog speaker signal supplied to each speaker as a reproduction signal. With a vessel. In order to connect the central wavefront synthesis module and the distributed speaker module, a plurality of transmission paths are provided, and each transmission path extends from the central wavefront synthesis module to the individual speakers.

レンダリングの操作は非常に演算集約的であり、これは、特に全ての個別スピーカに対して設けられる乗算器(multiplier)を考慮した場合に、例えばDSP(デジタル信号プロセッサ)または有線型回路の形の所要回路ハードウェアに対するコストに著しく寄与する。好ましくは、レンダリング手段はチャネルインパルス応答をチャネル情報として使用することによって動作し、時間ドメインまたは周波数ドメインのいずれかで直接実行することのできる演算時間集約的な畳み込み(convolution)を実行する。このとき、周波数ドメインへの変換および周波数ドメインからの変換が必要であり、その結果、周波数ドメインにおける現実の乗算演算と共に多大な処理を必要とする。ここで、レンダリングユニットは1つの個別合成信号を算出するだけでなく、通常は仮想音源の個数に対応する多数の合成信号を常に算出しなければならないことに特に留意すべきである。   The rendering operation is very computationally intensive, which is particularly in the form of a DSP (digital signal processor) or wired circuit, especially when considering the multipliers provided for all individual speakers. Significantly contributes to the cost of the required circuit hardware. Preferably, the rendering means operates by using the channel impulse response as channel information and performs a computation time intensive convolution that can be performed directly in either the time domain or the frequency domain. At this time, conversion to the frequency domain and conversion from the frequency domain are necessary, and as a result, a great deal of processing is required together with an actual multiplication operation in the frequency domain. Here, it should be particularly noted that the rendering unit not only calculates one individual combined signal, but usually always calculates a large number of combined signals corresponding to the number of virtual sound sources.

本発明の概念が導く結果として、分散的に実行することが可能な演算は中央波面合成モジュールから分散スピーカモジュールへとシフトされるので、最良の事例では、全てのスピーカに同等の意味を持つ演算だけが中央波面合成モジュールで実行され、1つのスピーカモジュールに接続された1つまたは複数のスピーカだけに関する全ての演算はそのスピーカモジュールで分散的に実行されることになる。   As a result of the concept of the present invention, the operations that can be performed in a distributed manner are shifted from the central wavefront synthesis module to the distributed speaker module, so that in the best case, all speakers have equivalent meanings. Only the central wavefront synthesis module is executed, and all computations relating to only one or more speakers connected to one speaker module are executed in a distributed manner in that speaker module.

よって、中央波面合成モジュールのコストを著しく低減することができるが、他方では、主としてスピーカモジュールで実行されるオーディオレンダリング操作のために、その価格がもはや無視できなくなったスピーカモジュールを用いることになるため、費用が嵩むという代価が発生する。   Thus, the cost of the central wavefront synthesis module can be significantly reduced, but on the other hand, the speaker module whose price is no longer negligible is used mainly for audio rendering operations performed on the speaker module. Incurs the cost of increased costs.

しかし、本発明のオーディオ再生システムは、性能ならびに価格の両面で拡縮可能である。多数の再生室用の中央波面合成モジュールを低価格で提供できる可能性があるので、中央ユニットおよび分散スピーカモジュールのコストに起因するシステム全体のコストは、設置されるスピーカの個数と、つまりは再生室の規模とに大きく依存するものとなる。   However, the audio reproduction system of the present invention can be scaled in both performance and price. Since the central wavefront synthesis module for a large number of playback rooms may be offered at a low price, the overall system cost due to the cost of the central unit and the distributed speaker module will depend on the number of speakers installed and thus the playback. It depends greatly on the size of the room.

換言すると、大規模再生室の運営者は依然として大規模再生室用の再生システムのために所定の代価を支払わなければならないが、一方では、小規模再生室の運営者はオーディオ再生システムをかなり低い価格で購入することが可能になる。なぜなら、スピーカの個数と、つまりは高価でコスト集約的なスピーカモジュールの個数とは、大規模再生室に比較して著しく低減されるからである。   In other words, large playback room operators still have to pay a certain price for a playback system for a large playback room, while small playback room operators have much lower audio playback systems. It becomes possible to purchase at a price. This is because the number of speakers, that is, the number of expensive and cost-intensive speaker modules, is significantly reduced compared to a large-scale reproduction room.

したがって、本発明のオーディオ再生システムは、小規模再生室用のオーディオ再生システムを大規模再生室に比較してかなり低減された価格で提供することが可能であり、その結果、オーディオ/ビデオコンポーネントの非常に競争の激しい市場で歓迎されることが期待できる。   Therefore, the audio reproduction system of the present invention can provide an audio reproduction system for a small reproduction room at a considerably reduced price as compared with a large reproduction room, and as a result, the audio / video component can be provided. You can expect to be welcomed in a very competitive market.

本発明の好適な実施形態では、中央波面合成ユニットは、映画フィルム用の従来のオーディオフォーマットで録音された映画フィルムを処理することを可能にするように形成される。ここで、一般的な録音フォーマットとは例えば5.1サラウンドフォーマット、または7.1フォーマット、または10.2フォーマットである。5.1フォーマットの場合、そのような映画フィルムは6本のオーディオトラック、即ち「後左」,「後右」,「前左」,「前右」,「前中央」のチャネル用ならびにサブウーファチャネル用のオーディオトラックを含む。オーディオ技術に関しては従来通りと言えるそのような映画フィルムの再生は、本発明のオーディオ再生システムにおいては、音響技師および再生室運営者それぞれの好みに応じて選択することが可能な仮想位置にある仮想音源として、オーディオトラックを配置することによって達成することができる。したがって、価格の点で拡縮可能であり、オーディオ再生システムにおいて互換性のある本発明の再生方法は、たとえ録音セッティングに関して必要とされるメタ情報を持ち完全に波面合成に適したオーディオトラックを有する映画/ビデオフィルムがごくわずかにしか存在しない時代であっても、波面合成に基づくオーディオ再生システムを一度に普及させる可能性を持っている。   In a preferred embodiment of the present invention, the central wavefront synthesis unit is formed to allow processing of motion picture film recorded in a conventional audio format for motion picture film. Here, the general recording format is, for example, 5.1 surround format, 7.1 format, or 10.2 format. In the case of the 5.1 format, such a motion picture film has six audio tracks, namely the “rear left”, “rear right”, “front left”, “front right”, “front center” channels as well as the subwoofer channel. Includes audio tracks for. In the audio reproduction system according to the present invention, the reproduction of such a movie film, which can be said to be conventional with respect to audio technology, is a virtual position at a virtual position that can be selected according to the preference of the acoustic engineer and the reproduction room operator This can be achieved by arranging an audio track as a sound source. Thus, the playback method of the present invention, which is scalable in terms of price and compatible in an audio playback system, is a movie having an audio track that is perfectly suited for wavefront synthesis with the meta information required for recording settings. / Even in the era when there is very little video film, it has the potential to spread audio playback systems based on wavefront synthesis at once.

以下に、本発明の好適な実施形態を、添付の図面を参照して説明する。
本発明のオーディオ再生システムの概念図である。 本発明の中央波面合成モジュールのブロック図である。 本発明の分散スピーカモジュールのブロック図である。 分散スピーカモジュール内のオーディオレンダリングユニットの好適な実施形態のブロック図である。 大きいスイートスポットを有する互換性のある再生の基本的表現である。 スピーカLSiの再生信号を得るために、1つのスピーカに対して各々チャネル情報を有する複数の合成信号が入力される様子を示す基本図である。 仮想音源から現実のスピーカまでのチャネルを、このチャネルに対し影響を与え得る変数と共に示す基本図である。
Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings.
It is a conceptual diagram of the audio reproduction system of this invention. It is a block diagram of the central wavefront synthesis module of the present invention. It is a block diagram of the distributed speaker module of this invention. FIG. 2 is a block diagram of a preferred embodiment of an audio rendering unit within a distributed speaker module. A basic representation of compatible playback with a large sweet spot. It is a basic diagram showing a state where a plurality of composite signals each having channel information are input to one speaker in order to obtain a reproduction signal of speaker LSi. It is a basic diagram showing a channel from a virtual sound source to a real speaker together with variables that can affect the channel.

本発明の再生システムは、図1に示すように、基本的に2つの部分に分割される。一方の部分は中央波面合成モジュール10である。他方の部分は、個別スピーカモジュール12a、12b、12c、12d、12eから構成され、図1に示すように、それらは現実の物理的スピーカ14a、14b、14c、14d、14eに接続される。スピーカ14a〜14eの典型的な個数の領域は50個以上の範囲であり、さらに典型的には100個以上であることに留意すべきである。全てのスピーカに個別スピーカモジュールを設ける場合には、対応する個数のスピーカモジュールも必要となる。適用方法に依存して、1つのスピーカモジュールから少数群の隣接するスピーカをアドレス指定することが好ましい。ここで、例えば4台のスピーカに接続された1つのスピーカモジュールが、これら4台のスピーカに対して同一の再生信号を供給するか否か、あるいはこれら4台のスピーカのためにそれぞれ異なる合成信号が算出されるか否かは重要ではなく、そのようなスピーカモジュールは、現実には複数の個別スピーカモジュールから構成されてはいるが物理的には1つのユニットに一体化されている。   The playback system of the present invention is basically divided into two parts as shown in FIG. One part is the central wavefront synthesis module 10. The other part is composed of individual speaker modules 12a, 12b, 12c, 12d, 12e, which are connected to real physical speakers 14a, 14b, 14c, 14d, 14e as shown in FIG. It should be noted that the typical number of regions of the speakers 14a-14e ranges from 50 or more, more typically 100 or more. When individual speaker modules are provided for all speakers, a corresponding number of speaker modules are also required. Depending on the application method, it is preferable to address a small group of adjacent speakers from one speaker module. Here, for example, whether one speaker module connected to four speakers supplies the same reproduction signal to these four speakers, or different synthesized signals for these four speakers. It is not important whether or not is calculated. Such a speaker module is actually composed of a plurality of individual speaker modules, but is physically integrated into one unit.

波面合成モジュール10と全ての個別スピーカモジュール12a〜12eとの間に個別伝送経路16a〜16eが存在し、全ての伝送経路は中央波面合成モジュールおよび個別スピーカモジュールに結合される。   Individual transmission paths 16a to 16e exist between the wavefront synthesis module 10 and all the individual speaker modules 12a to 12e, and all the transmission paths are coupled to the central wavefront synthesis module and the individual speaker modules.

波面合成モジュールからスピーカモジュールへデータを伝送するためのデータ伝送モードとして、いわゆるファイヤワイヤ伝送フォーマットまたはUSBデータフォーマット等の高いデータレートを提供するシリアル伝送フォーマットが好ましい。毎秒100メガビットを超えるデータ伝送速度が有利である。   As a data transmission mode for transmitting data from the wavefront synthesis module to the speaker module, a serial transmission format that provides a high data rate such as a so-called firewire transmission format or a USB data format is preferable. A data transmission rate in excess of 100 megabits per second is advantageous.

波面合成モジュール10からスピーカモジュールに伝送されるデータストリームは、波面合成モジュール内で、選択されたデータフォーマットに依存してそれに対応するようにフォーマットされ、一般的なシリアルデータフォーマットで提供される同期情報を与えられる。この同期情報は、個別スピーカモジュールによってデータストリームから抽出され、個別スピーカモジュールをそれらの再生に関して同期化するために、即ち、アナログスピーカ信号を得てそれをリサンプリングするためのデジタル/アナログ変換に関して同期化するために使用される。中央波面合成モジュールはマスタとして動作し、全てのスピーカモジュールはクライアントとして動作し、ここで、個別データストリームは全て、異なる伝送経路16a〜16eを介して中央モジュール10から同一の同期情報を得ることが好ましい。これは、全てのスピーカモジュールが同期して動作すること、つまり、マスタ10によって同期化させられることを確実にする。これは、本発明のオーディオ再生システムにおいては、オーディオ品質の損失を被らないために、つまり、波面合成モジュールにより算出された合成信号が、それぞれのオーディオレンダリング後に、時間的にずれて個別スピーカに出力されないようにするために重要である。この概念の利点は、個別スピーカモジュールが相互に同期化する必要が無いことである。それらは全てマスタに同期して作動するので、それらは相互に自動的に同期化される。個別スピーカモジュールの相互間の接続は、本発明には望ましくない。なぜなら、再生室の規模に関するスピーカモジュールの拡縮可能性のモジュール概念は、モジュールの単純な追加を必要とし、モジュール間の対応する配線を達成する必要が無いからである。   The data stream transmitted from the wavefront synthesis module 10 to the speaker module is formatted in the wavefront synthesis module so as to correspond to the selected data format and is provided in a general serial data format. Is given. This synchronization information is extracted from the data stream by the individual speaker modules and is synchronized with respect to the digital / analog conversion to synchronize the individual speaker modules with respect to their playback, i.e. to obtain an analog speaker signal and resample it. Used to The central wavefront synthesis module operates as a master and all speaker modules operate as clients, where all individual data streams can obtain the same synchronization information from the central module 10 via different transmission paths 16a-16e. preferable. This ensures that all speaker modules operate synchronously, ie synchronized by the master 10. This is because, in the audio playback system of the present invention, in order to avoid loss of audio quality, that is, the synthesized signal calculated by the wavefront synthesis module is shifted in time to each individual speaker after each audio rendering. It is important to prevent output. The advantage of this concept is that the individual speaker modules do not need to be synchronized with each other. They all operate synchronously with the master, so they are automatically synchronized with each other. Connection between individual speaker modules is not desirable for the present invention. This is because the modular concept of speaker module scaling with respect to the size of the playback room requires simple addition of modules and does not have to achieve corresponding wiring between modules.

図2は、本発明の好適な実施形態に係る中央波面合成モジュールのブロック図を示す。まず、中央波面合成モジュールは、一般的に入力でオーディオ信号を受信するように形成された入力手段20を備え、上記オーディオ信号は複数のオーディオトラックを有し、これら全てのオーディオトラックに対して音源の位置が関連付けられる。   FIG. 2 shows a block diagram of a central wavefront synthesis module according to a preferred embodiment of the present invention. First, the central wavefront synthesis module comprises input means 20 that is generally configured to receive an audio signal at the input, the audio signal having a plurality of audio tracks, and a sound source for all these audio tracks. Are associated with each other.

適用方法によっては、音源位置とは、再生室内におけるスピーカのリスナーに対する位置を示す指標であり、互換性のある再生を得るために5.1等の標準化されたオーディオフォーマットに従うものである。この場合、オーディオ信号は5+1=6本のオーディオトラックを有する。代わりに、オーディオ信号はより多数のオーディオトラックを有することができ、それらは波面合成適性信号として既に存在し、現実の録音位置にある音源およびオーディオオブジェクトをそれぞれ表わし、それらは波面合成を使用することにより、オーディオ信号再生に関して再生室における仮想音源としてマッピングされる。   Depending on the application method, the sound source position is an index indicating the position of the speaker relative to the listener in the reproduction room, and follows a standardized audio format such as 5.1 in order to obtain compatible reproduction. In this case, the audio signal has 5 + 1 = 6 audio tracks. Instead, the audio signal can have a greater number of audio tracks, which already exist as wavefront synthesis suitability signals and represent sound sources and audio objects at the actual recording location, respectively, which use wavefront synthesis Thus, the audio signal reproduction is mapped as a virtual sound source in the reproduction room.

さらに、本発明の好適な実施形態では、入力手段20が主制御ユニットとして使用され、このユニットは更なる機能を持つことが好ましい。特に、それは映画館で一般的に使用されるように、復号モジュールの機能を有する。代わりに、または追加的に、入力手段20は、別個のオーディオチャネルおよびオーディオトラックをそれぞれ提供するDVD復号器として形成されてもよい。   Furthermore, in a preferred embodiment of the invention, the input means 20 is used as a main control unit, which unit preferably has further functions. In particular, it has the function of a decoding module, as is commonly used in cinemas. Alternatively or additionally, the input means 20 may be formed as a DVD decoder that provides separate audio channels and audio tracks, respectively.

代替的に、入力手段20は、波面合成用に意図されたオーディオトラック21および対応する音源情報22が既に設けられた、MPEG4復号モジュールとして形成されてもよい。特に、オーディオトラック21は、録音セッティングにおけるオーディオオブジェクトからのオーディオ信号、録音セッティングにおけるオーディオオブジェクトの位置、オーディオオブジェクトの特性、特に、オーディオオブジェクトの大きさに関する特性、あるいは音響特性に対するオーディオオブジェクトの密度に関係する。 Alternatively, the input means 20 may be formed as an MPEG4 decoding module in which an audio track 21 intended for wavefront synthesis and corresponding sound source information 22 are already provided. In particular, the audio track 21 relates to the audio signal from the audio object in the recording setting, the position of the audio object in the recording setting, the characteristics of the audio object, in particular the characteristics relating to the size of the audio object, or the density of the audio object relative to the acoustic characteristics. To do.

さらに必要ならば、オーディオトラック21に加えて、録音室および録音環境それぞれの特性を伝送し、波面合成の中でそれらの特性を考慮することが好ましい。録音室および録音環境それぞれに関する情報は、リスナーが視覚的表現を得るだけではなく、録音状況の聴覚的印象をも得ることをもたらすものである。観客は再生された音の中に、映画の録音場面が例えば戸外であるか、例えば潜水艦のような小さい部屋であるかを実感する。戸外での録音シナリオは、録音環境に反射がほとんどまたは全く無いので、比較的「ドライ」なオーディオ信号を提供するが、例えば潜水艦内では状況は全く異なる。ここでは、録音セッティングは多数の反射を持つ部屋および多数の反射を持つオーディオ環境によってそれぞれ代表される。この場合、オーディオトラックはできるだけドライに、つまり録音室内での部屋の音響効果無しに録音し、その特性に関する部屋の音響効果は追加的なメタ情報によって表わすことが好ましい。なぜなら、それらは標準化データストリームで標準MPEG4に従って伝送することができるからである。   Furthermore, if necessary, it is preferable to transmit the characteristics of the recording room and the recording environment in addition to the audio track 21 and to take these characteristics into consideration in the wavefront synthesis. Information about each of the recording room and recording environment provides the listener with not only a visual representation but also an audible impression of the recording situation. In the reproduced sound, the spectator realizes whether the recording scene of the movie is outdoors or a small room such as a submarine. An outdoor recording scenario provides a relatively “dry” audio signal since there is little or no reflection in the recording environment, but the situation is quite different, for example, in a submarine. Here, the recording settings are each represented by a room with multiple reflections and an audio environment with multiple reflections. In this case, it is preferred that the audio track be recorded as dry as possible, i.e. without room acoustics in the recording room, and the room acoustics related to its characteristics be represented by additional meta information. This is because they can be transmitted in a standardized data stream according to standard MPEG4.

中央波面合成モジュールは、一方でチャネル情報を、かつ他方で個別スピーカのための波面合成信号を決定するための手段24を備える。さらに、音源位置22を波面合成用の仮想位置に変換するための手段25が設けられる。   The central wavefront synthesis module comprises means 24 for determining channel information on the one hand and wavefront synthesis signals for the individual speakers on the other hand. Furthermore, a means 25 for converting the sound source position 22 into a virtual position for wavefront synthesis is provided.

仮想位置からスピーカ位置までの全てのオーディオチャネルのためのオーディオチャネル情報を決定する手段24が個別に形成され、上記仮想位置はオーディオトラックに関連付けられる音源位置(手段25)に依存するものであり、上記オーディオチャネル情報は、全ての仮想位置から全てのスピーカまでの全てのチャネルに対して存在する。さらに、手段24は、上述しかつ公知である波面合成の原理を使用することによって、上記仮想位置からスピーカへの合成信号を算出するように形成される。   Means 24 for determining audio channel information for all audio channels from the virtual position to the speaker position are individually formed, the virtual position depending on the sound source position (means 25) associated with the audio track, The audio channel information exists for all channels from all virtual positions to all speakers. Further, the means 24 is configured to calculate a composite signal from the virtual position to the loudspeaker by using the principle of wavefront synthesis described above and well known.

さらに、図2の中央波面合成モジュールは、1つまたは複数のスピーカに合成信号を提供するための手段26を備える。手段26は、中央波面合成モジュールからそれぞれの伝送経路を介して個別スピーカモジュールへと伝送される合成情報に関するチャネル情報を伝送し、それらの個別スピーカモジュールでオーディオレンダリングが実行されるように形成されている。実施形態によっては、各合成信号に関し、仮想位置から現実のスピーカへのチャネルに関するさらなる情報を伝送することが好ましい。これは、本発明の好適な実施形態における手段24が、全ての合成信号のためのチャネル情報をも提供し、算出されたチャネル情報からそれをそれぞれ補間し、その補間されたチャネル情報を手段26に提供して、手段26が個別スピーカモジュールへの伝送を開始することができるようにすることを意味する。好ましくは、データ伝送容量を節約するために、手段26は、無効の合成信号を排除し、無効の合成信号もその関連チャネル情報も伝送しないように形成される。したがって、1つの仮想音源からいくつかのスピーカに対して有効な合成信号が伝送される一方で、スピーカアレイの他のスピーカに対しては、波面合成の理論に従って同様に合成信号を算出することができるが、それらの信号は特定の期間内におけるそれらの性能に関して相対的に小さく、したがって、低減されたデータ伝送量のために無視できる場合がしばしば発生する。   Furthermore, the central wavefront synthesis module of FIG. 2 comprises means 26 for providing a synthesized signal to one or more speakers. The means 26 is configured to transmit channel information related to the synthesis information transmitted from the central wavefront synthesis module to the individual speaker modules via the respective transmission paths, and to perform audio rendering in those individual speaker modules. Yes. In some embodiments, it is preferable to transmit further information about the channel from the virtual position to the real speaker for each composite signal. This means that means 24 in the preferred embodiment of the present invention also provides channel information for all combined signals, interpolates it from the calculated channel information respectively, and means 26 the interpolated channel information. Means that the means 26 can start the transmission to the individual speaker module. Preferably, in order to save data transmission capacity, the means 26 is configured to eliminate invalid composite signals and transmit neither invalid composite signals nor their associated channel information. Therefore, an effective synthesized signal is transmitted from one virtual sound source to several speakers, while a synthesized signal can be similarly calculated for other speakers of the speaker array according to the theory of wavefront synthesis. Although they can, their signals are relatively small with respect to their performance within a certain period of time, and therefore often occur negligible due to reduced data transmission.

詳細には、手段24はオーディオ信号を前処理するために使用する機能を含む。その上、手段24は個別スピーカモジュールを制御し、詳しくは、個別スピーカモジュールがそれらに伝送されたデータストリームに対して直接的にまたは手段26に関連して同期情報を導入し、その結果、全てのスピーカモジュールが中央波面合成モジュールに対して中央同期を得るように制御する。   Specifically, the means 24 includes functions used to preprocess the audio signal. Moreover, the means 24 controls the individual speaker modules, in particular the individual speaker modules introduce synchronization information directly or in connection with the data streams transmitted to them, so that all Are controlled so as to obtain central synchronization with respect to the central wavefront synthesis module.

本発明の概念では、全ての再生チャネルに対して共通する処理演算は全て中央波面合成モジュールが実行し、他方、個別スピーカおよび個別再生チャネル毎にそれぞれ異なる処理演算は分散的に実行されるように形成されている。   In the concept of the present invention, all processing operations common to all playback channels are performed by the central wavefront synthesis module, while different processing operations are performed in a distributed manner for each individual speaker and each individual playback channel. Is formed.

さらに、手段24は、互換性のある再生に関して、ステレオ信号、5.1信号、7.2信号、10.2信号等の場合における波面合成情報のシミュレーションを実行するように形成される。したがって、標準化オーディオフォーマット用の再生室に対するスピーカの標準位置が音源位置として使用される。   Furthermore, the means 24 is configured to perform a simulation of wavefront synthesis information in the case of stereo signals, 5.1 signals, 7.2 signals, 10.2 signals, etc. for compatible playback. Therefore, the standard position of the speaker relative to the playback room for the standardized audio format is used as the sound source position.

これについて図5を参照して説明する。図5は、再生室50および再生室の周りに延在するスピーカアレイ52だけでなく、図5から分かるように再生室50の外側の仮想位置に配置された多数の仮想音源53a〜53eをも示す。手段24は、図1の手段25に関連し、音源情報から仮想位置を算出するために、即ち、手動で制御可能な5.2信号の標準位置指標から仮想位置を算出するために形成される。実施形態によっては、スピーカアレイ52が再生室50に平面波(planar waves)を放射するように、仮想位置を例えば無限領域に移動することが好ましい。これは、現実の5.1スピーカが再生室に配置された標準的状況に比較して、いわゆるスイートスポット、即ち最適な音響印象が得られる再生室内の領域を著しく拡大させるという結果を生む。   This will be described with reference to FIG. 5 shows not only the reproduction room 50 and the speaker array 52 extending around the reproduction room, but also a large number of virtual sound sources 53a to 53e arranged at virtual positions outside the reproduction room 50 as can be seen from FIG. Show. The means 24 is related to the means 25 of FIG. 1 and is formed for calculating the virtual position from the sound source information, ie for calculating the virtual position from the standard position index of the 5.2 signal that can be controlled manually. . In some embodiments, it is preferable to move the virtual position to, for example, an infinite region so that the speaker array 52 emits planar waves into the reproduction chamber 50. This has the result that the so-called sweet spot, i.e. the area in the reproduction room where an optimal acoustic impression is obtained, is significantly enlarged compared to the standard situation in which real 5.1 speakers are arranged in the reproduction room.

その代わりに、仮想音源を有限仮想位置に配置し、点音源としてモデル化することもできる。この選択肢は、音響印象が映画の観客/リスナーにとってより快適であるという利点を有する。平面波には、リスナーが非常に大きい部屋に座っている印象を持つという特性があり、例えばスクリーンで潜水艦の場面が展開されている場合には、特に不快な知覚を導く。これに関連して、例えば5.1オーディオトラックを持つ一般的な映画フィルムは、録音セッティングの音響特性に関する情報を含まないことに留意すべきである。したがって、そのような場合には、平面波つまり無限位置にある仮想音源または有限位置にある仮想音源の間の妥協点を見出すことが好ましい。この点に関し、本発明のオーディオ再生システムはさらに、映画の場面に応じて仮想スピーカ53a〜53eの仮想位置を変動させる能力を提供する。例えば、場面が戸外で展開される場合には、スピーカは無限領域に配置することができる。しかし、場面が小さい部屋で展開される場合には、スピーカは再生室50により近づけて配置することができる。   Alternatively, a virtual sound source can be placed at a finite virtual position and modeled as a point sound source. This option has the advantage that the acoustic impression is more comfortable for the movie audience / listener. Plane waves have the property that the listener has the impression of sitting in a very large room, which leads to unpleasant perception, especially when the submarine scene is deployed on a screen, for example. In this connection, it should be noted that a typical motion picture film, for example with 5.1 audio tracks, does not contain information about the acoustic characteristics of the recording settings. Therefore, in such a case, it is preferable to find a compromise between a plane wave, that is, a virtual sound source at an infinite position or a virtual sound source at a finite position. In this regard, the audio playback system of the present invention further provides the ability to vary the virtual position of the virtual speakers 53a-53e depending on the scene of the movie. For example, if the scene is unfolded outdoors, the speakers can be placed in an infinite area. However, when the scene is developed in a small room, the speaker can be arranged closer to the reproduction room 50.

互換性のある再生に関連して、本発明の好適な実施形態では、入力手段20は、映像信号の前に特定の時間「遅延」によってその映像信号に関連付けられるオーディオトラックをサンプリングするように構成され、その結果、波面合成モジュール内での処理後に個別スピーカモジュール内において、ある時間に関連付けられた音声がある時間に関連付けられた映像信号と同時にサンプリングされるように構成されている。本発明のオーディオ再生システムでは、音声および画像が一緒に放射されるように、負の「遅延」を測定しなければならない。負の遅延が大きい場合、信号は既に完全に算出されていることが可能であり、さらに信号は、例えば画像と音との同期化を確実にする各同期信号に応じてスピーカモジュールからスピーカへと出力されることができる。   In connection with compatible playback, in a preferred embodiment of the present invention, the input means 20 is configured to sample the audio track associated with the video signal by a specific time “delay” before the video signal. As a result, the sound associated with a certain time is sampled simultaneously with the video signal associated with a certain time in the individual speaker module after the processing in the wavefront synthesis module. In the audio playback system of the present invention, a negative “delay” must be measured so that sound and image are emitted together. If the negative delay is large, the signal can already be fully calculated, and the signal can be passed from the speaker module to the speaker in response to each synchronization signal, for example, to ensure synchronization of the image and sound. Can be output.

互換性のある再生の場合と、録音セッティングにおける音源に関する既に準備された波面合成情報を入力信号が含んでいる場合とのどちらにおいても、再生室に関する情報を回線27を介してチャネル情報算出手段24に提供し、その結果、その再生室に関する情報を用いて合成信号が処理され、例えば再生室の音響特性を除去できるようにすることが好ましい。   In both the case of compatible reproduction and the case where the input signal includes already prepared wavefront synthesis information relating to the sound source in the recording setting, channel information calculation means 24 sends information relating to the reproduction room via line 27. As a result, it is preferred that the combined signal is processed using information about the playback room so that, for example, the acoustic properties of the playback room can be removed.

再生室に関する情報は、再生室の幾何学的構造により決定することができるか、あるいはスピーカおよび特定のマイクロフォンアレイを使用することによって再生室で測定することができ、このとき制御および評価は再生室用の適応モジュール28を介して行なうことができる。本発明の一実施形態では、再生中に再生室の音響特性を決定し、それに相応して再生室に関する情報をリセットし、例えば満員の映画館の場合でも映画音響の最適抑制が実行されるようにすることが好ましい。このとき、特に小型で満員の再生室においては、再生室の音響特性は、再生室に人々がいない場合とは著しく異なることに留意すべきである。   Information about the playback room can be determined by the geometry of the playback room, or can be measured in the playback room by using speakers and a specific microphone array, where control and evaluation is controlled by the playback room. This can be done via the adaptation module 28. In one embodiment of the invention, the acoustic characteristics of the playback room are determined during playback, and the information about the playback room is reset accordingly, so that, for example, in the case of a full movie theater, optimal suppression of movie sound is performed. It is preferable to make it. At this time, it should be noted that the acoustic characteristics of the reproduction room are significantly different from those in the case where there are no people in the reproduction room, particularly in a small and full reproduction room.

さらに、再生室用の適応モジュール28は、再生の特性を測定するために使用することができるマイクロフォンアレイを備える。さらに、再生室用の適応モジュール28は、再生室におけるスピーカアレイの位置を見出すアルゴリズムを備える。さらに、再生室特性およびスピーカ特性の最適反転(optimum inverting)を実行するために、測定結果の前処理が実行される。このとき、適応モジュール28は手段24によって制御されることが好ましい。   Furthermore, the adaptation module 28 for the reproduction room comprises a microphone array that can be used to measure the characteristics of the reproduction. Furthermore, the adaptation module 28 for the reproduction room comprises an algorithm for finding the position of the speaker array in the reproduction room. In addition, pre-processing of the measurement results is performed in order to perform optimal inverting of the reproduction room characteristics and speaker characteristics. At this time, the adaptation module 28 is preferably controlled by the means 24.

実施形態によっては、適応モジュール28は、再生室のシステム構成のためだけに必要とされる場合もある。しかし、再生室の変化する状況に対する連続的な適応が望ましい場合には、この適応モジュール28を操作中絶えず使用することができる。   In some embodiments, the adaptation module 28 may be needed only for the playback room system configuration. However, this adaptation module 28 can be used continuously during operation if continuous adaptation to the changing conditions of the regeneration chamber is desired.

手段20へ入力されるWFS特定信号を処理するためにチャネル情報算出手段24が使用される場合には、追加のWFS情報、即ち例えばオーディオオブジェクトの特性および録音室の特性等が、入力されたオーディオ信号から抽出されてWFS情報回線29を介して手段24に供給され、その結果、この情報がチャネル情報算出に考慮されることが可能になる。   If the channel information calculation means 24 is used to process the WFS specific signal input to the means 20, additional WFS information, i.e. the characteristics of the audio object, the characteristics of the recording room, etc., are input audio. It is extracted from the signal and supplied to the means 24 via the WFS information line 29, so that this information can be taken into account in the channel information calculation.

この場合、中央WFSモジュールはさらに、WFS処理済みオーディオ信号の前処理を実行するように形成される。さらに、手段24および/または手段26は、画像と音声との間で同期を得るために設けられ、したがって前述の通り、個別スピーカモジュールへの好ましくはシリアルデータストリーム内に時間コードが挿入される。最後に、既に説明した通り、チャネル情報算出手段24は、必要とされる場合には再生前または再生中のいずれかにおいて、適応モジュール28を制御して再生室の音響特性の測定を制御するという役割を果たす。   In this case, the central WFS module is further configured to perform preprocessing of the WFS processed audio signal. Furthermore, means 24 and / or means 26 are provided for obtaining synchronization between the picture and the sound, so that, as described above, a time code is preferably inserted in the serial data stream to the individual speaker module. Finally, as already explained, the channel information calculation means 24 controls the adaptation module 28 to control the measurement of the acoustic characteristics of the reproduction room, either before reproduction or during reproduction, if necessary. Play a role.

マルチプレクサ/伝送ステージ26は、手段24または制御手段20または手段26自身のいずれかにおいて生成される同期情報を、スピーカモジュールへのデータストリーム内に導入するように構成される。スピーカモジュールにはさらに、個別スピーカに要求される合成信号および必要なチャネル情報が供給される。   The multiplexer / transmission stage 26 is configured to introduce synchronization information generated in either the means 24 or the control means 20 or the means 26 itself into the data stream to the speaker module. The speaker module is further supplied with a composite signal required for the individual speaker and necessary channel information.

ここでさらに留意すべきことは、チャネル情報を算出するためかつ同期信号を算出するため、および個別スピーカのための個別合成信号と個別チャネル情報とを算出するために、手段24にはさらに特定の再生室内におけるスピーカ位置が提供されなければならないということである。これは図2で回線30によって象徴的に示される。   It should be further noted here that means 24 are further specified for calculating channel information and for calculating synchronization signals and for calculating dedicated composite signals and dedicated channel information for individual speakers. The speaker position in the playback room must be provided. This is shown symbolically by line 30 in FIG.

以下に、図3を参照しながらスピーカモジュールの好適な実施形態について説明する。まず、スピーカモジュールは受信器/復号器ブロック31を備え、このブロック31は選択手段からデータストリームを受信し、かつこのデータストリームから、合成信号31aと、関連するチャネル情報31bと、同期情報31cとを抽出する。図3に示すスピーカモジュールはさらに、中央装置としてオーディオレンダリング手段32を備え、この手段32は、1つまたは複数の合成信号を使用し、かつこれら合成信号に関連付けられたチャネル情報を使用することにより、スピーカのための再生信号を算出する。さらに、スピーカモジュールはデジタル/アナログ変換器付き信号処理手段33を備え、この信号処理手段33は、音声信号を生成するためにそれぞれのスピーカLSi34に供給されるアナログスピーカ信号を生成する。信号処理手段33、特にデジタル/アナログ変換器と協働するリサンプラに対し、受信器31によってデータストリームから抽出された同期情報31cが供給される。その結果、スピーカは、図2の手段24によって算出された合成信号を、互いに畳重しかつチャネル情報が付与された状態で、中央波面合成モジュールと同期するように、従って他の全てのスピーカモジュールとも同期するように時間的に正確に出力することができる。   Hereinafter, a preferred embodiment of the speaker module will be described with reference to FIG. First, the speaker module comprises a receiver / decoder block 31, which receives a data stream from the selection means, and from this data stream, combines signal 31a, associated channel information 31b, synchronization information 31c, To extract. The speaker module shown in FIG. 3 further comprises audio rendering means 32 as a central device, which means 32 by using one or more combined signals and by using channel information associated with these combined signals. Then, the reproduction signal for the speaker is calculated. Further, the speaker module includes signal processing means 33 with a digital / analog converter, and the signal processing means 33 generates an analog speaker signal supplied to each speaker LSi 34 in order to generate an audio signal. The synchronization information 31c extracted from the data stream by the receiver 31 is supplied to the signal processing means 33, in particular the resampler cooperating with the digital / analog converter. As a result, the loudspeaker is synchronized with the central wavefront synthesis module with the composite signal calculated by the means 24 of FIG. 2 superimposed on each other and with channel information attached, and thus all other loudspeaker modules. Can be output accurately in time so as to synchronize with each other.

したがって、図3に示したスピーカモジュールは、デジタル受信器、他の信号処理手段、およびデジタル/アナログ変換器の組合せによって特徴付けられ、特に、信号処理手段33にはデジタル増幅器を設けることができる。代替的に、信号はデジタル/アナログ変換後に増幅することができるが、同期のより正確な可能性のため、デジタル増幅が好ましい。さらに、短いアナログ回線を介してスピーカ34を信号処理手段33に結合することが好ましい。しかし、信号処理手段33からスピーカ34までの回線を短くすることができない場合には、同期はデジタル側で実行することが好ましいので、スピーカモジュールとスピーカとの間の線長が非常に異なると、非同期化が発生するおそれがあり、それは可聴アーチファクトと波面合成によって形成しようとする音響印象の喪失とを導くおそれがあるので、全てのスピーカのそれぞれの回線が、同じ長さであるかあるいは所定の許容範囲内の差異を持つ長さであることが好ましい。   Therefore, the speaker module shown in FIG. 3 is characterized by a combination of a digital receiver, other signal processing means, and a digital / analog converter, and in particular, the signal processing means 33 can be provided with a digital amplifier. Alternatively, the signal can be amplified after digital / analog conversion, but digital amplification is preferred because of the more precise possibility of synchronization. Furthermore, it is preferable to couple the speaker 34 to the signal processing means 33 via a short analog line. However, if the line from the signal processing means 33 to the speaker 34 cannot be shortened, the synchronization is preferably performed on the digital side, so if the line length between the speaker module and the speaker is very different, Asynchronization can occur, which can lead to audible artifacts and loss of acoustic impression to be created by wavefront synthesis, so that each line of all speakers is either the same length or a given It is preferable that the length has a difference within an allowable range.

本発明の好適な実施形態では、チャネルインパルス応答は時間ドメインまたは周波数ドメインのチャネル情報として伝送される。この場合、オーディオレンダリング手段32は、個別の合成信号とこれら合成信号に関連付けられるチャネル情報との畳み込みを実行するように設計される。この畳み込みは実際には時間ドメインで畳み込みとして実現することができ、あるいは必要に応じて、周波数ドメインの解析信号にチャネル伝達関数を乗算することによって周波数ドメインで実行することができる。処理上の手間に関して最適化された実施形態を図4に示す。図4はオーディオレンダリング手段32の好適な実施形態を示し、全ての合成信号Sji(t)のための時間−周波数変換ブロック34a,34b,34cと、合成信号の変換値にチャネルインパルス応答の変換値Hji(f)を乗算するため全ての分岐に設けられた乗算器35a,35b,35cと、加算器36と、終端の周波数−時間変換手段37とを備え、それらは図4に示すように接続されている。図4に示す構成では、それぞれチャネル伝達関数を既に有する合成信号が周波数ドメインで加算されるので、合成信号の個数とは関係なく、全てのスピーカモジュールに対し単一の周波数−時間変換手段のみが存在するだけであり、処理上の手間が低減されるという事実が特徴として挙げられる。実施形態によっては、合成信号Sjiの時間−周波数変換は完全に並列で実行されることができ、または充分な時間がある場合には、直列/並列あるいは完全に直列でも実行されることができる。 In a preferred embodiment of the present invention, the channel impulse response is transmitted as channel information in the time domain or frequency domain. In this case, the audio rendering means 32 is designed to perform a convolution of the individual synthesized signals and the channel information associated with these synthesized signals. This convolution can actually be realized as a convolution in the time domain, or can be performed in the frequency domain by multiplying the frequency domain analysis signal by a channel transfer function, if necessary. An embodiment optimized for processing effort is shown in FIG. FIG. 4 shows a preferred embodiment of the audio rendering means 32, time-frequency conversion blocks 34a, 34b, 34c for all the synthesized signals S ji (t) and the conversion of the channel impulse response into the converted values of the synthesized signals. In order to multiply the value H ji (f), multipliers 35a, 35b, 35c provided in all branches, an adder 36, and a terminal frequency-time conversion means 37 are provided, as shown in FIG. It is connected to the. In the configuration shown in FIG. 4, since synthesized signals each having a channel transfer function are added in the frequency domain, only a single frequency-time conversion means is provided for all speaker modules regardless of the number of synthesized signals. It is characterized by the fact that it only exists and the processing effort is reduced. Depending on the embodiment, the time-frequency conversion of the composite signal S ji can be performed completely in parallel, or can be performed in series / parallel or completely in series if there is sufficient time. .

これまで示したように、図4に示した好適なオーディオレンダリング手段32は、スピーカモジュールに供給される合成信号の個数とは関係なく、好ましくは逆FFTとして実現される単一の周波数−時間変換手段37のみを有するという事実によって特徴付けられる。この場合では、手段34a,34b,34cはFFT(FFT=高速フーリエ変換)として実現されている。   As indicated so far, the preferred audio rendering means 32 shown in FIG. 4 is preferably a single frequency-to-time conversion implemented as an inverse FFT, irrespective of the number of synthesized signals supplied to the speaker module. Characterized by the fact that it has only means 37. In this case, the means 34a, 34b, 34c are realized as FFT (FFT = Fast Fourier Transform).

図3に示したオーディオレンダリング手段32はさらに、図2に示した中央波面合成モジュールからの特殊なプログラム情報を得るように構成されている。したがって、マルチプレクサ/伝送ステージ26は、プログラム情報をスピーカモジュールに提供するために特定の出力を備える。適用事例によっては、プログラム情報をデータストリーム内で合成信号およびチャネル情報と乗算することもできるが、これは必須ではない。   The audio rendering means 32 shown in FIG. 3 is further configured to obtain special program information from the central wavefront synthesis module shown in FIG. Accordingly, the multiplexer / transmission stage 26 comprises a specific output for providing program information to the speaker module. Depending on the application, the program information can be multiplied with the composite signal and channel information in the data stream, but this is not essential.

以下に、プログラム情報をスピーカモジュールに伝送するための例を説明する。チャネル情報がチャネルインパルス応答として表現され、個別スピーカモジュールに伝送される場合、データレートを節約する意味で、インパルス応答全体ではなく、エンベロープがしきい値より高い量を有するインパルス応答のフロント領域にあるインパルス応答のサンプルだけを伝送することが好ましい。ここで、インパルス応答は通常、短時間だけ大きい値を持ち、加速度的に小さい値を取るようになり、最終的にはいわゆる「残響テール」(reverberation tail)を持つことに留意すべきである。それは音響印象にとっては重要であるが、そのサンプルはもはや高くはなく、その特定の位相関係は耳で強く知覚されない。この場合、しきい値より低いエンベロープを持つ残響テールは、サンプルに基づいて伝送するのではなく、単にエンベロープ値を伝送することが好ましい。本発明では、オーディオレンダリング手段32によって要求される残響テールのサンプルは、0と1の任意のシーケンスを生成するオーディオレンダリング手段によって生成され、その振幅は伝送されたエンベロープ値によって加重される。さらなるデータ削減のため、少数のエンベロープ値だけを伝送し、エンベロープ値の間を補間し、次いで補間されたエンベロープをランダム0/1シーケンスの加重に使用することが好ましい。 Hereinafter, an example for transmitting the program information to the speaker module will be described. When channel information is expressed as a channel impulse response and transmitted to the individual speaker module, it is in the front region of the impulse response where the envelope has a higher amount than the threshold, rather than the entire impulse response, in the sense of saving data rate Preferably, only impulse response samples are transmitted. It should be noted here that the impulse response usually has a large value only for a short time, takes a small value in terms of acceleration, and eventually has a so-called “reverberation tail”. Although it is important for the acoustic impression, the sample is no longer high and its specific phase relationship is not strongly perceived by the ear. In this case, reverberant tails with envelopes below the threshold are preferably transmitted simply as envelope values rather than based on samples. In the present invention, the reverberant tail samples required by the audio rendering means 32 are generated by an audio rendering means that generates any sequence of 0's and 1's, the amplitude of which is weighted by the transmitted envelope value . For further data reduction, it is preferable to transmit only a small number of envelope values , interpolate between the envelope values , and then use the interpolated envelope values for weighting the random 0/1 sequence.

ランダム0/1シーケンスは、「1」が正電圧値、「0」が負電圧値によって実現されることが好ましいことに留意すべきである。特定の値までは現実のサンプルであり、その後は単なるエンベロープ値であるチャネル情報をオーディオレンダリング手段が受信したかどうかに関する情報は、図3に示すプログラム情報を介してトランスミッタとレシーバとに共有され、変化することはない。 It should be noted that the random 0/1 sequence is preferably realized by “1” being a positive voltage value and “0” being a negative voltage value. The information about whether the audio rendering means has received channel information, which is a real sample up to a specific value and then is simply an envelope value , is shared between the transmitter and the receiver via the program information shown in FIG. There is no change.

さらに、本発明の波面合成モジュールは、図2に示されていないWFSミキシングコンソールを備えており、このコンソールはWFS音表現を生成するためのオーサ(author)システムを備える。   In addition, the wavefront synthesis module of the present invention includes a WFS mixing console not shown in FIG. 2, which includes an author system for generating a WFS sound representation.

以下に、合成信号の生成の基礎を成す手順について、図6を参照しながら説明する。3つの仮想位置60,61,62にある3つの仮想音源と、中央WFSモジュールには既知の現実のスピーカ位置にあるスピーカLSi63とを有するシステムについて考察する。さらに、仮想音源の仮想位置60,61,62は、それらがWFS処理された入力信号内に供給されるので、あるいはそれらが仮想位置を算出するための手段25によって音源位置を使用して導出されるので、中央波面合成モジュールには既知である。合成信号S1i,S2i,S3iはスピーカ63が放射しなければならない信号であり、それらはそれぞれの仮想位置60,61,62に由来するものである。このことから、これまで説明してきたように、全てのスピーカが複数の合成信号の重畳を放射することが分かる。 Hereinafter, a procedure that forms the basis of the generation of the composite signal will be described with reference to FIG. Consider a system with three virtual sound sources at three virtual positions 60, 61, 62 and a speaker LSi 63 at a known real speaker position in the central WFS module. Furthermore, the virtual positions 60, 61, 62 of the virtual sound sources are derived using the sound source positions since they are supplied in the WFS processed input signal or by means 25 for calculating them. Thus, it is known to the central wavefront synthesis module. The combined signals S 1i , S 2i , S 3i are signals that the speaker 63 must radiate, and they are derived from the respective virtual positions 60, 61, 62. From this, it can be seen that all the speakers emit a superposition of a plurality of synthesized signals as described above.

さらに、チャネルjiは全ての仮想位置と全てのスピーカとの間に定義され、これは図7に関連して説明するように、例えばインパルス応答、伝達関数、または他のいずれかのチャネル情報によって記述されることができる。全ての所望の特性はチャネルの記述の中に組み込まれることが可能であり、次いで、波面合成モジュールによって算出された合成信号に対し、合成信号に関連付けられたそれぞれのチャネルのためのチャネル情報を提供することができる。チャネル情報がチャネルを記述するインパルス応答として与えられる場合には、畳み込みが適用される。信号が周波数ドメインに存在する場合には、乗算が行われる。実施形態に応じて、代替的チャネル情報を使用することもできる。 In addition, channel j i is defined between all virtual positions and all speakers, which can be described, for example, by an impulse response, transfer function, or any other channel information, as described in connection with FIG. Can be described. All desired characteristics can be incorporated into the channel description and then provide the channel information for each channel associated with the synthesized signal for the synthesized signal calculated by the wavefront synthesis module can do. If channel information is given as an impulse response describing the channel, convolution is applied. If the signal is in the frequency domain, multiplication is performed. Depending on the embodiment, alternative channel information may be used.

以下に、仮想音源71から現実のスピーカ72までのチャネル70に影響を及ぼすことができる情報について、図7を参照しながら説明する。まず、仮想音源71の仮想位置がチャネル情報内、即ち、例えばチャネルインパルス応答内に導入される。さらに、大きさや密度等の仮想音源の特性が導入される。したがって、例えば小さなトライアングルは、大きなティンパニとは異なる方法で表現されモデル化される。さらに、図7に示すように、録音室の特性がチャネル伝達関数の中に導入される。さらなる影響要素は、オーディオ再生システム全体のシステム歪みであり、例えばスピーカのスピーカ歪みおよび不具合がそれぞれ含まれる。さらに、再生室の音響特性の補償を達成するために、再生室に関する情報がチャネル情報内に導入される。この情報から、例えば再生室がスピーカの正面に対向する壁を持ち、その壁による反射を抑制しなければならないことが分かっている場合には、それぞれのスピーカはこの情報を考慮に入れて制御され、そのためこれらのスピーカが反射された信号に対し180度位相シフトされかつそれぞれの振幅を有する信号を含むので、その結果、反射が除去され、壁は音響学的に透明になり、つまりリスナーにはもはや反射による識別が不可能となる。   Hereinafter, information that can affect the channel 70 from the virtual sound source 71 to the actual speaker 72 will be described with reference to FIG. First, the virtual position of the virtual sound source 71 is introduced in the channel information, that is, for example, in the channel impulse response. Furthermore, virtual sound source characteristics such as size and density are introduced. Thus, for example, a small triangle is represented and modeled differently than a large timpani. Furthermore, as shown in FIG. 7, the characteristics of the recording room are introduced into the channel transfer function. A further influencing factor is the system distortion of the entire audio playback system, which includes, for example, speaker distortion and malfunction of the speaker, respectively. Furthermore, information regarding the reproduction room is introduced into the channel information in order to achieve compensation of the acoustic characteristics of the reproduction room. From this information, for example, if it is known that the playback room has a wall facing the front of the speaker and reflections from that wall must be suppressed, each speaker is controlled taking this information into account. , So that these speakers contain signals that are 180 degrees phase shifted with respect to the reflected signal and have their respective amplitudes, so that the reflection is removed and the walls are acoustically transparent, i.e. to the listener Identification by reflection is no longer possible.

最後に、チャネル情報は、特定の目標再生音響を設定するために使用することもできる。したがって、最初に再生室補償の形で再生室の音響を抑制してチャネル情報を生成し、次にその生成されたチャネル情報を波面合成モジュールに提供し、その結果、他のいずれの再生室の音響をも1つの再生室内でシミュレーションできるようにすることが好ましい。   Finally, the channel information can also be used to set a specific target playback sound. Therefore, the channel information is first generated by suppressing the sound of the playback room in the form of playback room compensation, and then the generated channel information is provided to the wavefront synthesis module, so that any other playback room It is preferable that sound can be simulated in one reproduction room.

条件によって、オーディオ信号を再生するための本発明の方法は、ハードウェアまたはソフトウェアで実現することができる。実現方法としては、電子的に読取り可能な制御信号を含むデジタルメモリ媒体、特にディスクまたはCDが挙げられ、上述の方法が実行されるようにプログラム可能なコンピュータシステムと協働することが可能なものである。概して、本発明は、コンピュータプログラム製品がコンピュータで実行されるときに、機械可読媒体に格納された本発明の方法を実行するためのプログラムコードを有するコンピュータプログラム製品にも存在する。換言すると、本発明は、コンピュータプログラムがコンピュータで実行されるときに、ある方法を実行するためのプログラムコードを有するコンピュータプログラムとしても実現することができる。   Depending on the conditions, the inventive method for reproducing an audio signal can be implemented in hardware or software. Implementation methods include digital memory media that contain electronically readable control signals, in particular discs or CDs, that can work with a computer system that can be programmed to perform the method described above. It is. In general, the present invention also resides in a computer program product having program code for performing the methods of the present invention stored on a machine readable medium when the computer program product is executed on a computer. In other words, the present invention can also be realized as a computer program having a program code for executing a certain method when the computer program is executed by a computer.

Claims (14)

複数のスピーカが再生室内の所定のスピーカ位置に配置された上記再生室内でオーディオ信号を再生するためのシステムであって、上記オーディオ信号が複数のオーディオトラックを有し、各オーディオトラックにそれぞれ音源位置が関連付けられたオーディオ再生システムにおいて、
上記オーディオ信号が入力される入力手段と、上記オーディオトラックに関連付けられた上記音源位置を上記再生室における仮想位置としてマッピングする手段と、全ての上記仮想位置から全ての上記スピーカまでの全てのオーディオチャネルの音響特性を示すオーディオチャネル情報を決定する手段と、波面合成の原理を用いて上記オーディオ信号から上記スピーカで再生されるべき合成信号を算出する手段であって、個々の上記スピーカから出力される音波の重畳から生じる波が、上記仮想位置にある仮想音源が実位置にある現実の音源であった場合にこの仮想音源から発生するであろう波と振幅および位相について一致するように、上記再生室の音響特性を含まない合成信号を算出する手段と、上記各スピーカによって再生されるべき1つまたは複数の上記合成信号とこの合成信号に関連する上記チャネル情報とを供給する手段と、を有する中央波面合成モジュールと、
複数のスピーカモジュールであって、1つのスピーカモジュールが少なくとも1つのスピーカと接続されており、上記各スピーカモジュールが、上記中央波面合成モジュールから供給された上記各スピーカのための上記1つまたは複数の合成信号と上記チャネル情報とを受け取るための受信器と、上記1つまたは複数の合成信号と上記チャネル情報とを使用することによって、上記スピーカ用の再生信号を算出するためのレンダリング手段と、上記再生信号によって上記各スピーカに供給するアナログスピーカ信号を生成するための信号処理手段と、を有する複数のスピーカモジュールと、
一方を上記中央波面合成モジュールに、他方を上記スピーカモジュールに個別に結合され、上記中央波面合成モジュールから全ての上記スピーカモジュールまでのびる複数の伝送線路と、
を備えることを特徴とするオーディオ再生システム。
A system for a plurality of speakers to reproduce the audio signal in placed the reproduction room at a predetermined loudspeaker position of the reproduction room, the audio signal has a plurality of audio tracks, each sound source position in each audio track In the audio playback system associated with
Input means for inputting the audio signal; means for mapping the sound source position associated with the audio track as a virtual position in the playback room; and all audio channels from all the virtual positions to all the speakers. Means for determining audio channel information indicating the acoustic characteristics of the audio signal, and means for calculating a synthesized signal to be reproduced by the speaker from the audio signal using the principle of wavefront synthesis, which are output from the individual speakers. The reproduction is performed so that the wave generated from the superimposition of the sound wave coincides with the wave that will be generated from the virtual sound source when the virtual sound source at the virtual position is a real sound source at the real position in terms of amplitude and phase. means for calculating a combined signal which does not include the acoustic properties of the chamber, to be reproduced by said respective loudspeakers One or a plurality of central wave-field synthesis module and means for supplying and the channel information associated with the combined signal and the combined signal,
A plurality of speaker modules, wherein one speaker module is connected to at least one speaker, and each speaker module is connected to the one or more speakers for each speaker supplied from the central wavefront synthesis module; A receiver for receiving a composite signal and the channel information; a rendering means for calculating a reproduction signal for the speaker by using the one or more composite signals and the channel information; and A plurality of speaker modules, comprising: signal processing means for generating analog speaker signals to be supplied to each of the speakers by a reproduction signal;
A plurality of transmission lines that are individually coupled to the central wavefront synthesis module and the other individually coupled to the speaker module, extending from the central wavefront synthesis module to all the speaker modules;
An audio playback system comprising:
上記各スピーカモジュールが、それに関連付けられる上記スピーカに対し、上記スピーカと上記スピーカモジュールとの間の空間距離が上記スピーカモジュールと上記中央波面合成モジュールとの間の空間距離より短くなるように結合されていることを特徴とする請求項1に記載のオーディオ再生システム。Each speaker module is coupled to the speaker associated therewith so that a spatial distance between the speaker and the speaker module is shorter than a spatial distance between the speaker module and the central wavefront synthesis module. The audio playback system according to claim 1, wherein: 上記オーディオチャネル情報は、上記オーディオチャネルに関連する音響特性を表すインパルス応答を含むことを特徴とする請求項1または2に記載のオーディオ再生システム。The audio channel information, an audio reproduction system according to claim 1 or 2, characterized in that it comprises an impulse response representative of the acoustic characteristics associated with the audio channels. 上記再生信号を算出するためのレンダリング手段は、1つまたは複数の上記合成信号をそれぞれのインパルス応答と共に使用することによって、1つまたは複数の畳み込みを実行する畳み込み手段を有することを特徴とする請求項3に記載のオーディオ再生システム。The rendering means for calculating the reproduction signal comprises convolution means for performing one or more convolutions by using one or more of the combined signals with respective impulse responses. Item 4. The audio playback system according to Item 3. 上記レンダリング手段は、
上記各合成信号を時間ドメインから周波数ドメインへ変換する時間ドメイン−周波数ドメイン変換手段と、
上記各合成信号の周波数変換値にそれぞれのチャネルインパルス応答を変換することによって得られたチャネル伝達関数を乗算するための乗算手段と、
上記チャネル伝達関数が乗算された上記合成信号を合計するための合計手段と、
上記合計信号を時間ドメインに変換して上記再生信号を得るための単一の周波数ドメイン−時間ドメイン変換手段と、
を備えることを特徴とする請求項4に記載のオーディオ再生システム。
The rendering means includes
Time domain-frequency domain converting means for converting each of the synthesized signals from the time domain to the frequency domain ;
Multiplying means for multiplying the channel transfer function obtained by converting the respective channel impulse responses to the frequency conversion values of the respective synthesized signals;
Summing means for summing the composite signal multiplied by the channel transfer function ;
A single frequency domain-time domain transforming means for transforming the total signal into the time domain to obtain the reproduced signal;
The audio reproduction system according to claim 4, further comprising:
上記スピーカモジュール内の上記信号処理手段は、デジタル増幅器を有することを特徴とする請求項1に記載のオーディオ再生システム。2. The audio reproduction system according to claim 1, wherein the signal processing means in the speaker module includes a digital amplifier. 上記オーディオトラックはビデオまたは映画フィルムの一部であり、上記中央波面合成モジュールは、映像再生の前にある時間だけシフトされた上記ビデオまたは映画フィルムのオーディオトラックをサンプリングするように形成され、上記時間は、上記中央波面合成モジュール内および上記スピーカモジュール内における処理時間を考慮して、画像および音声の同時再生が得られるように選択されることを特徴とする請求項1乃至6のいずれか1項に記載のオーディオ再生システム。The audio track is part of a video or movie film, and the central wavefront synthesis module is configured to sample the audio track of the video or movie film shifted by a certain time before video playback, and the time , taking into account the processing time in the central wave-field synthesis and in the above speaker module module, any one of claims 1 to 6, characterized in that simultaneous reproduction of image and audio are selected so as to obtain The audio playback system described in 1. 上記オーディオ信号は、上記オーディオトラックとして録音環境におけるオーディオオブジェクトのオーディオ信号と、録音環境におけるオーディオオブジェクトの位置と、大きさまたは密度等のオーディオオブジェクトの1つまたは複数の特性と、および/または上記録音環境の音響特性に関する情報とを含むことを特徴とする請求項1乃至のいずれか1項に記載のオーディオ再生システム。 The audio signal is an audio signal of an audio object in the recording environment as the audio track, the position of the audio object in the recording environment, one or more characteristics of the audio object such as size or density, and / or the recording. audio reproduction system as claimed in any one of claims 1 to 7, characterized in that it comprises information about acoustic characteristics of the environment. 上記中央波面合成モジュールが、上記録音環境における上記オーディオオブジェクトの位置から上記仮想位置を決定するように形成されていることを特徴とする請求項に記載のオーディオ再生システム。9. The audio reproduction system according to claim 8 , wherein the central wavefront synthesis module is configured to determine the virtual position from the position of the audio object in the recording environment. 上記中央波面合成モジュールは、複数の上記スピーカによって音波を再生する際に上記再生室の音響学的影響が低減されるように、上記再生室の音響特性に関する情報を使用して上記チャネル情報を決定する、ことを特徴とする請求項1乃至のいずれか1項に記載のオーディオ再生システム。The central wavefront synthesis module determines the channel information using information related to the acoustic characteristics of the reproduction chamber so that acoustic effects of the reproduction chamber are reduced when sound waves are reproduced by the plurality of speakers. to the audio playback system according to any one of claims 1 to 9, characterized in that. 上記中央波面合成モジュールは、
上記オーディオ信号の再生前に、上記再生室に配置された上記スピーカとマイクロフォンとの間の複数の室インパルス応答を算出し、
上記複数の室インパルス応答から上記再生室の総インパルス応答を補間し、かつ上記チャネル情報を算出するときに上記総インパルス応答を考慮して、上記再生室の音響特性を低減することによって、
上記再生室の音響効果に対する適応を実行するように形成されていることを特徴とする請求項1乃至10のいずれか1項に記載のオーディオ再生システム。
The central wavefront synthesis module is
Before reproducing the audio signal, calculate a plurality of room impulse responses between the speaker and the microphone arranged in the reproduction room,
By interpolating the total impulse response of the reproduction chamber from the plurality of room impulse responses, and considering the total impulse response when calculating the channel information, by reducing the acoustic characteristics of the reproduction chamber,
The audio reproduction system according to any one of claims 1 to 10 , wherein the audio reproduction system is configured to perform adaptation to an acoustic effect of the reproduction room.
上記中央波面合成モジュールが同期情報を生成し、かつその同期情報を上記スピーカモジュールへのデータストリーム内に組み込むように形成され、上記複数のスピーカモジュールが上記中央波面合成モジュールから上記同期情報を受信し、かつそれを同期化のために使用して上記スピーカモジュールを上記中央波面合成モジュールに同期させるように形成されていることを特徴とする請求項1乃至11のいずれか1項に記載のオーディオ再生システム。The central wavefront synthesis module is configured to generate synchronization information and incorporate the synchronization information into a data stream to the speaker module, and the plurality of speaker modules receive the synchronization information from the central wavefront synthesis module. and audio reproduction according to the speaker module using it for synchronization to any one of claims 1 to 11, characterized in that it is formed so as to synchronize with the central wave-field synthesis module system. 複数のスピーカが再生室内の所定のスピーカ位置に配置された上記再生室内でオーディオ信号を再生するための方法であって、上記オーディオ信号が複数のオーディオトラックを有し、各オーディオトラックにそれぞれ音源位置が関連付けられた方法において、
上記オーディオ信号を入力するステップと、
上記オーディオトラックに関連付けられた上記音源位置を上記再生室における仮想位置としてマッピングするステップと、
全ての上記仮想位置から全ての上記スピーカまでの全てのオーディオチャネルの音響特性を示すオーディオチャネル情報を中央で決定するステップと、
上記オーディオ信号から上記スピーカで再生されるべき合成信号を波面合成の原理を用いて中央で算出するステップであって、個々の上記スピーカから出力される音波の重畳から生じる波が、上記仮想位置にある仮想音源が実位置にある現実の音源であった場合にこの仮想音源から発生するであろう波と振幅および位相について一致するように、上記再生室の音響特性を含まない合成信号を算出するステップと、
1つまたは複数の上記合成信号とこの合成信号に関連するチャネル情報とを複数のスピーカモジュールに伝送するステップと、
各スピーカ用の1つまたは複数の上記合成信号と上記関連チャネル情報とを使用して、上記スピーカの再生信号を分散的に算出するステップと、
デジタル/アナログ変換を使用することにより信号処理を実行してアナログスピーカ信号を生成するステップと、
上記アナログスピーカ信号を複数の上記スピーカから集合的に取り出すステップと、
を含むことを特徴とする方法。
A method for a plurality of speakers to reproduce the audio signal in placed the reproduction room at a predetermined loudspeaker position of the reproduction room, the audio signal has a plurality of audio tracks, each sound source position in each audio track In the method associated with
Inputting the audio signal;
Mapping the sound source location associated with the audio track as a virtual location in the playback room ;
Centrally determining audio channel information indicating acoustic characteristics of all audio channels from all the virtual locations to all the speakers;
A step of calculating a synthesized signal to be reproduced by the speaker from the audio signal in the center using the principle of wavefront synthesis, wherein a wave generated by superposition of sound waves output from the individual speakers is located at the virtual position. When a virtual sound source is a real sound source at a real position, a composite signal that does not include the acoustic characteristics of the reproduction room is calculated so that the amplitude and phase coincide with the wave that will be generated from this virtual sound source. Steps,
Transmitting one or more of the combined signals and channel information associated with the combined signals to a plurality of speaker modules;
Using the one or more composite signals for each speaker and the associated channel information to calculate the speaker reproduction signal in a distributed manner;
Performing signal processing by using digital / analog conversion to generate an analog speaker signal;
Collectively extracting the analog speaker signal from the plurality of speakers;
A method comprising the steps of:
プログラムがコンピュータで実行されるときに、請求項13に記載の方法を実行するためのプログラムコードとして用いられるコンピュータプログラム。A computer program used as program code for executing the method of claim 13 when the program is executed on a computer.
JP2004552700A 2002-11-21 2003-11-21 Audio reproduction system and method for reproducing an audio signal Expired - Lifetime JP4620468B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10254404A DE10254404B4 (en) 2002-11-21 2002-11-21 Audio reproduction system and method for reproducing an audio signal
PCT/EP2003/013110 WO2004047485A1 (en) 2002-11-21 2003-11-21 Audio playback system and method for playing back an audio signal

Publications (2)

Publication Number Publication Date
JP2006507727A JP2006507727A (en) 2006-03-02
JP4620468B2 true JP4620468B2 (en) 2011-01-26

Family

ID=32318606

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004552700A Expired - Lifetime JP4620468B2 (en) 2002-11-21 2003-11-21 Audio reproduction system and method for reproducing an audio signal

Country Status (5)

Country Link
EP (1) EP1576847B1 (en)
JP (1) JP4620468B2 (en)
AT (1) ATE324021T1 (en)
DE (2) DE10254404B4 (en)
WO (1) WO2004047485A1 (en)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10321986B4 (en) * 2003-05-15 2005-07-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for level correcting in a wave field synthesis system
JP2006086921A (en) 2004-09-17 2006-03-30 Sony Corp Reproduction method of audio signal and reproducing device
JP4625671B2 (en) * 2004-10-12 2011-02-02 ソニー株式会社 Audio signal reproduction method and reproduction apparatus therefor
JP2006115396A (en) * 2004-10-18 2006-04-27 Sony Corp Reproduction method of audio signal and reproducing apparatus therefor
DE102004057500B3 (en) * 2004-11-29 2006-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for controlling a sound system and public address system
DE102005008333A1 (en) * 2005-02-23 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Control device for wave field synthesis rendering device, has audio object manipulation device to vary start/end point of audio object within time period, depending on extent of utilization situation of wave field synthesis system
DE102005008343A1 (en) * 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for providing data in a multi-renderer system
DE102005008369A1 (en) 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for simulating a wave field synthesis system
DE102005008366A1 (en) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device for driving wave-field synthesis rendering device with audio objects, has unit for supplying scene description defining time sequence of audio objects
DE102005008342A1 (en) * 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio-data files storage device especially for driving a wave-field synthesis rendering device, uses control device for controlling audio data files written on storage device
JP2006304165A (en) * 2005-04-25 2006-11-02 Yamaha Corp Speaker array system
DE102005043641A1 (en) * 2005-05-04 2006-11-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating and processing sound effects in spatial sound reproduction systems by means of a graphical user interface
DE102006053919A1 (en) 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a number of speaker signals for a speaker array defining a playback space
JP5338053B2 (en) * 2007-09-11 2013-11-13 ソニー株式会社 Wavefront synthesis signal conversion apparatus and wavefront synthesis signal conversion method
KR100943215B1 (en) 2007-11-27 2010-02-18 한국전자통신연구원 Apparatus and method for reproducing surround wave field using wave field synthesis
CN106454675B (en) 2009-08-03 2020-02-07 图象公司 System and method for monitoring cinema speakers and compensating for quality problems
KR102033071B1 (en) * 2010-08-17 2019-10-16 한국전자통신연구원 System and method for compatible multi channel audio
EP2451196A1 (en) 2010-11-05 2012-05-09 Thomson Licensing Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three
KR101845226B1 (en) 2011-07-01 2018-05-18 돌비 레버러토리즈 라이쎈싱 코오포레이션 System and method for adaptive audio signal generation, coding and rendering
DE102011082310A1 (en) 2011-09-07 2013-03-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and electroacoustic system for reverberation time extension
US9661436B2 (en) 2012-08-29 2017-05-23 Sharp Kabushiki Kaisha Audio signal playback device, method, and recording medium
JP5590169B2 (en) * 2013-02-18 2014-09-17 ソニー株式会社 Wavefront synthesis signal conversion apparatus and wavefront synthesis signal conversion method
JP5743003B2 (en) * 2014-05-09 2015-07-01 ソニー株式会社 Wavefront synthesis signal conversion apparatus and wavefront synthesis signal conversion method
US9924291B2 (en) * 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
JP6670259B2 (en) * 2017-01-26 2020-03-18 日本電信電話株式会社 Sound reproduction device
CN109068261A (en) * 2018-07-17 2018-12-21 费迪曼逊多媒体科技(上海)有限公司 A kind of playback restoring method carrying out non real-time rendering processing using WFS method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7577260B1 (en) * 1999-09-29 2009-08-18 Cambridge Mechatronics Limited Method and apparatus to direct sound

Also Published As

Publication number Publication date
JP2006507727A (en) 2006-03-02
DE10254404A1 (en) 2004-06-17
EP1576847A1 (en) 2005-09-21
EP1576847B1 (en) 2006-04-19
DE10254404B4 (en) 2004-11-18
WO2004047485A1 (en) 2004-06-03
DE50303069D1 (en) 2006-05-24
ATE324021T1 (en) 2006-05-15

Similar Documents

Publication Publication Date Title
JP4620468B2 (en) Audio reproduction system and method for reproducing an audio signal
US7706544B2 (en) Audio reproduction system and method for reproducing an audio signal
JP4255031B2 (en) Apparatus and method for generating a low frequency channel
KR101407200B1 (en) Apparatus and Method for Calculating Driving Coefficients for Loudspeakers of a Loudspeaker Arrangement for an Audio Signal Associated with a Virtual Source
US6990205B1 (en) Apparatus and method for producing virtual acoustic sound
JP4338733B2 (en) Wavefront synthesis apparatus and loudspeaker array driving method
US7751915B2 (en) Device for level correction in a wave field synthesis system
JP4819823B2 (en) Acoustic system driving apparatus, driving method, and acoustic system
KR102235413B1 (en) Generating binaural audio in response to multi-channel audio using at least one feedback delay network
US7734362B2 (en) Calculating a doppler compensation value for a loudspeaker signal in a wavefield synthesis system
JP2013211906A (en) Sound spatialization and environment simulation
US8363847B2 (en) Device and method for simulation of WFS systems and compensation of sound-influencing properties
EP2368375B1 (en) Converter and method for converting an audio signal
US9355632B2 (en) Apparatus, method and electroacoustic system for reverberation time extension
Otani et al. Binaural Ambisonics: Its optimization and applications for auralization
KR100955328B1 (en) Apparatus and method for surround soundfield reproductioin for reproducing reflection
Spors et al. Sound field synthesis
JP2007336080A (en) Sound compensation device
Geronazzo Sound Spatialization.
US11924623B2 (en) Object-based audio spatializer
WO2022034805A1 (en) Signal processing device and method, and audio playback system
JP2023066418A (en) object-based audio spatializer

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070731

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080311

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080317

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20080711

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100624

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100701

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101028

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4620468

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term