SE528706C2 - Device and process method for surround sound - Google Patents

Device and process method for surround sound

Info

Publication number
SE528706C2
SE528706C2 SE0402772A SE0402772A SE528706C2 SE 528706 C2 SE528706 C2 SE 528706C2 SE 0402772 A SE0402772 A SE 0402772A SE 0402772 A SE0402772 A SE 0402772A SE 528706 C2 SE528706 C2 SE 528706C2
Authority
SE
Sweden
Prior art keywords
virtual
signals
format
microphones
microphone
Prior art date
Application number
SE0402772A
Other languages
Swedish (sv)
Other versions
SE0402772L (en
SE0402772D0 (en
Inventor
Bengt-Inge Dalenbaeck
Original Assignee
Bengt Inge Dalenbaeck Med Catt
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bengt Inge Dalenbaeck Med Catt filed Critical Bengt Inge Dalenbaeck Med Catt
Priority to SE0402772A priority Critical patent/SE528706C2/en
Publication of SE0402772D0 publication Critical patent/SE0402772D0/en
Priority to PCT/SE2005/001659 priority patent/WO2006052188A1/en
Publication of SE0402772L publication Critical patent/SE0402772L/en
Publication of SE528706C2 publication Critical patent/SE528706C2/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

A surround sound processing arrangement where directionally encoded audio signals in a B-format (W, X, Y, Z) or B-format-like signals are via a primary matrix, synthesizing virtual arbitrary microphones, encoded to intermediate channels used as virtual loudspeaker feeds. These virtual loudspeaker feeds are via a secondary matrix transcoded to multiple channels corresponding to coincident or non-coincident virtual arbitrary microphone signals suitable for subsequent mono, stereo or surround sound loudspeaker replay. The described transcoding process enables variation of the properties of the reproduced sound field regarding parameters such as localization, depth, image size, spaciousness, envelopment, and particularly can offer a stable frontal image and a large listening area size.

Description

20 25 30 35 5-kanals rekommendation [l 1] visar sig en ambisonic-avkodning emellertid ha allvarliga problem typiskt resulterande i en liten lyssningsyta (liten ”sweetspot”), instabil frontal ljudbild och färgning av ljudet vid huvudrörelse [12] [l 3] och är för närvarande ovanlig vid praktisk efterbehandling av surround. I Gerzon m. fl. [5], undanröjdes den tidigare begränsningen inom ambisonic-teorin vad gäller kravet på regelbundna eller rektangulära högtalaruppställningar och ett stort antal numeriska exempel för oregelbundna uppställningar presenterades där dock ingen hade en så hög grad av osymmetri som den som valdes i ITU- rekommendationen: O°, =l=3 0°, i(l00°-120°) från den frontala centerlinjen. Även om ”ambisonicfïavkodníng är möjlig för en ITU-uppställning, såsom redovisas i [5], se t.ex. [l2], så accentuerar den kraftiga fram/bak osymmetrin ”sweetspot”-problemen. Delvis p. g.a. dessa problem är det vanligare inom nuvarande inspelningspraxis att syntetisera mikrofoner från B- format utan explicit hänsyn till arnbisonic-teorin men även i detta fall leder det till en instabil frontal ljudbild och en liten lyssningsyta, se t.ex. [l2], [l 3]. 20 25 30 35 5-channel recommendation [l 1], however, ambisonic decoding is found to have serious problems typically resulting in a small listening area (small "sweetspot"), unstable frontal sound image and color staining during main movement [12] [l 3 ] and is currently uncommon in practical surround finishing. I Gerzon m. Fl. [5], the previous limitation in ambisonic theory regarding the requirement for regular or rectangular speaker arrays was removed and a large number of numerical examples for irregular arrays were presented where no one had such a high degree of asymmetry as that chosen in the ITU recommendation: O °, = l = 30 °, i (100 ° -120 °) from the frontal center line. Although “ambisonicfïavkodning is possible for an ITU setup, as reported in [5], see e.g. [l2], so the strong front / back asymmetry accentuates the "sweetspot" problems. Partly p. G.a. these problems, it is more common in current recording practice to synthesize microphones from B-format without explicit consideration of the arnbisonic theory, but even in this case it leads to an unstable frontal sound image and a small listening area, see e.g. [l2], [l 3].

Separerade mikrofonuppställningar, å andra sidan, tenderar att erbjuda en större lyssningsyta, en stabil frontal ljudbild [12] [l3], och att överlag ge ett ljud som upplevs som mera spatiöst.Separated microphone arrays, on the other hand, tend to offer a larger listening area, a stable frontal sound image [12] [l3], and to generally provide a sound that is perceived as more spatial.

Dock ger varje separerad mikrofonuppställning ett annorlunda resultat då de inspelade signalerna spelas upp över en högtalaruppställning, typiskt ITU-rekommendationen [1l], se Fig. 3. Resultatet skiljer sig beträffande användbar lyssningsyta, den frontala ljudbildens stabilitet, färgning, återskapad storlek och läge på enskilda ljudkällor, generell ljudkaraktär, och fram-/bak-/sido-balans. Dessutom är, inom varje uppställning, flera varianter möjliga såsom variation av den huvudsakliga inspelningsvinkeln, se [l]. Ett bra exempel på detta är ett konferensbidrag om Williams MMA som beskriver över 220 sätt att konfigurera en uppställning av fem kardioidrnikrofoner [8]. Detta konferensbidrag, i sig själv, visar tydligt på behovet av ett angreppssätt som inte påtvingar ett beslut gällande mikrofonuppställningen redan på inspelningsstadiet där ett oturligt val kan leda till otillfredsställande resultat och t.o.m. till ett kostsamt andra inspelningstillfälle.However, each separated microphone array gives a different result when the recorded signals are played over a speaker array, typically the ITU recommendation [1l], see Fig. individual sound sources, general sound character, and front / rear / side balance. In addition, within each arrangement, fl your variants are possible such as variation of the main recording angle, see [l]. A good example of this is a conference paper on Williams MMA that describes over 220 ways to configure an array of five cardioid microphones [8]. This conference contribution, in itself, clearly shows the need for an approach that does not force a decision regarding the microphone setup already at the recording stage where an unfortunate choice can lead to unsatisfactory results and even to a costly second recording opportunity.

Den tredje typen av uppställning, med ett fysiskt objekt som separerar mikrofonema, är inte speciellt lämpad för användning med uppfinningen. Lyssningstest [13] pekar också på sweetspot-problem liknande de hos koincidenta uppställningar och diskuteras inte vidare.The third type of arrangement, with a physical object separating the microphones, is not particularly suitable for use with the invention. Listening tests [13] also point to sweetspot problems similar to those of coincidental lineups and are not discussed further.

Kortfattad beskrivning av uppfinningen Upptinningen erbjuder en möjlighet att överbrygga verkliga och upplevda problem med koincidenta mikrofonuppställningar så att, efter den beskrivna omarbetningen, fördelarna med separerade uppställningar huvudsakligen uppnås, speciellt den stabilare frontala ljudbilden 15 20 25 30 35 528 70t3 3 och den större lyssningsytan men även ett mer spatiöst ljud, samtidigt som beslutet om exakt vilken separerad uppställning som ska användas kan skjutas upp till efterbehandlingen.Brief Description of the Invention The invention offers an opportunity to overcome real and perceived problems with incidental microphone arrays so that, after the rework described, the benefits of separated arrays are mainly achieved, especially the more stable frontal sound image and the larger listening area. also a more spacious sound, at the same time as the decision on exactly which separate arrangement to use can be postponed until the finishing.

För att åstadkomma detta, utnyttjar uppfinningen B-fonnatets inneboende generalitet och ortogonalitet och lär hur B-formatet kan omarbetas till nästan varje annan typ av koincident eller separerad mikrofonuppställning så att, etter den faktiska inspelningen av B-format signalerna, eller efter att B-format signalema skapats på artificiell väg genom t.ex. datorsimulering eller faltning med B-format impulssvar, erbjuder ett val mellan en koincident eller en separerad mikrofonuppställning för att uppnå ett givet syfte, på så sätt erbjuds ett val mellan de huvudsakliga fördelarna med koincidenta och separerade uppställningar samt även mellan olika separerade uppställningar. Som kontrast är omarbetning av signaler vilka spelats in med en separerad uppställning till en annan separerad uppställning inte praktiskt möjligt eftersom redan vid inspelningstillfället har, på varierande sätt och i varierande grad, ömse- sidigt okorrelerade och ickeortogonala signaler registrerats. B-format, å andra sidan, består av starkt korrelerade signaler som, via den beskrivna omarbetningen, vid efterbehandlingen, kan dekorreleras på valt sätt genom användande av en virtuell syntetiserad primär koincident mikrofonuppställning som skapar matningar (här kallat L-format) till en virtuell högtalaruppställning vilkas utsignaler inspelas virtuellt av en vald sekundär virtuell koincident eller separerad mikrofonuppställning se Fig. 2. På detta sätt representerar den beskrivna processen en virtuell återinspelning av det ursprungliga ljudfältet där valet av mikrofonuppställning kan skjutas upp till efterbehandlingen på ett liknade sätt som nuvarande koincidenta metoder, beskrivna t.ex. i [3] [7], men där många fler frihetsgrader erbjuds eftersom även separerade uppställningar kan väljas. I synnerhet tillåter detta en väsentligt stabiliserad frontal ljudbild och en större lyssningsyta De odiskutabla tekniska fórdelama med B-format bibehålls (inklusive tex. möjligheten till monokompatibilitet, godtycklig rotation eller andra ljudtältstransformer) eftersom det ursprungliga B-formatet finns kvar eller kan återskapas från L-format. I de fall då den sekundära virtuella uppställningen är icke koincident så kan givetvis inte de omarbetade signalerna vara identiska med de som skulle ha spelats in direkt med motsvarande fysiska uppställning. Processen introducerar vissa artefakter bestående av ytterligare lj udupptagning p.g.a. de rundmottagande komponentema i de primära virtuella mikrofonerna, vilket följer direkt av beskrivningen nedan, men dessa artefakter upplevs generellt sett som mer positiva än negativa jämfört med rent koincidenta uppställningar. Fysiskt separerade uppställningar skapar alltid kamfiltereffekter, objektivt sett en artefakt men som av många upplevs att ge ett spatiöst ljud. Den beskrivna omarbetnings- processen introducerar ytterligare kamfiltereffekter men inte i en så hög grad att det negativt l5 20 25 30 35 påverkar lyssningsupplevelsen. Den slutliga högtalaruppspelningen, se Fig 3, låter mera likt den som skulle ha skapats av en fysisk separerad uppställning av samma typ än den som skapas av en rent koincident avkodning såsom t.ex. ambisonic.To accomplish this, the invention utilizes the inherent generality and orthogonality of the B-format and teaches how the B-format can be reworked into almost any other type of coincidence or separate microphone array so that, after the actual recording of the B-format signals, or after the B-format format the signals are created in an artistic way by e.g. computer simulation or convolution with B-shaped impulse response, offers a choice between a coincidence or a separated microphone array to achieve a given purpose, thus offering a choice between the main advantages of coincidental and separated arrays and also between different separated arrays. In contrast, reprocessing of signals recorded with a separate set-up to another separate set-up is not practically possible because already at the time of recording, mutually uncorrelated and non-orthogonal signals have been recorded in varying ways and to varying degrees. B-format, on the other hand, consists of strongly correlated signals which, via the described reworking, during post-processing, can be decorrelated in the selected way by using a virtual synthesized primary coincidence microphone array that creates feeds (here called L-format) to a virtual speaker array whose outputs are recorded virtually by a selected secondary virtual coincidence or separate microphone array see Fig. 2. In this way, the described process represents a virtual re-recording of the original sound field where the choice of microphone array can be postponed to the post-processing in a similar way to current coincident methods , described e.g. in [3] [7], but where many degrees of freedom are offered because even separate arrangements can be chosen. In particular, this allows for a substantially stabilized frontal sound image and a larger listening area. The indisputable technical advantages of B-format are maintained (including, for example, the possibility of monocompatibility, arbitrary rotation or other sound tent transformations) because the original B-format is retained or can be recreated from L- format. In cases where the secondary virtual arrangement is not coincidental, of course the reworked signals cannot be identical to those that would have been recorded directly with the corresponding physical arrangement. The process introduces certain artifacts consisting of additional lj extraction due to the round-receiving components of the primary virtual microphones, which follows directly from the description below, but these artifacts are generally perceived as more positive than negative compared to purely coincidental arrangements. Physically separated arrays always create comb filter effects, objectively an artifact but which is perceived by many to give a spatial sound. The described reworking process introduces additional chamber effects but not to such an extent that it negatively affects the listening experience. The final speaker playback, see Fig. 3, sounds more like the one that would have been created by a physically separated setup of the same type than the one created by a purely coincidental decoding such as e.g. ambisonic.

En ytterligare fördel med den föreliggande uppfinningen är att egenskaperna hos den slutgiltiga uppspelningen kan varieras i realtid genom att under lyssning variera både den primära virtuella mikrofonuppställningen och individuella mikrofonegenskaper, riktning och position, hos de sekundära virtuella mikrofonerna. På detta sätt erbjuds även ytterligare konstnärliga möjligheter vid efterbehandlingen, möjligheter som till sin natur är både mer vidsträckta och av en annan karaktär än de som erbjuds av nuvarande koincidenta tekniker.A further advantage of the present invention is that the characteristics of the final playback can be varied in real time by varying during listening both the primary virtual microphone array and individual microphone characteristics, direction and position, of the secondary virtual microphones. In this way, additional artistic possibilities are also offered in the finishing, possibilities which by their nature are both more extensive and of a different nature than those offered by current coincident techniques.

Uppfinningen kan även utnyttjas för att transformera mellan två godtyckliga separerade mikrofonuppställningar genom att först utföra en virtuell B-forrnat inspelning av de ursprungliga signalerna från den separerade uppställningen och sedan tillämpa uppfinningen på dessa B-forrnat signaler men p.g.a. vad som tidigare berörts kommer resultatet att bli av begränsad kvalitet eftersom de ursprungliga signalerna från den separerade uppställningen är för dekorrelerade.The array can also be used to transform between two arbitrary separated microphone arrays by first performing a virtual B-shaped recording of the original signals from the separated array and then applying the array to these B-shaped signals but due to as previously mentioned, the result will be of limited quality because the original signals from the separated array are too decorrelated.

På grund av vad som ovan angivits, innefattar det första utförandet av den föreliggande uppfinningen en bearbetningsanordning avsedd för bearbetning av riktningskodade ljudsignaler till ljudsignaler avsedda för uppspelning via högtalare till en lyssningsyta.Due to the above, the first embodiment of the present invention comprises a processing device intended for processing direction-coded audio signals into audio signals intended for playback via loudspeakers to a listening surface.

Således består anordningen av: ingångar för de riktningskodade ljudsignalema; primär matrisanordning; sammankopplingsanordning; sekundär matrisanordning; utgångar för efterföljande förstärkning och uppspelning av de bearbetade signalerna. Enligt en föredragen utformning består de riktningkodade ljudsignalerna av en eller flera av: inspelade B-forrnat signaler; artiñciellt skapade B-format signaler; mätta B-forrnat rumsimpulssvar; artificiellt skapade B-format rumsimpulssvar; inspelade B-forrnat-liknande signaler; artifieiellt skapade B-format liknande signaler; mätta B-format liknande rumsimpulssvar; artificiellt skapade B- format liknande rumsirnpulssvar. De riktningskodade B-format eller B-format liknande ljudsignalerna är sådana från huvudsakligen perfekt koincidenta mikrofoner bestående av minst en rundupptagande mikrofon och tre ortogonala figur-S mikrofoner. Företrädesvis kan de riktningskodade B-format ljudsignalerna vara begränsade till att bestå av rundupptagna och horisontella komponenter. De riktningskodade ljudsignalerna kan också bestå av B-format eller B-format liknande signaler som undergått en spatiell transform. Företrädesvis kan den primära matrisen innehålla linjära koefficienter med tecken aj, bf, c,- konfigurerade för att skapa individuella polära mikrofondirektiviteter från nämnda B-forrnat signaler; l0 15 20 25 30 35 786 11101) = hfUtfl/š WW) J" b/'COWWXÛU *f Cfsínßfifl YW) där m, bf, c, primära matriskoefficienter för beräkning av direktivitet hos primär virtuell mikrofon j; h, förstärkningsfaktor för primär virtuell mikrofon j; go,- den frontala axelns horisontella vinkel för syntetiserad primär mikrofon j ; n godtyckligt ljudsampelnurrimer.Thus, the device consists of: inputs for the direction-coded audio signals; primary matrix device; interconnecting device; secondary matrix device; outputs for subsequent amplification and playback of the processed signals. According to a preferred embodiment, the directionally coded audio signals consist of one or fl era of: recorded B-shaped signals; artificially created B-format signals; saturated B-shaped space impulse response; artificially created B-shaped space impulse responses; recorded B-shaped signals; artificially created B-format similar signals; saturated B-shaped similar spatial impulse responses; artificially created B-shaped similar spatial pulse responses. The direction-coded B-formats or B-formats similar to the audio signals are those from substantially perfectly coincident microphones consisting of at least one round-receiving microphone and three orthogonal figure-S microphones. Preferably, the directionally coded B-format audio signals may be limited to consist of busy and horizontal components. The directionally coded audio signals may also consist of B-format or B-format similar signals which have undergone a spatial transform. Preferably, the primary matrix may contain linear coefficients with characters aj, bf, c, - configured to create individual polar microphone directives from said B-shaped signals; l0 15 20 25 30 35 786 11101) = hfUt fl / š WW) J "b / 'COWWXÛU * f Cfsínß fifl YW) where m, bf, c, primary matrix coefficients for calculating directivity of primary virtual microphone j; h, primary gain factor virtual microphone j; go, - the horizontal angle of the front axle for synthesized primary microphone j; n arbitrary sound sample nurrimer.

Företrädesvis, O _ Företrädesvis är antalet (N) av primära virtuella mikrofoner och utgångar från den primära matrisen 2 3.Preferably, 0 _ Preferably, the number (N) of primary virtual microphones and outputs from the primary array 2 is 3.

Enigt en föredragen utformning väljes tidsfördröjningama, från de N virtuella högtalarna till centrum på den sekundära mikrofonuppställningen, till att vara huvudsakligen och i praktiken de samma.According to a preferred design, the time delays, from the N virtual speakers to the center of the secondary microphone array, are selected to be substantially and practically the same.

Den sekundära matrisen kan bestå av linjära koefñcienter med tecken, tidsfördröjningar och filtreringsanordningar som realiserar godtyckligt placerade och riktade, koincidenta eller ickekoincidenta sekundära virtuella mikrofoner av polär eller ickepolär typ där direktíviteten hos en polär typ beskrivs av F(0) = p + q cos(6l) där Ûär infallsvinkeln till en mikrofons frontala axel och där 0 5 p 5 l, p + q = l. En utformning kan innefatta styranordningar för att justera den primära matrisens koefficienter och på så sätt ändra de primära mikrofonemas typ. En styranordning kan innefattas för att justera koefficienter och tidtördröjningar hos den sekundära matrisen och på så sätt ändra typ, riktning, läge, filtrering och fördröjning för de sekundära virtuella mikrofonerna. De primära och sekundära matriserna kan vara integrerade.The secondary matrix may consist of linear coefficients with signs, time delays and alteration devices which realize arbitrarily placed and directed, coincidental or non-incidental secondary virtual microphones of polar or non-polar type where the directivity of a polar type is described by F (0) = p + q + q + q 6l) where Û is the angle of incidence of the frontal axis of a microphone and where 0 5 p 5 l, p + q = l. A design may include control devices for adjusting the coefficients of the primary matrix and thus changing the type of primary microphones. A control device may be included to adjust coefficients and time delays of the secondary matrix and thus change the type, direction, position, filtering and delay of the secondary virtual microphones. The primary and secondary matrices can be integrated.

Uppfinningen avser även en metod for bearbetning av en ljudsignal där riktningskodade ljudsignaler, via en primär matris vilken syntetiserar virtuella koincidenta mikrofoner, vilka omformar till temporära signaler vilka sänds till virtuella högtalare. Metoden innefattar att sända utsignalen från dessa virtuella högtalare till en sekundär matris vilken realiserar multipla koincidena eller ickekoincidenta virtuella polära eller ickepolära mikrofoner som på 10 20 25 30 så sätt bearbetas till multipla utgångssignaler för mono, stereo eller surroundmppspelning. De riktningkodade ljudsignalerna består av en eller flera av: inspelat B-fonnat; artificiellt skapat B-format; mätta B-format rumsimpulssvar; artificiellt skapade B-format rumsimpulssvar; inspelade B-format liknande signaler; artificiellt skapade B-format liknande signaler; mätta B- format liknande rumsimpulssvar; och artificiellt skapade B-format liknande rurnsimpulssvar.The invention also relates to a method for processing an audio signal in which direction-coded audio signals, via a primary matrix which synthesizes virtual coincident microphones, which convert into temporary signals which are transmitted to virtual speakers. The method comprises transmitting the output of these virtual speakers to a secondary array which realizes multiple coincidences or non-coincident virtual polar or non-polar microphones which are thus processed into multiple output signals for mono, stereo or surround recording. The directionally coded audio signals consist of one or more of: recorded B-form; artificially created B-format; saturated B-shaped space impulse responses; artificially created B-shaped space impulse responses; recorded B-format similar signals; artificially created B-format similar signals; measured B-shaped similar spatial impulse responses; and artificially created B-formats similar to runn impulse responses.

Uppfinningen avser även ett datorprogram, företrädesvis realiserat som en “plug-in”, för bearbetning av digitalt ljud, där riktningskodade ljudsignaler, via en primär matris vilken syntetiserar virtuella koincidenta mikrofoner, omfonnas till temporära signaler vilka sänds till virtuella högtalare. Programmet består av en procedur för att sända utsignalen av dessa virtuella högtalare till en sekundär matris vilken realiserar multipla koincidena eller ickekoincidenta virtuella polära eller ickepolära mikrofonsignaler anpassade för mono, stereo eller surround-uppspelning.The invention also relates to a computer program, preferably realized as a "plug-in", for processing digital sound, where direction-coded audio signals, via a primary matrix which synthesizes virtual coincident microphones, are converted into temporary signals which are transmitted to virtual speakers. The program consists of a procedure for transmitting the output of these virtual speakers to a secondary array which realizes multiple coincidences or non-coincident virtual polar or non-polar microphone signals adapted for mono, stereo or surround playback.

Uppfinningen avser även en datorprogramprodukt med en instruktionsuppsättning för bearbetning till digitalt ljud där riktningskodade ljudsígnaler, via en primär matris vilken syntetiserar virtuella koincidenta mikrofoner, bearbetas till temporära signaler vilka sänds till virtuella högtalare. lnstruktionsuppsättningen innefattar en procedur för att sända utsignalen av dessa virtuella högtalare till en sekundär matris vilken realiserar multipla koíncidena eller ickekoincidenta virtuella polära eller ickepolära mikrofonsignaler anpassade för efterföljande mono, stereo eller surround-uppspelning.The invention also relates to a computer program product with an instruction set for processing into digital sound where direction-coded audio signals, via a primary matrix which synthesizes virtual coincident microphones, are processed into temporary signals which are transmitted to virtual speakers. The instruction set includes a procedure for transmitting the output of these virtual speakers to a secondary array which realizes multiple coincidences or non-incidental virtual polar or non-polar microphone signals adapted for subsequent mono, stereo or surround playback.

Kortfattad beskrivning av figurerna Föreliggande uppfinning beskrivs mer detaljerad, med exempel på utforrrmingar, i de närslutna figurerna, där: Figur 1 visar ett översiktligt diagram över ett omarbetningssystem; Figur 2 visar ett översiktligt diagram av en 3 x 4 x 5 omarbetning for ITU surround, se Fig. 3; Figur 3 visar ett översiktligt diagram av surrounduppspelning för ITU surround; Figur 4 illustrerar tidsfördröjning av ljudsampel för enskilda sekundära virtuella mikrofoner på ett stort avstånd r från virtuella högtalare; 10 20 25 30 528 766 7 Figur 5 vinkeldefinitioner för 9,,- avseende sekundära virtuella mikrofoners direktivitet och för 12), avseende direktivitet för virtuella högtalare, exempel med i = 2 och j Figur 6 visar schematiskt huvudstegen i ett omarbetningssystem enligt uppfinningen.Brief Description of the Figures The present invention is described in more detail, with examples of embodiments, in the accompanying figures, in which: Figure 1 shows a general diagram of a reworking system; Figure 2 shows an overview diagram of a 3 x 4 x 5 rework for ITU surround, see Fig. 3; Figure 3 shows an overview diagram of surround playback for ITU surround; Figure 4 illustrates the time delay of audio samples for individual secondary virtual microphones at a large distance r from virtual speakers; 10 20 25 30 528 766 7 Figure 5 angular ions for 9 ,, - regarding the directivity of secondary virtual microphones and for 12), regarding directivity for virtual speakers, examples with i = 2 and j Figure 6 schematically shows the main steps in a reworking system according to the invention.

Detaljerad beskrivning av utföranden De följande exemplen avser att illustrera, men inte på något sätt begränsa, uppfinningen enligt kraven. Till exempel, kan uppfinningen lika väl använda sig av höjd-dimensionen (via Z- komponenten i B-format) men av praktiska skäl vad gäller högtalarinstallationer är exemplen enbart baserade på en rundupptagen komponent (W) och horisontella komponenter (X,Y).Detailed Description of Embodiments The following examples are intended to illustrate, but not in any way limit, the invention according to the claims. For example, the invention may just as well use the height dimension (via the Z component in B-format) but for practical reasons with respect to speaker installations, the examples are based only on a round component (W) and horizontal components (X, Y).

Exemplet använder dessutom det vanligen förekommande 5-kanals surroundystemet men skulle lika väl kunna använda t.ex. 6, 7 eller fler kanaler eller stereo.The example also uses the commonly used 5-channel surround system but could just as well use e.g. 6, 7 or fl are channels or stereo.

Figur l illustrerar ett surround bearbetningssystem (transcoding system) bestående av: ingångsanordning (1), primär matrisanordning (2), virtuella högtalaringångar (3), sekundär matrisanordning (4), och virtuella mikrofonsignaler och utgångsanordning (S).Figure 1 illustrates a surround processing system (transcoding system) consisting of: input device (1), primary matrix device (2), virtual speaker inputs (3), secondary matrix device (4), and virtual microphone signals and output device (S).

Bearbetningen för lTU surround, vilken illustreras i Fig. 2, består av: W,X,Y ingångssignaler (6), primär matrisanordning (7), syntetiserad primär mikrofondirektiviet (8), sekundär primär matrisanordning (9), virtuella högtalare (10), sekundär virtuell mikrofon (1 1), surround utgång (12), och koordinatsystemets origo (13).The processing for lTU surround, which is illustrated in Fig. 2, consists of: W, X, Y input signals (6), primary matrix device (7), synthesized primary microphone directive (8), secondary primary matrix device (9), virtual speakers (10) , secondary virtual microphone (1 1), surround output (12), and the origin of the coordinate system (13).

Den slutliga uppspelningen via en högtalaruppställning för surround, efter lämplig förstärkning, exemplifierad med en lTU-uppställning illustreras i Fig. 3: lyssningsrum (14), verkliga fysiska uppspelningshögtalare (15), ingångar från (12):(16), central lyssningsposition (17), och lyssningsyta (18).The final playback via a surround speaker array, after appropriate amplification, exemplified by an LCD array, is illustrated in Fig. 3: listening room (14), real physical playback speakers (15), inputs from (12) :( 16), central listening position ( 17), and listening area (18).

Utgångskanalerna från den primära matrisen (7) skapas av N primära koincidenta virtuella mikrofoner (8) syntetiserade från inkommande W,X,Y (6), och är anslutna till N virtuella högtalare (10), typiskt horisontellt placerade ekvidistant på en typiskt stor radie r, se Fig. 2.The output channels from the primary array (7) are created by N primary coincident virtual microphones (8) synthesized from incoming W, X, Y (6), and are connected to N virtual speakers (10), typically horizontally placed equidistant at a typically large radius r, see Fig. 2.

Om luftabsorption försurnmas, och förutom en gemensam utbredningskonstant och tidsfórdröjning, kan ingångssignalen till virtuell högtalare j approximativt beskrivas av: uj-(n) = h,-( afl/š W(n) + bjcos(ç1j)X(n) + c,- sin(çq-) Y(n)) (Ekv. 1) där 10 l5 20 25 30 528 706 8 n godtyckligt ljudsampelnumrner uJ-(n) ljudsampel n för virtuell högtalare j, (uJ-signalema kallas här L-format) N antal primära virtuella mikrofoner eller högtalare, N 2 3. N = 4 ger den mest praktiska användningen med hög kanalseparation. j index for primär virtuell mikrofon och virtuell högtalare, 1 S j S N h] variabel forstärkningsfaktor för primär virtuell mikrofon j, typiskt h,- = 1 W(n) B-format W ljudsampel n (traditionellt är en W-signal den från en rundupptagande mikrofon dividerad med faktorn Ö , i annat fall utgår denna faktor från Ekv. 1) X(n) B-format X ljudsampel n (signal från en frontalt riktad figur-S mikrofon) Y(n) B-format Y ljudsampel n (signal från en lateralt till vänster riktad figur-S mikrofon) aj, 11,-, cj primära matriskoefficienter for beräkning av matning till virtuell högtalare j: Typiskt: N = 4 och för hög kanalseparation a,- = 0.25, b,- = cj = 0.75 motsvarande syntetiserade primära hyperkardioid mikrofoner (p, den horisontella vinkeln från origo (13) till varje individuell virtuell högtalare (10), och även vinkeln mellan den frontala axeln hos motsvarande syntetiserad primär polär mikrofon (8), där visad som 21: (j - 1)/N radianer och där en alternativ realisering är 21: (j - 1/2)/N radianer.If air absorption is acidified, and in addition to a common propagation constant and time delay, the input signal to virtual speaker j can be approximately described by: uj- (n) = h, - (a fl / š W (n) + bjcos (ç1j) X (n) + c , - sin (çq-) Y (n)) (Eq. 1) where 10 l5 20 25 30 528 706 8 n arbitrary sound sample numbers uJ- (n) sound sample n for virtual speakers j, (the uJ signals are called here L-format ) N number of primary virtual microphones or speakers, N 2 3. N = 4 provides the most practical use with high channel separation. j index for primary virtual microphone and virtual speaker, 1 S j SN h] variable gain for primary virtual microphone j, typically h, - = 1 W (n) B-format W sound sample n (traditionally a W signal is that of a round recording microphone divided by the factor Ö, otherwise this factor is based on Equ. 1) X (n) B-format X sound sample n (signal from a frontally directed figure-S microphone) Y (n) B-format Y sound sample n ( signal from a laterally to the left-facing figure-S microphone) aj, 11, -, cj primary matrix coefficients for calculation of feed to virtual speaker j: Typically: N = 4 and for high channel separation a, - = 0.25, b, - = cj = 0.75 corresponding to the synthesized primary hypercardioid microphones (p, the horizontal angle from the origin (13) to each individual virtual speaker (10), and also the angle between the frontal axis of the corresponding synthesized primary polar microphone (8), where shown as 21: ( j - 1) / N radians and where an alternative realization is 21: (j - 1/2) / N radians .

De resulterande samplade utgångssignalerna skapade i den sekundära matrisen (i fort- sättningen kallad M-kanal), för sekundär virtuell mikrofon i (11), för stora r, som ett resultat av en summering av utsignaler från varje horisontellt placerad virtuell högtalare, förutom en gemensam konstant faktor, är approximativt: N an) i gfZ ur” - 01,- e» fi» 1=1 (Ekv. 2) där e,~(n) ljudsampel n fiir sekundär virtuell mikrofonsignal i (12) i index för sekundär virtuell mikrofon, 1 S i S M 15 20 25 30 fš Co 528 706 9 antal sekundära virtuella mikrofoner, M 2 1.The resulting sampled output signals created in the secondary matrix (hereinafter referred to as M-channel), for secondary virtual microphone i (11), for large r, as a result of a summation of output signals from each horizontally placed virtual speaker, except a common constant factor, is approximately: N an) i gfZ ur ”- 01, - e» fi »1 = 1 (Eq. 2) where e, ~ (n) sound sample n fi ir secondary virtual microphone signal i (12) in index for secondary virtual microphone, 1 S in SM 15 20 25 30 fš Co 528 706 9 number of secondary virtual microphones, M 2 1.

Exempel: M = 5 för ITU surround, M = 2 for stereo, M = 1 för mono variabel förstärkningsfaktor for sekundär virtuell mikrofon i positiv eller negativ ljudsampel fördröjning (tidsfórdröjning) för sekundär virtuell mikrofon i (1 1) från virtuell högtalare j (10) trunkerad till närmaste heltalsvärde (å) = 0 for sekundära virtuella mikrofoner placerad i origo (13)), se Fig. 4 för exempel med i = 1 där (19) anger virtuell högtalare och (20) sekundär virtuell mikrofon. ”Fractional delay” tekniker kan användas som en alternativ utformning. samplingsfrekvens, Hz ljudhastigheten i luft, m/s ytterligare positiv tidsfordröj ning för sekundär virtuell mikrofon i trunkerad till närmaste heltalsvärde. ”Fractional delay” tekniker kan användas som en alternativ utformning. ideal forsta-ordnings polär direktivitet hos sekundär virtuell mikrofon i evaluerad i riktning mot virtuell högtalare j : FU = pi + q,- cos(i9,)) (Ekv. 3) Simulering av verkliga mikrofonegenskaper via ÛÜ--beroende filter kan användas som en alternativ utformning (en fysisk kardioid är inte en kardioid vid alla frevenser).Example: M = 5 for ITU surround, M = 2 for stereo, M = 1 for mono variable gain for secondary virtual microphone in positive or negative sound sample delay (time delay) for secondary virtual microphone i (1 1) from virtual speaker j (10 ) truncated to the nearest integer value (å) = 0 for secondary virtual microphones placed in the origin (13)), see Fig. 4 for example with i = 1 where (19) indicates virtual speaker and (20) secondary virtual microphone. Fractional delay techniques can be used as an alternative design. sampling frequency, Hz the speed of sound in air, m / s additional positive time delay for secondary virtual microphone in truncated to the nearest integer value. Fractional delay techniques can be used as an alternative design. ideal first-order polar directivity of secondary virtual microphone in evaluated in the direction of virtual speaker j: FU = pi + q, - cos (i9,)) (Equ. 3) Simulation of real microphone properties via ÛÜ - dependent filter can be used as an alternative design (a physical cardioid is not a cardioid at all frequencies).

Ekv. 3 ändras då huvudsakligen till: Ûjlf) = Fiffi + qiff) COSWIJ) (Ekv. 4) lckepolära godtyckliga direktiva sekundära syntetiserade virtuella mikrofoner kan användas som en alternativ utformning. frekvens, Hz viktfaktorer för sekundära virtuella polära mikrofoner, 0 S p; S 1, p,- + qi = I horisontell vinkel mellan den frontala axeln hos sekundär virtuell mikrofon i (23) och en vektor från sekundär virtuell mikrofon i till virtuell högtalare j (21), se Fig. 5 för ett 20 25 30 528 TfÜâ 10 exempel med j = 1 och i = 2.Eq. 3 is then mainly changed to: Ûjlf) = Fiffi + qiff) COSWIJ) (Eq. 4) lckepolar arbitrary directives secondary synthesized virtual microphones can be used as an alternative design. frequency, Hz weighting factors for secondary virtual polar microphones, 0 S p; S 1, p, - + qi = At a horizontal angle between the frontal axis of the secondary virtual microphone i (23) and a vector from the secondary virtual microphone i to the virtual speaker j (21), see Fig. 5 for a 528 TfÜâ 10 examples with j = 1 and i = 2.

En egenskap hos den här utformningen är att om den sekundära virtuella mikrofon- uppställningen är en ideal B-forrnat mikrofon (M = 3, g.- = 1 0011 8: = 0 för i = 1 till M) placerad i origo (å-J- = O), och för åtminstone N = 4, çoj = 21t (i - U/N, Oßh h) = 1 föff "_" 1 tm N, så kan de ursprungliga W-, X~ och Y-signalerna återskapas exakt från L-fonnat, t.ex. om: 01:02 =ü3=G4=G>fÜ och bj=Cj=C#Û via följande samband: e1(n) = (sekundär virtuell mikrofon är rundupptagande: p , = I, q; = 0) = 4 = Z a, Wmflš =4 aßvr/(n) j=l => Wm) = mi) (4 aJš yl (Ekv- 7) 6201) = (sekundär virtuell mikrofon är figur-S i positiv x-riktning: p; = 0, q; = l) = = i (ajWU/z) Ja + bJ-cosüpj) X(n) + c, sin(ço,-) Y(n)) COS(9zj) = 20 XW) => Xm) = 6201) (2 cyl (Ekv- 8) e 3(n) = (sekundär virtuell mikrofon är figur~8 i positiv y-rikming: pi = 0, q; = 1) = = i (a_,W(n) J; + bj cos(çq) X(n) + cj sin(çßj) Y(n)) cos(63,-) = 2c Y(n) 1=1 => m) = 2301) (2 fy* (Ekv- 9) Numeriskt exempel med hyperkardioid L-format (a = 0.25 , c = (175): Wm) = ernyiš (Ekv. 10) X(n) == e2(n) /1.5 (Ekv. 11) Y(n) = e3(n) /1.5 (Ekv. 12) dvs., det ursprungliga B-formatet kan helt enkelt återskapas via skalning av de sekundära virtuella mikrofonsignalerna. 10 l5 20 25 30 35 01 š\J 'CS *<2 'S23 CK 11 En tillämpning av den ovannämnda egenskapen är att använda N-kanals L-forrnatet (uj) som ett distributionsformat från vilket många M-kanals surroundformat kan skapas, men som även tillåter återskapande av det ursprungliga B-formatet i de fall där t.ex. en arnbisonic- avkodning [5] önskas eller då det riktningskodade ljudfältet ska förbehandlas t.ex. via B- format transfonner [5], innan slutlig avkodning för högtalaruppspelning. Följande transformationer är därför möjliga: B-format <-> L-format -> en mångfald M-kanals uppställningar (för mono, stereo och surround) där: e» indikerar exakt framåt- och bakåt- transform -> indikerar framåt-transform enbart Exempel på användbara omarbetningar till stereo (M = 2) är med de virtuella sekundära rnikrofonerna konfigurerade som ORTF, NOS, RAI, DIN eller ”spaced omni” [l].A feature of this design is that if the secondary virtual microphone array is an ideal B-shaped microphone (M = 3, g.- = 1 0011 8: = 0 for i = 1 to M) placed in the origin (å- J- = O), and for at least N = 4, çoj = 21t (i - U / N, Oßh h) = 1 f exactly from L-shaped, e.g. if: 01:02 = ü3 = G4 = G> fÜ and bj = Cj = C # Û via the following relationship: e1 (n) = (secondary virtual microphone is recording: p, = I, q; = 0) = 4 = Z a, Wm fl š = 4 aßvr / (n) j = l => Wm) = mi) (4 aJš yl (Ekv- 7) 6201) = (secondary virtual microphone is figure-S in positive x-direction: p; = 0, q; = l) = = i (ajWU / z) Ja + bJ-cosüpj) X (n) + c, sin (ço, -) Y (n)) COS (9zj) = 20 XW) => Xm ) = 6201) (2 cyl (Ekv- 8) e 3 (n) = (secondary virtual microphone is fi gur ~ 8 in positive y-direction: pi = 0, q; = 1) = = i (a_, W (n ) J; + bj cos (çq) X (n) + cj sin (çßj) Y (n)) cos (63, -) = 2c Y (n) 1 = 1 => m) = 2301) (2 fy * (Eq- 9) Numerical example with hypercardioid L-format (a = 0.25, c = (175): Wm) = ernyiš (Eq. 10) X (n) == e2 (n) /1.5 (Eq. 11) Y (n) = e3 (n) /1.5 (Equ. 12) ie, the original B-format can simply be recreated via scaling of the secondary virtual microphone signals. 'S23 CK 11 An application of the above property is to use the N-channel L-format (uj) as a distribution form food from which many M-channel surround formats can be created, but which also allows reproduction of the original B-format in cases where e.g. an arnbisonic decoding [5] is desired or when the direction-coded sound field is to be pretreated e.g. via B-format transphones [5], before final decoding for loudspeaker playback. The following transformations are therefore possible: B-format <-> L-format -> a variety of M-channel setups (for mono, stereo and surround) where: e »indicates exact forward and backward transform -> indicates forward-transform only Examples of useful rework to stereo (M = 2) are with the virtual secondary microphones configured as ORTF, NOS, RAI, DIN or spaced omni [1].

Uppfinningen enligt kraven tar inte upp problemet med uppspelning via en högtalarupp- ställning som skiljer sig från ITU-rekommendationen [l l], men erbjuder en möjlighet att välja en sekundär virtuell mikrofonuppställning som ger ett resultat som är mindre beroende av exakt högtalaruppställning eller som är skapad för en annan uppställning.The requirement according to the requirements does not address the problem of playback via a speaker array that differs from the ITU recommendation [ll], but offers an option to select a secondary virtual microphone array that gives a result that is less dependent on the exact speaker array or that is created for another lineup.

De primära matrisekvationerna (Ekv. 1) är baserade på känd teknik och är intimt förknippade med ambisonics [5] men användandet av en primär (avkodnings-) matris motsvarande hyperkardioid L-format, analyserad enligt ambisonic-teori, resulterar i en hastighetsvektor (velocity vector) V, överdriven i förhållande till energivektorn (energy vector) E, och är därför inte användbar för en ambisonic-avkodning eftersom ambisonic-teorin stipulerar ry = l för alla kodade infallsvinklar samt rg = konstant för alla vinklar och maximerad mot l [5]. För en avkodningsmatris som motsvarar hyperkardioid-signaler (a,- = 0.25, b, = 0.75) för N = 4, blir ry = 1.5 medan rg = 0.5. Som kontrast, en ambisonic-avkodning för en kvadratisk högtalaruppställning ger ry = 1.0 (vilket stipuleras av ambisonic-teorin) medan rg blir = 0.75 med användande av a,- = 0.333 and b) = 0.667. Det måste understrykas att, till skillnad från ambisonic, så är L-format inte en psykoakustisk avkodning, som försöker ta hänsyn till aspekter av människans hörsel och vars mål är direkt högtalaruppspelning, utan representerar istället temporära signaler anpassade för virtuell återinspelning av det ursprungliga ljudfaltet och de sekundära virtuella mikrofonerna registrerar inte enbart energi utan ljudtryck inklusive fas. Användandet av separerade virtuella mikrofoner gör det omöjligt att karakterisera det slutliga resultatet i ambisonic-termer eftersom den teorin bygger på koincidenta mikrofoner. lO 15 20 25 30 \ 5,- 7.9 t C 12 Hur psykoakustiskt relevant och estetisk den slutgiltiga uppspelning av e; signalerna (12) via en vald högtalaruppställning (typiskt lTU, se Fig. 3) är, beror till hög grad på egenskaperna hos den sekundära virtuella mikrofonuppställningen samt den använda högtalaruppställningen, och till lägre grad på L-format, på ett liknade sätt som om en verklig separerad mikrofonuppställning av samma typ hade använts för att spela in det ursprungliga ljudfaltet. Värt att notera är att för de fall där en arnbisonic-avkodning är att föredra gör användandet av B-format att den möjligheten fortfarande lämnas öppen.The primary matrix equations (Eq. 1) are based on prior art and are intimately associated with ambisonics [5] but the use of a primary (decoding) matrix corresponding to hypercardioid L-format, analyzed according to ambisonic theory, results in a velocity vector vector) V, exaggerated in relation to the energy vector E, and is therefore not useful for ambisonic decoding because the ambisonic theory stipulates ry = l for all coded angles of incidence and rg = constant for all angles and maximized against l [5 ]. For a decoding matrix corresponding to hypercardioid signals (a, - = 0.25, b, = 0.75) for N = 4, ry = 1.5 while rg = 0.5. In contrast, an ambisonic decoding for a square speaker array gives ry = 1.0 (which is stipulated by the ambisonic theory) while rg becomes = 0.75 using a, - = 0.333 and b) = 0.667. It must be emphasized that, unlike ambisonic, L-format is not a psychoacoustic decoding, which seeks to take into account aspects of human hearing and whose goal is direct speaker playback, but instead represents temporary signals adapted for virtual re-recording of the original sound field and the secondary virtual microphones not only record energy but also sound pressure including phase. The use of separated virtual microphones makes it impossible to characterize the final result in ambisonic terms because that theory is based on coincidental microphones. lO 15 20 25 30 \ 5, - 7.9 t C 12 How psychoacoustically relevant and aesthetic is the final playback of e; the signals (12) via a selected speaker array (typically lTU, see Fig. 3) are, depends largely on the characteristics of the secondary virtual microphone array and the speaker array used, and to a lesser extent on L-format, in a manner similar to an actual separated microphone array of the same type had been used to record the original sound field. It is worth noting that in cases where arnbisonic decoding is preferred, the use of B-format means that this possibility is still left open.

Således är huvudstegen i en metod enligt en föredragen utformning sammanfattade i ett blockdiagram enligt Fig. 6. I ett första steg, via den primära matrisen (25), syntetiseras av de riktningkodade ljudsignalerna (24) virtuella koincidenta polära mikrofoner vidare kodade som temporära signaler avsedda att användas som matningssignaler till virtuella högtalare (26). l ett andra steg, matas utsignalen från de virtuella högtalarna via en sekundär matris (27) vilken realiserar multipla koincidenta eller ickekoincidenta sekundära virtuella polära eller iekepolära mikrofoner. De multipla utgângskanalema (28) lämpar sig för högtalaruppspelning av mono, stereo eller surroundljud.Thus, the main steps of a method according to a preferred embodiment are summarized in a block diagram according to Fig. 6. In a first step, via the primary matrix (25), virtual coincident polar microphones are further synthesized by the direction-coded sound signals (24) coded as temporary signals intended to be used as input signals to virtual speakers (26). In a second step, the output of the virtual speakers is fed via a secondary array (27) which realizes multiple coincidental or non-incidental secondary virtual polar or non-polar microphones. The multiple output channels (28) are suitable for speaker playback of mono, stereo or surround sound.

Som tillägg till de ovan beskrivna utformningarna kan ytterligare exempel, tillämpbara i godtyckliga kombinationer, inkludera: Exempel 1: Ett avståndsberoende från de virtuella högtalarna kan inkluderas så att tids- fördröj ningarna öv istället beräknas som: 5,1. = dUfs/CO (Ekv. 13) d, = (xj. _ x,)2 + y, _ y, 2 (Ekv. 14) där x, x-läge för virtuell högtalare j y,- y-läge för virtuell högtalare j x, X-läge för sekundär virtuell mikrofon i y,- y-läge for sekundär virtuell mikrofon i Exempel 2: Den geometriska spridningen från varje enskild virtuell högtalare kan tas hänsyn till under antagande av att dessa uppträder som punktkällor. Ekv. 2 lyder då istället: 10 15 20 25 30 35 528 705 13 N 2:01) = 8:2 14101 - å;- Sf) »Fry/dy (Ekv. 15) J=l Exempel 3: De primära virtuella mikrofonema kan vara av olika typ, en användbar variant är t.ex. att låta den bakåtriktade mikrofonen (i = 3 i exemplet ovan och i Fig. 2) istället vara en kardioid (a, = 0.5, bj = cj- = 0.5) eftersom ljud infallande rakt framifrån då inte kommer att vara närvarande i u3.In addition to the designs described above, further examples, applicable in arbitrary combinations, may include: Example 1: A distance dependence from the virtual speakers may be included so that the time delays above are instead calculated as: 5.1. = dUfs / CO (Equ. 13) d, = (xj. _ x,) 2 + y, _ y, 2 (Equ. 14) where x, x mode for virtual speakers jy, - y mode for virtual speakers jx, X mode for secondary virtual microphone iy, - y mode for secondary virtual microphone in Example 2: The geometric spread from each individual virtual speaker can be taken into account assuming that these act as point sources. Eq. 2 then reads instead: 10 15 20 25 30 35 528 705 13 N 2:01) = 8: 2 14101 - å; - Sf) »Fry / dy (Eq. 15) J = l Example 3: The primary virtual microphones can be of different type, a useful variant is e.g. to let the rearward-facing microphone (i = 3 in the example above and in Fig. 2) instead be a cardioid (a, = 0.5, bj = cj- = 0.5) because sound incident directly from the front will then not be present in u3.

Exempel 4: De virtuella högtalarna kan använda direktiviteter Gj, så att nivån vid sekundära virtuella mikrofoner placerade långt från en virtuell högtalares axel kommer att sänkas, se Fig. 5, där (21) är en virtuell högtalare, (22) en sekundär virtuell mikrofon, och (23) en sekundär virtuell mikrofons axel. Ekv. 2 lyder då istället: N 9:07) = gr Z ”Ä” ' 511' Ei) Gjtfßjr) F11/ di] f=l (Ekv. 16) Exempel 5: För vissa applikationer kan det vara fördelaktigt att använda olika metoder för omarbetning av låga och höga frekvenser eftersom människans hörsel har olika egenskaper under och över cza 500 Hz (huvudstorlek i förhållande till ljudets våglängd). För att åstadkomma detta med den presenterade uppfinningen kan två av de här beskrivna omformarna användas parallellt. Ingångama (1) hos den första omformaren matas med riktningskodade lågpassfiltrerade signaler och ingångama (1) hos den andra omformaren matas med hö gpassñltrerade signaler. Den första omformaren använder primära och sekundära matriser vilkas inställningar är optimerade eller anpassade för placering av lågfrekvent ljud medan den andra omformaren använder matriser optimerade eller anpassade för placering av högfrekvent ljud. Delníngsfrekvensen kan bero av tillämpningen men ligger typiskt mellan 300 och 700 Hz. Utgångarna (4) från båda omformarna summeras och bildar nya signaler för hö gtalaruppspelning och Iyssning.Example 4: The virtual speakers can use directivities Gj, so that the level of secondary virtual microphones placed far from the axis of a virtual speaker will be lowered, see Fig. 5, where (21) is a virtual speaker, (22) a secondary virtual microphone , and (23) the axis of a secondary virtual microphone. Eq. 2 then reads instead: N 9:07) = gr Z "Ä" '511' Ei) Gjtfßjr) F11 / di] f = l (Eq. 16) Example 5: For some applications it may be advantageous to use different methods for reprocessing of low and high frequencies because human hearing has different properties below and above cza 500 Hz (main size in relation to the wavelength of sound). To achieve this with the presented invention, two of the converters described here can be used in parallel. The inputs (1) of the first converter are fed with direction-coded low-pass signals and the inputs (1) of the second converter are fed with high-pass signals. The first converter uses primary and secondary matrices whose settings are optimized or adapted for placement of low-frequency sound, while the second converter uses matrices optimized or adapted for placement of high-frequency sound. The crossover frequency may depend on the application but is typically between 300 and 700 Hz. The outputs (4) from both inverters are summed and form new signals for speaker playback and listening.

Exempel 6: Ett användbart altemativ till direkt inspelning i B-format av musik eller andra uppträdanden är att mäta, eller skapa artificiella, B-format rumsimpulssvar via en av många tillgängliga mätmetoder för impulssvar (”Maximum Length Sequence”, frekvenssvep etc.).Example 6: A useful alternative to direct B-format recording of music or other performances is to measure, or create artificial, B-format room impulse responses via one of many available impulse response measurement methods ("Maximum Length Sequence", frequency sweep, etc.).

När dessa B-format impulssvar faltas med torrt inspelad musik kommer de skapade ljud- signalerna att vara huvudsakligen identiska med de signaler som hade spelats in om den torrt inspelade musiken hade spelats upp from samma högtalarposition som användes vid impulssvarsmätningen. Även B-format signaler som skapats på detta sätt kan användas med den presenterade uppfinningen men det är dessutom möjligt att använda uppfinningen direkt på B-format impulssvaren genom att se dessa som insignaler (1). Utsignalema från 10 14 omformaren blir då istället en ny uppsättning impulssvar som motsvarar de sekundära virtuella mikrofonerna. Den här tekniken är användbar for att skapa flera typer av flerkanal eller stereo impulssvar med syfte att användas for påläggning av efterklang, från samma mätta eller simulerade B-format rumsimpulssvar.When these B-format impulse responses are folded with dry recorded music, the generated audio signals will be substantially identical to the signals that would have been recorded if the dry recorded music had been played back from the same speaker position used in the impulse response measurement. B-format signals created in this way can also be used with the presented invention, but it is also possible to apply the invention directly to the B-format impulse responses by seeing these as input signals (1). The outputs from the converter then become instead a new set of impulse responses corresponding to the secondary virtual microphones. This technique is useful for creating multiple types of fl-channel or stereo impulse responses for use in reverberation, from the same measured or simulated B-shaped room impulse response.

Uppfinningen begränsas inte till de visade utformningama utan kan varieras på ett antal sätt utan att avvika från omfattningen av de bilagda kraven och anordningen och metoden kan realiseras på olika sätt beroende på tillämpning, funktionella enheter, behov och krav etc. [1] 10 [2] [3] 15 [4] 20 [5] [6] [7] 25 [3] 30 5 Referenser “Multichannel natural music recording principles based on psychoacoustic principles” Günther Thiele Utökad version av bidrag presenterat vid AES 19th International Conference, maj 2001 , httpz//wvvwirtde/IRT/F uE/as/mu1ti-rnr-ext.pdf US 4,042,779: COTNCIDENT MICROPHONE SIMULATION COVERING THREE DIMENSIONAL SPACE AND YIELDING VARIOUS DIRECTIONAL OUTPUTS Soundfield mikrofon/företag: Soundfield Ltd.The invention is not limited to the designs shown but can be varied in a number of ways without departing from the scope of the appended claims and the device and method may be realized in various ways depending on application, functional units, needs and requirements, etc. [1] 10 [2 ] [3] 15 [4] 20 [5] [6] [7] 25 [3] 30 5 References “Multichannel natural music recording principles based on psychoacoustic principles” Günther Thiele Extended version of contribution presented at AES 19th International Conference, May 2001, httpz // wvvwirtde / IRT / F uE / as / mu1ti-rnr-ext.pdf US 4,042,779: COTNCIDENT MICROPHONE SIMULATION COVERING THREE DIMENSIONAL SPACE AND YIELDING VARIOUS DIRECTIONAL OUTPUTS Soundfield microphone / company: Sound fi eld Ltd.

Charlotte Street Business Centre Wakefield, West Yorkshire, WFl lUH ENGLAND httpz//wvvwsoundfieldcouk US 4,086,433: SOUND REPRODUCTION SYSTEM WITH NON~SQUARE LOUDSPEAKER LAY-OUT US 5,757,927: SURROUND SOUND APPARATUS US 4,414,~430: DECODERS FOR FEEDING IRREGULAR LOUDSPEAKER ARRAYS McGriffy VVM mjukvara: David McGriffy 5208 Evans Ave.Charlotte Street Business Center Wake fi eld, West Yorkshire, WFl lUH ENGLAND httpz // wvvwsound fi eldcouk US 4,086,433: SOUND REPRODUCTION SYSTEM WITH NON ~ SQUARE LOUDSPEAKER LAY-OUT US 5,757,927: SURROUND SOUND APPARATER ~ 4,4, software: David McGriffy 5208 Evans Ave.

Austin, TX 78751 USA http://mcgriffy.com/audio/ambisonic/vvmic/ “The Quick Reference Guide to Multichannel Microphone Arrays. Part 1: using Cardioid Microphones” 25 Austin, TX 78751 USA http://mcgriffy.com/audio/ambisonic/vvmic/ “The Quick Reference Guide to Multichannel Microphone Arrays. Part 1: Using Cardioid Microphones ”25

[10] 1111 [10] 1111

[13] 16 M. Williams, G. le Dü. 110m AES preprint 5336, Amsterdam, The NETHERLANDS, maj 2001.[13] 16 M. Williams, G. le Dü. 110m AES preprint 5336, Amsterdam, The NETHERLANDS, May 2001.

Schalltechnik Dn-lng.Sound technology Dn-lng.

Schoeps GmbH Spitalstrasse 20 D-76227 Karlsruhe (Durlach) GERMANY vvwwschoepsde/E/kfrnlš60.html Holophone® A Division of Rising Sun Productions Ltd. 258 Adelaide Street East, Suite 200 Toronto, ON, MSA lNl CANADA wwwholophonecom “Multichannel surround sound systems and operations” AES Technical Document AESTD1001 .0.01-05, based on ITU-R BS.775-1 “Empirischer Verglecih von Mikrofoniemngsverfahren fur 5.0 surround” J. Roland, M. Fleischer, S. Fuhrmarin, B. Steiglitch, U. Reiter, H. Kutsbach See also http://wWw.stucLtu-ilmenau.de/~proverdi/index.html ORF/Hauptmilcrofon (listening test): “Classical Music in Radio and TV - a multichannel challenge. The ORF Surround Listening Test 2001” Florian Cramer and Christian Sodl, Austrian Broadcasting Cooperation.Schoeps GmbH Spitalstrasse 20 D-76227 Karlsruhe (Durlach) GERMANY vvwwschoepsde / E / kfrnlš60.html Holophone® A Division of Rising Sun Productions Ltd. 258 Adelaide Street East, Suite 200 Toronto, ON, MSA lNl CANADA wwwholophonecom “Multichannel surround sound systems and operations” AES Technical Document AESTD1001 .0.01-05, based on ITU-R BS.775-1 “Empirical Comparison of Microphone Surveillance Procedures for 5.0 Surround ”J. Roland, M. Fleischer, S. Fuhrmarin, B. Steiglitch, U. Reiter, H. Kutsbach See also http://wWw.stucLtu-ilmenau.de/~proverdi/index.html ORF / Hauptmilcrofon (listening test ): “Classical Music in Radio and TV - a multichannel challenge. The ORF Surround Listening Test 2001 ”Florian Cramer and Christian Sodl, Austrian Broadcasting Cooperation.

See also httpz//wwwhauptmikrofon.de/orfihtmSee also httpz // wwwhauptmikrofon.de / or fi htm

Claims (1)

1. 0 15 20 25 fv- Patentkrav . Ett arrangemang för behandling, företrädesvis för bearbetning från riktningskodade ljudsignaler i form av B-format (W,X,Y,Z ) eller B-format- liknande signaler till ljudsignaler reproducerbara via högtalare (10) över en lyssningsyta (18), kännetecknat av att sagda arrangemang innefattar: - ingångar for mottagning av riktningskodade lj udsignaler (1); - primär matrisanordning (2) anordnad för att skapa virtuella individuella mikrofondirektiviteter, - sammankopplingsanordning (3); - sekundär matrisanordning (4); och - utgångsanordning för efterföljande förstärkning och uppspelning av bearbetade ljudsignaler (5). . Arrangemang enligt krav l, vari sagda riktningskodade ljudsignaler innefattar en eller flera av: - inspelat B-forrnat (W,X,Y,Z ); - artificiellt skapat B-format; - mätta B-format rumsimpulssvar; - aztificiellt skapade B-format rumsimpulssvar; - inspelade B-format liknande signaler (W,X,Y,Z ); - artificiellt skapade B-fonnat liknade signaler; - mätta B-fonnat liknande rumsimpulssvar; - artificiellt skapade B-format liknande rumsimpulssvar. . Arrangemang enligt krav 2, vari sagda riktningskodade B-format eller B- formatliknande ljudsignaler härrör från ej perfekt koincidenta mikrofoner bestående av minst en rundupptagande mikrofon (W) och tre ortogonala figur-X l0 15 20 25 (fl va? GO '*~3 CD (j“\ mikrofoner (X,Y,Z). _ Arrangemang enligt antingen krav 2 eller 3, vari de riktningskodade ljudsignalerna innefattar B-fonnat signaler begränsade till rundupptagna (W) och horisontella (X,Y) komponenter. . Arrangemang enligt antingen krav 2, 3 eller 4, vari de riktningskodade ljudsignalema innefattar B-format eller B-format-likriande signaler vilka har undergått en spatiell transforrn. . Arrangemang enligt vilket som helst av kraven 2 - 5, vari den primära matrisanordningen (2) innefattar linjära koefñcienter med tecken aj, bj, c,- konfigurerade fór att skapa virtuella individuella mikrofondirektiviteter (8) erhållna från sagda B-format signaler; 11,01) = 11,4 61,45 Vr/(n) + b, 003% X0» + a, sinwj) 1101)) där aj, bj, cjprimära matriskoefficienter för beräkning av direktivitet för virtuell primär mikrofon j (8); h] variabel fórstärkningsfaktor for primär virtuell mikrofon j; (o, den frontala axelns horisontella vinkel för varje syntetíserad primär polär mikrofon (8); n godtyckligt ljudsampelnurnmer. . Arrangemang enligt krav 6, vari: OSajSKandbj=cj=K-aj; där K är en godtycklig positiv konstant. 10 15 20 25 8. 10. ll. 12. 13. 528 796 /f7 Arrangemang enligt krav 6 eller 7, vari antalet (N) av primära virtuella mikrofoner (8) och primära matrisutgångar (3) är 2 3. Arrangemang enligt vilket som helst av kraven 6 - 8, vari tidsfórdröjningen av signaler från de N virtuella högtalarna till origo (13) är väsentligen och i praktiken de samma. Arrangemang enligt vilket som helst av kraven 6 - 9, vari den sekundära matris- anordningen (4) innefattar linjära koefficienter med tecken, fordröjningar och filtreringsanordningar som realiserar godtyckligt placerade och riktade koincidenta och ickekoincidenta sekundära virtuella mikrofoner av varje polär typ med direktivititet F09) = p + q cos(0) där 9 är infallsvinkeln mot en mikrofons frontala axel och där 0 Sp S1,p + q = 1. Arrangemang enligt vilket som helst av kraven 6 - 9, vari den sekundära matris- anordningen (4) innefattar linjära koefficienter med tecken, fórdröjningar, och filtreringsanordningar som realiserar koincidenta eller ickekoincidenta sekundära virtuella mikrofoner av godtycklig ickepolär typ. Arrangemang enligt vilket som helst av kraven 6 - 1 1, vari kontrollanordningar är anordnade för justering av den primära matrisanordningens koefficienter (2) for att på så sätt förändra de primära virtuella mikrofontyperna. Arrangemang enligt vilket som helst av kraven 6 - 12, vari kontrollanordningar är anordnade fórjustering av koefficienter och fórdröjningar hos den sekundära matrisanordningen (4) och på så sätt förändra de sekundära virtuella mikrofonemas typ, riktning, position, ñltreringsanordning och fördröjning. 10 15 20 25 30 .B10 14. Arrangemang enligt vilket som helst av kraven 6 - 13, vari sagda primära och 15. 16. 17. 18. sekundära matriser är integrerade. En metod för bearbetning av ljud där riktningskodade ljudsignaler (24) i form av B-format (W,X,Y,Z ) eller B-forrnat-liknande signaler via en primär matris (25), . vilken syntetiserar virtuella koincidenta polära mikrofoner, omarbetas till temporära signaler vilka används som matning till virtuella högtalare (26), metoden innefattar matning av signalerna från sagda virtuella högtalare till en sekundär matris (27) vilken realiserar multipla koincidenta eller icke-koincidenta sekundära virtuella mikrofoner och på så vis omarbetas till multipla utgångar (28) passande för efterföljande högtalaruppspelning av mono, stereo eller surroundljud. En metod enligt krav 15, vari sagda riktningskodade ljudsignaler innefattar en eller flera av: - inspelat B-fonnat (W,X,Y,Z ); - artificiellt skapat B-format; - mätta B-format rumsimpulssvar; - artificiellt skapade B-format rumsimpulssvar; - inspelade B-fonnat liknande signaler (W,X,Y,Z ); - artificiellt skapade B-format liknade signaler; - mätta B-format likknande rumsimpulssvar; - artificiellt skapade B-forrnat liknande rumsimpulssvar. Metoden enligt vilket som helst av kraven 15 eller 16, van' sagda sekundära virtuella mikrofoner är en eller flera polära eller ickepolära typer. Ett datorprogram for bearbetning av riktningskodade ljudsignaler i form av B- forrnat (W,X,Y,Z ) eller B-format-liknande signaler till ett digitalt surroundljud där riktningskodade ljudsignaler, via en primär matris vilken syntetiserar virtuella l0 15 19. en ro se v, cr: ÖW polära mikrofoner, omarbetas till temporära signaler vilka används som matning till virtuella högtalare, varvid programmet innefattar en procedur för att mata signalema från virtuella högtalare via en sekundär matris vilken omarbetar till multipla kanaler motsvarande koincidenta eller icke-koincidenta sekundära polära eller icke-polära virtuella mikrofoner passande för efterföljande högtalaruppspelning av mono, stereo eller surroundljud. En datorläsbar produkt med en instruktionsuppsättriing for bearbetning från riktningskodade ljudsignaler i form av B-format (W,X,Y,Z ) eller B-format- liknande signaler till ett digitalt surroundljud där riktningskodade ljudsignaler, via en primär matris vilken syntetiserar virtuella polära mikrofoner, omarbetar till temporära signaler vilka används som matning till virtuella högtalare, instruktionsuppsättningen innefattar en procedur för att mata signalema från virtuella högtalare via en sekundär matris vilken omarbetar till multipla kanaler motsvarande koincidenta eller icke-koincidenta sekundära polära eller icke-polära virtuella mikrofoner passande för efterföljande högtalaruppspelning av mono, stereo eller surroundljud.1. 0 15 20 25 fv- Patent claim. An arrangement for processing, preferably for processing from direction-coded audio signals in the form of B-format (W, X, Y, Z) or B-format-like signals to audio signals reproducible via loudspeakers (10) over a listening surface (18), characterized by said arrangement comprising: - inputs for receiving direction-coded lj output signals (1); primary matrix device (2) arranged to create virtual individual microphone directives, - interconnection device (3); - secondary matrix device (4); and - output device for subsequent amplification and playback of processed audio signals (5). . Arrangement according to claim 1, wherein said direction-coded audio signals comprise one or more of: - recorded B-shaped (W, X, Y, Z); - artificially created B-format; - saturated B-shaped space impulse response; azti fi specially created B-shaped space impulse response; - recorded B-format similar signals (W, X, Y, Z); - artificially created B-shaped similar signals; - saturated B-shaped similar spatial impulse responses; - artificially created B-format similar to room impulse responses. . Arrangement according to claim 2, wherein said direction-coded B-format or B-format-like sound signals originate from non-perfectly coincident microphones consisting of at least one round-receiving microphone (W) and three orthogonal figure-X l0 15 20 25 (fl va? GO '* ~ 3 Arrangements according to either claim 2 or 3, wherein the directionally coded audio signals comprise B-shaped signals limited to round (W) and horizontal (X, Y) components. either claim 2, 3 or 4, wherein the directionally coded audio signals comprise B-format or B-format-like signals which have undergone a spatial transformation. linear coefficients with signs aj, bj, c, - configured to create virtual individual microphone directives (8) obtained from said B-format signals; 11,01) = 11,4 61.45 Vr / (n) + b, 003% X0 »+ a, sinwj) 1101)) where aj, bj, cjprimary matrix coefficients for calculating the directivity of the virtual primary microphone j (8); h] variable gain for primary virtual microphone j; (o, the horizontal angle of the frontal axis for each synthesized primary polar microphone (8); an arbitrary sound sample number. An arrangement according to claim 6, wherein: OSajSKandbj = cj = K-aj; where K is an arbitrary positive constant. Arrangement according to claim 6 or 7, wherein the number (N) of primary virtual microphones (8) and primary matrix outputs (3) is 2. Arrangement according to any one of the claims. 6 - 8, wherein the time delay of signals from the N virtual speakers to the origin (13) is substantially and practically the same Arrangement according to any one of claims 6 - 9, wherein the secondary matrix device (4) comprises linear coefficients with characters, delays and alteration devices realizing arbitrarily placed and directed coincidental and non-incidental secondary virtual microphones of any polar type with directivity F09) = p + q cos (0) where 9 is the angle of incidence towards the frontal axis of a microphone and where 0 Sp S1, p + q = 1 An arrangement according to any one of claims 6 to 9, wherein the secondary matrix device (4) comprises linear coefficients with signs, delays, and filtering devices realizing coincidental or non-coincidental secondary virtual microphones of any non-polar type. Arrangement according to any one of claims 6 - 1 1, wherein control devices are arranged for adjusting the coefficients (2) of the primary matrix device so as to change the primary virtual microphone types. Arrangement according to any one of claims 6 - 12, wherein control devices are arranged for adjusting the coefficients and delay of the secondary matrix device (4) and thus changing the type, direction, position, filtering device and delay of the secondary virtual microphones. Arrangement according to any one of claims 6 - 13, wherein said primary and 15. 16. 17. 18. secondary matrices are integrated. A method for processing sound in which direction-coded audio signals (24) in the form of B-format (W, X, Y, Z) or B-shaped signals via a primary matrix (25),. which synthesizes virtual coincidental polar microphones, is converted into temporary signals which are used as feed to virtual speakers (26), the method comprises feeding the signals from said virtual speaker to a secondary matrix (27) which realizes multiple coincidental or non-coincident secondary virtual microphones and thus reworked into multiple outputs (28) suitable for subsequent speaker playback of mono, stereo or surround sound. A method according to claim 15, wherein said direction-coded audio signals comprise one or more of: - recorded B-format (W, X, Y, Z); - artificially created B-format; - saturated B-shaped space impulse response; - artificially created B-shaped space impulse responses; - recorded B-shaped similar signals (W, X, Y, Z); - artificially created B-format similar signals; - saturated B-shaped similar spatial impulse responses; - artificially created B-shaped similar spatial impulse responses. The method according to any one of claims 15 or 16, wherein said secondary virtual microphones are one or more polar or non-polar types. A computer program for processing direction-coded audio signals in the form of B-shaped (W, X, Y, Z) or B-format-like signals into a digital surround sound in which direction-coded audio signals, via a primary matrix which synthesizes virtual see v, cr: ÖW polar microphones, converted into temporary signals which are used as feed to virtual speakers, the program comprising a procedure for feeding the signals from virtual speakers via a secondary matrix which converts to multiple channels corresponding to coincidental or non-incidental secondary polar or non-polar virtual microphones suitable for subsequent speaker playback of mono, stereo or surround sound. A computer-readable product with an instruction set for processing from direction-coded audio signals in the form of B-format (W, X, Y, Z) or B-format-like signals to a digital surround sound where direction-coded audio signals, via a primary matrix which synthesizes virtual polar microphones , converts to temporary signals which are used as input to virtual speakers, the instruction set comprises a procedure for feeding the signals from virtual speakers via a secondary matrix which converts to multiple channels corresponding to coincidental or non-coincidental secondary polar or non-polar virtual microphones suitable for subsequent speaker playback of mono, stereo or surround sound.
SE0402772A 2004-11-12 2004-11-12 Device and process method for surround sound SE528706C2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
SE0402772A SE528706C2 (en) 2004-11-12 2004-11-12 Device and process method for surround sound
PCT/SE2005/001659 WO2006052188A1 (en) 2004-11-12 2005-11-07 Surround sound processing arrangement and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
SE0402772A SE528706C2 (en) 2004-11-12 2004-11-12 Device and process method for surround sound

Publications (3)

Publication Number Publication Date
SE0402772D0 SE0402772D0 (en) 2004-11-12
SE0402772L SE0402772L (en) 2006-07-13
SE528706C2 true SE528706C2 (en) 2007-01-30

Family

ID=33488235

Family Applications (1)

Application Number Title Priority Date Filing Date
SE0402772A SE528706C2 (en) 2004-11-12 2004-11-12 Device and process method for surround sound

Country Status (2)

Country Link
SE (1) SE528706C2 (en)
WO (1) WO2006052188A1 (en)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9332372B2 (en) 2010-06-07 2016-05-03 International Business Machines Corporation Virtual spatial sound scape
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
US9648439B2 (en) * 2013-03-12 2017-05-09 Dolby Laboratories Licensing Corporation Method of rendering one or more captured audio soundfields to a listener
EP3933834A1 (en) 2013-07-05 2022-01-05 Dolby International AB Enhanced soundfield coding using parametric component generation
CN109756683A (en) * 2017-11-02 2019-05-14 深圳市裂石影音科技有限公司 Panorama audio-video method for recording, device, storage medium and computer equipment
CN109379694B (en) 2018-11-01 2020-08-18 华南理工大学 Virtual replay method of multi-channel three-dimensional space surround sound

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9211756D0 (en) * 1992-06-03 1992-07-15 Gerzon Michael A Stereophonic directional dispersion method
US6072878A (en) * 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
US20030191623A1 (en) * 2002-02-25 2003-10-09 Oak Technology, Inc. Computer system capable of executing a remote operating system

Also Published As

Publication number Publication date
WO2006052188B1 (en) 2006-12-28
SE0402772L (en) 2006-07-13
SE0402772D0 (en) 2004-11-12
WO2006052188A1 (en) 2006-05-18

Similar Documents

Publication Publication Date Title
TWI700687B (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding
US9584912B2 (en) Spatial audio rendering and encoding
EP2285139B1 (en) Device and method for converting spatial audio signal
KR100964353B1 (en) Method for processing audio data and sound acquisition device therefor
Coleman et al. Personal audio with a planar bright zone
KR102481338B1 (en) Method and apparatus for decoding stereo loudspeaker signals from a higher-order ambisonics audio signal
WO2012025580A1 (en) Method and device for enhanced sound field reproduction of spatially encoded audio input signals
JP2016052117A (en) Sound signal processing method and apparatus
CN109417676A (en) The device and method in each sound area are provided
EP2208363A1 (en) Focusing on a portion of an audio scene for an audio signal
GB2591066A (en) Spatial audio processing
KR102194515B1 (en) Subband spatial processing and crosstalk cancellation system for conferences
McCormack et al. Parametric spatial audio effects based on the multi-directional decomposition of ambisonic sound scenes
JP2024028527A (en) Sound field related rendering
WO2006052188A1 (en) Surround sound processing arrangement and method
Wiggins et al. AmbiFreeverb 2-Development of a 3D ambisonic reverb with spatial warping and variable scattering
DE102021200555B4 (en) Microphone and method for recording an acoustic signal
Zotter et al. Compact spherical loudspeaker arrays
CN112513982A (en) Spatial audio parameters
Hamdan et al. Weighted orthogonal vector rejection method for loudspeaker-based binaural audio reproduction
TWI834760B (en) Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding
WO2024036113A1 (en) Spatial enhancement for user-generated content
Politis et al. Overview of Time–Frequency Domain Parametric Spatial Audio Techniques
Pekonen Microphone techniques for spatial sound
Linkwitz A model for rendering stereo signals in the itd-range of hearing