NO175229B - - Google Patents

Info

Publication number
NO175229B
NO175229B NO893522A NO893522A NO175229B NO 175229 B NO175229 B NO 175229B NO 893522 A NO893522 A NO 893522A NO 893522 A NO893522 A NO 893522A NO 175229 B NO175229 B NO 175229B
Authority
NO
Norway
Prior art keywords
signals
channel
phase
amplitude
sound
Prior art date
Application number
NO893522A
Other languages
Norwegian (no)
Other versions
NO893522D0 (en
NO175229C (en
NO893522L (en
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US07/239,981 external-priority patent/US5046097A/en
Application filed filed Critical
Publication of NO893522D0 publication Critical patent/NO893522D0/en
Publication of NO893522L publication Critical patent/NO893522L/en
Publication of NO175229B publication Critical patent/NO175229B/no
Publication of NO175229C publication Critical patent/NO175229C/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/40Visual indication of stereophonic sound image

Description

Denne oppfinnelse vedrører en fremgangsmåte for å frembringe og lokalisere et tilsynelatende opprinnelsessted for en valgt lyd fra et elektrisk signal som tilsvarer den valgte lyd i en forutbestemt lokalisert posisjon hvor som helst innenfor et tredimensjonalt rom som inneholder en lytter ved å skille det elektriske signalet i respektive første og andre kanals signaler, å utføre fase- og amplitudeendring på et av nevnte første eller andre kanals signaler, og å tilføre nevnte første og andre kanals signaler til to lydtransdusere, samt et system for å kondisjonere et elektrisk signal for å frembringe og lokalisere en lydfølelsesmessig illusjon av et tilsynelatende opprinnelsessted for minst en valgt lyd fra det elektriske signal som tilsvarer den valgte lyd ved en forutbestemt og lokalisert posisjon som befinner segjinnenfor et tredimensjonalt rom som inneholder en lytter og ved å skille det elektriske signalet i respektive første og andre kanals signaler, å utføre fase- og amplitudeendring på et av nevnte første og andre kanals signaler, og å mate nevnte første og andre kanals signaler til to lydtransdusere. Ved slik behandling av et audiosignal tilsiktes at de resulterende lyder vil synes for lytteren å komme fra et sted som er et annet enn det faktiske stedet for høyttalerne. This invention relates to a method of generating and locating an apparent place of origin of a selected sound from an electrical signal corresponding to the selected sound at a predetermined localized position anywhere within a three-dimensional space containing a listener by separating the electrical signal into respective first and second channel signals, to perform phase and amplitude change on one of said first or second channel signals, and to supply said first and second channel signals to two audio transducers, as well as a system for conditioning an electrical signal to produce and locate a aural illusion of an apparent place of origin of at least one selected sound from the electrical signal corresponding to the selected sound at a predetermined and localized position located say within a three-dimensional space containing a listener and by separating the electrical signal into respective first and second channel signals , to perform phase and amplitude changes ing on one of said first and second channel signals, and feeding said first and second channel signals to two audio transducers. With such processing of an audio signal, it is intended that the resulting sounds will appear to the listener to come from a place other than the actual location of the speakers.

Mennesker som lytter er lett i stand til å bedømme retningen og avstanden til en lydkilde. Når flere lydkilder fordeles i rom rundt lytteren, kan posisjonen for hver oppfattes uavhengig og samtidig. Til tross for vesentlig og vedvarende forskning i mange år, har ingen tilfredsstillende teori ennå blitt utviklet for å ta i betraktning samtlige av de opp-fattelsesevner som er tilstede hos gjennomsnittslytteren. Human listeners are easily able to judge the direction and distance of a sound source. When several sound sources are distributed in space around the listener, the position of each can be perceived independently and simultaneously. Despite substantial and sustained research over many years, no satisfactory theory has yet been developed to take into account all of the perceptual abilities present in the average listener.

En prosess som måler trykket eller hastigheten av en lydbølge på et enkelt punkt, og gjengir den lyden effektivt ved et enkelt punkt, vil bevare forståeligheten av tale og meget av musikkens identitet. Ikke desto mindre fjerner et slikt system all den informasjon som behøves for å lokalisere lyden i rommet. Således blir et orkester som gjengis av et slikt system oppfattet som om alle instrumenter spilte på det ene gjengivelsespunktet. A process that measures the pressure or speed of a sound wave at a single point, and reproduces that sound effectively at a single point, will preserve the intelligibility of speech and much of the identity of music. Nevertheless, such a system removes all the information needed to localize the sound in the room. Thus, an orchestra reproduced by such a system is perceived as if all instruments were playing at the one reproduction point.

Anstrengelser blir derfor rettet mot å bevare de direktive anvendinger som befinner seg naturlig i lydene under sending eller opptak og gjengivelse. I US-patent 2 093 540 er vesentlige detaljer for et slikt to-kanals system gitt. Den kunstige understreking av forskjellen mellom stereokanalene som et middel for å utvide stereobildet, hvilket er basis for mange nåværende stereolydforbedringsteknikker, er beskrevet i detalj. Efforts are therefore aimed at preserving the directive uses that are naturally found in the sounds during transmission or recording and reproduction. In US patent 2,093,540, essential details for such a two-channel system are given. The artificial emphasis of the difference between the stereo channels as a means of expanding the stereo image, which is the basis of many current stereo sound enhancement techniques, is described in detail.

Visse kjente stereoforbedringssystemer baserer seg på krysskopling av stereokanaler på den ene eller annen måte, for å understreke de eksisterende anvisninger hva angår romlig sted som befinner seg i et stereoopptak. Krysskopling og dens motpart krysstalekansellering baserer seg begge på geometrien for høyttalerne og lytteområdet og må således individuelt justeres for hvert tilfelle. Certain known stereo enhancement systems rely on the cross-coupling of stereo channels in one way or another, in order to emphasize the existing indications of spatial location contained in a stereo recording. Crosstalk and its counterpart crosstalk cancellation are both based on the geometry of the speakers and the listening area and thus must be individually adjusted for each case.

Det er klart at forsøkte raffinementer i stereosystemet ikke har frembragt stor forbedring i de systemer som nå er i utstrakt bruk for underholdning. Virkelige lyttere liker å sitte komfortabelt, bevege eller dreie på sine hoder, og å anbringe sine høyttalere til å passe anvendeligheten av rommets utforming og til å passe inn med annet møblement. It is clear that attempted refinements in the stereo system have not produced much improvement in the systems now in widespread use for entertainment. Real listeners like to sit comfortably, move or turn their heads, and position their speakers to suit the utility of the room's layout and to blend in with other furnishings.

Av kjent teknikk skal nevnes US-patent 4152542 som vedrører en fire-kanals lydsystem, som er generelt kjent som kvadra-fonisk system, der det genereres en syntetisk, supplerende kanal fra de opprinnelige kodede transmisjonskanaler, hvilke involverer to opprinnelige kanaler. De syntetiske, supplerende kanaler har forutbestemt amplitude- og fasefor-hold som angir kilderetninger i forhold til de opprinnelig kodede transmisjonskanaler. De opprinnelige kanaler og de syntetiske kanaler dekodes til å danne et flertall av signaler. Dekodingen av de opprinnelige transmisjonskanaler og de syntetiske kanaler resulterer i et første sett av mer enn to høyttaler-presentasjonssignaler på forskjellige steder og et andre sett av presentasjonssignaler for å representere andre lyttings-rom retningsvinkler. De to sett av presentasjonssignaler blir så kombinert ved å addere signaler i det første settet med signaler i det andre settet for å tilveiebringe den passende flerhet av utgangssignaler. Således vil signalene fra de forskjellige kanaler bli blandet til å gi det resulterende signal. Of the prior art, mention should be made of US patent 4152542 which relates to a four-channel sound system, which is generally known as a quadraphonic system, where a synthetic, supplementary channel is generated from the original coded transmission channels, which involve two original channels. The synthetic supplementary channels have predetermined amplitude and phase relationships that indicate source directions in relation to the originally coded transmission channels. The original channels and the synthetic channels are decoded to form a plurality of signals. The decoding of the original transmission channels and the synthetic channels results in a first set of more than two speaker presentation signals at different locations and a second set of presentation signals to represent other listening room directional angles. The two sets of presentation signals are then combined by adding signals in the first set to signals in the second set to provide the appropriate plurality of output signals. Thus, the signals from the different channels will be mixed to give the resulting signal.

US-patent 4308424 vedrører et pseudo-stereosystem i hvilket et monauralt signal splittes og en kanal betjenes ved hjelp av en faseforsinkelse og amplitudeformingskrets. Den andre kanalen får volumet redusert slik at de to resulterende signaler ikke er ubehagelig høye. Amplituden justeres slik at den økes på de nedre frekvenser i forhold til et midtpunkt i systemets frekvensrespons og amplituden blir relativt redusert, ettersom frekvensene blir høyere og ettersom faseforskyvningen som påføres signalene beveger seg mot 180°. Faseforskyvning og amplitudestyring tilveiebringes av en resonansfilterløsning, der faseforskyvningen vil være kontinuerlig. US patent 4308424 relates to a pseudo-stereo system in which a monaural signal is split and one channel operated by means of a phase delay and amplitude shaping circuit. The second channel has its volume reduced so that the two resulting signals are not uncomfortably loud. The amplitude is adjusted so that it is increased at the lower frequencies relative to a midpoint in the system's frequency response and the amplitude is relatively reduced as the frequencies become higher and as the phase shift applied to the signals moves towards 180°. Phase shift and amplitude control are provided by a resonant filter solution, where the phase shift will be continuous.

Den europeiske patentsøknadspublikasjon 142213 vedrører et system for å generere pseudo-stereosignaler og omhandler å motta et monauralt signal og mate dette til et antall av forsinkelseslinjer som har minst to tappede utganger på forskjellige steder langs disse. En slik utmatning fra hver forsinkelseslinje mates tilbake til inngangen gjennom en attenuator eller et filter for å tilveiebringe etterklang, samt fungere som et kamfilter. De forskjellige tappede utganger blir så kombinert i to adderere for å resultere i et pseudo venstre og høyre stereosignal. I alle tilfeller blir de tappede utmatninger fra forsinkelseslinjene matet til to forskjellige adderere, slik at hver forsinkelseslinje har en del av sin kanal matet til den andre kanalen. European Patent Application Publication 142213 relates to a system for generating pseudo-stereo signals and relates to receiving a monaural signal and feeding this to a number of delay lines having at least two tapped outputs at different locations along them. Such an output from each delay line is fed back to the input through an attenuator or filter to provide reverberation, as well as act as a comb filter. The various tapped outputs are then combined in two adders to result in a pseudo left and right stereo signal. In all cases, the tapped outputs from the delay lines are fed to two different adders, so that each delay line has part of its channel fed to the other channel.

Således er det et formål ved den foreliggende oppfinnelse å tilveiebringe en fremgangsmåte og et system for å behandle et audiosignal slik at når det gjengis over to audiotransdusere kan det tilsynelatende stedet for lydkilden på passende måte styres, slik at det synes for lytterne som om stedet for lydkilden er atskilt fra stedet for transduserne eller høyttalerne. Thus, it is an object of the present invention to provide a method and system for processing an audio signal so that when it is reproduced over two audio transducers the apparent location of the sound source can be appropriately controlled so that it appears to listeners that the location of the sound source is separated from the location of the transducers or speakers.

Den foreliggende oppfinnelse er basert på den oppdagelse at monaural audiogjengivelsen under anvendelse av to uavhengige kanaler og to høyttalere kan frembringe meget lokaliserte bilder med stor klarhet i forskjellige posisjoner. Observa-sjon av dette fenomen fra oppfinnernes side, under spesiali-serte forhold i et opptaksstudio, førte til systematiske undersøkelser av forholdet som kreves for å frembringe denne audioillusjon. Noen års arbeid har frembragt en vesentlig forståelse av effekten, og evnen til å gjengi den konsekvent og etter ønske. The present invention is based on the discovery that the monaural audio reproduction using two independent channels and two loudspeakers can produce highly localized images with great clarity in different positions. Observation of this phenomenon by the inventors, under specialized conditions in a recording studio, led to systematic investigations of the conditions required to produce this audio illusion. A few years of work have produced a significant understanding of the effect, and the ability to reproduce it consistently and as desired.

Ifølge den foreliggende oppfinnelse blir en lydillusjon frembragt ved den innledningsvis nevnte fremgangsmåte, hvilken kjennetegnes ved trinnene: å koble nevnte første og andre kanals signaler til respektive lydprosessorer for å endre amplituden og forskyve fasen for begge av nevnte første og andre kanals signaler for suksessive diskrete frekvensbånd over audiospektrumet, med hver suksessive faseforskyvning forskjellig fra den foregående faseforskyvning i forhold til null grader, hvorved frembringes første og andre kanals modifiserte signaler for å skape et fasedifferensial og et amplitudedifferensial mellom de to kanalers modifiserte signaler, og å opprettholde den første kanalens signal separat og vekk fra den andre kanalens signal etter trinnet med endring av amplituden og forskyvning av fasen. According to the present invention, a sound illusion is produced by the initially mentioned method, which is characterized by the steps: connecting said first and second channel signals to respective sound processors to change the amplitude and shift the phase of both of said first and second channel signals for successive discrete frequency bands across the audio spectrum, with each successive phase shift different from the preceding phase shift relative to zero degrees, thereby producing first and second channel modified signals to create a phase differential and an amplitude differential between the two channels' modified signals, and to maintain the first channel signal separately and away from the other channel's signal after the step of changing the amplitude and shifting the phase.

Således kan en lydkilde anbringes hvor som helst i det tredimensjonale rom som omgir lytteren, uten begrensninger pålagt av høyttalerposisjoner. Flere lydbilder, fra uavhengige kilder og i uavhengige posisjoner, uten kjent grense hva angår deres antall, kan gjengis samtidig under anvendelse av de samme to kanaler. Gjengivelse krever ikke mer enn to uavhengige kanaler og to høyttalere, og separasjonsavstand eller rotasjon av høyttalerne kan varieres innenfor vide grenser uten å ødelegge illusjonen. Rotasjon av lytterens hode i et hvilket som helst plan, f.eks. for å "se på" bildet, forstyrrer ikke bildet. Thus, a sound source can be placed anywhere in the three-dimensional space surrounding the listener, without limitations imposed by speaker positions. Several sound images, from independent sources and in independent positions, with no known limit as to their number, can be reproduced simultaneously using the same two channels. Reproduction does not require more than two independent channels and two speakers, and the separation distance or rotation of the speakers can be varied within wide limits without destroying the illusion. Rotation of the listener's head in any plane, e.g. to "look at" the image, does not disturb the image.

Behandlingen av audiosignaler i henhold til den foreliggende oppfinnelse, skjer således ved behandling av et enkeltkanals audiosignal til å frembringe et to-kanals signal, der differensialfasen og amplituden mellom de to signalene justeres på en frekvensavhengig basis over hele lydspekteret. Denne behandling utføres ved å dele det monaurale inngangssignalet i to signaler og så føre et eller begge av slike signaler gjennom en overføringsfunksjon hvis amplitude og fase er, generelt, ikke-jevne funksjoner av frekvens. Overføringsfunksjonen kan involvere en signalinversjon og frekvensavhengig forsinkelse. Overføringsfunksjonene som anvendes kan ikke utledes fra noen i øyeblikket kjent teori, og de må derfor kjennetegnes ved hjelp av empiriske midler. Ever behandlingsoverføringsfunksjon plasserer et bilde i en enkel posisjon som bestemmes av overføringsfunksjonens karakteristika. Således blir lydkildeposisjonen entydig bestemt av transmisjonsfunksjonen. The processing of audio signals according to the present invention thus takes place by processing a single-channel audio signal to produce a two-channel signal, where the differential phase and amplitude between the two signals are adjusted on a frequency-dependent basis over the entire sound spectrum. This processing is performed by splitting the monaural input signal into two signals and then passing one or both of such signals through a transfer function whose amplitude and phase are, in general, non-smooth functions of frequency. The transfer function may involve a signal inversion and frequency dependent delay. The transfer functions used cannot be derived from any currently known theory, and they must therefore be characterized using empirical means. The Ever processing transfer function places an image in a simple position determined by the transfer function's characteristics. Thus, the sound source position is uniquely determined by the transmission function.

For en gitt posisjon kan der eksistere et antall forskjellige overfør ingsfunksj oner, hvor hver av disse vil være tilstrekkelig til å anbringe bildet generelt på den angitte posisjonen. For a given position, there may exist a number of different transfer functions, each of which will be sufficient to place the image generally at the indicated position.

Dersom et bevegelig bilde behøves, kan det frembringes ved jevnt å endre fra en overføringsfunksjon til en annen i rekkefølge. Således trenger en passende fleksibel realisering av prosessen ikke å være begrenset til produksjonen av statiske bilder. If a moving image is required, it can be produced by smoothly changing from one transfer function to another in sequence. Thus, a suitably flexible realization of the process need not be limited to the production of static images.

Audiosignaler som behandles i henhold til den foreliggende oppfinnelse kan gjengis direkte etter behandling, eller kan registreres ved hjelp av vanlige stereoopptaksteknikker på forskjellige media, slik som optisk plate, magnetisk bånd, grammofonplate eller optisk lydspor, eller sendes ved hjelp av en hvilken som helst vanlig stereotransmisjonsteknikk slik som radio eller kabel, uten skadelige effekter på lydbildet som tilveiebringes ved oppfinnelsen. Audio signals processed in accordance with the present invention may be reproduced directly after processing, or may be recorded using conventional stereo recording techniques on various media, such as optical disc, magnetic tape, gramophone record or optical audio track, or transmitted using any conventional stereo transmission technique such as radio or cable, without harmful effects on the sound image provided by the invention.

Bildedanningsprosessen ifølge den foreliggende oppfinnelse kan også anvendes rekursivt. Dersom eksempelvis hver kanal i et vanlig stereosignal behandles som et monofont signal, og kanalene bildedannes til to forskjellige posisjoner i lytterens rom, vil et fullstendig vanlig stereobilde langs linjen som sammenføyer posisjonene for bildene i kanalene bli oppfattet. I tillegg, ved det tidspunkt som stereoopptaket eller platen opptas på et multisporbånd, som har eksempelvis 24 kanaler, kan hver kanal mates gjennom en overførings-funksjonsprosessor slik at opptaksingeniøren kan plassere de forskjellige instrumenter og stemmer etter ønske for å skape en spesiell lydscene. Resultatet av dette er fortsatt to-kanals audiosignaler som kan avspilles på vanlig gjen-givelsesutstyr, men som vil inneholde den oppfinneriske lydbildedanningsevnen. The imaging process according to the present invention can also be used recursively. If, for example, each channel in a normal stereo signal is treated as a monophonic signal, and the channels are imaged to two different positions in the listener's space, a completely normal stereo image along the line joining the positions of the images in the channels will be perceived. In addition, at the time the stereo recording or disc is recorded onto a multitrack tape, which has, for example, 24 channels, each channel can be fed through a transfer function processor so that the recording engineer can place the various instruments and voices as desired to create a particular soundstage. The result of this is still two-channel audio signals that can be played back on normal reproduction equipment, but which will contain the inventive sound imaging ability.

Det innledningsvis nevnte system kjennetegnes, ifølge oppfinnelsen ved at nevnte første og andre kanals signaler er tilkoblet respektive første og andre kanals lydprosessorkretser hver for å endre amplituden og forskyve fasen for det respektive elektriske signal i suksessive, diskrete frekvensbånd over audiospektrumet, med hver suksessive faseforskyvning forskjellig fra den foregående faseforskyvning i forhold til null grader, hvorved frembringes første og andre kanals modifiserte signaler for å skape et fasedifferensial og et amplitudedifferensial mellom de to kanalers modifiserte signaler, og at utmatninger fra nevnte behandlingskretser opprettholdes adskilte og er tilkoblet de to transduserne. The initially mentioned system is characterized, according to the invention, in that said first and second channel signals are connected to respective first and second channel sound processor circuits each to change the amplitude and shift the phase of the respective electrical signal in successive, discrete frequency bands across the audio spectrum, with each successive phase shift being different from the preceding phase shift relative to zero degrees, whereby the first and second channel modified signals are produced to create a phase differential and an amplitude differential between the two channels' modified signals, and that outputs from said processing circuits are maintained separately and are connected to the two transducers.

Ifølge ytterligere utførelsesform av systemet kan det dessuten innbefatte et lagringssystem som er koblet til behandlingskretsen for å lagre nevnte modifiserte signaler i et medium som er i stand til å regenerere nevnte lagrede signaler ved et påfølgende valgt tidspunkt. According to a further embodiment of the system, it may also include a storage system which is connected to the processing circuit to store said modified signals in a medium capable of regenerating said stored signals at a subsequent selected time.

Videre kan det være fordelaktig å la de diskrete frekvensbånd være 40 Hz brede. Furthermore, it can be advantageous to leave the discrete frequency bands 40 Hz wide.

Disse og ytterligere utførelsesformer av fremgangsmåten og systemet, ifølge oppfinnelsen vil fremgå av patentkravene, samt av den etterfølgende beskrivelse og de dertil hørende tegninger. These and further embodiments of the method and system, according to the invention, will appear from the patent claims, as well as from the subsequent description and the accompanying drawings.

Oppfinnelsen skal nå nærmere forklares under henvisning til de vedlagte tegninger. Fig. 1 er en planriss fremstilling over en lyttende geometri for å definere parametre av bildestedet. The invention will now be explained in more detail with reference to the attached drawings. Fig. 1 is a plan representation of a listening geometry to define parameters of the image location.

Fig. 2 er et sideriss som tilsvarer fig. 1. Fig. 2 is a side view corresponding to fig. 1.

Fig. 3 er en planriss gjengivelse av en lyttingsgeometri for å definere parametre for lytterstedet. Fig. 3 is a plan view rendering of a listening geometry to define parameters for the listening location.

Fig. 4 er et vertikalriss som tilsvarer fig. 1. Fig. 4 is a vertical view corresponding to fig. 1.

Fig. 5a-5k er planriss for respektive lyttingssituasjoner med tilsvarende variasjoner i høyttalerplassering, og fig. 5m er en tabell over kritiske dimensjoner for tre lytterom. Fig. 6 er et planriss over et bildeoverføringseksperiment utført i to isolerte rom. Fig. 7 er et prosessblokkskjerna som relaterer den foreliggende oppfinnelse til den kjente teknikks praksis. Fig. 8 er et skjema i blokkdiagramform av et lydbilde-danningssystem ifølge en utførelsesform av den foreliggende oppfinnelse. Fig. 9 er en bildemessig fremstilling over en operatør-arbeidsstasjon i henhold til en utførelsesform av den foreliggende oppfinnelse. Fig. 10 viser en datamaskin-grafikk perspektivisk fremvisning som anvendes for styring av den foreliggende oppfinnelse. Fig. 11 viser en datamaskin-grafikkfremvisning av tre ortogonale riss som anvendes for å styre den foreliggende oppf innelse. Fig. 12 er en skjematisk fremstilling over dannelsen av virtuelle lydkilder ved hjelp av den foreliggende oppfinnelse, som viser et planriss over tre isolerte rom. Fig. 13 er et blokkskjema over utstyr for å demonstrere den foreliggende oppfinnelse. Fig. 14 er et bølgeformdiagram over et testsignal plottet som spenning mot tid. Fig. 15 angir i tabellform data som representerer en over-føringsfunksjon ifølge en utførelsesform av den foreliggende oppfinnelse. Fig. 16 er et blokkskjema over et lydbildelokaliseringssystem ifølge en utførelsesform av den foreliggende oppfinnelse. Fig. 17A og 17B er grafiske fremstillinger over typiske overføringsfunksjoner som anvendes i lydprosessoren ifølge fig. 16. Fig. 18A-18C er blokkskjemaer over en krets som omfatter den foreliggende oppfinnelse. Fig. 19 er et blokkskjema over ytterligere kretser som dessuten omfatter den foreliggende oppfinnelse. Fig. 1 er et planriss over en stereolyttingssituasjon, som viser venstre og høyre høyttalere, henholdsvis 101 og 102, en lytter 103 og en lydbildeposisjon 104 som er tilsynelatende for lytteren 103. Kun for definisjonsformål er lytteren vist plassert på en linje 105 som er perpendikulær på en linje 106 som sammenføyer høyttalerne 101 og 102, og er opptrukket ved midtpunktet av linjen 106. Denne lytterposisjon vil bli referert til som referanselytterposisjonen, men med denne oppfinnelse er lytteren ikke begrenset til denne posisjonen. Fig. 5a-5k are floor plans for respective listening situations with corresponding variations in loudspeaker placement, and fig. 5m is a table of critical dimensions for three listening rooms. Fig. 6 is a plan view of an image transfer experiment carried out in two isolated rooms. Fig. 7 is a process block core that relates the present invention to the prior art practice. Fig. 8 is a diagram in block diagram form of a sound image forming system according to an embodiment of the present invention. Fig. 9 is a pictorial representation of an operator workstation according to an embodiment of the present invention. Fig. 10 shows a computer graphic perspective view used for controlling the present invention. Fig. 11 shows a computer graphics display of three orthogonal views used to control the present invention. Fig. 12 is a schematic representation of the formation of virtual sound sources by means of the present invention, which shows a plan view of three isolated rooms. Fig. 13 is a block diagram of equipment for demonstrating the present invention. Fig. 14 is a waveform diagram of a test signal plotted as voltage versus time. Fig. 15 indicates in tabular form data representing a transfer function according to an embodiment of the present invention. Fig. 16 is a block diagram of a sound image localization system according to an embodiment of the present invention. Figs. 17A and 17B are graphical representations of typical transfer functions used in the sound processor according to Figs. 16. Figs. 18A-18C are block diagrams of a circuit embodying the present invention. Fig. 19 is a block diagram of further circuits which also comprise the present invention. Fig. 1 is a plan view of a stereo listening situation, showing left and right speakers, 101 and 102 respectively, a listener 103 and a sound image position 104 apparent to the listener 103. For definition purposes only, the listener is shown positioned on a line 105 which is perpendicular on a line 106 joining speakers 101 and 102, and drawn at the midpoint of line 106. This listener position will be referred to as the reference listener position, but with this invention the listener is not limited to this position.

Fra referanselytterposisjonen blir en bildeasimutvinkel (a) målt mot urviserretningen fra linje 105 til en linje 107 mellom lytteren 103 og bildeposisjonen 104. På tilsvarende måte blir en helningsavstand (r) definert som distansen fra lytteren 103 til bildeposisjonen 104. Denne avstand er den sanne avstand målt i tredimensjonalt rom, ikke den projiserte avstand som målt på planriss eller annet ortogonalriss. From the reference listener position, an image azimuth angle (a) is measured clockwise from line 105 to a line 107 between the listener 103 and the image position 104. Similarly, a slope distance (r) is defined as the distance from the listener 103 to the image position 104. This distance is the true distance measured in three-dimensional space, not the projected distance as measured on a floor plan or other orthogonal plan.

I den foreliggende oppfinnelse oppstår muligheten for bilder som er vesentlig ute av høyttalernes plan. Følgelig defineres i fig. 2 en høydevinkel (b) for bildet. En lytterposisjon 201 tilsvarer posisjonen 103 og en bildeposisjon 202 tilsvarer bildeposisjon 104 i fig. 1. Bildehøydevinkelen (b) måles oppad fra en horisontal linje 203 gjennom lytterens 103 hode til en linje 204 som sammenføyer lytterens hode med bildeposisjonen 202. Det bør bemerkes at høyttalerne 101, 102 ikke nødvendigvis ligger på linje 203. In the present invention, the possibility arises for images that are significantly out of the plane of the speakers. Accordingly, defined in fig. 2 an elevation angle (b) for the image. A listener position 201 corresponds to position 103 and an image position 202 corresponds to image position 104 in fig. 1. The image height angle (b) is measured upwards from a horizontal line 203 through the listener's 103 head to a line 204 joining the listener's head with the image position 202. It should be noted that the speakers 101, 102 do not necessarily lie on line 203.

Idet der er blitt definert bildeposisjonsparametrene med hensyn til en referanselyttekonfigurasjon, foreslås det å definere parametre for mulige variasjoner i lytterkonfigura-sjonen. Idet der vises til fig. 3, tilsvarer høyttalerne 301 og 302 og linjer 304 og 305 respektivt henvisningene 101, 102, 106 og 105 i fig. 1. En høyttaleravstand (s) måles langs linje 304, og en lytterdistanse (d) måles langs linje 305. I tilfellet at en lytter er anbrakt parallelt med linje 304 langs linje 306 til posisjon 307, defineres en sideveis forskyvning (e) målt langs linje 306. For hver høyttaler 301 og 302 defineres respektive asimutvinkler (p) og (q) som målt mot urviserretningen fra en linje gjennom høyttalerne 301 og 302 og perpendikulært på en linje som sammenføyer disse, i en retning mot lytteren. Tilsvarende for lytteren defineres en asimutvinkel (m) mot urviserretningen fra linje 305 i den retning som lytteren ser. Since the image position parameters have been defined with respect to a reference listening configuration, it is proposed to define parameters for possible variations in the listening configuration. While referring to fig. 3, the speakers 301 and 302 and lines 304 and 305 correspond respectively to the references 101, 102, 106 and 105 in fig. 1. A speaker distance (s) is measured along line 304, and a listener distance (d) is measured along line 305. In the case that a listener is placed parallel to line 304 along line 306 to position 307, a lateral displacement (e) measured along line 306. For each speaker 301 and 302, respective azimuth angles (p) and (q) are defined as measured counter-clockwise from a line through speakers 301 and 302 and perpendicular to a line joining them, in a direction towards the listener. Correspondingly for the listener, an azimuth angle (m) is defined clockwise from line 305 in the direction the listener sees.

I fig. 4 måles en høyttalerhøyde (h) opp fra horisontallinjen 401 gjennom hodet på lytteren 303 til den vertikale senter-linje for høyttaler 301, 302. In fig. 4, a speaker height (h) is measured from the horizontal line 401 through the head of the listener 303 to the vertical center line for speakers 301, 302.

Parametrene som er definert tillater mer enn en beskrivelse av en gitt geometri. Eksempelvis kan en bildeposisjon beskrives som (180,0,x) eller (0,180,x) med fullstendig ekvivalens. The parameters defined allow more than one description of a given geometry. For example, an image position can be described as (180,0,x) or (0,180,x) with complete equivalence.

I vanlig stereogjengivelse er bildet begrenset til å ligge langs linje 106 i fig. 1, mens bildet som frembringes av den foreliggende oppfinnelse kan anbringes fritt i rom: asimutvinkel (a) kan strekke seg fra 0-360 grader, og avstand (r) er ikke begrenset til distanser som svarer til (s) eller (d). Et bilde kan dannes meget nær lytteren, en liten brøkdel av (d), eller fjerntliggende på en avstand som er flere ganger (d), og kan samtidig være på hvilken som helst asimutvinkel (a) uten henvisning til asimutvinkelen som er motstående høyttalerne. I tillegg er den foreliggende oppfinnelse i stand til bildeplassering på en hvilken som helst høydevinkel (b). Lytterdistanse (d) kan variere fra 0,5 m til 30 m eller forbi dette, med bildet tilsynelatende statisk i rom under variasj onen. In normal stereo reproduction, the image is limited to lie along line 106 in fig. 1, while the image produced by the present invention can be placed freely in space: azimuth angle (a) can range from 0-360 degrees, and distance (r) is not limited to distances corresponding to (s) or (d). An image can be formed very close to the listener, a small fraction of (d), or distant at a distance several times (d), and at the same time can be at any azimuth angle (a) without reference to the azimuth angle opposite the speakers. In addition, the present invention is capable of image placement at any elevation angle (b). Listening distance (d) can vary from 0.5m to 30m or beyond, with the image appearing static in space during the variation.

God bildedannelse er blitt oppnådd med høyttaleravstander fra 0,2 m til 8 m, under anvendelse av de samme signaler til å drive høyttalerne fra alle innbyrdes avstander. Asimutvinkler på høyttalerne (p) og (q) kan varieres uavhengig over et bredt område uten noen virkning på bildet. Good imaging has been achieved with speaker distances from 0.2 m to 8 m, using the same signals to drive the speakers from all distances apart. Azimuth angles on the speakers (p) and (q) can be varied independently over a wide range without any effect on the image.

Det er kjennetegnende for denne oppfinnelse at moderate endringer i høyttalerhøyde (h) ikke påvirker bildehøyde-vinkelen (b) som oppfattes av lytteren. Dette gjelder både for positive og negative verdier av (h), dvs. høyttaler-plassering over eller under lytterens hodehøyde. It is characteristic of this invention that moderate changes in speaker height (h) do not affect the image height angle (b) perceived by the listener. This applies to both positive and negative values of (h), i.e. speaker placement above or below the listener's head height.

Ettersom bildet som dannes er uhyre realistisk, er det naturlig for lytteren å vende seg for å "se på", dvs. å vende seg direkte mot bildet. Bildet forblir stabilt når dette gjøres; lytterasimutvinkel (m) har ingen oppfattbar virkning på den romlige posisjonen av bildet, for minst et området av vinkler (m) fra +120 til -120 grader. Så sterkt er inntrykket av en lokalisert lydkilde at lyttere ikke har noen vanskelig-het med å "se på" eller peke mot bildet. En gruppe av lyttere vil angi den samme bildeposisjon. As the image formed is extremely realistic, it is natural for the listener to turn to 'look', i.e. to face the image directly. The image remains stable when this is done; listener azimuth angle (m) has no perceptible effect on the spatial position of the image, for at least a range of angles (m) from +120 to -120 degrees. So strong is the impression of a localized sound source that listeners have no difficulty in "looking at" or pointing towards the image. A group of listeners will enter the same image position.

Fig. 5a-5k viser et sett av ti lyttegeometrier i hvilke bildestabilitet er blitt testet. I fig. 5a er et planriss over en lyttegeometri vist. Venstre og høyre høyttalere, henholdsvis 501 og 502, reproduserer lyd for lytter 503, som frembringer et lydbilde 504. Delfigurer 5a til og med 5k viser variasjoner i høyttalerorientering, og er generelt lik delfigur 5a. Fig. 5a-5k show a set of ten listening geometries in which image stability has been tested. In fig. 5a is a plan view of a listening geometry shown. Left and right speakers, respectively 501 and 502, reproduce sound for listener 503, which produces a sound image 504. Subfigures 5a through 5k show variations in speaker orientation, and are generally similar to subfigure 5a.

Alle ti geometrier ble testet i tre forskjellige lytterom med forskjellige verdier av høyttaleravstand (s) og lytteravstand (d), slik som angitt i tabellen i fig. 5m. Rom 1 var et lite studiokontrollområde som inneholdt betydelige mengder av utstyr. Rom 2 var et stort opptaksstudio som var nesten fullstendig tomt, og rom 3 var et lite eksperimentrom med lydabsorberende materiale på tre vegger. All ten geometries were tested in three different listening rooms with different values of speaker distance (s) and listener distance (d), as indicated in the table in fig. 5 m. Room 1 was a small studio control area containing significant amounts of equipment. Room 2 was a large recording studio that was almost completely empty, and Room 3 was a small experimental room with sound-absorbing material on three walls.

For hver test ble lytteren bedt om å gi den oppfattede bildeposisjon for to betingelser, lytterhodevinkel (m) lik null, og hodet dreiet til å vende mot den tilsynelatende bildeposisjon. Hver test ble gjentatt med tre forskjellige lyttere. Således ble bildestabiliteten testet totalt i 180 konfigurasjoner. Hver av disse 180 konfigurasjoner anvendte de samme inngangssignaler til høyttalerne. I hvert tilfelle ble bildeasimutvinkelen (a) oppfattet som -60 grader. For each test, the listener was asked to provide the perceived image position for two conditions, listener head angle (m) equal to zero, and head turned to face the apparent image position. Each test was repeated with three different listeners. Thus, image stability was tested in a total of 180 configurations. Each of these 180 configurations applied the same input signals to the speakers. In each case, the image azimuth angle (a) was perceived as -60 degrees.

I fig. 6 er et bildeoverføringseksperiment vist i hvilket et lydbilde 601 er dannet av signaler behandlet i henhold til den foreliggende oppfinnelse, med drift av høyttaler 602 og 603 i et første rom 604. Et øvelseshode 605, slik som vist eksempelvis i tysk patent 1 927 401, bærer venstre og høyre mikrofoner 606 og 607 i sine modellører. Elektriske signaler på linjer 608 og 609 fra mikrofoner 606, 607 blir separat forsterket ved hjelp av forsterker 610 og 611, hvilke driver respektiv venstre og høyre høyttaler 612 og 613 i et andre rom 614. En lytter 615 som er plassert i dette andre rom, hvilket er akustisk isolert fra det første rom, vil oppfatte et skarpt sekundærbilde 616 som tilsvarer bildet 601 i det første rommet. In fig. 6 is an image transmission experiment shown in which a sound image 601 is formed from signals processed according to the present invention, with operation of speakers 602 and 603 in a first room 604. A practice head 605, as shown for example in German patent 1 927 401, carry left and right microphones 606 and 607 in their model ears. Electrical signals on lines 608 and 609 from microphones 606, 607 are separately amplified by means of amplifiers 610 and 611, which respectively drive left and right speakers 612 and 613 in a second room 614. A listener 615 placed in this second room, which is acoustically isolated from the first room, will perceive a sharp secondary image 616 corresponding to the image 601 in the first room.

Et eksempel på forholdet av den oppfinneriske lydprosessor overfor kjente systemer er vist i fig. 7, der en eller flere flerspors signalkilder 701, som kan være magnetbåndtilbake-spillingsmaskiner, mater et flertall av monofone signaler 702 som fås fra et flertall av kilder til en studioblandings-konsoll 703. Konsollen kan anvendes til å modifisere signalene, f.eks. ved å endre nivåer og ballansering av frekvens-innhold, på hvilke som helst ønskede måter. An example of the relationship of the inventive sound processor to known systems is shown in fig. 7, where one or more multi-track signal sources 701, which may be magnetic tape playback machines, feed a plurality of monophonic signals 702 obtained from a plurality of sources to a studio mixing console 703. The console may be used to modify the signals, e.g. by changing levels and balancing frequency content in any desired way.

Et flertall av modifiserte monofoniske signaler 704 som frembringes av konsoll 703 er forbundet med inngangene på et bildebehandlingssystem 705 i henhold til den foreliggende oppfinnelse. Innenfor dette system blir hver inngangskanal tildelt en bildeposisjon, og overføringsfunksjonbehandling anvendes for å frembringe to-kanalssignaler fra hvert enkelt inngangssignal 704. Samtlige av to-kanalssignalene blandes til å frembringe et sluttpar av signaler 706, 707, som så kan bringes tilbake til en blandekonsoll 708. Det vil forstås at to-kanalssignalene som frembringes ved hjelp av denne oppfinnelse ikke er virkelig venstre og høyre stereosignaler, men slik betegnelse gir en lett måte å referere til disse signaler. Når således samtlige av to-kanalssignalene blandes, blir samtlige av de venstre signaler kombinert i ett signal og samtlige av de høyre signaler kombinert i ett signal. I praksis kan konsoll 703 og konsoll 708 være separate sek-sjoner på den samme konsollen. Under anvendelse av konsoll-muligheter, kan de behandlede signaler tilføres drivhøyt-talere 709, 710 for overvåkningsformål. Etter en hvilken som helst ønsket modifikasjon eller nivåsetting, blir hoved-stereosignaler 711 og 712 ført til hovedstereoopptaker 713, som kan være en to-kanals magnetbåndopptaker. Henvisninger som etterfølger henvisning 705 er velkjente innenfor den kjente teknikk. A plurality of modified monophonic signals 704 produced by console 703 are connected to the inputs of an image processing system 705 according to the present invention. Within this system, each input channel is assigned an image position, and transfer function processing is used to produce two-channel signals from each individual input signal 704. All of the two-channel signals are mixed to produce a final pair of signals 706, 707, which can then be fed back to a mixing console 708. It will be understood that the two-channel signals produced by this invention are not truly left and right stereo signals, but such designation provides an easy way to refer to these signals. Thus, when all of the two-channel signals are mixed, all of the left signals are combined into one signal and all of the right signals are combined into one signal. In practice, console 703 and console 708 can be separate sections on the same console. Using console capabilities, the processed signals can be fed to drive loudspeakers 709, 710 for monitoring purposes. After any desired modification or leveling, master stereo signals 711 and 712 are fed to master stereo recorder 713, which may be a two-channel magnetic tape recorder. References following reference 705 are well known in the art.

Lydbildebehandlingssystem 705 er vist i nærmere detalj i fig. 8, hvor inngangssignaler 801 tilsvarer signaler 704 og utgangssignaler 807, 808 tilsvarer henholdsvis signaler 711, 712 i fig. 7. Hvert monaurale inngangssignal 801 mates til en individuell signalprosessor 802. Audio imaging system 705 is shown in greater detail in FIG. 8, where input signals 801 correspond to signals 704 and output signals 807, 808 correspond respectively to signals 711, 712 in fig. 7. Each monaural input signal 801 is fed to an individual signal processor 802.

Disse prosessorer 802 opererer uavhengig, med ingen sam-kopling av audiosignaler. Hver signalprosessor opererer til å frembringe to-kanalssignalene som har differensial fase og amplitude justert på en frekvensavhengig basis. Disse overføringsfunksjoner vil bli forklart i detalj nedenfor. Overføringsfunksjonene, som kan være beskrevet i tidsområdet som virkelige impulsresponser eller ekvivalent i frekvensområdet som komplekse frekvensresponser eller amplitude- og faseresponsere, karakteriserer kun den ønskede bildeposisjonen til hvilken inngangssignalet skal projiseres. These processors 802 operate independently, with no interconnection of audio signals. Each signal processor operates to produce the two-channel signals having differential phase and amplitude adjusted on a frequency dependent basis. These transfer functions will be explained in detail below. The transfer functions, which can be described in the time domain as real impulse responses or equivalently in the frequency domain as complex frequency responses or amplitude and phase responses, characterize only the desired image position to which the input signal is to be projected.

Ett eller flere behandlede signalpar 803 som er frembragt av signalprosessorene tilføres inngangene på stereoblander 804. Visse eller alle av disse kan også tilføres inngangene på et lagringssystem 805. Dette systemet er i stand til å lagre fullstendige behandlede stereoaudiosignaler, og å gjenspille disse samtidig til å fremkomme på utganger 806. Typisk kan dette lagringssystem ha forskjellige antall av inngangs-kanalpar og utgangskanalpar. Et flertall av utganger 806 fra lagringssystemet tilføres ytterligere innganger på stereoblander 804. Stereoblander 804 summerer alle venstre innmatinger til å frembringe venstre utmating 807, og alle høyre innmatinger til å frembringe høyre utmating 808, eventuelt å modifisere amplituden av hver innmating før summering. Intet samvirke eller kopling av venstre og høyre kanaler finner sted i blanderen. One or more processed signal pairs 803 produced by the signal processors are applied to the inputs of stereo mixer 804. Some or all of these may also be applied to the inputs of a storage system 805. This system is capable of storing complete processed stereo audio signals and playing them back simultaneously to appear on outputs 806. Typically, this storage system may have different numbers of input channel pairs and output channel pairs. A plurality of outputs 806 from the storage system are fed to additional inputs on stereo mixer 804. Stereo mixer 804 sums all left inputs to produce left output 807, and all right inputs to produce right output 808, possibly modifying the amplitude of each input before summing. No interaction or coupling of left and right channels takes place in the mixer.

En menneskelig operatør 809 kan styre operasjonen av systemet via operatørgrensesnitt 810 for å spesifisere den ønskede bildeposisjon som skal tildeles hver inngangskanal. A human operator 809 can control the operation of the system via operator interface 810 to specify the desired image position to be assigned to each input channel.

Det kan være særlig fordelaktig å realisere signalprosessor 802 digitalt, slik at ingen begrensning settes på posisjonen, banen, eller bevegelseshastigheten for et bilde. Disse digitale lydprosessorer, som gir den nødvendige differensial-justering av fase og amplitude på en frekvensavhengig basis, vil bli forklart i nærmere detalj nedenfor. I en slik digital realisering er det ikke alltid økonomisk å muliggjøre at signalbehandling skjer i reell tid, selv om slik operasjon er fullstendig mulig. Dersom reelltid-signalbehandling ikke tilveiebringes, vil utganger 803 bli forbundet med lager-system 805, hvilket vil være i stand til sakte registrering og reell tidsgjenspilling. Omvendt, dersom et adekvat antall av reelltids-signalprosessorer 802 tilveiebringes, kan lagringssystem 805 utelates. It can be particularly advantageous to realize the signal processor 802 digitally, so that no restriction is placed on the position, the path, or the speed of movement of an image. These digital audio processors, which provide the necessary differential adjustment of phase and amplitude on a frequency-dependent basis, will be explained in more detail below. In such a digital implementation, it is not always economical to enable signal processing to take place in real time, even if such an operation is completely possible. If real-time signal processing is not provided, outputs 803 will be connected to storage system 805, which will be capable of slow recording and real-time playback. Conversely, if an adequate number of real-time signal processors 802 are provided, storage system 805 may be omitted.

I fig. 9 kontrollerer operatør 901 blandekonsoll 902 som er utstyrt med venstre og høyre stereomonitorhøyttalere 903, 904. Selv om stabilitet av det endelige behandlede bildet er god til en høyttaleravstand (s) som lav som 0,2 m, foretrekkes det for blandeoperatøren å være forsynt med høyt-talere som er anbrakt 0,5 m fra hverandre. Med slik avstand blir nøyaktig bildeplassering lettere oppnådd. Et datamaskin-graf ikkfremvisningsmiddel 905, en fleraksestyring 906 og et tastatur 907, er tilveiebrakt sammen med passende beregnings og lagringsutstyr for å støtte disse. Datamaskingrafikk-fremvisningsmiddel 905 kan tilveiebringe en grafisk fremstilling over posisjonen eller banen for bildet i rom som vist, eksempelvis, i fig. 10 og 11. Fig. 10 viser en fremvisning 1001 over en lyttesituasjon der en typisk lytter 1002 og en bildebane 1003 presenteres sammen med en representasjon over en bevegelsebildeskjerm 1004 og perspektivromanvisere 1005, 1006. In fig. 9, operator 901 controls mixing console 902 which is equipped with left and right stereo monitor speakers 903, 904. Although stability of the final processed image is good to a speaker distance (s) as low as 0.2 m, it is preferable for the mixing operator to be provided with loudspeakers placed 0.5 m apart. With this distance, accurate image placement is more easily achieved. A computer graphics display means 905, a multi-axis controller 906 and a keyboard 907 are provided together with suitable computing and storage equipment to support these. Computer graphics display means 905 may provide a graphical representation of the position or path of the image in space as shown, for example, in FIG. 10 and 11. Fig. 10 shows a presentation 1001 of a listening situation where a typical listener 1002 and an image path 1003 are presented together with a representation of a motion picture screen 1004 and perspective novel viewers 1005, 1006.

Ved bunnen av fremvisningen er der en meny 1007 over enheter som vedrører den bestemte seksjonen av lydspor som betjenes, innbefattende registrering, tidssynkronisering og rediger-ingsinformasjon. Menyenheter kan velges av tastatur 907, eller ved å bevege markør 1008 til enheten, under anvendelse av fleraksestyring 906. Den valgte enhet kan modifiseres ved å anvende tastatur 907, eller vippes under anvendelse av en knapp på fleraksestyringen 906, hvorved det frembringes passende systemaksjon. I særdeleshet tillater en meny-gjenstand 1009 en operatør å forbinde fleraksestyringen 906 ved hjelp av programvare til å styre betraktningspunktet hvorfra perspektivbildet projiseres, eller å styre posisjon-en/banen for det eksisterende lydbildet. En annen menyenhet 1010 tillater valg av en alternativ fremvisning som er vist i fig. 11. At the bottom of the display there is a menu 1007 of units relating to the particular section of audio track being operated, including registration, time synchronization and editing information. Menu items may be selected by keyboard 907, or by moving cursor 1008 to the item, using multi-axis control 906. The selected item may be modified by using keyboard 907, or tilted using a button on multi-axis control 906, thereby producing appropriate system action. In particular, a menu item 1009 allows an operator to connect the multi-axis control 906 by means of software to control the viewpoint from which the perspective image is projected, or to control the position/path of the existing sound image. Another menu unit 1010 allows selection of an alternative display shown in FIG. 11.

I fremvisningen i fig. 11 blir den virtuelt hel-skjerms perspektiviske presentasjon 1001 som er vist i fig. 10, erstattet av et sett av tre ortogonale riss over den samme situasjon; et toppriss 1101, et frontriss 1102 og et sideriss 1103. For å hjelpe til med fortolkning opptas den gjenværende skjermkvadrant av en redusert og mindre detaljert versjon 1104 av perspektivbildet 1001. Igjen vil en meny 1105, som er i alt vesentlig lik den som er vist ved 1007 og med like funksjoner, oppta bunnen av skjermen. En særlig menyenhet 1106 tillater vipping tilbake til fremvisningen i fig. 10. In the display in fig. 11, the virtual full-screen perspective presentation 1001 shown in FIG. 10, replaced by a set of three orthogonal views of the same situation; a top view 1101, a front view 1102 and a side view 1103. To aid interpretation, the remaining screen quadrant is occupied by a reduced and less detailed version 1104 of the perspective image 1001. Again, a menu 1105, which is substantially similar to that shown at 1007 and with equal functions, occupy the bottom of the screen. A special menu unit 1106 allows tilting back to the display in fig. 10.

I fig. 12 blir lydkilder 12201, 1202 og 1203 i et første rom 1204 detektert av to mikrofoner 1205 og 1206 som genererer henholdsvis høyre og venstre stereosignaler, som opptas under anvendelse av vanlig stereoopptaksutstyr 1207. Dersom tilbakespilt på vanlig stereotilbakespillingsutstyr 1208, som driver henholdsvis høyre og venstre høyttaler 1209, 1210 med signalene stammende fra mikrofoner 1205, 1206, vil vanlige stereobilder 1211, 1212, 1213 som tilsvarer respektive kilder 1201, 1202, 1203 bli oppfattet av en lytter 1214 i et andre rom 1215. Disse bilder vil være ved posisjoner som er projeksjoner på linjen som sammenføyer høyttalerne 1209, 1210 av de sideveis posisjoner for kildene relativt til mikro-fonene 1205, 1206. In fig. 12, sound sources 12201, 1202 and 1203 in a first room 1204 are detected by two microphones 1205 and 1206 which generate respectively right and left stereo signals, which are recorded using conventional stereo recording equipment 1207. If played back on conventional stereo playback equipment 1208, which drives respectively right and left speaker 1209, 1210 with the signals originating from microphones 1205, 1206, normal stereo images 1211, 1212, 1213 corresponding to respective sources 1201, 1202, 1203 will be perceived by a listener 1214 in a second room 1215. These images will be at positions that are projections on the line joining the speakers 1209, 1210 of the lateral positions of the sources relative to the microphones 1205, 1206.

Dersom de to par av stereosignaler behandles og kombineres som detaljert ovenfor under anvendelse av lydprosessor 1216, og gjengis ved hjelp av vanlig stereotilbakespillingsutstyr 1217 på høyre og venstre høyttaler 1218, 1219 i et tredje rom 1220, vil skarpe romlige lokaliserte bilder av lydkildene fremtre for lytteren 1226 ved posisjoner som ikke er relatert til de faktiske posisjoner for høyttalerne 1218 og 1219. La oss anta at behandlingen var slik at der skulle dannes et bilde av det opprinnelig høyre kanalsignalet ved posisjonen 1214, og et bilde av det opprinnelig venstre kanalsignalet ved 1225. Hvert av disse bilder oppfører seg som om det var virkelig en høyttaler. Vi kan tenke på hildene som "virtuell høyttaler". If the two pairs of stereo signals are processed and combined as detailed above using sound processor 1216, and reproduced using conventional stereo playback equipment 1217 on right and left speakers 1218, 1219 in a third room 1220, sharp spatially localized images of the sound sources will appear to the listener 1226 at positions unrelated to the actual positions of the speakers 1218 and 1219. Let us assume that the processing was such that an image of the original right channel signal was to be formed at position 1214, and an image of the original left channel signal at 1225. Each of these images behaves as if it were really a speaker. We can think of the hilde as a "virtual speaker".

En overføringsfunksjon, der både differensial amplitude og fase av et to-kanalssignal justeres på en frekvensavhengig basis over hele audiobåndet, kreves for å projisere et bilde av et monauralt audiosignal til en gitt funksjon. For generelle anvendelser til å angi hver slik respons, må amplitude- og fasedifferensialet ved intervaller som ikke overskrider 40 Hz angis uavhengig for hver av de to kanalene over hele audiospekteret, for beste bildestabilitet og koherens. For anvendelser som ikke krever høy kvalitet og lydbildeplassering, kan frekvensintervallene utvides. Derfor krever spesifikasjoner av en slik respons ca. 1 000 reelle tall (eller ekvivalent 500 komplekse). Differanser for menneskelig oppfatning av lydromlig sted er noe ubestemt, idet det er basert på subjektiv måling, men i et sant tredimensjonalt rom er mer enn 1 000 distinkte posisjoner oppløsbare ved hjelp av en gjennomsnittslytter. Uttømmende karakterisering av alle responser for alle mulige posisjoner danner derfor et enormt antall av data, omfattende totalt mer enn en million reelle tall, hvis samling er i gang. A transfer function, in which both the differential amplitude and phase of a two-channel signal are adjusted on a frequency-dependent basis over the entire audio band, is required to project an image of a monaural audio signal to a given function. For general applications to specify each such response, the amplitude and phase differential at intervals not exceeding 40 Hz must be specified independently for each of the two channels over the entire audio spectrum, for best image stability and coherence. For applications that do not require high quality and sound image placement, the frequency intervals can be extended. Therefore, specifications of such a response require approx. 1,000 real numbers (or equivalently 500 complex). Differences in human perception of sound spatial location are somewhat indeterminate, being based on subjective measurement, but in a true three-dimensional space, more than 1,000 distinct positions are resolvable by an average listener. Exhaustive characterization of all responses for all possible positions therefore forms an enormous amount of data, comprising a total of more than one million real numbers, the collection of which is in progress.

Det bør bemerkes at overføringsfunksjonen i lydbehandleren, ifølge denne oppfinnelse, som gir differensialjusteringen mellom to kanaler, oppbygges stykke-for-stykke ved prøve- og feiletesting over audiospekteret for hvert 40 Hz intervall. Dessuten, slik det skal forklares nedenfor, lokaliserer hver overføringsfunksjon i lydprosessoren lyden relativt to atskilte transdusere ved kun ett sted, dvs. en asimut, høyde og dybde. It should be noted that the transfer function in the sound processor, according to this invention, which provides the differential adjustment between two channels, is built piece-by-piece by trial and error testing over the audio spectrum for each 40 Hz interval. Also, as will be explained below, each transfer function in the sound processor localizes the sound relative to two separate transducers at only one location, ie, an azimuth, elevation, and depth.

I praksis trenger man imidlertid ikke å gjengi alle over-føringsfunksjonsresponser uttrykkelig, ettersom speilbilde-symmetri generelt eksisterer mellom nevnte høyre og venstre kanaler. Dersom responsene som modifiserer kanalene ombyttes, blir bildeasimutvinkelen (a) invertert, mens høyden (b) og avstanden (r) forblir uendret. In practice, however, one does not need to reproduce all transfer function responses explicitly, as mirror image symmetry generally exists between said right and left channels. If the responses modifying the channels are swapped, the image azimuth angle (a) is inverted, while the height (b) and distance (r) remain unchanged.

Det er mulig å demonstrere den oppfinneriske prosess og lydillusjon under anvendelse av vanlig utstyr og ved hjelp av forenklede signaler. Dersom et utbrudd av en sinusbølge på en kjent frekvens styres jevnt på og av ved relativt lange intervaller, blir et meget smalt bånd av frekvensområdet opptatt av det resulterende signal. Dette signal vil sample den ønskede respons på en enkelt frekvens. Derfor vil de ønskede responser, dvs. overføringsfunksjonene, bli redusert til enkel styring av differensial amplitude og fase (eller forsinkelse) mellom venstre og høyre kanaler på en frekvensavhengig basis. Således vil det forstås at overførings-funksjonen for en bestemt lydplassering kan oppbygges empirisk ved å foreta differensiale fase- og amplitude-justeringer for hvert valgte frekvensintervall over audiospekteret. Ved hjelp av Fourier's teorem kan et hvilket som helst signal representeres som summen av en serie av sinus-bølger, slik at signalet som anvendes er fullstendig generelt . It is possible to demonstrate the inventive process and sound illusion using common equipment and using simplified signals. If an outbreak of a sine wave at a known frequency is controlled uniformly on and off at relatively long intervals, a very narrow band of the frequency range is occupied by the resulting signal. This signal will sample the desired response at a single frequency. Therefore, the desired responses, i.e. the transfer functions, will be reduced to simple control of the differential amplitude and phase (or delay) between the left and right channels on a frequency dependent basis. Thus, it will be understood that the transfer function for a specific sound location can be built up empirically by making differential phase and amplitude adjustments for each selected frequency interval over the audio spectrum. Using Fourier's theorem, any signal can be represented as the sum of a series of sine waves, so that the signal used is completely general.

Et eksempel på et system for å demonstrere den foreliggende oppfinnelse er vist i fig. 13, hvor en audiosyntetisator 1302, en Hewlett-Packard Multifunction Synthesizer modell 8904A, styres av en datamaskin 1301, Hewlett-Packard modell 330M, til å generere monauralt lydsignal som mates til inngangene 1303, 1304 av to kanaler på en audioforsinkelses-linje 1305, Eventide Precision Delay model PD860. Fra forsinkelseslinje 1305 passerer høyre kanalsignalet til en svitsjbar inverterer 1306 og venstre og høyre signaler passerer så gjennom respektive variable attenuatorer 1307, 1308 og dernest til to ef f ektf orsterkere 1309, 1310 som driver henholdsvis venstre og høyre høyttalere 1311, 1312. An example of a system for demonstrating the present invention is shown in fig. 13, where an audio synthesizer 1302, a Hewlett-Packard Multifunction Synthesizer model 8904A, is controlled by a computer 1301, a Hewlett-Packard model 330M, to generate monaural audio signal which is fed to the inputs 1303, 1304 of two channels of an audio delay line 1305, Eventide Precision Delay model PD860. From delay line 1305, the right channel signal passes to a switchable inverter 1306 and the left and right signals then pass through respective variable attenuators 1307, 1308 and then to two power amplifiers 1309, 1310 which drive left and right speakers 1311, 1312 respectively.

Syntetisator 1302 frembringer jevnt styrte sinusbølgeutbrudd av en hvilken som helst ønsket testfrekvens 1401, under anvendelse av en omhyll ing som vist i fig. 14. Sinusbølgen ledes på under anvendelse av en første lineær sagtannsspenning 1402 av 20 ms varighet, dveler på konstant amplitude 1403 i 45 ms, og ledes så av under anvendelse av en andre lineær sagtannsspenning 1404 med 20 ms varighet. Utbrudd gjentas med intervaller 1405 lik ca. 1-5 sekunder. Synthesizer 1302 produces smoothly controlled sine wave bursts of any desired test frequency 1401, using an envelope as shown in FIG. 14. The sine wave is led on using a first linear sawtooth voltage 1402 of 20 ms duration, dwells at constant amplitude 1403 for 45 ms, and then led off using a second linear sawtooth voltage 1404 of 20 ms duration. Outbreaks are repeated at intervals of 1405 equal to approx. 1-5 seconds.

I tillegg, under anvendelse av systemet i fig. 13 og bølge-formen i fig. 14, kan den foreliggende oppfinnelse bygge opp en overføringsfunksjon over audiospekteret ved å justere tidsforsinkelsen i forsinkelseslinje 1305 og amplituden ved hjelp av attenuatorer 1307, 1308. En lytter vil foreta justeringen, lytte på lydplasseringen og bestemme om den var på det rette stedet. Dersom så var tilfellet, ville det neste frekvensintervallet bli gransket. Dersom ikke, foretas så ytterligere justering og lytteprosessen gjentas. På denne måte kan overføringsfunksjonen over audiospekteret oppbygges. In addition, using the system of FIG. 13 and the waveform in fig. 14, the present invention can build a transfer function across the audio spectrum by adjusting the time delay in delay line 1305 and the amplitude using attenuators 1307, 1308. A listener would make the adjustment, listen to the sound location and determine if it was in the right place. If so, the next frequency interval would be examined. If not, further adjustment is made and the listening process is repeated. In this way, the transmission function over the audio spectrum can be built up.

Fig. 15 viser en tabell over praktiske data som skal anvendes til å danne en overføringsfunksjon som er egnet til å tillate gjengivelse av lydbilder godt vekk fra retningen for høyt-talerne for flere sinusbølgefrekvenser. Denne tabell kan utvikles akkurat som forklart ovenfor, ved forsøk og feil-lytting. Samtlige av disse bilder ble funnet å være stabile og repeterbare i alle tre lytterom som er detaljert angitt i fig. 5m, for et bredt område av lytterhodestillinger, innbefattende den som direkte vender mot bildet, og for et utvalg av lyttere. Fig. 15 shows a table of practical data to be used to form a transfer function suitable for allowing the reproduction of sound images well away from the direction of the loudspeakers for several sine wave frequencies. This table can be developed exactly as explained above, by trial and error listening. All of these images were found to be stable and repeatable in all three listening rooms detailed in fig. 5m, for a wide range of listening head positions, including those directly facing the image, and for a variety of listeners.

Plasseringen av smalbåndssignaler, som detaljert ovenfor, kan generaliseres på en slik måte at der tillates bredbånds-signaler, som representerer kompliserte kilder, slik som tale og musikk, å bli bildedannet. Dersom differensialamplitudene og f asef orskyvningene for de to kanalene som utledes fra et enkelt inngangssignal angis for samtlige frekvenser gjennom audiobåndet, er den fullstendige overføringsfunksjonen angitt. I praksis trenger man kun uttrykkelig å angi dif-ferensialamplituder og forsinkelser for et antall av frekvenser i det bånd som er av interesse. Amplituder og forsinkelser på hvilken som helst mellomfrekvens, mellom de som er angitt, kan så finnes ved interpolering. Dersom frekvensen, på hvilke responsen er angitt, ikke er for vidt atskilt, og når man tar i betraktning jevnheten eller endringstakten for den sanne respons som er representert, er interpoleringsmetoden ikke for kritisk. The placement of narrowband signals, as detailed above, can be generalized in such a way as to allow wideband signals representing complex sources, such as speech and music, to be imaged. If the differential amplitudes and phase shifts for the two channels derived from a single input signal are specified for all frequencies throughout the audio band, the complete transfer function is specified. In practice, one only needs to explicitly specify differential amplitudes and delays for a number of frequencies in the band of interest. Amplitudes and delays at any intermediate frequency between those specified can then be found by interpolation. If the frequency at which the response is indicated is not too widely separated, and taking into account the smoothness or rate of change of the true response represented, the interpolation method is not too critical.

I tabellen i fig. 15 blir amplitudene og forsinkelsene tilført signalet i hver kanal og dette er vist generelt i fig. 16 hvor en separat lydprosessor 1500, 1501 er tilveiebrakt. Enkeltkanalslydsignalet mates inn ved 1502 og mates til begge lydprosessorer 1500, 1501 hvor amplituden og fasen justeres på en frekvensavhengig basis slik at differensialet på venstre og høyre kanalutganger, henholdsvis 1503, 1504, er den korrekte størrelse som ble empirisk bestemt, slik som forklart ovenfor. Kontrollparametrene som mates inn på linje 1505 endrer differensialfase og amplitudejusteringen slik at lydbildet kan være på et forskjellig ønsket sted. Eksempelvis, i en digital realisering kunne lydprosessoren være endelige-impulsrespons (FIR) filtre hvis koeffisienter varieres av styreparametersignalet til å gi forskjellige effektive overføringsfunksjoner. In the table in fig. 15, the amplitudes and delays are added to the signal in each channel and this is shown generally in fig. 16 where a separate sound processor 1500, 1501 is provided. The single channel audio signal is fed in at 1502 and fed to both audio processors 1500, 1501 where the amplitude and phase are adjusted on a frequency-dependent basis so that the differential on the left and right channel outputs, 1503, 1504 respectively, is the correct amount that was empirically determined, as explained above. The control parameters entered on line 1505 change the differential phase and the amplitude adjustment so that the sound image can be in a different desired location. For example, in a digital implementation, the audio processor could be finite-impulse response (FIR) filters whose coefficients are varied by the control parameter signal to give different effective transfer functions.

Systemet i fig. 16 kan forenkles, som vist fra den følgende analyse. Først er kun differansen eller differensialet mellom forsinkelsene hos de to kanaler av interesse. Anta at venstre og høyre kanalsforsinkelser er henholdsvis t(v) og t(h). Nye forsinkelser t'(v) og t'(h) defineres ved å tilføye en hvilken som helst fast forsinkelse t(a), slik at: The system in fig. 16 can be simplified, as shown from the following analysis. First, only the difference or differential between the delays of the two channels is of interest. Assume that the left and right channel delays are t(v) and t(h), respectively. New delays t'(v) and t'(h) are defined by adding any fixed delay t(a), such that:

Resultatet er at hele effekten høres en tid t(a) senere, eller tidligere hvor t(a) er negativ. Dette generelle uttrykk holder i det spesielle tilfellet hvor t(a) = -t(h). The result is that the entire effect is heard a time t(a) later, or earlier where t(a) is negative. This general expression holds in the special case where t(a) = -t(h).

Ved substituering: By substitution:

Ved denne transformasjon kan man alltid redusere forsinkelsen i en kanal til null. I en praktisk realisering må man være omhyggelig med å subtrahere ut den mindre forsinkelsen, slik at behovet for en negativ forsinkelse aldri oppstår. Det kan foretrekkes å unngå dette problem ved å etterlate en fast restforsinkelse i en kanal, og å endre forsinkelsen i den andre. Dersom den faste restforsinkelsen er av tilstrekkelig størrelse, trenger den variable forsinkelsen å være negativ. With this transformation, one can always reduce the delay in a channel to zero. In a practical implementation, care must be taken to subtract out the smaller delay, so that the need for a negative delay never arises. It may be preferable to avoid this problem by leaving a fixed residual delay in one channel and changing the delay in the other. If the fixed residual delay is of sufficient size, the variable delay needs to be negative.

Dernest trenger man ikke å styre kanalamplitudene uavhengig. Det er en vanlig operasjon innenfor lydingeniørteknikk å endre amplitudene for signaler enten ved forsterkning eller dempning. Så lenge som begge stereokanaler endres med det samme forhold, er der ingen endring i den posisjonsmessige informasjon som bæres. Det er forholdet eller differensialet av amplituder som er viktig og må bevares. Så lenge som dette differensial bevares, er samtlige av effektene og illusjonene i denne beskrivelse fullstendig uavhengig av det totale gjengivelseslydnivå. Følgelig, ved en operasjon tilsvarende den som er detaljert ovenfor for tidsstyring eller fase-kontroll, kan man anbringe all ampiitudestyring i en kanal, hvorved den andre etterlates på en fast amplitude. Igjen kan det være hensiktsmessig å tilføre en fast restdempning til en kanal, slik at alle nødvendige forhold kan oppnås ved dempning av den andre. Full styring er da tilgjengelig under anvendelse av en variabel attenuator i kun én kanal. Second, there is no need to control the channel amplitudes independently. It is a common operation in audio engineering to change the amplitudes of signals either by amplification or attenuation. As long as both stereo channels change by the same ratio, there is no change in the positional information carried. It is the ratio or differential of amplitudes that is important and must be preserved. As long as this differential is preserved, all of the effects and illusions in this description are completely independent of the total reproduction sound level. Consequently, by an operation similar to that detailed above for time control or phase control, one can place all amplitude control in one channel, leaving the other at a fixed amplitude. Again, it may be appropriate to add a fixed residual damping to one channel, so that all necessary conditions can be achieved by damping the other. Full control is then available using a variable attenuator in just one channel.

Man kan således angi all den ønskede informasjon ved å angi differensialdempningen og forsinkelsen som funksjoner av frekvens for en enkelt kanal. En fast frekvensuavhengig dempning og forsinkelse må angis for den andre kanalen. Dersom disse etterlates uspesifiserte, får man enhets-forsterkning og null forsinkelse. One can thus specify all the desired information by specifying the differential attenuation and the delay as functions of frequency for a single channel. A fixed frequency-independent attenuation and delay must be specified for the other channel. If these are left unspecified, you get unity gain and zero delay.

Således, for en hvilken som helst lydbildeposisjon, og derfor en hvilken som helst venstre/høyre overføringsfunksjon, kan differensialfase og amplitudejustering (filtrering) organiseres alt i en kanal eller den andre eller en hvilken som helst kombinasjon imellom. En av lydprosessorene 1500, 1501 kan forenkles til ikke mer enn en variabel impedans eller til bare en rett ledning. Den kan ikke være en åpen krets. Antar man at fase og amplitudejusteringen utføres i kun én kanal for å gi det nødvendige differensialet mellom de to kanalene, vil overføringsfunksjonene så være representert slik som i fig. 17A og 17B. Thus, for any audio image position, and therefore any left/right transfer function, differential phase and amplitude adjustment (filtering) can all be organized in one channel or the other or any combination in between. One of the audio processors 1500, 1501 can be simplified to no more than a variable impedance or to just a straight wire. It cannot be an open circuit. Assuming that the phase and amplitude adjustment is performed in only one channel to provide the necessary differential between the two channels, the transfer functions will then be represented as in fig. 17A and 17B.

Fig. 17A representerer en typisk overføringsfunksjon for differensialfasen for de to kanalene, der den venstre kanalen er uendret og den høyre kanalen gjennomgår fasejustering på en frekvensavhengig basis over audiospekteret. På tilsvarende måte representerer fig. 17B generelt en typisk overførings-funksjon for differensialamplituden av de to kanalene, hvor amplituden for den venstre kanalen er uendret og den høyre kanalen gjennomgår dempning på en frekvensavhengig basis over audiospekteret. Fig. 17A represents a typical differential phase transfer function for the two channels, where the left channel is unchanged and the right channel undergoes phase adjustment on a frequency-dependent basis across the audio spectrum. In a similar way, fig. 17B generally shows a typical transfer function for the differential amplitude of the two channels, where the amplitude of the left channel is unchanged and the right channel undergoes attenuation on a frequency-dependent basis across the audio spectrum.

Det vil forstås at lydposisjonene, eksempelvis 1500, 1501 i fig. 16, kan være analoge eller digitale og kan innbefatte noen eller alle av de følgende kretselementer: filtre, forsinkelser, inverterere, summerere, forsterkere og fase-forskyvere. Disse funksjonskretselementer kan organiseres på en hvilken som helst måte som resulterer i overførings-funksjonen. It will be understood that the sound positions, for example 1500, 1501 in fig. 16, may be analog or digital and may include some or all of the following circuit elements: filters, delays, inverters, adders, amplifiers and phase shifters. These functional circuit elements can be organized in any way that results in the transfer function.

Flere ekvivalente representasjoner av denne informasjon er mulig, og blir vanlig anvendt i relatert teknikk. Eksempelvis kan forsinkelsen angis som en faseendring på en hvilken som helst gitt frekvens, under anvendelse av ekviva-lensene : Several equivalent representations of this information are possible, and are commonly used in the related art. For example, the delay can be expressed as a phase change at any given frequency, using the equivalences:

Forsiktighet med anvendelse av denne ekvivalens behøves, fordi den ikke er tilstrekkelig til å angi hovedverdi av fase. Hele fasen kreves dersom ovenstående ekvivalenser skal holde. Care must be taken with the application of this equivalence, because it is not sufficient to indicate the principal value of phase. The entire phase is required if the above equivalences are to hold.

En hensiktsmessig representasjon som vanlig anvendes innenfor elektronikkteknikkfaget er den komplekse s-plan-representasjon. Alle filterkarakteristikker som er realiserbare under anvendelse av reelle analoge komponenter (og mange som ikke er dette) kan angis som et forhold mellom to polynomer i Laplace-kompleksfrekvensvariabelen s. Denne generelle form er: An appropriate representation that is commonly used within the electronics engineering field is the complex s-plane representation. All filter characteristics that are realizable using real analog components (and many that are not) can be expressed as a ratio of two polynomials in the Laplace complex frequency variable s. This general form is:

Hvor T(s) er overføringsfunksjonen i s-planet, er Einn(s) og Eut(s) henholdsvis inngangs- og utgangssignalene som funksjoner av s, og teller- og nevnerfunksjonene N(s) og D(s) er av formen: Where T(s) is the transfer function in the s-plane, Einn(s) and Eut(s) are respectively the input and output signals as functions of s, and the numerator and denominator functions N(s) and D(s) are of the form:

Det tiltrekkende ved denne angivelse er at den kan være meget kompakt. For å angi funksjonen fullstendig på alle frekvenser, uten behov for interpolering, trenger man kun å angi de n+1 koeffisienter a og de n+1 koeffisienter b. Med disse koeffisienter angitt, kan amplituden og fasen for over-føringsfunksjonen på en hvilken som helst frekvens lett utledes under anvendelse av velkjente fremgangsmåter. En ytterligere attraksjon ved denne angivelse er at den er den form som er mest lett utledbar fra analyse av en analog krets, og står derfor som den mest naturlige, kompakte og vel godtatte metode for å angi overføringsfunksjonen fra en slik krets. The attractive thing about this specification is that it can be very compact. To specify the function completely at all frequencies, without the need for interpolation, one only needs to specify the n+1 coefficients a and the n+1 coefficients b. With these coefficients specified, the amplitude and phase of the transfer function at any preferably frequency easily derived using well-known methods. A further attraction of this notation is that it is the form most easily deduced from analysis of an analog circuit, and therefore stands as the most natural, compact, and well-accepted method of specifying the transfer function of such a circuit.

Nok en annen representasjon som er hensiktsmessig for bruk for å beskrive den foreliggende oppfinnelse er z-plan-representasjonen. I den foretrukne utførelsesform av den foreliggende oppfinnelse vil signalprosessoren bli realisert som digitale filtre for å oppnå fordelen med fleksibilitet. Ettersom hver billedposisjon kan defineres av en overførings-funksjon, trenger man et form for filter der overførings-funksjonen lett og hurtig realiseres med et minimum av begrensninger med hensyn til hvilke funksjoner som kan oppnås. Et fullstendig programmerbart digitalt filter er passende for å tilfredsstille dette krav. Yet another representation suitable for use in describing the present invention is the z-plane representation. In the preferred embodiment of the present invention, the signal processor will be implemented as digital filters to achieve the advantage of flexibility. As each image position can be defined by a transfer function, a form of filter is needed in which the transfer function is easily and quickly realized with a minimum of restrictions with regard to which functions can be achieved. A fully programmable digital filter is suitable to satisfy this requirement.

Et slikt digitalt filter kan operere i frekvensområdet, i hvilket tilfelle signalet er først Fourier-omdannet til å bevege dette fra en tidsområderepresentasjon til en frekvens-områderepresentasjon. Filteramplituden og faseresponsen, bestemt ved hjelp av en av ovennevnte fremgangsmåter, blir så tilført frekvensområderepresentasjonen for signalet ved kompleks multiplisering. Til sist blir en invers Fourier-transformasjon tilført, hvilket bringer signalet tilbake til tidsområdet for digital-til-analog omforming. Such a digital filter can operate in the frequency domain, in which case the signal is first Fourier transformed to move it from a time-domain representation to a frequency-domain representation. The filter amplitude and phase response, determined using one of the above methods, are then added to the frequency range representation of the signal by complex multiplication. Finally, an inverse Fourier transform is applied, bringing the signal back into the time domain for digital-to-analog conversion.

Alternativt kan man angi responsen direkte i tidsområdet som en reell impulsrespons. Denne respons er matematisk ekvivalent med frekvensområdeamplituden og faseresponsen, og kan oppnås fra denne ved anvendelse av en invers Fourier-transformasjon. Man kan anvende denne impulsrespons direkte i tidsområdet ved å konvolvere denne med tidsområderepresenta-sj onen av signalet. Det kan demonstreres at operasjonen av konvolusjon i tidsområdet er matematisk identisk med multi-plikasjonsoperasjonen i frekvensområdet, slik at den direkte konvolusjon er fullstendig ekvivalent med frekvensområde-operasjonen som er detaljert angitt i foregående avsnitt. Alternatively, the response can be entered directly in the time domain as a real impulse response. This response is mathematically equivalent to the frequency domain amplitude and phase response, and can be obtained from this by applying an inverse Fourier transform. This impulse response can be used directly in the time domain by convolving this with the time domain representation of the signal. It can be demonstrated that the operation of convolution in the time domain is mathematically identical to the multiplication operation in the frequency domain, so that the direct convolution is completely equivalent to the frequency domain operation detailed in the previous section.

Ettersom samtlige digitale beregninger er diskrete i stedet for kontinuerlige, blir en diskret betegnelse foretrukket for en kontinuerlig. Det er hensiktsmessig å angi responsen direkte i form av koeffisienter som vil bli anvendt i et rekursivt direkte konvolusjonsdigitalt filter, og dette gjøres lett under anvendelse av z-planbetegning som har paralleller til s-planbetegningen. Dersom således T(z) er s-tidsområde-responsekvivalent med T(s) i frekvensområdet: hvor N(z) og D(z) har formen: As all digital calculations are discrete rather than continuous, a discrete designation is preferred to a continuous one. It is convenient to state the response directly in the form of coefficients that will be used in a recursive direct convolution digital filter, and this is easily done using z-plane notation which has parallels to the s-plane notation. Thus, if T(z) is the s-time range response equivalent to T(s) in the frequency range: where N(z) and D(z) have the form:

I denne betegnelse er koeffisientene c og d tilstrekkelig til å angi funksjonen som a- og b-koeffisientene gjorde i s-planet, slik at lik kompakthet er mulig. Z-planfilteret kan realiseres direkte dersom operatøren z fortolkes slik at In this designation, the coefficients c and d are sufficient to indicate the function that the a and b coefficients did in the s-plane, so that equal compactness is possible. The Z-plane filter can be realized directly if the operator z is interpreted so that

z~<l> er en forsinkelse av n samplingsintervaller. z~<l> is a delay of n sampling intervals.

De spesifiserende koeffisienter c og d er da direkte de multipliserende koeffisienter i realiseringen. Man må begrense spesifiseringen til kun negative potenser av z, ettersom disse tilsvarer positive forsinkelser. En positiv potens av z ville tilsvare en negativ forsinkelse, dvs. en respons før et stimuli ble tilført. The specifying coefficients c and d are then directly the multiplying coefficients in the realization. One must limit the specification to only negative powers of z, as these correspond to positive delays. A positive power of z would correspond to a negative delay, i.e. a response before a stimulus was applied.

Med disse betegnelser forhånden kan man beskrive utstyr for å tillate bred plassering av lydbilder, slik som tale og musikk. For disse formål kan lydprosessoren, ifølge den foreliggende oppfinnelse, eksempelvis prosessor 802 i fig. 8, foreligge som et variabelt to-baneanalogt filter med variable banekoplingsattenuatorer, slik som i fig. 18A. With these designations in advance, equipment can be described to allow wide placement of sound images, such as speech and music. For these purposes, the sound processor, according to the present invention, for example processor 802 in fig. 8, present as a variable two-path analog filter with variable path coupling attenuators, such as in fig. 18A.

I fig. 18A blir et monofont eller monauralt inngangssignal 1601 innmatet til to filtre 1610, 1630 og også til to potensiometre 1651, 1652. Utmatingene fra filtrene 1610, 1630 er forbundet med potensiometerne 1653, 1654. De fire potensiometrene 1651-1654 er anordnet som en såkalt styrespak-styring slik at de kan virke differensielt. En styrespak-akse tillater styring av potensiometre 1651, 1652. Når en beveger seg slik at det føres en større andel av dens innmating til dens utgang, blir den andre mekaniske reversert og fører en mindre andel av sin innmating til sin utgang. Potensiometrene 1653, 1654 blir på tilsvarende måte differensielt operert på en andre uavhengig styrespak-akse. Utgangssignaler fra potensiometerne 1653, 1654 føres til enhetsforsterknings-buffere, respektivt 1655, 1656, hvilke i sin tur driver respektive potensiometere 1657, 1658 som er koplet til å virke sammen. De øker eller minsker andelen av innmating som føres til utgangen i trinn. "Utgangs signal ene fra potensiometrene 1657, 1658 går til en reverserende svitsj 1659, som tillater filtersignalene å bli matet direkte eller ombyttet, til første innganger på summeringselementer 1660, 1670. In fig. 18A, a monophonic or monaural input signal 1601 is fed to two filters 1610, 1630 and also to two potentiometers 1651, 1652. The outputs from the filters 1610, 1630 are connected to the potentiometers 1653, 1654. The four potentiometers 1651-1654 are arranged as a so-called control lever - management so that they can act differentially. A joystick axis allows control of potentiometers 1651, 1652. When one moves so that a larger proportion of its input is fed to its output, the other is mechanically reversed and feeds a smaller proportion of its input to its output. The potentiometers 1653, 1654 are similarly differentially operated on a second independent joystick axis. Output signals from the potentiometers 1653, 1654 are fed to unity gain buffers, respectively 1655, 1656, which in turn drive respective potentiometers 1657, 1658 which are connected to work together. They increase or decrease the proportion of input that is fed to the output in steps. "Output signal one from the potentiometers 1657, 1658 goes to a reversing switch 1659, which allows the filter signals to be fed directly or interchanged, to first inputs of summing elements 1660, 1670.

Hvert reagerende summeringselement 1660, 1670 mottar på sin andre inngang en utmating fra potensiometere 1651, 1652. Summeringselement 1670 driver inverterer 1690, og svitsj 1691 tillater valg av det direkte eller inverte signal ved punkt 1683. Svitsj 1685 tillater valg av signalet 1683 eller inngangssignalet 1601 som drivsignal til attenuator 1686 som frembringer venstre kanals utmating 1688. Each responsive summing element 1660, 1670 receives at its second input an output from potentiometers 1651, 1652. Summing element 1670 drives inverter 1690, and switch 1691 allows selection of the direct or inverted signal at point 1683. Switch 1685 allows selection of signal 1683 or input signal 1601 as the drive signal to attenuator 1686 which produces the left channel output 1688.

Filtrene 1610 og 1630 er identiske, og ett er vist i detalj i fig. 18B. En enhetsforsterkningsbuffer 1611 mottar inngangssignalet 1601 og er kapasitivt koplet via kondensator 1612 til drivfilterelement 1613. Lignende filterelementer 1614 til 1618 er kaskadekoplet, og sluttfilterelement 1618 er koplet via kondensator 1619 og enhetsforsterkningsbuffer 1620 til drivinverterer 1621. Svitsj 1622 tillater valg av enten utmatingen fra buffer 1620 eller fra inverterer 1621 på filterutgang 1623. Filters 1610 and 1630 are identical, and one is shown in detail in FIG. 18B. A unity gain buffer 1611 receives the input signal 1601 and is capacitively coupled via capacitor 1612 to drive filter element 1613. Similar filter elements 1614 to 1618 are cascaded, and final filter element 1618 is coupled via capacitor 1619 and unity gain buffer 1620 to drive inverter 1621. Switch 1622 allows selection of either the output 20 from buffer 16 or from inverter 1621 on filter output 1623.

Filterelementer 1613 til og med 1618 er identiske og er vist i detalj i fig. 18C. De avviker kun i verdien av deres respektive kondensator 1631. Inngang 1632 er koplet til kondensator 1631 og motstand 1633 og motstand 1633 er koplet til den inverterende inngang på operasjonsforsterker 1634, hvis utgang 1636 er filterelementutgangen. Tilbakekoplingsmotstand 1635 er koplet til operasjonsforsterker 1634 på vanlig måte. Den ikke-inverterende inngang på operasjonsforsterker 1634 drives fra forbindelsesstedet mellom kondensator 1631 og en av motstandene 1637-1642, slik denne velges av svitsj 1643. Dette filter er et all-pass-filter med en faseforskyvning som varierer med frekvens i henhold til settingen av svitsj 1643. Filter elements 1613 through 1618 are identical and are shown in detail in FIG. 18C. They differ only in the value of their respective capacitor 1631. Input 1632 is connected to capacitor 1631 and resistor 1633 and resistor 1633 is connected to the inverting input of operational amplifier 1634, whose output 1636 is the filter element output. Feedback resistor 1635 is connected to operational amplifier 1634 in the usual way. The non-inverting input of operational amplifier 1634 is driven from the junction between capacitor 1631 and one of the resistors 1637-1642, as selected by switch 1643. This filter is an all-pass filter with a phase shift that varies with frequency according to the setting of switch 1643.

Tabell 1 opplister verdiene av kondensator 1631 som anvendes i hvert filterelement 1613-1618, og tabell 2 opplister motstandsverdiene som velges av svitsj 1643. Disse motstands-verdier er de samme for alle filterelementer 1613-1618. Table 1 lists the values of capacitor 1631 used in each filter element 1613-1618, and Table 2 lists the resistance values selected by switch 1643. These resistance values are the same for all filter elements 1613-1618.

En utførelsesform av summeringselementer 1660, 1670 er vist i fig. 18D, der to innganger 1661, 1662 for summering i operasjonsforsterker 1663 resulterer i en enkel utgang 1664. Forsterkninger fra inngang til utgang bestemmes av motstander 1665, 1667 og tilbakekoplingsmotstand 1666. I begge tilfeller drives inngang 1662 fra svitsj 1659, og inngang 1661 fra respektive styrespakepotensiometere 1651, 1652. An embodiment of summing elements 1660, 1670 is shown in fig. 18D, where two inputs 1661, 1662 for summation in operational amplifier 1663 result in a single output 1664. Gains from input to output are determined by resistors 1665, 1667 and feedback resistor 1666. In both cases, input 1662 is driven from switch 1659, and input 1661 from respective joystick potentiometers 1651, 1652.

Som eksempler på bildeplassering, viser tabell 3 innstilling-er og tilsvarende bildeposisjoner for å "fly" et lydbilde tilsvarende et helikopter på posisjoner godt over planet som innbefatter høyttalerne og lytteren. For å oppnå det ønskede monofonsignal for prosessen ifølge den foreliggende oppfinnelse, ble stereosporene på lydeffektplaten summert. Med utstyret som er vist satt opp som tabulert, projiseres realistiske lydbilder i rom på en slik måte at lytteren oppfatter et helikopter på de tabulerte stedene. As examples of image placement, Table 3 shows settings and corresponding image positions for "flying" a sound image similar to a helicopter at positions well above the plane that includes the speakers and the listener. In order to obtain the desired monophonic signal for the process according to the present invention, the stereo tracks on the sound effects board were summed. With the equipment shown set up as tabulated, realistic sound images are projected in space in such a way that the listener perceives a helicopter at the tabulated locations.

Anmerkning til tabell 3: Note to table 3:

Setting av reverserende svitsj 1659 er i begge tilfeller slik at signaler fra element 1657 driver element 1660, og de fra element 1658 driver element 1670. Setting of reversing switch 1659 is in both cases such that signals from element 1657 drive element 1660, and those from element 1658 drive element 1670.

Ved tilføyelse av to ekstra elementer til de ovenstående kretser, blir en ekstra mulighet for sideveis forskyvning av lytteområdet tilveiebrakt. Det vil imidlertid forstås at dette ikke er vesentlig for skapningen av bilder. De ekstra elementer er vist i fig. 19, hvor venstre og høyre kanaler 1701, 1702 kan leveres fra respektive utganger 1688, 1689 hos signalprosessoren i fig. 16. I hver kanal blir en forsinkelse 1703, 1704 respektivt innført, og utgangssignalene fra forsinkelsene 1703, 1704 blir lydprosessorutmatinger 1705, 1706. By adding two additional elements to the above circuits, an additional possibility of lateral displacement of the listening area is provided. However, it will be understood that this is not essential for the creation of images. The additional elements are shown in fig. 19, where left and right channels 1701, 1702 can be delivered from respective outputs 1688, 1689 of the signal processor in fig. 16. In each channel, a delay 1703, 1704 is respectively introduced, and the outputs of the delays 1703, 1704 become audio processor outputs 1705, 1706.

Forsinkelser som introduseres i kanalene ved hjelp av dette tilleggsutstyr er uavhengige av frekvens. De kan således hver fullstendig kjennetegnes ved et enkelt reelt tall. La den venstre kanalens forsinkelse være t(v), og den høyre kanalens forsinkelse t(h). Som i det ovenstående tilfellet er kun differensialet mellom forsinkelsene vesentlig og man kan fullstendig styre utstyret ved å spesifisere differansen mellom forsinkelsene. Ved realisering vil man tilføye en fast forsinkelse til hver kanal for å sikre at minst ingen negativ forsinkelse kreves for å oppnå det ønskede differensial. Man definerer en differensial forsinkelse t(d) som: Delays introduced into the channels by means of this additional equipment are independent of frequency. They can thus each be completely characterized by a single real number. Let the left channel's delay be t(v), and the right channel's delay t(h). As in the above case, only the differential between the delays is significant and one can completely control the equipment by specifying the difference between the delays. When realized, a fixed delay will be added to each channel to ensure that at least no negative delay is required to achieve the desired differential. One defines a differential delay t(d) as:

Dersom t(d) er null, vil de effekter som frembringes være i alt vesentlig upåvirket av tilleggsutstyret. Dersom t(d) er positiv, vil lytteområdets senter bli forskjøvet sideveis til høyre langs dimensjonen (e) i fig. 3. En positiv verdi av t(d) vil tilsvare en positiv verdi av (e), som betegner forskyvning mot høyre. På tilsvarende måte kan en forskyvning mot venstre, som tilsvarer en negativ verdi av (e) oppnås ved hjelp av en negativ verdi av t(d). Ved hjelp av denne fremgangsmåte kan hele lytteområdet, i hvilket lyttere oppfatter illusjonen, projiseres sideveis til et hvilket som helst punkt mellom eller forbi høyttalerne. Det er lett mulig for dimensjon (e) å overskride halvparten av dimensjon (s), og gode resultater er blitt oppnådd ut til ekstreme for-skyvninger hvor dimensjon (e) er 83 % av dimensjon (s). Dette kan ikke være grensen for teknikken, men representerer grensen for eksperimenteringen i øyeblikket. If t(d) is zero, the effects produced will be largely unaffected by the additional equipment. If t(d) is positive, the center of the listening area will be shifted laterally to the right along dimension (e) in fig. 3. A positive value of t(d) will correspond to a positive value of (e), which denotes displacement to the right. Similarly, a shift to the left, which corresponds to a negative value of (e), can be obtained by means of a negative value of t(d). Using this method, the entire listening area in which listeners perceive the illusion can be projected laterally to any point between or past the speakers. It is easily possible for dimension (e) to exceed half of dimension (s), and good results have been achieved up to extreme displacements where dimension (e) is 83% of dimension (s). This may not be the limit of the technique, but represents the limit of experimentation at the moment.

Oppfinnelsen kan således oppsummeres som følger: The invention can thus be summarized as follows:

To ordinære, atskilte høyttalere kan frembringe et lydbilde som synes for lytteren å komme fra et sted som er et annet enn det faktiske stedet for høyttalerne. Lydsignalene behandles i henhold til denne oppfinnelse før de gjengis slik at ikke noe spesielt avspillingsutstyr kreves. Selv om to høyttalere kreves, er den frembragte lyd ikke den samme som vanlig stereofonisk, venstre og høyre lyd, men stereosignaler kan behandles og forbedres i henhold til foreliggende oppfinnelse. Den oppfinneriske lydbehandling involverer å oppdele hvert monaurale eller enkeltkanalssignal i to signaler og så justere differensialfasen og amplituden av de to signalene på en frekvensavhengig basis i henhold til en empirisk utledet overføringsfunksjon. Resultatene av denne behandling er at det tilsynelatende lydkildested kan anbringes etter ønske, forutsatt at overføringsfunksjonen er riktig utledet. Hver overføringsfunksjon har en empirisk utledet fase og amplitudejustering som oppbygges for hvert forutbestemt frekvensintervall over hele lydspekteret og muliggjør et separat lydkildested. Ved å tilveiebringe et passende antall av forskjellige overføringsfunksjoner og å velge disse på tilsvarende måte, kan lydkilden for lytteren synes å bevege seg. Overføringsfunksjonen kan realiseres ved hjelp av analoge kretskomponenter eller det monaurale signalet kan digitaliseres og digitale filtre og lignende anvendes. Two ordinary, separate speakers can produce a sound image that appears to the listener to come from a location other than the actual location of the speakers. The sound signals are processed according to this invention before they are reproduced so that no special playback equipment is required. Although two speakers are required, the sound produced is not the same as conventional stereophonic, left and right sound, but stereo signals can be processed and enhanced according to the present invention. The inventive audio processing involves splitting each monaural or single-channel signal into two signals and then adjusting the differential phase and amplitude of the two signals on a frequency-dependent basis according to an empirically derived transfer function. The results of this treatment are that the apparent sound source location can be located as desired, provided that the transfer function is correctly derived. Each transfer function has an empirically derived phase and amplitude adjustment that builds for each predetermined frequency interval across the entire audio spectrum and enables a separate audio source location. By providing an appropriate number of different transfer functions and selecting them accordingly, the sound source can appear to the listener to move. The transfer function can be realized using analogue circuit components or the monaural signal can be digitized and digital filters and the like used.

Claims (9)

1. Fremgangsmåte for å frembringe og lokalisere et tilsynelatende opprinnelsessted for en valgt lyd fra et elektrisk signal som tilsvarer den valgte lyd i en forutbestemt lokalisert posisjon hvor som helst innenfor et tredimensjonalt rom som inneholder en lytter ved å skille det elektriske signalet i respektive første og andre kanals signaler, å utføre fase- og amplitudeendring på et av nevnte første eller andre kanals signaler, og å tilføre nevnte første og andre kanals signaler til to lydtransdusere, karakterisert ved trinnene: å koble nevnte første og andre kanals signaler til respektive lydprosessorer (1501, 1502) for å endre amplituden og forskyve fasen for begge av nevnte første og andre kanals signaler for suksessive diskrete frekvensbånd over audiospektrumet, med hver suksessive faseforskyvning forskjellig fra den foregående faseforskyvning i forhold til null grader (fig. 17A), hvorved frembringes første og andre kanals modifiserte signaler (1503, 1504) for å skape et fasedifferensial og et amplitudedifferensial mellom de to kanalers modifiserte signaler, og å opprettholde den første kanalens signal separat og vekk fra den andre kanalens signal etter trinnet med endring av amplituden og forskyvning av fasen.1. Method of producing and locating an apparent place of origin of a selected sound from an electrical signal corresponding to the selected sound at a predetermined localized position anywhere within a three-dimensional space containing a listener by separating the electrical signal into respective first and second channels signals, to perform phase and amplitude change on one of said first or second channel signals, and to supply said first and second channel signals to two sound transducers, characterized by the steps: connecting said first and second channel signals to respective sound processors (1501, 1502 ) to change the amplitude and shift the phase of both of said first and second channel signals for successive discrete frequency bands across the audio spectrum, with each successive phase shift different from the preceding phase shift relative to zero degrees (Fig. 17A), thereby producing first and second channel modified signals (1503, 1504) to create a phase difference sial and an amplitude differential between the two channels' modified signals, and maintaining the first channel's signal separate and apart from the second channel's signal after the step of changing the amplitude and shifting the phase. 2. Fremgangsmåte som angitt i krav 1, karakterisert ved dessuten trinnet å koble minst et av nevnte første og andre kanals signaler til minst et all-pass-filter (1610, 1630) som inneholder en operasjonsforsterkerdel, idet nevnte filter har en forutbestemt frekvensrespons og topologi som betegnet ved en empirisk utledet overføringsfunksjon T(s) for den Laplace-komplekse frekvensvariable (s).2. Method as stated in claim 1, further characterized by the step of connecting at least one of said first and second channel signals to at least one all-pass filter (1610, 1630) containing an operational amplifier part, said filter having a predetermined frequency response and topology which denoted by an empirically derived transfer function T(s) for the Laplace complex frequency variable (s). 3. Fremgangsmåte som angitt i krav 2, karakterisert ved at trinnet med å koble minst et av nevnte signaler til minst et filter omfatter å koble nevnte minst ene signal til en kaskadekoblet rekke av filtre (1613-1618).3. Method as stated in claim 2, characterized in that the step of connecting at least one of said signals to at least one filter comprises connecting said at least one signal to a cascaded series of filters (1613-1618). 4 . Fremgangsmåte som angitt i krav 1, karakterisert ved dessuten trinnet å koble nevnte første og andre kanals modifiserte signaler til et lagringsmedium (805) som er i stand til å regenerere de lagrede signaler på et påfølgende valgt tidspunkt.4. Method as stated in claim 1, characterized by the further step of connecting said first and second channel modified signals to a storage medium (805) which is capable of regenerating the stored signals at a subsequent selected time. 5 . Fremgangsmåte som angitt i krav 1, karakterisert ved at respektive lydprosessorer (1501, 1502) har en forutbestemt faseoverføringsfunksjon for å utføre nevnte differensialfaseforskyvning og en forutbestemt ampi itudeoverføringsfunksjon for å utføre nevnte differen-s i alampi i tudeendr ing.5 . Method as stated in claim 1, characterized in that respective sound processors (1501, 1502) have a predetermined phase transfer function to perform said differential phase shift and a predetermined amplitude transfer function to perform said difference in amplitude change. 6. Fremgangsmåte som angitt i krav 1, karakterisert ved at de suksessive, diskrete frekvensbånd over audiospektrumet velges til å være ved 40 Hz intervaller.6. Method as stated in claim 1, characterized in that the successive, discrete frequency bands over the audio spectrum are chosen to be at 40 Hz intervals. 7. System for å kondisjonere et elektrisk signal for å frembringe og lokalisere en lydfølelsesmessig illusjon av et tilsynelatende opprinnelsessted for minst en valgt lyd fra det elektriske signal som tilsvarer den valgte lyd ved en forutbestemt og lokalisert posisjon som befinner seg innenfor et tredimensjonalt rom som inneholder en lytter og ved å skille det elektriske signalet i respektive første og andre kanals signaler, å utføre fase- og amplitudeendring på et av nevnte første og andre kanals signaler, og å mate nevnte første og andre kanals signaler til to lydtransdusere, karakterisert ved at nevnte første og andre kanals signaler er tilkoblet respektive første og andre kanals lydprosessorkretser (1501, 1502), hver for å endre amplituden og forskyve fasen for det respektive elektriske signal i suksessive, diskrete frekvensbånd over audiospektrumet, med hver suksessive faseforskyvning forskjellig fra den foregående faseforskyvning i forhold til null grader (fig. 17A), hvorved frembringes første og andre kanals modifiserte signaler (1503,1504) for å skape et fasedifferensial og et ampiitudedifferensial mellom de to kanalers modifiserte signaler, og at utmatninger fra nevnte behandlingskretser (1501, 1502) opprettholdes adskilte og er tilkoblet de to transduserne.7. System for conditioning an electrical signal to produce and locate an aural illusion of an apparent place of origin for at least one selected sound from the electrical signal corresponding to the selected sound at a predetermined and localized position located within a three-dimensional space containing a listener and by separating the electrical signal into respective first and second channel signals, performing phase and amplitude change on one of said first and second channel signals, and feeding said first and second channel signals to two sound transducers, characterized in that said first and second channel signals are coupled to respective first and second channel audio processor circuits (1501, 1502), each to change the amplitude and shift the phase of the respective electrical signal in successive discrete frequency bands across the audio spectrum, with each successive phase shift different from the preceding phase shift relative to zero degrees (fig. 17A), whereby the nge's first and second channel's modified signals (1503,1504) to create a phase differential and an amplitude differential between the two channels' modified signals, and that outputs from said processing circuits (1501, 1502) are maintained separately and are connected to the two transducers. 8. System som angitt i krav 7, karakterisert ved dessuten å innbefatte et lagringssystem (805) som er koblet til behandlingskretsen (802) for å lagre nevnte modifiserte signaler i et medium som er i stand til å regenerere nevnte lagrede signaler ved et påfølgende valgt tidspunkt.8. System as set forth in claim 7, characterized by further including a storage system (805) which is connected to the processing circuit (802) to store said modified signals in a medium capable of regenerating said stored signals at a subsequent selected time. 9. System som angitt i krav 7, karakterisert ved at de diskrete frekvensbånd er 40 Hz brede.9. System as specified in claim 7, characterized in that the discrete frequency bands are 40 Hz wide.
NO893522A 1988-09-02 1989-09-01 Method and apparatus for making sound image NO175229C (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US07/239,981 US5046097A (en) 1988-09-02 1988-09-02 Sound imaging process
US39898889A 1989-08-28 1989-08-28

Publications (4)

Publication Number Publication Date
NO893522D0 NO893522D0 (en) 1989-09-01
NO893522L NO893522L (en) 1990-03-05
NO175229B true NO175229B (en) 1994-06-06
NO175229C NO175229C (en) 1994-09-14

Family

ID=26933039

Family Applications (1)

Application Number Title Priority Date Filing Date
NO893522A NO175229C (en) 1988-09-02 1989-09-01 Method and apparatus for making sound image

Country Status (18)

Country Link
EP (1) EP0357402B1 (en)
JP (1) JP3205808B2 (en)
KR (1) KR930002147B1 (en)
AR (1) AR245858A1 (en)
AT (1) ATE123369T1 (en)
AU (1) AU621655B2 (en)
BG (1) BG60225B2 (en)
CA (1) CA1329911C (en)
DE (1) DE68922885T2 (en)
DK (1) DK433789A (en)
ES (1) ES2075053T3 (en)
FI (1) FI894143A (en)
HU (1) HUT59523A (en)
IL (1) IL91464A (en)
NO (1) NO175229C (en)
NZ (1) NZ230517A (en)
PL (1) PL163716B1 (en)
RU (1) RU2092979C1 (en)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL96553A (en) * 1989-12-07 1994-04-12 Q Sound Ltd Sound imaging system for a video game
EP0520068B1 (en) * 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JPH05145743A (en) * 1991-11-21 1993-06-11 Ricoh Co Ltd Image producing device
EP0563929B1 (en) * 1992-04-03 1998-12-30 Yamaha Corporation Sound-image position control apparatus
US6490359B1 (en) 1992-04-27 2002-12-03 David A. Gibson Method and apparatus for using visual images to mix sound
ATE180376T1 (en) * 1992-07-06 1999-06-15 Adaptive Audio Ltd ADAPTIVE AUDIO SYSTEMS AND SOUND REPRODUCTION SYSTEMS
JP2870562B2 (en) * 1992-11-30 1999-03-17 日本ビクター株式会社 Method of sound image localization control
WO1994024836A1 (en) * 1993-04-20 1994-10-27 Sixgraph Technologies Ltd Interactive sound placement system and process
US5436975A (en) * 1994-02-02 1995-07-25 Qsound Ltd. Apparatus for cross fading out of the head sound locations
US5596644A (en) * 1994-10-27 1997-01-21 Aureal Semiconductor Inc. Method and apparatus for efficient presentation of high-quality three-dimensional audio
US5850453A (en) * 1995-07-28 1998-12-15 Srs Labs, Inc. Acoustic correction apparatus
RU2106075C1 (en) * 1996-03-25 1998-02-27 Владимир Анатольевич Ефремов Spatial sound playback system
US5970152A (en) * 1996-04-30 1999-10-19 Srs Labs, Inc. Audio enhancement system for use in a surround sound environment
KR100370413B1 (en) * 1996-06-30 2003-04-10 삼성전자 주식회사 Method and apparatus for converting the number of channels when multi-channel audio data is reproduced
JPH10108300A (en) * 1996-09-27 1998-04-24 Yamaha Corp Sound field reproduction device
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6281749B1 (en) 1997-06-17 2001-08-28 Srs Labs, Inc. Sound enhancement system
US6016473A (en) * 1998-04-07 2000-01-18 Dolby; Ray M. Low bit-rate spatial coding method and system
GB2343347B (en) 1998-06-20 2002-12-31 Central Research Lab Ltd A method of synthesising an audio signal
JP3781902B2 (en) 1998-07-01 2006-06-07 株式会社リコー Sound image localization control device and sound image localization control method
GB2342024B (en) * 1998-09-23 2004-01-14 Sony Uk Ltd Audio processing
US7031474B1 (en) 1999-10-04 2006-04-18 Srs Labs, Inc. Acoustic correction apparatus
US7277767B2 (en) 1999-12-10 2007-10-02 Srs Labs, Inc. System and method for enhanced streaming audio
GB2370176A (en) * 2000-08-10 2002-06-19 James Gregory Stanier A simple microphone unit for the vertical localisation and enhancement of live sounds
JP4602204B2 (en) 2005-08-31 2010-12-22 ソニー株式会社 Audio signal processing apparatus and audio signal processing method
JP4637725B2 (en) 2005-11-11 2011-02-23 ソニー株式会社 Audio signal processing apparatus, audio signal processing method, and program
JP4894386B2 (en) 2006-07-21 2012-03-14 ソニー株式会社 Audio signal processing apparatus, audio signal processing method, and audio signal processing program
JP4835298B2 (en) 2006-07-21 2011-12-14 ソニー株式会社 Audio signal processing apparatus, audio signal processing method and program
US8050434B1 (en) 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US8908873B2 (en) 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
EP2124486A1 (en) * 2008-05-13 2009-11-25 Clemens Par Angle-dependent operating device or method for generating a pseudo-stereophonic audio signal
JP5499513B2 (en) * 2009-04-21 2014-05-21 ソニー株式会社 Sound processing apparatus, sound image localization processing method, and sound image localization processing program
CN103329571B (en) 2011-01-04 2016-08-10 Dts有限责任公司 Immersion audio presentation systems
US9164724B2 (en) 2011-08-26 2015-10-20 Dts Llc Audio adjustment system
EP2810453B1 (en) * 2012-01-17 2018-03-14 Koninklijke Philips N.V. Audio source position estimation
WO2017211448A1 (en) 2016-06-06 2017-12-14 Valenzuela Holding Gmbh Method for generating a two-channel signal from a single-channel signal of a sound source
US10511909B2 (en) * 2017-11-29 2019-12-17 Boomcloud 360, Inc. Crosstalk cancellation for opposite-facing transaural loudspeaker systems

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4152542A (en) * 1971-10-06 1979-05-01 Cooper Duane P Multichannel matrix logic and encoding systems
US4308424A (en) * 1980-04-14 1981-12-29 Bice Jr Robert G Simulated stereo from a monaural source sound reproduction system
NL8303945A (en) * 1983-11-17 1985-06-17 Philips Nv DEVICE FOR REALIZING A PSEUDO STEREO SIGNAL.
JPS61281799A (en) * 1985-06-07 1986-12-12 Dainabekutaa Kk Sound signal reproducing system
US4759065A (en) * 1986-09-22 1988-07-19 Harman International Industries, Incorporated Automotive sound system
WO1988009105A1 (en) * 1987-05-11 1988-11-17 Arthur Jampolsky Paradoxical hearing aid

Also Published As

Publication number Publication date
DE68922885T2 (en) 1995-10-12
NO893522D0 (en) 1989-09-01
ATE123369T1 (en) 1995-06-15
BG60225B2 (en) 1993-12-30
RU2092979C1 (en) 1997-10-10
DK433789D0 (en) 1989-09-01
KR930002147B1 (en) 1993-03-26
AR245858A1 (en) 1994-02-28
CA1329911C (en) 1994-05-31
KR900005841A (en) 1990-04-14
AU621655B2 (en) 1992-03-19
EP0357402A2 (en) 1990-03-07
NZ230517A (en) 1992-10-28
EP0357402A3 (en) 1991-10-02
PL163716B1 (en) 1994-04-29
FI894143A0 (en) 1989-09-01
DK433789A (en) 1990-03-03
EP0357402B1 (en) 1995-05-31
ES2075053T3 (en) 1995-10-01
NO175229C (en) 1994-09-14
AU4100089A (en) 1990-03-08
FI894143A (en) 1990-03-03
IL91464A0 (en) 1990-04-29
JP3205808B2 (en) 2001-09-04
NO893522L (en) 1990-03-05
JPH02298200A (en) 1990-12-10
DE68922885D1 (en) 1995-07-06
IL91464A (en) 1994-11-28
HUT59523A (en) 1992-05-28

Similar Documents

Publication Publication Date Title
NO175229B (en)
US5208860A (en) Sound imaging method and apparatus
US5105462A (en) Sound imaging method and apparatus
US5046097A (en) Sound imaging process
Snow Basic principles of stereophonic sound
US5598478A (en) Sound image localization control apparatus
US4817149A (en) Three-dimensional auditory display apparatus and method utilizing enhanced bionic emulation of human binaural sound localization
US5440639A (en) Sound localization control apparatus
CA2162567C (en) Stereophonic reproduction method and apparatus
KR101177853B1 (en) Audio signal reproduction apparatus and method thereof
US9014404B2 (en) Directional electroacoustical transducing
US5136651A (en) Head diffraction compensated stereo system
US5034983A (en) Head diffraction compensated stereo system
JPH09505702A (en) Binaural signal processor
EP0677235B1 (en) Sound image manipulation apparatus for sound image enhancement
Gardner Image fusion, broadening, and displacement in sound location
Snow Basic principles of stereophonic sound
JP2005535217A (en) Audio processing system
JPH1146400A (en) Sound image localization device
US20030169886A1 (en) Method and apparatus for encoding mixed surround sound into a single stereo pair
JP4226238B2 (en) Sound field reproduction device
DK180449B1 (en) A method and system for real-time implementation of head-related transfer functions
JPH0795697A (en) Surround signal processor and video/sound reproducing device
JPH07203597A (en) Headphone reproducing device
Wilkinson AD-3D: HRTF based 3D Audio Designer