WO2018066384A1 - 信号処理装置および方法、並びにプログラム - Google Patents

信号処理装置および方法、並びにプログラム Download PDF

Info

Publication number
WO2018066384A1
WO2018066384A1 PCT/JP2017/034240 JP2017034240W WO2018066384A1 WO 2018066384 A1 WO2018066384 A1 WO 2018066384A1 JP 2017034240 W JP2017034240 W JP 2017034240W WO 2018066384 A1 WO2018066384 A1 WO 2018066384A1
Authority
WO
WIPO (PCT)
Prior art keywords
sound
far
field
signal
sound reproduction
Prior art date
Application number
PCT/JP2017/034240
Other languages
English (en)
French (fr)
Inventor
悠 前野
祐基 光藤
芳明 及川
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to US16/338,014 priority Critical patent/US10757505B2/en
Priority to BR112019006368A priority patent/BR112019006368A2/pt
Priority to JP2018543840A priority patent/JP7010231B2/ja
Priority to KR1020197008681A priority patent/KR20190059905A/ko
Priority to EP17858223.5A priority patent/EP3525484A4/en
Priority to CN201780060680.8A priority patent/CN109792578A/zh
Publication of WO2018066384A1 publication Critical patent/WO2018066384A1/ja
Priority to US16/928,174 priority patent/US20200344550A1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • G10K11/26Sound-focusing or directing, e.g. scanning
    • G10K11/34Sound-focusing or directing, e.g. scanning using electrical steering of transducer arrays, e.g. beam steering
    • G10K11/341Circuits therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation

Definitions

  • the present technology relates to a signal processing device, method, and program, and more particularly, to a signal processing device, method, and program that can reproduce different sounds in the distance and the vicinity.
  • Non-Patent Document 1 a local sound field forming technique based on superdirectivity control using a parametric speaker has been proposed (for example, see Non-Patent Document 1).
  • the present technology has been made in view of such a situation, and makes it possible to reproduce different sounds in the distance and the vicinity.
  • the signal processing device generates a far-field sound reproduction signal for reproducing sound in the far-field listening area by performing filter processing using the far-field sound reproduction filter coefficient on the first sound source signal.
  • a near sound reproduction signal for reproducing sound in a near listening area different from the far listening area by performing a filtering process using a near sound reproduction filter coefficient on the far sound filter unit and the second sound source signal The neighborhood filter part which produces
  • the vicinity sound reproduction signal can be a signal for generating an evanescent wave.
  • the signal processing device further includes a near sound field processing unit that determines an attenuation rate of the evanescent wave according to a boundary position between the far listening region and the near listening region, and the nearby filter unit includes a plurality of the sound field processing units. Filter processing can be performed using the neighborhood sound reproduction filter coefficient corresponding to the determined attenuation rate among the neighborhood sound reproduction filter coefficients.
  • the signal processing device further includes a near sound field processing unit that determines a position of a control point according to a boundary position between the far listening area and the near listening area, and the near filter section includes a plurality of the near sound areas. Filter processing can be performed using the neighboring sound reproduction filter coefficient corresponding to the determined position of the control point among the reproduction filter coefficients.
  • the signal processing apparatus further includes a far field processing unit that determines a position of a control point according to a boundary position between the far listening region and the near listening region, and the far filter unit includes a plurality of far sounds. Filter processing can be performed using the far-field sound reproduction filter coefficient corresponding to the determined position of the control point among the reproduction filter coefficients.
  • the far-field sound reproduction signal can be a signal for generating a propagation wave.
  • the signal processing device includes a far field processing unit that determines a gain according to a boundary position between the far listening area and the near listening area, and the first sound source signal or the far sound based on the determined gain.
  • a remote gain adjustment unit for adjusting the gain of the reproduction signal can be further provided.
  • the signal processing device includes a near sound field processing unit that determines a gain according to a boundary position between the far listening area and the near listening area, and the second sound source signal or the near sound based on the determined gain.
  • a neighborhood gain adjusting unit for adjusting the gain of the reproduction signal can be further provided.
  • the first sound source signal and the second sound source signal can be used as signals for reproducing sounds of different contents.
  • the signal processing device may further include a speaker array that reproduces sound based on a signal obtained by synthesizing the far-field sound reproduction signal and the near sound reproduction signal.
  • the signal processing device may further include a first speaker array that reproduces sound based on the far-field sound reproduction signal and a second speaker array that reproduces sound based on the near-field reproduction signal.
  • the sound based on the far-field sound reproduction signal can be reproduced at a different timing from the sound based on the near-field sound reproduction signal.
  • the sound based on the far-field sound reproduction signal can be used as a sound for masking the sound based on the near-field sound reproduction signal.
  • the signal processing apparatus may further include a sound field boundary control unit that determines a boundary position between the far listening area and the nearby listening area based on a listener's position in space.
  • a signal processing method or program performs a far sound reproduction signal for reproducing sound in a far listening area by performing filter processing using a far sound reproduction filter coefficient on a first sound source signal. And a second sound source signal is subjected to filter processing using a near sound reproduction filter coefficient, thereby generating a near sound reproduction signal for reproducing sound in a near listening area different from the far listening area. Including the steps of:
  • a far sound reproduction signal for reproducing sound in the far listening area is generated by performing filter processing using the far sound reproduction filter coefficient on the first sound source signal, By performing a filtering process using the near sound reproduction filter coefficient on the two sound source signals, a near sound reproduction signal for reproducing sound in a near listening area different from the far listening area is generated.
  • different sounds can be played in the distance and the vicinity.
  • two sound fields are simultaneously formed by one speaker array obtained by arranging a plurality of speakers in a straight line.
  • the sound field in which the sound can be heard only in the region near the speaker array (hereinafter also referred to as the near sound reproduction sound field) and the sound field in which the sound can be heard far away from the speaker array. (Hereinafter also referred to as a far-field reproduction sound field).
  • the near sound reproduction sound field is formed, for example, by reproducing sound based on a near sound reproduction signal for generating an evanescent wave.
  • the evanescent wave is a wave having a property that sound pressure is exponentially attenuated in a direction perpendicular to the speaker array.
  • Such a near field reproduction sound field due to the evanescent wave is a sound field in which a sound pressure sufficient for listening is maintained only in the vicinity of the speaker array, and the sound pressure is sharply attenuated in the distance.
  • a far-field sound reproduction sound field is formed by reproducing sound based on a far-field sound reproduction signal for generating a propagation wave that propagates to a distance such as a plane wave or a spherical wave.
  • a far-field sound field is formed by plane waves.
  • Such a far-field sound reproduction sound field due to the propagating wave is a sound field that maintains a sound pressure sufficient for listening even at a distance far from the speaker array.
  • the near-field sound field and the far-field sound field are formed simultaneously, and the sound in the near-field sound field is reproduced sufficiently larger than the sound in the far-field sound field near the speaker array. By doing so, different sounds can be reproduced near and far from the speaker array.
  • the wavefront of the reproduced sound is, for example, as shown in FIG. In FIG. 1, the vertical direction and the horizontal direction indicate directions in the space, and the shading in the portion indicated by the arrow Q11 indicates the amplitude of the wavefront of the reproduced sound.
  • one linear speaker array is arranged at the position indicated by the arrow A11, and the linear speaker array allows a sound based on a near sound reproduction signal (hereinafter also referred to as a near sound) and a sound based on a far sound reproduction signal. (Hereinafter also referred to as a far-field sound). That is, the near sound reproduction sound field and the far sound reproduction sound field are formed simultaneously.
  • a near sound reproduction signal hereinafter also referred to as a near sound
  • a far sound reproduction signal hereinafter also referred to as a far-field sound
  • the near sound is an evanescent wave and the far sound is a plane wave
  • these waves are waves in different regions in the spatial spectrum, that is, in the spatio-temporal spectrogram, so they do not interfere with each other, Can distinguish distant sounds.
  • the sound pressure at each position in the space is as indicated by an arrow Q12, and the vicinity of the linear speaker array is a nearby sound listening area LE11, and the area away from the linear speaker array is a remote sound receiving sound. It becomes area
  • the shading at each position indicates the sound pressure at those positions.
  • the sound pressure of the near sound and the sound pressure of the distant sound are attenuated with respect to the y direction, for example, as shown in FIG. .
  • the vertical axis represents the sound pressure
  • the horizontal axis represents the position in the y direction.
  • the straight line L11 indicates the sound pressure of the neighboring sound at each position in the y direction, and the sound pressure indicated by the straight line L11 is 1 / e y when the distance in the y direction from the straight speaker array is y .
  • the curve L12 indicates the sound pressure of the far-field sound at each position in the y direction, and the sound pressure indicated by the curve L12 is 1 / y when the distance in the y direction from the linear speaker array is y. Become.
  • region R11 where the sound pressure of the near sound is larger than the far sound in the space becomes the listening region LE11 shown in FIG. 1, and the region R12 where the sound pressure of the far sound is larger than the near sound is shown in FIG. It becomes area
  • the near sound not only the near sound but also the far sound can be heard by the listener, but the difference in sound pressure between the near sound and the far sound can be made sufficiently large so that the far sound can be heard sufficiently small by the listener. Is possible. Further, in the region R12, the nearby sound is greatly attenuated, and the listener can hear only the far sound.
  • a boundary position between the region R11 and the region R12 that is, a position in the y direction where the sound pressures of the near sound and the far sound have the same level (size) will be referred to as a sound field boundary position.
  • FIG. 3 is a diagram illustrating a configuration example of an embodiment of a sound field forming device for different perspective according to the present technology.
  • the far and far sound field forming apparatus 11 includes a far field processing unit 21, a gain adjusting unit 22, a filter unit 23, a near sound field processing unit 24, a gain adjusting unit 25, a filter unit 26, an adding unit 27, and a speaker array 28. Have.
  • the far position sound field processing unit 21 and the near sound field processing unit 24 are compared with the boundary position between the near sound reproduction sound field and the far sound reproduction sound field, that is, the near sound listening area and the far field. Control information for controlling the sound field boundary position, which is the boundary position with the sound listening area, is supplied.
  • control information is listener position information indicating the position of the listener in space, boundary position information indicating the position of the sound field boundary, and the like.
  • boundary position information may be input manually or may be determined in advance.
  • the far field processing unit 21 determines the sound field boundary position based on the supplied control information.
  • the far field processing unit 21 includes a sound field boundary control unit 41, a far sound reproduction filter coefficient recording unit 42, and a filter coefficient selection unit 43.
  • the sound field boundary control unit 41 determines a sound field boundary position based on the supplied control information, and determines a gain value for gain adjustment of the far-field sound based on the determination result, and sends it to the gain adjustment unit 22. Supply.
  • the gain value for adjusting the far sound gain is also particularly referred to as a far sound gain value.
  • the sound field boundary control unit 41 also selects an appropriate far sound reproduction filter from among a plurality of far sound reproduction filter coefficients recorded in the far sound reproduction filter coefficient recording unit 42 based on the determination result of the sound field boundary position. Distant sound reproduction filter coefficient selection information for selecting a coefficient is generated and supplied to the filter coefficient selection unit 43.
  • the far sound reproduction filter coefficient recording unit 42 records in advance a plurality of far sound reproduction filter coefficients that are acoustic filter coefficients for forming a far sound reproduction sound field farther from the speaker array 28 than the predetermined sound field boundary position.
  • the far-field sound reproduction filter coefficient recorded is supplied to the filter coefficient selection unit 43.
  • the filter coefficient selection unit 43 selects one of a plurality of far-field sound reproduction filter coefficients recorded in the far-field sound reproduction filter coefficient recording unit 42. 1 is selected and supplied to the filter unit 23.
  • the gain adjusting unit 22 performs gain adjustment on the supplied sound source signal based on the far-field sound gain value supplied from the sound field boundary control unit 41 and supplies the obtained sound source signal to the filter unit 23.
  • the sound source signal supplied to the gain adjusting unit 22 is a time domain acoustic signal for reproducing a far-field sound.
  • the filter unit 23 generates a far sound reproduction signal by performing filter processing using the far sound reproduction filter coefficient supplied from the filter coefficient selection unit 43 on the sound source signal supplied from the gain adjustment unit 22, It supplies to the addition part 27.
  • the filter unit 23 performs a convolution process that convolves the sound source signal and the far-field sound reproduction filter coefficient as the filter process.
  • the near sound field processing unit 24 determines the sound field boundary position based on the supplied control information.
  • the near sound field processing unit 24 includes a sound field boundary control unit 51, a near sound reproduction filter coefficient recording unit 52, and a filter coefficient selection unit 53.
  • the sound field boundary control unit 51 determines the sound field boundary position based on the supplied control information, determines a gain value for gain adjustment of the nearby sound based on the determination result, and sends it to the gain adjustment unit 25. Supply.
  • the gain value for adjusting the gain of the nearby sound is also particularly referred to as a nearby sound gain value.
  • the sound field boundary control unit 51 also selects an appropriate near sound reproduction filter from a plurality of near sound reproduction filter coefficients recorded in the near sound reproduction filter coefficient recording unit 52 based on the determination result of the sound field boundary position. Neighboring sound reproduction filter coefficient selection information for selecting a coefficient is generated and supplied to the filter coefficient selection unit 53.
  • the neighborhood sound reproduction filter coefficient recording unit 52 records in advance a plurality of neighborhood sound reproduction filter coefficients that are acoustic filter coefficients for forming the neighborhood sound reproduction sound field closer to the speaker array 28 than the predetermined sound field boundary position.
  • the recorded neighborhood sound reproduction filter coefficients are supplied to the filter coefficient selection unit 53.
  • the filter coefficient selection unit 53 selects a plurality of neighborhood sound reproduction filter coefficients recorded in the neighborhood sound reproduction filter coefficient recording unit 52. 1 is selected and supplied to the filter unit 26.
  • the gain adjustment unit 25 performs gain adjustment on the supplied sound source signal based on the nearby sound gain value supplied from the sound field boundary control unit 51 and supplies the obtained sound source signal to the filter unit 26.
  • the sound source signal supplied to the gain adjusting unit 25 is a time-domain acoustic signal for reproducing a nearby sound.
  • the sound source signal supplied to the gain adjustment unit 22 and the sound source signal supplied to the gain adjustment unit 25 are signals for reproducing different content sounds.
  • the sound source signal may be the same.
  • the filter unit 26 generates a nearby sound reproduction signal by performing filter processing using the nearby sound reproduction filter coefficient supplied from the filter coefficient selection unit 53 on the sound source signal supplied from the gain adjustment unit 25, It supplies to the addition part 27.
  • the filter unit 26 performs a convolution process that convolves the sound source signal and the neighborhood sound reproduction filter coefficient as the filter process.
  • the adding unit 27 adds the far-field sound reproduction signal supplied from the filter unit 23 and the near-field sound reproduction signal supplied from the filter unit 26 to generate a speaker drive signal for simultaneously reproducing the near-field sound and the far-field sound. Generated and supplied to the speaker array 28. In other words, the adder 27 combines the far sound reproduction signal and the near sound reproduction signal to generate a speaker drive signal.
  • the speaker array 28 is a speaker array obtained by arranging a plurality of speakers, such as a linear speaker array, a planar speaker array, an annular speaker array, and a spherical speaker array, and is close to the speaker array 28 based on the speaker drive signal supplied from the adder 27. Play sound and distant sound.
  • the center position of the speaker array 28 is the origin O of the three-dimensional orthogonal coordinate system.
  • the three axes of the three-dimensional orthogonal coordinate system pass through the origin O and are orthogonal to each other as an x-axis, a y-axis, and a z-axis.
  • the direction of the x axis that is, the x direction is the direction in which the speakers constituting the speaker array 28 are arranged.
  • the direction of the y-axis that is, the y-direction is a direction perpendicular to the x-direction and parallel to the direction in which sound waves are output from the speaker array 28, and the x-direction and the direction perpendicular to the y-direction are z.
  • the direction of the axis is the z direction.
  • the direction in which sound waves are output from the speaker array 28 is the positive direction of the y direction.
  • a position in space that is, a vector indicating a position in space is also referred to as (x, y, z) using the x coordinate, the y coordinate, and the z coordinate.
  • the speaker array 28 is assumed to be a linear speaker array.
  • the sound field boundary control unit 41 and the sound field boundary control unit 51 perform the same process to determine the sound field boundary position.
  • listener position information is supplied as control information.
  • the listener position information indicating the position of the listener in the space can be obtained from image recognition for an image taken by a camera, detection of a listener using a sensor, input of position information by a user or the like.
  • the sound field boundary position is determined so that the position of the listener indicated by the listener position information as the control information is included in the far-field sound or near-field listening area.
  • an area that includes the listeners in the vicinity of the speaker array 28 is included in the neighborhood sound listening.
  • the sound field boundary position is determined so as to be an area.
  • the sound field boundary position is farther from the speaker array 28 in the y direction. It is moved to the position so that the listening area of the nearby sound is widened.
  • the boundary position of the sound field may be dynamically changed during the reproduction of the near sound and the far sound, that is, during the reproduction of the content.
  • the position indicated by the boundary position information is the sound field boundary position.
  • the far sound gain value, the near sound gain value, the far sound reproduction filter coefficient selection information, and the near sound reproduction filter coefficient selection information are obtained according to the determination result.
  • the sound field boundary position when the sound field is actually formed includes the far sound gain value, the near sound gain value, the position of the control point when the far sound reproduction sound field is formed, and the near sound reproduction sound field. It is determined by the attenuation factor of the evanescent wave.
  • the far-field sound gain value, the near-field sound gain value, the far-field reproduction sound field control point position, the evanescent wave attenuation rate, etc. are determined appropriately for the determined arbitrary position.
  • the far-field reproduction sound field and the near sound reproduction sound field can be formed so that the set position becomes the sound field boundary position. That is, an arbitrary position can be set as the sound field boundary position by adjusting the far sound gain value, the near sound gain value, the position of the far sound reproduction sound field control point, the evanescent wave attenuation rate, and the like.
  • the sound field boundary position is changed by adjusting the gain of the sound source signal of the sound of the content. Can be made. That is, the sound field boundary position can be controlled.
  • the sound pressure of the content B that is, the neighboring sound changes in the y direction as indicated by a straight line L21
  • the content A that is, Assume that it is known that the sound pressure of the far-field sound changes as indicated by a curve L22.
  • the vertical axis indicates the sound pressure
  • the horizontal axis indicates the position in the y direction.
  • the intersection position of the curve L22 and the straight line L21 that is, The position indicated by the arrow W11 is the sound field boundary position.
  • the sound pressure of the content A at each position in the y direction is increased by adjusting the gain of the content A, and as a result, the sound field boundary position is moved closer to the speaker array 28. That is, the sound field boundary position approaches the speaker array 28 as the sound pressure of the content A increases.
  • the intersection position of the curve L23 and the straight line L21, that is, the position indicated by the arrow W21 is the sound field boundary position.
  • the sound field boundary position also changes by adjusting the gain of content B.
  • the gain of the content B is increased, that is, if the neighborhood sound gain value is increased, the sound field boundary position is moved away from the speaker array 28.
  • the sound field boundary position can be the determined sound field boundary position.
  • the sound pressures of the far-field sound and the near-field sound are set in the y direction when the far-field sound reproduction filter coefficient and the near-field sound reproduction filter coefficient prepared in advance are used. It is known in advance how much it will be. That is, the straight line L21 and the curve L22 are known.
  • the sound field boundary control unit 41 and the sound field boundary control unit 51 are distant sounds such that the sound field boundary position becomes the sound field boundary position when the actual sound field is formed.
  • Gain values and nearby sound gain values can be obtained.
  • the gain adjustment may be performed by only one of the far sound gain value and the near sound gain value, or the gain adjustment may be performed by combining both of them. For example, when the gain adjustment is performed substantially only by the far sound gain value, the near sound gain value is set to 1.
  • the sound field boundary position is changed by changing the position of the control point of the far sound reproduction filter coefficient for forming the far sound reproduction sound field.
  • control lines made up of control points called reference lines parallel to the direction in which the speakers constituting the speaker array are arranged, that is, here in the x direction.
  • the formed sound field can be matched with the ideal sound field only on the control point.
  • a far sound reproduction filter coefficient for each of a plurality of control points that is, for each position in the y direction of the control point, is recorded in advance, and a predetermined one of these control point positions is recorded. Are selected and supplied to the filter unit 23.
  • the position of the control point of the far sound reproduction filter coefficient used for generating the far sound reproduction signal for reproducing the sound of the content A is When it changes, the sound field boundary position changes, for example, as shown in FIG. In FIG. 6, the vertical axis indicates the sound pressure, and the horizontal axis indicates the position in the y direction.
  • a curve L32 indicates the sound pressure of the content A at each position in the y direction, that is, the far-field sound. That is, the straight line L31 and the curved line L32 indicate how the sound pressure is attenuated in the y direction of the content B and the content A.
  • the intersection position of the curve L32 and the straight line L31, that is, the position indicated by the arrow W21 is Sound field boundary position.
  • the far sound reproduction filter coefficient whose control point position is y y2 farther from the speaker array 28 than y1 is used. Assume that a far-field sound reproduction signal for reproducing the sound of the content A is generated.
  • the sound pressure of the content A changes as indicated by the curve L33 with respect to the y direction, and the sound field boundary position is the position indicated by the arrow W22.
  • the sound field boundary position approaches the speaker array 28 when the position of the control point in the y direction is a position farther from the speaker array 28. Conversely, when the position of the control point is brought closer to the speaker array 28 in the y direction, the sound field boundary position moves away from the speaker array 28.
  • the control point of the far sound reproduction sound field appropriately, that is, the control point of the far sound reproduction filter coefficient, for the determined sound field boundary position, the near sound reproduction sound field and the far sound
  • the sound field boundary position when the reproduction sound field is formed at the same time can be the determined sound field boundary position.
  • the sound pressures of the far-field sound and the near-field sound are set in the y-direction when the far-field sound reproduction filter coefficient and the near-field sound reproduction filter coefficient prepared in advance are used. It is known in advance how much it will be.
  • the sound field boundary control unit 41 and the sound field boundary control unit 51 are arranged so that the far field sound whose sound field boundary position becomes the sound field boundary position when the actual sound field is formed is determined with respect to the determined sound field boundary position.
  • the position of the control point of the reproduction filter coefficient can be obtained.
  • the sound field boundary position also changes by changing the sound pressure attenuation rate of the neighborhood sound reproduction filter coefficient for forming the neighborhood sound reproduction sound field, that is, the attenuation rate of the evanescent wave.
  • neighborhood sound reproduction filter coefficient recording unit 52 a neighborhood sound reproduction filter coefficient for each combination of a constant ⁇ indicating a sound pressure attenuation rate in the y direction and a control point is recorded in advance, and one of the neighborhood sound reproduction filter coefficients is recorded. A reproduction filter coefficient is selected and supplied to the filter unit 26.
  • the constant ⁇ of the near sound reproduction filter coefficient used for generating the near sound reproduction signal for reproducing the sound of the content B that is, when the sound pressure attenuation rate changes, for example, the sound field boundary position changes as shown in FIG. In FIG. 7, the vertical axis indicates the sound pressure, and the horizontal axis indicates the position in the y direction.
  • a curve L42 indicates the sound pressure of the content A at each position in the y direction, that is, the far-field sound. That is, the straight line L41 and the curved line L42 indicate how the sound pressure is attenuated in the y direction of the content B and the content A.
  • the intersection position of the curve L42 and the straight line L41 that is, the position indicated by the arrow W31 is Sound field boundary position.
  • the value of the constant ⁇ of the neighborhood sound reproduction filter coefficient for obtaining the sound pressure indicated by the straight line L41 is ⁇ 1.
  • the sound pressure of the content B changes as indicated by a straight line L43 with respect to the y direction, and the sound field boundary position becomes a position indicated by an arrow W32.
  • the sound field boundary position approaches the speaker array 28 by using the neighborhood sound reproduction filter coefficient having a larger sound pressure attenuation rate.
  • the neighborhood sound reproduction filter coefficient having a smaller sound pressure attenuation rate is used, the sound field boundary position moves away from the speaker array 28.
  • the sound reproduction attenuation field of the near sound reproduction filter coefficient that is, the constant ⁇ is appropriately determined for the determined sound field boundary position, so that the near sound reproduction sound field and the far sound reproduction sound field are determined.
  • the sound field boundary position when formed at the same time can be the determined sound field boundary position.
  • the sound pressures of the far-field sound and the near-field sound are set in the y direction when the far-field sound reproduction filter coefficient and the near-field sound reproduction filter coefficient prepared in advance are used. It is known in advance how much it will be.
  • the sound field boundary control unit 51 and the sound field boundary control unit 41 make a nearby sound whose sound field boundary position becomes the sound field boundary position when the actual sound field is formed.
  • a constant ⁇ of the reproduction filter coefficient can be obtained.
  • the neighborhood sound reproduction filter coefficient is prepared for each combination of the constant ⁇ indicating the sound pressure attenuation rate and the control point, but the sound field boundary position also changes by changing the control point of the neighborhood sound reproduction filter coefficient. . Therefore, an appropriate control point may be determined for the neighborhood sound reproduction filter coefficient according to the sound field boundary position.
  • the sound field boundary position varies depending on the far-field sound gain value, the near-field sound gain value, the control point for the far-field sound reproduction filter coefficient, the control point for the near-field sound reproduction filter coefficient, and the constant ⁇ .
  • the sound field boundary control unit 41 and the sound field boundary control unit 51 perform the far sound gain value, the near sound gain value, the far sound reproduction filter coefficient control point, and the near sound reproduction with respect to the determined sound field boundary position.
  • An appropriate combination of the control point of the filter coefficient and the constant ⁇ is determined.
  • some of the far sound gain value, the near sound gain value, the far sound reproduction filter coefficient control point, the near sound reproduction filter coefficient control point, and the near sound reproduction filter coefficient constant ⁇ are dynamically determined. Others may be determined in advance.
  • each parameter such as the far-field sound gain value
  • the listening area for the far-field sound and the near-field sound needs to be on the side farther from the speaker array 28 than the control point.
  • the desired sound pressure can be ensured by dynamically determining multiple parameters such as changing the far-field sound gain value and the nearby sound gain value in addition to the far-field sound filter coefficient control point. Or a listening area can be formed at an appropriate position.
  • the sound field boundary control unit 41 uses information indicating the position of the determined control point of the far sound reproduction filter coefficient as the far sound. This is supplied to the filter coefficient selector 43 as reproduction filter coefficient selection information. Also, for example, the sound field boundary control unit 51 supplies information indicating the determined control point position of the near sound reproduction filter coefficient and the constant ⁇ to the filter coefficient selection unit 53 as near sound reproduction filter coefficient selection information.
  • the far sound reproduction filter coefficient recording unit 42 records a far sound reproduction filter coefficient for each position of a plurality of control points.
  • the far-field sound reproduction filter coefficient is determined in advance by the SDM (Spectral Division Method) method.
  • a sound field P (v, n tf ) in a three-dimensional free space is expressed as shown in the following equation (1).
  • n tf indicates a time frequency index
  • v is a vector indicating a position in space
  • v (x, y, z).
  • v 0 is a vector indicating a predetermined position on the x-axis
  • v 0 (x 0 , 0,0).
  • position location v indicated by the vector v and also referred to as a position v 0 the position indicated by the vector v 0.
  • D (v 0 , n tf ) indicates a driving signal of the secondary sound source
  • G (v, v 0 , n tf ) is transmitted between the position v and the position v 0. It is a function.
  • This secondary sound source drive signal D (v 0 , n tf ) corresponds to the far-field sound reproduction signal.
  • n sf represents a spatial frequency index
  • Equation (2) the sound field P F (n sf , y, z, n tf ) in the spatial frequency domain is expressed in the spatial frequency domain as shown in Equation (2).
  • equation (3) is expressed as the following equation (4).
  • a point sound source model P ps (n sf , y ref , 0, n tf ) is expressed as shown in the following equation (5). Can be used.
  • S (n tf ) represents the sound source signal of the sound to be reproduced
  • j represents the imaginary unit
  • k x represents the wave number in the x-axis direction.
  • x ps and y ps respectively indicate the x coordinate and y coordinate indicating the position of the point sound source
  • indicates the angular frequency
  • c indicates the speed of sound.
  • H 0 (2) represents the second kind Hankel function
  • the transfer function G F (n sf , y ref , 0, n tf ) can be expressed as shown in the following equation (6).
  • the spatial frequency spectrum D F (n sf , n tf ) is spatial frequency synthesized using DFT (Discrete Fourier Transform) to obtain the temporal frequency spectrum D (l, n tf ). That is, the time frequency spectrum D (l, n tf ) is calculated by calculating the following equation (7).
  • Equation (7) l identifies the speaker constituting the speaker array 28, indicates a speaker index indicating the position of the speaker in the x direction, and M ds indicates the number of DFT samples.
  • time frequency synthesis is performed on the time frequency spectrum D (l, n tf ) using IDFT (Inverse Discrete Fourier Transform), and the speaker drive signal d (l of each speaker of the speaker array 28 which is a time signal. , n d ) is required.
  • the speaker drive signal d (l, n d ) is calculated by performing the calculation of the following equation (8).
  • the speaker drive signal d (l, n d ) of each of these speakers is a far-field sound reproduction signal.
  • n d represents a time index
  • M dt represents the number of IDFT samples.
  • the obtained far sound reproduction filter coefficient h f (l, m) is used.
  • the far-field sound reproduction filter coefficient h f (l, m) is obtained for each speaker identified by the speaker index 1 of the speaker array 28 for one control point.
  • far sound reproduction filter coefficient recording unit 42 far sound reproduction filter coefficients h f (l, m) of a plurality of control points are recorded in advance.
  • the filter coefficient selection unit 43 is indicated by the far sound reproduction filter coefficient selection information supplied from the sound field boundary control unit 41 among the far sound reproduction filter coefficients h f (l, m) for each of a plurality of control points.
  • the far sound reproduction filter coefficient h f (l, m) at the same control point as the control point is read from the far sound reproduction filter coefficient recording unit 42 and supplied to the filter unit 23.
  • the control point group is planar, but in such a case as well, the same as when using a linear secondary sound source.
  • the far-field sound reproduction filter coefficient can be obtained.
  • the neighborhood sound reproduction filter coefficient recording unit 52 records neighborhood sound reproduction filter coefficients for each combination of the positions of a plurality of control points and a plurality of constants ⁇ . These near sound reproduction filter coefficients are filter coefficients of an acoustic filter for generating an evanescent wave that attenuates in the y direction by the speaker array 28.
  • the sound field p (v, t) at time t at an arbitrary position v satisfies the wave equation shown in the following equation (9).
  • variable separation is performed as shown in the following equation (13) to separate the space differentiation and the time differentiation, and further using equation (12), the following equation The Helmholtz equation shown in (14) is obtained.
  • P (v, ⁇ ) indicates the sound field of the angular frequency ⁇ at the position v.
  • the angular frequency is ⁇ pw and the wave numbers in the x direction, the y direction, and the z direction are k pw, x , k pw, y , and k pw, z
  • the angular frequency ⁇ pw and the wave number The general solution of the Helmholtz equation shown in equation (14), which represents a plane wave propagating in the direction represented by k pw, x , wave number k pw, y , and wave number k pw, z , is shown in the following equation (15) It becomes.
  • ⁇ ( ⁇ pw ) represents a delta function
  • the wave of the wave number k pw, y shown in the upper part of Equation (17), that is, the upper side represents a normal propagation wave
  • the wave of wave number k pw, y shown in the lower part of Equation (17), that is, the lower side Represents an evanescent wave.
  • the wave number k pw, x and the wave number are satisfied so as to satisfy the following equation (19) using the constant ⁇ representing the magnitude of attenuation.
  • k pw, z may be set.
  • the greater the constant ⁇ the greater the attenuation rate of the evanescent wave in the y direction.
  • the constant ⁇ shown in the equation (19) is a constant indicating the sound pressure attenuation rate in the y direction described above.
  • H 0 (2) represents the second kind Hankel function
  • K 0 represents the Bessel function
  • the spatial frequency spectrum D ′ (k x , ⁇ ) of the near-field reproduction signal is expressed by the following equation (22) from the SDM method using equations (20) and (21).
  • y ref indicates the position of a control point serving as a reference in the y direction.
  • the time-frequency spectrum D (x, ⁇ ) of the neighborhood sound reproduction signal shown in the following equation (23) is obtained by performing inverse spatial Fourier transform on the wave number k x of the equation (22) thus obtained.
  • the time waveform d (x, t) of the neighborhood sound reproduction signal that is, the time A speaker driving signal d (x, t) as a signal is obtained.
  • the speaker of the index l is calculated from equation (24).
  • the neighborhood sound reproduction filter coefficient h n (l, m) is obtained.
  • m represents a time index.
  • the neighborhood sound reproduction filter coefficient h n (l, m) is obtained by replacing x in the speaker drive signal d (x, t) shown in the equation (24) with an index l and replacing t with a time index m. It is done.
  • neighborhood sound reproduction filter coefficient recording unit 52 neighborhood sound reproduction filter coefficients h n (l, m) for each combination of the position y ref of the plurality of control points and the plurality of constants ⁇ are recorded in advance.
  • the filter coefficient selection unit 53 includes control points and constants indicated by the neighboring sound reproduction filter coefficient selection information supplied from the sound field boundary control unit 51 among the neighboring sound reproduction filter coefficients h n (l, m).
  • the near sound reproduction filter coefficient h n (l, m) having the same control point as ⁇ and the constant ⁇ is read from the near sound reproduction filter coefficient recording unit 52 and supplied to the filter unit 26.
  • a sound source signal supplied from the gain adjustment unit 22 to the filter unit 23 and a sound source signal supplied from the gain adjustment unit 25 to the filter unit 26 are not particularly distinguished from each other and are described as a sound source signal x (n). Note that n in the sound source signal x (n) indicates a time index.
  • filter coefficients h (l, m) when it is not necessary to distinguish the far-field sound reproduction filter coefficient h f (l, m) and the nearby sound reproduction filter coefficient h n (l, m), they are also referred to as filter coefficients h (l, m).
  • the filter unit 23 and the filter unit 26 perform a process of obtaining the speaker drive signal s (l, n) by convolving the supplied sound source signal x (n) and the filter coefficient h (l, m). That is, in the filter unit 23 and the filter unit 26, the calculation of the following equation (26) is performed for each speaker constituting the speaker array 28, and the speaker drive signal s (l, n) of each speaker identified by the speaker index l ) Is calculated.
  • N indicates the filter length
  • the speaker drive signal s (l, n) of each speaker obtained by the filter unit 23 by the calculation of equation (26) is a far-field sound reproduction signal. Further, the speaker drive signal s (l, n) of each speaker obtained by the filter unit 26 by the calculation of the equation (26) is the near sound reproduction signal.
  • step S11 the sound field boundary control unit 41 and the sound field boundary control unit 51 determine the sound field boundary position based on the supplied control information.
  • the sound field boundary control unit 41 and the sound field boundary control unit 51 define the listening area for the near sound and the listening area for the far sound based on the position of the listener indicated by the listener position information supplied as control information.
  • the position between these listening areas is defined as the sound field boundary position.
  • the sound field boundary control unit 41 and the sound field boundary control unit 51 directly use the position indicated by the boundary position information supplied as control information as the sound field boundary position.
  • step S12 the sound field boundary control unit 41 and the sound field boundary control unit 51 determine parameters such as a far-field sound gain value based on the sound field boundary position determined in the process of step S11.
  • the sound field boundary control unit 41 and the sound field boundary control unit 51 as described with reference to FIGS. 5 to 7, for example, the far-field sound gain value and the near sound gain as parameters according to the sound field boundary position.
  • the far-field sound gain value and the near sound gain as parameters according to the sound field boundary position.
  • Each value of the value, the position of the control point of the far sound reproduction filter coefficient, the position of the control point of the near sound reproduction filter coefficient, and the constant ⁇ of the near sound reproduction filter coefficient is determined.
  • the parameters may be predetermined values, and the values of the remaining parameters may be determined based on the sound field boundary position. Also, instead of determining the sound field boundary position and then determining the value of each parameter according to the sound field boundary position, the sound field boundary position and the value of each parameter are determined simultaneously while being adjusted to each other. It may be. That is, the processes of step S11 and step S12 may be performed simultaneously.
  • the sound field boundary control unit 41 supplies the far sound gain value as the determined parameter to the gain adjustment unit 22, and the control point of the far sound reproduction filter coefficient as the determined parameter.
  • Information indicating the position is supplied to the filter coefficient selection unit 43 as far sound reproduction filter coefficient selection information.
  • the sound field boundary control unit 51 supplies the near sound gain value as the determined parameter to the gain adjustment unit 25, and indicates the position of the control point of the near sound reproduction filter coefficient and the constant ⁇ as the determined parameter.
  • the information is supplied to the filter coefficient selection unit 53 as the neighborhood sound reproduction filter coefficient selection information.
  • step S13 the filter coefficient selection unit 43 and the filter coefficient selection unit 53 select a filter coefficient.
  • the filter coefficient selection unit 43 selects the control point indicated by the far sound reproduction filter coefficient selection information supplied from the sound field boundary control unit 41 from among the far sound reproduction filter coefficients for each of the plurality of control points. Select far-field sound filter coefficient. That is, the far sound reproduction filter coefficient corresponding to the position of the control point indicated by the far sound reproduction filter coefficient selection information is selected.
  • the filter coefficient selection unit 43 reads the selected far sound reproduction filter coefficient from the far sound reproduction filter coefficient recording unit 42 and supplies it to the filter unit 23.
  • the filter coefficient selection unit 53 is indicated by the neighborhood sound reproduction filter coefficient selection information supplied from the sound field boundary control unit 51 from among the neighborhood sound reproduction filter coefficients for each combination of a plurality of control points and the constant ⁇ .
  • the position of the control point and the neighborhood sound reproduction filter coefficient of the constant ⁇ are selected. That is, the neighborhood sound reproduction filter coefficient corresponding to the position of the control point and the constant ⁇ indicated by the neighborhood sound reproduction filter coefficient selection information is selected.
  • the filter coefficient selection unit 53 reads the selected neighborhood sound reproduction filter coefficient from the neighborhood sound reproduction filter coefficient recording unit 52 and supplies it to the filter unit 26.
  • step S14 the gain adjusting unit 22 and the gain adjusting unit 25 adjust the gain of the supplied sound source signal.
  • the gain adjustment unit 22 performs gain adjustment by multiplying the supplied sound source signal by the far-field sound gain value supplied from the sound field boundary control unit 41, and filters the sound source signal obtained as a result. To the unit 23.
  • the gain adjustment unit 25 performs gain adjustment by multiplying the supplied sound source signal by the nearby sound gain value supplied from the sound field boundary control unit 51, and filters the sound source signal obtained as a result. To the unit 26.
  • step S15 the filter unit 23 and the filter unit 26 perform filter processing on the sound source signal.
  • the filter unit 23 convolves the sound source signal supplied from the gain adjustment unit 22 with the far-field sound reproduction filter coefficient supplied from the filter coefficient selection unit 43 by performing the calculation of the above-described equation (26).
  • the far-field sound reproduction signal is generated and supplied to the adding unit 27.
  • the filter unit 26 performs the calculation of the above-described equation (26), thereby convolving the sound source signal supplied from the gain adjustment unit 25 and the nearby sound reproduction filter coefficient supplied from the filter coefficient selection unit 53. Then, a neighborhood sound reproduction signal is generated and supplied to the adder 27.
  • a far-field sound reproduction signal and a near sound reproduction signal are generated using a sound source signal that has been subjected to gain adjustment.
  • the sound source signal that has not been subjected to gain adjustment is used to generate the far-field sound reproduction signal and the near-field sound reproduction signal, and the gain adjustment is performed on the far-field sound reproduction signal and the near-field sound reproduction signal. Also good.
  • the gain adjustment unit 22 performs gain adjustment with respect to the far sound reproduction signal based on the far sound gain value
  • the gain adjustment unit 25 performs gain adjustment with respect to the near sound reproduction signal based on the near sound gain value. Is called.
  • step S ⁇ b> 16 the adding unit 27 adds the far-field sound reproduction signal supplied from the filter unit 23 and the near sound reproduction signal supplied from the filter unit 26 to generate a speaker drive signal, and supplies the speaker drive signal to the speaker array 28. To do.
  • step S17 the speaker array 28 reproduces the far-field sound and the near-field sound simultaneously based on the speaker drive signal supplied from the adder 27, and the far-and-far sound field forming process ends.
  • the far-field sound reproduction sound field and the near-field sound reproduction sound field are formed in different areas in the space. That is, a far-field listening area and a nearby sound listening area are formed at different positions.
  • the far-and-far sound field forming device 11 determines each parameter such as the far-field sound gain value according to the sound field boundary position, and performs the gain adjustment and the filter processing according to the determined parameter to perform the far-field sound. And a speaker driving signal for reproducing a nearby sound. By doing so, it is possible to reproduce different sounds in the distance and the vicinity.
  • the perspective separate sound field forming device is configured as shown in FIG. 9, for example. 9, parts corresponding to those in FIG. 3 are denoted by the same reference numerals, and description thereof will be omitted as appropriate.
  • the far and far sound field forming device 81 shown in FIG. 9 includes a far field processing unit 21, a gain adjusting unit 22, a filter unit 23, a near sound field processing unit 24, a gain adjusting unit 25, a filter unit 26, a speaker array 28, and A speaker array 91 is provided.
  • the far sound field processing unit 21 is provided with a sound field boundary control unit 41, a far sound reproduction filter coefficient recording unit 42, and a filter coefficient selection unit 43.
  • the near sound field processing unit 24 has a sound field boundary control unit. 51, a neighborhood sound reproduction filter coefficient recording unit 52, and a filter coefficient selection unit 53 are provided.
  • the configuration of the separate sound field forming device 81 is different from the structure of the separate sound field forming device 11 of FIG. 3 in that the adder 27 is not provided and the speaker array 91 is newly provided. In this respect, the configuration is the same as that of the perspective separate sound field forming device 11.
  • the far sound reproduction signal obtained by the filter unit 23 is supplied to the speaker array 28, and the far sound is reproduced based on the far sound reproduction signal in the speaker array 28. Further, the near sound reproduction signal obtained by the filter unit 26 is supplied to the speaker array 91.
  • the speaker array 91 is a speaker array obtained by arranging a plurality of speakers, such as a linear speaker array, a planar speaker array, an annular speaker array, a spherical speaker array, and the like, and is based on a near sound reproduction signal supplied from the filter unit 26. Play nearby sounds.
  • the speaker array 28 and the speaker array 91 may be arranged at the same position in the y direction, or may be arranged at different positions in the y direction.
  • the vicinity sound reproduction sound field is not limited to the evanescent wave but is formed by a propagation wave such as a plane wave or a spherical wave. You can also.
  • the near sound reproduction filter coefficient can be a filter coefficient for forming a near sound reproduction sound field generated by a plane wave, a spherical wave, or the like, which is generated in the same manner as the far sound reproduction filter coefficient, for example.
  • step S45 the filter unit 23 supplies the obtained far-field sound reproduction signal to the speaker array 28, and the filter unit 26 supplies the obtained near sound reproduction signal to the speaker array 91.
  • step S46 the speaker array 28 reproduces the far sound based on the far sound reproduction signal supplied from the filter unit 23.
  • step S47 the speaker array 91 reproduces the nearby sound based on the nearby sound reproduction signal supplied from the filter unit 26.
  • step S46 and step S47 are performed simultaneously.
  • the far-field sound reproduction sound field and the near-field sound reproduction sound field are formed in different areas in the space. That is, a far-field listening area and a nearby sound listening area are formed at different positions.
  • the perspective-specific sound field forming process ends.
  • the far-and-far sound field forming device 81 determines each parameter such as the far sound gain value according to the sound field boundary position, and performs the gain adjustment and the filter processing according to the determined parameter to perform the far sound. A reproduction signal and a neighborhood sound reproduction signal are generated. By doing so, it is possible to reproduce different sounds in the distance and the vicinity.
  • the far-field sound and the nearby sound are reproduced simultaneously.
  • the far-field sound and the nearby sound may be reproduced at different timings.
  • the far-field sound is reproduced at a timing when the near-field sound is not reproduced.
  • the far-field sound may be reproduced when the volume of the nearby sound is low. That is, for example, the filter unit 23 is also supplied with a sound source signal for reproducing the nearby sound, and the filter unit 23 is configured to receive the nearby sound when the amplitude of the sound source signal for reproducing the nearby sound is almost zero. Is detected, that is, the timing at which the adjacent sound is not reproduced is detected. Then, the filter unit 23 supplies the far-field sound reproduction signal to the speaker array 28 at a timing when the near-field sound is not reproduced, and reproduces the far-field sound.
  • the speaker arrays 28 and the speaker arrays 91 are arranged in the z direction, that is, arranged at different heights to be different from each other. The sound of the content may be reproduced.
  • the loudspeaker array 28 arranged at a higher position in the z direction reproduces content for a tall adult
  • the loudspeaker array 91 arranged at a lower position in the z direction is intended for a short child. You can also play the content. In this example, different contents can be reproduced for each height even in the vicinity of the speaker array.
  • the speaker array 28 and the speaker array 91 are arranged at different heights in the z-direction, as described in the first embodiment, two sounds with different listening areas are reproduced with one speaker array. You may make it do.
  • the far sound and the near sound are reproduced by the speaker array 28, and the far sound and the near sound are also reproduced by the speaker array 91, and the four sounds having different listening area positions in the z direction and the y direction are obtained.
  • a field can be formed.
  • the sound field boundary position of the far and near sounds reproduced by the speaker array 28 and the sound field boundary position of the far and near sounds reproduced by the speaker array 91 are different positions in the y direction. It is also possible to do. That is, the sound field boundary position can be controlled independently of each other.
  • video may be presented in combination.
  • a polarizing plate or the like together with a display device above the speaker array 28
  • different images are provided to the listener in the far sound listening area and the listener in the nearby sound listening area depending on the display device. Can be presented.
  • the content composed of the image and the far-field sound visible from the listening area is presented, and for the listener in the near-sound listening area, It is possible to present content composed of video and nearby sounds that can be seen from within the listening area. In other words, different contents composed of video and audio can be presented to the listener in the far-field listening area and the listener in the nearby-sound listening area.
  • the far-field sound may be used for masking the nearby sound. That is, the far sound can be used as a sound for masking the nearby sound.
  • the far-field sound is BGM in the same frequency band as the nearby sound, and the far-field sound and the near-field sound are simultaneously reproduced by the far-and-far sound field forming device 11 and the far and near sound field forming device 81. .
  • the near sound it is possible to make the near sound almost inaudible outside the listening area of the near sound. That is, it is possible to reduce leakage of nearby sounds outside the listening area.
  • the masking effect can be improved by using the sound in the frequency band including at least the entire frequency band of the nearby sound as the far-field sound.
  • the above-described series of processing can be executed by hardware or can be executed by software.
  • a program constituting the software is installed in the computer.
  • the computer includes, for example, a general-purpose computer capable of executing various functions by installing a computer incorporated in dedicated hardware and various programs.
  • FIG. 11 is a block diagram showing an example of a hardware configuration of a computer that executes the above-described series of processing by a program.
  • a CPU Central Processing Unit
  • ROM Read Only Memory
  • RAM Random Access Memory
  • An input / output interface 505 is further connected to the bus 504.
  • An input unit 506, an output unit 507, a recording unit 508, a communication unit 509, and a drive 510 are connected to the input / output interface 505.
  • the input unit 506 includes a keyboard, a mouse, a microphone, an image sensor, and the like.
  • the output unit 507 includes a display, a speaker array, and the like.
  • the recording unit 508 includes a hard disk, a nonvolatile memory, and the like.
  • the communication unit 509 includes a network interface or the like.
  • the drive 510 drives a removable recording medium 511 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory.
  • the CPU 501 loads the program recorded in the recording unit 508 to the RAM 503 via the input / output interface 505 and the bus 504 and executes the program, for example. Is performed.
  • the program executed by the computer (CPU 501) can be provided by being recorded in a removable recording medium 511 as a package medium or the like, for example.
  • the program can be provided via a wired or wireless transmission medium such as a local area network, the Internet, or digital satellite broadcasting.
  • the program can be installed in the recording unit 508 via the input / output interface 505 by attaching the removable recording medium 511 to the drive 510. Further, the program can be received by the communication unit 509 via a wired or wireless transmission medium and installed in the recording unit 508. In addition, the program can be installed in advance in the ROM 502 or the recording unit 508.
  • the program executed by the computer may be a program that is processed in time series in the order described in this specification, or in parallel or at a necessary timing such as when a call is made. It may be a program for processing.
  • the present technology can take a cloud computing configuration in which one function is shared by a plurality of devices via a network and is jointly processed.
  • each step described in the above flowchart can be executed by one device or can be shared by a plurality of devices.
  • the plurality of processes included in the one step can be executed by being shared by a plurality of apparatuses in addition to being executed by one apparatus.
  • the present technology can be configured as follows.
  • a far filter unit that generates a far sound reproduction signal for reproducing a sound in the far listening area by performing filter processing using the far sound reproduction filter coefficient on the first sound source signal;
  • a neighborhood filter unit that generates a neighborhood sound reproduction signal for reproducing sound in a neighborhood listening region different from the far listening region by performing a filtering process using a neighborhood sound reproduction filter coefficient on the second sound source signal And a signal processing device.
  • the neighborhood sound reproduction signal is a signal for generating an evanescent wave.
  • a near sound field processing unit that determines an attenuation rate of the evanescent wave according to a boundary position between the far listening area and the near listening area; The signal processing apparatus according to (2), wherein the neighborhood filter unit performs a filter process using the neighborhood sound reproduction filter coefficient corresponding to the determined attenuation rate among a plurality of the neighborhood sound reproduction filter coefficients.
  • a near sound field processing unit for determining a position of a control point according to a boundary position between the far listening area and the near listening area; The neighborhood filter unit performs filtering using the neighborhood sound reproduction filter coefficient corresponding to the determined position of the control point among the plurality of neighborhood sound reproduction filter coefficients.
  • a far field processing unit that determines a position of a control point according to a boundary position between the far listening area and the nearby listening area; The far filter unit performs a filtering process using the far sound reproduction filter coefficient corresponding to the determined position of the control point among the plurality of far sound reproduction filter coefficients (1) to (4) The signal processing device according to claim 1.
  • the signal processing apparatus according to any one of (1) to (5), wherein the far-field sound reproduction signal is a signal for generating a propagation wave.
  • a far field processing unit that determines a gain according to a boundary position between the far listening area and the nearby listening area; The signal processing device according to any one of (1) to (6), further comprising: a far gain adjustment unit that performs gain adjustment of the first sound source signal or the far sound reproduction signal based on the determined gain. .
  • a near sound field processing unit that determines a gain according to a boundary position between the far listening area and the near listening area; The signal processing device according to any one of (1) to (7), further comprising: a neighborhood gain adjustment unit that performs gain adjustment of the second sound source signal or the neighborhood sound reproduction signal based on the determined gain. .
  • the signal processing device according to any one of (1) to (8), wherein the first sound source signal and the second sound source signal are signals for reproducing sounds of different contents.
  • the signal processing apparatus according to any one of (1) to (9), further including a speaker array that reproduces sound based on a signal obtained by synthesizing the far-field sound reproduction signal and the near sound reproduction signal.
  • the signal processing apparatus according to any one of (1) to (11), wherein the sound based on the far-field sound reproduction signal is reproduced at a timing different from that of the sound based on the near sound reproduction signal.
  • the signal processing apparatus according to any one of (1) to (11), wherein the sound based on the far-field sound reproduction signal is a sound for masking sound based on the near-field reproduction signal.
  • a far sound reproduction signal for reproducing sound in the far listening area is generated by performing filter processing using the far sound reproduction filter coefficient on the first sound source signal, Including a step of generating a near sound reproduction signal for reproducing sound in a near listening area different from the far listening area by performing a filtering process using a near sound reproduction filter coefficient on the second sound source signal.
  • Signal processing method (16)
  • a far sound reproduction signal for reproducing sound in the far listening area is generated by performing filter processing using the far sound reproduction filter coefficient on the first sound source signal, Including a step of generating a near sound reproduction signal for reproducing sound in a near listening area different from the far listening area by performing a filtering process using a near sound reproduction filter coefficient on the second sound source signal.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本技術は、遠方と近傍とで異なる音を再生することができるようにする信号処理装置および方法、並びにプログラムに関する。 信号処理装置は、第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成する遠方フィルタ部と、第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成する近傍フィルタ部とを備える。本技術は遠近別音場形成装置に適用することができる。

Description

信号処理装置および方法、並びにプログラム
 本技術は信号処理装置および方法、並びにプログラムに関し、特に、遠方と近傍とで異なる音を再生することができるようにした信号処理装置および方法、並びにプログラムに関する。
 従来、スピーカを用いて局所的に音場を形成する技術が知られている。
 例えば、そのような技術としてパラメトリックスピーカを用いた超指向性制御による局所音場形成技術が提案されている(例えば、非特許文献1参照)。
 また、例えばスピーカアレイを用いてエバネッセント波を生成することで、スピーカアレイ近傍においてのみ音の聴取が可能な音場を形成する技術も提案されている(例えば、特許文献1参照)。
 ところで、空港や駅などの公共の場においては、映像ディスプレイを用いて運航情報やサイネージが提示されている。映像に加えて音声を用いることで、より効果的にコンテンツを提示することが可能になるが、一方でその情報を必要としていない不特定多数の人にまで音声が届いてしまうことになる。
 そこで、例えば遠方の人には最低限の案内だけを提示し、近傍の人には詳細な情報を提示することができるようにするなど、遠方と近傍とで異なる音を再生することができると便利である。例えば銀行のキャッシュディスペンサでは、キャッシュディスペンサ近傍で操作している人だけに聞かせたい音声と、「忘れ物があります」などの遠方の人に聞かせたい音声がある。
鎌倉他,"パラメトリックスピーカの実用化,"日本音響学会誌, vol.62, p.791-797, 2006.
特開2012-44572号公報
 しかしながら、上述した技術では、遠方の領域と近傍の領域とで異なる音を再生することは困難であった。
 本技術は、このような状況に鑑みてなされたものであり、遠方と近傍とで異なる音を再生することができるようにするものである。
 本技術の一側面の信号処理装置は、第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成する遠方フィルタ部と、第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成する近傍フィルタ部とを備える。
 前記近傍音再生信号を、エバネッセント波を生成するための信号とすることができる。
 信号処理装置には、前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて前記エバネッセント波の減衰率を決定する近傍音場処理部をさらに設け、前記近傍フィルタ部には、複数の前記近傍音再生フィルタ係数のうちの決定された前記減衰率に対応する前記近傍音再生フィルタ係数を用いてフィルタ処理を行わせることができる。
 信号処理装置には、前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて制御点の位置を決定する近傍音場処理部をさらに設け、前記近傍フィルタ部には、複数の前記近傍音再生フィルタ係数のうちの決定された前記制御点の位置に対応する前記近傍音再生フィルタ係数を用いてフィルタ処理を行わせることができる。
 信号処理装置には、前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて制御点の位置を決定する遠方音場処理部をさらに設け、前記遠方フィルタ部には、複数の前記遠方音再生フィルタ係数のうちの決定された前記制御点の位置に対応する前記遠方音再生フィルタ係数を用いてフィルタ処理を行わせることができる。
 前記遠方音再生信号を、伝搬波を生成するための信号とすることができる。
 信号処理装置には、前記遠方受聴領域と前記近傍受聴領域との境界位置に応じてゲインを決定する遠方音場処理部と、決定した前記ゲインに基づいて前記第1の音源信号または前記遠方音再生信号のゲイン調整を行う遠方ゲイン調整部とをさらに設けることができる。
 信号処理装置には、前記遠方受聴領域と前記近傍受聴領域との境界位置に応じてゲインを決定する近傍音場処理部と、決定した前記ゲインに基づいて前記第2の音源信号または前記近傍音再生信号のゲイン調整を行う近傍ゲイン調整部とをさらに設けることができる。
 前記第1の音源信号と前記第2の音源信号とを、互いに異なるコンテンツの音を再生するための信号とすることができる。
 信号処理装置には、前記遠方音再生信号と前記近傍音再生信号を合成して得られる信号に基づいて音を再生するスピーカアレイをさらに設けることができる。
 信号処理装置には、前記遠方音再生信号に基づいて音を再生する第1のスピーカアレイと、前記近傍音再生信号に基づいて音を再生する第2のスピーカアレイとをさらに設けることができる。
 前記遠方音再生信号に基づく音が、前記近傍音再生信号に基づく音とは異なるタイミングで再生されるようにすることができる。
 前記遠方音再生信号に基づく音を、前記近傍音再生信号に基づく音のマスキング用の音とすることができる。
 信号処理装置には、空間上の受聴者の位置に基づいて前記遠方受聴領域と前記近傍受聴領域との境界位置を決定する音場境界制御部をさらに設けることができる。
 本技術の一側面の信号処理方法またはプログラムは、第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成し、第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成するステップを含む。
 本技術の一側面においては、第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号が生成され、第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号が生成される。
 本技術の一側面によれば、遠方と近傍とで異なる音を再生することができる。
 なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載された何れかの効果であってもよい。
本技術について説明する図である。 本技術について説明する図である。 遠近別音場形成装置の構成例を示す図である。 座標系について説明する図である。 音場境界位置の制御について説明する図である。 音場境界位置の制御について説明する図である。 音場境界位置の制御について説明する図である。 遠近別音場形成処理を説明するフローチャートである。 遠近別音場形成装置の構成例を示す図である。 遠近別音場形成処理を説明するフローチャートである。 コンピュータの構成例を示す図である。
 以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈第1の実施の形態〉
〈本技術について〉
 本技術は、スピーカアレイを用いて、遠方と近傍とで異なる音を再生することができるようにするものである。
 本技術では、例えば複数のスピーカを直線状に並べて得られる1つのスピーカアレイにより2つの音場が同時に形成される。
 この場合、スピーカアレイにより、スピーカアレイ近傍の領域でのみ音の聴取が可能な音場(以下、近傍音再生音場とも称する)と、スピーカアレイから離れた遠方でも音の聴取が可能な音場(以下、遠方音再生音場とも称する)とが同時に形成される。
 ここで、近傍音再生音場は、例えばエバネッセント波を生成するための近傍音再生信号に基づいて音を再生することにより形成される。なお、エバネッセント波とは、スピーカアレイに対して垂直な方向に指数関数的に音圧が距離減衰する性質を有する波である。
 このようなエバネッセント波による近傍音再生音場は、スピーカアレイ近傍においてのみ聴取に十分な音圧が保たれ、遠方では急峻に音圧が減衰する音場となっている。
 これに対して、遠方音再生音場は、平面波や球面波などの遠方まで伝搬する伝搬波を生成するための遠方音再生信号に基づいて音を再生することにより形成される。なお、以下では遠方音再生音場は、平面波により形成されるものとして説明を続ける。
 このような伝搬波による遠方音再生音場は、スピーカアレイから離れた遠方においても聴取に十分な音圧が保たれる音場となっている。
 そのため、このような近傍音再生音場と遠方音再生音場とを同時に形成し、かつスピーカアレイ近傍においては、近傍音再生音場の音が遠方音再生音場の音よりも十分大きく再生されるようにすることで、スピーカアレイの近傍と遠方とで互いに異なる音を再生することができる。
 このような場合、再生された音の波面は例えば図1に示すようになる。なお、図1において、縦方向および横方向は空間上の方向を示しており、矢印Q11により示される部分における濃淡は、再生された音の波面の振幅を示している。
 この例では矢印A11に示す位置に1つの直線スピーカアレイが配置されており、その直線スピーカアレイによって、近傍音再生信号に基づく音(以下、近傍音とも称する)と、遠方音再生信号に基づく音(以下、遠方音とも称する)とが同時に再生されている。すなわち、近傍音再生音場と遠方音再生音場とが同時に形成されている。
 ここでは、近傍音はエバネッセント波であり、遠方音は平面波であるので、それらの波は空間スペクトル、すなわち時空間スペクトログラムにおいては異なる領域の波となるので互いに干渉せず、受聴者は近傍音と遠方音とを聞き分けることができる。
 また、この場合、空間上の各位置における音圧は矢印Q12に示すようになり、直線スピーカアレイ近傍が近傍音の受聴領域LE11となり、直線スピーカアレイから離れた位置にある領域が遠方音の受聴領域LE12となる。なお、矢印Q12に示す部分において各位置における濃淡は、それらの位置における音圧を示している。
 この例では、近傍の受聴領域LE11と、遠方の受聴領域LE12という互いに異なる領域で、それぞれ異なる音が再生される。
 直線スピーカアレイを構成する複数のスピーカが並ぶ方向と垂直な方向をy方向とすると、近傍音の音圧と遠方音の音圧は、それぞれy方向に対して例えば図2に示すように減衰する。なお、図2において縦軸は音圧を示しており、横軸はy方向の位置を示している。
 図2では、直線L11はy方向の各位置における近傍音の音圧を示しており、直線L11により示される音圧は、直線スピーカアレイからのy方向の距離をyとすると1/eyとなる。これに対して、曲線L12はy方向の各位置における遠方音の音圧を示しており、曲線L12により示される音圧は、直線スピーカアレイからのy方向の距離をyとすると1/yとなる。
 したがって、空間上において遠方音よりも近傍音の音圧が大きい領域R11が、図1に示した受聴領域LE11となり、近傍音よりも遠方音の音圧が大きい領域R12が図1に示した受聴領域LE12となる。
 例えば領域R11では、近傍音だけでなく遠方音も受聴者に聞こえるが、近傍音と遠方音の音圧差を十分に大きくすることができるため、受聴者には遠方音が十分に小さく聞こえるようにすることが可能である。また、領域R12では、近傍音の減衰が大きく、受聴者には遠方音のみが聞こえるようになっている。
 このように、y方向での減衰のしかたが互いに異なるエバネッセント波と平面波を利用することで、主に近傍音が受聴者に聞こえる領域R11と、遠方音が受聴者に聞こえる領域R12とを形成することが可能となる。
 以下では、領域R11と領域R12の境界位置、すなわち近傍音と遠方音の音圧が同じレベル(大きさ)となるy方向の位置を、音場境界位置とも称することとする。
〈遠近別音場形成装置の構成例〉
 それでは、以下、本技術を適用したより具体的な実施の形態について説明する。
 図3は、本技術を適用した遠近別音場形成装置の一実施の形態の構成例を示す図である。
 図3に示す遠近別音場形成装置11は、遠方と近傍とで異なる音を再生する信号処理装置である。遠近別音場形成装置11は、遠方音場処理部21、ゲイン調整部22、フィルタ部23、近傍音場処理部24、ゲイン調整部25、フィルタ部26、加算部27、およびスピーカアレイ28を有している。
 遠近別音場形成装置11では、遠方音場処理部21および近傍音場処理部24に対して、近傍音再生音場と遠方音再生音場との境界位置、すなわち近傍音の受聴領域と遠方音の受聴領域との境界位置である音場境界位置を制御するための制御情報が供給される。
 例えば制御情報は、空間上の受聴者の位置を示す受聴者位置情報や、音場境界の位置を示す境界位置情報などとされる。なお、境界位置情報は、手動で入力されたものであってもよいし、予め定められたものであってもよい。
 遠方音場処理部21は、供給された制御情報に基づいて音場境界位置を決定する。遠方音場処理部21は、音場境界制御部41、遠方音再生フィルタ係数記録部42、およびフィルタ係数選択部43を有している。
 音場境界制御部41は、供給された制御情報に基づいて音場境界位置を決定するとともに、その決定結果に基づいて遠方音のゲイン調整のためのゲイン値を決定してゲイン調整部22に供給する。以下、遠方音のゲイン調整のためのゲイン値を、特に遠方音ゲイン値とも称する。
 また、音場境界制御部41は、音場境界位置の決定結果に基づいて、遠方音再生フィルタ係数記録部42に記録されている複数の遠方音再生フィルタ係数のなかから適切な遠方音再生フィルタ係数を選択するための遠方音再生フィルタ係数選択情報を生成し、フィルタ係数選択部43に供給する。
 遠方音再生フィルタ係数記録部42は、所定の音場境界位置よりもスピーカアレイ28から遠い側に遠方音再生音場を形成するための音響フィルタ係数である遠方音再生フィルタ係数を予め複数記録しており、記録している遠方音再生フィルタ係数をフィルタ係数選択部43に供給する。
 フィルタ係数選択部43は、音場境界制御部41から供給された遠方音再生フィルタ係数選択情報に基づいて、遠方音再生フィルタ係数記録部42に記録されている複数の遠方音再生フィルタ係数のなかから1つの遠方音再生フィルタ係数を選択し、フィルタ部23に供給する。
 ゲイン調整部22は、音場境界制御部41から供給された遠方音ゲイン値に基づいて、供給された音源信号に対するゲイン調整を行い、得られた音源信号をフィルタ部23に供給する。ゲイン調整部22に供給される音源信号は、遠方音を再生するための時間領域の音響信号である。
 フィルタ部23は、ゲイン調整部22から供給された音源信号に対して、フィルタ係数選択部43から供給された遠方音再生フィルタ係数を用いたフィルタ処理を行うことで遠方音再生信号を生成し、加算部27に供給する。フィルタ部23では、フィルタ処理として、音源信号と遠方音再生フィルタ係数とを畳み込む畳み込み処理が行われる。
 近傍音場処理部24は、供給された制御情報に基づいて音場境界位置を決定する。近傍音場処理部24は、音場境界制御部51、近傍音再生フィルタ係数記録部52、およびフィルタ係数選択部53を有している。
 音場境界制御部51は、供給された制御情報に基づいて音場境界位置を決定するとともに、その決定結果に基づいて近傍音のゲイン調整のためのゲイン値を決定してゲイン調整部25に供給する。以下、近傍音のゲイン調整のためのゲイン値を、特に近傍音ゲイン値とも称する。
 また、音場境界制御部51は、音場境界位置の決定結果に基づいて、近傍音再生フィルタ係数記録部52に記録されている複数の近傍音再生フィルタ係数のなかから適切な近傍音再生フィルタ係数を選択するための近傍音再生フィルタ係数選択情報を生成し、フィルタ係数選択部53に供給する。
 近傍音再生フィルタ係数記録部52は、所定の音場境界位置よりもスピーカアレイ28に近い側に近傍音再生音場を形成するための音響フィルタ係数である近傍音再生フィルタ係数を予め複数記録しており、記録している近傍音再生フィルタ係数をフィルタ係数選択部53に供給する。
 フィルタ係数選択部53は、音場境界制御部51から供給された近傍音再生フィルタ係数選択情報に基づいて、近傍音再生フィルタ係数記録部52に記録されている複数の近傍音再生フィルタ係数のなかから1つの近傍音再生フィルタ係数を選択し、フィルタ部26に供給する。
 ゲイン調整部25は、音場境界制御部51から供給された近傍音ゲイン値に基づいて、供給された音源信号に対するゲイン調整を行い、得られた音源信号をフィルタ部26に供給する。ゲイン調整部25に供給される音源信号は、近傍音を再生するための時間領域の音響信号である。
 なお、ここではゲイン調整部22に供給される音源信号と、ゲイン調整部25に供給される音源信号とは、互いに異なるコンテンツの音を再生するための信号である例について説明するが、それらの音源信号が同一のものであってもよい。
 フィルタ部26は、ゲイン調整部25から供給された音源信号に対して、フィルタ係数選択部53から供給された近傍音再生フィルタ係数を用いたフィルタ処理を行うことで近傍音再生信号を生成し、加算部27に供給する。フィルタ部26では、フィルタ処理として、音源信号と近傍音再生フィルタ係数とを畳み込む畳み込み処理が行われる。
 加算部27は、フィルタ部23から供給された遠方音再生信号と、フィルタ部26から供給された近傍音再生信号とを加算して、近傍音と遠方音を同時に再生するためのスピーカ駆動信号を生成し、スピーカアレイ28に供給する。換言すれば、加算部27では遠方音再生信号と近傍音再生信号とが合成されてスピーカ駆動信号が生成される。
 スピーカアレイ28は、例えば直線スピーカアレイ、平面スピーカアレイ、環状スピーカアレイ、球状スピーカアレイなど、複数のスピーカを並べて得られたスピーカアレイであり、加算部27から供給されたスピーカ駆動信号に基づいて近傍音と遠方音を再生する。
〈遠近別音場形成装置の各部について〉
 ここで、以下においてする説明で用いる座標系について、図4を参照して説明する。
 すなわち、以下においてする説明では、スピーカアレイ28の中心位置が3次元直交座標系の原点Oとされる。
 また、3次元直交座標系の3つの軸は原点Oを通り、互いに直交するx軸、y軸、およびz軸とされる。ここで、x軸の方向、つまりx方向はスピーカアレイ28を構成するスピーカが並ぶ方向とされる。また、y軸の方向、つまりy方向はx方向と垂直な方向であり、かつスピーカアレイ28から音波が出力される方向と平行な方向され、これらのx方向およびy方向と垂直な方向がz軸の方向、つまりz方向とされる。特に、スピーカアレイ28から音波が出力される方向がy方向の正の方向とされる。
 以下では、空間上の位置、つまり空間上の位置を示すベクトルをx座標、y座標、およびz座標を用いて(x,y,z)とも記すこととする。また、以下では、スピーカアレイ28は直線スピーカアレイであるものとして説明を続ける。
 次に、図3に示した遠近別音場形成装置11の各部について、より詳細に説明する。
(音場境界制御部)
 まず、音場境界制御部41および音場境界制御部51について説明する。
 音場境界制御部41および音場境界制御部51では、同じ処理が行われて音場境界位置が決定される。
 すなわち、例えば制御情報として受聴者位置情報が供給されたとする。空間上の受聴者の位置を示す受聴者位置情報は、カメラにより撮影された画像に対する画像認識や、センサを利用した受聴者の検出、ユーザ等による位置情報の入力などから得ることができる。
 このような場合、例えば制御情報としての受聴者位置情報により示される受聴者の位置が遠方音または近傍音の受聴領域に含まれるように、音場境界位置が決定される。
 より具体的には、例えば空間上に複数の受聴者がいるが、スピーカアレイ28近傍に受聴者が少ない場合には、スピーカアレイ28近傍にいる受聴者が含まれる程度の領域が近傍音の受聴領域となるように音場境界位置が決定される。
 これに対して、例えばスピーカアレイ28近傍にいる受聴者が増えて、これまでの近傍音の受聴領域内に全受聴者が収まらなくなったときには、音場境界位置をスピーカアレイ28からy方向により遠い位置に移動させて近傍音の受聴領域が広くなるようにされる。
 このように近傍音や遠方音の再生中、つまりコンテンツの再生中に動的に音場境界位置が変化するようにしてもよい。
 また、例えば制御情報として境界位置情報が供給された場合には、その境界位置情報により示される位置が音場境界位置とされる。
 音場境界位置が決定されると、その決定結果に応じて遠方音ゲイン値、近傍音ゲイン値、遠方音再生フィルタ係数選択情報、および近傍音再生フィルタ係数選択情報が得られる。
 例えば実際に音場を形成する際の音場境界位置は、遠方音ゲイン値や近傍音ゲイン値、遠方音再生音場を形成する際の制御点の位置、近傍音再生音場を形成する際のエバネッセント波の減衰率などによって定まる。
 逆にいえば、決定された任意の位置に対して遠方音ゲイン値や近傍音ゲイン値、遠方音再生音場の制御点の位置、エバネッセント波の減衰率などを適切に定めることで、その決定された位置が音場境界位置となるように、遠方音再生音場と近傍音再生音場を形成することができる。つまり、遠方音ゲイン値や近傍音ゲイン値、遠方音再生音場の制御点の位置、エバネッセント波の減衰率などを調整することで、任意の位置を音場境界位置とすることができる。
 具体的には、例えば遠方音と近傍音として、それぞれコンテンツAの音とコンテンツBの音を再生する場合、それらのコンテンツの音の音源信号のゲインを調整することで、音場境界位置を変化させることができる。すなわち、音場境界位置の制御を行うことができる。
 例えば図5に示すようにスピーカアレイ28の位置をy=0の位置としたとき、y方向に対してコンテンツB、つまり近傍音の音圧が直線L21に示すように変化し、コンテンツA、つまり遠方音の音圧が曲線L22に示すように変化することが分かっているとする。なお、図5において縦軸は音圧を示しており、横軸はy方向の位置を示している。
 このようにコンテンツAの音圧が曲線L22に示すように変化(減衰)し、コンテンツBの音圧が直線L21に示すように変化(減衰)するときには、曲線L22と直線L21の交点位置、すなわち矢印W11に示す位置が音場境界位置となる。
 このような状態から、コンテンツAのゲインを大きくすると、すなわち遠方音ゲイン値を大きくすると、例えばコンテンツA、つまり遠方音の音圧はy方向に対して曲線L23に示すように変化するようになる。
 この例では、コンテンツAのゲイン調整によって、y方向の各位置におけるコンテンツAの音圧が大きくなっており、その結果、音場境界位置がスピーカアレイ28により近い位置に移動している。すなわち、コンテンツAの音圧の増加に応じて音場境界位置がスピーカアレイ28に近づいている。この場合、曲線L23と直線L21の交点位置、すなわち矢印W21に示す位置が音場境界位置となる。
 同様に、コンテンツBのゲイン調整を行うことでも音場境界位置が変化する。この場合、コンテンツBのゲインを大きくすると、すなわち近傍音ゲイン値を大きくすると、音場境界位置はスピーカアレイ28から遠ざかることになる。
 このようなことから、決定された音場境界位置に対して、適切に遠方音ゲイン値や近傍音ゲイン値を定めることで、近傍音再生音場と遠方音再生音場を同時に形成したときの音場境界位置が、決定された音場境界位置となるようにすることができる。
 音場境界制御部41および音場境界制御部51では、予め用意された遠方音再生フィルタ係数や近傍音再生フィルタ係数を用いた場合に、遠方音や近傍音の音圧がy方向の各位置でどの程度となるかが予め分かっている。すなわち、直線L21や曲線L22が既知となっている。
 そのため、音場境界制御部41および音場境界制御部51は、決定された音場境界位置に対して、その音場境界位置が実際の音場形成時に音場境界位置となるような遠方音ゲイン値や近傍音ゲイン値を求めることができる。
 なお、遠方音ゲイン値と近傍音ゲイン値のうちの何れか一方のみによりゲイン調整が行われるようにしてもよいし、それらの両方を組み合わせてゲイン調整が行われるようにしてもよい。例えば実質的に遠方音ゲイン値のみによりゲイン調整が行われるときには、近傍音ゲイン値は1とされる。
 音場境界位置の制御を遠方音ゲイン値や近傍音ゲイン値のみで行う場合には、遠方音再生フィルタ係数や近傍音再生フィルタ係数はそれぞれ1つ(1種類)だけ用意すればよい。
 また、例えば遠方音再生音場を形成するための遠方音再生フィルタ係数の制御点の位置を変化させることでも音場境界位置は変化する。
 例えばスピーカアレイを用いた音場形成では、スピーカアレイを構成するスピーカが並ぶ方向、つまりここではx方向と平行なリファレンスラインと呼ばれる制御点群からなる制御線が存在する。そして、その制御点上でのみ形成音場を理想的な音場と一致させることが可能である。
 遠方音再生フィルタ係数記録部42には、複数の制御点ごと、つまり制御点のy方向の位置ごとの遠方音再生フィルタ係数が予め記録されており、それらのうちの所定の1つの制御点位置の遠方音再生フィルタ係数が選択されてフィルタ部23へと供給される。
 遠方音と近傍音として、それぞれコンテンツAの音とコンテンツBの音を再生する場合、コンテンツAの音を再生するための遠方音再生信号の生成に用いる遠方音再生フィルタ係数の制御点の位置が変化すると、例えば図6に示すように音場境界位置が変化する。なお、図6において縦軸は音圧を示しており、横軸はy方向の位置を示している。
 図6の例では、スピーカアレイ28の位置がy=0の位置とされており、直線L31はy方向の各位置におけるコンテンツB、つまり近傍音の音圧を示している。また、曲線L32は、y方向の各位置におけるコンテンツA、つまり遠方音の音圧を示している。すなわち、直線L31および曲線L32は、コンテンツBとコンテンツAのy方向に対する音圧の減衰の様子を示している。
 なお、上述したように遠方音再生フィルタ係数や近傍音再生フィルタ係数を用いた場合に、遠方音や近傍音の音圧がy方向の各位置でどの程度となるかは既知である。
 このようにコンテンツAの音圧が曲線L32に示すように変化し、コンテンツBの音圧が直線L31に示すように変化するときには、曲線L32と直線L31の交点位置、すなわち矢印W21に示す位置が音場境界位置となる。
 例えば、ここでは曲線L32に示す音圧が得られる遠方音再生フィルタ係数の制御点の位置がy=y1であるとする。
 これに対して、制御点の位置がy1である遠方音再生フィルタ係数に代えて、制御点の位置がy1よりも、よりスピーカアレイ28から遠い側のy=y2である遠方音再生フィルタ係数を用いてコンテンツAの音を再生するための遠方音再生信号を生成したとする。
 この場合、コンテンツAの音圧はy方向に対して曲線L33に示すように変化し、音場境界位置は矢印W22に示す位置となる。
 このように、y方向において制御点の位置をスピーカアレイ28からより遠い位置とすると、音場境界位置はスピーカアレイ28に近づくことが分かる。逆に、y方向において制御点の位置をスピーカアレイ28に近づけると、音場境界位置はスピーカアレイ28から遠ざかる。
 このようなことから、決定された音場境界位置に対して、適切に遠方音再生音場の制御点、つまり遠方音再生フィルタ係数の制御点を定めることで、近傍音再生音場と遠方音再生音場を同時に形成したときの音場境界位置が、決定された音場境界位置となるようにすることができる。
 音場境界制御部41や音場境界制御部51では、予め用意された遠方音再生フィルタ係数や近傍音再生フィルタ係数を用いた場合に、遠方音や近傍音の音圧がy方向の各位置でどの程度となるかが予め分かっている。
 そのため、音場境界制御部41や音場境界制御部51は、決定された音場境界位置に対して、その音場境界位置が実際の音場形成時に音場境界位置となるような遠方音再生フィルタ係数の制御点の位置を求めることができる。
 さらに、例えば近傍音再生音場を形成するための近傍音再生フィルタ係数の音圧減衰率、すなわちエバネッセント波の減衰率を変化させることでも音場境界位置は変化する。
 近傍音再生フィルタ係数記録部52には、y方向の音圧減衰率を示す定数αと制御点との組み合わせごとの近傍音再生フィルタ係数が予め記録されており、それらのうちの1つの近傍音再生フィルタ係数が選択されてフィルタ部26へと供給される。
 例えば遠方音と近傍音として、それぞれコンテンツAの音とコンテンツBの音を再生する場合、コンテンツBの音を再生するための近傍音再生信号の生成に用いる近傍音再生フィルタ係数の定数α、すなわち音圧減衰率が変化すると、例えば図7に示すように音場境界位置が変化する。なお、図7において縦軸は音圧を示しており、横軸はy方向の位置を示している。
 図7の例では、スピーカアレイ28の位置がy=0の位置とされており、直線L41はy方向の各位置におけるコンテンツB、つまり近傍音の音圧を示している。また、曲線L42は、y方向の各位置におけるコンテンツA、つまり遠方音の音圧を示している。すなわち、直線L41および曲線L42は、コンテンツBとコンテンツAのy方向に対する音圧の減衰の様子を示している。
 このようにコンテンツAの音圧が曲線L42に示すように変化し、コンテンツBの音圧が直線L41に示すように変化するときには、曲線L42と直線L41の交点位置、すなわち矢印W31に示す位置が音場境界位置となる。
 例えば、ここでは直線L41に示す音圧が得られる近傍音再生フィルタ係数の定数αの値がα1であるとする。
 これに対して、定数α=α1である近傍音再生フィルタ係数に代えて、定数α=α1のときよりも音圧減衰率がより大きい、定数α=α2である近傍音再生フィルタ係数を用いてコンテンツBの音を再生するための近傍音再生信号を生成したとする。
 この場合、コンテンツBの音圧はy方向に対して直線L43に示すように変化し、音場境界位置は矢印W32に示す位置となる。
 このように、より音圧減衰率の大きい近傍音再生フィルタ係数を用いると、音場境界位置はスピーカアレイ28に近づくことが分かる。逆に、より音圧減衰率の小さい近傍音再生フィルタ係数を用いると、音場境界位置はスピーカアレイ28から遠ざかる。
 このようなことから、決定された音場境界位置に対して、適切に近傍音再生フィルタ係数の音圧減衰率、すなわち定数αを定めることで、近傍音再生音場と遠方音再生音場を同時に形成したときの音場境界位置が、決定された音場境界位置となるようにすることができる。
 音場境界制御部51や音場境界制御部41では、予め用意された遠方音再生フィルタ係数や近傍音再生フィルタ係数を用いた場合に、遠方音や近傍音の音圧がy方向の各位置でどの程度となるかが予め分かっている。
 そのため、音場境界制御部51や音場境界制御部41は、決定された音場境界位置に対して、その音場境界位置が実際の音場形成時に音場境界位置となるような近傍音再生フィルタ係数の定数αを求めることができる。
 なお、近傍音再生フィルタ係数は、音圧減衰率を示す定数αと制御点の組み合わせごとに用意されているが、近傍音再生フィルタ係数の制御点を変化させることでも音場境界位置は変化する。したがって、近傍音再生フィルタ係数についても音場境界位置に応じて適切な制御点が決定されるようにしてもよい。
 以上のように、遠方音ゲイン値や近傍音ゲイン値、遠方音再生フィルタ係数の制御点、近傍音再生フィルタ係数の制御点や定数αによって音場境界位置は変化する。
 そこで、音場境界制御部41および音場境界制御部51は、決定された音場境界位置に対して遠方音ゲイン値、近傍音ゲイン値、遠方音再生フィルタ係数の制御点、および近傍音再生フィルタ係数の制御点と定数αの適切な組み合わせを決定する。
 この場合、遠方音ゲイン値、近傍音ゲイン値、遠方音再生フィルタ係数の制御点、近傍音再生フィルタ係数の制御点、および近傍音再生フィルタ係数の定数αのうちのいくつかが動的に決定され、それ以外のものは予め定められているようにしてもよい。
 特に、遠方音ゲイン値等の各パラメータの決定にあたっては、例えばy方向の所定位置において所望の音圧を確保したいなどを考慮すべき場合がある。また、音場形成では遠方音や近傍音の受聴領域は、制御点よりもスピーカアレイ28から遠い側である必要がある。
 そのため、例えば音場境界位置に応じて遠方音再生フィルタ係数の制御点のみを変化させても、所望の音圧を確保したり適切な位置に受聴領域を形成したりすることができない可能性もある。しかし、遠方音再生フィルタ係数の制御点だけでなく、遠方音ゲイン値や近傍音ゲイン値も組み合わせて変化させるなど、複数のパラメータを動的に決定するようにすれば、所望の音圧を確保したり、適切な位置に受聴領域を形成したりすることができるようになる。
 このようにして、音場境界位置に対して各パラメータの値が決定されると、例えば音場境界制御部41は、決定した遠方音再生フィルタ係数の制御点の位置を示す情報を、遠方音再生フィルタ係数選択情報としてフィルタ係数選択部43に供給する。また、例えば音場境界制御部51は、決定した近傍音再生フィルタ係数の制御点の位置と定数αを示す情報を、近傍音再生フィルタ係数選択情報としてフィルタ係数選択部53に供給する。
(遠方音再生フィルタ係数記録部)
 遠方音再生フィルタ係数記録部42は、複数の制御点の位置ごとに遠方音再生フィルタ係数を記録している。
 例えば遠方音再生フィルタ係数は、SDM(Spectral Division Method)法により予め求められたものとされる。
 なお、SDM法については、例えば「Jens Ahrens and Sascha Spors, “Sound Field Reproduction Using Planar and Linear Arrays of Loudspeakers”, in IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL. 18, NO. 8, NOVEMBER 2010.」などに詳細に記載されている。
 例えば、3次元自由空間における音場P(v,ntf)は次式(1)に示すように表される。
Figure JPOXMLDOC01-appb-M000001
 なお、式(1)においてntfは時間周波数インデックスを示しており、vは空間上の位置を示すベクトルでありv=(x,y,z)である。また、式(1)においてv0はx軸上の所定の位置を示すベクトルでありv0=(x0,0,0)である。なお、以下、ベクトルvにより示される位置を位置vとも称し、ベクトルv0により示される位置を位置v0とも称することとする。
 さらに、式(1)においてD(v0,ntf)は二次音源の駆動信号を示しており、G(v,v0,ntf)は、位置vと位置v0との間の伝達関数である。この二次音源の駆動信号D(v0,ntf)は、遠方音再生信号に対応する。
 このような式(1)の計算では、空間領域においては駆動信号D(v0,ntf)と伝達関数G(v,v0,ntf)の畳み込みのかたちとなっており、式(1)に示す音場P(v,ntf)をx軸方向に空間フーリエ変換すると、次式(2)に示すようになる。
Figure JPOXMLDOC01-appb-M000002
 なお、式(2)において、nsfは空間周波数インデックスを示している。
 このように音場P(v,ntf)を空間フーリエ変換すると、式(2)に示すように空間周波数領域の音場PF(nsf,y,z,ntf)は、空間周波数領域の駆動信号DF(nsf,ntf)と伝達関数GF(nsf,y,z,ntf)との積により表される。したがって、二次音源の駆動信号の空間周波数表現は、次式(3)に示すようになる。
Figure JPOXMLDOC01-appb-M000003
 また、直線上の二次音源を用いる場合、その直線と平行な制御点上、つまりリファレンスライン上でのみ実際に形成される音場を理想的な音場と一致さることができる。そこで、その制御点のy方向の位置をy=yrefとし、また水平面上での音場形成を考えるためz=0とすると、式(3)は次式(4)に示すようになる。
Figure JPOXMLDOC01-appb-M000004
 この式(4)により示される二次音源の駆動信号DF(nsf,ntf)は、y=yrefの位置を制御点として、その制御点で理想的な音場を形成するための駆動信号である。
 また、例えば所望する音場PF(nsf,yref,0,ntf)として、次式(5)に示すように点音源モデルPps(nsf,yref,0,ntf)を用いることができる。
Figure JPOXMLDOC01-appb-M000005
 なお、式(5)において、S(ntf)は再生しようとする音の音源信号を示しており、jは虚数単位を示しており、kxはx軸方向の波数を示している。また、xpsおよびypsはそれぞれ点音源の位置を示すx座標およびy座標を示しており、ωは角周波数を示しており、cは音速を示している。さらに、H0 (2)は第二種ハンケル関数を示しており、K0はベッセル関数を示している。なお、遠方音再生フィルタ係数は音源に依存しないため、ここではS(ntf)=1とされる。
 また、伝達関数GF(nsf,yref,0,ntf)は、次式(6)に示すように表すことができる。
Figure JPOXMLDOC01-appb-M000006
 以上の式(4)、式(5)、および式(6)が用いられて、駆動信号DF(nsf,ntf)、すなわち遠方音再生信号の空間周波数スペクトルDF(nsf,ntf)が求められる。
 次に、空間周波数スペクトルDF(nsf,ntf)を、DFT(Discrete Fourier Transform)を用いて空間周波数合成することで、時間周波数スペクトルD(l,ntf)が求められる。すなわち、次式(7)を計算することで、時間周波数スペクトルD(l,ntf)が算出される。
Figure JPOXMLDOC01-appb-M000007
 なお、式(7)において、lはスピーカアレイ28を構成するスピーカを識別し、そのスピーカのx方向の位置を示すスピーカインデックスを示しており、MdsはDFTのサンプル数を示している。
 さらに、時間周波数スペクトルD(l,ntf)に対して、IDFT(Inverse Discrete Fourier Transform)を用いて時間周波数合成が行われ、時間信号であるスピーカアレイ28の各スピーカのスピーカ駆動信号d(l,nd)が求められる。具体的には、次式(8)の計算を行うことで、スピーカ駆動信号d(l,nd)が算出される。これらの各スピーカのスピーカ駆動信号d(l,nd)が遠方音再生信号である。
Figure JPOXMLDOC01-appb-M000008
 なお、式(8)において、ndは時間インデックスを示しており、MdtはIDFTのサンプル数を示している。
 このようにして求められたスピーカ駆動信号d(l,nd)は、音源に依存しないフィルタ係数そのものを表している。そこで、このスピーカ駆動信号d(l,nd)の時間インデックスndを、時間インデックスmに置き換えたものが、点音源の位置(xps,yps)および制御点の位置y=yrefについて求められた遠方音再生フィルタ係数hf(l,m)とされる。
 ここでは、1つの制御点について、スピーカアレイ28のスピーカインデックスlにより識別されるスピーカごとに遠方音再生フィルタ係数hf(l,m)が求められる。
 遠方音再生フィルタ係数記録部42には、複数の各制御点の遠方音再生フィルタ係数hf(l,m)が予め記録されている。
 したがって、フィルタ係数選択部43は、複数の制御点ごとの遠方音再生フィルタ係数hf(l,m)のうち、音場境界制御部41から供給された遠方音再生フィルタ係数選択情報により示される制御点と同じ制御点の遠方音再生フィルタ係数hf(l,m)を遠方音再生フィルタ係数記録部42から読み出してフィルタ部23に供給する。
 なお、遠方音再生フィルタ係数を求める際に面状の二次音源を用いる場合には制御点群は面状となるが、そのような場合においても直線上の二次音源を用いる場合と同様にして遠方音再生フィルタ係数を求めることができる。
(近傍音再生フィルタ係数記録部)
 近傍音再生フィルタ係数記録部52は、複数の制御点の位置と、複数の定数αとの組み合わせごとに近傍音再生フィルタ係数を記録している。これらの近傍音再生フィルタ係数は、y方向に減衰するエバネッセント波をスピーカアレイ28により生成するための音響フィルタのフィルタ係数である。
 このような近傍音再生フィルタ係数は、例えば以下のようにして求められる。
 例えば3次元自由空間において、任意の位置vにおける時刻tの音場p(v,t)は、次式(9)に示す波動方程式を満たす。
Figure JPOXMLDOC01-appb-M000009
 なお、式(9)においてcは音速を示しており、∇2は次式(10)に示す通りである。
Figure JPOXMLDOC01-appb-M000010
 また、時間フーリエ逆変換T(t)を次式(11)に示すものとすると、時間フーリエ変換F(・)は以下の式(12)に示すようになる。
Figure JPOXMLDOC01-appb-M000011
Figure JPOXMLDOC01-appb-M000012
 なお、式(11)および式(12)において、jは虚数単位を示しており、ωは角周波数を示している。
 ここで、上述した式(9)に対して、次式(13)に示すように変数分離を行って空間の微分と時間の微分を分けて、さらに式(12)を用いると、以下の式(14)に示すヘルムホルツ方程式が得られる。
Figure JPOXMLDOC01-appb-M000013
Figure JPOXMLDOC01-appb-M000014
 なお、式(14)においてP(v,ω)は、位置vにおける角周波数ωの音場を示している。また、角周波数がωpwであり、x方向、y方向、およびz方向のそれぞれの波数がkpw,x、kpw,y、およびkpw,zであるときの、角周波数ωpw、波数kpw,x、波数kpw,y、および波数kpw,zにより表される方向に伝搬する平面波を表す、式(14)に示すヘルムホルツ方程式の一般解は、次式(15)に示すものとなる。
Figure JPOXMLDOC01-appb-M000015
 なお、式(15)においてδ(ω-ωpw)はデルタ関数を示している。
 ここで、波数領域では、次式(16)に示す関係が成立する。
Figure JPOXMLDOC01-appb-M000016
 式(16)をy方向の波数kpw,yについて解くと、次式(17)に示すようになる。
Figure JPOXMLDOC01-appb-M000017
 この式(17)の上段、つまり上側に示される波数kpw,yの波は通常の伝搬波を表しており、式(17)の下段、つまり下側に示される波数kpw,yの波はエバネッセント波を表している。
 そこで、式(17)の下段に示されるエバネッセント波の波数kpw,yを式(15)に示した音場P(v,ω)に代入すると、次式(18)に示すようになる。
Figure JPOXMLDOC01-appb-M000018
 但し、波数kpw,yを式(15)に代入するにあたり、波数kpw,yの符号が正の項は物理的に意味をもたない解となるため、符号が負である項が代入されている。
 また、式(18)における(kpw,x 2+kpw,z 2-(ω/c)21/2は、エバネッセント波の減衰の大きさを定める項である。
 したがって、例えば角周波数ωに依存せず、一定の減衰の大きさとしたい場合には、減衰の大きさを表す定数αを用いて、次式(19)を満たすように波数kpw,xおよび波数kpw,zを設定すればよい。このとき、式(18)から分かるように定数αが大きいほど、y方向へのエバネッセント波の減衰率が大きくなる。このような式(19)に示される定数αが上述したy方向の音圧減衰率を示す定数である。
Figure JPOXMLDOC01-appb-M000019
 ここで、式(18)で表されるエバネッセント波を生成する近傍音再生信号を得るための近傍音再生フィルタ係数を求めることを考える。
 式(18)をxについて空間フーリエ変換すると、次式(20)に示すように表される。
Figure JPOXMLDOC01-appb-M000020
 また、伝達関数の空間周波数スペクトルG'(kx,y,z,ω)は、次式(21)に示すように表される。
Figure JPOXMLDOC01-appb-M000021
 なお、式(21)においてH0 (2)は第二種ハンケル関数を示しており、K0はベッセル関数を示している。
 さらに、式(20)と式(21)を用いてSDM法より、近傍音再生信号の空間周波数スペクトルD'(kx,ω)は次式(22)に示すようになる。
Figure JPOXMLDOC01-appb-M000022
 式(22)において、yrefはy方向における基準となる制御点の位置を示している。
 このようにして得られた式(22)を、波数kxについて逆空間フーリエ変換することで、次式(23)に示す近傍音再生信号の時間周波数スペクトルD(x,ω)が得られる。
Figure JPOXMLDOC01-appb-M000023
 さらに、このようにして得られた時間周波数スペクトルD(x,ω)を逆時間フーリエ変換すると、次式(24)に示すように近傍音再生信号の時間波形d(x,t)、すなわち時間信号であるスピーカ駆動信号d(x,t)が求まる。
Figure JPOXMLDOC01-appb-M000024
 このとき、スピーカアレイ28を構成するスピーカを識別し、そのスピーカのx方向の位置を示すインデックスをlとすると、以下の式(25)に示すように、式(24)からインデックスlのスピーカの近傍音再生フィルタ係数hn(l,m)が求まる。
Figure JPOXMLDOC01-appb-M000025
 なお、式(25)において、mは時間インデックスを示している。この近傍音再生フィルタ係数hn(l,m)は、式(24)に示したスピーカ駆動信号d(x,t)におけるxをインデックスlに置き換えるとともに、tを時間インデックスmに置き換えることにより得られる。
 近傍音再生フィルタ係数記録部52には、複数の制御点の位置yrefと複数の定数αとの組み合わせごとの近傍音再生フィルタ係数hn(l,m)が予め記録されている。
 したがって、フィルタ係数選択部53は、それらの近傍音再生フィルタ係数hn(l,m)のうち、音場境界制御部51から供給された近傍音再生フィルタ係数選択情報により示される制御点および定数αと同じ制御点および定数αの近傍音再生フィルタ係数hn(l,m)を近傍音再生フィルタ係数記録部52から読み出してフィルタ部26に供給する。
 また、以上においては、波数領域でエバネッセント波を求め、近傍音再生フィルタ係数hn(l,m)を算出する方法について説明したが、これ以外の方法でエバネッセント波を生成する近傍音再生フィルタ係数hn(l,m)を求めるようにしてもよい。
(フィルタ部)
 例えば、ゲイン調整部22からフィルタ部23に供給される音源信号と、ゲイン調整部25からフィルタ部26に供給される音源信号とを特に区別せずに音源信号x(n)と記すとする。なお、音源信号x(n)におけるnは時間インデックスを示している。
 また、遠方音再生フィルタ係数hf(l,m)と近傍音再生フィルタ係数hn(l,m)とを区別する必要のない場合、フィルタ係数h(l,m)とも称することとする。
 フィルタ部23およびフィルタ部26では、供給された音源信号x(n)と、フィルタ係数h(l,m)とを畳み込んでスピーカ駆動信号s(l,n)を求める処理が行われる。すなわち、フィルタ部23およびフィルタ部26では、スピーカアレイ28を構成するスピーカごとに次式(26)の計算が行われて、スピーカインデックスlにより識別される各スピーカのスピーカ駆動信号s(l,n)が算出される。
Figure JPOXMLDOC01-appb-M000026
 なお、式(26)において、Nはフィルタ長を示している。
 このような式(26)の計算によりフィルタ部23で求められた各スピーカのスピーカ駆動信号s(l,n)が遠方音再生信号である。また、式(26)の計算によりフィルタ部26で求められた各スピーカのスピーカ駆動信号s(l,n)が近傍音再生信号である。
〈遠近別音場形成処理の説明〉
 続いて、遠近別音場形成装置11の動作について説明する。すなわち、以下、図8のフローチャートを参照して、遠近別音場形成装置11により行われる遠近別音場形成処理について説明する。
 ステップS11において、音場境界制御部41および音場境界制御部51は、供給された制御情報に基づいて音場境界位置を決定する。
 例えば音場境界制御部41および音場境界制御部51は、制御情報として供給された受聴者位置情報により示される受聴者の位置に基づいて、近傍音の受聴領域と遠方音の受聴領域とを定め、それらの受聴領域の間の位置を音場境界位置とする。また、例えば音場境界制御部41および音場境界制御部51は、制御情報として供給された境界位置情報により示される位置をそのまま音場境界位置とする。
 ステップS12において、音場境界制御部41および音場境界制御部51は、ステップS11の処理で決定した音場境界位置に基づいて、遠方音ゲイン値等の各パラメータを決定する。
 すなわち、音場境界制御部41および音場境界制御部51は、例えば図5乃至図7を参照して説明したように、音場境界位置に応じて、パラメータとして遠方音ゲイン値、近傍音ゲイン値、遠方音再生フィルタ係数の制御点の位置、近傍音再生フィルタ係数の制御点の位置、および近傍音再生フィルタ係数の定数αの各値を決定する。
 なお、それらのパラメータのうちのいくつかは予め定められた値とされ、残りのパラメータの値が音場境界位置に基づいて決定されてもよい。また、音場境界位置を決定してから、その音場境界位置に応じて各パラメータの値を決定するのではなく、音場境界位置と各パラメータの値が互いに調整されながら同時に決定されるようにしてもよい。すなわち、ステップS11とステップS12の処理が同時に行われてもよい。
 各パラメータが決定されると、音場境界制御部41は決定されたパラメータとしての遠方音ゲイン値をゲイン調整部22に供給するとともに、決定されたパラメータとしての遠方音再生フィルタ係数の制御点の位置を示す情報を、遠方音再生フィルタ係数選択情報としてフィルタ係数選択部43に供給する。
 また、音場境界制御部51は決定されたパラメータとしての近傍音ゲイン値をゲイン調整部25に供給するとともに、決定されたパラメータとしての近傍音再生フィルタ係数の制御点の位置と定数αを示す情報を、近傍音再生フィルタ係数選択情報としてフィルタ係数選択部53に供給する。
 ステップS13において、フィルタ係数選択部43およびフィルタ係数選択部53は、フィルタ係数を選択する。
 具体的には、フィルタ係数選択部43は、複数の制御点ごとの遠方音再生フィルタ係数のなかから、音場境界制御部41から供給された遠方音再生フィルタ係数選択情報により示される制御点の遠方音再生フィルタ係数を選択する。つまり、遠方音再生フィルタ係数選択情報により示される制御点の位置に対応する遠方音再生フィルタ係数が選択される。
 そして、フィルタ係数選択部43は、選択した遠方音再生フィルタ係数を遠方音再生フィルタ係数記録部42から読み出してフィルタ部23に供給する。
 同様に、フィルタ係数選択部53は、複数の制御点および定数αの組み合わせごとの近傍音再生フィルタ係数のなかから、音場境界制御部51から供給された近傍音再生フィルタ係数選択情報により示される制御点の位置および定数αの近傍音再生フィルタ係数を選択する。すなわち、近傍音再生フィルタ係数選択情報により示される制御点の位置および定数αに対応する近傍音再生フィルタ係数が選択される。
 そして、フィルタ係数選択部53は、選択した近傍音再生フィルタ係数を近傍音再生フィルタ係数記録部52から読み出してフィルタ部26に供給する。
 ステップS14において、ゲイン調整部22およびゲイン調整部25は、供給された音源信号のゲイン調整を行う。
 すなわち、ゲイン調整部22は、供給された音源信号に対して、音場境界制御部41から供給された遠方音ゲイン値を乗算することでゲイン調整を行い、その結果得られた音源信号をフィルタ部23に供給する。
 また、ゲイン調整部25は、供給された音源信号に対して、音場境界制御部51から供給された近傍音ゲイン値を乗算することでゲイン調整を行い、その結果得られた音源信号をフィルタ部26に供給する。
 ステップS15において、フィルタ部23およびフィルタ部26は音源信号に対するフィルタ処理を行う。
 すなわち、例えばフィルタ部23は上述した式(26)の計算を行うことで、ゲイン調整部22から供給された音源信号と、フィルタ係数選択部43から供給された遠方音再生フィルタ係数とを畳み込んで遠方音再生信号を生成し、加算部27に供給する。
 また、例えばフィルタ部26は上述した式(26)の計算を行うことで、ゲイン調整部25から供給された音源信号と、フィルタ係数選択部53から供給された近傍音再生フィルタ係数とを畳み込んで近傍音再生信号を生成し、加算部27に供給する。
 なお、ここではゲイン調整が行われた音源信号が用いられて遠方音再生信号や近傍音再生信号が生成される例について説明した。しかし、ゲイン調整が行われていない音源信号が用いられて遠方音再生信号や近傍音再生信号が生成され、それらの遠方音再生信号や近傍音再生信号に対してゲイン調整が行われるようにしてもよい。
 そのような場合、例えばゲイン調整部22により遠方音ゲイン値に基づいて遠方音再生信号に対するゲイン調整が行われ、ゲイン調整部25により近傍音ゲイン値に基づいて近傍音再生信号に対するゲイン調整が行われる。
 ステップS16において、加算部27は、フィルタ部23から供給された遠方音再生信号と、フィルタ部26から供給された近傍音再生信号とを加算してスピーカ駆動信号を生成し、スピーカアレイ28に供給する。
 ステップS17において、スピーカアレイ28は、加算部27から供給されたスピーカ駆動信号に基づいて遠方音と近傍音を同時に再生し、遠近別音場形成処理は終了する。
 このようにして遠方音と近傍音が同時に再生されると、空間上の互いに異なる領域に遠方音再生音場と近傍音再生音場とが形成される。すなわち、互いに異なる位置に遠方音の受聴領域と、近傍音の受聴領域とが形成される。
 以上のようにして遠近別音場形成装置11は、音場境界位置に応じて遠方音ゲイン値等の各パラメータを決定し、決定されたパラメータに応じてゲイン調整やフィルタ処理を行って遠方音と近傍音を再生するスピーカ駆動信号を生成する。このようにすることで、遠方と近傍とで異なる音を再生することができる。
〈第2の実施の形態〉
〈遠近別音場形成装置の構成例〉
 なお、以上においては遠方音再生信号と近傍音再生信号とを加算してスピーカ駆動信号を生成し、1つのスピーカアレイ28で遠方音と近傍音を再生する例について説明したが、遠方音と近傍音をそれぞれ異なるスピーカアレイにより再生するようにしてもよい。
 そのような場合、遠近別音場形成装置は、例えば図9に示すように構成される。なお、図9において図3における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。
 図9に示す遠近別音場形成装置81は、遠方音場処理部21、ゲイン調整部22、フィルタ部23、近傍音場処理部24、ゲイン調整部25、フィルタ部26、スピーカアレイ28、およびスピーカアレイ91を有している。
 また遠方音場処理部21には音場境界制御部41、遠方音再生フィルタ係数記録部42、およびフィルタ係数選択部43が設けられており、近傍音場処理部24には音場境界制御部51、近傍音再生フィルタ係数記録部52、およびフィルタ係数選択部53が設けられている。
 この遠近別音場形成装置81の構成は、加算部27が設けられておらず、新たにスピーカアレイ91が設けられている点で図3の遠近別音場形成装置11の構成と異なり、その他の点では遠近別音場形成装置11と同じ構成となっている。
 遠近別音場形成装置81では、フィルタ部23で得られた遠方音再生信号がスピーカアレイ28に供給されて、スピーカアレイ28では遠方音再生信号に基づいて遠方音が再生される。また、フィルタ部26で得られた近傍音再生信号はスピーカアレイ91に供給される。
 スピーカアレイ91は、例えば直線スピーカアレイ、平面スピーカアレイ、環状スピーカアレイ、球状スピーカアレイなど、複数のスピーカを並べて得られたスピーカアレイであり、フィルタ部26から供給された近傍音再生信号に基づいて近傍音を再生する。
 ここで、スピーカアレイ28とスピーカアレイ91とは、y方向の同じ位置に配置されるようにしてもよいし、y方向の異なる位置に配置されるようにしてもよい。
 例えばスピーカアレイ28とスピーカアレイ91のそれぞれのy方向の配置位置が異なる場合には、近傍音再生音場がエバネッセント波に限らず、平面波や球面波などの伝搬波によって形成されるようにすることもできる。
 これは、例えば遠方音の音圧のy方向への減衰のしかたと、近傍音の音圧のy方向への減衰のしかたが同様であっても、それらの遠方音と近傍音を再生するスピーカアレイのy方向の位置が異なれば、それらの音の音圧の減衰曲線、すなわち例えば図6に示した曲線L32に対応する曲線は交点を有するからである。
 そのため、近傍音再生フィルタ係数を、例えば遠方音再生フィルタ係数における場合と同様にして生成した、平面波や球面波などにより近傍音再生音場を形成するためのフィルタ係数とすることも可能である。
〈遠近別音場形成処理の説明〉
 次に、図9に示した遠近別音場形成装置81の動作について説明する。すなわち、以下、図10のフローチャートを参照して、遠近別音場形成装置81により行われる遠近別音場形成処理について説明する。
 なお、ステップS41乃至ステップS45の処理は、図8のステップS11乃至ステップS15の処理と同様であるので、その説明は省略する。但し、ステップS45では、フィルタ部23は得られた遠方音再生信号をスピーカアレイ28に供給し、フィルタ部26は得られた近傍音再生信号をスピーカアレイ91に供給する。
 ステップS46において、スピーカアレイ28は、フィルタ部23から供給された遠方音再生信号に基づいて遠方音を再生する。
 また、ステップS47において、スピーカアレイ91は、フィルタ部26から供給された近傍音再生信号に基づいて近傍音を再生する。
 なお、より詳細には、ステップS46およびステップS47は同時に行われる。これにより、空間上の互いに異なる領域に遠方音再生音場と近傍音再生音場とが形成される。すなわち、互いに異なる位置に遠方音の受聴領域と、近傍音の受聴領域とが形成される。
 遠方音と近傍音が再生されると、遠近別音場形成処理は終了する。
 以上のようにして遠近別音場形成装置81は、音場境界位置に応じて遠方音ゲイン値等の各パラメータを決定し、決定されたパラメータに応じてゲイン調整やフィルタ処理を行って遠方音再生信号と近傍音再生信号を生成する。このようにすることで、遠方と近傍とで異なる音を再生することができる。
 なお、以上においては遠方音と近傍音を同時に再生すると説明したが、遠方音と近傍音が異なるタイミングで再生されるようにしてもよい。
 そのような場合、例えば近傍音の再生が行われていないタイミングで遠方音の再生が行われる。また、近傍音の音量が小さいときに遠方音が再生されてもよい。すなわち、例えばフィルタ部23に、近傍音を再生するための音源信号も供給されるようにし、フィルタ部23は、近傍音を再生するための音源信号の振幅がほぼ0であるときなど、近傍音の音量が小さいとき、つまり近傍音が再生されないタイミングを検出する。そしてフィルタ部23は、近傍音が再生されないタイミングで遠方音再生信号をスピーカアレイ28に供給し、遠方音を再生させる。
 このようにすることで、近傍音が再生されていないとき、つまり近傍音の音がしないときに遠方音を再生し、近傍音の音圧と遠方音の音圧との差が小さい位置においても、遠方音と近傍音が混ざり合って受聴者に聞こえてしまうことを防止することができる。
 また、2つのスピーカアレイ28とスピーカアレイ91を用いて互いに異なる音を再生する場合、それらのスピーカアレイ28とスピーカアレイ91をz方向に並べて、つまり異なる高さの位置に配置して、互いに異なるコンテンツの音を再生してもよい。
 そのような場合、例えばz方向においてより高い位置に配置されたスピーカアレイ28では背の高い大人向けのコンテンツを再生し、z方向においてより低い位置に配置されたスピーカアレイ91では背の低い子供向けのコンテンツを再生することもできる。この例では、スピーカアレイの近傍においても高さごとに互いに異なるコンテンツを再生することができる。
 さらに、例えばスピーカアレイ28とスピーカアレイ91とをz方向の異なる高さに配置する場合、第1の実施の形態で説明したように1つのスピーカアレイで、受聴領域が互いに異なる2つの音を再生するようにしてもよい。
 そのような場合、スピーカアレイ28により遠方音と近傍音を再生し、またスピーカアレイ91でも遠方音と近傍音を再生して、z方向とy方向とで互いに受聴領域の位置が異なる4つの音場を形成することができる。その際、スピーカアレイ28により再生される遠方音と近傍音の音場境界位置と、スピーカアレイ91により再生される遠方音と近傍音の音場境界位置とがy方向の異なる位置となるようにすることも可能である。すなわち、それぞれ独立して音場境界位置を制御することができる。
 このように2つのスピーカアレイのそれぞれで遠方音と近傍音を再生すれば、互いに異なる4つのコンテンツを、それらの音が混ざり合うことなく再生することができる。
 また、遠方と近傍で異なる音場を形成する場合、映像も組み合わせて提示するようにしてもよい。例えばスピーカアレイ28の上方に表示装置とともに偏光板などを設置することで、表示装置によって遠方音の受聴領域内の受聴者と、近傍音の受聴領域内の受聴者とにそれぞれ異なる映像(画像)を提示することができる。
 したがって、例えば遠方音の受聴領域内の受聴者に対しては、その受聴領域内から見える映像と遠方音とからなるコンテンツを提示し、近傍音の受聴領域内の受聴者に対しては、その受聴領域内から見える映像と近傍音とからなるコンテンツを提示することができる。すなわち、遠方音の受聴領域内の受聴者と、近傍音の受聴領域内の受聴者とに対して、それぞれ映像と音声からなる異なるコンテンツを提示することができる。
 その他、例えばスピーカアレイ近傍でのみ聞こえるような音を再生したい場合には、遠方音を近傍音のマスキングに用いるようにしてもよい。つまり、遠方音を近傍音のマスキング用の音声として用いることができる。
 そのような場合、例えば遠方音は、近傍音と同じ周波数帯域のBGMなどとされ、それらの遠方音と近傍音が遠近別音場形成装置11や遠近別音場形成装置81により同時に再生される。このようにすれば、近傍音の受聴領域外では殆ど近傍音が聞こえなくなるようにすることができる。すなわち、受聴領域外への近傍音の漏れ出しを低減させることができる。
 このように遠方音を近傍音のマスキング用の音声として用いる場合には、少なくとも近傍音の全周波数帯域を含む周波数帯域の音を遠方音として用いると、マスキング効果を向上させることができる。
〈コンピュータの構成例〉
 ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどが含まれる。
 図11は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
 コンピュータにおいて、CPU(Central Processing Unit)501,ROM(Read Only Memory)502,RAM(Random Access Memory)503は、バス504により相互に接続されている。
 バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。
 入力部506は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部507は、ディスプレイ、スピーカアレイなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体511を駆動する。
 以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
 コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
 コンピュータでは、プログラムは、リムーバブル記録媒体511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
 なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
 また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
 例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
 また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
 さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
 また、本明細書中に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。
 さらに、本技術は、以下の構成とすることも可能である。
(1)
 第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成する遠方フィルタ部と、
 第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成する近傍フィルタ部と
 を備える信号処理装置。
(2)
 前記近傍音再生信号は、エバネッセント波を生成するための信号である
 (1)に記載の信号処理装置。
(3)
 前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて前記エバネッセント波の減衰率を決定する近傍音場処理部をさらに備え、
 前記近傍フィルタ部は、複数の前記近傍音再生フィルタ係数のうちの決定された前記減衰率に対応する前記近傍音再生フィルタ係数を用いてフィルタ処理を行う
 (2)に記載の信号処理装置。
(4)
 前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて制御点の位置を決定する近傍音場処理部をさらに備え、
 前記近傍フィルタ部は、複数の前記近傍音再生フィルタ係数のうちの決定された前記制御点の位置に対応する前記近傍音再生フィルタ係数を用いてフィルタ処理を行う
 (1)または(2)に記載の信号処理装置。
(5)
 前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて制御点の位置を決定する遠方音場処理部をさらに備え、
 前記遠方フィルタ部は、複数の前記遠方音再生フィルタ係数のうちの決定された前記制御点の位置に対応する前記遠方音再生フィルタ係数を用いてフィルタ処理を行う
 (1)乃至(4)の何れか一項に記載の信号処理装置。
(6)
 前記遠方音再生信号は、伝搬波を生成するための信号である
 (1)乃至(5)の何れか一項に記載の信号処理装置。
(7)
 前記遠方受聴領域と前記近傍受聴領域との境界位置に応じてゲインを決定する遠方音場処理部と、
 決定した前記ゲインに基づいて前記第1の音源信号または前記遠方音再生信号のゲイン調整を行う遠方ゲイン調整部と
 をさらに備える(1)乃至(6)の何れか一項に記載の信号処理装置。
(8)
 前記遠方受聴領域と前記近傍受聴領域との境界位置に応じてゲインを決定する近傍音場処理部と、
 決定した前記ゲインに基づいて前記第2の音源信号または前記近傍音再生信号のゲイン調整を行う近傍ゲイン調整部と
 をさらに備える(1)乃至(7)の何れか一項に記載の信号処理装置。
(9)
 前記第1の音源信号と前記第2の音源信号とは、互いに異なるコンテンツの音を再生するための信号である
 (1)乃至(8)の何れか一項に記載の信号処理装置。
(10)
 前記遠方音再生信号と前記近傍音再生信号を合成して得られる信号に基づいて音を再生するスピーカアレイをさらに備える
 (1)乃至(9)の何れか一項に記載の信号処理装置。
(11)
 前記遠方音再生信号に基づいて音を再生する第1のスピーカアレイと、
 前記近傍音再生信号に基づいて音を再生する第2のスピーカアレイと
 をさらに備える(1)乃至(9)の何れか一項に記載の信号処理装置。
(12)
 前記遠方音再生信号に基づく音は、前記近傍音再生信号に基づく音とは異なるタイミングで再生される
 (1)乃至(11)の何れか一項に記載の信号処理装置。
(13)
 前記遠方音再生信号に基づく音は、前記近傍音再生信号に基づく音のマスキング用の音である
 (1)乃至(11)の何れか一項に記載の信号処理装置。
(14)
 空間上の受聴者の位置に基づいて前記遠方受聴領域と前記近傍受聴領域との境界位置を決定する音場境界制御部をさらに備える
 (1)乃至(13)の何れか一項に記載の信号処理装置。
(15)
 第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成し、
 第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成する
 ステップを含む信号処理方法。
(16)
 第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成し、
 第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成する
 ステップを含む処理をコンピュータに実行させるプログラム。
 11 遠近別音場形成装置, 21 遠方音場処理部, 22 ゲイン調整部, 23 フィルタ部, 24 近傍音場処理部, 25 ゲイン調整部, 26 フィルタ部, 28 スピーカアレイ, 41 音場境界制御部, 42 遠方音再生フィルタ係数記録部, 43 フィルタ係数選択部, 51 音場境界制御部, 52 近傍音再生フィルタ係数記録部, 53 フィルタ係数選択部, 91 スピーカアレイ

Claims (16)

  1.  第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成する遠方フィルタ部と、
     第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成する近傍フィルタ部と
     を備える信号処理装置。
  2.  前記近傍音再生信号は、エバネッセント波を生成するための信号である
     請求項1に記載の信号処理装置。
  3.  前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて前記エバネッセント波の減衰率を決定する近傍音場処理部をさらに備え、
     前記近傍フィルタ部は、複数の前記近傍音再生フィルタ係数のうちの決定された前記減衰率に対応する前記近傍音再生フィルタ係数を用いてフィルタ処理を行う
     請求項2に記載の信号処理装置。
  4.  前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて制御点の位置を決定する近傍音場処理部をさらに備え、
     前記近傍フィルタ部は、複数の前記近傍音再生フィルタ係数のうちの決定された前記制御点の位置に対応する前記近傍音再生フィルタ係数を用いてフィルタ処理を行う
     請求項1に記載の信号処理装置。
  5.  前記遠方受聴領域と前記近傍受聴領域との境界位置に応じて制御点の位置を決定する遠方音場処理部をさらに備え、
     前記遠方フィルタ部は、複数の前記遠方音再生フィルタ係数のうちの決定された前記制御点の位置に対応する前記遠方音再生フィルタ係数を用いてフィルタ処理を行う
     請求項1に記載の信号処理装置。
  6.  前記遠方音再生信号は、伝搬波を生成するための信号である
     請求項1に記載の信号処理装置。
  7.  前記遠方受聴領域と前記近傍受聴領域との境界位置に応じてゲインを決定する遠方音場処理部と、
     決定した前記ゲインに基づいて前記第1の音源信号または前記遠方音再生信号のゲイン調整を行う遠方ゲイン調整部と
     をさらに備える請求項1に記載の信号処理装置。
  8.  前記遠方受聴領域と前記近傍受聴領域との境界位置に応じてゲインを決定する近傍音場処理部と、
     決定した前記ゲインに基づいて前記第2の音源信号または前記近傍音再生信号のゲイン調整を行う近傍ゲイン調整部と
     をさらに備える請求項1に記載の信号処理装置。
  9.  前記第1の音源信号と前記第2の音源信号とは、互いに異なるコンテンツの音を再生するための信号である
     請求項1に記載の信号処理装置。
  10.  前記遠方音再生信号と前記近傍音再生信号を合成して得られる信号に基づいて音を再生するスピーカアレイをさらに備える
     請求項1に記載の信号処理装置。
  11.  前記遠方音再生信号に基づいて音を再生する第1のスピーカアレイと、
     前記近傍音再生信号に基づいて音を再生する第2のスピーカアレイと
     をさらに備える請求項1に記載の信号処理装置。
  12.  前記遠方音再生信号に基づく音は、前記近傍音再生信号に基づく音とは異なるタイミングで再生される
     請求項1に記載の信号処理装置。
  13.  前記遠方音再生信号に基づく音は、前記近傍音再生信号に基づく音のマスキング用の音である
     請求項1に記載の信号処理装置。
  14.  空間上の受聴者の位置に基づいて前記遠方受聴領域と前記近傍受聴領域との境界位置を決定する音場境界制御部をさらに備える
     請求項1に記載の信号処理装置。
  15.  第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成し、
     第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成する
     ステップを含む信号処理方法。
  16.  第1の音源信号に対して遠方音再生フィルタ係数を用いたフィルタ処理を行うことで、遠方受聴領域で音を再生するための遠方音再生信号を生成し、
     第2の音源信号に対して近傍音再生フィルタ係数を用いたフィルタ処理を行うことで、前記遠方受聴領域とは異なる近傍受聴領域で音を再生するための近傍音再生信号を生成する
     ステップを含む処理をコンピュータに実行させるプログラム。
PCT/JP2017/034240 2016-10-07 2017-09-22 信号処理装置および方法、並びにプログラム WO2018066384A1 (ja)

Priority Applications (7)

Application Number Priority Date Filing Date Title
US16/338,014 US10757505B2 (en) 2016-10-07 2017-09-22 Signal processing device, method, and program stored on a computer-readable medium, enabling a sound to be reproduced at a remote location and a different sound to be reproduced at a location neighboring the remote location
BR112019006368A BR112019006368A2 (pt) 2016-10-07 2017-09-22 dispositivo e método de processamento de sinal, e, programa
JP2018543840A JP7010231B2 (ja) 2016-10-07 2017-09-22 信号処理装置および方法、並びにプログラム
KR1020197008681A KR20190059905A (ko) 2016-10-07 2017-09-22 신호 처리 장치 및 방법, 및 프로그램
EP17858223.5A EP3525484A4 (en) 2016-10-07 2017-09-22 SIGNAL PROCESSING DEVICE, METHOD AND PROGRAM
CN201780060680.8A CN109792578A (zh) 2016-10-07 2017-09-22 信号处理设备和方法、以及程序
US16/928,174 US20200344550A1 (en) 2016-10-07 2020-07-14 Signal processing device, method, and program stored on a computer-readable medium, enabling a sound to be reproduced at a remote location and a different sound to be reproduced at a location neighboring the remote location

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016-198750 2016-10-07
JP2016198750 2016-10-07

Related Child Applications (2)

Application Number Title Priority Date Filing Date
US16/338,014 A-371-Of-International US10757505B2 (en) 2016-10-07 2017-09-22 Signal processing device, method, and program stored on a computer-readable medium, enabling a sound to be reproduced at a remote location and a different sound to be reproduced at a location neighboring the remote location
US16/928,174 Continuation US20200344550A1 (en) 2016-10-07 2020-07-14 Signal processing device, method, and program stored on a computer-readable medium, enabling a sound to be reproduced at a remote location and a different sound to be reproduced at a location neighboring the remote location

Publications (1)

Publication Number Publication Date
WO2018066384A1 true WO2018066384A1 (ja) 2018-04-12

Family

ID=61830907

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/034240 WO2018066384A1 (ja) 2016-10-07 2017-09-22 信号処理装置および方法、並びにプログラム

Country Status (7)

Country Link
US (2) US10757505B2 (ja)
EP (1) EP3525484A4 (ja)
JP (1) JP7010231B2 (ja)
KR (1) KR20190059905A (ja)
CN (1) CN109792578A (ja)
BR (1) BR112019006368A2 (ja)
WO (1) WO2018066384A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020036058A1 (ja) * 2018-08-13 2020-02-20 ソニー株式会社 信号処理装置および方法、並びにプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10764707B1 (en) * 2019-01-29 2020-09-01 Facebook Technologies, Llc Systems, methods, and devices for producing evancescent audio waves

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006270409A (ja) * 2005-03-23 2006-10-05 Toshiba Corp 音響再生装置、音響再生方法および音響再生プログラム
JP2007121439A (ja) * 2005-10-25 2007-05-17 Toshiba Corp 音響信号再生装置
JP2011103543A (ja) * 2009-11-10 2011-05-26 Mitsubishi Electric Corp 音声出力装置およびテレビ受像機
JP2012044572A (ja) 2010-08-23 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> 局所再生方法、局所再生装置及びそのプログラム
JP2013090038A (ja) * 2011-10-14 2013-05-13 Nippon Telegr & Teleph Corp <Ntt> 特定エリア音響再生装置とフィルタ係数生成装置と、それらの方法とプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101702330B1 (ko) * 2010-07-13 2017-02-03 삼성전자주식회사 근거리 및 원거리 음장 동시제어 장치 및 방법
US9245514B2 (en) 2011-07-28 2016-01-26 Aliphcom Speaker with multiple independent audio streams
US20130259254A1 (en) * 2012-03-28 2013-10-03 Qualcomm Incorporated Systems, methods, and apparatus for producing a directional sound field
US10448161B2 (en) * 2012-04-02 2019-10-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for gestural manipulation of a sound field

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006270409A (ja) * 2005-03-23 2006-10-05 Toshiba Corp 音響再生装置、音響再生方法および音響再生プログラム
JP2007121439A (ja) * 2005-10-25 2007-05-17 Toshiba Corp 音響信号再生装置
JP2011103543A (ja) * 2009-11-10 2011-05-26 Mitsubishi Electric Corp 音声出力装置およびテレビ受像機
JP2012044572A (ja) 2010-08-23 2012-03-01 Nippon Telegr & Teleph Corp <Ntt> 局所再生方法、局所再生装置及びそのプログラム
JP2013090038A (ja) * 2011-10-14 2013-05-13 Nippon Telegr & Teleph Corp <Ntt> 特定エリア音響再生装置とフィルタ係数生成装置と、それらの方法とプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
JENS AHRENS; SASCHA SPORS: "Sound Field Reproduction Using Planar and Linear Arrays of Loudspeakers", IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, vol. 18, no. 8, November 2010 (2010-11-01)
KAMAKURA ET AL.: "Practical use of parametric speaker", ACOUSTICAL SOCIETY OF JAPAN JOURNAL, vol. 62, 2006, pages 791 - 797
See also references of EP3525484A4

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020036058A1 (ja) * 2018-08-13 2020-02-20 ソニー株式会社 信号処理装置および方法、並びにプログラム
US11462200B2 (en) 2018-08-13 2022-10-04 Sony Corporation Signal processing apparatus and method, and program

Also Published As

Publication number Publication date
US20200344550A1 (en) 2020-10-29
US20190238982A1 (en) 2019-08-01
EP3525484A1 (en) 2019-08-14
EP3525484A4 (en) 2019-10-16
CN109792578A (zh) 2019-05-21
BR112019006368A2 (pt) 2019-06-25
JPWO2018066384A1 (ja) 2019-07-18
US10757505B2 (en) 2020-08-25
JP7010231B2 (ja) 2022-01-26
KR20190059905A (ko) 2019-05-31

Similar Documents

Publication Publication Date Title
US11310617B2 (en) Sound field forming apparatus and method
US9554227B2 (en) Method and apparatus for processing audio signal
KR100930835B1 (ko) 음향 재생 장치
KR101764175B1 (ko) 입체 음향 재생 방법 및 장치
JP6939786B2 (ja) 音場形成装置および方法、並びにプログラム
KR20110105715A (ko) 입체 음향 재생 방법 및 장치
KR100647338B1 (ko) 최적 청취 영역 확장 방법 및 그 장치
EP3467818B1 (en) Locally attenuated sound field forming device, corresponding method and computer program
US20200344550A1 (en) Signal processing device, method, and program stored on a computer-readable medium, enabling a sound to be reproduced at a remote location and a different sound to be reproduced at a location neighboring the remote location
EP3787311B1 (en) Sound image reproduction device, sound image reproduction method and sound image reproduction program
CN109923877A (zh) 对立体声音频信号进行加权的装置和方法
JP6323901B2 (ja) 収音装置および収音方法、並びにプログラム
JP5941373B2 (ja) スピーカアレイ駆動装置およびスピーカアレイ駆動方法
Omoto et al. Sound field reproduction applicable to noise control engineering
JP2019016871A (ja) 音像生成装置

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17858223

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018543840

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 20197008681

Country of ref document: KR

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112019006368

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 2017858223

Country of ref document: EP

Effective date: 20190507

ENP Entry into the national phase

Ref document number: 112019006368

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20190329