EP4365890A1 - Adaptive harmonic speech masking sound generation apparatus and method - Google Patents
Adaptive harmonic speech masking sound generation apparatus and method Download PDFInfo
- Publication number
- EP4365890A1 EP4365890A1 EP22205855.4A EP22205855A EP4365890A1 EP 4365890 A1 EP4365890 A1 EP 4365890A1 EP 22205855 A EP22205855 A EP 22205855A EP 4365890 A1 EP4365890 A1 EP 4365890A1
- Authority
- EP
- European Patent Office
- Prior art keywords
- signal
- limited
- masking
- frequency band
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000000873 masking effect Effects 0.000 title claims abstract description 151
- 238000000034 method Methods 0.000 title claims description 35
- 230000003044 adaptive effect Effects 0.000 title description 18
- 238000012937 correction Methods 0.000 claims description 30
- 238000004590 computer program Methods 0.000 claims description 14
- 230000002123 temporal effect Effects 0.000 claims description 7
- 230000002238 attenuated effect Effects 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 2
- 238000004422 calculation algorithm Methods 0.000 description 27
- 230000006870 function Effects 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 230000003931 cognitive performance Effects 0.000 description 7
- 230000007423 decrease Effects 0.000 description 7
- 238000001228 spectrum Methods 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 239000002775 capsule Substances 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000010255 response to auditory stimulus Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000003997 social interaction Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/175—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
- G10K11/1752—Masking
- G10K11/1754—Speech masking
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/40—Jamming having variable characteristics
- H04K3/42—Jamming having variable characteristics characterized by the control of the jamming frequency or wavelength
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/40—Jamming having variable characteristics
- H04K3/43—Jamming having variable characteristics characterized by the control of the jamming power, signal-to-noise ratio or geographic coverage area
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/40—Jamming having variable characteristics
- H04K3/45—Jamming having variable characteristics characterized by including monitoring of the target or target signal, e.g. in reactive jammers or follower jammers for example by means of an alternation of jamming phases and monitoring phases, called "look-through mode"
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K3/00—Jamming of communication; Counter-measures
- H04K3/80—Jamming or countermeasure characterized by its function
- H04K3/82—Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection
- H04K3/825—Jamming or countermeasure characterized by its function related to preventing surveillance, interception or detection by jamming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04K—SECRET COMMUNICATION; JAMMING OF COMMUNICATION
- H04K2203/00—Jamming of communication; Countermeasures
- H04K2203/10—Jamming or countermeasure used for a particular application
- H04K2203/12—Jamming or countermeasure used for a particular application for acoustic communication
Definitions
- the application relates to noise masking, in particular speech masking, and, in particular, to an apparatus and a method for adaptive, harmonic speech masking sound generation.
- Requirements for an acoustic workplace environment vary both over the course of the working day and with the different tasks that employees have to perform. For example, people who work in a crowded office have a high need for acoustic privacy, while people who work in a sparsely occupied office may need an expanded hearing horizon, for example, in order not to be surprised by the sudden appearance of other people (Zuydervliet et al., 2008).
- Some approaches are based on dynamically adjusting the volume of masking sounds to changing background noise conditions. For example, there are global system approaches in which the masking sound changes at fixed time intervals or based on microphone measurements throughout the office. These offer a rather inflexible and therefore inadequate solution. In addition, employee satisfaction increases when employees have the opportunity to personalize their workplace (see Huang, Robertson & Chang, 2004; Lee & Brand, 2010).
- Chanaud (2007) presented two systems of adaptive sound masking.
- a time-based system in which the sound pressure level of the masking sound varies in static time intervals throughout the day. For this, different needs for acoustic privacy and the expected level of noise intensity must be predicted for different times of day. For example, it is important for employees to be able to hear the presence of other people overnight and in the early morning. Accordingly, no or only very quiet masking sound would be sufficient at this time.
- the 10th percentile L10 of the measured sound level describes the sound level that was reached in at least 10% of the part-time period considered.
- the 90th percentile L90 describes the sound level that was reached in at least 90% of the part-time period considered.
- Zuydervliet et al. (2008) also suggests that the 10th and 90th percentile values should be determined for adaptive masking sound control.
- the 90th percentile L AF,90% represents the background noise of the ambient sound and the 10th percentile L AF,10% describes the activity transients of disturbing sounds in the background noise condition.
- the difference between these L AF,10%-90% values therefore describes an SNR of disturbing components and background noise (Zuydervliet et al., 2008). If the SNR is high, the background sound has a large changing state character and therefore causes an ISE.
- Zuydervliet et al. (2008) with a target value L AF,10%-90%,target , i.e. with an optimal percentile value difference.
- the masking sound level should slowly increase and thus reduce the signal-to-noise ratio (SNR) of the total sound. If the difference is smaller, the SNR of the sum signal is already smaller than the minimum necessary to not cause an ISE, and the masking sound can slowly become quieter.
- Other parameters such as a weighting factor W, a maximum volume change per minute, and a parameter for adjusting the sensitivity can thus influence the optimal volume of the masking sound (Zuydervliet et al., 2008).
- the target value (L AF,10%-90%,target ) should be between 3 and 10 dB, while the weighting factor should be between 0.5 and 4.
- the time period over which the analysis of the percentile values takes place determines the sensitivity of the system, whereby a period of 15 s is suggested. If a longer period is selected, level fluctuations are less significant and the control system reacts more slowly to changing sound conditions. A value of 0.05 dB per second is given as the maximum rate of change (L'Esperance et al., 2017).
- the level increase should generally be faster than the level reduction of the masking sound. It is also suggested that the upper and lower limits of adaptive masking sound systems should be limited. This should ensure that sufficient masking is ensured at all times, but at the same time a maximum acceptable level is not exceeded. Zuydervliet et al. (2008) suggests a dynamic range of 5 dB for the masking sound volume, whereas the work by L'Esoutheasternrance (2017) suggests 3 dB.
- Renz (2019) also focuses on percentile value differences L AF,10% - L AF,90% and has developed a new method for predicting an expected decrease in performance DP. Renz (2019) suggests 2 to 3 dB as a suitable target value (L AF,10%-90%,target ) for adaptive level control of masking sounds.
- Renz The DP values evaluated and plotted by Renz (2019), "Personalised sound masking in open offices. A trade-off between annoyance and restoration of working memory performance?" Stuttgart: Fraunhofer Verl, Stuttgart, as a function of the prediction parameter L AF,10%-90% are shown in Renz, 2019 on page 204. Renz, 2019, shows on page 204 a plot of the cognitive performance prediction model of the resulting DP with the prediction parameter LAF 10-90.
- US 2003/103632 A1 presents an adaptive noise masking system and noise masking method that divides unwanted noise into time blocks and estimates the frequency spectrum and power level, while continuously generating white noise with an appropriate spectrum and power level to mask the unwanted noise.
- CN110362789A shows a noise masking method and an adaptive noise masking system with a noise masking database, a noise satisfaction agent model and a self-adaptive noise masking search system.
- US 2015/194144 A1 shows a multi-microphone subsystem to capture sounds, a spectrum analyzer to determine a performance characteristic of the captured sound and a spatial analyzer to detect a directional characteristic of the sound.
- a device for generating speech masking sound comprises an analyzer for analyzing each frequency band-limited signal portion of a plurality of frequency band-limited signal portions of a microphone signal during an analyzed time period to obtain information about the frequency band-limited signal portion. Furthermore, the device comprises a masking signal generator for generating a masking signal depending on the information about the frequency band-limited signal portion of each of the plurality of frequency band-limited signal portions. The information about the frequency band-limited signal portion depends on a first sound level that was reached at least during a first time period during the analyzed time period. Furthermore, the information about the frequency band-limited signal portion depends on a second sound level that was reached at least during a second time period during the analyzed time period, wherein the second time period is different from the first time period.
- the information on the frequency band-limited signal component depends on a first sound level which is present at least during a first period of time during the analyzed period. Furthermore, the information on the frequency band-limited signal component depends on a second sound level that was reached at least during a second time period during the analyzed period, the second time period being different from the first time period.
- Embodiments provide a control algorithm that can adjust a speech masking signal for presentation over headphones in a way that is both comfortable and secure and psychoacoustically validated.
- Some embodiments provide a masking sound, which can be individually adjusted via headphones, for example, and is only used to the extent that it is needed. This creates an effective way to improve both the cognitive performance and the satisfaction of employees in the workplace.
- Fig.1 shows a device for generating speech masking sound according to an embodiment.
- the device comprises an analyzer 110 for analyzing each frequency band-limited signal component of a plurality of frequency band-limited signal components of a microphone signal during an analyzed period of time in order to obtain information about the frequency band-limited signal component.
- the device comprises a masking signal generator 120 for generating a masking signal depending on the information about the frequency band-limited signal component of each of the plurality of frequency band-limited signal components.
- the information about the frequency band-limited signal component depends on a first sound level that was reached at least during a first time period during the analyzed time period. Furthermore, the information about the frequency band-limited signal component depends on a second sound level that was reached at least during a second time period during the analyzed time period, the second time period being different from the first time period.
- the analyzer 110 can be designed, for example, to determine a microphone signal sound level difference between the first sound level and the second sound level for each signal component of the plurality of frequency-band-limited signal components of the microphone signal.
- the masking signal generator 120 can be designed, for example, to determine the masking signal depending on the microphone signal sound level difference of each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the microphone signal.
- the masking signal generator 120 can be designed, for example, to determine the masking signal by determining, for each signal component of the plurality of frequency-band-limited signal components, a level value for a frequency-band-limited component of the masking signal that corresponds to a frequency range of this signal component, depending on the microphone signal sound level difference of this signal component, and to carry out a level adjustment of this frequency-band-limited component of the masking signal using this level value.
- the analyzer 110 can be designed, for example, to determine an overall signal that depends on the microphone signal but is different from the microphone signal.
- the analyzer 110 can be designed, for example, to determine an error value for each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the overall signal, which error value indicates a difference between a target value for an overall signal sound level difference and a current overall signal sound level difference of the overall signal.
- the masking signal generator 120 can be designed, for example, to determine the masking signal depending on the error value for each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the overall signal.
- the analyzer 110 can, for example, be designed to determine the current total signal sound level difference between a third sound level and a fourth sound level for each frequency band-limited signal portion of the plurality of frequency band-limited signal portions of the total signal, wherein the third sound level is a sound level that was reached at least during a third time period during an analyzed time period in the frequency band-limited signal portion of the total signal, and wherein the fourth sound level is a sound level that was reached at least during a fourth time period during the analyzed time period in the frequency band-limited signal portion of the total signal.
- the analyzer 110 can, for example, be designed to determine each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the overall signal depending on a feedback time section of the masking signal to this frequency-band-limited signal component.
- the analyzer 110 can be designed, for example, to determine each of the plurality of frequency-band-limited signal components of the overall signal depending on an attenuation factor for this frequency-band-limited signal component of the overall signal, wherein the analyzer 110 is designed to apply the attenuation factor for this frequency-band-limited signal component to the corresponding frequency-band-limited signal component of the microphone in order to obtain an attenuated microphone signal for this frequency-band-limited signal component.
- the analyzer 110 may be configured, for example, to analyze each frequency band-limited signal component of the plurality of frequency band-limited Signal components of the overall signal are to be determined as the sum of the fed-back time section of the masking signal to this frequency band-limited signal component and the attenuated microphone signal to this frequency band-limited signal component.
- the masking signal generator 120 can, for example, be designed to determine the masking signal as a function of a correction value for each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the overall signal, wherein the masking signal generator 120 is designed to determine the correction value for this frequency-band-limited signal component as a function of the error value for this frequency-band-limited signal component.
- the masking signal generator 120 can further be designed, for example, to determine the correction value for this frequency band-limited signal component depending on a temporal predecessor value of this correction value.
- the masking signal generator 120 can, for example, be designed to determine the masking signal as a function of a control value for each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the microphone signal, wherein the masking signal generator 120 is designed to determine the control value for this frequency-band-limited signal component as a function of the microphone signal sound level difference of this frequency-band-limited signal component and as a function of the error value and the correction value of this frequency-band-limited signal component of the overall signal.
- the masking signal generator 120 can be designed, for example, to determine the control value for this frequency band-limited signal component by forming a sum of the microphone signal sound level difference of this frequency band-limited signal component and the error value and the correction value of this frequency band-limited signal component of the total signal.
- the masking signal generator 120 can, for example, be designed to determine the level value for a frequency band-limited component of the masking signal depending on the control value for this frequency band-limited signal component and depending on a previous level value for this frequency band-limited component of the masking signal.
- Embodiments provide a control algorithm that enables a masking sound to be dynamically adapted in volume and in its frequency spectrum to a background sound condition.
- the algorithm can, for example, independently detect the extent to which the background noise condition can have a disruptive influence on cognitive performance.
- a microphone signal is used to assess the noise condition.
- the algorithm works on different end devices with the technology available in each case. Since it cannot be assumed that all end devices have calibrated, standard-compliant microphones installed that meet the requirements for sound level meters according to DIN EN 61672-1, the algorithm does not require any knowledge of the absolute sound pressure level. The algorithm determines the 90% and 10% percentile values as control parameters.
- a masking sound is generated and played, which continuously has a sufficient masking effect to prevent a possible ISE-related cognitive performance decline that can arise from the background noise condition.
- the algorithm has an appropriate sensitivity to the background noise condition so that spontaneously occurring noises that are not representative of the background noise condition are not used for control.
- the masking sound generated by the algorithm is only as loud as necessary at any given time.
- the goal is not only to increase performance objectively, but also to ensure the acoustic satisfaction of the users.
- Masking sounds in general are perceived as more unpleasant than silence.
- the algorithm recognizes at any time which The system determines the minimum masking sound level that is currently required and uses this continuously as the target value for level control.
- the ratio of the L AF,10% percentile value to the L AF,90% percentile value is used as the target value.
- the masking sound adapts to the frequency spectrum of the background noise.
- the control times with which the volume of the masking sound is controlled are selected by the algorithm so that the volume fluctuations are barely noticeable. This is useful so that the masking sound itself does not distract the user. At the same time, however, volume changes occur quickly enough to be able to react to changed acoustic conditions in the background noise condition.
- the algorithm adds a harmonic component to the masking sound, which ensures a pleasant sound of the masking sound.
- Fig.2 a signal flow diagram according to an embodiment with a frequency division into nine octave bands, which in the example of Fig.2 Center frequencies at 63 Hz, 125 Hz, 250 Hz, 500 Hz, 1000 Hz, 2000 Hz, 4000 Hz, 800 Hz, 1600 Hz.
- Fig. 2 This illustrates Fig. 2 the part of the algorithm in which the frequency division of the microphone input signal into bands, for example into octave bands, takes place.
- Fig. 2 to see how the various band-filtered masking sound components are mixed together and calculated with a calibration factor W before the masking signal is output to the headphones.
- the light blue framed elements with the inscription "Adaptive Level Control" from Fig. 2 represent the part of the algorithm which is Fig.3 is illustrated in detail.
- FIG.3 shows a signal flow diagram for adaptive noise masking according to an embodiment.
- the level value measurement, the percentile value difference determination and the continuous calculation of the control value u take place. Furthermore, the control values u are smoothed here by set control times in order to obtain the level value p, which in turn controls the volume of the respective band-filtered masking sound component.
- Fig.4 a signal flow diagram of a control value checker according to an embodiment.
- Fig.4 shown how the percentile values of the level values of the entire signal (microphone signal * damping factor + (returned) masking sound component) are calculated.
- This resulting calculated level difference (L AF,10%-90%,Total ) is compared with the target value to obtain an error value (e).
- Fig.5 shows a control loop according to an embodiment. In particular, Fig.5 to see how a correction value is calculated from the error value e.
- the input of the algorithm is as in Fig.2 shown is the digital audio signal of a microphone which continuously records ambient noise.
- This signal is first divided into bands by octave filters in accordance with DIN EN 61260-1, e.g. into nine octave bands (e.g. with center frequencies in the range 63 Hz - 16 000 Hz), with the band-limited signals being analyzed and processed in the respective signal paths. Since the adaptive level control is to take place per band, the masking signal is also divided into individual bands. The volume of these band-filtered masking sounds is controlled individually in the signal paths (corresponding to the respective octave band) and then mixed together again to form an overall masking sound. This makes it possible to calculate the current interference influence for each octave band, which can be used to determine the volume control that the respective frequency range of the masking sound should have in order to sufficiently mask the interference sounds that occur across the entire frequency spectrum.
- the controlled masking signal is supplemented with an additional harmonic component.
- the harmonic component is a type of music that improves the acceptance and subjective perception of the masking sound.
- the harmonic component is included in the calculation of the expected interference effect of the acoustic environment described below.
- the harmonic component, mixed with the controlled masking component is played through the headphones.
- the harmonic component is psychoacoustically secured, i.e. its suitability has been tested in listening tests (no changing state behavior, as the ISE is not triggered).
- the harmonic component can be, for example, an uncompressed stereo file that is played and controlled by the algorithm.
- the input of adaptive sound masking is the band-filtered and A-weighted audio signal from the microphone.
- A-weighting is a commonly used frequency weighting that represents the ear's response to sound pressure or volume.
- the weightings F (fast), S slow (slow) and I (impulse) indicate how quickly a reaction occurs to a change in the sound level.
- LAF refers to a sound level with A-frequency weighting and F-time weighting.
- the percentile levels L AF,10% and L AF,90% indicate which levels were reached in 10% and 90% of the measurement time, respectively.
- the equivalent continuous sound level is now determined from the said audio signal in accordance with DIN EN 61672-1.
- a root mean square (RMS) is first determined per sample.
- the level values are then integrated over 125 milliseconds. In order to avoid any errors that may occur in further signal processing with unrealistically small amplitude values, the values are limited by a minimum amplitude value.
- the measured level values are saved in a continuous list, with the list length defining the observation period over which the percentile values are analyzed. Due to the previous level measurement, a new level value is added to the list every 125 milliseconds and an old value is deleted. A percentile value calculation (L AF,90% and L AF,10% ) takes place in the list.
- the difference between these continuously determined percentile values is used to calculate level differences that can be associated with the decrease in performance loss, as the previously described study by Renz et al. (2016) shows.
- the higher the relative level of the activity transients L AF,10% the greater the distraction (Zuydervliet et al., 2008).
- the background sound level L AF,90% should be increased by adding masking noise to such an extent that the level difference to the activity sound level L AF,10% is sufficiently reduced.
- the control described below ensures that the difference between these two values is as small as possible (e.g. below 3 or e.g. between 2 and 3. Other target values can also be selected).
- the total signal from masking sound and background sound is examined for its L AF,10%-90% value.
- Fig.3 illustrates the part of the algorithm, the functionality of which is described below.
- the masking sound is played through headphones, which means that an analysis of the actual percentile values should be carried out at the position of the user's ear.
- an exact analysis of this sound condition would only be possible using a microphone located in the headphone capsule.
- ANC headphones usually have such a microphone built into the capsules, but the microphone signal cannot be used without knowledge of the integrated signal processing of the respective headphones, if it is even possible to pick up this signal.
- the algorithm should also be universally usable with headphones without ANC. Therefore, the signal that reaches the user's ear is estimated in such embodiments. If access to the microphone is possible, the value can also be determined directly. The subsequent control is then carried out with the measured value instead of the estimated one, but is otherwise identical.
- the background noise is reduced in level by the headphones used.
- the determined equivalent continuous sound levels of the background noise condition are offset against the attenuation factor in this part of the algorithm in order to obtain an estimated relative sound level of the background noise condition at the position of the user's ear.
- the masking sound signal (and the harmonic component) which was tapped after its level adjustment (see Fig.4 ), a level measurement is now also carried out.
- the values determined are added to the background noise multiplied by the damping factor, whereby the estimated relative total noise level L AF,10%-90%, total can be determined.
- a person who uses an implementation of the adaptive masking signal generator algorithm in hardware or software can adjust the masking sound generator's playback volume for the current sound condition at the beginning of use. This is done, for example, via a fader in the graphical user interface, or a potentiometer on the headphones, which controls the calibration factor W.
- the calibration factor is added independently of the level control at the end of the signal path.
- the algorithm analyses the input signal of the microphone and calculates level differences of L AF,10% and L AF,90% (see Fig.3 These level differences L AF,10%-90%,HSB are intended to regulate the masking sound in its volume per octave band.
- the relationship of the prediction parameter L AF,10%-90% is not linear to a prospective DP value (Renz, 2019). This means that simply increasing the volume of the masking sound by the determined L AF,10%-90%,HSB value does not necessarily sufficiently mask the disturbing sound components of the HSB.
- the signal that reaches the user's ear attenuated ambient sound + masking signal
- it is analyzed as described above to determine the total value of the percentile differences L AF,10%-90%,Ges .
- L AF,10%-90%,Ges should be compared with a target value L AF,10%-90%,Ziel .
- a suitable target value at which a drop in performance does not yet occur significantly is between 2 dB and 3 dB.
- a target value L AF,10%-90%,Ziel of 2.5 dB is used for the algorithm. This leads to a target value range between 2 dB and 3 dB, within which L AF,10%-90%,Ges moves.
- the target value can also be chosen differently.
- the error value e describes the difference between L AF,10%-90%,Ziel and L AF,10%-90%,Ges .
- the manipulated variable u which regulates the volume of the masking sound, is defined as the sum of L AF,10%-90%,HSB and a correction value z (see equation 1).
- u L AF , 10 % ⁇ 90 % , HSB + z
- the correction value z must increase until an error value of 0 is reached. As soon as the error value falls below 0, the correction value must continuously decrease again. The correction value will increase and decrease again until it reaches a value at which the error value remains constant at 0. However, the correction value z should increase or decrease more slowly the closer the error value approaches 0. Since there is a tolerance range of +/- 0.5 dB around L AF,10%-90%,target , z can increase or decrease constantly until the tolerance limit is reached. From an error value of 0.5, z should change in smaller steps the closer e approaches 0. This is to prevent the error value from being corrected beyond the zero point by too strong a correction.
- the current correction value zn is the result of the last correction value zn -1, added or subtracted with a correction flat rate g(e).
- This correction flat rate depends on the size of the error value e, and is clearly defined for different conditions (see equation 3). This part of the algorithm is described in Fig.5 shown.
- Masking sounds should generally have a maximum sound pressure level between 45 dB(A) and 48 dB(A). This maximum is justified by the fact that higher sound levels over a longer period of time are usually perceived as extremely disturbing (Haapakangas et al., 2011). Therefore, the algorithm limits the upper and lower limits of u. However, the masking system described in this invention report cannot detect absolute sound levels, which is why the maximum possible sound level values are controlled via the user's own calibration.
- the dynamic range of the adaptive masking signal is set to 26 dB, but can be changed depending on the implementation. This means that even with a slightly disturbing HSB, the L AF,10%-90%,target value can be achieved, whereby the masking sound is as quiet as possible.
- Equation 4 describes the current level value p n , which defines the last output level value p n -1 and t Attack and t Release , through the current input value u n (control value).
- the time parameters tAttack and t Release result from the input sample rate and the desired attack and release times.
- the determined L AF,90% values are continuously checked for strong fluctuations. If a newly arrived L AF,90% value falls by more than 2 dB compared to the last L AF,90% value, the attack time t Attack of the time ramp is set to 90 seconds for the duration of the observation period (5 seconds). An attack time of this magnitude means that no noticeable increase in level is possible. After the five seconds have elapsed, the attack time is reset to its regular value and the level can be regulated regularly again.
- the entire adaptive harmonic speech masking signal (consisting of the masking and harmonic components) is reproduced via the audio output of the terminal device (digital or analog) through headphones.
- a masking signal which is both pleasant and effective and reliably achieves psychoacoustically determined target values within a specified time interval, the correlation of which with cognitive performance is known, for example.
- Embodiments are based on the fact that the control adjusts the masker by means of an estimation depending on the expected interference effect.
- embodiments can be used in office spaces, especially in offices for several people, and can be adapted in particular for use with headphones.
- Other areas of application can be, for example, in medical use or in therapy, or even in tourism.
- aspects have been described in the context of a device, it is to be understood that these aspects also represent a description of the corresponding method, so that a block or component of a device can also be understood as a corresponding method step or as a feature of a method step. Analogously, aspects described in the context of or as a method step also represent a description of a corresponding block or detail or feature of a corresponding device.
- Some or all of the method steps can be performed by a hardware apparatus (or using a hardware apparatus), such as a microprocessor, a programmable computer, or an electronic circuit. In some embodiments, some or more of the key method steps can be performed by such an apparatus.
- embodiments of the invention may be implemented in hardware or in software, or at least partially in hardware or at least partially in software.
- the implementation may be carried out using a digital storage medium, for example a floppy disk, a DVD, a BluRay disc, a CD, a ROM, a PROM, an EPROM, an EEPROM or a FLASH memory, a hard disk or another magnetic or optical memory on which electronically readable control signals are stored that can interact or interact with a programmable computer system in such a way that the respective method is carried out. Therefore, the digital storage medium may be computer readable.
- Some embodiments according to the invention thus comprise a data carrier having electronically readable control signals capable of interacting with a programmable computer system such that one of the methods described herein is carried out.
- embodiments of the present invention may be implemented as a computer program product having a program code, wherein the program code is operable to perform one of the methods when the computer program product is run on a computer.
- the program code can, for example, also be stored on a machine-readable medium.
- an embodiment of the method according to the invention is thus a computer program that has a program code for carrying out one of the methods described herein when the computer program runs on a computer.
- a further embodiment of the methods according to the invention is thus a data carrier (or a digital storage medium or a computer-readable medium) on which the computer program for carrying out one of the methods described herein is recorded.
- the data carrier or the digital storage medium or the computer-readable medium is typically tangible and/or non-transitory.
- a further embodiment of the method according to the invention is thus a data stream or a sequence of signals which represents the computer program for carrying out one of the methods described herein.
- the data stream or the sequence of signals can be configured, for example, to be transferred via a data communication connection, for example via the Internet.
- a further embodiment comprises a processing device, for example a computer or a programmable logic device, which is configured or adapted to carry out one of the methods described herein.
- a processing device for example a computer or a programmable logic device, which is configured or adapted to carry out one of the methods described herein.
- a further embodiment comprises a computer on which the computer program for carrying out one of the methods described herein is installed.
- a further embodiment according to the invention comprises a device or a system which is designed to transmit a computer program for carrying out at least one of the methods described herein to a receiver.
- Transmission may be, for example, electronic or optical.
- the recipient may be, for example, a computer, a mobile device, a storage device or a similar device.
- the device or system may, for example, comprise a file server for transmitting the computer program to the recipient.
- a programmable logic device e.g., a field programmable gate array, an FPGA
- a field programmable gate array may interact with a microprocessor to perform any of the methods described herein.
- the methods are performed by any hardware device. This may be general-purpose hardware such as a computer processor (CPU) or hardware specific to the method such as an ASIC.
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
Eine Vorrichtung zur Sprachmaskierschallerzeugung gemäß einer Ausführungsform wird bereitgestellt. Die Vorrichtung umfasst einen Analysator (110) zur Analyse von jedem frequenzbandbegrenzten Signalanteil einer Mehrzahl von frequenzbandbegrenzten Signalanteilen eines Mikrofonsignals während eines analysierten Zeitraums, um Information über den frequenzbandbegrenzten Signalanteil zu erhalten. Des Weiteren umfasst die Vorrichtung einen Maskiersignalerzeuger (120) zur Erzeugung eines Maskiersignals abhängig von der Information über den frequenzbandbegrenzten Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten Signalanteilen. Die Information über den frequenzbandbegrenzten Signalanteil hängt von einem ersten Schallpegel ab, der mindestens während einer ersten Zeitdauer während des analysierten Zeitraums erreicht wurde. Ferner hängt die Information über den frequenzbandbegrenzten Signalanteil von einem zweiten Schallpegel ab, der mindestens während einer zweiten Zeitdauer während des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer von der ersten Zeitdauer unterschiedlich ist.A device for generating speech masking sound according to an embodiment is provided. The device comprises an analyzer (110) for analyzing each frequency band-limited signal component of a plurality of frequency band-limited signal components of a microphone signal during an analyzed time period in order to obtain information about the frequency band-limited signal component. The device further comprises a masking signal generator (120) for generating a masking signal depending on the information about the frequency band-limited signal component of each of the plurality of frequency band-limited signal components. The information about the frequency band-limited signal component depends on a first sound level that was reached at least during a first time period during the analyzed time period. Furthermore, the information about the frequency band-limited signal component depends on a second sound level that was reached at least during a second time period during the analyzed time period, wherein the second time period is different from the first time period.
Description
Die Anmeldung betrifft Geräuschmaskierung, insbesondere Sprachmaskierung, und, im Speziellen, eine Vorrichtung und ein Verfahren zur adaptiven, harmonischen Sprachmaskierschallerzeugung.The application relates to noise masking, in particular speech masking, and, in particular, to an apparatus and a method for adaptive, harmonic speech masking sound generation.
Insbesondere Sprachschalle sowie unvorhersehbare Geräusche, die sich in ihren Pegelspitzen stark von dem Hintergrundniveau abheben, ziehen unsere kognitive Leistungsfähigkeit in Mitleidenschaft (siehe Bodin Danielsson & Bodin, 2009). Diese negativen Effekte auf das visuelle sowie auditive Kurzzeitgedächtnis von Störschallen, wie zum Beispiel Sprache, werden irrelevanter Geräuscheffekt (Irrelevant Sound Effect, ISE) genannt.In particular, speech sounds and unpredictable noises that differ greatly from the background level in terms of their peak levels have a negative impact on our cognitive performance (see Bodin Danielsson & Bodin, 2009). These negative effects on the visual and auditory short-term memory of noise, such as speech, are called the irrelevant sound effect (ISE).
Anforderungen an eine akustische Arbeitsplatzumgebung variieren sowohl über den zeitlichen Verlauf des Arbeitstages als auch bei verschiedenen Aufgaben, die Mitarbeitende zu erledigen haben. So haben Personen, die in einem vollbesetzten Büro arbeiten, ein hohes Bedürfnis nach akustischer Privatsphäre, während Personen, die in einem kaum besetzten Büro einer Arbeit nachgehen möglicherweise das Bedürfnis nach einem erweiterten Hörhorizont haben, zum Beispiel um nicht von dem plötzlichen Erscheinen anderer Personen überrascht zu werden (Zuydervliet et al., 2008).Requirements for an acoustic workplace environment vary both over the course of the working day and with the different tasks that employees have to perform. For example, people who work in a crowded office have a high need for acoustic privacy, while people who work in a sparsely occupied office may need an expanded hearing horizon, for example, in order not to be surprised by the sudden appearance of other people (Zuydervliet et al., 2008).
Um einer Beeinträchtigung durch den ISE entgegenzuwirken, wird in einigen Großraumbüros der Ansatz von globalen Maskierungssystemen über Lautsprecher verfolgt. Dabei wird ein breitbandiges statisches Rauschen über zentrale Lautsprecher in den Büroräumen wiedergegeben, mit dem Ziel Störschalle zu maskieren. Durch die daraus entstehende Reduktion des Signal-Rausch-Abstandes von zum Beispiel störenden Sprachsignalen zu dem nun angehobenen Hintergrundrauschen, wird die Sprachverständlichkeit minimiert (Zuydervliet et al., 2008). Ein solches Rauschen kann von Nutzern allerdings als unangenehm wahrgenommen und daher abgelehnt werden (siehe Keus Van De Poll, Marijke et al., 2015).To counteract the impact of the ISE, some open-plan offices use the approach of global masking systems via loudspeakers. A broadband static noise is played over central loudspeakers in the office rooms with the aim of masking noise. The resulting reduction in the signal-to-noise ratio of, for example, disturbing speech signals to the now increased background noise minimizes speech intelligibility (Zuydervliet et al., 2008). However, users may find such noise unpleasant and therefore reject it (see Keus Van De Poll, Marijke et al., 2015).
Manche Ansätze basieren auf einer dynamischen Anpassung der Lautstärke von Maskierschallen an sich ändernde Hintergrundschallbedingungen. So existieren Ansätze von globalen Systemen, bei denen sich der Maskierschall in festgelegten Zeitintervallen oder auf Grundlage von Mikrofonmessungen im gesamten Büro ändert. Diese bieten eine eher unflexible und daher unzulängliche Lösung. Außerdem ist eine Steigerung der Mitarbeiterzufriedenheit zu beobachten, wenn Angestellte die Möglichkeit haben ihren Arbeitsplatz zu personalisieren (siehe Huang, Robertson & Chang, 2004; Lee & Brand, 2010).Some approaches are based on dynamically adjusting the volume of masking sounds to changing background noise conditions. For example, there are global system approaches in which the masking sound changes at fixed time intervals or based on microphone measurements throughout the office. These offer a rather inflexible and therefore inadequate solution. In addition, employee satisfaction increases when employees have the opportunity to personalize their workplace (see Huang, Robertson & Chang, 2004; Lee & Brand, 2010).
Damit ein Schall über eine ausreichende Maskierwirkung verfügt, muss er in allen Frequenzanteilen, in denen das Störsignal vorkommt, über ein ausreichend breitbandiges Rauschsignal verfügen. Rosa Rauschen beispielsweise, welches einen Abfall der Lautstärke von etwa 3 dB pro Oktave hat, wurde als ein effektives Maskiersignal identifiziert. Allerdings wird es von Probanden subjektiv oft als störend wahrgenommen und daher eher abgelehnt (Schlittmeier & Hellbrück, 2009). In diversen anderen Studien werden Maskiersignale mit anderen Spektren vorgeschlagen und untersucht. Dabei wurden Signale, wie in dem Frequenzgang angepasstes Rosa Rauschen, sprachähnliches Gemurmel von mehreren Sprechern oder auch natürliche Signale, wie Quellwasserrauschen betrachtet (Hongistob et al., 2017; Veitch et al., 2002; Wang, Drotleff & Li, 2012). Natürliche Geräuschquellen scheinen dabei die Nutzerakzeptanz deutlich zu verbessern (Haapakangas et al., 2011). Auch Musik wurde als Geräuschquelle von Aufgaben irrelevanten Schallen in Studien untersucht, was sich allerdings als weniger effektiv herausstellte (Haapakangas et al., 2011; Schlittmeier & Hellbrück, 2009).In order for a sound to have a sufficient masking effect, it must have a sufficiently broadband noise signal in all frequency components in which the interference signal occurs. Pink noise, for example, which has a volume drop of about 3 dB per octave, has been identified as an effective masking signal. However, subjects often subjectively perceive it as disturbing and therefore tend to reject it (Schlittmeier & Hellbrück, 2009). In various other studies, masking signals with other spectra have been proposed and investigated. Signals such as pink noise adjusted in frequency response, speech-like murmuring from several speakers or even natural signals such as the sound of spring water were considered (Hongistob et al., 2017; Veitch et al., 2002; Wang, Drotleff & Li, 2012). Natural noise sources seem to significantly improve user acceptance (Haapakangas et al., 2011). Music has also been investigated as a source of task-irrelevant sounds in studies, but this turned out to be less effective (Haapakangas et al., 2011; Schlittmeier & Hellbrück, 2009).
Um die eben beschriebenen subjektiven Urteile neben der alleinigen psychoakustischen Wirksamkeit mit einzubeziehen, stellte Chanaud (2007) zwei Systeme der adaptiven Schallmaskierung vor. Zum einen ein zeitbasiertes System, bei dem der Schalldruckpegel des Maskier Schalles in statischen Zeitintervallen über den Tag variiert. Dafür müssen für verschiedene Tageszeiten verschiedene Bedürfnisse an Akustischer Privatsphäre, sowie das voraussichtliche Maß an Störintensität des Schalls vorhergesagt werden. So ist es über Nacht und am frühen Morgen für Angestellte wichtig, die Präsenz anderer Menschen hören zu können. Dementsprechend würde kein oder nur ein sehr leiser Maskierschall zu dieser Zeit ausreichen. Zu Stoßzeiten, in denen die meisten Angestellten an Ihrem Arbeitsplatzankommen oder diesen wieder verlassen, herrscht viel soziale Interaktion, wodurch ein hohes Maß an akustischer Ablenkung entstehen kann, welche durch höhere Lautstärken des Maskierschalls kompensiert werden sollen. Während der Mittagspause ist der Bedarf nach Maskierung wieder gering. Das 10. Perzentil L10, des gemessenen Schallpegels beschreibt den Schallpegel, welcher mindestens in 10% der betrachteten Teilzeit erreicht wurde. Das 90. Perzentil L90, beschreibt den Schallpegel, welcher mindestens in 90% der betrachteten Teilzeit erreicht wurde.In order to include the subjective judgements described above in addition to the psychoacoustic effectiveness alone, Chanaud (2007) presented two systems of adaptive sound masking. Firstly, a time-based system in which the sound pressure level of the masking sound varies in static time intervals throughout the day. For this, different needs for acoustic privacy and the expected level of noise intensity must be predicted for different times of day. For example, it is important for employees to be able to hear the presence of other people overnight and in the early morning. Accordingly, no or only very quiet masking sound would be sufficient at this time. At peak times, when most employees arrive at or leave their workplace, there is a lot of social interaction, which can lead to a high level of acoustic distraction, which should be compensated for by higher volumes of the masking sound. During the lunch break, the need for masking is again low. The 10th percentile L10 of the measured sound level describes the sound level that was reached in at least 10% of the part-time period considered. The 90th percentile L90 describes the sound level that was reached in at least 90% of the part-time period considered.
Zuydervliet et al. (2008) schlägt ebenfalls vor, dass bei einer adaptiven Maskierschallsteuerung der 10. und der 90. Perzentilwert ermittelt werden sollen. Dabei steht das 90. Perzentil LAF,90% stellvertretend für das Hintergrundrauschen des Umgebungsschalls und das 10. Perzentil LAF,10% beschreibt die Aktivitätstransienten von Störschallen in der Hintergrundschallbedingung. Die Differenz dieser LAF,10%-90%-Werte beschreibt also eine SNR von Störanteilen und Hintergrundrauschen (Zuydervliet et al., 2008). Ist der SNR hoch, verfügt der Hintergrundschall über einen großen Changing-State-Charakter und verursacht demnach einen ISE. Der ermittelte LAF,10%-90%-Wert sollte laut Zuydervliet et al. (2008) mit einem Zielwert LAF,10%-90%,Ziel, also mit einer optimale Perzentilwertdifferenz, verglichen werden. Wenn der Unterschied des ermittelten LAF,10%-90% größer ist als der Zielwert, soll sich das Maskierschalllevel langsam erhöhen und somit den Signal-Rausch-Abstand (SNR) des Gesamtschalls verkleinern. Wenn der Unterschied geringer ist, ist der SNR des Summensignals schon kleiner als mindestens notwendig um keinen ISE zu verursachen, und der Maskierschall kann langsam leiser werden. Weitere Parameter wie ein Gewichtungsfaktor W, eine maximale Lautstärkeänderung pro Minute, sowie ein Parameter zur Anpassung der Sensitivität können somit eine optimale Lautstärke des Maskierschalls beeinflussen (Zuydervliet et al., 2008). Dabei soll der Zielwert (LAF,10%-90%,Ziel) zwischen 3 und 10 dB liegen, während der Gewichtungsfaktor zwischen 0.5 und 4 liegen sollte. Die Zeitperiode über welche die Analyse der Perzentilwerte verläuft bestimmt die Senitivität des Systems, wobei hierfür ein Betrachtungszeitraum von 15 s vorgeschlagen wird. Wird ein längerer Zeitraum gewählt, fallen Pegelschwankungen weniger stark ins Gewicht und die Steuerung reagiert langsamer auf sich ändernde Schallbedingungen. Als maximale Änderungsrate wird ein Wert von 0,05 dB pro Sekunde genannt (L'Esperance et al., 2017).Zuydervliet et al. (2008) also suggests that the 10th and 90th percentile values should be determined for adaptive masking sound control. The 90th percentile L AF,90% represents the background noise of the ambient sound and the 10th percentile L AF,10% describes the activity transients of disturbing sounds in the background noise condition. The difference between these L AF,10%-90% values therefore describes an SNR of disturbing components and background noise (Zuydervliet et al., 2008). If the SNR is high, the background sound has a large changing state character and therefore causes an ISE. According to Zuydervliet et al. (2008) with a target value L AF,10%-90%,target , i.e. with an optimal percentile value difference. If the difference of the determined L AF,10%-90% is greater than the target value, the masking sound level should slowly increase and thus reduce the signal-to-noise ratio (SNR) of the total sound. If the difference is smaller, the SNR of the sum signal is already smaller than the minimum necessary to not cause an ISE, and the masking sound can slowly become quieter. Other parameters such as a weighting factor W, a maximum volume change per minute, and a parameter for adjusting the sensitivity can thus influence the optimal volume of the masking sound (Zuydervliet et al., 2008). The target value (L AF,10%-90%,target ) should be between 3 and 10 dB, while the weighting factor should be between 0.5 and 4. The time period over which the analysis of the percentile values takes place determines the sensitivity of the system, whereby a period of 15 s is suggested. If a longer period is selected, level fluctuations are less significant and the control system reacts more slowly to changing sound conditions. A value of 0.05 dB per second is given as the maximum rate of change (L'Esperance et al., 2017).
Laut Chanaud (2007) sollten die Pegelanhebung generell schneller erfolgen als die Pegelabsenkung des Maskierschalles. Des Weiteren wird vorgeschlagen, bei adaptiven Maskierschall Systemen das obere sowie das untere Limit zu beschränken. Dabei sollte gewährleistet werden, dass zu jeder Zeit eine ausreichende Maskierung gesichert ist, zugleich aber ein maximal zumutbarer Pegel nicht überschritten wird. Zuydervliet et al. (2008) schlägt für einen Dynamikbereich der Maskierschalllautstärke 5dB vor, in der Arbeit von L'Espérance (2017) dagegen wird 3dB vorgeschlagen.According to Chanaud (2007), the level increase should generally be faster than the level reduction of the masking sound. It is also suggested that the upper and lower limits of adaptive masking sound systems should be limited. This should ensure that sufficient masking is ensured at all times, but at the same time a maximum acceptable level is not exceeded. Zuydervliet et al. (2008) suggests a dynamic range of 5 dB for the masking sound volume, whereas the work by L'Espérance (2017) suggests 3 dB.
Während ein Großteil der bisherigen Lösungsansätze sich auf globale Maskiersysteme fokussiert, bei welchen die Maskierschalle über zentrale Lautsprecher in z.B. einem Großraumbüro wiedergeben werden, empfehlen Schlittmeier und Hellbrück (2009) lokale Maskierungssysteme für einzelne Arbeitskräfte. Da sich allerdings wiederum benachbarte Mitarbeitende durch Übersprechen von individuellen, über Lautsprecher wiedergegebenen Maskierschallen pro Arbeitsplatz gestört fühlen können, ist die Wiedergabe dieser Maskierschalle über Kopfhörer in Kombination mit einer adaptiven Pegelsteuerung ein vielversprechender Ansatz. Die Akzeptanz von einem solchen kopfhörerbasiertem Maskiersystem sollte auch durch die Personalisierbarkeit von Nutzern im Vergleich zu Lautsprechermaskierungssystemen verbessert werden. Denn verschiedene Studien zeigen, dass eine erhöhte Zufriedenheit in Bezug auf das Arbeitsumfeld herrscht, wenn dieses durch die Mitarbeitenden kontrollierbar ist (Huang et al., 2004; Lee & Brand, 2010).While the majority of previous solutions focus on global masking systems, in which the masking sounds are played over central loudspeakers in, for example, an open-plan office, Schlittmeier and Hellbrück (2009) recommend local masking systems for individual employees. However, since neighboring employees can be affected by crosstalk from individual loudspeakers, Since employees may feel disturbed by the masking sounds played at each workstation, the playback of these masking sounds via headphones in combination with an adaptive level control is a promising approach. The acceptance of such a headphone-based masking system should also be improved by the personalization of users compared to loudspeaker masking systems. Various studies show that there is increased satisfaction with the work environment when it is controllable by the employees (Huang et al., 2004; Lee & Brand, 2010).
Doch nicht nur die Zufriedenheit von Angestellten, sondern auch deren physische Gesundheit und Performance sollen durch mehr Kontrolle über das Arbeitsumfeld gesteigert werden (siehe Cohen, 1980; Quick, 1990). Auch Renz (2019) orientiert sich an Perzentilwertdifferenzen LAF,10%- LAF,90% und hat dabei eine neue Methode zur Vorhersage eines voraussichtlichen Leistungsabfalls DP (engl.: decrease of performance; deutsch: Rückgang der Performanz), erarbeitet. Renz (2019) schlägt 2 bis 3 dB als geeigneten Zielwert (LAF,10%-90%,Ziel) für eine adaptive Pegelsteuerung von Maskierschallen vor.However, not only the satisfaction of employees, but also their physical health and performance should be increased through more control over the work environment (see Cohen, 1980; Quick, 1990). Renz (2019) also focuses on percentile value differences L AF,10% - L AF,90% and has developed a new method for predicting an expected decrease in performance DP. Renz (2019) suggests 2 to 3 dB as a suitable target value (L AF,10%-90%,target ) for adaptive level control of masking sounds.
Die von Renz (2019), "Personalised sound masking in open offices. A trade-off between annoyance and restoration of working memory performance?" Stuttgart: Fraunhofer Verl, Stuttgart, evaluierten und geplotteten DP Werte in Abhängigkeit von dem Vorhersageparameter LAF,10%-90% sind in Renz, 2019 auf Seite 204 gezeigt. Renz, 2019, zeigt dabei auf Seite 204 einen Plot des kognitiven Performance Vorhersage Modells des resultierenden DP bei dem Vorhersageparameter LAF 10-90.The DP values evaluated and plotted by Renz (2019), "Personalised sound masking in open offices. A trade-off between annoyance and restoration of working memory performance?" Stuttgart: Fraunhofer Verl, Stuttgart, as a function of the prediction parameter L AF,10%-90% are shown in Renz, 2019 on page 204. Renz, 2019, shows on page 204 a plot of the cognitive performance prediction model of the resulting DP with the prediction parameter LAF 10-90.
Eine Vorrichtung nach Anspruch 1, ein Verfahren nach Anspruch 14 und ein Computerprogramm nach Anspruch 15 werden bereitgestellt.An apparatus according to
Eine Vorrichtung zur Sprachmaskierschallerzeugung gemäß einer Ausführungsform wird bereitgestellt. Die Vorrichtung umfasst einen Analysator zur Analyse von jedem frequenzbandbegrenzten Signalanteil einer Mehrzahl von frequenzbandbegrenzten Signalanteilen eines Mikrofonsignals während eines analysierten Zeitraums, um Information über den frequenzbandbegrenzten Signalanteil zu erhalten. Des Weiteren umfasst die Vorrichtung einen Maskiersignalerzeuger zur Erzeugung eines Maskiersignals abhängig von der Information über den frequenzbandbegrenzten Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten Signalanteilen. Die Information über den frequenzbandbegrenzten Signalanteil hängt von einem ersten Schallpegel ab, der mindestens während einer ersten Zeitdauer während des analysierten Zeitraums erreicht wurde. Ferner hängt die Information über den frequenzbandbegrenzten Signalanteil von einem zweiten Schallpegel ab, der mindestens während einer zweiten Zeitdauer während des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer von der ersten Zeitdauer unterschiedlich ist.A device for generating speech masking sound according to an embodiment is provided. The device comprises an analyzer for analyzing each frequency band-limited signal portion of a plurality of frequency band-limited signal portions of a microphone signal during an analyzed time period to obtain information about the frequency band-limited signal portion. Furthermore, the device comprises a masking signal generator for generating a masking signal depending on the information about the frequency band-limited signal portion of each of the plurality of frequency band-limited signal portions. The information about the frequency band-limited signal portion depends on a first sound level that was reached at least during a first time period during the analyzed time period. Furthermore, the information about the frequency band-limited signal portion depends on a second sound level that was reached at least during a second time period during the analyzed time period, wherein the second time period is different from the first time period.
Des Weiteren wird ein Verfahren zur Sprachmaskierschallerzeugung gemäß einer Ausführungsform bereitgestellt. Das Verfahren umfasst:
- Analysieren von jedem frequenzbandbegrenzten Signalanteil einer Mehrzahl von frequenzbandbegrenzten Signalanteilen eines Mikrofonsignals während eines analysierten Zeitraums, um Information über den frequenzbandbegrenzten Signalanteil zu erhalten. Und:
- Erzeugen eines Maskiersignals abhängig von der Information über den frequenzbandbegrenzten Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten Signalanteilen.
- Analyzing each frequency band-limited signal portion of a plurality of frequency band-limited signal portions of a microphone signal during an analyzed time period to obtain information about the frequency band-limited signal portion. And:
- Generating a masking signal depending on the information about the frequency band limited signal component of each of the plurality of frequency band limited signal components.
Ferner wird ein Computerprogramm mit einem Programmcode zur Durchführung des oben beschriebenen Verfahrens gemäß einer Ausführungsform bereitgestellt.Furthermore, a computer program with a program code for carrying out the method described above is provided according to one embodiment.
Die Information über den frequenzbandbegrenzten Signalanteil hängt von einem ersten Schallpegel ab, der mindestens während einer ersten Zeitdauer während des analysierten Zeitraums erreicht wurde. Ferner hängt die Information über den frequenzbandbegrenzten Signalanteil von einem zweiten Schallpegel ab, der mindestens während einer zweiten Zeitdauer während des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer von der ersten Zeitdauer unterschiedlich ist.The information on the frequency band-limited signal component depends on a first sound level which is present at least during a first period of time during the analyzed period. Furthermore, the information on the frequency band-limited signal component depends on a second sound level that was reached at least during a second time period during the analyzed period, the second time period being different from the first time period.
Ausführungsformen stellen einen Regelungsalgorithmus bereit, welcher ein Sprachmaskiersignal zur Darbietung über Kopfhörer gleichsam angenehm als auch gesichert, psychoakustisch validiert einstellen kann.Embodiments provide a control algorithm that can adjust a speech masking signal for presentation over headphones in a way that is both comfortable and secure and psychoacoustically validated.
Die oben beschriebenen, von Renz (2019) evaluierten und geplotteten DP Werte in Abhängigkeit von dem Vorhersageparameter LAF,10%-90%, die in Renz, 2019 auf Seite 204 abzulesen sind, bilden eine wissenschaftliche Grundlage von Überlegungen, auf denen Ausführungsformen basieren.The DP values described above, evaluated and plotted by Renz (2019) as a function of the prediction parameter L AF,10%-90% , which can be read in Renz, 2019 on page 204, form a scientific basis of considerations on which embodiments are based.
Manche Ausführungsformen stellen einen Maskierschall bereit, welcher beispielsweise individuell über Kopfhörer einstellbar ist und immer nur in einem Maße zum Einsatz kommt, in dem er gerade benötigt wird. Hierdurch wird eine effektive Möglichkeit geschaffen, um sowohl die kognitive Leistungsfähigkeit, als auch die Zufriedenheit der Mitarbeitenden am Arbeitsplatz zu verbessern.Some embodiments provide a masking sound, which can be individually adjusted via headphones, for example, and is only used to the extent that it is needed. This creates an effective way to improve both the cognitive performance and the satisfaction of employees in the workplace.
Nachfolgend werden bevorzugte Ausführungsformen der Erfindung unter Bezugnahme auf die Zeichnungen beschrieben.Preferred embodiments of the invention are described below with reference to the drawings.
In den Zeichnungen ist dargestellt:
- Fig. 1
- zeigt eine Vorrichtung zur Sprachmaskierschallerzeugung gemäß einer Ausführungsform.
- Fig. 2
- zeigt ein Signalflussdiagramm mit einer Frequenzaufteilung in neun Oktavbänder gemäß einer Ausführungsform.
- Fig. 3
- zeigt ein Signalflussdiagramm zur adaptiven Geräuschmaskierung gemäß einer Ausführungsform.
- Fig. 4
- ein Signalflussdiagramm eines Regelwert-Prüfers gemäß einer Ausführungsform.
- Fig. 5
- zeigt eine Regelschleife gemäß einer Ausführungsform.
- Fig.1
- shows a device for generating speech masking sound according to an embodiment.
- Fig.2
- shows a signal flow diagram with a frequency division into nine octave bands according to an embodiment.
- Fig.3
- shows a signal flow diagram for adaptive noise masking according to an embodiment.
- Fig.4
- a signal flow diagram of a control value checker according to an embodiment.
- Fig.5
- shows a control loop according to an embodiment.
Die Vorrichtung umfasst einen Analysator 110 zur Analyse von jedem frequenzbandbegrenzten Signalanteil einer Mehrzahl von frequenzbandbegrenzten Signalanteilen eines Mikrofonsignals während eines analysierten Zeitraums, um Information über den frequenzbandbegrenzten Signalanteil zu erhalten.The device comprises an
Des Weiteren umfasst die Vorrichtung einen Maskiersignalerzeuger 120 zur Erzeugung eines Maskiersignals abhängig von der Information über den frequenzbandbegrenzten Signalanteil jedes der Mehrzahl von frequenzbandbegrenzten Signalanteilen.Furthermore, the device comprises a
Die Information über den frequenzbandbegrenzten Signalanteil hängt von einem ersten Schallpegel ab, der mindestens während einer ersten Zeitdauer während des analysierten Zeitraums erreicht wurde. Ferner hängt die Information über den frequenzbandbegrenzten Signalanteil von einem zweiten Schallpegel ab, der mindestens während einer zweiten Zeitdauer während des analysierten Zeitraums erreicht wurde, wobei die zweite Zeitdauer von der ersten Zeitdauer unterschiedlich ist.The information about the frequency band-limited signal component depends on a first sound level that was reached at least during a first time period during the analyzed time period. Furthermore, the information about the frequency band-limited signal component depends on a second sound level that was reached at least during a second time period during the analyzed time period, the second time period being different from the first time period.
Gemäß einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, eine Mikrofonsignal-Schallpegeldifferenz zwischen dem ersten Schallpegel und dem zweiten Schallpegel für jeden Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen. Dabei kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein, das Maskiersignal abhängig von der Mikrofonsignal-Schallpegeldifferenz jedes frequenzbandbegrenzten Signalanteils der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen.According to one embodiment, the
In einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein, das Maskiersignal zu bestimmen, indem für jeden Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen, abhängig von der Mikrofonsignal-Schallpegeldifferenz dieses Signalanteils, einen Pegelwert für eine frequenzbandbegrenzte Komponente des Maskiersignals, die einem Frequenzbereich dieses Signalanteils entspricht, zu bestimmen, und eine Pegelanpassung dieser frequenzbandbegrenzten Komponente des Maskiersignals mittels dieses Pegelwerts vorzunehmen.In one embodiment, the
Gemäß einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, ein Gesamtsignal zu bestimmen, das von dem Mikrofonsignal abhängt, aber von dem Mikrofonsignal unterschiedlich ist. Dabei kann der Analysator 110 z.B. ausgebildet sein, für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals einen Fehlerwert zu bestimmen, der eine Differenz zwischen einem Zielwert für eine Gesamtsignal-Schallpegeldifferenz und einer aktuellen Gesamtsignal-Schallpegeldifferenz des Gesamtsignals angibt. Der Maskiersignalerzeuger 120 kann dabei z.B. ausgebildet sein, das Maskiersignal abhängig von dem Fehlerwert für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals zu bestimmen. Der Analysator 110 kann dabei z.B. ausgebildet sein, die aktuelle Gesamtsignal-Schallpegeldifferenz zwischen einem dritten Schallpegel und einem vierten Schallpegel für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals zu bestimmen, wobei der dritte Schallpegel ein Schallpegel ist, der mindestens während einer dritten Zeitdauer während eines analysierten Zeitraums in dem frequenzbandbegrenzten Signalanteil des Gesamtsignals erreicht wurde, und wobei der vierte Schallpegel ein Schallpegel ist, der mindestens während einer vierten Zeitdauer während des analysierten Zeitraums in dem frequenzbandbegrenzten Signalanteil des Gesamtsignals erreicht wurde erreicht wurde.According to one embodiment, the
In einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals abhängig von einem rückgekoppelten zeitlichen Abschnitt des Maskiersignals zu diesem frequenzbandbegrenzten Signalanteil zu bestimmen.In one embodiment, the
Gemäß einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, jeden der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals abhängig von einem Dämpfungsfaktor für diesen frequenzbandbegrenzten Signalanteil des Gesamtsignals zu bestimmen, wobei der Analysator 110 ausgebildet ist, den Dämpfungsfaktor für diesen frequenzbandbegrenzten Signalanteil auf dem entsprechenden frequenzbandbegrenzten Signalanteil des Mikrofons anzuwenden, um ein gedämpftes Mikrofonsignal zu diesem frequenzbandbegrenzten Signalanteil zu erhalten.According to one embodiment, the
In einer Ausführungsform kann der Analysator 110 z.B. ausgebildet sein, jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals als Summe des rückgekoppelten zeitlichen Abschnitt des Maskiersignals zu diesem frequenzbandbegrenzten Signalanteil und des gedämpftes Mikrofonsignals zu diesem frequenzbandbegrenzten Signalanteil zu bestimmen.In one embodiment, the
Gemäß einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein, das Maskiersignal abhängig von einem Korrekturwert für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals zu bestimmen, wobei der Maskiersignalerzeuger 120 ausgebildet ist, den Korrekturwert für diesen frequenzbandbegrenzten Signalanteil abhängig vom dem Fehlerwert für diesen frequenzbandbegrenzten Signalanteil zu bestimmen.According to one embodiment, the
In einer Ausführungsform kann der Maskiersignalerzeuger 120 des Weiteren z.B. ausgebildet sein, den Korrekturwert für diesen frequenzbandbegrenzten Signalanteil abhängig von einem zeitlichen Vorgängerwert dieses Korrekturwerts zu bestimmen.In one embodiment, the
Gemäß einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein, den Korrekturwert abhängig von
In einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein, das Maskiersignal abhängig von einem Stellwert für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen, wobei der Maskiersignalerzeuger 120 ausgebildet ist, den Stellwert für diesen frequenzbandbegrenzten Signalanteil abhängig von der Mikrofonsignal-Schallpegeldifferenz dieses frequenzbandbegrenzten Signalanteils und abhängig von dem Fehlerwert und von dem Korrekturwert dieses frequenzbandbegrenzten Signalanteils des Gesamtsignals zu bestimmen.In one embodiment, the
Gemäß einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein, den Stellwert für diesen frequenzbandbegrenzten Signalanteil durch Bildung einer Summe der Mikrofonsignal-Schallpegeldifferenz dieses frequenzbandbegrenzten Signalanteils und des Fehlerwerts und des Korrekturwerts dieses frequenzbandbegrenzten Signalanteils des Gesamtsignals zu bestimmen.According to one embodiment, the
In einer Ausführungsform kann der Maskiersignalerzeuger 120 z.B. ausgebildet sein, den Pegelwert für eine frequenzbandbegrenzte Komponente des Maskiersignals, abhängig von dem Stellwert für diesen frequenzbandbegrenzten Signalanteil und abhängig von einem vorangegangenen Pegelwert für diese frequenzbandbegrenzte Komponente des Maskiersignals zu bestimmen.In one embodiment, the
Ausführungsformen stellen einen Regelungsalgorithmus bereit, der es ermöglicht, einen Maskierschall in der Lautstärke und in seinem Frequenzspektrum dynamisch an eine Hintergrundschallbedingung anzupassen.Embodiments provide a control algorithm that enables a masking sound to be dynamically adapted in volume and in its frequency spectrum to a background sound condition.
Der Algorithmus kann dabei z.B. selbstständig erkennen, in welchem Maße die Hintergrundschallbedingung einen störenden Einfluss auf die Kognitive Leistungsfähigkeit haben kann. Für diese Beurteilung der Schallbedingung wird ein Mikrofonsignal verwendet.The algorithm can, for example, independently detect the extent to which the background noise condition can have a disruptive influence on cognitive performance. A microphone signal is used to assess the noise condition.
Der Algorithmus funktioniert auf verschiedenen Endgeräten mit der jeweils zu Verfügung stehenden Technik. Da nicht davon auszugehen ist, dass in allen Endgeräten geeichte, normgerechte Mikrofone verbaut sind welche die Anforderungen an Schallpegelmesser gemäß DIN EN 61672-1 erfüllen, kommt der Algorithmus ohne Kenntnisse über den absoluten Schalldruckpegel aus. Der Algorithmus bestimmt dafür die 90% und 10% Perzentilwerte als Regelparameter.The algorithm works on different end devices with the technology available in each case. Since it cannot be assumed that all end devices have calibrated, standard-compliant microphones installed that meet the requirements for sound level meters according to DIN EN 61672-1, the algorithm does not require any knowledge of the absolute sound pressure level. The algorithm determines the 90% and 10% percentile values as control parameters.
Es wird ein Maskierschall erzeugt und abgespielt, welcher kontinuierlich über eine ausreichende Maskierwirkung verfügt, um einen möglichen, ISE bedingten kognitiven Leistungsabfall, der durch die Hintergrundschallbedingung entstehen kann, zu verhindern. Dabei verfügt der Algorithmus über eine geeignete Sensitivität gegenüber der Hintergrundschallbedingung, damit spontan auftretende Störgeräusche, welche nicht repräsentativ für die Hintergrundschallbedingung sind, nicht zur Regelung verwendet werden.A masking sound is generated and played, which continuously has a sufficient masking effect to prevent a possible ISE-related cognitive performance decline that can arise from the background noise condition. The algorithm has an appropriate sensitivity to the background noise condition so that spontaneously occurring noises that are not representative of the background noise condition are not used for control.
Der durch den Algorithmus erzeugte Maskierschall ist zu jeder Zeit nur so laut, wie nötig. Nicht nur die objektive Leistungssteigerung, sondern die akustische Zufriedenheit der Nutzer ist das zu erreichende Ziel. Maskierschalle im Allgemeinen werden eher als unangenehm wahrgenommen im Vergleich zu Stille. Damit also eine größtmögliche Nutzerakzeptanz geschaffen wird, erkennt der Algorithmus zu jeder Zeit, welches Mindestmaß an Maskierschall-Pegel gerade notwendig ist, und verwendet dieses kontinuierlich als Zielwert der Pegelsteuerung. Als Zielwert wird das Verhältnis des LAF,10% Perzentilswerts zum LAF,90% Perzentilwert verwendet. Der Maskierschall passt sich an das Frequenzspektrum des Hintergrundschalls an. Die Regelungszeiten, mit welchen der Maskierschall in der Lautstärke gesteuert wird werden vom Algorithmus so gewählt, dass die Lautstärkeschwankungen kaum merkbar sind. Dies ist sinnvoll, damit der Maskierschall selbst nicht selbst zu einer Ablenkung der Nutzenden führt. Gleichsam passieren Lautstärkeänderungen jedoch schnell genug, um auf veränderte akustische Verhältnisse in der Hintergrundschallbedingung reagieren zu können.The masking sound generated by the algorithm is only as loud as necessary at any given time. The goal is not only to increase performance objectively, but also to ensure the acoustic satisfaction of the users. Masking sounds in general are perceived as more unpleasant than silence. In order to achieve the greatest possible user acceptance, the algorithm recognizes at any time which The system determines the minimum masking sound level that is currently required and uses this continuously as the target value for level control. The ratio of the L AF,10% percentile value to the L AF,90% percentile value is used as the target value. The masking sound adapts to the frequency spectrum of the background noise. The control times with which the volume of the masking sound is controlled are selected by the algorithm so that the volume fluctuations are barely noticeable. This is useful so that the masking sound itself does not distract the user. At the same time, however, volume changes occur quickly enough to be able to react to changed acoustic conditions in the background noise condition.
Zur weiteren Verbesserung der Akzeptanz mischt der Algorithmus dem Maskierschall einen harmonischen Anteil hinzu, welcher einen angenehmen Klang des Maskierschalls gewährleistet.To further improve acceptance, the algorithm adds a harmonic component to the masking sound, which ensures a pleasant sound of the masking sound.
Nachfolgend wird der Algorithmus gemäß einer Ausführungsform im Detail beschrieben.The algorithm according to one embodiment is described in detail below.
So zeigt
Dabei veranschaulicht
Dabei zeigt
In diesem Teil des Algorithmus findet die Pegelwertmessung, die Perzentilwertdifferenzbestimmung und die kontinuierliche Errechnung des Stellwertes u statt. Des Weiteren werden hier durch eingestellte Regelzeiten die Stellwerte u geglättet, um somit den Pegelwert p zu erhalten, welcher wiederum den jeweiligen bandgefilterten Maskierschallanteil in seiner Lautstärke steuert. Der Teil des Algorithmus, in dem der aktuelle LA,F,10%-90%,Ges Wert errechnet wird, ist in
So zeigt
Die Eingabe des Algorithmus ist, wie in
Das geregelte Maskiersignal wird mit einem zusätzlichen harmonischen Anteil ergänzt. Beim harmonischen Anteil handelt es sich um eine Art Musik, die die Akzeptanz und subjektive Wahrnehmung des Maskierschalls verbessert. Der harmonische Anteil geht in die nachfolgend beschriebe Berechnung der zu erwartenden Störwirkung der akustischen Umgebung mit ein. Außerdem wird der harmonische Anteil, gemischt mit dem geregelten Maskieranteil, über die Kopfhörer wiedergegeben. Der harmonische Anteil ist psychoakustisch abgesichert, also in Hörversuchen auf seine Eignung untersucht worden (kein Zustandsänderungsverhalten, englisch: Changing-State-Verhalten, da keine Auslösung des ISE). Der harmonische Anteil kann z.B. eine unkomprimierte Stereo-Datei (englisch: StereoFile) sein, welches vom Algorithmus abgespielt & geregelt wird.The controlled masking signal is supplemented with an additional harmonic component. The harmonic component is a type of music that improves the acceptance and subjective perception of the masking sound. The harmonic component is included in the calculation of the expected interference effect of the acoustic environment described below. In addition, the harmonic component, mixed with the controlled masking component, is played through the headphones. The harmonic component is psychoacoustically secured, i.e. its suitability has been tested in listening tests (no changing state behavior, as the ISE is not triggered). The harmonic component can be, for example, an uncompressed stereo file that is played and controlled by the algorithm.
Die Eingabe der adaptiven Geräuschmaskierung (Adaptive Sound Masking), siehe
Von den besagten Audiosignal wird nun der äquivalente Dauerschallpegel, gemäß DIN EN 61672-1 ermittelt. Dazu wird zunächst ein quadratischer Mittelwert (Root Mean Square, RMS) pro Sample ermittelt. Anschließend werden die Pegelwerte über 125 Millisekunden integriert. Um eventuell auftretende Fehler in der weiteren Signalverarbeitung bei unrealistisch kleinen Amplitudenwerten zu vermeiden, sind die Werte durch einen Minimalamplitudenwert beschränkt. Die gemessenen Pegelwerte werden in einer fortlaufenden Liste gespeichert, wobei die Listenlänge den Betrachtungszeitraum, über welchen die Perzentilwerte analysiert werden, definiert. Durch die vorangegangene Pegelmessung wird die Liste alle 125 Millisekunden um einen neuen Pegelwert ergänzt und ein alter Wert wird gelöscht. Es findet eine Perzentilwertberechnung (LAF,90%, sowie LAF,10%) in der Liste statt. Anschließend wird der Wert des 90. Perzentils LAF,90%, von dem des 10. Perzentils LAF,10% subtrahiert, um den Perzentilwertunterschied der Hintergrundbedingung LAF,10%-90%, HSB zu bestimmen (HSB = Hintergrundschallbedingung). Da die Liste mit den LAF Werten sich alle 125 Millisekunden aktualisiert, errechnet sich auch alle 125 Millisekunden ein neuer LAF,10%-90%, HSB Wert.The equivalent continuous sound level is now determined from the said audio signal in accordance with DIN EN 61672-1. To do this, a root mean square (RMS) is first determined per sample. The level values are then integrated over 125 milliseconds. In order to avoid any errors that may occur in further signal processing with unrealistically small amplitude values, the values are limited by a minimum amplitude value. The measured level values are saved in a continuous list, with the list length defining the observation period over which the percentile values are analyzed. Due to the previous level measurement, a new level value is added to the list every 125 milliseconds and an old value is deleted. A percentile value calculation (L AF,90% and L AF,10% ) takes place in the list. Then the value of the 90th percentile L AF,90% is subtracted from that of the 10th percentile L AF,10% to determine the percentile value difference of the background condition L AF,10%-90% , HSB (HSB = background noise condition). Since the list of LAF values is updated every 125 milliseconds, a new L AF,10%-90%, HSB value is also calculated every 125 milliseconds.
Aus der Differenz dieser kontinuierlich ermittelten Perzentilwerte errechnen sich also laufend Pegelunterschiede, welche mit dem Abfall eines Leistungsverlustes in Zusammenhang gebracht werden können, wie die zuvor beschriebene Studie von Renz et al. (2018) zeigt. Je höher das relative Level der Aktivitäts-Transienten LAF,10%, desto größer ist die Ablenkung (Zuydervliet et al., 2008). Um diesem ISE bedingten Leistungsabfall entgegenzuwirken, soll das Hintergrund-Schallpegelniveau LAF,90%, durch das Hinzufügen eines Maskierrauschens soweit angehoben werden, dass der Pegelunterschied zu dem Aktivitäts-Schallpegelniveau LAF,10% ausreichend reduziert wird. Die nachfolgend beschriebene Regelung stellt sicher, dass der Unterschied dieser beiden Werte möglichst gering ist (z.B. unter 3 oder z.B. zwischen 2 und 3. Es können auch andere Zielwerte gewählt werden). Um eine Regelung zu implementieren, welche gewährleisten soll, dass ein LAF,10%-90% Zielwert erreicht wird, wird das Gesamtsignal aus Maskierschall und Hintergrundschall auf seinen LAF,10%-90% Wert untersucht.The difference between these continuously determined percentile values is used to calculate level differences that can be associated with the decrease in performance loss, as the previously described study by Renz et al. (2018) shows. The higher the relative level of the activity transients L AF,10% , the greater the distraction (Zuydervliet et al., 2008). In order to counteract this ISE-related performance loss, the background sound level L AF,90% , should be increased by adding masking noise to such an extent that the level difference to the activity sound level L AF,10% is sufficiently reduced. The control described below ensures that the difference between these two values is as small as possible (e.g. below 3 or e.g. between 2 and 3. Other target values can also be selected). In order to implement a control that To ensure that a L AF,10%-90% target value is achieved, the total signal from masking sound and background sound is examined for its L AF,10%-90% value.
In manchen Ausführungsformen soll der Algorithmus universal auch mit Kopfhörern ohne ANC verwendbar sein. Deshalb wird das Signal, welches am Ohr des Nutzers ankommt, in derartigen Ausführungsformen geschätzt. Sofern der Zugriff auf das Mikrofon möglich ist, kann der Wert auch direkt bestimmt werden. Die nachfolgende Regelung erfolgt dann mit dem gemessenen Wert, statt mit dem geschätzten, ist aber abgesehen davon identisch.In some embodiments, the algorithm should also be universally usable with headphones without ANC. Therefore, the signal that reaches the user's ear is estimated in such embodiments. If access to the microphone is possible, the value can also be determined directly. The subsequent control is then carried out with the measured value instead of the estimated one, but is otherwise identical.
Zur Schätzung sollte bekannt sein, in welchem Maße der Hintergrundschall durch die verwendeten Kopfhörer in seinem Pegel reduziert wird. Die ermittelten äquivalenten Dauerschallpegel der Hintergrundschallbedingung werden in diesem Teil des Algorithmus mit dem Dämpfungsfaktor verrechnet, um somit einen geschätzten relativen Schallpegel der Hintergrundschallbedingung an der Position des Ohrs des Nutzers zu erlangen. Von dem Signal des Maskierschalls (und dem harmonischen Anteil) welches nach dessen Pegelanpassung abgegriffen wurde (siehe
Beispielsweise kann vorgesehen sein, dass eine Person, die eine Implementierung des adaptiven Maskiersignalerzeuger-Algorithmus in Hard- oder Software nutzt, zu Beginn der Nutzung den Maskierungsschallerzeuger in seiner Wiedergabelautstärke für die aktuelle Schallbedingung selbst einstellen kann. Das geschieht z.B. über einen Fader (Schieberegler) in der grafischen Benutzeroberfläche, oder einem Potentiometer am Kopfhörer, welcher den Kalibrierungsfaktor W steuert. Der Kalibrierungsfaktor wird unabhängig von der Pegelregelung am Ende des Signalpfades aufgeschlagen.For example, it can be provided that a person who uses an implementation of the adaptive masking signal generator algorithm in hardware or software can adjust the masking sound generator's playback volume for the current sound condition at the beginning of use. This is done, for example, via a fader in the graphical user interface, or a potentiometer on the headphones, which controls the calibration factor W. The calibration factor is added independently of the level control at the end of the signal path.
Zur Berechnung der sich selbst korrigierende Stellgröße u analysiert der Algorithmus das Eingangssignal des Mikrofons und es werden Pegelunterschiede von LAF,10% und LAF,90% errechnet (siehe
Allerdings ist das Verhältnis des Vorhersageparameter LAF,10%-90% nicht linear zu einem voraussichtlichen DP-Wert (Renz, 2019). Das bedeutet, dass durch eine einfache Lautstärkeanhebung des Maskierschalls um den ermittelten LAF,10%-90%,HSB Wert die störenden Schallanteile der HSB nicht zwangsläufig ausreichend maskiert sind. Um zu überprüfen, ob das Signal, welches am Ohr der Nutzer ankommt (gedämpfter Umgebungsschall + Maskiersignal), wirklich als eine störungsfreie Schallbedingung bewertet werden kann, wird dieses wie zuvor beschrieben analysiert, um den gesamten Wert der Perzentilunterschiede LAF,10%-90%,Ges zu ermitteln.However, the relationship of the prediction parameter L AF,10%-90% is not linear to a prospective DP value (Renz, 2019). This means that simply increasing the volume of the masking sound by the determined L AF,10%-90%,HSB value does not necessarily sufficiently mask the disturbing sound components of the HSB. In order to check whether the signal that reaches the user's ear (attenuated ambient sound + masking signal) can really be assessed as a disturbance-free sound condition, it is analyzed as described above to determine the total value of the percentile differences L AF,10%-90%,Ges .
LAF,10%-90%,Ges soll im nächsten Schritt mit einem Zielwert LAF,10%-90%,Ziel verglichen werden. Ein geeigneter Zielwert, bei welchem ein Leistungsabfall gerade so noch nicht signifikant eintritt liegt zwischen 2 dB und 3 dB. Für den Algorithmus wird beispielsweise ein Zielwert LAF,10%-90%,Ziel von 2,5 dB verwendet. Dies führt zu einem Zielwertebereich zwischen 2 dB und 3 dB, innerhalb dessen sich LAF,10%-90%,Ges bewegt. Der Zielwert kann jedoch auch anders gewählt werden. Bei einem Vergleich der Perzentilwertdifferenzen beschreibt der Fehlerwert e die Differenz von LAF,10%-90%,Ziel und LAF,10%-90%,Ges. Die Stellgröße u, welche die Lautstärke des Maskierschalls regelt, ist definiert als die Summe aus LAF,10%-90%,HSB und einem Korrekturwert z (siehe Gleichung 1).
Bei konstanten LAF,10%-90%,HSB Werten und einem positiven Fehlerwert muss der Korrekturwert z solange größer werden, bis ein Fehlerwert von 0 erreicht ist. Sobald der Fehlerwert unter 0 sinkt, muss der Korrekturwert wieder kontinuierlich kleiner werden. Der Korrekturwert wird dabei so lange ansteigen und wieder absinken, bis er sich einen Wert erreicht, bei welchem der Fehlerwert konstant 0 bleibt. Der Korrekturwert z, sollte sich jedoch umso langsamer erhöhen beziehungsweise absenken, je näher der Fehlerwert sich 0 annähert. Da um LAF,10%-90%,Ziel ein Toleranzbereich von +/- 0,5 dB besteht, kann z konstant steigen oder fallen, so lange, bis die Toleranzgrenze erreicht ist. Ab einem Fehlerwert von 0,5 soll sich z mit umso kleineren Schritten verändern, je näher sich e 0 annähert. Dadurch soll verhindert werden, dass der Fehlerwert durch eine zu starke Korrektur über den Nullpunkt hinaus korrigiert wird. Im Extremfall könnte das dazu führen, dass die Regelung den Korrekturwert zwischen zwei Extremen im positiven und negativen Wertebereich endlos hin und her pendelt. Aus diesem Grund ergibt sich der aktuelle Korrekturwert zn aus dem letzten Korrekturwert zn-1, addiert beziehungsweise subtrahiert mit einer Korrekturpauschale g(e). Diese Korrekturpauschale hängt von der Größe des Fehlerwertes e ab, und ist dabei für verschiedene Bedingungen klar definiert (siehe Gleichung 3). Dieser Teil des Algorithmus wird in
Maskierschalle sollten generell einen maximalen Schalldruckpegel zwischen 45 dB(A) und 48 dB(A) aufweisen. Dieses Maximum wird darin begründet, dass höhere Schallpegel über einen längeren Zeitraum hinweg meist als äußerst störend wahrgenommen werden (Haapakangas et al., 2011). Daher begrenzt der Algorithmus das obere sowie das untere Limit von u. Allerdings kann das in dieser Erfindungsmeldung beschriebe Maskierungssystem keine absoluten Schallpegel erfassen, weshalb die maximal möglichen Schallpegelwerte über die Kalibrierung des Nutzers selbst gesteuert werden. Der Dynamikbereich des adaptiven Maskiersignals wird auf 26 dB festgelegt, kann jedoch je nach Implementierung geändert werden. Damit kann auch bei einer gering störenden HSB der LAF,10%-90%,Ziel-Wert erreicht werden, wobei der Maskierschall so leise wie möglich ist.Masking sounds should generally have a maximum sound pressure level between 45 dB(A) and 48 dB(A). This maximum is justified by the fact that higher sound levels over a longer period of time are usually perceived as extremely disturbing (Haapakangas et al., 2011). Therefore, the algorithm limits the upper and lower limits of u. However, the masking system described in this invention report cannot detect absolute sound levels, which is why the maximum possible sound level values are controlled via the user's own calibration. The dynamic range of the adaptive masking signal is set to 26 dB, but can be changed depending on the implementation. This means that even with a slightly disturbing HSB, the L AF,10%-90%,target value can be achieved, whereby the masking sound is as quiet as possible.
Eine wesentliche Anforderung an den Algorithmus ist, dass die HSB zu jeder Zeit ausreichend maskiert wird. Allerdings darf eine Lautstärkeänderung nicht dazu führen, dass der Maskierschall selbst zu einem Störfaktor wird. Denn ein Changing-State-Charakter tritt unter anderem dann ein, wenn eine starke Variabilität im Amplitudengang festzustellen ist (Liebl, 2006). Und Schalle mit Changing-State-Charakter haben einen negativen Effekt auf die kognitive Leistungsfähigkeit. Aus diesem Grund regelt die Stellgröße u den Pegel des Maskierschalls nicht direkt. Durch das Zwischenschalten einer Zeitrampe kann eine Glättung im Verlauf der Pegelwerte erzielt werden. Eine Zeitrampe gewährleistet eine kontinuierliche Annäherung zwischen einem alten Stellwert u n-1 und einem neuen un . Dabei ist die Attack-Zeit tAttack, in welcher der Pegel von einem alten zu einem neuen Wert ansteigen soll, sowie die Release-Zeit tRelease, mit welcher der Pegel wieder abfällt, separat einstellbar. Die Gleichung 4 beschreibt den aktuellen Pegelwert pn , welcher durch den aktuellen Eingangswert un (Stellwert) den letzten ausgegebenen Pegelwert p n-1 und tAttack sowie tRelease, definiert. Die Zeitparameter tAttack, beziehungsweise tRelease, ergeben sich aus der Inputsamplerate und den angestrebten Attackbeziehungsweise Release-Zeiten.
Dabei muss abgewogen werden, ob es wichtiger ist, dass der Maskierschall so schnell wie möglich eine ausreichende Lautstärke erreicht, oder ob eine möglichst unmerkliche Lautstärkeänderung Priorität hat. Als Kompromisslösung werden 5 Sekunden vorgeschlagen.It is important to weigh up whether it is more important that the masking sound reaches a sufficient volume as quickly as possible, or whether a volume change that is as unnoticeable as possible has priority. 5 seconds is suggested as a compromise solution.
In dem Moment, in welchem der Pegel der HSB in den Betrachtungszeitraum fällt, würde jedoch ein hoher LAF,10%-90%,HSB Wert entstehen, was wiederum zu einem starken Pegelanstieg des Maskiersignals führen würde. Dieser Pegelanstieg kann durch seinen Changing-State-Charakter seinerseits wieder eine Ablenkung darstellen, ohne dabei einen Störschall zu maskieren. Um einen Pegelanstieg in einer solchen Situation zu verhindern, werden die ermittelten LAF,90% Werte kontinuierlich auf starke Schwankungen untersucht. Fällt dabei ein neu eintreffender LAF,90% Wert im Vergleich zum letzten LAF,90% Wert um mehr als 2 dB, wird die Attack-Zeit tAttack der Zeitrampe für die Dauer eines Betrachtungszeitraumes (5 Sekunden) auf 90 Sekunden gestellt. Eine Attack-Zeit in dieser Größenordnung bewirkt, dass kein merklicher Pegelanstieg möglich ist. Nach Ablauf der fünf Sekunden wird die Attack-Zeit wieder auf ihren regulären Wert zurückgestellt, und der Pegel kann wieder regulär geregelt werden.However, the moment the HSB level falls within the observation period, a high L AF,10%-90%,HSB value would arise, which in turn would lead to a strong increase in the level of the masking signal. Due to its changing state character, this level increase can in turn represent a distraction without masking any noise. To prevent a level increase in such a situation, the determined L AF,90% values are continuously checked for strong fluctuations. If a newly arrived L AF,90% value falls by more than 2 dB compared to the last L AF,90% value, the attack time t Attack of the time ramp is set to 90 seconds for the duration of the observation period (5 seconds). An attack time of this magnitude means that no noticeable increase in level is possible. After the five seconds have elapsed, the attack time is reset to its regular value and the level can be regulated regularly again.
Nach der Pegelanpassung wird das gesamte adaptive, harmonische Sprachmaskiersignal (bestehend aus der maskierenden sowie harmonischen Anteil) über den Audioausgang des Endgeräts (digital oder analog) über Kopfhörer wiedergegeben.After level adjustment, the entire adaptive harmonic speech masking signal (consisting of the masking and harmonic components) is reproduced via the audio output of the terminal device (digital or analog) through headphones.
In Ausführungsformen wird ein Maskiersignal bereitgestellt, welches gleichsam angenehm und wirksam ist, sowie gesichert innerhalb eines festzulegenden Zeitintervalls psychoakustisch determinierte Zielwerte erreicht, deren Korrelation mit der kognitiven Leistungsfähigkeit z.B. bekannt ist.In embodiments, a masking signal is provided which is both pleasant and effective and reliably achieves psychoacoustically determined target values within a specified time interval, the correlation of which with cognitive performance is known, for example.
Ausführungsformen basieren darauf, dass die Regelung mittels Schätzung abhängig von der zu erwarteten Störwirkung den Maskierer einstellt.Embodiments are based on the fact that the control adjusts the masker by means of an estimation depending on the expected interference effect.
Beispielsweise können Ausführungsformen bei Büroflächen, insbesondere bei Büros für mehrere Personen, zum Einsatz kommen und können insbesondere für den Einsatz mit Kopfhörern angepasst sein. Weitere Anwendungsfelder können beispielsweise im medizinischen Einsatz oder in der Therapie liegen, oder aber auch im Tourismus.For example, embodiments can be used in office spaces, especially in offices for several people, and can be adapted in particular for use with headphones. Other areas of application can be, for example, in medical use or in therapy, or even in tourism.
Obwohl manche Aspekte im Zusammenhang mit einer Vorrichtung beschrieben wurden, versteht es sich, dass diese Aspekte auch eine Beschreibung des entsprechenden Verfahrens darstellen, sodass ein Block oder ein Bauelement einer Vorrichtung auch als ein entsprechender Verfahrensschritt oder als ein Merkmal eines Verfahrensschrittes zu verstehen ist. Analog dazu stellen Aspekte, die im Zusammenhang mit einem oder als ein Verfahrensschritt beschrieben wurden, auch eine Beschreibung eines entsprechenden Blocks oder Details oder Merkmals einer entsprechenden Vorrichtung dar. Einige oder alle der Verfahrensschritte können durch einen Hardware-Apparat (oder unter Verwendung eines Hardware-Apparats), wie zum Beispiel einen Mikroprozessor, einen programmierbaren Computer oder einer elektronischen Schaltung durchgeführt werden. Bei einigen Ausführungsbeispielen können einige oder mehrere der wichtigsten Verfahrensschritte durch einen solchen Apparat ausgeführt werden.Although some aspects have been described in the context of a device, it is to be understood that these aspects also represent a description of the corresponding method, so that a block or component of a device can also be understood as a corresponding method step or as a feature of a method step. Analogously, aspects described in the context of or as a method step also represent a description of a corresponding block or detail or feature of a corresponding device. Some or all of the method steps can be performed by a hardware apparatus (or using a hardware apparatus), such as a microprocessor, a programmable computer, or an electronic circuit. In some embodiments, some or more of the key method steps can be performed by such an apparatus.
Je nach bestimmten Implementierungsanforderungen können Ausführungsbeispiele der Erfindung in Hardware oder in Software oder zumindest teilweise in Hardware oder zumindest teilweise in Software implementiert sein. Die Implementierung kann unter Verwendung eines digitalen Speichermediums, beispielsweise einer Floppy-Disk, einer DVD, einer BluRay Disc, einer CD, eines ROM, eines PROM, eines EPROM, eines EEPROM oder eines FLASH-Speichers, einer Festplatte oder eines anderen magnetischen oder optischen Speichers durchgeführt werden, auf dem elektronisch lesbare Steuersignale gespeichert sind, die mit einem programmierbaren Computersystem derart zusammenwirken können oder zusammenwirken, dass das jeweilige Verfahren durchgeführt wird. Deshalb kann das digitale Speichermedium computerlesbar sein.Depending on particular implementation requirements, embodiments of the invention may be implemented in hardware or in software, or at least partially in hardware or at least partially in software. The implementation may be carried out using a digital storage medium, for example a floppy disk, a DVD, a BluRay disc, a CD, a ROM, a PROM, an EPROM, an EEPROM or a FLASH memory, a hard disk or another magnetic or optical memory on which electronically readable control signals are stored that can interact or interact with a programmable computer system in such a way that the respective method is carried out. Therefore, the digital storage medium may be computer readable.
Manche Ausführungsbeispiele gemäß der Erfindung umfassen also einen Datenträger, der elektronisch lesbare Steuersignale aufweist, die in der Lage sind, mit einem programmierbaren Computersystem derart zusammenzuwirken, dass eines der hierin beschriebenen Verfahren durchgeführt wird.Some embodiments according to the invention thus comprise a data carrier having electronically readable control signals capable of interacting with a programmable computer system such that one of the methods described herein is carried out.
Allgemein können Ausführungsbeispiele der vorliegenden Erfindung als Computerprogrammprodukt mit einem Programmcode implementiert sein, wobei der Programmcode dahin gehend wirksam ist, eines der Verfahren durchzuführen, wenn das Computerprogrammprodukt auf einem Computer abläuft.In general, embodiments of the present invention may be implemented as a computer program product having a program code, wherein the program code is operable to perform one of the methods when the computer program product is run on a computer.
Der Programmcode kann beispielsweise auch auf einem maschinenlesbaren Träger gespeichert sein.The program code can, for example, also be stored on a machine-readable medium.
Andere Ausführungsbeispiele umfassen das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren, wobei das Computerprogramm auf einem maschinen-lesbaren Träger gespeichert ist. Mit anderen Worten ist ein Ausführungsbeispiel des erfindungsgemäßen Verfahrens somit ein Computerprogramm, das einen Programmcode zum Durchführen eines der hierin beschriebenen Verfahren aufweist, wenn das Computerprogramm auf einem Computer abläuft.Other embodiments include the computer program for carrying out one of the methods described herein, wherein the computer program is stored on a machine-readable medium. In other words, an embodiment of the method according to the invention is thus a computer program that has a program code for carrying out one of the methods described herein when the computer program runs on a computer.
Ein weiteres Ausführungsbeispiel der erfindungsgemäßen Verfahren ist somit ein Datenträger (oder ein digitales Speichermedium oder ein computerlesbares Medium), auf dem das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren aufgezeichnet ist. Der Datenträger oder das digitale Speichermedium oder das computerlesbare Medium sind typischerweise greifbar und/oder nicht flüchtig.A further embodiment of the methods according to the invention is thus a data carrier (or a digital storage medium or a computer-readable medium) on which the computer program for carrying out one of the methods described herein is recorded. The data carrier or the digital storage medium or the computer-readable medium is typically tangible and/or non-transitory.
Ein weiteres Ausführungsbeispiel des erfindungsgemäßen Verfahrens ist somit ein Datenstrom oder eine Sequenz von Signalen, der bzw. die das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren darstellt bzw. darstellen. Der Datenstrom oder die Sequenz von Signalen kann bzw. können beispielsweise dahin gehend konfiguriert sein, über eine Datenkommunikationsverbindung, beispielsweise über das Internet, transferiert zu werden.A further embodiment of the method according to the invention is thus a data stream or a sequence of signals which represents the computer program for carrying out one of the methods described herein. The data stream or the sequence of signals can be configured, for example, to be transferred via a data communication connection, for example via the Internet.
Ein weiteres Ausführungsbeispiel umfasst eine Verarbeitungseinrichtung, beispielsweise einen Computer oder ein programmierbares Logikbauelement, die dahin gehend konfiguriert oder angepasst ist, eines der hierin beschriebenen Verfahren durchzuführen.A further embodiment comprises a processing device, for example a computer or a programmable logic device, which is configured or adapted to carry out one of the methods described herein.
Ein weiteres Ausführungsbeispiel umfasst einen Computer, auf dem das Computerprogramm zum Durchführen eines der hierin beschriebenen Verfahren installiert ist.A further embodiment comprises a computer on which the computer program for carrying out one of the methods described herein is installed.
Ein weiteres Ausführungsbeispiel gemäß der Erfindung umfasst eine Vorrichtung oder ein System, die bzw. das ausgelegt ist, um ein Computerprogramm zur Durchführung zumindest eines der hierin beschriebenen Verfahren zu einem Empfänger zu übertragen. DieA further embodiment according to the invention comprises a device or a system which is designed to transmit a computer program for carrying out at least one of the methods described herein to a receiver. The
Übertragung kann beispielsweise elektronisch oder optisch erfolgen. Der Empfänger kann beispielsweise ein Computer, ein Mobilgerät, ein Speichergerät oder eine ähnliche Vorrichtung sein. Die Vorrichtung oder das System kann beispielsweise einen Datei-Server zur Übertragung des Computerprogramms zu dem Empfänger umfassen.Transmission may be, for example, electronic or optical. The recipient may be, for example, a computer, a mobile device, a storage device or a similar device. The device or system may, for example, comprise a file server for transmitting the computer program to the recipient.
Bei manchen Ausführungsbeispielen kann ein programmierbares Logikbauelement (beispielsweise ein feldprogrammierbares Gatterarray, ein FPGA) dazu verwendet werden, manche oder alle Funktionalitäten der hierin beschriebenen Verfahren durchzuführen. Bei manchen Ausführungsbeispielen kann ein feldprogrammierbares Gatterarray mit einem Mikroprozessor zusammenwirken, um eines der hierin beschriebenen Verfahren durchzuführen. Allgemein werden die Verfahren bei einigen Ausführungsbeispielen seitens einer beliebigen Hardwarevorrichtung durchgeführt. Diese kann eine universell einsetzbare Hardware wie ein Computerprozessor (CPU) sein oder für das Verfahren spezifische Hardware, wie beispielsweise ein ASIC.In some embodiments, a programmable logic device (e.g., a field programmable gate array, an FPGA) may be used to perform some or all of the functionality of the methods described herein. In some embodiments, a field programmable gate array may interact with a microprocessor to perform any of the methods described herein. In general, in some embodiments, the methods are performed by any hardware device. This may be general-purpose hardware such as a computer processor (CPU) or hardware specific to the method such as an ASIC.
Die oben beschriebenen Ausführungsbeispiele stellen lediglich eine Veranschaulichung der Prinzipien der vorliegenden Erfindung dar. Es versteht sich, dass Modifikationen und Variationen der hierin beschriebenen Anordnungen und Einzelheiten anderen Fachleuten einleuchten werden. Deshalb ist beabsichtigt, dass die Erfindung lediglich durch den Schutzumfang der nachstehenden Patentansprüche und nicht durch die spezifischen Einzelheiten, die anhand der Beschreibung und der Erläuterung der Ausführungsbeispiele hierin präsentiert wurden, beschränkt sei.The above-described embodiments are merely illustrative of the principles of the present invention. It is understood that modifications and variations of the arrangements and details described herein will occur to others skilled in the art. Therefore, it is intended that the invention be limited only by the scope of the following claims and not by the specific details presented in the description and explanation of the embodiments herein.
-
Bodin Danielsson, C. & Bodin, L. (2009). Difference in satisfaction with office environment among employees in different office types. Journal of Architectural and Planning Research, 26 (3), 241-257 Bodin Danielsson, C. & Bodin, L. (2009). Difference in satisfaction with office environment among employees in different office types. Journal of Architectural and Planning Research, 26 (3), 241-257 -
Zuydervliet, R., Chanaud, R. & L'Esperance, A. (2008). Adaptive sound masking. The Journal of the Acoustical Society of America, 123 (5), 3195. https://doi.org/10.1121/1.2933335Zuydervliet, R., Chanaud, R. & L'Esperance, A. (2008). Adaptive sound masking. Journal of the Acoustical Society of America, 123 (5), 3195. https://doi.org/10.1121/1.2933335 -
Keus Van De Poll, Marijke, Carlsson, J., Marsh, J. E., Ljung, R., Odelius, J., Schlittmeier, S. J. et al. (2015). Unmasking the effects of masking on performance. The potential of multiple-voice masking in the office environment. The Journal of the Acoustical Society of America, 138 (2), 807-816. https://doi.org/10.1121/1.4926904Keus Van De Poll, Marijke, Carlsson, J., Marsh, J. E., Ljung, R., Odelius, J., Schlittmeier, S. J. et al. (2015). Unmasking the effects of masking on performance. The potential of multiple voice masking in the office environment. Journal of the Acoustical Society of America, 138 (2), 807-816. https://doi.org/10.1121/1.4926904 -
Huang, Y.-H., Robertson, M. M. & Chang, K.-I. (2004). The Role of Environmental Control on Environmental Satisfaction, Communication, and Psychological Stress. Effects of Office Ergonomics Training. ENVIRON BEHAV (Environment and behavior), 36 (5), 617-637. https://doi.org/10.1177/0013916503262543Huang, Y.-H., Robertson, M. M. & Chang, K.-I. (2004). The role of environmental control on environmental satisfaction, communication, and psychological stress. Effects of office ergonomics training. ENVIRON BEHAV (Environment and behavior), 36 (5), 617-637. https://doi.org/10.1177/0013916503262543 -
Lee, S. Y. & Brand, J. L. (2010). Can personal control over the physical environment ease distractions in Office workplaces? Ergonomics, 53 (3), 324-335. https://doi.org/10.1080/00140130903389019Lee, S. Y. & Brand, J. L. (2010). Can personal control over the physical environment ease distractions in office workplaces? Ergonomics, 53 (3), 324-335. https://doi.org/10.1080/00140130903389019 -
Schlittmeier, S. J. & Hellbrück, J. (2009). Background music as noise abatement in open-plan offices. A laboratory study on performance effects and subjective preferences. APPL COGNITIVE PSYCH (Applied cognitive psychology), 23 (5), 684-697. https://doi.org/10.1002/acp.1498Schlittmeier, S. J. & Hellbrück, J. (2009). Background music as noise abatement in open-plan offices. A laboratory study on performance effects and subjective preferences. APPL COGNITIVE PSYCH (Applied cognitive psychology), 23 (5), 684-697. https://doi.org/10.1002/acp.1498 -
Hongistob, V., Varjo, J., Oliva, D., Haapakangas, A. & Benway, E. (2017). Perception of water-based masking sounds-long-term experiment in an open-plan office. FRONT PSYCHOL (Frontiers in psychology), 8. https://doi.org/10.3389/fpsyg.2017.01177Hongistob, V., Varjo, J., Oliva, D., Haapakangas, A. & Benway, E. (2017). Perception of water-based masking sounds-long-term experiment in an open-plan office. FRONT PSYCHOL (Frontiers in psychology), 8. https://doi.org/10.3389/fpsyg.2017.01177 -
Veitch, J., Bradley, J., Legault, L., Norcross, S. & Svec, J. (2002). Masking speech in open-plan offices with simulation Ventilation noise. Noise level and spectral composition effects on acoustic satisfaction. Institute for Research in Construction Veitch, J., Bradley, J., Legault, L., Norcross, S. & Svec, J. (2002). Masking speech in open-plan offices with simulated ventilation noise. Noise level and spectral composition effects on acoustic satisfaction. Institute for Research in Construction -
Wang, Y., Drotleff, H. A. & Li, P. (2012). Multiple maskers for speech masking in open-plan offices. The Journal of the Acoustical Society of America, 131 (4), 3481. https://doi.org/10.1121/1.4709135Wang, Y., Drotleff, H. A. & Li, P. (2012). Multiple maskers for speech masking in open-plan offices. Journal of the Acoustical Society of America, 131 (4), 3481. https://doi.org/10.1121/1.4709135 -
Haapakangas, A., Kankkunen, E., Hongisto, V., Virjonen, P., Oliva, D. & Keskinen, E. (2011). Effects of five speech masking sounds on performance and acoustic satisfaction. implications for open-plan offices. ACTA ACUST UNITED AC (Acta acustica united with Acustica), 97 (4), 641-655. https://doi.org/10.3813/AAA.918444Haapakangas, A., Kankkunen, E., Hongisto, V., Virjonen, P., Oliva, D. & Keskinen, E. (2011). Effects of five speech masking sounds on performance and acoustic satisfaction. implications for open-plan offices. ACTA ACUST UNITED AC (Acta acustica united with Acustica), 97 (4), 641-655. https://doi.org/10.3813/AAA.918444 -
Chanaud, R. C. (2007). Progress in Sound Masking. Acoustics today, 3 (4), 21-26. https://doi.org/10.1121/1.2961158Chanaud, R. C. (2007). Sound masking technology. Acoustics today, 3 (4), 21-26. https://doi.org/10.1121/1.2961158 -
L'Esperance, A., Boudreau, A., Gariepy, F., Boudreault, L.-A. & Mackenzie, R. (2017). Adaptive Volume Control for Sound Masking Systems. How It Works and Analysis of Performance. INTER-NOISE and NOISE-CON Congress and Conference Proceedings, 254 (2), 678-686. Verfügbar unter: https://www.ingentaconnect.eom/content/ince/incecp/2017/00000254/00000002/art00083L'Esperance, A., Boudreau, A., Gariepy, F., Boudreault, L.-A. & Mackenzie, R. (2017). Adaptive volume control for sound masking systems. How It Works and Analysis of Performance. INTER-NOISE and NOISE-CON Congress and Conference Proceedings, 254 (2), 678-686. Available at: https://www.ingentaconnect.eom/content/ince/incecp/2017/00000254/00000002/art00083 -
Cohen, S. (1980). Aftereffects of stress on human performance and social behavior. A review of research and theory. Psychological bulletin, 88 (1), 82-108. https://doi.org/10.1037/0033-2909.88.1.82Cohen, S. (1980). Aftereffects of stress on human performance and social behavior. A review of research and theory. Psychological bulletin, 88 (1), 82-108. https://doi.org/10.1037/0033-2909.88.1.82 -
Quick, T. L. (1990). Healthy Work. Stress, Productivity, and the Reconstruction of Working Life. National Productivity Review, 9, 475+. Verfügbar unter: https://link.gale.com/apps/doc/A8933314/AONE?u=anon~d59bbb41&sid=googleScholar& xid=389d3050Quick, T. L. (1990). HealthyWork. Stress, productivity, and the reconstruction of working life. National Productivity Review, 9, 475+. Available at: https://link.gale.com/apps/doc/A8933314/AONE?u=anon~d59bbb41&sid=googleScholar& xid=389d3050 -
Renz, T. (2019). Personalised sound masking in open offices. A trade-off between annoyance and restoration of working memory performance? Stuttgart: Fraunhofer Verl, Stuttgart Renz, T. (2019). Personalised sound masking in open offices. A trade-off between annoyance and restoration of working memory performance? Stuttgart: Fraunhofer Institute for Applied Mathematics, Stuttgart -
Renz, T., Leistner, P. & Liebl, A. (Hrsg.). (2018). A simple model to predict the cognitive performance in distracting background speech Renz, T., Leistner, P. & Liebl, A. (Eds.). (2018). A simple model to predict cognitive performance in distracting background speech -
US 2003/103632 A1 US 2003/103632 A1 -
CN 110362789 A, veröffentlicht 2019 CN 110362789 A, published 2019 -
US 2015/194144 A1 Directional Sound Masking, veröffentlicht 2015 US 2015/194144 A1 Directional Sound Masking, published 2015
Claims (15)
wobei der Maskiersignalerzeuger (120) ausgebildet ist, das Maskiersignal zu bestimmen, indem für jeden Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen, abhängig von der Mikrofonsignal-Schallpegeldifferenz dieses Signalanteils, einen Pegelwert für eine frequenzbandbegrenzte Komponente des Maskiersignals, die einem Frequenzbereich dieses Signalanteils entspricht, zu bestimmen, und eine Pegelanpassung dieser frequenzbandbegrenzten Komponente des Maskiersignals mittels dieses Pegelwerts vorzunehmen.Device according to claim 2,
wherein the masking signal generator (120) is designed to determine the masking signal by determining for each signal component of the plurality of frequency band-limited signal components, depending on the microphone signal sound level difference of this signal portion, to determine a level value for a frequency-band-limited component of the masking signal which corresponds to a frequency range of this signal portion, and to carry out a level adjustment of this frequency-band-limited component of the masking signal by means of this level value.
wobei der Analysator (110) ausgebildet ist, jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals abhängig von einem rückgekoppelten zeitlichen Abschnitt des Maskiersignals zu diesem frequenzbandbegrenzten Signalanteil zu bestimmen.Device according to claim 4,
wherein the analyzer (110) is designed to evaluate each frequency band-limited signal component of the plurality of frequency band-limited signal components of the total signal depending on a feedback temporal section of the masking signal to this frequency band-limited signal component.
wobei der Analysator (110) ausgebildet ist, jeden der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals abhängig von einem Dämpfungsfaktor für diesen frequenzbandbegrenzten Signalanteil des Gesamtsignals zu bestimmen, wobei der Analysator (110) ausgebildet ist, den Dämpfungsfaktor für diesen frequenzbandbegrenzten Signalanteil auf dem entsprechenden frequenzbandbegrenzten Signalanteil des Mikrofons anzuwenden, um ein gedämpftes Mikrofonsignal zu diesem frequenzbandbegrenzten Signalanteil zu erhalten.Device according to claim 4 or 5,
wherein the analyzer (110) is designed to determine each of the plurality of frequency-band-limited signal components of the overall signal depending on an attenuation factor for this frequency-band-limited signal component of the overall signal, wherein the analyzer (110) is designed to apply the attenuation factor for this frequency-band-limited signal component to the corresponding frequency-band-limited signal component of the microphone in order to obtain an attenuated microphone signal for this frequency-band-limited signal component.
wobei der Analysator (110) ausgebildet ist, jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals als Summe des rückgekoppelten zeitlichen Abschnitt des Maskiersignals zu diesem frequenzbandbegrenzten Signalanteil und des gedämpftes Mikrofonsignals zu diesem frequenzbandbegrenzten Signalanteil zu bestimmen.Device according to claim 5 and claim 6,
wherein the analyzer (110) is designed to determine each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the overall signal as the sum of the fed-back temporal portion of the masking signal to this frequency-band-limited signal component and of the attenuated microphone signal to this frequency-band-limited signal component.
wobei der Maskiersignalerzeuger (120) ausgebildet ist, das Maskiersignal abhängig von einem Korrekturwert für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Gesamtsignals zu bestimmen, wobei der Maskiersignalerzeuger (120) ausgebildet ist, den Korrekturwert für diesen frequenzbandbegrenzten Signalanteil abhängig vom dem Fehlerwert für diesen frequenzbandbegrenzten Signalanteil zu bestimmen.Device according to one of claims 4 to 7,
wherein the masking signal generator (120) is designed to determine the masking signal as a function of a correction value for each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the overall signal, wherein the masking signal generator (120) is designed to determine the correction value for this frequency-band-limited signal component as a function of the error value for this frequency-band-limited signal component.
wobei der Maskiersignalerzeuger (120) des Weiteren ausgebildet ist, den Korrekturwert für diesen frequenzbandbegrenzten Signalanteil abhängig von einem zeitlichen Vorgängerwert dieses Korrekturwerts zu bestimmen.Device according to claim 8,
wherein the masking signal generator (120) is further designed to determine the correction value for this frequency band-limited signal component depending on a temporal predecessor value of this correction value.
wobei der Maskiersignalerzeuger (120) ausgebildet ist, das Maskiersignal abhängig von einem Stellwert für jeden frequenzbandbegrenzten Signalanteil der Mehrzahl von frequenzbandbegrenzten Signalanteilen des Mikrofonsignals zu bestimmen, wobei der Maskiersignalerzeuger (120) ausgebildet ist, den Stellwert für diesen frequenzbandbegrenzten Signalanteil abhängig von der Mikrofonsignal-Schallpegeldifferenz dieses frequenzbandbegrenzten Signalanteils und abhängig von dem Fehlerwert und von dem Korrekturwert dieses frequenzbandbegrenzten Signalanteils des Gesamtsignals zu bestimmen.Device according to one of the preceding claims, wherein the device is a device according to claim 2 and claim 4 and claim 9,
wherein the masking signal generator (120) is designed to determine the masking signal as a function of a control value for each frequency-band-limited signal component of the plurality of frequency-band-limited signal components of the microphone signal, wherein the masking signal generator (120) is designed to determine the control value for this frequency-band-limited signal component as a function of the microphone signal sound level difference of this frequency-band-limited signal component and as a function of the error value and the correction value of this frequency-band-limited signal component of the overall signal.
wobei der Maskiersignalerzeuger (120) ausgebildet ist, den Stellwert für diesen frequenzbandbegrenzten Signalanteil durch Bildung einer Summe der Mikrofonsignal-Schallpegeldifferenz dieses frequenzbandbegrenzten Signalanteils und des Fehlerwerts und des Korrekturwerts dieses frequenzbandbegrenzten Signalanteils des Gesamtsignals zu bestimmen.Device according to claim 11,
wherein the masking signal generator (120) is designed to determine the control value for this frequency band-limited signal component by forming a sum of the microphone signal sound level difference of this frequency band-limited signal component and the error value and the correction value of this frequency band-limited signal component of the total signal.
wobei der Maskiersignalerzeuger (120) ausgebildet ist, den Pegelwert für eine frequenzbandbegrenzte Komponente des Maskiersignals, abhängig von dem Stellwert für diesen frequenzbandbegrenzten Signalanteil und abhängig von einem vorangegangenen Pegelwert für diese frequenzbandbegrenzte Komponente des Maskiersignals zu bestimmen.Device according to claim 11 or 12, wherein the device is a device according to claim 3,
wherein the masking signal generator (120) is designed to determine the level value for a frequency band-limited component of the masking signal as a function of the control value for this frequency band-limited signal component and as a function of a preceding level value for this frequency band-limited component of the masking signal.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP22205855.4A EP4365890A1 (en) | 2022-11-07 | 2022-11-07 | Adaptive harmonic speech masking sound generation apparatus and method |
PCT/EP2023/080738 WO2024099913A1 (en) | 2022-11-07 | 2023-11-03 | Device and method for adaptive, harmonic voice masking sound generation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP22205855.4A EP4365890A1 (en) | 2022-11-07 | 2022-11-07 | Adaptive harmonic speech masking sound generation apparatus and method |
Publications (1)
Publication Number | Publication Date |
---|---|
EP4365890A1 true EP4365890A1 (en) | 2024-05-08 |
Family
ID=84330133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP22205855.4A Pending EP4365890A1 (en) | 2022-11-07 | 2022-11-07 | Adaptive harmonic speech masking sound generation apparatus and method |
Country Status (2)
Country | Link |
---|---|
EP (1) | EP4365890A1 (en) |
WO (1) | WO2024099913A1 (en) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4438526A (en) * | 1982-04-26 | 1984-03-20 | Conwed Corporation | Automatic volume and frequency controlled sound masking system |
US5260980A (en) * | 1990-08-24 | 1993-11-09 | Sony Corporation | Digital signal encoder |
US20030103632A1 (en) | 2001-12-03 | 2003-06-05 | Rafik Goubran | Adaptive sound masking system and method |
US20150194144A1 (en) | 2012-07-24 | 2015-07-09 | Koninklijke Philips N.V. | Directional sound masking |
US20150256930A1 (en) * | 2014-03-10 | 2015-09-10 | Yamaha Corporation | Masking sound data generating device, method for generating masking sound data, and masking sound data generating system |
WO2016172446A1 (en) * | 2015-04-24 | 2016-10-27 | Rensselaer Polytechnic Institute | Sound masking in open-plan spaces using natural sounds |
CN110362789A (en) | 2019-07-19 | 2019-10-22 | 上海市环境科学研究院 | A kind of adaptive sound masking system and method based on GPR model |
US10607591B1 (en) * | 2019-08-06 | 2020-03-31 | Unlimiter Mfa Co., Ltd. | Sound playback device and method for masking interference sound through noise masking signal thereof |
-
2022
- 2022-11-07 EP EP22205855.4A patent/EP4365890A1/en active Pending
-
2023
- 2023-11-03 WO PCT/EP2023/080738 patent/WO2024099913A1/en unknown
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4438526A (en) * | 1982-04-26 | 1984-03-20 | Conwed Corporation | Automatic volume and frequency controlled sound masking system |
US5260980A (en) * | 1990-08-24 | 1993-11-09 | Sony Corporation | Digital signal encoder |
US20030103632A1 (en) | 2001-12-03 | 2003-06-05 | Rafik Goubran | Adaptive sound masking system and method |
US20150194144A1 (en) | 2012-07-24 | 2015-07-09 | Koninklijke Philips N.V. | Directional sound masking |
US20150256930A1 (en) * | 2014-03-10 | 2015-09-10 | Yamaha Corporation | Masking sound data generating device, method for generating masking sound data, and masking sound data generating system |
WO2016172446A1 (en) * | 2015-04-24 | 2016-10-27 | Rensselaer Polytechnic Institute | Sound masking in open-plan spaces using natural sounds |
CN110362789A (en) | 2019-07-19 | 2019-10-22 | 上海市环境科学研究院 | A kind of adaptive sound masking system and method based on GPR model |
US10607591B1 (en) * | 2019-08-06 | 2020-03-31 | Unlimiter Mfa Co., Ltd. | Sound playback device and method for masking interference sound through noise masking signal thereof |
Non-Patent Citations (16)
Title |
---|
"A simple model to predict the cognitive performance in distracting background speech", 2018 |
BODIN DANIELSSON, C.BODIN, L.: "Difference in satisfaction with office environment among employees in different office types", JOURNAL OF ARCHITECTURAL AND PLANNING RESEARCH, vol. 26, no. 3, 2009, pages 241 - 257 |
CHANAUD, R. C.: "Progress in Sound Masking", ACOUSTICS TODAY, vol. 3, no. 4, 2007, pages 21 - 26, Retrieved from the Internet <URL:https://doi.org/10.1121/1.2961158> |
COHEN, S.: "Aftereffects of stress on human performance and social behavior. A review of research and theory", PSYCHOLOGICAL BULLETIN, vol. 88, no. 1, 1980, pages 82 - 108, Retrieved from the Internet <URL:https://doi.org/10.1037/0033-2909.88.1.82> |
HAAPAKANGAS, A., KANKKUNEN, E., HONGISTO, V., VIRJONEN, P., OLIVA, D., KESKINEN, E.: "Effects of five speech masking sounds on performance and acoustic satisfaction. implications for open-plan offices", ACTA ACUST UNITED AC (ACTA ACUSTICA UNITED WITH ACUSTICA, vol. 97, no. 4, 2011, pages 641 - 655, Retrieved from the Internet <URL:https://doi.org/10.3813/AAA.918444> |
HONGISTOB, V.VARJO, J.OLIVA, D.HAAPAKANGAS, A.BENWAY, E.: "Perception of water-based masking sounds-long-term experiment in an open-plan office", FRONT PSYCHOL (FRONTIERS IN PSYCHOLOGY, 2017, pages 8, Retrieved from the Internet <URL:https://doi.org/10.3389/fpsyg.2017.01177> |
HUANG, Y.-H.ROBERTSON, M. M.CHANG, K.-I.: "The Role of Environmental Control on Environmental Satisfaction, Communication, and Psychological Stress. Effects of Office Ergonomics Training", ENVIRON BEHAV (ENVIRONMENT AND BEHAVIOR, vol. 36, no. 5, 2004, pages 617 - 637, Retrieved from the Internet <URL:https://doi.org/10.1177/0013916503262543> |
KEUS VAN DE POLL, MARIJKECARLSSON, J.MARSH, J. E.LJUNG, R.ODELIUS, J.SCHLITTMEIER, S. J. ET AL.: "Unmasking the effects of masking on performance. The potential of multiple-voice masking in the office environment", THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 138, no. 2, 2015, pages 807 - 816, XP012199732, Retrieved from the Internet <URL:https://doi.org/10.1121/1.4926904> DOI: 10.1121/1.4926904 |
LEE, S. Y.BRAND, J. L.: "Can personal control over the physical environment ease distractions in Office workplaces?", ERGONOMICS, vol. 53, no. 3, 2010, pages 324 - 335, Retrieved from the Internet <URL:https://doi.org/10.1080/00140130903389019> |
L'ESPERANCE, A.BOUDREAU, A.GARIEPY, F.BOUDREAULT, L.-A.MACKENZIE, R.: "Adaptive Volume Control for Sound Masking Systems. How It Works and Analysis of Performance", INTER-NOISE AND NOISE-CON CONGRESS AND CONFERENCE PROCEEDINGS, vol. 254, no. 2, 2017, pages 678 - 686, Retrieved from the Internet <URL:https://www.ingentaconnect.com/content/ince/incecp/2017/00000254/00000002/art00083> |
QUICK, T. L.: "Healthy Work. Stress, Productivity, and the Reconstruction of Working Life", NATIONAL PRODUCTIVITY REVIEW, vol. 9, 1990, pages 475, Retrieved from the Internet <URL:https://link.gale.com/apps/doc/A8933314/AONE?u=anon-d59bbb41&sid=googleScholar&xid=389d3050> |
RENZ, T.: "Personalised sound masking in open offices. A trade-off between annoyance and restoration of working memory performance?", STUTTGART: FRAUNHOFER VERL, 2019 |
SCHLITTMEIER, S. J.HELLBRÜCK, J.: "Background music as noise abatement in open-plan offices. A laboratory study on performance effects and subjective preferences", APPL COGNITIVE PSYCH (APPLIED COGNITIVE PSYCHOLOGY, vol. 23, no. 5, 2009, pages 684 - 697, Retrieved from the Internet <URL:https://doi.org/10.1002/acp.1498> |
VEITCH, J.BRADLEY, J.LEGAULT, L.NORCROSS, S.SVEC, J.: "Masking speech in open-plan offices with simulation Ventilation noise. Noise level and spectral composition effects on acoustic satisfaction", INSTITUTE FOR RESEARCH IN CONSTRUCTION, 2002 |
WANG, Y.DROTLEFF, H. A.LI, P.: "Multiple maskers for speech masking in open-plan offices", THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 131, no. 4, 2012, pages 3481, Retrieved from the Internet <URL:https://doi.org/10.1121/1.4709135> |
ZUYDERVLIET, R.CHANAUD, R.L'ESPERANCE, A.: "Adaptive sound masking", THE JOURNAL OF THE ACOUSTICAL SOCIETY OF AMERICA, vol. 123, no. 5, 2008, pages 3195, Retrieved from the Internet <URL:https://doi.org/10.1121/1.2933335> |
Also Published As
Publication number | Publication date |
---|---|
WO2024099913A1 (en) | 2024-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1143416B1 (en) | Time domain noise reduction | |
DE102007031677B4 (en) | Method and apparatus for determining a room acoustic impulse response in the time domain | |
Humes et al. | Models of the additivity of masking | |
DE69933141T2 (en) | TONE PROCESSOR FOR ADAPTIVE DYNAMIC RANGE IMPROVEMENT | |
EP3520441B1 (en) | Active suppression of the occlusion effect in hearing aids | |
DE60205232T2 (en) | METHOD AND DEVICE FOR DETERMINING THE QUALITY OF A LANGUAGE SIGNAL | |
EP1977626A1 (en) | Method for recording and reproducing a sound source with time-variable directional characteristics | |
EP2919652B1 (en) | Processing of audio signals for a tinnitus therapy | |
DE102020114146A1 (en) | SPEAKER IMAGE OF A MICROPHONE FOR WIND DETECTION | |
EP3454572A1 (en) | Method for detection of a defect in a listening instrument | |
EP1808853B1 (en) | Public address system, method and computer program to enhance the speech intelligibility of spoken messages | |
DE102017200597B4 (en) | Method for operating a hearing system and hearing system | |
DE112020005166B4 (en) | PARTICIPANT-TUNED FILTERING USING DYNAMIC SPECTRAL MASKING BY A DEEP NEURAL NETWORK TO ISOLATE AND SECURE CONVERSATIONS IN NOISY ENVIRONMENTS | |
EP3793218B1 (en) | Hearing device and method for operating a hearing device | |
EP4365890A1 (en) | Adaptive harmonic speech masking sound generation apparatus and method | |
DE102016207936A1 (en) | Method for operating a hearing device | |
EP1351550B1 (en) | Method for adapting a signal amplification in a hearing aid and a hearing aid | |
DE102020107620B3 (en) | System and method to compensate for the occlusion effect in headphones or hearing aids with improved perception of one's own voice | |
DE102012204193B4 (en) | Audio processor and method for amplifying or attenuating a received audio signal | |
EP3944635B1 (en) | Method for operating a hearing system, hearing system, hearing aid | |
EP1359437A1 (en) | Method for determining a position of a user of a communication terminal | |
Völk | Between Engineering and Hearing Research: Auditory Models in Product Development | |
DE10361954B4 (en) | Hearing system and method for setting such a method for the detection of characteristic sound spectra, and corresponding computer programs and corresponding computer-readable storage media | |
DE102022212035A1 (en) | Method for operating a hearing aid and hearing aid | |
DE102014107616B4 (en) | System and procedure for reducing speech intelligibility |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE APPLICATION HAS BEEN PUBLISHED |
|
AK | Designated contracting states |
Kind code of ref document: A1 Designated state(s): AL AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HR HU IE IS IT LI LT LU LV MC ME MK MT NL NO PL PT RO RS SE SI SK SM TR |