WO2011155196A1 - 語音聴取の評価システム、その方法およびそのプログラム - Google Patents

語音聴取の評価システム、その方法およびそのプログラム Download PDF

Info

Publication number
WO2011155196A1
WO2011155196A1 PCT/JP2011/003236 JP2011003236W WO2011155196A1 WO 2011155196 A1 WO2011155196 A1 WO 2011155196A1 JP 2011003236 W JP2011003236 W JP 2011003236W WO 2011155196 A1 WO2011155196 A1 WO 2011155196A1
Authority
WO
WIPO (PCT)
Prior art keywords
speech
sound
user
presented
determination unit
Prior art date
Application number
PCT/JP2011/003236
Other languages
English (en)
French (fr)
Inventor
信夫 足立
幸治 森川
加藤 弓子
和紀 小塚
Original Assignee
パナソニック株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パナソニック株式会社 filed Critical パナソニック株式会社
Priority to JP2012519255A priority Critical patent/JP5144836B2/ja
Priority to CN201180011703.9A priority patent/CN102781322B/zh
Publication of WO2011155196A1 publication Critical patent/WO2011155196A1/ja
Priority to US13/561,336 priority patent/US9044157B2/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/369Electroencephalography [EEG]
    • A61B5/377Electroencephalography [EEG] using evoked responses
    • A61B5/38Acoustic or auditory stimuli

Definitions

  • the present invention relates to a technique for evaluating whether or not a user has been able to listen to speech comfortably. More specifically, the present invention relates to comfort in listening to speech for "fitting" in a hearing aid or the like for adjusting the amount of amplification for each frequency of sound to obtain a sound of an appropriate magnitude for each user. The present invention relates to a comfort evaluation system for listening to speech that evaluates the degree of speech.
  • a hearing aid is a device that compensates for a user's decreased hearing by amplifying the amplitude of a signal of a specific frequency among various frequencies that constitute a sound that is difficult for the user to hear.
  • the amount of sound amplification that the user seeks from the hearing aid varies depending on the degree of hearing loss for each user. Therefore, before starting to use the hearing aid, “fitting” that first adjusts the amount of sound amplification in accordance with the hearing ability of each user is essential.
  • Fitting is performed with the aim of setting the output sound pressure (atmospheric pressure fluctuation, which can be perceived as sound) for each frequency of the hearing aid to MCL (most comfortable level: the sound pressure level that the user feels comfortable).
  • MCL most comfortable level: the sound pressure level that the user feels comfortable.
  • the first procedure of fitting is audiogram measurement.
  • the “audiogram” is a result of evaluating a threshold that is the minimum sound pressure of a pure tone that can be heard. For example, for each of a plurality of frequencies, the minimum sound pressure level (decibel value) that the user can hear is plotted according to the frequency (for example, 250 Hz, 500 Hz, 1000 Hz, 2000 Hz, 4000 Hz). .
  • the amplification amount for each frequency is determined based on the fitting theory that is a function for estimating the amplification amount for each frequency from the audiogram result.
  • the audiogram does not have a one-to-one correspondence with the ability to distinguish between conversations, and the difficulty of adjustment because the hearing-impaired person has a narrow sound pressure range that feels appropriate.
  • a hearing aid conformity inspection is carried out using the hearing aid determined and adjusted by the above method (for example, see Non-Patent Document 1).
  • a single syllable speech sound is presented with sound pressures of 55 dB SPL (Sound pressure level), 65 dB SPL, 75 dB SPL and 85 dB SPL when hearing aid is worn and when hearing aid is not worn (bare ear). Plot the speech intelligibility for each sound pressure level and compare. Then, if the clarity is improved at the time of wearing as compared with the case of non-wearing, it is determined as conforming.
  • Speech intelligibility refers to the degree of whether or not a single syllable speech sound has been heard. Speech intelligibility reflects the degree of discrimination during conversation.
  • the “single syllable word sound” indicates one vowel or a combination of a consonant and a vowel (for example, “a” / “da” / “shi”).
  • Speech intelligibility is evaluated by the following procedure (for example, Non-Patent Document 2).
  • the 67S-type word table (20-word sound) established by the Japan Audiological Society is played one by one and sent to the user.
  • the user is made to answer by using a method such as utterance or writing, as to which speech has been heard.
  • the speech sound presented by the evaluator is compared with the answer, and the correct answer rate, which is the proportion of the speech sound that is correctly heard out of all 20 speech sounds, is calculated.
  • the correct answer rate is speech intelligibility.
  • Patent Document 1 discloses a speech intelligibility evaluation method that automatically performs correct / incorrect determination using a personal computer (PC).
  • PC personal computer
  • a single syllable voice is presented to a user using a PC, the user is made to answer with a mouse or a pen touch (touch the pen to the display), an answer is accepted as an input of the PC,
  • By receiving an answer input with a mouse or pen touch it is not necessary for the evaluator to identify / decipher the user's answer (speech or writing), and the effort of the evaluator is reduced.
  • Patent Document 2 discloses a speech intelligibility evaluation method that presents a selection candidate of speech corresponding to a speech after speech presentation.
  • the number of selection candidates is narrowed down to several, and the user's trouble of searching for a character is reduced by selecting a corresponding word sound from among several characters.
  • Non-patent Document 2 In the measurement of the permissible level of environmental noise, it is evaluated whether or not the environmental noise is acceptable when the reading sound and the environmental noise are simultaneously presented and the reading sound is heard (Non-patent Document 2). Specifically, the reading sound is presented at 65 dB SPL and the environmental noise is presented at 55 dB SPL, and a subjective impression regarding whether the environmental noise is acceptable is reported. A subjective impression is that either hearing aids can be used when listening to reading sounds under noise, or wearing a hearing aid under noise is difficult to report. Then, the former case is determined as conforming, and the latter case is determined as nonconforming.
  • the conformity state is determined based only on the speech intelligibility, and it has not been considered whether the speech listening has been comfortable. For this reason, even when the comfort of listening to the speech sound is low, if the clarity is high when the hearing aid is worn compared to when not wearing it, the hearing aid is evaluated as suitable hearing aid processing.
  • the environmental noise tolerance level it was evaluated whether or not the environmental noise was acceptable, and no evaluation was made regarding the comfort of listening to the speech itself. In these evaluations, there is a case where it is determined that the hearing aid process is suitable even if it is a hearing aid process that is easy to get tired because of low comfort of listening to the speech. Low comfort is a burden for users who wear hearing aids on a daily basis.
  • An object of the present invention is to realize a speech sound listening comfort evaluation system that evaluates a user state related to speech sound listening comfort.
  • the evaluation system for listening to speech is a presentation that determines a speech of a single syllable to be presented with reference to a biological signal measurement unit that measures a user's brain wave signal and a speech database that stores a plurality of speech of a single syllable.
  • a speech sound determination unit an output unit that sequentially presents the determined speech sound as an auditory stimulus to the user, and an event related to the electroencephalogram signal included in a range of 600 ms to 900 ms starting from the time when the speech sound was presented It is determined whether or not a positive component has appeared in the potential, and a positive component determination unit that outputs an evaluation result as to whether or not the user is listening to the word sound according to the determination result; It is determined whether or not a negative component has appeared in the event-related potential of the electroencephalogram signal included in the range of 100 ms to 300 ms starting from the presented time. User and a negative component determination section for outputting a result of the evaluation about whether or not they feel noisy the speech.
  • the evaluation system further includes an event-related potential processing unit that adds and averages event-related potentials of the electroencephalogram signal, and the event-related potential processing unit has a sound pressure level when the word sound is presented and a sound pressure level is presented.
  • the event-related potentials of the electroencephalogram signals obtained when words belonging to the same classification are presented may be averaged.
  • the positive component determination unit is positive when the interval average potential of the event-related potential of the electroencephalogram signal included in the range of 600 ms to 900 ms starting from the time when each word sound is presented is equal to or higher than a predetermined first threshold. It may be determined that a component is present, and if the interval average potential is smaller than the first threshold, it may be determined that no positive component is present.
  • the positive component determination unit determines that the positive component is present, the positive component determination unit outputs an evaluation result that the user is making an effort to listen to the word sound.
  • the positive component determination unit determines that the positive component is not present, An evaluation result that the user is listening to the speech without effort may be output.
  • the negative component determination unit determines that there is a negative component when the peak of the negative component existing in the range of 100 ms or more and 300 ms or less from the time when each word sound is presented is shorter than a predetermined second threshold value.
  • the negative component may be determined to be absent when the negative component peak is equal to or greater than the second threshold.
  • the negative component determination unit determines that the negative component is present, the negative component determination unit outputs an evaluation result indicating that the user feels noisy, and when the negative component is determined not to exist, the user An evaluation result indicating that the speech is not felt loud may be output.
  • the speech sound database may store, for each of a plurality of speech sounds, a group related to voice, consonant information, and the probability of occurrence of abnormal hearing in association with each other.
  • the evaluation system further includes a result accumulation database that accumulates determination results of the positive component determination unit and the negative component determination unit, and the result accumulation database is positive by the positive component determination unit with respect to at least one sound pressure level.
  • a result accumulation database that accumulates determination results of the positive component determination unit and the negative component determination unit, and the result accumulation database is positive by the positive component determination unit with respect to at least one sound pressure level.
  • the result accumulation database whether or not the user is making an effort to listen to the speech sound for each speech sound, consonant sound, or group related to the probability of occurrence of abnormal hearing, and the user feels noisy the speech sound. Information for evaluating whether or not it is present may be accumulated.
  • the result accumulation database is information for evaluating whether or not the user is making an effort to listen to the word sound and whether or not the user feels the noisy sound for each word sound and sound pressure level. May be accumulated.
  • the presenting speech sound determining unit may determine the sound pressure level of the presenting voice.
  • the evaluation system selects a type of hearing aid processing for the speech to be presented that is determined by the presented speech sound determination unit, and processes the speech data held in the speech database based on the selected hearing aid processing
  • a processing unit may be further provided.
  • the evaluation system further includes a result accumulation database that accumulates the determination results of the positive component determination unit and the negative component determination unit, and the user stores the word sound for each word sound and for each hearing aid process in the result accumulation database. Information may be accumulated for evaluating whether or not the user is making an effort and whether or not the user feels the speech sound noisy.
  • the evaluation device for listening to speech refers to a speech database that stores a plurality of speech of single syllables and presents a speech determination unit that determines speech of single syllables to be sequentially presented to the user as an auditory stimulus from the output unit.
  • the event-related potential of the electroencephalogram signal included in the range of 600 ms to 900 ms starting from the time when the word sound was presented.
  • the positive component determination unit that determines whether or not a positive component has appeared, and the biological signal measurement unit that measures the user's electroencephalogram signal, and the time when the word sound measured by the user is presented is 100 ms to 300 ms.
  • a negative component determination unit that determines whether or not a negative component has appeared in the event-related potential of the electroencephalogram signal included in the range.
  • the method for evaluating speech listening includes a step of measuring a user's brain wave signal, a step of determining a speech of a single syllable to be presented with reference to a speech database holding a plurality of speech of a single syllable, A positive component appears in the event-related potential of the electroencephalogram signal included in the range of 600 ms to 900 ms starting from the time when the word sound was presented, A step of determining whether or not the user has listened to the speech according to the determination result, a step of outputting an evaluation result of whether or not the user is listening to the speech, and a time of 100 ms from the time when the speech is presented Determining whether a negative component has appeared in the event-related potential of the electroencephalogram signal included in the range of 300 ms or less, and depending on the determination result Includes a step of the user and outputs the result of the evaluation about whether or not they feel noisy the speech.
  • the computer program according to the present invention is a computer program executed by a computer provided in the speech intelligibility evaluation system, and the computer program is a measured user for a computer installed in the speech intelligibility evaluation system.
  • a step of outputting a result a step of determining whether a negative component has appeared in the event-related potential of the electroencephalogram signal included in a range of 100 ms to 300 ms starting from the time when the speech sound was presented, and a determination result
  • how much effort has been made for listening to speech (effort), depending on the presence or absence of a positive component with a latency of about 750 ms and a negative component with a latency of about 200 ms after speech presentation, It is determined how loud (noisy) the user feels and the comfort of listening to the speech is determined. Then, in addition to the axis of intelligibility indicating how much the word sound has been recognized, evaluation of the hearing aid processing is realized on the axis of comfort of listening to the word sound. Comfort evaluation based on effort and annoyance enables users to select a hearing aid process that is highly comfortable (no effort and does not feel annoying) and that does not get tired even if the hearing aid is worn for a long time. .
  • (A) is a figure which shows the waveform which carried out total addition averaging for every effort high / low effort labeled the event related electric potential starting from the audio
  • ( b) is a plot of the p-value of the t-test result for each sampling. It is a figure which shows the waveform which carried out total addition averaging by dividing
  • (A) is a diagram showing the correspondence between the presence / absence of positive / negative components and the determination of effort / noisiness, as summarized by the inventors, and (b) is the presence / absence of positive and negative components. It is a figure which shows the correspondence with evaluation of hearing aid processing. It is a figure which shows the structure and utilization environment of the comfort evaluation system 100 by this embodiment. It is a figure which shows the hardware constitutions of the comfort evaluation apparatus 1 for listening to word sound by Embodiment 1. FIG. It is a figure which shows the structure of the functional block of the comfort evaluation system 100 by Embodiment 1. FIG.
  • (A)-(c) is a figure which shows the example of the measurement result (conventional evaluation) of a speech intelligibility curve, and the comfort evaluation result of the speech listening by Embodiment 1 in addition to conventional evaluation.
  • 5 is a flowchart showing a procedure of processing performed in the comfort evaluation system 100. It is a figure which shows an example of the result of having evaluated effort and annoyance for every word of a single syllable.
  • FIG. (A) And (b) is a figure which shows the example of the data storage in result storage DB85. It is a flowchart which shows the process sequence of the speech intelligibility system 200 by Embodiment 2.
  • FIG. It is a figure which shows notionally the result of adding the result of the comfort evaluation in Embodiment 2 to the result of the conventional speech sound intelligibility evaluation at the time of presenting a sound at a certain sound pressure level.
  • FIG. It is a flowchart which shows the process sequence of the speech intelligibility system 300 by Embodiment 3.
  • the comfort evaluation system is used to evaluate how comfortably a user listens to a speech using a brain wave as a user state at the time of listening to the speech. More specifically, the system presents a single syllable word sound as a voice and allows the user to recognize the voice, and uses the event-related potential of the user's brain wave measured from the voice presentation as an index to facilitate comfortable speech listening. Assess sex.
  • the “event-related potential” is a part of an electroencephalogram and refers to a transient potential fluctuation in the brain that occurs temporally in relation to an external or internal event.
  • “presenting a voice” means outputting an auditory stimulus (also referred to as “voice stimulus”), for example, outputting a voice from a speaker.
  • voice stimulus also referred to as “voice stimulus”
  • the type of the speaker is arbitrary, and a speaker installed on a floor or a stand may be used, or a headphone type speaker may be used. However, the speaker needs to be able to output accurately with the specified sound pressure for correct evaluation.
  • the inventors of the present application have the comfort of listening to the speech: (1) “effort” indicating how much effort is made to distinguish the speech and (2) “noisiness” indicating how loud the speech is felt. I came up with the idea of being defined in two. This is obtained for the first time as a result of detailed analysis of the speech intelligibility evaluation and the user state at the time of evaluation. This will be specifically described below.
  • the speech intelligibility evaluation is a short-time evaluation performed at a hearing aid store. Therefore, the user under evaluation tries to distinguish the speech sound by making the best effort. Whether or not the user feels noisy is not an object to be evaluated. Therefore, even if the user feels a little noisy if he / she cannot tolerate, he / she will endure and perform the evaluation task.
  • the inventors of the present invention distinguish between the case where “effort” or “patience against annoyance” is not necessary and the case where “effort” or “patience against annoyance” is necessary as a user state when listening to speech. I thought that it should be evaluated. They identified them as comfort factors when listening to speech. Since the processes related to effort and annoyance are completely different processes in the brain, there is a possibility that they can be separated and evaluated by measuring brain waves.
  • An electroencephalogram measurement experiment was conducted in which a single syllable speech was presented in speech and the event-related potential was measured starting from the speech presentation with a setting that reminds the user of the speech corresponding to the speech.
  • the experiment in order to measure the subjectivity of effort / noisiness for listening to speech, we made subjective reports on them. Then, based on subjective reports on effort / noisiness, event-related potentials were averaged.
  • EEG measurement experiment we investigated the relationship between the subjective report on effort and annoyance obtained after speech presentation and the event-related potentials starting from speech.
  • FIG. 1 to FIG. 8 experimental settings and experimental results of an electroencephalogram measurement experiment will be described.
  • the experiment participants were 13 university / graduate students with normal hearing.
  • Fig. 1 shows an outline of the experimental procedure for an electroencephalogram measurement experiment.
  • procedure A a single syllable voice was presented. Details of the presented voice will be described later.
  • procedure B the participant was made to hear the voice and the hiragana corresponding to the heard voice was written down. Only the type of speech was changed without changing the conditions of the presented speech.
  • Procedures A and B were repeated 5 times.
  • step C the participants were asked to make a subjective evaluation on effort / noisiness with respect to the voice presented in step A. Subjective evaluation was performed on a visual analog scale (100-level evaluation) using a touch panel.
  • the above procedure A to procedure C were repeated as 12 blocks and repeated 12 blocks (total 60 trials). The sound pressure and distortion conditions of the voice presented for each block were changed in a random order.
  • FIG. 2 is a flowchart showing the procedure for one block.
  • step S11 single syllable speech is presented to the experiment participants.
  • step S12 the participant hears a single syllable and thinks of the corresponding character.
  • step S13 the participant writes down the characters corresponding to the heard voice.
  • step S14 the number of times the voice is presented is counted. The process returns to S11 until the number of presentations is four. When the number of presentations is 5, the process proceeds to S15 and the number of presentations is reset.
  • step S15 the participant answers the subjectivity to the voice heard in step S11.
  • the speech sounds presented as stimuli consisted of 8 voices (Shi, Su, Ki, Ku, Ta, Te, To, Ha) of the 67S-style word table established by the Japan Audiological Society out of unvoiced consonants that are often misunderstood. ).
  • Frequency gain means gain (circuit gain, amplification factor) for each of a plurality of frequency bands.
  • LF Large Flat
  • LD Large Distorted
  • MF Middle Flat
  • MD Middle Distorted
  • FIG. 3 (a) shows the classification of 6 conditions of speech and distortion.
  • FIG. 3B shows a gain adjustment amount for each frequency. The reason why the frequency gain in the high frequency band is reduced is to simulate a high-tone gradual type that is a typical pattern of elderly hearing loss. The voice stimulus was presented from a speaker with a flat frequency characteristic.
  • FIG. 4 shows the 10-20 System (10-20 System) 4 (b) shows an electrode arrangement in which electrodes are mounted in this experiment.
  • the sampling frequency was 200 Hz and the time constant was 1 second.
  • a 0.05-6 Hz digital bandpass filter was applied off-line.
  • a waveform of ⁇ 200 ms to 1000 ms was cut out from the time when the voice was presented.
  • ⁇ 200 milliseconds refers to a time point 200 milliseconds before the time when the voice is presented.
  • the results of subjective evaluation are shown. Based on the subjective evaluation results, each participant determined by the method described later was labeled based on the threshold value for effort / noisiness. Below, the label of the subjective evaluation is a user state at the time of listening to the speech.
  • Fig. 5 shows the results of subjective evaluation for each participant regarding effort.
  • FIG. 5 shows the percentage of all trials.
  • the solid line in FIG. 5 is the distribution of the subjective evaluation results, and the broken line indicates the threshold value obtained by dividing the subjective evaluation (high effort / low effort). Since there are large individual differences in subjective evaluation, the threshold value was determined based on the ranking of the evaluation results for each individual (1 to 100 on the visual analog scale). Specifically, the threshold value is a value that ranks the ranking of the evaluation results within an individual. However, the same evaluation results were treated as the same subjective evaluation.
  • Fig. 6 shows the result of subjective evaluation for each participant regarding annoyance.
  • FIG. 6 shows the percentage of all trials.
  • the solid line in FIG. 6 is the distribution of the subjective evaluation results, and the broken line indicates the threshold value obtained by dividing the subjective evaluation (“noisy” / “not noisy”). Similar to the effort, the inventors determined the threshold based on the ranking of the evaluation results for each individual (1 to 100 on the visual analog scale). Specifically, the inventors of the present application set the threshold value by setting the evaluation value rank within an individual to be “noisy” for one third from the highest evaluation value, and “not noisy” for others. However, the same evaluation results were treated as the same subjective evaluation.
  • FIG. 7 (a) is a waveform obtained by summing and averaging the event-related potentials starting from the voice presentation at the top of the head (Pz) for each high effort / low effort labeled by the above-described method. The addition average was performed based on the subjective evaluation regarding the effort of each block in all six conditions of the measurement experiment.
  • the horizontal axis is time and the unit is ms
  • the vertical axis is potential and the unit is ⁇ V.
  • the lower direction of the graph corresponds to positive (positive) and the upper direction corresponds to negative (negative).
  • the broken line shown in FIG. 7A is the total average waveform when the effort is low, and the solid line is the total average waveform when the effort is high.
  • FIG. 7 (a) shows the amplitude of the positive component with a latency of 600-900 ms.
  • the amplitude of the positive component with a latency of 600-900 ms is larger when the effort is high (solid line) than when the effort is low when listening to the speech (dashed line).
  • the average average potential of 600-900 ms for each subjective evaluation it was 1.99 ⁇ V when the effort was low, and 2.73 ⁇ V when the effort was high.
  • FIG. 7B shows the p value of the result of the t test for each sampling. From FIG. 7B, it can be seen that the p-value is smaller in the time zone of about 600-900 ms starting from the voice stimulus than in the other time zones.
  • the effort of listening to speech is likely to be reflected in a positive potential with a latency of about 600 to 900 ms starting from the voice presentation.
  • the time periods in which the significant difference due to the difference in subjective evaluation lasted for 15 ms or more were 420-445 ms, 655-670 ms, 730-745 ms, 775-830 ms ( p ⁇ .05).
  • FIG. 8 is a waveform obtained by summing and averaging the event-related potentials starting from the voice stimulus at the top of the head (Pz) according to the “noisy” / “not noisy” criteria labeled by the above-described method.
  • the addition average was performed based on the subjective evaluation regarding the annoyance for every block in all the six conditions of the said measurement experiment.
  • the horizontal axis in FIG. 8 is time and the unit is ms, and the vertical axis is potential and the unit is ⁇ V. Similar to FIG. 7A, as is clear from the scale shown in FIG. 8, the downward direction of the graph corresponds to positive (positive) and the upward direction corresponds to negative (negative).
  • the solid line shown in FIG. 8 is the total addition average waveform in the case of “noisy”, and the broken line is the total addition average waveform in the case of “not noisy”.
  • FIG. 8 shows that the latency of the negative component (N1 component) caused by the latency of about 200 ms is shorter in the solid line in the “noisy” case than in the broken line in the “noisy” case.
  • the latency of the N1 component for each participant was 195 ms for “noisy” and 240 ms for “noisy”.
  • a significant difference was observed (p ⁇ 0.05).
  • the interval average potential of the latency of 200 ms to 300 ms for each participant was 0.14 ⁇ V in the case of “noisy” and ⁇ 1.38 ⁇ V in the case of “not noisy”.
  • the interval average potential of latency 200 ms-300 ms As a result of t-testing the interval average potential of latency 200 ms-300 ms, the interval average potential in the case of “noisy” was significantly large (p ⁇ 0.05). Therefore, it can be said that the latency of the N1 component starting from the voice presentation and the average potential of the negative component of about 200 to 300 ms starting from the voice presentation reflect the loudness and can be used as an index of the loudness when listening to the speech.
  • the time period in which the significant difference due to the difference in subjective evaluation lasted for 15 ms or more was 50-70 ms, 155-175 ms, 225-290 ms, 920-935 ms.
  • EEG measurement experiments have revealed the existence of EEG components that reflect effort and annoyance, which are elements of comfort in listening to speech. Specifically, it was discovered that effort is reflected in a positive potential having a peak at a latency of about 750 ms, and annoyance is reflected in a negative potential having a peak at a latency of about 200 ms.
  • the amplitude of the N1 component (negative component with a latency of about 100 ms) increases as the sound pressure of the stimulus sound increases when a pure tone is presented as a stimulus (for example, Naatanen, R., & Picton, T. W. (1987).
  • the N1 wave of the human electric and magnetic response to sound a review and an analysis of the component structure. Psychophysiology, 24,425375-425.).
  • the fact that the amplitude of the negative component with a latency of about 200 ms increases reflecting the subjectivity (“noisy” / “not noisy”) regarding the user's annoyance at the time of listening to the speech is the brain wave conducted by the present inventors. It can be said that it became clear for the first time by the measurement experiment.
  • the positive component (FIG. 7) having a latency of about 750 ms at the top of the head (Pz) and the negative component (FIG. 8) having a latency of about 200 ms for each subjective evaluation regarding annoyance are, for example, the magnitude of the peak amplitude of the corresponding section It can be identified by a method of threshold processing, a method of creating a template from a typical waveform of the above component, and calculating a similarity to the template. Note that the threshold value / template may be a typical user's previously stored, or may be created for each individual.
  • the time after the elapse of a predetermined time calculated from a certain time point in order to define the event-related potential component is expressed as, for example, “latency 750 ms”. This means that a range centered on a specific time of 750 ms can be included.
  • EMP Event-Related Potential
  • the terms “about Xms” and “near Xms” mean that a width of 30 to 50 ms can exist around the Xms (for example, 300 ms ⁇ 30 ms, 750 ms ⁇ 50 ms).
  • width from 30 ms to 50 ms is an example of a general individual difference of the P300 component.
  • the positive component of the latency of about 750 ms has a slower latency than P300, the individual difference of the user is further increased. It appears greatly. Therefore, it is preferable to handle it as a wider width, for example, a width of about 100 ms to 150 ms before and after. Therefore, in this embodiment, “latency of about 750 ms” indicates a latency that exists in the range of 600 ms to 900 ms.
  • “around 200 ms latency” and “about 200 ms latency” may have a width of 30 to 50 ms before and after the latency of 200 ms, or slightly wider than that, for example, before and after each It may have a width of 50 ms to 100 ms.
  • the positive component with a latency of about 750 ms reflects the effort of listening to speech
  • the negative component having a latency of about 200 ms reflects the annoyance. Effort and annoyance are two elements of comfort that should be evaluated when listening to the speech specified by the inventors.
  • FIG. 9 (a) shows the correspondence between the presence / absence of a positive / negative component and the effort / noisiness determination summarized by the inventors of the present application. Based on the presence or absence of a positive component, if there is no positive component (the amplitude of the positive component is smaller than the threshold), it is determined that the effort is low, and if there is a positive component (the amplitude of the positive component is larger than the threshold) Judged to have high effort.
  • a negative component if there is no negative component (the latency of the negative component is longer than the threshold), it is judged as “noisy”, and if there is a negative component (the latency of the negative component is the threshold) If it is shorter, it is determined as “noisy”.
  • the “positive component” means a potential greater than 0 ⁇ V. However, in the present specification, the “positive component” does not need to be absolutely positive (greater than 0 ⁇ V). In the present specification, the presence or absence of a “positive component” is identified in order to identify whether the discrimination confidence level is high or low, and the segment average potential is 0 ⁇ V or less as long as significant discrimination level can be discriminated. There may be.
  • the “negative component” means a potential smaller than 0 ⁇ V regardless of the latency.
  • the case where the latency is shorter than a predetermined threshold is “negative component”
  • the case where the latency is longer than the predetermined threshold is “negative” It is defined as “no ingredients”.
  • a specific example of the threshold will be described later.
  • FIG. 9B shows the correspondence between the presence or absence of positive and negative components and the evaluation of hearing aid processing.
  • Cell (A) is when both positive and negative components are present. In this case, it is evaluated that the gain-adjusted frequency is not optimal or the amount of gain adjustment for each frequency is excessive.
  • Cell (B) is a case where a positive component was present but a negative component was not present. In this case, it is possible to distinguish by effort, but it is necessary to make an effort, and it is not suitable when wearing a hearing aid on a daily basis.
  • Cell (C) is a case where no positive component is present and a negative component is present. In this case, no effort is required for listening to the speech, but the overall evaluation is too much.
  • Cell (D) is a case where neither a positive component nor a negative component is present. In this case, it is evaluated that this is a suitable hearing aid process that allows the user to hear the speech comfortably.
  • the comfort evaluation system sequentially presents a single syllable speech by voice, and based on the presence or absence of a positive component of about 750 ms latency and a negative component of about 200 ms latency of the event-related potential starting from the time when the voice was presented.
  • a positive component of about 750 ms latency and a negative component of about 200 ms latency of the event-related potential starting from the time when the voice was presented.
  • the effort and annoyance of listening to speech are judged, and comfort evaluation is realized. This is realized for the first time based on the discovery of the present inventors.
  • Embodiment 1 below, the outline
  • the comfort evaluation system sequentially presents voices and measures event-related potentials starting from each voice presentation time. Then, a positive component with a latency of about 750 ms and a negative component with a latency of about 200 ms are detected, and effort and annoyance that are elements of comfort in listening to speech are determined.
  • an exploration electrode is provided on the top of the head (Pz)
  • a reference electrode is provided on either the left or right mastoid
  • an electroencephalogram that is a potential difference between the exploration electrode and the reference electrode is measured.
  • the level and polarity of the characteristic component of the event-related potential may vary depending on the part to which the electroencephalogram measurement electrode is attached and how to set the reference electrode and the exploration electrode.
  • a person skilled in the art can make an appropriate modification according to the reference electrode and the exploration electrode at that time to detect the characteristic component of the event-related potential and evaluate the speech intelligibility It is. Such modifications are within the scope of the present invention.
  • FIG. 10 shows the configuration and usage environment of the comfort evaluation system 100 according to the present embodiment.
  • This comfort evaluation system 100 is illustrated corresponding to the system configuration of Embodiment 1 described later.
  • the “comfort evaluation system” may also be referred to as a “sound listening evaluation system”. The same applies to the following second and third embodiments.
  • the comfort evaluation system 100 includes a comfort evaluation device 1 for listening to speech, an audio output unit 11, and a biological signal measurement unit 50.
  • the biological signal measuring unit 50 is connected to at least two electrodes A and B.
  • the electrode A is affixed to the mastoid of the user 5, and the electrode B is affixed on the scalp at the top of the user 5 (so-called Pz).
  • the comfort evaluation system 100 presents a single syllable word sound to the user 5 with a sound pressure of a certain sound pressure, and a positive component having a latency of about 750 ms in the brain wave (event-related potential) of the user 5 measured from the voice presentation time. Presence / absence and presence / absence of a negative component having a latency of about 200 ms are determined. Then, based on the present voice and the presence / absence of the positive / negative components, it is determined whether the user has made efforts or felt noisy when listening to the speech.
  • the brain wave of the user 5 is acquired by the biological signal measuring unit 50 based on the potential difference between the electrode A and the electrode B.
  • the biological signal measurement unit 50 transmits information corresponding to the potential difference (an electroencephalogram signal) to the comfort evaluation device 1 for listening to speech by wireless or wired.
  • FIG. 10 shows an example in which the biological signal measuring unit 50 transmits the information to the comfort evaluation device 1 for listening to speech wirelessly.
  • the speech sound listening comfort evaluation device 1 controls the sound pressure and presentation timing of the sound for the speech sound listening comfort evaluation, and presents the sound to the user 5 via the sound output unit 11 (for example, a speaker).
  • the sound output unit 11 for example, a speaker
  • FIG. 11 shows a hardware configuration of the comfort evaluation device 1 for listening to speech according to the present embodiment.
  • the speech sound listening comfort evaluation device 1 includes a CPU 30, a memory 31, and an audio controller 32. These are connected to each other via a bus 34 and can exchange data with each other.
  • the CPU 30 executes a computer program 35 stored in the memory 31.
  • the computer program 35 describes a processing procedure shown in a flowchart described later.
  • the speech sound listening comfort evaluation device 1 performs processing for controlling the entire comfort evaluation system 100 using the speech sound database (DB) 71 stored in the same memory 31 in accordance with the computer program 35. This process will be described in detail later.
  • DB speech sound database
  • the audio controller 32 generates a sound to be presented in accordance with a command from the CPU 30, and outputs the generated sound signal to the sound output unit 11 with a designated sound pressure.
  • the comfort evaluation device 1 for listening to speech may be realized as hardware such as a DSP in which a computer program is incorporated in one semiconductor circuit.
  • a DSP can realize all the functions of the CPU 30, the memory 31, and the audio controller 32 described above with a single integrated circuit.
  • the computer program 35 described above can be recorded on a recording medium such as a CD-ROM and distributed as a product to the market, or can be transmitted through an electric communication line such as the Internet.
  • the apparatus for example, PC
  • the apparatus provided with the hardware shown in FIG. 11 can function as the comfort evaluation apparatus 1 for listening to speech according to the present embodiment by reading the computer program 35.
  • the speech sound DB 71 may not be held in the memory 31 and may be stored in, for example, a hard disk (not shown) connected to the bus 34.
  • FIG. 12 shows a functional block configuration of the comfort evaluation system 100 according to the present embodiment.
  • the comfort evaluation system 100 includes an audio output unit 11, a biological signal measurement unit 50, and a comfort evaluation device 1 for listening to speech.
  • FIG. 12 also shows detailed functional blocks of the speech listening comfort evaluation device 1. That is, the speech sound listening comfort evaluation device 1 includes the event-related potential processing unit 55, the positive component determination unit 60, the negative component determination unit 65, the presented speech sound determination unit 70, the speech sound DB 71, and the result storage DB 80. I have. Note that the block of the user 5 is shown for convenience of explanation.
  • Each function block (excluding the speech sound DB 71) of the speech sound listening comfort evaluation device 1 is executed as a whole by the CPU 30, the memory 31, and the audio controller 32 by executing the program described in relation to FIG. It corresponds to the function that is realized from time to time.
  • the speech sound DB 71 is a speech sound database for evaluating the comfort of speech listening.
  • FIG. 13 shows an example of the speech sound DB 71 when the 20 word sounds of the 67S word table are used as the inspection sound.
  • data grouped according to the voice file to be presented, the consonant label, and the likelihood of occurrence of abnormal hearing (ease of occurrence of abnormal hearing) are associated. It is assumed that the stored sound has been subjected to gain adjustment (hearing aid processing) for each frequency based on a certain fitting theory from the audiogram of the hearing impaired measured in advance.
  • 50 sounds in the 57S word table may be used in addition to the 20 sound in the 67S word table.
  • the consonant label is used when the user 5 evaluates in which consonant the effort or noisy is high.
  • the grouping data is used when the user 5 evaluates in which group the effort or annoyance is high.
  • the grouping is, for example, major classification, middle classification, or minor classification.
  • the major classifications are vowels, unvoiced consonants, and voiced consonants.
  • the middle classification is a classification within unvoiced consonants and voiced consonants.
  • Sa line medium classification: 1 and Ta Ka Ha line (middle class: 2)
  • La Ya Wa line within the voiced consonant
  • La Ya Wa line within the voiced consonant
  • Na Ma Ga It can be classified into The Da Ba Line (medium classification: 2).
  • Minor classification can be classified into Na Ma line (minor classification: 1) and The Ga Da Ba line (minor classification: 2).
  • the presented speech sound determination unit 70 refers to the speech sound DB 71 and determines which speech sound is to be presented at which sound pressure level.
  • the presentation word sounds may be selected and determined in a random order, for example.
  • the sound pressure level of the presented speech is the sound pressure level after the hearing aid processing is performed on the speech of the speech intelligibility curve measurement of 55 dB SPL, 65 dB SPL, 75 dB SPL, 85 dB SPL.
  • the sound pressure level may be changed in order from a small sound pressure level to a large sound pressure level, or vice versa. Further, sound pressure levels may be selected in a random order.
  • the presented speech sound determination unit 70 outputs a trigger to the biological signal measurement unit 50 in accordance with the voice presentation time, and transmits the content of the presented voice to the event-related potential processing unit 55.
  • the voice output unit 11 presents the user 5 with a single syllable voice determined by the presentation word sound determination unit 70.
  • the biological signal measuring unit 50 is an electroencephalograph that measures a biological signal of the user 5 and measures an electroencephalogram as a biological signal. Then, an event-related potential of an electroencephalogram in a predetermined section (for example, a section from ⁇ 200 ms to 1000 ms) is cut out based on the trigger received from the presented speech sound determination section 70, and the waveform data (electroencephalogram data) is sent to the event-related potential processing section 55. To do. It is assumed that the user 5 is wearing an electroencephalograph in advance.
  • the electroencephalogram measurement electrode is attached to, for example, Pz at the top of the head.
  • the event-related potential processing unit 55 receives the event-related potential from the biological signal measuring unit 50, and performs an addition-average operation of the event-related potentials according to the content of the presented voice received from the presentation word sound determining unit 70.
  • the event-related potential processing unit 55 selects only the event-related potential for voice presentation of the same word sound, for example, and performs an arithmetic mean calculation of the event-related potential for each type of word sound. When the event-related potentials are added and averaged with only the same word sound, the comfort evaluation for each word sound is possible.
  • the averaging may be performed by selecting word sounds having the same consonant, or may be performed for each of the large classification, middle classification, and small classification of the group shown in FIG.
  • the effort and annoyance of listening to the speech can be evaluated for each type of consonant.
  • averaging is performed for each group, for example, it is possible to perform a discrimination evaluation in a group such that a voiced consonant and an unvoiced consonant have high effort with respect to the unvoiced consonant.
  • An addition waveform in which the number of additions is ensured to some extent is obtained by averaging for each consonant and each group.
  • event-related potentials for voice presentation with the same sound pressure may be selected and averaged regardless of the type of the same word sound.
  • the event-related potential processing unit 55 sends the electroencephalogram data obtained by executing a predetermined number of arithmetic operations for each word sound to the positive component determining unit 60 and the negative component determining unit 65.
  • separate processing may be performed on the event-related potential for each destination of the electroencephalogram data.
  • the number of times that the arithmetic mean calculation is executed may be changed according to the destination, or the two types of filter processing having different cutoff frequencies may be switched according to the destination to filter the event-related potential waveform.
  • the frequency of the negative component of about 200 ms latency is different from that of the positive component of about 750 ms latency, and is higher in the negative component.
  • the positive component determination unit 60 and the negative component determination unit 65 receive the electroencephalogram data from the event-related potential processing unit 55 and perform separate analysis described later.
  • the positive component determination unit 60 determines the presence / absence of a positive component having a latency of about 750 ms based on the electroencephalogram data received from the event-related potential processing unit 55.
  • the method for identifying the presence or absence of a positive component is as follows.
  • the positive component determination unit 60 compares, for example, a maximum amplitude from a latency of 600 ms to 900 ms or a section average potential from a latency of 600 ms to 900 ms with a predetermined threshold value.
  • the predetermined threshold when using the section average potential is the median of the section average potentials of “high effort” and “low effort” obtained in the above-mentioned experiment as a threshold for the presence or absence of a positive component of a general user. It is good also as 2.36 microvolt which is.
  • the positive component determination unit 60 identifies “there is a positive component”, and when smaller, identifies “there is no positive component”.
  • the positive component determination unit 60 may determine whether or not they are similar based on a similarity (for example, a correlation coefficient) with a predetermined template created from a typical positive component signal waveform having a latency of about 750 ms. . When it can be said that they are similar, the positive component determination unit 60 may identify “there is a positive component”, and when it is not similar, it may be identified as “there is no positive component”.
  • the predetermined template may be calculated and created from a waveform of a positive component of a general user acquired in advance.
  • the negative component determination unit 65 identifies the presence or absence of a negative component at the latency of about 200 ms of the electroencephalogram data received from the event-related potential processing unit 55. For example, the negative component determination unit 65 compares the latency of the negative potential peak from the latency of 100 ms to 300 ms with a predetermined threshold. When the peak potential of the negative potential is shorter than the predetermined threshold, it is identified as “with negative component”, and when the peak latency is smaller than the predetermined threshold, it is identified as “without negative component”.
  • the “predetermined threshold value” may be 218 ms, which is the median value of the latency of the “noisy” and “non-noisy” negative components obtained in the above-mentioned experiment as a threshold value for the presence or absence of a negative component of a general user Good.
  • the negative component determination unit 65 may determine whether or not they are similar based on a similarity (for example, a correlation coefficient) with a predetermined template created from a waveform of a typical negative component signal having a latency of about 200 ms. Good. A case where it can be said that they are similar may be identified as “with negative component”, and a case where they are not similar may be identified as “without negative component”.
  • the predetermined threshold value or template may be calculated and created from a waveform of a negative component of a general user acquired in advance.
  • the result accumulation DB 80 receives the presented voice information from the presented word sound determination unit 70.
  • the result accumulation DB 80 receives information on the presence / absence of a positive component for each speech from the positive component determination unit 60 and receives information on the presence / absence of a negative component for each speech from the negative component determination unit 65. Then, for example, information on the received effort and annoyance determination result is accumulated for each speech sound and sound pressure level.
  • the positive component determination unit 60 determines that a positive component is present, the positive component determination unit 60 outputs an evaluation result indicating that the user is listening to the speech. If the positive component is determined to be absent, the user determines that the positive component is not present. An evaluation result indicating that the user is listening to the speech without effort may be output.
  • the determination result of the effort may include the degree of effort corresponding to the amplitude of the positive component or the interval average potential in addition to the binary determination of “There is effort” and “No effort”.
  • the positive component determination unit 60 has a plurality of threshold values or templates corresponding to the degree of effort.
  • the threshold value decreases in the order of the third threshold value and the fourth threshold value.
  • the amplitude value of the positive component is larger than the third threshold value, it can be determined that the effort is high.
  • the amplitude value of the positive component is equal to or larger than the fourth threshold and smaller than the third threshold, it can be determined that the effort is medium. If the amplitude value of the positive component is smaller than the fourth threshold value, it can be determined that the effort is small. Further, the amplitude value of the positive component or the value of the section average potential may be used as the determination result.
  • the negative component determination unit 65 When it is determined that the negative component is present, the negative component determination unit 65 outputs an evaluation result indicating that the user feels noisy, and when the negative component is determined not to be present, the user feels noisy. You may output the evaluation result that there is no.
  • the negative component determination unit 65 may include the degree of annoyance corresponding to the latency of the negative component in addition to the two values “noisy” and “not noisy”. In this case, the negative component determination unit 65 has a plurality of threshold values or templates, like the positive component determination unit 60.
  • FIG. 14 is an example of data accumulation in the result accumulation DB 80.
  • FIG. 14 illustrates a case where effort information and annoyance information are accumulated for each word sound and each sound pressure level. For example, “1” in FIG. 14 indicates a case where the positive component determination unit 60 or the negative component determination unit 65 determines that there is a positive component or negative component, and “0” indicates that there is a positive component or negative component. The case where it was determined not to be performed is shown.
  • the ratio of the sound that was determined to have no positive component and the ratio of the sound that was determined to have no negative component were calculated for each sound pressure level and averaged. And it is good also as an evaluation result of comfort.
  • calculate the ratio of the sound that is determined to have no positive component and the ratio of the sound that is determined to have no negative component and use these calculation results to calculate the comfort evaluation result. It may be generated.
  • the comfort evaluation result may be obtained by using the ratio of groups related to the probability of occurrence of consonants or abnormal hearing.
  • the result accumulation DB 80 may be performed by the result accumulation DB 80, for example.
  • the result storage DB 80 is not just a recording medium. In addition to the recording medium, it has a function of searching for and extracting information stored in the recording medium. These functions are realized by, for example, hardware or software (both not shown) that function as a database server. This database server may perform the calculation process.
  • FIG. 15A shows an example in which only the speech intelligibility is evaluated for each sound pressure level of the presented voice during wearing.
  • This example is an evaluation result obtained by a conventional evaluation method.
  • the intelligibility is evaluated as 80% or higher at a sound pressure level of 65 dBdSPL or higher. Therefore, when the speech intelligibility is improved as compared with when not worn (not shown in FIG. 15), it is determined to be suitable in the hearing aid compatibility test.
  • the speech intelligibility curves are the same, but the results of comfort evaluation are greatly different.
  • the overall comfort is low, particularly at 55 dB. This can be heard if effort is made, but it can be evaluated that the sound pressure was generally low.
  • the comfort level is high overall, but the comfort level is low at a large sound pressure level. This is an appropriate hearing aid process at a sound pressure in the vicinity of 65 dB SPL, but can be evaluated as feeling noisy at a sound pressure level as high as 85 dB SPL.
  • 15 (b) and 15 (c) show the comfort only during wearing, the comfort is evaluated even when not wearing (bare ears), and the comfort is improved during non-wearing and wearing. You may compare.
  • FIG. 16 is a flowchart showing a procedure of processing performed in the comfort evaluation system 100.
  • step S101 the presented word sound determination unit 70 determines the word sound and sound pressure level of a single syllable to be presented with reference to the word sound DB 71.
  • the voice output unit 11 presents the speech to the user 5 at the determined sound pressure level.
  • the presented word sound determination unit 70 transmits a trigger to the biological signal measurement unit 50, and transmits sound information related to the presented word sound to the event-related potential processing unit 55.
  • the word sounds to be presented may be selected randomly from the DB 71, or specific consonants or group sounds may be selected intensively.
  • the sound pressure level of the presented speech sound is, for example, the sound pressure level after the hearing aid processing is performed on the speech of the speech intelligibility curve measurement of 55 dB SPL, 65 dB SPL, 75 dB SPL, and 85 dB SPL.
  • the order in which the sound pressure levels are presented may be changed in order from a small sound pressure level to a large sound pressure level, or vice versa. Further, sound pressure levels may be selected in a random order.
  • step S102 the biological signal measurement unit 50 receives a trigger from the presented word sound determination unit 70, and cuts out an event-related potential from ⁇ 200 ms to 1000 ms, for example, from the trigger, from the measured brain waves. Then, for example, an average potential of ⁇ 200 ms to 0 ms is obtained, and the obtained event-related potential is baseline-corrected so that the average potential becomes 0 ⁇ V.
  • step S103 the event-related potential processing unit 55 averages the event-related potentials cut out in step S102 for each word sound and each sound pressure level based on the information of the presented word sound received from the presented word sound determining unit 70.
  • the addition average calculation is performed for each word sound and each sound pressure level, but the target of the addition average calculation is not limited to each word sound. For example, it may be performed according to the type of speech sound (for example, for each consonant or speech sound group) or for each sound pressure level presented. That is, when each word sound is classified based on at least one of the type of sound and the sound pressure level when presented, the event-related potential processing unit 55 obtains when the sound belonging to the same classification is presented. The event-related potentials of the obtained electroencephalogram signals may be averaged.
  • step S104 the event-related potential processing unit 55 determines whether or not the number of event-related potentials added to the word sound presented in step S101 has reached a predetermined number. If the number of additions is less than or equal to the predetermined number, the process returns to step S101 and repeats voice presentation. If the number of additions is equal to or greater than the predetermined number, the process proceeds to step S105.
  • the number of additions is, for example, 20 times. Note that “20 times” is the number of additions frequently used in the field of measuring event-related potentials, but this is only an example.
  • step S ⁇ b> 105 the event-related potential processing unit 55 sends the electroencephalogram data that has undergone a predetermined number of arithmetic operations to the positive component determination unit 60 and the negative component determination unit 65.
  • step S106 the positive component determination unit 60 determines whether or not a positive component exists at a latency time of about 750 ms in the electroencephalogram data.
  • the positive component may be identified by comparison with a predetermined threshold as described above, or by comparison with a template.
  • the negative component determination unit 65 determines whether or not a negative component exists in the electroencephalogram data latency of about 200 ms.
  • the negative component may be identified by comparing the threshold of the latency of a predetermined negative component or by comparing with a template.
  • step S108 the result accumulation DB 80 receives, from the negative component determination unit 65, information about the presence or absence of a positive component of about 750 ms latency received from the positive component determination unit 60 for each speech / sound pressure level presented in step S101. In addition, information on the presence or absence of a negative component having a latency of about 200 ms is accumulated.
  • step S109 the presented speech sound determination unit 70 determines whether or not the stimulus presentation has been completed for all speech sounds and sound pressure levels scheduled to evaluate the comfort of listening to the speech. If it has not been completed, the process returns to step S101. If it has been completed, the comfort evaluation for listening to speech is terminated.
  • a positive component having a latency of about 750 ms and a negative component having a latency of about 200 ms are used, starting from the time when the voice is presented with the setting of presenting a single syllable word sound.
  • the comfort of listening to speech was evaluated by processing. According to the above-described processing, it is possible to realize determination as to how much the user has made efforts (effort) and how much annoyance (noisiness) has been felt when listening to the speech. This means that the suitability of hearing aid processing can be evaluated with the comfort of listening to speech different from speech intelligibility as an axis. Since hearing aid processing can be evaluated around comfort, hearing aid processing with high comfort and less fatigue can be realized.
  • the speech sound listening comfort evaluation device 1 is realized by a configuration that can be miniaturized using general hardware as shown in FIG.
  • the comfort evaluation device 1 is configured with a size and weight that can be carried and carried by the user, so that the user can evaluate the comfort of listening to speech in a sound environment using a hearing aid.
  • the sound output unit 11 is a speaker, but the sound output unit 11 may be a headphone. By using headphones, it is easy to carry and the speech intelligibility can be evaluated in the environment used by the user.
  • the description has been made on the assumption of Japanese speech intelligibility evaluation.
  • it may be in English or Chinese as long as it is a single syllable.
  • a single syllable word may be presented and the evaluation for each word may be performed.
  • FIG. 17 shows an example of the result of evaluating effort and annoyance for each single syllable word.
  • the user can determine how much effort (effort) and how much annoyance (noisiness) was felt when listening to the speech by simply thinking of the corresponding hiragana by listening to the voice. Realized.
  • the comfort at the time of listening to the sound is quantified, and the hearing aid process can be evaluated on the axis of comfort.
  • a fitting that is easy to hear and is not fatigued can be realized by the highly comfortable hearing aid process.
  • the biological signal measurement unit 50 extracts an event-related potential in a predetermined range starting from the trigger from the presentation word sound determination unit 70, performs baseline correction, and converts the potential waveform data into the event. It is assumed that it is transmitted to the related potential processing unit 55. However, this process is an example. As another process, for example, the biological signal measurement unit 50 may continuously measure the brain waves, and the event-related potential processing unit 55 may perform necessary event-related potential extraction and baseline correction. If it is the said structure, the presentation sound determination part 70 does not need to transmit a trigger to the biological signal measurement part 50, and should just transmit a trigger to the event related electric potential process part 55. FIG.
  • the results of the comfort evaluation are stored in the result storage DB 80, but may not be stored.
  • the positive component determination unit 60 and the negative component determination unit 65 may simply output each determination result.
  • Each determination result can be used as information related to comfort of listening to speech.
  • the positive component determination unit 60 and the negative component determination unit 65 have been described as determining the presence or absence of a positive component and a negative component, respectively, and outputting the determination results.
  • this configuration is an example.
  • the positive component determination unit 60 may determine that the effort index is large when a positive component is present, and the negative component determination unit 65 may determine that the annoyance index is large when a negative component is present. .
  • an evaluation result indicating that effort was required / not required for listening to the speech according to the determination result, and an evaluation result indicating that it was felt / not felt noisy are output, and the evaluation result is stored in the result accumulation DB 80. You may accumulate. Which of the determination result and the evaluation result is output can be set independently for each of the positive component determination unit 60 and the negative component determination unit 65.
  • the determination result may be output using a binary value indicating whether or not a positive / negative component has appeared, or output in a format other than a numerical value indicating the presence / absence of a positive / negative component (for example, character information). May be.
  • the evaluation result indicating that effort was necessary / not necessary, felt / not felt noisy may be output by using a binary value indicating each, or may indicate effort and feel noisy.
  • the degree may be output using a numerical value of 3 or more. Or you may output in formats (for example, character information) other than the numerical value which shows those grades.
  • Embodiment 2 In the comfort evaluation system 100 according to the first embodiment, a positive component having a latency of about 750 ms and a latency of about 200 ms are obtained with respect to a predetermined sound adjusted in advance based on one kind of hearing aid processing stored in the speech sound DB 71. Based on the presence or absence of negative components, the effort and annoyance at the time of listening to speech were judged.
  • a comfort evaluation system in which a hearing aid processing unit that processes the speech sound to be presented into sound output from the hearing aid is provided and the comfort for each hearing aid process is evaluated.
  • FIG. 18 shows a functional block configuration of the comfort evaluation system 200 according to this embodiment.
  • the comfort evaluation system 200 includes an audio output unit 11, a biological signal measurement unit 50, and a comfort evaluation device 2 for listening to speech.
  • the same blocks as those in FIG. 12 are denoted by the same reference numerals, and the description thereof is omitted.
  • the hardware configuration of the speech sound listening comfort evaluation device 2 is as shown in FIG.
  • the comfort evaluation device 2 for listening to speech according to the present embodiment shown in FIG. 18 is realized.
  • the speech sounding comfort evaluation device 2 according to the present embodiment is greatly different from the speech sound listening comfort evaluation device 1 according to the first embodiment in that a hearing aid processing unit 90 is newly provided.
  • the component name of the comfort evaluation device 2 is the same as that of the first embodiment, but different reference numerals are used when it has different operations and / or functions. .
  • the event-related potential processing unit 55 in order to perform the comfort evaluation for each of the plurality of hearing aid processes, which was not performed in the first embodiment, the event-related potential processing unit 55, the presented word sound determination unit 70, the word sound DB 71 according to the first embodiment, in this embodiment, instead of the result accumulation DB 80, an event-related potential processing unit 56, a presentation word sound determination unit 75, a word sound DB 72, and a result accumulation DB 85 are provided.
  • the speech sound DB 72 the presented speech sound determination unit 75, the hearing aid processing unit 90, the event-related potential processing unit 56, the result accumulation DB 85, and the hearing aid processing unit 90 will be described.
  • the speech sound DB 72 is a speech sound database for performing comfort evaluation for listening to speech sounds such as 20 speech sounds of the 67S type word table shown in FIG.
  • the difference from the speech sound DB 71 is that it has speech sound data before hearing aid processing.
  • the presented speech sound determination unit 75 refers to the speech sound DB similarly to the presented speech sound control unit 70 according to the first embodiment, and determines the type and sound pressure level of the speech sound.
  • the difference from the presented word sound control unit 70 is that it selects which hearing processing to process the sound and sends the sound data of the presented word sound to the hearing aid processing unit 90 together.
  • the hearing aid processing unit 90 processes the sound data by the instructed hearing aid processing method based on the instruction regarding the hearing aid processing selection received from the presentation word sound determination unit 75 and the sound data.
  • Hearing aid processing includes, for example, consonant enhancement, directivity, noise reduction, and the like. If the consonant-enhanced hearing aid process is selected, for example, a process of increasing the gain amplification amount of the consonant frequency is performed to process the audio data.
  • the event-related potential processing unit 56 determines the event-related potential received from the establishment signal measuring unit 50 in accordance with the content of the presentation voice received from the presentation word sound control unit. Addition averaging is performed. The difference from the event-related potential processing unit 55 is that the information of the hearing aid processing is received from the presented word sound determination unit 75 and the addition average calculation is performed for each word sound, each sound pressure level, and each hearing aid processing.
  • the result accumulation DB 85 includes, for example, information on presence / absence of a positive component having a latency of about 750 ms received from the positive component determination unit 60 for each speech and sound pressure level, and a negative component. Information about the presence or absence of a negative component having a latency of about 200 ms received from the determination unit 65 is accumulated.
  • the difference from the result accumulation DB 80 is that, in addition to the information of the speech sound / sound pressure level of the presentation stimulus, information on the type of hearing aid processing is received from the presentation speech sound determination unit 75, and data is accumulated for each type of hearing aid processing. is there.
  • FIGS. 19A and 19B are examples of data accumulation in the result accumulation DB 85.
  • FIG. FIGS. 19A and 19B illustrate a case where determination results of effort and annoyance are accumulated for each word sound, each sound pressure level, and each hearing aid process.
  • FIG. 19A shows determination results of effort and annoyance for each word / sound pressure level of a certain hearing aid processing A accumulated in the result accumulation DB 85.
  • FIG. 19B shows determination results of effort and annoyance for each word sound / sound pressure level of a certain hearing aid processing B stored in the result storage DB 85.
  • “1” in FIGS. 19A and 19B is a case where the positive component determination unit 60 or the negative component determination unit 65 determines that there is a positive component or a negative component, and “0” The case where it was determined that there was no negative component is shown.
  • FIG. 20 is a flowchart showing a processing procedure of the speech intelligibility system 200 according to the present embodiment.
  • steps that perform the same processing as the processing of the comfort evaluation system 100 are denoted by the same reference numerals, and description thereof is omitted.
  • the processing of the comfort evaluation system 200 according to the present embodiment is different from the processing of the comfort evaluation system 200 according to the first embodiment in steps S201, S202, and S203.
  • step S201 a single syllable speech processed by the designated hearing aid process is presented.
  • step S202 an arithmetic mean is performed for each speech sound, sound pressure level, and hearing aid processing.
  • step S203 the results are accumulated for each word sound, each voice, and each hearing aid process.
  • the presented speech sound determination unit 75 refers to the speech sound DB 72 to determine the type and sound pressure level of the speech to be presented, and acquires the data. Further, the presented word sound determination unit 75 determines the hearing aid process, and sends information related to the type of the hearing aid process and audio data to the hearing aid processor 90.
  • the hearing aid processing unit 90 receives information on the type of hearing aid processing determined by the presentation word sound determination unit 75 and the sound data, and processes the sound data based on the designated hearing aid processing method.
  • the audio output unit 11 presents the processed audio data to the user 5.
  • step S ⁇ b> 202 the event-related potential processing unit 56 receives the information of the type of the presented word sound, the sound pressure level, and the hearing aid processing received from the presented word sound determination unit 75, and determines the event-related potential of the electroencephalogram measured by the biological signal measurement unit 50. For example, averaging is performed for each word sound, each sound pressure level, and each hearing aid process.
  • the result accumulation DB is positive for the latency of about 750 ms determined by the positive component determination unit 60 for each piece of information (sound type, sound pressure level, hearing aid processing) related to the presented word sound received from the presented word sound determination unit 75.
  • the presence / absence of a component and the presence / absence of a negative component having a latency of about 200 ms determined by the negative component determination unit 65 are accumulated. Examples of result accumulation are as shown in FIGS. 19 (a) and 19 (b).
  • FIG. 21 conceptually shows the result of the conventional speech intelligibility evaluation when the speech is presented at a certain sound pressure level and the result of adding the result of the comfort evaluation in the present embodiment.
  • process A assumes consonant enhancement
  • process B assumes directivity
  • processes C and D assume noise reduction hearing aid processing.
  • Consonant enhancement Processing A: Although the gain adjustment amount in the consonant frequency band is increased, the intelligibility is improved, but the frequency characteristic of the speech itself is changed, so that the comfort is lowered.
  • the comfort for each hearing aid process can be evaluated.
  • Embodiment 3 In the comfort evaluation system 100 according to the first embodiment, in the positive component determination unit 60 and the negative component determination unit 65, a threshold value calculated from a positive component / negative component of a general user, or a positive component / negative component of a general user Using these templates, the presence or absence of a positive component and the presence or absence of a negative component were determined.
  • calibration is performed to measure characteristics of a positive component with a latency of about 750 ms and a negative component with a latency of about 200 ms for each user before evaluating the comfort of listening to speech.
  • a positive component with a latency of about 750 ms and a negative component with a latency of about 200 ms for each user before evaluating the comfort of listening to speech.
  • FIG. 22 shows a functional block configuration of the comfort evaluation system 300 according to the present embodiment.
  • the comfort evaluation system 300 includes an audio output unit 11, a biological signal measurement unit 50, and a comfort evaluation device 3 for listening to speech.
  • the same blocks as those in FIG. 12 are denoted by the same reference numerals, and the description thereof is omitted.
  • the hardware configuration of the speech sound listening comfort evaluation device 3 is as shown in FIG.
  • the comfort evaluation device 3 for listening to speech according to the present embodiment shown in FIG. 18 is realized.
  • the speech sound listening comfort evaluation device 3 is greatly different from the speech sound listening comfort evaluation device 1 according to the first embodiment in that a calibration / evaluation switching unit 95 and an individual threshold DB 96 are newly provided. is there. Moreover, in order to determine the presence or absence of a positive component based on the component characteristic for every user, it replaces with the event related electric potential process part 55, the positive component determination part 60, the negative component determination part 65, and the presentation word sound determination part 70 concerning Embodiment 1. In this embodiment, a positive component determination unit 61, a negative component determination unit 66, an event-related potential processing unit 57, and a presentation word sound determination unit 77 are provided.
  • the calibration / evaluation switching unit 95 the individual threshold value DB 96, the presentation speech sound control unit 77, the event-related potential processing unit 57, the positive component determination unit 61, and the negative component determination unit 65 will be described.
  • the calibration / evaluation switching unit 95 switches between a calibration mode for specifying the characteristics of event-related potential components for each user and an evaluation mode for performing comfort evaluation. Then, information indicating the current mode is sent to the presentation word sound control unit 77. Note that the mode switching may be performed when a predetermined number of speech sound presentations necessary for specifying the characteristics of the user's electroencephalogram have been completed.
  • the presentation speech sound control unit 77 refers to the speech sound DB 71 in the same manner as the presentation speech sound control unit 70, and determines the type of speech sound and the sound pressure level of the presented speech. Further, in the calibration mode when receiving the information of the calibration mode / evaluation mode from the calibration / evaluation switching unit 95, (1) the sound pressure level that the user can hear without effort but feel “noisy”; and (2) A sound is presented to the user 5 via the sound output unit 11 at a sound pressure level that requires effort but feels “noisy”. The sound pressure level may be determined with reference to the user's audiogram, for example. Then, trigger information is sent to the biological signal measuring unit 50, and voice information and calibration / evaluation mode information are sent to the event-related potential processing unit 57.
  • the event-related potential processing unit 57 performs an averaging operation of the event-related potentials received from the established signal measuring unit 50 in accordance with the content of the presented voice received from the presentation word sound control unit. .
  • the mode information is received from the presented word sound control unit 77. In the case of the calibration mode, for example, an averaging operation is performed for each sound pressure level regardless of the type of speech.
  • the feature-value used for identification with the positive component determination part 61 and the negative component determination part 66 is calculated, and it sends to individual threshold value DB96.
  • the feature amount includes, for example, a section average potential, a maximum amplitude, and a waveform itself.
  • the evaluation mode the arithmetic mean calculation is performed in the same manner as the event-related potential processing unit 55.
  • the individual threshold DB 96 stores the feature amount used for identification sent from the event-related potential processing unit 57.
  • the positive component determination unit 61 and the negative component determination unit 66 receive the electroencephalogram data from the event-related potential processing unit 57 and refer to the feature values for each sound pressure level stored in the individual threshold value DB 96, respectively. Determine. For example, when the feature amount is a section average potential, a positive component / negative component is determined in the same manner as the positive component determination unit 60 / negative component determination unit 65 using the intermediate value of the feature amount for each sound pressure level as a threshold value. To detect.
  • FIG. 23 is a flowchart showing a processing procedure of the speech intelligibility system 300 according to the present embodiment.
  • steps that perform the same processing as the processing of the comfort evaluation system 100 (FIG. 16) are denoted by the same reference numerals, and description thereof is omitted.
  • the processing of the comfort evaluation system 300 according to the present embodiment is different from the processing of the comfort evaluation system 100 according to the first embodiment in steps S301 to S308. Since the other steps have already been described with reference to FIG. 16, their description will be omitted.
  • step S301 the proofreading / evaluation switching unit 95 sets the current mode to the proofreading mode based on the user's selection, and sends the information on the proofreading mode to the presented word sound control unit 77.
  • step S302 the presented word sound control unit 77 refers to the word sound DB 71 to determine the type of the word sound. Then, the presenting sound control unit 77 (1) a sound pressure level at which the user can hear the voice presentation of the single syllable without effort but feel “noisy”, or (2) a sound that feels “noisy” although effort is required. Set the pressure level. Then, the voice is presented to the user 5 via the voice output unit 11.
  • step S303 the event-related potential processing unit 57 adds and averages the event-related potential measured by the biological signal measuring unit 50 for each sound pressure level.
  • the event-related potential processing unit 57 stores a feature amount for each sound pressure level. More specifically, the event-related potential processing unit 57 calculates feature amounts used for identification by the positive component determination unit 61 and the negative component determination unit 66 from the addition average waveform. For example, when the feature amount is a section average potential, the average potential of a predetermined section is calculated. And it preserve
  • step S305 the proofreading / evaluation switching unit 95 switches from the proofreading mode to the evaluation mode when the predetermined number of voice presentations are completed, and sends the evaluation mode information to the presented word sound control unit 77.
  • step S306 the presence / absence of a positive component is determined based on the feature amount of the positive component for each user.
  • the positive component determination unit 61 reads out a threshold value for determining the presence or absence of a positive component with reference to the individual threshold value DB 96, and uses the threshold value to receive the event-related potential received from the event-related potential processing unit 57.
  • the presence or absence of a positive component having a latency of about 750 ms is determined. For example, when the section average potential is identified as the feature amount, it is determined that there is a positive component when the section average potential of the latency of about 750 ms is larger than the calculated threshold value, and there is no positive component when it is small.
  • step S307 the presence or absence of a negative component is determined based on the feature amount of the negative component for each user. That is, in step S307, the negative component determination unit 61 reads a threshold value for determining the threshold value of the presence or absence of a negative component with reference to the individual threshold value DB 96, and the event received from the event-related potential processing unit 57 using the threshold value.
  • the presence or absence of a negative component having a latency of about 200 ms at the relevant potential is determined. For example, when the latency is identified as the feature amount, it is determined that there is a negative component when the latency of the latency of about 200 ms is smaller than the calculated threshold value, and there is no negative component when the latency is larger.
  • Such processing makes it possible to identify the presence / absence of positive and negative components in accordance with the electroencephalogram characteristics of each user, so that the comfort of listening to speech can be accurately evaluated.
  • comfort evaluation system 300 of the present embodiment comfort can be evaluated with high accuracy according to the brain wave characteristics of each user. This makes it possible to realize hearing aid processing with high comfort and listening comfort.
  • each feature quantity of the positive component and the negative component for each user is calibrated, but this process is an example. As the feature amount for each user, only one of the positive component and the negative component may be calibrated.
  • the speech listening Quantitative comfort assessment for listening to speech is possible based on the brain waves of the time.
  • hearing aid processing that is highly comfortable and that does not get tired can be selected, so that it can be used for fitting all hearing aid users.

Abstract

 補聴器のフィッティング状況を評価するための補聴器適合検査において、語音聴取に対する快適性が評価されず、語音明瞭度は高いが聞いていて疲れる補聴処理が選択される場合があり、ユーザの負担になっていた。 語音聴取評価システムは、ユーザの脳波信号を計測する生体信号計測部と、単音節の語音を複数保持している語音データベースを参照して、呈示する単音節の語音を決定する呈示語音決定部と、決定された語音を、前記ユーザに聴覚的刺激として順次呈示する出力部と、前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定し、判定結果に応じて、前記ユーザが前記語音を努力して聞いているか否かの評価結果を出力する陽性成分判定部と、前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定し、判定結果に応じて、前記ユーザが前記語音をうるさいと感じているかの評価結果を出力する陰性成分判定部とを備えている。

Description

語音聴取の評価システム、その方法およびそのプログラム
 本発明は、ユーザが語音を快適に聴取できたか否かを評価するための技術に関する。より具体的には、本発明は、補聴器等において、音の周波数ごとの増幅量を調整して個々のユーザにとって適切な大きさの音を得る「フィッティング」のための、語音聴取時の快適性の程度を評価する語音聴取の快適性評価システムに関する。
 近年、社会の高齢化に伴い、老人性の難聴者が増加している。若年者においても、大音量の音楽を長時間聴く機会が増えたなどの影響により、音響性の難聴者が増加している。また、補聴器の小型化・高性能化に伴い、補聴器の装用に対するユーザの抵抗が少なくなってきている。これらを背景として、会話の聞き分け能力の向上を目的に、日常的に補聴器を装用するユーザが増加している。
 補聴器は、ユーザが聞きとりにくい音を構成する種々の周波数のうち、特定周波数の信号の振幅を増幅させることにより、ユーザの低下した聴力を補うための装置である。ユーザが補聴器に求める音の増幅量は、ユーザごとの聴力低下の度合いに応じて異なる。そのため、補聴器の利用を開始する前には、まずユーザごとの聴力に合わせて音の増幅量を調整する「フィッティング」が必須である。
 フィッティングは、補聴器の周波数ごとの出力音圧(音として知覚され得る、大気の圧力変動)をMCL(most comfortable level:ユーザが快適に感じる音圧レベル)にすることを目指して行われる。このとき、(1)増幅量不足、または、(2)増幅量過多のいずれかの場合には、フィッティングが適切であるとは言えない。たとえば、増幅量不足の場合、音声が聞き分けられず、補聴器装用の目的が達成できないためである。また、増幅量過多の場合、音声の聞き分けはできるがユーザがうるさく感じ長時間使用できないという問題が発生するためである。そのため、上記(1)または(2)のいずれにも該当しないよう、フィッティングを行う必要がある。
 フィッティングの最初の手順は、オージオグラムの測定である。「オージオグラム」とは、聴取可能な純音の最小音圧である閾値を評価した結果である。たとえば、複数の周波数の音のそれぞれについて、そのユーザが聞き取ることが可能な最も小さい音圧レベル(デシベル値)を周波数(たとえば250Hz、500Hz、1000Hz、2000Hz、4000Hz)に応じてプロットした図である。
 次に、オージオグラムの結果から周波数ごとの増幅量を推定するための関数であるフィッティング理論に基づき、周波数ごとの増幅量を決定する。
 しかしながら、オージオグラムとフィッティング理論に基づく調整のみでは、会話の聞き分け明瞭度を向上させる最適なフィッティングが実現されたかどうかは分からない。その理由として、たとえばオージオグラムと会話の聞き分け能力とが一対一対応しないこと、難聴者は適切な大きさに感じる音圧の範囲が狭いため調整が難しいことなどが挙げられる。
 そこで、上記の方法で決定・調整された補聴器を装用して、補聴器適合検査が実施される(たとえば、非特許文献1参照)。補聴器適合検査の必須検査項目には、(1)語音明瞭度曲線の測定、(2)環境騒音許容レベルの測定の2種類がある。
 語音明瞭度曲線の測定では、補聴器装用時と補聴器非装用時(裸耳)において、55dB SPL(Sound pressure level)、65dB SPL、75dB SPLおよび85dB SPLの音圧で単音節の語音音声を呈示し、それぞれの音圧レベルごとの語音明瞭度をプロットし比較する。そして、非装用時の場合と比較して装用時において明瞭度が向上していれば適合と判定する。
 この「語音明瞭度」とは、単音節の語音音声が聞き取れたか否かの程度をいう。語音明瞭度は、会話時の聞き分けの程度を反映する。「単音節の語音」とは、一つの母音、または子音と母音との組合せを示す(たとえば「あ」/「だ」/「し」)。
 語音明瞭度は、以下の手順で評価する(たとえば非特許文献2)。まず、日本聴覚医学会が制定した67S式語表(20語音)の音声をひとつずつ再生し、ユーザに聞かせる。次に、呈示された語音をどの語音として聞き取ったかをユーザに発話または書き取りなどの方法で回答させる。そして、評価者が呈示した語音と回答とを照合し、全20語音のうち正しく聞き取れた語音の割合である正解率を計算する。その正解率が語音明瞭度である。
 語音明瞭度の評価方法に関して、従来から種々の技術が公開されている。たとえば、特許文献1には、パーソナルコンピュータ(PC)を用いて自動的に正誤判定を行う語音明瞭度評価方法が開示されている。特許文献1では、PCを用いてユーザに対して単音節の音声を呈示し、ユーザにマウスまたはペンタッチ(touch the pen to the display)により回答させ、回答をPCの入力として受け付け、呈示した音声と回答入力との正誤判定を自動的に行う方法が提案されている。マウスまたはペンタッチで回答入力を受けることで、ユーザの回答(発話または書き取り)を評価者が識別/解読する必要がなくなり、評価者の手間が削減される。
 また、たとえば特許文献2には、音声呈示後に該当する語音の選択候補を文字で呈示する語音明瞭度評価方法が開示されている。特許文献2では、選択候補を数個に絞り、数個の文字の中から該当する語音を選択させることでユーザが文字を探す手間を低減している。
 一方、環境騒音許容レベルの測定では、朗読音と環境騒音を同時に呈示し朗読音を聴取させた場合に、環境騒音が許容できるかどうかを評価する(非特許文献2)。具体的には、朗読音を65dB SPLで、環境騒音を55dB SPLで呈示し、環境騒音が許容できるかどうかに関する主観的な印象を報告させる。主観的な印象として、雑音下で朗読音を聴取するときに補聴器を使用できる、または雑音下での補聴器装用は困難である、のどちらかを報告させる。そして、前者の場合を適合、後者の場合を不適合と判定する。
特開平9-038069号公報 特開平6-114038号公報
細井裕司他、「補聴器適合検査の指針2008」、2008年 小寺一興、「補聴器フィッティングの考え方」、診断と治療社、1999年、166頁
 しかしながら、上述の補聴器適合検査のうち、語音明瞭度曲線の測定では、語音明瞭度のみに基づいて適合状態が判定されており、語音聴取が快適であったか否かは考慮されていなかった。そのため、語音聴取時の快適性が低い場合にも、非装用時と比較して補聴器装用時において明瞭度が高ければ、適した補聴処理であると評価された。また、環境騒音許容レベルの測定では、環境騒音が許容できるか否かが評価され、語音聴取そのものの快適性に関する評価はされなかった。これらの評価では、語音聴取の快適性が低いため聞いていて疲れやすい補聴処理であっても、適合していると判定してしまう場合があった。快適性の低さは、補聴器を日常的に装用するユーザにとって負担である。
 本発明の目的は、語音聴取の快適性に関するユーザ状態を評価する、語音聴取の快適性評価システムを実現することである。
 本発明による語音聴取の評価システムは、ユーザの脳波信号を計測する生体信号計測部と、単音節の語音を複数保持している語音データベースを参照して、呈示する単音節の語音を決定する呈示語音決定部と、決定された語音を、前記ユーザに聴覚的刺激として順次呈示する出力部と、前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定し、判定結果に応じて、前記ユーザが前記語音を努力して聞いているか否かの評価結果を出力する陽性成分判定部と、前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定し、判定結果に応じて、前記ユーザが前記語音をうるさいと感じているか否かの評価結果を出力する陰性成分判定部とを備えている。
 前記評価システムは、前記脳波信号の事象関連電位を加算平均する事象関連電位処理部をさらに備え、前記事象関連電位処理部は、前記語音が語音の種類および呈示されたときの音圧レベルの少なくとも一つに基づいて分類されるときにおいて、同じ分類に属する語音が呈示されたときに得られる前記脳波信号の事象関連電位を加算平均してもよい。
 前記陽性成分判定部は、各語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位の区間平均電位が予め定められた第1閾値以上の場合に陽性成分が存在すると判定し、前記区間平均電位が前記第1閾値よりも小さい場合には陽性成分が存在しないと判定してもよい。
 前記陽性成分判定部は、前記陽性成分が存在すると判定した場合、前記ユーザが前記語音を努力して聞いているという評価結果を出力し、前記陽性成分が存在しないと判定した場合には、前記ユーザが前記語音を努力せずに聞いているという評価結果を出力してもよい。
 前記陰性成分判定部は、各語音が呈示された時刻を起点として100ms以上300ms以下の範囲に存在する陰性成分のピークが、予め定められた第2閾値よりも短い場合には陰性成分が存在すると判定し、前記陰性成分のピークが前記第2閾値以上の場合には陰性成分は存在しないと判定してもよい。
 前記陰性成分判定部は、前記陰性成分が存在すると判定した場合、前記ユーザが前記語音をうるさいと感じているという評価結果を出力し、前記陰性成分が存在しないと判定した場合、前記ユーザが前記語音をうるさいと感じていないという評価結果を出力してもよい。
 前記語音データベースには、複数の語音の各々について、音声、子音情報および異聴発生確率に関するグループが対応付けて記憶されていてもよい。
 前記評価システムは、前記陽性成分判定部および前記陰性成分判定部の判定結果を蓄積する結果蓄積データベースをさらに備え、前記結果蓄積データベースは、少なくとも1つの音圧レベルに関して、前記陽性成分判定部によって陽性成分なしと判定された語音、子音、または、前記異聴発生確率に関するグループの割合、および、前記陰性成分判定部によって陰性成分なしと判定された語音、子音、または、前記異聴発生確率に関するグループの割合を算出し、算出結果を利用して評価結果を生成してもよい。
 前記結果蓄積データベースには、語音ごと、子音ごと、または、前記異聴発生確率に関するグループごとに、前記ユーザが前記語音を努力して聞いているか否か、および前記ユーザが前記語音をうるさいと感じているか否かを評価するための情報が蓄積されていてもよい。
 前記結果蓄積データベースは、語音ごと、音圧レベルごとに、前記ユーザが前記語音を努力して聞いているか否か、および前記ユーザが前記語音をうるさいと感じているか否かを評価するための情報を蓄積してもよい。
 前記呈示語音決定部は、呈示音声の音圧レベルを決定してもよい。
 前記評価システムは、前記呈示語音決定部によって決定され、呈示される前記語音に関して補聴処理の種類を選択し、選択された補聴処理に基づいて前記語音データベースに保持されている語音データを加工する補聴処理部をさらに備えていてもよい。
 前記評価システムは、前記陽性成分判定部および前記陰性成分判定部の判定結果を蓄積する結果蓄積データベースをさらに備え、前記結果蓄積データベースには、語音ごと、補聴処理ごとに、前記ユーザが前記語音を努力して聞いているか否か、および前記ユーザが前記語音をうるさいと感じているか否かを評価するための情報が蓄積されていてもよい。
 本発明による語音聴取の評価装置は、単音節の語音を複数保持している語音データベースを参照して、出力部からユーザに聴覚的刺激として順次呈示する単音節の語音を決定する呈示語音決定部と、前記ユーザの脳波信号を計測する生体信号計測部がおいて計測した脳波信号において、前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定する陽性成分判定部と、前記ユーザの脳波信号を計測する生体信号計測部がおいて計測した前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定する陰性成分判定部とを備えている。
 本発明による語音聴取の評価方法は、ユーザの脳波信号を計測するステップと、単音節の語音を複数保持している語音データベースを参照して、呈示する単音節の語音を決定するステップと、決定された語音を、前記ユーザに聴覚的刺激として順次呈示するステップと、前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定するステップと、判定結果に応じて前記ユーザが前記語音聴取を努力して聞いているか否かの評価結果を出力するステップと、前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定するステップと、判定結果に応じて、前記ユーザが前記語音をうるさいと感じているか否かの評価結果を出力するステップとを包含する。
 本発明によるコンピュータプログラムは、語音明瞭度評価システムに設けられたコンピュータによって実行されるコンピュータプログラムであって、前記コンピュータプログラムは、前記語音明瞭度評価システムに実装されるコンピュータに対し、計測されたユーザの脳波信号を受け取るステップと、単音節の語音を複数保持している語音データベースを参照して、呈示する単音節の語音を決定するステップと、決定された語音を、前記ユーザに聴覚的刺激として順次呈示するステップと、前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定するステップと、判定結果に応じて、前記ユーザが前記語音を努力して聞いているか否かの評価結果を出力するステップと、前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定するステップと、判定結果に応じて、前記ユーザが前記語音をうるさいと感じているか否かの評価結果を出力するステップとを実行させる。
 本発明によれば、音声呈示後のユーザ脳波の潜時約750msの陽性成分と潜時約200msの陰性成分の有無に応じて、語音聴取に対してどれくらい努力したか(努力性)と、語音をどれくらいうるさいと感じたか(うるささ)を判定し、語音聴取の快適性とする。そして、語音がどれくらい聞き分けられたかを示す明瞭度の軸に加えて、語音聴取の快適性の軸で補聴処理の評価を実現する。努力性・うるささを要素とした快適性評価により、ユーザは、快適性が高く(努力が不要でうるささを感じない)、長時間にわたって補聴器を装用しても疲れにくい補聴処理を選択できるようになる。
脳波計測実験の実験手順の概要を示す図である。 1ブロック分の手順を示すフローチャートである。 (a)は音声と歪みの6条件の分類を示す図であり、(b)は周波数ごとのゲイン調整量を示す図である。 (a)は国際10-20法(10-20 System)の電極位置を示す図であり、(b)は本実験で電極を装着した電極配置を示す図である。 努力性に関する参加者ごとの主観評価の結果を示す図である。 うるささに関する参加者ごとの主観評価の結果を示す図である。 (a)は、頭頂部(Pz)における音声呈示を起点とした事象関連電位を、上述の方法でラベル付けした努力性高/努力性低ごとに総加算平均した波形を示す図であり、(b)は、サンプリングごとt検定の結果のp値のプロット図である。 頭頂部(Pz)において音声刺激を起点とした事象関連電位をラベル付けした「うるさい」/「うるさくない」の基準によって分けて総加算平均した波形を示す図である。 (a)は、本願発明者らによってまとめられた、陽性成分/陰性成分の有無と、努力性/うるささ判定との対応関係を示す図であり、(b)は、陽性成分および陰性成分の有無と、補聴処理の評価との対応関係を示す図である。 本実施形態による快適性評価システム100の構成および利用環境を示す図である。 実施形態1による語音聴取の快適性評価装置1のハードウェア構成を示す図である。 実施形態1による快適性評価システム100の機能ブロックの構成を示す図である。 67S式語表の20語音を検査語音として用いる場合の語音DB71の例を示す図である。 結果蓄積DB80におけるデータ蓄積の例を示す図である。 (a)~(c)は、語音明瞭度曲線の測定結果(従来評価)と、従来評価に加えて実施形態1による語音聴取の快適性評価結果の例を示す図である。 快適性評価システム100において行われる処理の手順を示すフローチャートである。 単音節の単語ごとに努力性とうるささを評価した結果の一例を示す図である。 実施形態2による快適性評価システム200の機能ブロックの構成を示す図である。 (a)および(b)は、結果蓄積DB85におけるデータ蓄積の例を示す図である。 実施形態2による語音明瞭度システム200の処理手順を示すフローチャートである。 ある音圧レベルで語音を呈示した場合の、従来の語音明瞭度評価の結果と、それに実施形態2における快適性評価の結果を加えた場合の結果を、概念的に示す図である。 実施形態3による快適性評価システム300の機能ブロックの構成を示す頭である。 実施形態3による語音明瞭度システム300の処理手順を示すフローチャートである。
 以下、添付の図面を参照して、本発明による語音聴取の快適性評価システム(以下「快適性評価システム」と記述する。)の実施形態を説明する。
 本発明による快適性評価システムは、語音聴取時のユーザ状態として、脳波を利用してユーザがどの程度快適に語音を聴取したか、を評価するために用いられる。より具体的には、本システムは、単音節の語音を音声で呈示し、ユーザに音声を聞き分けさせる設定で、音声呈示を起点として計測したユーザ脳波の事象関連電位を指標に、語音聴取の快適性を評価する。なお、本明細書において、「事象関連電位」とは、脳波の一部であり、外的あるいは内的な事象に時間的に関連して生じる脳の一過性の電位変動をいう。また、「音声を呈示する」とは、聴覚刺激(「音声刺激」ともいう。)を出力すること、たとえば音声をスピーカから出力することをいう。なお、スピーカの種類は任意であり、床やスタンド上に設置されたスピーカでもよいし、ヘッドフォン型のスピーカでもよい。ただしスピーカは、正しく評価を行うために指定した音圧で正確に出力できる必要がある。
 本願発明者らは、語音聴取の快適性は、(1)どれだけ努力して語音を聞き分けたかを示す“努力性”と、(2)語音をどれだけうるさいと感じたかを示す“うるささ”の2つで定義されるとの考えに想到した。これは、語音明瞭度評価および評価時のユーザ状態を詳細に分析した結果、初めて得られたものである。以下で、具体的に説明する。
 語音明瞭度評価では、語音ごとに音声を聞き分けられたかどうかを○/×で評価し、聞き分けられた語音の数を評価対象の語音数(67S式語表の場合は20)で割って求める。そのため、語音聴取時のユーザ状態は結果に反映されない。
 しかしながら、実際には快適に聞き分けができた場合と、聞き分けはできたが不快であった場合が存在すると考えられる。語音明瞭度評価は、補聴器販売店において実施される短時間の評価である。そのため、評価中のユーザは、最大限に努力して語音音声を聞き分けようとする。ユーザがうるさいと感じたかどうかは評価対象ではないため、我慢できないうるささでなければ少しうるさいと感じてもユーザは我慢して評価課題を遂行する。
 ところが、日常的に長時間にわたって補聴器を装用する場合には、常に最大限の努力を維持して会話を聞き取ることは困難であり、長時間にわたってうるささを我慢することは、ユーザにとって負担である。
 これらの状況に鑑み、本願発明者らは、語音聴取時のユーザ状態として、「努力」あるいは「うるささに対する我慢」が不要な場合と、「努力」あるいは「うるささに対する我慢」が必要な場合は切り分けて評価すべきであると考えた。そして、それらが語音聴取時の快適性の要素であると特定した。努力性およびうるささに関する処理は、それぞれ脳内では全く別の処理であるため、脳波の測定によりそれぞれを切り分けて評価できる可能性がある。
 1.実験概要
 本願発明者らは、語音聴取の快適性評価の実現を目指し、努力性とうるささとを反映した脳波特徴成分を特定するために以下の実験を実施した。
 単音節の語音を音声で呈示し、音声に対応する語音をユーザに思い浮かべさせる設定で、音声呈示を起点に事象関連電位を計測する脳波計測実験を実施した。実験では、語音聴取に対する努力性/うるささに関する主観を測定するために、それらに関する主観報告をさせた。そして、努力性/うるささに関する主観報告に基づき、それぞれ事象関連電位を加算平均した。
 その結果、音声呈示を起点とした事象関連電位において、(1)音声聞き分けに対する努力性が高い場合には、低い場合と比べて頭頂部において潜時約750msの陽性成分が惹起されること、(2)上記陽性成分とは独立に音声に対するうるささの増加に伴い潜時約200msの陰性成分(N1成分)の潜時が短くなること、を発見した。「潜時」とは、音声刺激が呈示された時刻を起点として陽性成分または陰性成分のピークが出現するまでの時間を示す。
 これらの発見から、(1)音声呈示を起点とした事象関連電位の潜時約750msの陽性成分の有無から語音聴取の努力性の評価が可能であること、(2)潜時約200msの陰性成分(N1成分)の潜時から語音聴取のうるささの評価が可能であることを見出した。本手法により、語音聴取のユーザ状態として、努力していたか/うるさいと感じていたかの評価を、客観的・定量的に実現できる。
 以下で、これらをより詳細に説明する。はじめに、語音聴取の快適性評価を実現するために本願発明者らが実施した脳波計測実験について説明する。その後、実施形態としての、語音聴取の快適性を評価する語音聴取の快適性評価装置の概要および語音聴取の快適性評価装置を含む快適性評価システムの構成および動作を説明する。
 2.脳波計測実験
 脳波計測実験では、音声呈示後に取得した努力性、および、うるささに関する主観報告と、音声を起点とした事象関連電位との関係を調べた。以下、図1から図8を参照しながら、脳波計測実験の実験設定および実験結果を説明する。
 実験参加者は、正常な聴力を持つ大学・大学院生13名であった。
 図1は、脳波計測実験の実験手順の概要である。まず、手順Aにおいて単音節の音声を呈示した。呈示した音声の詳細は後述する。次に手順Bにおいて、参加者に音声を聞かせ、聞き取った音声に対応する平仮名を書き取らせた。呈示音声の条件を変えず、語音の種類のみ変化させた。手順AとBを5試行繰り返した。そして手順Cにおいて、参加者に手順Aで呈示された音声に対する、努力性/うるささ等に関する主観評価を行わせた。主観評価はタッチパネルを利用し、ビジュアルアナログスケール(100段階評価)で行った。上述の手順Aから手順Cを1ブロックとして12ブロック繰り返した(計60試行)。ブロックごとに呈示音声の音圧と歪みの条件は、ランダムな順序で変化させた。
 図2は、1ブロック分の手順を示すフローチャートである。
 ステップS11では単音節の音声が実験参加者に呈示される。
 ステップS12では参加者は単音節の音声を聞いて対応する文字を思い浮かべる。
 ステップS13では、参加者は聞き取った音声に対する文字を書き取る。
 ステップS14では、音声が呈示された回数がカウントされる。呈示回数が4回まではS11に戻る。呈示回数が5回のときS15に進み、呈示回数をリセットする。
 ステップS15では参加者はステップS11で聞き取った音声に対して主観を回答する。
 刺激として呈示した語音音声は、聞き取り間違いが多いとされる無声子音の中から日本聴覚医学会が制定した67S式語表の8音(シ、ス、キ、ク、タ、テ、ト、ハ)とした。正常な聴力を有する参加者に対して、快適性の要素である努力性とうるささを操作するために、周波数ゲインを調整した語音音声を用いた。「周波数ゲイン」とは、複数の周波数帯域ごとのゲイン(回路の利得、増幅率)を意味する。
 周波数ゲインの調整には、音圧3種類(大:Large、中:Middle、小:Small)×歪み2種類(なし:Flat、あり:Distorted)の計6条件を設定した。具体的には以下の(1)~(6)のとおりである。本明細書では、たとえば、音圧大・歪みなしはLargeとFlatの頭文字を取り、LF条件などと呼ぶ。
 (1)LF(Large Flat)条件:音圧は大きく聞き分け易い音声として全ての周波数帯域においてゲインを20dB向上させた。(2)LD(Large Distorted)条件:音圧は大きいが聞き分けが難しい音声としてMD条件をベースに全体的に20dB向上させた。(3)MF(Middle Flat)条件:音圧が大きく聞き分けやすい音声として周波数ゲインの加工をしなかった。(4)MD(Middle Distorted)条件:聞き分けが難しい音声としてLF条件の音声を250Hz-16kHzの周波数のゲインを段々と-30dBまで調整(低減)した。(5)SF(Small Flat)条件:音圧は小さいが聞き分け易い音声として全ての周波数帯域においてゲインを20dB下げた。(6)SD(Small Distorted)条件:音圧が小さく聞き分けが難しい音声としてMD条件をベースに全体的に20dB下げた。
 図3(a)は、音声と歪みの6条件の分類を示す。また、図3(b)は、周波数ごとのゲイン調整量を示す。高周波数帯の周波数ゲインを低減させた理由は、高齢難聴の典型的なパターンである高音漸傾型を模擬するためである。音声刺激は、周波数特性がフラットなスピーカから呈示した。
 脳波は頭皮上のFz、Cz、Pz、C3、C4(国際10-20法)、左右こめかみ、右目上下から右マストイドを基準に記録した。「マストイド」とは、耳の裏の付け根の下部の頭蓋骨の乳様突起である。図4(a)は、国際10-20法(10-20 System)
の電極位置を示し、図4(b)は本実験で電極を装着した電極配置を示す。サンプリング周波数は200Hz、時定数は1秒とした。オフラインで0.05-6Hzのディジタルバンドパスフィルタをかけた。音声呈示に対する事象関連電位として、音声が呈示された時刻を起点に-200msから1000msの波形を切り出した。ここで、「-200ミリ秒」とは、音声を呈示する時刻より200ミリ秒前の時点をいう。
 以下、主観評価結果の分布と閾値の設定を説明する。
 まず、主観評価の結果を示す。主観評価結果に基づき、後述の方法で決定した参加者ごとに閾値に基づいて、努力性/うるささの有無のラベル付けを行った。以下では、その主観評価のラベルを語音聴取時のユーザ状態とする。
 図5は、努力性に関する参加者ごとの主観評価の結果である。図5には全試行に対する割合が示されている。図5中の実線は主観評価結果の分布であり、破線は主観評価(努力性高/努力性低)を分割した閾値を示す。主観評価の個人差が大きいため、閾値は個人ごとの評価結果(ビジュアルアナログスケールの1~100)の順位に基づいて決定した。具体的には、個人内での評価結果の順位が中央になる値を閾値とした。ただし、評価結果が同じものは同じ主観評価として扱った。
 図6は、うるささに関する参加者ごとの主観評価の結果である。図6には全試行に対する割合が示されている。図6中の実線は主観評価結果の分布であり、破線は主観評価(「うるさい」/「うるさくない」)を分割した閾値を示す。努力性と同様、本願発明者らは、閾値を個人ごとの評価結果(ビジュアルアナログスケールの1~100)の順位に基づいて決定した。具体的には本願発明者らは、個人内での評価値の順位が、評価値が大きい方から3分の1を「うるさい」、それ以外を「うるさくない」とし、閾値を設定した。ただし、評価結果が同じものは同じ主観評価として扱った。
 次に、努力性に関する実験結果を説明する。
 以下、事象関連電位の結果を説明する。まず、主観評価の結果によってラベル付けした、努力性高/努力性低に基づいて加算平均した結果を、次に「うるさい」/「うるさくない」の基準に基づいて加算平均した結果を説明する。
 図7(a)は、頭頂部(Pz)における音声呈示を起点とした事象関連電位を、上述の方法でラベル付けした努力性高/努力性低ごとに総加算平均した波形である。加算平均は、上記計測実験の全6条件におけるブロックごとの努力性に関する主観評価に基づいて行った。図7(a)の横軸は時間で単位はms、縦軸は電位で単位はμVである。図7(a)に示されたスケールから明らかなとおり、グラフの下方向が正(陽性)に、上方向が負(陰性)に対応している。図7(a)に示される破線は努力性低の場合、実線は努力性高い場合の総加算平均波形である。
 図7(a)より、語音聴取時の努力性低の場合(破線)に比べて努力性高の場合(実線)では、潜時600-900msの陽性成分の振幅が大きいことが見てとれる。主観評価ごとの600-900msの区間平均電位を見てみると、努力性低の場合は1.99μV、努力性高の場合には2.73μVであった。区間平均電位をt検定した結果、10%水準で有意差があった。図7(b)は、サンプリングごとt検定の結果のp値である。図7(b)より、音声刺激を起点に約600-900msの時間帯において、他の時間帯と比べてp値が小さいことが分かる。したがって、語音聴取の努力性は、音声呈示を起点として潜時約600-900msの陽性電位に反映される可能性があるといえる。0msから1000msにおける全てのサンプリングごとにt検定を実施した結果、主観評価の違いによる有意差が15ms以上持続した時間帯は420-445ms、655-670ms、730-745ms、775-830msであった(p < .05)。
 図8は、頭頂部(Pz)において音声刺激を起点とした事象関連電位を、上述の方法でラベル付けした「うるさい」/「うるさくない」の基準によって分けて総加算平均した波形である。加算平均は、上記計測実験の全6条件における、ブロックごとのうるささに関する主観評価に基づいて行った。図8の横軸は時間で単位はms、縦軸は電位で単位はμVである。図7(a)と同様、図8中に示されたスケールから明らかなとおり、グラフの下方向が正(陽性)に、上方向が負(陰性)に対応している。図8中に示される実線は「うるさい」場合の総加算平均波形であり、破線は、「うるさくない」場合の総加算平均波形である。
 図8より、「うるさくない」場合の破線に比べて、「うるさい」場合の実線では、潜時約200msに惹起される陰性成分(N1成分)の潜時が短いことが分かる。参加者ごとのN1成分の潜時は「うるさい」場合は195ms、「うるさくない」場合には240msであった。潜時をt検定した結果、有意差が認められた(p<.05)。また、参加者ごとの潜時200ms-300msの区間平均電位は、「うるさい」場合は0.14μV、「うるさくない」場合には-1.38μVであった。潜時200ms-300msの区間平均電位をt検定した結果、「うるさい」場合の区間平均電位は有意に大きかった(p<.05)。よって、音声呈示を起点としたN1成分の潜時と、音声呈示を起点として約200-300msの陰性成分の平均電位はうるささを反映し、語音聴取時のうるささの指標として利用できるといえる。0ms-1000msにおける全てのサンプリングごとにt検定を実施した結果、主観評価の違いによる有意差が15ms以上持続した時間帯は50-70ms、155-175ms、225-290ms、920-935msであった。
 3.考察
 以上、脳波計測実験により、語音聴取の快適性の要素である努力性とうるささをそれぞれ反映する脳波成分の存在が明らかになった。具体的には、努力性は潜時約750msにピークを持つ陽性電位に、うるささは潜時約200msにピークを持つ陰性電位にそれぞれ反映されることを発見した。
 陰性成分に関してはこれまでに、純音を刺激として呈示する場合に刺激音の音圧増加に伴ってN1成分(潜時約100msの陰性成分)の振幅が増大することが報告されている(たとえば、Naatanen, R., & Picton, T. W.(1987). The N1 wave of the human electric and magnetic response to sound : a review and an analysis of the component structure. Psychophysiology, 24, 375-425.)。
 しかしながら、N1成分の振幅は音圧の他に、刺激音の立ち上がりや持続時間によって変化するため、立ち上がりや周波数、パワーが時間変化する「語音」を刺激として用いた場合の音圧レベルと陰性成分の関係性は明らかでなかった。加えて、音声刺激聴取時のうるささの主観報告(「うるさい」/「うるさくない」)を反映して、N1成分に差異があることは分からなかった。
 よって、語音聴取時のユーザのうるささに関する主観(「うるさい」/「うるさくない」)を反映して潜時約200msの陰性成分の振幅が増大するという事実は、本願発明者らが実施した、脳波計測実験によって初めて明らかになったといえる。
 上述の頭頂部(Pz)における潜時約750msの陽性成分(図7)および、うるささに関する主観評価ごとの潜時約200msの陰性成分(図8)は、たとえば該当区間のピーク振幅の大きさを閾値処理する方法、典型的な上記成分の波形からテンプレートを作成してそのテンプレートとの類似度を算出する方法等によって識別可能である。なお、閾値・テンプレートはあらかじめ保持した典型的なユーザのものを利用してもよいし、個人ごとに作成してもよい。
 また、今回の実験では、音声が呈示された時刻を起点とした事象関連電位に聞き分け自信度やうるささに関する主観を反映した成分が出現することを確認する意味で13人の参加者のデータを加算平均した。しかし、特徴量抽出の方法(たとえば波形のウェーブレット変換)や識別方法(たとえばサポートベクターマシンラーニング)の工夫により、非加算または数回程度の少数加算でも陽性成分・陰性成分の識別は可能である。
 本願明細書においては、事象関連電位の成分を定義するためにある時点から起算した所定時間経過後の時刻を、たとえば「潜時約750ms」と表現している。これは、750msという特定の時刻を中心とした範囲を包含し得ることを意味している。「事象関連電位(ERP)マニュアル-P300を中心に」(加我君孝ほか編集、篠原出版新社、1995)の30頁に記載の表1によると、一般的に、事象関連電位の波形には、個人ごとに30msから50msの差異(ずれ)が生じる。したがって、「約Xms」や「Xms付近」という語は、Xmsを中心として30から50msの幅がその前後(例えば、300ms±30ms、750ms±50ms)に存在し得ることを意味している。
 なお、上述の「30msから50msの幅」はP300成分の一般的な個人差の例であるが、上記潜時約750msの陽性成分はP300と比べて潜時が遅いためユーザの個人差がさらに大きく現れる。よって、より広い幅、たとえば前後に各100msから150ms程度の幅であるとして取り扱うことが好ましい。よって、本実施形態において、「潜時約750ms」は、600msから900msの範囲内に存在する潜時を示す。
 また、「潜時200ms付近」や「潜時約200ms」についても、潜時200msに対して前後に各30msから50msの幅を持つとしてもよいし、それよりも若干広い幅、たとえば前後に各50msから100msの幅を持つとしてもよい。
 以上、本願発明者らが実施した脳波計測実験により、音声が呈示された時刻を起点とした事象関連電位において、(1)潜時約750msの陽性成分が語音聴取の努力性を反映すること、(2)潜時約200msの陰性成分がうるささを、それぞれ反映することが明らかになった。努力性とうるささは、本願発明者らが特定した語音聴取時に評価すべき快適性の2つの要素である。
 ゆえに、音声刺激に対する事象関連電位を指標に評価した努力性とうるささの結果に基づき、それらを合わせて語音聴取の快適性評価が実現可能となる。
 図9(a)は、本願発明者らによってまとめられた、陽性成分/陰性成分の有無と、努力性/うるささ判定との対応関係を示す。陽性成分の有無に基づいて、陽性成分なしの場合(陽性成分の振幅が閾値より小さい)には努力性が低いと判定し、陽性成分ありの場合(陽性成分の振幅が閾値より大きい)には努力性高いと判定する。また、陰性成分の有無に基づいて、陰性成分なしの場合(陰性成分の潜時が閾値以上に長い)には「うるさくない」と判定し、陰性成分ありの場合(陰性成分の潜時が閾値より短い)には「うるさい」と判定する。
 なお、一般的には「陽性成分」とは0μVよりも大きい電位を意味する。しかしながら、本願明細書において「陽性成分」とは、絶対的に陽性である(0μVよりも大きい)ことを要しない。本願明細書では、聞き分け自信度が高いか低いかを識別するために「陽性成分」の有無を識別しており、聞き分け自信度の有意な高低を弁別できる限り、区間平均電位等が0μV以下であってもよい。
 なお、一般的には「陰性成分」とは潜時の長短に関わらず0μVよりも小さい電位を意味する。しかしながら本願明細書では、「うるさい」と感じたか否かを識別するために、潜時が所定の閾値よりも短い場合を「陰性成分あり」、潜時が所定の閾値よりも長い場合を「陰性成分なし」と定義する。閾値の具体例は後述する。
 また、図9(b)は、陽性成分および陰性成分の有無と、補聴処理の評価との対応関係を示す。セル(A)は、陽性成分・陰性成分がともに存在した場合である。この場合には、ゲイン調整した周波数が最適ではない、あるいは周波数ごとのゲイン調整の量が過多であると評価する。セル(B)は、陽性成分は存在したが、陰性成分は存在しなかった場合である。この場合には、努力により聞き分けが可能だが努力が必要で日常的に補聴器を装用する場合には向かないと評価する。セル(C)は、陽性成分が存在せず、陰性成分が存在した場合である。この場合には、語音聴取に努力は必要ないが、全体的に増幅しすぎであると評価する。セル(D)は、陽性成分・陰性成分がともに存在しなかった場合である。この場合には、ユーザが快適に語音を聞き分けることができる、適した補聴処理であると評価する。
 このように、陽性成分と陰性成分の有無に基づき、努力性とうるささを判定し、語音聴取の快適性を評価することで、同じ明瞭度であっても、ユーザが語音聴取時に努力が必要であるのか、「うるさい」と感じているのかが判定できる。そこで、たとえば、結果がセル(B)に該当する場合にはゲイン調整量を全体的に上げ、また結果がセル(C)に該当する場合にはゲイン調整量を全体的に下げる、のように語音聴取の快適性を向上させるための具体的なフィッティング手順への落とし込みを実現できる。
 以下、本発明の実施形態にかかる快適性評価システムを説明する。快適性評価システムは、単音節の語音を音声で順次呈示し、音声が呈示された時刻を起点とした事象関連電位の潜時約750msの陽性成分と潜時約200msの陰性成分の有無に基づいて、語音聴取の努力性とうるささを判定し、快適性評価を実現する。これは本願発明者らの発見に基づき初めて実現される。
 4.実施形態1
 以下では、まず、快適性評価システムの概要を説明する。その後、語音聴取の快適性評価装置を含む快適性評価システムの構成および動作を説明する。
 本実施形態による快適性評価システムは、音声を順次呈示し音声呈示時刻の各々を起点に事象関連電位を計測する。そして、潜時約750msの陽性成分と、潜時約200msの陰性成分とを検出し、語音聴取の快適性の要素である努力性とうるささとをそれぞれ判定する。
 本実施形態においては、探査電極を頭頂部(Pz)に設け、基準電極を左右どちらかのマストイドに設けて、探査電極と基準電極の電位差である脳波を計測した。なお、事象関連電位の特徴成分のレベルや極性は、脳波計測用の電極を装着する部位や、基準電極および探査電極の設定の仕方に応じて変わる可能性がある。しかしながら、以下の説明に基づけば、当業者は、そのときの基準電極および探査電極に応じて適切な改変を行って事象関連電位の特徴成分を検出し、語音明瞭度の評価を行うことが可能である。そのような改変例は、本発明の範疇である。
 上記脳波計測実験の説明においては、実験的に正常な聴力を有する参加者に対して周波数ゲインの強弱を変化させて、難聴者の聞こえの状況に近い状況を再現した。しかしながら、難聴者に対して評価を実施する場合には聞き分けにくい語音をあえて呈示する必要はない。本実施形態では、あらかじめ測定した難聴者のオージオグラムからフィッティング手法に基づいて、周波数ごとのゲインが最適に調整された音声を呈示することを前提とする。
 図10は、本実施形態による快適性評価システム100の構成および利用環境を示す。この快適性評価システム100は後述する実施形態1のシステム構成に対応させて例示している。なお、「快適性評価システム」は「語音聴取の評価システム」とも呼ばれることがある。続く実施形態2および3においても同様である。
 快適性評価システム100は、語音聴取の快適性評価装置1と、音声出力部11と、生体信号計測部50とを備えている。生体信号計測部50は少なくとも2つの電極AおよびBと接続されている。電極Aはユーザ5のマストイドに貼り付けられ、電極Bはユーザ5の頭頂部(いわゆるPz)の頭皮上に貼り付けられている。
 快適性評価システム100は、単音節の語音をある音圧の音声でユーザ5に呈示し、音声呈示時刻を起点に計測したユーザ5の脳波(事象関連電位)において潜時約750msの陽性成分の有無と潜時約200msの陰性成分の有無を判定する。そして、呈示音声と当該陽性成分・陰性成分の有無に基づき、それぞれ語音聴取時にユーザが努力していたか・うるさいと感じたかを判定する。
 ユーザ5の脳波は、電極Aと電極Bとの電位差に基づいて生体信号計測部50により取得される。生体信号計測部50は、電位差に対応する情報(脳波信号)を無線または有線で語音聴取の快適性評価装置1に送信する。図10では、当該情報を生体信号計測部50が無線で語音聴取の快適性評価装置1に送信する例を示している。
 語音聴取の快適性評価装置1は、語音聴取の快適性評価のための音声の音圧や呈示タイミングの制御を行い、音声出力部11(たとえばスピーカ)を介してユーザ5に音声を呈示する。
 図11は、本実施形態による語音聴取の快適性評価装置1のハードウェア構成を示す。語音聴取の快適性評価装置1は、CPU30と、メモリ31と、オーディオコントローラ32とを有している。これらは互いにバス34で接続され、相互にデータの授受が可能である。
 CPU30は、メモリ31に格納されているコンピュータプログラム35を実行する。コンピュータプログラム35には、後述するフローチャートに示される処理手順が記述されている。語音聴取の快適性評価装置1は、このコンピュータプログラム35にしたがって、同じメモリ31に格納されている語音データベース(DB)71を利用して、快適性評価システム100の全体を制御する処理を行う。この処理は後に詳述する。
 オーディオコントローラ32は、CPU30の命令に従って、それぞれ、呈示すべき音声を生成し、生成した音声信号を指定された音圧で音声出力部11に出力する。
 なお、語音聴取の快適性評価装置1は、1つの半導体回路にコンピュータプログラムを組み込んだDSP等のハードウェアとして実現されてもよい。そのようなDSPは、1つの集積回路で上述のCPU30、メモリ31、オーディオコントローラ32の機能を全て実現することが可能である。
 上述のコンピュータプログラム35は、CD-ROM等の記録媒体に記録されて製品として市場に流通され、または、インターネット等の電気通信回線を通じて伝送され得る。図11に示すハードウェアを備えた機器(たとえばPC)は、当該コンピュータプログラム35を読み込むことにより、本実施形態による語音聴取の快適性評価装置1として機能し得る。なお、語音DB71はメモリ31に保持されていなくてもよく、たとえばバス34に接続されたハードディスク(図示せず)に格納されていてもよい。
 図12は、本実施形態による快適性評価システム100の機能ブロックの構成を示す。快適性評価システム100は、音声出力部11と、生体信号計測部50と、語音聴取の快適性評価装置1とを有している。図12はまた、語音聴取の快適性評価装置1の詳細な機能ブロックも示している。すなわち、語音聴取の快適性評価装置1は、事象関連電位処理部55と、陽性成分判定部60と、陰性成分判定部65と、呈示語音決定部70と、語音DB71と、結果蓄積DB80とを備えている。なお、ユーザ5のブロックは説明の便宜のために示されている。
 語音聴取の快適性評価装置1の各機能ブロック(語音DB71を除く)は、それぞれ、図11に関連して説明したプログラムが実行されることによって、CPU30、メモリ31、オーディオコントローラ32によって全体としてその時々で実現される機能に対応している。
 語音DB71は、語音聴取の快適性評価を行うための語音のデータベースである。図13は、67S式語表の20語音を検査語音として用いる場合の語音DB71の例を示す。図13に示した語音DB71では、呈示する音声ファイル、子音ラベル、異聴発生尤度(異聴の発生しやすさ)によってグループ分けされたデータが対応付けられている。保存されている音声は、あらかじめ測定した難聴者のオージオグラムからあるフィッティング理論に基づいて周波数ごとのゲイン調整(補聴処理)が完了しているとする。保存される語音の種類は、67S式語表の20語音以外にも、57S式語表の50音を用いてもよい。子音ラベルは、ユーザ5がどの子音において努力性またはうるささが高いかを評価する際に利用される。グループ分けのデータは、ユーザ5がどのグループにおいて努力性またはうるささが高いかを評価する際に利用される。グループ分けは、たとえば大分類、中分類、小分類とする。
 大分類は母音、無声子音、有声子音の分類でそれぞれ0、1、2のように表記している。中分類は無声子音内、有声子音内の分類である。無声子音内はサ行(中分類:1)とタ・カ・ハ行(中分類:2)に、有声子音内はラ・ヤ・ワ行(中分類:1)とナ・マ・ガ・ザ・ダ・バ行(中分類:2)に分類できる。小分類は、ナ・マ行(小分類:1)とザ・ガ・ダ・バ行(小分類:2)のように分類できる。異聴発生尤度については、「補聴器フィッティングの考え方」(小寺一興、診断と治療社、1999年、172頁)を参照した。
 再び図12を参照する。呈示語音決定部70は、語音DB71を参照し、どの語音をどの音圧レベルで呈示するかを決定する。呈示語音は、たとえばランダムな順序で選択・決定してもよい。呈示語音の音圧レベルは、語音明瞭度曲線測定の55dB SPL、65dB SPL、75dB SPL、85dB SPLの音声に対して補聴処理を実施した後の音圧レベルとする。音圧レベルは、小さな音圧レベルから大きな音圧レベルに順に変更してもよいし、その逆でもよい。また、ランダムな順序で音圧レベルを選択してもよい。
 呈示語音決定部70は、音声呈示時刻に合わせてトリガを生体信号計測部50へ出力し、また呈示される音声の内容を事象関連電位処理部55に送信する。
 音声出力部11は、呈示語音決定部70によって決定された単音節の音声を再生することにより、ユーザ5に呈示する。
 生体信号計測部50は、ユーザ5の生体信号を計測する脳波計であり、生体信号として脳波を計測する。そして、呈示語音決定部70から受けたトリガを起点に所定区間(たとえば-200msから1000msの区間)の脳波の事象関連電位を切り出し、その波形データ(脳波データ)を事象関連電位処理部55に送付する。ユーザ5はあらかじめ脳波計を装着しているものとする。脳波計測用の電極はたとえば頭頂部のPzに装着される。
 事象関連電位処理部55は、生体信号計測部50から事象関連電位を受け取り、呈示語音決定部70から受けた呈示音声の内容に応じて、事象関連電位の加算平均演算を行う。事象関連電位処理部55は、たとえば同じ語音の音声呈示に対する事象関連電位のみを選択して、語音の種類毎に事象関連電位の加算平均演算を行う。同じ語音のみで事象関連電位を加算平均した場合には語音ごとの快適性評価が可能となる。加算平均は、同じ子音を持つ語音を選択して行ってもよいし、図13で示したグループの大分類・中分類・小分類ごとに行ってもよい。同じ子音を持つ語音で加算平均した場合には、子音の種類毎に、語音聴取の努力性・うるささの評価が可能となる。また、グループごとに加算平均した場合には、たとえば有声子音と無声子音では無声子音に対して努力性が高い、のようにグループにおける聞き分け評価が可能となる。子音ごと、グループごとの加算平均によって、ある程度加算回数が確保された加算波形がそれぞれ得られる。また、たとえば同じ語音の種類に関わらず、同じ音圧の音声呈示に対する事象関連電位を選択して加算平均してもよい。同じ音圧で加算平均した場合には、音圧ごとの快適性評価が可能となる。
 事象関連電位処理部55は、語音ごとに所定回数の加算平均演算を実行して得られた脳波データを、陽性成分判定部60と陰性成分判定部65とに送付する。ここで、脳波データの送付先ごとに事象関連電位に別々の処理を行ってもよい。たとえば、送り先に応じて加算平均演算を実行する回数を変更してもよいし、送り先に応じて遮断周波数の異なる2種類のフィルタ処理を切り替えて事象関連電位の波形にフィルタ処理を施してもよい。図7および図8からも明らかなように、潜時約750msの陽性成分に比べて潜時約200ms陰性成分の周波数は異なっており、陰性成分でより高周波数である。送り先に応じて異なるフィルタ処理を行うことにより、シグナル/ノイズ比が高い脳波データを得ることができる。
 陽性成分判定部60および陰性成分判定部65は事象関連電位処理部55から脳波データを受け取って、後述する別々の解析を行う。
 陽性成分判定部60は、事象関連電位処理部55から受け取った脳波データに基づいて、潜時約750msの陽性成分の有無を判定する。陽性成分の有無の識別方法は以下のとおりである。
 陽性成分判定部60は、たとえば潜時600msから900msの最大振幅、または、潜時600msから900msの区間平均電位を所定の閾値と比較する。区間平均電位を用いる場合の所定の閾値は、一般的なユーザの陽性成分の有無の閾値として、上述の実験で得られた「努力性高」と「努力性低」の区間平均電位の中央値である2.36μVとしてもよい。そして、区間平均電位が閾値より大きい場合には、陽性成分判定部60は「陽性成分あり」と識別し、小さい場合を「陽性成分なし」と識別する。
 または陽性成分判定部60は、潜時約750msの典型的な陽性成分信号の波形から作成した所定のテンプレートとの類似度(たとえば相関係数)によって類似しているか否かを判定してもよい。そして類似しているといえる場合には、陽性成分判定部60は「陽性成分あり」と識別し、類似しているとはいえない場合には「陽性成分なし」と識別してもよい。所定のテンプレートは、予め取得した一般的なユーザの陽性成分の波形から算出・作成してもよい。
 陰性成分判定部65は、事象関連電位処理部55から受け取った脳波データの潜時約200msにおける、陰性成分の有無を識別する。たとえば、陰性成分判定部65は、潜時100msから300msの陰性電位のピークの潜時を所定の閾値と比較する。そして、陰性電位のピーク潜時が所定の閾値よりも短い場合には「陰性成分あり」と識別し、ピーク潜時が所定の閾値より小さい場合を「陰性成分なし」と識別する。
 たとえば「所定の閾値」は、一般的なユーザの陰性成分の有無の閾値として、上述の実験で得られた「うるさい」と「うるさくない」の陰性成分の潜時の中央値である218msとしてもよい。または、陰性成分判定部65は、潜時約200msの典型的な陰性成分信号の波形から作成した所定のテンプレートとの類似度(たとえば相関係数)によって類似しているか否かを判定してもよい。そして類似しているといえる場合を「陰性成分あり」と識別し、類似していない場合を「陰性成分なし」と識別してもよい。所定の閾値やテンプレートは、予め取得した一般的なユーザの陰性成分の波形から算出・作成してもよい。
 結果蓄積DB80は、呈示した音声の情報を呈示語音決定部70から受け取る。また結果蓄積DB80は、陽性成分判定部60から語音ごとの陽性成分の有無の情報を受け取り、陰性成分判定部65から語音ごとの陰性成分の有無の情報を受け取る。そして、たとえば呈示音声の語音ごと・音圧レベルごとに、受け取った努力性とうるささの判定結果の情報を蓄積する。
 なお、陽性成分判定部60は、陽性成分が存在すると判定した場合、ユーザが語音を努力して聞いているという評価結果を出力し、陽性成分が存在しないと判定した場合には、ユーザが前記語音を努力せずに聞いているという評価結果を出力してもよい。
 努力性の判定結果は、「努力性がある」及び「努力性がない」の2値の判定に加えて、陽性成分の振幅又は区間平均電位に対応する努力性の程度も含んでも良い。この場合、陽性成分判定部60は、努力性の程度と対応させた複数の閾値又はテンプレートを有する。
 例えば、第三の閾値、第四の閾値の順に、閾値が小さくなる場合を考える。陽性成分の振幅値が、第三の閾値以上に大きい場合、努力性が大きいと判定できる。陽性成分の振幅値が、第四の閾値以上でありかつ第三の閾値より小さい場合には、努力性が中と判定できる。陽性成分の振幅値が、第四の閾値より小さい場合には、努力性が小さいと判定できる。また、陽性成分の振幅値又は区間平均電位の値を判定結果としても良い。
 陰性成分判定部65によるうるささの判定結果についても、同様である。
 陰性成分判定部65は、陰性成分が存在すると判定した場合、ユーザが語音をうるさいと感じているという評価結果を出力し、陰性成分が存在しないと判定した場合、ユーザが語音をうるさいと感じていないという評価結果を出力してもよい。
 そして陰性成分判定部65は、「うるさい」及び「うるさくない」の2値に加えて、陰性成分の潜時に対応するうるささの程度を含んでも良い。この場合、陰性成分判定部65は、陽性成分判定部60と同様に複数の閾値又はテンプレートを有する。
 図14は、結果蓄積DB80におけるデータ蓄積の例である。図14では、語音ごと・音圧レベルごとに努力性とうるささの情報をそれぞれ蓄積する場合を例示している。たとえば図14中の「1」は、陽性成分判定部60または陰性成分判定部65において陽性成分または陰性成分が存在したと判定された場合を示し、「0」は、陽性成分または陰性成分が存在しなかったと判定された場合を示す。
 努力性とうるささの判定結果に基づく快適性の評価方法としては、たとえば陽性成分なしと判定された語音の割合と、陰性成分なしと判定された語音の割合を音圧レベルごとに算出し、平均して、快適性の評価結果としてもよい。または、少なくとも1つの音圧レベルに関して、陽性成分なしと判定された語音の割合と、陰性成分なしと判定された語音の割合を算出し、それらの算出結果を利用して快適性の評価結果を生成してもよい。語音の割合に代えて、子音または異聴発生確率に関するグループの割合を利用して快適性の評価結果を求めてもよい。
 上述の快適性を評価する処理は、たとえば結果蓄積DB80が行ってもよい。このときは、結果蓄積DB80は単なる記録媒体ではない。記録媒体に加えて、その記録媒体に蓄積された情報を検索し、抽出する機能等を備えている。それらの機能は、たとえばデータベースサーバとして機能するハードウェアまたはソフトウェア(いずれも図示せず)によって実現される。このデータベースサーバが上記算出処理を行えばよい。
 図15(a)~(c)は、語音明瞭度曲線の測定結果(従来評価)と、従来評価に加えて本実施形態による語音聴取の快適性評価結果の例である。図15(a)は、装用時において呈示音声の音圧レベルごとの語音明瞭度のみを評価した例である。この例は従来の評価手法によって得られた評価結果である。この例では、65dB SPL以上の音圧レベルにおいて、明瞭度は80%以上と評価されている。そのため、非装用時(図15には表示せず)と比較して語音明瞭度が向上している場合には補聴器適合検査で適合と判定される。
 図15(b)および(c)は、図15(a)に示した装用時における語音明瞭度曲線の測定結果に加えて、本実施形態による努力性とうるささの判定に基づく快適性評価を加えた評価結果の例である。語音明瞭度曲線は、発話やキー入力等を行う従来の方法で別途測定したとする。
 図15(b)および(c)では語音明瞭度曲線は同じであるが、快適性評価の結果が大きく異なる。たとえば、図15(b)では、快適性が全体的に低く、特に55dBにおいて低い。これは、努力すれば聞けるが全体的に音圧が低かったと評価できる。また、たとえば、図15(c)では、快適性が全体的に高いが、大きな音圧レベルでは快適性が低い。これは、65dB SPL付近の音圧では適切な補聴処理であるが、85dB SPLと大きな音圧レベルではうるささを感じていると評価できる。これらは、努力性とうるささの2要素で語音聴取の快適性を評価した結果、初めて得られる評価である。このような評価によって、たとえば図15(b)の場合には、全体的にゲイン調整量を上げる、図15(c)の場合にはノンリニア増幅におけるコンプレッションを強くするという具体的なフィッティング手順の提案ができる。
 なお、図15(b)および(c)では、装用時のみの快適性を示しているが、非装用時(裸耳)についても快適性を評価し、非装用時と装用時で快適性を比較してもよい。
 次に、図16を参照しながら図12の快適性評価システム100において行われる処理手順を説明する。
 図16は、快適性評価システム100において行われる処理の手順を示すフローチャートである。
 ステップS101において、呈示語音決定部70は語音DB71を参照しながら呈示する単音節の語音と音圧レベルを決定する。音声出力部11は、決定された音圧レベルでユーザ5にその語音を呈示する。呈示語音決定部70は、生体信号計測部50にはトリガを送信し、事象関連電位処理部55には呈示した語音に関する音声情報を送信する。呈示する語音はDB71からランダムに選択してもよいし、特定の子音またはグループの語音を集中的に選択してもよい。呈示語音の音圧レベルは、たとえば語音明瞭度曲線測定の55dB SPL、65dB SPL、75dB SPL、85dB SPLの音声に対して補聴処理を実施した後の音圧レベルとする。音圧レベルの呈示順序は、小さな音圧レベルから大きな音圧レベルに順に変更してもよいし、その逆でもよい。また、ランダムな順序で音圧レベルを選択してもよい。
 ステップS102において、生体信号計測部50は呈示語音決定部70からトリガを受けて、計測した脳波のうち、トリガを起点にたとえば-200msから1000msまでの事象関連電位を切り出す。そしてたとえば-200msから0msの平均電位を求め、その平均電位が0μVになるよう、得られた事象関連電位をベースライン補正する。
 ステップS103において、事象関連電位処理部55はステップS102で切り出した事象関連電位を、呈示語音決定部70から受けた呈示語音の情報に基づき語音ごと・音圧レベルごとに加算平均する。本実施形態では語音ごと・音圧レベルごとに加算平均演算を行っているが、加算平均演算の対象は語音ごとに限られない。たとえば、語音の種類に応じて(たとえば子音ごとや語音のグループごとに)行ってもよいし、呈示された音圧レベルごとに行ってもよい。すなわち、各語音が語音の種類および呈示されたときの音圧レベルの少なくとも一つに基づいて分類されるときにおいて、事象関連電位処理部55は、同じ分類に属する語音が呈示されたときに得られる脳波信号の事象関連電位を加算平均すればよい。
 ステップS104において、事象関連電位処理部55はステップS101で呈示された語音に対する事象関連電位の加算回数が所定の加算回数に到達したか否かを判定する。加算回数が所定回数以下の場合には処理はステップS101へ戻り、音声の呈示を繰り返す。加算回数が所定回数以上の場合には、処理はステップS105へ進む。加算回数は、たとえば20回である。なお、「20回」は、事象関連電位を計測する分野において多く採用される加算回数であるが、これは一例に過ぎない。
 ステップS105において、事象関連電位処理部55は所定回数の加算平均演算をした脳波データを陽性成分判定部60および陰性成分判定部65に送付する。
 ステップS106において、陽性成分判定部60は、脳波データの潜時約750msに陽性成分が存在するか否かを判定する。陽性成分の識別は、上述のように、所定の閾値との比較によって行ってもよいし、テンプレートとの比較によって行ってもよい。
 ステップS107において、陰性成分判定部65は、脳波データの潜時約200msに陰性成分が存在するか否かを判定する。陰性成分の識別は、上述のように、所定の陰性成分の潜時の閾値比較によって行ってもよいし、テンプレートとの比較によって行ってもよい。
 ステップS108において、結果蓄積DB80は、ステップS101で呈示した語音ごと・音圧レベルごとに、陽性成分判定部60から受け取った潜時約750ms陽性成分の有無の情報と、陰性成分判定部65から受け取った潜時約200msの陰性成分の有無の情報を蓄積する。
 ステップS109において、呈示語音決定部70は、語音聴取の快適性を評価する予定の、全ての語音・音圧レベルにおいて刺激呈示が完了したか否かを判定する。完了していない場合には処理はステップS101へ戻り、完了している場合には語音聴取の快適性評価を終了する。
 結果蓄積DB80において蓄積した語音ごと・音圧レベルごとの努力性・うるささを要素とした快適性評価結果に基づけば、より具体的なフィッティング手順の提案ができる。たとえば、図15(b)のように快適性が全体的に低く、特に55dBにおいて低い場合には、全体的にゲイン調整量を上げる。また、図15(c)のように快適性が全体的に高いが、大きな音圧レベルでは低い場合には、ノンリニア増幅におけるコンプレッションを強くすればよい。
 本実施形態では、単音節の語音を音声で呈示する設定で音声が呈示された時刻を起点とした事象関連電位の潜時約750msの陽性成分と、潜時約200msの陰性成分とを用いた処理により、語音聴取の快適性を評価した。上述の処理によれば、語音聴取時に、ユーザがどれくらい努力したか(努力性)・どれくらいうるささを感じたか(うるささ)に関する判定が実現できる。これは、語音明瞭度とは異なる語音聴取の快適性を軸として、補聴処理の適合度合いを評価できることを意味する。快適性を軸として補聴処理の評価ができるので、快適性が高く聞いていて疲れにくい補聴処理が実現できる。
 なお、本実施形態における語音聴取の快適性評価装置1は、図11に示すとおり、一般的なハードウェアを用いた、小型化可能な構成により実現される。快適性評価装置1を持ち運び可能な大きさおよび重さで構成してユーザが携行することにより、ユーザが補聴器を利用する音環境で語音聴取の快適性を評価することができる。なお、図9では音声出力部11をスピーカとしたが、音声出力部11はヘッドフォンでもよい。ヘッドフォンを用いることで、持ち運びが簡易になりユーザが利用する環境において語音明瞭度の評価が可能となる。
 本実施形態では日本語の語音明瞭度評価を想定して説明した。しかしながら、単音節の語音であれば英語でも中国語でもよい。たとえば英語の場合には、単音節の単語を呈示し、単語ごとの評価をしてもよい。図17は、単音節の単語ごとに努力性とうるささを評価した結果の一例を示している。
 本実施形態の快適性評価システム100によれば、ユーザは音声を聞いて該当する平仮名を思い浮かべるだけで語音聴取時にどれくらい努力したか(努力性)とどれくらいうるささを感じたか(うるささ)の判定が実現される。これにより、語音聴取時の快適性が定量化され、快適性の軸で補聴処理の評価ができるので、快適性が高い補聴処理で、聞いていて疲れにくいフィッティングが実現できる。
 本実施形態の説明では、生体信号計測部50は、呈示語音決定部70からのトリガを起点にして予め定められた範囲の事象関連電位を切り出し、ベースライン補正を行って電位波形のデータを事象関連電位処理部55に送信するとした。しかしながら、この処理は一例である。他の処理として、たとえば、生体信号計測部50は継続的に脳波を計測し、事象関連電位処理部55が必要な事象関連電位の切り出しおよびベースライン補正を行ってもよい。当該構成であれば、呈示語音決定部70は生体信号計測部50にトリガを送信する必要はなくなり、事象関連電位処理部55にトリガを送信すればよい。
 また、本実施形態においては、快適性評価の結果は、結果蓄積DB80に蓄積されるとしたが、蓄積しなくてもよい。たとえば結果蓄積DB80を快適性評価装置1の外部に設ける場合には、陽性成分判定部60および陰性成分判定部65は各判定結果を単に出力すればよい。各判定結果は、語音聴取の快適性に関する情報として利用され得る。
 また、陽性成分判定部60および陰性成分判定部65は、それぞれ陽性成分及び陰性成分の有無を判定し、その判定結果を出力するとして説明した。しかしながら、この構成は一例である。たとえば陽性成分判定部60は、陽性成分が存在するときは努力性の指標が大きいと判断し、陰性成分判定部65は、陰性成分が存在するときはうるささの指標が大きいと判断しても良い。または、判定結果に応じた語音聴取に努力が必要であった/必要でなかった、という評価結果や、うるさいと感じた/感じていない、という評価結果を出力し、評価結果を結果蓄積DB80に蓄積してもよい。判定結果または評価結果のいずれを出力するかは、陽性成分判定部60および陰性成分判定部65の各々について独立して設定することができる。
 なお、判定結果は、陽性/陰性成分が現れたか否かを示す2値の数値を用いて出力されてもよいし、陽性/陰性成分の存否を表す数値以外の形式(たとえば文字情報)で出力されてもよい。また、努力が必要であった/必要でなかった、うるさいと感じた/感じていないという評価結果については、それぞれを示す2値の数値を用いて出力されてもよいし、努力およびうるさいと感じた程度が3値以上の数値を用いて出力されてもよい。または、それらの程度を示す数値以外の形式(たとえば文字情報)で出力されてもよい。
 5.実施形態2
 実施形態1による快適性評価システム100では、語音DB71に保存されたある1種類の補聴処理に基づいてあらかじめ調整された所定の音声に対して、潜時約750msの陽性成分と潜時約200msの陰性成分の有無に基づき、語音聴取時の努力性とうるささを判定した。
 しかしながら、近年、信号処理の高精度化に伴い、たとえば子音強調、指向性、ノイズリダクション等の機能を実現する補聴処理方法の開発が進んでおり、1つの補聴処理に対する快適性評価の結果のみから、最適な補聴処理を探索・特定することは困難であった。
 そこで本実施形態では、呈示する語音音声を補聴器から出力される音に加工する補聴処理部を設け、補聴処理ごとの快適性を評価する、快適性評価システムについて説明する。
 図18は、本実施形態による快適性評価システム200の機能ブロックの構成を示す。快適性評価システム200は、音声出力部11と、生体信号計測部50と、語音聴取の快適性評価装置2とを有している。図12と同じブロックについては同一の参照符号を付し、その説明は省略する。なお、語音聴取の快適性評価装置2のハードウェア構成は、図11に示すとおりである。実施形態1で説明したプログラム35(図11)と異なる処理を規定するプログラムが実行されることにより、図18に示す本実施形態による語音聴取の快適性評価装置2が実現される。
 本実施形態による語音聴取の快適性評価装置2が、実施形態1による語音聴取の快適性評価装置1と大きく相違する点は、新たに補聴処理部90を設けた点である。なお、快適性評価装置2の構成要素名に関しては、原則として実施形態1と同じ名称を用いているが、異なる動作および/または機能を有している場合には、異なる参照符号を用いている。たとえば、本実施形態では、実施形態1では行わなかった、複数の補聴処理ごとの快適性評価を実施するため、実施形態1にかかる事象関連電位処理部55、呈示語音決定部70、語音DB71、結果蓄積DB80に代えて、本実施形態では事象関連電位処理部56、呈示語音決定部75、語音DB72、結果蓄積DB85を設けている。
 以下、語音DB72、呈示語音決定部75、補聴処理部90、事象関連電位処理部56、結果蓄積DB85および補聴処理部90を説明する。
 語音DB72は、実施形態1にかかる語音DB71と同様に、たとえば図13に示した67S式語表の20語音のような語音聴取の快適性評価を行うための語音データベースである。語音DB71との差異は、補聴処理前の語音データを持つ点である。
 呈示語音決定部75は、実施形態1にかかる呈示語音制御部70と同様に語音DBを参照し、語音の種類と音圧レベルを決定する。呈示語音制御部70との差異は、どの補聴処理で音声を加工するかを選択し、補聴処理部90に呈示語音の音声データを共に送付する点である。
 補聴処理部90は、呈示語音決定部75から受けた補聴処理選択に関する指示と、音声データとに基づき、音声データを指示された補聴処理方法で加工する。補聴処理には、たとえば子音強調、指向性、ノイズリダクション等がある。子音強調の補聴処理が選択されていた場合には、たとえば通常よりも子音周波数のゲイン増幅量を上げるという処理をほどこし、音声データを加工する。
 事象関連電位処理部56は、実施形態1にかかる事象関連電位処理部55と同様に、呈示語音制御部から受けた呈示音声の内容に応じて、制定信号計測部50から受けた事象関連電位の加算平均演算を行う。事象関連電位処理部55との差異は、呈示語音決定部75から補聴処理の情報を受けて、語音ごと・音圧レベルごと・補聴処理ごとの加算平均演算を行う点である。
 結果蓄積DB85は、実施形態1にかかる結果蓄積DB80と同様に、たとえば語音ごと・音圧レベルごとに、陽性成分判定部60から受け取った潜時約750msの陽性成分の有無の情報と、陰性成分判定部65から受け取った潜時約200msの陰性成分の有無の情報を蓄積する。結果蓄積DB80との差異は、呈示語音決定部75から、呈示刺激の語音・音圧レベルの情報に加えて、補聴処理の種類の情報を受け取り、補聴処理の種類ごとにデータを蓄積する点である。
 図19(a)および(b)は、結果蓄積DB85におけるデータ蓄積の例である。図19(a)および(b)では、語音ごと・音圧レベルごと・補聴処理ごとに努力性とうるささの判定結果をそれぞれ蓄積する場合を例示している。たとえば図19(a)は、結果蓄積DB85に蓄積された、ある補聴処理Aの語音ごと・音圧レベルごとの、努力性とうるささの判定結果を示す。図19(b)は、結果蓄積DB85に蓄積された、ある補聴処理Bの語音ごと・音圧レベルごとの、努力性とうるささの判定結果を示す。図19(a)および(b)中の「1」は、陽性成分判定部60または陰性成分判定部65において陽性成分または陰性成分があったと判定された場合で、「0」は、陽性成分または陰性成分がなかったと判定された場合を示す。
 次に、図20を参照しながら、快適性評価システム200において行われる全体的な処理の手順を説明する。
 図20は、本実施形態による語音明瞭度システム200の処理手順を示すフローチャートである。図20では、快適性評価システム100の処理(図16)と同じ処理を行うステップについては同一の参照符号を付し、その説明は省略する。
 本実施形態による快適性評価システム200の処理が、実施形態1による快適性評価システム200の処理と相違する点は、ステップS201、S202およびS203である。ステップS201では、指定された補聴処理で加工した単音節音声が呈示される。ステップS202では、語音・音圧レベル・補聴処理ごとに加算平均演算が行われる。ステップS203では、語音ごと・音声ごと・補聴処理ごとに結果が蓄積される。それ以外のステップについては、図16に関連して既に説明しているため、説明を省略する。
 以下、ステップS201~S203を詳細に説明する。
 ステップS201において、呈示語音決定部75は、語音DB72を参照して呈示する音声の種類と音圧レベルを決定し、そのデータを取得する。さらに、呈示語音決定部75は、補聴処理を決定して、補聴処理の種類に関する情報と音声データを補聴処理部90に送付する。補聴処理部90は、呈示語音決定部75によって決定された補聴処理の種類に関する情報と音声データとを受け取り、指定された補聴処理方法に基づいて音声データを加工する。音声出力部11は、加工された音声データをユーザ5に呈示する。
 ステップS202において、事象関連電位処理部56は呈示語音決定部75から受けた呈示語音の種類、音圧レベル、補聴処理の情報を受けて、生体信号計測部50で計測した脳波の事象関連電位を、たとえば語音ごと・音圧レベルごと・補聴処理ごとに加算平均する。
 ステップS203において、結果蓄積DBは、呈示語音決定部75から受けた呈示語音に関する情報(語音の種類、音圧レベル、補聴処理)ごとに、陽性成分判定部60で判定した潜時約750msの陽性成分の有無と、陰性成分判定部65で判定した潜時約200msの陰性成分の有無を蓄積する。結果蓄積の例は、図19(a)および(b)に示したとおりである。
 このような処理によって、たとえば、子音強調、指向性、ノイズリダクション等の補聴処理ごとに、語音聴取に対する快適性が評価できる。図21は、ある音圧レベルで語音を呈示した場合の、従来の語音明瞭度評価の結果と、それに本実施形態における快適性評価の結果を加えた場合の結果を、概念的に示す。図21中に示した、処理Aは子音強調、処理Bは指向性、処理Cと処理Dはノイズリダクションの補聴処理を想定している。それぞれのプロットは、以下の仮説に基づいている。
 子音強調(処理A):子音の周波数帯のゲイン調整量を増やすため、明瞭度は向上するが、音声そのものの周波数特性が変化するため、快適性が低下する。
 指向性(処理B):明瞭度そのものは変化しないが、音源が異なるノイズが低減されるため、快適性は向上する。
 ノイズリダクション(処理Cと処理D):ノイズとともに音声情報もリダクションされるため、明瞭度は下がるが、うるささが低減するため快適性は向上する。従来は、語音明瞭度評価の結果のみに基づき、補聴処理ごとの明瞭度のみが評価されたため、たとえば処理Cや処理Dは、適合度が悪いと判定された。しかし、快適性の軸を加えることで、それらの補聴処理の効果をより適切に評価できるようになる。
 本実施形態の快適性評価システム200によれば、補聴処理ごとの快適性を評価できる。これによって、補聴器装用の目的、使用環境に合わせた補聴処理の選択が実現できるようになる。
 6.実施形態3
 実施形態1による快適性評価システム100では、陽性成分判定部60と陰性成分判定部65において、一般的なユーザの陽性成分/陰性成分から算出した閾値や、一般的なユーザの陽性成分/陰性成分のテンプレートを用いて、それぞれ陽性成分の有無と陰性成分の有無を判定した。
 しかしながら、事象関連電位の波形は個人差が大きいため、それらを基準とした識別では、努力性・うるささを精度よく判定することは困難であった。
 そこで本実施形態では、語音聴取の快適性評価の前にユーザごとの潜時約750msの陽性成分と潜時約200msの陰性成分の特徴を測定するためのキャリブレーションを行い、個人ごとの成分特徴に基づいて快適性を評価することとした。
 図22は、本実施形態による快適性評価システム300の機能ブロックの構成を示す。快適性評価システム300は、音声出力部11と、生体信号計測部50と、語音聴取の快適性評価装置3とを有している。図12と同じブロックについては同一の参照符号を付し、その説明は省略する。なお、語音聴取の快適性評価装置3のハードウェア構成は、図11に示すとおりである。実施形態1で説明したプログラム35(図11)と異なる処理を規定するプログラムが実行されることにより、図18に示す本実施形態による語音聴取の快適性評価装置3が実現される。
 本実施形態による語音聴取の快適性評価装置3が、実施形態1による語音聴取の快適性評価装置1と大きく相違する点は、新たに校正/評価切替部95と個別閾値DB96を設けた点である。また、ユーザごとの成分特徴に基づいて陽性成分の有無を判定するため、実施形態1にかかる事象関連電位処理部55、陽性成分判定部60、陰性成分判定部65、呈示語音決定部70に代えて、本実施形態では陽性成分判定部61、陰性成分判定部66、事象関連電位処理部57および呈示語音決定部77を設けている。
 以下、校正/評価切替部95、個別閾値DB96、呈示語音制御部77、事象関連電位処理部57、陽性成分判定部61、陰性成分判定部65を説明する。
 校正/評価切替部95は、ユーザごとの事象関連電位成分の特徴を特定するための校正モードと、快適性評価をする評価モードとを切り替える。そして、現在のモードを示す情報を呈示語音制御部77に送付する。なおモードの切替えは、ユーザ脳波の特徴を特定するために必要な所定回数の語音呈示が終了した時点で実施してもよい。
 呈示語音制御部77は、呈示語音制御部70と同様に語音DB71を参照し、語音の種類と呈示音声の音圧レベルを決定する。また、校正/評価切替部95から校正モード/評価モードの情報を受けて、校正モードの場合には、(1)ユーザが努力しないで聞けるが「うるさい」と感じる音圧レベルと、(2)努力が必要だが「うるさくない」と感じる音圧レベルで、音声出力部11を介してユーザ5に音声を呈示する。音圧レベルは、たとえばユーザのオージオグラムを参考に決定してもよい。そして、生体信号計測部50にトリガの情報を、事象関連電位処理部57に音声情報と校正/評価のモード情報を送付する。
 事象関連電位処理部57は、事象関連電位処理部55と同様に、呈示語音制御部から受けた呈示音声の内容に応じて、制定信号計測部50から受けた事象関連電位の加算平均演算を行う。呈示語音制御部77からモード情報を受け取る。校正モードの場合には、たとえば語音の種類に関わらず音圧レベルごとに加算平均演算を実施する。そして、陽性成分判定部61と陰性成分判定部66で識別に用いる特徴量を算出し、個別閾値DB96に送付する。特徴量には、たとえば区間平均電位、最大振幅、波形そのものがある。他方、評価モードの場合には、事象関連電位処理部55と同様の方法で加算平均演算を実施する。
 個別閾値DB96は、事象関連電位処理部57から送付された識別に利用する特徴量を保存する。
 陽性成分判定部61および、陰性成分判定部66は、事象関連電位処理部57から脳波データを受け取り、個別閾値DB96に保存された音圧レベルごとの特徴量を参照して、それぞれ努力性とうるささを判定する。たとえば、特徴量が区間平均電位の場合には、音圧レベルごとの特徴量の中間値を閾値として、陽性成分判定部60/陰性成分判定部65と同様の方法で、陽性成分/陰性成分を検出する。
 次に、図23を参照しながら、快適性評価システム300において行われる全体的な処理の手順を説明する。
 図23は、本実施形態による語音明瞭度システム300の処理手順を示すフローチャートである。図23では、快適性評価システム100の処理(図16)と同じ処理を行うステップについては同一の参照符号を付し、その説明は省略する。
 本実施形態による快適性評価システム300の処理が、実施形態1による快適性評価システム100の処理と相違する点は、ステップS301~S308である。それ以外のステップについては、図16に関連して既に説明しているため、説明を諸略する。
 ステップS301において、校正/評価切替部95は、ユーザの選択に基づいて、現在のモードを校正モードに設定し、校正モードの情報を呈示語音制御部77に送付する。
 ステップS302において、呈示語音制御部77は、語音DB71を参照して語音の種類を決定する。そして、呈示語音制御部77は、単音節の音声呈示を(1)ユーザが努力しないで聞けるが「うるさい」と感じる音圧レベル、あるいは、(2)努力が必要だが「うるさくない」と感じる音圧レベルを設定する。そして、音声出力部11を介してユーザ5に音声を呈示する。
 ステップS303において、事象関連電位処理部57は、生体信号計測部50で計測した事象関連電位を、音圧レベルごとに加算平均する。
 ステップS304において、事象関連電位処理部57は、音圧レベルごとの特徴量を保存する。より具体的には、事象関連電位処理部57は、加算平均波形から、陽性成分判定部61および陰性成分判定部66で識別に用いる特徴量をそれぞれ算出する。たとえば、特徴量が区間平均電位の場合には、所定区間の平均電位を算出する。そして、個別閾値DB96に保存する。このようにして得られた平均値は、そのユーザ固有の特徴を表しているといえる。
 ステップS305において、校正/評価切替部95は、所定回数の音声呈示が終了した段階で、校正モードから評価モードへの切り替えを行い、評価モードの情報を呈示語音制御部77に送付する。
 ステップS306ではユーザごとの陽性成分の特徴量に基づき陽性成分の有無が判定される。具体的には、陽性成分判定部61は、個別閾値DB96を参照して陽性成分の有無を判定するための閾値を読み出し、その閾値を利用して事象関連電位処理部57から受けた事象関連電位における潜時約750msの陽性成分の有無を判定する。たとえば、区間平均電位を特徴量として識別を行う場合には、潜時約750msの区間平均電位が算出した閾値よりも大きい場合に陽性成分あり、小さい場合に陽性成分なしと判定する。
 ステップS307では、ユーザごとの陰性成分の特徴量に基づき陰性成分の有無が判定される。すなわちステップS307において、陰性成分判定部61は、個別閾値DB96を参照して陰性成分の有無の閾値を判定するための閾値を読み出し、その閾値を利用して事象関連電位処理部57から受けた事象関連電位における潜時約200msの陰性成分の有無を判定する。たとえば、潜時を特徴量として識別を行う場合には、潜時約200msの潜時が算出した閾値よりも小さい場合に陰性成分あり、大きい場合に陰性成分なしと判定する。
 このような処理によって、ユーザごとの脳波特徴に合わせて、陽性成分・陰性成分の有無の識別が可能となるため、語音聴取の快適性が精度よく評価できるようになる。
 本実施形態の快適性評価システム300によれば、ユーザごとの脳波特徴に合わせて高い精度で快適性を評価できる。これによって、快適性が高く聞いていて疲れない補聴処理が実現できるようになる。
 なお、本実施形態では、ユーザごとの陽性成分および陰性成分の各特徴量を校正すると説明したが、この処理は一例である。ユーザごとの特徴量として、陽性成分または陰性成分の一方のみを校正してもよい。
 本発明の語音聴取の快適性評価装置および語音聴取の快適性評価装置が組み込まれた語音聴取の明瞭性評価システムによれば、語音の聞き分けができたか否かの明瞭度に加えて、語音聴取時の脳波に基づき、語音聴取の定量的な快適性評価が可能になる。それによって、快適性が高く聞いていて疲れない補聴処理が選択できるため、全ての補聴器ユーザのフィッティングにおいて利用可能である。
 1、2、3  語音聴取の快適性評価装置
 5  ユーザ
 11 音声出力部
 50 生体信号計測部
 55、56、57 事象関連電位処理部
 60、61 陽性成分判定部
 65、66 陰性成分判定部
 70、75、77 呈示語音決定部
 71、72 語音DB
 80、85 結果蓄積DB
 90 補聴処理部
 95 校正/評価切替部
 96 個別閾値DB
 100、200 語音聴取の明瞭性評価システム

Claims (16)

  1.  ユーザの脳波信号を計測する生体信号計測部と、
     単音節の語音を複数保持している語音データベースを参照して、呈示する単音節の語音を決定する呈示語音決定部と、
     決定された語音を、前記ユーザに聴覚的刺激として順次呈示する出力部と、
     前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定し、判定結果に応じて、前記ユーザが前記語音を努力して聞いているか否かの評価結果を出力する陽性成分判定部と、
     前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定し、判定結果に応じて、前記ユーザが前記語音をうるさいと感じているか否かの評価結果を出力する陰性成分判定部と
     を備えた、語音聴取の評価システム。
  2.  前記脳波信号の事象関連電位を加算平均する事象関連電位処理部をさらに備え、前記事象関連電位処理部は、前記語音が語音の種類および呈示されたときの音圧レベルの少なくとも一つに基づいて分類されるときにおいて、同じ分類に属する語音が呈示されたときに得られる前記脳波信号の事象関連電位を加算平均する、請求項1に記載の語音聴取の評価システム。
  3.  前記陽性成分判定部は、各語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位の区間平均電位が予め定められた第1閾値以上の場合に陽性成分が存在すると判定し、前記区間平均電位が前記第1閾値よりも小さい場合には陽性成分が存在しないと判定する、請求項1に記載の語音聴取の評価システム。
  4.  前記陽性成分判定部は、前記陽性成分が存在すると判定した場合、前記ユーザが前記語音を努力して聞いているという評価結果を出力し、前記陽性成分が存在しないと判定した場合には、前記ユーザが前記語音を努力せずに聞いているという評価結果を出力する、請求項3に記載の語音聴取の評価システム。
  5.  前記陰性成分判定部は、各語音が呈示された時刻を起点として100ms以上300ms以下の範囲に存在する陰性成分のピークが、予め定められた第2閾値よりも短い場合には陰性成分が存在すると判定し、前記陰性成分のピークが前記第2閾値以上の場合には陰性成分は存在しないと判定する、請求項1に記載の語音聴取の評価システム。
  6.  前記陰性成分判定部は、前記陰性成分が存在すると判定した場合、前記ユーザが前記語音をうるさいと感じているという評価結果を出力し、前記陰性成分が存在しないと判定した場合、前記ユーザが前記語音をうるさいと感じていないという評価結果を出力する、請求項5に記載の語音聴取の評価システム。
  7.  前記語音データベースには、複数の語音の各々について、音声、子音情報および異聴発生確率に関するグループが対応付けて記憶されている、請求項5に記載の語音聴取の評価システム。
  8.  前記陽性成分判定部および前記陰性成分判定部の判定結果を蓄積する結果蓄積データベースをさらに備え、
     前記結果蓄積データベースは、少なくとも1つの音圧レベルに関して、前記陽性成分判定部によって陽性成分なしと判定された語音、子音、または、前記異聴発生確率に関するグループの割合、および、前記陰性成分判定部によって陰性成分なしと判定された語音、子音、または、前記異聴発生確率に関するグループの割合を算出し、算出結果を利用して評価結果を生成する、請求項7に記載の語音聴取の評価システム。
  9.  前記結果蓄積データベースには、語音ごと、子音ごと、または、前記異聴発生確率に関するグループごとに、前記ユーザが前記語音を努力して聞いているか否か、および前記ユーザが前記語音をうるさいと感じているか否かを評価するための情報が蓄積されている、請求項6に記載の語音聴取の評価システム。
  10.  前記結果蓄積データベースは、語音ごと、音圧レベルごとに、前記ユーザが前記語音を努力して聞いているか否か、および前記ユーザが前記語音をうるさいと感じているか否かを評価するための情報を蓄積する、請求項9に記載の語音聴取の評価システム。
  11.  前記呈示語音決定部は、呈示音声の音圧レベルを決定する、請求項5に記載の語音聴取の評価システム。
  12.  前記呈示語音決定部によって決定され、呈示される前記語音に関して補聴処理の種類を選択し、選択された補聴処理に基づいて前記語音データベースに保持されている語音データを加工する補聴処理部をさらに備えた、請求項5に記載の語音聴取の評価システム。
  13.  前記陽性成分判定部および前記陰性成分判定部の判定結果を蓄積する結果蓄積データベースをさらに備え、
     前記結果蓄積データベースには、語音ごと、補聴処理ごとに、前記ユーザが前記語音を努力して聞いているか否か、および前記ユーザが前記語音をうるさいと感じているか否かを評価するための情報が蓄積されている、請求項12に記載の語音聴取の評価システム。
  14.  単音節の語音を複数保持している語音データベースを参照して、出力部からユーザに聴覚的刺激として順次呈示する単音節の語音を決定する呈示語音決定部と、
     前記ユーザの脳波信号を計測する生体信号計測部がおいて計測した脳波信号において、前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定する陽性成分判定部と、
     前記ユーザの脳波信号を計測する生体信号計測部がおいて計測した前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定する陰性成分判定部と
     を備えた、語音聴取の評価装置。
  15.  ユーザの脳波信号を計測するステップと、
     単音節の語音を複数保持している語音データベースを参照して、呈示する単音節の語音を決定するステップと、
     決定された語音を、前記ユーザに聴覚的刺激として順次呈示するステップと、
     前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定するステップと、
     判定結果に応じて前記ユーザが前記語音聴取を努力して聞いているか否かの評価結果を出力するステップと、
     前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定するステップと、
     判定結果に応じて、前記ユーザが前記語音をうるさいと感じているか否かの評価結果を出力するステップと
     を包含する、語音聴取の評価方法。
  16.  語音明瞭度評価システムに設けられたコンピュータによって実行されるコンピュータプログラムであって、
     前記コンピュータプログラムは、前記語音明瞭度評価システムに実装されるコンピュータに対し、
     計測されたユーザの脳波信号を受け取るステップと、
     単音節の語音を複数保持している語音データベースを参照して、呈示する単音節の語音を決定するステップと、
     決定された語音を、前記ユーザに聴覚的刺激として順次呈示するステップと、
     前記語音が呈示された時刻を起点として600ms以上900ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陽性成分が出現したか否かを判定するステップと、
     判定結果に応じて、前記ユーザが前記語音を努力して聞いているか否かの評価結果を出力するステップと、
     前記語音が呈示された時刻を起点として100ms以上300ms以下の範囲に含まれる前記脳波信号の事象関連電位に、陰性成分が出現したか否か判定するステップと、
     判定結果に応じて、前記ユーザが前記語音をうるさいと感じているか否かの評価結果を出力するステップと
     を実行させる、コンピュータプログラム。
PCT/JP2011/003236 2010-06-11 2011-06-08 語音聴取の評価システム、その方法およびそのプログラム WO2011155196A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2012519255A JP5144836B2 (ja) 2010-06-11 2011-06-08 語音聴取の評価システム、その方法およびそのプログラム
CN201180011703.9A CN102781322B (zh) 2010-06-11 2011-06-08 语音听取的评价系统、及方法
US13/561,336 US9044157B2 (en) 2010-06-11 2012-07-30 Assessment system of speech sound listening, and method and program thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010134239 2010-06-11
JP2010-134239 2010-06-11

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US13/561,336 Continuation US9044157B2 (en) 2010-06-11 2012-07-30 Assessment system of speech sound listening, and method and program thereof

Publications (1)

Publication Number Publication Date
WO2011155196A1 true WO2011155196A1 (ja) 2011-12-15

Family

ID=45097811

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/003236 WO2011155196A1 (ja) 2010-06-11 2011-06-08 語音聴取の評価システム、その方法およびそのプログラム

Country Status (4)

Country Link
US (1) US9044157B2 (ja)
JP (1) JP5144836B2 (ja)
CN (1) CN102781322B (ja)
WO (1) WO2011155196A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019022242A1 (ja) * 2017-07-28 2019-01-31 国立大学法人大阪大学 快不快の判別

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SI1896065T2 (sl) * 2005-06-27 2014-12-31 Glaxosmithkline Biologicals S.A. Postopek za pripravo cepiv
WO2012070212A1 (ja) * 2010-11-24 2012-05-31 パナソニック株式会社 うるささ判定システム、装置、方法およびプログラム
WO2014049979A1 (ja) * 2012-09-27 2014-04-03 パナソニック株式会社 不快音圧評価システム、不快音圧評価装置、不快音圧調整装置、不快音圧評価方法およびそのコンピュータプログラム
CN103054586B (zh) * 2012-12-17 2014-07-23 清华大学 一种基于汉语言语测听动态词表的汉语言语自动测听方法
US9807519B2 (en) * 2013-08-09 2017-10-31 The United States Of America As Represented By The Secretary Of Defense Method and apparatus for analyzing and visualizing the performance of frequency lowering hearing aids
JP6731654B2 (ja) * 2016-03-25 2020-07-29 パナソニックIpマネジメント株式会社 補聴器調整装置、補聴器調整方法及び補聴器調整プログラム
JP6337362B1 (ja) * 2017-11-02 2018-06-06 パナソニックIpマネジメント株式会社 認知機能評価装置、及び、認知機能評価システム
JP7043081B2 (ja) * 2019-05-23 2022-03-29 恒雄 新田 音声想起認識装置、装着具、音声想起認識方法及びプログラム
KR20210007385A (ko) * 2019-07-11 2021-01-20 현대자동차주식회사 오류 모니터링을 이용한 교통 감시 시스템

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11511367A (ja) * 1995-09-18 1999-10-05 クリーブランド、メディカル、デバイシズ、インコーポレーテッド 効果的な聴性誘発反応のためのワイアレスeegシステム
WO2005001677A1 (ja) * 2003-06-27 2005-01-06 Matsushita Electric Industrial Co., Ltd. サービス提供装置
WO2007066440A1 (ja) * 2005-12-08 2007-06-14 Matsushita Electric Industrial Co., Ltd. 情報処理システム、情報処理装置および方法
JP2008503261A (ja) * 2004-06-18 2008-02-07 ニューロントリックス インコーポレイテッド 神経学的疾患のための誘発反応試験システム
WO2011093005A1 (ja) * 2010-01-28 2011-08-04 パナソニック株式会社 語音明瞭度評価システム、その方法およびそのプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06114038A (ja) 1992-10-05 1994-04-26 Mitsui Petrochem Ind Ltd 聴覚検査・訓練装置
JPH0938069A (ja) 1995-08-02 1997-02-10 Nippon Telegr & Teleph Corp <Ntt> 語音聴力検査方法およびこの方法を実施する装置
WO2001087147A2 (en) * 2000-05-19 2001-11-22 Michael Sasha John System and method for objective evaluation of hearing using auditory steady-state responses
JP2004275619A (ja) 2003-03-19 2004-10-07 Kumamoto Technology & Industry Foundation 画像刺激−脳波意思伝達方法、及びそれに用いるシステム
EP1611846B1 (en) * 2004-07-02 2015-11-18 Maico Diagnostic GmbH Method to design acoustic stimuli in the spectral domain for the recording of Auditory Steady-State Responses (ASSR)
JP2008539977A (ja) * 2005-05-11 2008-11-20 バイオ−ロジック システムズ コーポレイション 神経生理学的中枢聴覚処理評価システム及び方法
JP5399251B2 (ja) 2006-10-13 2014-01-29 ラトガース,ザ ステート ユニバーシティ 聴覚処理障害を示す幼児を検査するため、または、正常に成長している幼児の聴覚または視覚情報処理を向上するためのデータを取得する方法およびシステム
AU2007350204B2 (en) * 2007-03-23 2011-11-10 Widex A/S System and method for the objective measurement of hearing ability of an individual
EP2344029B1 (en) * 2008-11-14 2017-09-27 Neuronetrix Solutions, LLC Electrode system
US8805489B1 (en) * 2010-02-08 2014-08-12 Einat OFEK Personal meaning extraction

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11511367A (ja) * 1995-09-18 1999-10-05 クリーブランド、メディカル、デバイシズ、インコーポレーテッド 効果的な聴性誘発反応のためのワイアレスeegシステム
WO2005001677A1 (ja) * 2003-06-27 2005-01-06 Matsushita Electric Industrial Co., Ltd. サービス提供装置
JP2008503261A (ja) * 2004-06-18 2008-02-07 ニューロントリックス インコーポレイテッド 神経学的疾患のための誘発反応試験システム
WO2007066440A1 (ja) * 2005-12-08 2007-06-14 Matsushita Electric Industrial Co., Ltd. 情報処理システム、情報処理装置および方法
WO2011093005A1 (ja) * 2010-01-28 2011-08-04 パナソニック株式会社 語音明瞭度評価システム、その方法およびそのプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SHIN'YA KURIKI: "Measurements of auditory evoked neuromagnetic field using a multichannel SQUID magnetometer", JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN, vol. 48, no. 5, May 1992 (1992-05-01), pages 320 - 327 *
TAKAHIRO TAMESUE ET AL.: "Kioku Seishin Sagyo Ji no Soon ni Taisuru Shinri - Seiriteki Teiryo Hyoka ni Kansuru Kisoteki Kosatsu", REPORT OF THE 2009 SPRING MEETING, March 2009 (2009-03-01), pages 1031 - 1032 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019022242A1 (ja) * 2017-07-28 2019-01-31 国立大学法人大阪大学 快不快の判別
JPWO2019022242A1 (ja) * 2017-07-28 2019-07-25 国立大学法人大阪大学 快不快の判別
JP2020073084A (ja) * 2017-07-28 2020-05-14 国立大学法人大阪大学 快不快の判別
JP7203388B2 (ja) 2017-07-28 2023-01-13 国立大学法人大阪大学 快不快の判別
US11690547B2 (en) 2017-07-28 2023-07-04 Osaka University Discernment of comfort/discomfort

Also Published As

Publication number Publication date
JP5144836B2 (ja) 2013-02-13
US9044157B2 (en) 2015-06-02
CN102781322B (zh) 2015-02-25
US20120288108A1 (en) 2012-11-15
JPWO2011155196A1 (ja) 2013-08-01
CN102781322A (zh) 2012-11-14

Similar Documents

Publication Publication Date Title
JP5144835B2 (ja) うるささ判定システム、装置、方法およびプログラム
JP5144836B2 (ja) 語音聴取の評価システム、その方法およびそのプログラム
JP4690507B2 (ja) 語音明瞭度評価システム、その方法およびそのプログラム
JP5002739B2 (ja) 聴力判定システム、その方法およびそのプログラム
JP5215508B1 (ja) 不快閾値推定システム、方法およびそのプログラム、補聴器調整システムおよび不快閾値推定処理回路
US8655439B2 (en) System and method of speech discriminability assessment, and computer program thereof
JP5042398B1 (ja) 脳波記録装置、補聴器、脳波記録方法およびそのプログラム
JP4769336B2 (ja) 補聴器の調整装置、方法およびプログラム
JP5091366B2 (ja) 音圧評価システム、その方法およびそのプログラム
US8849391B2 (en) Speech sound intelligibility assessment system, and method and program therefor
JP5406414B2 (ja) 不快音圧推定システム、不快音圧推定装置、不快音圧推定システムの作動方法およびそのコンピュータプログラム
JPWO2013001835A1 (ja) 不快音圧決定システム、その方法およびそのプログラム、補聴器調整システムおよび不快音圧決定装置

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201180011703.9

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11792155

Country of ref document: EP

Kind code of ref document: A1

DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2012519255

Country of ref document: JP

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11792155

Country of ref document: EP

Kind code of ref document: A1