WO2020208889A1 - 認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラム - Google Patents
認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラム Download PDFInfo
- Publication number
- WO2020208889A1 WO2020208889A1 PCT/JP2020/001804 JP2020001804W WO2020208889A1 WO 2020208889 A1 WO2020208889 A1 WO 2020208889A1 JP 2020001804 W JP2020001804 W JP 2020001804W WO 2020208889 A1 WO2020208889 A1 WO 2020208889A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- cognitive function
- evaluated person
- function evaluation
- information processing
- voice data
- Prior art date
Links
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B10/00—Other methods or instruments for diagnosis, e.g. instruments for taking a cell sample, for biopsy, for vaccination diagnosis; Sex determination; Ovulation-period determination; Throat striking implements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
Definitions
- the present invention relates to a cognitive function evaluation device, a cognitive function evaluation system, a cognitive function evaluation method, and a program capable of evaluating the cognitive function of the evaluated person.
- the revised Hasegawa Simple Intelligence Evaluation Scale (HDS-R) and MMSE (Mini) are methods in which the evaluated person, who is a patient whose cognitive function is evaluated, writes the answer on a test sheet.
- -Mental State Examination Mini-Mental State Examination
- CDR Chronic Dementia Racing
- Patent Documents 1 and 2 disclose a cognitive function evaluation device that calculates a feature amount from the voice data of the evaluated person and evaluates the cognitive function of the evaluated person from the feature amount.
- the cognitive function evaluation devices described in Patent Documents 1 and 2 are required to accurately evaluate the cognitive function of the evaluated person.
- the present invention provides a cognitive function evaluation device or the like capable of accurately evaluating the cognitive function of the evaluated person.
- the cognitive function evaluation device collects the second voice data for the test of the evaluated person before acquiring the first voice data of the evaluated person for evaluating the cognitive function. It includes an acquisition unit acquired from the device and an information processing unit that performs information processing for bringing the volume of the first audio data closer to a predetermined volume range based on the acquired second audio data.
- the cognitive function evaluation system includes the cognitive function evaluation device and the sound collecting device.
- the cognitive function evaluation method collects the second voice data for testing of the evaluated person before acquiring the first voice data of the evaluated person for evaluating the cognitive function. It includes an acquisition step acquired from the device and an information processing step of performing information processing for bringing the volume of the first audio data closer to a predetermined volume range based on the acquired second audio data.
- the program according to one aspect of the present invention is a program that causes a computer to execute the cognitive function evaluation method.
- the cognitive function evaluation device and the like of the present invention can accurately evaluate the cognitive function of the evaluated person.
- FIG. 1 is a diagram showing a configuration of a cognitive function evaluation system according to an embodiment.
- FIG. 2 is a block diagram showing a characteristic functional configuration of the cognitive function evaluation system according to the embodiment.
- FIG. 3 is a flowchart of the operation of the cognitive function evaluation device according to the embodiment.
- FIG. 4 is a flowchart showing the procedure of the volume test process.
- FIG. 5 is a diagram showing an example of an image for test instruction.
- FIG. 6 is a diagram showing an example of a first image showing that the volume of the evaluated person is appropriate.
- FIG. 7 is a diagram showing an example of a second image instructing the evaluated person to speak in a quiet voice.
- FIG. 8 is a diagram showing an example of a third image instructing the evaluated person to speak in a loud voice.
- FIG. 9 is a diagram showing an example of an image instructing the evaluated person to speak away from the sound collecting device.
- FIG. 10 is a diagram showing an example of an image instructing the evaluated person to approach the sound collecting device and speak.
- FIG. 11 is a diagram showing an example of an image instructing the evaluated person to speak by moving the sound collecting device away from the evaluated person.
- FIG. 12 is a diagram showing an example of an image instructing the evaluated person to bring the sound collecting device closer to the evaluated person and speak.
- FIG. 13 is a diagram showing a configuration of a cognitive function evaluation system when a sound collecting device is connected to an electric drive device.
- FIG. 14 is a flowchart showing the procedure of the cognitive function evaluation process.
- FIG. 14 is a flowchart showing the procedure of the cognitive function evaluation process.
- FIG. 15 is a diagram showing an outline of a method of acquiring the voice of the evaluated person by the cognitive function evaluation device according to the embodiment.
- FIG. 16 is a diagram showing an example of an image corresponding to the evaluation result.
- FIG. 17 is a diagram for explaining a formant calculated by a calculation unit from voice data.
- FIG. 18 is a diagram showing the scores obtained when the evaluated person took the MoCA test.
- FIG. 19 is a diagram showing a configuration of a cognitive function evaluation system according to a modification 1 of the embodiment.
- FIG. 20 is a diagram showing a configuration of a cognitive function evaluation system according to a modification 2 of the embodiment.
- parallel means not only completely parallel, but also substantially parallel, that is, including a deviation of, for example, about several percent.
- FIG. 1 is a diagram showing a configuration of a cognitive function evaluation system according to an embodiment.
- the cognitive function evaluation system 200 is a device for evaluating the cognitive function of the evaluated person U from the voice emitted by the evaluated person U.
- Cognitive function refers to the ability to recognize, remember, and judge.
- the cognitive function evaluation device 100 evaluates whether or not a person has dementia (dementia patient).
- Dementia refers to the above-mentioned symptom of cognitive decline.
- AD Alzheimer's disease
- Dementia refers to the above-mentioned symptom of cognitive decline.
- AD Alzheimer's disease
- the dementia patient will be examined by a doctor when the dementia patient's family or a third party prompts the dementia patient to see the doctor at the hospital. Further, it can be confirmed whether or not the evaluated person U has dementia by taking a batch test for diagnosing dementia such as a MoCA (Montreal Cognitive Assessment) test.
- MoCA Monitoring Cognitive Assessment
- the MoCA test takes about 15 minutes.
- it is necessary to determine whether or not the evaluated person U has dementia by executing the MoCA test a plurality of times at intervals in order to diagnose the change of the evaluated person U over time. .. That is, the MoCA test requires a long period of time to diagnose whether the evaluated person U has dementia.
- the cognitive function evaluation system 200 is a device that accurately evaluates the cognitive function of the evaluated person U by analyzing the voice of the evaluated person U.
- the cognitive function evaluation system 200 includes a cognitive function evaluation device 100, a sound collecting device 300, a display device 400, and an input device 500.
- the cognitive function evaluation device 100 is a computer that acquires voice data indicating the voice emitted by the evaluated person U by the sound collecting device 300 and evaluates the cognitive function of the evaluated person U from the acquired voice data.
- the sound collecting device 300 is a microphone that detects the voice emitted by the evaluated person U and outputs the voice data indicating the detected voice to the cognitive function evaluation device 100.
- a sound insulation wall 310 and / or a pop guard 320 may be arranged around the sound collecting device 300 in order to accurately detect the sound emitted by the evaluated person U.
- the display device 400 displays an image based on the image data output from the cognitive function evaluation device 100.
- the display device 400 is a monitor device composed of a liquid crystal panel, an organic EL panel, or the like.
- an information terminal such as a television, a smartphone, or a tablet terminal may be used.
- the input device 500 is a user interface device that accepts operations by the evaluated person U, a doctor who evaluates cognitive function, or a doctor's assistant.
- the input device 500 is realized by, for example, a mouse and a keyboard.
- the cognitive function evaluation device 100, the sound collector 300, and the display device 400 may be connected by wire or wirelessly as long as they can transmit and receive voice data or image data. Good.
- the cognitive function evaluation device 100 analyzes the voice of the evaluated person U based on the voice data detected by the sound collecting device 300, evaluates the cognitive function of the evaluated person U from the analysis result, and shows the evaluation result.
- the image data for displaying the image is output to the display device 400.
- the cognitive function evaluation device 100 can notify the dementia patient who has no subjective symptom of the degree of cognitive function, and therefore, for example, the dementia patient can be urged to see a doctor.
- the cognitive function evaluation device 100 can support a dementia patient to see a doctor by notifying the dementia patient who has no subjective symptom of the degree of cognitive function.
- the cognitive function evaluation device 100 is, for example, a personal computer, but may be a server device.
- FIG. 2 is a block diagram showing a characteristic functional configuration of the cognitive function evaluation device 100 according to the embodiment.
- the cognitive function evaluation device 100 includes an acquisition unit 110, a calculation unit 120, an evaluation unit 130, an output unit 140, a storage unit 150, and an instruction unit 160.
- the acquisition unit 110 acquires the voice data detected by the sound collecting device 300. In addition, the acquisition unit 110 acquires various information input from the input device 500 to the cognitive function evaluation device 100 in response to an operation on the input device 500.
- the acquisition unit 110 is, for example, a communication interface for performing wired communication or wireless communication.
- the calculation unit 120 is a processing unit that analyzes the voice data of the evaluated person U acquired by the acquisition unit 110. Specifically, the calculation unit 120 is realized by a processor, a microcomputer, or a dedicated circuit.
- the calculation unit 120 calculates the feature amount from the voice data acquired by the acquisition unit 110.
- the feature amount is a numerical value indicating the characteristics of the voice of the evaluated person U calculated from the voice data used by the evaluation unit 130 to evaluate the cognitive function of the evaluated person U.
- the feature amount is based on a formant obtained from a vowel portion of voice data acquired by the acquisition unit 110. More specifically, the feature amount is a variation of the first formant, a variation of the second formant, a variation of the ratio of the first formant and the second formant, and the like.
- the formant means the frequency of the formant. The variability is represented, for example, by the standard deviation. Formants will be supplemented later.
- the evaluation unit 130 collates the feature amount calculated by the calculation unit 120 with the reference data 151 stored in the storage unit 150, and evaluates the cognitive function of the evaluated person U.
- the evaluation unit 130 is realized by a processor, a microcomputer, or a dedicated circuit.
- the output unit 140 outputs the evaluation result of the cognitive function of the evaluated person U evaluated by the evaluation unit 130 to the display device 400.
- the output unit 140 is, for example, a communication interface for performing wired communication or wireless communication.
- the storage unit 150 is a storage device that stores reference data 151 showing the relationship between the feature amount and the human cognitive function.
- the reference data 151 is referred to by the evaluation unit 130 when the degree of cognitive function of the evaluated person U is evaluated.
- the storage unit 150 is realized by, for example, a ROM (Read Only Memory), a RAM (Random Access Memory), a semiconductor memory, an HDD (Hard Disk Drive), or the like.
- the storage unit 150 also stores a program executed by the calculation unit 120 and the evaluation unit 130, and image data indicating the evaluation result used when outputting the evaluation result of the cognitive function of the evaluated person U. There is. In addition, the storage unit 150 also stores an image for instructions, which will be described later.
- the instruction unit 160 instructs to quickly pronounce a phrase in which a predetermined syllable is repeated. Specifically, the instruction unit 160 acquires image data of an image for instruction stored in the storage unit 150 for instructing the rapid pronunciation of a phrase in which a predetermined syllable is repeated, and obtains the image data. The data is output to the display device 400 via the output unit 140. In this way, the instruction unit 160 instructs the display device 400 to quickly pronounce a phrase in which a predetermined syllable is repeated by displaying an image for instruction.
- the indicator unit 160 is realized by a processor, a microcomputer, or a dedicated circuit.
- the test processing unit 170 performs information processing related to the volume test processing described later.
- the test processing unit 170 is realized by a processor, a microcomputer, or a dedicated circuit.
- the calculation unit 120, the evaluation unit 130, the instruction unit 160, and the test processing unit 170 may be realized by one processor, a microcomputer, or a dedicated circuit having their respective functions, or the processor and the microcomputer. , Or it may be realized by a combination of two or more of the dedicated circuits.
- FIG. 3 is a flowchart of the operation of the cognitive function evaluation device 100.
- the cognitive function evaluation device 100 performs a volume test process (S10) and then a cognitive function evaluation process (S11).
- the volume test process is a process in which the evaluated person U is made to practice utterance, and the utterance volume of the evaluated person U is optimized before the cognitive function evaluation process.
- the test here means a trial.
- the voice of the evaluated person U When the voice of the evaluated person U is extremely low, the voice of the evaluated person U is buried in the ambient noise, or the voice data of the evaluated person U is affected by the white noise of the electric signal. For this reason, the accuracy of cognitive function evaluation may decrease. Further, if the voice of the evaluated person U is extremely loud, the dynamic range of the sound collector 300 may be exceeded, the waveform of the voice data may be distorted, and the accuracy of the evaluation of the cognitive function may be lowered. ..
- the cognitive function evaluation device 100 performs the cognitive function evaluation process after optimizing the utterance volume of the evaluated person U by performing the volume test process.
- FIG. 4 is a flowchart showing the procedure of the volume test process.
- the acquisition unit 110 acquires the identification information of the evaluated person U input to the cognitive function evaluation device 100 in response to the operation to the input device 500 (S20).
- the operation of the input device 500 is performed by the evaluated person U, a doctor who evaluates the cognitive function, an assistant of the doctor, or the like.
- the instruction unit 160 instructs to speak a test sentence (step S21).
- the instruction unit 160 acquires the image data of the image for the test instruction to the evaluated person U stored in the storage unit 150, and outputs the image data to the display device 400 via the output unit 140.
- the display device 400 displays the image 410 for the test instruction to the evaluated person U.
- FIG. 5 is a diagram showing an example of an image for test instruction. In the image of FIG. 5, it is instructed to speak the name of the evaluated person U, but the test sentence to be spoken is not particularly limited and may be the weather of the day.
- the test sentence is, for example, a sentence different from the sentence (phrase) used for the actual evaluation.
- the acquisition unit 110 acquires the test voice data of the evaluated person U who received the instruction in step S21 via the sound collector 300 (step S22).
- the test processing unit 170 calculates the volume of the test voice data acquired by the acquisition unit 110 (step S23).
- the volume is calculated, for example, based on the average amplitude of the waveform of the voice data over a period of time, but may be determined based on the peak amplitude of the waveform of the voice data.
- test processing unit 170 determines whether or not the volume calculated in step S23 is within a predetermined volume range (step S24).
- the predetermined volume range is determined empirically or experimentally and is stored in the storage unit 150 in advance.
- the test processing unit 170 determines that the calculated volume is within the predetermined volume range (Yes in step S24)
- the test processing unit 170 presents the first image to the evaluated person U as information indicating that the volume is appropriate.
- Step S25 the test processing unit 170 acquires the image data of the first image stored in the storage unit 150, and outputs the image data to the display device 400 via the output unit 140. Then, as shown in FIG. 6, the first image 420 is displayed on the display device 400.
- FIG. 6 is a diagram showing an example of the first image 420 showing that the utterance volume of the evaluated person U is appropriate.
- the first image 420 includes an illustration of a happy child, text information indicating that the volume is appropriate, and volume information (volume value and barometer), but at least a part of such various information. Should be included. Further, whether or not the utterance volume is appropriate may be indicated by blinking of a light emitting device realized by a light emitting element such as an LED (Light Emitting Diode).
- a light emitting element such as an LED (Light Emitting Diode).
- test processing unit 170 determines whether or not the calculated volume is larger than the predetermined volume range (step S26). ).
- the test processing unit 170 determines that the volume is louder than the predetermined volume range (Yes in step S26), the test processing unit 170 receives the second image as information instructing the evaluated person U to speak in a quiet voice. It is presented to the evaluator U (step S27). Specifically, the test processing unit 170 acquires the image data of the second image stored in the storage unit 150, and outputs the image data to the display device 400 via the output unit 140. Then, as shown in FIG. 7, the second image 430 is displayed on the display device 400.
- FIG. 7 is a diagram showing an example of the second image 430 instructing the evaluated person U to speak in a small voice.
- the second image 430 includes an illustration of a child who closes his ears, text information instructing him to speak in a quiet voice, and volume information (volume value and barometer). At least a part may be included.
- the test processing unit 170 receives the third image as information instructing the evaluated person U to speak in a loud voice.
- the test processing unit 170 acquires the image data of the third image stored in the storage unit 150, and outputs the image data to the display device 400 via the output unit 140. Then, as shown in FIG. 8, the third image 440 is displayed on the display device 400.
- FIG. 8 is a diagram showing an example of the third image 440 instructing the evaluated person U to speak in a loud voice.
- the third image 440 includes an illustration of a child making a gesture in which no sound is heard, text information instructing to speak in a loud voice, and volume information (volume value and barometer). It is sufficient that at least a part of various kinds of information is included.
- the third image 440 may include an illustration in which the child talks with a big mouth open.
- the cognitive function evaluation device 100 performs information processing based on the acquired voice data for the test in order to bring the volume of the voice data for the actual evaluation performed after the test closer to a predetermined volume range. .. Specifically, the cognitive function evaluation device 100 presents the evaluated person U with information instructing to speak in a low voice when it is determined that the volume of the voice data is louder than a predetermined volume range. When it is determined that the volume of the voice data is lower than the predetermined volume range, the evaluated person U is presented with information instructing the person to speak in a loud voice. As a result, it is suppressed that the actual evaluation is performed while the volume is out of the appropriate range, so that the evaluation accuracy of the cognitive function is improved.
- the test processing unit 170 After step S25, step S27, and step S28, the test processing unit 170 includes the identification information of the evaluated person U acquired in step S20, the first image 420, the second image 430, and the third.
- the image identification information indicating which image of the image 440 is presented is associated with the image identification information and stored as history information (step S29). That is, the test processing unit 170 stores historical information indicating what kind of image is presented to the evaluated person U.
- the test processing unit 170 can omit the processing of steps S21 to S24 and step S26 by referring to the history information in the storage unit 150 after the processing of step S20 when the volume test processing is performed next time. Then, the same image as the image presented at the time of the volume test processing this time can be presented. That is, when the test processing unit 170 evaluates the cognitive function of the evaluated person U after the specific contents (what kind of image is presented) of the information processing performed for adjusting the volume are stored. In addition, information processing having the same contents as the information processing unit stored in the storage unit 150 is performed.
- test processing unit 170 presented an image (information) instructing the evaluated person U to adjust the utterance volume. However, in step S27 and step S28, the test processing unit 170 may present an image (information) instructing the evaluated person U to adjust the positional relationship between the evaluated person U and the sound collecting device 300.
- test processing unit 170 presents an image instructing the evaluated person U to speak away from the sound collecting device 300 in step S27.
- FIG. 9 is a diagram showing an example of an image instructing the evaluated person U to speak away from the sound collecting device 300.
- test processing unit 170 presents an image instructing the evaluated person U to approach the sound collecting device 300 and speak in step S28.
- FIG. 10 is a diagram showing an example of an image instructing the evaluated person U to approach the sound collecting device 300 and speak.
- the test processing unit 170 evaluates an image instructing the sound collecting device 300 to move away from the evaluated person U to speak.
- FIG. 11 is a diagram showing an example of an image instructing the evaluated person U to speak by moving the sound collecting device 300 away from the evaluated person U.
- the test processing unit 170 receives an image instructing the sound collector 300 to approach the evaluated person U and speak.
- FIG. 12 is a diagram showing an example of an image instructing the evaluated person U to bring the sound collecting device 300 closer to the evaluated person U and speak.
- FIG. 13 is a diagram showing a configuration of a cognitive function evaluation system 200 when the sound collecting device 300 is connected to the electric drive device.
- step S27 the test processing unit 170 outputs a first control signal for moving the sound collector 300 away from the evaluated person U to the electric drive device 600, and in step S28, the test processing unit 170 outputs the sound collecting device 300 to the evaluated person.
- a second control signal for approaching U is output to the electric drive device 600.
- the process can be omitted when the next volume test process is performed. That is, the test processing unit 170 evaluates the cognitive function of the evaluated person U after the specific contents of the information processing performed for adjusting the volume (how the electric drive device 600 is driven) are stored. The information processing is performed with the same contents as the information processing unit stored in the storage unit 150.
- FIG. 14 is a flowchart showing the procedure of the cognitive function evaluation process.
- FIG. 15 is a diagram showing an outline of a method of acquiring the voice of the evaluated person U by the cognitive function evaluation device 100.
- the instruction unit 160 instructs to quickly pronounce a phrase in which a predetermined syllable is repeated (step S100).
- the doctor D and the like ask the evaluated person U, "Since the instruction is displayed on the terminal, can you speak as instructed?" Call out.
- the instruction unit 160 acquires image data of an image for instruction to the evaluated person U stored in the storage unit 150, and outputs the image data to the display device 400 via the output unit 140.
- the display device 400 displays an image 460 for instructing the evaluated person U.
- the image 460 for instructing the evaluated person U By displaying the image 460 for instructing the evaluated person U in this way, noise is less likely to enter the voice data as compared with the case where the doctor D gives an instruction to the evaluated person U by his / her own voice. Become.
- the instruction image 460 is, specifically, an image instructing the evaluated person U to quickly and repeatedly pronounce a predetermined syllable.
- the configuration in which the evaluated person quickly pronounces a phrase in which a predetermined syllable is repeated is suitable for calculating the variation in formants.
- a predetermined syllable is composed of, for example, a closed consonant and a vowel following the closed consonant.
- a predetermined syllable By constructing a predetermined syllable in this way, the cognitive function of the evaluated person U can be evaluated accurately.
- predetermined syllables are, for example, "pa”, "ta”, and "ka”.
- the closing consonants include plosives and affricates. Plosives and affricates are sounds that completely close both the vocal tracts of the mouth and nose, increase the internal air pressure, and then open it.
- an instruction is given to pronounce a predetermined syllable for 5 seconds or longer. That is, the instruction unit 160 instructs to pronounce a phrase in which a predetermined syllable is repeated for 5 seconds or longer, and as a result, the acquisition unit 110 can acquire voice data that lasts for 5 seconds or longer. As a result, the cognitive function evaluation device 100 can acquire voice data having a length sufficient for calculating the variation of the first formant.
- the acquisition unit 110 acquires the voice data of the evaluated person U who received the instruction in step S100 via the sound collecting device 300 (step S101).
- the evaluated person U is "papapapapa ", “tapping !, or "kakakaka ! or the like. Is emitted toward the sound collecting device 300.
- the acquisition unit 110 acquires these phrases uttered by the evaluated person U as voice data.
- the calculation unit 120 calculates the feature amount from the voice data acquired by the acquisition unit 110 (step S102).
- step S102 for example, the calculation unit 120 identifies a vowel portion of the voice data and calculates a feature amount based on the formant obtained from the spectrum of the specified vowel portion. Specifically, the calculation unit 120 calculates the variation of the first formant obtained from the spectrum of the specified vowel portion as a feature amount. For example, when the voice data contains n predetermined syllables (n is a natural number), n first formants are obtained, and the variation of the first formants is calculated by using all or a part of them. ..
- calculation unit 120 may calculate the variation of the second formant obtained from the spectrum of the specified vowel portion as a feature amount. Further, the calculation unit 120 may calculate a variation in the ratio of the first formant and the second formant obtained from the spectrum of the specified vowel portion as a feature amount.
- the evaluation unit 130 evaluates the cognitive function of the evaluated person U from the feature amount calculated by the calculation unit 120 in step S102 (step S103).
- the evaluation unit 130 evaluates the cognitive function of the evaluated person U from, for example, the variation of the first formant calculated by the calculation unit 120 in step S102 and the reference data 151 stored in the storage unit 150. ..
- step S104 the output unit 140 outputs the evaluation result of the cognitive function of the evaluated person U evaluated by the evaluation unit 130 (step S104).
- step S104 for example, the output unit 140 acquires the image data of the image corresponding to the evaluation result evaluated by the evaluation unit 130 in step S103 from the storage unit 150, and transmits the acquired image data to the display device 400.
- the display device 400 acquires the image data output by the output unit 140 and displays the image based on the image data.
- FIG. 16 is a diagram showing an example of an image corresponding to the evaluation result.
- Image 450 shown in FIG. 16 shows that the cognitive function of the evaluated person U tends to decrease.
- the evaluated person U can easily confirm the evaluation result of the cognitive function. Further, when the evaluated person U evaluates the cognitive function using the cognitive function evaluation device 100 at home or the like, the cognitive function evaluation device 100 displays an image to the evaluated person U by a doctor or the like. It is also possible to encourage a medical examination.
- FIG. 17 is a diagram for explaining a formant calculated by the calculation unit 120 from the voice data. Specifically, FIG. 17 is a graph showing a spectrum obtained by converting voice data whose horizontal axis is time and whose horizontal axis is frequency. The vertical axis of FIG. 17 is the amplitude.
- a plurality of peaks are confirmed in the data obtained by converting the horizontal axis of the voice data into frequencies.
- the frequency of the lowest frequency peak is the first formant F1.
- the frequency of the peak having the next lowest frequency after the first formant F1 is the second formant F2.
- the frequency of the peak having the next lowest frequency after the second formant F2 is the third formant F3.
- the first formant F1 is the first peak frequency seen from the low frequency side of human voice, and it is known that the characteristics related to the movement of the tongue are easily reflected. In addition, patients with dementia often have difficulty moving their tongue as compared to healthy individuals. Therefore, it is considered that the first formant F1 is likely to be different between a healthy person and a dementia patient. Therefore, the cognitive function of the evaluated person U can be evaluated accurately by using the quantity related to the first formant as a feature quantity in the evaluation of the cognitive function.
- the second formant F2 is the second peak frequency seen from the low frequency side of human voice, and is the position of the tongue among the resonances generated by the vocal cord sound source in the vocal tract, the oral cavity such as the lips and tongue, and the nasal cavity. It is known that the effects of In addition, patients with dementia often have a weaker motor function to maintain the position of the tongue and chin than healthy subjects. Therefore, it is considered that the second formant F2 is likely to make a difference between a healthy person and a dementia patient. Therefore, the cognitive function of the evaluated person U can be evaluated accurately by using the quantity related to the second formant as a feature quantity in the evaluation of the cognitive function.
- the calculation unit 120 calculates the vowel spectrum by extracting the vowel portion from the voice data acquired by the acquisition unit 110 by a known method and converting the voice data of the extracted vowel part into amplitude with respect to the frequency. Calculate the formant.
- the formant amplitude is, for example, the peak intensity at the frequency of each formant shown in FIG.
- the graph shown in FIG. 17 is calculated by converting voice data into amplitude data with respect to frequency and obtaining an envelope of the data.
- an envelope of the data for example, cepstrum analysis, linear predictive coding (LPC), or the like is adopted.
- the MoCA test is a batch test for diagnosing dementia, and can identify whether or not the evaluated person U has dementia.
- FIG. 18 is a diagram showing the scores obtained when the evaluated person U took the MoCA test.
- the inventors conducted a MoCA test by collecting a plurality of evaluated persons including healthy persons (NC: Normal Controls), patients with mild dementia (MCI: Mild Cognitive Impairment), and patients with dementia (AD).
- NC Normal Controls
- MCI Mild Cognitive Impairment
- AD patients with dementia
- the number of NC evaluated persons was 90
- the number of MCI evaluated persons was 94
- the number of AD evaluated persons was 93.
- the cognitive function evaluation device 100 can obtain the voice of the evaluated person U and the reference data 151 from the voice and the reference data 151.
- the cognitive function of the evaluated person U can be evaluated.
- the evaluation unit 130 evaluates that the larger the variation of the first formant, the lower the cognitive function, based on the reference data 151.
- the evaluation unit 130 evaluates that the larger the variation in the second formant, the lower the cognitive function, and the larger the variation in the ratio of the first formant and the second formant, the lower the cognitive function. ..
- the relationship between the variation in the reference data and the cognitive function is based on the data analysis of the above-mentioned evaluated persons of the inventors at the present time, but in the future, the data analysis of a larger number of evaluated persons will be collected.
- the evaluation criteria may change due to data analysis with revised conditions. Therefore, the greater the variation in the first formant, the higher the cognitive function may be evaluated.
- the calculation unit 120 calculates the feature amount based on the formant, but other feature amounts may be calculated.
- the calculation unit 120 may calculate the fluctuation of the fundamental frequency of the voice data per unit time as a feature amount.
- the fundamental frequency here means the frequency of the sound source. That is, it means the pitch of the voice emitted by the evaluated person U.
- the fluctuation of the fundamental frequency per unit time means the amount of change of the fundamental frequency per unit time.
- the evaluation unit 130 evaluates that the larger the fluctuation of the fundamental frequency of the voice data per unit time, the lower the cognitive function, but the larger the fluctuation of the fundamental frequency of the voice data per unit time, the more cognitive. It may be evaluated as having high function.
- the detailed evaluation criteria in this case may be appropriately determined experimentally or empirically as in the case of the above-mentioned reference data 151.
- the calculation unit 120 may calculate the fluctuation range of the fundamental frequency of the voice data per unit time as a feature amount.
- the amount of fluctuation of the fundamental frequency per unit time means the difference between the maximum value and the minimum value of the fundamental frequency in the unit time.
- the evaluation unit 130 evaluates that the larger the fluctuation amount of the fundamental frequency of the voice data per unit time, the lower the cognitive function, but the larger the fluctuation amount of the fundamental frequency of the voice data per unit time, the higher the evaluation.
- Cognitive function may be evaluated as high.
- the detailed evaluation criteria in this case may be appropriately determined experimentally or empirically as in the case of the above-mentioned reference data 151.
- the cognitive function evaluation device 100 collects the second voice data for the test of the evaluated person U before acquiring the first voice data of the evaluated person U for evaluating the cognitive function. It includes an acquisition unit 110 acquired from the sound device 300, and a test processing unit 170 that performs information processing to bring the volume of the first audio data closer to a predetermined volume range based on the acquired second audio data.
- the test processing unit 170 is an example of an information processing unit.
- the cognitive function evaluation device 100 evaluates the cognitive function after optimizing the utterance volume of the evaluated person U by the above information processing, the cognitive function of the evaluated person U is evaluated with high accuracy. be able to.
- the test processing unit 170 presents information for instructing the evaluated person U to adjust the utterance volume as the above information processing. For example, when it is determined that the volume of the second voice data is louder than a predetermined volume range, the test processing unit 170 presents information instructing the evaluated person U to speak in a quiet voice, and the second voice data is second. When it is determined that the volume of the voice data is lower than the predetermined volume range, the evaluated person U is presented with information instructing the person to speak in a loud voice.
- Such a cognitive function evaluation device 100 evaluates the cognitive function after instructing the evaluated person U to adjust the utterance volume, the evaluated person does not perform signal processing for amplifying or attenuating the second voice data.
- the possibility of being able to evaluate U's cognitive function increases. That is, the cognitive function evaluation device 100 can accurately evaluate the cognitive function of the evaluated person U.
- test processing unit 170 presents information for instructing the evaluated person U to adjust the positional relationship between the evaluated person U and the sound collecting device 300 as the above-mentioned information processing.
- the test processing unit 170 speaks away from the sound collector 300 when it is determined that the volume of the second voice data is louder than a predetermined volume range.
- Information is presented to the evaluated person U, and when it is determined that the volume of the second voice data is lower than the predetermined volume range, the information instructing the sound collector 300 to approach and speak is received. Present to evaluator U.
- the test processing unit 170 determines that the volume of the second voice data is larger than the predetermined volume range, the sound collecting device 300 Is presented to the evaluated person U with information instructing the evaluated person U to speak away from the evaluated person U, and when it is determined that the volume of the second voice data is smaller than the predetermined volume range, the sound collecting device 300 is used. Present the evaluated person U with information instructing him / her to speak closer to the evaluated person U.
- the cognitive function evaluation device 100 speaks to the evaluated person U himself.
- the cognitive function of the evaluated person U can be evaluated accurately without requiring the adjustment of the volume. Adjustment of the utterance volume may be difficult for the elderly, and a configuration for instructing adjustment of the positional relationship between the evaluated person U and the sound collecting device 300 is useful in such a case.
- the sound collecting device 300 is connected to the electric driving device 600 for adjusting the position of the sound collecting device 300, and the test processing unit 170 controls to drive the electric driving device 600 as the above information processing. Output a signal.
- the cognitive function evaluation device 100 since the cognitive function evaluation device 100 automatically adjusts the positional relationship between the evaluated person U and the sound collecting device 300 and then evaluates the cognitive function, the evaluated person U himself / herself. It is possible to accurately evaluate the cognitive function of the evaluated person U without requiring an action.
- the cognitive function evaluation device 100 further includes a storage unit 150.
- the test processing unit 170 stores the information processing content in the storage unit 150 in association with the identification information of the evaluated person U, and after the information processing content is stored, the evaluated person's When evaluating the cognitive function, information processing having the same content as the information processing stored in the storage unit 150 is performed.
- Such a cognitive function evaluation device 100 can shorten the time required for cognitive function evaluation by substantially omitting the second and subsequent volume tests.
- the cognitive function evaluation system 200 includes a cognitive function evaluation device 100 and a sound collecting device 300.
- Such a cognitive function evaluation system 200 evaluates the cognitive function after optimizing the utterance volume of the evaluated person U by the above information processing, the cognitive function of the evaluated person U is evaluated with high accuracy. be able to.
- the cognitive function evaluation method executed by a computer such as the cognitive function evaluation device 100 is for testing the evaluated person U before acquiring the first voice data of the evaluated person U for evaluating the cognitive function.
- the cognitive function is evaluated after optimizing the utterance volume of the evaluated person U by the above information processing, so that the cognitive function of the evaluated person U is evaluated accurately. Can be done.
- FIG. 19 is a diagram showing the configuration of the cognitive function evaluation system according to the first modification of the embodiment.
- the cognitive function evaluation system 200a includes a cognitive function evaluation device 100, a sound collecting device 300, and a display device 400, similarly to the cognitive function evaluation system 200 according to the embodiment.
- the cognitive function evaluation system 200 may include a pop guard 320 so as to cover the sound collecting device 300, for example.
- a sound collecting device 300 having directivity is adopted.
- the sound collecting device 300 and the display device 400 are in the direction in which the sound collecting device 300 exhibits the maximum sensitivity (sound collecting direction V2 shown in FIG. 19) and the normal direction of the display surface 401 in which the display device 400 displays the problem information. It is arranged so as to match V1.
- the sound collecting device 300 and the display device 400 are arranged on a fixed object such as a desk so that the normal direction V1 and the sound collecting direction V2 are parallel to each other.
- the sound collecting device 300 and the display device 400 may be fixed to a construction material or the like.
- the cognitive function evaluation system 200a may include a fixture for fixing the positional relationship between the sound collecting device 300 and the display device 400.
- the sound collecting direction V2 and the speaking direction can easily match. Therefore, by setting the positional relationship as in the cognitive function evaluation system 200a, the sound collecting device 300 can easily detect the voice of the evaluated person U accurately.
- FIG. 20 is a diagram showing the configuration of the cognitive function evaluation system according to the second modification of the embodiment.
- the cognitive function evaluation system 200b includes a cognitive function evaluation device 100, a sound collecting device 300a, and a display device 400, similarly to the cognitive function evaluation system 200 according to the embodiment.
- the sound collecting device 300a is a microphone that detects the voice emitted by the evaluated person U and outputs the voice data indicating the detected voice to the cognitive function evaluation device 100. Further, the sound collecting device 300a has directivity like the sound collecting device 300 in the cognitive function evaluation system 200 according to the embodiment.
- the sound collecting device 300a and the display device 400 are integrally formed. Specifically, the sound collecting device 300a and the display device 400 are arranged in the same housing. In the manufacturing process of integrally forming the sound collecting device 300a and the display device 400, if the normal direction V1 and the sound collecting direction V2 are formed so as to coincide with each other, the evaluated person U can use the cognitive function evaluation system 200b. When used, the deviation of the normal direction V1 and the sound collecting direction V2 is suppressed.
- the cognitive function evaluation device evaluated NC, MCI, or AD as a specific example of the evaluation of cognitive function.
- the cognitive function evaluation device is not limited to the evaluation of NC, MCI, or AD.
- the degree of drunkenness of the evaluated person U may be evaluated.
- Alzheimer-type dementia was mentioned as a specific example of the symptom of cognitive decline.
- cognitive function refers to the ability to recognize, remember, and judge, and dementia refers to the above-mentioned symptom of cognitive decline. That is, the degree of cognitive function evaluated by the cognitive function evaluation device is not limited to Alzheimer-type dementia, and may be, for example, vascular dementia.
- the storage unit 150 in order to evaluate the degree of cognitive function of the evaluated person U, the storage unit 150 previously uses data showing the relationship between the score of the MoCA test and the feature amount based on the formant as reference data 151.
- the reference data may be any data that can evaluate the degree of cognitive function by collating with the formant feature, and is not limited to the data showing the relationship between the MoCA test and the formant feature.
- the reference data may be data showing the relationship between a score such as MMSE (Mini-Mental State Examination) and a feature amount such as a formant.
- the cognitive function evaluation process may be any process for evaluating the cognitive function based on the voice data of the evaluated person, and for example, the cognitive function evaluation method described in Patent Document 2 may be used.
- the present invention may be realized as a program that causes a computer to execute a step executed by a cognitive function evaluation device. Further, the present invention may be realized as a recording medium such as a CD-ROM that can be read by a computer that records the program. Further, the present invention may be realized as information, data or a signal indicating the program. Then, those programs, information, data and signals may be distributed via a communication network such as the Internet.
- the voice data obtained from the evaluated person is calculated as a feature amount to evaluate the cognitive function of the evaluated person, but the evaluation is performed by combining data capable of evaluating other known cognitive functions. It may be carried out. For example, it is known that there is a correlation between cognitive function and walking data related to walking such as stride length, stride length, and walking speed.
- a plurality of feature quantities calculated by the calculation unit are exemplified.
- the evaluation unit may evaluate the cognitive function of the evaluated person from a plurality of different feature quantities calculated by the calculation unit.
- the evaluation unit may evaluate the cognitive function of the evaluated person by performing weighting on each feature amount.
- the coefficient used in the weighting performed by the evaluation unit may be arbitrarily determined.
- Cognitive function evaluation device 110 Acquisition unit 170 Test processing unit (information processing unit) 200, 200a, 200b Cognitive function evaluation system 300, 300a Sound collector 600 Electric drive device U Evaluated person
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Pathology (AREA)
- Acoustics & Sound (AREA)
- Biomedical Technology (AREA)
- Heart & Thoracic Surgery (AREA)
- Human Computer Interaction (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Details Of Audible-Bandwidth Transducers (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
認知機能評価装置(100)は、認知機能の評価を行うための被評価者の第1音声データを取得する前に、被評価者のテスト用の第2音声データを集音装置(300)から取得する取得部(110)と、取得された第2音声データに基づいて、第1音声データの音量を所定の音量範囲に近づけるための情報処理を行うテスト処理部(170)とを備える。
Description
本発明は、被評価者の認知機能を評価することができる、認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラムに関する。
従来から、認知機能を評価するテストとして、認知機能が評価される患者である被評価者がテスト用紙に解答を記載する方法である改訂長谷川式簡易知能評価スケール(HDS-R)、MMSE(Mini-Mental State Examination:ミニメンタルステート検査)、CDR(Clinical Dementia Rating)等がある。これらは、一定のトレーニングの受けた医師、臨床心理士等が、被評価者に対して医療機関で行うものである。
また、特許文献1及び2には、被評価者の音声データから特徴量を算出し、特徴量から前記被評価者の認知機能を評価する認知機能評価装置が開示されている。
特許文献1及び2に記載の認知機能評価装置には、精度良く被評価者の認知機能の評価をすることが要求されている。
そこで、本発明は、精度良く被評価者の認知機能の評価を行うことができる認知機能評価装置等を提供する。
本発明の一態様に係る認知機能評価装置は、認知機能の評価を行うための被評価者の第1音声データを取得する前に、前記被評価者のテスト用の第2音声データを集音装置から取得する取得部と、取得された前記第2音声データに基づいて、前記第1音声データの音量を所定の音量範囲に近づけるための情報処理を行う情報処理部を備える。
本発明の一態様に係る認知機能評価システムは、前記認知機能評価装置と、前記集音装置とを備える。
本発明の一態様に係る認知機能評価方法は、認知機能の評価を行うための被評価者の第1音声データを取得する前に、前記被評価者のテスト用の第2音声データを集音装置から取得する取得ステップと、取得された前記第2音声データに基づいて、前記第1音声データの音量を所定の音量範囲に近づけるための情報処理を行う情報処理ステップとを含む。
本発明の一態様に係るプログラムは、前記認知機能評価方法をコンピュータに実行させるプログラムである。
本発明の認知機能評価装置等は、精度良く被評価者の認知機能の評価を行うことができる。
以下、実施の形態について、図面を参照しながら説明する。なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序等は、一例であり、本発明を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
なお、各図は模式図であり、必ずしも厳密に図示されたものではない。また、各図において、実質的に同一の構成に対しては同一の符号を付しており、重複する説明は省略又は簡略化される場合がある。
また、以下の実施の形態において、方向を示す表現を用いている。例えば、平行とは、完全に平行であることを意味するだけでなく、実質的に平行とする、すなわち、例えば数%程度のずれを含むことも意味する。
(実施の形態)
[認知機能評価システムの構成]
実施の形態に係る認知機能評価システムの構成に関して説明する。図1は、実施の形態に係る認知機能評価システムの構成を示す図である。
[認知機能評価システムの構成]
実施の形態に係る認知機能評価システムの構成に関して説明する。図1は、実施の形態に係る認知機能評価システムの構成を示す図である。
認知機能評価システム200は、被評価者Uが発した音声から、被評価者Uの認知機能を評価するための装置である。認知機能とは、認識したり、記憶したり、判断したりする能力を示す。一具体例として、認知機能評価装置100は、認知症である人(認知症患者)かどうかを評価する。
認知症とは、上述した認知機能の低下が見られる症状を示す。認知症の一具体例としては、アルツハイマー型認知症(AD:Alzheimer’s disease)が挙げられる。認知症は自覚症状がないため、認知症患者の家族又は第三者等が認知症患者に病院での診察を促すことで、認知症患者は医師からの診察を受けることとなる。また、MoCA(Montreal Cognitive Assessment)テスト等の認知症の診断のためのバッチテストを被評価者Uが受けることにより、被評価者Uが認知症であるかどうかを確認することができる。
しかしながら、MoCAテストは、15分程度の時間を要する。また、MoCAテストは、被評価者Uの経時的な変化を診断するために、日をおいて複数回実行することで、被評価者Uが認知症であるかどうかの判定を行う必要がある。つまり、MoCAテストは、被評価者Uが認知症であるかどうかを診断するために、長い期間を要する。
ところで、認知症患者と、認知症ではない人(健常者)とでは、発話した単語が同じ単語であっても音声に違いがあることが知られている。
認知機能評価システム200は、被評価者Uの音声を解析することで、被評価者Uの認知機能を精度良く評価する装置である。
図1に示されるように、認知機能評価システム200は、認知機能評価装置100と、集音装置300と、表示装置400と、入力装置500とを備える。
認知機能評価装置100は、集音装置300によって、被評価者Uが発した音声を示す音声データを取得し、取得した音声データから被評価者Uの認知機能を評価するコンピュータである。
集音装置300は、被評価者Uが発した音声を検出して、検出した音声を示す音声データを認知機能評価装置100へ出力するマイクである。被評価者Uが発した音声を精度良く検出するために、集音装置300の周囲には、遮音壁310、及び/又は、ポップガード320が配置されていてもよい。
表示装置400は、認知機能評価装置100から出力される画像データに基づいた画像を表示する。表示装置400は、具体的には、液晶パネル、又は、有機ELパネルなどによって構成されるモニタ装置である。表示装置400として、テレビ、スマートフォン、又は、タブレット端末などの情報端末が用いられてもよい。
入力装置500は、被評価者U、認知機能の評価を行う医師、または、医師の補助者などの操作を受け付けるユーザインターフェース装置である。入力装置500は、例えば、マウス及びキーボードなどによって実現される。
認知機能評価装置100と、集音装置300及び表示装置400とは、音声データ又は画像データを送受信可能であればよく、有線で接続されていてもよいし、無線通信可能に接続されていてもよい。
認知機能評価装置100は、集音装置300によって検出された音声データに基づいて被評価者Uの音声を分析し、分析した結果から被評価者Uの認知機能を評価し、評価した結果を示す画像を表示するための画像データを表示装置400へ出力する。こうすることで、認知機能評価装置100は、自覚症状がない認知症患者へ認知機能の程度を通知できるため、例えば、認知症患者に医師に診察を受けるように促すことができる。言い換えると、認知機能評価装置100は、自覚症状がない認知症患者へ認知機能の程度を通知することで、認知症患者が医師に診察を受ける支援をすることができる。
なお、認知機能評価装置100は、例えば、パーソナルコンピュータであるが、サーバ装置であってもよい。
図2は、実施の形態に係る認知機能評価装置100の特徴的な機能構成を示すブロック図である。認知機能評価装置100は、取得部110と、算出部120と、評価部130と、出力部140と、記憶部150と、指示部160とを備える。
取得部110は、集音装置300によって検出された音声データを取得する。また、取得部110は、入力装置500への操作に応じて入力装置500から認知機能評価装置100に入力される各種情報を取得する。取得部110は、例えば、有線通信又は無線通信を行う通信インターフェースである。
算出部120は、取得部110で取得した被評価者Uの音声データを解析する処理部である。算出部120は、具体的には、プロセッサ、マイクロコンピュータ、又は、専用回路によって実現される。
算出部120は、取得部110が取得した音声データから特徴量を算出する。ここで、特徴量とは、評価部130が被評価者Uの認知機能を評価するために用いる音声データから算出される被評価者Uの音声の特徴を示す数値である。例えば、特徴量は、取得部110によって取得された音声データの母音部分から得られるフォルマントに基づく。特徴量は、より具体的には、第一フォルマントのばらつき、第二フォルマントのばらつき、第一フォルマント及び第二フォルマントの比率のばらつきなどである。なお、以下の実施の形態において、フォルマントとは、フォルマントの周波数を意味する。ばらつきは、例えば、標準偏差によって表される。フォルマントについては、後で補足する。
評価部130は、算出部120が算出した特徴量と、記憶部150に記憶されている参照データ151とを照合し、被評価者Uの認知機能を評価する。評価部130は、具体的には、プロセッサ、マイクロコンピュータ、又は、専用回路によって実現される。
出力部140は、評価部130が評価した被評価者Uの認知機能の評価結果を表示装置400へ出力する。出力部140は、例えば、有線通信又は無線通信を行う通信インターフェースである。
記憶部150は、特徴量と、人の認知機能との関係を示す参照データ151が記憶されている記憶装置である。参照データ151は、被評価者Uの認知機能の程度の評価が行われるときに評価部130によって参照される。記憶部150は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)、半導体メモリ、HDD(Hard Disk Drive)等によって実現される。
また、記憶部150には、算出部120及び評価部130が実行するプログラム、及び、被評価者Uの認知機能の評価結果を出力する際に用いられる当該評価結果を示す画像データも記憶されている。また、記憶部150には、後述する指示用の画像も記憶される。
指示部160は、所定の音節が繰り返されるフレーズを素早く発音することを指示する。指示部160は、具体的には、記憶部150に記憶された、所定の音節が繰り返されるフレーズを素早く発音することを指示するための指示用の画像の画像データを取得し、当該画像データを出力部140を介して表示装置400に出力する。このように、指示部160は、表示装置400に指示用の画像を表示させることにより、所定の音節が繰り返されるフレーズを素早く発音することを指示する。
指示部160は、具体的には、プロセッサ、マイクロコンピュータ、又は、専用回路によって実現される。
テスト処理部170は、後述の音量テスト処理に関する情報処理を行う。テスト処理部170は、具体的には、プロセッサ、マイクロコンピュータ、又は、専用回路によって実現される。
なお、算出部120、評価部130、指示部160、及び、テスト処理部170は、それぞれの機能を併せ持つ1つのプロセッサ、マイクロコンピュータ、又は、専用回路で実現されてもよいし、プロセッサ、マイクロコンピュータ、又は、専用回路のうちの2つ以上の組み合わせによって実現されてもよい。
[認知機能評価装置の動作]
次に、認知機能評価装置100の動作について説明する。図3は、認知機能評価装置100の動作のフローチャートである。
次に、認知機能評価装置100の動作について説明する。図3は、認知機能評価装置100の動作のフローチャートである。
まず、認知機能評価装置100は、音量テスト処理を行った後(S10)、認知機能評価処理を行う(S11)。音量テスト処理は、被評価者Uに発話練習をさせ、認知機能評価処理の前に、被評価者Uの発話音量の適正化を図る処理である。つまり、ここでのテストとは、トライアル(試行)の意味である。
被評価者Uの音声が極端に小さい場合、被評価者Uの音声が周囲の雑音に埋もれてしまうか、あるいは、被評価者Uの音声データが電気信号のホワイトノイズの影響を受けてしまうなどの理由で認知機能の評価の精度が低下してしまう可能性がある。また、被評価者Uの声が極端に大きい場合、集音装置300のダイナミックレンジを超えてしまい、音声データの波形が歪んでしまい、認知機能の評価の精度が低下してしまう可能性がある。
そこで、認知機能評価装置100は、音量テスト処理を行うことで被評価者Uの発話音量の適正化を図った上で認知機能評価処理を行う。
[音量テスト処理の手順]
続いて、認知機能評価装置100が実行する音量テスト処理の具体的な手順について説明する。図4は、音量テスト処理の手順を示すフローチャートである。
続いて、認知機能評価装置100が実行する音量テスト処理の具体的な手順について説明する。図4は、音量テスト処理の手順を示すフローチャートである。
まず、取得部110は、入力装置500への操作に応じて認知機能評価装置100に入力される被評価者Uの識別情報を取得する(S20)。入力装置500への操作は、被評価者U、認知機能の評価を行う医師、または、医師の補助者などによって行われる。
次に、指示部160は、テスト用の文章を発話することを指示する(ステップS21)。指示部160は、記憶部150に記憶された、被評価者Uへのテスト指示用の画像の画像データを取得し、当該画像データを、出力部140を介して表示装置400に出力する。そうすると、図5に示すように、表示装置400には、被評価者Uへのテスト指示用の画像410が表示される。図5は、テスト指示用の画像の一例を示す図である。図5の画像では、被評価者Uの名前を発話することが指示されているが、発話されるテスト用の文章は特に限定されず、当日の天気などであってもよい。テスト用の文章は、例えば、本番の評価に用いられる文章(フレーズ)とは異なる文章である。
次に、取得部110は、ステップS21の指示を受けた被評価者Uのテスト用の音声データを集音装置300を介して取得する(ステップS22)。
次に、テスト処理部170は、取得部110が取得したテスト用の音声データの音量を算出する(ステップS23)。音量は、例えば、音声データの波形の一定期間における平均振幅に基づいて算出されるが、音声データの波形のピーク振幅に基づいて定められてもよい。
次に、テスト処理部170は、ステップS23において算出された音量が所定の音量範囲内であるか否かを判定する(ステップS24)。所定の音量範囲は、経験的または実験的に定められ、あらかじめ記憶部150に記憶される。
テスト処理部170は、算出された音量が所定の音量範囲内であると判定した場合(ステップS24でYes)、音量が適正であることを示す情報として、第1画像を被評価者Uに提示する(ステップS25)。テスト処理部170は、具体的には、記憶部150に記憶された第1画像の画像データを取得し、当該画像データを、出力部140を介して表示装置400に出力する。そうすると、図6に示すように、表示装置400には、第1画像420が表示される。図6は、被評価者Uの発話音量が適正であることを示す第1画像420の一例を示す図である。第1画像420には、喜ぶ子供のイラストと、音量が適正であることを示す文字情報と、音量情報(音量値、及び、バロメータ)とが含まれるが、このような各種情報の少なくとも一部が含まれればよい。また、発話音量が適正か否かはLED(Light Emitting Diode)などの発光素子によって実現される発光装置の点滅によって示されてもよい。
テスト処理部170は、算出された音量が所定の音量範囲外であると判定した場合(ステップS24でNo)、算出された音量が所定の音量範囲よりも大きいか否かを判定する(ステップS26)。
テスト処理部170は、音量が所定の音量範囲よりも大きいと判定された場合に(ステップS26でYes)、被評価者Uに小さい声で発話することを指示する情報として、第2画像を被評価者Uに提示する(ステップS27)。テスト処理部170は、具体的には、記憶部150に記憶された第2画像の画像データを取得し、当該画像データを、出力部140を介して表示装置400に出力する。そうすると、図7に示すように、表示装置400には第2画像430が表示される。図7は、被評価者Uに小さい声で発話することを指示する第2画像430の一例を示す図である。第2画像430には、耳を塞ぐ子供のイラストと、小さい声で発話することを指示する文字情報と、音量情報(音量値、及び、バロメータ)とが含まれるが、このような各種情報の少なくとも一部が含まれればよい。
テスト処理部170は、音量が所定の音量範囲よりも小さいと判定された場合に(ステップS26でNo)、被評価者Uに大きい声で発話することを指示する情報として、第3画像を被評価者Uに提示する(ステップS28)。テスト処理部170は、具体的には、記憶部150に記憶された第3画像の画像データを取得し、当該画像データを、出力部140を介して表示装置400に出力する。そうすると、図8に示すように、表示装置400には、第3画像440が表示される。図8は、被評価者Uに大きい声で発話することを指示する第3画像440の一例を示す図である。第3画像440には、音が聞こえないジェスチャをする子供のイラストと、大きい声で発話することを指示する文字情報と、音量情報(音量値、及び、バロメータ)とが含まれるが、このような各種情報の少なくとも一部が含まれればよい。なお、第3画像440には、子供が大きな口を空けて話をするイラストが含まれてもよい。
このように、認知機能評価装置100は、取得されたテスト用の音声データに基づいて、テストの後に行われる本番の評価用の音声データの音量を所定の音量範囲に近づけるための情報処理を行う。認知機能評価装置100は、具体的には、音声データの音量が所定の音量範囲よりも大きいと判定された場合に、小さい声で発話することを指示する情報を被評価者Uに提示し、音声データの音量が所定の音量範囲よりも小さいと判定された場合に、大きい声で発話することを指示する情報を被評価者Uに提示する。これにより、音量が適正な範囲外のまま本番の評価が行われることが抑制されるため、認知機能の評価精度が向上される。
なお、ステップS25、ステップS27、及び、ステップS28の後、テスト処理部170は、ステップS20で取得された被評価者Uの識別情報と、第1画像420、第2画像430、及び、第3画像440のいずれの画像を提示したかを示す画像識別情報とを対応付けて履歴情報として記憶する(ステップS29)。つまり、テスト処理部170は、被評価者Uに対してのどのような画像を提示したかを示す履歴情報を記憶する。
これにより、テスト処理部170は、次回、音量テスト処理を行う際に、ステップS20の処理の後に記憶部150内の履歴情報を参照することで、ステップS21~ステップS24、ステップS26の処理を省略して、今回の音量テスト処理の際に提示された画像と同一の画像を提示することができる。つまり、テスト処理部170は、音量を調整するために行われた情報処理の具体的内容(どのような画像を提示したか)が記憶された後に被評価者Uの認知機能の評価を行う際に、記憶部150に記憶された情報処理部と内容が同一の情報処理を行う。
[音量テスト処理の変形例]
図4のフローチャートのステップS27及びステップS28では、テスト処理部170は、被評価者Uに発話音量の調整を指示する画像(情報)を提示した。しかしながら、ステップS27及びステップS28では、テスト処理部170は、被評価者Uに被評価者Uと集音装置300との位置関係の調整を指示する画像(情報)を提示してもよい。
図4のフローチャートのステップS27及びステップS28では、テスト処理部170は、被評価者Uに発話音量の調整を指示する画像(情報)を提示した。しかしながら、ステップS27及びステップS28では、テスト処理部170は、被評価者Uに被評価者Uと集音装置300との位置関係の調整を指示する画像(情報)を提示してもよい。
例えば、集音装置300が固定されて動かない場合、テスト処理部170は、ステップS27において、集音装置300から遠ざかって発話することを指示する画像を被評価者Uに提示する。図9は、被評価者Uに集音装置300から遠ざかって発話することを指示する画像の一例を示す図である。
同様に、集音装置300が固定されて動かない場合、テスト処理部170は、ステップS28において、集音装置300に近づいて発話することを指示する画像を被評価者Uに提示する。図10は、被評価者Uに集音装置300に近づいて発話することを指示する画像の一例を示す図である。
また、集音装置300が手動で位置調整が可能な機構を有している場合、テスト処理部170は、集音装置300を被評価者Uから遠ざけて発話することを指示する画像を被評価者Uに提示する。図11は、被評価者Uに、集音装置300を被評価者Uから遠ざけて発話することを指示する画像の一例を示す図である。
同様に、集音装置300が手動で位置調整が可能な機構を有している場合、テスト処理部170は、集音装置300を被評価者Uに近づけて発話することを指示する画像を被評価者Uに提示する。図12は、被評価者Uに、集音装置300を被評価者Uに近づけて発話することを指示する画像の一例を示す図である。
また、集音装置300が、集音装置300の位置を調整するための電動駆動装置に接続されている場合、テスト処理部170は、判定結果に基づいて電動駆動装置を駆動することで集音装置300の位置調整を行ってもよい。図13は、集音装置300が電動駆動装置に接続される場合の認知機能評価システム200の構成を示す図である。
例えば、テスト処理部170は、ステップS27において、集音装置300を被評価者Uから遠ざけるための第1制御信号を電動駆動装置600に出力し、ステップS28において、集音装置300を被評価者Uに近づけるための第2制御信号を電動駆動装置600に出力する。
この場合もステップS29において、被評価者Uの識別情報と電動駆動装置600をどのように駆動したかとが履歴情報として記憶されれば、次回の音量テスト処理を行う際に処理を省略できる。つまり、テスト処理部170は、音量を調整するために行われた情報処理の具体的内容(どのように電動駆動装置600を駆動したか)が記憶された後に被評価者Uの認知機能の評価を行う際に、記憶部150に記憶された情報処理部と内容が同一の情報処理を行う。
[認知機能評価処理の手順]
続いて、認知機能評価装置100が実行する認知機能評価処理の具体的な手順について説明する。図14は、認知機能評価処理の手順を示すフローチャートである。図15は、認知機能評価装置100による被評価者Uの音声の取得方法の概要を示す図である。
続いて、認知機能評価装置100が実行する認知機能評価処理の具体的な手順について説明する。図14は、認知機能評価処理の手順を示すフローチャートである。図15は、認知機能評価装置100による被評価者Uの音声の取得方法の概要を示す図である。
まず、指示部160は、所定の音節が繰り返されるフレーズを素早く発音することを指示する(ステップS100)。図15の(a)に示すように、例えば、ステップS100において、医者D等は、被評価者Uへ「端末に指示が表示されるので、指示の通りに話してもらえませんか?」というように声をかける。指示部160は、記憶部150に記憶された、被評価者Uへの指示用の画像の画像データを取得し、当該画像データを、出力部140を介して表示装置400に出力する。そうすると、図15の(b)に示すように、表示装置400には、被評価者Uへの指示用の画像460が表示される。このように、被評価者Uへの指示用の画像460が表示されることで、医者Dが自身の声で被評価者Uに指示を行う場合と比較して、音声データにノイズが入りにくくなる。
指示用の画像460は、具体的には、所定の音節を素早く繰り返して発音することを被評価者Uに指示する画像である。このように、所定の音節が繰り返されるフレーズを被評価者に素早く発音させる構成は、フォルマントのばらつきを算出するのに適している。
所定の音節は、例えば、閉鎖子音、及び、当該閉鎖子音に続く母音によって構成される。所定の音節がこのように構成されることにより、被評価者Uの認知機能は精度よく評価され得る。日本語においては、このような所定の音節は、例えば、「ぱ」、「た」、及び、「か」などである。なお、閉鎖子音には、破裂音及び破擦音などが含まれる。破裂音及び破擦音は、口及び鼻の両方の声道を完全に閉鎖し、内部の気圧を高めた後、それを開放して出す音である。
指示用の画像410においては、所定の音節を5秒以上発音するように指示が行われている。つまり、指示部160は、所定の音節が繰り返されるフレーズを5秒以上発音することを指示し、この結果、取得部110は、5秒以上続く音声データを取得することができる。これにより、認知機能評価装置100は、第一フォルマントのばらつきを算出するのに十分な長さの音声データを取得することができる。
次に、取得部110は、ステップS100の指示を受けた被評価者Uの音声データを集音装置300を介して取得する(ステップS101)。図15の(c)に示すように、ステップS101において、例えば、被評価者Uは、「ぱぱぱぱぱ・・」、「たたたたた・・」、または「かかかかか・・」などのフレーズを集音装置300に向けて発する。取得部110は、被評価者Uが発したこれらのフレーズを、音声データとして取得する。
次に、算出部120は、取得部110が取得した音声データから特徴量を算出する(ステップS102)。ステップS102において、例えば、算出部120は、音声データの母音部分を特定し、特定した母音部分のスペクトルから得られるフォルマントに基づく特徴量を算出する。算出部120は、具体的には、特定した母音部分のスペクトルから得られる第一フォルマントのばらつきを特徴量として算出する。例えば、音声データに所定の音節がn個(nは自然数)含まれる場合には、n個の第一フォルマントが得られ、これらの全部または一部を用いて第一フォルマントのばらつきが算出される。
なお、算出部120は、特定した母音部分のスペクトルから得られる第二フォルマントのばらつきを特徴量として算出してもよい。また、算出部120は、特定した母音部分のスペクトルから得られる第一フォルマント及び第二フォルマントの比率のばらつきを特徴量として算出してもよい。
次に、評価部130は、ステップS102で算出部120が算出した特徴量から被評価者Uの認知機能を評価する(ステップS103)。ステップS104において、評価部130は、例えば、ステップS102で算出部120が算出した第一フォルマントのばらつきと、記憶部150に記憶された参照データ151とから、被評価者Uの認知機能を評価する。
次に、出力部140は、評価部130が評価した被評価者Uの認知機能の評価結果を出力する(ステップS104)。ステップS104において、出力部140は、例えば、ステップS103で評価部130が評価した評価結果に対応する画像の画像データを記憶部150から取得して、表示装置400へ取得した画像データを送信する。
表示装置400は、出力部140が出力した画像データを取得して、当該画像データに基づいて画像を表示する。図16は、評価結果に対応する画像の一例を示す図である。図16に示される画像450は、被評価者Uの認知機能が低下傾向にあることを示す。
このように、評価結果が画像として表示されることで、被評価者Uは、簡便に、認知機能の評価結果を確認することができる。また、被評価者Uが自宅等で認知機能評価装置100を用いて認知機能を評価している場合には、認知機能評価装置100は、画像の表示により被評価者Uに対して医者等の診察を促すことも可能である。
[フォルマント]
以下、フォルマントについて補足する。図17は、音声データから算出部120が算出するフォルマントを説明するための図である。具体的には、図17は、横軸が時間である音声データを、横軸を周波数に変換して得られるスペクトルを示すグラフである。なお、図17の縦軸は、振幅である。
以下、フォルマントについて補足する。図17は、音声データから算出部120が算出するフォルマントを説明するための図である。具体的には、図17は、横軸が時間である音声データを、横軸を周波数に変換して得られるスペクトルを示すグラフである。なお、図17の縦軸は、振幅である。
図17に破線で示すように、音声データの横軸を周波数に変換して得られるデータには、複数のピークが確認される。複数のピークのうち、周波数の最も低いピークの周波数は、第一フォルマントF1である。また、第一フォルマントF1の次に周波数の低いピークの周波数は、第二フォルマントF2である。また、第二フォルマントF2の次に周波数の低いピークの周波数は、第三フォルマントF3である。
第一フォルマントF1は、人の音声の低周波数側から数えて1番目に見られるピーク周波数であり、舌の動きに関する特徴が反映されやすいことが知られている。また、認知症患者は、健常者と比較して舌をうまく動かせない場合が多い。そのため、第一フォルマントF1には、健常者と認知症患者とで違いが生じやすいと考えられる。したがって、第一フォルマントに関する量を特徴量として認知機能の評価に用いることで、精度良く被評価者Uの認知機能は評価され得る。
第二フォルマントF2は、人の音声の低周波数側から数えて2番目に見られるピーク周波数であり、声帯音源が声道、唇及び舌等の口腔、鼻腔等で生じる共鳴のうち、舌の位置に関する影響が反映されやすいことが知られている。また、認知症患者は、健常者と比較して舌やあごの位置を維持する運動機能が衰える場合が多い。そのため、第二フォルマントF2には、健常者と認知症患者とで違いが生じやすいと考えられる。したがって、第二フォルマントに関する量を特徴量として認知機能の評価に用いることで、精度良く被評価者Uの認知機能は評価され得る。
算出部120は、取得部110が取得した音声データから既知の方法により母音部分を抽出して、抽出した母音部分の音声データを、周波数に対する振幅にデータ変換することにより母音のスペクトルを算出し、フォルマントを算出する。なお、フォルマントの振幅とは、例えば、図17に示す各フォルマントの周波数におけるピーク強度である。
なお、図17に示すグラフは、音声データを周波数に対する振幅のデータに変換し、そのデータの包落線を求めることにより算出される。包落線の計算には、例えば、ケプストラム分析、線形予測分析(Linear Predictive Coding:LPC)等が採用される。
[具体的な評価方法]
一般に、被評価者Uが認知症であるかどうかは、MoCAテストを被評価者Uが受けることにより診断される。MoCAテストは、認知症の診断のためのバッチテストである、被評価者Uが認知症であるかどうかを特定することができる。図18は、被評価者UがMoCAテストを受けた際に獲得したスコアを示す図である。
一般に、被評価者Uが認知症であるかどうかは、MoCAテストを被評価者Uが受けることにより診断される。MoCAテストは、認知症の診断のためのバッチテストである、被評価者Uが認知症であるかどうかを特定することができる。図18は、被評価者UがMoCAテストを受けた際に獲得したスコアを示す図である。
発明者らは、健常者(NC:Normal Controls)、軽度の認知症患者(MCI:Mild Cognitive Inpairment)及び認知症患者(AD)を含む複数の被評価者を集めて、MoCAテストを実施した。NCの被評価者数(Number of subjects)は90人とし、MCIの被評価者数は94人とし、ADの被評価者数は93人とした。
図18から、NC、MCI及びADでMoCAのスコアの平均値(MoCA average score)及びスコアの範囲(MoCA score range)が異なることが確認できる。具体的には、NCのMoCAのスコアの平均値は27.4であり、MCIのMoCAのスコアの平均値は22.1であり、ADのMoCAのスコアの平均値は16.2であった。このように得られるMoCAテスト等の結果と、第一フォルマントF1のばらつきとの相関を参照データ151として用いることで、認知機能評価装置100は、被評価者Uの音声と参照データ151とから、被評価者Uの認知機能を評価することができる。
参照データ151においては、具体的には、第一フォルマントのばらつきが大きいほど、認知機能が低い傾向がみられる。そこで、評価部130は、参照データ151に基づいて、第一フォルマントのばらつきが大きいほど、認知機能が低いと評価する。
なお、上述のように、特徴量としては、第一フォルマントのばらつきの他に、第二フォルマントのばらつき、または、第一フォルマント及び第二フォルマントの比率のばらつきが用いられてもよい。この場合も、評価部130は、例えば、第二フォルマントのばらつきが大きいほど、認知機能が低いと評価し、第一フォルマント及び第二フォルマントの比率のばらつきが大きいほど、認知機能が低いと評価する。
また、上記参照データにおけるばらつきと認知機能との関係は、現時点における発明者らの上記被評価者らを集めたデータ分析によるものであるが、今後、より多くの被評価者を集めたデータ分析、条件を見直したデータ分析などが行われることにより評価基準が変更になる可能性がある。したがって、第一フォルマントのばらつきが大きいほど、認知機能が高いと評価される場合もありえる。第二フォルマントのばらつき、または、第一フォルマント及び第二フォルマントの比率のばらつきについても同様である。
[特徴量の別の例]
上記実施の形態では、算出部120は、フォルマントに基づく特徴量を算出したが、これ以外の特徴量を算出してもよい。
上記実施の形態では、算出部120は、フォルマントに基づく特徴量を算出したが、これ以外の特徴量を算出してもよい。
例えば、算出部120は、音声データの基本周波数の単位時間あたりの変動を特徴量として算出してもよい。ここでの基本周波数は、音源の振動数を意味する。つまり、被評価者Uが発した音声の音程を意味する。基本周波数の単位時間あたりの変動とは、基本周波数の単位時間あたりの変化量を意味する。
この場合、評価部130は、例えば、音声データの基本周波数の単位時間あたりの変動が大きいほど、認知機能が低いと評価するが、音声データの基本周波数の単位時間あたりの変動が大きいほど、認知機能が高いと評価してもよい。なお、この場合の詳細な評価基準については、上記参照データ151と同様に、実験的または経験的に適宜定められればよい。
また、算出部120は、音声データの基本周波数の単位時間あたりの変動幅を特徴量として算出してもよい。基本周波数の単位時間あたりの変動量とは、当該単位時間における基本周波数の最大値と最小値との差を意味する。
この場合、評価部130は、例えば、音声データの基本周波数の単位時間あたりの変動量が大きいほど、認知機能が低いと評価するが、音声データの基本周波数の単位時間あたりの変動量が大きいほど、認知機能が高いと評価してもよい。なお、この場合の詳細な評価基準については、上記参照データ151と同様に、実験的または経験的に適宜定められればよい。
[効果等]
以上説明したように、認知機能評価装置100は、認知機能の評価を行うための被評価者Uの第1音声データを取得する前に、被評価者Uのテスト用の第2音声データを集音装置300から取得する取得部110と、取得された第2音声データに基づいて、第1音声データの音量を所定の音量範囲に近づけるための情報処理を行うテスト処理部170とを備える。テスト処理部170は、情報処理部の一例である。
以上説明したように、認知機能評価装置100は、認知機能の評価を行うための被評価者Uの第1音声データを取得する前に、被評価者Uのテスト用の第2音声データを集音装置300から取得する取得部110と、取得された第2音声データに基づいて、第1音声データの音量を所定の音量範囲に近づけるための情報処理を行うテスト処理部170とを備える。テスト処理部170は、情報処理部の一例である。
このような認知機能評価装置100は、上記情報処理によって被評価者Uの発話音量の適正化を図った上で認知機能の評価を行うため、精度良く被評価者Uの認知機能の評価を行うことができる。
また、例えば、テスト処理部170は、上記情報処理として、被評価者Uに発話音量の調整を指示する情報を提示する。例えば、テスト処理部170は、第2音声データの音量が所定の音量範囲よりも大きいと判定された場合に、小さい声で発話することを指示する情報を被評価者Uに提示し、第2音声データの音量が所定の音量範囲よりも小さいと判定された場合に、大きい声で発話することを指示する情報を被評価者Uに提示する。
このような認知機能評価装置100は、被評価者Uに発話音量の調整を指示した上で認知機能の評価を行うため、第2音声データを増幅または減衰する信号処理を行わずに被評価者Uの認知機能の評価を行うことができる可能性が高まる。つまり、認知機能評価装置100は、精度良く被評価者Uの認知機能の評価を行うことができる。
また、例えば、テスト処理部170は、上記情報処理として、被評価者Uに被評価者Uと集音装置300との位置関係の調整を指示する情報を提示する。
例えば、集音装置300が固定されている場合、テスト処理部170は、第2音声データの音量が所定の音量範囲よりも大きいと判定された場合に、集音装置300から遠ざかって発話することを指示する情報を被評価者Uに提示し、第2音声データの音量が所定の音量範囲よりも小さいと判定された場合に、集音装置300に近づいて発話することを指示する情報を被評価者Uに提示する。
また、例えば、集音装置300が手動で位置調整が可能である場合、テスト処理部170は、第2音声データの音量が所定の音量範囲よりも大きいと判定された場合に、集音装置300を被評価者Uから遠ざけて発話することを指示する情報を被評価者Uに提示し、第2音声データの音量が所定の音量範囲よりも小さいと判定された場合に、集音装置300を被評価者Uに近づけて発話することを指示する情報を被評価者Uに提示する。
このような認知機能評価装置100は、被評価者Uに被評価者Uと集音装置300との位置関係の調整を指示した上で認知機能の評価を行うため、被評価者U自身に発話音量の調整を要求することなく、精度良く被評価者Uの認知機能の評価を行うことができる。発話音量の調整は、高齢者には難しい場合があり、被評価者Uと集音装置300との位置関係の調整を指示する構成は、このような場合に有用である。
また、例えば、集音装置300は、集音装置300の位置を調整するための電動駆動装置600に接続され、テスト処理部170は、上記情報処理として、電動駆動装置600を駆動するための制御信号を出力する。
このような認知機能評価装置100は、認知機能評価装置100が自動的に被評価者Uと集音装置300との位置関係の調整した上で認知機能の評価を行うため、被評価者U自身に行動を要求することなく、精度良く被評価者Uの認知機能の評価を行うことができる。
また、例えば、認知機能評価装置100は、さらに、記憶部150を備える。テスト処理部170は、情報処理を行った後、情報処理の内容を被評価者Uの識別情報と対応付けて記憶部150に記憶し、情報処理の内容が記憶された後に前記被評価者の認知機能の評価を行う際に、記憶部150に記憶された情報処理と内容が同一の情報処理を行う。
このような認知機能評価装置100は、2回目以降の音量のテストを実質的に省略することで、認知機能の評価にかかる時間を短縮することができる。
また、認知機能評価システム200は、認知機能評価装置100と、集音装置300とを備える。
このような認知機能評価システム200は、上記情報処理によって被評価者Uの発話音量の適正化を図った上で認知機能の評価を行うため、精度良く被評価者Uの認知機能の評価を行うことができる。
また、認知機能評価装置100などのコンピュータが実行する認知機能評価方法は、認知機能の評価を行うための被評価者Uの第1音声データを取得する前に、被評価者Uのテスト用の第2音声データを集音装置300から取得する取得ステップと、取得された第2音声データに基づいて、第1音声データの音量を所定の音量範囲に近づけるための情報処理を行う情報処理ステップとを含む。
このような認知機能評価方法は、上記情報処理によって被評価者Uの発話音量の適正化を図った上で認知機能の評価を行うため、精度良く被評価者Uの認知機能の評価を行うことができる。
(変形例)
続いて、実施の形態の変形例1及び変形例2に係る認知機能評価システムについて説明する。なお、実施の形態と同一の構成に関しては同一の符号を付しており、重複する説明は省略又は簡略化する場合がある。
続いて、実施の形態の変形例1及び変形例2に係る認知機能評価システムについて説明する。なお、実施の形態と同一の構成に関しては同一の符号を付しており、重複する説明は省略又は簡略化する場合がある。
図19は、実施の形態の変形例1に係る認知機能評価システムの構成を示す図である。
実施の形態の変形例1に係る認知機能評価システム200aは、実施の形態に係る認知機能評価システム200と同様に、認知機能評価装置100と、集音装置300と、表示装置400とを備える。認知機能評価システム200は、例えば、集音装置300を覆うように、ポップガード320を備えてもよい。
また、認知機能評価システム200aでは、指向性を有する集音装置300が採用されている。ここで、集音装置300及び表示装置400は、集音装置300が最大感度を示す方向(図19に示す集音方向V2)と表示装置400が課題情報を表示する表示面401の法線方向V1とが一致するように配置されている。具体的には、法線方向V1と集音方向V2とが平行となるように、集音装置300及び表示装置400は、机等の固定物に配置されている。なお、集音装置300及び表示装置400は、造営材などに固定されてもよい。また、認知機能評価システム200aは、集音装置300及び表示装置400の位置関係を固定するための固定具を備えてもよい。
こうすることで、被評価者Uが表示装置400を見ながら発話した場合においても、集音方向V2と、発話する方向とが一致しやすくなる。そのため、認知機能評価システム200aのような位置関係とすることで、集音装置300は、被評価者Uの音声を正確に検出しやすくなる。
続いて、実施の形態の変形例2に係る認知機能評価システムについて説明する。
図20は、実施の形態の変形例2に係る認知機能評価システムの構成を示す図である。
実施の形態の変形例2に係る認知機能評価システム200bは、実施の形態に係る認知機能評価システム200と同様に、認知機能評価装置100と、集音装置300aと、表示装置400とを備える。
集音装置300aは集音装置300と同様に、被評価者Uが発した音声を検出して、検出した音声を示す音声データを認知機能評価装置100へ出力するマイクである。また、集音装置300aは、実施の形態に係る認知機能評価システム200における集音装置300と同様に、指向性を有する。
認知機能評価システム200bにおいては、集音装置300aと表示装置400とが一体として形成されている。具体的には、集音装置300aと表示装置400とは、同一の筐体に配置されている。集音装置300aと表示装置400とを一体に形成する製造工程において、法線方向V1と集音方向V2とを一致するように形成しておけば、被評価者Uが認知機能評価システム200bを利用する際に、法線方向V1及び集音方向V2がずれることが抑制される。
(その他の実施の形態)
以上、実施の形態、及び実施の形態の変形例1及び変形例2に係る認知機能評価システム等について説明したが、本発明は、上記実施の形態に限定されるものではない。
以上、実施の形態、及び実施の形態の変形例1及び変形例2に係る認知機能評価システム等について説明したが、本発明は、上記実施の形態に限定されるものではない。
上記実施の形態では、認知機能評価装置は、認知機能の評価の一具体例として、NCかMCIかADかの評価をした。しかしながら、認知機能評価装置は、NCかMCIかADかの評価に限定されない。例えば、被評価者Uの酩酊の度合いが評価されてもよい。
また、上記実施の形態では、認知機能の低下の症状の一具体例として、アルツハイマー型認知症が挙げられた。しかしながら、認知機能とは、認識したり、記憶したり、判断したりする能力を示し、認知症とは、上述した認知機能の低下が見られる症状を示す。つまり、認知機能評価装置が評価する認知機能の程度は、アルツハイマー型認知症に限定されず、例えば、血管性認知症などでもよい。
また、上記実施の形態では、被評価者Uの認知機能の程度を評価するために、MoCAテストのスコアとフォルマントに基づく特徴量との関係性を示すデータを参照データ151として予め記憶部150が記憶している。しかしながら、参照データは、フォルマントの特徴量と照合することで認知機能の程度の評価をすることができるデータであればよく、MoCAテストとフォルマントの特徴量との関係性を示すデータに限定されない。例えば、参照データは、MMSE(Mini-Mental State Examination:ミニメンタルステート検査)等のスコアとフォルマント等の特徴量との関係を示すデータでもよい。
また、上記実施の形態における認知機能評価処理の具体的内容は、一例である。認知機能評価処理は、被評価者の音声データに基づいて認知機能を評価する処理であればよく、例えば、特許文献2に記載の認知機能評価方法が用いられてもよい。
また、本発明は、認知機能評価装置が実行するステップをコンピュータに実行させるプログラムとして実現されてもよい。また、本発明は、そのプログラムを記録したコンピュータによって読み取り可能なCD-ROM等の記録媒体として実現されてもよい。また、本発明は、そのプログラムを示す情報、データ又は信号として実現されてもよい。そして、それらプログラム、情報、データ及び信号は、インターネット等の通信ネットワークを介して配信されてもよい。
また、上記実施の形態では、被評価者から得られる音声データのみを特徴量として算出して被評価者の認知機能を評価したが、他の既知の認知機能を評価できるデータを組み合わせて評価を実施してもよい。例えば、認知機能と歩幅、歩隔、歩行速度等の歩行に関する歩行データとには、相関があることが知られている。上記実施の形態で評価された被評価者の音声データと、被評価者の歩行データとを組み合わせて認知機能の評価に用いることで、より精度良く被評価者の認知機能は評価され得る。
また、上記実施の形態では、算出部に算出される特徴量を複数例示した。評価部は、算出部によって算出された複数の異なる特徴量から、被評価者の認知機能を評価してもよい。また、評価部は、それぞれの特徴量に対して重み付けを実行して、被評価者の認知機能を評価してもよい。評価部が実行する重み付けで用いられる係数は、任意に定められてよい。
その他、各実施の形態に対して当業者が思いつく各種変形を施して得られる形態、又は、本発明の趣旨を逸脱しない範囲で各実施の形態における構成要素及び機能を任意に組み合わせることで実現される形態も本発明に含まれる。
100 認知機能評価装置
110 取得部
170 テスト処理部(情報処理部)
200、200a、200b 認知機能評価システム
300、300a 集音装置
600 電動駆動装置
U 被評価者
110 取得部
170 テスト処理部(情報処理部)
200、200a、200b 認知機能評価システム
300、300a 集音装置
600 電動駆動装置
U 被評価者
Claims (11)
- 認知機能の評価を行うための被評価者の第1音声データを取得する前に、前記被評価者のテスト用の第2音声データを集音装置から取得する取得部と、
取得された前記第2音声データに基づいて、前記第1音声データの音量を所定の音量範囲に近づけるための情報処理を行う情報処理部とを備える
認知機能評価装置。 - 前記情報処理部は、前記情報処理として、前記被評価者に発話音量の調整を指示する情報を提示する
請求項1に記載の認知機能評価装置。 - 前記情報処理部は、
前記第2音声データの音量が前記所定の音量範囲よりも大きいと判定された場合に、小さい声で発話することを指示する情報を前記被評価者に提示し、
前記第2音声データの音量が前記所定の音量範囲よりも小さいと判定された場合に、大きい声で発話することを指示する情報を前記被評価者に提示する
請求項2に記載の認知機能評価装置。 - 前記情報処理部は、前記情報処理として、前記被評価者に前記被評価者と前記集音装置との位置関係の調整を指示する情報を提示する
請求項1に記載の認知機能評価装置。 - 前記集音装置は、固定されており、
前記情報処理部は、
前記第2音声データの音量が前記所定の音量範囲よりも大きいと判定された場合に、前記集音装置から遠ざかって発話することを指示する情報を前記被評価者に提示し、
前記第2音声データの音量が前記所定の音量範囲よりも小さいと判定された場合に、前記集音装置に近づいて発話することを指示する情報を前記被評価者に提示する
請求項4に記載の認知機能評価装置。 - 前記集音装置は、手動で位置調整が可能であり、
前記情報処理部は、
前記第2音声データの音量が前記所定の音量範囲よりも大きいと判定された場合に、前記集音装置を前記被評価者から遠ざけて発話することを指示する情報を前記被評価者に提示し、
前記第2音声データの音量が前記所定の音量範囲よりも小さいと判定された場合に、前記集音装置を前記被評価者に近づけて発話することを指示する情報を前記被評価者に提示する
請求項4に記載の認知機能評価装置。 - 前記集音装置は、前記集音装置の位置を調整するための電動駆動装置に接続され、
前記情報処理部は、前記情報処理として、前記電動駆動装置を駆動するための制御信号を出力する
請求項1に記載の認知機能評価装置。 - さらに、記憶部を備え、
前記情報処理部は、
前記情報処理を行った後、前記情報処理の内容を前記被評価者の識別情報と対応付けて前記記憶部に記憶し、
前記情報処理の内容が記憶された後に前記被評価者の認知機能の評価を行う際に、前記記憶部に記憶された情報処理と内容が同一の情報処理を行う
請求項1~7のいずれか1項に記載の認知機能評価装置。 - 請求項1~8のいずれか1項に記載の認知機能評価装置と、
前記集音装置とを備える
認知機能評価システム。 - 認知機能の評価を行うための被評価者の第1音声データを取得する前に、前記被評価者のテスト用の第2音声データを集音装置から取得する取得ステップと、
取得された前記第2音声データに基づいて、前記第1音声データの音量を所定の音量範囲に近づけるための情報処理を行う情報処理ステップとを含む
認知機能評価方法。 - 請求項10に記載の認知機能評価方法をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021513171A JP7296595B2 (ja) | 2019-04-10 | 2020-01-21 | 認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019-074725 | 2019-04-10 | ||
JP2019074725 | 2019-04-10 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020208889A1 true WO2020208889A1 (ja) | 2020-10-15 |
Family
ID=72751622
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2020/001804 WO2020208889A1 (ja) | 2019-04-10 | 2020-01-21 | 認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7296595B2 (ja) |
WO (1) | WO2020208889A1 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6337362B2 (ja) * | 1980-02-18 | 1988-07-25 | Nippon Denshin Denwa Kk | |
JP2005184461A (ja) * | 2003-12-19 | 2005-07-07 | Nissan Motor Co Ltd | マイク制御装置およびマイク制御方法 |
JP2010239286A (ja) * | 2009-03-30 | 2010-10-21 | Yoshiichi Miyao | 自動高さ調整機能付きマイクスタンド |
JP2013114039A (ja) * | 2011-11-29 | 2013-06-10 | Brother Ind Ltd | 携帯端末装置用プログラム、携帯端末装置、及び表示方法 |
JP6268628B1 (ja) * | 2017-11-02 | 2018-01-31 | パナソニックIpマネジメント株式会社 | 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム |
JP2019040143A (ja) * | 2017-08-28 | 2019-03-14 | パナソニックIpマネジメント株式会社 | 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5447034B2 (ja) * | 2010-03-16 | 2014-03-19 | 株式会社リコー | 遠隔会議装置及び遠隔会議方法 |
JP6337362B1 (ja) * | 2017-11-02 | 2018-06-06 | パナソニックIpマネジメント株式会社 | 認知機能評価装置、及び、認知機能評価システム |
-
2020
- 2020-01-21 JP JP2021513171A patent/JP7296595B2/ja active Active
- 2020-01-21 WO PCT/JP2020/001804 patent/WO2020208889A1/ja active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6337362B2 (ja) * | 1980-02-18 | 1988-07-25 | Nippon Denshin Denwa Kk | |
JP2005184461A (ja) * | 2003-12-19 | 2005-07-07 | Nissan Motor Co Ltd | マイク制御装置およびマイク制御方法 |
JP2010239286A (ja) * | 2009-03-30 | 2010-10-21 | Yoshiichi Miyao | 自動高さ調整機能付きマイクスタンド |
JP2013114039A (ja) * | 2011-11-29 | 2013-06-10 | Brother Ind Ltd | 携帯端末装置用プログラム、携帯端末装置、及び表示方法 |
JP2019040143A (ja) * | 2017-08-28 | 2019-03-14 | パナソニックIpマネジメント株式会社 | 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム |
JP6268628B1 (ja) * | 2017-11-02 | 2018-01-31 | パナソニックIpマネジメント株式会社 | 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7296595B2 (ja) | 2023-06-23 |
JPWO2020208889A1 (ja) | 2021-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6337362B1 (ja) | 認知機能評価装置、及び、認知機能評価システム | |
US11826161B2 (en) | Cognitive function evaluation device, cognitive function evaluation system, cognitive function evaluation method, and non-transitory computer-readable storage medium | |
Sampaio et al. | Effects of fundamental frequency, vocal intensity, sample duration, and vowel context in cepstral and spectral measures of dysphonic voices | |
US10789966B2 (en) | Method for evaluating a quality of voice onset of a speaker | |
JP6312014B1 (ja) | 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム | |
US11688300B2 (en) | Diagnosis and treatment of speech and language pathologies by speech to text and natural language processing | |
KR101182069B1 (ko) | 발화문장의 운율분석을 통한 특발성 파킨슨병 진단장치 및 진단방법 | |
Almaghrabi et al. | Bio-acoustic features of depression: A review | |
Gustison et al. | Divergent acoustic properties of gelada and baboon vocalizations and their implications for the evolution of human speech | |
JP7022921B2 (ja) | 認知機能評価装置、認知機能評価システム、認知機能評価方法及びプログラム | |
JP2021110895A (ja) | 難聴判定装置、難聴判定システム、コンピュータプログラム及び認知機能レベル補正方法 | |
Chiu et al. | Exploring the acoustic perceptual relationship of speech in Parkinson's disease | |
van Brenk et al. | Investigating acoustic correlates of intelligibility gains and losses during slowed speech: A hybridization approach | |
WO2020208889A1 (ja) | 認知機能評価装置、認知機能評価システム、認知機能評価方法、及び、プログラム | |
Venail et al. | Validation of the French-language version of the OTOSPEECH automated scoring software package for speech audiometry | |
Loizou et al. | Voice signal analysis techniques for cognitive decline (stress) assessment | |
Moro Velázquez | Towards the differential evaluation of Parkinson’s Disease by means of voice and speech processing | |
JP7561358B2 (ja) | 推定方法、プログラムおよび推定装置 | |
Arjmandi et al. | Effects of simulated cochlear-implant processing on voice quality distinction: Evidence from analysis of disordered voices | |
Almaghrabi | Biomedical Signal Processing For Bioacoustic Features Extraction and Reproducibility Evaluation | |
Bharadwaj et al. | A Critical Study of the relation of Emotion and Stress from the Suprasegmental Features of an Assamese Emotional Spontaneous Speech | |
CN117727292A (zh) | 基于lap的语言能力评估系统 | |
Haderlein et al. | Language-independent automatic evaluation of intelligibility of chronically hoarse persons |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20788226 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2021513171 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20788226 Country of ref document: EP Kind code of ref document: A1 |