WO2005087301A1 - ボケ防止装置およびボケ防止方法 - Google Patents

ボケ防止装置およびボケ防止方法 Download PDF

Info

Publication number
WO2005087301A1
WO2005087301A1 PCT/JP2005/002695 JP2005002695W WO2005087301A1 WO 2005087301 A1 WO2005087301 A1 WO 2005087301A1 JP 2005002695 W JP2005002695 W JP 2005002695W WO 2005087301 A1 WO2005087301 A1 WO 2005087301A1
Authority
WO
WIPO (PCT)
Prior art keywords
signal
band
noise
audio signal
blur prevention
Prior art date
Application number
PCT/JP2005/002695
Other languages
English (en)
French (fr)
Inventor
Hiroshi Rikimaru
Original Assignee
Rion Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rion Co., Ltd. filed Critical Rion Co., Ltd.
Priority to US10/583,717 priority Critical patent/US7729907B2/en
Priority to DE112005000469T priority patent/DE112005000469T5/de
Publication of WO2005087301A1 publication Critical patent/WO2005087301A1/ja

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M21/00Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61MDEVICES FOR INTRODUCING MEDIA INTO, OR ONTO, THE BODY; DEVICES FOR TRANSDUCING BODY MEDIA OR FOR TAKING MEDIA FROM THE BODY; DEVICES FOR PRODUCING OR ENDING SLEEP OR STUPOR
    • A61M21/00Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis
    • A61M2021/0005Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis by the use of a particular sense, or stimulus
    • A61M2021/0027Other devices or methods to cause a change in the state of consciousness; Devices for producing or ending sleep by mechanical, optical, or acoustical means, e.g. for hypnosis by the use of a particular sense, or stimulus by the hearing sense

Definitions

  • the present invention relates to a blur prevention device and a blur prevention method that activates brain activity and prevents blurring by listening to degraded noise speech in which at least a part of a band signal of a voice signal is made noise. .
  • the audio signal is divided into four frequency bands (0—600, 600—1500, 150 0—2500, 2500—4000tiz), and each audio signal is half-wave rectified to 16 Hz.
  • a low-pass filter is used to find the amplitude envelope of each frequency band, and a signal obtained by adding the signals multiplied by the band noise corresponding to each frequency band is created.
  • Such a signal is called degraded noise speech. It has been reported that about 80% intelligibility was obtained when deteriorating noise speech was heard by subjects with normal hearing ability.
  • Non-patent ⁇ ffl ⁇ l bnannon, R.V., et.al, 'speech Recognition with Primarily Temporal Cues ", SIENCE, 270, 303-305 (1995)
  • Non-Patent Document 2 Nobuhisa Obata, Hiroshi Rikimaru: Frequency component deteriorated speech focusing on temporal amplitude change, Perception study of the Acoustical Society of Japan H-99-6 (1999)
  • Non-Patent Document 3 Nobuhisa Obata, Hiroshi Kamaru: Intelligibility of Japanese speech synthesized by band noise-Aiming at a speech processor using the function of the auditory central nervous system-, Acoustical Society of Japan, Hearing Study Group Material H- 2000-3 (2000)
  • the blur prevention apparatus and the blur prevention method of the present invention employ the following means and procedures.
  • a signal of a predetermined band is extracted from a sound source signal by a first band filtering unit having a plurality of band filters, and an envelope of each band signal is extracted by an envelope extraction unit having an envelope extractor
  • the noise source signal is added to a second band filtering unit having a plurality of band filters, and a noise signal corresponding to the predetermined band is extracted, and the output of the envelope extracting unit and the second band filtering unit are extracted.
  • the output of the multiplier is multiplied and the output of the multiplier is accumulated in the adder so as to create a deteriorated noise audio signal in which the sound source signal component is made noise.
  • the number of bandpass filters and the frequency boundary of the band can be selected or changed.
  • people of multiple nationalities can use it by selecting or changing the number of bandpass filters and band frequency boundaries suitable for the language. it can.
  • a program recording medium that records a program for causing a computer to function may be a program for causing a computer to function.
  • the blur prevention device and the blur prevention method for converting normal speech to degraded noise speech for listening, the activation of the brain is promoted, the brain function is enhanced, and the language understanding is enhanced.
  • the best mode for carrying out the invention is capable of preventing the cause of the blur phenomenon from occurring in the brain and preventing the occurrence of blur symptoms.
  • a blur prevention device and the like will be described with reference to the drawings.
  • repeated description may be abbreviate
  • FIG. 1 is a block diagram of the blur prevention apparatus of the present invention.
  • the input audio signal from the microphone is applied to the band-pass filter 1 via the input terminal 7.
  • the band filtering unit 1 includes a plurality of band filters la, lb, lc, and Id that extract a signal of a predetermined band.
  • the output signals of the bandpass filters la, lb, lc, and Id are applied to the envelope extractors 2a, 2b, 2c, and 2d of the envelope extractor 2, respectively.
  • Each envelope extractor 2a, 2b, 2c, 2d extracts the envelope of each band signal.
  • the noise signal output from the noise source 5 is applied to the bandpass filter 4 having a plurality of bandpass filters 4a, 4b, 4c, 4d, and is demultiplexed into a noise signal having the same frequency band as the bandpass filter 1.
  • the outputs of the envelope extractors 2a, 2b, 2c, 2d and the bandpass filters 4a, 4b, 4c, 4d are multiplied for each corresponding band in the multiplier 3 having the multipliers 3a, 3b, 3c, 3d. .
  • the plurality of multiplication results are accumulated in the adder 6 and output as an output signal at the output terminal 8.
  • the bandpass filter has a known function for extracting a predetermined frequency component of a signal, and can be constituted by an analog circuit, a digital circuit, a digital signal processor, or the like.
  • the envelope extractor has a well-known function for detecting a change in the amplitude value of a signal, and can be configured by an analog circuit, a digital circuit, a digital signal processor, etc. using the principle of half-wave rectification or full-wave rectification. .
  • the bandpass filters la and 4a responsible for the highest band may be high-pass filters.
  • the bandpass filters l d and 4d responsible for the lowest band may be low-pass filters.
  • Fig. 8 is a diagram showing the results of observing the activation state of the brain using a functional MRI apparatus.
  • B4 is obtained by dividing the audio material into four frequency bands using a bandpass filter and extracting each amplitude envelope.
  • the boundary frequencies are 600, 1500, and 2100 Hz, and the narrowband noise and amplitude with the corresponding frequency bands are extracted.
  • B1 extracted the amplitude envelope of the entire frequency band and multiplied it with noise. However, this noise is multiplied in advance by the effective value of the audio material divided at the boundary frequency.
  • S is an audio material.
  • N is a power spectrum approximation similar to B4 in the same way as B1, but without an amplitude envelope.
  • plain sentences consisting of 12 16 mora (23 seconds) were recorded with a sampling frequency of 8000 Hz and a quantization accuracy of 16 bits.
  • low-frequency noise 40 Hz or less
  • Fig. 8c The activation part of the left temporal lobe seen in [SN] (Fig. 8c) is considered to be the part used for normal speech recognition.
  • Activation of brain activity maintains and strengthens the function of the part, so that it can prevent deterioration of the function of the auditory recognition part, and can also be expected to prevent blurring of various parts other than the auditory recognition part.
  • “bokeh” means a state in which the acquired intelligence is continuously reduced and is dementia.
  • deteriorated noise speech is also expected to activate the activity of the part where the brain disorder that is considered to be the cause of the blurring phenomenon occurs. It can also be expected to prevent the onset of blurring and reduce the symptoms due to functional recovery of brain parts.
  • the frequency characteristics of each bandpass filter should have a frequency characteristic that compensates for the sensitivity reduction characteristic for that frequency band.
  • the dynamic range is set appropriately for each multiplier 3a, 3b, 3c, 3d of multiplier 3. If you want to have a non-linear multiplication characteristic to correct.
  • the band noise signal is created from the noise source 5, but the signal power may be created by distorting the audio signal to make noise.
  • the input signal of the bandpass filter 1 may be distorted, or the output signal of the bandpass filter la-Id may be distorted.
  • the envelope detection is performed for each of the audio signals in the four frequency bands, and the amplitude of the corresponding band noise signal is changed by the envelope signal.
  • the speed of the time change of the envelope signal may follow the change of the sound, but may be slower. That is, the time average value of the envelope signal of each frequency band may be used.
  • the activation effect of the brain may be slightly reduced, but activation other than auditory recognition and voice recognition can be performed.
  • At least a part of the input voice signal is divided into single or plural band signals to obtain a degraded noise voice signal, which is listened to by the user.
  • An anti-blurring device is provided, and the anti-blurring device promotes activation of the brain, and is expected to be effective in preventing blurring.
  • FIG. 2 is a block diagram of an anti-blurring device in a game format using the degraded noise sound of the present invention.
  • the band filtering unit 1, the envelope extracting unit 2, the multiplying unit 3, the band filtering unit 4, the noise source 5, and the adding unit 6 have the same configuration as in FIG.
  • the sound source signal unit 10 stores audio signals of various words and sentences.
  • the sound source selection control unit 11 passes a control signal to the sound source signal unit 10 to select and specify a sound signal of a predetermined word or sentence.
  • the sound source signal unit 10 outputs the speech signal of words and sentences designated by the sound source selection control unit 11 to the band filtering unit 1. From the output terminal 8, a speech signal with degraded noise of the word or sentence is output.
  • the instructor operates the sound source selection control unit 11 in accordance with the anti-blurring program, and sequentially asks the user to hear words and sentences.
  • the user listens to the degraded noise voice and responds verbally to the instructor with recognized words and sentences.
  • the instructor determines correctness and informs the user of the result, and proceeds to the next step.
  • the user learns by knowing the correctness.
  • the leader selects the next word or sentence to be given according to the right or wrong situation.
  • the frequency bands of the band-pass filters of the band-pass filtering units 1 and 4 are standard 0 to 600 Hz, 600 to 1500 Hz, 1500 to 2500 Hz, and 2500 to 4000 Hz.
  • the band selection unit 12 can switch the frequency bands of the band filtering units 1 and 4.
  • the number of frequency bands can be selected from 1, 2, 3, and 4. This is because some words, such as vowels, consonants, and plosives, do not require four frequency bands.
  • the number of frequency bands can be set to 2.
  • the boundary frequency between the frequency bands can be switched between 600Hz, 1500Hz, 2500Hz and 4000Hz.
  • 600Hz, 1500Hz, 2500Hz, 4000Hz are separated from the vowels of the voice by the 1st and the 2nd Fahrenheit Nolemant and in Japanese, Za /, / i /, / uZ, / e /, / o / Yes Value close to the standard frequency boundary.
  • this frequency boundary may be slightly different from person to person.
  • frequency band boundaries are adjusted. It is expected that the effect of preventing blurring will be improved by adjusting and changing, so that switching can be selected for this purpose.
  • the vowel system is different from that in Japanese, so the number of bandpass filters and the boundary frequency can be switched to accommodate foreign languages. Also good.
  • an automatic language recognition unit When dealing with a foreign language, an automatic language recognition unit may be provided, and the automatic language recognition unit may automatically recognize words and sentences first input to a microphone by a user or an instructor.
  • the country name data which is the recognition result of the automatic language recognition unit, is given to the band selection unit 12, and the band selection unit 12 displays the number of band filters and the frequency band boundary corresponding to the language of the country. Let me set it to.
  • the effect of promoting the activation of the brain activity can be obtained by the game-type blur prevention device described in the present embodiment.
  • FIG. 3 is a block diagram of another embodiment of the game-type blur prevention apparatus using the degraded noise voice of the present invention.
  • the deteriorated noise sound output from the adder 6 is presented to the user through the headphones 13 serving as an output unit.
  • the sound source selection control unit 11 has a display signal generation control function in addition to the sound source signal selection function, and gives instructions to the user and answers to words and sentences by degraded noise voice of the display device 14 which is a display unit. Display characters on the screen.
  • the answer input unit 15 is a keyboard for inputting recognized words and sentences.
  • the information signal from the answer input unit 15 is transmitted to the sound source selection control unit 11, and the sound source selection control unit 11 analyzes the contents of the answer and selects the next word or sentence to be presented according to the answer result.
  • the sound source selection control unit 11 includes a blur prevention program. For example, 10 basic words and sentences are presented as a set, one by one in sequence, and the user listens to the deteriorated noise sound and uses the response input unit 15 to input the recognized answer into Enter in.
  • the sound source selection control unit 11 receives the response input unit 15 at the timing when the response is input to the response input unit 15.
  • the information signal indicating the attached answer is compared with the text information corresponding to the words and sentences output from the headphones 13 to determine whether the answer is correct or incorrect. Then, the correctness / incorrectness is counted, and the correctness / incorrectness determination result of the answer and the correct answer are displayed on the display device 14. If the answer is correct, the correct answer need not be displayed.
  • the sound source selection control unit 11 controls the sound source signal unit 10 so as to present the next deteriorated noise voice again.
  • the sound source selection control unit 11 repeats this operation until presentation of 10 words and sentences is completed.
  • the sound source selection control unit 11 displays the correct answer rate obtained by dividing the counted correct answer count value by 10 on the display device 14.
  • the sound source selection control unit 11 and the display device 14 also function as a correct / incorrect output unit for outputting correct / incorrect answers.
  • the sound source selection control unit 11 may present the 10 tasks again and allow the user to confirm the tasks. In this way, the user can self-learn without an instructor.
  • the sound source selection control unit 11 then starts a task program having an appropriate difficulty level according to the accuracy rate. For example, if the accuracy rate is 50% or higher, a task program with a difficulty level higher than the difficulty level of the task program performed immediately before is started, and if the accuracy rate is less than 50%, the task program performed just before is started. You may make it start the program of the subject of the difficulty level lower than the difficulty level of a program. In this case, it is assumed that the difficulty level is set in association with the assignment program.
  • the voice When presenting the degraded noise voice, the voice may be displayed on the display device in characters. For example, it is possible to display a plurality of correct answers and a partially incorrect sentence that is easy to hear and close to the correct answer, and the user may input the number of what he / she thinks correct in the answer input unit 15.
  • the selection of the bandpass filters in the bandpass filtering units 1 and 4, the selection and switching of the band frequency boundaries, and the selection and switching by the automatic language recognition unit described in the second embodiment are applied in the present embodiment. May be.
  • the answer input unit may be a touch panel other than the keyboard, a mouse, or the like. In that case, the answer may be entered by selecting a character from a table with written characters.
  • the user can voluntarily implement a blur prevention menu by the above-described game-type blur prevention device.
  • Various game devices can be realized based on the configuration shown in FIG. First, the game title and difficulty level selection screen is displayed, and the player selects the difficulty level from the answer input section 15, and the sound source selection control section 11 receives the degraded noise sound of the words and sentences of the selected difficulty level. Select and present.
  • the correct answer rate record and the number of correct answers will be displayed on the display device 14 during the game. If a high score is obtained, an interesting screen will appear as a reward on the display so that the player can enjoy it. It is possible to compete for how many questions are answered within a certain period of time and how many correct answers are given.
  • the game device may be for a person with mild disabilities or a normal game device.
  • the presentation content, presentation speed, and presentation screen can be appropriate. The willingness to obtain high scores can also be expected to further promote brain activation.
  • the player may select the difficulty level of the game by operating the band selection unit 12.
  • select the number of bandpass filters from 1 to 4. In the case of four, it is easier to discriminate the original words and sentences than in the case of one, so that the player with the game difficulty level can select.
  • FIG. 4 is an example of a flowchart of a method for implementing the function of the anti-blurring device of the present invention.
  • the input voice signal from the microphone of the anti-blurring device is AD converted, and preparations are made to pass the voice data to the bandpass filtering procedure (S12).
  • This procedure is performed regularly thereafter.
  • the band selection procedure (S11) the number of band frequencies of the band filtering performed by the subsequent band filtering procedures (S12) and (S14) and the boundary frequency of the band frequencies are changed or set as necessary. Perform this procedure when there is user interaction. If there is no operation, skip the procedure.
  • the band filtering procedure (S12) the voice data is filtered based on the set number of band frequencies of the band filtering and the boundary frequency of the band frequencies.
  • the envelope extraction procedure (S13) the envelope component data is extracted from the filtered voice data.
  • the noise signal of white noise is filtered in accordance with the number of band frequencies of the band filtering set and the boundary frequency of the band frequency to generate band noise signal data.
  • Envelope component data and The band noise signal data is multiplied in the next multiplication procedure (S15), and when there are a plurality of multiplication results for the bands, it is accumulated in the addition procedure (S16).
  • the accumulated voice data is degraded noise voice data. This is DA converted in the signal presentation procedure (S17) and presented to the user from the earphone as an analog audio signal for listening.
  • Each step of (S17) may be executed sequentially as shown in FIG. 4, or may be executed in parallel. These procedures can be implemented in the form of a digital signal processor (DSP) program.
  • DSP digital signal processor
  • the procedure from (S11) to (S16) constitutes the degraded noise speech creation procedure (S100). Further, (S14) may be performed before the procedures of (S12) and (S13).
  • band selection procedure (S11) there is a language automatic recognition procedure such as Japanese, English, German, Chinese, etc., and the boundary frequency between the number of frequency bands suitable for the recognized language and the frequency band. May be selected. Since the automatic language recognition technique is a known technique, a detailed description thereof is omitted here.
  • FIG. 5 is an example of a flowchart of a procedure for realizing the function of the game-type blur prevention device of the present invention.
  • the sound source selection procedure (S20) data of a predetermined word or sentence to be presented is selected from the sound source signal data, and is given to the degraded noise voice creation procedure (S100).
  • degraded noise voice creation procedure (S100) degraded noise voice data is created.
  • degraded noise voice presentation procedure (S21) the created degraded noise voice data is converted into an analog voice signal and is heard by the user through headphones. Answer procedure (S
  • the user inputs to the answer input unit 15 words and sentences that are recognized and understood by the deteriorated noise speech that has been heard.
  • the evaluation device converts the input response data to the response evaluation procedure (S
  • the input audio signal from the microphone is applied to the band-pass filter 1 via the input terminal 7, but the input audio signal contains an ambient noise component along with the audio component.
  • the configuration shown in FIG. 6 may be used.
  • the input audio signal applied to the input terminal 7 from the microphone is applied to the band-pass filtering unit 1 via the audio signal extracting unit 9.
  • the audio signal extraction unit 9 has a function of extracting an audio signal from an input audio signal including ambient noise and the like.
  • the audio signal extraction unit 9 is configured to suppress noise components other than the audio signal included in the input audio signal by using a technique such as spectral subtraction, for example.
  • the audio signal extraction unit described in FIG. 9 may be applied to the bandpass filter 1 through 9.
  • a game-type blur prevention device or game device in which one of the two people inputs a word or sentence from a microphone and the other hears the deteriorated noise voice and hits the original word or sentence. Then, since ambient noise may be mixed in, it is preferable to provide the audio signal extraction unit 9.
  • FIG. 7 shows that the sound signal part 10 of the game-type blur prevention apparatus of FIG. 3 stores a signal obtained by converting the sound signal into degraded noise sound in advance and informs the user of the output signal through the headphones 13. Is.
  • the degraded noise audio signal is composed and output by reading the stored degraded noise audio signal from the sound source signal unit 10. Therefore, the band filtering units 1 and 4, the envelope extraction unit 2, the multiplication unit 3, the noise source 5, the addition unit 6, and the band selection unit 12 shown in FIG.
  • the game-type blur prevention device shown in FIG. 2 can have the same configuration.
  • the number of band-pass filters of the band-pass filtering units 1 and 4 is four as a typical example, but the number is not limited to four, and may be four or less. If necessary, implement the number of bands as needed.
  • the recording medium on which the program of the method for preventing blur according to the present invention is recorded refers to a recording medium such as a ROM, RAM, flexible disk, CD-ROM, DVD, memory card, or hard disk on which the program is recorded.
  • the blur prevention method procedure program is, for example, as follows. That is, the program extracts, from the audio signal, a first filtering step for extracting a plurality of predetermined band signals and an envelope of each band signal extracted in the first filtering step. An envelope extraction step; a noise source signal power; a second filtering step for extracting a noise signal corresponding to the predetermined band; a signal extracted in the envelope extraction step; and a signal extracted in the second filtering step. For each band, and an addition step for accumulating each multiplication result in the multiplication step.
  • the activity of various parts of the brain can be activated by using the blur prevention device and the blur prevention method according to the present invention, training centers, nursing care facilities, and medical facilities for the elderly and the elderly There is a possibility of use. It can be configured by a program and can be in the form of a game, so it can be easily installed in personal information terminals such as PDAs, mobile phones, home PCs, and home appliances.
  • FIG. 1 is a block diagram of a blur prevention device according to an embodiment of the present invention.
  • FIG. 2 is a block diagram of a game-type blur prevention device according to an embodiment of the present invention.
  • FIG. 3 is a block diagram of a game-type blur prevention device according to an embodiment of the present invention.
  • FIG. 4 is a flowchart showing the operation of the blur prevention apparatus according to the embodiment of the present invention.
  • FIG. 5 is a flowchart showing the operation of the game-type blur prevention device according to one embodiment of the present invention.
  • FIG. 6 is a block diagram of a blur prevention device according to an embodiment of the present invention.
  • FIG. 7 is a block diagram of a game-type blur prevention device according to an embodiment of the present invention.
  • Fig.8 Diagram showing an example of brain activity activation by degraded noise speech

Landscapes

  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Acoustics & Sound (AREA)
  • Psychology (AREA)
  • Engineering & Computer Science (AREA)
  • Anesthesiology (AREA)
  • Physics & Mathematics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Hematology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】本格的な高齢化社会を迎えるに当たり、ボケ防止策が必要である。 【解決手段】音声信号から、複数の帯域濾波器を有する第1の帯域濾波部により所定の帯域の信号を抽出し、包絡抽出器を有する包絡抽出部により各帯域信号の包絡線を抽出し、雑音源信号を複数の帯域濾波器を有する第2の帯域濾波部に加えて、上記所定の帯域に対応する雑音信号を抽出し、第1の帯域濾波部と第2の帯域濾波部の出力を乗算部において乗算し、乗算部の出力を加算部において累算して、劣化雑音音声信号を作成し、劣化雑音音声信号を聴取することによりボケ防止を行う。

Description

明 細 書
ボケ防止装置およびボケ防止方法
技術分野
[0001] 本発明は、音声信号の少なくとも一部の帯域信号を雑音化した劣化雑音音声を聴 取することにより、脳の活動を活発化し、ボケ防止を行うボケ防止装置およびボケ防 止方法に関する。
背景技術
[0002] 従来、音声信号の認識研究において、被験者が音声信号をそのまま聞くのではな ぐ音声信号の成分が所定の方法で雑音化されたものを聞いたとしても、言葉をかな り認識できることが知られている。かかる技術は、例えば、非特許文献 1、非特許文献 2、非特許文献 3に記載されている。
[0003] 力かる文献によれば、音声信号を 4つの周波数帯域(0— 600、 600— 1500、 150 0— 2500、 2500— 4000tiz)に分けて、それぞれの音声信号を半波整流し、 16Hz のローパスフィルタにかけて、各周波数帯の振幅包絡をもとめ、各周波数帯域に対 応したバンドノイズを掛け合わせた信号を足し合せた信号を作成する。このような信 号を劣化雑音音声という。劣化雑音音声を正常な聴力を有する被験者に聞かせたと ころ約 80%の了解度が得られたことが報告されている。
非特許乂 ffl^l: bnannon, R.V.,et.al, 'speech Recognition with Primarily Temporal Cues",SIENCE,270,303-305(1995)
非特許文献 2:小畑宣久、力丸裕:経時的振幅変化に着目した周波数成分劣化音声 知覚の検討、 日本音響学会聴覚研究会資料 H - 99 - 6 (1999)
非特許文献 3:小畑宣久、カ丸裕:帯域雑音により合成された日本語音声の了解度 - 聴覚中枢神経の機能を利用したスピーチプロセッサを目指して—、 日本音響学会聴 覚研究会資料 H-2000-3 (2000)
発明の開示
発明が解決しょうとする課題
[0004] 近年、高齢化社会になるに従って、いわゆるボケ老人の増加が懸念されている。ボ ケを防止するには、社会などの周囲に関心を持って生活するべきである、友人や家 族との会話を欠かさないべきである、などと言われているが、効果的な方法は確立さ れていない。ボケを効果的に防止できる方法や装置があれば、今後の本格的な高齢 化社会において有用である。
課題を解決するための手段
[0005] 上記の課題を解決するために、本発明のボケ防止装置、ボケ防止方法は、以下の ような手段および手順を採用する。
(1)入力音声信号の少なくとも一部を単一又は複数の帯域信号に分けて雑音化し た劣化雑音音声信号を作成、構成し、利用者が聴取するようにする。
[0006] (2)音源信号から、複数の帯域濾波器を有する第 1の帯域濾波部により、所定の帯 域の信号を抽出し、包絡抽出器を有する包絡抽出部により各帯域信号の包絡線を 抽出し、雑音源信号を複数の帯域濾波器を有する第 2の帯域濾波部に加えて、上記 所定の帯域に対応する雑音信号を抽出し、包絡抽出部の出力と第 2の帯域濾波部 の出力とを乗算部において乗算し、乗算部の出力を加算部において累算して、音源 信号の成分を雑音化した劣化雑音音声信号を作成するようにする。
[0007] (3)帯域濾波器の数や帯域の周波数境界を選択したり、変更したりできるようにす る。 自動言語認識によって、その言語に適した帯域濾波器の数や帯域の周波数境 界を選択したり、変更したりすれば、複数の国籍の人々が使用可能となり、外国人の ボケ防止にも使用できる。
[0008] (4)上記ボケ防止方法は、コンピュータプログラムなどの手順として実行可能である ので、コンピュータに機能させるためのプログラムを記録したプログラム記録媒体ゃコ ンピュータに機能させるためのプログラムとしてよい。
発明の効果
[0009] 本発明によれば、通常音声を劣化雑音音声に変換して聴取するボケ防止装置およ びボケ防止方法により、脳の活性化を促し、脳機能の強化、言語理解の増進により、 ボケ現象の原因が脳に発生するのを防止でき、ボケ症状の発症の防止が期待できる 発明を実施するための最良の形態 [0010] 以下、ボケ防止装置等の実施形態について図面を参照して説明する。なお、実施 の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を 省略する場合がある。
[0011] (実施の形態 1)
図 1は、本発明のボケ防止装置のブロック図である。図 1において、マイクロフォンか らの入力音声信号が、入力端子 7を経て帯域濾波部 1に印加される。帯域濾波部 1 は、所定の帯域の信号を抽出する複数の帯域濾波器 la、 lb、 lc、 Idを有する。各 帯域濾波器 la、 lb、 lc、 Idの出力信号は、包絡抽出部 2の包絡抽出器 2a、 2b、 2c 、 2dにそれぞれ印加される。各包絡抽出器 2a、 2b、 2c、 2dは、各帯域信号の包絡 線をそれぞれ抽出する。雑音源 5の出力する雑音信号は、複数の帯域濾波器 4a、 4 b、 4c、 4dを有する帯域濾波部 4に印加され、帯域濾波部 1と同様の周波数帯域を 有する雑音信号に分波される。包絡抽出器 2a、 2b、 2c、 2dと帯域濾波器 4a、 4b、 4 c、 4dの出力は、乗算器 3a、 3b、 3c、 3dを有する乗算部 3において、対応する帯域 毎に乗算される。その複数の乗算結果は、加算部 6において累算され、出力端子 8 力 出力信号として出力される。なお、帯域濾波器は、信号の所定の周波数成分を 抽出する周知の機能のもので、アナログ回路やデジタル回路、デジタル信号プロセッ サなどにより構成できる。また、包絡抽出器は、信号の振幅値の変化を検出する周知 の機能を有するもので、半波整流や全波整流の原理を用いてアナログ回路やデジタ ル回路、デジタル信号プロセッサなどにより構成できる。また、帯域濾波部 1、 4にお いて、最高帯域を担当する帯域濾波器 la, 4aは高域濾波器であってもよい。また、 最低帯域を担当する帯域濾波器 l d、 4dは低域濾波器であってもよい。
[0012] このようにして作成した劣化雑音音声を、ィャフォンにより聞かせると、脳の通常の 聴覚認識の賦活部位以外の多様な部位が活性化されていることが判明した。上記の ような 4帯域の劣化雑音音声を聞かせながら、 MRI装置により、脳の賦活部位を調べ ると、左側頭葉の通常の音声認識に利用される部位と考えられる部分に活性化が見 られる。また,これに加え、右側頭葉、前頭葉、頭頂葉,小脳の右側など、音声認識 以外に関連すると考えられる部位にも賦活が見られる。図 8は、 functional MRI装置 を使用して、脳の活性化状態を観測した結果を示す図である。 白く塗りつぶした部位 は一定以上の活性化を観測した部位である。図中の Sub.A、 Sub.B、 Sub.Cは、被験 者を表す。 B4、 Bl、 N、 Sは、提示した刺激であり、それぞれ以下のとおりである。 B4 は、音声素材をバンドパスフィルタにより 4周波数帯域に分割し,それぞれの振幅包 絡を抽出したもので、境界周波数を 600、 1500、 2100Hzとし、対応する周波数帯 域をもつ狭帯域雑音と振幅包絡を掛け合わせて作成した。 B1は、全周波数帯域の 振幅包絡を抽出し,雑音と掛け合わせた。ただし,この雑音には前もって,上記境界 周波数で分割された音声素材の実効値が、対応する帯域に掛けられている。 Sは、 音声素材をそのまま用いたものである。 Nは、 B1と同様の方法でパワースぺクトノレを B4に近似したものであるが、振幅包絡は掛けられていなレ、。音声素材としては、 12 一 16モーラ(2 3秒)からなる平易な文章をサンプリング周波数 8000Hz、量子化 精度 16ビットで録音した。さらに、ハイパスフィルタによって低周波ノイズ (40Hz以下 )を低減させたものである。図 8中の [B4-B1]は、刺激 B4と刺激 B1の活性度の差を 表す。 [S-N]で見られる左側頭葉の賦活部位(図 8c)は,通常の音声認識に利用され る部位であると考えられる。 [B4-B1] (図 8a、 b)、 [B4-N] (図 8e)においても, [S-N]と同 じ部位が賦活されている。また、これに加え右側頭葉の賦活も見られる。さらに Sub.B では前頭葉の両側、 Sub.Cでは前頭葉と頭頂葉の両側、小脳の右側にも賦活が見ら れる。このこと力 、 B4の聴取では、通常の音声認識の処理に加えて,他の補助的処 理手段を用いて音声認識をおこなっていると考えることができる。また、側頭葉以外 の賦活パターンが被験者間で大きく異なることが観測され、音声認識部位以外の活 性化には、個人差があると考えられる。従って、従来人為的には活性化が期待できな 力 た部位を活性化する可能性がある。
脳活動の活性化は、その部位の機能を維持、強化するので、聴覚認識部位の機能 劣化を防止できることはもちろん、聴覚認識部位以外の多様な部位について、ボケ 防止効果が期待できる。通常、脳の所定の部位を選択的に活性化することは、普通 の人にとっては容易ではなレ、。特別な思考活動や運動をしないと活性化できない部 位もある。本発明によれば、意識することなぐ 自分の脳の多様な部位の活性化を行 うことができ、ボケ防止に効果的である。ここで、「ボケ」とは、レ、つたん獲得された知 能が、持続的に低下した状態のことであり、痴呆のことである。 [0014] さらに、このような劣化雑音音声は、また、ボケ現象の原因と考えられる脳障害が発 生した部位の活動を活性化することが期待され、聴力の機能強化だけでなぐ障害 のある脳部位の機能回復によるボケ現象の発症の防止や症状軽減の効果も期待で きる。
[0015] 次に、ボケ防止装置の変形について説明する。例えば、難聴者において、ある周 波数帯域の感度が落ちている場合などでは、その周波数に対する感度低下の特性 を補償するような周波数特性を、各帯域濾波器の周波数特性に持たせるようにすれ ばよレ、。また、聞き取れる音量領域に制限が現れていて、小音量では聞き取れず、 大音量では歪んで認識できないような場合は、乗算部 3の各乗算器 3a、 3b、 3c、 3d に、ダイナミックレンジを適正に補正する非線型乗算特性を持たせるようにすればよ レ、。老人に見られる難聴を補償する特性を持たせることにより、言語理解を容易にす ることができ、脳活動の活性化を一層強めることができる。
[0016] 上記説明では、帯域雑音信号を雑音源 5から作成したが、音声信号を歪ませて雑 音化した信号力 作成してもよい。帯域濾波部 1の入力信号を歪ませてもよいし、帯 域濾波器 la— Idの出力信号を歪ませて使用してもよい。
[0017] 図 1では、 4つの周波数帯域の音声信号についてそれぞれ包絡検出し、包絡信号 により対応する帯域雑音信号の振幅を変化させたが、一部の包絡信号のみを用いて もよレ、。包絡信号の時間変化の早さは音声の変化に追随するものでよいが、更に遅 いものにしてもよい。すなわち、各周波数帯域の包絡信号の時間平均値としてもよい 。また、全周波数帯域の包絡信号としてもよい。脳の活性化効果は、やや少なくなる こともあるが、聴覚認識や音声認識部位以外の活性化が行える。
[0018] 図 1では、 4つの周波数帯域の音声信号のすべてを帯域雑音信号に置き換えたが 、一部の周波数帯域の音声信号は乗算部 3に加えずに、直接加算器 6に加えるよう にして、音声信号成分を残してもよい。音声信号成分を残す周波数帯域に対しても、 聴力障害の周波数特性やダイナミックレンジの劣化に対応した、それぞれの補正を 行なってもよレ、。
以上、本実施の形態によれば、入力音声信号の少なくとも一部を単一又は複数の 帯域信号に分けて雑音化した劣化雑音音声信号とし、利用者が聴取するようにした ボケ防止装置を提供し、当該ボケ防止装置により脳の活性化を促し、ボケ防止に効 果が期待される。
[0019] (実施の形態 2)
図 2は、本発明の劣化雑音音声を用いたゲーム形式のボケ防止装置のブロック図 である。図 2において、帯域濾波部 1、包絡抽出部 2、乗算部 3、帯域濾波部 4、雑音 源 5、加算部 6は図 1と同様の構成である。音源信号部 10には、種々の言葉や文章 の音声信号が記憶されている。音源選択制御部 11は、音源信号部 10に制御信号を 渡し、所定の言葉や文章の音声信号を選択、指定する。音源信号部 10は、音源選 択制御部 11によって指定された言葉や文章の音声信号を帯域濾波部 1に出力する 。出力端子 8からは、その言葉や文章の劣化雑音音声信号が出力される。これを、劣 化雑音音声信号を出力する出力部であるスピーカやヘッドフォンにより、使用者に聞 かせる。指導者は、音源選択制御部 11をボケ防止プログラムにしたがって操作して、 順次、言葉や文章を使用者に聞かせる。使用者は劣化雑音音声を聴いて、認識した 言葉や文章を指導者に口頭で回答する。指導者は、正誤を判定してその結果を使 用者に知らせ、次のステップに進む。使用者は、正誤を知ることにより学習をする。指 導者は正誤の状況に応じて、次に与える言葉や文章を選択する。
[0020] 帯域濾波部 1、 4の各帯域濾波器の周波数帯域は、 0— 600Hz、 600— 1500Hz 、 1500— 2500Hz、 2500— 4000Hzを標準的なものとする。帯域選択部 12は、帯 域濾波部 1、 4の上記各周波数帯域を切り替えることができる。例えば、周波数帯域 の数を 1、 2、 3、 4の内から選択できる。これは、母音、子音、破裂音など、言葉によつ ては、 4つの周波数帯域を必要としない場合があるからである。例えば、帯域濾波器 lc、 ld、 4c、 4dの出力を 0とすることにより、周波数帯域の数を 2とすることができる。 また、全部、あるいは任意の一部の帯域濾波器について、その周波数帯域の間の境 界周波数を 600Hz、 1500Hz, 2500Hz, 4000Hzとは另リの周波数に切換選択でき る。 600Hz、 1500Hz, 2500Hz, 4000Hzは、第 1フ才ノレマントと第 2フ才ノレマントに よって、音声の母音、 日本語では、 Za/、 /i/、 /uZ、 /e/、 /o/を分離する 周波数境界の標準的なものに近い値である。しかし、この周波数境界は、人によって 少し異なっている場合がある。このような個人差に対応して、周波数帯域の境界を調 整、変更することによりボケ防止効果がよくなることが期待されるので、このために切 換選択できるようにしておく。また、外国語、すなわち日本語でない言語では、母音 の体系が日本語の場合とは異なるものがあるので、外国語に対応するように帯域濾 波器の数や境界周波数を切り替えられるようにしてもよい。
[0021] 外国語対応をする場合は、言語自動認識部を設けておき、その言語自動認識部が 、使用者や指導者が最初にマイクロフォンに入力した言葉や文章を自動認識しても よい。その言語自動認識部における認識結果である国名データが帯域選択部 12に 与えられ、帯域選択部 12が、その国の言葉に対応した帯域濾波器数と周波数帯域 境界を、帯域濾波部 1と 4に設定させるようにしてもょレ、。
なお、上記した帯域濾波器数と周波数帯域境界の選択や切換、言語自動認識に よる帯域濾波器数と周波数帯域境界の選択や切換は、実施の形態 1で説明したボケ 防止装置にも適用することができる。
以上、本実施の形態で説明したゲーム形式のボケ防止装置により、脳の活動の活 性化を促す効果が得られる。
[0022] (実施の形態 3)
図 3は、本発明の劣化雑音音声を用いたゲーム形式のボケ防止装置の別の実施 の形態のブロック図である。本ブロック図を説明するに際し、図 2と異なる部分につい て説明する。加算部 6の出力する劣化雑音音声は、出力部であるヘッドフォン 13によ り使用者に提示する。音源選択制御部 11は、音源信号選択機能のほかに、表示信 号発生制御機能を有し、使用者に対する指示や、劣化雑音音声による言葉や文章 の回答を、表示部である表示装置 14の画面上に文字表示する。回答入力部 15は、 認識した言葉や文章を入力するキーボードである。回答入力部 15からの情報信号 は、音源選択制御部 11に伝えられ、音源選択制御部 11は、回答内容を分析し、回 答結果にしたがって、次に提示する言葉や文章を選択する。
[0023] 音源選択制御部 11には、ボケ防止プログラムが組み込まれてレ、る。例えば、 10個 の基本的な言葉や文章を 1組として、順次、 1つずつ提示し、使用者は、その劣化雑 音音声を聴き、回答入力部 15に、認識した回答を力、な文字で入力する。音源選択制 御部 11は、回答入力部 15に回答が入力されたタイミングで、回答入力部 15で受け 付けられた回答を示す情報信号と、ヘッドフォン 13から出力された言葉や文章に対 応するテキスト情報とを比較し、回答の正誤を判断する。そして、その正誤をカウント すると共に、回答の正誤の判断結果や、正答を表示装置 14に表示する。回答が正 解であった場合には、正答を表示しなくてもよい。その後、音源選択制御部 11は、次 の劣化雑音音声を再度提示するように音源信号部 10を制御する。音源選択制御部 11は、 10個の言葉や文章の提示が終了するまで、この動作を繰り返す。 10個の提 示と回答が終わったら、音源選択制御部 11は、カウントしていた正答のカウント値を 1 0で割った正解率を表示装置 14に表示する。このように、音源選択制御部 11と表示 装置 14は、回答の正誤を出力する正誤出力部の機能も果たす。最後に、音源選択 制御部 11は、 10個の課題を再度提示して、使用者に課題を確認させるようにしても よい。このようにすれば、使用者は、指導者がいなくとも自習できる。音源選択制御部 11は、正解率に応じて、次に適切な難易度の課題プログラムを開始する。例えば、 正解率が 50%以上であれば、直前に行った課題プログラムの難易度よりも高い難易 度の課題のプログラムを開始し、正解率が 50%未満であれば、直前に行った課題プ ログラムの難易度よりも低い難易度の課題のプログラムを開始するようにしてもよい。 この場合には、課題プログラムに対応付けて難易度が設定されているものとする。
[0024] 劣化雑音音声を提示する際に、その音声を文字によって表示装置に表示してもよ レ、。例えば、正解と、それに近い一部誤った、聞き誤りし易い文章を複数個表示し、 使用者は、正しいと思うものの番号を、回答入力部 15に入力するようにしてもよい。 実施の形態 2において説明した、帯域濾波部 1、 4内の帯域濾波器の選択や、帯域 周波数境界の選択、切換や、言語自動認識部による、選択、切換を、本実施の形態 において適用してもよい。
なお、回答入力部は、キーボード以外のタツチパネルやマウス等であってもよい。そ の場合には、文字の書いてある表から文字を選択することによって回答を入力しても よい。
以上、本実施の形態によれば、上述のゲーム形式のボケ防止装置により、使用者 は自発的にボケ防止のメニューの実施ができる。
[0025] (実施の形態 4) 上記図 3の構成を基本として、種々のゲーム装置を実現することができる。最初に、 ゲームのタイトルや難易度選択画面を表示し、遊戯者が難易度を回答入力部 15から 選択し、音源選択制御部 11は、選択された難易度の言葉や文章の劣化雑音音声を 選択して提示する。正答率の記録や正答数などをゲーム中にも表示装置 14に表示 してゆく。高得点が得られたら表示部に面白い画面がご褒美として現れ、遊戯者が 楽しめるようにする。一定時間内に何問答えられ、何問の正解が出るかを競うように することもできる。このようなゲームの場合、軽度のボケ障害者向けでもよいし、正常 者向けのゲーム装置とすることもできる。対象者によって、提示内容、提示速度、提 示画面は、適切なものにすることができる。高得点を獲得しょうとする意欲が脳の活 性化を更に促す効果も期待できる。
[0026] 遊戯者が、ゲームの難易度の選択を、帯域選択部 12を操作して行なってもよい。
例えば、帯域濾波器の数を 1一 4個の内から選択する。 4個の場合の方が、 1個の場 合よりも、元の言葉や文章をより正しく判別し易いので、ゲームの難易度レベルの遊 戯者が選択できることになる。
[0027] (実施の形態 5)
以下、ボケ防止方法の実施の形態について説明する。図 4は、本発明のボケ防止 装置の機能を実施する方法のフローチャートの一例である。
音声入力手順(S10)において、ボケ防止装置のマイクロフォンからの入力音声信 号を AD変換し、帯域濾波手順 (S12)に音声データを渡す準備を行なっている。こ の手順は、以降定常的に行なう。次に、帯域選択手順(S11)において、以降の帯域 濾波手順 (S12)、(S14)が行なう帯域濾波の帯域周波数の数や帯域周波数の境界 周波数の変更や設定を必要に応じて行なう。この手順は、使用者の操作がある場合 に実行する。操作が無ければ手順を飛ばす。次に、帯域濾波手順(S12)において、 設定された帯域濾波の帯域周波数の数や帯域周波数の境界周波数にもとづいて、 音声データを濾波する。濾波された音声データは、包絡抽出手順(S13)において、 その包絡成分データが抽出される。次に、帯域濾波手順(S14)において、ホワイトノ ィズの雑音信号を、上記設定された帯域濾波の帯域周波数の数や帯域周波数の境 界周波数にしたがって濾波し、帯域雑音信号データを生成する。包絡成分データと 帯域雑音信号データは、次の乗算手順 (S15)において乗算され、乗算結果が複数 の帯域分ある場合は、加算手順 (S16)において累算する。累算した音声データは、 劣化雑音音声データである。これを、信号提示手順(S17)において DA変換し、ァ ナログ音声信号としてィャフォンより使用者に提示し、聴取してもらう。
[0028] (S10) (S17)の各手順は、図 4のように順次実行してもよぐそれぞれ並列的に 実行してもよレ、。それらの手順は、デジタル信号プロセッサ(DSP)のプログラムの形 式で実現できる。
また、 (S11)から (S16)の手順は、劣化雑音音声作成手順 (S100)を構成する。 また、 (S14)を、(S12)、 (S13)の手順よりも前に行ってもよい。
[0029] 帯域選択手順 (S11)において、 日本語、英語、ドイツ語、中国語などの言語自動 認識手順を備えて、認識した言語にあった周波数帯域の数と周波数帯域の間の境 界周波数を選択するようにしてもよい。言語自動認識の技術は、公知技術であるので 、ここでの詳細な説明は省略する。
[0030] (実施の形態 6)
図 5は、本発明のゲーム形式のボケ防止装置の機能を実現する手順のフローチヤ ートの一例である。
ボケ防止プログラムをスタートさせると、音源選択手順(S20)において、音源信号 データから、提示すべき所定の言葉や文章のデータを選択し、劣化雑音音声作成手 順 (S100)に与える。劣化雑音音声作成手順 (S100)は、劣化雑音音声データを作 成する。作成した劣化雑音音声データは、劣化雑音音声提示手順 (S21)において、 アナログの音声信号に変換してヘッドフォンにより、使用者に聞かせる。回答手順(S
22)において、使用者は、聴取した劣化雑音音声を認識して理解した言葉や文章を 回答入力部 15に入力する。評価装置は、入力された回答データを回答評価手順 (S
23)において、正答かどうかを評価判定し、正解提示手順(S24)において、表示装 置に、正誤の結果や正しい言葉や文章を表示する。以上で、一つの設問についての ボケ防止メニューが終わる。この手順を順次繰り返せば、一連の設問から成る一組の ボケ防止プログラムメニューが実行できる。
[0031] (実施の形態 7) 以下、ボケ防止方法の別の実施の形態について説明する。図 5のゲーム形式のボ ケ防止装置手順の正解提示手順 (S24)において、正解率や正答得点などを表示す れば、ゲーム形式のボケ防止手順となる。
[0032] (実施の形態 8)
図 1のボケ防止装置では、マイクロフォンからの入力音声信号が、入力端子 7を経 て帯域濾波部 1に印加されるようにしたが、入力の音声信号に音声成分とともに周囲 雑音成分が含まれる場合がある。このような場合には、図 6のような構成にしてもよい 。図 6において、マイクロフォンからの入力端子 7に印加された入力音声信号は、音 声信号抽出部 9を経て帯域濾波部 1に印加される。音声信号抽出部 9は、周囲雑音 などを含む入力音声信号から、音声信号を抽出する機能を有する。このために、音 声信号抽出部 9は、例えば、スペクトルサブトラクシヨンのような手法で、入力音声信 号中に含まれる音声信号以外の雑音成分を抑圧するような構成とする。
[0033] (実施の形態 9)
図 2のゲーム形式のボケ防止装置や図 3のゲーム形式のボケ防止装置において、 音源信号部 10の音声信号が音声成分以外の周囲雑音を含む場合は、図 6におい て説明した音声信号抽出部 9を経て帯域濾波部 1に印加するようにしてもよい。また、 2人の内のひとりが、マイクロフォンから言葉や文章を入力して、もうひとりが、その劣 化雑音音声を聞き、元の言葉や文章を言い当てるようなゲーム形式のボケ防止装置 やゲーム装置では、周囲の雑音が混入することがあるので、音声信号抽出部 9を設 けることが好ましい。
[0034] (実施の形態 10)
図 7は、図 3のゲーム形式のボケ防止装置の音源信号部 10に、あらかじめ音声信 号を劣化雑音音声に変換した信号を記憶しておき、その出力信号をヘッドフォン 13 により、使用者に聞かせるものである。劣化雑音音声信号は、音源信号部 10から、記 憶してある劣化雑音音声信号を読み出すことにより、構成して出力される。したがつ て、図 3の帯域濾波部 1、 4、包絡抽出部 2、乗算部 3、雑音源 5、加算部 6、帯域選択 部 12を、備えなくともよいことになる。図 2のゲーム形式のボケ防止装置においても、 同様の構成をとることができる。 なお、上記実施例では、帯域濾波部 1、 4の帯域濾波器の数を、典型例として 4個と したが、その数は、 4個に限定されるものではなぐ 4個以下、以上でもよぐその時々 に必要に応じた帯域数で実施すればょレ、。
[0035] なお、本発明のボケ防止方法手順のプログラムを記録した記録媒体は、プログラム を記録した ROM、 RAM,フレキシブルディスク、 CD-ROM, DVD、メモリカード、 ハードディスクなどの記録媒体をいう。ここで、ボケ防止方法手順のプログラムとは、 例えば、次のようなものである。すなわち、このプログラムは、コンピュータに、音声信 号から、複数の所定の帯域の信号を抽出する第 1の濾波ステップと、前記第 1の濾波 ステップで抽出された各帯域信号の包絡線を抽出する包絡抽出ステップと、雑音源 信号力 前記所定の帯域に対応する雑音信号を抽出する第 2の濾波ステップと、包 絡抽出ステップで抽出された信号と、第 2の濾波ステップで抽出された信号とを帯域 ごとに乗算する乗算ステップと、乗算ステップでの各乗算結果を累算する加算ステツ プと実行させるためのものである。
産業上の利用可能性
[0036] 本発明にかかるボケ防止装置やボケ防止方法を使用すると、脳の多様な部位の活 動の活性化が可能であるので、高齢者や熟年者向けのトレーニングセンターや介護 施設、医療施設などで利用の可能性がある。プログラムにより構成可能であり、グー ム形式にできるので、個人情報端末 PDA、携帯電話、家庭用のパソコン、家庭電気 機器などに搭載することが容易である。
図面の簡単な説明
[0037] [図 1]本発明の一実施形態によるボケ防止装置のブロック図
[図 2]本発明の一実施形態によるゲーム形式のボケ防止装置のブロック図
[図 3]本発明の一実施形態によるゲーム形式のボケ防止装置のブロック図
[図 4]本発明の一実施形態によるボケ防止装置の動作を示すフローチャート
[図 5]本発明の一実施形態によるゲーム形式のボケ防止装置の動作を示すフローチ ヤート
[図 6]本発明の一実施形態によるボケ防止装置のブロック図
[図 7]本発明の一実施形態によるゲーム形式のボケ防止装置のブロック図 [図 8]劣化雑音音声による脳の活動活性化の観測例を示す図

Claims

請求の範囲
[1] 音声信号の少なくとも一部を帯域信号に分けて雑音化した劣化雑音音声信号を構 成し、前記劣化雑音音声信号を出力するボケ防止装置。
[2] 音声信号の少なくとも一部を複数の帯域信号に分けてそれぞれを雑音化した劣化雑 音音声信号を構成し、前記劣化雑音音声信号を出力するボケ防止装置。
[3] 前記音声信号から、所定の帯域の信号を抽出する、複数の帯域濾波器を有する第 1 の帯域濾波部と、
前記第 1の帯域濾波部によって抽出された各帯域信号の包絡線を抽出する包絡抽 出器を有する包絡抽出部と、
雑音源信号から、上記所定の帯域に対応する雑音信号を抽出する複数の帯域濾波 器を有する第 2の帯域濾波部と、
前記包絡抽出部の出力と前記第 2の帯域濾波部の出力とを帯域ごとに乗算する乗 算部と、
前記乗算部の出力を累算することによって前記劣化雑音音声信号を作成する加算 部と、を備えた請求項 1または請求項 2記載のボケ防止装置。
[4] 前記帯域濾波器の数、前記帯域濾波器の周波数帯域境界の周波数のうち少なくと も一方を少なくとも言語によって変更できることを特徴とする請求項 3記載のボケ防止 装置。
[5] 前記帯域濾波器の数、前記帯域濾波器の周波数帯域境界の周波数のうち少なくと も一方を言語自動認識により変更できることを特徴とする請求項 3または請求項 4記 載のボケ防止装置。
[6] 前記音声信号の中から音声成分を抽出する音声信号抽出器をさらに備え、前記劣 化雑音音声信号は、前記音声信号抽出器の出力から作成されることを特徴とする請 求項 1から請求項 5のいずれか記載のボケ防止装置。
[7] マイクロフォンをさらに備え、前記音声信号は前記マイクロフォンの出力信号であるこ とを特徴とする請求項 1から請求項 6のいずれか記載のボケ防止装置。
[8] 前記音声信号を記憶する音源信号部をさらに備え、前記音源信号部から読み出した 音声信号から前記劣化雑音音声信号を構成することを特徴とする請求項 1から請求 項 7のレ、ずれか記載のボケ防止装置。
[9] 音声信号の少なくとも一部を単数または複数の帯域信号に分けて雑音化した劣化雑 音音声信号を記憶しており、当該劣化雑音音声信号を出力する音源信号部を備え たことを特徴とするボケ防止装置。
[10] 前記劣化雑音音声信号を出力する出力部と、
使用者の回答を受け付ける回答入力部と、
当該回答の正誤を出力する正誤出力部と、をさらに備えることを特徴とする請求項 1 力 請求項 9のいずれか記載のボケ防止装置。
[11] 音声信号の少なくとも一部を帯域信号に分けて雑音化した劣化雑音音声信号を構 成し、前記劣化雑音音声信号を出力するボケ防止方法。
[12] 音声信号の少なくとも一部を複数の帯域信号に分けてそれぞれを雑音化した劣化雑 音音声信号を構成し、前記劣化雑音音声信号を出力するボケ防止方法。
[13] 前記音声信号から、複数の帯域濾波器を有する第 1の帯域濾波部により所定の帯域 の信号を抽出し、
包絡抽出器を有する包絡抽出部により各帯域信号の包絡線を抽出し、
雑音源信号を複数の帯域濾波器を有する第 2の帯域濾波部に加えて、上記所定の 帯域に対応する雑音信号を抽出し、
包絡抽出部の出力と第 2の帯域濾波部の出力とを乗算部において乗算し、 当該乗算部の出力を加算部において累算して、前記劣化雑音音声信号を作成する 、ことを特徴とする請求項 11または請求項 12記載のボケ防止方法。
[14] 前記帯域濾波器の数、前記帯域濾波器の周波数帯域境界の周波数のうち少なくと も一方を少なくとも言語によって変更できることを特徴とする請求項 13記載のボケ防 止方法。
[15] 前記帯域濾波器の数、前記帯域濾波器の周波数帯域境界の周波数のうち少なくと も一方を言語自動認識により変更できることを特徴とする請求項 13または請求項 14 記載のボケ防止方法。
[16] 前記音声信号の中から音声成分のみを抽出し、前記抽出した音声成分から前記劣 化雑音音声信号を作成することを特徴とする請求項 11から請求項 15のレ、ずれか記 載のボケ防止方法。
[17] マイクロフォンの出力信号を前記音声信号とすることを特徴とする請求項 11から請求 項 16のいずれか記載のボケ防止方法。
[18] 記憶している音声信号力 前記劣化雑音音声信号を構成することを特徴とする請求 項 11から請求項 17のいずれか記載のボケ防止方法。
[19] 記憶している、音声信号の少なくとも一部を単数または複数の帯域信号に分けて雑 音化した劣化雑音音声信号を読み出して出力することを特徴とするボケ防止方法。
[20] 前記劣化雑音音声信号を出力する出力ステップと、
使用者の回答を受け付ける回答入力ステップと、
当該回答の正誤を出力する正誤出力ステップと、を備えた請求項 11から請求項 19 のレ、ずれか記載のボケ防止方法。
PCT/JP2005/002695 2004-03-11 2005-02-21 ボケ防止装置およびボケ防止方法 WO2005087301A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US10/583,717 US7729907B2 (en) 2004-03-11 2005-02-21 Apparatus and method for preventing senility
DE112005000469T DE112005000469T5 (de) 2004-03-11 2005-02-21 Vorrichtung und Verfahren zum Verhindern von Senilität

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-068842 2004-03-11
JP2004068842A JP4035113B2 (ja) 2004-03-11 2004-03-11 ボケ防止装置

Publications (1)

Publication Number Publication Date
WO2005087301A1 true WO2005087301A1 (ja) 2005-09-22

Family

ID=34975350

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/002695 WO2005087301A1 (ja) 2004-03-11 2005-02-21 ボケ防止装置およびボケ防止方法

Country Status (5)

Country Link
US (1) US7729907B2 (ja)
JP (1) JP4035113B2 (ja)
CN (1) CN1905919A (ja)
DE (1) DE112005000469T5 (ja)
WO (1) WO2005087301A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007017572A (ja) 2005-07-06 2007-01-25 Rion Co Ltd 外国語学習装置、外国語学習方法、外国語学習の記録媒体およびプログラム
KR100735261B1 (ko) * 2005-12-26 2007-07-03 삼성전자주식회사 휴대 단말기 및 그 단말기의 음성 데이터 출력 방법
TWI403304B (zh) 2010-08-27 2013-08-01 Ind Tech Res Inst 隨身語能偵知方法及其裝置
US10111804B2 (en) * 2015-09-22 2018-10-30 Amchi Gendynamy Science Corporation Dynamic recovery and therapy system
CN107886965B (zh) * 2017-11-28 2021-04-20 游密科技(深圳)有限公司 游戏背景音的回声消除方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0670981A (ja) * 1992-03-03 1994-03-15 Kevin M Mcintyre 模擬存在
JPH10244003A (ja) * 1997-03-05 1998-09-14 Hayashibara Biochem Lab Inc 脳内活性化装置
JP2003107983A (ja) * 2001-09-27 2003-04-11 Tokai Dentsu:Kk 痴呆防止システム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3784750A (en) * 1972-02-25 1974-01-08 Shalako Resource Systems Apparatus and prosthetic device for providing electronic correction of auditory deficiencies for aurally handicapped persons
US4989248A (en) * 1983-01-28 1991-01-29 Texas Instruments Incorporated Speaker-dependent connected speech word recognition method
US5303327A (en) * 1991-07-02 1994-04-12 Duke University Communication test system
US5794188A (en) * 1993-11-25 1998-08-11 British Telecommunications Public Limited Company Speech signal distortion measurement which varies as a function of the distribution of measured distortion over time and frequency
US5754978A (en) * 1995-10-27 1998-05-19 Speech Systems Of Colorado, Inc. Speech recognition system
US6109107A (en) * 1997-05-07 2000-08-29 Scientific Learning Corporation Method and apparatus for diagnosing and remediating language-based learning impairments
US6868163B1 (en) * 1998-09-22 2005-03-15 Becs Technology, Inc. Hearing aids based on models of cochlear compression
US6505152B1 (en) * 1999-09-03 2003-01-07 Microsoft Corporation Method and apparatus for using formant models in speech systems
US7110951B1 (en) * 2000-03-03 2006-09-19 Dorothy Lemelson, legal representative System and method for enhancing speech intelligibility for the hearing impaired
US7203643B2 (en) * 2001-06-14 2007-04-10 Qualcomm Incorporated Method and apparatus for transmitting speech activity in distributed voice recognition systems
CN1452110A (zh) 2002-04-19 2003-10-29 英业达股份有限公司 无母语提示的多媒体外语造句表达训练系统及其方法
CA2452945C (en) * 2003-09-23 2016-05-10 Mcmaster University Binaural adaptive hearing system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0670981A (ja) * 1992-03-03 1994-03-15 Kevin M Mcintyre 模擬存在
JPH10244003A (ja) * 1997-03-05 1998-09-14 Hayashibara Biochem Lab Inc 脳内活性化装置
JP2003107983A (ja) * 2001-09-27 2003-04-11 Tokai Dentsu:Kk 痴呆防止システム

Also Published As

Publication number Publication date
US20070185710A1 (en) 2007-08-09
CN1905919A (zh) 2007-01-31
US7729907B2 (en) 2010-06-01
DE112005000469T5 (de) 2007-01-25
JP4035113B2 (ja) 2008-01-16
JP2005253655A (ja) 2005-09-22

Similar Documents

Publication Publication Date Title
Shinn-Cunningham et al. Selective attention in normal and impaired hearing
McDermott The cocktail party problem
US8057234B2 (en) Foreign language learning apparatus
US7502483B2 (en) Hearing aid, training device, game device, and audio output device
Nittrouer et al. Improving speech-in-noise recognition for children with hearing loss: Potential effects of language abilities, binaural summation, and head shadow
Shinn-Cunningham Cortical and sensory causes of individual differences in selective attention ability among listeners with normal hearing thresholds
Rossi-Katz et al. Message and talker identification in older adults: Effects of task, distinctiveness of the talkers' voices, and meaningfulness of the competing message
US10334376B2 (en) Hearing system with user-specific programming
Kusumoto et al. Modulation enhancement of speech by a pre-processing algorithm for improving intelligibility in reverberant environments
WO2005087301A1 (ja) ボケ防止装置およびボケ防止方法
Gallun et al. Exploring the role of the modulation spectrum in phoneme recognition
Krull et al. Text as a supplement to speech in young and older adults
US7421392B2 (en) Diagnosis device and diagnosis method
EP1031955A1 (en) Auditory sense training method and sound processing method for auditory sense training
RU2525366C1 (ru) Способ слухоречевой реабилитации и устройство для его реализации
KR100586060B1 (ko) 청각 훈련 장치
JP3636295B2 (ja) 記憶確認学習装置およびデジタル記録媒体
KR100528180B1 (ko) 청각 훈련 방법 및 청각 훈련용 기록 매체
Johnson Improving speech intelligibility without sacrificing environmental sound recognition
Ranjbar et al. Auditive identification of signal-processed environmental sounds: Monitoring the environment
Marchegiani et al. A behavioral study on the effects of rock music on auditory attention
Schäfer et al. CoachLea: an Android Application to Evaluate the Speech Production and Perception of Children with Hearing Loss.
Kociński The interaction between speech intelligibility task and non-auditory tasks
Chilo Implementing UX/UI in a real-time speech recognition and translation application in Android and a clinical study
Van Wilderode et al. Toward a Listening Training Paradigm: Evaluation in Normal-Hearing Young and Middle-Aged Adults

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200580001572.0

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 10583717

Country of ref document: US

Ref document number: 2007185710

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 1120050004694

Country of ref document: DE

122 Ep: pct application non-entry in european phase
WWP Wipo information: published in national office

Ref document number: 10583717

Country of ref document: US