JP5626366B2 - 音声制御装置、音声制御方法及び音声制御プログラム - Google Patents
音声制御装置、音声制御方法及び音声制御プログラム Download PDFInfo
- Publication number
- JP5626366B2 JP5626366B2 JP2012551766A JP2012551766A JP5626366B2 JP 5626366 B2 JP5626366 B2 JP 5626366B2 JP 2012551766 A JP2012551766 A JP 2012551766A JP 2012551766 A JP2012551766 A JP 2012551766A JP 5626366 B2 JP5626366 B2 JP 5626366B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- hearing
- reception
- voice control
- correction amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 22
- 238000012937 correction Methods 0.000 claims description 112
- 238000001228 spectrum Methods 0.000 claims description 57
- 230000005540 biological transmission Effects 0.000 claims description 56
- 238000004364 calculation method Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 10
- 230000007423 decrease Effects 0.000 description 7
- 206010011878 Deafness Diseases 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000010370 hearing loss Effects 0.000 description 4
- 231100000888 hearing loss Toxicity 0.000 description 4
- 208000016354 hearing loss disease Diseases 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000000994 depressogenic effect Effects 0.000 description 1
- 238000012074 hearing test Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/30—Monitoring or testing of hearing aids, e.g. functioning, settings, battery power
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R25/00—Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
- H04R25/70—Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/12—Audiometering
- A61B5/121—Audiometering evaluating hearing capacity
- A61B5/123—Audiometering evaluating hearing capacity subjective methods
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/74—Details of notification to user or communication with user or patient ; user input means
- A61B5/7475—User input or interface means, e.g. keyboard, pointing device, joystick
- A61B5/749—Voice-controlled interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
- G10L21/057—Time compression or expansion for improving intelligibility
- G10L2021/0575—Aids for the handicapped in speaking
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Otolaryngology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Heart & Thoracic Surgery (AREA)
- Veterinary Medicine (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Pathology (AREA)
- Multimedia (AREA)
- Neurosurgery (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
103 聴力推定部
104 騒音推定部
105 聴力補正部
106 スペクトル補正量算出部
107 スペクトル補正部
108 周波数逆変換部
204 制御部
<構成>
次に、実施例における音声制御装置1の機能について説明する。図2は、実施例における音声制御装置1の機能の一例を示すブロック図である。図2に示すように、音声制御装置1は、周波数変換部101、102、聴力推定部103、騒音推定部104、聴力補正部105、スペクトル補正量算出部106、スペクトル補正部107、周波数逆変換部108を含む。
Re{}:実部
Im{}:虚部
周波数変換部101は、求めたスペクトルR(f)を聴力推定部103、スペクトル補正量算出部106、スペクトル補正部107に出力する。
S_ave:送話音のスペクトルの平均電力
送受音算出部131は、例えば、受話音の平均電力R_aveと送話音の平均電力S_aveとから送受音比sp_ratioを次の式により求める。
sp_ratio=S_ave/R_ave ・・・式(5)
sp_ratio:送受音比
送受音比算出部131は、受話音の音量と送話音の音量との比を送受音比とする。送受音比算出部131は、求めた送受音比を年齢推定部132に出力する。
(1)各年齢(又は各年代:10代、20代など)の被験者に対して、受話音量(例えば60dB)に対する送話音量を測定する。
(2)(1)で測定した各年齢で全被験者の平均送話音量を求める。
(3)(2)の平均送話音量と受話音量との比(送受音比)を求める。
(4)(1)〜(3)の処理を他の受話音量(例えば30〜80dB)についても同様に行う。
S_ave≧THの場合、騒音推定部104は、騒音量を更新しない。
S_ave<THの場合、騒音推定部104は、騒音量を次の式により更新する。
noise_level(f)=α×S(f)+(1−α)×noise_level(f) ・・・式(6)
noise_level(f):騒音量
α:定数
ここで、noise_level(f)の初期値は任意である。例えば、この初期値は0とする。また、αは0〜1の定数である。αは、例えば、0.1とする。
(例1)
補正量算出部151は、騒音量に応じた補正量を保持しておく。図7は、騒音量と補正量との関係の一例を示す図である。図7に示す例では、騒音を大、中、小の3段階に分け、それぞれに対応する補正量を表す。図7に示す例では、B1は騒音量が「大」のスペクトルの補正量を表し、B2は騒音量が「中」のスペクトルの補正量を表し、B3は騒音量が「小」のスペクトルの補正量を表す。
補正量算出部151は、騒音推定部104から取得した騒音量noise_level(f)に定数βを乗算し、補正量を算出する。βは定数であり、例えば0.1とする。補正量算出部151は、算出した補正量を最小可聴域補正部152に出力する。
H'(f)=H(f)+β×noise_level(f) ・・・式(7)
H'(f):補正後の最小可聴域
H(f):補正前の最小可聴域
β:定数
noise_level(f):騒音量
図9は、騒音量と、補正前後の最小可聴域との関係の一例を示す図である。図9に示す例では、D1は補正後の最小可聴域を表し、D2は補正前の最小可聴域を表し、D3は騒音量を表す。
R(f)<H'(f)の場合:G(f)=H'(f)−R(f)
R(f)≧H'(f)の場合:G(f)=0
スペクトル補正量算出部106は、求めたスペクトル補正量G(f)をスペクトル補正部107に出力する。
R'(f)=R(f)+G(f) ・・・式(8)
図10は、スペクトル補正を説明するための図である。図10に示すE1は補正後の最小可聴域H'(f)を表し、E2は補正前の受話音スペクトルR(f)を表し、E3は補正後の受話音スペクトルR'(f)を表す。スペクトル補正部107は、補正後の受話音スペクトルR'(f)が最小可聴域H'(f)以上になるように受話音スペクトルR(f)を補正する。スペクトル補正部107は、補正された受話音のスペクトルR'(f)を周波数逆変換部108に出力する。
次に、実施例における音声制御装置1の動作について説明する。図11は、実施例における音声制御処理の一例を示すフローチャートである。
図13は、実施例における携帯端末装置200のハードウェアの一例を示すブロック図である。携帯端末装置200は、アンテナ201、無線部202、ベースバンド処理部203、制御部204、マイク205、スピーカ206、主記憶部207、補助記憶部208、端末インタフェース部209を有する。
Claims (6)
- 送話音の音量と受話音の音量との比を表す送受音比に基づいてユーザの聴力を推定する聴力推定部と、
推定された前記聴力に応じて前記受話音の受話信号に対する補正量を算出するスペクトル補正量算出部と、
算出された前記補正量により前記受話信号を補正する補正部と、
を備える音声制御装置。 - 前記聴力推定部は、
前記送受音比からユーザの年齢を推定し、該年齢に基づく最小可聴域を推定し、
前記スペクトル補正量算出部は、
推定された前記最小可聴域以上になるように前記受話信号に対する補正量を求める請求項1記載の音声制御装置。 - 前記送話音から騒音量を推定する騒音推定部と、
推定された前記騒音量に基づいて前記最小可聴域を補正する聴力補正部と、をさらに備え、
前記スペクトル補正量算出部は、
補正された前記最小可聴域以上になるように前記受話信号に対する補正量を求める請求項2記載の音声制御装置。 - 前記聴力推定部は、
前記受話音及び前記送話音が有音であるかを判定し、有音であると判定した受話音及び送話音に対して前記送受音比を求める請求項1乃至3いずれか一項に記載の音声制御装置。 - 音声制御装置における音声制御方法であって、
送話音の音量と受話音の音量との比を表す送受音比に基づいてユーザの聴力を推定し、
推定された前記聴力に応じて前記受話音の受話信号に対するスペクトルの補正量を算出し、
算出された前記スペクトルの補正量により前記受話信号を補正する音声制御方法。 - 送話音の音量と受話音の音量との比を表す送受音比に基づいてユーザの聴力を推定し、
推定された前記聴力に応じて前記受話音の受話信号に対するスペクトルの補正量を算出し、
算出された前記スペクトルの補正量により前記受話信号を補正する、
処理をコンピュータに実行させるための音声制御プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2011/050017 WO2012093470A1 (ja) | 2011-01-04 | 2011-01-04 | 音声制御装置、音声制御方法及び音声制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2012093470A1 JPWO2012093470A1 (ja) | 2014-06-09 |
JP5626366B2 true JP5626366B2 (ja) | 2014-11-19 |
Family
ID=46457338
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012551766A Expired - Fee Related JP5626366B2 (ja) | 2011-01-04 | 2011-01-04 | 音声制御装置、音声制御方法及び音声制御プログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US9271089B2 (ja) |
EP (1) | EP2662855A4 (ja) |
JP (1) | JP5626366B2 (ja) |
CN (1) | CN103282960B (ja) |
WO (1) | WO2012093470A1 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014064093A (ja) * | 2012-09-20 | 2014-04-10 | Sony Corp | 信号処理装置およびプログラム |
CN105142067B (zh) | 2014-05-26 | 2020-01-07 | 杜比实验室特许公司 | 音频信号响度控制 |
KR20160000345A (ko) * | 2014-06-24 | 2016-01-04 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
JP6596865B2 (ja) * | 2015-03-23 | 2019-10-30 | 日本電気株式会社 | 電話機、電話システム、電話機の音量設定方法、及びプログラム |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
EP3402217A1 (en) * | 2017-05-09 | 2018-11-14 | GN Hearing A/S | Speech intelligibility-based hearing devices and associated methods |
KR101941680B1 (ko) * | 2018-07-13 | 2019-01-23 | 신의상 | 사용자 맞춤형 오디오 주파수 이퀄라이저 조절 장치 및 방법 |
CN114900767B (zh) * | 2022-04-28 | 2023-06-13 | 歌尔股份有限公司 | 听力的保护方法、装置、终端设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004165865A (ja) * | 2002-11-12 | 2004-06-10 | Mitsubishi Electric Corp | 電話機及び受話音量調整方法 |
JP2005530213A (ja) * | 2002-06-19 | 2005-10-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声信号処理装置 |
JP2010028515A (ja) * | 2008-07-22 | 2010-02-04 | Nec Saitama Ltd | 音声強調装置、携帯端末、音声強調方法および音声強調プログラム |
JP2010239542A (ja) * | 2009-03-31 | 2010-10-21 | Yamaha Corp | 音声処理装置 |
WO2012090282A1 (ja) * | 2010-12-27 | 2012-07-05 | 富士通株式会社 | 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3266678B2 (ja) * | 1993-01-18 | 2002-03-18 | 株式会社日立製作所 | 聴覚特性補償用音声処理装置 |
JP3302119B2 (ja) | 1993-08-23 | 2002-07-15 | 株式会社東芝 | 無線通信装置 |
US5777664A (en) | 1994-11-18 | 1998-07-07 | Canon Kabushiki Kaisha | Video communication system using a repeater to communicate to a plurality of terminals |
JPH08163121A (ja) * | 1994-12-06 | 1996-06-21 | Canon Inc | 映像コミュニケーションシステム |
JPH08223256A (ja) * | 1995-02-15 | 1996-08-30 | Nec Corp | 電話装置 |
JP3236268B2 (ja) * | 1999-01-13 | 2001-12-10 | 埼玉日本電気株式会社 | 音声補正装置及び音声補正機能付き移動機 |
JP3849116B2 (ja) | 2001-02-28 | 2006-11-22 | 富士通株式会社 | 音声検出装置及び音声検出プログラム |
JP2004235708A (ja) * | 2003-01-28 | 2004-08-19 | Mitsubishi Electric Corp | 電話装置 |
US20060088154A1 (en) * | 2004-10-21 | 2006-04-27 | Motorola, Inc. | Telecommunication devices that adjust audio characteristics for elderly communicators |
US7778831B2 (en) * | 2006-02-21 | 2010-08-17 | Sony Computer Entertainment Inc. | Voice recognition with dynamic filter bank adjustment based on speaker categorization determined from runtime pitch |
CN101166017B (zh) * | 2006-10-20 | 2011-12-07 | 松下电器产业株式会社 | 用于声音产生设备的自动杂音补偿方法及装置 |
JP2009171189A (ja) * | 2008-01-16 | 2009-07-30 | Pioneer Electronic Corp | 音声補正装置及び音声補正機能を備えた通信端末装置 |
JP5453740B2 (ja) * | 2008-07-02 | 2014-03-26 | 富士通株式会社 | 音声強調装置 |
JP2010062663A (ja) * | 2008-09-01 | 2010-03-18 | Sony Ericsson Mobilecommunications Japan Inc | 音声信号処理装置、音声信号処理方法、及び、通信端末 |
US8792649B2 (en) | 2008-09-24 | 2014-07-29 | Mitsubishi Electric Corporation | Echo canceller used for voice communication |
JP2010081523A (ja) | 2008-09-29 | 2010-04-08 | Nec Corp | 携帯端末、携帯端末の制御方法、及びプログラム |
-
2011
- 2011-01-04 JP JP2012551766A patent/JP5626366B2/ja not_active Expired - Fee Related
- 2011-01-04 WO PCT/JP2011/050017 patent/WO2012093470A1/ja active Application Filing
- 2011-01-04 CN CN201180063528.8A patent/CN103282960B/zh not_active Expired - Fee Related
- 2011-01-04 EP EP11855034.2A patent/EP2662855A4/en not_active Withdrawn
-
2013
- 2013-06-21 US US13/924,071 patent/US9271089B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005530213A (ja) * | 2002-06-19 | 2005-10-06 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 音声信号処理装置 |
JP2004165865A (ja) * | 2002-11-12 | 2004-06-10 | Mitsubishi Electric Corp | 電話機及び受話音量調整方法 |
JP2010028515A (ja) * | 2008-07-22 | 2010-02-04 | Nec Saitama Ltd | 音声強調装置、携帯端末、音声強調方法および音声強調プログラム |
JP2010239542A (ja) * | 2009-03-31 | 2010-10-21 | Yamaha Corp | 音声処理装置 |
WO2012090282A1 (ja) * | 2010-12-27 | 2012-07-05 | 富士通株式会社 | 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2012093470A1 (ja) | 2012-07-12 |
CN103282960B (zh) | 2016-01-06 |
EP2662855A1 (en) | 2013-11-13 |
JPWO2012093470A1 (ja) | 2014-06-09 |
US20130279709A1 (en) | 2013-10-24 |
EP2662855A4 (en) | 2015-12-16 |
US9271089B2 (en) | 2016-02-23 |
CN103282960A (zh) | 2013-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5626366B2 (ja) | 音声制御装置、音声制御方法及び音声制御プログラム | |
JP5598552B2 (ja) | 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置 | |
JP5704470B2 (ja) | オーディオ明瞭度増大方法および装置とコンピュータ装置 | |
TWI463817B (zh) | 可適性智慧雜訊抑制系統及方法 | |
JP5923994B2 (ja) | 音声処理装置及び音声処理方法 | |
US8515087B2 (en) | Apparatus for processing an audio signal and method thereof | |
TW201142831A (en) | Adaptive environmental noise compensation for audio playback | |
JP5151762B2 (ja) | 音声強調装置、携帯端末、音声強調方法および音声強調プログラム | |
EP2626857B1 (en) | Reverberation reduction device and reverberation reduction method | |
EP3340657B1 (en) | A hearing device comprising a dynamic compressive amplification system and a method of operating a hearing device | |
CN111383647B (zh) | 语音信号处理方法及装置、可读存储介质 | |
JP5136378B2 (ja) | 音響処理方法 | |
JP2008309955A (ja) | ノイズサプレス装置 | |
EP2768242A1 (en) | Sound processing device, sound processing method and program | |
JP2010109624A (ja) | 音声処理回路、音声処理装置及び音声処理方法 | |
JP2012095047A (ja) | 音声処理装置 | |
JP2012163682A (ja) | 音声処理装置及び方法 | |
JP4739887B2 (ja) | オーディオ再生装置 | |
JP2010204564A (ja) | 通信装置 | |
JP6690285B2 (ja) | 音信号調整装置、音信号調整プログラム及び音響装置 | |
KR101258057B1 (ko) | 청각인지 마스킹 특성을 이용하여 주변잡음에 적응적인 전화기 벨소리 음량조정 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140624 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140812 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140902 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140915 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5626366 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |