JP5626366B2 - 音声制御装置、音声制御方法及び音声制御プログラム - Google Patents

音声制御装置、音声制御方法及び音声制御プログラム Download PDF

Info

Publication number
JP5626366B2
JP5626366B2 JP2012551766A JP2012551766A JP5626366B2 JP 5626366 B2 JP5626366 B2 JP 5626366B2 JP 2012551766 A JP2012551766 A JP 2012551766A JP 2012551766 A JP2012551766 A JP 2012551766A JP 5626366 B2 JP5626366 B2 JP 5626366B2
Authority
JP
Japan
Prior art keywords
sound
hearing
reception
voice control
correction amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012551766A
Other languages
English (en)
Other versions
JPWO2012093470A1 (ja
Inventor
鈴木 政直
政直 鈴木
猛 大谷
猛 大谷
太郎 外川
太郎 外川
千里 石川
千里 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2012093470A1 publication Critical patent/JPWO2012093470A1/ja
Application granted granted Critical
Publication of JP5626366B2 publication Critical patent/JP5626366B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/30Monitoring or testing of hearing aids, e.g. functioning, settings, battery power
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R25/00Deaf-aid sets, i.e. electro-acoustic or electro-mechanical hearing aids; Electric tinnitus maskers providing an auditory perception
    • H04R25/70Adaptation of deaf aid to hearing loss, e.g. initial electronic fitting
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/12Audiometering
    • A61B5/121Audiometering evaluating hearing capacity
    • A61B5/123Audiometering evaluating hearing capacity subjective methods
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/74Details of notification to user or communication with user or patient ; user input means
    • A61B5/7475User input or interface means, e.g. keyboard, pointing device, joystick
    • A61B5/749Voice-controlled interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/057Time compression or expansion for improving intelligibility
    • G10L2021/0575Aids for the handicapped in speaking

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Otolaryngology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Multimedia (AREA)
  • Neurosurgery (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、受話音を制御する音声制御装置、音声制御方法及び音声制御プログラムに関する。
従来から、受話音声を聞きやすくするための制御を行う携帯端末装置がある。例えば、ユーザに対して複数の単音周波数信号を再生し、ユーザの聴取結果に基づいて最低聴取レベルを算出し、音声を加工する技術がある(特許文献1)。
また、ロンバード効果を利用して送話音量が大きい場合、周囲が騒がしいと判断して受話音量を大きくし、送話音量が小さい場合、受話音量を小さくするよう自動調整する技術がある(特許文献2)。
また、特定の音域の音声信号を強調するイコライザを備え、ユーザの音量操作に基づいてイコライザの特性を補正する技術がある(特許文献3)。
特開平7−66767号公報 特開2004−165865号公報 特開2010−81523号公報
しかしながら、特許文献1では、ユーザが聴力検査を実施する必要があるため、ユーザに対し煩雑な処理を強いることになり、使い勝手が悪いという問題点がある。
また、特許文献2では、送話音量のみで受話音量を判定するため、ユーザの聴力の特性を考慮しておらず、ユーザによっては音質が悪い場合もあるという問題点がある。
また、特許文献3では、ユーザの音量操作が必要であるため、通話中に音量操作をすることは困難であり、通話中に音声制御を行うことができないという問題点がある。
そこで、開示の技術は、上記問題点に鑑みてなされたものであり、ユーザに負担を強いることなく、ユーザの聴力に応じて音声制御を行うことができる音声制御装置、音声制御方法及び音声制御プログラムを提供することを目的とする。
開示の一態様の音声制御装置は、送話音の音量と受話音の音量との比を表す送受音比に基づいてユーザの聴力を推定する聴力推定部と、推定された前記聴力に応じて前記受話音の受話信号に対する補正量を算出する補正量算出部と、算出された前記補正量により前記受話信号を補正する補正部と、を備える。
開示の技術によれば、ユーザに負担を強いることなく、ユーザの聴力に応じて音声制御を行うことができる。
年齢による聴力レベルの変化を示す図。 実施例における音声制御装置の機能の一例を示すブロック図。 聴力推定部の構成の一例を示すブロック図。 送受音比と年齢との関係の一例を示す図。 年齢と最小可聴域との関係の一例を示す図。 聴力補正部の構成の一例を示すブロック図。 騒音量と補正量との関係の一例を示す図。 補正前後の最小可聴域の一例を示す図。 騒音量と、補正前後の最小可聴域との関係の一例を示す図。 スペクトル補正を説明するための図。 実施例における音声制御処理の一例を示すフローチャート。 聴力補正処理の一例を示すフローチャート。 実施例における携帯端末装置のハードウェアの一例を示すブロック図。
101、102 周波数変換部
103 聴力推定部
104 騒音推定部
105 聴力補正部
106 スペクトル補正量算出部
107 スペクトル補正部
108 周波数逆変換部
204 制御部
まず、年齢と聴力との関係について説明する。聴力は、例えば最小可聴域である。図1は、年齢による聴力レベルの変化を示す図である。図1に示すグラフは、発明者らにより実験された聴力実験の実験結果を示す。図1に示す実験によれば、40歳代と60歳代とでは平均聴力レベルが異なることが分かる。60歳代の平均聴力レベルが高域(2kHz〜4kHz)で顕著に落ち込んでいる。また、年齢による聴力低下については、http://tri-osaka.jp/group/infoele/life/sense/data/katagiri/070622.pdfにも調査結果が報告されている。
図1に示すように、加齢により聴力レベルが落ちることが既に知られている。特に、高周波領域において、年齢を重ねるにつれ、聴力レベルが低下する。
ここで、ロンバード効果について説明する。ロンバード効果とは、周囲が騒がしい場合、又は相手の声が小さい場合に相手の声が聞こえにくくなると、話声が大きくなる効果をいう。例えば、背景騒音が50dBspl(以下、単にdBと表記する)の場合、静かな状態(37dB)に比べて話声が4dB大きくなることが調査されている。この調査は、"Effects of noise on speech production: acoustic and perceptual analyses", W. Van. Summers et.al.,J. Acoust. Soc. Am., Vol.84, No.3, September 1988の図1を参照されたい。
しかし、ロンバード効果は、周囲騒音と相手の声の大きさだけでなく、聞く人の聴力にも影響すると考えられる。聴力が低下すると相手の声が聞こえにくくなり、話声が大きくなる傾向がある。図1に示すように、聴力の低下は年齢に関係するため、ロンバード効果と年齢とは関係があると考えられる。
そこで、以下では、ロンバード効果を用いて受話音量と送話音量との関係を求め、この関係から年齢を推定し、推定した年齢から聴力を推定して受話音を制御し、受話音声を聞きやすくする実施例について説明する。以下、図面に基づいて実施例を説明する。
[実施例]
<構成>
次に、実施例における音声制御装置1の機能について説明する。図2は、実施例における音声制御装置1の機能の一例を示すブロック図である。図2に示すように、音声制御装置1は、周波数変換部101、102、聴力推定部103、騒音推定部104、聴力補正部105、スペクトル補正量算出部106、スペクトル補正部107、周波数逆変換部108を含む。
周波数変換部101は、受話音の受話信号r(t)に対して、時間周波数変換を行い、次の式(1)によりスペクトルR(f)を求める。時間周波数変換は、例えば、高速フーリエ変換(FFT)とする。
Figure 0005626366
f:周波数(f=0,1,2、・・・K-1) Kはナイキスト周波数
Re{}:実部
Im{}:虚部
周波数変換部101は、求めたスペクトルR(f)を聴力推定部103、スペクトル補正量算出部106、スペクトル補正部107に出力する。
周波数変換部102は、送話音の送話信号s(t)に対して、時間周波数変換を行い、次の式(2)によりスペクトルS(f)を求める。時間周波数変換は、例えば、高速フーリエ変換(FFT)とする。
Figure 0005626366
f:周波数(f=0,1,2、・・・K-1) Kはナイキスト周波数
Re{}:実部
Im{}:虚部
周波数変換部102は、求めたスペクトルS(f)を聴力推定部103、及び騒音推定部104に出力する。
聴力推定部103は、受話音の音量と送話音の音量とに基づいて、ユーザの聴力を推定する。図3は、聴力推定部103の構成の一例を示すブロック図である。図3に示す例では、聴力推定部103は、送受音比算出部131、年齢推定部132、最小可聴域推定部133を含む。
送受音比算出部131は、受話音のスペクトルR(f)と送話音のスペクトルS(f)との平均電力を次の式により算出する。
Figure 0005626366
R_ave:受話音のスペクトルの平均電力
S_ave:送話音のスペクトルの平均電力
送受音算出部131は、例えば、受話音の平均電力R_aveと送話音の平均電力S_aveとから送受音比sp_ratioを次の式により求める。
sp_ratio=S_ave/R_ave ・・・式(5)
sp_ratio:送受音比
送受音比算出部131は、受話音の音量と送話音の音量との比を送受音比とする。送受音比算出部131は、求めた送受音比を年齢推定部132に出力する。
年齢推定部132は、送受音比算出部131から送受音比を取得すると、予め保持しておいた送受音比と年齢との関係を示す情報を参照し、ユーザの年齢を推定する。
図4は、送受音比と年齢との関係の一例を示す図である。これは、年齢が高くなると聴力が低下して相手の声が聞こえにくくなるため、話声が大きくなるという考えに基づき実験を行う。ロンバード効果の求め方と同様の実験により、予め年齢と送受音比との関係を推定しておく。
例えば、以下の手順により、年齢と送受音比との関係が求められる。
(1)各年齢(又は各年代:10代、20代など)の被験者に対して、受話音量(例えば60dB)に対する送話音量を測定する。
(2)(1)で測定した各年齢で全被験者の平均送話音量を求める。
(3)(2)の平均送話音量と受話音量との比(送受音比)を求める。
(4)(1)〜(3)の処理を他の受話音量(例えば30〜80dB)についても同様に行う。
これにより、受話音量毎に、年齢と送受音比との関係を示す情報ができることになる。年齢推定部132は、この受話音量毎の、年齢と送受音比との関係を示す情報を保持しておく。
年齢推定部132は、送受音比算出部131から取得した送受音比に基づき、図4に示す関係から年齢を推定する。例えば、年齢推定部132は、送受音比を求めた受話音量に対応する、図4に示すような関係を示す情報を特定する。年齢推定部132は、特定した関係を示す情報と、算出された送受音比とから年齢を推定する。年齢推定部132は、推定した年齢を最小可聴域推定部133に出力する。
最小可聴域推定部133は、年齢推定部132から取得した年齢に基づき、最小可聴域を推定する。最小可聴域推定部133は、図1に示すような関係に基づき、各年代の平均的な最小可聴域を保持しておく。
図5は、年代と最小可聴域との関係の一例を示す図である。図5に示すA1は60代の最小可聴域を表し、A2は40代の最小可聴域を表し、A3は20代の最小可聴域を表す。なお、年代と最小可聴域との関係は、図5に示す例では20代ごとに設けているが、例えば10代ごとに設けてもよい。
図5に示すように、年代が上がるにつれて、最小可聴域が上がり聞こえにくくなる。最小可聴域推定部133は、図5に示すような年代と最小可聴域との関係を示すデータを保持し、年齢推定部132から取得した年齢に対応する最小可聴域を取得する。最小可聴域推定部133は、取得した最小可聴域を聴力補正部105に出力する。
年代と最小可聴域との関係以外にも、各年代の聴力低下量を用いてもよい。また、性別に基づく最小可聴域や聴力低下量を用いてもよい。性別による聴力特性の違いは、日本建築学会編「高齢者のための建築環境」、彰国社発行、1994年1月10日発行、p.72−73を参照されたい。
図2に戻り、騒音推定部104は、送話音から周囲の騒音を推定する。例えば、騒音推定部104は、現フレームの送話音の平均電力S_aveから騒音を推定する。
騒音推定部104は、送話音の平均電力S_aveと閾値THとを比較する。
S_ave≧THの場合、騒音推定部104は、騒音量を更新しない。
S_ave<THの場合、騒音推定部104は、騒音量を次の式により更新する。
noise_level(f)=α×S(f)+(1−α)×noise_level(f) ・・・式(6)
noise_level(f):騒音量
α:定数
ここで、noise_level(f)の初期値は任意である。例えば、この初期値は0とする。また、αは0〜1の定数である。αは、例えば、0.1とする。
閾値THは40〜50dBするとよい。人の会話の音声の大きさは70〜80dBであるから、閾値THは人の音声の大きさよりも小さくする。騒音推定部104は、推定した騒音量を聴力補正部105に出力する。
聴力補正部105は、聴力推定部103から取得した最小可聴域と、騒音推定部104から取得した騒音量とにより、聴力(例えば最小可聴域)を補正する。図6は、聴力補正部105の構成の一例を示すブロック図である。聴力補正部105は、補正量算出部151、最小可聴域補正部152を含む。
補正量算出部151は、騒音推定部104から取得した騒音量に応じて補正量を算出する。補正量算出部151は、算出した騒音量を最小可聴域補正部152に出力する。
最小可聴域補正部152は、聴力推定部103から取得した最小可聴域と、補正量算出部151から取得した補正量とに基づき、最小可聴域を補正する。最小可聴域補正部152は、例えば、取得した最小可聴域に、取得した補正量を加算する。
以下、最小可聴域補正の具体例について説明する。
(例1)
補正量算出部151は、騒音量に応じた補正量を保持しておく。図7は、騒音量と補正量との関係の一例を示す図である。図7に示す例では、騒音を大、中、小の3段階に分け、それぞれに対応する補正量を表す。図7に示す例では、B1は騒音量が「大」のスペクトルの補正量を表し、B2は騒音量が「中」のスペクトルの補正量を表し、B3は騒音量が「小」のスペクトルの補正量を表す。
補正量算出部151は、取得した騒音量が大、中、小のいずれに相当するかを閾値判定などで判定し、判定結果に応じて図7に示す関係から補正量を求める。補正量算出部151は、求めた補正量を最小可聴域補正部152に出力する。
最小可聴域補正部152は、聴力推定部103から取得した最小可聴域に、補正量算出部151から取得した補正量を加算する。図8は、補正前後の最小可聴域の一例を示す図である。図8に示す例では、C1は補正後の最小可聴域を表し、C2は補正前の最小可聴域を表す。
最小可聴域補正部152は、図8に示すC2の最小可聴域に対し、図7に示すいずれかの補正量(B1〜B3)を加算することで、補正後の最小可聴域(図7に示すC1)を求める。最小可聴域補正部152は、補正後の最小可聴域H'(f)をスペクトル補正量算出部106に出力する。補正後の最小可聴域H'(f)は、例えば、図8に示すC1である。
(例2)
補正量算出部151は、騒音推定部104から取得した騒音量noise_level(f)に定数βを乗算し、補正量を算出する。βは定数であり、例えば0.1とする。補正量算出部151は、算出した補正量を最小可聴域補正部152に出力する。
最小可聴域補正部152は、次の式により補正後の最小可聴域を求める。
H'(f)=H(f)+β×noise_level(f) ・・・式(7)
H'(f):補正後の最小可聴域
H(f):補正前の最小可聴域
β:定数
noise_level(f):騒音量
図9は、騒音量と、補正前後の最小可聴域との関係の一例を示す図である。図9に示す例では、D1は補正後の最小可聴域を表し、D2は補正前の最小可聴域を表し、D3は騒音量を表す。
最小可聴域補正部152は、図9に示すD2の最小可聴域に対し、図9に示すD3の騒音量に定数βを乗算した補正量を加算することで、補正後の最小可聴域(図9に示すD1)を求める。最小可聴域補正部152は、補正後の最小可聴域H'(f)をスペクトル補正量算出部106に出力する。
これにより、推定した騒音に基づいて、ユーザの年齢から推定した最小可聴域を補正することができる。
図2に戻り、スペクトル補正量算出部106は、受話音のスペクトルR(f)と補正後の最小可聴域H'(f)とを比較して、スペクトル補正量G(f)を求める。例えば、スペクトル補正量算出部106は、次の条件に基づきスペクトル補正量を求める。
R(f)<H'(f)の場合:G(f)=H'(f)−R(f)
R(f)≧H'(f)の場合:G(f)=0
スペクトル補正量算出部106は、求めたスペクトル補正量G(f)をスペクトル補正部107に出力する。
スペクトル補正部107は、例えば、受話音のスペクトルR(f)とスペクトル補正量G(f)から補正後の受話音スペクトルR'(f)を次の式により求める。
R'(f)=R(f)+G(f) ・・・式(8)
図10は、スペクトル補正を説明するための図である。図10に示すE1は補正後の最小可聴域H'(f)を表し、E2は補正前の受話音スペクトルR(f)を表し、E3は補正後の受話音スペクトルR'(f)を表す。スペクトル補正部107は、補正後の受話音スペクトルR'(f)が最小可聴域H'(f)以上になるように受話音スペクトルR(f)を補正する。スペクトル補正部107は、補正された受話音のスペクトルR'(f)を周波数逆変換部108に出力する。
スペクトル補正量算出部106は、予め設定した周波数帯域の受話音スペクトルのみを補正するようにしてもよい。予め設定した周波数帯域は、例えば、聴力が低下しやすい低周波帯域及び/又は高周波帯域とする。これは、聴力が低下しやすい帯域が分かっているからである。
図2に戻り、周波数逆変換部108は、スペクトル補正部107から取得した補正後の受話音スペクトルR'(f)を逆周波数変換(逆FFT変換)し、補正された受話信号r'(t)を取得する。補正された受話信号r'(t)は、スピーカから出力され、出力音となる。
これにより、音声制御装置1は、送話音の音量と受話音の音量との比に基づきユーザの聴力を推定し、この聴力に応じて音声を制御することで、通話中に自動でユーザに聞きやすい音声を提供することができる。
また、音声制御装置1は、推定した騒音に基づいて、ユーザの年齢から推定した最小可聴域を補正することで、ユーザにとってより聞きやすい音声を提供することができる。
なお、騒音推定部104及び聴力補正部105は、必ずしも必要な構成ではない。このとき、スペクトル補正量算出部106は、聴力推定部103により推定された聴力(最小可聴域)を用いてスペクトル補正量を算出すればよい。
<動作>
次に、実施例における音声制御装置1の動作について説明する。図11は、実施例における音声制御処理の一例を示すフローチャートである。
図11に示すステップS101で、送受音比算出部131は、受話音の音量と送話音の音量とから送受音比を算出する。
ステップS102で、年齢推定部132は、算出された送受音比に基づき、送受音比と年齢との関係を示す情報から年齢を推定する。
ステップS103で、最小可聴域推定部133は、推定された年齢に基づき、年齢(又は年代)と最小可聴域との関係を示す情報から最小可聴域を推定する。
ステップS104で、聴力補正部105は、推定された最小可聴域を、送話音に含まれる騒音に基づいて最小可聴域を補正する。この補正処理は、図12を用いて説明する。
ステップS105で、スペクトル補正量算出部106は、補正された最小可聴域以上になるように、受話音スペクトルの補正量を算出する。
ステップS106で、スペクトル補正部107は、算出された補正量を加算するなどして受話信号を補正する。
これにより、通話中に、ユーザの聴力に応じてユーザにとって聞きやすい音声を提供することができる。
図12は、聴力補正処理の一例を示すフローチャートである。図12に示すステップS201で、騒音推定部104は、送話音の平均電力(以下、送話電力ともいう)が閾値THより小さいかを判定する。送話電力が閾値THより小さければ(ステップS201−YES)ステップS202に進み、送話電力が閾値TH以上であれば(ステップS202−NO)ステップS203に進む。送信電力がTHより小さければ、騒音推定部104は、送話音は無音であると判定する。
ステップS202で、騒音推定部104は、現フレームの送話音スペクトルを用いて騒音量を式(6)により更新する。
ステップS203で、聴力補正部105は、推定された騒音量に基づいて、最小可聴域を補正する(図8,9参照)。
これにより、周囲の騒音量が大きい場合には、騒音量に基づいて最小可聴域を補正することで、周囲の騒音に応じて音声をより聞きやすくすることができる。なお、実施例では、騒音量による最小可聴域の補正を必ずしもしなくても、十分な効果を発揮する。
以上、実施例によれば、ユーザに負担を強いることなく、ユーザの聴力に応じて音声制御を行うことができる。また、実施例によれば、通話中に音声制御を行うことができるので、ユーザに音声制御の操作をしてもらう必要がなく、ユーザに応じて自動的に音声制御を行うことができる。
また、聴力推定部103による処理は、所定のタイミング(週に一回、月に一回など)で行い、通常は騒音量による聴力補正のみを行うようにしてもよい。ユーザが変わらなければ、通話する度に毎回聴力推定を行う必要はないからである。
また、送受音算出部131は、送受音比を算出する際、送話音及び受話音が有音(音声)であるときに算出するようにしてもよい。有音判定は、公知の技術を用いて行えばよい。
例えば、特許第3849116号公報では、入力信号のフレーム毎に、電力、零交差率、パワースペクトルのピーク周波数、ピッチ周期等を用いて算出した第1の音声特徴量と、パワースペクトルのピーク周波数の高次成分のみの相違を基に算出した第2の音声特徴量を基に音声か非音声かの判定を行なう。これにより、有音時の送話音の音量と受話音の音量とに基づいてユーザの聴力を推定することができる。
[変形例]
図13は、実施例における携帯端末装置200のハードウェアの一例を示すブロック図である。携帯端末装置200は、アンテナ201、無線部202、ベースバンド処理部203、制御部204、マイク205、スピーカ206、主記憶部207、補助記憶部208、端末インタフェース部209を有する。
アンテナ201は、送信アンプで増幅された無線信号を送信し、また、基地局から無線信号を受信する。無線部202は、ベースバンド処理部203で拡散された送信信号をD/A変換し、直交変調により高周波信号に変換し、その信号を電力増幅器により増幅する。無線部202は、受信した無線信号を増幅し、その信号をA/D変換してベースバンド処理部203に伝送する。
ベースバンド部203は、送信データの誤り訂正符号の追加、データ変調、拡散変調、受信信号の逆拡散、受信環境の判定、各チャネル信号の閾値判定、誤り訂正復号などのベースバンド処理などを行う。
制御部204は、制御信号の送受信などの無線制御を行う。また、制御部204は、補助記憶部208などに記憶されている音声制御プログラムを実行し、実施例における音声制御処理を行う。
主記憶部207は、ROM(Read Only Memory)やRAM(Random Access Memory)などであり、制御部204が実行する基本ソフトウェアであるOSやアプリケーションソフトウェアなどのプログラムやデータを記憶又は一時保存する記憶装置である。
補助記憶部208は、HDD(Hard Disk Drive)などであり、アプリケーションソフトウェアなどに関連するデータを記憶する記憶装置である。例えば、図4、5、7に示すような情報は、補助記憶部208に記憶される。
端末インタフェース部209は、データ用アダプタ処理、ハンドセットおよび外部データ端末とのインタフェース処理を行う。
これにより、携帯端末装置200において、通話中に、自動でユーザの聴力に応じた音声を提供することができる。また、実施例における音声制御装置1を1又は複数の半導体集積化回路として、携帯端末装置200に実装することも可能である。
また、開示の技術は、携帯端末装置200に限らず、他の機器にも実装することができる。変形例では、実施例の音声制御装置を携帯端末装置に実装した例について説明したが、例えば、前述した音声制御装置、又は前述した音声制御処理は、テレビ電話会議装置や電話機能を有する情報処理装置、固定電話などにも適用可能である。
また、前述した実施例で説明した音声制御処理を実現するためのプログラムを記録媒体に記録することで、実施例での音声制御処理をコンピュータに実施させることができる。
また、このプログラムを記録媒体に記録し、このプログラムが記録された記録媒体をコンピュータや携帯端末装置に読み取らせて、前述した制御処理を実現させることも可能である。なお、記録媒体は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的,電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
以上、実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形及び変更が可能である。また、前述した実施例の構成要素を全部又は複数を組み合わせることも可能である。

Claims (6)

  1. 送話音の音量と受話音の音量との比を表す送受音比に基づいてユーザの聴力を推定する聴力推定部と、
    推定された前記聴力に応じて前記受話音の受話信号に対する補正量を算出するスペクトル補正量算出部と、
    算出された前記補正量により前記受話信号を補正する補正部と、
    を備える音声制御装置。
  2. 前記聴力推定部は、
    前記送受音比からユーザの年齢を推定し、該年齢に基づく最小可聴域を推定し、
    前記スペクトル補正量算出部は、
    推定された前記最小可聴域以上になるように前記受話信号に対する補正量を求める請求項1記載の音声制御装置。
  3. 前記送話音から騒音量を推定する騒音推定部と、
    推定された前記騒音量に基づいて前記最小可聴域を補正する聴力補正部と、をさらに備え、
    前記スペクトル補正量算出部は、
    補正された前記最小可聴域以上になるように前記受話信号に対する補正量を求める請求項2記載の音声制御装置。
  4. 前記聴力推定部は、
    前記受話音及び前記送話音が有音であるかを判定し、有音であると判定した受話音及び送話音に対して前記送受音比を求める請求項1乃至3いずれか一項に記載の音声制御装置。
  5. 音声制御装置における音声制御方法であって、
    送話音の音量と受話音の音量との比を表す送受音比に基づいてユーザの聴力を推定し、
    推定された前記聴力に応じて前記受話音の受話信号に対するスペクトルの補正量を算出し、
    算出された前記スペクトルの補正量により前記受話信号を補正する音声制御方法。
  6. 送話音の音量と受話音の音量との比を表す送受音比に基づいてユーザの聴力を推定し、
    推定された前記聴力に応じて前記受話音の受話信号に対するスペクトルの補正量を算出し、
    算出された前記スペクトルの補正量により前記受話信号を補正する、
    処理をコンピュータに実行させるための音声制御プログラム。
JP2012551766A 2011-01-04 2011-01-04 音声制御装置、音声制御方法及び音声制御プログラム Expired - Fee Related JP5626366B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/050017 WO2012093470A1 (ja) 2011-01-04 2011-01-04 音声制御装置、音声制御方法及び音声制御プログラム

Publications (2)

Publication Number Publication Date
JPWO2012093470A1 JPWO2012093470A1 (ja) 2014-06-09
JP5626366B2 true JP5626366B2 (ja) 2014-11-19

Family

ID=46457338

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012551766A Expired - Fee Related JP5626366B2 (ja) 2011-01-04 2011-01-04 音声制御装置、音声制御方法及び音声制御プログラム

Country Status (5)

Country Link
US (1) US9271089B2 (ja)
EP (1) EP2662855A4 (ja)
JP (1) JP5626366B2 (ja)
CN (1) CN103282960B (ja)
WO (1) WO2012093470A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014064093A (ja) * 2012-09-20 2014-04-10 Sony Corp 信号処理装置およびプログラム
CN105142067B (zh) 2014-05-26 2020-01-07 杜比实验室特许公司 音频信号响度控制
KR20160000345A (ko) * 2014-06-24 2016-01-04 엘지전자 주식회사 이동 단말기 및 그 제어 방법
JP6596865B2 (ja) * 2015-03-23 2019-10-30 日本電気株式会社 電話機、電話システム、電話機の音量設定方法、及びプログラム
US9407989B1 (en) 2015-06-30 2016-08-02 Arthur Woodrow Closed audio circuit
EP3402217A1 (en) * 2017-05-09 2018-11-14 GN Hearing A/S Speech intelligibility-based hearing devices and associated methods
KR101941680B1 (ko) * 2018-07-13 2019-01-23 신의상 사용자 맞춤형 오디오 주파수 이퀄라이저 조절 장치 및 방법
CN114900767B (zh) * 2022-04-28 2023-06-13 歌尔股份有限公司 听力的保护方法、装置、终端设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004165865A (ja) * 2002-11-12 2004-06-10 Mitsubishi Electric Corp 電話機及び受話音量調整方法
JP2005530213A (ja) * 2002-06-19 2005-10-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号処理装置
JP2010028515A (ja) * 2008-07-22 2010-02-04 Nec Saitama Ltd 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
JP2010239542A (ja) * 2009-03-31 2010-10-21 Yamaha Corp 音声処理装置
WO2012090282A1 (ja) * 2010-12-27 2012-07-05 富士通株式会社 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3266678B2 (ja) * 1993-01-18 2002-03-18 株式会社日立製作所 聴覚特性補償用音声処理装置
JP3302119B2 (ja) 1993-08-23 2002-07-15 株式会社東芝 無線通信装置
US5777664A (en) 1994-11-18 1998-07-07 Canon Kabushiki Kaisha Video communication system using a repeater to communicate to a plurality of terminals
JPH08163121A (ja) * 1994-12-06 1996-06-21 Canon Inc 映像コミュニケーションシステム
JPH08223256A (ja) * 1995-02-15 1996-08-30 Nec Corp 電話装置
JP3236268B2 (ja) * 1999-01-13 2001-12-10 埼玉日本電気株式会社 音声補正装置及び音声補正機能付き移動機
JP3849116B2 (ja) 2001-02-28 2006-11-22 富士通株式会社 音声検出装置及び音声検出プログラム
JP2004235708A (ja) * 2003-01-28 2004-08-19 Mitsubishi Electric Corp 電話装置
US20060088154A1 (en) * 2004-10-21 2006-04-27 Motorola, Inc. Telecommunication devices that adjust audio characteristics for elderly communicators
US7778831B2 (en) * 2006-02-21 2010-08-17 Sony Computer Entertainment Inc. Voice recognition with dynamic filter bank adjustment based on speaker categorization determined from runtime pitch
CN101166017B (zh) * 2006-10-20 2011-12-07 松下电器产业株式会社 用于声音产生设备的自动杂音补偿方法及装置
JP2009171189A (ja) * 2008-01-16 2009-07-30 Pioneer Electronic Corp 音声補正装置及び音声補正機能を備えた通信端末装置
JP5453740B2 (ja) * 2008-07-02 2014-03-26 富士通株式会社 音声強調装置
JP2010062663A (ja) * 2008-09-01 2010-03-18 Sony Ericsson Mobilecommunications Japan Inc 音声信号処理装置、音声信号処理方法、及び、通信端末
US8792649B2 (en) 2008-09-24 2014-07-29 Mitsubishi Electric Corporation Echo canceller used for voice communication
JP2010081523A (ja) 2008-09-29 2010-04-08 Nec Corp 携帯端末、携帯端末の制御方法、及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005530213A (ja) * 2002-06-19 2005-10-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声信号処理装置
JP2004165865A (ja) * 2002-11-12 2004-06-10 Mitsubishi Electric Corp 電話機及び受話音量調整方法
JP2010028515A (ja) * 2008-07-22 2010-02-04 Nec Saitama Ltd 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
JP2010239542A (ja) * 2009-03-31 2010-10-21 Yamaha Corp 音声処理装置
WO2012090282A1 (ja) * 2010-12-27 2012-07-05 富士通株式会社 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置

Also Published As

Publication number Publication date
WO2012093470A1 (ja) 2012-07-12
CN103282960B (zh) 2016-01-06
EP2662855A1 (en) 2013-11-13
JPWO2012093470A1 (ja) 2014-06-09
US20130279709A1 (en) 2013-10-24
EP2662855A4 (en) 2015-12-16
US9271089B2 (en) 2016-02-23
CN103282960A (zh) 2013-09-04

Similar Documents

Publication Publication Date Title
JP5626366B2 (ja) 音声制御装置、音声制御方法及び音声制御プログラム
JP5598552B2 (ja) 音声制御装置、音声制御方法、音声制御プログラム及び携帯端末装置
JP5704470B2 (ja) オーディオ明瞭度増大方法および装置とコンピュータ装置
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
JP5923994B2 (ja) 音声処理装置及び音声処理方法
US8515087B2 (en) Apparatus for processing an audio signal and method thereof
TW201142831A (en) Adaptive environmental noise compensation for audio playback
JP5151762B2 (ja) 音声強調装置、携帯端末、音声強調方法および音声強調プログラム
EP2626857B1 (en) Reverberation reduction device and reverberation reduction method
EP3340657B1 (en) A hearing device comprising a dynamic compressive amplification system and a method of operating a hearing device
CN111383647B (zh) 语音信号处理方法及装置、可读存储介质
JP5136378B2 (ja) 音響処理方法
JP2008309955A (ja) ノイズサプレス装置
EP2768242A1 (en) Sound processing device, sound processing method and program
JP2010109624A (ja) 音声処理回路、音声処理装置及び音声処理方法
JP2012095047A (ja) 音声処理装置
JP2012163682A (ja) 音声処理装置及び方法
JP4739887B2 (ja) オーディオ再生装置
JP2010204564A (ja) 通信装置
JP6690285B2 (ja) 音信号調整装置、音信号調整プログラム及び音響装置
KR101258057B1 (ko) 청각인지 마스킹 특성을 이용하여 주변잡음에 적응적인 전화기 벨소리 음량조정 장치 및 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140624

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140812

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140915

R150 Certificate of patent or registration of utility model

Ref document number: 5626366

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees