JP2009080298A - 補聴装置 - Google Patents

補聴装置 Download PDF

Info

Publication number
JP2009080298A
JP2009080298A JP2007249480A JP2007249480A JP2009080298A JP 2009080298 A JP2009080298 A JP 2009080298A JP 2007249480 A JP2007249480 A JP 2007249480A JP 2007249480 A JP2007249480 A JP 2007249480A JP 2009080298 A JP2009080298 A JP 2009080298A
Authority
JP
Japan
Prior art keywords
voice
hearing aid
sound
start point
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007249480A
Other languages
English (en)
Other versions
JP5054477B2 (ja
Inventor
Atsushi Imai
篤 今井
Akio Ando
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2007249480A priority Critical patent/JP5054477B2/ja
Publication of JP2009080298A publication Critical patent/JP2009080298A/ja
Application granted granted Critical
Publication of JP5054477B2 publication Critical patent/JP5054477B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】受聴者に対してより快適に音声を聞き取り易くする。
【解決手段】受聴者に受聴させる音声の所定の区間を強調して音声を出力する補聴装置において、受聴者に受聴させる音声を入力する音声入力部と、前記音声入力部により入力された音声から強調させる音声区間及び音声開始点を検出する音声区間検出部と、前記音声区間検出部により検出された前記音声開始点を基準として、話速及びホルマントを制御して補聴音声を生成する補聴音声生成部と、前記補聴音声生成部により生成された補聴制御された音声を出力する音声出力部とを有することにより、上記課題を解決する。
【選択図】図1

Description

本発明は、補聴装置に係り、特に受聴者に対してより快適に音声を聞き取り易くするための補聴装置に関する。
従来、高齢者や聴力が弱い人(難聴者)等の受聴者の聴力を補償するために、聞き取りの手がかりを与える手法が用いられている。例えば、発話の開始タイミングを意識させるために、発話の開始部分をゆっくり再生させることで聞き取りの手がかりを与える話速変換に関する手法が開示されている(例えば、特許文献1参照。)。
特許文献1に示されている手法は、時間的に変化する任意の比率で、入力データを伸張合成して得られた出力データについて、ある無音区間が出現し、この無音区間の継続時間が所定の閾値を越えているときに、この入力データに対する出力データの伸張時間を、この伸張時間内の任意の時間だけ削除することで、実際に発話された時間枠の中で、話速変換を行うことができる。
特許第3220043号公報
しかしながら、上述に示すような従来手法には、音声信号の受聴タイミングで増幅率や音の特徴を変化させるものはなく、マイクロホンで収音した音を予め調節された増幅率や音質で再生するのみであった。したがって、音声信号の受聴タイミングで増幅率や音の特徴を変化させ、最小限必要な補聴のみを行い効率的に補聴効果を向上させる手法がなかった。
本発明は、上述した問題点に鑑みなされたものであり、受聴者に対してより快適に音声を聞き取り易くするための補聴装置を提供することを目的とする。
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。
請求項1に記載された発明は、受聴者に受聴させる音声の所定の区間を強調して音声を出力する補聴装置において、受聴者に受聴させる音声を入力する音声入力部と、前記音声入力部により入力された音声から強調させる音声区間及び音声開始点を検出する音声区間検出部と、前記音声区間検出部により検出された前記音声開始点を基準として、話速及びホルマントを制御して補聴音声を生成する補聴音声生成部と、前記補聴音声生成部により生成された補聴制御された音声を出力する音声出力部とを有することを特徴とする。
請求項1記載の発明によれば、受聴者に対してより快適に音声を聞き取り易くすることができる。具体的には、話が始まるタイミングを受聴者に知らせることで、音を聞くための心構えを喚起し、その結果として補聴効果を向上させることができる。
請求項2に記載された発明は、前記音声検出部は、予め設定された複数の音声のパワーの閾値に基づいて、ある所定の時間長における前記閾値の間の区間を音声区間とし、前記区間の開始地点を音声開始点として検出することを特徴とする。
請求項2記載の発明によれば、音声のパワーを基準として音声区間及び音声開始点を効率的に取得することができる。
請求項3に記載された発明は、前記補聴音声生成部は、前記音声開始点で出力される音声を所定の増幅率まで増幅し、その後は前記音声区間の中で予め設定された制御関数に対応させて増幅率を下げることを特徴とする。
請求項3記載の発明によれば、音声区間検出部により検出される音声区間全体の音声を増幅するのではなく、音声開始点(話し始めの部分)を基準に音の大きさ(増幅率)を変化させることで最小限必要な補聴のみを行うことができ、補聴効果を向上させることができる。
請求項4に記載された発明は、前記補聴音声生成部は、前記音声開始点で出力される話速を所定の速度まで遅くし、その後は前記音声区間の中で予め設定された制御関数に対応させて話速を通常速度に近付けることを特徴とする。
請求項4記載の発明によれば、音声区間検出部により検出される音声区間全体の速度を遅くするのではなく、音声開始点を基準に音の速度を変化させることで最小限必要な補聴のみを行うことができ、補聴効果を向上させることができる。
請求項5に記載された発明は、前記補聴音声生成部は、前記音声開始点で出力される音声のホルマント周波数の変化を強調し、その後は前記音声区間の中で予め設定された制御関数に対応させて強調を減少させることを特徴とする。
請求項5記載の発明によれば、音声区間検出部により検出される音声区間全体の速度を遅くするのではなく、音声開始点を基準にホルマント周波数の変化を強調することで、話し始めの“はっきり感”を増すことができ、補聴効果を向上させることができる。
請求項6に記載された発明は、前記音声開始点で前記受聴者に対して触覚による刺激を与える触覚刺激部を有することを特徴とする。
請求項6記載の発明によれば、効果的に受聴者に音声の開始を伝えることができる。
本発明によれば、受聴者に対してより快適に音声を聞き取り易くすることができる。具体的には、話が始まるタイミングを受聴者に知らせることで、音を聞くための心構えを喚起し、その結果として補聴効果を向上させることができる。
<本発明の概要>
本発明は、音声データ全体から音声区間を抽出し、更に話し始めの部分(音声開始点)を基準として、音の大きさ(増幅率)や速度を変化させたり、ホルマント周波数の変化を強調させることで、受聴者(使用者)に対して話し始めの聞き取り易さを向上させる。
また、本発明では、話し始めのタイミングを触覚刺激で与える。これは、例えば、お年寄りや聴力が低下した人でも、肩を叩かれる等して、話しかけられるタイミングを教えられると、話の内容を聞き取れる場合が多いことが知られているため、本発明ではこの現象を利用し話し始めの部分を強調することにより、受聴者に注意を喚起する機能を補聴装置に設ける。
したがって、本発明では、補聴器においても、話しかけられたタイミングを受聴者に察知させる機能を備えることで、増幅率をあまり上げなくても、利用者が良好に聞き取ることができる。また、その結果として、音の増幅率を必要以上に上げずに済むので、大きい音をうるさいと感じることも少なくなる。
以下に、上述したような特徴を有する本発明における補聴装置を好適に実施した形態について、図面を用いて詳細に説明する。
<補聴装置(補聴器):機能構成>
図1は、本発明における補聴装置の一構成例を示す図である。図1に示す補聴装置10は、音声入力部11と、前置増幅部12と、音声開始点検出部13と、増幅率設定部14と、適応増幅部15と、話速・ホルマント制御関数設定部16と、補聴音声生成部17と、音声出力部18とを有するよう構成されている。
音声入力部11は、外部から入力される音声を入力する。なお、音声入力部11は、基本的には例えばマイクロホン等の音声入力装置により音響信号が収音される。また、音声入力部11は、入力した音声を前置増幅部12に出力する。
前置増幅部12は、音声入力部11で入力された音声信号を所定の大きさに増幅する。また、前置増幅部12は、増幅した音声信号を音声区間検出部13及び適応増幅部15に出力する。
音声区間検出部13では、入力された音声に対して、音声に該当する音声区間と、話し始めの部分(音声開始点)を検出する。図2は、本実施形態における音声区間の検出方法の一例を示す図である。なお、図2において横軸は時間を示し、縦軸は音響パワーを示している。
例えば、音声区間検出部13は、図2に示すように入力される音声信号に対して音声区間とするパワーの上限値(Th1)と下限値(Th2)の2種類の閾値を設定し、音声信号に対する音響分析により得られる音声波形21に対して設定された上限値と下限値の間に含まれる時間T1〜T2を音声区間とする。
このように、音響パワーに対して予め2種類の閾値を設定する。つまり、雑音の影響を回避するため、予め大きめの音響パワーを設定した閾値Th1を越えたときに、その時間T2を含む音声区間を検出することができる。具体的には、時間T2から時間軸を逆方向に移動し、初めて閾値Th2を下回った時間T1を音声開始点(話し始めの部分)として検出する。これにより、音声区間検出部13は、音声区間T1〜T2及び音声開始点T1を求めることができる。
ここで、一般的に、補聴装置は、雑音が存在する環境で利用されるため、この閾値の設定が性能を左右することになる。そのため、閾値Th1と閾値Th2は、入力信号を観測しながら適応的に設定するのが好ましい。したがって、音声区間検出部13は、閾値Th1と閾値Th2の設定を任意に変更可能な機能を有する。この場合、例えば補強装置10に対して外部目盛等を設けて閾値を設定してもよく、また、装置内部に組み込まれるソフトウェアを用いて設定することもできる。
また、音声区間検出部13は、3以上の閾値の設定しておき、環境雑音等の収音する周囲の状況に応じてその中から2つの閾値を随時選択するようにしてもよい。なお、音声区間検出部13は、上述した音声区間検出処理を音響信号のパワーが閾値Th1を越えた場合に必ず行い、その都度得られた音声開始点情報を出力する。
また、音声区間検出部13における音声区間検出手法は、上述の手法に限定されることはなく、例えばピッチ抽出によって音声の有無を観測して音声区間を検出することもできる。音声区間検出部13は、検出された区間に関する情報(音声開始点及び音声区間)を増幅率設定部14に出力する。
増幅率設定部14は、音声区間検出部13により音声区間及び音声開始点が検出される毎に、予め設定された増幅率等の条件に基づいて適応増幅ブロックの増幅率を制御する。ここで、図3は、増幅率を制御するための条件の一例を説明するための図である。なお、図3は、増幅率制御を行う基準として予め設定された制御関数を用いて波形を設定した例を示している。また、図3において、横軸は時間を示し、縦軸は増幅率を示している。
ここで、図3に示す時間T3は、音声区間検出部13で検出された音声開始点を示している。増幅率設定部14は、図3に示す所定の関数により得られる曲線波形31に示すように、時刻T0〜T3までの区間は、例えばシグモイド関数f(x)=1/(1+e−x)により得られる曲線波形で設定し、時間T3以降については、余弦関数の1/4周期を組み合わせた曲線や適当な時定数を有するexp減衰関数等を用いた曲線を設定する。
また、増幅率設定部14は、上述したような関数に基づいて、例えば強調増幅率A1及び通常増幅率A2を設定する。なお、図3に示す曲線の例では、音声開始点の時間T3において強調増幅率A1に到達し、その後徐々に単調減少して通常増幅率A2に至る制御関数であれば、どのような関数を用いてもよい。
増幅率設定部14は、上述した制御関数を設定し、設定した関数の情報を適応増幅部15及び話速・ホルマント制御関数設定部16に出力する。
適応増幅部15は、増幅率設定部14で得られた増幅率及び制御関数により得られる曲線に適応させて前置増幅部12から入力された音声信号の所定の音声区間を増幅する。つまり、適応増幅部15は、音声区間検出部13により検出された音声区間に対して、増幅率設定部14で設定された増幅率及び制御関数により所定の音声区間の増幅を行う。
なお、上述した音声区間検出部13と、増幅率設定部14とにおける増幅率制御処理により処理の遅延が生じるが、この処理は人間の知覚できない遅延範囲内で行うため無視することができる。
話速・ホルマント制御関数設定部16では、話速制御用の関数及びホルマント制御用の関数を設定する。ここで、図4は、話速制御用の関数の一例を示す図である。また、図5は、ホルマント制御用の関数の一例を示す図である。なお、図4において、横軸は時間を示し、縦軸は波形伸縮率を示している。また、図5において、横軸は時間を示し、縦軸はホルマント制御量を示している。なお、上述の関数は一例であり、同様な単調減少性を有する関数であれば他の関数を用いた曲線波形であってもよい。
ここで、図4に示す時間T4は、波形区間検出部13により検出された音声開始点を示している。話速・ホルマント制御関数設定部16は、話速制御においては図4に示すように、音声開始点となる時間T4までの区間(時間T0〜T4)までは、波形の伸縮を行わず(伸縮率1.0)、音声開始点となる時間T4を基準にして、例えば音声の波形伸縮率を1.0よりも大きいE1とし、また時間の経過により次第に伸縮率が1.0に近づくように所定の曲線波形41を設定する。なお、波形伸縮率E1については、例えば、1.5や2.0等の所定の値を環境雑音や受聴者(使用者)個人の聞き取り易さ等の各種条件に基づいて任意に設定することができる。
また、図4においては、波形を大きく(伸縮率が大きく)するほど、話速が遅くなる。なお、時間T4以降の曲線波形41の設定方法としては、例えば余弦関数の1/4周期や適当な時定数を有するexp減衰関数等を用いることができる。
また、図5に示す時間T5は、波形区間検出部13により検出された音声開始点を示している。話速・ホルマント制御関数設定部16は、ホルマント制御においては図5に示すように、音声開始点となる時間T5までの区間(時間T0〜T5)までは、制御関数の値が0であるため制御は行わず、音声開始点となる時間T5以降については、制御関数の値に対応させて設定される制御量をS1とし、所定の曲線波形51を設定することで、ホルマント周波数の変化を強調する。
なお、制御量S1については、環境雑音や使用者(受聴者)個人の聞き取り易さ等の各種条件に基づいて任意に設定することができる。また、曲線波形51の設定方法としては、例えば余弦関数の1/4周期や適当な時定数を有するexp減衰関数等を用いることができる。
更に、上述した図3に示すような増幅率制御用の関数、図4に示すような話速制御用の関数、及び、図5に示すようなホルマント制御用の関数は、例えば、以下に示すような同一の関数R(t)を用いることができる。
R(t)=r+(r−r)×1/2×[cos{π(t−t)/T}+1.0]
このとき、上述した図3に示す関数の場合には、r=A2、r=A1とし、図4に示す関数の場合には、r=1.0、r=E1とし、図5に示す関数の場合には、r=0、r=S1とすることにより、1つの関数で効率的に各関数に対応させることができる。
話速・ホルマント制御関数設定部16は、設定された話速制御用の関数及びホルマント制御用の関数を補聴音声生成部17に出力する。
補聴音声生成部17は、話速・ホルマント制御関数設定部16で設定された各制御関数に基づいて、話速・ホルマント周波数の制御を行う。
ここで、補聴音声生成部17における話速の制御に関しては、例えば、上述した特許文献1で開示された方法を利用することができる。具体的には、受聴音声の発声する速さ(話速)を遅くする際に、入力音声のデータ長と、事前に与えられた伸縮倍率に関する変換関数によって予め計算された出力データ長と、実際に出力されている音声のデータ長とを一定の処理単位で常に監視しながら、情報の欠落を生じることなく、一連の処理を行なう。
更に、補聴音声生成部17は、音声を伸張することによる映像と音声との時間差を最小限にすることを目的として、話速変換に期待される遅さの度合い(変換倍率)に応じて設定される可変の閾値以上の長さを有する無音区間を適宜短縮し、かつ入力データ長に対する出力データ長の時間差の程度によって適応的に変換倍率を変化させることにより、変換音声の発話時間を原音声の発話時間にほぼ保ちつつ、決められた時間枠の中で実現し得る最大のゆっくり感を自動的に生成する。
つまり、補聴音声生成部17は、入力データ長と、これに任意の伸縮倍率を乗じて算出される目標データ長と、実際の出力音声データ長とを比較しながら制御を行うため、伸張・伸縮倍率の変化に対しても、音声情報の欠落が生じないようにすることができる。
また、時々刻々変化する原音声と、変換音声との時間差を監視し、時間差が少ない場合には、話速変換倍率を一時的に上昇させ、また逆に多い場合には、話速変換倍率を一時的に下降させる等、適応的に倍率を変化させ、更に話速変換倍率や伸張量等に基づいて、無音区間の残存割合を適応的に変化させて、話速変換に伴う原音声からの時間差を適応的に解消する。そのため、使用者等は、数段階の目安となる変換倍率を一度だけ設定操作するだけで、設定された条件に応じて話速変換倍率や無音区間を適応的に制御し、実際に発話された時間枠の中で、話速変換に期待される効果を安定して得ることができる
一方、ホルマント周波数の制御については、例えば、「都木徹、桑原尚夫、「ホルマント変化の強調・抑圧による声質制御」、日本音響学会講演論文集、昭和61年10月で開示された方法を利用することができる。
具体的には、連続音声中の音韻知覚には、隣接した前後の音韻情報が重要な役割を果たしている。そこで、ある音声のホルマント周波数の時間変化をF(t)とし、以下に示す(1)式を仮定する。
Figure 2009080298

ここで、上述の(1)式において、F^(t)は、現実の物理量F(t)に前後の情報を加算して得られる仮想的な物理量で、知覚の効果を考慮した特徴量ともいえる。また、上述の(1)式において、w(t)は重み関数であり、Tは考慮すべき前後の時間の範囲である。
上述した(1)式は、F^(t)には現時刻tの物理量F(t)に加えて、時間tだけ前後の物理量F(t+t)のF(t)からの差が、tに応じた重みで貢献していることを示している。したがって、この重みW(t)を増減することにより、知覚的な特徴量F^(t)を制御することができる。重み関数W(t)には、以下に示す(2)式を用いる。
Figure 2009080298
ここで、上述した(2)式において、αは重みを増減する係数である。なお、自然音声の第1及び第2ホルマント周波数の軌跡に、α=7.3、T=0.15(sec)として、上述した(1)式を代入した場合に、個々の母音のクラス内のまとまりがよくなると共にクラス間の距離が大きくなり、物理特性上では母音の中性化がある程度回復されることが観察されている。
したがって、補聴音声生成部17は、上述の(2)式のαとして、ホルマント周波数制御関数から得られる値を用いる。これにより、特徴量を制御することができ、声質制御を行うことができる。
また、補聴音声生成部17は、上述により設定を行った音声を音声出力部18に出力する。音声出力部18は、補聴音声生成部17より得られる音声全体を所定の増幅率で増幅した後、補聴制御された音声を出力する。なお、音声出力部18としては、例えばイヤホン等を適用することができる。
これにより、受聴者に対してより快適に音声を聞き取り易くすることができる。具体的には、話が始まるタイミングを音声の大きさや速度の制御により受聴者に知らせることで、音を聞くための心構えを喚起し、その結果として補聴効果を向上させることができる。
<他の実施形態>
なお、受聴者に音を聞くための心構えを喚起させる手法としては、上述以外にも、例えば触覚を刺激する手段を設けることで、その結果として補聴効果を向上させることができる。ここで、上述の処理内容を他の実施形態として図を用いて説明する。
図6は、他の実施形態を説明するための一構成例を示す図である。なお、図6において、上述した図1に示す補聴装置10と略同様の処理を行う構成については、同一の名称と同一の番号を付するものとし、ここでの説明は省略する。
図6に示す補聴装置60は、音声入力部11と、前置増幅部12と、音声開始点検出部61と、増幅率設定部14と、適応増幅部15と、話速・ホルマント制御関数設定部16と、補聴音声生成部17と、音声出力部18と、触覚刺激部62とを有するよう構成されている。
ここで、上述の図1に示す補聴装置10との主な相違部分である音声区間検出部61及び触覚刺激部62について説明すると、音声区間検出部61は、上述の手法で検出した音声開始点及び音声区間の情報を増幅率設定部14に出力すると共に、受聴者の触覚に刺激を与えるよう指示する指示制御信号を触覚刺激部62に出力する。
なお、音声区間検出部61は、音声区間の長さ等に応じて刺激の強さや時間を調整した制御信号を生成して触覚刺激部62に出力する。例えば、音声区間の短い場合には刺激の強さを強く、また時間を短くし、音声区間の長い場合には、時間を長くするよう指示する制御信号を生成する。
触覚刺激部62は、例えば特開2002−45790号公報に開示されている既存の手段によって振動を与えることができる。具体的には、コイルとコイル支持台にダンパを介して取り付けられる永久磁石により磁気回路を構成し、磁石を含む磁気回路自体を直接振動子として用いることにより、小型で幅広い周波数帯に対応した振動伝達装置を設けることで、これを使用者の身体の所要部位に押し当て、骨振動等を用いることで、振動呼び出し装置として用いることができる。したがって、触覚刺激部62は、音声区間検出部61から指示制御信号を取得すると、上述した制御に基づいて受聴者に信号を与える。
なお、触覚刺激部62は、上述した手法に限定されず、例えばイヤホンの筐体に微弱電流を流す等の手法を用いることができる。これにより、触覚刺激部62は、指示制御信号の指示内容に基づいて電流を流すことで、受聴者に対して刺激を与え、より快適に音声を聞き取り易くすることができる。具体的には、話が始まるタイミングを触覚への刺激により受聴者に知らせることで、音を聞くための心構えを喚起し、その結果として補聴効果を向上させることができる。
また、触覚刺激部62は、サイレンや踏切の信号音等の注意喚起音が、予め設定された音量以上で受聴された場合には、音声区間検出部61により検出された音声開始点のタイミングで音量の増幅や触覚刺激の手段を用いて注意喚起することができる。
上述の実施形態により、受聴者に対してより明確に警告することができ安全性を向上することができる。これにより、音量や音声速度を必要以上に調整しなくても、刺激を与えることで受聴者が良好に聞き取ることができる。
なお、その他の実施形態として、例えば、話速の制御を行い、更に触覚への刺激も行う等、2つの実施形態を組み合わせて適用することができる。また、上述の実施形態は、本発明の一例に過ぎず、各ブロックでの処理は、同様な目的を達成できるものであれば、いかなる手法を用いてもよい。
また、上述した補聴装置は、耳に設置する補聴器の他にもテレビやパソコン等にも適用でき、番組等のコンテンツを視聴者に提供する際にも補聴手法を適用することができる。
また、上述の補聴装置や、テレビやパソコン等により提供される場合には、上述した補聴手法を実行可能なプログラムを生成し、補聴装置自体やパソコン(補聴装置内の各ソフトウェアを制御するパソコンも含む)等にアプリケーションとしてインストールすることにより補聴プログラム等を実施することができる。
また、テレビやパソコン等により上述の各機能が提供される場合には、触覚刺激部62に対応する処理として、ランプや映像中のフラッシュ画像等、視覚への刺激であってもよい。
<補聴プログラム>
ここで、上述した補聴装置10,60は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記録媒体、マウスやキーボード、ポインティングデバイス等の入力装置、コンテンツを表示する表示手段、並びに外部と通信するためのインタフェースを備えたコンピュータによって構成される。
また、補聴装置10,60に備えた音声入力部11、前置増幅部12、音声開始点検出部13,61と、増幅率設定部14、適応増幅部15、話速・ホルマント制御関数設定部16、補聴音声生成部17、音声出力部18、及び触覚刺激部62における各機能は、これらの機能を記述したプログラムをCPUに実行させることにより、それぞれ実現される。また、これらのプログラムは、磁気ディスク(フロッピィーディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記録媒体に格納して頒布することもできる。
つまり、上述した各構成における処理をコンピュータに実行させるための実行プログラム(補聴プログラム)を生成し、例えば、汎用のパーソナルコンピュータやサーバ等にそのプログラムをインストールすることにより、補聴処理を実現することができる。
<ハードウェア構成>
ここで、本発明における実行可能なコンピュータのハードウェア構成例について図を用いて説明する。図7は、本発明における補聴処理が実現可能なハードウェア構成の一例を示す図である。
図7におけるコンピュータ本体には、入力装置71と、出力装置72と、ドライブ装置73と、補助記憶装置74と、メモリ装置75と、各種制御を行うCPU(Central Processing Unit)76と、ネットワーク接続装置77とを有するよう構成されており、これらはシステムバスBで相互に接続されている。
入力装置71は、使用者(受聴者、視聴者等)が操作するキーボード及びマウス等のポインティングデバイスやマイク等の音声入力デバイス等を有しており、使用者等からのプログラムの実行等、各種操作信号を入力する。
出力装置72は、本発明における処理を行うためのコンピュータ本体を操作するのに必要な各種ウィンドウやデータ等を表示するディスプレイや、音声を出力するスピーカ等を有し、CPU76が有する制御プログラムによりプログラムの実行経過や結果等を表示又は音声出力することができる。
ここで、本発明において、コンピュータ本体にインストールされる実行プログラムは、例えばCD−ROM等の記録媒体78等により提供される。プログラムを記録した記録媒体78は、ドライブ装置73にセット可能であり、記録媒体78に含まれる実行プログラムが、記録媒体78からドライブ装置73を介して補助記憶装置74にインストールされる。
補助記憶装置74は、ハードディスク等のストレージ手段であり、本発明における実行プログラムや、コンピュータに設けられた制御プログラム等を蓄積し必要に応じて入出力を行うことができる。
メモリ装置75は、CPU76により補助記憶装置74から読み出された実行プログラム等を格納する。なお、メモリ装置75は、ROM(Read Only Memory)やRAM(Random Access Memory)等からなる。
CPU76は、OS(Operating System)等の制御プログラム、メモリ装置75に格納されている実行プログラムに基づいて、各種演算や各ハードウェア構成部とのデータの入出力等、コンピュータ全体の処理を制御して各処理を実現することができる。また、CPU76は、プログラムの実行中に必要な各種情報を補助記憶装置74から取得することができ、またCPU76は、処理結果等を格納することもできる。
ネットワーク接続装置77は、通信ネットワーク等と接続することにより、実行プログラムを通信ネットワークに接続されている他の端末等から取得したり、プログラムを実行することで得られた実行結果又は本発明における実行プログラム自体を他の端末等に提供することができる。
上述したようなハードウェア構成により、特別な装置構成を必要とせず、低コストで効率的に補聴処理を実現することができる。また、プログラムをインストールすることにより、補聴処理を容易に実現することができる。
<補聴プログラム>
次に、本発明における実行プログラム(補聴プログラム)による補聴処理手順についてフローチャートを用いて説明する。
図8は、本発明における補聴処理手順の一例を示すフローチャートである。なお、図8では、触覚への刺激処理も行う例を示している。図8において、まず音声を入力し(S01)、予め設定された増幅率で前置増幅を行う(S02)。次に、上述した手法により音声開始点・音声区間を検出し(S03)、検出された音声開始点・音声区間における増幅率を設定する関数を設定し(S04)、設定された制御関数の曲線波形に適応させて音声区間の音声を増幅させる(S05)。
次に、話速・ホルマント制御関数を設定し(S06)、設定した関数に適応させて話速・ホルマント制御を行う(S07)。更に、使用者の触覚へ刺激を行い(S08)、その後、S07の処理にて制御された話速とホルマントに基づいて補聴制御された音声を出力する(S09)。なお、S08の処理は、省略することもできる。
これにより、受聴者に対してより快適に音声を聞き取り易くすることができる。また、実行プログラムをコンピュータにインストールすることにより、容易に補聴処理を実現することができる。
上述したように、本発明によれば、受聴者に対してより快適に音声を聞き取り易くすることができる。具体的には、話が始まるタイミングを受聴者に知らせることで、音を聞くための心構えを喚起し、その結果として補聴効果を向上させることができる。
つまり、音声区間を検出することにより、話し始めの部分を特定し、その部分の増幅率を上げた後、その後は徐々に増幅率を下げることにより、話し始めを受聴者に気付かせることができる。
また、触覚への刺激も利用することで、より確実に、話し始めを気付かせることが可能となる。更に、話し始めの部分の話速を遅くしたり、ホルマント周波数の変化を強調したりすることにより、話し始めの聞き取りを向上させることができる。
したがって、従来の補聴器の問題である、大きい音はうるさく感じ、小さい音は聞き取りにくいという問題が改善される。その結果、補聴器利用者の聞き取り能力が向上し、お年寄りや難聴者等のコミュニケーションが促進される。
以上本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。
本発明における補聴装置の一構成例を示す図である。 本実施形態における音声区間の検出方法の一例を示す図である。 増幅率を制御するための条件の一例を説明するための図である。 話速制御用の関数の一例を示す図である。 ホルマント制御用の関数の一例を示す図である。 他の実施形態を説明するための一構成例を示す図である。 本発明における補聴処理が実現可能なハードウェア構成の一例を示す図である。 本発明における補聴処理手順の一例を示すフローチャートである。
符号の説明
10,60 補聴装置
11 音声入力部
12 前置増幅部
13,61 音声開始点検出部
14 増幅率設定部
15 適応増幅部
16 話速・ホルマント制御関数設定部
17 補聴音声生成部
18 音声出力部
21 音声波形
31,41,51 曲線波形
62 触覚刺激部
71 入力装置
72 出力装置
73 ドライブ装置
74 補助記憶装置
75 メモリ装置
76 CPU
77 ネットワーク接続装置
78 記録媒体

Claims (6)

  1. 受聴者に受聴させる音声の所定の区間を強調して音声を出力する補聴装置において、
    受聴者に受聴させる音声を入力する音声入力部と、
    前記音声入力部により入力された音声から強調させる音声区間及び音声開始点を検出する音声区間検出部と、
    前記音声区間検出部により検出された前記音声開始点を基準として、話速及びホルマントを制御して補聴音声を生成する補聴音声生成部と、
    前記補聴音声生成部により生成された補聴制御された音声を出力する音声出力部とを有することを特徴とする補聴装置。
  2. 前記音声検出部は、
    予め設定された複数の音声のパワーの閾値に基づいて、ある所定の時間長における前記閾値の間の区間を音声区間とし、前記区間の開始地点を音声開始点として検出することを特徴とする請求項1に記載の補聴装置。
  3. 前記補聴音声生成部は、
    前記音声開始点で出力される音声を所定の増幅率まで増幅し、その後は前記音声区間の中で予め設定された制御関数に対応させて増幅率を下げることを特徴とする請求項1又は2に記載の補聴装置。
  4. 前記補聴音声生成部は、
    前記音声開始点で出力される話速を所定の速度まで遅くし、その後は前記音声区間の中で予め設定された制御関数に対応させて話速を通常速度に近付けることを特徴とする請求項1乃至3の何れか1項に記載の補聴装置。
  5. 前記補聴音声生成部は、
    前記音声開始点で出力される音声のホルマント周波数の変化を強調し、その後は前記音声区間の中で予め設定された制御関数に対応させて強調を減少させることを特徴とする請求項1乃至4の何れか1項に記載の補聴装置。
  6. 前記音声開始点で前記受聴者に対して触覚による刺激を与える触覚刺激部を有することを特徴とする請求項1乃至5の何れか1項に記載の補聴装置。
JP2007249480A 2007-09-26 2007-09-26 補聴装置 Expired - Fee Related JP5054477B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007249480A JP5054477B2 (ja) 2007-09-26 2007-09-26 補聴装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007249480A JP5054477B2 (ja) 2007-09-26 2007-09-26 補聴装置

Publications (2)

Publication Number Publication Date
JP2009080298A true JP2009080298A (ja) 2009-04-16
JP5054477B2 JP5054477B2 (ja) 2012-10-24

Family

ID=40655086

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007249480A Expired - Fee Related JP5054477B2 (ja) 2007-09-26 2007-09-26 補聴装置

Country Status (1)

Country Link
JP (1) JP5054477B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015215463A (ja) * 2014-05-09 2015-12-03 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
CN106992003A (zh) * 2017-03-24 2017-07-28 深圳北斗卫星信息科技有限公司 语音信号自动增益控制方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61156100A (ja) * 1984-12-27 1986-07-15 日本電気株式会社 音声認識装置
JPH05257490A (ja) * 1992-03-10 1993-10-08 Nippon Hoso Kyokai <Nhk> 話速変換方法および装置
JPH10133678A (ja) * 1996-10-30 1998-05-22 Matsushita Electric Ind Co Ltd 音声再生装置
JPH10224898A (ja) * 1997-01-31 1998-08-21 Sanyo Electric Co Ltd 補聴器
JP2005064745A (ja) * 2003-08-08 2005-03-10 Yamaha Corp 聴覚補助装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61156100A (ja) * 1984-12-27 1986-07-15 日本電気株式会社 音声認識装置
JPH05257490A (ja) * 1992-03-10 1993-10-08 Nippon Hoso Kyokai <Nhk> 話速変換方法および装置
JPH10133678A (ja) * 1996-10-30 1998-05-22 Matsushita Electric Ind Co Ltd 音声再生装置
JPH10224898A (ja) * 1997-01-31 1998-08-21 Sanyo Electric Co Ltd 補聴器
JP2005064745A (ja) * 2003-08-08 2005-03-10 Yamaha Corp 聴覚補助装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015215463A (ja) * 2014-05-09 2015-12-03 富士通株式会社 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
CN106992003A (zh) * 2017-03-24 2017-07-28 深圳北斗卫星信息科技有限公司 语音信号自动增益控制方法

Also Published As

Publication number Publication date
JP5054477B2 (ja) 2012-10-24

Similar Documents

Publication Publication Date Title
JP5665134B2 (ja) ヒアリングアシスタンス装置
JP2017538146A (ja) インテリジェントな音声認識および処理のためのシステム、方法、およびデバイス
CN108235181B (zh) 在音频处理装置中降噪的方法
JP6731632B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
JP5027127B2 (ja) 背景雑音に応じてバイブレータの動作を制御することによる移動通信装置の音声了解度の向上
JP2009178783A (ja) コミュニケーションロボット及びその制御方法
JP4876245B2 (ja) 子音加工装置、音声情報伝達装置及び子音加工方法
JP2012063614A (ja) マスキング音生成装置
JP2014130251A (ja) 会話保護システム及び会話保護方法
JP6977768B2 (ja) 情報処理装置、情報処理方法、音声出力装置、および音声出力方法
JP5054477B2 (ja) 補聴装置
JP5863928B1 (ja) 音声調整装置
JP2000152394A (ja) 軽度難聴者用補聴装置、軽度難聴者対応伝送システム、軽度難聴者対応記録再生装置、及び軽度難聴者対応再生装置
JP5682115B2 (ja) サウンドマスキングを行うための装置およびプログラム
CN108630214B (zh) 声音处理装置、声音处理方法以及存储介质
JP2006333396A (ja) 音声信号拡声装置
JP2005124135A (ja) 補聴装置
JP2008102551A (ja) 音声信号の処理装置およびその処理方法
JP2004013084A (ja) 音量制御装置
JP4644876B2 (ja) 音声処理装置
JP7078039B2 (ja) 信号処理装置および方法、並びにプログラム
KR20210056183A (ko) 음성의 선택적 증폭 방법, 컴퓨터 프로그램 및 시스템
WO2020217605A1 (ja) 音声処理装置
JP2005202335A (ja) 音声処理方法と装置及びプログラム
JP4079478B2 (ja) 音声信号の処理回路および処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091016

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110801

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120703

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120727

R150 Certificate of patent or registration of utility model

Ref document number: 5054477

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150803

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees