JPH10224898A - 補聴器 - Google Patents

補聴器

Info

Publication number
JPH10224898A
JPH10224898A JP9019356A JP1935697A JPH10224898A JP H10224898 A JPH10224898 A JP H10224898A JP 9019356 A JP9019356 A JP 9019356A JP 1935697 A JP1935697 A JP 1935697A JP H10224898 A JPH10224898 A JP H10224898A
Authority
JP
Japan
Prior art keywords
voice
input
converting
conversion means
time axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9019356A
Other languages
English (en)
Inventor
Koji Tanaka
浩司 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP9019356A priority Critical patent/JPH10224898A/ja
Publication of JPH10224898A publication Critical patent/JPH10224898A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 この発明は、装着者自身が発声した音声を、
別の人が話しているかのように変更でき、装着者が喋り
やすくなる補聴器を提供することを目的とする。 【解決手段】 補聴器において、音声を入力するための
入力装置1、入力装置1から入力された音声の話速を遅
くしかつ音程を元の音程と異なる音程に変換する音声変
換手段2、および音声変換手段2から得られた音声信号
を出力するための出力装置3を備えている。

Description

【発明の詳細な説明】
【0001】
【発明の属する分野】この発明は、補聴器に関する。
【0002】
【従来の技術】補聴器として、対話者の音声を聞き取り
易くするために、マイクに入力された音声の話速を遅く
しかつ音程はそのままでイアホンから出力するようにし
たものがある。
【0003】この種の補聴器では、補聴器を装着してい
る装着者が話をしている場合、装着者の音声が補聴器の
マイクに入力され、話速が遅くされた後、補聴器のイア
ホンから出力される。このように、装着者の声がゆっく
り再生されると、装着者は時間的に遅れた自分の声を聞
くことになり、発声に支障をきたし、喋られなくなった
りするという問題がある。
【0004】
【発明が解決しようとする課題】この発明は、装着者自
身が発声した音声を、別の人が話しているかのように変
更でき、装着者が喋りやすくなる補聴器を提供すること
を目的とする。
【0005】
【課題を解決するための手段】この発明による第1の補
聴器は、音声を入力するための入力装置、入力装置から
入力された音声の話速を遅くしかつ音程を元の音程と異
なる音程に変換する音声変換手段、および音声変換手段
から得られた音声信号を出力するための出力装置を備え
ていることを特徴とする。
【0006】音声変換手段としては、入力音声の話速を
遅くするとともに音程を低くして送出するもの、入力音
声の話速を遅くするとともに音程を高くして送出するも
の等が用いられる。
【0007】音声変換手段としては、たとえば、入力さ
れた音声信号を、所与のサンプリング周波数を用いて、
ディジタル信号に変換するA/D変換手段、A/D変換
手段によって得られた音声データに対して、所与の圧縮
伸長率で時間軸圧縮伸長処理を行なう時間軸圧縮伸長手
段、および時間軸圧縮伸長手段によって得られた音声デ
ータを、所与のサンプリング周波数を用いて、アナログ
信号に変換するD/A変換手段を備えているものが用い
られる。
【0008】音声変換手段としては、たとえば、入力さ
れた音声信号を、所与のサンプリング周波数を用いて、
ディジタル信号に変換するA/D変換手段、A/D変換
手段によって得られた音声データに基づいて、入力音声
が音声区間か無音区間かを判別する区間判別手段、A/
D変換手段によって得られた音声データのうち音声区間
であると判定された音声データに対して、所与の圧縮伸
長率で時間軸圧縮伸長処理を行なう第1の時間軸圧縮伸
長手段、A/D変換手段によって得られた音声データの
うち無音区間であると判定された音声データに対して、
所与の圧縮伸長率で時間軸圧縮伸長処理を行なう第2の
時間軸圧縮伸長手段、および時間軸圧縮伸長手段によっ
て得られた音声データを、所与のサンプリング周波数を
用いて、アナログ信号に変換するD/A変換手段を備え
ているものが用いられる。
【0009】なお、時間軸圧縮伸長処理には、入力音声
データを時間軸上で圧縮するための処理および入力音声
データを時間軸上で伸長するための処理の他、入力音声
データを削除する処理も含まれているものとする。
【0010】この発明による第2の補聴器は、音声を入
力するための入力装置、入力装置から入力された音声の
話速を遅くするとともに声質を元の声質と異なる声質に
変換する音声変換手段、および音声変換手段から得られ
た音声信号を出力するための出力装置を備えていること
を特徴とする。
【0011】音声変換手段としては、入力装置から入力
された音声の話速を遅くするための話速変換手段と、話
速変換手段によって得られた音声信号に基づいて声質を
変換するための声質変換手段とを備えているもの、ある
いは入力装置から入力された音声信号に基づいて声質を
変換するための声質変換手段と、声質変換手段によって
得られた音声の話速を遅くするための話速変換手段とを
備えているものが用いられる。
【0012】声質変換手段としては、線形フィルタまた
は非線形フィルタにより声質を変換するもの、フォルマ
ント周波数を制御することにより声質を変換するもの、
コードマッピングによる声質変換方法を利用したもの等
が用いられる。
【0013】
【発明の実施の形態】以下、図面を参照して、この発明
の実施の形態について説明する。
【0014】〔I〕第1の実施の形態についての説明
【0015】図1は、補聴器の構成例を示している。
【0016】補聴器は、音声を入力するためのマイク
(入力装置)1、マイク1から入力された音声の話速を
遅くするとともに音程を元の音程(ピッチ)と異なる音
程(ピッチ)に変換する音声変換回路(音声変換手段)
2および音声変換回路2から得られた音声信号を出力す
るためのイアホン3を備えている。図1において、Aは
補聴器の装着者を示し、Bは対話者を示している。
【0017】図2は、音声変換回路2の構成例を示して
いる。
【0018】入力音声信号は、A/D変換部(A/D変
換手段)11に送られ、たとえば12ビットのディジタ
ル信号に変換される。A/D変換部11のサンプリング
周波数fADは、サンプリング周波数調整部19によって
制御される。
【0019】A/D変換部11の出力は、フレームメモ
リ12を介して、区間判別部13に送られる。区間判別
部13は、フレームメモリ12に入力された所要数の音
声データのパワーの平均値、パワーの累積値、振幅平均
値、振幅累積値等に基づいて、入力音声が音声区間であ
るか、無音区間であるかを判定する。
【0020】フレームメモリ12に入力された所要数の
音声データのパワーの平均値に基づいて、入力音声が音
声区間であるか、無音区間であるかを判定する場合につ
いて説明する。この場合には、フレームメモリ12に記
憶された1フレーム分の音声データの平均パワー値Pが
算出される。この平均パワー値Pは、サンプリングされ
た1フレーム内の各音声データの振幅を、i0 ,i1
…iN-1 とすると、次の数式1によって求められる。
【0021】
【数1】
【0022】そして、算出された平均パワー値Pと所定
のしきい値Thとが比較され、平均パワー値Pがしきい
値Th以上である場合には(P≧Th)、現フレームが
音声区間であると判定され、パワー値Pがしきい値Th
未満である場合には(P<Th)、現フレームが無音区
間であると判定される。
【0023】このしきい値は、音声データのレベルに応
じて変化させてもよい。また、定常雑音、環境雑音も無
音区間として取り扱われる。
【0024】なお、入力音声信号のパワースペクトル、
入力信号の周期性の有無等に基づいて、入力音声が音声
区間であるか、無音区間であるかを判定するようにして
もよい。また、音声区間に関しては、その特徴を分析
し、母音または子音(有声子音、無音子音)の判別をも
行なってよい。
【0025】現フレームが音声区間であると判定された
場合には、現フレームの音声データが音声区間の時間軸
圧縮伸長部(第1の時間軸圧縮伸長手段)14に送られ
る。時間軸圧縮伸長部14では、圧縮伸長率調整部20
によって与えられた圧縮伸長率を用いて、入力された音
声データを時間軸圧縮伸長する。
【0026】現フレームが無音区間であると判定された
場合には、現フレームの音声データが無音区間の時間軸
圧縮伸長部15に送られる。時間軸圧縮伸長部(第2の
時間軸圧縮伸長手段)15では、圧縮伸長率調整部20
によって与えられた圧縮伸長率を用いて、入力された音
声データを時間軸圧縮伸長する。なお、無音区間の時間
軸圧縮伸長部15では、入力された音声データを削除す
る機能をも備えている。
【0027】各時間軸圧縮伸長部14、15によって得
られた音声データは、バッファ16に一旦蓄積される。
バッファ16に蓄積された音声データは、逐次読み出さ
れてD/A変換部(D/A変換手段)17に送られ、ア
ナログ信号に変換される。D/A変換部17のサンプリ
ング周波数fDAは、サンプリング周波数調整部19によ
って制御される。バッファ16の読み出し速度は、D/
A変換部17のサンプリング周波数fDAに対応する速度
となるように、サンプリング周波数調整部19によって
制御される。
【0028】サンプリング周波数調整部19および圧縮
伸長率調整部20には、操作部18からの指令信号がそ
れぞれ送られる。この実施の形態においては、音声変換
モードには、次の2つのモードがあり、操作部18によ
ってこれらのモードが切り替えられる。
【0029】〔1〕第1の音声変換モード:入力音声に
対して、話速を遅くし、音程を低くするモード 〔2〕第2の音声変換モード:入力音声に対して、話速
を遅くし、音程を高くするモード
【0030】以下、各音声変換モード毎に、音声変換回
路2の動作を説明する。
【0031】〔1〕第1の音声変換モード(入力音声に
対して、話速を遅くし、音程を低くするモード)時の動
作の説明
【0032】第1の音声変換モード時においては、出力
音声の音程を入力音声の音程に対して低くさせるため
に、A/D変換部11の周波数fADおよびD/A変換部
17の周波数fDAは、次の数式2を満足するような周波
数に設定される。
【0033】
【数2】
【0034】これにより、出力音声の音程は、入力音声
の音程の1/n倍となる。たとえば、A/D変換部11
の周波数fADは、D/A変換部17の周波数fDAの2倍
に設定される。この場合には、n=1/2となり、出力
音声の音程は、入力音声の音程の1/2倍となる。
【0035】出力音声の話速を入力音声の話速に対して
遅くさせるために、音声区間であると判定された音声デ
ータおよび無音区間であると判定された音声データに対
して行なわれる処理について説明する。
【0036】この処理方法には、次のような方法があ
る。
【0037】〔1−1〕第1方法 音声区間であると判別された音声データに対しては、時
間軸圧縮伸長部14は、nより大きな圧縮率α(α>
n)で、入力データを圧縮する。n=1/2である場合
には、圧縮率αはたとえば2/3に設定される。つま
り、3つの波形から2つの波形が生成される。これによ
り、出力音声の話速が入力音声の話速に対して遅くな
る。
【0038】時間軸圧縮伸長部14で用いられる時間軸
圧縮伸長法としては、たとえば、ポインタ移動制御によ
る重複加算法(PICOLA : Pointer Interval Control Ov
erlap and Add)、TDHS(Time Domain Harmonic Scaling)
法等がある。PICOLAを用いて、入力音声データを
圧縮率α=2/3で圧縮する方法について、図3を用い
て簡単に説明する。
【0039】まず、入力音声データからピッチ周期が抽
出される。抽出されたピッチ周期をTpとする。波形A
に対しては、1から0へ直線的に向かう重み(重み関数
K1)がつけられて波形A’が作成される。波形Bに対
しては、0から1へ直線的に向かう重み(重み関数K
2)がつけられて波形B’が作成される。
【0040】そして、これらの波形A’およびB’が加
え合わされて、長さTpの波形A’*B’が作成され
る。上記重みは、波形A’*B’の前後の接続点での連
続性を保つためにつけられている。次に、ポインタが、
圧縮率αに基づいて決定された長さである3Tp分だけ
移動せしめられ、同様な操作が行なわれる。これによ
り、3つの波形A、B、Cから2つの波形A’*B’と
Cとが得られる。このようにして、3ピッチ周期分の信
号が、2ピッチ周期分の信号に圧縮される。
【0041】上記の例では、ピッチ周期単位で圧縮処理
を行なっているが、予め定められた固定フレーム長単位
で圧縮処理を行なってもよい。
【0042】nより大きな圧縮率α(α>n)で、入力
信号を圧縮した場合に、出力音声の話速が入力音声の話
速に対して遅くなる理由について、n=1/2で、α=
2/3の場合を例にとって説明する。
【0043】n=1/2の場合(fAD/fDA=2の場
合)には、単位時間当たりにA/D変換部11によって
変換されるデータ量は、単位時間当たりにD/A変換部
17によって変換されるデータ量の2倍になる。n=1
/2の場合(fAD/fDA=2の場合)において、A/D
変換された音声データをそのままD/A変換して出力す
るとする。この場合、A/D変換されたディジタルデー
タおよびD/A変換されたディジタルデータを時間軸上
で表示すると、図4に示すようになる。
【0044】図4において、t1はA/D変換部11の
サンプリング周期(1/fAD)であり、D/A変換部1
7のサンプリング周期(1/fDA)は2t1となる。図
4から明らかなように、D/A変換データ列(A1〜A
6)は、A/D変換データ列(A1〜A6)が2倍に時
間軸上で伸長されたものとなる。つまり、入力音声信号
の所定時間Tの長さが、時間軸上で2倍に伸長されて、
出力音声信号として出力されることになるので、入力音
声の話速に対して、出力音声の話速が2倍遅くなったこ
とになる。
【0045】そこで、所定時間長さの入力音声信号を、
時間長さを変更することなく、出力音声信号として出力
するためには、言い換えれば、入力音声の話速と出力音
声の話速を同じにするには、A/D変換部11によって
変換された音声データを、1/2倍に圧縮する必要があ
る。つまり、図5に示すように、A/D変換された音声
データを1個ずつ間引くことにより、A/D変換された
音声データを1/2倍に圧縮すれば、入力音声信号の所
定長さMの時間長が変更されることなく、出力音声信号
として出力される。図5の例では、A/D変換データ列
A1、A2、…A7が、1/2倍に圧縮されることによ
り、D/A変換データ列A1、A3、A5、A7に変換
されている。
【0046】入力音声の話速に対して、出力音声の話速
を遅くするには、入力音声信号の所定時間長さを時間軸
上で伸長して、出力音声信号として出力すればよいこと
になる。n=1/2の場合(fAD/fDA=2の場合)に
は、A/D変換されたデータと、D/A変換されたデー
タとの時間長さが同じになる1/2倍の圧縮より、圧縮
の割合(度合い)を小さくすればよい。
【0047】つまり、入力音声の話速に対して、出力音
声の話速を遅くするためには、A/D変換部11によっ
て変換された音声データを1/2より大きな圧縮率αで
圧縮する必要がある。たとえば、A/D変換部11によ
って変換された音声区間の音声データを、圧縮率α=1
/2より大きな圧縮率α=2/3で圧縮した場合には、
出力音声信号の音声区間は、入力音声信号の音声区間を
2/3に圧縮したことになる。したがって、この場合に
は、圧縮率α=1/2で圧縮した場合に比べて、2/3
−1/2=1/6だけ、入力される音声区間が時間軸上
で伸長されて出力されることになる。
【0048】なお、n=1/2の場合には、圧縮率α
を、1/2より大きくかつ1以下の範囲内において、変
化させてもよい。圧縮率α=1とは、時間軸圧縮伸長部
14は、入力音声データに対して何ら処理を行なうこと
なく、入力音声データをそのまま出力することを意味す
る。
【0049】無音区間であると判定された音声データに
対しては、時間軸圧縮伸長部15は、nより小さな圧縮
率α(α<n)で入力データを圧縮するかあるいは入力
データを削除する。
【0050】n=1/2である場合には、無音区間であ
ると判定された音声データは、1/2より小さい圧縮率
αで圧縮(短縮)されるので、圧縮率α=1/2で圧縮
した場合に比べて、無音区間が時間軸上で圧縮されるこ
とになる。音声区間を上述のように、時間軸上で伸長し
たとしても、無音区間を時間軸上で短縮するので、入力
音声と出力音声との時間差を短くすることができる。無
音区間であると判定された音声データを削除した場合に
は、入力音声と出力音声との時間差をさらに短くするこ
とができる。
【0051】〔1−2〕第2方法 音声区間であると判定された音声データに対する処理方
法は、上述した第1方法〔1−1〕と同じである。
【0052】時間軸圧縮伸長部15は、無音区間である
と判定された音声データを、nと同じ圧縮率α(α=
n)で圧縮する。したがって、無音区間であると判定さ
れた音声データについては、入力音声の所定時間長さが
同じ時間長さの出力音声として出力されるので、入力音
声の話速と出力音声の話速とは同じとなる。
【0053】〔1−3〕第3方法 時間軸圧縮伸長部14は、音声区間であると判定された
音声データのうち、定常的な区間のみを、上述した第1
方法〔1−1〕と同様な方法で圧縮する。
【0054】時間軸圧縮伸長部15は、無音区間である
と判定された音声データを、nより大きな圧縮率α(α
>n)で圧縮する。したがって、入力される無音区間が
時間軸上で伸長されて出力される。
【0055】〔1−4〕第4方法 時間軸圧縮伸長部14は、音声区間であると判定された
音声データを、nと同じ圧縮率α(α=n)で、入力デ
ータを圧縮する。したがって、音声区間であると判定さ
れた音声データについては、入力音声の所定時間長さが
同じ時間長さの出力音声として出力されるので、入力音
声の話速と出力音声の話速とは同じとなる。
【0056】時間軸圧縮伸長部15は、無音区間である
と判定された音声データを、上記第3方法〔1−3〕と
同様な方法で圧縮する。したがって、入力される無音区
間が時間軸上で伸長されて出力される。無音区間が時間
軸上で伸長されて出力されることにより、話速がゆっく
りとなったように聞こえる。
【0057】〔2〕第2の音声変換モード(入力音声に
対して、話速を遅くし、音程を高くするモード)時の動
作の説明
【0058】第2の音声変換モード時においては、出力
音声の音程を入力音声の音程に対して高くさせるため
に、A/D変換部11の周波数fADおよびD/A変換部
17の周波数fDAは、次の数式3を満足するような周波
数に設定される。
【0059】
【数3】
【0060】これにより、出力音声の音程は、入力音声
の音程のn倍となる。たとえば、A/D変換部11の周
波数fADは、D/A変換部17の周波数fDAの1/2倍
に設定される。この場合には、n=2となり、出力音声
の音程は、入力音声の音程の2倍となる。
【0061】出力音声の話速を入力音声の話速に対して
遅くさせるために、音声区間であると判定された音声デ
ータおよび無音区間であると判定された音声データに対
して行なわれる処理について説明する。
【0062】この処理方法には、次のような方法があ
る。
【0063】〔2−1〕第1方法 音声区間であると判別された音声データに対しては、時
間軸圧縮伸長部14は、nより大きな伸長率β(β>
n)で、入力信号を伸長する。n=2である場合には、
伸長率βはたとえば3に設定される。たとえば、1つの
波形から3つの波形が生成される。これにより、出力音
声の話速が入力音声の話速に対して遅くなる。
【0064】nより大きな伸長率β(β>n)で、入力
信号を伸長した場合に、出力音声の話速が入力音声の話
速に対して遅くなる理由について、n=2で、β=3の
場合を例にとって説明する。
【0065】n=2の場合(fAD/fDA=1/2の場
合)には、単位時間当たりにA/D変換部11によって
変換されるデータ量は、単位時間当たりにD/A変換部
17によって変換されるデータ量の1/2倍になる。n
=2の場合(fAD/fDA=1/2の場合)において、A
/D変換された音声データをそのままD/A変換して出
力するとする。この場合、A/D変換されたディジタル
データおよびD/A変換されたディジタルデータを時間
軸上で表示すると、図6に示すようになる。ただし、図
6では、時間軸上でD/A変換ディジタルデータ列をシ
フトしている。
【0066】図6において、t1はD/A変換部17の
サンプリング周期(1/fDA)であり、A/D変換部1
1のサンプリング周期(1/fAD)は2t1となる。図
6から明らかなように、D/A変換データ列(A1〜A
6)は、A/D変換データ列(A1〜A6)が1/2倍
に時間軸上で短縮されたものとなる。つまり、入力音声
信号の所定時間2Tの長さが、時間軸上で1/2倍に短
縮されて、出力音声信号として出力されることになるの
で、入力音声の話速に対して、出力音声の話速が2倍速
くなったことになる。
【0067】そこで、所定時間長さの入力音声信号を、
時間長さを変更することなく、出力音声信号として出力
するためには、言い換えれば、入力音声の話速と出力音
声の話速を同じにするには、A/D変換部11によって
変換された音声データを、2倍に伸長する必要がある。
つまり、図7に示すように、A/D変換された音声デー
タを補間することによってA/D変換された音声データ
を2倍に伸長すれば、入力音声信号の所定長さが、時間
長が変更されることなく出力音声信号として出力され
る。図7の例では、A/D変換データ列A1、A2、…
A6が、2倍に伸長されることにより、D/A変換デー
タ列A1、A1’、A2、A2’…A6、A6’に変換
されている。
【0068】入力音声の話速に対して、出力音声の話速
を遅くするには、入力音声信号の所定時間長さを時間軸
上で伸長して、出力音声信号として出力すればよいこと
になる。n=2の場合(fAD/fDA=1/2の場合)に
は、A/D変換されたデータと、D/A変換されたデー
タとの時間長さが同じになる2倍の伸長より、伸長の割
合(度合い)を大きくすればよい。
【0069】つまり、入力音声の話速に対して、出力音
声の話速を遅くするためには、A/D変換部11によっ
て変換された音声データを2より大きな伸長率βで伸長
する必要がある。たとえば、A/D変換部11によって
変換された音声データを、伸長率β=2より大きな伸長
率β=3で伸長した場合には、出力音声信号の音声区間
は、入力音声信号の音声区間を3倍に伸長したことにな
る。したがって、この場合には、伸長率β=2で伸長し
た場合に比べて、3−2=1だけ、入力される音声区間
が時間軸上で伸長されて出力されることになる。
【0070】なお、n=2の場合には、伸長率βを、2
より大きな範囲内において、変化させてもよい。
【0071】無音区間であると判定された音声データに
対しては、時間軸圧縮伸長部15は、nより小さな伸長
率β(β<n)で入力データを伸長するかあるいは入力
データを削除する。
【0072】n=2である場合には、無音区間であると
判定された音声データは、2より小さい伸長率βで伸長
されるので、伸長率β=2で伸長した場合に比べて、無
音区間が時間軸上で圧縮(短縮)されることになる。音
声区間を上述のように、時間軸上で伸長したとしても、
無音区間を時間軸上で短縮するので、入力音声と出力音
声との時間差を短くすることができる。無音区間である
と判定された音声データを削除した場合には、入力音声
と出力音声との時間差をさらに短くすることができる。
【0073】〔2−2〕第2方法 音声区間であると判定された音声データに対する処理方
法は、上述した第1方法〔2−1〕と同じである。
【0074】時間軸圧縮伸長部15は、無音区間である
と判定された音声データを、nと同じ伸長率β(β=
n)で伸長する。したがって、無音区間であると判定さ
れた音声データについては、入力音声の所定時間長さが
同じ時間長さの出力音声として出力されるので、入力音
声の話速と出力音声の話速とは同じとなる。
【0075】〔2−3〕第3方法 時間軸圧縮伸長部14は、音声区間であると判定された
音声データのうち、定常的な区間のみを、上述した第1
方法〔2−1〕と同様な方法で伸長する。
【0076】時間軸圧縮伸長部15は、無音区間である
と判定された音声データを、nより大きな伸長率β(β
>n)で伸長する。したがって、入力される無音区間が
時間軸上で伸長されて出力される。
【0077】〔2−4〕第4方法 時間軸圧縮伸長部14は、音声区間であると判定された
音声データを、nと同じ伸長率β(β=n)で伸長す
る。したがって、音声区間であると判定された音声デー
タについては、入力音声の所定時間長さが同じ時間長さ
の出力音声として出力されるので、入力音声の話速と出
力音声の話速とは同じとなる。
【0078】時間軸圧縮伸長部15は、無音区間である
と判定された音声データを、上記第3方法〔2−3〕と
同様な方法で伸長する。したがって、入力される無音区
間が時間軸上で伸長されて出力される。
【0079】このような補聴器において、第1の音声変
換モードが設定されている場合には、マイク1に入力さ
れた音声、すなわち、対話者Bの発声した音声および装
着者Aが発声した音声は、その話速が遅くかつ音程が低
くされた音声に変換されて、イアホン3から出力され
る。
【0080】第2の音声変換モードが設定されている場
合には、マイク1に入力された音声、すなわち、対話者
Bの発声した音声および装着者Aが発声した音声は、そ
の話速が遅くかつ音程が高くされた音声に変換されて、
イアホン3から出力される。
【0081】いずれの音声変換モードが設定されている
場合においても、装着者Aの発声した音声はその話速お
よび音程が変換されてイアホン3から出力されるため、
装着者Aにとっては、別の人が発声した音声として聞こ
える。このため、装着者Aは、自分の声が遅れて聞こえ
ることによる違和感がなくなり、喋り易くなる。
【0082】図2の音声変換回路の代わりに、図8に示
すような音声変換回路を用いてもよい。図8において、
図2に対応する部分には、同じ符号を付してある。図8
の音声変換回路では、フレームメモリ12の後段にバッ
ファ16が設けられている点が、図2の音声変換回路と
異なっている。
【0083】また、入力される音声の特徴を分析し、こ
の分析結果に基づいて、圧縮伸長率を制御してもよい。
【0084】上記第1の実施の形態では、音声区間と無
音区間とが区間判別部13によって判別され、音声区間
と判別された音声データに対しては時間軸圧縮伸長部1
4によって時間軸圧縮伸長処理が施され、無音区間と判
別された音声データに対しては時間軸圧縮伸長部15に
よって時間軸圧縮伸長処理が施されている。
【0085】しかしながら、音声区間と無音区間とを判
別することなく、フレームメモリ12に格納された音声
データに対して、時間軸圧縮伸長処理を行なうようにし
てもよい。この場合、第1音声変換モードおよび第2音
声変換モードにおいて、話速が遅くなるようにフレーム
メモリ12に格納された音声データに対して時間軸圧縮
伸長処理が行なわれる。
【0086】〔II〕第2の実施の形態の説明
【0087】図9は、補聴器の構成例を示している。
【0088】この補聴器は、音声を入力するためのマイ
ク1(入力装置)、マイク1から入力された音声の話速
を遅くするとともに声質を元の声質と異なる声質に変換
する音声変換手段200および音声変換手段200から
得られた音声信号を出力するためのイアホン(出力装
置)3を備えている。
【0089】音声変換手段200は、マイク1から入力
された音声の話速を遅くするための話速変換部(話速変
換手段)201と、話速変換部201によって得られた
音声信号に基づいて、音声の声質を変換するための声質
変換部202(声質変換手段)とを備えている。図9に
おいて、Aは補聴器の装着者を示し、Bは対話者を示し
ている。
【0090】図10は、話速変換部201の一例を示し
ている。
【0091】入力音声信号は、A/D変換部(A/D変
換手段)31に送られ、たとえば12ビットのディジタ
ル信号に変換される。この例では、音程が変換されない
ように、後述するD/A変換部37のサンプリング周波
数fDAは、A/D変換部31のサンプリング周波数fAD
と等しく設定されている。
【0092】A/D変換部31の出力は、フレームメモ
リ32を介して、区間判別部33に送られる。区間判別
部33は、フレームメモリ32に入力された所要数の音
声データのパワーの平均値、パワーの累積値、振幅平均
値、振幅累積値等に基づいて、入力音声が音声区間であ
るか、無音区間であるかを判定する。
【0093】現フレームが音声区間であると判定された
場合には、現フレームの音声データが音声区間の時間軸
伸長部34に送られる。時間軸伸長部34では、1より
大きな伸長率βで入力された音声データを時間軸伸長す
る。伸長率βとしては、たとえば、3/2に設定され
る。たとえば、音声のピッチ周期が検出され、2ピッチ
周期が3ピッチ周期に伸長される。この場合には、話速
変換部201から出力される音声の速度は、入力された
音声の速度の2/3倍となる。
【0094】現フレームが無音区間であると判定された
場合には、削除部35に送られ、削除される。
【0095】時間軸伸長部34によって得られた音声デ
ータは、バッファ36に一旦蓄積される。バッファ36
に蓄積された音声データは、逐次読み出されてD/A変
換部(D/A変換手段)37に送られ、アナログ信号に
変換される。つまり、話速変換部201からは、話速が
入力音声の話速より遅くかつ音程が入力音声と同じ音程
の音声に対応する音声信号が出力される。
【0096】声質変換部202としては、たとえば、次
のようなものが用いられる。
【0097】(1)線形フィルタまたは非線形フィルタ
により声質を変換するもの。
【0098】(2)フォルマント周波数を制御すること
により声質を変換するもの。たとえば、入力音声からフ
ォルマントパラメータ(フォルマント周波数と、その帯
域幅とを表すパラメータ)とを抽出し、抽出されたフォ
ルマントパラメータを変換係数を用いて変換し、変換さ
れたフォルマントパラメータから音声を合成する。
【0099】(3)コードマッピングによる声質変換方
法を利用したもの。たとえば、仮想的な話者のコードブ
ックを予め作成しておき、入力音声に対応するコードベ
クトルを上記コードブックから選択して出力する。
【0100】このような補聴器においては、マイク1に
入力された音声、すなわち、対話者Bの発声した音声お
よび装着者Aが発声した音声は、その話速が遅くされる
とともに声質が変換されてイアホン3から出力される。
したがって、装着者Aが発声した音声は、装着者Aにと
っては別の人が発声した音声として聞こえる。このた
め、装着者Aは、自分の声が遅れて聞こえることによる
違和感がなくなり、喋り易くなる。
【0101】なお、音声変換回路200としては、マイ
ク1から入力された音声信号に基づいて声質を変換する
ための声質変換部と、声質変換部によって得られた音声
の話速を遅くするための話速変換部とを備えているもの
を用いてもよい。
【0102】
【発明の効果】この発明によれば、装着者自身が発声し
た音声を、別の人が話しているかのように変更できる。
このため、装着者が喋りやすくなる。
【図面の簡単な説明】
【図1】第1の実施の形態である補聴器の構成を示すブ
ロック図である。
【図2】図1の音声変換回路の構成を示すブロック図で
ある。
【図3】PICOLAを用いた時間軸圧縮伸長法を説明
するための模式図である。
【図4】n=1/2の場合(fAD/fDA=2の場合)に
おいて、A/D変換された音声データをそのままD/A
変換して出力した場合の、A/D変換されたディジタル
データおよびD/A変換されたディジタルデータを示す
タイムチャートである。
【図5】n=1/2の場合(fAD/fDA=2の場合)に
おいて、入力音声の話速と出力音声の話速を同じにする
ために、A/D変換された音声データを1個ずつ間引い
た場合の、A/D変換されたディジタルデータおよびD
/A変換されたディジタルデータを示すタイムチャート
である。
【図6】n=2の場合(fAD/fDA=1/2の場合)に
おいて、A/D変換された音声データをそのままD/A
変換して出力した場合の、A/D変換されたディジタル
データおよびD/A変換されたディジタルデータを示す
タイムチャーとである。
【図7】n=2の場合(fAD/fDA=1/2の場合)に
おいて、入力音声の話速と出力音声の話速を同じにする
ために、A/D変換された音声データを補間した場合
の、A/D変換されたディジタルデータおよびD/A変
換されたディジタルデータを示すタイムチャートであ
る。
【図8】音声変換回路の他の例を示すブロック図であ
る。
【図9】第2の実施の形態である補聴器の構成を示すブ
ロック図である。
【図10】図9の話速変換回路の構成を示すブロック図
である。
【符号の説明】
1 マイク 2 音声変換回路 3 イアホン 11 A/D変換部 13 区間判別部 14 音声区間の時間軸圧縮伸長部 15 無音区間の時間軸圧縮伸長部 16 バッファ 17 D/A変換部 18 操作部 19 サンプリング周波数調整部 20 圧縮伸長率調整部 200 音声変換回路 201 話速変換部 202 声質変換部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 音声を入力するための入力装置、 入力装置から入力された音声の話速を遅くするとともに
    音程を元の音程と異なる音程に変換する音声変換手段、
    および音声変換手段から得られた音声信号を出力するた
    めの出力装置、 を備えている補聴器。
  2. 【請求項2】 音声変換手段は、入力音声の話速を遅く
    するとともに音程を低くして送出するものである請求項
    1に記載の補聴器。
  3. 【請求項3】 音声変換手段は、入力音声の話速を遅く
    するとともに音程を高くして送出するものである請求項
    1に記載の補聴器。
  4. 【請求項4】 音声変換手段は、 入力された音声信号を、所与のサンプリング周波数を用
    いて、ディジタル信号に変換するA/D変換手段、 A/D変換手段によって得られた音声データに対して、
    所与の圧縮伸長率で時間軸圧縮伸長処理を行なう時間軸
    圧縮伸長手段、および時間軸圧縮伸長手段によって得ら
    れた音声データを、所与のサンプリング周波数を用い
    て、アナログ信号に変換するD/A変換手段、 を備えている請求項1、2および3のいずれかに記載の
    補聴器。
  5. 【請求項5】 音声変換手段は、 入力された音声信号を、所与のサンプリング周波数を用
    いて、ディジタル信号に変換するA/D変換手段、 A/D変換手段によって得られた音声データに基づい
    て、入力音声が音声区間か無音区間かを判別する区間判
    別手段、 A/D変換手段によって得られた音声データのうち音声
    区間であると判定された音声データに対して、所与の圧
    縮伸長率で時間軸圧縮伸長処理を行なう第1の時間軸圧
    縮伸長手段、 A/D変換手段によって得られた音声データのうち無音
    区間であると判定された音声データに対して、所与の圧
    縮伸長率で時間軸圧縮伸長処理を行なう第2の時間軸圧
    縮伸長手段、および時間軸圧縮伸長手段によって得られ
    た音声データを、所与のサンプリング周波数を用いて、
    アナログ信号に変換するD/A変換手段、 を備えている請求項1、2および3のいずれかに記載の
    補聴器。
  6. 【請求項6】 音声を入力するための入力装置、 入力装置から入力された音声の話速を遅くするとともに
    声質を元の声質と異なる声質に変換する音声変換手段、
    および音声変換手段から得られた音声信号を出力するた
    めの出力装置、 を備えている補聴器。
  7. 【請求項7】 音声変換手段は、入力装置から入力され
    た音声の話速を遅くするための話速変換手段と、話速変
    換手段によって得られた音声信号に基づいて声質を変換
    するための声質変換手段とを備えている請求項6に記載
    の補聴器。
  8. 【請求項8】 音声変換手段は、入力装置から入力され
    た音声信号に基づいて声質を変換するための声質変換手
    段と、声質変換手段によって得られた音声の話速を遅く
    するための話速変換手段とを備えている請求項6に記載
    の補聴器。
  9. 【請求項9】 声質変換手段は、フォルマント周波数を
    制御することにより、声質を変換するものである請求項
    8に記載の補聴器。
  10. 【請求項10】 声質変換手段は、コードブックマッピ
    ングによる声質変換方法により、声質を変換するもので
    ある請求項8に記載の補聴器。
JP9019356A 1997-01-31 1997-01-31 補聴器 Pending JPH10224898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9019356A JPH10224898A (ja) 1997-01-31 1997-01-31 補聴器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9019356A JPH10224898A (ja) 1997-01-31 1997-01-31 補聴器

Publications (1)

Publication Number Publication Date
JPH10224898A true JPH10224898A (ja) 1998-08-21

Family

ID=11997105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9019356A Pending JPH10224898A (ja) 1997-01-31 1997-01-31 補聴器

Country Status (1)

Country Link
JP (1) JPH10224898A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005021524A1 (de) * 2005-05-10 2006-11-16 Siemens Ag Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage
JP2009080298A (ja) * 2007-09-26 2009-04-16 Nippon Hoso Kyokai <Nhk> 補聴装置
WO2022065441A1 (ja) * 2020-09-24 2022-03-31 株式会社Jvcケンウッド 発音フィードバック装置、発音フィードバック方法、及びコンピュータプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005021524A1 (de) * 2005-05-10 2006-11-16 Siemens Ag Verfahren und Vorrichtung zum Eingeben von Zeichen in eine Datenverarbeitungsanlage
JP2009080298A (ja) * 2007-09-26 2009-04-16 Nippon Hoso Kyokai <Nhk> 補聴装置
WO2022065441A1 (ja) * 2020-09-24 2022-03-31 株式会社Jvcケンウッド 発音フィードバック装置、発音フィードバック方法、及びコンピュータプログラム

Similar Documents

Publication Publication Date Title
JP4675692B2 (ja) 話速変換装置
JP4680429B2 (ja) テキスト音声変換装置における高速読上げ制御方法
JP2955247B2 (ja) 話速変換方法およびその装置
JP4523257B2 (ja) 音声データ処理方法、プログラム及び音声信号処理システム
KR20050089874A (ko) 음성 처리에서의 인위적인 대역폭 확장 방법 및 장치
JP5326533B2 (ja) 音声加工装置及び音声加工方法
US20020038209A1 (en) Method of converting the speech rate of a speech signal, use of the method, and a device adapted therefor
JPH0644195B2 (ja) エネルギ正規化および無声フレーム抑制機能を有する音声分析合成システムおよびその方法
JP3439307B2 (ja) 発声速度変換装置
JP3220043B2 (ja) 話速変換方法およびその装置
JP2001034280A (ja) 電子メール受信装置および電子メールシステム
JPH10224898A (ja) 補聴器
US20040267524A1 (en) Psychoacoustic method and system to impose a preferred talking rate through auditory feedback rate adjustment
JP3373933B2 (ja) 話速変換装置
JPH1070790A (ja) 話速検出方法、話速変換方法および話速変換機能付補聴器
JP3432443B2 (ja) 音声速度変換装置、音声速度変換方法および音声速度変換方法を実行するプログラムを記録した記録媒体
JPH09152889A (ja) 話速変換装置
JPH0580796A (ja) 話速制御型補聴方法および装置
JP2004252085A (ja) 音声変換システム及び音声変換プログラム
JPH08254992A (ja) 話速変換装置
JPH07210192A (ja) 出力データ制御方法及び装置
JP3102553B2 (ja) 音声信号処理装置
JPH10224464A (ja) 音声通信装置
JP3351745B2 (ja) 音程調整機能付き補聴器
JPH10214098A (ja) 音声変換玩具