JPH06208395A - ホルマント検出装置及び音声加工装置 - Google Patents

ホルマント検出装置及び音声加工装置

Info

Publication number
JPH06208395A
JPH06208395A JP5270492A JP27049293A JPH06208395A JP H06208395 A JPH06208395 A JP H06208395A JP 5270492 A JP5270492 A JP 5270492A JP 27049293 A JP27049293 A JP 27049293A JP H06208395 A JPH06208395 A JP H06208395A
Authority
JP
Japan
Prior art keywords
gain
formant
frequency band
power spectrum
threshold value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5270492A
Other languages
English (en)
Inventor
Tsuyoshi Megata
強司 目片
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GIJUTSU KENKYU KUMIAI IRYO FUK
GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO
Original Assignee
GIJUTSU KENKYU KUMIAI IRYO FUK
GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GIJUTSU KENKYU KUMIAI IRYO FUK, GIJUTSU KENKYU KUMIAI IRYO FUKUSHI KIKI KENKYUSHO filed Critical GIJUTSU KENKYU KUMIAI IRYO FUK
Priority to JP5270492A priority Critical patent/JPH06208395A/ja
Publication of JPH06208395A publication Critical patent/JPH06208395A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 各周波数帯域の利得を制限して、自然なホル
マント強調音声を得る。 【構成】 周波数分析部10で計算されたパワースペク
トルは、コントラスト強調部20でコントラスト強調さ
れ、閾値判定部220でホルマントであるか否かが判定
される。利得割り当て部230により、ホルマントには
利得1が割り当てられ、それ以外の周波数帯域には1よ
り低い利得が割り当てられる。音声のレベル変動の影響
を除外するため周波数帯域ごとの閾値は閾値決定部42
0により入力音声信号のパワースペクトルに応じて決定
される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力音声信号からホル
マントを検出するホルマント検出装置、及び入力音声信
号に含まれる複数の周波数帯域のうち、重要な周波数帯
域を選択的に強調する音声加工装置に関する。
【0002】
【従来の技術】通常、音声は複数の音韻を含んでおり、
音韻のそれぞれは、音声波のスペクトル分析においてエ
ネルギーの集中するいくつかの周波数帯域によって特徴
づけられる。以下、本明細書では、音声信号のパワース
ペクトルにおいて、パワーが極大となる周波数帯域をホ
ルマントという。人間は、音声を内耳の蝸牛及び聴覚神
経により周波数分析して、その結果得られるホルマント
の分布を音韻を特定するための1つの手がかりとしてい
る。しかし、難聴者は同時に存在する周波数の異なる音
を弁別する能力が低下し(周波数分解能の低下)、その
結果、ホルマントの知覚が困難になる場合が多い。ま
た、健聴者であっても、雑音環境下では、雑音によるマ
スキング効果により周波数分解能が低下する場合があ
る。
【0003】このような周波数分解能が低下した者のた
めに音声の明瞭度を改善する装置として、ホルマント強
調装置が知られている。この装置は、ホルマントとそれ
以外の周波数帯域との間のエネルギー分布のコントラス
トを増大させることにより、音声の明瞭度を改善するも
のである。
【0004】例えば、Acta Otoraryngo
l 1990; Suppl.469:pp.101−
107には、従来のホルマント強調装置が開示されてい
る。
【0005】図7は、このホルマント強調装置の構成を
示す。このホルマント強調装置は、周波数分析部10、
コントラスト強調部20及び逆変換部30を有してい
る。周波数分析部10は、入力音声信号のパワースペク
トルと周波数帯域ごとの位相を計算する。周波数分析部
10は、例えば、FFTによって実現される。コントラ
スト強調部20は、周波数分析部10によって得られる
パワースペクトルにおけるピーク部分と谷部分とのコン
トラスト、すなわち、入力音声信号のパワースペクトル
において、パワーが極大となる周波数帯域とパワーが極
小となる周波数帯域との間のエネルギー差を一層強調す
る。コントラストを強調する方法としては、工学的な側
抑制モデルを用いて、パワースペクトルに、誤差関数を
組み合わせた側抑制関数(数1)を畳み込む方法があ
る。
【0006】
【数1】
【0007】また、その他の方法としては、パワースペ
クトルにおける各周波数成分をそれぞれべき乗する方
法、ケプストラム分析によって得られる平滑化されたパ
ワースペクトルをパワースペクトルに乗じる方法もあ
る。
【0008】逆変換部30は、コントラスト強調部20
によってコントラスト強調されたパワースペクトルと周
波数解析部10によって得られる周波数帯域ごとの位相
とを時間の関数としての音声信号に逆変換する。逆変換
部30は、例えば、逆FFTによって実現される。音声
の自然性を改善するため、周波数分析部10において、
FFTの1フレームより短い時間間隔で周波数分析が行
われ、逆変換部30において、時間的に重複するフレー
ムどうしを重み付け加算するオーバーラップ加算が一般
的に行われる。
【0009】次に、上述したような構成を有する従来の
ホルマント強調装置の動作を説明する。周波数分析部1
0によって、入力音声信号から入力音声信号のパワース
ペクトル及び周波数帯域ごとの位相が算出される。コン
トラスト強調部20によって、ホルマントに相当するパ
ワースペクトルの極大部の周波数成分は更に増大され、
パワースペクトルの極小部の周波数成分は更に抑圧され
る。コントラストの強調されたパワースペクトルと周波
数帯域ごとの位相とは、逆変換部30によって、時系列
の音声信号に変換される。このようにして、周波数分解
能が低下した難聴者にとっても聞き取り易い音声信号を
得ることができる。
【0010】他の従来のホルマント強調装置が、IEE
E Trans. SP vol.39,No.9,p
p.1943−1954に開示されている。
【0011】図8は、このホルマント強調装置の構成を
示す。図8において、図7と同一の部材には同一の番号
を付して説明を省略する。除算器110は、コントラス
ト強調部20によって得られる強調されたパワースペク
トルを、周波数分析部10によって得られるパワースペ
クトルで除算する。これにより、パワースペクトルが正
規化され、周波数帯域ごとの利得が決定される。周波数
特性可変フィルタ120は、除算器110によって決定
された利得に応じて入力音声信号の周波数特性を変化さ
せる。周波数分析部10が数サンプル時間ごとにパワー
スペクトルを計算する場合には、除算器110の出力に
対し補間処理が行われる。これにより、音声の自然性が
改善される。
【0012】上述したような構成を有するホルマント強
調装置によっても、周波数分解能が低下した難聴者にと
っても聞き取り易い音声信号を得ることができる。
【0013】
【発明が解決しようとする課題】しかしながら、図7及
び図8に示されるホルマント強調装置によれば、強調さ
れたパワースペクトルの極大部の周波数成分間のエネル
ギーの大小関係が原音のそれに比べて大きく変化してし
まうため、音声の自然性が損なわれてしまうという問題
点があった。
【0014】また、図7及び図8に示されるホルマント
強調装置によれば、コントラストを強調するために工学
的な側抑制モデルを用いた場合、入力音声信号のスペク
トルに畳み込む側抑制関数に依存して、それの出力信号
レベルが過大になったり過小になったりしてしまうた
め、適性レベルの信号を得ることが困難であるという問
題点があった。
【0015】さらに、図7及び図8に示されるホルマン
ト強調装置において、コントラストを強調する度合を調
整するためには側抑制関数を変更する必要があった。こ
のため、その度合を調整することが困難であった。ホル
マント強調装置において、高いコントラストが得られる
ようにその度合が調整されている場合、そのホルマント
強調装置に背景雑音が重畳された音声が入力されると、
雑音自体のパワースペクトルにおけるピーク部分と谷部
分とのコントラストが強調され、これにより、雑音が変
調される。その結果、音声の自然性が劣化するという問
題点があった。
【0016】
【課題を解決するための手段】本発明のホルマント検出
装置は、入力音声信号のパワースペクトルを計算する周
波数分析手段、該入力音声信号のパワースペクトルにお
ける極大部と極小部との間のコントラストを強調するコ
ントラスト強調手段、及び該コントラスト強調手段によ
って強調されたパワースペクトルにおけるパワーと閾値
とを周波数帯域ごとに比較し、該強調されたパワースペ
クトルにおけるパワーが該閾値を越える場合に、該パワ
ーに対応する周波数帯域をホルマントであると判定する
閾値判定手段を備えている。
【0017】本発明の他のホルマント検出装置は、入力
音声信号のパワースペクトルを計算する周波数分析手
段、該入力音声信号のパワースペクトルにおける極大部
と極小部との間のコントラストを強調するコントラスト
強調手段、該コントラスト強調手段によって強調された
パワースペクトルを該入力音声信号のパワースペクトル
により周波数帯域ごとに除算する除算手段、及び該除算
手段によって得られる除算結果と閾値とを周波数帯域ご
とに比較し、該除算結果が該閾値を越える場合に、該除
算結果に対応する周波数帯域をホルマントであると判定
する閾値判定手段を備えている。
【0018】前記閾値は、特定の話者によって発声され
た5つの母音の第1ホルマント及び第2ホルマントが前
記ホルマント検出装置により検出される確率が50%以
上となるように、予め決定されることが好ましい。
【0019】前記ホルマント検出装置は、前記入力音声
信号のスペクトルに応じて前記閾値を決定する閾値決定
手段をさらに備えていてもよい。
【0020】前記閾値決定手段は、前記閾値が前記入力
音声信号のスペクトルにおける周波数成分の定数倍に等
しくなるように、該閾値を周波数帯域ごとに決定しても
よい。
【0021】前記閾値決定手段は、前記閾値が前記入力
音声信号のスペクトルの全周波数帯域にわたる周波数成
分の平均値の定数倍に等しくなるように、該閾値を決定
してもよい。
【0022】前記ホルマント検出装置は、前記定数を手
動で変更するための定数変更手段をさらに備えてもよ
い。
【0023】前記ホルマント検出装置は、背景雑音レベ
ルを受け取り、該背景雑音レベルに応じて、前記定数を
変更するための定数変更手段をさらに備えていてもよ
い。
【0024】本発明の音声加工装置は、入力音声信号の
パワースペクトルを計算する周波数分析手段、該入力音
声信号のパワースペクトルにおける極大部と極小部との
間のコントラストを強調するコントラスト強調手段、該
コントラスト強調手段によって強調されたパワースペク
トルにおけるパワーと閾値とを周波数帯域ごとに比較
し、該強調されたパワースペクトルにおけるパワーが該
閾値を越える場合に、該パワーに対応する周波数帯域を
ホルマントであると判定する閾値判定手段、該閾値判定
手段によってホルマントであると判定された周波数帯域
に第1の利得を割り当て、それ以外の周波数帯域に第2
の利得を割り当てる利得割り当て手段、及び該利得割り
当て手段によって割り当てられた該第1の利得及び該第
2の利得を周波数帯域ごとに該入力音声信号のパワース
ペクトルに乗算することによって得られるパワースペク
トルを有する音声信号を生成する音声信号生成手段を備
えている。
【0025】本発明の他の音声加工装置は、入力音声信
号のパワースペクトルを計算する周波数分析手段、該入
力音声信号のパワースペクトルにおける極大部と極小部
との間のコントラストを強調するコントラスト強調手
段、該コントラスト強調手段によって強調されたパワー
スペクトルを該入力音声信号のパワースペクトルにより
周波数帯域ごとに除算する除算手段、該除算手段によっ
て得られる除算結果と閾値とを周波数帯域ごとに比較
し、該除算結果が該閾値を越える場合に、該除算結果に
対応する周波数帯域をホルマントであると判定する閾値
判定手段、該閾値判定手段によってホルマントであると
判定された周波数帯域に第1の利得を割り当て、それ以
外の周波数帯域に第2の利得を割り当てる利得割り当て
手段、及び該利得割り当て手段によって割り当てられた
該第1の利得及び該第2の利得を周波数帯域ごとに該入
力音声信号のパワースペクトルに乗算することによって
得られるパワースペクトルを有する音声信号を生成する
音声信号生成手段を備えている。
【0026】前記周波数分析手段は、周波数帯域ごとの
位相をさらに計算し、前記音声信号生成手段は、前記利
得割り当て手段によって割り当てられた前記第1の利得
及び前記第2の利得を周波数帯域ごとに前記入力音声信
号のパワースペクトルに乗算する乗算手段、該乗算手段
によって得られる乗算結果と周波数分析手段によって得
られる周波数帯域ごとの位相とを逆変換して、音声信号
を生成する逆変換手段を備えててもよい。
【0027】前記音声信号生成手段は、前記入力音声信
号を受け取り、前記利得割り当て手段によって割り当て
られた前記第1の利得及び前記第2の利得に応じて、該
入力音声信号の周波数特性を変化させる周波数特性可変
フィルタ手段を備えていてもよい。
【0028】前記利得割り当て手段は、前記第1の利得
及び前記第2の利得のうちの少なくとも1つとなり得る
複数の候補値を有しており、前記音声加工装置は、前記
第1の利得及び前記第2の利得のうち少なくとも1つを
他の候補値に切り換えるための利得切り換え手段をさら
に備えていてもよい。
【0029】前記利得割り当て手段は、前記第1の利得
及び前記第2の利得のうちの少なくとも1つとなり得る
複数の候補値を有しており、前記音声加工装置は、前記
音声入力信号から背景雑音レベルを検出する背景雑音レ
ベル検出手段、及び、前記第1の利得及び前記第2の利
得のうち少なくとも1つを他の候補値に切り換えるため
の利得切り換え手段をさらに備えていてもよい。
【0030】
【実施例】以下、図面を参照して、本発明の実施例を説
明する。
【0031】(第1の実施例)図1は、本発明の第1の
実施例の音声加工装置の構成を示す。図1において、図
7及び図8と同一の部材には同一の番号が付されてい
る。音声加工装置は、入力音声信号からホルマントを検
出するホルマント検出装置210を有している。ホルマ
ント検出装置210は、入力音声信号のパワースペクト
ルと周波数帯域ごとの位相を計算する周波数分析部1
0、周波数分析部10によって得られるパワースペクト
ルにおける極大部と極小部とのコントラストを強調する
コントラスト強調部20、及び、コントラスト強調部2
0によって強調されたパワースペクトルと予め決められ
た閾値とに基づいて、特定の周波数をホルマントである
と判定する閾値判定部220を有している。音声加工装
置は、ホルマント検出装置210によって検出されたホ
ルマントには利得1を割り当て、ホルマント以外の周波
数帯域には利得g(0≦g<1)を割り当てる利得割り
当て部230、利得割り当て部230によって割り当て
られた利得を入力音声信号のスペクトルに乗算する乗算
器240、入力音声信号の利得調整されたスペクトルと
周波数帯域ごとの位相とを逆変換して、時系列の音声信
号を生成する逆変換部30をさらに有している。
【0032】次に、音声加工装置の動作を説明する。周
波数分析部10は、入力音声信号を受け取り、入力音声
信号からパワースペクトルと周波数帯域ごとの位相とを
計算する。コントラスト強調部20は、周波数分析部1
0によって得られたパワースペクトルのコントラストを
強調する。すなわち、入力音声信号のパワースペクトル
において極大となるパワーを更に増大し、そのパワース
ペクトルにおいて極小となるパワーを更に抑圧する。閾
値判定部220には、パワースペクトルにおいて極大と
なるパワーのみが閾値を越えるように、閾値が予め設定
されている。かかる閾値の決定方法については後述す
る。閾値判定部22は、強調されたパワースペクトルの
パワーと予め決められた閾値とを周波数帯域ごとに比較
し、その強調されたパワースペクトルにおけるパワーが
予め決められた閾値を越える場合に、そのパワーに対応
する周波数帯域をホルマントであると判定する。より詳
細にいうと、周波数帯域をf、強調されたパワースペク
トルをE(f)、予め決められた閾値をTと表すと仮定
するとき、閾値判定部22は、E(f)>Tを満たす周
波数帯域fをホルマントであると判定する。利得割り当
て部230は、ホルマントであると判定された周波数帯
域に利得1を割り当て、それ以外の周波数帯域に1より
小さい利得gを割り当てる。より詳細にいうと、利得割
り当て部230は、E(f)>Tを満たす周波数帯域f
には利得1を割り当て、E(f)≦Tを満たす周波数帯
域fには利得g(0≦g<1)を割り当てる。利得割り
当て部230によって各周波数帯域に割り当てられた利
得は、乗算器240によって当該周波数帯域の入力音声
信号のスペクトルに乗算される。逆変換部30は、利得
調整されたスペクトルと周波数帯域ごとの位相とを受け
取り、これらを音声信号に変換する。
【0033】図2(a)から(d)は、図1に示される
点(a)から(d)におけるパワースペクトルの具体例
をそれぞれ示したものである。この例では、図2(b)
に示されるパワースペクトルにおいて、閾値を越える3
つの極大部に対応する周波数帯域が、それぞれホルマン
トA、B、及びCであると判定される。次に、図2
(c)に示すように、ホルマントA、B、及びCに応じ
て利得が周波数帯域ごとに割り当てられる。すなわち、
ホルマントA、B、及びCには利得1が割り当てられ、
それ以外の周波数帯域には利得gが割り当てられる。そ
の利得を図2(a)に示される入力音声信号のパワース
ペクトルに周波数帯域ごとに乗算することにより、図2
(d)に示されるパワースペクトルが得られる。図2
(d)に示されるパワースペクトルが逆変換部30に供
給される。
【0034】次に、閾値判定部220に予め設定される
閾値について説明する。この閾値は、以下の手順(1)
〜(5)に従って求められる。
【0035】(1)特定話者は、日本語の5つの母音
(「あ」、「い」、「う」、「え」、「お」)を一定の
間隔で発音する。
【0036】(2)従来のホルマント抽出法を用いて、
上記5つの母音のそれぞれ対して基準となる第1ホルマ
ント及び第2ホルマントを求めておく。ここで、第1ホ
ルマントとは、最も周波数の低いホルマントをいい、第
2ホルマントとは、第1ホルマントの次に周波数の低い
ホルマントをいう。従来のホルマント抽出法としては、
例えば、ピークピッキング法又はA−b−S法を使用す
ることができる。
【0037】(3)上記5つの母音のそれぞれを音声信
号に変換して、上述のホルマント検出装置210に入力
する。
【0038】(4)ホルマント検出装置210により、
入力音声信号のパワースペクトルにおいて、上記(2)
で求められた基準となる第1ホルマントと第2ホルマン
トとの両方が検出される確率が50%以上となるよう
に、閾値判定部220の閾値を調整する。より詳細にい
うと、ホルマント検出装置210の閾値判定部220に
最初に設定される値(初期値)は比較的高い値とされ
る。その値を低くするにつれて、第1ホルマントと第2
ホルマントとの両方が検出される確率は大きくなる。そ
の値を少しずつ低くしていき、第1ホルマントと第2ホ
ルマントとの両方が検出される確率が50%以上となっ
た場合に、その値を閾値として閾値判定部220に設定
する。
【0039】(5)上記(4)の条件を満たすように調
整された閾値を閾値判定部220の閾値として決定す
る。
【0040】また、ホルマント検出装置210が音声加
工装置に組み込まれた後に、閾値判定部220における
閾値を調整する場合には、音声加工装置による処理前の
音声に比べて、音声加工装置による処理後の音声につい
て単音節明瞭度又は了解度が向上するように、閾値を調
整すればよい。
【0041】さらに、さまざまな環境下で適切な加工音
声を得るために、音声加工装置は、上述のようにして調
整された閾値を変更する閾値変更部を有していてもよ
い。例えば、閾値変更部は、閾値判定部220に設定さ
れている閾値を手動で変更するためのスイッチを含んで
おり、操作者がそのスイッチを操作することにより、閾
値判定部220に設定された閾値が他の値に変更され
る。具体的には、上述の閾値が無雑音環境下で調整され
た値であると仮定すると、雑音環境下ではその閾値をよ
り大きな閾値に変更することが好ましい。これにより、
雑音成分が閾値を越える確率が低下し、雑音成分を誤っ
て強調することが少なくなるからである。
【0042】本発明の第1の実施例の音声加工装置によ
れば、コントラスト強調部20の出力である強調された
パワースペクトルは、逆変換部30には供給されない。
その代わりに、検出されたホルマントに応じて、入力音
声信号のパワースペクトルに所定の利得を乗じることに
よって得られるパワースペクトルが、逆変換部30に供
給される。この利得調整されたパワースペクトルにおい
て極大となるパワーの大きさは、入力音声信号のパワー
スペクトルにおいて極大となるパワーの大きさと同じで
あり、利得調整されたパワースペクトルにおいて極小と
なるパワーの大きさは、入力音声信号のパワースペクト
ルにおいて極小となるパワーの大きさのg倍に抑圧され
る。従って、逆変換部30に供給されるパワースペクト
ルのホルマント間のエネルギーの大小関係は、入力音声
信号のそれに実質的に等しい。その結果、音声の自然性
を損なうことなく、ホルマントとそれ以外の周波数帯域
とのエネルギーのコントラストが増大した加工音声が得
られる。さらに、周波数帯域ごとの利得は最大1である
ため、コントラスト強調に工学的な側抑制モデルを適用
した場合でも、側抑制関数のパラメータに応じて出力信
号レベルが過大になるということはない。
【0043】(第2の実施例)図3は、本発明の第2の
実施例の音声加工装置の構成を示す。図3において、図
1及び図8と同一の部材には同一の番号が付されてい
る。音声加工装置は、入力音声信号からホルマントを検
出するホルマント検出装置210を有している。
【0044】音声加工装置は、ホルマント検出装置21
0によって検出されたホルマントには利得1を割り当
て、ホルマント以外の周波数帯域には利得g(0≦g<
1)を割り当てる利得割り当て部230、与えられた利
得に応じて入力音声信号の周波数特性を変化させる周波
数特性可変フィルタ120をさらに有している。
【0045】次に、音声加工装置の動作を説明する。ホ
ルマント検出装置210は、入力音声信号からホルマン
トを検出する。ホルマント検出装置210の構成は、第
1の実施例と同一であるから、詳しい動作の説明は省略
する。利得割り当て部230は、ホルマント検出装置2
10の出力に応じて周波数帯域ごとに利得を決定し、決
定された利得を周波数特性可変フィルタ120に供給す
る。その利得は、ホルマントに対しては1であり、それ
以外の周波数帯域に対してはgである。従って、周波数
特性可変フィルタ120によって得られる音声信号のパ
ワースペクトルにおいて極大となるパワーの大きさは、
入力音声信号のスペクトルにおいて極大となるパワーの
大きさと同じであり、そのパワースペクトルにおいて極
小となるパワーの大きさは、入力音声信号のパワースペ
クトルにおいて極小となるパワーの大きさのg倍に抑圧
される。
【0046】このように、本発明の第2の実施例の音声
加工装置によれば、周波数特性可変フィルタ120によ
って得られる音声信号のパワースペクトルのホルマント
間のエネルギーの大小関係は、入力音声信号のそれに実
質的に等しい。その結果、音声の自然性を損なうことな
く、ホルマントとそれ以外の周波数帯域とのエネルギー
のコントラストが増大した加工音声が得られる。さら
に、周波数帯域ごとの利得は最大1であるため、コント
ラスト強調に工学的な側抑制モデルを適用した場合で
も、側抑制関数のパラメータに応じて出力信号レベルが
過大になるということはない。また、図8に示される従
来の装置では必要とされた除算器110や、図1に示さ
れる音声加工装置では必要とされた乗算器240が不要
となるため、計算ステップが大幅に削減される。その結
果、計算時間を大幅に短縮することが可能になる。
【0047】(第3の実施例)図4は、本発明の第3の
実施例の音声加工装置の構成を示す。図4において、図
1及び図8と同一の部材には同一の番号が付されてい
る。
【0048】音声加工装置は、入力音声信号からホルマ
ントを検出するホルマント検出装置310を有してい
る。ホルマント検出装置310は、入力音声信号のパワ
ースペクトルと周波数帯域ごとの位相を計算する周波数
分析部10、入力音声信号のパワースペクトルにおける
極大部と極小部との間のコントラストを強調するコント
ラスト強調部20、コントラスト強調部20によって強
調されたパワースペクトルを入力音声信号のパワースペ
クトルにより周波数帯域ごとに除算する除算器110、
及び除算器110によって得られる除算結果と閾値とに
基づいて、特定の周波数をホルマントであると判定する
閾値判定部220を有している。音声加工装置は、ホル
マント検出装置310によって検出されたホルマントに
は利得1を割り当て、ホルマント以外の周波数帯域には
利得g(0≦g<1)を割り当てる利得割り当て部23
0、与えられた利得に応じて入力音声信号の周波数特性
を変化させる周波数特性可変フィルタ120をさらに有
している。
【0049】次に、音声加工装置の動作を説明する。ホ
ルマント検出装置310は、入力音声信号からホルマン
トを検出する。ホルマント検出装置310において、コ
ントラスト強調部20によって強調されたパワースペク
トルは、入力音声信号のパワースペクトルにより周波数
帯域ごとに除算される。その結果、入力音声信号の正規
化されたパワースペクトルが得られ、この正規化された
パワースペクトルが閾値判定部220に供給される。閾
値判定部220では、この正規化されたパワースペクト
ルと所定の閾値とが比較される。正規化されたパワース
ペクトルは、入力音声信号の平均レベルには依存しない
ので、入力音声信号の平均レベルに依存することなく、
所定の閾値を決定することが可能となる。従って、入力
音声信号の長時間平均レベルが大きく変動する場合で
も、所定の閾値を変更する必要がない。閾値判定部22
0は、正規化されたパワースペクトルにおけるパワーが
所定の閾値を越える場合に、そのパワーに対応する周波
数帯域をホルマントであると判定する。ホルマント検出
装置310の出力は、利得割り当て部230に供給され
る。利得割り当て部230及び周波数特性可変フィルタ
120は、第2の実施例と同一であるので、詳しい動作
の説明を省略する。
【0050】当業者であれば、第1の実施例におけるホ
ルマント検出装置210は、第3の実施例におけるホル
マント検出装置310によって置き換えられることがで
きるということを理解するだろう。
【0051】本発明の第3の実施例の音声加工装置によ
れば、第2の実施例の音声加工装置と同様にして、周波
数特性可変フィルタ120によって得られる音声信号の
パワースペクトルのホルマント間のエネルギーの大小関
係は、入力音声信号のそれに実質的に等しい。その結
果、音声の自然性を損なうことなく、ホルマントとそれ
以外の周波数帯域とのエネルギーのコントラストが増大
した加工音声が得られる。さらに、周波数帯域ごとの利
得は最大1であるため、コントラスト強調に工学的な側
抑制モデルを適用した場合でも、側抑制関数のパラメー
タに応じて出力信号レベルが過大になるということはな
い。さらに、入力音声信号の平均レベルに応じて閾値判
定部220の閾値を変更する必要がないので、入力音声
レベルの変動に追随することができる。
【0052】(第4の実施例)図5は、本発明の第4の
実施例の音声加工装置の構成を示す。図5において、図
1及び図8と同一の部材には同一の番号が付されてい
る。
【0053】音声加工装置は、入力音声信号からホルマ
ントを検出するホルマント検出装置410を有してい
る。ホルマント検出装置410は、上述したホルマント
検出装置210に含まれる周波数分析部10、コントラ
スト強調部20、及び閾値判定部220を有している。
ホルマント検出装置410は、入力音声信号のスペクト
ルに応じて、閾値判定部220の閾値を決定する閾値決
定部420をさらにを有している。閾値決定部420
は、入力音声信号のパワースペクトルの各周波数成分を
定数倍し、これを閾値判定部220の各周波数帯域ごと
の閾値として設定する。
【0054】閾値決定部420による閾値の設定につい
てさらに詳しく説明する。周波数帯域をf、入力音声信
号のパワースペクトルにおける周波数帯域fでのパワー
をP(f)、周波数帯域fでの閾値をT(f)と表すと
仮定する。この場合、閾値決定部420は、各周波数帯
域fに対してT(f)=αP(f)を満たすように閾値
T(f)を決定し、閾値T(f)を閾値判定部220に
設定する。ここで、αは所定の定数である。αの求め方
については後述する。コントラスト強調部20によって
強調されたパワースペクトルをE(f)と表すとき、閾
値判定部220は、E(f)>T(f)(=αP
(f))を満たす周波数帯域fをホルマントであると判
定する。
【0055】このように、閾値判定部220の閾値T
(f)は、常に入力音声信号のパワースペクトルにおけ
る各周波数成分に比例する。従って、入力音声信号の長
時間平均レベルが大きく変動する場合でも、その変動に
追従して閾値T(f)が変化する。これにより、第3の
実施例の音声加工装置と同様にして、入力音声信号の長
時間平均レベルに依存することなく、ホルマントを検出
することが可能となる。
【0056】あるいは、入力音声信号のスペクトルの全
周波数帯域にわたるパワーの平均値をPAと表すとき、
閾値決定部420は、各周波数帯域fに対してT(f)
=αPAを満たすように閾値T(f)を決定し、閾値T
(f)を閾値判定部230に設定してもよい。閾値判定
部220は、E(f)>T(f)(=αPA)を満たす
周波数帯域fをホルマントであると判定する。この場合
にも、上述した理由と同様の理由で、入力音声信号の長
時間平均レベルに依存することなく、ホルマントを検出
することが可能となる。
【0057】さらに、入力音声信号に応じて閾値判定部
220の閾値T(f)を決定する方法は上述の方法には
限られない。入力音声信号の平均エネルギー又はパワー
スペクトルの増減に応じて閾値を増減させる方法であれ
ば、上述の方法と異なるいかなる方法をも採用すること
ができる。
【0058】音声加工装置は、利得割り当て部230及
び周波数特性可変フィルタ120に加えて、利得切換部
430をさらに有している。利得切換部430は、ホル
マント以外の周波数帯域に割り当てられる利得gを数種
類保持しておき、外部のスイッチ等の動作により利得g
を切り換える。このように、パワースペクトルの極小部
に割り当てられる利得を可変とすることにより、ホルマ
ントを強調する度合を容易に変更することができる。利
得割り当て部230及び周波数特性可変フィルタ120
は、第2の実施例と同一であるので、詳しい動作の説明
を省略する。
【0059】当業者であれば、第1の実施例におけるホ
ルマント検出装置210及び第3の実施例におけるホル
マント検出装置310のそれぞれは、ホルマント検出装
置410によって置き換えられることができるというこ
とを理解するだろう。
【0060】次に、閾値決定部420に設定される定数
αについて説明する。定数αは、以下の手順(1)〜
(5)に従って求められる。
【0061】(1)特定話者は、日本語の5つの母音
(「あ」、「い」、「う」、「え」、「お」)を一定の
間隔で発音する。
【0062】(2)従来のホルマント抽出法を用いて、
上記5つの母音のそれぞれ対して基準となる第1ホルマ
ント及び第2ホルマントを求めておく。ここで、第1ホ
ルマントとは、最も周波数の低いホルマントをいい、第
2ホルマントとは、第1ホルマントの次に周波数の低い
ホルマントをいう。従来のホルマント抽出法としては、
例えば、ピークピッキング法又はA−b−S法を使用す
ることができる。
【0063】(3)上記5つの母音のそれぞれを音声信
号に変換して、上述のホルマント検出装置410に入力
する。
【0064】(4)ホルマント検出装置410により、
入力音声信号のパワースペクトルにいて、上記(2)で
求められた基準となる第1ホルマントと第2ホルマント
との両方が検出される確率が50%以上となるように、
定数αの値を調整する。より詳細にいうと、閾値決定部
420に最初に設定される定数α’の値(初期値)は比
較的高い値とされる。定数α’の値を低くするにつれ
て、第1ホルマントと第2ホルマントとの両方が検出さ
れる確率は大きくなる。定数α’の値を少しずつ低くし
ていき、基準となる第1ホルマントと第2ホルマントと
の両方が検出される確率が50%以上となった場合に、
その定数α’の値を定数αの値として閾値判定部220
に設定する。
【0065】(5)上記(4)の条件を満たすように調
整された定数αを閾値決定部420に設定する。
【0066】また、ホルマント検出装置410が音声加
工装置に組み込まれた後に、閾値決定部420における
定数αを調整する場合には、音声加工装置による処理前
の音声に比べて、音声加工装置による処理後の音声につ
いて単音節明瞭度又は了解度が向上するように、定数α
を調整すればよい。
【0067】さらに、さまざまな環境下で適切な加工音
声を得るために、音声加工装置は、上述のようにして調
整された定数αを変更する定数変更部440を有してい
てもよい。例えば、定数変更部440は、定数αを手動
で変更するためのスイッチを含んでおり、操作者がその
スイッチを操作することにより、閾値決定部420に設
定された定数αが他の値に変更される。具体的には、上
述の定数αが無雑音環境下で調整された値であると仮定
すると、雑音環境下ではその定数αをより大きな定数β
に変更することが好ましい。これにより、雑音成分が閾
値を越える確率が低下し、雑音成分を誤って強調するこ
とが少なくなるからである。
【0068】本発明の第4の実施例の音声加工装置によ
れば、第3の実施例の音声加工装置と同様にして、周波
数特性可変フィルタ120によって得られる音声信号の
パワースペクトルのホルマント間のエネルギーの大小関
係は、入力音声信号のそれに実質的に等しい。その結
果、音声の自然性を損なうことなく、ホルマントとそれ
以外の周波数帯域とのエネルギーのコントラストが増大
した加工音声が得られる。さらに、入力音声信号のパワ
ースペクトル応じて閾値を変化させることにより、入力
音声レベルの変動に追随することができる。
【0069】さらに、利得切換部430を設けたことに
より、使用者の周波数分解能の劣化の度合に応じてホル
マントを強調する度合を変更することができる。これに
より、個人差を考慮して、個人ごとに適切なホルマント
強調の度合を得ることが容易になる。また、背景雑音に
応じてホルマントを強調する度合を変更することができ
る。これにより、雑音の変調による不自然な残留雑音の
発生を低減できる。さらに、図4に示される音声加工装
置では必要とされた除算器110が不要となるため、計
算ステップが大幅に削減される。その結果、計算時間を
大幅に短縮することができる。
【0070】(第5の実施例)図6は、本発明の第5の
実施例の音声加工装置の構成を示す。図6において、図
1、図5及び図8と同一の部材には同一の番号が付され
ている。
【0071】音声加工装置は、入力音声信号からホルマ
ントを検出するホルマント検出装置410を有してい
る。音声加工装置は、上述の利得切換部430、利得割
り当て部230、及び周波数特性可変フィルタ120に
加えて、背景雑音レベル推定部520をさらに有してい
る。
【0072】次に、音声加工装置の動作を説明する。ホ
ルマント検出装置410は、入力音声信号からホルマン
トを検出する。ホルマント検出装置410の構成は、第
4の実施例と同一であるから、詳しい動作の説明は省略
する。
【0073】背景雑音レベル推定部520は、音声の存
在しない背景雑音のみの区間を検出し、その区間におけ
る背景雑音のエネルギーを推定する。背景雑音のエネル
ギーを推定する方法としては、最尤雑音推定法に基づく
雑音区間推定を用いる方法がある。あるいは、もっと簡
易な方法として、数10秒の入力音声信号を複数の区間
に分割し、それぞれの区間のエネルギーの短時間平均値
を計算し、最も小さい短時間平均値を有する区間のエネ
ルギーを背景雑音のエネルギーと推定する方法も有効で
ある。
【0074】利得切換部430は、ホルマント以外の周
波数帯域に割り当てられる利得gを数種類保持してお
き、背景雑音レベル推定部520によって推定される雑
音区間のエネルギーの大きさに応じて利得gを切り換え
る。すなわち、利得切換部430は、推定される雑音区
間のエネルギーが高い場合には、利得gを相対的に低い
値に設定して、パワースペクトルの極大部と極小部との
間のエネルギーの差が大きくなるようにする。逆に、推
定される雑音区間のエネルギーが低い場合には、利得切
換部430は、利得gを相対的に高い値に設定して、雑
音自体が変調されて加工した音声の自然性が損なわれる
ことを防止する。このように、雑音環境下では、ホルマ
ントに割り当てられる利得とそれ以外の周波数帯域に割
り当てられる利得との差を無雑音のときより小さくす
る。これにより、耳障りな残留雑音を防止することがで
きる。利得切換部430によって設定された利得gの値
は、利得割り当て部230に供給される。利得割り当て
部230及び周波数特性可変フィルタ120は、第2の
実施例と同一であるので、詳しい動作の説明を省略す
る。
【0075】さらに、さまざまな雑音環境下で適切な加
工音声を得るために、ホルマント検出装置410が定数
変更部440を含んでいる場合には、背景雑音レベル推
定部520によって推定される背景雑音レベルを定数変
更部440にそれの入力として供給してもよい。ここ
で、定数αは、第4の実施例における方法と同様の方法
により無雑音環境下で調整された値であると仮定する。
この場合、定数変更部440は、背景雑音レベルに応じ
て、閾値決定部420に設定された定数αを変更する。
具体的には、定数変更部440は、背景雑音レベルが大
きくなるにつれて、定数αをより大きな定数βに変更す
る。これにより、雑音成分が閾値を越える確率が低下
し、雑音成分を誤って強調することが少なくなるからで
ある。
【0076】このように、本発明の第5の実施例によれ
ば、推定された雑音区間のエネルギーの大きさに応じ
て、パワースペクトルの極小部に割り当てる利得を変化
させることにより、環境雑音のレベルが変動しても雑音
の歪による聞きごこちの劣化が生じにくい音声加工装置
を得ることができる。
【0077】上述されたすべての実施例の音声加工装置
においては、利得割り当て部230によってホルマント
に割り当てられる利得は1である。しかし、この利得は
必ずしも1である必要はなく、ホルマント以外の周波数
帯域に割り当てられる利得より大きければよい。基本的
には、音声加工装置により、単音節明瞭度または了解度
が改善されるように利得の割り当てが決定される。ま
た、ホルマントに割り当てられる利得は、周波数帯域ご
とに異なっていてもよいし、同じであってもよい。
【0078】また、第4の実施例の音声加工装置におい
て、閾値決定部420と利得切換部430とは独立に機
能する。従って、閾値決定部420と利得切換部430
とは、必ずしも一緒に導入される必要はない。さらに、
利得切換部430において、ホルマント以外の周波数帯
域に割り当てる利得gを切り換えたが、ホルマントに割
り当てる利得を切り換えるようにしてもよく、両方の利
得を切り換えてもよい。
【0079】
【発明の効果】本発明によれば、同時に存在する複数の
ホルマント間のエネルギーの大小関係が原音のそれから
変化しないので、音声の自然性を保持しつつ、ホルマン
トとそれ以外の周波数帯域のエネルギーのコントラスト
が増大した加工音声を生成する音声加工装置を得ること
ができる。
【0080】また、本発明によれば、コントラストを強
調するために工学的な側抑制モデルを用いた場合でも、
側抑制関数のパラメータに応じて出力信号レベルが過大
になったり、過小になったりしない音声加工装置を得る
ことができる。
【0081】また、本発明によれば、コントラストを強
調する度合の調整を容易な音声加工装置、特に、雑音等
に応じてその度合を変化させることにより、雑音環境下
でも音声の自然性を損なわない音声加工装置を得ること
ができる。
【0082】さらに、本発明によれば、除算器を必要と
しない音声加工装置を得ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例の音声加工装置の構成を
示す図
【図2】図1の点(a)、(b)、(c)、及び(d)
におけるパワースペクトルの具体例を示す図
【図3】本発明の第2の実施例の音声加工装置の構成を
示す図
【図4】本発明の第3の実施例の音声加工装置の構成を
示す図
【図5】本発明の第4の実施例の音声加工装置の構成を
示す図
【図6】本発明の第5の実施例の音声加工装置の構成を
示す図
【図7】従来のホルマント強調装置の構成を示す図
【図8】従来のホルマント強調装置の構成を示す図
【符号の説明】
10 周波数分析部 20 コントラスト強調部 30 逆変換部 110 除算器 120 周波数特性可変フィルタ 210、310、410 ホルマント検出装置 220 閾値判定部 230 利得割り当て部 240 乗算器 420 閾値決定部 430 利得切換部 520 背景雑音レベル推定部

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】入力音声信号のパワースペクトルを計算す
    る周波数分析手段、該入力音声信号のパワースペクトル
    における極大部と極小部との間のコントラストを強調す
    るコントラスト強調手段、及び該コントラスト強調手段
    によって強調されたパワースペクトルにおけるパワーと
    閾値とを周波数帯域ごとに比較し、該強調されたパワー
    スペクトルにおけるパワーが該閾値を越える場合に、該
    パワーに対応する周波数帯域をホルマントであると判定
    する閾値判定手段を備えたホルマント検出装置。
  2. 【請求項2】入力音声信号のパワースペクトルを計算す
    る周波数分析手段、該入力音声信号のパワースペクトル
    における極大部と極小部との間のコントラストを強調す
    るコントラスト強調手段、該コントラスト強調手段によ
    って強調されたパワースペクトルを該入力音声信号のパ
    ワースペクトルにより周波数帯域ごとに除算する除算手
    段、及び該除算手段によって得られる除算結果と閾値と
    を周波数帯域ごとに比較し、該除算結果が該閾値を越え
    る場合に、該除算結果に対応する周波数帯域をホルマン
    トであると判定する閾値判定手段を備えたホルマント検
    出装置。
  3. 【請求項3】前記閾値は、特定の話者によって発声され
    た5つの母音の第1ホルマント及び第2ホルマントが前
    記ホルマント検出装置により検出される確率が50%以
    上となるように、予め決定される、請求項1又は請求項
    2に記載のホルマント検出装置。
  4. 【請求項4】前記ホルマント検出装置は、前記入力音声
    信号のスペクトルに応じて前記閾値を決定する閾値決定
    手段をさらに備えている、請求項1又は請求項2に記載
    のホルマント検出装置。
  5. 【請求項5】前記閾値決定手段は、前記閾値が前記入力
    音声信号のスペクトルにおける周波数成分の定数倍に等
    しくなるように、該閾値を周波数帯域ごとに決定する、
    請求項4に記載のホルマント検出装置。
  6. 【請求項6】前記閾値決定手段は、前記閾値が前記入力
    音声信号のスペクトルの全周波数帯域にわたる周波数成
    分の平均値の定数倍に等しくなるように、該閾値を決定
    する、請求項4に記載のホルマント検出装置。
  7. 【請求項7】前記ホルマント検出装置は、前記定数を手
    動で変更するための定数変更手段をさらに備えている、
    請求項5又は請求項6に記載のホルマント検出装置。
  8. 【請求項8】前記ホルマント検出装置は、背景雑音レベ
    ルを受け取り、該背景雑音レベルに応じて、前記定数を
    変更するための定数変更手段をさらに備えている、請求
    項5又は請求項6に記載のホルマント検出装置。
  9. 【請求項9】入力音声信号のパワースペクトルを計算す
    る周波数分析手段、該入力音声信号のパワースペクトル
    における極大部と極小部との間のコントラストを強調す
    るコントラスト強調手段、該コントラスト強調手段によ
    って強調されたパワースペクトルにおけるパワーと閾値
    とを周波数帯域ごとに比較し、該強調されたパワースペ
    クトルにおけるパワーが該閾値を越える場合に、該パワ
    ーに対応する周波数帯域をホルマントであると判定する
    閾値判定手段、該閾値判定手段によってホルマントであ
    ると判定された周波数帯域に第1の利得を割り当て、そ
    れ以外の周波数帯域に第2の利得を割り当てる利得割り
    当て手段、及び該利得割り当て手段によって割り当てら
    れた該第1の利得及び該第2の利得を周波数帯域ごとに
    該入力音声信号のパワースペクトルに乗算することによ
    って得られるパワースペクトルを有する音声信号を生成
    する音声信号生成手段を備えた音声加工装置。
  10. 【請求項10】入力音声信号のパワースペクトルを計算
    する周波数分析手段、該入力音声信号のパワースペクト
    ルにおける極大部と極小部との間のコントラストを強調
    するコントラスト強調手段、該コントラスト強調手段に
    よって強調されたパワースペクトルを該入力音声信号の
    パワースペクトルにより周波数帯域ごとに除算する除算
    手段、該除算手段によって得られる除算結果と閾値とを
    周波数帯域ごとに比較し、該除算結果が該閾値を越える
    場合に、該除算結果に対応する周波数帯域をホルマント
    であると判定する閾値判定手段、該閾値判定手段によっ
    てホルマントであると判定された周波数帯域に第1の利
    得を割り当て、それ以外の周波数帯域に第2の利得を割
    り当てる利得割り当て手段、及び該利得割り当て手段に
    よって割り当てられた該第1の利得及び該第2の利得を
    周波数帯域ごとに該入力音声信号のパワースペクトルに
    乗算することによって得られるパワースペクトルを有す
    る音声信号を生成する音声信号生成手段を備えた音声加
    工装置。
  11. 【請求項11】前記周波数分析手段は、周波数帯域ごと
    の位相をさらに計算し、前記音声信号生成手段は、前記
    利得割り当て手段によって割り当てられた前記第1の利
    得及び前記第2の利得を周波数帯域ごとに前記入力音声
    信号のパワースペクトルに乗算する乗算手段、該乗算手
    段によって得られる乗算結果と周波数分析手段によって
    得られる周波数帯域ごとの位相とを逆変換して、音声信
    号を生成する逆変換手段を備えている、請求項9又は請
    求項10に記載の音声加工装置。
  12. 【請求項12】前記音声信号生成手段は、前記入力音声
    信号を受け取り、前記利得割り当て手段によって割り当
    てられた前記第1の利得及び前記第2の利得に応じて、
    該入力音声信号の周波数特性を変化させる周波数特性可
    変フィルタ手段を備えている、請求項9又は請求項10
    に記載の音声加工装置。
  13. 【請求項13】前記利得割り当て手段は、前記第1の利
    得及び前記第2の利得のうちの少なくとも1つとなり得
    る複数の候補値を有しており、前記音声加工装置は、前
    記第1の利得及び前記第2の利得のうち少なくとも1つ
    を他の候補値に切り換えるための利得切り換え手段をさ
    らに備えている、請求項9又は請求項10に記載の音声
    加工装置。
  14. 【請求項14】前記利得割り当て手段は、前記第1の利
    得及び前記第2の利得のうちの少なくとも1つとなり得
    る複数の候補値を有しており、前記音声加工装置は、前
    記音声入力信号から背景雑音レベルを検出する背景雑音
    レベル検出手段、及び、前記第1の利得及び前記第2の
    利得のうち少なくとも1つを他の候補値に切り換えるた
    めの利得切り換え手段をさらに備えている、請求項9又
    は請求項10に記載の音声加工装置。
JP5270492A 1992-10-30 1993-10-28 ホルマント検出装置及び音声加工装置 Pending JPH06208395A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5270492A JPH06208395A (ja) 1992-10-30 1993-10-28 ホルマント検出装置及び音声加工装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4-292455 1992-10-30
JP29245592 1992-10-30
JP5270492A JPH06208395A (ja) 1992-10-30 1993-10-28 ホルマント検出装置及び音声加工装置

Publications (1)

Publication Number Publication Date
JPH06208395A true JPH06208395A (ja) 1994-07-26

Family

ID=26549242

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5270492A Pending JPH06208395A (ja) 1992-10-30 1993-10-28 ホルマント検出装置及び音声加工装置

Country Status (1)

Country Link
JP (1) JPH06208395A (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003065836A (ja) * 2001-08-28 2003-03-05 Nippon Telegr & Teleph Corp <Ntt> 雑音源判別装置及び方法
JP2007243709A (ja) * 2006-03-09 2007-09-20 Fujitsu Ltd 利得調整方法及び利得調整装置
JP2008145940A (ja) * 2006-12-13 2008-06-26 Yamaha Corp 音声評価装置及び音声評価方法
JPWO2006082636A1 (ja) * 2005-02-02 2008-06-26 富士通株式会社 信号処理方法および信号処理装置
WO2009119460A1 (ja) * 2008-03-24 2009-10-01 日本ビクター株式会社 オーディオ信号処理装置及びオーディオ信号処理方法
JP2010008922A (ja) * 2008-06-30 2010-01-14 Toshiba Corp 音声処理装置、音声処理方法及びプログラム
JP2010191302A (ja) * 2009-02-20 2010-09-02 Sharp Corp 音声出力装置
JP2010539539A (ja) * 2007-09-12 2010-12-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声明瞭化を伴うスピーチ改善
WO2011114933A1 (ja) * 2010-03-17 2011-09-22 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
JP2011203761A (ja) * 2011-07-12 2011-10-13 Yamaha Corp 音声合成装置および音声合成プログラム
JP2014219567A (ja) * 2013-05-08 2014-11-20 日本放送協会 音声強調装置、及びプログラム
WO2023228615A1 (ja) * 2022-05-25 2023-11-30 パナソニックIpマネジメント株式会社 音声特徴量算出方法、音声特徴量算出装置、及び、口腔機能評価装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003065836A (ja) * 2001-08-28 2003-03-05 Nippon Telegr & Teleph Corp <Ntt> 雑音源判別装置及び方法
JPWO2006082636A1 (ja) * 2005-02-02 2008-06-26 富士通株式会社 信号処理方法および信号処理装置
JP4519169B2 (ja) * 2005-02-02 2010-08-04 富士通株式会社 信号処理方法および信号処理装置
JP2007243709A (ja) * 2006-03-09 2007-09-20 Fujitsu Ltd 利得調整方法及び利得調整装置
US7916874B2 (en) 2006-03-09 2011-03-29 Fujitsu Limited Gain adjusting method and a gain adjusting device
JP2008145940A (ja) * 2006-12-13 2008-06-26 Yamaha Corp 音声評価装置及び音声評価方法
JP4595934B2 (ja) * 2006-12-13 2010-12-08 ヤマハ株式会社 音声評価装置及び音声評価方法
US8583426B2 (en) 2007-09-12 2013-11-12 Dolby Laboratories Licensing Corporation Speech enhancement with voice clarity
JP2010539539A (ja) * 2007-09-12 2010-12-16 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション 音声明瞭化を伴うスピーチ改善
JP5012995B2 (ja) * 2008-03-24 2012-08-29 株式会社Jvcケンウッド オーディオ信号処理装置及びオーディオ信号処理方法
WO2009119460A1 (ja) * 2008-03-24 2009-10-01 日本ビクター株式会社 オーディオ信号処理装置及びオーディオ信号処理方法
US8355908B2 (en) 2008-03-24 2013-01-15 JVC Kenwood Corporation Audio signal processing device for noise reduction and audio enhancement, and method for the same
JP2010008922A (ja) * 2008-06-30 2010-01-14 Toshiba Corp 音声処理装置、音声処理方法及びプログラム
JP2010191302A (ja) * 2009-02-20 2010-09-02 Sharp Corp 音声出力装置
JP2011197106A (ja) * 2010-03-17 2011-10-06 Sony Corp 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
CN102792371A (zh) * 2010-03-17 2012-11-21 索尼公司 编码设备和编码方法、解码设备和解码方法及程序
WO2011114933A1 (ja) * 2010-03-17 2011-09-22 ソニー株式会社 符号化装置および符号化方法、復号装置および復号方法、並びにプログラム
US8892429B2 (en) 2010-03-17 2014-11-18 Sony Corporation Encoding device and encoding method, decoding device and decoding method, and program
RU2546324C2 (ru) * 2010-03-17 2015-04-10 Сони Корпорейшн Кодирущее устройство и способ кодирования, декодирующее устройство и способ декодирования, и программа
JP2011203761A (ja) * 2011-07-12 2011-10-13 Yamaha Corp 音声合成装置および音声合成プログラム
JP2014219567A (ja) * 2013-05-08 2014-11-20 日本放送協会 音声強調装置、及びプログラム
WO2023228615A1 (ja) * 2022-05-25 2023-11-30 パナソニックIpマネジメント株式会社 音声特徴量算出方法、音声特徴量算出装置、及び、口腔機能評価装置

Similar Documents

Publication Publication Date Title
US5479560A (en) Formant detecting device and speech processing apparatus
JP2962732B2 (ja) 補聴器用信号処理システム
TWI463817B (zh) 可適性智慧雜訊抑制系統及方法
US5550924A (en) Reduction of background noise for speech enhancement
JP4279357B2 (ja) 特に補聴器における雑音を低減する装置および方法
US7343022B2 (en) Spectral enhancement using digital frequency warping
US8045739B2 (en) Method and apparatus for controlling band split compressors in a hearing aid
JP5203933B2 (ja) オーディオ雑音を減少させるシステムおよび方法
RU2121719C1 (ru) Способ и устройство ослабления шума в речевом сигнале
JP3953814B2 (ja) 補聴器におけるスピーチ信号成分を増強するための方法および信号処理装置
JP2000347688A (ja) 雑音抑圧装置
JP2001134287A (ja) 雑音抑圧装置
JPH06208395A (ja) ホルマント検出装置及び音声加工装置
JP2004341339A (ja) 雑音抑圧装置
JP2563719B2 (ja) 音声加工装置と補聴器
CN110168640B (zh) 用于增强信号中需要分量的装置和方法
JPH09311696A (ja) 自動利得調整装置
KR100363259B1 (ko) 인지 특성 가중 함수를 이용한 음성신호의 위상 양자화장치 및 방법
KR100883896B1 (ko) 음성명료도 향상장치 및 방법
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
JPH06332491A (ja) 音声区間検出装置と雑音抑圧装置
US11758337B2 (en) Audio processing apparatus
KR100746680B1 (ko) 음성 강조 장치
JPH0956000A (ja) 補聴器
WO1995002239A1 (en) Voice-activated automatic gain control