JP6065488B2 - 帯域拡張装置及び方法 - Google Patents
帯域拡張装置及び方法 Download PDFInfo
- Publication number
- JP6065488B2 JP6065488B2 JP2012206012A JP2012206012A JP6065488B2 JP 6065488 B2 JP6065488 B2 JP 6065488B2 JP 2012206012 A JP2012206012 A JP 2012206012A JP 2012206012 A JP2012206012 A JP 2012206012A JP 6065488 B2 JP6065488 B2 JP 6065488B2
- Authority
- JP
- Japan
- Prior art keywords
- high frequency
- band
- frequency amplitude
- amplitude
- unvoiced
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Function (AREA)
Description
以下、本発明の帯域拡張装置及び方法の第1の実施形態を、図面を参照しながら詳細に説明する。
図2は、第1の実施形態の音声帯域拡張装置の構成を示すブロック図である。
この推定式(1)は、特許文献1に記載のゲインの推定式と同じであるが、本発明では主に拡張高域成分の無声音の振幅を推定するために使う。
ここで、C0は適当な定数である。(2)式は(1)式と似た動作をするが、定数C0の導入により、無声音でAVが発散することや無音区間でAVが十分小さくならないことを防いでいる。(1)式及び(2)式の2つの式を図7で比較すると、2つの式は似た特徴を持っているが、(2)式はALL→0でも発散しないことがわかる。この安定化効果により、AVはALLとALHの比を拡張高域成分の振幅に安定的に反映することができるが、無声音の拡張高域成分の振幅の推定が不十分となる副作用を生じる。したがって、拡張高域成分の有声音の振幅を推定するのに有効である。
音声信号のほとんどは有声音であり、有声音ではほとんどの場合ALLがALHに比べて大きい。実際に計測した音声の平均振幅特性を図8に示した。このため、低域0Hz〜4kHzのエネルギーはほとんどALLの帯域に集中している。これに対して、(1)式と(2)式の推定式の分子には、ALLが存在しない。このため、本来の音声信号の高域成分の振幅と、(1)式と(2)式によって推定した拡張高域成分の振幅には、ズレが生じてしまう。そのズレを、ACを用いて補正する。
ここで、CUとCVとCCは2つの推定値と補正値のバランスを調整する適当な定数係数である。定数係数CU、CV、CCそれぞれを調整することによって、無声音の強調度合いとACによる補正度合いを設定することができる。
乗算処理部223は、拡張高域成分生成部204が出力する拡張高域成分EHにゲイン計算処理部222が出力するゲインGHを乗じて拡張高域成分の振幅を調整する。
第1の実施形態によれば、無声音と有声音の拡張高域成分の振幅を別々に推定し、さらにこれら2つの推定値で表現できていない低域0Hz〜2kHzから高域4kHz〜8kHzへの直接的な影響を補正して拡張高域成分の振幅を推定しているので、従来よりも自然で明瞭度の高い広帯域音声信号を得ることができる。
次に、本発明の帯域拡張装置及び方法の第2の実施形態を、図面を参照しながら詳細に説明する。
図9は、第2の実施形態の音声帯域拡張装置の構成を示すブロック図である。
以上のように、第2の実施形態によれば、無音区間を検出して適当なゲインを与えることで、無音区間には対応していない高域振幅推定部215により誤った高域振幅推定値を拡張高域成分に適用することを避けることが出来るため、第1の実施形態よりも自然で雑音の少ない広帯域音声信号を得ることができる。
次に、本発明の帯域拡張装置及び方法の第3の実施形態を、図面を参照しながら詳細に説明する。
図10は、第3の実施形態の音声帯域拡張装置の構成を示すブロック図である。
CV=CV0XPV …(7)
ここで、CU0およびCV0は適当な定数である。
以上のように、第3の実施形態によれば、入力音声中の無声音成分と有声音成分の割合に応じて、2つの高域振幅推定値に掛かる重みを適応的に変更することによって、本来の高域振幅の推定精度を向上させることができるため、第1の実施形態よりも自然で明瞭度の高い広帯域音声信号を得ることができる。
次に、本発明の帯域拡張装置及び方法の第4の実施形態を、図面を参照しながら詳細に説明する。
以上のように、第4の実施形態によれば、第2の実施形態の狭帯域音声信号Sが音声区間であると判断された場合にはおいて、2つの高域振幅推定値に掛ける重みを適応的に変更することによって、高域振幅の推定精度を向上させることができ、さらに第3の実施形態の狭帯域音声信号Sが無音と判断されるべき信号であった場合において、無音区間には対応していない高域振幅推定部1001により誤った高域振幅推定値を拡張高域成分に適用することを避けることができるため、第2の実施形態及び第3の実施形態よりも自然で明瞭度が高い雑音の少ない広帯域音声信号を得ることができる。
上述した第1〜第4の実施形態では、各構成要素がハードウェアに実現されているイメージで説明したが、各実施形態の各構成要素の全て又は一部がソフトウェア的に実行されるものであってもよい。
201…サンプリング周波数変換部、202…アップサンプリング処理部、203…エイリアシングフィルタリング処理部203、
204…拡張高域成分生成部、205…バンドパスフィルタリング処理部、206…全波整流処理部、207…ハイパスフィルタリング処理部、
208…スペクトル形状解析部、209及び210…帯域分割バンドパスフィルタリング処理部、211及び212…絶対値処理部、213及び214…平滑化ローパスフィルタリング処理部、
215及び1001…高域振幅推定部、216…無声音高域振幅推定処理部、217…有声音高域振幅推定処理部、218…高域振幅補正処理部、219…高域振幅決定処理部、
1002…有声無声推定処理部、1003…高域振幅推定値係数決定処理部、
220…絶対値処理部、221…平滑化ローパスフィルタリング処理部、
222…ゲイン計算処理部、223…乗算処理部、224…加算処理部、
901…音声区間検出処理部、902…ゲイン選択部、903…無音区間ゲイン設定部。
Claims (6)
- 周波数帯域が帯域BLに制限された狭帯域信号を、上記帯域BLより高域の周波数帯域である帯域BHの信号成分を含むように拡張する帯域拡張装置において、
上記狭帯域信号のサンプリング周波数を2倍以上のサンプリング周波数に変換するサンプリング周波数変換手段と、
上記サンプリング周波数変換手段の出力信号から上記帯域BLを有さず上記帯域BHを有する拡張高域成分を生成する拡張高域成分生成手段と、
上記サンプリング周波数変換手段の出力信号から狭帯域信号のスペクトル形状を解析するスペクトル形状解析手段と、
上記スペクトル形状解析手段の出力結果に基づいて複数の推定方法を用いて本来の高域成分の振幅を推定して高域振幅推定値を出力する高域振幅推定手段と、
上記拡張高域成分の振幅が上記高域振幅推定値となるように上記拡張高域成分のゲインを決定するゲイン決定手段と、
上記拡張高域成分に上記ゲインを乗じた信号と上記サンプリング周波数変換手段の出力信号とを加算合成する合成手段と
を備え、
上記高域振幅推定手段が、
上記スペクトル形状解析手段の出力結果に基づいて無声音成分の高域振幅を推定する無声音高域振幅推定部と、
上記スペクトル形状解析手段の出力結果に基づいて有声音成分の高域振幅を推定する有声音高域振幅推定部と、
上記スペクトル形状解析手段の出力結果に基づいて高域振幅の補正値を出力する高域振幅補正部と、
上記無声音高域振幅推定部から出力された無声音高域振幅推定値と上記有声音高域振幅推定部から出力された有声音高域振幅推定値との2個の高域振幅推定値と、上記高域振幅補正部から出力された高域振幅補正値とを加重加算することで上記高域振幅推定値を生成する高域振幅決定部と
を有する
ことを特徴とする帯域拡張装置。 - 上記高域振幅推定手段が、
上記狭帯域信号が有声音か無声音かを判定する有声無声推定部と、
上記有声無声推定部の判定結果に応じて上記無声音高域振幅推定値の加重係数と上記有声音高域振幅推定値の加重係数を適応的に決定する高域振幅推定値係数決定部と
を更に有することを特徴とする請求項1に記載の帯域拡張装置。 - 上記高域振幅推定手段が、
上記狭帯域信号に含まれる有声音成分と無声音成分との割合を推定する有声無声推定部と、
上記有声無声推定部の出力結果に応じて上記無声音高域振幅推定値の加重係数と上記有声音高域振幅推定値の加重係数を適応的に決定する高域振幅推定値係数決定部と
を更に有することを特徴とする請求項1に記載の帯域拡張装置。 - 上記狭帯域信号が音声区間か無音区間かを判定する音声区間検出手段と、
上記狭帯域信号が無音区間であった場合に適用する上記ゲインの値を出力する無音区間ゲイン設定手段と、
上記音声区間検出手段の判定結果に応じて前記ゲイン決定手段と上記無音区間ゲイン設定手段とのどちらの出力を前記ゲインとするかを選択するゲイン選択手段と
を備えることを特徴とする請求項1〜3のいずれかに記載の帯域拡張装置。 - 上記スペクトル形状解析手段が、
少なくとも2つ以上のバンドパスフィルタリング部と、
上記バンドパスフィルタリング部の出力信号の短期平均振幅を算出する振幅算出手段と
を有することを特徴とする請求項1〜4のいずれかに記載の帯域拡張装置。 - 周波数帯域が帯域BLに制限された狭帯域信号を、上記帯域BLより高域の周波数帯域である帯域BHの信号成分を含むように拡張する帯域拡張方法において、
サンプリング周波数変換手段が、上記狭帯域信号のサンプリング周波数を2倍以上のサンプリング周波数に変換し、
拡張高域成分生成手段が、上記サンプリング周波数変換手段の出力信号から上記帯域BLを有さず上記帯域BHを有する拡張高域成分を生成し、
スペクトル形状解析手段が、上記サンプリング周波数変換手段の出力信号から狭帯域信号のスペクトル形状を解析し、
高域振幅推定手段が、上記スペクトル形状解析手段の出力結果に基づいて複数の推定方法を用いて本来の高域成分の振幅を推定して高域振幅推定値を出力し、
ゲイン決定手段が、上記拡張高域成分の振幅が上記高域振幅推定値となるように上記拡張高域成分のゲインを決定し、
合成手段が、上記拡張高域成分に上記ゲインを乗じた信号と上記サンプリング周波数変換手段の出力信号とを加算合成し、
上記高域振幅推定手段が、
上記スペクトル形状解析手段の出力結果に基づいて無声音成分の高域振幅を推定する無声音高域振幅推定工程と、
上記スペクトル形状解析手段の出力結果に基づいて有声音成分の高域振幅を推定する有声音高域振幅推定工程と、
上記スペクトル形状解析手段の出力結果に基づいて高域振幅の補正値を出力する高域振幅補正工程と、
上記無声音高域振幅推定工程で出力された無声音高域振幅推定値と上記有声音高域振幅推定工程で出力された有声音高域振幅推定値との2個の高域振幅推定値と、上記高域振幅補正工程で出力された高域振幅補正値とを加重加算することで上記高域振幅推定値を生成する高域振幅決定工程と
を有する
ことを特徴とする帯域拡張方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012206012A JP6065488B2 (ja) | 2012-09-19 | 2012-09-19 | 帯域拡張装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012206012A JP6065488B2 (ja) | 2012-09-19 | 2012-09-19 | 帯域拡張装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014059525A JP2014059525A (ja) | 2014-04-03 |
JP6065488B2 true JP6065488B2 (ja) | 2017-01-25 |
Family
ID=50616022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012206012A Expired - Fee Related JP6065488B2 (ja) | 2012-09-19 | 2012-09-19 | 帯域拡張装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6065488B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106782594A (zh) * | 2016-12-14 | 2017-05-31 | 南京航空航天大学 | 一种抑制窄带主动噪声控制中频率不匹配的方法 |
EP4296728A4 (en) * | 2021-03-19 | 2024-08-21 | Keiwa Incorporated | LIGHT DIFFUSION SHEET, BACKLIGHT UNIT, LIQUID CRYSTAL DISPLAY DEVICE AND INFORMATION EQUIPMENT |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4281349B2 (ja) * | 2001-12-25 | 2009-06-17 | パナソニック株式会社 | 電話装置 |
-
2012
- 2012-09-19 JP JP2012206012A patent/JP6065488B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014059525A (ja) | 2014-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1638083B1 (en) | Bandwidth extension of bandlimited audio signals | |
US10510363B2 (en) | Pitch detection algorithm based on PWVT | |
EP2788980B1 (en) | Harmonicity-based single-channel speech quality estimation | |
JP4733727B2 (ja) | 音声楽音擬似広帯域化装置と音声楽音擬似広帯域化方法、及びそのプログラムとその記録媒体 | |
RU2756435C2 (ru) | Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты | |
JP5453740B2 (ja) | 音声強調装置 | |
WO2006006366A1 (ja) | ピッチ周波数推定装置およびピッチ周波数推定方法 | |
TWI518676B (zh) | 低複雜度聽覺事件邊界檢測技術 | |
JPWO2002080148A1 (ja) | 雑音抑圧装置 | |
JP2005165021A (ja) | 雑音低減装置、および低減方法 | |
JP6305694B2 (ja) | 信号処理装置及び信号処理方法 | |
JP6065488B2 (ja) | 帯域拡張装置及び方法 | |
JP5949379B2 (ja) | 帯域拡張装置及び方法 | |
JP4173525B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
Sun et al. | Speech enhancement via two-stage dual tree complex wavelet packet transform with a speech presence probability estimator | |
JP7152112B2 (ja) | 信号処理装置、信号処理方法および信号処理プログラム | |
JP4098271B2 (ja) | 雑音抑圧装置 | |
JP6163785B2 (ja) | 音声帯域拡張装置及びプログラム | |
JP5596618B2 (ja) | 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム | |
US8583425B2 (en) | Methods, systems, and computer readable media for fricatives and high frequencies detection | |
JP6559576B2 (ja) | 雑音抑圧装置、雑音抑圧方法及びプログラム | |
JP6089789B2 (ja) | 音声帯域拡張装置及びプログラム、並びに、無声音拡張装置及びプログラム | |
JP6451143B2 (ja) | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム | |
KR101192366B1 (ko) | 현출성을 이용하는 시간-주파수 조합영역의 피치 추정 시스템 및 방법 | |
CN116137154A (zh) | 语音信号的信号增强方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150515 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160510 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160614 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161129 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6065488 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |