JP5840087B2 - 音声信号復元装置および音声信号復元方法 - Google Patents
音声信号復元装置および音声信号復元方法 Download PDFInfo
- Publication number
- JP5840087B2 JP5840087B2 JP2012160355A JP2012160355A JP5840087B2 JP 5840087 B2 JP5840087 B2 JP 5840087B2 JP 2012160355 A JP2012160355 A JP 2012160355A JP 2012160355 A JP2012160355 A JP 2012160355A JP 5840087 B2 JP5840087 B2 JP 5840087B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- signal
- band
- smoothing
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Telephone Function (AREA)
Description
この発明は、例えば、音声通信、音声蓄積、音声認識システムが導入された、カーナビゲーションまたは携帯電話等の音声通信システム、ハンズフリー通話システム、TV会議システム、監視システム等の音質改善や、音声認識システムの認識率の向上に供される。
特許文献1にて開示されている音声信号復元技術と、特許文献2にて開示されている音声信号復元技術はともに、入力となる狭帯域音声信号に雑音が混入する場合、雑音の影響により算出した復元する高域のパワーが急激に変化するため、復元する高域部のパワー変動と狭帯域部の入力音声信号のパワー変動とに乖離が生じ、明瞭性が低下するという課題がある。
このような推定値の急激な変化を抑圧するための対策として、時間方向の平滑化を行うことが特許文献3にて開示されている。
第1の周波数帯域に帯域制限された音声信号から第2の周波数帯域の音声信号に対応する音源信号を生成する音源信号生成部と、
上記第1の周波数帯域に帯域制限された音声信号から上記第2の周波数帯域の音声信号に対応するスペクトル包絡を推定し、出力するスペクトル包絡推定部と、
上記第1の周波数帯域に帯域制限された音声信号に混入している雑音成分を推定し、雑音成分の混入度合いを示す指標である雑音情報を出力する雑音推定部と、
上記雑音推定部により推定された上記雑音情報から、上記スペクトル包絡推定部からの出力であるスペクトル包絡の平滑化の強さ度合いを示す指標である平滑化強度決定示数を出力する平滑化強度決定部と、
上記平滑化強度決定部により決定された上記平滑化強度決定示数を用いて上記スペクトル包絡推定部により推定された上記スペクトル包絡の平滑化を行うスペクトル包絡平滑化部と
上記音源信号生成部で生成された上記音源信号と、上記スペクトル包絡平滑化部で平滑化された上記スペクトル包絡とを用いて、上記第2の周波数帯域の音声信号を生成する信号合成部とを備える。
雑音推定部で、第1の周波数帯域に帯域制限された音声信号に混入している雑音成分を推定して、雑音成分の混入度合いを示す雑音情報を出力し、
第1の周波数帯域に帯域制限された音声信号から第2の周波数帯域の音声信号に対応するスペクトル包絡をスペクトル包絡推定部で推定し、出力された上記スペクトル包絡を平滑化する際に用いる平滑化強度決定示数を、上記雑音情報から算定し、この算定された平滑化強度決定示数を用いて、スペクトル包絡平滑化部で上記スペクトル包絡の平滑化を行い、
音源信号生成部で生成された第1の周波数帯域に帯域制限された音声信号から第2の周波数帯域の音声信号に対応する音源信号と、
上記スペクトル包絡平滑化部で平滑化された上記スペクトル包絡とを用いて、上記第2の周波数帯域の音声信号を生成する信号合成部とを備える構成にされているので、
第1の周波数帯域に帯域制限された音声信号への雑音の混入による生成された第2の周波数帯域の音声信号の明瞭性の低下や、平滑化の影響でパワーの急激な変化により異音と聞こえてしまう課題を解決し、異音感のない明瞭性のある広帯域音声信号を生成する効果がある。
以下、図面を参照してこの発明の実施の形態を説明する。
図3は本実施の形態1による音声信号復元装置の全体構成を示したものである。
図3において、音源生成部101は第1の周波数帯域に帯域制限された狭帯域音声信号(以下単に狭帯域音声信号と称す)を入力として、第2の周波数帯域である復元する帯域(以下単に復元する帯域と称す)の音声信号に対応する微細構造を含む音源信号を生成し出力する。スペクトル包絡推定部102は狭帯域音声信号を入力として、復元する帯域のスペクトル包絡を推定し出力する。雑音推定部103は狭帯域音声信号を入力とし、狭帯域音声信号中に含まれる雑音成分を推定し、その雑音情報を出力する。平滑化強度決定部104は雑音推定部103で推定された雑音情報を入力として、スペクトル包絡推定部102で推定された復元する帯域のスペクトル包絡を平滑する際の指標である平滑化強度決定示数を出力する。スペクトル包絡平滑化部105は、スペクトル包絡推定部102で推定された復元する帯域のスペクトル包絡と平滑化強度決定部104から出力された平滑化強度決定示数を入力とし、復元する帯域のスペクトル包絡の時間方向の平滑化を行い、平滑化された復元される帯域のスペクトル包絡を出力する。
まず、マイクロホン等を通じて取り込まれた音声や音楽等の信号が、A/D(アナログ・デジタル)変換された後、所定のサンプリング周波数(例えば、8000Hz)でサンプリングされると共にフレーム単位に分割(例えば10ms)され、更に帯域制限(例えば、300〜3400Hz)された狭帯域音声信号として、本実施の形態の音声信号復元装置へ入力される。なお、本実施の形態では、最終的に得る広帯域音声信号の周波数帯域を50〜7000Hzとして説明する。
ここでは、例として狭帯域音声信号の平均振幅スペクトル値から復元する帯域の平均振幅スペクトル値を推定する方法を述べるが、これに限られるものではなく他の方法であっても構わない。
ここで、nは現在のフレーム数を表し、X(n)はnフレーム目の狭帯域音声信号の平均振幅、N’(n)は推定ノイズ量を表す。またρは学習の際に用いる忘却係数である。
平滑化強度決定示数を上記のような関数で求めることにより、よりその雑音情報に適した平滑化強度決定示数を決定することができる。
ここで、Senv(n)はnフレーム目の復元する帯域のスペクトル包絡である。λは平滑化強度決定示数であり、S’env(n)は平滑化されたnフレーム目の復元する帯域のスペクトル包絡である。
・・・ 式3
ここで、Kは平滑化強度決定部104より出力された平滑化強度決定示数であり、この場合は移動平均に用いるフレーム数を表す。
また、本実施の形態では、信号合成部106が出力した復元する帯域を含む擬似音声信号を、帯域通過フィルタ部107で狭帯域音声信号の帯域以外の周波数成分のみを抽出し、この抽出された狭帯域音声信号の帯域以外の帯域制限された擬似音声信号と本実施の形態の音声信号復元装置へ入力される狭帯域音声信号の2つの信号を加算し、原音からの加工部分を少なくして音声帯域が拡張された広帯域音声信号として出力しているが、信号合成部106が出力する信号を復元する帯域を含む擬似音声信号として音声信号復元装置の最終的な出力としてもよい。
実施の形態1の他の実施の形態として、発話状態判定部109を導入することができる。図5は本実施の形態の全体構成を示したものである。図3に示す実施の形態1の構成と異なる点として、発話状態判定部109が導入されており、また、平滑化強度決定部110は雑音推定部103が出力する雑音情報および発話状態判定部109が出力する発話状態情報を入力とし、平滑化強度決定示数を決定するようになっている。
平滑化強度決定部110は、まず、雑音推定部103により実施の形態1と同様の手法で推定された雑音成分である推定ノイズ量N(n)を、狭帯域音声信号に雑音が混入しているかどうかの判定に用いる閾値であるNlimと比較し、その大小を判定し、推定ノイズ量N(n)が、閾値Nlim以上の時は、狭帯域音声信号に雑音が混入していると判定する(ステップS101)。狭帯域音声信号に雑音が混入していると判定されたときは、平滑化強度決定示数λをλnと決定する(ステップS102)。
推定ノイズ量N(n)が、閾値Nlim未満の時で、発話状態判定部109からの発話状態が発話開始区間S2でないときは、発話状態判定部109からの発話状態が発話終了区間S4であるか否かを判定する(ステップS105)。狭帯域音声信号が発話終了区間S4であると平滑化強度決定示数λをλs1と決定する(ステップS106)。発話状態が発話終了区間S4でないときは、平滑化強度決定示数λをλs2と決定する(ステップS107)。
このように、狭帯域音声信号が発話開始区間および発話終了区間のときは平滑化強度決定示数を小さくすることにより現在フレームの値の重みを大きくして、狭帯域音声信号の発話開始区間および発話終了区間のパワー変動に復元する帯域のパワー変動が追従することができるようにする。
実施の形態1のさらに他の実施の形態として、スペクトル包絡推定部102の前段に雑音抑圧部111を導入することができる。図8は本実施の形態の全体構成を示したものである。図3と異なる点として、雑音推定部103に代え、雑音抑圧部111をスペクトル包絡推定部102の前段に備え、平滑化強度決定部104は雑音抑圧部111によって得られる雑音情報から平滑化強度決定示数を算定する。
こうすることによって、音源生成部101において、雑音が混入していても本来の音声が持つ調波構造から復元する帯域の微細構造を含む音源信号を生成することができ、入力となる狭帯域音声信号に低SN比で雑音が混入する場合でも明瞭性のある広帯域音声信号を生成できる。
実施の形態1から3の音声信号復元装置は、図9のイメージ図のように、(a)に示される出力する狭帯域音声信号の帯域幅を拡張し、(b)に示される明瞭性のある広帯域音声信号を生成する技術である。
それに対し、図10のイメージ図のように、(a)に示される雑音抑圧や音声圧縮等により劣化・欠損した帯域を含む狭帯域音声信号を、(b)に示されるように、最終的に出力される音声信号の帯域幅は変わらないが、劣化・欠損した帯域の復元にも実施の形態1から3の音声信号復元装置が応用できる。
スペクトル包絡平滑化部105はスペクトル包絡推定部102で出力する復元する帯域として入力された狭帯域音声信号と同じ帯域のスペクトル包絡と平滑化強度決定部104で出力する平滑化強度決定示数を入力とし、復元する帯域のスペクトル包絡における時間方向の平滑化を行い、平滑化された復元する帯域のスペクトル包絡を出力する。
信号合成部106は、音源生成部101によって生成した復元する帯域として入力された狭帯域音声信号と同じ帯域の微細構造を含む音源信号とスペクトル包絡平滑化部105で出力する平滑化された復元する帯域として入力された狭帯域音声信号と同じ帯域のスペクトル包絡を入力とし、この2つを合成することによって、復元する帯域として入力された狭帯域音声信号と同じ帯域の擬似音声信号を出力する。
このように実施の形態1から3の復元する音声信号の帯域を、入力された音声信号と同じ帯域とすることで、信号合成部106の出力は劣化・欠損した帯域の復元が行われた音声信号となり、この信号合成部106の出力を最終出力とする。
このように実施の形態1から3を応用することにより、雑音抑圧や音声圧縮等により劣化・欠損した帯域の復元を行うことができ、より明瞭性のある音声信号を生成する効果が期待できる。
本実施の形態は、実施の形態1から4で述べた音声信号復元装置をカーナビゲーターのハンズフリー音声通話システムに応用した例である。全体構成を図11に示す。外部通信部201は、車内にあるユーザの携帯電話とブルートゥース等により通信を行い、携帯電話と音声信号の受け渡しを行う。音声信号復元部202は、実施の形態1から4で述べた音声信号復元装置であり、外部通信部201からの音声信号を音声復元して、外部入出力部203へと出力する。外部入出力部203は、スピーカ及びマイクロホンを備えており、ユーザとのインターフェースの役割を果たす。エコーキャンセラ部204は、音声信号復元部202の出力信号と外部入出力部203の出力信号を入力とし、スピーカからの出力音声をマイクロホンが拾うことによって生じるエコーを抑圧している。ノイズキャンセラ部205は、エコーキャンセラ部204の出力信号を入力とし、ユーザが乗車中の車が走行中等により生じる雑音を抑圧し、雑音抑圧した音声信号を外部通信部201へと出力する。
Claims (4)
- 第1の周波数帯域に帯域制限された音声信号から第2の周波数帯域の音声信号に対応する音源信号を生成する音源信号生成部と、
上記第1の周波数帯域に帯域制限された音声信号から上記第2の周波数帯域の音声信号に対応するスペクトル包絡を推定し、出力するスペクトル包絡推定部と、
上記第1の周波数帯域に帯域制限された音声信号に混入している雑音成分を推定し、雑音成分の混入度合いを示す指標である雑音情報を出力する雑音推定部と、
上記雑音推定部により推定された上記雑音情報から、上記スペクトル包絡推定部からの出力であるスペクトル包絡の平滑化の強さ度合いを示す指標である平滑化強度決定示数を出力する平滑化強度決定部と、
上記平滑化強度決定部により決定された上記平滑化強度決定示数を用いて上記スペクトル包絡推定部により推定された上記スペクトル包絡の平滑化を行うスペクトル包絡平滑化部と
上記音源信号生成部で生成された上記音源信号と、上記スペクトル包絡平滑化部で平滑化された上記スペクトル包絡とを用いて、上記第2の周波数帯域の音声信号を生成する信号合成部とを備えることを特徴とする音声信号復元装置。 - 上記第1の周波数帯域に帯域制限された音声信号から現在の発話状態を推定する発話状態推定部を備え
上記平滑化強度決定部は上記雑音推定部によって推定された上記雑音情報と上記発話状態推定部によって推定された上記発話状態とから上記平滑化強度決定示数を算出することを特徴とする請求項1に記載の音声信号復元装置。 - 上記第1の周波数帯域に帯域制限された音声信号に対して雑音抑圧を行い、雑音抑圧の際に推定した上記雑音情報を出力する雑音抑圧部を備え、
上記スペクトル包絡推定部は上記雑音抑圧部により雑音抑圧された上記第1の周波数帯域に帯域制限された音声信号から上記第2の周波数帯域の音声信号に対応するスペクトル包絡を推定し、
上記平滑化強度決定部は上記雑音抑圧部によって得られる上記雑音情報から上記平滑化強度決定示数を決定することを特徴とする請求項1に記載の音声信号復元装置。 - 第1の周波数帯域に帯域制限された音声信号から第2の周波数帯域の音声信号に対応する音源信号を生成する音源信号生成工程と、
上記第1の周波数帯域に帯域制限された音声信号から上記第2の周波数帯域の音声信号に対応するスペクトル包絡を推定し、出力するスペクトル包絡推定工程と、
上記第1の周波数帯域に帯域制限された音声信号に混入している雑音成分を推定し、雑音成分の混入度合いを示す指標である雑音情報を出力する雑音推定工程と、
上記雑音推定工程により推定された上記雑音情報から、上記スペクトル包絡推定工程からの出力であるスペクトル包絡の平滑化の強さ度合いを示す指標である平滑化強度決定示数を出力する平滑化強度決定工程と、
上記平滑化強度決定工程により決定された上記平滑化強度決定示数を用いて上記スペクトル包絡推定工程により推定された上記スペクトル包絡の平滑化を行うスペクトル包絡平滑化工程と
上記音源信号生成工程で生成された上記音源信号と、上記スペクトル包絡平滑化工程で平滑化された上記スペクトル包絡とを用いて、上記第2の周波数帯域の音声信号を生成する信号合成工程とを備えることを特徴とする音声信号復元方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012160355A JP5840087B2 (ja) | 2012-07-19 | 2012-07-19 | 音声信号復元装置および音声信号復元方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012160355A JP5840087B2 (ja) | 2012-07-19 | 2012-07-19 | 音声信号復元装置および音声信号復元方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014021307A JP2014021307A (ja) | 2014-02-03 |
JP5840087B2 true JP5840087B2 (ja) | 2016-01-06 |
Family
ID=50196228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012160355A Expired - Fee Related JP5840087B2 (ja) | 2012-07-19 | 2012-07-19 | 音声信号復元装置および音声信号復元方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5840087B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016024454A (ja) * | 2014-07-25 | 2016-02-08 | 三菱電機株式会社 | 音声帯域拡張装置および音声帯域拡張方法 |
JP6451136B2 (ja) * | 2014-08-05 | 2019-01-16 | 沖電気工業株式会社 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
JP6451143B2 (ja) * | 2014-08-20 | 2019-01-16 | 沖電気工業株式会社 | 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム |
US10347273B2 (en) | 2014-12-10 | 2019-07-09 | Nec Corporation | Speech processing apparatus, speech processing method, and recording medium |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3189614B2 (ja) * | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
-
2012
- 2012-07-19 JP JP2012160355A patent/JP5840087B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014021307A (ja) | 2014-02-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5183828B2 (ja) | 雑音抑圧装置 | |
JP5528538B2 (ja) | 雑音抑圧装置 | |
US8521530B1 (en) | System and method for enhancing a monaural audio signal | |
US8010355B2 (en) | Low complexity noise reduction method | |
JP5646077B2 (ja) | 雑音抑圧装置 | |
JP5595605B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
KR101224755B1 (ko) | 음성-상태 모델을 사용하는 다중-감각 음성 향상 | |
JP5535241B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
EP1772855A1 (en) | Method for extending the spectral bandwidth of a speech signal | |
JP5153886B2 (ja) | 雑音抑圧装置および音声復号化装置 | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
JP2004502977A (ja) | サブバンド指数平滑雑音消去システム | |
JPWO2006046293A1 (ja) | 雑音抑圧装置 | |
JPWO2013118192A1 (ja) | 雑音抑圧装置 | |
JPWO2018163328A1 (ja) | 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置 | |
US9245538B1 (en) | Bandwidth enhancement of speech signals assisted by noise reduction | |
JP2011033717A (ja) | 雑音抑圧装置 | |
JP5840087B2 (ja) | 音声信号復元装置および音声信号復元方法 | |
JP3960834B2 (ja) | 音声強調装置及び音声強調方法 | |
JP2009223210A (ja) | 信号帯域拡張装置および信号帯域拡張方法 | |
KR101850693B1 (ko) | 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법 | |
JPH11265199A (ja) | 送話器 | |
JP2004020679A (ja) | 雑音抑圧装置および雑音抑圧方法 | |
JP2006201622A (ja) | 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法 | |
KR20180010115A (ko) | 스피치를 향상하는 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151007 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5840087 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |