JP2017009657A - 音声強調装置、および音声強調方法 - Google Patents

音声強調装置、および音声強調方法 Download PDF

Info

Publication number
JP2017009657A
JP2017009657A JP2015122045A JP2015122045A JP2017009657A JP 2017009657 A JP2017009657 A JP 2017009657A JP 2015122045 A JP2015122045 A JP 2015122045A JP 2015122045 A JP2015122045 A JP 2015122045A JP 2017009657 A JP2017009657 A JP 2017009657A
Authority
JP
Japan
Prior art keywords
unit
vehicle
histogram
noise
cumulative histogram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015122045A
Other languages
English (en)
Other versions
JP6439174B2 (ja
Inventor
一博 中臺
Kazuhiro Nakadai
一博 中臺
武志 水本
Takeshi Mizumoto
武志 水本
圭佑 中村
Keisuke Nakamura
圭佑 中村
将行 瀧ヶ平
Masayuki Takigahira
将行 瀧ヶ平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Original Assignee
Honda Motor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd filed Critical Honda Motor Co Ltd
Priority to JP2015122045A priority Critical patent/JP6439174B2/ja
Priority to US15/173,922 priority patent/US9875755B2/en
Publication of JP2017009657A publication Critical patent/JP2017009657A/ja
Application granted granted Critical
Publication of JP6439174B2 publication Critical patent/JP6439174B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Data Mining & Analysis (AREA)
  • Mechanical Engineering (AREA)

Abstract

【課題】雑音抑圧を適切に行うことができる音声強調装置、および音声強調方法を提供することを目的とする。【解決手段】音声強調装置は、音響信号を収音する収音部と、車両の状態を監視する車両状態監視部と、収音部によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定するノイズ推定部と、収音された音響信号から、ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調部と、を備え、ノイズ推定部は、車両状態監視部によって監視された結果に基づいて、累積ヒストグラムをリセットする。【選択図】図1

Description

本発明は、音声強調装置、および音声強調方法に関する。
音響信号に含まれるノイズ成分を抑圧する音声強調装置がある。例えば、ハンズフリー通話や野外での通話を行う携帯電話などへ音声強調装置を適用することが提案されている。
このような音声強調装置では、音検出部によって収音された音響信号に対して周波数毎に、パワー毎の累積ヒストグラムを生成し、生成した累積ヒストグラムに基づいてノイズレベルを推定する。そして、音声強調装置は、収音された音響信号に含まれる音声信号から、推定したノイズレベルに基づくノイズ成分をスペクトル減算によって音声強調を行う(例えば、特許文献1参照)。なお、スペクトル減算とは、周波数毎に音声信号からノイズ成分を減算する処理である。
特開2012−88404号公報
しかしながら、特許文献1に記載の技術を、例えば、ノイズ成分の状態が変化する車両に適用した場合には、累積ヒストグラムを適切に生成できない可能性がある。なお、車両では、例えばドアが開いている状態、ドアが閉められている状態等に応じて、ノイズ成分が変化する。特許文献1に記載の技術では、このようにノイズ成分が変化する環境において雑音抑圧を適切に行えない可能性があった。
本発明は上記の点に鑑みてなされたものであり、雑音抑圧を適切に行うことができる音声強調装置、および音声強調方法を提供することを目的とする。
(1)上記目的を達成するため、本発明の一態様に係る音声強調装置は、音響信号を収音する収音部と、車両の状態を監視する車両状態監視部と、前記収音部によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定するノイズ推定部と、前記収音された音響信号から、前記ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調部と、を備え、前記ノイズ推定部は、前記車両状態監視部によって監視された結果に基づいて、前記累積ヒストグラムをリセットする。
(2)また、本発明の一態様に係る音声強調装置において、前記ノイズ推定部は、前記車両状態監視部によって監視された結果が変化したとき、前記累積ヒストグラムをリセットするようにしてもよい。
(3)また、本発明の一態様に係る音声強調装置は、前記車両の状態毎の前記累積ヒストグラムが記憶されているヒストグラム記憶部を備え、前記ノイズ推定部は、前記リセットした後、前記車両状態監視部によって監視された結果に基づいて、前記ヒストグラム記憶部から前記車両の状態に応じた周波数成分毎の前記累積ヒストグラムを読み出し、読み出した周波数成分毎の前記累積ヒストグラムを用いて周波数成分毎に雑音成分を推定するようにしてもよい。
(4)また、本発明の一態様に係る音声強調装置において、前記ヒストグラム記憶部には、前記車両の状態に、前記累積ヒストグラムにおける雑音成分を判別するための閾値が対応付けられ、前記ノイズ推定部は、前記ヒストグラム記憶部に記憶されている前記閾値を用いて、周波数成分毎に雑音成分を推定するようにしてもよい。
(5)また、本発明の一態様に係る音声強調装置において、前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両が発進および停止のうち、少なくとも1つが行われたときであるようにしてもよい。
(6)また、本発明の一態様に係る音声強調装置において、前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両のドアの開閉があったときであるようにしてもよい。
(7)また、本発明の一態様に係る音声強調装置において、前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両の窓の開閉があったときであるようにしてもよい。
(8)上記目的を達成するため、本発明の一態様に係る音声強調方法は、収音部が、音響信号を収音する収音手順と、車両状態監視部が、車両の状態を監視する車両状態監視手順と、ノイズ推定部が、前記収音手順によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定し、前記車両状態監視手順によって監視された結果に基づいて、前記累積ヒストグラムをリセットするノイズ推定手順と、音声強調部が、前記収音手順によって収音された音響信号から、前記ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調手順と、を含む。
上述した(1)、(8)の構成によれば、車両の状態が変化する場合であっても雑音抑圧を適切に行うことができる。
また、上述した(2)の構成によれば、車両内のノイズ状態が変化する環境においても雑音抑圧を適切に行うことができる。
また、上述した(3)の構成によれば、環境が変化したときであっても、ヒストグラム記憶部に記憶されている累積ヒストグラムを用いて、直ちに雑音抑圧を適切に行うことができる。
また、上述した(4)の構成によれば、雑音と発話のパワーの大小関係が変化したときであっても、雑音抑圧を適切に行うことができる。
また、上述した(5)、(6)、(7)の構成によれば、車両の状態によって車両内の雑音成分の大小関係が変化する環境においても雑音抑圧を適切に行うことができる。
実施形態に係る音響強調装置の構成を表すブロック図である。 実施形態に係るヒストグラム記憶部に車両の状態に対応付けられて記憶されている情報の例を表す図である。 実施形態に係る音響強調装置が行う処理のフローチャートである。 実施形態に係るヒストグラム更新部によって作成される雑音成分と発話のパワーレベルとの差が大きい場合のヒストグラムと累積ヒストグラムを説明する図である。 実施形態に係るヒストグラム更新部よって作成される雑音成分と発話のパワーレベルとの差が小さい場合のヒストグラムと累積ヒストグラムを説明する図である。 実施形態に係るノイズ推定部の処理手順を表す図である。 実施形態に係るヒストグラム更新部が行う累積ヒストグラムのリセット、変更、更新の処理のフローチャートである。 実施形態に係る車両の状態に応じた累積ヒストグラムをリセット、変更、更新するタイミングを説明するための図である。
以下、図面を参照しながら本発明の実施形態について説明する。また、以下の説明では、音声強調装置を車両に設置する例について説明を行う。
<音声強調装置の構成>
図1は、本実施形態に係る音響強調装置1の構成を表すブロック図である。
図1に示すように、音響強調装置1は、収音部11、音響信号取得部12、音源定位部13、音源分離部14、車両状態監視部15、ヒストグラム記憶部16、ノイズ推定部17、音声強調部18、音声区間検出部19、および音声認識部20を備える。音響強調装置1は、車両2に搭載されている。車両2は、ECU201およびCAN202を備える。なお、以下の説明では、話者が1人であり、車両2の運転者である例を説明する。
ECU(Electronic Control Unit;電子制御ユニット)201は、利用者によって車両2内の各機能が操作されたことを検出し、検出した結果に応じて車両2を制御する。各機能とは、パワーウィンドの開閉、ドアの開閉、ブレーキの操作等である。ECU201は、検出した結果を示す車両情報を、CAN202を介して音響強調装置1に出力する。なお、検出情報には、車両の状態を示す情報が含まれている。ここで、車両の状態とは、パワーウィンドが開かれた状態または閉じられた状態、ドアが開かれた状態または閉じられた状態、ブレーキが停止状態または発信状態等のうちの1つの状態である。
CAN(Control Area Network)202は、CAN規格に準拠した相互接続された機器間のデータ転送に用いられるネットワークである。
収音部11は、マイクロホンであり、マイクロホン101−1〜101−N(Nは2以上の整数)を備える。なお、収音部11は、例えばマイクロフォンアレイである。収音部11は、例えば、車両2の運転席と助手席との間に取り付けられている。なお、マイクロホン101−1〜101−Nのうちいずれか1つを特定しない場合は、マイクロホン101という。収音部11は、収音した音響信号を電気信号に変換して、変換した音響信号を音響信号取得部12に出力する。なお、収音部11は、収録したNチャネルの音響信号を音響信号取得部12に無線で送信してもよいし、有線で送信してもよい。送信の際にチャネル間で音響信号が同期していればよい。
音響信号取得部12は、収音部11のN個のマイクロホン101によって収録されたN個の音響信号を取得し、取得したN個の音響信号を音源定位部13および音源分離部14に出力する。
音源定位部13には、方位毎にマイクロホン101から所定の位置までの伝達関数が記憶されている。音源定位部13は、音響信号取得部12から入力されたN個の音響信号に対して、自部に記憶されている伝達関数を用いて音源の方位角の推定(音源定位を行うともいう)を行う。音源定位部13は、推定した音源の方位角情報を音源分離部14に出力する。音源定位部13は、例えば、MUSIC(MUltiple Signal Classification)法を用いて方位角を推定する。なお、方位角の推定には、ビームフォーミング(Beamforming)法、WDS−BF(Weighted Delay and Sum BeamForming;重み付き遅延和ビームフォーミング)法、一般化特異値展開を用いたMUSIC(GSVD−MUSIC;Generalized Singular Value Decomposition−Multiple Signal Classification)法等の他の音源方向推定方式を用いてもよい。
音源分離部14には、方位毎にマイクロホン101から所定の位置までの伝達関数が記憶されている。音源分離部14は、音響信号取得部12が出力したN個の音響信号と、音源定位部13が出力した音源の方位角情報を取得する。音源分離部14は、自部に記憶されている伝達関数のうち、取得した方位角に対応する伝達関数を読み出す。音源分離部14は、読み出した伝達関数と、例えばブラインド分離とビームフォーミングのハイブリッドである例えばGHDSS−AS(Geometrically constrained Highorder Decorrelation based Source Separation with Adaptive Stepsize control)法を用いて取得したN個の音響信号から話者の音声信号y(t)を分離する。なお、音源分離部14は、ビームフォーミング法等を用いて、音源分離処理を行ってもよい。音源分離部14は、分離した音源毎の音声信号y(t)をノイズ推定部17に出力する。
車両状態監視部15は、車両2が出力した車両情報に含まれている車両の状態を示す情報を抽出する。車両状態監視部15は、抽出した車両の状態を示す情報に基づいて、車両の状態が変化したことを検出した場合、累積ヒストグラム(頻度分布)をリセットし、ヒストグラム記憶部16から車両の状態に対応するデフォルトの累積ヒストグラムを読み出すリセット指示を生成する。車両状態監視部15は、生成したリセット指示をノイズ推定部17に出力する。なお、リセット指示には、車両の状態を示す情報が含まれている。
ヒストグラム記憶部16には、図2に示すように車両の状態毎にデフォルトの累積ヒストグラムと、後述する閾値Sとが対応つけられて記憶されている。
図2は、本実施形態に係るヒストグラム記憶部16に車両の状態に対応付けられて記憶されている情報の例を表す図である。図2に示すように、例えばパワーウィンド(窓)が開かれた状態に、デフォルト1の累積ヒストグラムと、閾値Sx1とが対応付けられている。また、パワーウィンドが閉じられた状態に、デフォルト2の累積ヒストグラムと、閾値Sx2とが対応付けられている。なお、デフォルトの累積ヒストグラムそれぞれは、周波数毎の累積ヒストグラムから構成されている。なお、図2に示した例は一例であり、車両の状態は、これに限られない。例えば、パワーウィンドが開いている割合毎にデフォルトの累積ヒストグラムが対応付けられていてもよく、車両の走行速度毎にデフォルトの累積ヒストグラムが対応付けられていてもよい。
図1に戻って、音響強調装置1の説明を続ける。
ノイズ推定部17は、パワー算出部171、雑音推定部172、およびヒストグラム更新部173を備える。
パワー算出部171は、音源分離部14が出力した音源毎の音声信号y(t)を、周波数領域で表された複素入力スペクトルY(k,l)に変換する。なお、kは、周波数を表すインデックスである。lは、各フレームを表すインデックスである。例えば、パワー算出部171は、音響信号y(t)について、例えば、フレームl毎に離散フーリエ変換(DFT:Discrete Fourier Transform)を行う。パワー算出部171は、音響信号y(t)に窓関数(例えば、ハミング窓)を乗算して、窓関数が乗算された音声信号について周波数領域で表された複素入力スペクトルY(k,l)に変換してもよい。
パワー算出部171は、複素入力スペクトルY(k,l)に基づいてパワースペクトル|Y(k,l)|を音源毎に算出する。以下の説明では、パワースペクトルを単にパワーと呼ぶことがある。ここで、|…|は、複素数…の絶対値を示す。パワー算出部171は、算出した音源毎のパワースペクトル|Y(k,l)|を雑音推定部172、ヒストグラム更新部173、および音声強調部18に出力する。
雑音推定部172は、パワー算出部171から入力された音源毎のパワースペクトル|Y(k,l)|に含まれる雑音成分のパワースペクトルλ(k,l)を、ヒストグラム更新部173によって更新された累積ヒストグラムを用いて音源毎に算出する。以下の説明では、雑音パワースペクトルλ(k,l)を雑音パワーλ(k,l)と呼ぶことがある。雑音推定部172は、例えば、HRLE(Histogram−based Recursive Level Estimation)法(例えば、参考文献1参照)によって、累積ヒストグラムを用いて雑音パワーλ(k,l)を周波数毎に算出する。雑音推定部172は、算出した音源毎の雑音パワーλ(k,l)を音声強調部18に出力する。HRLE法では、対数領域におけるパワースペクトル|Y(k,l)|のヒストグラムを周波数毎に算出し、その累積分布と予め定めた閾値Sに基づいて雑音パワーλ(k,l)を周波数毎に算出する。HRLE法を用いて雑音パワーλ(k,l)を算出する処理については後述する。
[参考文献1]ロボット聴覚〜高雑音下でのハンズフリー音声認識〜」、中臺一博、奥乃博、電子情報通信学会、信学技報、2011
ヒストグラム更新部173は、車両状態監視部15が出力したリセット指示に応じて、雑音推定に用いる周波数毎の累積ヒストグラムをリセットする。続けて、ヒストグラム更新部173は、リセット指示に含まれている車両の状態に応じたデフォルトの周波数毎の累積ヒストグラムをヒストグラム記憶部16から読み出して、雑音推定に用いる周波数毎の累積ヒストグラムを変更する。また、ヒストグラム更新部173は、車両の状態が変化しない期間、パワー算出部171が出力するパワースペクトルを用いて、周波数毎の累積ヒストグラムそれぞれの更新を行う。なお、累積ヒストグラムについては後述する。
音声強調部18は、パワー算出部171が出力したパワースペクトル|Y(k,l)|から、ノイズ推定部17が出力した雑音パワーλ(k,l)を周波数毎に減算または減算に相当する演算を行うことで、雑音成分を抑圧した音声信号のスペクトル(複素雑音除去スペクトル)を算出する。これにより、音声強調部18は、音源分離処理では分離しきれない、例えば拡散性雑音などの雑音成分を音声信号に対して抑圧する。
音声強調部18は、例えばパワースペクトル|Y(k,l)|と雑音パワーλ(k,l)とを用いて、利得GSS(k,l)を、例えば次式(1)を用いて算出する。
Figure 2017009657
式(1)において、max(α,β)は、実数αとβのうち大きい方の数を与える関数を示す。βは、予め定めた利得GSS(k,l)の最小値である。ここで、関数maxの左側(実数αの側)は、フレームlにおける周波数kに係る雑音成分が除去されたパワースペクトル|Y(k,l)|−λ(k,l)の、雑音が除去されていないパワースペクトル|Y(k,l)|の比に対する平方根を示す。音声強調部18は、パワー算出部171が出力した複素入力スペクトルY(k,l)に、算出した利得GSS(k,l)を乗算して複素雑音除去スペクトルX’(k,l)を算出する。つまり、複素雑音除去スペクトルX’(k,l)は、複素入力スペクトルY(k,l)からその雑音成分を示す雑音パワーが減算(抑圧)された複素スペクトルを示す。音声強調部18は、算出した複素雑音除去スペクトルX’(k,l)を時間領域の雑音除去信号x’(t)に変換する。ここで、音声強調部18は、フレームl毎に複素雑音除去スペクトルX’(k,l)に対して、例えば逆離散フーリエ変換(Inverse Discrete Fourier Transform、IDFT)を行って、雑音除去信号x’(t)を算出する。音声強調部18は、変換した雑音除去信号x’(t)を音声区間検出部19に出力する。なお、雑音除去信号x’(t)は、音響信号y(t)からノイズ推定部17で推定された雑音成分が所定の抑圧量で抑圧された音響信号である。
なお、音声強調部18は、スペクトル減算を行うことによって、雑音成分を抑圧するようにしてもよい。この場合、音源分離部14は、周波数毎に分離された音声信号を音声強調部18に出力する。そして、音声強調部18は、音源分離部14が出力した音声信号から、ノイズ推定部17が出力した雑音パワーλ(k,l)を周波数毎にスペクトル減算を行って、雑音除去信号x’(t)を算出するようにしてもよい。
音声区間検出部19は、音声強調部18が出力した雑音除去信号x’(t)から、有音区間であるフレームを検出する。音声区間検出部19は、検出した有音区間であるフレームの雑音除去信号x’(t)を音声認識部20に出力する。
音声認識部20は、音声区間検出部19が出力した雑音除去信号x’(t)について音声認識処理を行い、発話内容、例えば音韻列や単語を認識する。音声認識部20は、例えば、音響モデルである隠れマルコフモデル(HMM:Hidden Markov Model)と単語辞書を備える。音声認識部20は、補助雑音付加信号x’(t)について音響特徴量、例えば、静的メル尺度対数スペクトル(MSLS:Mel−Scale Log Spectrum)、デルタMSLS及び1個のデルタパワーを、所定時間(例えば、10ms)毎に算出する。音声認識部20は、算出した音響特徴量から音響モデルを用いて音韻を定め、定めた音韻からなる音韻列から単語辞書を用いて単語を認識する。音声認識部20は、認識した認識結果を外部装置(不図示)に出力する。外部装置は、例えばカーナビゲーションシステム等である。
なお、上述した例では、話者が1人の例を説明したが、これに限られない。話者が複数の場合、音源定位部13、音源分離部14、ノイズ推定部17、音声強調部18、音声区間検出部19、および音声認識部20は、話者毎に上述した処理を行う。
また、上述した例では、音声区間検出部19が、有音区間を検出する例を説明したが、有音区間を検出しなくてもよい。この場合、音声強調部18は、雑音除去信号x’(t)を音声認識部20に出力するようにしてもよい。
また、音声認識部20は、音声強調部18が出力した雑音除去信号x’(t)から、音響特徴量である例えばMSLSを抽出するようにしてもよい。なお、MSLSは、音響認識の特徴量としてスペクトル特徴量を用い、MFCC(メル周波数ケプストラム係数;Mel Frequency Cepstrum Coefficient)を逆離散コサイン変換することによって得られる。音声認識部20は、抽出した音響特徴量に基づいて、音声認識するようにしてもよい。
<音響強調装置1が行う処理手順>
次に、音響強調装置1が行う処理手順の例を説明する。
図3は、本実施形態に係る音響強調装置1が行う処理のフローチャートである。
(ステップS1)音響信号取得部12は、収音部11のN個のマイクロホン101によって収録されたN個の音響信号を取得する。
(ステップS2)音源定位部13は、音響信号取得部12から入力されたN個の音響信号に対して、自部に記憶されている伝達関数と、例えばMUSIC法を用いて音源定位を行う。
(ステップS3)音源分離部14は、自部に記憶されている伝達関数のうち、取得した方位角に対応する伝達関数を読み出す。続けて、音源分離部14は、読み出した伝達関数と、音源分離部14は、取得したN個の音響信号から、例えばGHDSS−AS法を用いて音声信号を分離する。
(ステップS4)ノイズ推定部17は、車両状態監視部15が出力したリセット指示に応じて変更したデフォルトの累積ヒストグラムを用いて、音声信号に含まれる雑音成分の雑音パワーλ(k,l)を周波数毎に推定する。
(ステップS5)音声強調部18は、パワー算出部171が出力したパワースペクトル|Y(k,l)|から、ノイズ推定部17が出力した雑音パワーλ(k,l)を、分離された音声信号毎かつ周波数毎に減算または減算に相当する演算を行うことで、雑音成分を抑圧した雑音除去信号x’(t)を算出する。これにより、音声強調部18は、音声信号に対して雑音成分を抑圧する。
(ステップS6)音声区間検出部19は、有音区間であるフレームの雑音除去信号x’(t)を音声認識部20に出力する。続けて、音声認識部20は、音声区間検出部19が出力した有音区間であるフレームの雑音除去信号x’(t)を用いて、周知技術によって音声認識する。
音響強調装置1は、例えば、車両2のイグニッションキーがオン状態の間、以上の処理をフレーム毎に行う。
<ヒストグラム、累積ヒストグラム>
次に、ノイズ推定部17が用いるヒストグラム、累積ヒストグラムについて説明する。
雑音推定部172は、上述したようにHRLE法を用いて雑音パワーλ(k,l)を算出する。HRLE法は、ある周波数について、パワー毎の頻度を計数してヒストグラムを生成し、生成したヒストグラムにおいて計数した頻度をパワーについて累積した累積頻度を算出し、予め定めた閾値Sを与えるパワーを雑音パワーと定める方法である。この閾値Sは、収録された音響信号に含まれる背景雑音の雑音パワーを定める変数、言い換えれば音声強調部18で減算(抑圧)される雑音成分の抑圧量を制御するための制御変数である。従って、閾値Sが大きいほど、推定される雑音パワーが大きくなり、閾値Sが小さいほど、推定される雑音パワーが小さくなる。
図4は、本実施形態に係るヒストグラム更新部173によって作成される雑音成分と発話のパワーレベルとの差が大きい場合のヒストグラムと累積ヒストグラムを説明する図である。図4のヒストグラムg101において、横軸はパワーレベルL[dB]であり、縦軸はパワーレベルの個数(頻度ともいう)N(L)である。
ヒストグラムg101に示す例において、Lは、パワーレベルの最小値を表し、L100は、パワーレベルの最大値を表している。例えば、車両2のパワーウィンドが閉められ、かつドアが閉められ、ブレーキが走行状態である車両の状態では、ヒストグラムg101に示すように、雑音成分(以下、単に雑音ともいう)と発話のパワーレベルとの差が大きい。また、ヒストグラムg101は、パワーの区間毎かつ周波数毎の頻度を示す。頻度は、所定の時間におけるフレーム毎に、算出されたパワー(スペクトル)があるパワーの区間に属すると判定された回数であり、度数とも呼ばれる。
ヒストグラム更新部173は、生成したヒストグラムをリセット指示が入力されるまで逐次累積することで、図4の累積ヒストグラムg102を生成する。累積ヒストグラムg102において、横軸はパワーレベルL[dB]であり、縦軸は累積したパワーレベルの個数(累積頻度ともいう)S(L)である。また、Lのxは、累積ヒストグラムg102の横軸上の位置を表す。また、累積ヒストグラムg102に示す累積頻度S(L)は、パワーの区間毎に、ヒストグラムg101に示す頻度を最も左側に示されている区間から順次累積した値である。累積頻度S(L)は、累積度数とも呼ばれる。
なお、閾値Sは、累積ヒストグラムにおいて累積頻度の最大値Smaxに対する所定の比率(例えばx/100)であってもよい。この場合、ヒストグラム更新部173は、所定の比率の累積頻度に対応するパワーの大きさL(t)に基づいて、推定ノイズパワーを算出するようにしてもよい。
図5は、本実施形態に係るヒストグラム更新部173によって作成される雑音成分と発話のパワーレベルとの差が小さい場合のヒストグラムと累積ヒストグラムを説明する図である。図5のヒストグラムg111における横軸と縦軸は図4のヒストグラムg101と同様であり、累積ヒストグラムg112における横軸と縦軸は図4のヒストグラムg102と同様である。
パワーウィンドが開いている車両の状態では、図5のヒストグラムg111のように、パワーウィンドが閉じているときより、雑音のパワーレベルが大きくなるので、雑音成分と発話のパワーレベルとの差が小さい。
なお、図4の累積ヒストグラムg102、図5の累積ヒストグラムg112は1つの周波数について示したものであり、車両の状態毎に、周波数毎の累積ヒストグラムが、車両の状態に対応付けられてヒストグラム記憶部16に記憶されている。このような累積ヒストグラムは、車両の状態毎かつ周波数毎に予め測定して、測定の結果を用いて生成され、生成された累積ヒストグラムを車両の状態毎かつ周波数毎にヒストグラム記憶部16に記憶させておく。
ここで、車両の状態が変化した場合の例を説明する。
例えば、パワーウィンドが閉じられている状態から、パワーウィンドが開けられた状態に変化したとき、雑音のパワーレベルが大きくなる。これにより、累積ヒストグラムの形状が図4のg102から図5のg112のように変化し、雑音と発話とを分けるための閾値Sの値も変化する。しかしながら、パワーウィンドが開けられた状態に変化した後に、パワーウィンドが閉じられている状態の累積ヒストグラムを更新しながら用いた場合は、累積ヒストグラムが適切ではなくなり、閾値Sの値も適切ではなくなるため、適切に雑音成分のパワーレベルを推定することが困難になる。
このため、本実施形態では、車両の状態が変化したとき、雑音成分を推定するために用いる累積ヒストグラムをリセットし、ヒストグラム記憶部16に記憶されている車両の状態に対応付けられているデフォルトの累積ヒストグラムに変更する。これにより、車両の状態が変化した場合であっても、雑音成分のパワーを適切に推定することができる。なお、累積ヒストグラムは、周波数毎に変更される。
なお、車両の状態が複数の場合、ヒストグラム更新部173は、自部に記憶されている優先度に応じて、車両の状態のうちの1つを選択するようにしてもよい。
例えば、ブレーキが発進の状態、ドアが閉じている状態、パワーウィンドが開いている状態の場合、パワーウィンドが開いていることによって雑音成分が増加するため、ヒストグラム更新部173は、複数の車両の状態を示す情報のうち、パワーウィンドが開いている情報に応じたデフォルト1の累積ヒストグラムを選択する。このように、雑音成分に与える影響が最も高い車両の状態の優先度を高く設定しておいてもよい。
または、車両の状態の組み合わせ毎に、デフォルトの累積ヒストグラム、雑音成分と発話のパワーの大小関係、および閾値Sを対応付けてヒストグラム記憶部16に記憶させておいてもよい。
<ノイズ推定処理>
次に、図3のステップS4において、雑音推定部172およびヒストグラム更新部173が行うノイズ推定処理について説明する。
なお、以下の説明において、式の簡素化のため周波数を省略して説明するが、パラメータを除く変数は周波数の関数であり、周波数毎に独立して同じ処理が行われる。また、雑音推定部172は、車両状態監視部15からリセット指示が入力されたのち、次のリセット指示が入力されるまで、以下の処理を繰り返す。
図6は、本実施形態に係るノイズ推定部17の処理手順を表す図である。
(ステップS101)ヒストグラム更新部173は、パワー算出部171から入力されたパワースペクトル|Y(k,l)|に基づき対数スペクトルY(k,l)を、次式(2)によって算出する。
Figure 2017009657
(ステップS102)ヒストグラム更新部173は、対数スペクトルY(k,l)が属するインデックスI(k、l)を次式(3)によって定める。なお、ヒストグラム更新部173は、パワーからインデクスへの変換を、計算量を削減するため変換テーブルを使用して行うようにしてもよい。
Figure 2017009657
なお、式(3)において、floor(…)は、実数…、又は…よりも小さい最大の整数を与える床関数(floor function)である。Lminは、予め定められた対数スペクトルY(k,l)の最小レベルを表す。Lstepは、ビン(bin)一つ分のレベル幅を表し、予め定められた階級毎のレベル幅を表す。
(ステップS103)ヒストグラム更新部173は、次式(4)によって、ヒストグラムの各頻度N(t、i)を算出する。
Figure 2017009657
式(4)において、αは、時間減衰係数(time decay parameter)である。ここで、α=1−{1/(Tr・Fs)}である。ここで、Trは、予め定めた時定数(time constant)であり、Fsは、サンプリング周波数である。δ(…)は、ディラックのデルタ関数(Dirac’s delta function)である。即ち、度数N(k,l,i)は、前フレームl−1における階級I(k,l)に対する度数N(k,l−1,i)にαを乗じて減衰させた値に、1−αを加算して得られる。これにより、階級I(k,l)に対する度数N(k,l,I(k,l))が加算される。
(ステップS104)ヒストグラム更新部173は、最下位の階級0から階級iまで度数N(k,l,i)を加算して、累積度数S(k,l,i)を次式(5)によって算出することによって、累積ヒストグラムを生成、更新する。
Figure 2017009657
このようにして作成された累積ヒストグラムは、データの古さにしたがって重みが小さくなるように構成されている。
(ステップS105)雑音推定部172は、車両の状態に応じた閾値Sを、ヒストグラム記憶部16から読み出す。続けて、雑音推定部172は、閾値Sに対応する累積度数S(k,l,Imax)・Sに最も近似する累積度数S(k,l,i)を与える階級iを、推定階級I(k,l)として次式(6)のように定める。なお、閾値Sの値は、車両の状態が異なっていても同じ値であってもよい。
Figure 2017009657
式(6)において、arg min[…]は、…を最小とするiを与える関数である。
(ステップS106)雑音推定部172は、車両の状態に応じて、ヒストグラム記憶部16に記憶されている雑音成分と発話のパワーの大小関係を読み出す。続けて、雑音推定部172は、次式(7)によって、推定階級I(k,l)を対数レベルλHRLE(k,l)に換算する。
Figure 2017009657
(ステップS107)雑音推定部172は、次式(8)によって、線形領域に変換して雑音パワーλ(k,l)を算出する。
Figure 2017009657
なお、上述した例では、ステップS103でヒストグラムを計算した後に、ステップS104で累積ヒストグラムを計算する例を説明したが、これに限られない。ヒストグラム更新部173は、ステップS103の処理を行わずに、ステップS104において、式(5)に式(4)を代入して直接、累積ヒストグラムを計算、更新するようにしてもよい。
また、パラメータLmin、Lstep、Imaxそれぞれの値は、例えば−100dB、0.2dB、1000である。また、時程数Tは、例えば10秒である。これらのパラメータは、デフォルトの累積ヒストグラム毎に異なっていてもよい。
<累積ヒストグラムのリセット、変更、更新の処理手順>
次に、ヒストグラム更新部173が行う累積ヒストグラムのリセット、変更、更新の処理手順について説明する。
図7は、本実施形態に係るヒストグラム更新部173が行う累積ヒストグラムのリセット、変更、更新の処理のフローチャートである。
(ステップS201)ヒストグラム更新部173は、リセット指示が車両状態監視部15から入力されたか否かを判別する。ヒストグラム更新部173は、リセット指示が入力された判別した場合(ステップS201;YES)、ステップS202に処理を進め、リセット指示が入力されていないと判別した場合(ステップS201;NO)、ステップS201の処理を繰り返す。
(ステップS202)ヒストグラム更新部173は、累積ヒストグラムをリセットする。
(ステップS203)ヒストグラム更新部173は、リセット指示に含まれる車両の状態に応じたデフォルトの累積ヒストグラムを、ヒストグラム記憶部16から読み出す。続けて、ヒストグラム更新部173は、雑音成分の推定に用いる累積ヒストグラムを読み出したデフォルトの累積ヒストグラムに変更する。
(ステップS204)ヒストグラム更新部173は、分離された音声信号に基づいて、ステップS203で変更された累積ヒストグラムを更新する。
(ステップS205)ヒストグラム更新部173は、リセット指示が車両状態監視部15から入力されたか否かを判別する。ヒストグラム更新部173は、リセット指示が入力された判別した場合(ステップS205;YES)、ステップS202に処理を戻し、リセット指示が入力されていないと判別した場合(ステップS205;NO)、ステップS204に処理を戻す。
なお、ヒストグラム更新部173は、例えばフレーム毎にステップS201〜S205の処理を逐次行う。
<車両の状態に応じた累積ヒストグラムをリセット、変更、更新するタイミングの例>
次に、車両の状態に応じた累積ヒストグラムをリセット、変更、更新するタイミングの具体例を説明する。
図8は、本実施形態に係る車両の状態に応じた累積ヒストグラムをリセット、変更、更新するタイミングを説明するための図である。図8において、横軸は時刻を表す。
図8に示す例では、時刻t1のときドアが開けられ、時刻t2のときドアが閉められ、時刻t3のときに車両2が発進された例である。
時刻t1において、ヒストグラム更新部173は、車両状態監視部15が出力したリセット指示に応じて、周波数毎の累積ヒストグラムをリセットする。続けて、ヒストグラム更新部173は、車両状態監視部15が出力したリセット指示に含まれる車両の状態を示す情報に応じて、ヒストグラム記憶部16からデフォルト1(図2)の周波数毎の累積ヒストグラムを読み出し、読み出したデフォルト1の周波数毎の累積ヒストグラムに変更する。
時刻t1〜t2の期間、ヒストグラム更新部173は、分離された音声信号に基づいて、デフォルト1の周波数毎の累積ヒストグラムを更新する。雑音推定部172は、更新されたデフォルト1の周波数毎の累積ヒストグラムを用いて、雑音成分のパワーレベルを周波数毎に推定する。
時刻t2において、ヒストグラム更新部173は、車両状態監視部15が出力したリセット指示に応じて、周波数毎の累積ヒストグラムをリセットする。続けて、ヒストグラム更新部173は、車両状態監視部15が出力したリセット指示に含まれる車両の状態を示す情報に応じて、ヒストグラム記憶部16からデフォルト2(図2)の周波数毎の累積ヒストグラムを読み出し、周波数毎の累積ヒストグラムをデフォルト1からデフォルト2に変更する。
時刻t2〜t3の期間、ヒストグラム更新部173は、分離された音声信号に基づいて、デフォルト2の周波数毎の累積ヒストグラムを更新する。雑音推定部172は、更新されたデフォルト2の周波数毎の累積ヒストグラムを用いて、雑音成分のパワーレベルを周波数毎に推定する。
時刻t3において、ヒストグラム更新部173は、車両状態監視部15が出力したリセット指示に応じて、周波数毎の累積ヒストグラムをリセットする。続けて、ヒストグラム更新部173は、車両状態監視部15が出力したリセット指示に含まれる車両の状態を示す情報に応じて、ヒストグラム記憶部16からデフォルト6(図2)の周波数毎の累積ヒストグラムを読み出し、周波数毎の累積ヒストグラムをデフォルト2からデフォルト6に変更する。
時刻t3以降、次にリセット指示が入力されるまで、ヒストグラム更新部173は、分離された音声信号に基づいて、デフォルト6の周波数毎の累積ヒストグラムを更新する。雑音推定部172は、更新されたデフォルト6の周波数毎の累積ヒストグラムを用いて、雑音成分のパワーレベルを周波数毎に推定する。
このように雑音成分を抑圧した音響信号に対して音声認識された認識結果を、例えばカーナビゲーションシステムに出力することで、雑音抑圧された音声信号を用いて、カーナビゲーションの動作を制御することができる。
以上のように、本実施形態の音響強調装置1は、音響信号を収音する収音部11と、車両の状態を監視する車両状態監視部15と、収音部によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定するノイズ推定部17と、収音された音響信号から、ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調部18と、を備え、ノイズ推定部は、車両状態監視部によって監視された結果に基づいて、累積ヒストグラムをリセットする。
この構成によって、本実施形態の音響強調装置1は、車両の状態を監視した結果に基づいて、ノイズ推定に用いていた累積ヒストグラムをリセットする。これにより、本実施形態の音響強調装置1は、車両の状態に応じて、例えばイグニッションキーによって車両2の電源がオン状態になったとき、リセットされた累積ヒストグラムを用いてノイズ推定を行うことで、過去に更新された累積ヒストグラムの影響を受けない。この結果、本実施形態の音響強調装置1では、車両の状態が変化する場合であっても雑音抑圧を適切に行うことができる。
また、本実施形態の音響強調装置1において、ノイズ推定部17は、車両状態監視部15によって監視された結果が変化したとき、累積ヒストグラムをリセットする。
この構成によって、本実施形態の音響強調装置1は、本実施形態の音響強調装置1は、車両の状態が変化した場合に、ノイズ推定に用いていた累積ヒストグラムをリセットする。これにより、本実施形態の音響強調装置1は、車両の状態が変化したとき、車両の状態が変化する前の累積ヒストグラムを用いずにリセットされた累積ヒストグラムを用いてノイズ推定を行う。この結果、本実施形態の音響強調装置1では、車両2内のノイズ状態が変化する環境においても雑音抑圧を適切に行うことができる。
また、本実施形態の音響強調装置1は、車両の状態毎の累積ヒストグラムが記憶されているヒストグラム記憶部16を備え、ノイズ推定部17は、リセットした後、車両状態監視部15によって監視された結果に基づいて、ヒストグラム記憶部から車両の状態に応じた周波数成分毎の累積ヒストグラム(デフォルト1、2、・・・)を読み出し、読み出した周波数成分毎の累積ヒストグラムを用いて周波数成分毎に雑音成分を推定する。
この構成によって、本実施形態の音響強調装置1は、車両の状態に応じた累積ヒストグラムを用いて雑音成分を推定するので、車両2内のノイズ状態が変化する環境においても雑音抑圧を適切に行うことができる。また、本実施形態の音響強調装置1では、車両の状態が変化したとき、ヒストグラムから累積ヒストグラムを新たに生成することなく、ヒストグラム記憶部16に予め記憶されている車両の状態毎の累積ヒストグラムを用いてノイズ推定を行うことができる。この結果、本実施形態の音響強調装置1では、環境が変化したときであっても、ヒストグラム記憶部に記憶されている累積ヒストグラムを用いて、直ちに雑音抑圧を適切に行うことができる。
また、本実施形態の音響強調装置1において、ヒストグラム記憶部16には、車両の状態に、前記累積ヒストグラムにおける雑音成分を判別するための閾値Sが対応付けられ、ノイズ推定部17は、ヒストグラム記憶部に記憶されている閾値を用いて、周波数成分毎に雑音成分を推定する。
この構成によって、本実施形態の音響強調装置1は、車両の状態毎に予め定められている閾値Sを用いて、雑音成分のパワーを適切に推定することができる。この結果、本実施形態の音響強調装置1では、雑音と発話のパワーの大小関係が変化したときであっても、雑音抑圧を適切に行うことができる。
また、本実施形態の音響強調装置1において、累積ヒストグラムがリセットされる車両の状態は、車両2が発進および停止のうち、少なくとも1つが行われたときである。
また、本実施形態の音響強調装置1において、累積ヒストグラムがリセットされる車両の状態は、車両2のドアの開閉があったときである。
また、本実施形態の音響強調装置1において、累積ヒストグラムをリセットされる車両の状態は、車両2の窓の開閉があったときである。
この構成によって、本実施形態の音響強調装置1は、車両2が発進、停止、ドアが開閉、窓が開閉されたうちの少なくとも1つのとき、累積ヒストグラムをリセットして、雑音成分を推定する。この結果、本実施形態の音響強調装置1では、車両の状態によって車両2内の雑音成分の大小関係が変化する環境においても雑音抑圧を適切に行うことができる。
また、本実施形態では、車両の状態毎かつ周波数毎に1つの累積ヒストグラムがヒストグラム記憶部16に記憶されている例を説明したが、これに限られない。例えば、運転席に対応する第1の累積ヒストグラムと、助手席に対応する累積ヒストグラムとが、ヒストグラム記憶部16に記録されていてもよい。これにより、運転席または助手席に着席している人に合わせて、雑音成分を最適に抑圧することができる。
なお、本実施形態では、音響強調装置1が車両2に取り付けられている例を説明したが、これに限られない。雑音成分と発話のパワーの関係が変化する環境であればよく、例えば列車、飛行機、船舶、家の部屋、店舗等に音響強調装置1を適用することも可能である。
例えば、店舗に適用した場合、店舗のドアの開閉によって雑音成分のパワーが変化する。このような環境であっても、本実施形態によれば、雑音成分の大小関係が変化する環境においても雑音抑圧を適切に行うことができる。
また、例えば、部屋毎に雑音成分が異なる家の部屋に適用した場合、部屋毎に累積ヒストグラムをヒストグラム記憶部16に記憶させてあるので、各部屋に適した雑音抑圧を行うことができる。これにより、本実施形態によれば、適切に雑音抑圧された音響信号を用いて、家の中で、例えば家電機器の制御を行うことができる。
また、本実施形態の音響強調装置1の一部または全ての構成要素を、スマートフォン、携帯端末、携帯ゲーム機器等によって実現してもよい。また、音響強調装置1が通信機能を有する場合、例えば、ヒストグラム記憶部16は、ネットワークを介したサーバ装置に格納されていてもよい。
なお、本発明における音響強調装置1の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより雑音成分の推定、音声強調等を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。
また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよい。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であってもよい。
1…音響強調装置、2…車両、11…収音部、12…音響信号取得部、13…音源定位部、14…音源分離部、15…車両状態監視部、16…ヒストグラム記憶部、17…ノイズ推定部、18…音声強調部、19…音声区間検出部、20…音声認識部、201…ECU、202…CAN、171…パワー算出部、172…雑音推定部、173…ヒストグラム更新部

Claims (8)

  1. 音響信号を収音する収音部と、
    車両の状態を監視する車両状態監視部と、
    前記収音部によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定するノイズ推定部と、
    前記収音された音響信号から、前記ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調部と、
    を備え、
    前記ノイズ推定部は、
    前記車両状態監視部によって監視された結果に基づいて、前記累積ヒストグラムをリセットする音声強調装置。
  2. 前記ノイズ推定部は、
    前記車両状態監視部によって監視された結果が変化したとき、前記累積ヒストグラムをリセットする請求項1に記載の音声強調装置。
  3. 前記車両の状態毎の前記累積ヒストグラムが記憶されているヒストグラム記憶部を備え、
    前記ノイズ推定部は、
    前記リセットした後、前記車両状態監視部によって監視された結果に基づいて、前記ヒストグラム記憶部から前記車両の状態に応じた周波数成分毎の前記累積ヒストグラムを読み出し、読み出した周波数成分毎の前記累積ヒストグラムを用いて周波数成分毎に雑音成分を推定する請求項1または請求項2に記載の音声強調装置。
  4. 前記ヒストグラム記憶部には、
    前記車両の状態に、前記累積ヒストグラムにおける雑音成分を判別するための閾値が対応付けられ、
    前記ノイズ推定部は、
    前記ヒストグラム記憶部に記憶されている前記閾値を用いて、周波数成分毎に雑音成分を推定する請求項3に記載の音声強調装置。
  5. 前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両が発進および停止のうち、少なくとも1つが行われたときである請求項1から請求項4のいずれか1項に記載の音声強調装置。
  6. 前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両のドアの開閉があったときである請求項1から請求項4のいずれか1項に記載の音声強調装置。
  7. 前記累積ヒストグラムがリセットされる前記車両の状態は、前記車両の窓の開閉があったときである請求項1から請求項4のいずれか1項に記載の音声強調装置。
  8. 収音部が、音響信号を収音する収音手順と、
    車両状態監視部が、車両の状態を監視する車両状態監視手順と、
    ノイズ推定部が、前記収音手順によって収音された音響信号のパワーの頻度を累積した周波数成分毎の累積ヒストグラムを用いて、周波数成分毎に雑音成分を推定し、前記車両状態監視手順によって監視された結果に基づいて、前記累積ヒストグラムをリセットするノイズ推定手順と、
    音声強調部が、前記収音手順によって収音された音響信号から、前記ノイズ推定部によって推定された周波数成分毎の雑音成分を抑圧する音声強調手順と、
    を含む音声強調方法。
JP2015122045A 2015-06-17 2015-06-17 音声強調装置、および音声強調方法 Active JP6439174B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015122045A JP6439174B2 (ja) 2015-06-17 2015-06-17 音声強調装置、および音声強調方法
US15/173,922 US9875755B2 (en) 2015-06-17 2016-06-06 Voice enhancement device and voice enhancement method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015122045A JP6439174B2 (ja) 2015-06-17 2015-06-17 音声強調装置、および音声強調方法

Publications (2)

Publication Number Publication Date
JP2017009657A true JP2017009657A (ja) 2017-01-12
JP6439174B2 JP6439174B2 (ja) 2018-12-19

Family

ID=57588282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015122045A Active JP6439174B2 (ja) 2015-06-17 2015-06-17 音声強調装置、および音声強調方法

Country Status (2)

Country Link
US (1) US9875755B2 (ja)
JP (1) JP6439174B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10140089B1 (en) * 2017-08-09 2018-11-27 2236008 Ontario Inc. Synthetic speech for in vehicle communication
KR102327441B1 (ko) * 2019-09-20 2021-11-17 엘지전자 주식회사 인공지능 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10319985A (ja) * 1997-03-14 1998-12-04 N T T Data:Kk ノイズレベル検出方法、システム及び記録媒体
JP2010016564A (ja) * 2008-07-02 2010-01-21 Panasonic Corp 音声信号処理装置
JP2012088404A (ja) * 2010-10-15 2012-05-10 Honda Motor Co Ltd ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8249271B2 (en) * 2007-01-23 2012-08-21 Karl M. Bizjak Noise analysis and extraction systems and methods
US20100239110A1 (en) * 2009-03-17 2010-09-23 Temic Automotive Of North America, Inc. Systems and Methods for Optimizing an Audio Communication System

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10319985A (ja) * 1997-03-14 1998-12-04 N T T Data:Kk ノイズレベル検出方法、システム及び記録媒体
JP2010016564A (ja) * 2008-07-02 2010-01-21 Panasonic Corp 音声信号処理装置
JP2012088404A (ja) * 2010-10-15 2012-05-10 Honda Motor Co Ltd ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法

Also Published As

Publication number Publication date
US9875755B2 (en) 2018-01-23
JP6439174B2 (ja) 2018-12-19
US20160372132A1 (en) 2016-12-22

Similar Documents

Publication Publication Date Title
JP5666444B2 (ja) 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法
JP5528538B2 (ja) 雑音抑圧装置
JP4532576B2 (ja) 処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラム
JP6169849B2 (ja) 音響処理装置
JP5127754B2 (ja) 信号処理装置
JP6169910B2 (ja) 音声処理装置
JP5156043B2 (ja) 音声判別装置
JP6077957B2 (ja) 音声処理装置、音声処理方法、及び音声処理プログラム
JP2021503633A (ja) 音声ノイズ軽減方法、装置、サーバー及び記憶媒体
JP5387459B2 (ja) 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム
JP5649488B2 (ja) 音声判別装置、音声判別方法および音声判別プログラム
JP5566846B2 (ja) ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法
JP2004347761A (ja) 音声認識装置、音声認識方法、該音声認識方法をコンピュータに対して実行させるためのコンピュータ実行可能なプログラムおよび記憶媒体
KR102152197B1 (ko) 음성 검출기를 구비한 보청기 및 그 방법
KR102206546B1 (ko) 잡음 환경 분류 및 제거 기능을 갖는 보청기 및 그 방법
JP6439174B2 (ja) 音声強調装置、および音声強調方法
JPH11305792A (ja) 収音装置,音声認識装置,これらの方法、及びプログラム記録媒体
JP2012181561A (ja) 信号処理装置
JP2009276365A (ja) 処理装置、音声認識装置、音声認識システム、音声認識方法
KR20070061216A (ko) Gmm을 이용한 음질향상 시스템
CN112133320A (zh) 语音处理装置及语音处理方法
JP2023172553A (ja) 音響信号処理装置、音響信号処理方法及びプログラム
Kamaraju et al. Speech Enhancement Technique Using Eigen Values

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171129

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181005

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181023

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181029

R150 Certificate of patent or registration of utility model

Ref document number: 6439174

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150