JP6451143B2 - 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム - Google Patents

音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム Download PDF

Info

Publication number
JP6451143B2
JP6451143B2 JP2014167743A JP2014167743A JP6451143B2 JP 6451143 B2 JP6451143 B2 JP 6451143B2 JP 2014167743 A JP2014167743 A JP 2014167743A JP 2014167743 A JP2014167743 A JP 2014167743A JP 6451143 B2 JP6451143 B2 JP 6451143B2
Authority
JP
Japan
Prior art keywords
correction
input signal
signal
band
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014167743A
Other languages
English (en)
Other versions
JP2016045249A (ja
Inventor
大 藤枝
大 藤枝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2014167743A priority Critical patent/JP6451143B2/ja
Publication of JP2016045249A publication Critical patent/JP2016045249A/ja
Application granted granted Critical
Publication of JP6451143B2 publication Critical patent/JP6451143B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムに関し、例えば、電話機器(ソフトフォン等を含む)に適用し得るものである。なお、「音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム」とネーミングしているが、本発明が取扱う信号は、音声信号に限定されず、音楽信号等の他の音信号であっても良い。
従来の音声帯域拡張装置として、特許文献1に開示されているものがある。図8は、特許文献1に記載の音声帯域拡張装置を示すブロック図である(特許文献1の図1参照)。
特許文献1に開示されている音声帯域拡張装置700は、ModGI算出手段701、拡張ゲイン算出手段702、サンプリング変換手段703、バンドパスフィルタ(BPF)手段704、全波整流処理手段705、ハイパスフィルタ(HPF)手段706、ゲイン乗算手段707及び拡張信号加算手段708を有する。
次に、特許文献1に開示の音声帯域拡張装置700の動作を簡単に説明する。
ModGI算出手段701及びサンプリング変換手段703には、入力信号が与えられる。入力信号は、低いサンプリング周波数でサンプリングされた音声である。低いサンプリング周波数とは、例えば、音声信号であれば8kHz、音楽信号であれば48kHzなどである。ModGI算出手段701は、周波数特性に関する特徴量の一つであるModGIを入力信号から算出する。ここで、ModGIは、入力信号の2階差分の振幅又はパワーを、入力信号の振幅又はパワーで除した特徴量である。拡張ゲイン算出手段702は、例えば、ModGIを定数倍する方法などにより、ModGIに基づいて拡張ゲインを算出する。サンプリング変換手段703は、入力信号のサンプリング周波数を高いサンプリング周波数に変換する。BPF手段704により、高いサンプリング周波数の入力信号から2kHz〜4kHzの帯域を抽出し、その抽出出力を全波整流処理手段705で全波整流した後、HPF手段706で4kHz以上の成分を抽出することにより、拡張帯域(4kHz〜8kHz)に成分を有する拡張信号を得る。ゲイン乗算手段707は、拡張信号に拡張ゲインを乗じて、調整拡張信号を生成し、拡張信号加算手段708は、高いサンプリング周波数の入力信号と調整拡張信号とを加算して、広帯域化信号を生成する。
特許文献1によれば、拡張帯域の振幅と相関のあるModGIを拡張ゲインの算出に用いることで、広帯域化信号の無声部が聴き取り易くなり、明瞭度を向上させることができるとしている。
特開2014−106337号公報
しかしながら、特許文献1の記載技術では、通信のための帯域制限やノイズキャンセラ等の前処理によって入力信号が変形している場合が考慮されていない。ここで、前処理とは、当該音声帯域拡張装置を搭載している音声通信装置における処理に限定されず、当該音声帯域拡張装置を搭載している音声通信装置へ音声信号を送信する音声通信装置における処理が該当する場合もある。
例えば、当該音声帯域拡張装置への入力信号が帯域制限を受けている場合がある。この場合は、送信前に帯域制限フィルタがかけられ、さらにボコーダを介して音声を受信するため、帯域制限フィルタとボコーダによって当該音声帯域拡張装置への入力信号の周波数特性が、送信しようとしている原信号の周波数特性から変化している可能性が高い。また例えば、前処理として、ノイズキャンセラが適用されている場合がある。ノイズキャンセラは、低い周波数の雑音をより正確に除去できるため、周波数の低い成分が抑圧され易い。このように入力信号が変形していると、算出される拡張ゲインが不適切な値となり、結果として広帯域化音声の音質劣化が引き起こされる。
そのため、入力信号に前処理が施されていても、高音質の広帯域化音声が得られる音声帯域拡張装置及びプログラムが望まれている。また、入力信号に前処理が施されていても、前処理の影響を除外した音声特徴量を得ることができる音声特徴量抽出装置及びプログラムが望まれている。
以上の課題を解決するために、第1の本発明は、入力信号の成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張装置において、(1)上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、(2)抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、(3)上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、(4)上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、(5)上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段とを備えることを特徴とする。
第2の本発明の音声帯域拡張プログラムは、入力信号に成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張プログラムであって、コンピュータを、(1)上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、(2)抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、(3)上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、(4)上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、(5)上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段として機能させることを特徴とする。
第3の本発明は、入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出装置において、(1)上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、(2)抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、(3)上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、(4)上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段とを備えることを特徴とする。
第4の本発明の音声特徴量抽出プログラムは、入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出プログラムであって、コンピュータを、(1)上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、(2)抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、(3)上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、(4)上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段として機能させることを特徴とする。
第1及び第2の本発明によれば、入力信号に前処理が施されていても、高音質の広帯域化音声が得られる。また、第3及び第4の本発明によれば、入力信号に前処理が施されていても、前処理の影響を除外した音声特徴量を得ることができる。
第1の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。 第1の実施形態の音声帯域拡張装置における入力信号補正手段の具体的構成を示すブロック図である。 第1の実施形態の音声帯域拡張装置における広帯域化手段の詳細構成例を示すブロック図である。 第2の実施形態の音声帯域拡張装置における入力信号補正手段の具体的構成を示すブロック図である。 第3の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。 第4の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。 第4の実施形態に係る音声帯域拡張装置における、音声区間での補正情報の修正方法の説明図である。 従来の音声帯域拡張装置の構成を示す機能ブロック図である。
(A)各実施形態に共通する前提
後述する全ての実施形態において、拡張する対象を人間の音声であるとし、入力信号における帯域である入力帯域は0Hz〜4kHz(又は300Hz〜3.4kHz)の帯域を有することを前提とする。しかし、本発明は、これに限定されず、例えば0Hz〜24kHzの帯域を有する音楽信号を帯域拡張対象とする場合こともでき、周波数に関する数値を音楽信号用に設定し直すことで、本発明を適用することができる。
(B)第1の実施形態
以下、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第1の実施形態を、図面を参照しながら説明する。
(B−1)第1の実施形態の構成
図1は、第1の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図である。ここで、第1の実施形態の音声帯域拡張装置は、ハードウェアで構成することも可能であり、また、CPUが実行するソフトウェア(音声帯域拡張プログラム)とCPUとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図1で表すことができる。
第1の実施形態の音声帯域拡張装置100は、図1に示すように、特徴量抽出手段101と、補正情報算出手段102と、入力信号補正手段103と、補正特徴量抽出手段104と、広帯域化手段105とを有する。
ここで、特徴量抽出手段101、補正情報算出手段102、入力信号補正手段103及び補正特徴量抽出手段104でなる部分が、第1の実施形態の音声特徴量抽出装置を構成している。
第1の実施形態の音声帯域拡張装置100に与えられた入力信号(入力音声)は、特徴量抽出手段101及び広帯域化手段105に与えられる。
特徴量抽出手段101は、入力信号を解析して、入力信号の周波数特性に関する少なくとも1つ以上の特徴量を抽出し、得られた特徴量を補正情報算出手段102に与える。特徴量として、例えば、2kHz〜4kHzの帯域の振幅を0Hz〜2kHzの帯域の振幅で除した入力帯域振幅比、特許文献1に記載のModGI、サブバンドパワー等を適用することができる。
補正情報算出手段102は、目標特徴量と、特徴量抽出手段101から与えられた特徴量とを比較して、補正情報を算出し、得られた補正情報を入力信号補正手段103に与える。
目標特徴量は、特徴量抽出手段101で抽出された特徴量の目標となる値であり、予め定められた定数値で与えられる。目標特徴量は、例えば、音声帯域拡張装置100に与えられた入力信号が前処理の影響を受けないとした場合における、特徴量抽出手段101からの特徴量の平均等であり、例えば、前処理が施されていない入力信号を適用したシミュレーション等によって予め決定される。なお、目標特徴量を、ユーザが任意のタイミングで随時指定できるようにしても良い。補正情報は、例えば、補正される周波数と補正量に関する情報で構成されるが、入力信号を補正できる情報であれば、これに限定されるものではない。
以下、補正情報算出手段102が補正情報を算出する方法の具体例を、特徴量が、入力帯域振幅比、ModGI、サブバンドパワーである場合のそれぞれについて説明する。
まず、特徴量として入力帯域振幅比を用いる場合について説明する。入力信号に施される前処理がノイズキャンセラによる処理である場合、入力帯域振幅比は好適な特徴量であり、以下の説明では、前処理がノイズキャンセラによる処理であるとする。
前処理がノイズキャンセラによる処理の場合、前処理によって低い周波数帯域が高い周波数成分よりも強く抑圧されている可能性が高い。そこで、低い周波数帯域の振幅を増大させる補正量を適用して目標特徴量に近付けるようにすれば良い。今、0Hz〜2kHzの帯域の振幅をAlow、2kHz〜4kHzの帯域の振幅をAhigh、補正量をC、入力帯域振幅比の目標特徴量をRtrg、期待値の演算をE{・}で書くこととして、(1)式を満たすような補正量Cを求めるようにすれば、補正量Cを適用して得た後述する補正特徴量を目標特徴量Rtrgに近付けることができる。(1)式は、入力帯域振幅比Ahigh/Alowを補正量候補(補正量)Cで補正した値の期待値と目標特徴量Rtrgとの差の絶対値が最小となるような補正量候補を補正量とすることを表している。なお、補正量Cは、低い周波数帯域の振幅を増大させるものであるので、1以上であるという制約がある。(1)式を満たす補正量Cは(2)式で与えられる。そして、後述する補正処理で、0Hz〜2kHzの帯域の振幅がC倍となるように入力信号を補正すれば良い。なお、実行可能という意味では期待値の算出は必要ないが、期待値でなく瞬時値を用いると、特定の条件下(ここではC≧1が満たされている場合)においては補正後の特徴量が常に目標特徴量と等しくなって、入力信号の時間変化に応じた広帯域化処理(後述)が行えなくなるため、期待値に基づいて補正量を算出することが特に好ましい。
Figure 0006451143
次に、特徴量としてModGIを用いる場合について説明する。入力信号に施される前処理が通信のための帯域制限である場合、ModGIは好適な特徴量であり、以下の説明では、前処理が帯域制限であるとする。
ModGIは、おおよそ、全帯域の振幅のうち高域側の振幅が占める割合を表しているから、ModGIを(3)式に示すように近似することとする。なお、(3)式において、ModGIをM、入力帯域0Hz〜4kHzの振幅をAinで表している。ModGIの目標特徴量をMtrgで書くこととして、(4)式を満たすような補正量Cを求めるようにすれば、補正量Cを適用して得た後述する補正特徴量を目標特徴量Mtrgに近付けることができる。(4)式は、ModGI(の近似値)Mを補正量候補(補正量)Cで補正した値の期待値と目標特徴量Mtrgとの差の絶対値が最小となるような補正量候補を補正量とすることを表している。なお、補正量Cは、入力帯域全体に対する制限を元に復帰させるものであるので、1以上であるという制約がある。(4)式を満たす補正量Cは(5)式で与えられる。そして、後述する補正処理で、2Hz〜4kHzの帯域の振幅がC倍となるように入力信号を補正すれば良い。
Figure 0006451143
最後に、特徴量としてサブバンドパワーを用いる場合について説明する。サブバンドパワーは、入力信号を少なくとも2つ以上のサブバンドに帯域分割し、各サブバンドのパワー(又は振幅)を算出した系列であり、以下では、入力帯域のパワーで正規化したサブバンドパワーの場合を説明する。サブバンドパワーを特徴量として用い、かつ、各サブバンドパワーを目標値と比較すれば、前処理によってどの帯域がどの程度変化させられたのかが分かるので、多様な前処理に対応し得る。
入力帯域0Hz〜4kHzのパワーをPin、サブバンドの番号をk(k=0〜K−1)、サブバンドkのサブバンドパワーをPk、Pinで正規化されたサブバンドkのパワーPk/Pinに対する目標値(目標特徴量)をQk、サブバンドkの補正量をCkで書くこととして、(6)式を満たすような補正量Ckを求めるようにすれば、補正量Ckを適用して得た後述する補正後のサブバンドパワーを目標値Qkに近付けることができる。(6)式は、Pinで正規化されたサブバンドkのパワーPk/Pinを補正量候補(補正量)Ckで補正した値の期待値((6)式では固定値を期待値演算の外に出しているが、意味合いは上述した通りである)と目標値Qkとの差の絶対値が最小となるような補正量候補を補正量とすることを表している。(6)式を満たす補正量Ckは(7)式で与えられる。そして、後述する補正処理で、入力信号を、各サブバンドのパワーがCk倍となるように補正すれば良い。
Figure 0006451143
入力信号補正手段103は、補正情報算出手段102から与えられた補正情報に基づいて入力信号を補正し、得られた補正後の信号を補正特徴量抽出手段104に与える。入力信号補正手段103は、上述した3つの具体例の説明で言及したように、入力信号を補正すれば良い。
上述したように、特徴量が、入力帯域振幅比、ModGI、サブバンドパワーのいずれであっても、入力信号の補正は、その周波数特性の一部又は全てに対するゲインの増減である。そのため、入力信号補正手段103を、図2に示すように、周波数特性(F特)を補正するF特補正手段201を中心要素として実現することができる。F特補正手段201は、補正情報に基づいて入力信号の周波数特性を補正して補正信号を生成する。F特補正手段201における補正方法として、帯域分割して補正の対象となる帯域の振幅又はパワーを補正して再合成する方法など、既存の周波数特性の補正方法を適用することができる。F特補正手段201として、一部の帯域を増幅又は減衰させるイコライジングフィルタは好適である。
以下では、F特補正手段201としてイコライジングフィルタを適用した場合の補正方法の具体例を、特徴量が、入力帯域振幅比、ModGI、サブバンドパワーである場合のそれぞれについて説明する。ノイズキャンセラによる影響を入力帯域振幅比に基づいて補正する場合には、特定の周波数より低い帯域を増幅又は減衰させるローシェルフフィルタ(Low Shelf Filter)と呼ばれるイコライジングフィルタを用いて低域側を増幅させる。帯域制限による影響をModGIに基づいて補正する場合には、特定の周波数より高い帯域を増幅又は減衰させるハイシェルフフィルタ(High Shelf Filter)と呼ばれるイコライジングフィルタを用いて高域側を増幅させる。サブバンドパワーに基づいて補正する場合には、各サブバンドに対応させた(サブバンドの中心周波数でピークに達する周波数特性を有する)ピークフィルタ(Peak Filter)と呼ばれるイコライジングフィルタをサブバンドの数と同じ数だけ用いてサブバンド毎に増幅又は減衰させる。
補正特徴量抽出手段104は、広帯域化に必要となる少なくとも一つ以上の特徴量を補正信号から抽出し、得られた補正特徴量を広帯域化手段105に与える。補正特徴量の具体例については後述する。
広帯域化手段105は、入力信号の拡張帯域に補正特徴量を反映させた適当な成分を追加して帯域を拡張して広帯域化信号を生成して出力する。拡張帯域に成分を追加する方法として、任意の方法(広帯域化方法)を用いることができる。図3は、広帯域化手段105の詳細構成例を示すブロック図であり、この詳細構成例は、拡張帯域に成分を追加するために全波整流を利用している。
図3において、広帯域化手段105は、BPF手段301、全波整流処理手段302、HPF手段303、拡張ゲイン算出手段304、ゲイン調整手段305及び拡張信号加算手段306を有する。ここで、広帯域化手段105に与えられた入力信号は、BPF手段301及び拡張信号加算手段306に与えられ、広帯域化手段105に与えられた補正特徴量は、拡張ゲイン算出手段304に与えられる。
BPF手段301は、入力信号から、バンドパスフィルタリングによって入力帯域の一部の帯域を濾波し、得られた濾波信号を全波整流処理手段302に与える。濾波帯域は限定されるものではないが、例えば、2kHz〜4kHzの帯域が好適である。なお、BPF手段301を省略し、0Hz〜4kHzの帯域を有する入力信号をそのまま全波整流処理手段302に与えるようにしても良い。
全波整流処理手段302は、与えられた濾波信号に対して全波整流処理を施して、得られた全波整流信号をHPF手段303に与える。全波整流処理によって、拡張帯域にも成分を有する信号が得られる。
HPF手段303は、与えられた全波整流信号から、ハイパスフィルタリングによって拡張帯域の全部又は一部の成分を濾波し、得られた拡張信号をゲイン調整手段305に与える。ハイパスフィルタリングによる濾波帯域は、拡張帯域に含まれる帯域であれば良く限定されるものではないが、4kHz〜8kHzの帯域が好適である。なお、HPF手段303に代え、4kHz〜7kHz等の拡張帯域に含まれる帯域を濾波するBPF手段を適用するようにしても良い。
拡張ゲイン算出手段304は、補正特徴量に基づいて拡張ゲインを算出し、ゲイン調整手段305に与える。補正特徴量には、補正信号の周波数特性を表す任意の特徴量を用いることができる。補正特徴量は、広帯域化手段105で利用される広帯域化処理に適した特徴量であり、一方、上述した特徴量抽出手段101が抽出する特徴量は、入力信号における周波数特性の補正に適した特徴量であり、これら2つの特徴量は同一である必要はない(勿論、同一であっても良い)。図3に示す広帯域化手段105で利用される補正特徴量としてはModGIが好適である。補正特徴量としてModGIを抽出した場合には、特許文献1の記載技術と同様に、ModGIを定数倍した値を拡張ゲインとする方法が好適である。なお、広帯域化手段105で用いられている広帯域化方法によって、好適な補正特徴量は変化する。
ゲイン調整手段305は、拡張ゲインに基づいて、拡張信号の振幅を調整し、得られた調整拡張信号を拡張信号加算手段306に与える。拡張信号の振幅を調整する方法には、拡張信号に拡張ゲインを乗じる方法が好適である。また、拡張ゲインを入力信号に加算すべき拡張信号の真の振幅であると捉えて拡張信号をそれ自身の振幅で除した後で拡張ゲインを乗じる構成としても良い。
拡張信号加算手段306は、入力信号に調整拡張信号を加算して、広帯域化信号を生成する。
(B−2)第1の実施形態の動作
次に、第1の実施形態の音声帯域拡張装置100の動作を説明する。
音声帯域拡張装置100において、入力音声は、特徴量抽出手段101及び広帯域化手段105に与えられる。
特徴量抽出手段101においては、入力信号が解析されて、入力信号の周波数特性に関する特徴量が抽出されて補正情報算出手段102に与えられる。補正情報算出手段102においては、特徴量抽出手段101から与えられた特徴量が目標特徴量と比較され、補正情報が算出されて入力信号補正手段103に与えられる。そして、入力信号補正手段103において、入力信号が、補正情報算出手段102から与えられた補正情報に基づいて補正され、補正後の信号が補正特徴量抽出手段104に与えられる。
補正特徴量抽出手段104においては、広帯域化に必要となる特徴量(補正特徴量)が、補正後の信号から抽出されて広帯域化手段105に与えられる。そして、広帯域化手段105において、入力信号の拡張帯域に補正特徴量を反映させた適当な成分が追加され、帯域が拡張された広帯域化信号が生成されて出力される。
広帯域化手段105の詳細構成は、図3に示すものに限定されないが、以下、図3に示す詳細構成を有する広帯域化手段105における内部動作を説明する。
広帯域化手段105に与えられた入力信号は、BPF手段301及び拡張信号加算手段306に与えられ、広帯域化手段105に与えられた補正特徴量は、拡張ゲイン算出手段304に与えられる。
BPF手段301において、入力信号から、入力帯域の一部の帯域が濾波され、得られた濾波信号が全波整流処理手段302に与えられる。次に、全波整流処理手段302において、濾波信号に対して全波整流処理が施され、得られた全波整流信号がHPF手段303に与えられる。その後、HPF手段303において、全波整流信号から、ハイパスフィルタリングによって拡張帯域の全部又は一部の成分が濾波され、得られた拡張信号がゲイン調整手段305に与えられる。
また、拡張ゲイン算出手段304において、補正特徴量抽出手段104から与えられた補正特徴量に基づいて、拡張ゲインが算出されてゲイン調整手段305に与えられる。そして、ゲイン調整手段305において、拡張ゲインに基づいて、HPF手段303から与えられた拡張信号の振幅が調整され、得られた調整拡張信号が拡張信号加算手段306に与えられる。
以上のようにして形成された調整拡張信号が、拡張信号加算手段306によって、入力信号に加算されて広帯域化信号が生成される。
(B−3)第1の実施形態の効果
第1の実施形態によれば、前処理によって入力信号の周波数特性が変形させられている場合にも、入力信号を目標特徴量に基づいて補正し、広帯域化に用いる特徴量を補正した信号から抽出するようにしたので、広帯域化処理が前処理の影響を受け難くなり、明瞭性の高い広帯域化信号を生成することができる。
(C)第2の実施形態
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第2の実施形態を、図面を参照しながら説明する。
第1の実施形態は、入力信号補正手段103がフィルタを適用しているF特補正手段により入力信号(の周波数特性)を補正するものであった。しかし、ノイズキャンセラや帯域制限によって「完全に」抑圧された帯域は、F特補正手段(フィルタ)を用いて復元することはできない。
そこで、この第2の実施形態では、入力信号に雑音を加算することによって、入力信号の周波数特性を調整することとした。
第2の実施形態の音声帯域拡張装置も、構成要素は、図1に示した第1の実施形態の音声帯域拡張装置100と同様である。しかし、入力信号補正手段の詳細構成(具体的な構成)が第1の実施形態のものと異なっている。以下では、第2の実施形態の音声帯域拡張装置及び入力信号補正手段に対してそれぞれ、符号「100A」、「103A」を付与して言及する。
なお、第2の実施形態の音声帯域拡張装置100Aにおいて、入力信号補正手段103A以外の構成は、第1の実施形態と同様であり、その機能及び動作説明は省略する。
図4は、第2の実施形態の入力信号補正手段103Aの詳細構成を示すブロック図である。第2の実施形態の入力信号補正手段103Aは、補正雑音生成手段401及び補正雑音加算手段402を有する。
入力信号補正手段103Aに与えられた入力信号は、補正雑音加算手段402に与えられ、入力信号補正手段103Aに与えられた補正情報は、補正雑音生成手段401に与えられる。
補正雑音生成手段401は、与えられた補正情報に基づいて、補正雑音を生成して補正雑音加算手段402に与える。
補正雑音加算手段402は、入力信号に、生成された補正雑音を加算し、入力信号の周波数特性を補正した補正信号を得て、補正特徴量抽出手段104(図1参照)に与える。
ここで、補正雑音生成手段401に与えられる補正情報は、補正雑音生成手段401が生成する補正雑音の周波数特性を調整するために用いられる。
以下、特徴量が、入力帯域振幅比、ModGI又はサブバンドパワーのときに算出された補正情報が与えられた場合における、補正雑音生成手段401による補正雑音の生成方法を説明する。
まず、特徴量が入力帯域振幅比である場合、すなわち、ノイズキャンセラによる影響を入力帯域振幅比に基づいて補正する場合の補正雑音の生成方法を説明する。
線形合同法によって、若しくは、線形帰還シフトレジスタを用いて乱数を生成し、生成した乱数をローパスフィルタに通すことにより、入力帯域の低域側に成分を有する低域雑音を生成する。そして、補正情報に基づいて、当該低域雑音の大きさを調整することで補正雑音を生成する。補正情報として、上述した(2)式で得られる補正量Cを用いることができる。しかし、第2の実施形態では、生成した補正雑音(低域雑音)を入力信号に乗算ではなく加算するので、低域に補正雑音が加算されたことを表現している(8)式を満たすように設計された(9)式によって算出された補正情報Cを補正雑音生成手段401が利用することが好ましい。このような補正情報Cの生成は、上述した補正情報算出手段102が実行する。
Figure 0006451143
次に、特徴量がModGIである場合、すなわち、帯域制限による影響をModGIに基づいて補正する場合の補正雑音の生成方法を説明する。
上述したような方法によって乱数を生成し、生成した乱数をバンドパスフィルタに通すことにより、入力帯域の高域側に成分を有する高域雑音を生成する。そして、補正情報に基づいて、当該高域雑音の大きさを調整することで補正雑音を生成する。補正情報として、上述した(5)式で得られる補正量Cを用いることができる。しかし、第2の実施形態では、生成した補正雑音(高域雑音)を入力信号に乗算ではなく加算するので、高域の補正雑音を考慮したModGIの近似値が加算されたことを表現している(10)式を満たすように設計された(11)式によって算出された補正情報Cを補正雑音生成手段401が利用することが好ましい。このような補正情報Cの生成は、上述した補正情報算出手段102が実行する。
Figure 0006451143
最後に、特徴量がサブバンドパワーである場合、すなわち、サブバンドパワーに基づいて入力信号における前処理の影響を補正する場合の補正雑音の生成方法を説明する。
上述したような方法によって乱数を生成し、生成した乱数を白色雑音として使用し、補正情報に基づいて、当該白色雑音の周波数特性と大きさを調整することで補正雑音を生成する。白色雑音の周波数特性を調整する方法としては、例えば、以下の通りである。補正雑音生成手段401では、サブバンドパワーの算出に用いた帯域分割フィルタと同ー又は同等の帯域分割フィルタによって白色雑音を帯域分割し、サブバンド毎に大きさを調整した後、再合成する方法が好適である。補正情報として、上述した(7)式で得られる補正量Ckを用いることができる。しかし、第2の実施形態では、生成した補正雑音を入力信号に乗算ではなく加算するので、入力信号のサブバンドに同じサブバンドの補正雑音が加算されたことを表現している(12)式を満たすように設計された(13)式によって算出されたサブバンド毎の補正情報Ckを補正雑音生成手段401が利用することが好ましい。このようなサブバンド毎の補正情報Ckの生成は、上述した補正情報算出手段102が実行する。
Figure 0006451143
第2の実施形態によれば、前処理によって入力信号の周波数特性が変形させられていて、仮に一部の帯域が完全に抑圧されている場合でも、入力信号を目標特徴量に基づいて補正し、広帯域化に用いる特徴量を補正した信号から抽出するようにしたので、広帯域化処理が前処理の影響を受け難くなり、明瞭性の高い広帯域化信号を生成することができる。
(D)第3の実施形態
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第3の実施形態を、図面を参照しながら説明する。
第1及び第2の実施形態では、補正情報を常に算出していた。しかし、音声は周波数特性が時間と共に大きく変化するため、予め定められる目標特徴量を適切な値に決定することは難しい。
そこで、この第3の実施形態では、音声が存在しない入力信号の非音声区間で補正量の算出を行うこととした。
図5は、第3の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図であり、上述した第1の実施形態に係る図1との同一、対応部分には同一、対応符号を付して示している。
第3の実施形態の音声帯域拡張装置100Bは、図5に示すように、特徴量抽出手段101と、音声区間検出手段506と、補正情報算出手段502と、入力信号補正手段103と、補正特徴量抽出手段104と、広帯域化手段105とを有する。
ここで、特徴量抽出手段101、音声区間検出手段506、補正情報算出手段502、入力信号補正手段103及び補正特徴量抽出手段104でなる部分が、第3の実施形態の音声特徴量抽出装置を構成している。
第3の実施形態は、音声区間検出手段506及び補正情報算出手段502が第1の実施形態のものと異なっており、以下では、音声区間検出手段506及び補正情報算出手段502について説明し、特徴量抽出手段101、入力信号補正手段103、補正特徴量抽出手段104及び広帯域化手段105の説明は省略する。
音声区間検出手段506は、入力信号が音声区間であるか否かを判定して、得られた音声区間判定値を補正情報算出手段502に与える。音声区間を検出する方法は限定されない。例えば、参考文献『R.Martin,“An Efficient Algorithm to Estimate the Instantaneous SNR of Speech Signals,”Proc.EUROSPEECH’93,pp.1093−1096,1993』に開示されている方法が好適である。なお、音声区間判定値には、入力信号が音声区間ならば真(True)、入力信号が音声区間でないならば偽(False)という値が設定されるとして、以下、説明する。
補正情報算出手段502は、与えられた音声区間判定値が偽の場合にのみ、特徴量の値を蓄積し、補正情報を更新し、この補正情報を入力信号補正手段103に与える。補正情報算出手段502は、音声区間判定値が真の場合には、最後に更新された補正情報を入力信号補正手段103に与える。特徴量の値を蓄積するのは、(1)式〜(13)式において期待値を算出するために過去の特徴量を必要とするためである。第1の実施形態では、音声区間か否かに関わらず常に特徴量を蓄積して期待値の算出に使用していたが、この第3の実施形態では、音声区間でない区間の特徴量のみを蓄積して期待値の算出に使用する。
以上では、上述した第1の実施形態をベースに、この第3の実施形態の技術的特徴を盛り込んだ場合を説明したが、上述した第2の実施形態をベースに、この第3の実施形態の技術的特徴を盛り込むようにしても良い。
第3の実施形態によれば、周波数特性が大きく変化する音声区間の情報を使わずに補正情報を更新するようにしたので、より安定した音質の広帯域化信号を生成することができる。
(E)第4の実施形態
次に、本発明による音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラムの第4の実施形態を、図面を参照しながら説明する。
第1〜第3の実施形態では、入力信号の補正は音声区間か否かに関わらず同一の補正方法を用いていた。しかし、非音声区間(音声区間でない区間)のパワーが音声区間のパワーに比べて著しく小さい場合、第1〜第3の実施形態における入力信号補正手段103、103Aによる入力信号の補正では、音声区間のパワーが小さ過ぎるために不十分となる場合がある。
そこで、この第4の実施形態では、音声区間では補正情報を修正してから入力信号を補正することで、音声区間でも十分に入力信号を補正できるようにした。
図6は、第4の実施形態に係る音声帯域拡張装置の構成を示す機能ブロック図であり、上述した第3の実施形態に係る図5との同一、対応部分には同一、対応符号を付して示している。
第4の実施形態の音声帯域拡張装置100Cは、図6に示すように、特徴量抽出手段101と、音声区間検出手段506と、補正情報算出手段502と、補正情報修正手段606と、入力信号補正手段103と、補正特徴量抽出手段104と、広帯域化手段105と、音声区間検出手段506とを有する。
ここで、特徴量抽出手段101、音声区間検出手段506及び補正情報算出手段502、補正情報修正手段606、入力信号補正手段103及び補正特徴量抽出手段104でなる部分が、第4の実施形態の音声特徴量抽出装置を構成している。
第4の実施形態は、補正情報修正手段606が第3の実施形態のものと異なっており、以下では、補正情報修正手段606について説明し、他の構成要素の説明は省略する。
補正情報修正手段606は、補正情報と音声区間判定値に基づいて、補正情報を修正し、得られた修正補正信号を入力信号補正手段103に与える。補正情報の修正は、音声区間判定値が真の場合にのみ行われる。すなわち、補正情報修正手段606は、音声区間判定値が真のときには補正情報を修正して修正補正情報とし、音声区間判定値が偽のときには補正情報を修正せずにそのまま修正補正情報とする。
音声区間における補正情報の修正は、入力帯域の振幅が大きい場合には補正量が大きくなるようにし、入力帯域の振幅が小さい場合には修正しないという処理であれば良く、このような要求を満たす任意の方法を適用することができる。以下、好適と考えられる方法の一例を説明する。
補正情報修正手段606は、入力帯域の振幅の長期平均値を算出しておいて、現在の入力帯域の振幅を当該長期平均値で除することで正規化振幅を算出する。そして、正規化振幅をA、正規化振幅に対する2つの閾値をA1とA2(但し、A1<A2)、修正重み係数をWとして、補正量修正係数Bを(14)式で算出し、補正量算出手段502で算出された補正量C又はCkに補正量修正係数Bを乗じたものを修正補正量とする。図7は、(14)式の変換式をグラフ状に示した説明図である。なお、閾値A1、A2や修正重み係数Wは、シュミレーション等によって最適値を定めれば良い。また、サブバンドパワーを特徴量とする場合のように補正量が2つ以上ある場合には、閾値A1、A2、修正重み係数Wを補正量毎に異なる値として、各補正量に対応する補正量修正係数を算出するようにしても良い。
Figure 0006451143
以上では、上述した第1の実施形態をベースに、この第4の実施形態の技術的特徴を盛り込んだ場合を説明したが、上述した第2又は第3の実施形態をベースに、この第4の実施形態の技術的特徴を盛り込むようにしても良い。
第4の実施形態によれば、音声区間でも適切に入力信号を補正することができるので、より明瞭性の高い広帯域化信号を生成することが提供できる。
(F)他の実施形態
上記各実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。
上記各実施形態においては、目標特徴量は予め定められていたが、ユーザが目標特徴量をその都度指定できるようにしても良い。
入力信号補正手段として入力信号補正手段103Aを用いる実施形態に対しては以下の変形実施形態を挙げることができる。一部の特徴量については、入力信号から特徴量を抽出する特徴量算出手段101の抽出結果を有効として広帯域化手段105に直接与えて、広帯域化手段105がその一部特徴量をそのまま利用するようにしても良い。例えば、音声のピッチ周波数に関する特徴量は、雑音を加算すると却って推定精度が悪くなるため、入力信号を補正する前に抽出する方が望ましい。
上記各実施形態の説明では、ModGIを特徴量の1つとしたものを示したが、特許文献1によって修正される前のGIも、信号波形の傾き方向が変化する回数とその大きさを測る指標であり、ModGIと同様に、おおよそ、全帯域の振幅のうち高域側の振幅が占める割合を表しているので、上記各実施形態におけるModGIに代えてGIを適用するようにしても良い。
上記各実施形態においては、入力信号補正手段として、図2に示す詳細構成を有する入力信号補正手段103又は図4に詳細構成を示す入力信号補正手段103Aの一方を適用するものを示したが、これら2つの補正手段を組み合わせた構成を用いるようにしても良い。例えば、2つの入力信号補正手段が並列処理し、得られた2つの補正信号に固定又は適応的な係数を乗じて加算して最終的な補正信号とするようにしても良い。
上記各実施形態では1種類の前処理に対応できるものを示したが、複数種類の前処理に対応できるように構成しておき、装置の立上げ時や通信の開始時等に適用する前処理の種類を設定し(固定設定でも随時設定でも良い)、その前処理に応じた動作を実行するようにしても良い。例えば、前処理の種類によって、特徴量抽出手段101が抽出する特徴量や、補正情報算出手段102の算出方法や、入力信号補正手段103、103Aの補正方法などを切り替えるようにすれば良い。このようにすることにより、前処理に応じた適切な補正信号を得ることができる。
また、前処理の種類を推定するようにしても良い。例えば、前処理推定手段が、音声区間検出手段(第3の実施形態参照)から音声区間判定値の供給を受け、音声区間判定値が偽のときに周波数特性を解析して、その解析結果に基づいて前処理を推定する。解析結果から前処理処理を決定する方法として、例えば、周波数スペクトルのパターンマッチングを挙げることができる。この場合にも、得られた前処理の種類の情報を入力信号補正手段103、103A等に与えることで、前処理に応じた適切な補正信号を得ることができる。
上記各実施形態は、背景雑音の影響を除外又は軽減する構成を備えないものであったが、背景雑音の対策構成をも含むように構成しても良い。例えば、背景雑音推定手段が、音声区間検出手段から音声区間判定値の供給を受け、音声区間判定値が偽のときに周波数特性を解析して、その解析結果に基づいて背景雑音を推定する。解析結果から背景雑音を決定する方法として、例えば、周波数スペクトルのパターンマッチングを挙げることができる。得られた背景雑音情報を入力信号補正手段103、103Aに与えることで、背景雑音に応じた適切な補正信号を得ることができる。例えば、背景雑音が強いサブバンドと弱いサブバンドとで補正係数を変更する。
上記各実施形態を、入力信号は広帯域化信号と同一のサンプリング周波数を有しているという前提で説明したが、入力信号のサンプリング周波数が広帯域化信号のサンプリング周波数より低くても良い。この場合には、広帯域化手段105の直前に、入力信号のサンプリング周波数を広帯域化信号のサンプリング周波数へと変換するサンプリング変換手段が挿入することを要する。
上記各実施形態では、特徴的な処理が時間領域の信号で処理される場合を示したが、一部又は全ての処理を、周波数領域の信号で処理するようにしても良い。
上記では、音声帯域拡張装置を電話機器に適用する場合に言及したが、本発明の音声帯域拡張装置の用途が電話機器に限定されないことは勿論である。
また、上記各実施形態では、拡張帯域が高域側であるものを示したが、高域側に加えて低域側を拡張する場合にも、本発明の技術思想を適用することができる。
上記各実施形態では、本発明の音声特徴量抽出装置を音声帯域拡張装置に適用する場合を示したが、特徴量(補正特徴量)を利用することを要する他の装置に、本発明の音声特徴量抽出装置を適用するようにしても良い。例えば、有声無声判定装置の中には、音声の特徴量を利用するものがあるが、有声無声判定装置における音声特徴量を抽出する構成として、本発明の音声特徴量抽出装置を適用するようにしても良い。
100、100A、100B、100C…音声帯域拡張装置、101…特徴量抽出手段、102、502…補正情報算出手段、103、103A…入力信号補正手段、104…補正特徴量抽出手段、105…広帯域化手段、201…F特補正手段、401…補正雑音生成手段、402…補正雑音加算手段、506…音声区間検出手段、606…補正情報修正手段。

Claims (12)

  1. 入力信号の成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張装置において、
    上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、
    抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、
    上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、
    上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、
    上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段と
    を備えることを特徴とする音声帯域拡張装置。
  2. 上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号の異なる2つの周波数帯域の振幅において、高域側の振幅を低域側の振幅で除した比である入力帯域振幅比であることを特徴とする請求項1に記載の音声帯域拡張装置。
  3. 上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号の2階差分の振幅又はパワーを、入力信号の振幅又はパワーで除したModGIであることを特徴とする請求項1に記載の音声帯域拡張装置。
  4. 上記特徴量の少なくとも1つ、又は、上記補正特徴量の少なくとも1つが、上記入力信号を2つ以上のサブバンドに帯域分割した各サブバンドの振幅又はパワーであるサブバンドパワーであることを特徴とする請求項1に記載の音声帯域拡張装置。
  5. 上記入力信号補正手段は、上記入力信号の周波数特性を、補正情報に基づいて直接操作するものであることを特徴とする請求項1〜請求項4のいずれかに記載の音声帯域拡張装置。
  6. 上記入力信号補正手段は、上記補正情報に基づいて、補正雑音を生成する補正雑音生成手段と、上記入力信号に上記補正雑音を加算する補正雑音加算手段とを有することを特徴とする請求項1〜請求項4のいずれかに記載の音声帯域拡張装置。
  7. 上記入力信号が音声区間であるか否かを判定する音声区間検出手段をさらに備え、
    上記補正情報算出手段は、上記入力信号が音声区間でない場合に限り上記補正情報を形成、更新することを特徴とする請求項1〜請求項6のいずれかに記載の音声帯域拡張装置。
  8. 上記入力信号が音声区間である場合に限り上記入力信号に基づいて上記補正情報を修正する補正情報修正手段をさらに備え、
    上記入力信号補正手段は、上記補正情報修正手段で修正された上記補正情報に基づいて上記入力信号を補正することを特徴とする請求項7に記載の音声帯域拡張装置。
  9. 上記補正情報修正手段は、上記補正情報のうち補正の大きさに関する補正量を修正するものであって、
    上記入力信号の振幅の長期平均値を算出し、
    上記入力信号の振幅を上記長期平均値で除して正規化振幅を算出し、
    上記正規化振幅が第1の閾値より小さい場合には上記補正情報を修正せず、
    上記正規化振幅が上記第1の閾値以上かつ第2の閾値より小さい場合には、上記補正量に、予め定められた修正重み係数と上記正規化振幅を乗じることで修正し、
    上記正規化振幅が上記第2の閾値以上の場合には上記補正量に上記修正重み係数と上記第2の閾値を乗じることで修正する
    ことを特徴とする請求項8に記載の音声帯域拡張装置。
  10. 入力信号に成分が存在しない周波数帯域に信号成分を追加して周波数帯域を拡張する音声帯域拡張プログラムであって、
    コンピュータを、
    上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、
    抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、
    上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、
    上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と、
    上記補正特徴量に基づいて上記入力信号の帯域を拡張して広帯域化信号を生成する広帯域化手段と
    して機能させることを特徴とする音声帯域拡張プログラム。
  11. 入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出装置において、
    上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、
    抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、
    上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、
    上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と
    を備えることを特徴とする音声特徴量抽出装置。
  12. 入力信号の周波数特性に関する1つ以上の特徴量を抽出する音声特徴量抽出プログラムであって、
    コンピュータを、
    上記入力信号から周波数特性に関する1つ以上の特徴量を抽出する特徴量抽出手段と、
    抽出された上記特徴量と予め定められた目標特徴量とに基づいて補正情報を形成する補正情報算出手段と、
    上記補正情報に基づいて、上記入力信号の周波数特性を補正した補正信号を生成する入力信号補正手段と、
    上記補正信号から周波数特性に関する1つ以上の補正特徴量を抽出する補正特徴量抽出手段と
    して機能させることを特徴とする音声特徴量抽出プログラム。
JP2014167743A 2014-08-20 2014-08-20 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム Active JP6451143B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014167743A JP6451143B2 (ja) 2014-08-20 2014-08-20 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014167743A JP6451143B2 (ja) 2014-08-20 2014-08-20 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2016045249A JP2016045249A (ja) 2016-04-04
JP6451143B2 true JP6451143B2 (ja) 2019-01-16

Family

ID=55635898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014167743A Active JP6451143B2 (ja) 2014-08-20 2014-08-20 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6451143B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3400474B2 (ja) * 1992-11-09 2003-04-28 株式会社リコー 音声認識装置および音声認識方法
JPH11212588A (ja) * 1998-01-22 1999-08-06 Hitachi Ltd 音声処理装置、音声処理方法、及び音声処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2003271190A (ja) * 2002-03-15 2003-09-25 Matsushita Electric Ind Co Ltd 雑音除去方法、雑音除去装置及び、それを用いた音声認識装置
JP5840087B2 (ja) * 2012-07-19 2016-01-06 三菱電機株式会社 音声信号復元装置および音声信号復元方法
JP6152639B2 (ja) * 2012-11-27 2017-06-28 沖電気工業株式会社 音声帯域拡張装置及びプログラム、並びに、音声特徴量算出装置及びプログラム
JP6451136B2 (ja) * 2014-08-05 2019-01-16 沖電気工業株式会社 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム

Also Published As

Publication number Publication date
JP2016045249A (ja) 2016-04-04

Similar Documents

Publication Publication Date Title
US8442250B2 (en) Hearing aid and method for controlling signal processing in a hearing aid
US8560308B2 (en) Speech sound enhancement device utilizing ratio of the ambient to background noise
JP5666444B2 (ja) 特徴抽出を使用してスピーチ強調のためにオーディオ信号を処理する装置及び方法
US8886499B2 (en) Voice processing apparatus and voice processing method
JP4818335B2 (ja) 信号帯域拡張装置
JPWO2006046293A1 (ja) 雑音抑圧装置
US8694311B2 (en) Method for processing noisy speech signal, apparatus for same and computer-readable recording medium
KR20120037954A (ko) 음성의 표적화 및 잡음의 무시에 의한 음성 신호의 프로세싱에 있어서 잡음 감소를 위한 시스템 및 방법
CA2891453C (en) Method of and apparatus for evaluating intelligibility of a degraded speech signal
US8744846B2 (en) Procedure for processing noisy speech signals, and apparatus and computer program therefor
US9418677B2 (en) Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program
US8744845B2 (en) Method for processing noisy speech signal, apparatus for same and computer-readable recording medium
CN105869652B (zh) 心理声学模型计算方法和装置
JP6451143B2 (ja) 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム
KR20200095370A (ko) 음성 신호에서의 마찰음의 검출
JP6451136B2 (ja) 音声帯域拡張装置及びプログラム、並びに、音声特徴量抽出装置及びプログラム
JP6065488B2 (ja) 帯域拡張装置及び方法
JP7152112B2 (ja) 信号処理装置、信号処理方法および信号処理プログラム
US10257620B2 (en) Method for detecting tonal signals, a method for operating a hearing device based on detecting tonal signals and a hearing device with a feedback canceller using a tonal signal detector
Rao et al. Speech enhancement using cross-correlation compensated multi-band wiener filter combined with harmonic regeneration
JP6163785B2 (ja) 音声帯域拡張装置及びプログラム
JP6536322B2 (ja) 雑音推定装置、プログラム及び方法、並びに、音声処理装置
JP2022011889A (ja) 音声区間検出回路
JP2015169900A (ja) 雑音抑圧装置
JP2015119404A (ja) マルチパス判定装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170515

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181126

R150 Certificate of patent or registration of utility model

Ref document number: 6451143

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150