JP2009003297A - 音声信号処理装置および音声再生装置 - Google Patents
音声信号処理装置および音声再生装置 Download PDFInfo
- Publication number
- JP2009003297A JP2009003297A JP2007165688A JP2007165688A JP2009003297A JP 2009003297 A JP2009003297 A JP 2009003297A JP 2007165688 A JP2007165688 A JP 2007165688A JP 2007165688 A JP2007165688 A JP 2007165688A JP 2009003297 A JP2009003297 A JP 2009003297A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- signal
- component
- frequency component
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】ポストプロセシングにより、ミュージカルノイズを含む音声信号を再生したときに、ミュージカルノイズを目立たなくする音声信号処理装置を提供する。
【解決手段】ミュージカルノイズを含むソース信号を入力し、このソース信号を4kHz以下の低域成分と4kHzを超える高域成分に分離する。両成分の振幅レベルを比較し、高域成分が優勢な場合には、高域カットフィルタ14にセットするフィルタ係数のカットオフ周波数を瞬時的に低下させて、この高域成分を抑制する。低域成分よりも高域成分が優勢な時間帯の高域成分は、ミュージカルノイズである場合が多く、低域成分もこのミュージカルノイズをマスクできるほど大きいレベルではないため、この高域成分の抑制により、ミュージカルノイズを目立たなくすることができる。
【選択図】 図1
【解決手段】ミュージカルノイズを含むソース信号を入力し、このソース信号を4kHz以下の低域成分と4kHzを超える高域成分に分離する。両成分の振幅レベルを比較し、高域成分が優勢な場合には、高域カットフィルタ14にセットするフィルタ係数のカットオフ周波数を瞬時的に低下させて、この高域成分を抑制する。低域成分よりも高域成分が優勢な時間帯の高域成分は、ミュージカルノイズである場合が多く、低域成分もこのミュージカルノイズをマスクできるほど大きいレベルではないため、この高域成分の抑制により、ミュージカルノイズを目立たなくすることができる。
【選択図】 図1
Description
この発明は、高圧縮率で圧縮された音声信号等を再生したときに発生するミュージカルノイズによる聴きづらさを改善した音声信号処理装置に関する。
高圧縮率で圧縮された音声信号は、4kHz〜6kHz付近の周波数帯に「キロキロ」または「ピロピロ」という聴感のノイズ信号を含んでいる。このノイズ信号は、音楽のように聴こえるためミュージカルノイズと呼ばれている。
このミュージカルノイズは、音声信号の圧縮技術に起因するものである。すなわち、一般的に音声信号の圧縮には、聴覚心理学に基づき聴取者に聴こえにくいとされる周波数成分の量子化ビット数の割り当てを減らしてビットレートを少なくする手法が用いられるが、高い圧縮率で音声信号を圧縮する場合、多くの信号成分を除去するため、除去されなかった信号成分のなかに、図7の成分101に示すように、時間的・周波数的に孤立した信号成分が発生する。音声信号を再生したとき、この孤立した信号成分が、上記「キロキロ」、「ピロピロ」という音となって再生されミュージカルノイズとなる。
図7は、人間の発話音声を高圧縮率で圧縮したのち、伸長・再生した信号のスペクトログラムを示す図であるが、発話音声信号は、主として3kHz以下の周波数帯域に分布している。一方、4kHz〜6kHzの周波数帯域には時間軸上、周波数軸上の両方で孤立した信号成分が点在している。この孤立した信号成分がミュージカルノイズとなる。ミュージカルノイズがどの周波数帯域に発生するかは、目的とする信号成分の分布や圧縮方式等によって異なるが、人間の発話音声を目的の信号とし、この成分を良く保存するように圧縮した場合、ミュージカルノイズは、一般的に4kHz〜6kHz付近の周波数帯域に現れる。
また、高圧縮率で圧縮した音声信号のみならず、たとえばスペクトルサブストラクション法で高レベル雑音を抑制した場合にも発生する。このスペクトルサブストラクション法によるノイズ抑制時に、ミュージカルノイズが発生しないような処理を行う技術は種々提案されている(たとえば、特許文献1、2等)
特開2006−113515号公報
特開2004−341339号公報
しかしながら、上記特許文献1、2の技術は、ノイズ除去プロセス時にミュージカルノイズの発生を抑制する技術であって、ミュージカルノイズを含む音声信号からミュージカルノイズを除去する技術、または、ミュージカルノイズを含む音声信号のミュージカルノイズを目立たなくする技術ではない。
また、高ノイズ環境で収音した音声信号からノイズを除去する処理におけるものであり、音声信号を高圧縮率で圧縮する際に生じるミュージカルノイズの成分(孤立した信号成分)の発生を抑制する技術ではない。
このように、従来は、ミュージカルノイズを含んでしまった音声信号を処理して、それを除去または目立たなくするポストプロセシングの技術は未だ提案されていない。
この発明は、ポストプロセシングにより、ミュージカルノイズを含む音声信号を再生したときに、ミュージカルノイズを目立たなくする音声信号処理装置を提供することを目的とする。
請求項1の発明は、ミュージカルノイズを含む音声信号であるソース信号を入力する入力部と、前記ソース信号を、このソース信号中の目的とする信号成分を含む周波数帯域である目的帯域の成分と、その他の周波数帯域の成分に分離し、前記目的帯域の成分と前記その他の周波数帯域の成分とを比較するレベル比較部と、前記ソース信号をフィルタリングするフィルタと、前記フィルタにフィルタ係数をセットするフィルタ係数発生部であって、前記レベル比較部の比較結果が、前記その他の周波数帯域の成分が優勢である旨の結果であったとき、前記その他の周波数帯域がカットされるようにフィルタ係数を変更するフィルタ係数発生部と、を備えたことを特徴とする。
請求項2の発明は、請求項1の発明において、前記目的とする信号成分を、人間の発話音声の信号成分としたことを特徴とする。
請求項3の発明は、請求項2の発明において、前記周波数分離部が、略4kHz以下の周波数帯域を目的帯域とし、前記略4kHzを超える周波数をその他の周波数帯域とすることを特徴とする。
請求項4の発明は、ミュージカルノイズを生じる程度までに圧縮された圧縮音声信号を記憶する記憶部と、前記記憶部に記憶されている圧縮音声信号を伸長してソース信号として出力するデコード部と、デコード部が出力したソース信号が入力される請求項1乃至請求項3のいずれかに記載の音声信号処理装置と、を備えたことを特徴とする。
この発明では、ミュージカルノイズを含んだ音声信号を入力し、この音声信号に対して、その音声信号のその他の(目的外の)周波数成分が優勢なときは、この目的外の周波数成分をフィルタによって抑制することにより、ミュージカルノイズを抑制する。ミュージカルノイズは、時間的・周波数的に孤立した信号成分である。人声を圧縮する場合、ミュージカルノイズの信号成分は、一般的に、4kHzを超える周波数帯に分布する。
この発明によれば、高圧縮やノイズ除去により、ミュージカルノイズを含んだ音声信号であっても、このミュージカルノイズを目立たなくして、自然な聴感で再生することができる。
図面を参照してこの発明の実施形態について説明する。図1はこの発明の実施形態である音声信号処理装置のブロック図である。
上述したように、高圧縮率で圧縮された音声信号や、高ノイズ環境で収音されスペクトルサブストラクション法でノイズが除去された音声信号には、ミュージカルノイズと呼ばれるノイズ成分が含まれている。ミュージカルノイズは、時間的および周波数的に孤立した信号成分によるノイズであり、「キュロキュロ」または「ピロピロ」という聴感で聴こえることからミュージカルノイズと呼ばれている。すなわち、音声信号を高圧縮率で圧縮すると多くの周波数成分が省かれてしまうため、圧縮された音声信号を伸長した場合、主要な信号成分が存在しない周波数帯に、時間的および周波数的に孤立した信号成分が生じることに起因するノイズである。
上述したように、高圧縮率で圧縮された音声信号や、高ノイズ環境で収音されスペクトルサブストラクション法でノイズが除去された音声信号には、ミュージカルノイズと呼ばれるノイズ成分が含まれている。ミュージカルノイズは、時間的および周波数的に孤立した信号成分によるノイズであり、「キュロキュロ」または「ピロピロ」という聴感で聴こえることからミュージカルノイズと呼ばれている。すなわち、音声信号を高圧縮率で圧縮すると多くの周波数成分が省かれてしまうため、圧縮された音声信号を伸長した場合、主要な信号成分が存在しない周波数帯に、時間的および周波数的に孤立した信号成分が生じることに起因するノイズである。
一般的に、人間の発話音声は、3kHz以下の周波数帯域に主要なフォルマントが分布し、4kHzを超える周波数帯域に破裂音などの子音の信号成分やランダムなノイズ成分が分布している。したがって、人間の発話音声を保存する圧縮方式で圧縮された場合、主として4kHz〜6kHzの周波数帯域にミュージカルノイズが分布する。
図1の音声信号処理装置は、このミュージカルノイズを抑制するため、以下の処理を実行する。ミュージカルノイズを含む音声信号(ソース信号)を入力し、4kHzを超える高域成分と4kHz以下の低域成分に分離して比較する。高域成分が優勢な時間帯は、ミュージカルノイズが耳につきやすい状態であるとして高域成分を減衰させる。
すなわち、4kHz以下の低域成分が優勢な時間帯は、発話されている時間帯であると考えることができる。母音は、連続した周期信号であるため、高圧縮された場合でも時間周波数的に孤立した成分が発生しにくいうえ、もしミュージカルノイズが発生しても母音によってマスクされ、リスナーに耳障りなほど顕著になることは殆どない。
一方、4kHzを超える高域成分が優勢な時間帯は、発話されておらずノイズのみの時間帯または破裂音等の子音が発音されている時間帯と考えることができる。ノイズや破裂音等の子音は、時間的に連続せずランダムに発生するため、高圧縮した場合、時間周波数的に孤立した成分が発生しやすく、これが再生されるとミュージカルノイズとなる。また、ミュージカルノイズをマスクする母音も発音されていないと考えられる。したがって、4kHzを超える高域帯域が優勢な場合は、高域成分を抑制することにより、リスナーに対して耳障りなミュージカルノイズが気にならないようにする。
図1において、入力端子10(INPUT)から入力された音声信号は、遅延回路13を介して高域カットフィルタ14に入力されるとともに、レベル比較回路11に入力される。レベル比較部11は、この音声信号について、上述した4kHz以下の低域成分と4kHz以上の高域成分とのレベルを比較し、比較結果を係数発生部12に出力する。
係数発生部12は、入力された比較結果に基づいて高域カットフィルタ14のフィルタ係数を算出して、高域カットフィルタ14にセットする。係数発生部12は、入力された比較結果が高域が優勢である旨の結果であった場合には、カットオフ周波数を低下させて高域カットフィルタ14に強く高域を抑制させる。
すなわち、この実施形態では、ミュージカルノイズが目立つ場合の高域成分の抑制は、高域カットフィルタ14のカットオフ周波数を低下させることで行っている。これ以外に、高域成分の抑制を、高域成分の経路にアッテネータを接続し、前記比較結果に基づいてアッテネータの減衰率を変化させるようにしてもよい。
なお、レベル比較部11による低域成分と高域成分のレベル比較、係数発生部12によるフィルタ係数の発生および高域カットフィルタ14へのセットは、入力される音声信号のサンプリングタイミングごとに行われる。
高域カットフィルタ14により、適宜高域をカットされた音声信号は音質補正フィルタ15に入力される。音質補正フィルタ15は、たとえば、1または複数のピーキングフィルタを備えたイコライザで構成され、自動的にまたはユーザのマニュアル操作により、音声信号の音質特に明瞭感が調整される。高域カットフィルタ14で音質が調整された音声信号は、後段、たとえばD/Aコンバータやデジタルアンプ等に出力される。
図2はレベル比較部11のブロック図である。入力された音声信号はローパスフィルタ(LPF)21、ハイパスフィルタ(HPF)23に入力される。ローパスフィルタ21は、低域成分、すなわち入力された音声信号のうち4kHz以下の周波数成分を選択的に通過させる。一方、ハイパスフィルタ23は、高域成分、すなわち入力された音声信号のうち4kHzを超える周波数成分を選択的に通過させる。ローパスフィルタ21を通過した低域成分はエンベロープ検出部22に入力される。ハイパスフィルタ23を通過した高域成分はエンベロープ検出部24に入力される。エンベロープ検出部22は、低域成分のエンベロープを検出する。また、エンベロープ検出部24は、高域成分のエンベロープを検出する。
ここで、エンベロープは、信号の各周期の最大振幅点をつないだ曲線であり、その信号の振幅レベルを示す値である。したがって、エンベロープ検出部22、24がサンプリングタイミング毎に出力するエンベロープの値を、以下、振幅レベルと呼ぶ。
エンベロープ検出部の構成は自由であるが、この実施形態では、図3に示すように、比較的軽負荷で実現できるピークを検出してディケイ値を減算するエンベロープ検出部を用いている。詳細は後述する。
エンベロープ検出部22が検出した低域成分の振幅レベル、および、エンベロープ24が検出した高域成分の振幅レベルは、加算器(減算器)25に入力される。
加算器25は、サンプリングタイミング毎に、高域成分の振幅レベルから低域成分の振幅レベルを減算したレベル差信号を出力する。このレベル差信号は、比較器26の一方の入力端子に入力される。比較器26の他方の入力端子にはしきい値が入力される。比較器26は、レベル差信号としきい値を比較し、レベル差信号がしきい値を超えていれば1を出力し、レベル差信号がしきい値以下であれば0を出力する。
しきい値が0の場合、高域成分の振幅レベルが低域成分の振幅レベルを超えていれば高域が優勢と判断されて1が出力される。また、しきい値が負値の場合、高域成分の振幅レベルが低域成分の振幅レベルよりもしきい値分小さい値を超えていれば高域が優勢と判断されて1が出力される。またさらに、しきい値が正値の場合、高域成分の振幅レベルが低域成分の振幅レベルよりもしきい値分大きい値を超えていれば高域が優勢と判断されて1が出力される。すなわち、しきい値は、高域成分の振幅レベルが低域成分の振幅レベルに対してどの程度の大小関係になれば高域が優勢であるかを決定するためパラメータである。しきい値は経験的に設定すればよい。
比較器26が比較結果として出力する値は、0または1の不連続な値である。このような、不連続な値をパラメータとしてフィルタ係数を算出すると、フィルタの特性が不連続に切り換えられ、フィルタリングされる音声信号に「バチッ」と言うようなノイズが発生するおそれがある。そこで、比較器26の後段にローパスフィルタ(LPF)27を設け、比較器26が出力した比較結果の値をローパスフィルタ27で時定数を与えて平滑化し、滑らかに変化するようにした。ローパスフィルタ27の時定数は、カットオフ周波数の追従スピードを決定するパラメータとなる。この時定数により、ローパスフィルタ27の出力は、オーバーシュートして0〜1の範囲を超えるおそれがあるため、ローパスフィルタ27の後段にリミッタ28を接続し、このリミッタ28により、滑らかに変化する比較結果の値が0〜1の範囲に収まるようにする。リミッタ28の出力は、後段の係数発生部12に出力される。
図3(A)は、前記エンベロープ検出部22,24の一例を示す図である。このエンベロープ検出部は、同図(B)に示すアナログの整流回路を模した構成になっており、交流信号を同図(C)に示すような直流信号に変換する。
同図(A)のエンベロープ検出部において、絶対値算出部31は、入力された信号(高域成分または低域成分)の振幅値を絶対値化する。dB変換部32は、絶対値化された振幅値をdB値に変換する。加算器(減算器)33は、dB変換部32から出力された振幅値から前回のサンプリングタイミングのセレクタ34の出力値からディケイ値を減算した値を減算してセレクタ34に入力する。セレクタ34は、加算器33から入力された値が0または正値であればdB変換器32から出力された振幅値を選択して後段に出力する。また、セレクタ34は、加算器33から入力された値が負値であれば前回のサンプリングタイミングの出力値からディケイ値を減算した値を再度後段に出力する。
セレクタ34の出力値は、加算器(減算器)35でディケイ値を減算されたのち振幅レベルとして出力される。さらに、この振幅レベルが次のサンプリングタイミングの比較対象として1サンプル遅延部36に記憶される。
これを毎サンプル繰り返すことによって、入力された高域成分または低域成分のエンベロープを求め、これを振幅レベルとして出力する。
これを毎サンプル繰り返すことによって、入力された高域成分または低域成分のエンベロープを求め、これを振幅レベルとして出力する。
なお、同図(B)の整流回路の動作は以下のようである。ダイオードブリッジ41は、交流信号(交流電源電圧)を絶対値化する。交流信号は、絶対値化されることにより、交流時の約1.4倍のピーク電圧を有する脈流となる。この脈流をコンデンサ42および抵抗43で平滑する。コンデンサ42は、脈流の電圧上昇に伴って電荷を蓄積し、脈流の電圧が低下し始めると蓄積した電荷を抵抗43(および負荷)に向けて放電することにより、出力電圧が脈流のように低下しないようにする。これにより、出力電圧が平滑される。
この構成は、同図(B)に示すアナログ回路をデジタル的に模したものである。
図4(A)は、係数発生部12のブロック図である。係数発生部12は、レベル比較部11から入力された比較結果信号に基づいて高域カットフィルタ14のフィルタ係数を算出する。比較結果信号は、0〜1の値をとり、0に近づくほど高域が優勢であることを示すので、0に近づくにつれてカットオフ周波数が下がるように係数を算出する。カットオフ周波数の決定およびフィルタ係数の算出は、サンプリングタイミング毎に実行される。
図4(A)は、係数発生部12のブロック図である。係数発生部12は、レベル比較部11から入力された比較結果信号に基づいて高域カットフィルタ14のフィルタ係数を算出する。比較結果信号は、0〜1の値をとり、0に近づくほど高域が優勢であることを示すので、0に近づくにつれてカットオフ周波数が下がるように係数を算出する。カットオフ周波数の決定およびフィルタ係数の算出は、サンプリングタイミング毎に実行される。
係数発生部12には、比較結果信号のほかに、高域カットフィルタ14のカットオフ周波数の上限値および下限値も入力される。加算器(減算器)52によってカットオフ周波数の上限値と下限値の差すなわち変化幅が算出される。この変化幅は乗算器51に入力される。乗算器51には、さらに比較結果信号が入力される。比較結果信号は0〜1の値をとるため、乗算器51では、カットオフ周波数の変化量が算出される。加算器53は、カットオフ周波数の下限値に変化量が加算され、このサンプリングタイミングにおけるカットオフ周波数fcが算出される。これにより、カットオフ周波数の上限値と下限値との間で、比較結果信号に応じたカットオフ周波数が決定される。
係数算出部54は、このカットオフ周波数fcおよびゲイン(減衰量)に基づいてフィルタ係数を算出する。係数算出部54が実行する係数の算出は、フィルタタイプに応じた任意の手法を用いればよい。ここでは、2次のIIRフィルタをハイシェルビングフィルタとして使う場合のフィルタ係数算出の手法について説明する。
2次IIRフィルタの係数は、アナログのハイシェルビングフィルタの伝達関数
と、2次のIIRフィルタの伝達関数
とを対応させて算出することができる。
とすると、sz変換することにより、以下の式から各フィルタ係数が算出される。
なお、係数発生部12の処理能力が低い場合には、予め比較結果信号の種々の値に対応するフィルタ係数を算出してテーブルとして記憶しておき、入力された比較結果信号に対応するフィルタ係数を読み出して高域カットフィルタ14にセットするようにしてもよい。
上記構成により、係数発生部12は、図4(B)に示すような特性になるフィルタ係数を発生して高域カットフィルタ14に設定する。これにより、高域が優勢でない場合には、カットオフ周波数を上限値に維持して音質を優先し、高域が優勢なときは瞬時的にカットオフ周波数を低くしてミュージカルノイズが目立たないように制御する。
図5は、この音声信号処理装置に入力された音声信号と、この音声信号に対応した各部の動作を説明する図である。上段のグラフの第1段が入力された音声信号の波形を示している。これは人間の発話音声の波形である。下段2つのスペクトログラムのうち、上側がこの入力された音声信号(処理前)の周波数スペクトルを示す図である。これらの図によると、発話していない時間帯や発話開始時の子音が発音されている時間帯に高域成分が目立っている。
グラフの第2段は、低域成分と高域成分のエンベロープすなわち振幅レベルの変化を示す図である。このグラフによると、発話中は低域成分が優勢であるが、無音の時間帯や発話開始時に高域成分が優勢になっていることがわかる。グラフの第3段は、比較結果信号を示す図である。このうち、1と0の間を不連続に変化しているものが比較器26の出力(Raw signal)である。滑らかに変化しているものがローパスフィルタ27の出力(LPF out)である。そして、グラフの第4段が高域カットフィルタ14にセットされるフィルタ係数のカットオフ周波数を示す図である。カットオフ周波数は通常は、上限値(8000Hz)に設定され、高域成分が優勢なときのみ瞬時的に低下するよう制御される。この例では下限値は4000Hzである。
上記のようにカットオフ周波数が制御された高域カットフィルタ14で処理された音声信号のスペクトログラムを同図の最下段(処理後)に示す。その上の処理前のスペクトログラムに比して、高域成分が優勢な時間帯に、その高域成分がカットされていることが判る。
以上説明したように、上記実施形態の音声信号処理装置を用いれば、ミュージカルノイズを含む音声信号を再生する場合でも、聴きやすい音質で再生することができる。したがって、この音声信号処理装置は、ミュージカルノイズを含む音声信号を再生する用途全般に適用可能である。たとえば、高圧縮率で圧縮された音声信号をデコード・再生する装置、高ノイズ環境で収音された音声信号をスペクトルサブストラクション法でノイズ除去する装置等に適用することができる。
図6に、その一例として発音機能付の電子辞書を示す。発音機能付の電子辞書には、多数の見出し語や例文の手本となる発音を録音したオーディオデータが記憶されている。一般的に電子辞書は、携帯サイズであるためメモリの容量が限られており、各オーディオデータは高圧縮率で圧縮されている。
電子辞書は、制御部60、メモリ62、操作部63、表示部64、音声信号処理部65、D/Aコンバータ66、アナログアンプ67、スピーカ68を備えている。メモリ62は、辞書データや手本発音のオーディオデータを記憶しており、ROMやフラッシュメモリ等で構成されている。制御部60は、マイクロコンピュータで構成され、装置全体の動作を制御するとともに、メモリ62に記憶されているオーディオデータを読み出して圧縮を解除(デコード)するデコーダ部61を有している。操作部63は、キーボードやタッチパネルを有し、ユーザの操作を受け付ける。表示部64は、液晶ディスプレイを含み、ユーザが検索した見出し語等を表示する。
音声信号処理部65は、上記図1〜図4で説明した音声信号処理装置であり、デコーダ部61がデコードしたオーディオ信号を処理してミュージカルノイズを抑制する。D/Aコンバータ66は、音声信号処理部65から出力されたオーディオ信号をアナログのオーディオ信号に変換する。アナログアンプ67は、D/Aコンバータ66でアナログ信号に変換されたオーディオ信号を増幅してスピーカ68に出力する。スピーカ68は、入力されたオーディオ信号を音響として放音する。
上記構成の電子辞書では、メモリ62に記憶されている手本発音のオーディオデータが高圧縮のオーディオデータであって、ミュージカルノイズを含むものであっても、音声信号処理部65でこれをミュージカルノイズでない成分とすることができるため、手本発音を聴きやすい音声で再生することができる。
上記実施形態では、人間の発話音声を圧縮したオーディオデータを再生する場合について説明したが、目的とする音声信号は人間の発話音声に限定されない。たとえば、楽器の楽音等に適用してもよい。また、目的とする音声信号が異なれば、その周波数分布や音質的特性が異なり、それに応じてミュージカルノイズが発生する周波数帯域も変化するが、上の実施形態で述べた各フィルタのカットオフ周波数は一例であり、目的とする音声信号に合わせて適宜設定されるものである。
11…レベル比較部
12…係数発生部
14…高域カットフィルタ
12…係数発生部
14…高域カットフィルタ
Claims (4)
- ミュージカルノイズを含む音声信号であるソース信号を入力する入力部と、
前記ソース信号を、このソース信号中の目的とする信号成分を含む周波数帯域である目的帯域の成分と、その他の周波数帯域の成分に分離し、前記目的帯域の成分と前記その他の周波数帯域の成分とを比較するレベル比較部と、
前記ソース信号をフィルタリングするフィルタと、
前記フィルタにフィルタ係数をセットするフィルタ係数発生部であって、前記レベル比較部の比較結果が、前記その他の周波数帯域の成分が優勢である旨の結果であったとき、前記その他の周波数帯域がカットされるようにフィルタ係数を変更するフィルタ係数発生部と、
を備えた音声信号処理装置。 - 前記目的とする信号成分は、人間の発話音声の信号成分である請求項1に記載の音声信号処理装置。
- 前記周波数分離部は、略4kHz以下の周波数帯域を目的帯域とし、前記略4kHzを超える周波数をその他の周波数帯域とする請求項2に記載の音声信号処理装置。
- ミュージカルノイズを生じる程度までに圧縮された圧縮音声信号を記憶する記憶部と、
前記記憶部に記憶されている圧縮音声信号を伸長してソース信号として出力するデコード部と、
デコード部が出力したソース信号が入力される請求項1乃至請求項3のいずれかに記載の音声信号処理装置と、
を備えた音声再生装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007165688A JP2009003297A (ja) | 2007-06-22 | 2007-06-22 | 音声信号処理装置および音声再生装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007165688A JP2009003297A (ja) | 2007-06-22 | 2007-06-22 | 音声信号処理装置および音声再生装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009003297A true JP2009003297A (ja) | 2009-01-08 |
Family
ID=40319718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007165688A Pending JP2009003297A (ja) | 2007-06-22 | 2007-06-22 | 音声信号処理装置および音声再生装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2009003297A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020190606A (ja) * | 2019-05-21 | 2020-11-26 | 日本放送協会 | 音声雑音除去装置及びプログラム |
-
2007
- 2007-06-22 JP JP2007165688A patent/JP2009003297A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020190606A (ja) * | 2019-05-21 | 2020-11-26 | 日本放送協会 | 音声雑音除去装置及びプログラム |
JP7316093B2 (ja) | 2019-05-21 | 2023-07-27 | 日本放送協会 | 音声雑音除去装置及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3875513B2 (ja) | デジタルに圧縮されたスピーチの了解度を向上させる方法および装置 | |
JP4640461B2 (ja) | 音量調整装置およびプログラム | |
RU2469423C2 (ru) | Повышение разборчивости речи с помощью четкости голоса | |
KR100905585B1 (ko) | 음성신호의 대역폭 확장 제어 방법 및 장치 | |
WO2004086362A1 (ja) | 音声信号雑音除去装置、音声信号雑音除去方法及びプログラム | |
EP1426926B1 (en) | Apparatus and method for changing the playback rate of recorded speech | |
JP2005157363A (ja) | フォルマント帯域を利用したダイアログエンハンシング方法及び装置 | |
JP2009244650A (ja) | 音声再生装置 | |
JPH0968997A (ja) | 音声処理方法及び装置 | |
JP2009003297A (ja) | 音声信号処理装置および音声再生装置 | |
JP5590021B2 (ja) | 音声明瞭化装置 | |
JP5345638B2 (ja) | 瞬時ピークレベル管理とスピーチの清澄の改良方法 | |
JP2008072600A (ja) | 音響信号処理装置、音響信号処理プログラム、音響信号処理方法 | |
JP2006333396A (ja) | 音声信号拡声装置 | |
JP3961616B2 (ja) | 話速変換方法および話速変換機能付補聴器 | |
JP2008102551A (ja) | 音声信号の処理装置およびその処理方法 | |
JPH0229232B2 (ja) | ||
KR100883896B1 (ko) | 음성명료도 향상장치 및 방법 | |
JP4900062B2 (ja) | 音声信号処理装置、音声再生装置および音声信号処理方法 | |
Yoo et al. | Relative energy and intelligibility of transient speech information | |
JP4826814B2 (ja) | 音声信号処理装置 | |
JP6159570B2 (ja) | 音声強調装置、及びプログラム | |
JP3102553B2 (ja) | 音声信号処理装置 | |
JP2011141540A (ja) | 音声信号処理装置、テレビジョン受像機、音声信号処理方法、プログラム、および、記録媒体 | |
TW569183B (en) | Noise cancellation method |