JP2013126063A - 音声信号処理装置 - Google Patents
音声信号処理装置 Download PDFInfo
- Publication number
- JP2013126063A JP2013126063A JP2011273106A JP2011273106A JP2013126063A JP 2013126063 A JP2013126063 A JP 2013126063A JP 2011273106 A JP2011273106 A JP 2011273106A JP 2011273106 A JP2011273106 A JP 2011273106A JP 2013126063 A JP2013126063 A JP 2013126063A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- signal
- attenuator
- input
- lpf
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
【課題】最大振幅の周波数帯域位置に応じて入力音声信号のダイナミックレンジの圧縮量を制御することで、簡単な回路構成で、異音の発生と音揺れ感とを適切に抑制し、高品位の音声を出力できるようにする。
【解決手段】音声信号処理装置は、入力音声信号のダイナミックレンジを圧縮して出力するアッテネータ30と、アッテネータ30の前で分岐した入力経路上に配置され、入力音声信号の所定の高周波数領域を減衰させて出力するLPF10と、LPF10から出力された音声信号の信号レベルを検出し、その検出した信号レベル基づき、アッテネータ30によるダイナミックレンジの圧縮を制御する信号レベル制御部20とを有する。アッテネータ30は、信号レベル制御部20による制御に基づき、LPF10を経ずに入力した入力音声信号を圧縮する。
【選択図】図1
【解決手段】音声信号処理装置は、入力音声信号のダイナミックレンジを圧縮して出力するアッテネータ30と、アッテネータ30の前で分岐した入力経路上に配置され、入力音声信号の所定の高周波数領域を減衰させて出力するLPF10と、LPF10から出力された音声信号の信号レベルを検出し、その検出した信号レベル基づき、アッテネータ30によるダイナミックレンジの圧縮を制御する信号レベル制御部20とを有する。アッテネータ30は、信号レベル制御部20による制御に基づき、LPF10を経ずに入力した入力音声信号を圧縮する。
【選択図】図1
Description
本発明は、音声信号処理装置、より詳細には、入力音声信号のダイナミックレンジを制御することで、高品位の音声を出力できるようにした音声信号処理装置に関する。
入力音声信号に対する音質改善処理技術に関して、入力音声信号の状態に応じて出力信号のダイナミックレンジを圧縮することで、音質の劣化を抑えるDRC(Dynamic Range Compression)に係る技術が知られている。この技術においては、DRC機能を有する音声信号処理装置から出力された音声信号が後段のアンプ等で増幅されるときに、クリップによる異音等の音質劣化が生じないようにするために、入力音声信号の最大振幅が所定レベルより大きい場合に、そのダイナミックレンジを圧縮する信号処理が行われる。
図5〜図6は、DRC機能がない場合の音声信号の出力状態を説明する図である。各図において縦軸の変化量が振幅、横軸は時間を示している。
ここではアンプによって入力音声信号を増幅し、スピーカなどから音声出力させる構成を考える。アンプでは、通常音声信号に一定のゲインを付与して増幅し、スピーカ等に出力する。このとき、例えば図5(A)のように、入力音声信号の振幅が十分に小さい音声信号が入力したものとする。そして図5(B)のように、振幅が十分に小さい入力信号をアンプで増幅したとしても、アンプにおけるクリップレベルCLを超えることなく、音声信号の波形がそのまま増幅されて出力される。
ここではアンプによって入力音声信号を増幅し、スピーカなどから音声出力させる構成を考える。アンプでは、通常音声信号に一定のゲインを付与して増幅し、スピーカ等に出力する。このとき、例えば図5(A)のように、入力音声信号の振幅が十分に小さい音声信号が入力したものとする。そして図5(B)のように、振幅が十分に小さい入力信号をアンプで増幅したとしても、アンプにおけるクリップレベルCLを超えることなく、音声信号の波形がそのまま増幅されて出力される。
一方、図6(A)に示すように、振幅の大きい音声信号が入力したものとする。この場合もアンプでは一定のゲインにより入力音声信号を増幅する。このとき、図6(B)に示すように、アンプの特性によってクリップレベルCL以上に増幅された振幅はクリップされる。つまり、入力音声信号の振幅が所定レベル以上に大きい場合には、アンプのクリップにより波形が乱れて、異音が発生する原因となる。
図7〜図8は、DRC機能を付加した場合の音声信号の出力状態を説明する図である。入力音声信号は、DRC機能を有する音声信号処理装置で信号処理され、アンプで増幅されてスピーカ等に出力される。
この場合、図7(A)に示すように、入力音声信号の振幅が十分に小さい場合、具体的にはDRCに設定されているスレッショルドより小さい振幅の音声信号の場合には、図7(B)に示すように、DRCの圧縮機能は動作することなく、入力音声信号はそのまま振幅が維持されてアンプに出力される。そして図7(C)に示すように、アンプではその音声信号に一定のゲインが付与されて増幅されるが、この場合には、アンプでは、増幅された音声信号がクリップレベルCLを超えることなく出力され、クリップに起因する異音は発生しない。
この場合、図7(A)に示すように、入力音声信号の振幅が十分に小さい場合、具体的にはDRCに設定されているスレッショルドより小さい振幅の音声信号の場合には、図7(B)に示すように、DRCの圧縮機能は動作することなく、入力音声信号はそのまま振幅が維持されてアンプに出力される。そして図7(C)に示すように、アンプではその音声信号に一定のゲインが付与されて増幅されるが、この場合には、アンプでは、増幅された音声信号がクリップレベルCLを超えることなく出力され、クリップに起因する異音は発生しない。
一方、図8(A)に示すように、DRC機能に設定されているスレッショルドのレベル以上の最大振幅を有する入力音声信号の場合には、図8(B)に示すように、DRCの圧縮機能が動作し、音声信号のダイナミックレンジを圧縮する信号処理が行われる。この音声信号をアンプにて増幅すると、図8(C)に示すように、増幅された音声信号の振幅がアンプのクリップレベルCLを超えることがないため、音声信号をクリップすることなく増幅することができる。つまりアンプの前段でDRCによる信号処理を行うことにより、後段のアンプにてクリップによる異音の発生を抑えることができる。
DRCに係る先行技術に関して、例えば特許文献1には、聴き易い音声を出力することを目的とした音声処理回路が開示されている。この音声処理回路は、入力信号を複数の周波数帯域に分割してそれぞれの信号に非線形処理を施し、非線形処理を施した信号を加算して出力信号を生成する。この音声処理回路によれば、分割した信号のレベルと外部から指定可能な係数とに基づいて決定されるゲインを、分割した信号のそれぞれに乗算するため、非線形処理後の音声信号に対してゲインを乗算する形態に比較して、出力信号のS/N比を劣化させることなく歪を抑制できるとされている。
また、特許文献2には、広範囲の音楽に対して好適な再生音を提供するオーディオ信号処理装置を得ることを目的としたオーディオ信号処理装置が開示されている。この装置は、低域通過フィルタよび高域通過フィルタによって、オーディオ信号を低音域信号と高音域信号とに帯域分割し、波高値分析器によって低音域信号の波高値を分析する。そして遅延部により、低音域信号および高音域信号を遅延させる。電圧制御型増幅器は、波高値分析器の分析結果に応じて遅延部の出力のレベルを圧縮し、圧縮された低音域信号と遅延部からの高音域信号とを混合回路によって混合する。
図9は、DRCによる圧縮処理の動作を説明する図である。上記のように、DRCによる信号処理技術では、入力音声信号の振幅に応じて後段のアンプでクリップが生じないように、適宜ダイナミックレンジを圧縮する処理が行われる。
ここでDRCでは、最大振幅の大きい音声信号が後段のアンプでクリップしないように、所定の振幅レベルにスレッショルドを設定する。例えば、図9(A)に示すような周波数特性を有する音声信号Q10が入力したものとする。この場合、DRCでは、所定のスレッショルドThに基づいて、スレッショルドThよりも振幅の大きい最大振幅jを検出し、スレッショルドを超えた分だけ振幅を圧縮する。
ここでDRCでは、最大振幅の大きい音声信号が後段のアンプでクリップしないように、所定の振幅レベルにスレッショルドを設定する。例えば、図9(A)に示すような周波数特性を有する音声信号Q10が入力したものとする。この場合、DRCでは、所定のスレッショルドThに基づいて、スレッショルドThよりも振幅の大きい最大振幅jを検出し、スレッショルドを超えた分だけ振幅を圧縮する。
図9(B)に圧縮された状態の音声信号Q11を示す。この場合、DRCでは、音声信号Q10における最大振幅jとスレッショルドThとの差分だけ入力音声信号Q10を圧縮する。圧縮は音声信号全体に一律に付与され、圧縮後の音声信号はQ11となる。このとき最大振幅はkのレベルとなり、スレッショルドThの振幅レベルにまで低下する。
このようにDRCでは、所定のスレッショルドThを設けて、スレッショルドThを超える振幅を有する音声信号に対しては、最大振幅とスレッショルドとの差分だけ圧縮して出力することで、後段のアンプにおける増幅時にクリップによる異音の発生を抑制するようにしている。
このようにDRCでは、所定のスレッショルドThを設けて、スレッショルドThを超える振幅を有する音声信号に対しては、最大振幅とスレッショルドとの差分だけ圧縮して出力することで、後段のアンプにおける増幅時にクリップによる異音の発生を抑制するようにしている。
しかしながら、DRCを一律に動作させて信号処理を行うと、入力音声信号の状態によっては人間の耳に異常な音揺れが感じられ、必ずしも常に音声の品位を保つことができない場合がある。以下にその理由を説明する。
図10は、フレッチャー&マンソン等のラウドネス曲線を示す図である。ラウドネス曲線は、人の聴覚で感じる音の大きさの感覚を示すもので、例えば40ホンの曲線では、100Hzのときは音圧レベルが60dB、1KHzのときは音圧レベルが40dBであり、人間の耳で同じ音圧を感じるためには、100Hzの音は1KHzの音よりも20dBも高い音圧レベルが必要となる。このラウドネス曲線によれば、音量がどのようなレベルであっても2KHz〜5KHzでは人の聴感上非常に感度が良く、7kHz以上は感度が悪いといえる。
図10は、フレッチャー&マンソン等のラウドネス曲線を示す図である。ラウドネス曲線は、人の聴覚で感じる音の大きさの感覚を示すもので、例えば40ホンの曲線では、100Hzのときは音圧レベルが60dB、1KHzのときは音圧レベルが40dBであり、人間の耳で同じ音圧を感じるためには、100Hzの音は1KHzの音よりも20dBも高い音圧レベルが必要となる。このラウドネス曲線によれば、音量がどのようなレベルであっても2KHz〜5KHzでは人の聴感上非常に感度が良く、7kHz以上は感度が悪いといえる。
図11は入力音声信号の異音の聞こえ易さについて説明するための図である。例えば図11(A)のような音声信号を考える。入力音声信号は、S1で示される単振動の正弦波であり、人間の可聴帯域内の約300Hz付近の周波数を有するものとする。
このような音声信号S1がアンプによってクリップされると、その奇数倍の周波数の高調波h1,h2,h3・・が発生し、この高調波が異音となって感じられる。この場合、図11(A)のように高調波h1、h2,h3・・が人間の聴感上感度が良い周波数帯域に発生すると、人の耳には異音による音質劣化が顕著に感じられる。
このような音声信号S1がアンプによってクリップされると、その奇数倍の周波数の高調波h1,h2,h3・・が発生し、この高調波が異音となって感じられる。この場合、図11(A)のように高調波h1、h2,h3・・が人間の聴感上感度が良い周波数帯域に発生すると、人の耳には異音による音質劣化が顕著に感じられる。
一方、図11(B)のように、入力音声信号S1が可聴帯域の比較的高周波数の位置(この例では10kHz)にあった場合、アンプによるクリップにより発生した高調波h1,h2,h3・・の周波数位置は可聴帯域の範囲外となり、人の耳には殆ど聞こえない。あるいは高調波が可聴帯域内で生じたとしても、その帯域は聴感上の感度が低い帯域にあるため、信号のクリップによる異音は聞こえ難い。
上記のように、音声信号は、その周波数特性に応じてクリップ時の異音の聞こえやすさが異なり、異音による音質劣化の感じ方も周波数特性に応じて異なってくる。
これに対して、一律にDRCを適用して、スレッショルド以上の最大振幅を持つ音声信号を圧縮した場合、クリップによる異音よりも、DRC自体が原因となる音の揺れ感による音質劣化を強く感じることがある。
これに対して、一律にDRCを適用して、スレッショルド以上の最大振幅を持つ音声信号を圧縮した場合、クリップによる異音よりも、DRC自体が原因となる音の揺れ感による音質劣化を強く感じることがある。
上記のようにDRCでは、所定のスレッショルドを超える最大振幅をもつ音声信号は、そのダイナミックレンジを圧縮することで振幅を抑えて出力させる。このとき、スレッショルドの設定値を超えると信号全体の振幅が圧縮により急に低下するため、所謂フワっとした音揺れ感が生じる。特に人の聴感上感度の高い2〜5kHz程度の音が圧縮されると、異様な音揺れ感を感じることがある。
DRCの音揺れ感をなくすためにはDRCの動作を停止すればよいが、この場合には、本来的なアンプのクリップによる異音を解決することができない。特に人の聴感上感度の高い周波数帯域、例えば2〜5kHzの音の場合には、DRCの動作による音揺れ感よりも、アンプでのクリップによる異音による音質劣化の影響が大きく、DRCは停止すべきではない。
一方、人の聴感上感度の低い周波数や可聴帯域外の周波数で高調波が生じるような音声信号の場合には、高調波による異音は比較的感じにくいにも係わらず、DRCの動作による音揺れにより違和感が強くなる。つまり通常のDRCでは、聴感上聞こえにくい高調波が生じる周波数帯域の音声信号に対しても、最大振幅がスレッショルドを超えればDRCが反応して動作し、周波数帯域全体に渡って圧縮する。これにより、聴感上感度のよい帯域の音声信号までもが圧縮され、異様な音揺れ感を生じさせてしまう。
このように、音声信号処理装置の後段のアンプでクリップされることによる異音を回避するために、所定のスレッショルドより大きい最大振幅の信号を圧縮するDRCが有効であるが、DRCの動作によって生じる音揺れ感が音質劣化の要因となる場合もあり、異音と音揺れの両方を適切に抑制して、聴感上音質劣化の少ない音声信号処理を行うことができなかった。
特許文献1の音声処理回路は、入力信号を複数の周波数帯域に分割して非線形処理を行うため、一部の周波数帯域で最大振幅が高いときに、周波数帯域の全体が圧縮されて音揺れを感じる、という問題をある程度防ぐことができるが、特許文献1の音声処理回路の場合、回路構成が複雑になって、多くの回路リソースを要するという課題が生じる。また、周波数分割を行って信号処理を行った後、分割された各信号を加算して出力するときに、音声劣化なく精度よく処理を実行できるようにするための設計難易度も高い。
また、特許文献2のオーディ信号処理装置は、高域通過フィルタを経由した高域の音声信号は、圧縮処理を受けることなくそのまま出力される。その結果、高域の信号で最大振幅が大きい場合には、後段のアンプでクリップが生じ、異音が発生してしまう。
本発明は、上述のごとき実情に鑑みてなされたものであり、音声信号の最大振幅に応じてダイナミックレンジを圧縮することで、後段のアンプで音声信号のクリップを生じないようにした構成を備え、最大振幅の周波数帯域位置に応じてダイナミックレンジの圧縮量を制御することで、簡単な回路構成で、異音の発生と音揺れ感とを適切に抑制し、高品位の音声を出力できるようにした音声信号処理装置を提供することを目的とする。
上記課題を解決するために、本発明の第1の技術手段は、入力音声信号のダイナミックレンジを圧縮して出力するアッテネータと、前記アッテネータの前で分岐した入力経路上に配置され、入力音声信号の所定の高周波数領域を減衰させて出力するLPFと、該LPFから出力された音声信号の信号レベルを検出し、該検出した信号レベル基づき、前記アッテネータによる前記ダイナミックレンジの圧縮を制御する信号レベル制御部とを有し、 前記アッテネータは、前記信号レベル制御部による制御に基づき、前記LPFを経ずに入力した入力音声信号を圧縮することを特徴としたものである。
第2の技術手段は、第1の技術手段において、前記信号レベル制御部が、予め定められた振幅値のスレッショルドと前記入力音声信号とを比較し、前記入力音声信号の最大振幅が前記スレッショルドより大きいときに、前記最大振幅と前記スレッショルドとの差分に相当する量を圧縮させるための圧縮量制御信号を生成する信号レベル検出回路を有し、前記アッテネータは、前記信号レベル検出回路が生成した前記圧縮量制御信号に従って、前記入力音声信号のダイナミックレンジを圧縮することを特徴としたものである。
第3の技術手段は、第2の技術手段において、前記信号レベル制御部が、前記アッテネータで前記入力音声信号の圧縮を行うとき、前記圧縮量制御信号により示される圧縮量まで達する時間特性を定めるアタックタイムと、圧縮を解除するまでの時間特性を定めるリリースタイムとが予め設定され、前記信号レベル検出回路により生成された圧縮量制御信号を、前記アタックタイムおよび前記リリースタイムに従って前記アッテネータに適用するレベルコントローラを有することを特徴としたものである。
本発明によれば、音声信号の最大振幅に応じてダイナミックレンジを圧縮することで、後段のアンプで音声信号のクリップを生じないようにした構成を備え、最大振幅の周波数帯域位置に応じてダイナミックレンジの圧縮量を制御することで、簡単な回路構成で、異音の発生と音揺れ感とを適切に抑制し、高品位の音声を出力できるようにした音声信号処理装置を提供することができる。
図1は、本発明に係る音声信号処理装置の構成例を示すブロック図である。音声信号処理装置1は、入力音声信号のダイナミックレンジを圧縮するアッテネータ30と、入力音声信号の周波数のうち、所定の遮断周波数より高い周波数の帯域を減衰させるLPF(Low-Pass Filter)10と、LPF10から出力された音声信号の信号レベルを検出し、入力音声信号を圧縮するための圧縮量制御信号を生成する信号レベル検出回路21と、信号レベル検出回路21で生成された圧縮量制御信号を、予め設定された応答特性に基づいてアッテネータ30に適用することで、アッテネータ30における信号レベルをコントロールするレベルコントローラ22とを有している。信号レベル検出回路21とレベルコントローラ22とによって信号レベル制御部20が構成されている。また、信号レベル制御部20およびアッテネータ30により、DRC(Dynamic Range Compression)40が構成されている。
図2は、本発明に係る音声信号処理装置による音声信号の圧縮処理例を説明するための図である。図1の構成を参照しながらその機能と動作例を説明する。
音声信号処理装置に入力した音声信号は、アッテネータ30と、アッテネータ30の前で分岐した入力経路上に設けられたLPF10とのそれぞれに入力する。図2(A)は、LPF10に入力した音声信号のフィルタリングの様子の一例を示している。ここでThは、信号レベル制御部20の信号レベル検出回路21に設定されている振幅のスレッショルドのレベルを示している。
音声信号処理装置に入力した音声信号は、アッテネータ30と、アッテネータ30の前で分岐した入力経路上に設けられたLPF10とのそれぞれに入力する。図2(A)は、LPF10に入力した音声信号のフィルタリングの様子の一例を示している。ここでThは、信号レベル制御部20の信号レベル検出回路21に設定されている振幅のスレッショルドのレベルを示している。
LPF10に入力した音声信号をQ1とする。LPF10では、周波数帯域の通過特性Cが予め設定され、この通過特性Cに従って入力音声信号をフィルタリング処理して通過させる。ここでは、LPF10には、所定の遮断周波数Fcより大きい周波数帯域の振幅を、周波数の増加に伴って徐々に大きく減衰させる特性が付与されている。そして、LPF10に入力された音声信号Q1は、LPFの通過特性Cに従って減衰され、音声信号Q2となって信号レベル検出回路21に出力される。
信号レベル検出回路21は、予め設定されているスレッショルドThと入力された音声信号とを比較し、スレッショルドThより大きい最大振幅を有する音声信号に対して、アッテネータ30でダイナミックレンジを圧縮させる圧縮量を決定し、その圧縮量を示す圧縮量制御信号を出力する。圧縮量制御信号は、例えばアッテネータ30に適用する目標圧縮量を示すボリューム値として生成される。この例では、音声信号Q1の最大振幅aは、遮断周波数Fcよりもやや高い周波数位置(約5kHz)にあり、音声信号Q1がLPF10を通過すると、最大振幅aの振幅レベルはbのレベルにまで若干減衰されて出力される。
LPF10を通過して信号レベル検出回路21に入力した音声信号Q2は、所定のスレッショルドThと比較され、最大振幅がスレッショルドThより高い場合に、その差分だけ振幅を圧縮させる。この例では、圧縮量pは、LPF10を通過後の音声信号Q2の最大振幅bとスレッショルドThとの差分となる。
信号レベル検出回路21では、圧縮量pをアッテネータ30に適用するための圧縮量制御信号を生成して出力する。一例として、検出した最大振幅とスレッショルドThとの比(Th/最大振幅)を示すボリューム値を圧縮量制御信号として出力する。
信号レベル検出回路21では、圧縮量pをアッテネータ30に適用するための圧縮量制御信号を生成して出力する。一例として、検出した最大振幅とスレッショルドThとの比(Th/最大振幅)を示すボリューム値を圧縮量制御信号として出力する。
信号レベル検出回路21から出力された圧縮量制御信号は、レベルコントローラ22に入力される。レベルコントローラ22は、予め設定されているアタックタイムとリリースタイムとに従って、信号レベル検出回路21から出力された圧縮量制御信号をアッテネータ30に適用する。アタックタイムは、圧縮制御信号により示される圧縮量まで達する時間特性を定めるもので、例えば立ち上がり時定数によって示される。また、リリースタイムは、圧縮を解除するまでの時間特性を定めるもので、例えば立ち下がり時定数によって示される。アタックタイムとリリースタイムを適宜設定することによって、圧縮量制御信号をアッテネータ30に適用するときのアッテネータ30の応答特性を設定することができる。
アッテネータ30では、レベルコントローラ22により応答特性が設定された圧縮量制御信号に従って入力音声信号のダイナミックレンジを圧縮する処理を行う。この場合、アッテネータ30に入力する音声信号は、LPF10にて作用を受けることなく直接に入力されたものである。従って、LPF10から信号レベル制御部20の経路では、アッテネータ30に適用するダイナミックレンジの圧縮のための圧縮量制御信号とその応答特性だけが決定され、実際に音声出力される音声信号に対する信号処理は行われない。
図2(B)に示すように、アッテネータ30には、信号レベル検出回路21で決定された圧縮量pを示す圧縮量制御信号が適用され、入力音声信号Q1のダイナミックレンジがその圧縮量pの分だけ圧縮される。圧縮は全周波数帯域で均等に行われ、圧縮後の音声信号はQ3となる。このとき入力音声信号Q1の最大振幅aは、cのレベルにまで圧縮される。この例では、LPF10によって、最大振幅aが若干減衰されているが、減衰量が比較的少ないため、LPF10のない状態でのダイナミックレンジの圧縮量(a―Th)に近い圧縮量で圧縮される。
図3は、本発明に係る音声信号処理装置による音声信号の圧縮処理の他の例を説明するための図である。音声信号処理装置に対する入力音声信号として、図3(A)に示すような音声信号Q4が入力したものとする。LPF10では、図2の例と同様の周波数帯域の通過特性Cが予め設定され、この通過特性Cに従って入力音声信号をフィルタリング処理して通過させる。LPF10に入力された音声信号Q4は、LPFの通過特性Cに従って減衰され、音声信号Q5となって信号レベル検出回路21に出力される。
信号レベル検出回路21は、予め設定されているスレッショルドThと入力された音声信号Q4とを比較し、スレッショルドThより大きい最大振幅を有する音声信号に対して、アッテネータ30でダイナミックレンジを圧縮させる圧縮量を決定し、その圧縮量を示す圧縮量制御信号を出力する。この例では、音声信号Q4の最大振幅dは、約9kHzにあり、図2の例の最大振幅aよりも高周波数側にある。音声信号Q4がLPF10を通過すると、最大振幅dは、eのレベルまで大きく減衰されて出力される。
LPF10を通過して信号レベル検出回路21に入力した音声信号Q5は、所定のスレッショルドThと比較され、最大振幅がスレッショルドThより高い場合に、その差分だけ振幅を圧縮させる。この例では、圧縮量pは、LPF10を通過後の音声信号Q5の最大振幅eとスレッショルドThとの差分となる。
信号レベル検出回路21では、圧縮量pをアッテネータ30に設定するためのボリューム値を生成して出力する。一例として、検出した最大振幅とスレッショルドThとの比(Th/最大振幅)の値をボリューム値として出力する。
信号レベル検出回路21では、圧縮量pをアッテネータ30に設定するためのボリューム値を生成して出力する。一例として、検出した最大振幅とスレッショルドThとの比(Th/最大振幅)の値をボリューム値として出力する。
信号レベル検出回路21から出力された圧縮量制御信号は、レベルコントローラ22に入力される。レベルコントローラ22は、予め設定されているアタックタイムとリリースタイムとに従って、信号レベル検出回路21から出力された圧縮量制御信号をアッテネータ30に適用する。アッテネータ30では、レベルコントローラ22により応答特性が設定された圧縮量制御信号に従って入力音声信号のダイナミックレンジを圧縮する処理を行う。
図3(B)に示すように、アッテネータ30には、信号レベル検出回路21で決定された圧縮量pを示す圧縮量制御信号が適用され、入力音声信号Q4のダイナミックレンジがその圧縮量pの分だけ圧縮される。圧縮は全周波数帯域で均等に行われ、圧縮後の音声信号はQ6となる。このとき最大振幅dは、fのレベルにまで圧縮される。この例では、LPF10によって、最大振幅dが減衰された減衰量は、図2の例に比較して大きいため、LPF10のない状態でのダイナミックレンジの圧縮量(a−Th)よりも圧縮量が大きく低減されている。
図4は、本発明に係る音声信号処理装置による音声信号の圧縮処理の更に他の例を説明するための図である。音声信号処理装置に対する入力音声信号として、図4(A)に示すような音声信号Q7が入力したものとする。LPF10では、上記の各例と同様の周波数帯域の通過特性Cが予め設定され、この通過特性Cに従って入力音声信号をフィルタリング処理して通過させる。LPF10に入力された音声信号Q7は、LPFの通過特性Cに従って減衰され、音声信号Q8となって信号レベル検出回路21に出力される。
信号レベル検出回路21は、予め設定されているスレッショルドThと入力された音声信号Q8とを比較し、スレッショルドThより大きい最大振幅を有する音声信号に対して、アッテネータ30でダイナミックレンジを圧縮させる圧縮量を決定し、その圧縮量を示す圧縮量制御信号を出力する。この例では、音声信号Q7の最大振幅gは、約13kHzの位置にあり、図3の例の最大振幅dよりもさらに高周波数側にある。音声信号Q7がLPF10を通過すると、最大振幅dは、hのレベルまでさらに大きく減衰されて出力される。
LPF10を通過して信号レベル検出回路21に入力した音声信号Q8は、所定のスレッショルドThと比較され、最大振幅がスレッショルドThより高い場合に、その差分だけ振幅を圧縮させる。しかしながらこの例では、LPF10を通過後の最大振幅hは、スレッショルドThよりも低くなっている。従って、信号レベル検出回路21では、入力音声信号のダイナミックレンジを圧縮する必要がないとして、その旨を示す圧縮量制御信号を出力する。ここでは上記のボリューム値を所定の値にすることよって、圧縮する必要がないことを示すものとしてもよい。
信号レベル検出回路21から出力された圧縮量制御信号は、レベルコントローラ22に入力されるが、レベルコントローラ22では、アッテネータ30にて音声信号を圧縮する必要がないと判断し、アッテネータ30に対する圧縮制御を行わない。これにより、アッテネータ30では、入力音声信号Q7がそのまま出力され、最大振幅gの振幅レベルも維持される。
上記の図2〜図4の例でわかるように、LPFの減衰特性を適切に設定し、所定の遮断周波数Fcより高い周波数領域では、周波数が高くになるに従って徐々に減衰量が大きくなるものを使用する。このようなLPFは、比較的汎用的で、引用文献1に記載されたような複雑な回路構成のものを用いることなく簡単な回路構成で実現できる。
そして上記のLPFにより、遮断周波数Fcより大きい周波数領域で、減衰後の最大振幅がスレッショルド以上の範囲では、最大振幅に基づき入力音声信号のダイナミックレンジを圧縮させる。
このときに、図2のように、その周波数領域の中で相対的に低い周波数域に最大振幅が存在する場合には、LPFによる減衰量は相対的に少なくなる。これにより、最大振幅とスレッショルドとを比較したときにその差が比較的大きくなり、その結果アッテネータ30による圧縮量が相対的に大きくなる。つまり、後段のアンプでクリップされるときの異音に対する聴感上の感度が高い低周波数領域で、ダイナミックレンジの圧縮率が相対的に高くなり、人に聞こえ易い周波数領域での異音の発生を効果的に抑制することができる。
このときに、図2のように、その周波数領域の中で相対的に低い周波数域に最大振幅が存在する場合には、LPFによる減衰量は相対的に少なくなる。これにより、最大振幅とスレッショルドとを比較したときにその差が比較的大きくなり、その結果アッテネータ30による圧縮量が相対的に大きくなる。つまり、後段のアンプでクリップされるときの異音に対する聴感上の感度が高い低周波数領域で、ダイナミックレンジの圧縮率が相対的に高くなり、人に聞こえ易い周波数領域での異音の発生を効果的に抑制することができる。
一方、図3のように、遮断周波数Fcより高い周波数領域で、その周波数領域の中で相対的に高い周波数域に最大振幅が存在する場合には、LPFによる減衰量は相対的に大きくなる。これにより、最大振幅とスレッショルドとを比較したときにその差が比較的小さくなり、その結果アッテネータ30による圧縮量が相対的に小さくなる。これにより後段のアンプでクリップされるときの異音が聴感上聞こえにくい(感度が低い)低周波数領域でダイナミックレンジの圧縮量が相対的に低くなり、クリップが発生しても人にはそれほど気にならず、圧縮率が低いために音揺れ感が抑えられて、安定感のある高品位の音声出力を行うことができる。
また、周波数帯域がさらに高くなると、図4に示すように、LPF10で減衰させた後の最大振幅がスレッショルドより小さくなる。この場合には、アッテネータ30による圧縮が行われることなく、入力音声信号はそのまま出力される。このような高周波数帯域では、アンプでクリップされたとしても聴感上、異音が発生する周波数帯域が可聴域外かもしくは感度が極めて低い帯域にあるため、クリップの発生をそのまま放置しても、異音を強く感じることなく音揺れ感の発生を抑えるようにすることができる。
上記のLPFの特性、つまり遮断周波数の位置や遮断周波数より高周波数帯域の減衰特性、及び信号レベル検出回路21に設定するスレッショルドの値は適宜設定することができる。従って、聴感特性上の感度を鑑みて適切な位置に遮断周波数、およびスレッショルドを設定し、後段のアンプでのクリップによる異音に対する聴感上の感度が比較的低い領域でダイナミックレンジの圧縮量を抑えて、もしくは圧縮しないようにして、効果的に音揺れ感の発生を抑制できるようにすることが望ましい。
また、遮断周波数より高い周波数領域では、LPFの減衰量を周波数が高くなるに従って徐々に大きくする特性とすることで、比較的聴感上の感度が高い周波数帯から低い周波数帯に向けて徐々に圧縮率を低減させることができ、これにより聴感上の感度の高い領域では圧縮率を確保してクリップによる異音を抑制し、徐々に高波長域になるに従って、圧縮率を低減させて音揺れ感をより抑制するように設定することができる。このLPFの減衰特性についても、聴感上の特性や音質の設計思想等に従って適宜定めることができる。
また、レベルコントローラ22ではアタックタイムとリリースタイムを適宜設定することで、アッテネータ30における信号圧縮処理の応答特性を制御することができる。また、本発明に係る音声信号処理装置は、レベルコントローラ22は必須の構成ではなく、信号レベル制御部20に信号レベル検出回路21を備え、信号レベル検出回路21から出力された圧縮量制御信号をアッテネータ30に適用して、アッテネータ30にて適宜入力音声信号を圧縮させるようにしてもよい。
1…音声信号処理装置、10…LPF、20…信号レベル制御部、21…信号レベル検出回路、22…レベルコントローラ、30…アッテネータ。
Claims (3)
- 入力音声信号のダイナミックレンジを圧縮して出力するアッテネータと、
前記アッテネータの前で分岐した入力経路上に配置され、入力音声信号の所定の高周波数領域を減衰させて出力するLPFと、
該LPFから出力された音声信号の信号レベルを検出し、該検出した信号レベル基づき、前記アッテネータによる前記ダイナミックレンジの圧縮を制御する信号レベル制御部とを有し、
前記アッテネータは、前記信号レベル制御部による制御に基づき、前記LPFを経ずに入力した入力音声信号を圧縮することを特徴とする音声信号処理装置。 - 請求項1に記載の音声信号処理装置において、
前記信号レベル制御部は、
予め定められた振幅値のスレッショルドと前記入力音声信号とを比較し、前記入力音声信号の最大振幅が前記スレッショルドより大きいときに、前記最大振幅と前記スレッショルドとの差分に相当する量を圧縮させるための圧縮量制御信号を生成する信号レベル検出回路を有し、
前記アッテネータは、前記信号レベル検出回路が生成した前記圧縮量制御信号に従って、前記入力音声信号のダイナミックレンジを圧縮することを特徴とする音声信号処理装置。 - 請求項2に記載の音声信号処理装置において、
前記信号レベル制御部は、
前記アッテネータで前記入力音声信号の圧縮を行うとき、前記圧縮量制御信号により示される圧縮量まで達する時間特性を定めるアタックタイムと、圧縮を解除するまでの時間特性を定めるリリースタイムとが予め設定され、前記信号レベル検出回路により生成された圧縮量制御信号を、前記アタックタイムおよび前記リリースタイムに従って前記アッテネータに適用するレベルコントローラを有することを特徴とする音声信号処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011273106A JP2013126063A (ja) | 2011-12-14 | 2011-12-14 | 音声信号処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011273106A JP2013126063A (ja) | 2011-12-14 | 2011-12-14 | 音声信号処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013126063A true JP2013126063A (ja) | 2013-06-24 |
Family
ID=48777084
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011273106A Pending JP2013126063A (ja) | 2011-12-14 | 2011-12-14 | 音声信号処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013126063A (ja) |
-
2011
- 2011-12-14 JP JP2011273106A patent/JP2013126063A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110326308B (zh) | 失真感测、防失真、以及失真察觉低音增强 | |
KR101482488B1 (ko) | 개선된 오디오를 위한 통합된 심리음향 베이스 강화 (pbe) | |
JP4787255B2 (ja) | 高雑音環境における提示のためのオーディオ信号処理システム及び方法 | |
US9881601B2 (en) | Controlling stability in ANR devices | |
JP5602309B2 (ja) | オーディオ信号の臨界周波数帯域における歪みを制御する方法とシステム | |
EP2856777B1 (en) | Adaptive bass processing system | |
JP6063230B2 (ja) | 歪み音補正補完装置および歪み音補正補完方法 | |
JP2017515149A5 (ja) | ||
KR20070050930A (ko) | 고 잡음 환경에서의 음향 표현을 위한 오디오 신호 처리시스템 및 방법 | |
US20080152168A1 (en) | Audio signal frequency range boost circuits | |
JP2012090092A (ja) | 音響信号処理装置 | |
JP5345067B2 (ja) | 聴覚感度補正装置 | |
DK2244491T4 (en) | A method of operating a hearing device and the hearing aid with a frekvensomskifter | |
JP6609698B2 (ja) | 歪みを制限するためのシステムおよび方法 | |
JP2012151767A (ja) | オーディオ信号処理装置およびオーディオアンプ | |
JP2018531557A6 (ja) | 歪みを制限するためのシステムおよび方法 | |
KR101981575B1 (ko) | 초지향성 초음파 스피커 장치의 음질개선 방법 및 이를 구비한 초음파 스피커 장치 | |
JP2009021843A (ja) | 音響信号処理装置及び音響信号処理方法 | |
JP5168208B2 (ja) | オーディオ信号処理装置およびスピーカ装置 | |
WO2017183405A1 (ja) | 音響処理装置および音響処理方法 | |
JP5715910B2 (ja) | ダイナミックレンジ拡張装置 | |
JP2013126063A (ja) | 音声信号処理装置 | |
JP5841405B2 (ja) | ダイナミックレンジ拡張装置 | |
JP6155132B2 (ja) | 低域補完装置および低域補完方法 | |
JP2012147179A (ja) | 低音増強装置、低音増強方法及びコンピュータプログラム |