JP2013126063A

JP2013126063A - 音声信号処理装置

Info

Publication number: JP2013126063A
Application number: JP2011273106A
Authority: JP
Inventors: Kenji Yanagihara; 謙志柳原
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2011-12-14
Filing date: 2011-12-14
Publication date: 2013-06-24

Abstract

【課題】最大振幅の周波数帯域位置に応じて入力音声信号のダイナミックレンジの圧縮量を制御することで、簡単な回路構成で、異音の発生と音揺れ感とを適切に抑制し、高品位の音声を出力できるようにする。
【解決手段】音声信号処理装置は、入力音声信号のダイナミックレンジを圧縮して出力するアッテネータ３０と、アッテネータ３０の前で分岐した入力経路上に配置され、入力音声信号の所定の高周波数領域を減衰させて出力するＬＰＦ１０と、ＬＰＦ１０から出力された音声信号の信号レベルを検出し、その検出した信号レベル基づき、アッテネータ３０によるダイナミックレンジの圧縮を制御する信号レベル制御部２０とを有する。アッテネータ３０は、信号レベル制御部２０による制御に基づき、ＬＰＦ１０を経ずに入力した入力音声信号を圧縮する。
【選択図】図１

Description

本発明は、音声信号処理装置、より詳細には、入力音声信号のダイナミックレンジを制御することで、高品位の音声を出力できるようにした音声信号処理装置に関する。

入力音声信号に対する音質改善処理技術に関して、入力音声信号の状態に応じて出力信号のダイナミックレンジを圧縮することで、音質の劣化を抑えるＤＲＣ（Dynamic Range Compression）に係る技術が知られている。この技術においては、ＤＲＣ機能を有する音声信号処理装置から出力された音声信号が後段のアンプ等で増幅されるときに、クリップによる異音等の音質劣化が生じないようにするために、入力音声信号の最大振幅が所定レベルより大きい場合に、そのダイナミックレンジを圧縮する信号処理が行われる。

図５〜図６は、ＤＲＣ機能がない場合の音声信号の出力状態を説明する図である。各図において縦軸の変化量が振幅、横軸は時間を示している。
ここではアンプによって入力音声信号を増幅し、スピーカなどから音声出力させる構成を考える。アンプでは、通常音声信号に一定のゲインを付与して増幅し、スピーカ等に出力する。このとき、例えば図５（Ａ）のように、入力音声信号の振幅が十分に小さい音声信号が入力したものとする。そして図５（Ｂ）のように、振幅が十分に小さい入力信号をアンプで増幅したとしても、アンプにおけるクリップレベルＣＬを超えることなく、音声信号の波形がそのまま増幅されて出力される。

一方、図６（Ａ）に示すように、振幅の大きい音声信号が入力したものとする。この場合もアンプでは一定のゲインにより入力音声信号を増幅する。このとき、図６（Ｂ）に示すように、アンプの特性によってクリップレベルＣＬ以上に増幅された振幅はクリップされる。つまり、入力音声信号の振幅が所定レベル以上に大きい場合には、アンプのクリップにより波形が乱れて、異音が発生する原因となる。

図７〜図８は、ＤＲＣ機能を付加した場合の音声信号の出力状態を説明する図である。入力音声信号は、ＤＲＣ機能を有する音声信号処理装置で信号処理され、アンプで増幅されてスピーカ等に出力される。
この場合、図７（Ａ）に示すように、入力音声信号の振幅が十分に小さい場合、具体的にはＤＲＣに設定されているスレッショルドより小さい振幅の音声信号の場合には、図７（Ｂ）に示すように、ＤＲＣの圧縮機能は動作することなく、入力音声信号はそのまま振幅が維持されてアンプに出力される。そして図７（Ｃ）に示すように、アンプではその音声信号に一定のゲインが付与されて増幅されるが、この場合には、アンプでは、増幅された音声信号がクリップレベルＣＬを超えることなく出力され、クリップに起因する異音は発生しない。

一方、図８（Ａ）に示すように、ＤＲＣ機能に設定されているスレッショルドのレベル以上の最大振幅を有する入力音声信号の場合には、図８（Ｂ）に示すように、ＤＲＣの圧縮機能が動作し、音声信号のダイナミックレンジを圧縮する信号処理が行われる。この音声信号をアンプにて増幅すると、図８（Ｃ）に示すように、増幅された音声信号の振幅がアンプのクリップレベルＣＬを超えることがないため、音声信号をクリップすることなく増幅することができる。つまりアンプの前段でＤＲＣによる信号処理を行うことにより、後段のアンプにてクリップによる異音の発生を抑えることができる。

ＤＲＣに係る先行技術に関して、例えば特許文献１には、聴き易い音声を出力することを目的とした音声処理回路が開示されている。この音声処理回路は、入力信号を複数の周波数帯域に分割してそれぞれの信号に非線形処理を施し、非線形処理を施した信号を加算して出力信号を生成する。この音声処理回路によれば、分割した信号のレベルと外部から指定可能な係数とに基づいて決定されるゲインを、分割した信号のそれぞれに乗算するため、非線形処理後の音声信号に対してゲインを乗算する形態に比較して、出力信号のＳ／Ｎ比を劣化させることなく歪を抑制できるとされている。

また、特許文献２には、広範囲の音楽に対して好適な再生音を提供するオーディオ信号処理装置を得ることを目的としたオーディオ信号処理装置が開示されている。この装置は、低域通過フィルタよび高域通過フィルタによって、オーディオ信号を低音域信号と高音域信号とに帯域分割し、波高値分析器によって低音域信号の波高値を分析する。そして遅延部により、低音域信号および高音域信号を遅延させる。電圧制御型増幅器は、波高値分析器の分析結果に応じて遅延部の出力のレベルを圧縮し、圧縮された低音域信号と遅延部からの高音域信号とを混合回路によって混合する。

特開２０１０−１０９６２４号公報特開平６−１７７６８８号公報

図９は、ＤＲＣによる圧縮処理の動作を説明する図である。上記のように、ＤＲＣによる信号処理技術では、入力音声信号の振幅に応じて後段のアンプでクリップが生じないように、適宜ダイナミックレンジを圧縮する処理が行われる。
ここでＤＲＣでは、最大振幅の大きい音声信号が後段のアンプでクリップしないように、所定の振幅レベルにスレッショルドを設定する。例えば、図９（Ａ）に示すような周波数特性を有する音声信号Ｑ１０が入力したものとする。この場合、ＤＲＣでは、所定のスレッショルドＴｈに基づいて、スレッショルドＴｈよりも振幅の大きい最大振幅ｊを検出し、スレッショルドを超えた分だけ振幅を圧縮する。

図９（Ｂ）に圧縮された状態の音声信号Ｑ１１を示す。この場合、ＤＲＣでは、音声信号Ｑ１０における最大振幅ｊとスレッショルドＴｈとの差分だけ入力音声信号Ｑ１０を圧縮する。圧縮は音声信号全体に一律に付与され、圧縮後の音声信号はＱ１１となる。このとき最大振幅はｋのレベルとなり、スレッショルドＴｈの振幅レベルにまで低下する。
このようにＤＲＣでは、所定のスレッショルドＴｈを設けて、スレッショルドＴｈを超える振幅を有する音声信号に対しては、最大振幅とスレッショルドとの差分だけ圧縮して出力することで、後段のアンプにおける増幅時にクリップによる異音の発生を抑制するようにしている。

しかしながら、ＤＲＣを一律に動作させて信号処理を行うと、入力音声信号の状態によっては人間の耳に異常な音揺れが感じられ、必ずしも常に音声の品位を保つことができない場合がある。以下にその理由を説明する。
図１０は、フレッチャー＆マンソン等のラウドネス曲線を示す図である。ラウドネス曲線は、人の聴覚で感じる音の大きさの感覚を示すもので、例えば４０ホンの曲線では、１００Ｈｚのときは音圧レベルが６０ｄＢ、１ＫＨｚのときは音圧レベルが４０ｄＢであり、人間の耳で同じ音圧を感じるためには、１００Ｈｚの音は１ＫＨｚの音よりも２０ｄＢも高い音圧レベルが必要となる。このラウドネス曲線によれば、音量がどのようなレベルであっても２ＫＨｚ〜５ＫＨｚでは人の聴感上非常に感度が良く、７ｋＨｚ以上は感度が悪いといえる。

図１１は入力音声信号の異音の聞こえ易さについて説明するための図である。例えば図１１（Ａ）のような音声信号を考える。入力音声信号は、Ｓ１で示される単振動の正弦波であり、人間の可聴帯域内の約３００Ｈｚ付近の周波数を有するものとする。
このような音声信号Ｓ１がアンプによってクリップされると、その奇数倍の周波数の高調波ｈ１，ｈ２，ｈ３・・が発生し、この高調波が異音となって感じられる。この場合、図１１（Ａ）のように高調波ｈ１、ｈ２，ｈ３・・が人間の聴感上感度が良い周波数帯域に発生すると、人の耳には異音による音質劣化が顕著に感じられる。

一方、図１１（Ｂ）のように、入力音声信号Ｓ１が可聴帯域の比較的高周波数の位置（この例では１０ｋＨｚ）にあった場合、アンプによるクリップにより発生した高調波ｈ１，ｈ２，ｈ３・・の周波数位置は可聴帯域の範囲外となり、人の耳には殆ど聞こえない。あるいは高調波が可聴帯域内で生じたとしても、その帯域は聴感上の感度が低い帯域にあるため、信号のクリップによる異音は聞こえ難い。

上記のように、音声信号は、その周波数特性に応じてクリップ時の異音の聞こえやすさが異なり、異音による音質劣化の感じ方も周波数特性に応じて異なってくる。
これに対して、一律にＤＲＣを適用して、スレッショルド以上の最大振幅を持つ音声信号を圧縮した場合、クリップによる異音よりも、ＤＲＣ自体が原因となる音の揺れ感による音質劣化を強く感じることがある。

上記のようにＤＲＣでは、所定のスレッショルドを超える最大振幅をもつ音声信号は、そのダイナミックレンジを圧縮することで振幅を抑えて出力させる。このとき、スレッショルドの設定値を超えると信号全体の振幅が圧縮により急に低下するため、所謂フワっとした音揺れ感が生じる。特に人の聴感上感度の高い２〜５ｋＨｚ程度の音が圧縮されると、異様な音揺れ感を感じることがある。

ＤＲＣの音揺れ感をなくすためにはＤＲＣの動作を停止すればよいが、この場合には、本来的なアンプのクリップによる異音を解決することができない。特に人の聴感上感度の高い周波数帯域、例えば２〜５ｋＨｚの音の場合には、ＤＲＣの動作による音揺れ感よりも、アンプでのクリップによる異音による音質劣化の影響が大きく、ＤＲＣは停止すべきではない。

一方、人の聴感上感度の低い周波数や可聴帯域外の周波数で高調波が生じるような音声信号の場合には、高調波による異音は比較的感じにくいにも係わらず、ＤＲＣの動作による音揺れにより違和感が強くなる。つまり通常のＤＲＣでは、聴感上聞こえにくい高調波が生じる周波数帯域の音声信号に対しても、最大振幅がスレッショルドを超えればＤＲＣが反応して動作し、周波数帯域全体に渡って圧縮する。これにより、聴感上感度のよい帯域の音声信号までもが圧縮され、異様な音揺れ感を生じさせてしまう。

このように、音声信号処理装置の後段のアンプでクリップされることによる異音を回避するために、所定のスレッショルドより大きい最大振幅の信号を圧縮するＤＲＣが有効であるが、ＤＲＣの動作によって生じる音揺れ感が音質劣化の要因となる場合もあり、異音と音揺れの両方を適切に抑制して、聴感上音質劣化の少ない音声信号処理を行うことができなかった。

特許文献１の音声処理回路は、入力信号を複数の周波数帯域に分割して非線形処理を行うため、一部の周波数帯域で最大振幅が高いときに、周波数帯域の全体が圧縮されて音揺れを感じる、という問題をある程度防ぐことができるが、特許文献１の音声処理回路の場合、回路構成が複雑になって、多くの回路リソースを要するという課題が生じる。また、周波数分割を行って信号処理を行った後、分割された各信号を加算して出力するときに、音声劣化なく精度よく処理を実行できるようにするための設計難易度も高い。

また、特許文献２のオーディ信号処理装置は、高域通過フィルタを経由した高域の音声信号は、圧縮処理を受けることなくそのまま出力される。その結果、高域の信号で最大振幅が大きい場合には、後段のアンプでクリップが生じ、異音が発生してしまう。

本発明は、上述のごとき実情に鑑みてなされたものであり、音声信号の最大振幅に応じてダイナミックレンジを圧縮することで、後段のアンプで音声信号のクリップを生じないようにした構成を備え、最大振幅の周波数帯域位置に応じてダイナミックレンジの圧縮量を制御することで、簡単な回路構成で、異音の発生と音揺れ感とを適切に抑制し、高品位の音声を出力できるようにした音声信号処理装置を提供することを目的とする。

上記課題を解決するために、本発明の第１の技術手段は、入力音声信号のダイナミックレンジを圧縮して出力するアッテネータと、前記アッテネータの前で分岐した入力経路上に配置され、入力音声信号の所定の高周波数領域を減衰させて出力するＬＰＦと、該ＬＰＦから出力された音声信号の信号レベルを検出し、該検出した信号レベル基づき、前記アッテネータによる前記ダイナミックレンジの圧縮を制御する信号レベル制御部とを有し、前記アッテネータは、前記信号レベル制御部による制御に基づき、前記ＬＰＦを経ずに入力した入力音声信号を圧縮することを特徴としたものである。

第２の技術手段は、第１の技術手段において、前記信号レベル制御部が、予め定められた振幅値のスレッショルドと前記入力音声信号とを比較し、前記入力音声信号の最大振幅が前記スレッショルドより大きいときに、前記最大振幅と前記スレッショルドとの差分に相当する量を圧縮させるための圧縮量制御信号を生成する信号レベル検出回路を有し、前記アッテネータは、前記信号レベル検出回路が生成した前記圧縮量制御信号に従って、前記入力音声信号のダイナミックレンジを圧縮することを特徴としたものである。

第３の技術手段は、第２の技術手段において、前記信号レベル制御部が、前記アッテネータで前記入力音声信号の圧縮を行うとき、前記圧縮量制御信号により示される圧縮量まで達する時間特性を定めるアタックタイムと、圧縮を解除するまでの時間特性を定めるリリースタイムとが予め設定され、前記信号レベル検出回路により生成された圧縮量制御信号を、前記アタックタイムおよび前記リリースタイムに従って前記アッテネータに適用するレベルコントローラを有することを特徴としたものである。

本発明によれば、音声信号の最大振幅に応じてダイナミックレンジを圧縮することで、後段のアンプで音声信号のクリップを生じないようにした構成を備え、最大振幅の周波数帯域位置に応じてダイナミックレンジの圧縮量を制御することで、簡単な回路構成で、異音の発生と音揺れ感とを適切に抑制し、高品位の音声を出力できるようにした音声信号処理装置を提供することができる。

本発明に係る音声信号処理装置の構成例を示すブロック図である。本発明に係る音声信号処理装置による音声信号の圧縮処理例を説明するための図である。本発明に係る音声信号処理装置による音声信号の圧縮処理の他の例を説明するための図である。本発明に係る音声信号処理装置による音声信号の圧縮処理の更に他の例を説明するための図である。ＤＲＣ機能がない場合の音声信号の出力状態を説明する図である。ＤＲＣ機能がない場合の音声信号の出力状態の他の例を説明する図である。ＤＲＣ機能を付加した場合の音声信号の出力状態を説明する図である。ＤＲＣ機能を付加した場合の音声信号の出力状態の他の例を説明する図である。ＤＲＣによる圧縮処理の動作を説明する図である。フレッチャー＆マンソン等のラウドネス曲線を示す図である。入力音声信号の異音の聞こえ易さについて説明するための図である。

図１は、本発明に係る音声信号処理装置の構成例を示すブロック図である。音声信号処理装置１は、入力音声信号のダイナミックレンジを圧縮するアッテネータ３０と、入力音声信号の周波数のうち、所定の遮断周波数より高い周波数の帯域を減衰させるＬＰＦ（Low-Pass Filter）１０と、ＬＰＦ１０から出力された音声信号の信号レベルを検出し、入力音声信号を圧縮するための圧縮量制御信号を生成する信号レベル検出回路２１と、信号レベル検出回路２１で生成された圧縮量制御信号を、予め設定された応答特性に基づいてアッテネータ３０に適用することで、アッテネータ３０における信号レベルをコントロールするレベルコントローラ２２とを有している。信号レベル検出回路２１とレベルコントローラ２２とによって信号レベル制御部２０が構成されている。また、信号レベル制御部２０およびアッテネータ３０により、ＤＲＣ（Dynamic Range Compression）４０が構成されている。

図２は、本発明に係る音声信号処理装置による音声信号の圧縮処理例を説明するための図である。図１の構成を参照しながらその機能と動作例を説明する。
音声信号処理装置に入力した音声信号は、アッテネータ３０と、アッテネータ３０の前で分岐した入力経路上に設けられたＬＰＦ１０とのそれぞれに入力する。図２（Ａ）は、ＬＰＦ１０に入力した音声信号のフィルタリングの様子の一例を示している。ここでＴｈは、信号レベル制御部２０の信号レベル検出回路２１に設定されている振幅のスレッショルドのレベルを示している。

ＬＰＦ１０に入力した音声信号をＱ１とする。ＬＰＦ１０では、周波数帯域の通過特性Ｃが予め設定され、この通過特性Ｃに従って入力音声信号をフィルタリング処理して通過させる。ここでは、ＬＰＦ１０には、所定の遮断周波数Ｆｃより大きい周波数帯域の振幅を、周波数の増加に伴って徐々に大きく減衰させる特性が付与されている。そして、ＬＰＦ１０に入力された音声信号Ｑ１は、ＬＰＦの通過特性Ｃに従って減衰され、音声信号Ｑ２となって信号レベル検出回路２１に出力される。

信号レベル検出回路２１は、予め設定されているスレッショルドＴｈと入力された音声信号とを比較し、スレッショルドＴｈより大きい最大振幅を有する音声信号に対して、アッテネータ３０でダイナミックレンジを圧縮させる圧縮量を決定し、その圧縮量を示す圧縮量制御信号を出力する。圧縮量制御信号は、例えばアッテネータ３０に適用する目標圧縮量を示すボリューム値として生成される。この例では、音声信号Ｑ１の最大振幅ａは、遮断周波数Ｆｃよりもやや高い周波数位置（約５ｋＨｚ）にあり、音声信号Ｑ１がＬＰＦ１０を通過すると、最大振幅ａの振幅レベルはｂのレベルにまで若干減衰されて出力される。

ＬＰＦ１０を通過して信号レベル検出回路２１に入力した音声信号Ｑ２は、所定のスレッショルドＴｈと比較され、最大振幅がスレッショルドＴｈより高い場合に、その差分だけ振幅を圧縮させる。この例では、圧縮量ｐは、ＬＰＦ１０を通過後の音声信号Ｑ２の最大振幅ｂとスレッショルドＴｈとの差分となる。
信号レベル検出回路２１では、圧縮量ｐをアッテネータ３０に適用するための圧縮量制御信号を生成して出力する。一例として、検出した最大振幅とスレッショルドＴｈとの比（Ｔｈ／最大振幅）を示すボリューム値を圧縮量制御信号として出力する。

信号レベル検出回路２１から出力された圧縮量制御信号は、レベルコントローラ２２に入力される。レベルコントローラ２２は、予め設定されているアタックタイムとリリースタイムとに従って、信号レベル検出回路２１から出力された圧縮量制御信号をアッテネータ３０に適用する。アタックタイムは、圧縮制御信号により示される圧縮量まで達する時間特性を定めるもので、例えば立ち上がり時定数によって示される。また、リリースタイムは、圧縮を解除するまでの時間特性を定めるもので、例えば立ち下がり時定数によって示される。アタックタイムとリリースタイムを適宜設定することによって、圧縮量制御信号をアッテネータ３０に適用するときのアッテネータ３０の応答特性を設定することができる。

アッテネータ３０では、レベルコントローラ２２により応答特性が設定された圧縮量制御信号に従って入力音声信号のダイナミックレンジを圧縮する処理を行う。この場合、アッテネータ３０に入力する音声信号は、ＬＰＦ１０にて作用を受けることなく直接に入力されたものである。従って、ＬＰＦ１０から信号レベル制御部２０の経路では、アッテネータ３０に適用するダイナミックレンジの圧縮のための圧縮量制御信号とその応答特性だけが決定され、実際に音声出力される音声信号に対する信号処理は行われない。

図２（Ｂ）に示すように、アッテネータ３０には、信号レベル検出回路２１で決定された圧縮量ｐを示す圧縮量制御信号が適用され、入力音声信号Ｑ１のダイナミックレンジがその圧縮量ｐの分だけ圧縮される。圧縮は全周波数帯域で均等に行われ、圧縮後の音声信号はＱ３となる。このとき入力音声信号Ｑ１の最大振幅ａは、ｃのレベルにまで圧縮される。この例では、ＬＰＦ１０によって、最大振幅ａが若干減衰されているが、減衰量が比較的少ないため、ＬＰＦ１０のない状態でのダイナミックレンジの圧縮量（ａ―Ｔｈ）に近い圧縮量で圧縮される。

図３は、本発明に係る音声信号処理装置による音声信号の圧縮処理の他の例を説明するための図である。音声信号処理装置に対する入力音声信号として、図３（Ａ）に示すような音声信号Ｑ４が入力したものとする。ＬＰＦ１０では、図２の例と同様の周波数帯域の通過特性Ｃが予め設定され、この通過特性Ｃに従って入力音声信号をフィルタリング処理して通過させる。ＬＰＦ１０に入力された音声信号Ｑ４は、ＬＰＦの通過特性Ｃに従って減衰され、音声信号Ｑ５となって信号レベル検出回路２１に出力される。

信号レベル検出回路２１は、予め設定されているスレッショルドＴｈと入力された音声信号Ｑ４とを比較し、スレッショルドＴｈより大きい最大振幅を有する音声信号に対して、アッテネータ３０でダイナミックレンジを圧縮させる圧縮量を決定し、その圧縮量を示す圧縮量制御信号を出力する。この例では、音声信号Ｑ４の最大振幅ｄは、約９ｋＨｚにあり、図２の例の最大振幅ａよりも高周波数側にある。音声信号Ｑ４がＬＰＦ１０を通過すると、最大振幅ｄは、ｅのレベルまで大きく減衰されて出力される。

ＬＰＦ１０を通過して信号レベル検出回路２１に入力した音声信号Ｑ５は、所定のスレッショルドＴｈと比較され、最大振幅がスレッショルドＴｈより高い場合に、その差分だけ振幅を圧縮させる。この例では、圧縮量ｐは、ＬＰＦ１０を通過後の音声信号Ｑ５の最大振幅ｅとスレッショルドＴｈとの差分となる。
信号レベル検出回路２１では、圧縮量ｐをアッテネータ３０に設定するためのボリューム値を生成して出力する。一例として、検出した最大振幅とスレッショルドＴｈとの比（Ｔｈ／最大振幅）の値をボリューム値として出力する。

信号レベル検出回路２１から出力された圧縮量制御信号は、レベルコントローラ２２に入力される。レベルコントローラ２２は、予め設定されているアタックタイムとリリースタイムとに従って、信号レベル検出回路２１から出力された圧縮量制御信号をアッテネータ３０に適用する。アッテネータ３０では、レベルコントローラ２２により応答特性が設定された圧縮量制御信号に従って入力音声信号のダイナミックレンジを圧縮する処理を行う。

図３（Ｂ）に示すように、アッテネータ３０には、信号レベル検出回路２１で決定された圧縮量ｐを示す圧縮量制御信号が適用され、入力音声信号Ｑ４のダイナミックレンジがその圧縮量ｐの分だけ圧縮される。圧縮は全周波数帯域で均等に行われ、圧縮後の音声信号はＱ６となる。このとき最大振幅ｄは、ｆのレベルにまで圧縮される。この例では、ＬＰＦ１０によって、最大振幅ｄが減衰された減衰量は、図２の例に比較して大きいため、ＬＰＦ１０のない状態でのダイナミックレンジの圧縮量（ａ−Ｔｈ）よりも圧縮量が大きく低減されている。

図４は、本発明に係る音声信号処理装置による音声信号の圧縮処理の更に他の例を説明するための図である。音声信号処理装置に対する入力音声信号として、図４（Ａ）に示すような音声信号Ｑ７が入力したものとする。ＬＰＦ１０では、上記の各例と同様の周波数帯域の通過特性Ｃが予め設定され、この通過特性Ｃに従って入力音声信号をフィルタリング処理して通過させる。ＬＰＦ１０に入力された音声信号Ｑ７は、ＬＰＦの通過特性Ｃに従って減衰され、音声信号Ｑ８となって信号レベル検出回路２１に出力される。

信号レベル検出回路２１は、予め設定されているスレッショルドＴｈと入力された音声信号Ｑ８とを比較し、スレッショルドＴｈより大きい最大振幅を有する音声信号に対して、アッテネータ３０でダイナミックレンジを圧縮させる圧縮量を決定し、その圧縮量を示す圧縮量制御信号を出力する。この例では、音声信号Ｑ７の最大振幅ｇは、約１３ｋＨｚの位置にあり、図３の例の最大振幅ｄよりもさらに高周波数側にある。音声信号Ｑ７がＬＰＦ１０を通過すると、最大振幅ｄは、ｈのレベルまでさらに大きく減衰されて出力される。

ＬＰＦ１０を通過して信号レベル検出回路２１に入力した音声信号Ｑ８は、所定のスレッショルドＴｈと比較され、最大振幅がスレッショルドＴｈより高い場合に、その差分だけ振幅を圧縮させる。しかしながらこの例では、ＬＰＦ１０を通過後の最大振幅ｈは、スレッショルドＴｈよりも低くなっている。従って、信号レベル検出回路２１では、入力音声信号のダイナミックレンジを圧縮する必要がないとして、その旨を示す圧縮量制御信号を出力する。ここでは上記のボリューム値を所定の値にすることよって、圧縮する必要がないことを示すものとしてもよい。

信号レベル検出回路２１から出力された圧縮量制御信号は、レベルコントローラ２２に入力されるが、レベルコントローラ２２では、アッテネータ３０にて音声信号を圧縮する必要がないと判断し、アッテネータ３０に対する圧縮制御を行わない。これにより、アッテネータ３０では、入力音声信号Ｑ７がそのまま出力され、最大振幅ｇの振幅レベルも維持される。

上記の図２〜図４の例でわかるように、ＬＰＦの減衰特性を適切に設定し、所定の遮断周波数Ｆｃより高い周波数領域では、周波数が高くになるに従って徐々に減衰量が大きくなるものを使用する。このようなＬＰＦは、比較的汎用的で、引用文献１に記載されたような複雑な回路構成のものを用いることなく簡単な回路構成で実現できる。

そして上記のＬＰＦにより、遮断周波数Ｆｃより大きい周波数領域で、減衰後の最大振幅がスレッショルド以上の範囲では、最大振幅に基づき入力音声信号のダイナミックレンジを圧縮させる。
このときに、図２のように、その周波数領域の中で相対的に低い周波数域に最大振幅が存在する場合には、ＬＰＦによる減衰量は相対的に少なくなる。これにより、最大振幅とスレッショルドとを比較したときにその差が比較的大きくなり、その結果アッテネータ３０による圧縮量が相対的に大きくなる。つまり、後段のアンプでクリップされるときの異音に対する聴感上の感度が高い低周波数領域で、ダイナミックレンジの圧縮率が相対的に高くなり、人に聞こえ易い周波数領域での異音の発生を効果的に抑制することができる。

一方、図３のように、遮断周波数Ｆｃより高い周波数領域で、その周波数領域の中で相対的に高い周波数域に最大振幅が存在する場合には、ＬＰＦによる減衰量は相対的に大きくなる。これにより、最大振幅とスレッショルドとを比較したときにその差が比較的小さくなり、その結果アッテネータ３０による圧縮量が相対的に小さくなる。これにより後段のアンプでクリップされるときの異音が聴感上聞こえにくい（感度が低い）低周波数領域でダイナミックレンジの圧縮量が相対的に低くなり、クリップが発生しても人にはそれほど気にならず、圧縮率が低いために音揺れ感が抑えられて、安定感のある高品位の音声出力を行うことができる。

また、周波数帯域がさらに高くなると、図４に示すように、ＬＰＦ１０で減衰させた後の最大振幅がスレッショルドより小さくなる。この場合には、アッテネータ３０による圧縮が行われることなく、入力音声信号はそのまま出力される。このような高周波数帯域では、アンプでクリップされたとしても聴感上、異音が発生する周波数帯域が可聴域外かもしくは感度が極めて低い帯域にあるため、クリップの発生をそのまま放置しても、異音を強く感じることなく音揺れ感の発生を抑えるようにすることができる。

上記のＬＰＦの特性、つまり遮断周波数の位置や遮断周波数より高周波数帯域の減衰特性、及び信号レベル検出回路２１に設定するスレッショルドの値は適宜設定することができる。従って、聴感特性上の感度を鑑みて適切な位置に遮断周波数、およびスレッショルドを設定し、後段のアンプでのクリップによる異音に対する聴感上の感度が比較的低い領域でダイナミックレンジの圧縮量を抑えて、もしくは圧縮しないようにして、効果的に音揺れ感の発生を抑制できるようにすることが望ましい。

また、遮断周波数より高い周波数領域では、ＬＰＦの減衰量を周波数が高くなるに従って徐々に大きくする特性とすることで、比較的聴感上の感度が高い周波数帯から低い周波数帯に向けて徐々に圧縮率を低減させることができ、これにより聴感上の感度の高い領域では圧縮率を確保してクリップによる異音を抑制し、徐々に高波長域になるに従って、圧縮率を低減させて音揺れ感をより抑制するように設定することができる。このＬＰＦの減衰特性についても、聴感上の特性や音質の設計思想等に従って適宜定めることができる。

また、レベルコントローラ２２ではアタックタイムとリリースタイムを適宜設定することで、アッテネータ３０における信号圧縮処理の応答特性を制御することができる。また、本発明に係る音声信号処理装置は、レベルコントローラ２２は必須の構成ではなく、信号レベル制御部２０に信号レベル検出回路２１を備え、信号レベル検出回路２１から出力された圧縮量制御信号をアッテネータ３０に適用して、アッテネータ３０にて適宜入力音声信号を圧縮させるようにしてもよい。

１…音声信号処理装置、１０…ＬＰＦ、２０…信号レベル制御部、２１…信号レベル検出回路、２２…レベルコントローラ、３０…アッテネータ。

Claims

入力音声信号のダイナミックレンジを圧縮して出力するアッテネータと、
前記アッテネータの前で分岐した入力経路上に配置され、入力音声信号の所定の高周波数領域を減衰させて出力するＬＰＦと、
該ＬＰＦから出力された音声信号の信号レベルを検出し、該検出した信号レベル基づき、前記アッテネータによる前記ダイナミックレンジの圧縮を制御する信号レベル制御部とを有し、
前記アッテネータは、前記信号レベル制御部による制御に基づき、前記ＬＰＦを経ずに入力した入力音声信号を圧縮することを特徴とする音声信号処理装置。
請求項１に記載の音声信号処理装置において、
前記信号レベル制御部は、
予め定められた振幅値のスレッショルドと前記入力音声信号とを比較し、前記入力音声信号の最大振幅が前記スレッショルドより大きいときに、前記最大振幅と前記スレッショルドとの差分に相当する量を圧縮させるための圧縮量制御信号を生成する信号レベル検出回路を有し、
前記アッテネータは、前記信号レベル検出回路が生成した前記圧縮量制御信号に従って、前記入力音声信号のダイナミックレンジを圧縮することを特徴とする音声信号処理装置。
請求項２に記載の音声信号処理装置において、
前記信号レベル制御部は、
前記アッテネータで前記入力音声信号の圧縮を行うとき、前記圧縮量制御信号により示される圧縮量まで達する時間特性を定めるアタックタイムと、圧縮を解除するまでの時間特性を定めるリリースタイムとが予め設定され、前記信号レベル検出回路により生成された圧縮量制御信号を、前記アタックタイムおよび前記リリースタイムに従って前記アッテネータに適用するレベルコントローラを有することを特徴とする音声信号処理装置。