JP2019169840A - デジタル音声信号処理装置およびそのプログラム - Google Patents

デジタル音声信号処理装置およびそのプログラム Download PDF

Info

Publication number
JP2019169840A
JP2019169840A JP2018055930A JP2018055930A JP2019169840A JP 2019169840 A JP2019169840 A JP 2019169840A JP 2018055930 A JP2018055930 A JP 2018055930A JP 2018055930 A JP2018055930 A JP 2018055930A JP 2019169840 A JP2019169840 A JP 2019169840A
Authority
JP
Japan
Prior art keywords
sampling frequency
audio signal
digital
signal
filter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018055930A
Other languages
English (en)
Inventor
伸也 日月
Shinya Tachimori
伸也 日月
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Onkyo Corp
Original Assignee
Onkyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Onkyo Corp filed Critical Onkyo Corp
Priority to JP2018055930A priority Critical patent/JP2019169840A/ja
Publication of JP2019169840A publication Critical patent/JP2019169840A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

【課題】高いサンプリング周波数のデジタル音声信号であっても、ラウドネス値を適切に算出し、演算負荷が少ないレベル補正を実施するデジタル音声信号処理装置およびそのプログラムを提供する。【解決手段】デジタル音声信号処理装置1は、第1サンプリング周波数のデジタル入力信号を第2サンプリング周波数のデジタル信号に変換する第1サンプリング周波数変換器21、22と、デジタル信号に第2サンプリング周波数で規定されるラウドネス特性を出力する聴覚特性フィルタ23、24と、出力の実効値を第2サンプリング周波数で動作して算出し、第2ゲイン係数信号を出力するゲイン係数信号出力器27と、第2ゲイン係数信号を第1サンプリング周波数の第1ゲイン係数信号に変換する第2サンプリング周波数変換器28と、デジタル入力信号に第1ゲイン係数信号を乗算して第1サンプリング周波数のデジタル信号として出力する乗算器13、14と、を備える。【選択図】図1

Description

本発明は、デジタル音声信号処理装置およびそのプログラムに関し、特に、デジタル音声信号のラウドネス値に基づいてレベル補正を行うノーマライザなどのデジタル音声信号処理装置およびそのプログラムに関する。
デジタル音声信号として記録された音楽等の楽曲を再生する場合に、楽曲における再生音量の相違を抑えるために、デジタル音声信号の音量レベルを検出してレベル補正を行って、音声信号を圧縮/伸張するリミッタ、コンプレッサ、エキスパンダ、ノーマライザ、等と呼ばれるデジタル音声信号処理装置が用いられる場合がある。デジタル音声信号の音量レベル、ラウドネスレベルを検出してレベル補正を行うデジタル音声信号処理装置には、様々なものがある。
従来には、楽曲を再生中に音量レベルを算出してレベル補正を行うものがある。例えば、デジタル入力信号を遅延する遅延手段と、前記遅延手段により遅延された前記デジタル信号を可変のゲインで減衰する減衰手段と、前記デジタル入力信号のレベルを検出するレベル検出手段と、前記レベル検出手段により検出されたレベルに基づきコンプレス/リミット用の第1のゲインを生成するゲイン生成手段と、前記ゲイン生成手段により出力された前記第1のゲインにフィルタ処理を施して減衰時定数を付与した第2のゲインを生成するスムーズフィルタと、前記スムーズフィルタにより出力された第2のゲインと、当該手段から出力される第4のゲインの所定サンプル前の信号に対して前記減衰時定数よりも長くする処理をして得られた第3のゲインと、を比較して値の大きい一方のゲインを選択することによってゲインの減衰時定数を延長して第4のゲインとする時定数延長手段とを有し、第4のゲインを印加するデジタル信号処理装置がある(特許文献1)。
また、従来には、複数の楽曲間での再生音量の相違を抑えるために、予め楽曲を解析して得たラウドネス値をメタデータとして保持しておき、このラウドネス値に基づいてデジタル音声信号をレンダリングするReplayGainのような仕様が知られている(特許文献2)。ただし、この仕様では、予め楽曲を解析しておかなければならず、使い勝手が悪い一面がある。
また、特許文献2で述べられているように、音声信号のラウドネスの計測手法としては、ITU−R BS.1770等の規格が定められて、活用されている。従来のラウドネス特性は、バンドパス(帯域通過型)フィルタのような特性カーブが知られているが、ITU−R BS.1770では、ハイパス(高域通過型)フィルタ特性を有する周波数重み付けカーブが適用され、デジタル音声信号のサンプリング周波数を48kHzと想定している。サンプリング周波数:48kHzの場合に標本化定理により確保される最大周波数成分がサンプリング周波数の1/2である24kHzであるので、人間の可聴周波数帯域は約20Hz〜約20kHzであることを考慮すると、サンプリング周波数:48kHzは十分である。
しかし、近年のデジタル音声信号で記録されている楽曲には、192kHzというような非常に高いサンプリング周波数で標本化されているハイレゾリューションと呼ばれるようなものが存在する。人間の可聴周波数帯域を遙かに超えるような周波数成分を含む一方で、サンプルレートが非常に高くなるので、48kHzといった従来のサンプリング周波数の楽曲と比較して、デジタル音声信号のラウドネス値を演算するにも、1サンプルの時間が短くてデジタル音声信号処理の負担が大きく、また、楽曲単位では計算量が多くなって演算負荷が大きくなる、という問題が生じる。
特許第3991372号公報 特許第5695677号公報
本発明は、上記の問題をより簡易に解決するためになされたものであり、その目的は、デジタル音声信号のラウドネス値に基づいてレベル補正を行うデジタル音声信号処理装置およびそのプログラムに関し、非常に高いサンプリング周波数のデジタル音声信号であっても、ラウドネス値を適切に算出して、演算の負荷が少なくてレベル補正を容易に実施できるデジタル音声信号処理装置およびそのプログラムを提供することにある。
本発明のデジタル音声信号処理装置は、デジタル入力音声信号のサンプリング周波数を第1サンプリング周波数として検出するサンプリング周波数検出器と、デジタル入力音声信号を第1サンプリング周波数とは異なる第2サンプリング周波数のデジタル音声信号に変換する第1サンプリング周波数変換器と、第2サンプリング周波数のデジタル音声信号に第2サンプリング周波数で規定されるラウドネス特性を与えて出力する聴覚特性フィルタと、聴覚特性フィルタの出力の実効値を第2サンプリング周波数で動作して算出する実効値演算器と、実効値から第2サンプリング周波数の第2ゲイン係数信号を出力するゲイン係数信号出力器と、第2ゲイン係数信号を第1サンプリング周波数の第1ゲイン係数信号に変換する第2サンプリング周波数変換器と、デジタル入力音声信号に第1ゲイン係数信号を乗算して第1サンプリング周波数のデジタル出力音声信号として出力する乗算器と、を備える。
好ましくは、本発明のデジタル音声信号処理装置は、第1サンプリング周波数が第2サンプリング周波数よりも高い周波数であり、第1サンプリング周波数変換器が、第2サンプリング周波数の1/2以下の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第1アンチエリアシングフィルタを含むダウンサンプリング変換器であり、第2サンプリング周波数変換器が、第2サンプリング周波数の1/2以下の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第2アンチエリアシングフィルタを含むアップサンプリング変換器であり、第2アンチエリアシングフィルタを構成するFIRフィルタのタップ数が、第1アンチエリアシングフィルタを構成するFIRフィルタのタップ数よりも少なく設定されている。
好ましくは、本発明のデジタル音声信号処理装置は、第2サンプリング周波数が48kHzであり、聴覚特性フィルタのラウドネス特性が、デジタル入力音声信号のラウドネスを測定するITU−R BS.1770に準拠して規定される。
好ましくは、本発明のデジタル音声信号処理装置は、デジタル入力音声信号が同期する複数のチャンネル成分を含む場合に、聴覚特性フィルタおよび実効値演算器が、複数のチャンネル成分に対してそれぞれ複数の実効値を算出し、ゲイン係数信号出力器が、複数の実効値の内の最大値から一の第2ゲイン係数信号を出力し、デジタル入力音声信号の複数のチャンネル成分に対してそれぞれ第1ゲイン係数信号を乗算して第1サンプリング周波数のデジタル出力音声信号として出力する。
また、本発明のデジタル音声信号処理のプログラムは、デジタル入力音声信号のサンプリング周波数を第1サンプリング周波数として検出するステップと、デジタル入力音声信号を第1サンプリング周波数とは異なる第2サンプリング周波数のデジタル音声信号に変換するステップと、第2サンプリング周波数のデジタル音声信号に第2サンプリング周波数で規定されるラウドネス特性を聴覚特性フィルタによって与えて出力するステップと、聴覚特性フィルタの出力の実効値を第2サンプリング周波数で動作して算出するステップと、実効値から第2サンプリング周波数の第2ゲイン係数信号を出力するステップと、第2ゲイン係数信号を第1サンプリング周波数の第1ゲイン係数信号に変換するステップと、デジタル入力音声信号に第1ゲイン係数信号を乗算して第1サンプリング周波数のデジタル出力音声信号として出力するステップと、を含む。
以下、本発明の作用について説明する。
本発明のデジタル音声信号処理装置は、デジタル音声信号のラウドネス値に基づいてレベル補正を行うのにあたって、デジタル入力音声信号のサンプリング周波数を第1サンプリング周波数として検出するサンプリング周波数検出器と、デジタル入力音声信号に第1ゲイン係数信号を乗算して第1サンプリング周波数のデジタル出力音声信号として出力する乗算器と、を備える。デジタル音声信号処理装置は、ハードウェアで構成する場合のほかに、コンピュータに信号処理を実行させる複数のステップを含むプログラムを実行させることにより、実現可能である。
デジタル音声信号処理装置は、さらに、デジタル入力音声信号を第1サンプリング周波数とは異なる第2サンプリング周波数のデジタル音声信号に変換する第1サンプリング周波数変換器と、第2サンプリング周波数のデジタル音声信号に第2サンプリング周波数で規定されるラウドネス特性を与えて出力する聴覚特性フィルタと、聴覚特性フィルタの出力の実効値を第2サンプリング周波数で動作して算出する実効値演算器と、実効値から第2サンプリング周波数の第2ゲイン係数信号を出力するゲイン係数信号出力器と、第2ゲイン係数信号を第1サンプリング周波数の第1ゲイン係数信号に変換する第2サンプリング周波数変換器と、を備える。プログラムも同様の信号処理のステップを含む。
つまり、第1サンプリング周波数の第1ゲイン係数信号は、第2サンプリング周波数で規定されるラウドネス特性で定まるラウドネス値を、デジタル入力音声信号のサンプリング周波数である第1サンプリング周波数のデジタル信号に変換した信号であるので、例えば第2サンプリング周波数が48kHzであり、聴覚特性フィルタのラウドネス特性が、デジタル入力音声信号のラウドネスを測定するITU−R BS.1770に準拠して規定されるような場合には、汎用されている標準規格をそのまま利用できて、より正確なラウドネス値を演算できる利点がある。プログラムも同様の信号処理のステップを含むようにすればよい。
また、第1サンプリング周波数が第2サンプリング周波数よりも高い周波数であり、例えば、192kHzであるようなハイレゾリューションの楽曲の場合には、第1ゲイン係数信号を出力するシグナルフロー並びにプログラムのステップが、低い周波数の第2サンプリング周波数(48kHz)で動作することになるので、デジタル音声信号のラウドネス値を演算するデジタル音声信号処理の負荷を実質的に小さくすることができる。
さらに、第1ゲイン係数信号を出力するシグナルフローには、聴覚特性フィルタの出力の実効値を第2サンプリング周波数で動作して算出する実効値演算器が含まれる。実効値演算の信号処理は、ローパスフィルターの特性を持つので、第2サンプリング周波数の第2ゲイン係数信号は、第2サンプリング周波数の1/2の周波数よりも低い周波数に帯域制限されている。したがって、第2サンプリング周波数の1/2以下の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第1アンチエリアシングフィルタを含むダウンサンプリング変換器であり、第2サンプリング周波数変換器が、第2サンプリング周波数の1/2以下の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第2アンチエリアシングフィルタを含むアップサンプリング変換器である場合には、第2アンチエリアシングフィルタを構成するFIRフィルタのタップ数を、第1アンチエリアシングフィルタを構成するFIRフィルタのタップ数よりも少なく設定することができる。その結果、デジタル音声信号のラウドネス値を演算するデジタル音声信号処理の負荷をより小さくすることができる利点がある。
デジタル入力音声信号が同期する複数のチャンネル成分を含む場合には、聴覚特性フィルタおよび実効値演算器が、複数のチャンネル成分に対してそれぞれ複数の実効値を算出し、ゲイン係数信号出力器が、複数の実効値の内の最大値から一の第2ゲイン係数信号を出力し、デジタル入力音声信号の複数のチャンネル成分に対してそれぞれ第1ゲイン係数信号を乗算して第1サンプリング周波数のデジタル出力音声信号として出力する。例えば、左右2チャンネルのチャンネル成分を含むステレオ信号の場合には、チャンネル間のバランスを崩すことなく最大のラウドネス値に基づいてレベル補正を行うことができる。
本発明のデジタル音声信号処理装置およびそのプログラムは、非常に高いサンプリング周波数のデジタル音声信号であっても、ラウドネス値を適切に算出して、演算の負荷が少なくてレベル補正を容易に実施できる。
本発明の好ましい実施形態によるデジタル音声信号処理装置について説明する図である。(実施例1) デジタル音声信号処理装置の聴覚特性フィルタの特性を説明するグラフである。(実施例1) デジタル音声信号処理装置のゲイン係数信号出力器の特性を説明するグラフである。
以下、本発明の好ましい実施形態によるデジタル音声信号処理装置およびそのプログラムについて説明するが、本発明はこれらの実施形態には限定されない。
図1は、本発明の好ましい実施形態によるデジタル音声信号処理装置1について説明する図である。具体的には、デジタル音声信号処理装置1は、左右2チャンネルのチャンネル成分を含むステレオ信号であるデジタル音声信号について、その音量レベルを検出してレベル補正を行って出力するノーマライザであり、図1は、その内部構成を示すブロック図である。なお、説明に不要な一部の構成や、内部構造等は、図示ならびに説明を省略する。
ノーマライザとしてのデジタル音声信号処理装置1は、デジタル音声信号処理装置1は、入力されるデジタル音声信号について、その音量レベルを検出して、圧縮/伸張して出力する。つまり、デジタル音声信号処理装置1は、デジタル音声信号を再生する際にその楽曲のラウドネスを解析してレベル補正を行って出力する。したがって、デジタル音声信号処理装置1は、小さな音量部分と大きな音量部分とを含む様なダイナミックレンジの大きな楽曲や、録音された音量レベルの差が大きいような複数の楽曲の間で、楽曲の再生音量が小さくなりすぎたり、大きくなりすぎたりするような不具合を防ぐように動作する。
デジタル音声信号処理装置1は、デジタルシグナルプロセッサ(DSP)で構成され得る。その場合には、DSPを制御する制御回路としての(図示しない)マイクロコンピュータ(マイコン)が接続され、マイコンがDSPにプログラムをロードさせて実行させるように制御する。デジタル音声信号処理装置1は、入力端子2に入力されるステレオのデジタル音声信号(Lin、Rin)を、乗算器13および14でレベル補正を行って、ステレオのデジタル音声信号(Lout、Rout)として出力端子3に出力するようなオーディオ機器に適用し得る。
例えば、本実施例のデジタル音声信号処理装置1に入力されるデジタル音声信号は、可聴音声周波数帯域よりも遙かに高いサンプリング周波数FS=192kHzでサンプリングしたデジタル音声信号であり、同期したステレオ音声信号LおよびRのデータの組である24ビットPCM信号を含む。ただし、入力されるデジタル音声信号は、1チャンネルのモノラル信号であっても、3チャンネル以上のチャンネル成分を含むマルチチャンネル信号であってもよい。
デジタル音声信号処理装置1は、第1サンプリング周波数FS1=192kHzで動作する第1信号処理部4と、第2サンプリング周波数FS2=48kHzで動作する第2信号処理部5と、を備える。デジタル音声信号処理装置1の全体および第1信号処理部4は、非常に高いサンプリング周波数で動作しているので、1サンプル当たりの動作時間が極めて短く、第1信号処理部4の演算負荷が大きい。一方で、第2信号処理部5は、その1/4のサンプリング周波数で動作している訳で、第1信号処理部4に比べて演算負荷は小さいことになる。
デジタル音声信号処理装置1の入力端子2に入力されるデジタル音声信号は、第1信号処理部4のサンプリング周波数検出器11に入力される。サンプリング周波数検出器11は、デジタル入力音声信号のサンプリング周波数FSを検出して、第1サンプリング周波数FS1として端子12から出力する。第1サンプリング周波数FS1に関する情報は、第1信号処理部4の動作に使われる他に、第2信号処理部5に供給される。
第1信号処理部4は、サンプリング周波数検出器11が検出するこの第1サンプリング周波数FS1で動作する。第1信号処理部4は、デジタル入力音声信号の左チャンネル成分Linに後述する第1ゲイン係数信号を乗算して第1サンプリング周波数FS1のデジタル出力音声信号Loutとして端子4に出力する乗算器13と、デジタル入力音声信号の右チャンネル成分Rinに第1ゲイン係数信号を乗算して第1サンプリング周波数FS1のデジタル出力音声信号Routとして出力する乗算器14と、を含む。
なお、第1信号処理部4は、乗算器13並びに乗算器14に入力するデジタル入力音声信号を所定の遅延時間だけ遅延させる(図示しない)遅延器またはディレイ回路を、サンプリング周波数検出器11と乗算器13並びに乗算器14との間に設けてもよい。
第2信号処理部5は、サンプリング周波数検出器11が検出する第1サンプリング周波数FS1を1/4にダウンサンプリングした第2サンプリング周波数FS2=48kHzで動作する。したがって、第2信号処理部5は、デジタル音声信号のサンプリング周波数をFS1=192kHzからFS2=48kHzに変換するダウンサンプリングコンバータとしての第1サンプリング周波数変換器21並びに22と、サンプリング周波数をFS2=48kHzからFS1=192kHzに変換するアップサンプリングコンバータとしての第2サンプリング周波数変換器28と、を含む。サンプリング周波数変換器21、22および28には、第1サンプリング周波数FS1に関する情報がサンプリング周波数検出器11の端子12から供給される。
第2信号処理部5のサンプリング周波数変換器21並びに22には、入力端子2に入力されるステレオのデジタル音声信号(Lin、Rin)が、第1信号処理部4から分岐してそれぞれ入力される。サンプリング周波数変換器21および22は、デジタル音声信号のサンプリング周波数をFS1=192kHzからFS2=48kHzに変換して、それぞれ聴覚特性フィルタ23並びに24に出力する。
第1サンプリング周波数変換器21および22は、それぞれ、サンプリング定理における折り返しを防止するのに必要なアンチエリアシングフィルタを含む。具体的には、サンプリング周波数変換器21および22は、サンプリング周波数をFS1=192kHzからFS2=48kHzに変換するダウンサンプリングコンバータであるので、FS2の1/2の周波数(=24kHz)以下の周波数を含まないようにするのに、24kHz以下の所定の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第1アンチエリアシングフィルタを含む。本実施例の場合には、第1アンチエリアシングフィルタはサンプリング周波数FS1で動作する32タップのFIRフィルタにより構成されている。
第1サンプリング周波数変換器21および22は、第1アンチエリアシングフィルタを通過させたサンプリング周波数FS1のデジタル音声信号を出力する。そして、サンプリング周波数変換器21および22は、ダウンサンプリングコンバータとして、この第1アンチエリアシングフィルタを通過させたサンプリング周波数FS1=192kHzのデジタル音声信号の4サンプルから1サンプルのみを周期的に間引くようにして、FS2=48kHzのデジタル音声信号に変換する。
聴覚特性フィルタ23並びに24は、デジタル入力音声信号のラウドネスを測定するITU−R BS.1770に準拠するラウドネス値を算出するフィルタである。ITU−R BS.1770が規定する聴覚特性フィルタの特性は、デジタル音声信号のサンプリング周波数を48kHzと想定しているので、汎用されている標準規格をそのまま利用できる。ITU−R BS.1770が規定する聴覚特性フィルタの構成の詳細については、説明を省略する。
図2のグラフは、聴覚特性フィルタ23並びに24のゲイン特性を説明するグラフである。太い実線で図示する曲線20は、ITU−R BS.1770が規定するハイパス(高域通過型)フィルタ特性を有する周波数重み付けカーブとなっている。ただし、上記の通りに曲線20はハイパス(高域通過型)フィルタ特性を有するので、20kHz以上の高い音声周波数成分が算出するラウドネス値に与える影響が大きくなり得る。その一方で、サンプリング周波数がFS2=48kHzの場合に、24kHz以上の周波数成分は、聴覚特性フィルタの出力としては含まれ得ない。そもそも約15kHz以上の高い周波数帯域の周波数成分は、加齢により聞き取りにくくなるなど、人間の感じる真のラウドネス値に与える影響が少ない周波数成分である。
したがって、サンプリング周波数変換器21および22が含む第1アンチエリアシングフィルタは、聴覚特性フィルタの出力に実質的にほぼ影響を与えない。仮に、第1アンチエリアシングフィルタのカットオフ周波数が例えば24kHz以下である18kHzであり、図2のグラフにおける点線の曲線30のようなローパス(低域通過型)のフィルタ特性を有していてもよい。少なくとも、図2のグラフにおける曲線20および曲線30で規定されるラウドネス特性は、従来に用いられていたバンドパス(帯域通過型)フィルタのような特性カーブのラウドネス特性よりも、ITU−R BS.1770が規定するラウドネス特性に近いものになる。
聴覚特性フィルタ23並びに24からの出力は、それぞれ実効値演算器25並びに26に入力される。実効値演算器25並びに26は、第2サンプリング周波数FS2=48kHzで動作して、入力値の実効値を演算により出力する。実効値演算の信号処理は、ローパスフィルターの特性を持つので、実効値演算器25並びに26からの出力信号は、第2サンプリング周波数FS2=48kHzの1/2の周波数よりも低い周波数に帯域制限されていることになる。なお、実効値演算器25並びに26での実効値の演算は、平均平方値を出力する演算処理であってもよく、また、平均値を出力する演算処理であってもよい。
実効値演算器25並びに26からの出力は、ゲイン係数信号出力器27に入力される。ゲイン係数信号出力器27は、2つの実効値演算器25並びに26の出力値の内で、大きい方の値を選択して入力する選択入力回路を含む。本実施例では、ステレオのデジタル音声信号(Lin、Rin)に対応しているので、選択入力回路により、いずれか一方のラウドネス値が大きなチャンネルに合わせて共通してレベル補正を行うようにして、チャンネル間のバランスを崩すことが無いようにしている。
さらに、ゲイン係数信号出力器27は、この選択入力回路から入力される実効値から第2サンプリング周波数FS2=48kHzの第2ゲイン係数信号を出力する。図3は、ゲイン係数信号出力器27の出力である入力値に対する補正出力値の特性を説明するグラフである。図3の横軸が入力値であり、縦軸が補正出力値である。
つまり、ゲイン係数信号出力器27は、入力値が約−30dB以下の場合には加算レベルを+6dBとなる補正を施して出力し、入力値が約−30dB以上約−18dB以下の場合には、入力値のレベルが大きくなるにつれて加算レベルを徐々に小さくして、入力値が約―18dB以上約+8dB以下の場合には、さらに減算レベルの絶対値を大きくする補正を施して出力する。したがって、ゲイン係数信号出力器27が出力する第2サンプリング周波数FS2=48kHzの第2ゲイン係数信号は、入力される実効値の最小値から最大値の変化幅に比べて、その最小値から最大値の変化幅が小さくなる。
ゲイン係数信号出力器27が出力する第2サンプリング周波数FS2=48kHzの第2ゲイン係数信号は、サンプリング周波数をFS2=48kHzからFS1=192kHzに変換するアップサンプリングコンバータである第2サンプリング周波数変換器28に入力される。サンプリング周波数変換器28は、アップサンプリングコンバータとして、サンプリング周波数FS2=48kHzのデジタル音声信号の1サンプルにつき3サンプルのゼロ値を周期的に挿入するようにして、FS1=192kHzのデジタル音声信号に変換する。
第2サンプリング周波数変換器28は、上述のサンプリング周波数変換器21および22と同様に、サンプリング定理における折り返しを防止するのに必要なアンチエリアシングフィルタを含む。具体的には、サンプリング周波数変換器28は、サンプリング周波数をFS2=48kHzからFS1=192kHzに変換するアップサンプリングコンバータであるので、FS2の1/2の周波数(=24kHz)以下の周波数を含まないようにするのに、24kHz以下の所定の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第2アンチエリアシングフィルタを含む。本実施例の場合には、第2アンチエリアシングフィルタはサンプリング周波数FS1で動作する8タップのFIRフィルタにより構成されている。
第2サンプリング周波数変換器28は、第2ゲイン係数信号をアップサンプルして第2アンチエリアシングフィルタを通過させたサンプリング周波数FS1の第1ゲイン係数信号を出力する。第2サンプリング周波数変換器28の出力は、第1サンプリング周波数FS1=192kHzの第1ゲイン係数信号として、第1信号処理部4の乗算器13並びに乗算器14に入力される。
なお、サンプリング周波数変換器28が含む第2アンチエリアシングフィルタは、上述のサンプリング周波数変換器21および22と同様に、聴覚特性フィルタの出力に実質的にほぼ影響を与えない。したがって、第2アンチエリアシングフィルタは、図2のグラフにおける点線の曲線30のようなローパス(低域通過型)のフィルタ特性を有していてもよい。また、実効値演算器25並びに26の出力は、ローパスフィルターの特性により第2サンプリング周波数FS2=48kHzの1/2の周波数よりも低い周波数に帯域制限されていることになるので、第2アンチエリアシングフィルタのカットオフ周波数をさらに低い周波数にすることができる。
その結果、アップサンプルするサンプリング周波数変換器28が含む第2アンチエリアシングフィルタは、それを構成するFIRフィルタのタップ数を、ダウンサンプルするサンプリング周波数変換器21および22の第1アンチエリアシングフィルタを構成するFIRフィルタのタップ数よりも少なく設定することができる。最少位相特性の低域通過フィルタを構成するFIRフィルタのタップ数を短く出来れば、FIRフィルタの遅延時間が短くなるので、遅延が少なくなるという利点がある。
第1信号処理部4の乗算器13並びに乗算器14は、デジタル入力音声信号の左チャンネル成分Lin並びに右チャンネル成分Rinに、それぞれサンプリング周波数変換器28が出力する第1サンプリング周波数FS1=192kHzの第1ゲイン係数信号を乗算して、それぞれデジタル出力音声信号Lout並びにRoutとして端子4に出力する。第1サンプリング周波数FS1で動作する第1信号処理部4において、実質的な信号処理部分は、乗算器13並びに乗算器14での乗算処理だけである。
一方で、第2信号処理部5は、第1サンプリング周波数FS1の1/4のサンプリング周波数で動作しているので、第2信号処理部5の演算負荷は、第1信号処理部4に比べて小さいことになる。第2信号処理部5では、サンプリング周波数が48kHzで規定されるITU−R BS.1770に準拠するラウドネス値を算出するものの、高いサンプリング周波数である第1サンプリング周波数FS1=192kHzのデジタル入力音声信号に、第2信号処理部5で得た正確なラウドネス値を演算して、比較的に小さい演算負荷でレベル補正を施した第1サンプリング周波数FS1=192kHzのデジタル出力音声信号を得ることができる。
例えば、第1サンプリング周波数FS1=192kHzのデジタル音声信号であって、再生時間が1分49秒の楽曲1について確認すると、本実施例の場合には、楽曲1の全サンプルについての信号処理に要する時間は1.90秒である。しかしながら、仮に第2信号処理部5を、本実施例のように第1サンプリング周波数FS1の1/4のサンプリング周波数で動作させずに、第1サンプリング周波数FS1で動作させるようにする比較例の場合には、楽曲1の全サンプルについての信号処理に要する時間は3.55秒にも及んで長くなり、約86.8%も長い時間を要することになる。
また、例えば、第1サンプリング周波数FS1=96kHzのデジタル音声信号であって、再生時間が1分5秒の楽曲2について確認すると、本実施例の場合には、楽曲2の全サンプルについての信号処理に要する時間は0.44秒である。しかしながら、仮に第2信号処理部5を、本実施例のように第1サンプリング周波数FS1の1/2のサンプリング周波数で動作させずに、第1サンプリング周波数FS1で動作させるようにする比較例の場合には、楽曲2の全サンプルについての信号処理に要する時間は0.58秒にも及んで長くなり、約31.8%も長い時間を要することになる。
上記の楽曲1および楽曲2の場合で分かるように、本実施例のデジタル音声信号処理装置1では、正確なラウドネス値を演算する第2信号処理部5を第1サンプリング周波数FS1よりも低い第2サンプリング周波数FS2で動作させているので、比較的に小さい演算負荷でレベル補正を行うことができ、計算にかかる時間を短縮できる。
なお、上記の説明では、第1サンプリング周波数FS1=192kHz、第2サンプリング周波数FS2=48kHzの場合を取り上げているが、入力端子2に入力されるデジタル音声信号のサンプリング周波数を意味する第1サンプリング周波数FS1は、例えば、96kHz、88.2kHz、176.4kHzといったハイレゾリューションと呼ばれる高いサンプリング周波数のものであればよく、他のサンプリング周波数であったとしても、第2サンプリング周波数よりも高い周波数のものであればよい。
ただし、本発明は、他の実施例として、第1サンプリング周波数FS1=32kHz(または44.1kHz)、第2サンプリング周波数FS2=48kHzの場合のように、第1サンプリング周波数が第2サンプリング周波数よりも低い周波数であってもよい。第1サンプリング周波数が第2サンプリング周波数よりも高い周波数である場合に限定するものではない。
また、デジタル音声信号処理装置1に入力されるデジタル音声信号は、1チャンネルのモノラル信号であっても、3チャンネル以上のチャンネル成分を含むマルチチャンネル信号であってもよい。第2信号処理部5における第1サンプリング周波数変換器21と、聴覚特性フィルタ23と、実効値演算器25と、を1または複数のチャンネル数に応じて設け、複数の実効値の内の最大値から一の第2ゲイン係数信号を出力し、デジタル入力音声信号の複数のチャンネル成分に対してそれぞれ第1ゲイン係数信号を乗算して第1サンプリング周波数のデジタル出力音声信号として出力するようにすればよい。
また、上記実施例では、デジタル音声信号処理装置1をデジタルシグナルプロセッサ(DSP)で構成しているが、もちろん、サンプリング周波数変換を含むレベル補正の信号処理を実現するデジタル音声信号処理装置1は、音声信号を取り扱う演算能力を有する他の(図示しない)プロセッサのみで構成してもよい。その場合にも、コンピュータのプロセッサには、以下に説明するプログラムがロードされて実行される。したがって、以下では、上述の図1〜図3の図示における図番を共通に用いて説明し、パルス幅変調の信号処理のプログラムのフローチャートは省略する。
本実施例のデジタル音声信号処理のプログラムは、プロセッサに、デジタル入力音声信号のサンプリング周波数を第1サンプリング周波数FS1として検出するステップS1と、デジタル入力音声信号を第1サンプリング周波数FS1とは異なる第2サンプリング周波数FS2のデジタル音声信号に変換するステップS2と、第2サンプリング周波数FS2のデジタル音声信号に第2サンプリング周波数FS2で規定されるラウドネス特性を聴覚特性フィルタによって与えて出力するステップS3と、聴覚特性フィルタの出力の実効値を第2サンプリング周波数FS2で動作して算出するステップS4と、実効値から第2サンプリング周波数FS2の第2ゲイン係数信号を出力するステップS5と、第2ゲイン係数信号を第1サンプリング周波数FS1の第1ゲイン係数信号に変換するステップS6と、デジタル入力音声信号に第1ゲイン係数信号を乗算して第1サンプリング周波数FS1のデジタル出力音声信号として出力するステップS7と、を実行させる。
第1サンプリング周波数FS1が第2サンプリング周波数FS2よりも高い周波数であるような場合には、上記のステップS2において、第2サンプリング周波数FS2の1/2以下の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第1アンチエリアシングフィルタを通過させて、デジタル入力音声信号を第1サンプリング周波数FS1から第2サンプリング周波数FS2のデジタル音声信号にダウンサンプリングして変換するステップS21を含むようにするのが好ましい。また、同様に、上記のステップS6において、第2サンプリング周波数FS2の1/2以下の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第2アンチエリアシングフィルタを通過させて、デジタル入力音声信号を第2サンプリング周波数FS2から第1サンプリング周波数FS1のデジタル音声信号にアップサンプリングして変換するステップS61を含むようにするのが好ましい。この場合には、第2アンチエリアシングフィルタを構成するFIRフィルタのタップ数を、第1アンチエリアシングフィルタを構成するFIRフィルタのタップ数よりも少なく設定するのが好ましい。
また、例えば第2サンプリング周波数が48kHzであるような場合には、上記のステップS3において、聴覚特性フィルタのラウドネス特性が、デジタル入力音声信号のラウドネスを測定するITU−R BS.1770に準拠して規定されるものにすることができる。汎用されている標準規格をそのまま利用できて、より正確なラウドネス値を演算できる利点がある。
その結果、本実施例のデジタル音声信号処理のプログラムは、正確なラウドネス値を演算する第2信号処理部5に関する上記のステップS3〜S5を第1サンプリング周波数FS1よりも低いサンプリング周波数である第2サンプリング周波数FS2で動作させているので、比較的に小さい演算負荷でレベル補正を行うことができ、計算にかかる時間を短縮できる。
なお、このデジタル音声信号処理のプログラムは、コンピュータのプロセッサに限らず、デジタル音声信号を取り扱うことが出来るプロセッサを搭載する電子機器で実行可能である。例えば、携帯電話、スマートフォン、等の音声信号専用のプロセッサを備えていないものであっても、CPUにおいてデジタル音声信号の演算能力をそなえていればよい。
本発明のデジタル音声信号処理およびそのプログラムは、ステレオ音声信号を再生するステレオ装置のみならず、マルチチャンネルサラウンド音声再生装置を含む音響再生システム、あるいは、持ち運びが可能なポータブル機器、スマートフォンなどの電子機器にも適用が可能である。
1 デジタル音声信号処理装置
2 入力端子
3 出力端子
4 第1信号処理部
5 第2信号処理部
11 サンプリング周波数検出器
13、14 乗算器
21、22 第1サンプリング周波数変換器
23、24 聴覚特性フィルタ
25、26 実効値演算器
27 ゲイン係数信号出力器
28 第2サンプリング周波数変換器

Claims (5)

  1. デジタル入力音声信号のサンプリング周波数を第1サンプリング周波数として検出するサンプリング周波数検出器と、
    該デジタル入力音声信号を該第1サンプリング周波数とは異なる第2サンプリング周波数のデジタル音声信号に変換する第1サンプリング周波数変換器と、
    該第2サンプリング周波数の該デジタル音声信号に該第2サンプリング周波数で規定されるラウドネス特性を与えて出力する聴覚特性フィルタと、
    該聴覚特性フィルタの出力の実効値を該第2サンプリング周波数で動作して算出する実効値演算器と、
    該実効値から該第2サンプリング周波数の第2ゲイン係数信号を出力するゲイン係数信号出力器と、
    該第2ゲイン係数信号を該第1サンプリング周波数の第1ゲイン係数信号に変換する第2サンプリング周波数変換器と、
    該デジタル入力音声信号に該第1ゲイン係数信号を乗算して該第1サンプリング周波数のデジタル出力音声信号として出力する乗算器と、
    を備える、デジタル音声信号処理装置。
  2. 前記第1サンプリング周波数が前記第2サンプリング周波数よりも高い周波数であり、前記第1サンプリング周波数変換器が、該第2サンプリング周波数の1/2以下の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第1アンチエリアシングフィルタを含むダウンサンプリング変換器であり、前記第2サンプリング周波数変換器が、該第2サンプリング周波数の1/2以下の周波数をカットオフ周波数とする最少位相特性の低域通過フィルタである第2アンチエリアシングフィルタを含むアップサンプリング変換器であり、
    該第2アンチエリアシングフィルタを構成するFIRフィルタのタップ数が、該第1アンチエリアシングフィルタを構成するFIRフィルタのタップ数よりも少なく設定されている、
    請求項2に記載のデジタル音声信号処理装置。
  3. 前記第2サンプリング周波数が48kHzであり、前記聴覚特性フィルタの前記ラウドネス特性が、デジタル入力音声信号のラウドネスを測定するITU−R BS.1770に準拠して規定される、
    請求項2に記載のデジタル音声信号処理装置。
  4. 前記デジタル入力音声信号が同期する複数のチャンネル成分を含む場合に、
    前記聴覚特性フィルタおよび前記実効値演算器が、複数の該チャンネル成分に対してそれぞれ複数の前記実効値を算出し、
    前記ゲイン係数信号出力器が、複数の該実効値の内の最大値から一の前記第2ゲイン係数信号を出力し、
    該デジタル入力音声信号の複数の該チャンネル成分に対してそれぞれ前記第1ゲイン係数信号を乗算して前記第1サンプリング周波数のデジタル出力音声信号として出力する、
    請求項1から3のいずれかに記載のデジタル音声信号処理装置。
  5. デジタル入力音声信号のサンプリング周波数を第1サンプリング周波数として検出するステップと、
    該デジタル入力音声信号を該第1サンプリング周波数とは異なる第2サンプリング周波数のデジタル音声信号に変換するステップと、
    該第2サンプリング周波数の該デジタル音声信号に該第2サンプリング周波数で規定されるラウドネス特性を聴覚特性フィルタによって与えて出力するステップと、
    該聴覚特性フィルタの出力の実効値を該第2サンプリング周波数で動作して算出するステップと、
    該実効値から該第2サンプリング周波数の第2ゲイン係数信号を出力するステップと、
    該第2ゲイン係数信号を該第1サンプリング周波数の第1ゲイン係数信号に変換するステップと、
    該デジタル入力音声信号に該第1ゲイン係数信号を乗算して該第1サンプリング周波数のデジタル出力音声信号として出力するステップと、
    を含む、デジタル音声信号処理のプログラム。
JP2018055930A 2018-03-23 2018-03-23 デジタル音声信号処理装置およびそのプログラム Pending JP2019169840A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018055930A JP2019169840A (ja) 2018-03-23 2018-03-23 デジタル音声信号処理装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018055930A JP2019169840A (ja) 2018-03-23 2018-03-23 デジタル音声信号処理装置およびそのプログラム

Publications (1)

Publication Number Publication Date
JP2019169840A true JP2019169840A (ja) 2019-10-03

Family

ID=68108568

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018055930A Pending JP2019169840A (ja) 2018-03-23 2018-03-23 デジタル音声信号処理装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP2019169840A (ja)

Similar Documents

Publication Publication Date Title
KR100859348B1 (ko) 워핑된 처리를 이용한 디지털 오디오의 동적 범위 제어 및등화
EP2209116B1 (en) Device and method for high-frequency range interpolation of an audio signal
US20070140511A1 (en) Process of implementing low frequency of audio signal
EP2209326B1 (en) Auditory sense correction device
US20080273718A1 (en) Bass enhancing method, signal processing device, and audio reproducing system
JP2004248298A (ja) 補聴器における動的圧縮
CN111525902B (zh) 一种音频限幅的方法和系统
US10128809B2 (en) Intelligent method and apparatus for spectral expansion of an input signal
US9478235B2 (en) Voice signal processing device and voice signal processing method
KR20220080146A (ko) 스펙트럼적 직교 오디오 성분들을 사용하는 부대역 공간 및 크로스토크 처리
JP2009296298A (ja) 音声信号処理装置および方法
US9281791B2 (en) Device for adding harmonics to sound signal
JP4970174B2 (ja) ナレーション音声制御装置
JP2019169840A (ja) デジタル音声信号処理装置およびそのプログラム
JP6314662B2 (ja) 音声信号処理装置およびそのプログラム
JP4804376B2 (ja) オーディオ装置
JP4471780B2 (ja) 音声信号処理装置及びその方法
US20210319800A1 (en) Frequency band expansion device, frequency band expansion method, and storage medium storing frequency band expansion program
JP4326282B2 (ja) フィルタ装置
JP6544276B2 (ja) 音響信号の転送方法
JP2001326991A (ja) 音声処理装置
JP6289041B2 (ja) イコライザ
JP6531418B2 (ja) 信号処理装置
JP2012145659A (ja) 音声信号圧縮装置、音声信号圧縮方法及びプログラム
JPH03187610A (ja) 音響補正装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20210303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20210303

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210427