JP6056356B2

JP6056356B2 - 録音装置

Info

Publication number: JP6056356B2
Application number: JP2012225516A
Authority: JP
Inventors: 茂之安達
Original assignee: Teac Corp
Current assignee: Teac Corp
Priority date: 2012-10-10
Filing date: 2012-10-10
Publication date: 2017-01-11
Anticipated expiration: 2032-10-10
Also published as: CN103731794A; US9240208B2; US20140098651A1; JP2014078298A

Description

本発明は、複数のトラックに音声信号を記録するマルチトラックレコーダ等の録音装置に関する。

従来から、複数のトラックに音声信号を記録するマルチトラックレコーダが知られている。マルチトラックレコーダを用いることで、例えばエレキギターを使ってリズムギターパートをトラック１、リードギターパートをトラック２に記録し、内蔵マイクを使ってボーカル音声をトラック３に記録し、これらをミックスダウンしてステレオ信号を生成して記録する等が可能である。

下記の特許文献１には、マルチチャンネル音響システムにおける自動マスタリング機能について記載されている。チャンネルフェーダを均一な値に調整し、少なくとも２つのチャンネルを均一な出力レベルに制限し、それ以外の各チャンネルを、２つのチャンネルの均一な出力レベル値よりも小さいデシベルである出力レベル値に制限した上で、パラメータであるチャンネルフェーダ、スレッシュホールド、リリース、出力レベルの内の少なくとも１つの値を調整することにより、エンコードチャンネルのさらなる圧縮及び／又は制限を行うことが記載されている。

特表２０１１−５３０８４３号公報

ところで、マルチトラックレコーダにおいては、通常、歪まない程度にできるだけ大きなレベルでミックスダウンを行い、その後、マスタリング処理を行うことで録音を完了させる。マスタリング処理は、音質補正（イコライザ処理）や音圧を上げる処理（圧縮処理）、指定したレベルに合わせ込む処理（ノーマライズ）を実行することであるが、ある程度の知識や経験がないと所望の結果を得るのが難しい。特に、音圧を上げる圧縮処理は、閾値（スレッシュホールド）や比率（レシオ）の調整が比較的困難であるため、例えば曲の種類毎にいくつかプリセットを用意しておき、ユーザがこれらのプリセットの中から所望のプリセットを選択できるような構成が提案されているが、適正な録音レベルでミックスダウンされていなければプリセットも効果がない問題がある。

図５Ａ及び図５Ｂに、マスタリング処理における圧縮処理（コンプレッサ）を模式的に示す。図５Ａは、ミックスダウンが適正なレベルで行われている場合の圧縮処理である。図において、０ｄＢＦＳは、基準となる目標レベルであり、ＴＨは、圧縮処理における閾値である。圧縮処理は、閾値を超えるレベルを所定の比率で圧縮し、閾値以下のレベルをそのまま維持する処理である。従って、図５Ａに示すように、ミックスダウンが適正なレベルで行われ、そのレベルが閾値ＴＨに達する場合には圧縮処理が意味を持つ。

他方、図５Ｂは、ミックスダウンが適正なレベルで行われていない場合、つまり、レベルが小さすぎる場合の圧縮処理である。オーバレベルによる歪みを考慮すると、ミックスダウンのレベルを小さくすることが有効であるが、レベルが小さすぎると閾値ＴＨに達しないこととなり、圧縮が全く行われないため意味がなくなってしまう。これは、複数のプリセットを用意しても同様であり、選択されたプリセットの閾値ＴＨとの比較においてミックスダウンのレベルが小さければ、圧縮処理は実質的に機能しないことになる。

本発明の目的は、ミックスダウンして得られるステレオ音声信号等の音声信号のレベルによらず、圧縮処理を効果的に実行でき、これによりマスタリング処理を簡易に実行できる録音装置を提供することにある。

本発明は、音声信号を記録する録音装置であって、音声信号の第１ピーク値を検出するピーク値検出手段と、検出された第１ピーク値を用いて圧縮処理の閾値を調整する閾値調整手段と、音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮するとともに、圧縮後の音声信号の第２ピーク値を検出する圧縮手段とを備えることを特徴とする。

本発明の１つの実施形態では、さらに、複数トラックの各トラックに割り当てられた音声信号からステレオ音声信号を生成するミックスダウン手段を備え、前記ミックスダウン手段が、前記ピーク値検出手段として音声信号の第１ピーク値を検出することを特徴とする。

本発明の他の実施形態では、さらに、検出された前記第２ピーク値を用いて前記圧縮手段で処理された音声信号のレベルを目標の基準レベルまで増幅するノーマライズ手段を備えることを特徴とする。

本発明のさらに他の実施形態では、前記圧縮手段は、音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮すると同時に、圧縮処理された音声信号のレベルを、前記第２ピーク値を用いて目標の基準レベルまで増幅することを特徴とする。

本発明のさらに他の実施形態では、前記ピーク値検出手段は、音声信号の所定下限周波数以下及び所定上限周波数以上をカットする手段と、所定下限周波数以下及び所定上限周波数以上がカットされた音声信号のエンベロープを検出する手段とを備え、前記エンベロープのピーク値を前記第１ピーク値として検出することを特徴とする。

本発明によれば、音声信号のレベルによらず、圧縮処理を効果的に実行でき、これによりマスタリング処理を簡易に実行することができる。本発明によれば、音声信号のレベルが小さい場合でも、確実に圧縮処理を実行できるので、ユーザはマスタリング処理の有効性を実感し得る。

実施形態におけるマルチトラックレコーダの構成図である。ミックスダウン処理の機能ブロック図である。実施形態におけるマスタリング処理のフローチャートである。実施形態における調整前の閾値説明図である。実施形態における調整後の閾値説明図である。ミックスダウンが適正レベルの場合の圧縮処理説明図である。ミックスダウンが適正レベルでない場合の圧縮処理説明図である。ピーク検出処理の説明図である。実施形態のピーク検出説明図である。ミックスダウン処理時のピーク検出（シングルバンド）の機能ブロック図である。ミックスダウン処理時のピーク検出（マルチバンド）の機能ブロック図である。圧縮処理時のピーク検出（シングルバンド）の機能ブロック図である。圧縮処理時のピーク検出（マルチバンド）の機能ブロック図である。他の実施形態におけるマスタリング処理のフローチャートである。

以下、図面に基づき本発明の実施形態について、録音装置としてマルチトラックレコーダを例にとり説明する。

図１に、本実施形態におけるマルチトラックレコーダ１の構成ブロック図を示す。音声信号入力回路１０は、複数の入力ポートを備え、複数の音源（ソース）からの音声信号を入力する。複数の音声信号を例示すると、ギター、ボーカル、ドラム等である。音声信号入力回路１０は、内蔵マイク及び／又は入力ポートを備え、音声信号を入力する。内蔵マイクと入力ポートの双方を備える場合、内蔵マイクと入力ポートは相互に切替可能である。音声信号入力回路１０から入力された音声信号は、バス１６を介してＤＳＰ（デジタルシグナルプロセッサ）１４に供給される。

ＤＳＰ１４は、ＣＰＵ３２の制御の下で、音声信号入力回路１０から供給された複数チャンネルの音声信号に対して、所定のデジタル処理、具体的には、ミックスダウン処理やマスタリング処理等を施し、バス１８を介してレコーダ３４に記録する。レコーダ３４の記録媒体は、ＣＤ−Ｒ／ＲＷ、ＤＶＤ−Ｒ／ＲＷ等の光ディスクやハードディスク、フラッシュメモリ媒体等である。ＤＳＰ１４の処理には、操作子２０の操作に応じて各音声信号のパン（ＰＡＮ）や音量レベルを調整する処理も含まれる。

操作子２０は、マルチトラックレコーダ１の操作面に設けられる。操作子２０は、各種のキースイッチや選択ボタン、メニューボタン、決定ボタン、パン（ＰＡＮ）つまみ、レベルつまみ等から構成される。ユーザは、操作子２０を操作することで、各音声信号を、複数トラックの少なくとも１つのトラックに割り当てる。操作子２０の操作状態は検出回路２２で検出される。検出回路２２は、バス１８を介して操作子２０の操作状態検出信号をＣＰＵ３２に供給する。

ＣＰＵ３２は、マルチトラックレコーダの全体を統括制御する。ＣＰＵ３２は、フラッシュＲＯＭ２８に記憶されたプログラムに従い、ワーキングメモリとしてのＲＡＭ３０を用いて各種処理を実行する。具体的には、検出回路２２からの操作状態検出信号に基づいて、複数チャンネルの各音声信号を複数トラックの少なくとのいずれかのトラックに割り当てる。例えば、トラックがトラック１〜トラック８まで存在する場合に、チャンネルＡをトラック１に割り当て、チャンネルＢをトラック２に割り当て、チャンネルＣをトラック８に割り当てる等である。また、ＣＰＵ３２は、各種の情報を表示回路２６に供給する。表示回路２６は、各種情報を表示部２４に表示する。

ＣＰＵ３２は、ユーザによる操作子２０の操作に応じて各種メニュー画面や設定画面を表示すべく表示回路２６に指令し、表示回路２６は、ＣＰＵ３２からの情報に応じてメニュー画面や設定画面を表示部２４に表示する。

また、ＣＰＵ３２は、各トラック毎に割り当てられた音声信号のレベルを、例えば棒グラフ形式（レベルメータ）で表示すべく表示回路２６に指令し、表示回路２６は、ＣＰＵ３２からの情報に応じてレベルメータ画像を表示部２４に表示する。

さらに、ＣＰＵ３２は、検出回路２２からの操作状態検出信号に応じ、レコーダ３４に記録された音声信号を読み出してＤＳＰ１４に供給し、ＤＳＰ１４はバス及び音声信号出力回路１２を介して音声信号を外部に出力する。音声出力回路１２は、アナログ出力ポートやデジタル出力ポート等の各種出力ポートを有する。

本実施形態におけるＤＳＰ１４は、上記のように、ミックスダウン処理及びマスタリング処理を行うので、ミックスダウン処理部及びマスタリング処理部として機能する。これらの各処理は、予めプログラムメモリに記憶されたプログラムを順次読み出し、ＤＳＰ１４がプログラムを逐次実行することで実現される。もちろん、ＤＳＰ１４の代わりに、ミックスダウン処理を行うハードウェア、マスタリング処理を行うハードウェアを設けることもできる。要するに、ミックスダウン処理、マスタリング処理は、ハードウェアあるいはソフトウェアのいずれで実行してもよい。

ミックスダウン処理は、音声信号入力回路１０から供給された複数チャンネルの音声信号をＬチャンネル及びＲチャンネルの音声信号に合成する処理である。ミックスダウン処理は、各トラックのレベルつまみを用いてレベルとバランスを調節し、かつ、全体のレベルを調節しながら行われる。また、トラックのＰＡＮつまみを用いてＬチャンネル及びＲチャンネルのステレオの定位を設定する。Ｌチャンネル及びＲチャンネルのレベル（ステレオメータ）は表示部２４に表示され、ユーザは表示されるレベルを視認しつつ調節する。

図２に、ミックスダウン処理の機能ブロック図を示す。トラック１〜トラック８の８個のトラックにそれぞれ音声信号が割り当てられている。各トラックは、できるだけフルスケール（０ｄＢＦＳ）に近いレベルで録音される。各トラックの音声信号のレベルは、チャンネル毎に設けられたチャンネルフェーダ２０ａで調整され、さらにＰＡＮつまみ２０ｂでＬ，Ｒ左右のレベルを調整しつつ定位される。マスタフェーダ２０ｃは、０ｄＢに設定され、全体のレベルが調整されてマスタトラック（ステレオトラック）にミックスダウンされる。ユーザは、ステレオメータを視認しつつ、レベルがオーバしない程度にできるだけフルスケールに近いレベルでミックスダウンを行う。

また、マスタリング処理は、イコライザ処理（イコライジング）、圧縮処理、ノーマライズ処理を含む処理であり、ユーザがマスタリングすべき音声信号の開始点と終了点を設定し、「マスタ録音」のボタンを操作あるいはメニューを選択することで開始される。マスタリングにおける圧縮処理の閾値及び比率は予め複数セット（複数のプリセット）が用意されており、ユーザが所望のプリセットを選択できるように構成される。しかしながら、ミックスダウン処理した結果の音声信号のレベルが適当でなく、小さすぎる場合には、音声信号のレベルが圧縮処理における閾値以下となり、圧縮処理の効果がなくなってしまう。

そこで、本実施形態では、マスタリング処理において、音声信号のレベルのピーク値を検出し、このピーク値に応じて適応的に圧縮処理の閾値を自動的に調整して圧縮処理を行うようにしている。音声信号のレベルが小さいため、そのピーク値もこれに応じて小さくなるが、ピーク値を検出し、ピーク値が小さければこれに応じて圧縮処理に用いる閾値を自動的に小さく調整することで、音声信号のうち閾値を超える部分が生じることとなり、圧縮処理の実効性を担保できる。

図３に、マスタリング処理のフローチャートを示す。ＤＳＰ１４で実行される処理である。まず、ユーザからの指示に応じ、音声信号入力回路１０から供給された複数チャンネルの音声信号をＬチャンネル及びＲチャンネルの音声信号に合成するミックスダウン処理を行う（Ｓ１０１）。また、ミックスダウン処理を実行すると同時に、音声信号レベルのピーク値（第１ピーク値）を検出する。ピーク値は、公知の方法で検出することができるが、不必要な周波数におけるピーク値を除外する、あるいは突発的なピーク値を除外して検出することが望ましい。この点についてはさらに後述する。ミックスダウン処理され、かつ、ピーク値が検出されたＬチャンネル及びＲチャンネルのステレオ音声信号は、ＲＡＭ３０あるいはレコーダ３４に記憶される。ピーク値は、ＲＡＭ３０に記憶される。

次に、ユーザから「マスタ録音」が指示されると、ＤＳＰ１４は、必要に応じてイコライザ処理（イコライジング）を行った上で、圧縮処理に用いる閾値（ユーザが選択したプリセットの閾値）を、検出したピーク値(第１ピーク値)に応じて自動調整する（Ｓ１０２）。この処理は、ステレオ音声信号のピーク値が小さすぎる場合に、これに応じて圧縮処理の閾値も小さく調整する処理である。具体的には、ＤＳＰ１４は、Ｓ１０１で検出され、ＲＡＭ３０に記憶されたピーク値を読み出し、圧縮処理の閾値と大小比較し、ピーク値が閾値以下であるか否かを判定する。閾値は、上記のように、予め複数のプリセットが用意されている場合、ユーザが選択したプリセットの閾値である。ピーク値が閾値以下であれば、圧縮処理しても圧縮される部分が存在しないため圧縮処理が無意味となるので、ピーク値に応じて閾値を小さく調整する。調整前の閾値をＴＨ、調整後の閾値をＴＨｎ、ピーク値をＰとすると、
ＴＨ≧Ｐ＞ＴＨｎ
を満たすように調整する。一例として、ピーク値Ｐに対して所定量Δ（設計や仕様によって決定される任意の値）だけ減じたレベルをＴＨｎとする等である。なお、ピーク値が閾値以上であれば、閾値を調整する必要はないが、ピーク値と閾値との差分が所定の値（設計や仕様によって決定される任意の値）より小さく、ピーク値と閾値がほとんど変わらないのであれば、たとえピーク値が閾値以上であっても閾値を調整してもよい。

ピーク値に応じて閾値を自動調整した後、調整後の閾値を用いて圧縮処理を行う（Ｓ１０３）。すなわち、音声信号のうち、調整後の閾値を超えるレベルを所定の比率で圧縮し、音声信号の音圧を向上させる。比率は、例えば１０：１等である。圧縮処理では、閾値を超えたレベルは圧縮されて相対的に小さくなるものの、元の音声信号の波形は残っている。

また、圧縮処理を行うと同時に、ミックスダウン処理と同様に、圧縮処理された音声信号レベルのピーク値(第２ピーク値)を検出する。検出されたピーク値は、ＲＡＭ３０に記憶される。

次に、圧縮処理を行った音声信号に対し、ノーマライズを行う（Ｓ１０４）。圧縮処理された音声信号のピーク値(第２ピーク値)を、目標の基準レベル（例えば０ｄＢＦＳ）となるように増幅する。通常、ノーマライズでは、まず音声信号のピーク値を検出する処理が行われるが、本実施形態では、ノーマライズに先立つ圧縮処理において同時にピーク検出が行われ、このピーク値をノーマライズで用いるため、ノーマライズにおいて別途ピーク値検出を行う必要がなく、ノーマライズを高速化できる。

以上のようにして処理された音声信号は、マスタデータとしてレコーダ３４に記録される。マスタデータは、ユーザからの再生指示に応じて読み出され、音声信号出力回路１２から出力される。なお、マスタデータをＷＡＶ形式等に変換し、外部のパーソナルコンピュータに出力してもよい。

本実施形態では、ミックスダウン処理時にピーク値(第１ピーク値)を検出し、このピーク値に応じて閾値を自動調整して圧縮処理するので、たとえミックスダウン処理された音声信号のレベルが小さすぎる場合であっても、圧縮処理を効果的に実行し、音声信号の音圧を向上させることができる。しかも、圧縮処理時においてもピーク値(第２ピーク値)を検出し、このピーク値を用いてノーマライズを行うため、全体の処理を効率化・高速化できる。

ミックスダウン処理時に検出されるピーク値（第１ピーク値）と、圧縮処理時に検出されるピーク値(第２ピーク値)は、必ずしも同一ではなく、この意味で、本実施形態ではそれぞれのピーク値を第１ピーク値と第２ピーク値と称して区別している。もちろん、結果的に第１ピーク値と第２ピーク値が同一となることを排除するものではない。

図４Ａに、調整前の閾値とミックスダウンして得られた音声信号との関係を示す。音声信号のレベルが小さく、閾値ＴＨに達していないため、このままでは圧縮処理しても圧縮されず、ユーザはマスタリング処理の効果を実感できない。

他方、図４Ｂに、調整後の閾値とミックスダウンして得られた音声信号との関係を示す。閾値がＴＨからＴＨｎに下方調整され、音声信号のレベルが閾値ＴＨｎに達していることが分かる。この場合、音声信号のうち、閾値ＴＨｎを超える部分については所定の比率で圧縮されるため、ユーザはマスタリング処理の効果、すなわち音圧向上を実感し得る。

次に、本実施形態における、ミックスダウン処理時におけるピーク値検出処理と、圧縮処理時におけるピーク値検出処理について説明する。本実施形態において、両ピーク値検出処理は互いに異なる処理である。

図６に、ミックスダウンにより得られたステレオ音声信号のレベルと検出ピークの関係を示す。単に、音声信号レベルのピーク値Ｐ０を検出すると、図に示すように突発的なピークをピーク値Ｐ０として検出してしまう場合があり得る。また、本来不必要な周波数帯、例えば２０Ｈｚ以下や１２ｋＨｚ以上の周波数におけるピークをピーク値Ｐ０として検出してしまう場合があり得る（本来不必要な周波数帯は、適用する装置の仕様や特性により異なるが、本実施形態では２０Ｈｚ以下や１２ｋＨｚ以上として説明する）。このようなピーク値に基づいて閾値を自動調整したのでは、効果的な圧縮処理ができない。そこで、突発的なピークでなく、かつ、不必要な周波数帯におけるピークでないピークをピーク値Ｐ１として検出することが望ましい。

このため、図７に示すように、ミックスダウンして得られた音声信号のエンベロープを検出し、このエンベロープにおけるピークをピーク値Ｐ１として検出することで、真のピーク値Ｐ１を確実に検出することができる。なお、音声信号のエンベロープは、音声信号をローパスフィルタに通過させることで取得でき、ローパスフィルタに通過させる前に、２０Ｈｚ以下の周波数、及び１２ｋＨｚ以上の周波数をそれぞれカットするフィルタで不必要な周波数帯をカットすればよい。

図８Ａに、ミックスダウン時におけるピーク値検出の機能ブロック図を示す。圧縮処理をシングルバンド（周波数帯毎に分けない場合）で行う場合の処理である。

ステレオバス１８からのステレオ音声信号は、ステレオトラックとしてレコーダ３４に記録されるとともに、ステレオ音声信号は、低域カットフィルタ（ＬＣＦ）で２０Ｈｚ以下の低域成分がカットされ、さらに高域カットフィルタ（ＨＣＦ）で１２ｋＨｚ以上の高域成分がカットされる。低域及び高域がカットされたステレオ音声信号は、絶対値検出器（ＡＢＳ）で絶対値が検出され、ローパスフィルタ（ＬＰＦ）でエンベロープが検出され、最大値検出器（ＭＡＸ）でその最大値が検出されてピーク値が検出される。これらのＬＣＦ、ＨＣＦ、ＡＢＳ、ＬＰＦ、ＭＡＸは、ＤＳＰ１４で構成されるが、ＤＳＰ１４とは別個の部材で構成してもよい。検出されたピーク値は、圧縮処理の閾値調整のために用いられる。具体的には、ユーザにより選択されたプリセットの閾値と大小比較され、大小比較の結果に応じて閾値が自動調整される。

図８Ｂに、ミックスダウン時におけるピーク値検出の機能ブロック図を示す。圧縮処理をマルチバンド（複数の周波数帯に分ける場合）で行う場合の処理である。

ステレオバス１８からのステレオ音声信号は、ステレオトラックとしてレコーダ３４に記録されるとともに、ステレオ音声信号は、低域カットフィルタ（ＬＣＦ）で２０Ｈｚ以下の低域成分がカットされ、さらに高域カットフィルタ（ＨＣＦ）で１２ｋＨｚ以上の高域成分がカットされる。低域及び高域がカットされたステレオ音声信号は、クロスオーバフィルタで３つの周波数帯に分割される。分割される３つの周波数帯を、相対的に低域周波数帯、中域周波数帯、高域周波数帯と称する。それぞれの周波数帯において、絶対値検出器（ＡＢＳ）で絶対値が検出され、ローパスフィルタ（ＬＰＦ）でエンベロープが検出され、最大値検出器（ＭＡＸ）でその最大値が検出されてピーク値が検出される。低域周波数帯におけるピーク値をピーク値Ｌ、中域周波数帯におけるピーク値をピーク値Ｍ、高域周波数帯におけるピーク値をピーク値Ｈとすると、これらのピーク値はいずれもＲＡＭ３０に記憶され、圧縮処理の閾値調整のために用いられる。具体的には、ユーザにより選択されたプリセットの低域閾値、中域閾値、高域閾値とそれぞれ大小比較され、大小比較の結果に応じてこれら３つの閾値が自動調整される。

このように、ミックスダウン処理して得られたステレオ音声信号の不要な周波数帯をカットし、そのエンベロープを検出してピーク値を検出して圧縮処理の閾値を自動調整することで、突発的なピークに影響されず、かつ、不要な周波数帯におけるピークに影響されずに適当な閾値に調整することができる。

図９Ａに、圧縮処理時におけるピーク値検出の機能ブロック図を示す。圧縮処理をシングルバンドで行う場合の処理である。

レコーダ３４のステレオトラックから読み出されたステレオ音声信号に対し、イコライザ（ＥＱ）でイコライジング処理した後、ミックスダウン処理時に検出されたピーク値に応じて調整された閾値を用いて圧縮処理を行う。圧縮処理されたステレオ音声信号は、レコーダ３４のステレオトラックに記録される。また、圧縮処理されたステレオ音声信号のピーク値が検出される。検出されたピーク値は、ＲＡＭ３０に記憶され、ノーマライズ処理に用いられる。圧縮処理時に検出されるピーク値は、ノーマライズ処理に用いられるため、ミックスダウン時におけるピーク値検出のようにエンベロープから検出する必要はない。

図９Ｂに、圧縮処理時におけるピーク値検出の機能ブロック図を示す。圧縮処理をマルチバンド（例えば３バンド）で行う場合の処理である。

レコーダ３４のステレオトラックから読み出されたステレオ音声信号に対し、イコライザ（ＥＱ）でイコライジング処理した後、クロスオーバフィルタで相対的に低域周波数帯、中域周波数帯、高域周波数帯の３つの周波数帯に分割し、それぞれの周波数帯において、ミックスダウン処理時に検出されたそれぞれの周波数帯におけるピーク値Ｌ，Ｍ，Ｈに応じて調整された閾値を用いて圧縮処理を行う。

ここで、それぞれの周波数帯における閾値は、それぞれの周波数帯におけるピーク値に応じて個別に調整されるため、全ての周波数帯において閾値が調整される他、ある周波数帯においては閾値が調整されるものの、他の周波数帯においては閾値が調整されない場合もあり得る。例えば、低域周波数帯におけるプリセットされた閾値をＴＨＬとし、高域周波数帯におけるプリセットされた閾値をＴＨＨとすると、ＴＨＬ≧ピーク値Ｌであれば閾値ＴＨＬは下方調整されるが、ピーク値Ｈ≧ＴＨＨであれば、閾値ＴＨＨはそのまま維持されて圧縮処理に用いられる。

３つの周波数帯毎に圧縮処理されたステレオ音声信号は、合成されてレコーダ３４のステレオトラックに記録される。また、圧縮処理され合成されたステレオ音声信号のピーク値が検出される。検出されたピーク値は、ＲＡＭ３０に記憶され、ノーマライズ処理に用いられる。ピーク値の検出は、シングルバンドの場合と同様である。

本実施形態では、図３に示すように、Ｓ１０３で圧縮処理及びピーク値検出を行い、Ｓ１０４でノーマライズ処理を行っており、ノーマライズ処理をオフライン、すなわちノーマライズ処理のみを実行してレコーダ３４に記録し、その後にノーマライズ処理された音声信号の再生を可能としているが、これをオンライン処理、すなわちユーザが視聴しながら処理を行うことも可能であり、この場合、圧縮処理及びピーク値検出処理を行うと同時にノーマライズ処理を演算により実行し、演算により得られた音声信号を再生してユーザが視聴できるようにする。

図１０に、他の実施形態の処理フローチャートを示す。ＤＳＰ１４で実行される処理である。まず、ユーザからの指示に応じ、音声信号入力回路１０から供給された複数チャンネルの音声信号をＬチャンネル及びＲチャンネルの音声信号に合成するミックスダウン処理を行う（Ｓ２０１）。また、ミックスダウン処理を実行すると同時に、音声信号レベルのピーク値を検出する。ミックスダウン処理され、かつ、ピーク値が検出されたＬチャンネル及びＲチャンネルのステレオ音声信号は、ＲＡＭ３０あるいはレコーダ３４に記憶される。ピーク値は、ＲＡＭ３０に記憶される。

次に、ユーザから「マスタ録音」が指示されると、ＤＳＰ１４は、必要に応じてイコライザ処理（イコライジング）を行った上で、圧縮処理に用いる閾値を検出したピーク値に応じて自動調整する（Ｓ２０２）。具体的には、ＤＳＰ１４は、Ｓ２０１で検出され、ＲＡＭ３０に記憶されたピーク値を読み出し、予め設定されている圧縮処理の閾値と大小比較し、ピーク値が閾値以下であるか否かを判定する。閾値は、予め複数のプリセットが用意されている場合、ユーザが選択したプリセットの閾値である。ピーク値が閾値以下であれば、圧縮処理しても圧縮される部分が存在しないため圧縮処理が無意味となるため、ピーク値に応じて閾値を小さく調整する。調整前の閾値をＴＨ、調整後の閾値をＴＨｎ、ピーク値をＰとすると、ＴＨ≧Ｐ＞ＴＨｎを満たすように調整する。

ピーク値に応じて閾値を自動調整した後、調整後の閾値を用いて圧縮処理を行う（Ｓ２０３）。すなわち、音声信号のうち、調整後の閾値を超えるレベルを所定の比率で圧縮し、音声信号の音圧を向上させる。また、圧縮処理を行うと同時に、圧縮処理された音声信号レベルのピーク値を検出する。検出されたピーク値は、ＲＡＭ３０に記憶される。

さらに、圧縮処理を行う際に、圧縮処理後の出力レベルを演算して推定し、推定したレベルに対し、そのピーク値が目標の基準レベル（例えば０ｄＢＦＳ）となるように圧縮及び増幅する。より具体的に説明すると、ステレオ音声信号のうち、閾値ＴＨを超えた部分については所定の比率（これをｒとする）で圧縮するが、所定の比率で圧縮した場合に得られるであろう音声信号のレベルを演算により算出し、そのレベルのピーク値を算出し、算出したピーク値を目標の基準レベルに合わせ込むための増幅率βを算出する。そして、ミックスダウンして得られたステレオ音声信号のうち、閾値以下の部分については比率βで増幅し、閾値ＴＨを超える部分については比率β・ｒで圧縮及び増幅を行う。言い換えれば、閾値以下の部分は比率βで圧縮し、閾値を超える部分については比率β・ｒで圧縮を行うといえる。

このように、圧縮処理において、同時にノーマライズを実行することで、圧縮処理を行った後に再度ノーマライズ処理を行う必要がなくなり、マスタリング処理に要する時間を短縮できる。演算により得られた音声信号は、必要に応じて再生してユーザが視聴し、圧縮処理及びノーマライズ処理された音声信号の状態を視聴して確認することができる。

以上、本発明の実施形態について、マルチトラックレコーダを例にとり説明したが、本発明はこれに限定されず、音声信号に対して圧縮処理を行って記録媒体に記録する任意の録音装置に適用することができる。

１マルチレコーダ、１０音声信号入力回路、１２音声信号出力回路、１４ＤＳＰ、１８バス、２０操作子、２２検出回路、２４表示部、２６表示回路、２８フラッシュＲＯＭ、３０ＲＡＭ、３２ＣＰＵ、３４レコーダ。

Claims

音声信号を記録する録音装置であって、
音声信号の第１ピーク値を検出するピーク値検出手段と、
検出された第１ピーク値を用いて圧縮処理の閾値を調整する閾値調整手段と、
音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮するとともに、圧縮後の音声信号の第２ピーク値を検出する圧縮手段と、
を備えることを特徴とする録音装置。
請求項１記載の録音装置において、さらに、
複数トラックの各トラックに割り当てられた音声信号からステレオ音声信号を生成するミックスダウン手段と、
を備え、前記ミックスダウン手段が、前記ピーク値検出手段として音声信号の第１ピーク値を検出する
ことを特徴とする録音装置。
請求項１，２のいずれかに記載の録音装置において、さらに、
検出された前記第２ピーク値を用いて前記圧縮手段で処理された音声信号のレベルを目標の基準レベルまで増幅するノーマライズ手段と、
を備えることを特徴とする録音装置。
請求項１，２のいずれかに記載の録音装置において、
前記圧縮手段は、音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮すると同時に、圧縮処理された音声信号のレベルを、前記第２ピーク値を用いて目標の基準レベルまで増幅する
ことを特徴とする録音装置。
請求項１，２のいずれかに記載の録音装置において、
前記ピーク値検出手段は、
音声信号の所定下限周波数以下及び所定上限周波数以上をカットする手段と、
所定下限周波数以下及び所定上限周波数以上がカットされた音声信号のエンベロープを検出する手段と、
を備え、前記エンベロープのピーク値を前記第１ピーク値として検出することを特徴とする録音装置。