JP6056356B2 - 録音装置 - Google Patents
録音装置 Download PDFInfo
- Publication number
- JP6056356B2 JP6056356B2 JP2012225516A JP2012225516A JP6056356B2 JP 6056356 B2 JP6056356 B2 JP 6056356B2 JP 2012225516 A JP2012225516 A JP 2012225516A JP 2012225516 A JP2012225516 A JP 2012225516A JP 6056356 B2 JP6056356 B2 JP 6056356B2
- Authority
- JP
- Japan
- Prior art keywords
- peak value
- audio signal
- level
- threshold
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 claims description 114
- 238000007906 compression Methods 0.000 claims description 73
- 230000006835 compression Effects 0.000 claims description 36
- 238000001514 detection method Methods 0.000 claims description 28
- 238000000034 method Methods 0.000 description 62
- 238000010606 normalization Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 2
- 230000001755 vocal effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10009—Improvement or modification of read or write signals
- G11B20/10305—Improvement or modification of read or write signals signal quality assessment
- G11B20/10314—Improvement or modification of read or write signals signal quality assessment amplitude of the recorded or reproduced signal
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
- G11B2020/10555—Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
- G11B2020/10555—Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account
- G11B2020/10574—Audio or video recording specifically adapted for audio data wherein the frequency, the amplitude, or other characteristics of the audio signal is taken into account volume or amplitude
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Stereophonic System (AREA)
Description
本発明は、複数のトラックに音声信号を記録するマルチトラックレコーダ等の録音装置に関する。
従来から、複数のトラックに音声信号を記録するマルチトラックレコーダが知られている。マルチトラックレコーダを用いることで、例えばエレキギターを使ってリズムギターパートをトラック1、リードギターパートをトラック2に記録し、内蔵マイクを使ってボーカル音声をトラック3に記録し、これらをミックスダウンしてステレオ信号を生成して記録する等が可能である。
下記の特許文献1には、マルチチャンネル音響システムにおける自動マスタリング機能について記載されている。チャンネルフェーダを均一な値に調整し、少なくとも2つのチャンネルを均一な出力レベルに制限し、それ以外の各チャンネルを、2つのチャンネルの均一な出力レベル値よりも小さいデシベルである出力レベル値に制限した上で、パラメータであるチャンネルフェーダ、スレッシュホールド、リリース、出力レベルの内の少なくとも1つの値を調整することにより、エンコードチャンネルのさらなる圧縮及び/又は制限を行うことが記載されている。
ところで、マルチトラックレコーダにおいては、通常、歪まない程度にできるだけ大きなレベルでミックスダウンを行い、その後、マスタリング処理を行うことで録音を完了させる。マスタリング処理は、音質補正(イコライザ処理)や音圧を上げる処理(圧縮処理)、指定したレベルに合わせ込む処理(ノーマライズ)を実行することであるが、ある程度の知識や経験がないと所望の結果を得るのが難しい。特に、音圧を上げる圧縮処理は、閾値(スレッシュホールド)や比率(レシオ)の調整が比較的困難であるため、例えば曲の種類毎にいくつかプリセットを用意しておき、ユーザがこれらのプリセットの中から所望のプリセットを選択できるような構成が提案されているが、適正な録音レベルでミックスダウンされていなければプリセットも効果がない問題がある。
図5A及び図5Bに、マスタリング処理における圧縮処理(コンプレッサ)を模式的に示す。図5Aは、ミックスダウンが適正なレベルで行われている場合の圧縮処理である。図において、0dBFSは、基準となる目標レベルであり、THは、圧縮処理における閾値である。圧縮処理は、閾値を超えるレベルを所定の比率で圧縮し、閾値以下のレベルをそのまま維持する処理である。従って、図5Aに示すように、ミックスダウンが適正なレベルで行われ、そのレベルが閾値THに達する場合には圧縮処理が意味を持つ。
他方、図5Bは、ミックスダウンが適正なレベルで行われていない場合、つまり、レベルが小さすぎる場合の圧縮処理である。オーバレベルによる歪みを考慮すると、ミックスダウンのレベルを小さくすることが有効であるが、レベルが小さすぎると閾値THに達しないこととなり、圧縮が全く行われないため意味がなくなってしまう。これは、複数のプリセットを用意しても同様であり、選択されたプリセットの閾値THとの比較においてミックスダウンのレベルが小さければ、圧縮処理は実質的に機能しないことになる。
本発明の目的は、ミックスダウンして得られるステレオ音声信号等の音声信号のレベルによらず、圧縮処理を効果的に実行でき、これによりマスタリング処理を簡易に実行できる録音装置を提供することにある。
本発明は、音声信号を記録する録音装置であって、音声信号の第1ピーク値を検出するピーク値検出手段と、検出された第1ピーク値を用いて圧縮処理の閾値を調整する閾値調整手段と、音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮するとともに、圧縮後の音声信号の第2ピーク値を検出する圧縮手段とを備えることを特徴とする。
本発明の1つの実施形態では、さらに、複数トラックの各トラックに割り当てられた音声信号からステレオ音声信号を生成するミックスダウン手段を備え、前記ミックスダウン手段が、前記ピーク値検出手段として音声信号の第1ピーク値を検出することを特徴とする。
本発明の他の実施形態では、さらに、検出された前記第2ピーク値を用いて前記圧縮手段で処理された音声信号のレベルを目標の基準レベルまで増幅するノーマライズ手段を備えることを特徴とする。
本発明のさらに他の実施形態では、前記圧縮手段は、音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮すると同時に、圧縮処理された音声信号のレベルを、前記第2ピーク値を用いて目標の基準レベルまで増幅することを特徴とする。
本発明のさらに他の実施形態では、前記ピーク値検出手段は、音声信号の所定下限周波数以下及び所定上限周波数以上をカットする手段と、所定下限周波数以下及び所定上限周波数以上がカットされた音声信号のエンベロープを検出する手段とを備え、前記エンベロープのピーク値を前記第1ピーク値として検出することを特徴とする。
本発明によれば、音声信号のレベルによらず、圧縮処理を効果的に実行でき、これによりマスタリング処理を簡易に実行することができる。本発明によれば、音声信号のレベルが小さい場合でも、確実に圧縮処理を実行できるので、ユーザはマスタリング処理の有効性を実感し得る。
以下、図面に基づき本発明の実施形態について、録音装置としてマルチトラックレコーダを例にとり説明する。
図1に、本実施形態におけるマルチトラックレコーダ1の構成ブロック図を示す。音声信号入力回路10は、複数の入力ポートを備え、複数の音源(ソース)からの音声信号を入力する。複数の音声信号を例示すると、ギター、ボーカル、ドラム等である。音声信号入力回路10は、内蔵マイク及び/又は入力ポートを備え、音声信号を入力する。内蔵マイクと入力ポートの双方を備える場合、内蔵マイクと入力ポートは相互に切替可能である。音声信号入力回路10から入力された音声信号は、バス16を介してDSP(デジタルシグナルプロセッサ)14に供給される。
DSP14は、CPU32の制御の下で、音声信号入力回路10から供給された複数チャンネルの音声信号に対して、所定のデジタル処理、具体的には、ミックスダウン処理やマスタリング処理等を施し、バス18を介してレコーダ34に記録する。レコーダ34の記録媒体は、CD−R/RW、DVD−R/RW等の光ディスクやハードディスク、フラッシュメモリ媒体等である。DSP14の処理には、操作子20の操作に応じて各音声信号のパン(PAN)や音量レベルを調整する処理も含まれる。
操作子20は、マルチトラックレコーダ1の操作面に設けられる。操作子20は、各種のキースイッチや選択ボタン、メニューボタン、決定ボタン、パン(PAN)つまみ、レベルつまみ等から構成される。ユーザは、操作子20を操作することで、各音声信号を、複数トラックの少なくとも1つのトラックに割り当てる。操作子20の操作状態は検出回路22で検出される。検出回路22は、バス18を介して操作子20の操作状態検出信号をCPU32に供給する。
CPU32は、マルチトラックレコーダの全体を統括制御する。CPU32は、フラッシュROM28に記憶されたプログラムに従い、ワーキングメモリとしてのRAM30を用いて各種処理を実行する。具体的には、検出回路22からの操作状態検出信号に基づいて、複数チャンネルの各音声信号を複数トラックの少なくとのいずれかのトラックに割り当てる。例えば、トラックがトラック1〜トラック8まで存在する場合に、チャンネルAをトラック1に割り当て、チャンネルBをトラック2に割り当て、チャンネルCをトラック8に割り当てる等である。また、CPU32は、各種の情報を表示回路26に供給する。表示回路26は、各種情報を表示部24に表示する。
CPU32は、ユーザによる操作子20の操作に応じて各種メニュー画面や設定画面を表示すべく表示回路26に指令し、表示回路26は、CPU32からの情報に応じてメニュー画面や設定画面を表示部24に表示する。
また、CPU32は、各トラック毎に割り当てられた音声信号のレベルを、例えば棒グラフ形式(レベルメータ)で表示すべく表示回路26に指令し、表示回路26は、CPU32からの情報に応じてレベルメータ画像を表示部24に表示する。
さらに、CPU32は、検出回路22からの操作状態検出信号に応じ、レコーダ34に記録された音声信号を読み出してDSP14に供給し、DSP14はバス及び音声信号出力回路12を介して音声信号を外部に出力する。音声出力回路12は、アナログ出力ポートやデジタル出力ポート等の各種出力ポートを有する。
本実施形態におけるDSP14は、上記のように、ミックスダウン処理及びマスタリング処理を行うので、ミックスダウン処理部及びマスタリング処理部として機能する。これらの各処理は、予めプログラムメモリに記憶されたプログラムを順次読み出し、DSP14がプログラムを逐次実行することで実現される。もちろん、DSP14の代わりに、ミックスダウン処理を行うハードウェア、マスタリング処理を行うハードウェアを設けることもできる。要するに、ミックスダウン処理、マスタリング処理は、ハードウェアあるいはソフトウェアのいずれで実行してもよい。
ミックスダウン処理は、音声信号入力回路10から供給された複数チャンネルの音声信号をLチャンネル及びRチャンネルの音声信号に合成する処理である。ミックスダウン処理は、各トラックのレベルつまみを用いてレベルとバランスを調節し、かつ、全体のレベルを調節しながら行われる。また、トラックのPANつまみを用いてLチャンネル及びRチャンネルのステレオの定位を設定する。Lチャンネル及びRチャンネルのレベル(ステレオメータ)は表示部24に表示され、ユーザは表示されるレベルを視認しつつ調節する。
図2に、ミックスダウン処理の機能ブロック図を示す。トラック1〜トラック8の8個のトラックにそれぞれ音声信号が割り当てられている。各トラックは、できるだけフルスケール(0dBFS)に近いレベルで録音される。各トラックの音声信号のレベルは、チャンネル毎に設けられたチャンネルフェーダ20aで調整され、さらにPANつまみ20bでL,R左右のレベルを調整しつつ定位される。マスタフェーダ20cは、0dBに設定され、全体のレベルが調整されてマスタトラック(ステレオトラック)にミックスダウンされる。ユーザは、ステレオメータを視認しつつ、レベルがオーバしない程度にできるだけフルスケールに近いレベルでミックスダウンを行う。
また、マスタリング処理は、イコライザ処理(イコライジング)、圧縮処理、ノーマライズ処理を含む処理であり、ユーザがマスタリングすべき音声信号の開始点と終了点を設定し、「マスタ録音」のボタンを操作あるいはメニューを選択することで開始される。マスタリングにおける圧縮処理の閾値及び比率は予め複数セット(複数のプリセット)が用意されており、ユーザが所望のプリセットを選択できるように構成される。しかしながら、ミックスダウン処理した結果の音声信号のレベルが適当でなく、小さすぎる場合には、音声信号のレベルが圧縮処理における閾値以下となり、圧縮処理の効果がなくなってしまう。
そこで、本実施形態では、マスタリング処理において、音声信号のレベルのピーク値を検出し、このピーク値に応じて適応的に圧縮処理の閾値を自動的に調整して圧縮処理を行うようにしている。音声信号のレベルが小さいため、そのピーク値もこれに応じて小さくなるが、ピーク値を検出し、ピーク値が小さければこれに応じて圧縮処理に用いる閾値を自動的に小さく調整することで、音声信号のうち閾値を超える部分が生じることとなり、圧縮処理の実効性を担保できる。
図3に、マスタリング処理のフローチャートを示す。DSP14で実行される処理である。まず、ユーザからの指示に応じ、音声信号入力回路10から供給された複数チャンネルの音声信号をLチャンネル及びRチャンネルの音声信号に合成するミックスダウン処理を行う(S101)。また、ミックスダウン処理を実行すると同時に、音声信号レベルのピーク値(第1ピーク値)を検出する。ピーク値は、公知の方法で検出することができるが、不必要な周波数におけるピーク値を除外する、あるいは突発的なピーク値を除外して検出することが望ましい。この点についてはさらに後述する。ミックスダウン処理され、かつ、ピーク値が検出されたLチャンネル及びRチャンネルのステレオ音声信号は、RAM30あるいはレコーダ34に記憶される。ピーク値は、RAM30に記憶される。
次に、ユーザから「マスタ録音」が指示されると、DSP14は、必要に応じてイコライザ処理(イコライジング)を行った上で、圧縮処理に用いる閾値(ユーザが選択したプリセットの閾値)を、検出したピーク値(第1ピーク値)に応じて自動調整する(S102)。この処理は、ステレオ音声信号のピーク値が小さすぎる場合に、これに応じて圧縮処理の閾値も小さく調整する処理である。具体的には、DSP14は、S101で検出され、RAM30に記憶されたピーク値を読み出し、圧縮処理の閾値と大小比較し、ピーク値が閾値以下であるか否かを判定する。閾値は、上記のように、予め複数のプリセットが用意されている場合、ユーザが選択したプリセットの閾値である。ピーク値が閾値以下であれば、圧縮処理しても圧縮される部分が存在しないため圧縮処理が無意味となるので、ピーク値に応じて閾値を小さく調整する。調整前の閾値をTH、調整後の閾値をTHn、ピーク値をPとすると、
TH≧P>THn
を満たすように調整する。一例として、ピーク値Pに対して所定量Δ(設計や仕様によって決定される任意の値)だけ減じたレベルをTHnとする等である。なお、ピーク値が閾値以上であれば、閾値を調整する必要はないが、ピーク値と閾値との差分が所定の値(設計や仕様によって決定される任意の値)より小さく、ピーク値と閾値がほとんど変わらないのであれば、たとえピーク値が閾値以上であっても閾値を調整してもよい。
TH≧P>THn
を満たすように調整する。一例として、ピーク値Pに対して所定量Δ(設計や仕様によって決定される任意の値)だけ減じたレベルをTHnとする等である。なお、ピーク値が閾値以上であれば、閾値を調整する必要はないが、ピーク値と閾値との差分が所定の値(設計や仕様によって決定される任意の値)より小さく、ピーク値と閾値がほとんど変わらないのであれば、たとえピーク値が閾値以上であっても閾値を調整してもよい。
ピーク値に応じて閾値を自動調整した後、調整後の閾値を用いて圧縮処理を行う(S103)。すなわち、音声信号のうち、調整後の閾値を超えるレベルを所定の比率で圧縮し、音声信号の音圧を向上させる。比率は、例えば10:1等である。圧縮処理では、閾値を超えたレベルは圧縮されて相対的に小さくなるものの、元の音声信号の波形は残っている。
また、圧縮処理を行うと同時に、ミックスダウン処理と同様に、圧縮処理された音声信号レベルのピーク値(第2ピーク値)を検出する。検出されたピーク値は、RAM30に記憶される。
次に、圧縮処理を行った音声信号に対し、ノーマライズを行う(S104)。圧縮処理された音声信号のピーク値(第2ピーク値)を、目標の基準レベル(例えば0dBFS)となるように増幅する。通常、ノーマライズでは、まず音声信号のピーク値を検出する処理が行われるが、本実施形態では、ノーマライズに先立つ圧縮処理において同時にピーク検出が行われ、このピーク値をノーマライズで用いるため、ノーマライズにおいて別途ピーク値検出を行う必要がなく、ノーマライズを高速化できる。
以上のようにして処理された音声信号は、マスタデータとしてレコーダ34に記録される。マスタデータは、ユーザからの再生指示に応じて読み出され、音声信号出力回路12から出力される。なお、マスタデータをWAV形式等に変換し、外部のパーソナルコンピュータに出力してもよい。
本実施形態では、ミックスダウン処理時にピーク値(第1ピーク値)を検出し、このピーク値に応じて閾値を自動調整して圧縮処理するので、たとえミックスダウン処理された音声信号のレベルが小さすぎる場合であっても、圧縮処理を効果的に実行し、音声信号の音圧を向上させることができる。しかも、圧縮処理時においてもピーク値(第2ピーク値)を検出し、このピーク値を用いてノーマライズを行うため、全体の処理を効率化・高速化できる。
ミックスダウン処理時に検出されるピーク値(第1ピーク値)と、圧縮処理時に検出されるピーク値(第2ピーク値)は、必ずしも同一ではなく、この意味で、本実施形態ではそれぞれのピーク値を第1ピーク値と第2ピーク値と称して区別している。もちろん、結果的に第1ピーク値と第2ピーク値が同一となることを排除するものではない。
図4Aに、調整前の閾値とミックスダウンして得られた音声信号との関係を示す。音声信号のレベルが小さく、閾値THに達していないため、このままでは圧縮処理しても圧縮されず、ユーザはマスタリング処理の効果を実感できない。
他方、図4Bに、調整後の閾値とミックスダウンして得られた音声信号との関係を示す。閾値がTHからTHnに下方調整され、音声信号のレベルが閾値THnに達していることが分かる。この場合、音声信号のうち、閾値THnを超える部分については所定の比率で圧縮されるため、ユーザはマスタリング処理の効果、すなわち音圧向上を実感し得る。
次に、本実施形態における、ミックスダウン処理時におけるピーク値検出処理と、圧縮処理時におけるピーク値検出処理について説明する。本実施形態において、両ピーク値検出処理は互いに異なる処理である。
図6に、ミックスダウンにより得られたステレオ音声信号のレベルと検出ピークの関係を示す。単に、音声信号レベルのピーク値P0を検出すると、図に示すように突発的なピークをピーク値P0として検出してしまう場合があり得る。また、本来不必要な周波数帯、例えば20Hz以下や12kHz以上の周波数におけるピークをピーク値P0として検出してしまう場合があり得る(本来不必要な周波数帯は、適用する装置の仕様や特性により異なるが、本実施形態では20Hz以下や12kHz以上として説明する)。このようなピーク値に基づいて閾値を自動調整したのでは、効果的な圧縮処理ができない。そこで、突発的なピークでなく、かつ、不必要な周波数帯におけるピークでないピークをピーク値P1として検出することが望ましい。
このため、図7に示すように、ミックスダウンして得られた音声信号のエンベロープを検出し、このエンベロープにおけるピークをピーク値P1として検出することで、真のピーク値P1を確実に検出することができる。なお、音声信号のエンベロープは、音声信号をローパスフィルタに通過させることで取得でき、ローパスフィルタに通過させる前に、20Hz以下の周波数、及び12kHz以上の周波数をそれぞれカットするフィルタで不必要な周波数帯をカットすればよい。
図8Aに、ミックスダウン時におけるピーク値検出の機能ブロック図を示す。圧縮処理をシングルバンド(周波数帯毎に分けない場合)で行う場合の処理である。
ステレオバス18からのステレオ音声信号は、ステレオトラックとしてレコーダ34に記録されるとともに、ステレオ音声信号は、低域カットフィルタ(LCF)で20Hz以下の低域成分がカットされ、さらに高域カットフィルタ(HCF)で12kHz以上の高域成分がカットされる。低域及び高域がカットされたステレオ音声信号は、絶対値検出器(ABS)で絶対値が検出され、ローパスフィルタ(LPF)でエンベロープが検出され、最大値検出器(MAX)でその最大値が検出されてピーク値が検出される。これらのLCF、HCF、ABS、LPF、MAXは、DSP14で構成されるが、DSP14とは別個の部材で構成してもよい。検出されたピーク値は、圧縮処理の閾値調整のために用いられる。具体的には、ユーザにより選択されたプリセットの閾値と大小比較され、大小比較の結果に応じて閾値が自動調整される。
図8Bに、ミックスダウン時におけるピーク値検出の機能ブロック図を示す。圧縮処理をマルチバンド(複数の周波数帯に分ける場合)で行う場合の処理である。
ステレオバス18からのステレオ音声信号は、ステレオトラックとしてレコーダ34に記録されるとともに、ステレオ音声信号は、低域カットフィルタ(LCF)で20Hz以下の低域成分がカットされ、さらに高域カットフィルタ(HCF)で12kHz以上の高域成分がカットされる。低域及び高域がカットされたステレオ音声信号は、クロスオーバフィルタで3つの周波数帯に分割される。分割される3つの周波数帯を、相対的に低域周波数帯、中域周波数帯、高域周波数帯と称する。それぞれの周波数帯において、絶対値検出器(ABS)で絶対値が検出され、ローパスフィルタ(LPF)でエンベロープが検出され、最大値検出器(MAX)でその最大値が検出されてピーク値が検出される。低域周波数帯におけるピーク値をピーク値L、中域周波数帯におけるピーク値をピーク値M、高域周波数帯におけるピーク値をピーク値Hとすると、これらのピーク値はいずれもRAM30に記憶され、圧縮処理の閾値調整のために用いられる。具体的には、ユーザにより選択されたプリセットの低域閾値、中域閾値、高域閾値とそれぞれ大小比較され、大小比較の結果に応じてこれら3つの閾値が自動調整される。
このように、ミックスダウン処理して得られたステレオ音声信号の不要な周波数帯をカットし、そのエンベロープを検出してピーク値を検出して圧縮処理の閾値を自動調整することで、突発的なピークに影響されず、かつ、不要な周波数帯におけるピークに影響されずに適当な閾値に調整することができる。
図9Aに、圧縮処理時におけるピーク値検出の機能ブロック図を示す。圧縮処理をシングルバンドで行う場合の処理である。
レコーダ34のステレオトラックから読み出されたステレオ音声信号に対し、イコライザ(EQ)でイコライジング処理した後、ミックスダウン処理時に検出されたピーク値に応じて調整された閾値を用いて圧縮処理を行う。圧縮処理されたステレオ音声信号は、レコーダ34のステレオトラックに記録される。また、圧縮処理されたステレオ音声信号のピーク値が検出される。検出されたピーク値は、RAM30に記憶され、ノーマライズ処理に用いられる。圧縮処理時に検出されるピーク値は、ノーマライズ処理に用いられるため、ミックスダウン時におけるピーク値検出のようにエンベロープから検出する必要はない。
図9Bに、圧縮処理時におけるピーク値検出の機能ブロック図を示す。圧縮処理をマルチバンド(例えば3バンド)で行う場合の処理である。
レコーダ34のステレオトラックから読み出されたステレオ音声信号に対し、イコライザ(EQ)でイコライジング処理した後、クロスオーバフィルタで相対的に低域周波数帯、中域周波数帯、高域周波数帯の3つの周波数帯に分割し、それぞれの周波数帯において、ミックスダウン処理時に検出されたそれぞれの周波数帯におけるピーク値L,M,Hに応じて調整された閾値を用いて圧縮処理を行う。
ここで、それぞれの周波数帯における閾値は、それぞれの周波数帯におけるピーク値に応じて個別に調整されるため、全ての周波数帯において閾値が調整される他、ある周波数帯においては閾値が調整されるものの、他の周波数帯においては閾値が調整されない場合もあり得る。例えば、低域周波数帯におけるプリセットされた閾値をTHLとし、高域周波数帯におけるプリセットされた閾値をTHHとすると、THL≧ピーク値Lであれば閾値THLは下方調整されるが、ピーク値H≧THHであれば、閾値THHはそのまま維持されて圧縮処理に用いられる。
3つの周波数帯毎に圧縮処理されたステレオ音声信号は、合成されてレコーダ34のステレオトラックに記録される。また、圧縮処理され合成されたステレオ音声信号のピーク値が検出される。検出されたピーク値は、RAM30に記憶され、ノーマライズ処理に用いられる。ピーク値の検出は、シングルバンドの場合と同様である。
本実施形態では、図3に示すように、S103で圧縮処理及びピーク値検出を行い、S104でノーマライズ処理を行っており、ノーマライズ処理をオフライン、すなわちノーマライズ処理のみを実行してレコーダ34に記録し、その後にノーマライズ処理された音声信号の再生を可能としているが、これをオンライン処理、すなわちユーザが視聴しながら処理を行うことも可能であり、この場合、圧縮処理及びピーク値検出処理を行うと同時にノーマライズ処理を演算により実行し、演算により得られた音声信号を再生してユーザが視聴できるようにする。
図10に、他の実施形態の処理フローチャートを示す。DSP14で実行される処理である。まず、ユーザからの指示に応じ、音声信号入力回路10から供給された複数チャンネルの音声信号をLチャンネル及びRチャンネルの音声信号に合成するミックスダウン処理を行う(S201)。また、ミックスダウン処理を実行すると同時に、音声信号レベルのピーク値を検出する。ミックスダウン処理され、かつ、ピーク値が検出されたLチャンネル及びRチャンネルのステレオ音声信号は、RAM30あるいはレコーダ34に記憶される。ピーク値は、RAM30に記憶される。
次に、ユーザから「マスタ録音」が指示されると、DSP14は、必要に応じてイコライザ処理(イコライジング)を行った上で、圧縮処理に用いる閾値を検出したピーク値に応じて自動調整する(S202)。具体的には、DSP14は、S201で検出され、RAM30に記憶されたピーク値を読み出し、予め設定されている圧縮処理の閾値と大小比較し、ピーク値が閾値以下であるか否かを判定する。閾値は、予め複数のプリセットが用意されている場合、ユーザが選択したプリセットの閾値である。ピーク値が閾値以下であれば、圧縮処理しても圧縮される部分が存在しないため圧縮処理が無意味となるため、ピーク値に応じて閾値を小さく調整する。調整前の閾値をTH、調整後の閾値をTHn、ピーク値をPとすると、TH≧P>THnを満たすように調整する。
ピーク値に応じて閾値を自動調整した後、調整後の閾値を用いて圧縮処理を行う(S203)。すなわち、音声信号のうち、調整後の閾値を超えるレベルを所定の比率で圧縮し、音声信号の音圧を向上させる。また、圧縮処理を行うと同時に、圧縮処理された音声信号レベルのピーク値を検出する。検出されたピーク値は、RAM30に記憶される。
さらに、圧縮処理を行う際に、圧縮処理後の出力レベルを演算して推定し、推定したレベルに対し、そのピーク値が目標の基準レベル(例えば0dBFS)となるように圧縮及び増幅する。より具体的に説明すると、ステレオ音声信号のうち、閾値THを超えた部分については所定の比率(これをrとする)で圧縮するが、所定の比率で圧縮した場合に得られるであろう音声信号のレベルを演算により算出し、そのレベルのピーク値を算出し、算出したピーク値を目標の基準レベルに合わせ込むための増幅率βを算出する。そして、ミックスダウンして得られたステレオ音声信号のうち、閾値以下の部分については比率βで増幅し、閾値THを超える部分については比率β・rで圧縮及び増幅を行う。言い換えれば、閾値以下の部分は比率βで圧縮し、閾値を超える部分については比率β・rで圧縮を行うといえる。
このように、圧縮処理において、同時にノーマライズを実行することで、圧縮処理を行った後に再度ノーマライズ処理を行う必要がなくなり、マスタリング処理に要する時間を短縮できる。演算により得られた音声信号は、必要に応じて再生してユーザが視聴し、圧縮処理及びノーマライズ処理された音声信号の状態を視聴して確認することができる。
以上、本発明の実施形態について、マルチトラックレコーダを例にとり説明したが、本発明はこれに限定されず、音声信号に対して圧縮処理を行って記録媒体に記録する任意の録音装置に適用することができる。
1 マルチレコーダ、10 音声信号入力回路、12 音声信号出力回路、14 DSP、18 バス、20 操作子、22 検出回路、24 表示部、26 表示回路、28 フラッシュROM、30 RAM、32 CPU、34 レコーダ。
Claims (5)
- 音声信号を記録する録音装置であって、
音声信号の第1ピーク値を検出するピーク値検出手段と、
検出された第1ピーク値を用いて圧縮処理の閾値を調整する閾値調整手段と、
音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮するとともに、圧縮後の音声信号の第2ピーク値を検出する圧縮手段と、
を備えることを特徴とする録音装置。 - 請求項1記載の録音装置において、さらに、
複数トラックの各トラックに割り当てられた音声信号からステレオ音声信号を生成するミックスダウン手段と、
を備え、前記ミックスダウン手段が、前記ピーク値検出手段として音声信号の第1ピーク値を検出する
ことを特徴とする録音装置。 - 請求項1,2のいずれかに記載の録音装置において、さらに、
検出された前記第2ピーク値を用いて前記圧縮手段で処理された音声信号のレベルを目標の基準レベルまで増幅するノーマライズ手段と、
を備えることを特徴とする録音装置。 - 請求項1,2のいずれかに記載の録音装置において、
前記圧縮手段は、音声信号のレベルのうち、調整された閾値を超えるレベルを圧縮すると同時に、圧縮処理された音声信号のレベルを、前記第2ピーク値を用いて目標の基準レベルまで増幅する
ことを特徴とする録音装置。 - 請求項1,2のいずれかに記載の録音装置において、
前記ピーク値検出手段は、
音声信号の所定下限周波数以下及び所定上限周波数以上をカットする手段と、
所定下限周波数以下及び所定上限周波数以上がカットされた音声信号のエンベロープを検出する手段と、
を備え、前記エンベロープのピーク値を前記第1ピーク値として検出することを特徴とする録音装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012225516A JP6056356B2 (ja) | 2012-10-10 | 2012-10-10 | 録音装置 |
US13/748,414 US9240208B2 (en) | 2012-10-10 | 2013-01-23 | Recording apparatus with mastering function |
CN201310467149.6A CN103731794B (zh) | 2012-10-10 | 2013-10-09 | 录音装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012225516A JP6056356B2 (ja) | 2012-10-10 | 2012-10-10 | 録音装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014078298A JP2014078298A (ja) | 2014-05-01 |
JP6056356B2 true JP6056356B2 (ja) | 2017-01-11 |
Family
ID=50432567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012225516A Active JP6056356B2 (ja) | 2012-10-10 | 2012-10-10 | 録音装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9240208B2 (ja) |
JP (1) | JP6056356B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6506623B2 (ja) | 2015-05-29 | 2019-04-24 | 株式会社ズーム | デジタルシグナルプロセッサ及び音響機器 |
US12069464B2 (en) * | 2019-07-09 | 2024-08-20 | Dolby Laboratories Licensing Corporation | Presentation independent mastering of audio content |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4080528A (en) * | 1976-04-23 | 1978-03-21 | Recognition Equipment Incorporated | Data interlacing system |
JPS5868325A (ja) * | 1981-10-19 | 1983-04-23 | Victor Co Of Japan Ltd | 雑音低減装置 |
US5579404A (en) * | 1993-02-16 | 1996-11-26 | Dolby Laboratories Licensing Corporation | Digital audio limiter |
US5956196A (en) * | 1993-04-09 | 1999-09-21 | Western Digital Corporation | Disk drive employing dynamically reconfigured read channel to process a read signal at two different frequencies |
US5530601A (en) * | 1993-09-30 | 1996-06-25 | International Business Machines Corporation | Tracking threshold circuit for peak detection |
US6868163B1 (en) * | 1998-09-22 | 2005-03-15 | Becs Technology, Inc. | Hearing aids based on models of cochlear compression |
JP4895418B2 (ja) * | 1999-08-24 | 2012-03-14 | ソニー株式会社 | 音声再生方法および音声再生装置 |
US7551745B2 (en) * | 2003-04-24 | 2009-06-23 | Dolby Laboratories Licensing Corporation | Volume and compression control in movie theaters |
US7813931B2 (en) * | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
US8352052B1 (en) * | 2006-10-23 | 2013-01-08 | Adobe Systems Incorporated | Adjusting audio volume |
CN105811910B (zh) | 2007-03-20 | 2018-08-28 | 联想创新有限公司(香港) | 电子设备用声音处理系统、方法以及便携电话终端 |
JP2009031357A (ja) * | 2007-07-24 | 2009-02-12 | Yamaha Corp | 楽曲配信システム、楽曲編集装置、楽曲再生装置、楽曲記憶装置およびプログラム |
US20090074209A1 (en) | 2007-08-16 | 2009-03-19 | Jeffrey Thompson | Audio Processing for Compressed Digital Television |
JP4327241B2 (ja) * | 2007-10-01 | 2009-09-09 | パナソニック株式会社 | 音声強調装置および音声強調方法 |
US8660845B1 (en) * | 2007-10-16 | 2014-02-25 | Adobe Systems Incorporated | Automatic separation of audio data |
DE102008036924B4 (de) | 2008-08-08 | 2011-04-21 | Gunnar Kron | Verfahren zur Mehrkanalbearbeitung in einem Mehrkanaltonsystem |
UA101542C2 (ru) | 2008-12-15 | 2013-04-10 | Долби Лабораторис Лайсензин Корпорейшн | Виртуализатор окружающего звука с динамическим сжатием диапазона и способ |
JP2010244602A (ja) * | 2009-04-03 | 2010-10-28 | Sony Corp | 信号処理装置及び方法、並びにプログラム |
US8401683B2 (en) * | 2009-08-31 | 2013-03-19 | Apple Inc. | Audio onset detection |
JP2011217067A (ja) * | 2010-03-31 | 2011-10-27 | Yamaha Corp | 音信号出力制御装置 |
JP2011217066A (ja) * | 2010-03-31 | 2011-10-27 | Yamaha Corp | 音信号出力制御装置 |
US8670577B2 (en) * | 2010-10-18 | 2014-03-11 | Convey Technology, Inc. | Electronically-simulated live music |
JP5585401B2 (ja) * | 2010-11-09 | 2014-09-10 | ソニー株式会社 | 再生装置、再生方法、提供装置および再生システム |
TWI517028B (zh) * | 2010-12-22 | 2016-01-11 | 傑奧笛爾公司 | 音訊空間定位和環境模擬 |
JP5707963B2 (ja) | 2011-01-20 | 2015-04-30 | ヤマハ株式会社 | オーディオアンプ |
CN102610229B (zh) | 2011-01-21 | 2013-11-13 | 安凯(广州)微电子技术有限公司 | 一种音频动态范围压缩方法、装置及设备 |
US8965774B2 (en) * | 2011-08-23 | 2015-02-24 | Apple Inc. | Automatic detection of audio compression parameters |
-
2012
- 2012-10-10 JP JP2012225516A patent/JP6056356B2/ja active Active
-
2013
- 2013-01-23 US US13/748,414 patent/US9240208B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN103731794A (zh) | 2014-04-16 |
US9240208B2 (en) | 2016-01-19 |
US20140098651A1 (en) | 2014-04-10 |
JP2014078298A (ja) | 2014-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI525987B (zh) | 在單一播放模式中組合響度量測的系統 | |
US6341166B1 (en) | Automatic correction of power spectral balance in audio source material | |
TWI529703B (zh) | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 | |
US20120288121A1 (en) | Acoustic control device | |
US8355908B2 (en) | Audio signal processing device for noise reduction and audio enhancement, and method for the same | |
JP6323089B2 (ja) | レベル調整方法およびレベル調整装置 | |
US20100040242A1 (en) | In-vehicle sound control system | |
US20120294461A1 (en) | Sound equipment, volume correcting apparatus, and volume correcting method | |
JP4792086B2 (ja) | 2つの入力チャンネルを使用して3つの出力チャンネルを合成させる装置および方法 | |
US9496839B2 (en) | Audio processing apparatus, reproduction apparatus, audio processing method and program | |
JP6079119B2 (ja) | 録音装置 | |
US9219455B2 (en) | Peak detection when adapting a signal gain based on signal loudness | |
JP6056356B2 (ja) | 録音装置 | |
US9047876B2 (en) | Audio device | |
US10225654B1 (en) | Speaker distortion reduction | |
JP2009086481A (ja) | 音響装置、残響音付加方法、残響音付加プログラム及びその記録媒体 | |
WO2010092674A1 (ja) | オーディオ信号混合装置 | |
JP5598722B2 (ja) | 音声再生装置、音声再生装置における再生音調整方法 | |
CN103731794B (zh) | 录音装置 | |
JP3828687B2 (ja) | 音響機器におけるイコライザ設定装置 | |
KR102531634B1 (ko) | 오디오 장치 및 그 제어방법 | |
JP6807769B2 (ja) | 音響装置及び音質調整方法 | |
KR20100067251A (ko) | 자동 볼륨 조절 장치 및 제어 방법 | |
JP6603725B2 (ja) | 音声信号生成装置、音声信号生成方法、及び、プログラム | |
JP2007199337A (ja) | デジタル録音装置,デジタル録音方法,そのプログラムおよび記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161108 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161121 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6056356 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |