JP2010206298A - 録音装置、録音方法、音声信号補正回路及びプログラム - Google Patents

録音装置、録音方法、音声信号補正回路及びプログラム Download PDF

Info

Publication number
JP2010206298A
JP2010206298A JP2009047031A JP2009047031A JP2010206298A JP 2010206298 A JP2010206298 A JP 2010206298A JP 2009047031 A JP2009047031 A JP 2009047031A JP 2009047031 A JP2009047031 A JP 2009047031A JP 2010206298 A JP2010206298 A JP 2010206298A
Authority
JP
Japan
Prior art keywords
audio signal
level
value
reference value
correction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009047031A
Other languages
English (en)
Other versions
JP4811475B2 (ja
Inventor
Kaoru Gyotoku
薫 行徳
Takaaki Hashimoto
高明 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2009047031A priority Critical patent/JP4811475B2/ja
Priority to US12/658,928 priority patent/US8462964B2/en
Priority to CN2010101216842A priority patent/CN102045619B/zh
Publication of JP2010206298A publication Critical patent/JP2010206298A/ja
Application granted granted Critical
Publication of JP4811475B2 publication Critical patent/JP4811475B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/002Volume compression or expansion in amplifiers in untuned or low-frequency amplifiers, e.g. audio amplifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

【課題】環境に適した周波数特性、かつ、信号レベルで音声信号を補正すること。
【解決手段】録音装置1は、音声信号補正部16と、音声信号処理部12を備える。音声信号補正部16は、マイクロホンから供給される音声信号に対して、録音モードに基づいて、音声信号の周波数特性を平坦化する補正及び/又は音声信号のレベルを補正する。補正制御部13は、録音モード毎に、音声信号のレベルが目標レベルの下限値及び上限値の範囲内に収まるように、音声信号補正部16に対して音声信号のレベルを調整させる。そして、所定の期間内で最大となる音声信号のレベルの絶対値を基準値として時間経過に応じて減衰させ、音声信号のレベルが基準値を上回る音声信号が入力された場合に、基準値を上回る音声信号のレベルの絶対値を新たな基準値とする。
【選択図】図3

Description

本発明は、例えば、会議室やホール等の環境に応じて音声を補正する場合に適用して好適な録音装置、録音方法、音声信号補正回路及びプログラムに関する。
従来、会議や講義の内容を録音する小型の録音装置が用いられていた。このような録音装置は、例えば、小型化されたマイクロホン、DSP(Digital Signal Processor)等を備える。そして、自動利得制御(AGC:Automatic Gain Control)により、録音モードに応じて音声信号に所定の処理を施していた。そして、AGCを変えるためのAGC係数は固定の定数で設定されるため、ユーザは手動でマイクロホンの周波数特性を補正していた。
特許文献1には、屋外又は屋内の撮影条件に適した音声特性となるように、信号レベルを連動させる技術が開示されている。
特開平5−161101号公報
ところで、従来、録音装置に内蔵される単一指向性のマイクロホンは、小口径であり、一般的に、このようなマイクロホンの周波数特性は低域のレスポンスが低い。会議等では音声帯域より低い帯域のレスポンスが低い方が、プロジェクター等のファンノイズなどの不要な成分のレベルが抑えられ、相対的に音声が聞きやすくなる場合がある。
しかし、楽器等を録音する場合は広帯域に渡って平坦な周波数特性が求められるため、録音した音声の低域が不足することがあった。そのため、適切な特性で録音できる場面が限定されることがあった。
また、会議等では、小さな音量の音声を聞きやすい適切な音量までAGCで増幅し、一定の音量に圧縮する。一方、音楽では音量の抑揚が求められるが、従来の録音装置を用いると、無音に近い小さな音であっても自動的に増幅されるため、全体が平坦な音量で録音されやすい。
本発明はこのような状況に鑑みて成されたものであり、環境に適した周波数特性、かつ、信号レベルで音声信号を補正することを目的とする。
本発明は、マイクロホンから供給される音声信号に対して、音声信号の周波数特性及びレベルの補正量が定められる録音モードに基づいて、音声信号の周波数特性を平坦化する補正及び/又は音声信号のレベルを補正する。
また、録音モード毎に予め定められた目標レベルの下限値及び上限値に基づいて、音声信号のレベルが目標レベルの下限値を下回る場合には、音声信号のレベルが目標レベルの下限値を上回るように、音声信号のレベルを調整する。
一方、音声信号のレベルが目標レベルの上限値を上回る場合には、音声信号のレベルが目標レベルの上限値を下回るように、音声信号のレベルを調整する。
次に、所定の期間内で最大となる音声信号のレベルの絶対値を基準値とし、基準値を時間経過に応じて減衰させる。
そして、音声信号のレベルが基準値を上回る音声信号が入力された場合に、基準値を上回る音声信号のレベルの絶対値を新たな基準値とするものである。
このようにしたことで、ユーザが設定した録音モードに応じて適切に音声信号のレベルを調整し、音声信号の周波数特性を補正することが可能となった。
本発明によれば、ユーザは録音する場面に応じて録音モードを設定することができ、この録音モードに基づいて、音声信号の周波数特性とレベルが補正される。このため、環境に適した周波数特性、かつ最適なレベルの音声信号を得ることができ、ユーザが意図する音質の音声を得やすくなるという効果がある。
本発明の一実施の形態における録音装置の内部構成例を示すブロック図である。 本発明の一実施の形態における主制御部の内部構成例を示すブロック図である。 本発明の一実施の形態における音声信号補正部の内部構成例を示すブロック図である。 本発明の一実施の形態における周波数特性補正の例を示す説明図である。 本発明の一実施の形態における補正前後の音声信号の周波数特性の例を示す説明図である。 本発明の一実施の形態における録音モードの例を示す説明図である。 本発明の一実施の形態における、音声信号の信号レベルを目標レベル下限値に合わせる例を示す説明図である。 本発明の一実施の形態における、音声信号の信号レベルを目標レベル上限値及び下限値の範囲内に合わせる例を示す説明図である。 本発明の一実施の形態における、信号レベルの最大値から一定の減衰量で基準値を変える例を示す説明図である。 本発明の一実施の形態における、信号レベルの最大値に応じて減衰量を変えて基準値を変える例を示す説明図である。 本発明の他の実施の形態における、左右チャンネル毎に信号レベルを比較して左右チャンネルの信号レベルを変える例を示す説明図である。
以下、発明を実施するための最良の形態(以下実施の形態とする。)について説明する。なお、説明は以下の順序で行う。
1.一実施の形態(音声信号の周波数特性及び信号レベルの補正:音声信号の周波数特性をフラット化し、目標レベルの範囲内に信号レベルを収める例)
2.変形例
<1.一実施の形態>
[録音装置の内部構成例]
以下、本発明の一実施の形態について、図1〜図10を参照して説明する。本実施の形態では、所定の録音モードに応じて録音する音声信号のレベルを補正する録音装置1に適用した例について説明する。
図1は、本例の録音装置1の内部構成例を示す。
録音装置1は、左右2チャンネルのアナログ音声信号を生成するマイクロホン2R,2Lと、アナログ音声信号を所定のデジタルフォーマットに変換するコーデック部3を備える。コーデック部3が対応するフォーマットは、例えば、リニアPCM(Pulse Code Modulation)が用いられる。
また、録音装置1は、コーデック部3から供給されるデジタル音声信号に対して、所定の録音モードに応じて信号レベルと周波数特性を補正する主制御部4と、信号レベルや周波数特性が補正されたデジタル音声信号を記録媒体11に記録する記録部5を備える。主制御部4には、例えば、システムLSIが用いられ、記録媒体11には、例えば、フラッシュメモリが用いられる。以下、マイクロホン2R,2Lから供給される音声信号に対して、音声信号の周波数特性及びレベルの補正量を定めるパラメータを、「録音モード」という。本例の録音モードは、後述するように5種類ある。
また、録音装置1は、ユーザが任意に録音モードを設定可能な操作部7と、設定された録音モードを表示したり、録音中であることを表示したりする表示部8を備える。操作部7には、例えば、キーボタンが用いられ、表示部8には、例えば、液晶ディスプレイパネルが用いられる。
また、録音装置1は、コーデック部3、主制御部4及び記録部5に電力を供給する電源6を備える。また、録音装置1は、音声を放音するスピーカ9及びイヤホン10を備える。コーデック部3は、デジタル音声信号をアナログ音声信号に変換し、不図示のアンプを介してスピーカ9とイヤホン10に音声信号を供給する。これにより、スピーカ9とイヤホン10は音声を放音することが可能となる。ただし、録音装置1は、記録部5からデジタル音声信号を読み出すだけでなく、記録部5を介さず、リアルタイムでスピーカ9とイヤホン10に音声を放音させることも可能である。
[主制御部の内部構成例]
図2は、主制御部4の内部構成例を示す。
主制御部4は、コーデック部3から供給されたデジタル音声信号のレベルや周波数特性を調整する音声信号処理部12を備える。また、主制御部4は、記録部5を介して記録媒体11にデジタル音声信号を記録させたり、記録部5を介して記録媒体11からデジタル音声信号を読み出したりする副制御部13を備える。
音声信号処理部12には、例えば、DSPが用いられ、副制御部13には、例えば、CPUが用いられる。そして、音声信号処理部12は、AGC係数やフィルタ係数を変えることによって、録音モードに応じて適切に音声信号を処理できる。さらに処理後の音声をMP3等のエンコーダ処理によりデータ圧縮することもできる。
[音声信号処理部の内部構成例]
図3は、音声信号処理部12の内部構成例を示す。
音声信号処理部12は、音声信号補正回路として録音装置1に組み込まれるブロックである。音声信号処理部12は、デジタル音声信号の前処理をする前処理部15と、設定された録音モードに応じてデジタル音声信号の周波数特性を適切な周波数特性に補正及び/又は音声信号のレベルを補正する音声信号補正部16を備える。
また、音声信号処理部12は、副制御部13にデジタル音声信号を供給する選択部17を備える。選択部17は、音声信号補正部16を介して周波数特性と信号レベルが調整されたデジタル音声信号か、何ら処理を施さないデジタル音声信号とするかを選択して出力したり、フェーダーとして録音モードの切替え時の音量を調節したりする。
また、音声信号処理部12は、前処理部15、音声信号補正部16及び選択部17に対して所定の制御を行う補正制御部18を備える。補正制御部18の制御は、主に操作部7の入力操作によって切替えられる録音モードのオン若しくはオフ、又は設定される録音モードの種類によって異なる。
音声信号補正部16は、マイクロホン2R,2Lから供給される音声信号に対して、音声信号の周波数特性及びレベルの補正量が定められる録音モードに基づいて、音声信号の周波数特性を適切な周波数特性に補正及び/又は音声信号のレベルを補正する。
音声信号補正部16は、所定の周波数特性を補正する第1の補正部21〜第4の補正部24と、設定された録音モードに応じてデジタル音声信号の信号レベルを増減させる第5の補正部25を備える。第1の補正部21〜第4の補正部24が補正する周波数特性の例は、後述する図4を参照して説明する。また、第5の補正部25が補正するデジタル音声信号の信号レベルの例は、後述する図6〜図10を参照して説明する。
補正制御部18は、録音モード毎に予め定められた目標レベルの下限値及び上限値に基づいて、音声信号のレベルが目標レベルの下限値を下回る場合には、音声信号のレベルが目標レベルの下限値を上回るように、音声信号補正部16に音声信号のレベルを調整させる。一方、補正制御部18は、音声信号のレベルが目標レベルの上限値を上回る場合には、音声信号のレベルが目標レベルの上限値を下回るように、音声信号補正部16に音声信号のレベルを調整させる。そして、補正制御部18は、所定の期間内で最大となる音声信号のレベルの絶対値を基準値とし、基準値を時間経過に応じて減衰させる。その後、補正制御部18は、音声信号のレベルが基準値を上回る音声信号が入力された場合に、基準値を上回る音声信号のレベルの絶対値を新たな基準値とする。
図4は、第1の補正部21〜第4の補正部24が補正する周波数特性の例を示す。
以下、図4と図5は、第1の補正部21〜第4の補正部24毎に、横軸を周波数[Hz]、縦軸をパワー[dB]として周波数特性補正の例を示す。
図4Aは、第1の補正部21が補正する周波数特性の例を示す。
第1の補正部21は、音域31の周波数特性(低域)の信号レベルを持ち上げる機能を有する。第1の補正部21には、例えば、IIR(Infinite impulse response:無限インパルス応答)型バスシェルビングフィルタが用いられる。
図4Bは、第2の補正部22が補正する周波数特性の例を示す。
第2の補正部22は、音域32の周波数特性(中低域)の信号レベルを増減し微調整する機能を有する。第2の補正部22には、例えば、IIR型イコライザフィルタが用いられる。
図4Cは、第3の補正部23が補正する周波数特性の例を示す。
第3の補正部23は、音域33の周波数特性(可聴帯以下の超低域)の信号レベルをカットする機能を有する。これにより、ノイズの要因となる不要なごく狭い低域がカットされる。第3の補正部23には、例えば、IIR型ハイパスフィルタ(HPF:High Pass Filter)が用いられる。
図4Dは、第4の補正部24が補正する周波数特性の例を示す。
第4の補正部24は、音域34の周波数特性(高域)の信号レベルを増減して微調整機能を有する。第4の補正部24には、例えば、IIR型イコライザフィルタが用いられる。
図4Eは、第1の補正部21〜第4の補正部24が補正する周波数特性補正の例を示す。第1の補正部21〜第4の補正部24は、図中に示した音域31〜34に対して、それぞれ周波数特性補正を行う。
図5は、補正前後の音声信号の周波数特性の例を示す。
図5Aは、補正前の音声信号の周波数特性の例を示す。
このとき、音声信号処理部12に入力されたデジタル音声信号の信号レベルは、周波数毎に一様でないため、放音時に低域不足に聞こえる場合がある。
図5Bは、補正後の音声信号の周波数特性の例を示す。
音声信号補正部16が備える第1の補正部21〜第4の補正部24は、音声信号から不要な、ごく低い帯域をカットし、デジタル音声信号の信号レベルを可聴領域で平坦化するため、放音時にユーザが入力された音声と同等に聞こえる。
図6は、録音装置1で設定される録音モードの例を示す。
図6Aは、録音モードの例を示す。
本例の録音装置1は、マイクロホン2R,2Lの録音感度を変えるため、複数の録音モードを用意する。録音モードは、音声信号の周波数特性をマイクロホン2R,2Lによって収音された状態を保ちながら、感度の基準となる第1の録音モードを定められる。また、録音モードは、マイクロホン2R,2Lの感度を第1の録音モードに比べて高くする第2の録音モードと、マイクロホン2R,2Lの感度を第1の録音モードに比べて低くする第3の録音モードが定められる。さらに、録音モードは、音声信号の周波数特性をフィルタ処理により録音場面に適切な周波数特性に補正されつつ、音声信号のレベルを補正する第4の録音モードが定められる。そして、ユーザによって、第1〜第4の録音モードのうち、いずれかが設定される。
具体的には、録音装置1は、5種類の録音モード(会議モード、高感度モード、口述モード、音楽モード及びマニュアルモード)を用意する。録音モード毎に必要とするマイクロホン2R,2Lの感度は異なるため、第5の補正部25は、録音モード毎にデジタル音声信号の信号レベルを調整する。
会議モードは、会議室等における会話を録音する際に適しており、上述した第1の録音モードに該当する。このとき、マイクロホン2R,2Lの感度は、中庸であり、他の録音モードにおける基準の信号レベルとなる。
高感度モードは、小さな音であっても大きく増幅して録音する機能を有しており、上述した第2の録音モードに該当する。高感度モードは、会議モードで録音する音声が小さかったり、大きな会議室で音響設備(PA:Public Address)を使わないで打合せ等を録音したりする場合に適する。
口述モードは、できるだけ同じ音量にするように自動的に録音時の信号レベルを調整する機能を有しており、上述した第3の録音モードに該当する。
音楽モードは、楽器等の演奏を録音する際に、放音時に違和感がないよう、音声より広帯域に渡って周波数特性が平坦になるよう補正され、かつ、音の抑揚を損なわずに録音する機能を有しており、上述した第4の録音モードに該当する。他のモードを設定した状態で、音楽を録音すると音の抑揚がなくなって平坦な音になることがある。また、録音する楽器によっては、音が震えて録音されることがある。そこで、楽器等の演奏を録音するために専用の音楽モードを設けている。
マニュアルモードは、他の録音モードに関係なく、ユーザの好みによってマイクロホン2R,2Lのゲイン(増幅率)を変えるモードである。マニュアルモードによって、ユーザがマニュアル設定を行うと、入力に比例した録音をすることになる。
図6Bは、音声信号処理部12に入力されるデジタル音声信号の信号レベルの例を示す。
通常、録音装置1が処理できるデジタル音声信号の信号レベルは、所定の閾値の範囲内となる。本例では、信号レベルの上限を最大入力レベルとして示す。
何ら処理することなく音声信号処理部12に入力されるデジタル音声信号の信号レベルは、最大入力レベルを超えることがある。このようなデジタル音声信号は、放音時にひずみが生じる原因となる。
図6Cは、録音モードを口述モード又は会議モードに設定した場合における、デジタル音声信号の信号レベルの例を示す。
この場合、デジタル音声信号の信号レベルは、ほぼ一様に補正される。つまり、小さな音声は信号レベルを高くし、大きな音声は信号レベルを低くする。そして、全体の信号レベルは、最大入力レベルを超えないように補正される。
図6Dは、録音モードを音楽モードに設定した場合における、デジタル音声信号の信号レベルの例を示す。
この場合、デジタル音声信号の信号レベルは、抑揚をある程度保った状態で全体のレンジを狭めて補正される。このため、小さな音声は信号レベルが低いままであり、大きな音声は信号レベルが高いままである。そして、全体の信号レベルは、最大入力レベルを超えないように補正される。
図7は、デジタル音声信号の信号レベルを目標レベル下限値に合わせる例を示す。
デジタル音声信号の信号レベルを所定の範囲内に収めるための目標レベルは、目標レベル下限値及び目標レベル上限値として定められる。
音声信号処理部12に入力されるデジタル音声信号の信号レベルが、録音モード毎に設定される判定閾値を上回る場合、次に示す演算式を用いて、出力信号レベルが目標レベル下限値と目標レベル上限値の間に収まるよう調整される。
a0=(目標上限値-目標下限値)÷(最大レベル-判定閾値)…式(1)
b0=目標上限値−(a0×判定閾値)…式(2)
出力信号レベル=((a0×基準値+b0)÷基準値)×入力信号レベル…式(3)
一方、判定閾値以下の信号に対しては、次に示す演算式用いて、信号の増幅が行われる。
出力信号レベル=(目標下限値÷判定閾値)×入力信号レベル…式(4)
ただし、信号レベルが、録音モード毎に設定される判定閾値に満たない場合、信号レベルの補正処理はされない。
図8は、デジタル音声信号の信号レベルを目標レベル上限値及び下限値の範囲内に合わせる例を示す。判定閾値は、図7に示した場合と同様に設定される。
ここでは、音声信号処理部12に入力されるデジタル音声信号の信号レベルのレンジが、目標レベル上限値を超えたり、目標レベル下限値に満たなかったりする場合を想定する。このとき、第5の補正部25は、信号レベルを目標レベル下限値から目標レベル上限値の範囲内に制限して出力する。
図9は、音声信号処理部12に入力されるデジタル音声信号の信号レベルの最大値から一定の減衰量で基準値を変える例を示す。
ここで、「基準値」について説明する。
図9には、基準値42a,42b,45a〜45cが示される。第5の補正部25は、所定の期間(本例では、1周期)内で入力された最大レベルのデジタル音声信号の絶対値(ピーク41a)を基準値42aとする。このとき、第5の補正部25は、ピーク41a(基準値42a)を何倍すれば、目標レベル上限値及び下限値の範囲内に信号レベルが収まるかを計算する。そして、第5の補正部25は、ピーク41a(基準値42a)を何倍にするかを示すパラメータを、「倍率パラメータ」として算出する。
第5の補正部25は、入力されたデジタル音声信号の信号レベルに「倍率パラメータ」を掛けることで、目標レベル上限値及び下限値の範囲内に信号レベルを収めるよう補正する。また、第5の補正部25は、この基準値42aを時間経過と共に一定に減衰させる。基準値42aの減衰量は、基準値42aを始値として、所定の傾きを有する減衰線43によって求まる。
ここで、ピーク41aの次のピーク41bについて検討する。ピーク41bは、基準値42aより低い。このため、第5の補正部25は、ピーク41aに対して求めた倍率パラメータをそのまま適用して、ピーク41bの信号レベルに掛けて補正する。これにより、ピーク41bの信号レベルは、目標レベル上限値及び下限値の範囲内に収まる。
基準値42bを上回る最大レベルの音声信号が入力されると、第5の補正部25は、この信号レベルの絶対値(ピーク41c)を新たな基準値45aとし、「倍率パラメータ」を算出する。そして、第5の補正部25は、減衰線46に従って、基準値45aを時間経過と共に減衰させる処理を繰り返す。
以下、入力されるデジタル音声信号の信号レベルと基準値が1周期毎に比較され、信号レベルが基準値より高い場合に、この信号レベルに基準値に基づいて再設定する処理が繰り返される。
このように、信号レベルの調整を行うための基準値は、所定の期間毎に判定される。そして、基準値の所定時間当りの減衰量は減衰線43,46に示されるように一定である。このため、例えば、会議において、一人の話者が大きな声で発言すると、基準値が高く設定される。その後、他の話者が小さな声で発言すると、基準値を下げる。これにより、話者の音声の大小によらず、適切に信号レベルを目標レベル上限値及び下限値の範囲内に補正できる。
図10は、所定の期間内における信号レベルの最大値に応じて減衰量を変える例を示す。
静かな環境では、デジタル音声信号の信号レベルは低くなりやすい。第5の補正部25は、低い信号レベルに対しては目標レベル上限値および下限値の範囲内まで信号レベルを引き上げる補正を行う。以下、入力信号の状態に追従して徐々に補正量を調整し、デジタル音声信号の信号レベルを目標レベル上限値及び下限値の範囲内まで引き上げる時間を、「リカバリ時間」と称する。第5の補正部25が行う後述するリカバリ時間は、録音モードによって設定されるマイクロホン2R,2Lの感度に連動して変化する。
従来、リカバリは、信号レベルによらず一定であった。このため、低い信号レベルのデジタル音声信号が入力されると、始めのうちは信号レベルが低いままであり、徐々に信号レベルが引き上げられていた。この結果、信号レベルが適正な状態から急に低いレベルへと変化した場合、変化の直後に録音された音声が小さく、発言内容が不明瞭となりがちであった。
そこで、本例の録音装置1(第5の補正部25)は、入力されるデジタル音声信号の信号レベルに応じてリカバリ時間を変えることとした。具体的には、補正制御部18は、基準値の一定時間当りの減衰量を音声信号のレベルの高さに応じて可変とし、音声信号補正部16(第5の補正部25)が行う音声信号のレベルを補正する速度を可変とする。
図10に示すように、第5の補正部25は、ピーク51a(基準値52a)を何倍にするかを示すパラメータを、「倍率パラメータ」として算出する。
そして、第5の補正部25は、入力されたデジタル音声信号の信号レベルに「倍率パラメータ」を掛けることで、目標レベル上限値及び下限値の範囲内に信号レベルを収めるよう補正する。また、第5の補正部25は、この基準値52aを時間経過と共に一定に減衰させる。基準値52aの減衰量は、基準値52aを始値として、所定の傾きを有する減衰線53によって求まる。
ここで、ピーク51aの次のピーク51b,51cについて検討する。ピーク51b,51cは、基準値52aより小さい。このため、第5の補正部25は、基準値52aをそのまま適用して倍率パラメータを求め、ピーク51b,51cの信号レベルに掛けて補正する。これにより、ピーク51b,51cの信号レベルは、目標レベル上限値及び下限値の範囲内に収まる。
基準値52bを上回る最大レベルの音声信号が入力されると、第5の補正部25は、この信号レベルの絶対値(ピーク51d)を新たな基準値55aとし、「倍率パラメータ」を算出する。そして、第5の補正部25は、減衰線56に従って、基準値55aを時間経過と共に基準値55b,55cに減衰させる処理を繰り返す。
以下、入力されるデジタル音声信号の信号レベルと基準値が所定の期間毎に比較され、信号レベルが基準値より高い場合に、この信号レベルに基づいて基準値を再設定する処理が繰り返される。
図10に示すように、音量が小さな音声が入力されると、リカバリに要する時間を短くする。一方、音量が大きな音声である場合、緩やかにAGCが追従するように、リカバリに要する時間を長くする。これにより、音量が小さなデジタル音声信号の信号レベルは、速やかに目標レベル上限値及び下限値の範囲内に収まるため、ユーザは再生する際に、信号レベルが適正な状態から急に低いレベルへと変化した場合であっても明りょうに聞くことができる。また、信号レベルが高くなると、リカバリに要する時間が長くなる。このため、第5の補正部25は、頻繁に倍率パラメータを求めることなく、信号レベルを補正できる。
以上説明した一実施の形態に係る録音装置1によれば、ユーザは録音する場面に応じて、最適な録音モードに変えて録音装置1に音声を録音することが可能である。このとき、音声信号補正部16は、デジタル音声信号の周波数特性を補正する第1の補正部21〜第4の補正部24の補正フィルタが最適になるよう録音モード毎に予め定められたフィルタ係数を自動的に変える。そして、第1の補正部21〜第4の補正部24は、マイクロホン2R,2Lの周波数特性のうち、特に低域部分の補正を行うため、録音するデジタル音声信号の周波数特性を低域から高域までフラットに補正することができる。また、低域を補正すると、風等が吹き込まれることによってノイズが生じる場合がある。この場合、低域補正フィルタを使用しない録音モードを設定するか、もしくは、低域除去フィルタ(LCF:Low Cut Filter)を設定することにより補正のオン又はオフを行い、低域をコントロールすることができる。
また、第5の補正部25は、設定された録音モードに応じて、マイクロホン2R,2Lの周波数特性を会議、口述等の主に音声を録音する用途と、楽器や自然音等を録音する用途で、マイクロホン2R,2Lが最適な周波数特性となるように補正する。このとき、それぞれの用途に応じて、マイクロホン2R,2Lのフィルタ係数、AGC係数、アタック時間、リカバリ時間等のパラメータを最適と思われる組み合わせに設定するため、ユーザが意図した録音状態となりやすくなるという効果がある。
また、録音装置1が備えるマイクロホン2R,2Lが小型であっても、収音する音声信号の周波数特性を平坦化できるため、高音質でデジタル音声信号を録音することが可能となる。また、ユーザは、録音モードを変えることで、AGC係数を録音シーンに合わせて設定できるため、自然な音声で録音することが可能となるという効果がある。
<2.変形例>
なお、上述した実施の形態に係る録音装置1は、マイクロホン2R,2Lを区別せずにデジタル音声信号の周波数特性を補正し、信号レベルの基準値を変えるが、マイクロホン2R,2Lの処理を関連づけてもよい。
図11は、チャンネル毎に信号レベルを比較して信号レベルを変える例を示す。
図11Aは、マイクロホン2Lが収音した音声から生成される、左チャンネルのデジタル音声信号の信号レベルの例を示す。
図11Bは、マイクロホン2Rが収音した音声から生成される、右チャンネルのデジタル音声信号の信号レベルの例を示す。
一般に、録音装置1に内蔵されるマイクロホン2R,2Lは、所定の距離(例えば、2cm程度)隔てて配置されるため、収音する音声の強さが異なり、結果として左右チャンネルのデジタル音声信号の信号レベルも異なる。このため、録音装置1によって録音された音声を聴くユーザはステレオ感が得られる。本例の録音装置1は、ステレオ感を維持した状態で、デジタル音声信号の周波数特性及び信号レベルの補正を行う。
まず、補正制御部18は、複数チャンネル(本例では、2チャンネル)の音声信号が供給される場合に、チャンネル毎に所定の期間内における左右チャンネルのデジタル音声信号の信号レベルを比較する。次に、信号レベルが高いチャンネル(図11Aに示す左チャンネル)の、ピーク61より、基準値62aを設定する。そして、第5の補正部25は、減衰線63に従って、基準値62aを時間経過と共に基準値62b,62cに減衰させる処理を繰り返す。
一方、信号レベルが低いチャンネル(図11Bに示す右チャンネル)の、デジタル音声信号の信号レベルの最大値(ピーク64)は、同時刻における信号レベルが高い側の、デジタル音声信号の信号レベルの最大値(ピーク61)より、ΔPだけ低い。この場合、左チャンネルの信号レベルと同じ高さになるよう、右チャンネルの信号レベルが補正されると、ステレオ録音したにもかかわらず、ステレオ感がなくなってしまう。このため、右チャンネルの信号レベルは、左チャンネルの信号レベルによって設定された基準値(信号レベル62a,62b,62c)に合わせて補正される。
本例の録音装置1は、左右チャンネルのデジタル音声信号の信号レベルに差がある場合に、信号レベルが高いチャンネルに設定された基準値を、信号レベルが低いチャンネルにも適用する。このとき、補正制御部18は、複数チャンネルの音声信号が供給される場合に、チャンネル毎に所定の期間内における音声信号のレベルを比較する。そして、補正制御部18は、音声信号のレベルが高いチャンネルの音声信号のレベルに対する、他のチャンネルの音声信号のレベルの比を維持しながら、音声信号補正部16に他のチャンネルの音声信号のレベルを調整させる。これにより、左右チャンネルの信号レベルのバランスが保たれ、ユーザのステレオ感が向上する。
また、上述した第1及び第2の実施の形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体を、システムあるいは装置に供給してもよい。また、そのシステムあるいは装置のコンピュータ(またはCPU等の制御装置)が記録媒体に格納されたプログラムコードを読み出し実行することによっても、機能が実現されることは言うまでもない。
この場合のプログラムコードを供給するための記録媒体としては、例えば、フロッピーディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読み出したプログラムコードを実行することにより、上述した実施の形態の機能が実現される。加えて、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(Operating System)などが実際の処理の一部又は全部を行う。その処理によって上述した実施の形態の機能が実現される場合も含まれる。
また、本発明は上述した実施の形態に限られるものではなく、本発明の要旨を逸脱することなくその他種々の構成を取り得ることは勿論である。
1…録音装置、2R,2L…マイクロホン、3…コーデック部、4…主制御部、5…記録部、6…電源、7…操作部、8…表示部、9…スピーカ、10…イヤホン、11…記録媒体、12…音声信号処理部、13…副制御部、15…前処理部、16…音声信号補正部、17…選択部、18…補正制御部、21…第1の補正部、22…第2の補正部、23…第3の補正部、24…第4の補正部、25…第5の補正部

Claims (8)

  1. マイクロホンから供給される音声信号に対して、前記音声信号の周波数特性及びレベルの補正量が定められる録音モードに基づいて、前記音声信号の周波数特性を平坦化する補正及び/又は前記音声信号のレベルを補正する音声信号補正部と、
    前記録音モード毎に予め定められた目標レベルの下限値及び上限値に基づいて、前記音声信号のレベルが前記目標レベルの下限値を下回る場合には、前記音声信号のレベルが前記目標レベルの下限値を上回るように、前記音声信号補正部に前記音声信号のレベルを調整させ、前記音声信号のレベルが前記目標レベルの上限値を上回る場合には、前記音声信号のレベルが前記目標レベルの上限値を下回るように、前記音声信号補正部に前記音声信号のレベルを調整させ、所定の期間内で最大となる前記音声信号のレベルの絶対値を基準値とし、前記基準値を時間経過に応じて減衰させ、前記音声信号のレベルが前記基準値を上回る音声信号が入力された場合に、前記基準値を上回る前記音声信号のレベルの絶対値を新たな基準値とする補正制御部と、
    前記音声信号を記録媒体に記録する記録部と、を備える
    録音装置。
  2. 前記音声信号補正部は、前記音声信号からノイズの要因となるごく低い帯域をカットし、可聴領域の前記音声信号のレベルを平坦化し、
    前記補正制御部は、前記基準値の一定時間当りの減衰量を前記音声信号のレベルの高さに応じて可変とし、前記音声信号補正部が行う前記音声信号のレベルを補正する速度を可変とする
    請求項1記載の録音装置。
  3. 前記補正制御部は、複数チャンネルの前記音声信号が供給される場合に、チャンネル毎に所定の期間内における前記音声信号のレベルを比較し、前記音声信号のレベルが高いチャンネルの音声信号のレベルに対する、他のチャンネルの前記音声信号のレベルの比を維持しながら、前記音声信号補正部に前記他のチャンネルの前記音声信号のレベルを調整させる
    請求項2記載の録音装置。
  4. 前記録音モードは、前記マイクロホンの感度の基準となる第1の録音モードを定めた上で、前記マイクロホンの感度を前記第1の録音モードに比べて高くする第2の録音モードと、前記マイクロホンの感度を前記第1の録音モードに比べて低くする第3の録音モードと、前記音声信号の周波数特性を前記マイクロホンによって収音された状態を保ちながら、前記音声信号のレベルを補正する第4の録音モードとのうち、いずれかが設定される
    請求項3記載の録音装置。
  5. 前記マイクロホンから供給される音声信号をそのまま出力するか、又は前記音声信号補正部を介して出力するかを選択する選択部を備える
    請求項4記載の録音装置。
  6. マイクロホンから供給される音声信号に対して、前記音声信号の周波数特性及びレベルの補正量が定められる録音モードに基づいて、前記音声信号の周波数特性を平坦化する補正及び/又は前記音声信号のレベルを補正するステップと、
    前記録音モード毎に予め定められた目標レベルの下限値及び上限値に基づいて、前記音声信号のレベルが前記目標レベルの下限値を下回る場合には、前記音声信号のレベルが前記目標レベルの下限値を上回るように、前記音声信号のレベルを調整し、前記音声信号のレベルが前記目標レベルの上限値を上回る場合には、前記音声信号のレベルが前記目標レベルの上限値を下回るように、前記音声信号のレベルを調整するステップと、
    所定の期間内で最大となる前記音声信号のレベルの絶対値を基準値とし、前記基準値を時間経過に応じて減衰し、前記音声信号のレベルが前記基準値を上回る音声信号が入力された場合に、前記基準値を上回る前記音声信号のレベルの絶対値を新たな基準値とするステップと、
    前記音声信号を記録媒体に記録するステップと、を含む
    録音方法。
  7. マイクロホンから供給される音声信号に対して、前記音声信号の周波数特性及びレベルの補正量が定められる録音モードに基づいて、前記音声信号の周波数特性を平坦化する補正及び/又は前記音声信号のレベルを補正する音声信号補正部と、
    前記録音モード毎に予め定められた目標レベルの下限値及び上限値に基づいて、前記音声信号のレベルが前記目標レベルの下限値を下回る場合には、前記音声信号のレベルが前記目標レベルの下限値を上回るように、前記音声信号補正部に前記音声信号のレベルを調整させ、前記音声信号のレベルが前記目標レベルの上限値を上回る場合には、前記音声信号のレベルが前記目標レベルの上限値を下回るように、前記音声信号補正部に前記音声信号のレベルを調整させ、所定の期間内で最大となる前記音声信号のレベルの絶対値を基準値とし、前記基準値を時間経過に応じて減衰させ、前記音声信号のレベルが前記基準値を上回る音声信号が入力された場合に、前記基準値を上回る前記音声信号のレベルの絶対値を新たな基準値とする補正制御部と、を備える
    音声信号補正回路。
  8. マイクロホンから供給される音声信号に対して、前記音声信号の周波数特性及びレベルの補正量が定められる録音モードに基づいて、前記音声信号の周波数特性を平坦化する補正及び/又は前記音声信号のレベルを補正するステップと、
    前記録音モード毎に予め定められた目標レベルの下限値及び上限値に基づいて、前記音声信号のレベルが前記目標レベルの下限値を下回る場合には、前記音声信号のレベルが前記目標レベルの下限値を上回るように、前記音声信号のレベルを調整し、前記音声信号のレベルが前記目標レベルの上限値を上回る場合には、前記音声信号のレベルが前記目標レベルの上限値を下回るように、前記音声信号のレベルを調整するステップと、
    所定の期間内で最大となる前記音声信号のレベルの絶対値を基準値とし、前記基準値を時間経過に応じて減衰し、前記音声信号のレベルが前記基準値を上回る音声信号が入力された場合に、前記基準値を上回る前記音声信号のレベルの絶対値を新たな基準値とするステップと、を含む
    コンピュータに実行させるためのプログラム。
JP2009047031A 2009-02-27 2009-02-27 録音装置、録音方法、音声信号補正回路及びプログラム Expired - Fee Related JP4811475B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2009047031A JP4811475B2 (ja) 2009-02-27 2009-02-27 録音装置、録音方法、音声信号補正回路及びプログラム
US12/658,928 US8462964B2 (en) 2009-02-27 2010-02-17 Recording apparatus, recording method, audio signal correction circuit, and program
CN2010101216842A CN102045619B (zh) 2009-02-27 2010-02-20 记录设备、记录方法、音频信号校正电路及程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009047031A JP4811475B2 (ja) 2009-02-27 2009-02-27 録音装置、録音方法、音声信号補正回路及びプログラム

Publications (2)

Publication Number Publication Date
JP2010206298A true JP2010206298A (ja) 2010-09-16
JP4811475B2 JP4811475B2 (ja) 2011-11-09

Family

ID=42667100

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009047031A Expired - Fee Related JP4811475B2 (ja) 2009-02-27 2009-02-27 録音装置、録音方法、音声信号補正回路及びプログラム

Country Status (3)

Country Link
US (1) US8462964B2 (ja)
JP (1) JP4811475B2 (ja)
CN (1) CN102045619B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012145716A (ja) * 2011-01-11 2012-08-02 Jvc Kenwood Corp 音声信号補正装置、音声信号補正方法及びプログラム
JP2013179585A (ja) * 2012-02-01 2013-09-09 Nikon Corp 音処理装置および音処理プログラム
JP2017521024A (ja) * 2015-05-06 2017-07-27 シャオミ・インコーポレイテッド 音声信号の最適化方法及びその装置、プログラム、及び記録媒体

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102610229B (zh) * 2011-01-21 2013-11-13 安凯(广州)微电子技术有限公司 一种音频动态范围压缩方法、装置及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002158620A (ja) * 2000-11-20 2002-05-31 Yamaha Corp データ処理装置およびデータ処理方法
JP2005210180A (ja) * 2004-01-20 2005-08-04 Sony Corp 入力信号処理装置、録音装置、録音方法
JP2006173918A (ja) * 2004-12-14 2006-06-29 Sharp Corp 音声処理装置及び撮像装置
JP2008312002A (ja) * 2007-06-15 2008-12-25 Yamaha Corp テレビ会議装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05161101A (ja) 1991-12-10 1993-06-25 Matsushita Electric Ind Co Ltd カメラ一体型磁気録画再生装置
JP2956642B2 (ja) * 1996-06-17 1999-10-04 ヤマハ株式会社 音場制御ユニットおよび音場制御装置
CN101053277A (zh) * 2004-11-10 2007-10-10 Adc技术株式会社 声音电子电路及其音量调节方法
TWI344751B (en) * 2006-07-07 2011-07-01 Yamaha Corp Automatic gain control circuit

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002158620A (ja) * 2000-11-20 2002-05-31 Yamaha Corp データ処理装置およびデータ処理方法
JP2005210180A (ja) * 2004-01-20 2005-08-04 Sony Corp 入力信号処理装置、録音装置、録音方法
JP2006173918A (ja) * 2004-12-14 2006-06-29 Sharp Corp 音声処理装置及び撮像装置
JP2008312002A (ja) * 2007-06-15 2008-12-25 Yamaha Corp テレビ会議装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012145716A (ja) * 2011-01-11 2012-08-02 Jvc Kenwood Corp 音声信号補正装置、音声信号補正方法及びプログラム
JP2013179585A (ja) * 2012-02-01 2013-09-09 Nikon Corp 音処理装置および音処理プログラム
JP2017521024A (ja) * 2015-05-06 2017-07-27 シャオミ・インコーポレイテッド 音声信号の最適化方法及びその装置、プログラム、及び記録媒体
US10499156B2 (en) 2015-05-06 2019-12-03 Xiaomi Inc. Method and device of optimizing sound signal

Also Published As

Publication number Publication date
US8462964B2 (en) 2013-06-11
JP4811475B2 (ja) 2011-11-09
CN102045619B (zh) 2013-12-11
US20100220872A1 (en) 2010-09-02
CN102045619A (zh) 2011-05-04

Similar Documents

Publication Publication Date Title
JP5236006B2 (ja) 音声信号調整装置及び音声信号調整方法
US7577263B2 (en) System for audio signal processing
EP2920880B1 (en) Audio loudness control system
JP5149991B2 (ja) 音声再生装置、音声再生方法及びプログラム
US20090092265A1 (en) Audio dosage control
US20090315708A1 (en) Method and system for limiting audio output in audio headsets
JP2007500466A (ja) 音声調整装置、方法及びコンピュータプログラム
JP2009044268A (ja) 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、及び、記録媒体
JP2007104407A (ja) 音響信号処理装置
US20090060209A1 (en) Audio-signal processing apparatus and method
JP4811475B2 (ja) 録音装置、録音方法、音声信号補正回路及びプログラム
JP2009296298A (ja) 音声信号処理装置および方法
JP2012113130A (ja) サウンドマスキング装置
JP2009296297A (ja) 音声信号処理装置および方法
JP5062055B2 (ja) 音声信号処理装置及び方法
CN112995854A (zh) 音频处理方法、装置及电子设备
JPWO2006093256A1 (ja) 音声再生装置及び方法、並びに、コンピュータプログラム
JP5306022B2 (ja) ハーモニー音量調整機能を備えるカラオケシステム
JPH03237899A (ja) ハウリング抑制装置
JP5289099B2 (ja) 歌唱音量調整機能を備えるカラオケシステム
JP2011217067A (ja) 音信号出力制御装置
JP2012182774A (ja) 音量制御装置、音量制御方法、および音量制御プログラム
JP4739887B2 (ja) オーディオ再生装置
JP4468580B2 (ja) 入力信号に対するレベル補償を行なう方法と装置
TWI584275B (zh) 電子裝置和聲音信號的分析與播放方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110222

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110412

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110707

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110726

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110808

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees