JP2011215314A - 録音装置 - Google Patents

録音装置 Download PDF

Info

Publication number
JP2011215314A
JP2011215314A JP2010082413A JP2010082413A JP2011215314A JP 2011215314 A JP2011215314 A JP 2011215314A JP 2010082413 A JP2010082413 A JP 2010082413A JP 2010082413 A JP2010082413 A JP 2010082413A JP 2011215314 A JP2011215314 A JP 2011215314A
Authority
JP
Japan
Prior art keywords
recording
level
series
gain
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010082413A
Other languages
English (en)
Inventor
Koichiro Shibata
孝一郎 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010082413A priority Critical patent/JP2011215314A/ja
Publication of JP2011215314A publication Critical patent/JP2011215314A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

【課題】ICレコーダのような録音装置において、ハードウエアの性能を最大限生かしつつ、ユーザの録音レベルの設定が多少大きすぎあるいは小さすぎた何れの場合であっても、クリップ歪の発生や録音音声がノイズに埋もれてしまうことなどを避けた録音データを取得することができ、例えば録音後に直ちにCDに焼けるデータを取得することができるようにすることを目的とする。
【解決手段】音声をデジタル録音する録音装置であって、入力音声に対して複数系列のそれぞれ録音レベルが異なる信号処理を行うことにより複数系列のデジタル音声信号を生成し、それらの複数系列のデジタル音声信号をそれぞれ録音データとして記憶手段に記録する。レベルオーバーが生じた時間位置をログファイルに記録する。複数系列の録音を行う際のサンプリング周波数Fs2とビット数B2と系列数nはハードウエアを効率的に使用できるように選択する。
【選択図】 図1

Description

この発明は、例えば携帯型のICレコーダなどのような小型で簡易に音声を録音する機能を備えた録音装置に関する。
従来より、音楽演奏した楽音や会議などの音声(以下、まとめて「音声」という)を簡易に録音することができる携帯型ICレコーダが知られている。ICレコーダは、例えば、内蔵のフラッシュメモリまたは装着したカード型メモリ(例えばSDカードなど)へ、リニアPCM(例えば、サンプリング周波数は96kHz、48kHz、44.1kHzなど、サンプルの量子化ビット数は24または16ビットなど)やMP3(ビットレートは320kbps〜32kbpsなど)での録音が可能である。
特許文献1には、規定の最大レベルの音声信号が入力されたときにA/D変換回路のフルスケールを超えないように入力音声信号を調整するとともに、A/D変換回路の出力をRAMにバッファリングし、バッファリングした音声信号の1周期内の最大値を検出し、該最大値を予め用意された入出力特性の入力側に適用したときに当該入出力特性の出力が得られるような係数を求め、得られた係数を、前記バッファリングした1周期の音声信号に乗ずることにより、広いダイナミックレンジで入力されたアナログ信号をA/D変換した際に、歪むことなく、適切にレベル調整が為されたデジタル音声信号が得られるようにする音声信号処理装置が開示されている。
特開2005−45584号公報
従来のICレコーダにおけるデジタル録音では、録音レベルの設定ミスにより、音声信号のレベルがICレコーダのダイナミックレンジをオーバーして大きな歪(クリップ歪)を生じたり、音声信号のレベルが低すぎてノイズの影響を大きく受けることがあった。リミッターやオートゲインコントロールなどを用いて、録音時にレベルオーバーをしたときに自動的にレベルを抑えたり、レベルが低すぎるとき音量を上げるようにすることも考えられるが、突発的なレベルの変化に対して瞬時に対応できないためにこれらの機能による処理が間に合わず一瞬歪んでしまうケースがあるし、また録音レベルが動的に変化するため、録音レベルが不自然に変化し、全体として不自然な録音音声になる場合があった。上記特許文献1の技術では、歪みを抑えることができるが、部分的なゲインコントロールを行うので、やはり全体として音声が不自然になる場合がある。
一方、現実的には、リニアPCM24ビットの高品質録音で、かつ録音レベルを低めに設定して録音することにより、クリップ歪の発生を回避することができる。しかし、例えば、ICレコーダで録音した曲を、録音してすぐにオーディオCDに焼きたいという要望があり、その場合、24ビットから16ビットへの変換を行わなければならない。録音された波形は大容量であり、その変換には結構な時間がかかる。例えば、1時間の演奏を録音した場合、録音された波形は3バイト(24ビット)×44.1kHz×60秒×60分×2ch(ステレオ)≒950Mバイトであり、それを2バイト(16ビット)×44.1kHz×60秒×60分×2ch(ステレオ)≒635Mバイトの波形に変換することになるので、その変換にはかなりの時間がかかる。
この発明は、ICレコーダのような録音装置において、ハードウエアの性能を最大限生かしつつ、ユーザの録音レベルの設定が多少大きすぎあるいは小さすぎた何れの場合であっても、クリップ歪の発生や録音音声がノイズに埋もれてしまうことなどを避けた録音データを取得することができ、例えば録音後に直ちにCDに焼けるデータを取得することができるようにすることを目的とする。
上記目的を達成するため、請求項1に係る発明は、入力した音声に基づくデジタル音声信号を生成して記憶手段に記録する録音装置であって、1系列の録音を行う通常モード、またはn系列(nは3以上の整数)の録音を行うマルチ・レベル・レコーディング・モード(以下、MLRモードという)の何れかを指定する手段と、ユーザが指定したトータルゲインの値を入力する手段と、入力した音声に基づくアナログ音声信号を生成する手段と、該アナログ信号に対して、前記トータルゲインの値から決定されるアナログゲインでレベル調整する手段と、該レベル調整後のアナログ音声信号をデジタル音声信号に変換する手段と、(1)通常モードが指定されているときは、前記デジタル音声信号を、前記トータルゲインの値から決定されるデジタルゲインでレベル調整することにより、前記ユーザが指定したトータルゲインがトータルな録音レベルになるようにレベル調整し、(2)MLRモードが指定されているときは、前記デジタル音声信号をn系列に分け、前記トータルゲインの値から決定されるそれぞれ異なるデジタルゲインでレベル調整するとともに、前記n系列のうちの1つの系列は、前記ユーザが指定したトータルゲインの値がトータルな録音レベルとなるように前記アナログゲインとデジタルゲインを決定し、前記n系列のうちの他の系列は、少なくとも、前記ユーザが指定したトータルゲインの値を所定値増加した値がトータルな録音レベルとなるようにする系列と、前記ユーザが指定したトータルゲインの値を所定値減少させた値がトータルな録音レベルとなるようにする系列とを含むように、各系列の前記アナログゲインとデジタルゲインを決定して、レベル調整する手段と、通常モードのときは前記レベル調整された1系列のデジタル音声信号に基づく録音データを記憶手段に記録し、MLRモードのときは前記レベル調整されたn系列のデジタル音声信号に基づく録音データをそれぞれ記憶手段に記録する手段とを備え、通常モードで選択できるサンプリング周波数の最大値がFs1でサンプルビット数の最大値がB1であるとき、MLRモードでのサンプリング周波数Fs2とビット数B2と系列数nを、Fs1×B1≧Fs2×B2×n(式1)が成立するように決定することを特徴とする。
請求項2に係る発明は、入力した音声に基づくデジタル音声信号を生成して記憶手段に記録する録音装置であって、ユーザが指定したトータルゲインの値gを入力する手段と、入力した音声に基づいてアナログ音声信号を生成する手段と、該アナログ音声信号をデジタル音声信号に変換する手段と、該デジタル音声信号を3系列に分け、第1の系列ではトータルな録音レベルがg+Δ(ただしΔは所定値)となるように、第2の系列ではトータルな録音レベルがgとなるように、第3の系列ではトータルな録音レベルがg−Δとなるように、それぞれのゲインを設定して各系列で異なるゲインでレベル調整を行い、各系列毎のデジタル音声信号を取得する手段と、該取得した3系列のデジタル音声信号に基づく録音データを、それぞれ記憶手段に記録する手段とを備えることを特徴とする。
請求項3に係る発明は、請求項1または2に記載の録音装置において、少なくとも前記複数系列のデジタル音声信号のうち一番高いデジタルゲインでレベル調整された系列について、そのデジタル音声信号のレベルオーバーが生じた時間位置をログファイルに記録する手段を備えることを特徴とする。
本発明によれば、1回の録音で、複数系列のそれぞれ録音レベルが異なる録音データが記録されるので、ユーザが設定した録音レベルが大きすぎたり小さすぎたりした場合でも、それら複数系列の録音データから適正なレベルで録音されたものを取得できる可能性が高くなる。いわば、保険として、より適正な録音レベルでの録音データを残すことができる。従って、録音後に直ちにCDに焼けるデータを取得できるようにすることも可能である。レベルオーバーが生じた位置をログファイルに記録しておけば、それを見ることで、使えない録音データを容易に判別できる。また、複数系列で得られた録音データは同時録音された時間軸が全く同じデータであるので、時間部分的にデータを差し替えることも容易に行える。
さらに、本発明では、通常モードで選択できるサンプリング周波数の最大値がFs1でサンプルビット数の最大値がB1であるとき、MLRモードでのサンプリング周波数Fs2とビット数B2と系列数nを、Fs1×B1≧Fs2×B2×n(式1)が成立するように決定するので、ハードウエアの性能を最大限効率的に利用できるようなFs2とB2とnを決定することができる。
実施形態のポケットレコーダの全体構成図 通常モードにおける信号の流れを示すブロック図 MLRモードにおける信号の流れを示すブロック図 バッファへの書き込みとフラッシュメモリへの転送のタイミングを示す図 従来のリミッターやオートゲインコントロールを適用した場合のレベルの変化の例を示す図 実施例1での録音データの流れを示す図 実施例2での録音データの流れを示す図 実施例3での録音データの流れを示す図
以下、図面を用いて、この発明の実施の形態を説明する。
図1は、この発明の一実施形態であるポケットレコーダの全体構成を示すブロック図である。このポケットレコーダは、例えば音楽演奏や会議などで音声の録音を行う際に用いる携帯型のICレコーダである。中央処理装置(CPU)101は、このポケットレコーダの全体の動作を制御する処理装置である。ランダムアクセスメモリ(RAM)102は、CPU101がプログラムを実行する際に利用するワーク領域および波形データのバッファ領域などに用いる揮発性の記憶装置である。内蔵フラッシュ103は、本ポケットレコーダに内蔵された不揮発性の記憶装置であり、CPU101が実行するプログラムや使用するデータ、後述するDSP113で実行させるためのマイクロプログラムなどを格納し、さらに録音データを格納する領域を設けることもできる記憶装置である。外部フラッシュ105は、メモリインタフェース(M I/O)104を介して本ポケットレコーダに接続する外部メモリであり、録音データの格納領域などとして使用する。
操作子106は、本ポケットレコーダの外部パネル上に設けられたスイッチやボリュームなどの操作子である。操作子106は、録音レベルGR(デシベル値:dB)を設定する操作子と、通常モードまたはMLR(マルチ・レベル・レコーディング)モードを切り替えるモード切り替え操作子などを含む。表示器107は、本ポケットレコーダの外部パネル上に設けられたディスプレイである。その他I/O108は、PC(パーソナルコンピュータ)などのその他機器と接続するためのインタフェースである。
マイクロフォン(MIC)109により入力されたアナログ音声信号は、入力アンプ110により所定のゲインで増幅され、ローパスフィルタ(LPF)111により高域部分のノイズ成分を減衰させて、アナログデジタル変換器(ADC)112に入力する。ADC112でアナログ音声信号からデジタル音声信号へ変換され、信号処理部(DSP)113に入力する。ADC112のAD変換は、量子化ビット数は常に24ビット固定とし、サンプリング周波数はCPU101からの指定に応じて96kHzまたは88.2kHzで行うものとする。
本ポケットレコーダでは、ユーザの指定に応じてPCM形式またはMP3形式で音声を録音することができる。PCM形式の録音の場合、ユーザは、サンプリング周波数として96kHz、88.2kHz、48kHz、または44.1kHzの何れかを指定でき、また量子化ビット数として24ビットまたは16ビットの何れかを指定できる(ただし後述するMLRモードが指定された場合は44.1kHzの16ビットに固定的に設定される)。DSP113は、入力するデジタル音声信号のレベル調整処理を行うとともに、必要であればダウンサンプリング処理を行う。すなわち、録音のサンプリング周波数として48kHzが指定された場合、ADC112ではサンプリング周波数96kHzでAD変換を行い、DSP113で96kHzから48kHzへのダウンサンプリングを行う。同様に、44.1kHzが指定された場合、ADC112ではサンプリング周波数88.2kHzでAD変換を行い、DSP113で88.2kHzから44.1kHzへのダウンサンプリングを行う。
MP3形式の録音の場合、ユーザは、ビットレートとして32〜320kbpsの範囲内の幾つかの設定値の中から1つを指定できる。DSP113は、入力するデジタル音声信号のレベル調整処理を行うとともに、入力信号を、指定されたビットレートのMP3形式のデータにエンコードする処理を行う。
DSP113は、上記処理で取得したPCM形式またはMP3形式のデータを、RAM102内の所定のバッファ領域へ書き込む。PCM形式の場合はサンプリング周期毎に1サンプルずつバッファ領域に書き込み、MP3形式の場合はエンコード処理の単位でバッファ領域に書き込む。CPU101は、該バッファ領域にフラッシュメモリの1ページ分の録音データが書き込まれたら、該録音データをバッファ領域から読み出して内蔵フラッシュメモリ103または外部フラッシュメモリ105に書き込む。なお、バッファ領域は例えば2ページ分(ページバッファ1と2)用意し、ページバッファ1にDSP113からサンプルを書き込んでいるときはページバッファ2からページデータを読み出してフラッシュメモリ103,105に転送し、ページバッファ2にDSP113からサンプルを書き込んでいるときはページバッファ1からページデータを読み出してフラッシュメモリ103,105に転送するようにする。そして、一方のページバッファが一杯になるごとに上述のページバッファ1と2の書き込みと読み出しを切り替えながら録音を行う。
本ポケットレコーダは再生機能を有する。CPU101は、ユーザにより再生を指示されたファイルの録音データを内蔵フラッシュメモリ103または外部フラッシュメモリ105から順次読み出してDSP113に送る。PCM形式の場合、その録音データはDSP113からデジタルアナログ変換器(DAC)114に渡され、アナログ音声信号に変換される。MP3形式の場合、その録音データはDSP113でデコード処理され、DAC114に渡されて、アナログ音声信号に変換される。DAC114から出力されるアナログ音声信号は、LPF115によりノイズ成分が除去され、出力アンプ116で増幅された後、スピーカ117により放音される。
本ポケットレコーダでは、PCM形式での録音の場合、ユーザは通常モードとMLRモードの何れかを指定できる。
図2に、通常モードにおける信号の流れを示す。通常モードでは、ユーザにより指定されたサンプリング周波数および量子化ビット数での録音が行われる。入力201は図1のマイク109による入力を示し、レベル調整202は入力アンプ110によるレベル調整処理を示す(LPF111は省略する)。レベル調整202のアナログ入力ゲイン(AIゲイン)Ga(g)は、CPU101により設定される。A/D変換203は、ADC112によるA/D変換処理を示す。A/D変換203におけるサンプリング周波数は、CPU101により96kHzまたは88.2kHzの何れかに設定される。
210は、DSP113による処理を示す。A/D変換203の出力は、Fs変換204により、指定されたサンプリング周波数に変換される。具体的には、96kHzまたは88.2kHzが指定されたときには、A/D変換203ではそれらのサンプリング周波数でA/D変換されるので、Fs変換204はそのままデータをスルーするだけである。48kHzまたは44.1kHzが指定されたときには、A/D変換203では96kHzまたは88.2kHzでA/D変換されるので、Fs変換204はサンプリング周波数が1/2になるようにダウンサンプリング処理を行う。Fs変換204の出力はレベル調整205に入力し、CPU101により設定されたデジタル入力ゲイン(DIゲイン)Gd(g)に応じてレベル調整される。ビット制限206は、指定された録音の量子化ビット数(24ビットまたは16ビット)に応じてサンプルデータのビット制限を行う。ビット制限206に入力するまでの処理は24ビットで行われるので、指定されたビット数が24ビットのときはそのままデータをスルーし、指定されたビット数が16ビットのときは24ビットサンプルの下位8ビットを切り捨てて16ビットにする処理を行う。ビット制限206の出力は、書き込み207で、サンプリング周期毎にRAM102のバッファ領域に書き込まれる。なお、オーバー検出部208については、後に詳しく説明する。
通常モードの場合、CPU101は、ユーザにより設定された録音レベルGR=g(dB)に基づいて、AIゲインGa(g)とDIゲインGd(g)を決定する。レベル調整202は、アナログ信号のレベル調整なので、細かくゲイン値を設定したゲイン調整が難しい。そのため、AIゲインGa(g)の値は、設定できる範囲が限られ、またその範囲内の幾つかのゲイン値を粗く設定する候補(例えば、HighとLowの2つ)の中から設定値を選択するようになっている。細かなゲイン調整はDIゲインGd(g)の設定により行う。CPU101は、ユーザにより録音レベルg(dB)が設定されたとき、まずその録音レベルgに応じてAIゲインGa(g)を決定する。例えば、与えられたgに対応するGa(g)を出力するテーブル(あるいは演算式)を用いればよい。その後、DIゲインGd(g)を、Gd(g)=g−Ga(g)で決定する。結果として、トータルの録音ゲインはユーザにより設定されたg(dB)となり、g=Ga(g)+Gd(g)が成立している。
図3に、MLRモードにおける信号の流れを示す。MLRモードは、DSP113における時分割処理で、3通りのレベル調整を行い、それらのレベル調整に応じた3通りのデジタル音声データを取得するモードである。図3の入力301、レベル調整302、A/D変換303、およびFs変換304はそれぞれ図2の201〜204の同名称のブロックと同じ機能を果たすブロックである。同様に、DSP内のレベル調整305−1〜305−3のそれぞれと図2のレベル調整205、ビット制限306−1〜306−3のそれぞれと図2のビット制限306、書き込み307−1〜307−3のそれぞれと図2の書き込み207も、同名称のブロック同士は同じ機能を果たすものである。MLRモードでは、Fs変換304の出力は、3系統の並行した処理に分けられる。それら3系統のそれぞれの処理で、レベル調整とビット制限とRAMへの書き込みを実行する。
MLRモードでは、ユーザの設定にかかわらず、サンプリング周波数44.1kHzかつ量子化ビット数16ビットに設定される。従って、A/D変換303のサンプリング周波数は88.2kHzに設定され、Fs変換304はサンプリング周波数を1/2とするように設定され、ビット制限306−1〜306−3のそれぞれはビット数を16ビットに制限するように設定される。
MLRモードの場合も、CPU101は、ユーザにより設定された録音レベルGR=g(dB)に基づいて、レベル調整302のAIゲインと、3系列のレベル調整305−1〜305−3の各DIゲインを決定する。すなわち、まずユーザにより設定された録音レベルGR=g(dB)からΔ(dB)だけ下げた値のGRX(dB)に基づいて、AIゲインとデジタル基準入力ゲイン(DIoゲイン)を決定する。ここではΔ=6(dB)とする。従って、GRX=g−6である。AIゲインは、通常モードで用いたのと同じテーブル(あるいは演算式)を用いて、Ga(g−6)と決定する。DIoゲインは、DIo=Gd(g−6)=(g−6)−Ga(g−6)と決定する。3系列のレベル調整305−1〜305−3の各DIゲインは、順に、DIo+2Δ、DIo+Δ、DIoと決定する。従って、レベル調整305−1〜305−3の各DIゲインは、順に、DIo+2Δ=Gd(g−6)+12、DIo+Δ=Gd(g−6)+6、DIo=Gd(g−6)となる。3系列の各トータルの録音ゲインG1、G2、G3は、それぞれ、G1=Ga(g−6)+Gd(g−6)+12、G2=Ga(g−6)+Gd(g−6)+6、G3=Ga(g−6)+Gd(g−6)となる。結果として、ユーザが設定した録音レベルgを基準とすると、G1=g+6、G2=g、G3=g−6となり、これらの3通りの録音レベルG1,G2,G3でそれぞれ録音した録音データが得られる。
図4は、DSP113からRAM102上のバッファへの書き込み、および該バッファからフラッシュメモリ103または105への転送の様子を示すタイムチャートである。矢印tは時間の進行方向を示す。
図4(a)は、通常モードにおける書き込みおよび転送の様子を示すタイムチャートである。「バッファへの書込」は、DSP113が図2のRAM書き込み207の処理により録音データを1サンプルずつRAM102上のバッファへ書き込む処理を示す。各区間401,…は、それぞれ、フラッシュメモリ103,105の1ページ分のサンプルデータをバッファに書き込む区間を示す。各区間にGRと記載したのは、ここで用いられる録音レベルがユーザが設定した録音レベルGR=gであることを示すものである。「フラッシュへの転送」は、バッファ上の1ページ分の録音データをフラッシュメモリ103,105に転送する処理を示す。例えば、区間401でバッファ上に書き込まれた1ページ分の録音データは、該区間401の終了のタイミング411でフラッシュメモリ103,105への転送処理が開始され、転送421で示す区間でその転送が行われる。以降の処理も同様である。
図4(b)は、MLRモードにおける書き込みおよび転送の様子を示すタイムチャートである。「バッファへの書込」と「フラッシュへの転送」の意味は図4(a)と同じである。MLRモードでは、上述の3通りの録音レベルG1,G2,G3で録音された録音データがそれぞれ3系統でバッファ(各系統毎に用意されている)へ書き込まれる。区間431は録音レベルG1で録音した1ページ分のサンプルデータをバッファに書き込む区間を示し、同様に区間432は録音レベルG2で、区間433は録音レベルG3で、それぞれ1ページ分のデータをバッファに書き込む区間を示す。1ページ分のデータが書き込まれたタイミング441で転送処理が開始され、まず転送1(451)で、録音レベルG1で録音した1ページ分の録音データがフラッシュメモリ103,105へ転送され、転送2(452)で、録音レベルG2の録音データが転送され、転送3(453)で、録音レベルG3の録音データが転送される。以降の処理も同様である。これらの転送1〜3で転送された各録音レベルの録音データは、それぞれフラッシュメモリ103,105のファイルに格納され、結果として、3種類の録音レベルG1,G2,G3で録音した録音データファイル1,2,3がそれぞれフラッシュメモリ上に生成される。
なお、MLRモードでは3系統の処理を並行して実施するため、DSP113は該処理が行える性能を持つものとし、DSP113からRAM102上のバッファへの書き込みと該バッファからフラッシュメモリ103,105への転送と書き込みも3系統の処理が行える性能を持つものとする必要がある。本ポケットレコーダは、通常モードで96kHzの24ビットで録音する性能を持つハードウェアであるので、MLRモードで44.1kHzの16ビットの3系統の録音を処理するためには十分な性能を持っている。
一般的に、通常モードで選択可能なサンプリング周波数の最大値がFs1で最大ビット数がB1ビットとし、MLRモードではサンプリング周波数Fs2でビット数がB2ビットで系列数nとすると、Fs1×B1≧Fs2×B2×n(式1)が成立することが必要である。すなわち、通常モードで1系列の録音を行うときにサンプリング周波数Fs1かつビット数B1で録音できる性能のハードウエアであれば、上記の式1が成立するように(それも左辺と右辺の値ができるだけ近くなるように)、MLRモードでのFs2とB2とnを選べば、通常モードを基準として構成されたそのハードウエアを無駄なく効率的に使用していることになる。
次に、レベルオーバーの検出履歴を記録する処理について説明する。
図2のDSP処理210内のオーバー検出208は、ADC112によるA/D変換203およびDSP処理210内のレベル調整205におけるレベルオーバーを検出する。まずA/D変換203の出力に対しては、正側と負側のそれぞれにオーバー検出用のマージンがとってある。マージンの幅をmとすると、正側のマージン領域は正側フルスケール値(最大値)MAXからMAX−mまでの範囲、負側のマージン領域は負側フルスケール値(最小値)MINからMIN+mまでの範囲である。オーバー検出208は、A/D変換203の出力がこれらのマージン領域に入ったとき、アナログ処理段でのレベルオーバーが生じたと判定する。デジタル処理段のレベル調整205では、入力信号にDIゲインを乗算するが、この乗算でオーバーフローが生じることがある。オーバー検出208は、レベル調整205でのオーバーフローを検出したとき、デジタル処理段でのレベルオーバーが生じたと判定する。
図3のDSP処理310内のオーバー検出308は、ADC112によるA/D変換303およびDSP処理310内のレベル調整305−1におけるレベルオーバーを検出する。レベルオーバーと判定する方式は、図2のオーバー検出208と同じである。結果として、通常モードの場合は、ユーザが指定した録音レベルGR=g(dB)での録音経路のレベルオーバーを検出している。また、MLRモードの場合は、ユーザが指定した録音レベルGR=g(dB)に対して6dB上げた録音ゲインG1=g+6(dB)での録音経路のレベルオーバーを検出している。
通常モードでのオーバー検出208およびMLRモードでのオーバー検出308の何れも、上記何れかのレベルオーバーを検出したとき、CPU101にその旨を通知する。CPU101は、そのレベルオーバーの発生タイミングを示すタイムコードをログファイルに記憶する。ログファイルは、録音データを格納するファイルと同じディレクトリに所定のファイル名で作成する。ユーザは、録音後にログファイルを参照することにより、レベルオーバーが発生した正確な位置を知ることができる。特に、MLRモードでは、録音ゲインG1=g+6(dB)で録音した録音ファイル1と、録音ゲインG2=g(dB)で録音した録音ファイル2と、録音ゲインG3=g−6(dB)で録音した録音ファイル3が生成され、ログファイルで録音ファイル1でレベルオーバーが発生した位置を知ることができるので、ユーザは、録音ファイル2や3を採用してレベルオーバーの無い録音データで再生したり、録音データを編集できる装置を持つユーザであれば、録音ファイル1のレベルオーバーが発生した部分を録音ファイル2や3のデータに差し替えることができる。
なお、録音ファイル1〜3は、同一のサンプリングクロックで録音されているので、各録音ファイルの録音データの時間軸は全く同じである。従って、各録音データ中の位置はタイムコードにより正確に対応付けることができ、部分的なデータの差し替えも可能となる。タイムコードは、録音の開始時点を基準とした時刻を直接的あるいは間接的に決定できる情報であればどのようなものでもよい。
図5(a)は、従来のICレコーダにおいてリミッターの動作が間に合わなかった様子を示す概念図である。マイク入力のアナログ信号501が、AD変換502により、量子化ビット数24ビットでデジタル信号503に変換される。504,505はリミッターが動作する閾値の位置とする。リミッターが正常に動作すればクリップノイズは生じないが、突発的なレベルオーバーに対してリミッターが瞬時に対応することができない場合がある。図5(a)はそのようなケースであり、結果として出力された16ビットのデジタル信号506はクリップノイズを含んだ音声となってしまう。
図5(b)は、従来のICレコーダにおいてオートゲインコントロールが作用した様子を示す概念図である。マイク入力のアナログ信号511が、AD変換512により、量子化ビット数24ビットでデジタル信号513に変換される。このとき、オートゲインコントロールが、レベルが小さい音声に対して部分的にレベルを大きくするように作用している。結果として出力された16ビットのデジタル信号516は、録音レベルが部分的に変化するため、全体のバランスがくずれて不自然な録音音声になることがある。
図6は、本実施形態のポケットレコーダのMLRモードでの録音の様子を示す概念図である。マイク入力のアナログ信号601が、図3のレベル調整302で音量レベルを6dB落とされ、AD変換602により量子化ビット数24ビットでデジタル信号に変換されるが、そのデジタル信号は3系列に分けられる。第1の系列では、トータルで録音レベルG1=g+6(dB)、すなわちユーザが設定した録音レベルgから6dB上げたゲインでレベル調整された音声データ603が取得され、ビット制限処理で16ビットサンプルとされ、結果としてデジタル信号606が取得され、録音ファイル1に格納される。同様に、第2の系列では、録音レベルG2=g(dB)で録音されたデータが録音ファイル2に格納され、第3の系列では、録音レベルG3=g−6(dB)で録音されたデータが録音ファイル3に格納される。図6では、第1の系列でオーバーフローが発生する波形を例示したが、このときログファイルにはオーバーフローが発生した位置が記録される。
なお、上記実施形態では、MLRモードにおけるオーバー検出308は、録音ゲインG1=g+6(dB)の録音経路のレベルオーバーを検出していたが、それに加えて他の録音ゲインG2,G3の録音経路のレベルオーバーを検出してログファイルに記録してもよい。また、検出したレベルオーバーがアナログ処理段またはデジタル処理段のどちらで発生したものであるかについてログファイルに記録するようにしてもよい。
さらに、レベルオーバーだけでなく、録音ゲインG3=g−6(dB)の録音経路についてレベルが所定値より低い範囲を検出して(さらに録音ゲインG2やG1について検出してもよいが)、ログファイルに記録してもよい。録音レベルが低すぎて、再生しても録音されている音を認識できないケースを避けたい場合、ユーザは、ログファイルを確認してレベルが低すぎる部分があることを知り、録音ゲインG1やG2の録音ファイルを採用したり、録音レベルが低すぎる範囲については、録音ゲインを上げて録音したデータに差し替えたりできる。
変形例として、アナログ信号の段階から3系列に分けて、それぞれ異なるレベル調整を行うようにしてもよい。図7は、そのような例を示す。マイク入力のアナログ信号701は、3系列に分けられ、第1の系列では、入力アンプ702により、音量レベルが6dB上げられたアナログ信号705とし、ADC708によりデジタル信号711を生成してファイル1に格納する。第2、第3の系列では、それぞれ、アナログ処理段の入力アンプ703,704でゲインを0dB,−6dBとしている。アンプ703,704以降の処理は、第1の系列と同じである。3つの各系列のデジタル処理段では、図3のレベル調整305−1〜305−3と同様のレベル調整が実行されるが、これらの各DIゲインのゲイン値は同じとする。従って、第1から第3の系列のそれぞれのトータルの録音レベルは、上述の実施形態と同じくG1=g+6、G2=g、G3=g−6となる。
また、別の変形例として、3つの感度の異なるマイクを利用して3系列の音量レベルの異なるアナログ音声信号を入力してもよい。図8は、そのような例を示す。第1の系列は高感度マイクでアナログ音声信号801を入力し、第2の系列は中感度マイクでアナログ音声信号802を入力し、第3の系列は低感度マイクでアナログ音声信号803を入力している。マイクの感度は、例えば中感度マイクを基準で0dBとしたとき、高感度マイクは+6dB、低感度マイクは−6dBとなるようなものとすればよい。音声信号入力後の処理は、3系列とも同じトータルの録音レベルとなるようにする。
上記実施形態のMLRモードや変形例では、録音レベルを6dBずつ異ならせた3系列の同時録音を行っているが、異ならせるレベルは6dBでなくてもよいし、系列数も3つに限らない。ただし、系列数が増えれば、それを実現できるだけの性能を持つハードウエアを用いる必要がある。上記実施形態では、PCM形式の録音の場合にMLRモードを指定できるようにしたが、MP3形式などの圧縮形式での録音の場合に同様の同時録音を行えるようにしてもよい。その場合は、複数系列で並行して当該圧縮形式にエンコードするだけの性能を備えたハードウエアを用いる必要がある。
上記実施形態のMLRモードや変形例では、ADCの量子化ビット数を24ビットとし、16ビットにビット制限する例で説明したが、これらのビット数はこれに限らない。ただし、最終的な録音データを16ビットPCM形式にすることにより、そのままCDに焼くことができるというメリットがある。
上記実施形態では、録音レベルを異ならせた3つの録音データファイルと1つのログファイルが生成される例で説明したが、予めデータ形式を決めておき、1つのファイルでこれら全てのデータを含むように構成してもよい。
101…中央処理装置(CPU)、102…ランダムアクセスメモリ(RAM)、103…内蔵フラッシュメモリ、104…メモリインターフェース、105…外部フラッシュメモリ、106…操作子、107…表示器、108…その他I/O、109…マイクロフォン(MIC)、110…入力アンプ、111…ローパスフィルタ(LPF)、112…アナログデジタル変換器(ADC)、113…信号処理部(DSP)、114…デジタルアナログ変換器(DAC)、115…LPF、116…出力アンプ、117…スピーカ。

Claims (3)

  1. 入力した音声に基づくデジタル音声信号を生成して記憶手段に記録する録音装置であって、
    1系列の録音を行う通常モード、またはn系列(nは3以上の整数)の録音を行うマルチ・レベル・レコーディング・モード(以下、MLRモードという)の何れかを指定する手段と、
    ユーザが指定したトータルゲインの値を入力する手段と、
    入力した音声に基づくアナログ音声信号を生成する手段と、
    該アナログ信号に対して、前記トータルゲインの値から決定されるアナログゲインでレベル調整する手段と、
    該レベル調整後のアナログ音声信号をデジタル音声信号に変換する手段と、
    (1)通常モードが指定されているときは、前記デジタル音声信号を、前記トータルゲインの値から決定されるデジタルゲインでレベル調整することにより、前記ユーザが指定したトータルゲインがトータルな録音レベルになるようにレベル調整し、
    (2)MLRモードが指定されているときは、前記デジタル音声信号をn系列に分け、前記トータルゲインの値から決定されるそれぞれ異なるデジタルゲインでレベル調整するとともに、前記n系列のうちの1つの系列は、前記ユーザが指定したトータルゲインの値がトータルな録音レベルとなるように前記アナログゲインとデジタルゲインを決定し、前記n系列のうちの他の系列は、少なくとも、前記ユーザが指定したトータルゲインの値を所定値増加した値がトータルな録音レベルとなるようにする系列と、前記ユーザが指定したトータルゲインの値を所定値減少させた値がトータルな録音レベルとなるようにする系列とを含むように、各系列の前記アナログゲインとデジタルゲインを決定して、レベル調整する手段と、
    通常モードのときは前記レベル調整された1系列のデジタル音声信号に基づく録音データを記憶手段に記録し、MLRモードのときは前記レベル調整されたn系列のデジタル音声信号に基づく録音データをそれぞれ記憶手段に記録する手段と
    を備え、
    通常モードで選択できるサンプリング周波数の最大値がFs1でサンプルビット数の最大値がB1であるとき、MLRモードでのサンプリング周波数Fs2とビット数B2と系列数nを、Fs1×B1≧Fs2×B2×n(式1)が成立するように決定することを特徴とする録音装置。
  2. 入力した音声に基づくデジタル音声信号を生成して記憶手段に記録する録音装置であって、
    ユーザが指定したトータルゲインの値gを入力する手段と、
    入力した音声に基づいてアナログ音声信号を生成する手段と、
    該アナログ音声信号をデジタル音声信号に変換する手段と、
    該デジタル音声信号を3系列に分け、第1の系列ではトータルな録音レベルがg+Δ(ただしΔは所定値)となるように、第2の系列ではトータルな録音レベルがgとなるように、第3の系列ではトータルな録音レベルがg−Δとなるように、それぞれのゲインを設定して各系列で異なるゲインでレベル調整を行い、各系列毎のデジタル音声信号を取得する手段と、
    該取得した3系列のデジタル音声信号に基づく録音データを、それぞれ記憶手段に記録する手段と
    を備えることを特徴とする録音装置。
  3. 請求項1または2に記載の録音装置において、
    少なくとも前記複数系列のデジタル音声信号のうち一番高いデジタルゲインでレベル調整された系列について、そのデジタル音声信号のレベルオーバーが生じた時間位置をログファイルに記録する手段を備えることを特徴とする録音装置。
JP2010082413A 2010-03-31 2010-03-31 録音装置 Pending JP2011215314A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010082413A JP2011215314A (ja) 2010-03-31 2010-03-31 録音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010082413A JP2011215314A (ja) 2010-03-31 2010-03-31 録音装置

Publications (1)

Publication Number Publication Date
JP2011215314A true JP2011215314A (ja) 2011-10-27

Family

ID=44945115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010082413A Pending JP2011215314A (ja) 2010-03-31 2010-03-31 録音装置

Country Status (1)

Country Link
JP (1) JP2011215314A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782224A (zh) * 2020-06-19 2020-10-16 哈尔滨市科佳通用机电股份有限公司 一种机车信号在车综合检测系统的在线程序变更方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111782224A (zh) * 2020-06-19 2020-10-16 哈尔滨市科佳通用机电股份有限公司 一种机车信号在车综合检测系统的在线程序变更方法

Similar Documents

Publication Publication Date Title
US7107109B1 (en) Process for adjusting the sound volume of a digital sound recording
US20070103355A1 (en) Digital recording device, digital recording method, program, and storage medium
US4910780A (en) Audio signal recording and reproducing apparatus utilizing digital data compression and extension
JPS6044837A (ja) 波形再生装置
Stockdale Tools for digital audio recording in qualitative research
US6654317B2 (en) Method and apparatus for reproducing information
EP0380310B1 (en) An acoustic analysis device and a frequency conversion device used therefor
JP2011215314A (ja) 録音装置
Plichta Best practices in the acquisition, processing, and analysis of acoustic speech signals
JP2003243952A (ja) デジタルオーディオシステム、自動音量調整要素生成方法、自動音量調整方法、自動音量調整要素生成プログラム、自動音量調整プログラム、自動音量調整要素生成プログラムが記録された記録媒体及び自動音量調整プログラムが記録された記録媒体
JP4588626B2 (ja) 楽曲再生装置、再生制御方法、および、プログラム
JP2007036710A (ja) アタック信号増幅デジタル信号処理装置
US8195317B2 (en) Data reproduction apparatus and data reproduction method
JPH06308992A (ja) 音声式電子ブック
JP4277609B2 (ja) 音声信号処理装置および方法、ならびに、記録装置および方法
KR20020090552A (ko) 다이렉트 디지털 오디오 인코딩 장치 및 그 방법
JP2005107617A5 (ja)
JP4787131B2 (ja) オーディオ再生装置、並びにオーディオ再生方法及びプログラム、オーディオ記録装置、オーディオ記録方法
KR20060119026A (ko) 보청 기능이 구비된 휴대용 단말기에서의 문자 표시장치 및방법
JP2005107617A (ja) 音声データ検索装置。
JP2007140063A (ja) 音声記録再生装置
JPH1051318A (ja) データ変換装置
JPH01236469A (ja) 情報記録再生装置
JP2001069089A (ja) ディジタル信号記録装置および記録方法、並びに記録媒体
US5790494A (en) Digital audio recorder and digital audio recording and reproducing system