JP2011215314A

JP2011215314A - 録音装置

Info

Publication number: JP2011215314A
Application number: JP2010082413A
Authority: JP
Inventors: Koichiro Shibata; 孝一郎柴田
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2010-03-31
Filing date: 2010-03-31
Publication date: 2011-10-27

Abstract

【課題】ＩＣレコーダのような録音装置において、ハードウエアの性能を最大限生かしつつ、ユーザの録音レベルの設定が多少大きすぎあるいは小さすぎた何れの場合であっても、クリップ歪の発生や録音音声がノイズに埋もれてしまうことなどを避けた録音データを取得することができ、例えば録音後に直ちにＣＤに焼けるデータを取得することができるようにすることを目的とする。
【解決手段】音声をデジタル録音する録音装置であって、入力音声に対して複数系列のそれぞれ録音レベルが異なる信号処理を行うことにより複数系列のデジタル音声信号を生成し、それらの複数系列のデジタル音声信号をそれぞれ録音データとして記憶手段に記録する。レベルオーバーが生じた時間位置をログファイルに記録する。複数系列の録音を行う際のサンプリング周波数Ｆｓ２とビット数Ｂ２と系列数ｎはハードウエアを効率的に使用できるように選択する。
【選択図】図１

Description

この発明は、例えば携帯型のＩＣレコーダなどのような小型で簡易に音声を録音する機能を備えた録音装置に関する。

従来より、音楽演奏した楽音や会議などの音声（以下、まとめて「音声」という）を簡易に録音することができる携帯型ＩＣレコーダが知られている。ＩＣレコーダは、例えば、内蔵のフラッシュメモリまたは装着したカード型メモリ（例えばＳＤカードなど）へ、リニアＰＣＭ（例えば、サンプリング周波数は９６ｋＨｚ、４８ｋＨｚ、４４．１ｋＨｚなど、サンプルの量子化ビット数は２４または１６ビットなど）やＭＰ３（ビットレートは３２０ｋｂｐｓ〜３２ｋｂｐｓなど）での録音が可能である。

特許文献１には、規定の最大レベルの音声信号が入力されたときにＡ／Ｄ変換回路のフルスケールを超えないように入力音声信号を調整するとともに、Ａ／Ｄ変換回路の出力をＲＡＭにバッファリングし、バッファリングした音声信号の１周期内の最大値を検出し、該最大値を予め用意された入出力特性の入力側に適用したときに当該入出力特性の出力が得られるような係数を求め、得られた係数を、前記バッファリングした１周期の音声信号に乗ずることにより、広いダイナミックレンジで入力されたアナログ信号をＡ／Ｄ変換した際に、歪むことなく、適切にレベル調整が為されたデジタル音声信号が得られるようにする音声信号処理装置が開示されている。

特開２００５−４５５８４号公報

従来のＩＣレコーダにおけるデジタル録音では、録音レベルの設定ミスにより、音声信号のレベルがＩＣレコーダのダイナミックレンジをオーバーして大きな歪（クリップ歪）を生じたり、音声信号のレベルが低すぎてノイズの影響を大きく受けることがあった。リミッターやオートゲインコントロールなどを用いて、録音時にレベルオーバーをしたときに自動的にレベルを抑えたり、レベルが低すぎるとき音量を上げるようにすることも考えられるが、突発的なレベルの変化に対して瞬時に対応できないためにこれらの機能による処理が間に合わず一瞬歪んでしまうケースがあるし、また録音レベルが動的に変化するため、録音レベルが不自然に変化し、全体として不自然な録音音声になる場合があった。上記特許文献１の技術では、歪みを抑えることができるが、部分的なゲインコントロールを行うので、やはり全体として音声が不自然になる場合がある。

一方、現実的には、リニアＰＣＭ２４ビットの高品質録音で、かつ録音レベルを低めに設定して録音することにより、クリップ歪の発生を回避することができる。しかし、例えば、ＩＣレコーダで録音した曲を、録音してすぐにオーディオＣＤに焼きたいという要望があり、その場合、２４ビットから１６ビットへの変換を行わなければならない。録音された波形は大容量であり、その変換には結構な時間がかかる。例えば、１時間の演奏を録音した場合、録音された波形は３バイト(２４ビット)×４４．１ｋＨｚ×６０秒×６０分×２ｃｈ（ステレオ）≒９５０Ｍバイトであり、それを２バイト（１６ビット）×４４．１ｋＨｚ×６０秒×６０分×２ｃｈ（ステレオ）≒６３５Ｍバイトの波形に変換することになるので、その変換にはかなりの時間がかかる。

この発明は、ＩＣレコーダのような録音装置において、ハードウエアの性能を最大限生かしつつ、ユーザの録音レベルの設定が多少大きすぎあるいは小さすぎた何れの場合であっても、クリップ歪の発生や録音音声がノイズに埋もれてしまうことなどを避けた録音データを取得することができ、例えば録音後に直ちにＣＤに焼けるデータを取得することができるようにすることを目的とする。

上記目的を達成するため、請求項１に係る発明は、入力した音声に基づくデジタル音声信号を生成して記憶手段に記録する録音装置であって、１系列の録音を行う通常モード、またはｎ系列（ｎは３以上の整数）の録音を行うマルチ・レベル・レコーディング・モード（以下、ＭＬＲモードという）の何れかを指定する手段と、ユーザが指定したトータルゲインの値を入力する手段と、入力した音声に基づくアナログ音声信号を生成する手段と、該アナログ信号に対して、前記トータルゲインの値から決定されるアナログゲインでレベル調整する手段と、該レベル調整後のアナログ音声信号をデジタル音声信号に変換する手段と、（１）通常モードが指定されているときは、前記デジタル音声信号を、前記トータルゲインの値から決定されるデジタルゲインでレベル調整することにより、前記ユーザが指定したトータルゲインがトータルな録音レベルになるようにレベル調整し、（２）ＭＬＲモードが指定されているときは、前記デジタル音声信号をｎ系列に分け、前記トータルゲインの値から決定されるそれぞれ異なるデジタルゲインでレベル調整するとともに、前記ｎ系列のうちの１つの系列は、前記ユーザが指定したトータルゲインの値がトータルな録音レベルとなるように前記アナログゲインとデジタルゲインを決定し、前記ｎ系列のうちの他の系列は、少なくとも、前記ユーザが指定したトータルゲインの値を所定値増加した値がトータルな録音レベルとなるようにする系列と、前記ユーザが指定したトータルゲインの値を所定値減少させた値がトータルな録音レベルとなるようにする系列とを含むように、各系列の前記アナログゲインとデジタルゲインを決定して、レベル調整する手段と、通常モードのときは前記レベル調整された１系列のデジタル音声信号に基づく録音データを記憶手段に記録し、ＭＬＲモードのときは前記レベル調整されたｎ系列のデジタル音声信号に基づく録音データをそれぞれ記憶手段に記録する手段とを備え、通常モードで選択できるサンプリング周波数の最大値がＦｓ１でサンプルビット数の最大値がＢ１であるとき、ＭＬＲモードでのサンプリング周波数Ｆｓ２とビット数Ｂ２と系列数ｎを、Ｆｓ１×Ｂ１≧Ｆｓ２×Ｂ２×ｎ（式１）が成立するように決定することを特徴とする。

請求項２に係る発明は、入力した音声に基づくデジタル音声信号を生成して記憶手段に記録する録音装置であって、ユーザが指定したトータルゲインの値ｇを入力する手段と、入力した音声に基づいてアナログ音声信号を生成する手段と、該アナログ音声信号をデジタル音声信号に変換する手段と、該デジタル音声信号を３系列に分け、第１の系列ではトータルな録音レベルがｇ＋Δ（ただしΔは所定値）となるように、第２の系列ではトータルな録音レベルがｇとなるように、第３の系列ではトータルな録音レベルがｇ−Δとなるように、それぞれのゲインを設定して各系列で異なるゲインでレベル調整を行い、各系列毎のデジタル音声信号を取得する手段と、該取得した３系列のデジタル音声信号に基づく録音データを、それぞれ記憶手段に記録する手段とを備えることを特徴とする。

請求項３に係る発明は、請求項１または２に記載の録音装置において、少なくとも前記複数系列のデジタル音声信号のうち一番高いデジタルゲインでレベル調整された系列について、そのデジタル音声信号のレベルオーバーが生じた時間位置をログファイルに記録する手段を備えることを特徴とする。

本発明によれば、１回の録音で、複数系列のそれぞれ録音レベルが異なる録音データが記録されるので、ユーザが設定した録音レベルが大きすぎたり小さすぎたりした場合でも、それら複数系列の録音データから適正なレベルで録音されたものを取得できる可能性が高くなる。いわば、保険として、より適正な録音レベルでの録音データを残すことができる。従って、録音後に直ちにＣＤに焼けるデータを取得できるようにすることも可能である。レベルオーバーが生じた位置をログファイルに記録しておけば、それを見ることで、使えない録音データを容易に判別できる。また、複数系列で得られた録音データは同時録音された時間軸が全く同じデータであるので、時間部分的にデータを差し替えることも容易に行える。

さらに、本発明では、通常モードで選択できるサンプリング周波数の最大値がＦｓ１でサンプルビット数の最大値がＢ１であるとき、ＭＬＲモードでのサンプリング周波数Ｆｓ２とビット数Ｂ２と系列数ｎを、Ｆｓ１×Ｂ１≧Ｆｓ２×Ｂ２×ｎ（式１）が成立するように決定するので、ハードウエアの性能を最大限効率的に利用できるようなＦｓ２とＢ２とｎを決定することができる。

実施形態のポケットレコーダの全体構成図通常モードにおける信号の流れを示すブロック図ＭＬＲモードにおける信号の流れを示すブロック図バッファへの書き込みとフラッシュメモリへの転送のタイミングを示す図従来のリミッターやオートゲインコントロールを適用した場合のレベルの変化の例を示す図実施例１での録音データの流れを示す図実施例２での録音データの流れを示す図実施例３での録音データの流れを示す図

以下、図面を用いて、この発明の実施の形態を説明する。

図１は、この発明の一実施形態であるポケットレコーダの全体構成を示すブロック図である。このポケットレコーダは、例えば音楽演奏や会議などで音声の録音を行う際に用いる携帯型のＩＣレコーダである。中央処理装置（ＣＰＵ）１０１は、このポケットレコーダの全体の動作を制御する処理装置である。ランダムアクセスメモリ（ＲＡＭ）１０２は、ＣＰＵ１０１がプログラムを実行する際に利用するワーク領域および波形データのバッファ領域などに用いる揮発性の記憶装置である。内蔵フラッシュ１０３は、本ポケットレコーダに内蔵された不揮発性の記憶装置であり、ＣＰＵ１０１が実行するプログラムや使用するデータ、後述するＤＳＰ１１３で実行させるためのマイクロプログラムなどを格納し、さらに録音データを格納する領域を設けることもできる記憶装置である。外部フラッシュ１０５は、メモリインタフェース（ＭＩ／Ｏ）１０４を介して本ポケットレコーダに接続する外部メモリであり、録音データの格納領域などとして使用する。

操作子１０６は、本ポケットレコーダの外部パネル上に設けられたスイッチやボリュームなどの操作子である。操作子１０６は、録音レベルＧＲ（デシベル値：ｄＢ）を設定する操作子と、通常モードまたはＭＬＲ（マルチ・レベル・レコーディング）モードを切り替えるモード切り替え操作子などを含む。表示器１０７は、本ポケットレコーダの外部パネル上に設けられたディスプレイである。その他Ｉ／Ｏ１０８は、ＰＣ（パーソナルコンピュータ）などのその他機器と接続するためのインタフェースである。

マイクロフォン（ＭＩＣ）１０９により入力されたアナログ音声信号は、入力アンプ１１０により所定のゲインで増幅され、ローパスフィルタ（ＬＰＦ）１１１により高域部分のノイズ成分を減衰させて、アナログデジタル変換器（ＡＤＣ）１１２に入力する。ＡＤＣ１１２でアナログ音声信号からデジタル音声信号へ変換され、信号処理部（ＤＳＰ）１１３に入力する。ＡＤＣ１１２のＡＤ変換は、量子化ビット数は常に２４ビット固定とし、サンプリング周波数はＣＰＵ１０１からの指定に応じて９６ｋＨｚまたは８８．２ｋＨｚで行うものとする。

本ポケットレコーダでは、ユーザの指定に応じてＰＣＭ形式またはＭＰ３形式で音声を録音することができる。ＰＣＭ形式の録音の場合、ユーザは、サンプリング周波数として９６ｋＨｚ、８８．２ｋＨｚ、４８ｋＨｚ、または４４．１ｋＨｚの何れかを指定でき、また量子化ビット数として２４ビットまたは１６ビットの何れかを指定できる（ただし後述するＭＬＲモードが指定された場合は４４．１ｋＨｚの１６ビットに固定的に設定される）。ＤＳＰ１１３は、入力するデジタル音声信号のレベル調整処理を行うとともに、必要であればダウンサンプリング処理を行う。すなわち、録音のサンプリング周波数として４８ｋＨｚが指定された場合、ＡＤＣ１１２ではサンプリング周波数９６ｋＨｚでＡＤ変換を行い、ＤＳＰ１１３で９６ｋＨｚから４８ｋＨｚへのダウンサンプリングを行う。同様に、４４．１ｋＨｚが指定された場合、ＡＤＣ１１２ではサンプリング周波数８８．２ｋＨｚでＡＤ変換を行い、ＤＳＰ１１３で８８．２ｋＨｚから４４．１ｋＨｚへのダウンサンプリングを行う。

ＭＰ３形式の録音の場合、ユーザは、ビットレートとして３２〜３２０ｋｂｐｓの範囲内の幾つかの設定値の中から１つを指定できる。ＤＳＰ１１３は、入力するデジタル音声信号のレベル調整処理を行うとともに、入力信号を、指定されたビットレートのＭＰ３形式のデータにエンコードする処理を行う。

ＤＳＰ１１３は、上記処理で取得したＰＣＭ形式またはＭＰ３形式のデータを、ＲＡＭ１０２内の所定のバッファ領域へ書き込む。ＰＣＭ形式の場合はサンプリング周期毎に１サンプルずつバッファ領域に書き込み、ＭＰ３形式の場合はエンコード処理の単位でバッファ領域に書き込む。ＣＰＵ１０１は、該バッファ領域にフラッシュメモリの１ページ分の録音データが書き込まれたら、該録音データをバッファ領域から読み出して内蔵フラッシュメモリ１０３または外部フラッシュメモリ１０５に書き込む。なお、バッファ領域は例えば２ページ分（ページバッファ１と２）用意し、ページバッファ１にＤＳＰ１１３からサンプルを書き込んでいるときはページバッファ２からページデータを読み出してフラッシュメモリ１０３，１０５に転送し、ページバッファ２にＤＳＰ１１３からサンプルを書き込んでいるときはページバッファ１からページデータを読み出してフラッシュメモリ１０３，１０５に転送するようにする。そして、一方のページバッファが一杯になるごとに上述のページバッファ１と２の書き込みと読み出しを切り替えながら録音を行う。

本ポケットレコーダは再生機能を有する。ＣＰＵ１０１は、ユーザにより再生を指示されたファイルの録音データを内蔵フラッシュメモリ１０３または外部フラッシュメモリ１０５から順次読み出してＤＳＰ１１３に送る。ＰＣＭ形式の場合、その録音データはＤＳＰ１１３からデジタルアナログ変換器（ＤＡＣ）１１４に渡され、アナログ音声信号に変換される。ＭＰ３形式の場合、その録音データはＤＳＰ１１３でデコード処理され、ＤＡＣ１１４に渡されて、アナログ音声信号に変換される。ＤＡＣ１１４から出力されるアナログ音声信号は、ＬＰＦ１１５によりノイズ成分が除去され、出力アンプ１１６で増幅された後、スピーカ１１７により放音される。

本ポケットレコーダでは、ＰＣＭ形式での録音の場合、ユーザは通常モードとＭＬＲモードの何れかを指定できる。

図２に、通常モードにおける信号の流れを示す。通常モードでは、ユーザにより指定されたサンプリング周波数および量子化ビット数での録音が行われる。入力２０１は図１のマイク１０９による入力を示し、レベル調整２０２は入力アンプ１１０によるレベル調整処理を示す（ＬＰＦ１１１は省略する）。レベル調整２０２のアナログ入力ゲイン（ＡＩゲイン）Ｇａ（ｇ）は、ＣＰＵ１０１により設定される。Ａ／Ｄ変換２０３は、ＡＤＣ１１２によるＡ／Ｄ変換処理を示す。Ａ／Ｄ変換２０３におけるサンプリング周波数は、ＣＰＵ１０１により９６ｋＨｚまたは８８．２ｋＨｚの何れかに設定される。

２１０は、ＤＳＰ１１３による処理を示す。Ａ／Ｄ変換２０３の出力は、Ｆｓ変換２０４により、指定されたサンプリング周波数に変換される。具体的には、９６ｋＨｚまたは８８．２ｋＨｚが指定されたときには、Ａ／Ｄ変換２０３ではそれらのサンプリング周波数でＡ／Ｄ変換されるので、Ｆｓ変換２０４はそのままデータをスルーするだけである。４８ｋＨｚまたは４４．１ｋＨｚが指定されたときには、Ａ／Ｄ変換２０３では９６ｋＨｚまたは８８．２ｋＨｚでＡ／Ｄ変換されるので、Ｆｓ変換２０４はサンプリング周波数が１／２になるようにダウンサンプリング処理を行う。Ｆｓ変換２０４の出力はレベル調整２０５に入力し、ＣＰＵ１０１により設定されたデジタル入力ゲイン（ＤＩゲイン）Ｇｄ（ｇ）に応じてレベル調整される。ビット制限２０６は、指定された録音の量子化ビット数（２４ビットまたは１６ビット）に応じてサンプルデータのビット制限を行う。ビット制限２０６に入力するまでの処理は２４ビットで行われるので、指定されたビット数が２４ビットのときはそのままデータをスルーし、指定されたビット数が１６ビットのときは２４ビットサンプルの下位８ビットを切り捨てて１６ビットにする処理を行う。ビット制限２０６の出力は、書き込み２０７で、サンプリング周期毎にＲＡＭ１０２のバッファ領域に書き込まれる。なお、オーバー検出部２０８については、後に詳しく説明する。

通常モードの場合、ＣＰＵ１０１は、ユーザにより設定された録音レベルＧＲ＝ｇ（ｄＢ）に基づいて、ＡＩゲインＧａ（ｇ）とＤＩゲインＧｄ（ｇ）を決定する。レベル調整２０２は、アナログ信号のレベル調整なので、細かくゲイン値を設定したゲイン調整が難しい。そのため、ＡＩゲインＧａ（ｇ）の値は、設定できる範囲が限られ、またその範囲内の幾つかのゲイン値を粗く設定する候補（例えば、ＨｉｇｈとＬｏｗの２つ）の中から設定値を選択するようになっている。細かなゲイン調整はＤＩゲインＧｄ（ｇ）の設定により行う。ＣＰＵ１０１は、ユーザにより録音レベルｇ（ｄＢ）が設定されたとき、まずその録音レベルｇに応じてＡＩゲインＧａ（ｇ）を決定する。例えば、与えられたｇに対応するＧａ（ｇ）を出力するテーブル（あるいは演算式）を用いればよい。その後、ＤＩゲインＧｄ（ｇ）を、Ｇｄ（ｇ）＝ｇ−Ｇａ（ｇ）で決定する。結果として、トータルの録音ゲインはユーザにより設定されたｇ（ｄＢ）となり、ｇ＝Ｇａ（ｇ）＋Ｇｄ（ｇ）が成立している。

図３に、ＭＬＲモードにおける信号の流れを示す。ＭＬＲモードは、ＤＳＰ１１３における時分割処理で、３通りのレベル調整を行い、それらのレベル調整に応じた３通りのデジタル音声データを取得するモードである。図３の入力３０１、レベル調整３０２、Ａ／Ｄ変換３０３、およびＦｓ変換３０４はそれぞれ図２の２０１〜２０４の同名称のブロックと同じ機能を果たすブロックである。同様に、ＤＳＰ内のレベル調整３０５−１〜３０５−３のそれぞれと図２のレベル調整２０５、ビット制限３０６−１〜３０６−３のそれぞれと図２のビット制限３０６、書き込み３０７−１〜３０７−３のそれぞれと図２の書き込み２０７も、同名称のブロック同士は同じ機能を果たすものである。ＭＬＲモードでは、Ｆｓ変換３０４の出力は、３系統の並行した処理に分けられる。それら３系統のそれぞれの処理で、レベル調整とビット制限とＲＡＭへの書き込みを実行する。

ＭＬＲモードでは、ユーザの設定にかかわらず、サンプリング周波数４４．１ｋＨｚかつ量子化ビット数１６ビットに設定される。従って、Ａ／Ｄ変換３０３のサンプリング周波数は８８．２ｋＨｚに設定され、Ｆｓ変換３０４はサンプリング周波数を１／２とするように設定され、ビット制限３０６−１〜３０６−３のそれぞれはビット数を１６ビットに制限するように設定される。

ＭＬＲモードの場合も、ＣＰＵ１０１は、ユーザにより設定された録音レベルＧＲ＝ｇ（ｄＢ）に基づいて、レベル調整３０２のＡＩゲインと、３系列のレベル調整３０５−１〜３０５−３の各ＤＩゲインを決定する。すなわち、まずユーザにより設定された録音レベルＧＲ＝ｇ（ｄＢ）からΔ（ｄＢ）だけ下げた値のＧＲＸ（ｄＢ）に基づいて、ＡＩゲインとデジタル基準入力ゲイン（ＤＩｏゲイン）を決定する。ここではΔ＝６（ｄＢ）とする。従って、ＧＲＸ＝ｇ−６である。ＡＩゲインは、通常モードで用いたのと同じテーブル（あるいは演算式）を用いて、Ｇａ（ｇ−６）と決定する。ＤＩｏゲインは、ＤＩｏ＝Ｇｄ（ｇ−６）＝（ｇ−６）−Ｇａ（ｇ−６）と決定する。３系列のレベル調整３０５−１〜３０５−３の各ＤＩゲインは、順に、ＤＩｏ＋２Δ、ＤＩｏ＋Δ、ＤＩｏと決定する。従って、レベル調整３０５−１〜３０５−３の各ＤＩゲインは、順に、ＤＩｏ＋２Δ＝Ｇｄ（ｇ−６）＋１２、ＤＩｏ＋Δ＝Ｇｄ（ｇ−６）＋６、ＤＩｏ＝Ｇｄ（ｇ−６）となる。３系列の各トータルの録音ゲインＧ１、Ｇ２、Ｇ３は、それぞれ、Ｇ１＝Ｇａ（ｇ−６）＋Ｇｄ（ｇ−６）＋１２、Ｇ２＝Ｇａ（ｇ−６）＋Ｇｄ（ｇ−６）＋６、Ｇ３＝Ｇａ（ｇ−６）＋Ｇｄ（ｇ−６）となる。結果として、ユーザが設定した録音レベルｇを基準とすると、Ｇ１＝ｇ＋６、Ｇ２＝ｇ、Ｇ３＝ｇ−６となり、これらの３通りの録音レベルＧ１，Ｇ２，Ｇ３でそれぞれ録音した録音データが得られる。

図４は、ＤＳＰ１１３からＲＡＭ１０２上のバッファへの書き込み、および該バッファからフラッシュメモリ１０３または１０５への転送の様子を示すタイムチャートである。矢印ｔは時間の進行方向を示す。

図４（ａ）は、通常モードにおける書き込みおよび転送の様子を示すタイムチャートである。「バッファへの書込」は、ＤＳＰ１１３が図２のＲＡＭ書き込み２０７の処理により録音データを１サンプルずつＲＡＭ１０２上のバッファへ書き込む処理を示す。各区間４０１，…は、それぞれ、フラッシュメモリ１０３，１０５の１ページ分のサンプルデータをバッファに書き込む区間を示す。各区間にＧＲと記載したのは、ここで用いられる録音レベルがユーザが設定した録音レベルＧＲ＝ｇであることを示すものである。「フラッシュへの転送」は、バッファ上の１ページ分の録音データをフラッシュメモリ１０３，１０５に転送する処理を示す。例えば、区間４０１でバッファ上に書き込まれた１ページ分の録音データは、該区間４０１の終了のタイミング４１１でフラッシュメモリ１０３，１０５への転送処理が開始され、転送４２１で示す区間でその転送が行われる。以降の処理も同様である。

図４（ｂ）は、ＭＬＲモードにおける書き込みおよび転送の様子を示すタイムチャートである。「バッファへの書込」と「フラッシュへの転送」の意味は図４（ａ）と同じである。ＭＬＲモードでは、上述の３通りの録音レベルＧ１，Ｇ２，Ｇ３で録音された録音データがそれぞれ３系統でバッファ（各系統毎に用意されている）へ書き込まれる。区間４３１は録音レベルＧ１で録音した１ページ分のサンプルデータをバッファに書き込む区間を示し、同様に区間４３２は録音レベルＧ２で、区間４３３は録音レベルＧ３で、それぞれ１ページ分のデータをバッファに書き込む区間を示す。１ページ分のデータが書き込まれたタイミング４４１で転送処理が開始され、まず転送１（４５１）で、録音レベルＧ１で録音した１ページ分の録音データがフラッシュメモリ１０３，１０５へ転送され、転送２（４５２）で、録音レベルＧ２の録音データが転送され、転送３（４５３）で、録音レベルＧ３の録音データが転送される。以降の処理も同様である。これらの転送１〜３で転送された各録音レベルの録音データは、それぞれフラッシュメモリ１０３，１０５のファイルに格納され、結果として、３種類の録音レベルＧ１，Ｇ２，Ｇ３で録音した録音データファイル１，２，３がそれぞれフラッシュメモリ上に生成される。

なお、ＭＬＲモードでは３系統の処理を並行して実施するため、ＤＳＰ１１３は該処理が行える性能を持つものとし、ＤＳＰ１１３からＲＡＭ１０２上のバッファへの書き込みと該バッファからフラッシュメモリ１０３，１０５への転送と書き込みも３系統の処理が行える性能を持つものとする必要がある。本ポケットレコーダは、通常モードで９６ｋＨｚの２４ビットで録音する性能を持つハードウェアであるので、ＭＬＲモードで４４．１ｋＨｚの１６ビットの３系統の録音を処理するためには十分な性能を持っている。

一般的に、通常モードで選択可能なサンプリング周波数の最大値がＦｓ１で最大ビット数がＢ１ビットとし、ＭＬＲモードではサンプリング周波数Ｆｓ２でビット数がＢ２ビットで系列数ｎとすると、Ｆｓ１×Ｂ１≧Ｆｓ２×Ｂ２×ｎ（式１）が成立することが必要である。すなわち、通常モードで１系列の録音を行うときにサンプリング周波数Ｆｓ１かつビット数Ｂ１で録音できる性能のハードウエアであれば、上記の式１が成立するように（それも左辺と右辺の値ができるだけ近くなるように）、ＭＬＲモードでのＦｓ２とＢ２とｎを選べば、通常モードを基準として構成されたそのハードウエアを無駄なく効率的に使用していることになる。

次に、レベルオーバーの検出履歴を記録する処理について説明する。

図２のＤＳＰ処理２１０内のオーバー検出２０８は、ＡＤＣ１１２によるＡ／Ｄ変換２０３およびＤＳＰ処理２１０内のレベル調整２０５におけるレベルオーバーを検出する。まずＡ／Ｄ変換２０３の出力に対しては、正側と負側のそれぞれにオーバー検出用のマージンがとってある。マージンの幅をｍとすると、正側のマージン領域は正側フルスケール値（最大値）ＭＡＸからＭＡＸ−ｍまでの範囲、負側のマージン領域は負側フルスケール値（最小値）ＭＩＮからＭＩＮ＋ｍまでの範囲である。オーバー検出２０８は、Ａ／Ｄ変換２０３の出力がこれらのマージン領域に入ったとき、アナログ処理段でのレベルオーバーが生じたと判定する。デジタル処理段のレベル調整２０５では、入力信号にＤＩゲインを乗算するが、この乗算でオーバーフローが生じることがある。オーバー検出２０８は、レベル調整２０５でのオーバーフローを検出したとき、デジタル処理段でのレベルオーバーが生じたと判定する。

図３のＤＳＰ処理３１０内のオーバー検出３０８は、ＡＤＣ１１２によるＡ／Ｄ変換３０３およびＤＳＰ処理３１０内のレベル調整３０５−１におけるレベルオーバーを検出する。レベルオーバーと判定する方式は、図２のオーバー検出２０８と同じである。結果として、通常モードの場合は、ユーザが指定した録音レベルＧＲ＝ｇ（ｄＢ）での録音経路のレベルオーバーを検出している。また、ＭＬＲモードの場合は、ユーザが指定した録音レベルＧＲ＝ｇ（ｄＢ）に対して６ｄＢ上げた録音ゲインＧ１＝ｇ＋６（ｄＢ）での録音経路のレベルオーバーを検出している。

通常モードでのオーバー検出２０８およびＭＬＲモードでのオーバー検出３０８の何れも、上記何れかのレベルオーバーを検出したとき、ＣＰＵ１０１にその旨を通知する。ＣＰＵ１０１は、そのレベルオーバーの発生タイミングを示すタイムコードをログファイルに記憶する。ログファイルは、録音データを格納するファイルと同じディレクトリに所定のファイル名で作成する。ユーザは、録音後にログファイルを参照することにより、レベルオーバーが発生した正確な位置を知ることができる。特に、ＭＬＲモードでは、録音ゲインＧ１＝ｇ＋６（ｄＢ）で録音した録音ファイル１と、録音ゲインＧ２＝ｇ（ｄＢ）で録音した録音ファイル２と、録音ゲインＧ３＝ｇ−６（ｄＢ）で録音した録音ファイル３が生成され、ログファイルで録音ファイル１でレベルオーバーが発生した位置を知ることができるので、ユーザは、録音ファイル２や３を採用してレベルオーバーの無い録音データで再生したり、録音データを編集できる装置を持つユーザであれば、録音ファイル１のレベルオーバーが発生した部分を録音ファイル２や３のデータに差し替えることができる。

なお、録音ファイル１〜３は、同一のサンプリングクロックで録音されているので、各録音ファイルの録音データの時間軸は全く同じである。従って、各録音データ中の位置はタイムコードにより正確に対応付けることができ、部分的なデータの差し替えも可能となる。タイムコードは、録音の開始時点を基準とした時刻を直接的あるいは間接的に決定できる情報であればどのようなものでもよい。

図５（ａ）は、従来のＩＣレコーダにおいてリミッターの動作が間に合わなかった様子を示す概念図である。マイク入力のアナログ信号５０１が、ＡＤ変換５０２により、量子化ビット数２４ビットでデジタル信号５０３に変換される。５０４，５０５はリミッターが動作する閾値の位置とする。リミッターが正常に動作すればクリップノイズは生じないが、突発的なレベルオーバーに対してリミッターが瞬時に対応することができない場合がある。図５（ａ）はそのようなケースであり、結果として出力された１６ビットのデジタル信号５０６はクリップノイズを含んだ音声となってしまう。

図５（ｂ）は、従来のＩＣレコーダにおいてオートゲインコントロールが作用した様子を示す概念図である。マイク入力のアナログ信号５１１が、ＡＤ変換５１２により、量子化ビット数２４ビットでデジタル信号５１３に変換される。このとき、オートゲインコントロールが、レベルが小さい音声に対して部分的にレベルを大きくするように作用している。結果として出力された１６ビットのデジタル信号５１６は、録音レベルが部分的に変化するため、全体のバランスがくずれて不自然な録音音声になることがある。

図６は、本実施形態のポケットレコーダのＭＬＲモードでの録音の様子を示す概念図である。マイク入力のアナログ信号６０１が、図３のレベル調整３０２で音量レベルを６ｄＢ落とされ、ＡＤ変換６０２により量子化ビット数２４ビットでデジタル信号に変換されるが、そのデジタル信号は３系列に分けられる。第１の系列では、トータルで録音レベルＧ１＝ｇ＋６（ｄＢ）、すなわちユーザが設定した録音レベルｇから６ｄＢ上げたゲインでレベル調整された音声データ６０３が取得され、ビット制限処理で１６ビットサンプルとされ、結果としてデジタル信号６０６が取得され、録音ファイル１に格納される。同様に、第２の系列では、録音レベルＧ２＝ｇ（ｄＢ）で録音されたデータが録音ファイル２に格納され、第３の系列では、録音レベルＧ３＝ｇ−６（ｄＢ）で録音されたデータが録音ファイル３に格納される。図６では、第１の系列でオーバーフローが発生する波形を例示したが、このときログファイルにはオーバーフローが発生した位置が記録される。

なお、上記実施形態では、ＭＬＲモードにおけるオーバー検出３０８は、録音ゲインＧ１＝ｇ＋６（ｄＢ）の録音経路のレベルオーバーを検出していたが、それに加えて他の録音ゲインＧ２，Ｇ３の録音経路のレベルオーバーを検出してログファイルに記録してもよい。また、検出したレベルオーバーがアナログ処理段またはデジタル処理段のどちらで発生したものであるかについてログファイルに記録するようにしてもよい。

さらに、レベルオーバーだけでなく、録音ゲインＧ３＝ｇ−６（ｄＢ）の録音経路についてレベルが所定値より低い範囲を検出して（さらに録音ゲインＧ２やＧ１について検出してもよいが）、ログファイルに記録してもよい。録音レベルが低すぎて、再生しても録音されている音を認識できないケースを避けたい場合、ユーザは、ログファイルを確認してレベルが低すぎる部分があることを知り、録音ゲインＧ１やＧ２の録音ファイルを採用したり、録音レベルが低すぎる範囲については、録音ゲインを上げて録音したデータに差し替えたりできる。

変形例として、アナログ信号の段階から３系列に分けて、それぞれ異なるレベル調整を行うようにしてもよい。図７は、そのような例を示す。マイク入力のアナログ信号７０１は、３系列に分けられ、第１の系列では、入力アンプ７０２により、音量レベルが６ｄＢ上げられたアナログ信号７０５とし、ＡＤＣ７０８によりデジタル信号７１１を生成してファイル１に格納する。第２、第３の系列では、それぞれ、アナログ処理段の入力アンプ７０３，７０４でゲインを０ｄＢ，−６ｄＢとしている。アンプ７０３，７０４以降の処理は、第１の系列と同じである。３つの各系列のデジタル処理段では、図３のレベル調整３０５−１〜３０５−３と同様のレベル調整が実行されるが、これらの各ＤＩゲインのゲイン値は同じとする。従って、第１から第３の系列のそれぞれのトータルの録音レベルは、上述の実施形態と同じくＧ１＝ｇ＋６、Ｇ２＝ｇ、Ｇ３＝ｇ−６となる。

また、別の変形例として、３つの感度の異なるマイクを利用して３系列の音量レベルの異なるアナログ音声信号を入力してもよい。図８は、そのような例を示す。第１の系列は高感度マイクでアナログ音声信号８０１を入力し、第２の系列は中感度マイクでアナログ音声信号８０２を入力し、第３の系列は低感度マイクでアナログ音声信号８０３を入力している。マイクの感度は、例えば中感度マイクを基準で０ｄＢとしたとき、高感度マイクは＋６ｄＢ、低感度マイクは−６ｄＢとなるようなものとすればよい。音声信号入力後の処理は、３系列とも同じトータルの録音レベルとなるようにする。

上記実施形態のＭＬＲモードや変形例では、録音レベルを６ｄＢずつ異ならせた３系列の同時録音を行っているが、異ならせるレベルは６ｄＢでなくてもよいし、系列数も３つに限らない。ただし、系列数が増えれば、それを実現できるだけの性能を持つハードウエアを用いる必要がある。上記実施形態では、ＰＣＭ形式の録音の場合にＭＬＲモードを指定できるようにしたが、ＭＰ３形式などの圧縮形式での録音の場合に同様の同時録音を行えるようにしてもよい。その場合は、複数系列で並行して当該圧縮形式にエンコードするだけの性能を備えたハードウエアを用いる必要がある。

上記実施形態のＭＬＲモードや変形例では、ＡＤＣの量子化ビット数を２４ビットとし、１６ビットにビット制限する例で説明したが、これらのビット数はこれに限らない。ただし、最終的な録音データを１６ビットＰＣＭ形式にすることにより、そのままＣＤに焼くことができるというメリットがある。

上記実施形態では、録音レベルを異ならせた３つの録音データファイルと１つのログファイルが生成される例で説明したが、予めデータ形式を決めておき、１つのファイルでこれら全てのデータを含むように構成してもよい。

１０１…中央処理装置（ＣＰＵ）、１０２…ランダムアクセスメモリ（ＲＡＭ）、１０３…内蔵フラッシュメモリ、１０４…メモリインターフェース、１０５…外部フラッシュメモリ、１０６…操作子、１０７…表示器、１０８…その他Ｉ／Ｏ、１０９…マイクロフォン（ＭＩＣ）、１１０…入力アンプ、１１１…ローパスフィルタ（ＬＰＦ）、１１２…アナログデジタル変換器（ＡＤＣ）、１１３…信号処理部（ＤＳＰ）、１１４…デジタルアナログ変換器（ＤＡＣ）、１１５…ＬＰＦ、１１６…出力アンプ、１１７…スピーカ。

Claims

入力した音声に基づくデジタル音声信号を生成して記憶手段に記録する録音装置であって、
１系列の録音を行う通常モード、またはｎ系列（ｎは３以上の整数）の録音を行うマルチ・レベル・レコーディング・モード（以下、ＭＬＲモードという）の何れかを指定する手段と、
ユーザが指定したトータルゲインの値を入力する手段と、
入力した音声に基づくアナログ音声信号を生成する手段と、
該アナログ信号に対して、前記トータルゲインの値から決定されるアナログゲインでレベル調整する手段と、
該レベル調整後のアナログ音声信号をデジタル音声信号に変換する手段と、
（１）通常モードが指定されているときは、前記デジタル音声信号を、前記トータルゲインの値から決定されるデジタルゲインでレベル調整することにより、前記ユーザが指定したトータルゲインがトータルな録音レベルになるようにレベル調整し、
（２）ＭＬＲモードが指定されているときは、前記デジタル音声信号をｎ系列に分け、前記トータルゲインの値から決定されるそれぞれ異なるデジタルゲインでレベル調整するとともに、前記ｎ系列のうちの１つの系列は、前記ユーザが指定したトータルゲインの値がトータルな録音レベルとなるように前記アナログゲインとデジタルゲインを決定し、前記ｎ系列のうちの他の系列は、少なくとも、前記ユーザが指定したトータルゲインの値を所定値増加した値がトータルな録音レベルとなるようにする系列と、前記ユーザが指定したトータルゲインの値を所定値減少させた値がトータルな録音レベルとなるようにする系列とを含むように、各系列の前記アナログゲインとデジタルゲインを決定して、レベル調整する手段と、
通常モードのときは前記レベル調整された１系列のデジタル音声信号に基づく録音データを記憶手段に記録し、ＭＬＲモードのときは前記レベル調整されたｎ系列のデジタル音声信号に基づく録音データをそれぞれ記憶手段に記録する手段と
を備え、
通常モードで選択できるサンプリング周波数の最大値がＦｓ１でサンプルビット数の最大値がＢ１であるとき、ＭＬＲモードでのサンプリング周波数Ｆｓ２とビット数Ｂ２と系列数ｎを、Ｆｓ１×Ｂ１≧Ｆｓ２×Ｂ２×ｎ（式１）が成立するように決定することを特徴とする録音装置。
入力した音声に基づくデジタル音声信号を生成して記憶手段に記録する録音装置であって、
ユーザが指定したトータルゲインの値ｇを入力する手段と、
入力した音声に基づいてアナログ音声信号を生成する手段と、
該アナログ音声信号をデジタル音声信号に変換する手段と、
該デジタル音声信号を３系列に分け、第１の系列ではトータルな録音レベルがｇ＋Δ（ただしΔは所定値）となるように、第２の系列ではトータルな録音レベルがｇとなるように、第３の系列ではトータルな録音レベルがｇ−Δとなるように、それぞれのゲインを設定して各系列で異なるゲインでレベル調整を行い、各系列毎のデジタル音声信号を取得する手段と、
該取得した３系列のデジタル音声信号に基づく録音データを、それぞれ記憶手段に記録する手段と
を備えることを特徴とする録音装置。
請求項１または２に記載の録音装置において、
少なくとも前記複数系列のデジタル音声信号のうち一番高いデジタルゲインでレベル調整された系列について、そのデジタル音声信号のレベルオーバーが生じた時間位置をログファイルに記録する手段を備えることを特徴とする録音装置。