JP2007140063A - Device for sound recording and reproducing - Google Patents

Device for sound recording and reproducing Download PDF

Info

Publication number
JP2007140063A
JP2007140063A JP2005333036A JP2005333036A JP2007140063A JP 2007140063 A JP2007140063 A JP 2007140063A JP 2005333036 A JP2005333036 A JP 2005333036A JP 2005333036 A JP2005333036 A JP 2005333036A JP 2007140063 A JP2007140063 A JP 2007140063A
Authority
JP
Japan
Prior art keywords
recording
sampling frequency
bit rate
audio
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005333036A
Other languages
Japanese (ja)
Inventor
Koji Mizobuchi
孝二 溝渕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Imaging Corp
Original Assignee
Olympus Imaging Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Imaging Corp filed Critical Olympus Imaging Corp
Priority to JP2005333036A priority Critical patent/JP2007140063A/en
Publication of JP2007140063A publication Critical patent/JP2007140063A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a device for sound recording and reproducing device which can optimize the sound recording quality according to an object of sound recording, is easy to use and is free of misoperations. <P>SOLUTION: The sound recording and reproducing device comprises a sound signal level detection unit 1, which compares an input sound signal with a specified criterion to detect a sound signal not lower than the criterion; a sound-recorded object decision unit 2 which decides the object of sound recording, based on the frequency of input of the sound signal that is not lower than the acceptance criterion detected by the sound signal level detection unit 1; a sampling frequency selection unit 3 which selects a sampling frequency, based on the decision result of the sound-recorded object decision unit 2 so as to optimize the sound recording quality; and an encoding unit 4 which encodes the input sound signal into sound data of a bit rate, corresponding to the sampling frequency selected by the sampling frequency selection unit 3. <P>COPYRIGHT: (C)2007,JPO&INPIT

Description

本発明は、録音対象の判別機能を備えた音声記録再生装置に関する。   The present invention relates to an audio recording / reproducing apparatus having a recording target discrimination function.

アナログの音声信号をデジタルの音声データに変換した後、この音声データを書換え可能な記録媒体としてのフラッシュメモリに記録する機能と、フラッシュメモリに記録された音声データをアナログ化して再生する機能とを有する携帯型の音声記録再生装置(以下、ICレコーダと称する)が1990年代後半から本格的に実用化されている。更に、近年では、上記の機能に加えて、WMA(Windows(登録商標) Media Audio)形式やMP3(MPEG-1 audio layer3)形式等の音声ファイルを高音質で再生することができるミュージックプレーヤとしてのICレコーダも製品化されている。   After converting an analog audio signal into digital audio data, the audio data is recorded in a flash memory as a rewritable recording medium, and the audio data recorded in the flash memory is converted into analog and played back. A portable audio recording / reproducing apparatus (hereinafter referred to as an IC recorder) has been put into practical use since the late 1990s. Furthermore, in recent years, in addition to the above functions, as a music player that can reproduce audio files in WMA (Windows (registered trademark) Media Audio) format and MP3 (MPEG-1 audio layer3) format with high sound quality. IC recorders have also been commercialized.

このようなICレコーダは、所定の操作部を操作することにより、録音、再生、早送り、及び早戻しなどの各種動作を選択的に実行させることができる。例えば、録音動作のときは、予めフラッシュメモリに設けられた音声データ記録領域に、デジタル信号に変換された音声データが記録され、インデックス情報記録領域に、該音声データに関するインデックス情報(音声データの記録アドレス、録音日時等の音声データに関する各種情報)が記録される。   Such an IC recorder can selectively execute various operations such as recording, reproduction, fast forward, and fast reverse by operating a predetermined operation unit. For example, during a recording operation, audio data converted into a digital signal is recorded in an audio data recording area provided in advance in a flash memory, and index information (audio data recording) about the audio data is recorded in the index information recording area. Various information regarding audio data such as address and recording date / time) is recorded.

ここで、フラッシュメモリに記録される音声データは、インデックス情報と共に音声ファイルを構成している。音声ファイルは、その後のファイル検索や再生が容易となるように、記録時に、ファイルナンバー(ファイル名)とフォルダ記号とが割り当てられる。また、フォルダは、録音毎に増え続ける音声ファイルを効率良く区分管理できるように、例えばA、B、Cフォルダのように複数設けられることが多い。更に、これら複数設けられたフォルダのうちで選択中のフォルダを操作者が認識し易いように、フォルダの選択時には、ICレコーダ本体に設けられたLCDなどの表示器に、フォルダマークをポップ表示するなどの工夫もなされている。   Here, the audio data recorded in the flash memory constitutes an audio file together with the index information. An audio file is assigned a file number (file name) and a folder symbol at the time of recording so as to facilitate subsequent file search and reproduction. In addition, a plurality of folders such as A, B, and C folders are often provided so that audio files that continue to increase every recording can be efficiently managed. Further, when selecting a folder, the folder mark is pop-displayed on a display device such as an LCD provided in the IC recorder body so that the operator can easily recognize the folder being selected from among the plurality of folders provided. The device is made.

このように、機能、性能、及び操作性においては十分に進化してきたICレコーダであるが、口述と会議(複数話者の会話、講演等)に代表されるような、録音対象に応じて録音品質を最適化する技術については、未だに操作者自身の経験と勘に頼らざるを得ない。   In this way, the IC recorder has evolved sufficiently in function, performance, and operability, but it can be recorded according to the recording target, as represented by dictation and conference (conversations, lectures, etc.). The technology for optimizing quality still has to rely on the operator's own experience and intuition.

このような問題を解決するための手法として、例えば特許文献1において提案されている記録装置では、録音対象に応じた録音時間や録音品質の切り換え選択が行われている。具体的には、操作者が指定した録音時間又は音質に応じて、最高音質で録音できる組み合わせのサンプリング周波数と圧縮率とを録音対象毎に選択することが述べられている。
特開平8−185671号公報
As a technique for solving such a problem, for example, in a recording apparatus proposed in Patent Document 1, switching selection of recording time and recording quality corresponding to a recording target is performed. Specifically, according to the recording time or sound quality designated by the operator, a combination of sampling frequency and compression rate that can be recorded with the highest sound quality is selected for each recording target.
JP-A-8-185671

ここで、上記特許文献1の提案の場合、録音開始前に操作者自身の状況判断で録音時間や音質をその都度指定しなければならない。したがって、咄嗟の録音時には、指定操作が間に合わない可能性がある。また、録音経験の浅い未熟な操作者は、録音対象と期待する録音品質(録音時間や音質等)との関連付けがイメージできないことが多く、この意味においても操作者自身に煩雑な操作を要求するのは現実的ではない。   Here, in the case of the proposal of the above-mentioned patent document 1, it is necessary to designate the recording time and the sound quality each time by the operator's own situation judgment before starting the recording. Therefore, there is a possibility that the designated operation will not be in time when recording a song. In addition, inexperienced operators who have little experience in recording often cannot imagine the relationship between the recording target and the expected recording quality (recording time, sound quality, etc.), and in this sense, the operator himself requires complicated operations. Is not realistic.

本発明は、上記の事情に鑑みてなされたものであり、録音対象に応じて録音品質を最適化することができ、かつ使い易く誤操作のない音声記録再生装置を提供することを目的とする。   The present invention has been made in view of the above circumstances, and an object of the present invention is to provide an audio recording / reproducing apparatus that can optimize recording quality according to a recording target and that is easy to use and has no erroneous operation.

上記の目的を達成するために、本発明の第1の態様による音声記録再生装置は、入力された音声信号と所定の判定基準値とを大小比較する音声信号レベル検出手段と、所定時間内に上記音声信号レベル検出手段により検出された上記判定基準値以上の音声信号の入力回数に基づいて録音対象を判定する録音対象判定手段と、上記録音対象判定手段による判定結果に基づいて録音品質が最適になるようにサンプリング周波数を選択するサンプリング周波数選択手段と、上記サンプリング周波数選択手段で選択されたサンプリング周波数に応じたビットレートの音声データに上記入力された音声信号を符号化する符号化手段とを具備することを特徴とする。   In order to achieve the above object, an audio recording / reproducing apparatus according to the first aspect of the present invention includes an audio signal level detecting means for comparing the input audio signal with a predetermined criterion value within a predetermined time. Recording target determination means for determining a recording target based on the number of times of input of an audio signal equal to or higher than the determination reference value detected by the voice signal level detection means, and the recording quality is optimal based on the determination result by the recording target determination means Sampling frequency selection means for selecting the sampling frequency so as to be, and encoding means for encoding the input audio signal into the audio data of the bit rate corresponding to the sampling frequency selected by the sampling frequency selection means It is characterized by comprising.

本発明によれば、録音対象に応じて録音品質を最適化することができ、かつ使い易く誤操作のない音声記録再生装置を提供することができる。   According to the present invention, it is possible to provide an audio recording / reproducing apparatus that can optimize recording quality according to a recording target and that is easy to use and has no erroneous operation.

以下、図面を参照して本発明の実施形態を説明する。
図1は、本発明の一実施形態に係る音声記録再生装置の主要な構成を示したブロック図である。図1に示すように、本一実施形態の音声記録再生装置は、音声信号レベル検出部1と、録音対象判定部2と、サンプリング周波数選択部3と、符号化部4とから構成されている。
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing the main configuration of an audio recording / reproducing apparatus according to an embodiment of the present invention. As shown in FIG. 1, the audio recording / playback apparatus according to the present embodiment includes an audio signal level detection unit 1, a recording target determination unit 2, a sampling frequency selection unit 3, and an encoding unit 4. .

音声信号レベル検出部1は、図示しないマイクロフォンを介して入力され、図示しないマイクアンプにより増幅された音声信号と所定の判定基準値とを大小比較し、この比較の結果、所定の判定基準値以上の音声信号を、録音対象判定部2に出力する。録音対象判定部2は、所定時間内に、音声信号レベル検出部1から入力された判定基準値以上の音声信号の入力回数を計数し、その回数に基づいて録音対象を判定する。そして、その判定結果をサンプリング周波数選択部3に出力する。サンプリング周波数選択部3は、録音対象判定部2による録音対象の判定結果に基づいて録音品質が最適になるようにサンプリング周波数を選択し、選択したサンプリング周波数を符号化部4に供給する。符号化部4は、サンプリング周波数選択部3から供給されるサンプリング周波数に応じたビットレートの音声データに音声信号を符号化する。   The audio signal level detection unit 1 compares the audio signal input through a microphone (not shown) and amplified by a microphone amplifier (not shown) with a predetermined determination reference value, and as a result of this comparison, the audio signal level detection unit 1 is equal to or greater than the predetermined determination reference value. Is output to the recording target determination unit 2. The recording target determination unit 2 counts the number of input audio signals that are equal to or greater than the determination reference value input from the audio signal level detection unit 1 within a predetermined time, and determines the recording target based on the number of times. Then, the determination result is output to the sampling frequency selection unit 3. The sampling frequency selection unit 3 selects a sampling frequency based on the determination result of the recording target by the recording target determination unit 2 so as to optimize the recording quality, and supplies the selected sampling frequency to the encoding unit 4. The encoding unit 4 encodes the audio signal into audio data having a bit rate corresponding to the sampling frequency supplied from the sampling frequency selection unit 3.

図2は、本発明の一実施形態に係る音声記録再生装置の一例としてのICレコーダの内部構成を示すブロック図である。図2に示すICレコーダは、音声を電気信号に変換するマイクロフォン(MIC)20を備えている。音声の録音時においては、マイクロフォン(MIC)20は、音声を電気信号(アナログの音声信号)に変換し、変換して得られた音声信号を後段のマイクアンプ(AMP)21に出力する。マイクアンプ(AMP)21は、マイクロフォン(MIC)20を介して入力された音声信号を増幅して、ローパスフィルタ(LPF)22に出力する。ローパスフィルタ(LPF)22は、入力された音声信号のうち、不要な周波数帯域をカットして、A/D変換器(ADC)23に出力する。A/D変換器(ADC)23は、入力された音声信号をデジタル信号に変換し、これによって得られたデジタルの音声信号を、デジタル信号処理部(DSP)24に出力する。デジタル信号処理部(DSP)24は、録音時には、システム制御部25の制御の下、A/D変換器(ADC)23で得られたデジタルの音声信号を、フレーム単位で読み出して所定の符号化フォーマットの音声データに符号化(圧縮)する。この符号化された音声データは、システム制御部25に設けられた図示しないバッファメモリに一時的に記憶される。   FIG. 2 is a block diagram showing an internal configuration of an IC recorder as an example of an audio recording / reproducing apparatus according to an embodiment of the present invention. The IC recorder shown in FIG. 2 includes a microphone (MIC) 20 that converts sound into an electrical signal. At the time of voice recording, the microphone (MIC) 20 converts the voice into an electrical signal (analog voice signal), and outputs the voice signal obtained by the conversion to the microphone amplifier (AMP) 21 at the subsequent stage. The microphone amplifier (AMP) 21 amplifies the audio signal input via the microphone (MIC) 20 and outputs the amplified audio signal to the low-pass filter (LPF) 22. The low-pass filter (LPF) 22 cuts an unnecessary frequency band from the input audio signal and outputs the cut signal to the A / D converter (ADC) 23. The A / D converter (ADC) 23 converts the input audio signal into a digital signal, and outputs the digital audio signal obtained thereby to the digital signal processing unit (DSP) 24. During recording, the digital signal processing unit (DSP) 24 reads the digital audio signal obtained by the A / D converter (ADC) 23 in units of frames and performs predetermined encoding under the control of the system control unit 25. Encode (compress) audio data in the format. The encoded audio data is temporarily stored in a buffer memory (not shown) provided in the system control unit 25.

一方、デジタル信号処理部(DSP)24は、音声の再生時には、システム制御部25の制御の下、システム制御部25の図示しないバッファメモリから、符号化された音声データをフレーム単位で読み出して復号化(伸長)し、D/A変換器(DAC)26に出力する。D/A変換器(DAC)26は、符号化された音声データをアナログ信号に変換して、ローパスフィルタ(LPF)27に出力する。ローパスフィルタ(LPF)27は、入力された音声信号のうち、不要な周波数帯域をカットして、パワーアンプ(AMP)28に出力する。パワーアンプ(AMP)28は、入力された音声信号を増幅して、スピーカ(SP)29に出力する。スピーカ(SP)29は、入力された音声信号を音声として出力する。   On the other hand, the digital signal processing unit (DSP) 24 reads the encoded audio data in units of frames from a buffer memory (not shown) of the system control unit 25 and decodes it under the control of the system control unit 25 during reproduction of the audio. (Expand) and output to the D / A converter (DAC) 26. The D / A converter (DAC) 26 converts the encoded audio data into an analog signal and outputs the analog signal to the low-pass filter (LPF) 27. The low-pass filter (LPF) 27 cuts an unnecessary frequency band from the input audio signal and outputs it to the power amplifier (AMP) 28. The power amplifier (AMP) 28 amplifies the input audio signal and outputs it to the speaker (SP) 29. The speaker (SP) 29 outputs the input audio signal as audio.

システム制御部25は、例えばCPUで構成されており、デジタル信号処理部(DSP)24以外に、記録部(メモリ)30と、操作部31と、表示部32とが接続されている。   The system control unit 25 includes, for example, a CPU, and a recording unit (memory) 30, an operation unit 31, and a display unit 32 are connected in addition to the digital signal processing unit (DSP) 24.

記録部(メモリ)30は、例えば、フラッシュメモリ等の不揮発性の半導体メモリで構成されている。録音時においては、記録部(メモリ)30には、デジタル信号処理部(DSP)24で符号化された音声データが、システム制御部25の制御の下、図示しないバッファメモリを介して記録される。このとき、音声データに関するインデックス情報も記録される。   The recording unit (memory) 30 is configured by a nonvolatile semiconductor memory such as a flash memory, for example. During recording, audio data encoded by the digital signal processing unit (DSP) 24 is recorded in the recording unit (memory) 30 through a buffer memory (not shown) under the control of the system control unit 25. . At this time, index information related to the audio data is also recorded.

操作部31は、録音スイッチ(REC)、再生スイッチ(PLAY)、停止スイッチ(STOP)、早送りスイッチ(FF)、早戻しスイッチ(REW)、メニュースイッチ(MENU)、消去スイッチ(ERASE)、ホールドスイッチ(HOLD)等の各種操作部材が機能別に設けられている。このような操作部31の操作を受けてシステム制御部25は各種動作処理を実行する。   The operation unit 31 includes a recording switch (REC), a playback switch (PLAY), a stop switch (STOP), a fast forward switch (FF), a fast reverse switch (REW), a menu switch (MENU), an erase switch (ERASE), and a hold switch. Various operation members such as (HOLD) are provided for each function. In response to such operation of the operation unit 31, the system control unit 25 executes various operation processes.

表示部32は、操作部31に含まれる何れかの操作を受けて所定の処理が開始されたときに、本ICレコーダの動作モード、又はそれら動作モードにおけるその後の動作状況を表示する。例えば、操作者により録音スイッチ(REC)が押された場合に、表示部32は、録音の経過時間、録音可能な残り時間、及びファイルナンバー等を表示する。また、操作者によりメニュースイッチ(MENU)が押された場合に、表示部32は、マイク感度の選択(高/低)、録音モードの選択(自動/標準/ロング)、及びアラームの選択(オン/オフ)等の本ICレコーダの機能選択に関連した表示を行う。更に、システム制御部25が時計機能を有しているときは、表示部32は、現在日時のカレンダー表示も行う。   When a predetermined process is started in response to any operation included in the operation unit 31, the display unit 32 displays an operation mode of the IC recorder or a subsequent operation state in the operation mode. For example, when the recording switch (REC) is pressed by the operator, the display unit 32 displays the elapsed recording time, the remaining recording time, the file number, and the like. In addition, when the menu switch (MENU) is pressed by the operator, the display unit 32 selects the microphone sensitivity (high / low), the recording mode (automatic / standard / long), and the alarm selection (on). Display related to the function selection of this IC recorder such as / off). Further, when the system control unit 25 has a clock function, the display unit 32 also displays a calendar of the current date and time.

次に、図2に示す構成を有するICレコーダのメイン動作について図3を参照しながら説明する。図3は、図2のICレコーダのメイン動作を示すフローチャートである。   Next, the main operation of the IC recorder having the configuration shown in FIG. 2 will be described with reference to FIG. FIG. 3 is a flowchart showing the main operation of the IC recorder of FIG.

図示しないパワースイッチの操作等により、本ICレコーダがパワーオンされると、図3に示すように、システム制御部25は、所定の初期設定を行う(S1)。初期設定の終了後に、システム制御部25は、図示しないタイマの計時をスタートさせる(S2)。このタイマは、所定時間経過後に、本ICレコーダが通常の動作モードから待機モード(低消費電流モード)に入るための時間を計時するためのタイマである。   When the IC recorder is powered on by operating a power switch (not shown) or the like, as shown in FIG. 3, the system control unit 25 performs predetermined initial settings (S1). After the end of the initial setting, the system control unit 25 starts counting a timer (not shown) (S2). This timer is a timer for measuring the time for the IC recorder to enter the standby mode (low current consumption mode) from the normal operation mode after a predetermined time has elapsed.

S2のタイマスタートの後、システム制御部25は、S3〜S9に示すスイッチ検出処理を行う。即ち、システム制御部25は、録音スイッチ(REC)がオンされたか否か(S3)、再生スイッチがオンされたか否か(S4)、早送りスイッチ(FF)がオンされたか否か(S5)、早戻しスイッチ(REW)がオンされたか否か(S6)、停止スイッチ(STOP)がオンされたか否か(S7)、メニュースイッチ(MENU)がオンされたか否か(S8)、及び消去スイッチ(ERASE)がオンされたか否か(S9)を順次判定する。   After the timer start in S2, the system control unit 25 performs a switch detection process shown in S3 to S9. That is, the system controller 25 determines whether the recording switch (REC) is turned on (S3), whether the playback switch is turned on (S4), whether the fast-forward switch (FF) is turned on (S5), Whether the rewind switch (REW) is turned on (S6), whether the stop switch (STOP) is turned on (S7), whether the menu switch (MENU) is turned on (S8), and the erase switch ( It is sequentially determined whether or not (ERASE) is turned on (S9).

S3〜S9の判定において、全てのスイッチがオフである場合には、S10に進み、システム制御部25は、タイマの計時時間が所定時間をオーバしたか否かを判定する(S10)。S10の判定において、タイマの計時時間が所定時間をオーバしていない場合には、S3に戻り、S3〜S9のスイッチ検出処理を継続する。一方、S10の判定において、タイマの計時時間が所定時間をオーバしている場合には、S10をS11に分岐して、システム制御部25は、待機モードのサブルーチン処理を行う(S11)。待機モードに入ると本ICレコーダが低電流動作になる。具体的には、図2のマイクロフォン(MIC)20、マイクアンプ(AMP)21、ローパスフィルタ(LPF)22、A/D変換器(ADC)23、デジタル信号処理部(DSP)24、D/A変換器(DAC)26、ローパスフィルタ(LPF)27、パワーアンプ(AMP)28、記録部(メモリ)30、表示部32への電源供給を遮断する、或いは図2の各ブロックを構成する図示しないICに設けられているチップイネーブル端子に、システム制御部25から非選択信号を出力することにより、低消費電流状態とする。このとき、システム制御部25のCPUは、自らも動作クロックを最も消費電流の少ない低速クロックに切り換えて低消費電流状態になる。場合によっては、動作クロックをメインクロック(例えば、16.384MHz)からサブクロック(例えば、32.768kHz)に切り換えて、その後スイッチ入力が検出されるまで、メインクロックを完全に停止させても良い。   If it is determined in S3 to S9 that all the switches are off, the process proceeds to S10, and the system control unit 25 determines whether or not the time counted by the timer has exceeded a predetermined time (S10). If it is determined in S10 that the time counted by the timer does not exceed the predetermined time, the process returns to S3, and the switch detection process in S3 to S9 is continued. On the other hand, if it is determined in S10 that the time counted by the timer exceeds the predetermined time, S10 is branched to S11, and the system control unit 25 performs a standby mode subroutine process (S11). When the standby mode is entered, the IC recorder operates at a low current. Specifically, the microphone (MIC) 20, microphone amplifier (AMP) 21, low-pass filter (LPF) 22, A / D converter (ADC) 23, digital signal processor (DSP) 24, D / A in FIG. The power supply to the converter (DAC) 26, the low-pass filter (LPF) 27, the power amplifier (AMP) 28, the recording unit (memory) 30, and the display unit 32 is cut off, or each block of FIG. By outputting a non-selection signal from the system control unit 25 to a chip enable terminal provided in the IC, a low current consumption state is obtained. At this time, the CPU of the system control unit 25 itself switches to the low-speed clock with the least current consumption by switching the operation clock to the low current consumption state. In some cases, the operation clock may be switched from a main clock (for example, 16.384 MHz) to a sub clock (for example, 32.768 kHz), and then the main clock may be completely stopped until a switch input is detected.

ここで、待機モード中に、ユーザによって何らかのスイッチ操作がなされた場合には、S2に戻り、メイン動作の処理が再開される。   Here, if any switch operation is performed by the user during the standby mode, the process returns to S2 and the processing of the main operation is resumed.

また、S3の判定において、録音スイッチがオンされた場合には、S3をS12に分岐して、システム制御部25は、録音処理のサブルーチンを実行する(S12)。この録音処理については後述する。また、S4の判定において、再生スイッチがオンされた場合には、S4をS13に分岐して、システム制御部25は、再生処理のサブルーチンを実行する(S13)。また、S5の判定において、早送りスイッチがオンされた場合には、S5をS14に分岐して、システム制御部25は、早送り処理のサブルーチンを実行する(S14)。また、S6の判定において、早戻しスイッチがオンされた場合には、S6をS15に分岐して、システム制御部25は、早戻し処理のサブルーチンを実行する(S15)。また、S7の判定において、停止スイッチがオンされた場合には、S7をS16に分岐して、システム制御部25は、停止処理のサブルーチンを実行する(S16)。また、S8の判定において、メニュースイッチがオンされた場合には、S8をS17に分岐して、システム制御部25は、メニュー変更処理のサブルーチンを実行する(S17)。また、S9の判定において、消去スイッチがオンされた場合には、S9をS18に分岐して、システム制御部25は、消去処理のサブルーチンを実行する(S18)。これら何れかのサブルーチンの実行後、システム制御部25は、上記タイマを再スタートさせて(S19)、S3に戻る。   If it is determined in S3 that the recording switch is turned on, S3 is branched to S12, and the system control unit 25 executes a recording processing subroutine (S12). This recording process will be described later. If it is determined in S4 that the regeneration switch is turned on, S4 is branched to S13, and the system control unit 25 executes a subroutine for the regeneration process (S13). If it is determined in step S5 that the fast forward switch is turned on, step S5 is branched to step S14, and the system control unit 25 executes a fast forward processing subroutine (S14). If it is determined in S6 that the fast reverse switch is turned on, S6 is branched to S15, and the system control unit 25 executes a subroutine of the fast reverse process (S15). If it is determined in S7 that the stop switch is turned on, S7 is branched to S16, and the system control unit 25 executes a subroutine for stop processing (S16). If it is determined in S8 that the menu switch is turned on, S8 is branched to S17, and the system control unit 25 executes a menu change processing subroutine (S17). If it is determined in S9 that the erasure switch is turned on, S9 is branched to S18, and the system control unit 25 executes a subroutine for erasure processing (S18). After executing any of these subroutines, the system control unit 25 restarts the timer (S19) and returns to S3.

ここで、S13の再生処理、S14の早送り処理、S15の早戻し処理、S16の停止処理、S17のメニュー変更処理、及びS18の消去処理の各処理は、周知の技術手段を用いて実施できるものであり、また、本一実施形態の内容に直接関係しないので、ここでの詳しい説明は省略する。   Here, each of the reproduction process of S13, the fast-forward process of S14, the fast-rewind process of S15, the stop process of S16, the menu change process of S17, and the erase process of S18 can be performed using known technical means. In addition, since it is not directly related to the contents of the present embodiment, detailed description thereof is omitted here.

次に、本一実施形態の音声記録再生装置の録音処理について更に説明する。図4は、図2の構成のうちで、特に録音処理に係る詳細な構成について示す図である。   Next, the recording process of the audio recording / reproducing apparatus of this embodiment will be further described. FIG. 4 is a diagram showing a detailed configuration related to the recording process among the configurations of FIG.

図2のマイクロフォン(MIC)20から出力される音声信号(VIN)は、オペアンプ40、コンデンサC1及びC2、抵抗R1及びR2で構成された増幅回路(上記マイクアンプ(AMP)21に対応している)21に入力される。この図4の増幅回路21では、入力された音声信号(VIN)がおよそR2/R1倍に増幅され、これによって得られた音声信号(VLO)がローパスフィルタ(LPF)22に出力される。   The audio signal (VIN) output from the microphone (MIC) 20 in FIG. 2 corresponds to the amplifier circuit (the microphone amplifier (AMP) 21) configured by the operational amplifier 40, capacitors C1 and C2, and resistors R1 and R2. ) 21. In the amplifier circuit 21 of FIG. 4, the input audio signal (VIN) is amplified approximately R2 / R1 times, and the audio signal (VLO) obtained thereby is output to the low-pass filter (LPF) 22.

ここで、増幅によって得られた音声信号(VLO)の振幅が後述するA/D変換器23の入力ダイナミックレンジを超えないように、増幅回路21の入出力間には、負帰還回路で構成されたオートゲインコントローラ(AGC)42が付加されている。このオートゲインコントローラ(AGC)42によって、A/D変換器23への音声信号の過入力が自動的に抑制される。   Here, a negative feedback circuit is formed between the input and output of the amplifier circuit 21 so that the amplitude of the audio signal (VLO) obtained by amplification does not exceed the input dynamic range of the A / D converter 23 described later. An auto gain controller (AGC) 42 is added. The auto gain controller (AGC) 42 automatically suppresses excessive input of the audio signal to the A / D converter 23.

ローパスフィルタ(LPF)22は、サンプリング周波数の半分以下、例えばサンプリング周波数のおよそ0.45倍、のカットオフ周波数で動作するアンチエイリアス用のフィルタである。増幅回路21から出力される音声信号(VLO)は、ローパスフィルタ(LPF)22を通過することにより、量子化に不必要な高い周波数帯域の音声信号が減衰除去される。このローパスフィルタ(LPF)22を通過した、カットオフ周波数よりも低い周波数帯域の音声信号は、後段のA/D変換器(ADC)23において、サンプリング周期(サンプリング周波数の逆数である)毎に量子化(A/D変換)される。このときの量子化ビット数は少なくとも14ビット以上である。A/D変換器(ADC)23で得られたデジタル音声信号はデジタル信号処理部(DSP)24とマグニチュードコンパレータ45とに出力される。   The low-pass filter (LPF) 22 is an antialiasing filter that operates at a cut-off frequency that is half or less of the sampling frequency, for example, approximately 0.45 times the sampling frequency. The audio signal (VLO) output from the amplifier circuit 21 passes through a low-pass filter (LPF) 22, so that an audio signal in a high frequency band unnecessary for quantization is attenuated and removed. The audio signal in the frequency band lower than the cut-off frequency that has passed through the low-pass filter (LPF) 22 is quantized every sampling period (which is the reciprocal of the sampling frequency) in the A / D converter (ADC) 23 in the subsequent stage. (A / D conversion). The number of quantization bits at this time is at least 14 bits. The digital audio signal obtained by the A / D converter (ADC) 23 is output to the digital signal processing unit (DSP) 24 and the magnitude comparator 45.

ところで、ローパスフィルタ(LPF)22、A/D変換器(ADC)23、及びデジタル信号処理部(DSP)24には、サンプリング周波数として高ビットレート用fs、または低ビットレート用fsの何れか1波のみが供給される。即ち、システム制御部25を構成するCPU47からセレクタ46に入力されるfs選択信号により、ビットレートに応じたサンプリング周波数が択一的に、ローパスフィルタ(LPF)22、A/D変換器(ADC)23、及びデジタル信号処理部(DSP)24に供給される。つまり、CPU47とセレクタ46とで図1のサンプリング周波数選択部3を構成している。ここで、高ビットレート用fsは、低ビットレート用fsよりも高い周波数であるとする。   By the way, in the low pass filter (LPF) 22, the A / D converter (ADC) 23, and the digital signal processing unit (DSP) 24, either one of fs for high bit rate or fs for low bit rate is used as the sampling frequency. Only waves are supplied. That is, the sampling frequency corresponding to the bit rate is alternatively selected from the low frequency filter (LPF) 22 and the A / D converter (ADC) according to the fs selection signal input from the CPU 47 constituting the system control unit 25 to the selector 46. 23 and a digital signal processing unit (DSP) 24. That is, the CPU 47 and the selector 46 constitute the sampling frequency selection unit 3 in FIG. Here, it is assumed that the high bit rate fs has a higher frequency than the low bit rate fs.

図1の符号化部4に対応するデジタル信号処理部(DSP)24においては、CPU47によって予め指定された音声データの圧縮率とセレクタ46において選択されたサンプリング周波数の組み合わせとに従って、デジタル音声信号が所定ビットレートの音声データに符号化される。   In the digital signal processing unit (DSP) 24 corresponding to the encoding unit 4 in FIG. 1, the digital audio signal is converted according to the combination of the audio data compression rate specified in advance by the CPU 47 and the sampling frequency selected by the selector 46. It is encoded into audio data of a predetermined bit rate.

もちろん言うまでもなく、セレクタ46において選択できるサンプリング周波数は2波に限るものではなく、例えば、3波以上の固定周波数の中から選択できるようにしても良い。また、セレクタ46の代わりにPLLを用いて任意の周波数を供給できるようにしても良い。このように供給できるサンプリング周波数の数を増やすことにより、幅広いビットレートの選択に対応させることができる。   Of course, the sampling frequency that can be selected by the selector 46 is not limited to two waves, and may be selected from, for example, three or more fixed frequencies. Further, an arbitrary frequency may be supplied using a PLL instead of the selector 46. By increasing the number of sampling frequencies that can be supplied in this way, it is possible to cope with a wide selection of bit rates.

また、図1の音声信号レベル検出部1に対応するマグニチュードコンパレータ45では、A/D変換器(ADC)23から出力されるデジタル音声信号が所定の上側閾値(+VTH)及び下側閾値(−VTH)に対してどれだけ大きいか又は小さいかの大小比較が、サンプリング周期毎に行われる。マグニチュードコンパレータ45での検出結果は、CPU47に音声信号レベル検出信号として出力される。   Further, in the magnitude comparator 45 corresponding to the audio signal level detection unit 1 of FIG. 1, the digital audio signal output from the A / D converter (ADC) 23 is a predetermined upper threshold (+ VTH) and lower threshold (−VTH). A comparison is made at each sampling period. The detection result of the magnitude comparator 45 is output to the CPU 47 as an audio signal level detection signal.

具体的には、図5に示す、A/D変換器23のダイナミックレンジ内(VCC>ADIN(MAX)、ADIN(MIN)>GND)で、オペアンプ40の動作基準電圧(AVREF)を基準として対称に振動している部分の音声信号(VLO)の大小比較を行う。この大小比較において、図2のマイクロフォン(MIC)20に入力される音声が大きいときには、音声信号(VLO)が上側閾値(+VTH)及び下側閾値(−VTH)をそれぞれ超えた振幅で振動するので、マグニチュードコンパレータ45からは、ADIN(MAX)>VLO≧+VTH、及び−VTH≧VLO>ADIN(MIN)であることを示す音声信号レベル検出信号が出力される。逆に、図2のマイクロフォン(MIC)20に入力される音声が比較的小さいときには、音声信号(VLO)が上側閾値(+VTH)と下側閾値(−VTH)の範囲内の振幅で振動するので、マグニチュードコンパレータ45からは、+VTH>VLO>−VTHであることを示す音声信号レベル検出信号が出力される。   Specifically, it is symmetric with respect to the operation reference voltage (AVREF) of the operational amplifier 40 within the dynamic range (VCC> ADIN (MAX), ADIN (MIN)> GND) of the A / D converter 23 shown in FIG. The size of the audio signal (VLO) of the portion that vibrates is compared. In this size comparison, when the sound input to the microphone (MIC) 20 in FIG. 2 is loud, the sound signal (VLO) vibrates with an amplitude exceeding the upper threshold (+ VTH) and the lower threshold (−VTH). The magnitude comparator 45 outputs audio signal level detection signals indicating that ADIN (MAX)> VLO ≧ + VTH and −VTH ≧ VLO> ADIN (MIN). Conversely, when the sound input to the microphone (MIC) 20 of FIG. 2 is relatively small, the sound signal (VLO) vibrates with an amplitude within the range of the upper threshold value (+ VTH) and the lower threshold value (−VTH). The magnitude comparator 45 outputs an audio signal level detection signal indicating that + VTH> VLO> −VTH.

以下、図6を参照して録音処理について説明する。図6は録音処理について示すフローチャートである。図6の処理は、システム制御部25内のCPU47によって行われるが、ここではシステム制御部25が行うとして以下の説明を続ける。   Hereinafter, the recording process will be described with reference to FIG. FIG. 6 is a flowchart showing the recording process. The processing in FIG. 6 is performed by the CPU 47 in the system control unit 25. Here, the following description will be continued assuming that the system control unit 25 performs the processing.

録音処理が開始すると、システム制御部25は、最初にマイク感度(高/低)、録音モード(自動/標準/ロング)、ファイルナンバー、及び音声データを記録する音声データ記録領域における記録開始アドレス等の各種情報をインデックス情報記録領域に記録する(S30)。ここで、録音モードは、操作者が意図的に「標準」又は「ロング」を選択していない限りは「自動」が選択されるものである。   When the recording process starts, the system control unit 25 first sets the microphone sensitivity (high / low), the recording mode (automatic / standard / long), the file number, the recording start address in the audio data recording area for recording the audio data, and the like. Are recorded in the index information recording area (S30). Here, “automatic” is selected as the recording mode unless the operator intentionally selects “standard” or “long”.

次に、システム制御部25は、LBRフラグを0にクリアし(S31)、更にRJFフラグを0にクリアする(S32)。ここで、LBRフラグは、後述する録音対象判定処理において、高ビットレート用fsから低ビットレート用fsへの切り換えが行われたときにセットされるサインフラグである。また、RJFフラグは、録音対象判定処理が完了したときにセットされるサインフラグである。   Next, the system control unit 25 clears the LBR flag to 0 (S31), and further clears the RJF flag to 0 (S32). Here, the LBR flag is a sign flag that is set when switching from a high bit rate fs to a low bit rate fs is performed in a recording target determination process described later. The RJF flag is a sign flag that is set when the recording target determination process is completed.

S32の後に、システム制御部25は、サンプリング周波数として高ビットレート用fsが選択されるように、fs選択信号を出力する(S33)。つまり、録音モードが「自動」である場合には録音動作開始時に必ず高ビットレート用fsが選択される。なお、本一実施形態では録音モード「標準」の場合が高ビットレート用fsに対応し、「ロング」の場合が低ビットレート用fsに対応している。   After S32, the system control unit 25 outputs the fs selection signal so that the high bit rate fs is selected as the sampling frequency (S33). That is, when the recording mode is “automatic”, the high bit rate fs is always selected at the start of the recording operation. In the present embodiment, the recording mode “standard” corresponds to the high bit rate fs, and the “long” case corresponds to the low bit rate fs.

以上の処理の後、マイクロフォン(MIC)20から出力されたアナログの音声信号がサンプリング周期毎に量子化(A/D変換)される(S34)。この後、システム制御部25は、RJFフラグの状態判定を行う(S35)。S35の判定において、RJFフラグ=0のときは、S41以後の録音対象判定のシーケンスに移行する。録音対象判定のシーケンスにおいては、まず図4のマグニチュードコンパレータ45により、量子化された音声信号のレベル検出がサンプリング周期毎に行われる(S41)。ここで、S41の音声信号のレベル検出は、録音開始からごく僅かな所定時間、例えば録音開始から30秒間程度行えば良い。次に、システム制御部25は、録音開始から上記所定時間が経過したか否かを判定する(S42)。S42の判定において、所定時間が経過していない場合には、S34に戻る。   After the above processing, the analog audio signal output from the microphone (MIC) 20 is quantized (A / D conversion) for each sampling period (S34). Thereafter, the system control unit 25 determines the state of the RJF flag (S35). If the RJF flag = 0 in the determination of S35, the process proceeds to the recording target determination sequence after S41. In the recording target determination sequence, first, the level of the quantized audio signal is detected every sampling period by the magnitude comparator 45 of FIG. 4 (S41). Here, the level detection of the audio signal in S41 may be performed for a very short predetermined time from the start of recording, for example, about 30 seconds from the start of recording. Next, the system control unit 25 determines whether or not the predetermined time has elapsed since the start of recording (S42). If it is determined at S42 that the predetermined time has not elapsed, the process returns to S34.

一方、S42の判定において、所定時間が経過した場合には、S42をS43に分岐して、システム制御部25は、S42の所定時間内に採集した音声信号レベル検出信号を基にして録音対象を判定する(S43)。具体的には、S42の所定時間内に採集された音声信号レベル検出信号のうちで所定レベル以上(例えば、ADIN(MAX)>VLO≧+VTH、及び−VTH≧VLO>ADIN(MIN))の音声信号レベル検出信号の検出回数により録音対象を判定する。   On the other hand, when the predetermined time has passed in the determination of S42, S42 is branched to S43, and the system control unit 25 selects the recording target based on the audio signal level detection signal collected within the predetermined time of S42. Determine (S43). More specifically, the audio having a level equal to or higher than a predetermined level (for example, ADIN (MAX)> VLO ≧ + VTH and −VTH ≧ VLO> ADIN (MIN)) among the audio signal level detection signals collected within the predetermined time of S42. The recording target is determined by the number of detections of the signal level detection signal.

ここで、録音対象は、少なくとも「会議録音」と「口述録音」とに大別できれば良い。一般に、「会議録音」の場合は、マイクロフォン(MIC)20に入感する音声が弱く小さいので、所定レベル以上の音声信号レベル検出信号の検出回数が少なくなる。逆に、「口述録音」の場合は、マイクロフォン(MIC)20に入感する音声が強く大きいので、所定レベル以上の音声信号レベル検出信号の検出回数が「会議録音」に比べて多くなる。そこで、S43においては、説明を簡単にするために、所定レベル以上の音声信号レベル検出信号の検出回数が所定回数以上である場合には、録音対象が「口述録音」であり、そうでない場合には録音対象が「会議録音」であると判定する。   Here, it is only necessary to roughly divide recording targets into “conference recording” and “dictation recording”. In general, in the case of “conference recording”, since the sound perceived by the microphone (MIC) 20 is weak and small, the number of detections of the audio signal level detection signal above a predetermined level is reduced. On the other hand, in the case of “dictation recording”, since the sound perceived by the microphone (MIC) 20 is strong and loud, the number of detections of the audio signal level detection signal equal to or higher than a predetermined level is larger than that in “conference recording”. Therefore, in S43, in order to simplify the explanation, when the number of detections of the audio signal level detection signal equal to or higher than the predetermined level is equal to or higher than the predetermined number, the recording target is “oral recording”; Determines that the recording target is “conference recording”.

なお、S42の所定時間内に採集した所定レベル以上の音声信号レベル検出信号の検出回数と録音対象毎に実測された所定レベル以上の音声信号レベル検出信号の検出回数の平均値とを比較することにより録音対象を判定しても良い。この場合には、システム制御部25は、所定時間内に採集された所定レベル以上の音声信号レベル検出信号の検出回数に最も近い検出回数平均値を検出し、この検出回数平均値に対応する録音対象を現在の録音対象と判定する。ここで、録音対象毎に実測された所定レベル以上の音声信号レベル検出信号の検出回数平均値は、フィールドテスト等の実測によって求めれば良く、システム制御部25内のCPU47に設けられた図示しないプログラムメモリに既定値として記憶させておけば良い。   Note that the number of detections of the audio signal level detection signal of the predetermined level or higher collected within the predetermined time of S42 is compared with the average value of the number of detections of the audio signal level detection signal of the predetermined level or higher actually measured for each recording target. The recording target may be determined by the above. In this case, the system control unit 25 detects the average number of detection times closest to the number of detections of the audio signal level detection signal of a predetermined level or higher collected within a predetermined time, and the recording corresponding to this detection number average value. Determine the target as the current recording target. Here, the average number of detection times of the audio signal level detection signal of a predetermined level or more actually measured for each recording target may be obtained by actual measurement such as a field test, and a program (not shown) provided in the CPU 47 in the system control unit 25. It can be stored in memory as a default value.

更に録音対象の判定精度の向上を狙うなら、音声信号の検出レベルの閾値を複数設けたり、音声信号の検出間隔及び検出回数等を統計的に算術処理して、モデル的な録音対象との相関性から録音対象を類推しても良い。   Furthermore, if you want to improve the accuracy of judgment of the recording target, set multiple thresholds for the detection level of the audio signal, or perform statistical arithmetic processing on the detection interval and the number of detections of the audio signal, and correlate with the model recording target. The recording target may be inferred from the gender.

S43の判定において、所定レベル以上の音声信号レベル検出信号の検出回数が所定回数以上でない場合には、S43をS44に分岐して、システム制御部25は、録音対象が「会議録音」であると判定する。「会議録音」の場合は、マイクロフォン(MIC)20に入感する音声が弱く小さいので、録音環境下の雰囲気や複数話者の声の重畳がクリアに録音できるように、サンプリング周波数として高ビットレート用fsが選択されるように、fs選択信号を出力する(S44)。その後、S47に移行する。一方、S43の判定において、所定レベル以上の音声信号レベル検出信号の検出回数が所定回数以上である場合には、S43をS45に分岐して、システム制御部25は、録音対象が「口述録音」であると判定する。「口述録音」の場合は、マイクロフォン(MIC)20に入感する音声が強く大きいので、サンプリング周波数として低ビットレート用fsが選択されるように、fs選択信号を出力する(S45)。低ビットレート用fs選択時には、LBRフラグを1にセットする(S46)。   If it is determined in S43 that the number of detections of the audio signal level detection signal equal to or higher than the predetermined level is not equal to or higher than the predetermined number, S43 is branched to S44, and the system control unit 25 determines that the recording target is “conference recording”. judge. In the case of “conference recording”, since the sound perceived by the microphone (MIC) 20 is weak and small, a high bit rate is used as a sampling frequency so that the atmosphere in the recording environment and the superposition of voices of multiple speakers can be recorded clearly. An fs selection signal is output so that fs for use is selected (S44). Thereafter, the process proceeds to S47. On the other hand, if it is determined in S43 that the number of detections of the audio signal level detection signal equal to or higher than the predetermined level is equal to or higher than the predetermined number, S43 is branched to S45, and the system control unit 25 determines that the recording target is “dictation recording”. It is determined that In the case of “dictation recording”, since the sound perceived by the microphone (MIC) 20 is strong and loud, an fs selection signal is output so that the low bit rate fs is selected as the sampling frequency (S45). When the low bit rate fs is selected, the LBR flag is set to 1 (S46).

以上の処理の後、システム制御部25は、RJFフラグを1にセットして(S47)、S34に戻る。   After the above processing, the system control unit 25 sets the RJF flag to 1 (S47) and returns to S34.

一方、S35の判定において、RJFフラグが1の場合には、S35をS36に分岐して、デジタル信号処理部(DSP)24による符号化が行われ、これによって得られた音声データが記録部(メモリ)30に記録される(S36)。ここで、符号化そのものはフレーム単位で、音声データ所定フレーム数に達するまで連続的に行われる。つまり、CPU47の図示しないバッファメモリに記憶された音声データが所定フレーム数に達した場合に、これら所定フレーム数の音声データが記録部(メモリ)30の音声データ記録領域に記録される。例えば、14ビット/フレームの音声信号を4ビット/フレームまで符号化した音声データを記録部(メモリ)30へ512バイト単位で書き込む場合、所定フレーム数は1024になる。   On the other hand, if it is determined in S35 that the RJF flag is 1, S35 is branched to S36, and encoding is performed by the digital signal processing unit (DSP) 24, and the audio data obtained thereby is recorded in the recording unit ( (Memory) 30 (S36). Here, encoding itself is continuously performed in units of frames until a predetermined number of frames of audio data is reached. That is, when the audio data stored in the buffer memory (not shown) of the CPU 47 reaches a predetermined number of frames, the predetermined number of frames of audio data are recorded in the audio data recording area of the recording unit (memory) 30. For example, when audio data obtained by encoding an audio signal of 14 bits / frame up to 4 bits / frame is written to the recording unit (memory) 30 in units of 512 bytes, the predetermined number of frames is 1024.

次に、システム制御部25は、停止スイッチがオンされたか否かを判定する(S37)。S37の判定において、停止スイッチがオンされるまで、S34からS36の処理が繰り返される。一方、S37の判定において、停止スイッチがオンされた場合には、S37をS38に分岐して、システム制御部25は、LBRフラグの状態判定を行う(S38)。S38の判定において、LBRフラグ=0のときは、システム制御部25は、そのまま録音終了処理を実行して(S40)、録音を終了する。   Next, the system control unit 25 determines whether or not the stop switch is turned on (S37). In the determination of S37, the processes of S34 to S36 are repeated until the stop switch is turned on. On the other hand, if it is determined in S37 that the stop switch is turned on, S37 is branched to S38, and the system control unit 25 determines the state of the LBR flag (S38). In the determination of S38, when the LBR flag = 0, the system control unit 25 executes the recording end process as it is (S40) and ends the recording.

一方、S38の判定において、LBRフラグ=1のときは、高ビットレート用fsでの録音がなされた録音開始からS42の所定時間経過までの間の音声データを、所定時間経過後に録音した音声データと等価な低ビットレート用fsの音声データに変換する(S39)。その後にシステム制御部25は、録音終了処理を実行して(S40)、録音を終了する。ここで、例えば、サンプリング周波数が、高ビットレート用fs=16kHz、低ビットレート用fs=8kHzのとき、もしワークエリアとして利用できるメモリ容量に余裕があるならば、録音開始から所定時間経過までの量子化後のデジタル音声信号を、図4のCPU47に設けられたバッファメモリ、または図2の記録部(メモリ)30に一時的に記憶しても良い。例えば、上記所定時間を30秒とすると、30秒間の14ビットのデジタル音声信号の書き込みに必要なメモリ容量は、僅かに(14ビット×16kHz×30秒)÷8ビット=840kバイトである。仮に記録部(メモリ)30の容量が1Gバイトもあれば、840kバイトの消費は0.1%以下であり、音声データの記録(即ち録音時間)を著しく圧迫することはない。   On the other hand, in the determination at S38, when the LBR flag = 1, the audio data from the start of recording at the high bit rate fs to the elapse of the predetermined time in S42 is the audio data recorded after the elapse of the predetermined time. Is converted into low bit rate fs audio data equivalent to (S39). Thereafter, the system control unit 25 executes a recording end process (S40) and ends the recording. Here, for example, when the sampling frequency is fs = 16 kHz for high bit rate and fs = 8 kHz for low bit rate, if there is a margin in the memory capacity that can be used as a work area, a predetermined time elapses from the start of recording. The quantized digital audio signal may be temporarily stored in a buffer memory provided in the CPU 47 in FIG. 4 or a recording unit (memory) 30 in FIG. For example, if the predetermined time is 30 seconds, the memory capacity required for writing a 14-bit digital audio signal for 30 seconds is slightly (14 bits × 16 kHz × 30 seconds) ÷ 8 bits = 840 kbytes. If the capacity of the recording unit (memory) 30 is 1 Gbyte, the consumption of 840 kbytes is 0.1% or less, and recording of audio data (that is, recording time) is not significantly compressed.

また、低ビットレートの音声データへの変換は、例えば記録部(メモリ)30のワークエリアに一時的に書き込まれたデジタル音声信号を先頭アドレスから順次読み出し、デジタル信号処理部(DSP)24で低ビットレート用fs=8kHzに対応した符号化を行ってから、記録部(メモリ)30において対応するファイルナンバーの音声データ記録領域に、変換後の音声データを順次再記録すれば良い。もちろん、デジタル信号処理部(DSP)24の処理能力が高ければ、記録部(メモリ)30の音声データ記録領域から直接的に変換対象の音声データを読み出し、デジタル信号処理部(DSP)24で低ビットレート用fsに対応した音声データに変換して記録部(メモリ)30に再記録しても良い。例えば、MP3形式で録音した録音時間が30秒、ビットレートが64kbpsの音声データを、低ビットレートの32kbpsの音声データに再符号化する場合も、数秒以内に上記一連の処理が完了すれば、操作者がストレスを感じることはない。   The conversion to low bit rate audio data is performed, for example, by sequentially reading the digital audio signals temporarily written in the work area of the recording unit (memory) 30 from the head address, and the digital signal processing unit (DSP) 24 reducing the audio data. After encoding corresponding to bit rate fs = 8 kHz, the converted audio data may be sequentially re-recorded in the audio data recording area of the corresponding file number in the recording unit (memory) 30. Of course, if the processing capability of the digital signal processing unit (DSP) 24 is high, the audio data to be converted is read directly from the audio data recording area of the recording unit (memory) 30 and the digital signal processing unit (DSP) 24 reduces the data. It may be converted into audio data corresponding to the bit rate fs and re-recorded in the recording unit (memory) 30. For example, when re-encoding audio data with a recording time of 30 seconds and a bit rate of 64 kbps recorded in MP3 format into audio data with a low bit rate of 32 kbps, if the above-described series of processing is completed within a few seconds, The operator does not feel stress.

ここで、音声データに関する録音モード(標準/ロング)、音声データ記録領域における記録開始アドレス等の各種インデックス情報の更新は、S39の低ビットレートへの変換終了後に行う。   Here, the update of various index information such as the recording mode (standard / long) relating to the audio data and the recording start address in the audio data recording area is performed after the conversion to the low bit rate in S39.

以上の説明のように、本一実施形態によれば、録音時に、録音対象に最適なビットレートが自動的に選択されるので、操作者は録音行為に集中することができる。また、録音対象毎に、録音品質が一定に保たれるので、メモリ使用に無駄が生じない。   As described above, according to the present embodiment, the optimum bit rate for the recording target is automatically selected during recording, so that the operator can concentrate on the recording action. Further, since the recording quality is kept constant for each recording target, there is no waste in using the memory.

以上実施形態に基づいて本発明を説明したが、本発明は上記した実施形態に限定されるものではなく、本発明の要旨の範囲内で種々の変形や応用が可能なことは勿論である。   Although the present invention has been described based on the above embodiments, the present invention is not limited to the above-described embodiments, and various modifications and applications are naturally possible within the scope of the gist of the present invention.

さらに、上記した実施形態には種々の段階の発明が含まれており、開示される複数の構成要件の適当な組合せにより種々の発明が抽出され得る。例えば、実施形態に示される全構成要件からいくつかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成も発明として抽出され得る。   Further, the above-described embodiments include various stages of the invention, and various inventions can be extracted by appropriately combining a plurality of disclosed constituent elements. For example, even if some constituent requirements are deleted from all the constituent requirements shown in the embodiment, the problem described in the column of the problem to be solved by the invention can be solved, and the effect described in the column of the effect of the invention Can be extracted as an invention.

本発明の一実施形態に係る音声記録再生装置の主要な構成を示したブロック図である。It is the block diagram which showed the main structures of the audio | voice recording / reproducing apparatus concerning one Embodiment of this invention. 本発明の一実施形態に係る音声記録再生装置の一例としてのICレコーダの内部構成を示すブロック図である。It is a block diagram which shows the internal structure of the IC recorder as an example of the audio | voice recording / reproducing apparatus which concerns on one Embodiment of this invention. 図2のICレコーダのメイン動作を示すフローチャートである。It is a flowchart which shows the main operation | movement of the IC recorder of FIG. 図2の構成のうちで、特に録音処理に係る詳細な構成について示す図である。It is a figure shown about the detailed structure which concerns on a sound recording process among the structures of FIG. 音声信号レベル検出信号について説明するための図である。It is a figure for demonstrating an audio | voice signal level detection signal. 録音処理について示すフローチャートである。It is a flowchart shown about a recording process.

符号の説明Explanation of symbols

1…音声信号レベル検出部、2…録音対象判定部、3…サンプリング周波数選択部、4…符号化部、20…マイクロフォン(MIC)、21…マイクアンプ(AMP)、22,27…ローパスフィルタ(LPF)、22…デジタル信号処理部、23…A/D変換器(ADC)、24…デジタル信号処理部(DSP)、25…システム制御部、26…D/A変換器(DAC)、28…パワーアンプ(AMP)、29…スピーカ、30…記録部(メモリ)、31…操作部、32…表示部、40…オペアンプ、42…オートゲインコントローラ(AGC)、45…マグニチュードコンパレータ、46…セレクタ、47…CPU   DESCRIPTION OF SYMBOLS 1 ... Audio | voice signal level detection part, 2 ... Recording object determination part, 3 ... Sampling frequency selection part, 4 ... Encoding part, 20 ... Microphone (MIC), 21 ... Microphone amplifier (AMP), 22, 27 ... Low pass filter ( LPF), 22 ... Digital signal processing unit, 23 ... A / D converter (ADC), 24 ... Digital signal processing unit (DSP), 25 ... System control unit, 26 ... D / A converter (DAC), 28 ... Power amplifier (AMP), 29 ... Speaker, 30 ... Recording unit (memory), 31 ... Operation unit, 32 ... Display unit, 40 ... Operational amplifier, 42 ... Auto gain controller (AGC), 45 ... Magnitude comparator, 46 ... Selector, 47 ... CPU

Claims (4)

入力された音声信号と所定の判定基準値とを大小比較して、上記判定基準値以上の音声信号を検出する音声信号レベル検出手段と、
所定時間内に上記音声信号レベル検出手段により検出された上記判定基準値以上の音声信号の入力回数に基づいて録音対象を判定する録音対象判定手段と、
上記録音対象判定手段による判定結果に基づいて録音品質が最適になるようにサンプリング周波数を選択するサンプリング周波数選択手段と、
上記サンプリング周波数選択手段で選択されたサンプリング周波数に応じたビットレートの音声データに上記入力された音声信号を符号化する符号化手段と、
を具備することを特徴とする音声記録再生装置。
An audio signal level detection means for comparing the input audio signal with a predetermined determination reference value and detecting an audio signal greater than the determination reference value;
A recording target determination means for determining a recording target based on the number of times of input of the audio signal equal to or higher than the determination reference value detected by the voice signal level detection means within a predetermined time;
Sampling frequency selecting means for selecting a sampling frequency so that the recording quality is optimized based on the determination result by the recording target determining means;
Encoding means for encoding the input audio signal into audio data having a bit rate corresponding to the sampling frequency selected by the sampling frequency selection means;
An audio recording / reproducing apparatus comprising:
上記サンプリング周波数選択手段は、録音動作の開始時には、高音質のビットレートに対応するサンプリング周波数を選択し、上記録音対象判定手段によって録音対象が判定された後は、上記録音対象判定手段による判定結果に基づいたサンプリング周波数を選択することを特徴とする請求項1に記載の音声記録再生装置。   The sampling frequency selection means selects a sampling frequency corresponding to a high sound quality bit rate at the start of a recording operation, and after the recording target is determined by the recording target determination means, the determination result by the recording target determination means The audio recording / reproducing apparatus according to claim 1, wherein a sampling frequency based on the selection is selected. 上記符号化手段は、録音動作の開始時には高音質のビットレートで上記入力された音声信号を符号化し、上記録音対象判定手段によって録音対象が判定された後、上記録音動作の開始時のビットレートと録音対象が判定された後のビットレートとが異なる場合には、上記録音動作の開始時のビットレートで符号化された音声データを、録音対象が判定された後のビットレートで符号化し直すことを特徴とする請求項1に記載の音声記録再生装置。   The encoding means encodes the input audio signal at a high sound quality bit rate at the start of a recording operation, and after the recording target is determined by the recording target determination means, the bit rate at the start of the recording operation When the recording target is different from the bit rate after the recording target is determined, the audio data encoded at the bit rate at the start of the recording operation is re-encoded at the bit rate after the recording target is determined. The audio recording / reproducing apparatus according to claim 1. 上記録音対象は、少なくとも口述録音と会議録音の何れかを含み、
上記サンプリング周波数選択手段は、上記録音対象判定手段によって上記録音対象が口述録音であることが判定された場合に低音質のビットレートに対応するサンプリング周波数を選択し、上記録音対象判定手段によって上記録音対象が会議録音であることが判定された場合に高音質のビットレートに対応するサンプリング周波数を選択することを特徴とする請求項1に記載の音声記録再生装置。
The recording target includes at least either oral recording or conference recording,
The sampling frequency selection means selects a sampling frequency corresponding to a low sound quality bit rate when the recording target is determined to be oral recording by the recording target determination means, and the recording target determination means selects the recording target. 2. The audio recording / reproducing apparatus according to claim 1, wherein a sampling frequency corresponding to a high-quality bit rate is selected when it is determined that the target is conference recording.
JP2005333036A 2005-11-17 2005-11-17 Device for sound recording and reproducing Pending JP2007140063A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005333036A JP2007140063A (en) 2005-11-17 2005-11-17 Device for sound recording and reproducing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005333036A JP2007140063A (en) 2005-11-17 2005-11-17 Device for sound recording and reproducing

Publications (1)

Publication Number Publication Date
JP2007140063A true JP2007140063A (en) 2007-06-07

Family

ID=38203009

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005333036A Pending JP2007140063A (en) 2005-11-17 2005-11-17 Device for sound recording and reproducing

Country Status (1)

Country Link
JP (1) JP2007140063A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010164735A (en) * 2009-01-15 2010-07-29 Kyocera Corp Voice recording device and communication terminal
JP2013527490A (en) * 2010-04-08 2013-06-27 クゥアルコム・インコーポレイテッド Smart audio logging system and method for mobile devices

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010164735A (en) * 2009-01-15 2010-07-29 Kyocera Corp Voice recording device and communication terminal
JP2013527490A (en) * 2010-04-08 2013-06-27 クゥアルコム・インコーポレイテッド Smart audio logging system and method for mobile devices
JP2014195275A (en) * 2010-04-08 2014-10-09 Qualcomm Incorporated System and method of smart audio logging for mobile devices
US9112989B2 (en) 2010-04-08 2015-08-18 Qualcomm Incorporated System and method of smart audio logging for mobile devices
JP2016180988A (en) * 2010-04-08 2016-10-13 クゥアルコム・インコーポレイテッドQualcomm Incorporated System and method of smart audio logging for mobile devices

Similar Documents

Publication Publication Date Title
US6769603B2 (en) Data recording and reproducing apparatus and data reproducing apparatus
JP2011198348A (en) Sound recording device
JP2011150060A (en) Recording device
JP3569266B2 (en) Reproduction device and power saving method
JP2007140063A (en) Device for sound recording and reproducing
JP2008241850A (en) Recording or reproducing device
JP3963701B2 (en) Audio recording / playback device
JP2005221565A (en) Voice data file storing method and sound-recording processor
JP2006221755A (en) Recording and reproducing apparatus
JP2006303672A (en) Sound reproducing device and system
JP3727689B2 (en) Digital audio recording / reproducing device
JP4187444B2 (en) Audio recording / playback device
US20040028384A1 (en) Digital recording/reproducing apparatus
US20040018004A1 (en) Audio recording and playback device
JP2001235566A (en) Semiconductor recorder
JP4747697B2 (en) Reproducing apparatus, reproducing method, and electronic device for removable memory
JP2002315087A (en) Data processing apparatus
JPH103300A (en) Digital audio recording and reproducing device
JPH06332500A (en) Voice reproducing device with variable speed reproducing function
JP2000227485A (en) Timepiece device
JP2001188562A (en) Voice recording and reproducing device, peripheral device, voice recording and reproduction system equipped with them, and recording medium with voice data processing program recorded thereon
JP2008292684A (en) Sound recording and reproduction device
JP2007072202A (en) Data recording device and voice recording and reproducing device
JP2007149165A (en) Music data recording/reproducing device, and music data recording/reproducing method therefor
JP2000206993A (en) Voice recorder, voice reproducing device and voice processing device