JPH0816199A - Sound recording device - Google Patents

Sound recording device

Info

Publication number
JPH0816199A
JPH0816199A JP6144663A JP14466394A JPH0816199A JP H0816199 A JPH0816199 A JP H0816199A JP 6144663 A JP6144663 A JP 6144663A JP 14466394 A JP14466394 A JP 14466394A JP H0816199 A JPH0816199 A JP H0816199A
Authority
JP
Japan
Prior art keywords
frequency
voice
sampling frequency
converter
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6144663A
Other languages
Japanese (ja)
Inventor
Tadashi Asai
忠 浅井
Teruo Hoshi
照雄 法師
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP6144663A priority Critical patent/JPH0816199A/en
Publication of JPH0816199A publication Critical patent/JPH0816199A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To conduct a high quality sound recording of digital voice signals for a long time. CONSTITUTION:Input voice signals are converted into gidital data in an A/D converter 12, coded by a coder 14 and stored in a voice memory 30. Then, the inputted signals are fed to a characteristic discrimination section 24 and the distinction of the sex of the speaker is made by checking the frequency characteristics of the data, for example, by discriminating the level of the voice signal of lower frequency. The discrimination result is supplied to a control section 26, which sets the sampling frequency of the converter 12 lower than that of a female when the speaker is discriminated to be a male. Since a male voice contains much lower frequency components, a lower sampling frequency does not adversely affect the tone quality. By conducting the above control, an efficient data compression is accomplished and a long time recording is performed while keeping the tone quality high.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、音声信号をデジタルデ
ータとして録音する録音装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a recording device for recording a voice signal as digital data.

【0002】[0002]

【従来の技術】従来より、デジタルデータの記録媒体と
して半導体メモリが利用されており、留守番電話機の録
音など音声信号の録音にも利用されている。このような
録音は、例えば音声信号をA/D変換器でデジタル化し
た後、DSP(デジタル・シグナル・プロセッシング)
処理により高効率符号化して大容量LSIメモリに記録
することによって行う。また、再生は、メモリから読み
出した符号化データをDSP処理して復号した後、D/
A変換器で音声信号に戻す。
2. Description of the Related Art Conventionally, a semiconductor memory has been used as a recording medium for digital data, and it has also been used for recording voice signals such as recording on an answering machine. Such recording is performed by, for example, digitizing an audio signal by an A / D converter and then DSP (digital signal processing).
It is performed by high-efficiency encoding by processing and recording in a large-capacity LSI memory. For reproduction, the coded data read from the memory is DSP processed and decoded, and then D /
Return to audio signal with A converter.

【0003】このようなシステムの場合、A/D変換の
際のサンプリング周波数は、通常8KHzに固定されて
いるが、限られたメモリ容量でより長時間録音を可能に
するために、6kHz、4kHz、3kHzも選択可能
になっている。また、符号化データのビット数(量子化
ビット数)も1〜4ビットのいずれかに固定されている
ものが多いが、2ビット、3ビット、4ビットと量子化
ビットを選択可能なものも知られている。
In such a system, the sampling frequency for A / D conversion is usually fixed at 8 KHz, but in order to enable recording for a longer time with a limited memory capacity, 6 kHz, 4 kHz. 3 kHz is also selectable. Also, the number of bits (quantization bit number) of encoded data is often fixed to any one of 1 to 4 bits, but some bits can select 2 bits, 3 bits, 4 bits and quantization bits. Are known.

【0004】勿論、良好な音質を得るためには、サンプ
リング周波数Fsは8kHz、量子化ビット数は4ビッ
ト(このときのビットレートは32kbps)が必要で
ある。しかしながら、録音時間はビットレートに反比例
するため、音質とのかねあいから24kbps程度に設
定される場合が多い。
Of course, in order to obtain good sound quality, the sampling frequency Fs needs to be 8 kHz and the number of quantization bits must be 4 bits (the bit rate at this time is 32 kbps). However, since the recording time is inversely proportional to the bit rate, it is often set to about 24 kbps in consideration of the sound quality.

【0005】[0005]

【発明が解決しようとする課題】上述のように、従来の
録音装置においては、長時間の録音を行いたい場合に音
質を犠牲にしていた。しかし、音質を犠牲にすることが
好ましいわけではなく、十分な音質を維持しつつ、長時
間の録音を可能にすることが望まれている。
As described above, in the conventional recording apparatus, the sound quality is sacrificed when it is desired to record for a long time. However, it is not preferable to sacrifice sound quality, and it is desired to enable long-term recording while maintaining sufficient sound quality.

【0006】本発明は、上記課題に鑑みなされたもので
あり、音質を維持しつつ長時間録音を可能とする録音装
置を提供することを目的とする。
The present invention has been made in view of the above problems, and an object of the present invention is to provide a recording apparatus capable of recording for a long time while maintaining sound quality.

【0007】[0007]

【課題を解決するための手段】本発明は、音声信号をA
/D変換器によりデジタルデータに変換して記録する録
音装置において、入力されてくる音声信号の周波数特性
を判定する周波数特性判定手段と、判定された周波数特
性に応じて上記A/D変換器におけるサンプリング周波
数を変更するサンプリング周波数変更手段と、を有する
ことを特徴とする。
SUMMARY OF THE INVENTION The present invention provides an audio signal A
In a recording device for converting digital data by an A / D converter and recording the digital data, a frequency characteristic judging means for judging a frequency characteristic of an input audio signal, and an A / D converter according to the judged frequency characteristic. And a sampling frequency changing means for changing the sampling frequency.

【0008】また、本発明は、音声信号をA/D変換器
によりデジタルデータに変換した後、符号化器で所定ビ
ットの符号データに変換して記録する録音装置におい
て、入力されてくる音声信号の周波数特性を判定する周
波数特性判定手段と、判定された周波数特性に応じて上
記A/D変換器におけるサンプリング周波数を変更する
サンプリング周波数変更手段と、判定された周波数特性
に応じて上記符号化で得る符号データのビット数を変更
するビット数変更手段と、を有することを特徴とする。
Further, according to the present invention, an audio signal input to a recording device which converts an audio signal into digital data by an A / D converter and then converts the audio data into coded data of a predetermined bit by an encoder for recording. The frequency characteristic determining means for determining the frequency characteristic of, the sampling frequency changing means for changing the sampling frequency in the A / D converter according to the determined frequency characteristic, and the encoding according to the determined frequency characteristic. And a bit number changing means for changing the bit number of the obtained code data.

【0009】また、本発明は、上記周波数特性判定手段
は、音声の母音部分の基本周波数に当たる音声信号波形
の繰り返し周波数を検出し、低周波音声または高周波音
声のいずれであるかを判定し、上記サンプリング周波数
変更手段は、低周波音声の場合にサンプリング周波数を
低くし、高周波音声の場合にサンプリング周波数を高く
することを特徴とする。
Further, according to the present invention, the frequency characteristic determining means detects the repetition frequency of the voice signal waveform corresponding to the fundamental frequency of the vowel part of the voice, determines whether it is a low frequency voice or a high frequency voice, and The sampling frequency changing means is characterized by lowering the sampling frequency in the case of low frequency sound and increasing the sampling frequency in the case of high frequency sound.

【0010】また、本発明は、上記周波数特性判定手段
は、所定周波数以下の成分が多いか否かを検出し、低周
波音声または高周波音声のいずれであるかを判定し、上
記サンプリング周波数変更手段は、低周波音声の場合に
サンプリング周波数を低くし、高周波音声の場合にサン
プリング周波数を高くすることを特徴とする。
Further, according to the present invention, the frequency characteristic judging means detects whether or not there are many components below a predetermined frequency, judges whether it is a low frequency sound or a high frequency sound, and the sampling frequency changing means. Is characterized by lowering the sampling frequency in the case of low frequency speech and increasing the sampling frequency in the case of high frequency speech.

【0011】[0011]

【作用】本発明は、男性と女性とで、音声の特性が異な
ることに注目することによってなされたものである。音
声は、ホルトマントと呼ばれるスペクトルの極大値を形
成するピーク位置によって母音の識別が行われており、
周波数の低い方から第1ホルトマント、第2ホルトマン
トと呼ばれれている。この第1および第2ホルトマント
は、男性の場合280Hz〜2310Hz、女性の場合
340Hz〜2830Hz程度にある。ここで、男女各
25名の発声測定の結果を平均したホルトマントの位置
を表1に示す。
The present invention has been made by paying attention to the fact that male and female have different voice characteristics. In speech, vowels are identified by the peak position that forms the maximum value of the spectrum called Holtmant,
The ones with lower frequencies are called the first and second holts. The first and second holtmants are at 280 Hz to 2310 Hz for men and about 340 Hz to 2830 Hz for women. Here, Table 1 shows the positions of the Holtmants, which are the averages of the results of the vocalization measurement for each of 25 men and women.

【0012】[0012]

【表1】 また、第3ホルトマントは、話者の識別に重要なファク
ターになっており、これによって個人の声の特徴が形成
される。従って、音声を録音する場合には、この第3ホ
ルトマントをカバーする必要がある。そして、この第3
ホルトマントは、男性で3000Hzまで、女性で40
00Hzまでの帯域にある。音声信号の音質を維持して
A/D変換する場合、その周波数の2倍の周波数でサン
プリングする必要がある。従って、A/D変換のサンプ
リング周波数として、女性の場合は8kHzが必要であ
り、男性の場合6kHzでも十分である。
[Table 1] Also, the third holtmant is an important factor for speaker identification, which forms the characteristics of the individual's voice. Therefore, when recording voice, it is necessary to cover this third Holtmant. And this third
Holtmant is up to 3000Hz for men and 40 for women.
It is in the band up to 00 Hz. When performing A / D conversion while maintaining the sound quality of the audio signal, it is necessary to sample at a frequency twice that frequency. Therefore, as a sampling frequency for A / D conversion, 8 kHz is necessary for a female and 6 kHz is sufficient for a male.

【0013】このように、男性と女性とでは、音質を維
持するために必要なサンプリング周波数が異なる。そこ
で、男性と女性とで、サンプリング周波数を変更すれ
ば、音質を十分なものに維持しながらデータの圧縮の効
率を上昇できる。
As described above, the sampling frequency required for maintaining the sound quality differs between men and women. Therefore, by changing the sampling frequency between male and female, the efficiency of data compression can be increased while maintaining sufficient sound quality.

【0014】本発明によれば、入力されてくる音声信号
の周波数特性を判定する。これによって、男性と女性の
識別を行う。そして、この識別結果に応じて、A/D変
換の際のサンプリング周波数を変更することで、音質を
損なうことなく、効率良いデータの圧縮が行える。例え
ば、男性の場合には、サンプリング周波数を6kHz、
女性の場合には、8kHzに設定することによって、第
3ホルトマントを失うことなく、データの圧縮効率を高
めることができる。
According to the present invention, the frequency characteristic of the input voice signal is determined. This distinguishes between male and female. Then, by changing the sampling frequency at the time of A / D conversion according to the identification result, efficient data compression can be performed without degrading the sound quality. For example, for men, the sampling frequency is 6 kHz,
In the case of a woman, by setting the frequency to 8 kHz, the data compression efficiency can be improved without losing the third Holtmant.

【0015】また、A/D変換によって得られたデジタ
ルデータをそのまま記憶すると、データ量が膨大にな
る。そこで、本発明においては、符号化して、データ量
を削減してからデータを記憶する。そして、この符号化
した際に得る符号化データのビット数を周波数特性に応
じて変更する。例えば、男性の音声であれば4ビット、
女性の音声であれば3ビットにする。特に、この場合の
A/D変換の際のサンプリング周波数を男性の場合6k
Hz、女性の場合8kHzにすることによって、男女と
も24kbpsとなる。このようにして、ビットレート
を同一として、効果的なデータの圧縮ができる。
Further, if the digital data obtained by the A / D conversion is stored as it is, the data amount becomes enormous. Therefore, in the present invention, the data is stored after being encoded to reduce the data amount. Then, the number of bits of the encoded data obtained at the time of encoding is changed according to the frequency characteristic. For example, 4 bits for male voice,
If it is a female voice, set it to 3 bits. In particular, the sampling frequency for A / D conversion in this case is 6k for men.
Hz and 8 kHz for a female, 24 kbps for both male and female. In this way, it is possible to effectively compress data with the same bit rate.

【0016】また、音声の母音部分の波形は、声帯の形
状等によって決定される基本周波数で同一波形を繰り返
すものになっている。そして、この基本周波数は、男性
と女性とで異なっている。例えば、男女の音声の基本周
波数は、図4に示すような分布になっており、男性の場
合125Hz程度が中心、女性の場合240Hz程度が
中心の分布になっている。そこで、音声信号における基
本周波数により男性か女性かを判定できる。
Further, the waveform of the vowel portion of the voice is such that the same waveform is repeated at the fundamental frequency determined by the shape of the vocal cord and the like. And this fundamental frequency is different between men and women. For example, the fundamental frequencies of the voices of men and women have a distribution as shown in FIG. 4, with the distribution centering around 125 Hz for men and 240 Hz for women. Therefore, it is possible to determine male or female based on the fundamental frequency of the voice signal.

【0017】本発明では、この基本周波数を検出し、男
性の音声に対応する低周波の音声と女性の音声の対応す
る高周波の音声かを判定する。そして、この判定結果に
従ってA/D変換の際のサンプリング周波数を変更する
ため、音質を損なうことなくデータの圧縮率を上昇する
ことができる。
According to the present invention, the fundamental frequency is detected to determine whether the low frequency voice corresponding to the male voice and the high frequency voice corresponding to the female voice. Since the sampling frequency at the time of A / D conversion is changed according to this determination result, the data compression rate can be increased without impairing the sound quality.

【0018】また、男女の音声を周波数分析した場合、
男性の声に比較して、女性の声は150Hz以下の成分
が極めて少ないという特徴がある。
When frequency analysis is performed on the voices of men and women,
Compared to male voices, female voices are characterized by having very few components below 150 Hz.

【0019】本発明では、この所定周波数(例えば、1
50Hz)以下の成分が多く存在するか否かで、男性の
音声に対応する低周波の音声と女性の音声の対応する高
周波の音声かを判定する。そこで、上述の場合と同様に
して、音質を損なうことなくデータの圧縮率を上昇する
ことができる。
In the present invention, this predetermined frequency (for example, 1
It is determined by whether or not there are many components below 50 Hz), that is, a low frequency voice corresponding to a male voice and a high frequency voice corresponding to a female voice. Therefore, similarly to the case described above, the data compression rate can be increased without deteriorating the sound quality.

【0020】[0020]

【実施例】以下、本発明の実施例について、図面に基づ
いて説明する。図1は、システムの全体構成を示すブロ
ック図であり、固体録音再生LSI10、音声メモリ3
0およびマイコン40からなっている。マイクロフォン
等によって、電気信号に変換されたアナログの入力音声
信号は固体録音再生LSI10に入力される。固体録音
再生LSI10は、その内部に、A/D変換器12、符
号化器14、書込みドライバ16、読出しドライバ1
8、復号化器20、D/A変換器22、特性判定部24
および制御部26を有している。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing the overall configuration of the system, including a solid-state recording / playback LSI 10 and an audio memory 3.
0 and the microcomputer 40. An analog input voice signal converted into an electric signal by a microphone or the like is input to the solid-state recording / reproducing LSI 10. The solid-state recording / reproducing LSI 10 includes therein an A / D converter 12, an encoder 14, a write driver 16, a read driver 1.
8, decoder 20, D / A converter 22, characteristic determination unit 24
And a control unit 26.

【0021】入力音声信号は、A/D変換器12に入力
され、ここで所定ビット、例えば8ビットのデジタルデ
ータに変換される。なお、このA/D変換器12はサン
プリング周波数が少なくとも6kHz、8kHzの2段
階に切り替え可能になっている。A/D変換器12から
のデジタルデータは、符号化器14で所定の手法で符号
化される。例えば、この符号化の手法として、MSBC
−AB等が好適である。このMSBC−ABは、適応的
なビット割り付けを行う変形サブバンド符号化を意味し
ており、音声データを20msec程度のフレームに区
切り、このフレーム毎に4バンド位の帯域に分割し各々
の波形を符号化するするもので、この符号化の際の周波
数帯域毎の割り当てビット数が適応的に変更されるもの
である。
The input audio signal is input to the A / D converter 12, where it is converted into digital data of a predetermined bit, for example, 8 bits. The A / D converter 12 can switch the sampling frequency between two levels of at least 6 kHz and 8 kHz. The digital data from the A / D converter 12 is encoded by the encoder 14 by a predetermined method. For example, as the encoding method, MSBC
-AB and the like are preferable. This MSBC-AB means a modified sub-band coding that adaptively allocates bits, divides audio data into frames of about 20 msec, divides each frame into bands of about 4 bands, and divides each waveform. Encoding is performed, and the number of allocated bits for each frequency band at the time of encoding is adaptively changed.

【0022】そして、この符号化器14における1つの
デジタル信号に対する符号化データのビット数(量子化
ビット数)が、切り替え可能になっている。量子化ビッ
ト数は、少なくとも、3ビットまたは4ビットに切り替
え可能になっている。
The bit number (quantization bit number) of encoded data for one digital signal in the encoder 14 can be switched. The number of quantization bits can be switched to at least 3 bits or 4 bits.

【0023】このようにして得られた符号化データは、
書込みドライバ16を介し、音声メモリ30に書き込ま
れる。これによって、入力音声信号が、デジタルデータ
として、半導体の音声メモリ30に記録される。なお、
この音声メモリ30は、例えば4MバイトのDRAMで
構成される。
The coded data thus obtained is
It is written in the audio memory 30 via the write driver 16. As a result, the input voice signal is recorded as digital data in the semiconductor voice memory 30. In addition,
The voice memory 30 is composed of, for example, a 4-Mbyte DRAM.

【0024】一方、音声メモリ30から読出しドライバ
18を介し読み出された符号化データは、復号化器20
に供給され、ここで復号化され、デジタルの音声データ
に変換される。そして、D/A変換器22によりアナロ
グの出力音声信号に戻される。ここで、符号化器20の
復号化は、符号化器14の符号化に対応したものであ
り、またD/A変換器22はA/D変換器12に対応し
たものであり、これらは記録系のサンプリング周波数や
量子化ビット数の変更に対応して処理内容を変更する。
On the other hand, the encoded data read from the audio memory 30 via the read driver 18 is decoded by the decoder 20.
, Where it is decoded and converted into digital audio data. Then, the D / A converter 22 returns the analog output audio signal. Here, the decoding of the encoder 20 corresponds to the encoding of the encoder 14, the D / A converter 22 corresponds to the A / D converter 12, and these are recorded. The processing contents are changed in response to changes in the sampling frequency of the system and the number of quantization bits.

【0025】そして、本実施例では、特性判定部24に
おいて、入力音声信号の特性を判定し、男性の音声か女
性の音声かを判定する。男性の音声の場合、その音声の
特徴を示す第3ホルトマントまでをカバーするためのA
/D変換器12のサンプリング周波数は6kHzでよ
い。そこで、特性判定部24において、入力音声信号が
男性と判定した場合には、制御部26がA/D変換器1
2におけるサンプリング周波数を6kHz、符号化器1
4の量子化ビットを4ビットに設定すると共に、復号化
器20、A/D変換器22をこれらに対応したものに設
定する。
Then, in the present embodiment, the characteristic judging section 24 judges the characteristic of the input voice signal to judge whether it is a male voice or a female voice. In the case of a male voice, A for covering up to the third holtmant, which shows the features of the voice
The sampling frequency of the / D converter 12 may be 6 kHz. Therefore, when the characteristic determination unit 24 determines that the input audio signal is male, the control unit 26 causes the A / D converter 1 to operate.
Sampling frequency in 2 is 6 kHz, encoder 1
The quantization bits of 4 are set to 4 bits, and the decoder 20 and the A / D converter 22 are set to those corresponding to these.

【0026】一方、特性判定部24において、入力音声
信号が女性と判定した場合には、制御部26がA/D変
換器12におけるサンプリング周波数を8kHz、符号
化器14の量子化ビットを3ビットに設定すると共に、
復号化器20、A/D変換器22をこれらに対応したも
のに設定する。
On the other hand, when the characteristic judging section 24 judges that the input voice signal is female, the controlling section 26 sets the sampling frequency of the A / D converter 12 to 8 kHz and the quantization bit of the encoder 14 to 3 bits. Set to
The decoder 20 and the A / D converter 22 are set to correspond to these.

【0027】このようにして、本実施例によれば、ビッ
トレートは24kbpsに固定したままで、サンプリン
グ周波数および量子化ビットを変更することによって、
音質を維持しつつ、音声メモリ30に記憶するデータ量
を削減することができる。すなわち、入力音声信号の特
質に合わせてデータ圧縮の手法を変更し、効果的なデー
タ圧縮を行うことができる。
In this way, according to this embodiment, by changing the sampling frequency and the quantized bit while keeping the bit rate fixed at 24 kbps,
It is possible to reduce the amount of data stored in the audio memory 30 while maintaining the sound quality. That is, the data compression method can be changed according to the characteristics of the input audio signal, and effective data compression can be performed.

【0028】なお、マイコン40は、外部から入力され
る操作信号などによって、固体録音再生LSI10の動
作を制御するものであり、録音の起動停止、再生の起動
停止、モードの設定などを制御する。また、外部からの
操作によって、サンプリング周波数を変更したり、量子
化ビットを変更するようにしてもよいし、また特性判定
による制御をオンオフできるようにしても良い。
The microcomputer 40 controls the operation of the solid-state recording / reproducing LSI 10 in accordance with an operation signal input from the outside, and controls recording start / stop, reproduction start / stop, mode setting, and the like. The sampling frequency may be changed, the quantization bit may be changed, or the control based on the characteristic determination may be turned on / off by an external operation.

【0029】次に、特性判定部24の構成の一例につい
て、図2に基づいて説明する。この例では、入力音声信
号の基本周波数を測定し、男性女性の別を判定する。す
なわち、入力音声信号は、ローパスフィルタ52に入力
され、ここで高周波成分がカットされた後、周波数解析
器52に入力され周波数解析される。そして、判定器5
6が周波数解析の結果に応じて、入力音声信号が男性の
ものか女性のものかを判定する。
Next, an example of the configuration of the characteristic determining section 24 will be described with reference to FIG. In this example, the fundamental frequency of the input voice signal is measured to determine whether it is male or female. That is, the input audio signal is input to the low pass filter 52, where high frequency components are cut off, and then input to the frequency analyzer 52 for frequency analysis. And the determiner 5
6 determines whether the input voice signal is male or female, according to the result of the frequency analysis.

【0030】ここで、ローパスフィルタ52では、例え
ば500Hz以上の成分がカットされる。音声は、声帯
で決定される基本周波数の音に舌、顎等の形による高周
波成分が重畳されて、各種の音になる。しかし、通常の
会話の際の音声の基本周波数は一定である。このため、
音声信号から500Hz以上の成分をカットすると、ほ
ぼ基本周波数の成分のみが残る。そこで、得られた信号
の周波数解析を行うことによって、基本周波数を検出す
ることができる。
Here, in the low-pass filter 52, components of, for example, 500 Hz or higher are cut. A voice has various sounds by superposing a high-frequency component due to the shape of the tongue, jaw, etc. on the sound of the fundamental frequency determined by the vocal cords. However, the fundamental frequency of voice in a normal conversation is constant. For this reason,
If the component of 500 Hz or more is cut from the audio signal, only the component of the fundamental frequency remains. Therefore, the fundamental frequency can be detected by performing frequency analysis of the obtained signal.

【0031】そして、判定器56は、周波数解析器54
の解析結果により周波数が125Hz近辺であった場合
には、男性と判定し、解析結果が245Hz近辺であっ
た場合には、女性と判定する。この判定は、カウンタの
カウント値を所定値と比較し、所定範囲に入っているか
を判定すればよい。
The decision unit 56 is the frequency analyzer 54.
When the frequency is around 125 Hz according to the analysis result of 1., it is determined to be a male, and when the analysis result is around 245 Hz, it is determined to be a female. This determination may be made by comparing the count value of the counter with a predetermined value and determining whether it is within a predetermined range.

【0032】このようにして、音声の基本周波数を検出
することによって、話者が男性であるか、女性であるか
を判定することができる。したがって、この情報を制御
部26に供給することによって、制御部26が音声信号
の特性に合わせたデータの圧縮を行うことができる。
In this way, it is possible to determine whether the speaker is male or female by detecting the fundamental frequency of the voice. Therefore, by supplying this information to the control unit 26, the control unit 26 can compress the data in accordance with the characteristics of the audio signal.

【0033】次に、図3に、特性判定部24の他の構成
例を示す。この例では、音声信号の150Hz以上の成
分と、150Hz以下の成分の割合に応じて、話者が男
性であるか、女性であるかを判定する。すなわち、入力
音声信号は、ローパスフィルタ62およびハイパスフィ
ルタ64に入力される。ローパスフィルタ62は、15
0Hz以上の信号をカットするものであり、ハイパスフ
ィルタ64は、150Hz以下の信号をカットするもの
である。
Next, FIG. 3 shows another structural example of the characteristic judging section 24. In this example, it is determined whether the speaker is a male or a female according to the ratio of the component of 150 Hz or higher and the component of 150 Hz or lower of the audio signal. That is, the input audio signal is input to the low pass filter 62 and the high pass filter 64. The low pass filter 62 has 15
The signal of 0 Hz or higher is cut, and the high pass filter 64 cuts the signal of 150 Hz or lower.

【0034】ローパスフィルタ62およびハイパスフィ
ルタ64の出力は、それぞれ別々のレベル積算器66、
68に入力される。これらレベル積算器66、68は、
入力されてくる信号の信号レベルを検波すると共に、こ
のレベル値を所定時間積算する。従って、レベル積算器
66、68には、150Hz以下の信号のレベルと、1
50Hz以上の信号のレベルが得られる。そして、レベ
ル積算器66、68の積算結果の信号はコンパレータ7
0に入力され、ここで両者が比較される。
The outputs of the low-pass filter 62 and the high-pass filter 64 are respectively level accumulators 66,
68 is input. These level accumulators 66 and 68 are
The signal level of the input signal is detected and this level value is integrated for a predetermined time. Therefore, the level accumulators 66 and 68 have a signal level of 150 Hz or less and
A signal level of 50 Hz or higher can be obtained. The signal of the integration result of the level integrators 66 and 68 is sent to the comparator 7
It is input to 0, and both are compared here.

【0035】男性の場合150Hz以下の成分の信号レ
ベルが大きく、一方、女性の場合は150Hz以下の成
分の信号レベルは非常に小さい。そこで、コンパレータ
70の比較結果において、レベル積算器66の出力、す
なわち150Hz以下の信号のレベルの方が大きけれ
ば、入力音声信号は男性のものであると判断され、レベ
ル積算器68の出力、すなわち150Hz以上の信号の
レベルの方が大きければ、入力音声信号は女性のもので
あると判断される。このようにして、この例の特性判定
部24により、入力音声信号が男性のものであるか、女
性のものであるかを判定することができる。したがっ
て、この回路を利用して、音声信号の特性に合わせたデ
ータの圧縮を上述の場合と同様に行うことができる。
In the case of a male, the signal level of the component below 150 Hz is large, while in the case of a female, the signal level of the component below 150 Hz is very small. Therefore, in the comparison result of the comparator 70, if the output of the level integrator 66, that is, the level of the signal of 150 Hz or less is larger, it is determined that the input voice signal is male, and the output of the level integrator 68, that is, If the level of the signal of 150 Hz or higher is higher, the input audio signal is judged to be female. In this way, the characteristic determining unit 24 of this example can determine whether the input audio signal is of a male type or a female type. Therefore, by using this circuit, data compression suitable for the characteristics of the audio signal can be performed in the same manner as in the above case.

【0036】また、留守番電話機の用件録音のように、
通常の録音の場合、話者の性別は分からない。従って、
上述のような性別の判定は録音開始後の初期に行わなけ
ればならない。そこで、本実施例の装置では、図5に示
すように、録音開始当初の10秒間位は、サンプリング
周波数8Hz、量子化ビット4ビットの、ビットレート
32kbpsで録音しながら性別の判定を行う。そし
て、性別の判定ができた場合に、男性ならサンプリング
周波数を6kHzに変更し、女性なら量子化ビットを3
ビットに変更し、ビットレート24kbpsでその後の
録音を最後まで行う。このようにすることによって、全
体の録音時間にもよるが、性別判定時間は録音時間に占
める割合が少ないので、1回の録音に要するメモリの容
量は、ほぼ24kbpsでの値に近くなり、十分な音質
を維持しつつ、限られたメモリ容量で、長時間の録音が
可能になる。
Also, like the message recording of an answering machine,
In normal recording, the gender of the speaker is unknown. Therefore,
The determination of sex as described above must be performed early after the start of recording. Therefore, in the apparatus of the present embodiment, as shown in FIG. 5, for 10 seconds at the beginning of recording, the gender is determined while recording at a bit rate of 32 kbps with a sampling frequency of 8 Hz and 4 quantization bits. If the gender can be determined, the sampling frequency is changed to 6 kHz for men, and the quantization bit is set to 3 for women.
Change to bit and record at the bit rate of 24 kbps until the end. By doing this, although the sex determination time is a small percentage of the recording time, depending on the total recording time, the memory capacity required for one recording is close to the value at 24 kbps, which is sufficient. With a limited memory capacity, it is possible to record for a long time while maintaining excellent sound quality.

【0037】なお、上述の実施例において、特性判定部
24は、アナログの入力音声信号を受入れ、処理を行う
ように記載したが、A/D変換器12の出力であるデジ
タルデータを受入れ処理を行っても良い。この場合、回
路は、すべてデジタル回路で形成される。
In the above-mentioned embodiment, the characteristic judging section 24 is described as receiving the analog input voice signal and performing the processing. However, the characteristic judging section 24 receives the digital data output from the A / D converter 12 and performs the processing. You can go. In this case, the circuit is formed entirely of digital circuits.

【0038】[0038]

【発明の効果】以上説明したように、本発明のよれば、
入力されてくる音声信号の周波数特性を判定する。これ
によって、男性と女性の識別が行える。そこで、この識
別結果に応じて、A/D変換の際のサンプリング周波数
を変更することで、音質を損なうことを抑制して、効率
良いデータの圧縮が行える。
As described above, according to the present invention,
The frequency characteristic of the input audio signal is determined. This makes it possible to distinguish between men and women. Therefore, by changing the sampling frequency at the time of A / D conversion according to this identification result, it is possible to suppress the loss of sound quality and perform efficient data compression.

【0039】また、本発明においては、符号化して、デ
ータ量を削減してからデータを記憶すると共に、この符
号化した際に得る符号化データのビット数を周波数特性
に応じて変更する。このように、量子化ビット数の制御
を合わせて行うことによりビットレートは常時同一とし
ながら、効果的なデータの圧縮ができる。
Further, in the present invention, the data is stored after being encoded so as to reduce the amount of data, and the number of bits of the encoded data obtained by this encoding is changed according to the frequency characteristic. In this way, by controlling the number of quantization bits together, it is possible to effectively compress data while always keeping the same bit rate.

【0040】また、本発明では、この基本周波数を検出
し、男性の音声に対応する低周波の音声と女性の音声の
対応する高周波の音声かを判定する。そして、この判定
結果に従ってA/D変換の際のサンプリング周波数を変
更するため、音質を損なうことなくデータの圧縮率を上
昇することができる。
Further, in the present invention, this fundamental frequency is detected to determine whether the low frequency voice corresponding to the male voice and the high frequency voice corresponding to the female voice. Since the sampling frequency at the time of A / D conversion is changed according to this determination result, the data compression rate can be increased without impairing the sound quality.

【0041】また、本発明では、この所定周波数以下の
成分が多く存在するか否かで、男性の音声に対応する低
周波の音声と女性の音声の対応する高周波の音声かを判
定する。そこで、上述の場合と同様にして、音質を損な
うことなくデータの圧縮率を上昇することができる。
Further, in the present invention, it is determined whether there is a low frequency voice corresponding to a male voice and a high frequency voice corresponding to a female voice depending on whether or not there are many components below the predetermined frequency. Therefore, similarly to the case described above, the data compression rate can be increased without deteriorating the sound quality.

【0042】そして、このような効率的なデータの圧縮
が行えるため、限られたメモリ容量で、音質を維持しつ
つ、長時間録音が可能になる。
Since such efficient data compression can be performed, recording can be performed for a long time with a limited memory capacity while maintaining sound quality.

【図面の簡単な説明】[Brief description of drawings]

【図1】実施例の全体構成を示すブロック図である。FIG. 1 is a block diagram showing an overall configuration of an embodiment.

【図2】特性判定部の構成例を示すブロック図である。FIG. 2 is a block diagram illustrating a configuration example of a characteristic determination unit.

【図3】特性判定部の他の構成例を示すブロック図であ
る。
FIG. 3 is a block diagram illustrating another configuration example of a characteristic determination unit.

【図4】基本周波数の分布を示す図である。FIG. 4 is a diagram showing a distribution of fundamental frequencies.

【図5】録音の際の動作を示す説明図である。FIG. 5 is an explanatory diagram showing an operation at the time of recording.

【符号の説明】[Explanation of symbols]

10 固体録音再生LSI 12 A/D変換器 14 符号化器 20 復号化器 22 D/A変換器 30 音声メモリ 10 Solid-state recording / playback LSI 12 A / D converter 14 Encoder 20 Decoder 22 D / A converter 30 Voice memory

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 音声信号をA/D変換器によりデジタル
データに変換して記録する録音装置において、 入力されてくる音声信号の周波数特性を判定する周波数
特性判定手段と、 判定された周波数特性に応じて上記A/D変換器におけ
るサンプリング周波数を変更するサンプリング周波数変
更手段と、 を有することを特徴とする録音装置。
1. A recording device for converting an audio signal into digital data by an A / D converter and recording the digital data, and a frequency characteristic judging means for judging a frequency characteristic of an input audio signal, and a frequency characteristic judging means for judging the frequency characteristic. And a sampling frequency changing means for changing the sampling frequency in the A / D converter.
【請求項2】 音声信号をA/D変換器によりデジタル
データに変換した後、符号化器で所定ビットの符号デー
タに変換して記録する録音装置において、 入力されてくる音声信号の周波数特性を判定する周波数
特性判定手段と、 判定された周波数特性に応じて上記A/D変換器におけ
るサンプリング周波数を変更するサンプリング周波数変
更手段と、 判定された周波数特性に応じて上記符号化で得る符号デ
ータのビット数を変更するビット数変更手段と、 を有することを特徴とする録音装置。
2. In a recording device which converts an audio signal into digital data by an A / D converter and then converts it into coded data of a predetermined bit by an encoder for recording, a frequency characteristic of an input audio signal is measured. Frequency characteristic judging means for judging, sampling frequency changing means for changing a sampling frequency in the A / D converter according to the judged frequency characteristic, and code data obtained by the coding according to the judged frequency characteristic. A recording device comprising: a bit number changing means for changing the bit number.
【請求項3】 請求項1または2に記載の録音装置にお
いて、 上記周波数特性判定手段は、音声の母音部分の基本周波
数に当たる音声信号波形の繰り返し周波数を検出し、低
周波音声または高周波音声のいずれであるかを判定し、 上記サンプリング周波数変更手段は、低周波音声の場合
にサンプリング周波数を低くし、高周波音声の場合にサ
ンプリング周波数を高くすることを特徴とする録音装
置。
3. The recording device according to claim 1, wherein the frequency characteristic determining means detects a repetition frequency of a voice signal waveform corresponding to a fundamental frequency of a vowel part of voice, and selects either low frequency voice or high frequency voice. The recording device is characterized in that the sampling frequency changing means lowers the sampling frequency in the case of low frequency sound and increases the sampling frequency in the case of high frequency sound.
【請求項4】 請求項1または2に記載の録音装置にお
いて、 上記周波数特性判定手段は、所定周波数以下の成分が多
いか否かを検出し、低周波音声または高周波音声のいず
れであるかを判定し、 上記サンプリング周波数変更手段は、低周波音声の場合
にサンプリング周波数を低くし、高周波音声の場合にサ
ンプリング周波数を高くすることを特徴とする録音装
置。
4. The recording device according to claim 1, wherein the frequency characteristic determination means detects whether there are many components having a frequency equal to or lower than a predetermined frequency and determines whether the component is a low frequency voice or a high frequency voice. The recording device characterized in that the sampling frequency changing means lowers the sampling frequency in the case of low-frequency sound and increases the sampling frequency in the case of high-frequency sound.
JP6144663A 1994-06-27 1994-06-27 Sound recording device Pending JPH0816199A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6144663A JPH0816199A (en) 1994-06-27 1994-06-27 Sound recording device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6144663A JPH0816199A (en) 1994-06-27 1994-06-27 Sound recording device

Publications (1)

Publication Number Publication Date
JPH0816199A true JPH0816199A (en) 1996-01-19

Family

ID=15367337

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6144663A Pending JPH0816199A (en) 1994-06-27 1994-06-27 Sound recording device

Country Status (1)

Country Link
JP (1) JPH0816199A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010164735A (en) * 2009-01-15 2010-07-29 Kyocera Corp Voice recording device and communication terminal
CN102693721A (en) * 2012-06-26 2012-09-26 苏州科技学院 Simple and easy voice and gender detection device and method
CN106683686A (en) * 2016-11-18 2017-05-17 祝洋 Examinee gender statistical equipment and statistical method of same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010164735A (en) * 2009-01-15 2010-07-29 Kyocera Corp Voice recording device and communication terminal
CN102693721A (en) * 2012-06-26 2012-09-26 苏州科技学院 Simple and easy voice and gender detection device and method
CN106683686A (en) * 2016-11-18 2017-05-17 祝洋 Examinee gender statistical equipment and statistical method of same

Similar Documents

Publication Publication Date Title
JP4444749B2 (en) Method and apparatus for performing reduced rate, variable rate speech analysis synthesis
US5732390A (en) Speech signal transmitting and receiving apparatus with noise sensitive volume control
JP2016189015A (en) Method for expanding performance of coding system using high frequency reconstitution method
US5251261A (en) Device for the digital recording and reproduction of speech signals
JP2007534020A (en) Signal coding
EP1312075B1 (en) Method for noise robust classification in speech coding
JP2002536694A (en) Method and means for 1/8 rate random number generation for voice coder
US20070118362A1 (en) Audio compression/decompression device
US6173265B1 (en) Voice recording and/or reproducing method and apparatus for reducing a deterioration of a voice signal due to a change over from one coding device to another coding device
EP0899892B1 (en) Signal processing apparatus and method, and information recording apparatus
JPH0816199A (en) Sound recording device
JPH10116097A (en) Voice reproducing device
JP2797348B2 (en) Audio encoding / decoding device
JP2002258900A (en) Device and method for reproducing voice
JP4260928B2 (en) Audio compression apparatus and recording medium
JP2965788B2 (en) Audio gain control device and audio recording / reproducing device
KR0141237B1 (en) Audio signal recording/reproducing method
JPH0888525A (en) Automatic gain controller by detection of silent tone
JP2905215B2 (en) Recording and playback device
JPH07240782A (en) Handset
JP2000293199A (en) Voice coding method and recording and reproducing device
JPH10124097A (en) Voice recording and reproducing device
KR100776432B1 (en) Apparatus for writing and playing audio and audio coding method in the apparatus
JPH01173100A (en) Digital voice reproducing device
JPH10260695A (en) Speech signal encoding device

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040106