JPS6253093B2 - - Google Patents

Info

Publication number
JPS6253093B2
JPS6253093B2 JP56120111A JP12011181A JPS6253093B2 JP S6253093 B2 JPS6253093 B2 JP S6253093B2 JP 56120111 A JP56120111 A JP 56120111A JP 12011181 A JP12011181 A JP 12011181A JP S6253093 B2 JPS6253093 B2 JP S6253093B2
Authority
JP
Japan
Prior art keywords
digital data
decoder
memory
audio signal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56120111A
Other languages
Japanese (ja)
Other versions
JPS5821798A (en
Inventor
Eiji Kira
Kazuo Kitagawa
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56120111A priority Critical patent/JPS5821798A/en
Publication of JPS5821798A publication Critical patent/JPS5821798A/en
Publication of JPS6253093B2 publication Critical patent/JPS6253093B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】[Detailed description of the invention]

この発明は、音声信号波形を適応型デルタ変調
方式により符号化したデータを含むデイジタルデ
ータから元の音声信号波形を再生する音声再生装
置に関する。 音声信号波形の符号化方式の一つであるデルタ
変調方式は、周知のようにサンプリング周波数を
十分大きくとり、隣接するサンプル値間の相関を
高めてその振幅の差が一定範囲内に収まるように
した上で、その振幅の大小関係を“1”、“0”の
1ビツトで表現して符号化する方式である。この
デルタ変調方式は、原理的に2種の歪を伴なうこ
とが知られている。その一つは、スロープオーバ
ーロード(Slope Over Load)と呼ばれるもの
で、第1図aに示すように入力音声信号波形1の
急傾斜の変化に対しデルタ変調用エンコーダにお
ける局部D/Aコンバータの出力波形2が追従で
きないことによつて生じる歪である。3は符号化
データを示している。他の一つは、グラニユラデ
イストーシヨン(Granular Distontion)と呼ば
れるもので、第1図bに示すように入力音声信号
波形1が時間的にあまり変化しないとき、局部
D/Aコンバータの出力波形2が増減を操作し、
符号化データ3が“1”と“0”とを交互に繰返
すことに起因するものである。 このような2種の歪を低減させる方式として考
案されたのが、音声信号の振幅の大小に応じて量
子化幅を適応的に変化させる適応型デルタ変調方
式である。すなわち、音声信号波形を符号化した
データが連続して“1”または“0”の場合はス
ロープオーバーロードが起つているので量子化幅
を増加させ、データが常に変化しているときはグ
ラニユラデイストーシヨンが生じているので、逆
に量子化幅を小さくするものである。 第2図a,bは適応型デルタ変調方式の一種で
あるCVSD(Continuous Variable Slope Delta
Modulation)方式による音声記録再生装置にお
けるエンコーダ側およびデコーダ側の構成例を示
している。エンコーダ側においては、入力音声信
号11がローパスフイルタ12を通してコンパレ
ータ13で差分された後、D−フリツプフロツプ
14でクロツクCLKによりリタイミングされ
て、符号化データとなる。コンパレータ13の比
較レベルは、基本デルタ変調方式ではエステイメ
イトフイルタ15(局部D/Aコンバータに相
当)の出力で与えられ、そのステツプ、つまり量
子化幅は一定であるが、第2図ではこの量子化幅
が連続的に適応制御される。すなわち、入力音声
信号11の波形が急激に変化し、符号化データが
3ビツト以上“1”または“0”が連続すると、
シフトレジスタ16およびEX−OR回路17でそ
れが検出され、シラビツクフイルタ18の出力が
積分されることにより、エステイメイトフイルタ
15の出力側に設けられた掛算器19のゲインが
上昇し、量子化幅が1ビツト毎に順次大きくな
る。これによつてスロープオーバーロードが抑え
られる。一方、入力音声信号11の波形が時間的
にあまり変化しないときはシラビツクフイルタ1
8の出力が減少することにより、掛算器19のゲ
インが低下し、量子化幅は順次小さくなるので、
グラニユラデイストーシヨンが抑えられる。 デコーダ側ではエステイメイトフイルタ21、
掛算器22、シフトレジスタ23、EX−OR回路
24、シラビツクフイルタ25およびローパスフ
イルタ26からなる構成によつてエンコーダと逆
の操作を行ない、再生音声信号27を得る。 ところが、このCVSD方式のような適応型デル
タ変調方式でも、再生音声の明瞭度という点で未
だ改善されるべき問題がある。この問題点を第3
図、第4図を用いて説明する。第3図aは日本語
で「オヤスミノジカン」という言葉を普通の速度
で話したときの音声信号のエンベロープ波形であ
り、同図bはこの音声信号に対応する有音−無音
判別信号を示している。第3図bでHが有音区
間、Lが無音区間を表わしている。これによる
と、例えば「OYA」と「SUMI」の間の無音区間
は約120msである。一般的に、通常の会話では
この100ms前後の無音区間は、語間、音節間を
含めてかなり存在する。CVSD方式での量子化幅
の変化の第3図と対応させてマクロ的にみると、
「OYA」においては振幅が大きいため量子化幅は
大きくなり、「OYA」と「SUMI」の間の無音区
間になると量子化幅はシラビツクフイルタの時定
数で小さくなる。通常、シラビツクフイルタの時
定数は16kHzのクロツクに対し4ms程度に選ば
れているので、有音区間でいかに量子化幅が大き
くなつても、100ms前後の時間幅が多くを占め
る無音区間では量子化幅は最小の値に落着き、グ
ラニユラデイストーシヨンは抑えられる。従つ
て、無音区間に続く有音区間、例えば「SUMI」
が始まる初期では、最小の量子化幅で符号化が行
なわれることになり、ミクロ的にみれば
「SUMI」の初期においてほとんどの場合フロー
プオーバーロードが生じてしまう。 一般的な音声信号の性質として、各音節の始点
は音韻性、明瞭性にかかわる重要な部分である。
例えば単音節の中で破裂音のエンベロープ波形を
みると、第4図に示すように始点から10〜100m
sの期間は破裂部A、バズB、気音部C、出わた
り部D等を含み、これらの部分が歪なく符号化さ
れないと、別の音のように聞えてしまうなど、音
韻がはつきりしない結果となる。 このように、従来のCVSD等の適応型デルタ変
調方式では、特に無音区間が比較的長く続き量子
化幅がほぼ最小に落着いた状態の後の有音区間初
期において音声信号波形の変化に対する量子化幅
の変化の追従性が悪いため、スロープオーバーロ
ードが生じ易く、これが再生音声の明瞭度を損う
原因となつていた。 この発明の目的は、適応型デルタ変調により符
号化されたデータを含むデイジタルデータから元
の音声信号波形を再生するに際し、有音区間初期
に生じているスロープオーバーロードを補償して
明瞭度を上げることができる音声再生装置を提供
することにある。 この発明は、メモリから読出されるデイジタル
データの無音区間を検出し、この無音区間の一部
または全期間にわたりデコーダに対し沈黙パター
ンの代りに量子化幅を最小量子化幅よりも大きく
するための特定のデイジタルデータを供給し、さ
らにその期間中はデコーダの出力を無音レベルに
保持することを特徴としている。 このようにすると、有音区間初期ではデコーダ
において量子化幅が強制的に速く増大させられる
ことによつて、明瞭度に大きな影響を及ぼす有音
区間初期でのスロープオーバーロードを再生時に
補償することができる。また、この特定のデジタ
ルデータがデコーダに供給される期間中は、デコ
ーダの出力が無音レベルに保持されるため、この
デイジタルデータに起因する雑音が再生音声信号
波形に生ずることはない。 以下、この発明の実施例を図面に参照して説明
する。 第5図はこの発明の一実施例に係る音声再生装
置の構成を示したものである。図において、メモ
リ51には音声信号波形を適応型デルタ変調方式
により符号化したデータ、例えば第2図aのエン
コーダにより符号化したデータを含むデイジタル
データが記憶されている。このメモリ51の内容
はコントローラ52を介して読出され、デコーダ
53を通して元の音声信号波形が再生される。デ
コーダ53は例えば第2図bと同様の構成のもの
で、コントローラ52を介して送られてくるデイ
ジタルデータをエステイメイトフイルタ21を通
して掛算器22に導き、シフトレジスタ23およ
びEX−OF回路24で検出されたデータをシラビ
ツクフイルタ25を通して積分した値によつて掛
算器22のゲインを制御して、第1図a,bの1
に示すような階段波形を作り、これを後述するア
ナログスイツチ55を通し、さらにローパスフイ
ルタ26を通して不要高域成分を除去することに
よつて元のアナログの音声信号波形を再生する。
クロツク発振器54が発生するクロツクは、コン
トローラ52を介してメモリ51へ読出し用クロ
ツクとして与えられ、さらにシフトレジスタ53
におけるシフトレジスタ23へ復調用クロツクと
して供給される。 コントローラ52は、次のようにしてデコーダ
53へのデイジタルデータの入力およびアナログ
スイツチ55の動作等を制御する。 第6図はメモリ51における記憶フオーマツト
の一例を示したもので、同図aに示すようにエン
コーダによつて得られた符号化データ61は1バ
イト(図の例では1バイトは8ビツトからなる)
ずつ番地62に対応づけられて記憶されている。
ここで、Lは無音区間のデータ、Mは有音区間の
データの領域を示している。一方、メモリ51内
にはさらに第6図bに示すように、有音区間始点
の番地K+3、K+i、……を示すデータ63が
やはり番号64に対応づけられて記憶されてい
る。この第6図bに示すようなテーブルを作るた
めには、エンコーダにおいて音声信号波形を符号
化する際、音声信号波形の有音区間始点を検出す
る毎に、その符号化データが書込まれる番地をM
番地より順次書込んでゆけばよい。その場合、音
声信号波形の有音区間と無音区間との判別を行な
う必要があるが、これには第7図に示すような回
路を用いればよい。すなわち、音声信号71のレ
ベルを立上り、立下りの時定数が最適に設定され
たレベル検出器72で検出し、その検出出力を閾
値Vthが最適に設定されたコンパレータ73に通
すことにより、第3図bに示したような有無−無
音判別信号74を得ることができる。 コントローラ52は、通常はメモリ51内の第
6図aに示した符号化データ61をそのままデコ
ーダ53へ送出するが、メモリ51内の第6図b
に示す有音区間始点番地を示すデータ63から、
次に読出されるべき符号化データ61の有音区間
始点番地、例えばK+3を知り、その番地よりτ
時間前の無音区間のデータが書込まれている番地
を算出する。ここで、例えばτ=4ms、サンプ
リング周波数を16kHzとすれば、K+3番地より
τ時前の無音区間のデータが書込まれている番地
は、K+3番地より16×4=64ビツト前、つまり
8バイト前の番地K−5となる。そして、コント
ローラ52はメモリ51からこの番地K−5の内
容を読出すタイミングになると、メモリ51に記
憶されている符号化データ(無音区間のデータ)
のデコーダ53への送出を停止し、それに代えて
デコーダ53における量子化幅を最小量子化幅よ
りも大きくするための特定のデイジタルデータを
τ時間、つまり有音区間始点番地K+3のデータ
をメモリ51から読出すタイミングの直前まで
(K+2番地のデータを読出すべきタイミングま
で)の期間、デコーダ53へ供給する。 ここで、上記の量子化幅を最小量子化幅よりも
大きくするための特定のデイジタルデータとは、
この実施例においてはデコーダ53におけるミラ
ビツクフイルタ25をアクテイブな状態とするた
めのデータであり、換言すれば“1”または
“0”が3ビツト以上連続するものである。 一般的には、デコーダが入力されるデイジタル
の連続するMビツトが同じ値になつたとき量子化
幅が増加するものとすれば、このデイジタルデー
タは同じ値がMビツト以上連続するものであれば
よい。この例ではこのデイジタルデータとして、
次表の如く“1”、“0”が8ビツトずつ交互に連
続するものを用いることにする。
The present invention relates to an audio reproduction device that reproduces an original audio signal waveform from digital data including data obtained by encoding an audio signal waveform using an adaptive delta modulation method. As is well known, the delta modulation method, which is one of the audio signal waveform encoding methods, uses a sufficiently large sampling frequency to increase the correlation between adjacent sample values so that the difference in amplitude falls within a certain range. This is a method in which the magnitude relationship of the amplitudes is then expressed and encoded using one bit, ``1'' or ``0''. It is known that this delta modulation method is accompanied by two types of distortion in principle. One of them is called slope overload, and as shown in Figure 1a, the output of the local D/A converter in the delta modulation encoder responds to a steep change in the input audio signal waveform 1. This is distortion caused by the inability of waveform 2 to follow. 3 indicates encoded data. The other type is called granular distortion. As shown in Figure 1b, when the input audio signal waveform 1 does not change much over time, the output waveform of the local D/A converter 2 operates increase/decrease,
This is due to the fact that the encoded data 3 alternately repeats "1" and "0". An adaptive delta modulation method that adaptively changes the quantization width depending on the amplitude of the audio signal was devised as a method for reducing these two types of distortion. In other words, if the data that encodes the audio signal waveform is continuously "1" or "0", slope overload has occurred, so the quantization width is increased, and when the data is constantly changing, the quantization width is increased. Since distortion occurs, the quantization width is conversely reduced. Figures 2a and b show CVSD (Continuous Variable Slope Delta), which is a type of adaptive delta modulation method.
2 shows an example of a configuration of an encoder side and a decoder side in an audio recording and reproducing apparatus using a modulation method. On the encoder side, the input audio signal 11 is passed through a low-pass filter 12 and subtracted by a comparator 13, and then retimed by a clock CLK in a D-flip-flop 14 to become encoded data. In the basic delta modulation method, the comparison level of the comparator 13 is given by the output of the estimate filter 15 (corresponding to a local D/A converter), and its step, that is, the quantization width, is constant. The width of the change is continuously and adaptively controlled. That is, if the waveform of the input audio signal 11 changes suddenly and the encoded data has 3 or more bits of "1" or "0" continuously,
This is detected by the shift register 16 and the EX-OR circuit 17, and the output of the syllabi filter 18 is integrated, so that the gain of the multiplier 19 provided on the output side of the estimate filter 15 increases, and the quantization is performed. The width increases sequentially for each bit. This suppresses slope overload. On the other hand, when the waveform of the input audio signal 11 does not change much over time, the filter 1
As the output of 8 decreases, the gain of the multiplier 19 decreases, and the quantization width gradually decreases.
Granular distortion can be suppressed. On the decoder side, Estmate filter 21,
A configuration consisting of a multiplier 22, a shift register 23, an EX-OR circuit 24, a syllabi filter 25, and a low-pass filter 26 performs an operation opposite to that of the encoder, and a reproduced audio signal 27 is obtained. However, even with adaptive delta modulation methods such as the CVSD method, there are still problems that need to be improved in terms of the clarity of reproduced speech. This problem is explained in the third
This will be explained using FIG. Figure 3a shows the envelope waveform of the audio signal when the Japanese word "Oyasuminojikan" is spoken at a normal speed, and Figure 3b shows the sound/silence discrimination signal corresponding to this audio signal. ing. In FIG. 3b, H represents a sound section and L represents a silent section. According to this, for example, the silent interval between "OYA" and "SUMI" is approximately 120 ms. Generally, in normal conversation, there are quite a few silent periods of around 100 ms, including between words and syllables. Looking at it macroscopically in relation to Figure 3, which shows the change in quantization width in the CVSD method,
Since the amplitude of "OYA" is large, the quantization width becomes large, and in the silent section between "OYA" and "SUMI", the quantization width becomes smaller due to the time constant of the Silavik filter. Normally, the time constant of the Silavik filter is selected to be about 4ms with respect to a 16kHz clock, so no matter how large the quantization width is in a sound section, in a silent section where the time width is mostly around 100ms, the quantization width is The distortion width settles to the minimum value, and granular distortion is suppressed. Therefore, a sound section following a silent section, for example "SUMI"
At the beginning of SUMI, encoding is performed with the minimum quantization width, and from a microscopic perspective, flop overload occurs in most cases at the beginning of SUMI. As a general characteristic of speech signals, the starting point of each syllable is an important part related to phonology and intelligibility.
For example, if we look at the envelope waveform of a plosive in a monosyllable, we can see that it is 10 to 100 meters from the starting point, as shown in Figure 4.
The period of s includes plosive part A, buzz B, aspiratory part C, and exit part D, etc., and if these parts are not encoded without distortion, the sound will sound like a different sound and the phonology will be distorted. The result is that the In this way, in conventional adaptive delta modulation methods such as CVSD, quantization is performed in response to changes in the audio signal waveform, especially at the beginning of a voiced period after a relatively long silent period and a state in which the quantization width has reached an almost minimum value. Due to the poor followability of changes in width, slope overload is likely to occur, which causes loss of clarity of reproduced audio. An object of the present invention is to improve intelligibility by compensating for slope overload occurring at the beginning of a sound section when reproducing an original audio signal waveform from digital data including data encoded by adaptive delta modulation. The purpose of the present invention is to provide an audio playback device that can perform the following tasks. The present invention detects a silent section of digital data read from a memory, and instructs a decoder to make a quantization width larger than a minimum quantization width instead of a silence pattern during part or all of the silent section. It is characterized by supplying specific digital data and maintaining the output of the decoder at a silent level during that period. In this way, the quantization width is forcibly increased rapidly in the decoder at the beginning of a voiced period, thereby compensating for the slope overload at the beginning of the voiced period, which has a large effect on intelligibility, during playback. Can be done. Furthermore, since the output of the decoder is maintained at a silent level during the period when this specific digital data is supplied to the decoder, noise caused by this digital data does not occur in the reproduced audio signal waveform. Embodiments of the present invention will be described below with reference to the drawings. FIG. 5 shows the configuration of an audio reproduction device according to an embodiment of the present invention. In the figure, a memory 51 stores digital data including data encoded by the adaptive delta modulation method of an audio signal waveform, for example, data encoded by the encoder shown in FIG. 2a. The contents of this memory 51 are read out via a controller 52, and the original audio signal waveform is reproduced via a decoder 53. The decoder 53 has, for example, a configuration similar to that shown in FIG. The gain of the multiplier 22 is controlled by the value obtained by integrating the obtained data through the Silavik filter 25, and
The original analog audio signal waveform is reproduced by creating a staircase waveform as shown in FIG. 2, passing it through an analog switch 55 (described later), and removing unnecessary high-frequency components through a low-pass filter 26.
The clock generated by the clock oscillator 54 is provided as a reading clock to the memory 51 via the controller 52, and is further provided to the shift register 53.
The signal is supplied to the shift register 23 as a demodulation clock. The controller 52 controls the input of digital data to the decoder 53, the operation of the analog switch 55, etc. in the following manner. FIG. 6 shows an example of the storage format in the memory 51. As shown in FIG. )
Each address is stored in association with address 62.
Here, L indicates a data area of a silent section, and M indicates an area of data of a sound section. On the other hand, in the memory 51, as shown in FIG. 6b, data 63 indicating addresses K+3, K+i, . In order to create the table shown in FIG. 6b, when the encoder encodes the audio signal waveform, each time the start point of the voiced section of the audio signal waveform is detected, the address where the encoded data is written is set. M
You can write them in order starting from the address. In that case, it is necessary to discriminate between a sound section and a silent section of the audio signal waveform, and a circuit as shown in FIG. 7 may be used for this purpose. That is, the level of the audio signal 71 is detected by a level detector 72 whose rising and falling time constants are optimally set, and the detection output is passed through a comparator 73 whose threshold value V th is optimally set. A presence/silence discrimination signal 74 as shown in FIG. 3b can be obtained. The controller 52 normally sends the encoded data 61 shown in FIG. 6a in the memory 51 to the decoder 53 as is, but the encoded data 61 shown in FIG.
From the data 63 indicating the starting point address of the sound section shown in
The start address of the sound section of the encoded data 61 to be read next, for example K+3, is known, and from that address τ
Calculate the address where the data of the silent section before the time is written. For example, if τ = 4 ms and the sampling frequency is 16 kHz, the address where the data of the silent period τ hours before address K+3 is written is 16 x 4 = 64 bits before address K+3, that is, 8 bytes. The previous address is K-5. Then, at the timing to read the contents of this address K-5 from the memory 51, the controller 52 reads out the encoded data (silent section data) stored in the memory 51.
The transmission to the decoder 53 is stopped, and instead, specific digital data for making the quantization width in the decoder 53 larger than the minimum quantization width is sent to the memory 51 for a time τ, that is, the data at the sound interval start point address K+3. The data is supplied to the decoder 53 for a period from 1 to 2 until immediately before the read timing (until the timing at which data at address K+2 is to be read). Here, the specific digital data for making the above quantization width larger than the minimum quantization width is:
In this embodiment, this is data for activating the Miravic filter 25 in the decoder 53, in other words, it is data of three or more consecutive "1" or "0" bits. In general, if the quantization width is assumed to increase when consecutive M bits of digital input to the decoder become the same value, then if this digital data has the same value consecutively for M bits or more, then the quantization width increases. good. In this example, this digital data is
As shown in the following table, 8 bits of "1" and "0" are alternately consecutive.

【表】 この表で対応番地とは、右に示す置換デイジタ
ルデータに置換されたデコーダ53へ供給される
べきメモリ51内の番地を表わす。 このようにして、無音区間内のτ時間の期間沈
黙パターンを“1”、“0”が8ビツトづつ連続す
るデイジタルデータに置換してデコーダ53へ供
給したときの掛算器22の出力波形を第8図aに
示す。この図から分るように、τの期間内に量子
化幅△は沈黙パターンがデコーダ53に入力され
たときの量子化(最小量子化幅)△より大きく
なつており、有音区間始点t0における量子化幅は
十分大きく設定される。 従つて、掛算器22の出力をローパスフイルタ
26を通して得られる再生音声信号波形は、有音
区間初期の部分においても元の音声信号波形の変
化によく追従したものとなる。すなわち、適応型
デルタ変調で問題となつていた有音区間初期での
スロープオーバーロードが再生時において補償さ
れることにより、音韻性が明確化し、明瞭度が大
きく向上する。 ところで、第8図aの波形をそのままローパス
フイルタ26に通すと、τの期間の波形が雑音と
して現われてしまう。そこでτの期間は無音区間
なので、第8図bの制御信号によりローパスフイ
ルタ26の入力側に設けられたアナログスイツチ
55を直流的にOVの基準電位点E側に切換え
る。このようにすると、ローパスフイルタ26の
入力波形は第8図cのようにτの期間において直
流的に0レベルとなり、ローパスフイルタ26の
出力は無音レベルとなるので、雑音は生じない。 なお、有音区間始点t0での量子化幅はτの時間
あるいはこのτの期間中にデコーダ53に供給さ
れるデイジタルデータの内容によつて変化する。
しかし、この量子化幅を大きくすると、スロープ
オーバーロードはより少なくなるが、量子化雑音
も増加するので、その点も考慮することが必要で
ある。但し、有音区間が子音から始まる場合など
では、量子化雑音がむしろ大きい方が子音の駆動
音源的効果をよく示し、音韻性はより明確にな
る。 この発明は種々変形して実施が可能である。例
えば量子化幅を大きくするためのデイジタルデー
タとしては、モリ51内の有音区間の符号化デー
タの適当なものを利用してもよい。また、このデ
イジタルデータをメモリ51内の無音区間の符号
化データと置換える時間τは、無音区間全期間と
してもよい。 また、アナログスイツチ55はτの期間にゲイ
ンが零あるいは十分小さくなるように制御される
ようにした電圧制御可変利得増幅器に置換えても
よい。 一方、メモリ51における記憶フオーマツトと
しては、無音区間内のデータとして“1”、“0”
を交互に繰返す沈黙パターンを記憶する代りに、
無音区間の発生タイミングを示すコードと、その
時間長を示すデータを記憶してもよい。このよう
にすると、メモリ51の容量を節約できる。 さらに、実施例ではCVSD方式にこの発明を適
用した例を説明したが、この発明はCVSD方式以
外の適応型デルタ変調によつて符号化されたデー
タを含むデイジタルデータをメモリから読出して
元の音声信号波形を再生する装置にも適用が可能
である。
[Table] In this table, the corresponding address represents the address in the memory 51 to be supplied to the decoder 53, which has been replaced with the replacement digital data shown on the right. In this way, the output waveform of the multiplier 22 when the silence pattern during the period of time τ in the silent interval is replaced with digital data consisting of 8 consecutive bits of "1" and "0" and supplied to the decoder 53 is calculated as follows. It is shown in Figure 8a. As can be seen from this figure, within the period of τ, the quantization width △ is larger than the quantization (minimum quantization width) △ 0 when the silence pattern is input to the decoder 53, and the sound interval start point The quantization width at 0 is set sufficiently large. Therefore, the reproduced audio signal waveform obtained by passing the output of the multiplier 22 through the low-pass filter 26 closely follows the changes in the original audio signal waveform even in the early part of the sound section. That is, by compensating for the slope overload at the beginning of a voiced section, which has been a problem with adaptive delta modulation, during playback, the phonology becomes clearer and the intelligibility is greatly improved. By the way, if the waveform of FIG. 8a is directly passed through the low-pass filter 26, the waveform of the period τ will appear as noise. Therefore, since the period τ is a silent section, the analog switch 55 provided on the input side of the low-pass filter 26 is switched to the reference potential point E side of OV using the control signal shown in FIG. 8B. In this way, the input waveform of the low-pass filter 26 becomes 0 level in terms of direct current during the period τ as shown in FIG. 8c, and the output of the low-pass filter 26 becomes a silent level, so that no noise is generated. Note that the quantization width at the start point t 0 of the sound section changes depending on the time τ or the content of the digital data supplied to the decoder 53 during the period τ.
However, if the quantization width is increased, the slope overload will be reduced, but the quantization noise will also increase, so it is necessary to take this point into consideration. However, in cases such as when a voiced interval begins with a consonant, the larger the quantization noise, the better the driving sound source effect of the consonant, and the phonology becomes clearer. This invention can be implemented with various modifications. For example, as the digital data for increasing the quantization width, appropriate coded data of the sound section in the memory 51 may be used. Further, the time τ for replacing this digital data with the encoded data of the silent section in the memory 51 may be set to the entire period of the silent section. Further, the analog switch 55 may be replaced with a voltage-controlled variable gain amplifier whose gain is controlled to be zero or sufficiently small during the period τ. On the other hand, as for the storage format in the memory 51, the data in the silent section is "1" and "0".
Instead of memorizing alternating patterns of silence,
A code indicating the generation timing of the silent section and data indicating the length of time may be stored. In this way, the capacity of the memory 51 can be saved. Further, in the embodiment, an example in which the present invention is applied to the CVSD method has been described, but the present invention reads out digital data including data encoded by adaptive delta modulation other than the CVSD method from the memory and converts it to the original voice. It can also be applied to devices that reproduce signal waveforms.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図a,bはデルタ変調方式におけるスロー
ブオーバーロードおよびグラニユラデイストーシ
ヨンを説明するための図、第2図a,bはCVSD
方式のエンコーダおよびデコーダの一構成例を示
す図、第3図a,bは音声信号のエンベロープ波
形の一例とそれに対応する有音−無音判別信号波
形を示す図、第4図は破裂音のエンベロープ波形
のいくつかの例を示す図、第5図はこの発明の一
実施例に係る音声再生装置の構成を示す図、第6
図はメモリにおける記憶フオーマツトの一例を示
す図、第7図は有音−無音判別回路の一構成例を
示す図、第8図は同実施例の動作を説明するため
のタイムチヤートである。 51……メモリ、52……コントローラ、53
……デコーダ、54……クロツク発振器、55…
…アナログスイツチ。
Figures 1a and b are diagrams for explaining slowo overload and granular distortion in the delta modulation method, and Figures 2a and b are CVSD
Figures 3a and 3b are diagrams showing an example of the envelope waveform of a voice signal and the corresponding waveform of the speech-no-speech discrimination signal. Figure 4 is a diagram showing an example of the envelope waveform of a plosive. FIG. 5 is a diagram showing some examples of waveforms, FIG. 5 is a diagram showing the configuration of an audio reproduction device according to an embodiment of the present invention, and FIG.
7 is a diagram showing an example of a storage format in a memory, FIG. 7 is a diagram showing an example of the configuration of a sound/non-sound discrimination circuit, and FIG. 8 is a time chart for explaining the operation of the same embodiment. 51...Memory, 52...Controller, 53
...Decoder, 54...Clock oscillator, 55...
...Analog switch.

Claims (1)

【特許請求の範囲】 1 音声信号波形を適応型デルタ変調により符号
化した符号化データを含むデイジタルデータを記
憶したメモリと、このメモリから読出されるデイ
ジタルデータから元の音声信号波形を再生するデ
コーダと、前記メモリから読出されるデイジタル
データの無音区間を検出する手段と、この無音区
間の一部または全期間にわたり前記デコーダに対
し前記デコーダにおける量子化幅を最小量子化幅
よりも大きくするための特定のデイジタルデータ
を供給する手段と、この特定のデイジタルデータ
が前記デコーダに供給されている期間中前記デコ
ーダの出力を無音レベルに保持する手段とを具備
することを特徴とする音声再生装置。 2 デコーダは入力されるデイジタルデータの連
続するMビツトが同じ値になつたとき量子化幅が
増加するものであり、このデコーダに無音区間の
一部または全期間にわたり供給される特定のデイ
ジタルデータは同じ値がMビツト以上連続するも
のである特許請求の範囲第1項記載の音声再生装
置。
[Claims] 1. A memory that stores digital data including encoded data obtained by encoding an audio signal waveform using adaptive delta modulation, and a decoder that reproduces the original audio signal waveform from the digital data read from this memory. a means for detecting a silent section of digital data read from the memory; and a means for detecting a silent section of digital data read from the memory; An audio reproducing device comprising: means for supplying specific digital data; and means for maintaining the output of the decoder at a silent level while the specific digital data is being supplied to the decoder. 2. The decoder increases the quantization width when consecutive M bits of input digital data become the same value, and the specific digital data supplied to this decoder during part or all of the silent period is 2. The audio reproduction device according to claim 1, wherein the same value continues for M bits or more.
JP56120111A 1981-07-31 1981-07-31 Voice reproducer Granted JPS5821798A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56120111A JPS5821798A (en) 1981-07-31 1981-07-31 Voice reproducer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56120111A JPS5821798A (en) 1981-07-31 1981-07-31 Voice reproducer

Publications (2)

Publication Number Publication Date
JPS5821798A JPS5821798A (en) 1983-02-08
JPS6253093B2 true JPS6253093B2 (en) 1987-11-09

Family

ID=14778204

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56120111A Granted JPS5821798A (en) 1981-07-31 1981-07-31 Voice reproducer

Country Status (1)

Country Link
JP (1) JPS5821798A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62111492U (en) * 1985-12-29 1987-07-16
JPS6430097U (en) * 1987-08-17 1989-02-23

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0435320A (en) * 1990-05-28 1992-02-06 Matsushita Electric Ind Co Ltd 1-bit digital/analog converter
US6941067B2 (en) 2003-05-21 2005-09-06 Nikon Corporation Camera and multiple flash photographing system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62111492U (en) * 1985-12-29 1987-07-16
JPS6430097U (en) * 1987-08-17 1989-02-23

Also Published As

Publication number Publication date
JPS5821798A (en) 1983-02-08

Similar Documents

Publication Publication Date Title
US20080262856A1 (en) Method and system for enabling audio speed conversion
JPH10187188A (en) Method and device for speech reproducing
JPS6253093B2 (en)
JPS5982608A (en) System for controlling reproducing speed of sound
KR100251497B1 (en) Audio signal reproducing method and the apparatus
US6070135A (en) Method and apparatus for discriminating non-sounds and voiceless sounds of speech signals from each other
US7801630B2 (en) Method and apparatus for controlling recording levels
JPS5821799A (en) Voice reproducer
JP2838159B2 (en) Audio signal processing device
JP2905215B2 (en) Recording and playback device
WO1994024667A1 (en) Apparatus for recording and reproducing voice
KR0141237B1 (en) Audio signal recording/reproducing method
KR100201309B1 (en) Voice signal processing method for reproduction over triple speed
KR100194659B1 (en) Voice recording method of digital recorder
JP2526919B2 (en) Digital recording / playback device
JPH01173100A (en) Digital voice reproducing device
JPS5817500A (en) Voice reproducer
JP3829944B2 (en) Playback device
JP2962777B2 (en) Audio signal time-base expansion / compression device
JPS58111990A (en) Voice signal encoder
JPH07153188A (en) Voice reproducing device
JPH08255423A (en) Voice recorder
KR970023203A (en) Background sound synthesis method and apparatus therefor for variable reproduction of voice signal
JPH0411421A (en) Pulse code modulation transmitter
JPH07160300A (en) Voice recording device and voice reproducing device