JPS5912192B2 - audio playback device - Google Patents

audio playback device

Info

Publication number
JPS5912192B2
JPS5912192B2 JP56116075A JP11607581A JPS5912192B2 JP S5912192 B2 JPS5912192 B2 JP S5912192B2 JP 56116075 A JP56116075 A JP 56116075A JP 11607581 A JP11607581 A JP 11607581A JP S5912192 B2 JPS5912192 B2 JP S5912192B2
Authority
JP
Japan
Prior art keywords
phoneme
output
output filter
audio
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP56116075A
Other languages
Japanese (ja)
Other versions
JPS5817500A (en
Inventor
和雄 北川
英司 吉良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP56116075A priority Critical patent/JPS5912192B2/en
Publication of JPS5817500A publication Critical patent/JPS5817500A/en
Publication of JPS5912192B2 publication Critical patent/JPS5912192B2/en
Expired legal-status Critical Current

Links

Description

【発明の詳細な説明】 この発明は、デルタ変調方式(適応型デルタ変調方式も
含む)による音声記録再生システムや音5 声応答シス
テム等に用いられる音声再生装置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an audio reproducing device used in an audio recording/reproducing system, a five-voice response system, etc. using a delta modulation method (including an adaptive delta modulation method).

デルタ変調方式は、基本的には隣り合うサンプル値の差
分がある範囲におさまる程度に短く設定した周期で音声
信号波形等をサンプリングし、隣10り合うサンプル値
の大小関係のみを1ビットのデータで表わして量子化す
るものである。
The delta modulation method basically samples audio signal waveforms, etc. at a cycle set short enough to keep the difference between adjacent sample values within a certain range, and then converts only the magnitude relationship between 10 adjacent sample values into 1-bit data. It is expressed as and quantized.

第1図はその原理を示す波形図であり、aの入力信号波
形はまずbのような階段波形に変換される。このbの波
形は、デルタ変調用エンコーダにおける局部15D/A
コンバータの出力波形であり、デコーダの出力波形もこ
れと同じとなる。そしてbの波形がcに示ず゛1’’、
’゛o’’のデータ列として伝送あるいはメモリに蓄積
される。このデルタ変調方式の最大の長所は、比較的簡
J 単な・・−トウエアにより比較的低ビットレートの
符号化ができることにあるが、反面、その忠実度の低い
ことが短所として挙げられる。
FIG. 1 is a waveform diagram showing the principle, and the input signal waveform of a is first converted into a staircase waveform as shown in b. This waveform of b is the local 15D/A in the delta modulation encoder.
This is the output waveform of the converter, and the output waveform of the decoder is also the same. And the waveform of b is not shown in c, ``1'',
It is transmitted or stored in memory as a data string of '゛o''. The greatest advantage of this delta modulation method is that it can be encoded at a relatively low bit rate with relatively simple software, but its disadvantage is that it has low fidelity.

忠実度が低い現象の一つは、グラニユラーノイズと呼ば
れるもので、第1図aの入力信号波形の小振幅もしく2
5は無信号の部分11で、差分データに交互に゛01一
゛0’’が生じてbの局部D/Aコンバータの出力波形
がサンプリグ周期で振動し、cの符号化データに交互に
゛゛1’’、゛00’’が現れてしまうことによるノイ
ズである。もう一つはオーバースロープ30ロードと呼
ばれるもので、第1図aの入力信号波形の急傾斜の部分
12の変化にbの局部D/Aコンバータの出力波形が追
従しきれないことによつて発生する歪である。これらの
短所を補う方法として、入力信号波形35の差分データ
が交互に゛゛1’’、゜゛O’’となつた場合は、グラ
ニユーラノイズを低減すべく局部D/Aコンバータ出力
波形における量子化ステツプ幅を徐々に小さくし、また
差分データが例えば3〜4個以上連続して″11または
60゛となつた場合は、逆に量子化ステツプ幅を徐々に
大きくしてオーバスロープロードを軽減させる方式の、
適応型デルタ変調方式が既に実用化されており、かなり
の改善をみている。
One phenomenon with low fidelity is called granular noise, which occurs when the input signal waveform shown in Figure 1a has a small amplitude or
5 is a no-signal portion 11, in which "01-0" alternately occur in the differential data, the output waveform of the local D/A converter b oscillates at the sampling period, and the encoded data c alternately exhibits "0". This is noise caused by the appearance of 1'' and ``00''. The other type is called overslope 30 load, which occurs when the output waveform of the local D/A converter shown in b cannot follow the change in the steeply sloped portion 12 of the input signal waveform shown in Figure 1 a. It is a distortion that causes As a method to compensate for these shortcomings, when the difference data of the input signal waveform 35 is alternately ``1'' and ゜゛O'', quantization in the local D/A converter output waveform is performed to reduce granular noise. Gradually reduce the step width, and if the difference data becomes ``11'' or ``60'' for 3 or 4 or more pieces in a row, conversely, gradually increase the quantization step width to reduce the overslope load. of the method,
Adaptive delta modulation schemes are already in use and have shown considerable improvement.

しかし、適応型も含めてデルタ変調方式においてはもう
一つの大きな歪が生ずる。
However, another large distortion occurs in the delta modulation method, including the adaptive type.

これはサンプリング周波数の整数分の1と入力信号周波
数とのビードのようなもので、比較的サンプリング周波
数が低いときに大きなノイズとなる。例えばサンプリン
グ周波数が16kHzで、第2図aに示すような急傾斜
(大レベル)の1kHzの入力信号が到来した場合、局
部D/Aコンバータの出力波形はbのようになり、従つ
て符号化データはcのように1r゛と10”が8個ずつ
連続したものとなる。ここで、入力信号周波数が1kH
zの16/15の1.067kHzになると、その1波
を15ビツトで表現せねばならず、その場合、例えば局
部D/Aコンバータの出力波形は第3図aとなり、符号
化データはbのように01″と00″が8ーJメ[Jヨ黷
Wビットずつといつた具合に連続し、1波毎に大きく歪
む。同様に入力信号周波数が1kHzの32/31の1
.032kHzのときは、局部D/Aコンバータの出力
波形および符号化データは第4図A,bのようになり、
2波毎に大きく歪む。これらの歪は再生時、特にレベル
が比較的大きいとき、カサカサという背景ノイズとなつ
て現れ、非常に耳障りとなる。従来、この現象の対策と
して、復調された波形に対して高域側カツトオフ周波数
が比較的低い出カフイルタで高域をカツトしている。
This is like a bead between an integer fraction of the sampling frequency and the input signal frequency, and becomes a large noise when the sampling frequency is relatively low. For example, if the sampling frequency is 16kHz and a 1kHz input signal with a steep slope (large level) as shown in Figure 2a arrives, the output waveform of the local D/A converter will be as shown in b, and therefore the encoding The data consists of 8 consecutive 1r゛ and 10'' as shown in c.Here, the input signal frequency is 1kHz.
When the frequency reaches 1.067kHz, which is 16/15 of z, one wave must be expressed with 15 bits.In that case, for example, the output waveform of the local D/A converter is as shown in Figure 3a, and the encoded data is as shown in b. So 01″ and 00″ are 8-J
It continues in such a way that each wave is W bits at a time, and each wave is greatly distorted. Similarly, when the input signal frequency is 1kHz, 1 of 32/31
.. At 0.032kHz, the output waveform and encoded data of the local D/A converter are as shown in Figure 4A and b,
Significant distortion occurs every second wave. These distortions appear as rustling background noise during playback, especially when the level is relatively high, and are extremely annoying. Conventionally, as a countermeasure to this phenomenon, high frequencies have been cut off using an output filter whose cutoff frequency on the high frequency side is relatively low relative to the demodulated waveform.

例えば適応型デルタ変調方式の1種であるCVSD(C
OntinuOusV訂1ab1eS10peDe1t
aM0(KlratiOn)方式による市販の音声合成
システムで、サンプリング周波数14kHzのものでは
、1kHz付近で数DBのピークを持ち、−18dB/
0ctの減衰特性を持つ出力フイルタを用いている。
For example, CVSD (C
OntinuOusVedition1ab1eS10peDelt
A commercially available speech synthesis system using the aM0 (KlratiOn) method with a sampling frequency of 14 kHz has a peak of several DB around 1 kHz, and -18 dB/
An output filter with an attenuation characteristic of 0ct is used.

しかしながら、このような出力フイルタで高域をカツト
すると、前記の背景ノイズは目立たなくなるが、それに
伴い再生される音声の明瞭度がかなり損なわれてしまい
、好ましくない。この発明の目的は、音声信号波形をデ
ルタ変調により符号化したデータから元の音声を再生す
るに際し、明瞭度を損なうことなく背景ノイズを低減す
ることができる音声再生装置を提供することにある。一
般に、音声の明瞭度は音声信号波形のうち音韻開始部、
つまり音韻開始始点からある期間の波形によつて大きく
左右され、特に子音部でその傾向が強い。
However, if such an output filter cuts out the high frequency range, the background noise will become less noticeable, but the clarity of the reproduced audio will be considerably impaired, which is not preferable. An object of the present invention is to provide an audio reproduction device that can reduce background noise without impairing clarity when reproducing original audio from data obtained by encoding an audio signal waveform by delta modulation. Generally speaking, speech intelligibility is determined by the phonological beginning part of the speech signal waveform,
In other words, it is greatly influenced by the waveform for a certain period from the beginning of the phoneme, and this tendency is particularly strong in consonant parts.

また子音部では、2kHz前後の比較的周波数の高い成
分が多くを占めている。従つて、音韻開始部の波形が十
分高い周波数成分まで得られれば、再生される音声の明
瞭度は大きく向上する。一方、第3図、第4図で説明し
た歪は前述したように大レベルの部分で主に発生し、音
韻開始部のような低レベルの部分では発生しにくい。こ
の発明は、このような点に着目してなされたもので、符
号化データから音声信号波形を復調するデコーダの出力
側に設けられる出力フイルタを帯域可変とし、符号化デ
ータの音韻開始時点から一定時間の間はこの出力フイル
タの高域側カツトオフ周波数を高い方に移動させること
によつて、常時は出力フイルタで背景ノイズの原因とな
る歪成分を除去し、音韻開始部の波形は十分高域側まで
通して、明瞭度を上げるようにしたものである。以下、
この発明の実施例を図面を参照して説明する。第5図は
この発明の一実施例の概略的な構成を示したものである
Furthermore, in the consonant part, relatively high frequency components of around 2 kHz occupy the majority. Therefore, if the waveform at the beginning of a phoneme is obtained with sufficiently high frequency components, the clarity of the reproduced speech will be greatly improved. On the other hand, the distortion explained in FIGS. 3 and 4 mainly occurs in high-level portions as described above, and is less likely to occur in low-level portions such as the beginning of a phoneme. This invention was made with attention to these points, and the output filter provided on the output side of the decoder that demodulates the audio signal waveform from the encoded data has a variable band, so that the output filter remains constant from the start of the phoneme of the encoded data. By moving the cutoff frequency on the high-frequency side of this output filter to a higher side during the period, the output filter normally removes distortion components that cause background noise, and the waveform at the beginning of the phoneme is kept in a sufficiently high frequency range. This was done to improve clarity by passing it all the way to the side. below,
Embodiments of the invention will be described with reference to the drawings. FIG. 5 shows a schematic configuration of an embodiment of the present invention.

メモリ51は音声信号波形をデルタ変調(適応型デルタ
変調も含む)により符号化した符号化データを蓄積した
もので、その内容はコントローラ52からの制御で順次
読出される。このメモリ51の出力データは、クロツク
信号CKに従つて動作するデコーダ53で復調されて、
第1図、第2図のbあるいは第3図、第4図のaに示す
ような階段波となる。そして、デコーダ53の出力は出
力フイルタ54で平滑された後、音声増幅器55、スピ
ーカ56を通して音声として再生される。コントローラ
52はメモリ51の出力データの音韻開始時点を検出す
る機能を持つており、この時点から一定時間、例えば1
50ms程度の間だけ、出力フイルタ54の周波数特性
を第6図に示すように高域側カツトオフ周波数がf1で
ある特性61から、高域側カツトオフ周波数がF2であ
る特性62に切換える。
The memory 51 stores encoded data obtained by encoding the audio signal waveform by delta modulation (including adaptive delta modulation), and its contents are sequentially read out under control from the controller 52. The output data of this memory 51 is demodulated by a decoder 53 which operates according to the clock signal CK.
This results in a staircase wave as shown in b in FIGS. 1 and 2 or a in FIGS. 3 and 4. The output of the decoder 53 is smoothed by an output filter 54 and then reproduced as audio through an audio amplifier 55 and a speaker 56. The controller 52 has a function of detecting the start point of a phoneme in the output data of the memory 51, and continues for a certain period of time from this point, for example, 1
Only for about 50 ms, the frequency characteristic of the output filter 54 is switched from a characteristic 61 in which the high cutoff frequency is f1 to a characteristic 62 in which the high cutoff frequency is F2, as shown in FIG.

ここでf1、F2は例えばf1=1.2kHz,f2=
2.4kHz程度に選ばれる。これによつて、デコーダ
53の出力のうち明瞭度を大きく左右する音韻開始部の
波形は、出力フイルタ54を十分高い周波数まで通過す
るので、スビーカ56で再生される音声の明瞭度が向上
し、さらに音韻開始部以外の大レベル領域で発生する歪
は、高域成分であるが故に出力フイルタ54でほとんど
除去されるため、スピーカ56から背景ノイズとして聞
えることはない。第7図にコントローラ52の具体的な
構成例を示す。
Here, f1 and F2 are, for example, f1=1.2kHz, f2=
The frequency is selected to be approximately 2.4kHz. As a result, the waveform at the beginning of the phoneme, which greatly affects the intelligibility of the output of the decoder 53, passes through the output filter 54 to a sufficiently high frequency, so that the intelligibility of the speech reproduced by the speaker 56 is improved. Furthermore, since the distortion occurring in the high-level region other than the beginning of a phoneme is a high-frequency component, it is almost completely removed by the output filter 54, so that it is not heard as background noise from the speaker 56. FIG. 7 shows a specific example of the configuration of the controller 52.

アドレスカウンタ71は第5図のメモリ51の読出しア
ドレスを指定するもので、デコーダ52と同じクロック
信号CKが1個与えられる毎にメモリ51へ与えるアド
レスを1つずつインクリメントする。この読出しアドレ
スはコンパレータ72で音韻開始アドレステーブル73
に予め蓄積されているデータ、すなわちメモリ51内の
音韻開始時点のデータのアドレスの情報のうちの対応す
るものと比較される。コンパレータ72は両者の一致を
検出するとパルスを1個出力して、テーブルカウンタ7
4をカウントアップさせることにより音韻開始アドレス
テーブル73に次にメモリ51の読出しアドレスと比較
すべきデータの出力を準備させるとともに、単安定マル
チバイブレータ(モノマルチ)75を起動させ、一定幅
のパルス76を発生せしめる。モノマルチ75の出カパ
ルス76は、出力フイルタ51へ制御信号として与えら
れる。一方、出力フイルタ54は例えば第8図に示すよ
うに、オペアンプ81とRC回路82からなる2次のロ
ーバスフイルタに、RC回路82の抵抗を切換える電子
的スイツチ83,84を付加したもので、このスイツチ
83,84が第7図のモノマルチ75の出力パルス76
によつてオン状態となることにより、高域側カツトオフ
周波数がf1からF2に切換わるように構成されている
The address counter 71 specifies the read address of the memory 51 shown in FIG. 5, and increments the address given to the memory 51 by one every time the same clock signal CK as the decoder 52 is applied. This read address is read from the phoneme start address table 73 by the comparator 72.
It is compared with the corresponding data stored in advance in the memory 51, that is, the address information of the data at the beginning of the phoneme in the memory 51. When the comparator 72 detects a match between the two, it outputs one pulse and the table counter 7
By counting up 4, the phoneme start address table 73 prepares the output of data to be compared with the next read address of the memory 51, and at the same time, a monostable multivibrator (mono multi) 75 is activated, and a pulse 76 of a constant width is activated. to occur. The output pulse 76 of the monomulti 75 is given to the output filter 51 as a control signal. On the other hand, the output filter 54 is, for example, as shown in FIG. 8, a secondary low-pass filter consisting of an operational amplifier 81 and an RC circuit 82, with electronic switches 83 and 84 added thereto to switch the resistance of the RC circuit 82. These switches 83 and 84 are the output pulse 76 of the monomulti 75 in FIG.
When the switch is turned on, the cutoff frequency on the high frequency side is switched from f1 to F2.

この発明は上記実施例に限定されず、種々変形して実施
が可能である。例えば、実施例では音声信号波形をデル
タ変調により符号化した符号化データが、メモリから読
出されたものとして説明したが、音声伝送システムにお
いて伝送されてきたものであつても同様にこの発明を適
用することができる。また、実施例では出力フイルタと
して1個のフイルタを用いて、その高域側カットオフ周
波数を切換えるようにしたが、高域側カツトオフ周波数
の異なる2個の出力フイルタを切換えて使用してもよい
ことは勿論である。
This invention is not limited to the above embodiments, and can be implemented with various modifications. For example, in the embodiment, the encoded data obtained by encoding the audio signal waveform by delta modulation has been described as being read out from the memory, but the present invention is similarly applicable to data transmitted in an audio transmission system. can do. Furthermore, in the embodiment, one filter is used as the output filter, and its high-frequency cutoff frequency is switched, but two output filters with different high-frequency cutoff frequencies may be switched and used. Of course.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図はデルタ変調方式の原理を説明するための波形図
、第2図は入力信号周波数がサンプリング周波数の整数
分の1のときの波形図、第3図および第4図は入力信号
周波数がサンプリング周波数の整数分の1でないときの
波形図、第5図はこの発明の一実施例に係る音声再生装
置の概略的構成を示す図、第6図はその動作を説明する
ための出力フイルタの特性図、第7図は同実施例におけ
るコントローラの構成例を示す図、第8図は同実施例に
おける出力フイルタの構成例を示す図である。 51・・・・・・メモリ、52・・・・・・コントロー
ラ、53・・・・・・デコーダ、54・・・・・・出力
フイルタ、55・・・・・・音声増幅器、56・・・・
・・スピーカ。
Figure 1 is a waveform diagram to explain the principle of the delta modulation method, Figure 2 is a waveform diagram when the input signal frequency is an integer fraction of the sampling frequency, and Figures 3 and 4 are waveform diagrams when the input signal frequency is an integer fraction of the sampling frequency. A waveform diagram when the sampling frequency is not an integer fraction, FIG. 5 is a diagram showing a schematic configuration of an audio reproduction device according to an embodiment of the present invention, and FIG. 6 is a diagram of an output filter for explaining its operation. A characteristic diagram, FIG. 7 is a diagram showing an example of the configuration of the controller in the same embodiment, and FIG. 8 is a diagram showing an example of the configuration of the output filter in the same embodiment. 51...Memory, 52...Controller, 53...Decoder, 54...Output filter, 55...Audio amplifier, 56...・・・
...Speaker.

Claims (1)

【特許請求の範囲】 1 音声信号波形をデルタ変調により符号化した符号化
データから音声信号波形を復調するデコーダと、このデ
コーダの出力が入力される出力フィルタと、この出力フ
ィルタの出力から音声を再生する手段と、前記符号化デ
ータの音韻開始時点を検出する手段と、この音韻開始時
点から一定時間前記出力フィルタの高域側カットオフ周
波数を高い方に移動させる制御手段とを備えることを特
徴とする音声再生装置。 2 符号化データはメモリから読出されるものであり、
符号化データの音韻開始時点を検出する手段は、上記メ
モリ内の音韻開始時点のデータを蓄積したアドレスと上
記メモリの読出しアドレスとの一致時点を検出するもの
である特許請求の範囲第1項記載の音声再生装置。 3 出力フィルタは高域側カットオフ周波数を切換える
ための電子的スイッチ素子を有するものであり、制御手
段は音韻開始時点で起動されて上記スイッチ素子を制御
する一定幅の制御パルスを発生する単安定マルチバイブ
レータである特許請求の範囲第1項記載の音声再生装置
[Claims] 1. A decoder that demodulates an audio signal waveform from coded data obtained by encoding the audio signal waveform by delta modulation, an output filter to which the output of this decoder is input, and an output filter that outputs audio from the output of this output filter. It is characterized by comprising means for reproducing, means for detecting a phoneme start point of the encoded data, and control means for moving the high-frequency side cutoff frequency of the output filter upward for a certain period of time from the phoneme start point. Audio playback device. 2 Encoded data is read from memory,
Claim 1, wherein the means for detecting the start point of a phoneme of encoded data detects a point in time when an address in the memory at which data at the start point of a phoneme is stored matches a read address of the memory. audio playback device. 3. The output filter has an electronic switching element for switching the high-side cutoff frequency, and the control means is a monostable type that is activated at the start of a phoneme and generates a control pulse of a constant width to control the switching element. The audio reproduction device according to claim 1, which is a multivibrator.
JP56116075A 1981-07-24 1981-07-24 audio playback device Expired JPS5912192B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56116075A JPS5912192B2 (en) 1981-07-24 1981-07-24 audio playback device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56116075A JPS5912192B2 (en) 1981-07-24 1981-07-24 audio playback device

Publications (2)

Publication Number Publication Date
JPS5817500A JPS5817500A (en) 1983-02-01
JPS5912192B2 true JPS5912192B2 (en) 1984-03-21

Family

ID=14678085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56116075A Expired JPS5912192B2 (en) 1981-07-24 1981-07-24 audio playback device

Country Status (1)

Country Link
JP (1) JPS5912192B2 (en)

Also Published As

Publication number Publication date
JPS5817500A (en) 1983-02-01

Similar Documents

Publication Publication Date Title
KR100263825B1 (en) Copyright information embedding apparatus
EP0637011B1 (en) Speech signal discrimination arrangement and audio device including such an arrangement
KR910006441B1 (en) Analog and digital signal apparatus
EP0240286B1 (en) Low-pitched sound creator
JP3401171B2 (en) Audio information processing method, audio information processing apparatus, and audio information recording method on recording medium
US3700812A (en) Audio system with means for reducing noise effects
JPS60114040A (en) Digital audio system
US20070118362A1 (en) Audio compression/decompression device
EP0644542B1 (en) Audio signal reproducing apparatus
US6628720B1 (en) Transmitting apparatus and reproducing apparatus
US5157396A (en) D/a conversion apparatus
JPS5912192B2 (en) audio playback device
JPS6253093B2 (en)
JP4822697B2 (en) Digital signal encoding apparatus and digital signal recording apparatus
KR100201308B1 (en) Background sound mixing device and method for variable speed reproduction of voice signal
US5659317A (en) Apparatus for reproducing digital audio waveform data
KR930016999A (en) Head Frequency Characteristic Improvement Circuit of Cassette Tape Player
JP3526725B2 (en) Recording / playback device
JP2570112B2 (en) PCM audio recording and playback device
KR100188145B1 (en) Key controller using dynamic cross fading
JP3403924B2 (en) 1-bit signal transmission or recording / reproducing device
JPH0621084Y2 (en) Digital audio recording medium reproducing device
JPS58111990A (en) Voice signal encoder
JPH0744199A (en) Speech sound recording and reproducing device
JPH117718A (en) Method and apparatus for recording digital data and recording medium