JPS6060077B2 - Analog signal synthesizer - Google Patents

Analog signal synthesizer

Info

Publication number
JPS6060077B2
JPS6060077B2 JP53016046A JP1604678A JPS6060077B2 JP S6060077 B2 JPS6060077 B2 JP S6060077B2 JP 53016046 A JP53016046 A JP 53016046A JP 1604678 A JP1604678 A JP 1604678A JP S6060077 B2 JPS6060077 B2 JP S6060077B2
Authority
JP
Japan
Prior art keywords
analog signal
signal
phoneme
sampling
analog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP53016046A
Other languages
Japanese (ja)
Other versions
JPS54108505A (en
Inventor
賢 西村
洋治 杉浦
憲一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP53016046A priority Critical patent/JPS6060077B2/en
Priority to US05/967,717 priority patent/US4210781A/en
Priority to FR7835365A priority patent/FR2434451B1/en
Priority to GB7848761A priority patent/GB2013453B/en
Priority to CA000318058A priority patent/CA1118897A/en
Priority to IT7830905A priority patent/IT1192605B/en
Priority to DE2854601A priority patent/DE2854601C2/en
Publication of JPS54108505A publication Critical patent/JPS54108505A/en
Priority to US06/297,831 priority patent/USRE31172E/en
Publication of JPS6060077B2 publication Critical patent/JPS6060077B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

PURPOSE:To generate a synthetic sound with neither discontinuous waves of a connection part nor variation in pitch frequency by selecting the shift amount of data when the sum of absolute values of level differences of connection-part sampling values between preceding and following phoneme waveforms becomes minimum. CONSTITUTION:In memory units 103 and 104, an analog input signal sampled according to clocks is stored, and binary signal converter 124 converts sampling values of the connection part of a preceding phoneme waveform and following phoneme waveform into binary signals of polarities equivalent to the input signal. Here, arithmetic processor 121 sums up absolute values of level differences and the shift amount of sampling data when the calculation value becomes minimum is selected among calculation values through its calculation operation, so that memory units will be clock-controlled by programs to adjust the time axis of the following connection phoneme element. Consequently, a synthetic sound can be obtained with neither discontinuous waveforms of the connection point nor variation in pitch frequency.

Description

【発明の詳細な説明】[Detailed description of the invention]

本発明は音声等のアナログ信号の合成装置に関し、合成
アナログ信号の品質を高めることを目的とするものであ
る。 一般に音素片即ち単語、音節、あるいはこれより更に短
かい音声セグメントを結合編集して合成された音声信号
(単語、句、話声)の品質は音声の構成単位である音素
片の接続部の処理によつて決まると言える。 例えば、音素片の接続部に発生する波形の急激な変化、
即ち波形の不連続性は高調波ノイズの原因となり、合成
音のS/Nを低下させ、明瞭度を落とす。又声帯振動の
基本周波数であるピッチ周波数の変動は合成音声の自然
性を劣化させることも知られている。ピッチ周波数の変
化に対して人間の聴覚はきわめて敏感であり(検知限は
0.1%と言われている)、結合された音素片のピッチ
周波数が不連続な場合、合成音声は聞きづらい不自然な
ものとなる。本発明は音素片波形のパターンを認識して
自然・な形で各音素片を結合することにより高品質の合
成音を得ることを可能にするものである。 素片波形としては自然音声からたとえばピッチ中間毎に
切り出したものを用いたり、別の音声合成装置で一素片
分を合成したものを取り出したりして用いる方法がある
が、本発明は比較的短時間の、具体的には数拾〜数百ミ
リ秒の音素片を、接続部に於ける波形の不連続及びピッ
チ周波数の変動なしに結合する方法を提供するものであ
る。即ち、かかる短時間の音素片は、相隣る音素片の少
なくとも結合部については波形が類似しているはずであ
り、従つて、各音素片の時間軸をそれぞれ若干修正する
ことにより接続部をなめらかに結合して行くことが出来
る。本発明は結合される音素片の接続部について、波形
の類似度を信号のレベルの形て粗く把握し、これにもと
づき音素片の時間軸に適当な時間的修正を施こすもので
ある。第1図は従来の時間軸伸長装置を例示するブロッ
ク図である。 図に於て、1は音声入力端子、2は出力端子、3及び4
はいずれもNビットの例えばBBDなどのアナログシフ
トレジスタ、5は低減通過フィルタLpFl6,7,8
及び9は入力端子1からアナログシフトレジスタ3或は
4、L,F5を経て出力端子2に至る音声信号をスイッ
チ制御するアナログスイッチである。かつこれらアナロ
グスイッチは、アナログシフトレジスタ3,4の書込ク
ロック回路CPlOをMN(但しMNは整数、mについ
ては後述する)分周する分周回路11のQ及びO出力に
よつて図示の如く開閉制御される。アナログシフトレジ
スタ3及び4は、クロック回路10及び分周回路11の
Q,O出力のANDゲート12及び13により、0Rゲ
ート14及び15を介して交互に書込みクロック制御さ
れ、又、読出しクロック回路CPl6及び分周回路11
のQ,O出力のANDゲート17及び18により同じく
0Rゲート14及び15を介して交互に読出しクロック
制御される。即ち、例えば入力端子1に与えられた時間
軸がm倍(m〉1)に圧縮された音声信号(かかる圧縮
信号は例えばテープレコーダの再生速度を録音速度のm
倍とすることにより得られる)は、分周回路11のQ出
力が1のときアナログスイッチ8を経てアナログシフト
レジスタ4に読込まれる。該シフトレジスタのビット数
はNであり、これに対し謝個のサンプリング列が入力音
声信号として順次入力を完了したとき、分周回路11の
Q出力は反転してOとなり、スイッチ8を閉じる。それ
と同時に分周回路11のO出力はOとなり、スイッチ6
を開いて同様にアナログシフトレジスタ3に書込みを行
なう。このとき、図の構成から明らかなように、アナロ
グシフトレジスタ4は読出しクロック回路16によりク
ロックされて、同様に寛出力により制御されているスイ
ッチ9を経て読み出される。アナログシフトレジスタ3
への書き込み期間中、別のアナログシフトレジスタ4は
このように読み出しを行ない、続いて分周回路11のQ
,O出力が反転すると、再びアナログシフトレジスタ4
が書き込み、3が読み出しを行なう。ここで書き込みク
ロック回路10のクロック周波数をf1、読み出しクロ
ック回路16のクロック周波数をF2としたとき、とな
るように各クロック周波数を決めれば、時間軸はm倍に
伸長され、音声入力端子1に入力した圧縮音声は出力端
子2に時間軸が復元されてあられれる。 読み出しクロック周波数F2は、当然必要な出力音声周
波数帯域に対し、ナイキストのサンプリング定理を満た
すように決められる。上述の如き従来装置に於ては、ア
ナログシフトレジスタ3及び4を交互に出力する音素片
の接続タイミングは、書き込みクロック10をMN分周
する分周回路11の出力によりMN/f1秒毎に自動的
に決められるため、従つて、第6図に図示するように接
続部に不連続な波形変化と、ピッチ周波数の変動を発生
させている。前述の如くこのような音素片の接続部に於
ける波形やピッチ周波数の不連続は、音質や明瞭度をい
ちじるしく低下させる。次にこのような従来装置の欠点
を改良する本発明の内容を第2図のブロック図により説
明する。 図に於て103及び104はアナログスイッチ106,
107,108及び109によつて開閉制御されるアナ
ログシフトレジスタ、110及び116はそれぞれ周波
数f1およびF2の書込み用および読出し用のクロック
回路、111はMN分周回路てあり、これらの構成は第
1図の従来装置と同じである。本発明においては前述の
如く接続lする音素片の接続部について時間的修正を加
えるのであるが、これをROMl2Oによりプログラム
された演算処理装置(コンピュータ)CPUl2lによ
り行なう。カウンター122は各周期毎に音素片及び後
端を計数し、I/Oボート123を経てCPUl2lに
タイミング指示する回路、A/D変換器124はクロッ
ク回路110からのコンバートコマンド信号に従つて入
力信号をディジタル変換する回路、CPUl2lに従続
する記憶回路RAMl25は、これらA/D変換された
ディジタルコード信号のうち最上位桁だけを記憶すると
同時に、CPUl2lの演算処理結果を一時保存する機
能をあわせ有するものである。ここでA/D変換器出力
の最上位桁だけを使用するのは、前述の如く数拾〜数百
ミリ秒の短時間の音素片は、相隣る音素片の少なくとも
結合部については、波形が類似しているはずであり、音
声の基本ピッチの変動を押えるためには、音声の基本ピ
ッチ波形のゼロクロス点を最も誤差が少なく結合するこ
とにより、目的は達成されるから、入力波形を粗くパタ
ーン化しても、後述の演算処理によりA/D変換器出力
の全桁を使用した場合と比較しほぼ同様の結果が得られ
るからである。A/D変換器出力の最上位桁だけで、入
力波形をパターン化するということは、A/D変換器出
力が自然2進コードの場合は、入力波形がA/D変換器
のダイナミックレンジの112を超えるか否かにより、
それぞれ〔1〕,
The present invention relates to an apparatus for synthesizing analog signals such as audio, and an object of the present invention is to improve the quality of synthesized analog signals. In general, the quality of speech signals (words, phrases, speech) synthesized by combining and editing phoneme fragments, that is, words, syllables, or even shorter speech segments, is determined by the processing of the connections between phoneme fragments, which are the constituent units of speech. It can be said that it depends on For example, a sudden change in waveform that occurs at the junction of phoneme pieces,
That is, the discontinuity of the waveform causes harmonic noise, lowers the S/N of the synthesized sound, and reduces the clarity. It is also known that fluctuations in the pitch frequency, which is the fundamental frequency of vocal cord vibration, degrade the naturalness of synthesized speech. Human hearing is extremely sensitive to changes in pitch frequency (the detection limit is said to be 0.1%), and when the pitch frequencies of connected phoneme segments are discontinuous, the synthesized speech becomes difficult to hear and unnatural. Become something. The present invention makes it possible to obtain high-quality synthesized speech by recognizing the pattern of phoneme segment waveforms and combining each phoneme segment in a natural manner. There are methods of using segment waveforms cut out from natural speech, for example at mid-pitch intervals, or by extracting one segment waveform synthesized by another speech synthesizer, but the present invention is relatively simple. The object of the present invention is to provide a method for combining phoneme segments of a short time, specifically, several tens to hundreds of milliseconds, without discontinuities in waveforms at connections and without fluctuations in pitch frequency. In other words, such short-time phoneme segments should have similar waveforms at least at the joints of adjacent phoneme segments, and therefore, by slightly modifying the time axis of each phoneme segment, the joints can be made similar. It can be combined smoothly. The present invention roughly grasps the degree of waveform similarity in the form of a signal level for the connecting portions of phoneme segments to be combined, and based on this, makes appropriate temporal corrections to the time axes of the phoneme segments. FIG. 1 is a block diagram illustrating a conventional time axis expansion device. In the figure, 1 is the audio input terminal, 2 is the output terminal, 3 and 4
are N-bit analog shift registers such as BBD, and 5 is a reduced pass filter LpFl6, 7, 8.
and 9 are analog switches for controlling the audio signal from the input terminal 1 to the output terminal 2 via the analog shift register 3 or 4, L, F5. These analog switches are operated as shown in the figure by the Q and O outputs of a frequency divider circuit 11 that divides the write clock circuit CPlO of the analog shift registers 3 and 4 by MN (MN is an integer, and m will be described later). Opening/closing controlled. The analog shift registers 3 and 4 are alternately write clock controlled by AND gates 12 and 13 of the Q and O outputs of the clock circuit 10 and frequency divider circuit 11 via 0R gates 14 and 15, and are controlled by the read clock circuit CPl6. and frequency dividing circuit 11
The read clock is alternately controlled by AND gates 17 and 18 of the Q and O outputs of , and also via 0R gates 14 and 15. That is, for example, an audio signal in which the time axis applied to the input terminal 1 is compressed by m times (m>1) (such a compressed signal is, for example, the playback speed of a tape recorder, m
) is read into the analog shift register 4 via the analog switch 8 when the Q output of the frequency dividing circuit 11 is 1. The number of bits of the shift register is N, and when a number of sampling strings have been sequentially input as input audio signals, the Q output of the frequency dividing circuit 11 is inverted to O, and the switch 8 is closed. At the same time, the O output of the frequency dividing circuit 11 becomes O, and the switch 6
Open it and write to the analog shift register 3 in the same way. At this time, as is clear from the configuration in the figure, the analog shift register 4 is clocked by the read clock circuit 16 and read out via the switch 9 which is also controlled by the output. analog shift register 3
During the writing period, another analog shift register 4 reads in this way, and then the Q of the frequency divider 11
, O When the output is inverted, the analog shift register 4 is switched again.
writes, and 3 reads. Here, if the clock frequency of the write clock circuit 10 is f1 and the clock frequency of the read clock circuit 16 is F2, then if each clock frequency is determined so that The input compressed audio is output to the output terminal 2 with its time axis restored. The read clock frequency F2 is naturally determined to satisfy Nyquist's sampling theorem for the necessary output audio frequency band. In the conventional device as described above, the connection timing of the phoneme pieces that are alternately output from the analog shift registers 3 and 4 is automatically determined every MN/f 1 second by the output of the frequency dividing circuit 11 that divides the write clock 10 by MN. Therefore, as shown in FIG. 6, discontinuous waveform changes and pitch frequency fluctuations occur at the connection portion. As mentioned above, such discontinuities in the waveform and pitch frequency at the junctions of phoneme segments significantly reduce the sound quality and clarity. Next, the content of the present invention, which improves the drawbacks of such conventional devices, will be explained with reference to the block diagram of FIG. In the figure, 103 and 104 are analog switches 106,
Analog shift registers 107, 108 and 109 control the opening and closing, 110 and 116 are clock circuits for writing and reading frequencies f1 and F2, respectively, and 111 is an MN frequency dividing circuit. This is the same as the conventional device shown in the figure. In the present invention, as described above, the temporal correction is applied to the connecting portions of connected phoneme pieces, and this is carried out by the arithmetic processing unit (computer) CPU12l programmed by the ROM12O. The counter 122 is a circuit that counts phoneme pieces and rear ends in each period and provides timing instructions to the CPU 12l via the I/O boat 123, and the A/D converter 124 converts input signals according to the conversion command signal from the clock circuit 110. The memory circuit RAM125 following the CPU12l, which is a circuit for digitally converting the data, has the function of storing only the most significant digit of these A/D-converted digital code signals, and at the same time temporarily storing the arithmetic processing results of the CPU12l. It is something. The reason why only the most significant digit of the A/D converter output is used here is because, as mentioned above, for short-time phoneme segments of several tens to hundreds of milliseconds, the waveform of at least the joint of adjacent phoneme pieces is should be similar, and in order to suppress fluctuations in the fundamental pitch of the voice, the purpose is achieved by combining the zero-crossing points of the voice's fundamental pitch waveform with the least error. Therefore, the input waveform should be coarsened. This is because even when patterned, substantially the same result can be obtained as compared to the case where all digits of the A/D converter output are used through the calculation processing described later. Patterning the input waveform using only the most significant digit of the A/D converter output means that if the A/D converter output is a natural binary code, the input waveform is within the dynamic range of the A/D converter. Depending on whether it exceeds 112 or not,
[1] respectively,

〔0〕の出力をコンバートコマンド信
号に同期して出すことになる。これと同じ機能を得るに
は、他の方法、例えば第2図中の一点鎖線内の如く、コ
ンパレータ126の出力と、コンバートコマンド信号と
のANDをN1ゲート127によりとることによつて行
なうことができる。また増幅器により信号の振幅を飽和
させ、極性判別してコンバートコマンド信号とのAND
をとることでも同じ機能を得ることができる。 次にそのような振幅飽和用の増幅器を使用する実施例の
要部を第3図に示す。第3図において128は利得が充
分大きい増幅器、129はクランプ回路である。今、入
力端子1n,101に第4図aの如き入力信号が印加さ
れると、増幅器128により入力信号は増幅されると共
に飽和して増幅器128の出力は第4図bの如くなる。
更にクランプ回路129により信号の下端(或は上端)
がクランプされるので、クランプ回路129の出力は第
4図Cの如くなる。そしてクランプ回路129の出力は
コンバートコマンド信号と共にANDゲート127に印
加される。このようにA/D変換器の最上位桁だけを使
用する構成であれば、出力ビット数の少いA/D変換器
を使用することができ、またコンパレータあるいは飽和
増幅器でも同じ機能を果すことができる。 換言すれば入力信号の極性に対応した2値信号に変換す
る2値信号変換装置としてはA/D変換器やコンパレー
タ等を使用できる。そして、これらA/D変換器やコン
パレータ等は安価に構成できる。斯る構成の場合、さら
にコンピュータが処理する情報量が少なくなり、ROM
及びRAMの容量が少なくできる等、コンピュータ部の
構成も安価にできる効果が得られる。さて、まずCPU
l2lは計数回路122の出力にもとずき、入力クロッ
クの最後部よりM個のサンプルを、A/D変換器出力1
24によりディジタル化して最上位桁だけをI/0ボー
ト123から読み込み、記憶回路125に保存する。 次に分周回路111の出力が反転すると、CPUl2l
は同様に計数回路122の出力にもとずき入力クロック
の前端から(M+r)個のサンプルを読み込む。引き続
きCPUl2lはROMl2Oのプログラムにもとづき
入力された音素片の後端と、続く音素片の類似性を演算
するのであるが、これには各サンプリング列の二乗誤差
を計算するのが良い。音素片の後端のサンプリング数列
をXp(p=1,2,3,・・M)、後続の音素片の前
端サンプリング数列をYp(p=1,2,3,・・・M
+r)としたとき2つの波形間の二乗誤差はであらされ
る。 これはサンプリング波形Xpに対してYpをk個だけず
らせて重ね合わせたときの類似度をあられすものてある
。しかしながら(2)式にもとづく演算処理は、実際に
は膨大な計算ステップ数となり、短時間(少なくとも数
10ミリ秒の間)で計算するには、高性能のコンピュー
タによらねばならない。 もともと(2)式は振幅やレベルの異なる2つの波形の
相関をしらべるものであつて、その為標準偏差σX,σ
yで波形を正規化し、更に平均レベル′X,yとの差に
ついて二乗和をとることにより誤差を計算している。と
ころで本発明の音声の合成装置の場合、取扱かう音素片
は時間的に近接した波形であり、従つて振幅およびレベ
ル共もともと類似してみるとみて良い。この場合2つの
波形間の差は(2)式に代えてを計算rてt良い。 しかも、本発明の場合は2つの波形の類似度が最大のタ
イミングを把握すれば良いのであり、従つて(3)式は
更に次の(4)式に代えられる。ここでXp及びYP+
kはA/D変換器の最上位桁だけのデータであるから、
いずれも〔1〕又は
An output of [0] is output in synchronization with the convert command signal. The same function can be achieved in other ways, for example by ANDing the output of the comparator 126 with the convert command signal using the N1 gate 127, as shown in the dashed line in FIG. can. In addition, the amplitude of the signal is saturated by an amplifier, the polarity is determined, and the AND signal is combined with the convert command signal.
You can also get the same functionality by taking . Next, the main part of an embodiment using such an amplifier for amplitude saturation is shown in FIG. In FIG. 3, 128 is an amplifier with a sufficiently large gain, and 129 is a clamp circuit. Now, when an input signal as shown in FIG. 4a is applied to the input terminals 1n and 101, the input signal is amplified and saturated by the amplifier 128, and the output of the amplifier 128 becomes as shown in FIG. 4b.
Furthermore, the lower end (or upper end) of the signal is clamped by the clamp circuit 129.
is clamped, the output of the clamp circuit 129 becomes as shown in FIG. 4C. The output of the clamp circuit 129 is then applied to the AND gate 127 together with the convert command signal. If this configuration uses only the most significant digit of the A/D converter, an A/D converter with a small number of output bits can be used, and a comparator or saturation amplifier can also perform the same function. I can do it. In other words, an A/D converter, a comparator, or the like can be used as a binary signal converter that converts an input signal into a binary signal corresponding to the polarity. These A/D converters, comparators, etc. can be constructed at low cost. In such a configuration, the amount of information processed by the computer is further reduced, and the ROM
Also, the configuration of the computer section can be made inexpensive, such as the capacity of RAM can be reduced. Well, first of all, the CPU
l2l is based on the output of the counting circuit 122, and outputs M samples from the last part of the input clock to the A/D converter output 1.
24, only the most significant digit is read from the I/0 port 123 and stored in the memory circuit 125. Next, when the output of the frequency divider circuit 111 is inverted, CPUl2l
Similarly, based on the output of the counting circuit 122, (M+r) samples are read from the leading edge of the input clock. Subsequently, the CPU 12l calculates the similarity between the rear end of the input phoneme segment and the following phoneme segment based on the program in the ROM 12O, and it is preferable to calculate the squared error of each sampling sequence. The sampling number sequence at the rear end of a phoneme is Xp (p=1, 2, 3, . . . M), and the sampling number sequence at the front end of the subsequent phoneme segment is Yp (p = 1, 2, 3, . . . M).
+r), the square error between the two waveforms is expressed as. This expresses the degree of similarity when Yp is shifted by k points and superimposed on the sampling waveform Xp. However, the arithmetic processing based on equation (2) actually requires a huge number of calculation steps, and requires a high-performance computer to perform calculations in a short period of time (at least several tens of milliseconds). Originally, equation (2) was used to examine the correlation between two waveforms with different amplitudes and levels, and therefore the standard deviations σX, σ
The error is calculated by normalizing the waveform with y and then calculating the sum of squares of the difference between the average level 'X and y. By the way, in the case of the speech synthesis apparatus of the present invention, the phoneme pieces handled have waveforms that are close in time, and therefore, it can be considered that the amplitude and level are originally similar. In this case, the difference between the two waveforms can be calculated using equation (2) instead. Furthermore, in the case of the present invention, it is only necessary to know the timing at which the similarity between the two waveforms is maximum, and therefore equation (3) can be further replaced with the following equation (4). Here Xp and YP+
Since k is the data of only the most significant digit of the A/D converter,
Either [1] or

〔0〕である。 即ち、これは各対応するサンプリング値の差の絶対値を
積分したものであり、これが極小となるkを知ることに
より接続タイミングが決定される。即ち、演算処理装置
121はEkをk=0,1,・・rについてそれぞれ計
算し、これが最も小さくなるkを決定する。即ち、第5
図に示すように先行音素片の後端M個のサンプル列は、
後続音素片の先頭よりk個ずれた部分から重ね合わせる
のが最も誤差が少ないということになる。そこて演算処
理装置121は後続音素片の先頭より(k+M+N)個
のサンプルをとり込み、1/0ボート123を通じてA
NDゲート112あるいは113を制御し、書き込みク
ロックを停止する。アナログシフトレジスタ103ある
いは104の容量はNであるから、従つて該アナログメ
モリーには、図示の如く(k+M+1)番目からNビッ
トが記憶され、次の読み出しタイミングに順次読み出さ
れるのであるが、以上の説明から明らかな通り、先行音
素片の最後端Mサンプルと、後続の音素片の(k+1)
番目からのMサンプルとが最も誤差が少なく重なるので
、従つて音素片はまつたく自然な形で音素片が引き続き
出力される。前述の通り後続音素片は(k+M+N)サ
ンプルがアナログメモリーに取り込まれるのであるが、
このうち最後尾からMサンプルが同様にA/D変換器1
24、I/0ボート123を経てCPUl2lの記憶装
置125に保存される。これは更に続く音素片の先頭か
ら(M+r)個のサンプルとの類似性を調べて接続する
為に必要である。以上の処理のタイムチャートは第5図
Cに図示する通りである。ここで重要なことはアナログ
シフトレジスタ103あるいは104はNビットであり
、従つてこれ以上のビット(M+k+N)のサンプルが
読み込まれても記憶されるのは、うしろからNビットだ
けであるということである。音素片の時間長は少なくと
も数10ミリ秒であるが、(4)式で示したEkの計算
はきわめて少ないステップで処理でき、低速のいわゆる
マイクロコンピュータが利用できる。尚、第6図には第
1図の従来方式による時間軸伸長装置の再生音声波形を
、第7図には本発明方式(第2図)による同再生音声波
形を200(Hz)の正弦波単一信号について実際に処
理したデータを示している。 これら両データは、m=2,f1=40KHz..f2
=20KHz..N=768なる条件で測定したもので
ある。上述においては、本発明は音声の時間軸伸長装置
を具体例として明記したが、記憶手段として前述の如き
アナログシフトレジスタを使用する代りにRAMを使用
してもよく、その際にはアナログの音声波形をA/D変
換器でディジタル信号に変換してからRAMに入力し、
RAM出力はD/A変換器でアナログ信号に変換すると
いう慣用技術を使用することは言うまでもない。 このように本発明の技術は各種の音声や音響等のアナロ
グ信号の合成装置に利用可能であることは言うまでもな
い。このように本発明の装置は先行および後続アナログ
信号素片の接続部について、先行アナログ信号素片の後
端部のサンプリング値と後続アナログ信号素片のサンプ
リング値との差の絶対値の積分値が最小となるように重
ね合わせるべく時間軸の修正を行なうものである。 更に詳説すると、本発明は記憶手段に記憶された先行ア
ナログ信号素片・の後端部近傍と後続アナログ信号素片
の先端部近傍の波形の類似性を比較し、先行アナログ信
号素片と後続アナログ信号素片が最も滑めらかに接続さ
れるよう後続アナログ信号素片をクロック出力すること
てある。即ち、先行アナログ信号素片の後端部近傍のデ
ータと後続アナログ信号素片の先端部近傍のデータとを
相対的にシフトさせて比較し、先行アナログ信号素片に
後続アナログ信号素片が最も滑めらかに接続されるよう
後続アナログ信号素片のデータを記憶手段からクロック
出力する。従つて従来装置の如き接続部のアナログ信号
波形の不連続やピッチ周波数の変動等の無い合成アナロ
グ信号を得ることができる。
It is [0]. That is, this is the integral of the absolute value of the difference between the corresponding sampling values, and the connection timing is determined by knowing k at which this is the minimum. That is, the arithmetic processing unit 121 calculates Ek for k=0, 1, . That is, the fifth
As shown in the figure, the sequence of M samples at the end of the preceding phoneme is:
It follows that overlapping from a portion shifted by k positions from the beginning of the succeeding phoneme has the least error. Then, the arithmetic processing unit 121 takes in (k+M+N) samples from the beginning of the subsequent phoneme, and sends them to A through the 1/0 boat 123.
Controls the ND gate 112 or 113 to stop the write clock. Since the capacity of the analog shift register 103 or 104 is N, N bits are stored in the analog memory from the (k+M+1)th as shown in the figure, and are sequentially read out at the next read timing. As is clear from the explanation, the last M samples of the preceding phoneme and (k+1) of the following phoneme
Since the M samples from the th to M samples overlap with each other with the least error, the phoneme pieces are continuously output in a completely natural form. As mentioned above, (k+M+N) samples of the subsequent phoneme are captured into analog memory,
Of these, M samples from the end are similarly sent to the A/D converter 1.
24, and is stored in the storage device 125 of the CPU 12l via the I/0 boat 123. This is necessary in order to check the similarity with (M+r) samples from the beginning of the subsequent phoneme and connect them. A time chart of the above processing is shown in FIG. 5C. The important thing here is that the analog shift register 103 or 104 has N bits, so even if a sample of more bits (M+k+N) is read, only the last N bits will be stored. be. Although the time length of a phoneme segment is at least several tens of milliseconds, the calculation of Ek shown in equation (4) can be processed with extremely few steps, and a low-speed so-called microcomputer can be used. In addition, FIG. 6 shows the reproduced audio waveform of the time axis expansion device according to the conventional method shown in FIG. 1, and FIG. This shows data actually processed for a single signal. Both of these data are m=2, f1=40KHz. .. f2
=20KHz. .. It was measured under the condition that N=768. In the above description, the present invention has been specified as a specific example of an audio time axis expansion device, but instead of using the analog shift register as described above, a RAM may be used as a storage means. Convert the waveform into a digital signal with an A/D converter, then input it to RAM,
Needless to say, the conventional technique of converting the RAM output into an analog signal using a D/A converter is used. As described above, it goes without saying that the technique of the present invention can be used in a synthesis device for analog signals such as various voices and sounds. As described above, the device of the present invention calculates the integral value of the absolute value of the difference between the sampling value at the rear end of the preceding analog signal element and the sampling value of the succeeding analog signal element at the connecting portion of the preceding analog signal element and the succeeding analog signal element. The time axes are corrected in order to overlap them so that they are minimized. More specifically, the present invention compares the similarity of waveforms near the rear end of the preceding analog signal element stored in the storage means and near the leading end of the subsequent analog signal element, and compares the similarity between the preceding analog signal element and the subsequent analog signal element. Subsequent analog signal segments may be clocked so that the analog signal segments are connected as smoothly as possible. That is, the data near the rear end of the preceding analog signal element and the data near the leading end of the succeeding analog signal element are relatively shifted and compared, and the following analog signal element is the most similar to the preceding analog signal element. The data of the subsequent analog signal segment is clocked out from the storage means so that the connection is smooth. Therefore, it is possible to obtain a composite analog signal without discontinuities in analog signal waveforms or fluctuations in pitch frequency at the connection parts as in conventional devices.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来のアナログ信号合成装置を示すブロック●
ダイヤグラム、第2図は本発明のアナログ信号合成装置
を示すブロック・ダイアグラム、第3図は本発明の装置
に使用する2値信号変換装置として振幅飽和用増幅器を
使用する実施例を示す要部ブロック・ダイアグラム、第
4図は第3図の実施例の動作を説明するための図面、第
5図は第2図の本発明の装置を説明するための図面、第
6図は従来の装置の特性を示す図面、第7図は本発明の
装置の特性を示す図面である。 101・・・信号入力端子、102・・・信号出力端子
、103,104・・・アナログ信号の記憶装置、10
6,107,108,109・・・アナログスイッチ、
110・・・書込み用クロック、116・・・読出し用
クロック、121・・・演算処理装置、124・・・A
/D変換器(2値信号変換装置)。
Figure 1 shows a block diagram of a conventional analog signal synthesizer●
2 is a block diagram showing an analog signal synthesis device of the present invention, and FIG. 3 is a main block diagram showing an embodiment in which an amplitude saturation amplifier is used as a binary signal converter used in the device of the present invention.・Diagrams: FIG. 4 is a drawing to explain the operation of the embodiment shown in FIG. 3, FIG. 5 is a drawing to explain the device of the present invention shown in FIG. 2, and FIG. 6 is a diagram showing the characteristics of the conventional device. FIG. 7 is a drawing showing the characteristics of the device of the present invention. 101... Signal input terminal, 102... Signal output terminal, 103, 104... Analog signal storage device, 10
6,107,108,109...analog switch,
110...Writing clock, 116...Reading clock, 121... Arithmetic processing unit, 124...A
/D converter (binary signal converter).

Claims (1)

【特許請求の範囲】 1 アナログ信号波形から抽出されたアナログ信号素片
波形を用いて編集合成するアナログ信号合成装置であつ
て、(a)クロックに従つて入力信号をサンプリングし
て記憶する記憶装置と、(b)前記入力信号のサンプリ
ングより得られた先行アナログ信号素片波形の接続部の
サンプリング値と後続アナログ信号素片波形の接続部の
サンプリング値とをそれぞれ該入力信号の極性に対応し
た2値信号に変換する2値信号変換装置と、(c)該変
換装置の出力信号である先行アナログ信号素片波形の2
値信号と後続アナログ信号素片波形の2値信号とのレベ
ル差を演算して該レベル差の絶対値の合計を計算し、且
つ対応サンプリングデーータを順次シフトさせて前記レ
ベル差の絶対値の合計の計算操作をそのシフトの都度行
ない、該計算操作による計算値のうち計算値が最小とな
るサンプリングデータのシフト量を選定し、この選定さ
れたシフト量にもとずき後続の接続アナログ信号素片の
時間軸を調整すべく前記記憶装置をクロック制御するよ
うプログラムされた演算処理装置とを備えることを特徴
とするアナログ信号素片編集型のアナログ信号合成装置
。 2 2値信号変換装置は入力信号の零レベル(入力信号
がバイアスを受ける時はそのバイアスレベル)を比較レ
ベルとすることを特徴とする特許請求の範囲1記載のア
ナログ信号合成装置。 3 2値信号変換装置は前記サンプリング値を振幅飽和
させる増幅器よりなることを特徴とする特許請求の範囲
1記載のアナログ信号合成装置。
[Scope of Claims] 1. An analog signal synthesis device that edits and synthesizes analog signal segment waveforms extracted from analog signal waveforms, comprising: (a) a storage device that samples and stores input signals according to a clock; and (b) the sampling value of the connection part of the preceding analog signal elemental waveform obtained by sampling the input signal and the sampling value of the connection part of the subsequent analog signal elemental waveform, respectively, corresponding to the polarity of the input signal. (c) a binary signal converter that converts into a binary signal; and (c) two of the preceding analog signal segment waveforms that are the output signals of the converter.
The level difference between the value signal and the binary signal of the subsequent analog signal segment waveform is calculated, the sum of the absolute values of the level difference is calculated, and the corresponding sampling data is sequentially shifted to calculate the absolute value of the level difference. The total calculation operation is performed each time the shift is performed, and the shift amount of the sampling data that minimizes the calculated value among the values calculated by the calculation operation is selected, and the subsequent connected analog signal is calculated based on the selected shift amount. An analog signal synthesis device of an analog signal segment editing type, comprising: an arithmetic processing unit programmed to clock-control the storage device in order to adjust the time axis of the segment. 2. The analog signal synthesis device according to claim 1, wherein the binary signal conversion device uses the zero level of the input signal (or the bias level when the input signal is subjected to a bias) as a comparison level. 3. The analog signal synthesis device according to claim 1, wherein the binary signal conversion device comprises an amplifier that saturates the amplitude of the sampled value.
JP53016046A 1977-12-16 1978-02-13 Analog signal synthesizer Expired JPS6060077B2 (en)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP53016046A JPS6060077B2 (en) 1978-02-13 1978-02-13 Analog signal synthesizer
US05/967,717 US4210781A (en) 1977-12-16 1978-12-08 Sound synthesizing apparatus
FR7835365A FR2434451B1 (en) 1977-12-16 1978-12-15 SOUND SYNTHESIZER APPARATUS
GB7848761A GB2013453B (en) 1977-12-16 1978-12-15 Sound synthesizing apparatus
CA000318058A CA1118897A (en) 1977-12-16 1978-12-15 Sound synthesizing apparatus
IT7830905A IT1192605B (en) 1977-12-16 1978-12-15 APPARATUS AND METHOD OF SYNTHESIZATION FOR SOUND REPRODUCTION
DE2854601A DE2854601C2 (en) 1977-12-16 1978-12-18 Process for sound processing and sound synthesizer for its implementation
US06/297,831 USRE31172E (en) 1977-12-16 1981-08-31 Sound synthesizing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP53016046A JPS6060077B2 (en) 1978-02-13 1978-02-13 Analog signal synthesizer

Publications (2)

Publication Number Publication Date
JPS54108505A JPS54108505A (en) 1979-08-25
JPS6060077B2 true JPS6060077B2 (en) 1985-12-27

Family

ID=11905623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP53016046A Expired JPS6060077B2 (en) 1977-12-16 1978-02-13 Analog signal synthesizer

Country Status (1)

Country Link
JP (1) JPS6060077B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6283270U (en) * 1985-11-14 1987-05-27
JPH0449320U (en) * 1990-08-30 1992-04-27

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6283270U (en) * 1985-11-14 1987-05-27
JPH0449320U (en) * 1990-08-30 1992-04-27

Also Published As

Publication number Publication date
JPS54108505A (en) 1979-08-25

Similar Documents

Publication Publication Date Title
US4864620A (en) Method for performing time-scale modification of speech information or speech signals
US5842172A (en) Method and apparatus for modifying the play time of digital audio tracks
EP0090589A1 (en) Method and apparatus for use in processing signals
JPH0361959B2 (en)
KR20030031936A (en) Mutiple Speech Synthesizer using Pitch Alteration Method
JPS6060077B2 (en) Analog signal synthesizer
JPH11259066A (en) Musical acoustic signal separation method, device therefor and program recording medium therefor
JPS6042959B2 (en) Analog signal synthesizer
JPS6036598B2 (en) speech synthesizer
JPS6060079B2 (en) Analog signal synthesizer
JP3147562B2 (en) Audio speed conversion method
JPS6042960B2 (en) Analog signal synthesizer
JPH05307395A (en) Voice synthesizer
JPS6060078B2 (en) Analog signal synthesizer
JP3197975B2 (en) Pitch control method and device
JPH0125080B2 (en)
JPH0713596A (en) Speech speed converting method
JP2913310B2 (en) Speech synthesis interruption device
JPS62102294A (en) Voice coding system
JPS6295595A (en) Voice response system
JPS6265098A (en) Music vocoder
JPS621000A (en) Voice processor
JPH035599B2 (en)
JPH0358518B2 (en)
JPS59124386A (en) Musical interval varying apparatus