JPS6042959B2 - Analog signal synthesizer - Google Patents

Analog signal synthesizer

Info

Publication number
JPS6042959B2
JPS6042959B2 JP52153275A JP15327577A JPS6042959B2 JP S6042959 B2 JPS6042959 B2 JP S6042959B2 JP 52153275 A JP52153275 A JP 52153275A JP 15327577 A JP15327577 A JP 15327577A JP S6042959 B2 JPS6042959 B2 JP S6042959B2
Authority
JP
Japan
Prior art keywords
analog signal
input
clock
time axis
phonemic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP52153275A
Other languages
Japanese (ja)
Other versions
JPS5483703A (en
Inventor
賢 西村
洋治 杉浦
憲一 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP52153275A priority Critical patent/JPS6042959B2/en
Priority to US05/967,717 priority patent/US4210781A/en
Priority to CA000318058A priority patent/CA1118897A/en
Priority to IT7830905A priority patent/IT1192605B/en
Priority to GB7848761A priority patent/GB2013453B/en
Priority to FR7835365A priority patent/FR2434451B1/en
Priority to DE2854601A priority patent/DE2854601C2/en
Publication of JPS5483703A publication Critical patent/JPS5483703A/en
Priority to US06/297,831 priority patent/USRE31172E/en
Publication of JPS6042959B2 publication Critical patent/JPS6042959B2/en
Expired legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

PURPOSE:To obtain composite sounds of high quality by naturally combining respective phonemic element by recognizing a pattern of a phonemic-element waveform. CONSTITUTION:Since phonemic element of tens to hundreds mm seconds are similar in terms of the waveform at the junction part, connections can be made smooth by slightly correcting the time axis of each phonemic element. This operation is executed by ROM120 from programmed computer CPU121. On the basis of the output of counting circuit 122, CPU121 allows A/D converter 124 to digitize the M- number samples from the baskmost part of input clocks and they are read from I/O port 123 and stored in memory circuit 125. Similarly, the (M+r)-number samples are read in from the front end of input clocks and the similarity between the back end of the input phonemic element and the front end of the following phonemic element is calculated by using a square-law error or correlative function, thereby correcting each time axis.

Description

【発明の詳細な説明】 本発明は音声等のアナログ信号の合成装置に関し、合成
アナログ信号の品質を高めることを目的とするものであ
る。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to an apparatus for synthesizing analog signals such as audio, and an object of the present invention is to improve the quality of synthesized analog signals.

一般に、音素片即ち単語、音節、あるいはこれより更に
短い音声セグメントを結合編集して合成された音声信号
(単語、句、話声)の品質は音声の構成単位である音素
片の接続部の処理によつて決まると言える。
In general, the quality of a speech signal (word, phrase, speech) synthesized by combining and editing phoneme fragments (words, syllables, or even shorter speech segments) is determined by the processing of the connections between phoneme fragments, which are the constituent units of speech. It can be said that it depends on

例えば接続部に発生する波形の急激な変化、即ぢ波形の
不連続性は高調波ノイズの原因となり、合成音のS/N
を低下させ、明瞭度を落す。又声帯振動の基本周波数で
あるピッチ・周波数の変動は合成音声の自然性を劣化さ
せることも知られている。ピッチ周波数の変化に対して
人間の聴覚はきわめて敏感であり(検知限は0.1%と
言われている)、結合された音素片のピッチ周波数が不
連続な場合、合成音声は聞きづらい不・自然なものとな
る。本発明は音素片波形のパターンを認識して自然な形
で各音声片を結合することにより高品質の合成音を得る
ことを可能とするものである。
For example, sudden changes in waveforms that occur at connections, or discontinuities in waveforms, can cause harmonic noise and reduce the S/N of the synthesized sound.
and reduce clarity. It is also known that fluctuations in pitch and frequency, which are the fundamental frequencies of vocal cord vibration, degrade the naturalness of synthesized speech. Human hearing is extremely sensitive to changes in pitch frequency (the detection limit is said to be 0.1%), and if the pitch frequencies of connected phoneme segments are discontinuous, synthesized speech may be difficult to hear. It becomes natural. The present invention makes it possible to obtain high-quality synthesized speech by recognizing the pattern of phoneme segment waveforms and combining each speech segment in a natural manner.

音素片波形としては、自然音声からたとえばピッチ区間
毎に切り出したものを用いたり、別の音声合成装置で一
素片分を合成したものを取り出したりして用いる方法が
あるが、本発明は比較的短時間の、具体的には数拾〜数
百ミリ秒の音素片を、接続部に於ける波形の不連続及び
ピッチ周波数の変動なしに結合する方法を提供するもの
である。即ちかかる短時間の音素片は相隣る音素片の少
なくとも結合部については波形が類似しているはずであ
り、従つて、各音素片の時間軸をそれぞれ若干修正する
ことにより、接続部をなめらかに結合して行くことが出
来る。本発明は結合される音素片の接続部について波形
の類似度を相関関数の形で把握し、これにもとづき音素
片の時間軸に適当な時間的修正を施こすものである。本
発明の詳細な説明について、以下音声の時間軸変換装置
をその具体的実施例として説明する。
As the phoneme segment waveform, there are methods to use one cut out from natural speech, for example, for each pitch interval, or to use a phoneme segment waveform synthesized by another speech synthesizer, but the present invention uses a comparative method. The present invention provides a method for combining phoneme segments of a short period of time, specifically several tens to hundreds of milliseconds, without discontinuities in waveforms and fluctuations in pitch frequency at connections. In other words, the waveforms of such short-duration phoneme segments should be similar at least at the joints between adjacent phoneme segments. Therefore, by slightly modifying the time axis of each phoneme segment, the connection parts can be smoothed. It can be combined with . The present invention grasps the degree of waveform similarity in the form of a correlation function for the connecting portions of phoneme segments to be combined, and based on this, makes appropriate temporal corrections to the time axes of the phoneme pieces. A detailed description of the present invention will be given below using an audio time axis conversion device as a specific embodiment thereof.

第1図は従来の時間軸伸長装置を例示するブロック図で
ある。同図に於て、端子1は音声入力端子、2は出力端
子、3及び4はいずれもNビットの例えばBBDなどの
アナログシフトレジスタ、5は低域通過フィルタ(LP
F)である。6,7,8及び9はアナログスイッチであ
り、入力端子1からアナログシフトレジスタ3或いは牡
LPF5を経て出力端子2に至る音声信号をスイッチ制
御する。
FIG. 1 is a block diagram illustrating a conventional time axis expansion device. In the figure, terminal 1 is an audio input terminal, 2 is an output terminal, 3 and 4 are N-bit analog shift registers such as BBD, and 5 is a low-pass filter (LP
F). Reference numerals 6, 7, 8, and 9 are analog switches, which switch-control the audio signal from the input terminal 1 to the output terminal 2 via the analog shift register 3 or the LPF 5.

かつこれらアナログスイッチは、アナログシフトレジス
タ3,4の書込クロック回路10をMN(但しMNは整
数、mについては後述する)分周する分周回路11のQ
及びO出力によつて図.示の如く開閉制御される。アナ
ログシフトレジスタ3及び4はクロック回路10及び分
周回路11のQ,O出力のANDゲート12及び13に
より0Rゲート14及び15を介して交互に書込みクロ
ック制御され、又読出しクロック回路16及び.”分周
回路11のQ,O出力のANDゲート17及び18によ
り同じく0Rゲート14及び15を介して交互に読出し
クロック制御される。即ち、例えば入力端子1に与えら
れた時間軸がm倍(m〉1)に圧縮された音声信号(か
かる圧縮信号は例・えばテープレコーダの再生速度を録
音速度のm倍にすることにより得られる)は、分周回路
11のQ出力が1のとき、アナログスイッチ8を経てア
ナログシフトレジスタ4に書込まれる。該シフトレジス
タのビット数はNであり、これに対レ■個のサンプリン
グ列が入力音声信号として、順次入力を完了したとき、
分周回路11のQ出力は反転して0となり、スイッチ8
を閉じる。同時に該分周回路のO出力は1となり、スイ
ッチ6を開いて、同様にアナログシフトレジスタ3に書
込みを行なう。このとき図の構成から明らかなように、
アナログシフトレジスタ4は読出しクロック回路16に
よりクロックされて同様にO出力により制・御されてい
るスイッチ9を経て読み出される。アナログシフトレジ
スタ3への書き込み期間中別のアナログシフトレジスタ
4はこのように読み出しを行ない、続いて分周回路11
のQ,寛出力が反転すると、再びアナログシフトレジス
タ4が書込み、3が読出しを行なう。ここで書込みクロ
ック回路10のクロック周波数をf1、読出しクロック
回路16のクロック周波数をF2としたとき、となるよ
うに、各クロック周波数を決めれば、時間軸はm倍に伸
長され、音声入力端子1に入力した圧縮音声は出力端子
2に時間軸が復元されてあられれる。読出しクロック周
波数F2は、当然、必要な出力音声周波数帯域に対しナ
イキストのサンプリング定理を満たすように決められる
。上述の如き従来装置に於ては、アナログシフトレジス
タ3及び4を交互に出力する音素片の接続タイミングは
、書き込みクロック10をMNと分周する分周回路11
の出力によりMN/f1秒毎に自動的に決められるため
、従つて第4図に図示するように音素片の接続部に不連
続な波形変化とピッチ周波数の変動とが発生する。
These analog switches also control the Q of a frequency divider circuit 11 that divides the write clock circuit 10 of the analog shift registers 3 and 4 by MN (MN is an integer, and m will be described later).
and O output. Opening/closing is controlled as shown. Analog shift registers 3 and 4 are alternately write clock controlled by AND gates 12 and 13 of the Q and O outputs of clock circuit 10 and frequency divider circuit 11 via 0R gates 14 and 15, and are also controlled by read clock circuits 16 and . "The read clock is controlled alternately by the AND gates 17 and 18 of the Q and O outputs of the frequency dividing circuit 11 via the 0R gates 14 and 15. That is, for example, the time axis given to the input terminal 1 is multiplied by m ( m>1) (such a compressed signal can be obtained, for example, by increasing the playback speed of a tape recorder by m times the recording speed), when the Q output of the frequency dividing circuit 11 is 1, The signal is written into the analog shift register 4 via the analog switch 8.The number of bits in the shift register is N, and when the pair of sampling strings have been sequentially input as input audio signals,
The Q output of the frequency divider circuit 11 is inverted and becomes 0, and the switch 8
Close. At the same time, the O output of the frequency dividing circuit becomes 1, the switch 6 is opened, and data is written to the analog shift register 3 in the same way. At this time, as is clear from the configuration of the figure,
The analog shift register 4 is clocked by a read clock circuit 16 and read out via a switch 9 which is also controlled by the O output. During the writing period to the analog shift register 3, another analog shift register 4 performs reading in this manner, and then the frequency dividing circuit 11
When the Q and output of the analog shift register 4 is inverted, the analog shift register 4 writes again, and the analog shift register 3 performs the reading. Here, when the clock frequency of the write clock circuit 10 is f1 and the clock frequency of the read clock circuit 16 is F2, if each clock frequency is determined as follows, the time axis is expanded by m times, and the audio input terminal 1 The compressed audio input to the output terminal 2 is outputted with the time axis restored. The read clock frequency F2 is naturally determined so as to satisfy Nyquist's sampling theorem for the required output audio frequency band. In the conventional device as described above, the connection timing of the phoneme pieces that are alternately output from the analog shift registers 3 and 4 is determined by the frequency dividing circuit 11 that divides the write clock 10 by MN.
Since it is automatically determined every 1 second by the output of MN/f, discontinuous waveform changes and pitch frequency fluctuations occur at the connecting portions of phoneme units, as shown in FIG.

前記の如くこのような音素片の接続部に於ける波形やピ
ッチの不連続は音質や明瞭度をいちじるしく低下させる
。次にこのような従来装置の欠点を改良できる本発明の
内容について第2図のブロック図と共に説明する。同図
に於いて、103及び104はアナログスイッチ106
,107,108及び109によつて開閉制御されるア
ナログシフトレジスタ、110及び116はそれぞれ周
波数f1およびF2のクロック回路、111はMN分周
回路てあり、これらの構成は第1図の従来装置と同じで
ある。本発明は、前述の如く接続する音素片の接続部に
ついて時間的修正を加えるのであるが、これをROMl
2Oによりプログラムされたコンピユータ(演算処理装
置)(CPU)121により行なう。計数回路(カウン
ター)122は各周期毎に音素片の先端及び後端を計数
しI/0ボート123を経てCPUl2lにタイミング
指示する回路、A/D変換器124はクロック回路11
0からのコンバートコマンド信号に従つて入力信号をデ
ィジタル変換する回路、及びCPUl2lに縦続する記
憶回路125は、これらA/D変換された信号を記憶す
ると同時にCPUl2lの演算処理結果を一時保存する
機能をあわせ有している。即ち、まずCPUl2lは計
数回路122の出力にもとづき、入力クロックの最後部
よりM個のサンプルをA/D変換器124によりディジ
タル化してI/0ボート123から読み込み、記憶回路
125に保存する。次に分周回路111の出力が反転す
ると、CPUl2lは同様に計数回路122の出力にも
とづき、入力クロックの前端から(M+r)個のサンプ
ルを読み込む。引き続きCPUl2lはROMl2Oの
プログラムにもとづき、入力された音素片の後端と、そ
の後に続く音素片の前端の類似性を演算するのであるが
、具体的には各サンプリング列の二乗誤差を計算しこれ
が最小となるような接続タイミングを決定する。音素片
の後端のサンプリング数列をXp(P=1,2,・・,
M)、後続の音素片の前端サンプリングをYp(P=1
,2,・・,M+r)としたとき、2つの波形間の二乗
誤差はであられされる。これはサンプリング波形Xpに
対してYpをk個だけずらせて重ね合せたときの類似度
をあられすものであり、演算処理装置121はEHをk
=0,1,・・,rについてそれぞれ計算し、これが最
も小さくなるkを決定する。即ち第3図に示すように、
先行音素片の後端M個のサンプル列は後続音素片の先頭
よりk個ずれた部分から重ね合わせるのが最も誤差が少
ないということになる。そこで演算処理装置121は後
続音素片の先頭より(k+M+N)をとり込み、1/0
ボート123を通じてANDゲート112あるいは11
3を制御し、書き込みクロックを停止する。アナログシ
フトレジスタ103あるいは104の容量はNであるか
ら、従つて該アナログメモリーには図示の如く(k+M
+1)番目からNビットが記憶され、次の読み出しタイ
ミングに順次読み出されるのであるが、以上の説明から
明らかな通り、先行音素片の最後端Mサンプルと、後続
音素片の(k+1)番目からのMサンプルとが最も誤差
が少なく重さなるので、従つて音素片はまつたく自然な
形で音素片が引き続き出力される。前述の通り後続音素
片は(k+M+N)サンプルがアナログメモリーに取り
込まれるのであるが、このうちの最後尾からMサンプル
が同様にA/D変換器124、I/0ボート123を経
てCPUl2lの記憶装置125に保存される。これは
更に続く音素片の先頭から(M+r)個のサンプルとの
類似性を調べて接続する為に必要である。以上の処理の
タイムチャートを第3図Cに図示した。音素片の時間長
は少なくとも数10ミリ秒てあり、いわゆるマイクロコ
ンピュータ等の演算処理−装置により容易に処理され得
る。
As mentioned above, such discontinuities in waveform and pitch at the junctions of phoneme segments significantly reduce sound quality and clarity. Next, the content of the present invention that can improve the drawbacks of the conventional device will be explained with reference to the block diagram of FIG. 2. In the figure, 103 and 104 are analog switches 106
, 107, 108 and 109, analog shift registers 110 and 116 are clock circuits with frequencies f1 and F2, respectively, and 111 is an MN frequency divider circuit. These structures are different from the conventional device shown in FIG. It's the same. The present invention adds temporal correction to the connected parts of connected phoneme pieces as described above.
This is performed by a computer (processing unit) (CPU) 121 programmed by 2O. A counting circuit (counter) 122 is a circuit that counts the leading and trailing ends of phoneme pieces in each period and gives timing instructions to the CPU 12l via an I/0 board 123, and an A/D converter 124 is a circuit that counts the leading and trailing ends of phoneme pieces in each period, and the A/D converter 124 is a circuit that counts the leading and trailing ends of a phoneme piece in each cycle and instructs the CPU 12l to timing.
A circuit that digitally converts an input signal according to a conversion command signal from 0, and a storage circuit 125 connected in series to the CPU 12l have the function of storing these A/D converted signals and at the same time temporarily storing the arithmetic processing results of the CPU 12l. It also has. That is, first, based on the output of the counting circuit 122, the CPU 12l digitizes M samples from the last part of the input clock using the A/D converter 124, reads them from the I/0 port 123, and stores them in the storage circuit 125. Next, when the output of the frequency dividing circuit 111 is inverted, the CPU 12l similarly reads (M+r) samples from the front end of the input clock based on the output of the counting circuit 122. Subsequently, the CPU 12l calculates the similarity between the rear end of the input phoneme segment and the front end of the phoneme segment that follows based on the program in the ROM 12O. Specifically, it calculates the squared error of each sampling string and calculates this. Determine the minimum connection timing. The sampling sequence at the end of the phoneme is Xp (P=1, 2,...,
M), the front end sampling of the subsequent phoneme is Yp (P=1
, 2, . . , M+r), the square error between the two waveforms is calculated by . This calculates the degree of similarity when Yp is shifted by k points and superimposed on the sampling waveform Xp, and the arithmetic processing unit 121 calculates EH by k
=0, 1, . . . , r, and determine k for which this is the smallest. That is, as shown in Figure 3,
This means that the least error will be achieved if the M sample strings at the end of the preceding phoneme are superimposed from a portion shifted by k from the beginning of the succeeding phoneme. Therefore, the arithmetic processing unit 121 takes in (k+M+N) from the beginning of the subsequent phoneme, and 1/0
AND gate 112 or 11 through boat 123
3 and stops the write clock. Since the capacity of the analog shift register 103 or 104 is N, the analog memory has (k+M
+1) bits are stored and sequentially read out at the next read timing. Since the M samples have the least error and are heavier, the phoneme pieces are continuously output in a natural form. As mentioned above, (k+M+N) samples of the subsequent phoneme are taken into the analog memory, and M samples from the end of these are similarly passed through the A/D converter 124 and the I/0 board 123 and stored in the storage device of the CPU 121. 125. This is necessary in order to check the similarity with (M+r) samples from the beginning of the subsequent phoneme and connect them. A time chart of the above processing is shown in FIG. 3C. The time length of a phoneme is at least several tens of milliseconds, and can be easily processed by an arithmetic processing device such as a so-called microcomputer.

無論コンピュータシステムの能力と経済性を考慮すれは
、演算処理量は最少量にとどめられるべきである。この
為に(2)式を次の様に変形する。波形の類似度をつか
む為にはこの右辺第2項だけを使えば良い。即ちこの式
で定義されるFxY(k)は衆知のことく、2つの数値
系列Xp.l5Ypとの間の相互相関関数と称されるも
のであり、片方の波をk個のサンプル値分だけずらした
ときの2波の間のパワーであり、2波が完全に一致した
ときその値はlとなフる。
Of course, considering the power and economy of the computer system, the amount of calculation processing should be kept to a minimum. For this purpose, equation (2) is transformed as follows. In order to grasp the similarity of waveforms, it is sufficient to use only the second term on the right side. That is, as is well known, FxY(k) defined by this formula is composed of two numerical series Xp. It is called the cross-correlation function between the two waves, and is the power between the two waves when one wave is shifted by k sample values, and the value when the two waves completely match. becomes l.

(4)式の採用により演算処理時間は大巾に短縮される
。第4図には従来方法(第1図)による時間軸伸長装置
の再生音波形を、第5図には本発明方式(第2図)によ
る同再生波形を200(Hz)の正弦波単一信号につい
て実際に処理したデータである。これら両データはm=
2、f1=40KHz.sf2=20KHz..N=7
68なる条件で測定したものである。上述においては、
音声の時間軸伸長装置を具体例として説明したが、記憶
手段として前述の如きアナログシフトレジスタを使用す
る代りにRAMを使用してもよく、その際にはナナログ
の音声波形をA/D変換器でディジタル信号に変換して
からRAMに入力し、RAM出力はD/A変換器でアナ
ログ信号に変換するという慣用技術を使用することは言
うまでもない。
By employing equation (4), the calculation processing time is greatly shortened. Figure 4 shows the reproduced waveform of the time axis expansion device using the conventional method (Figure 1), and Figure 5 shows the same reproduced waveform by the method of the present invention (Figure 2) using a single 200 (Hz) sine wave. This is data that was actually processed about the signal. Both of these data are m=
2, f1=40KHz. sf2=20KHz. .. N=7
It was measured under the condition of 68. In the above,
Although the audio time axis expansion device has been described as a specific example, a RAM may be used instead of using the analog shift register as described above as a storage means, and in that case, the analog audio waveform is transferred to an A/D converter. It goes without saying that the conventional technique of converting the signal into a digital signal before inputting it to the RAM and converting the RAM output into an analog signal using a D/A converter is used.

このように本発明の技術は各種の音声や音響等のアナロ
グ信号の合成装置に利用可能であることは言うまでもな
い。このように本発明の装置は先行および後続アナログ
信号素片の接続部近傍の相関関数あるいは二乗誤差に着
目して時系列的に連続するアナログ信号素片について、
アナログ信号素片の各接続部の誤差が最も少ない部分で
重ね合うように各時間軸の修正を行なうものである。
As described above, it goes without saying that the technique of the present invention can be used in a synthesis device for analog signals such as various voices and sounds. In this way, the device of the present invention focuses on the correlation function or square error near the connection between the preceding and succeeding analog signal segments, and calculates the
The time axes are corrected so that the connected portions of analog signal segments overlap at the portion where the error is least.

更に詳説すると、本発明は記憶手段に記憶された先行ア
ナログ信号素一片の後端部近傍と後続アナログ信号素片
の先端部近傍の波形の類似性を比較し、先行アナログ信
号素片と後続アナログ信号素片が最も滑めらかに接続さ
れるよう後続アナログ信号素片をクロック出力すること
である。即ち、先行アナログ信号素片の後端部近傍のデ
ータと後続アナログ信号素片の先端部近傍のデータとを
相対的にシフトさせて比較し、先行アナログ信号素片に
後続アナログ信号素片が最も滑めらかに接続されるよう
後続アナログ信号素片のデータを記憶手段からクロック
出力する。従つて従来装置の如き接続部のアナログ信号
波形の不連続やピッチ周波数の変動等の無い合成アナロ
グ信号を得ることができる。
More specifically, the present invention compares the similarity of waveforms near the rear end of the preceding analog signal element stored in the storage means and near the front end of the subsequent analog signal element, and The purpose is to output the clock of the subsequent analog signal segments so that the signal segments are connected as smoothly as possible. That is, the data near the rear end of the preceding analog signal element and the data near the leading end of the succeeding analog signal element are relatively shifted and compared, and the following analog signal element is the most similar to the preceding analog signal element. The data of the subsequent analog signal segment is clocked out from the storage means so that the connection is smooth. Therefore, it is possible to obtain a composite analog signal without discontinuities in analog signal waveforms or fluctuations in pitch frequency at the connection parts as in conventional devices.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来のアナログ信号合成装置を示すブロック・
ダイヤグラム、第2図は本発明のアナログ信号合成装置
を示すブロック・ダイヤグラム、第2図は本発明の音声
合成装置を示すブロック・ダイアグラム、第3図は本発
明を説明するための図面、第4図は従来の装置の特性を
示す図面、第5図は本発明の装置の特性を示す図面であ
る。 103,104・・・アナログ信号の記憶装置、121
・・・演算処理装置。
Figure 1 shows the block diagram of a conventional analog signal synthesizer.
2 is a block diagram showing an analog signal synthesizer of the present invention; FIG. 2 is a block diagram showing a speech synthesizer of the present invention; FIG. 3 is a drawing for explaining the present invention; The figure shows the characteristics of a conventional device, and FIG. 5 shows the characteristics of the device of the present invention. 103, 104...analog signal storage device, 121
...Arithmetic processing unit.

Claims (1)

【特許請求の範囲】 1 アナログ信号波形より抽出されたアナログ信号素片
波形を用いて編集合成アナログ信号合成装置であつて、
(a)入力クロック供給手段と、(b)出力クロック供
給手段と、 (c)前記入力クロック供給手段から供給される入力ク
ロックに従つて入力信号をサンプリングして記憶し且つ
前記出力クロック供給手段から供給される出力クロック
に従つて出力する記憶手段と、(d)入力信号のサンプ
リングより得られた時間的に先行する先行アナログ信号
素片のサンプリング値と時間的に後続する後続アナログ
信号素片のサンプリング値について時間軸を変数とする
前記入力信号波形の類似度を算出する計算手段と、(e
)該計算手段の計算結果により前記記憶手段の出力クロ
ックを制御して先行アナログ信号素片に引き続き出力す
る後続アナログ信号素片の類似性が時間的に連続するよ
うに、前記出力クロック供給手段を制御して後続アナロ
グ信号素片の時間軸を調整するクロック制御信号発生手
段とを備えることを特徴とするアナログ信号素片編集型
のアナログ信号合成装置。 2 計算手段及びクロック制御信号発生手段は、先行ア
ナログ信号素片の比較的後端部のサンプリング値と後続
アナログ信号素片の比較的先端部のサンプリング値につ
いて2乗誤差、或は相互相関関数を計算し、この計算結
果により記憶手段の出力クロックを制御して接続アナロ
グ信号素片の時間軸を調整するようプログラムされた演
算処理装置である特許請求の範囲1に記載のアナログ信
号合成装置。
[Claims] 1. An analog signal synthesis device for editing and synthesizing using analog signal segment waveforms extracted from analog signal waveforms,
(a) an input clock supply means; (b) an output clock supply means; (c) an input signal that samples and stores an input signal according to an input clock supplied from the input clock supply means; (d) storage means for outputting in accordance with the supplied output clock; a calculation means for calculating the similarity of the input signal waveform with the time axis as a variable for the sampling value;
) The output clock supplying means controls the output clock of the storage means according to the calculation result of the calculation means so that the similarity of the subsequent analog signal segment to be outputted subsequently to the preceding analog signal segment is temporally continuous. 1. A clock control signal generating means for controlling and adjusting the time axis of a subsequent analog signal segment. 2. The calculation means and the clock control signal generation means calculate a square error or a cross-correlation function for the sampling value at the relatively rear end of the preceding analog signal segment and the sampling value at the relatively leading end of the succeeding analog signal segment. The analog signal synthesis device according to claim 1, which is an arithmetic processing device programmed to perform calculations and adjust the time axis of the connected analog signal segments by controlling the output clock of the storage means based on the calculation results.
JP52153275A 1977-12-16 1977-12-16 Analog signal synthesizer Expired JPS6042959B2 (en)

Priority Applications (8)

Application Number Priority Date Filing Date Title
JP52153275A JPS6042959B2 (en) 1977-12-16 1977-12-16 Analog signal synthesizer
US05/967,717 US4210781A (en) 1977-12-16 1978-12-08 Sound synthesizing apparatus
CA000318058A CA1118897A (en) 1977-12-16 1978-12-15 Sound synthesizing apparatus
IT7830905A IT1192605B (en) 1977-12-16 1978-12-15 APPARATUS AND METHOD OF SYNTHESIZATION FOR SOUND REPRODUCTION
GB7848761A GB2013453B (en) 1977-12-16 1978-12-15 Sound synthesizing apparatus
FR7835365A FR2434451B1 (en) 1977-12-16 1978-12-15 SOUND SYNTHESIZER APPARATUS
DE2854601A DE2854601C2 (en) 1977-12-16 1978-12-18 Process for sound processing and sound synthesizer for its implementation
US06/297,831 USRE31172E (en) 1977-12-16 1981-08-31 Sound synthesizing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP52153275A JPS6042959B2 (en) 1977-12-16 1977-12-16 Analog signal synthesizer

Publications (2)

Publication Number Publication Date
JPS5483703A JPS5483703A (en) 1979-07-04
JPS6042959B2 true JPS6042959B2 (en) 1985-09-25

Family

ID=15558892

Family Applications (1)

Application Number Title Priority Date Filing Date
JP52153275A Expired JPS6042959B2 (en) 1977-12-16 1977-12-16 Analog signal synthesizer

Country Status (1)

Country Link
JP (1) JPS6042959B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57138699A (en) * 1981-02-20 1982-08-27 Sanyo Electric Co Voice synthesizer
JPS58162996A (en) * 1982-03-19 1983-09-27 三洋電機株式会社 Voice synthesizer
JPS61107299A (en) * 1984-10-31 1986-05-26 興和株式会社 Signal processor

Also Published As

Publication number Publication date
JPS5483703A (en) 1979-07-04

Similar Documents

Publication Publication Date Title
JPS623439B2 (en)
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
JPH0736455A (en) Music event index generating device
JPS6042959B2 (en) Analog signal synthesizer
JPH11259066A (en) Musical acoustic signal separation method, device therefor and program recording medium therefor
JPS602680B2 (en) speech synthesizer
JPH05307395A (en) Voice synthesizer
JP3197975B2 (en) Pitch control method and device
JPS6042960B2 (en) Analog signal synthesizer
JPS6060077B2 (en) Analog signal synthesizer
JP2612867B2 (en) Voice pitch conversion method
JPS6060079B2 (en) Analog signal synthesizer
JPS6060078B2 (en) Analog signal synthesizer
JPS6036598B2 (en) speech synthesizer
JPS6265098A (en) Music vocoder
JPS6040633B2 (en) Speech synthesizer with silent plosive sound source
JPH0125080B2 (en)
JPS6295595A (en) Voice response system
JPH035599B2 (en)
JP2572961B2 (en) Voice synthesis method
JP2000003187A (en) Method and device for storing voice feature information
JPS60113299A (en) Voice synthesizer
JPH0358518B2 (en)
JPS59177597A (en) Musical note synthesizer
JPS6067998A (en) Voice synthesizer