JPS6059397A - Voice synthesizer - Google Patents

Voice synthesizer

Info

Publication number
JPS6059397A
JPS6059397A JP58167533A JP16753383A JPS6059397A JP S6059397 A JPS6059397 A JP S6059397A JP 58167533 A JP58167533 A JP 58167533A JP 16753383 A JP16753383 A JP 16753383A JP S6059397 A JPS6059397 A JP S6059397A
Authority
JP
Japan
Prior art keywords
channel
waveform
phoneme
register
reproduction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58167533A
Other languages
Japanese (ja)
Inventor
森戸 誠
隆 矢頭
三木 敬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP58167533A priority Critical patent/JPS6059397A/en
Publication of JPS6059397A publication Critical patent/JPS6059397A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 (技術分野) 本発明は記憶領域から音素波形の波形領域での情報を読
み出し音声を合成する音声合成器に関し、特に複数のD
PCM符号化された音素波形を重畳する加算を実行し、
音声出力を得る音声合成器に関する。
Detailed Description of the Invention (Technical Field) The present invention relates to a speech synthesizer that reads information in the waveform region of a phoneme waveform from a storage area and synthesizes speech, and particularly relates to a speech synthesizer that reads information in the waveform region of a phoneme waveform from a storage area and synthesizes speech.
Perform addition to superimpose PCM encoded phoneme waveforms,
This invention relates to a speech synthesizer that obtains speech output.

(従来技術) 人間の声は有声音の場合、肺からの空気流が声帯によっ
て準周期的なイン・ぐルス流となり声道と呼ばれる空洞
共鳴体と共鳴することによって発せられる。
(Prior Art) When a human voice is a voiced sound, it is emitted when the airflow from the lungs becomes a quasi-periodic in-gurus flow through the vocal cords and resonates with a hollow resonator called the vocal tract.

人間の声の波形を第1図に示す。Figure 1 shows the waveform of a human voice.

第1図に示されるごとく人間の声は゛ピ、チ″と呼ばれ
る周期ごとにほとんど同じ波形がくりかえされている。
As shown in Figure 1, the human voice has almost the same waveform that repeats every cycle called ``pi'' and ``chi''.

このことは前にも述べたように人間の声は準周期的なイ
ンパルス流によって発せられることから起因しておりピ
ッチ周期はこのインパルス流の間隔に等しい。
This is because, as mentioned earlier, the human voice is emitted by a quasi-periodic impulse stream, and the pitch period is equal to the interval of this impulse stream.

このような音声を合成し7ようとしたとき音声の情Nを
どのような形で格納しておくかにより各種方式があげら
れる。
When attempting to synthesize such voices, there are various methods depending on how the information N of the voice is stored.

その1つの方式として音声の1ピッチ周期の波形(これ
を音素波形と称する)をいろいろな音声について記憶領
域に格納し制御情報にしたがいこれら音素波形をつなぎ
合わぜることによって音声を出力する方式がある。
One method is to store one-pitch period waveforms of speech (called phoneme waveforms) for various speech sounds in a storage area, and output speech by connecting these phoneme waveforms according to control information. be.

第2図にこの方式による構成を示す。Figure 2 shows a configuration using this method.

1は各種音声に対して]ピッチ周期の音素波形を格納し
ておく記憶領域で、2は音素波形をつなぎ合わぜるだめ
のピッチならびに振幅倍などの制御情報用記憶領域で、
3は音声素片をつなぎ合わせる合成部である。
1 is a storage area for storing phoneme waveforms with pitch periods for various voices; 2 is a storage area for control information such as pitch and amplitude multiplication for connecting phoneme waveforms;
3 is a synthesis unit that connects speech segments.

記1意領域1に格納された音声を記憶領域2に格納され
た制御情報によってつなぎ合わせることによって音声を
合成部3で合成するが、自然性の高い合成音を作るため
には声の高さ、声の大きさを連節に制御しなければなら
ない。声の大きさは記憶領域内の振幅倍情報によって記
憶領域内の音素を一定倍することにより制御される。ま
た声の高さは記憶領域2内のピッチ情報によって制御さ
れる。しかし記憶領域lの中の音素波形は音素波形を抽
出した際の音声のピッチ周期の長さをもっており制御情
報によって与えられるピッチとは必ずしも一致していな
い。
Note 1: Voices are synthesized by the synthesizer 3 by connecting the voices stored in the storage area 1 according to the control information stored in the storage area 2. However, in order to create a highly natural synthesized sound, the pitch of the voice must be adjusted. , the volume of the voice must be controlled in a continuous manner. The loudness of the voice is controlled by multiplying the phonemes in the storage area by a certain amount using amplitude multiplication information in the storage area. Furthermore, the pitch of the voice is controlled by pitch information in the storage area 2. However, the phoneme waveform in the storage area l has the pitch period length of the voice when the phoneme waveform was extracted, and does not necessarily match the pitch given by the control information.

したがって制御情報のピッチが音声素片長よシ短い場合
には音声素片の後端を切シ、制御情報のピッチが音声素
片長よシ長い場合には音声素片の最後の値を延長して制
御情報と同一ピンチ長をもった音素をする。(第3図参
照)しかし記憶領域1に格納された音素波形を途中で切
った場合には音素波形が十分に減衰していないときには
接続する音素波形との間に不連続を生じ合成音に悪影き
ょうをおよぼすという欠点かあ、Itた逆に音素波形を
長くした場合には音素波形のス波りトラムが変形してし
まい音質劣化をまねくという欠点があった。
Therefore, if the pitch of the control information is shorter than the phoneme length, the trailing end of the phoneme is cut off, and if the pitch of the control information is longer than the phoneme length, the last value of the phoneme is extended. Play phonemes with the same pinch length as the control information. (See Figure 3) However, if the phoneme waveform stored in storage area 1 is cut in the middle, if the phoneme waveform is not sufficiently attenuated, discontinuity will occur between the phoneme waveform and the connected phoneme waveform, which will affect the synthesized sound. On the other hand, when the phoneme waveform is lengthened, the wave tram of the phoneme waveform is deformed, resulting in deterioration of sound quality.

(発明の目的及び概要) 本発明の目的はこれらの欠点を解決することにあり、ピ
ッチ周期ずつずれる複数チャンネルのI)PCM 相号
化された音素波形を重畳する音声合成器にン9いて、D
PCM符号再生を時間多重処理することにより、また音
素波形の重畳演算に用いる加算器をI)PCM符号再生
器内の加算と共有することによりfyi〕単な回路構成
で自然性のある良質な音声を合成すも音声合成器を実現
させたもので、以下詳細に説明する。
(Objective and Summary of the Invention) The object of the present invention is to solve these drawbacks, and to provide a speech synthesizer that superimposes I) PCM phase encoded phoneme waveforms of multiple channels shifted by pitch period. D
By time-multiplexing PCM code reproduction, and by sharing the adder used for the phoneme waveform superimposition calculation with the addition in the PCM code regenerator, natural, high-quality speech can be achieved with a simple circuit configuration. This is an implementation of a speech synthesizer, and will be explained in detail below.

(発明の前提) 前:・ても述べたように音声は声帯によるインパルス流
が共鳴することにより発せられておシこれは電気回路に
置き換えることができる。
(Premise of the invention) Previous: As mentioned above, sound is produced by the resonance of impulse flows from the vocal cords, and this can be replaced by an electric circuit.

すなわち音声は声帯に相当する励振回路の発する1つの
インパルスに対応した共振フィルタの出力波形(以下こ
れを音素波形と呼ぶ)の重なり合ったものと考えられる
。このことを第4図を用いて説明する。
In other words, speech is considered to be a superposition of output waveforms (hereinafter referred to as phoneme waveforms) of a resonant filter corresponding to one impulse generated by an excitation circuit corresponding to the vocal cords. This will be explained using FIG. 4.

2:′λ4図のIOは、励振回路の発するイン・ぐルス
列である。ここで、各インパルス間の時間間隔はピッチ
周期間隔である。11は励振回路の発するイン・Qルス
列で共振フィルタを駆動した合成音声出力波形である。
2:'λ4 IO in the diagram is an in-wave train generated by the excitation circuit. Here, the time interval between each impulse is the pitch period interval. 11 is a synthesized audio output waveform obtained by driving a resonant filter with an in-Q pulse train generated by an excitation circuit.

12は励振回路の発するインパルス列のうち、インパル
スP1によって共振フィルタを駆動した場合の音素波形
である。
12 is a phoneme waveform when the resonant filter is driven by the impulse P1 of the impulse train generated by the excitation circuit.

以下同様に13〜17はインパルスP2〜P6(でよっ
て共振フィルタ4を駆動した場合の音素波形である。
Similarly, 13 to 17 are phoneme waveforms when the resonance filter 4 is driven by impulses P2 to P6.

励振回路より発せられる駆動インパルス列1゜はインパ
ルスP1からP6の加算であるから重畳の定理によれば
合成音声出力波形11は各音素波形12から17までの
加算によって得られる。
Since the driving impulse train 1° emitted from the excitation circuit is the addition of impulses P1 to P6, according to the superposition theorem, the synthesized speech output waveform 11 is obtained by the addition of each phoneme waveform 12 to 17.

第・1図に示される音素波形12は時間点t1以前はO
である。時間点1.以後では時間経過とともに減衰し無
限大時間点では0となる性質を有する。実際、音声波形
の場合励振点(1+)から16ミIJ秒を経過した時点
での音素波形はほとんど0と考えられる。したがって音
素波形12の再生処理は励振時点(tl)から16ミリ
秒間で十分である。
The phoneme waveform 12 shown in FIG. 1 is O before time point t1.
It is. Time point 1. Thereafter, it has the property of attenuating with the passage of time and becoming 0 at an infinite time point. In fact, in the case of a speech waveform, the phoneme waveform is considered to be almost 0 when 16 milliJ seconds have passed from the excitation point (1+). Therefore, 16 milliseconds from the excitation time point (tl) is sufficient for the reproduction processing of the phoneme waveform 12.

しかし、音素波形13の再生処理を励振時間点L2から
開始するには、音素波形12の再生処理が滓了していな
いために多重的な再生処理が必要となる。必要と在る波
形再生多重度nは次の第(1)で−りえられる。通常音
声の場合nは4程度で十分である。そこでn = 4と
して以後説明する。
However, in order to start the reproduction process of the phoneme waveform 13 from the excitation time point L2, multiple reproduction processes are required because the reproduction process of the phoneme waveform 12 has not yet been completed. The necessary waveform reproduction multiplicity n can be determined in the following step (1). In the case of normal voice, n of about 4 is sufficient. Therefore, the following explanation will be made assuming that n = 4.

次に音素波形を再生するための符号として、符号化効率
のよいDI)CM符号を用いる・一連のDPCM符号か
ら波形を再生する再生器については特願55−] 09
800に提案されているDPCM復号器において量子化
ステップサイズを与える量子化メモリのアドレスy、 
Jえるポインタ値を一定にすることによって与えられる
ため詳しい説明は省略する。
Next, as a code for reproducing the phoneme waveform, a DI)CM code with high encoding efficiency is used.・For a regenerator that reproduces a waveform from a series of DPCM codes, Patent Application No. 55-09
address y of the quantization memory giving the quantization step size in the DPCM decoder proposed in 800;
The detailed explanation will be omitted since it is given by keeping the constant pointer value constant.

DPCM符号の再生処理のような差分復号処理において
16ミリ秒(128標本周期)で再生処理を打ち切った
場合には最終出力値が保持される。したがって音素波形
の条件 (条件1) 励振時間点以前ば0である(条件2) 無
限大時間点でば0であるを満たすためには再生初期値が
Oである事と、再生最終出力値がOである事が必要であ
り、再生初期値をOとしても通常再生最終値は0とはな
らない。したがって再生最終値が0となるようにDPC
M符号列を与えなければなら々い。
In a differential decoding process such as a DPCM code reproduction process, when the reproduction process is terminated after 16 milliseconds (128 sample periods), the final output value is held. Therefore, the phoneme waveform condition (Condition 1) is 0 before the excitation time point (Condition 2) and is 0 at the infinite time point.In order to satisfy the condition, the initial reproduction value must be O, and the reproduction final output value must be 0. It is necessary that the value is O, and even if the initial value for reproduction is O, the final value for normal reproduction will not be 0. Therefore, DPC is set so that the final playback value is 0.
It is necessary to provide M code strings.

(発明の実施例) 第5図に本発明における1実施例を示す。(Example of the invention) FIG. 5 shows one embodiment of the present invention.

ここで1標本周期時間内に時分割に処理される処理に対
して番刊付けのため1−チャネル」又はrchJという
言葉を用いる。
Here, the term ``1-channel'' or rchJ is used to number the processes that are time-divisionally processed within one sample period.

第5図における各部は次のとおりである。100は第1
c++入力レジスク、101は第2ch入カレノスタ、
102は第3ch入力レジスク、1o3は第4c1〕入
力レジスタ、104.105はセレクタ、106はDP
CM符号データLnを格納するレノスタ、109はセレ
クタ、110はセレクタ、111は第1.chポインタ
レジスタ、112は第2chポインタレノスタ、113
は第3chポインタレノスク、114は第2chポイン
タレノスタ、115はセレクタ、117は量子化ステッ
プ値Xを格納している量子化メモリ、118はシフトレ
ソスタ、119tri /J1i、]誠lfI器、12
0はレノスタ、121は合成音声を出力するレノスタ、
122は出力端子、135は第1C11グウンカウンタ
、136は第2chりゞランカウンタ、137は第3C
)〕ダウンカウンタ、138は第1Ichグウンカウン
ク、139は第2Chデコーダ、140は第2Chデコ
ーダ、141は第3chデコーダ、142は第4.ch
デコーダ、14 Jは各チャネルのBIJSY信号、1
’4.5は波形再生のための起動信号、150はコント
ローラである。コントローラ15θは前述の第101〕
入力レジスタ100、第2C11の入カレジスク101
+・、第3chデコータ141 、 第4chデコーダ
142等の各回路と接続され、その動作の制御を行なっ
ているが第5図td図が複雑になるのをさけるためにそ
の接続の様子は省略している。
Each part in FIG. 5 is as follows. 100 is the first
c++ input register, 101 is 2nd channel input careno star,
102 is the 3rd channel input register, 1o3 is the 4th c1] input register, 104.105 is the selector, 106 is the DP
109 is a selector, 110 is a selector, 111 is a first . channel pointer register, 112, second channel pointer register, 113
114 is the 3rd channel pointer nosk, 114 is the 2nd channel pointer nostar, 115 is the selector, 117 is the quantization memory storing the quantization step value
0 is Renostar, 121 is Renostar that outputs synthesized voice,
122 is an output terminal, 135 is the 1st C11 count counter, 136 is the 2nd channel rerun counter, and 137 is the 3rd C
)] Down counter, 138 is the first Ich count, 139 is the second Ch decoder, 140 is the second Ch decoder, 141 is the third ch decoder, 142 is the fourth... ch
Decoder, 14 J is BIJSY signal of each channel, 1
'4.5 is a start signal for waveform reproduction, and 150 is a controller. The controller 15θ is the above-mentioned No. 101]
Input register 100, second C11 input register 101
+., 3rd channel decoder 141, 4th channel decoder 142, etc., and controls their operation, but the connections are omitted to avoid complicating the Figure 5 TD diagram. ing.

第6図は音素波形を再生するために本発明において用い
るデータでポインタ値DPnと128個のDI’C11
?符号Lnl J Ln2 + L12 + ”’ r
 Ln64から成り立っている。またポインタ値データ
D I”は波形再生開始時点にポインタに格納されるデ
ータである。
Figure 6 shows the data used in the present invention to reproduce the phoneme waveform, including the pointer value DPn and 128 DI'C11.
? Code Lnl J Ln2 + L12 + ”' r
It consists of Ln64. Further, the pointer value data DI'' is data stored in the pointer at the start of waveform reproduction.

捷た各チャンネルに割り当てられる再生処理と時間との
関係を第7図に示す。
FIG. 7 shows the relationship between the playback processing assigned to each skipped channel and time.

第7図において200は合成出力波形、20ノはチャネ
ル1に割り当てられた再生処理によって再生される音素
波形、202はチャネル1用起動信号ST1.203は
チャネル1用BUSY信号BUSY1. 。
In FIG. 7, 200 is a synthesized output waveform, 20 is a phoneme waveform reproduced by the reproduction processing assigned to channel 1, 202 is a channel 1 activation signal ST1.203 is a channel 1 BUSY signal BUSY1. .

以下205 、2 o 9 、213はチャネル2,3
゜4に割り当てられた再生処理によって再生される音素
波形、206,210,214はチャネル2゜3.4の
起動信号ST2.ST3.ST4.207,211゜2
1.5はチャネル2,3.4用BUSY信号BUSY2
 。
Below 205, 2 o 9 and 213 are channels 2 and 3
The phoneme waveforms 206, 210, and 214 reproduced by the reproduction process assigned to channel 2°3.4 are activation signals ST2. ST3. ST4.207,211゜2
1.5 is the BUSY signal BUSY2 for channels 2 and 3.4
.

BUSY3 、 BUSY4信号であ不。BUSY3, BUSY4 signal is not working.

第5図〜第7図を用いて本発明の実施例を詳しく説明す
る。
Embodiments of the present invention will be described in detail with reference to FIGS. 5 to 7.

時間点t1において外部から起動信号STIがコントロ
ーラ150にくわえられチャネル1によって第4図12
に相当する音素波形の再生処理が開始される。このとき
コントローラ150はダウンカウンタ135に値128
をセ、1・する。この値は前記16ミリ秒に相当する値
である。(出力波形の標本化周期を125マイクロ秒と
すると、16ミリ秒は128標本化周期となる)デコー
ダ139はダウンカウンタ135の出力が0以外の場合
は” 1 ”をBUS−11’l信号として出力する。
At time point t1, a start signal STI is applied to the controller 150 from the outside and is transmitted through channel 1 as shown in FIG.
The reproduction process of the phoneme waveform corresponding to is started. At this time, the controller 150 sets the down counter 135 to a value of 128.
Set, 1. This value corresponds to the aforementioned 16 milliseconds. (If the sampling period of the output waveform is 125 microseconds, 16 milliseconds is 128 sampling periods.) If the output of the down counter 135 is other than 0, the decoder 139 outputs "1" as the BUS-11'l signal. Output.

以下、標本化周期(125マイクロ秒)ごとに入カレノ
スタ100から波形再生用のデータを読み取りDPCM
再生処理を行なう。再生処理終了ごとにダウンカウンタ
1’ 35は1づつ減じられる。128回目の再生処理
が終了した時点でダウンカウンタ135は0とな9、B
USYI信号が” o ”となる。
Hereafter, data for waveform reproduction is read from the input current recorder 100 every sampling period (125 microseconds) and the DPCM
Perform playback processing. The down counter 1' 35 is decremented by 1 each time the reproduction process is completed. At the end of the 128th playback process, the down counter 135 becomes 0.9,B
The USYI signal becomes "o".

第1表に、コントロ〜う150が、セレクタ104f介
して入力される各チャンネルの入カレノスタ(100,
101,102,1o3)に格納されたDPCM符号L
nと、シフトレジスタ118によってシフトダウンされ
た値(CXI、[因X〕、〔イX) 、 (、、x) 
;但しCX)は量子化メモリ117の出力)とを用いて
l/レジスタ20と加減算器119において行なう1.
)PCM波形再ケ演算処理(ポインタの移動演算は除く
)を示す。
Table 1 shows the input current status (100,
101, 102, 1o3) DPCM code L stored in
n and the value shifted down by the shift register 118 (CXI, [Cause X], [IX), (,,x)
; However, CX) is performed in the l/ register 20 and the adder/subtractor 119 using the output of the quantization memory 117.
) PCM waveform re-key calculation processing (excluding pointer movement calculation).

第1表 同様に時間点t2において外部から起動信号ST2がコ
ノトローラ150に加えられ、チャネル2(・こよって
第4図13に相当する音素波形の再生処理が開始される
。このときダウンカウンタ136に(1!、l; 2 
gがセットされBUSY2信号が1″と在る。以下チャ
ネル1と同様な再生処理を行ない128標本化周期後に
ダウンカウンタ136はOと々すBUSY2信号は” 
o ”となる。
Similarly to Table 1, at time point t2, a start signal ST2 is externally applied to the controller 150, and the reproduction process of the phoneme waveform corresponding to channel 2 (FIG. 4, 13) is started. At this time, the down counter 136 (1!, l; 2
g is set and the BUSY2 signal is 1''.Then, the same reproduction process as for channel 1 is performed, and after 128 sampling periods, the down counter 136 reaches O.The BUSY2 signal is ``1''.
o”.

以下時間点t3からはチャネル3において、時間点1,
4からはチャネル4において、時間点t5からはチャネ
ル1において同様な制御が行なわれる。
From time point t3 onwards, in channel 3, time point 1,
Similar control is performed on channel 4 from time point t5 onwards, and on channel 1 from time point t5 onwards.

このように4つのチャネルによって再生処理を?j庁い
合成音声出力波形を標本化周期ごとに出力するが、各チ
ャンネルの再生処理は1標本時間点の;11jて時分割
に行なわれる。ここで、1標本化周期内での処理の時間
関係を第8図(a)に、フローチ、\・−1−全第8図
(b) 、 、(c)に示す。
Playback processing using four channels like this? The synthesized audio output waveform is output every sampling period, and the reproduction processing of each channel is performed in a time-division manner at one sampling time point. Here, the time relationship of processing within one sampling period is shown in FIG. 8(a), and FIGS. 8(b), 8(c).

1標本化周期内での処理は5つのサイクルに分か机でお
り、順次処理される。尚、それぞれのサイクルにおいて
処理されるDpcr4生処理に必要な回路はほとんど共
有化されており第6図の各構成要素のうちその名称にチ
ャネル番号の旬月されてい々い構成要素はすべて各サイ
クルに共通に用いられるものであり、これらを総称し7
て[共有部]と称する。
The processing within one sampling period is divided into five cycles, which are sequentially processed. It should be noted that most of the circuits required for the Dpcr4 raw processing processed in each cycle are shared, and all of the components shown in Figure 6, whose names include the channel number, are the same for each cycle. These are commonly used in 7
This is called the [shared part].

(サイクルj) チャネル1に割g当てられた波形再生処理が入カレノス
タ1θ0+ポインタレノスク111 、 ダウンカウン
タ135.デコーダ139と共有部を用いて行なわれ、
結果はレジスタ120VC格納される。
(Cycle j) The waveform reproduction process assigned to channel 1 is input to the current register 1θ0 + pointer register 111, down counter 135. This is done using the decoder 139 and a shared part,
The result is stored in register 120VC.

(サイクル2) チ・、ネル2に割り尚てられ/こ波形再生処理が入カレ
ノスクlol、!インタレノスタ112.ダウンカラ/
り136.デコーダ140と共有部を用いて行なわれ、
結果はレジスタ120に格納される。
(Cycle 2) Reassigned to Channel 2/This waveform playback process is input! Interenosta 112. Down collar/
ri136. This is done using the decoder 140 and a shared part,
The result is stored in register 120.

(サイクル3) チャネル3に割シ当てられた波形再生処理が入カレノス
ク102.ポインタレノスタ113.ダウンカラ/り1
37、デコーダ141と共有部を用いて行庁われ、結果
はレジスタ120に格納される。
(Cycle 3) The waveform playback process assigned to channel 3 is input to current screen 102. Pointerenosta 113. Down collar/ri 1
37, the processing is performed using the decoder 141 and the shared section, and the result is stored in the register 120.

(サイクル4) チャネル4に割り当てられた波形再生処理が入力レゾス
フ103.ポインタレノスタ114.ダウンカウンタ1
38.デコーダ142と共有部を用1ハて行々われ、結
果はレジスタ120に格納される。
(Cycle 4) The waveform reproduction processing assigned to channel 4 is performed by the input resouf 103. Pointerenosta 114. down counter 1
38. One step is performed using the decoder 142 and the shared section, and the result is stored in the register 120.

(サイクル5) し7′スタ120の値をレジスタ121に格納して合成
音声出力のためのPCMデータとする。
(Cycle 5) The value of the 7' star 120 is stored in the register 121 and used as PCM data for outputting synthesized speech.

以上の5つのサイクルにおけるii制御を第8図(+)
) 。
Figure 8 (+) shows the ii control in the above five cycles.
).

(c)のフローチャートに示す。This is shown in the flowchart in (c).

このように本実施例では、各チャンネルに割り当てられ
たDPCM符号による音素波形再生処理を、各チャンネ
ルごとの構成要素と、共通的に用いる共有部とで、時分
割処理によって実施している。
As described above, in this embodiment, the phoneme waveform reproduction processing using the DPCM code assigned to each channel is performed by time-division processing using the constituent elements for each channel and the commonly used shared section.

また各チャンネルの波形再生に用いる遂次加算手段(レ
ジスタ120と加減算器119)は音素波形を重ね合わ
せるための加算手段も兼ねており小さな回路構成により
実現される特長を有する。
Furthermore, the sequential addition means (register 120 and adder/subtractor 119) used to reproduce the waveforms of each channel also serves as addition means for superimposing phoneme waveforms, and has the advantage of being realized by a small circuit configuration.

又、各チャンネルの起動信号の間隔の変更によシ合成音
声出力のピッチ周期を容易に変化させることができる。
Furthermore, by changing the interval between activation signals of each channel, the pitch period of the synthesized audio output can be easily changed.

さらに一つの音素波形もOから始まり0で終わるため、
それぞれの音素の加算による波形の不連続性等の音質劣
化も発生し々い特長を合わせ持っている。
Furthermore, since one phoneme waveform also starts from O and ends at 0,
It also has the characteristic that sound quality deterioration such as waveform discontinuity due to the addition of individual phonemes is likely to occur.

(発明の効果) 以上説明したように本発明によれば、簡単な回路構成に
よりピッチ周期のコントロールが可能で良質々合成音を
出力する音声合成回路が構成できる。
(Effects of the Invention) As described above, according to the present invention, it is possible to configure a speech synthesis circuit that can control the pitch period and outputs high-quality synthesized speech with a simple circuit configuration.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は音声波形を示した図、第2図は従来の音声合成
器の構成図、第3図はピッチを変化させる場合に用いる
波形を示す図、第4図は音素波形の重ね合わせの説明図
、第5図は本発明の1実施例を示した図、第6図は音素
波形のデータ形式を示した図、第7図は音素波形とST
倍信号BUSY信号の時間関係を示した図、第8図(a
)は1標本周期時間内での処理の時間関係を表わした図
、第8図(b) 、 (c)は1標本周期時間内での処
理を表わしたフローチャートである。 100−第1ch入カレノスタ、101 ・・第2ch
入力1/ジスタ、102 第3ch入カレノスタ、10
3 ・第4 cl+l+入力レジスフ04・セレクタ、
105 セレクタ、lθ6 ・レジスタ、109・・セ
レクタ、110・セレクタ、111・第i chポイン
タレジスタ、112 第2cbポインタレソスク、11
3・・・第3chポインタレジスタ、114・第4.c
l+ポインタレジスタ、115・・・セレクタ、117
− ffi子化メモリ、11B・・・シフ1−レ/゛ス
タ、119・・加減算器、12θ・・レジスタ、12ル
ゾスタ、122・・出力端子、1.95・第1c)1ダ
ウンカウンタ、136 第2C1〕ダウンカウンク、1
37・第3chダウンカワンク、138・第4chグウ
ンカウンタ、139・・・第1chデコーダ、140・
第2chデコーダ、141・・第3chデコーダ114
2・第4chデコーダ、143−BUSY信号、145
・起動信号、150・・・コントローラ。 特許出願人 沖電気工業株式会社 第6図 第8図(b’ 第8 図(c) サイクル゛3 ! 1− ナイフ、l/4 手続補正書(自発) 1 事件の表示 昭和58年 特 許 願第 1.67533 号2発臥
1の名称 音声合成器 3 補正をする者 事件との関係 特許出願人 任 所(〒105) 東京都港区虎ノ門1丁目7番12
号4代理人 住 所(〒105) 東京都港区虎ノ門1丁目7香12
号6補正の内容 別紙のとおI) j− (’−5+’i−’:)、9 6、補正の内容 (1)明細書第4頁第10行目に1音素をする。」とあ
るのを1音素とする。」と補正する。 (2)同11第7頁第10行目に「DpcM@4号器」
とあるのk r ADPCM復号器」と補正する。 (3)同省−第9更第18行目に17Ln64」とある
のをrLnj’28jと補正する。
Figure 1 is a diagram showing speech waveforms, Figure 2 is a diagram showing the configuration of a conventional speech synthesizer, Figure 3 is a diagram showing waveforms used when changing pitch, and Figure 4 is a diagram showing the superposition of phoneme waveforms. Explanatory drawings, FIG. 5 is a diagram showing one embodiment of the present invention, FIG. 6 is a diagram showing a data format of a phoneme waveform, and FIG. 7 is a diagram showing a phoneme waveform and ST
A diagram showing the time relationship of the double signal BUSY signal, Fig. 8 (a
) is a diagram showing the time relationship of processing within one sample period time, and FIGS. 8(b) and 8(c) are flowcharts showing processing within one sample period time. 100-1st channel entry, 101...2nd channel
Input 1/Jista, 102 3rd channel input Kareno Star, 10
3 ・4th cl+l+input register 04・selector,
105 selector, lθ6 register, 109... selector, 110 selector, 111 i-th ch pointer register, 112 2nd cb pointer register, 11
3...3rd channel pointer register, 114/4th. c.
l + pointer register, 115... selector, 117
- ffi child memory, 11B... shift 1 register/star, 119... adder/subtractor, 12θ... register, 12 Luzo star, 122... output terminal, 1.95 1st c) 1 down counter, 136 2nd C1] Down count, 1
37. 3rd channel down counter, 138. 4th channel down counter, 139... 1st channel decoder, 140.
2nd channel decoder, 141... 3rd channel decoder 114
2. 4th channel decoder, 143-BUSY signal, 145
・Start signal, 150...controller. Patent applicant Oki Electric Industry Co., Ltd. Figure 6 Figure 8 (b' Figure 8 (c) Cycle ゛3! 1- Knife, l/4 Procedural amendment (voluntary) 1 Indication of case 1982 Patent application No. 1.67533 Name of No. 2 Speech Synthesizer 3 Relation to the case of the person making the amendment Patent applicant's office (105) 1-7-12 Toranomon, Minato-ku, Tokyo
No. 4 Agent address (105) 1-7 Kaori, Toranomon, Minato-ku, Tokyo
Contents of amendment No. 6 Attachment I) j- ('-5+'i-':), 9 6. Contents of amendment (1) Add one phoneme to line 10 on page 4 of the specification. ” is one phoneme. ” he corrected. (2) "DpcM@Unit 4" on page 7, line 10 of the same 11
A certain k r ADPCM decoder” is corrected. (3) Ministry of the same Ministry - 17Ln64'' on the 18th line of the 9th correction is corrected to rLnj'28j.

Claims (1)

【特許請求の範囲】[Claims] 複数のチャンネルに対応して、ポインタ初期値と複数の
DPCM符号とを含む単位データを再生手段に入力して
、各チャンネル毎に音素波形を再生してピンチ周期ずつ
ずれた各チャンネルの音素波形を加算手段により加算を
行ないその加算結果を合成音として出力する音声合成器
において、前記DPCM符号は1つの音素波形の初期値
と最終値を一致させるように設定された符号であり、各
チャンネルの前記音素波形は再生起動時点から一定時間
長を有し初期値と最終値が0である波形であり、前期再
生手段はそれぞれのチャンールで共有し、標本時間内に
各チャンネルにおける再生処理を時分割に行なうもので
あり、かつ前記加算手段は前記再生手段に用いるレーゾ
スタ及び加減算器を共用したものであって音素波形を累
算するものであることを特徴とする音声合成器。
In correspondence with a plurality of channels, unit data including a pointer initial value and a plurality of DPCM codes is input to a reproduction means, and a phoneme waveform of each channel is reproduced to generate a phoneme waveform of each channel shifted by a pinch period. In a speech synthesizer that performs addition by an adding means and outputs the addition result as a synthesized sound, the DPCM code is a code set so that the initial value of one phoneme waveform matches the final value, and the DPCM code of each channel is The phoneme waveform is a waveform that has a fixed time length from the start of playback and has an initial value and a final value of 0. The early playback means is shared by each channel, and the playback processing in each channel is time-divided within the sample time. 1. A speech synthesizer according to claim 1, wherein said adding means shares a laser star and an adder/subtractor used in said reproducing means and accumulates phoneme waveforms.
JP58167533A 1983-09-13 1983-09-13 Voice synthesizer Pending JPS6059397A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58167533A JPS6059397A (en) 1983-09-13 1983-09-13 Voice synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58167533A JPS6059397A (en) 1983-09-13 1983-09-13 Voice synthesizer

Publications (1)

Publication Number Publication Date
JPS6059397A true JPS6059397A (en) 1985-04-05

Family

ID=15851456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58167533A Pending JPS6059397A (en) 1983-09-13 1983-09-13 Voice synthesizer

Country Status (1)

Country Link
JP (1) JPS6059397A (en)

Similar Documents

Publication Publication Date Title
US5752223A (en) Code-excited linear predictive coder and decoder with conversion filter for converting stochastic and impulsive excitation signals
KR950035447A (en) Video Signal Processing System Using Speech Analysis Automation and Its Method
JPH0122636B2 (en)
JPS6059397A (en) Voice synthesizer
JPS5975294A (en) Music tone synthesizer
JPH0449956B2 (en)
JPH0449957B2 (en)
JP3829134B2 (en) GENERATION DEVICE, REPRODUCTION DEVICE, GENERATION METHOD, REPRODUCTION METHOD, AND PROGRAM
JPS61189597A (en) Musical sound synthesizer
JP3086458B2 (en) Speech synthesizer
US4944014A (en) Method for synthesizing echo effect from digital speech data
JPH0235320B2 (en)
JPS6295595A (en) Voice response system
JPS59177597A (en) Musical note synthesizer
JP2861005B2 (en) Audio storage and playback device
JPS5945498A (en) Recording/editing type voice synthesizer
JPS61278900A (en) Voice synthesizer
JPS6021098A (en) Synthesization of voice
JPS58107597A (en) Voice synthesizer
JPH0142000B2 (en)
JPS5915299A (en) Voice analyzer
JPS63286900A (en) Recording/editing synthesization system
JPS59162594A (en) Musical tone sythesizer
JPS59133596A (en) Voice synthesizer
JPS62100027A (en) Voice coding system