JP2765192B2 - Electronic musical instrument - Google Patents

Electronic musical instrument

Info

Publication number
JP2765192B2
JP2765192B2 JP2146785A JP14678590A JP2765192B2 JP 2765192 B2 JP2765192 B2 JP 2765192B2 JP 2146785 A JP2146785 A JP 2146785A JP 14678590 A JP14678590 A JP 14678590A JP 2765192 B2 JP2765192 B2 JP 2765192B2
Authority
JP
Japan
Prior art keywords
formant
vowel
formants
sound
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2146785A
Other languages
Japanese (ja)
Other versions
JPH0439696A (en
Inventor
アユミ 深田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2146785A priority Critical patent/JP2765192B2/en
Publication of JPH0439696A publication Critical patent/JPH0439696A/en
Application granted granted Critical
Publication of JP2765192B2 publication Critical patent/JP2765192B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/471General musical sound synthesis principles, i.e. sound category-independent synthesis methods
    • G10H2250/481Formant synthesis, i.e. simulating the human speech production mechanism by exciting formant resonators, e.g. mimicking vocal tract filtering as in LPC synthesis vocoders, wherein musical instruments may be used as excitation signal to the time-varying filter estimated from a singer's speech

Description

【発明の詳細な説明】 「産業上の利用分野」 この発明は、外部からの音のフォルマントを抽出した
後、該抽出したフォルマントを再合成することによって
生成した音を演奏ピッチに応じて発音する電子楽器に関
する。
DETAILED DESCRIPTION OF THE INVENTION [Industrial Application Field] The present invention extracts a formant of a sound from the outside, and then reproduces a sound generated by resynthesizing the extracted formant in accordance with a performance pitch. Electronic musical instruments.

「従来の技術」 従来より、サンプリングした音を発音する電子楽器に
おいては、例えば、音声の母音/a/を発音させるには、
母音/a/のフォルマントを予め記憶しておき、発音の際
に、該記憶されたフォルマントを読出して再合成する。
この時、近い周波数成分を有する第1フォルマントから
高い周波数成分を有する高次のフォルマントまでを予め
記憶しておれば、これらを合成することにより再現性の
よい音声を発音できる。
[Prior art] Conventionally, in an electronic musical instrument that produces a sampled sound, for example, to produce a vowel / a / of a voice,
The formant of the vowel / a / is stored in advance, and at the time of sound generation, the stored formant is read out and re-synthesized.
At this time, if the first formant having a close frequency component to the higher-order formant having a high frequency component are stored in advance, a sound with good reproducibility can be generated by synthesizing these.

また、上述した従来の電子楽器において、母音/a,i,
u,e,o/を全て発音させようとする場合には、それぞれの
母音のフォルマントを、やはり低次から高次のフォルマ
ント周波数まで記憶しておき、発音の際に所定のフォル
マントを読出して、再合成することによって発音してい
た。
In the conventional electronic musical instrument described above, the vowel / a, i,
In the case where all u, e, o / are to be pronounced, the formants of each vowel are also stored from low to high order formant frequencies, and a predetermined formant is read out at the time of pronunciation, It was pronounced by recombining.

「発明が解決しようとする課題」 ところで、上述した従来の電子楽器では、さまざまな
特徴(音色や声色)を有する音(母音や管楽器音)を発
音するような場合には、音色や声色が変わる度に、発音
しようとする全ての音のフォルマント(複数)を記憶し
ておかなければならないため、多くのメモリ容量が必要
となり、楽器の小型化、コストの低減化ができないとい
う問題が生じた。
"Problems to be Solved by the Invention" By the way, in the above-mentioned conventional electronic musical instruments, when a sound (vowel or wind instrument sound) having various characteristics (tones or vocal sounds) is to be pronounced, the timbre or timbre changes. Each time, it is necessary to store the formants (plural) of all the sounds to be produced, so that a large memory capacity is required, and there has been a problem that the size and cost of the musical instrument cannot be reduced.

この発明は、上述した問題に鑑みてなされたもので、
メモリ容量の削減、当該装置の小型化、コストの低減化
ができる電子楽器を提供することを目的としている。
The present invention has been made in view of the above problems,
It is an object of the present invention to provide an electronic musical instrument capable of reducing the memory capacity, the size of the device, and the cost.

「課題を解決するための手段」 上記問題を解決するために、この発明では外部から供
給される音をサンプリングし、雑音を特徴づけるフォル
マントを抽出するフォルマント抽出手段と、 各々音色が異なる所定の複数音のフォルマントがそれ
ぞれ標準値として記憶される標準値記憶手段と、 前記サンプリング音に対応する前記標準フォルマント
と前記サンプリング音の抽出フォルマントとの関係に基
づいて、前記抽出フォルマントを基準とした前記複数音
の各々に対応するフォルマントを推定するフォルマント
推定手段と、 前記推定フォルマントを再合成して楽音信号として出
力するフォルマント合成手段と を具備することを特徴とする。
[Means for Solving the Problems] In order to solve the above-mentioned problems, the present invention provides a formant extracting means for sampling a sound supplied from the outside and extracting a formant characterizing noise, and a plurality of formants each having a different timbre. Standard value storage means in which sound formants are respectively stored as standard values, and the plurality of sounds based on the extracted formants based on a relationship between the standard formants corresponding to the sampled sounds and the extracted formants of the sampled sounds. And formant estimating means for estimating a formant corresponding to each of the following, and formant synthesizing means for resynthesizing the estimated formant and outputting it as a tone signal.

「作用」 フォルマント抽出手段により外部から供給される音を
サンプリングし、かつ該音を特徴づけるフォルマントを
抽出する。この抽出したフォルマントと標準値記憶手段
に記憶された前記標準フォルマントとの関係に基づい
て、フォルマント推定手段により前記抽出フォルマント
を基準とした音色が異なる他の音のフォルマントを推定
する。そして、フォルマント合成手段において、上記フ
ォルマント推定手段により推定されたフォルマントを再
合成して楽音信号として出力する。
[Operation] A sound supplied from the outside is sampled by the formant extracting means, and a formant characterizing the sound is extracted. Based on the relationship between the extracted formant and the standard formant stored in the standard value storage means, formant estimation means estimates formants of other sounds having different timbres based on the extracted formant. Then, the formant synthesizing means re-synthesizes the formant estimated by the formant estimating means and outputs it as a tone signal.

「実施例」 次に図面を参照してこの発明の実施例について説明す
る。
"Example" Next, an example of the present invention will be described with reference to the drawings.

第1図はこの発明の一実施例の構成を示すブロック図
である。なお、この実施例では、複数の声色を有する音
声(特に、母音)を発音する電子楽器について説明す
る。この図において、1はフォルマント抽出部であり、
外部より供給される音声をフーリエ変換して、第1フォ
ルマントF1、第2フォルマントF2、第3フォルマントF3
および第4フォルマントF4を抽出し、このうち第1〜第
3フォルマントを移動量算出部2へ供給する。第4フォ
ルマントは、後述するフォルマント合成部4へそのまま
供給される。これは第4フォルマントが「個人性」を表
す成分である声道、発音の形態差などの影響を受ける高
次の周波数成分を有し、母音の種類によって変動するこ
とが少ないので、最終的なフォルマント合成において他
のフォルマントに付加してやることで個人の特徴ある音
声が再現できる点にある。上記移動量算出部2は、上記
第1〜第3フォルマントの比に基づいて標準パターの移
動量を決定し、該移動量を母音推定部3へ供給する。こ
こで、上記標準パターンおよびその移動量について説明
する。一般に、第1フォルマントを横軸、第2フォルマ
ントを縦軸にして、母音/a,i,u,e,o/のフォルマント成
分を表すと、第2図に示すようになる。各点を結んでで
きる形を標準パターンと呼ぶ。この標準パターンのフォ
ルマント周波数は次のようになる。
FIG. 1 is a block diagram showing the configuration of one embodiment of the present invention. In this embodiment, an electronic musical instrument that produces sounds having a plurality of timbres (particularly, vowels) will be described. In this figure, 1 is a formant extraction unit,
Fourier transforms the voice supplied from the outside and converts the first formant F1, the second formant F2, and the third formant F3
And the fourth formant F4 are extracted, and the first to third formants are supplied to the movement amount calculation unit 2. The fourth formant is directly supplied to a formant synthesizing unit 4 described later. This is because the fourth formant has high-order frequency components that are affected by the vocal tract and pronunciation morphological differences, which are components representing “individuality,” and does not vary much depending on the type of vowel. The point is that by adding it to other formants in formant synthesis, individual characteristic voices can be reproduced. The movement amount calculation unit 2 determines the movement amount of the standard putter based on the ratio of the first to third formants, and supplies the movement amount to the vowel estimation unit 3. Here, the standard pattern and the amount of movement thereof will be described. In general, the formant components of the vowels / a, i, u, e, o / are shown in FIG. 2 with the first formant being on the horizontal axis and the second formant being on the vertical axis. The shape formed by connecting each point is called a standard pattern. The formant frequency of this standard pattern is as follows.

しかし、実際の各フォルマントの周波数は、発話者や
環境の差によって異なるため、必ずしも第2図に示す標
準パターンのところに位置するとは限らない。しかし、
異なる条件における音声のフォルマントによるパターン
でも、5母音(/a,i,u,e,o/)の相対的な位置関係が保
持されたまま平行移動するのが通例である(第2図の破
線によるパターンを参照)。したがって、外部から供給
されたいずれか1つの母音のフォルマントが分かれば、
該母音のフォルマントと標準パターンの該当する母音の
フォルマントとの比からその移動量(ズレ)を決定でき
る。すなわち、上述した移動量算出部2は、上記標準パ
ラメータをどの程度移動させれば、該標準パターンの該
当する母音が外部から供給された母音のフォルマントに
一致するか示す上記移動量を算出する。
However, since the actual frequency of each formant varies depending on the speaker and the environment, it is not always located at the standard pattern shown in FIG. But,
In general, even a pattern based on a formant of a voice under different conditions moves in parallel while maintaining the relative positional relationship of the five vowels (/ a, i, u, e, o /) (broken line in FIG. 2). See pattern by.) Therefore, if the formant of any one vowel supplied from outside is known,
The amount of movement (deviation) can be determined from the ratio between the formant of the vowel and the formant of the corresponding vowel in the standard pattern. That is, the above-described movement amount calculation unit 2 calculates the movement amount indicating how much the standard parameter should be moved so that the vowel corresponding to the standard pattern matches the vowel formant supplied from the outside.

母音推定部3は、上述した移動量から他の母音の第1
〜第3フォルマントを推定し、フォルマント合成部4へ
供給する。フォルマント周波数の推定は、上述した移動
量に標準パターンのフォルマント周波数を乗算すること
により求められる。
The vowel estimation unit 3 calculates the first vowel based on the amount of movement described above.
To the third formant and supply it to the formant synthesis unit 4. The estimation of the formant frequency is obtained by multiplying the above-described movement amount by the formant frequency of the standard pattern.

フォルマント合成部4は、周知のものであり、例え
ば、所定のピッチ周期毎に発生する窓関数波形を、その
ピッチ周期毎に位相を初期化しながらフォルマント中心
周波数をピッチとする周波数形を乗算して他の母音の楽
音信号を求める。
The formant synthesizing unit 4 is a well-known one. For example, the formant synthesizing unit 4 multiplies a window function waveform generated at each predetermined pitch cycle by a frequency form having a formant center frequency as a pitch while initializing a phase at each pitch cycle. Find a tone signal of another vowel.

上述した構成によれば、例えば、入力母音として母音
/a/をフォルマント抽出部1に入力すると、フォルマン
ト抽出部1は、入力母音/a/の第1〜第4フォルマント
を抽出する。第1,第2および第3フォルマントは移動量
算出部2へ供給され、第4フォルマントはフォルマント
合成部4へ供給される。
According to the configuration described above, for example, a vowel as an input vowel
When / a / is input to the formant extraction unit 1, the formant extraction unit 1 extracts the first to fourth formants of the input vowel / a /. The first, second, and third formants are supplied to the movement amount calculation unit 2, and the fourth formant is supplied to the formant synthesis unit 4.

次に、移動量算出部2では、入力された母音のフォル
マントに基づいて移動量を算出する。ここで、簡単な例
をあげて説明する。まず、入力母音を/a/とし、この入
力母音/a/の第1および第2フォルマントが各々900Hzと
1500Hzであったとする(第2図の入力母音を参照)。次
に、これらの値から、入力母音/i/の第1および第2フ
ォルマントの移動量を算出する。第1フォルマントの移
動量は、入力母音/a/の第1フォルマント周波数(=90
0)を標準パターンの母音/a/の第1フォルマント周波数
(=700)で割ることにより求められる(移動量;900/70
0)。同様にして、第2フォルマントの移動量は、入力
母音/a/の第2フォルマント周波数(=1500)を標準パ
ターンの母音/a/の第2フォルマント周波数(=1400)
で割ることにより求められる(移動量;1500/1400)。以
下、母音/a/の第3フォルマントについても同様に移動
量を算出する。
Next, the movement amount calculator 2 calculates the movement amount based on the input vowel formants. Here, a simple example will be described. First, the input vowel is set to / a /, and the first and second formants of the input vowel / a / are each 900 Hz.
Let it be 1500 Hz (see input vowel in FIG. 2). Next, the movement amounts of the first and second formants of the input vowel / i / are calculated from these values. The amount of movement of the first formant is the first formant frequency of the input vowel / a / (= 90
0) divided by the first formant frequency (= 700) of the vowel / a / of the standard pattern (moving amount; 900/70
0). Similarly, the movement amount of the second formant is obtained by changing the second formant frequency (= 1500) of the input vowel / a / to the second formant frequency (= 1400) of the vowel / a / of the standard pattern.
It is obtained by dividing by (moving amount; 1500/1400). Hereinafter, the movement amount is similarly calculated for the third formant of the vowel / a /.

これらの移動量は母音推定部3へ供給される。母音推
定部3では、他の母音/i,u,e,o/の第1〜第3フォルマ
ントを推定する。上述した例に従うと、母音/i/の第1
フォルマント周波数の推定は、上記移動量(=900/70
0)に標準パターンの母音/i/における第1フォルマント
周波数(=200)を乗算することによって行われ、推定
フォルマント周波数として約257(Hz)という値を得
る。また、第2フォルマント周波数の推定は、移動量
(=1500/1400)に標準パターンにおける第2フォルマ
ント周波数(=2100)を乗算することによって行われ、
推定フォルマント周波数として約2250(Hz)という値を
得る。同様に第3フォルマント周波数についても求め
る。
These movement amounts are supplied to the vowel estimation unit 3. The vowel estimation unit 3 estimates the first to third formants of other vowels / i, u, e, o /. According to the above example, the first vowel / i /
Estimation of the formant frequency is based on the above movement amount (= 900/70
0) is multiplied by the first formant frequency (= 200) in the vowel / i / of the standard pattern to obtain a value of about 257 (Hz) as the estimated formant frequency. The estimation of the second formant frequency is performed by multiplying the movement amount (= 1500/1400) by the second formant frequency (= 2100) in the standard pattern.
A value of about 2250 (Hz) is obtained as the estimated formant frequency. Similarly, the third formant frequency is obtained.

さらに、母音/u/も同様に、上記移動量(=900/700)
に標準パターンの第1フォルマント周波数(=300)を
乗算し、推定フォルマント周波数として約385(Hz)と
いう値を得る。また、移動量(=1500/1400)に標準パ
ターンの第2フォルマント周波数(=1300)を乗算し、
推定フォルマント周波数として約1392(Hz)という値を
得る。
In addition, the vowel / u / is similarly moved (= 900/700)
Is multiplied by the first formant frequency of the standard pattern (= 300) to obtain a value of about 385 (Hz) as the estimated formant frequency. Also, the moving amount (= 1500/1400) is multiplied by the second formant frequency (= 1300) of the standard pattern,
A value of about 1392 (Hz) is obtained as the estimated formant frequency.

以下、上述した演算と同様の方法によって、母音/e,o
/の第1、第2および第3フォルマントも推定する(第
2図の破線パターンを参照)。
Hereinafter, the vowel / e, o
The first, second and third formants of / are also estimated (see dashed pattern in FIG. 2).

このようにして求められた各母音/i,u,e,o/の第1〜
第3フォルマントは次の表2のようになる。
The first to first of each vowel / i, u, e, o / obtained in this way
The third formant is as shown in Table 2 below.

このようにして求められたフォルマント周波数は、フ
ォルマント合成部4に供給できる。フォルマント合成部
4では、所定のピッチ周期毎に発生する窓関数波形を、
フォルマント中心周波数をピッチとする周期波形を。乗
算してそれぞれの母音の楽音信号を求めて出力する。
The formant frequency thus obtained can be supplied to the formant synthesizing unit 4. The formant synthesizing unit 4 converts a window function waveform generated every predetermined pitch cycle into
A periodic waveform whose pitch is the formant center frequency. Multiplication is performed to obtain and output a musical tone signal of each vowel.

次に、上述した実施例の具体的な応用例について説明
する。第3図はこの実施例の構成を示すブロック図であ
る。この図において、10は鍵情報発生部であり、鍵盤に
よって構成されている。この鍵情報発生部10は、演奏者
により操作され、該操作に応じたキーコードKCおよびキ
ーオンKONをフォルマント合成部の各合成ユニット15a,1
5b,15c,15dへ出力する。11はフォルマント制御部であ
り、フォルマント解析部11a、フォルマントパラメータ
メモリ11bおよび標準フォルマントパラメータメモリ11c
から構成されている。フォリマント解析部11aは、第1
図のフォルマント抽出部に相当し、入力される音声をフ
ーリエ変換して各フォルマントを取り出す。フォルマン
トパラメータメモリ11bには、各母音の第1フォルマン
ト〜第4フォルマントが記憶される。ここで、第4図に
記憶されているフォルマントのフォーマットの概念を示
す。この図において、母音は/a,i,u,e,o/の5つであ
り、これら母音に対するフォルマントは、アルファベッ
トの大文字Fに付ける添字で区別され、母音種別mの第
nフォルマントはFmnで表される。また、このフォルマ
ントパラメータのテーブルは1つだけでもよいが、複数
個用意してさまざまの声音に対応させるようにしてもよ
い。この場合、各フォルマントパラメータのテーブルは
テーブル指定番号Kにより区別される。
Next, a specific application example of the above-described embodiment will be described. FIG. 3 is a block diagram showing the configuration of this embodiment. In this figure, reference numeral 10 denotes a key information generation unit, which is constituted by a keyboard. The key information generating unit 10 is operated by a player, and generates a key code KC and a key-on KON corresponding to the operation by each of the synthesizing units 15a, 1 of the formant synthesizing unit.
Output to 5b, 15c, 15d. Reference numeral 11 denotes a formant control unit, which includes a formant analysis unit 11a, a formant parameter memory 11b, and a standard formant parameter memory 11c.
It is composed of The formant analysis unit 11a
It corresponds to the formant extraction unit in the figure, and takes out each formant by Fourier-transforming the input voice. The first to fourth formants of each vowel are stored in the formant parameter memory 11b. Here, the concept of the format of the formant stored in FIG. 4 is shown. In this figure, there are five vowels of / a, i, u, e, o /, and the formants for these vowels are distinguished by subscripts added to the capital letter F of the alphabet, and the n-th formant of the vowel type m is F mn It is represented by Although only one formant parameter table may be used, a plurality of formant parameter tables may be prepared to correspond to various voice sounds. In this case, the table of each formant parameter is distinguished by the table designation number K.

次に、標準フォルマントパラメータメモリ11cは、上
述したフォルマントパラメータメモリ11bと同様のテー
ブルで、前述した標準パターンに対する各母音のフォル
マントが記憶されている。各フォルマントはアルファベ
ットFsに付ける添字で区別される。この標準フォルマン
トパラメータのテーブルも上述したフォルマントパラメ
ータのテーブルと同様に複数個用意して、テーブル出力
番号Kにより区別するようにしてもよい。
Next, the standard formant parameter memory 11c is a table similar to the above-described formant parameter memory 11b, and stores the formants of each vowel for the above-described standard pattern. Each formant is distinguished by a subscript attached to the alphabet Fs. A plurality of standard formant parameter tables may be prepared similarly to the above-described formant parameter table, and may be distinguished by the table output number K.

12は楽音設定部であり、音声合成システム全体を制御
するために、各種変数を各部に供給する。楽音設定部12
は、上記フォルマント制御部11へ入力母音の種別指定変
数Mおよびフォルマントパラメータのテーブル指定番号
Kを出力する。また、後述するフォルマント発音制御部
13へ上記テーブル指定番号K、発音母音指定変数M′お
よびモードMODEを出力する。発音母音指定変数M′は発
音すべき母音を指定する変数である。また、モードMODE
は発音に際してフォルマントパラメータメモリ11bまた
は標準パラメータメモリ11cのどちらのフォルマントデ
ータを使用するかを指定する変数であり、「0」または
「1」の状態をとる。
Reference numeral 12 denotes a musical tone setting unit which supplies various variables to each unit in order to control the entire speech synthesis system. Music setting section 12
Outputs the input vowel type designation variable M and the formant parameter table designation number K to the formant control unit 11. Also, a formant sound control unit described later
The table designation number K, the pronunciation vowel designation variable M ', and the mode MODE are output to 13. The pronunciation vowel designation variable M 'is a variable for designating a vowel to be pronounced. Mode MODE
Is a variable for designating which formant data of the formant parameter memory 11b or the standard parameter memory 11c to use at the time of sound generation, and takes a state of "0" or "1".

前述したフォルマント発音制御部13は、上記モードMO
DEが「1」の場合には、フォルマントパラメータメモリ
11bのK番目のフォルマントテーブルの発音母音指定変
数M′(M′=1,2,3,4,5のいずれか)で指定される母
音のフォルマントを読出し、第1フォルマントを合成ユ
ニット15aへ、第2フォルマントを合成ユニット15bへ、
第3フォルマントを合成ユニット15cへ、第4フォルマ
ントを合成ユニット15dへそれぞれ出力する。また、上
記モードMODEが「0」の場合には、標準パラメータメモ
リ11cのK番目のフォルマントテーブルの発音母音指定
変数M′で指定される母音のフォルマントを読出し、上
述した場合と同様に、各フォルマントをそれぞれの合成
ユニット15a〜15dへ出力する。
The formant sound control unit 13 described above is provided with the mode MO
If DE is "1", formant parameter memory
The formant of the vowel designated by the pronunciation vowel design variable M '(M' = 1, 2, 3, 4, or 5) in the K-th formant table of 11b is read, and the first formant is sent to the synthesis unit 15a. The second formant is sent to the synthesis unit 15b,
The third formant is output to the synthesizing unit 15c, and the fourth formant is output to the synthesizing unit 15d. When the mode MODE is "0", the vowel formant designated by the vowel designation variable M 'of the K-th formant table in the standard parameter memory 11c is read out, and each formant is read out in the same manner as described above. Is output to each of the combining units 15a to 15d.

合成ユニット15a〜15dは、第1図のフォルマント合成
部に相当し、各々のユニットにおいて、キーコードKCで
指定されたピッチ周期毎に発生する窓関数波形を、その
ピッチ周期毎に位相を初期化しながら、各フォルマント
に基づいて、フォルマント中心周波数をピッチとする周
期波形を乗算してそれぞれの母音の楽音信号を求めて、
乗算器16a,16b,16cおよび16dへ出力する。乗算器16a〜1
6dは、MIX信号に応じて、上記楽音信号のレベルを調整
した後、ミキシング部17へ出力する。ミキシング部17
は、上記レベル調整された第1フォルマント〜第4フォ
ルマントを混合することによって、楽音信号を形成して
次段の回路(サウンドシステムなど;図示略)へ出力す
る。
The synthesizing units 15a to 15d correspond to the formant synthesizing units in FIG. 1. In each unit, a phase of a window function waveform generated at each pitch cycle specified by the key code KC is initialized at each pitch cycle. While, based on each formant, multiply the periodic waveform with the pitch of the formant center frequency to obtain the tone signal of each vowel,
Output to multipliers 16a, 16b, 16c and 16d. Multipliers 16a-1
6d adjusts the level of the tone signal according to the MIX signal, and then outputs it to the mixing unit 17. Mixing part 17
Mixes the level-adjusted first to fourth formants to form a tone signal and outputs it to the next-stage circuit (such as a sound system; not shown).

次に、上述した構成による電子楽器の動作につて、第
6図および第7図に示すフローチャートを参照して説明
する。
Next, the operation of the electronic musical instrument having the above-described configuration will be described with reference to the flowcharts shown in FIGS.

まず、フォルマント制御部11の動作について説明す
る。所定のスイッチ操作が行われて、演奏者により音声
の入力が指示されると、第6図に示すフローチャートが
実行される。まず、ステップSA1において、入力された
音声がサンプリングされる。この場合、入力母音は、演
奏者により予め設定されており、楽音設定部12から入力
母音指定変数M(M=1,2,3,4,5のいずれか)として出
力される。次に、ステップSA2において、フォルマント
解析部11aにより入力音声から第1フォルマントFM1,第
2フォルマントFM2,第3フォルマントFM3および第4フ
ォルマントFM4が抽出される。ここで、例えば、入力母
音指定変数Mが「1」に指定されているとすると、母音
/a/の第1フォルマントF11,第2フォルマントF12,第3
フォルマントF13および第4フォルマントF14が抽出され
る。そして、ステップSA3に進み、初期設定として、変
数m=1、n=1が設定される。
First, the operation of the formant control unit 11 will be described. When a predetermined switch operation is performed and a voice input is instructed by the performer, a flowchart shown in FIG. 6 is executed. First, in step SA1, the input voice is sampled. In this case, the input vowel is set in advance by the player, and is output from the tone setting unit 12 as an input vowel designation variable M (M = 1, 2, 3, 4, or 5). Next, in step SA2, the first formant FM1 , the second formant FM2 , the third formant FM3, and the fourth formant FM4 are extracted from the input voice by the formant analyzing section 11a. Here, for example, assuming that the input vowel designation variable M is designated as “1”,
/ a / first formant F 11 , second formant F 12 , third
Formant F 13 and fourth formant F 14 is extracted. Then, the process proceeds to Step SA3, where variables m = 1 and n = 1 are set as initial settings.

次に、ステップSA4において、母音/a/の第1フォルマ
ントF11を式F11/Fs11×Fs11から求め、K番目のフォル
マントテーブルの対応した箇所にストアする。次にステ
ップSA5に進み、変数mが「5」になったか否かを判断
する。この場合、変数mはまだ「1」なので、ステップ
SA5における判断結果は「NO」となり、ステップSA6へ進
む。ステップSA6では、変数mをインクリメントした
後、ステップSA4に戻る。ステップSA4では、母音/i/の
第1フォルマントF21を式F11/Fs11×Fs21から求め、や
はりK番目のフォルマントテーブルの所定の箇所へスト
アする。以下、同様に、ステップSA5における判断結果
が「YES」になるまでステップSA4,SA5およびSA6を繰り
返し、母音/u,e,o/の第1フォルマントF31,F41およびF
51を求めて、K番目のフォルマントテーブルの所定の箇
所へストアする。そして、変数mが「5」になると、ス
テップSA5における判断結果が「YES」になり、ステップ
SA7へ進む。ステップSA7では、変数nが「3」になった
か否かが判断される。この場合、変数nはステップSA3
における初期設定のまま「1」である。したがって、ス
テップSA7における判断結果は「NO」となり、ステップS
A8へ進む。ステップSA8では、変数nをインクリメント
するとともに、変数mを「1」にした後、ステップSA4
に戻る。そして、再び、ステップSA4,SA5,SA6を繰り返
し、各母音の第2フォルマントF12,F22,F32,F42,F52
求めて、K番目のフォルマントテーブルの所定の箇所へ
ストアする。そして、変数mが「5」になり、ステップ
SA5における判断結果が再び「YES」になると、ステップ
SA7に進む。変数nは「2」であるので、ステップSA7に
おける判断結果は「NO」となり、ステップSA8に進む。
このステップSA8では、変数nをインクリメントして
「3」にするとともに、変数mを「1」にした後、ステ
ップSA4に戻る。そして、再び、ステップSA4,SA5,SA6を
繰り返し、各母音の第3フォルマントF13,F23,F33,F43,
F53を求めて、フォルマントテーブルの所定の箇所へス
トアする。そして、変数mが「5」になり、ステップSA
5における判断結果が再び「YES」になると、ステップSA
7に進む。変数nは「3」であるので、ステップSA7にお
ける判断結果は「YES」となり、ステップSA9に進む。ス
テップSA9では、ステップSA2において抽出した第4フォ
ルマントF14を各母音/i,u,e,o/の第4フォルマントとし
てそのままストアして、このルーチンを終了する。
Next, at step SA4, the first formant F 11 a vowel / a / calculated from the equation F 11 / Fs 11 × Fs 11 , is stored in the corresponding portion of the K-th formant table. Next, the process proceeds to Step SA5, where it is determined whether or not the variable m has become “5”. In this case, since the variable m is still “1”, the step
The determination result at SA5 is “NO”, and the process proceeds to Step SA6. In step SA6, after the variable m is incremented, the process returns to step SA4. At step SA4, the vowel / i / the first formant F 21 determined from equation F 11 / Fs 11 × Fs 21 , also stores the predetermined point K-th formant table. Hereinafter, similarly, the determination in step SA5 is repeated step SA4, SA5 and SA6 until "YES", vowel / u, e, o / the first formant F 31, F 41 and F
51 is obtained and stored in a predetermined location of the K-th formant table. Then, when the variable m becomes “5”, the judgment result in step SA5 becomes “YES”, and
Proceed to SA7. In step SA7, it is determined whether or not the variable n has become "3". In this case, the variable n is set in step SA3
Is "1" as it is in the initial setting. Therefore, the determination result in step SA7 is “NO”, and the
Proceed to A8. In step SA8, the variable n is incremented and the variable m is set to "1".
Return to Then, again, step SA4, SA5, SA6 repeated, the second formant F 12, F 22, F 32 , F 42, F 52 of each vowel seeking to store the predetermined portion of the K-th formant table. Then, the variable m becomes “5” and the step
When the determination result at SA5 becomes “YES” again, the step
Proceed to SA7. Since the variable n is “2”, the result of the determination in step SA7 is “NO”, and the flow proceeds to step SA8.
In this step SA8, the variable n is incremented to “3” and the variable m is set to “1”, and then the process returns to step SA4. Then, again, step SA4, SA5, SA6 repeated, third formant F 13 of each vowel, F 23, F 33, F 43,
Seeking F 53, and stores the predetermined point formant table. Then, the variable m becomes “5” and the step SA
When the determination result at step 5 becomes “YES” again, step SA
Go to 7. Since the variable n is “3”, the result of the determination in step SA7 is “YES”, and the flow proceeds to step SA9. In step SA9, as it is stores the fourth formant F 14 extracted in the step SA2 each vowel / i, u, e, as o / the fourth formant, the routine ends.

このようにフォルマント制御部11の処理により入力母
音に基づいて他の母音のフォルマントが全て求められ、
フォルマントパラメータメモリ11bにストアされる。し
たがって、予め記憶しておくデータとしては、標準パタ
ーンだけでよいため、メモリ容量を削減することができ
る。なお、実施例において、入力母音指定変数Mは、1
〜5のいずれかの値に設定されてもよく、例えば「2」
とすれば、母音/i/に基づいて他の母音のフォルマント
が求められる。
In this way, the formants of the other vowels are all obtained based on the input vowel by the processing of the formant control unit 11,
Stored in the formant parameter memory 11b. Therefore, since only the standard pattern needs to be stored in advance, the memory capacity can be reduced. In the embodiment, the input vowel designation variable M is 1
May be set to any one of values from 5 to 5, for example, “2”.
Then, formants of other vowels are obtained based on the vowel / i /.

音声入力が終了すると、次に発音が行われる。すなわ
ち、演奏者が鍵盤を用いて演奏すると、鍵情報発生部10
が演奏に応じたキーコードKCおよびキーオンKONを各合
成ユニット15a,15b,15cおよび15dへ供給する。また、楽
音設定部12は、使用するテーブル指定番号K、発音母音
指定変数M′およびモードMODE(0または1)をフォル
マント発音制御部13へ供給する。そして、第7図に示す
フローチャートが実行される。まず、ステップSB1にお
いて、変数K、M′およびモードMODEが設定されたか否
かが判断される。これらの変数が設定されていない場合
には、ステップSB1における判断結果が「NO」となり、
上記変数が設定されるまで同ステップSB1が繰り返し実
行される。この場合、既に上記変数は、楽音設定部12か
ら供給されているため、ステップSB1における判断結果
は「YES」となり、ステップSB2へ進む。ステップSB2で
は、モードMODEが「0」か否かが判断される。この場
合、モードMODEが「0」に設定されていたとすると、こ
のステップSB2における判断結果は「YES」となり、ステ
ップSB3へ進む。ステップSB3では、標準フォルマントパ
ラメータメモリ11cのK番目のテーブルの発音母音指定
変数M′で指定された母音(この例の場合、例えば、
M′=4;/e/とすると)の第1フォルマントFs41,第2フ
ォルマントFs42,第3フォルマントFs43および第4フォ
ルマントFs44を各々の合成ユニット15a,15b,15c,15dへ
供給した後、ステップSB1へ戻り、次の変数の設定操作
を待機する。
When the voice input is completed, the pronunciation is performed next. That is, when the player performs using the keyboard, the key information generator 10
Supplies a key code KC and a key-on KON corresponding to the performance to each of the synthesizing units 15a, 15b, 15c and 15d. Further, the musical tone setting unit 12 supplies the table designation number K, the pronunciation vowel designation variable M ′ and the mode MODE (0 or 1) to be used to the formant emission control unit 13. Then, the flowchart shown in FIG. 7 is executed. First, in step SB1, it is determined whether or not the variables K and M 'and the mode MODE have been set. If these variables are not set, the result of the determination in step SB1 is "NO",
Step SB1 is repeatedly executed until the above variables are set. In this case, since the variables have already been supplied from the tone setting unit 12, the result of the determination in step SB1 is "YES", and the routine proceeds to step SB2. In step SB2, it is determined whether or not the mode MODE is "0". In this case, assuming that the mode MODE has been set to "0", the result of the determination at step SB2 is "YES", and the routine proceeds to step SB3. In step SB3, the vowel designated by the pronunciation vowel designation variable M 'in the K-th table of the standard formant parameter memory 11c (in this example, for example,
M ′ = 4; / e /), the first formant Fs 41 , the second formant Fs 42 , the third formant Fs 43 and the fourth formant Fs 44 were supplied to the respective synthesis units 15a, 15b, 15c, 15d. Thereafter, the process returns to step SB1, and waits for the next variable setting operation.

また、各合成ユニット15a,15b,15cおよび15dでは、上
記第1フォルマントFs41,第2フォルマントFs42,第3フ
ォルマントFs43,第4フォルマントFs44および楽音設定
部12から供給されたパラメータに従って音声信号が合成
され、各音声信号は各々乗算器16a,16b,16cおよび16dへ
供給される。上記音声信号は、各乗算器においてレベル
が調整された後、ミキシング部17によりミキシングされ
た後、後段の回路によってキーコードKCに応じた音高の
母音/e/として発音される。
Further, in the combining unit 15a, 15b, 15c and 15d, the sound in accordance with the first formant Fs 41, second formant Fs 42, third formant Fs 43, parameters supplied from the fourth formant Fs 44 and tone setting unit 12 The signals are synthesized, and each audio signal is supplied to multipliers 16a, 16b, 16c and 16d, respectively. After the level of the audio signal is adjusted in each multiplier, the audio signal is mixed by the mixing unit 17, and is then emitted by a subsequent circuit as a vowel / e / having a pitch corresponding to the key code KC.

一方、モードMODEが「1」に設定されていたとする
と、ステップSB2における判断結果は「NO」となり、ス
テップSB4へ進む。ステップSB4では、フォルマントパラ
メータメモリ11bのK番目のテーブルの発音母音指定変
数M′で指定された母音(この例の場合、上述同様に例
えば、M′=4;/e/とすると)の第1フォルマントF41,
第2フォルマントF42,第3フォルマントF43および第4
フォルマントF44を各々の合成ユニット15a,15b,15c,15d
へ供給した後、ステップSB1へ戻り、次の変数の設定操
作を待機する。
On the other hand, if the mode MODE is set to “1”, the result of the determination in step SB2 is “NO”, and the flow proceeds to step SB4. At step SB4, the first vowel designated by the pronunciation vowel designation variable M 'of the K-th table of the formant parameter memory 11b (in this case, for example, M' = 4; / e / as described above). Formant F 41 ,
Second formant F 42, third formant F 43 and the fourth
Formant F 44 each synthesis units 15a, 15b, 15c, 15d
After returning to step SB1, the process returns to step SB1 to wait for the next variable setting operation.

また、各合成ユニット15a,15b,15cおよび15dでは、上
記第1フォルマントF41,第2フォルマントF42,第3フォ
ルマントF43,第4フォルマントF44および楽音設定部12
から供給されたパラメータに従って音声信号が合成さ
れ、各音声信号は各々乗算器16a,16b,16cおよび16dへ供
給される。上記音声信号は、各乗算器においてレベルが
調整された後、ミキシング部17によりミキシングされ、
後段の回路によってキーコードKCに応じた音高の母音/e
/として発音される。
Further, in the combining unit 15a, 15b, 15c and 15d, the first formant F 41, second formant F 42, third formant F 43, the fourth formant F 44 and the tone setting section 12
The audio signals are synthesized according to the parameters supplied from, and the respective audio signals are supplied to multipliers 16a, 16b, 16c and 16d, respectively. After the level of the audio signal is adjusted in each multiplier, the audio signal is mixed by the mixing unit 17,
Vowel at pitch corresponding to key code KC / e
Pronounced as /.

また、楽音設定部12において、発音母音指定変数M′
を変更すると、次に鍵盤を操作したときには変更した母
音が発音される。このように、この実施例では、第4フ
ォルマントをそのまま付加してやるため、極めて個人の
特徴を有した母音が発音できるという利点が得られる。
In the tone setting section 12, the pronunciation vowel designation variable M '
Is changed, the next time the keyboard is operated, the changed vowel is pronounced. Thus, in this embodiment, since the fourth formant is added as it is, there is an advantage that a vowel having extremely individual characteristics can be pronounced.

なお、上述した実施例におけるフォルマント抽出法
は、高速フーリエ変換、複合正弦波法や線形予測法(例
えばLSP法)などでもよい。
Note that the formant extraction method in the above-described embodiment may be a fast Fourier transform, a composite sine wave method, a linear prediction method (for example, the LSP method), or the like.

また、同実施例では、母音は5種類、フォルマントは
第1〜第4フォルマントまでとしたが、この数に限定さ
れることはない。
In the embodiment, the vowels are five types and the formants are the first to fourth formants. However, the number is not limited to this.

また、標準パターンおよび入力音声として日本語の母
音としたが、これに限定されることなく、他言語や楽器
音などでもよい。
In addition, although the standard pattern and the input voice are Japanese vowels, the present invention is not limited to this, and other languages or instrument sounds may be used.

また、実施例では第4フォルマントは、入力音声のも
のをそのまま使用する構成としたが、低次のフォルマン
トと同様に演算によって求めたものを使用するようにし
てもよい。
Further, in the embodiment, the fourth formant is configured to use the input form as it is, but may use the formant obtained by calculation in the same manner as the low-order formant.

また、実施例では、フォルマント合成の際に、低次の
フォルマントに付加する高次フォルマントとして第4フ
ォルマントを用いたが、これ以上の高次フォルマントを
付加してもよい。
In the embodiment, the fourth formant is used as a higher-order formant to be added to a lower-order formant in formant synthesis, but a higher-order formant may be added.

また、実施例では、音声を入力した後、メモリ上にパ
ラメータテーブルを作成して、それを用いるような構成
としたが、リアルタイム的に入力音を解析、演算してフ
ォルマントを求めて、該フォルマントを合成部に供給す
るような構成としてもよい。したがって、この場合に
は、メモリに上記推定されたフォルマントを記憶してお
く必要はなく、単に標準パターンのみを記憶しておけば
よいため、さらにメモリ容量を削減できる。
Further, in the embodiment, after inputting a voice, a parameter table is created in the memory and used. However, the input sound is analyzed and calculated in real time to obtain a formant, and the formant is obtained. May be supplied to the synthesizing unit. Therefore, in this case, it is not necessary to store the estimated formants in the memory, and only the standard pattern need be stored, so that the memory capacity can be further reduced.

また、実施例では、入力母音の種別を変数Mにより設
定したが、入力母音と標準パターンとを比較(音声認
識)して、どの母音が入力されたかを認識させるように
してもよい。このようにすれば、入力する母音の設定を
省略できるという利点が得られる。
Further, in the embodiment, the type of the input vowel is set by the variable M, but the input vowel and the standard pattern may be compared (voice recognition) to recognize which vowel is input. This has the advantage that the setting of the input vowel can be omitted.

「発明の効果」 以上、説明したように、この発明によれば、標準フォ
ルマントのみを記憶し、サンプリングされた音の特徴を
有し、かつ音色が異なる他の音のフォルマントを、上記
標準フォルマントと外部から供給される音の推定フォル
マントとの比に基づいて推定し、該推定したフォルマン
トを再合成されることにより音を発音するようにしたた
め、メモリ容量の削減、当該装置の小型化、コストの低
減化が図れるという利点が得られる。
[Effects of the Invention] As described above, according to the present invention, only the standard formants are stored, and the formants of other sounds having characteristics of the sampled sound and having different timbres are referred to as the standard formants. Estimation is performed based on the ratio of an externally supplied sound to the estimated formant, and the estimated formant is re-synthesized to generate a sound, thereby reducing memory capacity, miniaturizing the device, and reducing cost. The advantage of reduction can be obtained.

【図面の簡単な説明】[Brief description of the drawings]

第1図はこの発明の一実施例の構成を示すブロック図、
第2図は同実施例において用いる標準パターンと母音推
定方法を説明するための母音とフォルマントとの関係
図、第3図は本発明の応用例の構成を示すブロック図、
第4図は同応用例において用いたフォルマントパラメー
タメモリに記憶されるフォルマント周波数のフォーマッ
トの概念図、第5図は同応用例において用いた標準フォ
ルマントパラメータメモリに記憶される標準パターンの
フォーマットの概念図、第6図および第7図は同応用例
の動作を説明するためのフローチャートである。 1……フォルマント抽出部(フォルマント抽出手段)、
2……移動量算出部、3……母音推定部(母音推定手
段)、4……フォルマント合成部(フォルマント合成手
段)、12c……標準フォルマントパラメータメモリ(標
準値記憶手段)。
FIG. 1 is a block diagram showing the configuration of one embodiment of the present invention,
FIG. 2 is a diagram showing a relationship between vowels and formants for explaining a standard pattern and a vowel estimation method used in the embodiment, FIG. 3 is a block diagram showing a configuration of an application example of the present invention,
FIG. 4 is a conceptual diagram of a format of a formant frequency stored in a formant parameter memory used in the application example, and FIG. 5 is a conceptual diagram of a format of a standard pattern stored in a standard formant parameter memory used in the application example. 6 and 7 are flowcharts for explaining the operation of the application example. 1. Formant extraction unit (formant extraction means)
2... A moving amount calculating section, 3... A vowel estimating section (vowel estimating means), 4... A formant synthesizing section (formant synthesizing means), 12 c... A standard formant parameter memory (standard value storing means).

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】外部から供給される音をサンプリングし、
該音を特徴づけるフォルマントを抽出するフォルマント
抽出手段と、 各々音色が異なる所定の複数音のフォルマントがそれぞ
れ標準値として記憶される標準値記憶手段と、 前記サンプリング音に対応する前記標準フォルマントと
前記サンプリング音の抽出フォルマントとの関係に基づ
いて、前記抽出フォルマントを基準とした前記複数音の
各々に対応するフォルマントを推定するフォルマント推
定手段と、 前記推定フォルマントを再合成して楽音信号として出力
するフォルマント合成手段と を具備することを特徴とする電子楽器。
(1) sampling an externally supplied sound,
Formant extraction means for extracting a formant characterizing the sound; standard value storage means for storing formants of a plurality of predetermined tones each having a different timbre as a standard value; the standard formant corresponding to the sampling sound and the sampling A formant estimating means for estimating a formant corresponding to each of the plurality of sounds based on the extracted formant based on a relationship with a sound extraction formant; and a formant synthesis for resynthesizing the estimated formant and outputting it as a tone signal. An electronic musical instrument comprising:
JP2146785A 1990-06-05 1990-06-05 Electronic musical instrument Expired - Fee Related JP2765192B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2146785A JP2765192B2 (en) 1990-06-05 1990-06-05 Electronic musical instrument

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2146785A JP2765192B2 (en) 1990-06-05 1990-06-05 Electronic musical instrument

Publications (2)

Publication Number Publication Date
JPH0439696A JPH0439696A (en) 1992-02-10
JP2765192B2 true JP2765192B2 (en) 1998-06-11

Family

ID=15415486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2146785A Expired - Fee Related JP2765192B2 (en) 1990-06-05 1990-06-05 Electronic musical instrument

Country Status (1)

Country Link
JP (1) JP2765192B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4830350B2 (en) * 2005-05-26 2011-12-07 カシオ計算機株式会社 Voice quality conversion device and program

Also Published As

Publication number Publication date
JPH0439696A (en) 1992-02-10

Similar Documents

Publication Publication Date Title
Bonada et al. Synthesis of the singing voice by performance sampling and spectral models
JP3502247B2 (en) Voice converter
EP1701336B1 (en) Sound processing apparatus and method, and program therefor
WO2019138871A1 (en) Speech synthesis method, speech synthesis device, and program
JP2006215204A (en) Voice synthesizer and program
EP3719795B1 (en) Voice synthesizing method, voice synthesizing apparatus, and computer program
JP2006030575A (en) Speech synthesizing device and program
EP3879524A1 (en) Information processing method and information processing system
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
US7251601B2 (en) Speech synthesis method and speech synthesizer
EP1246163B1 (en) Speech synthesis method and speech synthesizer
Bonada et al. Singing voice synthesis combining excitation plus resonance and sinusoidal plus residual models
EP3879521A1 (en) Acoustic processing method and acoustic processing system
JP2003345400A (en) Method, device, and program for pitch conversion
JP2765192B2 (en) Electronic musical instrument
JP4757971B2 (en) Harmony sound adding device
JPH11259066A (en) Musical acoustic signal separation method, device therefor and program recording medium therefor
Rodet et al. Spectral envelopes and additive+ residual analysis/synthesis
JP3540159B2 (en) Voice conversion device and voice conversion method
Bonada et al. Sample-based singing voice synthesizer using spectral models and source-filter decomposition
JPH1031496A (en) Musical sound generating device
WO2020171036A1 (en) Sound signal synthesis method, generative model training method, sound signal synthesis system, and program
JP3776782B2 (en) Method for encoding an acoustic signal
JP3540609B2 (en) Voice conversion device and voice conversion method
Roebel Between physics and perception: Signal models for high level audio processing

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090403

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees