JPH09134188A - Singing voice synthesizer and musical tone reproducing device - Google Patents

Singing voice synthesizer and musical tone reproducing device

Info

Publication number
JPH09134188A
JPH09134188A JP7292403A JP29240395A JPH09134188A JP H09134188 A JPH09134188 A JP H09134188A JP 7292403 A JP7292403 A JP 7292403A JP 29240395 A JP29240395 A JP 29240395A JP H09134188 A JPH09134188 A JP H09134188A
Authority
JP
Japan
Prior art keywords
pitch
data
output
outputs
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7292403A
Other languages
Japanese (ja)
Inventor
Katsuhiko Hayashi
克彦 林
Daisuke Mori
大輔 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7292403A priority Critical patent/JPH09134188A/en
Publication of JPH09134188A publication Critical patent/JPH09134188A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To prevent the degradation in the quality of a back chorus in spite of a change in playing speed and interval by applying a singing voice synthesizer capable of synthesizing the back chorus of PCM quality to a synthesizing KARAOKE machine. SOLUTION: The waveform data read out by a first reading out device 106a and second reading out device 106b are subjected to level conversion by level converters 108a and 108b according to the output values of first and second envelope formers 107a and 107b. Further, the outputs of these level converters 108a and 108b are added by an adder 109 and the singing voice synthesized output is obtd. at an output terminal 110. Further, the device is provided with an interval differential value generator 111 for controlling the pitch values of phonemes so as to gradually approximate the pitch value of the front phoneme to the rear phoneme at the time the front phoneme transfers to the rear phoneme when the pitches of the front and rear phonemes vary. As a result, the phonemes and the phonemes are extremely smoothly connected by controlling the reading out devices 106a and 106b.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明はバックコーラス付き
のカラオケ演奏を行うカラオケ装置に用いる音楽再生装
置に関し、特に曲のテンポ(演奏速度)およびピッチ(移
調)変更によってバックバックコーラスの品質を低下す
ることのない、歌声合成装置および音楽再生装置に関す
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a music reproducing apparatus used in a karaoke apparatus for performing a karaoke performance with a back chorus, and particularly, the quality of the back back chorus is deteriorated by changing the tempo (performance speed) and pitch (transposition) of the music. The present invention relates to a singing voice synthesizing device and a music reproducing device.

【0002】[0002]

【従来の技術】近年、デジタル技術の進歩に伴い、各種
のカラオケ方式が提案されており、特に電子楽器と同様
の楽音合成装置を用いたシンセサイザ方式のカラオケ
(以下、シンセカラオケと称す)が注目されるようにな
ってきている。
2. Description of the Related Art In recent years, various karaoke systems have been proposed in accordance with the progress of digital technology, and in particular, a synthesizer system karaoke system using a musical tone synthesizer similar to an electronic musical instrument (hereinafter referred to as "synth karaoke system") has attracted attention. Is becoming popular.

【0003】シンセカラオケは、楽音合成装置を一般に
MIDIと呼ばれる演奏指示情報等によって駆動し、カ
ラオケ用のバックミュージックを発生するものであり、
一般のカラオケ(例えばレーザーディスクのカラオケ)に
較べて、1曲の演奏に要するデータ量が非常に少ないこ
とに特長がある。
Synthesized karaoke is a system in which a musical sound synthesizer is driven by performance instruction information generally called MIDI to generate back music for karaoke.
Compared with general karaoke (for example, laser disk karaoke), the feature is that the amount of data required for playing one song is very small.

【0004】シンセサイザ方式のこの特長は、演奏情報
をISDNや電話回線を伝送路として転送するシンセカ
ラオケ(いわゆる、通信カラオケ)や演奏情報を半導体メ
モリ等に格納するタイプのシンセカラオケ等に生かされ
ていて、今後この分野でのシンセカラオケの成長が期待
されている。
This feature of the synthesizer system is utilized in synth karaoke (so-called communication karaoke) in which performance information is transferred through an ISDN or a telephone line as a transmission line, and in synth karaoke in which performance information is stored in a semiconductor memory or the like. Therefore, the growth of synth karaoke in this field is expected in the future.

【0005】反面、シンセサイザ方式のカラオケには音
声やバックコーラスの演奏が難しいという欠点が存在す
る。これは、シンセカラオケが電子楽器の楽音合成装置
を用いて構成されており、楽音合成装置が楽器音(ピア
ノやギター等の音声以外の楽器)の再生を目的として構
成されていること起因している。
On the other hand, synthesizer karaoke has a drawback that it is difficult to play voice and back chorus. This is because synth karaoke is configured using a musical tone synthesizer for electronic musical instruments, and the musical tone synthesizer is configured for playing musical instrument sounds (musical instruments other than voices such as piano and guitar). There is.

【0006】このような、欠点を克服するために従来考
案されたシンセサイザ方式のカラオケの音楽再生装置と
して、例えば、特開平6−161479号公報に開示さ
れたものがある。
As a conventional music reproducing apparatus for karaoke using a synthesizer system to overcome such drawbacks, there is one disclosed in Japanese Patent Application Laid-Open No. 6-161479.

【0007】この従来の音楽再生装置を同公報記載の図
面を用い、以下、その説明を行う。同公報の図1におい
て1は楽音データ記録部、2は楽音演奏部、3は入力
部、4は文字データ記録部、5は音声合成部、6は合成
増幅部、7は出力部、8は同期部である。
This conventional music reproducing apparatus will be described below with reference to the drawings described in the publication. In FIG. 1 of the publication, 1 is a tone data recording unit, 2 is a tone playing unit, 3 is an input unit, 4 is a character data recording unit, 5 is a voice synthesis unit, 6 is a synthesis amplification unit, 7 is an output unit, and 8 is It is a synchronization unit.

【0008】以上のように構成された従来の音楽再生装
置について以下説明を行う。楽音データ記録部1は演奏
曲の録音データを記録するもので、例えばコンパクトデ
ィスク(CD)、レーザーディスク(LD)または磁気記録
媒体とそのドライブ装置からなる。楽音演奏部2は楽音
データ記録部1の楽音データを受取り、アナログの楽音
信号に変えるものである。ここで記録部1に記録されて
いる楽音データをMIDIコードとすれば、楽音演奏部
2は電子発振器を使って音を生成するシンセサイザを用
いればよい。また、入力部3は歌唱者の音声をマイク等
で入力する。また、文字データ記録部4は文字コード列
を記録するもので、楽音データ記録部1と同様に磁気記
録媒体等とそにドライブ装置から構成され、楽音データ
記録部1と兼ねることも可能である。音声合成部5は文
字データ記録部4に記録された文字データ列を受取音声
信号に変換するものである。また合成増幅部6は楽音演
奏部2の出力と入力部3より入力された音声信号と音声
合成部5の出力を合成し、かつ増幅する。その結果の出
力はスピーカ等の出力部7に送られる。また同期部8は
楽音演奏部2の演奏に合わせて文字データ記録部4から
音声合成部5へ送られる文字データの制御を指令する。
The conventional music reproducing device configured as described above will be described below. The musical sound data recording unit 1 is for recording the recording data of a musical composition, and is composed of, for example, a compact disk (CD), a laser disk (LD) or a magnetic recording medium and its drive device. The musical tone playing section 2 receives the musical tone data of the musical tone data recording section 1 and converts it into an analog musical tone signal. Here, if the musical tone data recorded in the recording unit 1 is a MIDI code, the musical tone playing unit 2 may use a synthesizer that generates a sound using an electronic oscillator. The input unit 3 also inputs the voice of the singer using a microphone or the like. Further, the character data recording unit 4 records a character code string, and like the musical tone data recording unit 1, is composed of a magnetic recording medium and a drive device, and can also function as the musical tone data recording unit 1. . The voice synthesizer 5 converts the character data string recorded in the character data recorder 4 into a received voice signal. The synthesis amplification section 6 synthesizes and amplifies the output of the musical tone performance section 2, the voice signal input from the input section 3 and the output of the voice synthesis section 5. The resulting output is sent to the output unit 7 such as a speaker. Further, the synchronizing section 8 gives an instruction to control the character data sent from the character data recording section 4 to the voice synthesizing section 5 in accordance with the performance of the musical tone performance section 2.

【0009】音楽データ記録部1にはMIDIコードが
記録されているものとする。同公報の図2は文字データ
記録部4に記録されている文字データの例を示す。図
1、図2を参照して本装置の動作を説明する。MIDI
コードが演奏され始めると、楽音演奏部2に設定されて
いる楽音データ記録部1からの読みとり速度、すなわち
楽音演奏速度の値が同期部8へ送られ、同期部メモリ9
へ記憶される。次にMIDIコードの第1小節のデータ
は楽音データ記録部1から読出され、楽音演奏部2に送
られて楽音信号に変換される。同時に1小節分のMID
Iコードを受け取ったことは同期部8へ知らされる。こ
の同期部8は1小節のMIDIコードが楽音演奏部2に
送られたことを知ると、文字データ記録部4から1行デ
ータを読出して文字数をカウントし、音声の速さ指定の
値を計算する。ここでは1小節分の文字データは改行ま
での1行としている。そして音声合成部5は速さの指定
から発音する文字コードデータを送る。速さの値は次の
ように演算される。速さの値=(1小節の時間)/(1
行の文字数)。
A MIDI code is recorded in the music data recording unit 1. FIG. 2 of the publication shows an example of character data recorded in the character data recording unit 4. The operation of this apparatus will be described with reference to FIGS. MIDI
When the chord starts to be played, the reading speed from the tone data recording section 1 set in the tone playing section 2, that is, the value of the tone playing speed is sent to the synchronizing section 8 and the synchronizing section memory 9
Is stored in Next, the data of the first measure of the MIDI code is read from the musical tone data recording section 1 and sent to the musical tone performance section 2 to be converted into a musical tone signal. MID for one bar at the same time
The reception of the I code is notified to the synchronization unit 8. When the synchronizing section 8 knows that the one-measure MIDI code has been sent to the musical tone playing section 2, it reads out one line of data from the character data recording section 4, counts the number of characters, and calculates a value designating a voice speed. To do. Here, the character data for one bar is one line up to the line feed. Then, the voice synthesizing unit 5 sends character code data which is pronounced from the designation of speed. The speed value is calculated as follows. Value of speed = (1 bar time) / (1
Number of characters in line).

【0010】例えば、いま演奏しようとしている曲が1
小節5秒の速さで演奏されるように設定されたとし、バ
ックコーラスの1行の文字数が10文字であったとする
と、音声合成部5は指定された速さで送られた文字を音
声信号に変換し、合成増幅部6へ送る。この結果、楽音
演奏部2で発生された楽音と、音声合成部5で発生され
た音声との同期がとられ、合成増幅部6より出力部7へ
送られる。このように声音データを文字コード列として
記録し、その文字コード列から音声を発生させるように
しているので、声音データも楽音のMIDIデータと同
様にコード化して記録することができ、大幅にデータを
圧縮することができる。
For example, the song that is about to be played is 1
Assuming that the bar is set to be played at a speed of 5 seconds and the number of characters in one line of the back chorus is 10, the voice synthesizer 5 outputs the characters sent at the specified speed to the voice signal. To the composite amplification unit 6. As a result, the musical sound generated by the musical sound playing unit 2 and the voice generated by the voice synthesizing unit 5 are synchronized and sent from the synthesizing and amplifying unit 6 to the output unit 7. In this way, the voice sound data is recorded as a character code string, and the voice is generated from the character code string. Therefore, the voice sound data can be coded and recorded similarly to the MIDI data of the musical sound, and the data can be greatly Can be compressed.

【0011】しかしながら、ここに開示された音楽再生
装置では、文字データ記録部4には図2に示したように
文字のみが記憶されていて、これらの文字を音韻に変換
することを音声合成部6に指示することはできるが、音
声合成部6に対して音程を指示することができないう
え、これらの音韻の発音タイミングも1小節内で均等に
割り付けられるため細かく制御することができないなど
の制約があり、特殊な楽曲用のバックコーラスしか実現
できないという課題があった。
However, in the music reproducing device disclosed herein, only the characters are stored in the character data recording unit 4 as shown in FIG. 2, and it is necessary to convert these characters into phonemes. 6 can be instructed, but the pitch cannot be instructed to the speech synthesizer 6, and the pronunciation timings of these phonemes cannot be finely controlled because they are evenly allocated within one measure. However, there was a problem that only a back chorus for special songs could be realized.

【0012】この点を改良した従来のシンセカラオケの
音楽再生装置として、例えば、特開平7−140991
号公報に開示されたカラオケ装置がある。
As a conventional synth karaoke music reproducing apparatus in which this point is improved, for example, Japanese Patent Application Laid-Open No. 7-140991.
There is a karaoke device disclosed in the publication.

【0013】以下、従来の音楽再生装置を同公報の図面
を用いて、以下に、その説明を行なう。
The conventional music reproducing apparatus will be described below with reference to the drawings of the publication.

【0014】同公報の図1において、1はCPU、2は
RAM、3はバス、4は曲データ記憶装置、5はパネル
I/F、6はコントローラ、7は背景映像記憶/再生
部、8は画像/歌詞表示部、9はビデオセレクタ、10
はモニタ、11はマイク、12はミキサおよびエフェク
タ、13はアンプおよびスピーカー、14は音源、15
はプログラムROMおよびシーケンサ、16はディジタ
ル音声デコーダである。
In FIG. 1 of the publication, 1 is a CPU, 2 is a RAM, 3 is a bus, 4 is a song data storage device, 5 is a panel I / F, 6 is a controller, 7 is a background image storage / reproduction unit, and 8 Is an image / lyrics display section, 9 is a video selector, 10
Is a monitor, 11 is a microphone, 12 is a mixer and an effector, 13 is an amplifier and a speaker, 14 is a sound source, 15
Is a program ROM and sequencer, and 16 is a digital audio decoder.

【0015】同公報の図2は曲データの構造図であり、
図3は演奏データトラックの詳細を示す説明図であり、
図4は音声データ指示トラックの詳細を示す説明図であ
り、図5は各トラックの時系列的な構造図であり、図6
は音声データをデコードする部分の説明図であり、図7
はコーラス音声制御のタイムチャートである。
FIG. 2 of the publication is a structural diagram of music data,
FIG. 3 is an explanatory diagram showing the details of the performance data track,
4 is an explanatory diagram showing details of the audio data instruction track, FIG. 5 is a time-series structural diagram of each track, and FIG.
7 is an explanatory diagram of a portion for decoding audio data, and FIG.
Is a time chart of chorus voice control.

【0016】以上のように構成された、従来のカラオケ
装置について、以下その動作を説明する。
The operation of the conventional karaoke apparatus configured as described above will be described below.

【0017】図1は従来例のカラオケ装置全体のブロッ
ク図である。この図において1はシステム全体の動作を
制御および管理するCPU(中央処理装置)、2はCPU
1によりシステム全体の動作を制御および管理するとき
に使用されるRAM(ランダムアクセスメモリ)、3はシ
ステム全体を統合するためのデータおよびアドレスバス
である。
FIG. 1 is a block diagram of an entire conventional karaoke apparatus. In this figure, 1 is a CPU (central processing unit) that controls and manages the operation of the entire system, and 2 is a CPU
A RAM (random access memory) used when controlling and managing the operation of the entire system by 1 is a data and address bus for integrating the entire system.

【0018】4は複数の曲データを格納した記憶装置、
例えばHDD(ハードディスク)、5はパネルI/F(イ
ンタフェース)、6はパネルI/F5を介してシステム
に指示を与える複数のリモコン等のコントローラ、7は
背景映像記憶/再生部、8は背景の静止画や歌詞を表示
するための画像/歌詞表示部、9は背景映像記憶/再生部
7からの背景映像(動画)と画像/歌詞表示部8からの画
像を選択、合成するビデオセレクタ、10はビデオセレ
クタで選択、合成された画像を表示するモニタである。
A storage device 4 stores a plurality of pieces of music data,
For example, an HDD (hard disk), 5 are panel I / Fs (interfaces), 6 are controllers such as a plurality of remote controllers that give instructions to the system via the panel I / Fs 5, 7 is a background image storage / playback unit, and 8 is a background image. An image / lyrics display section for displaying still images and lyrics, and 9 is a video selector for selecting and synthesizing the background video (moving image) from the background video storage / playback section 7 and the image / lyrics display section 8. Is a monitor that displays the image selected and synthesized by the video selector.

【0019】11は歌い手の歌唱音声を入力するマイ
ク、12は歌唱音声と演奏曲の楽音とを混合するミキサ
および各種の音響効果を与えるエフェクタである。13
は合成された歌唱音声と演奏曲をアンプで増幅して出力
するスピーカである。14は演奏曲の楽音を発音する音
源、15はこの音源14並びに、ミキサおよびエフェク
タ12を制御するシーケンサである。このシーケンサ1
5はCPU1が使用するプログラムを格納したプログラ
ムROMを有する。16は符号化されたディジタル音声
データ(例えばPCMやADPCMデータ)をデコードす
る音声デコーダである。
Reference numeral 11 is a microphone for inputting the singer's singing voice, 12 is a mixer for mixing the singing voice and the musical sound of the performance song, and an effector for providing various acoustic effects. 13
Is a speaker that amplifies and outputs the synthesized singing voice and performance music. Reference numeral 14 is a sound source for producing a musical tone of a musical composition, and 15 is a sequencer for controlling the sound source 14 and the mixer and effector 12. This sequencer 1
Reference numeral 5 has a program ROM that stores programs used by the CPU 1. A voice decoder 16 decodes encoded digital voice data (for example, PCM or ADPCM data).

【0020】以下、動作を説明する。コントローラ6の
操作によって演奏曲が指定されるとCPU1は記憶装置
4に記憶されている曲目リストを参照して該当する演奏
曲の曲データおよびバックコーラス用の符号化された音
声データをRAM2に転送し、シーケンサ15に制御を
移す。シーケンサ515は、曲データに含まれる複数の
イベントデータを基に、曲演奏を含む複数のイベントを
同時に並列して実行する。
The operation will be described below. When the musical composition is designated by the operation of the controller 6, the CPU 1 refers to the musical composition list stored in the storage device 4 and transfers the musical composition data of the corresponding musical composition and the encoded voice data for the back chorus to the RAM 2. Then, the control is transferred to the sequencer 15. The sequencer 515 simultaneously executes a plurality of events including music performance in parallel based on a plurality of event data included in the music data.

【0021】即ち、シーケンサ15は、楽曲の音色およ
び疑似音声の音色に関するデータは音源14に、また符
号化された音声データはディジタル音声デコーダ16
に、さらに背景映像番号は背景映像記録/再生部7に、
また歌詞番号は画像/歌詞表示部8にそれぞれ供給す
る。この結果、モニタ10の全面に背景映像が表示さ
れ、その一部に歌詞がスーパーインポーズされた表示状
態となる一方、スピーカ13からは演奏曲およびバック
コーラスが出力される演奏状態になる。
That is, in the sequencer 15, the data relating to the tone color of the musical composition and the tone color of the pseudo voice are sent to the sound source 14, and the encoded voice data is sent to the digital voice decoder 16.
In addition, the background video number is in the background video recording / playback unit 7,
The lyrics numbers are supplied to the image / lyrics display section 8, respectively. As a result, the background image is displayed on the entire surface of the monitor 10 and a part of the background image is displayed in a superimposed state, while the speaker 13 is in a playing state in which the playing song and the back chorus are output.

【0022】曲データは図2に示すように、ヘッダ部、
データシーケンス部、音声データ部からなる。ヘッダ部
にはその曲固有の情報として、曲番号、曲名、作曲者
名、歌手名、背景画像選択情報、歌詞のフォント情報が
書き込まれている。
As shown in FIG. 2, the music data includes a header portion,
It consists of a data sequence part and a voice data part. In the header portion, as the information peculiar to the song, a song number, a song name, a composer name, a singer name, background image selection information, and lyric font information are written.

【0023】データシーケンス部には、並行して同時に
実行される複数種類のイベントを記述した複数のトラッ
クが設定されている。音声データ部にはデータシーケン
ス部の音声データ指示データで選択される複数の音声番
号が書き込まれている。
In the data sequence section, a plurality of tracks describing a plurality of types of events that are executed simultaneously in parallel are set. A plurality of voice numbers selected by the voice data instruction data of the data sequence portion are written in the voice data portion.

【0024】データシーケンス部に含まれるトラックの
内、演奏データトラックには、音源14から演奏曲の楽
音を発声させるデータを時系列に記述してある。疑似音
声データトラックには、音源14から疑似コーラス音声
(例えば「わー」、「うー」)を発声させるデータを時系
列に記述してある。音声データ指示トラックにはデコー
ダ16でデコードさせる真性コーラス音声(例えば「は
こだてー」、「ながさきー」)の種類を指示する音声デ
ータ番号、音程、音高の各データが記述してある。歌詞
データトラックには、演奏に併せてモニタ10に表示す
る歌詞の種類を指示するデータを時系列に記述してあ
る。効果制御データトラックには、ミキサおよびエフェ
クタ12を制御するコントロールデータを時系列に記述
してある。
Among the tracks included in the data sequence section, data for uttering the musical tone of the musical piece to be played from the sound source 14 is described in time series on the performance data track. The pseudo voice data track contains a pseudo chorus voice from the sound source 14.
The data for uttering (for example, "Wow", "Woo") is described in time series. In the voice data instruction track, voice data numbers, pitches, and pitch data for instructing the types of true chorus voices (for example, "Hakodate" and "Nagasaki") to be decoded by the decoder 16 are described. In the lyrics data track, data indicating the type of lyrics to be displayed on the monitor 10 along with the performance is described in time series. In the effect control data track, control data for controlling the mixer and the effector 12 are described in time series.

【0025】図3は演奏でーたトラックの詳細を示す説
明図である。この演奏データトラックには、ノートイベ
ント、音色変更イベント、ピッチベンドイベントの各情
報が記述されている。ノートイベントには、音源14の
発声させようとする一つのCH(チャンネル)を指示する
CHナンバ、ノート番号(音高)、ベロシティ(音量)、符
長が書き込まれている。音色変更イベントにはCHナン
バ、音色データが書き込まれている。ピッチベンドイベ
ントには、CHナンバ、ピッチベンド情報が書き込まれ
ている。演奏データトラックのノートイベントは、演奏
曲の楽音発音用であるが、疑似音声データトラックも、
CHナンバが異なるだけの同様構造のノートイベントを
有する。
FIG. 3 is an explanatory diagram showing details of the track played. In the performance data track, note event information, tone color change event information, and pitch bend event information are described. A CH number, a note number (pitch), a velocity (volume), and a note length for designating one CH (channel) to be uttered by the sound source 14 are written in the note event. CH number and tone color data are written in the tone color change event. The CH number and pitch bend information are written in the pitch bend event. The note event of the performance data track is for the musical tone pronunciation of the performance song, but the pseudo voice data track also
It has a note event with a similar structure but with different CH numbers.

【0026】図4は、音声データ指示トラックの詳細を
示す説明図である。この音声データ指示トラックには、
音声指示イベントの各情報が記述されている。即ち、音
声データ番号、音程、音量の各情報である。音声データ
番号は、デコーダ16でデコードさせる符号化された真
性コーラス音声データの番号であり、図2の音声データ
の音声番号のことである。予め複数のトラックは図5に
示すように、イベントの種類と次のイベント発声までの
待ち時間Δtを時系列に配列した構造である。
FIG. 4 is an explanatory diagram showing details of the audio data instruction track. In this voice data instruction track,
Each information of the voice instruction event is described. That is, it is information about the voice data number, the pitch, and the volume. The voice data number is the number of the encoded true chorus voice data to be decoded by the decoder 16, and is the voice number of the voice data of FIG. As shown in FIG. 5, the plurality of tracks have a structure in which the type of event and the waiting time Δt until the next event is uttered are arranged in time series.

【0027】図6は音声指示イベントの情報に従い、音
声データをデコードする部分の説明図である。シーケン
サ15は、音声指示イベントの音声データ番号を用いて
RAM2から該当する音声データ番号の符号化されたデ
ィジタル音声データを読み出し、それをディジタル音声
デコーダ16に入力する。このディジタル音声データ
は、従来例では真性コーラス音声データである。一例と
してディジタル音声データが、データ容量を減らすため
に圧縮されたアダプティブ・デルタ(AD)PCMデータ
である場合、デコーダ16はビット数変換および周波数
変換を行って伸長する機能を有したPCMデコーダであ
る。
FIG. 6 is an explanatory diagram of a portion for decoding the voice data according to the information of the voice instruction event. The sequencer 15 reads the encoded digital voice data of the corresponding voice data number from the RAM 2 using the voice data number of the voice instruction event and inputs it to the digital voice decoder 16. This digital voice data is true chorus voice data in the conventional example. As an example, when the digital audio data is adaptive delta (AD) PCM data compressed to reduce the data capacity, the decoder 16 is a PCM decoder having a function of performing bit number conversion and frequency conversion to expand. .

【0028】デコーダ16の後段には音程および音量を
制御するプロセッサ17が配置され、ここでデコードさ
れたアナログ波形の音程および音量を、音声指示イベン
トに含まれる音程および音量情報に基づいて調整した
後、ミキサおよびエフェクタ12に入力する。この経路
を用いて真性コーラス音声を再生するのは再生速度が1
00%のときまたはピッチの変更量が所定範囲内のとき
である。コントローラ6からの指示で演奏曲の再生速度
を100%以外に変更したときはプロセッサ17におい
てデコーダ16の出力に対する音量を0にして、真性コ
ーラス音声の再生を中止する。ピッチの変更量が所定量
の200〜300セントを超えた場合も同様である。
A processor 17 for controlling the pitch and the volume is arranged in the subsequent stage of the decoder 16, and after adjusting the pitch and the volume of the analog waveform decoded here based on the pitch and the volume information included in the voice instruction event. , Mixer and effector 12. The playback speed of the intrinsic chorus voice is 1 using this path.
When it is 00% or when the pitch change amount is within a predetermined range. When the reproduction speed of the musical composition is changed to a value other than 100% by the instruction from the controller 6, the processor 17 sets the volume for the output of the decoder 16 to 0 and stops the reproduction of the intrinsic chorus voice. The same applies when the pitch change amount exceeds a predetermined amount of 200 to 300 cents.

【0029】ピッチ変更時に真性コーラス音声を使用し
ないのは次の理由による。つまり、音程、音量制御部1
7において、真性コーラス音声に対する音程をある程度
以上変化させると、音声の質が低下し、実質的に使用で
きなくなる。「ある程度」の目安は半音単位で±2〜3
音(200から300セント)である。したがって、テンポ
(再生速度)を変更した場合だけでなく、ピッチ(音程)を
所定量以上変更したときも疑似コーラス音声を使用す
る。
The reason why the intrinsic chorus voice is not used when changing the pitch is as follows. That is, the pitch / volume controller 1
In No. 7, if the pitch for the intrinsic chorus voice is changed to a certain extent or more, the quality of the voice deteriorates and it becomes practically unusable. A guideline for "somewhat" is ± 2 to 3 in semitone units.
Sound (200 to 300 cents). Therefore, the tempo
The pseudo chorus voice is used not only when the (playback speed) is changed but also when the pitch (pitch) is changed by a predetermined amount or more.

【0030】以上の理由から、演奏曲の再生速度が10
0%以外になったとき、またはピッチの変更量が所定量
の200〜300セントを超えたときは、シーケンサ51
5は疑似音声データトラックのデータに従い、音源51
4から疑似コーラスを発声させる。疑似コーラス音声
は、予め音源514に、楽音と同様にして「わー」「う
ー」という音声のチャンネルを設定しておき、それを疑
似音声データで選択して発音させるものである。
For the above reasons, the playing speed of the performance music is 10
When it becomes a value other than 0% or when the pitch change amount exceeds a predetermined amount of 200 to 300 cents, the sequencer 51
5 is a sound source 51 according to the data of the pseudo voice data track.
Produce a pseudo-chorus from 4. The pseudo-chorus voice is a voice channel in which the voices “wow” and “woo” are set in the sound source 514 in advance in the same manner as the musical tone, and the voice channel is selected by the pseudo-voice data to be sounded.

【0031】図7は、テンポ(再生速度)が100%を中
心に変化した場合の、シーケンサ15による制御の様子
を示している。この例では音声データトラックのイベン
トは、時刻t1、t5、t8で順番に変化する。これに
対しテンポは時間t4で1005から70%に、時刻t
6で70%から120%に、時刻t7で120%から1
00%に変化した例である。
FIG. 7 shows how the sequencer 15 controls when the tempo (reproduction speed) changes around 100%. In this example, the events of the audio data track change in order at times t1, t5, and t8. On the other hand, the tempo changes from 1005 to 70% at time t4 at time t4.
70% to 120% at 6 and 120% to 1 at time t7
This is an example of change to 00%.

【0032】時刻t1のテンポは100%なので、この
時は音声データトラックのイベントに従い、「はこだて
ー」という真性音声データのデコードを開始し、音声デ
ータの音量を音声イベントに記述された所定量に設定す
る。このとき、疑似音声データトラックについては何も
処理しないという訳ではなく、最初の「は」に相当する
音声イベントを読み、その疑似音声(例えば「わー」)を
音源14から発音させる。但し実際には、疑似音声側の
音量を0にして、スピーカ13からは出力できないよう
にする。同時に、真性音声データに関する音量値(上記
の所定値)を復帰用に記憶しておく。
Since the tempo at time t1 is 100%, at this time, the decoding of the true audio data "Hakodate" is started according to the event of the audio data track, and the volume of the audio data is set to the predetermined amount described in the audio event. Set. At this time, nothing is processed with respect to the pseudo voice data track, and the voice event corresponding to the first "ha" is read and the pseudo voice (for example, "wow") is sounded from the sound source 14. However, in reality, the volume of the pseudo sound is set to 0 so that the speaker 13 cannot output the sound. At the same time, the volume value (the above-mentioned predetermined value) regarding the intrinsic voice data is stored for restoration.

【0033】時刻t2でもテンポは100%なので、真
性コーラス音声の出力を継続する。このとき、疑似音声
トラックは「こ」の発音イベントに入るが、疑似音声側
の音量は0のままである。時刻t3でもテンポは100
%なので、真性コーラスの音声の出力を継続する。この
とき、疑似音声トラックは「だ」の発音イベントに入る
が、疑似音声側の音量は0のままである。
Since the tempo is 100% at time t2, the true chorus voice is continuously output. At this time, the pseudo voice track enters the sounding event of "ko", but the volume of the pseudo voice remains 0. Tempo is 100 even at time t3
%, So the output of the true chorus voice is continued. At this time, the pseudo voice track enters a sounding event of "da", but the volume on the pseudo voice side remains 0.

【0034】時刻t4になるとテンポが100%から7
0%に下がるので、真性音声をフェードアウトし、代わ
りに疑似音声の発音チャンネルを予め記憶しておいた所
定値にフェードインする。このときは、真性音声が再生
途中である可能性もあるので緩やかなクロスフェードを
行って途切れを回避する。
At time t4, the tempo changes from 100% to 7
Since it decreases to 0%, the true voice is faded out, and instead, the pseudo voice generation channel is faded in to a predetermined value stored in advance. At this time, since there is a possibility that the true voice is being reproduced, a gentle crossfade is performed to avoid interruption.

【0035】時刻t5になると音声データ側は次のイベ
ント(「しんじることさ」)に入るが、テンポが100%
に戻っていないので、音量を0にしたまま真性音声の発
音はせず代わりに「し」に対する疑似音声(例えば「わ
ー」)を音源14から発声させる。この疑似音声につい
ては、イベントに記述されたCH番号、ノート番号(音
高)、ベロシティ(音量)、符長を用いて制御する。
At time t5, the audio data side enters the next event ("Shinji Kotosa"), but the tempo is 100%.
Since the sound has not been returned to, the pseudo sound (for example, "wa") corresponding to "shi" is uttered from the sound source 14 instead of producing the true sound with the volume set to 0. This pseudo voice is controlled using the CH number, note number (pitch), velocity (volume), and note length described in the event.

【0036】時刻t6でテンポが70%から120%に
変化するが、100%ではないので「ん」に相当する疑
似音声(例えば「わー」)の発音を継続する。時刻t7で
テンポが70%から100%に変化するので真性音声に
戻る1つの条件が成立したが、この段階では前の音声デ
ータイベントのデコード途中なので、次の音声データイ
ベントが開始するまでは、疑似音声の発音を継続する。
At time t6, the tempo changes from 70% to 120%, but since it is not 100%, the pseudo voice corresponding to "n" (for example, "wa") is continuously produced. Since the tempo changes from 70% to 100% at time t7, one condition for returning to true voice is satisfied, but at this stage, since the previous voice data event is being decoded, until the next voice data event starts, Continue to pronounce the pseudo voice.

【0037】時刻t8になるとテンポが100%であ
り、かつ新たな音声データイベントが開始するので、こ
のタイミングで真性音声にフェードインさせる。この時
は真性音声の開始時なので、急峻にフェードインしても
問題ない。この時、疑似音声の「ど」に相当する発音部
分もあるが、その発音チャンネルの音量を0にして発音
を禁止する。以上のような制御をシーケンサ15が行う
ことで、コーラスパート付きのカラオケ演奏曲を再生速
度が変化しても常に時間のずれの無い状態で提供するこ
とができる。
At time t8, the tempo is 100%, and a new voice data event starts, so that the real voice is faded in at this timing. At this time, since it is the start of the intrinsic voice, there is no problem even if it suddenly fades in. At this time, although there is a sounding portion corresponding to "d" of the pseudo sound, the sound volume of the sounding channel is set to 0 to prohibit sounding. By performing the above-described control by the sequencer 15, it is possible to provide a karaoke performance piece with a chorus part without any time lag even if the reproduction speed changes.

【0038】[0038]

【発明が解決しようとする課題】しかしながら上記の従
来の構成では、演奏速度を変化したり音程を変化すると
PCMおよびPCM圧縮波形で形成されたバックコーラ
スから楽音合成装置で形成された疑似バックコーラスに
切り替わるため、音質が変化してしまい、特に演奏速度
と音程が規定値内でないときは、疑似バックコーラスに
なって、バックコーラスの品質が低下するという課題を
有していた。特にPCMおよびPCM圧縮で形成したバ
ックコーラスが歌詞を再生するのに対し、「あー」、
「わー」で構成した疑似バックコーラスは異質である。
However, in the above-mentioned conventional configuration, when the playing speed or the pitch is changed, the back chorus formed by the PCM and the PCM compressed waveform is changed to the pseudo back chorus formed by the tone synthesizer. Since the sound quality is changed, the sound quality is changed, and especially when the playing speed and the pitch are not within the specified values, a pseudo back chorus is generated and the quality of the back chorus is deteriorated. In particular, while PCM and a back chorus formed by PCM compression play lyrics, "Ah",
The pseudo back chorus composed of "wow" is different.

【0039】また、PCMおよびPCM圧縮形式のバッ
クコーラスのデータ量は、楽音合成装置を駆動する一般
にMIDIと呼ばれる演奏情報に較べて、非常に多い
(100倍以上)ため、通信カラオケ等ではこれらを曲毎
に通信回線を経由して伝送するのに多大の時間を要し、
またスタンドアロンのシンセカラオケ等では大量のデー
タ記憶装置が必要になる。これを避けるためには演奏速
度または音程が規定値内であっても疑似バックコーラス
を用いるようにしなければならないという課題を有して
いた。
Further, the data amount of the PCM and the back chorus in the PCM compression format is much larger than the performance information generally called MIDI which drives the tone synthesizer.
Because it is (100 times or more), it takes a lot of time to transmit these for each song via a communication line in online karaoke,
A large amount of data storage device is required for a stand-alone synth karaoke. In order to avoid this, there is a problem that the pseudo back chorus must be used even if the playing speed or the pitch is within the specified value.

【0040】本発明は上記従来の課題を解決するもの
で、PCM品質のバックコーラスを合成できる歌声合成
装置を提供し、さらにこれをシンセカラオケに適用する
ことにより、演奏速度や音程が変化してもバックコーラ
スの品質が低下しない音楽再生装置を提供するものであ
る。
The present invention solves the above-mentioned conventional problems, and provides a singing voice synthesizer capable of synthesizing a back chorus of PCM quality, and by applying the singing voice synthesizer to a synth karaoke, the performance speed and pitch are changed. Also provides a music reproducing device in which the quality of the back chorus does not deteriorate.

【0041】[0041]

【課題を解決するための手段】これらの課題を解決する
ために、本発明の歌声合成装置は、入力された音韻と音
高と音量および発音タイミングからなる演奏情報を第1
および第2の出力系列に交互に出力するアサイナと、ア
サイナの第1および第2の出力系列によっ音高と発音タ
イミングを指示されて第1および第2の出力にそれぞれ
第1および第2の音程変化値を出力する音程差分発生器
と、アサイナの第1および第2の出力系列によってそれ
ぞれ音高と音韻と発音タイミングを指示されかつ音程差
分発生器の第1および第2の出力によってそれぞれ音程
変化値を指示される第1および第2の読み出し器と、ア
サイナの第1および第2の出力系列によってそれぞれ音
量と発音タイミングを指示され波形包絡データを生成す
る第1および第2のエンベ形成器と、予め複数の音韻お
よび音高の音声波形を記憶していてそれぞれ第1および
第2の読み出し器によってデータが読み出される第1お
よび第2の波形メモリと、第1および第2の読み出し器
の出力をそれぞれ第1および第2のエンベ形成器の出力
でレベル変換する第1および第2のレベル変換器と、第
1および第2のレベル変換器の出力を加算する加算器と
を備える。
In order to solve these problems, the singing voice synthesizing apparatus of the present invention first provides performance information consisting of an input phoneme, pitch, volume and sounding timing.
And a second output sequence for alternately outputting the pitch, and the first and second output sequences of the assigner to instruct the pitch and sounding timing to output the first and second outputs respectively. A pitch difference generator that outputs a pitch change value, and a pitch and a phoneme and a sounding timing are instructed by the first and second output sequences of the assigner, respectively, and the pitch difference generator generates the pitch by the first and second outputs, respectively. First and second readers for which change values are instructed, and first and second envelope formers for generating waveform envelope data in which volume and sound generation timing are instructed by the first and second output sequences of the assigner, respectively. And a first and second waveform memory in which voice waveforms of a plurality of phonemes and pitches are stored in advance and data is read by the first and second readers, respectively. And first and second level converters for level converting the outputs of the first and second readers with the outputs of the first and second envelope formers, respectively, and the first and second level converters. And an adder for adding the outputs of the above.

【0042】また、本発明の音楽再生装置は、楽器およ
び歌唱の演奏情報を記憶している演奏データメモリと、
演奏データメモリから読みだした演奏情報と移調入力お
よび演奏速度入力に応じてタイミングを制御しながら演
奏指示情報を出力するシーケンサと、シーケンサの演奏
指示に従って楽音を合成する楽音合成装置と、シーケン
サの演奏指示に従って歌声を合成する歌声合成装置と、
楽音合成装置の出力と歌声合成装置の出力を加算する加
算器とを備える。
Further, the music reproducing apparatus of the present invention comprises a performance data memory storing performance information of musical instruments and singing,
A sequencer that outputs performance instruction information while controlling the timing according to the performance information read from the performance data memory and transposition input and performance speed input, a tone synthesizer that synthesizes musical sounds according to the performance instructions of the sequencer, and the sequencer performance A singing voice synthesizer that synthesizes a singing voice according to instructions,
An adder for adding the output of the musical sound synthesizer and the output of the singing voice synthesizer is provided.

【0043】[0043]

【発明の実施の形態】本発明の請求項1に記載の発明
は、入力された音韻と音高と音量および発音タイミング
からなる演奏情報を第1および第2の出力系列に交互に
出力するアサイナと、前記アサイナの第1および第2の
出力系列によってそれぞれ音高と音韻と発音タイミング
を指示される第1および第2の読み出し器と、前記アサ
イナの第1および第2の出力系列によってそれぞれ音量
と発音タイミングを指示され波形包絡データを生成する
第1および第2のエンベ形成器と、予め複数の音韻およ
び音高の音声波形を記憶していてそれぞれ第1および第
2の前記読み出し器によってデータが読み出される第1
および第2の波形メモリと、前記第1および第2の読み
出し器の出力をそれぞれ前記第1および第2のエンベ形
成器の出力でレベル変換する第1および第2のレベル変
換器と、前記第1および第2のレベル変換器の出力を加
算する加算器とを備えたものであり、指定された音韻/
音高の音声波形を、音韻毎に交互に個別に読み出し器で
読み出し、クロスフェードしながら滑らかに出力する。
クロスフェード部以外は原音PCMそのままなので品質
の高い歌声が合成できる。
BEST MODE FOR CARRYING OUT THE INVENTION The invention according to claim 1 of the present invention is an assigner for alternately outputting performance information consisting of an input phoneme, pitch, volume and sounding timing to first and second output sequences. And first and second readers whose pitch, phoneme, and sounding timing are instructed by the first and second output series of the assigner, respectively, and the volume of sound by the first and second output series of the assigner, respectively. And the first and second envelope formers that generate the waveform envelope data instructed by the sounding timing, and the voice waveforms of a plurality of phonemes and pitches are stored in advance and the data is read by the first and second readers, respectively. First is read
And a second waveform memory, first and second level converters for level-converting the outputs of the first and second readers with the outputs of the first and second envelope formers, respectively. An adder for adding the outputs of the first and second level converters,
The voice waveform of the pitch is read out by the reading device alternately for each phoneme, and smoothly output while crossfading.
Except for the cross-fade part, the original sound PCM is unchanged, so that a high quality singing voice can be synthesized.

【0044】また、前の音韻と後ろの音韻で音高差があ
る場合にはクロスフェード時に前の音韻の音高を次第に
後ろの音高に漸近させるので音高の変化が滑らかにな
り、自然な歌声を合成することができる。
Further, when there is a pitch difference between the front phoneme and the back phoneme, the pitch of the front phoneme is gradually asymptotically approached to the back phoneme at the time of crossfade, so that the pitch change becomes smooth and natural. You can synthesize different singing voices.

【0045】さらに、上記歌声合成装置と楽音合成装置
をカラオケに組み込みバックコーラスを発生させるので
演奏する音程を変化させた時も音声波形の読み出し位置
が変化するだけなので演奏速度と音程にかかわらず品質
の高いバックコーラスが得られる。
Further, since the above-mentioned singing voice synthesizer and tone synthesizer are incorporated in karaoke to generate a back chorus, even when the pitch to be played is changed, only the read position of the voice waveform is changed, so that the quality is maintained regardless of the playing speed and the pitch. A high back chorus is obtained.

【0046】以下、本発明の実施の形態について、図面
を参照しながら説明する。 (実施の形態1)図1は、本発明の実施の形態1におけ
る歌声合成装置の構成を示すブロック図である。図1に
おいて、100、101、102、103は入力端子、
104はアサイナ、105a、105bは波形メモリ、
106a、106bは読み出し器、107a、107b
はエンベ形成器、108a、108bはレベル変換器、
109は加算器、110は出力端子、111は音程差分
発生器である。
Hereinafter, embodiments of the present invention will be described with reference to the drawings. (Embodiment 1) FIG. 1 is a block diagram showing a configuration of a singing voice synthesizing apparatus according to Embodiment 1 of the present invention. In FIG. 1, 100, 101, 102 and 103 are input terminals,
104 is an assigner, 105a and 105b are waveform memories,
106a and 106b are readers, and 107a and 107b.
Is an envelope former, 108a and 108b are level converters,
109 is an adder, 110 is an output terminal, and 111 is a pitch difference generator.

【0047】図2は本実施の形態における読み出し器1
06a、106bの動作および構成を示す図である。図
2(b)において、701、702、703、708は
入力端子、707は出力端子、709、706は加算
器、704はアドレス生成器、705は読み出し開始ア
ドレス生成器である。
FIG. 2 shows the reader 1 according to this embodiment.
It is a figure showing operation and composition of 06a and 106b. In FIG. 2B, 701, 702, 703, and 708 are input terminals, 707 is an output terminal, 709 and 706 are adders, 704 is an address generator, and 705 is a read start address generator.

【0048】図3は本実施の形態における音程差分発生
器111の動作を説明する説明図、図4は本実施の形態
における波形メモリ105aおよび105bのデータ格
納状態の説明図、図5は本実施の形態における波形メモ
リ105aおよび105bのループ読み出しの説明図、
図6は本実施の形態における歌声合成のクロスフェード
処理の説明図、図7は本実施の形態におけるアサイナ1
04の動作説明図である。
FIG. 3 is an explanatory diagram for explaining the operation of the pitch difference generator 111 according to the present embodiment, FIG. 4 is an explanatory diagram for the data storage state of the waveform memories 105a and 105b according to the present embodiment, and FIG. 5 is for the present embodiment. Of loop reading of the waveform memories 105a and 105b in the form of FIG.
FIG. 6 is an explanatory view of the crossfade processing of singing voice synthesis in this embodiment, and FIG. 7 is an assigner 1 in this embodiment.
It is operation | movement explanatory drawing of 04.

【0049】以上のように構成された本実施の形態にお
ける歌声合成装置の動作を説明する。
The operation of the singing voice synthesizing apparatus according to the present embodiment configured as described above will be described.

【0050】アサイナ104には、合成すべき歌声の音
韻と音高と音量および発音タイミングからなる演奏情報
がそれぞれ入力端子100、101、102、103か
ら与えられる。アサイナ104は、入力された音韻と音
高と音量および発音タイミングからなる演奏情報を交互
に第1および第2の出力系列に出力する。
Performance information consisting of phonemes, pitches, volumes and sounding timings of singing voices to be synthesized is given to the assigners 104 from the input terminals 100, 101, 102 and 103, respectively. The assigner 104 alternately outputs the input phoneme, pitch, volume, and performance information consisting of sounding timing to the first and second output sequences.

【0051】さらに、アサイナ104の第1および第2
の出力系列にはそれぞれ第1の読み出し器106aと第
2の読み出し器106bが接続されていて、アサイナ1
04から音高と音韻と発音タイミングが指示される。
Further, the first and second of the assigner 104 are
A first reader 106a and a second reader 106b are respectively connected to the output series of the assigner 1
From 04, the pitch, phoneme, and sounding timing are instructed.

【0052】読み出し器106aおよび106bは次の
ように動作する。音韻と音高が指示され発音の開始が指
示されると、読み出し器106aおよび106bは波形
メモリの指示された音韻および音高の格納されている先
頭番地から順に波形データを読出す。
The readers 106a and 106b operate as follows. When the phoneme and the pitch are instructed and the start of the pronunciation is instructed, the readers 106a and 106b sequentially read the waveform data from the head address where the instructed phoneme and the pitch are stored in the waveform memory.

【0053】一般に、音声の波形は、発音開始部の数1
00m秒が過渡部であり、以後は比較的類似した波形が
繰り返し出現する性質がある。この繰り返し部分も数1
00m秒で表現できることが知られている。すなわち元
となる音声の波形を図5(a)とすると、発音開始部+繰
り返し部を波形メモリに記憶しておき、読出す際には図
5(b)のように繰り返し部をループして読出すことによ
って、波形メモリ量を1音韻あたり500m秒から1秒
程度にすることができる。
In general, the waveform of a voice is the number 1 of the sound generation start part.
00 msec is the transition part, and thereafter, there is a property that a relatively similar waveform repeatedly appears. This repeated part is also number 1
It is known that it can be expressed in 00 msec. That is, assuming that the waveform of the original voice is as shown in FIG. 5 (a), the sound generation start portion + repetition portion is stored in the waveform memory, and when reading out, the repetition portion is looped as shown in FIG. 5 (b). By reading out, the waveform memory amount can be set to about 500 msec to 1 sec per phoneme.

【0054】このように波形メモリ105a、105b
は図2に示すような構成をしている。入力端子703か
ら音韻、708から音高が指定される。していされた音
韻と音高の組み合わせにしたがい読み出し開始アドレス
が読み出し開始アドレス生成器705から出力される。
In this way, the waveform memories 105a and 105b
Has a configuration as shown in FIG. A phoneme is designated from the input terminal 703, and a pitch is designated from 708. The read start address is output from the read start address generator 705 according to the combination of the phoneme and the pitch that has been played.

【0055】同時に入力端子701から発音タイミン
グ、702から音程差分値があたえらる。加算器709
は音程差分値と音高の指定値を加算しこれをΔAとして
出力する。ΔAはアドレス生成器704に与えられてい
てアドレス生成器704は基本的にΔAを積分する。た
だし積分値が波形データ長を超える毎に積分値から繰り
返し部の長さに相当する値が引き算され、図2(a)の
ようなアドレス値が生成される。このアドレス値が読み
出し開始アドレス生成器705の出力と加算器706で
加算され出力端子707に波形メモリに与えるアドレス
が出力される。
At the same time, the tone generation timing is given from the input terminal 701 and the pitch difference value is given from 702. Adder 709
Outputs the pitch difference value and the specified value of the pitch, and outputs this as ΔA. ΔA is given to the address generator 704, and the address generator 704 basically integrates ΔA. However, every time the integrated value exceeds the waveform data length, a value corresponding to the length of the repeating portion is subtracted from the integrated value to generate an address value as shown in FIG. This address value is added to the output of the read start address generator 705 and the adder 706, and the address given to the waveform memory is output to the output terminal 707.

【0056】また、音程差分発生器111にはアサイナ
104の第1および第2の出力系列双方から音高および
発音タイミングが指示される。音程差分発生器111は
図3のように前の音韻から後ろの音韻に移行する際に前
の音韻の音高をしだいに後ろの音韻の音高に近づけるた
めに時間的に変化する第1および第2の補正値をそれぞ
れ第1および第2の出力とし、これらの出力はそれぞれ
第1の読み出し器106aと第2の読み出し器106b
の音程変化値入力として与えられる。
Further, the pitch difference generator 111 is instructed of the pitch and tone generation timing from both the first and second output series of the assigner 104. The pitch difference generator 111 temporally changes the pitch of the preceding phoneme to gradually approach the pitch of the following phoneme when transitioning from the preceding phoneme to the following phoneme as shown in FIG. The second correction values are respectively the first and second outputs, and these outputs are respectively the first reader 106a and the second reader 106b.
It is given as the pitch change value input of.

【0057】さらに、アサイナ104の第1および第2
の出力系列にはそれぞれ波形包絡データを生成する第1
のエンベ形成器107aおよび第2のエンベ形成器10
7bが接続されていてそれぞれアサイナ104の第1お
よび第2の出力系列から音量と発音タイミングを指示さ
れる。
Further, the first and second of the assigner 104 are
The first output sequence for generating the waveform envelope data
Envelope former 107a and second envelope former 10
7b is connected, and the volume and sound generation timing are instructed from the first and second output series of the assigner 104, respectively.

【0058】第1の読み出し器106aと第2の読み出
し器106bによって読み出される第1の波形メモリ1
05aおよび105bには図4のように日本語や英語そ
のたの言語について通常発音可能または演奏に必要な全
音韻、全音高の波形データが格納されていて、第1の読
み出し器106aと第2の読み出し器106bは指定さ
れた音高および音韻の波形データを順次読み出す。
The first waveform memory 1 read by the first reader 106a and the second reader 106b
Reference numerals 05a and 105b store waveform data of all phonemes and pitches that are normally soundable or necessary for performance in Japanese, English and other languages as shown in FIG. Reader 106b sequentially reads the waveform data of the specified pitch and phoneme.

【0059】第1の読み出し器106aと第2の読み出
し器106bによって読み出された波形データは、それ
ぞれ第1および第2のエンベ形成器107aと107b
の出力値に従ってレベル変換器108aと108bによ
ってレベル変換される。
The waveform data read by the first reader 106a and the second reader 106b are the first and second envelope formers 107a and 107b, respectively.
The level is converted by the level converters 108a and 108b in accordance with the output value of.

【0060】さらに、レベル変換器108aと108b
の出力は加算器109で加算され出力端子110に歌声
合成出力が得られる。
Further, the level converters 108a and 108b.
Is added by the adder 109 and a singing voice synthesis output is obtained at the output terminal 110.

【0061】以上の動作の一例として、たとえば、図7
の楽譜で示す歌声を合成する場合を説明する。
As an example of the above operation, for example, FIG.
The case of synthesizing the singing voice shown in the score will be described.

【0062】この例の場合、アサイナ104の入力およ
び第1、第2の出力系列の出力は図7のようになる。
In the case of this example, the input of the assigner 104 and the outputs of the first and second output series are as shown in FIG.

【0063】アサイナ104の出力は第1の読み出し器
106aおよび第2の読み出し器106bに与えられ、
第1の読み出し器106aは時間t1から音韻あ(音高ド)
を読み出し、時間t3から音韻た(音高ファ)を読み出す。
同じく第2の読み出し器106bは時間t2から音韻し
(音高ラ)を読み出し、時間t4から音韻の(音高ソ)を読
み出す。
The output of the assigner 104 is given to the first reader 106a and the second reader 106b,
The first reader 106a displays the phoneme from the time t1.
And the phoneme (pitch pitch) is read from time t3.
Similarly, the second reader 106b starts phonologically from time t2.
(Pitch L) is read out, and the phoneme (Pitch S) is read out from time t4.

【0064】また、アサイナ104の出力は第1のエン
ベ形成器107aおよび第2のエンベ形成器107bに
与えられそれぞれ図6のEaおよびEbに示すような波
形エンベロープを発生する。すなわち前後する音韻と音
韻の交替部分で、双方の音韻波形をクロスフェードする
ように波形エンベロープを発生するのである。
The output of the assigner 104 is applied to the first envelope former 107a and the second envelope former 107b to generate the waveform envelopes shown as Ea and Eb in FIG. 6, respectively. That is, a waveform envelope is generated so as to crossfade both phoneme waveforms at the alternate portions of the phonemes and the phonemes that come and go.

【0065】このように形成された波形エンベロープE
aとEbと読み出し器106aの出力Sa、読み出し器
106bの出力Sbがそれぞれレベル変換器108a、
108bに与えられる。
The waveform envelope E formed in this way
a and Eb, the output Sa of the reader 106a, and the output Sb of the reader 106b are the level converters 108a and 108b, respectively.
108b.

【0066】エンベ形成器107aと107bではそれ
ぞれEa×SaとEa×Sbを演算し、エンベ形成器1
07aと107bの出力が加算器109で加算され歌声
合成処理が完了して出力端子110に出力波形が得られ
る。
The envelope formers 107a and 107b calculate Ea × Sa and Ea × Sb, respectively, and the envelope former 1
The outputs of 07a and 107b are added by the adder 109, the singing voice synthesis process is completed, and an output waveform is obtained at the output terminal 110.

【0067】同時に音程差分発生器111は以下のよう
に動作する。アサイナ104の出力を受けて、音程差分
発生器111は図3のように第1および第2の補正出力
を発生する。例えば時間t2で音韻し(音高ラ)の音声を
発音開始するときに、直前で音韻あ(音高ド)の音声を発
音していて、この間に900セントの音高差がある。この
音高差を次第に小さくするために音程差分発生器111
は図3に示すように第1の補正出力を第1の読み出し器
106aに与える。
At the same time, the pitch difference generator 111 operates as follows. Upon receiving the output of the assigner 104, the pitch difference generator 111 generates the first and second correction outputs as shown in FIG. For example, when a phoneme with a phoneme (pitch ra) is started to be produced at time t2, a phoneme with a phoneme a (pitch do) is being pronounced immediately before, and there is a pitch difference of 900 cents between them. To reduce the pitch difference gradually, the pitch difference generator 111
Gives the first correction output to the first reader 106a as shown in FIG.

【0068】前述したように、読み出し器106a,1
06bは、音高指定値と補正値を加算した値を波形デー
タの読み出し速度に反映するので、音韻あは音高ドから
音高ラにしだいに変化することになる。このようにして
直前の音韻の音高から次の音韻の音高になめらかに漸近
することになり前述したクロスフェード処理との相乗作
用により、極めて滑らかに音韻と音韻が接続されて、品
質のよい歌声を合成することができる。
As described above, the readers 106a, 1a
Since 06b reflects the value obtained by adding the specified pitch value and the correction value to the reading speed of the waveform data, the phoneme changes from the pitch do to the pitch la gradually. In this way, the pitch of the immediately preceding phoneme is smoothly approached to the pitch of the next phoneme, and by the synergistic action with the crossfade processing described above, the phonemes and the phonemes are connected very smoothly, and the quality is good. Singing voice can be synthesized.

【0069】以上のように、本実施の形態によれば、予
め複数の音高および音韻の波形データを格納した波形メ
モリ105aと105bを2つの波形読み出し器106
aと106bで交互に読み出し、この読み出し出力をク
ロスフェードするようにエンベロープを発生するエンベ
発生器107aと107bを設けこれにより波形読み出
し器106aと106bの出力をレベル変換して加算
し、さらに前後する音韻の音高が異なる場合には前の音
韻から後ろの音韻に移行する際に前の音韻の音高値をし
だいに後ろの音高値に近づけるように制御する音程差分
値発生器111を設けて、これによって読み出し器10
6aと106bを制御することにより、極めて滑らかに
音韻と音韻が接続することができ、品質のよい歌声を合
成することができる。
As described above, according to the present embodiment, the waveform memories 105a and 105b in which the waveform data of a plurality of pitches and phonemes are stored in advance are provided in the two waveform readers 106.
a and 106b are alternately read, and envelope generators 107a and 107b are provided to generate envelopes so as to cross-fade the read outputs, whereby the outputs of the waveform readers 106a and 106b are level-converted and added, and then forward and backward. When the pitches of the phonemes are different, a pitch difference value generator 111 is provided to control the pitch value of the previous phoneme to gradually approach the pitch value of the back phoneme when transitioning from the previous phoneme to the back phoneme. This allows the reader 10
By controlling 6a and 106b, the phonemes can be connected to each other very smoothly, and a high quality singing voice can be synthesized.

【0070】なお、本実施の形態では、波形メモリ10
5aと105b、読み出し器106aと106b、エン
ベ形成器107aと107b、レベル変換器108aと
108bとしたが、これらを時分割多重処理として単一
のハードで構成可能なことはいうまでもない。
In the present embodiment, the waveform memory 10
Although 5a and 105b, readers 106a and 106b, envelope formers 107a and 107b, and level converters 108a and 108b are used, it goes without saying that these can be configured by a single hardware as time division multiplexing processing.

【0071】また、レベル変換を乗算としたが、例えば
ビットシフト等でもかまわない。 (実施の形態2)つぎに本発明の実施の形態2につい
て、図面を参照しながら説明する。
Further, although the level conversion is multiplication, for example, bit shift or the like may be used. (Second Embodiment) Next, a second embodiment of the present invention will be described with reference to the drawings.

【0072】図8は本発明の実施の形態における音楽再
生装置の構成を示すブロック図である。図8において、
200は演奏データメモリ、201はシーケンサ、20
2は歌声合成装置であり、これは実施の形態1で説明し
たものと同じである。203は楽音合成装置、204は
加算器、205は出力端子、206は移調入力端子、2
07は演奏速度入力端子である。
FIG. 8 is a block diagram showing the structure of the music reproducing apparatus according to the embodiment of the present invention. In FIG.
200 is a performance data memory, 201 is a sequencer, 20
Reference numeral 2 is a singing voice synthesizer, which is the same as that described in the first embodiment. Reference numeral 203 is a musical sound synthesizer, 204 is an adder, 205 is an output terminal, 206 is a transposition input terminal, 2
Reference numeral 07 is a performance speed input terminal.

【0073】以上のように構成された本実施の形態の音
楽再生装置について、以下その動作を説明する。
The operation of the music reproducing apparatus of the present embodiment configured as above will be described below.

【0074】演奏データメモリ200には演奏情報が格
納されている。演奏情報の格納形式は従来例で説明した
とうりであり、ここでは繰り返し説明しない。シーケン
サ201は演奏データメモリ200から演奏情報を読み
出し、歌声の演奏であれば歌声合成装置202に合成す
べき歌声の音韻と音高と音量および発音タイミングから
なる演奏情報を与え、楽器音の演奏であれば楽音合成装
置203に音高と音量および発音タイミングからなる発
音情報を与る。
Performance information is stored in the performance data memory 200. The storage format of the performance information is as described in the conventional example, and will not be described repeatedly here. The sequencer 201 reads the performance information from the performance data memory 200, and in the case of the performance of a singing voice, provides the singing voice synthesizer 202 with the performance information including the phoneme of the singing voice to be synthesized, the pitch, the volume, and the sounding timing. If there is, the musical tone synthesizer 203 is given pronunciation information consisting of the pitch, the volume, and the pronunciation timing.

【0075】歌声合成装置202と楽音合成装置203
の出力は加算器204で加算され出力端子205に歌声
と楽器演奏音が同時に得られる。
Singing voice synthesizer 202 and tone synthesizer 203
Is added by the adder 204, and the singing voice and the musical instrument playing sound are simultaneously obtained at the output terminal 205.

【0076】206は移調指示値の入力端子であり、た
とえば値1が入力されるとシーケンサ201は音高指示
を半音高くして歌声合成装置202および楽音合成装置
203に与える。207は演奏速度指示値の入力端子で
あり、ここに与える値によりシーケンサは演奏速度を速
くまたは遅くする。
Reference numeral 206 denotes a transposition instruction value input terminal. When, for example, a value of 1 is input, the sequencer 201 raises the pitch instruction by a semitone and gives it to the singing voice synthesizer 202 and the musical tone synthesizer 203. Reference numeral 207 is an input terminal for a playing speed instruction value, and the sequencer makes the playing speed faster or slower depending on the value given here.

【0077】本実施の形態では歌声合成装置202に実
施の形態1と同じ構成のものを用いているので、入力端
子206から移調指示があって、シーケンサ201が音
高指示値を変化すると、波形メモリ105a、105b
を読み出すアドレスが変化する。
In this embodiment, since the singing voice synthesizer 202 having the same structure as that of the first embodiment is used, when a transposition instruction is given from the input terminal 206 and the sequencer 201 changes the pitch instruction value, the waveform is changed. Memories 105a, 105b
The address to read is changed.

【0078】しかしこれは、読み出す波形データの品質
を変化させるものではないので、移調する/しないに係
わらず、歌声合成器は劣化するものではない。
However, since this does not change the quality of the waveform data to be read, the singing voice synthesizer does not deteriorate regardless of transposing / not transposing.

【0079】同様に演奏速度指示値が変化しても、読み
出し器106aと106b、エンベ形成器107aと1
07b等に与えるタイミング情報が変化するだけであ
り、移調の場合と同じく読み出す波形データの品質を変
化させるものではないので、移調する/しないに係わら
ず、歌声合成装置は劣化するものではない。
Similarly, even if the performance speed instruction value changes, the reading units 106a and 106b and the envelope forming units 107a and 1
Since the timing information given to 07b and the like only changes and does not change the quality of the waveform data to be read as in the case of transposing, the singing voice synthesizing device does not deteriorate regardless of transposing.

【0080】以上のように、演奏情報が格納されている
演奏データメモリ200と、シーケンサ201と、実施
の形態1による歌声合成装置202と、楽音合成装置2
03とを設けることにより、演奏速度や音程を変化して
も歌声の品質を劣化させることなく音楽を再生すること
ができ、カラオケ等の音楽再生時にキーコンなどの操作
をしても、音楽の品質が劣化しない。
As described above, the performance data memory 200 storing the performance information, the sequencer 201, the singing voice synthesizer 202 according to the first embodiment, and the musical sound synthesizer 2
By providing 03, it is possible to play music without degrading the quality of the singing voice even if the playing speed or the pitch are changed, and even if a key console or the like is operated during music playback such as karaoke, the quality of the music can be improved. Does not deteriorate.

【0081】[0081]

【発明の効果】以上のように本発明によれば、音韻と音
高と音量および発音タイミングからなる演奏情報を第1
および第2の出力系列に交互に出力するアサイナと、ア
サイナの第1および第2の出力系列によっ音高と発音タ
イミングを指示されて第1および第2の出力にそれぞれ
第1および第2の音程変化値を出力する音程差分発生器
と、アサイナの第1および第2の出力系列によってそれ
ぞれ音高と音韻と発音タイミングを指示されかつ音程差
分発生器の第1および第2の出力によってそれぞれ音程
変化値を指示される第1および第2の読み出し器と、ア
サイナの第1および第2の出力系列によってそれぞれ音
量と発音タイミングを指示され波形包絡データを生成す
る第1および第2のエンベ形成器と、予め複数の音韻お
よび音高の音声波形を記憶していてそれぞれ第1および
第2の読み出し器によってデータが読み出される第1お
よび第2の波形メモリと、第1および第2の読み出し器
の出力をそれぞれ第1および第2のエンベ形成器の出力
でレベル変換する第1および第2のレベル変換器と、第
1および第2のレベル変換器の出力を加算する加算器と
を備ることにより、指定された音韻/音高の音声波形
を、音韻毎に交互に個別に読み出し器で読み出し、クロ
スフェードしながら滑らかに出力する。クロスフェード
部以外は原音PCMそのままなので品質の高い歌声が合
成でき、さらに前の音韻と後ろの音韻で音高差がある場
合にはクロスフェード時に前の音韻の音高を次第に後ろ
の音高に漸近させるので音高の変化が滑らかになり、自
然な歌声を合成することができる。
As described above, according to the present invention, the performance information consisting of the phoneme, the pitch, the volume, and the sounding timing is first set.
And a second output sequence for alternately outputting the pitch, and the first and second output sequences of the assigner to instruct the pitch and sounding timing to output the first and second outputs respectively. A pitch difference generator that outputs a pitch change value and a pitch and a phoneme and a pronunciation timing are respectively instructed by the first and second output sequences of the assigner, and the pitch is generated by the first and second outputs of the pitch difference generator, respectively. First and second readers for which change values are instructed, and first and second envelope formers for generating waveform envelope data in which volume and sound generation timing are instructed by the first and second output sequences of the assigner, respectively. And a first and second waveform memory in which voice waveforms of a plurality of phonemes and pitches are stored in advance and data is read by the first and second readers, respectively. And first and second level converters for level converting the outputs of the first and second readers with the outputs of the first and second envelope formers, respectively, and the first and second level converters. By adding an adder for adding the outputs of the above, the phoneme waveform of the designated phoneme / pitch is alternately read out by the reader for each phoneme alternately and smoothly output while crossfading. Except for the crossfade part, the original PCM is the same as it is, so a high quality singing voice can be synthesized, and if there is a pitch difference between the front phoneme and the back phoneme, the pitch of the front phoneme is gradually changed to the back pitch during the crossfade. Since the pitch is made asymptotic, the pitch change becomes smooth and a natural singing voice can be synthesized.

【0082】また、楽器および歌唱の演奏情報を記憶し
ている演奏データメモリと、演奏データメモリから読み
だした演奏情報と移調入力および演奏速度入力に応じて
タイミングを制御しながら演奏指示情報を出力するシー
ケンサと、シーケンサの演奏指示に従って楽音を合成す
る楽音合成装置と、シーケンサの演奏指示に従って歌声
を合成する歌声合成装置と、楽音合成装置の出力と歌声
合成装置の出力を加算する加算器とを備ることにより、
演奏する音程や速度を変化させた時も品質の高い歌声付
きの音楽再生ができ、これをシンセカラオケの音楽再生
装置に適用することにより、演奏速度や音程が変化して
もバックコーラスの品質が低下しないシンセカラオケを
提供でき、その実用上優れた効果を有するものである。
Also, performance data memory storing performance information of musical instruments and singing, performance information read from the performance data memory, and performance instruction information is output while controlling timing according to transposition input and performance speed input. A sequencer, a tone synthesizer that synthesizes musical tones according to the performance instructions of the sequencer, a singing voice synthesizer that synthesizes singing voices according to the performance instructions of the sequencer, and an adder that adds the output of the tone synthesizer and the output of the singing voice synthesizer. By having
Even when the pitch or speed of the performance is changed, high-quality music with a singing voice can be reproduced.By applying this to a music playback device for synth karaoke, the quality of the back chorus can be improved even if the performance speed or pitch changes. It is possible to provide a synth karaoke that does not deteriorate and has an excellent effect in practical use.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態1における歌声合成装置の
構成を示すブロック図
FIG. 1 is a block diagram showing the configuration of a singing voice synthesizing device according to a first embodiment of the present invention.

【図2】同実施の形態における読み出し器の動作および
構成を示す説明図
FIG. 2 is an explanatory diagram showing an operation and a configuration of a reader according to the same embodiment.

【図3】同実施の形態における音程差分発生器の動作を
説明する説明図
FIG. 3 is an explanatory diagram illustrating an operation of the pitch difference generator according to the same embodiment.

【図4】同実施の形態における波形メモリのデータ格納
状態の説明図
FIG. 4 is an explanatory diagram of a data storage state of the waveform memory in the same embodiment.

【図5】同実施の形態における波形メモリのループ読み
出しの説明図
FIG. 5 is an explanatory diagram of loop reading of the waveform memory according to the same embodiment.

【図6】同実施の形態における歌声合成のクロスフェー
ド処理の説明図
FIG. 6 is an explanatory diagram of a crossfade process for singing voice synthesis in the same embodiment.

【図7】同実施の形態におけるアサイナの動作説明図FIG. 7 is an operation explanatory view of the assigner according to the same embodiment.

【図8】本発明の実施の形態2における音楽再生装置の
構成を示すブロック図
FIG. 8 is a block diagram showing a configuration of a music reproducing device according to a second embodiment of the present invention.

【符号の説明】 104 アサイナ 105a、105b 波形メモリ 106a、106b 読み出し器 107a、107b エンベ形成器 108a、108b レベル変換器 109 加算器 111 音程差分発生器 200 演奏データメモリ 201 シーケンサ 202 歌声合成装置 203 楽音合成装置 204 加算器[Description of Reference Signs] 104 Assigner 105a, 105b Waveform memory 106a, 106b Reader 107a, 107b Envelope generator 108a, 108b Level converter 109 Adder 111 Pitch difference generator 200 Performance data memory 201 Sequencer 202 Singing voice synthesizer 203 Musical sound synthesis Device 204 Adder

Claims (4)

【特許請求の範囲】[Claims] 【請求項1】 入力された音韻と音高と音量および発音
タイミングからなる演奏情報を第1および第2の出力系
列に交互に出力するアサイナと、前記アサイナの第1お
よび第2の出力系列によってそれぞれ音高と音韻と発音
タイミングを指示される第1および第2の読み出し器
と、前記アサイナの第1および第2の出力系列によって
それぞれ音量と発音タイミングを指示され波形包絡デー
タを生成する第1および第2のエンベ形成器と、予め複
数の音韻および音高の音声波形を記憶していてそれぞれ
第1および第2の前記読み出し器によってデータが読み
出される第1および第2の波形メモリと、前記第1およ
び第2の読み出し器の出力をそれぞれ前記第1および第
2のエンベ形成器の出力でレベル変換する第1および第
2のレベル変換器と、前記第1および第2のレベル変換
器の出力を加算する加算器とを備えた歌声合成装置。
1. An assigner which alternately outputs performance information consisting of an input phoneme, pitch, volume and sounding timing to first and second output series, and first and second output series of the assigner. First and second readers for which a pitch, a phoneme, and a sounding timing are respectively instructed, and a volume and a sounding timing are instructed by the first and second output sequences of the assigner, respectively, and first waveform envelope data is generated. And a second envelope former, first and second waveform memories for preliminarily storing speech waveforms of a plurality of phonemes and pitches, from which data is read by the first and second readers, respectively. First and second level converters for level converting the outputs of the first and second readers with the outputs of the first and second envelope formers, respectively; A singing voice synthesizing apparatus comprising: an adder that adds outputs of the first and second level converters.
【請求項2】 入力された音韻と音高と音量および発音
タイミングからなる演奏情報を第1および第2の出力系
列に交互に出力するアサイナと、前記アサイナの第1お
よび第2の出力系列によって音高と発音タイミングを指
示されて第1および第2の出力にそれぞれ第1および第
2の音程変化値を出力する音程差分発生器と、前記アサ
イナの第1および第2の出力系列によってそれぞれ音高
と音韻と発音タイミングを指示され、かつ前記音程差分
発生器の第1および第2の出力によってそれぞれ音程変
化値を指示される第1および第2の読み出し器と、前記
アサイナの第1および第2の出力系列によってそれぞれ
音量と発音タイミングを指示され波形包絡データを生成
する第1および第2のエンベ形成器と、予め複数の音韻
および音高の音声波形を記憶していてそれぞれ第1およ
び第2の前記読み出し器によってデータが読み出される
第1および第2の波形メモリと、前記第1および第2の
読み出し器の出力をそれぞれ前記第1および第2のエン
ベ形成器の出力でレベル変換する第1および第2のレベ
ル変換器と、前記第1および第2のレベル変換器の出力
を加算する加算器とを備えた歌声合成装置。
2. An assigner which alternately outputs performance information consisting of an input phoneme, pitch, volume and sounding timing to a first and a second output sequence, and a first and a second output sequence of the assigner. The pitch difference generator that outputs the first and second pitch change values to the first and second outputs, respectively, in response to the pitch and the sounding timing, and the first and second output sequences of the assigner, respectively. First and second readers which are instructed of pitch, phoneme and pronunciation timing, and instructed by the first and second outputs of the interval difference generator, respectively, and first and second of the assigner. Volumes and sounding timings are respectively instructed by two output sequences, first and second envelope formers for generating waveform envelope data, and speech waves having a plurality of phonemes and pitches in advance. A first and a second waveform memory for storing a shape and data being read by the first and second readers respectively; and outputs of the first and second readers respectively for the first and second readers. 1. A singing voice synthesizing device comprising: first and second level converters for level conversion with the output of the envelope former; and adder for adding outputs of the first and second level converters.
【請求項3】 楽器および歌唱の演奏情報を記憶してい
る演奏データメモリと、前記演奏データメモリから読み
だした演奏情報と移調入力および演奏速度入力に応じて
タイミングを制御しながら演奏指示情報を出力するシー
ケンサと、前記シーケンサの演奏指示に従って楽音を合
成する楽音合成装置と、前記シーケンサの演奏指示に従
って歌声を合成する歌声合成装置と、前記楽音合成装置
の出力と前記歌声合成装置の出力を加算する加算器を備
えた音楽再生装置。
3. Performance data memory storing performance information of musical instruments and singing, performance information read from the performance data memory and performance instruction information while controlling timing according to transposition input and performance speed input. A sequencer for outputting, a musical tone synthesizer for synthesizing musical tones according to performance instructions of the sequencer, a singing voice synthesizer for synthesizing singing voices according to performance instructions of the sequencer, an output of the musical tone synthesizer and an output of the singing voice synthesizer are added. Music playback device equipped with an adder that
【請求項4】 歌声合成装置は、請求項1または2に記
載の構成であることを特徴とする請求項3に記載の音楽
再生装置。
4. The music reproducing apparatus according to claim 3, wherein the singing voice synthesizing apparatus has the configuration according to claim 1 or 2.
JP7292403A 1995-11-10 1995-11-10 Singing voice synthesizer and musical tone reproducing device Pending JPH09134188A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7292403A JPH09134188A (en) 1995-11-10 1995-11-10 Singing voice synthesizer and musical tone reproducing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7292403A JPH09134188A (en) 1995-11-10 1995-11-10 Singing voice synthesizer and musical tone reproducing device

Publications (1)

Publication Number Publication Date
JPH09134188A true JPH09134188A (en) 1997-05-20

Family

ID=17781339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7292403A Pending JPH09134188A (en) 1995-11-10 1995-11-10 Singing voice synthesizer and musical tone reproducing device

Country Status (1)

Country Link
JP (1) JPH09134188A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005037848A (en) * 2003-07-18 2005-02-10 Crimson Technology Inc Musical sound generator and its program
US7764800B2 (en) 2000-07-07 2010-07-27 Yamaha Hatsudoki Kabushiki Kaisha Vehicle sound synthesizer
JP2015072432A (en) * 2013-10-04 2015-04-16 ブラザー工業株式会社 Karaoke device and program
CN109559718A (en) * 2017-09-27 2019-04-02 卡西欧计算机株式会社 The tone generation method and storage medium of electronic musical instrument, electronic musical instrument
CN112992109A (en) * 2019-12-16 2021-06-18 宏正自动科技股份有限公司 Auxiliary singing system, auxiliary singing method and non-instantaneous computer readable recording medium
CN113035164A (en) * 2021-02-24 2021-06-25 腾讯音乐娱乐科技(深圳)有限公司 Singing voice generation method and device, electronic equipment and storage medium

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7764800B2 (en) 2000-07-07 2010-07-27 Yamaha Hatsudoki Kabushiki Kaisha Vehicle sound synthesizer
JP2005037848A (en) * 2003-07-18 2005-02-10 Crimson Technology Inc Musical sound generator and its program
JP2015072432A (en) * 2013-10-04 2015-04-16 ブラザー工業株式会社 Karaoke device and program
CN109559718A (en) * 2017-09-27 2019-04-02 卡西欧计算机株式会社 The tone generation method and storage medium of electronic musical instrument, electronic musical instrument
CN109559718B (en) * 2017-09-27 2023-06-20 卡西欧计算机株式会社 Electronic musical instrument, musical tone generating method for electronic musical instrument, and storage medium
CN112992109A (en) * 2019-12-16 2021-06-18 宏正自动科技股份有限公司 Auxiliary singing system, auxiliary singing method and non-instantaneous computer readable recording medium
CN112992109B (en) * 2019-12-16 2023-11-28 宏正自动科技股份有限公司 Auxiliary singing system, auxiliary singing method and non-transient computer readable recording medium
CN113035164A (en) * 2021-02-24 2021-06-25 腾讯音乐娱乐科技(深圳)有限公司 Singing voice generation method and device, electronic equipment and storage medium

Similar Documents

Publication Publication Date Title
JP2921428B2 (en) Karaoke equipment
JP3319211B2 (en) Karaoke device with voice conversion function
JP2838977B2 (en) Karaoke equipment
JP3324158B2 (en) Karaoke equipment
JP2947032B2 (en) Karaoke equipment
JPH09134188A (en) Singing voice synthesizer and musical tone reproducing device
JPH11126083A (en) Karaoke reproducer
JPH11282483A (en) Karaoke device
JP3141574B2 (en) Automatic performance device
JPH10268895A (en) Voice signal processing device
JP4081859B2 (en) Singing voice generator and karaoke device
JP2002372981A (en) Karaoke system with voice converting function
JP5106437B2 (en) Karaoke apparatus, control method therefor, and control program therefor
JPH08254985A (en) Music reproduction controller and music reproducing device
JP3903492B2 (en) Karaoke equipment
JP3552675B2 (en) Waveform generation method and apparatus
JP2904045B2 (en) Karaoke equipment
JP3178694B2 (en) Karaoke equipment
JP2002221978A (en) Vocal data forming device, vocal data forming method and singing tone synthesizer
JP3613191B2 (en) Waveform generation method and apparatus
JP3551441B2 (en) Karaoke equipment
JP2000122672A (en) Karaoke (sing-along music) device
JP3552676B2 (en) Waveform generation method and apparatus
JP3876896B2 (en) Waveform generation method and apparatus
JP2002221971A (en) Karaoke device