JPH0895588A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH0895588A
JPH0895588A JP6257521A JP25752194A JPH0895588A JP H0895588 A JPH0895588 A JP H0895588A JP 6257521 A JP6257521 A JP 6257521A JP 25752194 A JP25752194 A JP 25752194A JP H0895588 A JPH0895588 A JP H0895588A
Authority
JP
Japan
Prior art keywords
information
pronunciation
pitch
sound
syllable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP6257521A
Other languages
English (en)
Inventor
Toshio Kuroiwa
俊夫 黒岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP6257521A priority Critical patent/JPH0895588A/ja
Publication of JPH0895588A publication Critical patent/JPH0895588A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 スラーのような様々な歌唱方法を簡単に実現
する。また、肉声の個人差毎に音素片や音響パラメータ
を用意することなく音色を簡単に変更する。 【構成】 演奏情報記憶手段1には音色制御情報と、発
音開始時刻、音高及び音量を1組とする発音開始情報
と、音節の文字情報と、発音終了時刻、音高及び音量を
1組とする発音終了情報の各情報を1以上組み合わされ
て1以上の音節の情報として記憶される。音源3は文字
情報が示す音節の音を発音開始情報が示す発音開始時
刻、音高及び音量で出力を開始し、発音終了情報が示す
発音終了時刻、音高及び音量で出力を終了する。音響パ
ラメータ読み出し/変更手段5は音響パラメータ/無声
音記憶手段4の音響パラメータを音色制御情報に応じた
係数によりシフトし、合成フィルタ6はこの音響パラメ
ータによって音源3の波形に加工する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、歌唱を行う音声合成装
置に関し、特に肉声を合成する場合に好適な音声合成装
置に関する。
【0002】
【従来の技術】従来、歌唱を行う音声合成装置では、歌
詞情報の1音節に対して1組の音高、音量、音長のパラ
メータを生成するように構成されている。また、従来の
規則合成方式においてはメモリに予め記憶されている音
素片又は音響パラメータにより音声を合成するように構
成されている。また、実音声から音源のピッチ情報と声
道の音響パラメータを分離することにより音声を合成し
ている。
【0003】なお、歌唱を行う音声合成装置としては例
えば特開平2−27397号公報に示されるように、楽
譜に記載された歌詞、音譜、音楽記号を入力し、歌詞に
基づいて音韻パラメータを生成するとともに音譜及び音
楽記号に基づいて韻律パラメータを生成し、音韻パラメ
ータ及び韻律パラメータに基づいて合成音を発生する方
法が知られている。
【0004】
【発明が解決しようとする課題】しかしながら、従来の
音声合成装置では、1音節に対して1音高(音程)が割
り当てられているので、音節の母音を保ったまま音高を
変えるような、頻繁に用いられるスラー歌唱法を再現す
ることが困難であり、また、これを実現するためには母
音の連続性を示す特殊な記号が必要になるという問題点
がある。なお、スラーを実現する方法として、例えば特
開平4−331990号公報に示されるように音声信号
のピッチを連続的に変化させる方法が提案されている
が、この方法では制御が複雑になる。
【0005】また、肉声の個人差(男性、女性等)を再
現するためには、この個人差毎に予め音素片や音響パラ
メータを容易しなければならず、効率的でなくなる。ま
た、実音声から音源のピッチ情報と声道の音響パラメー
タを分離する方法は完全ではなく、特に無声音の再現性
が低いという問題点がある。
【0006】本発明は上記従来の問題点に鑑み、スラー
のような様々の歌唱方法を簡単に実現することができる
音声合成装置を提供することを目的とする。本発明はま
た、肉声の個人差毎に音素片や音響パラメータを用意す
ることなく音色を簡単に変更することができる音声合成
装置を提供することを目的とする。
【0007】
【課題を解決するための手段】本発明は上記目的を達成
するために、発音開始から発音終了までの発音時間、音
高(音程)及び音量を示す発音情報と、音節の文字情報
の各情報を1以上組み合わせて1以上の音節の情報とし
て記憶し、文字情報が示す音節の音を発音情報が示す発
音時間、音高及び音量で出力を開始し、発音情報が示す
発音時間、音高及び音量で出力を終了するようにしたも
のである。すなわち本発明によれば、発音開始から発音
終了までの発音時間、音高及び音量を示す発音情報と、
音節の文字情報の各情報を1以上組み合わせて1以上の
音節の情報として記憶する演奏情報記憶手段と、前記演
奏情報記憶手段に記憶された各情報を読み出して分離す
る読み出し分離手段と、前記読み出し分離手段により分
離された情報毎に、文字情報が示す音節の音を発音情報
が示す発音時間、音高及び音量で出力を開始し、発音情
報が示す発音時間、音高及び音量で出力を終了する音源
とを有する音声合成装置が提供される。
【0008】本発明はまた、1つの音節の情報として音
色制御情報を記憶し、文字情報に対応する音響パラメー
タを音色制御情報に基づいて変更して音源が発生する音
色を変更するようにしたものである。すなわち本発明に
よれば、音色制御情報と、発音開始から発音終了までの
発音時間、音高及び音量を示す発音情報と、音節の文字
情報の各情報を1以上組み合わせて1以上の音節の情報
として記憶する演奏情報記憶手段と、前記演奏情報記憶
手段に記憶された各情報を読み出して分離する読み出し
分離手段と、前記読み出し分離手段により分離された情
報毎に、文字情報が示す音節の音を発音情報が示す発音
時間、音高及び音量で出力を開始し、発音情報が示す発
音時間、音高及び音量で出力を終了する音源と、音節を
表す文字毎に音響パラメータを記憶する音響パラメータ
記憶手段と、前記読み出し分離手段により分離された文
字情報に対応する音響パラメータを前記音響パラメータ
記憶手段から読み出し、前記読み出し分離手段により分
離された音色制御情報に基づいて変更する音響パラメー
タ変更手段と、前記音源が発生する音色を前記音響パラ
メータ変更手段により変更された音響パラメータで変更
する音色変更手段とを有する音声合成装置が提供され
る。
【0009】
【作用】本発明では、発音開始から発音終了までの発音
時間、音高及び音量を示す発音情報と、音節の文字情報
の各情報を1以上組み合わせて1以上の音節の情報とし
て記憶し、文字情報が示す音節の音を発音情報が示す発
音時間、音高及び音量で出力を開始し、発音情報が示す
発音時間、音高及び音量で出力を終了するようにしたの
で、例えば図3に示すように1つの音節に対して発音開
始時刻及び発音終了時刻と音高が異なる複数の発音情報
を対応させることによりスラーを実現することができ
る。また、例えば図7に示すように1つの音節に対して
発音開始時刻及び発音終了時刻が同一であり且つ音高が
異なる複数の発音情報を対応させることによりコーラス
を実現することができる。さらに、例えば図4に示すよ
うに1つの発音情報に対して複数の文字情報を対応さ
せ、文字毎に音響パラメータを変更することにより1音
を口の形を変えながら引き延ばすような歌唱を実現する
ことができ、また、1つの音節に対して発音開始時刻及
び発音終了時刻が同一であり且つ音高が異なる複数の発
音情報と、複数の異なる音色制御情報を対応させること
により音色が異なるコーラスを実現することができる。
【0010】本発明ではまた、1つの音節の情報として
音色制御情報を記憶し、文字情報に対応する音響パラメ
ータを音色制御情報に基づいて変更して音源が発生する
音色を変更するので、肉声の個人差毎に音素片や音響パ
ラメータを用意することなく音色を簡単に変更すること
ができる。
【0011】
【実施例】以下、図面を参照して本発明の実施例につい
て説明する。図1は本発明に係る音声合成装置の一実施
例を示すブロック図、図2は演奏情報の基本フォーマッ
トを示す説明図、図3はスラーを実現するための演奏情
報の一例を示す説明図、図4は1音を延ばす歌唱を実現
するための演奏情報の一例を示す説明図、図5は音色制
御イベントを示す説明図、図6は音色を指定した演奏情
報の一例を示す説明図、図7はコーラスを実現するため
の演奏情報の一例を示す説明図である。
【0012】本実施例では、電子楽器間の演奏情報交換
に通常用いられるMIDI及びMIDIデータを保存す
るために通常用いられるSMFのデータ記述を例にして
説明する。SMFはイベントとイベントの間の時間を記
述し、イベントはMIDIに関するイベントと、MID
I以外のイベント(メタイベント)が区別可能に記述さ
れる。主たるMIDIイベントは発音開始イベントとイ
ベント発音終了イベントであり、これらのイベントは
「ド」、「レ」、「ミ」のような音高と「0」〜「1
0」のような音量を含む。通常のMIDI対応の電子楽
器はこれらのイベントにより演奏可能である。
【0013】図1に示す演奏情報記憶手段1には、基本
フォーマットとして図2に示すように上記MIDIイベ
ントの発音開始イベントと音節イベント発音終了イベン
トの間にメタイベントとして「め」、「だ」、「か」の
ような各音節イベントが挿入されて記憶される。ここ
で、図2ではイベント間の時間が発音開始時刻と発音終
了時刻で記憶されているが、発音開始から発音終了まで
の発音時間でもよい。また、図2においてビブラート等
の表現を加えることも可能である。演奏情報記憶手段1
に記憶された演奏情報は、演奏情報読み出し/分離手段
2により読み出されて各イベントに分離される。
【0014】音源3には実音声から線型予測分析によっ
て、声道の音響特性であるスペクトル包絡を除いた予測
残差波形の1周期が記憶され、この波形は声帯の振動波
形と等価である。この波形と演奏情報読み出し/分離手
段2により読み出されて分離された各イベントの発音情
報10に基づいて音節が音高、音量で発音される。
【0015】音響パラメータ/無声音波形記憶手段4に
は予め、1音節に対する音響パラメータとして実音声を
線型予測分析し、声道の共振点の周波数とそのバンド
幅、又は線スペクトル対がホルマント情報として記憶さ
れる。ここで、共振点は複数箇所存在し、発声の開始か
らの時間に応じて周波数が変化するので2次元的なデー
タ配列となる。
【0016】例えば音響パラメータ/無声音波形記憶手
段4には主要な5つの共振点について発声開始から10
ms毎の50組の線スペクトル対周波数等が音節に対応
するように記憶されている。音響パラメータ/無声音波
形記憶手段4にはまた、無声音を含む音節に対して、実
音声から無声音部分のみが検出され、波形として記憶さ
れる。この場合、情報量を低減するためにADPCM等
の波形符号化を行って圧縮して記憶してもよい。
【0017】音響パラメータ読み出し/変更手段5は、
読み出し/分離手段2から音節情報9を受け取るとこれ
に対応する音響パラメータと無声音の波形データを音響
パラメータ/無声音波形記憶手段4から読み出し、音響
パラメータを合成フィルタ6に、また、無声音の波形デ
ータ12をゲインコントローラ7に送る。なお、音節の
接続部の音響パラメータの不連続性を解消するために、
演奏情報読み出し/分離手段2において発音すべき音節
を指定すると共に次に発音すべき音節を指定し、音響パ
ラメータ/無声音波形記憶手段4から音響パラメータを
同時に読み出し、音節の接続点において音響パラメータ
を平均化することにより2音節を滑らかに接続するよう
に構成してもよい。
【0018】合成フィルタ6は時間的に推移する音響パ
ラメータに対応した伝達関数を有するデジタルフィルタ
であり、声道の変化による音響特性の変化を音源波形
(声帯波形)14に加える。この合成フィルタ6の出力
13は無声音12と共にゲインコントローラ7に印加さ
れ、無声音が読み出されている区間に対して有声音の音
量が調整される。次いでD/A変換器8によりアナログ
音声信号に変換された後、スピーカSPにより肉声とし
て再生される。
【0019】図3は音高が異なる連続する各音譜を切れ
目なく滑らかに奏するいわゆるスラーを実現するために
一例として「からす」の演奏情報を示している。この場
合、「か」の音節は「ミ」から「レ」に変化し、「ら」
の音節は「レ」→「ド」→「レ」のように変化する。こ
の場合には図3に示すように変化毎に発音開始と発音終
了の各イベント情報を演奏情報記憶手段1に記憶するこ
とにより、特殊なスラーコードを用いることなくスラー
を実現することができる。
【0020】図4は「アーウー」のように1音を引き延
ばしながら言葉を伝える歌唱法を実現する場合の演奏情
報を示している。この場合には1音毎にイベント発音開
始、終了イベントを設けず、1音毎に音響パラメータの
みを変化させることにより実際の発声形態に近い高品位
の合成音を実現することができる。
【0021】次に、図5〜図7を参照して音色を制御す
る場合について説明する。先ず、音色制御イベントをメ
タイベントとして定義し、図5に示すように音色制御イ
ベントとして制御タイプと制御パラメータを定義する。
一例として制御タイプは声質とコーラスに分類され、制
御パラメータは声質として男声1、男声2、女声1、女
声2が、また、コーラスとして1人、2人、3人のよう
に分類される。
【0022】そして、例えば「男声2」で「めだか」を
合成する場合には図6に示すように音色制御イベントと
して「声質」、「男声2」が演奏情報記憶手段1に記憶
される。すなわち、この音声情報は図1に示す基本フォ
ーマットに対して音色制御イベントを加えただけであ
る。この音色制御イベント11は読み出し/分離手段2
により分離されて音源3と読み出し/音響パラメータ変
更手段5に印加される。ここで、男性と女性の音質の差
の原因として、声帯の構造的な違いによる声帯振動波形
の差と音響パラメータの違いを挙げることができる。音
響パラメータは声道の音響的な共振点群を表し、男性と
女性を比較すると主要な共振点は音節にかかわらず周波
数において比例的に推移しているという特質を有する。
【0023】そこで、音色制御イベントとして「男声
2」が指定されると、音源3では「男声2」により表さ
れるべき実音声から得られた基本の音源波形14に切り
替えられる。また、実音声から分析された音響パラメー
タと、音響パラメータ/無声音波形記憶手段4に記憶さ
れている音響パラメータとの比較から得られた係数を予
め読み出し/音響パラメータ変更手段5に記憶し、音響
パラメータ/無声音波形記憶手段4から読み出された音
響パラメータをこの係数によりシフトする。そして、こ
の変更された音響パラメータと「男声2」の基本の音源
を合成フィルタ6により合成することにより目的の「男
声2」が得られる。
【0024】また、和声コーラスは、図7に示すように
同一時刻において発音開始イベントと音節イベント発音
終了イベントを指定して同一の音節を指定し、既知の信
号処理により複音感を得ることができる。また、図7に
おいてイベント毎に音色制御イベントを追加することに
より音色が異なるコーラスを実現することができる。
【0025】
【発明の効果】以上説明したように本発明によれば、発
音開始から発音終了までの発音時間、音高及び音量を示
す発音情報と、音節の文字情報の各情報を1以上組み合
わせて1以上の音節の情報として記憶し、文字情報が示
す音節の音を発音情報が示す発音時間、音高及び音量で
出力を開始し、発音情報が示す発音時間、音高及び音量
で出力を終了するようにしたので、例えば図3に示すよ
うに1つの音節に対して発音開始時刻及び発音終了時刻
と音高が異なる複数の発音情報を対応させることにより
スラーを実現することができる。また、例えば図7に示
すように1つの音節に対して発音開始時刻及び発音終了
時刻が同一であり且つ音高が異なる複数の発音情報を対
応させることによりコーラスを実現することができる。
さらに、例えば図4に示すように1つの発音情報に対し
て複数の文字情報を対応させ、文字毎に音響パラメータ
を変更することにより1音を引き延ばすような歌唱を実
現することができる。
【0026】また、本発明によれば、1つの音節の情報
として音色制御情報を記憶し、文字情報に対応する音響
パラメータを音色制御情報に基づいて変更して音源が発
生する音色を変更するので、肉声の個人差毎に音素片や
音響パラメータを容易することなく音色を簡単に変更す
ることができる。また、1つの音節に対して発音開始時
刻及び発音終了時刻が同一であり且つ音高が異なる複数
の発音情報と、複数の異なる音色制御情報を対応させる
ことにより音色が異なるコーラスを実現することができ
る。
【図面の簡単な説明】
【図1】本発明に係る音声合成装置の一実施例を示すブ
ロック図である。
【図2】演奏情報の基本フォーマットを示す説明図であ
る。
【図3】スラーを実現するための演奏情報の一例を示す
説明図である。
【図4】1音を延ばす歌唱を実現するための演奏情報の
一例を示す説明図である。
【図5】音色制御イベントを示す説明図である。
【図6】音色を指定した演奏情報の一例を示す説明図で
ある。
【図7】コーラスを実現するための演奏情報の一例を示
す説明図である。
【符号の説明】
1 演奏情報記憶手段 2 演奏情報読み出し/分離手段(読み出し/分離手
段) 3 音源 4 音響パラメータ/無声音記憶手段(音響パラメータ
記憶手段) 5 音響パラメータ読み出し/変更手段(音響パラメー
タ変更手段) 6 合成フィルタ(音色変更手段) 7 ゲインコントローラ 8 D/A変換器 SP スピーカ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 発音開始から発音終了までの発音時間、
    音高及び音量を示す発音情報と、音節の文字情報の各情
    報を1以上組み合わせて1以上の音節の情報として記憶
    する演奏情報記憶手段と、 前記演奏情報記憶手段に記憶された各情報を読み出して
    分離する読み出し分離手段と、 前記読み出し分離手段により分離された情報毎に、文字
    情報が示す音節の音を発音情報が示す発音時間、音高及
    び音量で出力を開始し、発音情報が示す発音時間、音高
    及び音量で出力を終了する音源と、 を有する音声合成装置。
  2. 【請求項2】 音色制御情報と、発音開始から発音終了
    までの発音時間、音高及び音量を示す発音情報と、音節
    の文字情報の各情報を1以上組み合わせて1以上の音節
    の情報として記憶する演奏情報記憶手段と、 前記演奏情報記憶手段に記憶された各情報を読み出して
    分離する読み出し分離手段と、 前記読み出し分離手段により分離された情報毎に、文字
    情報が示す音節の音を発音情報が示す発音時間、音高及
    び音量で出力を開始し、発音情報が示す発音時間、音高
    及び音量で出力を終了する音源と、 音節を表す文字毎に音響パラメータを記憶する音響パラ
    メータ記憶手段と、 前記読み出し分離手段により分離された文字情報に対応
    する音響パラメータを前記音響パラメータ記憶手段から
    読み出し、前記読み出し分離手段により分離された音色
    制御情報に基づいて変更する音響パラメータ変更手段
    と、 前記音源が発生する音色を前記音響パラメータ変更手段
    により変更された音響パラメータで変更する音色変更手
    段と、 を有する音声合成装置。
JP6257521A 1994-09-27 1994-09-27 音声合成装置 Withdrawn JPH0895588A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6257521A JPH0895588A (ja) 1994-09-27 1994-09-27 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6257521A JPH0895588A (ja) 1994-09-27 1994-09-27 音声合成装置

Publications (1)

Publication Number Publication Date
JPH0895588A true JPH0895588A (ja) 1996-04-12

Family

ID=17307459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6257521A Withdrawn JPH0895588A (ja) 1994-09-27 1994-09-27 音声合成装置

Country Status (1)

Country Link
JP (1) JPH0895588A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1031496A (ja) * 1996-07-15 1998-02-03 Casio Comput Co Ltd 楽音発生装置
JP2009075611A (ja) * 2008-12-08 2009-04-09 Yamaha Corp 合唱合成装置、合唱合成方法およびプログラム
JP2009288615A (ja) * 2008-05-30 2009-12-10 Yamaha Corp 歌唱合成装置およびプログラム
WO2016152715A1 (ja) * 2015-03-20 2016-09-29 ヤマハ株式会社 音制御装置、音制御方法、および音制御プログラム
CN113016028A (zh) * 2018-11-06 2021-06-22 雅马哈株式会社 音响处理方法及音响处理系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1031496A (ja) * 1996-07-15 1998-02-03 Casio Comput Co Ltd 楽音発生装置
JP2009288615A (ja) * 2008-05-30 2009-12-10 Yamaha Corp 歌唱合成装置およびプログラム
JP2009075611A (ja) * 2008-12-08 2009-04-09 Yamaha Corp 合唱合成装置、合唱合成方法およびプログラム
WO2016152715A1 (ja) * 2015-03-20 2016-09-29 ヤマハ株式会社 音制御装置、音制御方法、および音制御プログラム
US10354629B2 (en) 2015-03-20 2019-07-16 Yamaha Corporation Sound control device, sound control method, and sound control program
CN113016028A (zh) * 2018-11-06 2021-06-22 雅马哈株式会社 音响处理方法及音响处理系统

Similar Documents

Publication Publication Date Title
CN110390923B (zh) 电子乐器、电子乐器的控制方法以及存储介质
CN110390922B (zh) 电子乐器、电子乐器的控制方法以及存储介质
JP3333022B2 (ja) 歌声合成装置
US5704007A (en) Utilization of multiple voice sources in a speech synthesizer
JP3144273B2 (ja) 自動歌唱装置
CN110634460A (zh) 电子乐器、电子乐器的控制方法以及存储介质
CN110634464A (zh) 电子乐器、电子乐器的控制方法以及存储介质
CN110634461A (zh) 电子乐器、电子乐器的控制方法以及存储介质
JP7476934B2 (ja) 電子楽器、電子楽器の制御方法、及びプログラム
JP2564641B2 (ja) 音声合成装置
JP5360489B2 (ja) 音素符号変換装置および音声合成装置
JP5560769B2 (ja) 音素符号変換装置および音声合成装置
JP3521711B2 (ja) カラオケ再生装置
JP2023100776A (ja) 電子楽器、電子楽器の制御方法、及びプログラム
JPH0895588A (ja) 音声合成装置
JP3307283B2 (ja) 歌唱音合成装置
JP3233036B2 (ja) 歌唱音合成装置
JPH04146473A (ja) 電子音声楽器
JP5106437B2 (ja) カラオケ装置及びその制御方法並びにその制御プログラム
WO2022190502A1 (ja) 音生成装置およびその制御方法、プログラム、電子楽器
JP3265995B2 (ja) 歌唱音声合成装置及び方法
EP0396141A2 (en) System for and method of synthesizing singing in real time
JP7544076B2 (ja) 情報処理装置、電子楽器、電子楽器システム、方法及びプログラム
JP2004061753A (ja) 歌唱音声を合成する方法および装置
JP5471138B2 (ja) 音素符号変換装置および音声合成装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20020115