JP3022270B2 - フォルマント音源のパラメータ生成装置 - Google Patents

フォルマント音源のパラメータ生成装置

Info

Publication number
JP3022270B2
JP3022270B2 JP7234731A JP23473195A JP3022270B2 JP 3022270 B2 JP3022270 B2 JP 3022270B2 JP 7234731 A JP7234731 A JP 7234731A JP 23473195 A JP23473195 A JP 23473195A JP 3022270 B2 JP3022270 B2 JP 3022270B2
Authority
JP
Japan
Prior art keywords
interpolation
formant
time
sound
phoneme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7234731A
Other languages
English (en)
Other versions
JPH0962297A (ja
Inventor
慎一 大田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP7234731A priority Critical patent/JP3022270B2/ja
Priority to US08/687,976 priority patent/US5703311A/en
Publication of JPH0962297A publication Critical patent/JPH0962297A/ja
Application granted granted Critical
Publication of JP3022270B2 publication Critical patent/JP3022270B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、フォルマント合
成方式の音源により音声を発生させる際に、該音源に与
えるフォルマントパラメータを生成する装置に関する。
【0002】
【従来の技術】従来より、CSM分析法などを用いて実
際の音声データを分析してフォルマントデータ(例え
ば、フォルマント中心周波数、フォルマントレベル、お
よびフォルマントバンド幅などの時系列のパラメータ)
を取得し、このフォルマントデータをフォルマント発生
装置を備えた音声合成装置に送って音声を発生させる技
術が知られている。
【0003】例えば、特開平3−200299号公報に
は、複数のフォルマント発生部を備えた音声合成装置が
開示されている。特開平4−349497号公報には、
フォルマントを指定するパラメータを時系列に複数用意
したもの(フォルマントは細かく時変動するので一瞬一
瞬の音声のデータを示すパラメータを時系列に沿って用
意する)を、音源ごとに記憶回路に用意しておき、キー
オンごとにそれらを読み出してフォルトマント合成型音
源に渡すことにより、音声による演奏を行なう電子楽器
が開示されている。
【0004】
【発明が解決しようとする課題】ところで、このような
フォルトマント合成方式の音源で音声を発生させる(言
葉を喋らせたり歌わせたりする)場合、上述のCMS分
析などで音声データを分析して一連のフォルトマントデ
ータを算出するのには、かなりの演算能力が必要である
し装置のコストも高くなる。また、音声から通常の楽音
に音色を徐々に変化させていくなど、音色のエディット
も困難である。
【0005】そこで、例えば「あいうえお」と発音させ
る場合、「あ」「い」「う」「え」「お」というそれぞ
れの音に対して音色ファイル(音素のフォルマントパラ
メータ)を用意しておき、各音素の間はフォルマントパ
ラメータを徐々に変化させて(補間して)発音させる手
法が用いられている。ここでは、そのような手法をモー
フィングと呼ぶことにする。
【0006】ところが、例えば「あいうえお」と滑らか
に発音させる場合にモーフィングを行なうとすると、各
音素の発声開始時間からフォルマントパラメータの補間
を始めることになるが、この場合、例えば「あ」の音素
がすぐにモーフィングの補間によって書き替えられ、
「あ」と聞こえなくなることがある。すなわち、モーフ
ィングの補間によって、聴感上、音声として聞こえなく
なることがある。
【0007】この発明は、高い演算能力を必要とするこ
となく低コストの簡便な装置で音声を合成できるととも
に、音声から楽音に音色を変化させるなどの音色エディ
ットも可能なフォルマント音源のパラメータ生成装置を
提供することを目的とする。また、この発明は、フォル
マント合成方式の音声合成装置においてモーフィングを
行なう場合に、聴感上音声として聞こえなくなるような
ことを無くすことを目的とする。
【0008】
【課題を解決するための手段】この目的を達成するた
め、請求項1に記載の発明は、フォルマントを規定す
ォルマントパラメータに応じたフォルマントを有する
音声を合成するフォルマント音源に与えるフォルマント
パラメータを生成するフォルマント音源のパラメータ生
成装置であって、複数の音韻についてのフォルマントパ
ラメータ( ハ゜ラメータ 611)と発生すべき音韻を指定する音
韻指定情報(SEGMENT VOICE 625)と該音韻の発生タイ
ミングを示す音韻発生タイミング情報(SEG DURATION 6
27)と補間開始タイミングを示す補間開始タイミング情
報(DEAD RATE 612,DEAD RATE COEF626)とを記憶した
記憶手段( テ゛ータメモリ 104)と、前記記憶手段に記憶された
音韻指定情報および音韻タイミング情報にしたがって、
前記記憶手段に記憶されたフォルマントパラメータを順
次読み出して前記フォルマント音源に出力する制御手段
であって、有声音間において、前の有声音に関するフォ
ルマントパラメータを前記フォルマント音源に前記補間
開始タイミング情報が示すタイミングまで出力した後、
前記前の有声音から後の有声音へとフォルマントパラメ
ータの補間を開始し、該補間結果を前記フォルマント音
源に出力するものとを備えたことを特徴とする。
【0009】請求項2に記載の発明は、請求項1におい
て、前記補間開始タイミング情報は、第1種の補間開始
タイミング情報(DEAD RATE 612)と第2種の補間開始
タイミング情報(DEAD RATE COEF 626)とからなり、前
記記憶手段は、前記フォルマントパラメータと前記第1
種の補間開始タイミング情報とからなる音色ファイル
(V FRMNT DATA)を音韻種類毎に記憶するとともに、前
記音韻指定情報と前記音韻発生タイミング情報と前記第
2種の補間開始タイミング情報とからなるイベントデー
タ(VEVENT)を複数記憶するものであり( フォルマントハ゜ラメータ
テーフ゛ル 601と シーケンステーフ゛ル 602)、前記制御手段は、前の有
声音に関するフォルマントパラメータを前記フォルマン
ト音源に、前記第1種および第2種の補間開始タイミン
グ情報に応じたタイミングまで出力するものであること
を特徴とする。
【0010】請求項3に記載の発明は、請求項1におい
て、有声音間に無声音が存在することを特徴とする。
【0011】請求項4に記載の発明は、請求項1におい
て、前記音韻発生タイミング情報は各音韻の発音継続時
間を示す発音時間情報であり、前記補間開始タイミング
情報は各音韻の発音継続時間に対する割合を示すデッド
レートであり、前記制御手段は、(a)前記前の有声音
の発音時間情報が示す発音継続時間と前記デッドレート
を乗算することにより、前記前の有声音の発音開始か
ら補間開始までの時間を算出する補開始時間算出手段
と、(b)前記前の有声音の発音開始から前記補間開始
時間算出手段により算出した補間開始までの時間の間、
前記前の有声音に関するフォルマントパラメータを前記
フォルマント音源に出力するフォルマントパラメータ出
力手段と、(c)前記補間開始までの時間が経過したこ
とを検出する補間開始時間検出手段と、(d)前記補間
開始までの時間が経過したときは、前記前の有声音から
前記後の有声音へのフォルマントパラメータの補間を開
始し、補間結果を前記フォルマント音源に出力する補間
手段とからなることを特徴とする。
【0012】請求項5は、請求項1において、前記音韻
発生タイミング情報は各音韻の発音継続時間を示す発音
時間情報であり、前記補間開始タイミング情報は各音韻
の発音継続時間に対する割合を示すデッドレートであ
り、前記制御手段は、(a)前記前の有声音の発音時間
情報が示す発音継続時間と前記デッドレートとを乗算す
ることにより、前記前の有声音の発音開始から補間開始
までの時間を算出するとともに、前記前の有声音の発音
時間から前記算出した補間開始までの時間を減算するこ
とにより補間を実行する補間時間を算出する補間時間算
出手段と、(b)前記先の音韻の発音開始から前記補間
時間算出手段により算出した補間開始までの時間の間、
前記前の有声音に関するフォルマントパラメータを前記
フォルマント音源に出力する第1のフォルマントパラメ
ータ出力手段と、(c)前記補間開始までの時間が経過
したことを検出する補間開始時間検出手段と、(d)前
記補間開始までの時間が経過したときは、前記前の有声
音のフォルマントパラメータから前記後の有声音のフォ
ルマントパラメータまでの間を、前記補間時間で補間
し、補間結果を前記フォルマント音源に順次出力する補
間手段と、(e)前記補間時間が経過したことを検出す
る補間時間検出手段と、(f)前記補間時間が経過した
ときは、前記後の有声音に関するフォルマントパラメー
タを前記フォルマント音源に出力する第2のフォルマン
トパラメータ出力手段とからなることを特徴とする
【0013】請求項に記載の発明は、請求項1におい
て、前記音韻発生タイミング情報は各音韻の発音継続時
間を示す発音時間情報であり、前記補間開始タイミング
情報は各音韻の発音継続時間に対する割合を示すデッド
レートであり、前記制御手段は、(a)前記前の有声音
の発音時間情報が示す発音継続時間と前記デッドレート
とを乗算することにより前記前の有声音の発音開始から
補間開始までの時間を算出するとともに、前記前の有声
音の発音時間から前記算出した補間開始までの時間およ
び次に発音すべき無声音の発音時間を減算することによ
り補間を実行する補間時間を算出する補間時間算出手段
と、(b)前記前の有声音の発音開始から前記補間時間
算出手段により算出した補間開始までの時間の間、前記
前の有声音に関するフォルマントパラメータを前記フォ
ルマント音源に出力する第1のフォルマントパラメータ
出力手段と、(c)前記補間開始までの時間が経過した
ことを検出する補間開始時間検出手段と、(d)前記補
間開始までの時間が経過したときは、前記前の有声音の
フォルマントパラメータから前記後の有声音のフォルマ
ントパラメータまでの間を、前記補間時間および前記無
声音の発音時間で補間し、補間結果を前記フォルマント
音源に順次出力する補間手段と、(e)前記補間時間が
経過したことを検出する補間時間検出手段と、(f)前
記補間時間が経過したときは、前記無声音に関するフォ
ルマントパラメータを前記フォルマント音源に出力し、
その後に、前記後の有声音に関するフォルマントパラメ
ータを前記フォルマント音源に出力する第2のフォルマ
ントパラメータ出力手段とからなることを特徴とする
【0014】請求項に記載の発明は、請求項1から6
において、前記制御手段は、(a)前記有声音の発音継
続時間が所定時間より長いときは、前記請求項1乃至6
に記載の補間方法で補間し、(b)前記有声音の発音継
続時間が所定時間より短いときは、前記有声音の合成初
期は目標値への変化が緩く後期になって目標値への変化
が急になる補間方法で補間することを特徴とする。
【0015】
【0016】
【発明の実施の形態】以下、図面を用いて、この発明の
実施の形態を説明する。
【0017】図1は、本発明の一形態例に係るフォルマ
ントパラメータ生成装置を適用した電子楽器のシステム
構成を示す。この電子楽器は、中央処理装置101、リ
ードオンリメモリ(ROM)102、ランダムアクセス
メモリ(RAM)103、データメモリ104、表示部
105、演奏操作子106、設定操作子107、フォル
マント音源108、およびディジタルアナログ変換器
(DAC)109を備えている。上記101〜108は
バスライン110に接続されている。
【0018】演奏操作子106は、ユーザが演奏操作す
るための鍵盤などの操作子である。設定操作子107
は、ユーザが各種の設定を行なうためのスイッチなどの
操作子である。CPU101は、この電子楽器全体の動
作を制御する。特に、CPU101は、演奏操作子10
6の演奏操作を検出し、その演奏操作に応じて時系列の
フォルマントパラメータを生成してフォルマント音源1
08に向けて出力する。またCPU101は、設定操作
子107の操作を検出して各種の設定を実行する。
【0019】ROM102には、CPU101が実行す
るプログラムおよび各種の定数データなどが格納されて
いる。RAM103は、CPU101が動作する際のワ
ーキング領域として用いる。データメモリ104は、フ
ォルマントパラメータテーブルとシーケンステーブルと
を格納する。これらのテーブルの内容については、図6
で後述する。表示部105は、各種の情報を表示する表
示部である。
【0020】図2は、フォルマント音源108の概略構
成を示す。フォルマント音源108は、大きく2つのグ
ループ(VTGグループ201とUTGグループ20
2)に分かれる。
【0021】VTGグループ201は、有声音(母音)
を発生するためのグループであり、内部に4つの音源V
TG1〜VTG4を備える。各音源は、CPU101か
ら与えられた有声音に関するフォルマントパラメータに
応じた1つのフォルマントを形成するための音源であ
り、CPU101からのキーオン信号(VKON)の入
力を契機として音声発生動作を開始する。4つの音源V
TG1〜VTG4から出力されるディジタル楽音信号を
混合して、4つのフォルマントを備えた有声音の楽音信
号として出力する。
【0022】UTGグループ202は、無声音(子音)
を発生するためのグループであり、内部に4つの音源U
TG1〜UTG4を備える。各音源は、CPU101か
ら与えられた無声音に関するフォルマントパラメータに
応じた1つのフォルマントを形成するための音源であ
り、CPU101からのキーオン信号(UKON)の入
力を契機として音声発生動作を開始する。4つの音源U
TG1〜UTG4から出力されるディジタル楽音信号を
混合して、4つのフォルマントを備えた無声音の楽音信
号として出力する。
【0023】VTGグループ201から出力される有声
音の楽音信号とUTGグループ202から出力される無
声音の楽音信号とを加算器203で加算し、フォルマン
ト音源108の最終的な出力とする。
【0024】CPU101が生成して音源108に与え
るフォルマントパラメータについて説明する。この例で
は、説明の簡略化のため、1フォルマントは、図3
(a)に示すような3つのパラメータff,fl,bw
から構成されているとする。図3(a)は1フォルマン
トをパワースペクトルで示したものであり、ffはフォ
ルマント中心周波数、flはフォルマントレベル、bw
はフォルマントバンド幅(フォルマントの山の鋭さ)を
示す。
【0025】有声音を発生させたいとき、CPU101
は、当該有声音の第1フォルマントを規定する上記パラ
メータff,fl,bwをVTGグループの音源VTG
1に送る。同様に、第2〜第4フォルマントを規定する
パラメータff,fl,bwをそれぞれ音源VTG2〜
4に送る。これにより、それらのフォルマントパラメー
タで規定される第1〜第4フォルマントを有する当該有
声音がVTGグループから出力されることになる。無声
音を発生させるときも同様であり、UTGグループの音
源UTG1〜4にそれぞれ上記パラメータff,fl,
bwを送って、所望の無声音を発生させる。
【0026】本システムを用いて言葉を喋らせたり歌わ
せたりする場合、一瞬一瞬で変化するフォルマントを再
現するために一連のフォルマントパラメータを時系列デ
ータとして順次音源108に送る必要がある。しかし、
システムの構成を簡略化しコストを押さえるため、本シ
ステムでもモーフィングの手法を用いる。本システムに
おけるモーフィングの方式について説明する。本システ
ムでは、CPU101により、複数の音素間でモーフィ
ングすなわちフォルマントパラメータの補間を行ない、
時系列の一連のフォルマントパラメータを作成し、それ
を音源108に与えることにより、言葉を喋らせたり歌
わせたり、フォルマント系の楽音と音声とのモーフィン
グを実現する。
【0027】まず、有声フォルマントのみの音素を含ん
だモーフィングについて説明する。本システムでは、あ
らかじめ「a(あ)」「i(い)」「u(う)」「e
(え)」「o(お)」というそれぞれの有声音の音素の
音色ファイルを用意する。各音素の音色ファイルは、そ
の音素に関する複数(本例では4つ)のフォルマントを
表す図3(a)に示したパラメータff,fl,bwお
よびその他のフォルマントパラメータからなる。例え
ば、フォルマント中心周波数ffに注目すると、「a」
の音色ファイルには第1ffとしてF1=697Hz、
第2ffとしてF2=1072Hz、第3ffとしてF
3=2839Hz、…というように格納され、「u」の
音色ファイルには第1ffとしてF1=298Hz、第
2ffとしてF2=1288Hz、第3ffとしてF3
=2104Hz、…というように格納されている。他の
音素および他のパラメータについても同様である。
【0028】ある音素からある音素へモーフィングを行
なうにあたって必要となる情報は、それらの音素の音
色ファイル、各音素の発音時間、補間デッドレー
ト、および補間方法である。は、第1の音素から第
2の音素へとモーフィングを行なう場合、第1および第
2の音素のフォルマントパラメータを格納した音色ファ
イルが必要であるということである。〜について
は、図3(b)で後述する。
【0029】図3(b)は、「a」→「i」→「u」の
順でモーフィングを行なう際のフォルマント中心周波数
ffの補間の様子を示す。第1音素開始時間T1=0か
ら「a」を発声するために、第1フォルマント中心周波
数ffとしてF1=697Hzを補間開始時間T11ま
でグラフ301のように出力する。補間開始時間T11
に至ったら、「a」から「i」へ移行するため、「a」
の第1ffであるF1=697Hzから「i」の第1f
fであるF1=310Hzまでを補間し、補間結果を第
1ffとしてグラフ302のように順次出力する。第2
音素開始時間T2から補間開始時間T21までは、
「い」を発声するために、F1=310Hzを第1ff
としてグラフ303のように出力する。補間開始時間T
21に至ったら、「i」から「u」へ移行するため、
「i」の第1ffであるF1=310Hzから「u」の
第1ffであるF1=298Hzまでを補間し、補間結
果を第1ffとしてグラフ304のように順次出力す
る。以下、同様である。第1ff以外のパラメータにつ
いても同様にして出力する。
【0030】モーフィングを行なう際に必要となる情報
のうち、「各音素の発音時間」は、図3(b)の第n音
素開始時間から第n+1音素開始時間までの時間をい
う。例えば、T1=0からT2までの時間が「a」の発
音時間、T2からT3までの時間が「i」の発音時間で
ある。この情報が指定されることにより、次の音素の開
始時間が決定できることになる。例えば、「a」の発音
時間が指定されれば、T1にその発音時間を加算して、
次の「i」の開始時間T2が決定できる。
【0031】モーフィングを行なう際に必要となる情報
のうち、「補間デッドレート」は、 補間デッドレート =(第n音素補間開始時間−第n音素発声開始時間)/(第n音素発音時間) =(第n音素補間開始時間−第n音素発声開始時間)/(第n+1音素発声開 始時間−第n音素発生開始時間) で定義される。補間デッドレートは、各音素ごとに指定
してもよいし、全音素に共通の定数としてもよい。
【0032】従来方式で機械的に補間を行なった場合、
各音素の発声開始時間から補間を始めることがあり、聴
感上音声にならないことがある。例えば、図3(b)の
例で「a」の開始時間から補間を始めると、「a」の音
素がすぐに補間によって書き替えられ、「a」と聞こえ
なくなる。そこで、本システムでは、モーフィングを行
なう際に補間デッドレートを指定し、ある音素の発音時
間に補間デッドレートを乗算した乗算結果の時間は当該
音素のフォルマントパラメータをそのまま出力し、その
時間の経過後、次の音素に向かう補間を開始するように
している。したがって、例えば図3(b)の第1音素開
始時間から補間開始時間T11までの間の時間は、
「a」の発音時間T2−T1に、指定された補間デット
レートを乗算して求める。そして、「a」の開始時間T
1からこの補間開始時間T11までの間は「a」の音色
ファイルのフォルマントパラメータをそのまま出力し、
これにより「a」が聴感上明確に認識されるようにして
いる。
【0033】モーフィングを行なう際に必要となる情報
のうち、「補間方法」は、リニア、またはスプラインな
どの補間の方法を示す。
【0034】図3(b)では有声音による補間例を説明
したが、次に無声音を含む場合の補間例を説明する。日
本語の場合、無声音部は有声音部と違い、C(無声)+
V(有声)という構成をとるため基本的に無声音部の補
間は必要ない。そのため、例えば「hasi(はし)」
と発声させる場合、本システムでは、有声(母音)部分
の補間は前述の方法で実現し、無声(子音)部分は無声
音の音色ファイルのフォルマントパラメータを出力する
ようにする。無声音の後の有声音の発音タイミングは、
無声音のレベルに所定のしきい値を設定しておき、その
レベル以下になった場合に有声音の発音を開始するよう
にする。
【0035】図4は、無声音と有声音とを組み合わせて
発声する際にモーフィングを行なう場合のフォルマント
レベルデータの出力例を示す。図4(a)は無声音のフ
ォルマントレベルデータ出力例、図4(b)は有声音の
フォルマントレベルデータ出力例を示す。この例は、例
えば「ha(は)」→「si(し)」の順でモーフィン
グを行なう場合を示している。「ha(は)」は無声音
の「h」と有声音の「a」からなり、「si(し)」は
無声音の「s」と有声音の「i」からなる。
【0036】第1音素開始時間T1=0から無声音
「h」を発声するため、第1フォルマントレベルflと
して、グラフ401のように「h」の音色ファイルの内
容にしたがって出力する。この第1フォルマントレベル
flが所定のしきい値Sに至った時点が、第2音素
「a」の開始時間T2となる。T2から有声音「a」を
発声するため、第1フォルマントレベルflとして、グ
ラフ402のように「a」の音色ファイルの内容にした
がって出力する。この有声音「a」の補間開始時間T2
1は、図3(b)で説明したのと同様に決定する。すな
わち、有声音「a」に関する補間デッドレートが指定さ
れるので、「a」の発音時間(第3音素開始時間T3−
第2音素開始時間T2)に補間デットレートを乗算して
第2音素開始時間T2から補間開始時間T21までの時
間を算出する。これにより補間開始時間T21を決定す
ることができる。
【0037】補間開始時間T21に至ったら、「a」か
ら次の有声音「i」(補間は有声音の間で行なう)に向
かう補間を開始し、補間した結果をグラフ403のよう
に順次出力する。第3音素開始時間T3に至ったら、第
3音素である無声音「s」を発声するため、グラフ40
4のように、「s」の音色ファイルの内容にしたがって
第1フォルマントレベルflを出力する。この第1フォ
ルマントレベルflが所定のしきい値Sに至ったら、第
4音素「i」に関する第1フォルマントレベルの出力を
開始する。第4音素「i」の補間開始時間T41や補間
については、第2音素「a」の場合と同様とする。
【0038】なお、聴感上、有声音(母音)が鳴り始め
たタイミングがその音の鳴り始めのタイミングに聞こえ
る。例えば図4の例では、第4音素開始時間T4のタイ
ミングから「si」が鳴り始めたように聞こえ、実際に
指定した開始時間T3より遅れて鳴り始めたように感じ
てしまう。これを防止するため、無声音部分(子音)が
前の母音を食うようなタイミングで発音させてもよい。
図5は、そのような例を示す。
【0039】図5は、図4と同様の「hasi(は
し)」と発声する際のフォルマントレベルデータの出力
例を示す。図4の例と同様に、第1音素開始時間T1か
ら第1音素(無声音「h」)に関する第1フォルマント
レベルデータをグラフ501のように「h」の音色ファ
イルの内容にしたがって出力し、所定のしきい値Sに至
ったらその時点を第2音素(有声音「a」)の開始時間
T2として、第2音素に関する第1フォルマントレベル
データをグラフ502のように「a」の音色ファイルの
内容にしたがって出力する。
【0040】図5の例は、補間開始時間T21および第
3音素の開始時間T3の決め方が図4の例とは異なる。
すなわち、第2音素「a」の発音時間が指定されるが、
その発音時間を次の有声音(次に無声音+有声音が続く
場合は、その無声音の後の有声音)の開始までの時間と
する。図5の例では、第2音素「a」の次に無声音
「s」+有声音「i」が続くから、第2音素「a」の開
始時間T2にその発音時間を加算することにより、第4
音素である有声音「i」の開始時間T4を決定する。補
間開始時間T21は、第2音素の発音時間(=T4−T
2)にその補間デッドレートを乗算してT21−T2の
時間を求め、これにより補間開始時間T21を決定す
る。第3音素「s」の開始時間T3は、第4音素「i」
の開始時間T4から第3音素の発音時間を減算して決定
する。無声音である第3音素「s」の発音時間は、パラ
メータで与えるか、またはパラメータ中にエンベロープ
データが含まれるのでこれにより算出してもよい。
【0041】図5の例において、第2音素「a」に着目
するとその発音時間はT4−T2になるが、その発音時
間でずっと「a」が発音されるわけではない。実際に
は、開始時間T1の時点からその発音時間T4−T2が
経過する前のT3の時点で「a」のフォルマントパラメ
ータの出力が打ち切られ、T3の時点から第3音素であ
る子音「s」のフォルマントパラメータが出力されるこ
とになる。すなわち、第3音素の子音「s」が第2音素
の母音「a」を食うようにタイミングが調整されてい
る。第3音素「s」+第4音素「i」の「si」の音
は、第4音素開始時間T4から鳴り始めたように聞こえ
るので、聴感上は、第2音素の発音時間の後に適正に
「si」が鳴り始めたように感じる。
【0042】図6は、データメモリ104の内容を示
す。データメモリ104には、フォルマントパラメータ
テーブル601とシーケンステーブル602が用意され
ている。フォルマントパラメータテーブル601は、各
音素のフォルマントパラメータを格納するテーブルであ
る。V FRMNT DATAは有声音(母音)の音色
ファイル(フォルマントパラメータ)を示し、「a」
「i」「u」「e」「o」の音色ファイルが用意されて
いる。U FRMNT DATAは無声音(子音)の音
色ファイル(フォルマントパラメータ)を示し、「b」
「ch」などの音色ファイルが用意されている。
【0043】1つの音素の音色ファイルは、第1〜第4
の各フォルマントに関するパラメータ611、デッドレ
ート(DEAD RATE)612、およびその他のデ
ータ(MISC)613からなる。パラメータ611の
うち、FRMNT FREQ1、FRMNT LVL
1、およびFRMNT BW1は、それぞれ、第1フォ
ルマントに関するフォルマント中心周波数、フォルマン
トレベル、およびフォルマントバンド幅を示す。同様に
第2〜第4フォルマントに関するパラメータも保持して
いる。
【0044】シーケンステーブル602は、本システム
により発声させる歌詞データを保持するテーブルであ
る。LYRIC DATAは1つの歌詞データを示し、
複数の歌詞データが用意されている。1つの歌詞データ
は、先頭に格納された当該歌詞データのタイトル名(T
ITLE NAME)621、複数のイベントデータ
(VEVENT1〜n)623、および歌詞の終りを示
すエンドデータ(END)624からなる。1つのイベ
ントデータ(VEVENTi)は、発生すべき音素を指
定する音素指定情報(SEGMENT VOICE)6
25、補間デッドレート調整係数(DEAD RATE
COEF)626、当該音素の発音時間(SEG D
URATION)627、およびその他の情報(SEG
MISCDATA)628からなる。その他の情報6
28は、例えば当該音素のピッチや音量などを示すデー
タである。
【0045】音素指定情報(SEGMENT VOIC
E)625に子音が指定されたときは、デッドレート調
整係数626と発音時間627は未使用とする。子音で
は、これらの情報は無意味だからである。子音の発音時
間は、エンベロープで決まるが、そのエンベロープに関
する情報はその他の情報628に含まれているものとす
る。
【0046】ある音素の発音時間が、発音時間を格納す
る領域627で表現できる大きさを越えているときは、
その次のイベントデータは発音時間627のみを指定し
たイベントデータとする。発音時間のみを指定したイベ
ントデータは、発音時間627以外の領域はすべて0で
ある。逆にいえば、音素指定情報625に音素の指定が
ないイベントデータは、発音時間627のみを指定した
ものであり、現在発生中の音素の発音時間を延ばすこと
を示す。
【0047】次に、図7〜図9のフローチャートを参照
して本システムによる歌詞演奏の手順を説明する。ま
ず、あらかじめ図6のシーケンステーブル602から演
奏すべき歌詞データが1つ選択されているものとする。
ステップ701では各種の初期化を行なう。特に、イベ
ントデータを指すための歌詞イベントポインタiを1と
する。
【0048】次に、ステップ702でポインタiで指す
イベントデータ(VEVENTi)を読み込む。ステッ
プ703では、読み込んだデータがエンドデータ624
か否か判別する。エンドデータであったときは処理を終
了する。エンドデータでなかったときは、ステップ70
4で、読み込んだイベントデータ(VEVENTi)の
音素指定情報(SEGMENT VOICE)625に
音素の指定があるか否か判別する。音素の指定がないと
きは、そのイベントデータは発音時間(SEGDURA
TION)627のみを指定したイベントデータである
から、ステップ821で当該発音時間(SEG DUR
ATION)627の分だけカウントを行ない(その間
は現在発音中の音素の発音が継続している)、ステップ
822で当該発音時間分だけ時間経過したか否か判別す
る。未だ時間経過していないときは再びステップ821
に戻ってカウントを繰り返し、当該発音時間分だけ時間
経過したら、ステップ911に進む。ステップ911で
歌詞イベントポインタiをインクリメントして、ステッ
プ702に戻る。
【0049】ステップ704で、読み込んだイベントデ
ータの音素指定情報(SEGMENT VOICE)6
25に音素の指定があるときは、その指定音素をXiと
してステップ705に進む。ステップ705では当該指
定音素Xiが母音(有声音)か否か判別する。母音でな
いときは、子音(無声音)であるということだから、ス
テップ811で当該指定音素Xiのフォルマントパラメ
ータ(U FRMNTDATA Xi)を図6のフォル
マントパラメータテーブル601から読み出して音源1
08のUTGグループ202に転送し、キーオンする
(UKONを「1」とする)。これにより、子音の発音
が開始される。ステップ811の後、ステップ911に
進む。
【0050】ステップ705で当該指定音素Xiが母音
であるときは、ステップ706で前の指定音素Xi-1が
子音か否か判別する。前の指定音素Xi-1が子音である
ときは、その子音(現在発音中)の発音レベルが所定の
しきい値Sを下回ったタイミングで指定音素(母音)X
iの発音を開始するため、ステップ707で指定音素Xi
-1の発音レベルをチェックし、ステップ708でその発
音レベルが所定のしきい値Sより小さくなったか否かを
チェックする。指定音素Xi-1の発音レベルがしきい値
S以上のときは、未だ子音Xi-1の発音を続けるため、
ステップ707に戻る。ステップ708で指定音素Xi-
1の発音レベルがしきい値Sより小さくなったら、次の
指定音素(母音)Xiの発音を開始するためステップ8
01に進む。ステップ706で前の指定音素Xi-1が母
音のときは、次の指定音素Xiの発音を開始してよいか
ら、ステップ801に進む。
【0051】なお、ステップ707,708のレベルチ
ェックは、UTGグループ202の出力などを直接監視
してもよいし、ソフト的にレベルを概算しながらチェッ
クしてもよい。また、子音のキーオン後にこのチェック
処理を行なうようにしてもよい。
【0052】ステップ801では、指定音素Xiに関す
るフォルマントパラメータ(V FRMNT DATA
Xi)を図6のフォルマントパラメータテーブル60
1から読み出して、音源108のVTGグループ201
に転送し、キーオンする(VKONを「1」とする)。
これにより、母音Xiの発音が開始する。次に、ステッ
プ802で補間開始までの時間(発音開始から補間開始
までの時間間隔)Tsiを算出する。Tsiは、 Tsi=SEG DURATIONi×DEAD RAT
E COEFi×DEAD RATEx で求める。すなわち、現在発音中の指定音素(母音)X
iの発音時間(SEGDURATIONi)に、この音素
のデッドレート(DEAD RATE)612とイベン
トデータで指定されたデッドレート調整係数(DEAD
RATECOEFi)626とを乗算して、補間開始
までの時間Tsiを求める。
【0053】デッドレート調整係数(DEAD RAT
E COEF)は、デッドレート(DEAD RAT
E)を部分的に調整したい場合に用いる。通常は、デッ
ドレートのみを用いて図4で説明したように補間開始ま
での時間を決定すればよいが、歌詞の言葉の並び方によ
っては部分的にデッドレートを変更したい場合もある。
そこで、デッドレート調整係数を用いて部分的にデッド
レートを調整するようにしている。これにより、歌詞の
言葉の並び方に応じた最適なデッドレートでフォルマン
トパラメータを出力でき、一連の歌詞が自然に聞こえる
ように発音することができる。
【0054】ステップ802で補間開始までの時間Tsi
を求めたら、ステップ803でその時間Tsiをカウント
する処理を行なう。ステップ804で時間Tsiが経過し
たか否か判別し、経過していなかったらステップ803
に戻ってカウントを継続する。時間Tsiが経過したら、
補間を開始するため、ステップ805に進む。
【0055】ステップ805では、補間時間TIiを算
出する。TIiは、 TIi=SEG DURATIONi−Tsi で求める。すなわち、指定音素Xiの発音時間(SEG
DURATIONi)から補間開始時間(発音開始から
補間開始までの時間)Tsiを減算すればよい。次にステ
ップ806で、指定音素(母音)Xiに後続するイベン
トデータから、指定音素(SEGMENT VOIC
E)として母音が指定されたイベントデータ(VENE
NT)を検索する。母音の次に続くのは母音または子音
であり、子音の次には必ず母音が続くから、ステップ8
06ではXi+1またはXi+2が検索されるはずである。
【0056】次にステップ901で、現在発音中の指定
音素Xiから次の母音音素(Xi+1またはXi+2)までの
間を、時間TIiで直線補間し、補間結果を所定タイミ
ングごとに音源108のVTGグループ201に転送す
る。そして、ステップ902でTIiのカウントチェッ
クを行ない、ステップ903で時間TIiが経過したか
否か判別する。未だ時間TIiが経過していなかった
ら、ステップ901に戻って補間および補間結果の出力
を続ける。時間TIiが経過したら、ステップ904に
進んで次のイベントデータの指定音素(SEGMENT
VOICEi+1)を参照し、ステップ905で当該指
定音素(SEGMENT VOICEi+1)が母音か否
か判別する。母音でないときは、次に子音が続くという
ことだから、ステップ906でVTGグループ201に
キーオフを送り(VKONを「0」とする)、現在発音
中の音素Xiの発音を停止させて、次のイベントデータ
の発音を行なうべくステップ911に進む。ステップ9
05で次に続くのが母音であったときは、現在発音中の
母音を消音せずに、引き続き次の母音の発音を行なって
よいから、そのままステップ911に進む。
【0057】以上図7〜図9の手順により、図3(b)
および図4で説明したようにフォルマントパラメータを
出力することができる。
【0058】一方、図7〜図9と同様の手順で、図5で
説明したように子音が前の母音を食うようなタイミング
で発音されるようにすることもできる。そのためには、
ほぼ図7〜図9の処理手順をそのまま用いればよく、以
下のステップのみを変更すればよい。まず、上記ステッ
プ805で補間時間TIiを TIi=SEG DURATIONi−(Tsi+次の子音
Xi+1の発音時間) で求めるようにする。すなわち、母音である指定音素X
iの発音時間(SEGDURATIONi)から、補間開
始時間(発音開始から補間開始までの時間)Tsiと次の
子音Xi+1の発音時間(見積もり時間)とを加算した時
間分を減算するようにする。次の音素Xi+1が母音のと
きは、ステップ805は変更の必要がない。また、ステ
ップ901で補間を行なう際に、時間TIiで補間する
のでなく、時間TIiに次の子音Xi+1の発音時間を加算
した時間で補間するようにする。以上により、図5で説
明したようにフォルマントパラメータを出力することが
できる。
【0059】なお、上記のシステムでは、補間の開始や
次の音素の発音開始のタイミングなどの時間管理は、そ
の都度、必要な時間をカウントしてその時間が経過した
かどうかを判別することにより行なっているが、割り込
み処理を用いて時間管理を行なうようにしてもよい。
【0060】また上記システムでは、デッドレートを設
けて、必ず発音時間×デッドレートの時間は当該音素の
フォルマントパラメータを出力するようにしたが、この
ようにすると、発音時間が短いときは補間時間も短くな
りプツンプツンと音が切れる感じがすることがある。そ
こで、発音時間が所定値以上のときは上述したように通
常の直線補間を行ない、発音時間が短い母音のときは初
期は目標値への変化が緩く後期になって目標値への変化
が急になる補間方法(例えば、指数関数による補間)用
いるとよい。これにより、初期は変化の緩い補間が為さ
れるので、実質的にデッドレート分の時間が確保されて
いるような効果がある。
【0061】上記システムでは母音と子音に分けてそれ
ぞれの音素ごとにデッドレートを定めているが(図6の
フォルマントパラメータテーブル601)、母音と子音
に分けずに50音の1つ1つの音を音素とし、50音の
それぞれに対してデッドレートを含むフォルマントパラ
メータを設けるようにしてもよい。
【0062】上記システムでは音素間のモーフィングを
行なう例を説明したが、音声と楽音(フォルマント系の
楽音)との間でモーフィングを行なうこともできる。ま
た、本発明は、電子楽器に組み込む形のほか、パソコン
システムのアプリケーションの形でも実施することがで
きる。
【0063】
【発明の効果】以上説明したように、発明によれば、
各音素のフォルマントパラメータを用いて、音素間はモ
ーフィングによってフォルマントパラメータを生成出力
するようにしているので、特別高い演算能力を必要とす
ることもなく低コストの簡便な装置で音声を合成するこ
とができる。また、音声から楽音に音色を変化させるな
どの音色エディットも可能となる。
【0064】さらに、第1の音韻の発音時間にデッドレ
ートを乗算した時間だけ当該音韻のフォルマントパラメ
ータの出力を保持し、あるいは第1の音韻の発音の初期
には目標値への変化が緩い補間方法を用いることによ
り、第1の音韻が聴感上音声として明確に聞こえるよう
になる。デッドレートは音素ごとに定めておけば、音素
に応じて当該音素が確実に認識できるように発音させる
ことができる。また、デッドレート調整係数でデッドレ
ートの部分的な調整を行なうことができるので、音素の
並び方に応じた最適なデッドレートでフォルマントパラ
メータを出力でき、一連の歌詞が自然に聞こえるように
発音させることができる。
【0065】また、第2の音韻が第1の音韻を食うよう
なタイミングで発音が為されるので、聴感上、有声音
(母音)が鳴り始めたタイミングがその音の鳴り始めの
タイミングに聞こえるということに基づき、適正なタイ
ミングで第2の音韻が鳴り始めたように聞こえるように
できる。
【図面の簡単な説明】
【図1】本発明の一形態例に係るフォルマントパラメー
タ生成装置を適用した電子楽器のシステム構成図
【図2】フォルマント音源の概略構成図
【図3】フォルマントパラメータの説明図および有声音
間でモーフィングを行なう際のフォルマント中心周波数
ffの補間の様子を示す図
【図4】無声音と有声音とを組み合わせて発声する際に
モーフィングを行なう場合のフォルマントレベルデータ
の出力例を示す図(その1)
【図5】無声音と有声音とを組み合わせて発声する際に
モーフィングを行なう場合のフォルマントレベルデータ
の出力例を示す図(その2)
【図6】データメモリの内容を示す図
【図7】歌詞演奏の手順を示すフローチャート図(その
1)
【図8】歌詞演奏の手順を示すフローチャート図(その
2)
【図9】歌詞演奏の手順を示すフローチャート図(その
3)
【符号の説明】
101…中央処理装置、102…リードオンリメモリ
(ROM)、103…ランダムアクセスメモリ(RA
M)、104…データメモリ、105…表示部、106
…演奏操作子、107…設定操作子、108…フォルマ
ント音源、109…ディジタルアナログ変換器(DA
C)、110…バスライン、201…VTGグループ、
202…UTGグループ、203…加算器、ff…フォ
ルマント中心周波数、fl…フォルマントレベル、bw
…フォルマントバンド幅。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭63−210900(JP,A) 特開 昭56−80099(JP,A) 特開 昭58−107597(JP,A) 特開 昭58−97093(JP,A) 特開 昭59−212899(JP,A) 特開 昭61−118798(JP,A) 特開 昭59−42598(JP,A) 特開 昭62−96999(JP,A) 特開 昭63−307500(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/00 G10L 13/04

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】フォルマントを規定するフォルマントパラ
    メータに応じたフォルマントを有する音声を合成するフ
    ォルマント音源に与えるフォルマントパラメータを生成
    するフォルマント音源のパラメータ生成装置であって、複数の音韻についてのフォルマントパラメータ( ハ゜ラメータ
    611)と発生すべき音韻を指定する音韻指定情報(SEGME
    NT VOICE 625)と該音韻の発生タイミングを示す音韻発
    生タイミング情報(SEG DURATION 627)と補間開始タイ
    ミングを示す補間開始タイミング情報(DEAD RATE 61
    2,DEAD RATE COEF 626)とを記憶した記憶手段( テ゛ータメ
    モリ 104)と、 前記記憶手段に記憶された音韻指定情報および音韻タイ
    ミング情報にしたがって、前記記憶手段に記憶されたフ
    ォルマントパラメータを順次読み出して前記フォルマン
    ト音源に出力する制御手段であって、有声音間におい
    て、前の有声音に関するフォルマントパラメータを前記
    フォルマント音源に前記補間開始タイミング情報が示す
    タイミングまで出力した後、前記前の有声音から後の有
    声音へとフォルマントパラメータの補間を開始し、該補
    間結果を前記フォルマント音源に出力するものとを備え
    ことを特徴とするフォルマント音源のパラメータ生成
    装置。
  2. 【請求項2】前記補間開始タイミング情報は、第1種の
    補間開始タイミング情報(DEAD RATE 612)と第2種の
    補間開始タイミング情報(DEAD RATE COEF 626)とから
    なり、 前記記憶手段は、前記フォルマントパラメータと前記第
    1種の補間開始タイミング情報とからなる音色ファイル
    (V FRMNT DATA)を音韻種類毎に記憶するとともに、前
    記音韻指定情報と前記音韻発生タイミング情報と前記第
    2種の補間開始タイミング情報とからなるイベントデー
    タ(VEVENT)を複数記憶するものであり( フォルマントハ゜ラメータ
    テーフ゛ル 601と シーケンステーフ゛ル 602)、 前記制御手段は、前の有声音に関するフォルマントパラ
    メータを前記フォルマント音源に、前記第1種および第
    2種の補間開始タイミング情報に応じたタイミ ングまで
    出力するものであることを特徴とする請求項1に記載の
    フォルマント音源のパラメータ生成装置。
  3. 【請求項3】有声音間に無声音が存在することを特徴と
    する請求項1に記載のフォルマント音源のパラメータ生
    成装置。
  4. 【請求項4】前記音韻発生タイミング情報は各音韻の発
    音継続時間を示す発音時間情報であり、前記補間開始タ
    イミング情報は各音韻の発音継続時間に対する割合を示
    すデッドレートであり、 前記制御手段は、 (a)前記前の有声音 の発音時間情報が示す発音継続時
    間と前記デッドレートを乗算することにより、前記前
    の有声音の発音開始から補間開始までの時間を算出す
    開始時間算出手段と、(b) 前記前の有声音の発音開始から前記補間開始時間
    算出手段により算出した補間開始までの時間の間、前記
    前の有声音に関するフォルマントパラメータを前記フォ
    ルマント音源に出力するフォルマントパラメータ出力手
    段と、(c) 前記補間開始までの時間が経過したことを検出す
    る補間開始時間検出手 段と、(d) 前記補間開始までの時間が経過したときは、前記
    前の有声音から前記後の有声音へのフォルマントパラメ
    ータの補間を開始し、補間結果を前記フォルマント音源
    に出力する補間手段とからなることを特徴とする請求項
    1に記載のフォルマント音源のパラメータ生成装置。
  5. 【請求項5】前記音韻発生タイミング情報は各音韻の発
    音継続時間を示す発音時間情報であり、前記補間開始タ
    イミング情報は各音韻の発音継続時間に対する割合を示
    すデッドレートであり、 前記制御手段は、 (a)前記前の有声音の発音時間情報が示す発音継続時
    間と前記デッドレート とを乗算することにより、前記前
    の有声音の発音開始から補間開始までの時間を算出する
    とともに、前記前の有声音の発音時間から前記算出した
    補間開始までの時間を減算することにより補間を実行す
    る補間時間を算出する補間時間算出手段と、 (b)前記先の音韻の発音開始から前記補間時間算出手
    段により算出した補間開始までの時間の間、前記前の有
    声音に関するフォルマントパラメータを前記フォルマン
    ト音源に出力する第1のフォルマントパラメータ出力手
    段と、 (c)前記補間開始までの時間が経過したことを検出す
    る補間開始時間検出手段と、 (d)前記補間開始までの時間が経過したときは、前記
    前の有声音のフォルマントパラメータから前記後の有声
    音のフォルマントパラメータまでの間を、前記補間時間
    で補間し、補間結果を前記フォルマント音源に順次出力
    する補間手段と、 (e)前記補間時間が経過したことを検出する補間時間
    検出手段と、 (f)前記補間時間が経過したときは、前記後の有声音
    に関するフォルマントパラメータを前記フォルマント音
    源に出力する第2のフォルマントパラメータ出力手段と
    からなることを特徴とする請求項1記載のフォルマント
    音源の パラメータ生成装置。
  6. 【請求項6】前記音韻発生タイミング情報は各音韻の発
    音継続時間を示す発音時間情報であり、前記補間開始タ
    イミング情報は各音韻の発音継続時間に対する割合を示
    すデッドレートであり、 前記制御手段は、 (a)前記前の有声音の発音時間情報が示す発音継続時
    間と前記デッドレートとを乗算することにより前記前の
    有声音の発音開始から補間開始までの時間を算出すると
    ともに、前記前の有声音の発音時間から前記算出した補
    間開始までの時間および次に発音すべき無声音の発音時
    間を減算することにより補間を実行する補間時間を算出
    する補間時間算出手段と、 (b)前記前の有声音の発音開始から前記補間時間算出
    手段により算出した補間開始までの時間の間、前記前の
    有声音に関するフォルマントパラメータを前記フォルマ
    ント音源に出力する第1のフォルマントパラメータ出力
    手段と、 (c)前記補間開始までの時間が経過したことを検出す
    る補間開始時間検出手段と、 (d)前記補間開始までの時間が経過したときは、前記
    前の有声音のフォルマントパラメータから前記後の有声
    音のフォルマントパラメータまでの間を、前記補間時間
    および前記無声音の発音時間で補間し、補間結果を前記
    フォルマント音源に順次出力する補間手段と、 (e)前記補間時間が経過したことを検出する補間時間
    検出手段と、 (f)前記補間時間が経過したときは、前記無声音に関
    するフォルマントパラメータを前記フォルマント音源に
    出力し、その後に、前記後の有声音に関するフォルマン
    トパラメータを前記フォルマント音源に出力する第2の
    フォルマントパラメータ出力手段とからなることを特徴
    とする請求項1に記載のフォルマント音源の パラメータ
    生成装置。
  7. 【請求項7】前記制御手段は、 (a)前記有声音の発音継続時間が所定時間より長いと
    きは、前記請求項1乃至6に記載の補間方法で補間し、 (b)前記有声音の発音継続時間が所定時間より短いと
    きは、前記有声音の合成初期は目標値への変化が緩く後
    期になって目標値への変化が急になる補間方法で補間す
    ることを特徴とする請求項1から6の何れか1つに記載
    のフォルマント音源の パラメータ生成装置。
JP7234731A 1995-08-03 1995-08-21 フォルマント音源のパラメータ生成装置 Expired - Fee Related JP3022270B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7234731A JP3022270B2 (ja) 1995-08-21 1995-08-21 フォルマント音源のパラメータ生成装置
US08/687,976 US5703311A (en) 1995-08-03 1996-07-29 Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7234731A JP3022270B2 (ja) 1995-08-21 1995-08-21 フォルマント音源のパラメータ生成装置

Publications (2)

Publication Number Publication Date
JPH0962297A JPH0962297A (ja) 1997-03-07
JP3022270B2 true JP3022270B2 (ja) 2000-03-15

Family

ID=16975487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7234731A Expired - Fee Related JP3022270B2 (ja) 1995-08-03 1995-08-21 フォルマント音源のパラメータ生成装置

Country Status (1)

Country Link
JP (1) JP3022270B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6024191B2 (ja) * 2011-05-30 2016-11-09 ヤマハ株式会社 音声合成装置および音声合成方法
JP6728755B2 (ja) 2015-03-25 2020-07-22 ヤマハ株式会社 歌唱音発音装置

Also Published As

Publication number Publication date
JPH0962297A (ja) 1997-03-07

Similar Documents

Publication Publication Date Title
US5703311A (en) Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques
JP3144273B2 (ja) 自動歌唱装置
JP6561499B2 (ja) 音声合成装置および音声合成方法
US8103505B1 (en) Method and apparatus for speech synthesis using paralinguistic variation
JP3287230B2 (ja) コーラス効果付与装置
US5212731A (en) Apparatus for providing sentence-final accents in synthesized american english speech
Bonada et al. Singing voice synthesis combining excitation plus resonance and sinusoidal plus residual models
US7280969B2 (en) Method and apparatus for producing natural sounding pitch contours in a speech synthesizer
JP6390690B2 (ja) 音声合成方法および音声合成装置
JP3022270B2 (ja) フォルマント音源のパラメータ生成装置
AU769036B2 (en) Device and method for digital voice processing
Dutilleux et al. Time‐segment Processing
EP2634769B1 (en) Sound synthesizing apparatus and sound synthesizing method
JP4963345B2 (ja) 音声合成方法及び音声合成プログラム
JP3083624B2 (ja) 音声規則合成装置
JPH1031496A (ja) 楽音発生装置
WO2023140151A1 (ja) 情報処理装置、電子楽器、電子楽器システム、方法及びプログラム
JPH02293900A (ja) 音声合成装置
JPH02153397A (ja) 音声収録装置
JP3294192B2 (ja) 音声変換装置及び音声変換方法
JP2658109B2 (ja) 音声合成装置
JP3862300B2 (ja) 音声合成に用いる情報の処理方法および装置
JP2809769B2 (ja) 音声合成装置
JP2573586B2 (ja) 規則型音声合成装置
JP3284634B2 (ja) 規則音声合成装置

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100114

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees