JP2989615B2 - 音声合成歌唱器 - Google Patents

音声合成歌唱器

Info

Publication number
JP2989615B2
JP2989615B2 JP1142401A JP14240189A JP2989615B2 JP 2989615 B2 JP2989615 B2 JP 2989615B2 JP 1142401 A JP1142401 A JP 1142401A JP 14240189 A JP14240189 A JP 14240189A JP 2989615 B2 JP2989615 B2 JP 2989615B2
Authority
JP
Japan
Prior art keywords
voice
data
pitch
clock
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1142401A
Other languages
English (en)
Other versions
JPH037993A (ja
Inventor
寛治 国澤
登 上地
彰 山村
順子 大向
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Electric Works Co Ltd
Original Assignee
Matsushita Electric Works Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Works Ltd filed Critical Matsushita Electric Works Ltd
Priority to JP1142401A priority Critical patent/JP2989615B2/ja
Publication of JPH037993A publication Critical patent/JPH037993A/ja
Application granted granted Critical
Publication of JP2989615B2 publication Critical patent/JP2989615B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、合成音声で歌唱を行わせる音声合成歌唱器
に関するものである。
[従来の技術] 従来、人工的に音声を合成して出力する音声合成方式
としては、録音編集方式、パラメータ編集方式、規則合
成方式の3種類に分類されるものがある。この中のパラ
メータ編集方式や規則合成方式では、線形分離等価回路
モデル(株式会社オーム社発行『音声情報処理の基礎』
斉藤収三、中田和男著(昭和56年11月30日発行(第76頁
乃至77頁参照)が用いられることが多い。
[発明が解決しようとする課題] ところで、上述のような音声合成方式により発生され
た合成音声により歌唱を行わせることが考えられるが、
線形分離等価回路モデルを用いた音声合成器により歌の
合成音を出力させる場合には、次のような問題点があ
る。
すなわち、PARCOR方式などの線形分離等価回路モデル
による音声合成用LSIが市販されているが、このような
音声合成用LSIなどでは、音声データとしてパルス発生
器へ入力されるデータはパルスの間隔(ピッチ)と振幅
であり、間隔については合成波形のサンプリング周期の
整数倍で与えられる。そのため、ピッチのとり得る値は
不連続となり、正確な音程がとれなくなる。例えば、サ
ンプリング周波数が10KHz(周期100μsec)の場合の正
確な音程からのずれは第3図に示すようになる。
このような音程ずれを回避するためには、パルス発生
器の部分または全体のサンプリング周期を短くし、とり
得る値を細かく設定できるようにする(パルス発生器の
部分だけサンプリング周期を短くする場合は、それによ
って生成されたパルス列をフィルタ部のサンプリング周
期でサンプリングし直したものをフィルタ部への入力と
する)などの方法が考えられる。しかしながら、このよ
うな方法を実現するためには回路の変更が必要となり、
既存の音声合成用LSIなどは利用できなくなり、このよ
うな方法を実現した音声合成器は高価なものとなってし
まうという問題があった。
本発明は、上記の問題点に鑑みて為されたものであ
り、その目的とするところは、既存の音声合成LSIを用
いた比較的簡単な方法で正確な音程を出力でき、安価で
高品質な音声合成歌唱器を提供することにある。
[課題を解決するための手段] 本発明の音声合成歌唱器は、クロック発生回路から入
力されるクロック周波数と1対1の関係で変化するサン
プリング周波数で音声を合成する音声合成回路を備え、
入力された歌の音声データに基づいて音声合成回路から
歌の合成音を出力する音声合成歌唱器において、音階に
対応し音声合成回路から出力される音声波形のピッチを
音声データの音階のピッチに一致させるための補正がさ
れたピッチデータ及びクロックデータが記憶されるデー
タテーブルを有し、音階で表現されたピッチに関する音
声データが外部より入力されると入力された音声データ
に対応するピッチデータ及びクロックデータをデータテ
ーブルから読み出し、読み出したピッチデータを音声合
成回路に出力するとともに読み出したクロックデータに
基づいてクロック発生回路を駆動することで合成音声の
音階を補正する補正手段を備えたものである。
[作 用] 本発明は上述のように構成されており、音階に対応し
音声合成回路から出力される音声波形のピッチを音声デ
ータの音階のピッチに一致させるための補正がされたピ
ッチデータ及びクロックデータが記憶されるデータテー
ブルを有し、音階で表現されたピッチに関する音声デー
タが外部より入力されると入力された音声データに対応
するピッチデータ及びクロックデータをデータテーブル
から読み出し、読み出したピッチデータを音声合成回路
に出力するとともに読み出したクロックデータに基づい
てクロック発生回路を駆動することで合成音声の音階を
補正する補正手段を備えたものであり、既存の音声合成
LSIを用いた比較的簡単な方法で正確な音程を出力で
き、安価で高品質な音声合成歌唱器を提供できるように
なっている。
[実施例] 第1図は本発明一実施例を示すもので、クロック発生
回路4から入力されるクロック周波数と1対1の関係で
変化するサンプリング周波数で音声を合成する音声合成
回路(実施例では、例えば、特願昭63−177315号のよう
な規則合成方式を用いた音声合成用LSI)1を備え、入
力された歌の音声データ(音階、強さ、長さより成る韻
律データと、音韻データ)に基づいて音声合成回路1か
ら歌の合成音を出力する音声合成合唱器において、音階
に対応し音声合成回路1から出力される音声波形のピッ
チを音声データの音階のピッチに一致させるための補正
がされたピッチデータ及びクロックデータが記憶される
データテーブル3を有し、音階で表現されたピッチに関
する音声データが外部より入力されると入力された音声
データに対応するピッチデータ及びクロックデータをデ
ータテーブル3から読み出し、読み出したピッチデータ
を音声合成回路1に出力するとともに読み出したクロッ
クデータに基づいてクロック発生回路4を駆動すること
で合成音声の音階を補正する補正手段を備えたものであ
る。実施例では、上記補正手段はCPU2にて形成されてお
り、CPU2では、音階に対応したピッチデータをデータテ
ーブル3から読み出して音声合成回路1に入力するピッ
チパラメータを作成(同時にアンプパラメータおよび調
音パラメータも作成)するとともに、データテーブル3
からクロックデータ(D/Aコンバータに与える値)を読
み出してクロック発生回路4のD/Aコンバータ4aを制御
し、V−fコンバータ4bにて発生された所定周波数のク
ロックを音声合成回路1に入力させるようになってい
る。なお、データテーブル3内に記憶されているデータ
は、音声合成回路1にて合成されスピーカSPから出力さ
れる音声波形のピッチを正確な音階のピッチと一致させ
るための補正値を考慮(ずれを補正)したものであるこ
とは言うまでもない。
また、実施例では、音声合成回路1のクロック周波数
に時系列的なゆらぎを付加するゆらぎ付加手段(CPU2内
にソフト的に形成)を設けている。
以下、実施例の動作について説明する。いま、実施例
では、外部から入力される音韻データおよび韻律データ
よりなる歌音声の音声データを入力データとし、CPU2に
よって音声合成回路1を制御して音声合成を行うように
なっており、歌音声の規則合成を行う場合の時系列ピッ
チ(ピッチパターン)の生成方法としては、ある音階の
期間は一定の値をとり、音階と音階の境界部で直線補間
してパターンを生成する方法(例えば、特願昭63−1773
15号)などが考えられる。
この際に、従来例にあっては、音階に正確に対応した
ピッチの値を与えることができないので、合成された歌
音声が音程のずれた音声になってしまうことになるが、
本実施例にあっては、クロックの周波数を補正すること
によって音声合成回路1から出力される音声波形を時間
伸縮することにより、このずれを修正するようにしてい
る。すなわち、音声合成回路1から出力される音声波形
の時間伸縮は、音声合成回路1のサンプリング周期を変
えることにより行うもので、例えば、音声合成回路1に
与えるピッチの値が本来与えるべき値よりも1%長いと
すると、サンプリング周期を1/1.01倍するわけである。
第2図は動作説明図であり、同図(a)はピッチP′を
P′=nT(但し、T:サンプリング周波数)として得られ
る合成音声波形、同図(b)はピッチP″をP″=(n
+1)Tとして得られる合成音声波形、同図(c)は同
図(a)の波形を伸長(クロックを補正)して本来のピ
ッチPで繰り返されるようにした場合の合成音声波形で
ある。
このような補正処理をすると、時間軸が変化するので
音韻長に、スペクトルが変化するので音韻性に影響を与
えると考えられる。時間伸縮によるスペクトルの変化に
ついて考えると、f(a*t)のフーリエ変換はF(ω
/a)/aであるから、時間を伸縮させるとスペクトルは周
波数軸、振幅軸ともに伸縮することになる。
ところで伸縮させる量について考えると、第3図より
最も大きい場合で2.5%であるから、時間伸縮によって
受ける音韻長と音韻性の変化は無視できると考えられ
る。なお、ピッチのずれは最大でも2.5%であるから無
視できるのではないかと考えられるが、隣り合う音階の
ピッチの差は6%しかないので、1音だけ聞けば問題は
ないかもしれないが、音楽として複数の音を連続して聞
く場合は問題になる。
また、サンプリング周期の制御は、音声合成回路1の
サンプリング周期は通常その音声合成回路1に入力され
るクロックに比例しているので、このクロックを制御し
てやれば良い。実施例では、V−fコンバータ(電圧−
周波数変換器)4aと、D/Aコンバータ4bとから成るクロ
ック発生回路4を用いてCPU1により制御している。
第4図に音声合成回路1の標準クロックが800KHzの場
合の各音階に対して音声合成回路1に与えるピッチの値
とそのときに正確な音程を得るためのクロック周波数の
値を示す。実際には、第1図(b)のようなデータテー
ブル3を用意し、入力された各音階データに対して一定
のピッチを与える区間において、データテーブル3から
音声合成回路1に与えるピッチの値と、正確な音程を得
るためのクロック周波数を発生させるためにD/Aコンバ
ータ4aに与える値を読み出し、その値をそれぞれ音声合
成回路1と、D/Aコンバータ4aに与えるようにする。以
上のようにクロック周波数を制御することにより、正確
な音程を持った歌音声を出力させることができる。
一方、ピッチパターンにゆらぎを付加(例えば、特開
昭50−54202号公報)することにより、より自然な声質
の合成音声を得ることができる。本実施例でゆらぎを与
えるためには、音声合成LSIに与えるクロック周波数の
時系列パターンに対してゆらぎを付加し、これを改めて
音声合成回路1に与えるクロック周波数とすればよい。
この場合、出力させたい音階に対するピッチの値を正確
に出力する必要はなくなるが、その値の近傍の値を出力
できるような回路である必要がある。
第5図は他の実施例を示すもので、クロック発生回路
4を、ラッチ4dと、発信器4eと、プリセッタブルカウン
タ4fとを用いて形成し、データテーブル3に記憶させる
音階に対応したピッチデータを、出力したい音階に対応
するピッチを四捨五入した整数とは限定せずに、音声合
成回路1に与えるピッチデータとクロック周期の組合せ
で最も出力したいピッチに近くなるものを選んで、テー
ブルデータを形成している。
第6図はこのようにして求めたピッチとクロック周期
を示すもので、この場合、音声合成回路1に与えるピッ
チのとり得る値を無制限とはせずに、ピッチの値をP、
Pを四捨五入したものをnとすると、とり得る値はn−
1、n、n+1としている。これは、遷移部でピッチの
直線補間を行う場合になるべく連続的に変化するように
と考えたからである。以上のようにすることにより、よ
り正確な音程が得られることになる。なお、本実施例で
も前記実施例と同様に、クロック周波数にゆらぎを与え
ることにより、ピッチパターンにゆらぎを与え、より自
然な声質の合成音声を出力することが考えられ、安価で
高品質な音声合成歌唱器を実現することができる。
第7図はさらに他の実施例を示すもので、クロック発
生回路4をラッチ4eおよびPLL回路4gで構成したもので
あり、この回路では、PLL回路4gの発振器の周波数がf
c、カウンタで分周される値が1/Nとすると、VCOから出
力される周波数fは、 f=fc・N ……(1) となる。このようにすると、高速動作のICを用いなくて
も、発振器の周波数fcを小さくし、カウンタのビット数
を大きくすることにより非常に細かいきざみ幅でクロッ
ク周波数を設定することが可能になる。
また、前記実施例と同様に、ゆらぎを付加することを
考えると、PLL回路4gでは、第5図実施例のように周波
数が飛び飛びに変化するのではなく、整定時間を長めに
してやれば、カウンタへの値を変えたときに((1)式
に基づいた)それに対応する周波数には連続的に徐々に
近づくので、ゆらぎとして三角波のようなものを付加し
た場合は、連続的に変化するクロック周波数が得られ
る。例えば、第8図に示すように、中心周波数が800Hz
のものに対して幅が±10Hz、周波数が10Hzの三角波を重
畳する場合には、100msec毎に810Hzと790Hzに対応する
値をカウンタに交互に与えれば良い。不連続的に変化す
るゆらぎをもつピッチパターンによる歌の合成音声と、
連続的に変化するゆらぎをもつピッチパターンによる歌
の合成音声を聞き比べると後者の合成音声のほうが肉声
に近い品質であり、この点からもPLL回路4gを用いる方
法は有効であると言える。
[発明の効果] 本発明は上述のように構成されており、音階に対応し
音声合成回路から出力される音声波形のピッチを音声デ
ータの音階のピッチに一致させるための補正がされたピ
ッチデータ及びクロックデータが記憶されるデータテー
ブルを有し、音階で表現されたピッチに関する音声デー
タが外部より入力されると入力された音声データに対応
するピッチデータ及びクロックデータをデータテーブル
から読み出し、読み出したピッチデータを音声合成回路
に出力するとともに読み出したクロックデータに基づい
てクロック発生回路を駆動することで合成音声の音階を
補正する補正手段を備えたものであり、既存の音声合成
LSIを用いた比較的簡単な方法で正確な音程を出力で
き、安価で高品質な音声合成歌唱器を提供できるという
効果がある。
【図面の簡単な説明】
第1図(a)は本発明一実施例の概略構成図、第1図
(b)は同上の要部説明図、第2図乃至第4図は同上の
動作説明図、第5図は他の実施例の概略構成図、第6図
は同上の動作説明図、第7図は他の実施例の概略構成
図、第8図は同上の動作説明図である。 1は音声合成回路、2はCPU、3はデータテーブル、4
はクロック発生回路である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 大向 順子 大阪府門真市大字門真1048番地 松下電 工株式会社内 (56)参考文献 特開 昭57−185498(JP,A) 特開 昭61−121097(JP,A) 実開 昭61−101800(JP,U) (58)調査した分野(Int.Cl.6,DB名) G10L 3/00 - 9/20

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】クロック発生回路から入力されるクロック
    周波数と1対1の関係で変化するサンプリング周波数で
    音声を合成する音声合成回路を備え、入力された歌の音
    声データに基づいて音声合成回路から歌の合成音を出力
    する音声合成歌唱器において、音階に対応し音声合成回
    路から出力される音声波形のピッチを音声データの音階
    のピッチに一致させるための補正がされたピッチデータ
    及びクロックデータが記憶されるデータテーブルを有
    し、音階で表現されたピッチに関する音声データが外部
    より入力されると入力された音声データに対応するピッ
    チデータ及びクロックデータをデータテーブルから読み
    出し、読み出したピッチデータを音声合成回路に出力す
    るとともに読み出したクロックデータに基づいてクロッ
    ク発生回路を駆動することで合成音声の音階を補正する
    補正手段を備えたことを特徴とする音声合成歌唱器。
  2. 【請求項2】音声合成回路のクロック周波数に時系列的
    なゆらぎを付加するゆらぎ付加手段を設けたことを特徴
    とする請求項1記載の音声合成歌唱器。
  3. 【請求項3】クロック発生回路を、D/Aコンバータおよ
    びV−fコンバータを用いて形成したことを特徴とする
    請求項1記載の音声合成歌唱器。
  4. 【請求項4】クロック発生回路を、発振器およびプリセ
    ッタブルカウンタを用いて形成したことを特徴とする請
    求項1記載の音声合成歌唱器。
  5. 【請求項5】クロック発生回路を、PLL回路を用いて形
    成したことを特徴とする請求項1記載の音声合成歌唱
    器。
JP1142401A 1989-06-05 1989-06-05 音声合成歌唱器 Expired - Lifetime JP2989615B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1142401A JP2989615B2 (ja) 1989-06-05 1989-06-05 音声合成歌唱器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1142401A JP2989615B2 (ja) 1989-06-05 1989-06-05 音声合成歌唱器

Publications (2)

Publication Number Publication Date
JPH037993A JPH037993A (ja) 1991-01-16
JP2989615B2 true JP2989615B2 (ja) 1999-12-13

Family

ID=15314490

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1142401A Expired - Lifetime JP2989615B2 (ja) 1989-06-05 1989-06-05 音声合成歌唱器

Country Status (1)

Country Link
JP (1) JP2989615B2 (ja)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57185498A (en) * 1981-05-11 1982-11-15 Matsushita Electric Works Ltd Voice synthesizer
JPS61121097A (ja) * 1984-11-16 1986-06-09 富士通株式会社 合成音声ビブラ−ト付与回路
JPS61101800U (ja) * 1984-12-07 1986-06-28

Also Published As

Publication number Publication date
JPH037993A (ja) 1991-01-16

Similar Documents

Publication Publication Date Title
JP3815347B2 (ja) 歌唱合成方法と装置及び記録媒体
US7016841B2 (en) Singing voice synthesizing apparatus, singing voice synthesizing method, and program for realizing singing voice synthesizing method
Macon et al. A singing voice synthesis system based on sinusoidal modeling
EP1701336B1 (en) Sound processing apparatus and method, and program therefor
US5895449A (en) Singing sound-synthesizing apparatus and method
JPS5953560B2 (ja) 音声の合成方法
JP4844623B2 (ja) 合唱合成装置、合唱合成方法およびプログラム
JP2003345400A (ja) ピッチ変換装置、ピッチ変換方法及びプログラム
JP4304934B2 (ja) 合唱合成装置、合唱合成方法およびプログラム
CN100524456C (zh) 歌唱声音合成方法和装置
JP2989615B2 (ja) 音声合成歌唱器
JP3307283B2 (ja) 歌唱音合成装置
JPH11126083A (ja) カラオケ再生装置
JP3540159B2 (ja) 音声変換装置及び音声変換方法
EP1505570B1 (en) Singing voice synthesizing method
JP3233036B2 (ja) 歌唱音合成装置
JP4565846B2 (ja) ピッチ変換装置
JP3265995B2 (ja) 歌唱音声合成装置及び方法
Bonada et al. Sample-based singing voice synthesizer using spectral models and source-filter decomposition
JPS587197A (ja) 歌声発生装置
JP3130305B2 (ja) 音声合成装置
EP0396141A2 (en) System for and method of synthesizing singing in real time
JP4207237B2 (ja) 音声合成装置およびその合成方法
JPH1031496A (ja) 楽音発生装置
JP3540160B2 (ja) 音声変換装置及び音声変換方法