JPH01185700A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH01185700A
JPH01185700A JP63009247A JP924788A JPH01185700A JP H01185700 A JPH01185700 A JP H01185700A JP 63009247 A JP63009247 A JP 63009247A JP 924788 A JP924788 A JP 924788A JP H01185700 A JPH01185700 A JP H01185700A
Authority
JP
Japan
Prior art keywords
syllable
data
phoneme
speech
acoustic tube
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63009247A
Other languages
English (en)
Inventor
Norio Suda
典雄 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP63009247A priority Critical patent/JPH01185700A/ja
Publication of JPH01185700A publication Critical patent/JPH01185700A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 この発明は音響管を使用した規則合成による音声合成方
法に関する。
B1発明の概要 この発明は規則合成による音声合成方法において、 音節を音節データ単泣毎に切り換えて第1.第2音素処
理部に与えて両データを別々に処理したのち、第1.第
2音響管モデルに入力させ、その出力に音声波形信号を
得たのち、両モデル部の音声波形信号の出力タイミング
をずらせて加算させるようにしたことにより、 母音から子音に移る工程の処理が容易にできるようにし
たしのである。
C従来の技術 人口的に音声を合成して出力する電子装置は、最近にな
って1ないし数チップの音声認識や音声合成のLSIが
音声情報処理と半導体の大規模集積回路技術により低価
格で実現されるようになり、その使用目的、制約条件に
より種々の方式が提案されている。この音声合成には、
人間の発生した生の音声を録音しておき、これを適当に
結合して文章に編集する録音編集方式と、人間の声を直
接的には利用せず、人間の音声のパラメータだけを抽出
し、音声合成過程で、そのパラメータを制約して人口的
に音声信号を作り出す方法がある。
このパラメータ方式で良質な合成音が得られることで広
く利用されているパーコール(PARCOR)方式があ
る。
音声を電子計算機で扱う場合、音声波形をある周期毎に
サンプリングして各サンプリング点での音声信号の値を
アナログ/ディジタル変換し、その値を0と1の符号で
表示して行われるが、アナログ信号に忠実な記録をする
には、ビット数を増やす必要があるが音声合成信号は大
変多くのメモリーを必要とする。
そこで、この情報量を極力少なくするために各種の高能
率な符号化法が研究開発されている。
その方法の1つとして、1つの音声信号の情報に対し、
最低限1ビツトとした方式で、デルタ変調方式がある。
この方式は、1ビツトの使い方として、次にくる音声信
号値が現在の値より高いか低いかを判定して、高ければ
符号“l”、低ければ符号“0”を与え音声信号の符号
化を行うもので、実際のンステム構成としては一定の振
幅ステップ量(デルタ)を定めておき、誤差が蓄積され
ないように今までの符号化によって得られる音声の値と
、入力してくる音声信号との残差信号に対して、符号化
を行う。
このような構成は予測コード化といわれ、線形予測法(
何個か11りのサンプル値から予測する)およびパーコ
ール方式(線形予測法の予測係数の代わりにパーコール
係数にといわれろ偏自己相関関数を用いる)がある。
D 発明が解決しようとする課題 前述のように予測コード化を用いたものは、音と音との
継ぎ目に相当する調音結合が難しいという問題がある。
例えば母音から子音を経て母音に至る発生において、母
音の定常から過渡を経て子音に至りまた母音の過渡を経
て母音の定常音に至る過程で母音と母音の継ぎ目の音が
跡切れ、人間が聞いたときに自然な感じを与えない。
61課題を解決するための手段 この発明は入力された文字を、予め設けられた辞書登録
部に登録された言語を用いて日本語処理部にて処理し、
その後、処理された言語を音節処理部でピッチ、エネル
ギー、継続時間に区分した音節データを作成し、この音
節データを音節データ単位毎に区分して切り換え、単位
音節データを第1音素処理部と第2音素処理部に交互に
与えてデータ処理し、処理された音素データを第1音響
管モデル部と第2音響管モデル部にそれぞれ入力し、そ
の出力に音声波形信号を得た後、両モデル部から出力さ
れる音声波形信号のタイミングをずらせて、両モデル部
の音声波形信号の一部が重なるようにして両波形信号を
加算させて音声合成出力を得るようにしたしのである。
F 作用 音節データを音節データ単位毎に区分して切り換え、そ
れぞれを第1.第2音素処理部でデータ処理してから第
1.第2音響管モデル部で音声波形信号にする。その後
、両モデル部から出力された音声波形信号のタイミング
をずらせて、両波形信号を加算したため、母音から子音
を経て母音に至る発声において、音と音との継ぎ目に相
当する調音結合が容易にできるようになる。このため、
人間か聞いたときでら自然な音声として聞くことができ
ろ。
G、実施例 まず、この発明の基礎となる先願発明(特願昭62−9
1705号)の概要について述べる。先願発明は次のよ
うに構成されている。
人間の音の発生は人間の口腔、音響管の長さや断面積等
の形状変化によって作り出されるので、これら音響管の
音波の伝達を表す進行波現象を音響等価回路で解析し、
音響管の断面積がサージインピーダンスに反比例するこ
とに着目し、サージインピーダンスを変化させることで
断面積を模擬的に変化させ、サージインピーダンスを連
続的変化することで調音結合をスムーズに行うことがで
きるようにして人間の発声と同様な音の合成を容易とな
し、音声の自然性の向上を図るようにしたものである。
上記のように構成された先願発明において、音声発声時
の声道の断面積変化は、例えば「ア」の発声の場合は、
喉の奥が狭く口唇が開いた状態で肺から押し出される吸
気で声帯が吸気を断続的に開閉して声道(音響管)の中
で反射を繰り返して出てくる音波が「ア」の音声波形と
なって出てくる。「イ」は喉の方か広く口唇の先か狭い
と「イ」の音声波形が出力される。
このように口の恰好で周波数か決まり、口の恰好を模擬
すれば「ア」なり「イ」が発声されろ。
口の恰好は音響管の断面積で模擬でき、また、音響管の
断面積の変化はサージアドミッタンスの変化で模擬でき
る。従って、サージアドミッタンスを変化させれば口の
恰好が模擬できることになる。
サージアドミッタンスの変化は電気回路上極めて容易に
可変できるので、電気信号によって様々な音声を合成す
ることができる。第5図(ア)は断面積A+、At、・
・A、と異なる断面積をもった音響管を接続して声道を
模擬したものである。同図(イ)はその音響インピーダ
ンスを電気回路のLC回路に置き換えたもので、各音響
管を1個のLC線路とし、全体を集中線路のn−1の電
気回路としたものである。また第5図(つ)は進行波等
価モデル図で、各音響管の音響インピーダンスZ1、Z
、・・・Znは、音響管の断面積に反比例(音響アドミ
ッタンスは比例)し、音波の速度Cに比例するので、(
ρは空気密度) となる。なお、同図でZgは音源インピーダンス。
ZLは放射インピーダンスを示し、またブロック間の矢
印は、進行波と後進波を表している。
今「アjという音声を発声させる場合は、口唇の先に相
当する音響管の断面積のところで「ア」の口の恰好を与
えて、インパルスPを断続的に印加tろことで、「ア」
の音が得られ、また「ア」から「イ」の音を発声させろ
場合は、口唇の先に相当する音響管の断面積を狭め「イ
」の口の恰好を与えることで「イ」が得られる。
インパルスPが連続して断続的に与えられ、断面積全体
を「イ」の口の恰好に変化させる場合、声心は第5図に
示すn個の音響管によって模擬しているので、これらの
各断面積を「ア」から動かして口の恰好を「アーイ」と
連続的に変えることになる。この音響管の断面積を変え
るということは、サージインピーダンスを徐々に変える
ことによって行われる。
従って、断面積は連続的に変えられるので、定常状態の
「ア」、「イ」の音か得られることは勿論であるが、更
にインピーダンスは連続して可変できるので、その中間
の音、即ち音と音との間の音を得ることができる。従っ
て音の切れが無く人間の発声に近い調音結合がスムーズ
に行われる。
次に音波の伝搬速度を考えると、これは長さQでLCを
持った電線路にインパルスを印加した時の過渡現象に似
ている。
即ち第6図に示すようにLCを有する線路を等価的に表
すと第7図のようになる。ここで両端部からみたサージ
インピーダンスZ。+、201は、ZO,=  L/C
、Z、t=  L/Cとなる。
ここで相手から到達してきた進行波を等価的な電流源と
考えろと、 となり電流は中間にn個の遅延回路ブロックZがあれば
、n時間後に出力される。即ち左側の回路で発生したし
のがτ時間後右側に到達したということになる。
となる。但し、ディジタル計算においては、電圧または
電流を細分割するのでV、、V、は計測時刻りにおける
電圧、では経過時間を示している。
第7図では、L、C回路にインパルスを印加すれば、τ
時間後に出力管側に出る。そしてτ時間前到達されたも
のは相手にも到達しているということを等価的に表して
いる。線路の長さQを1にするということは、遅延ブロ
ックnを正規化してlにすることで計算し易くなる。Q
を3cmに刻む場合は遅延ブロックのnを3ブロツクに
すればよい。
第5図(ア)を人間の声道は男性で約17cmなので、
Lc、w刻みで17本の音響管で模擬すれば、八〇から
入った波形は、半周期の電流を10に分割しその△むを
lOμsecとすれば、170μsecかかつてA n
 Illから出てくる。
従って、音響管断面積A1〜Anの断面積変化に対応し
た演算処理を演算処理装置で行い音響管A。
〜Anの個々の等価回路を流れる各部の電流値および関
数をテーブルとして有するメモリと、当該等価回路の各
部の電流値を演算する演算手段と、前記等価回路とは相
隣接する等両回路の電流値を用いて電流値を演算する演
算手段とを備えて演算処理を行えば音声信号が得られ、
その出力をD/A変換してスピーカに出力すれば、スピ
ーカより音声として出力される。
次に上記の音響管モデルを使用して文字入力信号から規
則によって音声を合成する実施例について説明する。
第1図はこの発明の一実施例を説明するためのブロック
図で、1は日本語処理部で、この処理部lは漢字かな混
じりで書かれた文章を入力として受(十とり、これを辞
書登録部2の辞書登録と対応させて文節、句、文の区切
、形態素分類の自然語解析を行い、更にアクセント処理
を行って、これを表音変換してイントネーションをつけ
て文章処理データを作るものである。3は上記日本語処
理部1で処理されたデータから音節データを得る音節処
理部で、この音節処理部3で得られたデータには下記に
示すrPJ、rEJ、rTjの音節パラメータを有す。
この音節パラメータは子音の110個〜140個(普通
に話せる言葉は110個程度あればよい)の音節毎に音
の高さ(ピッチP)、音の強さ(エネルギーE)および
継続時間(T)に区分され、これらの値を調整して音声
のレベルが合わせられている。この音節パラメータの1
例を第2図に示す。この第2図は「桜」の場合を例示し
たもので、「SA」、「KU」、「RA」の各音節毎に
ピッチP、エネルギーE1時間Tが正規化されている。
4は音節処理部3から出力された音節データをその単位
毎(rsAJ、rKUj、rRAJ)に切り換える音節
データ切換部で、この音節データ切換部4は音節データ
単位、例えばrsAJ 。
rKUj、f’4Ajを交互に切り換えて出力すもので
ある。出力された音節データ、例えばrsAJは第1音
素処理部5に、rKUJは第2音素処理部6に、rl’
lAjは第1音素処理部5に順次交互に入力される。第
1.第2音素処理部5.6に入力された音節データは面
記音節パラメータにより処理されてその出力に音素レベ
ルデータが送出される。この音素レベルデータは第1.
第2パラメータ補間処理部7.8で音素パラメータ(後
述する)によりパラメータ捕間される。
音素パラメータは第3図に示すように、各音素毎に音の
立上り部01.定常部Ot、立下り部03に区分され、
各区分毎に、音素時定数、継続時間、ピッチ、ピッチ時
定数、エネルギー、エネルギー時定数、音源、断面積を
正規化し、各区分毎のデータのブロックを形成する。こ
のようにして形成されたブロックを第3図に示す。この
第3図は前記「桜」を例にとったもので、rsJ、rA
J。
rKJ、rUJ、、rRJ、rAJの各音素における区
分の立上り部O1であれば、DO,、T、、P、。
DP、、E、、DE、、G、のデータユニットを形成す
る。これらのデータユニットは第5図に示す音響管モデ
ルの断面積A1−八〇の各断面積A、・1〜A n ’
 nに対応して設けられている。すなわち、音響管モデ
ルの断面積Aが17ある場合は各音節毎に6x17=1
02のデータが用伍される。なお、第3図において、各
時定数は前の区分の最終値から、当該区分のそれぞれに
対応する目標値への動き方を指定する。時間Tは継続時
間で、この時間′r内に上記の各処理が行われろ。また
、音源G2、G2、G3は子音部分では6区分毎に時間
T内に300パフ、母音部では50パフ程度のパルスで
音諒を与えろ。
9、lOは第1.第2音響管モデル部で、このモデル部
9.10には第1.第2パラメータ補間処理部7.8の
出力が供給され、ここで音響管の断面積の変化を模擬ず
ろ制御が行われる。その出力は第4図A、[3に示すよ
うに、rsAJの音節からrKUJの音節に移るとき、
−都電なるようにタイミングをずらして加算器11に入
力されて合成する。そのときの合成波形は第4図Cに示
すようになり、音節から音節に移るのが滑らかに行われ
るようになる。加算器11で合成した出力は、D/A変
換部12に供給されてアナログ信号に変えられてスピー
カ13から音声出力が送出される。
H4発明の効果 以上述べたように、この発明によれば、第1゜第2音響
管モデル部からの出力信号を互いにタイミングをずらし
て音節の一部出力が重なるようにしたので、音と音との
継ぎ目に相当する調音結果が容易にできるようになり、
人間がその音を聞いたときでも自然な音声として聞くこ
とができるようになる。
【図面の簡単な説明】
第1図はこの発明の一実施例を示すブロック図、第2図
は音節パラメータ説明図、第3図は音素パラメータ説明
図、第4図A、B、Cは波形図、第5図(ア)は音響管
モデル図、第5図(イ)は音響管の電気回路モデル図、
第5図(つ)は音響管の進行波等価モデル図、第6図は
音声伝搬を電気的に模擬した電気回路図、第7図は第6
図の等価回路図である。 1・・・日本語処理部、2・・・辞書登録部、3・音節
処理部、4−・音節データ切換部、5.6・・・第1゜
第2音素処理部、7.8・第1.第2パラメータ補間部
、9.lO・・第1.第2音響管モダル部、!1・・加
算器、12・・D/A変換器第3区 言木パラメータ苫光明回 第4図 液形S 第6図 1摺p5イj【搬 の電気σつ慣用ξL医第7図 匈テ イ面 回 路 ロー 手続補正盲動式) 昭和63”5”lO”

Claims (1)

    【特許請求の範囲】
  1. (1)入力された文字を、予め設けられた辞書登録部に
    登録された言語を用いて日本語処理部にて処理し、その
    後、処理された言語を音節処理部でピッチ、エネルギー
    、継続時間に区分した音節データを作成し、この音節デ
    ータを音節データ単位毎に区分して切り換え、単位音節
    データを第1音素処理部と第2音素処理部に交互に与え
    てデータ処理し、処理された音素データを第1音響管モ
    デル部と第2音響管モデル部にそれぞれ入力し、その出
    力に音声波形信号を得た後、両モデル部から出力される
    音声波形信号のタイミングをずらせて両モデル部の音声
    波形信号の一部が重なるようにして両波形信号を加算さ
    せて音声合成出力を得るようにしたことを特徴とする音
    声合成方法。
JP63009247A 1988-01-19 1988-01-19 音声合成方法 Pending JPH01185700A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63009247A JPH01185700A (ja) 1988-01-19 1988-01-19 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63009247A JPH01185700A (ja) 1988-01-19 1988-01-19 音声合成方法

Publications (1)

Publication Number Publication Date
JPH01185700A true JPH01185700A (ja) 1989-07-25

Family

ID=11715077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63009247A Pending JPH01185700A (ja) 1988-01-19 1988-01-19 音声合成方法

Country Status (1)

Country Link
JP (1) JPH01185700A (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4950803A (ja) * 1972-09-18 1974-05-17
JPS56111898A (en) * 1980-02-08 1981-09-03 Sanyo Electric Co Voice synthetizer
JPS61118798A (ja) * 1984-11-15 1986-06-06 松下電器産業株式会社 音声合成装置
JPS61119798A (ja) * 1984-11-14 1986-06-06 株式会社 千代田化学研究所 サイズ剤

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4950803A (ja) * 1972-09-18 1974-05-17
JPS56111898A (en) * 1980-02-08 1981-09-03 Sanyo Electric Co Voice synthetizer
JPS61119798A (ja) * 1984-11-14 1986-06-06 株式会社 千代田化学研究所 サイズ剤
JPS61118798A (ja) * 1984-11-15 1986-06-06 松下電器産業株式会社 音声合成装置

Similar Documents

Publication Publication Date Title
Flanagan et al. Synthetic voices for computers
US5097511A (en) Sound synthesizing method and apparatus
JPH01185700A (ja) 音声合成方法
JP2990691B2 (ja) 音声合成装置
JP2990693B2 (ja) 音声合成装置
JPH01219896A (ja) 音声合成方式
JPH01177097A (ja) 音声合成方式
JPH01171000A (ja) 音声合成方式
JP2992995B2 (ja) 音声合成装置
JPH01177096A (ja) 音声合成方式
JPH0833751B2 (ja) 音声合成方式
JPH01182900A (ja) 音声合成方式
JPH01292400A (ja) 音声合成方式
JPH01177098A (ja) 音声合成装置
JPH01177100A (ja) 音声合成方式
JPH01219894A (ja) 音声合成方式
JPH0833749B2 (ja) 音合成方法
D’Souza et al. Comparative Analysis of Kannada Formant Synthesized Utterances and their Quality
JPS63257000A (ja) 音合成方法
JPH01219899A (ja) 音声合成装置
JPH01177099A (ja) 音声合成方式
Singh et al. Removal of spectral discontinuity in concatenated speech waveform
JP2910587B2 (ja) 音声合成装置
JPH0833750B2 (ja) 音声合成方法
JPH01219898A (ja) 音声合成装置