JPH01167800A - 音声合成方法 - Google Patents

音声合成方法

Info

Publication number
JPH01167800A
JPH01167800A JP62326052A JP32605287A JPH01167800A JP H01167800 A JPH01167800 A JP H01167800A JP 62326052 A JP62326052 A JP 62326052A JP 32605287 A JP32605287 A JP 32605287A JP H01167800 A JPH01167800 A JP H01167800A
Authority
JP
Japan
Prior art keywords
radius
sound
acoustic
tube
shape
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62326052A
Other languages
English (en)
Other versions
JPH0833750B2 (ja
Inventor
Norio Suda
典雄 須田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Original Assignee
Meidensha Corp
Meidensha Electric Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meidensha Corp, Meidensha Electric Manufacturing Co Ltd filed Critical Meidensha Corp
Priority to JP62326052A priority Critical patent/JPH0833750B2/ja
Publication of JPH01167800A publication Critical patent/JPH01167800A/ja
Publication of JPH0833750B2 publication Critical patent/JPH0833750B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 A、産業上の利用分野 本発明は人間の音声合成方法に関する。
B0発明の概要 本発明は人間の音声合成方法において、音響管の半径を
音響管が全体的に形状変化する部分の半径とそれが小さ
く変化する部分の半径とをそれぞれ別々に演算し、その
演算結果における音響伝搬の現象が、送電線等の電気回
路における系統過渡現象に近似していることに着目して
、その演算出力をサージインピーダンス変化に対応させ
てサージインピーダンスを可変させたことにより、 自然な音質の音の合成を得るとともに、全体的に形状変
化する部分の半径の演算量を減少させるようにしたもの
である。
C0従来の技術 音声合成やミュージックシンセサイザー(電子楽器)等
の所謂者を人工的に合成して出力する電子装置は、最近
になって1ないし数チップの音声認識や音声合成のLS
Iが音声情報処理と半導体の大規模集積回路技術により
低価格で実現されるようになり、その使用目的、制約条
件により種々の方式が提案されている。この音声合成に
は、人間の発生した生の音声を録音しておき、これを適
当に結合して文章に編集する録音編集方式と、人間の声
を直接的には利用せず、人間の音声のパラメータだけを
抽出し、音声合成過程で、そのパラメータを制御して人
工的に音声信号を作り出す方法がある。
このパラメータ方式で良質な合成音が得られることで広
く利用されているパーコール(PARCOR)方式があ
る。
音声を電子計算機で扱う場合、音声波形をある周期毎に
サンプリングして各サンプリング点での音声信号の値を
アナログ/ディジタル変換し、その値を0と1の符号で
表示して行われるが、アナログ信号に忠実な記録をする
には、ビット数を増やす必要があるが音声合成信号は大
変多くのメモリーを必要とする。
そこで、この情報量を極力少なくするために各種の高能
率な符号化法が研究開発されている。
その方法の1つとして、1つの音声信号の情報に対し、
最低限1ビツトとした方式で、デルタ変調方式がある。
この方式は、1ビツトの使い方として、次にくる音声信
号値が現在の値より高いか低いかを判定して、高ければ
符号“ビ、低ければ符号“0°を与え音声信号の符号化
を行うもので、実際のシステム構成としては一定の振幅
ステップ量(デルタ)を定めておき、誤差が蓄積されな
いように今までの符号化によって得られる音声の値と、
入力してくる音声信号との残差信号に対して、符号化を
行う。
このような構成は予測コード化といわれ、線形予測法(
何個か前のサンプル値から予測する)およびパーコール
方式(線形予測法の予測係数の代わりにパーコール係数
にといわれる偏自己相関関数を用いる)がある。
D0発明が解決しようとする問題点 前述のように予測コード化を用いたものは、音と音との
継ぎ目に相当する調音結合が難しいという問題がある。
即ち第11図は横軸に音声発生の時間tをとり、縦軸に
パーコール係数kをとったもので、例えば母音から子音
を経て母音に至る発声において、母音の定常から過渡を
経て子音に至りまた母音の過渡を経て母音の定常音に至
る過程で母音と母音の継ぎ目の音が跡切れ、人間が聞い
たときに自然な感じを与えない。
E9問題点を解決するための手段 以上の点に鑑み、本発明は人間の音の発生は人間の口腔
断面積の形状変化によって作り出される。
そこで、これら音響管の音波の伝達を表す進行波現象を
音響管等価回路で解析し、音響管の半径を音響管が全体
的に形状変化する部分の半径と、それが小さく変化する
部分の半径とをそれぞれ別々に演算して、その和を求め
、その後、円周率と半径の2乗を乗算して断面積を求め
、その断面積がサージインピーダンスに反比例すること
に着目し、サージインピーダンスを変化させることで音
響管の半径を演算して求めた断面積を模擬的に変化させ
、サージインピーダンスを連続的に変化させることで調
音結合をスムーズに行うことができるようにして人間の
発声と同様な音の合成を容易となし音声の自然性の向上
を図るとともに全体的に形状変化する部分の演算量を減
算させるようにしたものである。
19作用 人間は口腔を動かすことにより、音を発声する。
本発明は音響管(人間の声帯から口唇までの声道も1つ
の音響管とみなすことができる)の半径rを例えば、人
間の「アゴ」の動きのような全体の動きの半径rIと、
「舌」の動きのような小さい動きの半径r、とを別々に
演算し、加算した後、πr2から断面積を求め、その断
面積を等価回路のサージインピーダンスにl対lに対応
させているので、このサージインピーダンスを変化させ
れば音響管の断面積を変化させたと同じとなる。このサ
ージインピーダンスの変更は、電気技術的に極めて簡単
にできるので、人間の音の発生と全く同様な音の合成が
でき、特に従来の問題点とされた音と音の継ぎ目にあた
る調音結合もサージインピーダンスを連続的に変化する
ことで良好に行われ、自然に近い音の発声ができる。
G、実施例 まず、本発明の実施例を述べる前に、本発明の背景につ
いて説明する。
音声を口から外に放射されるには、音源が必要で、この
音源は声帯に主って作り出される。一方声帯は2枚のヒ
ダを開閉することによって呼気を断続的に止める働きが
あり、その断続によってパフと呼ばれる空気流か発生し
、声帯を緊張させるとこのヒダに張力が加わりヒダの開
閉の周波数が高くなり、周波数の高いパフ音が発生する
。そして呼気流を大きくすると大きな音となる。
この音源波が声道のような円筒状の音響管を通過すると
、開放端から音波は共振現象によりある成分が強調され
、ある成分が減弱し複雑な母音の波形が作り出される。
音源が同じ波形をもっていても、口唇から放射されるま
でに通過する声道の形によって影響を受ける。即ち、声
道の形状が一定であれば音源のピッチや強度を変えても
スペクトル包絡はあまり変化しない。声道は母音によっ
て極めて複雑な形状を示すが、声道があまり変化しない
部分と大きく変化する部分に分けて考えることができる
。例えば第1図のように長さと断面積がA I、 A 
tとそれぞれ異なるような2つの音響管が接続したもの
と仮定することができる。
第1図は音響管モデル図、第2図はその等価回路図で、
断面積がA+、Atとそれぞれ異なる2つの音響管を接
続した場合である。
この音響管の接続する面に着目すると、音波の流れは断
面積の異なる場合、その異なる面で音波の一部が反射す
るという現象を生ずる。この現象は、電気回路でインピ
ーダンスの異なる線路にインパルス電流を流したときの
過渡現象と同じである。
音声の発生は、前述したように声帯による音源の断続に
よって行われるがこれは電気的には、インパルスが断続
的に印加されることと等価となる。
音は気体、液体、固体のいずれでも伝わる一種の振動で
あるが、電気回路的には、抵抗の無い無損失のしC分布
回路に対応させることができる。
そしてこの等価回路の電気的インピーダンス(V/I)
は、JL/Cとなるので、音波の場合に置き換えると音
波の速度、空気密度ρと音速Cを掛けたρCとなり、音
場におけるインピーダンス即ち音響インピーダンスは気
体の質量と音速だけに依存する。
断面積の異なる音響管が連設されていると、その境界面
で反射が起こる。これは電気的なサージインピーダンス
に模擬することができる。即ち、第1図のような音響管
の断面積の異なるブロックの接続された等価回路は第2
図に置き換えられる。
ここで、空気密度をρ、音速をCとすれば、各音響管の
音響アドミッタンスYl、Y2は次のように与えられる
但し2..21は音響インピーダンスである。
次に隣接ブロックよりの伝搬電流源をII、Itとし、
これにより決定される電流分布a l r a を及び
11+11および接合点の電圧をeとするとまたaI=
 i++ I i  a、= i2+Iti +=a+
  I l+   j t=at  Iとなり、次のス
テップのための隣接ブロックの伝搬電流源11’112
′は、 1%−f++a+、It’=L+atとなる。
上式でi+=a+  IIおよびLt=at  Isを
代入して11’=2a1 II、I%=2as  11
としてもよい。
上記の方式において断面積Aの時間に対する補間状況を
第5図に示す。この第5図は最も演算の簡単な直線補間
を示している。
第3図は音響管の電気回路等価モデル図で、その(ア)
図は声帯から口唇までの声道を1つの音響管とみなした
音響管モデル図、(イ)図はその電気回路モデル図、(
つ)図は進行波等価モデル図を示している。
第3図を説明するに先立ち、人間の母音はどのようにし
て作られるかを説明する。
第4図は音声発生時の声道の断面積変化を模擬したもの
で、その(ア)図は、「ア」の発声の場合で喉の奥か狭
く口唇が開いた状態で肺から押し出される呼気で声帯が
呼気を断続的に開閉して声道(音響管)の中で反射を繰
り返して出てくる音波が「ア」の音声波形となって出て
くる。「イ」は(イ)図のように喉の方が広く口唇の先
が狭いと「イ」の音声波形が出力される。
このように口の恰好で周波数が決まり、口の恰好を模擬
すれば「ア」なり[イ]が発声される。
口の恰好は音響管の断面積で模擬でき、また音響管の断
面積の変化は、サージアドミッタンスの変化で模擬でき
、サージアドミッタンスの変化は、電気回路上極めて容
易に可変できろ。第3図(ア)は断面積A + 、 A
 t・・・A、と異なる断面積をもった音響管を接続し
て声道を模擬したものである。同図(イ)はその音響イ
ンピーダンスを電気回路のLC回路に置き換えたもので
、各音響管をIgのLC線路とし、全体を集中線路のn
−1の電気回路としたものである。また第3図(つ)は
進行波等価モデル図で、各音響管の音響インピーダンス
’11.Zt・・・2.は、音響管の断面積に反比例(
音響アドミッタンスは比例)し、音波の速度に比例する
ので となる。なお、同図でZK音源インピーダンス。
ZLは放射インピーダンスを示し、またブロック間の矢
印は、進行波と反射波を表している。
今「ア」という音声を発声させる場合は、第4図の口唇
の先の断面積に相当する断面積A1のところで「ア」の
口の恰好を与えて、インパルスPを断続的に印加するこ
とで、「ア」の音が得られ、また「ア」から「イ」の音
を発声させる場合は、同図(イ)に示すように断面積を
A (’に狭め「イ」の口の恰好を与えることで「イ」
か得られる。
インパルスPが連続して断続的に与えられ、断面積全体
を「イ」の口の恰好に変化させる場合、声道は第3図に
示すn個の音響管によって模擬しているので、これらの
各断面積を「ア」から動かして口の恰好を「アーゼ」と
連続的に変えることになる。この音響管の断面積を変え
るということは、サージインピーダンスを徐々に変える
ことによって行われる。
上記のように断面積をAIからAI’に連続的に変えた
直線補間の例は第5図に示しである。この第5図におけ
る直線捕間の場合でも合成としてはかなり良くなるけれ
ども、人間の口腔の動きは断面積の直線的な動きに対応
しているのではなく、「アゴ」や「舌」等の上下関係に
対応しているため、合成音としては第5図に示す直線補
間では多不自然になることがある。
そこで、本発明は音響管の半径rを音響管が「アゴ」の
動きのように全体に形状変化する半径ri(マクロ半径
)と、それが「舌」の動きのように小さく変化する半径
rl′(ミクロ半径)とに分割して演算し、その和を求
める。このとき、人間の声道は男性で約#7cmなので
、1cm刻みで17本の音響管で模擬し、「ア」の声を
出したときの状態を描くと、第6図に示すようになる。
第6図において、図示右端が「くちびる」側である。
この第6図において、マクロ半径は図示直線SLで示す
ようになり、ミクロ半径は図示曲線CLになる。この第
6図からマクロ半径は直線変化するため、その演算半径
は17個も必要なく数個で充分であるので、半径r、の
演算量は少なくてすむ。
従って、上述のように半径を分割してr、+r、’”r
を求めた後、断面積AをA=πr“にて計算すれば演算
量が少なくなる。このようにして計算した結果を前記(
1)式、(2)式に代入することによって、(1)式、
(2)式の面積比、すなわち係数は次式となる。
なお、r 1 +  r 2は隣接する音響管の半径で
ある。
上述のように、音響管の半径rを演算し、その結果から
断面積を得るようにしたので、定常状態の「ア」、「イ
」の音が得られることは勿論であるが、その中間の音、
即ち、音と音との間の音が自然に近い音質かつ品質で得
ることができる。第7図は上記音響管の半径rを補間対
象として演算した結果の説明図で、図中−点鎖線で示す
曲線は半径rを演算したときの断面積の変化特性曲線で
ある。この曲線から音と音との間の音が自然に近い音質
で得られるようになる。
上記のものは隣接する2つの音響管の場合であるが、隣
接する多分岐管部の演算においては次の一般式を用いて
行う。
r ム Σrtk (但し、rkはに=1.2・・・n、n分岐管部のそれ
ぞれの音響管の半径、rlはi番目分岐管の半径である
) 次に音波の伝搬速度を考えると、これは長さQでLCを
持った電線路にインパルスを印加した時の過渡現象に似
ている。
即ち第8図に示すようにLCを有する線路を等価的に表
すと第9図のようになる。ここで両端部からみたサージ
インピーダンスZ。++Zotは、Z o+=JL/ 
C、Z ot−JL / Cとなる。
ここで相手から到達してきた進行波を等価的な電流源と
考えると、 となり電流は中間にn個の遅延回路ブロックZがあれば
、n時間後に出力される。即ち左側の回路で発生したも
のがτ時間後右側に到達したということになる。
となる。但し、ディジタル計算においては、電圧または
電流を細分割するのでV、、V、は計測時刻tにおける
電圧、τは経過時間を示している。
第9図では、L、C回路にインパルスを印加すれば、1
時間後に出力管側に出る。そしてτ時間面到達されたも
のは相手にも到達しているということを等価的に表して
いる。線路の長さeを1にするということは、遅延ブロ
ックnを正規化して1にすることで計算し易くなる。e
を3cmに刻む場合は遅延ブロックのnを3ブロツクに
すればよい。
第3図(ア)を人間の声道は男性で約17cmなので、
1cm刻みで17本の音響管で模擬すれば、AIから入
った波形は、半周期の電流を10に分割しそのΔtをl
Oμsecとすれば、170μsecかかってAn側か
ら出てくる。
次に、第3図(つ)の進行波等価モデルの演算処理を第
1θ図のフローチャートに基づいて説明する。
音響管AI(管の半径rt)にインパルスが人力される
と、コンピュータよりなる演算処理装置は、ステップS
、にてメモリよりAtのa。A、10^。
■。^、Eを取り出す。取り出した値をもとに、ステッ
プS、では、 a op、’= f (E 、  I IIA)ioA
’=λ。え’−Iい の演算を行う。この演算値aO^’、io^′およびス
テップS3でメモリより導入された管At(半径rt)
の値1111!l、 alAl  i lB+  i 
IAI  I II  I IAを用いてステップS4
では、 a +e’= S +8 (1lB+ 11A)a+A
’ =SIA(Ita+ I IA)i +s’= a
 IB’  I tailA’= a IA’  I 
+a I +e’= i GA’  a。A′の演算を行う。
ステップS、ではS4にて求められたt 18’+  
a 1B’を用し1てI OA’ = I 、B+ a
 IBを演算する。また一方、S、にて求められた値j
 +A’+ a IA’と、ステップS6においてメモ
リより導入された管A!(半径rs)の値a*B* a
!Anlta+1い、Ita、IIAとを用いてステッ
プS7にて次の演算が行われる。
a *B’= S ta (I lB+ I IA)a
!^’=s之^(■之β+[、^) i *B’= a *a’  I !at tA’= 
a tA’  [tA I wa’= t IAI a jA’AtップS8で
はS7にて求められた!we’、 i*A’を用いて I IA’= i ta’+ a *A’の演算が行わ
れる。以下同様にして模擬された音響管の半径rを演算
し、この演算結果からπr!を計算して断面積が求めら
れ、ステップ5n−1では、 a na’=f  (I n5) l nB’= a nB’  I nBI n5=41
%−、IA+ an−IAの演算を行う。その結果を用
いてステップSrlでは、 I 、−IA’: 1 nB’ + a nB’の演算
を行う。すなわち、音響管の半径r、−rnを演算し、
その演算結果からπr1′〜πrn″を計算し、得られ
た断面積に対応した等価回路の最終段(n段)における
演算結果の出力がD/A変換されて図示省略されたスピ
ーカに出力され、スピーカより音声として出力される。
したがって演算処理装置は音響管AI−Anに対応した
演算を行うものであるから、この演算処理装置は音響管
のA、〜A0個々の等価回路を流れる各部の電流値およ
び関数f、S1s、5tA(i=1゜2・・・n−1)
をテーブルとして有しているメモリと、当該等価回路の
各部の電流値を演算する第1の演算手段と、当該等価回
路とは相隣接する等価回路の電流値を用いて当該等価回
路の電流値を演算する第2の演算手段とを備えている。
H、発明の効果 以上のように本発明は、音響管の半径rを音響管が大き
く変動するときの半径と、それが小さく変動するときの
半径とをそれぞれ別々に演算し、その演算結果からπr
1を計算し、得られた断面積が等価回路のサージインピ
ーダンスにl対lに対応していることに着目し、音響管
の半径を演算した結果により求められた断面積の変化を
サージインピーダンスの変化で模擬するようにしたちの
であるから、パラメータとしては、音響管の半径を演算
するだけを持てばよいので、極めて簡単にでき、従来の
ように音声合成のための多くのメモリを必要としないと
ともに音響管の半径が大きく変動するときの半径の演算
量を少なくしても音声合成にはほとんど影響がないので
、演算量を大幅に少なくすることができる。また、調音
結合も、サージインピーダンスの連続的な変化によって
スムーズに行われ、自然音に近い発声が得られる。
【図面の簡単な説明】
第1図〜第10図は本発明を説明するための図で、第1
図は音響管モデル図、第2図は音響管等価回路図、第3
図は音響管の電気回路等価モデル図、第4図は声道の変
化説明図、第5図は音響管断面積の時間に対する補間説
明図、第6図は本発明による音響管が大きく変動すると
きと、小さく変動するときの説明図、第7図は本発明に
よる音響管の半径rの時間に対する補間説明図、第8図
は音声伝搬を電気的に模擬した電気回路図、第9図は第
8図の等価回路図、第1θ図は本発明の音声合成をコン
ピュータ処理するプログラムの一例を示すフローチャー
ト図、第11図は従来のパーコール合成による調音結合
説明図を示す。 A1.At・・・An・・・音響管、rl+r!・・・
rn・・・音響管の半径、Y、、Y、・・・音響管の音
響アドミッタンス、C,、Ct・・・co・・・電気回
路モデルの静電容量、L、、Lt・・・Ln・・・同上
のりアクタンス、Zl。 Z、・・・Zn・・・サージインピーダンス。 第4図 第5図 第6図 CL

Claims (2)

    【特許請求の範囲】
  1. (1)音響管を用いて模擬する音声合成において、隣合
    う2つの音響管を伝搬電流源と音響断面積に反比例した
    サージインピーダンスの並列回路として扱い、音響管の
    形状変化に伴い音響管の半径を音響管が全体的に形状変
    化する部分の半径と、それが小さく変化する部分の半径
    とをそれぞれ別々に演算した後、加算し、その後円周率
    と前記加算により求められた半径とを乗算して断面積を
    求める際に、次式の 係数 ▲数式、化学式、表等があります▼ (但し、r_i、r_i_+_1は隣合う2つの音響管
    の半径、iは1、2、3・・・nである)を用いること
    を特徴とする音声合成方法。
  2. (2)音響管を用いて模擬する音声合成において、隣合
    う2つの音響管を伝搬電流源と音響断面積に反比例した
    サージインピーダンスの並列回路として扱い、音響管の
    形状変化に伴い音響管の半径を音響管が全体的に形状変
    化する部分の半径と、それが小さく変化する部分の半径
    とをそれぞれ別々に演算した後、加算し、その後円周率
    と前記演算により求められた半径とを乗算して断面積を
    求める際に、次式の係数 ▲数式、化学式、表等があります▼ (但し、r_i、r_i_+_1は隣合う2つの音響管
    の半径、iは1、2.3・・・nである)を用いると共
    に隣へ新しく伝搬すべき電流源をサージインピーダンス
    に流れ込む電流と、当該音響管に流れ込む電流の和、若
    しくはサージインピーダンスに流れ込む電流の2倍の値
    と当該音響管の電流源との差を用いることを特徴とする
    音声合成方法。
JP62326052A 1987-12-23 1987-12-23 音声合成方法 Expired - Lifetime JPH0833750B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62326052A JPH0833750B2 (ja) 1987-12-23 1987-12-23 音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62326052A JPH0833750B2 (ja) 1987-12-23 1987-12-23 音声合成方法

Publications (2)

Publication Number Publication Date
JPH01167800A true JPH01167800A (ja) 1989-07-03
JPH0833750B2 JPH0833750B2 (ja) 1996-03-29

Family

ID=18183568

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62326052A Expired - Lifetime JPH0833750B2 (ja) 1987-12-23 1987-12-23 音声合成方法

Country Status (1)

Country Link
JP (1) JPH0833750B2 (ja)

Also Published As

Publication number Publication date
JPH0833750B2 (ja) 1996-03-29

Similar Documents

Publication Publication Date Title
US5528726A (en) Digital waveguide speech synthesis system and method
JPH07134594A (ja) 楽音信号処理システム
Mullen et al. Waveguide physical modeling of vocal tract acoustics: flexible formant bandwidth control from increased model dimensionality
Smith Virtual acoustic musical instruments: Review and update
FI66268B (fi) Moenster och filterkoppling foer aotergivning av akustisk ljudvaeg anvaendningar av moenstret och moenstret tillaempande talsyntetisator
US5097511A (en) Sound synthesizing method and apparatus
JPH01167800A (ja) 音声合成方法
JPS63311400A (ja) 音合成方法
JPS63311399A (ja) 音合成方法
JPS63257000A (ja) 音合成方法
JP2990691B2 (ja) 音声合成装置
JP2990693B2 (ja) 音声合成装置
JPH01292400A (ja) 音声合成方式
Schnell et al. Analysis of lossy vocal tract models for speech production
JP2992995B2 (ja) 音声合成装置
JPH01177098A (ja) 音声合成装置
Childers et al. Articulatory synthesis: Nasal sounds and male and female voices
JPH01182900A (ja) 音声合成方式
JPH01219899A (ja) 音声合成装置
JPH01185700A (ja) 音声合成方法
JPH01219896A (ja) 音声合成方式
JPH0833751B2 (ja) 音声合成方式
Gómez MUMT 618 Project Report: Anl Overview of Flute Physical Models
JPH01171000A (ja) 音声合成方式
JPH01177100A (ja) 音声合成方式