JPS6239752B2 - - Google Patents

Info

Publication number
JPS6239752B2
JPS6239752B2 JP55070613A JP7061380A JPS6239752B2 JP S6239752 B2 JPS6239752 B2 JP S6239752B2 JP 55070613 A JP55070613 A JP 55070613A JP 7061380 A JP7061380 A JP 7061380A JP S6239752 B2 JPS6239752 B2 JP S6239752B2
Authority
JP
Japan
Prior art keywords
phoneme
word
voiced
storage unit
pitch
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55070613A
Other languages
English (en)
Other versions
JPS56167197A (en
Inventor
Koji Takeda
Masao Akaha
Tomotoshi Takayama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP7061380A priority Critical patent/JPS56167197A/ja
Priority to GB8115886A priority patent/GB2076616B/en
Priority to US06/267,280 priority patent/US4400582A/en
Publication of JPS56167197A publication Critical patent/JPS56167197A/ja
Priority to HK885/85A priority patent/HK88585A/xx
Publication of JPS6239752B2 publication Critical patent/JPS6239752B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 本発明は音声合成装置さらに詳しく言えば音声
素片を記録しておいてとそれらを順次読み出して
音声を作り出す編集合成の改良に関するものであ
り、特に集積回路(以下ICという)化を考慮し
たものである。
実用的な音声合成方式の1つとして、人間の自
然音声から周期性を有する有声音についてはピツ
チ単位の代表的な音声素片を有声音素として切り
出し、また周期性を有しない無声音については無
声音部そのもの(またはこの一部を無声音素とし
てこれをくり返して用いることもある)を無声音
素として、それぞれ有声音素記憶部、無声音素記
憶部に記録しておき、それらを外部から与えられ
る制御情報に従つて読み出しつなぎ合わせて音声
を作り出す方式が提案されている。ここで制御情
報としては有声無声の別、音素番号、振幅、ピツ
チ、くり返し数などがある。この方式では、言語
の中の代表的な有声音素と無声音素を代表音素と
してすべて記録しておき、自然音声にもつとも近
い音素を順次選択しつなぎ合わせていくことによ
り任意の語を発生できる。しかしこの方式により
合成された合成音声の品質は余り良好とはいえな
い。これは合成された音声を構成している各代表
音素が別々のことばから抽出されていることに起
因する。実際の応用例を考えたとき、発生語数は
数語から十数語、時間にして10秒前後のものが非
常に多く、任意の語を発生できる機能はあまり必
要でない。また音声合成装置の1チツプIC化を
考えたとき、有声音素記憶部と無声音素記憶部を
分けるのは好ましくない。なぜなら発生する語の
種類によつて両者の比がいろいろに変わるため、
記憶部の一方に空きが生じて有効利用ができなく
なるからである。またさらに制御回路の簡単化と
いう点からも記憶部は1つにするのが好ましい。
本発明は実際の応用例を考慮しつつ以上の欠点
も除去したもので、その目的は音声合成ICの1
チツプ化にある。
さらに記憶部へのデータ格納法に関し、記憶部
の効果的利用、さらには読み出し制御の簡単化を
行なうためのデータ格納法を実現することを目的
とする。
以下実施例に基づいて本発明を詳しく説明す
る。(第1図) 2は有声音素及び無声音素が格納されている音
素記憶部であり、読み出し専用メモリ(以下
ROMと言う)とそのアドレスを示すアドレスカ
ウンタとから構成れる。音素の1サンプル点を6
ビツトで表現し、40点で1音素を構成した場合1
音素は6×40=240ビツトより成り、また音素の
総数をN個とするとROMの大きさは6×(40×
N)となる。特許請求の範囲で述べた音素記憶領
域は、本例では240ビツトの大きさということに
なる。サンプル周期を10KHzとすると1音素の長
さは4msecとなり、これは女性の有声音のピツ
チが4msec前後となることを考慮したものであ
り、男性の場合はピツチが8msec前後あるので
1音素を80点ぐらいにすればよい。以後の説明に
おいては女性の音声の合成について考えるが、音
素の点数を除けば何ら変ることがない。又説明に
用いている数値についても一例であつて特定する
ものではない。自然音声の有声部より音素を取り
出すとき、第2図aのようにピツチが4msecよ
り小さい場合はその後ろに0を挿入してbのよう
な形で有声音素を記録する。第2図のcのように
ピツチが4msecより大きい場合は4msecで打ち
切つてdのような形で記録するか、またこれにe
のような音素の終り付近で徐々に0に近づく重み
関数をかけて、fのような波形にして記録する。
無声音部についは、4msec以上のものは4msec
ごとに区切つて、複数個の音素として連続して記
録する。これらは有声無声の区別なく自然音声の
時系列順にROMの中に記録されている。たとえ
ば、「おはようございます」と「おやすみなさ
い」という2つのことばを記録する場合、まず
「お」を合成するに必要ないくつかの有声音素が
取り出され、つぎに「は」の最初の無声音部が連
連続した複数個の無声音素として取り出され、以
下同様にして「おはようございます」ということ
ばから有声部無声部の区別なく取り出された順に
記録される。そしてこのあとに「おやすみなさ
い」を合成すべく各音素が記憶される。
3は2に格納されている音素からことばを合成
する際に必要となる制御情報を記録してある語制
御記憶部であり、アドレスカウンタとROMから
構成されている。1つの制御単位(以下これを行
と言う)は振幅、ピツチ、くり返し数からなり、
これは1つの音素の制御情報となる。行と音素は
2及び3の中のそれぞれのROMの配列順に従つ
て上から対応している。しかし1つの行と1つの
音素とが1対1に対応するとは限らず複数個の連
続した行と1つの音素が対応することがある。こ
の関係を第3図で説明する。31,32,33,
34は1つの制御単位すなわち行であり、21,
22,23は240ビツトより成る音素である。3
1の行は21の音素に対応し、32は22に対応
している。しかし33は23に対応するのではな
く22に対応し、34も22に対応している。1
つの音素の振幅およびピツチを徐々に変化させつ
つ、同じ音素でくり返したい時にこのような対応
関係が生じる。従つて制御単位の中には、前の行
に対応した音素に対する制御情報であるのか又は
その次の音素に対する制御情報であるのかを区別
するための情報が含まれている。またひとつのこ
とば(合成の単位)の終わりを表わす情報も含ま
れている。このことばの終わりを示す情報が含ま
れる行を最終行と呼ぶことにすると、先にあげた
「おはようございます」,「おやすみなさい」に対
応する行の群の終わりにはそれぞれ最終行があ
る。最終行の数は発生できる語の数に一致する。
第1図の4は3からの制御情報9に従つて、2
から来る音素データ10から音声を合成し、出力
する音声発生部であり、11の音声信号はスピー
カーに接続される。
6は発生させたいことばの番号を示す信号線で
あり、たとえば5本あれば32語まで指定可能であ
る。1は6に対応したことばの語制御記憶部スタ
ートアドレス7及び音素記憶部スタートアドレス
8を指定する語指定部でありROMから成る。1
2は4に起動をかける信号線、13は一つのこと
ばの合成の終了を示す信号線であり、5がインタ
ーフエイス部である。
6に発生させたいことばの番号をセツトし、1
2から起動をかけると、まず6に対応したことば
の語制御記憶部スタートアドレス及び音素記憶部
スタートアドレスが、7,8を介して、3及び2
の中のアドレスカウンタにそれぞれ設定される。
そして3のアドレスカウンタは各行に対応する音
素が制御情報に従つて出力されるごとに1づつ増
加され、最終行が現われるまで続く。2のアドレ
スカウンタは3の各行の制御情報によつて増加し
たりしなかつたりする。3のアドレスカウンタの
増加に従つて、音声の合成が進み最終行が現われ
ると合成を止めて、終了の13の信号線によつて
外部に通知する。そしてまた12に起動がかかる
まで停止状態が続く。
以上に示したように、本発明による音声合成装
置では自然音声より抽出した有声音素及び無声音
素を区別せずに音素記憶部内の同じ大きさの音素
記憶領域に記録しているために、音素用ROMが
有効利用できる。これは有声と無声の音素記憶部
を分離した場合、両者の比を固定しなければなら
ないのに対して、同一の記憶部とした場合その比
を自由に変えられるからである。また有声音素と
無声音素の記憶領域の大きさが等しいので制御回
路も非常に簡単になる。
また音素を自然音声より抽出し、これを時系列
順に記録しているため発生可能時間は長くはない
が音質は非常に良い。実際の応用例を考えたとき
発生時間は数秒から十数秒で良く、音質が重要な
場合が多いので、この方式は実用的であると言え
る。また前述したように、1つの音素に語制御記
憶部の複数行を対応させられるので、1つの音素
に対してピツチ、振幅のきめ細かな制御が可能で
あり、比較的少数の音素でも高品質の音声が合成
できる。さらに、音素記憶部と語制御記憶部の構
成からわかるように、音素の登録の仕方を細かく
するかあらくするかによつて音質(圧縮率)と発
生時間を自由に変えられる。すなわち、音質があ
まり良くなくてもよいが、長い発生時間が必要な
場合は音素の抽出をあらくすれば良く、発生時間
は短くても音質を良くしたい場合は音素の抽出を
細かくすれば良く、これは単なるROMの内容の
変更だけですむ。また本発明による音声発生装置
はIC1チツプ化を意識したものであり、ICにした
時、次のような利点が生じる。まず第1にその構
成要素がほとんどROMであり、その他の制御の
部分があまり大きくないため、数秒から十数秒の
発生時間を要する応用に対して安価な音声合成用
ICを供給できる。第2にIC単体として動作でき
る。すなわち第1図に示したように6にことばの
番号をセツトし、12に起動パルスを加えれば良
いので、ここに単なるスイツチを取り付けるだけ
で音声合成装置として動作できる。第3はマイク
ロコンピユータなどの他の装置とのインターフエ
イスが簡単にとれるという点である。これはこと
ばの番号を示す信号線6と起動パルス12の他
に、状態表示信号13があることによる。また第
1図において、これらの他にそのICをセレクト
するかしないかというチツプセレクト信号を付け
加えることにより、複数個のICを並列接続で
き、高品質、長時間の応用にも使用できる。ま
た、状態表示信号13を用いると、ことばの結合
として一連のことばを発生させることができる。
これを時刻報知の例を用いて説明する。「ただい
まの時刻は2時10分です」と発生させたい場合
「ただいまの時刻は」「2」「時」「10」「分です」
をそれぞれ1つのことばとして記憶しておき、ま
ず「ただいまの時刻は」を発生させ、13の信号
線にその終了が通知されると、次に「2」を発生
させ、以下同様に「時」「10」「分です」と発生さ
せる。任意の時刻を報知するには「ただいまの時
刻は」「時」「分です」の他に「1」から「60」ま
での数字を用意しておき、こられを組み合わせれ
ば良い。このようにことばの結合として一連のこ
とばを発生できるので、共通のことばを数多く用
いる応用にも適している。
【図面の簡単な説明】
第1図は、本発明による音声合成装置を実施す
る装置のブロツク図、第2図は有声音素の記憶方
式を説明した波形、第3図は第1図の2と3の対
応関係を説明した図である。 1……語指定部、2……音素記憶部、3……語
制御記憶部、4……音声発生部、5……インター
フエイス部、6……ことばの番号を指定する信号
線、7……語制御記憶部スタートアドレス、8…
…音素記憶部スタートアドレス、9……制御情
報、10……音素データ、11……音声信号、1
2……外部からの起動信号、13……外部への状
態表示信号、21,22,23……各々一つの音
素が格納されている音素記憶領域、31,32,
33,34……行(制御情報)。

Claims (1)

  1. 【特許請求の範囲】 1 a 発生させようとする語を外部から指定す
    る語指定部、 b 自然音声の時系列順に有声音素と無声音声の
    区別なく複数個の音素記憶領域が並んでいる音
    素記憶部、 c 前記音素記憶部の各音素に対応させて、前記
    語指定部からの語を合成する為に必要な振幅情
    報、ピツチ情報、繰り返し情報を制御情報とし
    て記憶しておく記憶制御記憶部、 d 前記語記憶制御部の制御情報に従つて音素記
    憶部の各音素を継ぎ合せて音声を合成しスピー
    カーより出力する音声発生部、 e 前記音声発生部を制御し、外部装置との情報
    送受を行なうインターフエイス部、 を備え、 前記音素記憶部の前記複数個の音素記憶領域に
    納められる音素データは、一定の大きさを有し、
    前記有声音素のピツチが前記一定の大きさ内であ
    れば0を付加し、前記有声音素のピツチが前記一
    定の大きさ以上であれば重み関数をかけて前記一
    定の大きさに収束させ、前記無声音素は前記一定
    の大きさに区切つて連続して並べられていること
    を特徴とする音声合声装置。
JP7061380A 1980-05-27 1980-05-27 Voice synthesizer Granted JPS56167197A (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP7061380A JPS56167197A (en) 1980-05-27 1980-05-27 Voice synthesizer
GB8115886A GB2076616B (en) 1980-05-27 1981-05-22 Speech synthesizer
US06/267,280 US4400582A (en) 1980-05-27 1981-05-27 Speech synthesizer
HK885/85A HK88585A (en) 1980-05-27 1985-11-07 Speech synthesizer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7061380A JPS56167197A (en) 1980-05-27 1980-05-27 Voice synthesizer

Publications (2)

Publication Number Publication Date
JPS56167197A JPS56167197A (en) 1981-12-22
JPS6239752B2 true JPS6239752B2 (ja) 1987-08-25

Family

ID=13436616

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7061380A Granted JPS56167197A (en) 1980-05-27 1980-05-27 Voice synthesizer

Country Status (1)

Country Link
JP (1) JPS56167197A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0736115B2 (ja) * 1991-05-13 1995-04-19 松下電器産業株式会社 波形発生方法

Also Published As

Publication number Publication date
JPS56167197A (en) 1981-12-22

Similar Documents

Publication Publication Date Title
EP0848372B1 (en) Speech synthesizing system and redundancy-reduced waveform database therefor
DE3883034D1 (de) System zur sprachsynthese.
US5463715A (en) Method and apparatus for speech generation from phonetic codes
JP2013072903A (ja) 合成辞書作成装置および合成辞書作成方法
JPS6239752B2 (ja)
JPH0122636B2 (ja)
JPH0250196A (ja) 音声出力電子機器
ES2357700T3 (es) Dispositivo y procedimiento de edición diferenciada de voz.
JPH0876796A (ja) 音声合成装置
JP2894447B2 (ja) 複合音声単位を用いた音声合成装置
JPH0258639B2 (ja)
JPS6014360B2 (ja) 音声応答装置
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JP6251219B2 (ja) 合成辞書作成装置、合成辞書作成方法および合成辞書作成プログラム
JPS616732A (ja) 発声訓練装置
JP3241582B2 (ja) 韻律制御装置及び方法
JPS5950999B2 (ja) 音声合成装置
JPH0281099A (ja) テキスト音声合成装置
JPH02170091A (ja) 目覚まし時計
JPS6339920B2 (ja)
JP2573586B2 (ja) 規則型音声合成装置
Jiménez Designing with speech processing chips
JP2573585B2 (ja) 音声スペクトルパタン生成装置
JPS5814900A (ja) 音声合成装置
SU1599888A1 (ru) Способ компил ционного синтеза речи