JPS63131191A - 規則型音声合成装置 - Google Patents

規則型音声合成装置

Info

Publication number
JPS63131191A
JPS63131191A JP61277581A JP27758186A JPS63131191A JP S63131191 A JPS63131191 A JP S63131191A JP 61277581 A JP61277581 A JP 61277581A JP 27758186 A JP27758186 A JP 27758186A JP S63131191 A JPS63131191 A JP S63131191A
Authority
JP
Japan
Prior art keywords
speech
speech synthesis
word
information
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61277581A
Other languages
English (en)
Inventor
幸夫 三留
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61277581A priority Critical patent/JPS63131191A/ja
Publication of JPS63131191A publication Critical patent/JPS63131191A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字列から規則に従って音声を合成する規則
型音声合成装置に関する。
(従来の技術) 人間が読むためのテキスト、例えば日本語ならば漢字仮
名混じりの文章を機械に音読させる場合には、テキスト
を解析し、読み等を表す情報を生成し、それから音声を
合成することになる。これは、音声の規則合成と呼ばれ
る。
テキストを解析する部分では、辞書や文法規則を用意し
ておき、それらを用いて読みやアクセント等の列からな
る情報(以後、音声合成情報と呼ぶ)を生成する0次に
、音声を合成する部分では、ピッチ、音素の時間長、振
幅あるいはスペクトルパラメータなどを制御する様々な
音声合成規則を用意しておき、入力された音声合成情報
に対してそれらの音声合成規則を適用することによって
音声を合成する。
まず、テキスト解析の例は、福島らによる情報処理学会
日本語文書処理研究会資料2−11(1985)、「盲
人用読書器における文音声変換のための文章解析」に示
されている。この例は、漢字などを見出しとし、読みや
アクセントあるいは品詞などの+W報を有する辞書を用
い、品詞の接続表を参照しながら入力テキストから語句
の列に変換し、その読みやアクセント等の情報と構文情
報から構成される音声合成情報を出力するものである。
次に、音声合成部の例は、三留と伏木田による日本音響
学会音声研究会資料585−31(1985,7)、「
ホルマント、cv−vc型規則合成」に示されている。
これは、音声合成規則として、時間長規則、ピッチ規則
、ポーズ規則、パラメータ編集規則などがあり、あらか
じめ自然音声を分析して得られたCV−VC(Cは子音
■は母音を表す)を単位とするホルマントパラメータを
編集し、それをポルマント型音声合成器に与えることで
任意の音声を合成するものである。
これらの諸規則の内パラメータ編集規則は、合成すべき
音声の音素系列に基づいてまず単位となるcv−vc音
声の番号を決定し、あらかじめ用意されたcv−vcを
単位とするホルマントや音源振幅などのデータを1a集
して音声を合成する規則である。
一方、音声合成部の第二の従来例としては、三留、伏木
田、高島による、電子通信学会情報システム部門全国大
会講演論文集、No、 1−131に示された「調音素
片編集方式による音声合成システム」がある、これは、
第一の従来例と同様に、調音素片と呼ばれる単位音声を
編集して任意の音声を合成するものであるが、ホルマン
トなどのパラメータではなく、数段階のピッチレベルを
有する音声波形を編集する点が第一の例と異なる。
いずれの例も、音声合成情報に基づいて任意の日本語音
声を合成するものであり、漢字仮名混じりのテキストか
ら音声を合成するためには、前段に前述のようなテキス
ト解析部が必要である。
(発明が解決しようとする問題点) これらの例のような音声の規則合成によって明瞭な合成
音声を生成しようとすると、各音素、特に子音を強くは
っきりと合成しなければならない。
特に子音が重要な理由は、母音はもともとその継続時間
長も長くパワーも大きく、更にその種類も少ないため、
相互に紛れることが少ないのに対し、子音はパワーが小
さい上に種類も多いため、相互に紛れ易いからである。
ところが、従来の例にみられる様な音声の規則合成では
、明瞭性を向上させるために各音素、特に子音の強さを
、パワーを大きくしたり時間長を長くしたりして強調す
ると、−音一音が強くなるため滑らかさに欠け、耳障り
で不自然な合成音になり、長時間聞くと疲れるという問
題があった。
(問題点を解決するための手段) 本発明の規則型音声合成装置は、辞書を有するテキスト
解析部と音声合成規則を有する音声合成部とからなり、
テキスト解析部で生成された読みやアクセント等の列か
らなる音声合成情報に音声合成規則を適用し合成音声を
生成する規則型音声合成装置において、テキスト解析部
の辞書には、辞書中の各語句に対しその語句と読みが似
通っていて紛れ易い語句が存在するか否かを示す情報を
記憶させる領域を設け、音声合成部には、各音素や音節
あるいは語句などの音声の強さを、その紛れ易い語句の
有無を表す情報に基づいて制御する手段を設けたことを
特徴とする。
(作用) 本発明は、テキスト解析部から音声合成部に対し、従来
のように語句の読みやアクセントなどの情報の他に、合
成しようとする語句に対して紛れ易い語句が存在するか
否かという情報を送り、その情報に基づいて、音声合成
部において、子音などの強さを制御するものである。
これは、紛れ易い語句が無い場合には、聴取者は文の前
後関係や意味に基づいて判断するなめ、個々の音を強く
はっきりと合成しなくても十分に聞き取ることができる
うえに、むしろその方が滑らかで自然な音声に聞こえる
ためである。一方、紛れ易い語句が在る場合・には、そ
の語句、あるいはその識別のキーとなる音素や音節を強
くはっきりと合成しなければならない。
このとき、ある語句が他の語句と紛れ易いか否かといっ
た情報を、各語句の読みを基にあらかじめ判定しておき
、テキスト解析部の辞書に記憶させておく。
(実施例) 次に、図面を参照して本発明の詳細な説明する。
第1図は、本発明の第1の実施例のブロック図である0
図において、101はテキスト解析装置、102は辞書
、103は波形編集制御装置、104は波形データメモ
リ、105は乗算器である。このうち、テキスト解析装
置101と、辞書102はテキスト解析部106を構成
し、波形i集制御装置103と、波形データメモリ 1
04と、乗算器105とは音声合成部107を構成する
辞書102には、各語句の読み、アクセント、品詞など
の従来のものと同様の情報の他に、本発明の特徴である
、語句の紛れ易さの情報が記憶されており、漢字などの
見出しからそれらの情報(以後、辞書情報と呼ぶ)を読
み出せるようになっている。
テキスト解析装置101は、従来と同様に、信号線11
1から入力されるテキストを解析する。即ち、辞@10
2に、信号#!A113を介して語句の候補の見出しを
送り、それに関する辞書情報を信号線114を介して読
み出す、それらの語句の候補の列の文法的な接続の正当
性をチェックして正しい語句を認定する。そして、その
ときの辞書情報と構文情報から音声合成情報を生成し、
信号!!115を介して、波形1F4集制御装置103
に送る。
波形編集制御装置103は、テキスト解析部から送られ
た音声合成情報に基づいて、単位音声名の列を生成し、
信号線116を介して波形データメモリ 104に送る
。波形データメモリ 104内に記憶されている各単位
音声の波形データは信号線118を介して乗算器105
に送られ、そこで振幅が調整されて信号線119を介し
て波形編集制御装置103に取り込まれる。このとき、
波形編集制御装置103は、音声合成情報のうちの語句
の紛れ易さの情報に基づいて乗算器の乗数を決定し、信
号線117を介して乗算器に送る。即ち、強める必要が
無い場合は乗数を 1.0とし、強める場合は乗数を1
゜0以上として振幅を大きくする。波形編集制御装置1
03は、こうして強めるべき子音などの振幅を制御した
波形データを1i集し、信号線112から出力する。
本実施例のように、あらかじめ自然音声から抽出してお
いた単位音声のデータを編集する型の装置の場合は、あ
らかじめ用意するデータそのものに、強く発声したもの
と弱く発声したものを用意しておき、それらの振幅を制
御するようにすれば、音素の強さをきめ細かく制御でき
、より自然な音声を合成することができる。
第2図は、本発明の第2の実施例のブロック図である。
図において、201はテキスト解析装置、202は辞書
で、この二つは第1の実施例におけるテキスト解析装置
101と辞書102と同様のものであり、テキスト解析
部207を構成する。
一方、203はホルマント合成制御装置、204は音声
合成制御規則メモリ、205は音源生成回路、206は
ホルマント音声合成フィルタであり、これらは音声合成
部208を構成する。
テキスト解析装置201は、第1の実施例と同様に、信
号線211から入力されるテキストを解析する。即ち、
信号線213を介して辞書202に見出しを送り、信号
線214を介して辞書情報を読み出し、それと構文情報
から音声合成情報を生成し、それを信号線215を介し
てポルマント合成制御装置203に送る。
音声合成部208では、音源生成回路205とホルマン
ト音声合成フィルタ206が、ポルマント型の音声合成
回路を構成する。即ち、ホルマント合成制御装置203
から信号線218を介して送られる制御信号に従って、
音源生成回路205で音源波形が生成され、信号線21
9を経由してホルマント音声合成フィルタ206に送ら
れる。ホルマント音声合成フィルタ 206では、ホル
マント合成制御装置203から信号線220を介して送
られる制御信号に従って、その音源波形がろ波されるこ
とにより音声が合成され、信号線212から出力される
音声合成制御規則メモリ204には、このホルマント型
の音声合成回路、即ち音源生成回ll! 205とホル
マント音声合成フィルタ206を制御する為の音声合成
規則が記憶されており、信号線216を介して送られる
指示に応じた規則が信号線217へと出力される。
ホルマント合成制御装置203は、テキスト解析部20
7から送られる音声合成情報に応じた音声合成制御規則
を、音声合成制御規則メモリ 204から読みだし、そ
れに基づいて音源生成回l?8205とホルマント音声
合成フィルタ206を制御する。
このとき、テキスト解析部から送られた音声合成情報の
内、語句の紛れ易さの情報に応じて、音源生成回路20
5を制御することにより、音源の振幅が調整され、はっ
きりと発声されるべき音素や語句が強く合成される。
本実施例の場合、音源の振幅ばかりでなく、ホルマント
音声合成フィルタ206の係数も同時に制御し、音声の
スペクトラムをも強調すれば、強めるべき音素をより明
瞭に合成することができる。
(発明の効果) 以上説明したように、本発明によれば、紛られしい語句
ははっきりと合成されるため合成音の明瞭性が高まると
同時に、全体的には滑らかで自然な合成音が得られると
いう効果がある。
【図面の簡単な説明】 第1図および第2図は、本発明の第1および第2の実施
例をそれぞれ示すブロック図である。 図において、101はテキスト解析装置、102は辞書
、103は波形編集制御装置、104は波形データメモ
リ、105は乗算器、106はテキスト解析部、107
は音声合成部であり、201はテキスト解析装置、20
2は辞書、203はホルマント合成制御装置、204は
音声合成制御規則メモリ、205は音源生成回路、20
6はホルマント音声合成フィルタ、207はテキスト解
析部、208は音声合成部である。

Claims (1)

    【特許請求の範囲】
  1. 辞書を有するテキスト解析部と音声合成規則を有する音
    声合成部とからなり、前記テキスト解析部で生成された
    読みやアクセント等の列からなる音声合成情報に前記音
    声合成規則を適用し合成音声を生成する規則型音声合成
    装置において、前記テキスト解析部の辞書には、この辞
    書中の各語句に対しその語句と読みが似通っていて紛れ
    易い語句が存在するか否かを示す情報を記憶させる領域
    を設け、前記音声合成部には、各音素や音節あるいは語
    句などの音声の強さを、その紛れ易い語句の有無を表す
    情報に基づいて制御する手段を設けたことを特徴とする
    規則型音声合成装置。
JP61277581A 1986-11-20 1986-11-20 規則型音声合成装置 Pending JPS63131191A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61277581A JPS63131191A (ja) 1986-11-20 1986-11-20 規則型音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61277581A JPS63131191A (ja) 1986-11-20 1986-11-20 規則型音声合成装置

Publications (1)

Publication Number Publication Date
JPS63131191A true JPS63131191A (ja) 1988-06-03

Family

ID=17585462

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61277581A Pending JPS63131191A (ja) 1986-11-20 1986-11-20 規則型音声合成装置

Country Status (1)

Country Link
JP (1) JPS63131191A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9155219B2 (en) 2011-08-22 2015-10-06 Fujitsu Limited Blanking plate for electronics rack

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58154900A (ja) * 1982-03-10 1983-09-14 株式会社リコー 文章音声変換装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58154900A (ja) * 1982-03-10 1983-09-14 株式会社リコー 文章音声変換装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9155219B2 (en) 2011-08-22 2015-10-06 Fujitsu Limited Blanking plate for electronics rack

Similar Documents

Publication Publication Date Title
Isewon et al. Design and implementation of text to speech conversion for visually impaired people
El-Imam An unrestricted vocabulary Arabic speech synthesis system
US20030158734A1 (en) Text to speech conversion using word concatenation
JPH031200A (ja) 規則型音声合成装置
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JP3518898B2 (ja) 音声合成装置
US6829577B1 (en) Generating non-stationary additive noise for addition to synthesized speech
JPH08335096A (ja) テキスト音声合成装置
O'Shaughnessy Design of a real-time French text-to-speech system
JPS63131191A (ja) 規則型音声合成装置
JP3060276B2 (ja) 音声合成装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JP3397406B2 (ja) 音声合成装置及び音声合成方法
Salor et al. Implementation and evaluation of a text-to-speech synthesis system for turkish.
JPS5914752B2 (ja) 音声合成方式
JPS60144799A (ja) 自動通訳装置
KR920009961B1 (ko) 무제한 단어 한국어 합성 방법 및 회로
Rizk et al. Arabic Text to Speech Synthesizer: Arabic Letter to Sound Rules
JPH0667685A (ja) 音声合成装置
Crystal et al. Segmental durations in connected speech signals
FalDessai Development of a Text to Speech System for Devanagari Konkani
JPS58168096A (ja) 複数言語音声合成装置
JPH01119822A (ja) 文章読み上げ装置
JPH06138894A (ja) 音声合成装置及び音声合成方法
JP2001166787A (ja) 音声合成装置および自然言語処理方法