JPH02285400A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH02285400A JPH02285400A JP1108611A JP10861189A JPH02285400A JP H02285400 A JPH02285400 A JP H02285400A JP 1108611 A JP1108611 A JP 1108611A JP 10861189 A JP10861189 A JP 10861189A JP H02285400 A JPH02285400 A JP H02285400A
- Authority
- JP
- Japan
- Prior art keywords
- synthesis
- parameter
- voice
- synthetic
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 54
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 54
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 235000016496 Panda oleosa Nutrition 0.000 abstract description 7
- 240000000220 Panda oleosa Species 0.000 abstract description 7
- 238000009877 rendering Methods 0.000 abstract 1
- 230000033764 rhythmic process Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000001755 vocal effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は音声合成装置に関するものである。
従来の技術
従来の音声合成装置としては、例えば、古井:ディジタ
ル音声処理p、14G (東海大学出版会1985)に
示されている。第3図はこの従来の音声合成装置の構成
を示すブロック図である。1は文字列入力端で、漢字仮
名混じり文が入力される。2はテキスト解析部で、入力
された漢字仮名混じり文は辞書3を用いて単語・付属語
に分割され、各々の読み・アクセント型が付与される。
ル音声処理p、14G (東海大学出版会1985)に
示されている。第3図はこの従来の音声合成装置の構成
を示すブロック図である。1は文字列入力端で、漢字仮
名混じり文が入力される。2はテキスト解析部で、入力
された漢字仮名混じり文は辞書3を用いて単語・付属語
に分割され、各々の読み・アクセント型が付与される。
5は韻律制御部で、各単語、付属語のアクセント型から
文節のアクセント型の決定、ポーズ位置や文全体のイン
トネーション等の決定を韻律制御規則により行う。θは
音韻制御部で、テキスト解析部2で得られた読みに対し
、母音の無声化や鼻音化処理、仮名表記と発音音声の異
なる場合の処理(「私は」の「は」は、 「わ」と発音
される)等を行ない、音声表記を得る。7は合成パラメ
ータ作成部で、韻律情報や音声表記情報から実際の合成
に必要な合成パラメータ列を得る。合成パラメータとは
、音の高さを決める基本周波数、音の大きさを決める振
幅、声道の状態を決める声道記述パラメータ(PARC
OR係数やホルマント周波数等)、声帯の状態を決める
有声/無声判定フラグ等であり、パラメータテーブル8
に格納されている。10はパラメータ捕間部で、合成パ
ラメータ作成部7で得られた合成パラメータ値を補間し
て一定時間毎の合成パラメータ列を得る。11は音声合
成部で、パラメータ補間部10で得られた合成パラメー
タ列から実際の音声を合成し、合成音声出力端12に得
る。
文節のアクセント型の決定、ポーズ位置や文全体のイン
トネーション等の決定を韻律制御規則により行う。θは
音韻制御部で、テキスト解析部2で得られた読みに対し
、母音の無声化や鼻音化処理、仮名表記と発音音声の異
なる場合の処理(「私は」の「は」は、 「わ」と発音
される)等を行ない、音声表記を得る。7は合成パラメ
ータ作成部で、韻律情報や音声表記情報から実際の合成
に必要な合成パラメータ列を得る。合成パラメータとは
、音の高さを決める基本周波数、音の大きさを決める振
幅、声道の状態を決める声道記述パラメータ(PARC
OR係数やホルマント周波数等)、声帯の状態を決める
有声/無声判定フラグ等であり、パラメータテーブル8
に格納されている。10はパラメータ捕間部で、合成パ
ラメータ作成部7で得られた合成パラメータ値を補間し
て一定時間毎の合成パラメータ列を得る。11は音声合
成部で、パラメータ補間部10で得られた合成パラメー
タ列から実際の音声を合成し、合成音声出力端12に得
る。
発明が解決しようとする課題
文字列で表記された書類等の中に、初めて見る単語や普
段あまり使用されない単語(未知語)が含まれている場
合がある。我々がこのような文章を読みあげる場合、未
知語の部分を大きく・ゆっくり読んだり、ポーズをおい
たりして、それが未知語であることの注意を喚起させる
場合が多い。
段あまり使用されない単語(未知語)が含まれている場
合がある。我々がこのような文章を読みあげる場合、未
知語の部分を大きく・ゆっくり読んだり、ポーズをおい
たりして、それが未知語であることの注意を喚起させる
場合が多い。
従来の音声合成装置は、このような話調変化は考慮され
ておらず、ある一定の調子で読みあげることしかできな
い。そのため、聞き手に十分な了解性を提供することが
できず、同じ文章に対する内容理解度を規則合成音と実
際の音声で比較した場合、規則合成音の方が内容理解度
が劣るという問題点があった。
ておらず、ある一定の調子で読みあげることしかできな
い。そのため、聞き手に十分な了解性を提供することが
できず、同じ文章に対する内容理解度を規則合成音と実
際の音声で比較した場合、規則合成音の方が内容理解度
が劣るという問題点があった。
本発明は、−かかる点に鑑みてなされたもので、辞書に
存在しない文字列(未知語)があれば、発音速度や音量
等合成パラメータを制御し、より了解性の高い合成音を
提供することを目的としている。
存在しない文字列(未知語)があれば、発音速度や音量
等合成パラメータを制御し、より了解性の高い合成音を
提供することを目的としている。
課題を解決するための手段
本発明の音声合成装置は、上記目的を達成するため、文
字列もしくは記号列を入力する手段と、この入力手段か
ら入力された文字列もしくは記号列を解析する手段と、
この解析手段で得られた解析結果に従って合成パラメー
タを作成する合成パラメータ制御手段と、前記合成パラ
メータから音声を合成する音声合成手段と、前記解析手
段に入力された文字列の中に、辞書に存在しない未知語
があれば、前記合成パラメータ制御手段の合成パラメー
タ値を変更する手段とを備えたことを特徴とするもので
ある。
字列もしくは記号列を入力する手段と、この入力手段か
ら入力された文字列もしくは記号列を解析する手段と、
この解析手段で得られた解析結果に従って合成パラメー
タを作成する合成パラメータ制御手段と、前記合成パラ
メータから音声を合成する音声合成手段と、前記解析手
段に入力された文字列の中に、辞書に存在しない未知語
があれば、前記合成パラメータ制御手段の合成パラメー
タ値を変更する手段とを備えたことを特徴とするもので
ある。
作 用
本発明は前記した構成により、文字列の中に辞書に存在
しない未知語があると、発話速度や音量等の合成パラメ
ータを制御し、より了解性の高い合成音を提供する。
しない未知語があると、発話速度や音量等の合成パラメ
ータを制御し、より了解性の高い合成音を提供する。
実施例
第1図は、本発明の一実施例における音声合成装置の構
成を示すブロック図である。1は文字列入力端で、漢字
仮名混じり文が入力される。2はテキスト解析部で、入
力された漢字仮名混じり文は辞書3を用いて単語・付属
語に分割され、各々の読み・アクセント型が付与される
。4は未知語処理部で、入力文字列内に辞書3に存在し
ない未知語がある場合に、その部分の取り出しを行う。
成を示すブロック図である。1は文字列入力端で、漢字
仮名混じり文が入力される。2はテキスト解析部で、入
力された漢字仮名混じり文は辞書3を用いて単語・付属
語に分割され、各々の読み・アクセント型が付与される
。4は未知語処理部で、入力文字列内に辞書3に存在し
ない未知語がある場合に、その部分の取り出しを行う。
5は韻律制御部で、各単語、付属語のアクセント型から
文節のアクセント型の決定、ポーズ位置や文全体のイン
トネーション等の決定を規則により行う。6は音韻制御
部で、テキスト解析部2で得られた読みに対し、母音の
無声化や鼻音化処理、仮名表記と発声音声の異なる場合
の処理等を行い、音声表記を得る。7は合成パラメータ
作成部で、韻律情報や音声表記情報から実際の合成に必
要な合成パラメータ列を得る。合成パラメータはパラメ
ータテーブル8に格納されている。9はパラメータ修正
部で、未知語処理部4で得られた文字列について時間長
(発声速度)や振幅のパラメータ値を変更する。10は
パラメータ補間部で、パラメータ修正部9で得られた合
成パラメータ値を補間して一定時間毎の合成パラメータ
を得る。11は音声合成部で、パラメータ補間部10で
得られた合成パラメータ列から実際の音声を合成し、合
成音声出力端12に得る。
文節のアクセント型の決定、ポーズ位置や文全体のイン
トネーション等の決定を規則により行う。6は音韻制御
部で、テキスト解析部2で得られた読みに対し、母音の
無声化や鼻音化処理、仮名表記と発声音声の異なる場合
の処理等を行い、音声表記を得る。7は合成パラメータ
作成部で、韻律情報や音声表記情報から実際の合成に必
要な合成パラメータ列を得る。合成パラメータはパラメ
ータテーブル8に格納されている。9はパラメータ修正
部で、未知語処理部4で得られた文字列について時間長
(発声速度)や振幅のパラメータ値を変更する。10は
パラメータ補間部で、パラメータ修正部9で得られた合
成パラメータ値を補間して一定時間毎の合成パラメータ
を得る。11は音声合成部で、パラメータ補間部10で
得られた合成パラメータ列から実際の音声を合成し、合
成音声出力端12に得る。
次に各処理の詳細について実例を用いて説明する。 「
彼は電産の社員です。」という文章が入力された場合に
ついて考える。 (現在「電産」は辞書に存在しない未
知語であるとする。)テキスト解析部2により入力文章
は以下のように分割され、アクセント型や読みの情報を
得る。
彼は電産の社員です。」という文章が入力された場合に
ついて考える。 (現在「電産」は辞書に存在しない未
知語であるとする。)テキスト解析部2により入力文章
は以下のように分割され、アクセント型や読みの情報を
得る。
(入力文章) 「彼は電産の社員です。」(単語分割
) 彼/は/電圧/の/社員/です。
) 彼/は/電圧/の/社員/です。
(読み) カレ ワ
テ゛ン号ン ノ シャイン テ゛
ス (アクセント型)ITI)T 1 b (品詞) 氏名 副動 未知 格助 名助動 ここで「は」 「の」に対して与えられているアクセン
ト型Tやbは、NHKアクセント辞書・解説付録(日本
放送協会 1885年)に記載されているもので、自立
語と結合して文節を構成する際の結合アクセント核のあ
る音節位置を示したものである。テキスト解析部2では
、 「重度」が未知語(辞書に存在しないもの)である
ことを検出して、未知語処理によって読み・アクセント
型を付与する。次に、韻律制御部5で、ポーズ位置や文
節のアクセント型、文全体のイントネーシヨンを決定す
る。又音韻制御部6で実際の音声表記を得る。
テ゛ン号ン ノ シャイン テ゛
ス (アクセント型)ITI)T 1 b (品詞) 氏名 副動 未知 格助 名助動 ここで「は」 「の」に対して与えられているアクセン
ト型Tやbは、NHKアクセント辞書・解説付録(日本
放送協会 1885年)に記載されているもので、自立
語と結合して文節を構成する際の結合アクセント核のあ
る音節位置を示したものである。テキスト解析部2では
、 「重度」が未知語(辞書に存在しないもの)である
ことを検出して、未知語処理によって読み・アクセント
型を付与する。次に、韻律制御部5で、ポーズ位置や文
節のアクセント型、文全体のイントネーシヨンを決定す
る。又音韻制御部6で実際の音声表記を得る。
以上で得られた韻律情報・音韻情報に従って合成パラメ
ータ作成部7で実際の合成パラメータを得る。本実施例
では、合成素片単位として音素(C1V)を、声道の特
殊記述パラメータとしてホルマント周波数を用いる。即
ち以下に示す各音素毎に、ホルマント周波数、バンド幅
、基本周波数、振幅、有声/無声判定及び各音素の継続
時間長のパラメータが、パラメータテーブル8を参照す
ることによって作成される。これらのパラメータ値は、
音韻環境を考慮して規則を用いて変更される。
ータ作成部7で実際の合成パラメータを得る。本実施例
では、合成素片単位として音素(C1V)を、声道の特
殊記述パラメータとしてホルマント周波数を用いる。即
ち以下に示す各音素毎に、ホルマント周波数、バンド幅
、基本周波数、振幅、有声/無声判定及び各音素の継続
時間長のパラメータが、パラメータテーブル8を参照す
ることによって作成される。これらのパラメータ値は、
音韻環境を考慮して規則を用いて変更される。
(素片表記)
KAREWA(+’−ス’)DENSANNO5YAI
N[1ESU パラメータ修正部9では、未知語処理部4で得られた強
調部のパラメータ値を変更する。変更規則の一部を第2
図に示す。例では、単語「重度」が未知語なので、母音
の時間長を20%、子音の時間長を10%長クシ、振幅
を10%上げて、さらに、その前に100 m5ecの
無音部をおく。その結果、「重度」の部分が、ゆっくり
合成されることになる。パラメータ補間部10では、こ
うして得られた各音素毎のパラメータの線形補間を行い
、5 m5ec毎のパラメータ列を得、音声合成部11
でホルマント型の合成器を用いて合成する。
N[1ESU パラメータ修正部9では、未知語処理部4で得られた強
調部のパラメータ値を変更する。変更規則の一部を第2
図に示す。例では、単語「重度」が未知語なので、母音
の時間長を20%、子音の時間長を10%長クシ、振幅
を10%上げて、さらに、その前に100 m5ecの
無音部をおく。その結果、「重度」の部分が、ゆっくり
合成されることになる。パラメータ補間部10では、こ
うして得られた各音素毎のパラメータの線形補間を行い
、5 m5ec毎のパラメータ列を得、音声合成部11
でホルマント型の合成器を用いて合成する。
以上のように本実施例によれば、未知語処理部4を設け
て未知の文字列を取り出し、その情報に従って発声速度
や音量等を制御することにより、了解性の高い合成音を
合成することができる。
て未知の文字列を取り出し、その情報に従って発声速度
や音量等を制御することにより、了解性の高い合成音を
合成することができる。
なお、上記実施例において合成単位は音素(C。
■)、ホルマント合成方式を用いたが、これに限定され
るものではない。また、未知語について制御するパラメ
ータを継続時間長拳振幅とその前につける無音部(ポー
ズ)にしたが、これは、本発明を何等拘束するものでは
ない。
るものではない。また、未知語について制御するパラメ
ータを継続時間長拳振幅とその前につける無音部(ポー
ズ)にしたが、これは、本発明を何等拘束するものでは
ない。
発明の詳細
な説明したように、本発明によれば、文字列の中に未知
語があった場合、その合成パラメータを制御し、文章の
ある部分を前にポーズをおいて、大きくゆっくり発音さ
せたり、より人間の発声に近い合成音を作成することが
できる。
語があった場合、その合成パラメータを制御し、文章の
ある部分を前にポーズをおいて、大きくゆっくり発音さ
せたり、より人間の発声に近い合成音を作成することが
できる。
これにより、合成音の了解性を向上させることができ、
その実用的価値には大なるものがある。
その実用的価値には大なるものがある。
第1図は本発明の一実施例における音声合成装置のブロ
ック図、第2図はパラメータ制御規則の一部を示した説
明図、第3図は従来例の音声合成装置のブロック図であ
る。 1014文字列入力端、2.、、テキスト解析部、30
1.辞書、4.、、未知語処理部、590.韻律処理部
、691.音韻処理部、7.、、合成パラメータ作成部
、800.パラメータテーブル、9.、、パラメータ修
正部、10.、、パラメータ補間部、11.、、音声合
成部、12.、、合成音声出力端。
ック図、第2図はパラメータ制御規則の一部を示した説
明図、第3図は従来例の音声合成装置のブロック図であ
る。 1014文字列入力端、2.、、テキスト解析部、30
1.辞書、4.、、未知語処理部、590.韻律処理部
、691.音韻処理部、7.、、合成パラメータ作成部
、800.パラメータテーブル、9.、、パラメータ修
正部、10.、、パラメータ補間部、11.、、音声合
成部、12.、、合成音声出力端。
Claims (1)
- 文字列もしくは記号列を入力するテキスト入力手段と、
この入力手段から入力されたテキストを解析するテキス
ト解析手段と、この解析手段で得られた解析結果に従っ
て合成パラメータを作成する合成パラメータ制御手段と
、前記合成パラメータから音声を合成する音声合成手段
と、前記解析手段で解析できなかったテキストに対応し
て合成パラメータ値を変更する手段とを備えたことを特
徴とする音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1108611A JPH02285400A (ja) | 1989-04-26 | 1989-04-26 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1108611A JPH02285400A (ja) | 1989-04-26 | 1989-04-26 | 音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH02285400A true JPH02285400A (ja) | 1990-11-22 |
Family
ID=14489190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1108611A Pending JPH02285400A (ja) | 1989-04-26 | 1989-04-26 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH02285400A (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60188995A (ja) * | 1984-03-07 | 1985-09-26 | 日本電気株式会社 | 文章発声方法 |
-
1989
- 1989-04-26 JP JP1108611A patent/JPH02285400A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60188995A (ja) * | 1984-03-07 | 1985-09-26 | 日本電気株式会社 | 文章発声方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Isewon et al. | Design and implementation of text to speech conversion for visually impaired people | |
JP3113101B2 (ja) | 音声合成装置 | |
JPH01321496A (ja) | 音声合成装置 | |
JPH02285400A (ja) | 音声合成装置 | |
JP3235747B2 (ja) | 音声合成装置及び音声合成方法 | |
JP2703253B2 (ja) | 音声合成装置 | |
Dessai et al. | Development of Konkani TTS system using concatenative synthesis | |
Kaur et al. | BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE | |
JPS62284398A (ja) | 文・音声変換装置 | |
JPH03196199A (ja) | 音声合成装置 | |
JP3465326B2 (ja) | 音声合成装置 | |
JPH01112297A (ja) | 音声合成装置 | |
JPH08160990A (ja) | 音声合成装置 | |
JP3722136B2 (ja) | 音声合成装置 | |
JPH06168265A (ja) | 言語処理装置および音声合成装置 | |
JPH0439698A (ja) | 音声合成装置 | |
JPH01119822A (ja) | 文章読み上げ装置 | |
JPH06118981A (ja) | 音声合成装置 | |
JPH06318093A (ja) | 音声合成装置及び読み付与装置 | |
Teranishi | A speech synthesis system by rule in Japanese | |
JPH0756591A (ja) | 音声合成装置、音声合成方法及び記録媒体 | |
Agrawal | Analysis and synthesis of CV syllables in Hindi | |
Changli et al. | Synthesis of Chinese by rules based on a multipulse excitation model | |
JPH07140999A (ja) | 音声合成装置及び音声合成方法 | |
Hillenbrand et al. | Effects of fundamental frequency contour on the identification of resynthesized vowels with static formant frequency patterns |