JP2001117575A - 音声合成装置および音声合成プログラムを格納したコンピュータ読み取り可能な記録媒体 - Google Patents

音声合成装置および音声合成プログラムを格納したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2001117575A
JP2001117575A JP29781699A JP29781699A JP2001117575A JP 2001117575 A JP2001117575 A JP 2001117575A JP 29781699 A JP29781699 A JP 29781699A JP 29781699 A JP29781699 A JP 29781699A JP 2001117575 A JP2001117575 A JP 2001117575A
Authority
JP
Japan
Prior art keywords
utterance speed
speed
phoneme
recording medium
utterance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP29781699A
Other languages
English (en)
Inventor
Hideyuki Hoshikawa
星川英之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP29781699A priority Critical patent/JP2001117575A/ja
Publication of JP2001117575A publication Critical patent/JP2001117575A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 読み情報と韻律情報に基づいて文章の読み上
げを行う音声合成装置に関し、文章中の各単語の伯数に
応じて読み上げる速度を変え、伯数の少ない単語を聞き
やすくする。 【解決手段】 音韻変換部1とパラメータ計算部2と音
声合成部3と音声波形合成部4とからなる、文章の読み
上げを行う音声合成装置において、文章中の各単語ある
いはアクセント句内の伯数を検出する伯数検出部11
と、音韻発声速度決定部12とを備え、音韻発声速度決
定部12は伯数検出部11で得られた伯数に応じて、パ
ラメータ計算部2で得られた継続時間を変化させること
で単語あるいはアクセント句の読み上げる速度を変更す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字列からなるテ
キストを音声に変換して発声する音声合成装置に関す
る。
【0002】
【従来の技術】図2は従来システムの構成ブロック図で
ある。音韻変換部1は、入力された漢字仮名混じり文で
書かれた文書ファイルを音韻辞書により仮名文字列に変
換し音韻列とする。これはワープロの仮名漢字変換の逆
変換に相当する。これにアクセント辞書により、単語を
構成する音韻列にアクセント情報を付加し、更に、文法
解析により単語間のつながりによる連結の強さを考慮し
た休止情報、およびイントネーション情報を付加して、
合成文字列とする。合成文字列は、音節を表す片仮名
と、呼気段落、フレーズ、アクセント句を表す区切り記
号と、アクセント記号、鼻濁化記号、無声化記号等から
なる。
【0003】パラメータ計算部2は、音声合成部3の前
処理として、合成文字列を数値パラメータに変換する。
この中には、各音韻要素の継続時間が含まれる。これ
は、標準の発声速度における値である。
【0004】音声合成部3は、数値パラメータを一定の
合成規則(例えばPARCOR方式)により変換合成し
てパラメータ時系列データとする。パラメータ時系列デ
ータは一定時間単位(フレーム)毎の値を並べたもの
で、音声波形合成部4でこれを音声波形に変換する。数
値パラメータを音声合成部で処理してパラメータ時系列
データとし、パラメータ時系列データを音声波形合成4
で処理し、アナログデータとしての音声を得、スピーカ
等により音声として出力する。
【0005】発声速度を変えたいときは、音声波形合成
部4でフレーム時間を変えることにより発声速度を変え
ていた。
【0006】
【発明が解決しようとする課題】しかしながら、従来技
術の音声合成装置では、文中の各音韻の発声速度が基本
的には一定であるため、各単語の発声速度が一定とな
り、そのため、自然な発声のリズムが乱れ不自然な音声
になることがあった。
【0007】一般に、聞き手は話し手が次に発声する音
を予測しながら、あるいは、発声した音を推論しながら
聞いていると考えられる。例えば、最初の音が聞き取れ
なく「ルチメディア」と聞こえたなら「マルチメディ
ア」と言ったに違いないと判断できる。しかし、伯数の
少ない単語ではこのような推論がうまくできない。例え
ば、「た」としか聞き取れなかった場合、「また」なの
か「はた」なのか「あった」なのか判断できない。この
ように、伯数の少ない単語は、伯数の多い単語に比べ、
聞き逃し、聞き間違い等を起こすことが多かった。
【0008】本発明は、上述した問題点を解決するため
になされたものであり、各単語の発声速度を単語の伯数
に応じて変えることができる音声合成装置を実現するこ
とを目的とする。
【0009】
【課題を解決するための手段】この目的を達成するため
に、本発明の請求項1に係る音声合成装置は、読み情報
および韻律情報を基に文章の読み上げを行うものであっ
て、文章中の各単語あるいはアクセント句の伯数をそれ
ぞれ検出する伯数検出手段と、前記伯数検出手段によっ
て得られた伯数と、韻律情報と、音声合成装置の基準発
声速度とから、前記単語あるいはアクセント句の各音韻
の発声速度を決定する発声速度決定手段とを備えてい
る。
【0010】また、請求項2に係る音声合成装置におい
ては、前記発声速度決定手段は、得られた伯数が少ない
ほど遅い速度を各音韻に付与することを特徴とする。
【0011】また、請求項3に係る音声合成装置におい
ては、前記発声速度決定手段は、前記伯数検出手段によ
り得られた伯数と所定の閾値とを比較し、伯数が閾値よ
り少ないとき、発声速度を前記基準発声速度よりも遅い
速度に設定することを特徴とする。
【0012】請求項4に係る音声合成装置においては、
前記発声速度決定手段は、複数の閾値を有し、前記伯数
検知手段により得られた伯数に応じて、発声速度を多段
階に遅くなるよう設定することを特徴とする。
【0013】この目的を達成するために、本発明の請求
項5に係る音声合成プログラムを格納するコンピュータ
読み取り可能な記録媒体においては、読み情報および韻
律情報を基に文章の読み上げを行うものであって、文章
中の各単語あるいはアクセント句の伯数をそれぞれ検出
する伯数検出プログラムと、前記伯数検出プログラムに
よって得られた伯数と、韻律情報と、音声合成装置の基
準発声速度とから、前記単語あるいはアクセント句の各
音韻の発声速度を決定する発声速度決定プログラムとを
備えている。
【0014】また、請求項6に係る記録媒体において
は、前記発声速度決定プログラムは、得られた伯数が少
ないほど遅い速度を各音韻に付与することを特徴とす
る。
【0015】また、請求項7に係る記録媒体において
は、前記発声速度決定プログラムは、前記伯数検出プロ
グラムにより得られた伯数と所定の閾値とを比較し、伯
数が閾値より少ないとき、発声速度を前記基準発声速度
よりも遅い速度に設定することを特徴とする。
【0016】請求項8に係る記録媒体においては、前記
発声速度決定プログラムは、複数の閾値を有し、前記伯
数検知プログラムにより得られた伯数に応じて、発声速
度を多段階に遅くなるよう設定することを特徴とする。
【0017】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して説明する。
【0018】まず、本実施例の音声合成装置の構成を図
1に基づいて説明する。
【0019】尚、図1に示すように、従来技術と同一の
構成要素には同一の符号を付し、その詳細な説明は省略
する。
【0020】本実施例の音声合成装置は、音韻変換部1
と、パラメータ計算部2と、伯数検出手段としての伯数
検出部11と、発声速度決定手段としての音韻発声速度
決定部12と、音声合成部3と、音声波形合成部4とで
構成されている。
【0021】本発明の実施例の各構成要素について説明
する。音韻変換部1は、入力された漢字仮名混じり文で
書かれた文書ファイルを音韻辞書により仮名文字列に変
換し音韻列とする。これにアクセント辞書により、単語
を構成する音韻列にアクセント情報を付加し、更に、文
法解析により単語間のつながりによる連結の強さを考慮
した休止情報、およびイントネーション情報を付加し
て、合成文字列とする。尚、合成文字列は、音節を表す
片仮名と、呼気段落、フレーズ、アクセント句を表す区
切り記号と、アクセント記号、鼻濁化記号、無声化記号
等からなる。
【0022】パラメータ計算部2は、音声合成部3の前
処理として、合成文字列を数値パラメータに変換する。
この中には、各音韻要素の継続時間が含まれる。これ
を、音声合成装置の基準発声速度とする。
【0023】伯数検出部11は、前記音韻変換部1で得
られた合成文字列からアクセント句を表す区切り記号を
基にしてアクセント句内の伯数を検出する。
【0024】音韻発声速度決定部12は、前記の伯数と
しきい値(例えば5)とを比較し、伯数がしきい値より
小さければ前記パラメータ計算部で得られた継続時間を
大きくし、伯数がしきい値より大きければ継続時間を小
さくする。
【0025】音声合成部3は、数値パラメータを一定の
合成規則により変換合成してパラメータ時系列データと
する。パラメータ時系列データは一定時間単位(フレー
ム)毎の値を並べたもので、音声波形合成部4でこれを
音声波形に変換する。そして、数値パラメータを音声合
成部で処理してパラメータ時系列データとし、パラメー
タ時系列データを音声波形合成4で処理し、アナログデ
ータとしての音声を得、スピーカ等により音声として、
出力する。
【0026】次に、本実施例の動作を、「またマルチメ
ディアパソコンは、文章を読み上げることが出来ま
す。」を例に説明する。
【0027】まず、音韻変換部1で入力文を、合成文字
列 マタ/マルチメディアパ ' ソコンワ|ブ ' ンショ
ーオ/ヨミアケ゜ 'ルコトカ゜/デキマ 'ス.に変換す
る。
【0028】伯数検出部11により「また」、「マルチ
メディアパソコンは」、「文章を」、「読み上げること
が」、「出来ます」の伯数2、11、5、8、4をそれ
ぞれ検出する。
【0029】次に、音韻速度決定部12で、伯数2、4
の「また」、「出来ます」の各音韻の標準継続時間に1.
2を乗じ、伯数11、5、8の「マルチメディアパソコ
ンは」、「文章を」、「読み上げることが」の各音韻の
継続時間に0.9を乗じる。この継続時間とパラメータ計
算部で得られたその他の数値パラメータを音声合成部3
で変換合成し、パラメータ時系列データを得、これを音
声波形合成部で処理し、アナログデータとしての音声を
出力する。
【0030】尚、音韻発声速度決定部のしきい値は5以
外の数でもよく、また、伯数がしきい値以上なら1以上
の数を、伯数がしきい値より小さければ1より小さな値
を継続時間に乗じてもよい。また、しきい値を複数用意
して、多段階に設定するようにしても良い。例えば、し
きい値を3と5に設定して、伯数3未満は標準継続時間
に1.2を乗じ、伯数3以上5未満は標準継続時間のまま
(1を乗じ)、伯数5以上は0.9を乗するようにしても
よい。
【0031】さらに、しきい値を設定する代わりに伯数
をパラメータとする関数を用いて乗ずる値を決定しても
よい。
【0032】
【発明の効果】以上説明したことから明かなように、本
発明の請求項1に係る音声合成装置においては、文章中
の各単語あるいはアクセント句の伯数をそれぞれ検出す
る伯数検出手段と、前記伯数検出手段によって得られた
伯数と、韻律情報と、音声合成装置の基準発声速度とか
ら、各音韻の発声速度を決定する発声速度決定手段とを
備え、文章中の各単語あるいはアクセント句の伯数に応
じて発声速度を変えることができ、リズムを乱すことな
く発声することができる。
【0033】さらに、請求項2及び3に係る音声合成装
置においては、得られた伯数が少ないほど遅い速度を各
音韻に付与するように発声速度を決定するので、伯数の
少ない単語を聞きやすくすることができ、聞き逃しや聞
き間違いを防ぐことができる。
【0034】また、請求項4に係る音声合成装置のよう
に、伯数に応じて多段階の発声速度を持たせるようにす
れば、文章に応じた適度な発声速度が設定されるように
なり、より自然な発声がなされることとなり合成音声を
聞き取りやすくできる。
【0035】以上説明したことから明かなように、本発
明の請求項5に係る音声合成プログラムを格納したコン
ピュータ読み取り可能な記録媒体においては、文章中の
各単語あるいはアクセント句の伯数をそれぞれ検出する
伯数検出プログラムと、前記伯数検出プログラムによっ
て得られた伯数と、韻律情報と、音声合成装置の基準発
声速度とから、各音韻の発声速度を決定する発声速度決
定プログラムとを備え、文章中の各単語あるいはアクセ
ント句の伯数に応じて発声速度を変えることができ、リ
ズムを乱すことなく発声することができる。
【0036】さらに、請求項6及び7に係る音声合成プ
ログラムを格納したコンピュータ読み取り可能な記録媒
体においては、得られた伯数が少ないほど遅い速度を各
音韻に付与するように発声速度の決定を行わせるので、
伯数の少ない単語を聞きやすくすることができ、聞き逃
しや聞き間違いを防ぐことができる。
【0037】また、請求項8に係る音声合成プログラム
を格納したコンピュータ読み取り可能な記録媒体のよう
に、伯数に応じて多段階の発声速度を持たせるようにす
れば、文章に応じた適度な発声速度が設定されるように
なり、より自然な発声がなされることとなり合成音声を
聞き取りやすくできる。
【図面の簡単な説明】
【図1】本発明の構成図である。
【図2】従来システムの構成図である。
【符号の説明】
1 音韻変換部 2 パラメータ計算部 3 音声合成部 4 音声波形合成部 11 伯数検出部 12 音韻発声速度決定部

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 読み情報および韻律情報を基に文章の読
    み上げを行う音声合成装置において、 文章中の各単語あるいはアクセント句の伯数をそれぞれ
    検出する伯数検出手段と、 前記伯数検出手段によって得られた伯数と、韻律情報
    と、音声合成装置の基準発声速度とから、前記単語ある
    いはアクセント句の各音韻の発声速度を決定する発声速
    度決定手段とを備えたことを特徴とする音声合成装置。
  2. 【請求項2】 前記発声速度決定手段は、得られた伯数
    が少ないほど遅い速度を各音韻に付与することを特徴と
    する請求請1に記載の音声合成装置。
  3. 【請求項3】 前記発声速度決定手段は、前記伯数検出
    手段により得られた伯数と所定の閾値とを比較し、伯数
    が閾値より少ないとき、発声速度を前記基準発声速度よ
    りも遅い速度に設定することを特徴とする請求項1また
    は2に記載の音声合成装置。
  4. 【請求項4】 前記発声速度決定手段は、複数の閾値を
    有し、前記伯数検知手段により得られた伯数に応じて、
    発声速度を多段階に遅くなるよう設定することを特徴と
    する請求項3に記載の音声合成装置。
  5. 【請求項5】 読み情報および韻律情報を基に文章の読
    み上げを行う音声合成プログラムを格納したコンピュー
    タ読み取り可能な記録媒体において、 文章中の各単語あるいはアクセント句の伯数をそれぞれ
    検出する伯数検出プログラムと、 前記伯数検出プログラムによって得られた伯数と、韻律
    情報と、音声合成装置の基準発声速度とから、前記単語
    あるいはアクセント句の各音韻の発声速度を決定する発
    声速度決定プログラムとを備えたことを特徴とする音声
    合成プログラムが格納された記録媒体。
  6. 【請求項6】 前記発声速度決定プログラムは、得られ
    た伯数が少ないほど遅い速度を各音韻に付与することを
    特徴とする請求請1に記載の記録媒体。
  7. 【請求項7】 前記発声速度決定プログラムは、前記伯
    数検出プログラムにより得られた伯数と所定の閾値とを
    比較し、伯数が閾値より少ないとき、発声速度を前記基
    準発声速度よりも遅い速度に設定することを特徴とする
    請求項1または2に記載の記録媒体。
  8. 【請求項8】 前記発声速度決定プログラムは、複数の
    閾値を有し、前記伯数検知プログラムにより得られた伯
    数に応じて、発声速度を多段階に遅くなるよう設定する
    ことを特徴とする請求項3に記載の記録媒体。
JP29781699A 1999-10-20 1999-10-20 音声合成装置および音声合成プログラムを格納したコンピュータ読み取り可能な記録媒体 Pending JP2001117575A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29781699A JP2001117575A (ja) 1999-10-20 1999-10-20 音声合成装置および音声合成プログラムを格納したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29781699A JP2001117575A (ja) 1999-10-20 1999-10-20 音声合成装置および音声合成プログラムを格納したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2001117575A true JP2001117575A (ja) 2001-04-27

Family

ID=17851543

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29781699A Pending JP2001117575A (ja) 1999-10-20 1999-10-20 音声合成装置および音声合成プログラムを格納したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2001117575A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015102726A (ja) * 2013-11-26 2015-06-04 ブラザー工業株式会社 音声合成装置、楽曲再生装置、音声合成プログラム及び楽曲再生プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015102726A (ja) * 2013-11-26 2015-06-04 ブラザー工業株式会社 音声合成装置、楽曲再生装置、音声合成プログラム及び楽曲再生プログラム

Similar Documents

Publication Publication Date Title
Isewon et al. Design and implementation of text to speech conversion for visually impaired people
US7096183B2 (en) Customizing the speaking style of a speech synthesizer based on semantic analysis
JP3083640B2 (ja) 音声合成方法および装置
JP2000206982A (ja) 音声合成装置及び文音声変換プログラムを記録した機械読み取り可能な記録媒体
US20020184030A1 (en) Speech synthesis apparatus and method
GB2380380A (en) Speech synthesis method and apparatus
US8170876B2 (en) Speech processing apparatus and program
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JPH05165486A (ja) テキスト音声変換装置
JP3518898B2 (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JP3404055B2 (ja) 音声合成装置
JP2001117575A (ja) 音声合成装置および音声合成プログラムを格納したコンピュータ読み取り可能な記録媒体
JPH11282494A (ja) 音声合成装置および記憶媒体
JP4260071B2 (ja) 音声合成方法、音声合成プログラム及び音声合成装置
Sudhakar et al. Development of Concatenative Syllable-Based Text to Speech Synthesis System for Tamil
JP3113101B2 (ja) 音声合成装置
JP4056647B2 (ja) 波形接続型音声合成装置および方法
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JPH11296193A (ja) 音声合成装置
JP3234371B2 (ja) 音声合成用音声持続時間処理方法及びその装置
JP3870583B2 (ja) 音声合成装置および記憶媒体
JP3297221B2 (ja) 音韻継続時間長制御方式
JP2578876B2 (ja) 文章読み上げ装置
JPH1063287A (ja) 発音訓練装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070925

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071002

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080408