JPH11126087A - 音声合成方法及び音声合成装置、ナビゲーションシステム、並びに情報記録媒体 - Google Patents

音声合成方法及び音声合成装置、ナビゲーションシステム、並びに情報記録媒体

Info

Publication number
JPH11126087A
JPH11126087A JP9288815A JP28881597A JPH11126087A JP H11126087 A JPH11126087 A JP H11126087A JP 9288815 A JP9288815 A JP 9288815A JP 28881597 A JP28881597 A JP 28881597A JP H11126087 A JPH11126087 A JP H11126087A
Authority
JP
Japan
Prior art keywords
information
speech
audio signal
prosody
expression content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP9288815A
Other languages
English (en)
Inventor
Keiichi Yamada
敬一 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP9288815A priority Critical patent/JPH11126087A/ja
Publication of JPH11126087A publication Critical patent/JPH11126087A/ja
Abandoned legal-status Critical Current

Links

Landscapes

  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】 音声再生機能と合成音声機能を併用して、多
種多様の極めて自然な合成音を得ることができるように
した音声合成方法及び音声合成装置、ナビゲーションシ
ステム、並びに情報記録媒体を提供する。 【解決手段】 韻律制御部13において、韻律生成部1
4により非定型的表現内容の音韻情報に基づいてこれに
対応した韻律情報を生成し、附属情報付音声データメモ
リ11より取り出された定型的表現内容の韻律情報との
整合性を考慮して上記非定型的表現内容に対応した韻律
情報を韻律調整部14により調整する。そして、上記定
型的表現内容に対応した音声信号と上記非定型的表現内
容に対応した合成音声信号とを音声接続部18で接続す
ることにより、入力情報に応じて定型的表現内容の一部
に非定型的表現内容を含む表現内容の音声信号を生成す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力情報に応じて
定型的表現内容の一部に非定型的表現内容を含む表現内
容の音声信号を生成する音声合成方法及び音声合成装
置、ナビゲーションシステム、並びに情報記録媒体に関
する。
【0002】
【従来の技術】従来、情報機器からユーザに音声で情報
を提供する方法としては、音声を記録媒体に記録してお
き、それを再生する録音再生機能による情報提供方法や
音声合成により合成音を生成する音声合成機能による情
報提供方法、あるいは音声再生機能と音声合成機能を併
用する情報提供方法等がある。
【0003】音声再生機能により情報を提供する音声情
報提供装置は、例えば図6に示すように構成されてい
た。この音声情報提供装置は、ユーザに提供すべき1以
上の音声の波形データあるいはその波形データを圧縮し
たデータなどの音声データを記憶した定型文音声データ
メモリ101を備える。そして、この定型文音声データ
メモリ101から読み出される音声データが音声処理部
102を介して音声出力部103に供給され、この音声
出力部103からスピーカ104を介して音声が出力さ
れるようになっている。なお、音声処理部102では、
圧縮された音声データの場合に伸張処理が行われる。ま
た、音声出力部103は、例えばD/A変換器や出力増
幅器などを備えており、音声処理部102から供給され
る音声データをD/A変換してアナログの音声信号と
し、その信号レベルを適正に調整した音声信号をスピー
カ104に供給する。
【0004】一般に、録音再生機能による音声再生の場
合では、発声話者の個人性がその音声の保持されている
程に再生音声の品質は良好である。この音声再生では、
人間の自然な発声による音声波形がある程度忠実に再生
され、音声波形に含まれる音韻情報、韻律情報はほぼ確
実に再現される。また、再生される音声波形の発声内容
は明解に聞き取ることが可能であり、音声再生による情
報伝達の確実性はかなり高い。
【0005】また、音声合成機能により情報を提供する
音声情報提供装置は、例えば図7に示すように構成され
ていた。この音声情報提供装置は、例えばカーナビゲー
ションなどのナビゲーションシステムに適用されるもの
で、ユーザ(運転者)に現在地やその他の情報を合成音
で提供するものとされている。
【0006】ナビゲーションシステムでは、現在地や、
目的地までの距離、その他の様々な情報をユーザに提供
することが望まれる。これらの情報は、通常、頻繁に使
用される文である定型文を構成する単語を、所定の単語
に置き換えた文である置き換え文によって表現すること
ができる。
【0007】例えば、ユーザに現在地を合成音で知らせ
るには、「ここは、○○付近です。」という定型文を用
意しておき、その「○○」部分を現在地(品川や五反田
駅など)で置き換えることにより「ここは、品川付近で
す。」や「ここは、五反田駅付近です。」などの置き換
え文を生成し、さらに、その置き換え文に対応する合成
を生成すればよい。
【0008】ここで、「ここは、品川付近です。」や
「ここは、五反田駅付近です。」などの置き換え文は、
「ここは、品川付近です。」や「ここは、五反田駅付近
です。」における「品川」や「五反田駅」の単語を除い
た定型文「ここは、○○付近です。」のうちの「○○」
を除いた定型的表現内容と、定型文「ここは、○○付近
です。」のうちの「○○」に置き換えられる置換単語で
ある「品川」や「五反田駅」などの非定型的表現内容を
含んでいる。
【0009】図7に示した音声情報提供装置は、以上の
ような置き換え文を音声合成機能による合成音声として
出力するもので、出力文章生成部201により置き換え
文の音韻情報が与えられる規則音声合成部203を備え
る。
【0010】出力文章生成部201は、置換単語の音韻
情報(読み)を受信すると、受信した置換単語と組み合
わせるべき定型文の音韻情報を発声内容データメモリ3
02から読み出して、その定型文の「○○」部分を受信
した置換単語に置き換えた置き換え文の音韻情報を生成
する。
【0011】規則音声合成部203は、出力文章生成部
201から置き換え文の音韻情報が与えられると、その
音韻情報に基づいて韻律情報生成部204により上記置
き換え文の韻律情報を生成し、上記置き換え文の音韻情
報と韻律情報に基づいて音声合成部205により音声単
位データセット記憶部206から音素片データを読み出
して接続する。このようにして上記置き換え文の合成音
声データを規則音声合成部203により生成するそし
て、音声出力部207は、規則音声合成部203から供
給される合成音声データをD/A変換してアナログの音
声信号とし、その信号レベルを適正に調整した音声信号
をスピーカ208に供給する。これにより、上記置き換
え文の合成音声がスピーカ104を介して音声が出力さ
れる。
【0012】この音声情報提供装置において、例えば非
定型的表現内容すなわち置換単語として現在地(ここで
は、例えば「品川」とする。)が出力文章生成部201
に供給された場合、出力文章生成部201では、定型的
表現内容すなわち例えば定型文「ここは、○○付近で
す。」を構成する単語「○○」が「品川」に置き換えら
れ、これにより置き換え文「ここは、品川付近です。」
の音韻情報が生成される。そして、規則音声合成部20
3では、この音韻情報に基づいて規則音声合成を行うこ
とにより、上記置き換え文「ここは、品川付近です。」
の合成音声データを生成する。
【0013】このような構成の音声情報提供装置では、
合成音とする情報すなわち置き換え文の音韻情報があれ
ば、その合成音を生成することができるので、多種多様
の表現に対応する合成音を容易に得ることができる。
【0014】さらに、音声再生機能と音声合成機能を併
用して情報を提供する音声情報提供装置は、例えば図8
に示すように構成されていた。この図8に示した音声情
報提供装置は、定型文音声データメモリ301及び音声
処理部302による音声再生機能により生成される定型
的表現内容の音声データと規則音声合成部303による
音声合成機能により生成される非定型的表現内容の音声
データを音声接続部307により接続して置き換え文の
音声データを生成するようにしたものである。
【0015】この音声情報提供装置では、非定型的表現
内容の音声データとして例えば置換単語「品川」の音韻
情報が規則音声合成部303に与えられ、上記置換単語
の音韻情報に基づいて規則音声合成部303により生成
される置換単語の合成音声データが音声接続部307に
供給される。規則音声合成部303は、非定型的表現内
容の音声データである置換単語の音韻情報が与えられる
と、その音韻情報に基づいて韻律情報生成部304によ
り上記置換単語の韻律情報を生成し、上記置換単語の音
韻情報と韻律情報に基づいて音声合成部305により音
声単位データセット記憶部306から音素片データを読
み出して接続することにより、上記置換単語の合成音声
データを生成する。
【0016】また、非定型的表現内容の音声データすな
わち置換単語と組み合わされる定型的表現内容の音声デ
ータとして定型文の音声データが定型文音声データメモ
リ301から読み出されて、この定型文の音声データが
音声処理部202を介して音声接続部307に供給され
る。音声処理部202は、定型文音声データメモリ30
1から読み出され音声データは圧縮された音声データの
場合に伸張処理を施す。
【0017】そして、音声接続部307は、音声処理部
202から供給される定型文の音声データと規則音声合
成部303から供給される置換単語の合成音声データと
を組み合わせて置き換え文の音声データを生成する。こ
れにより、例えば置換単語「品川」の合成音声データと
定型文「ここは、○○付近です。」の音声データとを組
み合わせた置き換え文「ここは、品川付近です。」の音
声データを生成する。
【0018】この音声接続部307により生成された置
き換え文の音声データが音声出力部308に供給され、
この音声出力部308からスピーカ309を介して置き
換え文の音声が出力される。
【0019】このように音声再生機能と合成音声機能を
併用したで音声情報提供装置では、出力しようとする表
現内容の内、表現が変化しない定型的表現内容の部分に
関しては音声再生を用い、その他の非定型的表現内容の
部分に関しては合成音声を用いることによって、再生音
声の高品質な点、任意の表現内容が出力可能といったそ
れぞれの機能の長所を享受することができる。
【0020】
【発明が解決しようとする課題】しかしながら、録音再
生機能による音声再生では、音声合成機能による合成音
声に比べて同じ表現内容に対応する音声を出力する時に
必要とする情報量が数十倍から数百倍となり、同じ記憶
容量のデータメモリを用いた場合では、出力可能な表現
内容の数が単純に数十分の一から数百分の一と限定され
てしまう。
【0021】また、音声合成機能による合成音声では、
録音再生機能による再生音声に比べて音声品質の面で未
だ十分な品質レベルに達しているとは言えない。
【0022】さらに、音声合成機能における韻律制御が
不十分であるために、出力される合成音声が自然音声に
比べて不自然な韻律となってユーザへの情報伝達能力が
低下する場合がある。
【0023】音声再生機能と合成音声機能を併用する場
合には、上記したように再生音声と合成音声との音声品
質面での隔たりがあり、しかも、再生音声の韻律と合成
音声の韻律との整合性が取れていないために、同一の話
者が発声しているようには聞こえないことによる不自然
さが発生する。
【0024】また、ある一つの表現内容の中に音声再生
機能と合成音声機能による音声が混在していると、音声
品質の面から合成音声による部分の了解度が低下し、表
現内容全体としてのユーザへの情報伝達能力が低下する
場合がある。
【0025】本発明の目的は、上述の如き従来の音声情
報提供装置における問題点に鑑み、音声再生機能と合成
音声機能を併用して、多種多様の極めて自然な合成音を
得ることができるようにした音声合成方法及び音声合成
装置、ナビゲーションシステム、並びに情報記録媒体を
提供することにある。
【0026】
【課題を解決するための手段】本発明に係る音声合成方
法及び音声合成装置は、入力情報により指定される定型
的表現内容に対応した音声信号を生成するとともに、そ
の音声信号に対応した韻律情報を生成し、上記入力情報
により指定される非定型的表現内容の音韻情報から韻律
情報を生成し、上記定型的表現内容に対応した音声信号
の韻律情報に合わせて上記非定型的表現内容に対応した
韻律情報を調整し、この韻律情報に基づいて上記非定型
的表現内容に対応した合成音声信号を生成し、上記定型
的表現内容に対応した音声信号と上記非定型的表現内容
に対応した合成音声信号とを接続することにより、入力
情報に応じて定型的表現内容の一部に非定型的表現内容
を含む表現内容の音声信号を生成することを特徴とす
る。
【0027】本発明に係る音声合成方法及び音声合成装
置では、例えば、上記定型的表現内容に対応した音声音
声の韻律情報として、上記音声信号のピッチパターンの
情報と上記音声信号の発話速度の情報と上記音声信号の
音韻パワーの情報を予め記憶しておき、上記音声信号の
ピッチパターンの情報と上記音声信号の発話速度の情報
と上記音声信号の音韻パワーの情報に基づいて、上記定
型的表現内容に対応した音声信号の韻律情報に合わせて
上記非定型的表現内容に対応した韻律情報を調整する。
【0028】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記定型的表現内容に対応した
音声信号の韻律情報として、上記音声信号のピッチパタ
ーンの情報と上記音声信号の発話速度の情報を予め記憶
しておき、上記音声信号のピッチパターンの情報と上記
音声信号の発話速度の情報に基づいて、上記定型的表現
内容に対応した音声信号の韻律情報に合わせて上記非定
型的表現内容に対応した韻律情報を調整する。
【0029】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記定型的表現内容に対応した
音声信号の韻律情報として、上記音声信号のピッチパタ
ーンの情報を予め記憶しておき、上記音声信号のピッチ
パターンの情報に基づいて、上記定型的表現内容に対応
した音声信号の韻律情報に合わせて上記非定型的表現内
容に対応した韻律情報を調整する。
【0030】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記定型的表現内容に対応した
音声信号の韻律情報として、上記音声信号の接続部分の
ピッチの情報と上記音声信号の接続部分の発話速度の情
報と上記記音声信号の接続部分の音韻パワーの情報を予
め記憶しておき、上記音声信号の接続部分のピッチの情
報と上記音声信号の接続部分の発話速度の情報と上記記
音声信号の接続部分の音韻パワーの情報に基づいて、上
記定型的表現内容に対応した音声信号の韻律情報に合わ
せて上記非定型的表現内容に対応した韻律情報を調整す
る。
【0031】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記定型的表現内容に対応した
音声信号の韻律情報として、上記音声信号の接続部分の
ピッチの情報と上記音声信号の接続部分の発話速度の情
報を予め記憶しておき、上記音声信号の接続部分のピッ
チの情報と上記音声信号の接続部分の発話速度の情報に
基づいて、上記定型的表現内容に対応した音声信号の韻
律情報に合わせて上記非定型的表現内容に対応した韻律
情報を調整する。
【0032】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記定型的表現内容に対応した
音声信号の韻律情報として、上記音声信号の接続部分の
ピッチの情報を予め記憶しておき、上記音声信号の接続
部分のピッチの情報の情報に基づいて、上記定型的表現
内容に対応した音声信号の韻律情報に合わせて上記非定
型的表現内容に対応した韻律情報を調整する。
【0033】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記定型的表現内容に対応した
音声信号の物理特性に合わせて予め物理特性が調整され
た音声単位データセットを記憶しておき、上記非定型的
表現内容に対応した音韻情報のみに基づいて、音声単位
データセットを読み出して規則音声合成による音声信号
を生成することを特徴とする。
【0034】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記音声単位データセットの物
理特性として、前記音声単位データセットのパワーが、
前記定型的表現内容に対応した音声信号のパワー情報に
よって予め調整しておく。
【0035】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記非定型的表現内容に対応し
た合成音声に後続する定型的表現内容の音声信号を生成
し、少なくとも1つの非定型的表現内容と、それに後続
する定型的表現内容からなるものを一つの表現内容とし
て、任意の個数の表現内容によって構成される発話内容
の音声信号を生成する。
【0036】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記非定型的表現内容に対応し
た合成音声に後続する定型的表現内容の先頭音韻が無声
音の音声信号を生成する。
【0037】また、本発明に係る音声合成方法及び音声
合成装置では、例えば、上記非定型的表現内容に対応し
た合成音声と韻律上の連続性が滑らかになるように、物
理特性が予め調整された上記定型的表現内容に対応した
音声信号を生成する。
【0038】さらに、本発明に係る音声合成方法及び音
声合成装置では、例えば、上記定型的表現内容に対応し
た音声信号と上記合成処理に用いられる音声単位データ
セットの各音声データとして同一発声者から得られた音
声データを用いる。
【0039】本発明に係るナビゲーションシステムは、
少なくとも地図に関する情報である地図情報とを記憶し
ている地図情報記憶手段と、現在地を測定する測定手段
と、上記地図情報記憶手段の内容及び上記測定手段の測
定結果に対応して、所定の情報を出力する出力手段をナ
ビゲーションシステムであって、上記出力手段は、入力
情報により指定される定型的表現内容に対応した音声信
号を生成するとともに、その音声信号に対応した韻律情
報を生成する音声信号生成手段と、上記入力情報により
指定される非定型的表現内容の音韻情報から韻律情報を
生成する韻律生成手段と、上記音声信号生成手段により
生成された定型的表現内容に対応した音声信号の韻律情
報に応じて、上記非定型的表現内容に対応した韻律情報
を調整する韻律調整手段と、上記韻律調整手段により調
整された韻律情報に基づいて、上記非定型的表現内容に
対応した合成音声信号を生成する音声合成手段と、上記
音声信号生成手段により生成された定型的表現内容に対
応した音声信号と上記音声合成手段により生成された非
定型的表現内容に対応した合成音声信号とを接続する音
声接続手段とを備え、入力情報に応じて定型的表現内容
の一部に非定型的表現内容を含む表現内容の音声信号を
生成する音声合成装置により、上記所定の情報から音声
信号を生成して出力することを特徴とする。
【0040】本発明に係る情報記録媒体は 入力情報に
より指定される定型的表現内容に対応した音声信号を生
成するとともに、その音声信号に対応した韻律情報を生
成し、上記入力情報により指定される非定型的表現内容
の音韻情報から韻律情報を生成し、上記定型的表現内容
に対応した音声信号の韻律情報に合わせて上記非定型的
表現内容に対応した韻律情報を調整し、この韻律情報に
基づいて上記非定型的表現内容に対応した合成音声信号
を生成し、上記定型的表現内容に対応した音声信号と上
記非定型的表現内容に対応した合成音声信号とを接続す
ることにより、入力情報に応じて定型的表現内容の一部
に非定型的表現内容を含む表現内容の音声信号を生成す
ることを特徴とする。
【0041】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照して詳細に説明する。
【0042】本発明は、例えば図1に示すような構成の
ナビゲーションシステムに適用される。この図1に示し
たナビゲーションシステムは、例えば自動車に搭載さ
れ、その自動車の現在位置を表示して目的地までの道順
を示すもので、入力部1、制御部2、CD−ROMドラ
イブ3、測定部4及び出力部5などからなる。
【0043】このナビゲーションシステムにおいて、入
力部1は、例えばボタンやジョイスティックなどの操作
手段と、運転手等の音声を入力するためのマイクロホン
などの音声入力手段と、この音声入力手段を介して入力
される音声を認識する音声認識手段などを装備してい
る。この入力部1は、操作手段の操作に応じた入力信号
や音声入力手段を介して入力された音声の認識結果など
を制御部2に供給する。
【0044】また、制御部2は、このナビゲーションシ
ステムを構成する各ブロックと情報の授受を行い、シス
テム全体を制御する。
【0045】CD−ROMドライブ3は、例えば複数の
スケールの電子化された地図情報(地図の画像データだ
けでなく、その地図上の地名や施設名などのテキストデ
ータ、音韻情報などを含む)、その他のナビゲーション
に必要な情報が記録されたCD−ROMから、制御部2
による制御命令に応じて必要な情報を読み出して制御部
2に供給する。
【0046】測定部4は、GPS用衛星から測定用信号
を受信したり、ジャイロスコープなどの測定装置を用い
ることにより、現在位置を検出する。そして、この測定
部4は、現在位置を示す位置情報を制御部2に供給す
る。
【0047】出力部5は、制御部2により与えられる所
定の情報を出力するもので、表示部6、本発明に係る音
声合成装置7、音声出力部8及びスピーカ9などからな
る。表示部6は、制御部2により与えられた情報が画像
その他の表示可能な情報である場合にそれを表示するた
めのものであって、例えば液晶モニタやCRTなどから
なる。
【0048】音声合成装置7は、制御部2により与えら
れた情報が音声による情報提供に必要な情報である場合
に、その情報に基づいて音情報提供のための音声データ
を生成する。この音声合成装置7は、生成した音声デー
タを音声出力部8に供給し、この音声出力部8からスピ
ーカ9を介して音声を出力させる。
【0049】このような構成のナビゲーションシステム
では、例えば入力部1により現在地の表示を指示する命
令が入力部1から制御部2に入力されると、制御部2
は、測定部4により測定されている現在地の位置情報に
基づいて、CD−ROMドライブ3を制御して、現在地
を含む所定スケールの地図情報をCD−ROMから読み
出し、その地図情報を出力部5に供給する。これによ
り、出力部5の表示部6には、例えば現在地を中心とす
る地図が自信を表すマーク(例えば自動車の進行方向を
向いた矢印など)とともに表示される。
【0050】その後、このナビゲーションシステムのユ
ーザ(運転者)が運転する自動車が、例えば所定の地域
や交差点、施設などに差し掛かるとと、そこの名称すな
わち地名や交差点名、施設名がCD−ROMドライブ3
により読み出され、音声による情報提供に必要な音声デ
ータとして制御部2から出力部5に供給される。
【0051】出力部5の音声合成装置7は、制御部2か
ら音声による情報提供に必要な音声データが供給される
と、この音声データに基づいて例えば規則音声合成など
により情報提供のための音声データを生成する。例え
ば、地名が「品川であった場合、音声合成装置7では、
現在地をユーザに音声により知らせる例えば置き換え文
「ここは、品川付近です。」の音声データを生成する。
そして、この音声合成装置7は、生成した置き換え文
「ここは、品川付近です。」の音声データを音声出力部
8に供給し、この音声出力部8からスピーカ9を介して
音声を出力させる。これにより、ユーザは、表示部6に
移動することなく、現在地を認識することができる。
【0052】このナビゲーションシステムにおける音声
合成装置7は、音声再生機能と合成音声機能を併用して
置き換え文の音声データを生成する機能を有するもので
あって、例えば図2に示すように構成されている。
【0053】この図2に示した音声合成装置7は、附属
情報付音声データメモリ11及び音声処理部12による
音声再生機能と、韻律制御部13、音声合成部14及び
音声単位データセット記憶部17による合成音声機能と
を備え、音声再生機能により生成される定型的表現内容
すなわち定型文の再生音声データと音声合成機能により
生成される非定型的表現内容すなわち置換単語の合成音
声データとを音声接続部18により接続して置き換え文
の音声データを生成するようになっている。
【0054】この音声合成装置7において、附属情報付
音声データメモリ11は、入力情報により指定される定
型的表現内容の音声データとして定型文の音声データ及
びその附属情報として上記音声データすなわち定型的表
現内容の音韻情報を記憶している。そして、この附属情
報付音声データメモリ11からは、入力情報に応じて定
型文の音声データとともにその附属情報である定型的表
現内容の韻律情報が読み出され、音声データが音声処理
部12を介して音声接続部18に供給され、音韻情報が
韻律制御部13に供給される。
【0055】韻律制御部13は、入力情報として非定型
的表現内容の音声データである置換単語の音韻情報が与
えられる韻律生成部14と、この韻律生成部14により
生成された非定型的表現内容の韻律情報と上記附属情報
付音声データメモリ11から読み出された定型的表現内
容の韻律情報とが供給される韻律調整部15からなる。
この韻律制御部13では、韻律生成部14により入力情
報として与えられる非定型的表現内容の音声データであ
る置換単語の音韻情報に基づいて、置換単語の韻律情報
を生成する。そして、韻律調整部15は、 上記附属情
報付音声データメモリ11から読み出された定型的表現
内容の韻律情報に合わせて、上記韻律生成部14により
生成された非定型的表現内容の韻律情報を調整する。
【0056】音声合成部16は、上記韻律制御部13を
介して与える得る上記置換単語の音韻情報と韻律情報に
基づいて、音声単位データセット記憶部17から音素片
データを読み出して接続することにより、上記置換単語
の合成音声データを生成する。この音声合成部16によ
り生成された非定型的表現内容すなわち置換単語の合成
音声データは音声接続部18に供給される。
【0057】そして、音声接続部18は、音声処理部1
2から供給される定型的表現内容すなわち定型文の再生
音声データと音声合成部16から供給される非定型的表
現内容すなわち置換単語の合成データとを接続して置き
換え文の音声データを生成する。
【0058】このような構成の音声合成装置7では、次
のようにして所望の文章に対応した音声データを生成す
る。
【0059】この音声合成装置7に与えられる入力情報
は、附属情報付音声信号データメモリ11に記憶されて
いる定型文の音声データからどの音声データを用いるか
を表した情報である。
【0060】このような構成の音声合成装置7では、次
のようにして所望の文章に対応した音声データを生成す
る。
【0061】まず、文章全体が完全な定型的表現内容で
ある場合について説明する。
【0062】例えば「間もなく、目的地付近です。」の
ような案内の音声を出力する場合には、まず附属情報付
音声データメモリ11の中に記憶されているデータから
対象の文章に該当する音声データとその音声データに対
応した附属韻律情報を取り出す。この例文では、文章全
体が完全な定型的表現内容であるので、附属情報付音声
データメモリ2より取り出された附属韻律情報は、韻律
制御部13に入力されず、附属情報付音声データメモリ
2より取り出された音声データのみが音声処理部12に
入力される。
【0063】音声処理部12では、入力された音声デー
タから再生音声データが生成される。この音声処理部1
2で生成された再生音声データは、音声接続部18へ入
力される。この例文では、非定型的表現内容が含まれて
いないので、音声合成部16から音声接続部18に入力
される合成音声データはなく、音声接続部18に入力さ
れた再生音声データは合成音声データと接続されること
なく、そのまま音声出力部8へ出力される。
【0064】次に、文章内に定型的表現内容と非定型的
表現内容が混在する場合について、「現在地は、○○付
近です。」のような現在地名を案内する例を用いて説明
する。
【0065】この例では、文章中の「○○」の部分にカ
ーナビゲーションシステムから得られる現在地の地名の
情報が設定される。この現在地名の情報は、その情報が
必要とされた時点での場所の条件から表現内容が変化す
る非定型的表現内容である。
【0066】このように定型的表現内容と非定型的表現
内容が混在する場合では、音声合成装置7への入力情報
は、附属情報付音声データメモリ11に記憶されている
音声データからどの発声内容データを用いるかを表した
情報と、その発声内容データに必要とされる非定型的表
現内容の音韻情報の組合せとなる。
【0067】定型的表現内容と非定型的表現内容が混在
する場合では、最終的に音声データを合成するために、
非定型的表現内容に対応した韻律情報を自動的に生成し
て、定型的表現内容に対応した附属韻律情報との整合性
を考慮した調整を行う必要がある。
【0068】そのために、附属情報付音声データメモリ
11より取り出された図3の(A)に示すような定型的
表現内容の韻律情報が非定型的表現内容の音韻情報とと
もに韻律制御部13に入力される。
【0069】韻律制御部13では、図3の(B)に示す
ように、まず非定型的表現内容の音韻情報に基づいてこ
れに対応した韻律情報が生成される。
【0070】そして、生成された韻律情報は、附属情報
付音声データメモリ11より取り出された定型的表現内
容の韻律情報との整合性を考慮して調整される。この調
整処理においては、図3の(C)に示すように、最終的
に出力される再生音声データと合成音声データが接続さ
れた音声データによる音声が聴感上滑らかな韻律になる
ように調整される。
【0071】この調整処理では、例えば図3の(D)に
示すような処理が行われる。
【0072】すなわち、上記韻律生成部14で生成され
た生成された韻律情報に含まれるピッチパターンについ
ては、定型的表現内容の韻律情報に含まれる音声信号の
ピッチパターンの情報に基づいて、音声信号のピッチパ
ターンと滑らかに繋がるように、上記韻律生成部14で
生成された韻律情報に含まれるピッチパターンを変更す
る。また、上記韻律生成部14で生成された生成された
韻律情報に含まれる音韻継続時間長については、定型的
表現内の韻律情報に含まれる音声信号の発話速度の情報
に基づいて、音声信号の発話速度と同じになるように、
上記韻律生成部14で生成された生成された韻律情報に
含まれる音韻継続時間長を調整する。さらに、上記韻律
生成部14で生成された生成された韻律情報に含まれる
音韻パワーについては、定型的表現内容の韻律情報に含
まれる音声信号の音韻パワーの情報に基づいて、音声信
号の音韻パワーと滑らかに繋がるように、上記韻律生成
部14で生成された生成された韻律情報に含まれる音韻
パワーを調整する。
【0073】このようにして、定型的表現内容と非定型
的表現内容の混在する文章での非定型的表現内容に対応
した韻律情報が設定される。
【0074】韻律制御部13に入力された音韻情報と、
韻律制御部13において設定された韻律情報は、音声合
成部16へ入力される。
【0075】音声合成部16では、入力された音韻情報
に基づいて音声単位データセット記憶部17から各音声
単位データをロードする。ロードされた音声単位データ
は入力された音韻情報に応じた順序に並べられる。そし
て、この音韻情報に応じて並べられた音声単位データ
と、音声合成部16に入力された韻律情報を用いて音声
合成処理を行い、合成音声データを生成する。
【0076】ここで用いられる韻律情報は、各音韻の発
声時間を表す音韻継続時間長、各音韻の波形振幅を規定
する音韻パワー、音声の抑揚を表すピッチパターンから
なる。
【0077】このようにして、音声合成部16において
合成音声が生成される。
【0078】一方、文章内の定型的表現内容について
は、附属情報付音声データメモリ11より定型的表現内
容に該当する音声データが取り出され、音声処理部12
に入力される。
【0079】音声合成部16において生成された合成音
声データと音声処理部12において生成された再生音声
データは、音声接続部18に入力される。
【0080】音声接続部18では、文章内の定型的表現
内容と非定型的表現内容に基づいて、再生音声データと
合成音声データの接続を行い、この音声合成装置7から
出力される出力音声データが生成される。
【0081】音声接続部18で生成された出力音声デー
タは、音声出力部8へ入力され、スピーカ9から音声と
して出力される。
【0082】このような構成で音声合成装置7では、入
力情報により指定される定型的表現内容に対応した音声
信号を生成するとともに、その音声信号に対応した韻律
情報を生成し、上記入力情報により指定される非定型的
表現内容の音韻情報から韻律情報を生成し、上記定型的
表現内容に対応した音声信号の韻律情報に合わせて上記
非定型的表現内容に対応した韻律情報を調整し、この韻
律情報に基づいて上記非定型的表現内容に対応した合成
音声信号を生成し、上記定型的表現内容に対応した音声
信号と上記非定型的表現内容に対応した合成音声信号と
を接続することにより、入力情報に応じて定型的表現内
容の一部に非定型的表現内容を含む表現内容の音声信号
を生成する。これにより、定型的表現内容と非定型的表
現内容が混在する文章に対応した音声を出力する場合
に、再生音声の韻律と合成音声の韻律の整合性を考慮せ
ずに、再生音声と合成音声を単純に繋ぎ合わせただけの
音声に比べて、韻律の面においてより自然性の高い出力
音声を生成することができる。
【0083】なお上述の実施の形態においては、附属情
報付音声データメモリ11に記憶されている附属韻律情
報として、音声信号のピッチパターンの情報と、音声信
号の発話速度の情報と、音声信号の音韻パワーの情報を
取り上げているが、前記3種類の情報の内、音声信号の
ピッチパターンの情報と、音声信号の発話速度の情報の
2種類の情報を附属情報付音声データメモリ11に記憶
しておき、音韻パワーに関しては韻律生成部14におい
て自動的に生成される情報を利用してもよい。
【0084】さらに、上記3種類の情報の内、音声信号
のピッチパターンの情報のみを附属情報付音声データメ
モリ11に記憶しておき、音韻継続時間長と音韻パワー
に関しては韻律生成部14にて自動的に生成される情報
を利用してもよい。
【0085】また、附属情報付音声データメモリ11に
記憶されている附属韻律情報として、音声信号の接続部
分のピッチの情報と、音声信号の接続部分の発話速度の
情報と、音声信号の接続部分の音韻パワーの情報を記憶
しておき、韻律調整部15において上記3種類の情報に
基づいて、図4の(A),(B),(C),(D)に示
すような調整処理を行ってもよい。
【0086】さらに、上記3種類の情報の内、音声信号
の接続部分のピッチの情報と、音声信号の接続部分の発
話速度の情報の2種類の情報を附属情報付音声データメ
モリ11に記憶しておき、音韻パワーに関しては韻律生
成部14において自動的に生成される情報を利用しても
よい。
【0087】さらに、上記3種類の情報の内、音声信号
の接続部分のピッチの情報のみを附属情報付音声データ
メモリ11に記憶しておき、音韻継続時間長と音韻パワ
ーに関しては韻律生成部14において自動的に生成され
る情報を利用してもよい。
【0088】また、上述の実施の形態における音声単位
データセット記憶部17に記憶されている音声単位デー
タセットについては、附属情報付音声データメモリ11
に記憶されている音声信号の平均パワー、平均波形振
幅、最大波形振幅などの物理特性に基づいて、それらに
対応した音声単位データセットの物理特性が予め調整さ
れておいてもよい。
【0089】さらに、上述の物理特性の内、平均パワー
のみに基づいて、音声単位データセットの平均パワーが
予め調整されておいてもよい。
【0090】また、上述の実施の形態での、文章内に定
型的表現内容と非定型的表現内容が混在する場合の例文
「現在地は、○○付近です。」において、「現在地は」
と、「○○付近です。」のように文章を分解して、それ
ぞれに対応した出力音声データを生成するようにしても
よい。
【0091】この場合は、「非定型的表現内容と、それ
に後続する定型的表現内容」あるいは「定型的表現内容
のみ」からなるものを一つの表現内容として、この表現
内容一つ一つに対応した出力音声を生成する処理構造に
することにより、韻律調整部15における調整処理が、
後続する定型的表現内容に対応した附属韻律情報との整
合性のみを考慮することとなり、調整処理が容易なもの
となる。
【0092】さらに、「非定型的表現内容と、それに後
続する定型的表現内容」の場合において、定型的表現内
容の先頭音韻が無声音となるように、定型的表現内容を
事前に決定しておいてもよい(「○○付近です。」にお
ける /fukiNdesu/ の /f/ )。
【0093】この場合は、非定型的表現内容に対応した
合成音声と、定型的表現内容に対応した再生音声との接
続が必ず無声音で行われることとなり、韻律調整部15
での調整処理において重要なピッチパターンの滑らかな
連続性が容易に実現され、合成音声と再生音声の接続か
らなる出力音声全体の韻律がより自然性の高いものとな
る。
【0094】また、上述の実施の形態における附属情報
付音声データメモリ11に記憶されている音声データに
ついては、合成音声と韻律上の連続性が滑らかになるよ
うに、図5に示すように、音声信号の物理特性が予め調
整されておいてもよい。
【0095】さらに、予め調整される音声信号の物理特
性としては、音声信号のピッチパターンと波形振幅の両
者ともであってもよいし、あるいはピッチパターンか波
形振幅のどちらか一方のみであってもよい。
【0096】また、上述の実施の形態における附属情報
付音声データメモリ11に記憶されている音声信号は情
報圧縮されたものであってもよい。その場合は、音声処
理部12では情報圧縮された音声信号の復号化の処理も
行う。
【0097】さらに、上述の実施の形態例ではカーナビ
ゲーションシステムにおける音声案内を取り上げている
が、本発明はカーナビゲーションシステムに限定される
ものではなく、定型的表現内容と非定型的表現内容が混
在するような表現内容に対して音声出力を行う音声情報
提供装置全てに適用して好適なものである。
【0098】また、上述の音声合成装置7における音声
合成処理を行うための処理プログラムは、コンピュータ
で読み取り可能でかつ実行可能な音声合処理プログラム
として、情報記録媒体を介して提供することもできる。
【0099】
【発明の効果】以上のように、本発明に係る音声合成方
法及び音声合成装置では、入力情報により指定される定
型的表現内容に対応した音声信号を生成するとともに、
その音声信号に対応した韻律情報を生成する。また、上
記入力情報により指定される非定型的表現内容の音韻情
報から韻律情報を生成する。そして、上記定型的表現内
容に対応した音声信号の韻律情報に合わせて上記非定型
的表現内容に対応した韻律情報を調整し、この韻律情報
に基づいて上記非定型的表現内容に対応した合成音声信
号を生成し、上記定型的表現内容に対応した音声信号と
上記非定型的表現内容に対応した合成音声信号とを接続
することにより、入力情報に応じて定型的表現内容の一
部に非定型的表現内容を含む表現内容の音声信号を生成
するので、音声再生機能と合成音声機能を併用して、多
種多様の極めて自然な合成音を得ることができる。
【0100】また、本発明に係るナビゲーションシステ
ムでは、地図情報記憶手段の内容及び上記測定手段の測
定結果に対応して、所定の情報を出力する出力手段に、
本発明に係る音声合成装置の構成を備えるので、多種多
様の極めて自然な合成音によって、現在地などをユーザ
に知らせることができる。
【0101】さらに、本発明に係る情報記録媒体では、
入力情報により指定される定型的表現内容に対応した音
声信号を生成するとともに、その音声信号に対応した韻
律情報を生成し、上記入力情報により指定される非定型
的表現内容の音韻情報から韻律情報を生成し、上記定型
的表現内容に対応した音声信号の韻律情報に合わせて上
記非定型的表現内容に対応した韻律情報を調整し、この
韻律情報に基づいて上記非定型的表現内容に対応した合
成音声信号を生成し、上記定型的表現内容に対応した音
声信号と上記非定型的表現内容に対応した合成音声信号
とを接続することにより、入力情報に応じて定型的表現
内容の一部に非定型的表現内容を含む表現内容の音声信
号を生成するコンピュータで読み取り可能でかつ実行可
能な音声合成処理プログラムを簡単に提供することがで
きる。
【0102】したがって、本発明によれば、音声再生機
能と合成音声機能を併用して、多種多様の極めて自然な
合成音を得ることができるようにした音声合成方法及び
音声合成装置、ナビゲーションシステム、並びに情報記
録媒体を提供することができる。
【図面の簡単な説明】
【図1】本発明を適用したナビゲーションシステムの構
成を示すブロック図である。
【図2】本発明に係る音声合成装置の構成を示すブロッ
ク図である。
【図3】上記音声合成装置における韻律制御部の動作を
説明するための図である。
【図4】上記音声合成装置における韻律制御部の他の動
作例を説明するための図である。
【図5】上記音声合成装置における韻律制御部のさらに
他の動作例を説明するための図である。
【図6】音声再生機能により情報を提供する従来の音声
情報提供装置の構成を示すブロック図である。
【図7】音声合成機能により情報を提供する従来の音声
情報提供装置の構成を示すブロック図である。
【図8】音声再生機能及び音声合成を併用して情報を提
供する従来の音声情報提供装置の構成を示すブロック図
である。
【符号の説明】
7 音声合成装置、11 附属情報付音声データメモ
リ、12 音声処理部、13 韻律制御部、14 韻律
生成部、15 韻律調整部、16 音声合成部、17
音声単位データセット記憶部、18 音声接続部

Claims (27)

    【特許請求の範囲】
  1. 【請求項1】 入力情報により指定される定型的表現内
    容に対応した音声信号を生成するとともに、その音声信
    号に対応した韻律情報を生成し、 上記入力情報により指定される非定型的表現内容の音韻
    情報から韻律情報を生成し、 上記定型的表現内容に対応した音声信号の韻律情報に合
    わせて上記非定型的表現内容に対応した韻律情報を調整
    し、この韻律情報に基づいて上記非定型的表現内容に対
    応した合成音声信号を生成し、 上記定型的表現内容に対応した音声信号と上記非定型的
    表現内容に対応した合成音声信号とを接続することによ
    り、 入力情報に応じて定型的表現内容の一部に非定型的表現
    内容を含む表現内容の音声信号を生成することを特徴と
    する音声合成方法。
  2. 【請求項2】 上記定型的表現内容に対応した音声音声
    の韻律情報として、上記音声信号のピッチパターンの情
    報と上記音声信号の発話速度の情報と上記音声信号の音
    韻パワーの情報を予め記憶しておき、上記音声信号のピ
    ッチパターンの情報と上記音声信号の発話速度の情報と
    上記音声信号の音韻パワーの情報に基づいて、上記定型
    的表現内容に対応した音声信号の韻律情報に合わせて上
    記非定型的表現内容に対応した韻律情報を調整すること
    を特徴とする請求項1に記載の音声合成方法。
  3. 【請求項3】 上記定型的表現内容に対応した音声信号
    の韻律情報として、上記音声信号のピッチパターンの情
    報と上記音声信号の発話速度の情報を予め記憶してお
    き、 上記音声信号のピッチパターンの情報と上記音声信号の
    発話速度の情報に基づいて、上記定型的表現内容に対応
    した音声信号の韻律情報に合わせて上記非定型的表現内
    容に対応した韻律情報を調整することを特徴とする請求
    項1に記載の音声合成方法。
  4. 【請求項4】 上記定型的表現内容に対応した音声信号
    の韻律情報として、上記音声信号のピッチパターンの情
    報を予め記憶しておき、 上記音声信号のピッチパターンの情報に基づいて、上記
    定型的表現内容に対応した音声信号の韻律情報に合わせ
    て上記非定型的表現内容に対応した韻律情報を調整する
    ことを特徴とする請求項1に記載の音声合成方法。
  5. 【請求項5】 上記定型的表現内容に対応した音声信号
    の韻律情報として、上記音声信号の接続部分のピッチの
    情報と上記音声信号の接続部分の発話速度の情報と上記
    記音声信号の接続部分の音韻パワーの情報を予め記憶し
    ておき、 上記音声信号の接続部分のピッチの情報と上記音声信号
    の接続部分の発話速度の情報と上記記音声信号の接続部
    分の音韻パワーの情報に基づいて、上記定型的表現内容
    に対応した音声信号の韻律情報に合わせて上記非定型的
    表現内容に対応した韻律情報を調整することを特徴とす
    る請求項1に記載の音声合成方法。
  6. 【請求項6】 上記定型的表現内容に対応した音声信号
    の韻律情報として、上記音声信号の接続部分のピッチの
    情報と上記音声信号の接続部分の発話速度の情報を予め
    記憶しておき、 上記音声信号の接続部分のピッチの情報と上記音声信号
    の接続部分の発話速度の情報に基づいて、上記定型的表
    現内容に対応した音声信号の韻律情報に合わせて上記非
    定型的表現内容に対応した韻律情報を調整することを特
    徴とする請求項1に記載の音声合成方法。
  7. 【請求項7】 上記定型的表現内容に対応した音声信号
    の韻律情報として、上記音声信号の接続部分のピッチの
    情報を予め記憶しておき、 上記音声信号の接続部分のピッチの情報の情報に基づい
    て、上記定型的表現内容に対応した音声信号の韻律情報
    に合わせて上記非定型的表現内容に対応した韻律情報を
    調整することを特徴とする請求項1に記載の音声合成方
    法。
  8. 【請求項8】 上記定型的表現内容に対応した音声信号
    の物理特性に合わせて予め物理特性が調整された音声単
    位データセットを記憶しておき、 上記非定型的表現内容に対応した音韻情報のみに基づい
    て、音声単位データセットを読み出して規則音声合成に
    よる音声信号を生成することを特徴とする請求項1に記
    載の音声合成方法。
  9. 【請求項9】 上記音声単位データセットの物理特性と
    して、前記音声単位データセットのパワーが、前記定型
    的表現内容に対応した音声信号のパワー情報によって予
    め調整しておくことを特徴とする請求項8に記載の音声
    合成方法。
  10. 【請求項10】 上記非定型的表現内容に対応した合成
    音声に後続する定型的表現内容の音声信号を生成し、 少なくとも1つの非定型的表現内容と、それに後続する
    定型的表現内容からなるものを一つの表現内容として、
    任意の個数の表現内容によって構成される発話内容の音
    声信号を生成することを特徴とする請求項1に記載の音
    声合成方法。
  11. 【請求項11】 上記非定型的表現内容に対応した合成
    音声に後続する定型的表現内容の先頭音韻が無声音の音
    声信号を生成することを特徴とする請求項10に記載の
    音声合成方法。
  12. 【請求項12】 上記非定型的表現内容に対応した合成
    音声と韻律上の連続性が滑らかになるように、物理特性
    が予め調整された上記定型的表現内容に対応した音声信
    号を生成することを特徴とする請求項1に記載の音声合
    成方法。
  13. 【請求項13】 上記定型的表現内容に対応した音声信
    号と上記合成処理に用いられる音声単位データセットの
    各音声データとして同一発声者から得られた音声データ
    を用いることを特徴とする請求項1に記載の音声合成方
    法。
  14. 【請求項14】 入力情報により指定される定型的表現
    内容に対応した音声信号を生成するとともに、その音声
    信号に対応した韻律情報を生成する音声信号生成手段
    と、 上記入力情報により指定される非定型的表現内容の音韻
    情報から韻律情報を生成する韻律生成手段と、 上記音声信号生成手段により生成された定型的表現内容
    に対応した音声信号の韻律情報に応じて、上記非定型的
    表現内容に対応した韻律情報を調整する韻律調整手段
    と、 上記韻律調整手段により調整された韻律情報に基づい
    て、上記非定型的表現内容に対応した合成音声信号を生
    成する音声合成手段と、 上記音声信号生成手段により生成された定型的表現内容
    に対応した音声信号と上記音声合成手段により生成され
    た非定型的表現内容に対応した合成音声信号とを接続す
    る音声接続手段とを備え、 入力情報に応じて定型的表現内容の一部に非定型的表現
    内容を含む表現内容の音声信号を生成することを特徴と
    する音声合成装置。
  15. 【請求項15】 上記音声信号生成手段は、定型的表現
    内容に対応した音声音声の韻律情報として、上記音声信
    号のピッチパターンの情報と上記音声信号の発話速度の
    情報と上記音声信号の音韻パワーの情報を記憶した記憶
    手段を備え、 上記韻律調整手段は、上記記憶手段から読み出される上
    記音声信号のピッチパターンの情報と上記音声信号の発
    話速度の情報と上記音声信号の音韻パワーの情報に基づ
    いて、上記音声信号生成手段により生成された定型的表
    現内容に対応した音声信号の韻律情報と上記韻律生成部
    によって生成された非定型的表現内容に対応した韻律情
    報との整合性を計ること調整を行うことを特徴とする請
    求項14に記載の音声合成装置。
  16. 【請求項16】 上記音声信号生成手段は、定型的表現
    内容に対応した音声信号の韻律情報として、上記音声信
    号のピッチパターンの情報と上記音声信号の発話速度の
    情報を予め記憶した記憶手段を備え、 上記韻律調整手段は、上記記憶手段から読み出される上
    記音声信号のピッチパターンの情報と上記音声信号の発
    話速度の情報に基づいて、上記音声信号生成手段により
    生成された定型的表現内容に対応した音声信号の韻律情
    報と上記韻律生成部によって生成された非定型的表現内
    容に対応した韻律情報との整合性を計る調整を行うこと
    を特徴とする請求項14に記載の音声合成装置。
  17. 【請求項17】 上記音声信号生成手段は、定型的表現
    内容に対応した音声信号の韻律情報として、上記音声信
    号のピッチパターンの情報を予め記憶した記憶手段を備
    え、 上記韻律調整手段は、上記記憶手段から読み出される上
    記音声信号のピッチパターンの情報に基づいて、上記音
    声信号生成手段により生成された定型的表現内容に対応
    した音声信号の韻律情報と上記韻律生成部によって生成
    された非定型的表現内容に対応した韻律情報との整合性
    を計る調整を行うことを特徴とする請求項14に記載の
    音声合成装置。
  18. 【請求項18】 上記音声信号生成手段は、定型的表現
    内容に対応した音声信号の韻律情報として、上記音声信
    号の接続部分のピッチの情報と上記音声信号の接続部分
    の発話速度の情報と上記音声信号の接続部分の音韻パワ
    ーの情報を記憶した記憶手段を備え、 上記韻律調整手段は、上記記憶手段から読み出される上
    記音声信号の接続部分のピッチの情報と上記音声信号の
    接続部分の発話速度の情報と上記音声信号の接続部分の
    音韻パワーの情報に基づいて、上記音声信号生成手段に
    より生成された定型的表現内容に対応した音声信号の韻
    律情報と上記韻律生成部によって生成された非定型的表
    現内容に対応した韻律情報との整合性を計る調整を行う
    ことを特徴とする請求項14に記載の音声合成装置。
  19. 【請求項19】 上記音声信号生成手段は、定型的表現
    内容に対応した音声信号の韻律情報として、上記音声信
    号の接続部分のピッチの情報と上記音声信号の接続部分
    の発話速度の情報を記憶した記憶手段を備え、 上記韻律調整手段は、上記記憶手段から読み出される上
    記音声信号の接続部分のピッチの情報と上記音声信号の
    接続部分の発話速度の情報に基づいて、上記音声信号生
    成手段により生成された定型的表現内容に対応した音声
    信号の韻律情報と上記韻律生成部によって生成された非
    定型的表現内容に対応した韻律情報との整合性を計る調
    整を行うことを特徴とする請求項14に記載の音声合成
    装置。
  20. 【請求項20】 上記音声信号生成手段は、定型的表現
    内容に対応した音声信号の附属韻律情報として、上記音
    声信号の接続部分のピッチの情報を記憶した記憶手段を
    備え、 上記韻律調整手段は、上記記憶手段から読み出される上
    記音声信号の接続部分のピッチの情報に基づいて、上記
    音声信号生成手段により生成された定型的表現内容に対
    応した音声信号の韻律情報と上記韻律生成部によって生
    成された非定型的表現内容に対応した韻律情報との整合
    性を計る調整を行うことを特徴とする請求項14に記載
    の音声合成装置。
  21. 【請求項21】 上記定型的表現内容に対応した音声信
    号の物理特性に合わせて予め物理特性が調整された音声
    単位データセットを記憶した音声単位データセット記憶
    手段を備え、 上記音声合成手段は、音韻情報のみに基づいて、上記音
    声単位データセット記憶手段から音声単位データセット
    を読み出して、規則音声合成による音声データを生成す
    ることを特徴とする請求項14に記載の音声合成装置。
  22. 【請求項22】 上記音声単位データセットの物理特性
    として、前記音声単位データセットのパワーが、前記定
    型的表現内容に対応した音声信号のパワー情報によって
    予め調整されていることを特徴とする請求項21に記載
    の音声合成装置。
  23. 【請求項23】 上記音声信号生成手段は、上記非定型
    的表現内容に対応した合成音声に後続する定型的表現内
    容の音声信号を生成し、 少なくとも1つの非定型的表現内容と、それに後続する
    定型的表現内容からなるものを一つの表現内容として、
    任意の個数の表現内容によって構成される発話内容の音
    声信号を生成することを特徴とする請求項14に記載の
    音声合成装置。
  24. 【請求項24】 上記音声信号生成手段は、上記非定型
    的表現内容に対応した合成音声に後続する定型的表現内
    容の先頭音韻が無声音の音声信号を生成することを特徴
    とする請求項23に記載の音声合成装置。
  25. 【請求項25】 上記音声信号生成手段は、上記非定型
    的表現内容に対応した合成音声と韻律上の連続性が滑ら
    かになるように、物理特性が予め調整された上記定型的
    表現内容に対応した音声信号を生成することを特徴とす
    る請求項14に記載の音声合成装置。
  26. 【請求項26】 少なくとも地図に関する情報である地
    図情報とを記憶している地図情報記憶手段と、現在地を
    測定する測定手段と、上記地図情報記憶手段の内容及び
    上記測定手段の測定結果に対応して、所定の情報を出力
    する出力手段を備えるナビゲーションシステムであっ
    て、 上記出力手段は、入力情報により指定される定型的表現
    内容に対応した音声信号を生成するとともに、その音声
    信号に対応した韻律情報を生成する音声信号生成手段
    と、上記入力情報により指定される非定型的表現内容の
    音韻情報から韻律情報を生成する韻律生成手段と、上記
    音声信号生成手段により生成された定型的表現内容に対
    応した音声信号の韻律情報に応じて、上記非定型的表現
    内容に対応した韻律情報を調整する韻律調整手段と、上
    記韻律調整手段により調整された韻律情報に基づいて、
    上記非定型的表現内容に対応した合成音声信号を生成す
    る音声合成手段と、上記音声信号生成手段により生成さ
    れた定型的表現内容に対応した音声信号と上記音声合成
    手段により生成された非定型的表現内容に対応した合成
    音声信号とを接続する音声接続手段とを備え、入力情報
    に応じて定型的表現内容の一部に非定型的表現内容を含
    む表現内容の音声信号を生成する音声合成装置により、
    上記所定の情報から音声信号を生成して出力することを
    特徴とするナビゲーションシステム。
  27. 【請求項27】 入力情報により指定される定型的表現
    内容に対応した音声信号を生成するとともに、その音声
    信号に対応した韻律情報を生成し、 上記入力情報により指定される非定型的表現内容の音韻
    情報から韻律情報を生成し、 上記定型的表現内容に対応した音声信号の韻律情報に合
    わせて上記非定型的表現内容に対応した韻律情報を調整
    し、この韻律情報に基づいて上記非定型的表現内容に対
    応した合成音声信号を生成し、 上記定型的表現内容に対応した音声信号と上記非定型的
    表現内容に対応した合成音声信号とを接続することによ
    り、 入力情報に応じて定型的表現内容の一部に非定型的表現
    内容を含む表現内容の音声信号を生成することを特徴と
    するコンピュータで読み取り可能で、かつ実行可能な音
    声合処理プログラムを記憶した情報記録媒体。
JP9288815A 1997-10-21 1997-10-21 音声合成方法及び音声合成装置、ナビゲーションシステム、並びに情報記録媒体 Abandoned JPH11126087A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9288815A JPH11126087A (ja) 1997-10-21 1997-10-21 音声合成方法及び音声合成装置、ナビゲーションシステム、並びに情報記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9288815A JPH11126087A (ja) 1997-10-21 1997-10-21 音声合成方法及び音声合成装置、ナビゲーションシステム、並びに情報記録媒体

Publications (1)

Publication Number Publication Date
JPH11126087A true JPH11126087A (ja) 1999-05-11

Family

ID=17735103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9288815A Abandoned JPH11126087A (ja) 1997-10-21 1997-10-21 音声合成方法及び音声合成装置、ナビゲーションシステム、並びに情報記録媒体

Country Status (1)

Country Link
JP (1) JPH11126087A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003177029A (ja) * 2001-12-12 2003-06-27 Navitime Japan Co Ltd 地図表示装置、地図表示システム
WO2014203329A1 (ja) * 2013-06-18 2014-12-24 三菱電機株式会社 音声応答装置および応答音声生成方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003177029A (ja) * 2001-12-12 2003-06-27 Navitime Japan Co Ltd 地図表示装置、地図表示システム
WO2014203329A1 (ja) * 2013-06-18 2014-12-24 三菱電機株式会社 音声応答装置および応答音声生成方法

Similar Documents

Publication Publication Date Title
JP4878538B2 (ja) 音声合成装置
JP4973337B2 (ja) 音声読み上げのための装置、プログラム及び方法
JP2007086316A (ja) 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JP3673471B2 (ja) テキスト音声合成装置およびプログラム記録媒体
JP2000267687A (ja) 音声応答装置
JPH08193837A (ja) ナビゲーションシステム
JP3518898B2 (ja) 音声合成装置
JPH11126087A (ja) 音声合成方法及び音声合成装置、ナビゲーションシステム、並びに情報記録媒体
JPH0934490A (ja) 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体
JP3862478B2 (ja) 音声合成装置および音声合成方法
JPH03273280A (ja) 発声練習用音声合成方式
JPH11133989A (ja) カラオケ装置
JPH11249679A (ja) 音声合成装置
JPH07200554A (ja) 文章読み上げ装置
JP3785892B2 (ja) 音声合成装置及び記録媒体
JP2004516515A (ja) 区別された音声出力のための装置及び方法
JPH086582A (ja) 歌詞表示制御情報を有する伴奏データフォーマット及びこれに適した映像歌伴奏装置
JP3432336B2 (ja) 音声合成装置
JPH113096A (ja) 音声合成方法及び音声合成システム
JP4684609B2 (ja) 音声合成装置、制御方法、制御プログラム及び記録媒体
JPH0712581A (ja) 車輌用音声出力装置
JPH09179576A (ja) 音声合成方法
JP3034554B2 (ja) 日本語文章読上げ装置及び方法
JP2577372B2 (ja) 音声合成装置および方法
JPH04270395A (ja) 車載用交通情報提供装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040426

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040426

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060228

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20060501