JPH0934490A - 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体 - Google Patents

音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体

Info

Publication number
JPH0934490A
JPH0934490A JP7184196A JP18419695A JPH0934490A JP H0934490 A JPH0934490 A JP H0934490A JP 7184196 A JP7184196 A JP 7184196A JP 18419695 A JP18419695 A JP 18419695A JP H0934490 A JPH0934490 A JP H0934490A
Authority
JP
Japan
Prior art keywords
information
sentence
voice
replacement
prosody
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7184196A
Other languages
English (en)
Inventor
Keiichi Yamada
敬一 山田
Naoto Iwahashi
直人 岩橋
Satoshi Miyazaki
敏 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP7184196A priority Critical patent/JPH0934490A/ja
Publication of JPH0934490A publication Critical patent/JPH0934490A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Instructional Devices (AREA)
  • Navigation (AREA)
  • Traffic Control Systems (AREA)

Abstract

(57)【要約】 【課題】 多種多様の、自然な合成音を、容易に生成す
る。 【解決手段】 韻律生成部12において、現在地の地名
「品川」の音韻情報に基づいて、その韻律情報が生成さ
れ、韻律情報接続部13に供給される。さらに、韻律情
報接続部13には、発声内容データメモリ16に記憶さ
れている定型文「ここは、○○付近です。」の韻律情報
も供給される。韻律情報接続部13では、地名「品川」
および定型文「ここは、○○付近です。」の韻律情報
が、その整合性をとりながら接続され、置き換え文「こ
こは、品川付近です。」の韻律情報が生成される。そし
て、音声合成部14において、その韻律情報に基づい
て、合成音の生成が行われる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声合成装置およ
び音声合成方法、ナビゲーションシステム、並びに記録
媒体に関する。特に、自然で聞き取り易い合成音を得る
ことができるようにした音声合成装置および音声合成方
法、ナビゲーションシステム、並びに記録媒体に関す
る。
【0002】
【従来の技術】従来、情報機器から、ユーザに対し、情
報を音声で提供する方法としては、音声を記録媒体に記
録しておき、それを再生する方法(以下、適宜、音声再
生による方法という)、音声合成により合成音を生成す
る方法(以下、適宜、音声合成による方法という)、お
よび、例えば特開平4−270395号公報などに開示
されているような両者を併用する方法(以下、適宜、音
声再生および音声合成の併用による方法という)などが
ある。
【0003】図4は、音声再生による方法により、情報
を音声で提供する、従来の音声提供装置の一例の構成を
示している。定型文音声データメモリ21には、ユーザ
に提供すべき1以上の音声の波形データ、あるいはその
波形データを圧縮したデータ(以下、適宜、両方含め
て、音声データという)が記憶されている。音声処理部
22では、定型文音声データメモリ21から、ユーザに
提供すべき所定の音声データが読み出され、音声出力部
8に供給される。なお、音声処理部22では、音声デー
タが圧縮されている場合、その伸張処理が行われる。
【0004】音声出力部8は、例えばD/A変換器およ
びアンプなどを内蔵しており、音声処理部22からの音
声データをD/A変換し、さらに、そのレベルを適正に
調整して、スピーカ9に供給する。これにより、スピー
カ9からは、音声が出力される。
【0005】以上の音声再生による方法によれば、人間
の自然な発声による音声波形がある程度忠実に再生さ
れ、音声波形に含まれる音韻情報、韻律情報はほぼ確実
に再現される。従って、この場合、スピーカ9から出力
される音声は、例えばテープレコーダなどに録音された
音声を再生した場合とほぼ同様のものであるから、発話
者の特徴(個人性)が保存された、いわば高品質の音声
を得ることができる。さらに、この場合、再生された音
声の内容は明瞭に聞き取ることができるので、確実性の
高い情報伝達を行うことができる。
【0006】次に、図5は、音声合成による方法によ
り、情報を音声(合成音)で提供する、従来の音声提供
装置の一例の構成を示している。なお、図中、図4にお
ける場合と対応する部分については、同一の符号を付し
てある。この音声提供装置は、例えばカーナビゲーショ
ンシステムなどに適用され、ユーザ(運転者)に、現在
地その他の情報を合成音で提供するものとされている。
【0007】ここで、カーナビゲーションシステムなど
には、例えば現在地や、目的地までの距離、その他の様
々な情報を、ユーザに提供することが望まれるが、その
情報は、通常、頻繁に使用される文である定型文を構成
する単語を、所定の単語に置き換えた文である置き換え
文によって表現することができる。
【0008】即ち、カーナビゲーションシステムにおい
て、例えば、ユーザに、現在地を、合成音で知らせるに
は、「ここは、○○付近です」という定型文を用意して
おき、その○○の部分を、現在地(例えば、品川や五反
田駅など)で置き換えた置き換え文(上述の例では、
「ここは、品川付近です。」や、「ここは、五反田駅付
近です。」など)を生成し、さらに、その置き換え文に
対応する合成音を生成すれば良い。
【0009】なお、「ここは、品川付近です」や「ここ
は、五反田駅付近です。」のうちの、品川や五反田駅を
除く部分、即ち、定型文「ここは、○○付近です。」の
うちの○○を除く部分を、定型的表現(定型的表現内
容)というものとすると、○○の部分と置き換えられる
単語(以下、適宜、置換単語という)としての、例えば
品川や五反田などは、非定型的表現(非定型的表現内
容)ということができる。
【0010】図5の音声提供装置では、以上のような置
き換え文の合成音が生成されるようになされている。即
ち、出力文章生成部31には、置換単語の音韻情報(読
み)が供給されるようになされており、出力文章生成部
31は、置換単語を受信すると、発声内容データメモリ
32に記憶されている定型文の音韻情報のうち、受信し
た置換単語と組み合わせるべき定型文の音韻情報が読み
出される。そして、その定型文の○○の部分が、受信し
た置換単語に置き換えられた置き換え文(の音韻情報)
が生成され、規則音声合成部33に供給される。
【0011】規則音声合成部33では、置き換え文の音
韻情報が、韻律制御部34に供給され、そこでは、その
音韻情報に基づいて、置き換え文の韻律情報が生成され
る。置き換え文の音韻情報および韻律情報は、音声合成
部14に供給され、音声合成部14では、その音韻情報
および韻律情報に基づいて、音声単位データセット記憶
部15に記憶されている音素片データが読み出されて接
続される。そして、その結果得られた音声波形は、音声
出力部8を介して、スピーカ9に供給され、これによ
り、スピーカ9からは、置き換え文に対応する合成音が
出力される。
【0012】以上の処理によれば、例えば、置換単語と
して、現在地(ここでは、例えば品川とする)が、出力
文章生成部31に供給された場合、出力文章生成部31
では、例えば定型文「ここは、○○付近です。」を構成
する単語○○が、品川に置き換えられ、これにより、置
き換え文「ここは、品川付近です。」が生成される。そ
して、規則音声合成部33において、規則音声合成が行
われることにより、合成音「ここは、品川付近です。」
が生成される。
【0013】音声合成による方法によれば、合成音とす
る情報(上述の例では、置き換え文)の音韻情報があれ
ば、その合成音を生成することができるので、多種多様
の表現(定型的表現であっても、また非定型的表現であ
っても)に対応する合成音を、容易に得ることができ
る。
【0014】次に、図6は、音声再生および音声合成の
併用による方法により、情報を音声(合成音)で提供す
る、従来の音声提供装置の一例の構成を示している。な
お、図中、図4または図5における場合と対応する部分
については、同一の符号を付してある。
【0015】この音声提供装置では、図5で説明したよ
うな置き換え文に対応する合成音が生成されるが、その
うちの定型文に対応する合成音(音声)は、定型文音声
データメモリ21および音声処理部22によって、ま
た、置換単語に対応する合成音は、規則音声合成部33
によって、それぞれ生成(再生)されるようになされて
いる。
【0016】即ち、規則音声合成部33には、置換単語
の音韻情報が入力され、そこでは、図5における場合と
同様にして、その合成音の音声波形が生成され、音声結
合部41に供給される。また、音声処理部22では、規
則音声合成部33に入力された置換単語と組み合わせる
べき定型文の音声データ(音声波形)が読み出され、音
声結合部41に供給される。音声結合部41では、規則
音声合成部33および音声処理部22の出力が、波形レ
ベルで組み合わされ、即ち、規則音声合成部33からの
置換単語の音声波形と、音声処理部22からの定型文の
音声波形とが組み合わされ、これにより、図5で説明し
たような置き換え文「ここは、品川付近です。」に対応
する合成音が生成される。
【0017】以上のように、音声再生および音声合成の
併用による方法によれば、合成音のうち、定型的表現の
部分に関しては音声再生による方法が用いられ、非定型
的表現の部分に関しては音声合成による方法がを用いら
れるので、両者の長所を享受することができる。
【0018】
【発明が解決しようとする課題】しかしながら、上述し
た方法には、以下のような課題があった。
【0019】即ち、音声再生による方法の場合には、提
供しようとする音声すべてについての音声データを、定
型文音声データメモリ21に記憶しておく必要があっ
た。このため、例えば、音声合成による方法の場合と同
様の表現に対応する音声を提供するには、莫大な量の音
声データ(音声合成による方法の場合に必要となる情報
量の、例えば数十乃至数百倍程度のデータ)が必要であ
った。従って、同一の記憶容量のデータメモリを用いた
場合では、出力可能な合成音の表現内容の数が、単純に
は、数十分の一乃至数百分の一に限定される課題があっ
た。
【0020】また、音声合成による方法の場合には、音
声再生による方法の場合に比較して、合成音が、充分な
品質レベルに達しているとはいい難く、さらに、韻律制
御部34では、置き換え文の音韻情報のみから、その韻
律情報が生成されるため、置き換え文全体の韻律情報
が、合成音の韻律制御を行うのに不充分なものとなる場
合があった。このため、合成音の韻律が不自然なものと
なり、ユーザへの情報伝達能力が低下することがあっ
た。
【0021】一方、音声再生および音声合成の併用によ
る方法の場合では、上述したように、両方法によって得
られる音声(合成音)の品質の隔たりが大きいため、即
ち、装置から出力される合成音には、品質の大きく異な
る音声が混在しているため、合成音が、同一の話者が発
声しているようには聞こえず、不自然なものとなる課題
があった。さらに、その結果、音声合成による方法によ
り生成された、高品質でない合成音の部分の了解度が低
下し、これにより、合成音全体の情報伝達能力が低下す
ることがあった。
【0022】本発明は、このような状況に鑑みてなされ
たものであり、多種多様の、自然な合成音を、容易に得
ることができるようにするものである。
【0023】
【課題を解決するための手段】本発明の音声合成装置
は、定型文を構成する単語を、入力単語に置き換えた文
である置き換え文に対応する合成音を生成する音声合成
装置であって、定型文の音韻情報および韻律情報を記憶
している定型文記憶手段と、入力単語の音韻情報に基づ
いて、その韻律情報を生成する韻律情報生成手段と、定
型文および入力単語の音韻情報に基づいて、置き換え文
の音韻情報を生成するとともに、定型文および入力単語
の韻律情報を、その整合性をとりながら接続することに
より、置き換え文の韻律情報を生成する音韻韻律情報生
成手段とを備えることを特徴とする。
【0024】この音声合成装置においては、定型文記憶
手段には、定型文の韻律情報として、そのピッチパター
ンを、少なくとも記憶させておくことができる。また、
定型文記憶手段には、定型文の韻律情報として、その定
型文を構成する各音韻の継続時間または各音韻のパワー
を、さらに記憶させておくことができる。
【0025】本発明の音声合成方法は、定型文を構成す
る単語を、入力単語に置き換えた文である置き換え文に
対応する合成音を生成する音声合成方法であって、入力
単語の音韻情報に基づいて、その韻律情報を生成し、定
型文および入力単語の音韻情報に基づいて、置き換え文
の音韻情報を生成するとともに、定型文および入力単語
の韻律情報を、その整合性をとりながら接続することに
より、置き換え文の韻律情報を生成することを特徴とす
る。
【0026】本発明のナビゲーションシステムは、少な
くとも地図に関する情報である地図情報を記憶している
地図情報記憶手段と、現在地を測定する測定手段と、地
図情報記憶手段の記憶内容および測定手段の測定結果に
対応して、所定の情報を出力する出力手段とを備えるナ
ビゲーションシステムであって、出力手段が、所定の情
報を合成音で出力する音声合成手段を含んで構成され、
所定の情報が、定型文を構成する単語を、所定の単語に
置き換えた文である置き換え文であるとき、音声合成手
段が、定型文の音韻情報および韻律情報を記憶している
定型文記憶手段と、所定の単語の音韻情報に基づいて、
その韻律情報を生成する韻律情報生成手段と、定型文お
よび所定の単語の音韻情報に基づいて、置き換え文の音
韻情報を生成するとともに、定型文および所定の単語の
韻律情報を、その整合性をとりながら接続することによ
り、置き換え文の韻律情報を生成する音韻韻律情報生成
手段と、置き換え文の音韻情報および韻律情報に基づい
て、合成音を生成する合成音生成手段とを有することを
特徴とする。
【0027】本発明の記録媒体は、定型文を構成する単
語を、入力単語に置き換えた文である置き換え文に対応
する合成音を生成する音声合成装置で用いられる記録媒
体であって、定型文の音声波形を構成するための音韻情
報および韻律情報が記録されていることを特徴とする。
【0028】本発明の音声合成装置においては、定型文
記憶手段は、定型文の音韻情報および韻律情報を記憶し
ている。韻律情報生成手段は、入力単語の音韻情報に基
づいて、その韻律情報を生成し、音韻韻律情報生成手段
は、定型文および入力単語の音韻情報に基づいて、置き
換え文の音韻情報を生成するとともに、定型文および入
力単語の韻律情報を、その整合性をとりながら接続する
ことにより、置き換え文の韻律情報を生成するようにな
されている。
【0029】本発明の音声合成方法においては、入力単
語の音韻情報に基づいて、その韻律情報を生成し、定型
文および入力単語の音韻情報に基づいて、置き換え文の
音韻情報を生成するとともに、定型文および入力単語の
韻律情報を、その整合性をとりながら接続することによ
り、置き換え文の韻律情報を生成するようになされてい
る。
【0030】本発明のナビゲーションシステムにおいて
は、定型文記憶手段は、定型文の音韻情報および韻律情
報を記憶している。韻律情報生成手段は、所定の単語の
音韻情報に基づいて、その韻律情報を生成し、音韻韻律
情報生成手段は、定型文および所定の単語の音韻情報に
基づいて、置き換え文の音韻情報を生成するとともに、
定型文および所定の単語の韻律情報を、その整合性をと
りながら接続することにより、置き換え文の韻律情報を
生成するようになされている。
【0031】本発明の記録媒体においては、定型文の音
声波形を構成するための音韻情報および韻律情報が記録
されている。
【0032】
【発明の実施の形態】以下に、本発明の実施例を説明す
るが、その前に、特許請求の範囲に記載の発明の各手段
と以下の実施例との対応関係を明らかにするために、各
手段の後の括弧内に、対応する実施例(但し、一例)を
付加して、本発明の特徴を記述すると、次のようにな
る。
【0033】即ち、請求項1に記載の音声合成装置は、
定型文を構成する単語を、入力単語に置き換えた文であ
る置き換え文に対応する合成音を生成する音声合成装置
であって、定型文の音韻情報および韻律情報を記憶して
いる定型文記憶手段(例えば、図2に示す発声内容デー
タメモリ16など)と、入力単語の音韻情報に基づい
て、その韻律情報を生成する韻律情報生成手段(例え
ば、図2に示す韻律生成部12など)と、定型文および
入力単語の音韻情報に基づいて、置き換え文の音韻情報
を生成するとともに、定型文および入力単語の韻律情報
を、その整合性をとりながら接続することにより、置き
換え文の韻律情報を生成する音韻韻律情報生成手段(例
えば、図2に示す韻律情報接続部13など)と、置き換
え文の音韻情報および韻律情報に基づいて、合成音を生
成する合成音生成手段(例えば、図2に示す音声合成部
14など)とを備えることを特徴とする。
【0034】請求項5に記載のナビゲーションシステム
は、少なくとも地図に関する情報である地図情報を記憶
している地図情報記憶手段(例えば、図1に示すCD−
ROM3など)と、現在地を測定する測定手段(例え
ば、図1に示す測定部4など)と、地図情報記憶手段の
記憶内容および測定手段の測定結果に対応して、所定の
情報を出力する出力手段(例えば、図1に示す出力部5
など)とを備えるナビゲーションシステムであって、出
力手段が、所定の情報を合成音で出力する音声合成手段
(例えば、図1に示す音声合成装置7など)を含んで構
成され、所定の情報が、定型文を構成する単語を、所定
の単語に置き換えた文である置き換え文であるとき、音
声合成手段が、定型文の音韻情報および韻律情報を記憶
している定型文記憶手段(例えば、図2に示す発声内容
データメモリ16など)と、所定の単語の音韻情報に基
づいて、その韻律情報を生成する韻律情報生成手段(例
えば、図2に示す韻律生成部12など)と、定型文およ
び所定の単語の音韻情報に基づいて、置き換え文の音韻
情報を生成するとともに、定型文および所定の単語の韻
律情報を、その整合性をとりながら接続することによ
り、置き換え文の韻律情報を生成する音韻韻律情報生成
手段(例えば、図2に示す韻律情報接続部13など)
と、置き換え文の音韻情報および韻律情報に基づいて、
合成音を生成する合成音生成手段(例えば、図2に示す
音声合成部14など)とを有することを特徴とする。
【0035】なお、勿論この記載は、各手段を上記した
ものに限定することを意味するものではない。
【0036】図1は、本発明を適用したナビゲーション
システムの一実施例の構成を示すブロック図である。こ
のナビゲーションシステムは、例えば自動車などに装備
され、ボタンなどの操作による他、入力音声にも対応し
て、動作するようになされている。なお、このナビゲー
ションシステムは、自動車などに装備する他、例えば携
帯して用いることもできるようになされている。
【0037】入力部1には、例えばボタンやジョイステ
ィックなどの操作手段と、音声を入力するためのマイク
などの音声入力手段が装備されている。そして、入力部
1からは、操作手段の操作に対応した信号が制御部2に
送信されるようになされている。さらに、入力部1は、
音声認識装置を内臓しており、入力された音声(音声入
力手段に入力された音声)は、そこで音声認識され、そ
の音声認識結果も、制御部2に送信されるようになされ
ている。制御部2は、システムを構成する各ブロックと
の間で情報の送受を行い、システム全体の動作を制御す
るようになされている。CD−ROM3には、例えば複
数のスケールの、電子化された地図情報(地図の画像デ
ータだけでなく、その地図上の地名や施設名などのテキ
ストデータ、音韻情報などを含む)、その他のナビゲー
ションに必要な情報が記録(記憶)されており、そこか
らは、制御部2からの指令に基づいて必要な情報が読み
出されるようになされている。
【0038】測定部4は、GPS衛星からの電波を受信
したり、ジャイロスコープなどの測定装置を用いること
などによって、現在地を測定するようになされている。
出力部5は、制御部2より供給される所定の情報を出力
するようになされている。即ち、出力部5は、所定の情
報が、画像その他の表示可能なもの(例えば、地図な
ど)である場合にそれを表示するための、例えば液晶モ
ニタやCRTなどでなる表示部6、所定の情報が、合成
音を生成するのに必要なものである場合にその情報に基
づいて音声合成を行う音声合成装置7、音声合成装置7
で生成された合成音(ディジタルデータ)をD/A変換
し、適正なレベルに増幅する音声出力部8、および音声
出力部8から供給される合成音を出力するためのスピー
カ9を有している。
【0039】以上のように構成されるナビゲーションシ
ステムにおいては、例えば入力部1が、現在地を表示す
るように操作されると、その操作に対応した操作信号
が、入力部1から制御部2に出力される。すると、制御
部2では、測定部4によって測定されている現在地が受
信され、その現在地を含む、所定のスケールの地図が、
CD−ROM3から読み出される。さらに、制御部2
は、CD−ROM3から読み出した地図を、出力部5の
表示部6に供給する。これにより、表示部6では、例え
ば現在地を中心とする地図が、自身を表すマーク(例え
ば、自動車の進行方向を向いた矢印など)とともに表示
される。
【0040】その後、ユーザ(運転者)が運転する自動
車が、例えば、所定の地域や交差点、施設などに差し掛
かると、制御部2において、その地名(交差点名や、施
設名などを含む)が、CD−ROM3から読み出され、
音声合成に必要な情報とともに、出力部5の音声合成装
置7に出力される。音声合成装置7では、制御部2から
情報を受信すると、その情報に基づいて、例えば規則音
声合成が行われ、合成音が生成される。即ち、地名が、
例えば「品川」などであった場合、音声合成装置7で
は、例えば、現在地をユーザに報知するための合成音
「ここは、品川付近です。」が生成される。この合成音
は、音声出力部8を介して、スピーカ9に供給されて出
力され、これにより、ユーザは、表示部6に視線を移動
することなく、現在地を認識することができる。
【0041】なお、以上のように、現在地を合成音で出
力する地点(地域、施設、交差点など)は、CD−RO
M3に記憶させておくようにすることもできるし、ユー
ザがあらかじめ設定することもできる。さらに、ユーザ
が、入力部1を所定操作したときに、現在地を合成音で
出力させるようにすることも可能である。
【0042】また、CD−ROM3は、システムに対
し、着脱可能になされており、これにより将来、地図な
どに変更があっても、その変更後の地図情報が記憶され
たCD−ROMを、CD−ROM3に代えて装着するこ
とによって、CD−ROM3に記憶されている情報の陳
腐化により、システムが実質的に使用不可になることを
防止することができるようになされている。
【0043】図2は、図1の音声合成装置7の構成例を
示している。なお、図中、図4乃至図6における場合と
対応する部分については、同一の符号を付してある。
【0044】この音声合成装置7は、定型文の単語を、
置換単語(入力単語)(所定の単語)に置き換えて、上
述したような合成音を生成するようになされている。即
ち、制御部2から音声合成装置7に対しては、音声合成
に必要な情報としての、例えば用いる定型文(定型的表
現)を特定するための特定情報と、CD−ROM3に記
録されている地名などとしての、置換単語(非定型的表
現)(正確には、置換単語の音韻情報)とが、入力情報
として供給されるようになされている。具体的には、例
えば、上述したような合成音「ここは、品川付近で
す。」を生成する場合には、「ここは、○○付近で
す。」という定型文に対応する特定情報と、○○と置き
換えられる置換単語「品川」とが、入力情報として供給
される。なお、特定情報は、発声内容データメモリ16
に、置換単語は、韻律制御部11に、それぞれ入力され
るようになされている。
【0045】韻律制御部11は、韻律生成部12および
韻律情報接続部13で構成されている。韻律生成部12
は、置換単語の音韻情報に基づいて、その韻律情報を生
成し、置換単語の音韻情報とともに、韻律情報接続部1
3に供給するようになされている。韻律情報接続部13
は、後述する発声内容データメモリ16から供給される
定型文を構成する単語を、韻律生成部12から供給され
る置換単語で置き換えた置き換え文を生成するようにな
されている。即ち、韻律情報接続部13は、発声内容デ
ータメモリ16からの定型文の音韻情報、および韻律生
成部12からの置換単語の音韻情報に基づいて、置き換
え文全体についての音韻情報を生成する。さらに、韻律
情報接続部13は、発声内容データメモリ16からの定
型文の韻律情報、および韻律生成部12からの置換単語
の韻律情報を、その整合性をとりながら接続することに
より、置き換え文全体についての韻律情報を生成する。
【0046】韻律情報接続部13で生成された置き換え
文の音韻情報および韻律情報(以下、適宜、両方含め
て、音韻韻律情報という)は、音声合成部14に供給さ
れるようになされている。
【0047】音声合成部14は、韻律情報接続部13か
らの音韻韻律情報に基づいて、音声単位データセット記
憶部15に記憶されている音素片データを接続し、置き
換え文に対応する合成音(音声波形)を生成するように
なされている。音声単位データセット記憶部15は、例
えば、CV(CまたはVは、それぞれ子音または母音を
表す)や、CVC/VCV等の単位で規則音声合成に必
要な音素片データを記憶している。発声内容データメモ
リ16は、種々の定型文(例えば、上述したような「こ
こは、○○付近です。」の他、「○○を右(左)に曲が
って下さい。」や、「あと、○kmで○○(具体的な目
的地など)です。」、「次は、○○(具体的な交差点
名))交差点です。」、さらには、置換単語による置き
換えを行わずに使用することのできる「まもなく、目的
地付近です。」や、「次の交差点を右(左)に曲がって
下さい。」など)に対応する音声波形を構成(生成)す
るのに必要な音韻情報および韻律情報(例えば、定型文
のピッチパターン(これは、合成音の抑揚を表す)、定
型文を構成する各音韻の継続時間、および各音韻のパワ
ー(これにより、音韻の波形振幅が規定される)など)
を記憶している。
【0048】なお、発声内容データメモリ16には、定
型文の音韻韻律情報が、その特定情報と対応付けられて
記憶されており、例えば、特定情報をアドレスとして与
えると、その特定情報と対応付けされている定型文の音
韻韻律情報が出力されるようになされている。
【0049】次に、その動作について説明する。制御部
2から特定情報および置換単語が供給されると、その特
定情報または置換単語は、それぞれ発声内容データメモ
リ16または韻律生成部12に入力される。発声内容デ
ータメモリ16では、制御部2から特定情報を受信する
と、その特定情報に対応する定型文の音韻韻律情報が、
韻律情報接続部13に供給される。また、韻律生成部1
2では、制御部2から置換単語(の音韻情報)を受信す
ると、その置換単語の音韻情報に基づいて、その韻律情
報が生成され、韻律情報接続部13に供給される。
【0050】韻律情報接続部13では、発声内容データ
メモリ16から、定型文の音韻韻律情報を受信するとと
もに、韻律生成部12から、置換単語の音韻韻律情報を
受信すると、それらの情報に基づいて、上述したように
して、定型文を構成する単語を置換単語で置き換えた置
き換え文についての音韻韻律情報が生成され、音声合成
部14に出力される。音声合成部14では、韻律情報接
続部13からの音韻情報に対応した音素片データが、音
素単位データセット記憶部15より読み出され、それら
が、同じく韻律情報接続部13からの韻律情報に基づい
て接続されることにより、置き換え文に対応する音声波
形が生成される。この音声波形は、音声出力部8を介し
て、スピーカ9に供給され、これにより、スピーカ9か
らは、置き換え文に対応する合成音が出力される。
【0051】なお、制御部2から音声合成装置7に対し
ては、置換単語が供給されず、置換単語による置き換え
を行わずに使用することのできる定型文(例えば、上述
した「まもなく、目的地付近です。」や、「次の交差点
を右(左)に曲がって下さい。」など)に対応する特定
情報のみが供給される場合があり、この場合、発話内容
データメモリ16から出力される定型文の音韻韻律情報
は、韻律情報接続部13ではなく、音声合成部14に供
給されるようになされている。従って、この場合、音声
合成部14では、その定型文に対応する合成音が、上述
したようにして生成され、その結果、スピーカ9から
は、「まもなく、目的地付近です。」や、「次の交差点
を右(左)に曲がって下さい。」などの定型文そのもの
に対応する合成音が出力される。
【0052】次に、スピーカ9から、例えば合成音「こ
こは、品川付近です。」が出力される場合を例にして、
ナビゲーションシステム(音声合成装置7)の動作につ
いて、さらに説明する。この場合、制御部2から音声合
成装置7に対しては、特定情報として、例えば定型文
「ここは、○○付近です。」に対応するものが供給され
るとともに、置換単語(正確には、上述したように、置
換単語の音韻情報)として、例えば「品川」が供給され
る。
【0053】特定情報は、発声内容データメモリ16に
対し、アドレスとして与えられ、これにより、発声内容
データメモリ16からは、定型文「ここは、○○付近で
す。」の音韻情報(読み)および韻律情報(本実施例で
は、上述したように、ピッチパターン、音韻の継続時
間、および音韻のパワーとする)が読み出され、韻律情
報接続部13に供給される。
【0054】ここで、図3(A)は、発声内容データメ
モリ16から出力される定型文「ここは、○○付近で
す。」の音韻韻律情報(音韻情報と韻律情報)を表して
いる。なお、図3(A)(後述する図3(B)および図
3(C)についても同様)においては、次のように音韻
情報および韻律情報が表されている。即ち、図3(D)
に示すように、アルファベット(図3(D)において
は、kとo)は、音韻情報(読み)を表し、線上のグラ
フは、ピッチパターン(ピッチ周波数)を表している。
さらに、白抜きの棒グラフの高さまたは幅は、それぞれ
子音(図3(D)においては、k)のパワーまたは継続
時間(音韻継続時間長)を表し、黒塗りの棒グラフの高
さまたは幅は、それぞれ母音(図3(D)においては、
o)のパワーまたは継続時間を表している。
【0055】また、音韻情報は、原則として小文字のア
ルファベットで表してあるが、「ん」の音韻情報につい
ては、「な」、「に」、「ぬ」、「ね」、「の」の子音
を表すnと区別するために大文字(N)で表してある。
さらに、母音であっても、発話において無声化するもの
については、白抜きの棒グラフを用いて表してある(例
えば、図3(A)におけるfu(ふ)のうちのuや、s
u(す)のうちのuなど)。
【0056】一方、置換単語「品川」の音韻情報(上述
した規則にしたがって表記すればshinagawa)
は、韻律生成部12に供給され、そこで、その音韻情報
に基づいて、置換単語「品川」の韻律情報が生成され
る。そして、置換単語「品川」の音韻情報および韻律情
報は、韻律生成部12から韻律情報接続部13に供給さ
れる。ここで、図3(B)に、韻律生成部12から出力
される置換単語「品川」の音韻韻律情報(音韻情報と韻
律情報)を示す。
【0057】韻律情報接続部13では、発声内容データ
メモリ16からの定型文「ここは、○○付近です。」の
音韻情報kokowa○○fukiNdesuの○○の
部分が、韻律生成部12からの置換単語「品川」の音韻
情報shinagawaに置き換えられ、これにより置
き換え文「ここは、品川付近です。」についての音韻情
報kokowashinagawafukiNdesu
が生成される。
【0058】さらに、韻律情報接続部13においては、
発声内容データメモリ16からの定型文「ここは、○○
付近です。」の韻律情報、および韻律生成部12からの
置換単語「品川」の韻律情報が、最終的に出力される合
成音が聴感上滑らかな韻律になるように整合性が計られ
た上で接続され、これにより、置き換え文「ここは、品
川付近です。」の韻律情報が生成される。ここで、図3
(C)に、韻律情報接続部13で生成される置き換え文
「ここは、品川付近です。」の音韻韻律情報(音韻情報
と韻律情報)を示す。
【0059】韻律情報接続部13において、定型文「こ
こは、○○付近です。」の韻律情報と、置換単語「品
川」の韻律情報との整合性は、具体的には、例えば次の
ようにとられる。即ち、ピッチパターンについては、例
えば、ポーズが挿入されずに接続される部分(本実施例
では、「品川」のwaの終わりの部分と、「付近」のf
uの先頭部分)が滑らかになるように制御される。音韻
の継続時間については、例えば、置換単語「品川」と定
型文「ここは、○○付近です。」の各音節がほぼ同じ程
度の長さ(時間)になるように制御される。音韻のパワ
ーについては、例えば、置換単語「品川」と定型文「こ
こは、○○付近です。」の各音節がほぼ同じ程度のパワ
ーになるように制御される。
【0060】以上のようにして生成された置き換え文
「ここは、品川付近です。」の音韻情報および韻律情報
は、音声合成部14に供給され、そこでは、韻律情報接
続部13からの音韻情報に対応した音素片データが、音
素単位データセット記憶部15より読み出され、それら
が、同じく韻律情報接続部13からの韻律情報に基づい
て接続される。即ち、音声合成部14は、音素片データ
を、ピッチパターン、音韻の継続時間、およびパワーな
どに基づいて接続し、置き換え文に対応する音声波形を
生成する。この音声波形は、音声出力部8を介して、ス
ピーカ9に供給され、これにより、スピーカ9からは、
置き換え文「ここは、品川付近です。」に対応する合成
音が出力される。
【0061】以上のように、定型文を構成する単語を置
換単語で置き換えた置き換え文を生成し、また、置換単
語の韻律情報を、その音韻情報から生成するようにした
ので、種々の表現の合成音を、容易に(置換単語の韻律
情報を記憶しておかなくても)提供することができる。
【0062】さらに、定型文を構成する単語の、置換単
語への置き換えを、波形レベルで行うのではなく、音韻
情報と韻律情報のレベルで行うようにしたので、自然な
韻律の合成音を提供することができる。
【0063】また、定型文の韻律情報を、あらかじめ発
声内容データメモリ16に記憶させておくようにしたの
で、この定型文の韻律情報は、精度の高いものとするこ
とができる。そして、そのような精度の高い韻律情報と
整合をとって、置換単語の韻律情報を接続するようにし
たので、定型文の部分に対応する合成音と、置換単語の
部分に対応する合成音との間には、大きな品質の差が生
じず、その結果、聞き取り易い合成音を提供することが
できる。また、前述した音声合成による方法の場合に比
較して、より自然性の高い合成音を提供することができ
る。
【0064】さらに、音声合成部14において、置き換
え文を構成する定型文および置換単語のいずれの部分に
ついても、音声単位データセット記憶部15に記憶され
ている音素片データから合成音を生成するようにしたの
で、前述した音声再生および音声合成の併用による方法
における場合のように、合成音に不自然さが生じること
もない。
【0065】さらに、定型文については、その音声波形
を得るための情報として、定型文の音韻情報および韻律
情報を、発声内容データメモリ16に記憶させておくよ
うにしたので、その音声波形をそのまま、あるいは、圧
縮して記憶しておく場合に比較して、その容量を小さな
もの(例えば、10%以下など)とすることができる
(言い換えれば、定型文についての情報を非常に効率的
に圧縮して記憶しておくことができる)。従って、同一
の容量のメモリを用意した場合には、音声波形を記憶さ
せる場合に比較して、より多くの定型文を記憶させるこ
とができる。なお、本実施例では、定型文の音韻韻律情
報を記憶させておく媒体として、メモリ(発声内容デー
タメモリ16)を用いるようにしたが、定型文の音韻韻
律情報を記憶させておく媒体としては、メモリ以外の、
例えばCD−ROMなどの記録媒体(メモリは、正確に
は、記憶媒体というべきであるが、本明細書中では、記
憶媒体も記録媒体に含まれるものとする)を用いること
が可能である。
【0066】以上、本発明を、自動車に搭載されるナビ
ゲーションシステムに適用した場合について説明した
が、本発明は、その他、例えば航空機や船舶などに搭載
されるナビゲーションシステムなどにも適用可能であ
る。さらに、本発明は、ナビゲーションシステムの他、
合成音による音声応答を行う音声ガイダンス装置、その
他のあらゆる装置に適用可能である。
【0067】なお、本実施例においては、現在地を、ユ
ーザに報知する場合に用いる定型文「ここは、○○付近
です。」を例にして、合成音の出力を説明したが、本発
明は、その他の定型文を用いた場合にも適用可能であ
る。
【0068】さらに、本実施例では、定型文の音韻情報
および韻律情報を、音声合成装置7内の発声内容データ
メモリ16に記憶させておくようにしたが、定型文の音
韻情報および韻律情報は、その他、例えばCD−ROM
3に記録しておくことも可能である。この場合、発声内
容データメモリ16は設ける必要はない。
【0069】また、本実施例においては、発声内容デー
タメモリ16に、定型文の韻律情報として、音韻継続時
間長、音韻パワー、ピッチパターンを記憶させるように
したが、発声内容データメモリ16には、ピッチパター
ン、ピッチパターンと音韻継続時間長またはピッチパタ
ーンと音韻パワーを記憶させておくようにし、定型文の
音韻継続時間長または音韻パワーは、韻律生成部12に
おいて生成される置換単語の韻律情報である音韻継続時
間長または音韻パワーとの整合をとりながら生成するよ
うにすることが可能である。
【0070】また、本実施例では、韻律情報として、音
韻継続時間長、音韻パワー、ピッチパターンを用いた場
合を説明したが、韻律情報としては、その他の情報を用
いることも可能である。
【0071】
【発明の効果】以上の如く、本発明の音声合成装置およ
び音声合成方法によれば、入力単語の音韻情報に基づい
て、その韻律情報が生成される。そして、定型文および
入力単語の音韻情報に基づいて、置き換え文の音韻情報
が生成されるとともに、定型文および入力単語の韻律情
報が、その整合性をとりながら接続され、置き換え文の
韻律情報が生成される。従って、多種多様の、自然な合
成音を、容易に提供することが可能となる。
【0072】また、本発明のナビゲーションシステムに
よれば、所定の単語の音韻情報に基づいて、その韻律情
報が生成される。そして、定型文および所定の単語の音
韻情報に基づいて、置き換え文の音韻情報が生成される
とともに、定型文および所定の単語の韻律情報が、その
整合性をとりながら接続され、置き換え文の韻律情報が
生成される。従って、自然な合成音によって、例えば現
在地などを、ユーザに報知することが可能となる。
【0073】本発明の記録媒体には、定型文の音声波形
を構成するための音韻情報および韻律情報が記録されて
おり、この音韻情報および韻律情報は、音声波形のデー
タに比較して極めてデータ量が少ないので、多くの定型
文についての情報を記録しておくことが可能となる。
【図面の簡単な説明】
【図1】本発明を適用したナビゲーションシステムの一
実施例の構成を示すブロック図である。
【図2】図1の音声合成装置7の構成例を示すブロック
図である。
【図3】図2の韻律情報接続部13の処理を説明するた
めの図である。
【図4】音声再生による方法により、情報を音声で提供
する、従来の音声提供装置(音声合成装置)の一例の構
成を示すブロック図である。
【図5】音声合成による方法により、情報を音声(合成
音)で提供する、従来の音声提供装置の一例の構成を示
すブロック図である。
【図6】音声再生および音声合成の併用による方法によ
り、情報を音声(合成音)で提供する、従来の音声提供
装置の一例の構成を示すブロック図である。
【符号の説明】
1 入力部 2 制御部 3 CD−ROM 4 測定部 5 出力部 6 表示部 7 音声合成装置 11 韻律制御部 12 韻律生成部 13 韻律情報接続部 14 音声合成部 15 音声単位データセット記憶部 16 発声内容メモリ

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 定型文を構成する単語を、入力単語に置
    き換えた文である置き換え文に対応する合成音を生成す
    る音声合成装置であって、 前記定型文の音韻情報および韻律情報を記憶している定
    型文記憶手段と、 前記入力単語の音韻情報に基づいて、その韻律情報を生
    成する韻律情報生成手段と、 前記定型文および入力単語の音韻情報に基づいて、前記
    置き換え文の音韻情報を生成するとともに、前記定型文
    および入力単語の韻律情報を、その整合性をとりながら
    接続することにより、前記置き換え文の韻律情報を生成
    する音韻韻律情報生成手段と、 前記置き換え文の音韻情報および韻律情報に基づいて、
    前記合成音を生成する合成音生成手段とを備えることを
    特徴とする音声合成装置。
  2. 【請求項2】 前記定型文記憶手段は、前記定型文の韻
    律情報として、そのピッチパターンを、少なくとも記憶
    していることを特徴とする請求項1に記載の音声合成装
    置。
  3. 【請求項3】 前記定型文記憶手段は、前記定型文の韻
    律情報として、その定型文を構成する各音韻の継続時間
    または各音韻のパワーを、さらに記憶していることを特
    徴とする請求項2に記載の音声合成装置。
  4. 【請求項4】 定型文を構成する単語を、入力単語に置
    き換えた文である置き換え文に対応する合成音を生成す
    る音声合成方法であって、 前記定型文の音韻情報および韻律情報があらじめ記憶さ
    れているとき、 前記入力単語の音韻情報に基づいて、その韻律情報を生
    成し、 前記定型文および入力単語の音韻情報に基づいて、前記
    置き換え文の音韻情報を生成するとともに、前記定型文
    および入力単語の韻律情報を、その整合性をとりながら
    接続することにより、前記置き換え文の韻律情報を生成
    し、 前記置き換え文の音韻情報および韻律情報に基づいて、
    前記合成音を生成することを特徴とする音声合成方法。
  5. 【請求項5】 少なくとも地図に関する情報である地図
    情報を記憶している地図情報記憶手段と、 現在地を測定する測定手段と、 前記地図情報記憶手段の記憶内容および前記測定手段の
    測定結果に対応して、所定の情報を出力する出力手段と
    を備えるナビゲーションシステムであって、 前記出力手段が、前記所定の情報を合成音で出力する音
    声合成手段を含んで構成され、 前記所定の情報が、定型文を構成する単語を、所定の単
    語に置き換えた文である置き換え文であるとき、 前記音声合成手段は、 前記定型文の音韻情報および韻律情報を記憶している定
    型文記憶手段と、 前記所定の単語の音韻情報に基づいて、その韻律情報を
    生成する韻律情報生成手段と、 前記定型文および所定の単語の音韻情報に基づいて、前
    記置き換え文の音韻情報を生成するとともに、前記定型
    文および所定の単語の韻律情報を、その整合性をとりな
    がら接続することにより、前記置き換え文の韻律情報を
    生成する音韻韻律情報生成手段と、 前記置き換え文の音韻情報および韻律情報に基づいて、
    前記合成音を生成する合成音生成手段とを有することを
    特徴とするナビゲーションシステム。
  6. 【請求項6】 定型文を構成する単語を、入力単語に置
    き換えた文である置き換え文に対応する合成音を生成す
    る音声合成装置で用いられる記録媒体であって、 前記定型文の音声波形を構成するための音韻情報および
    韻律情報が記録されていることを特徴とする記録媒体。
JP7184196A 1995-07-20 1995-07-20 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体 Pending JPH0934490A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7184196A JPH0934490A (ja) 1995-07-20 1995-07-20 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7184196A JPH0934490A (ja) 1995-07-20 1995-07-20 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体

Publications (1)

Publication Number Publication Date
JPH0934490A true JPH0934490A (ja) 1997-02-07

Family

ID=16149043

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7184196A Pending JPH0934490A (ja) 1995-07-20 1995-07-20 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体

Country Status (1)

Country Link
JP (1) JPH0934490A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0973011A2 (en) * 1998-07-15 2000-01-19 Visteon Technologies, LLC Method and apparatus for providing route guidance in a vehicle navigation system
JP2007212884A (ja) * 2006-02-10 2007-08-23 Fujitsu Ltd 音声合成装置、音声合成方法、及びコンピュータプログラム
JP2009037214A (ja) * 2007-07-11 2009-02-19 Canon Inc 音声処理装置及び方法
JP2009282236A (ja) * 2008-05-21 2009-12-03 Mitsubishi Electric Corp 音声合成装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0973011A2 (en) * 1998-07-15 2000-01-19 Visteon Technologies, LLC Method and apparatus for providing route guidance in a vehicle navigation system
EP0973011B1 (en) * 1998-07-15 2008-03-12 TomTom International B.V. Method and apparatus for providing route guidance in a vehicle navigation system
JP2007212884A (ja) * 2006-02-10 2007-08-23 Fujitsu Ltd 音声合成装置、音声合成方法、及びコンピュータプログラム
JP2009037214A (ja) * 2007-07-11 2009-02-19 Canon Inc 音声処理装置及び方法
JP2009282236A (ja) * 2008-05-21 2009-12-03 Mitsubishi Electric Corp 音声合成装置

Similar Documents

Publication Publication Date Title
JP4973337B2 (ja) 音声読み上げのための装置、プログラム及び方法
JP5029167B2 (ja) 音声読み上げのための装置、プログラム及び方法
EP0831460B1 (en) Speech synthesis method utilizing auxiliary information
JP4878538B2 (ja) 音声合成装置
EP1071074A2 (en) Speech synthesis employing prosody templates
JP5029168B2 (ja) 音声読み上げのための装置、プログラム及び方法
US20230034572A1 (en) Voice synthesis method, voice synthesis apparatus, and recording medium
JP2007086316A (ja) 音声合成装置、音声合成方法、音声合成プログラムおよび音声合成プログラムを記憶したコンピュータ読み取り可能な記憶媒体
JPH08193837A (ja) ナビゲーションシステム
JPH0934490A (ja) 音声合成装置および音声合成方法、ナビゲーションシステム、並びに記録媒体
JPH0876796A (ja) 音声合成装置
JPH03273280A (ja) 発声練習用音声合成方式
JPH11126087A (ja) 音声合成方法及び音声合成装置、ナビゲーションシステム、並びに情報記録媒体
JPH0934491A (ja) 音声合成装置および音声合成方法、並びにナビゲーションシステム
JP2001337690A (ja) 情報再生装置及び情報再生方法並びに記憶媒体
JPH07200554A (ja) 文章読み上げ装置
JP2004516515A (ja) 区別された音声出力のための装置及び方法
JPH0712581A (ja) 車輌用音声出力装置
JPH11249679A (ja) 音声合成装置
JP4684609B2 (ja) 音声合成装置、制御方法、制御プログラム及び記録媒体
JP3034554B2 (ja) 日本語文章読上げ装置及び方法
JP3432336B2 (ja) 音声合成装置
JP2006330486A (ja) 音声合成装置、この音声合成装置を備えるナビゲーション装置、音声合成プログラム及びこのプログラムを記憶した情報記憶媒体
JPH113096A (ja) 音声合成方法及び音声合成システム
JPH04270395A (ja) 車載用交通情報提供装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030617