JP2001209400A - 音声合成装置及び音声案内システム - Google Patents
音声合成装置及び音声案内システムInfo
- Publication number
- JP2001209400A JP2001209400A JP2000014892A JP2000014892A JP2001209400A JP 2001209400 A JP2001209400 A JP 2001209400A JP 2000014892 A JP2000014892 A JP 2000014892A JP 2000014892 A JP2000014892 A JP 2000014892A JP 2001209400 A JP2001209400 A JP 2001209400A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- guidance
- data
- synthesizing
- synthesized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Navigation (AREA)
Abstract
(57)【要約】
【課題】簡易な手法で自分の好みの音声での音声案内が
実現できるようにする。 【解決手段】特徴データ抽出部12で入力された特定者
の音声から声質の特徴を示す特徴データが抽出され、特
徴データ格納部13に格納される。案内用テキスト情報
格納部17は、本システム1にて音声案内をする内容に
応じたテキスト情報を格納しており、音声合成用データ
格納部15には、所定単位毎の音声波形信号が音声合成
用データとして格納されている。声質変換部14は、音
声合成用データ格納部15から読み出した音声合成用デ
ータを、特徴データ格納部13から読み出した任意の特
徴データに対応する特定者の音声を合成するための音声
合成用データに変換する。そして、音声合成部16は、
この声質変換部14によって変換された、案内用テキス
ト情報を構成する各単位に対応する音声合成用データ
を、なめらかな発声が得られるように連結する波形処理
を行う。
実現できるようにする。 【解決手段】特徴データ抽出部12で入力された特定者
の音声から声質の特徴を示す特徴データが抽出され、特
徴データ格納部13に格納される。案内用テキスト情報
格納部17は、本システム1にて音声案内をする内容に
応じたテキスト情報を格納しており、音声合成用データ
格納部15には、所定単位毎の音声波形信号が音声合成
用データとして格納されている。声質変換部14は、音
声合成用データ格納部15から読み出した音声合成用デ
ータを、特徴データ格納部13から読み出した任意の特
徴データに対応する特定者の音声を合成するための音声
合成用データに変換する。そして、音声合成部16は、
この声質変換部14によって変換された、案内用テキス
ト情報を構成する各単位に対応する音声合成用データ
を、なめらかな発声が得られるように連結する波形処理
を行う。
Description
【0001】
【発明の属する技術分野】本発明は、テキスト情報に対
応する音声を合成する音声合成装置及びその音声合成装
置を備えた音声案内システムに関する。
応する音声を合成する音声合成装置及びその音声合成装
置を備えた音声案内システムに関する。
【0002】
【従来の技術及び発明が解決しようとする課題】従来よ
り、カーナビゲーションシステムにおける経路案内な
ど、音声での案内によるユーザへの情報伝達は広い分野
で実施されているが、その多くは、予め内部の記憶手段
内に格納されたシステム固定の音声を用いている。その
ため、案内音声が単数あるいは複数にかかわらずシステ
ム固定の音声でしか案内がされず、ユーザにとって必ず
しも快適な音声案内が実現されているとはいいがたい。
り、カーナビゲーションシステムにおける経路案内な
ど、音声での案内によるユーザへの情報伝達は広い分野
で実施されているが、その多くは、予め内部の記憶手段
内に格納されたシステム固定の音声を用いている。その
ため、案内音声が単数あるいは複数にかかわらずシステ
ム固定の音声でしか案内がされず、ユーザにとって必ず
しも快適な音声案内が実現されているとはいいがたい。
【0003】なお、上述したカーナビゲーションシステ
ムの場合には、例えば標準語・関西弁・津軽弁・英語と
いった複数種類の音声から自由に選択できるものもある
が、これらはいずれもシステム側で予め準備されている
ものである。したがって、単調さの解消には役立つが、
そのいずれも気に入ったものでなければ、やはり快適な
音声案内とはならない。
ムの場合には、例えば標準語・関西弁・津軽弁・英語と
いった複数種類の音声から自由に選択できるものもある
が、これらはいずれもシステム側で予め準備されている
ものである。したがって、単調さの解消には役立つが、
そのいずれも気に入ったものでなければ、やはり快適な
音声案内とはならない。
【0004】ここで、システム固定の音声以外の音声も
用いる技術として、特願平9−325043号に開示さ
れたものがある。しかし、この技術は、音声案内メッセ
ージ自体をそのまま録音する方式であるため、好みの音
声にしたい音声案内メッセージの全てに対して録音しな
くてはならない。しかし、例えば音声案内メッセージが
100種類もあれば、その全てについて録音する必要が
あるため、本人が行うにしても非常に手間がかかってし
まう。また、他人にわざわざそのような録音作業をして
もらうというのは現実的に困難であり、ごく親しい人以
外は実質的に不可能に近い。特に、システム固定の音声
を作成する際のように、充実した録音機器や場所を確保
するにも難しく、音質そのものが良好にはなりにくい。
用いる技術として、特願平9−325043号に開示さ
れたものがある。しかし、この技術は、音声案内メッセ
ージ自体をそのまま録音する方式であるため、好みの音
声にしたい音声案内メッセージの全てに対して録音しな
くてはならない。しかし、例えば音声案内メッセージが
100種類もあれば、その全てについて録音する必要が
あるため、本人が行うにしても非常に手間がかかってし
まう。また、他人にわざわざそのような録音作業をして
もらうというのは現実的に困難であり、ごく親しい人以
外は実質的に不可能に近い。特に、システム固定の音声
を作成する際のように、充実した録音機器や場所を確保
するにも難しく、音質そのものが良好にはなりにくい。
【0005】そしてなにより、そのような自分に近い関
係の人ではなく、テレビやラジオに出演している自分の
好きなタレントなどの声で音声案内をしてもらいたいと
いう要求がある場合、上述した技術では対応できない。
有名タレントや芸能人にわざわざ音声案内メッセージ自
体を発声してもらい、録音するのは実質的に不可能な場
合がほとんどだからである。
係の人ではなく、テレビやラジオに出演している自分の
好きなタレントなどの声で音声案内をしてもらいたいと
いう要求がある場合、上述した技術では対応できない。
有名タレントや芸能人にわざわざ音声案内メッセージ自
体を発声してもらい、録音するのは実質的に不可能な場
合がほとんどだからである。
【0006】そこで、本発明は、簡易な手法で自分の好
みの音声での音声案内が実現できるようにするための音
声合成装置及び音声案内システムを提供することを目的
とする。
みの音声での音声案内が実現できるようにするための音
声合成装置及び音声案内システムを提供することを目的
とする。
【0007】
【課題を解決するための手段】請求項1に記載の音声合
成装置を用いれば、次のようにして、ユーザが所望する
特定の者の声での音声を合成することができる。まず、
音声入力手段を介して特定者の音声を入力する。この場
合、入力する特定者の音声の源は、例えば音声データを
記録した媒体(例えばCDやMDなど)を再生する再生
装置から出力された音声や、音声データを受信して再生
する受信装置(テレビ受信機やラジオ受信機など)から
出力された音声が考えられる。もちろん、マイクロフォ
ンを介してリアルタイムで入力された特定者の音声でも
よい。
成装置を用いれば、次のようにして、ユーザが所望する
特定の者の声での音声を合成することができる。まず、
音声入力手段を介して特定者の音声を入力する。この場
合、入力する特定者の音声の源は、例えば音声データを
記録した媒体(例えばCDやMDなど)を再生する再生
装置から出力された音声や、音声データを受信して再生
する受信装置(テレビ受信機やラジオ受信機など)から
出力された音声が考えられる。もちろん、マイクロフォ
ンを介してリアルタイムで入力された特定者の音声でも
よい。
【0008】そして、音声入力手段を介して入力した音
声から特定者の声質の特徴データを抽出し、その抽出し
た特徴データを基に、音声を合成するための音声合成用
データを、特定者の声質での音声を合成するための音声
合成用データに変換する。その後、その声質変換手段に
よって変換された音声合成用データを基に、テキスト情
報に対応する音声を合成する。
声から特定者の声質の特徴データを抽出し、その抽出し
た特徴データを基に、音声を合成するための音声合成用
データを、特定者の声質での音声を合成するための音声
合成用データに変換する。その後、その声質変換手段に
よって変換された音声合成用データを基に、テキスト情
報に対応する音声を合成する。
【0009】このように本発明装置の場合には、従来手
法のように所定内容に応じた音声を意図的に発したもの
を録音して利用するのではなく、自由に取り込んだ音声
に基づいて音声合成することができる。これによって、
例えばテレビ放送やラジオ放送などを利用して、好みの
音声を取り込み、その音声にてテキスト情報に対応する
音声を合成することができる。したがって、例えばこれ
をナビゲーションシステムに適用すれば、経路案内など
のための案内音声を、自分の好みの音声にて実現するこ
とができる。そして、この際、取り込む相手に特段の面
倒をかけることないため、例えば自分の好きなタレント
の声で音声案内をさせたい場合であっても、そのタレン
トの主体的な協力なしで非常に簡易に実現できる。
法のように所定内容に応じた音声を意図的に発したもの
を録音して利用するのではなく、自由に取り込んだ音声
に基づいて音声合成することができる。これによって、
例えばテレビ放送やラジオ放送などを利用して、好みの
音声を取り込み、その音声にてテキスト情報に対応する
音声を合成することができる。したがって、例えばこれ
をナビゲーションシステムに適用すれば、経路案内など
のための案内音声を、自分の好みの音声にて実現するこ
とができる。そして、この際、取り込む相手に特段の面
倒をかけることないため、例えば自分の好きなタレント
の声で音声案内をさせたい場合であっても、そのタレン
トの主体的な協力なしで非常に簡易に実現できる。
【0010】なお、音声合成の仕方は、編集合成形音声
合成でもよいし、規則合成形音声合成でもよい。編集合
成形音声合成の場合には、編集状況によっては合成可能
な音声が制限される。したがって、特定者の音声の入力
度合いが少ない段階では、やや問題があるが音質は良く
なる、一方、規則合成形音声合成の場合は、少ないサン
プル入力であっても、任意の音声を合成可能であるが、
音質は相対的には悪くなる。これらは、いずれか一方の
みに固定しても良いが、例えば両方の合成方法を選択で
きるようにし、ユーザが選択可能としてもよい。つま
り、多くのサンプル入力が可能であれば、編集合成形音
声合成を選択して音質の良さを重要視すればよいし、多
くのサンプル入力が望めない場合には、規則合成形音声
合成を選択すればよい。
合成でもよいし、規則合成形音声合成でもよい。編集合
成形音声合成の場合には、編集状況によっては合成可能
な音声が制限される。したがって、特定者の音声の入力
度合いが少ない段階では、やや問題があるが音質は良く
なる、一方、規則合成形音声合成の場合は、少ないサン
プル入力であっても、任意の音声を合成可能であるが、
音質は相対的には悪くなる。これらは、いずれか一方の
みに固定しても良いが、例えば両方の合成方法を選択で
きるようにし、ユーザが選択可能としてもよい。つま
り、多くのサンプル入力が可能であれば、編集合成形音
声合成を選択して音質の良さを重要視すればよいし、多
くのサンプル入力が望めない場合には、規則合成形音声
合成を選択すればよい。
【0011】このような音声合成装置は、請求項3に示
すように、音声案内システムに適用することができる。
この場合は、音声案内システムにて使用する案内用のテ
キスト情報に対応する音声を音声合成装置にて合成し、
その合成音声にて案内を実行させることができる。そし
て、このような音声案内システムとする場合には、請求
項4に示すように、さらに、自システムにて使用する全
ての案内用のテキスト情報に対応する音声を記憶してい
るシステム固定音声記憶手段を備え、音声合成装置にて
合成した音声またはシステム固定音声記憶手段に記憶さ
れた音声を選択的に用いて音声案内を実行できるように
することも考えられる。音声合成ができるほどサンプル
音声が入力できていない場合などには、システム固定の
音声にて音声案内すればよい。
すように、音声案内システムに適用することができる。
この場合は、音声案内システムにて使用する案内用のテ
キスト情報に対応する音声を音声合成装置にて合成し、
その合成音声にて案内を実行させることができる。そし
て、このような音声案内システムとする場合には、請求
項4に示すように、さらに、自システムにて使用する全
ての案内用のテキスト情報に対応する音声を記憶してい
るシステム固定音声記憶手段を備え、音声合成装置にて
合成した音声またはシステム固定音声記憶手段に記憶さ
れた音声を選択的に用いて音声案内を実行できるように
することも考えられる。音声合成ができるほどサンプル
音声が入力できていない場合などには、システム固定の
音声にて音声案内すればよい。
【0012】なお、記憶しておく合成音声に関しては、
請求項5に示すように、複数の特定者に対応させてもよ
い。まず第1の特定者の音声を入力し、その声質で、シ
ステムにて使用する全ての案内用のテキスト情報に対応
する音声を合成し、それを記憶しておく。その後、第2
の特定者の音声を入力し、その声質で同様に案内用のテ
キスト情報に対応する音声を合成して記憶しておくので
ある。このようにすれば、選択肢が広くなる。
請求項5に示すように、複数の特定者に対応させてもよ
い。まず第1の特定者の音声を入力し、その声質で、シ
ステムにて使用する全ての案内用のテキスト情報に対応
する音声を合成し、それを記憶しておく。その後、第2
の特定者の音声を入力し、その声質で同様に案内用のテ
キスト情報に対応する音声を合成して記憶しておくので
ある。このようにすれば、選択肢が広くなる。
【0013】また、複数の声質での音声案内が可能な場
合には、請求項6に示すように、案内内容に対応して声
質を個別に指定できるように、その指定された声質を用
いて音声案内を行うようにしてもよい。この際、請求項
7に示すように、ユーザに対して目的地までの経路を案
内するにあたり、目的地までの経路案内全体という単位
で声質を指定できるようにすることもできる。例えば、
カーナビゲーションシステムに適用した場合、目的地が
友達の家であれば、経路案内をその友達の声で行うこと
が考えられる。
合には、請求項6に示すように、案内内容に対応して声
質を個別に指定できるように、その指定された声質を用
いて音声案内を行うようにしてもよい。この際、請求項
7に示すように、ユーザに対して目的地までの経路を案
内するにあたり、目的地までの経路案内全体という単位
で声質を指定できるようにすることもできる。例えば、
カーナビゲーションシステムに適用した場合、目的地が
友達の家であれば、経路案内をその友達の声で行うこと
が考えられる。
【0014】また、安全面を重視した案内の場合と、通
常の案内の場合でそれぞれふさわしい声質に指定するこ
ともできる。あるいは、施設案内に際して、例えばコン
ビニエンスストアの案内に、そのコンビニエンスストア
のCMに出ているタレントの声を使うといったこともで
きる。
常の案内の場合でそれぞれふさわしい声質に指定するこ
ともできる。あるいは、施設案内に際して、例えばコン
ビニエンスストアの案内に、そのコンビニエンスストア
のCMに出ているタレントの声を使うといったこともで
きる。
【0015】これらの自分の好みに応じた自由な設定
が、基本的には自分だけで実現することができる。つま
り、相手の協力を特に求めなくてよいという意味であ
る。
が、基本的には自分だけで実現することができる。つま
り、相手の協力を特に求めなくてよいという意味であ
る。
【0016】
【発明の実施の形態】以下、本発明が適用された実施例
について図面を用いて説明する。なお、本発明の実施の
形態は、下記の実施例に何ら限定されることなく、本発
明の技術的範囲に属する限り、種々の形態を採り得るこ
とは言うまでもない。
について図面を用いて説明する。なお、本発明の実施の
形態は、下記の実施例に何ら限定されることなく、本発
明の技術的範囲に属する限り、種々の形態を採り得るこ
とは言うまでもない。
【0017】図1は、音声合成装置10を備えた音声案
内システム1の概略構成を示すブロック図である。本実
施例の音声案内システム1は、音声合成装置10と、合
成音声記憶部21と、システム固定音声記憶部22と、
出力音声切換部23と、制御部24と、操作部25と、
音声プロセッサ26と、スピーカ27とを備えており、
音声合成装置10は、音声入力部11と、特徴データ抽
出部12と、特徴データ格納部13と、声質変換部14
と、音声合成用データ格納部15と、音声合成部16
と、案内用テキスト情報格納部17とを備えている。
内システム1の概略構成を示すブロック図である。本実
施例の音声案内システム1は、音声合成装置10と、合
成音声記憶部21と、システム固定音声記憶部22と、
出力音声切換部23と、制御部24と、操作部25と、
音声プロセッサ26と、スピーカ27とを備えており、
音声合成装置10は、音声入力部11と、特徴データ抽
出部12と、特徴データ格納部13と、声質変換部14
と、音声合成用データ格納部15と、音声合成部16
と、案内用テキスト情報格納部17とを備えている。
【0018】音声入力部11には、マイクロフォン3
1、CDプレーヤ32、MDプレーヤ33、TVチュー
ナ34、ラジオチューナ35が接続されており、マイク
ロフォン31を介して入力された人の音声信号、CDプ
レーヤ32やMDプレーヤ33にて再生された音楽CD
やMDなどに記憶されている音声信号、TVチューナ3
4やラジオチューナ35にて受信・再生された音声信号
などを入力可能とされている。なお、これらマイクロフ
ォン31、CDプレーヤ32、MDプレーヤ33、TV
チューナ34、ラジオチューナ35に関しては必ずしも
これら全てを備える必要はなく、いずれか一つだけでも
よい。
1、CDプレーヤ32、MDプレーヤ33、TVチュー
ナ34、ラジオチューナ35が接続されており、マイク
ロフォン31を介して入力された人の音声信号、CDプ
レーヤ32やMDプレーヤ33にて再生された音楽CD
やMDなどに記憶されている音声信号、TVチューナ3
4やラジオチューナ35にて受信・再生された音声信号
などを入力可能とされている。なお、これらマイクロフ
ォン31、CDプレーヤ32、MDプレーヤ33、TV
チューナ34、ラジオチューナ35に関しては必ずしも
これら全てを備える必要はなく、いずれか一つだけでも
よい。
【0019】特徴データ抽出部12は、音声入力部11
を介して入力した特定者の音声に対して所定の波形処理
を行い、声質の特徴を示すデータ(特徴データf)を抽
出(あるいは生成)する。この特徴データは、入力音声
の基本周波数、パワー、スペクトル包絡など、あるいは
これらから生成した声紋データである。もちろん、これ
以外にも、話者固有の声質を反映可能なものであれば特
徴データfとして採用可能である。
を介して入力した特定者の音声に対して所定の波形処理
を行い、声質の特徴を示すデータ(特徴データf)を抽
出(あるいは生成)する。この特徴データは、入力音声
の基本周波数、パワー、スペクトル包絡など、あるいは
これらから生成した声紋データである。もちろん、これ
以外にも、話者固有の声質を反映可能なものであれば特
徴データfとして採用可能である。
【0020】そして、この特徴データ抽出部12にて抽
出された特徴データfは、特徴データ格納部13に格納
される。なお、本実施例では、特定者としてn人まで格
納することができ、それらに対応した特徴データf1,
f2,…fn として区別して格納することができる。
出された特徴データfは、特徴データ格納部13に格納
される。なお、本実施例では、特定者としてn人まで格
納することができ、それらに対応した特徴データf1,
f2,…fn として区別して格納することができる。
【0021】案内用テキスト情報格納部17は、本シス
テム1にて音声案内をする内容に応じたテキスト情報を
格納している。そして、音声合成用データ格納部15に
は、案内用テキスト情報の自然な読み方にできるだけ近
い読み方が得られるように、案内用テキスト情報を、そ
の表記された単位ではなく、音韻解析などに基づいて発
声に適した単位に分割した、その単位毎の音声波形信号
が音声合成用データとして格納されている。
テム1にて音声案内をする内容に応じたテキスト情報を
格納している。そして、音声合成用データ格納部15に
は、案内用テキスト情報の自然な読み方にできるだけ近
い読み方が得られるように、案内用テキスト情報を、そ
の表記された単位ではなく、音韻解析などに基づいて発
声に適した単位に分割した、その単位毎の音声波形信号
が音声合成用データとして格納されている。
【0022】声質変換部14は、音声合成用データ格納
部15から読み出した音声合成用データを、特徴データ
格納部13から読み出した任意の特徴データfx に対応
する特定者の音声を合成するための音声合成用データに
変換する。そして、音声合成部16は、この声質変換部
14によって変換された、案内用テキスト情報を構成す
る各単位に対応する音声合成用データを、なめらかな発
声が得られるように連結する波形処理を行う。これによ
って、使用した特徴データfx に対応する特定者の音声
にて音声案内が可能な合成音声データを生成することが
できる。
部15から読み出した音声合成用データを、特徴データ
格納部13から読み出した任意の特徴データfx に対応
する特定者の音声を合成するための音声合成用データに
変換する。そして、音声合成部16は、この声質変換部
14によって変換された、案内用テキスト情報を構成す
る各単位に対応する音声合成用データを、なめらかな発
声が得られるように連結する波形処理を行う。これによ
って、使用した特徴データfx に対応する特定者の音声
にて音声案内が可能な合成音声データを生成することが
できる。
【0023】このようにして生成された合成音声データ
は、合成音声記憶部21に記憶される。一方、システム
固定音声記憶部22には、本システム1にて音声案内を
するために予め準備しておいたシステム固定音声データ
が記憶されている。つまり、音声合成部16において、
案内用テキスト情報格納部17に格納された全ての案内
用テキスト情報に対応する音声合成がなされた場合に
は、合成音声記憶部21に、システム固定音声記憶部2
2に記憶されているの内容と同じではあるが声質の異な
る音声データが記憶されることとなる。
は、合成音声記憶部21に記憶される。一方、システム
固定音声記憶部22には、本システム1にて音声案内を
するために予め準備しておいたシステム固定音声データ
が記憶されている。つまり、音声合成部16において、
案内用テキスト情報格納部17に格納された全ての案内
用テキスト情報に対応する音声合成がなされた場合に
は、合成音声記憶部21に、システム固定音声記憶部2
2に記憶されているの内容と同じではあるが声質の異な
る音声データが記憶されることとなる。
【0024】そこで、出力音声切換部23は、制御部2
4による制御に基づいて、合成音声記憶部21に記憶さ
れた合成音声データか、システム固定音声記憶部22に
記憶されているシステム固定音声データのいずれかを選
択切換して音声プロセッサ26に出力する。音声プロセ
ッサ26では入力された合成音声データあるいはシステ
ム固定音声データをアナログの音声信号に復元し、スピ
ーカ27を介して外部に出力する。これによって音声案
内がなされることとなる。
4による制御に基づいて、合成音声記憶部21に記憶さ
れた合成音声データか、システム固定音声記憶部22に
記憶されているシステム固定音声データのいずれかを選
択切換して音声プロセッサ26に出力する。音声プロセ
ッサ26では入力された合成音声データあるいはシステ
ム固定音声データをアナログの音声信号に復元し、スピ
ーカ27を介して外部に出力する。これによって音声案
内がなされることとなる。
【0025】なお、合成音声データあるいはシステム固
定音声データのいずれを出力させるかについては、例え
ば操作部25を介してユーザが指定することができる。
このような構成を有する本実施例の音声案内システム1
においては、音声合成装置10にて、ユーザが所望する
特定者の声での音声を合成することができる。つまり、
まず、特定者の性質に応じて音源を選ぶ。つまり、テレ
ビ番組やラジオ番組に出演している者の音声での合成を
所望する場合には、TVチューナ34やラジオチューナ
35を用い、音声入力部11を介してその特定者の音声
を入力する。なお、これらの番組の場合、その特定者の
みが話しているとは限らないので、例えば予めその特定
者の話している部分のみを編集したものをMDなどに記
憶させておき、それをMDプレーヤ33にて再生しても
よい。また、特定者が歌手であればCDプレーヤ32に
てその歌手の音楽CDを再生し、音声入力部11を介し
てその特定者の音声を入力してもよい。また、知人など
であれば、直接マイクロフォン31にて音声を拾うよう
にしてもよい。
定音声データのいずれを出力させるかについては、例え
ば操作部25を介してユーザが指定することができる。
このような構成を有する本実施例の音声案内システム1
においては、音声合成装置10にて、ユーザが所望する
特定者の声での音声を合成することができる。つまり、
まず、特定者の性質に応じて音源を選ぶ。つまり、テレ
ビ番組やラジオ番組に出演している者の音声での合成を
所望する場合には、TVチューナ34やラジオチューナ
35を用い、音声入力部11を介してその特定者の音声
を入力する。なお、これらの番組の場合、その特定者の
みが話しているとは限らないので、例えば予めその特定
者の話している部分のみを編集したものをMDなどに記
憶させておき、それをMDプレーヤ33にて再生しても
よい。また、特定者が歌手であればCDプレーヤ32に
てその歌手の音楽CDを再生し、音声入力部11を介し
てその特定者の音声を入力してもよい。また、知人など
であれば、直接マイクロフォン31にて音声を拾うよう
にしてもよい。
【0026】従って、本実施例の場合には、従来手法の
ように所定内容に応じた音声を意図的に発したものを録
音して利用するのではなく、自由に取り込んだ音声に基
づいて音声合成することができる。これによって、例え
ばテレビ放送やラジオ放送などを利用して、好みの音声
を取り込み、その音声にてテキスト情報に対応する音声
を合成することができる。したがって、例えばこれをナ
ビゲーションシステムに適用すれば、経路案内などのた
めの案内音声を、自分の好みの音声にて実現することが
できる。そして、この際、取り込む相手に特段の面倒を
かけることないため、例えば自分の好きなタレントの声
で音声案内をさせたい場合であっても、そのタレントの
主体的な協力なしで非常に簡易に実現できる。
ように所定内容に応じた音声を意図的に発したものを録
音して利用するのではなく、自由に取り込んだ音声に基
づいて音声合成することができる。これによって、例え
ばテレビ放送やラジオ放送などを利用して、好みの音声
を取り込み、その音声にてテキスト情報に対応する音声
を合成することができる。したがって、例えばこれをナ
ビゲーションシステムに適用すれば、経路案内などのた
めの案内音声を、自分の好みの音声にて実現することが
できる。そして、この際、取り込む相手に特段の面倒を
かけることないため、例えば自分の好きなタレントの声
で音声案内をさせたい場合であっても、そのタレントの
主体的な協力なしで非常に簡易に実現できる。
【0027】また、本実施例のシステム1の場合には、
合成音声データだけでなく、システム固定音声データも
準備されており、それらを選択的に用いて音声案内が実
行できる。例えば音声合成ができるほどサンプル音声が
入力できていない場合などには、システム固定音声デー
タを用いた音声案内をすればよい。なお、合成音声記憶
部21には、複数の特定者に対応する合成音声データを
記憶させておき、それらを選択的に用いて音声案内させ
てもよい。
合成音声データだけでなく、システム固定音声データも
準備されており、それらを選択的に用いて音声案内が実
行できる。例えば音声合成ができるほどサンプル音声が
入力できていない場合などには、システム固定音声デー
タを用いた音声案内をすればよい。なお、合成音声記憶
部21には、複数の特定者に対応する合成音声データを
記憶させておき、それらを選択的に用いて音声案内させ
てもよい。
【0028】そして、このように複数の声質での音声案
内が可能な場合(システム固定音声データと合成音声デ
ータ、あるいは複数の合成音声データが存在する場合)
には、案内内容に対応して声質を個別に指定できるよう
にして、その指定された声質を用いて音声案内を行うよ
うにしてもよい。この指定は操作部25を用いてユーザ
が自由に行えばよいが、例えば次のような指定が考えら
れる。カーナビゲーションにおける目的地までの経路を
案内する際、目的地までの経路案内全体を、その目的地
にふさわしい声にする。例えば目的地が友達の家であれ
ば、経路案内をその友達の声で行うことが考えられる。
この場合には、その友達にマイクロフォン31から音声
を入力してもらえばよい。また、施設案内に際し、例え
ばコンビニエンスストアの案内をするのであれば、その
コンビニエンスストアのCMに出ているタレントの声を
使うといったこともできる。
内が可能な場合(システム固定音声データと合成音声デ
ータ、あるいは複数の合成音声データが存在する場合)
には、案内内容に対応して声質を個別に指定できるよう
にして、その指定された声質を用いて音声案内を行うよ
うにしてもよい。この指定は操作部25を用いてユーザ
が自由に行えばよいが、例えば次のような指定が考えら
れる。カーナビゲーションにおける目的地までの経路を
案内する際、目的地までの経路案内全体を、その目的地
にふさわしい声にする。例えば目的地が友達の家であれ
ば、経路案内をその友達の声で行うことが考えられる。
この場合には、その友達にマイクロフォン31から音声
を入力してもらえばよい。また、施設案内に際し、例え
ばコンビニエンスストアの案内をするのであれば、その
コンビニエンスストアのCMに出ているタレントの声を
使うといったこともできる。
【0029】このように、自分の好みに応じた自由な設
定が、基本的には自分だけで実現することができる。な
お、本実施例においては、音声入力部11が音声入力手
段にし相当し、特徴データ抽出部12が特徴データ抽出
手段に相当する。また、声質変換部14が声質変換手段
に相当し、音声合成用データ格納部15が音声合成用デ
ータ記憶手段に相当する。さらに、音声合成部16が音
声合成手段に相当し、合成音声記憶部21が合成音声記
憶手段に相当する。そして、システム固定音声記憶部2
2がシステム固定音声記憶手段に相当する。
定が、基本的には自分だけで実現することができる。な
お、本実施例においては、音声入力部11が音声入力手
段にし相当し、特徴データ抽出部12が特徴データ抽出
手段に相当する。また、声質変換部14が声質変換手段
に相当し、音声合成用データ格納部15が音声合成用デ
ータ記憶手段に相当する。さらに、音声合成部16が音
声合成手段に相当し、合成音声記憶部21が合成音声記
憶手段に相当する。そして、システム固定音声記憶部2
2がシステム固定音声記憶手段に相当する。
【0030】[その他] (1)上記実施例では、音声合成装置10における音声
合成の仕方が、規則合成形音声合成であったが、編集合
成形音声合成でもよい。但し、編集合成形音声合成の場
合には、編集状況によっては合成可能な音声が制限され
る。例えばテレビ放送などから特定者の音声を取り込
み、それを編集して合成することを想定すると、ある程
度多くの音声を入力しないと、全ての音声案内をその特
定者の声にて行わせることは難しくなる。それに対し
て、上記実施例のように規則合成形音声合成の場合は、
少ないサンプル入力であっても、任意の音声を合成可能
であるため、早期に所望の特定者の声での音声案内を実
現させたい場合には、規則合成形音声合成の方が好まし
いと言える。
合成の仕方が、規則合成形音声合成であったが、編集合
成形音声合成でもよい。但し、編集合成形音声合成の場
合には、編集状況によっては合成可能な音声が制限され
る。例えばテレビ放送などから特定者の音声を取り込
み、それを編集して合成することを想定すると、ある程
度多くの音声を入力しないと、全ての音声案内をその特
定者の声にて行わせることは難しくなる。それに対し
て、上記実施例のように規則合成形音声合成の場合は、
少ないサンプル入力であっても、任意の音声を合成可能
であるため、早期に所望の特定者の声での音声案内を実
現させたい場合には、規則合成形音声合成の方が好まし
いと言える。
【0031】(2)上記実施例では、CDプレーヤ32
及びMDプレーヤ33というように、音声データを記録
した媒体としてCD及びMDを挙げたが、それ以外にも
ビデオテープやDVDなどであってもよい。また、例え
ば電話機であっても、音声データを取り込むことは可能
である。
及びMDプレーヤ33というように、音声データを記録
した媒体としてCD及びMDを挙げたが、それ以外にも
ビデオテープやDVDなどであってもよい。また、例え
ば電話機であっても、音声データを取り込むことは可能
である。
【0032】(3)上記実施例では、音声案内システム
1が音声合成装置10を備える構成であったが、音声合
成装置10を単体で実現させることもできる。図2は単
体で実現させる場合の音声合成装置10などの概略構成
を示すブロック図である。なお、図1と同じ構成は省略
した。この場合は、音声合成装置10において、外部記
憶媒体書込部51を追加した。したがって、音声合成部
16にて生成された合成音声データを、外部記憶媒体書
込部51にて外部記憶媒体50に書き込む。この外部記
憶媒体50としては、例えばCD−RWやMOなどが考
えられる。もちろん、それ以外の記憶媒体でも構わな
い。
1が音声合成装置10を備える構成であったが、音声合
成装置10を単体で実現させることもできる。図2は単
体で実現させる場合の音声合成装置10などの概略構成
を示すブロック図である。なお、図1と同じ構成は省略
した。この場合は、音声合成装置10において、外部記
憶媒体書込部51を追加した。したがって、音声合成部
16にて生成された合成音声データを、外部記憶媒体書
込部51にて外部記憶媒体50に書き込む。この外部記
憶媒体50としては、例えばCD−RWやMOなどが考
えられる。もちろん、それ以外の記憶媒体でも構わな
い。
【0033】そして、音声案内システムは、合成音声記
憶部21と、システム固定音声記憶部22と、出力音声
切換部23と、制御部24と、操作部25と、音声プロ
セッサ26と、スピーカ27とを備えていると共に(但
し図2には合成音声記憶部21しか示さない)、さらに
外部記憶媒体再生部52を備える。したがって、この外
部記憶媒体再生部52にて外部記憶媒体50を再生して
得た合成音声データを、合成音声記憶部21に記憶させ
る。このようにすれば、図2の音声合成装置10自体は
図2の音声案内システムと分離しておける。したがっ
て、カーナビゲーションシステムを構成する場合であれ
ば、音声合成装置10は車両に搭載する必要がない。ま
た、このように分離できれば汎用性が向上する。つま
り、音声案内システムとしては異なる複数のシステムが
あった場合でも、案内用テキスト情報さえそのシステム
から取り込めば、該当するシステムに合った合成音声デ
ータを生成することができるため、複数の音声案内シス
テムに対して1台の音声合成装置10でまかなうことも
可能である。
憶部21と、システム固定音声記憶部22と、出力音声
切換部23と、制御部24と、操作部25と、音声プロ
セッサ26と、スピーカ27とを備えていると共に(但
し図2には合成音声記憶部21しか示さない)、さらに
外部記憶媒体再生部52を備える。したがって、この外
部記憶媒体再生部52にて外部記憶媒体50を再生して
得た合成音声データを、合成音声記憶部21に記憶させ
る。このようにすれば、図2の音声合成装置10自体は
図2の音声案内システムと分離しておける。したがっ
て、カーナビゲーションシステムを構成する場合であれ
ば、音声合成装置10は車両に搭載する必要がない。ま
た、このように分離できれば汎用性が向上する。つま
り、音声案内システムとしては異なる複数のシステムが
あった場合でも、案内用テキスト情報さえそのシステム
から取り込めば、該当するシステムに合った合成音声デ
ータを生成することができるため、複数の音声案内シス
テムに対して1台の音声合成装置10でまかなうことも
可能である。
【図1】 本発明の一実施例の音声合成装置を備えた音
声案内システムの概略構成を示すブロック図である。
声案内システムの概略構成を示すブロック図である。
【図2】 別実施例の音声合成装置の概略構成を示すブ
ロック図である。
ロック図である。
1…音声案内システム 10…音声合成装
置 11…音声入力部 12…特徴デー
タ抽出部 13…特徴データ格納部 14…声質変換
部 15…音声合成用データ格納部 16…音声合成
部 17…案内用テキスト情報格納部 21…合成音声
記憶部 22…システム固定音声記憶部 23…出力音声
切換部 24…制御部 25…操作部 26…音声プロセッサ 27…スピーカ 31…マイクロフォン 32…CDプレ
ーヤ 33…MDプレーヤ 34…TVチュ
ーナ 35…ラジオチューナ 50…外部記憶
媒体 51…外部記憶媒体書込部 52…外部記憶
媒体再生部
置 11…音声入力部 12…特徴デー
タ抽出部 13…特徴データ格納部 14…声質変換
部 15…音声合成用データ格納部 16…音声合成
部 17…案内用テキスト情報格納部 21…合成音声
記憶部 22…システム固定音声記憶部 23…出力音声
切換部 24…制御部 25…操作部 26…音声プロセッサ 27…スピーカ 31…マイクロフォン 32…CDプレ
ーヤ 33…MDプレーヤ 34…TVチュ
ーナ 35…ラジオチューナ 50…外部記憶
媒体 51…外部記憶媒体書込部 52…外部記憶
媒体再生部
Claims (7)
- 【請求項1】テキスト情報に対応する音声を合成する音
声合成装置であって、 音声を合成するための音声合成用データを記憶しておく
音声合成用データ記憶手段と、 特定者の音声を入力するための音声入力手段と、 その音声入力手段を介して入力した音声から前記特定者
の声質の特徴データを抽出する特徴データ抽出手段と、 その特徴データ抽出手段によって抽出された特徴データ
を基に、前記音声合成用データ記憶手段に記憶されてい
る音声合成用データを、前記特定者の声質での音声を合
成するための音声合成用データに変換する声質変換手段
と、 その声質変換手段によって変換された音声合成用データ
を基に、前記テキスト情報に対応する音声を合成する音
声合成手段とを備えることを特徴とする音声合成装置。 - 【請求項2】前記請求項1記載の音声合成装置におい
て、 前記音声入力手段によって入力する前記特定者の音声の
源は、少なくとも、音声データを記録した媒体を再生す
る再生装置から出力された音声、音声データを受信して
再生する受信装置から出力された音声のいずれかである
ことを特徴とする音声合成装置。 - 【請求項3】請求項1又は2記載の音声合成装置を備え
た音声案内システムであって、 自システムにて使用する案内用のテキスト情報に対応す
る音声を前記音声合成装置にて合成し、その合成音声に
て案内を実行可能であることを特徴とする音声案内シス
テム。 - 【請求項4】請求項3記載の音声案内システムにおい
て、 自システムにて使用する全ての案内用のテキスト情報に
対応する音声を前記音声合成装置にて合成し、その合成
音声を合成音声記憶手段に格納しておき、 さらに、自システムにて使用する全ての案内用のテキス
ト情報に対応する音声を記憶しているシステム固定音声
記憶手段を備え、 前記合成音声記憶手段に記憶された音声または前記シス
テム固定音声記憶手段に記憶された音声を選択的に用い
て音声案内を実行可能であることを特徴とする音声案内
システム。 - 【請求項5】請求項4記載の音声案内システムにおい
て、 前記合成音声記憶手段には、複数の特定者にそれぞれ対
応する、前記全ての案内用のテキスト情報に対応した合
成音声が記憶されており、 その合成音声記憶手段に記憶された複数の特定者に対応
する合成音声についても選択可能であることを特徴とす
る音声案内システム。 - 【請求項6】請求項3〜5のいずれか記載の音声案内シ
ステムにおいて、 複数の声質での音声案内が可能な場合には、案内内容に
対応して声質を個別に指定可能であり、その指定された
声質を用いて音声案内を行うことを特徴とする音声案内
システム。 - 【請求項7】請求項6記載の音声案内システムにおい
て、 前記音声案内は、ユーザに対して目的地までの経路を案
内するためのものであり、その目的地までの経路案内全
体という単位で声質を指定可能であることを特徴とする
音声案内システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000014892A JP2001209400A (ja) | 2000-01-24 | 2000-01-24 | 音声合成装置及び音声案内システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000014892A JP2001209400A (ja) | 2000-01-24 | 2000-01-24 | 音声合成装置及び音声案内システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001209400A true JP2001209400A (ja) | 2001-08-03 |
Family
ID=18542270
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000014892A Pending JP2001209400A (ja) | 2000-01-24 | 2000-01-24 | 音声合成装置及び音声案内システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2001209400A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003177029A (ja) * | 2001-12-12 | 2003-06-27 | Navitime Japan Co Ltd | 地図表示装置、地図表示システム |
JP2008238832A (ja) * | 2007-03-23 | 2008-10-09 | Fuji Heavy Ind Ltd | 車両用メッセージ情報報知装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08248994A (ja) * | 1995-03-10 | 1996-09-27 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 声質変換音声合成装置 |
JPH09179576A (ja) * | 1995-12-21 | 1997-07-11 | Toshiba Corp | 音声合成方法 |
JPH10104011A (ja) * | 1996-09-30 | 1998-04-24 | Mazda Motor Corp | ナビゲーション装置 |
JPH117296A (ja) * | 1997-06-18 | 1999-01-12 | Oputoromu:Kk | 電子回路を有する記憶媒体と該記憶媒体を有する音声合成装置 |
JPH1138996A (ja) * | 1997-07-10 | 1999-02-12 | Internatl Business Mach Corp <Ibm> | 音声メールシステム、音声合成装置およびこれらの方法 |
JPH11102198A (ja) * | 1997-07-31 | 1999-04-13 | Toyota Motor Corp | メッセージ処理装置、メッセージ処理方法及びメッセージ処理プログラムを記録した媒体 |
JPH11259271A (ja) * | 1998-03-13 | 1999-09-24 | Aqueous Reserch:Kk | エージェント装置 |
-
2000
- 2000-01-24 JP JP2000014892A patent/JP2001209400A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08248994A (ja) * | 1995-03-10 | 1996-09-27 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 声質変換音声合成装置 |
JPH09179576A (ja) * | 1995-12-21 | 1997-07-11 | Toshiba Corp | 音声合成方法 |
JPH10104011A (ja) * | 1996-09-30 | 1998-04-24 | Mazda Motor Corp | ナビゲーション装置 |
JPH117296A (ja) * | 1997-06-18 | 1999-01-12 | Oputoromu:Kk | 電子回路を有する記憶媒体と該記憶媒体を有する音声合成装置 |
JPH1138996A (ja) * | 1997-07-10 | 1999-02-12 | Internatl Business Mach Corp <Ibm> | 音声メールシステム、音声合成装置およびこれらの方法 |
JPH11102198A (ja) * | 1997-07-31 | 1999-04-13 | Toyota Motor Corp | メッセージ処理装置、メッセージ処理方法及びメッセージ処理プログラムを記録した媒体 |
JPH11259271A (ja) * | 1998-03-13 | 1999-09-24 | Aqueous Reserch:Kk | エージェント装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003177029A (ja) * | 2001-12-12 | 2003-06-27 | Navitime Japan Co Ltd | 地図表示装置、地図表示システム |
JP2008238832A (ja) * | 2007-03-23 | 2008-10-09 | Fuji Heavy Ind Ltd | 車両用メッセージ情報報知装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4558308B2 (ja) | 音声認識システム、データ処理装置、そのデータ処理方法及びプログラム | |
JP2002366166A (ja) | コンテンツ提供システム及び方法、並びにそのためのコンピュータプログラム | |
JP2004309965A (ja) | 会議録音・書き起こしシステム | |
JPH09146579A (ja) | 音楽再生装置 | |
JP2001209400A (ja) | 音声合成装置及び音声案内システム | |
JP2001184100A (ja) | 話速変換装置 | |
JPH06110650A (ja) | 音声対話装置 | |
JP2007221574A (ja) | 音声処理装置、音声処理方法及びプログラム | |
JP7131550B2 (ja) | 情報処理装置および情報処理方法 | |
JP2000206987A (ja) | 音声認識装置 | |
JP3927155B2 (ja) | 対話記録装置および対話記録プログラム | |
JP4516943B2 (ja) | カラオケ歌唱補助システム | |
JP2010176042A (ja) | 歌唱音声録音カラオケシステム | |
CN101393429B (zh) | 利用音调的自动控制系统及自动控制装置 | |
WO2002001550A1 (fr) | Procede et systeme de commande d'un dispositif | |
JP2797644B2 (ja) | 発声機能付きカラオケ装置 | |
JPH08328575A (ja) | 音声合成装置 | |
JP2002507772A (ja) | 情報再生用または機能実行用の装置 | |
JPS613241A (ja) | 音声確認方式 | |
JP2000020091A (ja) | 音声記録再生装置 | |
JP2005250242A (ja) | 情報処理装置、情報処理方法、情報処理用プログラム、及び記録媒体 | |
JP2000268545A (ja) | 音声再生装置 | |
JPH04240900A (ja) | 音声変換装置 | |
JP2003140677A (ja) | 読み上げシステム | |
JP4105975B2 (ja) | 映像音声再生装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060404 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090402 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091215 |