JP2002169582A - 音声合成装置及びその制御方法、コンピュータ可読メモリ - Google Patents

音声合成装置及びその制御方法、コンピュータ可読メモリ

Info

Publication number
JP2002169582A
JP2002169582A JP2000363756A JP2000363756A JP2002169582A JP 2002169582 A JP2002169582 A JP 2002169582A JP 2000363756 A JP2000363756 A JP 2000363756A JP 2000363756 A JP2000363756 A JP 2000363756A JP 2002169582 A JP2002169582 A JP 2002169582A
Authority
JP
Japan
Prior art keywords
measuring
information
synthesized
user
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000363756A
Other languages
English (en)
Other versions
JP2002169582A5 (ja
Inventor
Toshiaki Fukada
俊明 深田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000363756A priority Critical patent/JP2002169582A/ja
Publication of JP2002169582A publication Critical patent/JP2002169582A/ja
Publication of JP2002169582A5 publication Critical patent/JP2002169582A5/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 利用者もしくはその周囲環境の情報を利用す
ることにより、言語的には同一の内容でも環境に応じた
多様な合成音声を生成することができる音声合成装置及
びその制御方法、コンピュータ可読メモリを提供する。 【解決手段】 環境情報測定部1002で、利用者もし
くは周囲環境の状況を示す環境情報値を測定する。合成
音声特性決定部1003で、測定された環境情報値に基
づいて、音声合成対象データに対応する合成音声信号の
特性を決定する。そして、音声合成部1005で、決定
された特性で、前記音声合成対象データに対応する合成
音声を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、合成音声を生成す
る音声合成装置及びその制御方法、コンピュータ可読メ
モリに関するものである。
【0002】
【従来の技術】近年、任意の文字系列を音韻系列に変換
し、その音韻系列を所定の音声規則合成方式に従って合
成音声に変換する音声合成装置が開発されている。
【0003】
【発明が解決しようとする課題】従来の音声合成装置か
らテキストデータに基づいて出力される合成音声は、同
一のテキストデータに対しては常に同じ合成音声が出力
されている。このような音声合成装置において、例え
ば、話者や声の高さ(ピッチ)、発声速度などの合成音
声の特性を変化させる場合には、利用者が好みに応じて
これらの特性を変化させるか、もしくは予めテキストデ
ータに付加情報を与えるなどの手段が必要であった。
【0004】この課題に対して、特開平11−1612
98号では、合成音声の発声開始からの経過時間もしく
は時刻、日付などの計時情報に応じて合成音声の特性を
変化させる制御方法が提案されている。
【0005】また、特開平11−15488号では、自
動車内に入力された平均ピッチ、平均ピッチ幅、平均音
圧等の音情報を分析することにより、車内環境下におい
て明瞭に聴取できる音声再生制御方法が提案されてい
る。
【0006】しかしながら、例えば、高速道路を長時間
走行している場合には、運転者が眠くなっている可能性
が高いため、合成音声の平均周波数を上げ、音量を増加
させることにより覚醒作用を与えることが望ましい。し
かし、前述の従来例によれば、このような状況において
合成音声の特性を変化させることは困難である。すなわ
ち、音声合成の利用者もしくはその周辺状況の多様な変
化に対して合成音声の特性を適切に変更するためには、
前記従来例において示されている発声開始からの経過時
間、時刻や日付などの絶対的な時間の計時情報、自動車
内に入力された平均ピッチ、平均ピッチ幅、平均音圧の
みの情報では十分とは言えず、より多様な情報を検出す
るための手段、及び、この手段によって得られる情報に
対する合成音声の特性を変える手段を備える必要があっ
た。
【0007】本発明は上記の課題を解決するためになさ
れてものであり、利用者もしくはその周囲環境の情報を
利用することにより、言語的には同一の内容でも環境に
応じた多様な合成音声を生成することができる音声合成
装置及びその制御方法、コンピュータ可読メモリを提供
することを目的とする。
【0008】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による音声合成装置は以下の構成を備える。
即ち、合成音声を生成する音声合成装置であって、利用
者もしくは周囲環境の状況を示す環境情報値を測定する
測定手段と、前記測定手段で測定された環境情報値に基
づいて、音声合成対象データに対応する合成音声信号の
特性を決定する決定手段と、前記決定手段で決定された
特性で、前記音声合成対象データに対応する合成音声を
出力する出力手段とを備える。
【0009】また、好ましくは、前記測定手段は、利用
者もしくは周囲環境の位置を示す位置情報値を測定する
位置情報測定手段を含む。
【0010】また、好ましくは、前記測定手段は、利用
者の周囲環境の気象状況を示す気象情報値を測定する気
象情報測定手段を含む。
【0011】また、好ましくは、前記測定手段は、利用
者の当該音声合成装置の使用時間を示す時間情報値を測
定する時間情報測定手段を含む。
【0012】また、好ましくは、前記測定手段は、利用
者もしくは周囲環境の画像を示す画像報値を測定する画
像情報測定手段を含む。
【0013】また、好ましくは、前記測定手段は、利用
者もしくは周囲環境の音を示す音情報値を測定する音情
報測定手段を含む。
【0014】また、好ましくは、前記測定手段は、利用
者における速度/加速度を示す速度/加速度情報値を測
定する速度/加速度情報測定手段を含む。
【0015】また、好ましくは、前記測定手段は、当該
音声合成装置の利用者とその周辺の対象物体間の距離を
示す距離情報値を測定する距離情報測定手段を含む。
【0016】また、好ましくは、前記測定手段は、利用
者の生体状況を示す生体情報値を測定する生体情報測定
手段を含む。
【0017】上記の目的を達成するための本発明による
音声合成装置の制御方法は以下の構成を備える。即ち、
合成音声を生成する音声合成装置の制御方法であって、
利用者もしくは周囲環境の状況を示す環境情報値を測定
する測定工程と、前記測定工程で測定された環境情報値
に基づいて、音声合成対象データに対応する合成音声信
号の特性を決定する決定工程と、前記決定工程で決定さ
れた特性で、前記音声合成対象データに対応する合成音
声を出力する出力工程とを備える。
【0018】上記の目的を達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
合成音声を生成する音声合成装置の制御のプログラムコ
ードが格納されたコンピュータ可読メモリであって、利
用者もしくは周囲環境の状況を示す環境情報値を測定す
る測定工程のプログラムコードと、前記測定工程で測定
された環境情報値に基づいて、音声合成対象データに対
応する合成音声信号の特性を決定する決定工程のプログ
ラムコードと、前記決定工程で決定された特性で、前記
音声合成対象データに対応する合成音声を出力する出力
工程のプログラムコードとを備える。
【0019】
【発明の実施の形態】以下、図面を参照して本発明の好
適な実施の形態を詳細に説明する。
【0020】図1は本発明の各実施形態に係る音声合成
装置のハードウェア構成を示すブロック図である。
【0021】図1において、101はCPUであり、R
OM102に記憶された制御プログラムあるいは外部記
憶装置104からRAM103にロードされた制御プロ
グラムに従って、以下に説明する各実施形態の音声合成
装置における各種制御を行う。102はROMであり、
各種パラメータやCPU101が実行する制御プログラ
ム等を格納している。103はRAMであり、CPU1
01による各種制御の実行時に作業領域を提供するとと
もに、CPU101により実行される制御プログラムを
記憶する。
【0022】104はハードディスク、フロッピー(登
録商標)ディスク、CD−ROM、DVD−ROM、メ
モリカード等の外部記憶装置であり、この外部記憶装置
104がハードディスクである場合には、CD−ROM
やフロッピーディスク等からインストールされた各種プ
ログラムが記憶されている。105は利用者を含む周囲
環境状況を取得する環境情報測定装置であり、GPS等
の位置情報取得装置、光センサ、温度計、湿度計、風力
計等の気象情報取得装置、時計、タイマ等の時間情報取
得装置、ビデオカメラ等の映像入力装置、マイクロフォ
ン等の音響入力装置、速度もしくは加速度測定装置、赤
外線センサ等の距離測定装置、脳波、体温、脈拍、発
汗、呼吸数等の生体情報検出装置の少なくとも1つ以上
の組み合わせによって構成される。
【0023】106はキーボード、マウス等のポインテ
ィングデバイス、OCR(光学的文字読み取り装置)、
通信インタフェース等の合成対象テキストデータを入力
する入力装置である。107は液晶やCRT等のディス
プレイであり、CPU101の制御により各種データの
表示を行う。108はスピーカであり、音声信号(電気
信号)を可聴音である音声に変換して出力する。109
は上記各構成要素を相互に接続するバスである。
【0024】次に、本発明の各実施形態に係る音声合成
装置の基本機能構成について、図2を用いて説明する。
【0025】図2は本発明の各実施形態に係る音声合成
装置の基本機能構成を示すブロック図である。
【0026】テキスト取得部1001では、音声合成対
象テキストデータを取得する。環境情報測定部1002
では、利用者を含む周囲環境状況を環境情報取得装置を
用いることによって環境情報を取得する。合成音声特性
決定部1003では、環境情報測定部1002で取得し
た環境情報に対する合成音声信号の特性もしくは特性の
変化量を示す合成音声特性決定用パラメータを特性決定
用補助データ1004から取得し、合成音声信号の特性
もしくは特性の変化量を決定する。
【0027】尚、合成音声信号の特性としては、利用者
(性別)、声の高さ、発声速度、音量、声質、発話様
式、感情、合成音に重畳もしくは挿入する音情報、音像
定位、エフェクト等があり、これ以外にも合成音声信号
の特性として定義できるものであれば、どのようなもの
でも良い。
【0028】音声合成部1005では、テキスト取得部
1001から得られる音声合成対象テキストデータ、合
成音声特性決定部1003で決定された合成音声特性決
定用パラメータ、及び音声合成用の素片データや韻律生
成規則等を格納する音声合成用データ1006を用いて
合成音声信号を生成する。音声出力部1007では、音
声合成部1005で生成された合成音声信号をスピーカ
108によって出力する。
【0029】ここで、特性決定用補助データ1004の
基本構成について、図3を用いて説明する。
【0030】図3は本発明の各実施形態に係る特性決定
用補助データの基本構成を示す図である。
【0031】特性決定用補助データは、入力された音声
合成対象テキストデータの通常の既定合成音声信号(既
定値の基本周波数、発生速度、音量等での合成音声信
号)に対し、その特性もしくは特性の変化量を決定する
情報である。
【0032】図3に示されるように、特性決定用補助デ
ータは、環境情報測定部1002で測定された環境情報
値に対し、合成音声信号の特性もしくは特性の変化量が
対応づけて管理されている。例えば、環境情報測定部1
002で測定された環境情報値がbである場合には、既
定合成音声信号に対する特性もしくは特性の変化量とし
て、性別を女性に変更し、基本周波数を20Hz加算
し、発声速度を20%早め、信号レベルを2倍にすると
いう情報が取得される。
【0033】尚、特性決定用補助データの構成は、図3
に示した構成に限定されず、各種用途に応じて音声信号
に対する様々な条件を設定可能である。
【0034】次に、本発明の各実施形態に係る音声合成
装置で実行される処理の概要について、図4を用いて説
明する。
【0035】図4は本発明の各実施形態に係る音声合成
装置で実行される処理の概要を示すフローチャートであ
る。
【0036】まず、ステップS101で、環境情報測定
部1002は、環境情報を測定し、環境情報値を取得す
る。次に、ステップS102で、合成音声特性決定部1
003は、取得された環境情報値に対応する合成音声特
性決定用パラメータを、特性決定用補助データ1004
を参照して取得し、音声合成対象テキストデータに対す
る合成音声信号の特性もしくは特性の変化量を決定す
る。
【0037】尚、ステップS102では、環境情報値に
応じて、合成音声特性決定用パラメータの取得の実行の
有無を制御しても良い。例えば、環境情報値が所定値以
上である場合に、合成音声特性決定用パラメータを取得
する構成であっても良い。
【0038】ステップS103で、音声合成部1005
は、テキスト取得部1001から得られる音声合成対象
テキストデータ、合成音声特性決定部1003で決定さ
れた合成音声特性決定用パラメータ、及び音声合成用の
素片データや韻律生成規則等を格納する音声合成用デー
タ1006を用いて合成音声信号を生成する。
【0039】ステップS104で、音声出力部1007
は、音声合成部1005で生成された合成音声信号をス
ピーカ108によって出力する。
【0040】次に、各実施形態の音声合成装置について
説明する。 <実施形態1>実施形態1では、環境情報として、位置
情報を用いる場合を例に挙げて説明し、実施形態1の音
声合成装置の機能構成は、上述の図2の環境情報測定部
が位置情報測定部となり、また、上述の図4のステップ
S101は、環境情報値として位置情報値を取得する。
【0041】次に、実施形態1の音声合成装置の機能構
成について、図5を用いて説明する。
【0042】図5は実施形態1の音声合成装置の機能構
成を示すブロック図である。
【0043】テキスト取得部201では、音声合成対象
テキストデータを取得する。位置情報測定部202で
は、GPS等の位置情報取得装置を用いることによって
利用者の位置情報を取得する。合成音声特性決定部20
3では、位置情報測定部202で取得した位置情報に対
する合成音声特性決定用パラメータを特性決定用補助デ
ータ204から取得した後、図2で説明した同様の手順
によって合成音声を生成する。
【0044】尚、特性決定用補助データ204の構成
は、上述の図3に準じ、実施形態1の場合は、位置情報
に対し、合成音声特性決定用パラメータとして、既定合
成音声信号に対する基本周波数と発声速度の変化量が管
理されている。
【0045】例えば、カーナビゲーションシステムに搭
載されたGPSから得られる経度、緯度情報と地図情報
から、現在、利用者が高速道路を走行していることを示
す位置情報を位置情報測定部202において取得する。
このとき、合成音声特性決定部203から特性決定用補
助データ204に対して、高速道路走行時における合成
音声特性決定用パラメータを問い合わせた結果、基本周
波数を既定値に対して20Hz加算し、発声速度を既定
値に対して10%早めるという情報が取得されたとす
る。この場合、音声合成部205において、テキスト取
得部201から送られる音声合成対象テキストデータを
音声合成する際に、既定合成音声信号よりも基本周波数
を20Hz高く、かつ発声速度を10%早くした合成音
声信号を生成し、音声出力部207において出力する。
【0046】以上説明したように、実施形態1によれ
ば、音声合成装置の利用者もしくはその周囲環境の位置
情報を利用することにより、言語的には同一の内容でも
環境に応じた多様な合成音声を生成することができる。 <実施形態2>実施形態2では、環境情報として、気象
情報を用いる場合を例に挙げて説明し、実施形態2の音
声合成装置の機能構成は、上述の図2の環境情報測定部
が気象情報測定部となり、また、上述の図4のステップ
S101は、環境情報値として気象情報値を取得する。
【0047】次に、実施形態2の音声合成装置の機能構
成について、図6を用いて説明する。
【0048】気象情報測定部302では、光センサ、温
度計、湿度計、風力計等の気象情報取得装置を用いるこ
とによって利用者の周辺の明るさ、気温、湿度、風力の
うち少なくとも1つの気象情報を取得する。次に、合成
音声特性決定部303では、取得した気象情報に応じた
合成音声信号の合成音声特性決定用パラメータを特性決
定用補助データ304から取得した後、図2で説明した
同様の手順によって合成音声を生成する。
【0049】尚、特性決定用補助データ304の構成
は、上述の図3に準じ、実施形態2の場合は、気象情報
に対し、合成音声特性決定用パラメータとして、既定合
成音声信号に対する基本周波数と発声速度の変化量が管
理されている。
【0050】例えば、自動車に搭載された光センサから
得られる光度情報から、現在トンネルもしくは夜など暗
い状況下で走行していることを示す気象情報を気象情報
測定部302において取得する。このとき、合成音声特
性決定部303から特性決定用補助データ304に対し
て、暗い状況下での走行時における合成音声特性決定用
パラメータを問い合わせた結果、基本周波数を既定値に
対して20Hz減算し、発声速度を既定値に対して10
%遅くするという情報が取得されたとする。この場合、
音声合成部305において、テキスト取得部301から
送られる音声合成対象テキストデータを音声合成する際
に、既定合成音声信号よりも基本周波数を20Hz低
く、かつ発声速度を10%遅くした合成音声信号を生成
し、音声出力部307において出力する。
【0051】以上説明したように、実施形態2によれ
ば、音声合成装置の利用者もしくはその周囲環境の気象
情報を利用することにより、言語的には同一の内容でも
環境に応じた多様な合成音声を生成することができる。 <実施形態3>実施形態3では、環境情報として、時間
情報を用いる場合を例に挙げて説明し、実施形態3の音
声合成装置の機能構成は、上述の図2の環境情報測定部
が使用時間測定部となり、また、上述の図4のステップ
S101は、環境情報値として時間情報値を取得する。
【0052】次に、実施形態3の音声合成装置の機能構
成について、図7を用いて説明する。
【0053】図7は実施形態3の音声合成装置の機能構
成を示す図である。
【0054】使用時間測定部402では、時計、タイマ
ー等の時間情報取得装置を用いることによって、音声合
成機能が搭載されたシステム、サービス、製品の利用者
の使用時間を取得する。次に、合成音声特性決定部40
3では、取得した使用時間に応じた合成音声特性決定用
パラメータを特性決定用補助データ404から取得した
後、図2で説明した同様の手順によって合成音声を生成
する。
【0055】尚、特性決定用補助データ404の構成
は、上述の図3に準じ、実施形態3の場合は、時間情報
に対し、合成音声特性決定用パラメータとして、既定合
成音声信号に対する話者の性別が管理されている。
【0056】例えば、音声合成機能を備える自動車を運
転する場合、自動車のエンジンをかけ始めてからの使用
時間を示す時間情報を使用時間測定部402において取
得する。このとき、運転後1時間が経過した際に、テキ
スト取得部401から音声合成対象テキストデータが送
られてきた場合、音声合成特性決定部404は、このと
きの合成音声特性決定用パラメータを特性決定用補助デ
ータ404に対して問い合わせ、その結果、合成音声信
号の話者の性別を変更するという情報が取得されたとす
る。この場合、音声合成部405において、これまで用
いていた音声合成用データ406の性別を変更した合成
音声信号を生成し、音声出力部407において出力す
る。
【0057】以上説明したように、実施形態3によれ
ば、音声合成装置の利用者もしくはその周囲環境の時間
情報を利用することにより、言語的には同一の内容でも
環境に応じた多様な合成音声を生成することができる。 <実施形態4>実施形態4では、環境情報として、画像
情報を用いる場合を例に挙げて説明し、実施形態4の音
声合成装置の機能構成は、上述の図2の環境情報測定部
が画像情報測定部となり、また、上述の図4のステップ
S101は、環境情報値として画像情報値を取得する。
【0058】次に、実施形態4の音声合成装置の機能構
成について、図8を用いて説明する。
【0059】図8は実施形態4の音声合成装置の機能構
成を示す図である。
【0060】画像情報測定部502では、ビデオカメラ
等の映像入力装置を用いることによって利用者もしくは
その周辺環境の画像情報を取得する。次に、合成音声特
性決定部503では、取得した画像情報に応じた音声合
成特性決定用パラメータを特性決定用補助データ504
から取得した後、図2で説明した同様の手順によって合
成音声を生成する。
【0061】尚、特性決定用補助データ504の構成
は、上述の図3に準じ、実施形態4の場合は、画像情報
に対し、合成音声特性決定用パラメータとして、既定合
成音声信号に対する音量の変化量が管理されている。
【0062】例えば、画像情報測定部502においてビ
デオカメラから利用者の顔画像を取得し、顔画像の特徴
量もしくはその時間変化特徴量を示す画像情報測定す
る。ここで、この時間変化特徴量がある閾値以下となっ
た場合、合成音声特性決定部503は、このときの合成
音声特性決定用パラメータを特性決定用補助データ50
4に対して問い合わせ、その結果、合成音声信号の音量
を2倍に変更するという情報が取得されたとする。この
場合、音声合成部505において、テキスト取得部50
1から送られる音声合成対象テキストテキストデータを
音声合成する際に、既定合成音声信号の信号レベルを2
倍にした合成音声信号を生成し、音声出力部507にお
いて出力する。
【0063】以上説明したように、実施形態4によれ
ば、音声合成装置の利用者もしくはその周囲環境の画像
情報を利用することにより、言語的には同一の内容でも
環境に応じた多様な合成音声を生成することができる。 <実施形態5>実施形態5では、環境情報として、音情
報を用いる場合を例に挙げて説明し、実施形態5の音声
合成装置の機能構成は、上述の図2の環境情報測定部が
音情報測定部となり、また、上述の図4のステップS1
01は、環境情報値として音情報値を取得する。
【0064】次に、実施形態5の音声合成装置の機能構
成について、図9を用いて説明する。
【0065】図9は実施形態5の音声合成装置の機能構
成を示す図である。
【0066】音情報測定部602では、マイクロフォン
等の音響入力装置を用いることによって、利用者もしく
はその周辺環境の音情報を取得する。次に、合成音声特
性決定部603では、取得した音情報に応じた音声合成
特性決定用パラメータを特性決定用補助データ604か
ら取得した後、図2で説明した同様の手順によって合成
音声を生成する。
【0067】尚、特性決定用補助データ604の構成
は、上述の図3に準じ、実施形態5の場合は、音情報に
対し、合成音声特性決定用パラメータとして、既定合成
音声信号に対する音量の変化量が管理されている。
【0068】例えば、音情報測定部602においてマイ
クロフォンから利用者が発声する音声信号を取得し、無
音継続時間を測定する。ここで、この無音継続時間があ
る閾値以上となった場合、合成音声特性決定部603
は、このときの合成音声特性決定用パラメータを特性決
定用補助データ604に対して問い合わせ、その結果、
合成音声信号の音量を2倍に変更するという情報が得ら
れたとする。この場合、音声合成部605においてテキ
スト取得部601から送られる音声合成対象テキストデ
ータを音声合成する際に、既定合成音声信号の信号レベ
ルを2倍にした合成音声信号を生成し、音声出力部60
7において出力する。
【0069】以上説明したように、実施形態5によれ
ば、音声合成装置の利用者もしくはその周囲環境の音情
報を利用することにより、言語的には同一の内容でも環
境に応じた多様な合成音声を生成することができる。 <実施形態6>実施形態6では、環境情報として、速度
/加速度情報を用いる場合を例に挙げて説明し、実施形
態6の音声合成装置の機能構成は、上述の図2の環境情
報測定部が速度/加速度情報測定部となり、また、上述
の図4のステップS101は、環境情報値として速度/
加速度情報値を取得する。
【0070】次に、実施形態6の音声合成装置の機能構
成について、図10を用いて説明する。
【0071】図10は実施形態6の音声合成装置の機能
構成を示す図である。
【0072】速度/加速度情報測定部702では、速度
もしくは加速度センサ等の速度もしくは加速度測定装置
を用いることによって、利用者もしくはその周辺環境の
速度もしくは加速度情報を取得する。次に、合成音声特
性決定部703では、取得した速度もしくは加速度情報
に応じた合成音声特性決定用パラメータを特性決定用補
助データ704から取得した後、図2で説明した同様の
手順によって合成音声を生成する。
【0073】尚、特性決定用補助データ704の構成
は、上述の図3に準じ、実施形態6の場合は、速度/加
速度情報に対し、合成音声特性決定用パラメータとし
て、既定合成音声信号に対する性別、基本周波数と発声
速度の変化量が管理されている。
【0074】例えば、速度センサを搭載した自動車内に
おいて合成音声機能を利用する場合、速度/加速度情報
測定部702において速度センサによって自動車の速度
を測定する。ここで、速度が時速100km以上になっ
た場合、合成音声特性決定部703は、このときの合成
音声特性決定用パラメータを特性決定用補助データ70
4に対して問い合わせ、その結果、合成音声信号の基本
周波数を既定値に対して20Hz加算し、発声速度を既
定値に対して20%早めるという情報が取得されたとす
る。この場合、音声合成部705においてテキスト取得
部701から送られる音声合成対象テキストデータを音
声合成する際に、既定合成音声信号よりも基本周波数を
20Hz高く、かつ発声速度を20%早くした合成音声
を生成し、音声出力部707において出力する。
【0075】以上説明したように、実施形態6によれ
ば、音声合成装置の利用者もしくはその周囲環境の速度
/加速度情報を利用することにより、言語的には同一の
内容でも環境に応じた多様な合成音声を生成することが
できる。 <実施形態7>実施形態7では、環境情報として、距離
情報を用いる場合を例に挙げて説明し、実施形態7の音
声合成装置の機能構成は、上述の図2の環境情報測定部
が距離情報測定部となり、また、上述の図4のステップ
S101は、環境情報値として距離情報値を取得する。
【0076】次に、実施形態7の音声合成装置の機能構
成について、図11を用いて説明する。
【0077】図11は実施形態7の音声合成装置の機能
構成を示す図である。
【0078】距離情報測定部802では、赤外線センサ
などの距離測定装置を用いることによって、利用者とそ
の周辺環境の対象物体感の距離情報を取得する。次に、
合成音声特性決定部803において取得した距離情報に
応じた合成音声特性決定用パラメータを特性決定用補助
データ804から取得した後、図2で説明した同様の手
順によって合成音声を生成する。
【0079】尚、特性決定用補助データ804の構成
は、上述の図3に準じ、実施形態7の場合は、距離情報
に対し、合成音声特性決定用パラメータとして、既定合
成音声信号に対する性別、基本周波数と発声速度の変化
量が管理されている。
【0080】例えば、赤外線センサを搭載した自動車内
において合成音声機能を利用する場合、距離情報測定部
802において赤外線センサによって自動車の進行方向
とその方向に存在する物体との距離を測定する。ここ
で、自動車と物体との距離が10m以下になった場合、
合成音声特性決定部803は、このときの合成音声特性
決定用パラメータを特性決定用補助データ804に対し
て問い合わせ、その結果、合成音声信号の性別を変更
し、更に基本周波数を既定値に対して20Hz加算し、
発声速度を既定値に対して20%早めるという情報が取
得されたとする。この場合、音声合成部805におい
て、テキスト取得部801から送られる音声合成対象テ
キストデータを音声合成する際に、これまで生成してい
た既定合成音声信号の性別を変更した上で基本周波数を
20Hz高く、かつ発声速度を20%早くした合成音声
信号を生成し、音声出力部807において出力する。
【0081】以上説明したように、実施形態7によれ
ば、音声合成装置の利用者もしくはその周囲環境の距離
情報を利用することにより、言語的には同一の内容でも
環境に応じた多様な合成音声を生成することができる。 <実施形態8>実施形態8では、環境情報として、生体
情報を用いる場合を例に挙げて説明し、実施形態8の音
声合成装置の機能構成は、上述の図2の環境情報測定部
が生体情報測定部となり、また、上述の図4のステップ
S101は、環境情報値として生体情報値を取得する。
【0082】次に、実施形態8の音声合成装置の機能構
成について、図12を用いて説明する。
【0083】図12は実施形態8の音声合成装置の機能
構成を示す図である。
【0084】生体情報測定部902では、脳波、体温、
脈拍、発汗、呼吸数等の生体情報検出装置を用いること
によって利用者の生体情報を取得する。次に、合成音声
特性決定部903では、取得した生体情報に応じた合成
音声特性決定用パラメータを特性決定用補助データ90
4から取得した後、図2で説明した同様の手順によって
合成音声を生成する。
【0085】尚、特性決定用補助データ904の構成
は、上述の図3に準じ、実施形態8の場合は、生体情報
に対し、合成音声特性決定用パラメータとして、既定合
成音声信号に対する音量の変化量が管理されている。
【0086】例えば、生体情報測定部902において脳
波測定装置によって利用者の脳波を測定する。合成音声
特性決定部903は、得られる脳波のパターンに応じて
このときの合成音声特性決定用パラメータを特性決定用
補助データ904に対して問い合わせ、その結果、合成
音声信号の音量を2倍に変更するという情報が得られた
とする。この場合、音声合成部905において、テキス
ト取得部901から送られる音声合成対象テキストデー
タを音声合成する際に、既定合成音声信号の信号レベル
を2倍にした合成音声信号を生成し、音声出力部907
において出力する。
【0087】以上説明したように、実施形態8によれ
ば、音声合成装置の利用者もしくはその周囲環境の生体
情報を利用することにより、言語的には同一の内容でも
環境に応じた多様な合成音声を生成することができる。 <実施形態9>実施形態9では、環境情報として、位置
情報、使用時間、音情報を用いる場合を例に挙げて説明
し、実施形態9の音声合成装置の機能構成は、上述の図
2の環境情報測定部が位置情報測定部、使用時間測定
部、音情報測定部となり、また、上述の図4のステップ
S101は、環境情報値として位置情報値、使用時間、
音情報値を取得する。
【0088】次に、実施形態9の音声合成装置の機能構
成について、図13を用いて説明する。
【0089】図13は実施形態9の音声合成装置の機能
構成を示す図である。
【0090】位置情報測定部2002では、GPS等の
位置情報測定装置を用い、使用時間測定部2003では
時計、タイマー等の時間情報取得装置を用い、音情報測
定部2004ではマイクロフォン等の音響入力装置を用
いてそれぞれの情報を取得する。次に、合成音声特性決
定部2005において取得した3種類の情報に応じた特
性決定用パラメータを特性決定用補助データ2006か
ら取得した後、図2で説明した同様の手順によって合成
音声を生成する。
【0091】尚、特性決定用補助データ2006の構成
は、上述の図3に準じ、実施形態9の場合は、位置情
報、使用時間、音情報に対し、合成音声特性決定用パラ
メータとして、既定合成音声信号に対する基本周波数と
発声速度の変化量が管理されている。
【0092】例えば、カーナビゲーションシステムに搭
載されたGPSから得られる経度、緯度情報と地図情報
から、現在、利用者が高速道路を走行していることを位
置情報測定部2002において取得し、自動車のエンジ
ンをかけ始めてからの経過時間が1時間であることを使
用時間測定部2003において取得し、音情報測定部2
004においてマイクロフォンから利用者が発声する音
声信号の無音継続時間が10分であることを取得したと
する。
【0093】このとき、合成音声特性決定部2005か
ら特性決定用補助データ2006に対して、高速道路走
行時かつ使用時間1時間かつ無音継続時間10分という
条件における合成音声特性決定用パラメータを問い合わ
せた結果、基本周波数を既定値に対して20Hz加算
し、発声速度を既定値に対して10%早めるという情報
が取得されたとする。このとき、音声合成部2007に
おいてテキスト取得部2001から送られる音声合成対
象テキストを音声合成する際に、既定合成音声信号より
も基本周波数を20Hz高く、かつ発声速度10%を早
くした合成音声信号を生成し、音声出力部2009にお
いて出力する。
【0094】以上説明したように、実施形態9によれ
ば、音声合成装置の利用者もしくはその周囲環境の位置
情報、使用時間、音情報を利用することにより、言語的
には同一の内容でも環境に応じた多様な合成音声を生成
することができる。
【0095】尚、本発明は、複数の機器(例えばホスト
コンピュータ、インタフェース機器、リーダ、プリンタ
など)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、カーナビゲーションシステ
ム、ATM等)に適用してもよい。
【0096】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0097】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0098】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROMな
どを用いることができる。
【0099】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0100】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
【0101】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した図4に示すフローチャー
トに対応するプログラムコードが格納されることにな
る。
【0102】
【発明の効果】以上説明したように、本発明によれば、
利用者もしくはその周囲環境の情報を利用することによ
り、言語的には同一の内容でも環境に応じた多様な合成
音声を生成することができる音声合成装置及びその制御
方法、コンピュータ可読メモリを提供できる。
【図面の簡単な説明】
【図1】本発明の各実施形態に係る音声合成装置のハー
ドウェア構成を示すブロック図である。
【図2】本発明の各実施形態に係る音声合成装置の基本
機能構成を示すブロック図である。
【図3】本発明の各実施形態に係る特性決定用補助デー
タの基本構成を示す図である。
【図4】本発明の各実施形態に係る音声合成装置で実行
される処理の概要を示すフローチャートである。
【図5】実施形態1の音声合成装置の機能構成を示すブ
ロック図である。
【図6】実施形態2の音声合成装置の機能構成を示すブ
ロック図である。
【図7】実施形態3の音声合成装置の機能構成を示すブ
ロック図である。
【図8】実施形態4の音声合成装置の機能構成を示すブ
ロック図である。
【図9】実施形態5の音声合成装置の機能構成を示すブ
ロック図である。
【図10】実施形態6の音声合成装置の機能構成を示す
ブロック図である。
【図11】実施形態7の音声合成装置の機能構成を示す
ブロック図である。
【図12】実施形態8の音声合成装置の機能構成を示す
ブロック図である。
【図13】実施形態9の音声合成装置の機能構成を示す
ブロック図である。
【符号の説明】
1001 テキスト取得部 1002 環境情報測定部 1003 合成音性特性決定部 1004 特性決定用補助データ 1005 音声合成部 1006 音声合成用データ 1007 音声出力部

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】 合成音声を生成する音声合成装置であっ
    て、 利用者もしくは周囲環境の状況を示す環境情報値を測定
    する測定手段と、 前記測定手段で測定された環境情報値に基づいて、音声
    合成対象データに対応する合成音声信号の特性を決定す
    る決定手段と、 前記決定手段で決定された特性で、前記音声合成対象デ
    ータに対応する合成音声を出力する出力手段とを備える
    ことを特徴とする音声合成装置。
  2. 【請求項2】 前記測定手段は、利用者もしくは周囲環
    境の位置を示す位置情報値を測定する位置情報測定手段
    を含むことを特徴とする請求項1に記載の音声合成装
    置。
  3. 【請求項3】 前記測定手段は、利用者の周囲環境の気
    象状況を示す気象情報値を測定する気象情報測定手段を
    含むことを特徴とする請求項1または請求項2に記載の
    音声合成装置。
  4. 【請求項4】 前記測定手段は、利用者の当該音声合成
    装置の使用時間を示す時間情報値を測定する時間情報測
    定手段を含むことを特徴とする請求項1乃至請求項3の
    いずれか1項に記載の音声合成装置。
  5. 【請求項5】 前記測定手段は、利用者もしくは周囲環
    境の画像を示す画像報値を測定する画像情報測定手段を
    含むことを特徴とする請求項1乃至請求項4のいずれか
    1項に記載の音声合成装置。
  6. 【請求項6】 前記測定手段は、利用者もしくは周囲環
    境の音を示す音情報値を測定する音情報測定手段を含む
    ことを特徴とする請求項1乃至請求項5のいずれか1項
    に記載の音声合成装置。
  7. 【請求項7】 前記測定手段は、利用者における速度/
    加速度を示す速度/加速度情報値を測定する速度/加速
    度情報測定手段を含むことを特徴とする請求項1乃至請
    求項6のいずれか1項に記載の音声合成装置。
  8. 【請求項8】 前記測定手段は、当該音声合成装置の利
    用者とその周辺の対象物体間の距離を示す距離情報値を
    測定する距離情報測定手段を含むことを特徴とする請求
    項1乃至請求項7のいずれか1項に記載の音声合成装
    置。
  9. 【請求項9】 前記測定手段は、利用者の生体状況を示
    す生体情報値を測定する生体情報測定手段を含むことを
    特徴とする請求項1乃至請求項8のいずれか1項に記載
    の音声合成装置。
  10. 【請求項10】 合成音声を生成する音声合成装置の制
    御方法であって、 利用者もしくは周囲環境の状況を示す環境情報値を測定
    する測定工程と、 前記測定工程で測定された環境情報値に基づいて、音声
    合成対象データに対応する合成音声信号の特性を決定す
    る決定工程と、 前記決定工程で決定された特性で、前記音声合成対象デ
    ータに対応する合成音声を出力する出力工程とを備える
    ことを特徴とする音声合成装置の制御方法。
  11. 【請求項11】 前記測定工程は、利用者もしくは周囲
    環境の位置を示す位置情報値を測定する位置情報測定工
    程を含むことを特徴とする請求項10に記載の音声合成
    装置の制御方法。
  12. 【請求項12】 前記測定工程は、利用者の周囲環境の
    気象状況を示す気象情報値を測定する気象情報測定工程
    を含むことを特徴とする請求項10または請求項11に
    記載の音声合成装置の制御方法。
  13. 【請求項13】 前記測定工程は、利用者の当該音声合
    成装置の使用時間を示す時間情報値を測定する時間情報
    測定工程を含むことを特徴とする請求項10乃至請求項
    12のいずれか1項に記載の音声合成装置の制御方法。
  14. 【請求項14】 前記測定工程は、利用者もしくは周囲
    環境の画像を示す画像報値を測定する画像情報測定工程
    を含むことを特徴とする請求項10乃至請求項13のい
    ずれか1項に記載の音声合成装置の制御方法。
  15. 【請求項15】 前記測定工程は、利用者もしくは周囲
    環境の音を示す音情報値を測定する音情報測定工程を含
    むことを特徴とする請求項10乃至請求項14のいずれ
    か1項に記載の音声合成装置の制御方法。
  16. 【請求項16】 前記測定工程は、利用者における速度
    /加速度を示す速度/加速度情報値を測定する速度/加
    速度情報測定工程を含むことを特徴とする請求項10乃
    至請求項15のいずれか1項に記載の音声合成装置の制
    御方法。
  17. 【請求項17】 前記測定工程は、当該音声合成装置の
    利用者とその周辺の対象物体間の距離を示す距離情報値
    を測定する距離情報測定工程を含むことを特徴とする請
    求項10乃至請求項16のいずれか1項に記載の音声合
    成装置の制御方法。
  18. 【請求項18】 前記測定工程は、利用者の生体状況を
    示す生体情報値を測定する生体情報測定手段を含むこと
    を特徴とする請求項10乃至請求項17のいずれか1項
    に記載の音声合成装置の制御方法。
  19. 【請求項19】 合成音声を生成する音声合成装置の制
    御のプログラムコードが格納されたコンピュータ可読メ
    モリであって、 利用者もしくは周囲環境の状況を示す環境情報値を測定
    する測定工程のプログラムコードと、 前記測定工程で測定された環境情報値に基づいて、音声
    合成対象データに対応する合成音声信号の特性を決定す
    る決定工程のプログラムコードと、 前記決定工程で決定された特性で、前記音声合成対象デ
    ータに対応する合成音声を出力する出力工程のプログラ
    ムコードとを備えることを特徴とするコンピュータ可読
    メモリ。
JP2000363756A 2000-11-29 2000-11-29 音声合成装置及びその制御方法、コンピュータ可読メモリ Pending JP2002169582A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000363756A JP2002169582A (ja) 2000-11-29 2000-11-29 音声合成装置及びその制御方法、コンピュータ可読メモリ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000363756A JP2002169582A (ja) 2000-11-29 2000-11-29 音声合成装置及びその制御方法、コンピュータ可読メモリ

Publications (2)

Publication Number Publication Date
JP2002169582A true JP2002169582A (ja) 2002-06-14
JP2002169582A5 JP2002169582A5 (ja) 2009-10-08

Family

ID=18834815

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000363756A Pending JP2002169582A (ja) 2000-11-29 2000-11-29 音声合成装置及びその制御方法、コンピュータ可読メモリ

Country Status (1)

Country Link
JP (1) JP2002169582A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006337403A (ja) * 2005-05-31 2006-12-14 Kenwood Corp 音声案内装置及び音声案内プログラム
JP2007140376A (ja) * 2005-11-22 2007-06-07 Canon Inc 音声出力方法
JP2007206522A (ja) * 2006-02-03 2007-08-16 Toyota Motor Corp 音声出力装置
JP2010055096A (ja) * 2008-08-29 2010-03-11 Honda Motor Co Ltd 自動車車両の操作者の注意を乱すことを最小限に抑えた可変テキスト読み上げのためのシステムおよび方法
JP2019060921A (ja) * 2017-09-25 2019-04-18 富士ゼロックス株式会社 情報処理装置、及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6174100A (ja) * 1984-09-19 1986-04-16 株式会社トキメック 船舶用警報装置
JPH08249447A (ja) * 1995-03-13 1996-09-27 Atr Tsushin Syst Kenkyusho:Kk 表情検出装置
JPH10288532A (ja) * 1997-04-15 1998-10-27 Toyota Motor Corp 車両用音声案内装置
JPH10312196A (ja) * 1997-03-12 1998-11-24 Seiko Epson Corp 応答音声の音量適正化方法およびその装置
JPH1178592A (ja) * 1997-09-12 1999-03-23 Nissan Diesel Motor Co Ltd 車間距離警報装置
JPH11175895A (ja) * 1997-12-05 1999-07-02 Nippon Telegr & Teleph Corp <Ntt> ドライバー状況依存コミュニケーション装置及びその方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6174100A (ja) * 1984-09-19 1986-04-16 株式会社トキメック 船舶用警報装置
JPH08249447A (ja) * 1995-03-13 1996-09-27 Atr Tsushin Syst Kenkyusho:Kk 表情検出装置
JPH10312196A (ja) * 1997-03-12 1998-11-24 Seiko Epson Corp 応答音声の音量適正化方法およびその装置
JPH10288532A (ja) * 1997-04-15 1998-10-27 Toyota Motor Corp 車両用音声案内装置
JPH1178592A (ja) * 1997-09-12 1999-03-23 Nissan Diesel Motor Co Ltd 車間距離警報装置
JPH11175895A (ja) * 1997-12-05 1999-07-02 Nippon Telegr & Teleph Corp <Ntt> ドライバー状況依存コミュニケーション装置及びその方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006337403A (ja) * 2005-05-31 2006-12-14 Kenwood Corp 音声案内装置及び音声案内プログラム
JP2007140376A (ja) * 2005-11-22 2007-06-07 Canon Inc 音声出力方法
JP4759374B2 (ja) * 2005-11-22 2011-08-31 キヤノン株式会社 情報処理装置、情報処理方法、プログラム、記憶媒体
JP2007206522A (ja) * 2006-02-03 2007-08-16 Toyota Motor Corp 音声出力装置
JP2010055096A (ja) * 2008-08-29 2010-03-11 Honda Motor Co Ltd 自動車車両の操作者の注意を乱すことを最小限に抑えた可変テキスト読み上げのためのシステムおよび方法
JP2019060921A (ja) * 2017-09-25 2019-04-18 富士ゼロックス株式会社 情報処理装置、及びプログラム
JP7021488B2 (ja) 2017-09-25 2022-02-17 富士フイルムビジネスイノベーション株式会社 情報処理装置、及びプログラム

Similar Documents

Publication Publication Date Title
US7881934B2 (en) Method and system for adjusting the voice prompt of an interactive system based upon the user&#39;s state
US10929652B2 (en) Information providing device and information providing method
JP3573907B2 (ja) 音声合成装置
JP6173477B2 (ja) ナビゲーション用サーバ、ナビゲーションシステムおよびナビゲーション方法
US20080269958A1 (en) Emotive advisory system and method
JP2006350567A (ja) 対話システム
US8315873B2 (en) Sentence reading aloud apparatus, control method for controlling the same, and control program for controlling the same
CN103020232A (zh) 一种导航系统中单字录入方法
JP2002169582A (ja) 音声合成装置及びその制御方法、コンピュータ可読メモリ
US20200319634A1 (en) Agent device, method of controlling agent device, and storage medium
JP2001272991A (ja) 音声対話方法及び音声対話装置
JP2007241535A (ja) エージェント装置
JP3862478B2 (ja) 音声合成装置および音声合成方法
JP2023047081A (ja) 音処理機器の制御方法及び音処理機器の制御装置
US11797261B2 (en) On-vehicle device, method of controlling on-vehicle device, and storage medium
KR20220130952A (ko) 이모지 생성 장치, 차량 및 이모지 생성 방법
JP2001134642A (ja) 社会的反応特性を利用したエージェントシステム
KR20210012265A (ko) 음성 제공 방법, 음성 제공을 위한 학습 방법 및 그 장치들
JP2004226711A (ja) 音声出力装置及びナビゲーション装置
JP2020160285A (ja) エージェント装置、情報提供方法、及びプログラム
JP2020152298A (ja) エージェント装置、エージェント装置の制御方法、およびプログラム
JP2020160848A (ja) サーバ装置、情報提供システム、情報提供方法、およびプログラム
US20210358511A1 (en) Output apparatus, output method and non-transitory computer-readable recording medium
US20240190443A1 (en) Apparatus and method for providing vehicle sound
JP7274901B2 (ja) エージェント装置、エージェント装置の制御方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071129

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071129

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100517

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100521

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100708

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101105