JPH09281994A - 音声合成装置 - Google Patents
音声合成装置Info
- Publication number
- JPH09281994A JPH09281994A JP8098026A JP9802696A JPH09281994A JP H09281994 A JPH09281994 A JP H09281994A JP 8098026 A JP8098026 A JP 8098026A JP 9802696 A JP9802696 A JP 9802696A JP H09281994 A JPH09281994 A JP H09281994A
- Authority
- JP
- Japan
- Prior art keywords
- fluctuation
- voice
- clock
- pitch
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Analogue/Digital Conversion (AREA)
Abstract
(57)【要約】
【課題】 低消費電力で合成音声の微視的な周波数のゆ
らぎを付与することが可能な音声合成装置を提供する。 【解決手段】 音声合成装置200は、ゆらぎ付加を無
効にするゆらぎ付加無効回路201と、母音などのピッ
チ周波数をもつ有声音の音声素片、及び無声子音や無音
部の音声素片を検出する有声音検出部202と、クロッ
ク間隔ゆらぎデータ値を格納するクロック間隔ゆらぎデ
ータ格納部203と、基準クロックにクロック間隔ゆら
ぎデータ値を加えてゆらぎを持つクロックを生成し、D
/A変換器108に供給する可変クロック発生部204
とを備えて構成する。
らぎを付与することが可能な音声合成装置を提供する。 【解決手段】 音声合成装置200は、ゆらぎ付加を無
効にするゆらぎ付加無効回路201と、母音などのピッ
チ周波数をもつ有声音の音声素片、及び無声子音や無音
部の音声素片を検出する有声音検出部202と、クロッ
ク間隔ゆらぎデータ値を格納するクロック間隔ゆらぎデ
ータ格納部203と、基準クロックにクロック間隔ゆら
ぎデータ値を加えてゆらぎを持つクロックを生成し、D
/A変換器108に供給する可変クロック発生部204
とを備えて構成する。
Description
【0001】
【発明の属する技術分野】本発明は、ディジタル音声デ
ータをアナログ信号に変換して音声を合成する音声合成
装置に係り、詳細にはテキストデータを入力とし、自然
性を付与した合成音を出力する音声合成装置、特に、出
力される合成音の持つ周波数成分にゆらぎを付与する音
声合成装置に関する。
ータをアナログ信号に変換して音声を合成する音声合成
装置に係り、詳細にはテキストデータを入力とし、自然
性を付与した合成音を出力する音声合成装置、特に、出
力される合成音の持つ周波数成分にゆらぎを付与する音
声合成装置に関する。
【0002】
【従来の技術】音声合成方式には、音声波形そのものを
記録しておき、それを組み合わせて音声波形を作りだす
ものと、音声の特性を表すパラメータに分析して記録し
ておき、出力時に合成器を用いるものがある。さらに、
制御部と波形形成部の方式の組み合わせにより録音編
集、音声素片編集、パラメータ編集、規則合成などのさ
まざまな音声合成方式がある。
記録しておき、それを組み合わせて音声波形を作りだす
ものと、音声の特性を表すパラメータに分析して記録し
ておき、出力時に合成器を用いるものがある。さらに、
制御部と波形形成部の方式の組み合わせにより録音編
集、音声素片編集、パラメータ編集、規則合成などのさ
まざまな音声合成方式がある。
【0003】このうち音声素片(主として1ピッチ周期
の音声波形)編集合成は、ピッチ制御が可能で音声素片
の選び方によっては任意語の出力まで拡張できる。ま
た、パラメータ編集合成は、単位音声ごとに音源パラメ
ータと音声伝達特性(スペクトラム)パラメータを符号
化して記録しておき、パラメータ時系列で音声合成を得
るものである。音声の規則合成は、文字や音声記号など
の離散的記号で表現された系列を、連続音声に変換する
ものである。
の音声波形)編集合成は、ピッチ制御が可能で音声素片
の選び方によっては任意語の出力まで拡張できる。ま
た、パラメータ編集合成は、単位音声ごとに音源パラメ
ータと音声伝達特性(スペクトラム)パラメータを符号
化して記録しておき、パラメータ時系列で音声合成を得
るものである。音声の規則合成は、文字や音声記号など
の離散的記号で表現された系列を、連続音声に変換する
ものである。
【0004】テキスト音声合成は、文章(テキストデー
タ)を音声に変換するものであり、音声表記と1対1に
対応しないのが普通である。したがって、入力テキスト
を音声記号の系列に変換するとともに、韻律的特徴を自
動的に生成するため、形態素解析や構文解析などの言語
処理が必要となる。
タ)を音声に変換するものであり、音声表記と1対1に
対応しないのが普通である。したがって、入力テキスト
を音声記号の系列に変換するとともに、韻律的特徴を自
動的に生成するため、形態素解析や構文解析などの言語
処理が必要となる。
【0005】図11は従来のテキスト音声合成装置の構
成を示すブロック図である。
成を示すブロック図である。
【0006】図11において、テキスト音声合成装置1
00は、データ入力部101、文章解析部102、単語
辞書記憶部103、合成パラメータ生成部104、素片
データ合成部105、音声素片データ格納部106及び
音声合成出力部107から構成される。
00は、データ入力部101、文章解析部102、単語
辞書記憶部103、合成パラメータ生成部104、素片
データ合成部105、音声素片データ格納部106及び
音声合成出力部107から構成される。
【0007】上記音声合成出力部107は、D/A変換
器108、D/A変換器108に供給するクロック信号
のタイミングfsamp0を決定するクロック発生器10
9、ローパスフィルタ及びアンプからなるアナログ部1
10、スピーカ111から構成される。
器108、D/A変換器108に供給するクロック信号
のタイミングfsamp0を決定するクロック発生器10
9、ローパスフィルタ及びアンプからなるアナログ部1
10、スピーカ111から構成される。
【0008】上記テキスト音声合成装置の動作を説明す
る。
る。
【0009】RS−232C等の通信ポートやFDDか
らなるデータ入力部101に入力されたテキストデータ
は、内部バッファに一時的に格納され、ある単位ごと
(例えば、文章や文節ごと)に文章解析部102に送ら
れる。文章解析部102では単語辞書格納部103の単
語辞書と入力されたテキストデータとを照合しながら、
読み、アクセント、イントネーション、ポーズ等の情報
を文字列として記述した音韻韻律記号を生成し、これを
合成パラメータ生成部104に送る。
らなるデータ入力部101に入力されたテキストデータ
は、内部バッファに一時的に格納され、ある単位ごと
(例えば、文章や文節ごと)に文章解析部102に送ら
れる。文章解析部102では単語辞書格納部103の単
語辞書と入力されたテキストデータとを照合しながら、
読み、アクセント、イントネーション、ポーズ等の情報
を文字列として記述した音韻韻律記号を生成し、これを
合成パラメータ生成部104に送る。
【0010】合成パラメータ生成部104では、この音
韻韻律記号列に基づいて音声素片データ記憶部106に
格納されている音声素片データの位置、各音韻の継続時
間、音の高さ(ピッチ)、声の強さを決定し、これらの
情報からなる合成パラメータを生成し、素片データ合成
部105に送る。
韻韻律記号列に基づいて音声素片データ記憶部106に
格納されている音声素片データの位置、各音韻の継続時
間、音の高さ(ピッチ)、声の強さを決定し、これらの
情報からなる合成パラメータを生成し、素片データ合成
部105に送る。
【0011】素片データ合成部105では、生成された
合成パラメータに基づいて音声素片データ記憶部106
より音声素片データを読み込みながら音声波形データを
生成し、これをD/A変換器108に送る。D/A変換
器108では、クロック発生器109より出力されるク
ロック信号のタイミングfsamp0(Hz)でディジタル
音声波形データをアナログ信号に変換し、アナログ部1
10でフィルタリング及び増幅されてスピーカ111よ
り合成音声として出力される。
合成パラメータに基づいて音声素片データ記憶部106
より音声素片データを読み込みながら音声波形データを
生成し、これをD/A変換器108に送る。D/A変換
器108では、クロック発生器109より出力されるク
ロック信号のタイミングfsamp0(Hz)でディジタル
音声波形データをアナログ信号に変換し、アナログ部1
10でフィルタリング及び増幅されてスピーカ111よ
り合成音声として出力される。
【0012】
【発明が解決しようとする課題】しかしながら、このよ
うな従来のテキスト音声合成装置にあっては、大局的な
ピッチ周波数変化には対応していても微視的な周波数の
ゆらぎには対応していないため、音声の自然性の一部を
損なうという問題点があった。
うな従来のテキスト音声合成装置にあっては、大局的な
ピッチ周波数変化には対応していても微視的な周波数の
ゆらぎには対応していないため、音声の自然性の一部を
損なうという問題点があった。
【0013】本発明は、低消費電力で合成音声の微視的
な周波数のゆらぎを付与することが可能な音声合成装置
を提供することを目的とする。
な周波数のゆらぎを付与することが可能な音声合成装置
を提供することを目的とする。
【0014】
【課題を解決するための手段】本発明に係る音声合成装
置は、所定クロック信号のタイミングでディジタル音声
波形データをアナログ信号に変換して音声を合成するD
/A変換器を備えた音声合成装置において、母音などの
ピッチ周波数をもつ有声音の音声素片、及び無声子音や
無音部の音声素片を検出する有声音検出手段と、クロッ
ク間隔ゆらぎデータ値を格納するクロック間隔ゆらぎデ
ータ格納手段と、基準クロックにクロック間隔ゆらぎデ
ータ値を加えてゆらぎを持つクロックを生成し、D/A
変換器に供給する可変クロック発生手段とを備えて構成
する。
置は、所定クロック信号のタイミングでディジタル音声
波形データをアナログ信号に変換して音声を合成するD
/A変換器を備えた音声合成装置において、母音などの
ピッチ周波数をもつ有声音の音声素片、及び無声子音や
無音部の音声素片を検出する有声音検出手段と、クロッ
ク間隔ゆらぎデータ値を格納するクロック間隔ゆらぎデ
ータ格納手段と、基準クロックにクロック間隔ゆらぎデ
ータ値を加えてゆらぎを持つクロックを生成し、D/A
変換器に供給する可変クロック発生手段とを備えて構成
する。
【0015】上記音声合成装置が、有声音の音声素片デ
ータを合成時のみ、ゆらぎを持つ値をクロック間隔ゆら
ぎデータ格納手段から読み出して可変クロック発生手段
に与えて1クロック毎にクロックの周期にゆらぎを持た
せ、該可変クロック発生手段により生成したクロックを
D/A変換器に供給し、該D/A変換器が該クロックに
基づいてD/A変換を行なうことにより合成音声の微視
的な周波数のゆらぎを付与するように構成してもよい。
ータを合成時のみ、ゆらぎを持つ値をクロック間隔ゆら
ぎデータ格納手段から読み出して可変クロック発生手段
に与えて1クロック毎にクロックの周期にゆらぎを持た
せ、該可変クロック発生手段により生成したクロックを
D/A変換器に供給し、該D/A変換器が該クロックに
基づいてD/A変換を行なうことにより合成音声の微視
的な周波数のゆらぎを付与するように構成してもよい。
【0016】また、上記音声合成装置が、可変クロック
発生手段に接続される信号の変動タイミングを1ピッチ
毎に制御するピッチ検出手段を備え、ピッチ検出手段の
出力を可変クロック発生手段に与えて1ピッチ毎にクロ
ックの周期にゆらぎを持たせ、該クロックでD/A変換
を行なうことにより主に合成音声のピッチ周波数のゆら
ぎを付加するものであってもよい。
発生手段に接続される信号の変動タイミングを1ピッチ
毎に制御するピッチ検出手段を備え、ピッチ検出手段の
出力を可変クロック発生手段に与えて1ピッチ毎にクロ
ックの周期にゆらぎを持たせ、該クロックでD/A変換
を行なうことにより主に合成音声のピッチ周波数のゆら
ぎを付加するものであってもよい。
【0017】また、上記音声合成装置が、非音声データ
検出する非音声データ検出手段を備え、非音声データ検
出手段の出力を可変クロック発生手段に与えてピッチ間
の振幅が所定値より小さい非音声の部分のみクロックの
周期にゆらぎを持たせ、該クロックでD/A変換を行な
うことにより合成音声のピッチ周波数のゆらぎのみを付
加するものであってもよい。
検出する非音声データ検出手段を備え、非音声データ検
出手段の出力を可変クロック発生手段に与えてピッチ間
の振幅が所定値より小さい非音声の部分のみクロックの
周期にゆらぎを持たせ、該クロックでD/A変換を行な
うことにより合成音声のピッチ周波数のゆらぎのみを付
加するものであってもよい。
【0018】また、上記音声合成装置が、ピッチ周波数
の大きさが変化する毎にピッチ対応ゆらぎ幅を変更する
ピッチ対応ゆらぎ幅変更手段と、ピッチ対応ゆらぎ幅変
更手段の出力に基づいてクロック間隔ゆらぎデータ格納
手段から出力されるゆらぎデータのゆらぎ幅の倍率を変
える倍率変更手段とを備え、ゆらぎ幅を可変してピッチ
周波数とゆらぎ幅が反比例する特性を防止して多種のゆ
らぎ特性に対応するようにしたものであってもよい。
の大きさが変化する毎にピッチ対応ゆらぎ幅を変更する
ピッチ対応ゆらぎ幅変更手段と、ピッチ対応ゆらぎ幅変
更手段の出力に基づいてクロック間隔ゆらぎデータ格納
手段から出力されるゆらぎデータのゆらぎ幅の倍率を変
える倍率変更手段とを備え、ゆらぎ幅を可変してピッチ
周波数とゆらぎ幅が反比例する特性を防止して多種のゆ
らぎ特性に対応するようにしたものであってもよい。
【0019】また、上記音声合成装置において、クロッ
ク間隔ゆらぎデータ格納手段は、ピッチの変動方向に応
じたゆらぎデータのパタンを複数格納し、ピッチ周波数
の変動方向を検出するピッチ変動方向検出手段を備え、
ピッチ変動方向検出手段の出力に基づいてクロック間隔
ゆらぎデータ格納手段に格納されたクロック間隔ゆらぎ
データパタンを、ピッチ変動方向によって選択使用して
大局的なピッチ周波数の変化に応じた多種のゆらぎ特性
に対応するようにしたものであってもよい。
ク間隔ゆらぎデータ格納手段は、ピッチの変動方向に応
じたゆらぎデータのパタンを複数格納し、ピッチ周波数
の変動方向を検出するピッチ変動方向検出手段を備え、
ピッチ変動方向検出手段の出力に基づいてクロック間隔
ゆらぎデータ格納手段に格納されたクロック間隔ゆらぎ
データパタンを、ピッチ変動方向によって選択使用して
大局的なピッチ周波数の変化に応じた多種のゆらぎ特性
に対応するようにしたものであってもよい。
【0020】また、上記音声合成装置が、ゆらぎ付加を
無効にする付加無効回路を備えたものであってもよく、
ゆらぎ付加無効回路は、機械的な合成音声とゆらぎを付
加した自然性の高い合成音声とを切り換える切換手段に
より行うものであってもよく、また、ゆらぎ付加無効回
路は、ディジタル音声波形データ内に付加された特殊記
号を判別する手段を備え、判別手段により特殊記号を判
別して機械的な合成音声とゆらぎを付加した自然性の高
い合成音声とを切り換えるようにしたものであってもよ
い。
無効にする付加無効回路を備えたものであってもよく、
ゆらぎ付加無効回路は、機械的な合成音声とゆらぎを付
加した自然性の高い合成音声とを切り換える切換手段に
より行うものであってもよく、また、ゆらぎ付加無効回
路は、ディジタル音声波形データ内に付加された特殊記
号を判別する手段を備え、判別手段により特殊記号を判
別して機械的な合成音声とゆらぎを付加した自然性の高
い合成音声とを切り換えるようにしたものであってもよ
い。
【0021】さらに、ディジタル音声波形データは、テ
キストデータであってもよい。
キストデータであってもよい。
【0022】
【発明の実施の形態】本発明に係る音声合成装置は、テ
キストデータを入力とする音声合成装置に適用すること
ができる。
キストデータを入力とする音声合成装置に適用すること
ができる。
【0023】図1は本発明の第1の実施形態に係る音声
合成装置の構成図である。本実施形態に係る音声合成装
置は、テキストデータを入力とする音声合成装置につい
て全て有効である。
合成装置の構成図である。本実施形態に係る音声合成装
置は、テキストデータを入力とする音声合成装置につい
て全て有効である。
【0024】図1の説明にあたり、前記図11と同一構
成部分及び同一信号部分には同一符号を付している。
成部分及び同一信号部分には同一符号を付している。
【0025】図1において、テキスト音声合成装置20
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、有声音検出部202(有声音検
出手段)、クロック間隔ゆらぎデータ格納部203(ク
ロック間隔ゆらぎデータ格納手段)、可変クロック発生
部204(可変クロック発生手段)、D/A変換器10
8、アナログ部110及びスピーカ111から構成され
る。
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、有声音検出部202(有声音検
出手段)、クロック間隔ゆらぎデータ格納部203(ク
ロック間隔ゆらぎデータ格納手段)、可変クロック発生
部204(可変クロック発生手段)、D/A変換器10
8、アナログ部110及びスピーカ111から構成され
る。
【0026】上記データ入力部101は、RS−232
C等の通信ポートやFDD、データを格納する内部バッ
ファから構成され、音声合成するテキストデータが通信
ポートやFDDを通して入力される。
C等の通信ポートやFDD、データを格納する内部バッ
ファから構成され、音声合成するテキストデータが通信
ポートやFDDを通して入力される。
【0027】上記文章解析部102は、単語辞書格納部
103の単語辞書と入力されたテキストデータとを照合
しながら、読み、アクセント、イントネーション、ポー
ズ等の情報を文字列として記述した音韻韻律記号を生成
する。アクセントとイントネーションは、ピッチ周波数
の時間的変化パターンと最も密接に関係しており、ピッ
チ周波数パターンは自然で聞きやすい音調を付与するば
かりでなく、単語や句のまとまりを示して文音声を理解
しやすくする役割を果たす。
103の単語辞書と入力されたテキストデータとを照合
しながら、読み、アクセント、イントネーション、ポー
ズ等の情報を文字列として記述した音韻韻律記号を生成
する。アクセントとイントネーションは、ピッチ周波数
の時間的変化パターンと最も密接に関係しており、ピッ
チ周波数パターンは自然で聞きやすい音調を付与するば
かりでなく、単語や句のまとまりを示して文音声を理解
しやすくする役割を果たす。
【0028】上記単語辞書記憶部103は、例えばRO
MやRAMで構成され、単語辞書及び文法的に連結可能
な後続単語の種類を規定した単語検索テーブルを記憶す
る。
MやRAMで構成され、単語辞書及び文法的に連結可能
な後続単語の種類を規定した単語検索テーブルを記憶す
る。
【0029】上記合成パラメータ生成部104は、上記
音韻韻律記号列に基づいて音声素片データ記憶部106
に格納されている音声素片データの位置、各音韻の継続
時間、音の高さ(ピッチ)、声の強さを決定し、これら
の情報からなる合成パラメータを生成する。
音韻韻律記号列に基づいて音声素片データ記憶部106
に格納されている音声素片データの位置、各音韻の継続
時間、音の高さ(ピッチ)、声の強さを決定し、これら
の情報からなる合成パラメータを生成する。
【0030】上記素片データ合成部105は、生成され
た合成パラメータに基づいて音声素片データ記憶部10
6より音声素片データを読み込みながら音声波形データ
を生成する。
た合成パラメータに基づいて音声素片データ記憶部10
6より音声素片データを読み込みながら音声波形データ
を生成する。
【0031】上記音声素片データ格納部106は、音声
素片データの位置、各音韻の継続時間、音の高さ(ピッ
チ)、声の強さ等の音声素片データを格納する。
素片データの位置、各音韻の継続時間、音の高さ(ピッ
チ)、声の強さ等の音声素片データを格納する。
【0032】上記ゆらぎ付加無効回路201は、スイッ
チ201aを備え、スイッチ201aがオンされた時、
クロック間隔ゆらぎデータ格納部203の動作を禁止す
る信号を出力する。
チ201aを備え、スイッチ201aがオンされた時、
クロック間隔ゆらぎデータ格納部203の動作を禁止す
る信号を出力する。
【0033】上記有声音検出部202は、母音などのピ
ッチ周波数をもつ有声音の音声素片か、あるいは無声子
音や無音部の音声素片かを音声素片データの位置により
決定し、有声音の場合、クロック間隔ゆらぎデータ格納
部203に接続された信号線を“Low”レベル(≒0
V)とする。
ッチ周波数をもつ有声音の音声素片か、あるいは無声子
音や無音部の音声素片かを音声素片データの位置により
決定し、有声音の場合、クロック間隔ゆらぎデータ格納
部203に接続された信号線を“Low”レベル(≒0
V)とする。
【0034】上記クロック間隔ゆらぎデータ格納部20
3は、クロック間隔ゆらぎデータ値を格納するもので、
格納されたクロック間隔ゆらぎデータ値は、プルダウン
接続されたデータバス205を介してD/A変換器10
8に出力される。
3は、クロック間隔ゆらぎデータ値を格納するもので、
格納されたクロック間隔ゆらぎデータ値は、プルダウン
接続されたデータバス205を介してD/A変換器10
8に出力される。
【0035】上記可変クロック発生部204は、D/A
変換器108に入力するクロック周波数より十分高い周
波数を持つ基準発振器204aと、この基準発振器20
4aからの出力を分周するカウンタ204bを備え、基
準分周比(fsamp0)にクロック間隔ゆらぎデータ値を
加えてゆらぎを持つクロックの生成する。
変換器108に入力するクロック周波数より十分高い周
波数を持つ基準発振器204aと、この基準発振器20
4aからの出力を分周するカウンタ204bを備え、基
準分周比(fsamp0)にクロック間隔ゆらぎデータ値を
加えてゆらぎを持つクロックの生成する。
【0036】上記D/A変換器108は、可変クロック
発生部204より出力されるゆらぎを持ったクロック信
号のタイミングfsamp0+x(n)(Hz)でディジタル音
声波形データをアナログ信号に変換する。
発生部204より出力されるゆらぎを持ったクロック信
号のタイミングfsamp0+x(n)(Hz)でディジタル音
声波形データをアナログ信号に変換する。
【0037】上記アナログ部110は、ローパスフィル
タ及びアンプから構成され、アナログ信号に変換された
音声波形にフィルタリングして増幅する。
タ及びアンプから構成され、アナログ信号に変換された
音声波形にフィルタリングして増幅する。
【0038】本テキスト音声合成装置200は、データ
入力部101が文章解析部102、ゆらぎ付加無効回路
201とデータバスで接続され、文章解析部102は単
語辞書格納部103、合成パラメータ生成部104と、
データバスで接続され、合成パラメータ生成部104
は、素片データ合成部105、有声音検出部202とデ
ータバスで接続されている。
入力部101が文章解析部102、ゆらぎ付加無効回路
201とデータバスで接続され、文章解析部102は単
語辞書格納部103、合成パラメータ生成部104と、
データバスで接続され、合成パラメータ生成部104
は、素片データ合成部105、有声音検出部202とデ
ータバスで接続されている。
【0039】また、素片データ合成部105は、音声素
片データ記憶部106、D/A変換器108とデータバ
スで接続され、有声音検出部202はゆらぎ付加無効回
路201、クロック間隔ゆらぎデータ格納部203と、
信号線で接続されており、また、可変クロック発生部2
04は、クロック間隔ゆらぎデータ格納部203とデー
タバス205で有声音検出部202と可変クロック発生
部204と信号線で接続されている。
片データ記憶部106、D/A変換器108とデータバ
スで接続され、有声音検出部202はゆらぎ付加無効回
路201、クロック間隔ゆらぎデータ格納部203と、
信号線で接続されており、また、可変クロック発生部2
04は、クロック間隔ゆらぎデータ格納部203とデー
タバス205で有声音検出部202と可変クロック発生
部204と信号線で接続されている。
【0040】D/A変換器108は、ローパスフィル
タ、アンプからなるアナログ部110を経てスピーカ1
11に信号線で接続されている。
タ、アンプからなるアナログ部110を経てスピーカ1
11に信号線で接続されている。
【0041】すなわち、本実施形態に係る音声合成装置
200は、ディジタル音声波形データをアナログ信号に
変換して音声を合成するD/A変換器108を備えた音
声合成装置に、ゆらぎ付加を無効にするゆらぎ付加無効
回路201と、母音などのピッチ周波数をもつ有声音の
音声素片、及び無声子音や無音部の音声素片を検出する
有声音検出部202と、クロック間隔ゆらぎデータ値を
格納するクロック間隔ゆらぎデータ格納部203と、基
準クロックにクロック間隔ゆらぎデータ値を加えてゆら
ぎを持つクロックを生成し、D/A変換器108に供給
する可変クロック発生部204とが付加された構成とな
っている。
200は、ディジタル音声波形データをアナログ信号に
変換して音声を合成するD/A変換器108を備えた音
声合成装置に、ゆらぎ付加を無効にするゆらぎ付加無効
回路201と、母音などのピッチ周波数をもつ有声音の
音声素片、及び無声子音や無音部の音声素片を検出する
有声音検出部202と、クロック間隔ゆらぎデータ値を
格納するクロック間隔ゆらぎデータ格納部203と、基
準クロックにクロック間隔ゆらぎデータ値を加えてゆら
ぎを持つクロックを生成し、D/A変換器108に供給
する可変クロック発生部204とが付加された構成とな
っている。
【0042】以下、上述のように構成された音声合成装
置200の動作を説明する。
置200の動作を説明する。
【0043】まず、パソコン通信の文章ファイルやフロ
ッピーディスク(FD)内の文章ファイル等のテキスト
データがデータ入力部101のRS232C等の通信ポ
ートやFDDを経て入力され、内部バッファに一時的に
格納され、一定量を超えることによりある単位ごと(例
えば、1文章ごと)に文章解析部102に送られる。
ッピーディスク(FD)内の文章ファイル等のテキスト
データがデータ入力部101のRS232C等の通信ポ
ートやFDDを経て入力され、内部バッファに一時的に
格納され、一定量を超えることによりある単位ごと(例
えば、1文章ごと)に文章解析部102に送られる。
【0044】文章解析部102では、ROMやRAMで
構成された単語辞書格納部103の単語辞書と、そのテ
キストデータを照合しながら読み、アクセント、イント
ネーション、ポーズ等の情報を文字列として記述した音
韻韻律記号を生成し、これを合成パラメータ生成部10
4に送る。
構成された単語辞書格納部103の単語辞書と、そのテ
キストデータを照合しながら読み、アクセント、イント
ネーション、ポーズ等の情報を文字列として記述した音
韻韻律記号を生成し、これを合成パラメータ生成部10
4に送る。
【0045】合成パラメータ生成部104では、この音
韻韻律記号列に基づいて音声素片データ記憶部106に
格納されている音声素片データの位置、各音韻の継続時
間(使用する音声素片の繰り返し数)、声の高さ(使用
する音声素片の繰り返し間隔)、声の強さ(使用する音
声素片の倍率)を決定し、これらの情報からなる合成パ
ラメータを生成して素片データ合成部105に送る。こ
のとき、有声音検出部202へ対して音声素片データの
位置を同時に送る。
韻韻律記号列に基づいて音声素片データ記憶部106に
格納されている音声素片データの位置、各音韻の継続時
間(使用する音声素片の繰り返し数)、声の高さ(使用
する音声素片の繰り返し間隔)、声の強さ(使用する音
声素片の倍率)を決定し、これらの情報からなる合成パ
ラメータを生成して素片データ合成部105に送る。こ
のとき、有声音検出部202へ対して音声素片データの
位置を同時に送る。
【0046】素片データ合成部105では、生成された
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108に送る。
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108に送る。
【0047】また、有声音検出部202では、母音など
のピッチ周波数をもつ有声音の音声素片か、それとも|
p|,|t|,|k|,|s|(||は、音節境界記号
を示す。)のような無声子音や無音部の音声素片かを音
声素片データの位置により決定し、有声音の場合、クロ
ック間隔ゆらぎデータ格納部203に接続された信号線
を“Low”レベル(≒0V)とする。
のピッチ周波数をもつ有声音の音声素片か、それとも|
p|,|t|,|k|,|s|(||は、音節境界記号
を示す。)のような無声子音や無音部の音声素片かを音
声素片データの位置により決定し、有声音の場合、クロ
ック間隔ゆらぎデータ格納部203に接続された信号線
を“Low”レベル(≒0V)とする。
【0048】これによりクロック間隔ゆらぎデータ格納
部203はアクティブとなり、可変クロック発生器20
4は、有声音検出部202と接続された信号線の変動
(この間隔はゆらぎ無しのD/A変換器108の入力す
るクロックfsamp0に等しい)に同期して順次クロック
間隔ゆらぎデータを読み込む。
部203はアクティブとなり、可変クロック発生器20
4は、有声音検出部202と接続された信号線の変動
(この間隔はゆらぎ無しのD/A変換器108の入力す
るクロックfsamp0に等しい)に同期して順次クロック
間隔ゆらぎデータを読み込む。
【0049】また、可変クロック発生器204は、D/
A変換器108に入力するクロック周波数より十分高い
周波数を持つ基準発振器204aを持ち、この基準発振
器204aからの出力をカウンタ204bによって与え
られた分周比で分周して目的とするクロックを生成する
が、基準分周比(この値で分周された周波数はfsamp
0)と、クロック間隔ゆらぎデータ値を加えることでゆ
らぎを持ったクロックの生成を可能としている。
A変換器108に入力するクロック周波数より十分高い
周波数を持つ基準発振器204aを持ち、この基準発振
器204aからの出力をカウンタ204bによって与え
られた分周比で分周して目的とするクロックを生成する
が、基準分周比(この値で分周された周波数はfsamp
0)と、クロック間隔ゆらぎデータ値を加えることでゆ
らぎを持ったクロックの生成を可能としている。
【0050】ここでは上記の構成で分周比を変更してい
るが、PWM(Pulse Width Modulation:パルス幅変
調)タイマを使い、カウンタ値を変動させても同様な出
力が可能である。
るが、PWM(Pulse Width Modulation:パルス幅変
調)タイマを使い、カウンタ値を変動させても同様な出
力が可能である。
【0051】また、無声子音や無音部などの非有声音の
場合、クロック間隔ゆらぎデータ格納部203に接続さ
れた信号線は“High”レベル(≒電源電圧)のまま
である。そのため、クロック間隔ゆらぎデータ格納部2
03は動作しない。また、クロック間隔ゆらぎ格納部2
03と可変クロック発生器204間のデータバス205
は、プルダウン抵抗206によりプルダウン接続されて
おり、通常の出力は“0”となる。そのため可変クロッ
ク発生器204の出力は常に、fsamp0となる。
場合、クロック間隔ゆらぎデータ格納部203に接続さ
れた信号線は“High”レベル(≒電源電圧)のまま
である。そのため、クロック間隔ゆらぎデータ格納部2
03は動作しない。また、クロック間隔ゆらぎ格納部2
03と可変クロック発生器204間のデータバス205
は、プルダウン抵抗206によりプルダウン接続されて
おり、通常の出力は“0”となる。そのため可変クロッ
ク発生器204の出力は常に、fsamp0となる。
【0052】これにより、有声音のデータを、D/A変
換器108から出力する場合、変換のタイミングが毎回
微妙にずれ、アナログ部110を経てスピーカ111か
ら出力される合成音声は微視的な周波数のゆらぎを付与
することが可能となる。また、クロック間隔ゆらぎデー
タに平均値“0”、の正規分布のデータを使用すること
により、ピッチ周波数を殆ど従来例のままで微視的な周
波数のゆらぎを付加することが可能である。
換器108から出力する場合、変換のタイミングが毎回
微妙にずれ、アナログ部110を経てスピーカ111か
ら出力される合成音声は微視的な周波数のゆらぎを付与
することが可能となる。また、クロック間隔ゆらぎデー
タに平均値“0”、の正規分布のデータを使用すること
により、ピッチ周波数を殆ど従来例のままで微視的な周
波数のゆらぎを付加することが可能である。
【0053】図2は有声音のデータを時間軸方向に表し
た特性図であり、従来例との対比で表している。図2に
示すように、有声音のデータを、出力する場合、変換の
タイミングが毎回微妙にずれ、この微妙な時間軸のずれ
が周波数の微妙なずれとなってスピーカ111から出力
される合成音声は微視的な周波数のゆらぎが付与された
ものとなる。
た特性図であり、従来例との対比で表している。図2に
示すように、有声音のデータを、出力する場合、変換の
タイミングが毎回微妙にずれ、この微妙な時間軸のずれ
が周波数の微妙なずれとなってスピーカ111から出力
される合成音声は微視的な周波数のゆらぎが付与された
ものとなる。
【0054】また、本テキスト音声合成装置200で
は、有声音検出部202を備えているため、有声音検出
部202を付加していない従来例に比して有声音以外は
クロック間隔ゆらぎデータ格納部を動作させないため、
低消費電力化が可能である。すなわち、無声子音の音声
素片データは有声音のように1ピッチ分のデータでな
く、そのままの波形データを持つので自然らしさを最初
からそなえているので、ゆらぎを付加する必要がない。
は、有声音検出部202を備えているため、有声音検出
部202を付加していない従来例に比して有声音以外は
クロック間隔ゆらぎデータ格納部を動作させないため、
低消費電力化が可能である。すなわち、無声子音の音声
素片データは有声音のように1ピッチ分のデータでな
く、そのままの波形データを持つので自然らしさを最初
からそなえているので、ゆらぎを付加する必要がない。
【0055】また、留守番電話の応答メッセージなどで
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。そのような
場合、ゆらぎ付加無効回路201のスイッチ201aを
‘オン’するか、または入力されるテキストデータ内に
特殊記号(例えば、“ESC”+“MI”となるコード
列)を付加することにより、有声音検出部202に強制
的に非有声音とする信号を送り、クロック間隔ゆらぎデ
ータ格納部203の動作を禁止することにより、従来の
周波数のゆらぎのない機械的な合成音を合成することが
可能となる。
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。そのような
場合、ゆらぎ付加無効回路201のスイッチ201aを
‘オン’するか、または入力されるテキストデータ内に
特殊記号(例えば、“ESC”+“MI”となるコード
列)を付加することにより、有声音検出部202に強制
的に非有声音とする信号を送り、クロック間隔ゆらぎデ
ータ格納部203の動作を禁止することにより、従来の
周波数のゆらぎのない機械的な合成音を合成することが
可能となる。
【0056】以上説明したように、第1の実施形態に係
る音声合成装置200は、ゆらぎ付加を無効にするゆら
ぎ付加無効回路201と、母音などのピッチ周波数をも
つ有声音の音声素片、及び無声子音や無音部の音声素片
を検出する有声音検出部202と、クロック間隔ゆらぎ
データ値を格納するクロック間隔ゆらぎデータ格納部2
03と、基準クロックにクロック間隔ゆらぎデータ値を
加えてゆらぎを持つクロックを生成し、D/A変換器1
08に供給する可変クロック発生部204とを備え、有
声音の音声素片データを合成時のみ、ゆらぎを持つ値を
クロック間隔ゆらぎデータ格納部203から読み出して
可変クロック発生部204に与えて1クロック毎にクロ
ックの周期にゆらぎを持たせ、可変クロック発生部20
4により生成したクロックをD/A変換器108に供給
し、D/A変換器108が供給されたクロックに基づい
てD/A変換を行なうことにより合成音声の微視的な周
波数のゆらぎを付与するようにしているので、周波数ゆ
らぎの考慮されていない有声音の合成時のみ1クロック
毎にクロック周波数にゆらぎを持たせ、該クロックでD
/A変換を行なうことにより低消費電力で合成音声の微
視的な周波数のゆらぎを付与することが可能という効果
を得ることができる。
る音声合成装置200は、ゆらぎ付加を無効にするゆら
ぎ付加無効回路201と、母音などのピッチ周波数をも
つ有声音の音声素片、及び無声子音や無音部の音声素片
を検出する有声音検出部202と、クロック間隔ゆらぎ
データ値を格納するクロック間隔ゆらぎデータ格納部2
03と、基準クロックにクロック間隔ゆらぎデータ値を
加えてゆらぎを持つクロックを生成し、D/A変換器1
08に供給する可変クロック発生部204とを備え、有
声音の音声素片データを合成時のみ、ゆらぎを持つ値を
クロック間隔ゆらぎデータ格納部203から読み出して
可変クロック発生部204に与えて1クロック毎にクロ
ックの周期にゆらぎを持たせ、可変クロック発生部20
4により生成したクロックをD/A変換器108に供給
し、D/A変換器108が供給されたクロックに基づい
てD/A変換を行なうことにより合成音声の微視的な周
波数のゆらぎを付与するようにしているので、周波数ゆ
らぎの考慮されていない有声音の合成時のみ1クロック
毎にクロック周波数にゆらぎを持たせ、該クロックでD
/A変換を行なうことにより低消費電力で合成音声の微
視的な周波数のゆらぎを付与することが可能という効果
を得ることができる。
【0057】上述した第1の実施形態では、周波数ゆら
ぎがD/A変換器108に入力されるデータごとに変化
するものであったが、音の高さ、すなわちピッチ周波数
のゆらぎについては対応していない。特に、平均値0、
正規分布を持つゆらぎデータではほぼゼロとなってしま
う。そこで、ゆらぎの変化を1ピッチ毎に変化させるこ
とを目的としたのが第2の実施形態である。
ぎがD/A変換器108に入力されるデータごとに変化
するものであったが、音の高さ、すなわちピッチ周波数
のゆらぎについては対応していない。特に、平均値0、
正規分布を持つゆらぎデータではほぼゼロとなってしま
う。そこで、ゆらぎの変化を1ピッチ毎に変化させるこ
とを目的としたのが第2の実施形態である。
【0058】図3は本発明の第2の実施形態に係る音声
合成装置の構成を示すブロック図であり、本実施形態に
係る音声合成装置も、テキストデータを入力とする音声
合成装置に適用した例である。本実施形態に係る音声合
成装置の説明にあたり図1に示す音声合成装置と同一構
成部分には同一符号を付して重複部分の説明を省略す
る。
合成装置の構成を示すブロック図であり、本実施形態に
係る音声合成装置も、テキストデータを入力とする音声
合成装置に適用した例である。本実施形態に係る音声合
成装置の説明にあたり図1に示す音声合成装置と同一構
成部分には同一符号を付して重複部分の説明を省略す
る。
【0059】図3において、テキスト音声合成装置30
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、ピッチ検出部301(ピッチ検
出手段)、クロック間隔ゆらぎデータ格納部203、可
変クロック発生部204、D/A変換器108、アナロ
グ部110及びスピーカ111から構成される。
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、ピッチ検出部301(ピッチ検
出手段)、クロック間隔ゆらぎデータ格納部203、可
変クロック発生部204、D/A変換器108、アナロ
グ部110及びスピーカ111から構成される。
【0060】すなわち、本テキスト音声合成装置300
は、第1の実施形態の有声音検出部202に代えて、有
声音検出部の機能に可変クロック発生部204に接続さ
れる信号の変動タイミングを1ピッチ毎に制御可能とす
る機能を追加したピッチ検出部301を設けた構成とな
っている。
は、第1の実施形態の有声音検出部202に代えて、有
声音検出部の機能に可変クロック発生部204に接続さ
れる信号の変動タイミングを1ピッチ毎に制御可能とす
る機能を追加したピッチ検出部301を設けた構成とな
っている。
【0061】上記ピッチ検出部301は、内部にピッチ
間隔トリガ生成回路302を備え、ピッチ間隔トリガ生
成回路302は、ピッチ周波数f0(n)に基づいてピ
ッチ間隔トリガを生成する。
間隔トリガ生成回路302を備え、ピッチ間隔トリガ生
成回路302は、ピッチ周波数f0(n)に基づいてピ
ッチ間隔トリガを生成する。
【0062】以下、上述のように構成された音声合成装
置300の動作を説明する。
置300の動作を説明する。
【0063】まず、パソコン通信の文章ファイルやFD
内の文章ファイルがデータ入力部101のRS232C
等の通信ポートやFDDを経て入力され、内部バッファ
に一時保持され、一定量を超えることによりある単位
(例えば、1文章)ごとに文章解析部102に送られ
る。
内の文章ファイルがデータ入力部101のRS232C
等の通信ポートやFDDを経て入力され、内部バッファ
に一時保持され、一定量を超えることによりある単位
(例えば、1文章)ごとに文章解析部102に送られ
る。
【0064】文章解析部102では、単語辞書格納部1
03(ROMやRAMで構成)の単語辞書と、そのテキ
ストデータを照合しながら読み、アクセント、イントネ
ーション、ポーズ等の情報を文字列として記述した音韻
韻律記号を生成し、これを合成パラメータ生成部104
に送る。
03(ROMやRAMで構成)の単語辞書と、そのテキ
ストデータを照合しながら読み、アクセント、イントネ
ーション、ポーズ等の情報を文字列として記述した音韻
韻律記号を生成し、これを合成パラメータ生成部104
に送る。
【0065】合成パラメータ生成部104では、この音
韻韻律記号列に基づいて音声素片データ記憶部106に
格納されている音声素片データの位置、各音韻の継続時
間(使用する音声素片の繰り返し数)、声の高さ(使用
する音声素片の繰り返し間隔)、声の強さ(使用する音
声素片の倍率)を決定し、これらの情報からなる合成パ
ラメータを生成し、素片データ合成部105に送る。こ
の時、ピッチ検出部301へ対して音声素片データの位
置を同時に送る。
韻韻律記号列に基づいて音声素片データ記憶部106に
格納されている音声素片データの位置、各音韻の継続時
間(使用する音声素片の繰り返し数)、声の高さ(使用
する音声素片の繰り返し間隔)、声の強さ(使用する音
声素片の倍率)を決定し、これらの情報からなる合成パ
ラメータを生成し、素片データ合成部105に送る。こ
の時、ピッチ検出部301へ対して音声素片データの位
置を同時に送る。
【0066】素片データ合成部105では、生成された
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108に送る。
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108に送る。
【0067】また、ピッチ検出部301では、母音など
のピッチ周波数をもつ有声音の音声素片か、それとも|
p|,|t|,|k|,|s|のような無声子音や無音
部の音声素片かを音声素片データの位置により決定し、
有声音の場合、合成パラメータ生成部104よりピッチ
検出部301へ声の高さ(ピッチ)情報を送り、その次
にクロック間隔ゆらぎデータ格納部203に接続された
信号線を“Low”レベル(≒0V)とする。
のピッチ周波数をもつ有声音の音声素片か、それとも|
p|,|t|,|k|,|s|のような無声子音や無音
部の音声素片かを音声素片データの位置により決定し、
有声音の場合、合成パラメータ生成部104よりピッチ
検出部301へ声の高さ(ピッチ)情報を送り、その次
にクロック間隔ゆらぎデータ格納部203に接続された
信号線を“Low”レベル(≒0V)とする。
【0068】これによりクロック間隔ゆらぎデータ格納
部203はアクティブとなり、可変クロック発生器20
4は、ピッチ検出部301と接続された信号線の変動
(ピッチ間隔トリガ生成回路302により、ピッチ周波
数f0(n)に等しい)に同期して順次クロック間隔ゆ
らぎデータを読み込む。
部203はアクティブとなり、可変クロック発生器20
4は、ピッチ検出部301と接続された信号線の変動
(ピッチ間隔トリガ生成回路302により、ピッチ周波
数f0(n)に等しい)に同期して順次クロック間隔ゆ
らぎデータを読み込む。
【0069】また、可変クロック発生器204はD/A
変換器に入力するクロック周波数より十分高い周波数を
持つ基準発振器204aを持ち、この基準発振器204
aからの出力をカウンタ204bによって与えられた分
周比で分周して目的とするクロックを生成するが、基準
分周比(この値で分周された周波数はfsamp0)と、ク
ロック間隔ゆらぎデータ値を加えることでゆらぎを持っ
たクロックの生成を可能としている。ここでは上記の構
成で分周比を変更しているが、PWMタイマを使い、カ
ウンタ値を変動させても同様な出力が可能である。
変換器に入力するクロック周波数より十分高い周波数を
持つ基準発振器204aを持ち、この基準発振器204
aからの出力をカウンタ204bによって与えられた分
周比で分周して目的とするクロックを生成するが、基準
分周比(この値で分周された周波数はfsamp0)と、ク
ロック間隔ゆらぎデータ値を加えることでゆらぎを持っ
たクロックの生成を可能としている。ここでは上記の構
成で分周比を変更しているが、PWMタイマを使い、カ
ウンタ値を変動させても同様な出力が可能である。
【0070】また、無声子音や無音部などの非有声音の
場合、クロック間隔ゆらぎデータ格納部203に接続さ
れた信号線は“High”レベル(≒電源電圧)のまま
である。そのため、クロック間隔ゆらぎデータ格納部2
03は動作しない。また、クロック間隔ゆらぎ格納部2
03と可変クロック発生器204間のデータバス205
は、プルダウン抵抗206によりプルダウン接続されて
おり、通常の出力は“0”となる。そのため可変クロッ
ク発生器204の出力は常に、fsamp0となる。
場合、クロック間隔ゆらぎデータ格納部203に接続さ
れた信号線は“High”レベル(≒電源電圧)のまま
である。そのため、クロック間隔ゆらぎデータ格納部2
03は動作しない。また、クロック間隔ゆらぎ格納部2
03と可変クロック発生器204間のデータバス205
は、プルダウン抵抗206によりプルダウン接続されて
おり、通常の出力は“0”となる。そのため可変クロッ
ク発生器204の出力は常に、fsamp0となる。
【0071】これにより、有声音のデータをD/A変換
器108から出力する場合、変換のタイミングがピッチ
周波数毎に微妙にずれ、アナログ部110を経てスピー
カ111から出力される合成音声は周波数のゆらぎを付
与することが可能となる。また、クロック間隔ゆらぎデ
ータに平均値“0”、の正規分布のデータを使用するこ
とにより、ピッチ周波数の平均値をほどんど従来のまま
でピッチ周波数のゆらぎと微視的な周波数のゆらぎを付
加することが可能である。
器108から出力する場合、変換のタイミングがピッチ
周波数毎に微妙にずれ、アナログ部110を経てスピー
カ111から出力される合成音声は周波数のゆらぎを付
与することが可能となる。また、クロック間隔ゆらぎデ
ータに平均値“0”、の正規分布のデータを使用するこ
とにより、ピッチ周波数の平均値をほどんど従来のまま
でピッチ周波数のゆらぎと微視的な周波数のゆらぎを付
加することが可能である。
【0072】図4は有声音のデータを時間軸方向に表し
た特性図であり、従来例との対比で表している。図4に
示すように、従来例ではピッチ間隔T0は一定であった
が、本実施形態ではピッチ間隔はT0,T0-nA,T0+nB
と変化し、さらに1ピッチ毎に変化したゆらぎの変化上
に、第1の実施形態と同様に、有声音のデータを、出力
する場合に変換のタイミングが毎回微妙にずれ、この微
妙な時間軸のずれが周波数の微妙なずれとなってスピー
カ111から出力される合成音声は、ピッチ周波数のゆ
らぎを加えた微視的な周波数のゆらぎが付与されたもの
となる。
た特性図であり、従来例との対比で表している。図4に
示すように、従来例ではピッチ間隔T0は一定であった
が、本実施形態ではピッチ間隔はT0,T0-nA,T0+nB
と変化し、さらに1ピッチ毎に変化したゆらぎの変化上
に、第1の実施形態と同様に、有声音のデータを、出力
する場合に変換のタイミングが毎回微妙にずれ、この微
妙な時間軸のずれが周波数の微妙なずれとなってスピー
カ111から出力される合成音声は、ピッチ周波数のゆ
らぎを加えた微視的な周波数のゆらぎが付与されたもの
となる。
【0073】また、ピッチ検出部301を設置している
ためこのピッチ検出部を付加していない場合に比して、
有声音以外はクロック間隔ゆらぎデータ格納部を動作さ
せないため、低消費電力化が可能である。すなわち、無
声子音の音声素片データは有声音のように1ピッチ分の
データでなく、そのままの波形データを持つので自然ら
しさを最初からそなえているので、ゆらぎを付加する必
要がない。
ためこのピッチ検出部を付加していない場合に比して、
有声音以外はクロック間隔ゆらぎデータ格納部を動作さ
せないため、低消費電力化が可能である。すなわち、無
声子音の音声素片データは有声音のように1ピッチ分の
データでなく、そのままの波形データを持つので自然ら
しさを最初からそなえているので、ゆらぎを付加する必
要がない。
【0074】また、留守番電話の応答メッセージなどで
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。その時、ゆ
らぎ付加無効回路313のスイッチ201aを‘オン’
するか、または入力されるテキストデータ内に特殊記号
(例えば、“ESC”+“MI”となるコード列)を付
加することにより、ピッチ検出部301に強制的に非有
声音とする信号を送り、クロック間隔ゆらぎデータ格納
部203の動作を禁止することにより、従来の周波数の
ゆらぎのない機械的な合成音を合成することが可能とな
る。
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。その時、ゆ
らぎ付加無効回路313のスイッチ201aを‘オン’
するか、または入力されるテキストデータ内に特殊記号
(例えば、“ESC”+“MI”となるコード列)を付
加することにより、ピッチ検出部301に強制的に非有
声音とする信号を送り、クロック間隔ゆらぎデータ格納
部203の動作を禁止することにより、従来の周波数の
ゆらぎのない機械的な合成音を合成することが可能とな
る。
【0075】以上説明したように、第2の実施形態に係
る音声合成装置300は、ピッチデータを読み込み、そ
の値をもってピッチ間隔でトリガー信号を生成するピッ
チ間隔トリガ生成回路302を追加したピッチ検出部3
01を有声音検出部202の代わりに設け、1ピッチ毎
にクロックの周期にゆらぎを持たせ、該クロックでD/
A変換を行なうことにより主に合成音声のピッチ周波数
のゆらぎを付加するようにしているので、微視点な周波
数のゆらぎのみならず、ピッチ周波数のゆらぎの実現が
可能という効果を得ることができる。
る音声合成装置300は、ピッチデータを読み込み、そ
の値をもってピッチ間隔でトリガー信号を生成するピッ
チ間隔トリガ生成回路302を追加したピッチ検出部3
01を有声音検出部202の代わりに設け、1ピッチ毎
にクロックの周期にゆらぎを持たせ、該クロックでD/
A変換を行なうことにより主に合成音声のピッチ周波数
のゆらぎを付加するようにしているので、微視点な周波
数のゆらぎのみならず、ピッチ周波数のゆらぎの実現が
可能という効果を得ることができる。
【0076】上述した第2の実施形態では、ゆらぎの変
化を1ピッチ毎に変化させることによりピッチ周波数の
ゆらぎに対応するものであったが微視的な周波数のゆら
ぎについてはピッチ間でゆらぎ方向が同一で、却って自
然性を損なう場合がある。
化を1ピッチ毎に変化させることによりピッチ周波数の
ゆらぎに対応するものであったが微視的な周波数のゆら
ぎについてはピッチ間でゆらぎ方向が同一で、却って自
然性を損なう場合がある。
【0077】そこで、ピッチ間の非音声部分のデータの
みを1ピッチ毎にゆらぎを付加することでピッチ周波数
のゆらぎのみを追加することを目的としたのが第3の実
施形態である。
みを1ピッチ毎にゆらぎを付加することでピッチ周波数
のゆらぎのみを追加することを目的としたのが第3の実
施形態である。
【0078】図5は本発明の第3の実施形態に係る音声
合成装置の構成を示すブロック図であり、本実施形態に
係る音声合成装置も、テキストデータを入力とする音声
合成装置に適用した例である。本実施形態に係る音声合
成装置の説明にあたり図1に示す音声合成装置と同一構
成部分には同一符号を付している。
合成装置の構成を示すブロック図であり、本実施形態に
係る音声合成装置も、テキストデータを入力とする音声
合成装置に適用した例である。本実施形態に係る音声合
成装置の説明にあたり図1に示す音声合成装置と同一構
成部分には同一符号を付している。
【0079】図5において、テキスト音声合成装置40
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、非音声データ検出部401(非
音声データ検出手段)、クロック間隔ゆらぎデータ格納
部203、可変クロック発生部204、D/A変換器1
08、アナログ部110及びスピーカ111から構成さ
れる。
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、非音声データ検出部401(非
音声データ検出手段)、クロック間隔ゆらぎデータ格納
部203、可変クロック発生部204、D/A変換器1
08、アナログ部110及びスピーカ111から構成さ
れる。
【0080】すなわち、本テキスト音声合成装置400
は、第2の実施形態のピッチ検出部301に代えて、ピ
ッチ検出部の機能に素片データ合成部105から出力さ
れるディジタルデータより非音声データ検出する回路を
付加した非音声データ検出部401を設けた構成となっ
ている。
は、第2の実施形態のピッチ検出部301に代えて、ピ
ッチ検出部の機能に素片データ合成部105から出力さ
れるディジタルデータより非音声データ検出する回路を
付加した非音声データ検出部401を設けた構成となっ
ている。
【0081】上記非音声データ検出部401は、内部に
非音声データ検出回路402を備え、非音声データ検出
回路402は、素片データ合成部105から出力される
ディジタルデータより非音声データ検出する。
非音声データ検出回路402を備え、非音声データ検出
回路402は、素片データ合成部105から出力される
ディジタルデータより非音声データ検出する。
【0082】以下、上述のように構成された音声合成装
置400の動作を説明する。
置400の動作を説明する。
【0083】まず、パソコン通信の文章ファイルやFD
内の文章ファイルがデータ入力部101のRS232C
等の通信ポートやFDDを経て入力され、内部バッファ
に一時保持され、一定量を超えることによりある単位
(例えば、1文章)ごとに文章解析部102に送られ
る。
内の文章ファイルがデータ入力部101のRS232C
等の通信ポートやFDDを経て入力され、内部バッファ
に一時保持され、一定量を超えることによりある単位
(例えば、1文章)ごとに文章解析部102に送られ
る。
【0084】文章解析部102では、単語辞書格納部1
03(ROMやRAMで構成)の単語辞書と、そのテキ
ストデータを照合しながら読み、アクセント、イントネ
ーション、ポーズ等の情報を文字列として記述した音韻
韻律記号を生成し、これを合成パラメータ生成部104
に送る。合成パラメータ生成部104では、この音韻韻
律記号列に基づいて音声素片データ記憶部106に格納
されている音声素片データの位置、各音韻の継続時間
(使用する音声素片の繰り返し数)、声の高さ(使用す
る音声素片の繰り返し間隔)、声の強さ(使用する音声
素片の倍率)を決定し、これらの情報からなる合成パラ
メータを生成し素片データ合成部105に送る。この
時、非音声データ検出部401に対して音声素片データ
の位置を同時に送る。
03(ROMやRAMで構成)の単語辞書と、そのテキ
ストデータを照合しながら読み、アクセント、イントネ
ーション、ポーズ等の情報を文字列として記述した音韻
韻律記号を生成し、これを合成パラメータ生成部104
に送る。合成パラメータ生成部104では、この音韻韻
律記号列に基づいて音声素片データ記憶部106に格納
されている音声素片データの位置、各音韻の継続時間
(使用する音声素片の繰り返し数)、声の高さ(使用す
る音声素片の繰り返し間隔)、声の強さ(使用する音声
素片の倍率)を決定し、これらの情報からなる合成パラ
メータを生成し素片データ合成部105に送る。この
時、非音声データ検出部401に対して音声素片データ
の位置を同時に送る。
【0085】素片データ合成部105では、生成された
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108及び非音
声データ検出部401に送る。
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108及び非音
声データ検出部401に送る。
【0086】また、非音声データ検出部101では、母
音などのピッチ周波数をもつ有声音の音声素片か、それ
とも|p|,|t|,|k|,|s|のような無声子音
や無音部の音声素片かを音声データの位置により決定
し、有声音の場合、素片データ合成部より送られてくる
音声波形データより音声データ/非音声データかを判定
する。ここでは波形データの絶対値が閾値より小さくな
った時点で非音声データと判定する。
音などのピッチ周波数をもつ有声音の音声素片か、それ
とも|p|,|t|,|k|,|s|のような無声子音
や無音部の音声素片かを音声データの位置により決定
し、有声音の場合、素片データ合成部より送られてくる
音声波形データより音声データ/非音声データかを判定
する。ここでは波形データの絶対値が閾値より小さくな
った時点で非音声データと判定する。
【0087】まず、音声データの場合、クロック間隔ゆ
らぎデータ格納部203を動作させず(クロック間隔ゆ
らぎデータ格納部203に接続された信号線は“Hig
h”レベルにする)にクロック間隔ゆらぎデータを読み
込むため、非有声音の時と同様、可変クロック発生器2
04の出力は常にfsamp0となる。
らぎデータ格納部203を動作させず(クロック間隔ゆ
らぎデータ格納部203に接続された信号線は“Hig
h”レベルにする)にクロック間隔ゆらぎデータを読み
込むため、非有声音の時と同様、可変クロック発生器2
04の出力は常にfsamp0となる。
【0088】次に、非音声データの場合、クロック間隔
ゆらぎデータ格納部203に接続された信号線を“Lo
w”レベル(≒0V)とし、クロック間隔ゆらぎデータ
格納部203をアクティブとする。
ゆらぎデータ格納部203に接続された信号線を“Lo
w”レベル(≒0V)とし、クロック間隔ゆらぎデータ
格納部203をアクティブとする。
【0089】また同時に、トリガー信号を可変クロック
発生器204に送り、クロック間隔ゆらぎデータを読み
込む。ここで、可変クロック発生器204はD/A変換
器108に入力するクロック周波数より十分高い周波数
を持つ基準発振器204aを持ち、この基準発振器20
4aからの出力をカウンタ204bによって与えられた
分周比で分周して目的とするクロックを生成するが、基
準分周比(この値で分周された周波数はfsamp0)と、
クロック間隔ゆらぎデータ値を加えることでゆらぎを持
ったクロックの生成を可能としている。ここでは上記の
構成で分周比を変更しているが、PWMタイマを使い、
カウンタ値を変動させても同様な出力が可能である。
発生器204に送り、クロック間隔ゆらぎデータを読み
込む。ここで、可変クロック発生器204はD/A変換
器108に入力するクロック周波数より十分高い周波数
を持つ基準発振器204aを持ち、この基準発振器20
4aからの出力をカウンタ204bによって与えられた
分周比で分周して目的とするクロックを生成するが、基
準分周比(この値で分周された周波数はfsamp0)と、
クロック間隔ゆらぎデータ値を加えることでゆらぎを持
ったクロックの生成を可能としている。ここでは上記の
構成で分周比を変更しているが、PWMタイマを使い、
カウンタ値を変動させても同様な出力が可能である。
【0090】また、非有声音の場合、クロック間隔ゆら
ぎデータ格納部203を動作させずにクロック間隔ゆら
ぎデータを読み込むための可変クロック発生器204の
出力は常にfsamp0となる。これにより有声音で、かつ
非音声データをD/A変換器108から出力する場合の
み変換のタイミングが微妙にずれ、アナログ部110を
経てスピーカ111から出力される合成音声はピッチ周
波数のゆらぎのみを付加することが可能となる。
ぎデータ格納部203を動作させずにクロック間隔ゆら
ぎデータを読み込むための可変クロック発生器204の
出力は常にfsamp0となる。これにより有声音で、かつ
非音声データをD/A変換器108から出力する場合の
み変換のタイミングが微妙にずれ、アナログ部110を
経てスピーカ111から出力される合成音声はピッチ周
波数のゆらぎのみを付加することが可能となる。
【0091】図6は有声音のデータを時間軸方向に表し
た特性図であり、従来例との対比で表している。図6に
示すように、1ピッチ分のデータのうち振幅の大きな音
声データ部分n個、振幅の小さな非音声データの部分m
個の場合、振幅の小さな非音声データの部分mにのみに
ついて、前記第2の実施形態と同様にピッチ間隔はT
0,T0-mA,T0+mBと変化し、さらに1ピッチ毎に変化
したゆらぎの変化上に、前記第1の実施形態と同様に、
有声音のデータを、出力する場合に変換のタイミングが
毎回微妙にずれ、この微妙な時間軸のずれが周波数の微
妙なずれとなってスピーカ111から出力される合成音
声は、適切なピッチ周波数のゆらぎを加えた微視的な周
波数のゆらぎが付与されたものとなる。
た特性図であり、従来例との対比で表している。図6に
示すように、1ピッチ分のデータのうち振幅の大きな音
声データ部分n個、振幅の小さな非音声データの部分m
個の場合、振幅の小さな非音声データの部分mにのみに
ついて、前記第2の実施形態と同様にピッチ間隔はT
0,T0-mA,T0+mBと変化し、さらに1ピッチ毎に変化
したゆらぎの変化上に、前記第1の実施形態と同様に、
有声音のデータを、出力する場合に変換のタイミングが
毎回微妙にずれ、この微妙な時間軸のずれが周波数の微
妙なずれとなってスピーカ111から出力される合成音
声は、適切なピッチ周波数のゆらぎを加えた微視的な周
波数のゆらぎが付与されたものとなる。
【0092】また、非音声データ検出部401による有
声音検出部を設置しているためこの有声音検出部を付加
していない場合に比して、有声音以外はクロック間隔ゆ
らぎデータ格納部を動作させないため、低消費電力化が
可能である。すなわち、無声子音の音声素片データは有
声音のように1ピッチ分のデータでなく、そのままの波
形データを持つので、自然らしさを最初からそなえてい
るので、ゆらぎを付加する必要がない。
声音検出部を設置しているためこの有声音検出部を付加
していない場合に比して、有声音以外はクロック間隔ゆ
らぎデータ格納部を動作させないため、低消費電力化が
可能である。すなわち、無声子音の音声素片データは有
声音のように1ピッチ分のデータでなく、そのままの波
形データを持つので、自然らしさを最初からそなえてい
るので、ゆらぎを付加する必要がない。
【0093】また、留守番電話の応答メッセージなどで
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。その時、ゆ
らぎ付加無効回路413のスイッチ201aを‘オン’
するか、または入力されるテキストデータ内に特殊記号
(例えば、“ESC”+“MI”となるコード列)を付
加することにより、有声声検出部101に強制的に非有
声音とする信号を送り、クロック間隔ゆらぎデータ格納
部203の動作を禁止することにより、従来の周波数の
ゆらぎのない機械的な合成音を合成することが可能とな
る。
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。その時、ゆ
らぎ付加無効回路413のスイッチ201aを‘オン’
するか、または入力されるテキストデータ内に特殊記号
(例えば、“ESC”+“MI”となるコード列)を付
加することにより、有声声検出部101に強制的に非有
声音とする信号を送り、クロック間隔ゆらぎデータ格納
部203の動作を禁止することにより、従来の周波数の
ゆらぎのない機械的な合成音を合成することが可能とな
る。
【0094】以上説明したように、第3の実施形態に係
る音声合成装置400は、非音声データ検出する非音声
データ検出する非音声データ検出401を設け、非音声
データ検出部401の出力を可変クロック発生部204
に与えてピッチ間の振幅が所定値より小さい非音声の部
分のみクロックの周期にゆらぎを持たせ、該クロックで
D/A変換を行なうことにより合成音声のピッチ周波数
のゆらぎのみを付加するようにしているので、ピッチ間
のデータのうち、振幅の小さな非音声データの部分のみ
でゆらぎを付加することができ、ピッチ周波数のゆらぎ
のみの実現が可能という効果を得ることができる。
る音声合成装置400は、非音声データ検出する非音声
データ検出する非音声データ検出401を設け、非音声
データ検出部401の出力を可変クロック発生部204
に与えてピッチ間の振幅が所定値より小さい非音声の部
分のみクロックの周期にゆらぎを持たせ、該クロックで
D/A変換を行なうことにより合成音声のピッチ周波数
のゆらぎのみを付加するようにしているので、ピッチ間
のデータのうち、振幅の小さな非音声データの部分のみ
でゆらぎを付加することができ、ピッチ周波数のゆらぎ
のみの実現が可能という効果を得ることができる。
【0095】上述した第2、第3の実施形態では、ピッ
チ周波数が低いほどゆらぎを付加されたデータ数が多い
ため、ピッチ周波数とゆらぎ幅が反比例するという特性
を持っており、却って自然性を損なう場合がある。そこ
で、ピッチ周波数の大きさが変化する毎に、ゆらぎ幅を
倍率を変え、多種のピッチ周波数−ゆらぎ幅特性に対応
することを目的とするのが第4の実施形態である。
チ周波数が低いほどゆらぎを付加されたデータ数が多い
ため、ピッチ周波数とゆらぎ幅が反比例するという特性
を持っており、却って自然性を損なう場合がある。そこ
で、ピッチ周波数の大きさが変化する毎に、ゆらぎ幅を
倍率を変え、多種のピッチ周波数−ゆらぎ幅特性に対応
することを目的とするのが第4の実施形態である。
【0096】図7は本発明の第4の実施形態に係る音声
合成装置の構成を示すブロック図であり、本実施形態に
係る音声合成装置も、テキストデータを入力とする音声
合成装置に適用した例である。本実施形態に係る音声合
成装置の説明にあたり図3に示す第2の実施形態に係る
音声合成装置と同一構成部分には同一符号を付してい
る。
合成装置の構成を示すブロック図であり、本実施形態に
係る音声合成装置も、テキストデータを入力とする音声
合成装置に適用した例である。本実施形態に係る音声合
成装置の説明にあたり図3に示す第2の実施形態に係る
音声合成装置と同一構成部分には同一符号を付してい
る。
【0097】図7において、テキスト音声合成装置50
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、ピッチ検出部501、ピッチ検
出部501内部に設けたピッチ対応ゆらぎ幅変更回路5
02(ピッチ対応ゆらぎ幅変更手段)、倍率変更部50
3(倍率変更手段)、クロック間隔ゆらぎデータ格納部
203、可変クロック発生部204、D/A変換器10
8、アナログ部110及びスピーカ111から構成され
る。
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、ピッチ検出部501、ピッチ検
出部501内部に設けたピッチ対応ゆらぎ幅変更回路5
02(ピッチ対応ゆらぎ幅変更手段)、倍率変更部50
3(倍率変更手段)、クロック間隔ゆらぎデータ格納部
203、可変クロック発生部204、D/A変換器10
8、アナログ部110及びスピーカ111から構成され
る。
【0098】上記ピッチ検出部501は、内部にピッチ
対応ゆらぎ幅変更回路502を備え、ピッチ対応ゆらぎ
幅変更回路502は、ピッチ周波数f0(n)に基づい
てピッチ間隔トリガを生成するとともに、ピッチ対応ゆ
らぎ幅を変更する。
対応ゆらぎ幅変更回路502を備え、ピッチ対応ゆらぎ
幅変更回路502は、ピッチ周波数f0(n)に基づい
てピッチ間隔トリガを生成するとともに、ピッチ対応ゆ
らぎ幅を変更する。
【0099】上記倍率変更部503は、ピッチ周波数の
大きさが変化する毎に、クロック間隔ゆらぎデータ格納
部203から出力されるゆらぎデータのゆらぎ幅を倍率
を変える。
大きさが変化する毎に、クロック間隔ゆらぎデータ格納
部203から出力されるゆらぎデータのゆらぎ幅を倍率
を変える。
【0100】すなわち、本実施形態に係る音声合成装置
500は、第2の実施形態に係る音声合成装置300
に、クロック間隔ゆらぎデータ格納部203と可変クロ
ック発生器204との間に倍率変更部503を追加する
とともに、ピッチ検出部501にピッチ対応ゆらぎ幅変
更回路502を付加し、ピッチ検出部501に追加した
ピッチ対応ゆらぎ幅変更回路502から倍率変更部50
3を制御線504で制御可能に接続された構成となって
いる。
500は、第2の実施形態に係る音声合成装置300
に、クロック間隔ゆらぎデータ格納部203と可変クロ
ック発生器204との間に倍率変更部503を追加する
とともに、ピッチ検出部501にピッチ対応ゆらぎ幅変
更回路502を付加し、ピッチ検出部501に追加した
ピッチ対応ゆらぎ幅変更回路502から倍率変更部50
3を制御線504で制御可能に接続された構成となって
いる。
【0101】以下、上述のように構成された音声合成装
置500の動作を説明する。
置500の動作を説明する。
【0102】まず、パソコン通信の文章ファイルやFD
内の文章ファイルがデータ入力部101のRS232C
等の通信ポートやFDDを経て入力され、内部バッファ
に一時保持され、一定量を超えることによりある単位
(例えば、1文章)ごとに文章解析部102に送られ
る。
内の文章ファイルがデータ入力部101のRS232C
等の通信ポートやFDDを経て入力され、内部バッファ
に一時保持され、一定量を超えることによりある単位
(例えば、1文章)ごとに文章解析部102に送られ
る。
【0103】文章解析部102では、単語辞書格納部1
03(ROMやRAMで構成)の単語辞書と、そのテキ
ストデータを照合しながら読み、アクセント、イントネ
ーション、ポーズ等の情報を文字列として記述した音韻
韻律記号を生成し、これを合成パラメータ生成部104
に送る。合成パラメータ生成部104では、この音韻韻
律記号列に基づいて音声素片データ記憶部106に格納
されている音声素片データの位置、各音韻の継続時間
(使用する音声素片の繰り返し数)、声の高さ(使用す
る音声素片の繰り返し間隔)、声の強さ(使用する音声
素片の倍率)を決定し、これらの情報からなる合成パラ
メータを生成し素片データ合成部105に送る。この
時、ピッチ検出部501へ対して音声素片データの位置
を同時に送る。
03(ROMやRAMで構成)の単語辞書と、そのテキ
ストデータを照合しながら読み、アクセント、イントネ
ーション、ポーズ等の情報を文字列として記述した音韻
韻律記号を生成し、これを合成パラメータ生成部104
に送る。合成パラメータ生成部104では、この音韻韻
律記号列に基づいて音声素片データ記憶部106に格納
されている音声素片データの位置、各音韻の継続時間
(使用する音声素片の繰り返し数)、声の高さ(使用す
る音声素片の繰り返し間隔)、声の強さ(使用する音声
素片の倍率)を決定し、これらの情報からなる合成パラ
メータを生成し素片データ合成部105に送る。この
時、ピッチ検出部501へ対して音声素片データの位置
を同時に送る。
【0104】素片データ合成部105では、生成された
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108に送る。
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108に送る。
【0105】また、ピッチ検出部501では、母音など
のピッチ周波数をもつ有声音の音声素片か、それとも|
p|,|t|,|k|,|s|のような無声子音や無音
部の音声素片かを音声素片データの位置により決定し、
有声音の場合、合成パラメータ生成部104よりピッチ
検出部501へ声の高さ(ピッチ)情報を送り、その次
にクロック間隔ゆらぎデータ格納部203に接続された
信号線を“Low”レベル(≒0V)とする。
のピッチ周波数をもつ有声音の音声素片か、それとも|
p|,|t|,|k|,|s|のような無声子音や無音
部の音声素片かを音声素片データの位置により決定し、
有声音の場合、合成パラメータ生成部104よりピッチ
検出部501へ声の高さ(ピッチ)情報を送り、その次
にクロック間隔ゆらぎデータ格納部203に接続された
信号線を“Low”レベル(≒0V)とする。
【0106】これによりクロック間隔ゆらぎデータ格納
部はアクティブとなり、可変クロック発生器204は、
ピッチ検出部501と接続された信号線の変動(ピッチ
間隔トリガ生成回路により、ピッチ周波数f0(n)に
等しい)に同期して順次クロック間隔ゆらぎデータを読
み込む。この時、ピッチ検出部501のピッチ対応ゆら
ぎ幅変更回路502は、制御線504を通して倍率変更
部503を制御することにより、ピッチ周波数の大きさ
に応じてゆらぎデータ値を変化させている。
部はアクティブとなり、可変クロック発生器204は、
ピッチ検出部501と接続された信号線の変動(ピッチ
間隔トリガ生成回路により、ピッチ周波数f0(n)に
等しい)に同期して順次クロック間隔ゆらぎデータを読
み込む。この時、ピッチ検出部501のピッチ対応ゆら
ぎ幅変更回路502は、制御線504を通して倍率変更
部503を制御することにより、ピッチ周波数の大きさ
に応じてゆらぎデータ値を変化させている。
【0107】図8はゆらぎ幅とピッチ周波数f0との関
係を示す図であり、前記第2、第3実施形態と本実施形
態との対比で表している。図8に示すように、ピッチ周
波数f0により倍率を変更することによってさまざまな
ピッチ周波数−ゆらぎ幅特性に対応可能になる。
係を示す図であり、前記第2、第3実施形態と本実施形
態との対比で表している。図8に示すように、ピッチ周
波数f0により倍率を変更することによってさまざまな
ピッチ周波数−ゆらぎ幅特性に対応可能になる。
【0108】また、可変クロック発生器204はD/A
変換器108に入力するクロック周波数より十分高い周
波数を持つ基準発振器204aを持ち、この基準発振器
204aからの出力をカウンタ204bによって与えら
れた分周比で分周して目的とするクロックを生成する
が、基準分周比(この値で分周された周波数はfsamp
0)と、クロック間隔ゆらぎデータ値を加えることでゆ
らぎを持ったクロックの生成を可能としている。ここで
は上記の構成で分周比を変更しているが、PWMタイマ
を使い、カウンタ値を変動させても同様な出力が可能で
ある。
変換器108に入力するクロック周波数より十分高い周
波数を持つ基準発振器204aを持ち、この基準発振器
204aからの出力をカウンタ204bによって与えら
れた分周比で分周して目的とするクロックを生成する
が、基準分周比(この値で分周された周波数はfsamp
0)と、クロック間隔ゆらぎデータ値を加えることでゆ
らぎを持ったクロックの生成を可能としている。ここで
は上記の構成で分周比を変更しているが、PWMタイマ
を使い、カウンタ値を変動させても同様な出力が可能で
ある。
【0109】また、無声子音や無音部などの非有声音の
場合、クロック間隔ゆらぎデータ格納部203に接続さ
れた信号線は“High”レベル(≒電源電圧)のまま
である。そのため、クロック間隔ゆらぎデータ格納部2
03は動作しない。
場合、クロック間隔ゆらぎデータ格納部203に接続さ
れた信号線は“High”レベル(≒電源電圧)のまま
である。そのため、クロック間隔ゆらぎデータ格納部2
03は動作しない。
【0110】また、クロック間隔ゆらぎ格納部203と
倍率変更部503間のデータバス205は、プルダウン
抵抗206によりプルダウン接続されており、通常の出
力は“0”となる。そのため可変クロック発生器204
の出力は常に、fsamp0となる。
倍率変更部503間のデータバス205は、プルダウン
抵抗206によりプルダウン接続されており、通常の出
力は“0”となる。そのため可変クロック発生器204
の出力は常に、fsamp0となる。
【0111】これにより、有声音のデータをD/A変換
器108から出力する場合、変換のタイミングがピッチ
周波数毎で、しかもピッチ周波数の大きさによりゆらぎ
幅が変化しながら微妙にずれ、アナログ部110を経て
スピーカ111から出力される合成音声は周波数のゆら
ぎを付与することが可能となる。また、クロック間隔ゆ
らぎデータに平均値“0”、の正規分布のデータを使用
することにより、ピッチ周波数の平均値をほどんど従来
例のままでピッチ周波数のゆらぎと微視的な周波数のゆ
らぎを付加することが可能である。
器108から出力する場合、変換のタイミングがピッチ
周波数毎で、しかもピッチ周波数の大きさによりゆらぎ
幅が変化しながら微妙にずれ、アナログ部110を経て
スピーカ111から出力される合成音声は周波数のゆら
ぎを付与することが可能となる。また、クロック間隔ゆ
らぎデータに平均値“0”、の正規分布のデータを使用
することにより、ピッチ周波数の平均値をほどんど従来
例のままでピッチ周波数のゆらぎと微視的な周波数のゆ
らぎを付加することが可能である。
【0112】さらに、有声音検出部を付加していない場
合よりも、有声音以外はクロック間隔ゆらぎデータ格納
部を動作させないため、低消費電力化が可能である。す
なわち、無声子音の音声素片データは有声音のように1
ピッチ分のデータでなく、そのままの波形データを持つ
ので自然らしさを最初からそなえているので、ゆらぎを
付加する必要がない。
合よりも、有声音以外はクロック間隔ゆらぎデータ格納
部を動作させないため、低消費電力化が可能である。す
なわち、無声子音の音声素片データは有声音のように1
ピッチ分のデータでなく、そのままの波形データを持つ
ので自然らしさを最初からそなえているので、ゆらぎを
付加する必要がない。
【0113】また、留守番電話の応答メッセージなどで
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。その時、ゆ
らぎ付加無効回路514のスイッチ201aを‘オン’
するか、または入力されるテキストデータ内に特殊記号
(例えば、“ESC”+“MI”となるコード列)を付
加することにより、ピッチ検出部501に強制的に非有
声音とする信号を送り、クロック間隔ゆらぎデータ格納
部203の動作を禁止することにより、従来の周波数の
ゆらぎのない機械的な合成音を合成することが可能とな
る。
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。その時、ゆ
らぎ付加無効回路514のスイッチ201aを‘オン’
するか、または入力されるテキストデータ内に特殊記号
(例えば、“ESC”+“MI”となるコード列)を付
加することにより、ピッチ検出部501に強制的に非有
声音とする信号を送り、クロック間隔ゆらぎデータ格納
部203の動作を禁止することにより、従来の周波数の
ゆらぎのない機械的な合成音を合成することが可能とな
る。
【0114】以上説明したように、第4の実施形態に係
る音声合成装置500は、ピッチ周波数の大きさが変化
する毎にピッチ対応ゆらぎ幅を変更するピッチ対応ゆら
ぎ幅変更回路502と、ピッチ対応ゆらぎ幅変更手段の
出力に基づいてクロック間隔ゆらぎデータ格納手段から
出力されるゆらぎデータのゆらぎ幅の倍率を変える倍率
変更部503とを設け、ゆらぎ幅を可変してピッチ周波
数とゆらぎ幅が反比例する特性を防止するようにしてい
るので、多種のピッチ周波数−ゆらぎ幅特性に対応する
ことが可能という効果を得ることができる。
る音声合成装置500は、ピッチ周波数の大きさが変化
する毎にピッチ対応ゆらぎ幅を変更するピッチ対応ゆら
ぎ幅変更回路502と、ピッチ対応ゆらぎ幅変更手段の
出力に基づいてクロック間隔ゆらぎデータ格納手段から
出力されるゆらぎデータのゆらぎ幅の倍率を変える倍率
変更部503とを設け、ゆらぎ幅を可変してピッチ周波
数とゆらぎ幅が反比例する特性を防止するようにしてい
るので、多種のピッチ周波数−ゆらぎ幅特性に対応する
ことが可能という効果を得ることができる。
【0115】上述した第2〜第4の実施形態では、ピッ
チ周波数の変動方向(例えば、ピッチが徐々に低くなる
など)に関係なくゆらぎのパターンは常に一様であっ
た。そのため、自然性を損なう場合が考えられる。そこ
で、クロック間隔ゆらぎデータを複数パタン持ち、ピッ
チ変動方向によって使用するゆらぎデータを選択するこ
とにより、より自然な合成音を出力することを目的とし
たのが第5の実施形態である。
チ周波数の変動方向(例えば、ピッチが徐々に低くなる
など)に関係なくゆらぎのパターンは常に一様であっ
た。そのため、自然性を損なう場合が考えられる。そこ
で、クロック間隔ゆらぎデータを複数パタン持ち、ピッ
チ変動方向によって使用するゆらぎデータを選択するこ
とにより、より自然な合成音を出力することを目的とし
たのが第5の実施形態である。
【0116】図9は本発明の第5の実施形態に係る音声
合成装置の構成を示すブロック図であり、本実施形態に
係る音声合成装置も、テキストデータを入力とする音声
合成装置に適用した例である。本実施形態に係る音声合
成装置の説明にあたり図3に示す第2の実施形態に係る
音声合成装置と同一構成部分には同一符号を付してい
る。
合成装置の構成を示すブロック図であり、本実施形態に
係る音声合成装置も、テキストデータを入力とする音声
合成装置に適用した例である。本実施形態に係る音声合
成装置の説明にあたり図3に示す第2の実施形態に係る
音声合成装置と同一構成部分には同一符号を付してい
る。
【0117】図9において、テキスト音声合成装置60
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、ピッチ変動検出部601、ピッ
チ検出部601内部に設けたピッチ変動方向検出回路6
02(ピッチ変動方向検出手段)、クロック間隔ゆらぎ
データ格納部203、可変クロック発生部204、D/
A変換器108、アナログ部110及びスピーカ111
から構成される。
0は、データ入力部101、文章解析部102、単語辞
書記憶部103、合成パラメータ生成部104、素片デ
ータ合成部105、音声素片データ格納部106、ゆら
ぎ付加無効回路201、ピッチ変動検出部601、ピッ
チ検出部601内部に設けたピッチ変動方向検出回路6
02(ピッチ変動方向検出手段)、クロック間隔ゆらぎ
データ格納部203、可変クロック発生部204、D/
A変換器108、アナログ部110及びスピーカ111
から構成される。
【0118】上記ピッチ変動検出部601は、内部にピ
ッチ変動方向検出回路602を備え、ピッチ変動方向検
出回路602は、ピッチ周波数f0(n)に基づいてピ
ッチ間隔トリガを生成するとともに、ピッチの変動方向
に応じてゆらぎデータのパタンを選択する。
ッチ変動方向検出回路602を備え、ピッチ変動方向検
出回路602は、ピッチ周波数f0(n)に基づいてピ
ッチ間隔トリガを生成するとともに、ピッチの変動方向
に応じてゆらぎデータのパタンを選択する。
【0119】すなわち、本実施形態に係る音声合成装置
600は、第2の実施形態に係る音声合成装置300
に、ピッチ変動検出部601の機能にピッチの変動方向
に応じてゆらぎデータのパタンを選択するピッチ変動方
向検出回路602を設けた構成となっている。
600は、第2の実施形態に係る音声合成装置300
に、ピッチ変動検出部601の機能にピッチの変動方向
に応じてゆらぎデータのパタンを選択するピッチ変動方
向検出回路602を設けた構成となっている。
【0120】以下、上述のように構成された音声合成装
置600の動作を説明する。
置600の動作を説明する。
【0121】まず、パソコン通信の文章ファイルやFD
内の文章ファイルがデータ入力部601のRS232C
等の通信ポートやFDDを経て入力され、内部バッファ
に一時保持され、一定量を超えることによりある単位
(例えば、1文章)ごとに文章解析部102に送られ
る。
内の文章ファイルがデータ入力部601のRS232C
等の通信ポートやFDDを経て入力され、内部バッファ
に一時保持され、一定量を超えることによりある単位
(例えば、1文章)ごとに文章解析部102に送られ
る。
【0122】文章解析部102では、単語辞書格納部1
03(ROMやRAMで構成)の単語辞書と、そのテキ
ストデータを照合しながら読み、アクセント、イントネ
ーション、ポーズ等の情報を文字列として記述した音韻
韻律記号を生成し、これを合成パラメータ生成部104
に送る。合成パラメータ生成部104では、この音韻韻
律記号列に基づいて音声素片データ記憶部106に格納
されている音声素片データの位置、各音韻の継続時間
(使用する音声素片の繰り返し数)、声の高さ(使用す
る音声素片の繰り返し間隔)、声の強さ(使用する音声
素の片倍率)を決定し、これらの情報からなる合成パラ
メータを生成し、素片データ合成部105に送る。この
時、ピッチ変動検出部601へ対して音声素片データの
位置を同時に送る。
03(ROMやRAMで構成)の単語辞書と、そのテキ
ストデータを照合しながら読み、アクセント、イントネ
ーション、ポーズ等の情報を文字列として記述した音韻
韻律記号を生成し、これを合成パラメータ生成部104
に送る。合成パラメータ生成部104では、この音韻韻
律記号列に基づいて音声素片データ記憶部106に格納
されている音声素片データの位置、各音韻の継続時間
(使用する音声素片の繰り返し数)、声の高さ(使用す
る音声素片の繰り返し間隔)、声の強さ(使用する音声
素の片倍率)を決定し、これらの情報からなる合成パラ
メータを生成し、素片データ合成部105に送る。この
時、ピッチ変動検出部601へ対して音声素片データの
位置を同時に送る。
【0123】素片データ合成部105では、生成された
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108に送る。
合成パラメータに基づいて、音声素片データ記憶部10
6より使用する音声素片データを読み込みながら音声波
形データを生成し、これをD/A変換器108に送る。
【0124】また、ピッチ変動検出部601では、母音
などのピッチ周波数をもつ有声音の音声素片か、それと
も|p|,|t|,|k|,|s|のような無声子音や
無音部の音声素片かを音声素片データの位置により決定
し、有声音の場合、合成パラメータ生成部104よりピ
ッチ変動方向検出回路602に声の高さ(ピッチ)情報
を送り、その次にクロック間隔ゆらぎデータ格納部20
3に接続された信号線のうち、以前のピッチとの差分に
より、ピッチ変動方向を検出し、それに対応するパタン
に接続される1つを“Low”レベル(≒0V)とす
る。
などのピッチ周波数をもつ有声音の音声素片か、それと
も|p|,|t|,|k|,|s|のような無声子音や
無音部の音声素片かを音声素片データの位置により決定
し、有声音の場合、合成パラメータ生成部104よりピ
ッチ変動方向検出回路602に声の高さ(ピッチ)情報
を送り、その次にクロック間隔ゆらぎデータ格納部20
3に接続された信号線のうち、以前のピッチとの差分に
より、ピッチ変動方向を検出し、それに対応するパタン
に接続される1つを“Low”レベル(≒0V)とす
る。
【0125】これによりクロック間隔ゆらぎデータ格納
部の1部分のみがアクティブとなり、可変クロック発生
器204は、ピッチ変動検出部601と接続された信号
線の変動(ピッチ間隔トリガ生成回路により、ピッチ周
波数f0(n)に等しい)に同期して順次クロック間隔
ゆらぎデータを読み込む。
部の1部分のみがアクティブとなり、可変クロック発生
器204は、ピッチ変動検出部601と接続された信号
線の変動(ピッチ間隔トリガ生成回路により、ピッチ周
波数f0(n)に等しい)に同期して順次クロック間隔
ゆらぎデータを読み込む。
【0126】図10はピッチ周波数f0を時間軸方向に
表した特性図であり、前記第2〜第4実施形態と本実施
形態との対比で表している。図10に示すように、本実
施形態ではピッチ変動方向検出回路602によりピッチ
変動方向を検出し、ピッチの変動方向に応じてゆらぎ幅
が変えるようにしている。例えば、図10ハッチング部
に示すように、前記第2〜第4実施形態では音声のピッ
チパタンとゆらぎ幅は、ピッチの変動方向Δfh,Δfl
によらず均等であったが、本実施形態では変動方向Δf
h<Δfl、Δfh>Δflによってゆらぎ幅が異なり、多
重のゆらぎ特性に対応することが可能になる。
表した特性図であり、前記第2〜第4実施形態と本実施
形態との対比で表している。図10に示すように、本実
施形態ではピッチ変動方向検出回路602によりピッチ
変動方向を検出し、ピッチの変動方向に応じてゆらぎ幅
が変えるようにしている。例えば、図10ハッチング部
に示すように、前記第2〜第4実施形態では音声のピッ
チパタンとゆらぎ幅は、ピッチの変動方向Δfh,Δfl
によらず均等であったが、本実施形態では変動方向Δf
h<Δfl、Δfh>Δflによってゆらぎ幅が異なり、多
重のゆらぎ特性に対応することが可能になる。
【0127】また、可変クロック発生器204はD/A
変換器108に入力するクロック周波数より十分高い周
波数を持つ基準発振器204aを持ち、この基準発振器
204aからの出力をカウンタ204bによって与えら
れた分周比で分周して目的とするクロックを生成する
が、基準分周比(この値で分周された周波数はfsamp
0)と、クロック間隔ゆらぎデータ値を加えることでゆ
らぎを持ったクロックの生成を可能としている。ここで
は上記の構成で分周比を変更しているが、PWMタイマ
を使い、カウンタ値を変動させても同様な出力が可能で
ある。
変換器108に入力するクロック周波数より十分高い周
波数を持つ基準発振器204aを持ち、この基準発振器
204aからの出力をカウンタ204bによって与えら
れた分周比で分周して目的とするクロックを生成する
が、基準分周比(この値で分周された周波数はfsamp
0)と、クロック間隔ゆらぎデータ値を加えることでゆ
らぎを持ったクロックの生成を可能としている。ここで
は上記の構成で分周比を変更しているが、PWMタイマ
を使い、カウンタ値を変動させても同様な出力が可能で
ある。
【0128】また、無声子音や無音部などの非有声音の
場合、クロック間隔ゆらぎデータ格納部203に接続さ
れた信号線は“High”レベル(≒電源電圧)のまま
である。そのため、クロック間隔ゆらぎデータ格納部2
03は動作しない。また、クロック間隔ゆらぎ格納部2
03と可変クロック発生器204間のデータバス205
は、プルダウン抵抗206によりプルダウン接続されて
おり、通常の出力は“0”となる。そのため可変クロッ
ク発生器204の出力は常に、fsamp0となる。
場合、クロック間隔ゆらぎデータ格納部203に接続さ
れた信号線は“High”レベル(≒電源電圧)のまま
である。そのため、クロック間隔ゆらぎデータ格納部2
03は動作しない。また、クロック間隔ゆらぎ格納部2
03と可変クロック発生器204間のデータバス205
は、プルダウン抵抗206によりプルダウン接続されて
おり、通常の出力は“0”となる。そのため可変クロッ
ク発生器204の出力は常に、fsamp0となる。
【0129】これにより、有声音のデータをD/A変換
器108から出力する場合、変換のタイミングがピッチ
周波数毎に、かつピッチの変動方向に応じて異なったパ
タンで微妙にずれ、アナログ部110を経てスピーカ1
11から出力される合成音声は周波数のゆらぎを付与す
ることが可能となる。
器108から出力する場合、変換のタイミングがピッチ
周波数毎に、かつピッチの変動方向に応じて異なったパ
タンで微妙にずれ、アナログ部110を経てスピーカ1
11から出力される合成音声は周波数のゆらぎを付与す
ることが可能となる。
【0130】さらに、ピッチ変動検出部を付加していな
い場合よりも、有声音以外はクロック間隔ゆらぎデータ
格納部を動作させないため、低消費電力化が可能であ
る。すなわち無声子音の音声素片データは有声音のよう
に1ピッチ分のデータでなく、そのままの波形データを
持つので自然らしさを最初からそなえているので、ゆら
ぎを付加する必要がない。
い場合よりも、有声音以外はクロック間隔ゆらぎデータ
格納部を動作させないため、低消費電力化が可能であ
る。すなわち無声子音の音声素片データは有声音のよう
に1ピッチ分のデータでなく、そのままの波形データを
持つので自然らしさを最初からそなえているので、ゆら
ぎを付加する必要がない。
【0131】また、留守番電話の応答メッセージなどで
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。その時、ゆ
らぎ付加無効回路613のスイッチ201aを‘オン’
するか、または入力されるテキストデータ内に特殊記号
(例えば、“ESC”+“MI”となるコード列)を付
加することにより、ピッチ変動検出部601に強制的に
非有声音とする信号を送り、クロック間隔ゆらぎデータ
格納部203の動作を禁止することにより、従来の周波
数のゆらぎのない機械的な合成音を合成することが可能
となる。
は、一聞で留守番電話であるとわかる機械的な声の方が
使用者を驚かさず、使いやすい場合がある。その時、ゆ
らぎ付加無効回路613のスイッチ201aを‘オン’
するか、または入力されるテキストデータ内に特殊記号
(例えば、“ESC”+“MI”となるコード列)を付
加することにより、ピッチ変動検出部601に強制的に
非有声音とする信号を送り、クロック間隔ゆらぎデータ
格納部203の動作を禁止することにより、従来の周波
数のゆらぎのない機械的な合成音を合成することが可能
となる。
【0132】以上説明したように、第5の実施形態に係
る音声合成装置600は、クロック間隔ゆらぎデータ格
納部203にピッチの変動方向に応じたゆらぎデータの
パタンを複数格納するとともに、ピッチ変動検出部60
1にピッチ周波数の変動方向を検出するピッチ変動方向
検出回路602を設けているので、ピッチの変動方向に
応じて使用するゆらぎデータを選択することにより、大
局的なピッチ周波数の変化に応じた多重のゆらぎ特性に
対応することが可能という効果を得ることができる。
る音声合成装置600は、クロック間隔ゆらぎデータ格
納部203にピッチの変動方向に応じたゆらぎデータの
パタンを複数格納するとともに、ピッチ変動検出部60
1にピッチ周波数の変動方向を検出するピッチ変動方向
検出回路602を設けているので、ピッチの変動方向に
応じて使用するゆらぎデータを選択することにより、大
局的なピッチ周波数の変化に応じた多重のゆらぎ特性に
対応することが可能という効果を得ることができる。
【0133】なお、上記各実施形態に係る音声合成装置
では、テキストデータを入力とする音声合成装置に全て
適用することができるが、ディジタル音声波形データを
アナログ信号に変換して音声を合成する音声合成装置ど
のようなものでもよく、各種端末に組み込まれる回路の
一部であってもよい。
では、テキストデータを入力とする音声合成装置に全て
適用することができるが、ディジタル音声波形データを
アナログ信号に変換して音声を合成する音声合成装置ど
のようなものでもよく、各種端末に組み込まれる回路の
一部であってもよい。
【0134】また、上記各実施形態に係る音声合成装置
を構成するD/A変換器108や各種回路の数、種類接
続状態などは前述した上述の各実施形態に限られないこ
とは言うまでもない。
を構成するD/A変換器108や各種回路の数、種類接
続状態などは前述した上述の各実施形態に限られないこ
とは言うまでもない。
【0135】
【発明の効果】本発明に係る音声合成装置では、母音な
どのピッチ周波数をもつ有声音の音声素片、及び無声子
音や無音部の音声素片を検出する有声音検出手段と、ク
ロック間隔ゆらぎデータ値を格納するクロック間隔ゆら
ぎデータ格納手段と、基準クロックにクロック間隔ゆら
ぎデータ値を加えてゆらぎを持つクロックを生成し、D
/A変換器に供給する可変クロック発生手段とを備えて
構成しているので、低消費電力で合成音声の微視的な周
波数のゆらぎを付与することができる。
どのピッチ周波数をもつ有声音の音声素片、及び無声子
音や無音部の音声素片を検出する有声音検出手段と、ク
ロック間隔ゆらぎデータ値を格納するクロック間隔ゆら
ぎデータ格納手段と、基準クロックにクロック間隔ゆら
ぎデータ値を加えてゆらぎを持つクロックを生成し、D
/A変換器に供給する可変クロック発生手段とを備えて
構成しているので、低消費電力で合成音声の微視的な周
波数のゆらぎを付与することができる。
【0136】また、本発明に係る音声合成装置では、可
変クロック発生手段に接続される信号の変動タイミング
を1ピッチ毎に制御するピッチ検出手段を備え、ピッチ
検出手段の出力を可変クロック発生手段に与えて1ピッ
チ毎にクロックの周期にゆらぎを持たせ、該クロックで
D/A変換を行なうことにより主に合成音声のピッチ周
波数のゆらぎを付加するように構成しているので、微視
点な周波数のゆらぎのみならず、ピッチ周波数のゆらぎ
の実現が可能という効果を得ることができる。
変クロック発生手段に接続される信号の変動タイミング
を1ピッチ毎に制御するピッチ検出手段を備え、ピッチ
検出手段の出力を可変クロック発生手段に与えて1ピッ
チ毎にクロックの周期にゆらぎを持たせ、該クロックで
D/A変換を行なうことにより主に合成音声のピッチ周
波数のゆらぎを付加するように構成しているので、微視
点な周波数のゆらぎのみならず、ピッチ周波数のゆらぎ
の実現が可能という効果を得ることができる。
【0137】また、本発明に係る音声合成装置では、非
音声データ検出する非音声データ検出手段を備え、非音
声データ検出手段の出力を可変クロック発生手段に与え
てピッチ間の振幅が所定値より小さい非音声の部分のみ
クロックの周期にゆらぎを持たせ、該クロックでD/A
変換を行なうことにより合成音声のピッチ周波数のゆら
ぎのみを付加するように構成しているので、ピッチ間の
データのうち、振幅の小さな非音声データの部分のみで
ゆらぎを付加することができ、ピッチ周波数のゆらぎの
みの実現が可能という効果を得ることができる。
音声データ検出する非音声データ検出手段を備え、非音
声データ検出手段の出力を可変クロック発生手段に与え
てピッチ間の振幅が所定値より小さい非音声の部分のみ
クロックの周期にゆらぎを持たせ、該クロックでD/A
変換を行なうことにより合成音声のピッチ周波数のゆら
ぎのみを付加するように構成しているので、ピッチ間の
データのうち、振幅の小さな非音声データの部分のみで
ゆらぎを付加することができ、ピッチ周波数のゆらぎの
みの実現が可能という効果を得ることができる。
【0138】また、本発明に係る音声合成装置では、ピ
ッチ周波数の大きさが変化する毎にピッチ対応ゆらぎ幅
を変更するピッチ対応ゆらぎ幅変更手段と、ピッチ対応
ゆらぎ幅変更手段の出力に基づいてクロック間隔ゆらぎ
データ格納手段から出力されるゆらぎデータのゆらぎ幅
の倍率を変える倍率変更手段とを備え、ゆらぎ幅を可変
してピッチ周波数とゆらぎ幅が反比例する特性を防止し
て多種のゆらぎ特性に対応するように構成しているの
で、多種のピッチ周波数−ゆらぎ幅特性に対応すること
が可能という効果を得ることができる。
ッチ周波数の大きさが変化する毎にピッチ対応ゆらぎ幅
を変更するピッチ対応ゆらぎ幅変更手段と、ピッチ対応
ゆらぎ幅変更手段の出力に基づいてクロック間隔ゆらぎ
データ格納手段から出力されるゆらぎデータのゆらぎ幅
の倍率を変える倍率変更手段とを備え、ゆらぎ幅を可変
してピッチ周波数とゆらぎ幅が反比例する特性を防止し
て多種のゆらぎ特性に対応するように構成しているの
で、多種のピッチ周波数−ゆらぎ幅特性に対応すること
が可能という効果を得ることができる。
【0139】また、本発明に係る音声合成装置では、ク
ロック間隔ゆらぎデータ格納手段は、ピッチの変動方向
に応じたゆらぎデータのパタンを複数格納し、ピッチ周
波数の変動方向を検出するピッチ変動方向検出手段を備
え、ピッチ変動方向検出手段の出力に基づいてクロック
間隔ゆらぎデータ格納手段に格納されたクロック間隔ゆ
らぎデータパタンを、ピッチ変動方向によって選択使用
して大局的なピッチ周波数の変化に応じた多種のゆらぎ
特性に対応するように構成しているので、大局的なピッ
チ周波数の変化に応じた多重のゆらぎ特性に対応するこ
とが可能という効果を得ることができる。
ロック間隔ゆらぎデータ格納手段は、ピッチの変動方向
に応じたゆらぎデータのパタンを複数格納し、ピッチ周
波数の変動方向を検出するピッチ変動方向検出手段を備
え、ピッチ変動方向検出手段の出力に基づいてクロック
間隔ゆらぎデータ格納手段に格納されたクロック間隔ゆ
らぎデータパタンを、ピッチ変動方向によって選択使用
して大局的なピッチ周波数の変化に応じた多種のゆらぎ
特性に対応するように構成しているので、大局的なピッ
チ周波数の変化に応じた多重のゆらぎ特性に対応するこ
とが可能という効果を得ることができる。
【図1】本発明を適用した第1の実施形態に係る音声合
成装置の構成を示すブロック図である。
成装置の構成を示すブロック図である。
【図2】上記音声合成装置の有声音のデータを時間軸方
向に表した特性図である。
向に表した特性図である。
【図3】本発明を適用した第2の実施形態に係る音声合
成装置の構成を示すブロック図である。
成装置の構成を示すブロック図である。
【図4】上記音声合成装置の有声音のデータを時間軸方
向に表した特性図である。
向に表した特性図である。
【図5】本発明を適用した第3の実施形態に係る音声合
成装置の構成を示すブロック図である。
成装置の構成を示すブロック図である。
【図6】上記音声合成装置の有声音のデータを時間軸方
向に表した特性図である。
向に表した特性図である。
【図7】本発明を適用した第4の実施形態に係る音声合
成装置の構成を示すブロック図である。
成装置の構成を示すブロック図である。
【図8】上記音声合成装置のゆらぎ幅とピッチ周波数f
0との関係を示す図である。
0との関係を示す図である。
【図9】本発明を適用した第5の実施形態に係る音声合
成装置の構成を示すブロック図である。
成装置の構成を示すブロック図である。
【図10】上記音声合成装置のピッチ周波数f0を時間
軸方向に表した特性図である。
軸方向に表した特性図である。
【図11】従来の音声合成装置の構成を示すブロック図
である。
である。
200,300,400,500,600 テキスト音
声合成装置、101データ入力部、102 文章解析
部、103 単語辞書記憶部、104 合成パラメータ
生成部、105 素片データ合成部、106 音声素片
データ格納部、108 D/A変換器、110 アナロ
グ部、111 スピーカ、201 ゆらぎ付加無効回
路、202 有声音検出部(有声音検出手段)、203
クロック間隔ゆらぎデータ格納部(クロック間隔ゆら
ぎデータ格納手段)、204 可変クロック発生部(可
変クロック発生手段)、205 データバス、301,
501 ピッチ検出部(ピッチ検出手段)、401 非
音声データ検出部(非音声データ検出手段)、502
ピッチ対応ゆらぎ幅変更回路(ピッチ対応ゆらぎ幅変更
手段)、503 倍率変更部(倍率変更手段)、601
ピッチ変動検出部、602 ピッチ変動方向検出回路
(ピッチ変動方向検出手段)
声合成装置、101データ入力部、102 文章解析
部、103 単語辞書記憶部、104 合成パラメータ
生成部、105 素片データ合成部、106 音声素片
データ格納部、108 D/A変換器、110 アナロ
グ部、111 スピーカ、201 ゆらぎ付加無効回
路、202 有声音検出部(有声音検出手段)、203
クロック間隔ゆらぎデータ格納部(クロック間隔ゆら
ぎデータ格納手段)、204 可変クロック発生部(可
変クロック発生手段)、205 データバス、301,
501 ピッチ検出部(ピッチ検出手段)、401 非
音声データ検出部(非音声データ検出手段)、502
ピッチ対応ゆらぎ幅変更回路(ピッチ対応ゆらぎ幅変更
手段)、503 倍率変更部(倍率変更手段)、601
ピッチ変動検出部、602 ピッチ変動方向検出回路
(ピッチ変動方向検出手段)
Claims (10)
- 【請求項1】 所定クロック信号のタイミングでディジ
タル音声波形データをアナログ信号に変換して音声を合
成するD/A変換器を備えた音声合成装置において、 母音などのピッチ周波数をもつ有声音の音声素片、及び
無声子音や無音部の音声素片を検出する有声音検出手段
と、 クロック間隔ゆらぎデータ値を格納するクロック間隔ゆ
らぎデータ格納手段と、 基準クロックに前記クロック間隔ゆらぎデータ値を加え
てゆらぎを持つクロックを生成し、前記D/A変換器に
供給する可変クロック発生手段とを備えたことを特徴と
する音声合成装置。 - 【請求項2】 上記請求項1記載の音声合成装置におい
て、 有声音の音声素片データを合成時のみ、ゆらぎを持つ値
を前記クロック間隔ゆらぎデータ格納手段から読み出し
て前記可変クロック発生手段に与えて1クロック毎にク
ロックの周期にゆらぎを持たせ、該可変クロック発生手
段により生成したクロックを前記D/A変換器に供給
し、該D/A変換器が該クロックに基づいてD/A変換
を行なうことにより合成音声の微視的な周波数のゆらぎ
を付与することを特徴とする音声合成装置。 - 【請求項3】 さらに、上記請求項1記載の音声合成装
置において、 前記可変クロック発生手段に接続される信号の変動タイ
ミングを1ピッチ毎に制御するピッチ検出手段を備え、 前記ピッチ検出手段の出力を前記可変クロック発生手段
に与えて1ピッチ毎にクロックの周期にゆらぎを持た
せ、該クロックでD/A変換を行なうことにより主に合
成音声のピッチ周波数のゆらぎを付加することを特徴と
する音声合成装置。 - 【請求項4】 さらに、上記請求項1記載の音声合成装
置において、 非音声データ検出する非音声データ検出手段を備え、 前記非音声データ検出手段の出力を前記可変クロック発
生手段に与えてピッチ間の振幅が所定値より小さい非音
声の部分のみクロックの周期にゆらぎを持たせ、該クロ
ックでD/A変換を行なうことにより合成音声のピッチ
周波数のゆらぎのみを付加することを特徴とする音声合
成装置。 - 【請求項5】 さらに、上記請求項1記載の音声合成装
置において、 ピッチ周波数の大きさが変化する毎にピッチ対応ゆらぎ
幅を変更するピッチ対応ゆらぎ幅変更手段と、 前記ピッチ対応ゆらぎ幅変更手段の出力に基づいて前記
クロック間隔ゆらぎデータ格納手段から出力されるゆら
ぎデータのゆらぎ幅の倍率を変える倍率変更手段とを備
え、 ゆらぎ幅を可変してピッチ周波数とゆらぎ幅が反比例す
る特性を防止して多種のゆらぎ特性に対応するようにし
たことを特徴とする音声合成装置。 - 【請求項6】 さらに、上記請求項1記載の音声合成装
置において、 前記クロック間隔ゆらぎデータ格納手段は、ピッチの変
動方向に応じたゆらぎデータのパタンを複数格納し、 ピッチ周波数の変動方向を検出するピッチ変動方向検出
手段を備え、 前記ピッチ変動方向検出手段の出力に基づいて前記クロ
ック間隔ゆらぎデータ格納手段に格納されたクロック間
隔ゆらぎデータパタンを、ピッチ変動方向によって選択
使用して大局的なピッチ周波数の変化に応じた多種のゆ
らぎ特性に対応するようにしたことを特徴とする音声合
成装置。 - 【請求項7】 さらに、上記請求項1記載の音声合成装
置において、 ゆらぎ付加を無効にする付加無効回路を備えたことを特
徴とする音声合成装置。 - 【請求項8】 前記ゆらぎ付加無効回路は、機械的な合
成音声とゆらぎを付加した自然性の高い合成音声とを切
り換える切換手段により行うことを特徴とする請求項7
記載の音声合成装置。 - 【請求項9】 前記ゆらぎ付加無効回路は、ディジタル
音声波形データ内に付加された特殊記号を判別する手段
を備え、 前記判別手段により前記特殊記号を判別して機械的な合
成音声とゆらぎを付加した自然性の高い合成音声とを切
り換えるようにしたことを特徴とする請求項7記載の音
声合成装置。 - 【請求項10】 前記ディジタル音声波形データは、テ
キストデータであることを特徴とする請求項1又は9の
何れかに記載の音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8098026A JPH09281994A (ja) | 1996-04-19 | 1996-04-19 | 音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8098026A JPH09281994A (ja) | 1996-04-19 | 1996-04-19 | 音声合成装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH09281994A true JPH09281994A (ja) | 1997-10-31 |
Family
ID=14208432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8098026A Withdrawn JPH09281994A (ja) | 1996-04-19 | 1996-04-19 | 音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH09281994A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005539264A (ja) * | 2002-09-17 | 2005-12-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 無声音信号を合成する方法 |
-
1996
- 1996-04-19 JP JP8098026A patent/JPH09281994A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005539264A (ja) * | 2002-09-17 | 2005-12-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 無声音信号を合成する方法 |
JP4813796B2 (ja) * | 2002-09-17 | 2011-11-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 信号を合成するための方法、記憶媒体及びコンピュータシステム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4624012A (en) | Method and apparatus for converting voice characteristics of synthesized speech | |
HU176776B (en) | Method and apparatus for synthetizing speech | |
JP2000305582A (ja) | 音声合成装置 | |
JP5198046B2 (ja) | 音声処理装置及びそのプログラム | |
US20040054537A1 (en) | Text voice synthesis device and program recording medium | |
JPH08335096A (ja) | テキスト音声合成装置 | |
JPH09281994A (ja) | 音声合成装置 | |
van Rijnsoever | A multilingual text-to-speech system | |
JP2005539262A (ja) | 定常音響信号のための合成方法 | |
JP3094622B2 (ja) | テキスト音声合成装置 | |
Furtado et al. | Synthesis of unlimited speech in Indian languages using formant-based rules | |
JP3081300B2 (ja) | 残差駆動型音声合成装置 | |
JP3083624B2 (ja) | 音声規則合成装置 | |
JP3862300B2 (ja) | 音声合成に用いる情報の処理方法および装置 | |
Kaur et al. | BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE | |
KR20040015605A (ko) | 가상노래 합성장치 및 방법 | |
JP2573586B2 (ja) | 規則型音声合成装置 | |
Lai | F0 control model for mandarin singing voice synthesis | |
JPH0229800A (ja) | 音声合成装置 | |
JP3515268B2 (ja) | 音声合成装置 | |
JP2004206144A (ja) | 基本周波数パタン生成方法、及びプログラム記録媒体 | |
JP2573585B2 (ja) | 音声スペクトルパタン生成装置 | |
JPH08171394A (ja) | 音声合成装置 | |
JP2001166787A (ja) | 音声合成装置および自然言語処理方法 | |
Christogiannis et al. | Construction of the acoustic inventory for a greek text-to-speech concatenative synthesis system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20030701 |