JPH08152900A - 音声合成方法及び音声合成装置 - Google Patents

音声合成方法及び音声合成装置

Info

Publication number
JPH08152900A
JPH08152900A JP6319217A JP31921794A JPH08152900A JP H08152900 A JPH08152900 A JP H08152900A JP 6319217 A JP6319217 A JP 6319217A JP 31921794 A JP31921794 A JP 31921794A JP H08152900 A JPH08152900 A JP H08152900A
Authority
JP
Japan
Prior art keywords
voice
sampling frequency
digital
data
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6319217A
Other languages
English (en)
Inventor
Naoto Iwahashi
直人 岩橋
Keiichi Yamada
敬一 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP6319217A priority Critical patent/JPH08152900A/ja
Publication of JPH08152900A publication Critical patent/JPH08152900A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】本発明は、音声合成方法及び音声合成装置につ
いて、予め蓄えられた音声データの声質とは異なる声質
を有する音声を合成する。 【構成】デイジタル音声データをアナログ音声信号に変
換するデイジタルアナログ変換器(3)のサンプリング
周波数を、サンプリング周波数変換手段((3A)、
(3B)、(3C)、(3D))によつて変換し、当該
変換されたサンプリング周波数によりデイジタル音声デ
ータをアナログ音声信号に変換する。これにより、良好
な声質の合成音声、所望の声質の合成音声、様々な声質
の合成音声を簡易かつ確実に出力し得ると共に、声質の
異なる音声を安定して合成することができる。

Description

【発明の詳細な説明】
【0001】
【目次】以下の順序で本発明を説明する。 産業上の利用分野 従来の技術 発明が解決しようとする課題 課題を解決するための手段(図1、図2及び図4) 作用(図2及び図4) 実施例 (1)第1実施例による音声合成装置(図1〜図3) (2)第2実施例による音声合成装置(図4及び図5) 発明の効果
【0002】
【産業上の利用分野】本発明は音声合成方法及び音声合
成装置に関し、例えばカーナビゲーシヨンシステムの音
声案内機能、電子化された文書の読上げシステムや電子
ゲーム機器などに適用して好適なものである。
【0003】
【従来の技術】従来、音声の声質を特徴づける要因の1
つとして、音声のスペクトル包絡の特性があげられる。
スペクトル包絡は、発生器官の共振、反共振特性、声帯
音源のスペクトル概形、口唇や鼻孔などからの音波の放
射特性などを含めたスペクトルの大局的な特徴を表す。
このスペクトル包絡の特性は、主に発声器官の物理的な
形状に依存しており、スペクトル特性を変えることによ
つて声質を変化させることができる。
【0004】
【発明が解決しようとする課題】ところで声質を変化さ
せるためのスペクトル特性変換法として、スペクトルの
極周波数を変換する方式(箱田 和雄「極制御による男
女声質変換法」日本音響学会講演論文集、 213頁〜 214
頁、1987年10月)が提案されている。この方式では、ま
ず音声スペクトルを全極型のスペクトル特性で近似、す
なわち複数の極周波数とそれに関するバンド幅で表す。
この極周波数を決められた規則に従つて変換することに
よりスペクトルの特性を変える。こうして得られたスペ
クトル特性を有するデイジタルフイルタを構成し、この
フイルタを用いて声質の異なる音声を合成している。
【0005】ところがこの方式では、極周波数の変換に
よつて、得られたスペクトル特性を有するデイジタルフ
イルタを構成しなければならず、そのための演算が複雑
なるという問題があつた。
【0006】本発明は以上の点を考慮してなされたもの
で、所望の声質の合成音声を出力し得る音声合成方法及
び音声合成装置を提案しようとするものである。
【0007】
【課題を解決するための手段】かかる課題を解決するた
め本発明においては、デイジタル記録された音声データ
より音声を合成する音声合成方法において、合成文の内
容を表す合成文情報に基づいてデイジタル音声データを
合成し、当該デイジタル音声データをアナログ音声信号
に変換するデイジタルアナログ変換器(3)のサンプリ
ング周波数を変換し、当該変換されたサンプリング周波
数によりデイジタル音声データをアナログ音声信号に変
換する。
【0008】また本発明においては、デイジタル記録さ
れた音声データより音声を合成する音声合成方法におい
て、合成文の内容を表す合成文情報に基づいてデイジタ
ル音声データを合成し、当該デイジタル音声データを再
サンプリングしてデイジタル音声データのサンプリング
周波数を変換する。
【0009】また本発明においては、デイジタル記録さ
れた音声データより音声を合成する音声合成装置(1)
において、合成文の内容を表す合成文情報に基づいてデ
イジタル音声データを合成するデイジタル音声データ合
成手段(2)と、デイジタル音声データをアナログ音声
信号に変換するデイジタルアナログ変換器(3)のサン
プリング周波数を変換するサンプリング周波数変換手段
((3A)、(3B)、(3C)、(3D))とを設
け、当該サンプリング周波数変換手段((3A)、(3
B)、(3C)、(3D))で変換したサンプリング周
波数によりデイジタル音声データをアナログ音声信号に
変換する。
【0010】また本発明においては、デイジタル記録さ
れた音声データより音声を合成する音声合成装置(1
0)において、合成文の内容を表す合成文情報に基づい
て上記デイジタル音声データを合成するデイジタル音声
データ合成手段(2)と、デイジタル音声データを再サ
ンプリングしてデイジタル音声データのサンプリング周
波数を変換するサンプリング周波数変換手段(12)と
を設ける。
【0011】
【作用】デイジタル音声データをアナログ音声信号に変
換するデイジタルアナログ変換器(3)のサンプリング
周波数をサンプリング周波数変換手段((3A)、(3
B)、(3C)、(3D))によつて変換し、当該変換
されたサンプリング周波数によりデイジタル音声データ
をアナログ音声信号に変換する。これにより、良好な合
成音声、所望の声質の合成音声、様々な声質の合成音声
を簡易かつ確実に出力することができると共に、声質の
異なる音声を安定して合成することかできる。
【0012】またデイジタル音声データをサンプリング
周波数変換手段(12)によつて再サンプリングして当
該デイジタル音声データのサンプリング周波数を変換す
る。これにより、良好な合成音声、所望の声質の合成音
声、様々な声質の合成音声を簡易かつ確実に出力するこ
とができると共に、声質の異なる音声を安定して合成す
ることかできる。
【0013】
【実施例】以下図面について、本発明の一実施例を詳述
する。
【0014】(1)第1実施例による音声合成装置 図1において、1は全体として本発明の第1実施例によ
る音声合成装置の概略構成を示している。音声合成装置
1はデイジタル音声データ合成器2、デイジタルアナロ
グ変換器(D/A変換器)3及びスピーカ4より構成さ
れており、D/A変換器3のサンプリング周波数は可変
となるように構成されている。この音声合成装置1で
は、D/A変換器3のサンプリング周波数をサンプリン
グ周波数情報に応じたサンプリング周波数に変換して出
力音声の声質を変化させている。
【0015】図1に示すように、デイジタル音声データ
合成器2には、合成しようとする文の情報(合成文情
報)が入力される。合成文情報としては、例えば合成文
の内容を表す[kyo'owa te'nkiga i'idesune]のような
音韻系列情報及びアクセント情報である。ここで「’」
はアクセントの位置を表す。デイジタル音声データ合成
器2では、合成文情報に基づいてデイジタル音声データ
を合成し、このデイジタル音声データをD/A変換器3
に送出する。
【0016】D/A変換器3では、サンプリング周波数
情報によつて指定されたサンプリング周波数によりデイ
ジタル音声データをアナログ音声信号に変換する。D/
A変換器3より出力されたアナログ音声信号は音声とし
てスピーカ4より出力される。
【0017】D/A変換器3の構成を図2に示す。図2
に示すように、D/A変換器3は、デイジタル音声デー
タをアナログ音声信号に変換するデイジタルアナログコ
ンバータ(D/Aコンバータ)3Aと、D/Aコンバー
タ3Aより出力されるアナログ音声信号に含まれる高周
波数帯域の信号成分を除去するアナログローパスフイル
タ3Bと、サンプリング周波数情報に基づいて発振器3
Cを選択するスイツチ3Dと、それぞれが異なる分周率
を有する複数(1〜n)の発振器3Cとによつて構成さ
れている。
【0018】以上の構成において、D/A変換器3に入
力されたデイシダル音声データは、まずD/Aコンバー
タ3Aにおいてアナログ音声信号に変換される。このと
きD/Aコンバータ3Aのサンプリング周波数はスイツ
チ3Dによつて選択された発振器3Cで生成されるクロ
ツク信号により変更され、変更されたサンプリング周波
数によりデイジタル音声データをアナログ音声信号に変
換する。
【0019】すなわちスイツチ3Dにはサンプリング周
波数情報が入力され、スイツチ3Dはこのサンプリング
周波数情報に基づいて発振器3Cを選択し、選択された
発振器3Cで生成されるクロツク信号がD/Aコンバー
タ3Aに出力される。従つてD/Aコンバータ3Aのサ
ンプリング周波数はこのクロツク信号に基づいて変更さ
れる。D/Aコンバータ3Aより出力されたアナログ音
声信号はアナログローパスフイルタ3Bにおいて、当該
信号に含まれている高周波数帯域の信号成分が除去され
てアナログ音声信号としてスピーカ4に出力される。
【0020】ここで従来の音声合成装置では、D/A変
換器のサンプリング周波数と、蓄積してある音声をA/
D(アナログ/デイジタル) 変換した時のサンプリング
周波数とはほぼ等しい。ただしシステム構成上若干の違
いがある場合もある。
【0021】図3にサンプリング周波数を変更する前の
音声スペクトルの変化(A)とサンプリング周波数を
1.2倍に変化させたときの音声スペクトルの変化(B)
を示す。D/A変換器3でサンプリング周波数を変えた
場合、変換倍率が「1」より大きいときはスペクトル全
体が高域側に移動し、変換倍率が「1」より小さいとき
は低域側に移動する。
【0022】以上の構成によれば、合成音声の出力に用
いるD/A変換器3のサンプリング周波数を、サンプリ
ング周波数情報に基づいて選択した発振器3Cで生成さ
れるクロツク信号により変更し、この変更したサンプリ
ング周波数によつてデイジタル音声データをアナログ音
声信号に変換したことにより、音声合成装置1に予め蓄
積しておいた音声データの声質とは異なる声質を有する
音声を容易に合成することができる。
【0023】例えば、男性の声データを予め音声合成装
置1に蓄積しておいた場合、D/A変換器3のサンプリ
ング周波数を、蓄積しておいた男性の声データの元のサ
ンプリング周波数よりも高くなるように変更することに
より、女性らしい声質の合成音声を出力することができ
る。
【0024】また上述の構成によれば、D/A変換器3
のサンプリング周波数を変更しても、音声のスペクトル
構造を特徴づける「ホルマント(formant )」と呼ばれ
る局所的なピークの相対的な構造に変化を生じさせない
ので、非音声的にならず安定して声質を変換することが
できる。一般に女性の音声スペクトルのホルマント周波
数は男性の音声スペクトルのホルマント周波数よりも高
いので、男性の音声データを変換して女性らしく聞こえ
る音声スペクトルを得るためには、サンプリング周波数
を高くすれば良い。
【0025】(2)第2実施例による音声合成装置 図1との対応部分に同一符号を付して示す図4におい
て、10は全体として本発明の第2実施例による音声合
成装置を示している。この音声合成装置10では、デイ
ジタル音声データ合成器2とD/A変換器11との間に
サンプリング周波数変換演算器12が設けられている。
このサンプリング周波数変換演算器12によつてデイジ
タル音声データのサンプリング周波数をサンプリング周
波数情報に応じて再サンプリングすることによりデイジ
タル音声データのサンプリング周波数を変更する。この
サンプリング周波数変換演算器12は、例えばデイジタ
ルシグナルプロセツサ(digital signal processor、D
SP)より構成されている。
【0026】サンプリング周波数変換演算器12におけ
る演算処理の流れを図5に示す。ここでデイジタル音声
データ合成器2より出力されるデイジタル音声データの
サンプリング周波数をX〔Hz〕とする。デイジタル音声
データ合成器2より出力されたデイジタル音声データを
アツプサンプリングしてサンプリング周波数をm倍のm
X〔Hz〕とする。次にこのm倍されたサンプリング周波
数を1/n倍にダウンサンプリングして(m/n)X
〔Hz〕のサンプリング周波数を有するデイジタル音声デ
ータを得る。ここでm、nは自然数である。
【0027】(m/n)X〔Hz〕のサンプリング周波数
に変換されたデイジタル音声データはD/A変換器11
でアナログ音声信号に変換された後、音声としてスピー
カ4より出力される。このようにサンプリング周波数変
換演算器12によつてデイジタル音声データのサンプリ
ング周波数を変換した場合、変換倍率が「1」より大き
いときはスペクトル全体が低域側に移動し、変換倍率が
「1」より小さいときは高域側に移動する。すなわちD
/A変換器3でサンプリング周波数を変換した場合と逆
の結果になる。
【0028】以上の構成によれば、デイジタル音声デー
タ合成器2とD/A変換器11との間にDSPで構成さ
れるサンプリング周波数変換演算器12を設け、このサ
ンプリング周波数変換演算器12でデイジタル音声デー
タのサンプリング周波数をn/m倍に変換したことによ
り、音声合成装置10に予め蓄積しておいた音声データ
の声質とは異なる声質を有する音声を容易に合成するこ
とができる。
【0029】また上述の構成によれば、サンプリング周
波数変換演算器12でデイジタル音声データのサンプリ
ング周波数をm/n倍に変換しても、音声のスペクトル
構造を特徴づける「ホルマント」と呼ばれる局所的なピ
ークの相対的な構造に変化を生じさせないので、非音声
的にならず安定して声質を変換することができる。また
上述の構成によれば、サンプリング周波数変換演算器1
2をDSPで構成したことにより、合成音声の品質を保
持したまま少ない演算量で声質を変換することができ
る。
【0030】ここで第1実施例及び第2実施例で述べた
ようにサンプリング周波数をサンプリング周波数情報に
基づいて変換することによつてスペクトルの特性を変え
た場合、同時に音韻継続時間や基本周波数も変化する。
従つて上述の第1及び第2実施例では、出力される音声
が適切になるように基本周波数や音韻継続時間などのい
わゆる韻律情報をサンプリング周波数の変更に応じて適
切に設定する。この場合、スペクトル特性と、音韻継続
時間や基本周波数とをそれぞれ独立に変化させる。
【0031】すわなちD/A変換器3のサンプリング周
波数を変えるか又はサンプリング周波数変換演算器12
でデイジタル音声データのサンプリング周波数を変える
ことによつて出力音声の声質を変化させる場合、出力さ
れる音声が適切なものとなるように、予めサンプリング
周波数の変化を補正するように音韻継続時間や基本周波
数を決定する。
【0032】例えばD/A変換器3のサンプリング周波
数を 1.2倍に変換した場合、得られる合成音声の音韻継
続時間は元の1/1.2 倍となり、早口な合成音声にな
る。従つて元の音声の音韻継続時間をD/A変換器3の
サンプリング周波数に合わせて1.2倍にして適切な発声
速度を得る。また基本周波数に関しても、変換後は 1.2
倍になる。出力したい音声の基本周波数がY〔Hz〕であ
るとき、変換前の合成音の基本周波数をY/1.2 〔Hz〕
となるように音声を合成する。このように音韻継続時間
や基本周波数を変える合成方式に関しては、例えば「デ
イジタル音声処理」古井著、東海大学出版会 (1985) 」
などに詳述されている。
【0033】なお上述の実施例においては、スイツチ3
Dによつて発振器3Cを選択し、選択した発振器3Cで
生成されるクロツク信号によつてD/Aコンバータ3A
のサンプリング周波数を変換した場合について述べた
が、本発明はこれに限らず、D/Aコンバータ3Aにク
ロツク信号を送出しないスイツチモードを設け、声質を
変換せずに合成音声を出力してもよい。
【0034】また上述の実施例においては、デイジタル
音声データのサンプリング周波数を変換するサンプリン
グ周波数変換演算器12をDSPで構成した場合につい
て述べたが、本発明はこれに限らず、他の演算装置で構
成してもよい。
【0035】
【発明の効果】上述のように本発明によれば、デイジタ
ル音声データをアナログ音声信号に変換するデイジタル
アナログ変換器のサンプリング周波数をサンプリング周
波数変換手段によつて変換し、当該変換したサンプリン
グ周波数によりデイジタル音声データをアナログ音声信
号に変換することにより、良好な合成音声、所望の声質
の合成音声、様々な声質の合成音声を簡易かつ確実に出
力することができる共に、声質の異なる音声を安定して
合成することかできる。
【図面の簡単な説明】
【図1】第1実施例による音声合成装置の構成を示すブ
ロツク図である。
【図2】D/A変換器の構成を示すブロツク図である。
【図3】サンプリング周波数を変換する前の音声スペク
トルの変化(A)とD/A変換器によつてサンプリング
周波数を変換した後の音声スペクトルの変化(B)との
説明に供する周波数特性曲線図である。
【図4】第2実施例による音声合成装置の構成を示すブ
ロツク図である。
【図5】サンプリング周波数変換演算器によるサンプリ
ング周波数の変換処理の流れを示すブロツク図である。
【符号の説明】
1、10……音声合成装置、2……デイジタル音声デー
タ合成器、3、11……D/A変換器、3A……D/A
コンバータ、3B……アナログローパスフイルタ、3C
……発振器、3D……スイツチ、4……スピーカ、12
……サンプリング周波数変換演算器。

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】デイジタル記録された音声データより音声
    を合成する音声合成方法において、 合成文の内容を表す合成文情報に基づいて上記デイジタ
    ル音声データを合成し、 当該デイジタル音声データをアナログ音声信号に変換す
    るデイジタルアナログ変換器のサンプリング周波数を変
    換し、 当該変換されたサンプリング周波数により上記デイジタ
    ル音声データを上記アナログ音声信号に変換することを
    特徴とする音声合成方法。
  2. 【請求項2】予め蓄積しておいた音声データとして男性
    が発声した音声データを用いて、上記デイジタルアナロ
    グ変換器のサンプリング周波数を、上記音声データを蓄
    積する際に用いたサンプリング周波数よりも高く設定す
    ることを特徴とする請求項1に記載の音声合成方法。
  3. 【請求項3】上記デイジタルアナログ変換器のサンプリ
    ング周波数を変換する場合、当該サンプリング周波数の
    変化に応じて合成音声の基本周波数及び音韻継続時間を
    設定することを特徴とする請求項1に記載の音声合成方
    法。
  4. 【請求項4】デイジタル記録された音声データより音声
    を合成する音声合成方法において、 合成文の内容を表す合成文情報に基づいて上記デイジタ
    ル音声データを合成し、 当該デイジタル音声データを再サンプリングして上記デ
    イジタル音声データのサンプリング周波数を変換するこ
    とを特徴とする音声合成方法。
  5. 【請求項5】予め蓄積しておいた音声データとして男性
    が発声した音声データを用いて、上記デイジタル音声デ
    ータを再サンプリングする際のサンプリング周波数を、
    上記音声データを蓄積する際に用いたサンプリング周波
    数よりも低く設定することを特徴とする請求項4に記載
    の音声合成方法。
  6. 【請求項6】上記デイジタル音声データを再サンプリン
    グして当該デイジタル音声データのサンプリング周波数
    を変換する場合、当該サンプリング周波数の変化に応じ
    て合成音声の基本周波数及び音韻継続時間を設定するこ
    とを特徴とする請求項4に記載の音声合成方法。
  7. 【請求項7】デイジタル記録された音声データより音声
    を合成する音声合成装置において、 合成文の内容を表す合成文情報に基づいて上記デイジタ
    ル音声データを合成するデイジタル音声データ合成手段
    と、 上記デイジタル音声データをアナログ音声信号に変換す
    るデイジタルアナログ変換器のサンプリング周波数を変
    換するサンプリング周波数変換手段とを具え、当該サン
    プリング周波数変換手段で変換したサンプリング周波数
    により上記デイジタル音声データを上記アナログ音声信
    号に変換することを特徴とする音声合成装置。
  8. 【請求項8】デイジタル記録された音声データより音声
    を合成する音声合成装置において、 合成文の内容を表す合成文情報に基づいて上記デイジタ
    ル音声データを合成するデイジタル音声データ合成手段
    と、 上記デイジタル音声データを再サンプリングして上記デ
    イジタル音声データのサンプリング周波数を変換するサ
    ンプリング周波数変換手段とを具えることを特徴とする
    音声合成装置。
JP6319217A 1994-11-28 1994-11-28 音声合成方法及び音声合成装置 Pending JPH08152900A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6319217A JPH08152900A (ja) 1994-11-28 1994-11-28 音声合成方法及び音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6319217A JPH08152900A (ja) 1994-11-28 1994-11-28 音声合成方法及び音声合成装置

Publications (1)

Publication Number Publication Date
JPH08152900A true JPH08152900A (ja) 1996-06-11

Family

ID=18107724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6319217A Pending JPH08152900A (ja) 1994-11-28 1994-11-28 音声合成方法及び音声合成装置

Country Status (1)

Country Link
JP (1) JPH08152900A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249020B2 (en) 2001-04-18 2007-07-24 Nec Corporation Voice synthesizing method using independent sampling frequencies and apparatus therefor
US7571099B2 (en) 2004-01-27 2009-08-04 Panasonic Corporation Voice synthesis device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7249020B2 (en) 2001-04-18 2007-07-24 Nec Corporation Voice synthesizing method using independent sampling frequencies and apparatus therefor
US7418388B2 (en) 2001-04-18 2008-08-26 Nec Corporation Voice synthesizing method using independent sampling frequencies and apparatus therefor
US7571099B2 (en) 2004-01-27 2009-08-04 Panasonic Corporation Voice synthesis device

Similar Documents

Publication Publication Date Title
JP4705203B2 (ja) 声質変換装置、音高変換装置および声質変換方法
JP4153220B2 (ja) 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム
JP2004038071A (ja) 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム
WO2002054383A1 (fr) Dispositif de synthese vocale de texte et support d'enregistrement de programme
JP2564641B2 (ja) 音声合成装置
JP4214842B2 (ja) 音声合成装置及び音声合成方法
AU769036B2 (en) Device and method for digital voice processing
JP2003345400A (ja) ピッチ変換装置、ピッチ変換方法及びプログラム
JP4757971B2 (ja) ハーモニー音付加装置
JPH08152900A (ja) 音声合成方法及び音声合成装置
JP5360489B2 (ja) 音素符号変換装置および音声合成装置
JPH11338500A (ja) フォルマント・シフト補償音響シンセサイザおよびその操作方法
JPH10124082A (ja) 歌声合成装置
JP2008058379A (ja) 音声合成システム及びフィルタ装置
JPH07200554A (ja) 文章読み上げ装置
JPH09179576A (ja) 音声合成方法
JPS587197A (ja) 歌声発生装置
JP4012410B2 (ja) 楽音生成装置および楽音生成方法
JPS58168097A (ja) 音声合成装置
JP2987089B2 (ja) 音声素片作成方法および音声合成方法とその装置
JP3241582B2 (ja) 韻律制御装置及び方法
JPH0934489A (ja) 音声合成装置および方法
JP2000194388A (ja) 音声合成装置
JPH0962297A (ja) フォルマント音源のパラメータ生成装置
JPH0572599B2 (ja)