JPH09305197A - 音声変換方法及び装置 - Google Patents

音声変換方法及び装置

Info

Publication number
JPH09305197A
JPH09305197A JP8121811A JP12181196A JPH09305197A JP H09305197 A JPH09305197 A JP H09305197A JP 8121811 A JP8121811 A JP 8121811A JP 12181196 A JP12181196 A JP 12181196A JP H09305197 A JPH09305197 A JP H09305197A
Authority
JP
Japan
Prior art keywords
voice
pitch
section
waveform
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8121811A
Other languages
English (en)
Inventor
Takahiko Niimura
貴彦 新村
Ayanori Yoshitani
文徳 吉谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP8121811A priority Critical patent/JPH09305197A/ja
Publication of JPH09305197A publication Critical patent/JPH09305197A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 任意の音声の発話様式を所望の韻律に近似す
る韻律を持つ他の音声、例えば声優の音声の発話様式に
効率的に変換する音声変換装置を提供する。 【解決手段】 元音声と音声区間情報を元音声データベ
ース102から選びだす元音声情報検索部104、元音
声に対応する音声区間情報を声優音声データベース10
3から選びだす声優音声情報検索部105、元音声の音
声区間と声優の音声区間とを対応させる音声区間対応部
106、元音声と声優の音声の音声区間に含まれたピッ
チ波形を対応させるピッチ波形対応部107、元音声の
音声区間に含まれたピッチ波形を声優の音声のピッチ波
形をモデルとして加工する韻律制御部108、そして区
分された元音声を合成する波形合成部109を含んで音
声変換装置1を構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば通信、マル
チメディア、ヒューマンインタフェース、合成音サービ
ス等に利用される音声変換技術に係り、ある人間の発話
様式を別の人間の発話様式に変換する技術に関する。
【0002】
【従来の技術】人間の発話様式には、それぞれ、発声方
法、イントネーションなどの発声に関係する個性、癖が
ある。また、声質のように先天的に備わった要素に基づ
く発話がなされる場合もあれば、訓練によって独特な発
話がなされる場合もある。例えば、アナウンサーや声優
のように発話を得意にする人々は、資質としての優れた
声質のほかに、特有の発話様式になるように訓練を行っ
ているのが通常である。このような人々の発話様式は、
同じ文章を音読したとしても、声の大きさ、発音速度、
声の高さなどについて、訓練を経ない一般の人々には真
似ることが難しい。
【0003】ところで、最近は、自分の音声を加工し、
この加工した音声を機械に発声させる音声変換技術が提
案されている。この種の音声変換に係る従来技術として
は、例えば特開平7−92986号公報に記載された音
声変換装置が参考になる。以下、この音声変換装置につ
いて説明する。
【0004】図6は上記公報に記載された従来技術によ
る音声変換装置のブロック構成図である。この音声変換
装置6は、形態素解析部601、韻律生成部602、波
形素片選択部603、波形制御部604、合成部605
を有し、さらに、韻律生成部602が参照する基本韻律
規則テーブル606と発話様式変更テーブル607、及
び波形素片選択部603が参照する波形素片データベー
ス608を含んで成る。基本韻律テーブル606には、
検索のための検索キーと、検索キーに対応する基本韻
律、例えば、周波数、振幅、時間長のパラメータの組と
が記録されている。また、発話様式変更テーブル607
には、検索キーと、検索キーに対応する基本韻律の変更
規則、例えば周波数、振幅、時間長、及びホルマントの
組とが記憶されている。
【0005】この音声変換装置6の動作は以下のように
なる。テキストが音声変換装置6に入力されると、形態
素解析部601は、このテキストに含まれる字句、構文
を形態素解析する。この形態素解析結果は韻律生成部6
02に送られる。韻律生成部602は、形態素解析結果
から検索キーを見つけだし、基本韻律規則テーブル60
6から検索キーに対応する基本韻律と、発話様式変更テ
ーブル607から検索キーに対応した基本韻律の変更規
則を引き出して韻律モデルを作成し、これを波形素片選
択部603に送る。波形素片選択部603は、この韻律
モデルに対応する波形素片を波形素片データベース60
8から索出し、それを選択波形として波形制御部604
に送る。波形制御部604は、送られた選択波形の波形
素片を必要に応じて加工する。そして、加工した波形素
片を合成部605に送る。合成部605は、加工された
波形素片を全て合成し、入力されたテキストに対応した
合成音声を出力する。
【0006】関連する他の音声変換技術として、特開平
5−11794号公報に記載された合成音作成方法があ
る。この方法は、合成音声の音素波形を意図した発話様
式の韻律にあわせて加工し、合成することを特徴とす
る。この韻律は、入力音声を音素単位に分析することに
より得られる。
【0007】
【発明が解決しようとする課題】上記各公報に記載され
た従来技術は、合成音の発話者の韻律を予めデータベー
スに固定的に蓄積して使用している。また、変換しよう
とする発話様式の韻律規則は、データベースに蓄積され
ている合成音の発話者の多量の音声を分析して求めた
り、その都度入力された所望の音声を分析して求めてい
た。例えば一般の者の発話を所望の声優の発話様式に変
換して合成しようとする場合、従来は、データベースに
蓄積されている一般の者の音声を、入力された声優の音
声の分析結果に基づいて変換していた。このため、合成
音の発話者や発話様式に柔軟性を持たせたいときは、音
素単位のマッチングや分析処理が難しくなり、また、デ
ータベースの増改築が不可欠になる問題があった。この
種のデータベースの増改築は、専門知識を要するととも
にその負担が大きく、末端利用者にとっては扱いにくい
ものであった。
【0008】そこで本発明の課題は、例えばある発話様
式の音声を、他の発話様式の音声に容易に変換すること
ができる音声変換方法を提供することにある。本発明の
他の課題は、上記音声変換方法の実施に適した音声変換
装置を提供することにある。
【0009】
【課題を解決するための手段】本発明が提供する音声変
換方法は、発声内容が同一で声質が異なる第一及び第二
の音声の各音声について音声を形成するピッチ波形に関
わる韻律パラメータを生成するとともに、第一の音声の
韻律パラメータが第二の音声の韻律パラメータと近似す
るように第一の音声のピッチ波形を加工する過程を含む
ことを特徴とする。つまり、第二の音声の韻律パラメー
タをモデルとして第一の音声のピッチ波形に関わる韻律
パラメータを操作することで音声変換を行う。
【0010】また、本発明の音声変換装置は、発声内容
が同一で声質が異なる第一及び第二の音声の各音声につ
いて音声を形成するピッチ波形に関わる韻律パラメータ
を生成する韻律パラメータ生成手段と、第二の音声の韻
律パラメータに応じて第一の音声のピッチ波形を加工し
て新たな音声を生成する波形加工手段と、を有すること
を特徴とする。
【0011】本発明の音声変換装置において、前記韻律
パラメータ生成手段は、例えば、第一及び第二の音声の
ピッチ波形の配列パターンが変化する変化点を検出する
検出手段と、検出された変化点によって第一及び第二の
音声を各々複数の音声区間に区切ると共に第一の音声に
おける各音声区間と第二の音声における各音声区間とを
対応付ける区間対応手段とを備えて成る。
【0012】また、前記検出手段は、例えば、第一及び
第二の音声の各音声についてケプストラム演算を実行す
る手段を備え、このケプストラム演算の実行結果に基づ
いて前記変化点を検出する。この場合、前記区間対応手
段は、前記ケプストラム演算の実行結果により特定され
る第一及び第二の音声のスペクトラム定常区間同士を対
応付ける。
【0013】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。本実施形態では、音声変換装
置の使用者が発声した文章の音声とその韻律、及び、声
優などが発声した同一文章の音声の韻律パラメータを予
め記憶しておき、ある選択された文章について使用者が
発声した音声を、声優が発声した音声の韻律パラメータ
に応じて変換する例を説明する。
【0014】図1は、本実施形態による音声変換装置の
ブロック構成図である。この音声変換装置1は、韻律パ
ラメータ生成部101、元音声データベース102、声
優音声データベース103、元音声情報検索部104、
声優音声情報検索部105、音声区間対応部106、ピ
ッチ波形対応部107、韻律制御部108、及び波形合
成部109を備えて構成される。
【0015】韻律パラメータ生成部101は、入力され
た音声を複数の区間に区切ると共に、区切られた音声区
間の韻律を表す韻律パラメータを生成し、これを音声区
間情報として出力するもので、本発明の韻律パラメータ
生成手段として機能する。元音声データベース102
は、複数の文章について使用者が発声した元音声(文章
音声)と韻律パラメータ生成部101で生成した音声区
間情報とを文章番号と共に記憶するものである。声優音
声データベース103は、同一の文章について予め複数
の声優によって発声された音声に関する音声区間情報を
声優番号及び文章番号と共に記憶したものである。元音
声情報検索部104は、入力される文章番号をキーとし
て対応する音声区間情報を元音声データベース102か
ら索出するものであり、声優音声情報検索部105は、
文章番号及び声優番号をキーとして声優音声データベー
ス103から該当する音声区間情報を索出するものであ
る。音声区間対応部106は、所定の区間毎に区切られ
た元音声と声優音声の音声区間情報同士を対応させるも
のである。ピッチ波形対応部107は、元音声の音声区
間に含まれたピッチの位置と声優音声の音声区間に含ま
れたピッチの位置を互いに対応させ、これをピッチ波形
対応情報として出力するものである。韻律制御部108
は、元音声の音声区間に含まれたピッチ波形を加工する
ものである。波形合成部109は、加工された元音声の
ピッチ波形を合成して新たな合成音声を生成するもので
ある。
【0016】なお、元音声データベース102と声優音
声データベース103を除く各部101,103〜10
9は、プログラムされたコンピュータによって実現可能
であり、それぞれ物理的に把握可能なユニットの集合と
して存在してもよく、あるいは汎用のコンピュータが読
み取り可能な可搬性の情報記憶媒体上に固定され、それ
を読みとったコンピュータに上記機能を付与する命令構
成体として存在してもよい。
【0017】韻律パラメータ生成部101の詳細なブロ
ック構成例を図2に示す。この韻律パラメータ生成部1
01は、音声のスペクトラムについてのケプストラム演
算を実行するΔケプストラム演算部201、Δケプスト
ラム計算部201の結果に基づいて音声を複数の音声区
間に区分する、ピッチ波形の配列パターンの変化点を検
出する検出手段と音声を区分する手段としての音声区間
検出部202、区分された音声区間に含まれるピッチ位
置を抽出するピッチ計算部203、及び音声区間情報を
生成する音声区間情報生成部204を含んで構成され
る。
【0018】図2を参照して韻律パラメータ生成部10
1の動作を説明する。まず、Δケプストラム計算部20
1に音声が入力される。Δケプストラム計算部201
は、その音声の時間軸上を細かく移動しながらケプスト
ラム値の差分である△ケプストラムを計算する。音声区
間検出部202は、Δケプストラム計算部201の計算
結果に基づいて△ケプストラムの値が最も大きくなると
ころをスペクトルの定常区間の境界とする。なお、正確
さを求めるならば、目視で区間境界を変更することも可
能である。ピッチ計算部203は、音声区間検出部20
2によって決定された区間ごとにピッチの位置を計算す
る。音声区間情報生成部204は、音声区間ごとに有声
区間位置情報と無声区間位置情報と有声音区間における
ピッチ位置の情報から成る音声区間情報を出力する。生
成された音声区間情報は、入力された音声が使用者によ
るものか声優によるものかに応じて異なったデータベー
スに記憶される。例えば、使用者によるものであれば、
元音声データベース102に使用者の発声による文章音
声と音声区間情報が文章番号ごとに記憶される。一方、
声優によるものであれば、声優音声データベース103
に発声された文章音声と音声区間情報が声優番号と共に
記憶される。
【0019】次に、本実施形態の音声変換装置の動作を
詳細に説明する。まず、特定の文章を指定する文章番号
が元音声情報検索部104と声優音声情報検索部105
に入力され、同時にモデルにしたい声優を特定する声優
番号が声優音声情報検索部105に入力される。元音声
情報検索部104は、入力された文章番号に対応する音
声区間情報を元音声データベース102から索出する。
そして、音声区間情報を音声区間対応部106に、無声
音区間位置情報を波形合成部109に、有声音区間位置
情報を韻律制御部108に、元音声ピッチ波形情報をピ
ッチ波形対応部107にそれぞれ送る。声優音声情報検
索部105は、入力された文章番号と声優番号に対応す
る音声区間情報を声優音声データベース103から索出
して、音声区間情報を音声区間対応部106に、声優音
声ピッチ波形情報をピッチ波形対応部107にそれぞれ
送る。
【0020】音声区間対応部106は、元音声情報検索
部104から送られた音声区間情報の区間位置情報と声
優音声情報検索105から送られた音声区間情報とに基
づいて元音声の音声区間と声優の音声の音声区間とを対
応付け、これを音声区間対応情報としてピッチ波形対応
部107へ送る。ここでいう対応付けは、例えば、スペ
クトルの定常部分を音声の先頭から一対一に対応させる
ことをいう。
【0021】ピッチ波形対応部107は、音声区間対応
部106から送られた音声区間対応情報と、元音声情報
検索104から送られた元音声ピッチ波形情報と声優音
声情報検索部103から送られた声優音声ピッチ波形情
報とから、対応する音声区間に含まれるピッチを対応さ
せ、これをピッチ対応情報として韻律制御部108に送
る。
【0022】図3及び図4を参照してピッチの対応のさ
せ方の一例を説明する。図3(a)は、声優の一音声区
間のピッチ波形を示した図であり、図3(b)は、それ
に対応する元音声の音声区間のピッチ波形を示した図で
ある。また、図4は、図3(a),(b)におけるピッ
チの対応付けの一例を示す図である。対応する音声区間
の区間長は一般に異っているため、ピッチを対応させる
ためにピッチ波形情報のピッチ位置情報から得られる各
ピッチに付随する音声区間を”1”とした場合のピッチ
の位置比率が使用される。図3(a)では、音声区間の
区間長を”1”としたときに、左から順に9/63、1
8/63、27/63、36/63、45/63、54
/63、63/63(=”1”)の位置にピッチが存在
し、図3(b)では、7/63、14/63、21/6
3、28/63、35/63、42/63、49/6
3、56/63、63/63(=”1”)にピッチが存
在している。ピッチは、位置比率が互いにより接近する
もの同士を結び付けて行われる。図4で、元音声の音声
区間で7/63に位置するピッチが声優の音声区間で9
/63に位置するピッチに対応し、元音声の音声区間で
14/63と21/63に位置する二つのピッチが声優
の音声区間で18/63に位置するピッチに対応してい
ることを示しており、残りのピッチについても同様にピ
ッチが対応付けられる。このようなピッチ波形の対応が
互いに対応する音声区間の全てに対してなされ、ピッチ
波形対応情報が生成される。
【0023】韻律制御部108では、このピッチ対応情
報に基づいて、元音声の有声音区間の韻律を制御する。
韻律制御の一例としてはピッチ波形重畳法を使用するこ
とができる。図5は、ピッチ波形重畳法によるピッチ波
形の加工方法の説明図である。このピッチ波形重畳法で
は、各音声区間について振幅、ピッチ周期、時間長を含
む韻律パラメータを変換するようにピッチ波形を加工し
ている。
【0024】以下、図1及び図5を参照して、一音声区
間についてのピッチ波形の加工手順を説明する。韻律制
御部108には、元音声情報検索部104から有声音区
間の位置情報と、音声区間のピッチ情報とが送られる。
また、ピッチ波形対応部107からは、ピッチ波形対応
情報が送られる。次に、入力された音声区間の時間長制
御のために周波数を考慮して最適なピッチ波形の数を計
算する。そして計算結果に応じてピッチ波形の数を増減
させる。さらに重み関数によってピッチの振幅が調整さ
れる。音声区間内のピッチ波形の数が加減されて区間の
時間長が調節される。ピッチ波形の間隔を変化させて周
波数を調節し、それぞれのピッチ波形を重ね合わせて結
合する。なお、周波数の調節時において、いわゆるエイ
リアシングの可能性もあるので、必要に応じて窓かけを
行う。合成された波形は、波形合成部109に送られ
る。
【0025】波形合成部109では、韻律制御部108
において生成された合成波形と無音声区間を合成する。
より詳しくは、韻律制御部108から送られた有声音区
間位置情報と、元音声情報検索部104から送られた無
声音区間の位置情報とに基づいて、所定の位置に各音声
区間が配置されるように合成する。
【0026】なお、元音声データベース102を用いな
くても文章番号に対応した音声を直接に韻律パラメータ
生成部101に入力してもよい。この場合、韻律パラメ
ータ生成部101から直接に音声区間情報が音声区間対
応部106に、無声音区間位置情報が波形合成部109
に、有声音区間位置情報が韻律制御部108に、ピッチ
波形情報がピッチ波形対応部107にそれぞれ送られ
る。
【0027】このように、本実施形態では、従来の声優
の音声の韻律分析や規則生成に代えて、予め声優に決ま
った文章を発声させてスペクトル定常区間ごとに韻律パ
ラメータを求めておき、この定常区間ごとの韻律パラメ
ータを合成音の韻律モデルとし、ピッチ波形単位で声優
の音声と元音声とを対応させて、元音声をそのピッチ情
報のみで韻律制御を行うことで声優の音声に近似させて
いるので、波形素片ではなく、韻律情報のみをデータベ
ース化すればよく、記憶容量の節減が可能になる。ま
た、普通の人が発声した音声を、声優の独特な話し方に
変更させた合成音に容易に変換することができるため、
合成音声の利用範囲を拡大することができる。
【0028】
【発明の効果】以上の説明から明らかなように、本発明
によれば、一般の人間の発話様式を、ハードウエア資源
や処理の負担を増加させることなく、他の人間の発話様
式に容易に変換することができる。
【図面の簡単な説明】
【図1】本実施形態に係る音声変換装置のブロック構成
図。
【図2】本実施形態による韻律パラメータ生成部の詳細
なブロック構成図。
【図3】(a)は本実施形態による声優の音声区間のピ
ッチ波形、(b)は対応する元音声の音声区間のピッチ
波形の一例を示した図。
【図4】本実施形態による音声区間のピッチ波形の位置
の比率によるピッチ波形の対応関係の一例を示した図。
【図5】ピッチ波形重畳法によるピッチ波形の加工の一
例を示した説明図。
【図6】従来技術による音声変換装置のブロック構成
図。
【符号の説明】
1 音声変換装置 101 韻律パラメータ生成部 102 元音声データベース 103 声優音声データベース 104 元音声情報検索部 105 声優音声情報検索部 106 音声区間対応部 107 ピッチ波形対応部 108 韻律制御部 109 波形合成部 201 Δケプストラム演算部 202 音声区間検出部 203 ピッチ計算部 204 音声区間情報生成部

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 発声内容が同一で声質が異なる第一及び
    第二の音声の各音声について音声を形成するピッチ波形
    に関わる韻律パラメータを生成するとともに、第一の音
    声の韻律パラメータが第二の音声の韻律パラメータと近
    似するように第一の音声のピッチ波形を加工する過程を
    含むことを特徴とする音声変換方法。
  2. 【請求項2】 発声内容が同一で声質が異なる第一及び
    第二の音声の各音声について音声を形成するピッチ波形
    に関わる韻律パラメータを生成する韻律パラメータ生成
    手段と、 第二の音声の韻律パラメータに応じて第一の音声のピッ
    チ波形を加工して新たな音声を生成する波形加工手段
    と、 を有することを特徴とする音声変換装置。
  3. 【請求項3】 前記韻律パラメータ生成手段は、第一及
    び第二の音声のピッチ波形の配列パターンが変化する変
    化点を検出する検出手段と、検出された変化点によって
    第一及び第二の音声を各々複数の音声区間に区切ると共
    に第一の音声における各音声区間と第二の音声における
    各音声区間とを対応付ける区間対応手段とを備えること
    を特徴とする請求項2記載の音声変換装置。
  4. 【請求項4】 前記検出手段は、第一及び第二の音声の
    各音声についてケプストラム演算を実行する手段を備
    え、このケプストラム演算の実行結果に基づいて前記変
    化点を検出することを特徴とする請求項3記載の音声変
    換装置。
  5. 【請求項5】 前記区間対応手段は、前記ケプストラム
    演算の実行結果により特定される第一及び第二の音声の
    スペクトラム定常区間同士を対応付けることを特徴とす
    る請求項4記載の音声変換装置。
JP8121811A 1996-05-16 1996-05-16 音声変換方法及び装置 Pending JPH09305197A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8121811A JPH09305197A (ja) 1996-05-16 1996-05-16 音声変換方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8121811A JPH09305197A (ja) 1996-05-16 1996-05-16 音声変換方法及び装置

Publications (1)

Publication Number Publication Date
JPH09305197A true JPH09305197A (ja) 1997-11-28

Family

ID=14820522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8121811A Pending JPH09305197A (ja) 1996-05-16 1996-05-16 音声変換方法及び装置

Country Status (1)

Country Link
JP (1) JPH09305197A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002033944A1 (fr) * 2000-10-17 2002-04-25 Yozan Inc. Systeme de reponses
WO2014016892A1 (ja) * 2012-07-23 2014-01-30 山形カシオ株式会社 音声変換装置、及びプログラム
US10878803B2 (en) 2017-02-21 2020-12-29 Tencent Technology (Shenzhen) Company Limited Speech conversion method, computer device, and storage medium
CN112634919A (zh) * 2020-12-18 2021-04-09 平安科技(深圳)有限公司 语音转换方法、装置、计算机设备及存储介质
CN113539239A (zh) * 2021-07-12 2021-10-22 网易(杭州)网络有限公司 语音转换方法、装置、存储介质及电子设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002033944A1 (fr) * 2000-10-17 2002-04-25 Yozan Inc. Systeme de reponses
WO2014016892A1 (ja) * 2012-07-23 2014-01-30 山形カシオ株式会社 音声変換装置、及びプログラム
JPWO2014016892A1 (ja) * 2012-07-23 2016-07-07 山形カシオ株式会社 音声変換装置、及びプログラム
US10878803B2 (en) 2017-02-21 2020-12-29 Tencent Technology (Shenzhen) Company Limited Speech conversion method, computer device, and storage medium
CN112634919A (zh) * 2020-12-18 2021-04-09 平安科技(深圳)有限公司 语音转换方法、装置、计算机设备及存储介质
CN112634919B (zh) * 2020-12-18 2024-05-28 平安科技(深圳)有限公司 语音转换方法、装置、计算机设备及存储介质
CN113539239A (zh) * 2021-07-12 2021-10-22 网易(杭州)网络有限公司 语音转换方法、装置、存储介质及电子设备
CN113539239B (zh) * 2021-07-12 2024-05-28 网易(杭州)网络有限公司 语音转换方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
EP3588484B1 (en) Electronic musical instrument, electronic musical instrument control method, and storage medium
US7035791B2 (en) Feature-domain concatenative speech synthesis
JP4130190B2 (ja) 音声合成システム
Wouters et al. Control of spectral dynamics in concatenative speech synthesis
US20030154080A1 (en) Method and apparatus for modification of audio input to a data processing system
JPH10153998A (ja) 補助情報利用型音声合成方法、この方法を実施する手順を記録した記録媒体、およびこの方法を実施する装置
CN112102811B (zh) 一种合成语音的优化方法、装置及电子设备
CN112331222A (zh) 一种转换歌曲音色的方法、系统、设备及存储介质
CN112037755B (zh) 一种基于音色克隆的语音合成方法、装置及电子设备
JP2010128103A (ja) 音声合成装置、音声合成方法、および音声合成プログラム
JPH09305197A (ja) 音声変換方法及び装置
JP2001272991A (ja) 音声対話方法及び音声対話装置
JPH08248994A (ja) 声質変換音声合成装置
JPH0887297A (ja) 音声合成システム
JP2001242882A (ja) 音声合成方法及び音声合成装置
WO2008056604A1 (fr) Système de collecte de son, procédé de collecte de son et programme de traitement de collecte
JPH08335096A (ja) テキスト音声合成装置
JP2013156472A (ja) 音声合成装置及び音声合成方法
Wang et al. Beijing opera synthesis based on straight algorithm and deep learning
JPH07140996A (ja) 音声規則合成装置
JP2536169B2 (ja) 規則型音声合成装置
CN110782866A (zh) 一种演唱声音转换器
JP2001125599A (ja) 音声データ同期装置及び音声データ作成装置
JPH1165597A (ja) 音声合成装置、音声合成及びcg合成出力装置、ならびに対話装置
Cheng et al. HMM-based mandarin singing voice synthesis using tailored synthesis units and question sets