JP5518621B2 - 音声合成装置およびコンピュータプログラム - Google Patents
音声合成装置およびコンピュータプログラム Download PDFInfo
- Publication number
- JP5518621B2 JP5518621B2 JP2010177776A JP2010177776A JP5518621B2 JP 5518621 B2 JP5518621 B2 JP 5518621B2 JP 2010177776 A JP2010177776 A JP 2010177776A JP 2010177776 A JP2010177776 A JP 2010177776A JP 5518621 B2 JP5518621 B2 JP 5518621B2
- Authority
- JP
- Japan
- Prior art keywords
- control
- fundamental frequency
- speech speed
- information
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004590 computer program Methods 0.000 title claims description 6
- 238000000034 method Methods 0.000 claims description 140
- 238000012937 correction Methods 0.000 claims description 85
- 238000004458 analytical method Methods 0.000 claims description 55
- 238000004364 calculation method Methods 0.000 claims description 28
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 238000003786 synthesis reaction Methods 0.000 claims description 3
- 208000032041 Hearing impaired Diseases 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 230000011218 segmentation Effects 0.000 description 9
- 238000000926 separation method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 4
- 206010011878 Deafness Diseases 0.000 description 2
- 206010048865 Hypoacusis Diseases 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 206010036626 Presbyacusis Diseases 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000002940 repellent Effects 0.000 description 1
- 239000005871 repellent Substances 0.000 description 1
- 238000003079 width control Methods 0.000 description 1
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
そこで、本発明は上記事情に鑑みてなされたものであり、音響に関する専門知識や豊かな調整経験がなくとも音声データを補正でき、聴き易い音声データを容易に且つ効果的に得ることができる、音声合成装置およびコンピュータプログラムを提供することを目的とする。
ここで、話速の制御量は、音声データ補正部が韻律の音響特徴量である話速を補正するための補正データまたは補正量を表すデータである。また、基本周波数の変化幅の制御量は、音声データ補正部が韻律の音響特徴量である基本周波数の変化幅、言い換えると音域を補正するための補正データまたは補正量を表すデータである。
この構成によれば、本発明の一態様である音声合成装置は、話速の制御量と基本周波数の変化幅の制御量とのいずれか一方を指定することにより、この一方の制御量に対応する他方の制御量を制御情報テーブル記憶部から取得する。そして、この音声合成装置は、取得した基本周波数の変化幅の制御量に基づいて目標基本周波数の時間変化情報を生成し、取得した話速の制御量と生成した目標基本周波数の時間変化情報とに基づいて、音声データの話速および基本周波数の変化幅に関する韻律を補正する。
よって、本発明の一態様である音声合成装置によれば、音声データが容易に且つ効率的に補正後音声データに補正される。
[第1の実施の形態]
図1は、本発明の第1実施形態である音声合成装置の機能構成を示すブロック図である。同図に示すように、音声合成装置100は、音声データ取得部10と、音声属性情報取得部20と、音声分析部30と、制御条件情報生成部40と、目標値生成部50と、制御情報テーブル更新部60と、生成条件取得部70と、音声データ補正部80とを備える。
音声データの発話内容が「おはようございます(空白)ごきげんいかがですか(空白)」である場合、テキスト情報は、例えば“おはようございます。ごきげんいかがですか。”である。なお、“(空白)”は、その前後の音声の間に、発声されない区間があることを表す。また、テキスト情報に含まれる文章は、ひらがな表記の他、カタカナ表記、ローマ字表記、または漢字混じり表記のいずれであってもよい。また、本実施形態では、音声データの発話内容が日本語である場合について説明するが、本実施形態は外国語についても適用可能である。
音素区切時間情報は、音声データの音声の先頭に対応する時点を基準時としたときの、当該音声データの各音素の発声時間を示す情報である。音素とは、音韻論上の音の最小単位であり、母音および子音それぞれが1音素に対応する。また、撥音、長音、および促音それぞれも1音素に対応する。この音素区切時間情報の具体例については後述する。
基本周波数分析部31は、音声データに基づいて、基本周波数の時間変化情報を有声区間(声帯の振動を伴う音声である有声音声の区間)において生成し、その生成した基本周波数の値に対し、有声区間の分析値を用いてスプライン関数等によりスムージング処理を行うことによって、変化が滑らかな基本周波数の時間変化情報を生成する。このとき、基本周波数分析部31は、基本周波数を抽出できない無声区間(声帯の振動を伴わない音声である無声音声の区間)については、この無声区間の前後の有声区間における基本周波数の値から内挿した値を用いて、無声区間における基本周波数の値を補間する。
なお、基本周波数分析部31は、スムージング処理を行わずに、生成した基本周波数の値そのものを基本周波数の時間変化情報としてもよい。
第1の話速値を計算する方法は、音声データとテキスト情報とに基づいて音素区切時間情報を生成し、生成した音素区切時間情報に基づいて話速を計算する方法である。具体的には、話速計算部32は、音声データから音声区間の総時間長を求め、この総時間長とテキスト情報とに基づき公知の音声認識処理技術によって音素区切時間情報を生成する。そして、話速計算部32は、音素区切時間情報から単位時間当たりのモーラ(Mora)数を求めることによって話速値(単位は、「モーラ/秒」)を得る。モーラとは、音の長さについての音韻論上の単位である。日本語では、おおむね拗音については仮名二文字が1モーラに対応し、直音については仮名一文字が1モーラに対応する。そして、1モーラは、一つまたは複数の音素により構成される。
第2の話速値を計算する方法は、音声データから音声区間の総時間長を求めるとともにテキスト情報からモーラ数を求めて、これら音声区間の総時間長とモーラ数とに基づいて話速値を計算する方法である。
制御方法の種別は、話速の制御量と基本周波数の変化幅の制御量との制御方法を区別するデータである。話速の制御量は、音声データ補正部80が韻律の第1の音響特徴量である話速を補正するための補正データまたは補正量を表すデータであり、目標となる話速値の絶対値、または話速の倍率で表される。基本周波数の変化幅の制御量は、音声データ補正部80が韻律の第2の音響特徴量である基本周波数の変化幅、言い換えると音域を補正するための補正データまたは補正量を表すデータであり、基本周波数の変化幅の絶対値、または基本周波数の変化幅の倍率で表される。
制御方法の種別について具体的に説明する。本実施形態における制御方法の種別は定量的に制御量を指定する制御方法であり、下記の表1のように分類される。
制御情報テーブル記憶部51は、読み出しおよび書き込み可能な記憶装置であり、例えば、磁気ハードディスク装置、半導体記憶装置等である。また、制御情報テーブル記憶部51は、光磁気ディスク等の可搬型記録媒体であってもよい。
生成条件情報は、目標基本周波数生成部54が目標基本周波数の時間変化情報を生成するときの条件を指定する情報であり、平均値固定指定と、最小値固定指定と、指定値固定指定とのいずれかが指定される。
最小値固定指定は、基本周波数分析部31が生成した基本周波数の時間変化情報の所定区間における周波数値の最小値を基準とし、その最小値以上の周波数値となるように、当該区間における目標基本周波数の時間変化情報を生成することを指定するものである。
指定値固定指定には次の二通りの指定がある。第1の指定値固定指定は、基本周波数分析部31が生成した基本周波数の時間変化情報の所定区間における任意の一つの周波数値を基準として、当該区間における目標基本周波数の時間変化情報を生成することを指定するものである。
また、第2の指定値固定指定は、所定区間の始点と終点とのそれぞれに対応する二つの周波数値を基準として、当該区間における目標基本周波数の時間変化情報を生成することを指定するものである。
また、目標基本周波数生成部54は、制御情報取得部53から供給される基本周波数の変化幅の制御量が「基本周波数の変化幅の倍率」である場合、生成条件取得部70から供給される生成条件情報にしたがって、周波数の変化幅が「基本周波数の変化幅の倍率」に適合する目標基本周波数の時間変化情報を生成する。
生成条件取得部70は、ユーザによるキーボードやマウス等の入力装置の操作によって平均値固定指定と最小値固定指定と第1の指定値固定指定と第2の指定値固定指定とのいずれかの指定を受け、その指定を示す生成条件情報を生成して目標基本周波数生成部54に供給する。
具体的には、例えば、音声データ補正部80は、音声データに目標基本周波数の時間変化情報を適用して基本周波数の時間変化情報を補正する。そして、音声データ補正部80は、話速の制御量(話速値の絶対値または話速の倍率)に基づいて話速計算部32が算出した話速値を補正し、音声データの音素区切時間情報をその補正した話速値に基づいて補正する。そして、音声データ補正部80は、基本周波数の時間変化情報が補正された音声データに、補正後の音素区切時間情報を適用して時間軸方向を補正した補正後音声データを生成する。
また、音素区切時間情報の各行は、区切り文字(例えば、スペースやタブ等)で区切られた3つの列を有している。一列目は、音声データの先頭に対応する時点を基準時として各音素の開始時点までの時間を1万分の1秒単位で表し、二列目は上記基準時から各音素の終了時点までの時間を1万分の1秒単位で表し、三列目は音素の音素ラベルを表す。例えば、同図において、“0 2740 sil”は、基準時から0.274秒経過するまでの間が無声区間であることを表す。また、“2740 3168 o(お)”は、基準時から0.274秒経過した時点から、基準時から0.3168秒経過するまでの間の音素が“o(お)”であることを表す。なお、音素ラベル“sil”は音素がないことを表す。
なお、ここでは、時刻が1万分の1秒単位である場合を一例として説明したが、1千分の1秒単位(ミリ秒)等、他の単位で表すようにしてもよい。
同図(a)は、生成条件情報が平均値固定指定を示す情報である場合に、目標基本周波数生成部54が生成した目標基本周波数の時間変化情報の例である。同図(a)は、時刻t1から時刻t2まで(t1<t2)の時間における音声データの基本周波数の時間変化情報1と、この基本周波数の時間変化情報1を基本周波数の変化幅の制御量に基づいて、拡大した基本周波数の時間変化情報1aと、縮小した基本周波数の時間変化情報1rとを示す。同図(a)において、基本周波数の時間変化情報1の時刻t1から時刻t2までにおける周波数値の平均値は平均値faveである。同図(a)に示すように、目標基本周波数生成部54は、時刻t1から時刻t2までの基本周波数の時間変化情報の平均値が平均値faveになるように、基本周波数の時間変化情報2を拡大したり縮小したりする。
まず、ステップS101において、制御条件情報生成部40は、ユーザによるキーボードやマウス等の入力装置の操作によって所望の制御方法の種別と所望の制御パラメータと補正目的の種別との供給を受けると、これら制御方法の種別と制御パラメータと補正目的の種別とを含めた制御条件情報を生成して目標値生成部50に供給する。
次に、ステップS102において、目標値生成部50の制御条件設定部52は、制御条件情報生成部40から供給される制御条件情報を取り込み、その制御条件情報に含まれる制御方法の種別と制御パラメータと補正目的の種別とを制御情報取得部53に設定する。
次に、ステップS103において、音声データ取得部10は、音声データの供給を受けると、その音声データを取り込んで音声分析部30に供給する。さらに、音声属性情報取得部20は、音声データ取得部10に供給される音声データに関連する音声属性情報の供給を受けると、その音声属性情報を取り込んで音声分析部30に供給する。
次に、ステップS107において、音声データ補正部80は、制御情報取得部53から供給された話速の制御量と、目標基本周波数生成部54から供給された目標基本周波数の時間変化情報とをそれぞれ取り込むと、音声データ取得部10が取得した音声データの韻律を補正して補正後音声データを出力する。
したがって、本実施形態である音声合成装置100によれば、音響に関する専門知識や豊かな調整経験を必要とせず、容易に且つ効率的に音声データを聴き易い補正後音声データに補正することができる。
図8は、本発明の第2実施形態である音声合成装置の機能構成を示すブロック図である。なお、本実施形態において、第1実施形態である音声合成装置100の構成と同一の構成については、同一の符号を付してその説明を省略する。同図に示す音声合成装置100aは、音声合成装置100の構成における制御条件情報生成部40と目標値生成部50とを、それぞれ、制御条件情報生成部40aと目標値生成部50aとに変更したものである。
本実施形態における制御方法の種別について具体的に説明する。本実施形態における制御方法の種別は定性的に制御量を指定する制御方法であり、下記の表2のように分類される。
この制御方法Aは、老人性難聴の症状を有する高齢者や他の難聴者等に、ゆっくりとした速度で且つ音域を拡張した聴き取り易い音声を提供する場合に好適な制御方法である。
この制御方法Bは、聴き取り可能な程度の速い速度で且つ音域を少し狭めた速聴向けの音声を提供する場合に好適な制御方法である。
この制御方法Cは、違和感を与えない程度の速い速度で且つ音域を狭めた早口音声を提供する場合に好適な制御方法である。
この制御方法Dは、話速を変えることなく且つ音域を拡張して、例えば騒音・雑音環境下において聴き取り易い音声を提供する場合に好適な制御方法である。
制御情報テーブル記憶部51aは、読み出しおよび書き込み可能な記憶装置であり、例えば、磁気ハードディスク装置、半導体記憶装置等である。また、制御情報テーブル記憶部51aは、光磁気ディスク等の可搬型記録媒体であってもよい。
図10は、速聴向けの制御情報が格納された制御情報テーブルの例を示す図である。同図に示す速聴向けの制御情報テーブルは、音声データの話速を2.0倍する指定と、音声データの基本周波数の変化幅を0.93倍する指定とを含んでいる。
図11は、早口向けの制御情報が格納された制御情報テーブルの例を示す図である。同図に示す早口向けの制御情報テーブルは、音声データの話速を1.4倍する指定と、音声データの基本周波数の変化幅を0.84倍する指定とを含んでいる。
図12は、雑音環境下向けの制御情報テーブルの例を示す図である。同図に示す雑音環境下向けの制御情報テーブルは、音声データの話速を固定(1.0倍)する指定と、音声データの基本周波数の変化幅を1.15倍する指定とを含んでいる。
なお、図9から図12までの制御情報テーブルの例は、話速計算部32から供給される音声データの話速値が7モーラ/秒から8モーラ/秒程度である場合の例である。
まず、ステップS101aにおいて、制御条件情報生成部40aは、ユーザによるキーボードやマウス等の入力装置の操作によって所望の制御方法の種別の供給を受けると、この制御方法の種別を含めた制御条件情報を生成して目標値生成部50aに供給する。
次に、ステップS102aにおいて、目標値生成部50aの制御条件設定部52aは、制御条件情報生成部40aから供給される制御条件情報を取り込み、その制御条件情報に含まれる制御方法の種別を制御情報取得部53aに設定する。
したがって、本実施形態である音声合成装置100aによれば、音響に関する専門知識や豊かな調整経験を必要とせず、容易に且つ効率的に音声データを聴き易い補正後音声データに補正することができる。
20 音声属性情報取得部
30 音声分析部
31 基本周波数分析部
32 話速計算部
40,40a 制御条件情報生成部
50,50a 目標値生成部
51,51a 制御情報テーブル記憶部
52,52a 制御条件設定部
53,53a 制御情報取得部
54 目標基本周波数生成部
60 制御情報テーブル更新部
70 生成条件取得部
80 音声データ補正部
Claims (2)
- 話速の制御量と基本周波数の変化幅の制御量とを対応付けた制御情報テーブルを、制御方法の種別に関連付けて記憶する制御情報テーブル記憶部と、
音声データを取得する音声データ取得部と、
前記音声データ取得部が取得した前記音声データに基づいて基本周波数の時間変化情報を生成する基本周波数分析部と、
前記音声データに基づいて話速値を計算する話速計算部と、
所望の制御方法の種別と制御情報テーブルにおける話速の制御量または基本周波数の変化幅の制御量を指定するキー情報と補正目的の種別とを設定する制御条件設定部と、
前記制御条件設定部が設定した前記制御方法の種別と補正目的の種別とに関連付けられた制御情報テーブルを前記制御情報テーブル記憶部から読み込み、前記制御条件設定部が設定した前記キー情報と前記話速計算部が計算した前記話速値と前記基本周波数分析部が生成した前記基本周波数の時間変化情報とに基づいて、話速の制御量と基本周波数の変化幅の制御量とを取得する制御情報取得部と、
前記制御情報取得部が取得した前記基本周波数の変化幅の制御量に基づいて、前記基本周波数の時間変化情報から目標基本周波数の時間変化情報を生成する目標基本周波数生成部と、
前記制御情報取得部が取得した前記話速の制御量と、前記目標基本周波数生成部が生成した前記目標基本周波数の時間変化情報とに基づいて、前記音声データを補正して補正後音声データを出力する音声データ補正部と、
を備える音声合成装置であって、
話速の倍率を話速の制御量とし、基本周波数の変化幅の倍率を基本周波数の変化幅の制御量とし、前記制御情報テーブル記憶部は、複数の話速の倍率それぞれに基本周波数の変化幅の倍率を対応付けた制御情報テーブルを制御方法の種別と補正目的の種別とに関連付けて記憶し、
前記制御条件設定部は、前記キー情報についての所望の倍率をさらに設定し、
前記制御情報取得部は、前記制御条件設定部が設定した前記キー情報と前記倍率と前記話速計算部が計算した前記話速値と前記基本周波数分析部が生成した前記基本周波数の時間変化情報とに基づいて、話速の制御量と基本周波数の変化幅の制御量とを取得するものであり、
前記制御情報テーブル記憶部は、複数の指定話速値それぞれに対応して、複数の話速の倍率それぞれに基本周波数の変化幅の倍率を対応付けた制御情報テーブルを制御方法の種別と補正目的の種別とに関連付けて記憶し、
前記制御情報取得部は、前記制御条件設定部が設定した前記制御方法の種別と補正目的の種別とに関連し且つ前記話速計算部が計算した前記話速値と同一である指定話速値に対応する制御情報テーブルを前記制御情報テーブル記憶部から読み込み、前記制御条件設定部が設定した前記キー情報と前記倍率と前記話速値と前記基本周波数分析部が生成した前記基本周波数の時間変化情報とに基づいて、話速の制御量と基本周波数の変化幅の制御量とを取得する、
ことを特徴とする音声合成装置。 - 話速の制御量と基本周波数の変化幅の制御量とを対応付けた制御情報テーブルを、制御方法の種別に関連付けて記憶する制御情報テーブル記憶部を備えるコンピュータを、
音声データを取得する音声データ取得手段と、
前記音声データ取得手段が取得した前記音声データに基づいて基本周波数の時間変化情報を生成する基本周波数分析手段と、
前記音声データに基づいて話速値を計算する話速計算手段と、
所望の制御方法の種別と制御情報テーブルにおける話速の制御量または基本周波数の変化幅の制御量を示すキー情報と補正目的の種別とを設定する制御条件設定手段と、
前記制御条件設定手段が設定した前記制御方法の種別と補正目的の種別とに関連付けられた制御情報テーブルを前記制御情報テーブル記憶部から読み込み、前記制御条件設定手段が設定した前記キー情報と前記話速計算手段が計算した前記話速値と前記基本周波数分析手段が生成した前記基本周波数の時間変化情報とに基づいて、話速の制御量と基本周波数の変化幅の制御量とを取得する制御情報取得手段と、
前記制御情報取得手段が取得した前記基本周波数の変化幅の制御量に基づいて、前記基本周波数の時間変化情報から目標基本周波数の時間変化情報を生成する目標基本周波数生成手段と、
前記制御情報取得手段が取得した前記話速の制御量と、前記目標基本周波数生成手段が生成した前記目標基本周波数の時間変化情報とに基づいて、前記音声データを補正して補正後音声データを出力する音声データ補正手段と、
として機能させるためのコンピュータプログラムであって、
話速の倍率を話速の制御量とし、基本周波数の変化幅の倍率を基本周波数の変化幅の制御量とし、前記制御情報テーブル記憶部は、複数の話速の倍率それぞれに基本周波数の変化幅の倍率を対応付けた制御情報テーブルを制御方法の種別と補正目的の種別とに関連付けて記憶し、
前記制御条件設定手段は、前記キー情報についての所望の倍率をさらに設定し、
前記制御情報取得手段は、前記制御条件設定手段が設定した前記キー情報と前記倍率と前記話速計算手段が計算した前記話速値と前記基本周波数分析手段が生成した前記基本周波数の時間変化情報とに基づいて、話速の制御量と基本周波数の変化幅の制御量とを取得するものであり、
前記制御情報テーブル記憶部は、複数の指定話速値それぞれに対応して、複数の話速の倍率それぞれに基本周波数の変化幅の倍率を対応付けた制御情報テーブルを制御方法の種別と補正目的の種別とに関連付けて記憶し、
前記制御情報取得手段は、前記制御条件設定手段が設定した前記制御方法と補正目的の種別との種別に関連し且つ前記話速計算手段が計算した前記話速値と同一である指定話速値に対応する制御情報テーブルを前記制御情報テーブル記憶部から読み込み、前記制御条件設定手段が設定した前記キー情報と前記倍率と前記話速値と前記基本周波数分析手段が生成した前記基本周波数の時間変化情報とに基づいて、話速の制御量と基本周波数の変化幅の制御量とを取得する、
ことを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010177776A JP5518621B2 (ja) | 2010-08-06 | 2010-08-06 | 音声合成装置およびコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010177776A JP5518621B2 (ja) | 2010-08-06 | 2010-08-06 | 音声合成装置およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012037726A JP2012037726A (ja) | 2012-02-23 |
JP5518621B2 true JP5518621B2 (ja) | 2014-06-11 |
Family
ID=45849776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010177776A Expired - Fee Related JP5518621B2 (ja) | 2010-08-06 | 2010-08-06 | 音声合成装置およびコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5518621B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102013224417B3 (de) * | 2013-11-28 | 2015-05-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Hörhilfevorrichtung mit Grundfrequenzmodifizierung, Verfahren zur Verarbeitung eines Sprachsignals und Computerprogramm mit einem Programmcode zur Durchführung des Verfahrens |
JP6277739B2 (ja) * | 2014-01-28 | 2018-02-14 | 富士通株式会社 | 通信装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08171395A (ja) * | 1994-12-19 | 1996-07-02 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成装置 |
JP2002268700A (ja) * | 2001-03-09 | 2002-09-20 | Canon Inc | 音響情報符号化装置及び復号装置及び方法及びコンピュータプログラム及び記憶媒体 |
-
2010
- 2010-08-06 JP JP2010177776A patent/JP5518621B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012037726A (ja) | 2012-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7739113B2 (en) | Voice synthesizer, voice synthesizing method, and computer program | |
Janse | Word perception in fast speech: artificially time-compressed vs. naturally produced fast speech | |
JP7228998B2 (ja) | 音声合成装置及びプログラム | |
US20080319755A1 (en) | Text-to-speech apparatus | |
US20090006098A1 (en) | Text-to-speech apparatus | |
CN105957515B (zh) | 声音合成方法、声音合成装置和存储声音合成程序的介质 | |
JP5029168B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
JP2007140200A (ja) | 語学学習装置およびプログラム | |
JP2023007405A (ja) | 音声変換装置、音声変換方法、プログラム、および記録媒体 | |
Vojtech et al. | The effects of modulating fundamental frequency and speech rate on the intelligibility, communication efficiency, and perceived naturalness of synthetic speech | |
JP5518621B2 (ja) | 音声合成装置およびコンピュータプログラム | |
JP4953767B2 (ja) | 音声生成装置 | |
JP6314879B2 (ja) | 音読評価装置、音読評価方法、及びプログラム | |
JP2007271910A (ja) | 合成音声生成装置 | |
JPH07140996A (ja) | 音声規則合成装置 | |
KR20040015605A (ko) | 가상노래 합성장치 및 방법 | |
JP4260071B2 (ja) | 音声合成方法、音声合成プログラム及び音声合成装置 | |
JP2010224392A (ja) | 発話補助装置、方法及びプログラム | |
CN113255313B (zh) | 音乐生成方法、装置、电子设备和存储介质 | |
JP3113101B2 (ja) | 音声合成装置 | |
JP6191094B2 (ja) | 音声素片切出装置 | |
JP2004004952A (ja) | 音声合成装置および音声合成方法 | |
JP2000310995A (ja) | 音声合成方法及び音声合成装置、並びに音声合成装置を備えた電話機 | |
JP5677137B2 (ja) | 韻律変換装置およびプログラム | |
JP2001265374A (ja) | 音声合成装置及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130225 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20130225 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131024 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131205 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140304 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140402 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5518621 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |