JP2012048154A - 音声合成装置、音声合成方法およびプログラム - Google Patents
音声合成装置、音声合成方法およびプログラム Download PDFInfo
- Publication number
- JP2012048154A JP2012048154A JP2010192656A JP2010192656A JP2012048154A JP 2012048154 A JP2012048154 A JP 2012048154A JP 2010192656 A JP2010192656 A JP 2010192656A JP 2010192656 A JP2010192656 A JP 2010192656A JP 2012048154 A JP2012048154 A JP 2012048154A
- Authority
- JP
- Japan
- Prior art keywords
- band
- spectrum
- speech
- unit
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/04—Details of speech synthesis systems, e.g. synthesiser structure or memory management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Abstract
【解決手段】第1記憶部は、n個の帯域通過フィルタを雑音信号に適用したn個の帯域雑音信号を記憶する。第2記憶部は、n個の帯域通過フィルタをパルス信号に適用したn個の帯域パルス信号を記憶する。パラメータ入力部は、基本周波数、n個の帯域雑音強度およびスペクトルパラメータを入力する。切出部は、ピッチマークごとにn個の帯域雑音信号をシフトしながら切り出す。振幅制御部は、切り出した帯域雑音信号の振幅と帯域パルス信号の振幅とを帯域雑音強度に応じて変更する。生成部は、n個の帯域雑音信号とn個の帯域パルス信号とを加算した混合音源信号を生成する。重畳部は、ピッチマークに基づいて生成された混合音源信号を重畳する。声道フィルタ部は、重畳された混合音源信号にスペクトルパラメータを用いた声道フィルタを適用して音声波形を生成する。
【選択図】図1
Description
第1の実施形態にかかる音声合成装置は、予め帯域通過フィルタを適用したパルス信号(帯域パルス信号)および雑音信号(帯域雑音信号)を記憶し、帯域雑音信号から巡回シフトまたは往復シフトさせながら切り出した帯域雑音信号を用いてソースフィルタモデルの音源信号を生成することにより、高速に音声波形を生成する。
第2の実施形態にかかる音声合成装置200は、ピッチマークと音声波形を入力し、ピッチ同期分析したスペクトルを固定フレームレートに補間することにより得られたスペクトルにより音声を分析して音声パラメータを生成する。これにより精密な音声分析が可能になり、このようにして生成された音声パラメータから音声を合成することで、高品質な合成音声を作成することが可能になる。
音声パラメータを入力して音声波形の生成を行う音声合成装置のみでなく、入力したテキストデータ(以下、単にテキストという)から音声を合成する装置も広く音声合成装置と呼ばれる。このような音声合成装置の1つとして隠れマルコフモデル(HMM)に基づく音声合成が提案されている。HMMに基づく音声合成は、様々なコンテキスト情報(文内の位置、呼気段落内の位置、単語内の位置、および、前後の音素環境など)を考慮した音素単位のHMMを、最尤推定および、決定木に基づく状態クラスタリングによって構築する。音声を合成する際には、入力テキストから変換して得られるコンテキスト情報によって決定木を辿ることにより分布列を作成し、得られた分布列から音声パラメータ列を生成する。音声パラメータ列から、例えばメルケプストラムによるソースフィルタ型の音声合成装置などを利用することにより音声波形生成を行う。HMMの出力分布に、動的特徴量を加え、この動的特徴量を考慮したパラメータ生成アルゴリズムを用いて音声パラメータ列を生成することにより、滑らかに接続された音声が合成される。
11 第1パラメータ入力部
12 音源信号生成部
13 声道フィルタ部
14 波形出力部
201 第2パラメータ入力部
202 判断部
203 ピッチマーク作成部
204 混合音源作成部
205 重畳部
206 雑音音源作成部
207 接続部
221 第1記憶部
222 第2記憶部
223 第3記憶部
301 切出部
302 振幅制御部
303 生成部
Claims (12)
- n個(nは2以上の整数)の通過帯域に対応するn個の帯域通過フィルタそれぞれを雑音信号に適用して得られるn個の帯域雑音信号を記憶する第1記憶部と、
n個の前記帯域通過フィルタそれぞれをパルス信号に適用して得られるn個の帯域パルス信号を記憶する第2記憶部と、
合成する音声の基本周波数系列と、n個の前記通過帯域それぞれの雑音の強度を表すn個の帯域雑音強度系列と、スペクトルパラメータ系列とを入力するパラメータ入力部と、
前記基本周波数系列から作成した前記合成する音声のピッチマークごとに、前記第1記憶部に記憶されたn個の前記帯域雑音信号をシフトしながら切り出す切出部と、
n個の前記通過帯域ごとに、切り出した前記帯域雑音信号の振幅と、前記帯域パルス信号の振幅とを、前記通過帯域の前記帯域雑音強度系列に応じて変更する振幅制御部と、
振幅を変更したn個の前記帯域雑音信号と、振幅を変更したn個の前記帯域パルス信号とを加算した前記ピッチマークごとの混合音源信号を生成する生成部と、
前記ピッチマークごとの前記混合音源信号を重畳する重畳部と、
重畳された前記混合音源信号に前記スペクトルパラメータ系列を用いた声道フィルタを適用して音声波形を生成する声道フィルタ部と、
を備えることを特徴とする音声合成装置。 - 音声信号と前記ピッチマークとを入力する音声入力部と、
前記ピッチマークを中心として前記音声信号に窓関数を適用することにより音声波形を抽出する波形抽出部と、
前記音声波形をスペクトル分析して前記音声波形のスペクトルを表す音声スペクトルを算出するスペクトル分析部と、
予め定められたフレームレートの各フレーム時刻に隣接する複数の前記ピッチマークの前記音声スペクトルを補間することにより、前記フレームレートの各フレーム時刻の音声スペクトルを算出する補間部と、
前記補間部により得られた音声スペクトルに基づいて前記スペクトルパラメータ系列を算出するパラメータ算出部と、をさらに備え、
前記パラメータ入力部は、前記基本周波数系列と、前記帯域雑音強度系列と、算出された前記スペクトルパラメータ系列とを入力すること、
を特徴とする請求項1に記載の音声合成装置。 - 音声信号と前記音声信号の雑音成分と前記ピッチマークとを入力する音声入力部と、
前記ピッチマークを中心として前記音声信号に窓関数を適用することにより音声波形を抽出し、前記ピッチマークを中心として前記雑音成分に窓関数を適用することにより雑音成分波形を抽出する波形抽出部と、
前記音声波形および前記雑音成分波形をスペクトル分析して前記音声波形のスペクトルを表す音声スペクトルおよび前記雑音成分のスペクトルを表す雑音成分スペクトルを算出するスペクトル分析部と、
予め定められたフレームレートの各フレーム時刻に隣接する複数の前記ピッチマークの前記音声スペクトルおよび前記雑音成分スペクトルを補間することにより、前記フレームレートの各フレーム時刻の音声スペクトルおよび雑音成分スペクトルを算出し、算出した音声スペクトルに対する雑音成分スペクトルの割合を表す雑音成分指標を算出する、または、前記フレームレートの各フレーム時刻に隣接する複数の前記ピッチマークの前記音声スペクトルに対する前記雑音成分スペクトルの割合を補間することにより、前記フレームレートの各フレーム時刻の音声スペクトルに対する雑音成分スペクトルの割合を表す雑音成分指標を算出する補間部と、
算出された雑音成分指標に基づいて、前記帯域雑音強度系列を算出するパラメータ算出部と、をさらに備え、
前記パラメータ入力部は、前記基本周波数系列と、算出された前記帯域雑音強度系列と、前記スペクトルパラメータ系列とを入力すること、
を特徴とする請求項1に記載の音声合成装置。 - 前記音声入力部は、前記音声信号と、前記音声信号のスペクトルの基本周波数の整数倍以外の成分を表す前記雑音成分と、前記ピッチマークとを入力すること、
を特徴とする請求項3に記載の音声合成装置。 - 予め定められた閾値を超える最大の周波数である境界周波数を、有声音のスペクトルから抽出する境界周波数抽出部と、
前記境界周波数より低い周波数帯域は音源信号がパルス信号となるように前記雑音成分指標を補正する補正部と、をさらに備えること、
を特徴とする請求項3に記載の音声合成装置。 - 予め定められた初期周波数から単調増加または単調減少する範囲で予め定められた閾値を超える最大の周波数である境界周波数を、有声摩擦音のスペクトルから抽出する境界周波数抽出部と、
前記境界周波数より低い周波数帯域は音源信号がパルス信号となるように前記雑音成分指標を補正する補正部と、をさらに備えること、
を特徴とする請求項3に記載の音声合成装置。 - 予め定められた音声単位に対する基本周波数系列、帯域雑音強度系列、およびスペクトルパラメータ系列の出力確率分布パラメータを含む隠れマルコフモデルパラメータを記憶する隠れマルコフモデル記憶部と、
入力されたテキストデータに含まれる前記音声単位を解析する言語解析部と、
解析された前記音声単位および前記隠れマルコフモデルパラメータに基づいて、入力されたテキストデータに対する前記基本周波数系列、前記帯域雑音強度系列および前記スペクトルパラメータ系列を生成する音声パラメータ生成部と、をさらに備え、
前記パラメータ入力部は、生成された前記基本周波数系列、前記帯域雑音強度系列、および、前記スペクトルパラメータ系列を入力すること、
を特徴とする請求項1に記載の音声合成装置。 - 前記第1記憶部に記憶された前記帯域雑音信号は、音質劣化しない最小の長さとして予め定められた規定長以上の長さであること、
を特徴とする請求項1に記載の音声合成装置。 - 前記規定長は5ミリ秒であること、
を特徴とする請求項7に記載の音声合成装置。 - 前記第1記憶部に記憶された前記帯域雑音信号は、対応する前記通過帯域が大きい前記帯域雑音信号が、対応する前記通過帯域が小さい前記帯域雑音信号より長く、対応する前記通過帯域が小さい前記帯域雑音信号が、音質劣化しない最小の長さとして予め定められた規定長以上の長さであること、
を特徴とする請求項1に記載の音声合成装置。 - n個(nは2以上の整数)の通過帯域に対応するn個の帯域通過フィルタそれぞれを雑音信号に適用して得られるn個の帯域雑音信号を記憶する第1記憶部と、n個の前記帯域通過フィルタそれぞれをパルス信号に適用して得られるn個の帯域パルス信号を記憶する第2記憶部と、を備える音声合成装置で実行される音声合成方法であって、
合成する音声の基本周波数系列と、n個の前記通過帯域それぞれの雑音の強度を表すn個の帯域雑音強度系列と、スペクトルパラメータ系列とを入力するパラメータ入力ステップと、
前記基本周波数系列から作成した合成する音声のピッチマークごとに、前記第1記憶部に記憶されたn個の前記帯域雑音信号をシフトしながら切り出す切出ステップと、
n個の前記通過帯域ごとに、切り出した前記帯域雑音信号の振幅と、前記帯域パルス信号の振幅とを、前記通過帯域の前記帯域雑音強度系列に応じて変更する振幅制御ステップと、
振幅を変更したn個の前記帯域雑音信号と、振幅を変更したn個の前記帯域パルス信号とを加算した前記ピッチマークごとの混合音源信号を生成する生成ステップと、
前記ピッチマークごとの前記混合音源信号を重畳する重畳ステップと、
重畳された前記混合音源信号に前記スペクトルパラメータ系列を用いた声道フィルタを適用して音声波形を生成する声道フィルタステップと、
を含むことを特徴とする音声合成方法。 - コンピュータを、
n個(nは2以上の整数)の通過帯域に対応するn個の帯域通過フィルタそれぞれを雑音信号に適用して得られるn個の帯域雑音信号を記憶する第1記憶部と、
n個の前記帯域通過フィルタそれぞれをパルス信号に適用して得られるn個の帯域パルス信号を記憶する第2記憶部と、
合成する音声の基本周波数系列と、n個の前記通過帯域それぞれの雑音の強度を表すn個の帯域雑音強度系列と、スペクトルパラメータ系列とを入力するパラメータ入力部と、
前記基本周波数系列から作成した前記合成する音声のピッチマークごとに、前記第1記憶部に記憶されたn個の前記帯域雑音信号をシフトしながら切り出す切出部と、
n個の前記通過帯域ごとに、切り出した前記帯域雑音信号の振幅と、前記帯域パルス信号の振幅とを、前記通過帯域の前記帯域雑音強度系列に応じて変更する振幅制御部と、
振幅を変更したn個の前記帯域雑音信号と、振幅を変更したn個の前記帯域パルス信号とを加算した前記ピッチマークごとの混合音源信号を生成する生成部と、
前記ピッチマークごとの前記混合音源信号を重畳する重畳部と、
重畳された前記混合音源信号に前記スペクトルパラメータ系列を用いた声道フィルタを適用して音声波形を生成する声道フィルタ部、
として機能させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010192656A JP5085700B2 (ja) | 2010-08-30 | 2010-08-30 | 音声合成装置、音声合成方法およびプログラム |
US13/051,541 US9058807B2 (en) | 2010-08-30 | 2011-03-18 | Speech synthesizer, speech synthesis method and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010192656A JP5085700B2 (ja) | 2010-08-30 | 2010-08-30 | 音声合成装置、音声合成方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012048154A true JP2012048154A (ja) | 2012-03-08 |
JP5085700B2 JP5085700B2 (ja) | 2012-11-28 |
Family
ID=45698345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010192656A Active JP5085700B2 (ja) | 2010-08-30 | 2010-08-30 | 音声合成装置、音声合成方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US9058807B2 (ja) |
JP (1) | JP5085700B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101402805B1 (ko) * | 2012-03-27 | 2014-06-03 | 광주과학기술원 | 음성분석장치, 음성합성장치, 및 음성분석합성시스템 |
JP2017520016A (ja) * | 2014-05-28 | 2017-07-20 | インタラクティブ・インテリジェンス・インコーポレイテッド | パラメトリック音声合成システムに基づく声門パルスモデルの励磁信号形成方法 |
JP2017167526A (ja) * | 2016-03-14 | 2017-09-21 | 株式会社東芝 | 統計的パラメトリック音声合成のためのマルチストリームスペクトル表現 |
US10878801B2 (en) | 2015-09-16 | 2020-12-29 | Kabushiki Kaisha Toshiba | Statistical speech synthesis device, method, and computer program product using pitch-cycle counts based on state durations |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013003470A (ja) * | 2011-06-20 | 2013-01-07 | Toshiba Corp | 音声処理装置、音声処理方法および音声処理方法により作成されたフィルタ |
US8620646B2 (en) * | 2011-08-08 | 2013-12-31 | The Intellisis Corporation | System and method for tracking sound pitch across an audio signal using harmonic envelope |
JP5631915B2 (ja) | 2012-03-29 | 2014-11-26 | 株式会社東芝 | 音声合成装置、音声合成方法、音声合成プログラムならびに学習装置 |
CN105122351B (zh) | 2013-01-18 | 2018-11-13 | 株式会社东芝 | 声音合成装置及声音合成方法 |
KR102148407B1 (ko) * | 2013-02-27 | 2020-08-27 | 한국전자통신연구원 | 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법 |
US9607610B2 (en) * | 2014-07-03 | 2017-03-28 | Google Inc. | Devices and methods for noise modulation in a universal vocoder synthesizer |
WO2016042659A1 (ja) | 2014-09-19 | 2016-03-24 | 株式会社東芝 | 音声合成装置、音声合成方法およびプログラム |
CN105989836B (zh) * | 2015-03-06 | 2020-12-01 | 腾讯科技(深圳)有限公司 | 一种语音采集方法、装置及终端设备 |
CN104916282B (zh) * | 2015-03-27 | 2018-11-06 | 北京捷通华声科技股份有限公司 | 一种语音合成的方法和装置 |
TWI569263B (zh) * | 2015-04-30 | 2017-02-01 | 智原科技股份有限公司 | 聲頻訊號的訊號擷取方法與裝置 |
CN107924686B (zh) | 2015-09-16 | 2022-07-26 | 株式会社东芝 | 语音处理装置、语音处理方法以及存储介质 |
US10586526B2 (en) * | 2015-12-10 | 2020-03-10 | Kanru HUA | Speech analysis and synthesis method based on harmonic model and source-vocal tract decomposition |
CN107871494B (zh) * | 2016-09-23 | 2020-12-11 | 北京搜狗科技发展有限公司 | 一种语音合成的方法、装置及电子设备 |
EP3553950B1 (en) * | 2016-12-06 | 2023-10-11 | Nippon Telegraph and Telephone Corporation | Signal feature extraction device, signal feature extraction method, and program |
KR102136464B1 (ko) * | 2018-07-31 | 2020-07-21 | 전자부품연구원 | 어텐션 메커니즘 기반의 오디오 분할 방법 |
US11468879B2 (en) * | 2019-04-29 | 2022-10-11 | Tencent America LLC | Duration informed attention network for text-to-speech analysis |
KR102321798B1 (ko) * | 2019-08-15 | 2021-11-05 | 엘지전자 주식회사 | 인공 신경망 기반의 음성 인식 모델을 학습시키는 방법 및 음성 인식 디바이스 |
JP7334942B2 (ja) * | 2019-08-19 | 2023-08-29 | 国立大学法人 東京大学 | 音声変換装置、音声変換方法及び音声変換プログラム |
US11151979B2 (en) | 2019-08-23 | 2021-10-19 | Tencent America LLC | Duration informed attention network (DURIAN) for audio-visual synthesis |
WO2021127978A1 (zh) * | 2019-12-24 | 2021-07-01 | 深圳市优必选科技股份有限公司 | 语音合成方法、装置、计算机设备和存储介质 |
CN113409756B (zh) * | 2020-03-16 | 2022-05-03 | 阿里巴巴集团控股有限公司 | 语音合成方法、系统、设备及存储介质 |
CN113689837B (zh) * | 2021-08-24 | 2023-08-29 | 北京百度网讯科技有限公司 | 音频数据处理方法、装置、设备以及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03123400A (ja) * | 1989-10-06 | 1991-05-27 | Kokusai Electric Co Ltd | 線形予測分析・合成方式の復号器 |
JPH04116700A (ja) * | 1990-09-07 | 1992-04-17 | Mitsubishi Electric Corp | 音声分析・合成装置 |
JPH07239700A (ja) * | 1994-03-02 | 1995-09-12 | Nec Corp | 音声符号化装置 |
JPH09319398A (ja) * | 1996-05-27 | 1997-12-12 | Nec Corp | 信号符号化装置 |
JPH11272296A (ja) * | 1998-03-23 | 1999-10-08 | Toshiba Corp | 音声符号化/復号化方法 |
JP2000356995A (ja) * | 1999-04-16 | 2000-12-26 | Matsushita Electric Ind Co Ltd | 音声通信システム |
JP2001051698A (ja) * | 1999-08-06 | 2001-02-23 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
JP2002268660A (ja) * | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
JP2009244723A (ja) * | 2008-03-31 | 2009-10-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声分析合成装置、音声分析合成方法、コンピュータプログラム、および記録媒体 |
JP2010049196A (ja) * | 2008-08-25 | 2010-03-04 | Toshiba Corp | 声質変換装置及び方法、音声合成装置及び方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08254993A (ja) * | 1995-03-16 | 1996-10-01 | Toshiba Corp | 音声合成装置 |
JP4380669B2 (ja) * | 2006-08-07 | 2009-12-09 | カシオ計算機株式会社 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、及び、プログラム |
JP5159279B2 (ja) * | 2007-12-03 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそれを用いた音声合成装置。 |
JP5159325B2 (ja) | 2008-01-09 | 2013-03-06 | 株式会社東芝 | 音声処理装置及びそのプログラム |
-
2010
- 2010-08-30 JP JP2010192656A patent/JP5085700B2/ja active Active
-
2011
- 2011-03-18 US US13/051,541 patent/US9058807B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03123400A (ja) * | 1989-10-06 | 1991-05-27 | Kokusai Electric Co Ltd | 線形予測分析・合成方式の復号器 |
JPH04116700A (ja) * | 1990-09-07 | 1992-04-17 | Mitsubishi Electric Corp | 音声分析・合成装置 |
JPH07239700A (ja) * | 1994-03-02 | 1995-09-12 | Nec Corp | 音声符号化装置 |
JPH09319398A (ja) * | 1996-05-27 | 1997-12-12 | Nec Corp | 信号符号化装置 |
JPH11272296A (ja) * | 1998-03-23 | 1999-10-08 | Toshiba Corp | 音声符号化/復号化方法 |
JP2000356995A (ja) * | 1999-04-16 | 2000-12-26 | Matsushita Electric Ind Co Ltd | 音声通信システム |
JP2001051698A (ja) * | 1999-08-06 | 2001-02-23 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化復号方法および装置 |
JP2002268660A (ja) * | 2001-03-13 | 2002-09-20 | Japan Science & Technology Corp | テキスト音声合成方法および装置 |
JP2009244723A (ja) * | 2008-03-31 | 2009-10-22 | Nippon Telegr & Teleph Corp <Ntt> | 音声分析合成装置、音声分析合成方法、コンピュータプログラム、および記録媒体 |
JP2010049196A (ja) * | 2008-08-25 | 2010-03-04 | Toshiba Corp | 声質変換装置及び方法、音声合成装置及び方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101402805B1 (ko) * | 2012-03-27 | 2014-06-03 | 광주과학기술원 | 음성분석장치, 음성합성장치, 및 음성분석합성시스템 |
US9390728B2 (en) | 2012-03-27 | 2016-07-12 | Gwangju Institute Of Science And Technology | Voice analysis apparatus, voice synthesis apparatus, voice analysis synthesis system |
JP2017520016A (ja) * | 2014-05-28 | 2017-07-20 | インタラクティブ・インテリジェンス・インコーポレイテッド | パラメトリック音声合成システムに基づく声門パルスモデルの励磁信号形成方法 |
US10878801B2 (en) | 2015-09-16 | 2020-12-29 | Kabushiki Kaisha Toshiba | Statistical speech synthesis device, method, and computer program product using pitch-cycle counts based on state durations |
US11423874B2 (en) | 2015-09-16 | 2022-08-23 | Kabushiki Kaisha Toshiba | Speech synthesis statistical model training device, speech synthesis statistical model training method, and computer program product |
JP2017167526A (ja) * | 2016-03-14 | 2017-09-21 | 株式会社東芝 | 統計的パラメトリック音声合成のためのマルチストリームスペクトル表現 |
Also Published As
Publication number | Publication date |
---|---|
US20120053933A1 (en) | 2012-03-01 |
JP5085700B2 (ja) | 2012-11-28 |
US9058807B2 (en) | 2015-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5085700B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
US11170756B2 (en) | Speech processing device, speech processing method, and computer program product | |
US11423874B2 (en) | Speech synthesis statistical model training device, speech synthesis statistical model training method, and computer program product | |
US8255222B2 (en) | Speech separating apparatus, speech synthesizing apparatus, and voice quality conversion apparatus | |
JP5038995B2 (ja) | 声質変換装置及び方法、音声合成装置及び方法 | |
US8195464B2 (en) | Speech processing apparatus and program | |
US10529314B2 (en) | Speech synthesizer, and speech synthesis method and computer program product utilizing multiple-acoustic feature parameters selection | |
US8301451B2 (en) | Speech synthesis with dynamic constraints | |
US8370153B2 (en) | Speech analyzer and speech analysis method | |
US20100217584A1 (en) | Speech analysis device, speech analysis and synthesis device, correction rule information generation device, speech analysis system, speech analysis method, correction rule information generation method, and program | |
WO2015025788A1 (ja) | 定量的f0パターン生成装置及び方法、並びにf0パターン生成のためのモデル学習装置及び方法 | |
US10446133B2 (en) | Multi-stream spectral representation for statistical parametric speech synthesis | |
JP2015161774A (ja) | 音合成方法及び音合成装置 | |
JP5075865B2 (ja) | 音声処理装置、方法、及びプログラム | |
JPH0247700A (ja) | 音声合成方法および装置 | |
JP2018004997A (ja) | 音声合成装置及びプログラム | |
Ngo et al. | Toward a rule-based synthesis of vietnamese emotional speech | |
Anil et al. | Pitch and duration modification for expressive speech synthesis in Marathi TTS system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120807 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120905 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5085700 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150914 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |