JP2016065900A - 音声合成装置、方法、およびプログラム - Google Patents
音声合成装置、方法、およびプログラム Download PDFInfo
- Publication number
- JP2016065900A JP2016065900A JP2014193112A JP2014193112A JP2016065900A JP 2016065900 A JP2016065900 A JP 2016065900A JP 2014193112 A JP2014193112 A JP 2014193112A JP 2014193112 A JP2014193112 A JP 2014193112A JP 2016065900 A JP2016065900 A JP 2016065900A
- Authority
- JP
- Japan
- Prior art keywords
- segment
- prosody
- data
- speech
- cost
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
Description
(付記1)
入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するセグメントデータ列抽出手段と、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させる目標韻律移動手段と、
前記目標韻律移動手段により目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定する素片列選択手段と、
前記素片選定手段により、前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定する素片列決定手段と、
当該決定された素片の列に基づいて合成音声を出力する波形合成手段と、
を備える音声合成装置。
(付記2)
前記目標韻律移動手段は、前記目標韻律に含まれる基本周波数を、予め設定された範囲内で予め設定された間隔で順次移動させる、付記1に記載の音声合成装置。
(付記3)
前記素片列選択手段は、
前記音声コーパスから、前記抽出されたセグメントデータに含まれる音素と一致する音素を有する素片全てを選択する素片選択手段と、
前記選択された素片毎に、当該素片に対応付けられた音素及び韻律に基づいた素片コストを算出する素片コスト算出手段と、
前記選択された素片夫々を、前記抽出されたセグメントデータに対応して並べて素片列を生成した場合の接続コストを算出する接続コスト算出手段と、
前記算出された音素列コスト、韻律コスト及び接続コストを含む総合コストが最良となる素片列を生成する素片列生成手段と、
を有する、付記1又は2に記載の音声合成装置。
(付記4)
前記素片コスト算出手段は、
前記選択された素片毎に、当該素片及びその前後の素片夫々に対応付けられた音素からなる音素列と、前記抽出されたセグメントデータに含まれる音素とその前後の音素とからなる音素列とを比較して音素列コストを算出する音素列コスト算出手段と、
前記選択された素片毎に、当該選択された素片に対応付けられた韻律と前記目標韻律との差に基づく韻律コストを算出する韻律コスト算出手段と、
を有する付記3に記載の音声合成装置。
(付記5)
音声合成装置が、
入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出し、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させ、
前記目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定し、
前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定し、
当該決定された素片の列に基づいて合成音声を出力する、音声合成方法。
(付記6)
音声合成装置として用いられるコンピュータに、
入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するステップと、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させるステップと、
前記目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定するステップと、
前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定するステップと、
当該決定された素片の列に基づいて合成音声を出力するステップと、
を実行させるプログラム。
101 テキスト入力部
102 形態素解析部
103 韻律予測部
104 韻律辞書
105 波形選択部
106 音声辞書
107 波形合成部
201 目標韻律データ
202 韻律入力部
203 韻律倍率変更部
204 コスト算出用韻律データ
205 素片選定部
205a 素片リストアップ部
205b 音声素片列選定部
206 評価部
206a 素片評価部
206b 接続評価部
206c 最良コスト判定部
207 素片候補データ
301 倍率変更前の目標韻律のピッチ周波数
302 倍率変更後の目標韻律のピッチ周波数
401 CPU
402 ROM(リードオンリーメモリ)
403 RAM(ランダムアクセスメモリ)
404 入力装置
405 出力装置
406 外部記憶装置
407 可搬記録媒体駆動装置
408 通信インタフェース
409 バス
410 可搬記録媒体
Claims (6)
- 入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するセグメントデータ列抽出手段と、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させる目標韻律移動手段と、
前記目標韻律移動手段により目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定する素片列選択手段と、
前記素片選定手段により、前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定する素片列決定手段と、
当該決定された素片の列に基づいて合成音声を出力する波形合成手段と、
を備える音声合成装置。 - 前記目標韻律移動手段は、前記目標韻律に含まれる基本周波数を、予め設定された範囲内で予め設定された間隔で順次移動させる、請求項1に記載の音声合成装置。
- 前記素片列選択手段は、
前記音声コーパスから、前記抽出されたセグメントデータに含まれる音素と一致する音素を有する素片全てを選択する素片選択手段と、
前記選択された素片毎に、当該素片に対応付けられた音素及び韻律に基づいた素片コストを算出する素片コスト算出手段と、
前記選択された素片夫々を、前記抽出されたセグメントデータに対応して並べて素片列を生成した場合の接続コストを算出する接続コスト算出手段と、
前記算出された音素列コスト、韻律コスト及び接続コストを含む総合コストが最良となる素片列を生成する素片列生成手段と、
を有する、請求項1又は2に記載の音声合成装置。 - 前記素片コスト算出手段は、
前記選択された素片毎に、当該素片及びその前後の素片夫々に対応付けられた音素からなる音素列と、前記抽出されたセグメントデータに含まれる音素とその前後の音素とからなる音素列とを比較して音素列コストを算出する音素列コスト算出手段と、
前記選択された素片毎に、当該選択された素片に対応付けられた韻律と前記目標韻律との差に基づく韻律コストを算出する韻律コスト算出手段と、
を有する請求項3に記載の音声合成装置。 - 音声合成装置が、
入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出し、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させ、
前記目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定し、
前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定し、
当該決定された素片の列に基づいて合成音声を出力する、音声合成方法。 - 音声合成装置として用いられるコンピュータに、
入力テキストデータから音素及び目標韻律が対応付けられたセグメントデータの列を抽出するステップと、
前記目標韻律を、予め設定された範囲内でかつ予め設定された間隔で順次移動させるステップと、
前記目標韻律が移動される毎に、音素及び韻律が対応付けられた素片の集合である音声コーパスから、前記抽出されたセグメントデータの列に対応する素片の列であって、音素および韻律に関するコストが最良となる素片の列を選定するステップと、
前記目標韻律が移動される毎に選定された素片列のうち、前記コストが最良となる音声素片の列を決定するステップと、
当該決定された素片の列に基づいて合成音声を出力するステップと、
を実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193112A JP2016065900A (ja) | 2014-09-22 | 2014-09-22 | 音声合成装置、方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014193112A JP2016065900A (ja) | 2014-09-22 | 2014-09-22 | 音声合成装置、方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016065900A true JP2016065900A (ja) | 2016-04-28 |
JP2016065900A5 JP2016065900A5 (ja) | 2017-11-09 |
Family
ID=55804135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014193112A Pending JP2016065900A (ja) | 2014-09-22 | 2014-09-22 | 音声合成装置、方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016065900A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415716A (zh) * | 2019-07-05 | 2019-11-05 | 深圳前海达闼云端智能科技有限公司 | 音频混合方法、装置、存储介质及电子设备 |
CN112420017A (zh) * | 2020-11-13 | 2021-02-26 | 北京沃东天骏信息技术有限公司 | 语音合成方法及装置 |
CN113345417A (zh) * | 2021-05-31 | 2021-09-03 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备以及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005091747A (ja) * | 2003-09-17 | 2005-04-07 | Mitsubishi Electric Corp | 音声合成装置 |
WO2012160767A1 (ja) * | 2011-05-25 | 2012-11-29 | 日本電気株式会社 | 素片情報生成装置、音声合成装置、音声合成方法および音声合成プログラム |
JP2012237925A (ja) * | 2011-05-13 | 2012-12-06 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成装置とその方法とプログラム |
-
2014
- 2014-09-22 JP JP2014193112A patent/JP2016065900A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005091747A (ja) * | 2003-09-17 | 2005-04-07 | Mitsubishi Electric Corp | 音声合成装置 |
JP2012237925A (ja) * | 2011-05-13 | 2012-12-06 | Nippon Telegr & Teleph Corp <Ntt> | 音声合成装置とその方法とプログラム |
WO2012160767A1 (ja) * | 2011-05-25 | 2012-11-29 | 日本電気株式会社 | 素片情報生成装置、音声合成装置、音声合成方法および音声合成プログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415716A (zh) * | 2019-07-05 | 2019-11-05 | 深圳前海达闼云端智能科技有限公司 | 音频混合方法、装置、存储介质及电子设备 |
CN112420017A (zh) * | 2020-11-13 | 2021-02-26 | 北京沃东天骏信息技术有限公司 | 语音合成方法及装置 |
CN113345417A (zh) * | 2021-05-31 | 2021-09-03 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备以及存储介质 |
CN113345417B (zh) * | 2021-05-31 | 2024-03-01 | 平安科技(深圳)有限公司 | 语音合成方法、装置、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3588490B1 (en) | Speech conversion method, computer device, and storage medium | |
CN101828218B (zh) | 通过多形式段的生成和连接进行的合成 | |
JP3913770B2 (ja) | 音声合成装置および方法 | |
US11741942B2 (en) | Text-to-speech synthesis system and method | |
JP3910628B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
US9978359B1 (en) | Iterative text-to-speech with user feedback | |
CN101131818A (zh) | 语音合成装置与方法 | |
JP5434587B2 (ja) | 音声合成装置及び方法とプログラム | |
JP2016065900A (ja) | 音声合成装置、方法、およびプログラム | |
KR20180078252A (ko) | 성문 펄스 모델 기반 매개 변수식 음성 합성 시스템의 여기 신호 형성 방법 | |
JP6520108B2 (ja) | 音声合成装置、方法、およびプログラム | |
JP3450237B2 (ja) | 音声合成装置および方法 | |
JP4829605B2 (ja) | 音声合成装置および音声合成プログラム | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP6400526B2 (ja) | 音声合成装置、その方法、およびプログラム | |
JP6902759B2 (ja) | 音響モデル学習装置、音声合成装置、方法およびプログラム | |
JP6519096B2 (ja) | 音声合成装置、方法、およびプログラム | |
JP2006084854A (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP6519097B2 (ja) | 音声合成装置、方法、およびプログラム | |
JP2004233774A (ja) | 音声合成方法及び装置、並びに音声合成プログラム | |
JPH1185193A (ja) | 音声データベースにおける音素片情報最適化方法、及び音素片情報最適化装置 | |
KR20010076625A (ko) | 합성 데이터베이스 경량화를 위한 불필요한 합성단위 제거방법 | |
JP2005091551A (ja) | 音声合成装置及びそのためのコスト計算装置、並びにコンピュータプログラム | |
CN116884385A (zh) | 语音合成方法、装置及计算机可读存储介质 | |
JP2017062346A (ja) | 音合成装置、方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170921 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180912 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180925 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20181122 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190326 |