JP2015118222A - 音声合成システム及び音声合成方法 - Google Patents
音声合成システム及び音声合成方法 Download PDFInfo
- Publication number
- JP2015118222A JP2015118222A JP2013261142A JP2013261142A JP2015118222A JP 2015118222 A JP2015118222 A JP 2015118222A JP 2013261142 A JP2013261142 A JP 2013261142A JP 2013261142 A JP2013261142 A JP 2013261142A JP 2015118222 A JP2015118222 A JP 2015118222A
- Authority
- JP
- Japan
- Prior art keywords
- information
- processing unit
- speech synthesis
- correction
- correction candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 265
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 253
- 238000001308 synthesis method Methods 0.000 title claims description 6
- 238000012545 processing Methods 0.000 claims abstract description 308
- 238000012937 correction Methods 0.000 claims abstract description 280
- 238000000034 method Methods 0.000 claims description 81
- 230000006872 improvement Effects 0.000 claims description 80
- 230000008569 process Effects 0.000 claims description 58
- 230000004048 modification Effects 0.000 claims description 20
- 238000012986 modification Methods 0.000 claims description 20
- 238000013500 data storage Methods 0.000 claims description 8
- 238000004458 analytical method Methods 0.000 description 41
- 230000010354 integration Effects 0.000 description 28
- 230000004044 response Effects 0.000 description 26
- 230000006870 function Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000010365 information processing Effects 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
第1実施例では、図1の基本構成を用いて、音声合成結果に対する修正及び改善指示要求を受け付ける音声合成システムについて説明する。本実施例では、本発明の基本構成を用いたサーバ・クライアント構成での音声合成サービスを想定する。サーバ側は本発明の音声合成手法を用いた音声合成装置を構成し、この音声合成装置は、クライアント(ユーザ)側から要求された読み上げテキストに対して、合成音声を生成してそれを送信するサービスを行う。この時、本発明の基本構成で生成される読み上げテキストのメタ情報を用いることで、クライアント側に対して、生成された合成音声に対して、どのような修正・改善が可能かを示すことができる。
第2実施例では、本発明の基本構成および第1実施例に記載の構成を用いて、音声合成結果に対する修正及び改善指示要求を受け付ける音声合成サービスについて説明する。
102 :読み生成処理部
103 :韻律生成処理部
104 :波形生成処理部
105 :読み上げ音声
106 :読み修正候補情報生成処理部
107 :韻律修正候補情報生成処理部
108 :波形修正候補情報生成処理部
109 :修正候補情報統合処理部
110 :修正候補情報
201 :読み上げテキスト
202 :単語分割処理部
203 :読み選択処理部
204 :区切り決定処理部
205 :結合決定処理部
207 :単語読み修正候補情報生成処理部
208 :区切り修正候補情報生成処理部
209 :読み修正候補情報統合処理部
210 :読み修正候補情報
211 :結合修正候補情報生成処理部
221 :継続長修正候補情報生成処理部
222 :基本周波数修正候補情報生成処理部
223 :高さ修正候補情報生成処理部
224 :話速修正候補情報生成処理部
225 :韻律修正候補情報統合処理部
226 :韻律修正候補情報
301 :単語ネットワーク情報
302 :最適単語列選択処理部
303 :単語統合処理部
304 :読み分け処理部
306 :単語読み修正候補情報生成処理部
307 :単語読み修正候補情報
501,502 :単語候補
1301 :アクセント結合フラグ
1302 :アクセント結合候補箇所フラグ
1601 :読み上げテキスト
1602 :音声合成コンテキスト生成処理部
1603 :メタ情報付き音声合成処理部
1604 :文解析メタ情報
1605 :解析単位別ID設定処理部
1606 :合成音声
1607 :ID付きメタ情報
1608 :サービス応答生成処理部
1609 :サービス応答情報
1610 :音声合成データ格納装置
1611 :コンテキスト格納装置
1651 :改善指示情報
1652 :改善指示解釈処理部
1653 :対象ID
1654 :音声合成コンテキスト選択処理部
1657 :合成音声
1658 :文解析メタ情報
1659 :改善データ反映処理部
1660 :改善箇所決定処理部
1661 :改善データ作成処理部
1801 :読み上げリクエスト情報
1802 :ユーザ情報取得部
1803 :音声合成選択部
1804 :ユーザ情報データベース
1805 :音声合成システム
1806 :音声合成データ・データベース
1807 :サービス内容修正部
1808 :サービス応答情報
1851 :サービス応答情報
1852 :修正候補リスト提示部
1853 :ディスプレイ装置
1854 :スピーカ装置
1855 :改善要求対象指示部
1856 :マウス・キーボード
1857 :改善指示リクエスト作成部
1858 :改善指示情報
1901 :ユーザID
1902 :利用できる言語
1903 :取得できる情報
1904 :改善要求の可否
Claims (15)
- 読み上げテキストを受け取り、前記読み上げテキストを読み上げた合成音声を出力する音声合成システムであって、
前記合成音声を生成した際の情報に基づいて、前記合成音声における修正可能な箇所と修正候補の内容を示す修正候補情報を生成する修正候補情報生成処理部を備えることを特徴とする音声合成システム。 - 請求項1に記載の音声合成システムにおいて、
前記修正候補情報生成処理部は、
前記合成音声の読みを生成する読み生成処理における修正情報である読み修正候補情報を生成する読み修正候補情報生成処理部と、
前記合成音声の韻律を生成する韻律生成処理における修正情報である韻律修正候補情報を生成する韻律修正候補情報生成処理部と、
前記合成音声の波形を生成する波形生成処理における修正情報である波形修正候補情報を生成する波形修正候補情報生成処理部と、
の少なくとも1つを備えることを特徴とする音声合成システム。 - 請求項2に記載の音声合成システムにおいて、
前記読み修正候補情報生成処理部は、
前記合成音声内の単語の読みに関する修正情報である単語読み修正情報を生成する単語読み修正候補情報生成処理部と、
前記合成音声の区切り位置に関する修正情報である区切り修正候補情報を生成する区切り修正候補情報生成処理部と、
前記合成音声のアクセント結合の位置に関する修正情報である結合修正候補情報を生成する結合修正候補情報生成処理部と
の少なくとも1つを備えることを特徴とする音声合成システム。 - 請求項2に記載の音声合成システムにおいて、
前記韻律修正候補情報生成処理部は、
前記合成音声の音素継続長に関する修正情報である継続長修正候補情報を生成する継続長修正候補情報生成処理部と、
前記合成音声の音素基本周波数に関する修正情報である基本周波数修正候補情報を生成する基本周波数修正候補情報生成処理部と、
前記合成音声の部分の音の高さのパターンに関する修正情報である高さ修正候補情報を生成する高さ修正候補情報生成処理部と、
前記合成音声の部分の話速に関する修正情報である話速修正候補情報を生成する話速修正候補情報生成処理部と、
の少なくとも1つを備えることを特徴とする音声合成システム。 - 請求項2に記載の音声合成システムにおいて、
前記波形修正候補情報生成処理部は、前記合成音声で使用された素片に関する修正情報である素片修正候補情報を生成する素片修正候補情報生成処理部を備えることを特徴とする音声合成システム。 - 請求項1に記載の音声合成システムにおいて、
前記合成音声の改善情報である改善指示情報に基づいて前記合成音声を更新する改善データ作成処理部を更に備えることを特徴とする音声合成システム。 - 請求項6に記載の音声合成システムにおいて、
前記合成音声を生成するための音声合成データを格納する音声合成データ格納装置と、
前記改善指示情報に基づいて前記音声合成データ格納装置における前記音声合成データを更新する改善データ反映処理部と、
を更に備えることを特徴とする音声合成システム。 - 請求項1に記載の音声合成システムにおいて、
ユーザに対して提供されるサービスに関する情報を格納するユーザ情報データベースと、
前記サービスに関する情報に基づいて前記修正候補情報の内容を修正するサービス内容修正部と、
を更に備えることを特徴とする音声合成システム。 - 請求項1に記載の音声合成システムにおいて、
前記修正候補情報は、前記読み上げテキストのデータに対して、前記修正可能な箇所と前記修正候補の内容を示すタグを追加した情報であることを特徴とする音声合成システム。 - 請求項9に記載の音声合成システムにおいて、
前記修正候補情報は、前記修正可能な箇所毎に識別子を含むことを特徴とする音声合成システム。 - 請求項1に記載の音声合成システムにおいて、
前記修正候補情報生成処理部を備え、前記合成音声及び前記修正候補情報を送信するサーバ装置と、
前記サーバ装置から前記合成音声及び前記修正候補情報を受け取るクライアント装置と、
を備えることを特徴とする音声合成システム。 - 請求項11に記載の音声合成システムにおいて、
前記クライアント装置は、前記修正候補情報から選択された改善情報に関する改善指示情報を作成する改善指示リクエスト作成部を備え、
前記サーバ装置は、前記改善指示情報に基づいて前記合成音声を更新する改善データ作成処理部を備えることを特徴とする音声合成システム。 - 請求項11に記載の音声合成システムにおいて、
前記クライアント装置は、
前記修正候補情報を表示装置に表示するための修正候補リスト提示部と、
前記表示装置に表示された前記修正候補情報から選択された改善情報を受け取る改善要求対象指示部と、
を更に備えることを特徴とする音声合成システム。 - 入力された読み上げテキストを読み上げた合成音声を生成する第1ステップと、
前記合成音声を生成した際の情報に基づいて、前記合成音声における修正可能な箇所と修正候補の内容を示す修正候補情報を生成する第2ステップと、
を備えることを特徴とする音声合成方法。 - 請求項14に記載の音声合成方法において、
前記第2ステップは、
前記合成音声の読みを生成する読み生成処理における修正情報である読み修正候補情報を生成するステップと、
前記合成音声の韻律を生成する韻律生成処理における修正情報である韻律修正候補情報を生成するステップと、
前記合成音声の波形を生成する波形生成処理における修正情報である波形修正候補情報を生成するステップと、
の少なくとも1つを含むことを特徴とする音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013261142A JP6336749B2 (ja) | 2013-12-18 | 2013-12-18 | 音声合成システム及び音声合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013261142A JP6336749B2 (ja) | 2013-12-18 | 2013-12-18 | 音声合成システム及び音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015118222A true JP2015118222A (ja) | 2015-06-25 |
JP6336749B2 JP6336749B2 (ja) | 2018-06-06 |
Family
ID=53530990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013261142A Active JP6336749B2 (ja) | 2013-12-18 | 2013-12-18 | 音声合成システム及び音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6336749B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017179164A1 (ja) * | 2016-04-14 | 2017-10-19 | 三菱電機株式会社 | 読み上げルール修正装置、読み上げルール修正方法 |
JP2019152712A (ja) * | 2018-03-01 | 2019-09-12 | Kddi株式会社 | 解析装置及びプログラム |
JP2019154468A (ja) * | 2018-03-07 | 2019-09-19 | 株式会社Nttドコモ | 対話システム |
CN111199724A (zh) * | 2019-12-31 | 2020-05-26 | 出门问问信息科技有限公司 | 一种信息处理方法、设备及计算机可读存储介质 |
CN112307712A (zh) * | 2019-07-31 | 2021-02-02 | 株式会社理光 | 文本评价装置和方法以及存储介质和计算机装置 |
CN112530404A (zh) * | 2020-11-30 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 一种语音合成方法、语音合成装置及智能设备 |
CN112530405A (zh) * | 2019-09-18 | 2021-03-19 | 北京声智科技有限公司 | 一种端到端语音合成纠错方法、系统及装置 |
CN113763921A (zh) * | 2020-07-24 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 用于纠正文本的方法和装置 |
JP7153305B2 (ja) | 2018-04-02 | 2022-10-14 | 株式会社パロマ | ガスコンロ |
JP7454116B2 (ja) | 2022-03-29 | 2024-03-22 | Remem株式会社 | 文書音声化システム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000352989A (ja) * | 1999-04-30 | 2000-12-19 | Lucent Technol Inc | ユーザが文字列の発音を設定することを可能にするためにコンピュータ上で実行される方法 |
JP2007199410A (ja) * | 2006-01-26 | 2007-08-09 | Internatl Business Mach Corp <Ibm> | テキストに付与する発音情報の編集を支援するシステム |
JP2008083239A (ja) * | 2006-09-26 | 2008-04-10 | Toshiba Corp | 中間言語編集装置、中間言語編集方法および中間言語編集プログラム |
JP2011180368A (ja) * | 2010-03-01 | 2011-09-15 | Fujitsu Ltd | 合成音声修正装置および合成音声修正方法 |
JP2011186143A (ja) * | 2010-03-08 | 2011-09-22 | Hitachi Ltd | ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム |
JP2012073519A (ja) * | 2010-09-29 | 2012-04-12 | Toshiba Corp | 読み上げ支援装置、方法、およびプログラム |
JP2012103668A (ja) * | 2010-11-08 | 2012-05-31 | Voiceware Co Ltd | 使用者の候補合成単位選択による音声合成方法およびシステム(VoiceSynthesizingMethodandSystemBasedonUserDirectedCandidate−UnitSelection) |
-
2013
- 2013-12-18 JP JP2013261142A patent/JP6336749B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000352989A (ja) * | 1999-04-30 | 2000-12-19 | Lucent Technol Inc | ユーザが文字列の発音を設定することを可能にするためにコンピュータ上で実行される方法 |
JP2007199410A (ja) * | 2006-01-26 | 2007-08-09 | Internatl Business Mach Corp <Ibm> | テキストに付与する発音情報の編集を支援するシステム |
JP2008083239A (ja) * | 2006-09-26 | 2008-04-10 | Toshiba Corp | 中間言語編集装置、中間言語編集方法および中間言語編集プログラム |
JP2011180368A (ja) * | 2010-03-01 | 2011-09-15 | Fujitsu Ltd | 合成音声修正装置および合成音声修正方法 |
JP2011186143A (ja) * | 2010-03-08 | 2011-09-22 | Hitachi Ltd | ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム |
JP2012073519A (ja) * | 2010-09-29 | 2012-04-12 | Toshiba Corp | 読み上げ支援装置、方法、およびプログラム |
JP2012103668A (ja) * | 2010-11-08 | 2012-05-31 | Voiceware Co Ltd | 使用者の候補合成単位選択による音声合成方法およびシステム(VoiceSynthesizingMethodandSystemBasedonUserDirectedCandidate−UnitSelection) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017179164A1 (ja) * | 2016-04-14 | 2017-10-19 | 三菱電機株式会社 | 読み上げルール修正装置、読み上げルール修正方法 |
JPWO2017179164A1 (ja) * | 2016-04-14 | 2018-07-26 | 三菱電機株式会社 | 読み上げルール修正装置、読み上げルール修正方法 |
JP2019152712A (ja) * | 2018-03-01 | 2019-09-12 | Kddi株式会社 | 解析装置及びプログラム |
JP7019462B2 (ja) | 2018-03-07 | 2022-02-15 | 株式会社Nttドコモ | 対話システム |
JP2019154468A (ja) * | 2018-03-07 | 2019-09-19 | 株式会社Nttドコモ | 対話システム |
JP7153305B2 (ja) | 2018-04-02 | 2022-10-14 | 株式会社パロマ | ガスコンロ |
CN112307712A (zh) * | 2019-07-31 | 2021-02-02 | 株式会社理光 | 文本评价装置和方法以及存储介质和计算机装置 |
CN112307712B (zh) * | 2019-07-31 | 2024-04-16 | 株式会社理光 | 文本评价装置和方法以及存储介质和计算机装置 |
CN112530405A (zh) * | 2019-09-18 | 2021-03-19 | 北京声智科技有限公司 | 一种端到端语音合成纠错方法、系统及装置 |
CN111199724A (zh) * | 2019-12-31 | 2020-05-26 | 出门问问信息科技有限公司 | 一种信息处理方法、设备及计算机可读存储介质 |
CN113763921A (zh) * | 2020-07-24 | 2021-12-07 | 北京沃东天骏信息技术有限公司 | 用于纠正文本的方法和装置 |
CN112530404A (zh) * | 2020-11-30 | 2021-03-19 | 深圳市优必选科技股份有限公司 | 一种语音合成方法、语音合成装置及智能设备 |
JP7454116B2 (ja) | 2022-03-29 | 2024-03-22 | Remem株式会社 | 文書音声化システム |
Also Published As
Publication number | Publication date |
---|---|
JP6336749B2 (ja) | 2018-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6336749B2 (ja) | 音声合成システム及び音声合成方法 | |
JP5703256B2 (ja) | 単語レベルの変換候補生成に基づく音声認識システム及び方法 | |
JP4987623B2 (ja) | ユーザと音声により対話する装置および方法 | |
KR100859532B1 (ko) | 대응 문형 패턴 기반 자동통역 방법 및 장치 | |
JP2015026057A (ja) | インタラクティブキャラクター基盤の外国語学習装置及び方法 | |
JP2008083855A (ja) | 機械翻訳を行う装置、システム、方法およびプログラム | |
JP2008243080A (ja) | 音声を翻訳する装置、方法およびプログラム | |
KR102580904B1 (ko) | 음성 신호를 번역하는 방법 및 그에 따른 전자 디바이스 | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP5423466B2 (ja) | 音声合成装置、音声合成方法、及び音声合成プログラム | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
JP2018169434A (ja) | 音声合成装置、音声合成方法及び音声合成システムならびに音声合成用コンピュータプログラム | |
JP2008268478A (ja) | アクセント調整可能な音声合成装置 | |
JP3542578B2 (ja) | 音声認識装置及びその方法、プログラム | |
JP5819147B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
CN110782899B (zh) | 信息处理装置、存储介质及信息处理方法 | |
JP6674876B2 (ja) | 補正装置、補正方法及び補正プログラム | |
JP5696638B2 (ja) | 対話制御装置、対話制御方法及び対話制御用コンピュータプログラム | |
JP6197523B2 (ja) | 音声合成装置、言語辞書修正方法及び言語辞書修正用コンピュータプログラム | |
JP6619932B2 (ja) | 形態素解析装置およびプログラム | |
JP6232724B2 (ja) | 音声合成装置及び言語辞書登録方法 | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム | |
WO2021205832A1 (ja) | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム | |
JP2000330588A (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160921 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170908 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170919 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180410 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180507 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6336749 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |