JP2012088555A - 音声合成システム、音声素片辞書作成方法、音声素片辞書作成プログラム、及び、音声素片辞書作成プログラム記録媒体 - Google Patents
音声合成システム、音声素片辞書作成方法、音声素片辞書作成プログラム、及び、音声素片辞書作成プログラム記録媒体 Download PDFInfo
- Publication number
- JP2012088555A JP2012088555A JP2010235568A JP2010235568A JP2012088555A JP 2012088555 A JP2012088555 A JP 2012088555A JP 2010235568 A JP2010235568 A JP 2010235568A JP 2010235568 A JP2010235568 A JP 2010235568A JP 2012088555 A JP2012088555 A JP 2012088555A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- unit
- selection
- segment
- category
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims abstract description 81
- 238000003786 synthesis reaction Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000009826 distribution Methods 0.000 claims abstract description 32
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims description 31
- 238000005259 measurement Methods 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 5
- 230000010365 information processing Effects 0.000 claims description 5
- 239000000284 extract Substances 0.000 abstract description 9
- 239000011295 pitch Substances 0.000 description 23
- 238000010586 diagram Methods 0.000 description 12
- 230000015556 catabolic process Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 2
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 description 1
- 101000911772 Homo sapiens Hsc70-interacting protein Proteins 0.000 description 1
- 101000710013 Homo sapiens Reversion-inducing cysteine-rich protein with Kazal motifs Proteins 0.000 description 1
- 101000661816 Homo sapiens Suppression of tumorigenicity 18 protein Proteins 0.000 description 1
- 101000661807 Homo sapiens Suppressor of tumorigenicity 14 protein Proteins 0.000 description 1
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】本発明にかかる音声合成システムは、音声素片が格納されている音声データベースと、学習用の韻律情報に基づき、前記音声データベースから音声素片を選択する第1の音声素片選択手段と、前記第1の音声素片選択手段により選択された音声素片の選択度数を計測する第1の選択度数計測手段と、前記音声データベース内の音声素片のパラメータ分布を所定のカテゴリーに分割するカテゴリー分割手段と、前記カテゴリー別に、前記選択度数に基づいて所定の個数の音声素片を抽出する音声素片抽出手段と、抽出された前記音声素片から、前記カテゴリー別に代表素片を生成する代表素片生成手段と、を有する音声素片辞書作成手段を備えるものである。
【選択図】 図2
Description
以下に、本実施の形態を図面に基づいて詳細に説明する。なお、以下に説明する実施の形態は、それぞれが本発明を具体化する際の一形態であって、本発明をその範囲内に限定するためのものではない。
上記実施の形態1では、学習用テキスト情報から生成される韻律情報に対応する音声データベース103内の全ての音声素片について選択度数を計測し、カテゴリー別に選択度数に基づき所定の個数の音声素片を抽出して代表素片を作成する構成とした。本実施の形態では、選択度数が低い音声素片を音声データベース103から除外して音声素片の選択範囲を制限する。そして、制限された範囲内の音声素片に対し、再度学習用の韻律情報に対する各音声素片の選択度数を求め、この選択度数上位であるN個の音声素片から代表素片を作成する構成にする。
上記実施の形態では、カテゴリー分割条件を固定していたが、本実施の形態においてはこれを適時、更新を可能にする構成としている。
上記実施の形態1乃至3では、音声合成ユニット100への入力であるテキスト情報と、音声素片辞書作成ユニット200への入力である学習用テキスト情報とは別個のものとしているが、本実施の形態においては合成音声を作成するテキスト情報を学習用テキスト情報に加える、または、学習用テキスト情報の少なくとも一部を置換するなど、実際に音声合成したテキスト情報に応じて学習用テキスト情報を更新し、適時、音声素片辞書203を更新する構成としている。
上記実施の形態1乃至4における音声合成ユニット200は、テキスト情報を入力として音声合成ユニット200内で言語解析処理を行う構成としているが、これに代え、テキスト情報に対する言語解析処理を予め別途実施しておき、図1と対比して示す図10に示すように言語解析部201を省く構成とし、テキスト情報から得られた言語情報を入力として合成音声を生成することも可能である。なお、テキスト情報の言語解析処理、韻律情報生成処理を予め別途実施しておき、その韻律情報を入力として音声合成するとし、音声合成ユニット200内の言語解析部201、韻律情報生成部202を省く構成とすることも可能である。
101 言語情報解析部
102 韻律情報生成部
103 音声データベース
104 音声素片選択部
105 選択度数計測部
106 カテゴリー分割部
107 音声素片抽出部
108 代表素片生成部
109 音声データベース更新部
200 音声合成ユニット
201 言語情報解析部
202 韻律情報生成部
203 音声素片辞書
204 音声素片選択部
205 音声素片接続部
Claims (12)
- 音声素片が格納されている音声データベースと、
学習用の韻律情報に基づき、前記音声データベースから音声素片を選択する第1の音声素片選択手段と、
前記第1の音声素片選択手段により選択された音声素片の選択度数を計測する第1の選択度数計測手段と、
前記音声データベース内の音声素片のパラメータ分布を所定のカテゴリーに分割するカテゴリー分割手段と、
前記カテゴリー別に、前記選択度数に基づいて所定の個数の音声素片を抽出する音声素片抽出手段と、
抽出された前記音声素片から、前記カテゴリー別に代表素片を生成する代表素片生成手段と、を有する音声素片辞書作成手段を備えることを特徴とする音声合成システム。 - 音声素片が格納されている音声データベースと、
学習用の韻律情報に基づき、前記音声データベースから音声素片を選択する第1の音声素片選択手段と、
前記第1の音声素片選択手段により選択された音声素片の選択度数を計測する第1の選択度数計測手段と、
前記音声データベース内の音声素片のパラメータ分布を所定のカテゴリーに分割するカテゴリー分割手段と、
前記選択度数に基づいて音声素片の選択範囲を制限する選択範囲制限手段と、
前記学習用の韻律情報に基づき、前記選択範囲制限手段により制限された範囲内の音声素片を選択する第2の音声素片選択手段と、
前記第2の音声素片選択手段により選択された音声素片の選択度数を計測する第2の選択度数計測手段と、
前記カテゴリー別に、前記選択度数に基づいて所定の個数の音声素片を抽出する音声素片抽出手段と、
抽出された前記音声素片から、前記カテゴリー別に代表素片を生成する代表素片生成手段と、を有する音声素片辞書作成手段を備えることを特徴とする音声合成システム。 - 請求項2に記載の音声素片辞書作成手段は、さらに、
前記選択範囲制限手段、前記第2の音声素片選択手段、前記第2の選択度数計測手段、の一連の処理を複数回繰り返し、かつ、繰り返し毎に、前記選択範囲制限手段は音声素片の選択範囲を前回の処理と比べて狭くすることを特徴とする音声合成システム。 - 前記カテゴリー分割手段は、
前記音声素片辞書作成手段により作成された音声素片辞書内の音声素片によって合成される音声の品質に応じて、前記音声データベース内の音声素片のパラメータ分布を分割する条件を更新することを特徴とする請求項1乃至3のいずれか1つに記載の音声合成システム。 - 前記音声素片辞書作成手段は、
音声合成用の入力情報から生成される韻律情報によって学習用の韻律情報を更新して、音声素片辞書を更新することを特徴とする請求項1乃至4のいずれか1つに記載の音声合成システム。 - 前記音声素片辞書作成手段は、さらに、
学習用テキスト情報に対して言語情報を得る言語情報解析手段と、
前記言語情報から音韻記号及び韻律情報を生成する韻律情報生成手段と、
を有することを特徴とする請求項1乃至5のいずれか1つに記載の音声合成システム。 - 請求項1乃至6のいずれか1つに記載の前記音声素片辞書作成手段により生成された音声素片辞書を備える音声合成システム。
- 学習用の韻律情報に基づき、前記音声データベースから音声素片を選択する第1の音声素片選択ステップと、
前記第1の音声素片選択ステップにおいて選択された音声素片の選択度数を計測する第1の選択度数計測ステップと、
前記音声データベース内の音声素片のパラメータ分布を所定のカテゴリーに分割するカテゴリー分割ステップと、
前記カテゴリー別に、前記選択度数に基づいて所定の個数の音声素片を抽出する音声素片抽出ステップと、
抽出された前記音声素片から、前記カテゴリー別に代表素片を生成する代表素片生成ステップと、を有することを特徴とする音声素片辞書作成方法。 - 学習用の韻律情報に基づき、前記音声データベースから音声素片を選択する第1の音声素片選択ステップと、
前記第1の音声素片選択ステップにおいて選択された音声素片の選択度数を計測する第1の選択度数計測ステップと、
前記音声データベース内の音声素片のパラメータ分布を所定のカテゴリーに分割するカテゴリー分割ステップと、
前記選択度数に基づいて音声素片の選択範囲を制限する選択範囲制限ステップと、
前記学習用の韻律情報に基づき、前記選択範囲制限ステップにおいて制限された範囲内の音声素片を選択する第2の音声素片選択ステップと、
前記第2の音声素片選択ステップにおいて選択された音声素片の選択度数を計測する第2の選択度数計測ステップと、
前記カテゴリー別に、前記選択度数に基づいて所定の個数の音声素片を抽出する音声素片抽出ステップと、
抽出された前記音声素片から、前記カテゴリー別に代表素片を生成する代表素片生成ステップと、を有することを特徴とする音声素片辞書作成方法。 - 請求項9に記載の音声素片辞書作成方法は、さらに、
前記選択範囲制限ステップ、前記第2の音声素片選択ステップ、前記第2の選択度数計測ステップ、の一連の処理を複数回繰り返し、かつ、繰り返し毎に前記選択範囲制限ステップにおける音声素片の選択範囲を前回の処理と比べて狭くすることを特徴とする音声素片辞書作成方法。 - 情報処理装置を請求項1乃至6のいずれか1つに記載の音声素片辞書作成手段として機能させるための音声素片辞書作成プログラム。
- 情報処理装置を請求項1乃至6のいずれか1つに記載の音声素片辞書作成手段として機能させるためのプログラムを記録した情報処理装置が読み取り可能な音声素片辞書作成プログラム記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010235568A JP5747471B2 (ja) | 2010-10-20 | 2010-10-20 | 音声合成システム、音声素片辞書作成方法、音声素片辞書作成プログラム、及び、音声素片辞書作成プログラム記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010235568A JP5747471B2 (ja) | 2010-10-20 | 2010-10-20 | 音声合成システム、音声素片辞書作成方法、音声素片辞書作成プログラム、及び、音声素片辞書作成プログラム記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012088555A true JP2012088555A (ja) | 2012-05-10 |
JP5747471B2 JP5747471B2 (ja) | 2015-07-15 |
Family
ID=46260227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010235568A Active JP5747471B2 (ja) | 2010-10-20 | 2010-10-20 | 音声合成システム、音声素片辞書作成方法、音声素片辞書作成プログラム、及び、音声素片辞書作成プログラム記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5747471B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014167556A (ja) * | 2013-02-28 | 2014-09-11 | Brother Ind Ltd | 音源特定システム、及び音源特定方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319391A (ja) * | 1996-03-12 | 1997-12-12 | Toshiba Corp | 音声合成方法 |
JP2002091475A (ja) * | 2000-09-18 | 2002-03-27 | Matsushita Electric Ind Co Ltd | 音声合成方法 |
JP2004037605A (ja) * | 2002-07-01 | 2004-02-05 | Nippon Hoso Kyokai <Nhk> | 音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム |
JP2005266010A (ja) * | 2004-03-16 | 2005-09-29 | Advanced Telecommunication Research Institute International | 素片接続型音声合成装置及び方法 |
JP2005292433A (ja) * | 2004-03-31 | 2005-10-20 | Toshiba Corp | 音声合成装置、音声合成方法および音声合成プログラム |
JP2009080268A (ja) * | 2007-09-26 | 2009-04-16 | Kddi Corp | 種々の音声合成装置のための素片データベース生成装置、方法及びプログラム |
-
2010
- 2010-10-20 JP JP2010235568A patent/JP5747471B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09319391A (ja) * | 1996-03-12 | 1997-12-12 | Toshiba Corp | 音声合成方法 |
JP2002091475A (ja) * | 2000-09-18 | 2002-03-27 | Matsushita Electric Ind Co Ltd | 音声合成方法 |
JP2004037605A (ja) * | 2002-07-01 | 2004-02-05 | Nippon Hoso Kyokai <Nhk> | 音声合成用データ削減方法、音声合成用データ削減装置および音声合成用データ削減プログラム |
JP2005266010A (ja) * | 2004-03-16 | 2005-09-29 | Advanced Telecommunication Research Institute International | 素片接続型音声合成装置及び方法 |
JP2005292433A (ja) * | 2004-03-31 | 2005-10-20 | Toshiba Corp | 音声合成装置、音声合成方法および音声合成プログラム |
JP2009080268A (ja) * | 2007-09-26 | 2009-04-16 | Kddi Corp | 種々の音声合成装置のための素片データベース生成装置、方法及びプログラム |
Non-Patent Citations (2)
Title |
---|
CSNG200700044148; 鴨志田 亮太 Ryota Kamoshida: '素片選択型音声合成方式におけるデータベース容量削減に関する検討 Examination about Downsizing of Data' 日本音響学会2004年秋季研究発表会講演論文集-I- THE 2004 AUTUMN MEETING OF THE ACOUSTICAL SOCI , 20040921, p.365-366, 社団法人日本音響学会 * |
JPN6014017592; 鴨志田 亮太 Ryota Kamoshida: '素片選択型音声合成方式におけるデータベース容量削減に関する検討 Examination about Downsizing of Data' 日本音響学会2004年秋季研究発表会講演論文集-I- THE 2004 AUTUMN MEETING OF THE ACOUSTICAL SOCI , 20040921, p.365-366, 社団法人日本音響学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014167556A (ja) * | 2013-02-28 | 2014-09-11 | Brother Ind Ltd | 音源特定システム、及び音源特定方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5747471B2 (ja) | 2015-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4080989B2 (ja) | 音声合成方法、音声合成装置および音声合成プログラム | |
JP4241762B2 (ja) | 音声合成装置、その方法、及びプログラム | |
JP4469883B2 (ja) | 音声合成方法及びその装置 | |
JP3667950B2 (ja) | ピッチパターン生成方法 | |
JP3910628B2 (ja) | 音声合成装置、音声合成方法およびプログラム | |
JP2007249212A (ja) | テキスト音声合成のための方法、コンピュータプログラム及びプロセッサ | |
JP5269668B2 (ja) | 音声合成装置、プログラム、及び方法 | |
JP6036682B2 (ja) | 音声合成システム、音声合成方法、および音声合成プログラム | |
JPH10171484A (ja) | 音声合成方法および装置 | |
JP5929909B2 (ja) | 韻律生成装置、音声合成装置、韻律生成方法および韻律生成プログラム | |
KR20170107683A (ko) | 딥러닝 기반의 음성 합성 시스템을 위한 피치 동기화 음성 합성 방법 | |
US9805711B2 (en) | Sound synthesis device, sound synthesis method and storage medium | |
KR20180078252A (ko) | 성문 펄스 모델 기반 매개 변수식 음성 합성 시스템의 여기 신호 형성 방법 | |
JP5747471B2 (ja) | 音声合成システム、音声素片辞書作成方法、音声素片辞書作成プログラム、及び、音声素片辞書作成プログラム記録媒体 | |
JP4247289B1 (ja) | 音声合成装置、音声合成方法およびそのプログラム | |
JP4945465B2 (ja) | 音声情報処理装置及びその方法 | |
JP5874639B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
JP2016065900A (ja) | 音声合成装置、方法、およびプログラム | |
JP5177135B2 (ja) | 音声合成装置、音声合成方法及び音声合成プログラム | |
CN102822888A (zh) | 话音合成器、话音合成方法和话音合成程序 | |
JP2010224419A (ja) | 音声合成装置、方法およびプログラム | |
JP4034751B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP2004354644A (ja) | 音声合成方法及びその装置並びにそのコンピュータプログラム及びそれを記憶した情報記憶媒体 | |
JP3881970B2 (ja) | 知覚試験用音声データセット作成装置、コンピュータプログラム、音声合成用サブコスト関数の最適化装置、及び音声合成装置 | |
JPH1185193A (ja) | 音声データベースにおける音素片情報最適化方法、及び音素片情報最適化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130830 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140312 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20140326 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140507 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140701 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150319 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150414 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150427 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5747471 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |