JP2012078755A - 話速調整装置、音声合成システム、およびプログラム - Google Patents
話速調整装置、音声合成システム、およびプログラム Download PDFInfo
- Publication number
- JP2012078755A JP2012078755A JP2010226680A JP2010226680A JP2012078755A JP 2012078755 A JP2012078755 A JP 2012078755A JP 2010226680 A JP2010226680 A JP 2010226680A JP 2010226680 A JP2010226680 A JP 2010226680A JP 2012078755 A JP2012078755 A JP 2012078755A
- Authority
- JP
- Japan
- Prior art keywords
- speech
- synthesized
- data
- speed
- speech speed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015572 biosynthetic process Effects 0.000 title claims description 34
- 238000003786 synthesis reaction Methods 0.000 title claims description 34
- 230000001186 cumulative effect Effects 0.000 claims abstract description 37
- 238000006243 chemical reaction Methods 0.000 claims abstract description 26
- 230000008602 contraction Effects 0.000 claims description 40
- 238000003860 storage Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 abstract description 37
- 238000000034 method Methods 0.000 description 36
- 238000010586 diagram Methods 0.000 description 6
- 230000006866 deterioration Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 240000008168 Ficus benjamina Species 0.000 description 1
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000005871 repellent Substances 0.000 description 1
- 230000002940 repellent Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
Abstract
【解決手段】複数の音声データベースから合成された合成音声データの話速の平均値を、識別番号jに基づいて合成音声データの生成源の音声データベースごとに算出する話速平均値算出手段11と、合成音声データの時間長の累計値を、合成音声データの生成源の音声データベースごとに算出する時間長累計値算出手段12と、該平均値、該累計値、および、番組放送時間に基づいて、合成音声データの時間長の伸縮倍率を、合成音声データの生成源の音声データベースごとに算出する伸縮倍率算出手段14と、該倍率で前記合成音声データの話速を変換する話速変換手段15と、を含む。
【選択図】図5
Description
また、この構成により、各音声データベースから合成された合成音声データの話速を用いて合成音声データの時間長の伸縮倍率を算出するため、実態に即した精緻な話速調整を行うことができる。
また、この構成により、各音声データベースを構成する音声データの話速を用いて合成音声データの時間長の伸縮倍率を算出するため、計算処理が簡易となり、効率的に話速調整を行うことができる。
本発明に係る話速調整装置の第1の実施形態を図1、図5〜図7を参照しながら説明する。本実施形態の話速調整装置1は、図1の構成で作成された合成音声データの話速を調整するものである。
本発明に係る話速調整装置の第2の実施形態を図4、図8を参照しながら説明する。本実施形態の話速調整装置2は、図4の構成で作成された合成音声データの話速を調整するものである。なお、第1の実施形態と同様の構成については説明を省略する。
11、21 話速平均値算出手段
12 時間長累計値算出手段
13 番組放送時間設定手段
14 伸縮倍率算出手段
15 話速変換手段
16 記憶手段
50 音声合成エンジン
60、70 音声合成装置
DB−1、・・・、DB−N 音声データベース
Claims (6)
- 複数の音声データベースから合成された合成音声データの話速の平均値を、該合成音声データの生成源の音声データベースごとに算出する話速平均値算出手段と、
前記合成音声データの時間長の累計値を、該合成音声データの生成源の音声データベースごとに算出する時間長累計値算出手段と、
前記話速平均値算出手段で算出された前記平均値、前記時間長累計値算出手段で算出された前記累計値、および、番組放送時間に基づいて、前記合成音声データ全体の時間長を該番組放送時間と一致させ、かつ、該合成音声データの生成源の音声データベースごとの話速の平均値を互いに等しくする該合成音声データの伸縮倍率を、該合成音声データの生成源の音声データベースごとに算出する伸縮倍率算出手段と、
前記伸縮倍率算出手段で算出された前記伸縮倍率で前記合成音声データの話速を変換する話速変換手段と、
前記話速変換手段により話速が変換された合成音声データを記憶する記憶手段と、を備える話速調整装置。 - 複数の音声データベースが有する音声データの話速の平均値を、該音声データベースごとに算出する話速平均値算出手段と、
前記合成音声データの時間長の累計値を、該合成音声データの生成源の音声データベースごとに算出する時間長累計値算出手段と、
前記話速平均値算出手段で算出された前記平均値、前記時間長累計値算出手段で算出された前記累計値、および、番組放送時間に基づいて、前記合成音声データ全体の時間長を該番組放送時間と一致させ、かつ、該合成音声データの生成源の音声データベースごとの話速の平均値を互いに等しくする該合成音声データの伸縮倍率を、該合成音声データの生成源の音声データベースごとに算出する伸縮倍率算出手段と、
前記伸縮倍率算出手段で算出された前記伸縮倍率で前記合成音声データの話速を変換する話速変換手段と、
前記話速変換手段により話速が変換された合成音声データを記憶する記憶手段と、を備える話速調整装置。 - 音声データと、該音声データに対応するテキストおよびその音素表記と、を有する複数の音声データベースを備え、放送内容に応じた放送用テキストと、該放送用テキストに対応する音声データが蓄積されている前記音声データベースの識別情報と、に基づいて前記複数の音声データベースから合成音声データを生成し、生成した該合成音声データ、該合成音声データの時間長、および、該合成音声データまたは該音声データの話速、を出力する音声合成装置と、
請求項1から請求項3のいずれか一項に記載の話速調整装置と、を備える音声合成システム。 - コンピュータに、
複数の音声データベースから合成された合成音声データの話速の平均値を、該合成音声データの生成源の音声データベースごとに算出する話速平均値算出手段と、
前記合成音声データの時間長の累計値を、該合成音声データの生成源の音声データベースごとに算出する時間長累計値算出手段と、
前記話速平均値算出手段で算出された前記平均値、前記時間長累計値算出手段で算出された前記累計値、および、番組放送時間に基づいて、前記合成音声データ全体の時間長を該番組放送時間と一致させ、かつ、該合成音声データの生成源の音声データベースごとの話速の平均値を互いに等しくする該合成音声データの伸縮倍率を、該合成音声データの生成源の音声データベースごとに算出する伸縮倍率算出手段と、
前記伸縮倍率算出手段で算出された前記伸縮倍率で前記合成音声データの話速を変換する話速変換手段と、
前記話速変換手段により話速が変換された合成音声データを記憶する記憶手段と、を実現させるプログラム。 - コンピュータに、
複数の音声データベースが有する音声データの話速の平均値を、該音声データベースごとに算出する話速平均値算出手段と、
前記合成音声データの時間長の累計値を、該合成音声データの生成源の音声データベースごとに算出する時間長累計値算出手段と、
前記話速平均値算出手段で算出された前記平均値、前記時間長累計値算出手段で算出された前記累計値、および、番組放送時間に基づいて、前記合成音声データ全体の時間長を該番組放送時間と一致させ、かつ、該合成音声データの生成源の音声データベースごとの話速の平均値を互いに等しくする該合成音声データの伸縮倍率を、該合成音声データの生成源の音声データベースごとに算出する伸縮倍率算出手段と、
前記伸縮倍率算出手段で算出された前記伸縮倍率で前記合成音声データの話速を変換する話速変換手段と、
前記話速変換手段により話速が変換された合成音声データを記憶する記憶手段と、を実現させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010226680A JP5620776B2 (ja) | 2010-10-06 | 2010-10-06 | 話速調整装置、音声合成システム、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010226680A JP5620776B2 (ja) | 2010-10-06 | 2010-10-06 | 話速調整装置、音声合成システム、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012078755A true JP2012078755A (ja) | 2012-04-19 |
JP5620776B2 JP5620776B2 (ja) | 2014-11-05 |
Family
ID=46239044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010226680A Expired - Fee Related JP5620776B2 (ja) | 2010-10-06 | 2010-10-06 | 話速調整装置、音声合成システム、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5620776B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018179209A1 (ja) * | 2017-03-30 | 2018-10-04 | 三菱電機株式会社 | 電子機器、音声制御方法、およびプログラム |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000132179A (ja) * | 1998-10-27 | 2000-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 録音音声データベース話速均一化方法及び装置及び話速均一化プログラムを格納した記憶媒体 |
JP2001265374A (ja) * | 2000-03-14 | 2001-09-28 | Omron Corp | 音声合成装置及び記録媒体 |
JP2004361766A (ja) * | 2003-06-06 | 2004-12-24 | Kenwood Corp | 話速変換装置、話速変換方法及びプログラム |
JP2006313274A (ja) * | 2005-05-09 | 2006-11-16 | Nhk Computer Service:Kk | 番組音声制作装置および番組音声制作プログラム |
-
2010
- 2010-10-06 JP JP2010226680A patent/JP5620776B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000132179A (ja) * | 1998-10-27 | 2000-05-12 | Nippon Telegr & Teleph Corp <Ntt> | 録音音声データベース話速均一化方法及び装置及び話速均一化プログラムを格納した記憶媒体 |
JP2001265374A (ja) * | 2000-03-14 | 2001-09-28 | Omron Corp | 音声合成装置及び記録媒体 |
JP2004361766A (ja) * | 2003-06-06 | 2004-12-24 | Kenwood Corp | 話速変換装置、話速変換方法及びプログラム |
JP2006313274A (ja) * | 2005-05-09 | 2006-11-16 | Nhk Computer Service:Kk | 番組音声制作装置および番組音声制作プログラム |
Non-Patent Citations (1)
Title |
---|
JPN6014029489; 今井篤他: '"話速変換技術を利用したインターネットでのラジオニュースサービス"' 映像情報メディア学会誌 Vol.59,No.2, 200502, pp.265-270 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018179209A1 (ja) * | 2017-03-30 | 2018-10-04 | 三菱電機株式会社 | 電子機器、音声制御方法、およびプログラム |
JP6486582B2 (ja) * | 2017-03-30 | 2019-03-20 | 三菱電機株式会社 | 電子機器、音声制御方法、およびプログラム |
JPWO2018179209A1 (ja) * | 2017-03-30 | 2019-04-11 | 三菱電機株式会社 | 電子機器、音声制御方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5620776B2 (ja) | 2014-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5482042B2 (ja) | 合成音声テキスト入力装置及びプログラム | |
US7716052B2 (en) | Method, apparatus and computer program providing a multi-speaker database for concatenative text-to-speech synthesis | |
CN102543081B (zh) | 可调控式韵律重估测系统与方法及计算机程序产品 | |
US10176797B2 (en) | Voice synthesis method, voice synthesis device, medium for storing voice synthesis program | |
JPS62160495A (ja) | 音声合成装置 | |
JP2007133033A (ja) | 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム | |
JP5029168B2 (ja) | 音声読み上げのための装置、プログラム及び方法 | |
JP2012118385A (ja) | 音声合成情報編集装置 | |
JP2008249808A (ja) | 音声合成装置、音声合成方法及びプログラム | |
JP2001282278A (ja) | 音声情報処理装置及びその方法と記憶媒体 | |
JP5758713B2 (ja) | 音声合成装置、ナビゲーション装置および音声合成方法 | |
JP2007264503A (ja) | 音声合成装置及びその方法 | |
JP2011186143A (ja) | ユーザ挙動を学習する音声合成装置、音声合成方法およびそのためのプログラム | |
JP2010128103A (ja) | 音声合成装置、音声合成方法、および音声合成プログラム | |
JP4953767B2 (ja) | 音声生成装置 | |
JP5620776B2 (ja) | 話速調整装置、音声合成システム、およびプログラム | |
JP2007271910A (ja) | 合成音声生成装置 | |
JP6314879B2 (ja) | 音読評価装置、音読評価方法、及びプログラム | |
JP2009157220A (ja) | 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法 | |
JP2002525663A (ja) | ディジタル音声処理装置及び方法 | |
JP3109778B2 (ja) | 音声規則合成装置 | |
JP5935545B2 (ja) | 音声合成装置 | |
JP4468506B2 (ja) | 音声データ作成装置および声質変換方法 | |
JP6486582B2 (ja) | 電子機器、音声制御方法、およびプログラム | |
JP5218971B2 (ja) | 音声メッセージ作成装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20130807 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20130807 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140626 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140715 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140808 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140826 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140919 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5620776 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |