JP2015049252A - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP2015049252A JP2015049252A JP2013178513A JP2013178513A JP2015049252A JP 2015049252 A JP2015049252 A JP 2015049252A JP 2013178513 A JP2013178513 A JP 2013178513A JP 2013178513 A JP2013178513 A JP 2013178513A JP 2015049252 A JP2015049252 A JP 2015049252A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- data
- voice
- mixing
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Electrophonic Musical Instruments (AREA)
Abstract
【解決手段】変数設定部52は、利用者からの指示に応じて混合比率Rを経時的に変化させる。素片混合部62は、第1音声の音声素片の各単位区間を表す複数の単位データを含む素片データPAと、第1音声とは声質が相違する第2音声の音声素片の各単位区間を表す複数の単位データを含む第2素片データPBとの間で、変数設定部52が設定した混合比率Rに応じて各単位データを順次に混合する。合成対象音声のうち一の音素が定常的に継続される定常期間について、素片混合部62は、素片データPAおよび素片データPBの各々における当該音素に対応する各単位データを、定常期間H内で経時的に変化する混合比率Rに応じて順次に混合する。合成処理部58は、素片混合部62による混合後の単位データの時系列を利用して合成対象音声の音声信号Vを生成する。
【選択図】図6
Description
図1は、本発明の第1実施形態に係る音声合成装置100の構成図である。音声合成装置100は、複数の音声素片を時間軸上で相互に連結する素片接続型の音声合成処理で任意の合成音声の音声信号Vを生成する。具体的には、第1実施形態の音声合成装置100は、任意の楽曲(以下「合成楽曲」という)の歌唱音声の音声信号Vを生成する信号処理装置であり、演算処理装置10と記憶装置12と表示装置14と入力装置16と放音装置18とを具備するコンピュータシステム(例えば携帯電話機やパーソナルコンピュータ等の情報処理装置)で実現される。
eZ=(1−R)・eA+R・eB ……(A)
数式(A)から理解される通り、混合単位データZXは、第1音声と第2音声との中間的なスペクトル包絡(第1音声と第2音声との中間的な声質)を表現する。
本発明の第2実施形態を説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を適宜に流用して各々の詳細な説明を適宜に省略する。
E1=G+δ{exp(η・f)−1} ……(B)
図10および数式(B)から理解される通り、変数Gは、声帯振動のスペクトル包絡の全体的な強度(以下「包絡強度」という)に相当する。包絡強度Gは、周波数fの0(直流成分)に対応するスペクトルの強度とも換言され得る。変数δは、励起波形包絡E1の強度(縦軸)の数値範囲を規定する変数であり、変数ηは、励起波形包絡E1の形状を規定する変数である。第2実施形態の混合処理では、素片データPAの包絡特性データDEが規定する包絡強度GA(数式(A)の変数eA)と、素片データPBの包絡特性データDEが規定する包絡強度GB(数式(A)の変数eB)とについて混合比率Rを適用した数式(A)の演算が実行されることで、合成後のスペクトル包絡の包絡強度GZ(数式(A)の変数eZ)が算定される。
ΔG=GA−GZ≦ΔTH ……(C)
GZ=min{GZ,GA+ΔTH} ……(D)
数式(D)の右辺の包絡強度GZは、数式(A)の混合処理で定された包絡強度GZ(包絡強度GAと包絡強度GBとの加重和)である。数式(D)の演算子min{ }は、括弧内の複数の数値のうち最小値を採択する演算を意味する。数式(D)から理解される通り、混合処理後の包絡強度GZは、混合処理前の包絡強度GAに閾値ΔTHを加算した数値以下の範囲に制限される。
ΔG_est=WZ−WA
={(1−R)・WA+R・WB}−WA ……(E)
数式(E)で算定される推定変化量ΔG_estが数式(D)の閾値ΔTHとして採用される。したがって、混合処理後の包絡強度GZは、混合処理前の包絡強度GAに推定変化量ΔG_estを加算した数値以下の範囲に制限される。
図11は、本発明の第3実施形態に係る音声合成装置100の構成図である。図11から理解される通り、第3実施形態の音声合成装置100の記憶装置12は、相異なる声質の音声に対応するN個(Nは3以上の自然数)の音声ライブラリLを記憶する。例えば相異なる発声者が発声した音声の音声ライブラリLや、ひとりの発声者が声質を相違させて発声した音声の音声ライブラリLが記憶装置12に記憶される。
前述の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
eZ=rA・eA+rB・eB+rC・eC ……(G)
混合比率Rは、数式(G)の比率rAと比率rBと比率rCとを含んで構成され、利用者からの指示に応じて可変に設定される。
Claims (4)
- 利用者からの指示に応じて混合比率を経時的に変化させる変数設定手段と、
第1音声の音声素片の各単位区間を表す複数の単位データを含む第1素片データと、前記第1音声とは声質が相違する第2音声の音声素片の各単位区間を表す複数の単位データを含む第2素片データとの間で、前記変数設定手段が設定した前記混合比率に応じて前記各単位データを順次に混合する素片混合手段と、
前記素片混合手段による混合後の単位データの時系列を利用して合成対象音声の音声信号を生成する合成処理手段とを具備し、
前記素片混合手段は、前記合成対象音声のうち一の音素が定常的に継続される定常期間について、前記第1素片データのうち当該一の音素に対応する第1単位データと、前記第2素片データのうち当該一の音素に対応する第2単位データとを、前記定常期間内で経時的に変化する前記混合比率に応じて順次に混合する
音声合成装置。 - 前記第1音声の継続音の変動成分を表す第1継続音データと、前記第2音声の継続音の変動成分を表す第2継続音データとを、前記混合比率に応じて混合する継続音混合手段を具備し、
前記合成処理手段は、前記定常期間について、前記素片混合手段による混合後の単位データの時系列と前記継続音混合手段による混合後の継続音データとを利用して前記定常期間内の前記音声信号を生成する
請求項1の音声合成装置。 - 前記単位データは、声帯振動のスペクトル包絡の全体的な強度を示す包絡強度を含む複数のパラメータで音声のスペクトル包絡を表現する包絡特性データを包含し、
前記素片混合手段は、前記第1素片データの単位データと前記第2素片データの単位データとの混合の前後にわたる前記包絡強度の変化量を所定の範囲内に制限する
請求項1または請求項2の音声合成装置。 - 声質が相違する音声について音声素片毎の素片データを含む複数の音声ライブラリから、所定の条件を充足する組合せの範囲内で、前記第1音声の音声ライブラリと前記第2音声の音声ライブラリとを利用者からの指示に応じて選択する音声選択手段
を具備する請求項1から請求項3の何れかの音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013178513A JP6286946B2 (ja) | 2013-08-29 | 2013-08-29 | 音声合成装置および音声合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013178513A JP6286946B2 (ja) | 2013-08-29 | 2013-08-29 | 音声合成装置および音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015049252A true JP2015049252A (ja) | 2015-03-16 |
JP6286946B2 JP6286946B2 (ja) | 2018-03-07 |
Family
ID=52699359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013178513A Active JP6286946B2 (ja) | 2013-08-29 | 2013-08-29 | 音声合成装置および音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6286946B2 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06250690A (ja) * | 1993-02-26 | 1994-09-09 | N T T Data Tsushin Kk | 振幅特徴抽出装置及び合成音声振幅制御装置 |
WO2005071664A1 (ja) * | 2004-01-27 | 2005-08-04 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置 |
JP2010224498A (ja) * | 2009-03-25 | 2010-10-07 | Toshiba Corp | 音声合成装置及び音声合成方法 |
JP2012083722A (ja) * | 2010-09-15 | 2012-04-26 | Yamaha Corp | 音声処理装置 |
JP2013011863A (ja) * | 2011-05-30 | 2013-01-17 | Yamaha Corp | 音声合成装置 |
-
2013
- 2013-08-29 JP JP2013178513A patent/JP6286946B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06250690A (ja) * | 1993-02-26 | 1994-09-09 | N T T Data Tsushin Kk | 振幅特徴抽出装置及び合成音声振幅制御装置 |
WO2005071664A1 (ja) * | 2004-01-27 | 2005-08-04 | Matsushita Electric Industrial Co., Ltd. | 音声合成装置 |
JP2010224498A (ja) * | 2009-03-25 | 2010-10-07 | Toshiba Corp | 音声合成装置及び音声合成方法 |
JP2012083722A (ja) * | 2010-09-15 | 2012-04-26 | Yamaha Corp | 音声処理装置 |
JP2013011863A (ja) * | 2011-05-30 | 2013-01-17 | Yamaha Corp | 音声合成装置 |
Non-Patent Citations (1)
Title |
---|
小川真 他: "v.Connect:ユーザが声色操作可能な歌声合成器", 情報処理学会研究報告, vol. 2012, no. 10, JPN6017016232, 15 April 2012 (2012-04-15), pages 1 - 7 * |
Also Published As
Publication number | Publication date |
---|---|
JP6286946B2 (ja) | 2018-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6171711B2 (ja) | 音声解析装置および音声解析方法 | |
JP6024191B2 (ja) | 音声合成装置および音声合成方法 | |
JP6791258B2 (ja) | 音声合成方法、音声合成装置およびプログラム | |
JP6236765B2 (ja) | 音楽データ編集装置および音楽データ編集方法 | |
JP4839891B2 (ja) | 歌唱合成装置および歌唱合成プログラム | |
JP6620462B2 (ja) | 合成音声編集装置、合成音声編集方法およびプログラム | |
JP6729539B2 (ja) | 音声合成方法、音声合成システムおよびプログラム | |
CN105957515A (zh) | 声音合成方法、声音合成装置和存储声音合成程序的介质 | |
JP2006030575A (ja) | 音声合成装置およびプログラム | |
JP2017040867A (ja) | 情報処理装置 | |
JP5625321B2 (ja) | 音声合成装置およびプログラム | |
JP2016090916A (ja) | 音声合成装置 | |
JP2018004870A (ja) | 音声合成装置および音声合成方法 | |
JP6152753B2 (ja) | 音声合成管理装置 | |
JP2018077283A (ja) | 音声合成方法 | |
JP6390690B2 (ja) | 音声合成方法および音声合成装置 | |
JP6286946B2 (ja) | 音声合成装置および音声合成方法 | |
JP5176981B2 (ja) | 音声合成装置、およびプログラム | |
JP2009157220A (ja) | 音声編集合成システム、音声編集合成プログラム及び音声編集合成方法 | |
JP5092905B2 (ja) | 歌唱合成装置およびプログラム | |
JP5552797B2 (ja) | 音声合成装置および音声合成方法 | |
JP6834370B2 (ja) | 音声合成方法 | |
JP6683103B2 (ja) | 音声合成方法 | |
JP5790860B2 (ja) | 音声合成装置 | |
JP2013050705A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160620 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170703 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180122 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6286946 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |