JP2013015829A - 音声合成装置 - Google Patents
音声合成装置 Download PDFInfo
- Publication number
- JP2013015829A JP2013015829A JP2012129798A JP2012129798A JP2013015829A JP 2013015829 A JP2013015829 A JP 2013015829A JP 2012129798 A JP2012129798 A JP 2012129798A JP 2012129798 A JP2012129798 A JP 2012129798A JP 2013015829 A JP2013015829 A JP 2013015829A
- Authority
- JP
- Japan
- Prior art keywords
- phase
- spectrum
- speech
- unit
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【解決手段】記憶装置14は、音声素片の各フレームの振幅スペクトルSMを示す音声素片データDを記憶する。位相算定部32は、音声素片データDが示す振幅スペクトルSMに対応する最小位相を音声素片の位相スペクトルSPとしてフレーム毎に算定する。音声合成部34は、音声素片データDが示す各フレームの振幅スペクトルSMと位相算定部32による算定後の各フレームの位相スペクトルSPとを利用して音声信号VOUTを生成する。
【選択図】図1
Description
図1は、本発明の第1実施形態に係る音声合成装置100のブロック図である。音声合成装置100は、発話音や歌唱音等の音声を素片接続型の音声合成処理で生成する信号処理装置であり、図1に示すように、演算処理装置(CPU)12と記憶装置14と放音装置16とを具備するコンピュータシステムで実現される。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図7は、第3実施形態の音声合成装置100のブロック図である。図7に示すように、第3実施形態における素片群GAの各音声素片データDは、複数の単位データU(UA,UB)の時系列に加えて種別情報Cを含んで構成される。種別情報Cは、音声素片内の各音素の種別を指定する。例えば母音(/a/,/i/,/u/),無声破裂音(/t/,/k/,/p/),有声破裂音(/b/,/d/,/g/),無声破擦音(/ts/),有声破擦音(/j/),無声摩擦音(/s/,/f/),有声摩擦音(/z/),半母音(/w/,/y/)等の種別が種別情報Cで指定される。
第1実施形態では、振幅スペクトルSMに対応する最小位相を位相スペクトルSPとして算定した。第4実施形態では、振幅スペクトルSMに対応する位相スペクトルSPを算定する方法が第1実施形態とは相違する。図9は、第4実施形態の位相算定部32が振幅スペクトルSMに対応する位相スペクトルSPを算定する動作の説明図である。図9の部分(A)には、素片調整部26による調整後の振幅スペクトルSMが図示されている。振幅スペクトルSMは、周波数軸上の相異なる周波数f[k]に対応する複数の振幅値A[k]の系列として表現される。記号kは、周波数軸上の任意の1個の周波数(周波数ビン)を意味する。振幅特性データRから特定される振幅スペクトルSMは包絡線であるから、記号kは調波成分(基音成分および複数の倍音成分)の次数に相当する。すなわち、振幅値A[k]は、振幅スペクトルSMにおける第k次の調波成分の振幅を意味する。第4実施形態の位相算定部32は、以下に例示する処理をフレーム毎に順次に実行する。
図10は、第5実施形態の音声合成装置100のブロック図である。図10に示すように、第5実施形態の演算処理装置12は、第1実施形態と同様の各要素(素片選択部22,振幅算定部24,素片調整部26,位相算定部32,音声合成部34)に加えて第3位相補正部43として機能する。第3位相補正部43は、位相算定部32がフレーム毎に算定する位相スペクトルSPの各位相値φA[m]を補正することで位相値φB[m]をフレーム毎に算定する。記号mは、時間軸上の任意の1個のフレーム(例えばフレームの番号)を意味する。位相値φB[m]は、振幅スペクトル(包絡線)SMの調波成分毎(周波数ビン毎)に算定される。第3位相補正部43による補正後の各位相値φB[m]の系列が第m番目のフレームの位相スペクトルSPとして音声合成部34の処理に利用される。
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様を適宜に併合することも可能である。
Claims (7)
- 音声素片データが音声素片の各フレームについて示す振幅スペクトルに対応する位相スペクトルをフレーム毎に算定する位相算定手段と、
前記音声素片データが示す各フレームの振幅スペクトルと前記位相算定手段による算定後の各フレームの位相スペクトルとを利用して音声信号を生成する音声合成手段と
を具備する音声合成装置。 - 前記位相算定手段は、前記音声素片データが示す前記振幅スペクトルに対応する最小位相または最大位相を位相スペクトルとして算定する
請求項1の音声合成装置。 - 前記位相算定手段は、前記音声素片データが示す前記振幅スペクトルにおいて周波数軸上で相隣接する各周波数間の振幅値の差分を周波数軸の方向に平滑化することで位相スペクトルを算定する
請求項1の音声合成装置。 - 音声素片データが示す各フレームの振幅スペクトルを調整する素片調整手段を具備し、
前記位相算定手段は、前記素片調整手段による調整後の振幅スペクトルに対応する位相スペクトルをフレーム毎に算定し、
前記音声合成手段は、前記素片調整手段による調整後の振幅スペクトルと前記位相算定手段による算定後の各フレームの位相スペクトルとを利用して音声信号を生成する
請求項1から請求項3の何れかの音声合成装置。 - 前記位相算定手段が算定した各フレームの位相スペクトルのうち所定の帯域内の各位相値を乱数的に変化させる第1位相補正手段
を具備する請求項1から請求項4の何れかの音声合成装置。 - 音声素片内での有声度の時間変化を特定し、前記位相算定手段が算定した各フレームの位相スペクトルの各位相値を、そのフレームの有声度に応じた変動範囲内で乱数的に変化させる第2位相補正手段
を具備する請求項1から請求項5の何れかの音声合成装置。 - 前記位相算定手段が各フレームについて算定した位相スペクトルを補正する手段であって、前記位相算定手段が一のフレームについて算定した位相スペクトルの各位相値に、前記一のフレームの直前のフレームから予測される位相値の予測誤差を付加する第3位相補正手段
を具備する請求項1から請求項3の何れかの音声合成装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012129798A JP6011039B2 (ja) | 2011-06-07 | 2012-06-07 | 音声合成装置および音声合成方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011127124 | 2011-06-07 | ||
JP2011127124 | 2011-06-07 | ||
JP2012129798A JP6011039B2 (ja) | 2011-06-07 | 2012-06-07 | 音声合成装置および音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013015829A true JP2013015829A (ja) | 2013-01-24 |
JP6011039B2 JP6011039B2 (ja) | 2016-10-19 |
Family
ID=47688525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012129798A Expired - Fee Related JP6011039B2 (ja) | 2011-06-07 | 2012-06-07 | 音声合成装置および音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6011039B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10650800B2 (en) | 2015-09-16 | 2020-05-12 | Kabushiki Kaisha Toshiba | Speech processing device, speech processing method, and computer program product |
CN113066472A (zh) * | 2019-12-13 | 2021-07-02 | 科大讯飞股份有限公司 | 合成语音处理方法及相关装置 |
CN113066472B (zh) * | 2019-12-13 | 2024-05-31 | 科大讯飞股份有限公司 | 合成语音处理方法及相关装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0756590A (ja) * | 1993-08-19 | 1995-03-03 | Sony Corp | 音声合成装置、音声合成方法及び記録媒体 |
JP2906970B2 (ja) * | 1993-04-14 | 1999-06-21 | ヤマハ株式会社 | サウンドの分析及び合成方法並びに装置 |
JP2000515992A (ja) * | 1996-07-30 | 2000-11-28 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 言語コーディング |
JP2002202790A (ja) * | 2000-12-28 | 2002-07-19 | Yamaha Corp | 歌唱合成装置 |
JP2004126011A (ja) * | 2002-09-30 | 2004-04-22 | Toshiba Corp | 音声合成方法と装置及び音声合成プログラム |
WO2004049304A1 (ja) * | 2002-11-25 | 2004-06-10 | Matsushita Electric Industrial Co., Ltd. | 音声合成方法および音声合成装置 |
JP4349316B2 (ja) * | 2005-04-28 | 2009-10-21 | ヤマハ株式会社 | 音声分析及び合成装置、方法、プログラム |
-
2012
- 2012-06-07 JP JP2012129798A patent/JP6011039B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2906970B2 (ja) * | 1993-04-14 | 1999-06-21 | ヤマハ株式会社 | サウンドの分析及び合成方法並びに装置 |
JPH0756590A (ja) * | 1993-08-19 | 1995-03-03 | Sony Corp | 音声合成装置、音声合成方法及び記録媒体 |
JP2000515992A (ja) * | 1996-07-30 | 2000-11-28 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 言語コーディング |
JP2002202790A (ja) * | 2000-12-28 | 2002-07-19 | Yamaha Corp | 歌唱合成装置 |
JP2004126011A (ja) * | 2002-09-30 | 2004-04-22 | Toshiba Corp | 音声合成方法と装置及び音声合成プログラム |
WO2004049304A1 (ja) * | 2002-11-25 | 2004-06-10 | Matsushita Electric Industrial Co., Ltd. | 音声合成方法および音声合成装置 |
JP4349316B2 (ja) * | 2005-04-28 | 2009-10-21 | ヤマハ株式会社 | 音声分析及び合成装置、方法、プログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10650800B2 (en) | 2015-09-16 | 2020-05-12 | Kabushiki Kaisha Toshiba | Speech processing device, speech processing method, and computer program product |
US11170756B2 (en) | 2015-09-16 | 2021-11-09 | Kabushiki Kaisha Toshiba | Speech processing device, speech processing method, and computer program product |
US11348569B2 (en) | 2015-09-16 | 2022-05-31 | Kabushiki Kaisha Toshiba | Speech processing device, speech processing method, and computer program product using compensation parameters |
CN113066472A (zh) * | 2019-12-13 | 2021-07-02 | 科大讯飞股份有限公司 | 合成语音处理方法及相关装置 |
CN113066472B (zh) * | 2019-12-13 | 2024-05-31 | 科大讯飞股份有限公司 | 合成语音处理方法及相关装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6011039B2 (ja) | 2016-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6024191B2 (ja) | 音声合成装置および音声合成方法 | |
US10176797B2 (en) | Voice synthesis method, voice synthesis device, medium for storing voice synthesis program | |
JP5961950B2 (ja) | 音声処理装置 | |
JP6821970B2 (ja) | 音声合成装置および音声合成方法 | |
WO2019172397A1 (ja) | 音処理方法、音処理装置および記録媒体 | |
JP2018077283A (ja) | 音声合成方法 | |
JP6011039B2 (ja) | 音声合成装置および音声合成方法 | |
JP2005004104A (ja) | 規則音声合成装置及び規則音声合成方法 | |
WO2020241641A1 (ja) | 生成モデル確立方法、生成モデル確立システム、プログラムおよび訓練データ準備方法 | |
JP2018072368A (ja) | 音響解析方法および音響解析装置 | |
JP4963345B2 (ja) | 音声合成方法及び音声合成プログラム | |
US9640172B2 (en) | Sound synthesizing apparatus and method, sound processing apparatus, by arranging plural waveforms on two successive processing periods | |
JP5573529B2 (ja) | 音声処理装置およびプログラム | |
JP6834370B2 (ja) | 音声合成方法 | |
JP2007226174A (ja) | 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム | |
JP2004061753A (ja) | 歌唱音声を合成する方法および装置 | |
JP2018077280A (ja) | 音声合成方法 | |
JP7106897B2 (ja) | 音声処理方法、音声処理装置およびプログラム | |
JP7200483B2 (ja) | 音声処理方法、音声処理装置およびプログラム | |
JP6784137B2 (ja) | 音響解析方法および音響解析装置 | |
JP2003288095A (ja) | 音声合成装置、音声合成方法並びに音声合成用プログラム及びこのプログラムを記録したコンピュータで読み取り可能な記録媒体 | |
JP6047952B2 (ja) | 音声合成装置および音声合成方法 | |
JP5782751B2 (ja) | 音声合成装置 | |
JP2015064482A (ja) | 音声合成装置 | |
JP2001312300A (ja) | 音声合成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150421 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160801 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160905 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6011039 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |