JP6284298B2 - 音声合成装置、音声合成方法および音声合成プログラム - Google Patents
音声合成装置、音声合成方法および音声合成プログラム Download PDFInfo
- Publication number
- JP6284298B2 JP6284298B2 JP2012263574A JP2012263574A JP6284298B2 JP 6284298 B2 JP6284298 B2 JP 6284298B2 JP 2012263574 A JP2012263574 A JP 2012263574A JP 2012263574 A JP2012263574 A JP 2012263574A JP 6284298 B2 JP6284298 B2 JP 6284298B2
- Authority
- JP
- Japan
- Prior art keywords
- subband
- speech
- waveform
- sine wave
- sound source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
(音声合成装置の構成)
図1は、音声合成装置100の基本構成を示すブロック図であり、図2は、音声合成装置100の具体的構成を示すブロック図である。音声合成装置100は、音源波形をサブバンド分割部110によりサブバンド分割して蓄積し、入力情報に応じてサブバンド毎に振幅を調整する。そして、振幅を調整されたサブバンド分割音源波形ベクトルを用いてサブバンド合成部140により合成し、目標となるスペクトル特性を近似的に有する音声波形を合成する。
フィルタバンクを構成するあるフィルタの係数に離散フーリエ変換(DFT)や離散コサイン変換(DCT)、あるいはそれらの逆変換の係数系列を掛けると、基となったフィルタの特性を、周波数軸上でシフトした形のフィルタ特性が得られる。そして、このようなフィルタでフィルタバンクを構成することで、フィルタバンクの処理で必要な計算に、FFT(高速フーリエ変換)等の高速化手法が利用可能となる。これにより、サブバンド分割・サブバンド合成の処理を高速化することができる。
次に、音源の制御方法について説明する。まず前提として、サブバンド分割・サブバンド合成の前後で処理の線形性が保証されているものとする。先述のDFTやDCTに基づくフィルタバンクは、線形な操作の組み合わせだけでその処理が構成されているので、この条件を満たす。
フィルタバンクにおける間引き率Mはその値が1(全く間引かない)からMまでの場合で、少なくとも再合成前に各サブバンドでパワー調整を行なわない場合、サブバンド合成結果がサブバンド分割前の入力信号と一致するようなフィルタバンクを構成することができることが理論上知られている。例えば、DFTやDCTのみでフィルタバンクを構成し、間引き率Lの間引きを行なう場合、計算誤差を無視すれば、それらの逆変換により入力波形が完全に復元できることは明らかである。
(正弦波合成を用いた装置の構成)
上記の実施形態は、音源ごとに乗算回路を設けてスペクトル包絡特性の再現と音源の混合比調整を同時に行なう構成であるが、例えば混合励振源の各帯域のパワーが等しくなるような条件の下でサブバンド分割された音源波形をまず作成し、それに対してサブバンドごとにパワー制御を行なうこともできる。
以下に、正弦波合成部232の動作の詳細を説明する。正弦波合成部232における処理は、例えば正弦波合成部232による最終出力波形と同じサンプリングレートで特定の周波数の正弦波を生成し、それらを組み合わせて周期性波形を構築して、サブバンド符号化を行うことで実現できる。
次に、音声合成装置200の動作例を説明する。図8および図9は、音声合成装置200の動作の一例を示すフローチャートである。なお、図中のA、B、Cは、図8と図9との流れを結ぶ点を示している。本動作例では、フレームシフトがDサンプル、音源波形の1素片の長さがMサンプル、分割帯域数がMであることを前提条件としている。
110 サブバンド分割部
120 サブバンド分割音源生成部
121 蓄積部
122 選択部
130 サブバンドパワー調整部
140 サブバンド合成部
200 音声合成装置
210 サブバンド分割部
211a インパルス側分割部
211b 白色雑音側分割部
220 サブバンド分割音源生成部
220a インパルス側サブバンド分割音源生成部
220b 白色雑音側サブバンド分割音源生成部
221a インパルス側蓄積部
221b 白色雑音側蓄積部
222a インパルス側選択部
222b 白色雑音側選択部
223a インパルス側乗算部
223b 白色雑音側乗算部
224 加算部
232 正弦波合成部
236 サブバンド分割波形ベクトル生成部
Claims (7)
- 入力された時系列の音源制御情報およびスペクトル特性情報を基に、分割された複数の周波数帯域で音声波形を合成する音声合成装置であって、
1以上のサブバンドにおいて出力目標音声のスペクトル特性を模擬するように、振幅調整された複数の正弦波を足し合わせて合成した正弦波合成成分を出力する正弦波合成部と、
前記1以上のサブバンドにおいて、白色雑音のサブバンド分割音源波形ベクトルおよび前記正弦波合成成分の和として、1つのサブバンド分割波形ベクトルを生成するサブバンド分割波形ベクトル生成部と、
前記1以上のサブバンドにおいて前記生成されたサブバンド分割波形ベクトルを単一の音声波形に合成するサブバンド合成部と、を備えることを特徴とする音声合成装置。 - 前記正弦波合成部は、前記出力する正弦波合成成分が前記サブバンド合成部において原波形を完全もしくは近似的に復元できるようにダウンサンプリングされた際のサンプリングレートと等しいサンプリングレートで、前記1以上のサブバンドにおいて予めサブバンド符号化された前記正弦波合成成分を生成することを特徴とする請求項1記載の音声合成装置。
- 前記正弦波合成部は、低い側の一部の帯域のサブバンドを前記1以上のサブバンドとして前記正弦波合成成分を生成することを特徴とする請求項1または請求項2記載の音声合成装置。
- 前記正弦波合成部は、前記1以上のサブバンドにおいて入力された基本周波数から決定されるインパルスの位置に対応させて前記正弦波合成成分を生成することを特徴とする請求項1から請求項3のいずれかに記載の音声合成装置。
- 前記正弦波合成部は、前記1以上のサブバンドにおいて入力された基本周波数から決定されるインパルスの配置される時刻から遅延時間を加えた時刻に位相が0となるように前記正弦波合成成分を生成することを特徴とする請求項4記載の音声合成装置。
- 入力された時系列の音源制御情報およびスペクトル特性情報を基に、分割された複数の周波数帯域で音声波形を合成する音声合成方法であって、
1以上のサブバンドにおいて出力目標音声のスペクトル特性を模擬するように、振幅調整された複数の正弦波を足し合わせて合成した正弦波合成成分を出力するステップと、
前記1以上のサブバンドにおいて、白色雑音のサブバンド分割音源波形ベクトルおよび前記正弦波合成成分の和として、1つのサブバンド分割波形ベクトルを生成するステップと、
前記1以上のサブバンドにおいて前記生成されたサブバンド分割波形ベクトルを単一の音声波形に合成するステップと、を含むことを特徴とする音声合成方法。 - 入力された時系列の音源制御情報およびスペクトル特性情報を基に、分割された複数の周波数帯域で音声波形を合成する音声合成プログラムであって、
1以上のサブバンドにおいて出力目標音声のスペクトル特性を模擬するように、振幅調整された複数の正弦波を足し合わせて合成した正弦波合成成分を出力する処理と、
前記1以上のサブバンドにおいて、白色雑音のサブバンド分割音源波形ベクトルおよび前記正弦波合成成分の和として、1つのサブバンド分割波形ベクトルを生成する処理と、
前記1以上のサブバンドにおいて前記生成されたサブバンド分割波形ベクトルを単一の音声波形に合成する処理と、をコンピュータに実行させることを特徴とする音声合成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012263574A JP6284298B2 (ja) | 2012-11-30 | 2012-11-30 | 音声合成装置、音声合成方法および音声合成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012263574A JP6284298B2 (ja) | 2012-11-30 | 2012-11-30 | 音声合成装置、音声合成方法および音声合成プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017131338A Division JP6410890B2 (ja) | 2017-07-04 | 2017-07-04 | 音声合成装置、音声合成方法および音声合成プログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2014109667A JP2014109667A (ja) | 2014-06-12 |
JP2014109667A5 JP2014109667A5 (ja) | 2015-10-08 |
JP6284298B2 true JP6284298B2 (ja) | 2018-02-28 |
Family
ID=51030335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012263574A Active JP6284298B2 (ja) | 2012-11-30 | 2012-11-30 | 音声合成装置、音声合成方法および音声合成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6284298B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022055464A (ja) * | 2020-09-29 | 2022-04-08 | Kddi株式会社 | 音声分析装置、方法及びプログラム |
CN112863477B (zh) * | 2020-12-31 | 2023-06-27 | 出门问问(苏州)信息科技有限公司 | 一种语音合成方法、装置及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3557662B2 (ja) * | 1994-08-30 | 2004-08-25 | ソニー株式会社 | 音声符号化方法及び音声復号化方法、並びに音声符号化装置及び音声復号化装置 |
JP3659053B2 (ja) * | 1998-04-23 | 2005-06-15 | ヤマハ株式会社 | 波形データ生成方法、波形データ生成プログラムを記録した記録媒体および波形データ生成装置 |
JP4019824B2 (ja) * | 2002-07-08 | 2007-12-12 | ソニー株式会社 | 波形生成装置及び方法並びに復号装置 |
CN101116136B (zh) * | 2005-02-10 | 2011-05-18 | 皇家飞利浦电子股份有限公司 | 声音合成的装置和方法 |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
-
2012
- 2012-11-30 JP JP2012263574A patent/JP6284298B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014109667A (ja) | 2014-06-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2586846C2 (ru) | Устройство и способ обработки входного звукового сигнала с помощью каскадированного банка фильтров | |
EP2486564B1 (en) | Apparatus and method for generating high frequency audio signal using adaptive oversampling | |
AU2011263191B2 (en) | Bandwidth Extension Method, Bandwidth Extension Apparatus, Program, Integrated Circuit, and Audio Decoding Apparatus | |
CA3008914C (en) | Improved subband block based harmonic transposition | |
KR102014696B1 (ko) | 교차 곱 강화된 서브밴드 블록 기반 고조파 전위 | |
AU2013286049B2 (en) | Device, method and computer program for freely selectable frequency shifts in the sub-band domain | |
CN108140396B (zh) | 音频信号处理 | |
US9837098B2 (en) | Reduced-delay subband signal processing system and method | |
JP6410890B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP6284298B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP6201205B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
JP5763487B2 (ja) | 音声合成装置、音声合成方法および音声合成プログラム | |
RU2641253C2 (ru) | Устройство и способ для обработки звукового сигнала с использованием сигнала ошибки вследствие наложения спектров |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150821 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160915 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161018 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170523 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170704 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6284298 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |