JP2010191042A - 音声処理装置およびプログラム - Google Patents
音声処理装置およびプログラム Download PDFInfo
- Publication number
- JP2010191042A JP2010191042A JP2009033641A JP2009033641A JP2010191042A JP 2010191042 A JP2010191042 A JP 2010191042A JP 2009033641 A JP2009033641 A JP 2009033641A JP 2009033641 A JP2009033641 A JP 2009033641A JP 2010191042 A JP2010191042 A JP 2010191042A
- Authority
- JP
- Japan
- Prior art keywords
- phase
- component
- frequency spectrum
- frequency
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】ピーク検出部34は、音声信号VINの周波数スペクトルFから局所的ピークPkを検出する。成分生成部40は効果成分Ckを生成する。効果成分Ckの位相φ(fk)は、局所的ピークPkの位相θ(fk)を、経時的に変化する調整値X(fk)と逆位相を意味するπだけ変化させた位相に設定される。効果成分Ckの振幅a(fk)は、局所的ピークPkの振幅A(fk)に応じて設定される。特性付与部50は、周波数スペクトルFのうち局所的ピークPkの周波数fkに効果成分Ckを付加する。
【選択図】図1
Description
図1は、本発明の第1実施形態に係る音声処理装置100のブロック図である。図1に示すように、音声処理装置100には、信号供給装置12と放音機器14と入力装置16とが接続される。信号供給装置12は、音声の波形を表す音声信号VINを音声処理装置100に供給する。例えば、周囲の音声を収音して音声信号VINを生成する収音機器や、記録媒体(例えば光ディスク)から音声信号VINを取得する再生装置や、通信網から音声信号VINを受信する通信装置が、信号供給装置12として利用される。音声信号VINは、発声者の声帯の振動に主に由来する音声(すなわち、仮声帯の振動に起因した成分が少ない音声)の波形を表す。
φ(fk)=θ(fk)+X(fk)+π ……(1)
数式(1)から理解されるように、効果成分Ckの位相φ(fk)は、局所的ピークPkの位相θ(fk)を、調整値X(fk)とπとの加算値だけ変化させた位相に相当する。位相θ(fk)に対するπ(rad)の加算が、声帯の振動(位相θ(fk))を逆位相に変化させる(仮声帯の振動の位相を模擬する)ことに相当する。
X(fk)=−D・2π・fk ……(2a)
D=(1+λ)/PT ……(2b)
数式(2a)および数式(2b)から理解されるように、調整値X(fk)は、音声信号VINのピッチ周期Tに対応する基準値(T・2π・fk)を中心とする範囲内で乱数λに応じて刻々と変動する。
本発明の第2実施形態について説明する。第1実施形態では、付加スペクトルEの効果成分Ckとして正弦波のスペクトル成分を利用した。第2実施形態においては、周波数スペクトルFから抽出されるスペクトル成分を効果成分Ckとして利用する。なお、以下の各形態において作用や機能が第1実施形態と同様である要素については、以上と同じ符号を付して各々の詳細な説明を適宜に省略する。
本発明の第3実施形態について説明する。第1実施形態の制御部64は、入力装置16に対する操作に応じて調整部52のゲインηを可変に制御した。第3実施形態は、制御部64が可変に制御する変数を第1実施形態から変更または追加した形態である。
図8は、本発明の第4実施形態に係る音声処理装置100Aのブロック図である。図8に示すように、音声処理装置100Aは、第1実施形態の音声処理装置100に特徴抽出部66を追加した構成である。特徴抽出部66は、音声信号VINの音量Lを所定の期間毎(例えばフレーム毎)に順次に算定する。なお、特徴抽出部66に音声信号VINを入力する構成を図8では例示するが、周波数分析部32が生成した周波数スペクトルFから特徴抽出部66が音量Lを算定する構成(特徴抽出部66に周波数スペクトルFを入力する構成)も採用される。
以上に例示した各形態は様々に変形され得る。変形の具体的な態様を以下に例示する。なお、以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
効果成分Ckの振幅a(fk)を設定する方法は以上の例示(振幅a(fk)を周波数スペクトルFの振幅A(fk)に合致させる方法)に限定されない。例えば、周波数スペクトルFの振幅A(fk)に所定値を乗算することで振幅a(fk)を算定する構成や、振幅a(fk)を振幅A(fk)とは無関係の所定値に設定する構成も採用される。ただし、振幅a(fk)を振幅A(fk)とは無関係に設定した場合、再生音の特性(特に調波構造)が音声信号VINの特性から乖離する可能性がある。他方、振幅a(fk)を振幅A(fk)に設定する第1実施形態や振幅A(fk)の演算値に設定する構成のように、周波数スペクトルFの振幅A(fk)に応じて効果成分Ckの振幅a(fk)を設定する構成によれば、音声信号VINの調波構造(基音および各倍音の成分の周波数や強度の関係)を高度に維持した喉詰声を生成できるという利点がある。
以上の各形態の調整部52に加えて、または、以上の各形態の調整部52に代えて、周波数スペクトルFの強度を調整する調整部が特性付与部50に配置され得る。すなわち、周波数スペクトルFと付加スペクトルEとの混合比を可変に制御する構成が本発明においては好適であり、周波数スペクトルFおよび付加スペクトルEの何れの強度を調整するかは任意である。もっとも、周波数スペクトルFおよび付加スペクトルEの強度の調整は本発明において必須ではない。
以上の各形態においては入力装置16に対する操作に応じて各種の変数(第1実施形態のゲインηや第3実施形態の乱数λの範囲など)を制御したが、変数の制御の基礎が利用者からの指示である構成は本発明において必須ではない。例えば、他装置からの指示に応じて変数を制御する構成や、記憶装置24に記憶されたデータ(例えば変数の数値を時系列に指示するデータ)に応じて変数を制御する構成も採用される。もっとも、演算処理装置22にて利用される変数を可変に制御する構成(制御部64)は本発明において必須ではない。
以上の各形態においては、付加スペクトルEの生成に使用される周波数スペクトルFを周波数分析部32が音声信号VINから生成したが、記憶装置24に事前に格納された周波数スペクトルFを付加スペクトルEの生成や付加に適用する構成も採用される。したがって、周波数分析部32は省略され得る。また、特性付与部50が生成した出力スペクトルGを、通信網や記録媒体を介して外部の装置に提供したうえで喉詰声の再生に利用する構成(すなわち、逆変換部62を音声処理装置100から省略した構成)も採用される。
以上の各形態においては、発生者の声帯の振動に主に由来する音声(非喉詰声)の音声信号VINに喉詰声の特性を付与したが、声帯および仮声帯の双方の振動に由来する喉詰声の音声信号VINも演算処理装置22による処理の対象となり得る。すなわち、音声信号VINが表す喉詰声の特性を更に強調した音声信号VOUT(出力スペクトルG)が生成される。また、演算処理装置22による処理(喉詰声の特性の付与)の対象となる音声は現実の発声音に限定されない。例えば、公知の音声合成技術で生成された音声信号VIN(または周波数スペクトルF)に喉詰声の特性を付与する場合にも本発明を利用できる。
効果成分Ckの個数は任意である。例えば、図2や図6においては、局所的ピークPkと同数(n個)の効果成分C1〜Cnを周波数スペクトルFに付加する場合を例示したが、1個の効果成分Ck(例えば、局所的ピークP1に対応する効果成分C1)のみを周波数スペクトルFに付加する構成でも、喉詰声の特性を音声信号VINに付加するという所期の効果は実現される。
以上の各形態においては付加スペクトルEを音声信号VINのフレーム毎に生成したが、付加スペクトルEの生成の周期は適宜に変更される。例えば、複数のフレームを1周期として付加スペクトルEが生成され得る。1周期内の各フレームの周波数スペクトルFには共通の付加スペクトルEが付加される。なお、複数のフレームを単位として付加スペクトルEを生成する構成では、相前後する付加スペクトルEで各周波数の位相が不連続となる可能性がある。そこで、相前後する各付加スペクトルEで各周波数における位相の連続性を維持するための処理(例えば、各付加スペクトルの周波数毎の位相の時系列を平滑化する処理)が好適に実行される。
Claims (6)
- 音声信号の周波数スペクトルから局所的ピークを検出するピーク検出手段と、
前記局所的ピークの位相を変化させた位相に設定されるとともに当該局所的ピークの周波数に位置する効果成分を生成する成分生成手段と、
前記周波数スペクトルに前記効果成分を付加する特性付与手段と
を具備する音声処理装置。 - 前記ピーク検出手段は、前記周波数スペクトルから複数の局所的ピークを特定し、
前記成分生成手段は、前記複数の局所的ピークの各々について、当該局所的ピークの位相を変化させた位相に設定されるとともに当該局所的ピークの周波数に位置する効果成分を生成し、
前記特性付与手段は、前記周波数スペクトルに前記複数の効果成分を付加する
請求項1の音声処理装置。 - 前記成分生成手段は、前記効果成分の振幅を前記周波数スペクトルの当該局所的ピークの振幅に応じて設定する
請求項1または請求項2の音声処理装置。 - 前記成分生成手段は、前記局所的ピークの位相をπだけ変化させることで前記効果成分の位相を設定する
請求項1から請求項3の何れかの音声処理装置。 - 前記成分生成手段は、経時的に変動する調整値に応じて前記局所的ピークの位相を変化させることで前記効果成分の位相を設定する
請求項1から請求項4の何れかの音声処理装置。 - 音声信号の周波数スペクトルから局所的ピークを検出するピーク検出処理と、
前記局所的ピークの位相を変化させた位相に設定されるとともに当該局所的ピークの周波数に位置する効果成分を生成する成分生成処理と、
前記周波数スペクトルに前記効果成分を付加する特性付与処理と
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009033641A JP2010191042A (ja) | 2009-02-17 | 2009-02-17 | 音声処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009033641A JP2010191042A (ja) | 2009-02-17 | 2009-02-17 | 音声処理装置およびプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014001682A Division JP5928489B2 (ja) | 2014-01-08 | 2014-01-08 | 音声処理装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010191042A true JP2010191042A (ja) | 2010-09-02 |
Family
ID=42817170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009033641A Pending JP2010191042A (ja) | 2009-02-17 | 2009-02-17 | 音声処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010191042A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015099363A (ja) * | 2013-10-17 | 2015-05-28 | ヤマハ株式会社 | 音声処理装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05265481A (ja) * | 1992-03-16 | 1993-10-15 | Csk Corp | 自然動画における音声編集装置 |
JP2003058176A (ja) * | 2001-08-13 | 2003-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 喉頭音源合成方法およびこの方法を実施する装置 |
JP2003058175A (ja) * | 2001-08-13 | 2003-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 喉頭音源合成方法およびこの方法を実施する装置 |
JP2003255998A (ja) * | 2002-02-27 | 2003-09-10 | Yamaha Corp | 歌唱合成方法と装置及び記録媒体 |
JP2006010906A (ja) * | 2004-06-24 | 2006-01-12 | Yamaha Corp | 音声効果付与装置及び音声効果付与プログラム |
JP2006017946A (ja) * | 2004-06-30 | 2006-01-19 | Yamaha Corp | 音声処理装置およびプログラム |
-
2009
- 2009-02-17 JP JP2009033641A patent/JP2010191042A/ja active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05265481A (ja) * | 1992-03-16 | 1993-10-15 | Csk Corp | 自然動画における音声編集装置 |
JP2003058176A (ja) * | 2001-08-13 | 2003-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 喉頭音源合成方法およびこの方法を実施する装置 |
JP2003058175A (ja) * | 2001-08-13 | 2003-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 喉頭音源合成方法およびこの方法を実施する装置 |
JP2003255998A (ja) * | 2002-02-27 | 2003-09-10 | Yamaha Corp | 歌唱合成方法と装置及び記録媒体 |
JP2006010906A (ja) * | 2004-06-24 | 2006-01-12 | Yamaha Corp | 音声効果付与装置及び音声効果付与プログラム |
JP2006017946A (ja) * | 2004-06-30 | 2006-01-19 | Yamaha Corp | 音声処理装置およびプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015099363A (ja) * | 2013-10-17 | 2015-05-28 | ヤマハ株式会社 | 音声処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11410637B2 (en) | Voice synthesis method, voice synthesis device, and storage medium | |
JP4645241B2 (ja) | 音声処理装置およびプログラム | |
JP6821970B2 (ja) | 音声合成装置および音声合成方法 | |
US11875777B2 (en) | Information processing method, estimation model construction method, information processing device, and estimation model constructing device | |
JP2018077283A (ja) | 音声合成方法 | |
US8492639B2 (en) | Audio processing apparatus and method | |
JP5928489B2 (ja) | 音声処理装置およびプログラム | |
JP2010191042A (ja) | 音声処理装置およびプログラム | |
JP4844623B2 (ja) | 合唱合成装置、合唱合成方法およびプログラム | |
US8927847B2 (en) | Glitch-free frequency modulation synthesis of sounds | |
JP6171393B2 (ja) | 音響合成装置および音響合成方法 | |
WO2020241641A1 (ja) | 生成モデル確立方法、生成モデル確立システム、プログラムおよび訓練データ準備方法 | |
JP2006010906A (ja) | 音声効果付与装置及び音声効果付与プログラム | |
JP2007248551A (ja) | 波形データ生産方法、波形データ生産装置、プログラムおよび波形メモリ生産方法 | |
JP6337698B2 (ja) | 音響処理装置 | |
JP6683103B2 (ja) | 音声合成方法 | |
JP2010032599A (ja) | 音声処理装置およびプログラム | |
JP2018077281A (ja) | 音声合成方法 | |
JP4729859B2 (ja) | 音響効果装置 | |
RU2591640C1 (ru) | Способ модификации голоса и устройство для его осуществления (варианты) | |
Rautray et al. | Parametric Analysis of Audio Effects on Vocal and Instrumental Audio Samples | |
Anderson | A Research Dissertation Submitted in Partial Fulfilment of the Requirements for the Degree of Master of Music in Music Technology | |
Anderson | The amalgamation of acoustic and digital audio techniques for the creation of adaptable sound output for musical theatre | |
Dutilleux et al. | Modulators and demodulators | |
Furukawa et al. | Live-Electronics Algorithms in the Multimedia Work" Swim Swan |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130307 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130523 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131022 |