JP5928489B2 - 音声処理装置およびプログラム - Google Patents
音声処理装置およびプログラム Download PDFInfo
- Publication number
- JP5928489B2 JP5928489B2 JP2014001682A JP2014001682A JP5928489B2 JP 5928489 B2 JP5928489 B2 JP 5928489B2 JP 2014001682 A JP2014001682 A JP 2014001682A JP 2014001682 A JP2014001682 A JP 2014001682A JP 5928489 B2 JP5928489 B2 JP 5928489B2
- Authority
- JP
- Japan
- Prior art keywords
- component
- unit
- phase
- frequency spectrum
- local peak
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
Description
図1は、本発明の第1実施形態に係る音声処理装置100のブロック図である。図1に示すように、音声処理装置100には、信号供給装置12と放音機器14と入力装置16とが接続される。信号供給装置12は、音声の波形を表す音声信号VINを音声処理装置100に供給する。例えば、周囲の音声を収音して音声信号VINを生成する収音機器や、記録媒体(例えば光ディスク)から音声信号VINを取得する再生装置や、通信網から音声信号VINを受信する通信装置が、信号供給装置12として利用される。音声信号VINは、発声者の声帯の振動に主に由来する音声(すなわち、仮声帯の振動に起因した成分が少ない音声)の波形を表す。
φ(fk)=θ(fk)+X(fk)+π ……(1)
数式(1)から理解されるように、効果成分Ckの位相φ(fk)は、局所的ピークPkの位相θ(fk)を、調整値X(fk)とπとの加算値だけ変化させた位相に相当する。位相θ(fk)に対するπ(rad)の加算が、声帯の振動(位相θ(fk))を逆位相に変化させる(仮声帯の振動の位相を模擬する)ことに相当する。
X(fk)=−D・2π・fk ……(2a)
D=(1+λ)/PT ……(2b)
数式(2a)および数式(2b)から理解されるように、調整値X(fk)は、音声信号VINのピッチ周期Tに対応する基準値(T・2π・fk)を中心とする範囲内で乱数λに応じて刻々と変動する。
本発明の第2実施形態について説明する。第1実施形態では、付加スペクトルEの効果成分Ckとして正弦波のスペクトル成分を利用した。第2実施形態においては、周波数スペクトルFから抽出されるスペクトル成分を効果成分Ckとして利用する。なお、以下の各形態において作用や機能が第1実施形態と同様である要素については、以上と同じ符号を付して各々の詳細な説明を適宜に省略する。
本発明の第3実施形態について説明する。第1実施形態の制御部64は、入力装置16に対する操作に応じて調整部52のゲインηを可変に制御した。第3実施形態は、制御部64が可変に制御する変数を第1実施形態から変更または追加した形態である。
図8は、本発明の第4実施形態に係る音声処理装置100Aのブロック図である。図8に示すように、音声処理装置100Aは、第1実施形態の音声処理装置100に特徴抽出部66を追加した構成である。特徴抽出部66は、音声信号VINの音量Lを所定の期間毎(例えばフレーム毎)に順次に算定する。なお、特徴抽出部66に音声信号VINを入力する構成を図8では例示するが、周波数分析部32が生成した周波数スペクトルFから特徴抽出部66が音量Lを算定する構成(特徴抽出部66に周波数スペクトルFを入力する構成)も採用される。
以上に例示した各形態は様々に変形され得る。変形の具体的な態様を以下に例示する。なお、以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
効果成分Ckの振幅a(fk)を設定する方法は以上の例示(振幅a(fk)を周波数スペクトルFの振幅A(fk)に合致させる方法)に限定されない。例えば、周波数スペクトルFの振幅A(fk)に所定値を乗算することで振幅a(fk)を算定する構成や、振幅a(fk)を振幅A(fk)とは無関係の所定値に設定する構成も採用される。ただし、振幅a(fk)を振幅A(fk)とは無関係に設定した場合、再生音の特性(特に調波構造)が音声信号VINの特性から乖離する可能性がある。他方、振幅a(fk)を振幅A(fk)に設定する第1実施形態や振幅A(fk)の演算値に設定する構成のように、周波数スペクトルFの振幅A(fk)に応じて効果成分Ckの振幅a(fk)を設定する構成によれば、音声信号VINの調波構造(基音および各倍音の成分の周波数や強度の関係)を高度に維持した喉詰声を生成できるという利点がある。
以上の各形態の調整部52に加えて、または、以上の各形態の調整部52に代えて、周波数スペクトルFの強度を調整する調整部が特性付与部50に配置され得る。すなわち、周波数スペクトルFと付加スペクトルEとの混合比を可変に制御する構成が本発明においては好適であり、周波数スペクトルFおよび付加スペクトルEの何れの強度を調整するかは任意である。もっとも、周波数スペクトルFおよび付加スペクトルEの強度の調整は本発明において必須ではない。
以上の各形態においては入力装置16に対する操作に応じて各種の変数(第1実施形態のゲインηや第3実施形態の乱数λの範囲など)を制御したが、変数の制御の基礎が利用者からの指示である構成は本発明において必須ではない。例えば、他装置からの指示に応じて変数を制御する構成や、記憶装置24に記憶されたデータ(例えば変数の数値を時系列に指示するデータ)に応じて変数を制御する構成も採用される。もっとも、演算処理装置22にて利用される変数を可変に制御する構成(制御部64)は本発明において必須ではない。
以上の各形態においては、付加スペクトルEの生成に使用される周波数スペクトルFを周波数分析部32が音声信号VINから生成したが、記憶装置24に事前に格納された周波数スペクトルFを付加スペクトルEの生成や付加に適用する構成も採用される。したがって、周波数分析部32は省略され得る。また、特性付与部50が生成した出力スペクトルGを、通信網や記録媒体を介して外部の装置に提供したうえで喉詰声の再生に利用する構成(すなわち、逆変換部62を音声処理装置100から省略した構成)も採用される。
以上の各形態においては、発生者の声帯の振動に主に由来する音声(非喉詰声)の音声信号VINに喉詰声の特性を付与したが、声帯および仮声帯の双方の振動に由来する喉詰声の音声信号VINも演算処理装置22による処理の対象となり得る。すなわち、音声信号VINが表す喉詰声の特性を更に強調した音声信号VOUT(出力スペクトルG)が生成される。また、演算処理装置22による処理(喉詰声の特性の付与)の対象となる音声は現実の発声音に限定されない。例えば、公知の音声合成技術で生成された音声信号VIN(または周波数スペクトルF)に喉詰声の特性を付与する場合にも本発明を利用できる。
効果成分Ckの個数は任意である。例えば、図2や図6においては、局所的ピークPkと同数(n個)の効果成分C1〜Cnを周波数スペクトルFに付加する場合を例示したが、1個の効果成分Ck(例えば、局所的ピークP1に対応する効果成分C1)のみを周波数スペクトルFに付加する構成でも、喉詰声の特性を音声信号VINに付加するという所期の効果は実現される。
以上の各形態においては付加スペクトルEを音声信号VINのフレーム毎に生成したが、付加スペクトルEの生成の周期は適宜に変更される。例えば、複数のフレームを1周期として付加スペクトルEが生成され得る。1周期内の各フレームの周波数スペクトルFには共通の付加スペクトルEが付加される。なお、複数のフレームを単位として付加スペクトルEを生成する構成では、相前後する付加スペクトルEで各周波数の位相が不連続となる可能性がある。そこで、相前後する各付加スペクトルEで各周波数における位相の連続性を維持するための処理(例えば、各付加スペクトルの周波数毎の位相の時系列を平滑化する処理)が好適に実行される。
Claims (7)
- 音声信号の周波数スペクトルから検出された局所的ピーク毎に前記周波数スペクトルを区分した複数の単位成分の各々から、当該単位成分の位相を変化させた効果成分を生成する成分生成手段と、
前記各単位成分から生成された効果成分を、当該効果成分の局所的ピークが前記周波数スペクトルにおける当該単位成分の局所的ピークの周波数に位置するように、前記周波数スペクトルに付加することで、声帯と仮声帯とが略同等の周期により略逆位相で振動する喉詰声の特性を前記音声信号に付与する特性付与手段と
を具備する音声処理装置。 - 前記成分生成手段は、前記複数の単位成分の各々から、πを中心とする変動範囲内の変化量だけ当該単位成分の局所的ピークの位相を変化させた効果成分を生成する
請求項1の音声処理装置。 - 前記成分生成手段は、前記効果成分の振幅を前記周波数スペクトルの当該局所的ピークの振幅に応じて設定する
請求項1または請求項2の音声処理装置。 - 前記成分生成手段は、経時的に変動する調整値に応じて前記局所的ピークの位相を変化させることで前記効果成分の位相を設定する
請求項1から請求項3の何れかの音声処理装置。 - 前記成分生成手段は、乱数に応じて前記調整値を算定する
請求項4の音声処理装置。 - 前記乱数の範囲を可変に設定する制御手段を具備し、
前記成分生成手段は、前記制御手段が設定した範囲内で発生した乱数から前記調整値を算定する
請求項5の音声処理装置。 - 音声信号の周波数スペクトルから検出された局所的ピーク毎に前記周波数スペクトルを区分した複数の単位成分の各々から、当該単位成分の位相を変化させた効果成分を生成する成分生成処理と、
前記各単位成分から生成された効果成分を、当該効果成分の局所的ピークが前記周波数スペクトルにおける当該単位成分の局所的ピークの周波数に位置するように、前記周波数スペクトルに付加することで、声帯と仮声帯とが略同等の周期により略逆位相で振動する喉詰声の特性を前記音声信号に付与する特性付与処理と
をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014001682A JP5928489B2 (ja) | 2014-01-08 | 2014-01-08 | 音声処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014001682A JP5928489B2 (ja) | 2014-01-08 | 2014-01-08 | 音声処理装置およびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009033641A Division JP2010191042A (ja) | 2009-02-17 | 2009-02-17 | 音声処理装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014059588A JP2014059588A (ja) | 2014-04-03 |
JP5928489B2 true JP5928489B2 (ja) | 2016-06-01 |
Family
ID=50616048
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014001682A Expired - Fee Related JP5928489B2 (ja) | 2014-01-08 | 2014-01-08 | 音声処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5928489B2 (ja) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0496500A (ja) * | 1990-08-09 | 1992-03-27 | Matsushita Electric Ind Co Ltd | 音声信号処理装置 |
JP2003058176A (ja) * | 2001-08-13 | 2003-02-28 | Nippon Telegr & Teleph Corp <Ntt> | 喉頭音源合成方法およびこの方法を実施する装置 |
JP3941611B2 (ja) * | 2002-07-08 | 2007-07-04 | ヤマハ株式会社 | 歌唱合成装置、歌唱合成方法及び歌唱合成用プログラム |
JP4649888B2 (ja) * | 2004-06-24 | 2011-03-16 | ヤマハ株式会社 | 音声効果付与装置及び音声効果付与プログラム |
JP4654621B2 (ja) * | 2004-06-30 | 2011-03-23 | ヤマハ株式会社 | 音声処理装置およびプログラム |
JP4701684B2 (ja) * | 2004-11-19 | 2011-06-15 | ヤマハ株式会社 | 音声処理装置およびプログラム |
JP4839891B2 (ja) * | 2006-03-04 | 2011-12-21 | ヤマハ株式会社 | 歌唱合成装置および歌唱合成プログラム |
-
2014
- 2014-01-08 JP JP2014001682A patent/JP5928489B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2014059588A (ja) | 2014-04-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11410637B2 (en) | Voice synthesis method, voice synthesis device, and storage medium | |
JP4645241B2 (ja) | 音声処理装置およびプログラム | |
JP2013051589A (ja) | ミキシング装置、ミキシング信号処理装置、ミキシングプログラム及びミキシング方法 | |
JP6821970B2 (ja) | 音声合成装置および音声合成方法 | |
US20050288921A1 (en) | Sound effect applying apparatus and sound effect applying program | |
JP2015161774A (ja) | 音合成方法及び音合成装置 | |
JP2018077283A (ja) | 音声合成方法 | |
US8492639B2 (en) | Audio processing apparatus and method | |
JP7331588B2 (ja) | 情報処理方法、推定モデル構築方法、情報処理装置、推定モデル構築装置およびプログラム | |
JP5928489B2 (ja) | 音声処理装置およびプログラム | |
US8927847B2 (en) | Glitch-free frequency modulation synthesis of sounds | |
JP2010191042A (ja) | 音声処理装置およびプログラム | |
WO2020241641A1 (ja) | 生成モデル確立方法、生成モデル確立システム、プログラムおよび訓練データ準備方法 | |
US9865276B2 (en) | Voice processing method and apparatus, and recording medium therefor | |
JP6337698B2 (ja) | 音響処理装置 | |
JP6683103B2 (ja) | 音声合成方法 | |
JP6409417B2 (ja) | 音響処理装置 | |
US10056061B1 (en) | Guitar feedback emulation | |
Malko et al. | Implementation of digital audio effects for electric guitar on DSP platform | |
JP2018077281A (ja) | 音声合成方法 | |
JP4729859B2 (ja) | 音響効果装置 | |
RU2591640C1 (ru) | Способ модификации голоса и устройство для его осуществления (варианты) | |
Rautray et al. | Parametric Analysis of Audio Effects on Vocal and Instrumental Audio Samples | |
JP4172369B2 (ja) | 楽音処理装置、楽音処理方法及び楽音処理プログラム | |
JPS6143305Y2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140108 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140924 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141121 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150428 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150626 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20151201 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160222 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20160304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160329 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160411 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5928489 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
LAPS | Cancellation because of no payment of annual fees |