JP4172369B2 - 楽音処理装置、楽音処理方法及び楽音処理プログラム - Google Patents

楽音処理装置、楽音処理方法及び楽音処理プログラム Download PDF

Info

Publication number
JP4172369B2
JP4172369B2 JP2003354089A JP2003354089A JP4172369B2 JP 4172369 B2 JP4172369 B2 JP 4172369B2 JP 2003354089 A JP2003354089 A JP 2003354089A JP 2003354089 A JP2003354089 A JP 2003354089A JP 4172369 B2 JP4172369 B2 JP 4172369B2
Authority
JP
Japan
Prior art keywords
region
spectrum
overtone
fluctuation
changing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003354089A
Other languages
English (en)
Other versions
JP2005121742A (ja
Inventor
靖雄 吉岡
ロスコス アレックス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2003354089A priority Critical patent/JP4172369B2/ja
Publication of JP2005121742A publication Critical patent/JP2005121742A/ja
Application granted granted Critical
Publication of JP4172369B2 publication Critical patent/JP4172369B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

本発明は、楽音処理装置に関し、特に、複数の人が歌唱若しくは演奏しているような効果(アンサンブル効果)等を得るのに好適な楽音処理装置、楽音処理方法及び楽音処理プログラムに関する。
入力される楽音にコーラス効果(単一の音源の音を複数の音源の音が同時に鳴っているように変える効果)を付与する装置が広く知られている。このようなコーラス効果を付与する装置として、下記特許文献1には、入力される楽音信号を低域成分、中域成分、高域成分の3つに帯域分割し、帯域分割した各信号成分に異なる変調処理(周期的なピッチ変化や遅延等を与えるための処理)を施し、これらを入力された楽音信号とミックスしてコーラス効果を付与する装置が開示されている。また、下記特許文献2には、予めメモリ等に格納されている楽譜情報からピッチ、音量、出音タイミング等を抽出し、これらに変調処理を施して合成した合唱音声を得る歌唱合成装置が開示されている。
特開2003−122361号公報 特開平7−146695号公報
しかしながら、上記各特許文献に開示された変調処理においては、LFO(Low Frequency Oscillator)にて発生された三角波等の変調信号が用いられていたため、その変化の仕方は単調かつ不自然であり、実際に複数の人が歌唱若しくは演奏しているようなアンサンブル効果は得られなかった。なぜなら、実際に複数の人が歌唱若しくは演奏した場合には、声質や歌い方(演奏であれば演奏方法等)等に微妙なずれが生じ、この微妙なずれによって味わい深い音の艶や揺らぎが生み出されるからである。
本発明は、以上説明した事情を鑑みてなされたものであり、自然なアンサンブル効果等の付与を可能とする楽音処理装置、楽音処理方法及び楽音処理制御プログラムを提供することを目的とする。
上記目的を達成するために、本願発明者は、まず、1人の歌唱者が歌唱したときの音声のスペクトルと多数人の歌唱者が歌唱したときの音声のスペクトルとを比較し、相違点を明らかにした。図1は、「う」といった音を1人の歌唱者が発声したときの音声(以下、単音音声)のスペクトルの時間推移を示す図であり、図2は、上記と同じく「う」といった音を多数人の歌唱者が発声したときの音声(以下、アンサンブル音声)のスペクトルの時間推移を示す図である(縦軸;振幅、横軸;周波数)。なお、図1及び図2においては、A→B→Cの順で時間が推移(数10ms程度の時間間隔)したときのスペクトルの変化が示されている。これら図1及び図2を比較してわかることは、次の通りである。
(1)単音音声においては、スペクトルの大きさについて時間とともに大きな変化は認められず(図1のA〜C参照)、また、はっきりとした倍音構成がみてとれる。
(2)アンサンブル音声においては、1倍音、2倍音・・・といった各倍音スペクトルの大きさが時間とともに変化し(図2のA〜C参照)、また、低域から高域に向かうにつれ、倍音が明確ではなくなっていくこと(うねっていること)がみてとれる。
なお、倍音スペクトルとは、スペクトルのピークが現れる最も低い周波数を基本周波数(1倍音)とし、この基本周波数を2倍、3倍、・・・n倍した各周波数(図1及び図2に示す基本周波数、2倍音周波数等参照)におけるスペクトル成分をいい、倍音とは、これら各倍音スペクトルに対応する音をいう。
本願発明者は、このような結果を次のように考察した。まず、図2に示されるような倍音スペクトルの大きさの変動は、例えば周波数の近い正弦波を重ねたときに各周波数の差分に応じて発生するビート(うなり)の原理にみてとることができる。すなわち、多数人が歌唱等するアンサンブル時において、まず、全倍音スペクトルの中のある倍音スペクトルに着目すると、その倍音スペクトルの周波数は、各人毎にそれぞれ微妙に異なり、かつ、その周波数のずれ量も時間とともに変動していく。そして、このような倍音スペクトルの周波数のずれ方は、各倍音毎にそれぞれ異なる。さらに、低域から高域に向かうにつれ、対応する倍音スペクトルの周波数のずれ量は大きくなる。以下に示す本願発明は、このような知見に基づくものである。
上記知見に基づく本願発明は、該分析により得られるスペクトルのピークに基づいて、該単音から複数の倍音領域を抽出する倍音領域抽出手段と、前記各倍音領域内を複数の領域に分割する倍音領域内分割手段と、それぞれ異なる揺らぎ信号を発生する複数の揺らぎ信号発生手段と、前記複数の領域の各々に存在する複数のスペクトル成分について、前記複数の揺らぎ信号発生手段のいずれかに対応した前記揺らぎ信号を用いて各領域毎にそれぞれ異なる変調を施す変調手段とを具備することを特徴とする。
かかる構成によれば、入力される単音が倍音領域に分割され、倍音領域毎に異なる変調が施されるため、各倍音スペクトルの大きさが時間とともに変化し、かつ、変化の仕方等も各倍音毎に異なるといったアンサンブル音声に固有の特徴を忠実にシュミレートすることができる。
また、前記倍音領域内分割手段は、各倍音領域内に存在するピーク・スペクトルを含む第1領域と、前記第1領域の外側の領域であって該第1領域を挟む第2領域と、前記第2領域のさらに外側の領域であって該第1領域及び第2領域を挟む第3領域とに分割する態様がさらに好ましい。
また、ノイズ信号から特定周波数成分の信号を取り除いた揺らぎ信号を発生する揺らぎ信号発生手段をさらに複数備え、前記変調手段は、前記第1領域内に存在する複数のスペクトルについて、前記各倍音領域毎にそれぞれ異なる前記揺らぎ信号を用いて変化させる第1変調手段と、前記第2の領域内に存在する複数のスペクトルについて、各スペクトル毎にそれぞれ異なる前記揺らぎ信号を用いて変化させる第2変調手段とを具備するようにしても良い。
また、前記第1変調手段は、前記第1の領域内に存在する複数のスペクトルの振幅値の各々を前記揺らぎ信号を用いて変化させ、前記第2変調手段は、前記第2の領域内に存在する複数のスペクトルの振幅値の各々を、前記第1領域内に存在するピーク・スペクトルの振幅値を前記各揺らぎ信号を用いて変化させたものに置き換える一方、前記第2の領域内に存在する複数のスペクトルの位相の各々を、前記第1領域内に存在するピーク・スペクトルの周波数からその周波数偏移の分だけ補正して生成したものに置き換えるようにしても良い。
以上説明したように、本発明によれば、自然なアンサンブル効果等の付与が可能となる。
以下、本発明に係る実施の形態について図面を参照しながら説明する。
A.本実施形態
A−1.全体構成
図3は、本実施形態に係る音声処理装置(楽音処理装置)100の構成を示す図である。
音声入力部200は、マイクロホン等によって構成され、1人の歌唱者が発した単音音声を音声処理装置100の内部に入力する。
音声分析部300は、音声入力部200から供給される単音音声をフレーム単位(5〜10ms程度)でFFT(Fast Fourier Transform)分析等を行い、スペクトルの抽出を行う。そして、音声分析部300は、かかる分析等によって得たスペクトルをアンサンブル効果付与部400に供給する。
アンサンブル効果付与部(変調手段)400は、音声分析部300から供給される単音音声のスペクトルから複数の倍音領域を抽出し(詳しくは後述)、これら各倍音領域のスペクトルに異なる変調処理を施すことで、入力される単音音声にアンサンブル効果を付与する手段であり、揺らぎ信号発生ユニット500とスペクトル変更部600とを備えている。
揺らぎ信号発生ユニット500は、上記変調の際に用いられる揺らぎ信号を発生する手段であり、複数の揺らぎ信号発生部510−k(1≦k≦n)によって構成されている。さらに、各揺らぎ信号発生部510−kは、図4に示すように振幅の仕方等がそれぞれ異なる揺らぎ信号を発生する複数の揺らぎ信号発生器520−k−j(1≦j≦m)を備えている。図5は、揺らぎ信号発生器520−k−jの構成を示す図であり、図6は、揺らぎ信号発生器520−k−jにおいて発生される揺らぎ信号の波形を例示した図である。なお、以下の説明において、各揺らぎ信号発生部510−k及び各揺らぎ信号発生器520−k−jを特に区別する必要がない場合には、単に揺らぎ信号発生部510及び揺らぎ信号発生器520と略称する。また、図6に示すような揺らぎ信号を揺らぎ信号wobble(t)と略称する。
図5に示すホワイトノイズ発生器(ノイズ発生手段)521は、図示せぬ制御部による制御のもと、一定レベル内のノイズ信号をランダムに発生し、LPF(フィルタ手段)522に供給する。LPF522は、供給されるノイズ信号からカットオフ周波数設定手段523によって設定されるカットオフ周波数Fcよりも高い周波数成分の信号を取り除き、これを正規化手段524に出力する。カットオフ周波数設定手段523は、10Hz前後の一定の周波数範囲内で揺れるようなカットオフ周波数Fcを発生し、これをLPF522に設定する。このように、カットオフ周波数Fcを10Hz前後で揺らすように設定するのは、かかる揺らぎ信号によるスペクトルの変化の仕方がアンサンブル時におけるスペクトルの変化の仕方に最も合致するからである。なお、カットオフ周波数Fcを10Hz前後で揺らすタイミングについては、任意に設定可能である。また、カットオフ周波数Fcを10Hz前後で揺らすことなく、固定しても良いのはもちろんである。
正規化手段524は、LPF522から高周波成分が取り除かれたノイズ信号を受け取ると、これを図6に示すように−1〜0〜1の範囲になるように正規化し、揺らぎ信号として出力手段525に出力する。この結果、各揺らぎ信号発生部510からは、アンサンブル時におけるスペクトルの変化の仕方に最も合致する複数の揺らぎ信号(ただし、振幅の仕方等は揺らぎ信号毎に異なる)が出力され、スペクトル変更部600に供給されることになる。
スペクトル変更部600は、人数感パラメータ入力部700から供給される人数感指定情報(後述)と、各揺らぎ信号発生部510から供給される揺らぎ信号とに基づいて、各倍音領域の各スペクトルをそれぞれ変更する。なお、スペクトル変更部600の詳細については後述する。
人数感パラメータ入力部700は、操作ボタン、操作スイッチ等によって構成され、外部から操作ボタン等を介して入力される人数感(すなわち、何人で演奏等されたときのアンサンブル効果をシュミレートすべきか)を指定するための人数感指定情報を受け付け、これをスペクトル変更部600に供給する。
合成部(合成手段)800は、アンサンブル効果が付与された音声と入力された単音音声とを合成する手段であり、加算器810と、変換器820とを備えている。
加算器810は、アンサンブル効果付与部400から供給されるスペクトル(すなわちアンサンブル効果が付与された音声のスペクトル)と音声分析部300から供給されるスペクトル(すなわち入力された単音音声のスペクトル)とを加算し、加算結果を変換器820に出力する。
変換器820は、加算器から出力される加算結果(すなわち、スペクトルの加算結果)に逆FFT等を施し、入力される単音音声とアンサンブル効果が付与された音声とを合成した合成音声を得る。そして、合成部800は、この逆FFT等によって得られた合成音声を音声出力部900に供給する。
音声出力部900は、スピーカ等によって構成され、合成部800から供給される合成音声を外部に出力する。かかる構成を有する音声処理装置100を利用することで、実際に複数の人が歌唱若しくは演奏しているかのような効果を得ることが可能となる。以下、スペクトル変更部600の構成、動作等について詳細に説明する。
A−2.スペクトル変更部600
図7は、スペクトル変更部600の構成を示す図であり、図8は、単音音声から複数の領域を抽出する動作を説明するための図である。
倍音領域抽出手段621は、音声分析部300から供給される単音音声のスペクトルから複数の倍音領域を抽出する手段である。詳述すると、倍音領域抽出手段621は、供給される単音音声の各倍音スペクトルのピークを検出し、検出した各ピークを中心とする所定の周波数領域(図8のAに示すCP間の領域)をそれぞれ倍音領域として抽出する。なお、抽出する倍音領域の幅については適宜設定可能である。また、倍音領域の抽出の方法はこれに限る趣旨ではなく、変形例5に示すような方法を採用しても良い。そして、倍音領域抽出手段621は、このようにして抽出した各倍音領域のスペクトル成分を、それぞれ対応する倍音領域変更手段620−l(1≦l≦n)に供給する。
この結果、第1倍音領域内に存在する複数のスペクトル成分が第1倍音領域変更手段620−1に供給され、第2倍音領域内に存在する複数のスペクトル成分が第2倍音領域変更手段620−2に供給され、・・・第n倍音領域に存在する複数のスペクトル成分が第n倍音領域変更手段620−nに供給されることになる。なお、以下の説明において、各倍音領域変更手段620−l及び各倍音領域変更手段620−lに与えられる複数のスペクトルについて特に区別する必要がない場合には、それぞれ倍音領域変更手段620及び倍音領域スペクトルと呼ぶ。
各倍音領域変更手段620は、倍音領域抽出手段621から供給される倍音領域スペクトルを、対応する揺らぎ信号発生部510によって発生される揺らぎ信号に基づいて変更する手段であり、倍音領域内分割手段622と、第1領域変更手段623と、第2領域変更手段624と、第1加算器625とを備えている。
倍音領域内分割手段622は、倍音領域抽出手段621から供給される倍音領域スペクトルを、複数(本実施形態では3つ)の領域に分割する手段である。
具体的には、図8のBに示すように、倍音領域内分割手段622は、与えられる倍音領域スペクトルについて、倍音領域内に存在するピークを示すスペクトル(ピーク・スペクトル)を含む第1領域と、この第1領域の外側の領域であって第1領域を挟む第2領域と、この第2領域のさらに外側の領域であって第1領域及び第2領域を挟む第3領域とに分割する。
なお、各領域の幅については、例えば第1領域をピーク・スペクトルを中心とした3〜5程度のbinを含む領域とし(図8のBに示すbin参照;なお、binとはFFT分析の結果である各周波数スペクトルの成分であり、binの数はFFT分析の分解能に対応し、各binには周波数順にインデックスが付されている。)、第2領域については当該倍音領域のピーク周波数(ピーク・スペクトルの周波数)に応じてそのピーク周波数が高くなるほど広くなるように設定し(詳細は後述)、第3領域については当該倍音領域から第1領域及び第2領域の除いた領域とする。もちろん、どのようにして各領域の幅を決定するかは適宜設定・変更可能である。
倍音領域内分割手段622は、上記の如く倍音領域を第1〜第3領域に分割すると、分割後の第1領域に含まれる複数のbin(以下、第1領域スペクトル)を第1領域変更手段623に供給し、第2領域に含まれる複数のbin(以下、第2領域スペクトル)を第2領域変更手段624に供給し、第3領域に含まれる複数のbin(以下、第3領域スペクトル)を第1加算器625に供給する。
図9は、第1領域変更手段623及び第2領域変更手段624によって実行される第1領域スペクトル及び第2領域スペクトルの変更動作を説明するための図であり、図10は、第1領域変更手段623及び第2領域変更手段624に供給される揺らぎ信号wobble(t)を説明するための図である。なお、図9においては、変化前のスペクトルの振幅値を実線で示し、変化後のスペクトルの振幅値を破線で示している。
A−2−1.第1領域変更手段623
第1領域変更手段(第1変調手段)623は、倍音領域内分割手段622から第1領域スペクトルを受け取ると、この第1領域スペクトルのbinの振幅値magnitude(=OriginalMag(i))の各々を、下記式(1)を利用して変化させる(図9に破線で示す第1領域スペクトル参照)。
Mag(i)=OriginalMag(i)*(wobble[n](t)+1)*a ・・・(1)
a;振幅値の揺らぎ幅を決定する定数(詳細は後述)
i;第1領域スペクトルのbinのインデックス
なお、上記式(1)におけるwobble[n](t)の[n]は、各倍音領域の番号(例えば第1倍音領域であれば「1」等)を意味し、各倍音領域毎にそれぞれ独立した揺らぎ信号wobble(t)が用いられることを意味する。具体的には、図10に示すように、第1倍音領域変更手段620−1に係る第1領域変更手段623には、揺らぎ信号発生器520−1−1から発生される揺らぎ信号が供給され、第2倍音領域変更手段620−2に係る第1領域変更手段623には、揺らぎ信号発生器520−2−1から発生される揺らぎ信号が供給され、・・・第n倍音領域変更手段620−nに係る第1領域変更手段623には、揺らぎ信号発生器520−n−1から発生される揺らぎ信号が供給される。
各第1領域変更手段623は、与えられる揺らぎ信号wobble(t)を用いてMag(i)を求めると、このようにして求めたMag(i)を、そのbinの新しい振幅値magnitudeとし、新しい振幅値magnitudeを有する第1領域スペクトルを第1加算器625に出力する。なお、各第1領域変更手段623は、後述する各第2領域変更手段624とは異なり、供給される第1領域スペクトルの振幅値magnitudeを揺らぎ信号wobble(t)に基づいて変化させるのみであり、それぞれの位相phaseについては変化させない(Phase=OriginalPhase(i))。各第1領域変更手段623は、このような処理を実行することで、各倍音毎に生じるビート(うなり)がシュミレートする(発明が解決しようとする課題の項参照)。
A−2−2.第2領域変更手段624
第2領域変更手段(第2変調手段)624は、倍音領域内分割手段622から第2領域スペクトルを受け取ると、まず、この第2領域スペクトルの振幅値magnitudeの各々を、下記式(2)を利用して求めた各Mag(i)に置き換える(図9に破線で示す第2領域スペクトル参照)。
Mag(i)=PeakMag(n)*(wobble[i](t)+1)*b ・・・(2)
b;振幅値の揺らぎ幅を決定する定数(詳細は後述)
i;第2領域スペクトルのbinのインデックス
なお、上記式(2)におけるPeakMag(n)は、n次倍音領域(すなわち、倍音領域の番号が[n]である倍音領域)のピーク・スペクトルのmagnitudeを示しており、上記OriginalMag(i)については無視する点に留意する。また、wobble[i](t)の[i]は、各スペクトル毎にそれぞれ独立した揺らぎ信号wobble(t)を用いることを意味し、同一倍音領域内であっても各スペクトル毎にそれぞれ独立した揺らぎ信号wobble[i](t)が用いられる点に留意する。
具体的には、図10に示すように、第1倍音領域変更手段620−1に係る第2領域変更手段624には、揺らぎ信号発生器520−1−2〜−m1から発生される複数の揺らぎ信号が供給され、第2倍音領域変更手段620−2に係る第2領域変更手段624には、揺らぎ信号発生器520−2−2〜−m2(>m1)から発生される複数の揺らぎ信号が供給され、・・・第n倍音領域変更手段620−nに係る第2領域変更手段624には、揺らぎ信号発生器510−n−2〜−m3(>m2)から発生される複数の揺らぎ信号が供給される。
このように、第2領域については、倍音領域の番号が大きくなるにつれ(すなわち倍音領域のピーク・スペクトルの周波数が高くなるにつれ)、供給される揺らぎ信号の数が増加するように設定される。これは、倍音領域のピーク・スペクトルの周波数に応じて第2領域の幅を変えているためである。前述したように、アンサンブル音声においては、高い周波数領域の倍音ほどずれが大きい(図2参照)。これをシュミレートするべく、本実施形態では、第2領域変更手段(領域幅変更手段)624が、倍音領域のピーク・スペクトルの周波数が高くなるにつれ、第2領域の幅が広くなるように設定する(図11参照)。なお、図11では、倍音領域のピーク・スペクトルの周波数に応じて第2領域の幅が単調に拡がる場合を例示しているが、その傾き、関数の形状等については、人数感パラメータ入力部700から入力される人数感指定情報に従って適宜変更すれば良い。また、第2領域の幅のみならず、第1領域の幅、第3領域の幅を上記の如く変えて良いのはもちろんである。
図12は、図示せぬメモリに格納されている関数管理テーブルTAを例示した図である。この関数管理テーブルTAには、人数感指定情報と図11に示す第2領域の幅を決定するための関数の傾きとが対応づけて登録されている。図12に示すように、この関数の傾きは、人数感指定情報に示される人数が増すにつれ、大きくなるように設定されている。このように設定されているのは、アンサンブル演奏等を行う人数が多ければ多いほど、音程等のずれが大きくなると考えられるからである。
スペクトル変更部600は、人数感パラメータ入力部700から人数感指定情報を受け取ると、この人数感指定情報に示される人数(例えば、「5人」)を検索キーとして上記メモリを検索し、対応する関数の傾き(例えば、「e4」)を取得し、各第2領域変更手段624に供給する。各第2領域変更手段624は、この傾きを有する関数に従って第2領域の幅を適宜求めていく。このように、第2領域の幅を決定する関数の傾きを適宜変更することで、人数感の調節を行うことが可能となる。なお、人数感指定情報と関数の傾き(若しくは関数の形状等)との関係をどのように規定するかは、適宜変更可能である。
以上の如く第2領域スペクトルのbinの振幅値magnitudeの各々を適宜変更すると、次に、第2領域変更手段624は、第2領域スペクトルの位相phaseの各々を、下記式(3)、(4)利用して求めた各位相Phaseに置き換える。
PhaseOffset(i)=LastPhaseOffset(i)+2π*PeakFreq(n)*(i/BinPeak (n)−1.0)*FrameTime ・・・(3)
Phase(i)=PeakPhase(n)+PhaseOffset(i) ・・・(4)
PeakFreq(n);n次倍音領域のピーク・スペクトルの周波数
PeakPhase(n);n次倍音領域のピーク・スペクトルの位相
BinPeak(n);n次倍音領域のピーク・スペクトルのbinのインデックス番号
LastPhaseOffset(i);1つ前に求めたPhaseOffset
FrameTime;FFTなどの処理フレームの時間周期
i;第2領域スペクトルのbinのインデックス
このように、第2領域変更手段624は、第2領域スペクトルのbinの位相Phaseの各々を、n次倍音領域のピーク・スペクトルの位相からその周波数偏移の分だけ補正して生成したものに置き換えることで、上記位相を変化させる。各第2領域変更手段624は、上記の如く与えられる各揺らぎ信号wobble(t)を用いて新たな振幅値Mag(i)を求めるとともに、新たな位相Phase(i)を求め、これら新たな振幅値Mag(i)及び新たな位相Phase(i)を有する第2領域スペクトルを第1加算器625に出力する。各第2領域変更手段624は、このような処理を実行することで、もとの音声(入力される単音音声)の倍音周辺に生じるスペクトルのうねりをシュミレートする(発明が解決しようとする課題の項参照)。
各倍音領域変更手段620に設けられた第1加算器625は、第1領域変更手段623から供給される変更後の第1領域スペクトルと、第2領域変更手段624から供給される変更後の第2領域スペクトルと、倍音領域内分割手段622から供給される何も変更されていない第3領域スペクトルとを加算し、これを変更後の倍音領域スペクトルとして第2加算器626に出力する。第2加算器626は、各第1加算器625からそれぞれ供給される変更後の倍音領域スペクトルを加算し、加算結果を合成部800(図3参照)に出力する。
合成部800は、このようにアンサンブル効果が付与された音声のスペクトルを第2加算器626から受け取ると、この音声のスペクトルと音声分析部300から供給される単音音声のスペクトルとを合成し、合成音声を得る。この結果、音声出力部900からは、実際に複数の人が歌唱しているかのような効果が付与された合成音声が出力される。
以上説明したように、本実施形態によれば、入力される単音音声から複数の倍音領域を抽出し、各倍音領域の各々に含まれる複数のスペクトル成分について、それぞれ異なる変調を施すことにより、実際に複数の人が歌唱しているかのうようなアンサンブル効果を付与することが可能となる。特に、本実施形態においては、各倍音領域において生ずるビートをシュミレートする領域(第1領域)、スペクトルのうねりをシュミレートする領域(第2領域)等に分け、それぞれに異なる変調を施しているため、より忠実にアンサンブル効果をシュミレートすることが可能となる。
さらに、本実施形態においては、高い周波数領域ほど倍音のずれが大きいといったアンサンブル音声の特性を考慮し、スペクトルのうねりをシュミレートする領域(第2領域)の幅については、周波数が高くなるほどを広く設定している。このような設定により、上記と同じく、より忠実にアンサンブル効果をシュミレートすることが可能となる。
なお、上述した本実施形態では、第2加算器626によって加算された結果がそのまま合成部800に出力される場合について説明したが、例えば第2加算器626の後段に、図13に示すような特性を有するフィルタ手段(図7の破線部分参照)を設けても良い。かかるフィルタ手段627を設けることにより、高域成分の信号が取り除かれ、より自然なアンサンブル効果を付与することが可能となる。
ここで、フィルタ手段627のカットオフ周波数fcについては、所定の値に固定することもできるが、所定の範囲(例えば、5〜10kHz程度)で揺らすように設定しても良い。また、第2加算器626の後段にフィルタ手段627を設ける代わりに、第1加算器625と第2加算器626の間にフィルタ手段627を設けるようにしても良い。なお、カットオフ周波数を揺らすように設定する方法については、LPF522の説明においてその詳細を明らかにしたため、省略する。
B.変形例
<変形例1>
上述した本実施形態では、第2領域の幅を決定する関数の傾きを適宜変更することで、人数感の調節を行う場合について説明したが、例えば上記式(1)、(2)に示す定数a、bの大きさを適宜変更することで、人数感の調節を行うようにしても良い。
図14は、図示せぬメモリに格納されている定数管理テーブルTBを例示した図である。この定数管理テーブルTBには、人数感指定情報と定数a及び定数bとが対応づけて登録されている。図14に示すように、この定数a、bは、人数感指定情報に示される人数が増すにつれ、大きくなるように設定されている。このように設定されているのは、アンサンブル演奏等を行う人数が多ければ多いほど、音程等のずれが大きくなると考えられるからである。スペクトル変更部600は、人数感パラメータ入力部700から人数感指定情報を受け取ると、この人数感指定情報に示される人数(例えば、「5人」)を検索キーとして上記メモリを検索し、対応する定数a(例えば、「a4」)、定数b(例えば、「b4」)を取得する。
そして、スペクトル変更部600は、取得した各定数a、bを各第1領域変更手段623及び各第2領域変更手段624に供給する。各第1領域変更手段(第1揺らぎ幅変更手段)623は、上記式(1)に示される定数をスペクトル変更部600から与えられる定数aに変えることで振幅値の揺らぎ幅を変更する一方、各第2領域変更手段(第2揺らぎ幅変更手段)624は、上記式(2)に示される定数をスペクトル変更部600から与えられる定数bに変えることで振幅値の揺らぎ幅を変更する。このように、式(1)、(2)に示す定数a、bの大きさを適宜変更することで、人数感の調整を行うようにしても良い。なお、定数a及び定数bについて、倍音領域毎に異なる定数a及び定数bをそれぞれ設定するようにしても良いのはもちろんである。
<変形例2>
図15は、変形例2に係る音声処理装置100’の構成を示す図であり、図3に対応する図である。図15に示す音声処理装置100’と図3に示す音声処理装置100とは、アンサンブル効果付与部400にパラメータ変更部410が設けられている点、及びアンサンブル効果付与部400が複数設けられている点が相違する。なお、その他の点については、図3に示す音声処理装置100と同様であるため説明を割愛する。
パラメータ変更部410は、図示せぬ制御部による制御のもと、音声分析部300から供給される単音音声のスペクトルについて、ピッチや音量、出力タイミングといったパラメータを変更する手段である。パラメータ変更部410は、これらのパラメータを適宜変更すると、パラメータを適宜変更した後のスペクトルをスペクトル変更部600に供給する。このように、入力される単音音声のスペクトルをそのままスペクトル変更部600に供給するのではなく、パラメータ変更部410を介して各種パラメータを変更した後にスペクトル変更部600に供給するようにしても良い。
また、本実施形態では、音声処理装置100にアンサンブル効果付与部400が1つ設けられている場合について説明したが、図15に示すようにアンサンブル効果付与部400を複数設け、各アンサンブル効果付与部400によってアンサンブル効果が付与された複数の音声と入力された単音音声とを合成し、合成音声を得るようにしても良い。かかる構成によれば、アンサンブル効果付与部400が1つ設けられている場合と比較して、より一層人数感を増した合成音声を得ることが可能となる。
<変形例3>
また、上述した本実施形態では、倍音領域変更手段620と同じ数の揺らぎ信号発生部510が設けられている場合について説明したが(図10参照)、次のようにして揺らぎ信号発生部510の数を倍音領域変更手段620の数より減らしても良い。例えば、図10に示す揺らぎ信号発生部510−1から発生される複数の揺らぎ信号を、第1倍音領域変更手段620−1及び第2倍音領域変更手段620−2に供給する。
この場合、揺らぎ信号発生器520−1−1から発生される揺らぎ信号については、第1倍音領域変更手段620−1に係る第1領域変更手段623に供給するとともに、第2倍音領域変更手段620−2に係る第2領域変更手段624に供給し、・・・揺らぎ信号発生器520−n−1から発生される揺らぎ信号については、第1倍音領域変更手段620−1に係る第2領域変更手段624に供給するとともに、第n倍音領域変更手段620−nに係る第1領域変更手段623に供給する。このように、各揺らぎ信号発生器520から発生される揺らぎ信号を複数の倍音領域変更手段620に供給することで、揺らぎ信号発生部510の数を倍音領域変更手段620の数より減らすようにしても良い。
<変形例4>
また、上述した本実施形態では、上記式(1)、(2)において「(wobble[i](t)+1)」といった形で揺らぎ信号を用いる場合について説明したが、例えば「(wobble[i](t)+1)*(wobble[i](t)+1)」といったように揺らぎ信号を2乗、3乗等して用い、magnitudeの変調の仕方を強調するようにしても良い。
<変形例5>
また、上述した本実施形態では、検出した各ピークを中心とする所定の周波数領域(図8のAに示すCP間の領域)をそれぞれ倍音領域として抽出する場合について説明したが、例えば図16のAに示すように検出した各ピークの中間位置をCP’として設定し、この中間位置CP’にて分割した各領域をそれぞれ倍音領域としても良く、また、図16のBに示すように複数のピークを含む所定の周波数領域(図16のBに示すCP’’間の領域)をそれぞれ倍音領域として抽出するようにしても良い。
また、本実施形態では歌唱音声を例に説明したが、例えば通常の会話の音声や楽器音などにも適用することができる。また、以上説明した音声処理装置100の各部の機能は、ROM等に格納されているプログラムによって実現されるため、かかるプログラムについてCD−ROM等の記録媒体に記録して頒布したり、インターネット等の通信ネットワークを介して頒布しても良い。もちろん、音声処理装置100の各部の機能をハードウェアによって実現しても良い。
単音音声のスペクトルの時間推移を示す図である。 アンサンブル音声のスペクトルの時間推移を示す図である。 本実施形態に係る音声処理装置の構成を示す図である。 同実施形態に係る揺らぎ信号発生部の構成を示す図である。 同実施形態に係る揺らぎ信号発生器の構成を示す図である。 同実施形態に係る揺らぎ信号の変化の様子を示す図である。 同実施形態に係るスペクトル変更部の構成を示す図である。 同実施形態に係る単音音声を複数の領域に分割する動作を説明するための図である。 同実施形態に係る第1領域スペクトル及び第2領域スペクトルの変更動作を説明するための図である。 同実施形態に係る第1領域変更手段及び第2領域変更手段に供給される揺らぎ信号を説明するための図である。 同実施形態に係る倍音領域のピーク・スペクトルの周波数と第2領域の幅との関係を示す図である。 同実施形態に係る関数管理テーブルを例示した図である。 同実施形態に係るフィルタ手段の特性を示す図である。 変形例1に係る定数管理テーブルを例示した図である。 変形例2に係る音声処理装置の構成を示す図である。 変形例5に係る単音音声を複数の領域に分割する動作を説明するための図である。
符号の説明
100、100’・・・音声処理装置、200・・・音声入力部、300・・・音声分析部、400・・・アンサンブル効果付与部、410・・・パラメータ変更部、500・・・揺らぎ信号発生ユニット、510・・・揺らぎ信号発生部、520・・・揺らぎ信号発生器、521・・・ホワイトノイズ発生器、522・・・LPF、523・・・カットオフ周波数設定手段、524・・・正規化手段、525・・・出力手段、600・・・スペクトル変更部、620・・・倍音領域変更手段、621・・・倍音領域抽出手段、622・・・倍音領域内分割手段、623・・・第1領域変更手段、624・・・第2領域変更手段、625・・・第1加算器、626・・・第2加算器、627・・・フィルタ手段、700・・・人数感パラメータ入力部、800・・・合成部、900・・・音声出力部、TA・・・関数管理テーブル、TB・・・定数管理テーブル。

Claims (9)

  1. 入力される単音のスペクトルを分析し、該分析により得られるスペクトルのピークに基づいて、該単音から複数の倍音領域を抽出する倍音領域抽出手段と、
    前記各倍音領域内を複数の領域に分割する倍音領域内分割手段と、
    それぞれ異なる揺らぎ信号を発生する複数の揺らぎ信号発生手段と、
    前記複数の領域の各々に存在する複数のスペクトル成分について、前記複数の揺らぎ信号発生手段のいずれかに対応した前記揺らぎ信号を用いて各領域毎にそれぞれ異なる変調を施す変調手段と
    を具備することを特徴とする楽音処理装置。
  2. 記倍音領域内分割手段は、各倍音領域内に存在するピーク・スペクトルを含む第1領域と、前記第1領域の外側の領域であって該第1領域を挟む第2領域と、前記第2領域のさらに外側の領域であって該第1領域及び第2領域を挟む第3領域とに分割することを特徴とする請求項に記載の楽音処理装置。
  3. 記変調手段は、
    前記第1領域内に存在する複数のスペクトル成分について、前記各倍音領域毎にそれぞれ異なる前記揺らぎ信号を用いて変化させる第1変調手段と、
    前記第2領域内に存在する複数のスペクトル成分について、各スペクトル成分毎にそれぞれ異なる前記揺らぎ信号を用いて変化させる第2変調手段と
    を具備することを特徴とする請求項に記載の楽音処理装置。
  4. 前記第1変調手段は、前記第1の領域内に存在する複数のスペクトル成分の振幅値の各々を前記揺らぎ信号を用いて変化させ、
    前記第2変調手段は、前記第2の領域内に存在する複数のスペクトル成分の振幅値の各々を、前記第1領域内に存在するピーク・スペクトルの振幅値を前記各揺らぎ信号を用いて変化させたものに置き換える一方、前記第2領域内に存在する複数のスペクトル成分の位相の各々を、前記第1領域内に存在するピーク・スペクトルの周波数からその周波数偏移の分だけ補正して生成したものに置き換えることを特徴とする請求項に記載の楽音処理装置。
  5. 前記各揺らぎ信号発生手段は、
    ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と
    をそれぞれ具備することを特徴とする請求項またはに記載の楽音処理装置。
  6. 前記第1変調手段によって変化させられる前記振幅値の揺らぎ幅を変更する第1揺らぎ幅変更手段と、
    前記第2変調手段によって置き換えられる前記振幅値の変化幅を変更する第2揺らぎ幅変更手段とをさらに具備することを特徴とする請求項またはに記載の楽音処理装置。
  7. 前記各倍音領域に存在するピーク・スペクトルの周波数に応じて、各倍音領域の幅を変更する領域幅変更手段をさらに具備することを特徴とする請求項のいずれか1の請求項に記載の楽音処理装置。
  8. 入力される単音のスペクトルを分析し、該分析により得られるスペクトルのピークに基づいて、該単音から複数の倍音領域を抽出する倍音領域抽出過程と、
    前記各倍音領域内を複数の領域に分割する倍音領域内分割過程と、
    それぞれ異なる揺らぎ信号を発生する複数の揺らぎ信号発生過程と、
    前記複数の領域の各々に存在する複数のスペクトル成分について、前記複数の揺らぎ信号発生過程のいずれかに対応した前記揺らぎ信号を用いて各領域毎にそれぞれ異なる変調を施す変調過程と
    を具備することを特徴とする楽音処理方法。
  9. コンピュータを、
    入力される単音のスペクトルを分析し、該分析により得られるスペクトルのピークに基づいて、該単音から複数の倍音領域を抽出する倍音領域抽出手段と、
    前記各倍音領域内を複数の領域に分割する倍音領域内分割手段と、
    それぞれ異なる揺らぎ信号を発生する複数の揺らぎ信号発生手段と、
    前記複数の領域の各々に存在する複数のスペクトル成分について、前記複数の揺らぎ信号発生手段のいずれかに対応した前記揺らぎ信号を用いて各領域毎にそれぞれ異なる変調を施す変調手段と
    として機能させるための楽音処理プログラム。
JP2003354089A 2003-10-14 2003-10-14 楽音処理装置、楽音処理方法及び楽音処理プログラム Expired - Fee Related JP4172369B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003354089A JP4172369B2 (ja) 2003-10-14 2003-10-14 楽音処理装置、楽音処理方法及び楽音処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003354089A JP4172369B2 (ja) 2003-10-14 2003-10-14 楽音処理装置、楽音処理方法及び楽音処理プログラム

Publications (2)

Publication Number Publication Date
JP2005121742A JP2005121742A (ja) 2005-05-12
JP4172369B2 true JP4172369B2 (ja) 2008-10-29

Family

ID=34612181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003354089A Expired - Fee Related JP4172369B2 (ja) 2003-10-14 2003-10-14 楽音処理装置、楽音処理方法及び楽音処理プログラム

Country Status (1)

Country Link
JP (1) JP4172369B2 (ja)

Also Published As

Publication number Publication date
JP2005121742A (ja) 2005-05-12

Similar Documents

Publication Publication Date Title
JP6791258B2 (ja) 音声合成方法、音声合成装置およびプログラム
JP4207902B2 (ja) 音声合成装置およびプログラム
JP3502247B2 (ja) 音声変換装置
JP4645241B2 (ja) 音声処理装置およびプログラム
JP2002529773A5 (ja)
JP2003255998A (ja) 歌唱合成方法と装置及び記録媒体
CN110459196A (zh) 一种调整歌曲演唱难度的方法、装置及系统
Bonada et al. Sample-based singing voice synthesizer by spectral concatenation
JP2002268658A (ja) 音声分析及び合成装置、方法、プログラム
JP3511360B2 (ja) 音楽音響信号分離方法、その装置およびそのプログラム記録媒体
Gentilucci et al. Composing vocal distortion: A tool for real-time generation of roughness
JP4455701B2 (ja) 音声信号処理装置および音声信号処理方法
JP4844623B2 (ja) 合唱合成装置、合唱合成方法およびプログラム
JP2004021027A (ja) 演奏音制御方法及び装置
JP4304934B2 (ja) 合唱合成装置、合唱合成方法およびプログラム
JP4172369B2 (ja) 楽音処理装置、楽音処理方法及び楽音処理プログラム
JP4433734B2 (ja) 音声分析合成装置、音声分析装置、及びプログラム
JP4349316B2 (ja) 音声分析及び合成装置、方法、プログラム
Ashtamoorthy et al. Frequency contour modeling to synthesize natural flute renditions for Carnatic music
JP2000003200A (ja) 音声信号処理装置及び音声信号処理方法
JP3903975B2 (ja) 楽音処理装置、楽音処理方法及び楽音処理プログラム
JP7375836B2 (ja) 電子楽器、楽音発生方法およびプログラム
JP3130305B2 (ja) 音声合成装置
US20230215407A1 (en) Electronic musical instrument, method of generating musical sound, and computer-readable storage medium
JP3540609B2 (ja) 音声変換装置及び音声変換方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060724

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080318

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080722

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080804

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110822

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120822

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130822

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees