JP3903975B2 - 楽音処理装置、楽音処理方法及び楽音処理プログラム - Google Patents

楽音処理装置、楽音処理方法及び楽音処理プログラム Download PDF

Info

Publication number
JP3903975B2
JP3903975B2 JP2003342254A JP2003342254A JP3903975B2 JP 3903975 B2 JP3903975 B2 JP 3903975B2 JP 2003342254 A JP2003342254 A JP 2003342254A JP 2003342254 A JP2003342254 A JP 2003342254A JP 3903975 B2 JP3903975 B2 JP 3903975B2
Authority
JP
Japan
Prior art keywords
pitch
musical sound
signal
volume
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003342254A
Other languages
English (en)
Other versions
JP2005107315A (ja
Inventor
靖雄 吉岡
ロスコス アレックス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2003342254A priority Critical patent/JP3903975B2/ja
Publication of JP2005107315A publication Critical patent/JP2005107315A/ja
Application granted granted Critical
Publication of JP3903975B2 publication Critical patent/JP3903975B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Description

本発明は、楽音処理装置に関し、特に、複数の人が同じメロディを歌唱しているような効果(斉唱効果)等を得るのに好適な楽音処理装置、楽音処理方法及び楽音処理プログラムに関する。
入力される楽音にコーラス効果(単一の音源の音を複数の音源の音が同時に鳴っているように変える効果)を付与する装置が広く知られており、このような装置が上記斉唱効果を得るために利用されている。このようなコーラス効果を付与する装置として、下記特許文献1には、入力される楽音信号を低域成分、中域成分、高域成分の3つに帯域分割し、帯域分割した各信号成分に異なる変調処理(周期的なピッチ変化や遅延等を与えるための処理)を施し、これらを入力された楽音信号とミックスしてコーラス効果を付与する装置が開示されている。また、下記特許文献2には、予めメモリ等に格納されている楽譜情報からピッチ、音量、出音タイミング等を抽出し、これらに変調処理を施して合成した合唱音声を得る歌唱合成装置が開示されている。さらに、下記特許文献3には、入力される音声信号をキー変更回路、フィルタ、残響付加回路を通して変換する際に、これら各パラメータを揺らぎコントローラによって揺らがせてやることにより、入力音声信号とは異なる音声信号を生成し、これらを合成することにより斉唱効果を得る斉唱効果装置が開示されている。
特開2003−122361号公報 特開平7−146695号公報 特開平9−281966号公報
しかしながら、上記各特許文献に開示された変調処理においては、LFO(Low Frequency Oscillator)にて発生された三角波等の変調信号が用いられていたため、その変化の仕方は単調かつ不自然であり、実際に複数の人が歌唱しているような効果は得られなかった。なぜなら、実際に複数の人が歌唱した場合には、声質、歌い方、音程のずれ方等は各人毎に微妙に異なるものであり、この微妙なずれによって味わい深い音の艶や揺らぎが生み出されるからである。
本発明は、以上説明した事情を鑑みてなされたものであり、自然な斉唱効果等の付与を可能とする楽音処理装置、楽音処理方法及び楽音処理制御プログラムを提供することを目的とする。
上述した課題を解決するため、本発明に係る楽音処理装置は、ノイズ信号を発生するノイズ発生手段と、設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、入力される楽音を分析することにより、該楽音のピッチ若しくは音量を含むパラメータを抽出する分析・抽出手段と、入力される楽音のアタック時刻を検出する検出手段と、前記アタック時刻が検出されてからある時間が経過するまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を前記疑似ランダム信号を用いて算出する変化量算出手段と、前記算出された変化量を前記抽出された楽音のピッチ若しくは音量に加算することにより、該楽音のピッチ若しくは音量を変化させるパラメータ変化手段とを具備することを特徴とする。
また、本発明に係る楽音処理装置は、ノイズ信号を発生するノイズ発生手段と、設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、入力される楽音を分析することにより、該楽音のピッチ若しくは音量を含むパラメータを抽出する分析・抽出手段と、前記抽出された楽音のピッチ若しくは音量の変化の仕方がある条件を満たすとき、当該部分を前記楽音のピッチ若しくは音量の遷移部として検出する遷移部検出手段と、前記遷移部の開始時刻及び終了時刻を検出する遷移部時刻検出手段と、少なくとも前記遷移部の開始時刻が検出されてから終了時刻が検出されるまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を、前記疑似ランダム信号を用いて算出する算出手段と、前記算出された変化量を、対応する前記楽音のピッチ若しくは音量に加算することにより、該楽音のピッチ若しくは音量を変化させるパラメータ変化手段とを具備することを特徴とする。
また、本発明に係る楽音処理装置は、ノイズ信号を発生するノイズ発生手段と、設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、入力される楽音を分析することにより、該楽音のピッチを含むパラメータを抽出する分析・抽出手段と、前記楽音のピッチの変化の仕方がある条件を満たす部分を音程遷移部、その他の部分を音程安定部として検出する検出手段と、前記音程安定部として検出された部分のピッチをあるずらし量によって変化させるパラメータ変化手段であって、前記音程遷移部から前記音程安定部への移行が検出される毎に、前記ずらし量を前記疑似ランダム信号に基づいて変化させるパラメータ変化手段とを具備することを特徴とする。
また、本発明に係る楽音処理装置は、ノイズ信号を発生するノイズ発生手段と、設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、入力される楽音であって、音声を含む楽音を前記疑似ランダム信号に基づいて変調する変調手段と、前記音声の有声、無声を判定する判定手段と、前記音声が無声であると判定された場合、該音声を構成する各周波数成分の振幅値若しくは位相値をランダムに変更する変更手段とを具備することを特徴とする。
また、本発明に係る楽音処理装置は、ノイズ信号を発生するノイズ発生手段と、設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、入力される楽音のスペクトルエンベロープを抽出し、該スペクトルエンベロープを前記疑似ランダム信号に基づいて時間的に連続して変化させる変調手段とを具備することを特徴とする。
かかる構成によれば、入力される楽音を変調するための変調信号として、特定周波数成分の信号が取り除かれた疑似ランダム信号が用いられる。このような疑似ランダム信号を変調信号として用いることにより、三角波等を変調信号として用いる場合と比較して、より自然な斉唱効果等を付与することが可能となる。
ここで、上記構成にあっては、前記カットオフ周波数を設定する手段であり、該カットオフ周波数を一定の周波数範囲内で変更するカットオフ周波数設定手段をさらに具備する態様が望ましい。このように、カットオフ周波数を固定するのではなく、一定の周波数範囲内(例えば、2Hz前後)で揺らすことにより、人が歌唱したときの自然な変化、揺れ方により合致させることが可能となる。
以上説明したように、本発明によれば、自然な斉唱効果等の付与が可能となる。
以下、本発明に係る実施の形態について図面を参照しながら説明する。
A.本実施形態
A−1.全体構成
図1は、本実施形態に係る音声処理装置(楽音処理装置)100の構成を示す図である。
音声信号入力部200は、マイクロホン等によって構成され、利用者が発した音声を入力音声信号として音声処理装置100の内部に入力する。
音声信号分析部(分析・抽出手段)300は、音声信号入力部200から供給される入力音声信号を入力音声をフレーム単位(5〜10ms程度)でFFT(Fast Fourier Transform)分析等を行い、有声、無声の判定、ピッチ、音量、スペクトルの抽出を行う。そして、音声信号分析部300は、かかる分析等によって得た該音声の特徴をあらわすパラメータ、すなわち有声、無声の判定結果、ピッチ、音量、スペクトルをフレーム情報として各クローン信号生成部410−k(1≦k≦n)等に供給する。なお、入力音声信号が有声であるか、あるいは無声であるかについては、該音声信号のエネルギーや周波数成分を分析することで判定すれば良い。
クローン信号生成ユニット400は、音色、ピッチ、音量、出力タイミング等が入力音声信号と微妙に異なる変換音声信号(以下、クローン信号という)を生成する手段であり、複数のクローン信号生成部410−kによって構成されている。各クローン信号生成部(変調手段)410−kは、音声信号分析部300から供給されるフレーム情報を、疑似ランダム信号発生部510−k(1≦k≦n)から供給される疑似ランダム信号(後述)に基づいて変化させることにより上記クローン信号を生成する。
疑似ランダム信号発生ユニット500は、クローン信号生成時に用いられる疑似ランダム信号を発生する手段であり、複数の疑似ランダム信号発生部510−k(1≦k≦n)によって構成されている。各疑似ランダム信号発生部510−kは、振幅の仕方等がそれぞれ異なる疑似ランダム信号を発生し、これら各疑似ランダム信号をそれぞれ対応するクローン信号生成部410−kに供給する。図2は、疑似ランダム信号発生部510−kの構成を示す図であり、図3は、疑似ランダム信号発生部510−kにおいて発生される疑似ランダム信号の波形を例示した図である。なお、以下の説明において、各疑似ランダム信号発生部510−k及び各クローン信号生成部410−kを特に区別する必要がない場合には、単に疑似ランダム信号発生部510及びクローン信号生成部410と略称する。また、図3に示すような疑似ランダム信号を表す関数を疑似ランダム関数rand(t)と略称する。
図2に示すホワイトノイズ発生器(ノイズ発生手段)511は、図示せぬ制御部による制御のもと、一定レベル内のノイズ信号をランダムに発生し、LPF(フィルタ手段)512に供給する。LPF512は、供給されるノイズ信号からカットオフ周波数設定手段513によって設定されるカットオフ周波数Fcよりも高い周波数成分の信号を取り除き、これを正規化手段514に出力する。カットオフ周波数設定手段513は、2Hz前後の一定の周波数範囲内で揺れるようなカットオフ周波数Fcを発生し、これをLPF512に設定する。このように、カットオフ周波数Fcを2Hz前後で揺らすように設定するのは、人が歌唱したときの自然な変化、揺れ方に最も合致するから(2Hz前後で揺れるから)である。なお、カットオフ周波数Fcを2Hz前後で揺らすタイミングについては、任意に設定可能である。また、カットオフ周波数Fcを2Hz前後で揺らすことなく、固定しても良いのはもちろんである。
正規化手段514は、LPF512から高周波成分が取り除かれたノイズ信号を受け取ると、これを図3に示すように−1〜0〜1の範囲になるように正規化し、疑似ランダム信号として出力手段515に出力する。この結果、各疑似ランダム信号発生部510からは、人が歌唱したときの自然な変化、揺れ方に最も合致する疑似ランダム信号(ただし、振幅の仕方等は各疑似ランダム信号毎に異なる)が出力されることになる。
図1に戻り、各クローン信号生成部410は、対応する各疑似ランダム信号発生部510から疑似ランダム信号を受け取ると、受け取った疑似ランダム信号に基づきフレーム情報を変化させることにより、それぞれ異なったクローン信号(すなわち、音色、ピッチ等のずれ量がそれぞれ異なる変換音声信号)を生成する。
制御情報入力部(入力手段)600は、操作ボタン、操作スイッチ等によって構成され、外部から操作ボタン等を介して入力される各種効果(ビブラート効果等;詳細は後述)に関するコントロール指示を受け付ける。
信号合成部(合成手段)700は、クローン信号生成ユニット400において生成される各クローン信号と入力音声信号とを合成する手段であり、第1加算器710と、第2加算器720と、変換器730とを備えている。
第1加算器710は、各クローン信号生成部410から供給される各クローン信号のスペクトルを加算し、加算結果を第2加算器720に出力する。第2加算器720は、第1加算器710から出力されるスペクトルの加算結果と、音声信号分析部300から供給される入力音声信号のスペクトルとを加算し、加算結果を変換器730に出力する。変換器730は、第2加算器720から出力される加算結果(すなわち、全てのスペクトルの加算結果)に逆FFT等を施し、入力音声信号と各クローン信号とを合成した合成音声信号を得る。そして、信号合成部700は、この逆FFT等によって得られた合成音声信号(すなわち、音色、ピッチ等が微妙にずれた複数の音声信号を合成したもの)を音声出力部800に供給する。
音声出力部800は、スピーカ等によって構成され、信号合成部700から供給される合成音声信号を外部に出力する。かかる構成を有する音声処理装置100を利用することで、実際に複数の人が斉唱しているかのような効果を得ることが可能となる。
以下、各クローン信号生成部410によって実現される各種機能について詳細に説明する。
A−2.出力タイミング変更機能
出力タイミング変更機能は、入力音声信号に対するクローン信号の出力タイミングを変更する機能であり、図1に示すタイミング変更手段411によって実現される。
図4は、タイミング変更手段411によってフレーム情報の出力タイミングが変更されたときの様子を示す図である。なお、図4においては、フレーム情報に含まれるピッチを例示し、出力タイミング変更前のピッチを実線で示し、出力タイミング変更後のピッチを破線で示している。図4に示すように、フレーズの切り替わり部分において、ピッチの出力タイミング(すなわち、ピッチの時間的な遅れ量)は変更されている。図5は、かかる出力タイミングを変更するための処理(タイミング変更処理)を示すフローチャートであり、図6は、タイミング変更処理を説明するための図である。なお、以下の説明では、初期条件としてstate値=2、Delay値=0がメモリ(図示略)に予め設定されているものとする。
タイミング変更手段(検出手段)411は、音声信号分析部300からフレーム情報を受け取ると、該フレーム情報から入力音声信号の音量値を取得し、これを音量値AMPとしてレジスタ(図示略)に格納する(ステップS1)。そして、タイミング変更手段411は、メモリを参照し、当該時点におけるstate値を判断する(ステップS2)。タイミング変更手段411は、state値が「2」であると判断すると、ステップS3に進み、現在の音量値AMPが予め設定されている第2の音量閾値G2(>G1)よりも大きいか否かを判断する。タイミング変更手段411は、現在の音量値AMPが第2の音量閾値G2以下であると判断すると(ステップS3;NO)、そのまま処理を終了する一方、現在の音量値AMPが第2の音量閾値G2よりも大きいと判断すると(ステップS3;YES)、ステップS4に進み、state値を「2」から「1」に切り換え(図6に示すP1参照)、処理を終了する。
また、タイミング変更手段411は、ステップS2においてstate値が「1」であると判断すると、ステップS5に進み、現在の音量値AMPが予め設定されている第1の音量閾値G1よりも小さいか否かを判断する。タイミング変更手段411は、現在の音量値AMPが第1の音量閾値G1以上であると判断すると(ステップS5;NO)、そのまま処理を終了する一方、現在の音量値AMPが第1の音量閾値G1よりも小さいと判断すると(ステップS5;YES)、ステップS6に進み、下記式(1)を利用してNEW Delay値を生成し、Delay値の書き換えを行う(Delay←New Delay)とともに、state値を「1」から「2」に切り換え(図6に示すP2参照)、処理を終了する。なお、下記式(1)に示す変化量z1は、外部から制御情報入力部600を介して入力される制御情報であり、この変化量z1を変更することで出力タイミングの調整が可能となっている(この点については、以下に説明する変化量z2等も同様)。
New Delay[s]={1+rand(t)}*k1*z1 ・・・(1)
k1;定数
z1;変化量(0〜1)
このように、タイミング変更手段411は、入力音声信号の音量が減少し、かつ、該音量が第1の閾値G1(<G2)を下回ったときに、新たなDelay値を求める。タイミング変更手段411は、新たなDelay値を求めると、この新たなDelay値に従ってフレーム情報の出力タイミングを適宜変更してゆく。ここで、Delayの値を変更することにより、音声波形は不連続になり、異音が発生するといった問題が生ずるが、上記条件(すなわち、入力音声信号の音量の減少が検出され、かつ、該音量が第1の閾値G1を下回るといった条件)によれば該異音はマスクされるため、聴感上不自然な異音が聞こえてしまうといった問題も未然に防ぐことができる。
このようにしてタイミング変更手段411から出力されたフレーム情報は、図1に示す供給制御手段412に供給される。供給制御手段412は、フレーム情報を受け取ると、該フレーム情報を参照して入力音声が有声であるか、あるいは無声であるかを判断する。入力音声が有声であると判断すると、供給制御手段412は、ピッチ、音量をトレンド変化手段413に出力するとともに、スペクトルを第1スペクトル変化手段418に出力し、さらに、出力切換手段420に有声である旨の判定結果を出力する(図1に示す有声系統参照)。一方、入力音声が無声であると判断すると、供給制御手段412は、スペクトルを第2スペクトル変化手段419に出力し、さらに、出力切換手段420に無声である旨の判定結果を出力する(図1に示す無声系統参照)。
A−3.トレンド変化機能
トレンド変化機能は、供給されるピッチ、音量に比較的大きな変化(以下、トレンド変化という)をつける機能であり、図1に示すトレンド変化手段413によって実現される。
図7は、ピッチのトレンド変化の様子を示す図であり、トレンド変化前のピッチを実線で示し、トレンド変化後のピッチを破線で示している。
トレンド変化手段(パラメータ制御手段)413は、タイミング変更手段411からピッチ、音量を受け取ると、これらを下記式(2)、(3)にそれぞれ代入することにより、ピッチ、音量にトレンド変化を与える。なお、下記式(2)、(3)に示す入力ピッチ(t)[Hz]、入力音量(t)[dB]は、それぞれ供給制御手段412から供給されるピッチ、音量を指す。
出力ピッチ(t)[Hz]=入力ピッチ(t)[Hz]*{1+rand(t)*k2*z2} ・・・(2)
出力音量(t)[dB]=入力音量(t)[dB]+rand(t)*k3*z3} ・・・(3)
k2、k3;定数
z2、z3;変化量(0〜1)
このように、ピッチ、音量にトレンド変化を与えるための信号として疑似ランダム信号を用いることにより、正弦波信号などを用いる場合に比べ、より自然な変化を与えることができる。
A−4.しゃくり効果付与機能
しゃくり効果付与機能は、入力音声信号のアタック検出時にピッチ、音量軌跡を変える機能であり、図1に示すしゃくり効果付与手段414によって実現される。
図8は、しゃくり効果が付与されたときのピッチ変化の様子を示す図であり、しゃくり効果付与前のピッチを実線で示し、しゃくり効果付与後のピッチを破線で示している。周知の通り、人は歌唱するときに、音の出始め部分(アタック)において「しゃくる」ことがある。この「しゃくり」は、各人毎に、また歌唱する状況等によって異なる場合がある。この「しゃくり」をシュミレートして自然なしゃくり効果を付与するのが、しゃくり効果付与手段414である。
図9は、しゃくり効果の制御方法を説明するための図である。しゃくり効果付与手段(検出手段)414は、まず、与えられる音量と予め設定されている閾値とを比較等することにより、アタック時刻(図9に示すP1参照)の検出を行う。しゃくり効果付与手段(変化量算出手段)414は、アタック時刻を検出すると、疑似ランダム関数rand(t)を用いてピッチの変化量ΔPitchを求める。具体的には、しゃくり効果付与手段414は、アタック時刻から所定の入り時間(ある時間)が経過したときに上記変化量ΔPitchが最大値に到達し(図9に示すP2参照)、アタック時刻から所定の収束時間(ある時間)が経過したときに上記変化量ΔPitchが「0」に収束するように変化量ΔPitchを求める(図9に示すP3参照)。
この際、しゃくり効果付与手段(時間算出手段)414は、変化量ΔPitchのみならず、入り時間、収束時間についても疑似ランダム関数rand(t)を用いて算出する。なお、疑似ランダム関数rand(t)をどのように用いるかは、利用者が所望するしゃくり効果の大きさ、長さ等に応じて適宜決定すれば良い。そして、しゃくり効果付与手段(パラメータ変化手段)414は、上記の如く求めた変化量ΔPitchを下記式(4)に代入し、出力ピッチ[cent]を求める。なお、下記式(4)に示す入力ピッチ[cent]は、トレンド変化手段413から供給されるピッチを指す。
出力ピッチ[cent]=入力ピッチ[cent]+ΔPitch[cent] ・・・(4)
しゃくり効果付与手段414は、このように疑似ランダム関数rand(t)に基づいて変化量ΔPitchを求め、求めた変化量ΔPitchを入力ピッチに加算することで、図8に破線で示すようなしゃくり効果が付与された出力ピッチを得る。なお、しゃくり効果が付与されたときの音量変化については、以上説明したピッチ変化とほぼ同様の論理によって説明することができるため、割愛する。
A−5.ビブラート効果付与機能
ビブラート効果付与機能は、音を伸ばす部分等にビブラートを付ける機能であり、図1に示すビブラート効果付与手段415によって実現される。
図10は、ビブラート効果が付与されたときのピッチ変化の様子を示す図であり、ビブラート効果付与前のピッチを実線で示し、ビブラート効果付与後のピッチを破線で示している。
このようなビブラート効果を付与する前提として、利用者は、制御情報入力部600の操作ボタン等を操作して平均ビブラートディレイ、平均ビブラートデプス、平均ビブラートスピード(=レート)といったビブラート効果に関するコントロール指示(ビブラート制御情報)を入力する。入力されたビブラート制御情報は、制御情報入力部600からビブラート効果付与手段415に供給される。ビブラート効果付与手段(変調手段)415は、該ビブラート制御情報を受け取ると、ビブラート効果を付与すべきか否かを判断すべく、しゃくり効果付与手段414から供給される音量と予め設定されている閾値とを比較する。ビブラート効果付与手段415は、該音量が予め設定されている閾値を越えたと判断すると、下記式(5)、(6)、(7)に上記平均ビブラートディレイ、平均ビブラートデプス、平均ビブラートスピードを代入し、新たなビブラートディレイ、ビブラートデプス、ビブラートスピードを求める。
ビブラートディレイ=平均ビブラートディレイ*{1+rand(t)*k4} ・・・(5)
ビブラートデプス=平均ビブラートデプス*{1+rand(t)*k5} ・・・(6)
ビブラートスピード=平均ビブラートスピード*{1+rand(t)*k6} ・・・(7)
k4、k5、k6;定数
このように、ビブラート効果付与手段415は、平均ビブラートディレイ、平均ビブラートデプス、平均ビブラートディレイといったビブラート制御情報を疑似ランダム関数rand(t)に基づいて変更し、新たなビブラート制御情報を求める。そして、ビブラート効果付与手段415は、新たなビブラートディレイ時間が経過した後、この計算で求めたビブラートデプス、ビブラートスピードにてビブラートをかける。この結果、各クローン信号毎にそれぞれ異なる位相、異なる開始時刻、異なるデプス、異なるスピードを有するビブラートがかけられることになり(図10参照)、よりばらけた感じを与えることが可能となる。なお、ブラート効果が付与されたときの音量変化については、以上説明したピッチ変化とほぼ同様に説明することができるため、割愛する。
A−6.遷移部変化機能
遷移部変化手段416は、音程や音量が大きく変化するところ(遷移部)において、その変化の仕方を変更する機能であり、図1に示す遷移部変化手段416によって実現される。
図11は、遷移部前後におけるピッチ変化の様子を示す図であり、変化させる前のピッチを実線(ただし、遷移部は太い実線)で示し、変化させた後のピッチを破線で示している。周知の通り、歌唱するメロディ等が同一であったとしても、歌唱する人が異なれば、音程や音量が大きく変わるところ(すなわち遷移部)でのピッチや音量の変化の仕方は異なる。このようなピッチ、音量の変化をシュミレートして遷移部における自然な変化を実現するのが、遷移部変化手段416である。
ここで、ピッチの遷移部の検出について説明すると、まず、遷移部変化手段(遷移部検出手段)416は、ビブラート効果付与手段415から与えられるピッチの短時間平均値(例えば50[ms]間隔のピッチの平均値等)を求める。次に、遷移部変化手段416は、このようにして求めた短時間平均値について、前回求めた短時間平均値と今回求めた短時間平均値との差分(すなわち微分)をとる。そして、遷移部変化手段416は、この微分の絶対値(すなわちピッチの絶対的な変化量)が予め設定されている第1の閾値を越えてから、該ピッチの変化量が予め設定されている第2の閾値(<第1の閾値)を下回るまでを遷移部として検出する(図11に太い実線で示す遷移部参照)。より詳細には、遷移部変化手段(遷移部時刻検出手段)416は、ピッチの変化量が予め設定されている第1の閾値を越えた時刻を遷移部の開始時刻として検出し(図12に示すP1参照)、該開始時刻の後の時刻であってピッチの変化量が第2の閾値を下回った時刻を遷移部の終了時刻として検出する(図12に示すP2参照)。
図12は、このように検出した遷移部におけるピッチの制御方法を説明するための図である。
まず、遷移部変化手段(算出手段)416は、下記式(8)を用いることにより、疑似ランダム関数に基づき単位時間当たり(例えば1フレーム時間)のピッチ変化量、すなわち単位時間毎にどれだけピッチを変化させるかを求める。
ピッチ変化量[cent]=rand(t)*k7 ・・・(8)
k7;定数
次に、遷移部変化手段416は、下記式(9)にピッチ変化量を代入することにより、ピッチ変位量ΔPitchを求める。ただし、あまりに大きくピッチが変化してしまうと音痴に聞こえてしまうため、ピッチ変化関数f(t)は、図12に示すようにある量(限界値)以上は変化しないように規定する。また、遷移終了後は、遷移終了時刻(図12に示すP2)からある時間をかけてピッチ変位量ΔPitchを「0」に収束させる。ただし、遷移終了時刻後におけるピッチ変位量ΔPitchをどのように収束させるかは任意に設定可能である。
ΔPitch[cent]= ピッチ変化量[cent]*f(t) ・・・(9)
f(t);ピッチの変化関数(図12参照)
そして、遷移部変化手段(パラメータ変化手段)416は、このようにして求めたピッチ変位量ΔPitchを下記式(10)に代入することにより、出力ピッチ[cent]を求める。なお、下記式(10)に示す入力ピッチ[cent]は、ビブラート効果付与手段415から供給されるピッチを指す。
出力ピッチ[cent]=入力ピッチ[cent]+ΔPitch[cent] ・・・(10)
遷移部変化手段416は、このように疑似ランダム関数rand(t)に基づいてピッチ変化量、ピッチ変位量ΔPitchを求め、求めたピッチ変位量ΔPitchを入力ピッチに加算することで、図11に破線で示すような遷移部にてその変化の仕方が異なる出力ピッチを得る。なお、遷移部前後における音量変化については、上記ピッチ変化とほぼ同様に説明することができるため、割愛する。
A−7.スモール変化機能
スモール変化機能は、供給されるピッチ、音量に細かな変化(以下、スモール変化という)をつける機能であり、図1に示すスモール変化手段417によって実現される。
図13は、ピッチのスモール変化の様子を示す図であり、スモール変化前のピッチを実線で示し、スモール変化後のピッチを破線で示している。上述したトレンド変化においては、ピッチ、音量に比較的大きな変化を与えたが、ここではさらに短い時間間隔で、ピッチ、音量に細かな変化を与える。かりに、このようなスモール変化を与えずに音声合成等を行った場合には、一定のピッチ、音量で音声が合成されるため、機械的な音(例えばブザーのような音)に聞こえてしまう。
これに対し、短い時間間隔でピッチ、音量に細かな変化を与えた場合には、音声として自然に聞こえるといった効果を享受できる。このように、音声が音声として聞こえるためには、微少なピッチ、音量の変化が必要であるが、この変化の仕方は、当然ながら各人毎に異なる。これをシュミレートするために、スモール変化手段(パラメータ制御手段)417は、供給されるピッチ、音量を純粋なランダム信号を用いて変化させことにより、微少なランダム変化を与える。なお、この純粋なランダム信号にかえて疑似ランダム関数rand(t)を用いても良い。
A−8.音色変化機能
A−8−1.第1音色変化機能
第1音色変化機能は、クローン信号毎に異なる音色変化を与える機能であり、図1に示す第1スペクトル変化手段418によって実現される。
図14は、入力音声信号のあるフレームのスペクトルを例示した図である。なお、図14では、周波数f[Hz]を横軸にとり、振幅値magnitude[dB]を縦軸にとっている。また、図14では、スペクトルエンベロープを実線で示し、スロープを表すカーブ(以下、ECurveと称する)を破線で示している。ここでまず、ECurveの振幅値であるECurveMag(f)は、下記式(1')で表すことができる。
ECurveMag(f)=Gain+100*(e−slope*f−1)・・・(1')
Gain;当該フレームのゲイン
slope;当該フレームのスロープ
第1スペクトル変化手段418は、供給制御手段412から入力音声信号のスペクトルを受け取ると、上記のようにあらわされるECurveのslopeを各クローン信号毎に変化させる。図15及び図16は、ECurveのslopeを変えたときのスペクトルエンベロープの変化の様子を示す図であり、図15は、slopeを大きくしたときのスペクトルエンベロープの変化を示し、図16は、slopeを小さくしたときのスペクトルエンベロープの変化を示している。なお、図15及び図16に示すスペクトルエンベロープ及びECurveは、いずれも図14に示すスペクトルエンベロープ及びECurveを基準にしている。
図15と図14、図16と図14をそれぞれ比較して明らかなように、slopeを変化させると、全体の音量を表すGain(各図ではECurveの切片)は変わらないが、ECurveのslopeの変化に伴ってスペクトルエンベロープの形状が変化し、これにより音色が変化する。より具体的には、図15に示すようにslopeを大きくすると、高域側のスペクトルが出なくなるため、こもった音色になる。一方、図16に示すようにslopeを小さくすると、低域から高域まで均等にスペクトルが出るため、明るい音色になる。第1スペクトル変化手段418は、このようにクローン信号毎にスペクトルエンベロープのslopeを変えることにより、クローン信号毎に異なる音色変化を与えることが可能となる。なお、スペクトルエンベロープのslopeを各クローン信号毎に変える方法は、適宜設定可能である。
A−8−2.第2音色変化機能
第2音色変化機能は、音色を時間とともに(すなわち、時間的に連続して)変化させる機能であり、上記第1音色変化機能と同様、図1に示す第1スペクトル変化手段418によって実現される。例えば入力音声信号のアタック部分等において、スペクトルエンベロープの変化のさせ方を時間とともに変えていくと、ゴスペル的斉唱効果等が得られるといった効果がある。なお、ゴスペル的斉唱効果とは、音色の時間変化が歌唱者毎に異なるために、例えば各歌唱者による歌唱表現がさまざまであるかのような状況を与える効果をいう。ここで、上記の如く音色を時間とともに変化させる方法としては、例えば第1フォルマント周波数(スペクトルのピークが最初に現れる周波数)の変化値を時間とともに変化させる方法がある。図17は、第1フォルマント周波数の変化の様子を示す図であり、音色変化前の第1フォルマント周波数を実線で示し、音色変化後の第1フォルマント周波数を破線で示している。また、図18は、このような音色変化を実現するための第1フォルマント周波数の制御方法を説明するための図である。
まず、第1スペクトル変化手段(変調手段)418は、タイミング変更手段411から入力音声信号のスペクトルを受け取ると、該スペクトルからスペクトルエンベロープを抽出するとともに、該スペクトルを分析してアタック開始時刻の検出を行う。第1スペクトル変化手段418は、アタック時刻を検出すると(図18に示すP1参照)、疑似ランダム関数rand(t)を用いて第1フォルマント周波数の変化目標値(第1フォルマント変化値という)を求める。具体的には、第1スペクトル変化手段418は、アタック時刻から所定の入り時間が経過したときに上記第1フォルマント変化値が予め設定されている変化目標値に到達し(図18に示すP2参照)、アタック時刻から所定の収束時間が経過したときに「0」に収束するように第1フォルマント変化値を求める(図18に示すP3参照)。
この際、第1スペクトル変化手段418は、第1フォルマント変化値のみならず、入り時間、収束時間についても疑似ランダム関数rand(t)を用いて算出する。なお、疑似ランダム関数rand(t)をどのように用いるかは、利用者が所望するゴスペル的斉唱効果の大きさ、長さ等に応じて適宜決定すれば良い。そして、第1スペクトル変化手段418は、上記の如く求めた第1フォルマント変化値を下記式(11)に代入し、出力第1フォルマント周波数[Hz]を求める。なお、下記式(11)に示す入力第1フォルマント周波数[Hz]は、供給制御手段412から供給される入力音声信号の第1フォルマント周波数を指す。
出力第1フォルマント周波数[Hz]=入力第1フォルマント周波数[Hz]+第1フォルマント変化値[Hz] ・・・(11)
このように、第1フォルマント周波数を時間とともに変化させることで、上述したスペクトルエンベロープ(図14等参照)は時間とともに変化する。これに伴って該スペクトルエンベロープのslopeが変化するため、最終的には、音色が時間とともに変化することになる。なお、上記説明では、第1フォルマント周波数を時間とともに変化させる態様を例示したが、例えば第mフォルマント周波数(2≦m)を時間とともに変化させる、あるいは第mフォルマントの振幅値を時間とともに変化させるなど、何れの態様によって時間とともに音色を変化させるかは適宜選択可能である。また、第1スペクトル変化手段418は、以上説明した第1音色変化機能及び第2音色変化機能を実現するほか、スモール変化手段417から供給されるピッチ、音量に基づいてスペクトルを変化させる機能も実現する。よって、入力音声が有声音である場合には、有声系統の各手段によって様々な効果が付与されたクローン信号のスペクトルが第1スペクトル変化手段418から出力されることになる。
A−9.無声音質変化機能
無声音質変化機能は、入力音声が無声である場合にこの無声音の音質を変化させる機能であり、図1に示す第2スペクトル変化手段419によって実現される。
第2スペクトル変化手段(変更手段)419は、供給制御手段(判定手段)412から入力音声信号(無声音)のスペクトルを受け取ると、図示せぬランダム信号発生器から供給されるランダム信号(この場合のランダム信号は純粋なランダム信号とする)に基づき、該スペクトルの各周波数f[Hz]における振幅値magnitude[dB](図14参照)、位相値をランダムに変更する。この結果、例えば「s」などピッチのない無声音について、違うニュアンスの音質を有する「s」といった無声音を出力することが可能となる。このように、入力音声が無声音である場合には、無声系統の第2スペクトル変化手段419によって上記の振幅値magnitude[dB]、位相値が変更されたクローン信号のスペクトルが出力されることになる。なお、上記純粋なランダム信号の代わりに、疑似ランダム信号を用いても良いのはもちろんである。
A−10.出力切換機能
出力切換機能は、有声系統、無声系統との間で出力スペクトルの切り換えを行う機能であり、図1に示す出力切換手段420によって実現される。出力切換手段420は、供給制御手段412から供給される判定結果が「有声」である場合、有声系統側に切り換えることで、有声系統から出力されるスペクトル(有声スペクトル)を信号合成部700に供給する一方、該判定結果が「無声」である場合には、無声系統側に切り換えることで、無声系統から出力されるスペクトル(無声スペクトル)を信号合成部700に出力する。
信号合成部700は、各クローン信号生成部410から供給される全ての有声スペクトル若しくは無声スペクトル、及び入力音声信号のスペクトルを加算し、逆FFT等を施す等して合成音声信号を得る。この合成音声信号は、上記の如く疑似ランダム関数rand(t)に基づいて種々の効果等が付与された合成音声信号である。よって、利用者等は、この合成音声信号から生成される合成音声を音声出力部800を介して受聴することで、実際に複数の人が斉唱しているかのような効果を享受することが可能となる。
以上説明したように、本実施形態に係る音声処理装置によれば、音声変換時に用いる変調信号として、ホワイトノイズにLPFをかけた疑似ランダム信号を用いているため、自然な変化(すなわち、実際に複数の人が斉唱しているかのような変化)を与えることが可能となる。また、上記LPFにあっては、2Hz前後で揺れるといった人声の特徴を考慮し、そのカットオフ周波数Fcが2Hz前後で揺れるように設定される。この結果、カットオフ周波数Fcを固定した場合と比較して、より人間の自然な変化、揺れ方に合致させることが可能となる。なお、上記各処理で用いる疑似ランダム関数rand(t)について、各処理毎にそれぞれ異なるものを用いても良いのはもちろんである。
B.変形例
<変形例1>
図19は、変形例1に係る遷移部変化機能を説明するための図であり、前掲図11に対応する図である。なお、図19においても、前掲図11と同様、変化させる前のピッチを実線(ただし、音程遷移部は太い実線)で示し、変化させた後のピッチを破線で示している。
変形例1に係る遷移部変化機能は、音程が大きく変化する音程遷移部から該音程が安定する音程安定部に移行する度に、該音程安定部のデチューン量(ピッチの僅かなずらし量)を決定し、音程安定部毎にデチューン量を変える機能であり、図1に示す遷移部変化手段416’によって実現される。この変形例1に係る遷移部変化機能は、本実施形態に係る遷移部変化機能のように人間の声の自然な変化をシュミレートするものではなく、例えばバイオリンのような楽器から発せられる楽音の変化をシュミレートするものである。周知の通り、バイオリン等の弦楽器は、ピアノ等の鍵盤楽器とは異なり、ある鍵を押下すれば必ずその鍵に対応したジャストピッチ(例えば「A」=440[Hz])の楽音が発せられるものではなく、弦を押さえる箇所等によって微妙に音が変わるものである。いいかえると、バイオリン等の楽器は、音程を変えるたびに、ジャストピッチ(例えば「A」=440[Hz])から微妙に音程がずれる一方、その音程の音を出している間はそのピッチでほぼ安定しているといった特徴を有する。このような変化をシュミレートするのが、遷移部変化手段416’である(図19に示す各デチューン量dt1〜dt3参照)。
図20は、変形例1に係る遷移部変化手段416’によるピッチの制御方法を説明するための図であり、図19に示すα部分を模式的に示した図である。遷移部変化手段(検出手段)416’は、上述した遷移部変化手段416と同様に音程遷移部を検出する一方、他の部分を音程安定部として検出する。遷移部変化手段416’は、音程安定部から音程遷移部への移行を検出すると(図20に示すP1参照)、後述の如く求めた該音程安定部におけるデチューン量dt2(>0)をある時間t1をかけて「0」に収束させる。その後、遷移部変化手段(パラメータ変化手段)416’は、音程遷移部から音程安定部への移行を検出すると(図20に示すP2参照)、疑似ランダム関数rand(t)に基づいて新たなデチューン量dt3(<0)を求める。そして、遷移部変化手段416’は、ある時間t2をかけて新たなデチューン量dt3となるように制御し、以後、音程安定部から音程遷移部への移行が検出されるまでの間、このデチューン量dt3を維持する。
遷移部変化手段416’は、このようにして求めた各デチューン量dt[cent]を下記式(12)に代入することにより、出力ピッチ[cent]を求める。なお、下記式(12)に示す入力ピッチは、ビブラート効果付与手段415から供給されるピッチを指す。
出力ピッチ[cent]=入力ピッチ[cent]+dt[cent] ・・・(12)
遷移部変化手段416’は、このように疑似ランダム関数rand(t)に基づいてデチューン量dtを求め、求めたデチューン量dtを入力ピッチに加算等することで、図19に破線で示すような音程安定部毎にデチューン量dtが異なる出力ピッチを得る。
以上説明した本変形例に係る方法を入力されるバイオリン等の楽音に適用すれば、利用者等は、ストリングスセクションによる演奏の如く臨場感ある楽音を聴取することが可能となる。なお、上記例では、疑似ランダム信号に基づいてデチューン量dtを決定する場合について説明したが、デチューン量を「0」に収束させる時間(ある時間t1)や、デチューン量をある値まで増加させる時間(ある時間t2)を疑似ランダム信号に基づいて決定しても良い。また、本変形例1に係る遷移部変化手段416’と本実施形態に係る遷移部変化手段416の両者を音声処理装置100に搭載しても良く、また、何れか一方の遷移部変化手段を該装置100に搭載しても良い。
<変形例2>
また、上述した本実施形態では、斉唱効果(基本ピッチはいずれのクローン信号も同じ)を得る場合について説明したが、例えば基本ピッチが各クローン信号毎に異なっており、これらが合成されることにより音楽的なハーモニーが構成されるようなハーモナイザ効果を得る場合にも適用可能である。ハーモナイザ効果を得る場合には、例えば図1に示す各タイミング変更手段411から出力されるピッチを、所望の量(音楽的なハーモニーが構成されるようなピッチの変化量)だけ変化させれば良い。例えば、C4の音が装置内部に入力された場合、タイミング変更手段411−1からはC4→C3に変更されたピッチが出力され、タイミング変更手段411−2からはC4→A4に変更されたピッチが出力され、・・・、タイミング変更手段411−nからはC4→G4に変更されたピッチが出力される。このようにしてハーモナイザ効果を得るようにしても良い。
<変形例3>
また、上述した本実施形態では、入力される楽音として音声を例示したが、楽器音(例えばストリングス)等が入力される場合にも適用可能である。また、図1に示す各クローン信号生成部410から出力されるクローン信号について、音の定位を制御するためのパンパラメータを適宜変更し、これを合成するようにしても良いのはもちろんである。かかる態様によれば、ステレオ空間内に適切に拡がるような斉唱効果等を得ることが可能となる。また、上述した本実施形態においては、カットオフ周波数Fcを2Hz前後で揺らすようなLPFを例示したが、LPFに限らずBPF(Band Pass Filter)等を用いても良いのはもちろんである。また、カットオフ周波数Fcを2Hz前後で揺らす(すなわち、カットオフ周波数Fcを一定の周波数範囲内で変更する)態様に限らず、各々の変化項目等に応じて適宜変更可能である。
<変形例4>
また、以上説明した音声処理装置100の各部の機能は、ROM等に格納されているプログラムによって実現されるため、かかるプログラムについてCD−ROM等の記録媒体に記録して頒布したり、インターネット等の通信ネットワークを介して頒布しても良い。もちろん、音声処理装置100の各部の機能をハードウェアによって実現しても良い。
本実施形態に係る音声処理装置の構成を示す図である。 同実施形態に係る疑似ランダム信号発生部の構成を示す図である。 同実施形態に係る疑似ランダム信号の波形を例示した図である。 同実施形態に係るフレーム情報の出力タイミングが変更されたときの様子を示す図である。 同実施形態に係るタイミング変更処理を示すフローチャートである。 同実施形態に係るタイミング変更処理を説明するための図である。 同実施形態に係るピッチのトレンド変化の様子を示す図である。 同実施形態に係るしゃくり効果が付与されたときのピッチ変化の様子を示す図である。 同実施形態に係るしゃくり効果の制御方法を説明するための図である。 同実施形態に係るビブラート効果が付与されたときのピッチ変化の様子を示す図である。 同実施形態に係る遷移部前後におけるピッチ変化の様子を示す図である。 同実施形態に係る遷移部におけるピッチの制御方法を説明するための図である。 同実施形態に係るピッチのスモール変化の様子を示す図である。 同実施形態に係る入力音声信号のあるフレームのスペクトルを例示した図である。 同実施形態に係るECurveのslopeを大きくしたときのスペクトルエンベロープの変化を示す図である。 同実施形態に係るECurveのslopeを小さくしたときのスペクトルエンベロープの変化を示す図である。 同実施形態に係る第1フォルマント周波数の変化の様子を示す図である。 同実施形態に係る第1フォルマント周波数の制御方法を説明するための図である。 変形例1に係る遷移部変化機能を説明するための図である。 同変形例に係るピッチの制御方法を説明するための図である。
符号の説明
100・・・音声処理装置、200・・・音声信号入力部、300・・・音声信号分析部、400・・・クローン信号生成ユニット、410・・・クローン信号生成部、411・・・タイミング変更手段、412・・・供給制御手段、413・・・トレンド変化手段、414・・・しゃくり効果付与手段、415・・・ビブラート効果付与手段、416、416’・・・遷移部変化手段、417・・・スモール変化手段、418・・・第1スペクトル変化手段、419・・・第2スペクトル変化手段、420・・・出力切換手段、500・・・疑似ランダム信号発生ユニット、510・・・疑似ランダム信号発生部、511・・・ホワイトノイズ発生器、512・・・LPF、513・・・カットオフ周波数設定手段、514・・・正規化手段、515・・・出力手段、600・・・制御情報入力部、700・・・信号合成部、710・・・第1加算器、720・・・第2加算器、730・・・変換部、800・・・音声出力部。

Claims (20)

  1. ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音を分析することにより、該楽音のピッチ若しくは音量を含むパラメータを抽出する分析・抽出手段と、
    入力される楽音のアタック時刻を検出する検出手段と、
    前記アタック時刻が検出されてからある時間が経過するまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を前記疑似ランダム信号を用いて算出する変化量算出手段と、
    前記算出された変化量を前記抽出された楽音のピッチ若しくは音量に加算することにより、該楽音のピッチ若しくは音量を変化させるパラメータ変化手段と
    を具備することを特徴とする楽音処理装置。
  2. 前記ある時間を前記疑似ランダム信号を用いて算出する時間算出手段をさらに具備することを特徴とする請求項に記載の楽音処理装置。
  3. ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音を分析することにより、該楽音のピッチ若しくは音量を含むパラメータを抽出する分析・抽出手段と、
    前記抽出された楽音のピッチ若しくは音量の変化の仕方がある条件を満たすとき、当該部分を前記楽音のピッチ若しくは音量の遷移部として検出する遷移部検出手段と、
    前記遷移部の開始時刻及び終了時刻を検出する遷移部時刻検出手段と、
    少なくとも前記遷移部の開始時刻が検出されてから終了時刻が検出されるまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を、前記疑似ランダム信号を用いて算出する算出手段と、
    前記算出された変化量を、対応する前記楽音のピッチ若しくは音量に加算することにより、該楽音のピッチ若しくは音量を変化させるパラメータ変化手段と
    を具備することを特徴とする楽音処理装置。
  4. 前記検出手段は、一定時間毎の前記楽音のピッチ若しくは音量の平均値を求め、前回求めた平均値と今回求めた平均値との差分が閾値を越えたとき、当該部分を前記楽音のピッチ若しくは音量の遷移部として検出することを特徴とする請求項に記載の楽音処理装置。
  5. 前記算出手段は、前記遷移部の開始時刻が検出されてから終了時刻が検出されるまでの前記変化量を算出するほか、前記終了時刻が検出されてからある時間経過するまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を、前記疑似ランダム信号を用いて算出することを特徴とする請求項に記載の楽音処理装置。
  6. ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音を分析することにより、該楽音のピッチを含むパラメータを抽出する分析・抽出手段と、
    前記楽音のピッチの変化の仕方がある条件を満たす部分を音程遷移部、その他の部分を音程安定部として検出する検出手段と、
    前記音程安定部として検出された部分のピッチをあるずらし量によって変化させるパラメータ変化手段であって、前記音程遷移部から前記音程安定部への移行が検出される毎に、前記ずらし量を前記疑似ランダム信号に基づいて変化させるパラメータ変化手段と
    を具備することを特徴とする楽音処理装置。
  7. ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音であって、音声を含む楽音を前記疑似ランダム信号に基づいて変調する変調手段と、
    前記音声の有声、無声を判定する判定手段と、
    前記音声が無声であると判定された場合、音声を構成する各周波数成分の振幅値若しくは位相値をランダムに変更する変更手段と
    を具備することを特徴とする楽音処理装置。
  8. ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音のスペクトルエンベロープを抽出し、該スペクトルエンベロープを前記疑似ランダム信号に基づいて時間的に連続して変化させる変調手段と
    を具備することを特徴とする楽音処理装置。
  9. 前記カットオフ周波数を設定する手段であり、該カットオフ周波数を一定の周波数範囲内で変更するカットオフ周波数設定手段をさらに具備することを特徴とする請求項1乃至8のいずれかに記載の楽音処理装置。
  10. 前記フィルタ手段は、前記カットオフ周波数よりも高い周波数成分の信号を取り除くローパスフィルタであり、前記カットオフ周波数設定手段は、2Hz前後の一定の周波数範囲内で前記カットオフ周波数を変更することを特徴とする請求項に記載の楽音処理装置。
  11. ノイズ発生器によって発生されるノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段に対し、カットオフ周波数を設定するカットオフ周波数設定過程と、
    入力される楽音を分析することにより、該楽音のピッチ若しくは音量を含むパラメータを抽出する分析・抽出過程と、
    入力される楽音のアタック時刻を検出する検出過程と、
    前記アタック時刻が検出されてからある時間が経過するまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を前記疑似ランダム信号を用いて算出する変化量算出過程と、
    前記算出された変化量を前記抽出された楽音のピッチ若しくは音量に加算することにより、該楽音のピッチ若しくは音量を変化させるパラメータ変化過程と
    を具備することを特徴とする楽音処理方法。
  12. ノイズ信号を発生するノイズ発生過程と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ過程と、
    入力される楽音を分析することにより、該楽音のピッチ若しくは音量を含むパラメータを抽出する分析・抽出過程と、
    前記抽出された楽音のピッチ若しくは音量の変化の仕方がある条件を満たすとき、当該部分を前記楽音のピッチ若しくは音量の遷移部として検出する遷移部検出過程と、
    前記遷移部の開始時刻及び終了時刻を検出する遷移部時刻検出過程と、
    少なくとも前記遷移部の開始時刻が検出されてから終了時刻が検出されるまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を、前記疑似ランダム信号を用いて算出する算出過程と、
    前記算出された変化量を、対応する前記楽音のピッチ若しくは音量に加算することにより、該楽音のピッチ若しくは音量を変化させるパラメータ変化過程と
    を具備することを特徴とする楽音処理方法。
  13. ノイズ信号を発生するノイズ発生過程と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ過程と、
    入力される楽音を分析することにより、該楽音のピッチを含むパラメータを抽出する分析・抽出過程と、
    前記楽音のピッチの変化の仕方がある条件を満たす部分を音程遷移部、その他の部分を音程安定部として検出する検出過程と、
    前記音程安定部として検出された部分のピッチをあるずらし量によって変化させるパラメータ変化過程であって、前記音程遷移部から前記音程安定部への移行が検出される毎に、前記ずらし量を前記疑似ランダム信号に基づいて変化させるパラメータ変化過程と
    を具備することを特徴とする楽音処理方法。
  14. ノイズ信号を発生するノイズ発生過程と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ過程と、
    入力される楽音であって、音声を含む楽音を前記疑似ランダム信号に基づいて変調する変調過程と、
    前記音声の有声、無声を判定する判定過程と、
    前記音声が無声であると判定された場合、該音声を構成する各周波数成分の振幅値若しくは位相値をランダムに変更する変更過程と
    を具備することを特徴とする楽音処理方法。
  15. ノイズ信号を発生するノイズ発生過程と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ過程と、
    入力される楽音のスペクトルエンベロープを抽出し、該スペクトルエンベロープを前記疑似ランダム信号に基づいて時間的に連続して変化させる変調過程と
    を具備することを特徴とする楽音処理方法。
  16. コンピュータを、
    ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音を分析することにより、該楽音のピッチ若しくは音量を含むパラメータを抽出する分析・抽出手段と、
    入力される楽音のアタック時刻を検出する検出手段と、
    前記アタック時刻が検出されてからある時間が経過するまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を前記疑似ランダム信号を用いて算出する変化量算出手段と、
    前記算出された変化量を前記抽出された楽音のピッチ若しくは音量に加算することにより、該楽音のピッチ若しくは音量を変化させるパラメータ変化手段として機能させるための楽音処理プログラム。
  17. コンピュータを、
    ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音を分析することにより、該楽音のピッチ若しくは音量を含むパラメータを抽出する分析・抽出手段と、
    前記抽出された楽音のピッチ若しくは音量の変化の仕方がある条件を満たすとき、当該部分を前記楽音のピッチ若しくは音量の遷移部として検出する遷移部検出手段と、
    前記遷移部の開始時刻及び終了時刻を検出する遷移部時刻検出手段と、
    少なくとも前記遷移部の開始時刻が検出されてから終了時刻が検出されるまでの前記楽音のピッチ若しくは音量の単位時間当たりの変化量を、前記疑似ランダム信号を用いて算出する算出手段と、
    前記算出された変化量を、対応する前記楽音のピッチ若しくは音量に加算することにより、該楽音のピッチ若しくは音量を変化させるパラメータ変化手段として機能させるための楽音処理プログラム。
  18. コンピュータを、
    ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音を分析することにより、該楽音のピッチを含むパラメータを抽出する分析・抽出手段と、
    前記抽出された楽音のピッチの変化の仕方がある条件を満たす部分を音程遷移部、その他の部分を音程安定部として検出する検出手段と、
    前記音程安定部として検出された部分のピッチをあるずらし量によって変化させるパラメータ変化手段であって、前記音程遷移部から前記音程安定部への移行が検出される毎に、前記ずらし量を前記疑似ランダム信号に基づいて変化させるパラメータ変化手段として機能させるための楽音処理プログラム。
  19. コンピュータを、
    ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音であって、音声を含む楽音を前記疑似ランダム信号に基づいて変調する変調手段と、
    前記音声の有声、無声を判定する判定手段と、
    前記音声が無声であると判定された場合、該音声を構成する各周波数成分の振幅値若しくは位相値をランダムに変更する変更手段として機能させるための楽音処理プログラム。
  20. コンピュータを、
    ノイズ信号を発生するノイズ発生手段と、
    設定されるカットオフ周波数に従って前記ノイズ信号から特定周波数成分の信号を取り除き、疑似ランダム信号として出力するフィルタ手段と、
    入力される楽音のスペクトルエンベロープを抽出し、該スペクトルエンベロープを前記疑似ランダム信号に基づいて時間的に連続して変化させる変調手段として機能させるための楽音処理プログラム。
JP2003342254A 2003-09-30 2003-09-30 楽音処理装置、楽音処理方法及び楽音処理プログラム Expired - Fee Related JP3903975B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003342254A JP3903975B2 (ja) 2003-09-30 2003-09-30 楽音処理装置、楽音処理方法及び楽音処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003342254A JP3903975B2 (ja) 2003-09-30 2003-09-30 楽音処理装置、楽音処理方法及び楽音処理プログラム

Publications (2)

Publication Number Publication Date
JP2005107315A JP2005107315A (ja) 2005-04-21
JP3903975B2 true JP3903975B2 (ja) 2007-04-11

Family

ID=34536600

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003342254A Expired - Fee Related JP3903975B2 (ja) 2003-09-30 2003-09-30 楽音処理装置、楽音処理方法及び楽音処理プログラム

Country Status (1)

Country Link
JP (1) JP3903975B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5479823B2 (ja) * 2009-08-31 2014-04-23 ローランド株式会社 効果装置
US8088987B2 (en) 2009-10-15 2012-01-03 Yamaha Corporation Tone signal processing apparatus and method

Also Published As

Publication number Publication date
JP2005107315A (ja) 2005-04-21

Similar Documents

Publication Publication Date Title
US7945446B2 (en) Sound processing apparatus and method, and program therefor
CN109559718B (zh) 电子乐器、电子乐器的乐音产生方法以及存储介质
JP2002529773A5 (ja)
JP3711880B2 (ja) 音声分析及び合成装置、方法、プログラム
JP6728843B2 (ja) 電子楽器、楽音発生装置、楽音発生方法及びプログラム
KR20140003111A (ko) 사용자 음원 평가 장치 및 방법
US8457969B2 (en) Audio pitch changing device
JP4844623B2 (ja) 合唱合成装置、合唱合成方法およびプログラム
JP3903975B2 (ja) 楽音処理装置、楽音処理方法及び楽音処理プログラム
JP4304934B2 (ja) 合唱合成装置、合唱合成方法およびプログラム
Verfaille et al. Adaptive digital audio effects
JP6171393B2 (ja) 音響合成装置および音響合成方法
JP4349316B2 (ja) 音声分析及び合成装置、方法、プログラム
JP4433734B2 (ja) 音声分析合成装置、音声分析装置、及びプログラム
KR101053668B1 (ko) 노래의 감성 향상 방법 및 장치
TW201023172A (en) Apparatus and method for correcting a singing voice
JPH04251294A (ja) 音像定位制御装置
JP5703555B2 (ja) 楽音信号処理装置及びプログラム
JP2018054859A (ja) 楽音生成装置、楽音生成方法、電子楽器、及びプログラム
JP5342841B2 (ja) 長音符の歌唱部分で歌声の倍音特性を測定して表示するカラオケ装置
JP2009237590A (ja) 音声効果付与装置
JP3901144B2 (ja) 音声処理装置、音声処理方法及び音声処理プログラム
JP4172369B2 (ja) 楽音処理装置、楽音処理方法及び楽音処理プログラム
JP3575730B2 (ja) 歌唱音声合成装置、歌唱音声合成方法および記憶媒体
JP2010002937A (ja) 音声分析合成装置、音声分析装置、音声合成装置、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060911

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061003

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110119

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120119

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130119

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140119

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees