以下、本発明の実施の形態に係る音素材処理装置および音素材処理プログラムについて図面を用いて詳細に説明する。
(1)電子音楽装置の構成
図1は本発明の実施の形態に係る音素材処理装置を含む電子音楽装置の構成を示すブロック図である。図1の電子音楽装置1によれば、ユーザは演奏および楽曲の制作等を行うことができる。また、ユーザは、電子音楽装置1により各種音素材の処理を行い、処理された音素材を再生することができる。
電子音楽装置1は、演奏データ入力部2、入力I/F(インタフェース)3、設定操作子4、検出回路5、タッチパネルディスプレイ6、検出回路7および表示回路8を備える。演奏データ入力部2は、鍵盤等の音高指定操作子またはマイク等を含み、入力I/F3を介してバス19に接続される。ユーザの演奏操作に基づく演奏データが演奏データ入力部2により入力される。設定操作子4は、オンオフ操作されるスイッチ、回転操作されるロータリエンコーダ、またはスライド操作されるリニアエンコーダ等を含み、検出回路5を介してバス19に接続される。この設定操作子4は、音量の調整、電源のオンオフおよび各種設定を行うために用いられる。
タッチパネルディスプレイ6は、検出回路7および表示回路8を介してバス19に接続される。タッチパネルディスプレイ6には、各種情報が表示される。ユーザは、タッチパネルディスプレイ6を操作することにより各種操作を指示することができる。
電子音楽装置1は、RAM(ランダムアクセスメモリ)9、ROM(リードオンリメモリ)10、CPU(中央演算処理装置)11、タイマ12および記憶装置13をさらに備える。RAM9、ROM10、CPU11および記憶装置13はバス19に接続され、タイマ12はCPU11に接続される。外部記憶装置15等の外部機器が通信I/F(インタフェース)14を介してバス19に接続されてもよい。RAM9、ROM10、CPU11およびタイマ12がコンピュータを構成する。
RAM9は、例えば揮発性メモリからなり、CPU11の作業領域として用いられるとともに、各種データを一時的に記憶する。ROM10は、例えば不揮発性メモリからなり、システムプログラムおよび音素材処理プログラム等のコンピュータプログラムを記憶する。CPU11は、ROM10に記憶された音素材処理プログラムをRAM9上で実行することにより後述する音素材の処理を行う。タイマ12は、現在時刻等の時間情報をCPU11に与える。
記憶装置13は、ハードディスク、光学ディスク、磁気ディスクまたはメモリカード等の記憶媒体を含む。この記憶装置13には、1または複数の音素材が記憶される。ユーザにより楽曲を構成する音素材が選択される。各音素材は、音の波形を示すサンプリングデータ列からなる音響データ(オーディオデータ)である。音とは、音楽的な音に限るものではなく、音声またはその他の任意の音を含む。音素材は、任意の長さを有し、1拍もしくは複数拍に相当する長さまたは1拍に満たない1発音分の長さを有してもよく、楽曲の1小節または複数小節に相当する長さを有してもよい。また、記憶装置13には、自動演奏データおよび自動伴奏データが記憶される。上記の音素材処理プログラムが記憶装置13に記憶されてもよい。
外部記憶装置15は、記憶装置13と同様に、ハードディスク、光学ディスク、磁気ディスクまたはメモリカード等の記憶媒体を含み、楽曲データ等の各種データまたは音素材処理プログラムを記憶してもよい。
なお、本実施の形態における音素材処理プログラムは、コンピュータが読み取り可能な記録媒体に格納された形態で提供され、ROM10または記憶装置13にインストールされてもよい。また、通信I/F14が通信網に接続されている場合、通信網に接続されたサーバから配信された音素材処理プログラムがROM10または記憶装置13にインストールされてもよい。
電子音楽装置1は、音源16、効果回路17およびサウンドシステム18をさらに備える。音源16および効果回路17はバス19に接続され、サウンドシステム18は効果回路17に接続される。音源16は、演奏データ入力部2から入力される演奏データまたは記憶装置13から与えられる自動演奏データまたは自動伴奏データに基づいて楽音信号を生成する。効果回路17は、音源16により生成される楽音信号またはCPU11から与えられる音素材に音響効果を付与する。
サウンドシステム18は、デジタルアナログ(D/A)変換回路、増幅器およびスピーカを含む。このサウンドシステム18は、音源16から効果回路17を通して与えられる楽音信号またはCPU11から効果回路17を通して与えられる音素材をアナログ音信号に変換し、アナログ音信号に基づく音を発生する。それにより、楽音信号または音素材が再生される。電子音楽装置1において、主としてタッチパネルディスプレイ6、RAM9、ROM10、CPU11、タイマ12および記憶装置13が音素材処理装置100を構成する。
(2)音素材処理装置100の機能的な構成
図2は本発明の実施の形態に係る音素材処理装置100の機能的な構成を示すブロック図である。図2に示すように、音素材処理装置100は、再生指示部110、音素材入力部120、複数の遅延部130、複数の処理モジュール140および音素材出力部150を含む。また、音素材処理装置100は、処理方式決定部160、好適性情報取得部161、処理モジュール選択部170、差分遅延量算出部180、処理遅延量取得部190、パラメータ値設定部200および処理モジュール登録部210を含む。図2の音素材処理装置100の各ブロックの機能は、CPU11がROM10または記憶装置13に記憶された音素材処理プログラムを実行することにより実現される。本例では、複数の音素材が連続的に処理および再生される。
以下、複数の遅延部130の各々を区別する場合には、複数の遅延部130をそれぞれ遅延部130a〜130dと呼ぶ。また、複数の処理モジュール140の各々を区別する場合には、複数の処理モジュール140をそれぞれ処理モジュール140a〜140dと呼ぶ。
複数の処理モジュール140a〜140dは、それぞれ異なる処理方式A〜Dで音素材に予め定められた処理を行う。予め定められた処理は、同じ目的または類似の目的の処理であり、厳密に同じ処理を意味するものではない。
本実施の形態では、処理はタイムストレッチである。タイムストレッチとは、音響データを時間軸上で圧縮または伸張することを意味する。本実施の形態では、処理方式A〜Dは、それぞれ異なるタイムストレッチ方式である。複数の処理モジュール140a〜140dは、それぞれ処理方式A〜Dのパラメータ値好適性情報PPa〜PPdを保有する。パラメータ値好適性情報PPa〜PPdは、後述のパラメータPAの複数の値に対する処理方式A〜Dの好適性の程度を示す。各処理方式による音素材の処理に要する時間を処理遅延量と呼ぶ。処理遅延量は、音素材が各処理モジュール140に入力されてから出力されるまでの時間である。処理モジュール140a〜140dは、処理遅延量DLa〜DLdを保有する。本実施の形態では、処理モジュール140a〜140dを構成するプログラム中にパラメータ値好適性情報PPa〜PPdおよび処理遅延量DLa〜DLdが記述されている。
処理遅延量取得部190は、複数の処理モジュール140a〜140dからそれぞれ処理遅延量DLa〜DLdを取得する。差分遅延量算出部180は、処理遅延量DLa〜DLdの最大値以上の値を基準遅延量として算出し、処理遅延量DLa〜DLdと基準遅延量との差分を差分遅延量ΔDa〜ΔDdとして算出する。また、差分遅延量算出部180は、算出した差分遅延量ΔDa〜ΔDdをそれぞれ処理モジュール140a〜140dに対応する遅延部130a〜130dに設定する。
パラメータ値設定部200は、ユーザによる図1のタッチパネルディスプレイ6の操作に基づいて処理モジュール140a〜140dの処理に関する可変のパラメータPAの値を設定する。本実施の形態では、パラメータはストレッチ比である。ストレッチ比は、タイムストレッチ前の音素材の再生時間に対するタイムストレッチ後の音素材の再生時間の比である。パラメータPAの値に依存して処理モジュール140a〜140dの処理遅延量DLa〜DLdが変化する。
処理モジュール登録部210は、ユーザによる図1のタッチパネルディスプレイ6の操作に基づいて複数の処理モジュール140a〜140dのうち複数の音素材の処理に用いる処理モジュール140を登録する。全ての処理モジュール140が登録された場合には全ての処理モジュール140を、一部の処理モジュール140が登録された場合には登録された処理モジュール140のみを各音素材の処理に用いることが可能となる。
音素材入力部120は、ユーザによるタッチパネルディスプレイ6の操作に基づいて図1の記憶装置13に記憶される複数の音素材を入力する。複数の音素材は、一の楽曲データから連続的または不連続に選択された複数の音素材、または複数の楽曲データから不連続に選択された複数の音素材であってもよい。音素材入力部120への複数の音素材の入力順序は予め定められている。本実施の形態では、N個の音素材SI1〜SINが入力される。Nは2以上の自然数である。
好適性情報取得部161は、複数の処理モジュール140a〜140dからパラメータ値好適性情報PPa〜PPdを取得する。処理方式決定部160は、パラメータ値設定部200により設定されたパラメータPAの値および好適性情報取得部161により取得されたパラメータ値好適性情報PPa〜PPdに基づいて各音素材の処理に用いる処理方式を決定する。本実施の形態では、N個の音素材SI1〜SINの各々の処理に用いる処理方式が音素材の再生前に予め決定される。
音素材の再生時には、再生指示部110は、ユーザによる図1のタッチパネルディスプレイ6の操作に基づいて複数の音素材の再生を指示する。それにより、音素材入力部120は、複数の音素材SI1〜SINを順に入力する。この場合、入力する音素材の間に休符区間が入ってもよい。また、各音素材が再生開始予定時刻付きでまたは再生開始予定時刻が算出されて入力されてもよい。処理モジュール選択部170は、音素材の入力ごとに処理方式決定部160により決定された処理方式に対応する処理モジュール140を選択し、選択した処理モジュール140への音素材の入力を音素材入力部120に指示し、かつ選択した処理モジュール140により処理された音素材の出力を音素材出力部150に指示する。
音素材入力部120は、処理モジュール選択部170により指示された処理モジュール140に遅延部130を通して各音素材を入力する。このとき、遅延部130は、予め設定された差分遅延量の遅延を音素材に与える。選択された処理モジュール140は、入力された音素材を処理する。音素材出力部150は、処理モジュール選択部170により指示された処理モジュール140により処理された音素材を出力する。本実施の形態では、音素材出力部150は、音素材SI1〜SINにタイムストレッチを行うことにより得られた音素材SO1〜SONを順に出力する。
本例では、各遅延部130により各音素材に差分遅延量の遅延が付与されるが、複数の遅延部130を設けることなく音素材入力部120が各処理モジュール140に音素材を入力する時点を調整することにより各音素材に差分遅延量の遅延が付与されてもよい。
(3)処理方式の決定方法
タイムストレッチのための複数の処理方式としては、例えば、スライス方式、PSOLA(ピッチ同期重畳加算)方式、フェーズボコーダ方式、および波形クロスフェード方式がある。
スライス方式は、ストレッチ比が例えば1/4以下である場合に各種の音素材に対して好適である。再生速度が高い場合、音素材の種類(特徴)に拘わらず、アタック部のみを抽出して出力することにより、不自然さが目立たない。そのため、再生速度が高い場合にはスライス方式が選択肢の一つとなる。PSOLA方式は、他の方式に比べて広いストレッチ比の範囲で良好な音質を得ることができる。フェーズボコーダ方式は、ストレッチ比が例えば1/2以上2以下である場合に好適である。ただし、原音からの変化が大きいほど音質の劣化が大きい。波形クロスフェード方式は、ストレッチ比が1に近い場合(例えば、0.9以上1.1以下の範囲)にフェーズボコーダ方式よりも好適である。以上が、ストレッチ比の観点における主なタイムストレッチ方式の処理の傾向である。処理方式として、PICOLA(Pointer Interval Controlled OverLap and Add)方式等の他の方式が用いられてもよい。
図3は、パラメータ値好適性情報の例について説明するための図である。図3(a)〜図3(d)が、パラメータ値好適性情報PPa〜PPdをそれぞれ示す。図3(a)〜図3(d)において、横軸がストレッチ比を表し、縦軸が好適性を表す。図3の例では、好適性が、“0”以上“5”以下の数値(以下、好適値と呼ぶ)で表される。好適値が大きいほど、好適性が高い。ストレッチ比は百分率で表される。
例えば、ストレッチ比が50パーセントである場合、処理方式A、処理方式B、処理方式Cおよび処理方式Dの好適値は、それぞれ“3”、“2”、“0”、“2”である。それにより、図2のパラメータ値設定部200により設定されるストレッチ比が50パーセントである場合、処理方式決定部160は音素材の処理に用いる処理方式を処理方式Aに決定する。また、ストレッチ比が400パーセントである場合、処理方式A、処理方式B、処理方式Cおよび処理方式Dの好適値は、それぞれ“2”、“1”、“3”、“1”である。それにより、図2のパラメータ値設定部200により設定されるストレッチ比が400パーセントである場合、処理方式決定部160は、音素材の処理に用いる処理方式を処理方式Cに決定する。パラメータ値好適性情報の各好適値は、ユーザにより適宜変更可能であってもよい。また、処理モジュール140の数(処理方式の数)は、上記の例に限定されず、適宜変更可能である。
また、処理方式の決定の際に、処理すべき音素材の特徴が考慮されてもよい。音素材の特徴は、例えば、音素材がピッチ音であるか無ピッチ音であるか、音素材がピッチ音である場合に単一音であるか混合音であるか、または音素材に無音区間が存在するか否かである。ピッチ音は、人が音高を明確に知覚可能な音であり、無ピッチ音は、人が音高を明確に知覚することができない音である。単一音は、人が1つの音として知覚する音であり、混合音は、複数の単一音が混合された音である。
例えば、スライス方式は、無音区間が存在する音素材(例えば、パーカッション演奏等)に関して、広いストレッチ比の範囲(例えば、1/8以上8以下)で好適である。PSOLA方式は、単一音には広いストレッチ比の範囲で好適であるが、混合音には適さない。また、PSOLA方式は、持続音系に適しており、ノイズ成分にも適切に処理可能である。フェーズボコーダ方式は、打楽器音等の鋭いアタック音および無ピッチ音では音質の劣化が目立ち、適さない。波形クロスフェード方式は、単一音および混合音の両方に関して、一定の音質を得ることができ、かつ無音区間が少なく継続して音が発せられる音素材に関して、不自然な音の途切れを抑制することができる。そのため、波形クロスフェード方式は、混合音に関して、PSOLA方式よりも好適であり、無音区間が少ない音素材に関して、スライス方式よりも好適である。
図2の処理方式決定部160は、パラメータPAの値、パラメータ値好適性情報および音素材の特徴を表す情報に基づいて、各音素材の処理に用いる処理方式を決定してもよい。音素材の特徴を表す情報は、各音素材に関連付けられて記憶装置13に記憶されていてもよく、再生の直前に自動解析等により取得されてもよい。あるいは、ユーザが当該情報を入力してもよい。また、例えば数秒以上の長さを有する音素材においては、途中で特徴が変化する場合がある。そのような音素材の処理では、途中で処理方式が変更されてもよい。
(4)音素材処理装置100の動作
図4および図5は図1および図2の音素材処理装置100により行われる複数の音素材の処理を示すフローチャートである。また、図6は音素材処理装置100による複数の音素材の処理の一例を示すタイミング図である。図4および図5の複数の音素材の処理は、図1のCPU11がROM10または記憶装置13に記憶された音素材処理プログラムを実行することに行われる。以下、図2の音素材処理装置100の各部の動作と関連付けて複数の音素材の処理を説明する。
本例では、図2の処理モジュール登録部210により複数の音素材の処理に使用可能な処理モジュール140として処理モジュール140a〜140dが登録されているものとする。複数の処理モジュール140a〜140dのパラメータPAの値がパラメータ値設定部200により設定される。
まず、図2の音素材入力部120は、ユーザの操作に基づいて、図1の記憶装置13に記憶される複数の音素材から再生対象となるN個の音素材SI1〜SINを取得する(ステップS1)。次に、処理方式決定部160は、音素材入力部120により取得されたN個の音素材SI1〜SINの処理に用いる処理方式をそれぞれ決定する(ステップS2)。本例では、音素材SI1〜SI4の処理にそれぞれ処理方式A〜Dが用いられるものとする。
その後、処理遅延量取得部190は、決定された各処理方式に対応する処理モジュール140a〜140dから処理遅延量DLa〜DLdを取得する(ステップS3)。本例では、処理遅延量DLa〜DLdは、DLa<DLb<DLc<DLdの関係を有する。
差分遅延量算出部180は、処理遅延量取得部190により取得された処理遅延量DLa〜DLdに基づいて基準遅延量DRを決定する(ステップS4)。本例では、基準遅延量DRは処理遅延量DLa〜DLdのうち最大の処理遅延量DLdに決定される。また、差分遅延量算出部180は、基準遅延量DRと各処理モジュール140a〜140dの処理遅延量DLa〜DLdとの差を差分遅延量ΔDa〜ΔDdとして算出する(ステップS5)。さらに、差分遅延量算出部180は、各処理モジュール140a〜140dに対応する遅延部130a〜130dにそれぞれ差分遅延量ΔDa〜ΔDdを設定する(ステップS6)。
次に、処理方式決定部160は、音素材入力部120による各音素材SO1〜SONの出力開始時刻を決定する(ステップS7)。出力開始時刻は、各音素材の再生が開始される時刻に相当する。各音素材の出力開始時刻と次の音素材の出力開始時刻との間の時間差は、処理後の各音素材の再生時間により決定される。本例では、入力される音素材が休符区間を含まないが、入力される音素材が休符区間を含む場合には、再生時間に休符区間が加算される。図6には、処理後の音素材SO1〜SO5の出力開始時刻r1〜r5が示される。
また、処理方式決定部160は、音素材入力部120による各音素材SI1〜SINの入力開始時刻を決定する(ステップS8)。この場合、各入力開始時刻は、対応する出力開始時刻よりも基準遅延量DRだけ前の時点に決定される。図6には、音素材SI1〜SI5の入力開始時刻t1〜t5が示される。
ユーザの操作に基づいて、再生指示部110が複数の音素材の再生の開始を指示する(ステップS9)。また、再生指示部110は図1のタイマ12を起動する(ステップS10)。処理モジュール選択部170は、変数iを1に設定する(ステップS11)。次に、処理モジュール選択部170は、i番目(1番目)の音素材の処理に用いる処理モジュール140を現在の処理モジュール140とする(ステップS12)。本例では、処理モジュール140aが現在の処理モジュール140となる。
その後、処理モジュール選択部170は、図1のタイマ12の出力に基づいて、i番目(1番目)の入力開始時刻t1が到来したか否かを判定する(ステップS13)。i番目(1番目)の入力開始時刻t1が到来した場合には、処理モジュール選択部170は、現在の処理モジュール140aへ遅延部130aを通してi番目(1番目)の音素材SI1の入力を開始するように音素材入力部120を制御する(ステップS14)。この場合、図6に示すように、遅延部130aにより音素材SI1に差分遅延量ΔDaが付与される。それにより、音素材SI1は、入力開始時刻t1から差分遅延量ΔDaの経過後に処理モジュール140aに入力される。処理モジュール140aは、入力された音素材SI1の処理を開始し、処理遅延量DLaの経過後に処理された音素材SO1の出力が可能となる。
その後、処理モジュール選択部170は、図1のタイマ12の出力に基づいて、i番目(1番目)の出力開始時刻r1が到来したか否かを判定する(ステップS15)。i番目(1番目)の出力開始時刻r1が到来した場合には、処理モジュール選択部170は、現在の処理モジュール140aにより処理された音素材SO1を出力するように音素材出力部150を制御する(ステップS16)。図6の例では、音素材出力部150は、出力開始時刻r1において、処理モジュール140aにより処理された1番目の音素材SO1をフェードインさせながら出力する。
次に、処理モジュール選択部170は、ユーザの操作に基づいて、再生指示部110により再生の終了が指示されたか否かを判定する(ステップS17)。再生の終了が指示されていない場合、処理モジュール選択部170は、変数iに1を加算する(ステップS18)。次に、処理モジュール選択部170は、i番目(2番目)の音素材SI2の処理に用いる処理モジュール140を次の処理モジュール140とする(ステップS19)。本例では、処理モジュール140bが次の処理モジュール140となる。
その後、処理モジュール選択部170は、図1のタイマ12の出力に基づいて、i番目(2番目)の入力開始時刻t2が到来したか否かを判定する(ステップS20)。i番目(2番目)の入力開始時刻t2が到来した場合には、処理モジュール選択部170は、次の処理モジュール140bへ遅延部130bを通してi番目(2番目)の音素材SI2の入力を開始するように音素材入力部120を制御する(ステップS21)。この場合、図6に示すように、遅延部130bにより音素材SI2に差分遅延量ΔDbが付与される。それにより、音素材SI2は、入力開始時刻t2から差分遅延量ΔDbの経過後に処理モジュール140bに入力される。処理モジュール140bは、入力された音素材SI2の処理を開始し、処理遅延量DLbの経過後に処理された音素材SO2の出力が可能となる。
その後、処理モジュール選択部170は、図1のタイマ12の出力に基づいて、i番目(2番目)の出力開始時刻r2が到来したか否かを判定する(ステップS22)。i番目(2番目)の出力開始時刻r2が到来した場合には、処理モジュール選択部170は、現在の処理モジュール140aにより処理された音素材SO1の出力を停止するように音素材出力部150を制御する(ステップS23)。図6の例では、音素材出力部150は音素材SO1をフェードアウトさせる。
次に、処理モジュール選択部170は、次の処理モジュール140bを現在の処理モジュール140とする(ステップS24)。処理モジュール選択部170は、現在の処理モジュール140bにより処理された音素材SO2を出力するように音素材出力部150を制御する(ステップS25)。図6の例では、出力開始時刻r2において、音素材出力部150が処理モジュール140bにより処理された音素材SO2をフェードインさせる。
その後、処理モジュール選択部170は、ステップS17に戻り、ステップS17〜S25を繰り返す。これにより、図6の例では、入力開始時刻t3で3番目の音素材SI3が遅延部130cを通して処理モジュール140cに入力され、差分遅延量ΔDcの経過後に音素材SI3の処理が開始される。さらに、処理遅延量DLcの経過後の出力開始時刻r3で、2番目の音素材SO2がフェードアウトされ、処理モジュール140cにより処理された3番目の音素材SO3がフェードインされる。同様に、入力開始時刻t4で4番目の音素材SI4が遅延部130dを通して処理モジュール140dに入力され、差分遅延量ΔDdの経過後に音素材SI4の処理が開始される。さらに、処理遅延量DLdの経過後の出力開始時刻r4で、3番目の音素材SO3がフェードアウトされ、処理モジュール140dにより処理された4番目の音素材SO4がフェードインされる。
ステップS17で、再生の終了が指示された場合、処理モジュール選択部170はタイマ12を停止させる(ステップS26)、また、処理モジュール選択部170は、現在の処理モジュール140への音素材の入力を停止するように音素材入力部120を制御し(ステップS27)、現在の処理モジュール140により処理された音素材の出力を停止するように音素材出力部150を制御する(ステップS28)。
本例では、処理方式の切り替わり時に先行する音素材がフェードアウトしかつ後続する音素材がフェードインすることによりクロスフェードが行われるので、聴感上自然な再生音が得られる。
上記の複数の音素材の処理において、パラメータ値設定部200によりパラメータPAの値が変更された場合には、各処理方式の処理遅延量が変化する。そのため、各音素材の出力開始時刻および入力開始時刻も変更される必要がある。本実施の形態では、パラメータがストレッチ比であるため、ストレッチ比の値が変更されると、各処理モジュール140の処理遅延量および処理後の音素材の再生時間も変更される。この場合、ステップS3に戻り、処理遅延量取得部190により変更後のパラメータPAの値に応じた処理遅延量が取得され、ステップS4〜S8において各音素材の出力開始時刻および入力開始時刻が再度決定される。その後、ステップS9〜S28が実行される。
(5)実施の形態の効果
本実施の形態に係る音素材処理装置100によれば、設定されたパラメータPAの値および各処理方式のパラメータ値好適性情報に基づいて、設定されたパラメータPAの値に適した処理方式が決定される。それにより、各処理方式についての知識および経験が乏しいユーザであっても、各音素材を適切な処理方式で処理することができる。また、複数の異なるパラメータの値で複数の音素材に連続的に処理が行われる場合でも、処理方式の切り替えのためのユーザの煩雑な操作を必要とせず、各音素材を適切な処理方式で処理することができる。
また、本実施の形態では、処理モジュール140a〜140dへの音素材の入力から音素材の出力までの時間が基準遅延量DRと等しくなるように音素材に遅延が与えられる。それにより、処理方式A〜Dの切り替え時に音ずれが生じない。この場合、ユーザは、各処理方式の処理遅延量および楽音の信号処理を考慮する必要がない。その結果、各処理方式および楽音の信号処理についての知識および経験が乏しいユーザであっても、各音素材を適切な処理方式で処理するとともに処理後の複数の音素材の連続性を容易に確保することが可能となる。
(6)他の処理の例
上記実施の形態では、処理としてタイムストレッチが行われるが、他の処理が行われてもよい。他の処理の例として、ディストーションエフェクトがある。ディストーションエフェクトでは、音素材が増幅され、増幅後の音素材が一定のクリップレベルでクリップされることにより、音素材が意図的に歪まされる。以下、音素材の振幅を信号レベルと呼ぶ。ディストーションエフェクトのパラメータとして、歪み度が設定される。歪み度は、クリップレベルに対する増幅後の信号レベルの比率である。処理前における信号レベルがSLであり、増幅の比率(増幅度)がkであり、歪み度がdであり、かつクリップレベルがCLである場合、k=d・CL/SLとなる。
ディストーションエフェクトの処理方式として、例えば、処理方式E、処理方式Fおよび処理方式Gがある。図7は、ディストーションエフェクトの処理方式について説明するための模式図である。図7(a)には、処理前の音素材が示される。図7(b)〜図7(d)には、処理方式E〜Gによる処理後の音素材が示される。図7(a)〜図7(d)において、横軸は時間を示し、縦軸は変位を示す。図7の例では、処理前の信号レベルがSLであり、増幅後の信号レベルがk・SLである。
図7(b)の処理方式Eでは、増幅後の音素材にハードクリップ処理が施される。具体的には、増幅後の音素材において、CLよりも大きい変位がCLに変換され、−CLよりも小さい変位が−CLに変換される。増幅後の音素材において、−CL以上CL以下の変位はそのまま維持される。図7(c)の処理方式Fでは、増幅後の音素材にソフトクリップ処理が施される。処理方式Fが処理方式Eと異なる点は、変位がCLまたは−CLに変換される部分と、その前後の部分とが、緩やかな曲線を描くように連続することである。図7(d)の処理方式Gでは、オーバーサンプリング後にクリップ処理が施される。具体的には、増幅後の音素材が元のサンプリング周波数よりも高い周波数でオーバーサンプリングされ、得られた信号に上記のソフトクリップ処理またはハードクリップ処理が施される。クリップ処理後の信号からローパスフィルタにより高周波数成分が除去される。高周波数成分の除去後の信号が元のサンプリング周波数にダウンサンプリングされる。このような処理により、折り返しノイズの発生を抑制しつつ音素材をクリップさせることができる。
処理方式E〜Gのうち、処理方式Eの処理負荷が最も小さく、処理方式Gの処理負荷が最も大きい。また、歪み度が大きいほど、折り返しノイズが生じやすい。そのため、歪み度が比較的小さい(例えば、1.0以上1.2未満)場合、処理負荷の小さい処理方式Eが好適である。一方、歪み度が比較的大きい(例えば、2.0以上)場合、折り返しノイズの発生が抑制される処理方式Gが好適である。また、歪み度がこれらの中間(例えば、1.2以上2.0未満)である場合、処理方式Gより処理負荷が小さく、かつ比較的良好なエフェクトが得られる処理方式Fが好適である。このように、上記実施の形態と同様に、設定されたパラメータ(歪み度)の値、およびパラメータの値に対する各処理方式の好適性を表すパラメータ値好適性情報に基づいて、設定されたパラメータの値に適した処理方式を決定することができる。したがって、各音素材を適切な処理方式で処理することができる。
(7)他の実施の形態
上記実施の形態では、記憶装置13に複数の音素材が記憶されるが、複数の音素材が通信I/F14により通信網を経由して取得されてもよい。また、演奏データ入力部2または外部から入力される音響データから複数の音素材が取得されてもよい。さらに、処理の種類によっては、各音素材の処理方式が決定されつつ各音素材が処理および再生されてよく、またはマイク等の入力装置により入力される音響データから複数の音素材が取得されつつ各音素材についての処理方式の決定、決定された処理方式での処理および再生が順次行われてもよい。
上記実施の形態では、複数の音素材に差分遅延量の遅延が付与されつつ複数の音素材の処理および再生が順次行われるが、本発明はこれに限らない。例えば、複数の音素材の処理が予め行われ、処理後の音素材が順次再生されてもよい。また、複数ではなく1つの音素材の処理および再生のみが行われてもよい。また、上記実施の形態では、1つの音素材に関して1つのパラメータの値が設定されるが、1つの音素材に関して複数のパラメータの値が設定されてもよい。その場合、設定された複数のパラメータの値に基づいて処理方式が決定されてもよい。
上記実施の形態では、音素材処理装置100が電子音楽装置1に設けられているが、音素材処理装置100がパーソナルコンピュータ、スマートデバイス(smart device)、ゲーム機器等の電子機器に適用されてもよい。上記実施の形態に係る音素材処理装置100は、CPU11等のハードウエアおよび音素材処理プログラム等のソフトウエアにより実現されるが、図2の音素材処理装置100の各構成要素が電子回路等のハードウエアにより実現されてもよい。
(8)請求項の各構成要素と実施の形態の各部との対応
以下、請求項の各構成要素と実施の形態の各部との対応の例について説明するが、本発明は下記の例に限定されない。請求項の各構成要素として、請求項に記載されている構成または機能を有する他の種々の要素を用いることができる。
上記実施の形態では、音素材入力部120が音素材取得手段の例であり、パラメータ値設定部200がパラメータ値取得手段の例であり、好適性情報取得部161が好適性情報取得手段の例であり、パラメータ値好適性情報PPa〜PPdが好適性情報の例であり、処理方式決定部160が処理方式決定手段の例であり、処理モジュール140が処理手段の例である。