JP6114492B2 - データ処理装置およびプログラム - Google Patents

データ処理装置およびプログラム Download PDF

Info

Publication number
JP6114492B2
JP6114492B2 JP2011242607A JP2011242607A JP6114492B2 JP 6114492 B2 JP6114492 B2 JP 6114492B2 JP 2011242607 A JP2011242607 A JP 2011242607A JP 2011242607 A JP2011242607 A JP 2011242607A JP 6114492 B2 JP6114492 B2 JP 6114492B2
Authority
JP
Japan
Prior art keywords
data
sound
waveform signal
unit
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011242607A
Other languages
English (en)
Other versions
JP2013007988A (ja
Inventor
旬 臼井
旬 臼井
泰史 神谷
泰史 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2011242607A priority Critical patent/JP6114492B2/ja
Publication of JP2013007988A publication Critical patent/JP2013007988A/ja
Application granted granted Critical
Publication of JP6114492B2 publication Critical patent/JP6114492B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Description

本発明は、楽音波形信号から音素材を抽出する技術に関する。
断片的な音素材をデータベースに記憶し、この音素材を組み合わせて楽音を発生させる技術がある。楽音を発生させるときに用いる音素材は、データベースに登録された多数の音素材から選択することになる。特許文献1には、このデータベースに登録する音素材を、楽曲の楽音波形信号から予め決められたアルゴリズムにしたがって抽出することが開示されている。
特開2010−191337号公報
特許文献1に開示された技術によれば、楽曲の楽音波形信号から音素材を抽出し、その音素材の特徴に応じて分類することができるため、音素材のデータベースへの登録が容易になる。音素材のデータベースへの登録が用意になったことにより、より多くの様々な特徴をもつ音素材をデータベースに登録しようと考えることがある。この場合には、同じような音素材ばかりが登録されないように、様々な楽曲の楽音波形信号を用意する必要があった。
本発明は、上述の事情に鑑みてなされたものであり、一の楽音波形信号に基づいて様々な特徴をもつ音素材を抽出することを目的とする。
上述の課題を解決するため、本発明は、発音内容を示す発音データを取得するとともに、当該発音内容を変化させるための加工データを複数取得して、当該発音データに対して当該複数の加工データに基づく複数の加工をする加工手段と、前記複数の加工をされた発音データの発音内容を示す楽音波形信号を解析して、予め決められた特徴を有する楽音波形信号の期間を特定する特定手段と、前記特定された期間の楽音波形信号を解析して特徴量を算出する算出手段と、前記特定された期間の楽音波形信号を示す特定データと前記算出された特徴量を示す特徴量データとを出力するデータ出力手段とを具備し、前記複数の加工データは、発音内容を規定する発音データを含み、前記加工手段は、前記取得した発音データに係る楽音波形信号に対して、前記複数の加工データに含まれる発音データに係る楽音波形信号を合成することにより前記加工をすることを特徴とするデータ処理装置を提供する。
また、別の好ましい態様において、前記複数の加工データは、前記楽音波形信号に付与する音響効果の内容を規定する設定データを含み、前記加工手段は、前記設定データに基づいて、前記取得した発音データに係る前記楽音波形信号に音響効果を付与するように前記加工をすることを特徴とする。
また、別の好ましい態様において、前記特定データは、前記複数の加工をされた発音データに係る楽音波形信号と当該楽音波形信号の前記特定された期間を示す時刻情報とにより、前記特定された期間の楽音波形信号を示し、前記特定手段が複数の期間を特定した場合には、前記特定データは、前記複数の加工をされた発音データに係る楽音波形信号と当該楽音波形信号の前記特定された複数の期間を示す時刻情報とにより、前記特定された複数の期間の楽音波形信号を示し、前記算出手段は、前記特定された期間毎に前記特徴量を算出することを特徴とする。
また、別の好ましい態様において、前記特定データは、前記特定された期間の楽音波形信号を抽出した楽音波形信号を示すことを特徴とする。
また、別の好ましい態様において、前記加工手段は、前記複数の加工データのうち一の加工データをユーザの指示に従って取得することを特徴とする。
また、本発明は、コンピュータを、発音内容を示す発音データを取得するとともに、当該発音内容を変化させるための加工データを複数取得して、当該発音データに対して当該複数の加工データに基づく複数の加工をする加工手段と、前記複数の加工をされた発音データの発音内容を示す楽音波形信号を解析して、予め決められた特徴を有する楽音波形信号の期間を特定する特定手段と、前記特定された期間の楽音波形信号を解析して特徴量を算出する算出手段と、前記特定された期間の楽音波形信号を示す特定データと前記算出された特徴量を示す特徴量データとを出力するデータ出力手段として機能させるためのプログラムであって、前記複数の加工データは、発音内容を規定する発音データを含み、前記加工手段は、前記取得した発音データに係る楽音波形信号に対して、前記複数の加工データに含まれる発音データに係る楽音波形信号を合成することにより前記加工をするプログラムを提供する。
本発明によれば、一の楽音波形信号に基づいて様々な特徴をもつ音素材を抽出することができる。
本発明の実施形態における楽音処理装置の構成を説明するブロック図である。 本発明の実施形態における音素材DBの例を説明する図である。 本発明の実施形態における特定データにより表される音素材の内容を説明する図である。 本発明の実施形態における音素材トラックの例を説明する図である。 本発明の実施形態における再生機能の構成を説明するブロック図である。 本発明の実施形態における音素材抽出機能および修正機能の構成を説明するブロック図である。 本発明の実施形態における再生プログラム実行中の表示の一例を説明する図である。 本発明の実施形態における抽出プログラム実行中の表示の一例(分岐位置指定表示)を説明する図である。 本発明の実施形態における抽出プログラム実行中の表示の一例(抽出完了表示)を説明する図である。 本発明の実施形態における修正プログラム実行中の表示の一例を説明する図である。 本発明の変形例5における音素材タイミングデータの例を説明する図である。 本発明の変形例6における音素材トラックの例を説明する図である。 本発明の変形例6における音素材トラックの別の例を説明する図である。 本発明の変形例7における発音制御システムの構成を説明するブロック図である。 本発明の変形例7におけるサーバ装置の構成を説明する図である。 本発明の変形例7における音素材トラックの例を説明する図である。 本発明の変形例7における楽音処理装置およびサーバ装置の機能を説明する機能ブロック図である。 本発明の変形例7における音素材トラック作成プログラム実行時の表示画面の表示例を説明する図である。 本発明の変形例7における音素材トラック作成プログラム実行時の発音制御システムの動作を説明する図である。 本発明の変形例8における音素材トラック作成プログラム実行時の表示画面の表示例を説明する図である。 本発明の変形例17における音素材トラック作成プログラム実行時の表示画面の表示例を説明する図である。 本発明の変形例18における音素材トラック作成プログラムム実行時の表示画面の表示例を説明する図である。
<実施形態>
[概要]
本発明の実施形態における楽音処理装置は、パーソナルコンピュータ、携帯電話、PDA(Personal Digital Assistant)、タブレット端末などの情報処理装置であり、OS(Operating System)上で特定のアプリケーションプログラムを実行することにより、DAW(Digital Audio Workstation)と呼ばれる機能が実現される装置である。この楽音処理装置において実現されるDAWにおいては、楽音波形信号の一部として抽出される音素材を用いて楽音を発生させるための制御を行う機能も実現される。また、楽音波形信号から音素材を抽出する機能など、以下に説明する各機能も実現される。DAWを実現するアプリケーションプログラムの実行中においてサブルーチンのプログラムが実行されることにより、これらの各機能が実現される。
[楽音処理装置10の構成]
図1は、本発明の実施形態における楽音処理装置10の構成を説明するブロック図である。楽音処理装置10は、制御部11、操作部12、表示部13、インターフェイス14、記憶部15、および音響処理部16を有する。これらの各構成はバスを介して接続されている。また、楽音処理装置10は、音響処理部16に接続されたスピーカ161およびマイクロフォン162を有する。
制御部11は、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを有する。制御部11は、ROMまたは記憶部15に記憶された各種プログラムを実行することにより、各種機能を実現する。この例においては、制御部11によるプログラムの実行には、DAWを実現するアプリケーションプログラムの実行、上述のサブルーチンのプログラムの実行が含まれる。サブルーチンのプログラムとしては、記憶部15に記憶された再生プログラム、抽出プログラム、および修正プログラムが含まれる。
再生プログラムは、DAWにおいて楽音の発音内容を規定するシーケンスデータを再生し、楽音を発音させる処理を行う再生機能を実現するためのプログラムである。抽出プログラムは、再生機能により合成される楽音波形信号から音素材を抽出する音素材抽出機能を実現するためのプログラムである。修正プログラムは、抽出された音素材のデータに修正を加える修正機能を実現するためのプログラムである。これらの機能の詳細については、後述する各機能の構成の説明において述べる。
操作部12はユーザによる操作を受け付ける操作ボタン、キーボード、マウス、タッチパネルなどの操作手段を有し、それぞれに受け付けられた操作の内容を示す操作データを制御部11に出力する。これにより、ユーザからの指示が楽音処理装置10に入力される。
表示部13は、液晶ディスプレイなどの表示デバイスであり、制御部11の制御に応じた内容の表示を表示画面131に行う。表示画面131に表示される内容は、メニュー画面、設定画面などの他、実行されたプログラムによって様々な内容となる(図7、図8、図9、図10参照)。
インターフェイス14は、外部装置と接続して有線または無線により通信し、各種データの送受信をする機能を有する。また、インターフェイス14には、外部装置からオーディオデータが入力されるAUX(Auxiliary)端子も設けられている。インターフェイス14は、外部装置から入力された各種データを制御部11に出力する一方、制御部11からの制御により、外部装置へ各種データを出力する。なお、AUX端子にアナログ信号が入力される場合には、A/D変換(アナログデジタル変換)が施される。
マイクロフォン162は、入力された音の内容を示す楽音波形信号を音響処理部16に出力する。
音響処理部16は、DSP(Digital Signal Processor)などの信号処理回路などを有する。この例においては、音響処理部16は、マイクロフォン162から入力される楽音波形信号をA/D変換し、オーディオデータとして制御部11に出力する。また、音響処理部16は、制御部11から出力されたオーディオデータを、制御部11によって設定された音響処理、D/A変換(デジタルアナログ変換)処理、増幅処理などの信号処理などを施して、楽音波形信号としてスピーカ161に出力する。
スピーカ161は、音響処理部16から入力された楽音波形信号が示す音を出力する。
記憶部15は、ハードディスク、フラッシュメモリなどの不揮発性メモリであって、上記の各種プログラムを記憶する記憶領域を有する。また、記憶部15は、各種プログラムが実行されているときに用いられるシーケンスデータ、音素材データベース(以下、音素材DBと記す)、波形データベース(以下、波形DBと記す)をそれぞれ記憶する記憶領域を有する。
波形DBは、楽音波形信号を示す波形データW1、W2、・・・が登録されている。これらの波形データが示す楽音波形信号は、楽曲、特定の楽器音、音素材など様々な内容のいずれかであり、その長さについても1秒未満から数分以上まで様々である。また、ループして用いられるものも存在してもよい。ループして用いられる波形データであっても、その一部の区間を用いてループしない波形データとして用いてもよい。なお、この例における波形データについては、複数チャンネル(例えばLch、Rch)のデータが含まれている。以下の説明においては、楽音波形信号を示す波形データ、オーディオデータなどの各データは、Lch、Rchの2chにより構成されているものとするが、より多くのチャンネル数で構成されていてもよいし、モノラル(1ch)で構成されていてもよい。
図2は、本発明の実施形態における音素材DBの例を説明する図である。音素材DBは、音素材の内容を特定する情報が登録されている。図2に示すように、音素材の内容を特定する情報は、音素材の楽音波形信号の内容を特定する特定データ、音素材の楽音波形信号の特徴を示す特徴量データ、この楽音波形信号の特徴により分類されるカテゴリを含む。
特定データは、波形DBに登録された波形データのいずれかを指定する波形指定情報と、その波形データにおけるデータ範囲を時刻で指定する時刻指定情報との組み合わせにより構成されている。この例においては、時刻指定情報によって指定される時刻は、波形データのデータ先頭からの時刻として決められている。ここで、波形指定情報が示す波形データがループして用いられるものである場合には、データ範囲における開始位置の時刻が、終了位置の時刻より後の時刻として示されていてもよい。この場合には、音素材の内容は、開始位置からデータ最後までの区間の楽音波形信号に続いて、データ先頭から終了位置までの区間の楽音波形信号を接続したものとなる。特定データによって特定される音素材については、それぞれを特定するための識別子(この例においては、sn1、sn2、・・・)が付されている。以下、特定の音素材を示す場合には、音素材sn1というように記す。
なお、特定データのうち時刻指定情報が規定されていないものについては、波形指定情報が示す波形データそのものが音素材の楽音の内容を表している。例えば、音素材sn4が示す楽音ついては、波形データW5が示す楽音波形信号全体で表される。
図3は、本発明の実施形態における特定データにより表される音素材の内容を説明する図である。図3(a)は、音素材sn1、sn2、sn3が示す楽音の楽音波形信号を説明する図であり、図3(b)は、音素材sn4が示す楽音の楽音波形信号を説明する図である。図2に示すように、音素材sn1の内容は、波形指定情報が波形データW1であり、時刻指定情報がts1〜te1として特定されている。したがって、音素材sn1に対応する楽音波形信号は、図3(a)に示すように、波形データW1が示す楽音波形信号のうち、時刻ts1〜te1の楽音波形信号となる。同様に、音素材sn2、sn3にそれぞれ対応する楽音波形信号についても、波形データW1が示す楽音波形信号の一部の範囲として特定される。一方、図3(b)に示すように、音素材sn4が示す楽音波形信号については、時刻指定情報が規定されていないため、波形データW5が示す楽音波形信号全体として特定される。以下、音素材sn1、sn2、・・・が示す楽音波形信号を表すデータを、音素材データsn1、sn2、・・・として記す。
図2に戻って説明を続ける。特徴量データは、各音素材の楽音波形信号がもつ複数種類の特徴量p1、p2、・・・を示す。例えば、音素材について、周波数別(高域、中域、低域)のそれぞれの強度、振幅のピークとなる時刻(音素材データの先頭を基準とした時刻)、振幅のピーク強度、協和度、複雑さなどについての特徴量であり、音素材データを解析して得られた値である。例えば、特徴量p1は、その値により音素材の高域の強度を示す。以下、特徴量データは、その特徴量p1、p2、・・・のそれぞれの値の組み合わせによってPa、Pb、・・・というように示す。例えば、音素材sn3については、特徴量データは各特徴量の組み合わせから決められたPcとして示す。
音素材の特徴、すなわち特徴量データの内容により分類されるカテゴリは、聴感上の特徴が似た音素材毎に分類されたものであり、例えば、アタックが明瞭でエッジ感が強い音として分類されるカテゴリ「分類A(例えば、エッジ音)」、ノイズのように聞こえる音として分類されるカテゴリ「分類B(例えば、テクスチャ音)」などである。
この特徴量、カテゴリについては、例えば、ユーザが、後述する音素材トラックにおいて用いられる音素材を決めるときに、所望の音素材を音素材DBから検索するときに用いられる。例えば、ユーザが特徴量データを入力することにより、制御部11が特徴量データに類似する音素材を検索し、ユーザに提示したり、ユーザがカテゴリを選択することにより、制御部11は、そのカテゴリに分類された音素材をユーザに提示したりすればよい。また、ユーザが特定の音素材を指定した場合に、制御部11が、その音素材に特徴量データが類似する音素材を検索し、ユーザに提示するようにしてもよい。
シーケンスデータは、時系列に発音内容を規定する複数のトラックを有している。各トラックは、この例においては、オーディオトラック、MIDI(Musical Instrument Digital Interface)トラック、音素材トラックのうち、いずれかの種類のトラックが割り当てられている。この各トラックは、本発明の発音データの一態様である。
MIDIトラックは、ノートオン、ノートオフ、ノートナンバ、ベロシティなどのMIDIイベントと、これらのイベントの処理タイミング(例えば、トラックのデータ開始からの小節数、拍数、ティック数などにより表される)との関係を規定するトラックである。このように、MIDIトラックは、この例においては、一般的に用いられるMIDI形式で規定されているものとするが、イベントに応じた発音内容の楽音波形信号を生成する音源などを制御するための情報が規定されたトラックであれば、他の形式によって規定されていてもよい。
オーディオトラックは、オーディオデータとそのデータの再生開始タイミングが規定されたトラックである。オーディオデータとしては、波形DBに記憶された波形データであってもよいし、別途入力された楽音波形信号を示すデータであってもよい。また、再生開始タイミングは、上記の処理タイミングと同様に、トラックのデータ開始からの小節数、拍数、ティック数により表される。なお、オーディオデータの再生音量を示す情報など他の情報が含まれていてもよい。
図4は、本発明の実施形態における音素材トラックの例を説明する図である。図4に示すように、音素材トラックは、音素材データとそのデータの再生開始タイミングが規定されたトラックである。音素材データは、音素材DBにおいて各音素材の識別子により特定される。また、再生開始タイミングは、上記の処理タイミングと同様に、トラックのデータ開始からの小節数、拍数、ティック数により表される。この例においては、音素材データを再生するときの音量、時間(この例においてはティック数で表される)についても規定されているが、音量、時間については規定されていなくてもよい。
規定される時間は、音素材データのデータ先頭からの時間(規定される時間より短い音素材データについてはループ再生してもよい)として決められたものであってもよいし、タイムストレッチ処理によりこの時間に伸縮するように決められたものであってもよい。時間が規定されていない場合には、音素材データをデータ開始から最後まで再生するようにすればよい。
図4の例に示す場合には、例えば、再生開始タイミング「0002:01:000」(第2小節第1拍に対応)においては、対応する音素材データSn3を再生するように決められている。
図1に戻って説明を続ける。シーケンスデータは、上記トラックの他、各トラックの再生速度を指定するテンポ(1拍の時間を示す値)、各トラックに対して施す音響処理の内容、各トラックから得られる楽音波形信号の合成態様、楽音波形信号を合成した後の音響処理などの各信号処理の内容を規定する設定データを有している。楽音波形信号の合成態様としては、各トラックに基づく楽音波形信号が合成(ミキシング)されて音響処理部16に出力されるまでの、各楽音波形信号の信号経路の態様、楽音波形信号を合成するときの信号レベルの割合(トラック間、チャンネル間(Lch,Rch))などである。
このシーケンスデータにおける各トラックの内容、設定データの内容は、ユーザによって作成されてもよいし、インターフェイス14を介して取得するようにしてもよい。
以上が、楽音処理装置10のハードウエア構成についての説明である。
[再生機能構成]
次に、楽音処理装置10の制御部11が再生プログラムを実行することによって実現される再生機能について説明する。なお、以下に説明する再生機能を実現する各構成の一部または全部については、ハードウエアによって実現してもよい。
図5は、本発明の実施形態における再生機能の構成を説明するブロック図である。制御部11が再生プログラムを実行すると、データ読出部110−1、110−2、・・・(以下、それぞれを区別しない場合には、データ読出部110という)、音源部120、音素材データ合成部130、音響効果付与部140−1、140−2、・・・(以下、それぞれを区別しない場合には、音響効果付与部140という)、オーディオデータ合成部150、合成音響効果付与部160、チャンネル変換部170、およびバス部180を有する再生機能部100が構成され、再生機能が実現される。
データ読出部110−1は、設定データにより規定されたテンポ、およびオーディオトラックに規定されたタイミングにより決まる再生開始タイミングからオーディオデータを読み出して、音響効果付与部140−1に出力する。オーディオデータの各部(例えばサンプル単位)を読み出す速度についてもテンポに応じて変化させてもよい。この場合には、タイムストレッチ処理によりオーディオデータの示す楽音波形信号のピッチが変わらないようにする。音響効果付与部140−1は、入力されたオーディオデータが示す楽音波形信号に、設定データにより規定された内容の音響効果を付与するように信号処理を施して、信号処理が施されたオーディオデータをオーディオデータ合成部150に出力する。
オーディオトラックからオーディオデータ合成部150に至る信号ラインには、データ読出部110−1によって読み出されて出力されたオーディオデータを取り出すための信号ラインである分岐S1、音響効果付与部140−1によって音響効果が付与された楽音波形信号を示すオーディオデータを取り出すための分岐S5が設けられている。
なお、オーディオトラックは、1つのトラックにつき、データ読出部110−1および音響効果付与部140−1の組を有している。したがって、オーディオトラックが複数存在する場合には、データ読出部110−1および音響効果付与部140−1の組がオーディオトラックの数だけ設けられる。分岐S1、S5についてもトラック毎に設けられる。
データ読出部110−2は、設定データにより規定されたテンポ、およびMIDIトラックに規定されたタイミングにより決まる処理タイミングでイベントを読み出して音源部120に出力する。音源部120は、入力されるMIDIイベントに応じた発音内容の楽音波形信号を示すオーディオデータを生成するソフトウエア音源である。音源部120は、データ読出部110−2から入力されたMIDIイベントに応じて生成したオーディオデータを音響効果付与部140−2に出力する。なお、音源部120は、外部装置として設けられていてもよく、この場合には、データ読出部110−2は、インターフェイス14を介して外部装置にMIDIイベントを出力し、音響効果付与部140−2は、外部装置において生成されたオーディオデータを、インターフェイス14を介して取得してもよい。
音響効果付与部140−2は、入力されたオーディオデータが示す楽音波形信号に、設定データにより規定された内容の音響効果を付与するように信号処理を施して、信号処理が施されたオーディオデータをオーディオデータ合成部150に出力する。
MIDIトラックからオーディオデータ合成部150に至る信号ラインには、音源部120から出力されたオーディオデータを取り出すための信号ラインである分岐S2、音響効果付与部140−2によって音響効果が付与された楽音波形信号を示すオーディオデータを取り出すための分岐S6が設けられている。
なお、MIDIトラックは、1つのトラックにつき、データ読出部110−2、音源部120および音響効果付与部140−2の組を有している。したがって、MIDIトラックが複数存在する場合には、データ読出部110−2、音源部120および音響効果付与部140−2の組がMIDIトラックの数だけ設けられる。分岐S2、S6についてもトラック毎に設けられる。なお、音源部120は、トラック毎に入力を受け付けて、トラック毎にオーディオデータを出力する構成であれば、複数存在しなくてもよい。
データ読出部110−3は、設定データにより規定されたテンポ、および音素材トラックに規定されたタイミングにより決まる再生開始タイミングで、対応する音素材データを読み出して音素材データ合成部130に出力する。音素材データ合成部130は、データ読出部110−3から入力される音素材データが示す楽音波形信号を、入力されたタイミングに応じて時系列に合成して、オーディオデータとして音響効果付与部140−3に出力する。
ここで、2つの音素材データが順に入力されるとき、先の音素材データの再生途中において後の音素材データが入力される場合には、先の音素材データが示す楽音波形信号の最後の部分と、後の音素材データが示す楽音波形信号の最初の部分が、同期間に重複する場合がある。このような期間においては、それぞれの楽音波形信号を合成した内容を示すオーディオデータが音素材データ合成部130から出力されることになる。
音響効果付与部140−3は、入力されたオーディオデータが示す楽音波形信号に、設定データにより規定された内容の音響効果を付与するように信号処理を施して、信号処理が施されたオーディオデータをオーディオデータ合成部150に出力する。
音素材トラックからオーディオデータ合成部150に至る信号ラインには、音素材データ合成部130から出力されたオーディオデータを取り出すための信号ラインである分岐S3、音響効果付与部140−3によって音響効果が付与された楽音波形信号を示すオーディオデータを取り出すための分岐S7が設けられている。
なお、音素材トラックは、1つのトラックにつき、データ読出部110−3、音素材データ合成部130および音響効果付与部140−3の組を有している。したがって、音素材トラックが複数存在する場合には、データ読出部110−3、音素材データ合成部130および音響効果付与部140−3の組が音素材トラックの数だけ設けられる。分岐S3、S6についてもトラック毎に設けられる。
インターフェイス14のAUX端子に入力されたオーディオデータは、音響効果付与部140−4に出力される。このオーディオデータは、時系列にAUX端子から入力されるものであるため、上記のデータ読出部に相当する構成については存在しない。音響効果付与部140−4は、入力されたオーディオデータが示す楽音波形信号に、設定データにより規定された内容の音響効果を付与するように信号処理を施して、信号処理が施されたオーディオデータをオーディオデータ合成部150に出力する。
AUX端子からオーディオデータ合成部150に至る信号ラインには、AUX端子に入力されたオーディオデータを取り出すための信号ラインである分岐S4、音響効果付与部140−4によって音響効果が付与された楽音波形信号を示すオーディオデータを取り出すための分岐S8が設けられている。
なお、インターフェイス14に複数のAUX端子がある場合には、音響効果付与部140−4が、各AUX端子に対応して設けられる。分岐S4についてもトラック毎に設けられる。
バス部180は、音響効果付与部140−1、140−2、140−3、140−4に入力されるオーディオデータ(B1、B2、B3、B4において分岐)を取り出して、合成して音響効果付与部140−5に出力する。合成するときの各オーディオデータの信号レベルについては、設定データに基づいて決められる。音響効果付与部140−5は、入力されたオーディオデータが示す楽音波形信号に、設定データにより規定された内容の音響効果を付与するように信号処理を施して、信号処理が施されたオーディオデータをオーディオデータ合成部150に出力する。
バス部180からオーディオデータ合成部150に至る信号ラインには、バス部180から出力されたオーディオデータを取り出すための信号ラインである分岐S14、音響効果付与部140−5によって音響効果が付与された楽音波形信号を示すオーディオデータを取り出すための分岐S15が設けられている。
ここで、音響効果付与部140に入力されるオーディオデータが、本発明の発音データの一態様である。また、音響効果付与部140が、本発明の加工手段の一態様であり、付与する音響効果の内容を規定する設定データが、加工データの一態様である。すなわち、音響効果付与部140は、設定データに基づいてオーディオデータを加工する構成である。
オーディオデータ合成部150は、入力された各オーディオデータを、設定データの内容に基づいて合成して出力する。具体的には、オーディオデータ合成部150は、各オーディオデータが示す楽音波形信号について、トラック間(AUX端子、バス部180からの出力も含む)の信号レベルの比、同一トラックのチャンネル間(Lch、Rch)の信号レベルの比を調整して、チャンネル毎に合成する。そして、オーディオデータ合成部150は、合成した楽音波形信号を示すオーディオデータを、合成音響効果付与部160に出力する。なお、図5においては、分岐S1〜S8、S14、S15については、LchおよびRchをまとめた信号ラインとして記載していたが、以下に説明する分岐S9〜S12については、信号ラインをLchとRchとに分けて図示している。
ここで、オーディオデータ合成部150は、本発明の加工手段の一態様であり、合成前のいずれかのオーディオデータが発音データの一態様であり、他のオーディオデータが加工データの一態様である。すなわち、オーディオデータ合成部150は、いずれかのオーディオデータを他のオーディオデータに基づいて加工する構成である。また、合成態様(加工態様)については、上述したように設定データに基づいて決められている。なお、バス部180についてもオーディオデータ合成部150と同様に、本発明の加工手段の一態様となりうる。
合成音響効果付与部160は、入力されたオーディオデータに対して、設定データにより規定された内容の音響効果を付与するように信号処理を施して、チャンネル変換部170に出力する。チャンネル変換部170は、設定データにより規定されたチャンネル数に変換して音響処理部16に出力する。この例においては、Lch、Rchの楽音波形信号を合成してモノラル化したオーディオデータが出力される場合を図5に示しているが、合成せずにそのまま出力されるようにしてもよいし、よりチャンネル数を増やす処理が施されて出力されるようにしてもよい。このようにチャンネル変換部170は、設定データに基づいて、マトリクス処理などを用いてチャンネル数を増減させる機能を有するものであればよい。
ここで、合成音響効果付与部160およびチャンネル変換部170が、各々本発明の加工手段の一態様であり、付与する音響効果の内容、チャンネル数を規定する設定データが、加工データの一態様である。
オーディオデータ合成部150から音響処理部16に至る信号ラインには、オーディオデータ合成部150から出力されるオーディオデータのLchを取り出すための信号ラインである分岐S9、Rchを取り出すための信号ラインS10が設けられ、合成音響効果付与部160によって音響効果が付与されたオーディオデータのLchを取り出すための信号ラインである分岐S11、Rchを取り出すための信号ラインS12が設けられ、チャンネル変換部170によってモノラル化したオーディオデータを取り出すための信号ラインである分岐S13が設けられている。
以上が、再生機能についての説明である。
[音素材抽出機能および修正機能]
次に、楽音処理装置10の制御部11が抽出プログラムを実行することによって実現される音素材抽出機能について説明する。また、制御部11が修正プログラムを実行することによって実現される修正機能についても併せて説明する。なお、以下に説明する音素材抽出機能および修正機能を実現する各構成の一部または全部については、ハードウエアによって実現してもよい。
図6は、本発明の実施形態における音素材抽出機能および修正機能の構成を説明するブロック図である。制御部11が抽出プログラムを実行すると、選択部210、抽出部220およびデータ出力部230を有する音素材抽出機能部200が構成され、音素材抽出機能が実現される。また、制御部11が修正プログラムを実行すると、修正部300が構成され、修正機能が実現される。
選択部210は、分岐S1、S2、・・・S15のいずれかを選択し、選択した分岐の信号ラインにおけるオーディオデータを取得して抽出部220に出力する。いずれを選択するかについては、ユーザによっていずれかが選択されてもよいし、予め決められていてもよい。また、いずれか1つの分岐を選択するのではなく、複数の分岐を選択してもよい。その場合には、選択部210は、チャンネル毎に楽音波形信号を合成して出力すればよい。また、分岐S9、S10の組み合わせ、または分岐S11、S12の組み合わせについては、Lch、Rchの関係であるから、一体として選択されるようにしてもよい。一方、分岐S9のみの選択など、一方のチャンネルについてのみのオーディオデータが選択された場合には、選択部210は、出力するオーディオデータについて、他方のチャンネルについては無音としてもよいし、双方のチャンネルともに同じ楽音波形信号としてもよいし、モノラル化してもよい。なお、分岐S1、S2、・・・、S8、S14、S15については、LchおよびRchをまとめた信号ラインとして説明したが、選択部210は、これらの分岐から取得したオーディオデータを抽出部220に出力するときには、いずれか一方のチャンネルのみのオーディオデータとしてもよいし、モノラル化したオーディオデータとしてもよい。どのような態様でオーディオデータを出力するかについては、設定データに基づいて決められればよい。
抽出部220は、音素材特定部221および特徴量算出部222を有し、音素材特定部221および特徴量算出部222の処理により、入力されたオーディオデータから音素材を抽出して、その音素材の特徴量を算出する。そして、抽出部220は、オーディオデータが示す楽音波形信号のうち、抽出した音素材に対応する区間を示す情報と、算出した特徴量を示す特徴量データとをデータ出力部230に出力する。このとき、抽出に用いたオーディオデータ(抽出部200に入力されたオーディオデータ)についても出力する。
以下、音素材特定部221および特徴量算出部222の機能について説明する。
特徴量算出部222は、抽出部220に入力されたオーディオデータが示す楽音波形信号(以下、抽出元楽音波形信号という)のうち、音素材特定部221に指示された区間における特徴量を算出して、算出結果を音素材特定部221に出力する。
音素材特定部221は、抽出元楽音波形信号から、音量変化が一定以上の変化をするオンセットを検出し、オンセットから予め決められた時間の範囲のうち、様々な区間を特徴量算出部222に指示し特徴量を算出させる。音素材特定部221は、算出された各区間の特徴量のうち、予め決められた特定の条件を満たす特徴量の区間を、オーディオデータから抽出した音素材に対応する抽出元楽音波形信号における区間として特定する。音素材特定部221は、入力されたオーディオデータ全体から、音素材の抽出を行って、音素材に対応する抽出元楽音波形信号における区間を特定していく。なお、このようにオーディオデータから音素材を抽出する方法については公知の方法のいずれも用いること可能であるが、例えば、特開2010−191337号公報に開示された方法を用いればよい。
そして、音素材特定部221は、抽出した音素材毎に、それぞれ特定した区間(以下、特定区間という)を示す情報と、この区間に対応して算出された特徴量を示す特徴量データとを出力し、入力されたオーディオデータについても出力する。
データ出力部230は、抽出部220から入力されたオーディオデータを記憶部15に出力し、波形データとして波形DBに登録する。また、データ出力部230は、登録した波形データを識別する波形指定情報と、特定区間をデータ範囲とした時刻指定情報とを示す特定データ、および特徴量データを記憶部15に出力し、抽出した音素材毎に音素材DBに登録する。このとき、データ出力部230は、登録した特徴量データに応じて分類されるカテゴリについても決定する。
また、データ出力部230は、波形DBに登録する場合には、抽出部220から入力されたオーディオデータのうち、特定区間の楽音波形信号を切り出したオーディオデータを、波形データとして波形DBに登録する場合もある。この場合には、データ出力部230が音素材DBに登録する特定データには時刻指定情報が含まれない。すなわち、特定データは、波形データ全体を音素材として特定することで、音素材の楽音波形信号を示していることになる。
データ出力部230による上記2種類の波形DBの登録方法のいずれを適用するかについては、ユーザが予め設定すればよい。この例においては、前者の登録方法(特定区間の楽音波形信号を切り出さない場合)は「mode1」、後者の登録方法(特定区間の楽音波形信号を切り出す場合)は「mode2」として設定される。なお、この登録方法については、データ出力部230が予め決められたアルゴリズムにしたがって設定してもよい。例えば、抽出部220において抽出された音素材の数が予め決められた数以上である場合には、「mode1」として設定され、当該数未満であれば、「mode2」として設定されればよい。
修正部300は、データ出力部230による波形DBおよび音素材DBへの登録前における音素材のデータ範囲(時刻指定情報)について、ユーザの指示に応じて修正する機能を有する。これにより抽出部220により抽出された音素材を、ユーザの要求に沿った音素材になるように調整することができる。このとき、特徴量データの内容を変更しなくてもよいし、特徴量データの内容を修正後の音素材から特徴量算出部222によって再算出させて更新してもよい。
なお、修正部300は、既に登録されている音素材のデータ範囲を修正するようにしてもよい。
以上が、音素材抽出機能および修正機能についての説明である。上記各機能構成により、楽音処理装置10において、本発明のデータ処理装置が実現される。
[各機能の動作例]
続いて、上述した再生プログラム、抽出プログラムおよび修正プログラムが実行されたときの動作例について、表示画面131の表示例を参照しながら説明する。
まず、ユーザは、DAW上においてシーケンスデータの再生を行う場合に、再生プログラムの実行の指示を、楽音処理装置10に対して入力し、再生させるシーケンスデータの指示についても入力する。このようにすると、表示画面131には、図7に示す内容の表示がなされる。
図7は、本発明の実施形態における再生プログラム実行中の表示の一例を説明する図である。表示画面131には、大きく分けてシーケンスデータの内容を示すデータ領域TA、およびユーザの指示を、ポインタptを用いて楽音処理装置10に入力するための操作画像領域BAが表示される。
データ領域TAには、シーケンスデータの各トラックの内容を模式的に示した画像が表示され、縦軸方向にトラック、横軸方向に時刻が規定される。データ領域TAに表示される内容はシーケンスデータの一部分であって、ユーザは、縦軸用スクロールバーVBAにおける縦軸タブvsbを操作して縦軸方向の表示範囲を変更し、横軸用スクロールバーHBAにおける横軸タブhsbなどを操作して横軸方向の表示範囲を変更する。この例のシーケンスデータにおいて、トラックはtr1、tr2、・・・tr6と6トラックで構成されているものとする。ここでは、tr1、tr2がオーディオトラック(図における「audio」)、tr3、tr4がMIDIトラック(図における「midi」)、tr5、tr6が音素材トラック(図における「ms」)であるものとする。このトラック数、トラックの種類は、ユーザにより自由に設定可能である。
また、横軸方向のデータ範囲を指定するための範囲指定矢印(開始指定矢印asおよび終了指定矢印ae)が表示され、これらの矢印を移動させることにより、横軸における開始時刻tssおよび終了時刻tseを設定する。
また、表示画面131には、再生のテンポを設定するためのテンポ制御ボタンb1、再生開始、停止、早送り、巻き戻しを指定する再生制御ボタンb2、範囲指定矢印において指定されたデータ範囲のシーケンスデータから音素材に変換する処理を開始するための変換ボタンb3、および、抽出プログラム実行時の設定を行うための設定ボタンb4が表示される。
ユーザが再生制御ボタンb2を操作して、再生の開始を指示すると、再生機能部100におけるデータ読出部110において、設定されたテンポに基づいて、各データの読み出しが開始される。これにより、再生機能部100から音響処理部16に対してオーディオデータが出力され、シーケンスデータに基づく発音内容でスピーカ161から出力される。
ユーザが設定ボタンb4を操作すると、抽出プログラムが実行され、表示画面131には、図8に示す表示がなされる。この表示は、変換において、音素材を抽出するオーディオデータを設定するための内容になっている。
図8は、本発明の実施形態における抽出プログラム実行中の表示の一例(分岐位置指定表示)を説明する図である。図8に示すように、表示画面131においては、再生機能部100における各構成および信号ラインに対応した表示がなされる。トラック表示tmは、音響効果付与部140にオーディオデータを出力する構成に対応する部分をトラック毎に示している。バス表示bmは、バス部180に対応した部分を示している。音響効果付与表示etmは、音響効果付与部140に対応した部分をトラック毎に示している。合成部表示mmは、オーディオデータ合成部150に対応した部分を示している。合成音響効果付与表示emmは、合成音響効果付与部160に対応した部分を示している。mono表示cmは、チャンネル変換部170に対応した部分を示している。
また、各構成の表示に対応する間の線は信号ラインに対応し、線に設けられた丸印である分岐表示bt1、bt2、・・・bt5は、分岐S1、S2、・・・S15に対応する。なお、この例において、オーディオトラックがtr1、tr2の2つのトラックから構成されているため、分岐S1、S5は、それぞれのトラックに対応して設けられている。MIDIトラック、音素材トラックについても同様である。ユーザの操作により分岐表示の部分を選択すると、表示が白丸から黒丸に変更され、その部分の信号ラインにおけるオーディオデータが音素材の抽出対象として設定される。図5に示す例においては、分岐S13に対応する部分の信号ラインにおけるオーディオデータが、音素材の抽出対象として設定された場合を示している。なお、ユーザは複数の分岐表示を選択してもよい。
また、表示画面131には、データ出力部230におけるデータベースの登録態様を設定するためのモード選択ボタンbmについても表示される。ユーザは「mode1」または「mode2」の一方を選択することにより、データ出力部230における登録態様が設定される。この例においては、「mode1」が設定されている状態を示している。
ユーザが決定ボタンb5を操作すると、これらの設定を終了し、表示画面131の表示は、図7に示す表示に戻る。
続いて、ユーザは、範囲指定矢印を操作して、抽出対象となるオーディオデータの期間を設定する。全範囲とする場合には範囲の設定は不要である。
上記設定が終了し、ユーザが変換ボタンb3を操作すると、ユーザにより設定された内容にしたがって、音素材抽出機能部200における処理が開始される。この例においては、音素材抽出機能部200において、再生機能部100に対して、範囲指定矢印により指定された期間のオーディオデータのうち、分岐S13の信号ラインにおけるオーディオデータを生成させ、選択部210で受け取る。そして、抽出部220において音素材を抽出する。抽出が終了すると、表示画面131には、図9に示すように、抽出完了表示がなされる。
なお、選択部210においてオーディオデータを受け取るときには、再生機能部100において、そのオーディオデータを生成すればよいから、必ずしも音響処理部16に対してオーディオデータの出力はされなくてもよい。また、AUX端子からオーディオデータの入力がある場合(入力の有無はユーザによって予め設定されればよい)には、再生機能部100において、範囲指定矢印により指定された期間のオーディオデータを音響処理部16に出力し、その期間にAUX端子から入力されたオーディオデータがオーディオデータ合成部150において合成されるようにすればよい。
図9は、本発明の実施形態における抽出プログラム実行中の表示の一例(抽出完了表示)を説明する図である。図9に示すように、表示画面131には、選択部210で受け取ったオーディオデータが示す抽出元楽音波形信号wv、抽出した音素材の期間(特定区間)を示す表示(この図における音素材sna、snb、snc、snd)、各音素材に対応した特徴量データから分類されるカテゴリを示す表示(この図におけるアイコンica、icb、icc、icd)が表示される。また、特定区間を修正するための修正ボタンb6、抽出した音素材をデータベースに登録するための登録ボタンb7についても、表示画面131に表示される。
ユーザは、音素材に対応する部分(例えばアイコンica、icb、icc、icd)を、ポインタptを用いて操作すると、対応する音素材の楽音波形信号が示す音が、制御部11の制御によってスピーカ161から出力されるようになっている。
ユーザがスピーカ161から出力された音を試聴して、音素材の特定区間について修正する必要がない場合など、ユーザによって登録ボタンb7が操作されると、データ出力部230は、選択部210が受け取ったオーディオデータを波形DBに登録する一方、抽出した音素材毎に特定データおよび特徴量データを音素材DBに登録する。
一方、ユーザが音素材の特定区間について修正したいと考えた場合など、ユーザによって修正ボタンb6が操作された場合には、修正プログラムが実行され、表示画面131には、図10に示す表示がなされる。
図10は、本発明の実施形態における修正プログラム実行中の表示の一例を説明する図である。図10に示すように、表示画面131には、最後に試聴した音素材の部分が拡大表示される。この例においては、最後に試聴した音素材は、音素材snbであったものとする。また、音素材に対応する楽音波形信号の期間(特定区間)を調整するための範囲指定矢印(開始指定矢印asおよび終了指定矢印ae)が表示される。
その他、範囲指定矢印によって指定された期間の楽音波形信号が示す音を試聴するための試聴ボタンb8、範囲指定矢印によって指定された期間の楽音波形信号を音素材に対応する楽音波形信号として確定させる確定ボタンb9が表示画面131に表示される。
ユーザは、範囲指定矢印を操作して楽音波形信号の期間を調整し、試聴ボタンb8を操作して試聴する行為を繰り返すことにより、所望の音素材になるように楽音波形信号の期間を指定する。図10においては、開始時刻tsb、終了時刻tebとして規定される期間の楽音波形信号に対応する音素材snb1が指定されたものとする。そして、ユーザは、確定ボタンb9を操作すると、抽出された音素材snbが、ユーザによって指定された音素材snb1に修正される。
そして、上述したとおり、ユーザによって登録ボタンb7が操作されると、選択部210が受け取ったオーディオデータを波形DBに登録する一方、抽出した音素材毎に特定データおよび特徴量データを音素材DBに登録する。このとき、修正された音素材については、修正後の音素材に対応する特定データが音素材DBに登録される。特徴量データについては、修正前に算出された特徴量を示すものであってもよいし、修正後の音素材が示す楽音波形信号について特徴量算出部222が再計算した特徴量を示すものであってもよい。いずれにするかは、ユーザの指示に応じて決定されればよい。
このようにして音素材に対応する楽音波形信号の開始時刻をずらすことにより、音の立ち上がり感を調整したり、終了時刻をずらすことにより残響感を調整したりすることができる。
以上が、再生プログラム、抽出プログラム、修正プログラムが実行されたときの動作例の説明である。
このように、本発明の実施形態における楽音処理装置10は、一のトラックに基づいて出力されるオーディオデータが示す楽音波形信号から音素材を抽出するだけでなく、このオーディオデータを加工して得られる楽音波形信号から音素材を抽出する。そのため、加工態様を変えることで抽出元楽音波形信号を変化させることにより、様々な音素材を抽出することができる。ここでいうオーディオデータの加工とは、上述したとおり、様々な態様で実現される。この楽音処理装置10においては、オーディオデータが示す楽音波形信号に対して音響効果を付与する信号処理を施す態様、オーディオデータに対して他のオーディオデータを合成する態様、およびオーディオデータのチャンネル数を変換する態様で、オーディオデータを加工して得られる楽音波形信号から、音素材を抽出することができる。
<変形例>
以上、本発明の実施形態について説明したが、本発明は以下のように、様々な態様で実施可能である。
[変形例1]
上述した実施形態において、加工態様として一のトラックのオーディオデータに対して他のオーディオデータを合成する態様については、双方のオーディオデータともに、音響効果付与部140によって音響効果が付与された楽音波形信号を示すオーディオデータであったが、音響効果が付与されていない楽音波形信号を示すオーディオデータであってもよい。
すなわち、音素材が抽出される対象として選択可能なオーディオデータには、一のトラックから得られるオーディオデータに対して、上述した加工態様のうち、少なくともいずれかの態様によって加工したものが含まれていればよい。この場合には、楽音処理装置10は、ユーザの指示によって、いずれかの加工態様が選択できるように構成されていてもよい。選択された内容は設定データなどにより規定されるようにすればよい。
[変形例2]
上述した実施形態においては、本発明のデータ処理装置は、再生機能、音素材抽出機能、および修正機能の各機能構成により実現されていたが、修正機能の構成については有していなくてもよい。
[変形例3]
上述した実施形態において、本発明のデータ処理装置は、DAWを実現する楽音処理装置10に適用されたものであるが、デジタルミキサ、アナログミキサなどにおいて適用されてもよい。この場合には、音素材抽出機能を有するデータ処理装置は、ミキサによりオーディオデータの加工をすることになる。そして、データ処理装置は、ミキサの各信号ラインにおけるオーディオデータを取得し、このオーディオデータから音素材を抽出し、データベースに登録するようにすればよい。この場合には、オーディオデータの加工を行う再生機能としてはミキサの機能により代替されるため、データ処理装置は、再生機能を実現しない構成であってもよい。このように、データ処理装置は、オーディオデータを加工する機能を実現する構成と、音素材抽出機能を実現する構成とを有していれば、どのような装置にも適用可能である。
[変形例4]
上述した実施形態においては、データ出力部230は、特定データなどを出力してデータベースに登録していたが、必ずしもデータベースに登録される態様でなくてもよい。例えば、データ出力部230から出力される特定データなどは、インターフェイス14から外部装置に出力されるようにしてもよい。
[変形例5]
上述した実施形態において、データ出力部230は、音素材DBへの音素材の登録に伴い、登録した音素材とその発音タイミングとを規定する音素材トラックに相当するデータ(音素材タイミングデータ)を出力して記憶部15に記憶するようにしてもよい。すなわち、1つの波形データの抽出元楽音波形信号から抽出された音素材の識別子と、音素材に対応する特定区間の開始時刻を示す情報とを対応付けたデータを記憶部15に記憶すればよい。
図11は、本発明の変形例5における音素材タイミングデータの例を説明する図である。音素材タイミングデータは、音素材トラックにおける再生開始タイミングおよび音素材No.の部分に対応するのデータである。再生開始タイミングは、小節数、拍数、ティック数などの相対的な時刻として表される一方、特定区間の始まりの時刻は、楽音波形信号の先頭から経過時間に対応する絶対的な時刻である。そのため、データ出力部230は、予め決められたテンポ(例えば、テンポ=120(1拍0.5秒))を基準とすることによって、絶対的な時刻から相対的な時刻に変換して、音素材タイミングデータとして記憶する。なお、再生開始タイミングは、絶対的な時刻で表されていてもよく、この場合には上記のような変換は不要である。
このようにして記憶された音素材タイミングデータは、再生機能によって上記テンポで再生されると、抽出元楽音波形信号のうち、抽出された音素材部分が発音され、それ以外の部分がミュートされたような発音内容としてスピーカ161から出力されることになる。
なお、データ出力部230は、音素材タイミングデータの形式ではなく、音素材トラックの形式で出力して記憶部15に記憶するようにしてもよい。この場合には、音量、時間については、予め決められた値が決定されてもよいし、音素材の内容に応じて決定されてもよい。例えば、音量については、音素材に対応する楽音波形信号の信号レベルに応じて決定されればよい。時間については、音素材に対応する楽音波形信号の長さに応じて決定されればよい。
また、データ出力部230は、音素材DBに登録される形式において、各音素材に対して再生開始タイミングが対応付けられたデータとして出力して記憶部15に記憶するようにしてもよい。
[変形例6]
上述した実施形態において、音素材トラックは、発音させる音素材を、その識別子によって規定するものであったが、特徴量データによって規定するものであってもよい。
図12は、本発明の変形例6における音素材トラックの例を説明する図である。図12に示すように、この例における音素材トラックは、図4に示す実施形態の場合の音素材の識別子を示す部分が、特徴量データを示す部分となっている。この場合、再生機能におけるデータ読出部110−3は、音素材トラックから特徴量データを読み出して、この特徴量データに類似する特徴量データを音素材DBから検索して特定する。そして、データ読出部110−3は、特定した特徴量データに対応する音素材データを、音素材トラックにより規定された再生開始タイミングで、音素材データ合成部130に出力すればよい。
なお、複数種類の音素材DBが記憶部15に記憶されている場合には、データ読出し部110−3が音素材データを特定するための検索対象とする音素材DBについても、時系列に音素材トラックに規定されるようにしてもよい。この構成については、後述する変形例7以降において詳細を説明する。
また、音素材トラックは、さらに別の態様によっても規定され得る。例えば、音素材の識別子により楽音波形信号を規定する代わりに、シーケンスデータにおける各トラック(この例においてはオーディオトラック、MIDIトラック)と、そのトラックに基づいて生成されるオーディオデータのデータ範囲との組み合わせにより楽音波形信号を規定するようにしてもよい。
図13は、本発明の変形例6における音素材トラックの別の例を説明する図である。図13に示すように、この例における音素材トラックは、図4に示す実施形態の場合の音素材の識別子を示す部分が、トラックを指定する部分(指定トラック)とデータ範囲を指定する部分となっている。指定トラックは、トラックの番号を示している。図13に示す例においては、tr1、tr2が示されているが、実施形態の動作例を用いて説明すれば、これらのトラックはともにオーディオトラックを示している。なお、tr3、tr4であればMIDIトラックとなる。
また、データ範囲は、音素材DBにおけるデータ範囲と同様に、時刻指定情報により規定される。この場合の時刻指定情報は、指定トラックに基づいて生成されるオーディオデータのデータ先頭からの時刻として決められている。なお、データ範囲は、予め決められたテンポ(例えば、テンポ=120(1拍0.5秒))で再生された場合を基準として規定されていてもよいし、設定データにより規定されたテンポで再生された場合を基準として規定されていてもよい。
この音素材トラックにおいて指定トラックがオーディオトラックである場合、データ読出部110−3は、指定トラックに基づいてデータ読出部110−1から出力されるオーディオデータ(分岐B1から出力されるオーディオデータ)のうちデータ範囲が示すオーディオデータに相当する部分を、音素材データとして出力する。このように音素材データとして出力される部分については、データ読出部110−3は、実際のシーケンスデータの再生に先立って、データ読出部110−1から取得しておけばよい。例えば、シーケンスデータの再生前に、予めデータ読出部110−1を動作させて、データ範囲におけるオーディオデータを出力させればよい。
指定トラックがMIDIトラックである場合には、データ読出部110−3は、指定トラックに基づいて音源部120から出力されるオーディオデータ(分岐B2から出力されるオーディオデータ)のうちデータ範囲が示すオーディオデータに相当する部分を、音素材データとして出力する。このように音素材データとして出力される部分については、データ読出部110−3は、実際のシーケンスデータの再生に先立って、音源部120から取得しておけばよい。例えば、シーケンスデータの再生前に、予めデータ読出部110−2および音源部120を動作させて、データ範囲におけるオーディオデータを出力させればよい。
[変形例7]
上述した変形例6の説明にて述べた、複数種類の音素材DBが記憶部15に記憶されている場合には、データ読出し部110−3が音素材データを特定するための検索対象とする音素材DBについても、時系列に音素材トラックに規定されるようにしてもよいとした例について、詳細に説明する。ここでは、これらの処理が楽音処理装置10においてのみ行われる場合ではなく、複数の装置間のやり取りを含んで行われる場合について説明する。
図14は、本発明の変形例7における発音制御システム1の構成を説明するブロック図である。発音制御システム1は、インターネットなどの通信回線1000を介して接続される楽音処理装置10Aおよびサーバ装置50を有する。
楽音処理装置10Aは、上述した実施形態に示した楽音処理装置10と概ね同じ構成を有している。楽音処理装置10Aのインターフェイス14は、さらに、通信回線1000を介してサーバ装置50と各種情報のやり取りを行う通信部としても機能する。また、楽音処理装置10Aの記憶部15には音素材DBおよび波形DBは記憶されていなくてもよく、この例では、これらのDBはサーバ装置50において記憶されている。また、楽音処理装置10Aの記憶部15には、制御部11において実行される音素材トラック作成プログラムを記憶している。音素材トラック作成プログラムは、本変形例における音素材トラックを作成するためのプログラムである。
図15は、本発明の変形例7におけるサーバ装置50の構成を説明する図である。サーバ装置50は、制御部51、通信部54および記憶部55を有する。これらの各構成は、バスを介して接続されている。
制御部51は、CPU、RAM、ROMなどを有する。制御部51は、ROMまたは記憶部55に記憶された各種プログラムを実行することにより、各種機能を実現する。この例においては、制御部51は、楽音処理装置10Aからの指示により、検索プログラムを実行する。検索プログラムが実行されると、楽音処理装置10Aからの指示に応じて、記憶部55の音素材DBを検索して、特定した音素材データを楽音処理装置10Aに送信する機能を実現する。この機能の詳細については別途説明する。
通信部54は、制御部51の制御に応じて、通信回線1000と接続して、楽音処理装置10Aなどの通信装置と情報のやりとりを行う。制御部51は、通信部54を介して取得した情報を用いて、記憶部55に記憶された情報を更新するようにしてもよい。また、通信部54は、通信回線1000を介した通信に限らず、有線または無線により外部装置と接続可能に構成されたインターフェイスを有していてもよい。
記憶部55は、ハードディスク、不揮発性メモリなどであり、音素材DB、波形DBをそれぞれ記憶する記憶領域の他、上述した検索プログラムなどの各種プログラムを記憶する記憶領域を有する。波形DBは上述したように楽音処理装置10の記憶部15に記憶されていた波形DBと同様であるから説明を省略する。
音素材DBは、複数の音素材DB(音素材DBa、DBb,・・・)から構成されている。以下、それぞれを特に区別せずに説明する場合には、音素材DBという。音素材DBのそれぞれは、登録された音素材データは異なるものの、データベースの構成としては、上述した楽音処理装置10の記憶部15に記憶されていた音素材DBと同様であるから説明を省略する。なお、音素材DBについては、予め記憶部55に記憶されているが、通信部54を介して外部装置から取得することにより、新たな種類の音素材DBがさらに記憶されるようにしてもよい。
図16は、本発明の変形例7における音素材トラックの例を説明する図である。この例における音素材トラックは、特徴量指定データ(図16(a))およびDB指定データ(図16(b))により構成される。特徴量指定データは、発音タイミングを示す再生時刻、そのタイミングに発音させたい音素材データに相当する特徴量データ、発音の音量および時間が対応付けられている。図16(a)の例によれば、再生時刻「0002:01:000」(第2小節第1拍に対応)においては、特徴量データPiに基づく音を、音量「20」、発音時間「120」で発音させることが示されている。なお、後述するように、発音される特徴量データPiに基づく音は、特徴量データPiの音素材データが示す音素材とは限らず、類似する音のいずれかとなる。
DB指定データは、特徴量指定データによって示される特徴量データを用いて、サーバ装置50において音素材データを特定するときの検索対象となる音素材DBの種類を再生時刻の範囲として設定されたデータである。図16(b)の例によれば、再生時刻「0001:01:000」から「0001:03:959」までは、検索対象となるデータベースは音素材DBaであることを示している。
次に、楽音処理装置10Aの制御部11が音素材トラック作成プログラムを実行し、それに伴いサーバ装置50の制御部51が検索プログラムを実行することによって実現される機能について説明する。なお、以下に説明する機能を実現する各構成の一部または全部については、ハードウエアによって実現してもよい。
図17は、本発明の変形例7における楽音処理装置10Aおよびサーバ装置50の機能を説明する機能ブロック図である。制御部11が音素材トラック作成プログラムを実行すると、表示制御部310、設定部320、発音制御部330およびデータ出力部340を構成する。この例においては楽音処理装置10Aは、表示制御部310、設定部320および発音制御部330が構成されることにより発音制御装置として機能する。また、制御部51が検索プログラムを実行すると、特定部510を構成する。この例においてはサーバ装置50は、特定部510が構成されることにより特定装置として機能する。
表示制御部310は、ユーザによって入力される指示に応じて、表示画面131の表示内容を制御する。この場合、表示画面131には、図18に示すような内容が表示される。
図18は、本発明の変形例7における音素材トラック作成プログラム実行時の表示画面131の表示例を説明する図である。表示画面131には、大きく分けてアイコン配置領域STおよびDB配置領域DTが表示される。アイコン配置領域STおよびDB配置領域DTは、横軸を共通の時間軸として決められている。拍子線BLは、1拍ごとの位置を示す補助線である。また、アイコン配置領域STは、縦軸が発音の音量を規定する音量軸である。なお、アイコン画像の位置に関係なく音量が規定されるものとすれば音量軸はなくてもよい。
アイコン画像s1、s2、・・・は、特徴量データが対応付けられた画像である。アイコン画像s1、s2、・・・がアイコン配置領域STに配置されることにより、アイコン画像左端の時間軸に沿った方向の位置に応じて、それぞれ対応した特徴量データに基づく音の発音タイミングが規定される。また、アイコン画像下端の音量軸に沿った方向の位置に応じて、その音量が規定される。アイコン画像s1、s2、・・・の絵柄の種類は、対応付けられた特徴量データが分類されるカテゴリ(分類A、B、・・・)ごとに異なるように決められている。例えば、アイコン画像s1に対応する特徴量データとアイコン画像s2に対応する特徴量データとは異なるカテゴリに分類されるものであり、アイコン画像s2に対応する特徴量データとアイコン画像s4に対応する特徴量データとは同じカテゴリに分類されるものである。なお、アイコン画像の絵柄は、カテゴリに応じて異なったものでなくてもよい。すなわち、全て同じ絵柄であってもよいし、別のパラメータに応じて異なる絵柄になるように制御されてもよい。
DB画像d1、d2、・・・は、音素材DBの種類が対応付けられた画像である。DB画像d1、d2、・・・が、DB配置領域DTに配置され、DB画像の左端から右端の時間軸に沿った方向の位置に応じて、そのDB画像に対応する音素材DBがサーバ装置50における検索対象として適用される期間が規定される。例えば、音素材DBaは、時刻t0から時刻t2までが検索対象として適用され、音素材DBcは、時刻t1から時刻t3までが検索対象として適用される。すなわち、時刻t1から時刻t2までは、音素材DBaと音素材DBcとの双方が検索対象として適用される。
また、表示画面131には、再生テンポを設定するためのテンポ制御ボタンb11、アイコン配置領域のアイコン画像の配置態様に基づいて、音素材トラックをオーディオデータに変換するための指示を行うための変換指示ボタンb12、変換により生成されたオーディオデータを発音させるための再生指示ボタンb13が表示される。このテンポ制御ボタンb11は、上述したテンポ制御ボタンb1と同様の機能を有している。また、作成した音素材トラックを記憶部15に記憶させるための決定ボタンb14が表示されていてもよい。
図17に戻って説明を続ける。設定部320は、ユーザによって入力された指示に応じて、時間軸に沿って音素材DBの種類を設定する。この例においては、設定部320は、設定内容を表示制御部310に出力して、図18に示すように表示画面にDB画像を表示させる。なお、設定部320は、表示制御部310への出力をせずに、DB画像が表示画面131に表示されないようにしてもよい。この場合には、DB配置領域DTは不要である。すなわち、音素材DBの種類がアイコン配置領域STと同じ時間軸に沿って設定されていれば、その設定内容が表示画面131に表示されていても表示されていなくてもよい。
表示制御部310および設定部320は、アイコン画像の配置態様、音素材DBの種類の設定態様に応じて音素材トラックを生成する。ここで、表示制御部310は、音素材トラックのうち、特徴量指定データを生成し、設定部320は、音素材トラックのうちDB指定データを生成する。音素材トラックは、アイコン画像が配置されたり、音素材DBの設定が行われたりする度に内容が決定されるようにしてもよいし、変換指示ボタンb12が操作されたときに決定されるようにしてもよい。上述した保存ボタンb14が表示画面131に表示されている場合には、ユーザによって保存ボタンb14が操作が操作されると、ここで生成された音素材トラックが記憶部15に保存される。
発音制御部330は、ユーザによって変換指示ボタンb12が操作されると、サーバ装置50に対して、生成された音素材トラックの一部または全部を通信部14を介して送信し、サーバ装置50の制御部51に検索プログラムを起動、実行させる。音素材トラックの一部とは、少なくとも、特徴量データと、その特徴量データに対して時間軸において対応関係にある音素材DBの種類(種類情報)とを対応付けた部分のデータである。そして、発音制御部330は、サーバ装置50から音素材データをインターフェイス14を介して受信して、受信した音素材データおよび音素材トラックに基づいて、データ出力部340からオーディオデータを出力させる。具体的には、発音制御部330は、音素材トラックの特徴量指定データを参照して、アイコン画像に対応する音素材データを音量に応じてレベルを変化させる加工をし、再生時刻に応じたタイミングでオーディオデータとして出力させる。データ出力部340は、発音制御部330の制御に応じてオーディオデータを出力する。
特定部510は、発音制御部330から送信された音素材トラックに基づく情報を通信部54を介して受信し、記憶部55に記憶された音素材DBのうち、受信した情報が示す検索対象となる種類の音素材DBを検索し、音素材トラックに含まれる各特徴量データのそれぞれに対して、類似する特徴量データをもつ音素材データを特定する。この例においては、特定部510は、特徴量データを複数の特徴量により構成されるベクトル量として取り扱い、検索対象となる種類の音素材DBを参照してユークリッド距離が最も短くなる特徴量データをもつ音素材データを特定する。
なお、類似度を判断するためのアルゴリズムについては、公知の他のアルゴリズムを用いてもよい。また、ユークリッド距離が最も短くなるものでなくてもよく、2番目、3番目に近いものを特定してもよい。このような特定を行うために必要な情報は、予めユーザなどにより設定されていればよい。また、特定される音素材データは、音素材トラックに含まれる特徴量データに対して、特徴量データが類似関係にあるものでなくてもよく、予め決められた特定の関係にあればよい。また、検索対象については、検索対象となる種類の音素材DBとするだけなく、さらに、カテゴリにより絞りこまれてもよい。この場合には、検索対象となるカテゴリは、例えばユーザによって指示されたものであってもよいし、音素材トラックに含まれる特徴量データと同じカテゴリまたは関連するカテゴリであってもよい。ここで、関連するカテゴリは、予め設定されたアルゴリズムに従って決められてもよいし、予め関連するカテゴリ同士が設定されていてもよい。
そして、特定部510は、特定した素材データを通信部54を介して発音制御部330に送信する。なお、上述の通り、この例においては、通信部54は、音素材トラックに基づく情報を受信することにより取得する取得手段、および特定された素材データを送信することにより出力する出力手段として機能する。
以上が機能構成についての説明である。続いて、音素材トラック作成プログラム実行時の発音制御システム1における動作について図19を用いて説明する。
図19は、本発明の変形例7における音素材トラック作成プログラム実行時の発音制御システム1の動作を説明する図である。ここでは、楽音処理装置10Aは、ユーザから音素材トラック作成プログラムの実行の指示が入力された後の処理を説明する。音素材トラック作成プログラムが実行されると、表示画面131には、図18に示すように、アイコン配置領域ST、DB配置領域DTなどの表示がなされる。この段階においては、アイコン画像およびDB画像は表示されていないものとする。
ユーザは、特徴量データの内容を決定する指示、決定した内容により決まる絵柄のアイコン画像をアイコン配置領域STに配置する指示、DB画像をDB配置領域DTに配置する指示を入力することにより、楽音を発生させるためのシーケンスを作成する(ステップS110)。その結果、表示画面131には、図18に示す内容で表示されたものとする。この状態で生成されている音素材トラックは、例えば、図16に示す内容となる。この場合、アイコン画像s3、s4、s5に対応する特徴量データは、Ph、Pi、Pjとなる。
ユーザは、変換指示ボタンb12を操作することにより変換指示(ステップS120)を入力すると、楽音処理装置10Aは、発音制御部330によりサーバ装置50に音素材トラックを送信する(ステップS130)。送信される音素材トラックは、上述したように、全ての情報でなくてもよく、特徴量データと、その特徴量データに対して時間軸において対応関係にある音素材DBの種類とを対応付けた部分を有したデータであればよい。
サーバ装置50は、このデータを受信すると、検索プログラムを実行し、特定部510により音素材DBを検索して音素材データを特定する(ステップS140)。例えば、アイコン画像s3に対応する特徴量データPiについては、時間軸において対応関係にある音素材DBの種類となる音素材DBcを検索して、特徴量データPiに類似する特徴量データをもつ音素材データを楽音処理装置10Aに送信する(ステップS150)。このとき、サーバ装置50は、特定した音素材データがどの特徴量データに対応したものであるかが識別できるようにして送信する。
楽音処理装置10Aは、これらのデータを受信が完了するとその旨をユーザに通知する。ユーザは、再生指示ボタンb13を操作することにより再生指示を入力(ステップS160)すると、発音制御部330によりデータ出力部340を制御させる。発音制御部330は、音素材トラックのうち特徴量指定データを参照して、受信した音素材データの音量を調整して、対応する特徴量データの再生時刻にしたがってオーディオデータとしてデータ出力部340から出力(ステップS170)させ、スピーカ161から発音させる。
ユーザは、スピーカ161からの発音を聴き、所望の音になっている場合には、決定ボタンb14を操作して、音素材トラックを記憶部15に記憶させる。
このようにして、ユーザが作成したシーケンスにしたがって、楽音処理装置10Aからオーディオデータが出力される。ここで、検索対象となる音素材DBの種類は、DB指定データによって規定されている。したがって、ユーザは、DB指定データを変更するだけで検索対象となる音素材DBの種類が変更されるから、特徴量指定データの内容が変更されていなくても、特定部510において特定される音素材データも変化する。したがって、ユーザの再生指示により発音される内容も変化することになる。このとき、音素材データは変化したとしても、特徴量データが変わるわけではないから、音素材データの音が全く違うものに変化せず、大体の場合は同じカテゴリに分類されているものから特定される。したがって、音素材DBの種類が、例えば、楽曲のジャンル(ジャズ、ロックなど)に応じたものとなっている場合には、ユーザはDB指定データを変更するだけでも、同じような発音内容(楽音のパターンなど)を維持したまま、ジャズであったりロックであったりと印象を変更することができる。
なお、実施形態におけるデータ読込部110−3および音素材データ合成部130(図5参照)は、変形例7の構成が適用された場合には発音制御部330の機能と同様にしてオーディオデータを出力するようにすればよい。また、データ読込部110−3および音素材データ合成部130は、データ出力部340から出力されたオーディオデータを記憶部15に記憶しておきオーディオトラックと同様に扱って処理するようにしてもよい。
[変形例8]
上述した変形例7において、ユーザによって入力された指示に応じて、アイコン配置領域STに表示されるアイコン画像が時間軸方向に伸縮可能に構成されてもよい。
図20は、本発明の変形例8における音素材トラック作成プログラム実行時の表示画面の表示例を説明する図である。表示制御部310は、表示画面131に表示されたアイコン画像の長さを、ユーザによって入力された指示に応じて時間軸に沿った方向に変化させる。例えば、図18に示すアイコン画像s4を、図20に示すアイコン画像s41のように、時間軸に沿った方向に伸長させる。この場合には、発音制御部330は、このアイコン画像s41に対応する音素材データを出力部340から出力させるときに、アイコン画像s41の時間軸に沿った方向の長さに応じて、タイムストレッチ処理(音素材データの波形を伸ばす処理)、ループ処理(音素材データを繰り返して出力させる処理)などを施すことにより加工し、データ出力部340からオーディオデータとして出力させてもよい。この場合、音素材トラックにおいてアイコン画像に対応して決められている時間が変更される。なお、シーケンス情報として発音終了のタイミング、ループ再生のフラグなど必要な情報が追加されてもよい。
なお、図18に示すアイコン画像は、すべて同じ大きさであり、本変形例での処理により時間軸に沿った方向に伸縮させていたが、伸縮させる前の状態であっても、音素材トラックにおけるそのアイコン画像に対応して決められている時間に応じた長さで表示されてもよい。
[変形例9]
上述した変形例7においては、アイコン配置領域STの縦軸は音量を示す座標軸(音量軸)であったが、例えば、ピッチ、音長などを示す座標軸(以下、指定座標軸という)としてもよい。すなわち、アイコン配置領域STは、音素材データの音量以外の他の加工内容を指定する指定値を示す指定座標軸をもっていてもよい。ピッチを示す指定座標軸とした場合には、発音制御部330は、音素材データのピッチを、アイコン画像の指定座標軸における位置に応じて変更してデータ出力部340からオーディオデータとして出力させればよい。音長を示す指定座標軸とした場合には、発音制御部330は、アイコン画像の指定座標軸に於ける位置に応じて、タイムストレッチ処理(音素材データの波形を伸ばす処理)、ループ処理(音素材データを繰り返して出力させる処理)などを施すことにより加工し、データ出力部340からオーディオデータとして出力させればよい。
また、指定座標軸によって指定される加工内容は、音量、ピッチなど複数種類にわたってもよく、この場合には、ユーザによって入力された指示に応じて、指定座標軸の種類を切り替えて、アイコン画像を配置可能なものとしてもよい。このように切り替え可能な指定座標軸をもつアイコン配置領域STにアイコン画像を配置させることにより、音素材データを様々に加工してもよい。
[変形例10]
上述した変形例7においては、アイコン配置領域STの縦軸は音素材データの加工内容を指定する指定座標軸であったが、特定部510において音素材データを特定するための特定値を示す座標軸(以下、特定座標軸という)としてもよい。この場合には、特定部510は、音素材データを特定するときに、アイコン画像の特定座標軸における位置に応じて特定すればよい。例えば、特定値が類似度に関するものであれば、アイコン配置領域STの上方にアイコン画像が位置するほど、特定部510において特定される音素材データが類似度が低い(特徴量データ間のユークリッド距離が長い)ものが特定されるようにすればよい。
なお、類似度についてはユーザが指定するのではなく、例えば、ユーザが所定の操作(ランダムボタンの操作など)をすることにより、全てのアイコン画像または予め指定されたアイコン画像に対応する類似度が予め決められたアルゴリズム(例えばランダム)に従って指定されるようにしてもよい。
また、特定値の内容は複数種類にわたってもよく、この場合には、ユーザによって入力された指示に応じて、アイコン配置領域STにおける特定座標軸と変形例9における指定座標軸とを切り替えて、アイコン画像を配置可能なものとしてもよい。他の種類の例としては、例えば、アイコン画像に対応する特徴量データを変化させて分類させるカテゴリを変化させるものであってもよい。
[変形例11]
上述した変形例7において、図19に示すステップS170の処理、すなわち、音素材トラック作成プログラムの実行時にデータ出力部340から出力されるオーディオデータは、発音制御部330が、アイコン画像の時間軸における位置に応じたタイミングで音素材データを出力することにより実現していたが、出力期間全体の発音内容を示すデータとして発音制御部330によって生成された後、データ出力部340から出力されるようにしてもよい。発音制御部330は、生成されたオーディオデータを記憶部15に出力して記憶させるようにしてもよい。また、オーディオデータとして記憶させる場合に限らず、音素材トラックと音素材データとの組み合わせなど、オーディオデータを生成するために必要な複数種類のデータで記憶させれるようにしてもよい。各種データを記憶させる指示については、ユーザによって入力されるようにすればよい。
また、このようなオーディオデータに基づく発音は、楽音処理装置10Aのスピーカ161から出力されていたが、楽音処理装置10Aに接続される外部のスピーカ装置から出力されるようにしてもよいし、サーバ装置50から出力されるようにしてもよい。すなわち、発音制御部330は、音を出力する何らかの装置から発音されるように、オーディオデータを出力させるように、楽音処理装置10Aの構成のみならず接続される各構成を制御すればよい。
[変形例12]
上述した変形例7においては、音素材トラック作成プログラム実行時に表示画面131に表示されるアイコン画像、DB画像などはプログラム上において生成しているが、これらの画像は、予め記憶部15、55などに記憶されていてもよい。
[変形例13]
上述した変形例7においては、アイコン配置領域STに表示されるアイコン画像に対応する特徴量データの内容は、ユーザが入力した指示に応じて決定していたが、ユーザは、アイコン画像の絵柄(またはカテゴリ)を選択することにより、この絵柄に対応するカテゴリの予め決められた代表値を特徴量データとして決定するようにしてもよい。
[変形例14]
上述した変形例7において、DB指定データの内容は、ユーザがDB配置領域DTにDB画像を配置することにより決定されていたが、予め決められたアルゴリズムにしたがって、再生時刻範囲と音素材DBの種類との関係を、制御部11が自動的に決定するようにしてもよい。
[変形例15]
上述した変形例7において、DB指定データの内容として音素材DBの種類の指定がされていない再生時刻範囲が存在する場合には、指定されていない再生時刻範囲においては、予め決められた音素材DBの種類(全ての種類、一部の特定の種類など)が検索対象として指定されてもよいし、その範囲の直前に指定されていた種類を指定してもよい。
[変形例16]
上述した実施形態においては、音素材DBのデータ範囲に応じて、適時波形DBから音素材データを取得しているが、あらかじめ切出し済みの区間の音素材データだけを保持しておいても良い。その場合、音素材DBにデータ範囲の情報は不要である。
[変形例17]
上述した変形例7において、ユーザが音素材データ(特定データ)のデータ範囲を調整できるようにしてもよい。
図21は、本発明の変形例17における音素材トラック作成プログラム実行時の表示画面の表示例を説明する図である。図21は、変形例7において説明した図18において、ユーザがアイコン画像s3に対して所定の操作(ダブルクリック操作など)をしたときにの表示内容を示している。図21に示すポップアップウインドウPWは、ユーザの操作に応じて表示され、その内容がアイコン画像s3に対応する波形を拡大したものとなっている。ここで、アイコン画像s3に対応する波形とは、再生時にアイコン画像s3に対応して発音される音の波形である。ユーザはポップアップウインドウPWにおいて波形の範囲を変更することにより、時間軸方向の長さを調整することができる。
[変形例18]
上述した変形例7において、DB配置領域DTには、音素材DBの種類が対応付けられたDB画像が表示されていたが、音素材DBの種類とその検索対象となる時刻の範囲とは別々に表示されていてもよい。
図22は、本発明の変形例18における音素材トラック作成プログラム実行時の表示画面の表示例を説明する図である。この例においては、DB配置領域DTは、指定される音素材DBが各行に分割されて表示される。各行には、指定された音素材DBが検索対象となる時刻の範囲を示すDB期間指定画像d1a、d2a、・・・が配置される。DB配置領域DTの左側には、各行に対応した音素材DBの種類を指定するためのDB種類指定領域DMが表示されている。ユーザは、ポップアップメニューなどにより、各行に対応する音素材DBの種類を変更できるようになっている。
図22に示す例では、音素材DBa、DBb、DBc指定され、例えば、音素材DBaについては、DB期間指定画像d1aが指定する時刻の範囲において検索対象となる。図22における表示は、図18とは異なる表示であるが、音素材DBの種類およびその検索対象となる時刻の範囲は同じである。
なお、DB種類指定領域DMの左側に表示されているチェックボックスCBにより、対応する行において指定された検索対象を有効とするか無効とするかを指定する事ができるようにしてもよい。このチェックボックスCBは、図18に示す表示において用いられてもよい。
[変形例19]
上述した変形例7において、図18に示す表示におけるアイコン画像は、ユーザの指示に応じて決定された特徴量データに応じて配置されていた。ユーザが特徴量データを指示するときに、所望の特徴量データを音素材DBから検索するようにしてもよい。このときには、例えば、特開2011−163171号公報に開示された方法を用いればよい。また、このときの検索対象の音素材DBの種類については、図22に示したチェックボックスCBにおいて指定された音素材DBとしてもよい。なお、ユーザがこのようにアイコン画像に対応する特徴量データを指示する場合には、図18に示す表示の一部に、特徴量データの指示をするための表示を行うようにすればよい。また、アイコン画像に対して所定の操作(ダブルクリック操作など)をしたときにポップアップウインドウなどを表示させて、そのアイコン画像に対応する特徴量データを指示できるようにしてもよい。
[変形例20]
上述した変形例7での図18に示す表示において、音素材DBの種類、およびその検索対象となる時刻の範囲については、ユーザが指定していたが、例えば、ユーザが所定の操作(ランダムボタンの操作など)をすることにより、予め決められたアルゴリズム(例えばランダム)に従って指定されるようにしてもよい。また、図8に示すように予め音素材DBの種類、およびその検索対象となる時刻の範囲が決められている場合には、いずれかのDB画像を指定して、指定されたDB画像に対して予め決められたアルゴリズム(例えばランダム)に従って、音素材DBの種類、時刻の範囲が変更されるようにしてもよい。さらには、データベースのランダム選択で、DB配置領域DT自体をアクティブ(音素材DBを選択する機能が生きている状態)にして音素材DBを選択可能にしたり、非アクティブ(音素材DBを選択する機能が生きていない状態)にして特定の音素材DBのみを適用したりすることもランダムに行えるようにしてもよい。さらには、DB配置領域DTにおいて選択されている音素材DBをアクティブ(選択されている音素材DBを検索対象とする状態)にしたり、非アクティブ(選択されている音素材DBを検索対象としない状態)にしたりすることもランダムに行えるようにしてもよい。このとき、アクティブな音素材DBに対応するDB画像は色つきのままとして、非アクティブな音素材DBに対応するDB画像はグレーアウトするなど、表示が変更されている音素材DBについてアクティブか非アクティブか認識できるようにするとよい。
[変形例21]
上述した変形例7での図18に示す表示において、アイコン画像に該当する音がない場合には、アイコン画像をグレーアウトさせてもよい。該当する音がないとは、例えば、そのアイコン画像に対応する時刻を範囲とする音素材DB(検索対象となる音素材DB)が決められていない場合、アイコン画像に対応する特徴量データに基づいて特定部510により特定される音素材データが存在しない場合などがある。特定部510により特定される音素材データが存在しないとは、例えば、アイコン画像に対応する特徴量データに最も類似する音素材データが、しきい値として予め決められた類似度よりも類似していない場合、またカテゴリにより検索対象が絞り込まれる構成であるときに検索対象の音素材DBにそのカテゴリが含まれていない場合などがある。
[変形例22]
上述した変形例7においては、発音制御システム1は、通信回線1000を介して接続された楽音処理装置10Aとサーバ装置50とにより構成されていたが、一体の装置として構成され、通信回線1000を介していない構成としてもよい。また、別体の装置であっても、楽音処理装置10Aにおける各構成の一部がサーバ装置50の構成に含まれていてもよいし、逆に、サーバ装置50の各構成の一部が楽音処理装置10Aの構成に含まれていてもよい。また、楽音処理装置10Aの記憶部15に記憶されている各種情報、およびサーバ装置50の記憶部55に記憶されている各種情報は、発音制御システム1全体としていずれかの記憶部において記憶されていればよく、楽音処理装置10Aおよびサーバ装置50以外に、これらの情報の全部または一部を記憶する記憶装置が通信回線1000に接続されていてもよい。また、これらの情報は、通信回線1000に接続可能な他の楽音処理装置10Aと共有することにより、他のユーザが使用できるようにしてもよい。
組み合わせとしては、例えば、音素材DBはサーバ装置50の記憶部55に記憶されている一方、楽音処理装置10Aにおいて、記憶部15に波形DBが記憶され、特定部510の機能が実現されてもよい。さらには、検索プログラムおよび抽出プログラムの実行は楽音処理装置10Aで実行してもよいし、楽音処理装置10Aから得た情報をもとにサーバ装置50で実行するようにしてもよい。
[変形例23]
上述した実施形態における各プログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータ読み取り可能な記録媒体に記憶した状態で提供し得る。また、楽音処理装置10は、各プログラムをネットワーク経由でダウンロードしてもよい。
1…発音制御システム、10,10A…楽音処理装置、11…制御部、12…操作部、13…表示部、131…表示画面、14…インターフェイス、15…記憶部、16…音響処理部、161…スピーカ、162…マイクロフォン、100…再生機能部、110−1,110−2,110−3…データ読出部、120…音源部、130…音素材データ合成部、140−1,140−2,140−3,140−4…音響効果付与部、150…オーディオデータ合成部、160…合成音響効果付与部、170…チャンネル変換部、180…バス部、200…音素材抽出機能部、210…選択部、220…抽出部、221…音素材特定部、222…特徴量算出部、230…データ出力部、300…修正部、310…表示制御部、320…設定部、330…発音制御部、340…データ出力部、510…特定部、1000…通信回線

Claims (6)

  1. 発音内容を示す発音データを取得するとともに、当該発音内容を変化させるための加工データを複数取得して、当該発音データに対して当該複数の加工データに基づく複数の加工をする加工手段と、
    前記複数の加工をされた発音データの発音内容を示す楽音波形信号を解析して、予め決められた特徴を有する楽音波形信号の期間を特定する特定手段と、
    前記特定された期間の楽音波形信号を解析して特徴量を算出する算出手段と、
    前記特定された期間の楽音波形信号を示す特定データと前記算出された特徴量を示す特徴量データとを出力するデータ出力手段と
    を具備し、
    前記複数の加工データは、発音内容を規定する発音データを含み、
    前記加工手段は、前記取得した発音データに係る楽音波形信号に対して、前記複数の加工データに含まれる発音データに係る楽音波形信号を合成することにより前記加工をする
    ことを特徴とするデータ処理装置。
  2. 前記複数の加工データは、前記楽音波形信号に付与する音響効果の内容を規定する設定データを含み、
    前記加工手段は、前記設定データに基づいて、前記取得した発音データに係る前記楽音波形信号に音響効果を付与するように前記加工をする
    ことを特徴とする請求項1に記載のデータ処理装置。
  3. 前記特定データは、前記複数の加工をされた発音データに係る楽音波形信号と当該楽音波形信号の前記特定された期間を示す時刻情報とにより、前記特定された期間の楽音波形信号を示し、
    前記特定手段が複数の期間を特定した場合には、
    前記特定データは、前記複数の加工をされた発音データに係る楽音波形信号と当該楽音波形信号の前記特定された複数の期間を示す時刻情報とにより、前記特定された複数の期間の楽音波形信号を示し、
    前記算出手段は、前記特定された期間毎に前記特徴量を算出する
    ことを特徴とする請求項1又は2に記載のデータ処理装置。
  4. 前記特定データは、前記特定された期間の楽音波形信号を抽出した楽音波形信号を示す
    ことを特徴とする請求項1又は2に記載のデータ処理装置。
  5. 前記加工手段は、前記複数の加工データのうち一の加工データをユーザの指示に従って取得する
    ことを特徴とする請求項1乃至請求項のいずれか1項に記載のデータ処理装置。
  6. コンピュータを、
    発音内容を示す発音データを取得するとともに、当該発音内容を変化させるための加工データを複数取得して、当該発音データに対して当該複数の加工データに基づく複数の加工をする加工手段と、
    前記複数の加工をされた発音データの発音内容を示す楽音波形信号を解析して、予め決められた特徴を有する楽音波形信号の期間を特定する特定手段と、
    前記特定された期間の楽音波形信号を解析して特徴量を算出する算出手段と、
    前記特定された期間の楽音波形信号を示す特定データと前記算出された特徴量を示す特徴量データとを出力するデータ出力手段
    として機能させるためのプログラムであって、
    前記複数の加工データは、発音内容を規定する発音データを含み、
    前記加工手段は、前記取得した発音データに係る楽音波形信号に対して、前記複数の加工データに含まれる発音データに係る楽音波形信号を合成することにより前記加工をする
    プログラム
JP2011242607A 2011-05-26 2011-11-04 データ処理装置およびプログラム Active JP6114492B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011242607A JP6114492B2 (ja) 2011-05-26 2011-11-04 データ処理装置およびプログラム

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011118518 2011-05-26
JP2011118518 2011-05-26
JP2011242607A JP6114492B2 (ja) 2011-05-26 2011-11-04 データ処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2013007988A JP2013007988A (ja) 2013-01-10
JP6114492B2 true JP6114492B2 (ja) 2017-04-12

Family

ID=47675366

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011242607A Active JP6114492B2 (ja) 2011-05-26 2011-11-04 データ処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP6114492B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014113071A1 (en) 2013-01-15 2014-07-24 Viki, Inc. System and method for captioning media

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0789279B2 (ja) * 1985-10-21 1995-09-27 ヤマハ株式会社 楽音信号発生装置
JPS62129894A (ja) * 1985-11-30 1987-06-12 カシオ計算機株式会社 波形発生装置
JP3556400B2 (ja) * 1996-07-11 2004-08-18 株式会社河合楽器製作所 楽音波形形成方法及びその装置
JP3570309B2 (ja) * 1999-09-24 2004-09-29 ヤマハ株式会社 リミックス装置および記憶媒体
JP3904012B2 (ja) * 2004-09-27 2007-04-11 ヤマハ株式会社 波形生成装置及び方法
JP4544258B2 (ja) * 2007-03-30 2010-09-15 ヤマハ株式会社 音響変換装置およびプログラム
JP5135982B2 (ja) * 2007-10-09 2013-02-06 ヤマハ株式会社 楽曲加工装置およびプログラム

Also Published As

Publication number Publication date
JP2013007988A (ja) 2013-01-10

Similar Documents

Publication Publication Date Title
JP5842545B2 (ja) 発音制御装置、発音制御システム、プログラム及び発音制御方法
JP5135931B2 (ja) 楽曲加工装置およびプログラム
JP5333517B2 (ja) データ処理装置およびプログラム
WO2008065731A1 (fr) Processeur audio et procédé de traitement audio
US9792916B2 (en) Multifunctional audio signal generation apparatus
JP4274152B2 (ja) 楽音合成装置
WO2008065730A1 (fr) Dispositif et méthode de traitement audio
JP6201460B2 (ja) ミキシング管理装置
JP6114492B2 (ja) データ処理装置およびプログラム
JP6657866B2 (ja) 音響効果付与装置及び音響効果付与プログラム
JP5060341B2 (ja) 同期再生装置、楽曲自動リミックスシステム、同期再生方法および同期再生プログラム
JP2004258564A (ja) スコアデータ編集装置、スコアデータ表示装置およびプログラム
JP6474292B2 (ja) カラオケ装置
JP5742472B2 (ja) データ検索装置およびプログラム
JP6390094B2 (ja) 音響信号分析制御プログラムおよび音響信号分析制御装置
JP6810773B2 (ja) 再生装置、再生方法、及び、プログラム
WO2022249586A1 (ja) 情報処理装置、情報処理方法、情報処理プログラムおよび情報処理システム
JP2005037848A (ja) 楽音発生装置及びそのプログラム
WO2023062865A1 (ja) 情報処理装置および方法、並びにプログラム
JP5200896B2 (ja) 演奏データ処理装置及びプログラム
JP6323216B2 (ja) パラメータ受付装置、方法およびプログラム
JP2003141859A (ja) 画像音声再生システム、プログラム、及び記録媒体
JP6003861B2 (ja) 音響データ作成装置、プログラム
JP2021099535A (ja) 再生装置、再生方法、及び、プログラム
JP2003150162A (ja) 楽音発生装置及びプログラムを記録した媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150707

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150826

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160119

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160419

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20160427

A912 Removal of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20160610

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170317

R150 Certificate of patent or registration of utility model

Ref document number: 6114492

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150