JP4665664B2 - Sequence data generation apparatus and sequence data generation program - Google Patents
Sequence data generation apparatus and sequence data generation program Download PDFInfo
- Publication number
- JP4665664B2 JP4665664B2 JP2005242208A JP2005242208A JP4665664B2 JP 4665664 B2 JP4665664 B2 JP 4665664B2 JP 2005242208 A JP2005242208 A JP 2005242208A JP 2005242208 A JP2005242208 A JP 2005242208A JP 4665664 B2 JP4665664 B2 JP 4665664B2
- Authority
- JP
- Japan
- Prior art keywords
- sequence data
- frequency
- power spectrum
- audio stream
- stream data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Auxiliary Devices For Music (AREA)
- Electrophonic Musical Instruments (AREA)
Description
この発明は、楽音に連動して素子を駆動するのに用いるシーケンスデータを生成する装置およびプログラムに関する。 The present invention relates to an apparatus and a program for generating sequence data used for driving elements in conjunction with musical sounds.
携帯電話など、楽曲再生機能を持った電子機器では、楽曲再生の際、アミューズメント性を高めるために、楽曲のノート(音符)のタイミングに合わせてLEDを点滅させ、あるいはバイブレータを振動させる場合がある。ここで、電子機器がMIDIデータなどの演奏データによって音源を駆動して楽曲再生を行うものである場合には、演奏データに含まれるノートオンやノートオフの指示の情報をLEDの点滅等の制御に用いることができた。しかし、最近の携帯電話などでは、このように音源の駆動により楽曲再生を行うのではなく、演奏を録音することにより得られたオーディオストリームデータを再生することにより楽曲再生を行う機種も提供されている。この場合、オーディオストリームデータは、楽音波形を表すデータであって、ノートオンやノートオフのタイミングを直接表すデータではないので、これをLEDの点滅制御等に用いることはできない。従って、このようなオーディオストリームデータを用いて楽曲再生を行う装置において、LEDの点滅制御等を行うためには、楽曲のノートのタイミングを示すデータを別途用意する必要がある。従来、オーディオストリームデータからノートのタイミングの抽出を行う技術として、特許文献1に開示された技術があった。この技術は、オーディオストリームデータを一定時間長のフレームに分割し、フレーム毎に周波数解析を行ってスペクトルを求め、フレーム間におけるスペクトルのピークの不連続性を検出することによりノートのタイミングを検出するものである。
ところで、上述した特許文献1に開示された技術は、スペクトルのピークの不連続性に基づいてノートのタイミングを検出するので、時間経過に伴って音高が明確に変化する楽音波形のオーディオストリームデータでないと、オーディオストリームデータ自体からノートのタイミングを検出するのは困難であるという問題があった。
By the way, since the technique disclosed in
この発明は、以上説明した事情に鑑みてなされたものであり、処理対象が打楽器音などのような音高の変化が明確でない楽音波形のオーディオストリームデータである場合であっても、ノートのタイミングを検出し、LEDやバイブレータなどの素子を駆動するシーケンスデータを生成することができるシーケンスデータ生成装置およびシーケンスデータ生成プログラムを提供することを目的とする。 The present invention has been made in view of the circumstances described above, and even when the processing target is music stream audio stream data whose pitch change is not clear, such as percussion instrument sound, the timing of the notes An object of the present invention is to provide a sequence data generation device and a sequence data generation program that can detect sequence and generate sequence data for driving elements such as LEDs and vibrators.
この発明は、楽曲またはその一部の波形を示すオーディオストリームデータの開始点から終了点までの各部の周波数特性を順次求める周波数解析手段と、周波数帯域および振幅域を指定する範囲指定手段と、前記範囲指定手段により指定された周波数帯域および振幅域に前記周波数解析手段によって順次求められる周波数特性におけるパワースペクトルのピークが含まれる期間を検出し、この検出結果に基づき、楽音の発生タイミングを示すシーケンスデータを生成するシーケンスデータ生成手段とを具備することを特徴とするシーケンスデータ生成装置およびコンピュータを前記各手段として機能させるシーケンスデータ生成プログラムを提供する。
かかる発明によれば、範囲指定手段により適切な周波数帯域および振幅域を指定することにより、周波数解析手段により順次求められるオーディオストリームデータの周波数特性から楽音の発生タイミングを検出し、シーケンスデータを生成することができる。
The present invention provides a frequency analysis means for sequentially obtaining frequency characteristics of each part from a start point to an end point of audio stream data indicating a waveform of a music piece or a part thereof, a range specifying means for specifying a frequency band and an amplitude range, Sequence data indicating the generation timing of a musical tone based on the detection result of detecting a period in which the frequency spectrum sequentially obtained by the frequency analysis means includes frequency spectrum and amplitude range designated by the range designation means. And a sequence data generation program for causing a computer to function as each means.
According to this invention, by designating appropriate frequency band and amplitude range by the range designating means, the tone generation timing is detected from the frequency characteristics of the audio stream data sequentially obtained by the frequency analyzing means, and sequence data is generated. be able to.
以下、図面を参照し、この発明の実施の形態を説明する。
図1はこの発明の一実施形態であるシーケンスデータ生成装置の構成を示すブロック図である。このシーケンスデータ生成装置は、パーソナルコンピュータなどのコンピュータに対し、オーディオストリームデータからシーケンスデータを生成するシーケンスデータ生成プログラムをインストールしたものである。
Embodiments of the present invention will be described below with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of a sequence data generating apparatus according to an embodiment of the present invention. This sequence data generation apparatus is obtained by installing a sequence data generation program for generating sequence data from audio stream data in a computer such as a personal computer.
図1において、CPU1は、このシーケンスデータ生成装置の各部を制御する制御中枢である。ROM2は、ローダなど、このシーケンスデータ生成装置の基本的な動作を制御するための制御プログラムを記憶した読み出し専用メモリである。表示部3は、装置の動作状態やユーザに対するメッセージなどを表示するための装置である。操作部4は、ユーザからコマンドや各種の情報を受け取るための手段であり、キーボードやマウスなどの各種の操作子により構成されている。I/F(インタフェース)群5は、ネットワークを介して他の装置との間でデータ通信を行うためのネットワークインタフェースや、磁気ディスク、CD−ROMなどの外部記憶媒体との間でデータの授受を行うためのドライバなどにより構成されている。HDD(ハードディスク装置)6は、各種のプログラムやデータベースなどの情報を記憶するための不揮発性記憶装置である。RAM7は、CPU1によってワークエリアとして使用される揮発性メモリである。CPU1は、操作部4を介して与えられる指令に従い、HDD6内のプログラムをRAM7にロードして実行する。サウンドシステム8は、CPU1による制御の下、音声を出力する装置である。
In FIG. 1, a
HDD6に記憶される情報として、シーケンスデータ生成プログラムとその処理対象であるオーディオストリームデータがある。ここで、オーディオストリームデータは、楽曲演奏の際の楽音波形をサンプリングして符号化することにより得られるデータである。また、シーケンスデータ生成プログラムは、このオーディオストリームデータから楽音の発音期間を示すノート情報を抽出し、一連のノート情報により構成されるシーケンスデータを生成するプログラムである。好ましい態様において、シーケンスデータ生成プログラムおよびオーディオストリームデータは、例えばインターネット内のサイトからI/F群5の中の適当なものを介してダウンロードされ、HDD6にインストールされる。また、他の態様において、シーケンスデータ生成プログラムおよびオーディオストリームデータは、CD−ROM、MDなどのコンピュータ読み取り可能な記憶媒体に記憶された状態で取引される。この態様では、I/F群5の中の適当なものを介して記憶媒体からシーケンスデータ生成プログラムまたはオーディオストリームデータが読み出され、HDD6にインストールされる。
Information stored in the
図2はシーケンスデータ生成プログラムの処理内容を示すブロック図である。この図に示すように、シーケンスデータ生成プログラムは、窓掛け11、FFT(高速フーリエ変換)12、パワースペクトル表示13、矩形指定によるパラメータ設定14、矩形内ピーク検出15および発音時間累算16の各処理を含む。窓掛け11では、処理対象であるオーディオストリームデータを一定時間長のフレームに分割し、フレーム毎に窓関数を乗算する。FFT12では、フレーム毎に、窓関数の乗じられたオーディオストリームデータにFFTを施し、オーディオストリームデータの周波数特性を求める。そして、パワースペクトル表示13では、横軸を周波数軸、縦軸を振幅軸として、FFT12において求めた各フレームの周波数特性の絶対値であるパワースペクトルを表示部3に表示する。
FIG. 2 is a block diagram showing the processing contents of the sequence data generation program. As shown in this figure, the sequence data generation program includes each of
図3はこのパワースペクトル表示13の処理により表示部3に表示されるパワースペクトルの例を示している。打楽器音などの波形は、図示の例のように、広い周波数範囲に分布したパワースペクトルを含んでいるが、それらのパワースペクトルの中には発音開始から発音終了までの間に振幅が大きく推移する特徴的なパワースペクトルがある。ユーザは、表示部3におけるパワースペクトル表示を確認し、そのような特徴的なパワースペクトルが存在する周波数帯域と振幅域を見つける。矩形指定によるパラメータ設定14では、パワースペクトルの表示された表示部3の表示画面上において、上記の特徴的なパワースペクトルの存在する矩形領域の始点P1および終点P2を操作部4におけるマウスなどのポインティングデバイスの操作によりユーザに指定させる。そして、矩形指定によるパラメータ設定14では、図3に示すように、操作部4の操作によって指定された矩形領域をパワースペクトルと重ね表示するとともに、その矩形領域の横辺によって示される周波数帯域と縦辺によって示される振幅域をパラメータとして受け取る。
FIG. 3 shows an example of a power spectrum displayed on the
矩形内ピーク検出15および発音時間累算16の各処理は、オーディオストリームデータのパワースペクトルからノート情報を抽出し、シーケンスデータを生成する処理を構成している。これらの処理は、矩形指定によるパラメータ設定14が実行され、周波数帯域および振幅域が設定されることにより実行可能となる。矩形内ピーク検出15では、FFT12により得られたパワースペクトルのピークの中に、パラメータ設定14により得られた周波数帯域および振幅域の範囲内に属するものがあるか否かをフレーム毎に判定する。この判定がフレーム毎に繰り返されることにより、楽音の発音期間の開始と終了が求められる。そして、発音時間累算16では、この周波数帯域幅および振幅域の範囲内にパワースペクトルのピークが含まれる時間を累算する。この累算により、楽音の発音期間の長さが求められる。そして、楽音の発音期間の開始時刻および長さを示すノート情報が得られ、シーケンスデータが構成される。
Each process of the detection of the peak in
次に本実施形態の動作を説明する。図4は、シーケンスデータ生成プログラムにおいて図2における矩形指定によるパラメータ設定14に相当するルーチンの処理内容を示すフローチャートである。また、図5は、シーケンスデータ生成プログラムにおいて図2における矩形内ピーク検出15および発音時間累算16に相当するルーチンの処理内容を示すフローチャートである。ユーザが操作部4の操作によりシーケンスデータ生成プログラムの起動を指示すると、CPU1は、同プログラムをHDD6からRAM7にロードして実行する。このシーケンスデータ生成プログラムの実行過程において、CPU1は、まず、図4に示すルーチンの実行を開始する。まず、CPU1は、パワースペクトル表示ウィンドウがアクティブか否かを判断し(ステップS101)。この判断の結果が「NO」である場合、CPU1は、同判断を繰り返す。ここで、操作部4の操作により、HDD6内の所望のオーディオストリームデータの選択が指示されると、CPU1は、シーケンスデータ生成プログラムに従い、そのオーディオストリームデータをHDD6からRAM7内のワークエリアにロードし、このワークエリア内のオーディストリームデータについて図2における窓掛け11、FFT12、パワースペクトル表示13を実行する。これによりパワースペクトルが表示部3に表示される。この際、RAM7のワークエリアにロードされたオーディオストリームデータをサウンドシステム8により再生し、処理対象をユーザに聴かせるようにしてもよい。
Next, the operation of this embodiment will be described. FIG. 4 is a flowchart showing the processing contents of a routine corresponding to the parameter setting 14 by rectangle designation in FIG. 2 in the sequence data generation program. FIG. 5 is a flowchart showing the processing contents of a routine corresponding to the in-
パワースペクトルの表示の態様には各種のものが考えられる。第1の態様では、横軸を周波数、縦軸を振幅とするパワースペクトルのグラフをフレーム毎に順次表示する。この態様では、ユーザは、パワースペクトルのグラフが時間経過に伴って変化してゆくのを観察することができる。なお、矩形指定によるパラメータ設定14におけるユーザの操作を容易にするため、矩形指定によるパラメータ設定14が完了するまでの間、オーディオストリームデータの最後のフレームのパワースペクトルの表示が終わった後、再び最初のフレームに戻り、窓掛け11、FFT12、パワースペクトル表示13を繰り返し実行するようにしてもよい。第2の態様では、フレーム毎に得られるパワースペクトルのグラフの画像をRAM7内のビデオメモリエリアに重ね書きし、ビデオメモリエリア内の画像を表示部3に表示する。この態様では、ユーザは、全フレームについて重ね合わせたパワースペクトルのグラフを表示部3の表示画面上において観察することができる。
Various types of display of the power spectrum are conceivable. In the first aspect, a graph of a power spectrum with the horizontal axis representing frequency and the vertical axis representing amplitude is sequentially displayed for each frame. In this aspect, the user can observe the power spectrum graph changing over time. In order to facilitate the user's operation in the parameter setting 14 by the rectangle designation, after the display of the power spectrum of the last frame of the audio stream data is completed until the parameter setting 14 by the rectangle designation is completed, Returning to this frame, the
表示部3にパワースペクトルが表示されると、ユーザは、パワースペクトルを観察する。そして、時間経過に伴って振幅が大きく変化するような特徴的なパワースペクトルがある場合、ユーザは、操作部4のマウスのドラッグ操作により、その特徴的なパワースペクトルのピークを囲む矩形を指定する。以下の処理は、このマウス操作による矩形入力を受け付けるための処理である。
When the power spectrum is displayed on the
まず、パワースペクトル表示が行われ、ステップS101の判断結果が「YES」となってステップS102に進むと、CPU1は、操作部4におけるマウスボタンが押されたか否かを判断し、肯定的な判断結果が得られるまで同判断を繰り返す。マウスボタンが押され、ステップS102の判断結果が「YES」になると、CPU1は、既に矩形が表示部3に表示されているか否かを判断する(ステップS103)。この判断結果が「NO」である場合、CPU1は、マウスボタンが押されたときの表示画面上のカーソルの位置座標を始点P1の位置座標として記憶する(ステップS106)。次にCPU1は、マウスボタンが離されたか否かを判断し(ステップS107)、肯定的な判断結果が得られるまで同判断を繰り返す。
First, the power spectrum is displayed, and when the determination result in step S101 is “YES” and the process proceeds to step S102, the
そして、マウスボタンが離されて、ステップS107の判断結果が「YES」になると、CPU1は、マウスボタンが離されたときの表示画面上のカーソルの位置座標を終点P2の位置座標として記憶する(ステップS108)。次にCPU1は始点P1と終点P2を結ぶ直線が対角線となる矩形を、パワースペクトルと重ね合わせて表示部3に表示する(ステップS109)。そして、CPU1は、表示された矩形の縦辺に相当する振幅域と横辺に相当する周波数帯域幅を求め、ノート情報の抽出対象となる領域を特定するパラメータとして設定し(ステップS110)、処理をステップS102に戻す。
When the mouse button is released and the determination result in step S107 is “YES”, the
本実施形態においてユーザは、以上のようにして表示部3に矩形が表示された状態において、マウス操作により矩形を変更することができる。以下、その場合の動作を説明する。まず、矩形が表示された状態においてマウスボタンが押されると、ステップS102を介してステップS103に進んだとき、このステップS103の判断結果が「YES」となり、処理はステップS104に進む。ステップS104において、CPU1は、マウスが押されたときのカーソル位置が表示されている矩形の辺上にあるか否かを判断する。この判断結果が「NO」である場合、CPU1は、表示部3における矩形の表示を消去し(ステップS105)、マウスが押されたときのカーソル位置の座標を始点P1の座標として記憶する(ステップS106)。その後、マウスが離されたときに、上述と同様、ステップS107〜S110を順次実行して矩形を確定させ、矩形の縦辺に相当する振幅域と矩形の横辺に相当する周波数帯域をパラメータとして設定する。このように、始点P1として、表示されている矩形の辺上でない位置を指すマウス操作が行われた場合には、既に表示されている矩形が消去され、新たな矩形入力として取り扱われる。
In the present embodiment, the user can change the rectangle by operating the mouse while the rectangle is displayed on the
一方、表示されている矩形の辺上にカーソルを位置させてマウスボタンが押されたときには、ステップS102およびステップS103を介してステップS104に進んだとき、ステップS104の判断結果が「YES」となり、ステップS111に進む。このステップS111において、CPU1は、マウスボタンが離されたか否かを判断し、肯定的な判断結果が得られるまで同判断を繰り返す。そして、マウスが離されてステップS111の判断結果が「YES」になると、CPU1は、ステップS104においてマウスによって指示されていることを確認した矩形の辺を、マウスのドラッグ量に応じて移動させ、この辺の移動後の矩形を表示部3に表示する(ステップS112)。そして、処理はステップS110に進み、CPU1は、表示された矩形の縦辺に相当する振幅域と横辺に相当する周波数帯域幅を求め、ノート情報の抽出対象となる領域を特定するパラメータとして設定し(ステップS110)、処理をステップS102に戻す。
On the other hand, when the cursor is positioned on the side of the displayed rectangle and the mouse button is pressed, when the process proceeds to step S104 via step S102 and step S103, the determination result in step S104 is “YES”. Proceed to step S111. In step S111, the
以上のようにして、矩形の縦辺に相当する振幅域と、矩形の横辺に相当する周波数帯域が設定されると、図5に示すルーチンの実行が可能な状態となる。そして、ユーザが操作部4の操作により、シーケンスデータの生成の指示を入力すると、CPU1は、図5に示すルーチンを実行する。このルーチンでは、オーディオストリームデータをフレーム単位で処理してノートイベントを含むシーケンスデータを生成する。まず、CPU1は、初期化処理を実行し、ノートオンフラグNONを“0”に、フレームカウンタFCNTを「0」に、ノートオン期間カウンタNLを「0」に設定する(ステップS201)。ここで、ノートオンフラグNONは、現在処理しているフレームがノートオン期間(楽音の発音期間)のものかノートオフ期間のものかを示すフラグであり、ノートオン期間は“1”、ノートオフ期間は“0”とされる。また、フレームカウンタFCNTは、オーディオストリームデータのフレーム単位での処理を進める際に処理したフレーム数を計数するカウンタである。このカウンタのカウント値は、オーディオストリームデータの開始点を基準とした時刻情報として用いられる。ノートオン期間カウンタNLは、ノートオン期間が始まってから終了するまでのフレーム数を計数するカウンタである。
When the amplitude range corresponding to the vertical side of the rectangle and the frequency band corresponding to the horizontal side of the rectangle are set as described above, the routine shown in FIG. 5 can be executed. When the user inputs an instruction to generate sequence data by operating the operation unit 4, the
ステップS201の初期化処理が終了すると、CPU1は、RAM7のワークエリアから1フレーム分のオーディオストリームデータを読み出し、そのフレームについて図2における窓掛け11、FFT12およびパワースペクトル表示13の各処理を実行する(ステップS202)。次にCPU1は、FFT12により得られたパワースペクトルのピークの中に、現在設定されている矩形領域の周波数帯域および振幅域に収まるものがあるか否かを判断する(ステップS203)。この判断結果が「NO」である場合、CPU1は、ノートオンフラグNONが“0”であるか否かを判断する(ステップS204)。そして、ステップS204の判断結果が「YES」である場合、CPU1は、フレームカウンタFCNTを「1」だけ増加させる(ステップS210)。次にCPU1は、現在のフレームが処理対象であるオーディオストリームデータの最後のフレームか否かを判断し(ステップS211)、この判断結果が「NO」である場合には処理をステップS202に戻す。以後、ステップS202、S203、S204、S210、S211の各処理が繰り返される。
When the initialization process of step S201 is completed, the
この間、ステップS202の処理対象となるフレームが楽曲のノートオフ期間に属するものからノートオン期間に属するものに移行してゆくと、ステップS202において得られるパワースペクトルの振幅が大きくなってゆく。そして、ステップS202において得られるパワースペクトルのピークが現在設定されている矩形領域内に入ると、ステップS203の判断結果が「YES」になり、CPU1の処理はステップS207に進む。このステップS207においてCPU1は、ノートオンフラグNONが“1”か否かを判断する。この判断結果が「NO」である場合、すなわち、ノートオフ期間からノートオン期間への切り換わりがあった場合には、CPU1は、ノートオンフラグNONを“1”とし、その時点におけるフレームカウンタFCNTのカウント値をノートオン開始時刻データFSとして保存し、ノートオン期間カウンタNLを「0」に初期化する(ステップS208)。次にCPU1は、ノートオン期間カウンタNLを「1」だけ増加させ(ステップS209)、上述したステップS210およびS211を順次実行し、ステップS211の判断結果が「NO」である場合には処理をステップS202に戻す。
In the meantime, when the frame to be processed in step S202 shifts from that belonging to the note-off period to that belonging to the note-on period, the amplitude of the power spectrum obtained in step S202 increases. When the peak of the power spectrum obtained in step S202 falls within the currently set rectangular area, the determination result in step S203 is “YES”, and the process of the
この結果、処理はステップS202およびS203を介してステップS207に進む。このとき、ノートオンフラグNONは“1”となっているため、ステップS207の判断結果は「YES」となる。従って、CPU1は、ステップS209、S210およびS211を順次実行し、ステップS211の判断結果が「NO」である場合には処理をステップS202に戻す。以後、ステップS202、S203、S207、S209、S210、S211の各処理が繰り返される。
As a result, the process proceeds to step S207 via steps S202 and S203. At this time, since the note-on flag NON is “1”, the determination result in step S207 is “YES”. Therefore, the
この間、ステップS202の処理対象となるフレームが楽曲のノートオン期間に属するものからノートオフ期間に属するものに移行してゆくと、ステップS202において得られるパワースペクトルの振幅が小さくなってゆく。そして、ステップS202において得られるパワースペクトルのピークが現在設定されている矩形領域外に出ると、ステップS203の判断結果が「NO」になり、CPU1の処理はステップS204に進む。このステップS204においてCPU1は、ノートオンフラグNONが“0”か否かを判断する。このときノートオンフラグNONは“1”となっているため、ステップS204の判断結果は「NO」となり、CPU1の処理はステップS205に進む。このステップS205においてCPU1は、ノートオンフラグNONを“0”とする。次にステップS206に進み、CPU1は、その時点におけるノートオン開始時刻データFSおよびノートオン期間カウンタNLをノート情報としてRAM7内に設定されたシーケンスデータの格納エリアに格納する(ステップS206)。次にCPU1は、ステップS210およびS211を順次実行し、ステップS211の判断結果が「NO」である場合には処理をステップS202に戻す。
以後、同様の動作が繰り返され、ステップS211の判断結果が「YES」となったときこのルーチンは終了する。
In the meantime, when the frame to be processed in step S202 shifts from that belonging to the note-on period to that belonging to the note-off period, the amplitude of the power spectrum obtained in step S202 decreases. If the peak of the power spectrum obtained in step S202 goes outside the currently set rectangular area, the determination result in step S203 is “NO”, and the process of the
Thereafter, the same operation is repeated, and this routine ends when the determination result in step S211 is "YES".
以上の処理により、ノート情報を時系列的に並べたシーケンスデータがRAM7内に得られる。このシーケンスデータは元のオーディオストリームデータと共に携帯電話などの楽曲再生機能を持った電子機器のユーザに供給され、オーディオストリームデータは楽曲の再生に、シーケンスデータはLEDやバイブレータの駆動制御に用いられる。オーディオデータおよびシーケンスデータは、I/F群5の中の適切な装置により記憶媒体に格納してユーザに供給してもよいし、I/F群5の中の適切な装置を介してネットワーク内のサーバに送信し、そこからユーザに配信するようにしてもよい。
Through the above processing, sequence data in which note information is arranged in time series is obtained in the
以上のように、本実施形態によれば、周波数解析によりオーディオストリームデータのパワースペクトルを求め、指定された周波数帯域および振幅域内にパワースペクトルのピークが収まる期間を検出し、この検出結果に基づいてシーケンスデータを生成するようにしたので、打楽器演奏音など音高の変化が明確でない楽音の発音タイミングを示すシーケンスデータをオーディオストリームデータから生成することができる。また、本実施形態によれば、周波数解析により求めたパワースペクトルを、横軸を周波数、縦軸を振幅として表示し、この表示画面上において所望の周波数帯域および振幅域をマウスなどのポインティングデバイスにより指定させるようにしたので、ユーザは、所望の楽音の種類に特有な特徴的なパワースペクトルの発生する周波数帯域および振幅域を見つけ、その領域を簡単な操作により指定することができる。 As described above, according to the present embodiment, the power spectrum of the audio stream data is obtained by frequency analysis, the period during which the peak of the power spectrum falls within the designated frequency band and amplitude range is detected, and based on this detection result Since the sequence data is generated, it is possible to generate sequence data indicating the tone generation timing of a musical tone whose pitch change is not clear, such as a percussion instrument performance sound, from the audio stream data. Further, according to the present embodiment, the power spectrum obtained by frequency analysis is displayed with the horizontal axis as frequency and the vertical axis as amplitude, and a desired frequency band and amplitude range are displayed on this display screen by a pointing device such as a mouse. Since the designation is made, the user can find a frequency band and an amplitude range in which a characteristic power spectrum peculiar to the type of desired musical sound is generated, and can designate the range by a simple operation.
以上、この発明の一実施形態について説明したが、この発明にはこれ以外にも他の実施形態が考えられる。例えば次の通りである。
(1)上記実施形態では、マウスの操作により矩形領域をユーザに指定させたため、振幅域の上限および下限の両方が得られ、パワースペクトルのピークが指定された周波数帯域内にあり、かつ、振幅域の上限および下限の間に収まっている期間を検出した。しかし、振幅域の上限は無視し、パワースペクトルのピークが指定された周波数帯域内にあり、かつ、振幅域の下限以上である期間を検出し、これを楽音の発音期間として扱ってもよい。
Although one embodiment of the present invention has been described above, other embodiments are possible for the present invention. For example:
(1) In the above embodiment, since the rectangular area is designated by the user by operating the mouse, both the upper limit and the lower limit of the amplitude area are obtained, the peak of the power spectrum is within the specified frequency band, and the amplitude A period that falls between the upper and lower limits of the range was detected. However, the upper limit of the amplitude range may be ignored, and a period in which the peak of the power spectrum is within the specified frequency band and is equal to or greater than the lower limit of the amplitude range may be detected and treated as a tone generation period.
(2)上記実施形態では、楽音の発音開始時刻を示す情報と発音の持続時間を示す情報を含むシーケンスデータを生成したが、楽音の発音開始時刻を示す情報を含み、発音の持続時間を示す情報を含まないシーケンスデータを生成してもよい。あるいは、シーケンスデータに従ってLEDやバイブレータの駆動を行う携帯電話などの電子機器において、シーケンスデータ中の楽音の発音開始時刻を示す情報のみを利用してLED等の駆動開始タイミングを制御し、駆動の持続時間は例えばユーザが操作子の操作により自由に設定するようにしてもよい。 (2) In the above embodiment, the sequence data including the information indicating the tone generation start time of the musical tone and the information indicating the duration of the pronunciation is generated. However, the sequence data includes the information indicating the pronunciation start time of the tone and indicates the duration of the pronunciation Sequence data that does not include information may be generated. Alternatively, in an electronic device such as a mobile phone that drives an LED or a vibrator according to sequence data, the drive start timing of the LED or the like is controlled by using only the information indicating the sound generation start time in the sequence data, and the drive is continued. For example, the user may freely set the time by operating the operator.
(3)上記実施形態において、窓掛け11、FFT12、パワースペクトル表示13の高速実行が可能な場合には、処理対象のオーディオストリームデータをサウンドシステム8に送って楽曲を再生させ、これに同期させて、オーディオストリームデータの各フレームについての窓掛け11、FFT12、パワースペクトル表示13を順次実行させるようにしてもよい。この態様によれば、ユーザは、サウンドシステム8により再生される楽曲を聴き、例えばドラム音などの所望の楽音が発音されるのに合わせて大きく動く特徴的なパワースペクトルを発見し、矩形領域の指定を行うことができる。
(3) In the above embodiment, when the
(4)矩形領域の指定を行わせるために利用するオーディオストリームデータとシーケンスデータを生成するために利用するオーディオストリームデータは別のデータであってもよい。すなわち、矩形指定によるパラメータ設定14を容易に行わせるために、処理対象のオーディオストリームデータとは別に、ドラム音、シンバル音といった各種の楽音の単発音のオーディオストリームデータを用意する。そして、これらのうちユーザによって指定されたものについて窓掛け11、FFT12、パワースペクトル表示13および矩形指定によるパラメータ設定14を実行する。そして、矩形領域が定まった場合には、所望の楽曲のオーディオストリームデータを処理対象とし、窓掛け11、FFT12、パワースペクトル表示13、矩形内ピーク検出15および発音時間累算16の各処理を実行するのである。
(4) The audio stream data used for specifying the rectangular area and the audio stream data used for generating the sequence data may be different data. That is, in order to easily perform parameter setting 14 by specifying a rectangle, a single tone audio stream data of various musical sounds such as a drum sound and a cymbal sound is prepared separately from the audio stream data to be processed. Then, the
(5)上記実施形態では、1個の矩形領域を指定するようにしたが、矩形領域を複数指定することを認め、矩形領域毎に、パワースペクトルのピークが収まる期間の検出および検出結果に基づくシーケンスデータの生成を行うようにしてもよい。この態様によれば、複数種類の楽音を含む楽曲のオーディオストリームデータが処理対象となっており、かつ、楽音の種類により、特徴的なパワースペクトルの現れる周波数帯域が異なるような場合に、それらの楽音の種類毎に矩形領域を設定し、各楽音に対応したシーケンスデータを生成することができる。この場合において、シーケンスデータを利用する携帯電話等において、例えば第1の楽音のシーケンスデータにより赤色LEDの点滅制御を行い、第2の楽音のシーケンスデータにより青色LEDの点滅制御を行うようにしてもよい。
(6)窓掛け11およびFFT12は、CPU1がDSP(デジタル信号プロセッサ)などの他の装置に実行させるようにしてもよい。
(5) In the above embodiment, one rectangular area is specified. However, it is recognized that a plurality of rectangular areas are specified, and detection of a period in which the peak of the power spectrum falls within each rectangular area and based on the detection result. Sequence data may be generated. According to this aspect, when the audio stream data of a song including a plurality of types of musical sounds is a processing target and the frequency band in which a characteristic power spectrum appears varies depending on the types of musical sounds, A rectangular area can be set for each type of musical sound, and sequence data corresponding to each musical sound can be generated. In this case, in a cellular phone or the like using sequence data, for example, the blinking control of the red LED is performed by the sequence data of the first musical tone, and the blinking control of the blue LED is performed by the sequence data of the second musical tone. Good.
(6) The
1……CPU、2……ROM、3……表示部、4……操作部、5……I/F群、6……HDD、7……RAM、8……サウンドシステム、11……窓掛け、12……FFT、13……パワースペクトル表示、14……矩形指定によるパラメータ設定、15……矩形内ピーク検出、16……発音時間累算。 1 ... CPU, 2 ... ROM, 3 ... display unit, 4 ... operation unit, 5 ... I / F group, 6 ... HDD, 7 ... RAM, 8 ... sound system, 11 ... window Multiplication, 12... FFT, 13... Power spectrum display, 14... Parameter setting by rectangle specification, 15... Peak detection within rectangle, 16.
Claims (10)
ユーザが行う操作部の操作に従って周波数帯域および振幅域からなる領域を指定する範囲指定手段と、
前記範囲指定手段により指定された周波数帯域および振幅域からなる領域に前記周波数解析手段によって順次求められる周波数特性におけるパワースペクトルのピークが含まれる期間を検出し、この検出結果に基づき、楽音の発生タイミングを示すシーケンスデータを生成するシーケンスデータ生成手段と
を具備することを特徴とするシーケンスデータ生成装置。 Frequency analysis means for sequentially obtaining the frequency characteristics of each part from the start point to the end point of the audio stream data indicating the waveform of the music piece or a part thereof;
A range specifying means for specifying a region consisting of the frequency band and amplitude range according to operation of the operation unit performed by the user,
A period in which the peak of the power spectrum in the frequency characteristics sequentially obtained by the frequency analysis means is included in a region composed of the frequency band and the amplitude range designated by the range designation means is detected, and the generation timing of the musical sound is determined based on the detection result. And a sequence data generating means for generating sequence data representing the sequence data.
前記シーケンスデータ生成手段は、前記範囲指定手段により指定された周波数帯域および振幅域からなる領域に前記周波数解析手段によってフレーム毎に順次求められる周波数特性におけるパワースペクトルのピークが含まれるフレームを検出し、前記ピークが含まれるフレームをノートオン期間とすることにより、楽音の発生タイミングを示すシーケンスデータを生成することを特徴とする請求項1に記載のシーケンスデータ生成装置。The sequence data generating means detects a frame including a peak of a power spectrum in a frequency characteristic sequentially obtained for each frame by the frequency analyzing means in a region composed of a frequency band and an amplitude range specified by the range specifying means, The sequence data generating apparatus according to claim 1, wherein sequence data indicating a musical sound generation timing is generated by setting a frame including the peak as a note-on period.
前記シーケンスデータ生成手段は、前記範囲指定手段により周波数帯域および振幅域からなる領域が複数指定された場合に、前記領域毎に、前記周波数解析手段によって順次求められる周波数特性におけるパワースペクトルのピークが含まれる期間を検出し、この検出結果に基づき、各々楽音の発生タイミングを示す複数のシーケンスデータを生成することを特徴とする請求項1〜3のいずれか1の請求項に記載のシーケンスデータ生成装置。The sequence data generation means includes a peak of a power spectrum in the frequency characteristics sequentially obtained by the frequency analysis means for each area when a plurality of areas consisting of frequency bands and amplitude areas are designated by the range designation means. 4. The sequence data generation device according to claim 1, wherein a plurality of sequence data each indicating a tone generation timing is generated based on the detection result. .
前記範囲指定手段は、前記表示手段における前記パワースペクトルの表示画面上において前記周波数帯域および振幅域からなる領域を指定するポインティングデバイスを具備することを特徴とする請求項1〜4のいずれか1の請求項に記載のシーケンスデータ生成装置。5. The pointing device according to claim 1, wherein the range designating unit includes a pointing device that designates a region composed of the frequency band and the amplitude region on a display screen of the power spectrum in the display unit. The sequence data generation device according to claim.
前記表示手段が前記周波数解析手段により求められる第1のオーディオストリームデータの周波数特性におけるパワースペクトルを表示し、The display means displays a power spectrum in the frequency characteristics of the first audio stream data obtained by the frequency analysis means;
前記範囲指定手段がユーザが行う操作部の操作に従って前記表示手段における前記第1のオーディオストリームデータのパワースペクトルの表示画面上において前記周波数帯域および振幅域からなる領域を指定し、In accordance with the operation of the operation unit performed by the user by the range specifying unit, the region consisting of the frequency band and the amplitude region is specified on the display screen of the power spectrum of the first audio stream data in the display unit,
前記周波数解析手段が第2のオーディオストリームデータの開始点から終了点までの各部の周波数特性を順次求め、The frequency analysis means sequentially obtains the frequency characteristics of each part from the start point to the end point of the second audio stream data,
前記シーケンスデータ生成手段が、前記範囲指定手段により指定された周波数帯域および振幅域からなる領域に前記周波数解析手段によって順次求められる前記第2のオーディオストリームデータの周波数特性におけるパワースペクトルのピークが含まれる期間を検出し、この検出結果に基づき、楽音の発生タイミングを示すシーケンスデータを生成することを特徴とする請求項5〜7のいずれか1の請求項に記載のシーケンスデータ生成装置。The sequence data generating means includes a peak of the power spectrum in the frequency characteristic of the second audio stream data sequentially obtained by the frequency analyzing means in the region consisting of the frequency band and the amplitude range designated by the range designating means. 8. The sequence data generating apparatus according to claim 5, wherein a period is detected, and sequence data indicating a musical sound generation timing is generated based on the detection result.
前記再生手段によるオーディオストリームデータの再生に同期して、前記周波数解析手段は、前記オーディオストリームデータの周波数特性を求め、前記表示手段は、前記周波数特性におけるパワースペクトルを表示することを特徴とする請求項1〜8のいずれか1の請求項に記載のシーケンスデータ生成装置。The frequency analysis means obtains a frequency characteristic of the audio stream data in synchronization with the reproduction of the audio stream data by the reproduction means, and the display means displays a power spectrum in the frequency characteristic. The sequence data generation device according to any one of claims 1 to 8.
楽曲またはその一部の波形を示すオーディオストリームデータの開始点から終了点までの各部の周波数特性を順次求める周波数解析手段と、Frequency analysis means for sequentially obtaining frequency characteristics of each part from the start point to the end point of the audio stream data indicating the waveform of the music piece or a part thereof;
ユーザが行う操作部の操作に従って周波数帯域および振幅域からなる領域を指定する範囲指定手段と、A range specifying means for specifying a region composed of a frequency band and an amplitude region according to an operation of the operation unit performed by the user;
前記範囲指定手段により指定された周波数帯域および振幅域からなる領域に前記周波数解析手段によって順次求められる周波数特性におけるパワースペクトルのピークが含まれる期間を検出し、この検出結果に基づき、楽音の発生タイミングを示すシーケンスデータを生成するシーケンスデータ生成手段として機能させることを特徴とするシーケンスデータ生成プログラム。A period in which the peak of the power spectrum in the frequency characteristics sequentially obtained by the frequency analysis means is included in a region composed of the frequency band and the amplitude range designated by the range designation means is detected, and the generation timing of the musical sound is determined based on the detection result. A sequence data generation program that functions as a sequence data generation unit that generates sequence data indicating
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005242208A JP4665664B2 (en) | 2005-08-24 | 2005-08-24 | Sequence data generation apparatus and sequence data generation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005242208A JP4665664B2 (en) | 2005-08-24 | 2005-08-24 | Sequence data generation apparatus and sequence data generation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007057751A JP2007057751A (en) | 2007-03-08 |
JP4665664B2 true JP4665664B2 (en) | 2011-04-06 |
Family
ID=37921329
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005242208A Expired - Fee Related JP4665664B2 (en) | 2005-08-24 | 2005-08-24 | Sequence data generation apparatus and sequence data generation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4665664B2 (en) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05161619A (en) * | 1991-12-17 | 1993-06-29 | Sharp Corp | Portable electrocardiograph |
JPH10232915A (en) * | 1997-02-19 | 1998-09-02 | Canon Inc | Image processor and its method |
JPH10247099A (en) * | 1997-03-05 | 1998-09-14 | Dainippon Printing Co Ltd | Sound signal coding method and sound recording/ reproducing device |
JP2000009760A (en) * | 1998-06-24 | 2000-01-14 | Sony Corp | Data display device and display method therefor |
JP2001238884A (en) * | 2000-02-29 | 2001-09-04 | Toshiba Corp | Method of quantitative analysis on aspect of tissue by ultrasound diagnostic equipment and ultrasound |
JP2002014122A (en) * | 2000-06-29 | 2002-01-18 | Anritsu Corp | Signal analyzer, and method of displaying marker |
JP2003005744A (en) * | 2001-06-20 | 2003-01-08 | Yamaha Corp | Method of extracting timing for playing |
JP2003140647A (en) * | 2001-08-17 | 2003-05-16 | Hewlett Packard Co <Hp> | Method of classifying musical piece including a plurality of tones |
JP2003228373A (en) * | 2002-02-04 | 2003-08-15 | Casio Comput Co Ltd | Device and method for spectrum setting |
JP2004234767A (en) * | 2003-01-31 | 2004-08-19 | Fujitsu Ten Ltd | Frequency spectrum display device |
JP2004347320A (en) * | 2003-05-15 | 2004-12-09 | Advantest Corp | Display and method for measuring and displaying signal |
JP2005099457A (en) * | 2003-09-25 | 2005-04-14 | Yamaha Corp | Waveform data editing device and waveform data editing program |
JP2005164766A (en) * | 2003-12-01 | 2005-06-23 | Fujitsu Ltd | Signal waveform generating device, noise removing device, signal waveform generating method, noise removing method, and signal waveform generating program |
-
2005
- 2005-08-24 JP JP2005242208A patent/JP4665664B2/en not_active Expired - Fee Related
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05161619A (en) * | 1991-12-17 | 1993-06-29 | Sharp Corp | Portable electrocardiograph |
JPH10232915A (en) * | 1997-02-19 | 1998-09-02 | Canon Inc | Image processor and its method |
JPH10247099A (en) * | 1997-03-05 | 1998-09-14 | Dainippon Printing Co Ltd | Sound signal coding method and sound recording/ reproducing device |
JP2000009760A (en) * | 1998-06-24 | 2000-01-14 | Sony Corp | Data display device and display method therefor |
JP2001238884A (en) * | 2000-02-29 | 2001-09-04 | Toshiba Corp | Method of quantitative analysis on aspect of tissue by ultrasound diagnostic equipment and ultrasound |
JP2002014122A (en) * | 2000-06-29 | 2002-01-18 | Anritsu Corp | Signal analyzer, and method of displaying marker |
JP2003005744A (en) * | 2001-06-20 | 2003-01-08 | Yamaha Corp | Method of extracting timing for playing |
JP2003140647A (en) * | 2001-08-17 | 2003-05-16 | Hewlett Packard Co <Hp> | Method of classifying musical piece including a plurality of tones |
JP2003228373A (en) * | 2002-02-04 | 2003-08-15 | Casio Comput Co Ltd | Device and method for spectrum setting |
JP2004234767A (en) * | 2003-01-31 | 2004-08-19 | Fujitsu Ten Ltd | Frequency spectrum display device |
JP2004347320A (en) * | 2003-05-15 | 2004-12-09 | Advantest Corp | Display and method for measuring and displaying signal |
JP2005099457A (en) * | 2003-09-25 | 2005-04-14 | Yamaha Corp | Waveform data editing device and waveform data editing program |
JP2005164766A (en) * | 2003-12-01 | 2005-06-23 | Fujitsu Ltd | Signal waveform generating device, noise removing device, signal waveform generating method, noise removing method, and signal waveform generating program |
Also Published As
Publication number | Publication date |
---|---|
JP2007057751A (en) | 2007-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10354627B2 (en) | Singing voice edit assistant method and singing voice edit assistant device | |
US6140565A (en) | Method of visualizing music system by combination of scenery picture and player icons | |
US9613635B2 (en) | Automated performance technology using audio waveform data | |
CN108140402B (en) | Method for dynamically modifying audio content theme | |
JP5333517B2 (en) | Data processing apparatus and program | |
WO2017028686A1 (en) | Information processing method, terminal device and computer storage medium | |
KR20080023199A (en) | Audio reproduction apparatus and method and storage medium | |
JP5724231B2 (en) | Electronic music apparatus and program | |
EP1845528A1 (en) | Music data processing apparatus and method | |
JP4665664B2 (en) | Sequence data generation apparatus and sequence data generation program | |
JP5510207B2 (en) | Music editing apparatus and program | |
JP5217275B2 (en) | Apparatus and program for producing music | |
JP3656507B2 (en) | Performance information editing device | |
JP5699558B2 (en) | Musical sound generating apparatus and program | |
JP2006113487A (en) | Method and device for producing musical sound data | |
JP4380720B2 (en) | Song editing apparatus and program | |
JP3972899B2 (en) | Music score display device | |
JP5742472B2 (en) | Data retrieval apparatus and program | |
JP4613924B2 (en) | Song editing apparatus and program | |
JP4305315B2 (en) | Automatic performance data characteristic changing device and program thereof | |
JP6390112B2 (en) | Music information processing apparatus, program, and method | |
JP2005249872A (en) | Device and method for setting music reproduction parameter | |
JP2003108119A (en) | Playing information display device and program | |
JP4093132B2 (en) | Effect type selection device and program | |
JP2010231027A (en) | Electronic musical device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080619 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100518 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100720 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101227 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140121 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4665664 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |