JP2005241717A - 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム - Google Patents

自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム Download PDF

Info

Publication number
JP2005241717A
JP2005241717A JP2004047809A JP2004047809A JP2005241717A JP 2005241717 A JP2005241717 A JP 2005241717A JP 2004047809 A JP2004047809 A JP 2004047809A JP 2004047809 A JP2004047809 A JP 2004047809A JP 2005241717 A JP2005241717 A JP 2005241717A
Authority
JP
Japan
Prior art keywords
model
sound
performance
power spectrum
volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004047809A
Other languages
English (en)
Other versions
JP4530199B2 (ja
Inventor
Ren Sumida
錬 澄田
Naoyuki Tanaka
直行 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kawai Musical Instrument Manufacturing Co Ltd
Original Assignee
Kawai Musical Instrument Manufacturing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawai Musical Instrument Manufacturing Co Ltd filed Critical Kawai Musical Instrument Manufacturing Co Ltd
Priority to JP2004047809A priority Critical patent/JP4530199B2/ja
Priority to PCT/JP2005/002244 priority patent/WO2005081222A1/ja
Publication of JP2005241717A publication Critical patent/JP2005241717A/ja
Application granted granted Critical
Publication of JP4530199B2 publication Critical patent/JP4530199B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

【課題】自然楽器の演奏において演奏指手段の指示どおりの操作がなされたかどうかを判定するためのモデルを誤りなく作成できるようにすること。
【解決手段】モデル作成時に自然楽器を実際に弾くことにより発生された演奏音を、マイクロフォン10、A/D変換器6を通してレベル調整して取り込む。アタック検出13は、取り込んだ込んだ演奏音をレベル調整された演奏音の音量および該レベル調整状態で取り込んだノイズの音量に基づいて設定した閾値と比較してアタックを検出する。スペクトル作成部12は、アタックを検出したときの演奏音のパワースペクトルをモデルとして記憶する。無音状態を検出してから次のモデル作成に移る。また、アクション音やノイズやDC成分の影響をモデルから取り除く。
【選択図】図1

Description

本発明は、自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラムに関し、特に、自然楽器の演奏において演奏指示手段の指示どおりの操作がなされたかどうかを判定するためのモデルを誤りなく作成することができる自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラムに関する。
従来、鍵盤楽器の演奏を独習するための押鍵指示手段を有する電子楽器が知られている。例えば、下記特許文献1には、予め記憶された演奏情報を表示回路に順次読み出し、鍵盤の各鍵に対応して設けた表示ランプをこの演奏情報に従って付勢することにより押鍵指示を行い、演奏者が押鍵した鍵の音高をキースキャン回路で検出し、この音高が表示ランプで指示した演奏情報の音高と一致した場合に次の演奏情報を表示回路に読み出すようにした押鍵指示手段を備えた電子楽器が記載されている。
下記特許文献1に従う押鍵指示は、キースキャン回路を備えた電子楽器では容易に実現できるが、キースキャン回路を持たないアコースティックピアノのような自然楽器では実現が困難である。自然楽器にキースキャン回路を設けることも考えられるが、キースキャン回路に必要なキースイッチや表示ランプを鍵ごとに後付けする作業が繁雑であり、手軽に行うことはできない。
自然楽器においても押鍵指示などの演奏指示を可能にするため、本出願人は、マイクロフォンから各音高の単音を取り込んで予め各単音のパワースペクトルをモデルとして作成して記憶させておき、レッスン時に演奏指示に従って次に弾くべき音のモデルを読み出し、これとマイクロフォンで取り込んだ演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進めるという自然楽器の楽音判定装置を特願2003−134372号(先願)で提案した。
この装置は、自然楽器を実際に弾いて作成したモデルとレッスン時の演奏音とを比較するものであるため、演奏音のピッチなどのパラメータを検出する必要がなく、非常に簡単な計算で、また、自然楽器の調律がずれている場合でも全く問題なく確実に、モデルとレッスン時の演奏音との一致を検出できるという特徴を持つが、実際に自然楽器を弾いて各音高の単音のパワースペクトルをモデルとして予め誤りなく作成し、記憶させておく必要がある。
特公平2−705号公報
上記先願では、モデルとレッスン時の演奏音のパワースペクトルはできるだけ早い段階で一致検出することが望ましいので、モデル作成時に押鍵後の演奏音のアタックを検出し、アタック検出時点のパワースペクトルをモデルとして記憶する。アタックは、音量または振幅が、予想されるノイズの音量または振幅以上に閾値を超過したことで検出され、単に閾値を超過した音量または振幅が入力されればアタックが検出されてモデルが作成される。
しかしながら、演奏者は鍵によっていろいろな強さで押鍵する可能性があり、このように押鍵強さが各鍵で異なって発生された演奏音を基にモデルを作成することは好ましくない。また、レッスン時、次に弾くべき音が和音の場合には和音を構成する単音のモデルを合成してモデルとするが、ピアノの場合には同じ強さで押鍵しても音域によって音量が大きく異なるため、モデル合成時に各単音の音量を正規化して合成することは適当でない。以上のことから、モデル作成時には演奏者に各鍵を同じ強さで弾いてもらうようにして、それにより発生された演奏音を基にモデルを作成し、和音の場合には各単音のモデルをそのまま合成し、合成後に全体として正規化して使用できるようにする工夫が必要である。
また、アタック検出は入力されるデジタル信号の音量または振幅の影響を受けるため、入力される演奏音のレベルが適正に設定される必要がある。さらに、同じ強さで弾いた場合でも音域(音高)によって発生される音量に大きな差があるので、単純に音量最大値が同じ位になるようにガイドしたのでは同じ強さで弾いてもらうことはできない。また、モデル作成時に余り強く押鍵すると、高次倍音の成分が強く出てしまい、これにより作成されたモデルとレッスン時の演奏音のパワースペクトルの一致検出が難しくなってしまう。そのため、モデル作成時には普通の強さか、やや弱めに押鍵してもらうことが望ましい。
また、モデル作成時には、モデルを作成する音域の鍵を次々と押鍵してそれぞれの単音のモデルを作成して記憶していくが、余り早く次の鍵を押鍵すると前の演奏音の残響がまだ残っているため余分な周波数成分が含まれてしまい、押鍵した鍵に対応する本来のモデルが作成されないという問題がある。そうすると、レッスン時に正しい鍵を押鍵してもモデルとの一致が得られなくなってしまう。十分に残響がなくなるまで待って次の鍵のモデル作成を開始させることによりこの不都合をなくすことができるが、単音ごとに必要以上に十分な時間を費やすことは無駄であり、広い音域のモデルを作成する場合には多大に時間を要することになる。また、どの時点で次の鍵を押鍵してモデル作成に入っていいかはっきりしない。
また、上述の各音高の単音のパワースペクトルをモデルとして作成するとき、マイクロフォンからの入力音にはピアノの音以外にピアノのアクション音も含まれてしまう。モデルとレッスン時の演奏音のパワースペクトルを比較する際にはフーリエ変換(FFT)を行うが、このアクション音のパワースペクトルは、FFTで得られたモデルおよびレッスン時の演奏音のパワースペクトルの低音部に入っている。
高音の鍵の場合には本来のピアノ音である弦の振動音よりもアクション音のパワースペクトルの方が強く出るため、モデルとレッスン時の演奏音とを比較すると、アクション音のパワースペクトルの一致が比較的大きく評価されてしまう。このアクション音がモデルとレッスン時の演奏音の含まれることにより両者の正しい一致が得られず不都合であるため、何らかの工夫が必要である。
アクション音が評価されないようにするには、アクション音を取り除けばよい。しかし、アクション音はアクション部分から発せられるノイズのようなものであり、そのパワースペクトルは毎回異なるためアクション音のみを選択して取り除くことは困難である。
また、モデルとレッスン時の演奏音のパワースペクトルの比較の前処理としてパワースペクトルの正規化を行うが、単純にパワースペクトルを音量で正規化すると外部環境によるノイズなども正規化されてしまい、特に弱く弾いた音を正規化した場合、ノイズ成分を大きく持ち上げてしまう結果になる。従って、このようなノイズがモデルやレッスン時の演奏音に含まれていても両者の正しい一致が得られない。
また、パワースペクトルを作成するためにFFTを行うと、パワースペクトルにDC(直流)成分が現れる。そのようなDC成分がモデルやレッスン時の演奏音のパワースペクトルに含まれていても、モデルとレッスン時の演奏音のパワースペクトルの正しい一致が得られない。
さらに、モデルとレッスン時の演奏音のパワースペクトルの比較に当たってパワースペクトルの正規化のために音量を測定する場合、DC成分の影響で音量を正しく測定できない。A/D変換前のアナログ信号にのっているDCのオフセットは、A/D変換後のデジタル信号にものってしまうため、波形の振幅から音量を求めようとするとDCのオフセットによって音量を正しく測定できない。
従って、モデルとレッスン時の演奏音のパワースペクトルの比較を正しく行うにはノイズ成分やDC成分の影響も受けないようにする工夫も必要である。
本発明の目的は、自然楽器の演奏において演奏指示手段の指示どおりの操作がなされたかどうかを判定するためのモデルを誤りなく作成できるようにすることにある。
上記の課題を解決するため、本発明は、モデル作成時に自然楽器を実際に弾くことにより発生された演奏音をレベル調整して取り込み、取り込んだ演奏音をレベル調整された演奏音の音量および該レベル調整状態で取り込んだノイズの音量に基づいて設定した閾値と比較してアタックを検出し、アタックを検出したときの演奏音のパワースペクトルを算出してモデルとして記憶する点に特徴がある。
また、本発明は、モデル作成時に自然楽器を実際に弾くことにより発生された演奏音の音量を閾値と比較し、演奏音の音量が閾値を一定時間継続的に下回ったとき無音状態と判断して次のモデル作成に移る点に特徴がある。
また、本発明は、モデル作成時に自然楽器を実際に弾くことにより発生された演奏音を取り込み、取り込んだ演奏音のパワースペクトルを求め、モデルを作成しようとする音高の基本周波数より低い周波数成分をカットしたパワースペクトルをモデルとして記憶する点に特徴がある。
また、本発明は、モデル作成時に自然楽器を演奏しない状態で取り込んだ音のパワースペクトルを求め、そのパワースペクトル中でパワー最大のスペクトルのパワー値をノイズ基準値とし、このノイズ基準値以下をカットした演奏音のパワースペクトルをモデルとして記憶する点に特徴がある。
さらに、本発明は、モデル作成時に自然楽器を実際に弾くことにより発生された演奏音を取り込み、該演奏音のパワースペクトルを求め、該パワースペクトル中の最も低い周波数付近の成分をカットしたパワースペクトルをモデルとして記憶する点に特徴がある。
なお、上記の特徴、つまりアタック検出、無音検出、アクション音やノイズやDC成分除去の技術は適宜組み合わせて採用することができ、また、本発明は装置あるいはプログラムとして構成することができる。
本発明の特徴によれば、モデル作成時に演奏音の音量を適当に調整できるとともに、レベル調整されて入力された演奏音のアタックを良好に検出でき、演奏音の音量が適当でなければその旨のメッセージを送出してほぼ一定の強さで弾くように促すことができるので、誤りのないモデルを作成することができる。
また、無音状態を検出して次のモデル作成に進ませることにより、先のモデル作成での演奏音の残響の影響をなくすことができるとともに、安心して次々とモデルを作成することができる。
さらに、モデル作成時にモデルの基本周波数以下のパワースペクトルを取り除いたり、モデルとするパワースペクトルの中からノイズのパワー最大値よりも低いパワーのパワースペクトルを取り除いたり、演奏音のパワースペクトルにおいて最も低い周波数付近の成分やDC成分を取り除くことにより、アクション音やノイズやDC成分の影響がモデルに出ないようにすることができる。
図1は、本発明が適用される楽音判定装置のブロック図であり、アコースティックピアノ(以下、特に電子ピアノと区別しない場合は、単に「ピアノ」と呼ぶ)の楽音判定装置として構成された例である。
図1に示す楽音判定装置は、CPU1、ROM2、RAM3、音源装置4、スピーカ5、A/D変換器6、入力装置(キーボードやマウス)7、および表示装置8を含むパーソナルコンピュータで要部を構成することができる。表示装置8としては液晶ディスプレイやブラウン管等、パーソナルコンピュータの処理結果を表示するための周知の表示手段を使用することができる。パーソナルコンピュータには外部記憶装置9が接続され、かつA/D変換器6を介してマイクロフォン10が接続される。マイクロフォン10はピアノPの発生音を取り込むために設けられるものであり、ピアノP内に配置されるのが望ましい。
CPU1は、音量測定部11、スペクトル作成部12,アタック検出部13、スペクトル比較部14、および押鍵指示部15を要部機能として備える。すなわち、音量測定部11、スペクトル作成部12,アタック検出部13、スペクトル比較部14、および押鍵指示部15はソフトウエアとして構成されている。もちろん、これらの部分はハードウエアでも構成できる。
音量測定部11は、マイクロフォン10から入力された音のレベル(音量)を検出する。スペクトル作成部12は、マイクロフォン10およびA/D変換器6を通じて入力されたデジタル楽音信号からパワースペクトルを得るFFT(フーリエ変換)機能を有する。FFTによって得られたパワースペクトルはRAM3に記憶される。
アタック検出部13は、検出されたパワースペクトルに基づいてアタックを検出する。スペクトル比較部14はモデル作成フェーズおよびレッスンフェーズにおいてスペクトル作成部12でそれぞれ作成されたパワースペクトルの距離を比較して演奏が押鍵指示どおり行われたかどうかを判断する。モデル作成フェーズ、レッスンフェーズについては後で詳細に説明する。
押鍵指示部15は、演奏情報に従う押鍵指示を表示装置8で表示するための表示データを作成する。表示データは入力装置7から入力される演奏開始指示に応答して作成開始され表示装置8に入力される。
楽音判定装置における処理は、演奏者がピアノPを実際に弾くことにより発生される演奏音に従って各音高の単音のモデルを作成するモデル作成フェーズと、演奏者のレッスン演奏に従って入力される演奏音とモデルとを比較して一致を判定し、その判定結果に従ってレッスンを進めるレッスンフェーズとに分けられる。以下では、モデル作成フェーズで発生される演奏音を、特に「モデル作成演奏音」と称することにする。
モデル作成フェーズでは、まず、アコースティックピアノPの各音高の鍵を1音ずつ演奏者に押鍵してもらい、発生されるモデル作成演奏音をマイクロフォン10から取り込む。それにより入力されたアナログ信号をA/D変換器6でデジタル信号に変換し、デジタル信号の音量を音量測定部11で測定する。アタック検出部13は、音量測定部11で測定された音量から音の立ち上がり(アタック)を検出する。
アタックが検出されたとき、スペクトル作成部12は、デジタル信号をFFTしてパワースペクトルを作成する。スペクトル作成部12で作成されたパワースペクトルは、押鍵された鍵の音高の単音のモデルとしてRAM3または外部記憶装置9に記憶される。
レッスンフェーズでは、RAM3または外部記憶装置9に記憶された楽曲の演奏情報を読み出し、その楽曲の先頭の楽音の押鍵指示を表示装置8で表示する。同時に、楽曲の先頭の楽音のモデルをRAM3または外部記憶装置9から読み出す。表示装置8に表示された押鍵指示に従ってピアノPで押鍵された音をマイクロフォン10から取り込む。マイクロフォン10を通して入力されたアナログ信号をA/D変換器6でデジタル信号に変換し、デジタル信号の音量を音量測定部11で測定する。
スペクトル作成部12は、音量測定部11で測定された音量が閾値以上であるならばデジタル信号をFFTしてパワースペクトルを作成する。アタック検出部13は、スペクトル作成部12で作成されたパワースペクトルから音の立ち上がりのアタックを検出する。アタックが一度でも検出されたならば、スペクトル比較部14は、FFTにより求められたパワースペクトルを読み出されたモデルと比較し、両者が一致した場合には表示装置8の押鍵指示を次の楽音に進める。
なお、比較に際し、押鍵が単音の場合には単音のモデルをそのまま使用できるが、和音の場合には単音モデルを合成してパワースペクトルを比較するようにすればよい。以上の一連の動作を繰り返すことによりレッスンが進められる。
図2は、モデル作成フェーズのCPU1の処理を示すフローチャートである。モデル作成が指示されたとき、まず、楽曲あるいはレッスン(技量)レベルの選択を促す画面を表示装置8に表示し、演奏者に楽曲を選択してもらうか、レッスンレベルを選択してもらうかする(S1)。この選択に従ってモデル作成の音域を設定する(S2)。
楽曲が選択された場合には、その楽曲の演奏情報を走査し、例えば図3に示すように、それに含まれる音高を少なくとも含む音域をモデル作成の音域として自動的に設定する。選択された楽曲のレベルに応じてモデル作成の音域を自動的に設定するようにしてもよいし、選択された楽曲に出てくる音高を演奏者に示し、それらの音高を少なくとも含む音域を演奏者に指示させてモデル作成の音域を設定するようにしてもよい。
レッスンレベルが選択された場合には、選択されたレッスンレベルの楽曲に含まれる音域をモデル作成の音域として設定する。例えば図4に示すように、入門、初級、中級、上級に従って音域を広く設定する。モデル作成の音域を設定したら、モデル作成の最初の音高の音、例えばモデル作成の音域に含まれる最低音をセットする(S3)。
次に、モデル作成の音高の音に対応する鍵を表示装置8に表示した鍵盤に表示し、演奏者に押鍵を指示する(S4)。この際、押鍵指示した音高の音を音源4に発音するように指示してもよい。演奏者が指示された鍵を押鍵すると、ピアノPから発せられたモデル作成演奏音はマイクロフォン10により取り込まれる。S4で押鍵指示した音高の音をスピーカ5から発音させれば、ここでピアノPから発せられるモデル作成演奏音と聴き比べて押鍵の間違いを演奏者に気付かせることができる。
マイクロフォン10を通して入力されたアナログ信号をA/D変換器6でデジタル信号に変換し、その音量を音量測定部11で測定する。音量測定は離鍵指示まで継続して行う。音量測定部11で測定した音量が閾値を超えたらアタックとみなす(S5)。このアタック検出処理については後で詳細に説明する。スペクトル作成部12はデジテル信号をFFTしてパワースペクトルを作成し、音量測定部11はその音量を算出する(S6)。アタックが検出されたときのパワースペクトルと音量は、後で使用するのでバッファとしてのRAM3に一時的に保存する。
パワースペクトルが作成され、音量が算出されたら表示装置8に離鍵を促す指示を表示する(S7)。離鍵指示はスピーカ5による音もしくは音声の指示であってもよい。その後、次の処理に移るが、次の処理が先の音高の音の残響音で影響されないように、その前にピアノPが無音状態になっている必要あるので、離鍵指示後、音量測定部11で算出される音量が無音検出の閾値以下になるまで待つ(S8)。音量がこの閾値以下になれば実質的に無音状態と判断する。ピアノの場合にはかなりの残響音があるので、誤りなくモデルを作成するために無音検出は重要である。
無音状態になったと判断できたら、押鍵指示からこれまでの期間の音量の最大値または振幅の最大値が許容範囲内に入っているかどうかを判断する(S9)。ここで音量や振幅が許容範囲内に入っておらず、それが大きすぎると判断した場合には、例えば「もっと小さく弾いて下さい。」とメッセージを出し、逆にそれが小さすぎると判断された場合には「もっと大きく弾いて下さい。」とメッセージを出すなどしてからS4に戻り、演奏者に再度の押鍵を指示する。これは極端に強くまたは弱く押鍵された場合のパワースペクトルはモデルとしてふさわしくないからである。アタック検出時点の音量や振幅ではなく、押鍵指示からこれまでの期間の音量の最大値または振幅をチェックするのは、アタック検出時点の音量や振幅はピーク値ではなく、音量や振幅は通常、アタック検出後にピーク値となるからである。
押鍵指示からこれまでの期間の音量の最大値または振幅の最大値が許容範囲内に入っていると判断できたら、一時的に保存しておいたパワースペクトルと音量を押鍵された音高の音のモデルとしてRAM11に記憶する(S10)。
S1〜S10により単音のモデルが記憶され、以上の処理を順次、次々の音高の音について繰り返すことにより設定された音域内の単音のモデルを記憶することができるが、本実施形態では、外部環境によるノイズなどが発せられたとしても各音高の単音のモデルを正しく記憶できるように、同じ鍵を再度押鍵するように指示し、これにより得られたモデルが先に記憶したモデルと一致すればそれを正規のモデルとして残すようにしている。
以下に説明するS11〜S17がこの処理である。1回目の押鍵によるモデルをRAM3に記憶した後、演奏者にもう一度同じ鍵を押鍵するように指示する(S11)。この押鍵指示は、1回目と同様、表示装置8による表示あるいは音源4による発音、あるいは両者によって行ってもよい。次に、S10で記憶したモデルを読み出す(S12)。
演奏者の押鍵によるモデル作成演奏音はマイクロフォン10によって取り込まれる。マイクロフォン10を通して入力されたアナログ信号をA/D変換器6でデジタル信号に変換した後、その音量を音量測定部11で検出する(S13)。ある程度以上の音量が検出されたら、スペクトル作成部12でデジタル信号をFFTしてパワースペクトルを作成し、これを2回目のモデルとする(S14)。ある程度以上の音量が検出されて始めてパワースペクトルを作成することにより、無駄な処理をなくし、本装置がパーソナルコンピュータなどで構成された場合のCPUの負荷を減らすことができる。
2回目のモデルを作成したら、すでにアタックが検出されているかどうかをチェックする(S15)。最初はアタックは検出されていないので次のステップに進み、アタックを検出する(S16)。アタック検出は、音の立ち上がりを検出するものであり、例えば音量変化で検出する方法やパワースペクトルの各スペクトルのパワー増加分から検出する方法などで実行できる。
S16でアタックを検出できなかった場合、S13に戻って再度音量の検出からやり直す。また、アタックを検出できた場合には、S12で読み出したモデル(1回目のモデル)とS14で作成したモデル(2回目のモデル)との比較処理(S17)に移る。アタック検出(S16)は、同じ楽音の間は一度検出したら2度目以降は検出する必要はない。通常、アタックが検出されるのは音が立ち上がる瞬間のみであり、必ずしもアタック時の楽音のパワースペクトルと1回目のモデルとが一致するとは限らないからである。比較処理に際しては、1回目と2回目の押鍵による音量の違いをなくすために両者の音量が同じになるように正規化することが好ましい。
比較処理(S17)は、例えば1回目のモデルと比べて2回目のモデルに足りない不足分のパワースペクトルの合計を距離として算出し、これを所定の閾値と比較し、距離が閾値を超える場合には不一致と判断し、距離が閾値以下の場合には一致と判断する方法により実行できる。この方法は、ピアノなどのような残響が多く残る楽器には有効な方法である。このとき、距離が閾値以下の場合でも押鍵された鍵の楽音のパワースペクトルに構成音ごとの特徴が見つからない場合には不一致と判断するようにすることもできる。
S17で不一致と判断した場合、S4に戻って再度1回目のモデル作成からやり直す。この再度の処理で作成されたモデルは、先に記憶されたモデルに上書きされる。
S17で一致と判断すれば、S10でRAM3に記憶したモデルを正しいモデルとして残したままにしておく。次に、作成されたモデルの音がモデル作成の最終音かどうかを判断する(S18)。S2で設定された音域の最終音(最高音)ではないと判断すれば、例えば半音高い次の音高の音にするなどモデル作成演奏音を1つ進め(RAM3にセット)てS4に戻り(S19)、その音について同様の処理を繰り返す。また、S18で最終音と判断すれば、作成された全ての音高の音のモデルをRAM3または外部記憶装置9に保存し(S20)、モデル作成を終了する。
次に、アタック検出処理(S5)について説明する。アタック検出は、ノイズや入力信号レベルに応じた閾値に基づいて行う。モデルとレッスン時の演奏音のパワースペクトルはできるだけ早い段階で一致検出することが望ましいので、モデル作成時に押鍵後の演奏音のアタックを検出し、アタック検出時点のパワースペクトルをモデルとして記憶する。
アタック検出に際しては、まず最初に、ピアノPを弾いていない状態で余分な音を立てないようにして、音量測定部11で騒音(暗騒音)の音量を測定する。この測定時間は特に問題にならないが、例えば5秒程度でよく、余り長いと騒音が入り込む可能性が大きくなるので1秒程度でもよい。
音量測定部11は、A/D変換器3からの出力サンプルがN個たまるごとに下記式で音量を測定する。なお、Sはi番目の出力(振幅)を表す。
Figure 2005241717
サンプリング周波数が11025Hzの場合、Nの値は128程度が好ましく、この場合には約12msecごとに繰り返し音量が計算されることになる。上記式で求めた音量Pの例えば5秒間の最大値をノイズ音量の最大値PWNOISEとして保存する。
ノイズ音量の最大値PWNOISEが保存されたら、これにアタックとみなす音量PWATTACKを加算した値をアタック検出の音量閾値PWTHとする。つまり、ノイズ音量以上にある程度の音量が入力されたらピアノPが演奏されたと判断する。図5にPWNOISE、PWATTACKおよびPWTHの関係を示す。
以上で説明したアタック検出は、入力されるデジタル信号の音量または振幅の影響を受けるため、マイクロフォン1の入力レベルが適正に設定される必要がある。
図6は、マイクロフォン2とA/D変換器3の部分(図1)の詳細構成を示すブロック図である。マイクロフォン2の出力はマイクボリューム201に入力され、次にマイクアンプ202を経由してA/D変換器3に入力される。マイクボリューム202を調節することによってマイクの感度や入力音の音量に応じてA/D変換器3の入力信号レベルを変更することができる。楽音判定装置がパーソナルコンピュータに実装される場合などでは録音デバイスのミキサコントロールがこれに相当する。
ピアノPの演奏音をマイクロフォン2で取り込んでA/D変換器3に入力するとき、A/D変換後のデジタル信号がノイズに埋もれたり、クリップされないようにするために、モデル作成時に表示装置8にピークメータを表示する。
ピークメータは、例えば図7に示すように、点灯個数の振れ具合を変化(色変化)させてA/D変換後のデジタル信号の一定時間ごとの振幅の最大値を表示し、その最大値が0のときには1つも点灯しない表示になる。また、その最大値がデジタル信号の量子化ビット数によって決まる振幅の最大値もしくはその半分程度になったとき全てが点灯する表示になる。
ピアノPを強めに弾いたときに、上記のように設定されたピークメータの7〜8割程度が点灯するようにマイクボリューム201を調節すれば、ノイズに埋もれたり、クリップされたりしない適切な入力信号レベルにすることができる。なお、この調節の際に弾く鍵は高音域より中音域や低音域の方が適している。中音域や低音域の方が適正な音量が得られるからである。また、振幅の最大値を更新っする一定時間間隔は、10〜50msec程度が適当である。余り速すぎるとピークメータの動きに目が追いつかないし、余り遅すぎると瞬間的な音量の変化が表示されなくなってしまうからである。
アタックとみなす音量PWATTACKは、マイク入力レベルを適正に設定するために表示したピークメータの振れ具合に応じて変える。マイクボリューム201の調節によってピークメータの7〜8割程度が振れるようにできれば問題はないが、マイクロフォン2の感度が低いため、マイクボリューム201を最大限にしてもピークメータが余る振れないような場合には、7〜8割程度が振れるようにした場合と同じ閾値では、思いっきり強く弾いてもアタックが検出されなかったり、かなり強く弾かないとアタックが検出されなかったりする。また、ピアノのような楽器では余り強く弾くと高い倍音が強く出るため、強く弾いてモデルを作成すると、レッスン時にも同じように強く弾かないと一致が得られなくなってしまう。
ピークメータは、音量PとしてA/D変換後のデジタル波形の振幅の平均値を表示しているので、ピークメータが半分しか振れない場合にはアタックとみなす音量PWATTACKも半分程度にすればよい。つまり、通常(強めに弾いたときにピークメータが7〜8割程度振れる)時のアタックとみなす音量PWATTACKが100位で丁度よいことが実験的に分かっているとき、ピークメータがその半分位しか振れないときにはアタックとみなす音量PWATTACKも半分の50位にすればよい。
次に、音量(振幅)チェック処理(S9)で用いられる音量最大値許容範囲の設定について説明する。図8は、あるピアノを最低音の音高(ノートナンバ)21から最高音のノートナンバ108までの88鍵を、ほぼ同じ強さで弾いたときの音高対音量最大値の特性を示す。なお、音量最大値とは各鍵を弾いたときに上記式により算出される音量Pの最大値のことである。同図にみられるように、同じ強さで弾いた場合でも音域(音高)によって音量値に大きな差があることが分かる。特に最高音に近い音域では非常に小さい音量最大値しか得られない。このように音域によって音量最大値に大きな差があるため、単純に音量最大値が同じ位になるようにガイドしたのでは同じ強さで弾いてもらうことはできない。
図8の音高対音量最大値の特性が予め分かっている場合にはこの特性に従って音量最大値の許容範囲を変化させればよいが、この特性は個々のピアノによって異なるし、マイクロフォンの特性によっても音域ごとの音量が異なってくるので、全ての装置に共通的な音量最大値許容範囲を予め設定しておくことはできない。
これは、以下のような方法で個々の装置において音量最大値許容範囲を設定することにより解決できる。ピアノによって個体差があり、マイクロフォンによって周波数特性が異なるが、アコースティックピアノで一般的なマイクロフォンを使う限り最高音あたりの音量が最も小さく、中音域あたりの音量はかなり大きいことに間違いない。そこで、予め最高音と中音域の1音(中央のドなど)をモデル作成にふさわしい普通の強さ、またはやや弱いタッチで弾いてもらい、そのときの音量最大値を保存しておく。
この2つの音量最大値にある程度の幅を持たせた範囲を音量最大値許容範囲とする。つまり、最高音の音量最大値をPWH、中音域の音量最大値をPWMとすると、入力された音の音量最大値がPWH×RからPWM/R′(R、R′は1.5程度の数値)の範囲に入っているかどうかをチェックし、入っていない場合には「もっと小さく弾いて下さい」や「もっと大きく弾いて下さい。」とメッセージを出すなどして、再度押鍵してもらうようにする。なお、RとR′は同じ値でも異なる値でもよい。
また、モデル作成にふさわしい普通の強さで弾くということが演奏者の主観が入って難しく、また同じ位の強さで弾くということが難しい場合には、最高音と中音域の1音を思いっきり強く弾いてもらって音量最大値を測定し、それを何分の一かにした音量を普通の強さで弾いたときの音量と類推し、この音量を基準値として音量最大値許容範囲を設定するようにしてもよい。ピアノの構造上、強い音といっても限界があるので、この方法により個人差のないデータを入力することができる。
また、モデル作成する音域の中の数カ所の音を弾いてもらい、それにより得られる音量最大値から音高対音量最大値の特性を作成し、この特性から音量最大値の許容範囲を決めることもできる。この場合も、標準の強さで弾いてもらうことが難しい場合には各鍵を思いっきり強く弾いてもらって音量最大値を測定し、それを何分の一かにした音量を音量最大値許容範囲の基準値とすることができる。
なお、各鍵の押鍵強さを判断するのに使う数量は、必ずしも音量最大値である必要はなく、A/D変換後のデジタル波形の振幅の最大値などでもよい。また、最大値ではなく平均値を使うこともできる。
次に、離鍵指示(S7)と無音検出処理(S8)について説明する。図9は、モデル作成時に表示装置8に鍵盤を表示し、押鍵する鍵のみの色を変えて押鍵を指示する押鍵指示の例を示す。押鍵指示と同時に音源4に指示してスピーカ5から発音させるようにしてもよい。
押鍵指示に従って押鍵され、パワースペクトルを作成し、音量を算出したら、離鍵を指示する(S7)。離鍵指示は、押鍵指示の反対であり、表示装置8に表示した鍵の色を元に戻すか、または押鍵指示のときとは異なる色で表示し、以下に説明するように無音になったと判断したときに鍵の色を元に戻すことにより行う。なお、スピーカ5から発音させている場合にはその停止を音源4に指示する。
離鍵後も残響音が残っているので、次の音のモデル作成のための押鍵あるいは2回目の押鍵の前に残響音が消えるのを待つ(S8)。残響音の音量は、音量Pを求める上記式によって求めることができる。
図10は、アコースティックピアノにおいて最低音(ノートナンバ21)を押鍵してすぐに離鍵したときに得られた音量変化を示し、実測により得られたものである。同図のように、離鍵後の残響音は音量はアタック直後に著しく低下するが、その後は上下しながら徐々に減衰していくので、音量が単純に閾値PWTHを一度下回ったということで無音と判断すると、その後にまた音量が上がってしまう可能性がある。そこで、閾値PWTH以下になっても音量を追跡するとともに経過時間をカウントし、再び音量が閾値PWTHを上回ったら経過時間をクリアする。そして、閾値PWTH以下の経過時間が連続して例えば1秒になって初めて無音と判断する。
ここで用いる閾値PWTHは以下のようにして決定できる。モデル作成に先立ち、ノイズの音量を測定する。これは、演奏者に音を立てないように静かにしてもらってマイクロフォン10から1〜5秒程度の間の音を取り込み、上記式により音量を算出すればよい。これにより測定された音量の最大値をノイズ音量の最大値PWNOISEとする。閾値PWTHはノイズ音量の最大値PWNOISEに無音とみなす音量PWSILENTを加えたものとする。
無音とみなす音量PWSILENTは小さいほど無音に近い状態で判断できるが、音の減衰は時間が経過するほど減衰する音量の程度が減っていくので、余り小さくすると音量が閾値PWTH以下になるまでの時間が著しく長くなってしまうので、パワースペクトルに現れないくらいの音量まで低下したら無音と判断されるように設定するのがよい。
また、無音とみなす音量PWSILENTをA/D変換後のデジタル信号の振幅に応じて変えるようにしてもよい。例えばA/D変換後のデジタル信号の一定時間ごとの振幅のピークを図7に示すようなピークメータで表示するとき、通常(強めに弾いたときにピークメータが7〜8割振れる)時の無音とみなす音量PWSILENTが50位の値で丁度よいことが実験的に分かっているとき、ピークメータがその半分位しか振れないときには無音とみなす音量PWSILENTもその半分の25位にする。
図11(a)は、アコースティックピアノにおいてノートナンバ48(中央のドよりも1オクターブ低いドの音)を普通の強さで押鍵したときに得られた音量変化を示し、実測により得られたものである。なお、図11(b)は、その一部の拡大図である。同図のように、音量はアタック直後に著しく低下するが、その後は上下しながら徐々に減衰し、10秒前後でノイズと区別が付かない程度まで減衰する。低音になるほどこの減衰にかかる時間は長くなるが、次の音のモデル作成のための押鍵あるいは2回目の押鍵に早く入れるように、無音と判断できる程度に音量が減衰するのをできるだけ早く検知してその旨をガイドするのがよい。
図12〜図15はそれぞれ、実測により得られたアタック直後、アタックから約1.4秒後、アタックから約4.1秒後、アタックから約5.8秒後のパワースペクトルを示す。また、図16は、次のモデル作成音(ノートナンバ50)をやや弱く押鍵したときに得られたパワースペクトルを示す。
図12〜図15と図16を比較すれば、図11においてどの程度に音量が減衰すれば次のモデル作成が影響されないかが判断できる。この例の音域の場合、弱めに弾いても比較的大きなパワースペクトルが得られているので、アタックから1.4秒後や4.1秒後程度でも次のモデル作成への影響は殆どない。つまり無音とみなす音量PWSILENTは250〜750程度でも構わないことになるが、もっと小さくしてできるだけ無音に近い状態で次のモデル作成に移る方が望ましい。
一方、図17は、最高音(ノートナンバ108)を普通の強さで押鍵したときに得られた音量変化を示し、最高でも300程度の音量しか出ないのが分かる。この場合の無音とみなす音量PWSILENTをを250〜750程度としたのでは大きすぎる。図10と図16から、無音とみなす音量PWSILENTを全音域で同じとするならば、10〜75程度がふさわしいことが分かる。それより大きくては、最高音(ノートナンバ108)のように音量が出ない音域で少し弱めに押鍵してしまうと最大音量がPWNOISE+PWSILENTを下回ってしまうことがあり、それより小さくては、少し大きめのノイズが入ると無音と判断できない状況が生じるからである。
なお、図9の押鍵指示において黒丸印で示すように、モデル作成時に表示装置8に表示する鍵盤の中央「ド」などの鍵に目印表示Sを常時表示し、実際のピアノの鍵盤の中央「ド」の鍵にも同じ目印表示のシールSを貼っておくことなどにより両鍵盤の対応を分かりやすくできる。また、通常、実際のピアノの鍵盤上側部にはメーカ名などのロゴ102が付されているが、このロゴ102の所定位置(図9では「B」の位置)に対応させた目印を表示装置8に表示させるなどしてもよい。これによりモデル作成時の負担を軽減することができる。
図18は、レッスンフェーズのCPU1の処理を示すフローチャートである。レッスン開始が指示されたとき、まず、RAM3または外部記憶装置9からモデルをワーク領域に読み込む(S21)。読み込まれるモデルは、モデル作成フェーズで設定された音域に含まれる全ての音高の音のモデルである。ここでは、前回作成したモデルまたは前回使用したモデルを自動的に読み込むようにしてもよいし、これまで作成したモデルの中から演奏者に選択させて読み込むようにしてもよい。
次に、演奏者がレッスンする楽曲を選択する(S22)。この際、RAM3または外部記憶装置9に予め記憶されているレッスン曲データを検索して楽曲の一覧を作成し、この一覧の中から演奏者がレッスンする楽曲を自分で選択するようにしてもよいし、演奏者のレベルにあった楽曲を装置側で自動的に選択して提示するようにしてもよい。レッスンする楽曲が決まったら、この楽曲の演奏情報をRAM3または外部記憶装置9から読み出す(S23)。
図19は、レッスンで表示装置8に押鍵指示を表示したり伴奏をしたりするのに使用される演奏情報のフォーマット例を示す図である。演奏情報は、少なくともイベントデータ、およびイベントデータの読み出しタイミングを指示するタイミングデータを含む。イベントデータは、ノートナンバ(音高)を含むノートオンデータおよびノートオフデータからなる。タイミングデータは、例えば1つのイベント終了から次のイベント発生までの時間情報として設定される。イベントデータとタイミングデータは、図示のように、アドレス進行に従って記憶される。
この演奏情報は、外部記憶装置9に記憶しておくことができる。
次に、選択された楽曲に含まれる全ての音高の単音のモデルがS21で読み込んだモデルに含まれているかどうかをチェックする(S24)。ここで、選曲した楽曲の全ての音高の音の単音モデルが含まれていないと判断すれば、S22に戻って別の楽曲の選択を指示するか、S21に戻って別のモデルの読み込みを指示する。
S24で、選曲した楽曲の全ての音高の音の単音モデルが含まれている判断すれば、この楽曲の最初の楽音の音高をRAM3上の変数にセットする(S25)。同時に、この音高の音の鍵を演奏者に押鍵してもらうための押鍵指示を表示装置8に表示し(S26)、さらに、S21で読み込んだモデルからこの音高の音に対応する単音モデルを読み出す(S27)。
演奏者は表示装置8に表示された押鍵指示をみてピアノPの鍵を押鍵するが、そのときに発生される演奏音はマイクロフォン10によって取り込まれる。マイクロフォン10を通して入力されたアナログ信号をA/D変換器6でデジタル信号に変換した後、その音量を音量測定部11で検出する(S28)。S28〜S32の処理は、図2のS13〜S17の処理と同様であるので、詳細な説明は省略する。S32で不一致と判断した場合、S28に戻って再度音量の検出からやり直す。
S32で一致と判断した場合には、まず、アタック検出をリセットし(S33)、選曲した楽曲の最後の楽音か否かを判断する(S34)。ここで楽曲の最後の楽音でないと判断すれば、次の楽音の音高をRAM3にセットし(S35)、S26に戻る。以上の処理を楽曲の最後の楽音まで繰り返し実行し、楽曲の終わりに達したならばもう一度レッスンするか尋ねたり(S36)、別の楽曲をレッスンするかを尋ねたりして(S37)その応答に対応する処理に移る。
図20は、1回目のモデルと2回目のモデルとの比較処理(S17)あるいはモデルとレッスン時の演奏音のパワースペクトルとの比較処理(S32)の例を示すフローチャートである。
まず、今回の演奏音と比較するためのモデルを、S12あるいはS27で読み出したモデルから作成する(S41)。単音の演奏音の場合は単音のモデルそのままでよく、和音の演奏音の場合には単音のモデルを合成する。また、モデルと今回の演奏音の音量の違いをなくすためにモデル作成時の音量と今回の演奏音の音量が同じになるようにモデルと今回の演奏音のパワースペクトルを音量によって正規化する。和音の演奏音の場合には和音を構成する音のモデル作成時の音量の総和によって正規化する。なお、音量ではなく波形のピーク値によって正規化してもよい。
モデルが作成できたら、モデルと比べて今回の演奏音に足りない不足分のパワースペクトルの合計を距離として算出する(S42)。この方法は、ピアノなどのような残響が多く残る楽器には有効な方法である。
次に、モデルと今回の演奏音が一致すると判断するための閾値を設定し(S43)、S42で算出した距離をこの閾値と比較する(S44)。距離が閾値以上である場合には不一致と判断し、距離が閾値より小さい場合には一致と判断する。このとき、距離が閾値より小さい場合でも今回の演奏音のパワースペクトルに構成音ごとの特徴が見つからない場合には不一致と判断するようにしてもよい(S45)。S44あるいはS45で不一致と判断した場合、S4(S28)に戻って再度押鍵指示(音量検出)からやり直す。また、S45で一致と判断した場合にはS18(S33)に進む。
図21は、レッスン時のピアノロールつまりスクロール方式による押鍵指示の表示の例を示す図である。表示装置8の表示画面101内の下部に鍵盤図形Kを表示し、その上方に押鍵指示マークMを表示する。表示画面101の上下方向は時間軸であり、押鍵指示マークMは、押鍵すべき鍵に対応する位置に楽音の演奏長さに応じた長さで表示される。最も鍵盤図形に近い押鍵指示マークMは、次に押鍵すべき楽音であり、鍵盤図形Kに近い方から順番に押鍵すべき楽音を示している。
上記S32(図18)で、次に押鍵すべく楽音のモデルとピアノPの演奏音から計算されたパワースペクトルの距離が閾値以下であることが判断されると、ピアノロールは下方向にスクロールされ、次の押鍵すべき楽音の押鍵指示マークMが鍵盤図形Kに最も近い位置まで下がってきた時点で止まる。押鍵指示された楽音が押鍵されるまでピアノロールのスクロールが停止しているので、演奏者は自分のペースで次の楽音を押鍵することができる。S23(図18)で読み出す演奏情報には、演奏者に押鍵を促す楽音だけでなく、伴奏の演奏情報も含ませることができる。この場合には次に押鍵すべき音のタイミングまでの伴奏音が音源4を通してスピーカ5から出力される。
現在押鍵されているいるべき鍵はマークmで示される。このマークmの長さはこの鍵をあとどれだけ長く押鍵していなくてはならないかを示しており、これにより演奏者は離鍵するタイミングを前もって知ることができる。小節線BLで示すように、この例では2小節分の押鍵指示を同時に1画面に表示しているが、同時に表示する小節数、表示する演奏情報の範囲は任意である。
次に、モデル作成においてモデルに含まれるアクション音、ノイズ成分およびDC成分を低減する方法をについて説明する。以下では、自然楽器をピアノ(アコースティックピアノ)として説明するが、その他の自然楽器でも同様に考えることができる。
まず、モデルに含まれるアクション音を低減する方法ついて説明する。マイクロフォン2から音を取り込むときにピアノPを弾くと、どうしてもピアノPのアクション音まで取り込んでしまう。図22はマイクロフォン2から取り込まれた音のスペクトルの例を示す図である。
アクション音は毎回違ったパワースペクトルを有し、ノイズのようなものである。アクション音は主に低音部に強い成分を持つパワースペクトルとして現れるが、高音部の鍵以外ではアクション音が入ってもピアノ本来の音(弦の振動音)のパワースペクトルの方がかなり大きく、押鍵された鍵の演奏音とモデルの比較に殆ど影響しない。
しかし、高音部の鍵の場合、弦の振動音のパワースペクトルが小さいため、アクション音のパワースペクトルの影響が大きく、押鍵された鍵の演奏音とモデルを比較するときにアクション音のパワースペクトルが大きく評価される結果となってしまう。したがって、押鍵された鍵の演奏音とモデルの正しい比較結果が得られなくなる。アクション音のパワースペクトルが毎回同じであればそれを減算して取り除くことは可能であるが、アクション音のパワースペクトルはノイズのようなもので毎回異なるので単純に減算して取り除くことは不可能である。
そこで、モデルを作成するときに、モデルを作成しようとする音高の音の基本周波数f以下のパワースペクトルをカットする。ただし、ピアノPの調律がずれていることも考えられるので、実際にカットする周波数は基本周波数fよりも若干低い周波数、例えば半音低い周波数にすることが好ましい。アクション音に含まれる周波数成分より基本周波数が低い音高ではアクション音のパワースペクトルを取り除くことができないことになるが、上述のように高音部の鍵以外では弦の振動音のパワースペクトルに比べてアクション音のパワースペクトルは比較的小さいので、レッスン時に押鍵された鍵の演奏音とモデルとを比較する上での問題は生じない。
次に、モデルに含まれるノイズ成分を低減する方法について説明する。モデルを作成するときにマイクロフォン2から音を取り込むと、ノイズが混入されるのが普通である。ノイズには、周囲の環境音やマイクロフォン2のケーブルに入り込むノイズ、マイクアンプやA/D変換器3のアナログ回路部分に入り込むノイズなどがある。ピアノPの音の音量が大きく、それに比較してノイズが目立たないほど小さければ問題はないが、弱い押鍵での演奏音をそのままモデルにした場合、モデルの音量は小さいので、モデルとレッスン時に押鍵された鍵の演奏音を比較する際に音量で正規化を行うと、ノイズ成分も大きく持ち上げられてしまうことになる。
一方、レッスン時に押鍵された鍵の演奏音にもノイズが含まれているが、その演奏音の音量が大きければ相対的にノイズ成分のパワースペクトルが低くなり、音量で正規化してもノイズ成分のスペクトルは小さいままである。そのため、モデルとレッスン時の押鍵された鍵の演奏音の一致は得られなくなってしまう。
この不都合をなくすために、演奏者がピアノPを弾いていない状態でマイクロフォン2から音を数秒取り込み、取り込んだ入力音を一定時間間隔でオーバラップさせながらFFTし、これにより求められたパワースペクトル中でのパワー最大値を測定して保存しておく。このパワー最大値をノイズと判断する基準値とする。すなわち、モデルとするパワースペクトルの中からこのパワー最大値よりも低いパワーのパワースペクトルをカットすることによりノイズと思われる成分を取り除く。図23はノイズ除去前(a)とノイズ除去後(b)のパワースペクトルの例を示す。なお、モデルの音量の値はそのままとし、レッスン時にモデルと演奏音のパワースペクトルの比較に際し、この音量の値に基づいて正規化を行う。
次に、モデルに含まれるDC成分を低減する方法について説明する。押鍵された鍵の演奏音をFFTしてパワースペクトルに変換すると、DC成分は最も低い周波数のパワースペクトルとして現れる。DC成分のパワースペクトルが実際に押鍵された鍵自体の演奏音のパワースペクトルよりも強く出てしまう場合もある。このような場合には、モデルとレッスン時に押鍵された鍵の演奏音を比較する際にDC成分が大きく評価されてしまい不都合が生じる。そこで、FFTのサイドローブも考慮し、得られたパワースペクトルにおいて最も低い周波数とその隣のパワースペクトルを強制的にゼロにしてDC成分と考えられる部分を取り除く。
次に、音量を測定するときのDCを取り除く方法について説明する。モデルとレッスン時に押鍵された鍵の演奏音を比較する際にパワースペクトルを音量で正規化するが、A/D変換前のアナログ信号にDCのオフセットがのっているとA/D変換後のデジタル信号にもDCのオフセットがのってしまい、音量の測定では単位時間当たりの波形の振幅の絶対値の平均を音量としているため正しい音量を求めることができない。そこで、音量を測定する瞬間の例えば1秒前までの波形から音の振幅の平均値を求める。この平均値は波形のDCを表すのでこの平均値を音量測定の波形から減算することによりDCを取り除くことができる。図24はDC除去前(a)とDC除去後(b)の波形の例を示し、波形振幅の中心の0レベルからのずれがなくなる様子を示している。
本発明は種々の実施形態で実施可能である。例えば、作成されたモデルはその後のレッスンで継続して使用されるものであるので、特に注意深く、間違いなく作成される必要があるのでモデル作成者の負担が大きい。この負担を軽減するために、S19(図2)で音高を音階に従って直上の音高に上げるのではなく、白鍵と黒鍵を別にしてそれぞれ個別に連続して押鍵させるように音高を上げていくのがよい。音階に従って順に音高を上げていくと白鍵と黒鍵を交互に弾く場合が生じ、押鍵指示された鍵に対応しない鍵を弾く誤りが起こることがあるからである。
また、設定されたモデル作成音域の全ての鍵をある色で表示し、その色を変えるなどして押鍵指示を行えば、あとどれだけの単音モデルを作成しなければならないかが容易に分かる。
なお、図2のフローチャートによれば、1回目と2回目のモデルとが一致しないとき、再度1回目のモデル作成から行うようにしており、これによれば1回目のモデルを記憶しておくだけでよいが、同一音高に単音対して1回目、2回目、3回目、・・・というように順次作成されたモデルを記憶していき、複数回、例えば2回の一致が得られた時点でその音高の単音のモデル作成を終了して、一致したモデルを正規のモデルとして採用するようにすることもできる。
また、上記したアタック検出、無音検出、アクション音やノイズやDC成分除去の技術は適宜組み合わせて採用することができる。
本発明が適用される楽音判定装置のブロック図である。 モデル作成フェーズの処理を示すフローチャートである。 モデル作成の音域設定の例を示す図である。 モデル作成の音域設定の他の例を示す図である。 アタック検出処理の説明図である。 マイクロフォンとA/D変換器の部分の詳細構成を示すブロック図である。 音量表示の例を示す図である。 音高対音量最大値の特性図である。 モデル作成時の押鍵指示の例を示す図である。 最低音(ノートナンバ21)の鍵の離鍵後の音量変化を示す図である。 最低音(ノートナンバ48)の鍵の離鍵後の音量変化を示す図である。 アタック直後のパワースペクトルを示す図である。 アタックから約1.4秒後のパワースペクトルを示す図である。 アタックから約4.1秒後のパワースペクトルを示す図である。 アタックから約5.8秒後のパワースペクトルを示す図である。 モデル作成音(ノートナンバ50)を押鍵したときに得られたパワースペクトルを示す 最高音(ノートナンバ108)を押鍵したときに得られた音量変化を示す図である。 レッスンフェーズの処理を示すフローチャートである。 演奏情報のフォーマット例を示す図である。 比較処理の例を示すフローチャートである。 レッスン時のスクロール方式による押鍵指示の表示の例を示す図である。 マイクロフォンから取り込まれた音のスペクトルの例を示す図である。 ノイズ除去前とノイズ除去後のパワースペクトルの例を示す図である。 DC除去前とDC除去後の波形の例を示す図である。
符号の説明
1・・・CPU、2・・・ROM、3・・・RAM、4・・・音源、5・・・スピーカ、6・・・A/D変換器、7・・・入力装置、8・・・表示装置、9・・・外部記憶装置、10・・・マイクロフォン、11・・・音量測定部、12・・・スペクトル作成部、13・・・アタック検出部、14・・・スペクトル比較部、15・・・押鍵指示部、101・・・表示画面、102・・・ロゴ、、201・・・マイクボリューム、202・・・マイクアンプ、K・・・鍵盤図形、M・・・押鍵指示マーク、m・・・現在押鍵マーク、P・・・アコースティックピアノ、BL・・・小節線

Claims (18)

  1. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成装置において、
    モデル作成時に自然楽器を実際に弾くことにより発生された演奏音をレベル調整して取り込む演奏音取込手段と、前記演奏音取込手段により取り込まれた演奏音をレベル調整された演奏音の音量および該レベル調整状態で取り込まれたノイズの音量に基づいて設定した閾値と比較してアタックを検出するアタック検出手段と、アタックを検出したときの演奏音のパワースペクトルを算出するパワースペクトル算出手段とを備え、前記パワースペクトル算出手段により算出したパワースペクトルをモデルとして記憶することを特徴とする自然楽器の楽音判定装置におけるモデル作成装置。
  2. モデル作成時のレベル調整された演奏音の音量を表示する表示手段を備えることを特徴とする請求項1に記載の自然楽器の楽音判定装置におけるモデル作成装置。
  3. モデル作成時の演奏音の音量が許容範囲内に入っているか否かをレベル調整された演奏音の音量および楽器の音高対音量最大値の特性に従って判断する判断手段を備え、演奏音の音量が許容範囲内に入っていないときにはその旨のメッセージを送出することを特徴とする請求項1または2に記載の自然楽器の楽音判定装置におけるモデル作成装置。
  4. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成装置において、
    モデル作成時に自然楽器を実際に弾くことにより発生された演奏音の音量を閾値と比較する比較手段と、演奏音の音量が閾値を一定時間継続的に下回ったとき無音状態と判断する無音状態判断手段とを備え、前記無音状態判断手段が無音状態と判断したとき次のモデル作成に移ることを特徴とする自然楽器の楽音判定装置におけるモデル作成装置。
  5. モデル作成時の演奏音をレベル調整して取り込む演奏音取込手段を備え、前記比較手段は、前記演奏音取込手段によりレベル調整されて取り込まれたノイズの音量に応じて閾値を設定する閾値設定手段を備えることを特徴とする請求項4に記載の自然楽器の楽音判定装置におけるモデル作成装置。
  6. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成装置において、
    モデル作成時に自然楽器を実際に弾くことにより発生された演奏音を取り込む演奏音取込手段と、前記演奏音取込手段により取り込まれた演奏音のパワースペクトルを求めるパワースペクトル算出手段と、前記パワースペクトル算出手段により算出されたパワースペクトルの中でモデルを作成しようとする音高の基本周波数より低い低周波数成分をカットする低周波数成分除去手段とを備え、前記低周波数成分除去手段により低周波数成分がカットしたパワースペクトルをモデルとして記憶することを特徴とする自然楽器の楽音判定装置におけるモデル作成装置。
  7. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成装置において、
    モデル作成時に自然楽器を演奏しない状態で取り込んだ音のパワースペクトルを求めるパワースペクトル算出手段と、前記パワースペクトル算出手段により算出したパワースペクトルの中でパワー最大のスペクトルのパワー値をノイズ基準値とし、このノイズ基準値以下のパワースペクトルをカットするノイズ成分除去手段とを備え、前記ノイズ成分除去手段によりカットしたパワースペクトルをモデルとして記憶することを特徴とする自然楽器の楽音判定装置におけるモデル作成装置。
  8. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成装置において、
    モデル作成時に自然楽器を実際に弾くことにより発生された演奏音を取り込む演奏音取込手段と、前記演奏音取込手段により取り込まれた演奏音のパワースペクトルを算出するパワースペクトル算出手段と、前記パワースペクトル算出手段により算出したパワースペクトルの中で最も低い周波数付近の成分をカットするDC成分除去手段とを備え、前記DC成分除去手段によりカットしたパワースペクトルをモデルとして記憶することを特徴とする自然楽器の楽音判定装置におけるモデル作成装置。
  9. モデル作成時の演奏音波形の一定期間の振幅平均値を求め、該振幅平均値を減算した演奏音に基づいて音量を算出する音量算出手段と、モデルと演奏音のパワースペクトルの比較に際し、算出した演奏音の音量でモデルのパワースペクトルを正規化する正規化手段とを備えることを特徴とする請求項1ないし8のいずれかに記載の自然楽器の楽音判定装置におけるモデル作成装置。
  10. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成用プログラムにおいて、
    コンピュータに、モデル作成時に自然楽器を実際に弾くことにより発生された演奏音をレベル調整して取り込む手順と、取り込んだ演奏音をレベル調整された演奏音の音量および該レベル調整状態で取り込んだノイズの音量に応じた閾値と比較してアタックを検出する手順と、アタックを検出したときの演奏音のパワースペクトルを算出してモデルとして記憶する手順を実行させるための自然楽器の楽音判定装置におけるモデル作成用プログラム。
  11. モデル作成時のレベル調整された演奏音の音量を表示する手順を含むことを特徴とする請求項10に記載の自然楽器の楽音判定装置におけるモデル作成用プログラム。
  12. モデル作成時の演奏音の音量が許容範囲内に入っているか否かをレベル調整された演奏音の音量および楽器の音高対音量最大値の特性に従って判断する手順と、演奏音の音量が許容範囲内に入っていないときにはその旨のメッセージを送出する手順を含むことを特徴とする請求項10または11に記載の自然楽器の楽音判定装置におけるモデル作成用プログラム。
  13. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成用プログラムにおいて、
    コンピュータに、モデル作成時に自然楽器を実際に弾くことにより発生された演奏音の音量を閾値と比較する手順と、演奏音の音量が閾値を一定時間継続的に下回ったとき無音状態と判断する手順と、無音状態と判断されたときに次のモデル作成に移る手順を実行させるための自然楽器の楽音判定装置におけるモデル作成用プログラム。
  14. 演奏音をレベル調整して取り込む手順と、レベル調整状態で取り込んだノイズの音量に応じて閾値を設定する手順を含むことを特徴とする請求項13に記載の自然楽器の楽音判定装置におけるモデル作成用プログラム。
  15. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成用プログラムにおいて、
    コンピュータに、モデル作成時に自然楽器を実際に弾くことにより発生された演奏音を取り込む手順と、該演奏音のパワースペクトルを求める手順と、モデルを作成しようとする音高の基本周波数より低い低周波数成分のパワースペクトルをカットする手順と、低周波数成分をカットしたパワースペクトルをモデルとして記憶する手順を実行させるための自然楽器の楽音判定装置におけるモデル作成用プログラム。
  16. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成用プログラムにおいて、
    コンピュータに、モデル作成時に自然楽器を演奏しない状態で取り込んだ音のパワースペクトルを求める手順と、そのスペクトル中でパワー最大のスペクトルのパワー値をノイズ基準値とし、このノイズ基準値以下の演奏音をノイズと判断してカットする手順と、ノイズをカットした演奏音のパワースペクトルをモデルとして記憶する手順を実行させるための自然楽器の楽音判定装置におけるモデル作成用プログラム。
  17. 予め各音高の単音のパワースペクトルをモデルとして作成して記憶させておき、演奏指示に従って次に弾くべき音のモデルを読み出し、これと自然楽器を実際に弾くことにより発生された演奏音のパワースペクトルを比較し、両者が閾値以内の距離に近づいた場合に演奏指示を進める自然楽器の楽音判定装置におけるモデル作成用プログラムにおいて、
    コンピュータに、自然楽器を実際に弾くことにより発生された演奏音を取り込む手順と、取り込まれた演奏音のパワースペクトルを求める手順と、該パワースペクトルの中で最も低い周波数付近の成分をカットする手順と、最も低い周波数付近の成分をカットしたパワースペクトルをモデルとして記憶する手順を実行させるための自然楽器の楽音判定装置におけるモデル作成用プログラム。
  18. モデル作成時の演奏音波形の一定期間の振幅平均値を求め、該振幅平均値を減算した演奏音に基づいて演奏音の音量を算出する手順と、モデルのと演奏音のパワースペクトルの比較に際し、算出した演奏音の音量でモデルのパワースペクトルを正規化する手順とを含む10ないし17のいずれかに記載の自然楽器の楽音判定装置におけるモデル作成用プログラム。
JP2004047809A 2004-02-20 2004-02-24 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム Expired - Fee Related JP4530199B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004047809A JP4530199B2 (ja) 2004-02-24 2004-02-24 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム
PCT/JP2005/002244 WO2005081222A1 (ja) 2004-02-20 2005-02-15 演奏指示に従って演奏された自然楽器の楽音判定装置、楽音判定プログラムおよび該プログラムを記録した媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004047809A JP4530199B2 (ja) 2004-02-24 2004-02-24 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム

Publications (2)

Publication Number Publication Date
JP2005241717A true JP2005241717A (ja) 2005-09-08
JP4530199B2 JP4530199B2 (ja) 2010-08-25

Family

ID=35023546

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004047809A Expired - Fee Related JP4530199B2 (ja) 2004-02-20 2004-02-24 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム

Country Status (1)

Country Link
JP (1) JP4530199B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009031486A (ja) * 2007-07-26 2009-02-12 Yamaha Corp 演奏音の類似度を評価する方法、装置およびプログラム
JP2016085309A (ja) * 2014-10-24 2016-05-19 株式会社コルグ 楽音評価装置及びプログラム
CN108731791A (zh) * 2018-03-22 2018-11-02 深圳市月白电子科技有限公司 一种采集钢琴按键动作的方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110488A (ja) * 1992-09-30 1994-04-22 Matsushita Electric Ind Co Ltd 音声検出方法および音声検出装置
JPH0736455A (ja) * 1993-07-22 1995-02-07 Nec Corp 音楽イベントインデックス作成装置
JPH09258783A (ja) * 1996-03-26 1997-10-03 Mitsubishi Electric Corp 音声認識装置
JPH11259066A (ja) * 1998-03-09 1999-09-24 Nippon Telegr & Teleph Corp <Ntt> 音楽音響信号分離方法、その装置およびそのプログラム記録媒体
JP2001195065A (ja) * 2000-01-12 2001-07-19 Yamaha Corp 制御装置および制御方法
JP2002073073A (ja) * 2000-08-28 2002-03-12 Sharp Corp 音声認識装置およびプログラム記録媒体
JP2002169586A (ja) * 2000-09-19 2002-06-14 Atr Onsei Gengo Tsushin Kenkyusho:Kk 音声及び画像の合成モデル生成装置、音声及び画像の合成モデルのための環境適応化装置、並びに音声認識装置
JP2002258882A (ja) * 2001-03-05 2002-09-11 Hitachi Ltd 音声認識システム及び情報記録媒体
JP2003066990A (ja) * 2001-08-28 2003-03-05 Clarion Co Ltd 音声認識装置
JP2003099085A (ja) * 2001-09-25 2003-04-04 National Institute Of Advanced Industrial & Technology 音源の分離方法および音源の分離装置
JP2003308092A (ja) * 2002-04-15 2003-10-31 Mitsubishi Electric Corp 雑音除去装置及び雑音除去方法
JP2004533016A (ja) * 2001-05-21 2004-10-28 アミューズテック カンパニー リミテッド 楽譜追跡方法およびその装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06110488A (ja) * 1992-09-30 1994-04-22 Matsushita Electric Ind Co Ltd 音声検出方法および音声検出装置
JPH0736455A (ja) * 1993-07-22 1995-02-07 Nec Corp 音楽イベントインデックス作成装置
JPH09258783A (ja) * 1996-03-26 1997-10-03 Mitsubishi Electric Corp 音声認識装置
JPH11259066A (ja) * 1998-03-09 1999-09-24 Nippon Telegr & Teleph Corp <Ntt> 音楽音響信号分離方法、その装置およびそのプログラム記録媒体
JP2001195065A (ja) * 2000-01-12 2001-07-19 Yamaha Corp 制御装置および制御方法
JP2002073073A (ja) * 2000-08-28 2002-03-12 Sharp Corp 音声認識装置およびプログラム記録媒体
JP2002169586A (ja) * 2000-09-19 2002-06-14 Atr Onsei Gengo Tsushin Kenkyusho:Kk 音声及び画像の合成モデル生成装置、音声及び画像の合成モデルのための環境適応化装置、並びに音声認識装置
JP2002258882A (ja) * 2001-03-05 2002-09-11 Hitachi Ltd 音声認識システム及び情報記録媒体
JP2004533016A (ja) * 2001-05-21 2004-10-28 アミューズテック カンパニー リミテッド 楽譜追跡方法およびその装置
JP2003066990A (ja) * 2001-08-28 2003-03-05 Clarion Co Ltd 音声認識装置
JP2003099085A (ja) * 2001-09-25 2003-04-04 National Institute Of Advanced Industrial & Technology 音源の分離方法および音源の分離装置
JP2003308092A (ja) * 2002-04-15 2003-10-31 Mitsubishi Electric Corp 雑音除去装置及び雑音除去方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009031486A (ja) * 2007-07-26 2009-02-12 Yamaha Corp 演奏音の類似度を評価する方法、装置およびプログラム
JP2016085309A (ja) * 2014-10-24 2016-05-19 株式会社コルグ 楽音評価装置及びプログラム
CN108731791A (zh) * 2018-03-22 2018-11-02 深圳市月白电子科技有限公司 一种采集钢琴按键动作的方法及装置

Also Published As

Publication number Publication date
JP4530199B2 (ja) 2010-08-25

Similar Documents

Publication Publication Date Title
KR100949872B1 (ko) 악곡 연습 지원 장치, 악곡 연습 지원 장치의 제어 방법, 악곡 연습 지원 장치를 제어하는 제어 방법을 컴퓨터로 실행시키는 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체
US10832645B2 (en) Transducer apparatus for a labrosone and a labrosone having the transducer apparatus
US7674970B2 (en) Multifunctional digital music display device
KR101521451B1 (ko) 표시 제어 장치 및 방법
JP4212446B2 (ja) カラオケ装置
GB2559135A (en) Transducer apparatus for an edge-blown aerophone and an edge-blown aerophone having the transducer apparatus
JP2006276693A (ja) 歌唱評価表示装置およびプログラム
JP4609921B2 (ja) 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム
JP4530199B2 (ja) 自然楽器の楽音判定装置におけるモデル作成装置およびモデル作成用プログラム
JP4070120B2 (ja) 自然楽器の楽音判定装置
JP2004102146A (ja) ビブラート採点機能を有するカラオケ採点装置
WO2005081222A1 (ja) 演奏指示に従って演奏された自然楽器の楽音判定装置、楽音判定プログラムおよび該プログラムを記録した媒体
JP3599686B2 (ja) カラオケ歌唱時に声域の限界ピッチを検出するカラオケ装置
JP7024864B2 (ja) 信号処理装置、プログラムおよび音源
JP5704368B2 (ja) 楽音演奏装置及び楽音演奏処理プログラム
JP5005445B2 (ja) コード名検出装置及びコード名検出用プログラム
JP2005249844A (ja) 演奏指示装置および演奏指示プログラム
JP2005234304A (ja) 演奏音判定装置および演奏音判定プログラム
JP4180548B2 (ja) 声域告知機能付きカラオケ装置
JP2005107332A (ja) カラオケ装置
JP4159961B2 (ja) カラオケ装置
JP4492932B2 (ja) 演奏音判定装置および演奏音判定プログラムおよび該プログラムを記録した媒体
JP2002268637A (ja) 拍子判定装置、及びプログラム
JP5703555B2 (ja) 楽音信号処理装置及びプログラム
JP4379356B2 (ja) カラオケ装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100210

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100409

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100602

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100602

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130618

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees