JP3279204B2 - 音信号分析装置及び演奏情報発生装置 - Google Patents

音信号分析装置及び演奏情報発生装置

Info

Publication number
JP3279204B2
JP3279204B2 JP32477496A JP32477496A JP3279204B2 JP 3279204 B2 JP3279204 B2 JP 3279204B2 JP 32477496 A JP32477496 A JP 32477496A JP 32477496 A JP32477496 A JP 32477496A JP 3279204 B2 JP3279204 B2 JP 3279204B2
Authority
JP
Japan
Prior art keywords
section
value
pitch
stationary
sound signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32477496A
Other languages
English (en)
Other versions
JPH10149160A (ja
Inventor
知之 船木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP32477496A priority Critical patent/JP3279204B2/ja
Priority to US08/974,339 priority patent/US6525255B1/en
Publication of JPH10149160A publication Critical patent/JPH10149160A/ja
Application granted granted Critical
Publication of JP3279204B2 publication Critical patent/JP3279204B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、入力音声や楽音
に基づいて音楽的な音が存在する区間(有効区間)やそ
の音楽的な音の定常部分を分析する音信号分析装置、及
びこの入力音声や楽音に基づいてMIDI情報等の演奏
情報を発生する演奏情報発生装置に関する。
【0002】
【従来の技術】最近、コンピュータ等を用いて、MID
I情報等の演奏情報を発生し、その演奏情報に基づいて
演奏音を再生するコンピュータ演奏システムが新たな楽
音演奏装置として注目されている。この種のコンピュー
タ演奏システムでは、演奏情報を発生するためのデータ
を入力する方式として、リアルタイム入力方式、ステッ
プ入力方式、数値入力方式、楽譜入力方式等がある。
【0003】リアルタイム入力方式は、テープレコーダ
のように演奏者が実際に演奏した鍵盤等の演奏操作子の
操作情報をリアルタイムに演奏情報に変換する方式であ
る。数値入力方式は、音高(ピッチ)、音の長さ、音の
強弱等の演奏情報をコンピュータのキーボードから直接
数値データとして入力する方式である。楽譜入力方式
は、コンピュータのファンクションキーやマウス等を用
いてディスプレイ上の楽譜(5線譜)に単純化した音譜
記号等を配置していく方式である。ステップ入力方式
は、音譜をMIDI鍵盤やソフトウェア鍵盤で入力し、
音の長さをコンピュータのファンクションキーやマウス
等を用いて入力する方式である。
【0004】上述の各入力方式のうち、リアルタイム入
力方式は、実際の演奏操作状態をそのまま演奏情報とし
て記憶することができるので、人間的なニュアンスを表
現し易く、また短時間入力が可能であるという利点を有
する。しかし、この方式は演奏者自身に高度の楽器演奏
能力が必要であり、初心者等には不向きな入力方式であ
る。そこで、リアルタイム入力方式の利点を生かし、初
心者でも短時間で簡単に演奏情報を入力できるようにし
た演奏情報発生装置として、人声音又は自然楽器の楽音
をマイクを介して直接入力し、その入力音に応じて演奏
情報を発生するものがある。すなわち、これは、人声音
やギター等の音(単音)をマイクから入力するだけで、
簡単にMIDI信号を発生することができ、MIDIキ
ーボード等を使用しなくてもMIDI機器を制御でき
る。
【0005】
【発明が解決しようとする課題】従来の演奏情報発生装
置では、マイクからの入力音のピッチ変化に対して、次
のような処理を行ってMIDI情報を発生している。す
なわち、第1の方法はピッチ変化を半音単位で検出し、
そのピッチのノート情報のみを発生する。第2の方法は
ピッチ変化を半音単位で検出し、そのピッチのノート情
報と、その間のピッチ変化に関するピッチベンド情報
(音高変化情報)とを発生する。第3の方法はピッチ変
化を上下1オクターブの範囲で変化するピッチベンド情
報として発生する。また、ノート情報(ノートオン又は
ノートオフ)を発生するのに、入力音のレベルを所定の
基準値と比較し、その基準値よりも入力音のレベルが大
きくなった時点でノートオンを、小さくなった時点でノ
ートオフを発生している。
【0006】しかしながら、上記第1及び第2の方法の
ようにピッチ変化を半音単位で検出する場合において、
入力音のピッチが微妙にゆれると意図しないノート情報
(ノートオン又はノートオフ)が多数発生するという問
題がある。また、第3の方法のようにピッチ変化をピッ
チベンド情報で発生する場合は、ピッチ変化をピッチベ
ンド情報で忠実に追従することができるが、採譜のよう
な目的には適さない。さらに、入力レベルに応じてノー
ト情報を発生すると、入力音のレベルのゆれに応じて意
図しないノート情報が多数発生するという問題がある。
ところで、リアルタイム入力方式においては、複数の音
が任意の時間間隔で時系列的にマイクに入力されるの
で、音の存在する部分に対して効率的な分析を行うこと
が要求される。すなわち、マイク入力された信号に対し
てピッチ等の分析を絶えず行うようにしていたのでは、
実際には音が入力されていない時間においても無駄な分
析処理をすることになるので好ましくない。そこで、マ
イク入力された信号から実際に音が存在している区間
(有効区間)を抽出し、抽出された有効区間についての
みピッチ分析等の複雑な分析処理を施すようにするのが
効率的である。そのための従来の有効区間の抽出法は、
単純に所定基準レベルと入力信号レベルを比較して有効
区間の抽出を行っていたので、入力音のレベルが微妙に
変動するような場合、特に基準レベル付近で変動した場
合には有効区間の抽出が不正確になると問題があった。
【0007】この発明は、マイク等からの入力音のピッ
チ又はレベルが微妙にゆれた場合でも、音楽的な音が存
在する区間(有効区間)を容易に分析することのできる
音信号分析装置を提供することを目的とする。この発明
は、マイク等からの入力音のピッチ又はレベルが微妙に
ゆれた場合でも、そのゆれた部分以外の音楽的な音の定
常部分すなわち1つの音符に相当する部分を分析するこ
とのできる音信号分析装置を提供することを目的とす
る。詳しくは、入力された1連の音から定常部分を有効
に分析し、これに基づき音のピッチを正確に分析できる
ようにするものである。この発明は上述の点に鑑みてな
されたものであり、マイク等からの入力音のピッチ又は
レベルが微妙にゆれた場合でもそのピッチに対するノー
ト情報を確実に発生することのできる演奏情報発生装置
を提供することを目的とする。
【0008】
【課題を解決するための手段】請求項1に記載の音信号
分析装置は、外部から任意の音信号を入力するための入
力手段と、前記入力手段から順次入力された信号のサン
プル振幅値の所定サンプル数にわたる平均値をそれぞれ
求め、その結果を時系列的な平均音圧レベル情報として
出力する演算手段と、前記演算手段によって求められた
平均音圧レベルが第1の所定値以上である区間を音楽的
な音が存在する有効区間とし、前記第1の所定値未満の
区間を音楽的な音の存在しない無効区間とする区間決定
手段と、両側を前記有効区間に挟まれた前記無効区間の
中でその区間の時間長が第1の所定長未満の場合には、
その無効区間を有効区間に変更し、変更後の有効区間と
その両側の有効区間とを合成して新たな有効区間とする
有効区間化手段と、前記有効区間化手段による処理が終
了した時点で、両側を前記無効区間に挟まれた前記有効
区間の中でその区間の時間長が第2の所定長未満の場合
には、その有効区間を無効区間に変更し、変更後の無効
区間とその両側の無効区間とを合成して新たな無効区間
とする第1の無効区間化手段と、前記第1の無効区間化
手段による処理が終了した時点における前記有効区間の
それぞれについて、前記平均音圧レベルの平均値を算出
し、それが第2の所定値未満の場合には、その有効区間
を無効区間に変更する第2の無効区間化手段とを具えた
ものである。請求項1に記載の音信号分析装置では、入
力手段から順次入力される信号の各サンプル振幅値の所
定サンプル数にわたる平均値をそれぞれ求めているの
で、入力された音信号のレベル変動に敏感に応答した滑
らかに変化する平均音圧レベル情報を得ることだでき
る。このようにして得られた平均音圧レベルを第1の所
定値に基づいて有効区間及び無効区間に区分けし、区分
けされた有効区間及び無効区間をさらに第1及び第2の
所定長に基づいて最終的に有効区間を特定している。こ
れによって、マイク等からの入力音のレベルが微妙にゆ
れた場合でも、音楽的な音が存在する区間(有効区間)
を容易に分析することができる。
【0009】請求項2に記載の音信号分析装置は、外部
から任意の音信号を入力するための入力手段と、前記入
力手段から順次入力された信号のサンプル振幅値の所定
サンプル数にわたる平均値をそれぞれ求め、その結果を
時系列的な平均音圧レベル情報として出力する演算手段
と、前記演算手段によって求められた平均音圧レベルが
第1の所定値以上である区間を有効区間とし、前記第1
の所定値未満の区間であって両側を前記有効区間に挟ま
れた区間を無効区間として、これ以外の前記平均音圧レ
ベルの両端側の区間を未確定区間とする区間決定手段
と、両側を前記有効区間に挟まれた前記無効区間の中で
その区間の時間長が第1の所定長未満の場合には、その
無効区間を有効区間に変更し、変更後の有効区間とその
両側の有効区間とを合成して新たな有効区間とする有効
区間化手段と、前記有効区間化手段による処理が終了し
た時点で、両側を前記無効区間に挟まれた前記有効区間
の中でその区間の時間長が第2の所定長未満の場合に
は、その有効区間を無効区間に変更し、変更後の無効区
間とその両側の無効区間とを合成して新たな無効区間と
し、前記未確定区間に隣接する前記有効区間の中でその
区間の時間長が前記第2の所定長未満の場合には、その
有効区間と、それに隣接する無効区間と未確定区間とを
合成して新たな未確定区間とする第1の無効区間化手段
と、前記第1の無効区間化手段による処理が終了した時
点における前記有効区間及び前記未確定区間のそれぞれ
について、前記平均音圧レベルの平均値を算出し、それ
が第2の所定値未満の場合には前記有効区間又は前記未
確定区間を無効区間に変更し、前記第2の所定値以上の
場合には前記未確定区間を有効区間に変更する第2の無
効区間化手段とを具えたものである。請求項2に記載の
音信号分析装置は、基本的には請求項1に記載のものと
同じであり、求められた平均音圧レベルを第1の所定値
に基づいて有効区間及び無効区間に区分けするが、その
ときに平均音圧レベルの両端部分すなわち平均音圧レベ
ルの立上り部分と立下り部分を未確定区間とし、その後
の有効区間の特定処理を行うようにした。これによっ
て、入力された音信号の立上り部分及び立下り部分を正
確に有効区間であるかどうかの分析を行うことができ
る。
【0010】請求項3に記載の音信号分析装置は、請求
項1又は2に記載の音信号分析装置において、前記第2
の無効区間化手段による処理が終了した時点で、前記演
算手段によって求められた平均音圧レベルと前記第1の
所定値よりも小さな第2の所定値とを用いて前記有効区
間を拡張する拡張手段をさらに設けたものである。請求
項1又は2に記載の音信号分析装置では、平均音圧レベ
ルの有効区間と無効区間との境界は第1の所定値に基づ
いて決定されているので、この第1の所定値をどのよう
な値にするかによって大幅に依存するようになるので、
一連の処理によって特定された有効区間長を第1の所定
値よりも小さな第2の所定値を用いて拡張することによ
って、音楽的な音が存在する有効区間の特定を正確に行
うようにしている。
【0011】 請求項4に記載の音信号分析装置は、外
部から任意の音信号を入力するための入力手段と、前記
入力手段から入力する前記音信号の波形において周期基
準となる候補位置の複数を検出する周期基準検出手段
あって、該周期基準検出手段は、前記音信号の波形にお
ける特定の位置を検出することによって前記周期基準と
なる候補位置を複数検出するものと、前記音信号につい
て、前記候補位置で表される隣接する区間同士の波形の
一致度を演算し、その一致度の高いもの同士を接続して
同波形区間を検出する区間検出手段と、前記区間検出手
段によって検出された同波形区間に基づいて定常区間を
検出する定常区間決定手段と、前記定常区間決定手段に
よって決定された定常区間に基づいて1つの音価の区間
を決定する音価区間決定手段とを具えたものである。
【0012】請求項5に記載の音信号分析装置は、外部
から任意の音信号を入力するための入力手段と、前記入
力手段から入力する前記音信号に対して周期基準となる
仮候補位置の複数を検出する第1の周期基準検出手段
と、前記第1の周期基準検出手段によって検出された前
記仮候補位置に基づいて前記音信号の最大周波数及び最
小周波数を検出する周波数帯検出手段と、この周波数帯
検出手段によって、検出された最大周波数及び最小周波
数をカットオフ周波数とするバンドパスフィルタ処理を
前記入力手段から入力する前記音信号に施すフィルタ処
理手段と、前記フィルタ処理手段から出力される前記音
信号に対して周期基準となる候補位置の複数を検出する
第2の周期基準検出手段と、前記音信号について、前記
候補位置で表される隣接する区間同士の波形の一致度を
演算し、その一致度の高いもの同士を接続して同波形区
間を検出する区間検出手段と、前記区間検出手段によっ
て検出された同波形区間に基づいて定常区間を検出する
定常区間検出手段とを具えたものである。請求項5に記
載の音信号分析装置では、入力された音信号から周期基
準となる仮候補位置を検出し、その仮候補位置に基づい
て音信号の最大周波数及び最小周波数を検出し、検出さ
れた最大周波数及び最小周波数をカットオフ周波数とす
るバンドパスフィルタ処理を再び入力された音信号に対
して行うことによって、同波形区間の検出時に発生する
誤差の原因となる不要な低周波成分や高調波成分を有効
に除去することができる。このように不要な低周波成分
や高調波成分の除去された音信号について請求項4と同
様の処理を行うことによって、より高精度な定常区間の
分析を行うことができる。
【0013】請求項6に記載の音信号分析装置は、外部
から任意の音信号を入力するための入力手段と、前記入
力手段から入力する前記音信号の中から音楽的な音が存
在すると思われる有効区間を分析する有効区間分析手段
と、前記有効区間を構成する前記音信号の正負両側部分
のそれぞれに対して周期基準となる候補位置の複数を検
出する周期基準検出手段と、前記音信号の前記正負両側
部分のそれぞれについて、前記候補位置で表される隣接
する区間同士の波形の一致度を演算し、その一致度の高
いもの同士を接続して同波形区間を検出する区間検出手
段と、前記区間検出手段によって検出された正負両側の
同波形区間を重ね合わせることによってできた区間を同
音色区間とする音色区間決定手段と、前記音色区間決定
手段によって決定された同音色区間に基づいて定常区間
を検出する定常区間決定手段とを具えたものである。請
求項6に記載の音信号分析装置では、音信号の正負両側
で周期基準となる候補位置を検出し、その候補位置に基
づいて同波形区間を検出し、その正負両側の同波形区間
を重ね合わせているので、正負側で音信号のピッチやレ
ベルが微妙にゆれた場合でもその誤差を減少することが
できる。そして、このようにして決定された同音色区間
を音高の急激な変化及び音圧の急激な変化に基づいて最
終的な1つの音符に相当する定常区間を分析する。これ
によって、マイク等からの入力音のピッチ又はレベルが
微妙にゆれた場合でも、そのゆれた部分以外の音楽的な
音の1つの音符に相当する定常区間を分析することがで
きる。
【0014】請求項7に記載の音信号分析装置は、外部
から任意の音信号を入力するための入力手段と、前記入
力手段から入力する前記音信号の中から音楽的な音が存
在すると思われる有効区間を分析する有効区間分析手段
と、前記有効区間を構成する前記音信号に対して周期基
準となる仮候補位置の複数を検出する第1の周期基準検
出手段と、前記第1の周期基準検出手段によって検出さ
れた前記仮候補位置に基づいて前記音信号の全区間又は
前記有効区間に関する最大周波数及び最小周波数を検出
する周波数帯検出手段と、この周波数帯検出手段によっ
て、検出された最大周波数及び最小周波数をカットオフ
周波数とするバンドパスフィルタ処理を前記入力手段か
ら入力する前記音信号の全区間又は前記有効区間毎に施
すフィルタ処理手段と、前記フィルタ処理手段から出力
される前記音信号に対して周期基準となる候補位置の複
数を検出する第2の周期基準検出手段と、前記音信号の
前記正負両側部分のそれぞれについて、前記候補位置で
表される隣接する区間同士の波形の一致度を演算し、そ
の一致度の高いもの同士を接続して同波形区間を検出す
る区間検出手段と、前記区間検出手段によって検出され
た同波形区間に基づいて定常区間を検出する定常区間決
定手段とを具えたものである。請求項7に記載の音信号
分析装置では、入力された音信号から周期基準となる仮
候補位置を検出し、その仮候補位置に基づいて音信号の
最大周波数及び最小周波数を検出し、検出された最大周
波数及び最小周波数をカットオフ周波数とするバンドパ
スフィルタ処理を再び入力された音信号に対して行うこ
とによって、同波形区間の検出時に発生する誤差の原因
となる不要な低周波成分や高調波成分を有効に除去する
ことができる。このようにな不要な低周波成分や高調波
成分の除去された音信号について定常区間の分析処理を
行うことによって、より高精度な分析が可能となる。請
求項8に記載の音信号分析装置は、請求項6又は7に記
載の前記有効区間検出手段を、請求項1、2又は3に記
載の音信号分析装置で構成したものである。
【0015】請求項9に記載の演奏情報発生装置は、外
部から任意の音信号を入力するための入力手段と、前記
入力手段から入力する前記音信号の中から1つの音符に
相当する定常区間を分析する定常区間分析手段と、前記
定常区間分析手段によって分析された前記定常区間毎に
代表周波数を決定する周波数決定手段と、前記周波数決
定手段によって決定された前記定常区間の代表周波数に
基づいて前後する2つの定常区間同士の代表周波数の差
をセントを基準にした値に変換するセント値変換手段
と、このセント値変換手段によって変換されたセントを
基準にした値に基づいて前記2つの定常区間同士の相対
的な音高差データを算出する音高差算出手段と、前記音
高差算出手段によって算出された前記音高差データに基
づいて各定常区間に所定の音階上の音高を割り当てる音
高割当手段とを具えたものである。請求項9に記載の演
奏情報発生装置は、1つの音符に相当する定常区間毎に
その代表周波数を決定し、それぞれ相前後する定常区間
同士の代表周波数の差から算出されるセントを基準にし
た値に基づいて音高差データを算出し、この音高差デー
タに基づいて各定常区間に所定の音階上の音高を割り当
てている。すなわち、定常区間の代表周波数はその定常
区間を構成する複数波形の平均値であり、また、音高差
データは相前後する定常区間同士のセントを基準にした
値に基づいて算出されているので、マイク等からの入力
音のピッチが微妙にゆれた場合でも最終的に割り当てら
れる音階上の音高の中にその誤差成分を吸収することが
可能となる。
【0016】請求項10に記載の演奏情報発生装置は、
外部から任意の音信号を入力するための入力手段と、前
記入力手段から入力する前記音信号の中から1つの音符
に相当する定常区間を分析する定常区間分析手段と、定
常区間分析手段によって分析された前記定常区間毎に代
表周波数を決定する周波数決定手段と、前記定常区間分
析手段によって分析された前記定常区間の複数を纏めて
1つのフレーズを検出するフレーズ検出手段と、前記フ
レーズ検出手段によって検出された1フレーズ内におけ
る当該定常区間よりも前に存在する全ての定常区間に対
して、その代表周波数の差をそれぞれセントを基準にし
た値に変換するセント値変換手段と、前記フレーズ検出
手段によって検出された1フレーズ内における当該定常
区間よりも前に存在する全ての定常区間に対する相対的
な時間距離に基づいた重みを算出する重み算出手段と、
このセント値変換手段によって変換されたセントを基準
にした値及び重み算出手段によって算出された重みに基
づいて前記2つの定常区間同士の相対的な音高差データ
を算出する音高差算出手段と、前記音高差算出手段によ
って算出された前記音高差データに基づいて各定常区間
に所定の音階上の音高を割り当てる音高割当手段とを具
えたものである。請求項10に記載の演奏情報発生装置
は、複数の定常区間によって構成されるフレーズについ
て、請求項9に記載の演奏情報発生装置と同様に代表周
波数及びセントを基準にした値を決定し、フレーズ内の
前置音全てに対する時間距離に基づいた重み付けを行っ
て、音高差データを算出し、それに基づいて各定常区間
に所定の音階上の音高を割り当てている。これによっ
て、マイク等からの入力音のピッチが微妙にゆれた場合
でもフレーズを構成する定常区間の音に依存した音高割
当てを行うことができる。
【0017】請求項11に記載の演奏情報発生装置は、
外部から任意の音信号を入力するための入力手段と、前
記入力手段から入力する前記音信号の中から1つの音符
に相当する定常区間を分析する定常区間分析手段と、定
常区間分析手段によって分析された前記定常区間毎に代
表周波数を決定する周波数決定手段と、前記定常区間分
析手段によって分析された前記定常区間の複数を纏めて
1つのフレーズを検出するフレーズ検出手段と、前記フ
レーズ検出手段によって検出された1フレーズ内の先頭
の定常区間の代表周波数に対する前記フレーズ内の他の
各定常区間の代表周波数の差をセントを基準にした値に
変換するセント値変換手段と、このセント値変換手段に
よって変換されたセントを基準にした値に基づいて前記
2つの定常区間同士の相対的な音高差データを算出する
音高差算出手段と、前記音高差算出手段によって算出さ
れた前記音高差データに基づいて各定常区間に所定の音
階上の音高を割り当てる音高割当手段とを具えたもので
ある。請求項11に記載の演奏情報発生装置は、複数の
定常区間によって構成されるフレーズについて、請求項
9に記載の演奏情報発生装置と同様に代表周波数を決定
し、フレーズ内の先頭音に対してセントを基準にした値
及び音高差データを算出し、それに基づいて各定常区間
に所定の音階上の音高を割り当てている。これによっ
て、マイク等からの入力音のピッチが微妙にゆれた場合
でもフレーズ先頭音に依存した音高割当てを行うことが
できる。
【0018】請求項12に記載の演奏情報発生装置は、
請求項9、10又は11に記載の前記音高割当手段を、
各定常区間に所定の音階上の音高を割り当てる際に、最
初の定常区間に所定の音高を割り当ててから、順番に残
りの定常区間に所定の音階上の音高を割り当てるように
構成したものである。請求項13に記載の演奏情報発生
装置は、請求項9、10又は11に記載の前記音高割当
手段を、各定常区間に所定の音階上の音高を割り当てる
際に、最初の定常区間の音信号を分析してその定常区間
の平均周波数を検出し、検出された平均周波数に基づい
た音高を最初の定常区間の音高として割り当ててから、
残りの定常区間に順番に所定の音階上の音高を割り当て
るように構成したものである。請求項14に記載の演奏
情報発生装置は、請求項9、10又は11に記載の前記
音高割当手段を、各定常区間に複数の音階上の音高をノ
ート位置をずらしながらそれぞれ割り当ててみて、各音
階の各ノート位置におけるノート割当誤差の累計値を算
出し、その累計値に応じて最適な音階を決定し、決定さ
れた音階上の音高をその定常区間の音高として順番に割
り当てるようにしたものである。請求項15に記載の演
奏情報発生装置は、請求項9、10又は11に記載の前
記音高割当手段を、前記決定された音階上の音高をその
定常区間の音高として順番に割り当てる際にノート許容
誤差範囲の値に応じて音階外の音高を割り当てるように
構成したものである。
【0019】
【発明の実施の形態】以下、この発明の実施の形態を添
付図面に従って詳細に説明する。図2はこの発明に係る
楽音情報分析装置及び演奏情報発生装置を内蔵した電子
楽器の構成を示すハードブロック図である。電子楽器
は、マイクロプロセッサユニット(CPU)1、プログ
ラムメモリ2及びワーキングメモリ3からなるマイクロ
コンピュータによって制御される。CPU1は、この電
子楽器全体の動作を制御するものである。このCPU1
に対して、データ及びアドレスバス1Eを介してプログ
ラムメモリ2、ワーキングメモリ3、演奏データメモリ
4、押鍵検出回路5、マイクインターフェイス6、スイ
ッチ検出回路7、表示回路8及び音源回路9がそれぞれ
接続されている。
【0020】プログラムメモリ2はCPU1の各種プロ
グラム(システムプログラムや動作プログラムなど)、
各種データ等を格納するものであり、リードオンリーメ
モリ(ROM)で構成されている。ワーキングメモリ3
は、演奏情報やCPU1がプログラムを実行する際に発
生する各種データを一時的に記憶するものであり、ラン
ダムアクセスメモリ(RAM)の所定のアドレス領域が
それぞれ割り当てられ、レジスタ、フラグ、バッファ、
テーブル等などとして利用される。演奏データメモリ4
は、マイク等からの入力音に基づいて発生された演奏情
報(MIDIデータ)などを記憶するものである。ま
た、CPU1には、図示していないが、ハードディスク
装置などを接続して、そこに自動演奏データやコード進
行データ等の各種データを記憶していてもよく、更に、
前記動作プログラムを記憶するようにしてもよい。ま
た、前記ROM2に動作プログラムを記憶せずに、ハー
ドディスク装置にこれらの動作プログラムを記憶させて
おき、それをRAM3に読み込むことにより、ROM2
に動作プログラムを記憶したときと同様の動作をCPU
1に行わせることができる。このようにすると、動作プ
ログラムの追加やバージョンアップ等が容易に行える。
着脱自在な外部記憶媒体の1つとして、CD−ROMを
使用してもよい。このCD−ROMには、各種データ及
び任意の動作プログラムを記憶していてもよい。CD−
ROMに記憶されている動作プログラムや各種データ
は、CD−ROMドライブ(図示せず)によって、読み
出され、ハードディスク装置に転送記憶させることがで
きる。これにより、動作プログラムの新規のインストー
ルやバージョンアップを容易に行うことができる。
【0021】なお、図示していないが、通信インターフ
ェイスをデータ及びアドレスバス1Eに接続し、この通
信インターフェイスを介してLAN(ローカルエリアネ
ットワーク)やインターネットなどの種々の通信ネット
ワーク上に接続可能とし、他のサーバコンピュータとの
間でデータのやりとりを行うようにしてもよい。これに
より、ハードディスク装置内に動作プログラムや各種デ
ータが記憶されていないような場合には、サーバコンピ
ュータからその動作プログラムや各種データをダウンロ
ードすることができる。この場合、クライアントとなる
楽音生成装置である電子楽器から、通信インターフェイ
ス及び通信ネットワークを介してサーバコンピュータに
動作プログラムや各種データのダウンロードを要求する
コマンドを送信する。サーバコンピュータは、このコマ
ンドに応じて、所定の動作プログラムやデータを、通信
ネットワークを介して電子楽器1に送信する。電子楽器
では、通信インターフェイスを介してこれらの動作プロ
グラムやデータを受信して、ハードディスク装置にこれ
らを蓄積する。これによって、動作プログラム及び各種
データのダウンロードが完了する。
【0022】鍵盤10は、発音すべき楽音の音高を選択
するための複数の鍵を備えており、各鍵に対応してキー
スイッチを有しており、また必要に応じて押鍵速度検出
装置や押圧力検出装置等のタッチ検出手段を有してい
る。押鍵検出回路5は、発生すべき楽音の音高を指定す
る鍵盤10のそれぞれの鍵に対応して設けられた複数の
キースイッチからなる回路を含んで構成されており、新
たな鍵が押圧されたときはキーオンイベントを出力し、
鍵が新たに離鍵されたときはキーオフイベントを出力す
る。また、鍵押し下げ時の押鍵操作速度又は押圧力等を
判別してタッチデータを生成する処理を行い、生成した
タッチデータをベロシティデータとして出力する。この
ようにキーオン、キーオフイベント及びベロシティなど
のデータはMIDI規格に準拠したデータ(以下「MI
DIデータ」とする)で表現されておりキーコードと割
当てチャンネルを示すデータも含んでいる。マイクロフ
ォン1Aは、音声信号や楽器音を電圧信号に変換して、
マイクインターフェイス6に出力する。マイクインター
フェイス6は、マイクロフォン1Aからのアナログの電
圧信号をディジタル信号に変換してデータ及びアドレス
バス1Eを介してCPU1に出力する。
【0023】テンキー&各種スイッチ1Bは、数値デー
タ入力用のテンキーや文字データ入力用のキーボード、
音符化処理(音信号分析処理及び演奏情報発生処理)の
スタート/ストップスイッチなどの各種の操作子を含ん
で構成される。なお、この他にも音高、音色、効果等を
選択・設定・制御するための各種操作子を含むが、その
詳細については公知なので説明を省略する。スイッチ検
出回路7は、テンキー&各種スイッチ1Bの各操作子の
操作状態を検出し、その操作状態に応じたスイッチ情報
をデータ及びアドレスバス1Eを介してCPU1に出力
する。表示回路8はCPU1の制御状態、設定データの
内容等の各種の情報をディスプレイ1Cに表示するもの
である。ディスプレイ1Cは液晶表示パネル(LCD)
やCRT等から構成され、表示回路8によってその表示
動作を制御されるようになっている。このテンキー&各
種スイッチ1B、並びにディスプレイ1CによってGU
I(Graphical User Interfac
e)が構成される。
【0024】音源回路9は、複数チャンネルで楽音信号
の同時発生が可能であり、データ及びアドレスバス1E
を経由して与えられた楽音トラック上のMIDIデータ
を入力し、このデータに基づいた楽音信号を生成し、そ
れをサウンドシステム1Dに出力する。音源回路9にお
いて複数チャンネルで楽音信号を同時に発音させる構成
としては、1つの回路を時分割で使用することによって
複数の発音チャンネルを形成するようなものや、1つの
発音チャンネルが1つの回路で構成されるような形式の
ものであってもよい。また、音源回路9における楽音信
号発生方式はいかなるものを用いてもよい。例えば、発
生すべき楽音の音高に対応して変化するアドレスデータ
に応じて波形メモリに記憶した楽音波形サンプル値デー
タを順次読み出すメモリ読み出し方式(波形メモリ方
式)、又は上記アドレスデータを位相角パラメータデー
タとして所定の周波数変調演算を実行して楽音波形サン
プル値データを求めるFM方式、あるいは上記アドレス
データを位相角パラメータデータとして所定の振幅変調
演算を実行して楽音波形サンプル値データを求めるAM
方式等の公知の方式を適宜採用してもよい。また、これ
らの方式以外にも、自然楽器の発音原理を模したアルゴ
リズムにより楽音波形を合成する物理モデル方式、基本
波に複数の高調波を加算することで楽音波形を合成する
高調波合成方式、特定のスペクトル分布を有するフォル
マント波形を用いて楽音波形を合成するフォルマント合
成方式、VCO、VCF及びVCAを用いたアナログシ
ンセサイザ方式等を採用してもよい。また、専用のハー
ドウェアを用いて音源回路を構成するものに限らず、D
SPとマイクロプログラムを用いて音源回路を構成する
ようにしてもよいし、CPUとソフトウェアのプログラ
ムで音源回路を構成するようにしてもよい。音源回路9
から発生された楽音信号は、アンプ及びスピーカからな
るサウンドシステム1Dを介して発音される。
【0025】次に、この発明に係る電子楽器が音信号分
析装置及び演奏情報発生装置として動作する場合の一例
を説明する。図1は図2の電子楽器が演奏情報発生装置
として動作する際のメインフローを示す図である。メイ
ンフローは次のようなステップで順番に実行される。 ステップ11:まず、初期設定処理を行い、図2のワー
キングメモリ3内の各レジスタ及びフラグなどに初期値
を設定したりする。このとき、テンキー&各種スイッチ
1B上の音符化処理スタートスイッチがオン操作された
場合に、ステップ12〜ステップ17までの一連の処理
を行う。
【0026】ステップ12:このステップは音符化処理
スタートスイッチのオン操作有りと判定された場合に行
われるものであり、ここでは、そのオン操作に対応し
て、マイクインターフェイス6を介してマイクロフォン
1Aから入力される音声信号や楽器音の電圧波形を所定
周期(例えば44.1kHz)でサンプリング処理し、
それをディジタルサンプル信号としてワーキングメモリ
3内の所内領域に記憶する。このサンプリング処理は従
来の公知の方法で行うので、ここでは詳細は省略する。
ステップ13からステップ15までが音符化処理スター
トスイッチのオン操作に対応した音符化処理である。こ
の音符化処理ではサンプリングされた音声信号や楽器音
のディジタルサンプル信号を種々分析してそれを音高列
すなわち楽譜表示可能なMIDIデータに変換する。 ステップ13:ステップ12の音声サンプリング処理の
結果得られたディジタルサンプル信号に基づいて音楽的
な音が存在する区間すなわち有効区間がどこにあるのか
を検出する有効区間検出処理を行う。この有効区間検出
処理の詳細については後述する。 ステップ14:ステップ13の有効区間検出処理の結
果、検出された各有効区間内に存在する音楽的な音の定
常部分を検出する定常区間検出処理を行う。この定常区
間検出処理の詳細についは後述する。 ステップ15:ステップ13及びステップ14の処理の
結果、得られた各定常区間毎に最も最適な音符を割り当
てる音高列決定処理を行う。すなわち、このステップで
はMIDIデータを発生する。この音高列決定処理の詳
細については後述する。 ステップ16:ステップ15の処理によって発生された
MIDIデータに基づいて楽譜を作成する楽譜作成処理
を行う。この楽譜作成処理は従来の技術によって容易に
実現可能なので詳細は省略する。 ステップ17:ステップ15の処理によって発生された
MIDIデータに基づいた自動演奏処理を行う。この自
動演奏処理についても従来の技術によって容易に実現可
能なので詳細は省略する。
【0027】図3は図1のステップ13の有効区間検出
処理の詳細を示す図である。以下、ステップ12によっ
て求められたディジタルサンプル信号からどのようにし
て有効区間が検出されるのか、この有効区間検出処理の
動作を図9及び図10を用いて説明する。 ステップ31:ステップ12によって求められたディジ
タルサンプル信号に基づいて平均音圧レベルを算出す
る。図9は、サンプリング周波数44.1kHzでサン
プリングされた音声信号すなわちディジタルサンプル信
号の波形値の一例を示す図である。図9では、約20ポ
イント分の波形値が示されている。ステップ31では、
所定のサンプル数(例えば、10msec相当の時間に
対応するサンプル数)にわたるサンプル振幅値の平均を
求め、それを平均音圧レベルとする。従って、サンプリ
ング周期44.1kHzの場合においては、この所定サ
ンプル数は『441』であり、あるサンプルポイントの
平均値は、そのポイントを最終とする10msec分前
の各ポイントの合計値、すなわちそのポイントから44
1ポイント分前の波形値の合計を441で除した値とな
る。なお、0ポイントから440ポイントまでは、44
1ポイント分の波形値が存在しないので、0ポイントか
らその該当ポイントまでの波形値の平均をそのポイント
の平均値とする。こうして、時系列的な平均音圧レベル
情報が各サンプルタイミング毎に得られる。図9では、
説明の便宜上15ポイント分の波形値の平均値を平均音
圧レベルとする場合を図示している。従って、最初の1
5ポイントまではそれまでの波形値の合計値をそのポイ
ント数で除する形になっている。また、波形値の合計
は、その絶対値を合計することによって求める。図10
(A)はこのようにして求められた平均音圧レベルの値
を、サンプリングポイントを横軸とした場合をグラフ化
して示したものである。以下、この平均音圧レベルを平
均レベルカーブと称する。なお、図9のように15ポイ
ント毎に平均音圧レベルを求める場合には、カットオフ
周波数10Hz程度のローパスフィルタを掛けて、レベ
ル変動を滑らかにしている。従って、実際に441ポイ
ント分の波形値の平均を取る場合には、カットオフ周波
数80〜100Hz程度のローパスフィルタを掛けて、
そのレベル変動を滑らかにするのが望ましい。また、こ
こでは、あるサンプリングポイントの平均値を求めるの
に、そのポイントより前の所定数のポイントの波形値を
合計して平均音圧レベルを求める場合について説明した
が、あるサンプリングポイントを中心として前後に所定
数のポイントの波形値を合計してもよいし、サンプリン
グポイントから後に所定数のポイントの波形値を合計し
てもよい。
【0028】ステップ32:前記ステップ31で求めら
れた図10のような平均レベルカーブを、所定のしきい
値に基づいて有効区間又は無効区間にそれぞれ分類する
処理を行う。この処理では、しきい値として、その平均
レベルカーブの中の最大波形値の20パーセントの値を
しきい値とする。これ以外の値をしいき値としてもよい
ことは言うまでもない。例えば、平均レベルカーブの平
均値をしきい値としたり、又はその平均値の80パーセ
ントをしきい値としたり、平均レベルカーブの最大値の
半分の値をしきい値としたりしてもよい。しきい値は図
10(B)のような点線で示される。従って、この点線
(しきい値)と平均レベルカーブとの交点位置が有効区
間及び無効区間の境界となり、この点線(しきい値)よ
りも大きい区間が有効区間となり、小さい区間が無効区
間となる。図10(B)では、有効区間を○印で示し、
無効区間を×印で示す。
【0029】ステップ33:人間が音高を認知できる必
要な最低長を0.05msecとした場合に、前記ステ
ップ32で決定された無効区間の中からこの最低長より
も小さな無効区間を有効区間に変更する。例えば、サン
プリング周期が44.1kHzの場合にはサンプリング
数で2205個以下の無効区間を有効区間に変更する。
図10(B)においては、左側から第3番目及び第5番
目の無効区間がこの短い無効区間に相当する。従って、
ステップ33の処理の結果、図10(B)は図10
(C)のようになり、有効区間が拡張されたようにな
る。なお、この処理において、全区間内の始まりと終わ
りの部分に存在する無効区間は、短い無効区間に相当す
るが、短いからといって有効区間に変更しない特別な領
域として△印を用いて表現している。
【0030】ステップ34:前記ステップ33の処理の
結果、得られた有効区間及び無効区間のパターンの中か
ら0.05msec以下の短い有効区間を無効区間に変
更する処理を行う。この処理は前記ステップ33と同様
の処理にて行う。図10(C)においては、右端の有効
区間がこの短い有効区間に該当する。従って、ステップ
34の処理の結果、図10(C)は図10(D)のよう
になる。図10(D)から明らかなように、有効区間は
第1区間から第4区間までの全部の4つの区間となる。
なお、区間の終わりの部分の△印は第4の有効区間とみ
なされる。 ステップ35:ステップ34で特定された有効区間の平
均レベルカーブの平均値を求め、それが所定値よりも小
さい場合にその部分を無効区間とする最終的な有効区間
のチェックを行う。この平均値はその有効区間に存在す
る各ポイントの平均音圧レベル値の合計をその有効区間
長で除することによって得られる。このようにして得ら
れた平均音圧レベルの平均値が図10(D)の各区間の
下側に示してある。第1区間は60、第2区間は25、
第3区間は45、第4区間は15である。この平均音圧
レベルの平均値がその区間の最大波形値の30パーセン
トを下回った場合は、その区間を無効区間とする。ここ
では、第2区間及び第4区間が該当するので、それぞれ
の区間が無効区間になる。図10(E)はこのステップ
35の有効区間チェック処理によって特定された有効区
間と無効区間を示す図である。
【0031】ステップ36:ステップ31〜35までの
処理によって特定された有効区間を拡張する処理を行
う。例えば、図10(F)に示すように最大波形値の1
5パーセントを拡張許可レベルとして、そこの部分に線
を引き、有効区間を特定する境界線をその拡張許可レベ
ルの線のところまで拡張する。すなわち、各有効区間の
端から外側に向かって平均レベルカーブの上昇下降をチ
ェックしながら、そのカーブが拡張許可レベルを下回っ
たかどうかのチェックを行いながら拡張処理を行う。こ
のとき、下降が上昇に反転した場合や拡張許可レベルを
下回った場合には、そこまでを有効区間とする。また、
図10(G)は、この有効区間拡張処理の別の例を示す
図である。拡張許可レベルを最大波形値の5パーセント
とし、平均レベルカーブの下降が終了した位置を有効区
間の末端とする。又は、上昇が始まった位置を末端とし
てもいい。この拡張処理によれば、図10(F)の場合
よりも第1区間及び第3区間の拡張幅が大きくなる。こ
のようにして、人間が音高として認知することの可能な
有効区間が最終的に決定することになる。なお、拡張許
可レベルが低く、かつ、有効区間が近い距離にある場合
には、ある有効区間の末尾側の拡張位置と次の有効区間
の先頭側の拡張位置とが接近することもあれば、また同
じ位置になることもある。また、下降が終わる部分と上
昇が始まる部分のいずれを区切りにするかによっても境
界位置が変わる。この拡張処理の結果、有効区間同士が
重複した場合には、両方の中間位置を境界位置とすれば
よい。なお、図10(F)及び(G)では、有効区間の
拡張を前後に行う場合について説明したが、前方向又は
後方向のみにしてもよい。また、前後に拡張する場合
に、前方向と後方向とで拡張許可レベルを異ならせるよ
うにしてもよい。
【0032】図4は図1のステップ14の定常区間検出
処理の詳細を示す図である。ステップ13によって求め
られた有効区間の中から定常区間がどのようにして検出
されるのか、その定常区間検出処理の詳細を図11から
図18までの図面を用いて説明する。音声や楽音などの
音楽的なオーディオ信号を分析する場合、定常部がどこ
にあるかを知ることは重要なことである。リズム系以外
の音色では、定常部の周期性によって音高が決定され、
定常部を骨格として音価が決定されるからである。この
実施の形態では、定常部は、楽譜として表した時に一つ
の音符に相当する区間のことであり、音色、音高、ベロ
シティという音の3大要素の変化に注目し、人間が一つ
の音として認識する区間を時間軸上で検出しようとする
ことをいう。以下、図4のステップに従って、この定常
区間検出処理について説明する。
【0033】ステップ41:図3の有効区間検出処理に
よって得られた有効区間の全ての区間に対して1周期の
基準となる位置を検出する処理を行う。周期の基準位置
を検出するには、大きく分けて、0クロス位置検出かピ
ーク位置検出のどちらか一方を用いるのが一般的であ
る。0クロス位置検出によって周期の基準位置を検出す
るためには、フィルタ等で倍音をできるだけ取り除かな
いと検出は困難であり、帯域分割も必要である。ピーク
位置検出の場合も倍音をできるだけ取り除くことが望ま
しいが、0クロス位置検出ほどはシビアでないため、音
声や楽器の発音可能周波数帯をカットオフ周波数として
バンドパスフィルタを掛けるだけでよく、帯域分割など
の処理を特に行う必要はない。従って、ピーク位置検出
の方が手順が簡単で、そこそこの結果が得られる方法で
あり、望ましい。従って、この実施の形態では、ピーク
位置検出のよって周期の基準位置を検出する場合につい
て説明する。まず、ピーク位置検出を行う前にフィルタ
による倍音削除を行う。これは、発音可能な帯域をカッ
トオフ周波数として、バンドパスフィルタを掛けること
である。音声の場合、人間の発音可能な帯域は80〜1
000Hz程度であり、ユーザを限定せずに、オールマ
イティに分析するにはこれくらいが必要である。但し、
ユーザが限定されている場合には、発音可能な帯域をあ
る程度絞ることによって、倍音による間違いが減少させ
て精度を向上させることができる。ギターなら、80〜
700Hz程度であるが、これも予め音高枠を決めてお
くと精度が上がる。楽器ごとの違いなども予め設定して
おくと精度が向上する。図11に示すように、有効区間
内の楽音波形のピーク位置検出を行う。このピーク位置
検出方法は公知の手法によって行う。楽音波形のピーク
レベルを検知して、これを所定の時定数回路で保持し、
そのピークレベルをスレッシュルドホールド電圧として
次にこのスレッシュルドホールド電圧以上になった場合
を次のピークレベルとして保持し、それを順次繰り返す
ことによって、図11(B)のようなピーク位置を検出
することができる。図11(A)はこのピーク位置を検
出する際のスレッシュルドホールド電圧の様子を示す図
である。図11(A)の音声波形からは、図11(B)
のようなピーク位置が検出されることになる。ピーク位
置P1,P3,P5,P7,PA,PC,PEは共に規
則正しく所定の周期でピーク位置が現れているが、ピー
ク位置P9については、音声波形の若干の乱れによって
不正なピーク位置の現れ方をしている。以下、このよう
な不正なピーク位置が修正されて、正しいピーク位置に
おける定常区間の検出が行われる。
【0034】ステップ42:前記ステップ41で検出さ
れた周期基準位置に基づいて、あるピーク基準位置から
始まる基本区間と、その基本区間の直後の次のピーク基
準位置までの区間(以下、移動区間とする)との2つの
区間について比較を行う。図11(B)に示すように、
ピーク基準位置P7について考えると、最初の基本区間
はピーク基準位置P7から次のピーク基準位置P9まで
の区間79となる。しかし、区間79は帯域最低長以下
の長さなので、ピーク基準位置P7から次のピーク基準
位置PAまでの区間7Aに拡張される。この区間7Aは
帯域最低長よりも大きく、帯域最高長よりも小さいの
で、これに決定する。次に移動区間はピーク基準位置P
Aからピーク基準位置PCまでの区間ACとなる。区間
7Aと区間ACとの誤差率を算出して、それが所定値以
上だったら両区間は一致していないと判断して、移動区
間の長さをさらに広げる。そして、拡大した移動区間と
基本区間とで誤差率を算出して、さらに誤差率が所定値
以上だったら、その時の基本区間では一致しないと判定
し、基本区間の拡大を行う。従って、基本区間はピーク
基準位置P7から次のピーク基準位置PCまでの区間7
Cに拡張される。しかしながら、この区間7Cは帯域最
高長よりも大きいので、比較処理は中止し、この区間で
は一致しなかったと判定される。仮に、区間7Aと区間
ACとの比較の結果、誤差率が所定値(例えば10)よ
りも小さい場合には、両区間は一致すると判定して、次
のピーク基準位置PAから始まる区間3と次の移動区間
について同様の処理を行う。この誤差率の算出方法につ
いては後述する。このとき、ワーキングメモリ(RA
M)には、ピーク基準位置情報と、そのときの誤差率
と、一致フラグとのデータがそれぞれ書き込まれるデー
タ領域を有する。上述の場合、区間7Aと区間ACとが
一致した場合は、ピーク基準位置情報P7と、そのとき
の誤差率と、一致を示す一致フラグとがデータ領域にそ
れぞれ書き込まれる。一方、区間2と区間3とが一致し
ない場合には、不一致フラグだけが書き込まれる。
【0035】図12はこの波形比較処理の中で行われる
誤差率の算出方法を説明するための図である。まず、誤
差率の算出対象となる2つの波形が図12の示すような
比較波1Xと比較波2Xだとする。まず、比較波1X及
び比較波2Xについて、最大振幅値が100パーセント
となるようにその振幅値の正規化を行う。ここで、比較
波2Xは比較波1Xに比べて時間軸(横軸)方向の大き
さが短くなっているので、比較波2Xを比較波1Xと同
じ時間幅となるように伸長する。これによって、比較波
1Xは比較波1Yとなり、比較波2Xは比較波2Yとな
り、時間軸の伸長によって最終的には比較波2Zとな
る。この比較波1Yと比較波2Zとの間で誤差率の計算
が行われる。図13は、比較波1Yと比較波2Zとの間
の誤差率を算出する場合の具体例を示す図である。図で
は、比較波1Yと比較波2Zの最初の1周期の波形すな
わちサンプリング数で24個分について誤差率を算出す
る場合について説明する。比較波1Yと比較波2Zの同
じサンプリング位置についてその差分を算出し、その差
分の絶対値の合計を求める。図13の場合には絶対値の
合計値は122である。これをサンプリング数24で除
することによって、誤差率が求まる。この場合には誤差
率は5となる。この場合、所定値を10とすれば、この
誤差率は10以下なので、同じ波形として処理される。
図13において、各波形は1000を最大レベルとして
正規化されている。このようにして波形比較処理が行わ
れることによって、図11(B)のピーク基準位置P9
はキャンセルされ、図14(A)のように規則正しいピ
ーク位置が検出されることになる。
【0036】ステップ43:ステップ42の波形比較処
理の結果を利用して、誤差率が所定値(例えば10)よ
りも小さな区間同士を繋げて、それを疑似的な一致区間
とし、その一致区間の最大値と最小値を検出し、それに
基づいてカットオフ周波数帯を決定する。例えば、波形
比較処理の結果得られた複数の一致区間の中の最小値が
235ポイントで、最大値が365ポイントだとする。
この一致区間にやや余裕を持たせるために、最小値を1
割減とし、最大値を1割増しとすると、一致区間は約2
12ポイントから約402ポイントになる。これは、サ
ンプリング周波数が44.1kHzだと、110Hzか
ら208Hzのオーディオ信号の周波数帯に相当する。
従って、この110Hzから208Hzをカットオフ周
波数帯とする。 ステップ44:ステップ43で決定された新たなカット
オフ周波数を用いて、ステップ41及びステップ42と
同様の処理を繰り返し実行する。例えば、前述の場合に
は、カットオフ周波数を110Hzから208Hzの範
囲として、ステップ41の周期基準位置検出処理とステ
ップ42の波形比較処理を繰り返し、同じ波形の連続す
る区間(一致区間)を検出する。これによって、誤差の
原因となる低周波や高調波がカットされてより精度の高
い処理が可能となり、前回よりも精度の高い一致区間が
得られる。このステップ44の同波形区間検出処理によ
って、図11(A)のような音声波形は、図14(B)
のような三つの区間X,Y,Zに分割されたような形、
すなわち、区間Xと区間Zが区間Yによって連続性の途
切れた形になる。図14(B)では、音声波形のプラス
側もマイナス側も同じような場所で途切れている。な
お、図15(A)のような音声波形の場合には、4周期
目と5周期目の基音成分がやや少ないので、プラス側の
ピークがうまく認識できずに、図15(B)のようなピ
ーク位置が検出されることになる。従って、図15
(A)のような音声波形についてステップ41からステ
ップ44の処理を行うと、図15(C)のようにプラス
側だけがピーク位置P5とピーク位置PBとの間で連続
性の途切れたような形になる。しかしながら、これが定
常区間であるの場合には、プラス側かマイナス側のどち
らかに必ず基音成分が顕著に現れるので、図15(A)
の音声波形の場合には音声波形のマイナス側については
同波形区間として規則正しく認識される。従って、ステ
ップ42での波形比較処理における誤差率が許容範囲内
であったとすると、定常区間は図15(C)のようなマ
イナス部分の矢印で示される範囲となり、プラス側の途
切れた部分は誤りだったと認識されることになる。な
お、音声波形の場合は、基音成分がプラス側でもマイナ
ス側でも乱れる場合が結構あり得るので、ステップ46
で定常部の重ね合わせ処理を行い、その対策を行うよう
にしている。
【0037】ステップ45:ステップ44までの処理に
よって図16(A)に示すような両矢印に対応した区間
が同波形区間であると認定された場合に、その区間を拡
張する。すなわち、同波形区間内の先頭(○印の部分)
と末尾(×印の部分)の波形をそれぞれ基本波形とし
て、その両側の区間をそれぞれ移動区間としてステップ
42の波形比較処理と同じ方法によって、誤差率を求
め、同波形区間を拡張する。このとき、誤差率のしきい
値をステップ42の場合よりも高め(例えば誤差率15
程度)に設定しておくことによって、この同波形区間を
図16(B)のような点線矢印で示すような位置にまで
拡張することができる。但し、拡張した結果が隣の区間
に重なった場合にはその時点で拡張処理を止める。この
ようにして拡張された同波形区間が音声波形のプラス側
及びマイナス側のそれぞれの定常区間となる。 ステップ46:ステップ41からステップ45までの処
理は、音声波形のプラス側及びマイナス側についても行
われるので、両側で独立に得られた定常区間を重ね合わ
せる。例えば、ステップ45までの処理の結果、プラス
側とマイナス側の定常区間が図17(A)に示すような
矢印の範囲になったとする。これらプラス側とマイナス
側の定常区間をそれぞれ重ね合わせると、図17(B)
のハッチングされた長方形部分が最終的な定常区間とな
る。この場合、プラス側及びマイナス側に存在するそれ
ぞれ5つの定常区間はステップ46の定常部重ね合わせ
処理の結果、4つの定常区間となる。
【0038】ステップ47:ステップ46までの処理に
よって得られた定常区間についてさらに今度は音高及び
音圧の変化による細分化処理を行う。ステップ46まで
の定常区間検出処理では、波形を引き延ばして比較して
いるため、『ああ』などのような連続母音による音声波
形の音高変化であっても、それを1つの同じ音としてと
らえるような仕組みになっている。従って、楽器音の楽
音波形の場合には、持続系の楽器音の音高変化を見つけ
出せないような事態も起こる。そこで、この実施の形態
では、ステップ46までの処理によって得られた定常部
区間ごとに音高変化の状態を調べて、その状態に応じて
さらに分割する必要があるかどうかの判定を行い。必要
があると判定された場合には、定常部区間をさらに細か
く分割する。例えば、ある定常区間の中における周期基
準位置の間の長さを計算し、それをサンプリング周波数
で割ることによってその周期基準位置おける周波数が算
出される。図18(A)は定常区間を構成する各波形の
周波数の値を示すと共に、その区間の周波数と前区間の
周波数との差分をノートに対応したリニア軸で数値化し
たノート距離を示している。ここで、ノート距離は、 log(比較される周波数/元となる周波数)/log
(12√2) の式によって算出される。このノート距離の値が±0.
5の範囲内にある場合は急激な音高の変化ではないと見
なし、これよりも大きい値の場合は音高が急激に変化し
たものと見なして、その部分を区間の区切りとしてその
定常区間をさらに細かく分離する。例えば、図18
(A)の場合には、定常区間の第10番目から第12番
目のノート距離が共に0.5よりも大きいので、その部
分で音高が急激に変化したとみなされるので、定常区間
がさらに第1番目から第9番目までの区間と、第13番
目から第24番目までの区間に分離される。これは、音
色は変わらないが音高が変化した時の音符の区間を検出
しているのに等しい。
【0039】次に、音圧についても音高変化の場合と同
様のことが言えるので、音圧レベルが急激に変化した位
置を検出し、その部分で定常区間をさらに細かく分割す
る。図18(B)は定常区間を構成する各波形の平均音
圧レベルの値を示すと共に、その区間の平均音圧レベル
と前区間の平均音圧レベルとの増幅比を示している。こ
の増幅比は log(前区間の平均レベル/その区間の平均音圧レベ
ル) によって得られる。この増幅比の値が±0.01の範囲
内の場合は急激な音圧変化はないと見なし、これよりも
大きな値の場合は音圧が急激に変化したものと見なし
て、その部分を区間の区切りとして、その定常区間をさ
らに細かく分離する。例えば、図18(B)の場合に
は、定常区間の第16番目と第17番目が0.01より
も大きいので、その部分は音圧レベルの急激な変化部分
と見なされる。従って、初期分割区間のように3つの区
間に分割される。ところが、人間が音を感知できるの
は、0.01秒から0.1秒程度なので、それに応じて
区間の最低長を決め、それ以下の区間はその次の区間と
繋げることとする。従って、図18(B)の初期分割区
間の2番目の区間(○印の部分)は3番目の区間に繋げ
られて、最終的には初期分割区間の右側に示すような2
区間に分割されることになる。
【0040】図19は、図4の定常区間検出処理の概念
を示すための図である。図19において、有効区間は図
3の有効区間検出処理によって検出された結果である。
同波形区間はステップ41からステップ46までの処理
によって得られた区間である。同音高区間は、ステップ
47の音高変化の急激な部分で同音高区間をさらに細か
く分割することによって得られた区間である。同音圧区
間はこの同音高区間をさらに音圧変化の急激な部分で分
割することによって得られた区間である。なお、ノート
距離及び増幅比でそれぞれ定常区間(同波形区間)を分
割する場合について述べたが、分割された結果のいずれ
か一方だけを採用してもよいし、両方を採用してもよ
い。両方採用する場合に前述と同様に区間の最低長によ
る調整を行うようにしてもよい。また、ノート距離及び
増幅比で分割する場合に、いずれか一方の分割処理を優
先的に行い、その結果分割されなかった場合に限り他方
の分割処理を行うようにしてもよい。
【0041】図5は図1のステップ15の音高列決定処
理の詳細を示す図である。ステップ14によって検出さ
れた各定常区間に対して最適な音高列を決定する。な
お、この実施の形態では、4種類の音高列決定処理につ
いて、図20から図25までの図面を用いて説明する。
音声や楽音などを最終的に音符情報に変換する場合、あ
る特定周波数をどの音高に丸めるかによってメロディが
大幅に変わってしまい、思ったような検出ができない場
合が多い。そこで、この実施の形態では、相対音を主体
として音高を決定し、さらにそれに調を利用して一番ふ
さわしい音高遷移を選択することによって音高列を決定
するようにした。まず、音高列決定処理の第1の実施例
である音高列決定処理1について、図5のフローチャー
トに従って説明する。 ステップ51:ステップ13(図3)の有効区間検出処
理及びステップ14(図4)の定常区間検出処理によっ
て得られた各定常区間に対してその区間の代表周波数を
決定する。図20(A)は、最終的に得られた定常区間
の一例を示す図である。ここでは全部で12個の区間が
検出されたものとして、各区間に括弧記号で囲まれた
〔0〕〜〔12〕の区間番号を割り当ててある。各定常
区間の代表周波数を決定する場合に重要なことは、各定
常区間の周期位置から周波数の動向を洗い出して、その
区間固有の周波数を1つに決定することである。そのた
めの方法として、第1の方法は定常区間全体の平均周波
数をその区間の代表周波数とする。第2の方法は定常区
間の丁度中間付近の周期(周波数)をその区間の代表周
波数とする。第3の方法はピッチが安定している部分の
平均周波数をその区間の代表周波数とする。なお、この
実施の形態では、図1のステップ14の定常区間検出処
理の際に算出した誤差率を用いて代表周波数の算出処理
を行う。すなわち、図4のステップ45の定常区間拡張
処理前の同波形区間検出処理を利用して、その中で所定
値(例えば10)以下の誤差率の並んだ安定した定常区
間における周波数の平均を算出し、それをその定常区間
の代表周波数とする。例えば、図4のステップ44の同
波形区間検出処理で、隣接する区間の誤差率が10以下
の場合を波形が一致すると判断して、定常区間を検出し
たとする。この場合(定常区間拡張処理前)の定常区間
を構成する各波形区間の情報が図20(B)のようにな
っていたとする。すなわち、図20(B)に示すように
定常区間は誤差率10以下の12個の波形区間で構成さ
れる。各波形区間の周期長及び誤差率は図示の通りであ
る。この場合、この定常区間における周期長の平均値
は、255.833となる。ここで、周期長はサンプリ
ング数で表されているので、サンプリング周波数が4
4.1kHzだから、この定常区間の代表周波数は、そ
の周期長の平均値でサンプリング周波数を除することに
よって得られ、図20(B)の場合には172.38H
zとなる。この場合、代表周波数の値は小数点2桁を有
効として扱う。図20(C)はこのようにして図20
(A)のような各定常区間の代表周波数を算出した結果
を示す図である。
【0042】ステップ52:ステップ51の処理によっ
て各定常区間の代表周波数が決定されると、今度はその
代表周波数に基づいて各定常区間の相前後する定常区間
番号同士のノート距離を決定する。ノート距離の決定は
図4のステップ47で用いた演算式と同様にして求め
る。図20(C)にはこのようにして算出されたノート
距離の一例が示されている。 ステップ53:算出されたノート距離の小数点以下一桁
を四捨五入して、ノート距離を12音階上の各音高へ丸
め込む。例えば、図20(C)の場合には、各ノート距
離は四捨五入されて、右欄の実数のようになる。この実
数は、前音高からのノート番号上の差を示すことになる
ので、最初の音高を決定することによって、音高列デー
タを完成することが可能となる。図20(C)の最右欄
に示す音高列データが最初の音高を0とした場合の音高
遷移のようすを示すデータである。すなわち、図20
(C)の場合には0−2−4−5−2−3・・・とな
る。 ステップ54:第1音の音高を決定する。まず、最も簡
単な方法は、第1音にデフォルト値として60のノート
ナンバ(ノートネームC4)音を割り当てる。すなわ
ち、MIDI規格の場合、ノートナンバの限界は0〜1
27なので、第1音の音高として、ノートナンバ60
(ノートネームC4)の音を割り当てる。これによっ
て、高音側(プラス側)には67半音分、低音側(マイ
ナス側)には60半音分だけ音高を振ることができる。
このようにすると図20(C)の最右欄の音高列を示す
データは、60(C4)−62(D4)−64(E4)
−65(F4)−62(D4)−63(D♯4)・・・
・となる。
【0043】ステップ55:ステップ54で決定された
音高列データを修正する。すなわち、ステップ54で決
定された音高列データの振れ幅を検出し、それが低音側
(マイナス側)に−60以下に振れている場合には、そ
の最小振れ幅に合わせてデフォルト値60を修正する。
この修正は、最小振れ幅のノートが0以上となるように
デフォルト値を上側にシフトすることによって行う。例
えば、最小振れ幅が−64の場合には、計算式−60−
(−62)=4の結果に従って、デフォルト値60を4
ノート分上側にシフトして、第1音として64を割当て
る。高音側(プラス側)に+67以上振れている場合に
も同様に最大振れ幅に合わせてデフォルト値60を修正
すればよい。なお、低音側(マイナス側)及び高音(プ
ラス側)の両方において振れ幅がオーバーすることは人
間の発声帯域から判断してあり得ないので、そのような
場合は除外する。なお、このようなことが起こり得るよ
うな場合には、特別に音域を0〜256の範囲で設定す
るようにしてもよい。なお、ステップ54では、第1音
の音高をデフォルト値(例えば60)として決定し、音
高列データを作成する場合について説明したが、これに
限らず、最初の定常区間の代表周波数に最も近い純正率
音階の周波数を検出し、その音階に当てはめるようにし
てもよい。例えば、図20(C)の場合には、区間番号
〔0〕の代表周波数は172.38Hzなので、第1音
の音高をそれに最も近いノートナンバ53(ノートネー
ムF3)に決定する。これによって、図20(C)の音
高列を示すデータは、53(F3)−55(G3)−5
7(A3)−58(A♯3)−55(G3)−56(G
♯3)・・・・となる。
【0044】次に、音高列決定処理の第2の実施例であ
る音高列決定処理2について、図6のフローチャートに
従って説明する。この音高列決定処理2におけるステッ
プ61及びステップ62の処理は、前述の図5のステッ
プ51及びステップ52と同じなので、ここでは、ステ
ップ63からの処理について説明する。 ステップ63:算出されたノート距離を用いて、複数ス
ケール上の各音高に丸めた場合のノート割当誤差の累計
処理を行う。すなわち、この実施の形態では、自然的音
階、和声的音階、旋律的音階の3種類の音階について、
それぞれ丸めた場合の適合度を算出する。自然的音階は
図21に示すように全音,半音,全音,全音,半音,全
音,半音の順番に割当可能音が並んでいる。また、和声
的音階は全音,半音,全音,全音,半音,3半音(全音
+半音),半音の順番に並んでいる。また、旋律的音階
は、上昇時には全音,半音,全音,全音,全音,全音,
半音の順番となり、下降時に自然的音階と同じような順
番の並びになっている。図21では○印が音階構成音と
して採用可能なものを示し、×印は音階構成音として採
用不可のものを示す。図21の各音階について、最初の
音が各○印の音高から始まったものと仮定して、各定常
区間番号の音を×印を選択しないように順次割り当て
る。このときに、定常区間番号の音と割り当てられた音
との間の音高差すなわちノート割当誤差を算出し、それ
を累計する。例えば、定常区間番号
〔0〕に対するノー
ト距離が図20(C)のような音高列データの場合に、
定常区間番号〔5〕までを図21の自然的音階に割り当
ててみる。まず、図20(C)の定常区間番号
〔0〕の
音は最初の音なので図21の自然的音階のノート位置
(0)に割当てられる。次に図20(C)の定常区間番
号〔1〕の音は定常区間番号
〔0〕の音に対してノート
距離が1.7158なので、ノート距離としては半音又
は2半音(全音)が選択されるべきである。このとき、
自然的音階ではノート距離で半音の音すなわちノート位
置(1)は×印なので、ここは選択されないで、ノート
距離で2半音(全音)の音すなわちノート位置(2)に
割り当てられる。従って、ノート距離1.7158の音
がノート位置(2)に割り当てられたので、定常区間番
号〔1〕の音のノート割当誤差は、実際に割り当てられ
たノート位置(2)までのノート距離2と定常区間番号
〔0〕と定常区間番号〔1〕とのノート距離1.715
8との差分となり、その値は0.2842となる。次
に、定常区間番号〔2〕の音は定常区間番号〔1〕の音
に対してノート距離が2.1557なので、ノート距離
として全音又は3半音(全音+半音)が選択される。定
常区間番号〔1〕の音は前回の処理で、ノート位置
(2)に割り当てられているので、定常区間番号〔2〕
の音はノート距離全音又は3半音(全音+半音)のノー
ト位置(4)又は(5)に割り当てられることになる。
このとき、自然的音階ではノート位置(4)の音は×印
なので、定常区間番号〔2〕の音はノート位置(5)に
割り当てられることになる。従って、ノート距離2.1
557の音がノート距離3に対応するノート位置(5)
に割り当てられることになる。従って、定常区間番号
〔2〕の音のノート割当誤差は0.8443となる。前
回の定常区間番号〔1〕の場合と今回の定常区間番号
〔2〕の場合との累計は、0.2842+0.8443
=1.1285となる。このようにして、残りの定常区
間番号〔3〕から定常区間番号〔5〕までの音について
計算を行い、ノート割当誤差の累計値を算出すると、
2.233となる。この値は、自然的音階のノート位置
(0)を出発音とした場合である。従って、このノート
割当誤差の累計値の計算を自然的音階のノート位置
(2)、(3)、(5)、(7)、(8)、(10)に
ついても行い、同じく和声的音階及び旋律的音階の各ノ
ート位置についても行う。図22(A)は、このように
して、各音階について、各ノート位置を出発音とした場
合におけるノート割当誤差の累計値を示す図である。
【0045】ステップ64:複数スケール上の各音高に
丸めた場合におけるノート割当誤差が0.5以上のもの
の累計値を算出する。すなわち、ステップ63の場合
は、ノート割当誤差の全ての値の累計値を算出したが、
このステップでは、ノート割当誤差が0.5以上の場
合、すなわち図20(C)の場合、定常区間番号〔1〕
はノート距離(2)の位置に、定常区間番号〔2〕はノ
ート距離(3)の位置に丸められることがノート割当誤
差も小さく理想的であるが、前述のように音階によって
は×印であって、割り当てることのできない場合が存在
する。このような場合には、ノート距離に最も近い音高
以外の音高に割当が修正されることになる。従って、こ
のような場合、すなわちノート割当誤差が0.5以上の
場合を、ノート修正誤差として、その累計値を算出す
る。図22(B)がこのノート修正誤差の累計値を示す
図であり、図22(A)に対応している。 ステップ65:前記ステップ64でノート割当誤差が
0.5以上のノート数、すなわちステップ64の累計値
の算出に使用したノート数の合計を計算する。図22
(C)がこのノート数の合計を示す図であり、図22
(B)に対応している。
【0046】ステップ66:前記ステップ63から前記
ステップ65までの処理の結果、すなわち図22(A)
〜(C)の算出結果を利用して、一番ふさわしい音階
と、その始まり音を決定する。この決定方法には図22
(A)のノート割当誤差の累計値の最も小さいもの、図
22(B)のノート割当誤差0.5以上の累計値の最も
小さいもの、図22(C)のノート割当誤差0.5以上
のノート数の最も少ないもの、これらを適宜組み合わせ
たものなどが考えれる。ただし、近親調(関係調)など
のによって、最終的に1つに決定するとは限らない。こ
のような場合には、どれを利用しても同じメロディ遷移
となるので、どの決定方法を選択してもよい。従って、
図22(A)において、ノート割当誤差の累計値の最小
値は1.688であり、自然的音階に2ヵ所、和声的音
階に1ヵ所、旋律的音階に1ヵ所の合計4ヵ所に存在す
る。次にこの4ヵ所について、図22(B)最小値を探
す。すると、4ヵ所とも0.891で同じ値である。従
って、これら4ヵ所のどれを選択してもよいことになる
が、ここでは、上側音階を優先し、左側ノート位置を優
先することとする。従って、最終的には、音階は自然的
音階が決定し、始まり音は3度に決定する。なお、図2
2では音階の表示を統一するために、短音階で表示して
いたので、自然的音階の3度始まりの音は、自然(長)
音階の1度(トニック)音ということになる。 ステップ67:前記ステップ66で決定した音階と始ま
り音に基づいて、再度ノート割当誤差の算出処理と同じ
処理を行い、音高列を決定する。このようにして、図2
0(C)の定常区間番号に割り当てられた音高列を図2
2(D)に示す。図20(C)の場合には音高列は0−
2−4−5−2−3・・・であったが、今回の音高列は
0−2−4−5−2−4・・・である。これから明らか
なように定常区間番号〔5〕の音高列が『4』であり、
図20(C)の『3』と異なっていることがよく理解で
きる。
【0047】図6の音高列決定処理2の場合は、音階を
使って音を丸めることで、不安定な音がスケール音に丸
められるため、比較的安定したメロディに近づくのでユ
ーザの所望の音に近づく可能性が極めて高い。しかしな
がら、音感のよいユーザが音階構成音以外にわざと音を
ずらしてメロディを入力した場合には、このように音階
構成音に音を丸めるという処理は不適切である。最終的
にはメロディの善し悪しを判断しなければならない場合
もありうるが、それは現在の技術では不可能なため、図
6の音高列決定処理2のように音階を意識しながら音を
丸めて、特殊な音に限り、音階構成音以外の音でも認め
るようにすればよい。音階構成音以外の音とのノート距
離がある一定値以下の場合には、スケール構成音以外の
音であってもその音に丸めるという処理を行う。これ
は、図5の音高列決定処理1と図6の音高列決定処理2
との間に位置する中間的な音の丸め処理に該当する。図
6の音高列決定処理2によって、自然短音階の3度が始
まり音だと決定した後(すなわちステップ66の処理の
後)に、ノート誤差許容範囲を決定する処理を行う。こ
の処理は、予めノート誤差許容範囲として0.2などの
定数を設定する方法と、計算によって求める方法とがあ
る。計算によって求める方法は、図6のステップ63の
処理で音階構成音に丸める処理を行う時に、ノート距離
が0.5以下で丸められた場合におけるそのノート距離
の平均値を算出し、ユーザ(発声者)の音高ずれの傾向
を把握して、その平均値の定数倍をノート誤差許容範囲
とする方法が考えられる。この実施の形態では、ノート
許容誤差範囲として定数値の0.2を採用した場合につ
いて、図20(C)の各定常区間にどのような音高列が
割り当てられるのかを説明する。まず、図6のステップ
66の処理によって、自然短音階の3度が始まり音だと
決定するので、定常区間番号〔1〕のノート距離は1.
7158なので、一番近い音高は4度すなわちノート位
置(5)の音となる。この場合はそのまま近い音高に丸
めてしまえば問題ないので、ノート位置(5)の音が決
定する。次に定常区間番号〔2〕、〔3〕、〔4〕につ
いては同様にして音階内の音として、ノート位置
(7)、(8)、(5)が次々と決定する。ところが、
定常区間番号〔5〕については、ノート距離が1.10
93であり、定常区間番号〔4〕がノート位置(5)に
決定しているので、一番近い音高はノート位置(6)と
なる。このノート位置(6)の音高は音階構成音以外の
音である。従って、この場合にはノート許容誤差範囲内
かどうかの判定が行われる。この場合には、ノート距離
が1.1093なので、誤差は0.1093となり、ノ
ート許容誤差範囲の0.2以下なので、音階構成音以外
の音ではあるが、このノート位置(6)が採用されるこ
とになる。なお、定常区間番号〔5〕のノート距離が例
えば1.2093であったら、誤差は0.2093とな
り、ノート許容誤差範囲の0.2よりも大きいため、ノ
ート位置(6)とはならずに、その一つ上の音階構成音
であるノート位置(7)の音に決定することになる。こ
のようにノート許容誤差範囲を設定して、音階構成音以
外の音も音高列に加えることができるようにすることに
よって音階を使いながらも音階構成音以外の音にも配慮
でき、人がイメージして歌ったメロディに近い音高列を
決定することが可能となる。
【0048】次に、音高列決定処理の第3の実施例であ
る音高列決定処理3について、図7のフローチャートに
従って説明する。前述の音高列決定処理1、2では、直
前の音とのノート距離に基づいて音高列を決定する場合
について説明したが、一連のフレーズにおいては直前の
音とのノート距離だけで次の音高が決定することはな
く、フレーズの流れすなわち音高列を構成する音はその
フレーズの先頭の音に対して影響するので、ここでは、
フレーズを検出し、音高列の決定について、そのフレー
ズ先頭の音との音高差を考慮して音高列を決定するよう
にした。 ステップ71:図4の定常区間検出処理によって検出さ
れた定常区間の長さを音価列(時価列)のグリッド数で
表した場合にどれくらいになるのか決定する。定常区間
が図23(A)のような場合、各定常区間の先頭から次
の定常区間の先頭までを1つの区間として図23(B)
のような音価基準を作成する。1秒間の数百分の一程度
を1グリッドとした場合に、これらの音価基準がそのグ
リッドの何個分で構成されるかを決定する。図23
(C)が音価列を決定するためのグリッドである。従っ
て、図23(B)のような音価基準を図23(C)のグ
リッドに適合させるために、各音価基準の位置を修正す
る。例えば、音価基準の境界位置がグリッドとグリッド
の間に位置する場合には、最も近いグリッドに音価基準
の境界位置を変更する。なお、グリックとグリッドのち
ょうど中間に位置する場合には、前側のグリッドに音価
基準の境界位置を変更する。このようにして音価基準の
境界位置が変更されたものが、図23(D)の音価区間
である。図23(D)の音価区間の上側には定常区間番
号と同じ音価区間番号が、その下側にはその各音価区間
のグリッド数が示されている。グリッド数の並びは、
4,4,5,6,3,6,11,4,7,3,5,3,
10,・・・のようになっている。
【0049】ステップ72:このように各音価区間の長
さがグリッド数で規定されたので、今度は、そのグリッ
ド数に基づいて複数の音価区間を纏めて1つのフレーズ
を構成する。フレーズを構成する手法は、本願の出願人
が先に出願した特願平7−123105号に記載してあ
るので、ここでは簡単に説明する。まず、一つの音価区
間が一つの音符に対応するので、各音価区間の長さに基
づいて音価区間の平均の長さ(平均音価区間長)を算出
する。算出した平均音価区間長に所定係数K(1以上の
値であり、例えば2)を乗じることによって乗算値を得
る。このようにして得られた乗算値以上の値の音価区間
長を検出する。検出された音価区間の後にフレーズの区
切りを示す区切りデータを挿入する。区切りデータによ
って区切られた音価区間が一つのフレーズを構成するこ
とになる。今度は、このようにして纏められた各フレー
ズ毎に平均音価区間長を算出する。算出された平均音価
区間長に所定係数L(1以上の値であり、例えば2)を
乗じる。各フレーズの最後の音価区間の長さすなわち終
端音価区間長がこの乗算値よりも小さい場合には、その
フレーズの最終音価区間の後に挿入されているフレーズ
区切りデータを削除する。終端音価区間長が乗算値以上
の場合には何もしない。このようなフレーズ削除処理を
全フレーズに対して行う。例えば、図23(D)の場合
は、グリッド数の合計は、 4+4+5+6+3+6+11+4+7+3+5+3+
10=71 である。これを区間数13で割ると、71÷13=5.
46となる。小数点一桁で四捨五入すると、平均音価区
間長は5となる。この5に所定係数2を乗じた値は10
となる。従って、音価区間長が10以上である音価区間
は、音価区間〔6〕と音価区間〔12〕である。従っ
て、これらの音価区間〔6〕及び〔12〕の後に区切り
データが挿入されるので、図23(E)に示されるよう
に第1フレーズは音価区間
〔0〕〜〔6〕の7個で構成
され、第2フレーズは音価区間〔7〕〜〔12〕の6個
で構成される。
【0050】ステップ73:ステップ72で決定された
フレーズの各音価区間の代表周波数を決定する。ここ
で、音価区間は前述の図5の音程列決定処理1の定常区
間に相当するので、ステップ51と同じ方法で音価区間
の代表周波数を決定する。 ステップ74:フレーズ先頭音すなわちフレーズの先頭
の音価区間の代表周波数との間でノート距離を決定す
る。音程列決定処理1及び2では、直前の定常区間との
間だけでノート距離を算出していたが、ここでは、フレ
ーズの先頭の音価区間
〔0〕の代表周波数を基準とし
て、そのフレーズの各音価区間のノート距離を決定す
る。図24は、第1フレーズの音価区間
〔0〕〜〔6〕
における代表周波数の値と、第1フレーズの先頭の音価
区間
〔0〕と、第1フレーズを構成する各音価区間
〔1〕〜〔6〕との間のノート距離の値を示す図であ
る。 ステップ75:前記ステップ75で算出されたノート距
離に基づいて、前述の音程列決定処理1のステップ53
からステップ55までの処理、又は音程列決定処理2の
ステップ63からステップ66までの処理を行い、所定
の音程列を決定する。
【0051】次に、音程列決定処理の第4の実施例であ
る音程列決定処理4について、図8のフローチャートに
従って説明する。前述の音程列決定処理3では、フレー
ズの先頭音すなわちフレーズの先頭に位置する定常区間
の音との間でノート距離を算出して音程列を決定する場
合について説明したが、一連のフレーズにおいてはフレ
ーズ先頭音だけではなく、その該当する音が発音される
までに発音された音に対して影響することもあるので、
ここでは、フレーズを検出し、音程列の決定について、
各フレーズにおいて、その音が発音されるまでに発音さ
れた音との関係を考慮して音程列を決定するようにし
た。ステップ81からステップ83までの処理は、ステ
ップ71からステップ73までの処理と同じなので説明
を省略する。 ステップ84:フレーズ内の各前置音との間におけるノ
ート距離を決定する。図23(E)の第1フレーズにつ
いてこのノート距離を求める。まず、第1フレーズの音
価区間
〔0〕については前置音が存在しないので、ノー
ト距離は存在しない。音価区間〔1〕については前置音
として音価区間
〔0〕が存在するので、そのノート距離
は1.7158となる。音価区間〔2〕については前置
音として音価区間
〔0〕と〔1〕が存在するので、それ
ぞれのノート距離を求めると、3.8715と2.15
57となる。以下、同様にして各音価区間の前置音との
間のノート距離を算出すると、図25(A)のようにな
る。 ステップ85:フレーズ内の各前置音との間における時
間距離に基づいて重み付けを行う。まず、各音価区間が
前置音との間にどれだけの時間差を有するかをそのグリ
ッド数で表す。図23(E)の第1フレーズについてこ
れを算出すると、その値は図25(B)に示すようにな
る。音価区間
〔0〕については前置音が存在しないの
で、時間距離は存在しない。音価区間〔1〕については
前置音として音価区間
〔0〕が存在するので、その時間
距離は4グリッドとなる。音価区間〔2〕については前
置音として音価区間
〔0〕と〔1〕が存在するので、そ
れぞれの時間距離を求めると、8グリッドと4グリッド
となる。以下、同様にして各音価区間の前置音との間の
時間距離を算出すると、図25(B)のようになる。こ
のようにして求められた時間距離に基づいて、その重み
を算出する。各音価区間の時間距離をその各音価区間の
総和で除した除算値の逆数の総和が100となるように
正規化したものを各音価区間の時間距離による重みとす
る。例えば、図25(B)の音価区間〔2〕の場合は、
時間距離は8グリッドと4グリッドである。音価区間
〔2〕の時間距離8をその音価区間の総和である12で
除した値は8/12=2/3であり、時間距離4をその
音価区間の総和である12で除した値は4/12=1/
3である。この除算値の逆数3/2と3/1の総和が1
00となるには、それぞれの逆数3/2及び3/1に2
00/9を乗じたものである。従って、音価区間〔2〕
の区間番号
〔0〕に対する重みは33.3となり、区間
番号〔1〕に対する重みは66.7となる。このように
して、各音価区間毎に時間距離により重み付けが行われ
る。図25(C)は図25(B)の時間距離による重み
付けしたものの値を示す。
【0052】ステップ86:前記ステップ85の処理に
よって算出された重みに基づいて各音価区間の音を12
音階又は所定の音階上の音に丸める処理を行う。12音
階上の音に丸める処理は図5のステップ53〜ステップ
55の処理を行う。音階上の音に丸める処理は図6のス
テップ63〜ステップ66の処理を行う。この際に、ノ
ート距離として時間距離による重みを参考にする。例え
ば、図25(C)において、音価区間〔1〕の前置音は
音価区間
〔0〕の音だけなので、ノート距離は1.71
58がそのまま使用される。故に、ノート距離1.71
58に最も近い音程として音価区間
〔0〕の音よりも全
音高い音が選択される。次に音価区間〔2〕について考
察すると、音価区間〔2〕の音は音価区間
〔0〕に対し
ては、33.3パーセントの重みで影響を受け、音価区
間〔1〕に対しては、66.7パーセントの影響を受け
る。このとき、音価区間〔1〕は既に音価区間
〔0〕と
の間でノート距離として『2』が決定しているので、音
価区間
〔0〕と音価区間〔2〕との間のノート距離3.
8715からはそのノート距離『2』を減算した値1.
8715となる。一方、音価区間〔2〕と音価区間
〔1〕とのノート距離は2.1557である。従って、
音価区間〔2〕のノート距離はその重みを考慮して、次
のように算出される。 (1.8715×33.3+2.1577×66.6)
/100=2.06 従って、音価区間〔2〕のノート距離は2.06とな
る。このノート距離2.06を用いて、12音階上の音
に丸める処理(図5のステップ53〜ステップ55の処
理)又は音階上の音に丸める処理(図6のステップ63
〜ステップ66の処理)を行う。
【0053】
【発明の効果】この発明に係る音信号分析装置によれ
ば、マイク等からの入力音のピッチ又はレベルが微妙に
ゆれた場合でも、音楽的な音が存在する区間(有効区
間)を容易に分析することができる。別の発明に係る音
信号分析装置によれば、マイク等からの入力音のピッチ
又はレベルが微妙にゆれた場合でも、そのゆれた部分以
外の音楽的な音の定常部分すなわち1つの音符に相当す
る部分を分析することのできる音信号分析装置を提供す
ることができる。さらに別の発明の演奏情報発生装置に
よれば、マイク等からの入力音のピッチ又はレベルが微
妙にゆれた場合でもそのピッチに対するノート情報を確
実に発生することができる。
【図面の簡単な説明】
【図1】 図2の電子楽器が演奏情報発生装置として動
作する際のメインフローを示す図である。
【図2】 この発明に係る楽音情報分析装置及び演奏情
報発生装置を内蔵した電子楽器の構成を示すハードブロ
ック図である。
【図3】 図1のステップ13の有効区間検出処理の詳
細を示す図である。
【図4】 図1のステップ14の定常区間検出処理の詳
細を示す図である。
【図5】 図1のステップ15の音高列決定処理の詳細
を示す図である。
【図6】 図1のステップ15の音高列決定処理の第2
の実施例である音高列決定処理2の詳細を示す図であ
る。
【図7】 図1のステップ15の音高列決定処理の第3
の実施例である音高列決定処理3の詳細を示す図であ
る。
【図8】 図1のステップ15の音高列決定処理の第4
の実施例である音高列決定処理4の詳細を示す図であ
る。
【図9】 サンプリング周波数44.1kHzでサンプ
リングされた音声信号すなわちディジタルサンプル信号
の波形値の一例を示す図である。
【図10】 図1のステップ13の有効区間検出処理の
動作例の概念を示す図である。
【図11】 図4のステップ41の周期基準位置検出処
理の一例である有効区間内の楽音波形のピーク位置検出
処理の動作例の概念を示す図である。
【図12】 図4のステップ42の波形比較処理の中で
行われる誤差率の算出方法がどのように行われるのか、
その具体例を2個の比較波を用いて示した図である。
【図13】 図4のステップ42の波形比較処理によっ
て、図12の2個の比較波からどのようにして誤差率が
算出されるのか、その具体例を示す図である。
【図14】 図4のステップ42の波形比較処理によっ
て、図11(B)のピーク基準位置が修正されて、規則
正しいピーク位置が検出される様子を示す図である。
【図15】 図4のステップ41の周期基準位置検出処
理の一例である有効区間内の楽音波形のピーク位置検出
処理の動作例の別の楽音波形に対する概念を示す図であ
る。
【図16】 図4のステップ45の定常区間拡張処理の
動作例を示す図である。
【図17】 図4のステップ46の定常部重ね合わせ処
理の動作例を示す図である。
【図18】 図4のステップ47の音高・音圧の変化に
よる細分化処理の動作例を示す図である。
【図19】 ステップ13によって求められた有効区間
の中から定常区間がどのようにして検出されるのか、図
4の定常区間検出処理の概念を示す図である。
【図20】 図5の音高列決定処理1の動作例の概念を
示す図である。
【図21】 図6の音高列決定処理2で用いられる複数
スケールの一例を示す図である。
【図22】 図6の音高列決定処理2の動作例の概念を
示す図である。
【図23】 図7の音高列決定処理3の動作例の概念を
示す図である。
【図24】 図7のステップ74のフレーズ先頭音との
ノート距離決定処理の具体例を示す図である。
【図25】 図8の音高列決定処理4の動作例の概念を
示す図である。
【符号の説明】
1…CPU、2…プログラムメモリ、3…ワーキングメ
モリ、4…演奏データメモリ、5…押鍵検出回路、6…
マイクインターフェイス、7…スイッチ検出回路、8…
表示回路、9…音源回路、10…鍵盤、1A…マイクロ
フォン、1B…テンキー&各種スイッチ、1C…ディス
プレイ、1D…サウンドシステム、1E…データ及びア
ドレスバス
フロントページの続き (56)参考文献 特開 平4−284496(JP,A) 特開 昭60−43697(JP,A) 特開 平7−66904(JP,A) 特開 平1−219889(JP,A) 特開 平1−219623(JP,A) 特開 平1−219636(JP,A) 特公 平2−43200(JP,B2) 特公 平1−22631(JP,B2) (58)調査した分野(Int.Cl.7,DB名) G10H 1/00 G10G 3/04 G10L 3/00

Claims (16)

    (57)【特許請求の範囲】
  1. 【請求項1】 外部から任意の音信号を入力するための
    入力手段と、 前記入力手段から順次入力された信号のサンプル振幅値
    の所定サンプル数にわたる平均値をそれぞれ求め、その
    結果を時系列的な平均音圧レベル情報として出力する演
    算手段と、 前記演算手段によって求められた平均音圧レベルが第1
    の所定値以上である区間を音楽的な音が存在する有効区
    間とし、前記第1の所定値未満の区間を音楽的な音の存
    在しない無効区間とする区間決定手段と、 両側を前記有効区間に挟まれた前記無効区間の中でその
    区間の時間長が第1の所定長未満の場合には、その無効
    区間を有効区間に変更し、変更後の有効区間とその両側
    の有効区間とを合成して新たな有効区間とする有効区間
    化手段と、 前記有効区間化手段による処理が終了した時点で、両側
    を前記無効区間に挟まれた前記有効区間の中でその区間
    の時間長が第2の所定長未満の場合には、その有効区間
    を無効区間に変更し、変更後の無効区間とその両側の無
    効区間とを合成して新たな無効区間とする第1の無効区
    間化手段と、 前記第1の無効区間化手段による処理が終了した時点に
    おける前記有効区間のそれぞれについて、前記平均音圧
    レベルの平均値を算出し、それが第2の所定値未満の場
    合には、その有効区間を無効区間に変更する第2の無効
    区間化手段とを具えたことを特徴とする音信号分析装
    置。
  2. 【請求項2】 外部から任意の音信号を入力するための
    入力手段と、 前記入力手段から順次入力された信号のサンプル振幅値
    の所定サンプル数にわたる平均値をそれぞれ求め、その
    結果を時系列的な平均音圧レベル情報として出力する演
    算手段と、 前記演算手段によって求められた平均音圧レベルが第1
    の所定値以上である区間を有効区間とし、前記第1の所
    定値未満の区間であって両側を前記有効区間に挟まれた
    区間を無効区間として、これ以外の前記平均音圧レベル
    の両端側の区間を未確定区間とする区間決定手段と、 両側を前記有効区間に挟まれた前記無効区間の中でその
    区間の時間長が第1の所定長未満の場合には、その無効
    区間を有効区間に変更し、変更後の有効区間とその両側
    の有効区間とを合成して新たな有効区間とする有効区間
    化手段と、 前記有効区間化手段による処理が終了した時点で、両側
    を前記無効区間に挟まれた前記有効区間の中でその区間
    の時間長が第2の所定長未満の場合には、その有効区間
    を無効区間に変更し、変更後の無効区間とその両側の無
    効区間とを合成して新たな無効区間とし、前記未確定区
    間に隣接する前記有効区間の中でその区間の時間長が前
    記第2の所定長未満の場合には、その有効区間と、それ
    に隣接する無効区間と未確定区間とを合成して新たな未
    確定区間とする第1の無効区間化手段と、 前記第1の無効区間化手段による処理が終了した時点に
    おける前記有効区間及び前記未確定区間のそれぞれにつ
    いて、前記平均音圧レベルの平均値を算出し、 それが第2の所定値未満の場合には前記有効区間又は前
    記未確定区間を無効区間に変更し、前記第2の所定値以
    上の場合には前記未確定区間を有効区間に変更する第2
    の無効区間化手段とを具えたことを特徴とする音信号分
    析装置。
  3. 【請求項3】 前記第2の無効区間化手段による処理が
    終了した時点で、前記演算手段によって求められた平均
    音圧レベルと前記第1の所定値よりも小さな第2の所定
    値とを用いて前記有効区間を拡張する拡張手段をさらに
    設けたことを特徴とする請求項1又は2に記載の音信号
    分析装置。
  4. 【請求項4】 外部から任意の音信号を入力するための
    入力手段と、 前記入力手段から入力する前記音信号の波形において周
    期基準となる候補位置の複数を検出する周期基準検出手
    であって、該周期基準検出手段は、前記音信号の波形
    における特定の位置を検出することによって前記周期基
    準となる候補位置を複数検出するものと、 前記音信号について、前記候補位置で表される隣接する
    区間同士の波形の一致度を演算し、その一致度の高いも
    の同士を接続して同波形区間を検出する区間検出手段
    と、 前記区間検出手段によって検出された同波形区間に基づ
    いて定常区間を決定する定常区間決定手段と 前記定常区間決定手段によって決定された定常区間に基
    づいて1つの音価の区間を決定する音価区間決定手段と
    を具えたことを特徴とする音信号分析装置。
  5. 【請求項5】 外部から任意の音信号を入力するための
    入力手段と、 前記入力手段から入力する前記音信号に対して周期基準
    となる仮候補位置の複数を検出する第1の周期基準検出
    手段と、 前記第1の周期基準検出手段によって検出された前記仮
    候補位置に基づいて前記音信号の最大周波数及び最小周
    波数を検出する周波数帯検出手段と、 この周波数帯検出手段によって、検出された最大周波数
    及び最小周波数をカットオフ周波数とするバンドパスフ
    ィルタ処理を前記入力手段から入力する前記音信号に施
    すフィルタ処理手段と、 前記フィルタ処理手段から出力される前記音信号に対し
    て周期基準となる候補位置の複数を検出する第2の周期
    基準検出手段と、 前記音信号について、前記候補位置で表される隣接する
    区間同士の波形の一致度を演算し、その一致度の高いも
    の同士を接続して同波形区間を検出する区間検出手段
    と、 前記区間検出手段によって検出された同波形区間に基づ
    いて定常区間を検出する定常区間検出手段とを具えたこ
    とを特徴とする音信号分析装置。
  6. 【請求項6】 外部から任意の音信号を入力するための
    入力手段と、 前記入力手段から入力する前記音信号の中から音楽的な
    音が存在すると思われる有効区間を分析する有効区間分
    析手段と、 前記有効区間を構成する前記音信号の正負両側部分のそ
    れぞれに対して周期基準となる候補位置の複数を検出す
    る周期基準検出手段と、 前記音信号の前記正負両側部分のそれぞれについて、前
    記候補位置で表される隣接する区間同士の波形の一致度
    を演算し、その一致度の高いもの同士を接続して同波形
    区間を検出する区間検出手段と、 前記区間検出手段によって検出された正負両側の同波形
    区間を重ね合わせることによってできた区間を同音色区
    間とする音色区間決定手段と、 前記音色区間決定手段によって決定された同音色区間に
    基づいて定常区間を検出する定常区間決定手段とを具え
    たことを特徴とする音信号分析装置。
  7. 【請求項7】 外部から任意の音信号を入力するための
    入力手段と、 前記入力手段から入力する前記音信号の中から音楽的な
    音が存在すると思われる有効区間を分析する有効区間分
    析手段と、 前記有効区間を構成する前記音信号に対して周期基準と
    なる仮候補位置の複数を検出する第1の周期基準検出手
    段と、 前記第1の周期基準検出手段によって検出された前記仮
    候補位置に基づいて前記音信号の全区間又は前記有効区
    間に関する最大周波数及び最小周波数を検出する周波数
    帯検出手段と、 この周波数帯検出手段によって、検出された最大周波数
    及び最小周波数をカットオフ周波数とするバンドパスフ
    ィルタ処理を前記入力手段から入力する前記音信号の全
    区間又は前記有効区間毎に施すフィルタ処理手段と、 前記フィルタ処理手段から出力される前記音信号に対し
    て周期基準となる候補位置の複数を検出する第2の周期
    基準検出手段と、 前記音信号の前記正負両側部分のそれぞれについて、前
    記候補位置で表される隣接する区間同士の波形の一致度
    を演算し、その一致度の高いもの同士を接続して同波形
    区間を検出する区間検出手段と、 前記区間検出手段によって検出された同波形区間に基づ
    いて定常区間を検出する定常区間決定手段とを具えたこ
    とを特徴とする音信号分析装置。
  8. 【請求項8】 前記有効区間検出手段は、請求項1、2
    又は3に記載の音信号分析装置によって有効区間を検出
    することを特徴とする請求項6又は7に記載の音信号分
    析装置。
  9. 【請求項9】 外部から任意の音信号を入力するための
    入力手段と、 前記入力手段から入力する前記音信号の中から1つの音
    符に相当する定常区間を分析する定常区間分析手段と、 前記定常区間分析手段によって分析された前記定常区間
    毎に代表周波数を決定する周波数決定手段と、 前記周波数決定手段によって決定された前記定常区間の
    代表周波数に基づいて前後する2つの定常区間同士の代
    表周波数の差をセントを基準にした値に変換するセント
    値変換手段と、 このセント値変換手段によって変換されたセントを基準
    にした値に基づいて前記2つの定常区間同士の相対的な
    音高差データを算出する音高差算出手段と、 前記音高差算出手段によって算出された前記音高差デー
    タに基づいて各定常区間に所定の音階上の音高を割り当
    てる音高割当手段とを具えたことを特徴とする演奏情報
    発生装置。
  10. 【請求項10】 外部から任意の音信号を入力するため
    の入力手段と、 前記入力手段から入力する前記音信号の中から1つの音
    符に相当する定常区間を分析する定常区間分析手段と、 定常区間分析手段によって分析された前記定常区間毎に
    代表周波数を決定する周波数決定手段と、 前記定常区間分析手段によって分析された前記定常区間
    の複数を纏めて1つのフレーズを検出するフレーズ検出
    手段と、 前記フレーズ検出手段によって検出された1フレーズ内
    における当該定常区間よりも前に存在する全ての定常区
    間に対して、その代表周波数の差をそれぞれセントを基
    準にした値に変換するセント値変換手段と、 前記フレーズ検出手段によって検出された1フレーズ内
    における当該定常区間よりも前に存在する全ての定常区
    間に対する相対的な時間距離に基づいた重みを算出する
    重み算出手段と、 このセント値変換手段によって変換されたセントを基準
    にした値及び重み算出手段によって算出された重みに基
    づいて前記2つの定常区間同士の相対的な音高差データ
    を算出する音高差算出手段と、 前記音高差算出手段によって算出された前記音高差デー
    タに基づいて各定常区間に所定の音階上の音高を割り当
    てる音高割当手段とを具えたことを特徴とする演奏情報
    発生装置。
  11. 【請求項11】 外部から任意の音信号を入力するため
    の入力手段と、 前記入力手段から入力する前記音信号の中から1つの音
    符に相当する定常区間を分析する定常区間分析手段と、 定常区間分析手段によって分析された前記定常区間毎に
    代表周波数を決定する周波数決定手段と、 前記定常区間分析手段によって分析された前記定常区間
    の複数を纏めて1つのフレーズを検出するフレーズ検出
    手段と、 前記フレーズ検出手段によって検出された1フレーズ内
    の先頭の定常区間の代表周波数に対する前記フレーズ内
    の他の各定常区間の代表周波数の差をセントを基準にし
    た値に変換するセント値変換手段と、 このセント値変換手段によって変換されたセントを基準
    にした値に基づいて前記2つの定常区間同士の相対的な
    音高差データを算出する音高差算出手段と、 前記音高差算出手段によって算出された前記音高差デー
    タに基づいて各定常区間に所定の音階上の音高を割り当
    てる音高割当手段とを具えたことを特徴とする演奏情報
    発生装置。
  12. 【請求項12】 前記音高割当手段は、各定常区間に所
    定の音階上の音高を割り当てる際に、最初の定常区間に
    所定の音高を割り当ててから、順番に残りの定常区間に
    所定の音階上の音高を割り当てることを特徴とする請求
    項9、10又は11に記載の演奏情報発生装置。
  13. 【請求項13】 前記音高割当手段は、各定常区間に所
    定の音階上の音高を割り当てる際に、最初の定常区間の
    音信号を分析してその定常区間の平均周波数を検出し、
    検出された平均周波数に基づいた音高を最初の定常区間
    の音高として割り当ててから、残りの定常区間に順番に
    所定の音階上の音高を割り当てることを特徴とする請求
    項9、10又は11に記載の演奏情報発生装置。
  14. 【請求項14】 前記音高割当手段は、各定常区間に複
    数の音階上の音高をノート位置をずらしながらそれぞれ
    割り当ててみて、各音階の各ノート位置におけるノート
    割当誤差の累計値を算出し、その累計値に応じて最適な
    音階を決定し、決定された音階上の音高をその定常区間
    の音高として順番に割り当てることを特徴とする請求項
    9、10又は11に記載の演奏情報発生装置。
  15. 【請求項15】 前記音高割当手段は、前記決定された
    音階上の音高をその定常区間の音高として順番に割り当
    てる際にノート許容誤差範囲の値に応じて音階外の音高
    を割り当てることを特徴とする請求項9、10又は11
    に記載の演奏情報発生装置。
  16. 【請求項16】 前記定常区間分析手段は、請求項5、
    6、7又は8に記載の音信号分析装置によって前記定常
    区間を分析することを特徴とする請求項9、10又は1
    1に記載の演奏情報発生装置。
JP32477496A 1996-11-20 1996-11-20 音信号分析装置及び演奏情報発生装置 Expired - Fee Related JP3279204B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP32477496A JP3279204B2 (ja) 1996-11-20 1996-11-20 音信号分析装置及び演奏情報発生装置
US08/974,339 US6525255B1 (en) 1996-11-20 1997-11-19 Sound signal analyzing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32477496A JP3279204B2 (ja) 1996-11-20 1996-11-20 音信号分析装置及び演奏情報発生装置

Publications (2)

Publication Number Publication Date
JPH10149160A JPH10149160A (ja) 1998-06-02
JP3279204B2 true JP3279204B2 (ja) 2002-04-30

Family

ID=18169532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32477496A Expired - Fee Related JP3279204B2 (ja) 1996-11-20 1996-11-20 音信号分析装置及び演奏情報発生装置

Country Status (1)

Country Link
JP (1) JP3279204B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7096186B2 (en) 1998-09-01 2006-08-22 Yamaha Corporation Device and method for analyzing and representing sound signals in the musical notation
JP4024440B2 (ja) * 1999-11-30 2007-12-19 アルパイン株式会社 曲検索システムのデータ入力装置
JP2003122351A (ja) * 2001-10-16 2003-04-25 Yamaha Corp 音波形信号のピッチを音高に変換する装置およびプログラム
JP4622356B2 (ja) * 2004-07-16 2011-02-02 ヤマハ株式会社 音声合成用スクリプト生成装置及び音声合成用スクリプト生成プログラム
JP4735398B2 (ja) * 2006-04-28 2011-07-27 日本ビクター株式会社 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム
JP5549166B2 (ja) * 2009-09-18 2014-07-16 ブラザー工業株式会社 音声処理装置、プログラム
JP5093387B2 (ja) * 2011-07-19 2012-12-12 ヤマハ株式会社 音声特徴量算出装置
US10492276B2 (en) 2016-05-12 2019-11-26 Pioneer Dj Corporation Lighting control device, lighting control method, and lighting control program
CN112213243A (zh) * 2020-09-25 2021-01-12 桂林电子科技大学 扬尘程度检测系统、扬尘程度检测方法和计算机存储介质

Also Published As

Publication number Publication date
JPH10149160A (ja) 1998-06-02

Similar Documents

Publication Publication Date Title
JP3812328B2 (ja) 自動伴奏パターン発生装置及び方法
JPH08500452A (ja) 音声和音発生方法及び装置
US8735709B2 (en) Generation of harmony tone
CN112382257B (zh) 一种音频处理方法、装置、设备及介质
US6525255B1 (en) Sound signal analyzing device
JP3669129B2 (ja) 音信号分析装置及び方法
JP3279204B2 (ja) 音信号分析装置及び演奏情報発生装置
JP2806351B2 (ja) 演奏情報分析装置及びそれを用いた自動編曲装置
JP2010025972A (ja) コード名検出装置及びコード名検出用プログラム
EP2775475B1 (en) Music synthesizer with correction of tones during a pitch bend, based on played chord and on pitch conversion harmony rules.
JP3489503B2 (ja) 音信号分析装置、音信号分析方法及び記憶媒体
JP4134961B2 (ja) 音信号分析装置及び方法
JP2000261322A (ja) 音響信号の符号化方法およびプログラム記録媒体
CN113823270A (zh) 节奏评分的确定方法、介质、装置和计算设备
JP3888372B2 (ja) 音信号分析装置及び方法
JP3888371B2 (ja) 音信号分析装置及び方法
JPH01288900A (ja) 歌声伴奏装置
JP3888370B2 (ja) 音信号分析装置及び方法
JP2007140000A (ja) 歌唱採点装置および歌唱採点処理のプログラム
JP4695781B2 (ja) 音響信号の符号化方法
JP5659501B2 (ja) 電子音楽装置及びプログラム
JP2003216147A (ja) 音響信号の符号化方法
JP5703555B2 (ja) 楽音信号処理装置及びプログラム
JP6036800B2 (ja) 音信号生成装置及びプログラム
JP2011197564A (ja) 電子音楽装置及びプログラム

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090222

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100222

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees