JP2009223078A - 音処理装置およびプログラム - Google Patents

音処理装置およびプログラム Download PDF

Info

Publication number
JP2009223078A
JP2009223078A JP2008068728A JP2008068728A JP2009223078A JP 2009223078 A JP2009223078 A JP 2009223078A JP 2008068728 A JP2008068728 A JP 2008068728A JP 2008068728 A JP2008068728 A JP 2008068728A JP 2009223078 A JP2009223078 A JP 2009223078A
Authority
JP
Japan
Prior art keywords
pitch
range
unit
normalization
note number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008068728A
Other languages
English (en)
Other versions
JP5024136B2 (ja
Inventor
Hiroshi Kayama
啓 嘉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008068728A priority Critical patent/JP5024136B2/ja
Publication of JP2009223078A publication Critical patent/JP2009223078A/ja
Application granted granted Critical
Publication of JP5024136B2 publication Critical patent/JP5024136B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Auxiliary Devices For Music (AREA)

Abstract

【課題】音響信号のピッチを安定的に正規化する。
【解決手段】ピッチ検出部46は、音響信号SINのピッチPを検出する。範囲設定部72は、複数の音高(ノートナンバ)の各々について正規化範囲Rを設定する。音高特定部74は、ピッチ検出部46の検出したピッチPが属する正規化範囲Rに対応した音高を順次に特定する。音高特定部74が新たな音高を特定すると、範囲設定部72は、当該音高に対応した正規化範囲Rを拡大するとともに当該正規化範囲Rを拡大前の範囲まで経時的に縮小する。
【選択図】図1

Description

本発明は、音響信号のピッチを複数の音高の何れかに正規化する技術に関する。
人間の発声音や楽器の演奏音を収音した音響信号のピッチから複数の音高の何れかを特定する(すなわち音響信号のピッチを正規化する)ための各種の技術が従来から提案されている。例えば特許文献1には、音響信号のピッチを調音階(鍵盤楽器の白鍵に対応する音高の集合)や12音階(白鍵および黒鍵に対応する音高の集合)の各構成音に変換する技術が開示されている。
特開2003−122351号公報
ピッチの正規化には、複数の音高の各々について固定的に設定された範囲が利用される。すなわち、複数の音高のうち音響信号のピッチが属する範囲に対応した音高が正規化の結果として特定される。しかし、音響信号が不安定でピッチが微妙に変動する場合、以上の技術においては、正規化後の音高が短時間で刻々と変化するという問題がある。例えば、音高Cと音高C#との範囲の境界値の付近で音響信号のピッチが変動すると、正規化後の音高は、音高Cおよび音高C#の一方から他方に短時間で不安定に変動する。以上の事情に鑑みて、本発明は、音響信号のピッチを安定的に正規化することをひとつの目的とする。
以上の課題を解決するために、本発明の音処理装置は、音響信号のピッチを検出するピッチ検出手段と、複数の音高の各々について正規化範囲を設定する範囲設定手段と、ピッチ検出手段の検出したピッチが属する正規化範囲に対応した音高を順次に特定する音高特定手段とを具備し、音高特定手段が新たな音高を特定すると、範囲設定手段は、当該音高に対応した正規化範囲を一時的に拡大する。以上の構成によれば、音高特定手段が新たに特定した音高の正規化範囲が一時的に拡大するから、音響信号のピッチが不安定に変動する場合であっても、音高特定手段が特定する音高の変化を抑制することが可能である。
本発明の好適な態様において、音高特定手段が新たな音高を特定すると、範囲設定手段は、当該音高に対応した正規化範囲を拡大するとともに当該正規化範囲を拡大前の範囲まで経時的に縮小する。以上の態様によれば、例えば拡大後の正規化範囲が所定の時間にわたって維持される構成(例えば図9のように正規化範囲Rを制御する構成)と比較して、新たな音高の特定から時間が経過するほど他の音高の特定される可能性が高まるという利点がある。例えば人間の発声音や楽器の演奏音は発生の開始時に特に音高が不安定となるという傾向を考慮すれば、正規化範囲の縮小量が経時的に減少するように拡大後の正規化範囲を縮小する構成(例えば図8のように正規化範囲を制御する構成)が好適である。
本発明の好適な態様において、複数の構成音で構成されるスケールを指定する制御手段を具備し、音高特定手段は、制御手段が指定するスケールの複数の構成音のなかからピッチに対応した音高を特定する。以上の態様においては、例えば特定のスケールの楽曲の演奏や歌唱において音楽的に適切な音高のみを特定することが可能である。さらに、ピッチ検出手段の検出したピッチが属する正規化範囲に対応した音高がスケールの構成音に該当しない場合に音高特定手段が当該音高を調整する構成(例えば図4や図5のステップSB3からステップSB8を実行する構成)によれば、音響信号のピッチが不正確な場合であっても、音楽的に適切な音高を特定することができる。
本発明の好適な態様において、範囲設定手段は、ピッチベンドの利用が指示された場合には正規化範囲の拡大を実行しない。以上の態様においては、ピッチベンドの利用が指示された場合には正規化範囲が拡大されないから、音高を変化させる音楽的な表現を実現することも可能である。
以上の各態様に係る音処理装置は、入力音の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、音響信号のピッチを検出するピッチ検出処理と、ピッチ検出処理にて検出したピッチが属する正規化範囲に対応した音高を順次に特定する音高特定処理と、複数の音高の各々について正規化範囲を設定する処理であって、音高特定手段が新たな音高を特定すると、当該音高に対応した正規化範囲を一時的に拡大する範囲設定処理とをコンピュータに実行させる。本発明のプログラムによれば、以上の各態様に係る音処理装置と同様の作用および効果が奏される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
図1は、本発明の実施の形態に係る音処理装置のブロック図である。図1に示すように、音処理装置100にはA/D変換器14と出力処理装置22とが接続される。A/D変換器14は、収音機器12から供給される電気信号をデジタル形式の音響信号SINに変換して音処理装置100に出力する。音響信号SINは、収音機器12が採取した入力音(例えば利用者の歌唱音や楽器の演奏音)の波形を表す信号である。
音処理装置100は、音響信号SINから音楽データDNを生成する(すなわち音響信号SINを符号化する)。本形態の音楽データDNは、MIDI(Musical Instrument Digital Interface)規格に準拠したデータである。さらに詳述すると、音処理装置100は、複数の音高のなかから音響信号SIN(入力音)のピッチに応じた音高を特定する。すなわち、音処理装置100は音響信号SINのピッチを複数の音高に正規化(量子化)する。音楽データDNは、例えば音響信号SINのピッチから特定された音高をノートナンバとして指定するノートオンイベントである。
出力処理装置22は、音楽データDNに対して所定の処理を実行することで出力信号SOUTを生成する。出力信号SOUTは、音楽データDNが指定するノートナンバに対応した音高の音響(楽音や音声)を表す信号である。例えばMIDI音源などの音源回路が出力処理装置22として好適に採用される。出力信号SOUTが放音機器24(例えばスピーカ装置)に供給されることで、音楽データDNが指定するノートナンバに対応した音高の再生音(すなわち入力音のピッチを特定の音高に量子化した再生音)が放音される。
図1に示すように、音処理装置100は、制御装置32と記憶装置34とを具備するコンピュータシステムで実現される。制御装置32は、プログラムを実行することで複数の要素(特徴抽出部40,正規化部50,データ生成部62,制御部64)として機能する演算処理装置である。記憶装置34は、制御装置32が実行するプログラムや制御装置32が使用する各種のデータを記憶する。半導体記憶装置や磁気記憶装置などの公知の記録媒体が記憶装置34として任意に利用される。
図1の特徴抽出部40は、音響信号SINを時間軸上で区分した複数の区間(以下「単位区間」という)の各々について音響信号SINの特徴量を抽出する。本形態の特徴抽出部40は、平均強度検出部42とピーク強度検出部44とピッチ検出部46とで構成される。平均強度検出部42は、各単位区間における音響信号SINの強度の平均値(実効値)を平均強度QAとして算定する。ピーク強度検出部44は、各単位区間内における音響信号SINのピークの強度(単位区間内における強度の最大値)をピーク強度QBとして算定する。ピッチ検出部46は、音響信号SINのピッチ(基本周波数)P[Hz]を単位区間毎に算定する。ピッチPの検出には自己相関法や零交差法といった公知の技術が任意に採用される
正規化部50は、特徴抽出部40が抽出した各特徴量を正規化する。本形態の正規化部50は、平均強度正規化部52とピーク強度正規化部54とピッチ正規化部56とで構成される。平均強度正規化部52は、各単位区間の平均強度QAをn段階(例えばn=128)の何れかの数値QnAに正規化する。ピーク強度正規化部54は、各単位区間のピーク強度QBをn段階の何れかのピーク強度QnBに正規化する。ピッチ正規化部56は、各単位区間のピッチPに対応したノートナンバ(音高)Nを単位区間毎に特定する。ノートナンバNは、n段階のなかからピッチPに応じて選択された数値(N=0〜127)である。正規化部50による正規化後の平均強度QnAとピーク強度QnBとノートナンバNとはデータ生成部62に供給される。
データ生成部62は、平均強度QnAとピーク強度QnBとノートナンバNとから音楽データDNを生成する。なお、音楽データDNの生成の具体例については後述する。制御部64は、制御装置32の各要素を制御する。例えば、制御部64は、複数種のスケールのうちのひとつのスケール(以下では特に「選択スケール」という)を例えば利用者からの指示に応じて選択する。また、制御部64は、音楽データDNの生成にピッチベンドを利用するか否かを例えば利用者からの指示に応じて選択する。
図1に示すように、ピッチ正規化部56は、範囲設定部72と音高特定部74とで構成される。範囲設定部72は、n段階の音高(ノートナンバ)の各々について所定の範囲(以下「正規化範囲」という)Rを設定する。各ノートナンバに対応する正規化範囲Rは相互に重複しないように設定される。
音高特定部74は、ピッチ検出部46が検出したピッチPからひとつのノートナンバNを特定する。さらに詳述すると、音高特定部74は、第1に、範囲設定部72が設定したn個の正規化範囲Rのうちピッチ検出部46が検出したピッチPの属する正規化範囲Rに対応したノートナンバN0を単位区間毎に特定(正規化)する。第2に、音高特定部74は、制御部64が指定する選択スケールの複数の構成音のうちノートナンバN0に対応した構成音のノートナンバNを単位区間毎に特定(量子化)する。
ピッチベンドを利用する場合とピッチベンドを利用しない場合とに区分してピッチ正規化部56によるノートナンバN0の特定を以下に説明する。図2および図3は、ピッチ検出部46が検出したピッチP(縦軸)と音高特定部74が特定するノートナンバN0との経時的な変化を例示する概念図である。図2および図3におけるひとつの白丸がひとつの単位区間の音響信号SINから抽出されたピッチPを意味する。図2においてはピッチベンドの利用が指示された場合を想定し、図3においてはピッチベンドの利用が指示されない場合を想定する。
[1]ピッチベンドを利用する場合
図2に示すように、範囲設定部72は、n種類のノートナンバ(図2においては音高Bから音高C#までの3種類のノートナンバのみが図示されている)の各々について正規化範囲Rを設定する。例えば、下限値p0_Bから上限値p0_Cまでの範囲が音高Bの正規化範囲R_Bとして設定され、下限値p0_Cから上限値p0_C#までの範囲が音高Cの正規化範囲R_Cとして設定され、下限値p0_C#から上限値p0_Dまでの範囲が音高C#の正規化範囲R_C#として設定される。ピッチベンドの利用が制御部64から指示された場合、正規化範囲Rは所定の範囲(以下「初期範囲」という)r0に固定される(すなわち経時的に変化しない)。なお、図2や図3においては各音高の初期範囲r0の広さが共通する場合を便宜的に例示したが、実際には初期範囲r0の広さは音高毎に個別に設定される。
音高特定部74は、各単位区間のピッチPを包含する正規化範囲Rに対応したノートナンバN0を特定する。例えば、音高特定部74は、ピッチPが正規化範囲R_Cに属する単位区間については音高CのノートナンバN0を特定し、ピッチPが正規化範囲R_C#に属する単位区間については音高C#のノートナンバN0を特定する。したがって、音高特定部74が特定するノートナンバN0の時系列にはピッチPの変動(ピッチベンド)が精緻に反映される。例えば、正規化範囲R_Cと正規化範囲R_C#との境界値p0_C#の近傍にてピッチPが変動すると、音高特定部74が特定するノートナンバN0は、音高Cおよび音高C#の一方から他方に頻繁に変化する。
[2]ピッチベンドを利用しない場合
ピッチベンドの利用が制御部64から指示されない場合、範囲設定部72は、図3に示すように、n種類のノートナンバの各々について正規化範囲Rを初期範囲r0に設定する一方、音高特定部74が新たなノートナンバN0を特定するたびに、当該ノートナンバN0に対応した正規化範囲Rを拡大したうえで初期範囲r0まで経時的に縮小する。さらに詳述すると以下の通りである。
図3に示すように、正規化範囲R_C(初期範囲r0)に属するピッチPが時点t1の単位区間にて検出され始めると、音高特定部74は、時点t1の単位区間について新たなノートナンバN0(音高C)を特定する。以上のように音高特定部74が新たなノートナンバN0を特定すると、範囲設定部72は、次以降の各単位区間(時刻t2)のピッチPの正規化で使用する正規化範囲R_Cを初期範囲r0から一時的に拡大する。さらに詳述すると、正規化範囲R_Cは、時点t2の単位区間において、初期範囲r0の下限値p0_Cを下回る下限値pE_Cから初期範囲r0の上限値p0_C#を上回る上限値pE_C#までの範囲に拡大される。正規化範囲R_Cの各境界値以外の境界値(例えば境界値p0_Bや境界値p0_D)は変化しないから、音高Cに隣接する音高(B,C#)の正規化範囲Rは縮小する。
さらに、範囲設定部72は、時点t2の単位区間にて拡大した正規化範囲R_Cを複数の単位区間にわたって経時的に初期範囲r0まで縮小する。本形態の範囲設定部72は、拡大後の正規化範囲R_Cを一定の割合で縮小する。すなわち、正規化範囲R_Cの上限値は、時点t2(拡大の直後)における上限値pE_C#から所定の時間Δをかけて直線的に減少して初期範囲r0の上限値p0_C#に到達し、正規化範囲R_Cの下限値は、時点t2における下限値pE_Cから時間Δをかけて直線的に増加して初期範囲r0の上限値p0_Cに到達する。時間Δは、複数の単位区間に相当する時間長である。
範囲設定部72による正規化範囲Rの拡大は、音高特定部74が新たなノートナンバN0を特定するたびに実行される。例えば、図3に示すように、正規化範囲R_Cが初期範囲r0まで縮小した以後の時点t3にてピッチPが音高C#の正規化範囲R_C#内に変化して音高特定部74が音高C#のノートナンバN0を新たに特定すると、範囲設定部72は、音高C#に対応した正規化範囲R_C#を次回の単位区間(時点t4)にて拡大したうえで時間Δをかけて経時的に縮小する。
以上のように、ノートナンバN0の特定の直後の単位区間から時間Δにわたる期間内では、初期範囲r0から拡大した正規化範囲RがノートナンバN0の特定に適用される。したがって、正規化範囲Rを固定した場合(例えば図2のようにピッチベンドを利用する場合)と比較すると、ピッチPに多少の変動があっても、音高特定部74が特定するノートナンバN0(音高C)は変化しない可能性が高まる。すなわち、本形態によれば、音高特定部74の特定するノートナンバN0を安定化することが可能である。
次に、図4は、ピッチベンドを利用しない場合(図3の場合)におけるピッチ正規化部56の具体的な動作を示すフローチャートである。ステップSA1からステップSA9までの処理は、ピッチ検出部46が検出したピッチPに対応するノートナンバN0を特定する(すなわちピッチPを正規化する)ための処理に相当し、ステップSB1からステップSB8までの処理は、ステップSA1からステップSA8までの処理で特定したノートナンバN0から選択スケールの構成音のノートナンバNを特定する(すなわちノートナンバN0を選択スケールの各構成音に量子化する)ための処理に相当する。
図4の処理を開始すると、ピッチ正規化部56は、ピッチ検出部46が検出したピッチP[Hz]を、セント[cent]を単位とするピッチPCに変換する(ステップSA1)。さらに、音高特定部74は、範囲設定部72が設定するn種類の正規化範囲RのうちステップSA1の変換後のピッチPCを包含する正規化範囲Rに対応したノートナンバN0を特定する(ステップSA2)。図3に例示したように、入力音が発生していない状態では正規化範囲Rは初期範囲r0に設定される。
次いで、ピッチ正規化部56は、ステップSA2にて特定したノートナンバN0が複数の単位区間にわたって継続中であるか否かを判定する(ステップSA3)。ステップSA3の結果が否定である場合(今回の単位区間にて新たな音高が発生し始めた場合)、ピッチ正規化部56は、ステップSA4からステップSA9(正規化範囲Rの更新)を実行せずに処理をステップSB1に移行する。
ステップSB1において、音高特定部74は、今回の単位区間についてステップSA2からステップSA9までの処理で特定したノートナンバN0が選択スケールの構成音のノートナンバに該当するか否か(すなわちピッチPが選択スケールの各構成音に量子化されるか否か)を判定する。
ステップSB1の結果が肯定である場合、音高特定部74は、今回の単位区間について特定したノートナンバN0をノートナンバNとして確定した(ステップSB2)うえで処理をステップSA10に移行する。一方、ステップSB1の結果が否定である場合、音高特定部74は、今回の単位区間について特定したノートナンバN0に対応したピッチ(ノートナンバN0から逆算されるピッチ)PN[cent]が、ステップSA1で算定したピッチPCを上回るか否かを判定する(ステップSB3)。
ステップSB3の結果が肯定である場合、音高特定部74は、ノートナンバN0を単位量(例えば1)だけ減少させる(ステップSB4)。一方、ステップSB3の結果が否定である場合、音高特定部74は、ノートナンバN0を単位量だけ増加させる(ステップSB5)。すなわち、音高特定部74は、選択スケールの構成音のノートナンバに近づくようにノートナンバN0を調整する。
次いで、音高特定部74は、ステップSB4またはステップSB5における調整後のノートナンバN0が選択スケールの構成音のノートナンバに該当するか否かを判定する(ステップSB6)。ステップSB6の結果が肯定である場合、音高特定部74は、ステップSB4またはステップSB5における調整後のノートナンバN0をノートナンバNとして確定する(ステップSB7)。一方、ステップSB6の結果が否定である場合(すなわちステップSB4またはステップSB5での調整によってもノートナンバN0が選択スケールの構成音に該当しない場合)、音高特定部74はノートナンバNを特定しない(ステップSB8)。すなわち、音響信号SINのうち今回の単位区間の入力音を無視する。ステップSB7またはステップSB8が完了すると処理はステップSA10に移行する。
ステップSA10において、音高特定部74は、今回の単位区間についてステップSB2またはステップSB7で確定したノートナンバNが直前の単位区間のノートナンバNと相違するか否か(すなわち、今回の単位区間について新たなノートナンバNを特定したか否か)を判定する。ステップSA10の結果が肯定である場合、範囲設定部72は、図3を参照して前述したように、今回の単位区間について特定したノートナンバNに対応する正規化範囲Rを拡大する(ステップSA11)。さらに、範囲設定部72は、記憶装置34に格納された範囲拡大フラグFをオンに設定した(ステップSA12)うえで処理をステップSA13に移行する。範囲拡大フラグFは、正規化範囲Rの拡大中にオンに設定されるフラグである。
一方、ステップSA10の結果が否定である場合(すなわち、直前の単位区間からノートナンバNが変化していない場合)、範囲設定部72は、ステップSA11(正規化範囲Rの拡大)およびステップSA12(範囲拡大フラグFの設定)を実行せずに処理をステップSA13に移行する。
ステップSA13において、ピッチ正規化部56は、ピッチPの正規化を終了するか否かを判定する。音処理装置100の動作の終了が利用者から指示された場合にはステップSA13の結果が肯定となり、図4の処理は終了する。一方、ステップSA13の結果が否定である場合、ピッチ正規化部56は、今回の単位区間に後続する別の単位区間についてステップSA1以後の処理を実行する。
以上のように入力音の開始後の単位区間については、ステップSA11における拡大後の正規化範囲RがステップSA2におけるピッチPの正規化に適用される。そして、ノートナンバNが共通する入力音が継続することでステップSA3の結果が肯定になると、ピッチ正規化部56は、範囲拡大フラグFがオンに設定されているか否か(すなわち正規化範囲Rの拡大中であるか否か)を判定する(ステップSA4)。
音高特定部74による新たなノートナンバNの特定を契機として正規化範囲Rの拡大(ステップSA11)と範囲拡大フラグFの設定(ステップSA12)とが実行され、かつ、当該ノートナンバNの音響が今回の単位区間でも継続している場合、ステップSA3およびステップSA4の双方の結果が肯定となってステップSA5からステップSA9までの処理が実行される。
ステップSA5において、範囲設定部72は、現段階の正規化範囲Rと比較して縮小するように正規化範囲Rを更新する。例えば、範囲設定部72は、現段階の正規化範囲Rの上限値から所定値を減算した数値を上限値とし、現段階の正規化範囲Rの下限値に所定値を加算した数値を下限値とする範囲を更新後の正規化範囲Rとして算定する。
次いで、ピッチ正規化部56は、ステップSA5における更新後の正規化範囲Rが初期範囲r0に充分に近づいたか否かを判定する(ステップSA6)。さらに詳述すると、ピッチ正規化部56は、更新後の正規化範囲Rの上限値と初期範囲r0の上限値との差分値(または各範囲の下限値の差分値)が所定値を下回るか否かを判定する。ステップSA6の結果が肯定である場合(すなわち、拡大後の正規化範囲Rが初期範囲r0に充分に近づくまで縮小した場合)、範囲設定部72は、正規化範囲Rを初期範囲r0に設定するとともに範囲拡大フラグFをオフに設定した(ステップSA7)うえで処理をステップSB1に移行する。したがって、過去の単位区間にて発生した音高が今回の単位区間で継続している場合(ステップSA3:YES)であっても、当該音高の発生から所定の時間Δが経過した段階では、ステップSA4の結果が否定となるから、初期範囲r0に設定された正規化範囲RがステップSA2におけるノートナンバN0の特定に利用される。
ステップSA6の結果が否定である場合(正規化範囲Rが初期範囲r0と比較して大きい場合)、音高特定部74は、ステップSA1で算定したピッチPCを、ステップSA5における更新後の正規化範囲Rに基づいて正規化し直す(ステップSA8およびステップSA9)。さらに詳述すると、音高特定部74は、ステップSA8において、ステップSA1で算定したピッチPCが更新後の正規化範囲R内にあるか否か(すなわち更新後の正規化範囲Rの上限値を下回るとともに下限値を上回るか否か)を判定する。そして、ステップSA8の結果が肯定である場合、音高特定部74は、ステップSA2で特定したノートナンバN0を、過去の単位区間から継続しているノートナンバN0に変更した(ステップSA9)うえで処理をステップSB1に移行する。
一方、ステップSA8の結果が否定である場合(ピッチPCが更新後の正規化範囲Rに含まれない場合)、ピッチ正規化部56は、ステップSA9を実行せずに処理をステップSB1に移行する。すなわち、ステップSA2にて特定した結果がノートナンバN0として確定する。以上がピッチベンドを利用しない場合におけるピッチ正規化部56の具体的な動作である。
図5は、ピッチベンドを利用する場合におけるピッチ正規化部56の具体的な動作を示すフローチャートである。図5に示すように、制御部64からピッチベンドの利用が指示された場合、ピッチ正規化部56は、図4の処理と同様にピッチPからピッチPC[cent]とノートナンバN0とを特定した(ステップSA1およびステップSA2)うえで、図4のステップSB1からステップSB8と同様に、ノートナンバN0を選択スケールの複数の構成音に量子化するための処理を実行する。すなわち、ピッチベンドの利用が指示された場合、範囲設定部72は正規化範囲Rの拡大や範囲拡大フラグFの設定を実行しない。以上がピッチ正規化部56の具体的な動作である。
図1のデータ生成部62は、以上の手順で特定されたノートナンバNを平均強度QNAおよびピーク強度QnBとともに利用して音楽データDNを生成する。例えば、入力音の発生に伴なって音高特定部74が新たなノートナンバNを特定すると、データ生成部62は、当該ノートナンバNについて発音を指示するノートオンイベントを音楽データDNとして生成する。また、入力音の音高の変化に伴なって音高特定部74が新たなノートナンバNを特定すると、データ生成部62は、直前のノートナンバNについて消音を指示するノートオフイベントと変更後のノートナンバNについて発音を指示するノートオンイベントとを音楽データDNとして生成する。また、入力音の消音に伴なって音高特定部74によるノートナンバNの特定が停止すると、データ生成部62は、直前のノートナンバNについて消音を指示するノートオフイベントを音楽データDNとして生成する。
データ生成部62が生成するノートオンイベント内のベロシティ(音量)は正規化後のピーク強度QnBに応じて設定される。図6は、ピーク強度QnB(横軸)とベロシティ(縦軸)との関係を示すグラフである。図6に示すように、記憶装置34にはピーク強度QnBとベロシティとについて複数の関係CB(CB1,CB2,……)が記憶される。データ生成部62は、記憶装置34に保持された複数の関係CBのうち利用者からの指示に応じた関係CBを選択し、当該関係CBにおいてピーク強度QnBに対応するベロシティをノートオンイベントに設定する。したがって、再生音(音響信号SOUT)の音量を利用者の意図に応じて多様に設定することが可能である。
また、データ生成部62は、平均強度QnAが変化するたびにエクスプレッションイベントを音楽データDNとして生成する。エクスプレッションイベントは、再生音の音量や音色を可変に制御するためのデータである。エクスプレッションイベント内のエクスプレッション値(典型的には音量)は変化後の平均強度QnAに応じて設定される。図7に示すように、平均強度QnA(横軸)とエクスプレッション値(縦軸)とについて複数の関係CA(CA1,CA2,……)が記憶装置34に保持される。データ生成部62は、記憶装置34に保持された複数の関係CAのうち利用者からの指示に応じた関係CAを選択し、当該関係CAにおいて平均強度QnAに対応するエクスプレッション値をエクスプレッションイベントに設定する。したがって、再生音の音量や音色を利用者の意図に応じて多様に設定することが可能である。
制御部64からピッチベンドの利用が指示された場合、データ生成部62は、ピッチPに応じたピッチベンドイベントを音楽データDNとして生成する。ピッチベンドイベントは、再生音のピッチを可変に制御するためのデータである。ピッチベンドイベント内のピッチベンド値はピッチP(さらに詳細には正規化後のピッチPC)の変化量に応じて設定される。ピッチベンドイベントは、ピッチPの変化量(ピッチベンド値)が変化するたびに生成される。
以上に説明したように、本形態においては、音高特定部74が新たに特定した音高の正規化範囲Rが一時的に拡大するから、音響信号SIN(入力音)のピッチPが不安定に変動する場合であってもノートナンバNの変化を抑制することが可能である。したがって、安定的な再生音が生成されるという利点がある。一方、ピッチベンドの利用が指示されると正規化範囲Rの拡大が禁止されるから、再生音の音高を変化させる音楽的な表現(ピッチベンド)を音高の安定性に優先させて実現することも可能である。すなわち、利用者の意図を反映した多様な再生音を生成できるという利点がある。
さらに、選択スケールの複数の構成音のなかからピッチPに対応したノートナンバNが特定されるから、例えば特定のスケールの楽曲の演奏や歌唱において音楽的に適切な音高のみを特定することができる。特に、選択スケールの構成音に該当しないノートナンバN0が構成音の音高に接近するように調整されるから、音響信号SINのピッチPが不正確な場合や不安定な場合であっても、音楽的に適切な音高の再生音を生成できるという利点がある。また、ステップSA1およびステップSA2にてピッチPからピッチPCを介して特定されるノートナンバN0に誤差がある場合であっても、ノートナンバN0を調整することで誤差の影響を抑制することが可能である。
<変形例>
以上の形態には様々な変形が加えられる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の例示から2以上の態様を任意に選択して組合わせてもよい。
(1)変形例1
正規化範囲Rを一時的に拡大する方法は任意である。例えば、人間の発声音や楽器の演奏音は発生の開始の直後に特に不安定になり易いという傾向を考慮して、図8に示すように、正規化範囲Rの単位時間あたりの縮小量が経時的に減少する(すなわち正規化範囲Rが初期範囲r0に漸近する)ように正規化範囲Rの上限値および下限値を範囲設定部72が曲線的に変化させる構成も好適である。
もっとも、正規化範囲Rを連続的に変化させる構成は本発明において必須ではない。例えば、図9に示すように、拡大の直後の正規化範囲Rを時間Δにわたって維持するとともに拡大時から時間Δが経過した段階で正規化範囲Rを初期範囲r0に設定するという構成によっても、音高特定部74が特定する音高(ノートナンバN)の頻繁な変化を抑制するという所期の効果は実現される。ただし、図3や図8のように新たな音高の正規化範囲Rを徐々に縮小する構成(すなわち、新たな音高に隣接する他の音高の正規化範囲Rが徐々に拡大する構成)によれば、新たな音高の指定後に他の音高を利用者が指定し易いという利点がある。
(2)変形例2
音響信号SINのピッチPを選択スケールの複数の構成音に量子化する構成は本発明において必須ではない。すなわち、図4や図5におけるステップSB1からステップSB8を省略し、ステップSA2やステップSA9にて特定したノートナンバN0を音楽データDNに設定する構成も好適である。
(3)変形例3
以上の形態においては音高特定部74が特定したノートナンバNを音楽データDNにて指定したが、ノートナンバNをさらに調整したうえで音楽データDNの生成に利用してもよい。例えば、オクターブを指定するオクターブシフト量を制御部64が音高特定部74に指定する構成においては、ステップSB2やステップSB7で特定されたノートナンバNをオクターブシフト量に応じてシフトすることで確定的なノートナンバNが特定される。
(4)変形例4
以上の形態においては音楽データDNを出力処理装置22に出力したが、音楽データDNの利用の方法は本発明において任意である。例えば、音楽データDNの時系列を記憶装置34(または他の記憶媒体)に格納する構成や、音楽データDNの時系列を通信網に送信する構成が採用される。
本発明の実施の形態に係る音処理装置のブロック図である。 ピッチベンドを利用する場合におけるピッチとノートナンバとの関係を示す概念図である。 ピッチベンドを利用しない場合におけるピッチとノートナンバとの関係を示す概念図である。 ピッチベンドを利用しない場合におけるピッチ正規化部の動作を示すフローチャートである。 ピッチベンドを利用する場合におけるピッチ正規化部の動作を示すフローチャートである。 ピーク強度とベロシティとの関係を示すグラフである。 平均強度とエクスプレッション値との関係を示すグラフである。 変形例における正規化範囲の変化を示す概念図である。 変形例における正規化範囲の変化を示す概念図である。
符号の説明
100……音処理装置、12……収音機器、14……A/D変換器、22……出力処理装置、24……放音機器、32……制御装置、34……記憶装置、40……特徴抽出部、42……平均強度検出部、44……ピーク強度検出部、46……ピッチ検出部、50……正規化部、52……平均強度正規化部、54……ピーク強度正規化部、56……ピッチ正規化部、62……データ生成部、64……制御部、72……範囲設定部、74……音高特定部、SIN……音響信号、P……ピッチ、N……ノートナンバ、DN……音楽データ、SOUT……出力信号、R(R_B,R_C,R_C#)……正規化範囲、r0……初期範囲。

Claims (6)

  1. 音響信号のピッチを検出するピッチ検出手段と、
    複数の音高の各々について正規化範囲を設定する範囲設定手段と、
    前記ピッチ検出手段の検出したピッチが属する正規化範囲に対応した音高を順次に特定する音高特定手段とを具備し、
    前記音高特定手段が新たな音高を特定すると、前記範囲設定手段は、当該音高に対応した正規化範囲を一時的に拡大する
    音処理装置。
  2. 前記音高特定手段が新たな音高を特定すると、前記範囲設定手段は、当該音高に対応した正規化範囲を拡大するとともに当該正規化範囲を拡大前の範囲まで経時的に縮小する
    請求項1の音処理装置。
  3. 複数の構成音で構成されるスケールを指定する制御手段を具備し、
    音高特定手段は、前記制御手段が指定するスケールの複数の構成音のなかから前記ピッチに対応した音高を特定する
    請求項1または請求項2の音処理装置。
  4. 前記音高特定手段は、前記ピッチ検出手段の検出したピッチが属する正規化範囲に対応した音高が前記スケールの構成音に該当しない場合に当該音高を調整する
    請求項3の音処理装置。
  5. 前記範囲設定手段は、ピッチベンドの利用が指示された場合には正規化範囲の拡大を実行しない
    請求項1から請求項4の何れかの音処理装置。
  6. 音響信号のピッチを検出するピッチ検出処理と、
    前記ピッチ検出処理にて検出したピッチが属する正規化範囲に対応した音高を順次に特定する音高特定処理と、
    複数の音高の各々について前記正規化範囲を設定する処理であって、前記音高特定手段が新たな音高を特定すると、当該音高に対応した正規化範囲を一時的に拡大する範囲設定処理と
    をコンピュータに実行させるプログラム。
JP2008068728A 2008-03-18 2008-03-18 音処理装置およびプログラム Expired - Fee Related JP5024136B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008068728A JP5024136B2 (ja) 2008-03-18 2008-03-18 音処理装置およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008068728A JP5024136B2 (ja) 2008-03-18 2008-03-18 音処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2009223078A true JP2009223078A (ja) 2009-10-01
JP5024136B2 JP5024136B2 (ja) 2012-09-12

Family

ID=41239908

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008068728A Expired - Fee Related JP5024136B2 (ja) 2008-03-18 2008-03-18 音処理装置およびプログラム

Country Status (1)

Country Link
JP (1) JP5024136B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9478200B2 (en) 2014-10-01 2016-10-25 Yamaha Corporation Mapping estimation apparatus

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148136A (ja) * 1998-09-01 2000-05-26 Yamaha Corp 音信号分析装置、音信号分析方法及び記憶媒体
JP2003122351A (ja) * 2001-10-16 2003-04-25 Yamaha Corp 音波形信号のピッチを音高に変換する装置およびプログラム
JP2005106989A (ja) * 2003-09-29 2005-04-21 Yamaha Corp 楽譜対応データ生成装置及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000148136A (ja) * 1998-09-01 2000-05-26 Yamaha Corp 音信号分析装置、音信号分析方法及び記憶媒体
JP2003122351A (ja) * 2001-10-16 2003-04-25 Yamaha Corp 音波形信号のピッチを音高に変換する装置およびプログラム
JP2005106989A (ja) * 2003-09-29 2005-04-21 Yamaha Corp 楽譜対応データ生成装置及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9478200B2 (en) 2014-10-01 2016-10-25 Yamaha Corporation Mapping estimation apparatus

Also Published As

Publication number Publication date
JP5024136B2 (ja) 2012-09-12

Similar Documents

Publication Publication Date Title
JP4839891B2 (ja) 歌唱合成装置および歌唱合成プログラム
JP4207902B2 (ja) 音声合成装置およびプログラム
JP2006251375A (ja) 音声処理装置およびプログラム
JP5541072B2 (ja) 楽音信号処理装置及びプログラム
JP6175812B2 (ja) 楽音情報処理装置及びプログラム
JP5024136B2 (ja) 音処理装置およびプログラム
US10937447B2 (en) Harmony generation device and storage medium
JP2015018112A (ja) 楽音発生装置、楽音発生方法およびプログラム
JP6171393B2 (ja) 音響合成装置および音響合成方法
CN111837183A (zh) 声音处理方法、声音处理装置及记录介质
JPH10319993A (ja) データ編集装置
JP6488767B2 (ja) 歌唱評価装置およびプログラム
JP2018146928A (ja) 電子楽器、楽音発生方法およびプログラム
JP5088179B2 (ja) 音処理装置およびプログラム
JP4565846B2 (ja) ピッチ変換装置
US9542923B1 (en) Music synthesizer
JP5703555B2 (ja) 楽音信号処理装置及びプログラム
JP2011197564A (ja) 電子音楽装置及びプログラム
JP2018151547A (ja) 発音装置及び発音制御方法
JP5418524B2 (ja) 楽曲データ修正装置
JP5827484B2 (ja) 楽音制御装置
JP4168391B2 (ja) カラオケ装置、音声処理方法及びプログラム
JP2018151548A (ja) 発音装置及びループ区間設定方法
JP2018060121A (ja) 楽音再生装置、楽音再生方法、プログラムおよび電子楽器
WO2019172396A1 (ja) 音声処理方法、音声処理装置および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120522

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120604

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5024136

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees