JP2002529773A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2002529773A5 JP2002529773A5 JP2000580198A JP2000580198A JP2002529773A5 JP 2002529773 A5 JP2002529773 A5 JP 2002529773A5 JP 2000580198 A JP2000580198 A JP 2000580198A JP 2000580198 A JP2000580198 A JP 2000580198A JP 2002529773 A5 JP2002529773 A5 JP 2002529773A5
- Authority
- JP
- Japan
- Prior art keywords
- sound
- frequency
- harmonic
- amplitude
- overtone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Description
【発明の詳細な説明】
【0001】
(クロス・リファレンス)
本出願は引用によりここに組み込まれている1998年10月29日提出の仮特許出願第60/106,150号に関し、かつ、その恩典を請求する。
【0002】
(用語集、背景、および、発明の概要)
本発明は一般的にオーディオ信号の処理と波形の処理、及び、周期的オーディオ信号の倍音成分(ハーモニック・コンテント)の修正に関し、更に詳細には、サウンドまたはサウンドの知覚を変えるために、この種信号の倍音成分を動的に変更する方法に関する。
【0003】
本特許において用いられる多くの用語はこのセクションに集められて、定義される。
【0004】
ヒトの耳に連続的に衝撃を与える多数の種類のサウンドの中で、或る1つのサウンドは、振幅と音色(タンバ)と音高(ピッチ)の特性が当該サウンドのものであると耳でわかるのに充分な長さと安定性のある特徴によって区別される。この種類のサウンドは楽音(トーン)と呼ばれる。
【0005】
周波数およびラウドネス(音量)すなわち振幅が同じ音から或る特定の音を区別可能にする特性は、当該楽音(トーン)の品質すなわち音色(タンバ)である。あまり技術的でない用語を用いると、楽器に認職可能な個性すなわち性質を与える要因は、その大部分が或る時間に亙る当該サウンドの倍音成分であると表現される。
【0006】
いくつかの楽器は、数百サイクルが発生するに十分な期間に相当する少なくとも2、3秒間に亙って特性が変化しない状態を維持することのできる安定した楽音(トーン)を生成する。この種の音を周期的(periodic)であると称する。
【0007】
楽器を含む大部分の音源は、振幅と周波数が種々異なるサイン(正弦)波の混合体である複合波形を生成する。複合音に関与する個々のサイン波は、当該音の部分音(partial tone)または単に部分(partial)と呼ばれる。部分音または部分周波数は、限定的なエネルギ周波数帯域として定義され、倍音または倍音周波数は、例えばストリング(弦)などの機械的物体または空気柱(エアコラム)を整数個の節(ノード)で区分したような整数関係に基づく現象に従って生成される部分音として定義される。或る特定の複合音の音質すなわち音色は、その分割された部分音の音量、周波数、及び、振幅、特にそれら相互の振幅割合および相互の相対周波数(即ち、これらの要素が組み合わされるか又は混合される仕方)によって決定される。楽器で演奏される楽音は同一楽器で演奏される別の楽音に類似した音色を持つので、周波数のみでは決定要因にはならない。サウンドを扱う具体化されたシステムにおいて、部分音は実際に小さい周波数帯域におけるエネルギを表し、かつ、サンプリングレートおよび当該サンプリングシステムと関連する不確定イシューによって支配される。
【0008】
オーディオ信号、特に楽器またはヒトの音声に関係するオーディオ信号は、信号がどのようにサウンドを出すかを定める特有の倍音成分を持つ。各信号は、基本周波数およびそれよりも高い倍音周波数によって構成される。組合わされたこれらサイクルの各々に関する図形的パターンは波形である。複合波の詳細な波形は、部分的には、複数の倍音の相対振幅に依存する。複数の倍音の間の振幅関係、周波数関係、または、位相関係を変えると、音の音楽的性質に関する耳での聞こえ方が変化する。
【0009】
基本周波数(第1倍音またはf1とも称する)およびより高位の倍音(f2からfnまで)は、一般的に数学的に関係がある。一般的な楽器によって生成されるサウンドにおいて、高い倍音は殆どの場合、当該基本周波数の整数倍であるが、これに限られない。すなわち、第2倍音は基音の2倍の周波数であり、第3倍音は基音の3倍の周波数、等々である。これらの倍数は、しばしば高さ(ランキングナンバ又はランク)と呼ばれる。一般に、本特許において用いられる用語「倍音」は、基音を含む全ての倍音を表す。
【0010】
各倍音は、基本周波数に対して振幅、周波数、および、位相の観点から或る関係を持ち、これらの関係は、聞こえるサウンドを変えるように操作可能である。周期的複合音はその構成要素(基音およびより高位の倍音)に分割される。この解析の図形表現はスペクトルと呼ばれる。従って、或る音特有の音色はスペクトルプロファイルにおいて図形的に表される。
【0011】
一般的な楽器は、主として整倍数または整倍数に近い複数の倍音を含む音を生成することが多いが、様々な他の楽器および音源(ソース)は、基音およびより高位の倍音の間で更に複雑な関係を持つサウンドを生成する。多くの楽器は、整数倍でない部分音を生成する。これらの音は不調和音(非倍音)と呼ばれる。
【0012】
現代の均等平均律(または西洋音楽の音階)は、オクターブ当たり12個の均等間隔半音音程によって構成されるように音階を調節する方法である。任意の半音の周波数は当該半音の直前半音の周波数の2の12乗根倍すなわち1.0594631倍である。これは、全てのオクターブ音程の周波数が比率1:2であるような音階を生じる。これらのオクターブは調和音程のみに限られ、全ての他の音程は不調和である。
【0013】
音階本来の妥協性(中間性)により、例えばピアノは、全てのキーで演奏可能である。ただし、大部分の自動楽器(mechanical instrument)における倍音は厳密な倍数ではなく、「耳でわかる程度」であり、従って幾らかの楽器ではその調律が「ストレッチされ」、すなわち単純な数学的論式によって規制されるピッチ(調子)から調律がずれるので、平均律に正確に調律(チューニング)された、例えばピアノなどの楽器は、ヒトの耳には、高音域において完全に平坦に聞こえる。これらの偏りは、単純な数学公式によって規定された音に対して、わずかにシャープであるか、或いは、わずかにフラットであるかどちらかである。ストレッチチューニングにおいて、音と倍音の間の数学的な関係は依然として存在するが、しかし、これらの関係は更に複雑である。楽器を含む多くのクラスの発信/発振装置によって生成される倍音周波数間の関係は次の関数によってモデル化される
fn=f1xG(n)
ここで、fnはn次倍音の周波数であり、nは倍音の高さを表す正の整数である。この種の関数の例を次に示す
a)fn=f1xn
b)fn=f1xnx[1+(n2−1)β]1/2
ここで、βは、楽器、または、多弦装置の弦に依存し、演奏されている音の周波数音域に依存することもある定数である。
【0014】
オーディオ即ち楽音の感知される音高(ピッチ)は一般に(ただし常にではなく)周期信号における基音または最低周波数である。以前に言及したように、楽音は、種々異なる振幅関係、周波数関係、および、位相関係の倍音を含む。これらの倍音を重ねると、複合時間領域信号が作られる。信号に含まれる倍音の量および振幅はその音色または音楽的個性を最も強く表現する。
【0015】
楽器の感知される楽音または特性の他のアスペクト(側面)は、楽器のデザイン、大きさ、材料、構成の詳細、特徴、及び操作方法によって強調または強化される可聴スペクトルの或る特定の区分または部分である共振帯を含む。これらの共振帯は、可聴スペクトルの他の区分に比較して更に音量が大きく感知される。
【0016】
この種の共振帯は、周波数が固定されており、その楽器で別の異なる音が演奏される際にも一定である。これらの共振帯は、当該楽器で演奏される別の異なる音に対して移動(シフト)しない。これらは、任意の所与時間に演奏される特定の音でなく楽器の物理的性質によって決定される。
【0017】
倍音成分と共振帯の間の主な差異は、基音周波数に対する関係が異なることである。倍音は、基音周波数の変化と共にシフトし、(すなわち、倍音は演奏される基音と直接的に連結されて周波数が移動し)、従って、基音に対して常に相対的である。基音が別の新たな基音にシフトすると、それら基音の倍音はそれら基音と共に変化する。
【0018】
これとは対照的に、楽器の共振帯は周波数が固定され、移動する基音の関数として線形移動しない。
【0019】
音自体の倍音構造および楽器自体の共振帯は別として、楽器の感知される音または音楽的特徴に関連する他の要因は、倍音成分が楽音の継続時間に亙っての変化の仕方を必要とする。楽音の継続期間、すなわち「ライフスパン」は、そのアタック(当該音が初めに打たれるか又は鳴らされる特徴的な方法)、サステイン(ある時間に亙って鳴らされる音の持続特性)、及び、ディケイ(音が終了する特徴的方法、例えば、突然のカットオフ対漸進的なフェード)がこの順序で特徴づけられる。
【0020】
3段階、即ち、アタック、サステイン、及び、ディケイの期間全体に亙る音の倍音成分は、音の主な音質に関してヒトの耳に対する重要な知覚のヒントを与える。基音を含む複合時間領域信号における各倍音は、音の時間における音色の規定を助けるそれ自身の特徴的なアタック及びディケイ特性を有する。
【0021】
倍音の相対振幅レベルは基音の振幅に関して当該音のライフスパン中に変化(場合により、強調または弱調される)するので、それに応じて、特定音の音色は当該音の継続時間に亙って変化する。弾かれるか、或いは、打たれる(ピアノ及びギターのように)楽器において、高位倍音は低位倍音よりも早くディケイ(減衰)する。これとは対照的に、管楽器(例えばフルート)および弓楽器(例えばバイオリン)を含む連続的に演奏される楽器においては、倍音は連続的に生成される。
【0022】
例えば、ギターの場合には、知覚される音色を形成する2つの最も影響力の強い要因は、(1)ストリングによって生成されるコア倍音、および、(2)ギターボディの共振帯特性である。
【0023】
一旦、ストリングが、基本周波数およびそれに関連する倍音のコアセットを生成すると、ボディ、ブリッジ、および、他の構成要素が、非線形であってかつ周波数に依存するその共振特性によって、まず音色を更に形成するように演奏される。ギターは共振帯または、1つの音の幾つかの倍音が基音の周波数に関係なく強められる領域を有する。
【0024】
ギタリストは、ストリング及びフレット位置の異なる組合わせを用いてネック上の6箇所すべてにおいて正確に同じ音(同じ周波数または同じ音高)を演奏できる。ただし、基音とその倍音の間の関係が異なるので、6種のバージョンの各々は全く異なるサウンドを出す。従って、これらの差異は、ストリングの構成および設計、ストリングの直径、及び/又は、ストリングの長さにおける変化に起因する。ここで、「長さ」は必ずしも全ストリング長さでなく、音楽の高さを生じる振動する部分のみ、即ち、フレットされた位置からブリッジまでの距離を意味する。ボディ自体の共振特性は変化しないが、ストリングの直径、及び/又は、長さがこのように変化するので、異なるバージョンは、音高が同じでも知覚できるほど異なるサウンドを出す。
【0025】
多くの場合、楽器の音色に変化を与えることが望ましい。現代的および伝統的な両方法は、固定帯域電子式イコライザと呼ばれる一種のフィルタを用いて基本的な形式で実施される。固定帯域電子式イコライザは、所定区分よりも大きい周波数スペクトル内における1つ又は複数の所定区分または帯域に影響する。望ましい強調(「ブースト」)または弱調(「カット」)は所定帯域内においてのみ発生する。1つ又は複数の帯域の外側に所在する音または倍音は影響されない。
【0026】
与えられた周波数は、変化する基音との関係によって任意の倍音高さを持つことができる。共振帯フィルタすなわちイコライザは、周波数についてその固定帯域の内側にあるかまたは外側にあるかのみを認識し、周波数の倍音高さは認識または応答しない。イコライザは、入力される周波数が基音、第2倍音、第3倍音、等のいずれであるかを区別できない。従って、固定帯域イコライザの影響によっては、周波数の高さに関して変化またはシフトしない。等化は固定されたままであり、基音に対するそれらの倍音関係に関係なく、指定された周波数に影響を及ぼす。等化は、知覚される音色に著しく影響する倍音のレベルに影響するが、音、音声、楽器、または、他のオーディオ信号の固有「コア」倍音成分は変更しない。一旦調節されれば、固定帯域イコライザが影響するかどうかは、入力される音すなわち信号の周波数自体にのみ依存し、当該周波数が基音(第1倍音)、第2倍音、第3倍音、または他の高さであるかには依存しない。
【0027】
今日の幾らかのイコライザはそれらのフィルタを動的に変更する能力を有するが、この場合の変更は倍音高さ情報でなくて時間的要素にのみ拘束される。これらのイコライザは、ユーザ入力コマンドによる定義に従ってフィルタの設置位置を変えることによってそれらのフィルタ作用を即座に調節する能力を持つ。本発明の方法の1つは、1000帯域以上のグラフィックイコライザとして見ることもできるが、振幅および対応する影響を受けた周波数の、周波数および振幅が瞬時に変化すること、及び/又は、当該音の倍音エネルギ成分を修正するように周波数および振幅に対して非常に速く移動すること、及び、欠落倍音および変化に関して設定された倍音に関連した周波数の全ての後続および先行周波数を付加するシンセサイザと調和して作動することにおいて異なる。
【0028】
ヒトの音声は、他の楽器類に見られるような、多くの同じ質および特性を備えた楽器とみなすことが可能である。ヒトの音声は、圧力のかかった空気によって作動するので、基本的には管楽器であるが、周波数発生の観点からは、多重倍音振動が複数の組織片によって生成されるが、組織片の振動周波数はそのテンション(張力)によって変更できるという点において、音声は弦楽器に類似する。固定共振チャンバを備えたアコースティックギターボディとは異なり、単一音の継続時間内に何度も共振空洞の或る種の態様は話し手によって変更可能であるので、音声の共振帯域は即座に調節可能な場合もある。共振は鼻腔および口腔の構成、舌の位置、および、全体的に声管と呼ばれる他の態様によって影響される。
【0029】
(従来の技術)
Matsumotoへ許可された米国特許第5,847,303号は、ヒト音声入力の周波数スペクトルを変える音声処理装置を開示する。この特許は、音声信号を別の人の音声(例えばプロの歌手の音声)のように聞こえるようにするために、入力音声信号を等化する幾つかの処理および演算ステップを具体化する。更に、この特許は、歌手の知覚される性別を変えることを可能とするクレームも開示する。
【0030】
松本特許の周波数スペクトル修正は、原音声を解析することによって声管または共振子の形状をシミュレートする伝統的な共振帯域フィルタリングを用いることによって達成される。コンプレッサ(圧縮器)/エキスパンダ(膨張器)、及び、フィルタ(濾過器)に関連する係数は装置のメモリ又はディスクに記憶され、固定される(エンドユーザによって選択不可能)。Matsumoto特許の周波数追随効果は、入力された音声からの基本周波数情報を使用して音声をオフセットし、「適切な」または「正しい」音高(ピッチ)に調律することである。音高の変更は、声管内のフォーマット周波数をシフトする電子クロックレート操作を介して達成される。続いて、この情報は、完全な波形を合成する電子装置に供給される。特定の倍音は合成されず、基音周波数に関して個別に調節されることなく、信号全体が同じに扱われる。
【0031】
類似の松本特許5,750,912は、モデル音声をエミュレートするために、単一音声を修正する装置である。アナライザーは、集められた歌声を順次解析し、その歌声を生成するために物理的に活性化された歌い手の独自の音声オルガンの反響特性を示す実際のフォーマットデータをそこから抽出する。シーケンサーは、モデル音声の音声品質を示す順次供給され、歌声の進行にマッチするようにアレンジされた参照フォーマットデータのために、歌声の進行に同期して動作する。比較器は、実際のフォーマットデータと参照フォーマットとを順次互いに比較し、歌声の進行の間にこれらの違いを検出する。イコライザーは、モデル音声の音声品質を抽出するために、検出された違いに基づき、集められた歌声の振動特性を修正する。イコライザーは、調整可能な中心周波数と調整可能な増加量を有するバンドパスフィルタを備えている。このバンドパスフィルタは、フォーマットのピーク周波数、ピーク周波数及びピークレベルに基づく個々の周波数特性を有する。
【0032】
セラー等に与えられた米国特許5,536,902は、サウンドパラメーターを抽出し、制御することによってサウンドを解析し、合成する方法及び装置を開示している。これは、スペクトルモデリング合成方法(SMS)を採用している。解析データは、オリジナルサウンド波形を作り上げる複数の要素を示す。解析データは、所定の要素に関する特性を得るために解析(分解)され、その後、そのデータは、得られた特性がサウンド又は音楽パラメータとして抽出されることを示す。抽出された音楽パラメータに対応する特性は、解析データから除去され、オリジナルサウンド波形は、このように修正された解析データと音楽パラメータとの組み合わせによって表現される。これらのデータはメモリに保持される。ユーザーは、これらの音楽パラメータは自在に制御できる。制御された音楽パラメータに対応する特性は、解析データに加えられる。このように、サウンド波形は、制御された特性が既に付加された解析データに基づいて合成される。解析タイプのこのようなサウンド合成技術において、自由な制御を与えることによって、フォーマットやビブラートのようなサウンド要素を修正することができる。
【0033】
セタレスに与えられた米国特許5,504,270は、周波数(周波数)や振幅によって可聴入力信号の部分音を特定することにより、電子可聴入力信号の不協和音を解析し、減少又は増加させる方法を開示している。入力部分音の不協和音は、ここに開示された手順による参照部分音のセットに関して、算出される。1つ以上の入力部分音はその後シフトされ、不協和音が再計算される。不協和音が所望の方法で変化したら、シフトされた部分音は、それが演繹された入力部分音と置き換わるかもしれない。出力信号は、シフトされた入力部分音を含むように生成され、要求の通り、出力信号は大きめの不調和音又は少な目の不調和音となる。入力信号と参照部分音は、各々、例えば、パフォーマーと伴奏のような別々のソースから出てくる事もでき、その結果、出力信号は、参照部分音のソースに関しては、入力信号よりも大きな不調信号又は小さな不調信号となる。代替えとして、入力信号の本質的な不協和音を減らすために、参照部分音を入力信号から選択してもよい。
【0034】
Grob−Da Veigaに許可された米国特許第5,218,160は、低音または高音を生成することによって弦楽器音を強化する方法を開示する。この発明は、基音周波数を抽出し、倍音的に関係する低音および高音を生成するために当該周波数に整数または小さい分数を乗じる方法を用いる。従って、低音および高音は基音周波数(周波数)から直接導出される。
【0035】
Slaneyへ許可された米国特許第5,749,073号はオーディオ情報の自動モーフィングを扱う。オーディオモーフィングは、それぞれ認識可能な特性を備えた複数のサウンドを混合して、両方の元の音源が合成された特性を備える新たなサウンドにする処理である。
【0036】
Slaneyは多重ステップ技法を使用する。最初に、2つの異なる入力サウンドは解析(分解)可能な形式に変換され、倍音(調和)関係および不調和(非倍音)関係を見分ける種々の点で一致可能となる。一旦、入力が変換されると、ピッチ及びフォルマント周波数は2つの元のサウンドを一致させるために用いられる。一旦、一致すると、これらのサウンドはクロスフェード(即ち、合計されるか、または、事前に選択された割合で混合)され、次に、2つのサウンドの組合わせである1つの新たなサウンドを作るように変換される。用いられる方法は、音高の変化およびフィルタリングによるスペクトルプロファイル操作を用いる。以前に言及した特許におけると同様に、これらの方法は共振フィルタリングおよびフォーマット情報の操作を必要とする。
【0037】
E.Tellman、L.HakenおよびB.Hollowayによる論文「Timbre Morphing of Sounds with Unequal Numbers of Features」(同じ個数でない特徴を備えたサウンドの音色モーフィング)(Journal of Audio Engineering Society,Vol.43,No.9,Sept.1995)に開示された技術はSlaney特許と密接に関連する。この技術は、Lemur解析および合成を用いてサウンド間をモーフィングするアルゴリズムを必要とする。Tellman/Haken/Hollowayによる「音色モーフィングコンセプト(概念)はタイムスケール修正」(通過の速度低下または速度上昇)、ならびに、個別正弦波(サイン波を基調とする)構成要素の振幅および周波数の修正に関係する。
【0038】
Robert A.Moogによる米国特許4,050,343号は電子音楽シンセサイザに関する。音情報はユーザによって押される鍵盤キーから導出される。押された鍵盤キーは、電圧/被制御されるオシレータであって、その出力がバンドパスフィルタ、ローパスフィルタ、及び、出力増幅器を制御するオシレータを制御する。バンドパスフィルタの中心周波数および帯域幅は制御電圧を印加することによって調節される。ローパスフィルタのローパスカットオフ周波数は制御電圧の印加によって調節され、増幅器の利得は制御電圧によって調節される。
【0039】
アイオナイザ[Arboretum Systems社]と呼ばれる製品において、ノイズのみの特徴を示す信号に含まれるノイズのスペクトルを得るための方法は「事前解析」を用いることによって開始する。テープヒス、録音プレーヤノイズ、ハム、及び、バズ音は再発型ノイズであるので、これは、オーディオシステムにおいて実際に非常に有用である。サウンドプリントを得ることにより、これは、「アンチ‐ノイズ」を作成し、それを音源信号から差し引く(必ずしも直接とは限らない)ための基準として用いられる。プログラムの音響設計(Sound Design)部分内の通路において「ピーク検出(peak finding)」を使用することにより、512帯域のゲートEQ(イコライザ)を実装し、これによって、個別の倍音を引き抜くか、又は、或る特定のサウンド要素を除去するための非常に急峻な「ブリックウォール(煉瓦壁体)」フィルタを作ることができる。これらは、動的フィルタの作成を可能にするスレショルド(閾値)機能を実装する。しかし、この場合にも、ここで用いられる方法は基本周波数に対して追随または追跡せず、倍音除去は周波数帯域内において実行しなければならず、従って、楽器に関する全通路は追跡されない。
【0040】
Kyma−5は、Symbolic Sound社によって開発されたソフトウェアとハードウェアの組合わせである。Kyma−5は、カピバラ(Capybara)ハードウェアプラットホームによって加速されるソフトウェアである。Kyma−5は本来合成ツールであるが、入力は既存の記録された音響ファイルから得ることも可能である。Kyma−5はリアルタイム処理能力を持つが、本来静的ファイル処理ツールである。Kyma−5の一態様(アスペクト)は、音通路のスペクトルディスプレイから部分音を図形的に選択し、処理を適用する能力である。Kyrma−5は視覚的に部分音の選択に近づき、倍音の高さの位数を用いることなく周波数帯域内スペクトルディスプレイの「接続された」ドットを識別する。倍音は、手動で設定された帯域内に在れば選択できる。Kyma−5は、静的ファイルの倍音を解析し、加算合成を含む様々な合成アルゴリズムを適用することによって当該静的ファイルからサウンドまたは通路を再合成できる。ただし、継続時間全体に亙って音が変化する場合に、基本音に対して倍音を追跡する自動的な処理は行われない。Kyma−5は、ユーザが1つの基本周波数を選択することを可能にする。Kymaスペクトル解析ツール上の点を識別することによって厳密に非倍音(インハーモニシティー)である点を識別できる。最終的に、Kymaはサウンドにストレッチ定数を適用しない。
【0041】
(発明の方法および結果)
本発明は、複合オーディオ信号が時間経過とともに進行するにつれて各々のあらゆる基音、及び/又は、音の特定の倍音を、ユーザが規定した方法で修正することにより、信号、波形、音、または、任意の音源によって生成される他の信号の音質または音色に作用する。例えば、楽音(または、他の信号波形)の倍音に適用されるユーザが決定した変更は、時間経過と共に音楽が通過するにつれて、その次の音または信号、および、またその後の音および信号、および、あらゆる後続する音または信号にも適用され得る。本発明の全ての態様は、時間の経過とともに目標の振幅と周波数の両方が移動するにつれて音、サウンド、部分音、倍音、音色、非倍音、信号、等を調査し、かつ時間経過とともに振幅および周波数が調節可能な修正子を移動させることによって移動目標を調節することに留意することが重要である。
【0042】
本発明が具現する方法を次に示す。
* 複合波形のあらゆる倍音(f1からf∞まで)のエネルギを動的および個別に変更する。
* あらゆる他の倍音に対して定義された振幅および位相関係を有する新たな倍音(例えば、望ましいサウンドから「欠落」している倍音)を作成する。
* 整数や、fn=f1xnxSlog 2 nなどのユーザ定義の倍音関係に基づいて、合成サウンド内に自然発生する倍音を識別および模倣する。
* 倍音を抽出し、修正して、音内に再度挿入する。
* 周波数、振幅、及び/又は、他のパラメータに応じて信号を補間して、選択された音の倍音構造を調節可能とし、次に、ユーザ調節点の一方から他方の点までの音楽レンジ全体に亙り、ユーザによって規定された幾つかの曲線または音調曲線のいずれかに従って信号の倍音構造をシフトする。
* 倍音のアタックレート、ディケイレート、及び/又は、サステインパラメータを動的に変更する。
* 種々のタイプを処理するために複合信号からあらゆる倍音を分離する。
* 信号内の部分音の周波数および振幅に基づき、信号内の部分音のレベルを変える。
* 倍音の高さ及び振幅に基づき、複合信号の倍音のレベルを連続的に変える。
* 選択された通路全体にわたるか、又は、通路の任意の部分において、固定量または可変量だけ倍音を増大または減少させる。
* 記録処理において、または、情報が記録された磁気または他の元の媒体の劣化のいずれかにより喪失、損傷、または、修正された可能性のある音源信号の特性情報を復元する。
* ストレッチ関数fn=f1xnxSlog 2 (n)を用いて部分音および倍音の位置を計算する。
* 倍音調節および倍音合成の前述実施形態の組合わせを用いて、あるサウンド信号を他の信号タイプのサウンド信号に一致し、類似し、または、部分的に類似するように倍音的に変換する。
* 新型を含むがこれに限定されることなく、ギターシンセサイザ、バスシンセサイザ、ギター、バス、ピアノ、キーボード、スタジオ音修正装置、マスタリング音修正装置、新規スタイルの等化デバイス、及び、音、サウンド、または、信号を修正する前述の方法と関係のある新規オーディオデジタルハードウェア及びソフトウェア技術を含む新規楽器に関する基本を提供する。
【0043】
* 音声、楽器音、または、他のオーディオ信号の混合体から、音声、楽器音、楽音、部分音、倍音、サイン波、その他のサウンドまたは信号(又は、サウンドまたは信号の部分)を分離または隔離する。
* 他のこの種混合体内の聞き取りにくい音声、楽器音、楽音、倍音、部分音、他のサウンドまたは信号、サウンドまたは信号の部分を前以てハイライトする。
* ノイズをキャンセルするか、又は、ノイズを軽減する。
* この種の他の信号の混合体内の強すぎる、すなわち目立ちすぎる音声、楽器音、楽音、倍音、部分音、他のサウンドまたは信号、又は、サウンドまたは原音の部分を前以て平滑化または減衰させる。
* 低音量を強調し、及び/又は、比較的高音量の音、部分音、倍音、非倍音、または音楽の通路内の他の信号や他の複合時間領域信号を減衰させ、又は弱化させる。
* 比較的低レベル情報が一層容易に見分けられ、かつ/または、処理され得るように、部分音の或る特定振幅レンジを除去する。
* 音声、楽器音、楽音、倍音、部分音、その他のサウンドまたは信号、又は、サウンドまたは信号の部分の更に望ましい平衡を一般的に実施する。
【0044】
(方法の概要)
本処理は、伝統的な楽器に制限されることなく、あらゆる入力ソース信号波形または構成要素に対して、その知覚される質を修正し、音色の特定態様を強化し、または、特定態様を弱調するために適用される。これは、所与信号に関するスペクトルの個別倍音、及び/又は、部分音の操作によって達成される。本発明によれば、倍音または部分音の調節は或る特定の限定期間に亙って実施される。これは、不確定期間に亙って維持される総称的固定帯域等化とは異なる。
【0045】
割り当てられた処理は、倍音(又は、倍音のグループ)のエネルギレベルを操作するか、または、新たな倍音(又は、倍音のグループ)、または、部分音を生成するか、または、倍音(又は、倍音のグループ)、または、部分音を完全に除去することによって達成される。操作はあらゆる他の倍音の応答に結び付け可能であり、或いは、操作は任意の周波数または倍音の高さまたはユーザが選択した他のパラメータに結び付け可能である。また、調節は既存の倍音とは無関係に生成可能である。方法の任意の組み合わせを使用する多重操作が用いられる場合もある。倍音または倍音のグループが、種々の手段により、個別処理されるために分離される場合もある。更に、部分音が強調または弱調される場合もある。
【0046】
倍音操作の好ましい実施形態はデジタル信号処理(DPS)技法を用いる。フィルタリングおよび解析方法はコンピュータ(例えば、DSPまたは他のマイクロプロセッサ)によりデジタルデータ表現に関して実施される。デジタルデータは、サンプリングされ、アナログ電気波形からデジタルデータに変換されたアナログ信号または複合波形を表す。処理が完了すると、データはアナログ電気信号へ変換し戻される。また、データは、デジタル形式で他のシステムへ伝送され、同様に、何等かの形の磁気または他の記憶媒体に局所的に記憶される。信号源はデジタルオーディオフォーマットにおいてほぼリアルタイム又は事前記録され、ソフトウェアは所要演算および操作を実施するために用いられる。
【0047】
本発明の前述以外の目的、利点、および、新規の特徴は、添付図面と共に考察すれば本発明に関する次の詳細な記述から明白になるはずである。
【0048】
(好ましい実施形態の詳細な説明)
(倍音調節)
倍音調節および合成の目標は、倍音の特性を当該倍音それぞれの高さの位数に基づいて個別に操作することにある。この操作は、特定音の振幅が維持される継続期間全体に亙る。倍音は、その周波数を中心周波数とするフィルタを適用することにより調節される。本発明全体を通じて、フィルタはイコライザ(等化器)、数式モデル、またはアルゴリズムの形式であっても差し支えない。フィルタは、他のいずれかの倍音に対する、当該倍音の周波数、振幅、および、時間における位置に基づいて計算される。再び、本発明においては、倍音を移動する周波数目標および振幅目標として扱う。
【0049】
本発明においては、入力されようとしている信号をシフトする全ての仕方を予測し、演算およびユーザの入力および制御に対応する。ほぼリアルタイムに「予測すること」は実際に、例えば適切な処理を始動するために、入来データ(即ち、オーディオ信号)の適切な特性が認識可能であるような最小量の時間に亙るデータ収集を必要とする。この情報は、必要な態様が確認されるまで、遅延バッファに記憶される。遅延バッファは、新しいデータによって絶えず満たされ、不必要なデータは、それがもう必要でない時、バッファの「最古」端部から除去される。これは、ほぼリアルタイム状況においていかに小さい待ち時間が発生するかを意味する。
【0050】
ほぼリアルタイムとは、最大約60ミリ秒の微細な遅延を意味する。それは、映画フィルムにおけるフレーム2個以下の継続時間としてしばしば表現される。ただし、フレーム1個の遅延が好ましい。
【0051】
本発明において、処理フィルタは倍音の移動を予想し、倍音が第1倍音(f1)に対して移動するのにつれて移動する。指定された倍音(又は、「振幅調節にための倍音集合」)は、倍音高さに関連して数学的に固定された量だけ周波数がシフトする。例えば、第1倍音(f1)が100Hzから110Hzに変化すれば、第4波倍音(f4)に関する本発明の倍音調節フィルタは400Hzから440Hzにシフトする。
【0052】
図1は、一連の音4個、および、所定の時点における各音の4個の倍音の特徴的な倍音成分を示す。この仮説的シーケンスは、倍音およびフィルタが基音、倍音、および、相互に対してどのように移動するかを示す。これらの移動する倍音の振幅および周波数両方を時間経過と共に追跡することは、ここに具体化される処理方法における重要な要素(キーエレメント)である。
【0053】
周波数間の間隔または距離(フィルタ間の感覚に対応する)は、基音の周波数が上昇するにつれて膨張し、基音の周波数が低下するにつれて収縮する。図形的に説明すれば、本明細書において、この処理は「アコーデオン効果」として知られている。
【0054】
本発明は、振幅調節のために設定された信号の、非静止の(周波数の変化する)倍音と共に移動するフィルタを用いて、時間経過における倍音の振幅を調節するように設計されている。
【0055】
具体的には、個別の倍音はパラメータ的にフィルタリング、及び/又は、増幅される。これによって、(従来型装置を用いて現在行なわれているように)その中に当該倍音が現れる周波数帯域に基づくことなく、倍音の高さ及び、どの倍音の高さの位数がフィルタリングされるものとして設定されているかに基づき、演奏されている個々の音のスペクトルにおける様々の倍音の相対振幅が増大および減少する。これは、例えば、音楽または複合波形の記録の後でオフラインに実施されてもよいし、または、ほぼリアルタイムに実施されてもよい。これがほぼリアルタイムに実施されるためには、個別に演奏された音の倍音周波数は、周知の周波数検出法または高速基音検出(Fast Find Fundamental)方法を用いて決定され、次に、決定された音に対して倍音別のフィルタリングが実施される。
【0056】
倍音はこの独特の仕方において操作されるので、1つ又は複数の固定された共振帯域に割り当てられた従来型フィルタを用いるとスペクトルの断片にのみ作用するのとは対照的に、精密に選択された個別倍音に関して楽器の全体的音色が影響される。
【0057】
説明を容易にするために、図1−3に示す倍音関係のモデルはfn=f1xnとする。
【0058】
例えば、次の2つの音(図1の音1と音3)の第4倍音は周波数レンジが異なるが、この形式のフィルタは400Hzである第4倍音を、2400Hzの第4倍音をフィルタリングするのと同じ方法でフィルタリングするする。本発明のこの適用は、従来型周波数帯域毎の等化装置に対する補足として、及び/又は、代替物として有用なはずである。出力するために、演奏された音のこれらの個別にフィルタリングされた倍音を混合することについては、図4及び5に関して検討することとする。
【0059】
図2は一時点におけるある信号の倍音成分の一例を示す。基音周波数(f1)は100Hzである。従って、100Hzの倍数において、この信号の倍音は200Hz(f2=f1x2)、300Hz(f3=f1x3)、400Hz(f4=f1x4)、等々である。説明のために、この例には合計10個の倍音を示すが、実際の信号は更に多くの倍音を持つ場合が多い。
【0060】
図3は、本発明によって実施可能な図2に示す幾つかの倍音の調節修正を示す。200Hz(第2倍音)、400Hz(第4倍音)、500Hz(第5)、及び、1000Hz(第10)に位置する倍音のエネルギ成分および振幅は上方調節される。600Hz(第6倍音)、700Hz(第7倍音)、800Hz(第8)、及び、900Hz(第9)における倍音のエネルギ成分および振幅は下方調節される。
【0061】
本発明を用いると、倍音は、種々の方法により、振幅が増大または減少させられる、(ここでは、「振幅調整機能」と称する)。現代的一方法は、対象とするタイムフレーム全体に亙って具体的に計算されたデジタルフィルタを適用することである。これらのフィルタは調節されつつある倍音の周波数の移動に応じてフィルタの振幅および周波数を調節する。更に、別の方法でも、デジタル信号処理を用いて、例えば、シヌソイド(正弦曲線)の位相を対象とする倍音に一致させ、次に、(A)減少させるためには、元の信号に反転波形を加えることにより、所要量を減算し、又は(B)強化するためには、基準化されたバージョンの波形(すなわち、所望の係数が乗じられる波形)を加算する。
【0062】
他の実施形態においては、周波数が隣接する一連のフィルタ又は一連の固定周波数フィルタを使用する。この場合、1つの倍音があるフィルタレンジから次のフィルタレンジに移動する際に、処理工程は「バケツリレー」方式で手渡される。
【0063】
図4は実装実施形態を示す。ピックアップ、マイクロホン、または、事前記憶されたデータからの入力10における信号は倍音信号検出HSD12、および、フィルタのバンク14に供給される。バンク14における各フィルタは倍音検出信号の特定の倍音周波数に関してプログラム可能であり、f1、f2、f3...fNによって表される。コントローラ16は各フィルタの周波数を、当該倍音の高さに関する倍音信号検出器12によって検出された倍音周波数に一致する周波数に合わせる。個別倍音の所要の修正は、ユーザ入力に基づいてコントローラ16によって制御される。フィルタのバンク14の出力はミキサ18において入力10からの入力信号と組合わされ、使用される所定のアルゴリズムに依存する出力20に、組み合わせ出力信号として供給される。以下に、図3に関して検討するように、コントローラ16は、ミキサ18においてイコライザバンク14および入力10からの信号と組合わされるべき合成倍音も同様に供給する。
【0064】
図5は交互バケツリレー方式を実施するように修正されたシステムを示す。イコライザバンク14’はフィルタのバンクを有し、それぞれのフィルタはFa、Fb、Fc、等々によって表される固定周波数隣接帯域幅を有する。コントローラ16は、倍音信号検出器12によって識別される倍音信号を受け取ると、検出された倍音信号の特性と一致するように、14’の固定帯域幅フィルタの特性の信号修正を調節する。ここで、図4のバンク14内フィルタの各々の周波数は所要倍音に調節され、修正特性は所要倍音用に固定される。図5のバンク14’のイコライザは各々周波数が固定され、それらの修正特性は検出された倍音信号に応じて変えられる。
【0065】
アコーデオン周波数および振幅調節可能移動フィルタ法が使用されても、これらの方法の後に行なわれるか、これらの方法と組み合わされる予想周波数のバケツリレー法が使用されても、フィルタリング効果は振幅変化用に選択された倍音を用いて、信号の周波数ばかりでなくその倍音高さ及び振幅に応答して周波数を移動させる。
【0066】
倍音信号検出器12はコントローラ16とは別に図示されているが、両者は共通のDSPまたはマイクロコンピュータのソフトウェアであってもよい。
【0067】
フィルタ14はデジタルであることが好ましい。デジタルフィルタリングの利点は、位相歪みと呼ばれる元の信号と処理された信号の間の望ましくない位相シフトを最小限にできることである。本発明の一方法においては、所要目標に応じて2つのデジタルフィルタリング方法、即ち有限インパルス応答(FIR)方法、または無限インパルス応答(IIR)方法のどちらでも使用可能である。有限インパルス応答方法は振幅調節及び位相補償のために、分離された個別のフィルタを使用する。振幅調節フィルタは、所要応答が入力信号の周波数の関数となるように設計されてもよい。デジタルフィルタは、その振幅応答特性が本質的にデータアレの位相特性に影響して、これを歪めるように設計される。
【0068】
その結果、振幅調節フィルタには直列配置された位相補償フィルタとしての第2フィルタが後続する。位相補償フィルタは単位利得デバイスであり、振幅調節フィルタによって導入された位相歪みに対抗する(逆らう)。
【0069】
フィルタ及び他のサウンドプロセッサは、2つのタイプの入力オーディオ信号、即ちリアルタイムまたは非リアルタイム(固定または静的)のどちらにも適用可能である。リアルタイム信号には、プライベートな設定場所、公共アリーナ、又は、録音スタジオのいずれかにおいて行われる生の演奏が含まれる。一旦、複合波形がデジタル形式で磁気テープ又はその他の媒体に録音されると、当該波形は固定すなわち静的であるとみなされ、さらなる処理が可能である。
【0070】
入力信号にデジタル処理が適用可能となる前に、当該入力信号自体がデジタル情報に変換されなければならない。アレイは信号のデジタル表現を示す数列である。フィルタは、アレイの始めから終わりに向かって前進方向に適用されるか、又は、終わりからはじめに向かって後退方向に適用される。
【0071】
第2のデジタルフィルタリング方法、即ち無限インパルス応答(IIR)において、対象とするデータアレイに亙って両方向にフィルタを適用することにより、ゼロ位相フィルタリングが非リアルタイム(固定、静的)信号を用いて達成される。位相歪みは両方向において等しいので、フィルタが両方向に実行されるときにおける正味効果は、このような歪みが相殺されることである。この方法は静的な(固定され、記録された)データに限定される。本発明の一方法においては、高速デジタル計算デバイス、ならびに、ディジタル化された音楽を定量化する方法が用いられ、高速フーリエ、及び/又は、ウェーブレット解析に対する付加物として数学的アルゴリズムを改良する。デジタルデバイスは既存の音楽を解析し、倍音の音量または振幅を所要レベルに調節する。この方法は、倍音と共に周波数が移動し、所要倍音レベルが図4に示すように変化する非常に急速に変化する複合ピンポイントデジタル等化ウィンドウを用いて達成される。
【0072】
本発明は、ギター、バス、ピアノ、等化およびフィルタリングデバイス、記録に用いられるマスタリングデバイス、電子キーボード、オルガン、楽器音修正器、および、他の波形修正器に適用可能であるが、これらに限られない。
【0073】
(倍音合成)
楽音または他のオーディオ信号の倍音成分のエネルギレベルを調節することが望まれる多くの状況において、倍音成分が断続的であるか、または、事実上存在しないならば、前記の調節を実施することは不可能である。これは、倍音がソース信号のノイズ「フロア」(認識可能な最小エネルギレベル)を下回るようにフェードしたときに発生する。本発明を用いれば、これらの欠落またはフロアを下回る倍音は「スクラッチから」生成可能、即ち、電子的に合成される。更に、ソースに対する整数乗数関係または非整数乗数関係のいずれかを用いて、完全に新しい倍音、非倍音、または、分周音(基音より低い周波数の倍音)をすべて一緒に作ることも同様に望ましい。再び、この創作または生成処理は合成の一タイプである。自然に発生する倍音のように、合成された倍音は一般にそれらの基音の周波数に数学的に関係する。
【0074】
倍音調節の場合のように、本発明によって生成される合成倍音の周波数は非静止であり、合成倍音は他の倍音に対して移動する。合成倍音は任意の個別倍音(f1を含む)に対して合成され、音の周波数が変化すると、その変化が倍音シンセサイザを正しく調節することが予想しつつ、合成倍音の周波数が移動する。
【0075】
図2に示すように、元の信号の倍音成分は1000Hz(100Hz音の第10倍音)までの周波数を含み、第11または第12の倍音は存在しない。図3は、倍音合成によって生成されることによってこれらの欠落倍音が存在する場合を示す。従って、新たな倍音スペクトルには1200Hz(第12倍音)までの倍音が含まれる。
【0076】
楽器は、可聴スペクトルにおける倍音の相対レベルのみならず音に対する倍音の位相(時間経過と共に変化する関係)によっても定義される。従って、倍音合成は、振幅的に相互関係を持ち、かつ位相的に位置合わせされた(即ち、任意にではなく一貫的に基音に対して一致、又は、関連する)倍音の創造も可能にする。フィルタのバンク14及び14’は、同様にデジタルサイン波生成器でもあるデジタルデバイスであることが好ましく、合成倍音は、fn=f1xn以外の関数を用いて生成されることが好ましい。新たな倍音を生成するための好ましい関係はfn=f1xnxSlog 2 (n)である。Sは1より大きい数、例えば1.002である。
【0077】
(倍音調節および合成)
倍音調節と倍音合成の組み合わせは,「欠落している」とみなされる倍音を含めて1つの音に含まれる全ての倍音の振幅をそれらの倍音高さに基づいて動的に制御する能力を具体化する。倍音を制御するこの能力は、種々様々の音または信号の音色をユーザの好みに合わせて操作する大きい融通性をユーザに与える。本方法は、特定の入力信号の倍音レベルに基づいて種々異なる操作が望まれることを認識する。この方法は倍音調節および倍音合成を具体化する。既に存在するスペクトルの断片にのみ作用する場合と対照的に、楽器全体の音色が影響される。
【0078】
倍音がソース信号のノイズ「フロア」を下回るようにフェードアウトする場合のように、倍音成分が断続的であるか、又は、事実上存在しないならば、信号の倍音成分のエネルギレベルを調節することは不可能である。本発明をもちいると、これらの欠落したまたはフロアを下回る倍音は「スクラッチから」生成され、すなわち、電子的に合成されることが可能であり、その後で、元の信号、及び/又は、倍音的に調節された信号に混合し直される。
【0079】
これに関しては、ソース信号の全倍音応答を修正するために、倍音調節と関連して倍音合成も使用可能である。例えば、図6に示すように、エレキギターの第10倍音は、倍音高さがより低い倍音よりはるかに迅速に衰微する。音の初期部分における当該倍音のレベルをブーストするためだけでなく、当該倍音のレベルを当該音が存在する全期間に亙って維持するためにも合成を使用することは興味深い。合成は、選択された区分または通路における全ての音に対して実施される。従って、既存の倍音は、その倍音が或る閾値を越える部分的期間中に調節され、その後、当該音の残りの部分的期間中に(その調節された形において)合成される(図7参照)。
【0080】
幾つかの倍音に関してこれを達成することが望まれることもあり得る。この場合、当該倍音は、所要閾値に振幅を維持するために所要の位相位置合わせを用いて合成される。位相位置合わせは任意の設定を起点とすることもできるし、又は、位相は何等かの方法によりユーザが選択した倍音に位置合わせすることもできる。この方法においては、非常に高速で周波数、及び、振幅が変化し、及び/または、音の倍音エネルギ成分を変えるように非常に高速で移動し、所要の欠落倍音を加えるようにシンセサイザと調和して作用する。これらの倍音および合成された倍音は音量においてデジタルデバイスのソフトウェアに設定された百分率における設定倍音の振幅に比例する。新たな倍音を生成するためには、関数fn=f1xnx(S)log 2 (n)が用いられることが好ましい。
【0081】
存在しない倍音をブーストしようとする試行を回避するために、本発明は、検出アルゴリズムを使用して保証された調節を行うために十分な部分音が存在することを示す。一般に、この種の検出方法は、部分音エネルギ(または振幅)が、任意に定義された或る期間に亙って或る閾値以上である限り、存在するものと見なされるように、部分音のエネルギに基づく。
【0082】
(倍音変換)
倍音変換は、1つのサウンドまたは信号(変換対象のファイル)と他のサウンドまたは信号(第2ファイル)とを比較し、その後、倍音調節および倍音合成を使用して変換対象の信号を調節し、それによって当該信号が音色において第2ファイルに一層近く類似するか、或いは、第2ファイルと全く同じにする。これらの方法は、既に言及した発明の幾つかの態様を組み合わせることにより、オーディオサウンドを組み合わせるという目的、又は、あるサウンドを別のサウンドにより近づけるという目的を達成する。実際、録音された楽器または音声のサウンドを他の楽器または音声のサウンドにほとんど精確に似せるために、これを使用することができる。
【0083】
楽器または音声によって生成された或る音を、時間に対する、その倍音の周波数成分の観点から観察した場合(図6)、各倍音がアタック特性(当該倍音の初期部分が時間においてどのくらい速く立ち上がり、どのようにそのピークに達したか)、サステイン特性(アタック部分の後で、倍音構造がどのように動くか)、および、ディケイ特性(音の終わりの部分において倍音がどのように停止または衰微するか)を持つことが分かる。音自体が終了する以前に、特定の倍音が完全に衰微している場合もある。
【0084】
1つのタイプの楽器の異なる例(例えば、2台のピアノ)は、多くの点において異なる。その一つのバリエーションは、特定の複合時間領域信号の倍音成分ある。例えば、1台のピアノで出したミドル「C」音は、別のピアノで出した同じ音と、非常に異なった倍音成分を持つ。
【0085】
2台のピアノが異なり得る別の点は、時間経過に対する倍音成分である。2台の異なるピアノで演奏された同じ音は、倍音構造が異なるばかりでなく、これらの構造は時間経過と共に異なる仕方で動作する。1つの音の或る倍音は、別のピアノで出した同じ音の倍音構造の時間経過に対するふるまいと比較して、非常に異なる仕方でサステインまたはフェードアウトする。
【0086】
録音された楽器によって生成される各信号の倍音を個々に操作することによって、当該楽器の応答を別の異なる楽器の応答に密接に類似させるか、又は、一致させることが出来る。この技法は倍音変換と呼ばれる。この技法は、各音内の倍音エネルギレベルを動的に変更し、時間経過におけるそれらのエネルギ応答を別の楽器の倍音エネルギレベルに密接に一致させるように調整する。これは、倍音ランキングに関係する周波数帯域比較によって達成される。第1ファイル(倍音的に変換されるべきファイル)の倍音が、第2ファイルのアタック、サステイン、および、ディケイ特性と一致するように、第1ファイルの倍音は目標とするサウンドファイルと比較される。
【0087】
倍音は一対一に対応しないので、調節用規則を設定するために、アルゴリズムによる比較解析が必要とされる。この処理は、一般的な処理に際して、ユーザからの入力によって援助されることも可能である。
【0088】
この種の操作の一例はフルートとピアノに見られる。図8aから8dまでは、特定の時点におけるピアノ及びフルートに関するスペクトル成分のプロットを示す。図8aは、一般的なフルートの初期の音におけるスペクトル成分を示す。図8bは同一音の非常に後期におけるフルートの倍音成分を示す。図8cは一般的なピアノからの図8aと同じ相対的時点における同一音を示す。これらの時点において、大量の高倍音エネルギが存在する。ただし、時間経過の後、各音の相対倍音成分は非常に変化した。図8dは、同一相対時点における、図8bと同じであるがピアノから出た音を示す。ピアノの高倍音成分は、音における、この時点のフルートの倍音成分よりはるかに希薄である。
【0089】
1つのサウンドファイルは他のサウンドソースの広大なアレイに更に密接に類似させることが可能であるので、情報は第2のサウンドファイルから直接入力される必要はない。モデルは様々な手段によって作ることができる。一方法は、他のサウンドをその時間経過におけるふるまいに基づいて全体的に特性化し、特徴的な倍音または部分音成分のふるまいに注目することである。従って、変えようとするサウンドファイルの各倍音の処理を導くための、種々の数学的または他の論理的規則を作成可能である。モデルファイルは、他のサウンドファイルから作成され、完全な理論的モデルであってもよいし、又は、実際には、ユーザによって任意に定義してもよい。
【0090】
ユーザがピアノの音をフルートに類似させようとするものと仮定すれば、この処理は、両楽器の相対的特性の考察を必要とする。ピアノは、音の開始時にその倍音内に大きいエネルギバーストを持ち、その後エネルギ成分は急激に落下する。これに比べて、フルートの初期アタックはそれほど顕著でなく、非倍音性を持つ。本発明を用いると、ピアノの各倍音は、全ての音のこの段階においてフルートの対応する倍音および欠落部分音に近似させるか、又は、必要に応じてこれらを合成するように適宜調節される。
【0091】
ピアノの出す音のサステイン部分においては、その高倍音エネルギ成分は迅速に消滅するのに対し、フルートの出す音においては、高倍音エネルギ成分は当該音の継続期間全体に亙って存在する。従って、この部分の期間中、ピアノの倍音を連続して動的に調節することが必要である。実際、或る点においては、倍音がかなり低レベルまで降下すると、倍音成分を置き換えるために合成が要求される。最終的に、これらの2つの楽器においては、音のディケイもわずかに異なり、フルートに一致させるには再び適切な調節が必要とされる。
【0092】
これは、組み合わせて使用され、音周波数を含めて、対象とする信号または音の種々様々な態様のシフトと共に移動するか、又は、これら態様におけるシフトを予想するデジタルフィルタ、調節パラメータ、閾値、および、サイン波シンセサイザの使用によって達成される。
【0093】
(倍音および他の部分音の強調)
本発明において、倍音および他の部分音の強調は、関連周波数レンジ内の他の信号の振幅に関係するそれらの振幅に基づいて、サイン波、部分音、非倍音性、倍音、または、他の信号を調節する方法を提供する。フィルタ振幅位置ガイド又は判定基準として倍音ランキングを置き換えることは、周波数レンジ内の振幅を用いて倍音調節を変更することである。また、倍音調節の場合と同様に、部分音は周波数ならびに振幅が移動するので、部分音の周波数はガイドを調節するフィルタ周波数である。音楽通路に一般的な多くのオーディオエレメント又は他の複合オーディオ信号の中で、本発明を用いた場合に、弱いものは他のものに対してブースト可能であり、ユーザの選択に従ってそれらの動的レンジを圧縮するか、又は、圧縮することなく、強いものは他のものに対してカット可能である。
【0094】
本発明は(1)比較的静かなサウンドまたは信号を分離するか或いはハイライトし、(2)とりわけ背景雑音、歪み、または、混乱、競合、または、ユーザによって好ましくないとみなされるオーディオ信号を含む、比較的大音量の、または他の選択されたサウンドまたは信号を減少させ、(3)より明瞭な、又は、そうでなければ、より望ましい部分音、音声、楽音、倍音、正弦波、その他のサウンドまたは信号、または、サウンドまたは信号の部分の混合を実施する。
【0095】
従来型電子コンプレッサ及びエキスパンダは、本発明によって考慮対象とされる極めて少数のパラメータのみであって、決して全体でないパラメータに従って作動する。更に、この種の圧縮/拡張デバイスの動作は、本発明のこの種のデバイスとは基本的に異なる。強調を用いる場合には、信号の調節はその振幅のみに基づくことなく、その周波数レンジ内の他の信号の振幅に対するその相対振幅によっても調節可能である。例えば、床の上で足を引きずる音は、聞き取るために調節する必要がある場合も又はない場合もあり得る。それ以外には静かな部屋においては、サウンドの調節を必要としないが、強烈に競合している部分音、サウンド、または、信号の背景音に対して同一振幅の同一サウンドが発生している場合には聞き取るために強調を必要とする。本発明はこの種の決定を行い、それに従って動作することができる。
【0096】
本発明の一方法においては、1つの音楽がディジタル化されて、振幅修正して静かな部分音を強調する。現行技術は、当該音楽を固定周波数レンジ内に圧縮することによってこれを達成するが、それによって信号全体がその動的レンジ全体に基づいて影響される。正味の効果は、より静かな通路を増幅することによってより静かな区分を強調することにある。本発明のこの態様は異なる原理で作用する。コンピュータソフトウェアは、複合波形のスペクトルレンジを調査し、特定の設定閾値レベルを下回る個別部分音のレベルを引き上げる。同様に、特定の閾値を上回る部分音のレベルは振幅において引き下げられる。ソフトウェアは複合波形内の全ての部分音周波数を時間経過に対して調査し、変化に関して設定された閾値内の部分音周波数だけを修正する。この方法において、アナログ及びデジタルのハードウェア及びソフトウェアは音楽をデジタル化し、それを何等かの形式のメモリに記憶する。複合波形は、高速フーリエ変換、ウェーブレット、及び/又は、他の適切な解析方法を用いて高い精度において調査される。関連ソフトウェアは経過時間に対して計算された部分音の振幅、周波数、およびタイムスレショルド(時間限界値)、及び/又は、パラメータを比較し、いずれの部分音周波数が振幅修正に関するスレショルド内に所在するかを決定する。これらのスレショルドは動的であり、かつ、どちらかの側の指定された或る周波数レンジ内における調節用に予定された部分音を囲む競合する部分音に依存する。
【0097】
本発明のこの部分は、洗練された周波数選択的等化またはフィルタリングデバイスとして作用し、この場合における選択可能な周波数の数はほとんど無制限である。デジタル等化ウィンドウが生成されて消去され、それによって、聞き取り難かったサウンド内の部分音の始め、ピーク、および、終わりの振幅を変えることによって、聴取者にとってより明瞭になる。
【0098】
対象とされる振幅を持つ信号が他の信号の振幅に対してシフトするにつれて、本発明の融通性は、(1)連続的に変化するように、又は、(2)固定的であって非連続的に変化するように、のいずれかで調節が実施される。実用的効果は、調節を必要とするオーディオ信号の部分を精確に指摘し、その調節を実施するばかりでなく、これらを必要に応じて必要とされる時に限り実施する能力である。フィルタ変化が毎秒約30サイクルより速ければ、フィルタ変化はそれら自身の音を生成する。従って、低音サウンドがフィルタリングによって除去できない限り、これより速い速度の変化は提案されない。
【0099】
本発明の第1の方法(又は、その組み合わせ)は、特定の時点において特定の部分音(または、その断片)に所要の調節を実施するために何が必要とされるかに従って、周波数および振幅が移動するフィルタを用いる。
【0100】
本発明の第2の方法においては、振幅調節用に設定された部分音が1つのフィルタレンジからその次のフィルタレンジへ移動するときに、「バケツリレー」方式で処理が手渡される。
【0101】
本発明は、周波数、時間経過に対する周波数、時間経過に対する周波数帯域内の競合部分音、振幅、および、時間経過に対する振幅を調査することができる。次に、周波数および振幅を調節可能なフィルタ、数式モデル、または、アルゴリズムを使用して、上述の目標、結果、または、効果を達成するための必要性に応じて、これら部分音、倍音、または、他の信号(またはその部分)の振幅を動的に調節する。両方の方法において、部分音、他の信号、または、その部分の周波数および振幅を評価した後で、本発明は、信号を上方または下方調節するか、または、全然調節しないかを、閾値に基づいて決定する。
【0102】
強調は、振幅閾値、及び、調節曲線に従う。本発明において、所要の結果を達成するために、閾値および調節を実施する3つの方法がある。第1の方法は、複合波形の全エネルギに基づいて振幅閾値を動的に調節する閾値を利用する。エネルギ閾値は一貫性のある周波数依存性を維持する(即ち、閾値曲線の勾配が全てのエネルギ変化に対して一貫している)。第2の方法は、調節されようとしている部分音の周りの周波数帯域内の補間された閾値曲線を実現する。閾値は動的であり、この部分音の周りの周波数領域に限定される。また、調節も同一周波数帯域において動的であり、振幅が変化する領域変化内における周りの部分音と同様に変化する。部分音は周波数が移動するので、閾値および調節周波数帯域も周波数において動的であり、調節されようとしている部分音が移動すると、これと共に移動する。第3の方法は固定した閾値レベルを利用する。振幅が閾値を上回る部分音は下方へ調節される。振幅が閾値を下回るがノイズフロアを上回る部分音は振幅において上方調節される。これら3つの方法について以下に検討することとする。
【0103】
3つの方法全てにおいて、調節レベルは「基準化(スケーリング)関数」に依存する。倍音または部分音が閾値を超えるか、または、それを下回るように降下すると、閾値を超えた量またはそれを下回った量が調節の大きさを決定する。例えば、上側閾値をかろうじて超過する部分音は極少量だけ下方調節されるが、閾値を更に超過すると、更に大量の調節が発生する。調節量の遷移は連続関数である。最も単純なこの種の関数は線形関数であるが、任意の基準化関数が適用される。いかなる数学関数を用いる場合でも、閾値を超えるまたはそれを下回るように降下する部分音の調節レンジは基準化されるか或いはオフセットされる。基準化関数の効果が基準化されると、閾値が変化したかどうかには関係なしに、部分音が閾値を超過すると同量の調節が発生する。例えば、既に示した第1の方法において、波形内に更に多くのエネルギが存在するときには閾値が変化する。基準化関数は、依然として、調節されるべき部分音の0%から25%までの間で変動するが、波形内に更に多くのエネルギが存在する場合には比較的小さい範囲で変動する。これの代替操作は、基準化関数を幾らかのパーセンテージだけオフセットすることである。従って、信号内に更に多くのエネルギが存在する場合には、レンジは同じでないはずであり、例えば、この場合、0%から10%のみにまで変化する。しかし、調節量の変化は、閾値を超過した部分音のエネルギ量に対して一貫したものである。
【0104】
第1の閾値および調節方法に従い、振幅の最小および最大限度を画定することにより、信号の部分音成分の一部分に作用することが望ましい。この種の処理においては、2つの閾値の境界、即ち上限または天井と、下限またはフロアとの間に信号が保持されることが理想的である。部分音の振幅は、設定された期間よりも長期に亙って、上側閾値を超え、または、下側閾値を下回るように降下することは許容されない。これらの閾値は、図9Aに示すように、周波数に依存する。ノイズフロアは、実際に単なる低レベルノイズに過ぎない部分音の調節を防止するように確立されなければならない。ノイズフロアは強調のために全体的な下限として作用し、手動により、又は、解析手順を介して確立される。各入力される部分音は2つの閾値曲線と比較されてから、上方(エネルギがブーストされる)または下方(エネルギが低減される)調節されるか、或いは、全然調節されない。ブースト又はカットは部分音周波数レンジにおける全信号振幅に関連するので、閾値曲線は同様に所与の時点における全信号エネルギに依存して変化する。調節量は、部分音のレベルに従って変化する。上述したように、調節は基準化関数に基づいて発生する。従って、調節されるべき部分音が閾値を超えるか、または、閾値を下回るように降下するエネルギ量に依存して調節が変化する。
【0105】
第2閾値および調節方法において、部分音は、当該部分音の継続時間において、調節されようとしている当該部分音の周りの周波数帯域における「競合する」部分音と比較される。この周波数帯域は幾つかの特徴を持つ。これらを図9Dに示す。1)帯域幅は所要の結果に応じて修正され得る。2)閾値及び調節領域の形状は連続的な曲線であり、曲線全体の「線形」部分に適合するように滑らかになる。曲線の線形部分はこの部分音に関する比較および調節領域の外側周波数を表す。ただし、曲線の線形部分の全「オフセット」は波形内における全エネルギに依存する。従って、閾値のオフセットにおける全シフトが観察されるが、調節はそれ自体の周波数領域における部分音に依存するので、特定の部分音の調節は変化しない。比較される周波数帯域における上側閾値は競合する部分音と共に増加する。閾値線を上回る部分音の調節に用いられる基準化関数は同様にシフト又は再基準化(リスケール)する。比較周波数帯域における下側閾値は競合部分音と共に下降する。再び、部分音の調節に用いられる基準化関数は同様にシフト又は再基準化する。3)部分音が閾値を上回るか、又は、閾値を下回るように降下すると、調節は振幅が閾値をどれだけ上回る、または、閾値をどれだけ下回るかに依存する。調節量は、後続部分音の周りの競合部分音内エネルギ分同様にオフセットされる連続的なパラメータである。例えば、部分音が上側閾値をかろうじて上回る場合には、その振幅は、例えば、僅かに5%だけ下方調節される。その振幅が比較的大量に閾値を上回る場合には、部分音が25%だけ調節される更に極端な場合が観察される。ただし、全信号エネルギが異る場合には、閾値オフセットにおける全シフトに対して幾らかのパーセンテージだけこの調節量はオフセットされる。4)実際に低レベルノイズであるに過ぎない部分音の調節を防止するようにノイズフロアが確立されなければならない。ノイズフロアは強調条件に関する全体的な下側限界として作用し、手動または解析手順を介して確立される。
【0106】
第3閾値および調節方法においては、全て同じ調節方法が用いられるが、単一固定閾値に関して比較が行われる。図9cはこの種の閾値の一例を示す。部分音が閾値を上回る、又は、それを下回るように降下した場合には、その調節は、振幅が閾値を上回るまたはそれを下回るように降下する量に依存する。調節量は、部分音内エネルギ分同様にオフセット又は再基準化される連続的なパラメータである。ここでも、上述の方法において述べたように、実際には単に低レベルノイズに過ぎない部分音の調節を防止するようにノイズフロアが確立されなければならない。
【0107】
ヒトの耳自体が平坦ではないので、全ての閾値および調節方法において、閾値(単一閾値または別々の上側および下側閾値)が平坦であるとは限らない。耳は、可聴レンジ全体に亙る均一または線形状態の振幅を認識しない。我々の聴覚応答は周波数依存である(幾らかの周波数では他の周波数よりも多量のエネルギを持つように知覚される)ので、本発明におけるエネルギ調節も周波数依存である。
【0108】
最大と最小振幅調節量間の振幅調節量を補間することにより、更に連続的かつ一貫性のある調節が達成可能である。例えば、その振幅が最大レベルに近い(クリッピングに近い)部分音は、その振幅が下側調節閾値をかろうじて上回る部分音の場合よりも下方調節されるエネルギ量が多いはずである。時間的閾値(タイムスレショルド)は、設定された周波数レンジにおいて競合する部分音が限界を持つように設定される。閾値曲線および調節曲線は、ユーザ希望定義とヒトの耳に基づいた経験的な知覚曲線との組み合わせを表す。
【0109】
図9Aは標本閾値(サンプルスレショルド)曲線を示し、図9Bは閾値及び調節方法1に関連するサンプル調節曲線を表す。閾値(スレショルド)は、全信号エネルギに依存する(例えば、下側全エネルギは閾値を低下させる)。入力される部分音の振幅が上側エネルギ閾値曲線または図9Aの上昇限度(天井)を上回る場合には、部分音は、図9Bの当該周波数に関連する調節曲線によって定義された量だけ部分音のエネルギがカットされる(下方調節される)。同様に、部分音の振幅が下側エネルギ閾値曲線すなわちフロア(床)を下回るように降下すると、そのエネルギは、当該周波数に対して関連する調節関数によって定義される量だけ再びブーストされる(上方調節される)。振幅の増加量、及び/又は、減少量は事前決定された量であってもよい。
【0110】
図9Bの調節関数は所与の周波数において実施される最大調節量を画定する。部分音の振幅への歪みの導入を防止する目的で、最大調節まで滑らかな遷移が実施されるように、調節量は時間経過と共に先細にされる。遷移は任意の関数によって定義され、線形パターンと同程度に単純なものであってもよい。漸進的なテーパ(先細り)なしでは、波形調節は速過ぎるか、または、不連続性を生じ、それによって、調節された信号に不必要、かつ/または、好ましくない歪みを生じる。同様に、部分音を上方調節する場合にもテーパリング(先細にすること)が適用される。
【0111】
図9Cは、第2の閾値および調節方法に関係する一例を示す。
【0112】
信号継続時間全体に亙って、当該信号の倍音/部分音の振幅は、かなり一定であることも変動することもあり、場合によっては、かなり変動する。これらの態様は周波数及び時間に依存し、或る特定の倍音の振幅およびディケイ特性は、競合する部分音に関して或る特定の形でふるまう。
【0113】
倍音(個別倍音または倍音のグループのどちらか)の最大振幅および最小振幅を制御するための閾値に関する前述の検討とは別に、ユーザによって設定される時間を基調とする閾値(スレショルド)も存在する。本発明が部分音を調節していくには、これらの閾値が適合しなければならない。
【0114】
本発明が作動開始するためには、振幅閾値がユーザによって指定された期間において適合するように、時間を基調とする閾値は、指定された調節に関する開始時間、継続時間、および、終了時間を設定しなければならない。例えば、振幅閾値が超過されても、その状態がユーザによって指定された期間に亙って維持されなければ、振幅調節は処理されない。例えば、次に示す条件のいずれかに適合する最小閾値を下回るように降下する信号は調節されない、即ち、(1)当該閾値に一旦適合したが、その後で、それを下回るように降下した場合、または(2)最初から一度も当該閾値に適合しない場合。ソフトウェアが、信号調節におけるこの種の差異を認識し、しかもユーザによって調節可能であれば有用である。
【0115】
(補間)
一般的な意味において、補間とは、所与量および既知変数の間の関係に基づいて2つの所与量間の未知量を推定または計算する方法である。本発明において、補間は倍音調節、倍音の調節と合成、部分音変換、及び、倍音変換に適用される。これは、楽器またはヒトの音声いずれかによって出された音の或る特定点における倍音構造をユーザが調節する方法を意味する。ユーザによって調節されたこれらの点の1つから他の点まで音楽レンジ全体に亙る倍音構造のシフト(移動)は、ユーザによって規定された幾つかの曲線または音調曲線または補間関数に従い、本発明の影響を受ける。このように、演奏された音の倍音成分の修正は連続的な方法で制御される。
【0116】
音声または楽器のサウンドは音域(レジスタ)の関数として変化可能である。異なる音域においてサウンドを変えたいというように願望が変化するため、歌手またはミュージシャンは、別の音域における音を出している状態において、ある1つの音域の特徴または音色を維持することを希望することがある。本発明において、補間は、彼らの願望を叶えるばかりでなく、ユーザによって調節された一方の点から別の点まで音楽スペクトル全体に亙って制御可能な仕方で、音の倍音構造を自動的に調節することも可能にする。
【0117】
ユーザは、高音域の音における第3倍音を強調したいが、中間音域における第10倍音は強調したくないものと仮定することとする。一旦、ユーザがこれらのパラメータを希望通りに設定すれば、本発明は、ユーザによって制御可能な変換特性を用いて、これらの点間における音の倍音構造のシフト(移動)を自動的に実施する。
【0118】
簡単に表現すれば、ユーザが或る特定点における倍音を設定すれば、補間作用はこれら「設定点」間の全てを自動的に調節する。更に具体的には、次に示す2項目が達成される。
* 第1に、ユーザは、音声または楽器レンジ内の異なる点における当該音声または楽器の音(又は、選択されたレンジ内における音のグループ)の倍音構造を調節することができる。その際、ユーザは、当該サウンド内において知覚された不足音を訂正したり、または、特別な効果を生成するようにサウンドを調節したり、または、望ましいと思われる倍音を強調したり、または望ましくないと思われる倍音を減少させるか又は削除したり、または、場合によりあらゆることを実施したりできる。
* 第2に、ユーザが、選択されたこれらの音または音域のサウンドの調節を一旦完了すると、本発明は、設定点間の音楽スペクトル全体に亙って、全ての音および知覚された全ての倍音の倍音構造をユーザによって事前に選択された公式に従ってシフトまたは変換する。
【0119】
補間関数(すなわち、一方の設定点の倍音構造からもう一方までシフトする特性または曲線)は線形であっても、対数的であっても、または、ユーザによって選択された他の音調曲線であってもよい。
【0120】
周波数目盛りは種々様々な音、倍音、部分音、または、他の信号の位置を図に表すことができる。例えば、1目盛りは1オクターブ離れた位置の周波数を図に表してもよい。本発明がユーザ設定点の間の全ての倍音構造を調節する仕方は当該ユーザによって選択可能である。
【0121】
(自然倍音の模倣)
倍音周波数の良好なモデルは、広い共振帯域内において近似自然「シャープ化」に設定可能であるので、fn=nxf1xSlog 2 nである。例えば、f1=185Hzの第10倍音は、10x185を用いる1850Hzの代わりに1862.3Hzである。更に重要なことは、その式が協和倍音、例えば、倍音1は倍音2と、倍音2は倍音4と、倍音3は倍音4と、倍音4は倍音5と、倍音4は倍音8と、倍音6は倍音8と、倍音8は倍音10と、倍音9は12と、等々のように協和する。これらの倍音が、倍音生成に用いられると、自然倍音の場合よりも更に強められて鳴る(ring)。これは、倍音調節および合成、および、自然倍音にも用いられる。この関数またはモデルは、より高い倍音を「シャープ化」する楽器によって生成され、近く一致する倍音を見付ける良好な方法である。このようにして、ストレッチ関数は自然倍音模倣INHに使用できる。
【0122】
関数fn=f1xnx(S)log 2 nはnが増大するにつれて次第にシャープ化する倍音をモデル化するために用いられる。Sはシャープ化定数であり、一般に1と1.003の間に設定され、nは正の整数1、2、3,...,Tであり、ここで、Tは一般に17に等しい。この関数を用いると、Sの値はシャープ化する範囲を決定する。それがモデル化する倍音は、fn=nxf1である場合に倍音が協和すると同じ方法で協和する。即ち、fn及びfmが1つの音のn番およびm番倍音であるならば、fn/fm=f2n/f2m=f3n/f3m=...=fkn/fkmである。
【0123】
例えば、高速基音検出方法、又は、フィルタバンクを介した明白な周波数位置決め技法、又は、自動相関技法などの基音および倍音の周波数を決定するために利用可能な多数の方法がある。特定の演算に必要とされる精度および速度の程度はユーザによって定義され、適切な周波数発見アルゴリズムを選択する助けとなる。
【0124】
(特殊効果のための倍音分離)
本発明およびその方法の更なる拡張はオーディオの独特な操作、及び、オーディオ処理の他の分野への本発明の応用を可能にする。対象とされる倍音はユーザによって選択され、次に、以前に言及した可変デジタルフィルタの使用によって元のデータから分離される。信号を分離するために使われるフィルタリング方法は任意の方法でよいが、特に適用可能な方法は、係数が入力データに基づいて再計算可能なデジタルフィルタである。
【0125】
次に、分離された倍音は他の信号処理ユニット(例えば、残響、コーラス、フランジ、等々の楽器用エフェクト)に供給され、最終的に、ユーザによって選択されるブレンド又は比率で元の信号へ混合して戻される。
【0126】
(具体化)
具体化される1つの変形例には、例えば、デスクトップパソコン24等のホストコンピュータシステムであって、追加機能を実施するために、システム内にインストールされる幾つかの増設カードを有するホストコンピュータシステムへ接続されたオーディオ信号22のソース(供給源)が含まれる。ソース32は生の演奏であっても、記憶されたファイルから得られてもよい。これらのカードには、アナログ−デジタル変換カード26及びデジタル−アナログ変換カード28、並びに、高速で計算およびフィルタリング処理を行なうために用いられる追加デジタル信号処理カードが含まれる。ホストコンピュータシステムは主にユーザインタフェース処理を制御する。ただし、汎用パソコンのプロセッサは、デジタル信号プロセッサカードをインストールすることなしに、全ての計算を単独で実行する。
【0127】
入力されるオーディオ信号は、電気サウンド信号をデジタル表現に変換するアナログ−デジタル変換ユニット26へ供給される。一般的な用途において、アナログ−デジタル変換は20から24ビットのコンバータを用いて実施され、48kHz−96kHz[および、おそらくは更に高い]サンプルレートで作動する。パソコンのサンプルレートは、一般に、16ビットのコンバータでサポートされる8kHz−44.1kHzである。これらは、幾らかの用途には十分である。ただし、例えば、20ビット、24ビット、32ビットなどの大きいワードサイズである方が更に良好な結果が得られる。また、サンプルレートが高ければ、変換された信号の品質が改良される。デジタル表現は、数の長いストリームであり、ハードディスク30に記憶される。ハードディスクは、例えば高性能取外し可能ディスク型媒体などのような独立型ディスクドライブであってもよいし、コンピュータ用の他のデータ及びプログラムが存在する同一ディスクであってもよい。性能および融通性に観点から、ディスクは取外し可能型である。
【0128】
一旦、ディジタル化されたオーディオデータがディスク30に記憶されると、信号の所要操作を実施するために、プログラムが選択される。プログラムは、実際には、所要の目標を達成するための一連のプログラムで構成される。この処理アルゴリズムは、処理アルゴリズムによって制御されたランダムアクセスメモリ(RAM)に記憶されているコンピュータデータを、可変サイズユニット内のディスク32から読み取る。処理が完成すると、処理されたデータはコンピュータディスク30で再び記憶される。
【0129】
本発明において、ディスクに対する読み取り及び書き込み処理は、読み取りと書き込みが混合され得るように、又、データセクションが多数回読み書き可能であるように双方向的、及び/又は、再帰的であってもよい。ディスクによるデジタルオーディオ信号のアクセス及び記憶は、システムを遅延させるので、オーディオ信号のリアルタイム処理においては最小限化される必要があることが多い。RAMのみを利用するか、または、キャッシュメモリを利用することによって、システムの性能は、幾らかの処理がリアルタイム又はほぼリアルタイム方式で実施され得る点まで向上可能である。リアルタイムとは、ユーザが感知可能な待ち時間が殆ど無いか、又は、一切無しに結果が得られるような速さで処理が発生することを意味する。処理の型およびユーザの好みに応じて、処理されたデータは上書きされるか、または、元のデータと混合される。新たなファイルへ一緒に書き込まれても、書き込まれなくてもよい。
【0130】
処理が完了すると、再度聴くため、又は、更なる外部処理34のために、データがコンピュータディスク又はメモリ30から読み取られる。ディジタル化されたデータはディスク30から読み取られ、デジタル−アナログ変換ユニット28へ書き込まれる。このユニットは、コンピュータ34外で使用するためにディジタル化されたデータをアナログ信号に変換し戻す。あるいは、ディジタル化されたデータは、(例えば、AES/EBU、または、SPDIFデジタルオーディオインタフェースフォーマット又は代替形式など)様々な手段を介して、直接デジタル形式で、外部デバイスへ書き出してもよい。外部デバイスには、記録システム、マスタリングデバイス、オーディオ処理ユニット、放送ユニット、コンピュータ、等々が含まれる。
【0131】
処理は、ユーザが感知可能な待ち時間が殆ど無いか、又は、一切無しに結果が得られるような速さで発生する。処理の型およびユーザの好みに応じて、処理されたデータは上書きされるか、または、元のデータと混合される。新たなファイルへ一緒に書き込まれても、書き込まれなくてもよい。
【0132】
処理が完了すると、再度聴くため、又は、更なる外部処理34のために、データがコンピュータディスク又はメモリ30から読み取られる。ディジタル化されたデータはディスク30から読み取られ、デジタル−アナログへ変換ユニット28へ書き込まれる。このユニットは、コンピュータ34外で使用するためにディジタル化されたデータをアナログ信号に変換し戻す。あるいは、ディジタル化されたデータは、(例えば、AES/EBU、または、SPDIFデジタルオーディオインタフェースフォーマット又は代替形式など)様々な手段を介して、直接デジタル形式で、外部デバイスへ書き出してもよい。外部デバイスには、記録システム、マスタリングデバイス、オーディオ処理ユニット、放送ユニット、コンピュータ、等々が含まれる。
【0133】
(高速基音検出)
本明細書に開示された具体例は、例えば高速基音検出方法などのような技術も利用する。この高速検出方法技術は、リアルタイムに実施される必要な後続のアルゴリズムが、顕著な待ち時間無しに(又は、大きくない待ち時間と共に)実施可能であるような非常に迅速な方法において、更に高い倍音の倍音関係からオーディオ信号の基音周波数を推定するためのアルゴリズムを使用する。高速検出アルゴリズムは、倍音処理が迅速かつ能率的に実施されるように、検出された高い倍音及び振動数のランキング数と、未検出の高い倍音のランキング数を推定することができる。また、このような処理は、基本振動数を知ることなく又は推測することなく行う事ができる。
【0134】
本方法は当該信号内の少なくとも2つの候補周波数を選択することを含む。次に、候補振動数のセットの構成要素が、ある倍音関係を持つ適当な倍音周波数のグループであるかどうかが決定される。各倍音振動数のランキング数が決定される。最終的に、音周波数が、適当な周波数から推定される。
【0135】
この方法の1つのアルゴリズムにおいて、検出された部分音間の関係が、全てのメンバーが適当な倍音周波数である場合に有効な類似の関係と比較される。比較される関係には、周波数比、周波数の差、これらの差の比率、および、倍音周波数が整変数の関数によってモデル化されるという事実から得られる一意的関係が含まれる。また、候補者周波数はまた、当該信号のソース(音源)によって生成可能な音周波数、及び/又は、より高位の倍音周波数の下側および上側限界を用いて選別される。
【0136】
このアルゴリズムは、より高い倍音間の関係、選択を限定する条件、より高い倍音が基音に対して有する関係、および、可能性のある基音周波数のレンジを使用する。fnがn番目の倍音の振動数、f1が基本振動数、nが正の整数とし、fn=f1xnxG(n)が倍音振動数をモデル化すると、同じ根元に由来する正当な倍音振動数である場合に優勢であるべき部分音周波数の間の関係の例は以下のようになる。
a)候補振動数fH,fM,fLの比率は、倍音のモデルにおけるそれらのランキング数RH、RM、RLを置き換えることによって得られる比率にほぼ等しくなくてはならない。すなわち、fH÷fM≒G(RH)÷G(RM)}、および、fM÷fL≒G(RM)÷G(RL)。
b)候補振動数間の差の比率はモデル化された振動数の差の比率と合致しなければならない。即ち、(RH−RM)÷(RM−RL)≒{G(RH)−G(RM)}÷{G(RM)}÷G(RL)]。
c)候補周波数部分音fH、fM、fLは、ソース又は楽器によって生成可能な周波数レンジ内に所在しなければならない。
d)倍音の高さの位数RH、RM、RLは、ソース又は楽器によって生成可能な基音周波数レンジ内、即ち、FLを下回るかFHを上回る基音周波数を意味してはならない。
e)可能性のある3個の倍音の高さの位数を得るように整数可変比率を一致させる場合に、例えば、整数比率RH/RMにおける整数RMは、整数比率RM/RLにおける整数RMと同じでなければならない。この関係は、倍音の高さの位数の組{RH、RM}および{RM、RL}を可能性のある3個の位数(RH、RM、RL)に結合するために用いられる。
【0137】
他のアルゴリズムは、倍音関係の中の測定された部分音振動数のセットと、それらに由来する個々の振動数及び基本振動数のランキング数を即座に特定するための擬似されたスライド規則を使う。この方法は、関数fn=f1×G(n)のG(n)に対応する倍音乗数値がマークされる目盛りを具体化する。マークされた乗数の各々は、対応するnの値に付けられる。計測された部分音の振動数は、同様の目盛りでマークされ、これらの目盛りはそれらの相対位置変化と比較され、乗数のセットとマッチする部分音の振動数のセットを分離する。ランキング数は、乗数目盛りから直接読むことが出来る。これらは、nの対応する値である。
【0138】
ランキング数と振動数は、その後、どのセットが正当な倍音であるかを求めるために使用され、対応する基本振動数も乗数目盛りから直接読み出すことができる。
【0139】
上述したアルゴリズムと他の関係するアルゴリズムの総合的な説明のために、PCT国際出願PCT/US99/25294、高速基音発見方法、WO 00/26896、2000年5月11日出願、を参照する。
【0140】
(他の具体化)
本発明の原理に従って複合波形を変更するための各種システムおよび方法の潜在的相互関係を図11に示す。入力信号は複合波形として音響ファイルへ供給される。次に、この情報は高速発見基音方法または回路へ供給され得る。これは、複合波形の基音振動数を迅速に決定するため、または、更なる倍音調節、及び/又は、合成のために情報を提供するための先駆者として、使用可能である。分析がほぼリアルタイムで実施されなければならない場合には、これは、とりわけ真である。
【0141】
倍音調節、及び/又は、合成は、移動する目標、または、振幅および振動数に関して調節可能な変化するデバイスに基づく。オフライン態様において、倍音調節/合成は、その入力を音響ファイルから直接受け取るはずである。出力は倍音調節/合成から直接可能である。
【0142】
その代りに、特殊効果用倍音の分離、補間、または、自然倍音模倣のいずれかと、ここで示した方法によって組合わされた倍音調節及び合成信号は、出力信号として供給可能である。
【0143】
移動目標に基づく倍音及び部分音強調は、複合波形の音響ファイルの入力から直接オフラインの入力信号を受け取るか、又は、出力として倍音調節、及び/又は、合成を形成する。それ(倍音強調)は、システムから出力信号を供給するか、または、倍音変換へ入力として供給する。倍音変換は、移動目標に基づき、かつ、目標ファイル、補間、および、自然倍音模倣を含む。
【0144】
本発明は、当該記述が主題の実例を示すような表現によって記述された。本記述は限定的意味を持つことなく本発明について記述することを意図するものである。上述の方法には、多くの改変、組合わせ、及び、変更が可能である。従って、本発明は、ここに明確に記述した以外の方法において実行可能であることを理解されたい。
【0001】
(クロス・リファレンス)
本出願は引用によりここに組み込まれている1998年10月29日提出の仮特許出願第60/106,150号に関し、かつ、その恩典を請求する。
【0002】
(用語集、背景、および、発明の概要)
本発明は一般的にオーディオ信号の処理と波形の処理、及び、周期的オーディオ信号の倍音成分(ハーモニック・コンテント)の修正に関し、更に詳細には、サウンドまたはサウンドの知覚を変えるために、この種信号の倍音成分を動的に変更する方法に関する。
【0003】
本特許において用いられる多くの用語はこのセクションに集められて、定義される。
【0004】
ヒトの耳に連続的に衝撃を与える多数の種類のサウンドの中で、或る1つのサウンドは、振幅と音色(タンバ)と音高(ピッチ)の特性が当該サウンドのものであると耳でわかるのに充分な長さと安定性のある特徴によって区別される。この種類のサウンドは楽音(トーン)と呼ばれる。
【0005】
周波数およびラウドネス(音量)すなわち振幅が同じ音から或る特定の音を区別可能にする特性は、当該楽音(トーン)の品質すなわち音色(タンバ)である。あまり技術的でない用語を用いると、楽器に認職可能な個性すなわち性質を与える要因は、その大部分が或る時間に亙る当該サウンドの倍音成分であると表現される。
【0006】
いくつかの楽器は、数百サイクルが発生するに十分な期間に相当する少なくとも2、3秒間に亙って特性が変化しない状態を維持することのできる安定した楽音(トーン)を生成する。この種の音を周期的(periodic)であると称する。
【0007】
楽器を含む大部分の音源は、振幅と周波数が種々異なるサイン(正弦)波の混合体である複合波形を生成する。複合音に関与する個々のサイン波は、当該音の部分音(partial tone)または単に部分(partial)と呼ばれる。部分音または部分周波数は、限定的なエネルギ周波数帯域として定義され、倍音または倍音周波数は、例えばストリング(弦)などの機械的物体または空気柱(エアコラム)を整数個の節(ノード)で区分したような整数関係に基づく現象に従って生成される部分音として定義される。或る特定の複合音の音質すなわち音色は、その分割された部分音の音量、周波数、及び、振幅、特にそれら相互の振幅割合および相互の相対周波数(即ち、これらの要素が組み合わされるか又は混合される仕方)によって決定される。楽器で演奏される楽音は同一楽器で演奏される別の楽音に類似した音色を持つので、周波数のみでは決定要因にはならない。サウンドを扱う具体化されたシステムにおいて、部分音は実際に小さい周波数帯域におけるエネルギを表し、かつ、サンプリングレートおよび当該サンプリングシステムと関連する不確定イシューによって支配される。
【0008】
オーディオ信号、特に楽器またはヒトの音声に関係するオーディオ信号は、信号がどのようにサウンドを出すかを定める特有の倍音成分を持つ。各信号は、基本周波数およびそれよりも高い倍音周波数によって構成される。組合わされたこれらサイクルの各々に関する図形的パターンは波形である。複合波の詳細な波形は、部分的には、複数の倍音の相対振幅に依存する。複数の倍音の間の振幅関係、周波数関係、または、位相関係を変えると、音の音楽的性質に関する耳での聞こえ方が変化する。
【0009】
基本周波数(第1倍音またはf1とも称する)およびより高位の倍音(f2からfnまで)は、一般的に数学的に関係がある。一般的な楽器によって生成されるサウンドにおいて、高い倍音は殆どの場合、当該基本周波数の整数倍であるが、これに限られない。すなわち、第2倍音は基音の2倍の周波数であり、第3倍音は基音の3倍の周波数、等々である。これらの倍数は、しばしば高さ(ランキングナンバ又はランク)と呼ばれる。一般に、本特許において用いられる用語「倍音」は、基音を含む全ての倍音を表す。
【0010】
各倍音は、基本周波数に対して振幅、周波数、および、位相の観点から或る関係を持ち、これらの関係は、聞こえるサウンドを変えるように操作可能である。周期的複合音はその構成要素(基音およびより高位の倍音)に分割される。この解析の図形表現はスペクトルと呼ばれる。従って、或る音特有の音色はスペクトルプロファイルにおいて図形的に表される。
【0011】
一般的な楽器は、主として整倍数または整倍数に近い複数の倍音を含む音を生成することが多いが、様々な他の楽器および音源(ソース)は、基音およびより高位の倍音の間で更に複雑な関係を持つサウンドを生成する。多くの楽器は、整数倍でない部分音を生成する。これらの音は不調和音(非倍音)と呼ばれる。
【0012】
現代の均等平均律(または西洋音楽の音階)は、オクターブ当たり12個の均等間隔半音音程によって構成されるように音階を調節する方法である。任意の半音の周波数は当該半音の直前半音の周波数の2の12乗根倍すなわち1.0594631倍である。これは、全てのオクターブ音程の周波数が比率1:2であるような音階を生じる。これらのオクターブは調和音程のみに限られ、全ての他の音程は不調和である。
【0013】
音階本来の妥協性(中間性)により、例えばピアノは、全てのキーで演奏可能である。ただし、大部分の自動楽器(mechanical instrument)における倍音は厳密な倍数ではなく、「耳でわかる程度」であり、従って幾らかの楽器ではその調律が「ストレッチされ」、すなわち単純な数学的論式によって規制されるピッチ(調子)から調律がずれるので、平均律に正確に調律(チューニング)された、例えばピアノなどの楽器は、ヒトの耳には、高音域において完全に平坦に聞こえる。これらの偏りは、単純な数学公式によって規定された音に対して、わずかにシャープであるか、或いは、わずかにフラットであるかどちらかである。ストレッチチューニングにおいて、音と倍音の間の数学的な関係は依然として存在するが、しかし、これらの関係は更に複雑である。楽器を含む多くのクラスの発信/発振装置によって生成される倍音周波数間の関係は次の関数によってモデル化される
fn=f1xG(n)
ここで、fnはn次倍音の周波数であり、nは倍音の高さを表す正の整数である。この種の関数の例を次に示す
a)fn=f1xn
b)fn=f1xnx[1+(n2−1)β]1/2
ここで、βは、楽器、または、多弦装置の弦に依存し、演奏されている音の周波数音域に依存することもある定数である。
【0014】
オーディオ即ち楽音の感知される音高(ピッチ)は一般に(ただし常にではなく)周期信号における基音または最低周波数である。以前に言及したように、楽音は、種々異なる振幅関係、周波数関係、および、位相関係の倍音を含む。これらの倍音を重ねると、複合時間領域信号が作られる。信号に含まれる倍音の量および振幅はその音色または音楽的個性を最も強く表現する。
【0015】
楽器の感知される楽音または特性の他のアスペクト(側面)は、楽器のデザイン、大きさ、材料、構成の詳細、特徴、及び操作方法によって強調または強化される可聴スペクトルの或る特定の区分または部分である共振帯を含む。これらの共振帯は、可聴スペクトルの他の区分に比較して更に音量が大きく感知される。
【0016】
この種の共振帯は、周波数が固定されており、その楽器で別の異なる音が演奏される際にも一定である。これらの共振帯は、当該楽器で演奏される別の異なる音に対して移動(シフト)しない。これらは、任意の所与時間に演奏される特定の音でなく楽器の物理的性質によって決定される。
【0017】
倍音成分と共振帯の間の主な差異は、基音周波数に対する関係が異なることである。倍音は、基音周波数の変化と共にシフトし、(すなわち、倍音は演奏される基音と直接的に連結されて周波数が移動し)、従って、基音に対して常に相対的である。基音が別の新たな基音にシフトすると、それら基音の倍音はそれら基音と共に変化する。
【0018】
これとは対照的に、楽器の共振帯は周波数が固定され、移動する基音の関数として線形移動しない。
【0019】
音自体の倍音構造および楽器自体の共振帯は別として、楽器の感知される音または音楽的特徴に関連する他の要因は、倍音成分が楽音の継続時間に亙っての変化の仕方を必要とする。楽音の継続期間、すなわち「ライフスパン」は、そのアタック(当該音が初めに打たれるか又は鳴らされる特徴的な方法)、サステイン(ある時間に亙って鳴らされる音の持続特性)、及び、ディケイ(音が終了する特徴的方法、例えば、突然のカットオフ対漸進的なフェード)がこの順序で特徴づけられる。
【0020】
3段階、即ち、アタック、サステイン、及び、ディケイの期間全体に亙る音の倍音成分は、音の主な音質に関してヒトの耳に対する重要な知覚のヒントを与える。基音を含む複合時間領域信号における各倍音は、音の時間における音色の規定を助けるそれ自身の特徴的なアタック及びディケイ特性を有する。
【0021】
倍音の相対振幅レベルは基音の振幅に関して当該音のライフスパン中に変化(場合により、強調または弱調される)するので、それに応じて、特定音の音色は当該音の継続時間に亙って変化する。弾かれるか、或いは、打たれる(ピアノ及びギターのように)楽器において、高位倍音は低位倍音よりも早くディケイ(減衰)する。これとは対照的に、管楽器(例えばフルート)および弓楽器(例えばバイオリン)を含む連続的に演奏される楽器においては、倍音は連続的に生成される。
【0022】
例えば、ギターの場合には、知覚される音色を形成する2つの最も影響力の強い要因は、(1)ストリングによって生成されるコア倍音、および、(2)ギターボディの共振帯特性である。
【0023】
一旦、ストリングが、基本周波数およびそれに関連する倍音のコアセットを生成すると、ボディ、ブリッジ、および、他の構成要素が、非線形であってかつ周波数に依存するその共振特性によって、まず音色を更に形成するように演奏される。ギターは共振帯または、1つの音の幾つかの倍音が基音の周波数に関係なく強められる領域を有する。
【0024】
ギタリストは、ストリング及びフレット位置の異なる組合わせを用いてネック上の6箇所すべてにおいて正確に同じ音(同じ周波数または同じ音高)を演奏できる。ただし、基音とその倍音の間の関係が異なるので、6種のバージョンの各々は全く異なるサウンドを出す。従って、これらの差異は、ストリングの構成および設計、ストリングの直径、及び/又は、ストリングの長さにおける変化に起因する。ここで、「長さ」は必ずしも全ストリング長さでなく、音楽の高さを生じる振動する部分のみ、即ち、フレットされた位置からブリッジまでの距離を意味する。ボディ自体の共振特性は変化しないが、ストリングの直径、及び/又は、長さがこのように変化するので、異なるバージョンは、音高が同じでも知覚できるほど異なるサウンドを出す。
【0025】
多くの場合、楽器の音色に変化を与えることが望ましい。現代的および伝統的な両方法は、固定帯域電子式イコライザと呼ばれる一種のフィルタを用いて基本的な形式で実施される。固定帯域電子式イコライザは、所定区分よりも大きい周波数スペクトル内における1つ又は複数の所定区分または帯域に影響する。望ましい強調(「ブースト」)または弱調(「カット」)は所定帯域内においてのみ発生する。1つ又は複数の帯域の外側に所在する音または倍音は影響されない。
【0026】
与えられた周波数は、変化する基音との関係によって任意の倍音高さを持つことができる。共振帯フィルタすなわちイコライザは、周波数についてその固定帯域の内側にあるかまたは外側にあるかのみを認識し、周波数の倍音高さは認識または応答しない。イコライザは、入力される周波数が基音、第2倍音、第3倍音、等のいずれであるかを区別できない。従って、固定帯域イコライザの影響によっては、周波数の高さに関して変化またはシフトしない。等化は固定されたままであり、基音に対するそれらの倍音関係に関係なく、指定された周波数に影響を及ぼす。等化は、知覚される音色に著しく影響する倍音のレベルに影響するが、音、音声、楽器、または、他のオーディオ信号の固有「コア」倍音成分は変更しない。一旦調節されれば、固定帯域イコライザが影響するかどうかは、入力される音すなわち信号の周波数自体にのみ依存し、当該周波数が基音(第1倍音)、第2倍音、第3倍音、または他の高さであるかには依存しない。
【0027】
今日の幾らかのイコライザはそれらのフィルタを動的に変更する能力を有するが、この場合の変更は倍音高さ情報でなくて時間的要素にのみ拘束される。これらのイコライザは、ユーザ入力コマンドによる定義に従ってフィルタの設置位置を変えることによってそれらのフィルタ作用を即座に調節する能力を持つ。本発明の方法の1つは、1000帯域以上のグラフィックイコライザとして見ることもできるが、振幅および対応する影響を受けた周波数の、周波数および振幅が瞬時に変化すること、及び/又は、当該音の倍音エネルギ成分を修正するように周波数および振幅に対して非常に速く移動すること、及び、欠落倍音および変化に関して設定された倍音に関連した周波数の全ての後続および先行周波数を付加するシンセサイザと調和して作動することにおいて異なる。
【0028】
ヒトの音声は、他の楽器類に見られるような、多くの同じ質および特性を備えた楽器とみなすことが可能である。ヒトの音声は、圧力のかかった空気によって作動するので、基本的には管楽器であるが、周波数発生の観点からは、多重倍音振動が複数の組織片によって生成されるが、組織片の振動周波数はそのテンション(張力)によって変更できるという点において、音声は弦楽器に類似する。固定共振チャンバを備えたアコースティックギターボディとは異なり、単一音の継続時間内に何度も共振空洞の或る種の態様は話し手によって変更可能であるので、音声の共振帯域は即座に調節可能な場合もある。共振は鼻腔および口腔の構成、舌の位置、および、全体的に声管と呼ばれる他の態様によって影響される。
【0029】
(従来の技術)
Matsumotoへ許可された米国特許第5,847,303号は、ヒト音声入力の周波数スペクトルを変える音声処理装置を開示する。この特許は、音声信号を別の人の音声(例えばプロの歌手の音声)のように聞こえるようにするために、入力音声信号を等化する幾つかの処理および演算ステップを具体化する。更に、この特許は、歌手の知覚される性別を変えることを可能とするクレームも開示する。
【0030】
松本特許の周波数スペクトル修正は、原音声を解析することによって声管または共振子の形状をシミュレートする伝統的な共振帯域フィルタリングを用いることによって達成される。コンプレッサ(圧縮器)/エキスパンダ(膨張器)、及び、フィルタ(濾過器)に関連する係数は装置のメモリ又はディスクに記憶され、固定される(エンドユーザによって選択不可能)。Matsumoto特許の周波数追随効果は、入力された音声からの基本周波数情報を使用して音声をオフセットし、「適切な」または「正しい」音高(ピッチ)に調律することである。音高の変更は、声管内のフォーマット周波数をシフトする電子クロックレート操作を介して達成される。続いて、この情報は、完全な波形を合成する電子装置に供給される。特定の倍音は合成されず、基音周波数に関して個別に調節されることなく、信号全体が同じに扱われる。
【0031】
類似の松本特許5,750,912は、モデル音声をエミュレートするために、単一音声を修正する装置である。アナライザーは、集められた歌声を順次解析し、その歌声を生成するために物理的に活性化された歌い手の独自の音声オルガンの反響特性を示す実際のフォーマットデータをそこから抽出する。シーケンサーは、モデル音声の音声品質を示す順次供給され、歌声の進行にマッチするようにアレンジされた参照フォーマットデータのために、歌声の進行に同期して動作する。比較器は、実際のフォーマットデータと参照フォーマットとを順次互いに比較し、歌声の進行の間にこれらの違いを検出する。イコライザーは、モデル音声の音声品質を抽出するために、検出された違いに基づき、集められた歌声の振動特性を修正する。イコライザーは、調整可能な中心周波数と調整可能な増加量を有するバンドパスフィルタを備えている。このバンドパスフィルタは、フォーマットのピーク周波数、ピーク周波数及びピークレベルに基づく個々の周波数特性を有する。
【0032】
セラー等に与えられた米国特許5,536,902は、サウンドパラメーターを抽出し、制御することによってサウンドを解析し、合成する方法及び装置を開示している。これは、スペクトルモデリング合成方法(SMS)を採用している。解析データは、オリジナルサウンド波形を作り上げる複数の要素を示す。解析データは、所定の要素に関する特性を得るために解析(分解)され、その後、そのデータは、得られた特性がサウンド又は音楽パラメータとして抽出されることを示す。抽出された音楽パラメータに対応する特性は、解析データから除去され、オリジナルサウンド波形は、このように修正された解析データと音楽パラメータとの組み合わせによって表現される。これらのデータはメモリに保持される。ユーザーは、これらの音楽パラメータは自在に制御できる。制御された音楽パラメータに対応する特性は、解析データに加えられる。このように、サウンド波形は、制御された特性が既に付加された解析データに基づいて合成される。解析タイプのこのようなサウンド合成技術において、自由な制御を与えることによって、フォーマットやビブラートのようなサウンド要素を修正することができる。
【0033】
セタレスに与えられた米国特許5,504,270は、周波数(周波数)や振幅によって可聴入力信号の部分音を特定することにより、電子可聴入力信号の不協和音を解析し、減少又は増加させる方法を開示している。入力部分音の不協和音は、ここに開示された手順による参照部分音のセットに関して、算出される。1つ以上の入力部分音はその後シフトされ、不協和音が再計算される。不協和音が所望の方法で変化したら、シフトされた部分音は、それが演繹された入力部分音と置き換わるかもしれない。出力信号は、シフトされた入力部分音を含むように生成され、要求の通り、出力信号は大きめの不調和音又は少な目の不調和音となる。入力信号と参照部分音は、各々、例えば、パフォーマーと伴奏のような別々のソースから出てくる事もでき、その結果、出力信号は、参照部分音のソースに関しては、入力信号よりも大きな不調信号又は小さな不調信号となる。代替えとして、入力信号の本質的な不協和音を減らすために、参照部分音を入力信号から選択してもよい。
【0034】
Grob−Da Veigaに許可された米国特許第5,218,160は、低音または高音を生成することによって弦楽器音を強化する方法を開示する。この発明は、基音周波数を抽出し、倍音的に関係する低音および高音を生成するために当該周波数に整数または小さい分数を乗じる方法を用いる。従って、低音および高音は基音周波数(周波数)から直接導出される。
【0035】
Slaneyへ許可された米国特許第5,749,073号はオーディオ情報の自動モーフィングを扱う。オーディオモーフィングは、それぞれ認識可能な特性を備えた複数のサウンドを混合して、両方の元の音源が合成された特性を備える新たなサウンドにする処理である。
【0036】
Slaneyは多重ステップ技法を使用する。最初に、2つの異なる入力サウンドは解析(分解)可能な形式に変換され、倍音(調和)関係および不調和(非倍音)関係を見分ける種々の点で一致可能となる。一旦、入力が変換されると、ピッチ及びフォルマント周波数は2つの元のサウンドを一致させるために用いられる。一旦、一致すると、これらのサウンドはクロスフェード(即ち、合計されるか、または、事前に選択された割合で混合)され、次に、2つのサウンドの組合わせである1つの新たなサウンドを作るように変換される。用いられる方法は、音高の変化およびフィルタリングによるスペクトルプロファイル操作を用いる。以前に言及した特許におけると同様に、これらの方法は共振フィルタリングおよびフォーマット情報の操作を必要とする。
【0037】
E.Tellman、L.HakenおよびB.Hollowayによる論文「Timbre Morphing of Sounds with Unequal Numbers of Features」(同じ個数でない特徴を備えたサウンドの音色モーフィング)(Journal of Audio Engineering Society,Vol.43,No.9,Sept.1995)に開示された技術はSlaney特許と密接に関連する。この技術は、Lemur解析および合成を用いてサウンド間をモーフィングするアルゴリズムを必要とする。Tellman/Haken/Hollowayによる「音色モーフィングコンセプト(概念)はタイムスケール修正」(通過の速度低下または速度上昇)、ならびに、個別正弦波(サイン波を基調とする)構成要素の振幅および周波数の修正に関係する。
【0038】
Robert A.Moogによる米国特許4,050,343号は電子音楽シンセサイザに関する。音情報はユーザによって押される鍵盤キーから導出される。押された鍵盤キーは、電圧/被制御されるオシレータであって、その出力がバンドパスフィルタ、ローパスフィルタ、及び、出力増幅器を制御するオシレータを制御する。バンドパスフィルタの中心周波数および帯域幅は制御電圧を印加することによって調節される。ローパスフィルタのローパスカットオフ周波数は制御電圧の印加によって調節され、増幅器の利得は制御電圧によって調節される。
【0039】
アイオナイザ[Arboretum Systems社]と呼ばれる製品において、ノイズのみの特徴を示す信号に含まれるノイズのスペクトルを得るための方法は「事前解析」を用いることによって開始する。テープヒス、録音プレーヤノイズ、ハム、及び、バズ音は再発型ノイズであるので、これは、オーディオシステムにおいて実際に非常に有用である。サウンドプリントを得ることにより、これは、「アンチ‐ノイズ」を作成し、それを音源信号から差し引く(必ずしも直接とは限らない)ための基準として用いられる。プログラムの音響設計(Sound Design)部分内の通路において「ピーク検出(peak finding)」を使用することにより、512帯域のゲートEQ(イコライザ)を実装し、これによって、個別の倍音を引き抜くか、又は、或る特定のサウンド要素を除去するための非常に急峻な「ブリックウォール(煉瓦壁体)」フィルタを作ることができる。これらは、動的フィルタの作成を可能にするスレショルド(閾値)機能を実装する。しかし、この場合にも、ここで用いられる方法は基本周波数に対して追随または追跡せず、倍音除去は周波数帯域内において実行しなければならず、従って、楽器に関する全通路は追跡されない。
【0040】
Kyma−5は、Symbolic Sound社によって開発されたソフトウェアとハードウェアの組合わせである。Kyma−5は、カピバラ(Capybara)ハードウェアプラットホームによって加速されるソフトウェアである。Kyma−5は本来合成ツールであるが、入力は既存の記録された音響ファイルから得ることも可能である。Kyma−5はリアルタイム処理能力を持つが、本来静的ファイル処理ツールである。Kyma−5の一態様(アスペクト)は、音通路のスペクトルディスプレイから部分音を図形的に選択し、処理を適用する能力である。Kyrma−5は視覚的に部分音の選択に近づき、倍音の高さの位数を用いることなく周波数帯域内スペクトルディスプレイの「接続された」ドットを識別する。倍音は、手動で設定された帯域内に在れば選択できる。Kyma−5は、静的ファイルの倍音を解析し、加算合成を含む様々な合成アルゴリズムを適用することによって当該静的ファイルからサウンドまたは通路を再合成できる。ただし、継続時間全体に亙って音が変化する場合に、基本音に対して倍音を追跡する自動的な処理は行われない。Kyma−5は、ユーザが1つの基本周波数を選択することを可能にする。Kymaスペクトル解析ツール上の点を識別することによって厳密に非倍音(インハーモニシティー)である点を識別できる。最終的に、Kymaはサウンドにストレッチ定数を適用しない。
【0041】
(発明の方法および結果)
本発明は、複合オーディオ信号が時間経過とともに進行するにつれて各々のあらゆる基音、及び/又は、音の特定の倍音を、ユーザが規定した方法で修正することにより、信号、波形、音、または、任意の音源によって生成される他の信号の音質または音色に作用する。例えば、楽音(または、他の信号波形)の倍音に適用されるユーザが決定した変更は、時間経過と共に音楽が通過するにつれて、その次の音または信号、および、またその後の音および信号、および、あらゆる後続する音または信号にも適用され得る。本発明の全ての態様は、時間の経過とともに目標の振幅と周波数の両方が移動するにつれて音、サウンド、部分音、倍音、音色、非倍音、信号、等を調査し、かつ時間経過とともに振幅および周波数が調節可能な修正子を移動させることによって移動目標を調節することに留意することが重要である。
【0042】
本発明が具現する方法を次に示す。
* 複合波形のあらゆる倍音(f1からf∞まで)のエネルギを動的および個別に変更する。
* あらゆる他の倍音に対して定義された振幅および位相関係を有する新たな倍音(例えば、望ましいサウンドから「欠落」している倍音)を作成する。
* 整数や、fn=f1xnxSlog 2 nなどのユーザ定義の倍音関係に基づいて、合成サウンド内に自然発生する倍音を識別および模倣する。
* 倍音を抽出し、修正して、音内に再度挿入する。
* 周波数、振幅、及び/又は、他のパラメータに応じて信号を補間して、選択された音の倍音構造を調節可能とし、次に、ユーザ調節点の一方から他方の点までの音楽レンジ全体に亙り、ユーザによって規定された幾つかの曲線または音調曲線のいずれかに従って信号の倍音構造をシフトする。
* 倍音のアタックレート、ディケイレート、及び/又は、サステインパラメータを動的に変更する。
* 種々のタイプを処理するために複合信号からあらゆる倍音を分離する。
* 信号内の部分音の周波数および振幅に基づき、信号内の部分音のレベルを変える。
* 倍音の高さ及び振幅に基づき、複合信号の倍音のレベルを連続的に変える。
* 選択された通路全体にわたるか、又は、通路の任意の部分において、固定量または可変量だけ倍音を増大または減少させる。
* 記録処理において、または、情報が記録された磁気または他の元の媒体の劣化のいずれかにより喪失、損傷、または、修正された可能性のある音源信号の特性情報を復元する。
* ストレッチ関数fn=f1xnxSlog 2 (n)を用いて部分音および倍音の位置を計算する。
* 倍音調節および倍音合成の前述実施形態の組合わせを用いて、あるサウンド信号を他の信号タイプのサウンド信号に一致し、類似し、または、部分的に類似するように倍音的に変換する。
* 新型を含むがこれに限定されることなく、ギターシンセサイザ、バスシンセサイザ、ギター、バス、ピアノ、キーボード、スタジオ音修正装置、マスタリング音修正装置、新規スタイルの等化デバイス、及び、音、サウンド、または、信号を修正する前述の方法と関係のある新規オーディオデジタルハードウェア及びソフトウェア技術を含む新規楽器に関する基本を提供する。
【0043】
* 音声、楽器音、または、他のオーディオ信号の混合体から、音声、楽器音、楽音、部分音、倍音、サイン波、その他のサウンドまたは信号(又は、サウンドまたは信号の部分)を分離または隔離する。
* 他のこの種混合体内の聞き取りにくい音声、楽器音、楽音、倍音、部分音、他のサウンドまたは信号、サウンドまたは信号の部分を前以てハイライトする。
* ノイズをキャンセルするか、又は、ノイズを軽減する。
* この種の他の信号の混合体内の強すぎる、すなわち目立ちすぎる音声、楽器音、楽音、倍音、部分音、他のサウンドまたは信号、又は、サウンドまたは原音の部分を前以て平滑化または減衰させる。
* 低音量を強調し、及び/又は、比較的高音量の音、部分音、倍音、非倍音、または音楽の通路内の他の信号や他の複合時間領域信号を減衰させ、又は弱化させる。
* 比較的低レベル情報が一層容易に見分けられ、かつ/または、処理され得るように、部分音の或る特定振幅レンジを除去する。
* 音声、楽器音、楽音、倍音、部分音、その他のサウンドまたは信号、又は、サウンドまたは信号の部分の更に望ましい平衡を一般的に実施する。
【0044】
(方法の概要)
本処理は、伝統的な楽器に制限されることなく、あらゆる入力ソース信号波形または構成要素に対して、その知覚される質を修正し、音色の特定態様を強化し、または、特定態様を弱調するために適用される。これは、所与信号に関するスペクトルの個別倍音、及び/又は、部分音の操作によって達成される。本発明によれば、倍音または部分音の調節は或る特定の限定期間に亙って実施される。これは、不確定期間に亙って維持される総称的固定帯域等化とは異なる。
【0045】
割り当てられた処理は、倍音(又は、倍音のグループ)のエネルギレベルを操作するか、または、新たな倍音(又は、倍音のグループ)、または、部分音を生成するか、または、倍音(又は、倍音のグループ)、または、部分音を完全に除去することによって達成される。操作はあらゆる他の倍音の応答に結び付け可能であり、或いは、操作は任意の周波数または倍音の高さまたはユーザが選択した他のパラメータに結び付け可能である。また、調節は既存の倍音とは無関係に生成可能である。方法の任意の組み合わせを使用する多重操作が用いられる場合もある。倍音または倍音のグループが、種々の手段により、個別処理されるために分離される場合もある。更に、部分音が強調または弱調される場合もある。
【0046】
倍音操作の好ましい実施形態はデジタル信号処理(DPS)技法を用いる。フィルタリングおよび解析方法はコンピュータ(例えば、DSPまたは他のマイクロプロセッサ)によりデジタルデータ表現に関して実施される。デジタルデータは、サンプリングされ、アナログ電気波形からデジタルデータに変換されたアナログ信号または複合波形を表す。処理が完了すると、データはアナログ電気信号へ変換し戻される。また、データは、デジタル形式で他のシステムへ伝送され、同様に、何等かの形の磁気または他の記憶媒体に局所的に記憶される。信号源はデジタルオーディオフォーマットにおいてほぼリアルタイム又は事前記録され、ソフトウェアは所要演算および操作を実施するために用いられる。
【0047】
本発明の前述以外の目的、利点、および、新規の特徴は、添付図面と共に考察すれば本発明に関する次の詳細な記述から明白になるはずである。
【0048】
(好ましい実施形態の詳細な説明)
(倍音調節)
倍音調節および合成の目標は、倍音の特性を当該倍音それぞれの高さの位数に基づいて個別に操作することにある。この操作は、特定音の振幅が維持される継続期間全体に亙る。倍音は、その周波数を中心周波数とするフィルタを適用することにより調節される。本発明全体を通じて、フィルタはイコライザ(等化器)、数式モデル、またはアルゴリズムの形式であっても差し支えない。フィルタは、他のいずれかの倍音に対する、当該倍音の周波数、振幅、および、時間における位置に基づいて計算される。再び、本発明においては、倍音を移動する周波数目標および振幅目標として扱う。
【0049】
本発明においては、入力されようとしている信号をシフトする全ての仕方を予測し、演算およびユーザの入力および制御に対応する。ほぼリアルタイムに「予測すること」は実際に、例えば適切な処理を始動するために、入来データ(即ち、オーディオ信号)の適切な特性が認識可能であるような最小量の時間に亙るデータ収集を必要とする。この情報は、必要な態様が確認されるまで、遅延バッファに記憶される。遅延バッファは、新しいデータによって絶えず満たされ、不必要なデータは、それがもう必要でない時、バッファの「最古」端部から除去される。これは、ほぼリアルタイム状況においていかに小さい待ち時間が発生するかを意味する。
【0050】
ほぼリアルタイムとは、最大約60ミリ秒の微細な遅延を意味する。それは、映画フィルムにおけるフレーム2個以下の継続時間としてしばしば表現される。ただし、フレーム1個の遅延が好ましい。
【0051】
本発明において、処理フィルタは倍音の移動を予想し、倍音が第1倍音(f1)に対して移動するのにつれて移動する。指定された倍音(又は、「振幅調節にための倍音集合」)は、倍音高さに関連して数学的に固定された量だけ周波数がシフトする。例えば、第1倍音(f1)が100Hzから110Hzに変化すれば、第4波倍音(f4)に関する本発明の倍音調節フィルタは400Hzから440Hzにシフトする。
【0052】
図1は、一連の音4個、および、所定の時点における各音の4個の倍音の特徴的な倍音成分を示す。この仮説的シーケンスは、倍音およびフィルタが基音、倍音、および、相互に対してどのように移動するかを示す。これらの移動する倍音の振幅および周波数両方を時間経過と共に追跡することは、ここに具体化される処理方法における重要な要素(キーエレメント)である。
【0053】
周波数間の間隔または距離(フィルタ間の感覚に対応する)は、基音の周波数が上昇するにつれて膨張し、基音の周波数が低下するにつれて収縮する。図形的に説明すれば、本明細書において、この処理は「アコーデオン効果」として知られている。
【0054】
本発明は、振幅調節のために設定された信号の、非静止の(周波数の変化する)倍音と共に移動するフィルタを用いて、時間経過における倍音の振幅を調節するように設計されている。
【0055】
具体的には、個別の倍音はパラメータ的にフィルタリング、及び/又は、増幅される。これによって、(従来型装置を用いて現在行なわれているように)その中に当該倍音が現れる周波数帯域に基づくことなく、倍音の高さ及び、どの倍音の高さの位数がフィルタリングされるものとして設定されているかに基づき、演奏されている個々の音のスペクトルにおける様々の倍音の相対振幅が増大および減少する。これは、例えば、音楽または複合波形の記録の後でオフラインに実施されてもよいし、または、ほぼリアルタイムに実施されてもよい。これがほぼリアルタイムに実施されるためには、個別に演奏された音の倍音周波数は、周知の周波数検出法または高速基音検出(Fast Find Fundamental)方法を用いて決定され、次に、決定された音に対して倍音別のフィルタリングが実施される。
【0056】
倍音はこの独特の仕方において操作されるので、1つ又は複数の固定された共振帯域に割り当てられた従来型フィルタを用いるとスペクトルの断片にのみ作用するのとは対照的に、精密に選択された個別倍音に関して楽器の全体的音色が影響される。
【0057】
説明を容易にするために、図1−3に示す倍音関係のモデルはfn=f1xnとする。
【0058】
例えば、次の2つの音(図1の音1と音3)の第4倍音は周波数レンジが異なるが、この形式のフィルタは400Hzである第4倍音を、2400Hzの第4倍音をフィルタリングするのと同じ方法でフィルタリングするする。本発明のこの適用は、従来型周波数帯域毎の等化装置に対する補足として、及び/又は、代替物として有用なはずである。出力するために、演奏された音のこれらの個別にフィルタリングされた倍音を混合することについては、図4及び5に関して検討することとする。
【0059】
図2は一時点におけるある信号の倍音成分の一例を示す。基音周波数(f1)は100Hzである。従って、100Hzの倍数において、この信号の倍音は200Hz(f2=f1x2)、300Hz(f3=f1x3)、400Hz(f4=f1x4)、等々である。説明のために、この例には合計10個の倍音を示すが、実際の信号は更に多くの倍音を持つ場合が多い。
【0060】
図3は、本発明によって実施可能な図2に示す幾つかの倍音の調節修正を示す。200Hz(第2倍音)、400Hz(第4倍音)、500Hz(第5)、及び、1000Hz(第10)に位置する倍音のエネルギ成分および振幅は上方調節される。600Hz(第6倍音)、700Hz(第7倍音)、800Hz(第8)、及び、900Hz(第9)における倍音のエネルギ成分および振幅は下方調節される。
【0061】
本発明を用いると、倍音は、種々の方法により、振幅が増大または減少させられる、(ここでは、「振幅調整機能」と称する)。現代的一方法は、対象とするタイムフレーム全体に亙って具体的に計算されたデジタルフィルタを適用することである。これらのフィルタは調節されつつある倍音の周波数の移動に応じてフィルタの振幅および周波数を調節する。更に、別の方法でも、デジタル信号処理を用いて、例えば、シヌソイド(正弦曲線)の位相を対象とする倍音に一致させ、次に、(A)減少させるためには、元の信号に反転波形を加えることにより、所要量を減算し、又は(B)強化するためには、基準化されたバージョンの波形(すなわち、所望の係数が乗じられる波形)を加算する。
【0062】
他の実施形態においては、周波数が隣接する一連のフィルタ又は一連の固定周波数フィルタを使用する。この場合、1つの倍音があるフィルタレンジから次のフィルタレンジに移動する際に、処理工程は「バケツリレー」方式で手渡される。
【0063】
図4は実装実施形態を示す。ピックアップ、マイクロホン、または、事前記憶されたデータからの入力10における信号は倍音信号検出HSD12、および、フィルタのバンク14に供給される。バンク14における各フィルタは倍音検出信号の特定の倍音周波数に関してプログラム可能であり、f1、f2、f3...fNによって表される。コントローラ16は各フィルタの周波数を、当該倍音の高さに関する倍音信号検出器12によって検出された倍音周波数に一致する周波数に合わせる。個別倍音の所要の修正は、ユーザ入力に基づいてコントローラ16によって制御される。フィルタのバンク14の出力はミキサ18において入力10からの入力信号と組合わされ、使用される所定のアルゴリズムに依存する出力20に、組み合わせ出力信号として供給される。以下に、図3に関して検討するように、コントローラ16は、ミキサ18においてイコライザバンク14および入力10からの信号と組合わされるべき合成倍音も同様に供給する。
【0064】
図5は交互バケツリレー方式を実施するように修正されたシステムを示す。イコライザバンク14’はフィルタのバンクを有し、それぞれのフィルタはFa、Fb、Fc、等々によって表される固定周波数隣接帯域幅を有する。コントローラ16は、倍音信号検出器12によって識別される倍音信号を受け取ると、検出された倍音信号の特性と一致するように、14’の固定帯域幅フィルタの特性の信号修正を調節する。ここで、図4のバンク14内フィルタの各々の周波数は所要倍音に調節され、修正特性は所要倍音用に固定される。図5のバンク14’のイコライザは各々周波数が固定され、それらの修正特性は検出された倍音信号に応じて変えられる。
【0065】
アコーデオン周波数および振幅調節可能移動フィルタ法が使用されても、これらの方法の後に行なわれるか、これらの方法と組み合わされる予想周波数のバケツリレー法が使用されても、フィルタリング効果は振幅変化用に選択された倍音を用いて、信号の周波数ばかりでなくその倍音高さ及び振幅に応答して周波数を移動させる。
【0066】
倍音信号検出器12はコントローラ16とは別に図示されているが、両者は共通のDSPまたはマイクロコンピュータのソフトウェアであってもよい。
【0067】
フィルタ14はデジタルであることが好ましい。デジタルフィルタリングの利点は、位相歪みと呼ばれる元の信号と処理された信号の間の望ましくない位相シフトを最小限にできることである。本発明の一方法においては、所要目標に応じて2つのデジタルフィルタリング方法、即ち有限インパルス応答(FIR)方法、または無限インパルス応答(IIR)方法のどちらでも使用可能である。有限インパルス応答方法は振幅調節及び位相補償のために、分離された個別のフィルタを使用する。振幅調節フィルタは、所要応答が入力信号の周波数の関数となるように設計されてもよい。デジタルフィルタは、その振幅応答特性が本質的にデータアレの位相特性に影響して、これを歪めるように設計される。
【0068】
その結果、振幅調節フィルタには直列配置された位相補償フィルタとしての第2フィルタが後続する。位相補償フィルタは単位利得デバイスであり、振幅調節フィルタによって導入された位相歪みに対抗する(逆らう)。
【0069】
フィルタ及び他のサウンドプロセッサは、2つのタイプの入力オーディオ信号、即ちリアルタイムまたは非リアルタイム(固定または静的)のどちらにも適用可能である。リアルタイム信号には、プライベートな設定場所、公共アリーナ、又は、録音スタジオのいずれかにおいて行われる生の演奏が含まれる。一旦、複合波形がデジタル形式で磁気テープ又はその他の媒体に録音されると、当該波形は固定すなわち静的であるとみなされ、さらなる処理が可能である。
【0070】
入力信号にデジタル処理が適用可能となる前に、当該入力信号自体がデジタル情報に変換されなければならない。アレイは信号のデジタル表現を示す数列である。フィルタは、アレイの始めから終わりに向かって前進方向に適用されるか、又は、終わりからはじめに向かって後退方向に適用される。
【0071】
第2のデジタルフィルタリング方法、即ち無限インパルス応答(IIR)において、対象とするデータアレイに亙って両方向にフィルタを適用することにより、ゼロ位相フィルタリングが非リアルタイム(固定、静的)信号を用いて達成される。位相歪みは両方向において等しいので、フィルタが両方向に実行されるときにおける正味効果は、このような歪みが相殺されることである。この方法は静的な(固定され、記録された)データに限定される。本発明の一方法においては、高速デジタル計算デバイス、ならびに、ディジタル化された音楽を定量化する方法が用いられ、高速フーリエ、及び/又は、ウェーブレット解析に対する付加物として数学的アルゴリズムを改良する。デジタルデバイスは既存の音楽を解析し、倍音の音量または振幅を所要レベルに調節する。この方法は、倍音と共に周波数が移動し、所要倍音レベルが図4に示すように変化する非常に急速に変化する複合ピンポイントデジタル等化ウィンドウを用いて達成される。
【0072】
本発明は、ギター、バス、ピアノ、等化およびフィルタリングデバイス、記録に用いられるマスタリングデバイス、電子キーボード、オルガン、楽器音修正器、および、他の波形修正器に適用可能であるが、これらに限られない。
【0073】
(倍音合成)
楽音または他のオーディオ信号の倍音成分のエネルギレベルを調節することが望まれる多くの状況において、倍音成分が断続的であるか、または、事実上存在しないならば、前記の調節を実施することは不可能である。これは、倍音がソース信号のノイズ「フロア」(認識可能な最小エネルギレベル)を下回るようにフェードしたときに発生する。本発明を用いれば、これらの欠落またはフロアを下回る倍音は「スクラッチから」生成可能、即ち、電子的に合成される。更に、ソースに対する整数乗数関係または非整数乗数関係のいずれかを用いて、完全に新しい倍音、非倍音、または、分周音(基音より低い周波数の倍音)をすべて一緒に作ることも同様に望ましい。再び、この創作または生成処理は合成の一タイプである。自然に発生する倍音のように、合成された倍音は一般にそれらの基音の周波数に数学的に関係する。
【0074】
倍音調節の場合のように、本発明によって生成される合成倍音の周波数は非静止であり、合成倍音は他の倍音に対して移動する。合成倍音は任意の個別倍音(f1を含む)に対して合成され、音の周波数が変化すると、その変化が倍音シンセサイザを正しく調節することが予想しつつ、合成倍音の周波数が移動する。
【0075】
図2に示すように、元の信号の倍音成分は1000Hz(100Hz音の第10倍音)までの周波数を含み、第11または第12の倍音は存在しない。図3は、倍音合成によって生成されることによってこれらの欠落倍音が存在する場合を示す。従って、新たな倍音スペクトルには1200Hz(第12倍音)までの倍音が含まれる。
【0076】
楽器は、可聴スペクトルにおける倍音の相対レベルのみならず音に対する倍音の位相(時間経過と共に変化する関係)によっても定義される。従って、倍音合成は、振幅的に相互関係を持ち、かつ位相的に位置合わせされた(即ち、任意にではなく一貫的に基音に対して一致、又は、関連する)倍音の創造も可能にする。フィルタのバンク14及び14’は、同様にデジタルサイン波生成器でもあるデジタルデバイスであることが好ましく、合成倍音は、fn=f1xn以外の関数を用いて生成されることが好ましい。新たな倍音を生成するための好ましい関係はfn=f1xnxSlog 2 (n)である。Sは1より大きい数、例えば1.002である。
【0077】
(倍音調節および合成)
倍音調節と倍音合成の組み合わせは,「欠落している」とみなされる倍音を含めて1つの音に含まれる全ての倍音の振幅をそれらの倍音高さに基づいて動的に制御する能力を具体化する。倍音を制御するこの能力は、種々様々の音または信号の音色をユーザの好みに合わせて操作する大きい融通性をユーザに与える。本方法は、特定の入力信号の倍音レベルに基づいて種々異なる操作が望まれることを認識する。この方法は倍音調節および倍音合成を具体化する。既に存在するスペクトルの断片にのみ作用する場合と対照的に、楽器全体の音色が影響される。
【0078】
倍音がソース信号のノイズ「フロア」を下回るようにフェードアウトする場合のように、倍音成分が断続的であるか、又は、事実上存在しないならば、信号の倍音成分のエネルギレベルを調節することは不可能である。本発明をもちいると、これらの欠落したまたはフロアを下回る倍音は「スクラッチから」生成され、すなわち、電子的に合成されることが可能であり、その後で、元の信号、及び/又は、倍音的に調節された信号に混合し直される。
【0079】
これに関しては、ソース信号の全倍音応答を修正するために、倍音調節と関連して倍音合成も使用可能である。例えば、図6に示すように、エレキギターの第10倍音は、倍音高さがより低い倍音よりはるかに迅速に衰微する。音の初期部分における当該倍音のレベルをブーストするためだけでなく、当該倍音のレベルを当該音が存在する全期間に亙って維持するためにも合成を使用することは興味深い。合成は、選択された区分または通路における全ての音に対して実施される。従って、既存の倍音は、その倍音が或る閾値を越える部分的期間中に調節され、その後、当該音の残りの部分的期間中に(その調節された形において)合成される(図7参照)。
【0080】
幾つかの倍音に関してこれを達成することが望まれることもあり得る。この場合、当該倍音は、所要閾値に振幅を維持するために所要の位相位置合わせを用いて合成される。位相位置合わせは任意の設定を起点とすることもできるし、又は、位相は何等かの方法によりユーザが選択した倍音に位置合わせすることもできる。この方法においては、非常に高速で周波数、及び、振幅が変化し、及び/または、音の倍音エネルギ成分を変えるように非常に高速で移動し、所要の欠落倍音を加えるようにシンセサイザと調和して作用する。これらの倍音および合成された倍音は音量においてデジタルデバイスのソフトウェアに設定された百分率における設定倍音の振幅に比例する。新たな倍音を生成するためには、関数fn=f1xnx(S)log 2 (n)が用いられることが好ましい。
【0081】
存在しない倍音をブーストしようとする試行を回避するために、本発明は、検出アルゴリズムを使用して保証された調節を行うために十分な部分音が存在することを示す。一般に、この種の検出方法は、部分音エネルギ(または振幅)が、任意に定義された或る期間に亙って或る閾値以上である限り、存在するものと見なされるように、部分音のエネルギに基づく。
【0082】
(倍音変換)
倍音変換は、1つのサウンドまたは信号(変換対象のファイル)と他のサウンドまたは信号(第2ファイル)とを比較し、その後、倍音調節および倍音合成を使用して変換対象の信号を調節し、それによって当該信号が音色において第2ファイルに一層近く類似するか、或いは、第2ファイルと全く同じにする。これらの方法は、既に言及した発明の幾つかの態様を組み合わせることにより、オーディオサウンドを組み合わせるという目的、又は、あるサウンドを別のサウンドにより近づけるという目的を達成する。実際、録音された楽器または音声のサウンドを他の楽器または音声のサウンドにほとんど精確に似せるために、これを使用することができる。
【0083】
楽器または音声によって生成された或る音を、時間に対する、その倍音の周波数成分の観点から観察した場合(図6)、各倍音がアタック特性(当該倍音の初期部分が時間においてどのくらい速く立ち上がり、どのようにそのピークに達したか)、サステイン特性(アタック部分の後で、倍音構造がどのように動くか)、および、ディケイ特性(音の終わりの部分において倍音がどのように停止または衰微するか)を持つことが分かる。音自体が終了する以前に、特定の倍音が完全に衰微している場合もある。
【0084】
1つのタイプの楽器の異なる例(例えば、2台のピアノ)は、多くの点において異なる。その一つのバリエーションは、特定の複合時間領域信号の倍音成分ある。例えば、1台のピアノで出したミドル「C」音は、別のピアノで出した同じ音と、非常に異なった倍音成分を持つ。
【0085】
2台のピアノが異なり得る別の点は、時間経過に対する倍音成分である。2台の異なるピアノで演奏された同じ音は、倍音構造が異なるばかりでなく、これらの構造は時間経過と共に異なる仕方で動作する。1つの音の或る倍音は、別のピアノで出した同じ音の倍音構造の時間経過に対するふるまいと比較して、非常に異なる仕方でサステインまたはフェードアウトする。
【0086】
録音された楽器によって生成される各信号の倍音を個々に操作することによって、当該楽器の応答を別の異なる楽器の応答に密接に類似させるか、又は、一致させることが出来る。この技法は倍音変換と呼ばれる。この技法は、各音内の倍音エネルギレベルを動的に変更し、時間経過におけるそれらのエネルギ応答を別の楽器の倍音エネルギレベルに密接に一致させるように調整する。これは、倍音ランキングに関係する周波数帯域比較によって達成される。第1ファイル(倍音的に変換されるべきファイル)の倍音が、第2ファイルのアタック、サステイン、および、ディケイ特性と一致するように、第1ファイルの倍音は目標とするサウンドファイルと比較される。
【0087】
倍音は一対一に対応しないので、調節用規則を設定するために、アルゴリズムによる比較解析が必要とされる。この処理は、一般的な処理に際して、ユーザからの入力によって援助されることも可能である。
【0088】
この種の操作の一例はフルートとピアノに見られる。図8aから8dまでは、特定の時点におけるピアノ及びフルートに関するスペクトル成分のプロットを示す。図8aは、一般的なフルートの初期の音におけるスペクトル成分を示す。図8bは同一音の非常に後期におけるフルートの倍音成分を示す。図8cは一般的なピアノからの図8aと同じ相対的時点における同一音を示す。これらの時点において、大量の高倍音エネルギが存在する。ただし、時間経過の後、各音の相対倍音成分は非常に変化した。図8dは、同一相対時点における、図8bと同じであるがピアノから出た音を示す。ピアノの高倍音成分は、音における、この時点のフルートの倍音成分よりはるかに希薄である。
【0089】
1つのサウンドファイルは他のサウンドソースの広大なアレイに更に密接に類似させることが可能であるので、情報は第2のサウンドファイルから直接入力される必要はない。モデルは様々な手段によって作ることができる。一方法は、他のサウンドをその時間経過におけるふるまいに基づいて全体的に特性化し、特徴的な倍音または部分音成分のふるまいに注目することである。従って、変えようとするサウンドファイルの各倍音の処理を導くための、種々の数学的または他の論理的規則を作成可能である。モデルファイルは、他のサウンドファイルから作成され、完全な理論的モデルであってもよいし、又は、実際には、ユーザによって任意に定義してもよい。
【0090】
ユーザがピアノの音をフルートに類似させようとするものと仮定すれば、この処理は、両楽器の相対的特性の考察を必要とする。ピアノは、音の開始時にその倍音内に大きいエネルギバーストを持ち、その後エネルギ成分は急激に落下する。これに比べて、フルートの初期アタックはそれほど顕著でなく、非倍音性を持つ。本発明を用いると、ピアノの各倍音は、全ての音のこの段階においてフルートの対応する倍音および欠落部分音に近似させるか、又は、必要に応じてこれらを合成するように適宜調節される。
【0091】
ピアノの出す音のサステイン部分においては、その高倍音エネルギ成分は迅速に消滅するのに対し、フルートの出す音においては、高倍音エネルギ成分は当該音の継続期間全体に亙って存在する。従って、この部分の期間中、ピアノの倍音を連続して動的に調節することが必要である。実際、或る点においては、倍音がかなり低レベルまで降下すると、倍音成分を置き換えるために合成が要求される。最終的に、これらの2つの楽器においては、音のディケイもわずかに異なり、フルートに一致させるには再び適切な調節が必要とされる。
【0092】
これは、組み合わせて使用され、音周波数を含めて、対象とする信号または音の種々様々な態様のシフトと共に移動するか、又は、これら態様におけるシフトを予想するデジタルフィルタ、調節パラメータ、閾値、および、サイン波シンセサイザの使用によって達成される。
【0093】
(倍音および他の部分音の強調)
本発明において、倍音および他の部分音の強調は、関連周波数レンジ内の他の信号の振幅に関係するそれらの振幅に基づいて、サイン波、部分音、非倍音性、倍音、または、他の信号を調節する方法を提供する。フィルタ振幅位置ガイド又は判定基準として倍音ランキングを置き換えることは、周波数レンジ内の振幅を用いて倍音調節を変更することである。また、倍音調節の場合と同様に、部分音は周波数ならびに振幅が移動するので、部分音の周波数はガイドを調節するフィルタ周波数である。音楽通路に一般的な多くのオーディオエレメント又は他の複合オーディオ信号の中で、本発明を用いた場合に、弱いものは他のものに対してブースト可能であり、ユーザの選択に従ってそれらの動的レンジを圧縮するか、又は、圧縮することなく、強いものは他のものに対してカット可能である。
【0094】
本発明は(1)比較的静かなサウンドまたは信号を分離するか或いはハイライトし、(2)とりわけ背景雑音、歪み、または、混乱、競合、または、ユーザによって好ましくないとみなされるオーディオ信号を含む、比較的大音量の、または他の選択されたサウンドまたは信号を減少させ、(3)より明瞭な、又は、そうでなければ、より望ましい部分音、音声、楽音、倍音、正弦波、その他のサウンドまたは信号、または、サウンドまたは信号の部分の混合を実施する。
【0095】
従来型電子コンプレッサ及びエキスパンダは、本発明によって考慮対象とされる極めて少数のパラメータのみであって、決して全体でないパラメータに従って作動する。更に、この種の圧縮/拡張デバイスの動作は、本発明のこの種のデバイスとは基本的に異なる。強調を用いる場合には、信号の調節はその振幅のみに基づくことなく、その周波数レンジ内の他の信号の振幅に対するその相対振幅によっても調節可能である。例えば、床の上で足を引きずる音は、聞き取るために調節する必要がある場合も又はない場合もあり得る。それ以外には静かな部屋においては、サウンドの調節を必要としないが、強烈に競合している部分音、サウンド、または、信号の背景音に対して同一振幅の同一サウンドが発生している場合には聞き取るために強調を必要とする。本発明はこの種の決定を行い、それに従って動作することができる。
【0096】
本発明の一方法においては、1つの音楽がディジタル化されて、振幅修正して静かな部分音を強調する。現行技術は、当該音楽を固定周波数レンジ内に圧縮することによってこれを達成するが、それによって信号全体がその動的レンジ全体に基づいて影響される。正味の効果は、より静かな通路を増幅することによってより静かな区分を強調することにある。本発明のこの態様は異なる原理で作用する。コンピュータソフトウェアは、複合波形のスペクトルレンジを調査し、特定の設定閾値レベルを下回る個別部分音のレベルを引き上げる。同様に、特定の閾値を上回る部分音のレベルは振幅において引き下げられる。ソフトウェアは複合波形内の全ての部分音周波数を時間経過に対して調査し、変化に関して設定された閾値内の部分音周波数だけを修正する。この方法において、アナログ及びデジタルのハードウェア及びソフトウェアは音楽をデジタル化し、それを何等かの形式のメモリに記憶する。複合波形は、高速フーリエ変換、ウェーブレット、及び/又は、他の適切な解析方法を用いて高い精度において調査される。関連ソフトウェアは経過時間に対して計算された部分音の振幅、周波数、およびタイムスレショルド(時間限界値)、及び/又は、パラメータを比較し、いずれの部分音周波数が振幅修正に関するスレショルド内に所在するかを決定する。これらのスレショルドは動的であり、かつ、どちらかの側の指定された或る周波数レンジ内における調節用に予定された部分音を囲む競合する部分音に依存する。
【0097】
本発明のこの部分は、洗練された周波数選択的等化またはフィルタリングデバイスとして作用し、この場合における選択可能な周波数の数はほとんど無制限である。デジタル等化ウィンドウが生成されて消去され、それによって、聞き取り難かったサウンド内の部分音の始め、ピーク、および、終わりの振幅を変えることによって、聴取者にとってより明瞭になる。
【0098】
対象とされる振幅を持つ信号が他の信号の振幅に対してシフトするにつれて、本発明の融通性は、(1)連続的に変化するように、又は、(2)固定的であって非連続的に変化するように、のいずれかで調節が実施される。実用的効果は、調節を必要とするオーディオ信号の部分を精確に指摘し、その調節を実施するばかりでなく、これらを必要に応じて必要とされる時に限り実施する能力である。フィルタ変化が毎秒約30サイクルより速ければ、フィルタ変化はそれら自身の音を生成する。従って、低音サウンドがフィルタリングによって除去できない限り、これより速い速度の変化は提案されない。
【0099】
本発明の第1の方法(又は、その組み合わせ)は、特定の時点において特定の部分音(または、その断片)に所要の調節を実施するために何が必要とされるかに従って、周波数および振幅が移動するフィルタを用いる。
【0100】
本発明の第2の方法においては、振幅調節用に設定された部分音が1つのフィルタレンジからその次のフィルタレンジへ移動するときに、「バケツリレー」方式で処理が手渡される。
【0101】
本発明は、周波数、時間経過に対する周波数、時間経過に対する周波数帯域内の競合部分音、振幅、および、時間経過に対する振幅を調査することができる。次に、周波数および振幅を調節可能なフィルタ、数式モデル、または、アルゴリズムを使用して、上述の目標、結果、または、効果を達成するための必要性に応じて、これら部分音、倍音、または、他の信号(またはその部分)の振幅を動的に調節する。両方の方法において、部分音、他の信号、または、その部分の周波数および振幅を評価した後で、本発明は、信号を上方または下方調節するか、または、全然調節しないかを、閾値に基づいて決定する。
【0102】
強調は、振幅閾値、及び、調節曲線に従う。本発明において、所要の結果を達成するために、閾値および調節を実施する3つの方法がある。第1の方法は、複合波形の全エネルギに基づいて振幅閾値を動的に調節する閾値を利用する。エネルギ閾値は一貫性のある周波数依存性を維持する(即ち、閾値曲線の勾配が全てのエネルギ変化に対して一貫している)。第2の方法は、調節されようとしている部分音の周りの周波数帯域内の補間された閾値曲線を実現する。閾値は動的であり、この部分音の周りの周波数領域に限定される。また、調節も同一周波数帯域において動的であり、振幅が変化する領域変化内における周りの部分音と同様に変化する。部分音は周波数が移動するので、閾値および調節周波数帯域も周波数において動的であり、調節されようとしている部分音が移動すると、これと共に移動する。第3の方法は固定した閾値レベルを利用する。振幅が閾値を上回る部分音は下方へ調節される。振幅が閾値を下回るがノイズフロアを上回る部分音は振幅において上方調節される。これら3つの方法について以下に検討することとする。
【0103】
3つの方法全てにおいて、調節レベルは「基準化(スケーリング)関数」に依存する。倍音または部分音が閾値を超えるか、または、それを下回るように降下すると、閾値を超えた量またはそれを下回った量が調節の大きさを決定する。例えば、上側閾値をかろうじて超過する部分音は極少量だけ下方調節されるが、閾値を更に超過すると、更に大量の調節が発生する。調節量の遷移は連続関数である。最も単純なこの種の関数は線形関数であるが、任意の基準化関数が適用される。いかなる数学関数を用いる場合でも、閾値を超えるまたはそれを下回るように降下する部分音の調節レンジは基準化されるか或いはオフセットされる。基準化関数の効果が基準化されると、閾値が変化したかどうかには関係なしに、部分音が閾値を超過すると同量の調節が発生する。例えば、既に示した第1の方法において、波形内に更に多くのエネルギが存在するときには閾値が変化する。基準化関数は、依然として、調節されるべき部分音の0%から25%までの間で変動するが、波形内に更に多くのエネルギが存在する場合には比較的小さい範囲で変動する。これの代替操作は、基準化関数を幾らかのパーセンテージだけオフセットすることである。従って、信号内に更に多くのエネルギが存在する場合には、レンジは同じでないはずであり、例えば、この場合、0%から10%のみにまで変化する。しかし、調節量の変化は、閾値を超過した部分音のエネルギ量に対して一貫したものである。
【0104】
第1の閾値および調節方法に従い、振幅の最小および最大限度を画定することにより、信号の部分音成分の一部分に作用することが望ましい。この種の処理においては、2つの閾値の境界、即ち上限または天井と、下限またはフロアとの間に信号が保持されることが理想的である。部分音の振幅は、設定された期間よりも長期に亙って、上側閾値を超え、または、下側閾値を下回るように降下することは許容されない。これらの閾値は、図9Aに示すように、周波数に依存する。ノイズフロアは、実際に単なる低レベルノイズに過ぎない部分音の調節を防止するように確立されなければならない。ノイズフロアは強調のために全体的な下限として作用し、手動により、又は、解析手順を介して確立される。各入力される部分音は2つの閾値曲線と比較されてから、上方(エネルギがブーストされる)または下方(エネルギが低減される)調節されるか、或いは、全然調節されない。ブースト又はカットは部分音周波数レンジにおける全信号振幅に関連するので、閾値曲線は同様に所与の時点における全信号エネルギに依存して変化する。調節量は、部分音のレベルに従って変化する。上述したように、調節は基準化関数に基づいて発生する。従って、調節されるべき部分音が閾値を超えるか、または、閾値を下回るように降下するエネルギ量に依存して調節が変化する。
【0105】
第2閾値および調節方法において、部分音は、当該部分音の継続時間において、調節されようとしている当該部分音の周りの周波数帯域における「競合する」部分音と比較される。この周波数帯域は幾つかの特徴を持つ。これらを図9Dに示す。1)帯域幅は所要の結果に応じて修正され得る。2)閾値及び調節領域の形状は連続的な曲線であり、曲線全体の「線形」部分に適合するように滑らかになる。曲線の線形部分はこの部分音に関する比較および調節領域の外側周波数を表す。ただし、曲線の線形部分の全「オフセット」は波形内における全エネルギに依存する。従って、閾値のオフセットにおける全シフトが観察されるが、調節はそれ自体の周波数領域における部分音に依存するので、特定の部分音の調節は変化しない。比較される周波数帯域における上側閾値は競合する部分音と共に増加する。閾値線を上回る部分音の調節に用いられる基準化関数は同様にシフト又は再基準化(リスケール)する。比較周波数帯域における下側閾値は競合部分音と共に下降する。再び、部分音の調節に用いられる基準化関数は同様にシフト又は再基準化する。3)部分音が閾値を上回るか、又は、閾値を下回るように降下すると、調節は振幅が閾値をどれだけ上回る、または、閾値をどれだけ下回るかに依存する。調節量は、後続部分音の周りの競合部分音内エネルギ分同様にオフセットされる連続的なパラメータである。例えば、部分音が上側閾値をかろうじて上回る場合には、その振幅は、例えば、僅かに5%だけ下方調節される。その振幅が比較的大量に閾値を上回る場合には、部分音が25%だけ調節される更に極端な場合が観察される。ただし、全信号エネルギが異る場合には、閾値オフセットにおける全シフトに対して幾らかのパーセンテージだけこの調節量はオフセットされる。4)実際に低レベルノイズであるに過ぎない部分音の調節を防止するようにノイズフロアが確立されなければならない。ノイズフロアは強調条件に関する全体的な下側限界として作用し、手動または解析手順を介して確立される。
【0106】
第3閾値および調節方法においては、全て同じ調節方法が用いられるが、単一固定閾値に関して比較が行われる。図9cはこの種の閾値の一例を示す。部分音が閾値を上回る、又は、それを下回るように降下した場合には、その調節は、振幅が閾値を上回るまたはそれを下回るように降下する量に依存する。調節量は、部分音内エネルギ分同様にオフセット又は再基準化される連続的なパラメータである。ここでも、上述の方法において述べたように、実際には単に低レベルノイズに過ぎない部分音の調節を防止するようにノイズフロアが確立されなければならない。
【0107】
ヒトの耳自体が平坦ではないので、全ての閾値および調節方法において、閾値(単一閾値または別々の上側および下側閾値)が平坦であるとは限らない。耳は、可聴レンジ全体に亙る均一または線形状態の振幅を認識しない。我々の聴覚応答は周波数依存である(幾らかの周波数では他の周波数よりも多量のエネルギを持つように知覚される)ので、本発明におけるエネルギ調節も周波数依存である。
【0108】
最大と最小振幅調節量間の振幅調節量を補間することにより、更に連続的かつ一貫性のある調節が達成可能である。例えば、その振幅が最大レベルに近い(クリッピングに近い)部分音は、その振幅が下側調節閾値をかろうじて上回る部分音の場合よりも下方調節されるエネルギ量が多いはずである。時間的閾値(タイムスレショルド)は、設定された周波数レンジにおいて競合する部分音が限界を持つように設定される。閾値曲線および調節曲線は、ユーザ希望定義とヒトの耳に基づいた経験的な知覚曲線との組み合わせを表す。
【0109】
図9Aは標本閾値(サンプルスレショルド)曲線を示し、図9Bは閾値及び調節方法1に関連するサンプル調節曲線を表す。閾値(スレショルド)は、全信号エネルギに依存する(例えば、下側全エネルギは閾値を低下させる)。入力される部分音の振幅が上側エネルギ閾値曲線または図9Aの上昇限度(天井)を上回る場合には、部分音は、図9Bの当該周波数に関連する調節曲線によって定義された量だけ部分音のエネルギがカットされる(下方調節される)。同様に、部分音の振幅が下側エネルギ閾値曲線すなわちフロア(床)を下回るように降下すると、そのエネルギは、当該周波数に対して関連する調節関数によって定義される量だけ再びブーストされる(上方調節される)。振幅の増加量、及び/又は、減少量は事前決定された量であってもよい。
【0110】
図9Bの調節関数は所与の周波数において実施される最大調節量を画定する。部分音の振幅への歪みの導入を防止する目的で、最大調節まで滑らかな遷移が実施されるように、調節量は時間経過と共に先細にされる。遷移は任意の関数によって定義され、線形パターンと同程度に単純なものであってもよい。漸進的なテーパ(先細り)なしでは、波形調節は速過ぎるか、または、不連続性を生じ、それによって、調節された信号に不必要、かつ/または、好ましくない歪みを生じる。同様に、部分音を上方調節する場合にもテーパリング(先細にすること)が適用される。
【0111】
図9Cは、第2の閾値および調節方法に関係する一例を示す。
【0112】
信号継続時間全体に亙って、当該信号の倍音/部分音の振幅は、かなり一定であることも変動することもあり、場合によっては、かなり変動する。これらの態様は周波数及び時間に依存し、或る特定の倍音の振幅およびディケイ特性は、競合する部分音に関して或る特定の形でふるまう。
【0113】
倍音(個別倍音または倍音のグループのどちらか)の最大振幅および最小振幅を制御するための閾値に関する前述の検討とは別に、ユーザによって設定される時間を基調とする閾値(スレショルド)も存在する。本発明が部分音を調節していくには、これらの閾値が適合しなければならない。
【0114】
本発明が作動開始するためには、振幅閾値がユーザによって指定された期間において適合するように、時間を基調とする閾値は、指定された調節に関する開始時間、継続時間、および、終了時間を設定しなければならない。例えば、振幅閾値が超過されても、その状態がユーザによって指定された期間に亙って維持されなければ、振幅調節は処理されない。例えば、次に示す条件のいずれかに適合する最小閾値を下回るように降下する信号は調節されない、即ち、(1)当該閾値に一旦適合したが、その後で、それを下回るように降下した場合、または(2)最初から一度も当該閾値に適合しない場合。ソフトウェアが、信号調節におけるこの種の差異を認識し、しかもユーザによって調節可能であれば有用である。
【0115】
(補間)
一般的な意味において、補間とは、所与量および既知変数の間の関係に基づいて2つの所与量間の未知量を推定または計算する方法である。本発明において、補間は倍音調節、倍音の調節と合成、部分音変換、及び、倍音変換に適用される。これは、楽器またはヒトの音声いずれかによって出された音の或る特定点における倍音構造をユーザが調節する方法を意味する。ユーザによって調節されたこれらの点の1つから他の点まで音楽レンジ全体に亙る倍音構造のシフト(移動)は、ユーザによって規定された幾つかの曲線または音調曲線または補間関数に従い、本発明の影響を受ける。このように、演奏された音の倍音成分の修正は連続的な方法で制御される。
【0116】
音声または楽器のサウンドは音域(レジスタ)の関数として変化可能である。異なる音域においてサウンドを変えたいというように願望が変化するため、歌手またはミュージシャンは、別の音域における音を出している状態において、ある1つの音域の特徴または音色を維持することを希望することがある。本発明において、補間は、彼らの願望を叶えるばかりでなく、ユーザによって調節された一方の点から別の点まで音楽スペクトル全体に亙って制御可能な仕方で、音の倍音構造を自動的に調節することも可能にする。
【0117】
ユーザは、高音域の音における第3倍音を強調したいが、中間音域における第10倍音は強調したくないものと仮定することとする。一旦、ユーザがこれらのパラメータを希望通りに設定すれば、本発明は、ユーザによって制御可能な変換特性を用いて、これらの点間における音の倍音構造のシフト(移動)を自動的に実施する。
【0118】
簡単に表現すれば、ユーザが或る特定点における倍音を設定すれば、補間作用はこれら「設定点」間の全てを自動的に調節する。更に具体的には、次に示す2項目が達成される。
* 第1に、ユーザは、音声または楽器レンジ内の異なる点における当該音声または楽器の音(又は、選択されたレンジ内における音のグループ)の倍音構造を調節することができる。その際、ユーザは、当該サウンド内において知覚された不足音を訂正したり、または、特別な効果を生成するようにサウンドを調節したり、または、望ましいと思われる倍音を強調したり、または望ましくないと思われる倍音を減少させるか又は削除したり、または、場合によりあらゆることを実施したりできる。
* 第2に、ユーザが、選択されたこれらの音または音域のサウンドの調節を一旦完了すると、本発明は、設定点間の音楽スペクトル全体に亙って、全ての音および知覚された全ての倍音の倍音構造をユーザによって事前に選択された公式に従ってシフトまたは変換する。
【0119】
補間関数(すなわち、一方の設定点の倍音構造からもう一方までシフトする特性または曲線)は線形であっても、対数的であっても、または、ユーザによって選択された他の音調曲線であってもよい。
【0120】
周波数目盛りは種々様々な音、倍音、部分音、または、他の信号の位置を図に表すことができる。例えば、1目盛りは1オクターブ離れた位置の周波数を図に表してもよい。本発明がユーザ設定点の間の全ての倍音構造を調節する仕方は当該ユーザによって選択可能である。
【0121】
(自然倍音の模倣)
倍音周波数の良好なモデルは、広い共振帯域内において近似自然「シャープ化」に設定可能であるので、fn=nxf1xSlog 2 nである。例えば、f1=185Hzの第10倍音は、10x185を用いる1850Hzの代わりに1862.3Hzである。更に重要なことは、その式が協和倍音、例えば、倍音1は倍音2と、倍音2は倍音4と、倍音3は倍音4と、倍音4は倍音5と、倍音4は倍音8と、倍音6は倍音8と、倍音8は倍音10と、倍音9は12と、等々のように協和する。これらの倍音が、倍音生成に用いられると、自然倍音の場合よりも更に強められて鳴る(ring)。これは、倍音調節および合成、および、自然倍音にも用いられる。この関数またはモデルは、より高い倍音を「シャープ化」する楽器によって生成され、近く一致する倍音を見付ける良好な方法である。このようにして、ストレッチ関数は自然倍音模倣INHに使用できる。
【0122】
関数fn=f1xnx(S)log 2 nはnが増大するにつれて次第にシャープ化する倍音をモデル化するために用いられる。Sはシャープ化定数であり、一般に1と1.003の間に設定され、nは正の整数1、2、3,...,Tであり、ここで、Tは一般に17に等しい。この関数を用いると、Sの値はシャープ化する範囲を決定する。それがモデル化する倍音は、fn=nxf1である場合に倍音が協和すると同じ方法で協和する。即ち、fn及びfmが1つの音のn番およびm番倍音であるならば、fn/fm=f2n/f2m=f3n/f3m=...=fkn/fkmである。
【0123】
例えば、高速基音検出方法、又は、フィルタバンクを介した明白な周波数位置決め技法、又は、自動相関技法などの基音および倍音の周波数を決定するために利用可能な多数の方法がある。特定の演算に必要とされる精度および速度の程度はユーザによって定義され、適切な周波数発見アルゴリズムを選択する助けとなる。
【0124】
(特殊効果のための倍音分離)
本発明およびその方法の更なる拡張はオーディオの独特な操作、及び、オーディオ処理の他の分野への本発明の応用を可能にする。対象とされる倍音はユーザによって選択され、次に、以前に言及した可変デジタルフィルタの使用によって元のデータから分離される。信号を分離するために使われるフィルタリング方法は任意の方法でよいが、特に適用可能な方法は、係数が入力データに基づいて再計算可能なデジタルフィルタである。
【0125】
次に、分離された倍音は他の信号処理ユニット(例えば、残響、コーラス、フランジ、等々の楽器用エフェクト)に供給され、最終的に、ユーザによって選択されるブレンド又は比率で元の信号へ混合して戻される。
【0126】
(具体化)
具体化される1つの変形例には、例えば、デスクトップパソコン24等のホストコンピュータシステムであって、追加機能を実施するために、システム内にインストールされる幾つかの増設カードを有するホストコンピュータシステムへ接続されたオーディオ信号22のソース(供給源)が含まれる。ソース32は生の演奏であっても、記憶されたファイルから得られてもよい。これらのカードには、アナログ−デジタル変換カード26及びデジタル−アナログ変換カード28、並びに、高速で計算およびフィルタリング処理を行なうために用いられる追加デジタル信号処理カードが含まれる。ホストコンピュータシステムは主にユーザインタフェース処理を制御する。ただし、汎用パソコンのプロセッサは、デジタル信号プロセッサカードをインストールすることなしに、全ての計算を単独で実行する。
【0127】
入力されるオーディオ信号は、電気サウンド信号をデジタル表現に変換するアナログ−デジタル変換ユニット26へ供給される。一般的な用途において、アナログ−デジタル変換は20から24ビットのコンバータを用いて実施され、48kHz−96kHz[および、おそらくは更に高い]サンプルレートで作動する。パソコンのサンプルレートは、一般に、16ビットのコンバータでサポートされる8kHz−44.1kHzである。これらは、幾らかの用途には十分である。ただし、例えば、20ビット、24ビット、32ビットなどの大きいワードサイズである方が更に良好な結果が得られる。また、サンプルレートが高ければ、変換された信号の品質が改良される。デジタル表現は、数の長いストリームであり、ハードディスク30に記憶される。ハードディスクは、例えば高性能取外し可能ディスク型媒体などのような独立型ディスクドライブであってもよいし、コンピュータ用の他のデータ及びプログラムが存在する同一ディスクであってもよい。性能および融通性に観点から、ディスクは取外し可能型である。
【0128】
一旦、ディジタル化されたオーディオデータがディスク30に記憶されると、信号の所要操作を実施するために、プログラムが選択される。プログラムは、実際には、所要の目標を達成するための一連のプログラムで構成される。この処理アルゴリズムは、処理アルゴリズムによって制御されたランダムアクセスメモリ(RAM)に記憶されているコンピュータデータを、可変サイズユニット内のディスク32から読み取る。処理が完成すると、処理されたデータはコンピュータディスク30で再び記憶される。
【0129】
本発明において、ディスクに対する読み取り及び書き込み処理は、読み取りと書き込みが混合され得るように、又、データセクションが多数回読み書き可能であるように双方向的、及び/又は、再帰的であってもよい。ディスクによるデジタルオーディオ信号のアクセス及び記憶は、システムを遅延させるので、オーディオ信号のリアルタイム処理においては最小限化される必要があることが多い。RAMのみを利用するか、または、キャッシュメモリを利用することによって、システムの性能は、幾らかの処理がリアルタイム又はほぼリアルタイム方式で実施され得る点まで向上可能である。リアルタイムとは、ユーザが感知可能な待ち時間が殆ど無いか、又は、一切無しに結果が得られるような速さで処理が発生することを意味する。処理の型およびユーザの好みに応じて、処理されたデータは上書きされるか、または、元のデータと混合される。新たなファイルへ一緒に書き込まれても、書き込まれなくてもよい。
【0130】
処理が完了すると、再度聴くため、又は、更なる外部処理34のために、データがコンピュータディスク又はメモリ30から読み取られる。ディジタル化されたデータはディスク30から読み取られ、デジタル−アナログ変換ユニット28へ書き込まれる。このユニットは、コンピュータ34外で使用するためにディジタル化されたデータをアナログ信号に変換し戻す。あるいは、ディジタル化されたデータは、(例えば、AES/EBU、または、SPDIFデジタルオーディオインタフェースフォーマット又は代替形式など)様々な手段を介して、直接デジタル形式で、外部デバイスへ書き出してもよい。外部デバイスには、記録システム、マスタリングデバイス、オーディオ処理ユニット、放送ユニット、コンピュータ、等々が含まれる。
【0131】
処理は、ユーザが感知可能な待ち時間が殆ど無いか、又は、一切無しに結果が得られるような速さで発生する。処理の型およびユーザの好みに応じて、処理されたデータは上書きされるか、または、元のデータと混合される。新たなファイルへ一緒に書き込まれても、書き込まれなくてもよい。
【0132】
処理が完了すると、再度聴くため、又は、更なる外部処理34のために、データがコンピュータディスク又はメモリ30から読み取られる。ディジタル化されたデータはディスク30から読み取られ、デジタル−アナログへ変換ユニット28へ書き込まれる。このユニットは、コンピュータ34外で使用するためにディジタル化されたデータをアナログ信号に変換し戻す。あるいは、ディジタル化されたデータは、(例えば、AES/EBU、または、SPDIFデジタルオーディオインタフェースフォーマット又は代替形式など)様々な手段を介して、直接デジタル形式で、外部デバイスへ書き出してもよい。外部デバイスには、記録システム、マスタリングデバイス、オーディオ処理ユニット、放送ユニット、コンピュータ、等々が含まれる。
【0133】
(高速基音検出)
本明細書に開示された具体例は、例えば高速基音検出方法などのような技術も利用する。この高速検出方法技術は、リアルタイムに実施される必要な後続のアルゴリズムが、顕著な待ち時間無しに(又は、大きくない待ち時間と共に)実施可能であるような非常に迅速な方法において、更に高い倍音の倍音関係からオーディオ信号の基音周波数を推定するためのアルゴリズムを使用する。高速検出アルゴリズムは、倍音処理が迅速かつ能率的に実施されるように、検出された高い倍音及び振動数のランキング数と、未検出の高い倍音のランキング数を推定することができる。また、このような処理は、基本振動数を知ることなく又は推測することなく行う事ができる。
【0134】
本方法は当該信号内の少なくとも2つの候補周波数を選択することを含む。次に、候補振動数のセットの構成要素が、ある倍音関係を持つ適当な倍音周波数のグループであるかどうかが決定される。各倍音振動数のランキング数が決定される。最終的に、音周波数が、適当な周波数から推定される。
【0135】
この方法の1つのアルゴリズムにおいて、検出された部分音間の関係が、全てのメンバーが適当な倍音周波数である場合に有効な類似の関係と比較される。比較される関係には、周波数比、周波数の差、これらの差の比率、および、倍音周波数が整変数の関数によってモデル化されるという事実から得られる一意的関係が含まれる。また、候補者周波数はまた、当該信号のソース(音源)によって生成可能な音周波数、及び/又は、より高位の倍音周波数の下側および上側限界を用いて選別される。
【0136】
このアルゴリズムは、より高い倍音間の関係、選択を限定する条件、より高い倍音が基音に対して有する関係、および、可能性のある基音周波数のレンジを使用する。fnがn番目の倍音の振動数、f1が基本振動数、nが正の整数とし、fn=f1xnxG(n)が倍音振動数をモデル化すると、同じ根元に由来する正当な倍音振動数である場合に優勢であるべき部分音周波数の間の関係の例は以下のようになる。
a)候補振動数fH,fM,fLの比率は、倍音のモデルにおけるそれらのランキング数RH、RM、RLを置き換えることによって得られる比率にほぼ等しくなくてはならない。すなわち、fH÷fM≒G(RH)÷G(RM)}、および、fM÷fL≒G(RM)÷G(RL)。
b)候補振動数間の差の比率はモデル化された振動数の差の比率と合致しなければならない。即ち、(RH−RM)÷(RM−RL)≒{G(RH)−G(RM)}÷{G(RM)}÷G(RL)]。
c)候補周波数部分音fH、fM、fLは、ソース又は楽器によって生成可能な周波数レンジ内に所在しなければならない。
d)倍音の高さの位数RH、RM、RLは、ソース又は楽器によって生成可能な基音周波数レンジ内、即ち、FLを下回るかFHを上回る基音周波数を意味してはならない。
e)可能性のある3個の倍音の高さの位数を得るように整数可変比率を一致させる場合に、例えば、整数比率RH/RMにおける整数RMは、整数比率RM/RLにおける整数RMと同じでなければならない。この関係は、倍音の高さの位数の組{RH、RM}および{RM、RL}を可能性のある3個の位数(RH、RM、RL)に結合するために用いられる。
【0137】
他のアルゴリズムは、倍音関係の中の測定された部分音振動数のセットと、それらに由来する個々の振動数及び基本振動数のランキング数を即座に特定するための擬似されたスライド規則を使う。この方法は、関数fn=f1×G(n)のG(n)に対応する倍音乗数値がマークされる目盛りを具体化する。マークされた乗数の各々は、対応するnの値に付けられる。計測された部分音の振動数は、同様の目盛りでマークされ、これらの目盛りはそれらの相対位置変化と比較され、乗数のセットとマッチする部分音の振動数のセットを分離する。ランキング数は、乗数目盛りから直接読むことが出来る。これらは、nの対応する値である。
【0138】
ランキング数と振動数は、その後、どのセットが正当な倍音であるかを求めるために使用され、対応する基本振動数も乗数目盛りから直接読み出すことができる。
【0139】
上述したアルゴリズムと他の関係するアルゴリズムの総合的な説明のために、PCT国際出願PCT/US99/25294、高速基音発見方法、WO 00/26896、2000年5月11日出願、を参照する。
【0140】
(他の具体化)
本発明の原理に従って複合波形を変更するための各種システムおよび方法の潜在的相互関係を図11に示す。入力信号は複合波形として音響ファイルへ供給される。次に、この情報は高速発見基音方法または回路へ供給され得る。これは、複合波形の基音振動数を迅速に決定するため、または、更なる倍音調節、及び/又は、合成のために情報を提供するための先駆者として、使用可能である。分析がほぼリアルタイムで実施されなければならない場合には、これは、とりわけ真である。
【0141】
倍音調節、及び/又は、合成は、移動する目標、または、振幅および振動数に関して調節可能な変化するデバイスに基づく。オフライン態様において、倍音調節/合成は、その入力を音響ファイルから直接受け取るはずである。出力は倍音調節/合成から直接可能である。
【0142】
その代りに、特殊効果用倍音の分離、補間、または、自然倍音模倣のいずれかと、ここで示した方法によって組合わされた倍音調節及び合成信号は、出力信号として供給可能である。
【0143】
移動目標に基づく倍音及び部分音強調は、複合波形の音響ファイルの入力から直接オフラインの入力信号を受け取るか、又は、出力として倍音調節、及び/又は、合成を形成する。それ(倍音強調)は、システムから出力信号を供給するか、または、倍音変換へ入力として供給する。倍音変換は、移動目標に基づき、かつ、目標ファイル、補間、および、自然倍音模倣を含む。
【0144】
本発明は、当該記述が主題の実例を示すような表現によって記述された。本記述は限定的意味を持つことなく本発明について記述することを意図するものである。上述の方法には、多くの改変、組合わせ、及び、変更が可能である。従って、本発明は、ここに明確に記述した以外の方法において実行可能であることを理解されたい。
【特許請求の範囲】
【請求項1】
複合波形として検出されたトーンスペクトル内の、倍音の振幅を修正する方法において、
検出された部分音のエネルギに基づき、動的エネルギしきい値を周波数の関数として決定するステップと、
倍音のそれぞれのランク毎に、前記動的エネルギしきい値に応じた振幅修正値を連続的に決定するステップと、
前記トーンスペクトルの倍音ランク別に選択された各倍音に対し、振幅修正関数を用いて前記振幅修正値を適用するステップと含み、
前記選択された倍音を含む前記検出済みトーンスペクトルの周波数が時間経過と共に変化するのに従って、各振幅修正関数に対応する周波数を、前記倍音ランクに対応する周波数に連続的に設定することを特徴とする方法。
【請求項2】
前記振幅修正関数は、周波数および振幅の少なくとも一方に対して調節可能であることを特徴とする請求項1に記載の方法。
【請求項3】
倍音ランクを各振幅修正関数に割り当てるステップと、
該倍音の周波数が変化するのに従って、前記振幅修正関数の周波数を当該ランクの倍音の周波数に設定するステップとを含むことを特徴とする請求項1に記載の方法。
【請求項4】
振幅変化分を各振幅修正関数に割り当てるステップを含むことを特徴とする請求項3に記載の方法。
【請求項5】
前記振幅修正関数は固定周波数に対して設定され、
振幅修正関数の周波数と選択された倍音とが対応する場合に、前記振幅修正関数を選択された倍音に適用するステップと、
選択された倍音のランクの関数として、前記振幅修正関数の振幅修正値を調節するステップと、を更に含むことを特徴とする請求項1に記載の方法。
【請求項6】
前記振幅修正関数の振幅および周波数は、時間経過と共に変化することを特徴とする請求項1に記載の方法。
【請求項7】
前記振幅修正関数により、前記選択されたランクの倍音の振幅を所定の値だけ調節することを特徴とする請求項1に記載の方法。
【請求項8】
前記振幅修正関数を使用して、選択されたランクの倍音を合成するステップと、
合成された倍音の周波数を前記複合波形に加えるステップとを有することを特徴とする請求項1に記載の方法。
【請求項9】
Sを1より大きい定数、nを倍音のランクとした場合に、複数の倍音は、モデル化関数n×Slog 2 nを用いて合成されることを特徴とする請求項8に記載の方法。
【請求項10】
前記振幅修正関数は、前記複合波形において検出された複数の部分音について、周波数と、振幅と、時間位置と、倍音ランクとを修正するステップを含み、これによって第2音源複合波形に類似させることを特徴とする請求項1に記載の方法。
【請求項11】
前記振幅修正関数は、第2音源複合波形に類似させるために、周波数と、振幅と、時間位置と、倍音とによって、前記複合波形において選択された複数の部分音を合成するステップをことを特徴とする含む請求項1に記載の方法。
【請求項12】
2以上の、周波数に基づくパラメータを設定するステップと、
補間関数を選択するステップと、
前記周波数に基づくパラメータと補間関数とに基づいて、前記複数の倍音の振幅を調節するステップと、を含むことを特徴とする請求項1に記載の方法。
【請求項13】
ノイズフロア閾値を周波数の関数として設定するステップと、
スケーリング関数を用いて、前記動的エネルギー閾値及び前記ノイズフロア閾値に応じて各部分音の振幅の修正値を連続的に決定するステップと、を含むことを特徴とする請求項1に記載の方法。
【請求項14】
複合波形に含まれる部分音の振幅を修正する方法であって、
検出された、部分音のエネルギに基づき、動的エネルギ閾値を周波数の関数として決定するステップと、
ノイズフロア閾値を周波数の関数として設定するステップと、
スケーリング関数を用いて、前記閾値に応じて各部分音の振幅修正値を連続的に決定するステップと、
振幅修正関数を用いて、決定された前記修正値を前記部分音に対して適用するステップと、を含むことを特徴とする方法。
【請求項15】
前記ノイズフロア閾値は、周波数の関数として連続的に設定される(16,24)ことを特徴とする請求項1又は14に記載の方法。
【請求項16】
前記ノイズフロア閾値は、時間の関数として設定されることを特徴とする請求項15に記載の方法。
【請求項17】
部分音の周波数が時間経過とともに変化するに従い、当該部分音の振幅修正値が部分音の周波数と共に変化することを特徴とする請求項1又は14に記載の方法。
【請求項18】
部分音の周波数が時間経過とともに変化する間、各振幅修正関数の前記周波数は、当該部分音の周波数に連続的に設定されることを特徴とする請求項1又は14に記載の方法。
【請求項19】
前記動的エネルギ閾値は、検出された、隣接する部分音のエネルギに基づいて決定されることを特徴とする請求項1又は14に記載の方法。
【請求項20】
前記動的エネルギ閾値は、ある期間内に検出された、部分音のエネルギおよび周波数に基づいて決定されることを特徴とする請求項1又は14に記載の方法。
【請求項21】
前記動的エネルギ閾値は、検出された、全ての部分音のエネルギの合計として決定されることを特徴とする請求項1又は14に記載の方法。
【請求項22】
前記動的エネルギ閾値は、ある期間内における部分音の周波数帯域内のエネルギに基づき、各部分音毎に決定されることを特徴とする請求項1又は14に記載の方法。
【請求項23】
部分音の振幅修正値は、前記期間における当該部分音の振幅と、該振幅の前記閾値との関係によって決定されることを特徴とする請求項1又は14に記載の方法。
【請求項24】
部分音のエネルギが前記動的エネルギ閾値より大きい場合、該部分音はスケーリング関数を用いて調節されることを特徴とする請求項1又は14に記載の方法。
【請求項25】
部分音のエネルギが前記動的エネルギ閾値より小さい場合、該部分音はスケーリング関数を用いて調節されることを特徴とする請求項1又は14に記載の方法。
【請求項26】
前記閾値レベルが変化する場合に、前記スケーリング関数が定められることを特徴とする請求項14に記載の方法。
【請求項27】
前記期間は変化することを特徴とする請求項26に記載の方法。
【請求項28】
倍音ランクに基づいて選択された各倍音に振幅修正関数を適用することにより、複合波形内の検出されたトーンスペクトルの倍音の振幅を修正するステップを含み、
各振幅修正関数の周波数は、選択された倍音を含む前記検出されたトーンスペクトルの周波数が時間経過とともに変化するのに従って、該倍音のランクに一致する周波数に連続的に設定されるステップを含むことを特徴とする請求項14に記載の方法。
【請求項29】
部分音の前記振幅修正関数は、周波数および振幅を調節可能なデジタルフィルタリング方法を用いて実行されることを特徴とする請求項1又は14に記載の方法。
【請求項30】
部分音の前記振幅修正関数は、固定周波数可変振幅フィルタ処理方法を用いて実行されることを特徴とする請求項1又は14に記載の方法。
【請求項31】
前記複合波形を記憶するステップと;時間経過とともに前記音スペクトルおよびその倍音の周波数、振幅、および倍音のランクを決定するステップとを含むことを特徴とする請求項1乃至30のいずれか1項に記載の方法。
【請求項1】
複合波形として検出されたトーンスペクトル内の、倍音の振幅を修正する方法において、
検出された部分音のエネルギに基づき、動的エネルギしきい値を周波数の関数として決定するステップと、
倍音のそれぞれのランク毎に、前記動的エネルギしきい値に応じた振幅修正値を連続的に決定するステップと、
前記トーンスペクトルの倍音ランク別に選択された各倍音に対し、振幅修正関数を用いて前記振幅修正値を適用するステップと含み、
前記選択された倍音を含む前記検出済みトーンスペクトルの周波数が時間経過と共に変化するのに従って、各振幅修正関数に対応する周波数を、前記倍音ランクに対応する周波数に連続的に設定することを特徴とする方法。
【請求項2】
前記振幅修正関数は、周波数および振幅の少なくとも一方に対して調節可能であることを特徴とする請求項1に記載の方法。
【請求項3】
倍音ランクを各振幅修正関数に割り当てるステップと、
該倍音の周波数が変化するのに従って、前記振幅修正関数の周波数を当該ランクの倍音の周波数に設定するステップとを含むことを特徴とする請求項1に記載の方法。
【請求項4】
振幅変化分を各振幅修正関数に割り当てるステップを含むことを特徴とする請求項3に記載の方法。
【請求項5】
前記振幅修正関数は固定周波数に対して設定され、
振幅修正関数の周波数と選択された倍音とが対応する場合に、前記振幅修正関数を選択された倍音に適用するステップと、
選択された倍音のランクの関数として、前記振幅修正関数の振幅修正値を調節するステップと、を更に含むことを特徴とする請求項1に記載の方法。
【請求項6】
前記振幅修正関数の振幅および周波数は、時間経過と共に変化することを特徴とする請求項1に記載の方法。
【請求項7】
前記振幅修正関数により、前記選択されたランクの倍音の振幅を所定の値だけ調節することを特徴とする請求項1に記載の方法。
【請求項8】
前記振幅修正関数を使用して、選択されたランクの倍音を合成するステップと、
合成された倍音の周波数を前記複合波形に加えるステップとを有することを特徴とする請求項1に記載の方法。
【請求項9】
Sを1より大きい定数、nを倍音のランクとした場合に、複数の倍音は、モデル化関数n×Slog 2 nを用いて合成されることを特徴とする請求項8に記載の方法。
【請求項10】
前記振幅修正関数は、前記複合波形において検出された複数の部分音について、周波数と、振幅と、時間位置と、倍音ランクとを修正するステップを含み、これによって第2音源複合波形に類似させることを特徴とする請求項1に記載の方法。
【請求項11】
前記振幅修正関数は、第2音源複合波形に類似させるために、周波数と、振幅と、時間位置と、倍音とによって、前記複合波形において選択された複数の部分音を合成するステップをことを特徴とする含む請求項1に記載の方法。
【請求項12】
2以上の、周波数に基づくパラメータを設定するステップと、
補間関数を選択するステップと、
前記周波数に基づくパラメータと補間関数とに基づいて、前記複数の倍音の振幅を調節するステップと、を含むことを特徴とする請求項1に記載の方法。
【請求項13】
ノイズフロア閾値を周波数の関数として設定するステップと、
スケーリング関数を用いて、前記動的エネルギー閾値及び前記ノイズフロア閾値に応じて各部分音の振幅の修正値を連続的に決定するステップと、を含むことを特徴とする請求項1に記載の方法。
【請求項14】
複合波形に含まれる部分音の振幅を修正する方法であって、
検出された、部分音のエネルギに基づき、動的エネルギ閾値を周波数の関数として決定するステップと、
ノイズフロア閾値を周波数の関数として設定するステップと、
スケーリング関数を用いて、前記閾値に応じて各部分音の振幅修正値を連続的に決定するステップと、
振幅修正関数を用いて、決定された前記修正値を前記部分音に対して適用するステップと、を含むことを特徴とする方法。
【請求項15】
前記ノイズフロア閾値は、周波数の関数として連続的に設定される(16,24)ことを特徴とする請求項1又は14に記載の方法。
【請求項16】
前記ノイズフロア閾値は、時間の関数として設定されることを特徴とする請求項15に記載の方法。
【請求項17】
部分音の周波数が時間経過とともに変化するに従い、当該部分音の振幅修正値が部分音の周波数と共に変化することを特徴とする請求項1又は14に記載の方法。
【請求項18】
部分音の周波数が時間経過とともに変化する間、各振幅修正関数の前記周波数は、当該部分音の周波数に連続的に設定されることを特徴とする請求項1又は14に記載の方法。
【請求項19】
前記動的エネルギ閾値は、検出された、隣接する部分音のエネルギに基づいて決定されることを特徴とする請求項1又は14に記載の方法。
【請求項20】
前記動的エネルギ閾値は、ある期間内に検出された、部分音のエネルギおよび周波数に基づいて決定されることを特徴とする請求項1又は14に記載の方法。
【請求項21】
前記動的エネルギ閾値は、検出された、全ての部分音のエネルギの合計として決定されることを特徴とする請求項1又は14に記載の方法。
【請求項22】
前記動的エネルギ閾値は、ある期間内における部分音の周波数帯域内のエネルギに基づき、各部分音毎に決定されることを特徴とする請求項1又は14に記載の方法。
【請求項23】
部分音の振幅修正値は、前記期間における当該部分音の振幅と、該振幅の前記閾値との関係によって決定されることを特徴とする請求項1又は14に記載の方法。
【請求項24】
部分音のエネルギが前記動的エネルギ閾値より大きい場合、該部分音はスケーリング関数を用いて調節されることを特徴とする請求項1又は14に記載の方法。
【請求項25】
部分音のエネルギが前記動的エネルギ閾値より小さい場合、該部分音はスケーリング関数を用いて調節されることを特徴とする請求項1又は14に記載の方法。
【請求項26】
前記閾値レベルが変化する場合に、前記スケーリング関数が定められることを特徴とする請求項14に記載の方法。
【請求項27】
前記期間は変化することを特徴とする請求項26に記載の方法。
【請求項28】
倍音ランクに基づいて選択された各倍音に振幅修正関数を適用することにより、複合波形内の検出されたトーンスペクトルの倍音の振幅を修正するステップを含み、
各振幅修正関数の周波数は、選択された倍音を含む前記検出されたトーンスペクトルの周波数が時間経過とともに変化するのに従って、該倍音のランクに一致する周波数に連続的に設定されるステップを含むことを特徴とする請求項14に記載の方法。
【請求項29】
部分音の前記振幅修正関数は、周波数および振幅を調節可能なデジタルフィルタリング方法を用いて実行されることを特徴とする請求項1又は14に記載の方法。
【請求項30】
部分音の前記振幅修正関数は、固定周波数可変振幅フィルタ処理方法を用いて実行されることを特徴とする請求項1又は14に記載の方法。
【請求項31】
前記複合波形を記憶するステップと;時間経過とともに前記音スペクトルおよびその倍音の周波数、振幅、および倍音のランクを決定するステップとを含むことを特徴とする請求項1乃至30のいずれか1項に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10615098P | 1998-10-29 | 1998-10-29 | |
US60/106,150 | 1998-10-29 | ||
PCT/US1999/025295 WO2000026897A1 (en) | 1998-10-29 | 1999-10-29 | Method of modifying harmonic content of a complex waveform |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011253361A Division JP2012083768A (ja) | 1998-10-29 | 2011-11-19 | 複合波形の倍音変更方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002529773A JP2002529773A (ja) | 2002-09-10 |
JP2002529773A5 true JP2002529773A5 (ja) | 2012-03-29 |
JP5113307B2 JP5113307B2 (ja) | 2013-01-09 |
Family
ID=22309765
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000580199A Pending JP2002529774A (ja) | 1998-10-29 | 1999-10-29 | 調律済み移動音楽音階方法および装置 |
JP2000580198A Expired - Fee Related JP5113307B2 (ja) | 1998-10-29 | 1999-10-29 | 複合波形の倍音内容を変える方法 |
JP2000580197A Pending JP2002529772A (ja) | 1998-10-29 | 1999-10-29 | 基本波高速発見方法 |
JP2011253361A Pending JP2012083768A (ja) | 1998-10-29 | 2011-11-19 | 複合波形の倍音変更方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000580199A Pending JP2002529774A (ja) | 1998-10-29 | 1999-10-29 | 調律済み移動音楽音階方法および装置 |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000580197A Pending JP2002529772A (ja) | 1998-10-29 | 1999-10-29 | 基本波高速発見方法 |
JP2011253361A Pending JP2012083768A (ja) | 1998-10-29 | 2011-11-19 | 複合波形の倍音変更方法 |
Country Status (17)
Country | Link |
---|---|
US (2) | US6448487B1 (ja) |
EP (3) | EP1145220A1 (ja) |
JP (4) | JP2002529774A (ja) |
KR (3) | KR20010082280A (ja) |
CN (3) | CN1328680A (ja) |
AT (2) | ATE239286T1 (ja) |
AU (3) | AU1809100A (ja) |
CA (3) | CA2347359A1 (ja) |
DE (2) | DE69904640T2 (ja) |
DK (2) | DK1125273T3 (ja) |
EA (2) | EA002990B1 (ja) |
ES (2) | ES2187210T3 (ja) |
HK (1) | HK1044843A1 (ja) |
ID (2) | ID29029A (ja) |
MX (2) | MXPA01004262A (ja) |
TW (2) | TW446932B (ja) |
WO (3) | WO2000026898A1 (ja) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ID29029A (id) * | 1998-10-29 | 2001-07-26 | Smith Paul Reed Guitars Ltd | Metode untuk menemukan fundamental dengan cepat |
DE10309000B4 (de) * | 2003-03-01 | 2009-10-01 | Werner Mohrlok | Verfahren für eine programmgesteuerte variable Stimmung für Musikinstrumente |
EP1605439B1 (en) * | 2004-06-04 | 2007-06-27 | Honda Research Institute Europe GmbH | Unified treatment of resolved and unresolved harmonics |
US7538265B2 (en) * | 2006-07-12 | 2009-05-26 | Master Key, Llc | Apparatus and method for visualizing music and other sounds |
US7514620B2 (en) * | 2006-08-25 | 2009-04-07 | Apple Inc. | Method for shifting pitches of audio signals to a desired pitch relationship |
US7880076B2 (en) * | 2007-04-03 | 2011-02-01 | Master Key, Llc | Child development and education apparatus and method using visual stimulation |
US7589269B2 (en) * | 2007-04-03 | 2009-09-15 | Master Key, Llc | Device and method for visualizing musical rhythmic structures |
US7932454B2 (en) * | 2007-04-18 | 2011-04-26 | Master Key, Llc | System and method for musical instruction |
US7994409B2 (en) * | 2007-04-19 | 2011-08-09 | Master Key, Llc | Method and apparatus for editing and mixing sound recordings |
WO2008130665A1 (en) * | 2007-04-19 | 2008-10-30 | Master Key, Llc | System and method for audio equalization |
WO2008130657A1 (en) * | 2007-04-20 | 2008-10-30 | Master Key, Llc | Method and apparatus for computer-generated music |
WO2008130663A1 (en) * | 2007-04-20 | 2008-10-30 | Master Key, Llc | System and method for foreign language processing |
WO2008130659A1 (en) * | 2007-04-20 | 2008-10-30 | Master Key, Llc | Method and apparatus for identity verification |
US8018459B2 (en) * | 2007-04-20 | 2011-09-13 | Master Key, Llc | Calibration of transmission system using tonal visualization components |
US7935877B2 (en) * | 2007-04-20 | 2011-05-03 | Master Key, Llc | System and method for music composition |
US7820900B2 (en) * | 2007-04-20 | 2010-10-26 | Master Key, Llc | System and method for sound recognition |
WO2008130660A1 (en) * | 2007-04-20 | 2008-10-30 | Master Key, Llc | Archiving of environmental sounds using visualization components |
US7932455B2 (en) * | 2007-04-20 | 2011-04-26 | Master Key, Llc | Method and apparatus for comparing musical works |
WO2008130658A1 (en) * | 2007-04-20 | 2008-10-30 | Master Key, Llc | System and method for speech therapy |
US20080269775A1 (en) * | 2007-04-20 | 2008-10-30 | Lemons Kenneth R | Method and apparatus for providing medical treatment using visualization components of audio spectrum signals |
WO2008130698A1 (en) * | 2007-04-20 | 2008-10-30 | Master Key, Llc | Musical instrument tuning method and apparatus |
JP5162963B2 (ja) * | 2007-05-24 | 2013-03-13 | ヤマハ株式会社 | 即興演奏支援機能付き電子鍵盤楽器及び即興演奏支援プログラム |
US7875787B2 (en) * | 2008-02-01 | 2011-01-25 | Master Key, Llc | Apparatus and method for visualization of music using note extraction |
US7919702B2 (en) * | 2008-02-01 | 2011-04-05 | Master Key, Llc | Apparatus and method of displaying infinitely small divisions of measurement |
KR101547344B1 (ko) | 2008-10-31 | 2015-08-27 | 삼성전자 주식회사 | 음성복원장치 및 그 방법 |
EP2400488B1 (en) * | 2009-02-17 | 2017-09-27 | Kyoto University | Music audio signal generating system |
KR101053668B1 (ko) * | 2009-09-04 | 2011-08-02 | 한국과학기술원 | 노래의 감성 향상 방법 및 장치 |
WO2011072737A1 (en) * | 2009-12-16 | 2011-06-23 | Robert Bosch Gmbh | Audio system, method for generating an audio signal, computer program and audio signal |
CN101819764B (zh) * | 2009-12-31 | 2012-06-27 | 南通大学 | 基于子带分解的特殊音效镶边的处理系统 |
EP2362375A1 (en) | 2010-02-26 | 2011-08-31 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for modifying an audio signal using harmonic locking |
JP5585764B2 (ja) * | 2010-03-30 | 2014-09-10 | マツダ株式会社 | 車両用発音装置 |
KR101486119B1 (ko) * | 2011-09-14 | 2015-01-23 | 야마하 가부시키가이샤 | 음향 효과 부여 장치 및 어쿠스틱 피아노 |
CN103794222B (zh) * | 2012-10-31 | 2017-02-22 | 展讯通信(上海)有限公司 | 语音基音频率检测方法和装置 |
CN103293227B (zh) * | 2013-05-17 | 2015-02-18 | 廊坊中电熊猫晶体科技有限公司 | 一种压电石英晶体晶片倒边实现效果的测量方法 |
KR101517957B1 (ko) | 2013-06-13 | 2015-05-06 | 서울대학교산학협력단 | 음향 지각 능력 평가 방법 및 평가 장치 |
US9530391B2 (en) * | 2015-01-09 | 2016-12-27 | Mark Strachan | Music shaper |
US11120816B2 (en) * | 2015-02-01 | 2021-09-14 | Board Of Regents, The University Of Texas System | Natural ear |
CN105118523A (zh) * | 2015-07-13 | 2015-12-02 | 努比亚技术有限公司 | 音频处理方法和装置 |
EP3350799B1 (en) * | 2015-09-18 | 2020-05-20 | Multipitch Inc. | Electronic measuring device |
US10460709B2 (en) | 2017-06-26 | 2019-10-29 | The Intellectual Property Network, Inc. | Enhanced system, method, and devices for utilizing inaudible tones with music |
US11030983B2 (en) | 2017-06-26 | 2021-06-08 | Adio, Llc | Enhanced system, method, and devices for communicating inaudible tones associated with audio files |
WO2019026325A1 (ja) * | 2017-08-03 | 2019-02-07 | ヤマハ株式会社 | 差分提示装置、差分提示方法および差分提示プログラム |
CN108231046B (zh) * | 2017-12-28 | 2020-07-07 | 腾讯音乐娱乐科技(深圳)有限公司 | 歌曲调性识别方法及装置 |
CN108320730B (zh) * | 2018-01-09 | 2020-09-29 | 广州市百果园信息技术有限公司 | 音乐分类方法及节拍点检测方法、存储设备及计算机设备 |
TWI718716B (zh) * | 2019-10-23 | 2021-02-11 | 佑華微電子股份有限公司 | 樂器音階觸發的偵測方法 |
US11842712B2 (en) * | 2020-12-23 | 2023-12-12 | Crown Sterling Limited, LLC | Methods of providing precise tuning of musical instruments |
KR102479314B1 (ko) * | 2021-03-12 | 2022-12-19 | 재단법인대구경북과학기술원 | 나선 악보, 나선 악보 제공 장치 및 방법 |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USRE29144E (en) * | 1974-03-25 | 1977-03-01 | D. H. Baldwin Company | Automatic chord and rhythm system for electronic organ |
US4152964A (en) | 1977-10-17 | 1979-05-08 | Waage Harold M | Keyboard controlled just intonation computer |
JPS5565996A (en) | 1978-11-13 | 1980-05-17 | Nippon Musical Instruments Mfg | Electronic musical instrument |
DE3023578C2 (de) * | 1980-06-24 | 1983-08-04 | Matth. Hohner Ag, 7218 Trossingen | Schaltungsanordnung zum Identifizieren des Akkordtyps und seines Grundtons bei einem chromatisch gestimmten elektronischen Musikinstrument |
JPS57136696A (en) | 1981-02-18 | 1982-08-23 | Nippon Musical Instruments Mfg | Electronic musical instrument |
US4449437A (en) * | 1981-09-21 | 1984-05-22 | Baldwin Piano & Organ Company | Automatic piano |
US4434696A (en) | 1981-11-20 | 1984-03-06 | Harry Conviser | Instrument for comparing equal temperament and just intonation |
DE3304995C2 (de) | 1982-02-13 | 1987-01-08 | Victor Company Of Japan, Ltd., Yokohama, Kanagawa | Rein gestimmtes elektronisches Musikinstrument |
JPS60125892A (ja) * | 1983-12-10 | 1985-07-05 | 株式会社河合楽器製作所 | 電子楽器 |
DE3725820C1 (ja) * | 1987-08-04 | 1988-05-26 | Mohrlok, Werner, 7218 Trossingen, De | |
US4860624A (en) | 1988-07-25 | 1989-08-29 | Meta-C Corporation | Electronic musical instrument employing tru-scale interval system for prevention of overtone collisions |
US5056398A (en) * | 1988-09-20 | 1991-10-15 | Adamson Tod M | Digital audio signal processor employing multiple filter fundamental acquisition circuitry |
JPH02173799A (ja) * | 1988-12-27 | 1990-07-05 | Kawai Musical Instr Mfg Co Ltd | 音高変更装置 |
JPH03230197A (ja) * | 1990-02-05 | 1991-10-14 | Yamaha Corp | 電子鍵盤楽器 |
JP2555765B2 (ja) * | 1990-09-06 | 1996-11-20 | ヤマハ株式会社 | 電子楽器 |
JP2661349B2 (ja) * | 1990-09-13 | 1997-10-08 | ヤマハ株式会社 | 電子楽器 |
JPH04178696A (ja) * | 1990-11-13 | 1992-06-25 | Roland Corp | 折返しノイズ除去装置 |
JP3109117B2 (ja) * | 1991-03-12 | 2000-11-13 | ヤマハ株式会社 | 電子楽器 |
US5210366A (en) * | 1991-06-10 | 1993-05-11 | Sykes Jr Richard O | Method and device for detecting and separating voices in a complex musical composition |
JPH064076A (ja) * | 1992-06-22 | 1994-01-14 | Roland Corp | 音色形成装置 |
US5440756A (en) * | 1992-09-28 | 1995-08-08 | Larson; Bruce E. | Apparatus and method for real-time extraction and display of musical chord sequences from an audio signal |
US5536902A (en) * | 1993-04-14 | 1996-07-16 | Yamaha Corporation | Method of and apparatus for analyzing and synthesizing a sound by extracting and controlling a sound parameter |
JP2500495B2 (ja) * | 1993-04-19 | 1996-05-29 | ヤマハ株式会社 | 電子鍵盤楽器 |
JPH07104753A (ja) * | 1993-10-05 | 1995-04-21 | Kawai Musical Instr Mfg Co Ltd | 電子楽器の自動調律装置 |
US5501130A (en) | 1994-02-10 | 1996-03-26 | Musig Tuning Corporation | Just intonation tuning |
US5569871A (en) * | 1994-06-14 | 1996-10-29 | Yamaha Corporation | Musical tone generating apparatus employing microresonator array |
WO1996004642A1 (en) * | 1994-08-01 | 1996-02-15 | Zeta Music Partners | Timbral apparatus and method for musical sounds |
US5504270A (en) * | 1994-08-29 | 1996-04-02 | Sethares; William A. | Method and apparatus for dissonance modification of audio signals |
JP3517972B2 (ja) * | 1994-08-31 | 2004-04-12 | ヤマハ株式会社 | 自動伴奏装置 |
JP3538908B2 (ja) * | 1994-09-14 | 2004-06-14 | ヤマハ株式会社 | 電子楽器 |
JP3265962B2 (ja) * | 1995-12-28 | 2002-03-18 | 日本ビクター株式会社 | 音程変換装置 |
JP3102335B2 (ja) * | 1996-01-18 | 2000-10-23 | ヤマハ株式会社 | フォルマント変換装置およびカラオケ装置 |
US5736661A (en) | 1996-03-12 | 1998-04-07 | Armstrong; Paul R. | System and method for tuning an instrument to a meantone temperament |
JP3585647B2 (ja) * | 1996-05-14 | 2004-11-04 | ローランド株式会社 | 効果装置 |
JP3692661B2 (ja) * | 1996-10-25 | 2005-09-07 | 松下電器産業株式会社 | 楽音合成装置 |
JP3468337B2 (ja) * | 1997-01-07 | 2003-11-17 | 日本電信電話株式会社 | 補間音色合成方法 |
US5977472A (en) * | 1997-01-08 | 1999-11-02 | Yamaha Corporation | Chord detecting apparatus and method, and machine readable medium containing program therefor |
JPH11338480A (ja) * | 1998-05-22 | 1999-12-10 | Yamaha Corp | カラオケ装置 |
ID29029A (id) * | 1998-10-29 | 2001-07-26 | Smith Paul Reed Guitars Ltd | Metode untuk menemukan fundamental dengan cepat |
-
1999
- 1999-10-02 ID IDW20010875A patent/ID29029A/id unknown
- 1999-10-29 AT AT99961536T patent/ATE239286T1/de not_active IP Right Cessation
- 1999-10-29 MX MXPA01004262A patent/MXPA01004262A/es unknown
- 1999-10-29 WO PCT/US1999/025296 patent/WO2000026898A1/en not_active Application Discontinuation
- 1999-10-29 EP EP99956738A patent/EP1145220A1/en not_active Withdrawn
- 1999-10-29 CA CA002347359A patent/CA2347359A1/en not_active Abandoned
- 1999-10-29 DK DK99961536T patent/DK1125273T3/da active
- 1999-10-29 AT AT99956737T patent/ATE230148T1/de not_active IP Right Cessation
- 1999-10-29 CN CN99812696A patent/CN1328680A/zh active Pending
- 1999-10-29 JP JP2000580199A patent/JP2002529774A/ja active Pending
- 1999-10-29 EP EP99956737A patent/EP1125272B1/en not_active Expired - Lifetime
- 1999-10-29 WO PCT/US1999/025295 patent/WO2000026897A1/en not_active Application Discontinuation
- 1999-10-29 CN CN99812778A patent/CN1325526A/zh active Pending
- 1999-10-29 CA CA002345718A patent/CA2345718A1/en not_active Abandoned
- 1999-10-29 KR KR1020017005410A patent/KR20010082280A/ko not_active Application Discontinuation
- 1999-10-29 ID IDW20010907A patent/ID29354A/id unknown
- 1999-10-29 AU AU18091/00A patent/AU1809100A/en not_active Abandoned
- 1999-10-29 WO PCT/US1999/025294 patent/WO2000026896A2/en not_active Application Discontinuation
- 1999-10-29 ES ES99956737T patent/ES2187210T3/es not_active Expired - Lifetime
- 1999-10-29 JP JP2000580198A patent/JP5113307B2/ja not_active Expired - Fee Related
- 1999-10-29 EA EA200100480A patent/EA002990B1/ru not_active IP Right Cessation
- 1999-10-29 EP EP99961536A patent/EP1125273B1/en not_active Expired - Lifetime
- 1999-10-29 AU AU13276/00A patent/AU1327600A/en not_active Abandoned
- 1999-10-29 CA CA002341445A patent/CA2341445A1/en not_active Abandoned
- 1999-10-29 MX MXPA01004281A patent/MXPA01004281A/es unknown
- 1999-10-29 ES ES99961536T patent/ES2194540T3/es not_active Expired - Lifetime
- 1999-10-29 DE DE69904640T patent/DE69904640T2/de not_active Expired - Lifetime
- 1999-10-29 KR KR1020017005409A patent/KR20010082279A/ko not_active Application Discontinuation
- 1999-10-29 AU AU13277/00A patent/AU1327700A/en not_active Abandoned
- 1999-10-29 DK DK99956737T patent/DK1125272T3/da active
- 1999-10-29 JP JP2000580197A patent/JP2002529772A/ja active Pending
- 1999-10-29 EA EA200100478A patent/EA003958B1/ru not_active IP Right Cessation
- 1999-10-29 DE DE69907498T patent/DE69907498T2/de not_active Expired - Fee Related
- 1999-10-29 US US09/430,294 patent/US6448487B1/en not_active Expired - Fee Related
- 1999-10-29 KR KR1020017005408A patent/KR20010082278A/ko not_active Application Discontinuation
- 1999-10-29 TW TW088118770A patent/TW446932B/zh not_active IP Right Cessation
- 1999-10-29 CN CNB998128821A patent/CN1174368C/zh not_active Expired - Fee Related
-
2000
- 2000-11-22 TW TW088118769A patent/TW502248B/zh not_active IP Right Cessation
-
2002
- 2002-06-26 HK HK02104762.6A patent/HK1044843A1/zh unknown
- 2002-07-15 US US10/195,073 patent/US6777607B2/en not_active Expired - Fee Related
-
2011
- 2011-11-19 JP JP2011253361A patent/JP2012083768A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5113307B2 (ja) | 複合波形の倍音内容を変える方法 | |
US7003120B1 (en) | Method of modifying harmonic content of a complex waveform | |
JP2002529773A5 (ja) | ||
US5703311A (en) | Electronic musical apparatus for synthesizing vocal sounds using format sound synthesis techniques | |
US7728212B2 (en) | Music piece creation apparatus and method | |
US7750229B2 (en) | Sound synthesis by combining a slowly varying underlying spectrum, pitch and loudness with quicker varying spectral, pitch and loudness fluctuations | |
JP4207902B2 (ja) | 音声合成装置およびプログラム | |
US9515630B2 (en) | Musical dynamics alteration of sounds | |
Lindemann | Music synthesis with reconstructive phrase modeling | |
US7432435B2 (en) | Tone synthesis apparatus and method | |
Penttinen et al. | Model-based sound synthesis of the guqin | |
Ryynanen et al. | Accompaniment separation and karaoke application based on automatic melody transcription | |
Jensen | The timbre model | |
JP3797283B2 (ja) | 演奏音制御方法及び装置 | |
US10319353B2 (en) | Method for audio sample playback using mapped impulse responses | |
US10643594B2 (en) | Effects device for a musical instrument and a method for producing the effects | |
JP2006113487A (ja) | 楽音データ生成方法及び装置 | |
Proscia et al. | A timbral and a musical performance analysis of saxophone multiphonic morphings | |
US20240236609A1 (en) | Method of using iir filters for the purpose of allowing one audio sound to adopt the same spectral characteristic of another audio sound | |
Wager et al. | Towards expressive instrument synthesis through smooth frame-by-frame reconstruction: From string to woodwind | |
Janer et al. | Morphing techniques for enhanced scat singing | |
JP2004287350A (ja) | 音声変換装置、音声効果付与装置、及びプログラム | |
Sethares | A Wing, An Anomaly, A Recollection |