JP4581190B2 - 音楽信号の時間軸圧伸方法及び装置 - Google Patents

音楽信号の時間軸圧伸方法及び装置 Download PDF

Info

Publication number
JP4581190B2
JP4581190B2 JP2000183499A JP2000183499A JP4581190B2 JP 4581190 B2 JP4581190 B2 JP 4581190B2 JP 2000183499 A JP2000183499 A JP 2000183499A JP 2000183499 A JP2000183499 A JP 2000183499A JP 4581190 B2 JP4581190 B2 JP 4581190B2
Authority
JP
Japan
Prior art keywords
beat
attack
detected
interval
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000183499A
Other languages
English (en)
Other versions
JP2002006899A (ja
Inventor
直樹 仁田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2000183499A priority Critical patent/JP4581190B2/ja
Publication of JP2002006899A publication Critical patent/JP2002006899A/ja
Application granted granted Critical
Publication of JP4581190B2 publication Critical patent/JP4581190B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
この発明は、原ディジタル信号のピッチを変えずに原ディジタル信号を所望とする圧伸率で時間軸圧伸するディジタル信号の時間軸圧伸方法及び装置に関し、特にリズム音源信号を含む音楽信号に対する時間軸圧伸方法及び装置に関する。
【0002】
【従来の技術】
ディジタル・オーディオ信号のピッチを変えずにその時間軸を圧縮又は伸長する時間軸圧伸技術は、例えば、収録されたディジタルオーディオ信号の全体的な収録時間を所定の時間に合わせ込む、いわゆる「尺合わせ」や、カラオケ装置等のテンポ変換等に利用される。この種の時間軸圧伸技術としては、従来より、カット・アンド・スプライス法(例えば特開平10−282963号)やポインター移動量制御による重複加算法(“ポインター移動量制御による重複加算法を用いた音声の時間積での伸長圧縮とその評価”;森田、板倉、昭和61年10月;日本音響学会秋期大会講演論文集1-4-14,PP149)等が知られている。
【0003】
一般的なカット・アンド・スプライス法による時間軸圧伸処理は、波形とは無相関に波形の切り出しを行い、切り出した波形をつなぎ合わせて指定された圧伸率での圧伸処理を行うもので、切り出し波形同士のつなぎの部分では、波形の不連続が生じるので、クロスフェード処理を行って、フレームのつなぎ部分を滑らかにする。切り出し間隔は、人間の聴感上、エコー感や音のダブリ感が検知されにくい間隔、例えば60msec程度に設定される。特に、特開平10−282963号の方式では、音声タイミング情報に同期して切り出しの長さを決める。通常の方式に比べ、元波形のリズムと同じ周期でつなぎ目が現れ、つなぎ目の部分の音質変化が目立ちにくいという特徴がある。
【0004】
一方、ポインター移動量制御による重複加算法では、原オーディオ信号において、波形相関の高い隣接した同じ長さの2つの区間を抽出し、これら区間の信号を重複加算し、この重複加算された信号を元の2つの区間と入れ換えたり、元の2つの区間の間に挿入することで、全体的な時間を短くしたり長くする。この方式は、カット・アンド・スプライト法よりもスムーズな波形接続が可能となる。特に音声信号や単音楽器のようなピッチ性の高い音源に対し、より品質の高い時間軸圧伸が可能となる。
【0005】
【発明が解決しようとする課題】
従来の一般的なカット・アンド・スプライス法では、どのような信号を対象としても、それなりの音質が期待できるというメリットはあるものの、特にリズム音源を対象とした場合には、二度打ちやリズムの狂いといった非常に目立つ音質劣化を発生させやすい。特開平10−282963号の方式では、元波形のリズムに同期したカット・アンド・スプライスとなっているが、特に伸長の場合、波形を切り出す際に二つのアタックが切り出し波形に含まれることがあり、この場合二度打ちが発生する。更に、ポインタ移動量制御による重複加算法では、波形の時間相関を見ながら時間軸圧伸を行うため、二度打ち現象は原理的には起きないと考えられる。しかし、時間軸圧伸後のアタックの位置については全く補償されておらず、この結果、リズムのずれが発生し易い。また、特開平11−161272号公報には、テンポに同期した周期で不連続変化点を設定して時間軸圧伸する技術が開示されているが、この技術では、予め入力信号のテンポを知っておく必要がある。
【0006】
この発明は、このような問題点に鑑みなされたもので、リズム音源のようなパルシブな音楽信号に対し時間軸圧伸処理を施す際に、時間軸圧伸後のビート位置を補償して、リズムの狂いや二度打ちを発生させることがない音楽信号の時間軸圧伸方法及び装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
この発明に係る音楽信号の時間軸圧伸方法は、時間軸圧伸処理すべき音楽信号からアタック位置を検出したのち、過去に検出されたアタック位置の間隔の系列に基づいてビート間隔を決定し、検出されたアタック位置の間隔と前記決定されたビート間隔とに基づいて、アタック位置の検出漏れ補正又は過剰検出補正を行ってビート位置を検出し、この検出されたビート位置の間の音楽信号のうち、前記検出されたビート位置とその近傍とを除いた部分に対して時間軸圧伸処理を施すようにしたことを特徴とする。
【0008】
また、この発明に係る音楽信号の時間軸圧伸装置は、時間軸圧伸処理すべき音楽信号からアタック位置を検出するアタック位置検出手段と、このアタック位置検出手段で検出されたアタック位置に基づいてビート位置を検出するビート位置検出手段と、このビート位置検出手段で検出されたビート位置間の音楽信号のうち、前記検出されたアタック位置とその近傍とを除いた部分についてピッチを変えずに予め指定された圧伸率で時間軸圧伸処理する時間軸圧伸処理手段とを備え、前記ビート位置検出手段は、過去に検出されたアタック位置の間隔の系列に基づいてビート間隔を決定し、検出されたアタック位置の間隔と前記決定されたビート間隔とに基づいて、アタック位置の検出漏れ補正又は過剰検出補正を行ってビート位置を検出するものであることを特徴とする。
【0009】
この発明によれば、音楽信号のアタック位置を検出したのち、ビート位置を検出してアタックの検出漏れや過剰検出を補正し、検出されたビート位置間で時間軸圧伸処理を施すようにしているので、二度打ちが発生することはなく、ビート位置の間隔も圧伸率に応じて圧縮又は伸長されることになり、これにより圧伸処理前後のビート位置の相対関係は完全に維持されるので、リズムの狂いが発生するようなこともない。
【0010】
なお、ビート位置の検出は、例えば過去に検出されたアタック位置の間隔の系列に基づいてビート間隔を決定し、検出されたアタック位置の間隔と前記決定されたビート間隔とに基づいて決定することができる。より具体的には、例えば検出されたアタック位置とその1つ前のアタック位置との間隔がビート間隔の整数倍で且つ前記1つ前のアタック位置から前記検出されたアタック位置までビート間隔ずつ進んだ位置の音楽信号のパワーが所定値を超えている場合には、その位置をビート位置とする。また、例えば検出されたアタック位置とその1つ前のアタック位置との間隔がビート間隔の整数分の1倍で且つ検出されたアタック位置の音楽信号のパワーが所定値を超えている場合には、その位置をビート位置とし、そうでない場合には誤検出としてビート位置としない。
【0011】
また、音楽信号のうち、検出されたアタック位置とその近傍とを除いた部分について時間軸圧伸処理を行い、この時間軸圧伸処理された信号の両端を時間軸圧伸処理されない信号と滑らかに結合するようにする。滑らかに結合させるには、時間軸圧伸処理の際に、両端部での処理波形が元の信号波形とほぼ似通うようにしたり、或いはクロスフェード処理で結合させる。この場合、ビート位置の部分の波形はそのまま維持されるので、本来の音に近い音が得られる。
【0012】
【発明の実施の形態】
以下、図面を参照して、この発明の好ましい実施の形態について説明する。
図1は、この発明の一実施例に係る音楽信号の時間軸圧伸装置の構成を示すブロック図である。
時間軸圧伸すべきリズム音源信号であるディジタル・オーディオ信号x(t)は、アタック位置検出部1に入力されている。即ち、リズム音源信号には、“アタック”が存在し、波形レベルでは信号電力の急激な集中と変化となっている。アタック位置検出部1では、あるしきい値によって単位時間当たりの信号電力の評価を行うと共に、この信号電力の時間微分によって、波形の急激な変化点を検出する。この2つを組み合わせることにより、音楽信号内のほぼ全てのアタックの検出が可能である。そして、この検出結果は、アタック位置情報として出力される。また、アタック位置検出部1では、各アタック位置におけるパワーの平均値Patkも求めてこれを出力する。
【0013】
ここで、アタック位置検出1で検出されたアタック位置は、必ずしも音楽信号のビート(拍)位置を正確に示しているとは限らない。何故なら、アタック位置検出1で検出されたアタック位置は、信号電力の急激な集中と変化の位置を示すので、例えば弱拍の場合や、たまたま当該位置がビート性の弱い楽器パートでビートを示している場合等のように、信号電力が緩やかな集中と変化を示すようなビート位置を検出漏れしてしまったり、本来ビートではない位置がたまたま信号電力の急激な集中と変化とを示しているために、過剰に検出されるおそれなどがあるからである。そこで、入力オーディオ信号は、ビート位置検出部2にも供給されている。ビート位置検出部2では、アタック位置情報及びパワーの平均値Patk等からアタックの検出漏れ、過剰検出等を補正し、予想される正しいビート位置を求めてこれを出力する。更に、入力オーディオ信号は、時間軸圧伸処理部3にも供給されている。時間軸圧伸処理部3は、入力されたオーディオ信号のうち、ビート位置検出部2で検出されたビート位置間の信号について時間軸圧伸処理を施す。
【0014】
図2は、時間軸圧伸処理部3の構成を示すブロック図である。
入力オーディオ信号は、遅延バッファ11に順次格納される。遅延バッファ11は、波形の時間軸伸長処理およびピッチ抽出処理等に必要なデータ量が格納されるリングバッファである。遅延バッファ11に格納されたオーディオ信号は、隣接波形読出位置制御部12の制御に基づき種々の区間長で切り出され、隣接波形のデータとして順次読み出される。類似度計算部13は、隣接波形読出制御部12の制御のもとで読み出された隣接波形のデータの類似度を計算する。制御部14は、求められた類似度から隣接波形が最も類似する区間長を求め、これを基本周期(ピッチ)Lpとして波形読出制御部15に与える。波形読出制御部15は、制御部14に与えられた前記ビート位置情報に基づき、ビート位置間の信号について、与えられた基本周期Lpだけ離れた2つのデータを遅延バッファ11から読み出す。遅延バッファ11から読み出された2つのデータD1,D2は、波形窓掛け・加算部16,圧伸率制御部17及び出力バッファ18からなる圧伸処理制御手段に供給される。波形窓掛け・加算部16に供給されたデータD1,D2は、ここで所定の時間窓関数を乗算されて加算される。また、一方のデータD2は、圧伸率制御部17にも供給されている。圧伸率制御部17は、制御部14から与えられる圧伸処理の対象長さLの情報に基づいて原オーディオデータから波形を切り出す。圧伸処理の対象長さLは、予め設定された圧伸率Rと、抽出された基本周期Lpとに基づき制御部14で算出される。そして、波形窓掛け・加算部16で加算された波形と、圧伸率制御部17で切り出された原波形とが出力バッファ18において合成されて時間軸圧伸された出力信号が生成される。
【0015】
次に、このように構成されたこの実施例の装置の動作を説明する。
図3は、アタック検出部1におけるアタック検出処理を説明するための図である。
アタックの位置は、信号電力とその時間微分値より求めることができる。信号電力の計算は、図3に示すように、予め定めた信号電力計算時間T1の信号について、予め定めた信号電力評価更新時間長T2で順次更新しながら行う。入力信号をx(t)とし、期間T1の入力信号x(t)から信号電力Powを下記数1により求める。
【0016】
【数1】
Pow=sqrt[Σx(t)]
【0017】
求められた信号電力Powに対して、その時間微分Spwを数2のように求める。
【0018】
【数2】
Spw=dPow/dt
【0019】
この時間微分Spwが所定のしきい値を超えるかどうかを評価してアタック位置Aiを検出する。
【0020】
次に、ビート位置検出部2におけるビート位置検出処理について説明する。
図4は、ビート位置検出部2におけるビート位置検出処理を示すフローチャートである。
まず、アタック位置検出部1で検出されたアタック位置情報Aiを入力する(S1)。次に、このアタック位置Aiと、前回検出したアタック位置Ai-1との間隔ΔA[i]を求める(S2)。次に、過去のアタック間隔の系列ΔA[0],ΔA[1],…,ΔA[i]から適切なビート間隔ΔBを決定する(S3)。ΔBの決定方法としては、例えば過去のアタック間隔の系列ΔA[0],ΔA[1],…,ΔA[i]のうち、統計的に最多頻度となる値をΔBとする方法等を用いることができる。続いてアタック間隔ΔA[i]とビート間隔ΔBとを比較する(S4)。この大小関係によって検出漏れ補正又は過剰検出補正が行われる。
【0021】
(1)検出漏れ補正
ΔA[i]がΔB以上の場合(S4がYesの場合)、ΔA[i]がΔBのn倍(但しnは整数)の近傍であるかどうかを判定し(S5)、もしそうであれば検出漏れがあったと判断する。この場合、Ai-1からAiまでΔBずつ進んだ位置、それぞれがビート位置である可能性があるとするが(S6,S7,S8,S9)、むやみにビート位置の数を増加させないようにそれぞれの位置でパワーの評価を行う(S10)。パワーのしきい値Pthは、固定的に定めても良いし、その時点での信号から適応的に求めても良い。もし、パワーがしきい値Pthを超えていれば(S10)、その位置をビート位置とし(S9)、そうでなければビート位置の候補から除外する。なお、ここではドラム以外の比較的パワーの立上りが急峻でない楽音によるビートの提示を考慮して、パワーの立上りは評価せず、パワーの大きさのみを評価する。即ち、アタック位置検出部1においてその位置がアタックとして検出されなかったのは、パワーの立上りが急峻でなかったことによると仮定している。もし、ΔA[i]がΔBの整数倍近傍の値でなければ、Aiは誤検出であったと判断し、次のアタックAi+1を入力して(S1)同様の処理を繰り返す。
【0022】
(2)過剰検出補正
一方、図4のステップS4で、ΔA[i]がΔBよりも小さいと判定された場合、アタック間隔ΔA[i]がΔBの1/nの近傍の値であるかどうかを判定する(S11)もし、そうであれば更にアタック位置Aiにおけるパワーが過去のアタック位置におけるパワーの平均値Patkよりも大きいかどうかを判定する(S12)。これは検出されたアタックの中でもより重要なものであるかどうかを見ている。この二つの条件を共に満たしていれば、Aiはビート位置であると判断する(S13,S14)。この条件を一つでも満たしていなければ、Aiは誤検出であったと判断し、次のアタック位置Ai+1を入力する(S1)。
【0023】
図5は、上述したビート位置検出処理によってアタック位置からビート位置を再配置する例を示す図である。
例えば、図5(a)に示すように、検出されたアタック間隔ΔA[i]=15であるとし、同図(b)に示すように、ビート間隔がそれまでの処理によってΔB=5と決定されていたとすると、ΔA[i]≧ΔBで、且つΔA[i]=3・ΔBであるから、Ai-1+ΔB(=Bi1),Ai-1+2・ΔB(=Bi2)の位置が検出漏れのあったビート位置候補と考える。このとき、図5(b)(1)のように、それぞれのビート候補位置Ai-1+ΔB,Ai-1+2・ΔBでのパワーP(Ai-1+ΔB),P(Ai-1+2・ΔB)が全てパワーのしきい値Pthを超えている場合、これらは共にビート位置として確定する。従って、得られるビート位置の系列はBi-1(=Ai-1),Bi1,Bi2,Bi(=Ai)となる。また、図5(b)(2)では、ビート候補位置Bi1のパワーだけがしきい値Pthを超えており、ビート候補位置Bi2のパワーはしきい値Pthを下回っている。この場合には、ビート位置の系列はBi-1(=Ai-1),Bi1,Bi(=Ai)となる。更に、図5(b)(3)では、ビート候補位置Bi1,Bi2のパワーがいずれもしきい値Pthを下回っているので、この場合には、ビート位置の系列は、Bi-1(=Ai-1),Bi(=Ai)となる。
【0024】
一方、図5(c)のように、ビート間隔ΔB=30であるとすると、ΔA
[i]<ΔBで、且つΔA[i]=(1/2)・ΔBであるから、ΔAiはビート候補位置である。ここで同図(c)(1)のように、アタック位置AiでのパワーP(Ai)がしきい値Patkを超えている場合、これは重要なアタック位置、すなわちビート位置であると判断される。この場合に得られるビート位置の系列はBi-1(=Ai-1),Bi(=Ai)となる。逆に同図(c)(2)に示すように、AiでのパワーP(Ai)がパワーPatkを下回るときには、Aiはそれほど重要なアタック要素ではないとみなされて、ビート候補から外れ、却下される。
【0025】
また、図5(d)のように、ビート間隔ΔB=12又はΔB=18等に決定されているとすると、ΔBの整数倍及び整数分の1は、いずれもΔA[i]の近傍の値とはならないので、新たにビート位置が挿入されることもなく、アタック位置Aiは却下される。
【0026】
以上を繰り返して得られたBの系列が正しく補正されたビート位置となる。
図6は、音楽信号に対してアタック位置検出のみを行った場合の検出位置と、ビート位置検出処理を追加した場合の検出位置とを比較した図である。図6(a)では、アタック位置検出のみでは検出できなかったビートをビート位置検出を行うことによって検出できる例を示している。これにより、アタック検出のみでは二度打ち/抜けが発生していた箇所が保持されたまま処理することができる。また、図6(b)では、アタック検出のみの場合には、ビート成分以外の部分でもアタック位置を検出してしまうのを、ビート位置検出を併用することで、そのような過剰検出を抑制することができることを示している。これにより、圧伸処理の増加による音質劣化や計算量の増加を抑えることができる。
【0027】
次に、このように検出されたビート位置間の時間軸圧伸処理部3における圧伸方式について説明する。時間軸圧伸方式としては、カット・アンド・スプライス法、ポインタ移動量制御による重複加算法、リバーブ、ディザ、ループの繰り返し等、種々の方法を適用することができるが、ここでは、一例としてポインタ移動量制御による重複加算法による圧伸方式について説明する。
【0028】
図7及び図8は、この時間軸圧伸手法を説明するための図であり、図7は圧縮処理、図8は伸長処理をそれぞれ示している。まず、同図(a)に示すように、原オーディオデータの時間軸方向の隣接波形区間の類似性判定処理を行って基本周期Lpを抽出する。具体的には、区間長の初期値を最小値Lminに設定して隣接する区間長Lminの波形の類似度を判定する。これを区間長が最大値Lmaxとなるまで繰り返し、最も類似していると判定された区間長を、同図(b)のように基本周期Lpと決定する。次に、決定された基本周期Lpの隣接する2つの波形に、同図(c)に示すような窓関数を掛けて、これらを同図(d),(e),(f)に示すように重ね合わせる。図7(f)のように、重ね合わせた波形を2つの基本周期の波形と置き換えれば時間軸圧縮となり、図8(f)のように、重ね合わせた波形を2つの基本周期の波形の間に挿入すれば時間軸伸長となる。
【0029】
図9は、この時間軸圧伸処理の手順を示すフローチャートである。
入力信号x(t)は、必要な量がまず遅延バッファ11に格納される(S21)。このバッファ11は、最低でも2×Lmaxサンプルの容量が必要である。次に、類似性判定のための区間長Lpの初期値として最小値Lminが与えられ、類似度Sとして最大値Smaxが与えられる(S22)。そして類似度Sが計算されると共に(S23)、区間長Lpを1つずつ増やして(S24)、Lpが最大値Lmaxに達するまで、類似度Sを計算して(S25,S23)、最も類似性の高かった区間長Lpを求める(S23)。ここで図7及び図8を参照して明らかなように、類似性判定は、現在点T0からT0+Lp−1間での区間の波形Wave Aと、T0+LpからT0+2Lpまでの区間の波形Wave Bとの類似度演算となる。いま、これら区間の対応する各時間軸方向の位置をtx,tx+Lpとすると、類似度Sは、下記数3のように二乗誤差によって求めることができる。
【0030】
【数3】
Figure 0004581190
+
【0031】
この場合、類似度Sが小さいほど類似性が高いことを示すことになる。勿論、これは一例であって、このような二乗誤差の他に、誤差の絶対値和や自己相関関数を用いることもできる。
【0032】
ここで、例えば図10に示すように、ビート位置間の区間の前端部分(ビート位置)及び後端部分(次のビート位置の直前の区間)の信号は、そのままとし、その中間部分の信号を時間軸圧伸処理する。時間軸圧伸処理は、その両端において、時間軸圧伸されない信号と滑らかに結合されるように行う。最も目立つビートの部分の波形は、そのまま維持されるので、本来の音に近い音が得られる。
【0033】
ところで、このようにビート位置を基本とする時間軸圧伸処理では、処理はビート位置間で完結し、その前後の信号は一切用いないことが重要である。しかも、前述のように、時間軸圧伸処理された信号と時間軸圧伸処理されない信号とを滑らかに接続しなければならない。この場合、時間軸圧伸処理をポインタ移動量制御による重複加算法によって行うと、必ず処理しきれない部分が発生する。特に時間軸圧伸率が100%に近い部分では、この部分が非常に長くなる。
【0034】
図11は、時間軸伸長時に処理しきれなかった部分をビート位置間の後端部分からクロスフェードに必要な分のデータを取り出し、一部をクロスフェードして時間的な辻褄を合わせる処理を示している。図12は、時間軸伸長におけるクロスフェード時に、データが足りない場合に、一部のデータを繰り返して伸長を行っている様子を示している。これはポインタ移動量が大きすぎて全く処理できない場合等に有効である。
【0035】
図13は、時間軸圧縮時の様子を示したもので、伸長時と同様に、処理しきれなかった部分をクロスフェードで時間軸圧縮している。圧縮時にはデータが不足することはあり得ないので、全てビート位置間の後端部分から必要なデータを取り出し、クロスフェードすればよい。
【0036】
以上の処理では、モノチャネルのみの処理について説明したが、処理すべき音楽信号がステレオ信号である場合には、L,Rのそれぞれのチャネルの信号に対して独立に処理を行うと、ステレオ再生した場合に、定位感が広がってしまうことがある。これは、上述した時間軸圧伸を行った際、左右チャネル間でクロスフェードポイントがずれることにより、位相が変化してしまうため定位感が大きく損なわれるものと推測される。そこで、例えば図14に示すように、加算器21によってL+Rの和信号を得、この和信号に対してアタック位置検出部22にてアタック位置の検出を行う。その後、和信号から得られたアタック位置をもとに、ビート位置検出部23でビートの再配置を行う。更に、時間軸圧伸の際、圧伸処理を行う位置を決定する圧伸位置評価部24の評価関数にも左右の和信号を用いた上で、各チャネルを個別に処理する圧伸制御部25,26を設けるようにすれば、ビート位置および圧伸処理が左右同じになり、入力信号と同じ定位を保ったまま出力できる。
【0037】
なお、以上の実施例では、ビートがドラム等のパルシブな楽器によって生成されていると仮定した場合の処理例を示した。しかし、ビート検出の手法は、上述したものに限定されるものではなく、例えば次のような手法にて求めるようにしても良い。
即ち、まず入力オーディオ信号に対して周波数解析を行い、各周波数毎の発音時刻を求め、各周波数毎の発音時刻をベクトル化する。次に、過去に得られた発音時刻ベクトルからビート間隔を求め、次のビート時刻の予測とビートタイプの判定を行う。その際、コード変化情報を使用して音楽的に判定する。コード変化情報は、例えば四分音符レベルでのコード変化度と、八分音符レベルでのコード変化度とからなる。前者は、各四分音符の位置でコードがどれぐらい変化した可能性があるか、後者は八分音符の位置でコードがどれぐらい変化した可能性があるかを示す。得られるビート情報は、ビート時刻、ビートタイプ及び現在のテンポからなる。これらの情報を用いて時間軸圧伸処理を行うようにしても良い。この場合には、ビートがパルシブな楽器によって生成されたものでなくても、ビートの位置を正しく検出することができる。
【0038】
【発明の効果】
以上述べたように、この発明によれば、音楽信号のアタック位置を検出したのち、ビート位置を検出してアタックの検出漏れや過剰検出を補正し、検出されたビート位置間で時間軸圧伸処理を施すようにしているので、二度打ちが発生することはなく、ビート位置の間隔も圧伸率に応じて圧縮又は伸長されることになり、これにより圧伸処理前後のビート位置の相対関係は完全に維持されるので、リズムの狂いが発生するようなこともないという効果を奏する。
【図面の簡単な説明】
【図1】この発明の一実施例に係る音楽信号の時間軸圧伸装置のブロック図である。
【図2】同装置における時間軸圧伸処理部の構成を示すブロック図である。
【図3】同装置におけるアタック位置検出部の処理を説明するための図である。
【図4】同装置におけるビート位置検出部の処理を示すフローチャートである。
【図5】同装置におけるビート位置検出処理を説明するための図である。
【図6】同装置におけるビート位置検出による検出補正例を示す図である。
【図7】同処理における時間軸圧縮処理を示す波形図である。
【図8】同装置における時間軸伸長処理を示す波形図である。
【図9】同装置における時間軸圧伸処理のフローチャートである。
【図10】この発明における他の実施例に係る時間軸伸長処理前後の信号を示す波形図である。
【図11】同処理におけるクロスフェード処理を説明するための図である。
【図12】同処理におけるクロスフェード処理を説明するための図である。
【図13】同処理におけるクロスフェード処理を説明するための図である。
【図14】この発明の更に他の実施例に係る時間軸圧伸装置のブロック図である。
【符号の説明】
1,22…アタック位置検出部、2,23…ビート位置検出部、3,25,26…時間軸圧伸処理部、11…遅延バッファ、12…隣接波形読出部、13…類似度演算部、14…制御部、15…波形読出制御部、16…波形窓掛け・加算部、17…圧伸率制御部、18…出力バッファ、24…圧伸位置評価部。

Claims (8)

  1. 時間軸圧伸処理すべき音楽信号からアタック位置を検出したのち、過去に検出されたアタック位置の間隔の系列に基づいてビート間隔を決定し、検出されたアタック位置の間隔と前記決定されたビート間隔とに基づいて、アタック位置の検出漏れ補正又は過剰検出補正を行ってビート位置を検出し、この検出されたビート位置の間の音楽信号のうち、前記検出されたビート位置とその近傍とを除いた部分に対して時間軸圧伸処理を施すようにしたことを特徴とする音楽信号の時間軸圧伸方法。
  2. 前記検出されたアタック位置とその1つ前のアタック位置との間隔が前記ビート間隔の整数倍で且つ前記1つ前のアタック位置から前記検出されたアタック位置まで前記ビート間隔ずつ進んだ位置の音楽信号のパワーが所定値を超えている場合には、その位置をビート位置とすることを特徴とする請求項記載の音楽信号の時間軸圧伸方法。
  3. 前記検出されたアタック位置とその1つ前のアタック位置との間隔が前記ビート間隔の整数分の1倍で且つ前記検出されたアタック位置の音楽信号のパワーが所定値を超えている場合には、その位置をビート位置とし、そうでない場合には誤検出としてビート位置としないことを特徴とする請求項記載の音楽信号の時間軸圧伸方法。
  4. 記時間軸圧伸処理された信号の両端を時間軸圧伸処理されない信号と滑らかに結合するようにしたことを特徴とする請求項1〜のいずれか1項記載の音楽信号の時間軸圧伸方法。
  5. 時間軸圧伸処理すべき音楽信号からアタック位置を検出するアタック位置検出手段と、
    このアタック位置検出手段で検出されたアタック位置に基づいてビート位置を検出するビート位置検出手段と、
    このビート位置検出手段で検出されたビート位置間の音楽信号のうち、前記検出されたアタック位置とその近傍とを除いた部分についてピッチを変えずに予め指定された圧伸率で時間軸圧伸処理する時間軸圧伸処理手段と
    を備え
    前記ビート位置検出手段は、過去に検出されたアタック位置の間隔の系列に基づいてビート間隔を決定し、検出されたアタック位置の間隔と前記決定されたビート間隔とに基づいて、アタック位置の検出漏れ補正又は過剰検出補正を行ってビート位置を検出するものであることを特徴とする音楽信号の時間軸圧伸装置。
  6. 前記ビート位置検出手段は、前記検出されたアタック位置とその1つ前のアタック位置との間隔が前記ビート間隔の整数倍で且つ前記1つ前のアタック位置から前記検出されたアタック位置まで前記ビート間隔ずつ進んだ位置の音楽信号のパワーが所定値を超えている場合には、その位置をビート位置とするものであることを特徴とする請求項記載の音楽信号の時間軸圧伸装置。
  7. 前記ビート位置検出手段は、前記検出されたアタック位置とその1つ前のアタック位置との間隔が前記ビート間隔の整数分の1倍で且つ前記検出されたアタック位置の音楽信号のパワーが所定値を超えている場合には、その位置をビート位置とし、そうでない場合には誤検出としてビート位置としないことを特徴とする請求項記載の音楽信号の時間軸圧伸装置。
  8. 前記時間軸圧伸処理手段は、前記時間軸圧伸処理された信号の両端を時間軸圧伸処理されない信号と滑らかに結合するものであることを特徴とする請求項のいずれか1項記載の音楽信号の時間軸圧伸装置。
JP2000183499A 2000-06-19 2000-06-19 音楽信号の時間軸圧伸方法及び装置 Expired - Fee Related JP4581190B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000183499A JP4581190B2 (ja) 2000-06-19 2000-06-19 音楽信号の時間軸圧伸方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000183499A JP4581190B2 (ja) 2000-06-19 2000-06-19 音楽信号の時間軸圧伸方法及び装置

Publications (2)

Publication Number Publication Date
JP2002006899A JP2002006899A (ja) 2002-01-11
JP4581190B2 true JP4581190B2 (ja) 2010-11-17

Family

ID=18684078

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000183499A Expired - Fee Related JP4581190B2 (ja) 2000-06-19 2000-06-19 音楽信号の時間軸圧伸方法及び装置

Country Status (1)

Country Link
JP (1) JP4581190B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006517679A (ja) * 2003-02-12 2006-07-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ再生装置、方法及びコンピュータプログラム
JP2006293979A (ja) * 2005-03-18 2006-10-26 Advanced Telecommunication Research Institute International コンテンツ提供システム
JP2009300622A (ja) * 2008-06-11 2009-12-24 Korg Inc 演奏開始時刻予想装置
JP4537490B2 (ja) * 2009-09-07 2010-09-01 株式会社ソニー・コンピュータエンタテインメント オーディオ再生装置およびオーディオ早送り再生方法
JP6011064B2 (ja) * 2012-06-26 2016-10-19 ヤマハ株式会社 自動演奏装置及びプログラム
FR2992766A1 (fr) * 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
JP6090204B2 (ja) * 2014-02-21 2017-03-08 ヤマハ株式会社 音響信号発生装置
JP6350693B2 (ja) * 2017-02-08 2018-07-04 ヤマハ株式会社 音響信号発生装置
JP6350692B2 (ja) * 2017-02-08 2018-07-04 ヤマハ株式会社 音響信号発生装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962257A (ja) * 1995-08-25 1997-03-07 Yamaha Corp 楽音信号処理装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07111625B2 (ja) * 1990-03-30 1995-11-29 株式会社河合楽器製作所 演奏情報の再生装置
JP3252497B2 (ja) * 1992-12-02 2002-02-04 ヤマハ株式会社 波形データ編集装置
JP3675184B2 (ja) * 1997-09-30 2005-07-27 ヤマハ株式会社 波形形成装置及び方法
JPH11305795A (ja) * 1998-04-24 1999-11-05 Victor Co Of Japan Ltd 音声信号処理装置及び情報媒体
JP4278733B2 (ja) * 1998-07-21 2009-06-17 ローランド株式会社 波形データの演奏制御装置
JP4170524B2 (ja) * 1999-07-08 2008-10-22 ローランド株式会社 波形再生装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962257A (ja) * 1995-08-25 1997-03-07 Yamaha Corp 楽音信号処理装置

Also Published As

Publication number Publication date
JP2002006899A (ja) 2002-01-11

Similar Documents

Publication Publication Date Title
JP3546755B2 (ja) リズム音源信号の時間軸圧伸方法及び装置
US6205420B1 (en) Method and device for instantly changing the speed of a speech
US7250566B2 (en) Evaluating and correcting rhythm in audio data
TW518557B (en) Continuously variable time scale modification of digital audio signals
JP4300641B2 (ja) マルチトラック音源信号の時間軸圧伸方法及び装置
JP4581190B2 (ja) 音楽信号の時間軸圧伸方法及び装置
US6801898B1 (en) Time-scale modification method and apparatus for digital signals
JP3465628B2 (ja) オーディオ信号の時間軸圧伸方法及び装置
KR100303913B1 (ko) 음성처리방법, 음성처리장치 및 기록재생장치
US8635077B2 (en) Apparatus and method for expanding/compressing audio signal
JP3430974B2 (ja) ステレオ信号の時間軸圧伸方法及び装置
JP2001228896A (ja) 欠落音声パケットの代替置換方式
JP3654117B2 (ja) 時間軸方向における楽音波形信号の伸縮方法
JP2905191B1 (ja) 信号処理装置、信号処理方法および信号処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0962257A (ja) 楽音信号処理装置
JP2007094004A (ja) 音声信号の時間軸圧伸方法および音声信号の時間軸圧伸装置
JP2006220806A (ja) 音声信号処理装置,音声信号処理プログラム,音声信号処理方法
JP4364544B2 (ja) 音声信号処理装置及びその方法
JP3422716B2 (ja) 話速変換方法および装置および話速変換プログラムを格納した記録媒体
US20070269056A1 (en) Method and Apparatus for Audio Signal Expansion and Compression
JP2002287758A (ja) 波形編集方法および波形編集装置
JP2002297200A (ja) 話速変換装置
JP4471780B2 (ja) 音声信号処理装置及びその方法
JP6424462B2 (ja) オーディオ信号の時間軸圧縮伸張方法および装置並びにプログラム
JP2004317533A (ja) 音声信号処理装置及びその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070424

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100803

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100816

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130910

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees