JP4924513B2 - Time stretch system and program - Google Patents

Time stretch system and program Download PDF

Info

Publication number
JP4924513B2
JP4924513B2 JP2008092724A JP2008092724A JP4924513B2 JP 4924513 B2 JP4924513 B2 JP 4924513B2 JP 2008092724 A JP2008092724 A JP 2008092724A JP 2008092724 A JP2008092724 A JP 2008092724A JP 4924513 B2 JP4924513 B2 JP 4924513B2
Authority
JP
Japan
Prior art keywords
time
harmonic
component
components
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008092724A
Other languages
Japanese (ja)
Other versions
JP2009244704A (en
Inventor
友彦 佐藤
秀仁 北村
典昭 阿瀬見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP2008092724A priority Critical patent/JP4924513B2/en
Publication of JP2009244704A publication Critical patent/JP2009244704A/en
Application granted granted Critical
Publication of JP4924513B2 publication Critical patent/JP4924513B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a time stretch system and program capable of achieving satisfactory time stretch of a musical piece without causing sense of incongruity auditorily in each of nonharmonic component and harmonic component. <P>SOLUTION: In the time stretch system, the harmonic component constituting a harmonic structure and the nonharmonic component constituting no harmonic structure are first extracted from components of the musical piece being an object (s120, s130), the nonharmonic component is constituted by rearranging each of the divided components when divided per unit section along time base at front and rear positions on the time base in accordance with time stretch magnification (s150), and the harmonic component is time-stretched in accordance with time stretch magnification to extend or contract its waveform along the time base (s140). The nonharmonic component and the harmonic component time-stretched by separate means in this way are synthesized to apply time stretch to the musical piece being the object (s160). <P>COPYRIGHT: (C)2010,JPO&amp;INPIT

Description

本発明は、対象楽曲を所定のタイムストレッチ倍率によりタイムストレッチさせるためのタイムストレッチシステムに関する。   The present invention relates to a time stretch system for time-stretching a target music piece with a predetermined time stretch magnification.

従来から、対象楽曲をタイムストレッチさせるにあたっては、対象楽曲の成分(波形)を時間軸に沿って単位区間毎に分割した場合における各分割した成分それぞれの時間軸上の位置を、タイムストレッチ倍率に応じて前後した位置に配置し直す、といった技術が用いられている(特許文献1参照)。
特許第3221293号公報
Conventionally, when time-stretching a target song, when the component (waveform) of the target song is divided into unit sections along the time axis, the position on the time axis of each divided component is set as the time stretch magnification. The technique of rearranging in the back-and-forth position accordingly is used (see Patent Document 1).
Japanese Patent No. 3212293

上記技術は、対象楽曲の成分そのものを時間軸上で配置し直すことにより、調波構造をなしていない非調波成分,具体的にいえば急峻にレベルが変化する打楽器音のような成分において、高い再現性を維持しつつタイムストレッチを実現することができる。   The above-mentioned technique is used for non-harmonic components that do not have a harmonic structure, specifically, components such as percussion instrument sounds whose levels change sharply by rearranging the components of the target music on the time axis. It is possible to achieve time stretching while maintaining high reproducibility.

しかし、調波構造をなしている調波成分,具体的にいえばレベルが緩やかに変化する音声のような成分においては、例えば、単位区間における分割した成分それぞれの間に形成される無音部分や、分割した成分それぞれの重複部分に施されるクロスフェード処理の結果が、意図しない聴覚上の違和感を発生させる要因となってしまう恐れがある。   However, in a harmonic component having a harmonic structure, specifically, a voice-like component whose level changes gradually, for example, a silent part formed between each divided component in a unit interval, The result of the cross-fade process performed on the overlapping portions of the divided components may cause unintended auditory discomfort.

本発明はこのような課題を解決するためになされたものであり、その目的は、楽曲のタイムストレッチを、非調波成分および調波成分それぞれにおいて聴覚上の違和感がないように実現するための技術を提供することである。   The present invention has been made to solve such a problem, and its purpose is to realize time stretching of music so that there is no sense of incongruity in hearing in each of the non-harmonic component and the harmonic component. Is to provide technology.

上記課題を解決するためには、対象楽曲を所定のタイムストレッチ倍率によりタイムストレッチさせるためのタイムストレッチシステムを以下に示す第1の構成のようにするとよい。
In order to solve the above problem, a time stretch system for time-stretching the object music pieces in a predetermined time stretching magnification may be like the first configuration shown below.

この構成においては、前記対象楽曲における成分のスペクトル分布に基づいて、その成分のうちの調波構造をなしている調波成分を抽出する調波抽出手段と、前記対象楽曲の成分から前記調波抽出手段により抽出された調波成分を除去することにより、前記対象楽曲の成分のうちの調波構造をなしていない非調波成分を抽出する非調波抽出手段と、該非調波抽出手段により抽出された非調波成分に基づいて、該非調波成分を時間軸に沿って単位区間毎に分割した場合における各分割した成分(以降「分割非調波成分」という)それぞれの時間軸上の位置を、前記タイムストレッチ倍率に応じて前後させた位置に配置し直す成分再配置手段と、前記調波抽出手段により抽出された調波成分を、その波形が時間軸に沿って伸縮するように前記タイムストレッチ倍率に応じてタイムストレッチさせる波形伸縮手段と、該波形伸縮手段によりタイムストレッチされる前またはタイムストレッチされた後の調波成分について、該調波成分のピッチを前記タイムストレッチ倍率に応じて低くまたは高くするピッチシフト手段と、前記成分再配置手段により分割非調波成分が配置し直されてなる非調波成分に、前記波形伸縮手段によるタイムストレッチおよび前記ピッチシフト手段によるピッチシフトがされてなる調波成分を、それぞれの時間軸が一致するように合成する成分合成手段と、を備えている。   In this configuration, based on the spectral distribution of the components in the target music, harmonic extraction means for extracting the harmonic components having the harmonic structure of the components, and the harmonics from the components of the target music By removing the harmonic components extracted by the extracting means, the non-harmonic extracting means for extracting non-harmonic components that do not have a harmonic structure among the components of the target music, and the non-harmonic extracting means Based on the extracted non-harmonic component, the non-harmonic component is divided for each unit section along the time axis, and each divided component (hereinafter referred to as “divided sub-harmonic component”) on each time axis The component rearrangement means for rearranging the position to a position moved back and forth according to the time stretch magnification, and the harmonic component extracted by the harmonic extraction means so that the waveform expands and contracts along the time axis. Thailand Waveform expansion / contraction means for time-stretching according to the stretch magnification, and harmonic components before or after time-stretching by the waveform expansion / contraction means, the pitch of the harmonic component is lowered according to the time stretch magnification. Alternatively, the time shift by the waveform expansion / contraction means and the pitch shift by the pitch shift means are added to the pitch shift means to be increased and the non-harmonic component in which the divided subharmonic components are rearranged by the component rearrangement means. Component synthesizing means for synthesizing such harmonic components so that their time axes coincide with each other.

このような構成のタイムストレッチシステムでは、まず、対象楽曲の成分から調波構造をなす調波成分と、調波構造をなさない非調波成分と、が抽出される。その後、非調波成分は、時間軸に沿って単位区間毎に分割した場合における各分割した成分それぞれが、タイムストレッチ倍率に応じて前後した時間軸上の位置に配置し直され、調波成分は、その波形が時間軸に沿って伸縮するようにタイムストレッチ倍率に応じてタイムストレッチされる。そして、こうして別々の手法によりタイムストレッチされた非調波成分および調波成分が合成されることにより、対象楽曲へのタイムストレッチが施される。   In the time stretch system having such a configuration, first, a harmonic component having a harmonic structure and a non-harmonic component not having a harmonic structure are extracted from the components of the target music. After that, the non-harmonic component is rearranged at the position on the time axis that has been divided according to the time stretch magnification when each divided component is divided for each unit section along the time axis. Is time stretched according to the time stretch magnification so that the waveform expands and contracts along the time axis. Then, the non-harmonic component and the harmonic component that have been time-stretched by different methods are combined to perform time-stretching on the target music.

このように、上記構成では、対象楽曲の成分のうちの非調波成分に対し、単位区間毎に分割した成分それぞれの時間軸上の位置を配置し直すタイムストレッチが実施される一方、調波成分に対し、波形を時間軸に沿って伸縮させるタイムストレッチが実施される。   As described above, in the above configuration, time stretching is performed to rearrange the position on the time axis of each component divided for each unit section with respect to the non-harmonic component of the components of the target music. A time stretch is performed on the component to expand and contract the waveform along the time axis.

非調波成分は、具体的にいえば急峻にレベルが変化する打楽器音のような成分であり、その急峻なレベルの変化が上記単位区間内に現れやすいため、それら成分の時間軸上の位置を配置し直したとしても、その急峻なレベル変化を維持した再現性の高いタイムストレッチを実施することができる。   Specifically, the non-harmonic component is a component such as a percussion instrument sound whose level changes abruptly, and the change of the steep level is likely to appear in the unit interval. Even if the position is rearranged, time stretch with high reproducibility while maintaining the steep level change can be performed.

それに対し、調波成分は、具体的にいえばレベルが緩やかに変化する音声のような成分であるため、このような成分を単位区間毎に分割してしまうと、そのような変化の傾向が維持されなくなってしまう結果、意図しない聴覚上の違和感を発生させる要因となってしまう恐れがある。   On the other hand, the harmonic component is, specifically speaking, a sound-like component whose level changes slowly, and if such a component is divided into unit sections, such a change tendency tends to occur. As a result of not being maintained, there is a risk that unintentional sense of incongruity may occur.

ここでいう「聴覚上の違和感」は、タイムストレッチ倍率が1より大きければ、単位区間における分割した成分それぞれの間に無音部分が形成されてしまい、その区間において音声が存在しないような状態となってしまうことにより発生する。また、タイムストレッチ倍率が1未満であれば、単位区間における分割した成分それぞれの重複部分に施されるクロスフェード処理によって、緩やかなレベル変化が維持されなくなってしまうことにより発生する。   As used herein, “auditory discomfort” means that if the time stretch ratio is greater than 1, a silent portion is formed between each of the divided components in the unit section, and there is no sound in that section. It is generated by Further, if the time stretch ratio is less than 1, it occurs because the moderate level change is not maintained by the cross-fade process applied to the overlapping portions of the divided components in the unit section.

このような問題に対し、上記構成では、対象楽曲の成分のうちの調波成分に対して、単位区間毎に分割した成分それぞれの時間軸上の位置を配置し直す手法ではなく、波形を伸縮させる手法にてタイムストレッチを実施するようにしている。   To deal with such problems, the above configuration is not a method of rearranging the position on the time axis of each component divided for each unit section with respect to the harmonic component of the components of the target music, but expanding and contracting the waveform. The time stretch is carried out by the method to make it.

このタイムストレッチであれば、波形の形状が時間軸に沿って伸縮するだけであるため、レベルが緩やかに変化する調波成分において、その時間軸に沿った変化の傾向を維持したままでタイムストレッチが実現される結果、意図しない聴覚上の違和感が発生することを防止することができる。   With this time stretch, the waveform shape only expands and contracts along the time axis, so the harmonic component whose level changes slowly maintains the trend of change along the time axis while maintaining the time stretch. As a result, it is possible to prevent an unintended sense of incongruity from occurring.

このように、上記構成では、対象楽曲の成分における非調波成分,調波成分それぞれに適した手法によるタイムストレッチを実施することにより、対象楽曲のタイムストレッチを、非調波成分および調波成分それぞれにおいて聴覚上の違和感がないようにして実現することができる。   As described above, in the above configuration, the time stretch of the target music is converted to the non-harmonic component and the harmonic component by performing time stretch by a method suitable for each of the non-harmonic component and the harmonic component in the component of the target music. Each can be realized without any sense of incongruity in hearing.

この構成において、対象楽曲における成分から調波成分を抽出するための手法は特に限定されないが、例えば、対象楽曲の成分を示す時間軸に沿った波形をフーリエ変換などで周波数解析して得られるスペクトル分布のうち、スペクトル強度のピークが周期的に表れている(調波構造をなしている)成分を調波成分として抽出する、といったことが考えられる。   In this configuration, the method for extracting the harmonic component from the component in the target music is not particularly limited, but, for example, a spectrum obtained by frequency analysis of the waveform along the time axis indicating the component of the target music by Fourier transform or the like In the distribution, it is conceivable to extract, as a harmonic component, a component in which a spectral intensity peak appears periodically (having a harmonic structure).

また、調波成分を波形の伸縮によりタイムストレッチする具体的な構成としては、例えば、対象楽曲が所定のサンプリング周波数Fsで所定の楽曲をサンプリングしてなる楽曲データで示される場合には、以下に示す第2の構成のようにするとよい。
In addition, as a specific configuration for time-stretching the harmonic component by expanding and contracting the waveform, for example, when the target music is represented by music data obtained by sampling a predetermined music at a predetermined sampling frequency Fs, better to a second like configuration shown.

この構成においては、前記調波抽出手段により抽出された調波成分を、前記サンプリング周波数Fsに前記タイムストレッチ倍率Aと同じ倍率を積算してなるサンプリング周波数Fs・Aへと周波数変換する周波数変換手段,を備えている。そして、前記波形伸縮手段は、前記周波数変換手段により周波数変換された調波成分を、その波形が時間軸に沿って伸縮するようにタイムストレッチさせる。   In this configuration, the frequency conversion means for frequency-converting the harmonic component extracted by the harmonic extraction means to the sampling frequency Fs · A obtained by integrating the sampling frequency Fs by the same magnification as the time stretch magnification A. , Is provided. The waveform expansion / contraction means time-stretches the harmonic component frequency-converted by the frequency conversion means so that the waveform expands and contracts along the time axis.

この構成であれば、調波成分のサンプリング周波数を、タイムストレッチ倍率Aと同じ倍率を積算してなるサンプリング周波数Fs・Aへと周波数変換したうえで、その調波成分のタイムストレッチを実施することができる。   With this configuration, the harmonic component sampling frequency is converted to the sampling frequency Fs · A obtained by integrating the same magnification as the time stretch magnification A, and then the harmonic component is time stretched. Can do.

調波成分をタイムストレッチすると、タイムストレッチ倍率Aが1より大きければ、その成分における周波数分布が1/A(=1より小さい)倍に狭まって見かけ上のサンプリング周波数が低くなる一方、タイムストレッチ倍率Aが1未満であれば、その成分における周波数分布が1/A(=1より大きい)倍に拡がって見かけ上のサンプリング周波数が高くなる。   When the harmonic component is time stretched, if the time stretch magnification A is greater than 1, the frequency distribution in that component is narrowed to 1 / A (less than 1) times and the apparent sampling frequency is lowered, while the time stretch magnification is If A is less than 1, the frequency distribution in that component is expanded by 1 / A (greater than = 1) and the apparent sampling frequency is increased.

上記構成では、調波成分のタイムストレッチに先立ち、そのサンプリング周波数FsをFs・Aへと周波数変換しておくことにより、このタイムストレッチに起因する見かけ上のサンプリング周波数の変化を相殺することができる。   In the above configuration, by changing the sampling frequency Fs to Fs · A prior to the time stretch of the harmonic component, the change in the apparent sampling frequency due to the time stretch can be offset. .

例えば、タイムストレッチ倍率Aが1より大きい場合には、タイムストレッチにより見かけ上のサンプリング周波数が1/A(=1未満)倍に低くなるところ、このサンプリング周波数をあらかじめサンプリング周波数Fs・Aへと周波数変換(アップサンプリング)しておくことで、タイムストレッチ後のサンプリング周波数が結果的に元の周波数Fsに戻す(Fs・A・1/A=Fs)ことができる。   For example, when the time stretch ratio A is greater than 1, the apparent sampling frequency is lowered to 1 / A (less than 1) times due to the time stretch, and this sampling frequency is set to the sampling frequency Fs · A in advance. By converting (up-sampling), the sampling frequency after time stretching can be returned to the original frequency Fs as a result (Fs · A · 1 / A = Fs).

一方、タイムストレッチ倍率Aが1未満の場合では、そのタイムストレッチにより見かけ上のサンプリング周波数が1/A(=1より大きい)倍と高くなるところ、このサンプリング周波数をあらかじめサンプリング周波数Fs・Aへと周波数変換(ダウンサンプリング)しておくことで、タイムストレッチ後のサンプリング周波数が結果的に元の周波数Fsに戻す(Fs・A・1/A=Fs)ことができる。   On the other hand, when the time stretch magnification A is less than 1, the apparent sampling frequency becomes as high as 1 / A (greater than 1) times due to the time stretch, and this sampling frequency is changed to the sampling frequency Fs · A in advance. By performing frequency conversion (down sampling), the sampling frequency after time stretching can be returned to the original frequency Fs as a result (Fs · A · 1 / A = Fs).

ところで、上記構成においてタイムストレッチ倍率が1未満である場合には、そのタイムストレッチ(サンプリング周波数変換および波形の時間軸に沿った伸縮)によって、周波数分布がサンプリング周波数Fsの1/2以上にまで拡がってしまい、これがいわゆる折り返しノイズとなってしまう恐れがある。   By the way, when the time stretch magnification is less than 1 in the above configuration, the frequency distribution is expanded to 1/2 or more of the sampling frequency Fs by the time stretch (sampling frequency conversion and expansion / contraction along the time axis of the waveform). This may cause so-called aliasing noise.

このようなノイズが発生しないようにするためには、例えば、上記構成を以下に示す第3の構成のようにしておくことが考えられる。
この構成おいては、前記タイムストレッチ倍率が1未満である場合に、前記対象楽曲の成分から規定される周波数Fc(=(A・Fs)/2)以上の周波数成分を除去するフィルタリング手段,を備えている。そして、前記周波数変換手段は、前記フィルタリング手段により周波数Fc以上の周波数成分が除去されてなる対象楽曲に基づいて周波数変換を行う。
In order for such noise is prevented from occurring, for example, it is conceivable to have as a third configuration shown below the structure.
In this configuration, when the time stretch magnification is less than 1, filtering means for removing a frequency component having a frequency Fc (= (A · Fs) / 2) or more defined from the component of the target musical piece, I have. Then, the frequency conversion means performs frequency conversion based on the target musical piece obtained by removing frequency components equal to or higher than the frequency Fc by the filtering means.

この構成であれば、タイムストレッチ倍率が1未満である場合には、あらかじめ調波成分のうち、周波数Fc(=(A・Fs)/2)以上の周波数成分が除去される。
この周波数Fc以上の周波数帯域は、タイムストレッチ倍率Aにてタイムストレッチする過程で周波数分布がサンプリング周波数Fsの1/2以上に拡がりうる帯域であるため、上記構成のように周波数Fc以上の周波数成分をあらかじめ除去しておくことにより、タイムストレッチの過程で拡がった周波数分布において周波数成分が干渉しないようにすることで、周波数分布が拡がることによる折り返しノイズの発生を防止できる。
With this configuration, when the time stretch magnification is less than 1, a frequency component having a frequency Fc (= (A · Fs) / 2) or more is previously removed from the harmonic components.
Since the frequency band above the frequency Fc is a band in which the frequency distribution can be expanded to 1/2 or more of the sampling frequency Fs in the process of time stretching at the time stretch magnification A, the frequency component above the frequency Fc as in the above configuration. Is removed in advance so that frequency components do not interfere with each other in the frequency distribution expanded in the process of time stretching, thereby preventing the occurrence of aliasing noise due to the expansion of the frequency distribution.

また、上述した折り返しノイズが発生しないようにするためには、上記構成を以下に示す第4の構成のようにしておくことも考えられる。
この構成においては、前記タイムストレッチ倍率が1未満である場合に、前記調波抽出手段により抽出された調波成分を、前記サンプリング周波数Fsに前記タイムストレッチ倍率Aの逆数と同じ倍率を積算してなるサンプリング周波数Fs/Aへと周波数変換する事前変換手段,を備えている。そして、前記波形伸縮手段は、前記タイムストレッチ倍率が1未満である場合、前記事前変換手段により周波数変換された調波成分を、その波形が時間軸に沿って伸縮するように前記タイムストレッチ倍率に応じてタイムストレッチさせる。
Further, in order to aliasing noise described above does not occur, it is conceivable to have as a fourth configuration shown below the structure.
In this configuration, when the time stretch magnification is less than 1, the harmonic component extracted by the harmonic extraction means is multiplied by the same magnification as the reciprocal of the time stretch magnification A to the sampling frequency Fs. Pre-conversion means for converting the frequency to the sampling frequency Fs / A. When the time stretch magnification is less than 1, the waveform expansion / contraction means has the time stretch magnification such that the harmonic component frequency-converted by the prior conversion means is expanded and contracted along the time axis. Depending on the time stretch.

さらに、前記タイムストレッチ倍率が1未満である場合に、前記波形伸縮手段によるタイムストレッチおよび前記ピッチシフト手段によるピッチシフトがなされてなる調波成分を、そのサンプリング周波数に前記タイムストレッチ倍率Aと同じ倍率を積算してなるサンプリング周波数へと周波数変換する事後変換手段,を備えている。そして、前記成分合成手段は、前記成分再配置手段により分割非調波成分が配置し直されてなる非調波成分に、前記事後変換手段により周波数変換された調波成分を、それぞれの時間軸が一致するように合成する。   Further, when the time stretch magnification is less than 1, the harmonic component formed by the time stretch by the waveform expansion / contraction means and the pitch shift by the pitch shift means has the same magnification as the time stretch magnification A at the sampling frequency. And post-conversion means for converting the frequency to a sampling frequency obtained by integrating. Then, the component synthesizing unit converts the harmonic component frequency-converted by the posterior converting unit into the non-harmonic component obtained by rearranging the divided non-harmonic component by the component rearranging unit, respectively. Synthesize so that the axes match.

この構成であれば、タイムストレッチ倍率が1未満である場合には、タイムストレッチに先立ち、あらかじめ調波成分のサンプリング周波数が1/A倍に周波数変換され、そのタイムストレッチ後に調波成分のサンプリング周波数がA倍に周波数変換される。   With this configuration, when the time stretch magnification is less than 1, the harmonic component sampling frequency is converted to 1 / A times in advance prior to the time stretch, and after the time stretch, the harmonic component sampling frequency is converted. Is frequency converted to A times.

タイムストレッチに先立ってサンプリング周波数を1/A(=1より大きい)倍に周波数変換した場合、その倍率に応じて周波数分布が拡がることとなるが、サンプリング周波数を変換したのみであるため、そのサンプリング周波数Fs/Aの1/2以下の一部帯域に周波数成分が分布していない状態となる。これにより、タイムストレッチの過程で周波数分布が拡がったとしても、その拡がった周波数成分が干渉することがなくなるため、周波数分布が拡がることによる折り返しノイズの発生を防止することができる。   If the sampling frequency is frequency converted to 1 / A (greater than 1) times prior to time stretching, the frequency distribution will be expanded according to the magnification, but since the sampling frequency is only converted, the sampling is performed. The frequency components are not distributed in a partial band of 1/2 or less of the frequency Fs / A. As a result, even if the frequency distribution is expanded in the process of time stretching, the expanded frequency components do not interfere with each other, so that the occurrence of aliasing noise due to the expanded frequency distribution can be prevented.

そして、タイムストレッチ後に再度調波成分のサンプリング周波数をA(=1未満)倍に周波数変換することにより、そのタイムストレッチ前後におけるサンプリング周波数を一致させることができる。   Then, the sampling frequency before and after the time stretch can be matched by frequency-converting the sampling frequency of the harmonic component again by A (less than 1) times after the time stretch.

なお、この構成においては、事前に調波成分のサンプリング周波数が1/A倍に周波数変換された後、タイムストレッチの過程でA倍に周波数変換されており、その時点で両者の周波数変換の効果が相殺されているということができる。そのため、これら一連の周波数変換についてはその実施を省略することとしてもよく、そのためには、上記第1の構成を以下に示すようにした第5の構成のようにすることが考えられる。
In this configuration, the sampling frequency of the harmonic component is frequency-converted to 1 / A times in advance, and then frequency-converted to A times in the process of time stretching. Can be said to be offset. Therefore, for the series of frequency conversion it may be possible to omit the implementation. For this purpose, it is conceivable to make the fifth configuration in which as shown below the first configuration.

この構成では、前記対象楽曲が、所定のサンプリング周波数Fsで所定の楽曲をサンプリングしてなる楽曲データで示されるものである場合において、前記タイムストレッチ倍率が1未満である場合に、前記波形伸縮手段によるタイムストレッチおよび前記ピッチシフト手段によるピッチシフトがなされてなる調波成分を、前記サンプリング周波数Fsが前記タイムストレッチ倍率Aと同じ倍率のサンプリング周波数Fs’’’(=Fs’’・A=Fs)へと周波数変換する事後変換手段,を備えている。そして、前記成分合成手段は、前記成分再配置手段により分割非調波成分が配置し直されてなる非調波成分に、前記事後変換手段により周波数変換された調波成分を、それぞれの時間軸が一致するように合成する。   In this configuration, when the target music is indicated by music data obtained by sampling a predetermined music at a predetermined sampling frequency Fs, the waveform expansion / contraction means is used when the time stretch magnification is less than 1. The harmonic component formed by the time stretch by the pitch shift and the pitch shift by the pitch shift means is the sampling frequency Fs ′ ″ (= Fs ″ · A = Fs) having the same sampling frequency Fs as the time stretch magnification A. And post-conversion means for frequency conversion to Then, the component synthesizing unit converts the harmonic component frequency-converted by the posterior converting unit into the non-harmonic component obtained by rearranging the divided non-harmonic component by the component rearranging unit, respectively. Synthesize so that the axes match.

この構成であれば、一連の周波数変換を省略して処理負担を軽減しつつ、上記第4の構成と同様の作用効果を得ることができる。
ところで、上述したように、タイムストレッチ倍率が1未満である場合には、非調波成分のタイムストレッチに際して、第6の構成のように構成するとよい。
With this configuration, it is possible to obtain the same effects as the fourth configuration while omitting a series of frequency conversions and reducing the processing load.
Incidentally, as described above, when time stretch ratio is less than 1, when time stretching of the non-harmonic component, may sixth configured as Configuring.

この構成において、前記成分再配置手段は、前記タイムストレッチ倍率が1未満である場合、前記分割非調波成分それぞれの時間軸上の位置を、前記タイムストレッチ倍率に応じて前後させた位置に配置し直すと共に、時間軸上で隣接する前記分割非調波成分同士をクロスフェードさせる。   In this configuration, when the time stretch magnification is less than 1, the component rearrangement means arranges the position on the time axis of each of the divided non-harmonic components at a position moved back and forth according to the time stretch magnification. At the same time, the divided subharmonic components adjacent on the time axis are cross-faded.

この構成であれば、タイムストレッチ倍率が1未満であり、単位区間毎に分割した非調波成分(分割非調波成分)それぞれが時間軸上で重なってしまうような場合でも、それら分割非調波成分同士の重複部分をクロスフェードにより接続することができる。   With this configuration, even when the time stretch magnification is less than 1 and each of the subharmonic components (divided subharmonic components) divided for each unit section overlaps on the time axis, the divided non-adjustment The overlapping portions of the wave components can be connected by crossfading.

また、上記課題を解決するためには、上記第1〜第6のいずれかの構成におけるピッチシフトシステムの備える全ての手段としてコンピュータシステムを機能させるためのプログラムとしてもよい。このプログラムにより制御されるコンピュータシステムであれば、上記第1〜第6のいずれかの構成におけるタイムストレッチシステムと同様の作用,効果を得ることができる。 Further, in order to solve the above problem may be a program for causing a computer system as all means comprising pitch shift system in the first to sixth any one of the. If it is a computer system controlled by this program, the same operation and effect as the time stretch system in any one of the first to sixth configurations can be obtained.

なお、上述したプログラムは、コンピュータシステムによる処理に適した命令の順番付けられた列からなるものであって、各種記録媒体や通信回線を介してタイムストレッチシステムや、これを利用するユーザに提供されるものである。   The above-described program is composed of an ordered sequence of instructions suitable for processing by a computer system, and is provided to a time stretch system or a user who uses this through various recording media and communication lines. Is.

以下に本発明の実施形態を図面と共に説明する。
(1)ハードウェア構成
タイムストレッチシステム1は、図1に示すように、システム全体を制御する制御部11,各種情報を記憶する記憶部13,ネットワーク2を介した通信を制御する通信部15,キーボードやディスプレイなどからなるユーザインタフェース(U/I)部17,記録メディアを介して情報を入出力するメディアドライブ19などを備えた周知のコンピュータシステムである。
Embodiments of the present invention will be described below with reference to the drawings.
(1) Hardware Configuration As shown in FIG. 1, the time stretch system 1 includes a control unit 11 that controls the entire system, a storage unit 13 that stores various information, a communication unit 15 that controls communication via the network 2, This is a known computer system including a user interface (U / I) unit 17 including a keyboard and a display, a media drive 19 for inputting and outputting information via a recording medium, and the like.

このタイムストレッチシステム1は、ユーザインタフェース部17または通信部15を介して外部から所定の指令を受けた際、制御部11が記憶部13に記憶されたプログラムに従って各種処理を実行することによって、本発明のタイムストレッチシステムとしての機能を発揮する。   When the time stretch system 1 receives a predetermined command from the outside via the user interface unit 17 or the communication unit 15, the control unit 11 executes various processes according to a program stored in the storage unit 13, thereby It functions as a time stretch system of the invention.

なお、本実施形態では、タイムストレッチシステム1が単体のコンピュータシステムにより構成されているが、それぞれ協調して動作する複数のコンピュータシステムにより構成できることはいうまでもない。
(2)制御部11による処理
以下に、制御部11が記憶部13に記憶されたプログラムに従って実行する各種処理手順を説明する。
(2−1)タイムストレッチ処理
はじめに、ユーザインタフェース部17を介して規定の操作が行われた,または,通信部15を介してネットワーク2からの指令を受けた際に起動されるタイムストレッチ処理の処理手順を図2に基づいて説明する。
In the present embodiment, the time stretch system 1 is configured by a single computer system, but it is needless to say that it can be configured by a plurality of computer systems that operate in cooperation with each other.
(2) Processing by Control Unit 11 Hereinafter, various processing procedures executed by the control unit 11 according to a program stored in the storage unit 13 will be described.
(2-1) Time Stretching Process First, a time stretching process started when a prescribed operation is performed via the user interface unit 17 or when a command is received from the network 2 via the communication unit 15. The processing procedure will be described with reference to FIG.

このタイムストレッチ処理が起動されると、まず、所定の楽曲(以降「対象楽曲」という)を再生するための楽曲データ(入力楽曲データ)が取得される(s110)。ここでは、ユーザインタフェース部17への操作を介して指定された入力楽曲データが記憶部13やメディアドライブ19(つまり記録メディア)から取得される、または、通信部15を介して指令と共に受信された入力楽曲データが取得される。   When this time stretching process is activated, first, music data (input music data) for reproducing a predetermined music (hereinafter referred to as “target music”) is acquired (s110). Here, the input music data designated through the operation on the user interface unit 17 is acquired from the storage unit 13 or the media drive 19 (that is, the recording medium) or received together with the command through the communication unit 15. Input music data is acquired.

次に、上記s110にて取得された楽曲データで示される対象楽曲について、この対象楽曲における成分のうちの調波成分が抽出される(s120)。ここでは、対象楽曲の成分を示す時間軸に沿った波形をフーリエ変換などで周波数解析して得られるスペクトル分布のうち、スペクトル強度のピークが周期的に表れている(調波構造をなしている)成分が抽出され、これが時間軸に沿った波形に戻されることにより、この波形が調波成分として抽出される。   Next, for the target music indicated by the music data acquired in s110, the harmonic component of the components in the target music is extracted (s120). Here, in the spectrum distribution obtained by frequency analysis of the waveform along the time axis indicating the component of the target music by Fourier transform or the like, the peak of the spectrum intensity appears periodically (having a harmonic structure). ) Component is extracted and returned to a waveform along the time axis, whereby this waveform is extracted as a harmonic component.

次に、上記s110にて取得された楽曲データで示される対象楽曲について、この対象楽曲における成分のうちの非調波成分が抽出される(s130)。ここでは、対象楽曲の成分から上記s120にて抽出された調波成分を時間軸上で減算することにより、その減算結果たる成分が、対象楽曲の成分から調波成分を除去してなる非調波成分として抽出される。   Next, for the target music indicated by the music data acquired in s110, the non-harmonic component of the components in the target music is extracted (s130). Here, by subtracting the harmonic component extracted in s120 from the component of the target music on the time axis, the component resulting from the subtraction removes the harmonic component from the component of the target music. Extracted as a wave component.

次に、上記s120にて抽出された調波成分のタイムストレッチが後述する処理手順により実施される(s140)。ここでは、調波成分の波形が時間軸に沿って伸縮するようにタイムストレッチ倍率Aに応じたタイムストレッチが実施される。   Next, time stretching of the harmonic component extracted in s120 is performed by a processing procedure described later (s140). Here, the time stretch according to the time stretch magnification A is performed so that the waveform of the harmonic component expands and contracts along the time axis.

次に、上記s130にて抽出された非調波成分のタイムストレッチが実施される(s150)。ここでは、上記s130にて抽出された非調波成分に基づいて、この非調波成分を時間軸に沿って単位区間毎に分割した場合における各分割した成分(以降「分割非調波成分」という)それぞれの時間軸上の位置を、タイムストレッチ倍率Aに応じて前後させた位置に配置し直す、といった処理手順にてタイムストレッチが実施される。   Next, time stretching of the non-harmonic component extracted in s130 is performed (s150). Here, based on the non-harmonic component extracted in s130, each non-harmonic component is divided into unit sections along the time axis (hereinafter referred to as “divided non-harmonic component”). Time stretching is performed by a processing procedure such as rearranging each position on the time axis to a position moved back and forth according to the time stretch magnification A.

ここでのタイムストレッチに際し、タイムストレッチ倍率が1未満である場合には、分割非調波成分それぞれの時間軸上の位置が配置し直されると共に、時間軸上で隣接する分割非調波成分同士がクロスフェードにより接続されることとなる。   In the case of the time stretch here, when the time stretch magnification is less than 1, the positions on the time axis of each of the divided non-harmonic components are rearranged, and the divided non-harmonic components adjacent on the time axis are Are connected by cross-fading.

次に、上記s140にてタイムストレッチされた調波成分と、上記s150にてタイムストレッチされた非調波成分と、が時間軸に沿った波形として合成される(s160)。こうして、タイムストレッチ倍率Aによりタイムストレッチされた対象楽曲が生成される。   Next, the harmonic component time-stretched in s140 and the non-harmonic component time-stretched in s150 are combined as a waveform along the time axis (s160). In this way, the target music that has been time stretched by the time stretch magnification A is generated.

そして、上記s160にて合成された対象楽曲を示す楽曲データ(出力楽曲データ)が、本ピッチシフト処理の起動の契機となった指令に対する応答として返される(s170)。ここでは、ユーザインタフェース部17への操作を介して指定された記憶領域(記憶部13や記録メディア内の記憶領域)に対して出力楽曲データが記憶されたり、通信部15を介して入力楽曲データを送信してきた送信元に対して出力楽曲データが返信される。
(2−2)調波成分に対するタイムストレッチの実施手順「その1」
続いて、上記s140における調波成分に対するタイムストレッチの実施手順「その1」を図3に基づいて説明する。
Then, music data (output music data) indicating the target music synthesized in s160 is returned as a response to the command that triggered the start of this pitch shift process (s170). Here, the output music data is stored in the storage area (the storage area in the storage unit 13 or the recording medium) designated through the operation on the user interface unit 17, or the input music data is transmitted through the communication unit 15. The output music data is returned to the transmission source that has transmitted.
(2-2) Time stretch implementation procedure “1” for harmonic components
Next, the procedure “No. 1” for performing time stretching on the harmonic component in s140 will be described with reference to FIG.

ここでは、まず、ユーザインタフェース部17への操作を介して指定された、または、通信部15を介して指令と共に受信された「タイムストレッチ倍率(対象楽曲における元の再生時間に対するタイムストレッチ後における再生時間の割合)」が1未満であるか否かがチェックされる(s210)。   Here, first, the “time stretch magnification (reproduction after time stretch with respect to the original reproduction time in the target music) designated through the operation to the user interface unit 17 or received together with the command via the communication unit 15 is performed. It is checked whether or not “time ratio” ”is less than 1 (s210).

このs210でタイムストレッチ倍率が1未満であると判定された場合(s210:YES)、上記s120にて抽出された調波成分に含まれる周波数成分のうち、タイムストレッチ倍率Aおよび調波成分(または対象楽曲)のサンプリング周波数Fsから下記の式1により規定されるカットオフ周波数Fc以上の周波数成分が除去された後(s220)、プロセスが次の処理(s230)へ移行する。   If it is determined in s210 that the time stretch magnification is less than 1 (s210: YES), among the frequency components included in the harmonic component extracted in s120, the time stretch magnification A and the harmonic component (or After the frequency component equal to or higher than the cutoff frequency Fc defined by the following equation 1 is removed from the sampling frequency Fs of the target music) (s220), the process proceeds to the next process (s230).

このs220では、タイムストレッチ倍率Aおよびサンプリング周波数Fsにより規定されるカットオフ周波数Fc(=(A・Fs)/2)以上の周波数成分を除去する低域通過フィルタが生成され、これに基づいて周波数成分の除去が行われる。   In s220, a low-pass filter that removes a frequency component equal to or higher than the cutoff frequency Fc (= (A · Fs) / 2) defined by the time stretch magnification A and the sampling frequency Fs is generated, and the frequency is based on this. Component removal is performed.

このように、タイムストレッチ倍率Aが1未満である場合において、このs220により一部周波数成分が除去される様子を、図4(a),(b)に示す。
また、上記s210でタイムストレッチ倍率が1未満でないと判定された場合(s210:NO)、上記s220が行われることなく、プロセスが次の処理(s230)へ移行する。
As described above, when the time stretch magnification A is less than 1, a state in which some frequency components are removed by this s220 is shown in FIGS.
If it is determined in s210 that the time stretch ratio is not less than 1 (s210: NO), the process proceeds to the next process (s230) without performing s220.

次に、上記s120にて抽出された調波成分,または,上記s220を経て一部周波数成分が除去された調波成分のサンプリング周波数Fsが、タイムストレッチ倍率Aと同じ倍率を積算してなるサンプリング周波数Fs・Aへと周波数変換される(s230)。   Next, the sampling frequency Fs of the harmonic component extracted in s120 or the harmonic component from which the frequency component is partially removed through s220 is integrated by multiplying the same magnification as the time stretch magnification A. The frequency is converted to the frequency Fs · A (s230).

このように、サンプリング周波数が周波数変換された状態を、タイムストレッチ倍率Aが1未満である場合については図4(c)に示し、タイムストレッチ倍率Aが1未満でない場合については図5(a),(b)に示す。これら図からもわかるように、この周波数変換により、周波数分布が(Fs/2)・A以下の周波数帯域に狭まるまたは拡がることになる。具体的にいうと、タイムストレッチ倍率Aが1未満であれば、その値に応じて周波数帯域が狭まり、1未満でなければ、その値に応じて周波数帯域が拡がる。   In this way, the state where the sampling frequency is frequency-converted is shown in FIG. 4C when the time stretch magnification A is less than 1, and when the time stretch magnification A is not less than 1, the state shown in FIG. , (B). As can be seen from these figures, this frequency conversion narrows or widens the frequency distribution to a frequency band of (Fs / 2) · A or less. Specifically, if the time stretch magnification A is less than 1, the frequency band is narrowed according to the value, and if it is not less than 1, the frequency band is expanded according to the value.

次に、上記s230で周波数変換が施された調波成分について、その波形が時間軸に沿って伸縮するようにタイムストレッチ倍率Aに応じたタイムストレッチが実施される(s240)。   Next, a time stretch corresponding to the time stretch magnification A is performed on the harmonic component subjected to frequency conversion in s230 so that the waveform expands and contracts along the time axis (s240).

このように、タイムストレッチされた状態を、タイムストレッチ倍率Aが1未満である場合については図4(d)に示し、タイムストレッチ倍率Aが1未満でない場合については図5(c)に示す。この図からもわかるように、このタイムストレッチによる時間軸に沿った伸縮に伴い、周波数分布が拡がるまたは狭まることになる。具体的にいうと、タイムストレッチ倍率Aが1未満であれば、その値に応じて周波数帯域が拡がり、1未満でなければ、その値に応じて周波数帯域が狭まる。   As described above, the time stretched state is shown in FIG. 4D when the time stretch magnification A is less than 1, and is shown in FIG. 5C when the time stretch magnification A is not less than 1. As can be seen from this figure, the frequency distribution expands or narrows as the time stretches along the time axis. Specifically, if the time stretch magnification A is less than 1, the frequency band is expanded according to the value, and if it is not less than 1, the frequency band is decreased according to the value.

なお、こうして調波成分の周波数帯域が変化すると、それに応じてサンプリング周波数についても、そのタイムストレッチ倍率Aに応じた周波数Fs・A/A(=Fs)へと変化する。   When the frequency band of the harmonic component is changed in this way, the sampling frequency is also changed to the frequency Fs · A / A (= Fs) corresponding to the time stretch magnification A accordingly.

そして、上記s240にてタイムストレッチが施された調波成分に対して、そのピッチがタイムストレッチ倍率Aに応じて低くまたは高く修正すべくピッチシフトが施される(s250)。   Then, the harmonic shift component subjected to the time stretch in s240 is subjected to a pitch shift so that the pitch is corrected to be low or high according to the time stretch magnification A (s250).

ここでは、調波成分における周波数成分それぞれの周波数がタイムストレッチ倍率Aと同じ倍率を積算した値となるように、そのピッチが修正される。つまり、タイムストレッチ倍率Aが1未満であれば、周波数帯域が低周波側へと狭まるようにピッチが修正されるのに対し、タイムストレッチ倍率Aが1未満でなければ、周波数帯域が高周波側へと拡がるようにピッチが修正される。   Here, the pitch is corrected so that each frequency component in the harmonic component has a value obtained by integrating the same magnification as the time stretch magnification A. That is, if the time stretch magnification A is less than 1, the pitch is corrected so that the frequency band narrows to the low frequency side, whereas if the time stretch magnification A is not less than 1, the frequency band moves to the high frequency side. The pitch is corrected to expand.

このように、ピッチが修正された状態を、タイムストレッチ倍率Aが1未満である場合については図4(e)に示し、タイムストレッチ倍率Aが1未満でない場合については図5(d)に示す。
(2−3)調波成分に対するタイムストレッチの実施手順「その2」
続いて、上記s140における調波成分に対するタイムストレッチの実施手順「その2」を説明する。なお、上記「その1」と同様の処理手順については同様の符号を付してその具体的な説明を省略する。
Thus, the state in which the pitch is corrected is shown in FIG. 4E when the time stretch magnification A is less than 1, and is shown in FIG. 5D when the time stretch magnification A is not less than 1. .
(2-3) Time stretch execution procedure “2” for harmonic components
Subsequently, the implementation procedure “part 2” of time stretching for the harmonic component in s140 will be described. Note that the same processing steps as those of “No. 1” are denoted by the same reference numerals, and a detailed description thereof will be omitted.

この実施手順においては、上記「その1」と比べて、上記s230〜s250が行われる点は一致するが、上記s220が行われない点、および、タイムストレッチ倍率Aが1未満である場合にs230〜s250の事前,事後それぞれにサンプリング周波数を周波数変換するように構成されている点で相違する。   In this execution procedure, the points at which s230 to s250 are performed are the same as those of “No. 1”, but s230 is performed when s220 is not performed and the time stretch magnification A is less than 1. The difference is that the sampling frequency is frequency-converted before and after s250.

具体的にいえば、まず、上記s210でタイムストレッチ倍率が1未満であると判定された場合には(s210:YES)、上記s120にて抽出された調波成分のサンプリング周波数Fsが、タイムストレッチ倍率Aの逆数と同じ倍率を積算してなるサンプリング周波数Fs/Aへと周波数変換される(s212)。   Specifically, first, when it is determined in s210 that the time stretch magnification is less than 1 (s210: YES), the sampling frequency Fs of the harmonic component extracted in s120 is the time stretch. Frequency conversion is performed to a sampling frequency Fs / A obtained by integrating the same magnification as the reciprocal of the magnification A (s212).

このように、タイムストレッチ倍率Aが1未満である場合において、サンプリング周波数が周波数変換された状態を図7(b)に示す。
この後、こうして事前の周波数変換が施された調波成分について、上記「その1」と同様、周波数変換(s230),タイムストレッチ(s240),ピッチシフト(s250)がそれぞれ施される。この場合の周波数変換が施された状態,タイムストレッチが施された状態,および,ピッチシフトが施された状態を、図7(c)〜(e)に示す。
FIG. 7B shows a state where the sampling frequency is frequency-converted when the time stretch magnification A is less than 1 as described above.
Thereafter, the frequency component (s230), the time stretch (s240), and the pitch shift (s250) are respectively applied to the harmonic components subjected to the frequency conversion in advance as in the case of “No. 1”. FIGS. 7C to 7E show a state in which frequency conversion is performed, a state in which time stretching is performed, and a state in which pitch shift is performed in this case.

そして、そのs250によるピッチシフトが施された調波成分について、そのサンプリング周波数Fsが、タイムストレッチ倍率Aと同じ倍率を積算してなるサンプリング周波数Fsへと周波数変換される(s252)。   The sampling frequency Fs of the harmonic component subjected to the pitch shift by s250 is frequency-converted to a sampling frequency Fs obtained by integrating the same magnification as the time stretch magnification A (s252).

この場合においては、調波成分のサンプリング周波数が、s212の周波数変換によりFs/Aとなり、s230の周波数変換により(Fs/A)・A(=Fs)となり、s240のタイムストレッチによりFs/Aとなり、s252の周波数変換により(Fs/A)・A(=Fs)となる。   In this case, the sampling frequency of the harmonic component becomes Fs / A by the frequency conversion of s212, becomes (Fs / A) · A (= Fs) by the frequency conversion of s230, and becomes Fs / A by the time stretch of s240. , S252 frequency conversion results in (Fs / A) · A (= Fs).

このように、タイムストレッチ倍率Aが1未満である場合において、サンプリング周波数が周波数変換された状態を図7(f)に示す。この図からもわかるように、この周波数変換により、周波数分布が元の調波成分(上記s120にて抽出した時点における調波成分)と同じ周波数帯域に戻ることになる。
(3)作用,効果
このような構成のタイムストレッチシステム1では、まず、対象楽曲の成分から調波構造をなす調波成分と、調波構造をなさない非調波成分と、が抽出される(図2のs120,s130)。その後、非調波成分は、時間軸に沿って単位区間毎に分割した場合における各分割した成分それぞれが、タイムストレッチ倍率に応じて前後した時間軸上の位置に配置し直され(同図s150)、調波成分は、その波形が時間軸に沿って伸縮するようにタイムストレッチ倍率に応じてタイムストレッチされる(同図s140)。そして、こうして別々の手法によりタイムストレッチされた非調波成分および調波成分が合成されることにより、対象楽曲へのタイムストレッチが施される(同図s160)。
Thus, when the time stretch magnification A is less than 1, the state where the sampling frequency is frequency-converted is shown in FIG. As can be seen from this figure, the frequency conversion returns the frequency distribution to the same frequency band as the original harmonic component (the harmonic component extracted at s120).
(3) Action and Effect In the time stretch system 1 having such a configuration, first, a harmonic component having a harmonic structure and a non-harmonic component not having a harmonic structure are extracted from the components of the target music. (S120, s130 in FIG. 2). Thereafter, the non-harmonic component is rearranged at the position on the time axis that is divided according to the time stretch magnification when each divided component is divided for each unit section along the time axis (s150 in the figure). ), The harmonic component is time stretched according to the time stretch magnification so that the waveform expands and contracts along the time axis (s140 in the figure). Then, by combining the non-harmonic component and the harmonic component that have been time-stretched by different methods in this manner, time-stretching to the target music is performed (s160 in the figure).

このように、上記実施形態においては、対象楽曲の成分のうちの非調波成分に対し、単位区間毎に分割した成分それぞれの時間軸上の位置を配置し直すタイムストレッチが実施される一方、調波成分に対し、波形を時間軸に沿って伸縮させるタイムストレッチが実施される。   As described above, in the above embodiment, time stretching for rearranging the position on the time axis of each component divided for each unit section is performed on the non-harmonic component of the components of the target music piece, A time stretch is performed on the harmonic component to expand and contract the waveform along the time axis.

非調波成分は、具体的にいえば急峻にレベルが変化する打楽器音のような成分であり、その急峻なレベルの変化が上記単位区間内に現れやすいため、それら成分の時間軸上の位置を配置し直したとしても、その急峻なレベル変化を維持した再現性の高いタイムストレッチを実施することができる。   Specifically, the non-harmonic component is a component such as a percussion instrument sound whose level changes abruptly, and the change of the steep level is likely to appear in the unit interval. Even if the position is rearranged, time stretch with high reproducibility while maintaining the steep level change can be performed.

それに対し、調波成分は、具体的にいえばレベルが緩やかに変化する音声のような成分であるため、このような成分を単位区間毎に分割してしまうと、そのような変化の傾向が維持されなくなってしまう結果、意図しない聴覚上の違和感を発生させる要因となってしまう恐れがある。   On the other hand, the harmonic component is, specifically speaking, a sound-like component whose level changes slowly, and if such a component is divided into unit sections, such a change tendency tends to occur. As a result of not being maintained, there is a risk that unintentional sense of incongruity may occur.

このような問題に対し、本実施形態では、対象楽曲の成分のうちの調波成分に対して、単位区間毎に分割した成分それぞれの時間軸上の位置を配置し直す手法ではなく、波形を伸縮させる手法にてタイムストレッチを実施するようにしている。   In order to deal with such a problem, in the present embodiment, with respect to the harmonic component of the components of the target music, the waveform is not a method of rearranging the position on the time axis of each component divided for each unit section. Time stretch is performed by a method of expanding and contracting.

このタイムストレッチであれば、波形の形状が時間軸に沿って伸縮するだけであるため、レベルが緩やかに変化する調波成分において、その時間軸に沿った変化の傾向を維持したままでタイムストレッチが実現される結果、意図しない聴覚上の違和感が発生することを防止することができる。   With this time stretch, the waveform shape only expands and contracts along the time axis, so the harmonic component whose level changes slowly maintains the trend of change along the time axis while maintaining the time stretch. As a result, it is possible to prevent an unintended sense of incongruity from occurring.

このように、上記実施形態では、対象楽曲の成分における非調波成分,調波成分それぞれに適した手法によるタイムストレッチを実施することにより、対象楽曲のタイムストレッチを、非調波成分および調波成分それぞれにおいて聴覚上の違和感がないようにして実現することができる。   As described above, in the above-described embodiment, the time stretch of the target musical piece is performed by performing the time stretch by a method suitable for each of the non-harmonic component and the harmonic component in the component of the target musical piece. Each component can be realized so that there is no sense of incongruity in hearing.

また、上記実施形態においては、調波成分のサンプリング周波数を、タイムストレッチ倍率Aと同じ倍率を積算してなるサンプリング周波数Fs・Aへと周波数変換したうえで、その調波成分のタイムストレッチを実施することができる(図3のs230〜s240)。   In the above embodiment, the harmonic component sampling frequency is converted to the sampling frequency Fs · A obtained by integrating the same magnification as the time stretch magnification A, and then the harmonic component is time stretched. (S230 to s240 in FIG. 3).

調波成分をタイムストレッチすると、タイムストレッチ倍率Aが1より大きければ、その成分における周波数分布が1/A(=1より小さい)倍に狭まって見かけ上のサンプリング周波数が低くなる一方、タイムストレッチ倍率Aが1未満であれば、その成分における周波数分布が1/A(=1より大きい)倍に拡がって見かけ上のサンプリング周波数が高くなる。   When the harmonic component is time stretched, if the time stretch magnification A is greater than 1, the frequency distribution in that component is narrowed to 1 / A (less than 1) times and the apparent sampling frequency is lowered, while the time stretch magnification is If A is less than 1, the frequency distribution in that component is expanded by 1 / A (greater than = 1) and the apparent sampling frequency is increased.

上記実施形態では、調波成分のタイムストレッチに先立ち、そのサンプリング周波数FsをFs・Aへと周波数変換しておくことにより、上記のようなタイムストレッチに起因する見かけ上のサンプリング周波数の変化を相殺することができる。   In the above embodiment, the sampling frequency Fs is frequency-converted to Fs · A prior to the time stretching of the harmonic component, thereby canceling the apparent sampling frequency change caused by the time stretching as described above. can do.

例えば、タイムストレッチ倍率Aが1より大きい場合には、タイムストレッチにより見かけ上のサンプリング周波数が1/A(=1未満)倍に低くなるところ、このサンプリング周波数をあらかじめサンプリング周波数Fs・Aへと周波数変換(アップサンプリング)しておけば、タイムストレッチ後のサンプリング周波数が結果的に元の周波数Fsに戻る(Fs・A・1/A=Fs)ことになる(図4(c)〜(e)参照)。   For example, when the time stretch ratio A is greater than 1, the apparent sampling frequency is lowered to 1 / A (less than 1) times due to the time stretch, and this sampling frequency is set to the sampling frequency Fs · A in advance. If conversion (upsampling) is performed, the sampling frequency after time stretching will eventually return to the original frequency Fs (Fs · A · 1 / A = Fs) (FIGS. 4C to 4E). reference).

一方、タイムストレッチ倍率Aが1未満の場合では、そのタイムストレッチにより見かけ上のサンプリング周波数が1/A(=1より大きい)倍と高くなるところ、このサンプリング周波数をあらかじめサンプリング周波数Fs・Aへと周波数変換(ダウンサンプリング)しておけば、タイムストレッチ後のサンプリング周波数が結果的に元の周波数Fsに戻る(Fs・A・1/A=Fs)ことになる(図5(b)〜(d)参照)。   On the other hand, when the time stretch magnification A is less than 1, the apparent sampling frequency becomes as high as 1 / A (greater than 1) times due to the time stretch, and this sampling frequency is changed to the sampling frequency Fs · A in advance. If frequency conversion (downsampling) is performed, the sampling frequency after time stretching will eventually return to the original frequency Fs (Fs · A · 1 / A = Fs) (FIGS. 5B to 5D). )reference).

これらのようにして、タイムストレッチに起因する見かけ上のサンプリング周波数の変化を相殺することができる。
また、上記実施形態において、調波成分に対するタイムストレッチの実施手順「その1」では、タイムストレッチ倍率が1未満である場合には、あらかじめ調波成分におけるカットオフ周波数Fc(=(A・Fs)/2)以上の周波数成分が除去される(図3のs220,図4(b)参照)。
In this way, the apparent change in sampling frequency due to time stretching can be canceled out.
Further, in the above-described embodiment, when the time stretch magnification is less than 1 in the time stretch execution procedure “part 1” for the harmonic component, the cutoff frequency Fc (= (A · Fs) in the harmonic component is previously set. / 2) The above frequency components are removed (see s220 in FIG. 3, FIG. 4B).

この周波数Fc以上の周波数帯域は、タイムストレッチ倍率Aにてタイムストレッチする過程で周波数分布がサンプリング周波数Fsの1/2以上に拡がりうる帯域であるため、上記構成のように周波数Fc以上の周波数成分をあらかじめ除去しておくことにより、タイムストレッチの過程で拡がった周波数分布において周波数成分が干渉しないようにすることで(同図(c)参照)、周波数分布が拡がることによる折り返しノイズの発生を防止できる。   Since the frequency band above the frequency Fc is a band in which the frequency distribution can be expanded to 1/2 or more of the sampling frequency Fs in the process of time stretching at the time stretch magnification A, the frequency component above the frequency Fc as in the above configuration. Is removed in advance so that frequency components do not interfere in the frequency distribution that has been expanded in the process of time stretching (see (c) in the figure), thereby preventing the occurrence of aliasing noise due to the expansion of the frequency distribution. it can.

また、上記実施形態において、調波成分に対するタイムストレッチの実施手順「その2」では、タイムストレッチ倍率が1未満である場合には、タイムストレッチに先立ち、あらかじめ調波成分のサンプリング周波数が1/A倍に周波数変換され(図6のs212)、そのタイムストレッチ後に調波成分のサンプリング周波数がA倍に周波数変換される(同図s252)。   Further, in the above embodiment, in the time stretch execution procedure “part 2” for the harmonic component, when the time stretch magnification is less than 1, the sampling frequency of the harmonic component is 1 / A in advance prior to the time stretch. The frequency is doubled (s212 in FIG. 6), and after the time stretching, the sampling frequency of the harmonic component is frequency-converted to A times (s252 in FIG. 6).

タイムストレッチに先立ってサンプリング周波数を1/A(=1より大きい)倍に周波数変換した場合、その倍率に応じて周波数分布が拡がることとなるが、サンプリング周波数を変換したのみであるため、そのサンプリング周波数Fs/Aの1/2以下の一部帯域に周波数成分が分布していない状態となる(図7(b)参照)。これにより、タイムストレッチの過程で周波数分布が拡がったとしても、その拡がった周波数成分が干渉することがなくなるため、周波数分布が拡がることによる折り返しノイズの発生を防止することができる。   If the sampling frequency is frequency converted to 1 / A (greater than 1) times prior to time stretching, the frequency distribution will be expanded according to the magnification, but since the sampling frequency is only converted, the sampling is performed. The frequency components are not distributed in a partial band of 1/2 or less of the frequency Fs / A (see FIG. 7B). As a result, even if the frequency distribution is expanded in the process of time stretching, the expanded frequency components do not interfere with each other, so that the occurrence of aliasing noise due to the expanded frequency distribution can be prevented.

そして、タイムストレッチ後に再度調波成分のサンプリング周波数をA(=1未満)倍に周波数変換することにより(図6のs252)、そのタイムストレッチ前後におけるサンプリング周波数を一致させることができる(図7(f)参照)。   Then, after the time stretch, the sampling frequency of the harmonic component is frequency-converted again by A (less than = 1) times (s252 in FIG. 6), so that the sampling frequencies before and after the time stretch can be matched (FIG. 7 ( f)).

また、上記実施形態においては、単位区間毎に分割した非調波成分それぞれが時間軸上で重なってしまうような場合でも、それら非調波成分同士の重複部分をクロスフェードにより接続することができる。
(4)変形例
以上、本発明の実施の形態について説明したが、本発明は、上記実施形態に何ら限定されることはなく、本発明の技術的範囲に属する限り種々の形態をとり得ることはいうまでもない。
Moreover, in the said embodiment, even when each of the subharmonic components divided | segmented for every unit area overlaps on a time axis, the overlapping part of these subharmonic components can be connected by cross fade. .
(4) Modifications The embodiment of the present invention has been described above. However, the present invention is not limited to the above embodiment, and can take various forms as long as they belong to the technical scope of the present invention. Needless to say.

例えば、上記実施形態において、調波成分に対するタイムストレッチの実施手順「その2」では、事前に調波成分のサンプリング周波数が1/A倍に周波数変換された後(図6のs212)、タイムストレッチの過程でA倍に周波数変換されており(同図s230)、その時点で両者の周波数変換の効果が相殺されているといえるため、これら一連の周波数変換についてはその実施を省略することとしてもよく、そのためには、図8に示すように、s210で「YES」と判定された場合に、s212,s230を実施することなく、プロセスがs240へと移行するように構成するとよい。   For example, in the above-described embodiment, in the time stretch execution procedure “part 2” for the harmonic component, after the harmonic component sampling frequency is converted to 1 / A times in advance (s212 in FIG. 6), the time stretch is performed. In this process, the frequency conversion is A times (s230 in the figure), and it can be said that the effect of both frequency conversions is canceled at that time. Therefore, the implementation of these series of frequency conversions may be omitted. For this purpose, as shown in FIG. 8, when it is determined “YES” in s210, the process may be shifted to s240 without performing s212 and s230.

この場合には、一連の周波数変換を省略して処理負担を軽減しつつ、調波成分に対するタイムストレッチの実施手順「その2」と同様の作用,効果を得ることができる。
なお、この場合において、タイムストレッチされる過程の時間波形(時間軸に沿った波形)およびスペクトル分布それぞれを図9に示す。ここでは、タイムストレッチ(図8のs240)が施された後の様子が図9(b)であり、ピッチシフト(図8のs250)が施された後の様子が図9(c)であり、事後的な周波数変換(同図s252)が施された後の様子が図9(d)である。
(5)本発明との対応関係
以上説明した実施形態において、図2のs120が本発明における調波抽出手段であり、同図s130が本発明における非調波抽出手段であり、同図s150が本発明における成分再配置手段であり、図3,6,8のs240が本発明における波形伸縮手段であり、同図s250が本発明におけるピッチシフト手段であり、図2のs160が本発明における成分合成手段であり、図3,6,8のs230が本発明における周波数変換手段であり、同図s220が本発明におけるフィルタリング手段であり、図6のs212が本発明における事前変換手段であり、図6,図8におけるs252が本発明における事後変換手段である。
In this case, it is possible to obtain the same operation and effect as the time stretching execution procedure “part 2” for harmonic components while reducing the processing load by omitting a series of frequency conversions.
In this case, FIG. 9 shows a time waveform (waveform along the time axis) and spectrum distribution in the process of time stretching. Here, FIG. 9B shows the state after the time stretch (s240 in FIG. 8), and FIG. 9C shows the state after the pitch shift (s250 in FIG. 8). FIG. 9D shows a state after the subsequent frequency conversion (s252 in FIG. 9) is performed.
(5) Correspondence with the Present Invention In the embodiment described above, s120 in FIG. 2 is the harmonic extraction means in the present invention, s130 is the non-harmonic extraction means in the present invention, and s150 in FIG. The component rearrangement means in the present invention, s240 in FIGS. 3, 6 and 8 is the waveform expansion / contraction means in the present invention, s250 in FIG. 2 is the pitch shift means in the present invention, and s160 in FIG. 2 is the component in the present invention. 3, s230 of FIG. 3, 6 and 8 is the frequency converting means in the present invention, s220 in FIG. 6 is the filtering means in the present invention, s212 in FIG. 6 is the pre-converting means in the present invention, 6 and s252 in FIG. 8 are post-conversion means in the present invention.

タイムストレッチシステムのハードウェア構成を示す図Diagram showing the hardware configuration of the time stretch system タイムストレッチ処理を示すフローチャートFlow chart showing time stretch processing 調波成分に対するタイムストレッチの実施手順「その1」を示すフローチャートFlowchart showing time stretch execution procedure “part 1” for harmonic components 調波成分に対するタイムストレッチの実施手順「その1」において、1未満のタイムストレッチ倍率で調波成分がタイムストレッチされる過程を示す図The figure which shows the process in which a harmonic component is time-stretched by the time stretch magnification of less than 1 in the implementation procedure "the 1" of time-stretching to a harmonic component. 調波成分に対するタイムストレッチの実施手順「その1」において、1未満でないタイムストレッチ倍率で調波成分がタイムストレッチされる過程を示す図The figure which shows the process in which a harmonic component is time-stretched by the time stretch magnification which is not less than 1 in the implementation procedure "the 1" of time stretching with respect to a harmonic component. 調波成分に対するタイムストレッチの実施手順「その2」を示すフローチャートFlowchart showing time stretch execution procedure “part 2” for harmonic components 調波成分に対するタイムストレッチの実施手順「その2」において、1未満のタイムストレッチ倍率で調波成分がタイムストレッチされる過程を示す図The figure which shows the process in which the harmonic component is time-stretched by the time stretch magnification of less than 1 in the implementation procedure “part 2” of the time stretch with respect to the harmonic component. 別の実施形態における,調波成分に対するタイムストレッチの実施手順「その2」を示すフローチャートThe flowchart which shows the implementation procedure "the 2" of the time stretch with respect to a harmonic component in another embodiment 別の実施形態における,調波成分に対するタイムストレッチの実施手順「その2」において、1未満のタイムストレッチ倍率で調波成分がタイムストレッチされる過程を示す図The figure which shows the process in which harmonic component is time-stretched by the time stretch magnification of less than 1 in the implementation procedure "the 2" of harmonic stretch in another embodiment.

符号の説明Explanation of symbols

1・・・タイムストレッチシステム、2・・・ネットワーク、11・・・制御部、13・・・記憶部、15・・・通信部、17・・・ユーザインタフェース部、19・・・メディアドライブ。   DESCRIPTION OF SYMBOLS 1 ... Time stretch system, 2 ... Network, 11 ... Control part, 13 ... Memory | storage part, 15 ... Communication part, 17 ... User interface part, 19 ... Media drive.

Claims (5)

対象楽曲を所定のタイムストレッチ倍率によりタイムストレッチさせるためのタイムストレッチシステムであって、
前記対象楽曲における成分のスペクトル分布に基づいて、その成分のうちの調波構造をなしている調波成分を抽出する調波抽出手段と、
前記対象楽曲の成分から前記調波抽出手段により抽出された調波成分を除去することにより、前記対象楽曲の成分のうちの調波構造をなしていない非調波成分を抽出する非調波抽出手段と、
該非調波抽出手段により抽出された非調波成分に基づいて、該非調波成分を時間軸に沿って単位区間毎に分割した場合における各分割した成分(以降「分割非調波成分」という)それぞれの時間軸上の位置を、前記タイムストレッチ倍率に応じて前後させた位置に配置し直す成分再配置手段と、
前記調波抽出手段により抽出された調波成分を、その波形が時間軸に沿って伸縮するように前記タイムストレッチ倍率に応じてタイムストレッチさせる波形伸縮手段と、
該波形伸縮手段によりタイムストレッチされた後の調波成分について、該調波成分のピッチを前記タイムストレッチ倍率に応じて低くまたは高くするピッチシフト手段と、
前記成分再配置手段により分割非調波成分が配置し直されてなる非調波成分に、前記波形伸縮手段によるタイムストレッチおよび前記ピッチシフト手段によるピッチシフトがされてなる調波成分を、それぞれの時間軸が一致するように合成する成分合成手段と、を備えており、
前記対象楽曲が、所定のサンプリング周波数Fsで所定の楽曲をサンプリングしてなる楽曲データで示されるものである場合において、
前記波形伸縮手段は、前記調波抽出手段により抽出された調波成分を、前記サンプリング周波数Fsに前記タイムストレッチ倍率Aと同じ倍率を積算してなるサンプリング周波数Fs・Aへと周波数変換したうえで、該周波数変換された調波成分を、その波形が時間軸に沿って伸縮するようにタイムストレッチさせており、
さらに、前記タイムストレッチ倍率が1未満である場合に、前記対象楽曲の成分から規定される周波数Fc(=(A・Fs)/2)以上の周波数成分をフィルタリングにより除去した後で、前記波形伸縮手段による周波数変換およびタイムストレッチを行わせる周波数成分変換手段、を備えている
ことを特徴とするタイムストレッチシステム。
A time stretch system for time-stretching a target music with a predetermined time stretch magnification,
Harmonic extraction means for extracting a harmonic component having a harmonic structure among the components based on the spectral distribution of the components in the target music;
Non-harmonic extraction for extracting non-harmonic components that do not form a harmonic structure among the components of the target music by removing the harmonic components extracted by the harmonic extraction means from the components of the target music Means,
Based on the non-harmonic component extracted by the non-harmonic extraction means, each divided component when the non-harmonic component is divided into unit sections along the time axis (hereinafter referred to as “divided non-harmonic component”) Component rearrangement means for rearranging the position on each time axis to a position moved back and forth according to the time stretch magnification;
Waveform expansion / contraction means for time-stretching the harmonic component extracted by the harmonic extraction means according to the time stretch magnification so that the waveform expands and contracts along the time axis;
For harmonic component after being by Rita im stretch waveform expansion means, and the pitch shifting means for lower or higher, depending on the pitch of said harmonic components in the time stretch ratio,
The subharmonic components obtained by rearranging the divided subharmonic components by the component rearrangement unit are replaced with harmonic components obtained by time stretching by the waveform expansion / contraction unit and pitch shift by the pitch shift unit, respectively. Component synthesizing means for synthesizing so that the time axes match ,
In the case where the target music is indicated by music data obtained by sampling a predetermined music at a predetermined sampling frequency Fs,
The waveform expansion / contraction means converts the harmonic component extracted by the harmonic extraction means to a sampling frequency Fs · A obtained by integrating the sampling frequency Fs by the same magnification as the time stretch magnification A. The time-stretched harmonic component having undergone frequency conversion is stretched so that the waveform expands and contracts along the time axis.
Further, when the time stretch ratio is less than 1, the waveform expansion and contraction is performed after filtering out frequency components of a frequency Fc (= (A · Fs) / 2) or more defined from the components of the target music. A time stretch system comprising frequency component conversion means for performing frequency conversion and time stretch by the means .
対象楽曲を所定のタイムストレッチ倍率によりタイムストレッチさせるためのタイムストレッチシステムであって、A time stretch system for time-stretching a target music with a predetermined time stretch magnification,
前記対象楽曲における成分のスペクトル分布に基づいて、その成分のうちの調波構造をなしている調波成分を抽出する調波抽出手段と、Harmonic extraction means for extracting a harmonic component having a harmonic structure among the components based on the spectral distribution of the components in the target music;
前記対象楽曲の成分から前記調波抽出手段により抽出された調波成分を除去することにより、前記対象楽曲の成分のうちの調波構造をなしていない非調波成分を抽出する非調波抽出手段と、Non-harmonic extraction for extracting non-harmonic components that do not form a harmonic structure among the components of the target music by removing the harmonic components extracted by the harmonic extraction means from the components of the target music Means,
該非調波抽出手段により抽出された非調波成分に基づいて、該非調波成分を時間軸に沿って単位区間毎に分割した場合における各分割した成分(以降「分割非調波成分」という)それぞれの時間軸上の位置を、前記タイムストレッチ倍率に応じて前後させた位置に配置し直す成分再配置手段と、Based on the non-harmonic component extracted by the non-harmonic extraction means, each divided component when the non-harmonic component is divided into unit sections along the time axis (hereinafter referred to as “divided non-harmonic component”) Component rearrangement means for rearranging the position on each time axis to a position moved back and forth according to the time stretch magnification;
前記調波抽出手段により抽出された調波成分を、その波形が時間軸に沿って伸縮するように前記タイムストレッチ倍率に応じてタイムストレッチさせる波形伸縮手段と、Waveform expansion / contraction means for time-stretching the harmonic component extracted by the harmonic extraction means according to the time stretch magnification so that the waveform expands and contracts along the time axis;
該波形伸縮手段によりタイムストレッチされた後の調波成分について、該調波成分のピッチを前記タイムストレッチ倍率に応じて低くまたは高くするピッチシフト手段と、Pitch shift means for lowering or raising the pitch of the harmonic component according to the time stretch magnification for the harmonic component after being time stretched by the waveform expansion / contraction means;
前記成分再配置手段により分割非調波成分が配置し直されてなる非調波成分に、前記波形伸縮手段によるタイムストレッチおよび前記ピッチシフト手段によるピッチシフトがされてなる調波成分を、それぞれの時間軸が一致するように合成する成分合成手段と、を備えており、The subharmonic components obtained by rearranging the divided subharmonic components by the component rearrangement unit are replaced with harmonic components obtained by time stretching by the waveform expansion / contraction unit and pitch shift by the pitch shift unit, respectively. Component synthesizing means for synthesizing so that the time axes match,
さらに、further,
前記タイムストレッチ倍率が1未満である場合に、前記調波抽出手段により抽出された調波成分を、前記サンプリング周波数Fsに前記タイムストレッチ倍率Aの逆数と同じ倍率を積算してなるサンプリング周波数Fs/Aへと周波数変換した後で、該調波成分について前記波形伸縮手段によるタイムストレッチを行わせると共に、該波形伸縮手段によるタイムストレッチおよび前記ピッチシフト手段によるピッチシフトがなされた調波成分を、そのサンプリング周波数に前記タイムストレッチ倍率Aと同じ倍率を積算してなるサンプリング周波数へと周波数変換した後で、該周波数変換された調波成分と、前記成分再配置手段により分割非調波成分が配置し直されてなる非調波成分との前記成分合成手段による合成を行わせる周波数成分変換手段、を備えているWhen the time stretch magnification is less than 1, the harmonic component extracted by the harmonic extraction means is integrated with the sampling frequency Fs /, which is obtained by adding the same magnification as the reciprocal of the time stretch magnification A to the sampling frequency Fs. After frequency conversion to A, the harmonic component is subjected to time stretching by the waveform expansion / contraction means, and the harmonic component subjected to time stretching by the waveform expansion / contraction means and pitch shift by the pitch shifting means is After frequency conversion to a sampling frequency obtained by adding the same magnification as the time stretch magnification A to the sampling frequency, the harmonic component subjected to frequency conversion and the divided non-harmonic component are arranged by the component rearranging means. A frequency component change that causes the component synthesis means to synthesize the corrected non-harmonic component. Is equipped with means, the
ことを特徴とするタイムストレッチシステム。A time stretch system characterized by that.
対象楽曲を所定のタイムストレッチ倍率によりタイムストレッチさせるためのタイムストレッチシステムであって、A time stretch system for time-stretching a target music with a predetermined time stretch magnification,
前記対象楽曲における成分のスペクトル分布に基づいて、その成分のうちの調波構造をなしている調波成分を抽出する調波抽出手段と、Harmonic extraction means for extracting a harmonic component having a harmonic structure among the components based on the spectral distribution of the components in the target music;
前記対象楽曲の成分から前記調波抽出手段により抽出された調波成分を除去することにより、前記対象楽曲の成分のうちの調波構造をなしていない非調波成分を抽出する非調波抽出手段と、Non-harmonic extraction for extracting non-harmonic components that do not form a harmonic structure among the components of the target music by removing the harmonic components extracted by the harmonic extraction means from the components of the target music Means,
該非調波抽出手段により抽出された非調波成分に基づいて、該非調波成分を時間軸に沿って単位区間毎に分割した場合における各分割した成分(以降「分割非調波成分」という)それぞれの時間軸上の位置を、前記タイムストレッチ倍率に応じて前後させた位置に配置し直す成分再配置手段と、Based on the non-harmonic component extracted by the non-harmonic extraction means, each divided component when the non-harmonic component is divided into unit sections along the time axis (hereinafter referred to as “divided non-harmonic component”) Component rearrangement means for rearranging the position on each time axis to a position moved back and forth according to the time stretch magnification;
前記調波抽出手段により抽出された調波成分を、その波形が時間軸に沿って伸縮するように前記タイムストレッチ倍率に応じてタイムストレッチさせる波形伸縮手段と、Waveform expansion / contraction means for time-stretching the harmonic component extracted by the harmonic extraction means according to the time stretch magnification so that the waveform expands and contracts along the time axis;
該波形伸縮手段によりタイムストレッチされた後の調波成分について、該調波成分のピッチを前記タイムストレッチ倍率に応じて低くまたは高くするピッチシフト手段と、Pitch shift means for lowering or raising the pitch of the harmonic component according to the time stretch magnification for the harmonic component after being time stretched by the waveform expansion / contraction means;
前記成分再配置手段により分割非調波成分が配置し直されてなる非調波成分に、前記波形伸縮手段によるタイムストレッチおよび前記ピッチシフト手段によるピッチシフトがされてなる調波成分を、それぞれの時間軸が一致するように合成する成分合成手段と、を備えており、The subharmonic components obtained by rearranging the divided subharmonic components by the component rearrangement unit are replaced with harmonic components obtained by time stretching by the waveform expansion / contraction unit and pitch shift by the pitch shift unit, respectively. Component synthesizing means for synthesizing so that the time axes match,
前記対象楽曲が、所定のサンプリング周波数Fsで所定の楽曲をサンプリングしてなる楽曲データで示されるものである場合において、In the case where the target music is indicated by music data obtained by sampling a predetermined music at a predetermined sampling frequency Fs,
前記タイムストレッチ倍率が1未満である場合に、前記波形伸縮手段によるタイムストレッチおよび前記ピッチシフト手段によるピッチシフトがなされてなる調波成分を、前記サンプリング周波数Fsが前記タイムストレッチ倍率Aと同じ倍率のサンプリング周波数Fs’’’(=Fs’’・A=Fs)へと周波数変換した後で、該周波数変換された調波成分と、前記成分再配置手段により分割非調波成分が配置し直されてなる非調波成分との前記成分合成手段による合成を行わせる周波数成分変換手段、を備えているWhen the time stretch magnification is less than 1, the harmonic component formed by the time stretch by the waveform expansion / contraction means and the pitch shift by the pitch shift means has the sampling frequency Fs of the same magnification as the time stretch magnification A. After frequency conversion to the sampling frequency Fs ′ ″ (= Fs ″ · A = Fs), the frequency-converted harmonic component and the divided non-harmonic component are rearranged by the component rearrangement means. Frequency component converting means for performing synthesis by the component synthesizing means with the non-harmonic component formed by
ことを特徴とするタイムストレッチシステム。A time stretch system characterized by that.
前記成分再配置手段は、前記タイムストレッチ倍率が1未満である場合、前記分割非調波成分それぞれの時間軸上の位置を、前記タイムストレッチ倍率に応じて前後させた位置に配置し直すと共に、時間軸上で隣接する前記分割非調波成分同士をクロスフェードさせる
ことを特徴とする請求項1からのいずれかに記載のタイムストレッチシステム。
The component rearrangement unit rearranges the position on the time axis of each of the divided non-harmonic components to a position moved back and forth according to the time stretch magnification when the time stretch magnification is less than 1. The time stretch system according to any one of claims 1 to 3 , wherein the divided subharmonic components adjacent on the time axis are crossfaded.
請求項1からのいずれかに記載の全ての手段として機能させるための各種処理手順をコンピュータシステムに実行させるためのプログラム。 A program for causing a computer system to execute various processing procedures for causing all of the means according to any one of claims 1 to 4 to function.
JP2008092724A 2008-03-31 2008-03-31 Time stretch system and program Expired - Fee Related JP4924513B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008092724A JP4924513B2 (en) 2008-03-31 2008-03-31 Time stretch system and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008092724A JP4924513B2 (en) 2008-03-31 2008-03-31 Time stretch system and program

Publications (2)

Publication Number Publication Date
JP2009244704A JP2009244704A (en) 2009-10-22
JP4924513B2 true JP4924513B2 (en) 2012-04-25

Family

ID=41306637

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008092724A Expired - Fee Related JP4924513B2 (en) 2008-03-31 2008-03-31 Time stretch system and program

Country Status (1)

Country Link
JP (1) JP4924513B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6424462B2 (en) * 2014-05-19 2018-11-21 ヤマハ株式会社 Method and apparatus for time axis compression and expansion of audio signal
EP3316251B1 (en) * 2015-06-24 2023-05-10 AlphaTheta Corporation Display control device, display control method, and display control program
WO2016208000A1 (en) * 2015-06-24 2016-12-29 Pioneer DJ株式会社 Display control device, display control method, and display control program

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62271254A (en) * 1986-05-20 1987-11-25 Sanyo Electric Co Ltd Reproducing device for music
JPH02275498A (en) * 1989-04-17 1990-11-09 Matsushita Electric Ind Co Ltd Time base conversion processor
JP3185363B2 (en) * 1992-05-06 2001-07-09 ソニー株式会社 hearing aid
JP2970396B2 (en) * 1994-04-22 1999-11-02 ヤマハ株式会社 Waveform processing device
JP3221293B2 (en) * 1995-08-25 2001-10-22 ヤマハ株式会社 Music signal processor
JPH09198089A (en) * 1996-01-19 1997-07-31 Matsushita Electric Ind Co Ltd Reproduction speed converting device
JP3073942B2 (en) * 1997-09-12 2000-08-07 日本放送協会 Audio processing method, audio processing device, and recording / reproducing device
JP4293712B2 (en) * 1999-10-18 2009-07-08 ローランド株式会社 Audio waveform playback device
JP2004519738A (en) * 2001-04-05 2004-07-02 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Time scale correction of signals applying techniques specific to the determined signal type
JP2003255999A (en) * 2002-03-06 2003-09-10 Toshiba Corp Variable speed reproducing device for encoded digital audio signal
KR100653643B1 (en) * 2006-01-26 2006-12-05 삼성전자주식회사 Method and apparatus for detecting pitch by subharmonic-to-harmonic ratio

Also Published As

Publication number Publication date
JP2009244704A (en) 2009-10-22

Similar Documents

Publication Publication Date Title
RU2543309C2 (en) Device, method and computer programme for controlling audio signal, including transient signal
EP2581905A1 (en) Band enhancement method, band enhancement apparatus, program, integrated circuit and audio decoder apparatus
JP4705203B2 (en) Voice quality conversion device, pitch conversion device, and voice quality conversion method
CA2945730C (en) Improved subband block based harmonic transposition
US7612281B2 (en) Reverberation effect adding device
EP1840871B1 (en) Audio waveform processing device, method, and program
JP4924513B2 (en) Time stretch system and program
WO2010119253A1 (en) Processing audio signals
JP2004287171A (en) Vocoder device
Ottosen et al. A phase vocoder based on nonstationary Gabor frames
JP2000510255A (en) System and method for synthesizing sound using a length modulated digital delay line
JP2010008853A (en) Speech synthesizing apparatus and method therefof
JP2009244705A (en) Pitch shift system and program
WO2008010413A1 (en) Audio synthesis device, method, and program
JP3428401B2 (en) Waveform data processing method
JP2699629B2 (en) Music signal generator
JP3692661B2 (en) Music synthesizer
JP3888315B2 (en) Sound synthesis apparatus and program
JP2000259164A (en) Voice data generating device and voice quality converting method
US6660923B2 (en) Method for extracting the formant of a musical tone, recording medium and apparatus for extracting the formant of a musical tone
EP2038881B1 (en) Sound frame length adaptation
JP2003022100A (en) Method of removing noise, noise removing system and program
JP2007228349A (en) Sampling frequency converting method, its program, and its recording medium
JP2010026044A (en) Reverberation applying device and program
JP2003255951A (en) Waveform processing method and apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120123

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150217

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees