JP2008209447A - Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method - Google Patents
Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method Download PDFInfo
- Publication number
- JP2008209447A JP2008209447A JP2007043459A JP2007043459A JP2008209447A JP 2008209447 A JP2008209447 A JP 2008209447A JP 2007043459 A JP2007043459 A JP 2007043459A JP 2007043459 A JP2007043459 A JP 2007043459A JP 2008209447 A JP2008209447 A JP 2008209447A
- Authority
- JP
- Japan
- Prior art keywords
- section
- similarity
- section length
- input signal
- change width
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Description
本発明は、オーディオ信号などの入力信号のうち相類似する波形が反復する区間の時間長(以下「基本周期」という)を特定する技術に関する。 The present invention relates to a technique for specifying a time length (hereinafter referred to as “basic period”) of a section in which similar waveforms repeat among input signals such as audio signals.
基本周期分の波形を削除または挿入することで、ピッチやホルマントを維持しながら入力信号を時間軸の方向に圧縮または伸長する技術が従来から提案されている(例えば特許文献1)。特許文献1の技術においては、入力信号のうち同じ区間長で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理が、第1区間および第2区間の区間長をひとつのサンプル分ずつ変化させながら複数回にわたって反復され、類似度が最も高い区間長が基本周期として特定される。
特許文献1の技術は、第1区間および第2区間の各々についてサンプルを間引いたうえで類似度を算定することで処理量の削減を図っている。しかし、類似度の算定の対象となるサンプルを間引いただけでは実際には処理量が充分に削減されない場合もあり、さらなる処理量の削減が望まれるところである。以上の事情に鑑みて、本発明は、基本周期の特定のための処理量を削減するという課題の解決を目的としている。
The technique of
以上の課題を解決するために、本発明に係る時間軸圧伸方法は、入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1段階(例えば図3の処理)と、サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、第1段階で算定した類似度が類似を示す区間長(仮区間長)を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2段階(例えば図4の処理)と、第1段階および第2段階にて算定された類似度が類似を示す区間長を基本周期として、入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理段階とを有する。 In order to solve the above-described problem, the time axis companding method according to the present invention includes a first interval and a first interval that are adjacent to each other in a sample sequence in which a plurality of samples of an input signal are arranged in time series. A first stage (for example, the process of FIG. 3) in which a process of calculating the similarity of waveforms for two sections is performed for a plurality of section lengths changed by a first change width corresponding to two or more samples, and a sample The processing for calculating the similarity of the waveform for the first section and the second section of the column is the second in which the section length (temporary section length) in which the similarity calculated in the first stage shows similarity is smaller than the first change width. The second stage (for example, the process of FIG. 4) executed for a plurality of section lengths changed by the change width, and the section length in which the similarity calculated in the first stage and the second stage shows similarity is set as a basic period. Waveform of input signal expanded or compressed on time axis And a companding process generating a force signal.
以上の構成においては、区間長を第1変化幅ずつ変化させながら第1区間と第2区間との波形の類似度が算定されたうえで、第1区間と第2区間との波形が類似する特定の区間長を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について類似度が算定される。したがって、区間長を第1変化幅ずつ変化させた区間長についてのみ類似度を算定する方法と比較して基本周期を高い精度で特定することができ、第2変化幅ずつ変化させた総ての区間長について類似度を算定する構成と比較して処理量を削減することができる。 In the above configuration, the waveform similarity between the first section and the second section is similar after the waveform similarity between the first section and the second section is calculated while changing the section length by the first change width. Similarities are calculated for a plurality of section lengths in which a specific section length is changed by a second change width smaller than the first change width. Therefore, it is possible to specify the basic period with high accuracy compared to the method of calculating the similarity only for the section length in which the section length is changed by the first change width, and for all the changes in the second change width. The amount of processing can be reduced as compared with the configuration for calculating the similarity for the section length.
本発明の好適な態様に係る時間軸圧伸方法の第2段階においては、第1段階にて算定された類似度が高い順番に選択された複数(例えば図3や図4のN個)の区間長の各々を対象として、当該区間長を第2変化幅ずつ変化させた複数の区間長について第1区間と第2区間との類似度を算定する。以上の態様によれば、第1段階で算定されたひとつの区間長のみを第2段階における処理の対象とする場合と比較して、基本周期の特定の精度を高めることができる。 In the second stage of the time axis companding method according to a preferred aspect of the present invention, a plurality of (for example, N pieces in FIGS. 3 and 4) selected in descending order of similarity calculated in the first stage. For each of the section lengths, the similarity between the first section and the second section is calculated for a plurality of section lengths obtained by changing the section length by the second change width. According to the above aspect, compared with the case where only one section length calculated in the first stage is the target of processing in the second stage, the specific accuracy of the basic period can be increased.
なお、第2変化幅は、第1変化幅よりも小さいという条件を満たす範囲で任意に設定される。ただし、第2変化幅を、入力信号のサンプル列にて相前後する各サンプルの間隔に相当する大きさに設定すれば、基本周期を高精度に特定するという効果が特に顕著となる。 The second change width is arbitrarily set in a range that satisfies the condition that it is smaller than the first change width. However, if the second change width is set to a size corresponding to the interval between successive samples in the sample sequence of the input signal, the effect of specifying the basic period with high accuracy becomes particularly significant.
本発明の具体的な態様に係る時間軸圧伸方法の第1段階においては、第1段階に関する変数が入力信号のサンプリング周波数に応じて可変に制御される。例えば、入力信号のサンプリング周波数が高いほど第1変化幅が増加する。以上の態様によれば、サンプリング周波数が高い場合であっても第1段階における処理量を抑制することが可能である。 In the first stage of the time axis companding method according to a specific aspect of the present invention, the variable relating to the first stage is variably controlled according to the sampling frequency of the input signal. For example, the first change width increases as the sampling frequency of the input signal is higher. According to the above aspect, it is possible to suppress the processing amount in the first stage even when the sampling frequency is high.
本発明の具体的な態様に係る時間軸圧伸方法においては、第1段階にて各区間長について算定された類似度の分布幅が小さいほど、第2段階にて類似度を算定する区間長の個数(例えば図4の再検索幅LD)を減少させる。入力信号のうち類似度の分布幅が小さい区間(例えば無音や無声子音の区間)には明確な周期性が現れない可能性が高い。したがって、以上の態様によれば、入力信号のうち有声音の区間(すなわち本来的に基本周期を特定すべき区間)について基本周期の特定の精度を高水準に維持しながら、第2段階における処理量を削減することが可能である。また、第1段階にて各区間長について算定された類似度の分布幅が所定値を下回る場合に、第2段階における類似度の算定を停止すれば、第2段階における処理量を削減するという効果はさらに顕著となる。 In the time axis companding method according to a specific aspect of the present invention, the section length for calculating the similarity in the second stage is smaller as the distribution width of the similarity calculated for each section length in the first stage is smaller. (For example, the re-search width LD in FIG. 4) is reduced. There is a high possibility that a clear periodicity does not appear in a section in which the similarity distribution width is small (for example, a section of silent or unvoiced consonant) in the input signal. Therefore, according to the above aspect, the processing in the second stage is performed while maintaining the specific accuracy of the fundamental period at a high level for the voiced sound section of the input signal (that is, the section in which the fundamental period should be originally identified). It is possible to reduce the amount. Further, if the distribution of similarity calculated for each section length in the first stage is below a predetermined value, the processing amount in the second stage will be reduced if the similarity calculation in the second stage is stopped. The effect becomes even more remarkable.
本発明は、入力信号を時間軸の方向に圧縮または伸長する装置としても特定される。本発明の時間軸圧伸装置は、入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1処理手段と、サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、第1処理手段の算定した類似度が類似を示す区間長を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2処理手段と、第1処理手段および第2処理手段の算定した類似度が類似を示す区間長を基本周期として、入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理手段とを具備する。以上の装置によっても、本発明に係る時間軸圧伸方法と同様の作用および効果が相される。 The present invention is also specified as a device that compresses or expands an input signal in the direction of the time axis. The time-axis companding device according to the present invention calculates the similarity of waveforms for a first section and a second section that are equal in section length and are adjacent to each other in a sample sequence in which a plurality of samples of an input signal are arranged in time series. First processing means for executing the processing to be performed for a plurality of section lengths that are changed by the first change width corresponding to two or more samples, and the waveform similarity for the first section and the second section of the sample sequence A second processing means for executing a calculation process for a plurality of section lengths obtained by changing the section length in which the degree of similarity calculated by the first processing means is similar by a second change width smaller than the first change width; Companding processing means for generating an output signal having a waveform in which the input signal is expanded or compressed on the time axis with the interval length in which the similarity calculated by the first processing means and the second processing means is similar as the basic period. . Also with the above apparatus, the same operation and effect as the time-axis companding method according to the present invention are combined.
本発明に係る時間軸圧伸装置は、特定の信号処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1処理手段と、サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、第1処理手段の算定した類似度が類似を示す区間長を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2処理手段と、第1処理手段および第2処理手段の算定した類似度が類似を示す区間長を基本周期として、入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理手段としてコンピュータを機能させる内容である。以上のプログラムによっても、本発明の時間軸圧伸装置と同様の作用および効果が奏される。なお、本発明のプログラムは、CD−ROMなど可搬型の記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、ネットワークを介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。 The time axis companding device according to the present invention is realized by hardware (electronic circuit) such as a DSP (Digital Signal Processor) dedicated to specific signal processing, or a general-purpose operation such as a CPU (Central Processing Unit). This is also realized by cooperation between the processing device and the program. The program according to the present invention performs a process of calculating a waveform similarity for a first section and a second section that are equal in section length and are adjacent to each other in a sample sequence in which a plurality of samples of an input signal are arranged in time series. First processing means for executing a plurality of section lengths that are changed by a first change width corresponding to two or more samples, and a process for calculating a waveform similarity for the first section and the second section of the sample sequence Second processing means for executing a plurality of section lengths obtained by changing the section length in which the degree of similarity calculated by the first processing means is similar for each second change width smaller than the first change width, and the first processing means And a function that causes the computer to function as a companding processing means for generating an output signal having a waveform in which the input signal is expanded or compressed on the time axis, with the section length indicating the similarity calculated by the second processing means as a basic period. Ah . By the above program, the same operations and effects as the time-axis companding device of the present invention are exhibited. The program of the present invention is provided to a user in a form stored in a portable recording medium such as a CD-ROM and installed in a computer, or provided from a server device in a form of distribution via a network. Installed on the computer.
また、本発明のひとつの形態は、入力信号の複数のサンプルが時系列に配列されたサンプル列に基づいて当該入力信号の基本周期を特定する方法である。本形態に係る基本周期特定方法は、サンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1段階と、サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、第1段階で算定した類似度が類似を示す区間長を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2段階と、第1段階および第2段階にて算定された類似度が類似を示す区間長を基本周期として特定する第3段階とを含む。以上の方法によれば、処理量を削減しながら基本周期を高い精度で特定することが可能である。なお、以上の態様に係る基本周期特定方法を実現する装置(基本周期特定装置)やプログラムとしても本発明は特定され得る。 One embodiment of the present invention is a method for specifying a basic period of an input signal based on a sample sequence in which a plurality of samples of the input signal are arranged in time series. In the basic period specifying method according to the present embodiment, the processing for calculating the waveform similarity for the first section and the second section having the same section length and adjacent to each other in the sample sequence corresponds to two or more samples. The first stage executed for a plurality of section lengths changed by one change width and the process of calculating the waveform similarity for the first section and the second section of the sample sequence are similarities calculated in the first stage. The second stage executed for a plurality of section lengths obtained by changing the section length indicating similarity by a second change width smaller than the first change width, and the similarities calculated in the first stage and the second stage are similar. And a third stage that specifies the indicated section length as a basic period. According to the above method, it is possible to specify the basic period with high accuracy while reducing the processing amount. Note that the present invention can also be specified as a device (basic cycle specifying device) or program for realizing the basic cycle specifying method according to the above aspect.
<A:第1実施形態>
図1は、本発明の第1実施形態に係る時間軸圧伸装置の構成を示すブロック図である。時間軸圧伸装置100は、楽音や音声の波形を示す入力信号(オーディオ信号)VINを時間軸の方向に伸長または圧縮した波形の出力信号VOUTを生成する装置である。図1に示すように、時間軸圧伸装置100は、記憶回路10と制御回路20と出力回路40とを具備する。
<A: First Embodiment>
FIG. 1 is a block diagram showing a configuration of a time axis companding device according to the first embodiment of the present invention. The time axis companding
記憶回路10には入力信号VINのサンプル列が外部から供給される。サンプル列は、入力信号VINから抽出された多数のサンプルを時系列に配列した集合である。記憶回路10は、各サンプルを順次に格納する入力バッファ回路である。
A sample string of the input signal VIN is supplied to the
制御回路20は、プログラムを実行することで入力信号VINのサンプル列から出力信号VOUTのサンプル列を生成する演算処理装置(CPU)である。出力回路40は、出力信号VOUTの各サンプルを順次に蓄積するとともに所定の周期で各サンプルを順次に出力する出力バッファ回路である。
The
図1に示すように、制御回路20は、プログラムを実行することで基本周期特定部22および圧伸処理部24として機能する。ただし、基本周期特定部22や圧伸処理部24はDSPなどのハードウェア回路によって実現されてもよい。基本周期特定部22は、入力信号VINのうち相類似する波形が反復する区間の時間長である基本周期LWを特定する。図1に示すように、基本周期特定部22は、第1処理部31と第2処理部32とに区分される。
As illustrated in FIG. 1, the
図2は、第1処理部31および第2処理部32の動作の概略を説明するための概念図である。図2の部分(a)には、入力信号VINの各サンプルPが白丸および黒丸で図示されている。図2の部分(b)は第1処理部31の動作を示す概念図であり、図2の部分(c)は第2処理部32の動作を示す概念図である。
FIG. 2 is a conceptual diagram for explaining an outline of operations of the
図2の部分(b)および部分(c)に示すように、第1処理部31および第2処理部32の各々は、入力信号VINのうち区間長Lが等しい区間S1と区間S2とにおける波形の類似度Rを、各々の区間長L(区間S1および区間S2の各々に属するサンプルPの個数)を変化させながら複数回にわたって算定する。区間S1と区間S2とは時間軸上で相隣接する。第1処理部31および第2処理部32の各々は、類似度Rを算定するたびに、当該類似度Rと算定時の区間長Lとを対応させて記憶回路10に格納する。なお、類似度Rの算定には公知の任意の方法を採用することが可能であるが、本形態においては、区間S1と区間S2とで波形が類似する(類似性が高い)ほど類似度Rが減少するように類似度Rが算定される場合を想定する。例えば、類似度Rは、区間S1の波形の各サンプルPと区間S2の波形の各サンプルPとの2乗誤差である。
As shown in part (b) and part (c) of FIG. 2, each of the
図2の部分(b)に示すように、第1処理部31は、最大値LMAXから最小値LMINまでの範囲内で変化幅D1ずつ変化させた複数の区間長Lの各々について区間S1と区間S2との類似度Rを算定する。変化幅D1は2以上の数値である。図2の部分(a)には、入力信号VINの多数のサンプルPを所定の間引数(本形態では「4」)で間引いた後のサンプルPが便宜的に白丸で図示され、それ以外のサンプルP(間引かれたサンプルP)が黒丸で図示されている。図2の部分(b)に示すように、変化幅D1は、入力信号VINの間引き後の各サンプルPの間隔(すなわち間引き前の入力信号VINにて相前後する各サンプルPの間隔DSの2個分以上)に相当する。図2の変化幅D1は間隔DSの4個分に相当する。換言すると、第1処理部31は、最大値LMAXから最小値LMINまでの範囲内でひとつのサンプルPに相当する「1」ずつ変化させた全種類(「LMAX−LMIN+1」種類)の区間長Lを所定の間引数(D1)で間引いたときの残余の区間長Lについて類似度Rを算定し、間引かれた区間長Lについては類似度Rの算定を省略する。
As shown in part (b) of FIG. 2, the
第1処理部31が類似度Rを算定した全部の区間長Lのなかから類似度Rが小さい順番(すなわち区間S1と区間S2とで波形が類似する順番)に所定個の区間長L(以下では特に「仮区間長LX」という)が第2処理部32による処理の対象として選択される。図2の部分(c)においては、第1処理部31の算定した類似度Rが小さいひとつの区間長L(LMAX−2・D1)が仮区間長LXとして代表的に図示されている。
Among all the section lengths L for which the
図2の部分(c)に示すように、第2処理部32は、各仮区間長LXを変化幅D2ずつ増減させた所定個((2・LD)個)の区間長Lの各々について区間S1と区間S2との類似度Rを算定する。変化幅D2は変化幅D1よりも小さい。本形態における変化幅D2は、間隔DSの1個分(1サンプル分)に相当する「1」である。
As shown in part (c) of FIG. 2, the
数値LD(以下では「再検索幅LD」という)は、ひとつの仮区間長LXから変化幅D2ずつ変化させて類似度Rを算定する区間長Lの個数を規定する。図2の部分(c)には、再検索幅LDを「3」に設定した場合が例示されている。したがって、図2の部分(c)に示すように、第2処理部32は、第1処理部31による処理の結果から抽出された仮区間長LXごとに、区間長「LX−3」から区間長「LX+3」までの6個(既に類似度Rを算定した区間長LXは除外する)の区間長Lについて類似度Rを算定する。
The numerical value LD (hereinafter referred to as “re-search width LD”) defines the number of section lengths L for calculating the similarity R by changing the change width D2 from one temporary section length LX. Part (c) of FIG. 2 illustrates the case where the re-search width LD is set to “3”. Therefore, as shown in part (c) of FIG. 2, the
第1処理部31および第2処理部32の算定した類似度Rが最小である区間長L(区間S1と区間S2とで波形が最も類似する区間長L)が基本周期LWとして特定される。圧伸処理部24は、基本周期特定部22が特定した基本周期LWと外部から指定される圧伸率Cとに基づいて出力信号VOUTのサンプル列を生成する。圧伸率Cは、例えば入力装置(図示略)に対する利用者からの操作に応じて設定される。
The section length L (the section length L having the most similar waveform in the sections S1 and S2) having the minimum similarity R calculated by the
圧伸率Cが入力信号VINの圧縮を示す場合、圧伸処理部24は、入力信号VINのうち基本周期LWの区間S1と区間S2とを合成(例えばクロスフェード)し、合成後の波形を区間S1および区間S2に置換することで出力信号VOUTを生成する。また、圧伸率Cが入力信号VINの伸長を示す場合、圧伸処理部24は、入力信号VINのうち基本周期LWの区間S1と区間S2とを合成し、合成後の波形を区間S1および区間S2との間に挿入することで出力信号VOUTを生成する。なお、基本周期LWと圧伸率Cとに応じた入力信号VINの圧伸には公知の任意の方法を採用することが可能である。
When the companding ratio C indicates compression of the input signal VIN, the
次に、図3を参照して、第1処理部31がN個(Nは自然数)の仮区間長LXを特定する動作の具体例を説明する。第1処理部31は、記憶回路10に格納された変数LX[1]〜LX[N]と変数RX[1]〜RX[N]とをゼロに初期化する(ステップSA1)。図3の処理が完了した段階における変数LX[1]〜LX[N]がN個の仮区間長LXに相当する。変数RX[1]〜RX[N]は、変数LX[1]〜LX[N]の各々を区間長Lとしたときの区間S1と区間S2との類似度Rである。
Next, a specific example of an operation in which the
第1処理部31は、区間S1および区間S2の区間長Lを最大値LMAXに設定し(ステップSA2)、区間長Lの区間S1と区間S2とについて波形の類似度Rを算定する(ステップSA3)。区間S1の波形は、未処理で最も古いサンプルPに対応した時点TCから時点「TC+L−1」までのL個のサンプルPで表現され、区間S2の波形は、時点「TC+L」から時点「TC+2L−1」までのL個のサンプルPで表現される。
The
第1処理部31は、ステップSA3で算定した類似度Rを変数RX[1]および変数RPに格納するとともに現段階の区間長L(最大値LMAX)を変数LX[1]および変数LPに格納する(ステップSA4)。さらに、第1処理部31は、区間長Lから変化幅D1を減算する(ステップSA5)。図2に示したように変化幅D1は2以上の数値である。そして、第1処理部31は、ステップSA5における更新後の区間長Lの区間S1と区間S2とについて、ステップSA3と同様の方法で類似度Rを算定する(ステップSA6)。
The
第1処理部31は、変数iを「1」に初期化する(ステップSA7)。次いで、第1処理部31は、直前のステップSA6で算定した類似度Rが変数RX[i]を下回るか否かを判定する(ステップSA8)。ステップSA8の結果が肯定である場合(区間長Lの区間S1と区間S2とで波形の類似性が高い場合)、第1処理部31は、現段階で記憶回路10に格納されている変数LX[i]〜LX[N-1]を変数LX[i+1]〜LX[N]にシフトするとともに変数RX[i]〜RX[N-1]を変数RX[i+1]〜LX[N]にシフトする(ステップSA9)。そして、第1処理部31は、変数RX[i]を今回の類似度Rに更新するとともに変数LX[i]を現段階の区間長Lに更新してからステップSA11に処理を移行する(ステップSA10)。一方、ステップSA8の結果が否定である場合、第1処理部31は、ステップSA9およびステップSA10の処理を実行せずにステップSA11に処理を移行する。
The
ステップSA11において、第1処理部31は、変数iに「1」を加算したうえで、加算後の変数iが数値Nを上回るか否かを判定する(ステップSA12)。ステップSA12の結果が否定である場合、第1処理部31は、更新後の変数iについてステップSA8からステップSA11までの処理を繰返す。一方、ステップSA12の結果が肯定である場合、第1処理部31は、ステップSA13に処理を移行する。以上のようにステップSA6からステップSA12までの処理が反復されることで、変数LX[i]には、第1処理部31が算定した類似度Rの小さい順番(区間S1と区間S2とで波形の類似性が高い順番)に数えて第i番目の区間長Lが格納され、変数RX[i]には、区間S1および区間S2を区間長LX[i]に設定したときの類似度Rが格納される。
In step SA11, the
ステップSA13において、第1処理部31は、現段階の区間長Lから変化幅D1を減算した数値を新たな区間長Lとして設定する。そして、第1処理部31は、ステップSA13における更新後の区間長Lが最小値LMINを下回るか否かを判定する(ステップSA14)。ステップSA14の結果が否定である場合、第1処理部31は、更新後の区間長LについてステップSA6からステップSA12の処理を繰返す。ステップSA14の結果が肯定である場合(すなわち最大値LMAXから最小値LMINまでの範囲で変化幅D1ずつ変化させた全部の区間長Lについて処理が完了した場合)、第1処理部31は図3の処理を終了する。
In step SA13, the
以上に説明したように、最大値LMAXから最小値LMINまでの範囲内で区間長Lを変化幅D1ずつ変化させながらステップSA6からステップSA13の処理が反復される。図3の処理が完了した段階では、類似度Rが小さい順番(区間S1と区間S2とで波形の類似性が高い順番)に数えてN個の区間長Lが仮区間長LXとして変数LX[1]〜LX[N]に格納されるとともに、N個の仮区間長LXの各々に対応する類似度Rが変数RX[1]〜RX[N]に格納されている。 As described above, the processing from step SA6 to step SA13 is repeated while changing the section length L by the change width D1 within the range from the maximum value LMAX to the minimum value LMIN. At the stage where the processing of FIG. 3 is completed, N section lengths L are counted as the provisional section length LX as a temporary section length LX in the order of decreasing similarity R (in order of increasing waveform similarity between section S1 and section S2). 1] to LX [N], and the similarity R corresponding to each of the N provisional section lengths LX is stored in variables RX [1] to RX [N].
次に、図4を参照して、第2処理部32が基本周期LWを特定する動作の具体例を説明する。
第2処理部32は、変数iを「1」に初期化したうえで(ステップSB1)、変数RX[i]が変数RP(初期値はステップSA4で設定される)を下回るか否かを判定する(ステップSB2)。ステップSB2の結果が肯定である場合、第2処理部32は、変数LPを変数LX[i]に更新するとともに変数RPを変数RX[i]に更新する(ステップSB3)。一方、ステップSB2の結果が否定である場合にはステップSB3の処理は実行されない。すなわち、変数LPは、現時点で類似度RX[i]が最小である仮区間長LX[i]に維持され、変数RPは、当該類似度RX[i]に維持される。
Next, a specific example of an operation in which the
The
次いで、第2処理部32は、区間長Lを、変数LPと再検索幅LDとの加算値に更新する(ステップSB4)。第2処理部32は、ステップSB4における更新後の区間長Lの区間S1と区間S2とについて、ステップSA3やステップSA6と同様の方法で類似度Rを算定する(ステップSB5)。
Next, the
第2処理部32は、ステップSB5で算定した類似度Rが変数RPを下回るか否かを判定する(ステップSB6)。ステップSB6の結果が肯定である場合、第2処理部32は、ステップSB5で算定した類似度Rを変数RPに格納するとともに現段階の区間長Lを変数LPに格納する(ステップSB7)。一方、ステップSB6の結果が否定である場合にはステップSB7の処理が実行されない。
The
次いで、第2処理部32は、現段階の区間長Lから変化幅D2を減算した数値を新たな区間長Lとして設定する(ステップSB8)。図2に示したように変化幅D2はステップSA5やステップSA13における変化幅D1よりも小さい。なお、仮区間長LX[i]の類似度Rは既に算定されているから、ステップSB8において、第2処理部32は、変化幅D2の減算後の区間長Lが仮区間長LX[i]に合致する場合にはさらに変化幅D2を減算する。すなわち、仮区間長LX[i]についてはステップSB5からステップSB7までの処理が省略される。
Next, the
第2処理部32は、ステップSB8における更新後の区間長Lが、変数LPと再検索幅LDとの差分値(LP−LD)以上であるか否かを判定する(ステップSB9)。ステップSB9の結果が肯定である場合、第2処理部32はステップSB5に処理を移行する。以上のように、ステップSB5からステップSB9においては、仮区間長LX[i]を中央値として変化幅D2ずつ増減させた所定個(「2・LD」個)の区間長Lについて類似度Rが算定されるとともに変数LPと変数RPとが類似度Rの大小に応じて更新される。
The
ステップSB9の結果が否定である場合(すなわち、第i番目の仮区間長LX[i]を中央値とした「2・LD」個の区間長LについてステップSB5からステップSB9までの処理が完了した場合)、第2処理部32は、変数iに「1」を加算したうえで(ステップSB10)、加算後の変数iが数値Nを上回るか否かを判定する(ステップSB11)。ステップSB11の結果が否定である場合、第2処理部32は、ステップSB10における更新後の変数iについてステップSB2以後の処理を実行する。一方、ステップSB11の結果が肯定である場合(すなわちN個の仮区間長LX[1]〜LX[N]についてステップSB2からステップSB10までの処理が完了した場合)、第2処理部32は、現段階での変数LPを基本周期LWとして特定したうえで(ステップSB12)、図4の処理を終了する。
If the result of step SB9 is negative (that is, the processing from step SB5 to step SB9 is completed for “2.LD” section lengths L with the i-th provisional section length LX [i] as the median value) ), The
以上に説明したように、本形態においては、第1に、区間長Lを変化幅D1ずつ変化させながら区間S1と区間S2との類似度Rを算定することでN個の仮区間長LXが特定され、第2に、変化幅D1よりも小さい変化幅D2ずつ仮区間長LXを変化させた「2・LD」個の区間長Lについて類似度Rを算定することで基本周期LWが特定される。したがって、最小値LMINから最大値LMAXまでの全範囲にわたって区間長Lを「1」ずつ変化させて類似度Rを算定する構成(以下「対比例」という)と比較して、基本周期LWを特定するための処理量が削減されるという利点がある。 As described above, in this embodiment, first, N temporary section lengths LX are obtained by calculating the similarity R between the sections S1 and S2 while changing the section length L by the change width D1. Secondly, the basic period LW is specified by calculating the similarity R for “2 · LD” section lengths L in which the provisional section length LX is changed by a change width D2 smaller than the change width D1. The Therefore, the basic period LW is specified in comparison with the configuration in which the similarity R is calculated by changing the section length L by “1” over the entire range from the minimum value LMIN to the maximum value LMAX (hereinafter referred to as “comparative”). There is an advantage that the amount of processing to do is reduced.
図5は、類似度Rを算定する処理の回数を入力信号VINのサンプリング周波数FSごとに本形態と対比例とで比較した図表である。同図においては、図2に示したように、変化幅D1を「4」、変化幅D2を「1」、第1処理部31が特定する仮区間長LXの個数Nを「8」、再検索幅LDを「3」とした場合を想定している。また、対比例における類似度Rの算定の回数に対する本形態における類似度の算定の回数の割合が「比率」として記載されている。
FIG. 5 is a chart in which the number of processes for calculating the similarity R is compared with this embodiment for each sampling frequency FS of the input signal VIN. In the figure, as shown in FIG. 2, the change width D1 is “4”, the change width D2 is “1”, the number N of the provisional section lengths LX specified by the
図5に示すように、入力信号VINのサンプリング周波数FSが16kHzである場合、類似度Rを算定する処理の回数は、本形態においては対比例の44.8%まで低減される。また、対比例と比較したときの効果は、サンプリング周波数FSが増加するほど顕著となる。例えば、サンプリング周波数FSが48kHzである場合、本形態によれば対比例の31.6%まで類似度Rの算定の回数が削減される。 As shown in FIG. 5, when the sampling frequency FS of the input signal VIN is 16 kHz, the number of processes for calculating the similarity R is reduced to 44.8% in the present embodiment. The effect when compared with the proportionality becomes more prominent as the sampling frequency FS increases. For example, when the sampling frequency FS is 48 kHz, according to the present embodiment, the number of times of calculating the similarity R is reduced to 31.6% which is proportional.
また、変化幅D1よりも小さい変化幅D2ずつ仮区間長LXを変化させた各区間長Lについて第2処理部32が類似度Rを算定するから、変化幅D1ずつ変化させた区間長Lについてのみ第1処理部31が類似度Rを算定するとは言っても、基本周期LWを特定する精度が対比例と比較して不当に低下するということはない。さらに詳述すると以下の通りである。
Further, since the
図6から図8は、入力信号VINに設定された区間S1および区間S2の区間長Lと類似度Rとの関係を示すグラフである。図6においては、入力信号VINが有声音を示す場合が図示されている。同図に示すように、有声音については区間S1と区間S2との波形の類似度Rが区間長Lに対して周期的に変化するから、変化幅D1が類似度Rの変動の周期よりも小さければ、本形態のように区間長Lを変化幅D1ずつ変化させた場合であっても、第1処理部31が特定する仮区間長LXのなかには、図6において類似度Rが最小(最も類似する)となる区間長Lに近い仮区間長LXが含まれる。したがって、仮区間長LXを変化幅D2ずつ変化させた各区間長Lについて第2処理部32が類似度Rを算定することで、図6にて類似度Rが最小となる区間長L(すなわち基本周期LW)を対比例と同等の精度で特定することが可能である。
6 to 8 are graphs showing the relationship between the section length L and the similarity R of the sections S1 and S2 set in the input signal VIN. FIG. 6 illustrates a case where the input signal VIN indicates voiced sound. As shown in the figure, for voiced sound, the waveform similarity R between the section S1 and the section S2 changes periodically with respect to the section length L, so the change width D1 is larger than the period of variation of the similarity R. If it is smaller, even if the section length L is changed by the change width D1 as in the present embodiment, the similarity R is the smallest (most) in the temporary section length LX specified by the
図7は、有声音が存在しない状態(以下「無音の状態」という)で入力信号VINが収録された場合を示し、図8は、入力信号VINが無声子音を示す場合を示す。無音の状態や無声子音が存在する状態では、類似度Rは区間長Lに対して不規則に変動する。したがって、第1処理部31が区間長Lを変化幅D1ずつ変化させる本形態と区間長Lを「1」ずつ変化させる対比例とでは、実際に特定される基本周期LWが相違する。しかし、無音の状態や無声子音が存在する状態の入力信号VINは元来的に周期性に乏しい(明確な基本周期LWが現れない)から、区間長Lを変化幅D1ずつ変化させることで基本周期LWが対比例と相違するとしても出力信号VOUTの音質には殆ど影響しない。以上のように、本形態によれば、基本周期LWを特定する精度を対比例と同等に維持しながら処理量を削減できるという利点がある。
FIG. 7 shows a case where the input signal VIN is recorded in a state where there is no voiced sound (hereinafter referred to as “silent state”), and FIG. 8 shows a case where the input signal VIN indicates an unvoiced consonant. In a silent state or a state in which a voiceless consonant exists, the similarity R varies irregularly with respect to the section length L. Therefore, the fundamental cycle LW that is actually specified differs between the present embodiment in which the
<B:変形例>
以上の各形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を適宜に組み合わせてもよい。
<B: Modification>
Various modifications can be made to each of the above embodiments. An example of a specific modification is as follows. In addition, you may combine each following aspect suitably.
(1)変形例1
以上の形態においては変化幅D1を固定した場合を例示したが、変化幅D1(サンプル列の間引数)を可変に制御してもよい。例えば、図9に示すように、入力信号VINのサンプリング周波数FSに応じて変化幅D1を変化させる構成が採用される。図9の周波数特定部26は、例えば入力装置(図示略)に対する利用者からの操作や上位装置による指示に基づいて入力信号VINのサンプリング周波数FSを特定する手段である。第1処理部31は、周波数特定部26の特定したサンプリング周波数FSが高いほど変化幅D1が増加するように変化幅D1を制御する。
(1)
In the above embodiment, the case where the change width D1 is fixed is exemplified, but the change width D1 (an argument between sample columns) may be variably controlled. For example, as shown in FIG. 9, a configuration is adopted in which the change width D1 is changed according to the sampling frequency FS of the input signal VIN. The
変化幅D1を固定値とした場合には、サンプリング周波数FSが増加するほど第1処理部31による類似度Rの算定の回数は増加する。図9の構成によれば、サンプリング周波数FSが高いほど変化幅D1(サンプルPの間引数)が増加するから、サンプリング周波数FSが高い場合であっても、基本周期LWの特定の精度を低下させることなく第1処理部31による類似度Rの算定の回数を削減することが可能である。なお、変化幅D1以外の数値をサンプリング周波数FSに応じて変化させてもよい。例えば、仮区間長LXの個数Nを第1処理部31がサンプリング周波数FSに応じて制御する構成も採用される。例えば、サンプリング周波数FSが高いほど個数Nを増加させるといった具合である。
When the change width D1 is a fixed value, the number of times the similarity R is calculated by the
(2)変形例2
有声音には明確な周期性が現れる。したがって、図6ないし図8から把握されるように、入力信号VINが有声音を示す場合に、区間長Lに対する類似度Rの分布幅(類似度Rの最大値RMAXと最小値RMINとの差分値)ΔRは、入力信号VINが無音の状態を示す場合や無声子音を示す場合(すなわち入力信号VINに周期性が現れない場合)と比較して充分に大きい。換言すると、類似度Rの分布幅ΔRが大きい場合には入力信号VINが有声音を示し、類似度Rの分布幅ΔRが小さい場合には入力信号VINが無音の状態または無声子音を示すという傾向がある。一方、無音や無声子音を示す入力信号VINには明確な周期性が現れないから、そもそも基本周期LWを厳密に探索する意義に乏しい。
(2)
Clear periodicity appears in voiced sounds. Therefore, as understood from FIGS. 6 to 8, when the input signal VIN indicates voiced sound, the distribution width of the similarity R with respect to the section length L (the difference between the maximum value RMAX and the minimum value RMIN of the similarity R) (Value) ΔR is sufficiently large as compared with the case where the input signal VIN indicates a silent state or a case where the input signal VIN indicates a voiceless consonant (that is, when no periodicity appears in the input signal VIN). In other words, when the distribution width ΔR of the similarity R is large, the input signal VIN indicates voiced sound, and when the distribution width ΔR of the similarity R is small, the input signal VIN indicates a silent state or unvoiced consonant. There is. On the other hand, since no clear periodicity appears in the input signal VIN indicating silence or voiceless consonant, it is not meaningful to search for the fundamental period LW strictly.
したがって、第1処理部31が複数の区間長Lについて算定した類似度Rの分布幅ΔRが小さい場合(すなわち入力信号VINが無音や無声子音を示す可能性が高い場合)には第2処理部32による処理量を低減させる構成が好適に採用される。例えば、第1に、類似度Rの分布幅ΔRが小さいほど、ステップSB4やステップSB9で利用される再検索幅LD(すなわち第2処理部32が類似度Rを算定する回数)を第2処理部32が減少させるといった構成が採用される。第2に、分布幅ΔRが所定の閾値を下回る場合には第2処理部32が図4の処理(特に類似度Rの算定)を停止する構成も採用される。図4の処理を停止した場合、第2処理部32は、例えば、入力信号VINに拘わらず予め定められた基本周期LWを圧伸処理部24に指定する。
Therefore, when the distribution width ΔR of the similarity R calculated for the plurality of section lengths L by the
以上の構成によれば、入力信号VINが無音や無声子音を示す場合の第2処理部32の処理量を削減することが可能である。なお、第2処理部32の処理が簡略化または省略されるとは言っても、入力信号VINが有声音である場合には以上の形態と同様に基本周期LWが特定されるから、出力信号VOUTについては以上の形態と同等の音質を維持することが可能である。
According to the above configuration, it is possible to reduce the processing amount of the
(3)変形例3
図3や図4の処理に使用される各数値は適宜に変更される。例えば、再検索幅LDを変化幅D1よりも大きい数値に設定した構成によれば、基本周期LWをさらに高い精度で特定することが可能となる。なお、再検索幅LDが変化幅D1よりも大きい場合には、第2処理部32が類似度Rを算定する範囲(「LX+LD・D2」から「LX−LD・D2」までの範囲)内に、第1処理部31が既に類似度Rを算定した区間長Lが含まれる。したがって、類似度Rが既に算定された区間長Lについては、ステップSB5からステップSB8までの処理を第2処理部32が省略する構成も採用される。
(3)
Each numerical value used in the processing of FIG. 3 and FIG. 4 is appropriately changed. For example, according to the configuration in which the re-search width LD is set to a numerical value larger than the change width D1, the basic period LW can be specified with higher accuracy. When the re-search width LD is larger than the change width D1, the
(4)変形例
変化幅D1ずつ変化させた全部の区間長Lの類似度Rを第1処理部31が記憶回路10に格納しておき、第2処理部32が、記憶回路10内の類似度Rが高い順番に選択したN個の区間長Lを仮区間長LXとして図4の処理を実行する構成も採用される。すなわち、第1処理部31による処理(図3)のなかでN個の仮区間長LXが絞り込まれる構成は必ずしも必要ではない。
(4) Modification
The
(5)変形例5
基本周期特定部22は時間軸圧伸装置100以外にも使用される。例えば、基本周期LWの逆数をピッチとして出力するピッチ検出装置において入力信号VINから基本周期LWを特定するために基本周期特定部22を使用してもよい。
(5) Modification 5
The basic
100……時間軸圧伸装置、10……記憶回路、20……制御回路、22……基本周期特定部、24……圧伸処理部、31……第1処理部、32……第2処理部、40……出力回路、VIN……入力信号、VOUT……出力信号。
DESCRIPTION OF
Claims (9)
前記サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、前記第1段階で算定した類似度が類似を示す区間長を前記第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2段階と、
前記第1段階および前記第2段階にて算定された類似度が類似を示す区間長を基本周期として、前記入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理段階と
を有する時間軸圧伸方法。 The process of calculating the similarity of the waveforms for the first and second sections having the same section length and adjacent to each other in the sample sequence in which a plurality of samples of the input signal are arranged in time series is made into two or more samples. A first step of executing a plurality of section lengths changed by corresponding first change widths;
The process of calculating the waveform similarity for the first section and the second section of the sample sequence is the second change in which the section length indicating the similarity calculated in the first stage is smaller than the first change width. A second stage executed for a plurality of section lengths varied by width;
A companding process step of generating an output signal having a waveform obtained by expanding or compressing the input signal on a time axis, with the section length indicating the similarity calculated in the first step and the second step being similar. And a time axis companding method.
請求項1に記載の時間軸圧伸方法。 In the second stage, for each of a plurality of section lengths selected in order of decreasing similarity calculated in the first stage, a plurality of sections in which the section length is changed by the second change width The time axis companding method according to claim 1, wherein a similarity between the first section and the second section is calculated for the length.
請求項1または請求項2に記載の時間軸圧伸方法。 The time-axis companding method according to claim 1, wherein the second change width corresponds to an interval between samples that follow each other in the sample row.
請求項3に記載の時間軸圧伸方法。 The time axis companding method according to claim 3, wherein, in the first stage, the first change width is increased as the sampling frequency of the input signal is higher.
請求項1から請求項4の何れかに記載の時間軸圧伸方法。 5. The number of section lengths for calculating similarity in the second stage is decreased as the distribution width of the similarity calculated for each section length in the first stage is smaller. 5. The time axis companding method described in 1.
請求項1から請求項4の何れかに記載の時間軸圧伸方法。 5. The calculation of the similarity is stopped in the second stage when the distribution width of the similarity calculated for each section length in the first stage is less than a predetermined value. 5. Time axis companding method.
前記サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、前記第1処理手段の算定した類似度が類似を示す区間長を前記第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2処理手段と、
前記第1処理手段および前記第2処理手段の算定した類似度が類似を示す区間長を基本周期として、前記入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理手段と
を具備する時間軸圧伸装置。 The process of calculating the similarity of the waveforms for the first and second sections having the same section length and adjacent to each other in the sample sequence in which a plurality of samples of the input signal are arranged in time series is made into two or more samples. First processing means for executing a plurality of section lengths changed by corresponding first change widths;
The processing for calculating the similarity of the waveform for the first section and the second section of the sample sequence is performed by setting a second section length that is smaller than the first change width to a section length in which the similarity calculated by the first processing means shows similarity. A second processing means for executing a plurality of section lengths changed by a change width;
A companding processing means for generating an output signal having a waveform obtained by extending or compressing the input signal on the time axis, with a section length showing similarity between the calculated similarities of the first processing means and the second processing means as a basic period A time axis companding device comprising:
入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1処理手段と、
前記サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、前記第1処理手段の算定した類似度が類似を示す区間長を前記第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2処理手段と、
前記第1処理手段および前記第2処理手段の算定した類似度が類似を示す区間長を基本周期として、前記入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理手段と
として機能させるプログラム。 Computer
The process of calculating the similarity of the waveforms for the first and second sections having the same section length and adjacent to each other in the sample sequence in which a plurality of samples of the input signal are arranged in time series is made into two or more samples. First processing means for executing a plurality of section lengths changed by corresponding first change widths;
The processing for calculating the similarity of the waveform for the first section and the second section of the sample sequence is performed by setting a second section length that is smaller than the first change width to a section length in which the similarity calculated by the first processing means shows similarity. A second processing means for executing a plurality of section lengths changed by a change width;
A companding processing means for generating an output signal having a waveform obtained by extending or compressing the input signal on the time axis, with a section length showing similarity between the calculated similarities of the first processing means and the second processing means as a basic period A program that functions as and.
前記サンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1段階と、
前記サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、前記第1段階で算定した類似度が類似を示す区間長を前記第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2段階と、
前記第1段階および前記第2段階にて算定された類似度が類似を示す区間長を基本周期として特定する第3段階と
を有する基本周期特定方法。
A method of identifying a basic period of an input signal based on a sample sequence in which a plurality of samples of the input signal are arranged in time series,
A plurality of processings in which the processing for calculating the similarity between the waveforms of the first section and the second section having the same section length in the sample sequence and being adjacent to each other is changed by a first change width corresponding to two or more samples. A first stage to perform on the section length;
The process of calculating the waveform similarity for the first section and the second section of the sample sequence is the second change in which the section length indicating the similarity calculated in the first stage is smaller than the first change width. A second stage executed for a plurality of section lengths varied by width;
And a third step of specifying, as a basic cycle, a section length in which the similarity calculated in the first step and the second step shows similarity.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007043459A JP2008209447A (en) | 2007-02-23 | 2007-02-23 | Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007043459A JP2008209447A (en) | 2007-02-23 | 2007-02-23 | Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008209447A true JP2008209447A (en) | 2008-09-11 |
Family
ID=39785831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007043459A Pending JP2008209447A (en) | 2007-02-23 | 2007-02-23 | Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008209447A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017164216A1 (en) * | 2016-03-24 | 2017-09-28 | ヤマハ株式会社 | Acoustic processing method and acoustic processing device |
-
2007
- 2007-02-23 JP JP2007043459A patent/JP2008209447A/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017164216A1 (en) * | 2016-03-24 | 2017-09-28 | ヤマハ株式会社 | Acoustic processing method and acoustic processing device |
US10891966B2 (en) | 2016-03-24 | 2021-01-12 | Yamaha Corporation | Audio processing method and audio processing device for expanding or compressing audio signals |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7630883B2 (en) | Apparatus and method for creating pitch wave signals and apparatus and method compressing, expanding and synthesizing speech signals using these pitch wave signals | |
JP2007003682A (en) | Speaking speed converting device | |
JP4406440B2 (en) | Speech synthesis apparatus, speech synthesis method and program | |
JP2006293230A (en) | Device, program, and method for sound signal processing | |
JP2008209447A (en) | Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method | |
JP6011039B2 (en) | Speech synthesis apparatus and speech synthesis method | |
JPH1078791A (en) | Pitch converter | |
JP2005025173A (en) | Speech data selecting apparatus, method thereof and program | |
JP5552794B2 (en) | Method and apparatus for encoding acoustic signal | |
EP2634769B1 (en) | Sound synthesizing apparatus and sound synthesizing method | |
JP2008139573A (en) | Vocal quality conversion method, vocal quality conversion program and vocal quality conversion device | |
JP2007094004A (en) | Time base companding method of voice signal, and time base companding apparatus of voice signal | |
JP2007304515A (en) | Audio signal decompressing and compressing method and device | |
JP2002287758A (en) | Method and device for editing waveform | |
US6314403B1 (en) | Apparatus and method for generating a special effect on a digital signal | |
KR101650739B1 (en) | Method, server and computer program stored on conputer-readable medium for voice synthesis | |
JP5874341B2 (en) | Audio signal processing apparatus and program | |
US11348596B2 (en) | Voice processing method for processing voice signal representing voice, voice processing device for processing voice signal representing voice, and recording medium storing program for processing voice signal representing voice | |
JP5141033B2 (en) | Time axis companding device, time axis companding method and program | |
JP4437703B2 (en) | Speech speed conversion method and apparatus | |
JP5024136B2 (en) | Sound processing apparatus and program | |
JP3733964B2 (en) | Sound source waveform synthesizer using analysis results | |
JP4461985B2 (en) | Speech waveform expansion device, waveform expansion method, speech waveform reduction device, waveform reduction method, program, and speech processing device | |
JP2017111274A (en) | Data processor | |
JP2010032814A (en) | Impulse response processing device, reverberation applying device and program |