JP2008209447A - Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method - Google Patents

Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method Download PDF

Info

Publication number
JP2008209447A
JP2008209447A JP2007043459A JP2007043459A JP2008209447A JP 2008209447 A JP2008209447 A JP 2008209447A JP 2007043459 A JP2007043459 A JP 2007043459A JP 2007043459 A JP2007043459 A JP 2007043459A JP 2008209447 A JP2008209447 A JP 2008209447A
Authority
JP
Japan
Prior art keywords
section
similarity
section length
input signal
change width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007043459A
Other languages
Japanese (ja)
Inventor
Tsugio Ito
次男 伊藤
Norihiro Hayashida
教裕 林田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2007043459A priority Critical patent/JP2008209447A/en
Publication of JP2008209447A publication Critical patent/JP2008209447A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To reduce a processing amount for specifying a basic cycle. <P>SOLUTION: A first processing section 31 calculates a similarity degree R of waveforms of adjoining sections S1 and S2 in an input signal VIN, having the same section length L, for a plurality of section lengths L changed by a change width D1 corresponding to two or more samples. A second processing section 32 calculates the similarity degree R of waveforms of sections S1 and S2 of the input signal VIN, for the plurality of section lengths L generated by changing a temporary section length LX in which the similarity degree calculated by the first processing section 31 indicates similarity, by a change width D2 that is smaller than the change width D1. An expansion and compression section 24 generates an output signal VOUT of a waveform in which the input signal VIN is expanded or compressed on a time-axis, so that the section length L in which the similarity degree R calculated by the first processing section 31 and the second processing section 32 shows similarity, is a basic cycle LW. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、オーディオ信号などの入力信号のうち相類似する波形が反復する区間の時間長(以下「基本周期」という)を特定する技術に関する。   The present invention relates to a technique for specifying a time length (hereinafter referred to as “basic period”) of a section in which similar waveforms repeat among input signals such as audio signals.

基本周期分の波形を削除または挿入することで、ピッチやホルマントを維持しながら入力信号を時間軸の方向に圧縮または伸長する技術が従来から提案されている(例えば特許文献1)。特許文献1の技術においては、入力信号のうち同じ区間長で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理が、第1区間および第2区間の区間長をひとつのサンプル分ずつ変化させながら複数回にわたって反復され、類似度が最も高い区間長が基本周期として特定される。
特許第3465628号公報
Conventionally, a technique for compressing or expanding an input signal in the direction of the time axis while maintaining the pitch and formant by deleting or inserting a waveform corresponding to a basic period has been proposed (for example, Patent Document 1). In the technique of Patent Document 1, the process of calculating the waveform similarity for the first section and the second section that are adjacent to each other with the same section length in the input signal has one section length for the first section and the second section. The section length having the highest degree of similarity is specified as the basic period by being repeated a plurality of times while changing by the number of samples.
Japanese Patent No. 3465628

特許文献1の技術は、第1区間および第2区間の各々についてサンプルを間引いたうえで類似度を算定することで処理量の削減を図っている。しかし、類似度の算定の対象となるサンプルを間引いただけでは実際には処理量が充分に削減されない場合もあり、さらなる処理量の削減が望まれるところである。以上の事情に鑑みて、本発明は、基本周期の特定のための処理量を削減するという課題の解決を目的としている。   The technique of Patent Document 1 attempts to reduce the processing amount by calculating the similarity after thinning samples for each of the first section and the second section. However, there are cases where the amount of processing is not sufficiently reduced by simply thinning out samples for which the similarity is calculated, and further reduction of the amount of processing is desired. In view of the above circumstances, an object of the present invention is to solve the problem of reducing the processing amount for specifying the basic period.

以上の課題を解決するために、本発明に係る時間軸圧伸方法は、入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1段階(例えば図3の処理)と、サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、第1段階で算定した類似度が類似を示す区間長(仮区間長)を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2段階(例えば図4の処理)と、第1段階および第2段階にて算定された類似度が類似を示す区間長を基本周期として、入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理段階とを有する。   In order to solve the above-described problem, the time axis companding method according to the present invention includes a first interval and a first interval that are adjacent to each other in a sample sequence in which a plurality of samples of an input signal are arranged in time series. A first stage (for example, the process of FIG. 3) in which a process of calculating the similarity of waveforms for two sections is performed for a plurality of section lengths changed by a first change width corresponding to two or more samples, and a sample The processing for calculating the similarity of the waveform for the first section and the second section of the column is the second in which the section length (temporary section length) in which the similarity calculated in the first stage shows similarity is smaller than the first change width. The second stage (for example, the process of FIG. 4) executed for a plurality of section lengths changed by the change width, and the section length in which the similarity calculated in the first stage and the second stage shows similarity is set as a basic period. Waveform of input signal expanded or compressed on time axis And a companding process generating a force signal.

以上の構成においては、区間長を第1変化幅ずつ変化させながら第1区間と第2区間との波形の類似度が算定されたうえで、第1区間と第2区間との波形が類似する特定の区間長を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について類似度が算定される。したがって、区間長を第1変化幅ずつ変化させた区間長についてのみ類似度を算定する方法と比較して基本周期を高い精度で特定することができ、第2変化幅ずつ変化させた総ての区間長について類似度を算定する構成と比較して処理量を削減することができる。   In the above configuration, the waveform similarity between the first section and the second section is similar after the waveform similarity between the first section and the second section is calculated while changing the section length by the first change width. Similarities are calculated for a plurality of section lengths in which a specific section length is changed by a second change width smaller than the first change width. Therefore, it is possible to specify the basic period with high accuracy compared to the method of calculating the similarity only for the section length in which the section length is changed by the first change width, and for all the changes in the second change width. The amount of processing can be reduced as compared with the configuration for calculating the similarity for the section length.

本発明の好適な態様に係る時間軸圧伸方法の第2段階においては、第1段階にて算定された類似度が高い順番に選択された複数(例えば図3や図4のN個)の区間長の各々を対象として、当該区間長を第2変化幅ずつ変化させた複数の区間長について第1区間と第2区間との類似度を算定する。以上の態様によれば、第1段階で算定されたひとつの区間長のみを第2段階における処理の対象とする場合と比較して、基本周期の特定の精度を高めることができる。   In the second stage of the time axis companding method according to a preferred aspect of the present invention, a plurality of (for example, N pieces in FIGS. 3 and 4) selected in descending order of similarity calculated in the first stage. For each of the section lengths, the similarity between the first section and the second section is calculated for a plurality of section lengths obtained by changing the section length by the second change width. According to the above aspect, compared with the case where only one section length calculated in the first stage is the target of processing in the second stage, the specific accuracy of the basic period can be increased.

なお、第2変化幅は、第1変化幅よりも小さいという条件を満たす範囲で任意に設定される。ただし、第2変化幅を、入力信号のサンプル列にて相前後する各サンプルの間隔に相当する大きさに設定すれば、基本周期を高精度に特定するという効果が特に顕著となる。   The second change width is arbitrarily set in a range that satisfies the condition that it is smaller than the first change width. However, if the second change width is set to a size corresponding to the interval between successive samples in the sample sequence of the input signal, the effect of specifying the basic period with high accuracy becomes particularly significant.

本発明の具体的な態様に係る時間軸圧伸方法の第1段階においては、第1段階に関する変数が入力信号のサンプリング周波数に応じて可変に制御される。例えば、入力信号のサンプリング周波数が高いほど第1変化幅が増加する。以上の態様によれば、サンプリング周波数が高い場合であっても第1段階における処理量を抑制することが可能である。   In the first stage of the time axis companding method according to a specific aspect of the present invention, the variable relating to the first stage is variably controlled according to the sampling frequency of the input signal. For example, the first change width increases as the sampling frequency of the input signal is higher. According to the above aspect, it is possible to suppress the processing amount in the first stage even when the sampling frequency is high.

本発明の具体的な態様に係る時間軸圧伸方法においては、第1段階にて各区間長について算定された類似度の分布幅が小さいほど、第2段階にて類似度を算定する区間長の個数(例えば図4の再検索幅LD)を減少させる。入力信号のうち類似度の分布幅が小さい区間(例えば無音や無声子音の区間)には明確な周期性が現れない可能性が高い。したがって、以上の態様によれば、入力信号のうち有声音の区間(すなわち本来的に基本周期を特定すべき区間)について基本周期の特定の精度を高水準に維持しながら、第2段階における処理量を削減することが可能である。また、第1段階にて各区間長について算定された類似度の分布幅が所定値を下回る場合に、第2段階における類似度の算定を停止すれば、第2段階における処理量を削減するという効果はさらに顕著となる。   In the time axis companding method according to a specific aspect of the present invention, the section length for calculating the similarity in the second stage is smaller as the distribution width of the similarity calculated for each section length in the first stage is smaller. (For example, the re-search width LD in FIG. 4) is reduced. There is a high possibility that a clear periodicity does not appear in a section in which the similarity distribution width is small (for example, a section of silent or unvoiced consonant) in the input signal. Therefore, according to the above aspect, the processing in the second stage is performed while maintaining the specific accuracy of the fundamental period at a high level for the voiced sound section of the input signal (that is, the section in which the fundamental period should be originally identified). It is possible to reduce the amount. Further, if the distribution of similarity calculated for each section length in the first stage is below a predetermined value, the processing amount in the second stage will be reduced if the similarity calculation in the second stage is stopped. The effect becomes even more remarkable.

本発明は、入力信号を時間軸の方向に圧縮または伸長する装置としても特定される。本発明の時間軸圧伸装置は、入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1処理手段と、サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、第1処理手段の算定した類似度が類似を示す区間長を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2処理手段と、第1処理手段および第2処理手段の算定した類似度が類似を示す区間長を基本周期として、入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理手段とを具備する。以上の装置によっても、本発明に係る時間軸圧伸方法と同様の作用および効果が相される。   The present invention is also specified as a device that compresses or expands an input signal in the direction of the time axis. The time-axis companding device according to the present invention calculates the similarity of waveforms for a first section and a second section that are equal in section length and are adjacent to each other in a sample sequence in which a plurality of samples of an input signal are arranged in time series. First processing means for executing the processing to be performed for a plurality of section lengths that are changed by the first change width corresponding to two or more samples, and the waveform similarity for the first section and the second section of the sample sequence A second processing means for executing a calculation process for a plurality of section lengths obtained by changing the section length in which the degree of similarity calculated by the first processing means is similar by a second change width smaller than the first change width; Companding processing means for generating an output signal having a waveform in which the input signal is expanded or compressed on the time axis with the interval length in which the similarity calculated by the first processing means and the second processing means is similar as the basic period. . Also with the above apparatus, the same operation and effect as the time-axis companding method according to the present invention are combined.

本発明に係る時間軸圧伸装置は、特定の信号処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラムとの協働によっても実現される。本発明に係るプログラムは、入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1処理手段と、サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、第1処理手段の算定した類似度が類似を示す区間長を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2処理手段と、第1処理手段および第2処理手段の算定した類似度が類似を示す区間長を基本周期として、入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理手段としてコンピュータを機能させる内容である。以上のプログラムによっても、本発明の時間軸圧伸装置と同様の作用および効果が奏される。なお、本発明のプログラムは、CD−ROMなど可搬型の記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、ネットワークを介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。   The time axis companding device according to the present invention is realized by hardware (electronic circuit) such as a DSP (Digital Signal Processor) dedicated to specific signal processing, or a general-purpose operation such as a CPU (Central Processing Unit). This is also realized by cooperation between the processing device and the program. The program according to the present invention performs a process of calculating a waveform similarity for a first section and a second section that are equal in section length and are adjacent to each other in a sample sequence in which a plurality of samples of an input signal are arranged in time series. First processing means for executing a plurality of section lengths that are changed by a first change width corresponding to two or more samples, and a process for calculating a waveform similarity for the first section and the second section of the sample sequence Second processing means for executing a plurality of section lengths obtained by changing the section length in which the degree of similarity calculated by the first processing means is similar for each second change width smaller than the first change width, and the first processing means And a function that causes the computer to function as a companding processing means for generating an output signal having a waveform in which the input signal is expanded or compressed on the time axis, with the section length indicating the similarity calculated by the second processing means as a basic period. Ah . By the above program, the same operations and effects as the time-axis companding device of the present invention are exhibited. The program of the present invention is provided to a user in a form stored in a portable recording medium such as a CD-ROM and installed in a computer, or provided from a server device in a form of distribution via a network. Installed on the computer.

また、本発明のひとつの形態は、入力信号の複数のサンプルが時系列に配列されたサンプル列に基づいて当該入力信号の基本周期を特定する方法である。本形態に係る基本周期特定方法は、サンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1段階と、サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、第1段階で算定した類似度が類似を示す区間長を第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2段階と、第1段階および第2段階にて算定された類似度が類似を示す区間長を基本周期として特定する第3段階とを含む。以上の方法によれば、処理量を削減しながら基本周期を高い精度で特定することが可能である。なお、以上の態様に係る基本周期特定方法を実現する装置(基本周期特定装置)やプログラムとしても本発明は特定され得る。   One embodiment of the present invention is a method for specifying a basic period of an input signal based on a sample sequence in which a plurality of samples of the input signal are arranged in time series. In the basic period specifying method according to the present embodiment, the processing for calculating the waveform similarity for the first section and the second section having the same section length and adjacent to each other in the sample sequence corresponds to two or more samples. The first stage executed for a plurality of section lengths changed by one change width and the process of calculating the waveform similarity for the first section and the second section of the sample sequence are similarities calculated in the first stage. The second stage executed for a plurality of section lengths obtained by changing the section length indicating similarity by a second change width smaller than the first change width, and the similarities calculated in the first stage and the second stage are similar. And a third stage that specifies the indicated section length as a basic period. According to the above method, it is possible to specify the basic period with high accuracy while reducing the processing amount. Note that the present invention can also be specified as a device (basic cycle specifying device) or program for realizing the basic cycle specifying method according to the above aspect.

<A:第1実施形態>
図1は、本発明の第1実施形態に係る時間軸圧伸装置の構成を示すブロック図である。時間軸圧伸装置100は、楽音や音声の波形を示す入力信号(オーディオ信号)VINを時間軸の方向に伸長または圧縮した波形の出力信号VOUTを生成する装置である。図1に示すように、時間軸圧伸装置100は、記憶回路10と制御回路20と出力回路40とを具備する。
<A: First Embodiment>
FIG. 1 is a block diagram showing a configuration of a time axis companding device according to the first embodiment of the present invention. The time axis companding apparatus 100 is an apparatus that generates an output signal VOUT having a waveform obtained by extending or compressing an input signal (audio signal) VIN indicating a waveform of a musical tone or a voice in the direction of the time axis. As shown in FIG. 1, the time axis companding device 100 includes a storage circuit 10, a control circuit 20, and an output circuit 40.

記憶回路10には入力信号VINのサンプル列が外部から供給される。サンプル列は、入力信号VINから抽出された多数のサンプルを時系列に配列した集合である。記憶回路10は、各サンプルを順次に格納する入力バッファ回路である。   A sample string of the input signal VIN is supplied to the memory circuit 10 from the outside. The sample string is a set in which a large number of samples extracted from the input signal VIN are arranged in time series. The storage circuit 10 is an input buffer circuit that sequentially stores each sample.

制御回路20は、プログラムを実行することで入力信号VINのサンプル列から出力信号VOUTのサンプル列を生成する演算処理装置(CPU)である。出力回路40は、出力信号VOUTの各サンプルを順次に蓄積するとともに所定の周期で各サンプルを順次に出力する出力バッファ回路である。   The control circuit 20 is an arithmetic processing unit (CPU) that generates a sample sequence of the output signal VOUT from the sample sequence of the input signal VIN by executing a program. The output circuit 40 is an output buffer circuit that sequentially accumulates each sample of the output signal VOUT and sequentially outputs each sample at a predetermined period.

図1に示すように、制御回路20は、プログラムを実行することで基本周期特定部22および圧伸処理部24として機能する。ただし、基本周期特定部22や圧伸処理部24はDSPなどのハードウェア回路によって実現されてもよい。基本周期特定部22は、入力信号VINのうち相類似する波形が反復する区間の時間長である基本周期LWを特定する。図1に示すように、基本周期特定部22は、第1処理部31と第2処理部32とに区分される。   As illustrated in FIG. 1, the control circuit 20 functions as a basic period specifying unit 22 and a companding processing unit 24 by executing a program. However, the basic period specifying unit 22 and the companding processing unit 24 may be realized by a hardware circuit such as a DSP. The basic period specifying unit 22 specifies a basic period LW that is a time length of a section in which similar waveforms of the input signal VIN repeat. As shown in FIG. 1, the basic period specifying unit 22 is divided into a first processing unit 31 and a second processing unit 32.

図2は、第1処理部31および第2処理部32の動作の概略を説明するための概念図である。図2の部分(a)には、入力信号VINの各サンプルPが白丸および黒丸で図示されている。図2の部分(b)は第1処理部31の動作を示す概念図であり、図2の部分(c)は第2処理部32の動作を示す概念図である。   FIG. 2 is a conceptual diagram for explaining an outline of operations of the first processing unit 31 and the second processing unit 32. In part (a) of FIG. 2, each sample P of the input signal VIN is shown by a white circle and a black circle. Part (b) of FIG. 2 is a conceptual diagram showing the operation of the first processing unit 31, and part (c) of FIG. 2 is a conceptual diagram showing the operation of the second processing unit 32.

図2の部分(b)および部分(c)に示すように、第1処理部31および第2処理部32の各々は、入力信号VINのうち区間長Lが等しい区間S1と区間S2とにおける波形の類似度Rを、各々の区間長L(区間S1および区間S2の各々に属するサンプルPの個数)を変化させながら複数回にわたって算定する。区間S1と区間S2とは時間軸上で相隣接する。第1処理部31および第2処理部32の各々は、類似度Rを算定するたびに、当該類似度Rと算定時の区間長Lとを対応させて記憶回路10に格納する。なお、類似度Rの算定には公知の任意の方法を採用することが可能であるが、本形態においては、区間S1と区間S2とで波形が類似する(類似性が高い)ほど類似度Rが減少するように類似度Rが算定される場合を想定する。例えば、類似度Rは、区間S1の波形の各サンプルPと区間S2の波形の各サンプルPとの2乗誤差である。   As shown in part (b) and part (c) of FIG. 2, each of the first processing unit 31 and the second processing unit 32 has waveforms in the sections S1 and S2 having the same section length L in the input signal VIN. The similarity R is calculated a plurality of times while changing each section length L (the number of samples P belonging to each of the sections S1 and S2). The section S1 and the section S2 are adjacent to each other on the time axis. Each time the first processing unit 31 and the second processing unit 32 calculate the similarity R, the similarity R and the section length L at the time of calculation are associated with each other and stored in the storage circuit 10. It is possible to employ any known method for calculating the similarity R. However, in this embodiment, the similarity R increases as the waveform is more similar (higher similarity) between the sections S1 and S2. Assume that the similarity R is calculated so as to decrease. For example, the similarity R is a square error between each sample P of the waveform in the section S1 and each sample P of the waveform in the section S2.

図2の部分(b)に示すように、第1処理部31は、最大値LMAXから最小値LMINまでの範囲内で変化幅D1ずつ変化させた複数の区間長Lの各々について区間S1と区間S2との類似度Rを算定する。変化幅D1は2以上の数値である。図2の部分(a)には、入力信号VINの多数のサンプルPを所定の間引数(本形態では「4」)で間引いた後のサンプルPが便宜的に白丸で図示され、それ以外のサンプルP(間引かれたサンプルP)が黒丸で図示されている。図2の部分(b)に示すように、変化幅D1は、入力信号VINの間引き後の各サンプルPの間隔(すなわち間引き前の入力信号VINにて相前後する各サンプルPの間隔DSの2個分以上)に相当する。図2の変化幅D1は間隔DSの4個分に相当する。換言すると、第1処理部31は、最大値LMAXから最小値LMINまでの範囲内でひとつのサンプルPに相当する「1」ずつ変化させた全種類(「LMAX−LMIN+1」種類)の区間長Lを所定の間引数(D1)で間引いたときの残余の区間長Lについて類似度Rを算定し、間引かれた区間長Lについては類似度Rの算定を省略する。   As shown in part (b) of FIG. 2, the first processing unit 31 uses the section S1 and the section for each of the plurality of section lengths L changed by the change width D1 within the range from the maximum value LMAX to the minimum value LMIN. The similarity R with S2 is calculated. The change width D1 is a numerical value of 2 or more. In part (a) of FIG. 2, the sample P after thinning out a number of samples P of the input signal VIN with an argument (“4” in the present embodiment) for a predetermined period is shown as a white circle for convenience, and the rest Sample P (thinned sample P) is shown as a black circle. As shown in part (b) of FIG. 2, the change width D1 is the interval between the samples P after the thinning of the input signal VIN (that is, the interval DS of the samples P that precede and follow the input signal VIN before the thinning is 2). Equivalent to more than one). The change width D1 in FIG. 2 corresponds to four intervals DS. In other words, the first processing unit 31 sets the section length L of all types (“LMAX−LMIN + 1” types) changed by “1” corresponding to one sample P within the range from the maximum value LMAX to the minimum value LMIN. Is calculated for the remaining section length L when thinned out with the argument (D1) for a predetermined period, and the calculation of the similarity R is omitted for the section length L thinned out.

第1処理部31が類似度Rを算定した全部の区間長Lのなかから類似度Rが小さい順番(すなわち区間S1と区間S2とで波形が類似する順番)に所定個の区間長L(以下では特に「仮区間長LX」という)が第2処理部32による処理の対象として選択される。図2の部分(c)においては、第1処理部31の算定した類似度Rが小さいひとつの区間長L(LMAX−2・D1)が仮区間長LXとして代表的に図示されている。   Among all the section lengths L for which the first processing unit 31 has calculated the similarity degree R, a predetermined number of section lengths L (hereinafter referred to as the order in which the waveforms are similar between the sections S1 and S2). In particular, “temporary section length LX” is selected as a target of processing by the second processing unit 32. In part (c) of FIG. 2, one section length L (LMAX-2 · D1) having a small similarity R calculated by the first processing unit 31 is representatively shown as a provisional section length LX.

図2の部分(c)に示すように、第2処理部32は、各仮区間長LXを変化幅D2ずつ増減させた所定個((2・LD)個)の区間長Lの各々について区間S1と区間S2との類似度Rを算定する。変化幅D2は変化幅D1よりも小さい。本形態における変化幅D2は、間隔DSの1個分(1サンプル分)に相当する「1」である。   As shown in part (c) of FIG. 2, the second processing unit 32 determines a section for each of a predetermined number ((2 · LD)) of section lengths L obtained by increasing or decreasing each provisional section length LX by the change width D2. The similarity R between S1 and section S2 is calculated. The change width D2 is smaller than the change width D1. The change width D2 in this embodiment is “1” corresponding to one interval DS (one sample).

数値LD(以下では「再検索幅LD」という)は、ひとつの仮区間長LXから変化幅D2ずつ変化させて類似度Rを算定する区間長Lの個数を規定する。図2の部分(c)には、再検索幅LDを「3」に設定した場合が例示されている。したがって、図2の部分(c)に示すように、第2処理部32は、第1処理部31による処理の結果から抽出された仮区間長LXごとに、区間長「LX−3」から区間長「LX+3」までの6個(既に類似度Rを算定した区間長LXは除外する)の区間長Lについて類似度Rを算定する。   The numerical value LD (hereinafter referred to as “re-search width LD”) defines the number of section lengths L for calculating the similarity R by changing the change width D2 from one temporary section length LX. Part (c) of FIG. 2 illustrates the case where the re-search width LD is set to “3”. Therefore, as shown in part (c) of FIG. 2, the second processing unit 32 determines the interval from the interval length “LX-3” for each provisional interval length LX extracted from the result of the processing by the first processing unit 31. The similarity R is calculated for the section lengths L up to the length “LX + 3” (excluding the section length LX for which the similarity R has already been calculated).

第1処理部31および第2処理部32の算定した類似度Rが最小である区間長L(区間S1と区間S2とで波形が最も類似する区間長L)が基本周期LWとして特定される。圧伸処理部24は、基本周期特定部22が特定した基本周期LWと外部から指定される圧伸率Cとに基づいて出力信号VOUTのサンプル列を生成する。圧伸率Cは、例えば入力装置(図示略)に対する利用者からの操作に応じて設定される。   The section length L (the section length L having the most similar waveform in the sections S1 and S2) having the minimum similarity R calculated by the first processing section 31 and the second processing section 32 is specified as the basic period LW. The companding processing unit 24 generates a sample sequence of the output signal VOUT based on the basic period LW specified by the basic period specifying unit 22 and the companding rate C specified from the outside. The companding rate C is set in accordance with, for example, a user operation on an input device (not shown).

圧伸率Cが入力信号VINの圧縮を示す場合、圧伸処理部24は、入力信号VINのうち基本周期LWの区間S1と区間S2とを合成(例えばクロスフェード)し、合成後の波形を区間S1および区間S2に置換することで出力信号VOUTを生成する。また、圧伸率Cが入力信号VINの伸長を示す場合、圧伸処理部24は、入力信号VINのうち基本周期LWの区間S1と区間S2とを合成し、合成後の波形を区間S1および区間S2との間に挿入することで出力信号VOUTを生成する。なお、基本周期LWと圧伸率Cとに応じた入力信号VINの圧伸には公知の任意の方法を採用することが可能である。   When the companding ratio C indicates compression of the input signal VIN, the companding processing unit 24 synthesizes (for example, crossfade) the section S1 and the section S2 of the basic period LW in the input signal VIN, and generates a combined waveform. The output signal VOUT is generated by replacing the section S1 and the section S2. When the companding rate C indicates the expansion of the input signal VIN, the companding processing unit 24 synthesizes the section S1 and the section S2 of the basic period LW in the input signal VIN, and the synthesized waveform is represented by the sections S1 and S2. The output signal VOUT is generated by inserting it between the section S2. It should be noted that any known method can be employed for companding the input signal VIN in accordance with the basic period LW and the companding rate C.

次に、図3を参照して、第1処理部31がN個(Nは自然数)の仮区間長LXを特定する動作の具体例を説明する。第1処理部31は、記憶回路10に格納された変数LX[1]〜LX[N]と変数RX[1]〜RX[N]とをゼロに初期化する(ステップSA1)。図3の処理が完了した段階における変数LX[1]〜LX[N]がN個の仮区間長LXに相当する。変数RX[1]〜RX[N]は、変数LX[1]〜LX[N]の各々を区間長Lとしたときの区間S1と区間S2との類似度Rである。   Next, a specific example of an operation in which the first processing unit 31 specifies N (N is a natural number) provisional section lengths LX will be described with reference to FIG. The first processing unit 31 initializes the variables LX [1] to LX [N] and variables RX [1] to RX [N] stored in the storage circuit 10 to zero (step SA1). The variables LX [1] to LX [N] at the stage where the processing of FIG. 3 is completed correspond to the N provisional section lengths LX. The variables RX [1] to RX [N] are the similarity R between the section S1 and the section S2 when each of the variables LX [1] to LX [N] is the section length L.

第1処理部31は、区間S1および区間S2の区間長Lを最大値LMAXに設定し(ステップSA2)、区間長Lの区間S1と区間S2とについて波形の類似度Rを算定する(ステップSA3)。区間S1の波形は、未処理で最も古いサンプルPに対応した時点TCから時点「TC+L−1」までのL個のサンプルPで表現され、区間S2の波形は、時点「TC+L」から時点「TC+2L−1」までのL個のサンプルPで表現される。   The first processing unit 31 sets the section length L of the sections S1 and S2 to the maximum value LMAX (step SA2), and calculates the waveform similarity R for the sections S1 and S2 of the section length L (step SA3). ). The waveform of the section S1 is expressed by L samples P from the time point TC corresponding to the unprocessed oldest sample P to the time point "TC + L-1", and the waveform of the section S2 is expressed from the time point "TC + L" to the time point "TC + 2L". -1 "is represented by L samples P.

第1処理部31は、ステップSA3で算定した類似度Rを変数RX[1]および変数RPに格納するとともに現段階の区間長L(最大値LMAX)を変数LX[1]および変数LPに格納する(ステップSA4)。さらに、第1処理部31は、区間長Lから変化幅D1を減算する(ステップSA5)。図2に示したように変化幅D1は2以上の数値である。そして、第1処理部31は、ステップSA5における更新後の区間長Lの区間S1と区間S2とについて、ステップSA3と同様の方法で類似度Rを算定する(ステップSA6)。   The first processing unit 31 stores the similarity R calculated in step SA3 in the variable RX [1] and the variable RP, and stores the current section length L (maximum value LMAX) in the variable LX [1] and the variable LP. (Step SA4). Further, the first processing unit 31 subtracts the change width D1 from the section length L (step SA5). As shown in FIG. 2, the change width D1 is a numerical value of 2 or more. Then, the first processing unit 31 calculates the similarity R for the section S1 and the section S2 with the section length L after the update in step SA5 by the same method as in step SA3 (step SA6).

第1処理部31は、変数iを「1」に初期化する(ステップSA7)。次いで、第1処理部31は、直前のステップSA6で算定した類似度Rが変数RX[i]を下回るか否かを判定する(ステップSA8)。ステップSA8の結果が肯定である場合(区間長Lの区間S1と区間S2とで波形の類似性が高い場合)、第1処理部31は、現段階で記憶回路10に格納されている変数LX[i]〜LX[N-1]を変数LX[i+1]〜LX[N]にシフトするとともに変数RX[i]〜RX[N-1]を変数RX[i+1]〜LX[N]にシフトする(ステップSA9)。そして、第1処理部31は、変数RX[i]を今回の類似度Rに更新するとともに変数LX[i]を現段階の区間長Lに更新してからステップSA11に処理を移行する(ステップSA10)。一方、ステップSA8の結果が否定である場合、第1処理部31は、ステップSA9およびステップSA10の処理を実行せずにステップSA11に処理を移行する。   The first processing unit 31 initializes the variable i to “1” (step SA7). Next, the first processing unit 31 determines whether or not the similarity R calculated in the immediately preceding step SA6 is less than the variable RX [i] (step SA8). When the result of step SA8 is affirmative (when the similarity of the waveform is high between the section S1 and the section S2 having the section length L), the first processing unit 31 sets the variable LX stored in the storage circuit 10 at this stage. [i] to LX [N-1] are shifted to variables LX [i + 1] to LX [N] and variables RX [i] to RX [N-1] are changed to variables RX [i + 1] to LX [ N] (step SA9). The first processing unit 31 updates the variable RX [i] to the current similarity R and updates the variable LX [i] to the current section length L, and then proceeds to step SA11 (step S11). SA10). On the other hand, if the result of step SA8 is negative, the first processing unit 31 shifts the process to step SA11 without executing the processes of step SA9 and step SA10.

ステップSA11において、第1処理部31は、変数iに「1」を加算したうえで、加算後の変数iが数値Nを上回るか否かを判定する(ステップSA12)。ステップSA12の結果が否定である場合、第1処理部31は、更新後の変数iについてステップSA8からステップSA11までの処理を繰返す。一方、ステップSA12の結果が肯定である場合、第1処理部31は、ステップSA13に処理を移行する。以上のようにステップSA6からステップSA12までの処理が反復されることで、変数LX[i]には、第1処理部31が算定した類似度Rの小さい順番(区間S1と区間S2とで波形の類似性が高い順番)に数えて第i番目の区間長Lが格納され、変数RX[i]には、区間S1および区間S2を区間長LX[i]に設定したときの類似度Rが格納される。   In step SA11, the first processing unit 31 adds “1” to the variable i, and determines whether or not the variable i after the addition exceeds the numerical value N (step SA12). If the result of step SA12 is negative, the first processing unit 31 repeats the processing from step SA8 to step SA11 for the updated variable i. On the other hand, when the result of step SA12 is affirmative, the first processing unit 31 proceeds to step SA13. As described above, the processing from step SA6 to step SA12 is repeated, so that the variable LX [i] has a waveform in order of decreasing similarity R calculated by the first processing unit 31 (waveforms in the sections S1 and S2). The i-th section length L is stored in the order of the similarity of the sections S1 and S2 and the similarity R when the sections S1 and S2 are set to the section length LX [i] is stored in the variable RX [i]. Stored.

ステップSA13において、第1処理部31は、現段階の区間長Lから変化幅D1を減算した数値を新たな区間長Lとして設定する。そして、第1処理部31は、ステップSA13における更新後の区間長Lが最小値LMINを下回るか否かを判定する(ステップSA14)。ステップSA14の結果が否定である場合、第1処理部31は、更新後の区間長LについてステップSA6からステップSA12の処理を繰返す。ステップSA14の結果が肯定である場合(すなわち最大値LMAXから最小値LMINまでの範囲で変化幅D1ずつ変化させた全部の区間長Lについて処理が完了した場合)、第1処理部31は図3の処理を終了する。   In step SA13, the first processing unit 31 sets a value obtained by subtracting the change width D1 from the current section length L as a new section length L. Then, the first processing unit 31 determines whether or not the updated section length L in step SA13 is less than the minimum value LMIN (step SA14). If the result of step SA14 is negative, the first processing unit 31 repeats the processing from step SA6 to step SA12 for the updated section length L. When the result of step SA14 is affirmative (that is, when the processing is completed for all the section lengths L changed by the change width D1 in the range from the maximum value LMAX to the minimum value LMIN), the first processing unit 31 performs FIG. Terminate the process.

以上に説明したように、最大値LMAXから最小値LMINまでの範囲内で区間長Lを変化幅D1ずつ変化させながらステップSA6からステップSA13の処理が反復される。図3の処理が完了した段階では、類似度Rが小さい順番(区間S1と区間S2とで波形の類似性が高い順番)に数えてN個の区間長Lが仮区間長LXとして変数LX[1]〜LX[N]に格納されるとともに、N個の仮区間長LXの各々に対応する類似度Rが変数RX[1]〜RX[N]に格納されている。   As described above, the processing from step SA6 to step SA13 is repeated while changing the section length L by the change width D1 within the range from the maximum value LMAX to the minimum value LMIN. At the stage where the processing of FIG. 3 is completed, N section lengths L are counted as the provisional section length LX as a temporary section length LX in the order of decreasing similarity R (in order of increasing waveform similarity between section S1 and section S2). 1] to LX [N], and the similarity R corresponding to each of the N provisional section lengths LX is stored in variables RX [1] to RX [N].

次に、図4を参照して、第2処理部32が基本周期LWを特定する動作の具体例を説明する。
第2処理部32は、変数iを「1」に初期化したうえで(ステップSB1)、変数RX[i]が変数RP(初期値はステップSA4で設定される)を下回るか否かを判定する(ステップSB2)。ステップSB2の結果が肯定である場合、第2処理部32は、変数LPを変数LX[i]に更新するとともに変数RPを変数RX[i]に更新する(ステップSB3)。一方、ステップSB2の結果が否定である場合にはステップSB3の処理は実行されない。すなわち、変数LPは、現時点で類似度RX[i]が最小である仮区間長LX[i]に維持され、変数RPは、当該類似度RX[i]に維持される。
Next, a specific example of an operation in which the second processing unit 32 specifies the basic period LW will be described with reference to FIG.
The second processing unit 32 initializes the variable i to “1” (step SB1), and determines whether the variable RX [i] is less than the variable RP (the initial value is set in step SA4). (Step SB2). If the result of step SB2 is affirmative, the second processing unit 32 updates the variable LP to the variable LX [i] and updates the variable RP to the variable RX [i] (step SB3). On the other hand, if the result of step SB2 is negative, the process of step SB3 is not executed. That is, the variable LP is maintained at the provisional section length LX [i] at which the similarity RX [i] is the smallest at the present time, and the variable RP is maintained at the similarity RX [i].

次いで、第2処理部32は、区間長Lを、変数LPと再検索幅LDとの加算値に更新する(ステップSB4)。第2処理部32は、ステップSB4における更新後の区間長Lの区間S1と区間S2とについて、ステップSA3やステップSA6と同様の方法で類似度Rを算定する(ステップSB5)。   Next, the second processing unit 32 updates the section length L to the added value of the variable LP and the re-search width LD (step SB4). The second processing unit 32 calculates the similarity R for the section S1 and the section S2 with the updated section length L in step SB4 by the same method as in step SA3 and step SA6 (step SB5).

第2処理部32は、ステップSB5で算定した類似度Rが変数RPを下回るか否かを判定する(ステップSB6)。ステップSB6の結果が肯定である場合、第2処理部32は、ステップSB5で算定した類似度Rを変数RPに格納するとともに現段階の区間長Lを変数LPに格納する(ステップSB7)。一方、ステップSB6の結果が否定である場合にはステップSB7の処理が実行されない。   The second processing unit 32 determines whether or not the similarity R calculated in step SB5 is less than the variable RP (step SB6). If the result of step SB6 is affirmative, the second processing unit 32 stores the similarity R calculated in step SB5 in the variable RP and stores the current section length L in the variable LP (step SB7). On the other hand, if the result of step SB6 is negative, the process of step SB7 is not executed.

次いで、第2処理部32は、現段階の区間長Lから変化幅D2を減算した数値を新たな区間長Lとして設定する(ステップSB8)。図2に示したように変化幅D2はステップSA5やステップSA13における変化幅D1よりも小さい。なお、仮区間長LX[i]の類似度Rは既に算定されているから、ステップSB8において、第2処理部32は、変化幅D2の減算後の区間長Lが仮区間長LX[i]に合致する場合にはさらに変化幅D2を減算する。すなわち、仮区間長LX[i]についてはステップSB5からステップSB7までの処理が省略される。   Next, the second processing unit 32 sets a numerical value obtained by subtracting the change width D2 from the current section length L as a new section length L (step SB8). As shown in FIG. 2, the change width D2 is smaller than the change width D1 in step SA5 or step SA13. Since the similarity R of the provisional section length LX [i] has already been calculated, in step SB8, the second processing unit 32 determines that the section length L after subtraction of the change width D2 is the provisional section length LX [i]. If it matches, the change width D2 is further subtracted. That is, the process from step SB5 to step SB7 is omitted for the provisional section length LX [i].

第2処理部32は、ステップSB8における更新後の区間長Lが、変数LPと再検索幅LDとの差分値(LP−LD)以上であるか否かを判定する(ステップSB9)。ステップSB9の結果が肯定である場合、第2処理部32はステップSB5に処理を移行する。以上のように、ステップSB5からステップSB9においては、仮区間長LX[i]を中央値として変化幅D2ずつ増減させた所定個(「2・LD」個)の区間長Lについて類似度Rが算定されるとともに変数LPと変数RPとが類似度Rの大小に応じて更新される。   The second processing unit 32 determines whether or not the updated section length L in step SB8 is equal to or greater than the difference value (LP−LD) between the variable LP and the re-search width LD (step SB9). If the result of step SB9 is affirmative, the second processing unit 32 proceeds to step SB5. As described above, in steps SB5 to SB9, the similarity R is determined for a predetermined number (“2 · LD”) of section lengths L that are increased or decreased by the change width D2 with the provisional section length LX [i] as the median. While being calculated, the variable LP and the variable RP are updated according to the degree of similarity R.

ステップSB9の結果が否定である場合(すなわち、第i番目の仮区間長LX[i]を中央値とした「2・LD」個の区間長LについてステップSB5からステップSB9までの処理が完了した場合)、第2処理部32は、変数iに「1」を加算したうえで(ステップSB10)、加算後の変数iが数値Nを上回るか否かを判定する(ステップSB11)。ステップSB11の結果が否定である場合、第2処理部32は、ステップSB10における更新後の変数iについてステップSB2以後の処理を実行する。一方、ステップSB11の結果が肯定である場合(すなわちN個の仮区間長LX[1]〜LX[N]についてステップSB2からステップSB10までの処理が完了した場合)、第2処理部32は、現段階での変数LPを基本周期LWとして特定したうえで(ステップSB12)、図4の処理を終了する。   If the result of step SB9 is negative (that is, the processing from step SB5 to step SB9 is completed for “2.LD” section lengths L with the i-th provisional section length LX [i] as the median value) ), The second processing unit 32 adds “1” to the variable i (step SB10), and determines whether or not the variable i after the addition exceeds the numerical value N (step SB11). If the result of step SB11 is negative, the second processing unit 32 executes the process after step SB2 on the variable i after the update at step SB10. On the other hand, when the result of step SB11 is affirmative (that is, when the processing from step SB2 to step SB10 is completed for N temporary section lengths LX [1] to LX [N]), the second processing unit 32 After specifying the variable LP at the current stage as the basic period LW (step SB12), the processing in FIG. 4 is terminated.

以上に説明したように、本形態においては、第1に、区間長Lを変化幅D1ずつ変化させながら区間S1と区間S2との類似度Rを算定することでN個の仮区間長LXが特定され、第2に、変化幅D1よりも小さい変化幅D2ずつ仮区間長LXを変化させた「2・LD」個の区間長Lについて類似度Rを算定することで基本周期LWが特定される。したがって、最小値LMINから最大値LMAXまでの全範囲にわたって区間長Lを「1」ずつ変化させて類似度Rを算定する構成(以下「対比例」という)と比較して、基本周期LWを特定するための処理量が削減されるという利点がある。   As described above, in this embodiment, first, N temporary section lengths LX are obtained by calculating the similarity R between the sections S1 and S2 while changing the section length L by the change width D1. Secondly, the basic period LW is specified by calculating the similarity R for “2 · LD” section lengths L in which the provisional section length LX is changed by a change width D2 smaller than the change width D1. The Therefore, the basic period LW is specified in comparison with the configuration in which the similarity R is calculated by changing the section length L by “1” over the entire range from the minimum value LMIN to the maximum value LMAX (hereinafter referred to as “comparative”). There is an advantage that the amount of processing to do is reduced.

図5は、類似度Rを算定する処理の回数を入力信号VINのサンプリング周波数FSごとに本形態と対比例とで比較した図表である。同図においては、図2に示したように、変化幅D1を「4」、変化幅D2を「1」、第1処理部31が特定する仮区間長LXの個数Nを「8」、再検索幅LDを「3」とした場合を想定している。また、対比例における類似度Rの算定の回数に対する本形態における類似度の算定の回数の割合が「比率」として記載されている。   FIG. 5 is a chart in which the number of processes for calculating the similarity R is compared with this embodiment for each sampling frequency FS of the input signal VIN. In the figure, as shown in FIG. 2, the change width D1 is “4”, the change width D2 is “1”, the number N of the provisional section lengths LX specified by the first processing unit 31 is “8”, It is assumed that the search width LD is “3”. In addition, the ratio of the number of times of similarity calculation in the present embodiment to the number of times of calculation of similarity R in contrast is described as “ratio”.

図5に示すように、入力信号VINのサンプリング周波数FSが16kHzである場合、類似度Rを算定する処理の回数は、本形態においては対比例の44.8%まで低減される。また、対比例と比較したときの効果は、サンプリング周波数FSが増加するほど顕著となる。例えば、サンプリング周波数FSが48kHzである場合、本形態によれば対比例の31.6%まで類似度Rの算定の回数が削減される。   As shown in FIG. 5, when the sampling frequency FS of the input signal VIN is 16 kHz, the number of processes for calculating the similarity R is reduced to 44.8% in the present embodiment. The effect when compared with the proportionality becomes more prominent as the sampling frequency FS increases. For example, when the sampling frequency FS is 48 kHz, according to the present embodiment, the number of times of calculating the similarity R is reduced to 31.6% which is proportional.

また、変化幅D1よりも小さい変化幅D2ずつ仮区間長LXを変化させた各区間長Lについて第2処理部32が類似度Rを算定するから、変化幅D1ずつ変化させた区間長Lについてのみ第1処理部31が類似度Rを算定するとは言っても、基本周期LWを特定する精度が対比例と比較して不当に低下するということはない。さらに詳述すると以下の通りである。   Further, since the second processing unit 32 calculates the similarity R for each section length L in which the provisional section length LX is changed by a change width D2 smaller than the change width D1, the section length L changed by the change width D1. Even if the first processing unit 31 calculates the similarity R only, the accuracy of specifying the basic period LW does not unduly decrease compared to the proportionality. Further details are as follows.

図6から図8は、入力信号VINに設定された区間S1および区間S2の区間長Lと類似度Rとの関係を示すグラフである。図6においては、入力信号VINが有声音を示す場合が図示されている。同図に示すように、有声音については区間S1と区間S2との波形の類似度Rが区間長Lに対して周期的に変化するから、変化幅D1が類似度Rの変動の周期よりも小さければ、本形態のように区間長Lを変化幅D1ずつ変化させた場合であっても、第1処理部31が特定する仮区間長LXのなかには、図6において類似度Rが最小(最も類似する)となる区間長Lに近い仮区間長LXが含まれる。したがって、仮区間長LXを変化幅D2ずつ変化させた各区間長Lについて第2処理部32が類似度Rを算定することで、図6にて類似度Rが最小となる区間長L(すなわち基本周期LW)を対比例と同等の精度で特定することが可能である。   6 to 8 are graphs showing the relationship between the section length L and the similarity R of the sections S1 and S2 set in the input signal VIN. FIG. 6 illustrates a case where the input signal VIN indicates voiced sound. As shown in the figure, for voiced sound, the waveform similarity R between the section S1 and the section S2 changes periodically with respect to the section length L, so the change width D1 is larger than the period of variation of the similarity R. If it is smaller, even if the section length L is changed by the change width D1 as in the present embodiment, the similarity R is the smallest (most) in the temporary section length LX specified by the first processing unit 31 in FIG. The provisional section length LX close to the section length L is included. Therefore, the second processing unit 32 calculates the similarity R for each section length L obtained by changing the provisional section length LX by the change width D2, so that the section length L (that is, the similarity R is the minimum in FIG. It is possible to specify the basic period LW) with an accuracy equivalent to the proportionality.

図7は、有声音が存在しない状態(以下「無音の状態」という)で入力信号VINが収録された場合を示し、図8は、入力信号VINが無声子音を示す場合を示す。無音の状態や無声子音が存在する状態では、類似度Rは区間長Lに対して不規則に変動する。したがって、第1処理部31が区間長Lを変化幅D1ずつ変化させる本形態と区間長Lを「1」ずつ変化させる対比例とでは、実際に特定される基本周期LWが相違する。しかし、無音の状態や無声子音が存在する状態の入力信号VINは元来的に周期性に乏しい(明確な基本周期LWが現れない)から、区間長Lを変化幅D1ずつ変化させることで基本周期LWが対比例と相違するとしても出力信号VOUTの音質には殆ど影響しない。以上のように、本形態によれば、基本周期LWを特定する精度を対比例と同等に維持しながら処理量を削減できるという利点がある。   FIG. 7 shows a case where the input signal VIN is recorded in a state where there is no voiced sound (hereinafter referred to as “silent state”), and FIG. 8 shows a case where the input signal VIN indicates an unvoiced consonant. In a silent state or a state in which a voiceless consonant exists, the similarity R varies irregularly with respect to the section length L. Therefore, the fundamental cycle LW that is actually specified differs between the present embodiment in which the first processing unit 31 changes the section length L by the change width D1 and the proportionality in which the section length L is changed by “1”. However, since the input signal VIN in a silent state or a state in which there is an unvoiced consonant is inherently poor in periodicity (a clear basic period LW does not appear), it is fundamental to change the section length L by the change width D1. Even if the period LW is different from proportional, it hardly affects the sound quality of the output signal VOUT. As described above, according to this embodiment, there is an advantage that the processing amount can be reduced while maintaining the accuracy of specifying the basic period LW to be equal to the proportionality.

<B:変形例>
以上の各形態には様々な変形を加えることができる。具体的な変形の態様を例示すれば以下の通りである。なお、以下の各態様を適宜に組み合わせてもよい。
<B: Modification>
Various modifications can be made to each of the above embodiments. An example of a specific modification is as follows. In addition, you may combine each following aspect suitably.

(1)変形例1
以上の形態においては変化幅D1を固定した場合を例示したが、変化幅D1(サンプル列の間引数)を可変に制御してもよい。例えば、図9に示すように、入力信号VINのサンプリング周波数FSに応じて変化幅D1を変化させる構成が採用される。図9の周波数特定部26は、例えば入力装置(図示略)に対する利用者からの操作や上位装置による指示に基づいて入力信号VINのサンプリング周波数FSを特定する手段である。第1処理部31は、周波数特定部26の特定したサンプリング周波数FSが高いほど変化幅D1が増加するように変化幅D1を制御する。
(1) Modification 1
In the above embodiment, the case where the change width D1 is fixed is exemplified, but the change width D1 (an argument between sample columns) may be variably controlled. For example, as shown in FIG. 9, a configuration is adopted in which the change width D1 is changed according to the sampling frequency FS of the input signal VIN. The frequency specifying unit 26 in FIG. 9 is means for specifying the sampling frequency FS of the input signal VIN based on, for example, a user operation on an input device (not shown) or an instruction from the host device. The first processing unit 31 controls the change width D1 so that the change width D1 increases as the sampling frequency FS specified by the frequency specifying unit 26 increases.

変化幅D1を固定値とした場合には、サンプリング周波数FSが増加するほど第1処理部31による類似度Rの算定の回数は増加する。図9の構成によれば、サンプリング周波数FSが高いほど変化幅D1(サンプルPの間引数)が増加するから、サンプリング周波数FSが高い場合であっても、基本周期LWの特定の精度を低下させることなく第1処理部31による類似度Rの算定の回数を削減することが可能である。なお、変化幅D1以外の数値をサンプリング周波数FSに応じて変化させてもよい。例えば、仮区間長LXの個数Nを第1処理部31がサンプリング周波数FSに応じて制御する構成も採用される。例えば、サンプリング周波数FSが高いほど個数Nを増加させるといった具合である。   When the change width D1 is a fixed value, the number of times the similarity R is calculated by the first processing unit 31 increases as the sampling frequency FS increases. According to the configuration of FIG. 9, since the change width D1 (an argument between samples P) increases as the sampling frequency FS increases, even if the sampling frequency FS is high, the specific accuracy of the basic period LW is reduced. It is possible to reduce the number of times of calculation of the similarity R by the first processing unit 31 without any problem. Note that numerical values other than the change width D1 may be changed according to the sampling frequency FS. For example, a configuration in which the first processing unit 31 controls the number N of the provisional section lengths LX according to the sampling frequency FS is also employed. For example, the number N is increased as the sampling frequency FS is higher.

(2)変形例2
有声音には明確な周期性が現れる。したがって、図6ないし図8から把握されるように、入力信号VINが有声音を示す場合に、区間長Lに対する類似度Rの分布幅(類似度Rの最大値RMAXと最小値RMINとの差分値)ΔRは、入力信号VINが無音の状態を示す場合や無声子音を示す場合(すなわち入力信号VINに周期性が現れない場合)と比較して充分に大きい。換言すると、類似度Rの分布幅ΔRが大きい場合には入力信号VINが有声音を示し、類似度Rの分布幅ΔRが小さい場合には入力信号VINが無音の状態または無声子音を示すという傾向がある。一方、無音や無声子音を示す入力信号VINには明確な周期性が現れないから、そもそも基本周期LWを厳密に探索する意義に乏しい。
(2) Modification 2
Clear periodicity appears in voiced sounds. Therefore, as understood from FIGS. 6 to 8, when the input signal VIN indicates voiced sound, the distribution width of the similarity R with respect to the section length L (the difference between the maximum value RMAX and the minimum value RMIN of the similarity R) (Value) ΔR is sufficiently large as compared with the case where the input signal VIN indicates a silent state or a case where the input signal VIN indicates a voiceless consonant (that is, when no periodicity appears in the input signal VIN). In other words, when the distribution width ΔR of the similarity R is large, the input signal VIN indicates voiced sound, and when the distribution width ΔR of the similarity R is small, the input signal VIN indicates a silent state or unvoiced consonant. There is. On the other hand, since no clear periodicity appears in the input signal VIN indicating silence or voiceless consonant, it is not meaningful to search for the fundamental period LW strictly.

したがって、第1処理部31が複数の区間長Lについて算定した類似度Rの分布幅ΔRが小さい場合(すなわち入力信号VINが無音や無声子音を示す可能性が高い場合)には第2処理部32による処理量を低減させる構成が好適に採用される。例えば、第1に、類似度Rの分布幅ΔRが小さいほど、ステップSB4やステップSB9で利用される再検索幅LD(すなわち第2処理部32が類似度Rを算定する回数)を第2処理部32が減少させるといった構成が採用される。第2に、分布幅ΔRが所定の閾値を下回る場合には第2処理部32が図4の処理(特に類似度Rの算定)を停止する構成も採用される。図4の処理を停止した場合、第2処理部32は、例えば、入力信号VINに拘わらず予め定められた基本周期LWを圧伸処理部24に指定する。   Therefore, when the distribution width ΔR of the similarity R calculated for the plurality of section lengths L by the first processing unit 31 is small (that is, when the input signal VIN is highly likely to indicate silence or voiceless consonant), the second processing unit A configuration for reducing the amount of processing by 32 is preferably employed. For example, first, as the distribution width ΔR of the similarity R is smaller, the re-search width LD (that is, the number of times the second processing unit 32 calculates the similarity R) used in step SB4 and step SB9 is the second process. A configuration in which the portion 32 is reduced is adopted. Second, a configuration in which the second processing unit 32 stops the processing of FIG. 4 (particularly the calculation of the similarity R) when the distribution width ΔR is less than a predetermined threshold is also employed. When the process of FIG. 4 is stopped, for example, the second processing unit 32 designates a predetermined basic period LW to the companding processing unit 24 regardless of the input signal VIN.

以上の構成によれば、入力信号VINが無音や無声子音を示す場合の第2処理部32の処理量を削減することが可能である。なお、第2処理部32の処理が簡略化または省略されるとは言っても、入力信号VINが有声音である場合には以上の形態と同様に基本周期LWが特定されるから、出力信号VOUTについては以上の形態と同等の音質を維持することが可能である。   According to the above configuration, it is possible to reduce the processing amount of the second processing unit 32 when the input signal VIN indicates silence or a voiceless consonant. Although the processing of the second processing unit 32 is simplified or omitted, when the input signal VIN is a voiced sound, the basic period LW is specified in the same manner as in the above form, so that the output signal As for VOUT, it is possible to maintain the sound quality equivalent to the above-mentioned form.

(3)変形例3
図3や図4の処理に使用される各数値は適宜に変更される。例えば、再検索幅LDを変化幅D1よりも大きい数値に設定した構成によれば、基本周期LWをさらに高い精度で特定することが可能となる。なお、再検索幅LDが変化幅D1よりも大きい場合には、第2処理部32が類似度Rを算定する範囲(「LX+LD・D2」から「LX−LD・D2」までの範囲)内に、第1処理部31が既に類似度Rを算定した区間長Lが含まれる。したがって、類似度Rが既に算定された区間長Lについては、ステップSB5からステップSB8までの処理を第2処理部32が省略する構成も採用される。
(3) Modification 3
Each numerical value used in the processing of FIG. 3 and FIG. 4 is appropriately changed. For example, according to the configuration in which the re-search width LD is set to a numerical value larger than the change width D1, the basic period LW can be specified with higher accuracy. When the re-search width LD is larger than the change width D1, the second processing unit 32 calculates the similarity R within the range (the range from “LX + LD · D2” to “LX−LD · D2”). The section length L for which the first processing unit 31 has already calculated the similarity R is included. Therefore, for the section length L for which the similarity R has already been calculated, a configuration in which the second processing unit 32 omits the processing from step SB5 to step SB8 is also employed.

(4)変形例
変化幅D1ずつ変化させた全部の区間長Lの類似度Rを第1処理部31が記憶回路10に格納しておき、第2処理部32が、記憶回路10内の類似度Rが高い順番に選択したN個の区間長Lを仮区間長LXとして図4の処理を実行する構成も採用される。すなわち、第1処理部31による処理(図3)のなかでN個の仮区間長LXが絞り込まれる構成は必ずしも必要ではない。
(4) Modification
The first processing unit 31 stores the similarity R of all the section lengths L changed by the change width D1 in the storage circuit 10, and the second processing unit 32 performs the order of the similarity R in the storage circuit 10 in descending order. A configuration is also adopted in which the processing of FIG. 4 is executed with the N section lengths L selected as the temporary section length LX. That is, the configuration in which the N temporary section lengths LX are narrowed down in the processing by the first processing unit 31 (FIG. 3) is not necessarily required.

(5)変形例5
基本周期特定部22は時間軸圧伸装置100以外にも使用される。例えば、基本周期LWの逆数をピッチとして出力するピッチ検出装置において入力信号VINから基本周期LWを特定するために基本周期特定部22を使用してもよい。
(5) Modification 5
The basic period specifying unit 22 is used in addition to the time axis companding device 100. For example, in a pitch detection device that outputs the reciprocal of the basic period LW as a pitch, the basic period specifying unit 22 may be used to specify the basic period LW from the input signal VIN.

本発明の実施形態に係る時間軸圧伸装置の構成を示すブロック図である。It is a block diagram which shows the structure of the time-axis companding apparatus which concerns on embodiment of this invention. 第1処理部および第2処理部の動作を説明するための概念図である。It is a conceptual diagram for demonstrating operation | movement of a 1st process part and a 2nd process part. 第1処理部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of a 1st process part. 第2処理部の動作を示すフローチャートである。It is a flowchart which shows operation | movement of a 2nd process part. 本発明の効果を説明するための図表である。It is a chart for demonstrating the effect of this invention. 入力信号VINが有声音を示す場合の区間長と類似度との関係を示すグラフである。It is a graph which shows the relationship between the section length and similarity when the input signal VIN shows a voiced sound. 入力信号VINが無音を示す場合の区間長と類似度との関係を示すグラフである。It is a graph which shows the relationship between the section length in case the input signal VIN shows silence, and a similarity. 入力信号VINが有声子音を示す場合の区間長と類似度との関係を示すグラフである。It is a graph which shows the relationship between the section length and similarity when the input signal VIN shows a voiced consonant. 変形例に係る時間軸圧伸装置の構成を示すブロック図である。It is a block diagram which shows the structure of the time-axis companding apparatus which concerns on a modification.

符号の説明Explanation of symbols

100……時間軸圧伸装置、10……記憶回路、20……制御回路、22……基本周期特定部、24……圧伸処理部、31……第1処理部、32……第2処理部、40……出力回路、VIN……入力信号、VOUT……出力信号。 DESCRIPTION OF SYMBOLS 100 ... Time-axis companding device, 10 ... Memory circuit, 20 ... Control circuit, 22 ... Fundamental period specifying part, 24 ... Companding processing part, 31 ... First processing part, 32 ... Second Processing unit 40... Output circuit, VIN... Input signal, VOUT.

Claims (9)

入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1段階と、
前記サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、前記第1段階で算定した類似度が類似を示す区間長を前記第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2段階と、
前記第1段階および前記第2段階にて算定された類似度が類似を示す区間長を基本周期として、前記入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理段階と
を有する時間軸圧伸方法。
The process of calculating the similarity of the waveforms for the first and second sections having the same section length and adjacent to each other in the sample sequence in which a plurality of samples of the input signal are arranged in time series is made into two or more samples. A first step of executing a plurality of section lengths changed by corresponding first change widths;
The process of calculating the waveform similarity for the first section and the second section of the sample sequence is the second change in which the section length indicating the similarity calculated in the first stage is smaller than the first change width. A second stage executed for a plurality of section lengths varied by width;
A companding process step of generating an output signal having a waveform obtained by expanding or compressing the input signal on a time axis, with the section length indicating the similarity calculated in the first step and the second step being similar. And a time axis companding method.
前記第2段階において、前記第1段階にて算定された類似度が高い順番に選択された複数の区間長の各々を対象として、当該区間長を前記第2変化幅ずつ変化させた複数の区間長について第1区間と第2区間との類似度を算定する
請求項1に記載の時間軸圧伸方法。
In the second stage, for each of a plurality of section lengths selected in order of decreasing similarity calculated in the first stage, a plurality of sections in which the section length is changed by the second change width The time axis companding method according to claim 1, wherein a similarity between the first section and the second section is calculated for the length.
前記第2変化幅は、前記サンプル列にて相前後する各サンプルの間隔に相当する
請求項1または請求項2に記載の時間軸圧伸方法。
The time-axis companding method according to claim 1, wherein the second change width corresponds to an interval between samples that follow each other in the sample row.
前記第1段階においては、前記入力信号のサンプリング周波数が高いほど前記第1変化幅を増加させる
請求項3に記載の時間軸圧伸方法。
The time axis companding method according to claim 3, wherein, in the first stage, the first change width is increased as the sampling frequency of the input signal is higher.
前記第1段階にて各区間長について算定された類似度の分布幅が小さいほど、前記第2段階にて類似度を算定する区間長の個数を減少させる
請求項1から請求項4の何れかに記載の時間軸圧伸方法。
5. The number of section lengths for calculating similarity in the second stage is decreased as the distribution width of the similarity calculated for each section length in the first stage is smaller. 5. The time axis companding method described in 1.
前記第1段階にて各区間長について算定された類似度の分布幅が所定値を下回る場合、前記第2段階においては類似度の算定を停止する
請求項1から請求項4の何れかに記載の時間軸圧伸方法。
5. The calculation of the similarity is stopped in the second stage when the distribution width of the similarity calculated for each section length in the first stage is less than a predetermined value. 5. Time axis companding method.
入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1処理手段と、
前記サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、前記第1処理手段の算定した類似度が類似を示す区間長を前記第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2処理手段と、
前記第1処理手段および前記第2処理手段の算定した類似度が類似を示す区間長を基本周期として、前記入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理手段と
を具備する時間軸圧伸装置。
The process of calculating the similarity of the waveforms for the first and second sections having the same section length and adjacent to each other in the sample sequence in which a plurality of samples of the input signal are arranged in time series is made into two or more samples. First processing means for executing a plurality of section lengths changed by corresponding first change widths;
The processing for calculating the similarity of the waveform for the first section and the second section of the sample sequence is performed by setting a second section length that is smaller than the first change width to a section length in which the similarity calculated by the first processing means shows similarity. A second processing means for executing a plurality of section lengths changed by a change width;
A companding processing means for generating an output signal having a waveform obtained by extending or compressing the input signal on the time axis, with a section length showing similarity between the calculated similarities of the first processing means and the second processing means as a basic period A time axis companding device comprising:
コンピュータを、
入力信号の複数のサンプルが時系列に配列されたサンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1処理手段と、
前記サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、前記第1処理手段の算定した類似度が類似を示す区間長を前記第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2処理手段と、
前記第1処理手段および前記第2処理手段の算定した類似度が類似を示す区間長を基本周期として、前記入力信号を時間軸上で伸長または圧縮した波形の出力信号を生成する圧伸処理手段と
として機能させるプログラム。
Computer
The process of calculating the similarity of the waveforms for the first and second sections having the same section length and adjacent to each other in the sample sequence in which a plurality of samples of the input signal are arranged in time series is made into two or more samples. First processing means for executing a plurality of section lengths changed by corresponding first change widths;
The processing for calculating the similarity of the waveform for the first section and the second section of the sample sequence is performed by setting a second section length that is smaller than the first change width to a section length in which the similarity calculated by the first processing means shows similarity. A second processing means for executing a plurality of section lengths changed by a change width;
A companding processing means for generating an output signal having a waveform obtained by extending or compressing the input signal on the time axis, with a section length showing similarity between the calculated similarities of the first processing means and the second processing means as a basic period A program that functions as and.
入力信号の複数のサンプルが時系列に配列されたサンプル列に基づいて当該入力信号の基本周期を特定する方法であって、
前記サンプル列のうち区間長が同等で相隣接する第1区間と第2区間とについて波形の類似度を算定する処理を、2個以上のサンプルに対応する第1変化幅ずつ変化させた複数の区間長について実行する第1段階と、
前記サンプル列の第1区間と第2区間とについて波形の類似度を算定する処理を、前記第1段階で算定した類似度が類似を示す区間長を前記第1変化幅よりも小さい第2変化幅ずつ変化させた複数の区間長について実行する第2段階と、
前記第1段階および前記第2段階にて算定された類似度が類似を示す区間長を基本周期として特定する第3段階と
を有する基本周期特定方法。
A method of identifying a basic period of an input signal based on a sample sequence in which a plurality of samples of the input signal are arranged in time series,
A plurality of processings in which the processing for calculating the similarity between the waveforms of the first section and the second section having the same section length in the sample sequence and being adjacent to each other is changed by a first change width corresponding to two or more samples. A first stage to perform on the section length;
The process of calculating the waveform similarity for the first section and the second section of the sample sequence is the second change in which the section length indicating the similarity calculated in the first stage is smaller than the first change width. A second stage executed for a plurality of section lengths varied by width;
And a third step of specifying, as a basic cycle, a section length in which the similarity calculated in the first step and the second step shows similarity.
JP2007043459A 2007-02-23 2007-02-23 Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method Pending JP2008209447A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007043459A JP2008209447A (en) 2007-02-23 2007-02-23 Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007043459A JP2008209447A (en) 2007-02-23 2007-02-23 Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method

Publications (1)

Publication Number Publication Date
JP2008209447A true JP2008209447A (en) 2008-09-11

Family

ID=39785831

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007043459A Pending JP2008209447A (en) 2007-02-23 2007-02-23 Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method

Country Status (1)

Country Link
JP (1) JP2008209447A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017164216A1 (en) * 2016-03-24 2017-09-28 ヤマハ株式会社 Acoustic processing method and acoustic processing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017164216A1 (en) * 2016-03-24 2017-09-28 ヤマハ株式会社 Acoustic processing method and acoustic processing device
US10891966B2 (en) 2016-03-24 2021-01-12 Yamaha Corporation Audio processing method and audio processing device for expanding or compressing audio signals

Similar Documents

Publication Publication Date Title
US7630883B2 (en) Apparatus and method for creating pitch wave signals and apparatus and method compressing, expanding and synthesizing speech signals using these pitch wave signals
JP2007003682A (en) Speaking speed converting device
JP4406440B2 (en) Speech synthesis apparatus, speech synthesis method and program
JP2006293230A (en) Device, program, and method for sound signal processing
JP2008209447A (en) Time-axis expansion and compression method, time-axis expansion and compression device, program and basic cycle specifying method
JP6011039B2 (en) Speech synthesis apparatus and speech synthesis method
JPH1078791A (en) Pitch converter
JP2005025173A (en) Speech data selecting apparatus, method thereof and program
JP5552794B2 (en) Method and apparatus for encoding acoustic signal
EP2634769B1 (en) Sound synthesizing apparatus and sound synthesizing method
JP2008139573A (en) Vocal quality conversion method, vocal quality conversion program and vocal quality conversion device
JP2007094004A (en) Time base companding method of voice signal, and time base companding apparatus of voice signal
JP2007304515A (en) Audio signal decompressing and compressing method and device
JP2002287758A (en) Method and device for editing waveform
US6314403B1 (en) Apparatus and method for generating a special effect on a digital signal
KR101650739B1 (en) Method, server and computer program stored on conputer-readable medium for voice synthesis
JP5874341B2 (en) Audio signal processing apparatus and program
US11348596B2 (en) Voice processing method for processing voice signal representing voice, voice processing device for processing voice signal representing voice, and recording medium storing program for processing voice signal representing voice
JP5141033B2 (en) Time axis companding device, time axis companding method and program
JP4437703B2 (en) Speech speed conversion method and apparatus
JP5024136B2 (en) Sound processing apparatus and program
JP3733964B2 (en) Sound source waveform synthesizer using analysis results
JP4461985B2 (en) Speech waveform expansion device, waveform expansion method, speech waveform reduction device, waveform reduction method, program, and speech processing device
JP2017111274A (en) Data processor
JP2010032814A (en) Impulse response processing device, reverberation applying device and program