JP2005195968A - Pitch converting device - Google Patents

Pitch converting device Download PDF

Info

Publication number
JP2005195968A
JP2005195968A JP2004003197A JP2004003197A JP2005195968A JP 2005195968 A JP2005195968 A JP 2005195968A JP 2004003197 A JP2004003197 A JP 2004003197A JP 2004003197 A JP2004003197 A JP 2004003197A JP 2005195968 A JP2005195968 A JP 2005195968A
Authority
JP
Japan
Prior art keywords
pitch
value
smoothed
audio signal
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004003197A
Other languages
Japanese (ja)
Other versions
JP4565846B2 (en
Inventor
Atsushi Hoshiai
厚 星合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Roland Corp
Original Assignee
Roland Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Roland Corp filed Critical Roland Corp
Priority to JP2004003197A priority Critical patent/JP4565846B2/en
Publication of JP2005195968A publication Critical patent/JP2005195968A/en
Application granted granted Critical
Publication of JP4565846B2 publication Critical patent/JP4565846B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Electrophonic Musical Instruments (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a pitch converting device capable of converting the pitch of an audio signal such as a speech signal and a musical sound signal while leaving natural fluctuations with simple constitution in such a case. <P>SOLUTION: A desired section is cut out of sampling data stored in a ring memory as a phoneme based upon cycles corresponding to a pitch detected by a pitch detecting means 30, and the cut-out section is read out with time at a readout speed corresponding to a formant change coefficient FORMANT-VR; and the pitch detected by the pitch detecting means 30 is smoothed by a pitch smoothing means 32 and the phoneme is put together with the smoothed pitch in cycles corresponding to target pitch information SPITCH. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、音声信号や楽音信号等のピッチを変換するピッチ変換装置に関する。   The present invention relates to a pitch converter for converting the pitch of an audio signal, a musical sound signal, or the like.

従来、ピッチ変換装置としては、種々のものが提案されている。例えば特許第3329635号公報(特許文献1)には、入力されたオーディオ信号をメモリに記憶するとともに、そのオーディオ信号のピッチ(周期)を検出し、その検出された周期に対応する区間をメモリから切り出して、新たに指定されたピッチに応じた周期でその切り出した区間を合成することによりピッチを変換して再生する効果装置が開示されている。なお、本明細書中では、新たに指定されたピッチを目標ピッチといい、この目標ピッチは、入力されたオーディオ信号のピッチとは関係のない絶対音高を指すものとする。ピッチを指定する方法としては、入力されたオーディオ信号のピッチに対する相対値で指定する方法もあり、この方法と区別するためである。   Conventionally, various pitch converters have been proposed. For example, in Japanese Patent No. 3329635 (Patent Document 1), an input audio signal is stored in a memory, a pitch (period) of the audio signal is detected, and a section corresponding to the detected period is stored in the memory. An effect device is disclosed in which a pitch is converted and reproduced by synthesizing the segmented segments in a cycle according to the newly designated pitch. In the present specification, a newly designated pitch is referred to as a target pitch, and this target pitch refers to an absolute pitch that is not related to the pitch of the input audio signal. As a method of designating the pitch, there is a method of designating by a relative value with respect to the pitch of the input audio signal, for the purpose of distinguishing from this method.

また、特許第3287230号公報(特許文献2)には、歌唱者が発生すべきボーカル音のピッチを指定する情報およびそのボーカル音に付与すべきハーモニー音のピッチを指定する情報を入力し、歌唱者が発声したボーカル音のピッチを検出して、そのピッチと歌唱者が発生すべきボーカル音のピッチとの比率を求め、その比率に圧縮処理を施すことにより得られる情報をボーカル音に付与すべきハーモニー音のピッチを指定する情報に付与してハーモニー音のピッチを変換するようにしたコーラス効果装置が開示されている。したがって、この装置では歌唱者が発声したボーカル音のピッチが揺らいでいる場合には、歌唱者のピッチと発声すべきボーカル音のピッチとの比率により歌唱者のピッチの揺らぎが抽出され、この抽出された揺らぎがハーモニー音に付与される。
特許第3329635号公報(図10等) 特許第3287230号公報
In addition, in Japanese Patent No. 3287230 (Patent Document 2), information specifying the pitch of a vocal sound to be generated by a singer and information specifying the pitch of a harmony sound to be given to the vocal sound are input, and singing is performed. Detects the pitch of the vocal sound uttered by the person, finds the ratio of the pitch to the pitch of the vocal sound that the singer should generate, and gives the vocal sound the information obtained by compressing the ratio A chorus effect device is disclosed in which the pitch of a harmony sound is converted by adding to the information specifying the pitch of the harmony sound. Therefore, in this apparatus, when the pitch of the vocal sound uttered by the singer is fluctuating, the fluctuation of the singer's pitch is extracted by the ratio of the pitch of the singer and the pitch of the vocal sound to be uttered. The added fluctuation is added to the harmony sound.
Japanese Patent No. 3329635 (FIG. 10 etc.) Japanese Patent No. 3287230

しかしながら、特許文献1に記載されている効果装置では、切り出されたオーディオ信号を、新たに指定された目標ピッチに応じた周期で合成するように構成されているため、変換された音声は一定のピッチで発生され、あたかもロボットが発声しているかのような音声になっていた。特に、カラオケなどで効果装置として用いられるコーラス付加装置の場合は、付加されるコーラスのピッチが一定となるため、不自然で違和感があるという問題点があった。   However, the effect device described in Patent Document 1 is configured to synthesize the clipped audio signal at a period corresponding to the newly designated target pitch, and thus the converted sound is constant. It was generated at the pitch and sounded as if the robot was speaking. In particular, in the case of a chorus adding device used as an effect device in karaoke or the like, the pitch of the added chorus is constant, and thus there is a problem that it is unnatural and uncomfortable.

また、特許文献2に記載されているコーラス効果付与装置では、歌唱者が発生すべきボーカル音のピッチと、歌唱者が発生したボーカル音のピッチとの比率を求め、この比率に基づいてハーモニー音に揺らぎを与えるので、歌唱者が発生すべきボーカル音のピッチを指定する情報が必要であるという問題点があった。   Moreover, in the chorus effect imparting device described in Patent Document 2, the ratio of the pitch of the vocal sound that the singer should generate and the pitch of the vocal sound that the singer generated is obtained, and the harmony sound is calculated based on this ratio. This gives a problem that information specifying the pitch of the vocal sound that the singer should generate is necessary.

本発明は、上記問題点を解決するためになされたもので、音声信号や楽音信号等のオーディオ信号のピッチを変換するに際し、簡単な構成で自然な揺らぎを残したまま音声のピッチを変換することができるピッチ変換装置を提供することを目的とする。   The present invention has been made to solve the above-described problems. When converting the pitch of an audio signal such as an audio signal or a musical tone signal, the pitch of the audio is converted with a simple configuration while leaving natural fluctuations. An object of the present invention is to provide a pitch conversion device that can perform the above-described operation.

上記の目的を達成するために、本発明の請求項1記載のピッチ変換装置は、オーディオ信号を入力する入力手段と、その入力手段に入力されたオーディオ信号のピッチを順次検出するピッチ検出手段と、そのピッチ検出手段により検出されたピッチを平滑化し、平滑化ピッチ情報を求めるピッチ平滑手段と、目標ピッチを指定する目標ピッチ指定手段と、前記入力手段に入力されたオーディオ信号のピッチを変換するピッチ変換手段と
、前記ピッチ平滑手段により平滑化された平滑化ピッチ情報と前記目標ピッチ指定手段により指定された目標ピッチとに基づいて前記ピッチ変換手段を制御する制御手段とを備えている。
In order to achieve the above object, a pitch conversion apparatus according to claim 1 of the present invention includes an input means for inputting an audio signal, and a pitch detection means for sequentially detecting the pitch of the audio signal input to the input means. The pitch detection means for smoothing the pitch detected by the pitch detection means, the pitch smoothing means for obtaining smoothed pitch information, the target pitch specifying means for specifying the target pitch, and the pitch of the audio signal input to the input means are converted. Pitch conversion means; and control means for controlling the pitch conversion means based on the smoothed pitch information smoothed by the pitch smoothing means and the target pitch specified by the target pitch specifying means.

この請求項1記載のピッチ変換装置によれば、入力されたオーディオ信号のピッチを順次検出し、そのピッチを平滑化する平滑化手段を備え、平滑化されたピッチと指定された目標ピッチとに基づいてピッチ変換を行うものである。   According to the pitch conversion apparatus of the first aspect, the pitch converting apparatus includes a smoothing unit that sequentially detects the pitch of the input audio signal and smoothes the pitch, and the smoothed pitch and the designated target pitch are set. Based on this, pitch conversion is performed.

請求項2記載のピッチ変換装置は、請求項1記載のピッチ変換装置において、前記平滑化手段は、順次検出されたピッチに低域通過フィルタ処理を施すものである。   The pitch converter according to claim 2 is the pitch converter according to claim 1, wherein the smoothing means performs low-pass filter processing on the sequentially detected pitches.

請求項3記載のピッチ変換装置は、請求項1又は2記載のピッチ変換装置において、前記平滑化手段は、前記ピッチ検出手段により今回検出されたピッチの値から前回平滑化された値を引いた差分値に所定の係数を乗算することにより平滑化ピッチ情報を得るものである。   The pitch conversion device according to claim 3 is the pitch conversion device according to claim 1 or 2, wherein the smoothing means subtracts a previously smoothed value from a pitch value detected this time by the pitch detection means. Smoothing pitch information is obtained by multiplying the difference value by a predetermined coefficient.

請求項4記載のピッチ変換装置は、請求項1から3のいずれかに記載のピッチ変換装置において、前記ピッチ変換手段は、前記ピッチ検出手段により検出されたピッチに基づいて、前記オーディオ信号の所定区間を切り出し、その切り出した区間を前記ピッチ平滑手段により平滑化された平滑化ピッチ情報と前記目標ピッチ指定手段により指定された目標ピッチとに応じた周期で合成するものである。   The pitch conversion device according to claim 4 is the pitch conversion device according to any one of claims 1 to 3, wherein the pitch conversion unit is configured to perform predetermined processing of the audio signal based on the pitch detected by the pitch detection unit. The section is cut out, and the cut out section is synthesized with a period according to the smoothed pitch information smoothed by the pitch smoothing means and the target pitch specified by the target pitch specifying means.

請求項5記載のピッチ変換装置は、請求項1から3のいずれかに記載のピッチ変換装置において 前ピッチ変換手段は、波形記憶手段に記憶されたオーディオ信号を前記ピッチ平滑手段により平滑化された平滑化ピッチ情報と前記目標ピッチ指定手段により指定された目標ピッチとに応じた速さで読み出すものである。   The pitch conversion device according to claim 5 is the pitch conversion device according to any one of claims 1 to 3, wherein the front pitch conversion means smoothes the audio signal stored in the waveform storage means by the pitch smoothing means. Data is read at a speed corresponding to the smoothed pitch information and the target pitch specified by the target pitch specifying means.

請求項1記載のピッチ変換装置によれば、入力されたオーディオ信号のピッチを順次検出し、そのピッチを平滑化するピッチ平滑手段を備え、平滑化されたピッチと指定された目標ピッチとに基づいてピッチ変換を行うので、入力されたオーディオ信号のピッチが指定された目標ピッチに変換されるとともに、入力されたオーディオ信号のピッチが揺らいでいる場合には、変換されたオーディオ信号のピッチも揺らぐようにすることができるという効果がある。   According to the pitch conversion device of the first aspect, pitch smoothing means for sequentially detecting the pitch of the input audio signal and smoothing the pitch is provided, and based on the smoothed pitch and the designated target pitch. Therefore, the pitch of the input audio signal is converted to the specified target pitch, and if the pitch of the input audio signal fluctuates, the pitch of the converted audio signal also fluctuates. There is an effect that can be made.

請求項2記載のピッチ変換装置によれば、請求項1記載のピッチ変換装置の奏する効果に加え、前記ピッチ平滑手段は、順次検出されたピッチに低域通過フィルタ処理を施すものであるので、簡単な処理により平滑化することができるという効果がある。   According to the pitch conversion device of claim 2, in addition to the effect of the pitch conversion device of claim 1, the pitch smoothing means performs low-pass filter processing on the sequentially detected pitch, There is an effect that it can be smoothed by a simple process.

請求項3記載のピッチ変換装置は、請求項1又は2に記載のピッチ変換装置の奏する効果に加え、前記ピッチ平滑手段は、前記ピッチ検出手段により今回検出されたピッチの値から前回平滑化された値を引いた差分値に所定の係数を乗算することにより平滑化ピッチ情報を得るものであるので、単純な演算により平滑化処理を行うことができるという効果がある。   According to a third aspect of the present invention, in addition to the effect produced by the first aspect of the present invention, the pitch smoothing means is previously smoothed from the pitch value detected this time by the pitch detecting means. Since the smoothed pitch information is obtained by multiplying the difference value obtained by subtracting the obtained value by a predetermined coefficient, there is an effect that the smoothing process can be performed by a simple calculation.

請求項4記載のピッチ変換装置は、請求項1から3のいずれかに記載のピッチ変換装置の奏する効果に加え、前記ピッチ変換手段は、前記ピッチ検出手段により検出されたピッチに基づいて、前記オーディオ信号の所定区間を切り出し、その切り出した区間を前記ピッチ平滑手段により平滑化された平滑化ピッチ情報と前記目標ピッチ指定手段により指定された目標ピッチとに応じた周期で合成するものであるので、入力されたオーディオ信号のフォルマントを変更せずにピッチだけを変換することができるという効果がある。   According to a fourth aspect of the present invention, in addition to the effect produced by the pitch conversion device according to any one of the first to third aspects, the pitch conversion unit is configured to generate the pitch conversion unit based on the pitch detected by the pitch detection unit. A predetermined section of the audio signal is cut out, and the cut out section is synthesized with a period according to the smoothed pitch information smoothed by the pitch smoothing means and the target pitch specified by the target pitch specifying means. There is an effect that only the pitch can be converted without changing the formant of the input audio signal.

請求項5記載のピッチ変換装置は、請求項1から3のいずれかに記載のピッチ変換装置において、前ピッチ変換手段は、波形記憶手段に記憶されたオーディオ信号を前記ピッチ平滑手段により平滑化された平滑化ピッチ情報と前記目標ピッチ指定手段により指定された目標ピッチとに応じた速さで読み出すものであるので、入力されたオーディオ信号のフォルマントも同時に変換されるが構成が簡単であるという効果がある。   The pitch conversion device according to claim 5 is the pitch conversion device according to any one of claims 1 to 3, wherein the previous pitch conversion means smoothes the audio signal stored in the waveform storage means by the pitch smoothing means. The smoothed pitch information and the target pitch designated by the target pitch designation means are read out at a speed, so that the formant of the input audio signal is converted at the same time, but the configuration is simple. There is.

本発明の第1の実施形態は、図1(a)に示すように、アナログの楽音信号または音声信号等のオーディオ信号(可聴周波数信号)が入力される入力端子2を有し、この入力端子2に供給されたオーディオ信号が、A/D変換器4によってデジタルオーディオ信号(サンプリングデータ)に変換される。このA/D変換器4と入力端子2との間には、オーディオ信号をA/D変換器4におけるサンプリング周波数(例えば48kHz)の1/2以下の周波数に制限して、エイリアスの発生を防止するために、ローパスフィルタ6が設けられている。   As shown in FIG. 1 (a), the first embodiment of the present invention has an input terminal 2 to which an audio signal (audible frequency signal) such as an analog musical tone signal or a voice signal is input. The audio signal supplied to 2 is converted into a digital audio signal (sampling data) by the A / D converter 4. Between the A / D converter 4 and the input terminal 2, the audio signal is limited to a frequency that is 1/2 or less of the sampling frequency (for example, 48 kHz) in the A / D converter 4 to prevent aliasing. For this purpose, a low-pass filter 6 is provided.

A/D変換器4によりデジタル化されたサンプリングデータは、DSP(デジタル信号処理装置)8に供給され、DSP8からRAM12に供給される。このRAM12は、入力されたサンプリングデータを順次記憶するリングメモリとして使用されている。   The sampling data digitized by the A / D converter 4 is supplied to a DSP (digital signal processing device) 8 and is supplied from the DSP 8 to the RAM 12. The RAM 12 is used as a ring memory that sequentially stores input sampling data.

次に、DSP8は、このリングメモリに一時的に記憶したサンプリングデータを読出して、処理を行い、D/A変換器14に供給する。D/A変換器14は、DSP8で処理されたサンプリングデータをアナログのオーディオ信号に変換し、ローパスフィルタ16に供給する。このアナログのオーディオ信号は、ローパスフィルタ16により不要な信号成分が除去された後、出力端子18から出力され、図示しないアンプにより増幅されてスピーカ等から放音される。   Next, the DSP 8 reads the sampling data temporarily stored in the ring memory, performs processing, and supplies it to the D / A converter 14. The D / A converter 14 converts the sampling data processed by the DSP 8 into an analog audio signal and supplies the analog audio signal to the low-pass filter 16. This analog audio signal is output from the output terminal 18 after unnecessary signal components are removed by the low-pass filter 16, amplified by an amplifier (not shown), and emitted from a speaker or the like.

DSP8は、予め設定されているプログラムに従ってサンプリングデータを処理する。その処理には、例えば使用者が操作する操作子28によって設定されたフォルマント変更係数FORMANT−VRや目標ピッチ情報SPITCH等のパラメータが使用される。これらフォルマント変更係数FORMANT−VRや目標ピッチ情報SPITCHは、それぞれを設定するボリュームツマミが設けられており、それらのボリュームツマミにより設定されている値がCPU22によって検出され、DSP8に供給され、DSP8内のレジスタに記憶される。なお、目標ピッチ情報SPITCHは、目標ピッチ(周波数)に対応する周期であり、目標とするピッチの逆数である。   The DSP 8 processes sampling data according to a preset program. For this process, parameters such as formant change coefficient FORMAT-VR and target pitch information SPITCH set by the operator 28 operated by the user are used. These formant change coefficient FORMANT-VR and target pitch information SPITCH are provided with volume knobs for setting each of them, and the values set by these volume knobs are detected by the CPU 22, supplied to the DSP 8, and stored in the DSP 8. Stored in a register. The target pitch information SPITCH is a period corresponding to the target pitch (frequency), and is the reciprocal of the target pitch.

CPU22には、プログラム等を記憶したROM24とRAM26がバスを経由して接続され、ROM24に記憶されたプログラムを実行することによりピッチ変換装置の制御を行う。CPU22が実行する処理としては、上述の通り操作子28により設定されている値を検出し、その設定に応じたパラメータをDSP8に供給するなどのDSP8の制御と、設定されたパラメータを表示器(図示なし)に表示を行うなどの処理がある。   A ROM 24 and a RAM 26 storing programs and the like are connected to the CPU 22 via a bus, and the pitch conversion device is controlled by executing the programs stored in the ROM 24. As the processing executed by the CPU 22, as described above, the value set by the operation element 28 is detected, and the DSP 8 is controlled such that the parameter corresponding to the setting is supplied to the DSP 8, and the set parameter is displayed on the display ( There is a process such as displaying (not shown).

図1(b)は、DSP8が実行する機能を機能ブロック図で示したもので、本発明の基本となる実施形態を示したものである。なお、この実施例では、入力端子23に入力されるサンプリングデータをRAM12のリングメモリに順次記憶する機能ブロックを有しているが、説明を容易にするため、図1(b)ではその機能ブロックを省略している。   FIG. 1B is a functional block diagram showing the functions executed by the DSP 8, and shows a basic embodiment of the present invention. In this embodiment, there is a functional block for sequentially storing the sampling data input to the input terminal 23 in the ring memory of the RAM 12, but for the sake of easy explanation, the functional block is shown in FIG. Is omitted.

同図(b)に示す基本実施形態では、入力端子23と、ピッチ変換手段36と、ピッチ検出手段30と、ピッチ平滑手段32と、制御手段34と、出力端子29とが、設けられている。   In the basic embodiment shown in FIG. 2B, an input terminal 23, a pitch conversion means 36, a pitch detection means 30, a pitch smoothing means 32, a control means 34, and an output terminal 29 are provided. .

ピッチ検出手段30は、サンプリングデータからゼロクロス点を検出し、ゼロクロス点の間隔がほぼ同一となる周期を順次検出するものである。ピッチ平滑手段32は、ピッチ検出手段30が検出した周期を順次入力し平滑化を行うものである。入力されたオーディオ信号のピッチが揺らいでいる場合には、揺らぎが除かれ、平滑化(平均化)されたピッチ(周期)が得られる。   The pitch detection means 30 detects the zero cross points from the sampling data, and sequentially detects periods in which the intervals between the zero cross points are substantially the same. The pitch smoothing unit 32 performs smoothing by sequentially inputting the periods detected by the pitch detecting unit 30. When the pitch of the input audio signal is fluctuating, the fluctuation is removed, and a smoothed (averaged) pitch (period) is obtained.

制御手段34は、ピッチ検出手段30からのピッチ検出信号とピッチ平滑手段32により平滑化された平滑化ピッチ情報lpや、CPU22を介して操作子28の操作によって設定されたフォルマント変更係数FORMANT−VRや目標ピッチ情報SPITCH等のパラメータを用いてピッチ変換手段36を制御するものである。   The control means 34 includes a pitch detection signal from the pitch detection means 30 and smoothed pitch information lp smoothed by the pitch smoothing means 32, and a formant change coefficient FORMAT-VR set by the operation of the operator 28 via the CPU 22. The pitch conversion means 36 is controlled using parameters such as target pitch information SPITCH.

ピッチ変換手段36は、リングメモリに記憶されているサンプリングデータからピッチ検出手段30により検出されたピッチに対応する周期に基づいて所望の区間を音素として切り出し、制御手段34の制御に基づいて、切り出された区間を所望のフォルマントに対応する速度で読み出すと共に、再生ピッチ情報WIDTHに対応した周期で合成する。   The pitch converting means 36 cuts out a desired section as a phoneme based on the period corresponding to the pitch detected by the pitch detecting means 30 from the sampling data stored in the ring memory, and cuts out based on the control of the control means 34. The read section is read out at a speed corresponding to a desired formant and synthesized at a period corresponding to the reproduction pitch information WIDTH.

ピッチ平滑手段32は、上述の通りピッチ検出手段30により順次検出されたオーディオ信号のピッチに対応する周期を平滑化(平均化)するもので、ローパスフィルタ(低域通過フィルタ)を用いることができる。このローパスフィルタの一例として、今回検出されたピッチ(周期)をPITCH、平滑率をα(0より大きく1.0より小さい所定の値の係数)とすると平滑化された平滑ピッチlp(平滑化ピッチ情報)は、
lp=(PITCH−lp)×α+lp (1)
として求めることができる。
The pitch smoothing means 32 smoothes (averages) the period corresponding to the pitch of the audio signal sequentially detected by the pitch detecting means 30 as described above, and a low-pass filter (low-pass filter) can be used. . As an example of the low-pass filter, if the detected pitch (period) is PITCH and the smoothing rate is α (a coefficient having a predetermined value larger than 0 and smaller than 1.0), the smoothed smoothing pitch lp (smoothing pitch) Information)
lp = (PITCH−lp) × α + lp (1)
Can be obtained as

ここで、平滑率αの値を1.0とすれば、lpは、平滑化されない検出されたピッチの値そのものとなり、平滑率αの値を0に近い値に設定すると、検出されたピッチの変化に追従しない平滑化ピッチ情報となる。この平滑率を適切な値に設定することにより、入力されたオーディオ信号のピッチが揺らいでいる場合には、その揺らぎが除かれたピッチ、言換えれば中心ピッチが求められる。   Here, if the value of the smoothing rate α is 1.0, lp becomes the value of the detected pitch that is not smoothed, and if the value of the smoothing rate α is set to a value close to 0, the value of the detected pitch The smoothed pitch information does not follow the change. By setting the smoothing rate to an appropriate value, when the pitch of the input audio signal fluctuates, the pitch from which the fluctuation is removed, in other words, the center pitch is obtained.

制御手段34は、その揺らぎが除かれたピッチを指定された目標ピッチに変換するようにピッチ変換手段36を制御する。その結果、ピッチ変換されたオーディオ信号に、入力されたオーディオ信号のピッチの揺らぎが保持されることになる。   The control means 34 controls the pitch converting means 36 so as to convert the pitch from which the fluctuation is removed into a designated target pitch. As a result, the pitch fluctuation of the input audio signal is retained in the pitch-converted audio signal.

なお、この基本実施形態では、上記音素の再生を、第1の波形を再生するための処理経路と、第2の波形を再生するための処理経路とを使用し、それぞれの処理経路では、再生しようとする周期の2倍の周期で音素を再生し、これらを合成するようにしている。   In this basic embodiment, the phoneme is reproduced by using a processing path for reproducing the first waveform and a processing path for reproducing the second waveform. The phonemes are reproduced with a period twice as long as the intended period, and these are synthesized.

この効果付加の動作を、図2、図3及び図4に示すフローチャートに基づいて説明する。DSP8は、サンプリングデータの検出ピッチに対応する周期を記憶するレジスタPITCH、リングメモリからサンプリングデータを切り出す(読出)アドレスを記憶するレジスタSADRSを備えている。更に、後述する再生ピッチ周期長に達したかをカウントするためのレジスタPHASE、第1の波形の位相をカウントするためのレジスタPH1、第2の波形の位相をカウントするためのレジスタPH2も設けられている。   The effect adding operation will be described with reference to the flowcharts shown in FIGS. The DSP 8 includes a register PITCH that stores a period corresponding to the detected pitch of the sampling data, and a register SADRS that stores an address for reading (reading) the sampling data from the ring memory. Further, a register PHASE for counting whether a reproduction pitch period length described later has been reached, a register PH1 for counting the phase of the first waveform, and a register PH2 for counting the phase of the second waveform are also provided. ing.

また、ピッチ検出手段30によって検出された周期PITCHに目標ピッチ情報SPITCHを乗算し、その積を平滑化ピッチ情報lpで除算することによって求めた再生ピッチ情報を記憶するためのレジスタWIDTH、検出した周期とフォルマント係数FORMANT−VRとから定めたエンベロープの長さを記憶するレジスタLENGTH、平滑化されたピッチである平滑化ピッチ情報を記憶するレジスタlp、第1の波形のエンベロープを記憶するためのレジスタENV1、及び第2の波形のエンベロープを記憶するためのレジスタENV2が、設けられている。   A register WIDTH for storing reproduction pitch information obtained by multiplying the period PITCH detected by the pitch detection means 30 by the target pitch information SPITCH and dividing the product by the smoothed pitch information lp, the detected period And a register LENGTH for storing the length of the envelope determined from the formant coefficient FORMANT-VR, a register lp for storing smoothed pitch information which is a smoothed pitch, and a register ENV1 for storing the envelope of the first waveform And a register ENV2 for storing the envelope of the second waveform.

更に、第1の波形のエンベロープの形状を決定するためのレジスタWINDOW1、第2の波形のエンベロープの形状を決定するためのレジスタWINDOW2、LENGTHの値に基づいて定めたWINDOW1、WINDOW2の歩進率を記憶するレジスタW−RATE、第1の波形の切り出し開始アドレスを記憶するレジスタSADRS1、第2の波形の切り出し開始アドレスを記憶するレジスタSADRS2、第1及び第2の波形の切り出しの開始位置等の決定のために使用するフラグF等も設けられている。   Further, the step rate of WINDOW1 and WINDOW2 determined based on the values of the register WINDOW1 for determining the shape of the envelope of the first waveform, the registers WINDOW2 and LENGTH for determining the shape of the envelope of the second waveform, Register W-RATE to be stored, register SADRS1 to store the first waveform cut-out start address, register SADRS2 to store the second waveform cut-out start address, determination of the first and second waveform cut-out start positions, etc. A flag F used for the purpose is also provided.

これらは、電源の投入の際に、初期化が行われる。即ち、フラグFは1に、他のものは0に、それぞれ設定される。なお、以下の説明では、各レジスタには、既に適当な値が記憶されているとして説明する。また、図2及び図3に示すフローチャートの各ステップは、DSP8にA/D変換器4からサンプリングデータが入力されるごとに実行される。   These are initialized when the power is turned on. That is, the flag F is set to 1 and the others are set to 0. In the following description, it is assumed that appropriate values are already stored in each register. Each step of the flowcharts shown in FIGS. 2 and 3 is executed each time sampling data is input from the A / D converter 4 to the DSP 8.

図2において、サンプリングデータがA/D変換器4から供給されると、これをリングメモリに書き込む(S2)。次に、この入力されたサンプリングデータに基づいてピッチ検出処理を行う(S4)。このS4の処理がピッチ検出手段30に相当する。このピッチ検出処理は、ピッチを検出したときにゼロクロス位置のアドレスであるSADRSと検出したピッチに対応する周期であるPITCHとを出力するものである。   In FIG. 2, when sampling data is supplied from the A / D converter 4, it is written to the ring memory (S2). Next, pitch detection processing is performed based on the input sampling data (S4). The process of S4 corresponds to the pitch detection means 30. This pitch detection process outputs SADRS, which is the address of the zero cross position, and PITCH, which is a cycle corresponding to the detected pitch, when the pitch is detected.

このピッチ検出処理は、例えば隣接するゼロクロス間の時間間隔を順次比較するものである。例えば、図5(a)は、入力されたオーディオ信号の波形を表すもので、横軸に時間を、縦軸に波形の振幅値を表示している。この図において、入力信号のゼロクロス間の時間間隔がa0、b0、c0、d0、a1、b1、c1、d1であるとする。最初のゼロクロス間の時間間隔a0と次のゼロクロス間の時間間隔b0とを比較し、両者が異なると、次にそれらを加算した時間間隔(a0+b0)と隣接する時間間隔(c0+d0)とを比較する。この比較においても両者が異なると、時間間隔(a0+b0+c0)と隣接する時間間隔(d0+a1+b1)とを比較する。やはり両者が異なると、時間間隔(a0+b0+c0+d0)と隣接する時間間隔(a1+b1+c1+d1)とを比較する。この比較で両者がほぼ一致すると、時間間隔(a1+b1+c1+d1)をPITCH、時刻t0に対応するアドレスをゼロクロス位置のアドレスとして出力する。   This pitch detection process sequentially compares time intervals between adjacent zero crosses, for example. For example, FIG. 5A shows a waveform of an input audio signal, and the horizontal axis represents time and the vertical axis represents the amplitude value of the waveform. In this figure, it is assumed that the time intervals between the zero crosses of the input signal are a0, b0, c0, d0, a1, b1, c1, and d1. The time interval a0 between the first zero crosses is compared with the time interval b0 between the next zero crosses. If they are different, the time interval (a0 + b0) obtained by adding them is compared with the adjacent time interval (c0 + d0). . If both are different in this comparison, the time interval (a0 + b0 + c0) is compared with the adjacent time interval (d0 + a1 + b1). If they are different, the time interval (a0 + b0 + c0 + d0) is compared with the adjacent time interval (a1 + b1 + c1 + d1). When the two values are almost the same in this comparison, the time interval (a1 + b1 + c1 + d1) is output as PITCH, and the address corresponding to time t0 is output as the address at the zero cross position.

その他、例えば特開平3−288200号公報に開示されているように、サンプリングデータのゼロクロス位置と、波形信号のピーク位置とを検出し、これらゼロクロス位置とピーク位置との時間間隔を、以前に検出したゼロクロス位置との時間間隔と比較することによって、ピッチを検出するものも使用することができる。   In addition, as disclosed in, for example, Japanese Patent Laid-Open No. 3-288200, the zero cross position of the sampling data and the peak position of the waveform signal are detected, and the time interval between the zero cross position and the peak position is previously detected. It is also possible to use one that detects the pitch by comparing the time interval with the zero cross position.

S4の処理においてピッチ検出が行われたか否かを判断し(S6)、ピッチ検出された場合(S6:Yes)は、S4の処理で検出されたゼロクロス位置を切り出しアドレスとし、これによってレジスタSADRSの値を更新し、かつ検出ピッチを1周期長として、これでPITCHの値を更新する(S8)。   It is determined whether or not pitch detection has been performed in the process of S4 (S6). If the pitch is detected (S6: Yes), the zero-cross position detected in the process of S4 is set as the cut-out address, and thereby the register SADRS The value is updated, and the detected pitch is set to one cycle length, thereby updating the value of PITCH (S8).

ピッチ検出が行われなかった場合(S6:No)、またはピッチ検出が行われ、上記の両レジスタの更新が行われた場合、レジスタPHASE、PH1、PH2の値をそれぞれ1歩進させる(S10)。   When the pitch detection is not performed (S6: No), or when the pitch detection is performed and both the above registers are updated, the values of the registers PHASE, PH1, and PH2 are respectively advanced by 1 (S10). .

次にレジスタPHASEが、WIDTHの値と等しいかまたは大きいかを判断する(S12)。WIDTHは、後述するように再生するピッチに対応する1周期長を記憶しており、PHASEの値がこのWIDTHの値に達しているか否かを判断している。即ち、所定の再生ピッチにPHASEの値が達しているか否かを判断している。このWIDTHの値が再生ピッチ情報に相当する。   Next, it is determined whether the register PHASE is equal to or greater than the value of WIDTH (S12). WIDTH stores one cycle length corresponding to the pitch to be reproduced as will be described later, and determines whether or not the value of PHASE has reached this WIDTH value. That is, it is determined whether or not the PHASE value has reached a predetermined reproduction pitch. The value of WIDTH corresponds to reproduction pitch information.

PHASEの値がWIDTHの値に達していないと(S12:No)、後述する図3に記載のフローチャートのS32の波形処理へ進む。PHASEの値がWIDTHの値に達していると(S12:Yes)、レジスタPHASEの値を0とする(S14)。   If the PHASE value does not reach the WIDTH value (S12: No), the process proceeds to the waveform processing in S32 of the flowchart shown in FIG. If the value of PHASE has reached the value of WIDTH (S12: Yes), the value of register PHASE is set to 0 (S14).

次に、ピッチ平滑化処理を行う。この処理は、レジスタPITCHの値からレジスタlpの値を引いた値に係数αを乗算し、その値にレジスタlpの値を加算した値を新たなlpとするものであり、この処理によりレジスタPITCHに順次記憶される値が平滑化される。この平滑化された値lpをレジスタlpに記憶する(S16)。   Next, a pitch smoothing process is performed. In this process, a value obtained by subtracting the value of the register lp from the value of the register PITCH is multiplied by the coefficient α, and a value obtained by adding the value of the register lp to the value is used as a new lp. The values sequentially stored in are smoothed. The smoothed value lp is stored in the register lp (S16).

そして新たなWIDTHの値を決定するために、PITCHの値と目標ピッチ情報SPITCHとを乗算し、その積を平滑化ピッチ情報lpの値で除算する。これをレジスタWIDTHに記憶させると共に、第1の波形のエンベロープ、第2の波形のエンベロープの周期を決定するために、PITCHの値をフォルマント係数FORMANT−VRで除算し、レジスタLENGTHに記憶させる(S18)。   In order to determine a new WIDTH value, the PITCH value is multiplied by the target pitch information SPITCH, and the product is divided by the smoothed pitch information lp value. This is stored in the register WIDTH, and the PITCH value is divided by the formant coefficient FORMANT-VR and stored in the register LENGTH to determine the envelope periods of the first waveform and the second waveform (S18). ).

次に図3に記載するフローチャートに進み、レジスタLENGTHの値がレジスタWIDTHの値より大きいか否かを判断する(S20)。LENGTHの値がWIDTHの値よりも大きいと(S20:Yes)、LENGTHの値をWIDTHの値とする(S22)。これは、LENGTHの値がWIDTHの値を超えないようにするためである。即ち、後述するS32の波形読み出し処理において波形を加算するための処理経路が2つしか用意していないため、2つ以上の波形が重ならないようにするためである。   Next, proceeding to the flowchart shown in FIG. 3, it is determined whether or not the value of the register LENGTH is larger than the value of the register WIDTH (S20). If the LENGTH value is larger than the WIDTH value (S20: Yes), the LENGTH value is set as the WIDTH value (S22). This is to prevent the LENGTH value from exceeding the WIDTH value. In other words, since only two processing paths for adding waveforms are prepared in the waveform readout process of S32 described later, two or more waveforms are prevented from overlapping.

なお、LENGTHの値がWIDTHの値以下であると、S22のような処理を行わずに、S24の処理を行う。また、S22の処理に続いて、S24の処理も行われる。S24の処理では、LENGTHの値の逆数を求め、レジスタW−RATEに記憶させる。このW−RATEの値は、後述するようにWINDOW1、WINDOW2の値を歩進させるために使用する。また、S24の処理では、フラグFの値を今までの値と反転させることも行う。   If the LENGTH value is less than or equal to the WIDTH value, the process of S24 is performed without performing the process of S22. Further, following the process of S22, the process of S24 is also performed. In the process of S24, the reciprocal of the value of LENGTH is obtained and stored in the register W-RATE. This W-RATE value is used to step up the values of WINDOW1 and WINDOW2 as will be described later. Further, in the process of S24, the value of the flag F is also inverted from the current value.

次に、S24の処理で反転させたフラグFの値が1であるか、−1であるかを判断する(S26)。フラグFが1であると(S26:Yes)、第1の波形の読出開始のため、レジスタPH1、WINDOW1をそれぞれ0とし、S8の処理で決定したSADRSの値(切り出しアドレス)を切り出し開始アドレスレジスタSADRS1に記憶させる(S28)。   Next, it is determined whether the value of the flag F inverted in the process of S24 is 1 or -1 (S26). When the flag F is 1 (S26: Yes), in order to start reading the first waveform, the registers PH1 and WINDOW1 are set to 0, and the value of SADRS (cutout address) determined in the process of S8 is set to the cutout start address register. The data is stored in SADRS1 (S28).

またS24の処理で反転させたFの値が−1であると(S26:No)、第2の波形の読出開始のため、レジスタPH2、WINDOW2をそれぞれ0とし、S8で決定したレジスタSADRSの値(切り出しアドレス)を切り出し開始アドレスレジスタSADRS2に記憶させる(S30)。   If the value of F inverted in the process of S24 is -1 (S26: No), the value of the register SADRS determined in S8 is set to 0 by setting the registers PH2 and WINDOW2 to 0 in order to start reading the second waveform. The (cutout address) is stored in the cutout start address register SADRS2 (S30).

このようなステップS12、S14、S16、S18、S20、S22、S24、S26、S28、S30によって、2再生ピッチの周期長に相当する時間(WIDTHの値の2倍)経過ごとに、第1及び第2の波形データの切り出し開始アドレスが更新され、PHASEの値がWIDTHの値に達するごとにフラグFの値が反転されることになる。   By such steps S12, S14, S16, S18, S20, S22, S24, S26, S28, and S30, the first and second time intervals corresponding to the period length of two playback pitches (twice the value of WIDTH) are passed. The cut start address of the second waveform data is updated, and the value of the flag F is inverted every time the PHASE value reaches the WIDTH value.

S28またはS30の処理に続いて、またはS12の処理においてレジスタPHASEの値がレジスタWIDTHの値に達していないと判断された場合、波形読出処理を行う(S32)。このように波形読みだし処理は、PHASEの値がWIDTHに達するまでは、WIDTHの値、LENGTHの値(ひいてはW−RATEの値)を変更せずに行われる。   Following the processing of S28 or S30, or when it is determined in the processing of S12 that the value of the register PHASE has not reached the value of the register WIDTH, a waveform reading process is performed (S32). In this manner, the waveform reading process is performed without changing the WIDTH value and LENGTH value (and thus the W-RATE value) until the PHASE value reaches WIDTH.

後述する波形読み出し処理では、W−RATEの値で、第1及び第2の波形のエンベロープENV1、ENV2の値が制御される。   In the waveform readout process described later, the values of envelopes ENV1 and ENV2 of the first and second waveforms are controlled by the value of W-RATE.

そして、W−RATE、ひいてはLENGTHの値は、S18において検出ピッチをフォルマント変更係数FORMANT−VRによって変更したものであるので、波形読出処理される波形のピッチは、フォルマント変更係数FORMANT−VRに応じたものとなる。   Since the value of W-RATE, and hence LENGTH, is obtained by changing the detected pitch by the formant change coefficient FORMAT-VR in S18, the pitch of the waveform to be subjected to the waveform reading process corresponds to the formant change coefficient FORMANT-VR. It will be a thing.

次に図4を参照して、この波形読出処理について説明する。まずカウンタWINDOW1の値をW−RATEの値だけ歩進させる(S34)。そして、歩進させたWINDOW1の値が1より小さいか、1以上であって2より小さいか、2以上であるかを判定する(S36)。   Next, the waveform reading process will be described with reference to FIG. First, the value of the counter WINDOW1 is incremented by the value of W-RATE (S34). Then, it is determined whether the value of the incremented WINDOW1 is less than 1, 1 or more, less than 2, or 2 or more (S36).

1より小さい場合、WINDOW1の値をレジスタENV1に記憶させ(S38)、1以上であって2より小さいとき、2からWINDOW1の値を減算した値をレジスタENV1に記憶させ(S40)、2以上のとき、ENV1の値を0とする(S42)。   If it is smaller than 1, the value of WINDOW1 is stored in the register ENV1 (S38). If it is 1 or more and smaller than 2, the value obtained by subtracting the value of WINDOW1 from 2 is stored in the register ENV1 (S40). At this time, the value of ENV1 is set to 0 (S42).

S34乃至S40の処理は、W−RATEの値ずつ値が増加する鋸歯状波を作成し、これの値を1で折り返すことによって、ENV1を作成している。但し、WINDOW1の値が2を超えた場合には、S42の処理によってENV1を0としている。即ち、フォルマント係数FORMANT−VRと検出ピッチとに基づいて定めたLENGTHの値の逆数であるW−RATEずつ1まで増加し、その後、W−RATEずつ0まで減少する三角波を第1の波形のエンベロープとして作成している。   In the processing of S34 to S40, a sawtooth wave whose value increases by the value of W-RATE is created, and this value is folded back to 1, thereby creating ENV1. However, when the value of WINDOW1 exceeds 2, ENV1 is set to 0 by the process of S42. That is, a triangular wave that increases to 1 by W-RATE, which is the reciprocal of the value of LENGTH determined based on the formant coefficient FORMANT-VR and the detection pitch, and then decreases to 0 by W-RATE is converted into an envelope of the first waveform. It is created as.

また、S38、S40またはS42の処理に続いて、レジスタPH1の値(切り出しアドレスの歩進値)にフォルマント係数FORMANT−VRを乗算した値を、第1の波形の切り出し開始アドレスを記憶しているレジスタSADRS1の値と加算して、第1の波形の切り出しアドレスを記憶するレジスタADRS1に記憶させる(S44)。これに続いて、リングメモリから切り出しアドレスADRS1で第1の波形の波形データDATA1を読み出す(S46)。   Further, following the processing of S38, S40 or S42, a value obtained by multiplying the value of the register PH1 (stepping value of the cut-out address) by the formant coefficient FORMAT-VR is stored as the cut-out start address of the first waveform. The value is added to the value of the register SADRS1, and is stored in the register ADRS1 that stores the cut-out address of the first waveform (S44). Subsequently, the waveform data DATA1 of the first waveform is read from the ring memory with the cut-out address ADRS1 (S46).

このように読出アドレスはフォルマント係数FORMANT−VRによって変更されているので、結果的には波形データDATA1の読出速度が、フォルマント係数FORMANT−VRによって変更されている。   As described above, since the read address is changed by the formant coefficient FORMAT-VR, as a result, the read speed of the waveform data DATA1 is changed by the formant coefficient FORMAT-VR.

これに続いて、WINDOW2の値をW−RATEだけ歩進させる(S48)。歩進させたWINDOW2の値が1より小さいか、1以上で2未満であるか、または2以上であるか判断する(S50)。そして、WINDOW2の値が1より小さいと、WINDOW2の値をレジスタENV2に記憶させ(S52)、WINDOW2の値が1以上で2未満であると、2からWINDOW2の値を減算した値をレジスタENV2の記憶させ(S54)、WINDOW2の値が2以上であると、ENV2の値を0とする(S56)。このようにして、第2の波形のエンベロープを準備する。   Following this, the value of WINDOW2 is incremented by W-RATE (S48). It is determined whether the value of the incremented WINDOW2 is less than 1, 1 or more and less than 2, or 2 or more (S50). If the value of WINDOW2 is smaller than 1, the value of WINDOW2 is stored in the register ENV2 (S52). If the value of WINDOW2 is 1 or more and less than 2, the value obtained by subtracting the value of WINDOW2 from 2 is stored in the register ENV2. If the value of WINDOW2 is 2 or more, the value of ENV2 is set to 0 (S56). In this way, the envelope of the second waveform is prepared.

S52、S54またはS56の処理に続いて、レジスタPH2の値にフォルマント係数FORMANT−VRを乗算した値と第2の波形データ用の切り出し開始アドレスSADRS2の値とを加算した値を、第2の波形データ用の切り出しアドレス用のレジスタADRS2に記憶させる(S58)。そして、リングメモリからアドレスADRS2で第2の波形の波形データ(DATA2)を読み出す(S60)。   Subsequent to the processing of S52, S54, or S56, the value obtained by multiplying the value of the register PH2 by the value of the formant coefficient FORMAT-VR and the value of the extraction start address SADRS2 for the second waveform data is added to the second waveform. It is stored in the register ADRS2 for the cut-out address for data (S58). Then, the waveform data (DATA2) of the second waveform is read from the ring memory at the address ADRS2 (S60).

このようにして読出されたDATA1にENV1の値を乗算したものと、DATA2にENV2の値を乗算したものとを、加算したものを出力OUTとする(S62)。このような波形読出処理が行われた後、図3に示すように出力OUTを送出する(S64)。   An output OUT is obtained by adding the value of ENV1 multiplied by the value of DATA1 read out in this manner and the value of DATA2 multiplied by the value of ENV2 (S62). After such waveform reading processing is performed, output OUT is sent out as shown in FIG. 3 (S64).

図5は、目標ピッチ情報SPITCHに応じて設定されたWIDTHが、検出された周期PITCHより長く設定され、フォルマント変更係数FORMANT−VRが1に設定された場合の各部の波形を示すものである。すなわち、この図5では、入力されたオーディオ信号のピッチを低く変換し、フォルマント特性は元のままとする場合を示している。   FIG. 5 shows the waveform of each part when WIDTH set according to the target pitch information SPITCH is set longer than the detected period PITCH and the formant change coefficient FORMAT-VR is set to 1. That is, FIG. 5 shows a case where the pitch of the input audio signal is converted to a low value and the formant characteristics remain unchanged.

図5(a)は、入力波形であり、時刻t0からt1までが1周期であってその周期をP0、次に時刻t1からt2までが次の1周期であり、その周期をP1として示している。
以下同様である。
(b)は、レジスタPHASEの値の変化であり、再生される楽音のピッチに対応する周期であるWIDTHを周期とする鋸歯状波である。この周期毎の時刻をtw0、tw1・・・とする。
(c)は、PH1、(d)は、PH2を示す図で、WIDTHの2倍の周期の鋸歯状波であって、PH1とPH2とは、位相がWIDTHだけ異なっている。
FIG. 5A shows an input waveform, which is one cycle from time t0 to t1, and that cycle is P0, and then from time t1 to t2 is the next one cycle, which is shown as P1. Yes.
The same applies hereinafter.
(B) is a change in the value of the register PHASE, and is a sawtooth wave having a period of WIDTH, which is a period corresponding to the pitch of the reproduced musical sound. The times for each cycle are tw0, tw1,.
(C) is a diagram showing PH1, and (d) is a diagram showing PH2, and is a sawtooth wave having a period twice that of WIDTH. PH1 and PH2 are different in phase by WIDTH.

(e)は、ENV1を表す図であり、LENGTHは、入力されたオーディオ信号のピッチに対応する周期に設定されている。このLENGTHの期間に入力されたオーディオ信号の1周期が、ここでは入力されたサンプリング周期と同じ周期で読み出される。   (E) is a diagram showing ENV1, and LENGTH is set to a cycle corresponding to the pitch of the input audio signal. One period of the audio signal input during this LENGTH period is read out at the same period as the input sampling period.

時刻がtw2の時、入力波形のP0の周期が確定されるので、この時点でLENGTHの値が、P0に設定され、切り出しアドレスSADRSは、時刻t0にリングメモリに記憶したアドレスに設定される。
(f)は、ENV2を表す図であり、ENV1と同様にLENGTHは、入力されたオーディオ信号のピッチに対応する周期に設定されている。ENV1とENV2とは、位相がWIDTHだけ異なっており、読出された波形に乗算されるエンベロープ波形であり、ENV1とENV2とでエンベロープがクロスフェードされる。
When the time is tw2, the period of P0 of the input waveform is determined. At this time, the value of LENGTH is set to P0, and the cut-out address SADRS is set to the address stored in the ring memory at time t0.
(F) is a diagram showing ENV2, and LENGTH is set to a cycle corresponding to the pitch of the input audio signal as in ENV1. ENV1 and ENV2 are envelope waveforms that are different in phase by WIDTH and multiplied by the read waveform, and the envelopes are cross-faded between ENV1 and ENV2.

(g)、(h)は、それぞれのエンベロープENV1およびENV2が読出された音素に乗算された様子を示すもので、これらの波形が合成されて出力される。   (G) and (h) show how the envelopes ENV1 and ENV2 are multiplied by the read phonemes, and these waveforms are synthesized and output.

以上説明したように、この実施例では、出力される信号のピッチは、ピッチ検出手段により検出された周期であるPITCHと設定された目標ピッチ情報SPITCHとを乗算し、その積を平滑化ピッチ情報lpにより除算した値であるWIDTHの値により定められ、出力される信号の読出速度は、フォルマント変更係数FORMANT−VRによって定められる。   As described above, in this embodiment, the pitch of the output signal is multiplied by the pitch detected by the pitch detection means PITCH and the set target pitch information SPITCH, and the product is smoothed pitch information. It is determined by the value of WIDTH, which is a value divided by lp, and the read speed of the output signal is determined by the formant change coefficient FORMAT-VR.

したがって、入力されたオーディオ信号のピッチが揺らいでいる場合には、出力される信号のピッチは、その中心ピッチが目標ピッチに変換されつつも平滑率に対応した揺らぎが維持される。   Therefore, when the pitch of the input audio signal fluctuates, the fluctuation of the pitch of the output signal corresponding to the smoothing rate is maintained while the center pitch is converted to the target pitch.

図6は、本発明の第2の実施形態について説明するためのもので、本発明をコーラス効果装置に応用した実施例を示すブロック図である。図1(b)と異なる点は、ピッチ変換手段は、4つのコーラスチャネル36a、36b、36c、36dを備えている点である。その他のピッチ検出手段30、ピッチ平滑手段32は、同じであり制御手段34は、それぞれのコーラスチャネルに検出されたピッチ情報PITCHとそれぞれの再生ピッチ情報WIDTHを供給する。   FIG. 6 is a block diagram illustrating an example in which the present invention is applied to a chorus effect device for explaining a second embodiment of the present invention. The difference from FIG. 1 (b) is that the pitch converting means includes four chorus channels 36a, 36b, 36c, and 36d. The other pitch detection means 30 and pitch smoothing means 32 are the same, and the control means 34 supplies the detected pitch information PITCH and the respective reproduction pitch information WIDTH to each chorus channel.

例えば、カラオケ装置にこのコーラス効果装置を応用する場合は、カラオケ装置に備えられたシーケンサから曲の進行に合わせて複数のハーモニーに対応する音高情報がMIDI規格により規定されるノートナンバにより供給される。CPU22は、これらのノートナンバに対応する目標ピッチ情報SPITCHを求め、制御手段34に供給する。制御手段34は、それぞれの目標ピッチ情報SPITCHについて、検出されたピッチPITCHおよび平滑化ピッチlpに対応する再生ピッチ情報WIDTHを求め各コーラスチャネルに供給する。   For example, when this chorus effect device is applied to a karaoke device, pitch information corresponding to a plurality of harmonies is supplied from a sequencer provided in the karaoke device according to the progress of a song by a note number defined by the MIDI standard. The The CPU 22 obtains target pitch information SPITCH corresponding to these note numbers and supplies it to the control means 34. The control means 34 obtains reproduction pitch information WIDTH corresponding to the detected pitch PITCH and the smoothed pitch lp for each target pitch information SPITCH, and supplies it to each chorus channel.

また、複数のハーモニーのフォルマントをそれぞれ変更設定することにより、フォルマントを変更することができる。例えば、入力されるボーカルが男性の声であれば、ハーモニーのフォルマントを女性、または子供のフォルマントに設定すれば、あたかも男性のボーカルに女性、あるいは子供のハーモニーが付加されたような効果を得ることができる。   In addition, the formant can be changed by changing and setting the formants of a plurality of harmonies. For example, if the input vocal is a male voice, if the harmony formant is set to female or child formant, the effect is as if a female or child harmony was added to the male vocal. Can do.

図7は、本発明の第3の実施形態について説明するためのもので、本発明を電子楽器に応用した実施例のブロック図である。図1(a)と異なる点は、オーディオ信号が予め記憶手段であるストレージ38に記憶されている点と、目標ピッチを指定する手段が鍵盤40である点であり、その他の構成は、図1(a)と同じであり同じ部番を付している。図1(a)では、オーディオ信号が外部から入力され、そのオーディオ信号のピッチを変換する場合の実施例であるが、図7の場合は、例えばハードディスクなどの大容量のメモリに多数のサンプリングされた波形を記憶し、いずれかの波形を選択し、目標とするピッチを鍵盤40に備えられた鍵を押下することにより指定するものである。   FIG. 7 is a block diagram of an example in which the present invention is applied to an electronic musical instrument for explaining a third embodiment of the present invention. The difference from FIG. 1A is that an audio signal is stored in advance in a storage 38 which is a storage means, and a means for designating a target pitch is a keyboard 40. The other configurations are as shown in FIG. It is the same as (a) and has the same part number. FIG. 1A shows an embodiment in which an audio signal is input from the outside and the pitch of the audio signal is converted. In the case of FIG. 7, a large number of samples are sampled in a large-capacity memory such as a hard disk. The waveform is stored, one of the waveforms is selected, and the target pitch is designated by pressing a key provided on the keyboard 40.

この場合には、ストレージ38に記憶された波形の中から選択された波形を読出し、ピッチを順次検出してそのピッチを平滑化し、その平滑化された平滑化ピッチと、鍵盤40により指定された目標ピッチとに基づいてピッチ変換する。このことにより、ストレージ38に記憶されている波形のピッチの揺らぎを、ピッチ変換されて出力する波形のピッチに付与することができる。   In this case, the waveform selected from the waveforms stored in the storage 38 is read out, the pitches are sequentially detected and the pitches are smoothed, and the smoothed smoothed pitches and the keyboard 40 are designated. Pitch conversion is performed based on the target pitch. As a result, fluctuations in the pitch of the waveform stored in the storage 38 can be added to the pitch of the waveform that is output after being pitch-converted.

なお、以上の実施例では、ピッチ変換装置として、オーディオ信号の所定区間を切り出し、その切り出した区間を再生ピッチに対応する周期で合成する方式のものとしたが、メモリにオーディオ信号を所定のサンプリング周波数でサンプリングして記憶し、そのサンプリング周波数とは異なるサンプリング周波数で読み出すことによりピッチを変換する方式のものとしてもよい。例えば、特許第2519441号に開示されたコーラス効果装置は、この方式を採用したものである。この公報では、目標ピッチをf1、入力されたオーディオ信号のピッチをf2とし、ピッチ変換量Pをf1/f2とし、入力されたオーディオ信号を所定のサンプリング周波数F1でメモリに記憶し、読み出す場合は、このピッチ変換量PをF1に乗算したサンプリング周波数F2で読出している。この方式に、本発明を適用するには、検出されたピッチf2をピッチ平滑手段32により平滑化されたピッチに置き換えればよい。なお、ここでは、サンプリング周波数を変更するいわゆる可変サンプリング方式であるが、サンプリング周波数は一定で、歩進するアドレスの幅を、再生する速度に対応する幅とし、サンプル点がアドレスの少数点になる場合には、補間方法によりその小数点のアドレスに対応する振幅値を求める固定サンプリング方式としてもよい。   In the above embodiment, the pitch conversion device is a method of cutting out a predetermined section of the audio signal and synthesizing the cut out section with a period corresponding to the reproduction pitch. The pitch may be converted by sampling at a frequency and storing it, and reading at a sampling frequency different from the sampling frequency. For example, the chorus effect device disclosed in Japanese Patent No. 2519441 adopts this method. In this publication, when the target pitch is f1, the pitch of the input audio signal is f2, the pitch conversion amount P is f1 / f2, and the input audio signal is stored in the memory at a predetermined sampling frequency F1 and read out. The pitch conversion amount P is read at a sampling frequency F2 obtained by multiplying F1. In order to apply the present invention to this method, the detected pitch f2 may be replaced with a pitch smoothed by the pitch smoothing means 32. In this example, the so-called variable sampling method is used to change the sampling frequency. However, the sampling frequency is constant, the width of the address that advances is set to the width corresponding to the reproduction speed, and the sampling point is the decimal point of the address. In this case, a fixed sampling method may be used in which an amplitude value corresponding to the decimal point address is obtained by an interpolation method.

なお、請求項1記載の入力手段は、図1(b)の入力端子23が該当し、目標ピッチ指定手段は、図1(a)の操作子28、または図6を参照して説明したMIDI情報や図7の鍵盤40が該当する。   The input means described in claim 1 corresponds to the input terminal 23 in FIG. 1B, and the target pitch designating means is the operation element 28 in FIG. 1A or the MIDI described with reference to FIG. This corresponds to the information and the keyboard 40 shown in FIG.

以上、実施例に基づき本発明を説明したが、本発明は上述した実施例に何ら限定されるものではなく、本発明の趣旨を逸脱しない範囲内で種々の改良変更が可能であることは容易に推察できるものである。   The present invention has been described above based on the embodiments. However, the present invention is not limited to the above-described embodiments, and various modifications and changes can be easily made without departing from the spirit of the present invention. Can be inferred.

例えば、上記実施例では、ピッチ検出手段30をDSP8に設けたものとしたが、この処理をCPU22により実行するようにしてもよい。その場合には、DSP8からゼロクロス間の時間情報や波形のピークの時間などをCPU22に送り、CPU22は、これらの値から自己相関を演算により求め、周期を抽出する。   For example, in the above embodiment, the pitch detection means 30 is provided in the DSP 8, but this processing may be executed by the CPU 22. In that case, the DSP 8 sends time information between zero crosses, the peak time of the waveform, and the like to the CPU 22, and the CPU 22 obtains autocorrelation from these values by calculation and extracts the period.

また、同様に上記実施例では、ピッチ平滑手段32をDSP8に設けたものとしたが、この処理をCPU22により実行するようにしてもよい。その場合には、DSP8に設けたピッチ検出手段により検出されたピッチの値をCPU22が読み取り、平滑化した平滑化ピッチ情報を制御手段34に供給すればよい。また、同様に、制御手段34により行われる処理をCPU22により実行されるようにしてもよい。   Similarly, in the above embodiment, the pitch smoothing means 32 is provided in the DSP 8, but this processing may be executed by the CPU 22. In that case, the CPU 22 may read the value of the pitch detected by the pitch detection means provided in the DSP 8 and supply the smoothed smoothed pitch information to the control means 34. Similarly, the process performed by the control unit 34 may be executed by the CPU 22.

また、順次検出されるピッチの値を平滑化する低域通過フィルタの演算式(1)を例示したが、上記に代わる演算式として、
lp = PITCH×α +(1ーα)×lp
を用いてもよいし、その他の平滑化演算方法を用いてもよい。
Moreover, although the arithmetic expression (1) of the low-pass filter which smoothes the value of the pitch detected sequentially is illustrated, as an arithmetic expression instead of the above,
lp = PITCH × α + (1−α) × lp
Or other smoothing calculation methods may be used.

(a)は、本発明によるピッチ変換装置のブロック図、(b)は、DSPにおける処理を説明するためのブロック図である。(A) is a block diagram of the pitch conversion apparatus by this invention, (b) is a block diagram for demonstrating the process in DSP. DSPが実行する処理の一部を示すフローチャートである。It is a flowchart which shows a part of process which DSP performs. 図2に示すフローチャートに続くフローチャートである。It is a flowchart following the flowchart shown in FIG. 図3のフローチャートにおける波形読出し処理の詳細を示すフローチャートである。It is a flowchart which shows the detail of the waveform read-out process in the flowchart of FIG. DSPにおいて実行される処理の部分毎の波形を示す図である。It is a figure which shows the waveform for every part of the process performed in DSP. 本発明を応用したコーラス効果装置のブロック図を示す図である。It is a figure which shows the block diagram of the chorus effect apparatus to which this invention is applied. 本発明を応用した電子楽器のブロック図を示す図である。It is a figure which shows the block diagram of the electronic musical instrument to which this invention is applied.

符号の説明Explanation of symbols

8 DSP
22 CPU
23 入力端子(入力手段)
30 ピッチ検出手段
32 ピッチ平滑手段
34 制御手段
36 ピッチ変換手段
8 DSP
22 CPU
23 Input terminal (input means)
30 Pitch detection means 32 Pitch smoothing means 34 Control means 36 Pitch conversion means

Claims (5)

オーディオ信号を入力する入力手段と、
その入力手段に入力されたオーディオ信号のピッチを順次検出するピッチ検出手段と、
そのピッチ検出手段により検出されたピッチを平滑化し、平滑化ピッチ情報を求めるピッチ平滑手段と、
目標ピッチを指定する目標ピッチ指定手段と、
前記入力手段に入力されたオーディオ信号のピッチを変換するピッチ変換手段と
前記ピッチ平滑手段により平滑化された平滑化ピッチ情報と前記目標ピッチ指定手段により指定された目標ピッチとに基づいて前記ピッチ変換手段を制御する制御手段とを備えていることを特徴とするピッチ変換装置。
An input means for inputting an audio signal;
Pitch detection means for sequentially detecting the pitch of the audio signal input to the input means;
Pitch smoothing means for smoothing the pitch detected by the pitch detecting means and obtaining smoothed pitch information;
Target pitch designating means for designating the target pitch;
The pitch conversion means for converting the pitch of the audio signal input to the input means, the pitch conversion based on the smoothed pitch information smoothed by the pitch smoothing means and the target pitch specified by the target pitch specifying means. And a control means for controlling the means.
前記ピッチ平滑手段は、前記ピッチ検出手段により順次検出されたピッチに低域通過フィルタ処理を施すものであることを特徴とする請求項1記載のピッチ変換装置。   2. The pitch converting apparatus according to claim 1, wherein the pitch smoothing means performs low-pass filter processing on the pitches sequentially detected by the pitch detecting means. 前記ピッチ平滑手段は、前記ピッチ検出手段により今回検出されたピッチの値から前回平滑化された値を引いた差分値に所定の係数を乗算することにより平滑化ピッチ情報を求めるものであることを特徴とする請求項1又は2記載のピッチ変換装置。   The pitch smoothing means obtains smoothed pitch information by multiplying a difference value obtained by subtracting a previously smoothed value from the pitch value detected this time by the pitch detecting means by a predetermined coefficient. The pitch converter according to claim 1 or 2, characterized in that 前記ピッチ変換手段は、前記ピッチ検出手段により検出されたピッチに基づいて、前記オーディオ信号の所定区間を切り出し、その切り出した区間を前記ピッチ平滑手段により平滑化された平滑化ピッチ情報と前記目標ピッチ指定手段により指定された目標ピッチとに応じた周期で合成するものであることを特徴とする請求項1から3のいずれかに記載のピッチ変換装置。   The pitch converting means cuts out a predetermined section of the audio signal based on the pitch detected by the pitch detecting means, and smoothed pitch information smoothed by the pitch smoothing means and the target pitch. 4. The pitch conversion apparatus according to claim 1, wherein the pitch conversion apparatus is one that synthesizes at a period corresponding to the target pitch designated by the designation means. 前ピッチ変換手段は、波形記憶手段に記憶されたオーディオ信号を前記ピッチ平滑手段により平滑化された平滑化ピッチ情報と前記目標ピッチ指定手段により指定された目標ピッチとに応じた速さで読み出すものであることを特徴とする請求項1から3のいずれかに記載のピッチ変換装置。
The previous pitch conversion means reads the audio signal stored in the waveform storage means at a speed corresponding to the smoothed pitch information smoothed by the pitch smoothing means and the target pitch specified by the target pitch specifying means. The pitch converter according to any one of claims 1 to 3, wherein:
JP2004003197A 2004-01-08 2004-01-08 Pitch converter Expired - Fee Related JP4565846B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004003197A JP4565846B2 (en) 2004-01-08 2004-01-08 Pitch converter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004003197A JP4565846B2 (en) 2004-01-08 2004-01-08 Pitch converter

Publications (2)

Publication Number Publication Date
JP2005195968A true JP2005195968A (en) 2005-07-21
JP4565846B2 JP4565846B2 (en) 2010-10-20

Family

ID=34818178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004003197A Expired - Fee Related JP4565846B2 (en) 2004-01-08 2004-01-08 Pitch converter

Country Status (1)

Country Link
JP (1) JP4565846B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072231A (en) * 2005-09-08 2007-03-22 Roland Corp Pitch control program
JP2009010809A (en) * 2007-06-29 2009-01-15 Yamaha Corp Audio signal processor
JP2010055096A (en) * 2008-08-29 2010-03-11 Honda Motor Co Ltd System and method for variable text-to-speech with minimized distraction to operator of automotive vehicle
JP2011085731A (en) * 2009-10-15 2011-04-28 Yamaha Corp Musical signal processing device and program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05281996A (en) * 1992-03-31 1993-10-29 Sony Corp Pitch extracting device
JPH1078777A (en) * 1996-09-03 1998-03-24 Yamaha Corp Chorus effect imparting device
JPH10198379A (en) * 1996-12-30 1998-07-31 Roland Corp Wave-form generator
JP2001117578A (en) * 1999-10-21 2001-04-27 Yamaha Corp Device and method for adding harmony sound
JP2002091472A (en) * 2000-09-19 2002-03-27 Nippon Hoso Kyokai <Nhk> Rhythm display device, and reproducing device and similarity judging device for voice language and voice language processor and recording medium
JP2003036082A (en) * 1995-03-06 2003-02-07 Roland Corp Pitch converting apparatus

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05281996A (en) * 1992-03-31 1993-10-29 Sony Corp Pitch extracting device
JP2003036082A (en) * 1995-03-06 2003-02-07 Roland Corp Pitch converting apparatus
JPH1078777A (en) * 1996-09-03 1998-03-24 Yamaha Corp Chorus effect imparting device
JPH10198379A (en) * 1996-12-30 1998-07-31 Roland Corp Wave-form generator
JP2001117578A (en) * 1999-10-21 2001-04-27 Yamaha Corp Device and method for adding harmony sound
JP2002091472A (en) * 2000-09-19 2002-03-27 Nippon Hoso Kyokai <Nhk> Rhythm display device, and reproducing device and similarity judging device for voice language and voice language processor and recording medium

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007072231A (en) * 2005-09-08 2007-03-22 Roland Corp Pitch control program
JP4480650B2 (en) * 2005-09-08 2010-06-16 ローランド株式会社 Pitch control device and pitch control program
JP2009010809A (en) * 2007-06-29 2009-01-15 Yamaha Corp Audio signal processor
JP2010055096A (en) * 2008-08-29 2010-03-11 Honda Motor Co Ltd System and method for variable text-to-speech with minimized distraction to operator of automotive vehicle
JP2011085731A (en) * 2009-10-15 2011-04-28 Yamaha Corp Musical signal processing device and program

Also Published As

Publication number Publication date
JP4565846B2 (en) 2010-10-20

Similar Documents

Publication Publication Date Title
JP3985814B2 (en) Singing synthesis device
EP0750776B1 (en) Method and apparatus for changing the timbre and/or pitch of audio signals
JP3815347B2 (en) Singing synthesis method and apparatus, and recording medium
JP5605066B2 (en) Data generation apparatus and program for sound synthesis
JP4207902B2 (en) Speech synthesis apparatus and program
WO2018084305A1 (en) Voice synthesis method
JP4839891B2 (en) Singing composition device and singing composition program
EP1701336B1 (en) Sound processing apparatus and method, and program therefor
JP6024191B2 (en) Speech synthesis apparatus and speech synthesis method
JP2019061135A (en) Electronic musical instrument, musical sound generating method of electronic musical instrument, and program
JP6175812B2 (en) Musical sound information processing apparatus and program
JPH10319947A (en) Pitch extent controller
JP3966074B2 (en) Pitch conversion device, pitch conversion method and program
JP4844623B2 (en) CHORAL SYNTHESIS DEVICE, CHORAL SYNTHESIS METHOD, AND PROGRAM
JP4565846B2 (en) Pitch converter
JP4304934B2 (en) CHORAL SYNTHESIS DEVICE, CHORAL SYNTHESIS METHOD, AND PROGRAM
JP5106437B2 (en) Karaoke apparatus, control method therefor, and control program therefor
JP5102939B2 (en) Speech synthesis apparatus and speech synthesis program
JP2000010597A (en) Speech transforming device and method therefor
JP2007072231A (en) Pitch control program
JP2004061753A (en) Method and device for synthesizing singing voice
JP7544076B2 (en) Information processing device, electronic musical instrument, electronic musical instrument system, method, and program
JP6822075B2 (en) Speech synthesis method
JP3979213B2 (en) Singing synthesis device, singing synthesis method and singing synthesis program
JP5659501B2 (en) Electronic music apparatus and program

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20061109

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090929

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100803

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100803

R150 Certificate of patent or registration of utility model

Ref document number: 4565846

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130813

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees