JPS60129797A - Pitch controller - Google Patents

Pitch controller

Info

Publication number
JPS60129797A
JPS60129797A JP58238692A JP23869283A JPS60129797A JP S60129797 A JPS60129797 A JP S60129797A JP 58238692 A JP58238692 A JP 58238692A JP 23869283 A JP23869283 A JP 23869283A JP S60129797 A JPS60129797 A JP S60129797A
Authority
JP
Japan
Prior art keywords
signal
time
data
phase
multiplier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58238692A
Other languages
Japanese (ja)
Inventor
俊郎 寺内
田村 震一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP58238692A priority Critical patent/JPS60129797A/en
Publication of JPS60129797A publication Critical patent/JPS60129797A/en
Pending legal-status Critical Current

Links

Landscapes

  • Steering Control In Accordance With Driving Conditions (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Valve Device For Special Equipments (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、例えば音声信号においてその音程を)上意に
変えられるようにするピッチコントロール装置に関する
DETAILED DESCRIPTION OF THE INVENTION FIELD OF THE INVENTION The present invention relates to a pitch control device which makes it possible, for example, to change the pitch of an audio signal at will.

背景技術とその問題点 従来、時間軸で操作して信号のピンチを変えるには以下
のようにされている。例えば第1図Aに示すような信号
があった場合に、この音程を低下(ピッチダウン)させ
るには、下げる割合に応じて間欠に信号を取り出し、こ
の取り出された信号を第1図Bに示すようにそれぞれ時
間軸伸長し、これらをつなぎ合せて出力する。
BACKGROUND TECHNOLOGY AND PROBLEMS Conventionally, the following procedure has been used to change the pinch of a signal by operating on the time axis. For example, when there is a signal as shown in Figure 1A, in order to lower the pitch (pitch down), the signal is extracted intermittently according to the rate of decrease, and the extracted signal is shown in Figure 1B. As shown, the time axis is expanded, and these are connected and output.

しかしながらこのような装置の場合、信号のつなぎ目に
不連続点が生じ、これを例えばクロスフェードする等の
対策も行われたが、それでも不連続さを完全に解消する
ことはできず、聴感」ニの違和感があった。
However, in the case of such devices, discontinuities occur at the joints of signals, and although countermeasures have been taken, such as cross-fading, these discontinuities cannot be completely eliminated, and the audibility is affected. There was a feeling of discomfort.

また間欠で取り出されなかった部分の情報が失なわれて
おり、信号が不完全なものになっていた。
Additionally, the information that was not retrieved intermittently was lost, making the signal incomplete.

発明の目的 本発明はこのような点にかんがみ、簡単な構成で信号の
不連続や欠落のない、良好なピッチコントロール装置を
提案するものである。
OBJECTS OF THE INVENTION In view of these points, the present invention proposes an excellent pitch control device that has a simple configuration and is free from signal discontinuities and dropouts.

発明の概要 本発明は、人力された音声信号を任意の時間間隔ごとに
任意の時間長ずつ抽出する手段と、この抽出された各フ
レームごとにフーリエ変換して時間軸を周波数軸に変換
する手段と、この変換された信号の位相をrM整する手
段と、この位相調整された信号を逆フーリエ変換して周
波数軸を時間軸に逆変換する手段と、この逆変換された
信号を所望の時間間隔ごとに順次合成すると共にこの所
望の時間間隔が上記任意の時間間隔と等しくなるように
時間軸を伸縮し°ζ出力する手段とを有して成るピンチ
コントロール装置であって、これによれば簡単な構成で
信号の不連続や欠落のない、良好なピッチコントロール
を行うことができるものである。
Summary of the Invention The present invention provides means for extracting a human-generated audio signal at arbitrary time intervals and arbitrary lengths of time, and means for performing Fourier transform on each extracted frame to convert the time axis into the frequency axis. , means for adjusting the phase of this converted signal to rM, means for performing inverse Fourier transform on this phase-adjusted signal to inversely transform the frequency axis into the time axis, and converting this inversely transformed signal into a desired time A pinch control device comprising means for sequentially synthesizing each interval, expanding and contracting the time axis so that the desired time interval becomes equal to the arbitrary time interval, and outputting the desired time interval. With a simple configuration, it is possible to perform good pitch control without signal discontinuity or loss.

実施例 第2図において、入力端子(1)に供給された音声信号
がAD変換回路(2)に供給されてデジタル信号X(至
))とされ、バッファメモ1月3)に記憶される。この
メモリ(3)は例えば全体の長さがLとされ、入力が順
次シフトされて記憶される。このメモリ(3)の内容が
Rシフトされた時点(R<<L)ごとにメモ1月3)の
内容が並列にバッファメモリ(4)に取り出される。
Embodiment In FIG. 2, an audio signal supplied to an input terminal (1) is supplied to an AD conversion circuit (2), converted into a digital signal X(to)), and stored in a buffer memo (January 3). This memory (3) has, for example, a total length of L, and inputs are sequentially shifted and stored. Every time the contents of this memory (3) are shifted by R (R<<L), the contents of the memo (January 3) are taken out in parallel to the buffer memory (4).

これによってメモリ(4)からは、任意の時間間隔Rご
とに任意の時間長りずつ信号が抽出される。
As a result, signals are extracted from the memory (4) at arbitrary time intervals R and for arbitrary lengths of time.

ここでRはLに対し°C充分小さくされ°ζおり、各信
号は互いにオーバーランプされζいる。
Here, R is made sufficiently smaller than L by °C, and the signals are overlamped with each other.

このメモ1月4)からの信号が乗算器(5)に供給され
°C所定の窓係数ham>が掛られる。この窓係数の掛
られた信号がフーリエ変換回路(6)に供給される。
The signal from this memo January 4) is fed to a multiplier (5) and multiplied by a predetermined window factor ham>°C. The signal multiplied by this window coefficient is supplied to the Fourier transform circuit (6).

これによって信号の時間軸が周波数軸に変換される。This converts the time axis of the signal into the frequency axis.

この変換された信号が乗算器(7)に供給されて、メモ
1月3)でのシフト量Rに相当する位相の調整が行われ
る。この位相調整された信号が処理回路(8)に供給さ
れる。
This converted signal is supplied to the multiplier (7), and a phase adjustment corresponding to the shift amount R in Memo January 3) is performed. This phase-adjusted signal is supplied to a processing circuit (8).

この処理回路(8)におい°C、フーリエ変換にて周波
数軸に変換された信号が所定の周波数帯域ごとに各メモ
リ番地に収納される。この収納された信号が順次読み出
される。
In this processing circuit (8), the signals converted to the frequency axis by Fourier transformation are stored in each memory address for each predetermined frequency band. The stored signals are sequentially read out.

この処理回路(8)から睨み出された信号が乗算器(9
)に供給され“C1後述する出力時のシフト量R。
The signal output from this processing circuit (8) is sent to the multiplier (9
) is supplied to "C1" which is the shift amount R at the time of output, which will be described later.

に相当する位相のm整が行われる。この位相調整された
信号が逆フーリエ変換回路Qlに供給される。
m adjustment of the phase corresponding to is performed. This phase-adjusted signal is supplied to an inverse Fourier transform circuit Ql.

これによって信号の周波数軸が時間軸に変換される。This converts the frequency axis of the signal into the time axis.

この変換された信号が乗算器(11)に供給されζ、上
述の窓係数h(m)に対応した窓係数f (In)が掛
られる。この窓係数の掛られた信号がバッファメモリ 
(12)に記憶される。このメモリ (12)の内容が
並列にバッファメモリ (13)に供給される。
This converted signal is supplied to a multiplier (11), where it is multiplied by a window coefficient f (In) corresponding to the above-mentioned window coefficient h(m). The signal multiplied by this window coefficient is stored in the buffer memory.
(12). The contents of this memory (12) are supplied in parallel to the buffer memory (13).

このメモリ(13)は例えば全体の長さがLとされ、内
容が順次シフトされて出力される。またシフトによって
生じる空白部には0が記1.なされる。そし°ζこのメ
モリ (13)の内容がR゛ シフトされた時点ごとに
メモリ (12)の内容が供給され、それ以前の内容に
加算される。さらにメモリ (13)は、上述のメモ1
月4)での信号抽出時のクロック周波数R。
The entire length of this memory (13) is, for example, L, and the contents are sequentially shifted and output. In addition, 0 is written in the blank space created by the shift.1. It will be done. Then, °ζ Each time the contents of this memory (13) are shifted R゛, the contents of the memory (12) are supplied and added to the previous contents. Furthermore, the memory (13) is the memo 1 mentioned above.
Clock frequency R at the time of signal extraction on month 4).

に対しζ、□の周波数のクロックで駆動される。It is driven by a clock with a frequency of ζ and □.

これによっ゛ζメモリ (13)からは、時間間隔R。As a result, the time interval R is obtained from the ζ memory (13).

ごとに順次合成されると共に、この時間間隔R。This time interval R.

がR−に等しくなるように時間軸が伸縮された信号が出
力される。
A signal whose time axis is expanded or contracted so that R- becomes equal to R- is output.

このメモリ(13)からの信号がDA変換回路(14)
に供給されてアナログ信号とされ、出力端子(15)に
取り出される。
The signal from this memory (13) is sent to the DA conversion circuit (14)
The signal is supplied to the output terminal (15), converted into an analog signal, and taken out to the output terminal (15).

さらに、入力端子(11からの信号がバイパスフィルタ
(21)及びローパスフィルタ(22)に供給される。
Furthermore, the signal from the input terminal (11) is supplied to a bypass filter (21) and a low-pass filter (22).

これらの出力が比較回路(23)に供給されてそれぞれ
の帯域の信号のエネルギーが比較される。この比較出力
が窓係数h■)+f(Ill)の選択回路(24)に供
給されてそれぞれの場合に応じた窓係数が選択される。
These outputs are supplied to a comparison circuit (23) to compare the energies of the signals in each band. This comparison output is supplied to a window coefficient h■)+f(Ill) selection circuit (24), and a window coefficient corresponding to each case is selected.

この装置においζ、入力端子(11に第3図Aのような
信号が供給されると、この信号が時間間隔Rごとに時間
長りずつ抽出される。この抽出された信号がフーリエ変
換されて第3図Bに示すように時間軸が周波数軸に変換
されたスペクトラムが形成される。
In this device, when a signal as shown in FIG. 3A is supplied to the input terminal ζ (11), this signal is extracted for each time interval R. This extracted signal is Fourier transformed. As shown in FIG. 3B, a spectrum is formed in which the time axis is converted to the frequency axis.

この信号が処理回路(8)の各メモリ番地に収納され′
ζ位相調整される。この位相調整された信号が逆フーリ
エ変換され゛ζζ第4六A第5図Aにボすように順次時
間間隔Rずつシフトされた信号が形成される。これらの
信号が順次メモリ(12)を通じζメそり (13)に
供給され°ζ加算される。
This signal is stored in each memory address of the processing circuit (8).
ζ phase adjusted. This phase-adjusted signal is subjected to inverse Fourier transform to form signals sequentially shifted by time intervals R as shown in FIG. 5A. These signals are sequentially supplied to the ζ mesori (13) through the memory (12) and are added.

ここで例えば音程を低下(ピンチダウン)させる場合に
は、メモリ (13)のシフト用のクロックの周波数を
、信号抽出時のメモリ(4)の′クロックの周波数より
低くする。これに対し゛ζメモリ (12)からの信号
の供給は時間間隔Rごとに行う。
For example, if the pitch is to be lowered (pinch-down), the frequency of the shift clock of the memory (13) is set lower than the frequency of the 'clock of the memory (4) at the time of signal extraction. On the other hand, the signal is supplied from the ζ memory (12) at every time interval R.

Ro ずなわらクロックの周波数が□ (R’ <R)にされ
°Cいた場合に、時間間隔Rでのシフト量はRo RX −−= R”になっ°Cいる。そこでこのシフ1
− Ia R’ ごとに加算が行われると、この信号は
第4図Bに示すようになり、この信号は周波数帯域R’ は元のままだが時間が□に縮まっζいる。従ってこの信
号を二のクロックで取り出すことR’ により、第4図Cに示すように周波数帯域が□になり、
時間の変わらない信号が得られる。
If the frequency of the Ro Zunawara clock is set to □ (R'< R) and the shift amount in the time interval R becomes Ro RX --= R'', then this shift 1
- Ia When addition is performed for each R', this signal becomes as shown in FIG. 4B, and the frequency band R' of this signal remains the same, but the time is shortened to □. Therefore, by extracting this signal with the second clock R', the frequency band becomes □ as shown in Figure 4C,
A signal that does not change over time can be obtained.

例えばRo =□−とじた場合には、時間はそのままで
、周波数帯域が十になり、ピンチの1オクターブ下がっ
た信号となる。
For example, when Ro=□-, the time remains the same but the frequency band becomes 10, resulting in a signal that is one octave lower than the pinch.

また音程を上yr(ピッチアップ)させる場合も同様で
あって、ただR’ >Rとするだけである。
The same is true when raising the pitch (up yr), simply by setting R'>R.

これによって加算信号は第5図Bに示すように周R゛ 波数帯域は元のままで、時間が−に伸びた信R’ 号となる。そこでこの信号を□のクロックで取り出すこ
とにより、第5図Cに示すように周波R’ 数帯域が−になり、時間の変わらない信号が得られる。
As a result, the added signal becomes a signal R' with the frequency R' waveband remaining unchanged and the time extended to -, as shown in FIG. 5B. Therefore, by extracting this signal using the □ clock, the frequency R' number band becomes - as shown in FIG. 5C, and a signal that does not change in time can be obtained.

例えばR’=2Rとした場合には、時間はそのままで、
周波数帯域が2倍になり、ピンチの1オクターブ上がっ
た信号となる。
For example, if R'=2R, the time remains the same,
The frequency band is doubled, resulting in a signal that is one octave higher than the pinch.

なお第3し1〜第5図で波形はアナログで示したが、こ
れらは実際にはデジタル値で処理されζいる。
Although the waveforms in FIGS. 3-1 to 5 are shown in analog form, they are actually processed as digital values.

さらに」ニ述の装置において、窓係数h(匍、r(ト)
)は以下のような関係にされる。すなわち信号X(fn
)に対して x (m)h (SR−m ) X (Ill)但し、
Sは任怠の整数 となり、これをフーリエ変換して、 X2 (SR+ ω) −Σ h (SR−m) x<
to)a−”■g F+ −00 さらに、逆フーリエ変換して S−一■ これがx <m>に等しければよいからΣ r (m、
 rrt −3R) h (SR−m) ”1. Vm
S= −00 であればよい。
Furthermore, in the device described above, the window coefficient h(匍, r(t)
) are related as follows. That is, the signal X(fn
) for x (m) h (SR-m) X (Ill) However,
S becomes a lazy integer, and by Fourier transforming it, we get X2 (SR+ ω) −Σ h (SR−m) x<
to) a−”■g F+ −00 Furthermore, perform inverse Fourier transform to S−1■ Since it is sufficient that this is equal to x <m>, Σ r (m,
rrt -3R) h (SR-m) "1. Vm
It is sufficient if S=-00.

そして−上述のように入力信号のスペクトル形状を検出
し”C窓係数h(ト))+fQIl)を選17<シ’ζ
いる場合には、例えば低域成分の方が小さいときはha
n+P1 f +m)−0,5−0,5cos (2yr n/N
 −1)n=0、・・・N−] 低域成分の方が大きいときは ha+o=0.54−0.46 cos (2yr n
/N −1)n = Q、・・・N−1 fan+=2π/Σb j とすることにより音質を向上させることができる。
- As described above, detect the spectral shape of the input signal and select the "C window coefficient h (g) + fQIl)
For example, if the low frequency component is smaller, ha
n+P1 f +m)-0,5-0,5cos (2yr n/N
-1) n=0,...N-] When the low frequency component is larger, ha+o=0.54-0.46 cos (2yr n
/N −1) n = Q, . . . N−1 fan+=2π/Σb j The sound quality can be improved.

また上述の装置において、乗算器(9)での位相δIi
、1整は以下のようにされる。
Further, in the above-mentioned device, the phase δIi in the multiplier (9)
, 1 integral is done as follows.

まず時刻SRでのフーリエ変換後のスペクトラムを X (舖、ωk ) その実部を XR(SR,ωk) t、11. r!Bを Xl(SR,ωk) 位相の7主値を ・ P (S11.ωk) 但し、−π≦P (SR,ωk)くπ 及び時点Sに沿って連続化した位相を p (SR,ωk) 但し、−■<p(SR,ωk)くψ とする。このとき位相の連続化及び位相変形を次のよう
に行う。
First, the spectrum after Fourier transformation at time SR is X (or, ωk), and its real part is XR(SR, ωk) t, 11. r! B is Xl (SR, ωk) The 7 principal values of the phase are P (S11.ωk) However, -π≦P (SR, ωk) π and the phase continuous along time S is p (SR, ωk ) However, −■<p(SR, ωk) and ψ. At this time, phase continuity and phase transformation are performed as follows.

1)Shoの場合 (al 最初にフーリエ変換によって、X (SR,ω
k)をめる。
1) In the case of Sho (al First, by Fourier transform, X (SR, ω
k).

(bl 改にP (51?、ωk)をめる。(Add P (51?, ωk) to bl change.

ごこで XR(Sll、 ork) 、 Xl(SR,ωk)の
符号が(+、十)または(+、−)のときはP (SR
,ωk )、= tan−” (X ■ (31マ、 
ωk )/XR(SR,ωk)) 符号が(−、+)のときは P (Sll、 ωk) = tan−1(Xr (S
R+ ωk)/XR(SR,ωk)) 十π 符号が(−、−)のときは °− P (SR,ork) = tan−” (Xr (S
R+ (tok)/XR(SR,ωk))−π − である。
Here, when the sign of XR (Sll, ork) and Xl (SR, ωk) is (+, 10) or (+, -), P (SR
, ωk ), = tan-” (X ■ (31 ma,
ωk )/XR(SR, ωk)) When the sign is (-, +), P (Sll, ωk) = tan-1(Xr (S
R+ ωk)/XR(SR, ωk)) 1π When the sign is (-,-), °- P (SR, ork) = tan-” (Xr (S
R+(tok)/XR(SR,ωk))−π−.

(C1さらに IP(SR,ωk> −P((S−1) R,ωk) 
l<ε −但し、εば定数 であるか否かを判定する。
(C1 further IP(SR, ωk> −P((S-1) R, ωk)
l<ε - However, it is determined whether ε is a constant.

(dl そしてこれが止しいときは p (SR,ωk) =p((S−1)R,ωk) −
1−P (SR,ωk)−P((S−1) It、ωk
) とする。
(dl And if this stops, p (SR, ωk) = p((S-1)R, ωk) −
1-P (SR, ωk)-P((S-1) It, ωk
).

(d′)また(C1が止しくないときは、まず絶対値の
中の符号が(−)のときに p (SR,ωk)−p((S−1)R,ωk) IP
 (SR,ωk)−P((S−1) R,ωk)+2π 符号が(+)のときに 1) (SR,ωk)−p((S−1)R,ωk) I
P (SR,ωk)−P((S−1) R,ωk)−2
π とする。
(d') Also, (when C1 is not constant, first, when the sign of the absolute value is (-), p (SR, ωk) - p ((S-1)R, ωk) IP
(SR, ωk)-P((S-1) R, ωk)+2π 1 when the sign is (+)) (SR, ωk)-p((S-1)R, ωk) I
P (SR, ωk)-P((S-1) R, ωk)-2
Let it be π.

埋土によっ°(位相が連続化される。さらに十述の合成
時のシフ)Etの変史を行ゲζいる場合に、上ンニl−
ド及びデコードに於いて、ハンド間干渉を防(ため、シ
フト量の変史に応じて p (Sll、 ωk) −p (SR,ωk) −−
−とする。これによって位相の不連続によるノイズの発
生が防止される。
Due to buried soil (the phase is made continuous. Furthermore, the shift at the time of synthesis described above), when the history of Et is changed,
In code and decoding, interference between hands is prevented (in order to prevent interference between hands, p (Sll, ωk) −p (SR, ωk) −-
−. This prevents noise from occurring due to phase discontinuity.

こうしてピッチコントロールが行われるゎりであるが、
この装置によればフーリエ変換に゛ζ周波数軸に変換さ
れた信号を位相δI+、l整した後に合成するようにし
たので、極め°ζ高品質の信号が得られ、信すの不連続
や欠落等のない良好なピッチコント1コールが行われる
This is how pitch control is performed,
According to this device, the signals converted to the frequency axis by Fourier transform are synthesized after adjusting the phase δI +, l, so that extremely high quality signals can be obtained, and there are no discontinuities or omissions in the signal. A good pitch control 1 call with no etc. is made.

さらにRoを任怠に定めるごとにより、極めて高範囲に
わたってピンチを変えることができ、その間の音質劣化
も極めζ少ない。
Furthermore, by setting Ro arbitrarily, the pinch can be varied over an extremely wide range, and the deterioration in sound quality during that time is extremely small.

発明の効果 本発明によれば、簡単な構成で信号の不連続や欠落のな
い、良好なピッチ−1ントロールを行うことができるよ
うになった。
Effects of the Invention According to the present invention, it has become possible to perform good pitch-1 control without signal discontinuity or dropout with a simple configuration.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は従来の装置の説明のための図、第2しIは本発
明の一例の構成図、第3図〜第5し1はその説明のため
の図である。 (])は入力端子、(2)はAD変換回路、(3)、(
4)、(12)、(13)はへソファメモリ、(5)、
(7)、(9)、(11)は乗算器、(6)はフーリエ
変換回路、(8)は処理回路、α0)は逆フーリエ変換
回路、(14)は■〕Δ変換回1?3、(15)は出力
端子である。 1、串イ牛の表ボ 昭和58年 特 許 願 第238692号2、発明の
名称 ピッチコントI:1−ル13、ンdi ’+l−
を 4 る H “15件との関係 特許出願人 件 所 東京部品用区北品J1目r 丁Ll 7番35
υ−名称(21B)ソニー株式会社 代表取1名役 人 f)゛ 典 /、jl+4、代理人 (j、袖11−に31り増加する発明の数+11 特許
請求の範囲を別紙の通り訂正する。 (2)明細書中、第2頁20行〜第3頁10行[入力さ
れた・・・ピッチコントロール装置」とあるを次の通り
訂正する。 「入力された音声信号に任意の時間間隔ごとにその時間
間隔により制限される時間以上の長さ及び係数を有する
窓関数を掛けて抽出する手段と、この抽出された信号ご
とにフーリエ変換して時間軸を周波数軸に変換する手段
と、この変換された信号の位相を調整する手段と、この
位相調整された信号を逆フーリエ変換して周波数軸を時
間軸に逆変換する手段と、この逆変換された信号に上記
窓関数により規定される時間長及び係数を有する窓関数
を掛けて所望の時間間隔ごとに順次合成すると共に、こ
の所望の時間間隔が上記任意の時間間隔と等しくなるよ
うに時間軸を伸縮して出力する手段とを有して成るピッ
チコントロール装置」 (3)同、第3頁15行〜第4頁15行[第2図・・・
供給される。」とあるを次の通り訂正する。 [第2図において、あらかじめ、マイクロホン等により
電気的信号に変換され、遮断周波数3.2kHzの低域
通過フィルタを通された音声信号が入力端子11)に供
給される。この入力音声信号は、5.4kHz(周期的
158μs)の変換クロックにより駆動されている1語
12ビツトのAD変換器(2)により順次、このクロッ
クパルスの割合で1語12ビツトのデジタルデータに変
換される。AD変換器(2)は、6.4kHzのクロッ
クで駆動されている1語12ビツトより成る256a#
tのシフトレジスタ(3)に接続されており、駆動クロ
ックの1パルスがシフトレジスタ(3)に供給されるご
とに、シフトレジスタ(3)は、1語、第2図において
右(以下、1°左J、I右」という語を、第2図におい
て左、右という意味で用いることにする)にシフトされ
、AD変換器(2)の出力データが1語、シフトレジス
タ(3)の左より、シフトレジスタ(3)に入いる。 すなわちシフトレジスタ(3)には、AD変換器(2)
によって生成された、一連の256梧のデジタルデータ
がはいっており、AD変換器(2)が、デジタルデータ
を1語、生成するごとに、シフトレジスタ(3)は、1
梧、右にシフトされ、その内容が更新されて行く。 ここで、第2図における(4)以下の信号の具体的な流
れについて説明する前に、短時間フーリエ解析につい°
ζ、一般的な事柄を述べておく。 例えば、「あいうえお」という音声信号を考えてみると
、1あ」という音が発せられている時間と、「い」とい
う音が発せられている時間とでは、音声を発しているヒ
トの口や声道の形状がことなっている。すなわち「あい
うえお」という音声信号は、時間とともにその特性が変
化しζゆく物理的実体から発せられた信号であり、定常
信号とは見做せない。 このように、音声信号や音楽信号などは、それを発して
いる物理的実体の特性が、時間とともに変化しており、
一般に定常信号と見做すことはできず、定常信号を対象
にしたフーリエスペクトラム解析を直接に適用すること
は不可能である。しかしながら、先はどの例の1゛あい
うえお」について言うと、1゛あ」、「い」、「う」、
[え」。 1″お」の各々の音声を発している時間内では、ヒトの
口や声道の形状は、はぼ一定しており、その時間内に信
号を限定すれば、定常信号と見做せる。 そこで、フーリエ変換する領域を、定常と見做せる時間
の区間に限定し、フーリエ変換をおこない、その区間を
次々に更新してゆき得られるフーリエスペクトラムを用
いれば、非定常ではあるが、短時間の区間については定
常であるような、音声信号や音楽信号に対してフーリエ
解析が可能になる。 このようなフーリエ解析は、短時間フーリエ解析と呼ば
れている。 数式を用いてさらに説明しよう。入力信号x (tlを
、サンプリングに得られるデータ列を(xlml)(m
=(L 1+ 2+・・・・)としたとき、上述した事
柄は、定常とみなせるデータの部分列1 x (m+S
R) lm=0+L・・・・; 5=OA+−・・−(
R,Mはある整定数)の変数mについて、有限の部分列
(x(m+SR) ) m=0.1.・・・・、卜1の
端部がスペクトルに及ばず影響を減じる窓係数(h (
−rn) ) (m=0.1.・・・・、M−1)を乗
じた後、変数mについて離散的フーリエ変換をおこない
、短時間フーリエスペクトラムX (SR,k ) (
S=0,1.・・・−、M−1; k=0.1.2.・
・・・、?1−1)を得る、ということになる。 tr 第6図より明らかなように、Rは分析すると区間の更新
量であり、以下のような制約がある。 (A)式より W m + SR= fとおくと −(B) 窓係数(h (−m) ) (m=0.1.2.・・・
・、 M−1)の定義を、mについて−Q〜十ψまで拡
大して、とすると 2π すなわち、X(SR,k)は、第7図に示すように第1
番目の変数SRについて、データ列(h (m) )と
を、たたみ込んだデータ列、X(S、k)(S=0.1
.2.・・・・)をR−1データおきに再サンプリング
したものになつζおり、デジタル信号インパルスレスポ
ンス(h(m))を有する線形デジタルシステムに人力
した出力を、R−1データおきに再サンプリングしたも
のと解釈できる。 故に、分析する区間の更新量R’X 1は、サンプリン
グ定理が示すように、 の第1番目の変数mについての帯 域中〕 でなければならない。 (X (+n、k ) ) (m−0,1,2,・・=
)の帯域Illは、(m−(LL2+・・・・)に依存
するわけであるが、その上限は、図に於ける、インパル
スレスポンス(h (m) >を有する線形デジタルシ
ステムのローパス特性でおさえられるから、 のif番目の変数mについての帯 域中〕 ≧2 X ((h (m) ) (m=0.1,2.=
”)の帯域中) = CD > すなわちRは、 −(E) でなければならない。 一例として、M=256. (h (m) ) として
ハミング窓係数とすると窓係数h (m) =0.54
−0.46 cos(2πm/255) (m=0.1
.・・・・、 255 ’)を用いるとすると、(h 
(m) ) (m=o、1.2.・・−、255)のロ
ーパス部分の帯域中は、約42dBまで減衰するかって
、Rは、上式の関係から、 R≦□=64 でなければならない。 第2図において、(41、(51、+61 、 (71
で上述した、短時間フーリエ変換をおこなっている。M
 = 256、分析窓係数として、ハミング窓係数h(
m)−0,54−0,46Xcos (2πm/255
 ) (m=(LL2゜・・・・、 255 ) 、R
=64とし°ζいる。上述の例で明らかなように、R−
64は、(E)式を満たしている。 以下、具体的に述べる。 1i晶12ビツト、 2561吾より成るシフトレジス
タ(3)の内容は、AD変換器(2)の駆動クロックを
64分周したクロックの1パルス(すなわち、64X 
(AD変換(2)の駆動クロック周期、約158μ5e
c)(秒))ごとに同じく、1ii12ビツト、 25
6語より成るシフトレジスタ(4)にラッチされる。ラ
ッチされた256語のデータは、シフトレジスタ(4)
に供給される8MIIz(周期125 n 5ec)の
クロ7りのタイミングで、1語右へシフトされ、12ビ
ツトより成る2つの入力端子、および23ビツトより成
る1つの出力端子を有する乗算器(5)の一方の入力端
子へおくりこまれる。一方、この同じクロックのタイミ
ングで、乗算器(5)のもう一方の入力端子へ、あらか
じめROMに貯えである、ハミング窓係数h (m)−
0,54−0,46cos (2mm/255 ) (
m=0+1+・・・・、255)が、−語ずつ、m=0
.1.2.・・・・の順に、おくりこまれ、この2つの
入力の積が、乗算@ (51の出力として、入力データ
がセットされ°ζから100 n sec後に、乗算器
(5)の出力端子にセットされる。 この、乗算器(5)の23ビツトより成る出力結果は、
乗算器(5)に入力データを送りこむタイミングクロン
クのタイミングで(ずなわち、125 n secごと
に) F F T (Fast Fourier Tr
ansform) g換器(6)へ送りこまれる。FF
T変換器(6丹よ、こうして送りこまれる1語23ビツ
トのデータが256語になると、このli吾23ビット
、 256B吾のデータに対して、FFTをおこない実
部、虚部ともに16ビツトから成る、256語の複素デ
ータを生成する。 さて、FFT変換器(6)への、256倍の入力データ
を(y(m) ) (m=0.1.−・・、 255)
出力データを(Y (k) (k=o、1,2.・・・
・、255)とすると、FFTの定義より、 n 一方、この人力データ(y (m) ) (m=0+1
+・・・・、 255 )の短時間フーリエスペクトラ
ムは(A)式より、 −(G) したが−)7、(Y (k口(k=0.1,2.旧・、
 255)と(X (64s、k ) > (k=0.
1.2.旧・、 255 ) トは、 2π (k=0.1.2.・・・・、255>−(夏1) という関係がある。よって、FFT変# !!4+63
の出2π 入力データX(m)の短時間フーリエスペクトラムが得
られることになる。これを、乗算器(7)でおこなう。 すなわち、FFT変換器(6)で生成された、実部、虚
部ともに16ビツトから成る256語の複素データは、
周期125 n secのクロックのタイミングで、実
部、虚部ともに16ビツトより成る2つの複素データ入
力端子、および実、虚部ともに16ビツトより成る1つ
の出力端子を有する乗算器(7)の一方の入力端子へお
くりごまれる。一方、この同じクロックのタイミングで
、乗算器(7)のもう一方の入力端子へ、あらかじめ用
意されている、上述の係数、2π 2、・・・・、 255 )が−1吾ずつおくりこまれ
た、この2つの入力の積が、乗算器(7)の出力として
、人力データがセットされ“(から100 n sec
後に、乗算器(7)の出力端子にセントされる。この出
力結果は、乗算器(7)に入力データを送りこむクロッ
クのタイミングで1語ずつ、全部で256語がスペクト
ラム変形回路(8)へ送りこまれる。」 (4)同、ff14Ji(16行、第7頁1行、第14
頁14〜15行にそれぞれ「処理回路」とあるを[スペ
クトラム変形回路」と訂正する。 (5) 同、第4頁20行〜第6頁7行[この処理回路
・・・取り出される。」とあるを次の通り訂正する。 [スペクトラム変形回路(8)により変形された、■紐
が実部、虚ff1lともに16ビツトより成る256語
の複素データは、+91. alll、(11) 、(
12) 、(13) 。 (14)で時間領域の信号に変換される。 (9)〜(14)の流れを具体的に説明する前に、(9
)〜(14)に関しての、一般的な関係について述べて
おく。 先に述べたように、変形された短時間フーリエスペクト
ラムx (SR’ 、 l (S=0.1.2.・・・
・;k = 0.1,2.・・・・、 M−1)は、短
時間フーリエスペクトラムX (S、k) (S=0.
1.2.・・・・;に=O,l。 2、・・・・、M−1)を、第1番目の変数Sについて
、R’−1データおきに再サンプリングしたものである
。そこで、変形された短時間フーリエスペクトラム′ゾ
(SR’ 、 k) (S=O,1,2,・・・・1k
=0゜1.2.・・・・、卜1)から、時間領域の信号
を作成するには、X (SR’ 、 k) (S=0.
1.2.・・・・1k=0.1,2.・・・・、トl)
を補間して、X (S、k) (S−0,1,2,・・
・・i k−0,1,2,・・・・、 M−1)を作り
、X (S、k) (S=0.1,2.・・・・、 k
 = 0.1.2.・・・・。 M−1)を逆離散的フーリエ変換すれば良い、すなわら
、X (SR’ 、 k)の第1番目の変数に関して、
各々、隣りのデータの間に0をR′−1個つめたデータ
X(S、k) を作り、M(固のデータ(f (m) ) (m=0.
1.−・・、 Mfl )をインパルスレスポンスとし
て持つローパスフィルタに通して、X (S、k ’)
を作る6式X(ik)の定義より 鵬=−卯 この後、父(s、k)を第2番目の変数、kに関して、
逆離散的フーリエ変換して、出力信号(y(S))(S
−0,1,2,・・・・)を得る。これも式で書くと、
以下のようになる。 −(1) R’ −Rかつスペクトラムを操作しないときは、入力
信号がそのまま出力信号にならねばならない。 そのためには、上式より、 V (S) −x (S) ; ム f (S−輸R) ・ Σ h(+nR−44
) ・ x <i>lIπ−■ −≠−■ ところで、 であるから jl=s−pM (p :変数)とおく−(J) 故に、(h (m) )と(f (m) )とが、全て
のSについ°ζ、 I11+ −■ −(K) となることが必要である。さて、(1)式より、と書く
と、 −) (f (m) )はm = O+1+2+” ・
: + M−1でのみ0でないので f (S−*R’) ・x (d’ 、S)は、S=m
R’ 、 mR’ +l、・団、d’+M−1(m=S
−w+R’ + n=(M+旧・+ M−1)の部分だ
けが0でない、したがって、R′として、r−R′=M
(r:正の整定数)と、Mを割り切るように選ぶと、 (m−1)R’+M≦S≦mR’+M−1(m=0.1
,2.・・・・) と、有限回の加算で(y(S) ) (S=0.1.2
.・・・・)が逐次求まるt また、x (+mR,S)をめる際にFFTを使うには
、FFT変換されたデータと短時間フーリエスペクトラ
ムデータとの間に(11)式の関係がある2π j−R’kS ので、X (mR,k)に対してo M (k−0、l
、・・・・、 M−1i S−0,1,2,・・・・;
R′、整定数)を乗じたのちに、FFTを施せば良い。 第2図におい゛ζ具体的に述べる。なお以下の説明では
R’=64とする。 スペクトラム変形回路(8)により変形された、実部、
虚部ともに16ビツトより成る256語の短時間〜フー
リエスペクトラムX (64S、k) (k=0.1,
2゜・・・・、 255 )は、周期125 n se
eのクロックのタイミングで、k = 0.1,2.・
・・・の順に1語ずつ、実部、虚部ともに16ビツトよ
り成る2つの複素データ入力端子、および、実部、虚部
ともに16ビツトより成る1つの出力端子を有する乗算
器(旬へおくりこまれる。一方、その同じクロックのタ
イミングで、あらかじめ用意されている。上述の係数・
、255)かに=o、l、2.・−・(7)順に1語ず
つ、乗算器(9)のもう一方の入力端子に送り出され、
この2つの入力の積が、乗算器(9)の出方とじて、入
力データが乗算1i!19)にセットされてがら、10
0 n sec後に、乗算器(9)の出方端子にセット
される。この出力結果は、乗算器(9)に入力データを
送りこむクロックのタイミングで1語ずつ、計256語
が、逆FFT変換器Qlへ送りこまれる。 逆FFT変pA器a[有]は、こうして送りこまれる実
部、虚部ともに16ビツトより成るデータが256梧に
なると、このデータに対し、逆FFTをおこない、1語
16ビツトから成る256語の時間領域のデータを生成
する。この1語16ビツトから成る256語のデータは
、周期125 n secのクロックのタイミングで、
16ビツトより成る2つの人力端子、および16ビツト
より成る1つの出力端子を有する乗算器(11)の一方
の入力端子へおくりこまれる。 一方、この同じクロックのタイミングで、乗算器(11
)のもう一方の入力端子へ、あらかじめ、ROMに用意
され°ζいる、上述した関係式(K)2π 0.46cos (−g ) ) 、 m=0.L2.
・−・・+ 255 )55 がm=0.1,2.・・・・の順に1語ずつ、おくりこ
まれ、この2つの入力の積が、乗算器(11)の出力と
して、入力データがセットされてから100 n se
e後に、乗算器(11)の出力端子にセントされる。 この出力結果は、乗算器(11)に入力データを送りこ
むクロックのタイミングで1語ずフ、全部で256語、
シフトレジスタ(12)へ送りこまれる。 シフトレジスタ(12)は、1語16ビ、ント、 25
6語より成り、乗算器(11)の乗算結果を送出する。 周期125 n seeの間しクロックで駆動されてお
り、乗算器(11)から、乗算結果が1語おくりこまれ
るごとに、11吾、右ヘシフトされる。こうし°ζ、シ
フトレジスタ(12)に、 256語の、乗算器(11
)の乗算結果がはいると、シフトレジスタ(12)は、
シフト禁止の状態になりシフトレジスタ(12)の25
6it!;6<、la!16ヒツト、 256g8より
成るシフトレジスタ(13)の各々、対応する語ごとに
加算され、加算結果が、シフトレジスタ(13)の各々
の対応する語へ入れられる。 このシフトレジスタ(13)には、AD変換器(2)を
駆動している6、4kl!zのクロックが供給されてお
り、上述の加算が終rすると、こQ6.4kllzのク
ロック、lパルスごとにシフトレジスタ(13)が、1
語右ヘシフトされ、16ビツトAD変換器(14)に、
■データ送出される。他方、このシフトにより、シフト
レジスタ(13)には、左より、0の値を有するデータ
が1M入れられる。こうしてシフ1へレジスタ(13)
はシフトをR’=64回おこない、64出力データをD
A変換器におくりこむ。 16ビソトDA変換1(14)は、6.4kHzのりt
J7りのタイミングでおくられてくる1ixeビツトの
データを逐次、アナログ電圧値に変換し、出力端子(1
5)に出力する。」 (6) 同、第7頁2行1゛れ°C位相・・・信号が」
とあるを「れる。この信号が」と訂正する。 (7)同、同頁12行、末社、第8頁1行、2行、10
(8)同、第9頁9行「に対して」の後に[窓係数h 
(m)を掛けて、」を加入する。 (9)同、同頁12行(変換して、」の後に1゛スペク
トラムX2 (SR,ω)は、」を加入する。 叫 同、同頁15行 とあるを と訂正する。 (11)同、第10頁6〜13行「h(m)=1・・・
できる。」とあるを次の通り訂正する。 rh(m)=1 f (m) = 0.5−0.5 cos (2πm/
 (N l ) )m=0、・・・N−1 低域成分の方が大きいときは h (m) =0.54−0.46 cos (2πm
/ (N −1) )rn=0、・・・N−1 f (m)=R’ /Σh」 とすることにより音質を向上させることができる。 なお、h (m)=0ということは、乗算器(5)につ
いては何も行わないことに相当する。」(12)同、第
11頁5〜8行F位相の1値を、・・・・位相を」とあ
るを次の通り訂正する。 「とする、このとき位相の1値を P (SS1.ωk) とすると、P (SR,ωk)は 一π≦P (SR,ωk)くπ の値を°とり、位相の不連続となる部分が存在する。 そこでこの不連続を取り除いた位相を」(13)同、第
12頁10行[さらに」の後に1不連続なと訂正する。 (15)図面中、第5図を別紙の通り訂正する。 (16)図面中、第6図、第7図を別紙の通り追加する
。 以上 特許請求の範囲 入力された音声信号に任意の時間間隔ごとにその時間間
隔により制限される時間以上の長さ及び係数を有する窓
関数を掛けて抽出する手段と、この抽出された信号ごと
にフーリエ変換して時間軸を周波数軸に変換する手段と
、この変換された信号の位相を調整する手段と、この位
相調整された信号を逆フーリエ変換して周波数軸を時間
軸に逆変換する手段と、この逆変換された信号に上記窓
関数により規定される時間長及び係数を有する窓関数を
掛りで所望の時間間隔ごとに順次合成すると共にこの所
望の時間間隔が上記任意の時間間隔と等しくなるように
時間軸を伸縮して出力する手段とを有して成るピンチコ
ントロール装置。
FIG. 1 is a diagram for explaining a conventional device, FIG. 2-I is a configuration diagram of an example of the present invention, and FIGS. (]) is an input terminal, (2) is an AD conversion circuit, (3), (
4), (12), (13) are sofa memories, (5),
(7), (9), (11) are multipliers, (6) is a Fourier transform circuit, (8) is a processing circuit, α0) is an inverse Fourier transform circuit, (14) is ■] Δ transform times 1 to 3 , (15) are output terminals. 1. Skewered beef surface 1981 Patent Application No. 238692 2. Title of the invention Pitch control I: 1-13, di '+l-
4. Relationship with 15 Patent applicants Location: Kitashin J1, Tokyo Parts Store, 7-35
υ- Name (21B) 1 representative representative of Sony Corporation Person f)゛ Nori /, jl+4, agent (j, number of inventions increased by 31 to sleeve 11-+11 Amend the scope of claims as shown in the attached sheet) (2) In the specification, the phrase ``input pitch control device'' from page 2, line 20 to page 3, line 10 should be corrected as follows. means for multiplying and extracting each signal by a window function having a length and coefficient greater than the time limited by the time interval, and means for performing Fourier transform on each extracted signal to convert the time axis to the frequency axis; means for adjusting the phase of the converted signal; means for performing inverse Fourier transform on the phase-adjusted signal to inversely transform the frequency axis into the time axis; means for sequentially synthesizing each desired time interval by multiplying it by a window function having a time length and a coefficient, and expanding and contracting the time axis so that the desired time interval is equal to the arbitrary time interval and outputting the result. (3) Same, page 3, line 15 to page 4, line 15 [Figure 2...
Supplied. ” is corrected as follows. [In FIG. 2, an audio signal is supplied to the input terminal 11), which has been converted into an electrical signal by a microphone or the like and passed through a low-pass filter with a cut-off frequency of 3.2 kHz. This input audio signal is sequentially converted into digital data of 12 bits per word at the rate of this clock pulse by the AD converter (2) of 12 bits per word driven by a 5.4 kHz (periodic 158 μs) conversion clock. converted. The AD converter (2) is a 256a# consisting of 1 word of 12 bits driven by a 6.4kHz clock.
The shift register (3) is connected to the shift register (3) of t, and every time one pulse of the driving clock is supplied to the shift register (3), the shift register (3) outputs one word, right in FIG. The words "J left, I right" are used to mean left and right in Figure 2), and the output data of the AD converter (2) is shifted one word to the left of the shift register (3). Then, it enters the shift register (3). In other words, the shift register (3) has an AD converter (2)
The shift register (3) inputs a series of 256 words of digital data generated by the AD converter (2).
Go is shifted to the right and its contents are updated. Before explaining the specific flow of the signals below (4) in Figure 2, let us first explain the short-time Fourier analysis.
ζ Let me state some general matters. For example, if we consider the audio signal "Aiueo", the time when the sound "1a" is being emitted and the time when the sound "i" is being emitted differ depending on the mouth of the person making the sound. The shape of the vocal tract is different. In other words, the audio signal ``Aiueo'' is a signal emitted from a physical entity whose characteristics change over time, and cannot be regarded as a stationary signal. In this way, the characteristics of the physical entity that emits audio signals, music signals, etc. change over time.
In general, it cannot be regarded as a stationary signal, and it is impossible to directly apply Fourier spectrum analysis to stationary signals. However, in the example above, regarding 1゛aiueo'', 1゛a'', ``i'', ``u'',
[picture". The shapes of the human mouth and vocal tract remain fairly constant during the time each sound of 1"o" is uttered, and if the signal is limited to that time, it can be regarded as a steady signal. Therefore, if we limit the region to be Fourier transformed to a time interval that can be considered stationary, perform Fourier transform, and use the Fourier spectrum obtained by updating that interval one after another, it is possible to Fourier analysis becomes possible for audio signals and music signals that are stationary in the interval. Such Fourier analysis is called short-time Fourier analysis. Let's explain further using mathematical formulas. The input signal x (tl) is the data string obtained by sampling (xlml) (m
= (L 1+ 2+...), the above-mentioned matter is a subsequence of data 1 x (m+S
R) lm=0+L...; 5=OA+-...-(
For a variable m of (R, M are certain integer constants), a finite subsequence (x(m+SR)) m=0.1. ..., the window coefficient (h (
-rn) ) (m=0.1...,M-1), performs a discrete Fourier transform on the variable m, and obtains the short-time Fourier spectrum X (SR,k) (
S=0,1. ...-, M-1; k=0.1.2.・
...? 1-1). tr As is clear from FIG. 6, when analyzed, R is the update amount of the section, and has the following constraints. From equation (A), if W m + SR= f, -(B) Window coefficient (h (-m) ) (m=0.1.2...
・, M-1) is expanded to -Q~10ψ for m, then 2π In other words, X(SR,k) is the first
For the th variable SR, the data string (h (m) ) is convolved with the data string X (S, k) (S=0.1
.. 2. . It can be interpreted as Therefore, as shown by the sampling theorem, the update amount R'X 1 of the interval to be analyzed must be within the band for the first variable m. (X (+n,k)) (m-0,1,2,...=
The band Ill of ) depends on (m-(LL2+...), but its upper limit is the low-pass characteristic of a linear digital system with an impulse response (h (m) >) in the figure. Since it is suppressed, in the band for the if-th variable m of ] ≧2 X ((h (m) ) (m=0.1, 2.=
) = CD > In other words, R must be −(E). For example, if M=256. (h (m) ) is the Hamming window coefficient, the window coefficient h (m) = 0. 54
−0.46 cos(2πm/255) (m=0.1
.. ..., 255'), then (h
(m) ) (m=o, 1.2...-, 255) in the low-pass band is attenuated to about 42 dB, so from the relationship in the above equation, R must be R≦□=64. Must be. In Figure 2, (41, (51, +61, (71
The short-time Fourier transform described above is performed. M
= 256, Hamming window coefficient h(
m) -0,54-0,46Xcos (2πm/255
) (m=(LL2゜..., 255), R
= 64 and °ζ. As is clear from the above example, R-
64 satisfies formula (E). The details will be explained below. The contents of the shift register (3), which consists of a 12-bit, 2561-bit 1i crystal, is one pulse of the clock obtained by dividing the drive clock of the AD converter (2) by 64 (i.e., 64X
(Driving clock period of AD conversion (2), approximately 158μ5e
c) (seconds)) also 1ii12 bits, 25
It is latched into a shift register (4) consisting of six words. The latched 256 words of data are transferred to the shift register (4).
At the clock timing of 8 MIIz (period: 125 n 5 ec) supplied to the multiplier (5 ) is sent to one of the input terminals. On the other hand, at the timing of this same clock, the Hamming window coefficient h (m)-
0,54-0,46cos (2mm/255) (
m = 0 + 1 + ..., 255), each - word, m = 0
.. 1.2. ..., and the product of these two inputs is set to the output terminal of the multiplier (5) 100 n seconds after the input data is set as the output of the multiplier (51). The 23-bit output result of the multiplier (5) is
F F T (Fast Fourier Tr
ansform) is sent to the g converter (6). FF
T converter (6) When the data of 23 bits per word sent in this way becomes 256 words, perform FFT on this data of 23 bits and 256 bits, and both the real part and the imaginary part consist of 16 bits. , generates 256 words of complex data. Now, the 256 times the input data to the FFT converter (6) is (y(m)) (m=0.1.-..., 255)
Output data (Y (k) (k=o, 1, 2...
, 255), then from the definition of FFT, n On the other hand, this human data (y (m) ) (m=0+1
From equation (A), the short-time Fourier spectrum of
255) and (X (64s, k ) > (k=0.
1.2. Old..., 255) has the following relationship: 2π (k=0.1.2..., 255>-(Summer 1). Therefore, the FFT odd #!!4+63
2π The short-time Fourier spectrum of the input data X(m) is obtained. This is done by the multiplier (7). In other words, the 256 words of complex data generated by the FFT converter (6), consisting of 16 bits for both the real and imaginary parts, are as follows:
At the timing of a clock with a period of 125 n sec, one of the multipliers (7) has two complex data input terminals with both real and imaginary parts of 16 bits, and one output terminal with both real and imaginary parts of 16 bits. is sent to the input terminal of On the other hand, at the timing of this same clock, the above-mentioned coefficients, 2π 2, ..., 255) prepared in advance are sent to the other input terminal of the multiplier (7) by -1. In addition, the product of these two inputs is set as the output of the multiplier (7), and the human data is set as "(100 n sec from
Later, it is sent to the output terminal of the multiplier (7). This output result is sent word by word to the spectrum modification circuit (8), 256 words in total, at the timing of the clock that sends the input data to the multiplier (7). (4) Same, ff14Ji (line 16, page 7, line 1, 14th
In lines 14 and 15 of pages, the words "processing circuit" are corrected to "spectrum modification circuit." (5) Same, page 4, line 20 to page 6, line 7 [This processing circuit... is taken out. ” is corrected as follows. [256 words of complex data in which the string is transformed by the spectrum transformation circuit (8) and consists of 16 bits in both the real part and the imaginary ff1l are +91. all, (11), (
12), (13). The signal is converted into a time domain signal in (14). Before specifically explaining the flow of (9) to (14), (9)
) to (14), the general relationships will be described below. As mentioned earlier, the transformed short-time Fourier spectrum x (SR', l (S=0.1.2...
・;k=0.1,2. ..., M-1) is the short-time Fourier spectrum X (S, k) (S=0.
1.2. ...; ni = O, l. 2, . . . , M-1) is resampled for the first variable S every R'-1 data. Therefore, the transformed short-time Fourier spectrum 'zo(SR', k) (S=O, 1, 2,...1k
=0°1.2. ..., 卜1), to create a time domain signal, X (SR', k) (S=0.
1.2. ...1k=0.1,2. ..., Tol)
By interpolating X (S, k) (S-0, 1, 2,...
...i k-0,1,2,..., M-1), and create X (S, k) (S=0.1,2..., k
= 0.1.2. .... M-1) can be subjected to inverse discrete Fourier transform, that is, regarding the first variable of X (SR', k),
For each, data X(S,k) is created by inserting R'-1 0s between adjacent data, and M(hard data(f(m))(m=0.
1. −..., Mfl) as the impulse response, and then
6 From the definition of the formula
Perform inverse discrete Fourier transform to obtain output signal (y(S))(S
-0, 1, 2,...) is obtained. If we also write this as a formula,
It will look like this: -(1) R' -R and when the spectrum is not manipulated, the input signal must become the output signal as it is. For that purpose, from the above formula, V (S) −x (S);
) ・ x <i>lIπ−■ −≠−■ By the way, since , let jl=s−pM (p: variable) −(J) Therefore, (h (m) ) and (f (m) ) It is necessary that for all S, °ζ, I11+ −■ −(K). Now, from equation (1), if we write -) (f (m) ) is m = O+1+2+" ・
: + Since it is not 0 only at M-1, f (S-*R') ・x (d', S) is S=m
R', mR' +l, group, d'+M-1 (m=S
Only the part −w+R' + n=(M+old・+M-1) is not 0, so as R', r-R'=M
(r: positive integer constant) and M are chosen to divide evenly, (m-1)R'+M≦S≦mR'+M-1 (m=0.1
,2. ), and (y(S) ) (S=0.1.2
.. ...) is found one after another.In addition, in order to use FFT when calculating x (+mR,S), the relationship of equation (11) is established between the FFT-transformed data and the short-time Fourier spectrum data. Since some 2π j−R'kS, o M (k−0, l
,..., M-1i S-0,1,2,...;
R', an integer constant) and then perform FFT. This will be explained in detail in Figure 2. Note that in the following description, R'=64. The real part, transformed by the spectrum transformation circuit (8),
256-word short-time to Fourier spectrum X (64S, k) (k=0.1,
2゜..., 255) has a period of 125 n se
At the clock timing of e, k = 0.1, 2.・
A multiplier with two complex data input terminals each consisting of 16 bits for both the real and imaginary parts, and one output terminal consisting of 16 bits for both the real and imaginary parts. On the other hand, the coefficients and coefficients mentioned above are prepared in advance at the same clock timing.
, 255) Crab = o, l, 2. ...(7) Sequentially, one word at a time, is sent to the other input terminal of the multiplier (9),
The product of these two inputs is the output of the multiplier (9), and the input data is multiplied by 1i! 19), but 10
After 0 n sec, it is set to the output terminal of the multiplier (9). This output result is sent one word at a time, a total of 256 words, to the inverse FFT converter Ql at the timing of the clock that sends the input data to the multiplier (9). The inverse FFT transformer pA (with it) performs an inverse FFT on this data when the data sent in this way, consisting of 16 bits for both the real and imaginary parts, reaches 256, and converts the data into 256 words, each word consisting of 16 bits. Generate time domain data. These 256 words of data, each word consisting of 16 bits, are generated at a clock timing of 125 nsec.
It is fed into one input terminal of a multiplier (11) having two input terminals of 16 bits and one output terminal of 16 bits. On the other hand, at the timing of this same clock, the multiplier (11
), the above-mentioned relational expression (K)2π 0.46cos (-g) ), m=0. L2.
・−・・+255 )55 is m=0.1, 2. The product of these two inputs is inputted one word at a time in the order of .
After e, it is sent to the output terminal of the multiplier (11). This output result is 256 words in total, every single word is generated at the timing of the clock that sends the input data to the multiplier (11).
It is sent to the shift register (12). The shift register (12) has 16 bits per word, 25
It consists of 6 words and sends the multiplication result of the multiplier (11). It is driven by an intermittent clock with a period of 125 n see, and is shifted to the right by 11 times each time the multiplication result is transferred from the multiplier (11) by one word. In this way, the shift register (12) has a 256-word multiplier (11
), the shift register (12) becomes
25 of shift register (12) becomes shift prohibited state.
6it! ;6<, la! Each of the shift registers (13) consisting of 16 hits and 256g8 are added for each corresponding word, and the addition result is put into the corresponding word of each of the shift registers (13). This shift register (13) has 6.4kl! which drives the AD converter (2)! A clock of z is supplied, and when the above addition is completed, the shift register (13) performs 1 every l pulse of this clock of 4kllz.
The word is shifted to the right and sent to the 16-bit AD converter (14).
■Data is sent. On the other hand, due to this shift, 1M data having a value of 0 is input into the shift register (13) from the left. Thus register (13) to shift 1
performs the shift R' = 64 times and converts the 64 output data to D
Transfer to A converter. 16 bits DA conversion 1 (14) is 6.4kHz
The 1ixe bit data sent at the timing of J7 is sequentially converted into an analog voltage value, and the output terminal (1
5) Output. (6) Same, page 7, line 2, 1 ゛°C phase...signal.''
Correct the statement to read, ``This signal is.'' (7) Same page, line 12, Suesha, page 8, lines 1, 2, 10
(8) Same, page 9, line 9, after “for” [window coefficient h
Multiply by (m) and add ". (9) Same page, line 12 (after converting, add 1゛spectrum Same, page 10, lines 6-13 “h(m)=1...
can. ” is corrected as follows. rh (m) = 1 f (m) = 0.5-0.5 cos (2πm/
(N l )) m=0,...N-1 When the low frequency component is larger, h (m) =0.54-0.46 cos (2πm
/(N-1))rn=0,...N-1 f(m)=R'/Σh'', the sound quality can be improved. Note that h (m)=0 corresponds to doing nothing with the multiplier (5). "(12) Same, page 11, lines 5-8, 1 value of F phase, . . . phase" should be corrected as follows. ``In this case, if one value of the phase is P (SS1.ωk), P (SR, ωk) takes a value of 1 ≤ P (SR, ωk) > π, and the phase becomes discontinuous. Therefore, the phase after removing this discontinuity is corrected to be one discontinuity after "(13), page 12, line 10 [further"]. (15) In the drawings, Figure 5 will be corrected as shown in the attached sheet. (16) Figures 6 and 7 will be added to the drawings as shown in the attached sheet. What is claimed is: a means for multiplying and extracting an input audio signal for each arbitrary time interval by a window function having a length and a coefficient longer than the time limited by the time interval, and for each extracted signal. means for converting the time axis into the frequency axis by Fourier transform; means for adjusting the phase of this converted signal; and means for inversely converting the frequency axis into the time axis by performing inverse Fourier transform on the phase-adjusted signal. Then, this inversely transformed signal is multiplied by a window function having a time length and a coefficient defined by the above window function to sequentially synthesize each desired time interval, and this desired time interval is equal to the above arbitrary time interval. A pinch control device comprising a means for expanding and contracting a time axis and outputting the same.

Claims (1)

【特許請求の範囲】[Claims] 入力された音声信号を任意の時間間隔ごとに任意の時間
長ずつ抽出する手段と、この抽出された各フレームごと
にフーリエ変換して時間軸を周波数軸に変換する手段と
、この変換された信号の位相を調整する手段と、この位
相m整された信号を逆フーリエ変換して周波数軸を時間
軸に逆変換する手段と、この逆変換された信号を所望の
時間間隔ごとに順次合成すると共にこの所望の時間間隔
が上記任意の時間間隔と等しくなるように時間軸を伸縮
して出力する手段とを有して成るピッチコントロール装
置6′、。
A means for extracting an input audio signal at an arbitrary time interval and an arbitrary length of time, a means for Fourier transforming each extracted frame to convert the time axis into a frequency axis, and the converted signal means for adjusting the phase of the signal, means for performing inverse Fourier transform on the phase-adjusted signal to inversely transform the frequency axis into the time axis, and sequentially synthesizing the inversely transformed signals at each desired time interval. a pitch control device 6' comprising means for expanding and contracting the time axis so that the desired time interval is equal to the arbitrary time interval and outputting the result;
JP58238692A 1983-12-16 1983-12-16 Pitch controller Pending JPS60129797A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58238692A JPS60129797A (en) 1983-12-16 1983-12-16 Pitch controller

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58238692A JPS60129797A (en) 1983-12-16 1983-12-16 Pitch controller

Publications (1)

Publication Number Publication Date
JPS60129797A true JPS60129797A (en) 1985-07-11

Family

ID=17033874

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58238692A Pending JPS60129797A (en) 1983-12-16 1983-12-16 Pitch controller

Country Status (1)

Country Link
JP (1) JPS60129797A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5862232A (en) * 1995-12-28 1999-01-19 Victor Company Of Japan, Ltd. Sound pitch converting apparatus

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5862232A (en) * 1995-12-28 1999-01-19 Victor Company Of Japan, Ltd. Sound pitch converting apparatus

Similar Documents

Publication Publication Date Title
Laroche Time and pitch scale modification of audio signals
Yegnanarayana et al. Significance of group delay functions in signal reconstruction from spectral magnitude or phase
US5832437A (en) Continuous and discontinuous sine wave synthesis of speech signals from harmonic data of different pitch periods
US8706496B2 (en) Audio signal transforming by utilizing a computational cost function
US5495432A (en) Apparatus and method for sampling rate conversion
CN108269579B (en) Voice data processing method and device, electronic equipment and readable storage medium
Välimäki et al. Creating endless sounds
CN111798831A (en) Sound particle synthesis method and device
JP5104553B2 (en) Impulse response processing device, reverberation imparting device and program
JPS6363915B2 (en)
JP5651945B2 (en) Sound processor
JPS60129797A (en) Pitch controller
WO2002058053A1 (en) Encoding method and decoding method for digital voice data
JPH0681051B2 (en) Digital-analog conversion method
JPS60140298A (en) Speech controller
JPS60127823A (en) Band compressing and expanding device
JPS60130908A (en) Graphic equalizer
JPS60140942A (en) Signal transmitter
JPS60140933A (en) Band compression and expanding circuit
JP3479999B2 (en) Waveform data generator
Anand Digital Signal Processing: An Introduction
JP2784399B2 (en) Tone generator
JP2004518164A (en) Parametric encoder and method for encoding audio or speech signals
JP3018745B2 (en) Music processing unit
Evangelista Real-time time-varying frequency warping via short-time Laguerre transform