JPH0465398B2 - - Google Patents

Info

Publication number
JPH0465398B2
JPH0465398B2 JP60298296A JP29829685A JPH0465398B2 JP H0465398 B2 JPH0465398 B2 JP H0465398B2 JP 60298296 A JP60298296 A JP 60298296A JP 29829685 A JP29829685 A JP 29829685A JP H0465398 B2 JPH0465398 B2 JP H0465398B2
Authority
JP
Japan
Prior art keywords
signal
change
audio
changes
playback speed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60298296A
Other languages
Japanese (ja)
Other versions
JPS62159196A (en
Inventor
Keiji Hiramatsu
Chisato Yoshida
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KYODO DENSHI SHISUTEMU KK
Original Assignee
KYODO DENSHI SHISUTEMU KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KYODO DENSHI SHISUTEMU KK filed Critical KYODO DENSHI SHISUTEMU KK
Priority to JP60298296A priority Critical patent/JPS62159196A/en
Publication of JPS62159196A publication Critical patent/JPS62159196A/en
Publication of JPH0465398B2 publication Critical patent/JPH0465398B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の属する技術分野〕 本発明は、録音された音声の再生速度をq倍に
早め(時間軸の長さは1/qに圧縮)または1/
qに遅く(時間軸の長さはq倍に伸長)した際
に、q倍または1/q倍になる波形の瞬間値の変
化(その結果、生じる音声スペクトルの拡りも、
もとのスペクトルのq倍または1/q倍になる)
を解析音声信号の位相項から導かれる瞬時周波数
信号情報の1/q倍またはq倍にすることによ
り、聴感上の個人性、自然性情報を損なうことな
く再生速度を変え得る時間軸圧縮伸長装置に関す
る。
[Detailed description of the invention] [Technical field to which the invention pertains] The present invention speeds up the playback speed of recorded audio by q times (the length of the time axis is compressed to 1/q) or
When slowing down to q (the length of the time axis is expanded by q times), the instantaneous value of the waveform changes by q times or 1/q times (as a result, the resulting broadening of the audio spectrum is also
(becomes q times or 1/q times the original spectrum)
A time axis compression/expansion device that can change the playback speed without impairing auditory individuality and naturalness information by multiplying the instantaneous frequency signal information derived from the phase term of the analyzed audio signal by 1/q or q times. Regarding.

〔従来技術とその問題点〕 一般に、録音された音声を再生する再生装置の
再生速度を速めた場合、録音音声全体の再生は速
く終了する。また、音声時間波形の振幅の包絡線
信号も変化が遅くなつてしまう。さらに、音声時
間信号の波形の瞬時値の変化、すなわち時間に対
する周波数の変化も速くなる。この音声時間信号
の振幅包絡線信号は言語判断に冗長な情報である
ために、聴覚上言語判断への悪影響は少ない。し
かし、音声時間信号の波形の瞬間値の変化が早く
なると、聴覚上、音程が高くなり、声の質が変化
し、話者の個人性も失なわれる。反対に、再生速
度を遅めた場合にも、波形の瞬時値の変化が原因
となり、同様に音声の質的変化が生じる。
[Prior art and its problems] Generally, when the playback speed of a playback device that plays back recorded sound is increased, the playback of the entire recorded sound ends quickly. Furthermore, the amplitude envelope signal of the audio time waveform also changes slowly. Furthermore, the change in the instantaneous value of the waveform of the audio time signal, that is, the change in frequency with respect to time, becomes faster. Since the amplitude envelope signal of the speech time signal is redundant information for language judgment, it has little adverse effect on language judgment from an auditory perspective. However, if the instantaneous value of the waveform of the audio time signal changes quickly, the pitch will become higher audibly, the quality of the voice will change, and the individuality of the speaker will be lost. Conversely, when the playback speed is slowed down, a change in the instantaneous value of the waveform causes a similar change in the quality of the audio.

第5図はこれを説明したものである。すなわ
ち、図A原信号S(t)に対して、時間軸を圧縮
して再生された実時間信号(時間軸圧縮信号)の
基本的波形図を図Bに示す。これらは振幅包絡線
信号α(t),α1(t)と零交互波FM(t)(すな
わち、波形の位相変化分)とから構成される。こ
の振幅包絡線信号α(t)は、原信号s(t)の波
形周波数成分に対して、比較的ゆつくりした変化
である。換言すれば、それぞれの周波数成分が別
の帯域に集中していると近似することができるか
ら、原信号s(t)を次式(1)で近似することがで
きる。
FIG. 5 explains this. That is, FIG. B shows a basic waveform diagram of a real-time signal (time-axis compressed signal) reproduced by compressing the time axis with respect to the original signal S(t) in FIG. A. These are composed of amplitude envelope signals α(t), α 1 (t) and an alternating zero wave FM(t) (that is, a phase change of the waveform). This amplitude envelope signal α(t) changes relatively slowly with respect to the waveform frequency component of the original signal s(t). In other words, since it can be approximated that each frequency component is concentrated in a different band, the original signal s(t) can be approximated by the following equation (1).

S(t)=α(t)・FM(t) ……(1) このように、定性的に考えることにより、零交
互波FM(t)は振幅が一定で、位相のみ変化す
る信号、すなわち位相変調波あるいはFM波とみ
なすことができる。このように考えると、q倍の
再生速度の条件に伴なう再生波形の瞬時値の変化
は、位相変化がq倍に変化したものである。従つ
て、この位相変化分のみを1/q倍にすれば、原
波形の瞬時値の変化に、戻ることになる。これを
第5図Cに示す。
S(t)=α(t)・FM(t)...(1) In this way, by considering qualitatively, the zero alternating wave FM(t) is a signal whose amplitude is constant and only the phase changes, i.e. It can be regarded as a phase modulated wave or FM wave. Considering this, the change in the instantaneous value of the reproduced waveform due to the condition of q times the reproduction speed is a change in the phase change by q times. Therefore, if only this phase change is multiplied by 1/q, it returns to the change in the instantaneous value of the original waveform. This is shown in FIG. 5C.

以上に説明するように、例えば再生テープをq
倍に早廻しするとき、再生された信号の波形が時
間的に1/q倍の長さになる。このために、瞬時
の位相変化がq倍の変化、すなわち瞬時周波数も
q倍の早さで変化することになる。従つて、上述
のように位相あるいは周波数レベルで、原信号の
それに戻るように操作ができれば、早廻しした早
口言葉でも、音声のもとの性質を保持したまま
で、波形を校正することが可能である。
As explained above, for example, if a playback tape is
When the speed is doubled, the waveform of the reproduced signal becomes 1/q times as long in time. For this reason, the instantaneous phase change changes q times faster, that is, the instantaneous frequency also changes q times faster. Therefore, as mentioned above, if the phase or frequency level can be manipulated to return to that of the original signal, it is possible to calibrate the waveform while retaining the original characteristics of the speech, even in the case of rapid tongue twisters. It is.

上述の方法を、音声あるいはその他の準定常的
時間信号に対して実現するには、解析信号を利用
すれば可能である。解析信号とは、音声実時間信
号S(t)と、この時間信号S(t)をヒルベルト
変換した信号、すなわち各周波数成分を90度移相
した信号s^(t)により次式(2)で定義される信号
Sa(t)として周知である。
The above method can be implemented for speech or other quasi-stationary time signals by using analytic signals. The analytic signal is a real-time audio signal S(t) and a Hilbert-transformed signal of this time signal S(t), that is, a signal s^(t) in which each frequency component is phase-shifted by 90 degrees, as expressed by the following equation (2). signal defined by
It is known as Sa(t).

Sa(t)=S(t)+jS^(t) ……(2) ここに、jは虚数単位である。この第(2)式は次
式(3)のように複素指数関数で表わすことができ
る。
Sa(t)=S(t)+jS^(t)...(2) Here, j is an imaginary unit. This equation (2) can be expressed as a complex exponential function as shown in the following equation (3).

Sa(t)=α(t)exp〔jφ(t)〕=α(t){Cos
〔φ(t)〕+jsin〔φ(t)〕}……(3) ただし、 α(t)=√S2(t)+S^2(t) ……(4) φ(t)=tan-1S^2(t)/S(t) ……(5) 従つて、第(4)式は解析音声信号の包絡線情報及
び、第(5)式は解析音声信号の位相情報である。
Sa(t)=α(t)exp[jφ(t)]=α(t){Cos
[φ(t)]+jsin[φ(t)]}...(3) However, α(t)=√S 2 (t)+S^ 2 (t)...(4) φ(t)=tan - 1 S^ 2 (t)/S(t) (5) Therefore, the equation (4) is the envelope information of the analyzed audio signal, and the equation (5) is the phase information of the analyzed audio signal.

音声の実時間信号は、第(3)式よりα(t)Cos
〔φ(t)〕に相当する。
From equation (3), the real-time audio signal is α(t)Cos
Corresponds to [φ(t)].

このことから、音声実時間信号の情報は、解析
音声信号の包絡線情報α(t)および位相情報φ
(t)にすべて含まれることが分る。
From this, the information of the audio real-time signal is the envelope information α(t) and the phase information φ of the analyzed audio signal.
It can be seen that all are included in (t).

このような解析信号法を利用した提案が既に公
表されている。例えばその提案のうちの1つ(提
案1)は、Proceeding of the IEEE,Vol 55,
No.3,March,1967,p396−401のM.R.
Schroeder,J.L.Flamagan,senior member,
IEEE,and E.A.Lundryによる“Bandwidth
Compression of Speech by Analytic−Signal
Rooting”である。この提案1には、解析信号法
およびヒルベルト変換を用いて、特に1/2倍の再
生速度の校正に限る処理系が開示されている。他
の提案(提案2)は、NHK技術研究、昭46、第
23巻、第6号、通巻第127号、P461−471、戸塚
良則氏による「解析信号法を用いた音声の継続時
間の圧縮伸長」である。この提案には、提案1を
利用して1/2倍の外に、2倍の再生速度の校正に
限る処理系が開示されている。また、位相変化φ
(t)を1/q倍することにより、q倍の再生速
度変代に対する校正操作の可能ということのみが
言及されている。従つて、提案1は提案2に含ま
れるから、提案2について説明すれば、1/2倍お
よび2倍の校正操作において、位相変化φ(t)
が1/2φ(t)、2φ(t)となることから、音声信
号のFM波部分であるFM(t)がCos〔1/2φ
(t)〕、Cos〔2φ(t)〕となることに主として着眼
し、余弦関数の半角、倍角の公式に対応する装置
構成を提案している。またq倍の校正操作も同様
に位相変化φ(t)を対象として開示している。
しかしながら、校正操作を位相変化φ(t)を対
象として考慮するなどの理由により、実現化には
次のような問題があつた。
Proposals using such analytical signal methods have already been published. For example, one of the proposals (proposal 1) is Proceeding of the IEEE, Vol 55,
No.3, March, 1967, p396-401 MR
Schroeder, JLFlamagan, senior member,
“Bandwidth” by IEEE, and EALundry
Compression of Speech by Analytic−Signal
Proposal 1 discloses a processing system that uses the analytic signal method and Hilbert transform, and is limited to calibration especially for 1/2 playback speed.The other proposal (Proposal 2) is NHK Technical Research, 1972, No.
Volume 23, No. 6, Volume 127, P461-471, ``Compression and expansion of speech duration using analytic signal method'' by Yoshinori Totsuka. This proposal discloses a processing system that uses Proposal 1 to calibrate not only 1/2 speed but also double playback speed. Also, the phase change φ
It is only mentioned that by multiplying (t) by 1/q, it is possible to perform a calibration operation for changing the playback speed by a factor of q. Therefore, since Proposal 1 is included in Proposal 2, explaining Proposal 2, in the 1/2 and 2 times calibration operations, the phase change φ(t)
are 1/2φ(t) and 2φ(t), so FM(t), which is the FM wave part of the audio signal, is Cos[1/2φ
(t)], Cos[2φ(t)], and proposes an apparatus configuration that corresponds to the half-angle and double-angle formulas of the cosine function. Furthermore, a q-fold calibration operation is similarly disclosed for the phase change φ(t).
However, due to reasons such as considering the phase change φ(t) in the calibration operation, the following problems arose in realization.

(a) 位相変化を処理するため符号が不定である。
従つて、スイツチヤと称する符号判別処理を施
す必要が生じる。
(a) The sign is indeterminate because phase changes are processed.
Therefore, it becomes necessary to perform code discrimination processing called a switcher.

(b) ヒルベルト変換と1組の伝達関数で求めてい
る。従つて、遅延処理による調整操作が必要で
ある。
(b) Obtained using Hilbert transform and a set of transfer functions. Therefore, an adjustment operation using delay processing is necessary.

(c) 1/2倍および2倍の校正操作のみが実現され、
一般的なq倍の校正操作の実現が困難である。
(c) Only 1/2x and 2x calibration operations are realized;
It is difficult to implement a general q-fold calibration operation.

〔発明の目的〕[Purpose of the invention]

本発明は、上述の点に鑑み、従来技術の問題点
を有効に解決し、任意の再生速度変化に対して何
らの差異なく対応可能な時間軸圧縮伸長装置を提
供することを目的とする。
In view of the above-mentioned points, it is an object of the present invention to provide a time axis compression/expansion device that effectively solves the problems of the prior art and can cope with any change in playback speed without any difference.

〔発明の要点〕[Key points of the invention]

このような目的を達成するために、本発明の発
明者達は、数多くの研究と実験とを繰返した結
果、例えばq倍に伸長する再生速度変化に伴う音
程変化の校正操作と、解析信号理論より瞬時周波
数信号S(t)が位相情報の時間的変化であるか
ら、第(5)式より第(6)式を導く。
In order to achieve such an objective, the inventors of the present invention have repeatedly conducted numerous studies and experiments, and as a result, have developed a method for calibrating the pitch change associated with a change in playback speed, e.g. Since the instantaneous frequency signal S(t) is a temporal change in phase information, equation (6) is derived from equation (5).

fs(t)=1/2π・dφ(t)/dt=1/2
π(dS^(t)/dtS(t)−s^(t)dS(t)/dt)
/(s2(t)+s^2(t))
……(6) この第(6)式に着目すれば、再生速度をq倍にし
た音声信号に対して、この瞬時周波数信号S
(t)を、再生音声信号とその再生音声信号をヒ
ルベルト変換処理した両者より求め、さらに信号
処理して1/q倍の瞬時周波数信号情報を得、解
析信号の式(6)から原実時間音声信号の瞬時周波数
信号情報に戻す。包絡線情報はq倍の再生速度変
化のままで合成し、原音声(録音時の音声)のq
倍の早口の音声として、しかも個人性、音韻性を
損うことなく再生できるとの結論に到達し、コン
ピユータ・シミユレーシヨンによつても正確にこ
れを確認した。
fs(t)=1/2π・dφ(t)/dt=1/2
π(dS^(t)/dtS(t)−s^(t)dS(t)/dt)
/(s 2 (t) + s^ 2 (t))
...(6) Focusing on this equation (6), for an audio signal whose playback speed is multiplied by q, this instantaneous frequency signal S
(t) is obtained from both the reproduced audio signal and the reproduced audio signal subjected to Hilbert transform processing, and further signal processing is performed to obtain instantaneous frequency signal information multiplied by 1/q, and the original real time is calculated from equation (6) of the analytic signal. Return the audio signal to instantaneous frequency signal information. The envelope information is synthesized with the playback speed changed by q times, and the original audio (sound at the time of recording) is
They reached the conclusion that it is possible to reproduce speech twice as fast without losing its individuality or phonology, and this was confirmed accurately through computer simulation.

すなわち、録音された音声の再生速度を正常速
度のq倍に伸長または1/q倍に圧縮する際に、
このq倍または1/q倍に変化する再生波形の瞬
時値の変化を、音声時間信号S(t)とこの音声
時間信号をヒルベルト変換した信号S^(t)とか
ら定義される解析音声信号Sa(t)の位相情報φ
(t)=tan-1S^(t)/S(t)の時間的変化として
瞬時周波数信号S(t)を第(6)式のように導き、
この瞬時周波数信号S(t)を1/q倍またはq
倍する信号処理をして解析信号の式(6)により波形
を処理合成し、再生速度変化による音程変化を校
正し出力することを特徴とする。
In other words, when expanding the playback speed of recorded audio to q times the normal speed or compressing it to 1/q times,
The change in the instantaneous value of the reproduced waveform that changes by a factor of q or 1/q is an analytical audio signal defined from the audio time signal S(t) and the Hilbert-transformed signal S^(t) of this audio time signal. Phase information φ of Sa(t)
(t)=tan -1 Deriving the instantaneous frequency signal S(t) as the temporal change of S^(t)/S(t) as shown in equation (6),
This instantaneous frequency signal S(t) is multiplied by 1/q or q
It is characterized by performing multiplication signal processing, processing and synthesizing the waveform using equation (6) of the analytic signal, and calibrating and outputting changes in pitch due to changes in playback speed.

〔発明の実施例〕[Embodiments of the invention]

次に、本発明の実施例を図面に基づき、詳細に
説明する。
Next, embodiments of the present invention will be described in detail based on the drawings.

第1図は本発明の一実施例の基本的構成図、第
2図は第1図における1チヤンネル分のブロツク
図を示す。第1図および第2図において本時間軸
圧縮伸長装置1は、主としてヒルベルト変換回路
Cと、フイルタバンクFBと、本実施例では4チ
ヤンネルからなる瞬時周波数信号抽出回路D、再
生速度変化乗算回路E、FM波出力回路F、包絡
線信号出力回路G、ローパスフイルタLPF、な
らびに包絡線FM波乗算回路Hと、再生信号出力
部M等とから構成される。
FIG. 1 is a basic configuration diagram of an embodiment of the present invention, and FIG. 2 is a block diagram of one channel in FIG. In FIGS. 1 and 2, the time axis compression/decompression device 1 mainly includes a Hilbert transform circuit C, a filter bank FB, an instantaneous frequency signal extraction circuit D consisting of four channels in this embodiment, and a reproduction speed change multiplier circuit E. , an FM wave output circuit F, an envelope signal output circuit G, a low-pass filter LPF, an envelope FM wave multiplier circuit H, a reproduced signal output section M, and the like.

ところで、第2図に示す2は時間軸圧縮伸長装
置1に、抽出信号を出力する例えばテープ録音再
生装置または円板録音再生装置あるいはメモリ読
取装置等である。また、Aは上述の再生装置2内
に装備され、録音速度V(第1図)に対して何倍
の速度で再生されるか逐次、再生速度変化qまた
は1/qを出力する再生速度変化出力装置であ
る。Bは速度変化された録音情報、主として音
声、を出力する録音情報出力装置である。ヒルベ
ルト変換回路Cは、例えば音声のヒルベルト変換
対S(t)およびS^(t)を瞬時周波数信号抽出回
路Dおよび包絡線出力回路Gに出力する。再生速
度変化乗算回路Eは、再生速度変化出力装置Aに
よる再生速度変化qまたは1/qにより、瞬時周波
数信号S(t)を1/q倍またはq倍に乗算す
る。なお、FM波出力回路Fは、第(3)式の振幅包
絡線信号α(t)を一定とした式を計算して出力
する。さらに、包絡線信号出力回路Gは、包絡線
信号α(t)を第(4)式により計算し出力する。包
絡線FM波乗算回路Hは、FM波出力回路Fの出
力に包絡線信号α(t)の情報が乗算され、音程
変化が校正された信号を出力する。
Incidentally, reference numeral 2 shown in FIG. 2 is, for example, a tape recording/playback device, a disc recording/playback device, a memory reading device, or the like, which outputs an extracted signal to the time axis compression/expansion device 1. Further, A is installed in the above-mentioned playback device 2, and is a playback speed change that sequentially outputs a playback speed change q or 1/q to indicate how many times faster the playback is than the recording speed V (Fig. 1). It is an output device. B is a recorded information output device that outputs recorded information whose speed has been changed, mainly audio. The Hilbert transform circuit C outputs, for example, a Hilbert transform pair S(t) and S^(t) of speech to an instantaneous frequency signal extraction circuit D and an envelope output circuit G. The playback speed change multiplier circuit E multiplies the instantaneous frequency signal S(t) by 1/q times or q times by the playback speed change q or 1/q by the playback speed change output device A. Note that the FM wave output circuit F calculates and outputs the equation (3) in which the amplitude envelope signal α(t) is constant. Further, the envelope signal output circuit G calculates and outputs the envelope signal α(t) using equation (4). The envelope FM wave multiplier circuit H multiplies the output of the FM wave output circuit F by the information of the envelope signal α(t), and outputs a signal whose pitch change is calibrated.

なおこの際の再生速度変化qは、整数倍と限る
ものではなく、任意の値を選定することが可能で
ある。
Note that the playback speed change q at this time is not limited to an integral multiple, and any value can be selected.

次に、第3図は第1図における解析信号法によ
り抽出される諸量の波形図を示す。図においてA
は原実時間音声信号S(t)で、Bは包絡線信号
α(t)で、Cは位相項Cos〔φ(t)〕で、Dは
FM成分FM(t)、Eは瞬時周波数S(t)で、
この縦の周波数変動が再生速度に応じてq倍また
は1/q倍される。
Next, FIG. 3 shows a waveform diagram of various quantities extracted by the analytic signal method in FIG. 1. In the diagram A
is the original real-time audio signal S(t), B is the envelope signal α(t), C is the phase term Cos[φ(t)], and D is
FM component FM(t), E is the instantaneous frequency S(t),
This vertical frequency fluctuation is multiplied by q or 1/q depending on the reproduction speed.

次に、第4図は第1図による再生速度変化の変
更に対する校正波形図を示す。図において図Aは
原実時間音声信号S(t)で、図Bは再生時間軸
圧縮率が60%のときの再生実時間音声信号S1(t)
で、Cは同じく80%、Dは同じく100%、Eは同
じく120%のものである。いづれも原実時間音声
信号S(t)の再生速度を変えて得られる時間波
形である。従つて、再生時間は変化するも、ピツ
チ周期はいづれも変らず一定に校正されているか
ら、原音声の音韻が保持されている。
Next, FIG. 4 shows a calibration waveform diagram for changes in reproduction speed according to FIG. 1. In the figure, Figure A is the original real-time audio signal S(t), and Figure B is the reproduced real-time audio signal S 1 (t) when the reproduction time axis compression rate is 60%.
So, C is also 80%, D is 100%, and E is 120%. Both are time waveforms obtained by changing the reproduction speed of the original real-time audio signal S(t). Therefore, even though the playback time changes, the pitch period is calibrated to remain constant and the phoneme of the original speech is maintained.

すなわち、音声信号は、例えばバンドパスフイ
ルタによつて帯域分割されるが、各帯域ごとに瞬
間周波数を抽出する(ピーク周波数を見付ける)
ためで、このための操作としてヒルベルト変換が
行われるものであつて、区間ごとの処理ではな
く、波形の逐次処理を連続的に行い、原音声では
なく、速度変換された波形と周波数成分とが処理
されるもので、全くの再生速度の任意の倍率によ
る連続変化が可能である。
In other words, the audio signal is divided into bands, for example by a bandpass filter, but the instantaneous frequency is extracted for each band (finding the peak frequency).
Therefore, the Hilbert transform is performed as an operation for this purpose, and the waveform is sequentially processed, not the processing for each section. Processed, it is possible to continuously change the total playback speed by any factor.

〔発明の効果〕〔Effect of the invention〕

以上に説明するように本発明によれば、再生速
度を原音声の正常速度のq倍に早めまたは1/q
倍に遅くする際に、q倍または1/q倍に変化す
る再生波形の瞬時値の変化を解析信号法により解
析音声信号の位相情報により瞬時周波数信号を位
相変化の時間的変化として導かれた計算式によ
り、1/q倍またはq倍する信号処理を行うこと
により、再生速度変化による音韻の変化が校正さ
れ、聴感上の悪影響が解消され、従来技術の問題
点が有効に解決され、任意の再生速度変化に対応
し得るという効果を有する。
As explained above, according to the present invention, the playback speed is increased by q times the normal speed of the original audio or by 1/q.
When the speed is doubled, the change in the instantaneous value of the reproduced waveform that changes by a factor of q or 1/q is calculated using the analytical signal method.The instantaneous frequency signal is derived as a temporal change in phase change using the phase information of the analyzed audio signal. By performing signal processing that is multiplied by 1/q or q using a calculation formula, changes in phoneme due to changes in playback speed are calibrated, negative effects on auditory sensation are eliminated, and the problems of the conventional technology are effectively solved. This has the effect of being able to respond to changes in playback speed.

なお、本発明の一実施例は、主として録音され
た音声につき説明するも、これに限るものではな
く、ビデオカセツトからの再生音、任意の振動音
等と任意の時間信号に対しても適用し得るもので
ある。
Although the embodiment of the present invention will mainly be described with respect to recorded audio, it is not limited to this, but can also be applied to reproduced sounds from video cassettes, arbitrary vibration sounds, etc., and arbitrary time signals. It's something you get.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例の基本的構成図、第
2図は第1図における1チヤンネル分のブロツク
図、第3図は第1図の解析信号法により抽出され
た諸量の波形図、第4図は第1図による再生速度
変化の変更に対する校正波形図、第5図は原信号
と再生された信号の基本的波形、および、再生速
度の変化に対して校正された波形図である。 1:時間軸圧縮伸長装置、2:再生装置、C:
ヒルベルト変換回路、D:瞬時周波数信号抽出回
路、E:再生速度変化乗算回路、F:FM波出力
回路、G:包絡線信号出力回路、H:包絡線・
FM波乗算回路。
Fig. 1 is a basic configuration diagram of an embodiment of the present invention, Fig. 2 is a block diagram for one channel in Fig. 1, and Fig. 3 is a waveform of various quantities extracted by the analytical signal method shown in Fig. 1. Figure 4 is a waveform diagram calibrated for changes in playback speed according to Figure 1. Figure 5 is a diagram of the basic waveforms of the original signal and reproduced signal, and a waveform diagram calibrated for changes in playback speed. It is. 1: Time axis compression/expansion device, 2: Playback device, C:
Hilbert transform circuit, D: Instantaneous frequency signal extraction circuit, E: Playback speed change multiplication circuit, F: FM wave output circuit, G: Envelope signal output circuit, H: Envelope/
FM wave multiplier circuit.

Claims (1)

【特許請求の範囲】 1 録音またはメモリ上に記録された音声の再生
速度を正常速度のq倍に早めまたは1/q倍に遅
くする際に、このq倍または1/q倍に変化する
波形の瞬間値の変化を、音声時間信号s(t)と
この音声時間信号をヒルベルト変換した信号s^
(t)とから定義される解析音声信号sa(t)の位
相情報φ(t)=tan-1s^(t)/s(t)より、前記
解析音声信号の瞬時周波数信号fs(t)を前記位
相情報の時間的変化として、次式 fs(t)=1/2π・dφ(t)/dt=1/2π(d
s^(t)/dts(t)−s^(t)ds(t)/dt)/(s2
(t)+s^2(t)) にて導き、前記瞬間周波数信号fs(t)を1/
q倍またはq倍する信号処理をして再生速度の変
化による音程変化を校正し出力することを特徴と
する時間軸圧縮伸長装置。
[Claims] 1. A waveform that changes q times or 1/q times the normal speed when the playback speed of audio recorded on a recording or memory is made q times faster or 1/q times slower than the normal speed. The change in the instantaneous value of is expressed as the voice time signal s(t) and the Hilbert-transformed signal s^ of this voice time signal.
From the phase information φ(t)=tan -1 s^(t)/s(t) of the analytic audio signal sa(t) defined from (t), the instantaneous frequency signal fs(t) of the analytic audio signal is the temporal change in the phase information, and the following formula fs(t)=1/2π・dφ(t)/dt=1/2π(d
s^(t)/dts(t)−s^(t)ds(t)/dt)/(s 2
(t)+s^ 2 (t)), and the instantaneous frequency signal fs(t) is 1/
A time axis compression/expansion device characterized in that it performs signal processing that multiplies by q or q to calibrate and output changes in pitch due to changes in playback speed.
JP60298296A 1985-12-31 1985-12-31 Time base compressor/extender Granted JPS62159196A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60298296A JPS62159196A (en) 1985-12-31 1985-12-31 Time base compressor/extender

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60298296A JPS62159196A (en) 1985-12-31 1985-12-31 Time base compressor/extender

Publications (2)

Publication Number Publication Date
JPS62159196A JPS62159196A (en) 1987-07-15
JPH0465398B2 true JPH0465398B2 (en) 1992-10-19

Family

ID=17857805

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60298296A Granted JPS62159196A (en) 1985-12-31 1985-12-31 Time base compressor/extender

Country Status (1)

Country Link
JP (1) JPS62159196A (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5504445B2 (en) * 2010-03-26 2014-05-28 国立大学法人九州工業大学 Microphone device
JP6131574B2 (en) * 2012-11-15 2017-05-24 富士通株式会社 Audio signal processing apparatus, method, and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60140298A (en) * 1983-12-27 1985-07-25 ソニー株式会社 Speech controller

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60140298A (en) * 1983-12-27 1985-07-25 ソニー株式会社 Speech controller

Also Published As

Publication number Publication date
JPS62159196A (en) 1987-07-15

Similar Documents

Publication Publication Date Title
Rumsey Sound and recording: applications and theory
US5641927A (en) Autokeying for musical accompaniment playing apparatus
US5842172A (en) Method and apparatus for modifying the play time of digital audio tracks
US5530750A (en) Apparatus, method, and system for compressing a digital input signal in more than one compression mode
US7792681B2 (en) Time-scale modification of data-compressed audio information
JPS62145504A (en) Sound field magnifying device
JP3605706B2 (en) Sound signal reproducing method and apparatus
JPH0465398B2 (en)
KR20030085521A (en) Encoding method and decoding method for digital voice data
JP3560087B2 (en) Sound signal processing device and surround reproduction method
Suzuki et al. Time-scale modification of speech signals using cross-correlation functions
JP3424936B2 (en) Audio signal compression method and apparatus, recording method and apparatus using the same, and double speed reproduction apparatus
JP2734028B2 (en) Audio recording device
JP4133064B2 (en) Waveform playback device
JP2004317622A (en) Sound reproducing device
JPH06202692A (en) Control system for speech reproducing speed
JP2669088B2 (en) Audio speed converter
JPS60239800A (en) Residual excitation type vocoder
JPS6242280B2 (en)
JP2792838B2 (en) Reproduction method of digitized audio frequency signal
JPH01152499A (en) Double-speed reproducer
JPH0736490A (en) Higher harmonic adding circuit
JPH04185017A (en) Quantization error reducing device for audio signal
JPS59124386A (en) Musical interval varying apparatus
JPS5919934Y2 (en) volume expansion device