JPH08292789A - Speech speed changing device - Google Patents

Speech speed changing device

Info

Publication number
JPH08292789A
JPH08292789A JP7095493A JP9549395A JPH08292789A JP H08292789 A JPH08292789 A JP H08292789A JP 7095493 A JP7095493 A JP 7095493A JP 9549395 A JP9549395 A JP 9549395A JP H08292789 A JPH08292789 A JP H08292789A
Authority
JP
Japan
Prior art keywords
periodicity
input
voice
axis compression
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7095493A
Other languages
Japanese (ja)
Inventor
Koji Tanaka
浩司 田中
Masayuki Iida
正幸 飯田
Masanori Miyatake
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP7095493A priority Critical patent/JPH08292789A/en
Publication of JPH08292789A publication Critical patent/JPH08292789A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE: To provide a speech speed changing device in which the degradation of a voice is not generated when the changing of a speech speed is performed. CONSTITUTION: This device is a speech speed changing device provided with a time base compressing and expanding means 14 for performing the time base compression and expansion processing of an input voice and outputting the input voice while making the voice speed of the input voice slow. Moreover, this device is provided with a means 12 discriminating whether a periodicity is present or not in the input voice and means 13, 15 allowing the time base compression and expansion processing by the time base compressing and expanding means 14 to be performed only to sections in which the periodicities are present among the input signal.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は、入力音声の音声速度
を遅くして出力する話速変換装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech speed conversion device for slowing down and outputting a voice speed of input voice.

【0002】[0002]

【従来の技術】従来から入力音声信号を時間軸圧縮伸長
処理することにより、入力音声速度より遅い速度の出力
音声を得る話速変換技術が知られている。しかしなが
ら、入力音声を時間軸圧縮伸長処理した場合には、音声
の劣化が生じるという問題がある。
2. Description of the Related Art A speech speed conversion technique for obtaining an output voice at a slower speed than the input voice speed by subjecting an input voice signal to a time axis compression / expansion process has been conventionally known. However, when the input voice is subjected to the time axis compression / expansion process, there is a problem that the voice is deteriorated.

【0003】[0003]

【発明が解決しようとする課題】この発明は、話速変換
を行ったときに音声の劣化が生じない話速変換装置を提
供することを目的とする。
SUMMARY OF THE INVENTION It is an object of the present invention to provide a speech speed conversion device which does not cause voice deterioration when speech speed conversion is performed.

【0004】[0004]

【課題を解決するための手段】この発明による第1の話
速変換装置は、入力音声を時間軸圧縮伸長処理するため
の時間軸圧縮伸長手段を備え、入力音声の音声速度を遅
くして出力する話速変換装置において、入力音声に周期
性があるか否かを判定する手段、および入力信号のう
ち、周期性があると判定された区間に対してのみ、時間
軸圧縮伸長手段による時間軸圧縮伸長処理を行わせる手
段を備えていることを特徴とする。
A first speech speed conversion apparatus according to the present invention comprises time-axis compression / expansion means for time-axis compression / expansion processing of input voice, and outputs the voice at a low voice speed. In the speech speed converting apparatus, a unit for determining whether or not the input voice has periodicity, and a time axis by the time axis compression / expansion unit only for a section of the input signal determined to have periodicity. It is characterized in that it is provided with means for performing compression / decompression processing.

【0005】この発明による第2の話速変換装置は、入
力音声を時間軸圧縮伸長処理するための時間軸圧縮伸長
手段を備え、入力音声の音声速度を遅くして出力する話
速変換装置において、入力音声に周期性があるか否かを
判定する手段、周期性があると判定されたときにその継
続長を算出する手段、および入力信号のうち、周期性の
継続長が所定値以上の区間に対してのみ、時間軸圧縮伸
長手段による時間軸圧縮伸長処理を行わせる手段を備え
ていることを特徴とする。
A second voice speed conversion apparatus according to the present invention is a voice speed conversion apparatus which comprises time-axis compression / expansion means for time-axis compression / expansion processing of input voice, and outputs the voice at a low voice speed. , Means for determining whether the input voice has periodicity, means for calculating the duration when it is determined to have periodicity, and of the input signal, the duration of the periodicity is equal to or greater than a predetermined value. It is characterized in that it is provided with means for performing the time axis compression / expansion processing by the time axis compression / expansion means only for the section.

【0006】この発明による第3の話速変換装置は、入
力音声を時間軸圧縮処理するための時間軸圧縮手段を備
え、入力音声の音声速度を遅くして出力する話速変換装
置において、入力音声に周期性があるか否かを判定する
手段、周期性があると判定されたときにその継続長を算
出する手段、入力信号のうち、周期性の継続長が第1の
所定長未満の区間に対しては、時間軸圧縮伸長手段によ
る時間軸圧縮処理を行わずに出力させる手段、入力信号
のうち、周期性の継続長が第1の所定長以上でありかつ
第1の所定長より大きな第2の所定長未満の区間に対し
ては、比較的大きな圧縮率を用いて時間軸圧縮手段によ
る時間軸圧縮処理を行う手段、および入力信号のうち、
周期性の継続長が第2の所定長以上である区間に対して
は、比較的小さな圧縮率を用いて時間軸圧縮手段による
時間軸圧縮処理を行う手段を備えていることを特徴とす
る。
A third speech speed conversion apparatus according to the present invention is provided with a time axis compression means for time axis compression processing of input speech, and in the speech rate conversion apparatus for slowing down and outputting the input speech, A means for determining whether or not the sound has periodicity, a means for calculating the duration when it is determined to have the periodicity, and a duration of the periodicity of the input signal is less than the first predetermined length. For the section, the means for outputting the time axis compression processing by the time axis compression / decompression means without performing the time axis compression processing, and the duration of the periodicity of the input signal that is equal to or greater than the first predetermined length and is greater than the first predetermined length. Of the input signal, the means for performing the time-axis compression process by the time-axis compression means using a relatively large compression rate for a section having a large second predetermined length or less.
It is characterized in that it is provided with means for performing time-axis compression processing by the time-axis compression means using a relatively small compression rate for a section in which the continuity length of the periodicity is equal to or greater than the second predetermined length.

【0007】[0007]

【作用】この発明による第1の話速変換装置では、入力
音声に周期性があるか否かが判定される。そして、入力
信号のうち、周期性があると判定された区間に対しての
み、時間軸圧縮伸長手段による時間軸圧縮伸長処理が行
われる。
In the first speech speed converting apparatus according to the present invention, it is determined whether the input voice has periodicity. Then, the time axis compression / expansion processing is performed by the time axis compression / expansion means only for the section of the input signal that is determined to have periodicity.

【0008】この発明による第2の話速変換装置では、
入力音声に周期性があるか否かが判定される。周期性が
あると判定されたときにその継続長が算出される。そし
て、入力信号のうち、周期性の継続長が所定値以上の区
間に対してのみ、時間軸圧縮伸長手段による時間軸圧縮
伸長処理が行われる。
In the second speech speed converting apparatus according to the present invention,
It is determined whether the input voice has periodicity. When it is determined that there is periodicity, its continuation length is calculated. Then, in the input signal, the time axis compression / expansion processing is performed by the time axis compression / expansion means only for a section in which the continuity of the periodicity is equal to or greater than a predetermined value.

【0009】この発明による第3の話速変換装置では、
入力音声に周期性があるか否かが判定される。周期性が
あると判定されたときにその継続長が算出される。入力
信号のうち、周期性の継続長が第1の所定長未満の区間
に対しては、時間軸圧縮伸長手段による時間軸圧縮処理
を行われない。入力信号のうち、周期性の継続長が第1
の所定長以上でありかつ第1の所定長より大きな第2の
所定長未満の区間に対しては、比較的大きな圧縮率を用
いて時間軸圧縮手段による時間軸圧縮処理が行われる。
入力信号のうち、周期性の継続長が第2の所定長以上で
ある区間に対しては、比較的小さな圧縮率を用いて時間
軸圧縮手段による時間軸圧縮処理が行われる。
In the third speech speed converting apparatus according to the present invention,
It is determined whether the input voice has periodicity. When it is determined that there is periodicity, its continuation length is calculated. Of the input signal, the time axis compression processing by the time axis compression / expansion means is not performed for the section where the continuity of the periodicity is less than the first predetermined length. Of the input signals, the duration of periodicity is the first
The time axis compression process is performed by the time axis compression means using a relatively large compression rate for a section that is greater than or equal to the predetermined length and less than the second predetermined length that is greater than the first predetermined length.
Of the input signal, the time axis compression process is performed by the time axis compression means using a relatively small compression rate for a section in which the continuity of the periodicity is equal to or greater than the second predetermined length.

【0010】[0010]

【実施例】以下、図面を参照して、この発明の実施例に
ついて説明する。
Embodiments of the present invention will be described below with reference to the drawings.

【0011】(1)第1実施例の説明(1) Description of the first embodiment

【0012】図1を参照して、この発明の第1実施例に
ついて説明する。図1は、出力音声速度を入力音声速度
より遅くする話速変換装置の構成を示している。
A first embodiment of the present invention will be described with reference to FIG. FIG. 1 shows the configuration of a speech speed conversion device that makes an output voice speed slower than an input voice speed.

【0013】話速変換装置は、音声信号入力部11、周
期性判定部12、入力切り替え部13、時間軸圧縮伸長
手段14、出力切り替え部15、バッファ16および音
声信号出力部17を備えている。
The speech speed conversion device comprises a voice signal input unit 11, a periodicity determination unit 12, an input switching unit 13, a time axis compression / expansion unit 14, an output switching unit 15, a buffer 16 and a voice signal output unit 17. .

【0014】音声信号入力部11は、たとえば、増幅
部、A/D変換部、フレームメモリ等を備えている。音
声信号入力部11に入力された信号は、増幅された後、
ディジタル信号に変換されて、フレームメモリに格納さ
れる。音声信号入力部11の出力は、周期性判定部12
と入力切り替え部13とに送られる。
The audio signal input section 11 is provided with, for example, an amplification section, an A / D conversion section, a frame memory and the like. The signal input to the audio signal input unit 11 is amplified,
It is converted into a digital signal and stored in the frame memory. The output of the audio signal input unit 11 is the periodicity determination unit 12
To the input switching unit 13.

【0015】この実施例では、話速変換装置にアナログ
信号が入力される場合を示したが、ICメモリ等から読
み出されたディジタル信号を話速変換装置に入力するよ
うにしてもよい。この場合には、音声信号入力部11に
A/D変換部を設ける必要はない。
In this embodiment, the analog signal is input to the speech speed converter, but a digital signal read from an IC memory or the like may be input to the speech speed converter. In this case, it is not necessary to provide the audio signal input unit 11 with an A / D conversion unit.

【0016】周期性判定部12では、入力音声信号の周
期性の有無が検出される。入力信号の周期性の有無の検
出は、よく知られているように自己相関法に基づいて行
われる。周期性判定部12は、入力音声信号に周期性が
あると判定したときには第1切り替え信号を出力し、入
力信号に周期性がないと判定したときには第2切り替え
信号を出力する。周期性判定部12から出力される切り
替え信号は、入力切り替え部13および出力切り替え部
15に送られる。
The periodicity determination unit 12 detects whether or not the input audio signal has periodicity. The detection of the periodicity of the input signal is performed based on the autocorrelation method as is well known. The periodicity determination unit 12 outputs a first switching signal when it determines that the input audio signal has periodicity, and outputs a second switching signal when it determines that the input signal has no periodicity. The switching signal output from the periodicity determination unit 12 is sent to the input switching unit 13 and the output switching unit 15.

【0017】入力切り替え部13は、周期性判定部12
からの切り替え信号に基づいて、入力信号の送り先を切
り替える。つまり、第1切り替え信号が入力されている
ときには、入力音声信号を時間軸圧縮伸長手段14に送
り、第2切り替え信号が入力されているときには、入力
音声信号を出力切り替え部15に送る。
The input switching unit 13 includes a periodicity determining unit 12
The destination of the input signal is switched based on the switching signal from. That is, when the first switching signal is input, the input audio signal is sent to the time axis compression / expansion means 14, and when the second switching signal is input, the input audio signal is sent to the output switching unit 15.

【0018】時間軸圧縮伸長手段14は、入力音声速度
が標準再生速度より速い速度で再生された音声である場
合には、再生速度倍率をnとすると1/n以上の圧縮率
αで、入力信号を圧縮する。入力音声が標準再生速度で
再生された音声である場合には、1以上の圧縮率αで、
入力信号を伸長する。
When the input voice speed is a voice reproduced at a speed higher than the standard reproduction speed, the time axis compression / expansion means 14 inputs at a compression ratio α of 1 / n or more, where the reproduction speed multiplication factor is n. Compress the signal. When the input sound is reproduced at the standard reproduction speed, the compression rate α is 1 or more,
Decompress the input signal.

【0019】時間軸圧縮伸長手段14で用いられる時間
軸圧縮伸長法としては、たとえば、ポインタ移動制御に
よる重複加算法(Pointer Interval Control Overlap a
nd Add : PICOLA)、TDHS(Time Domain Harmonic Scalin
g)法等がある。
The time axis compression / expansion method used by the time axis compression / expansion means 14 is, for example, a pointer addition control overlap pointer addition method (Pointer Interval Control Overlap a).
nd Add: PICOLA), TDHS (Time Domain Harmonic Scalin
g) There are laws, etc.

【0020】PICOLAを用いて、入力音声信号(時
間軸圧縮伸長手段14への入力音声データ)を圧縮率2
/3で圧縮する方法について、図4を用いて簡単に説明
する。まず、入力音声信号からピッチ周期が抽出され
る。抽出されたピッチ周期をTpとする。波形Aに対し
ては、1から0へ直線的に向かう重み(重み関数K1)
がつけられて、波形A’が作成される。波形Bに対して
は0から1に向かう重み(重み関数K2)がつけられ
て、波形B’が作成される。
Using PICOLA, the input voice signal (the voice data input to the time axis compression / decompression means 14) is compressed at a compression rate of 2.
A method of compressing with / 3 will be briefly described with reference to FIG. First, the pitch period is extracted from the input voice signal. The extracted pitch period is Tp. For the waveform A, a weight that linearly goes from 1 to 0 (weight function K1)
Are added to form a waveform A ′. A weight (weighting function K2) from 0 to 1 is applied to the waveform B to create a waveform B '.

【0021】そして、これらの波形A’およびB’が加
え合わされ、長さTpの波形A’*B’が作成される。
これらの重みは、波形A’*B’の前後の接続点での連
続性を保つためにつけられている。次に、ポインタが、
圧縮率に基づいて決定される長さである3Tp分だけ移
動され、同様な操作が行われる。これにより、3つの波
形A、B、Cから2つの波形A’*B’とCとが得られ
る。このようにして、3ピッチ周期分の信号が、2ピッ
チ周期分の信号に圧縮される。
Then, these waveforms A'and B'are added together to form a waveform A '* B' of length Tp.
These weights are added to maintain continuity at the connection points before and after the waveform A ′ * B ′. Then the pointer becomes
The same operation is performed after moving by 3 Tp, which is the length determined based on the compression rate. As a result, two waveforms A ′ * B ′ and C are obtained from the three waveforms A, B, and C. In this way, the signal for 3 pitch periods is compressed into the signal for 2 pitch periods.

【0022】出力切り替え部15は、周期性判定部12
からの切り替え信号に基づいて、2つの入力のうちの一
方を選択してバッファ16に出力する。つまり、第1切
り替え信号が入力されているときには、時間軸圧縮伸長
手段14の出力をバッファ16に出力し、第2切り替え
信号が入力されているときには、入力切り替え部13の
出力をバッファ16に出力する。
The output switching unit 15 includes a periodicity determining unit 12
One of the two inputs is selected based on the switching signal from and output to the buffer 16. That is, when the first switching signal is input, the output of the time axis compression / expansion means 14 is output to the buffer 16, and when the second switching signal is input, the output of the input switching unit 13 is output to the buffer 16. To do.

【0023】バッファ16に蓄積された音声データは、
一定速度で読み出されて音声信号出力部17に送られ
る。
The voice data accumulated in the buffer 16 is
It is read at a constant speed and sent to the audio signal output unit 17.

【0024】音声信号出力部17は、D/A変換部を備
えている。出力切り替え部15から音声信号出力部17
に送られてきたディジタル信号は、アナログ信号に変換
されて音声信号出力部17から出力される。
The audio signal output section 17 includes a D / A conversion section. From the output switching unit 15 to the audio signal output unit 17
The digital signal sent to is converted into an analog signal and output from the audio signal output unit 17.

【0025】この実施例では、話速変換装置から音声信
号をアナログ信号として出力する場合を示したが、話速
変換装置から音声信号をデイジタル信号として出力する
ようにしてもよい。この場合には、音声信号出力部17
にD/A変換部を設ける必要はない。
In this embodiment, the case where the voice signal is output as an analog signal from the voice speed converter is shown, but the voice signal may be output as a digital signal from the voice speed converter. In this case, the audio signal output unit 17
It is not necessary to provide a D / A conversion unit in.

【0026】なお、話速変換装置の入出力信号が共にア
ナログ信号である場合には、音声信号出力部17内のD
/A変換部のサンプリング周波数は、標準サンプリング
周波数fSOに設定され、音声信号入力部11内のA/D
変換部のサンプリング周波数は、再生速度倍率をnとす
ると、n・fSOに設定される。たとえば、入力音声速度
が標準再生速度の2倍の速度で再生された音声である場
合、つまり、入力信号の再生速度倍率nが2である場合
には、音声信号入力部11内のA/D変換部のサンプリ
ング周波数は2fSOとなり、音声信号出力部17内のD
/A変換部のサンプリング周波数は、fSOとなる。
When both the input and output signals of the speech speed converter are analog signals, D in the voice signal output section 17 is used.
The sampling frequency of the A / A converter is set to the standard sampling frequency f SO, and the A / D in the audio signal input unit 11 is set.
The sampling frequency of the converter is set to n · f SO , where n is the reproduction speed multiplication factor. For example, when the input voice speed is voice reproduced at a speed twice the standard reproduction speed, that is, when the reproduction speed magnification n of the input signal is 2, the A / D in the audio signal input unit 11 is The sampling frequency of the conversion unit is 2f SO , and D in the audio signal output unit 17
The sampling frequency of the / A converter is f SO .

【0027】話速変換装置の入出力信号が共にディジタ
ル信号である場合には、再生速度倍率をnとすると、音
声信号出力部17から出力されるデータの出力速度に対
して、音声信号入力部11に入力されるデータの入力速
度は、n倍となるように設定される。
When both the input and output signals of the speech speed conversion device are digital signals, assuming that the reproduction speed multiplication factor is n, the audio signal input unit with respect to the output speed of the data output from the audio signal output unit 17 will be described. The input speed of the data input to 11 is set to be n times.

【0028】話速変換装置の動作について説明する。音
声信号入力部11に入力した音声信号の周期性の有無が
周期性判定部12で判定される。入力信号に周期性があ
ると判定されたときには、第1切り替え信号が周期性判
定部12から出力されて、各切り替え部13、15に送
られる。したがって、入力音声信号に周期性があると判
定されたときには、入力音声信号は時間軸圧縮伸長手段
14に送られる。
The operation of the speech speed converter will be described. The periodicity determination unit 12 determines whether or not the audio signal input to the audio signal input unit 11 has periodicity. When it is determined that the input signal has periodicity, the first switching signal is output from the periodicity determination unit 12 and sent to the switching units 13 and 15. Therefore, when it is determined that the input audio signal has periodicity, the input audio signal is sent to the time axis compression / expansion means 14.

【0029】再生速度倍率nが、たとえば2である場合
には、時間軸圧縮伸長手段14では、たとえば圧縮率2
/3で、入力信号が圧縮される。つまり、入力音声信号
の3ピッチが2ピッチになるように、波形が間引かれ
る。したがって、音声信号出力部17から出力される音
声の速度は標準音声速度の2/3倍となるが、その音程
は標準速度再生時の音程となる。
When the reproduction speed magnification n is, for example, 2, the time axis compression / expansion means 14 uses, for example, a compression ratio of 2.
At / 3, the input signal is compressed. That is, the waveforms are thinned out so that 3 pitches of the input audio signal become 2 pitches. Therefore, the speed of the voice output from the voice signal output unit 17 is ⅔ times the standard voice speed, but the pitch is the pitch at the standard speed reproduction.

【0030】再生速度倍率nが、たとえば1である場合
には、時間軸圧縮伸長手段14では、たとえば圧縮率3
/2で、入力音声信号が伸長される。つまり、入力音声
信号の2ピッチが3ピッチになるように、波形が挿入さ
れる。
When the reproduction speed magnification n is, for example, 1, the time axis compression / expansion means 14 uses, for example, a compression ratio of 3.
At / 2, the input audio signal is expanded. That is, the waveform is inserted so that 2 pitches of the input audio signal become 3 pitches.

【0031】時間軸圧縮伸長手段14によって時間軸圧
縮伸長処理が施された信号は、出力切り替え部15を介
してバッフア16に蓄積された後、音声信号出力部17
を介して出力される。
The signal subjected to the time axis compression / expansion processing by the time axis compression / expansion means 14 is accumulated in the buffer 16 via the output switching section 15, and then the audio signal output section 17 is provided.
Is output via.

【0032】周期性判定部12によって、入力信号に周
期性がないと判定されたときには、第2切り替え信号が
周期性判定部12から出力されて、各切り替え部13、
15に送られる。したがって、入力音声信号に周期性が
ないと判定されたときには、入力音声信号は、時間軸圧
縮伸長処理が施されることなく、バッフア16に蓄積さ
れる。そして、音声信号出力部17を介して出力され
る。
When the periodicity determining unit 12 determines that the input signal has no periodicity, the second switching signal is output from the periodicity determining unit 12 and each switching unit 13,
Sent to 15. Therefore, when it is determined that the input audio signal has no periodicity, the input audio signal is accumulated in the buffer 16 without being subjected to the time axis compression / expansion process. Then, it is output through the audio signal output unit 17.

【0033】時間軸圧縮伸長処理手段14は、入力音声
をピッチ周期単位で間引くまたは挿入するといった処理
を行う。したがって、周期性のない音声信号に対して、
時間軸圧縮伸長処理を行うと、音声が劣化する。第1実
施例では、入力音声に周期性がないときには、時間軸圧
縮伸長手段14によって時間軸圧縮伸長処理が行われな
いため、音声が劣化するといったことが防止される。
The time axis compression / expansion processing means 14 performs processing such as thinning out or inserting the input voice in pitch cycle units. Therefore, for a voice signal without periodicity,
When the time-base compression / decompression process is performed, the sound is deteriorated. In the first embodiment, when the input voice has no periodicity, the time-base compression / decompression means 14 does not perform the time-base compression / decompression process, so that the voice is prevented from being deteriorated.

【0034】(2)第2実施例の説明(2) Description of the second embodiment

【0035】図2を参照して、この発明の第2実施例に
ついて説明する。図2は、話速変換装置の構成を示して
いる。図2において、図1と同じものには、同じ符号を
付してその説明を省略する。
A second embodiment of the present invention will be described with reference to FIG. FIG. 2 shows the structure of the speech speed conversion device. 2, the same parts as those in FIG. 1 are designated by the same reference numerals and the description thereof will be omitted.

【0036】この話速変換装置では、周期性判定部12
の後段に継続長算出部21が設けられている。継続長算
出部21は、周期性判定部12によって周期性ありと判
定された場合に、その継続長を算出する。そして、その
継続長が予め定められた所定値以上になったときに第1
切り替え信号を出力する。
In this speech speed converting apparatus, the periodicity judging section 12
The continuation length calculation unit 21 is provided in the subsequent stage. The continuation length calculation unit 21 calculates the continuation length when the periodicity determination unit 12 determines that there is periodicity. Then, when the continuation length exceeds a predetermined value, the first
Output a switching signal.

【0037】つまり、継続長算出部21は、周期性判定
部12によって周期性ありと判定されかつその継続長が
所定値以上であるときに第1切り替え信号を出力する。
周期性判定部12によって周期性がないと判定されてい
るときまたは周期性判定部12によって周期性ありと判
定されてもその継続長が所定値未満のときには、継続長
算出部21は、第2切り替え信号を出力する。
That is, the continuation length calculation unit 21 outputs the first switching signal when the periodicity determination unit 12 determines that there is periodicity and the continuation length is equal to or greater than the predetermined value.
When the periodicity determination unit 12 determines that there is no periodicity, or when the periodicity determination unit 12 determines that there is periodicity and the duration is less than the predetermined value, the duration calculation unit 21 Output a switching signal.

【0038】第1切り替え信号が出力されたときの各切
り替え部13、15の動作および第2切り替え信号が出
力されたときの各切り替え部13、15の動作は、第1
実施例と同じである。したがって、第2実施例では、周
期性判定部12によって周期性ありと判定されかつその
継続長が所定値以上であるときのみ、時間軸圧縮伸長手
段14によって入力音声信号が時間軸圧縮伸長処理され
る。
The operation of each switching unit 13, 15 when the first switching signal is output and the operation of each switching unit 13, 15 when the second switching signal is output are as follows:
Same as the embodiment. Therefore, in the second embodiment, the time axis compression / expansion means 14 performs the time axis compression / expansion processing on the input audio signal only when the periodicity judgment section 12 judges that there is periodicity and the duration is equal to or more than the predetermined value. It

【0039】(3)第3実施例の説明(3) Description of the third embodiment

【0040】図3を参照して、この発明の第3実施例に
ついて説明する。図3は、話速変換装置の構成を示して
いる。図3において、図1または図2と同じものには、
同じ符号を付してその説明を省略する。
A third embodiment of the present invention will be described with reference to FIG. FIG. 3 shows the structure of the speech speed conversion device. In FIG. 3, the same thing as FIG. 1 or FIG.
The same reference numerals are given and the description thereof is omitted.

【0041】この話速変換装置は、入力音声信号が、標
準再生速度より速い速度で再生された音声であるときに
その音声速度を遅くさせて出力するものである。このた
め、時間軸伸長を行うことはないので、時間軸圧縮伸長
手段ではなく時間軸圧縮手段23が設けられている。
This speech speed converting apparatus is for outputting the input voice signal by reducing the voice speed when the input voice signal is a voice reproduced at a speed higher than the standard reproduction speed. For this reason, since the time axis expansion is not performed, the time axis compression means 23 is provided instead of the time axis compression and expansion means.

【0042】この話速変換装置では、時間軸圧縮手段2
3の圧縮率を、継続長算出部21からの制御信号によっ
て調整する圧縮率調整手段22が設けられている。
In this speech speed converter, the time axis compression means 2
A compression rate adjusting means 22 for adjusting the compression rate of No. 3 by a control signal from the continuation length calculation unit 21 is provided.

【0043】継続長算出部21は、周期性判定部12に
よって周期性ありと判定された場合に、その継続長を算
出する。そして、周期性がある音声信号の継続長が第1
の基準値T1未満のときには、継続長算出部21は第1
切り替え信号を出力する。周期性がある音声信号の継続
長が第1の基準値T1以上で第2基準値T2(T1<T
2)未満のときには、継続長算出部21は第2切り替え
信号を出力する。周期性がある音声信号の継続長が第2
の基準値T2以上のときには、継続長算出部21は第3
切り替え信号を出力する。
The continuation length calculation unit 21 calculates the continuation length when the periodicity determination unit 12 determines that there is periodicity. The duration of the voice signal having periodicity is first
Is less than the reference value T1 of the continuation length calculation unit 21
Output a switching signal. The duration of the periodic audio signal is greater than or equal to the first reference value T1 and the second reference value T2 (T1 <T
If less than 2), the continuation length calculation unit 21 outputs the second switching signal. The duration of the audio signal with periodicity is the second
When the reference value T2 is equal to or larger than the reference value T2 of
Output a switching signal.

【0044】継続長算出部21から出力される切り替え
信号は、各切り替え部12、15に送られるとともに、
圧縮率調整手段22にも送られる。入力切り替え部12
は、第1切り替え信号が送られているときには入力音声
信号を出力切り替え部14に送り、第2または第3切り
替え信号が送られているときには入力音声信号を時間軸
圧縮手段23に送る。
The switching signal output from the continuation length calculation unit 21 is sent to the switching units 12 and 15 and
It is also sent to the compression rate adjusting means 22. Input switching unit 12
Sends the input audio signal to the output switching unit 14 when the first switching signal is sent, and sends the input audio signal to the time axis compression means 23 when the second or third switching signal is sent.

【0045】出力切り替え部15は、第1切り替え信号
が送られているときには入力切り替え部12の出力をバ
ッファ16に送り、第2または第3切り替え信号が送ら
れているときには時間軸圧縮手段23によって時間軸圧
縮処理が施された音声信号をバッファ16に送る。
The output switching unit 15 sends the output of the input switching unit 12 to the buffer 16 when the first switching signal is sent, and by the time axis compression means 23 when the second or third switching signal is sent. The audio signal subjected to the time base compression processing is sent to the buffer 16.

【0046】圧縮率調整手段22は、第1切り替え信号
が送られてきているときには作動しない。第2切り替え
信号が圧縮率調整手段22に送られてきているときに
は、圧縮率調整手段22は、圧縮率を比較的大きな値に
設定する。つまり、入力信号をあまり間引かないように
する。第3切り替え信号が圧縮率調整手段22に送られ
てきているときには、圧縮率調整手段22は、圧縮率を
比較的小さな値に設定する。つまり、入力信号をたくさ
ん間引くようにする。
The compression ratio adjusting means 22 does not operate when the first switching signal is sent. When the second switching signal is sent to the compression rate adjusting means 22, the compression rate adjusting means 22 sets the compression rate to a relatively large value. That is, do not thin out the input signal. When the third switching signal is sent to the compression rate adjusting means 22, the compression rate adjusting means 22 sets the compression rate to a relatively small value. That is, the input signals are thinned out a lot.

【0047】たとえば、入力音声速度が標準再生速度の
2倍の速度で再生された音声である場合、つまり、入力
信号の再生速度倍率nが2である場合の話速変換装置の
動作について説明する。入力音声信号に周期性がないと
判定されたときまたは周期性があると判定されてもその
継続長が第1の基準値T1未満のときには(第1切り替
え信号が出力されているときには)、入力音声信号は時
間軸圧縮処理が行われることなくバッファ16に送られ
る。このような入力音声信号に対する出力音声の速度は
標準速度となる。
For example, the operation of the speech speed conversion device when the input voice speed is a voice reproduced at a speed twice the standard reproduction speed, that is, when the reproduction speed magnification n of the input signal is 2 will be described. . When it is determined that the input audio signal has no periodicity, or even when it is determined that there is periodicity, the duration is less than the first reference value T1 (when the first switching signal is output), the input The audio signal is sent to the buffer 16 without time axis compression processing. The speed of the output sound with respect to such an input sound signal becomes the standard speed.

【0048】入力音声信号に周期性があると判定されか
つその継続長が第1の基準値T1以上でかつ第2の基準
値T2未満のときには(第2切り替え信号が出力されて
いるときには)、圧縮率調整手段22によって圧縮率は
たとえば4/5に設定される。このような、入力音声信
号に対する出力音声の速度は標準速度の5/4倍とな
る。
When it is determined that the input audio signal has periodicity and its duration is equal to or more than the first reference value T1 and less than the second reference value T2 (when the second switching signal is output). The compression rate adjusting means 22 sets the compression rate to, for example, 4/5. The speed of the output sound with respect to the input sound signal is 5/4 times the standard speed.

【0049】入力音声信号に周期性があると判定されか
つその継続長が第2の基準値T2以上のときには(第3
切り替え信号が出力されているときには)、圧縮率調整
手段22によって圧縮率はたとえば1/2に設定され
る。このような、入力音声信号に対する出力音声の速度
は標準速度の2倍となる。
When it is determined that the input audio signal has periodicity and its duration is equal to or greater than the second reference value T2 (third value).
When the switching signal is being output), the compression rate adjusting means 22 sets the compression rate to, for example, 1/2. The speed of the output sound with respect to the input sound signal is twice the standard speed.

【0050】このように、周期性の継続長が第2の基準
値T2以上のときに、入力音声信号をたくさん間引くよ
うにしているのは、次の理由による。つまり、たとえば
「アー」というように、母音が長くのばされている部分
では、周期性の継続長が長くなる。そこで、このような
区間については、間引きの度合いをおおきくしても出力
音声を聞き取れることができるため、圧縮率の値αを小
さく(間引き率を大きく)しているのである。
The reason why the input audio signal is thinned out a lot when the duration of the periodicity is equal to or greater than the second reference value T2 is as follows. That is, in the portion where the vowel is extended, such as “ar”, the continuity of the periodicity is long. Therefore, in such a section, since the output voice can be heard even if the degree of thinning is large, the value α of the compression rate is made small (the thinning rate is made large).

【0051】なお、上記第2または第3実施例におい
て、周期性のない音声信号の継続長を検出する手段を付
加するとともに、周期性のない音声信号の継続長が予め
定められた所定値以上のときに、その入力音声を削除す
る手段を設けてもよい。このように、周期性のない音声
信号の継続長が予め定められた所定値以上のときに、そ
の入力音声を削除するのは、次の理由による。すなわ
ち、周期性のない音声信号の継続長が予め定められた所
定値以上のときには、その区間は人間の音声ではないと
判断できるからである。
In the second or third embodiment, means for detecting the duration of the non-periodic voice signal is added, and the duration of the non-periodic voice signal is equal to or more than a predetermined value. At this time, a means for deleting the input voice may be provided. The reason why the input voice is deleted when the duration of the voice signal having no periodicity is equal to or larger than a predetermined value is as follows. That is, when the duration of the voice signal having no periodicity is equal to or greater than a predetermined value, it can be determined that the section is not a human voice.

【0052】また、上記第2または第3実施例におい
て、周期性のない音声信号の継続長を検出する手段を付
加するとともに、周期性のない音声信号の継続長が予め
定められた所定値以上のときに、その入力音声を比較的
大きな度合いで間引くようにしてもよい。
In the second or third embodiment, means for detecting the duration of the non-periodic voice signal is added, and the duration of the non-periodic voice signal is equal to or more than a predetermined value. At that time, the input voice may be thinned out to a relatively large degree.

【0053】[0053]

【発明の効果】この発明によれば、話速変換を行ったと
きに、音声が劣化するのを防止することができる。
According to the present invention, it is possible to prevent the voice from being deteriorated when the voice speed conversion is performed.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の第1実施例である話速変換装置の概
略構成を示す構成図である。
FIG. 1 is a configuration diagram showing a schematic configuration of a speech speed conversion device according to a first embodiment of the present invention.

【図2】この発明の第2実施例である話速変換装置の概
略構成を示す構成図である。
FIG. 2 is a configuration diagram showing a schematic configuration of a speech speed conversion device which is a second embodiment of the present invention.

【図3】この発明の第3実施例である話速変換装置の概
略構成を示す構成図である。
FIG. 3 is a configuration diagram showing a schematic configuration of a speech speed conversion device which is a third embodiment of the present invention.

【図4】PICOLAを用いた時間軸圧縮伸長法を説明
するための模式図である。
FIG. 4 is a schematic diagram for explaining a time axis compression / expansion method using PICOLA.

【符号の説明】[Explanation of symbols]

11 音声信号入力部 12 周期性判定部 13 入力切り替え部 14 時間軸圧縮伸長手段 15 出力切り替え部 16 バッファ 17 音声信号出力部 21 継続長算出部 22 圧縮率調整部 23 時間軸圧縮手段 11 audio signal input unit 12 periodicity determination unit 13 input switching unit 14 time axis compression / expansion unit 15 output switching unit 16 buffer 17 audio signal output unit 21 continuation length calculation unit 22 compression ratio adjustment unit 23 time axis compression unit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 入力音声を時間軸圧縮伸長処理するため
の時間軸圧縮伸長手段を備え、入力音声の音声速度を遅
くして出力する話速変換装置において、 入力音声に周期性があるか否かを判定する手段、および
入力信号のうち、周期性があると判定された区間に対し
てのみ、時間軸圧縮伸長手段による時間軸圧縮伸長処理
を行わせる手段、 を備えていることを特徴とする話速変換装置。
1. A speech speed conversion device, comprising a time-axis compression / expansion means for performing time-axis compression / expansion processing of an input voice, wherein the voice speed of the input voice is output at a low speed, whether the input voice has periodicity or not. And a unit that causes the time-axis compression / expansion unit to perform the time-axis compression / expansion process only on the section of the input signal that is determined to have periodicity. Speak rate converter.
【請求項2】 入力音声を時間軸圧縮伸長処理するため
の時間軸圧縮伸長手段を備え、入力音声の音声速度を遅
くして出力する話速変換装置において、 入力音声に周期性があるか否かを判定する手段、 周期性があると判定されたときにその継続長を算出する
手段、および入力信号のうち、周期性の継続長が所定値
以上の区間に対してのみ、時間軸圧縮伸長手段による時
間軸圧縮伸長処理を行わせる手段、 を備えていることを特徴とする話速変換装置。
2. A speech speed conversion device, comprising a time axis compression / expansion means for performing time axis compression / expansion processing of input speech, and outputting the speech at a reduced speech speed, whether or not the input speech has periodicity. Means for determining whether or not there is periodicity, means for calculating the duration when it is determined that there is periodicity, and time-axis compression / expansion only for sections of the input signal where the duration of periodicity is greater than or equal to a predetermined value. A speech speed conversion device comprising: means for performing time-axis compression / expansion processing by means.
【請求項3】 入力音声を時間軸圧縮処理するための時
間軸圧縮手段を備え、入力音声の音声速度を遅くして出
力する話速変換装置において、 入力音声に周期性があるか否かを判定する手段、 周期性があると判定されたときにその継続長を算出する
手段、 入力信号のうち、周期性の継続長が第1の所定長未満の
区間に対しては、時間軸圧縮伸長手段による時間軸圧縮
処理を行わずに出力させる手段、 入力信号のうち、周期性の継続長が第1の所定長以上で
ありかつ第1の所定長より大きな第2の所定長未満の区
間に対しては、比較的大きな圧縮率を用いて時間軸圧縮
手段による時間軸圧縮処理を行う手段、および入力信号
のうち、周期性の継続長が第2の所定長以上である区間
に対しては、比較的小さな圧縮率を用いて時間軸圧縮手
段による時間軸圧縮処理を行う手段、 を備えている話速変換装置。
3. A speech speed conversion device, comprising a time axis compression means for time axis compression processing of input voice, and outputting the voice at a low voice speed of the input voice, wherein whether or not the input voice has periodicity is determined. Determining means, means for calculating the duration when it is determined that there is periodicity, time-axis compression / expansion for the section of the input signal where the duration of the periodicity is less than the first predetermined length Means for outputting without performing time-axis compression processing by means, in the section of the input signal in which the duration of the periodicity is greater than or equal to the first predetermined length and less than the second predetermined length that is greater than the first predetermined length. On the other hand, for the means for performing the time-axis compression processing by the time-axis compression means using a relatively large compression rate, and for the section of the input signal in which the continuity length of the periodicity is the second predetermined length or more, , Using a relatively small compression ratio, Speech speed converting device comprising: means for performing time base compression processing.
JP7095493A 1995-04-20 1995-04-20 Speech speed changing device Pending JPH08292789A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7095493A JPH08292789A (en) 1995-04-20 1995-04-20 Speech speed changing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7095493A JPH08292789A (en) 1995-04-20 1995-04-20 Speech speed changing device

Publications (1)

Publication Number Publication Date
JPH08292789A true JPH08292789A (en) 1996-11-05

Family

ID=14139132

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7095493A Pending JPH08292789A (en) 1995-04-20 1995-04-20 Speech speed changing device

Country Status (1)

Country Link
JP (1) JPH08292789A (en)

Similar Documents

Publication Publication Date Title
US6205420B1 (en) Method and device for instantly changing the speed of a speech
US5611018A (en) System for controlling voice speed of an input signal
US20080262856A1 (en) Method and system for enabling audio speed conversion
JP3220043B2 (en) Speech rate conversion method and apparatus
JPH09198089A (en) Reproduction speed converting device
JPH09152889A (en) Speech speed transformer
JP3378672B2 (en) Speech speed converter
JP3379348B2 (en) Pitch converter
JPH08292789A (en) Speech speed changing device
JP3432443B2 (en) Audio speed conversion device, audio speed conversion method, and recording medium storing program for executing audio speed conversion method
JPH09147472A (en) Video and audio reproducing device
JP3162945B2 (en) Video tape recorder
JP3357742B2 (en) Speech speed converter
JP3081469B2 (en) Speech speed converter
JP3147562B2 (en) Audio speed conversion method
JP3457393B2 (en) Speech speed conversion method
JPH09146587A (en) Speech speed changer
JP2002297200A (en) Speaking speed converting device
KR100359988B1 (en) real-time speaking rate conversion system
JP3102553B2 (en) Audio signal processing device
JP4437703B2 (en) Speech speed conversion method and apparatus
JPH10224898A (en) Hearing aid
JPH08292796A (en) Reproducing device
JPH10214098A (en) Voice converting toy
JPH06337696A (en) Device and method for controlling speed conversion