JP2001184100A - Speaking speed converting device - Google Patents

Speaking speed converting device

Info

Publication number
JP2001184100A
JP2001184100A JP36768299A JP36768299A JP2001184100A JP 2001184100 A JP2001184100 A JP 2001184100A JP 36768299 A JP36768299 A JP 36768299A JP 36768299 A JP36768299 A JP 36768299A JP 2001184100 A JP2001184100 A JP 2001184100A
Authority
JP
Japan
Prior art keywords
speech speed
period
signal
sound
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP36768299A
Other languages
Japanese (ja)
Inventor
Kotaro Machidera
侯大郎 待寺
Chikako Ohara
千賀子 大原
Yoichi Katsuki
陽一 勝木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anritsu Corp
Original Assignee
Anritsu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anritsu Corp filed Critical Anritsu Corp
Priority to JP36768299A priority Critical patent/JP2001184100A/en
Publication of JP2001184100A publication Critical patent/JP2001184100A/en
Withdrawn legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To reproduce an inputted voice signal which has arbitrary signal time length (source sound recording time) in a desirable reproduction time. SOLUTION: This device is equipped with a voice analysis part 10 which digitally analyzes a continuous voice signal, a sound-recording buffer 11 which stores the digital signal analyzed by the voice analysis part, a source sound recording time detecting means 16 which detects the source sound recording time of the continuous voice signal, a reference speaking speed multiple calculating means 18 which calculates a reference speaking speed multification M represented as the ratio of the detected source sound recording time R0 and a desirable reproduction time R1, and a signal composition part 12 which reproduces a new digital signal with a speaking speed multification Y corresponding to the previously calculated reference speaking speed multification M by compositing the digital signals outputted from the sound-recording buffer 11 responding to reproduction instructions.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は音声の話速を変更す
る話速変換装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a speech speed conversion device for changing the speech speed of voice.

【0002】[0002]

【従来の技術】例えば外国語を学習する方法として、実
際にその外国語を耳で聞いて学習する学習法が効果的で
ある。この場合、同じ会話を繰り返し聴くことが重要で
ある。したがって、外国語を聴く能力を向上させるため
に、簡便な方法として、例えば、数分〜十数分の会話又
はナレーションを録音したテープを再生して学習する。
2. Description of the Related Art For example, as a method of learning a foreign language, a learning method of actually learning by listening to the foreign language by ear is effective. In this case, it is important to listen to the same conversation repeatedly. Therefore, in order to improve the ability to listen to a foreign language, as a simple method, for example, learning is performed by playing a tape on which a conversation or a narration of several minutes to several tens of minutes has been recorded.

【0003】この場合、語学学習専用のテープレコーダ
においては、音声の再生速度を一定の範囲で可変できる
ように構成されている。
[0003] In this case, a tape recorder dedicated to language learning is configured so that the sound reproduction speed can be varied within a certain range.

【0004】また、語学学習以外にも、演説やナレーシ
ョンやニュース原稿を一旦テープレコーダに録音して、
後で再生する場合においても、再生速度を一定の範囲で
可変できることが望ましい。
[0004] In addition to language learning, speeches, narrations, and news manuscripts are temporarily recorded on a tape recorder,
Even in the case of reproducing later, it is desirable that the reproducing speed can be varied within a certain range.

【0005】しかし、ただ単に音声の再生速度を変更さ
せたのみでは、再生される音声の周波数が変化してしま
い、音声が不自然に聞こえる。
[0005] However, simply changing the reproduction speed of the sound changes the frequency of the reproduced sound, and the sound sounds unnatural.

【0006】このような不都合を解消するために、話す
速度、すなわち話速を変化させたとしても、音声の周波
数は変化せず、ただ話し方がゆっくりになったり、早口
になるのみで自然に聞こえる話速変換手法が提唱されて
いる。
[0006] Even if the speaking speed, that is, the speaking speed is changed in order to solve such inconvenience, the frequency of the voice does not change, and the sound can be heard naturally simply by slowing down the speech or making the speaker speak faster. A speech speed conversion method has been proposed.

【0007】次に、この話速変換手法を図11及び図1
2を用いて説明する。図11は、例えば「 It's diffi
cult for me to finish… 」と話した場合の音声信号
1の波形図である。図12はこの音声信号1の拡大図で
ある。周知のように、音声には子音と母音とがあり、音
声信号1にもそれに対応した子音と母音とがある。図示
するように子音は1個の無声音2で構成され、母音は複
数の有声音3で構成されている。また、音声信号1には
音声の途切れたときの無音4が存在する。
Next, FIG. 11 and FIG.
2 will be described. FIG. 11 shows, for example, “It's diffi
cult for me to finish ... ". FIG. FIG. 12 is an enlarged view of the audio signal 1. As is well known, voice has consonants and vowels, and voice signal 1 also has corresponding consonants and vowels. As shown, the consonant is composed of one unvoiced sound 2 and the vowel is composed of a plurality of voiced sounds 3. The audio signal 1 includes silence 4 when the audio is interrupted.

【0008】ここで、無声音2又は有声音3の継続期間
を有音期間5と称し、無音4の継続期間を無音期間6と
称する。
Here, the duration of the unvoiced sound 2 or the voiced sound 3 is referred to as a voiced period 5, and the duration of the silence 4 is referred to as a silent period 6.

【0009】子音を構成する無声音2は比較的高い周波
数成分を有し、母音を構成する複数の有声音3はほぼ同
一波形を有する。したがって、話速を速くするために
は、母音を構成する複数の有声音3のうちの1個又は複
数の有声音3を間引いて、間引いた有声音3の前後の有
声音3どうし、又は無声音2と有声音3、又は有声音3
と無音4とを接続する。よって、母音の継続時間を短縮
でき、結果として音声信号1の全体の時間を短くでき、
音声の周波数や音質を変更することなく話速を速くでき
る。また、無声期間6の時間を短縮することによって話
速を速くすることもできる。
The unvoiced sound 2 forming a consonant has a relatively high frequency component, and the plurality of voiced sounds 3 forming a vowel have substantially the same waveform. Therefore, in order to increase the speech speed, one or a plurality of voiced sounds 3 among the plurality of voiced sounds 3 constituting the vowel are thinned out, and the voiced sounds 3 before and after the thinned voiced sound 3 or unvoiced sounds 3 are mixed. 2 and voiced sound 3 or voiced sound 3
And silence 4 are connected. Therefore, the duration of the vowel can be shortened, and as a result, the entire time of the audio signal 1 can be shortened,
Speaking speed can be increased without changing the frequency or sound quality of the voice. In addition, by shortening the time of the silent period 6, the speech speed can be increased.

【0010】逆に、話速を遅くする場合は、母音を構成
する複数の有声音3に対して同一の有声音3を挿入して
母音の継続時間を長くすればよい。また、無声期間6の
時間を伸張することによって話速を遅くすることもでき
る。
Conversely, when the speech speed is reduced, the same voiced sound 3 may be inserted into a plurality of voiced sounds 3 constituting a vowel to extend the duration of the vowel. Further, the speech speed can be reduced by extending the time of the silent period 6.

【0011】有音期間5を短縮・伸張することによっ
て、話速変換を自動的に行うためには、音声信号1に含
まれる無声音2と有声音3と無音4とを区分けする必要
がある。この区分手法として、母音は複数の有声音3が
継続する性質を利用して、音声信号1に対して自己相関
関数を算出することにより、無声音2と有声音3との区
分け、及び各有声音3の継続時間(ピッチ)が検出す
る。
In order to automatically perform the speech speed conversion by shortening / extending the voiced period 5, it is necessary to distinguish the unvoiced sound 2, the voiced sound 3 and the voiceless sound 4 included in the voice signal 1. As a classification method, a vowel uses the property that a plurality of voiced sounds 3 continue, and calculates an autocorrelation function for the audio signal 1, thereby classifying the unvoiced sound 2 and the voiced sound 3 and each voiced sound. The duration (pitch) of 3 is detected.

【0012】そして、母音を構成する複数の有声音3の
うち何個の有声音3を間引くか、又は何個の有声音3を
挿入するかで、音声信号1の話速が定まる。
The speech speed of the voice signal 1 is determined by the number of voiced sounds 3 to be thinned out or the number of voiced sounds 3 to be inserted among a plurality of voiced sounds 3 constituting a vowel.

【0013】したがって、このような話速変換機能が組
込まれた音声再生装置を用いることにより、語学学習者
は、違和感なく、速い速度又は遅い速度で会話やナレー
ションを聴くことができる。
[0013] Therefore, by using a voice reproducing apparatus incorporating such a speech speed conversion function, a language learner can listen to conversation or narration at a high speed or a low speed without a sense of incongruity.

【0014】また、必要に応じて、違和感なく、演説や
ナレーションやニュース原稿の話速を変更できる。
Further, if necessary, the speech speed of a speech, a narration, or a news manuscript can be changed without a sense of discomfort.

【0015】[0015]

【発明が解決しようとする課題】しかしながら、上述し
た話速変換機能が組込まれた音声再生装置においても、
まだ改良すべき次のような課題があった。
However, even in a sound reproducing apparatus incorporating the above-mentioned speech speed conversion function,
There were the following issues that still need to be improved.

【0016】すなわち、講演会や放送局においては、予
め与えられた時間に合うように、演説やナレーションや
ニュース原稿が録音されている場合が多い。しかし、与
えられた時間が急に変更になる場合がしばしばある。
That is, in lectures and broadcast stations, speeches, narrations, and news manuscripts are often recorded in time with a predetermined time. However, given times often change suddenly.

【0017】しかし、上述した話速変換機能が組込まれ
た音声再生装置においては、再生される音声の話速を通
常話速に対して何%上昇させるか、又は、通常話速に対
して何%低下させるかを指示できたが、再生時間そのも
のを指定できなかった。そのために、適当に、話速倍率
を指定して、再生させていた。その結果、再生時間が与
えられた時間内に正確に収まらない問題が生じる。
However, in a voice reproducing apparatus incorporating the above-mentioned voice speed conversion function, what percentage of the voice speed of the voice to be reproduced is raised relative to the normal voice speed, Although it was possible to specify whether to reduce the playback time, the playback time itself could not be specified. For this purpose, the playback speed has been appropriately specified and reproduced. As a result, there arises a problem that the reproduction time does not exactly fit within the given time.

【0018】特に、放送局における放送時間は秒単位ま
で厳格に定められている。演説やナレーションは、たと
え圧縮・伸張しない状態においても、与えられた時間に
秒単位で収まることはない。したがって、録音時間が不
確かであるのに、適当な話速倍率を設定して、再生され
た演説やナレーションを放送時間内に秒単位まで厳格に
収めることは至難の業である。
In particular, the broadcasting time in a broadcasting station is strictly set to the second. Speech and narration, even in the uncompressed and uncompressed state, do not fit in seconds at a given time. Therefore, it is extremely difficult to set an appropriate speech rate magnification and strictly store reproduced speeches and narrations to the order of seconds within the broadcast time even though the recording time is uncertain.

【0019】本発明はこのような事情に鑑みてなされた
ものであり、希望再生時間を与えるのみで任意時間長を
有した音声信号を、違和感なく与えられた希望再生時間
で正確に再生でき、使い勝手を大幅に向上できる話速変
換装置を提供することを目的とする。
The present invention has been made in view of such circumstances, and it is possible to accurately reproduce an audio signal having an arbitrary time length at a given desired reproduction time without giving a sense of incongruity only by giving a desired reproduction time. It is an object of the present invention to provide a speech speed conversion device capable of greatly improving usability.

【0020】[0020]

【課題を解決するための手段】上記課題を解消するため
に、本発明の話速変換装置においては、連続した音声信
号をデジタル的に解析する音声解析部と、この音声解析
部で解析されたデジタル信号を記憶する録音バッファ
と、連続した音声信号の原音録音時間を検出する原音録
音時間検出手段と、この検出された原音録音時間と希望
再生時間との比で示される基準話速倍率を算出する基準
話速倍率算出手段と、再生指示に応動して、録音バッフ
ァから出力されるデジタル信号を合成して算出された基
準話速倍率に対応した話速倍率で新たなデジタル信号を
再生する信号合成部とを備えている。
SUMMARY OF THE INVENTION In order to solve the above-mentioned problems, in a speech speed conversion device according to the present invention, a voice analyzing section for digitally analyzing a continuous voice signal, and a voice analyzing section for analyzing the continuous voice signal. A recording buffer for storing a digital signal, an original sound recording time detecting means for detecting an original sound recording time of a continuous audio signal, and a reference speech speed magnification indicated by a ratio of the detected original sound recording time to a desired reproduction time. And a signal for reproducing a new digital signal at a speech rate corresponding to the reference speech rate calculated by synthesizing the digital signal output from the recording buffer in response to the playback instruction. A synthesizing unit.

【0021】また、発明の話速変換装置においては、連
続した音声信号をデジタル的に解析する音声解析部と、
この音声解析部で解析されたデジタル信号を記憶する録
音バッファと、連続した音声信号の原音録音時間を検出
する原音録音時間検出手段と、この検出された原音録音
時間と希望再生時間との比で示される基準話速倍率を算
出する基準話速倍率算出手段と、再生指示に応動して、
録音バッファから出力されるデジタル信号を合成して指
定された話速倍率で新たなデジタル信号を再生する信号
合成部と、算出された基準話速倍率に対応した話速倍率
を算出して前記信号合成部へ送出する話速算出部とを備
えている。
Further, in the speech speed conversion device of the present invention, a voice analysis unit for digitally analyzing a continuous voice signal,
A recording buffer for storing the digital signal analyzed by the audio analyzing unit, an original sound recording time detecting means for detecting an original sound recording time of a continuous audio signal, and a ratio of the detected original sound recording time to a desired reproduction time. In response to a reproduction instruction, a reference speech speed magnification calculating means for calculating the indicated reference speech speed magnification,
A signal synthesizing unit for synthesizing a digital signal output from the recording buffer to reproduce a new digital signal at a specified speech speed magnification, and calculating a speech speed ratio corresponding to the calculated reference speech speed ratio; A speech speed calculation unit for sending to the synthesis unit.

【0022】このように構成された話速変換装置におい
ては、入力された連続する音声信号は音声解析部で、例
えば有音期間、無音期間、無声音、有声音、無音等に区
分(解析)される。この音声解析部でデジタル的に解析
されたデジタル信号(デジタルの音声信号)は録音バッ
ファに記憶保持される。
In the thus constructed speech speed conversion device, the input continuous speech signal is classified (analyzed) by a speech analysis unit into, for example, a sound period, a silence period, an unvoiced sound, a voiced sound, a silence, and the like. You. A digital signal (digital audio signal) digitally analyzed by the audio analysis unit is stored and held in a recording buffer.

【0023】また、入力された連続する音声信号の信号
時間長で示される原音録音時間が検出され、例えば操作
入力された希望再生時間との比で示される基準話速倍率
が算出される。そして、この基準話速倍率から話速倍率
が算出される。ここで、話速倍率とは、速度変換を実施
していない状態の音声の話速を1(基準)とした場合の
話速の倍率である。
Also, the original sound recording time indicated by the signal time length of the input continuous audio signal is detected, and a reference speech speed magnification indicated by, for example, the ratio with the desired input reproduction time is calculated. Then, the speech speed magnification is calculated from the reference speech speed magnification. Here, the speech speed magnification is a magnification of the speech speed when the speech speed of the voice in a state where the speed conversion is not performed is set to 1 (reference).

【0024】外部から再生指示が出されると、録音バッ
ファに記憶保持されている解析されたデジタル信号(デ
ジタルの音声信号)は信号合成部にて話速算出部で指定
され話速倍率を有する新たなデジタル信号(デジタルの
音声信号)として再生される。
When a reproduction instruction is issued from the outside, the analyzed digital signal (digital audio signal) stored and held in the recording buffer is converted into a new signal having a speech speed magnification designated by the speech speed calculator in the signal synthesizer. Reproduced as a digital signal (digital audio signal).

【0025】したがって、操作者は、たとえ、入力され
た音声信号の信号時間長(原音録音時間)が不明であっ
たとしても、希望再生時間のみを指定するのみで、再生
された音声信号が希望再生時間に正確に収まる。
Therefore, even if the signal time length (original sound recording time) of the input audio signal is unknown, the operator can specify only the desired reproduction time, and the reproduced audio signal can be changed. Fits exactly in playback time.

【0026】また、別の発明の話速変換装置において
は、上述した発明の話速変換装置に対して、さらに、連
続する音声信号の累積有音期間を算出する累積有音期間
算出手段と、連続する音声信号の累積無音期間を算出す
る累積無音期間算出手段とを備えている。そして、話速
算出部は、算出された累積有音期間と累積無音期間とか
ら、有音期間の話速倍率を変更することによって基準話
速倍率が得られる有音目標話速倍率を算出して、デジタ
ル信号の有音期間に有音目標話速倍率の話速倍率を信号
合成部へ送出し、デジタルの音声信号の無音期間に期間
変更なしを信号合成部へ送出する。
According to another aspect of the present invention, there is provided a speech speed conversion device, wherein the speech speed conversion device according to the above-described invention further includes a cumulative sound period calculating means for calculating a cumulative sound period of a continuous audio signal. And a cumulative silent period calculating means for calculating a cumulative silent period of the continuous audio signal. Then, the speech speed calculation unit calculates a sound target speech speed ratio from which the reference speech speed ratio can be obtained by changing the speech speed ratio in the sound period from the calculated accumulated speech period and the accumulated silence period. Then, during the sound period of the digital signal, the speech speed magnification of the sound target speech speed ratio is sent to the signal synthesizing unit, and during the silence period of the digital audio signal, no change in the period is sent to the signal synthesizing unit.

【0027】このように構成された話速変換装置におい
ては、連続した音声信号の話速倍率を変更する手段とし
て、連続した音声信号における無音期間はそのまま変更
せずに、有音期間の時間を例えば、有声音を間引いた
り、同一有声音を付加することによって変更している。
[0027] In the speech speed conversion device thus constructed, as means for changing the speech speed magnification of the continuous voice signal, the silent period of the continuous voice signal is not changed but the time of the voice period is changed. For example, the voiced sound is changed by thinning out or adding the same voiced sound.

【0028】さらに、別の発明の話速変換装置において
は、上述した発明の話速変換装置に対して、さらに、連
続した音声信号の累積有音期間を算出する累積有音期間
算出手段と、連続した音声信号の累積無音期間を算出す
る累積無音期間算出手段とを備えている。そして、話速
算出部は、算出された累積有音期間と累積無音期間とか
ら、無音期間を変更することによって基準話速倍率が得
られる無音目標期間を算出して、デジタル信号の有音期
間に無音目標期間を信号合成部へ送出し、デジタル信号
の有音期間に1の話速倍率を信号合成部へ送出する。
Further, in the speech speed conversion device of another invention, the speech speed conversion device of the invention described above further comprises a cumulative sound period calculating means for calculating the cumulative sound period of the continuous audio signal, And a cumulative silence period calculating means for calculating a cumulative silence period of the continuous audio signal. Then, the speech speed calculation unit calculates a silence target period in which the reference speech speed magnification is obtained by changing the silence period from the calculated accumulated speech period and the accumulated silence period, and calculates the speech period of the digital signal. Then, a silent target period is sent to the signal synthesizing unit, and a speech speed magnification of 1 is sent to the signal synthesizing unit during the sound period of the digital signal.

【0029】このように構成された話速変換装置におい
ては、入力された音声信号の話速倍率を変更する手段と
して、入力された音声信号における有音期間はそのまま
変更せずに、無音期間の継続時間を圧縮又は伸張してい
る。
In the speech speed conversion device having the above-described structure, as a means for changing the speech speed magnification of the input voice signal, the voice period of the input voice signal is not changed without changing the voice period. Compressing or expanding duration.

【0030】さらに、別の発明の話速変換装置において
は、上述した発明の話速変換装置の話速算出部は、連続
した音声信号の開始時刻から規定時間経過するまでの期
間内に、時間経過に伴って予め設定された初期話速倍率
から基準話速倍率近傍の目標話速倍率まで変化させ、か
つ規定時間経過後に、目標話速倍率を維持する話速倍率
を順次算出して信号合成部へ送出する。
Further, in the speech speed conversion device according to another invention, the speech speed calculation unit of the speech speed conversion device according to the invention described above is configured such that the speech speed calculation unit sets the time within a period from the start time of the continuous audio signal until a predetermined time elapses. As the time elapses, the signal speed is changed from a preset initial speed factor to a target speed factor in the vicinity of the reference speed factor, and after a lapse of a predetermined time, the speed factor for maintaining the target speed factor is sequentially calculated to synthesize a signal. To the department.

【0031】このように構成された話速変換装置におい
ては、再生された演説やナレーションの冒頭部分のみ通
常話速に近い話速倍率で、規定時間経過後に基準話速倍
率近傍の目標話速倍率で再生される。よって、再生され
た演説やナレーションの冒頭部分を聞き逃すことはな
い。
In the thus constructed speech speed conversion device, only the beginning portion of the reproduced speech or narration has a speech speed magnification close to the normal speech speed, and after a lapse of a predetermined time, a target speech speed magnification near the reference speech speed magnification. Will be played back. Thus, the beginning of the replayed speech or narration will not be missed.

【0032】[0032]

【発明の実施の形態】以下、本発明の各実施形態を図面
を用いて説明する。 (第1実施形態)図1は本発明の第1実施形態に係る話
速変換装置の概略構成を示すブロック図である。入力端
子7に対して図11に示した音声信号1と同一構成の一
連の連続した音声信号aが入力される。したがって、こ
の音声信号aは、図12に示すように、子音に対応する
無声音2と、母音に対応する有声音3と、無音4とで構
成されている。そして、図12に示すように、無声音2
又は有声音3からなる有音期間5の継続期間をT1
し、無音4からなる無音期間6の継続期間をT0とす
る。
Embodiments of the present invention will be described below with reference to the drawings. (First Embodiment) FIG. 1 is a block diagram showing a schematic configuration of a speech speed conversion device according to a first embodiment of the present invention. A series of continuous audio signals a having the same configuration as the audio signal 1 shown in FIG. Therefore, as shown in FIG. 12, the audio signal a is composed of an unvoiced sound 2 corresponding to a consonant, a voiced sound 3 corresponding to a vowel, and a silent sound 4. Then, as shown in FIG.
Or the duration of the sound period 5 consisting voiced 3 and T 1, the duration of the silent period 6 made silent 4 and T 0.

【0033】入力端子7から入力されたアナログの音声
信号aは、A/D変換器8でデジタルの音声信号に変換
された後、音声信号メモリ9に蓄積される。音声解析部
10は、この音声信号メモリ9に書込まれた一連のデジ
タルの音声信号a1を無声音2と、有声音3と、無音4
とに区分けする。具体的には、音声信号a1の信号レベ
ルを調べて、有音期間5と無音期間6とを区分けする。
その後、各有音期間5の信号に対して自己相関解析を実
施して、この有音期間5を無声音2と有声音3とに区分
けする。音声解析部10で、無声音2と有声音3と無音
4とに区分けされた音声信号a2は一旦録音バッファ1
1へ書込まれて記憶保持される。
The analog audio signal a input from the input terminal 7 is converted into a digital audio signal by the A / D converter 8 and then stored in the audio signal memory 9. The voice analysis unit 10 converts the series of digital voice signals a 1 written in the voice signal memory 9 into the unvoiced sound 2, the voiced sound 3, and the
And is divided into Specifically, the signal level of the audio signal a 1 is checked, and the sound period 5 and the silent period 6 are classified.
After that, the autocorrelation analysis is performed on the signal of each voiced period 5 to divide the voiced period 5 into the unvoiced sound 2 and the voiced sound 3. The audio signal a 2 divided into the unvoiced sound 2, the voiced sound 3 and the silent sound 4 by the voice analysis unit 10 is temporarily stored in the recording buffer 1.
1 is written and stored.

【0034】信号合成部12は、外部から再生開始指令
が入力されると、この録音バッファ11に書込まれてい
る音声解析されたデジタルの音声信号a2を取込んで、
この取込んだ音声信号a2における有音期間5における
各母音を構成する複数の有声音3のうち、話速算出部1
9にで指定された話速倍率Yに対応した数だけ間引くか
又は追加する。また、この取込んだ音声信号a2におけ
る無音期間6の継続期間を話速算出部19にて指定され
た話速倍率Yに応じて短縮又は伸張する。そして、信号
合成部12は、入力された音声信号a2における無声音
2と、間引き又は追加後の有声音3と、短縮又は伸張さ
れた無音4とを接続して新たな音声信号a3を合成して
出力する。
When a reproduction start command is input from the outside, the signal synthesizing section 12 takes in the digitally analyzed digital audio signal a 2 written in the recording buffer 11, and
Of the plurality of voiced sounds 3 constituting each vowel in the voiced period 5 of the captured audio signal a 2, the speech speed calculation unit 1
9 is thinned out or added by the number corresponding to the speech speed magnification Y specified in 9. In addition, the duration of the silence period 6 in the captured audio signal a 2 is shortened or extended according to the speech speed magnification Y specified by the speech speed calculation unit 19. Then, the signal synthesis unit 12 connects the unvoiced sound 2 in the input audio signal a 2, the voiced sound 3 after thinning or addition, and the shortened or expanded silence 4 to synthesize a new audio signal a 3 . And output.

【0035】信号合成部12から出力された新たな音声
信号a3は出力バッファ13に一旦格納した後、D/A
変換14でアナログの音声信号a4に変換されて、出力
端子15から出力される。
The new audio signal a 3 output from the signal synthesizing unit 12 is temporarily stored in the output buffer 13 and then stored in the D / A
The signal is converted into an analog audio signal a 4 by the converter 14 and output from the output terminal 15.

【0036】したがって、出力端子15から出力された
新たなアナログの音声信号a4は、入力端子7に入力さ
れたアナログの音声信号aに対して、指定された話速倍
率Yに対する分だけ短縮又は伸張され、その分、再生さ
れた演説又はナレーションの再生時間が短縮又は伸張さ
れる。
Therefore, the new analog audio signal a 4 output from the output terminal 15 is shortened or reduced by the amount corresponding to the specified speech speed magnification Y with respect to the analog audio signal a input to the input terminal 7. The length of the expanded speech or narration is shortened or lengthened accordingly.

【0037】A/D変換器8から出力されたデジタルの
音声信号a1は音声信号メモリ9へ書込まれると共に、
録音時間検出部16へ入力される。録音時間検出部16
は、図2に示すように、入力された音声信号a(a1
の信号時間長で示される原音録音時間R0を検出して、
次の基準話速倍率算出部18へ送出する。
The digital audio signal a 1 output from the A / D converter 8 is written into the audio signal memory 9 and
It is input to the recording time detection unit 16. Recording time detector 16
Is the input audio signal a (a 1 ), as shown in FIG.
The original sound recording time R 0 indicated by the signal time length of
It is sent to the next reference speech speed magnification calculator 18.

【0038】希望再生時間入力部17は操作者が操作入
力した、図2に示す、出力端子15から出力されるアナ
ログの音声信号a4の信号時間長である再生時間RIを次
の基準話速倍率算出部18へ送出する。
The desired reproduction time input unit 17 the operator has operated the input, shown in FIG. 2, the following criteria story playback time R I is the signal duration of the audio signal a 4 analog output from the output terminal 15 It is sent to the speed magnification calculator 18.

【0039】基準話速倍率算出部18は、入力された音
声信号a(a1)の原音録音時間R0を出力される音声信
号a4の希望再生時間RIで除算した基準話速倍率Mを算
出して次の話速算出部19へ送出する。
The reference speech speed magnification calculator 18 calculates a reference speech speed ratio M by dividing the original sound recording time R 0 of the input audio signal a (a 1 ) by the desired reproduction time R I of the output audio signal a 4. Is calculated and sent to the next speech speed calculation unit 19.

【0040】M=R0/RI この第1実施形態の話速変換装置の話速算出部19は、
入力された基準話速倍率Mをそのまま話速倍率Yとし
て、信号合成部12へ送出する。
M = R 0 / R I The speech speed calculator 19 of the speech speed converter of the first embodiment is
The input reference speech speed magnification M is directly transmitted to the signal synthesizing unit 12 as the speech speed magnification Y.

【0041】Y=M 前述したように、信号合成部12は、取込んだデジタル
の音声信号a2を圧縮・伸張して話速倍率Yを有するデ
ジタルの音声信号a3として出力する。
Y = M As described above, the signal synthesizing unit 12 compresses and expands the captured digital audio signal a 2 and outputs it as a digital audio signal a 3 having a speech speed magnification Y.

【0042】このように構成された第1実施形態の話速
変換装置においては、入力端子7から入力された音声信
号aの信号時間長を示す原音録音時間R0が自動的に測
定される。そして、操作者が希望再生時間R1を操作入
力すると、基準話速倍率Mが自動的に算出されて、信号
合成部12へ話速倍率Yとして印加される。
In the speech speed conversion device of the first embodiment thus configured, the original sound recording time R 0 indicating the signal time length of the audio signal a inputted from the input terminal 7 is automatically measured. Then, when the operator inputs the desired reproduction time R 1 , the reference speech speed magnification M is automatically calculated and applied to the signal synthesizing unit 12 as the speech speed magnification Y.

【0043】したがって、操作者としては、入力された
音声信号aの原音録音時間R0に係わらず、希望再生時
間R1を操作入力のみで、高い精度の希望再生時間R1
有する音声信号a4を再生できる。
[0043] Thus, as the operator, regardless of the original sound recording time R 0 of the input speech signal a, only the operation input the desired playback time R 1, audio signal a having a desired playback time R 1 of high precision 4 can be played.

【0044】よって、放送局のように放送時間を秒単位
で制御する環境下でこの話速変換装置を使用する場合
に、高い精度の希望再生時間R1が確保されるので、こ
の話速変換装置の使い勝手を大幅に向上できる。
[0044] Therefore, when using this speech speed converting device in an environment controlled in seconds airtime as broadcasters, since high accuracy desired playback time R 1 is ensured, the speech speed conversion The usability of the device can be greatly improved.

【0045】(第2実施形態)図3は本発明の第2実施
形態に係わる話速変換装置の概略構成を示すブロック図
である。図1に示す第1実施形態の話速変換装置と同一
部分には同一符号を付して、重複する部分の詳細説明を
省略する。
(Second Embodiment) FIG. 3 is a block diagram showing a schematic configuration of a speech speed conversion device according to a second embodiment of the present invention. The same parts as those of the speech speed conversion device of the first embodiment shown in FIG. 1 are denoted by the same reference numerals, and detailed description of the overlapping parts will be omitted.

【0046】この第2実施形態の話速変換装置において
は、音声解析部10から出力された、有音期間5、無音
期間6、無声音2、有声音3、無音4に区分(解析)さ
れたデジタルの音声信号a2は順次録音バッファ11に
書込まれると共に、累積有音期間算出部20及び累積無
音期間算出部21へ入力される。
In the speech speed conversion device of the second embodiment, the speech output from the speech analyzer 10 is divided (analyzed) into a voiced period 5, a silent period 6, an unvoiced sound 2, a voiced sound 3, and a silence 4. The digital audio signal a 2 is sequentially written into the recording buffer 11 and is input to the cumulative sound period calculating unit 20 and the cumulative silent period calculating unit 21.

【0047】累積有音期間算出部20は、図2に示すよ
うに、入力された1原音録音時間R 0分の音声信号a
2(a)に含まれる全ての有音期間T1を累積した累積有
音期間TS1を算出して話速算出部19aへ送出する。同
様に、累積無音期間算出部21は、図2に示すように、
入力された1原音録音時間R0分の音声信号a2(a)に
含まれる全ての無音期間T0を累積した累積無音期間T
S0を算出して話速算出部19aへ送出する。
The cumulative sound period calculation unit 20 is configured as shown in FIG.
Thus, the input one original sound recording time R 0Minute audio signal a
TwoAll sound periods T included in (a)1Has accumulated
Sound period TS1Is calculated and sent to the speech speed calculation unit 19a. same
As shown in FIG. 2, the cumulative silence period calculation unit 21
Input original sound recording time R0Minute audio signal aTwo(A)
All included silent periods T0Cumulative silence period T
S0Is calculated and sent to the speech speed calculation unit 19a.

【0048】さらに、再生指示が入力され、信号合成部
12が録音バッファ11に記憶されたデジタルの音声信
号a2の読出しを開始すると、録音バッファ11から音
声信号a2が信号合成部12へ入力されると共に、話速
算出部19aへ入力される。したがって、話速算出部1
9aには、デジタルの音声信号a2が入力開始前に、基
準話速倍率M、累積有音期間TS1、累積無音期間TS0
が入力されている。
Further, when a reproduction instruction is input and the signal synthesizing unit 12 starts reading out the digital audio signal a 2 stored in the recording buffer 11, the audio signal a 2 is input from the recording buffer 11 to the signal synthesizing unit 12. At the same time, it is input to the speech speed calculation unit 19a. Therefore, the speech speed calculation unit 1
The 9a, the audio signal a 2 is input before the start of the digital, the reference speech rate magnification M, the cumulative voiced period T S1, accumulated silence period T S0
Is entered.

【0049】そして、この話速算出部19aは図4に示
す流れ図に従って、話速倍率Yを算出して信号合成部1
2へ送出する処理を実施する。
The speech speed calculator 19a calculates the speech speed magnification Y in accordance with the flowchart shown in FIG.
2 is executed.

【0050】前述したように、基準話速倍率M、累積有
音期間TS1、累積無音期間TS0 を取込む(P1)。次
に、有音目標話速倍率N1を算出する(P2)。この有
音目標話速倍率N1は、各無音期間TS0はそのままで、
各有音期間TS1を圧縮・伸張して希望再生時R1を得る
ために、各有音期間TS1に作用させるため話速倍率Yで
ある。この有音目標話速倍率N1は下式から導かれる。
As described above, the reference speech speed magnification M, the accumulated sound period T S1 , and the accumulated silence period T S0 are taken (P1). Then, to calculate the sound target speech speed ratio N 1 (P2). This voiced target speech speed magnification N 1 is the same as each silent period T S0 ,
The speech speed magnification Y is applied to each sound period T S1 in order to compress / expand each sound period T S1 to obtain the desired reproduction time R 1 . The voiced target speech speed ratio N 1 is derived from the following formula.

【0051】 (TS1/N1)+TS0=(TS1+TS0)/M N1=(M・TS1)/(TS1+TS0―M・TS0) そして、録音バッファ11から出力されたデジタルの音
声信号a2が入力開始されると(P3)、例えば、0.
01秒等の微小時間Δtの経過を待って(P4)、この
デジタルの音声信号a2が終了していないことを確認し
(P5)、現在時点におけるデジタルの音声信号a2
信号状態が有音期間5(T1)の場合は(P6)、先に
求めた有音目標話速倍率N1を話速倍率Yとして信号合
成部12へ送出する(P7)。Y=N1現在時点におけ
るデジタルの音声信号a2の信号状態が無音期間6
(T0)の場合は(P6)、無音期間6(T0)変更なし
指示となる、話速倍率1を話速倍率Yとして信号合成部
12へ送出する(P8)。 Y=1 そして、P5にて、デジタルの音声信号a2が終了する
と、この話速倍率算出処理を終了する。
(T S1 / N 1 ) + T S0 = (T S1 + T S0 ) / M N 1 = (M · T S1 ) / (T S1 + T S0 -M · T S0 ) and the digital audio signal a 2 is initiated input (P3), for example, 0.
After waiting for the minute time Δt of 01 seconds, etc. (P4), to confirm that the audio signal a 2 of the digital has not been completed (P5), the digital signal state of the audio signal a 2 of the present time Yes In the case of the sound period 5 (T 1 ) (P 6), the sound target speech speed magnification N 1 obtained above is transmitted to the signal synthesizing unit 12 as the speech speed magnification Y (P 7). Y = N 1 The signal state of the digital audio signal a 2 at the current time is a silent period 6
In the case of (T 0 ), (P 6), the speech speed magnification 1 is transmitted to the signal synthesizing unit 12 as the speech speed magnification Y, which is an instruction for no change in the silence period 6 (T 0 ) (P 8). Y = 1 Then, at P5, the audio signal a 2 digital is completed, ends the speech speed ratio calculation process.

【0052】このように、構成された第2実施形態の話
速変換装置においては、先に説明した第1実施形態の話
速変換装置と同様に、希望再生時間R1を指定すると、
この希望再生時間R1を有する音声信号a4を再生するこ
ことができる。
In the speech speed converter of the second embodiment configured as described above, similarly to the speech speed converter of the first embodiment described above, when the desired reproduction time R 1 is designated,
An audio signal a 4 having the desired playback time R 1 can child play.

【0053】さらに、この第2実施形態の話速変換装置
においては、話速算出部19aから、信号合成部12へ
入力される話速倍率Yは、無音期間6(T0)で1に設
定され、すなわち無音期間6(T0)変更なしに設定さ
れ、有音期間5(T1)で有音目標話速倍率N1に設定さ
れる。したがって、たとえ入力された音声信号aが大幅
に短縮又は伸張されたとしても、言葉と言葉との間の無
音期間6は変化されずに確保されるので、より自然に聞
こえる。
Further, in the speech speed conversion device of the second embodiment, the speech speed magnification Y input from the speech speed calculation unit 19a to the signal synthesis unit 12 is set to 1 during the silent period 6 (T 0 ). That is, the soundless period 6 (T 0 ) is set without change, and the sound target speech speed magnification N 1 is set in the sound period 5 (T 1 ). Therefore, even if the input audio signal a is greatly shortened or expanded, the silence period 6 between words is secured without being changed, so that it sounds more natural.

【0054】(第3実施形態)図5は本発明の第3実施
形態の話速変換装置に組込まれた話速算出部19aの話
速倍率Yの算出処理を示す流れ図である。なお、この第
3実施形態の話速変換装置のブロック構成図は、図3に
示した第2実施形態の話速変換装置のブロック構成図と
同じであるので説明を省略する。異なるところは、話速
算出部19aの話速倍率Yの算出処理内容のみである。
(Third Embodiment) FIG. 5 is a flowchart showing a process of calculating a speech speed magnification Y of a speech speed calculating unit 19a incorporated in a speech speed conversion device according to a third embodiment of the present invention. The block diagram of the speech speed converter of the third embodiment is the same as the block diagram of the speech speed converter of the second embodiment shown in FIG. The only difference is the content of the processing for calculating the speech speed magnification Y by the speech speed calculation unit 19a.

【0055】そして、第3実施形態の話速算出部19a
は図5に示す流れ図に従って、話速倍率Yを算出して信
号合成部12へ送出する処理を実施する。
Then, the speech speed calculator 19a of the third embodiment
Performs a process of calculating the speech speed magnification Y and sending it to the signal synthesizing unit 12 according to the flowchart shown in FIG.

【0056】図4と同様に、基準話速倍率M、累積有音
期間TS1、累積無音期間TS0 を取込んで(Q1)、無
音目標期間を得るための無音目標話速倍率N0を算出す
る(Q2)。この無音目標期間を得るための無音目標話
速倍率N0は、各有音期間TS 1はそのままで、各無音期
間TS0を圧縮・伸張して希望再生時R1を得るために、
各無音期間TS0に作用させるため話速倍率Yである。こ
の無音目標話速倍率N0は下式から導かれる。
As in FIG. 4, the reference speech speed magnification M, the accumulated speech period T S1 , and the accumulated silence period T S0 are taken in (Q1), and the target silence target speech speed N 0 for obtaining the target silence period is calculated. It is calculated (Q2). Silence target speech speed magnification N 0 for obtaining the silence target period, each voice period T S 1 is intact, in order to obtain a desired playback R 1 and compression and expansion of each silent period T S0,
This is the speech speed magnification Y to act on each silent period T S0 . This silent target speech speed magnification N 0 is derived from the following equation.

【0057】 TS1+(TS0/N0)=(TS1+TS0)/M N0=(M・TS0)/(TS1+TS0―M・TS1) そして、録音バッファ11から出力されたデジタルの音
声信号a2が入力開始されると(Q3)、例えば、0.
01秒等の微小時間Δtの経過を待って(Q4)、この
デジタルの音声信号a2が終了していないことを確認し
(Q5)、現在時点におけるデジタルの音声信号a2
信号状態が無音期間6(T0)の場合は(Q6)、先に
求めた無音目標話速倍率N0を話速倍率Yとして信号合
成部12へ送出する(Q7)。 Y=N0 現在時点におけるデジタルの音声信号a2の信号状態が
有音期間5(T1)の場合は(Q6)、話速倍率1を話
速倍率Yとして信号合成部12へ送出する(Q8)。 Y=1 そして、Q5にて、デジタルの音声信号a2が終了する
と、この話速倍率算出処理を終了する。
T S1 + (T S0 / N 0 ) = (T S1 + T S0 ) / M N 0 = (M · T S0 ) / (T S1 + T S0 −M · T S1 ) and output from the recording buffer 11. It has been the digital audio signal a 2 is initiated input (Q3), for example, 0.
After waiting for the minute time Δt of 01 seconds, etc. (Q4), and confirm that the audio signal a 2 of the digital has not been completed (Q5), the digital signal state of the audio signal a 2 of the present time silence In the case of the period 6 (T 0 ) (Q 6), the silence target speech speed magnification N 0 obtained above is transmitted to the signal synthesizing unit 12 as the speech speed magnification Y (Q 7). Y = N 0 digital signal state of the audio signal a 2 of the present time is in the case of voiced period 5 (T 1) (Q6) , and sends to the signal combining unit 12 speech speed ratio 1 as speech speed ratio Y ( Q8). Y = 1 Then, at Q5, when the audio signal a 2 digital is completed, ends the speech speed ratio calculation process.

【0058】このように構成された第3話速変換装置に
おいては、先に説明した第1実施形態の話速変換装置と
同様に、希望再生時間R1を指定すると、この希望再生
時間R1を有する音声信号a4を再生するこことができ
る。
In the third speech speed converter constructed as described above, when the desired playback time R 1 is designated, similarly to the speech speed converter of the first embodiment described above, the desired playback time R 1 is set. can child playing audio signal a 4 with.

【0059】さらに、この第3実施形態の話速変換装置
においては、話速算出部19aから信号合成部12へ入
力される話速倍率Yは、有音期間5(T1)で1に設定
され、無音期間6(T0)で無音目標話速倍率N0に設定
される。
Further, in the speech speed conversion device according to the third embodiment, the speech speed magnification Y input from the speech speed calculation unit 19a to the signal synthesis unit 12 is set to 1 in the sound period 5 (T 1 ). Then, in the silence period 6 (T 0 ), the silence target speech speed magnification N 0 is set.

【0060】したがって、例えば、無音期間6(T0
が多い、間延びした演説やナレーションを希望再生時間
1に短縮する場合に、この手法を採用することによっ
て、引き締まった聞き易い再生音声とすることができ
る。
Therefore, for example, the silent period 6 (T 0 )
There are many, in the case of shortening the speech and narration that was slow to the desired playback time R 1, by adopting this approach, it is possible to be that tight to hear easy playback voice.

【0061】(第4実施形態)図6は本発明の第4実施
形態の話速変換装置に組込まれた話速算出部19aから
信号合成部12へ印加される話速倍率Yの時間特性を示
す図である。なお、この第4実施形態の話速変換装置の
ブロック構成図は、図3に示した第2実施形態の話速変
換装置のブロック構成図と同じであるので説明を省略す
る。異なるところは、話速算出部19aの話速倍率Yの
算出処理内容のみである。
(Fourth Embodiment) FIG. 6 shows the time characteristic of the speech speed magnification Y applied from the speech speed calculator 19a incorporated in the speech speed converter of the fourth embodiment of the present invention to the signal synthesizer 12. FIG. The block diagram of the speech speed converter of the fourth embodiment is the same as the block diagram of the speech speed converter of the second embodiment shown in FIG. The only difference is the content of the processing for calculating the speech speed magnification Y by the speech speed calculation unit 19a.

【0062】この話速算出部19aは、図6に示すよう
に、この話速算出部19aに入力されたデジタルの音声
信号a3の開始時刻(t=0)から規定時間TB経過する
までの期間内に、時間経過に伴って予め設定された初期
話速倍率B(=1)から基準話速倍率M近傍の目標話速
倍率Nまで変化させ、かつ規定時間T経過後に、目標話
速倍率Nを維持する話速倍率Yを順次算出して信号合成
部12へ送出する。
[0062] The speech speed calculation unit 19a, as shown in FIG. 6, until the specified time T B has elapsed from the start time of the digital audio signal a 3 which is input to the speech rate calculating section 19a (t = 0) Is changed from an initial speech speed magnification B (= 1) set in advance with time to a target speech speed N near the reference speech speed M, and after a lapse of a specified time T, the target speech speed is increased. The speech speed magnification Y that maintains the magnification N is sequentially calculated and sent to the signal synthesis unit 12.

【0063】具体的には、この話速算出部19aは、図
7に示す流れ図に従って、話速倍率Yを算出して信号合
成部12へ送出する処理を実施する。
More specifically, the speech speed calculation unit 19a performs a process of calculating the speech speed magnification Y and sending it to the signal synthesis unit 12 in accordance with the flowchart shown in FIG.

【0064】先ず、基準話速倍率M、規定時間TB、原
音録音時間R0を取込んで(S1)、目標話速倍率Nを
算出する(S2)。具体的には、図6に示すように、話
速倍率Yが基準話速倍率Mを下回る面積S1と、話速倍
率Yが基準話速倍率Mを上回る面積S2とが等しくなる
ように目標話速倍率Nを算出する。
First, the reference speech speed magnification M, the specified time T B , and the original sound recording time R 0 are taken in (S1), and the target speech speed magnification N is calculated (S2). Specifically, as shown in FIG. 6, the area S 1 where the voice speed magnification Y is lower than the reference voice speed M is equal to the area S 2 where the voice speed Y exceeds the reference voice speed M. The target speech speed magnification N is calculated.

【0065】S1=(M―1)TB/2 S2=(N―M)(R0―TB) N=[(M―1)TB/2(R0―B)]+M そして、録音バッファ11から出力されたデジタルの音
声信号a2が入力開始されると、S3にて、経過時間t
を初期化する(t=0)。例えば、0.01秒等の微小
時間Δtの経過を待って(S4)、S5にて経過時間t
を更新する(t=t+Δt)。そして、更新後の経過時
間tが規定時間TB未満の場合(S6)、下式に示す話
速倍率Yの算出を行う(S7)。 Y=[(N―1)/TB]t+1 算出した話速倍率Yを信号合成部12へ送出する(S
8)。そして、S4へ戻り、次の微小時間Δtの経過を
待つ。
S 1 = (M−1) T B / 2 S 2 = (N−M) (R 0 −T B ) N = [(M−1) T B / 2 (R 0 −T B )] + M When the input of the digital audio signal a 2 output from the recording buffer 11 is started, the elapsed time t
Is initialized (t = 0). For example, after elapse of a minute time Δt such as 0.01 second (S4), the elapsed time t is determined in S5.
Is updated (t = t + Δt). When the elapsed time t after the update is less than the predetermined time T B (S6), calculates the speech speed ratio Y shown in the following equation (S7). Y = [(N−1) / T B ] t + 1 The calculated speech speed magnification Y is sent to the signal synthesis unit 12 (S
8). Then, the process returns to S4 and waits for the elapse of the next minute time Δt.

【0066】S6にて、更新後の経過時間tが規定時間
Bに達すると、目標話速倍率Y=Nを信号合成部9へ
送出する。
At S 6, when the elapsed time t after the update reaches the specified time T B , the target speech speed magnification Y = N is sent to the signal synthesizing section 9.

【0067】このように構成された第4実施形態の話速
変換装置においては、図6に示すように、時刻(経過時
間)t=0で録音バッファ11から解析済みのデジタル
の音声信号a2が信号合成部12及び話速算出部19a
へ入力開始されると、出力端子15から出力される音声
信号a4の話速は通常話速(Y=1)である。そして、
経過時間tが増加すると、話速倍率Yも増加する。
In the speech speed converter according to the fourth embodiment thus constructed, as shown in FIG. 6, a digital audio signal a 2 analyzed from the recording buffer 11 at time (elapsed time) t = 0. Is the signal synthesis unit 12 and the speech speed calculation unit 19a
If the input starts to speech speed of the speech signal a 4 output from the output terminal 15 is typically speech speed (Y = 1). And
As the elapsed time t increases, the speech speed magnification Y also increases.

【0068】そして、経過時間tが規定時間TBに達す
ると、話速倍率Yが基準話速倍率Mを若干上回る目標話
速倍率Nに達する(Y=N)。規定時間TBを経過した
後は、話速倍率Yは目標話速倍率Nを維持する。
[0068] When the elapsed time t reaches the predetermined time T B, it reaches the target speech speed ratio N over speech speed ratio Y slightly reference speech speed magnification M is (Y = N). After a lapse of specified time T B is speaking rate ratio Y maintains the target speech speed magnification N.

【0069】したがって、この第4実施形態の話速変換
装置を採用することによって、先に説明した第1実施形
態の話速変換装置と同様に、希望再生時間R1を指定す
ると、この希望再生時間R1を有する音声信号a4を再生
するこことができる。さらに、演説やナレーションの冒
頭部分のみ通常に近い話速でその後は目標話速Nの話速
なる。よって、演説やナレーションの冒頭部分を聞き逃
すことはない。
Therefore, by adopting the speech speed conversion device of the fourth embodiment, when the desired playback time R 1 is designated, as in the speech speed conversion device of the first embodiment described above, the desired playback time is designated. can child playing audio signal a 4 having a time R 1. Further, only the beginning of the speech or the narration has a speech speed close to normal, and thereafter the speech speed becomes the target speech speed N. Therefore, you will not miss the beginning of your speech or narration.

【0070】(第5実施形態)図8は本発明の第5実施
形態の話速変換装置に組込まれた話速算出部19aから
信号合成部12へ印加される話速倍率Yの時間特性を示
す図である。なお、この第5実施形態の話速変換装置の
ブロック構成図は、図3に示した第2実施形態の話速変
換装置のブロック構成図と同じであるので説明を省略す
る。異なるところは、話速算出部19aの話速倍率Yの
算出処理内容のみである。
(Fifth Embodiment) FIG. 8 shows the time characteristic of the speech speed magnification Y applied from the speech speed calculator 19a incorporated in the speech speed converter of the fifth embodiment of the present invention to the signal synthesizer 12. FIG. The block diagram of the speech speed conversion device of the fifth embodiment is the same as the block diagram of the speech speed conversion device of the second embodiment shown in FIG. The only difference is the content of the processing for calculating the speech speed magnification Y by the speech speed calculation unit 19a.

【0071】この話速算出部19aは、図8に示すよう
に、この話速算出部19aに入力されたデジタルの音声
信号a3の有音期間5(T1)の開始時刻(tS=0)か
らの経過期間tSが規定時間TB経過するまでの期間内
に、時間経過に伴って予め設定された初期話速倍率B
(=1)から基準話速倍率M近傍の目標話速倍率Nまで
変化させ、かつ規定時間TB経過後に、目標話速倍率N
を維持し、さらに、デジタルの音声信号a3が経過期間
S=tEで無音期間6(T0)に変化すると、1とな
り、次の有音期間5(T1)まで1を維持する話速倍率
Yを順次算出して信号合成部12へ送出する。但し、無
音期間6の継続期間tQがしきい値時間TSHより短い場
合は、話速倍率Yは1に戻らない。
As shown in FIG. 8, the speech speed calculating unit 19a starts the sounding period 5 (T 1 ) of the digital voice signal a 3 input to the speech speed calculating unit 19a (t S = T S ). in age period t to S defines time T B has elapsed from 0), is set in advance with time the initial speech speed ratio B
(= 1) is changed to the target speech speed magnification N of the reference speech rate ratio M vicinity of and after the predetermined time T B has elapsed, the target speech speed magnification N
Further, when the digital audio signal a 3 changes to the silent period 6 (T 0 ) during the elapsed time t S = t E, it becomes 1, and maintains 1 until the next voiced period 5 (T 1 ). The speech speed magnification Y is sequentially calculated and sent to the signal synthesizing unit 12. However, when the duration t Q of the silent period 6 is shorter than the threshold time T SH , the speech speed magnification Y does not return to 1.

【0072】具体的には、この話速算出部19aは、図
10に示す流れ図に従って、話速倍率Yを算出して信号
合成部12へ送出する処理を実施する。
More specifically, the speech speed calculation unit 19a performs a process of calculating the speech speed magnification Y and sending it to the signal synthesis unit 12 in accordance with the flowchart shown in FIG.

【0073】先ず、基準話速倍率M、規定時間TB、話
し始め話速倍率Bを取込んで(A1)、目標話速倍率N
を算出する(A2)。具体的には、図6に示すように、
話速倍率Yが基準話速倍率Mを下回る面積S1と、話速
倍率Yが基準話速倍率Mを上回る面積S2とが等しくな
るように目標話速倍率Nを算出する。なお、有音期間5
の時間長T1(tS=0〜tS=tE)は単語や文節によっ
てまちまちであるので、平均的な値を用いて目標話速倍
率Nを算出する。
First, the reference speech speed M, the specified time T B , and the speech speed B at the start of speech are taken in (A1), and the target speech speed N is obtained.
Is calculated (A2). Specifically, as shown in FIG.
The target speech speed magnification N is calculated so that an area S 1 where the speech speed magnification Y is lower than the reference speech speed magnification M is equal to an area S 2 where the speech speed magnification Y is higher than the reference speech speed magnification M. Note that the sound period 5
Since the time length T 1 (t S = 0 to t S = t E ) varies depending on the word or phrase, the target speech speed magnification N is calculated using an average value.

【0074】そして、録音バッファ11から出力された
デジタルの音声信号a2が入力開始されると、例えば、
0.01秒等の微小時間Δtの経過を待って(A3)、
A4にてデジタルの音声信号a2のその時点での解析結果
を取込む(A4)。そして、デジタルの音声信号a2
有音期間5であれば(A5)、有音期間フラグの状態を
調べる(A6)。0に解除されたままであると、今回初
めて有音期間5に入ったと判断して、A7にて、有音期
間フラグを1に設定するとともに、有音経過時間tS
初期化する(tS=0)。さらに、無音股間フラグを0
に解除する(A8)。
When the input of the digital audio signal a 2 output from the recording buffer 11 is started, for example,
After a lapse of a minute time Δt such as 0.01 second (A3),
Taking the analysis results at the time of the digital audio signal a 2 by A4 (A4). Then, if the digital audio signal a 2 has the sound period 5 (A5), the state of the sound period flag is checked (A6). If it remains released to 0, it is determined that the sound period 5 has entered for the first time this time, and the sound period flag is set to 1 at A7, and the sound elapsed time t S is initialized (t S = 0). Further, the silent crotch flag is set to 0.
(A8).

【0075】なお、A6にて、既に有音期間フラグが1
に設定されたままであると、前回以前に有音期間5に入
ったと判断して、A9にて、有音経過時間tSを更新す
る( tS=tS+Δt)。
At A6, the sound period flag is already 1
If it is still set to, it is determined that the sound period 5 has entered before the previous time, and the sound elapsed time t S is updated at A9 (t S = t S + Δt).

【0076】そして、下式で示す話速倍率Yを算出する
(A10)。
Then, the speech speed magnification Y represented by the following equation is calculated (A10).

【0077】 Y=N―(N―B)exp[―tS/(TB/5)] この算出した話速倍率Yを信号合成部12へ送出する
(A11)。そして、A3へ戻り、次の微小時間Δtが
経過するのを待つ。
Y = N− (NB) exp [−t S / (T B / 5)] The calculated speech speed magnification Y is sent to the signal synthesis unit 12 (A 11). Then, the process returns to A3 and waits for the next minute time Δt to elapse.

【0078】また、A5にて、現在時点でデジタルの音
声信号a2が有音期間5でなくて無音期間6の場合であ
れば、無音期間フラグの状態を調べる(A12)。0に
解除されたままであると、今回初めて無音期間6に入っ
たと判断して、A13にて、無音期間フラグを1に設定
するとともに、無音経過時間tQを初期化する(tQ
0)。そして、A9へ進み、有音経過時間tSを更新す
る(tS=tS+Δt)。さらに、前述した話速倍率Yを
算出して(A10)、信号合成部12へ送出する(A1
1)。そして、A3へ戻り、次の微小時間Δtが経過す
るのを待つ。
[0078] Also, at A5, in the case the digital audio signal a 2 at the current point of silent period 6 not voiced period 5, determine the status of the silent period flag (A12). If it is kept at 0, it is determined that the silence period 6 has entered for the first time this time. At A13, the silence period flag is set to 1 and the silence elapsed time t Q is initialized (t Q =
0). Then, the process proceeds to A9, and the sound elapsed time t S is updated (t S = t S + Δt). Further, the above-mentioned speech speed magnification Y is calculated (A10) and transmitted to the signal synthesizing unit 12 (A1).
1). Then, the process returns to A3 and waits for the next minute time Δt to elapse.

【0079】A12にて、既に無音期間フラグが1に設
定されたままであると、前回以前に無音期間6に入った
と判断して、A14にて、無音経過時間tQを更新する
(tQ=tQ+Δt)。そして、更新後の無音経過時間t
Qが予め設定されているしきい値TSHを超えたか否かを
調べる(A15)。
At A12, if the silent period flag is already set to 1, it is determined that the silent period 6 has been entered before the previous time, and the silent elapsed time t Q is updated at A14 (t Q = t Q + Δt). Then, the silence elapsed time t after the update
It is checked whether or not Q has exceeded a preset threshold value T SH (A15).

【0080】無音経過時間tQがしきい値時間TSHを超
えていなければ、A9へ進み、有音経過時間tSを更新
する(tS=tS+Δt)。さらに、話速倍率Yを算出し
て(A10)、信号合成部12へ送出する(A11)。
そして、A3へ戻り、次の微小時間Δtが経過するのを
待つ。
If the silence elapsed time t Q does not exceed the threshold time T SH , the process proceeds to A 9, where the speech elapsed time t S is updated (t S = t S + Δt). Further, the speech speed magnification Y is calculated (A10) and transmitted to the signal synthesizing unit 12 (A11).
Then, the process returns to A3 and waits for the next minute time Δt to elapse.

【0081】A15にて、無音経過時間tQがしきい値
時間TSHを超えると、初めて有音期間フラグを0に解除
する(A16)。そして、A3へ戻り、次の微小時間Δ
tが経過するのを待つ。
At A15, when the silence elapsed time t Q exceeds the threshold time T SH , the sound period flag is reset to 0 for the first time (A16). Then, returning to A3, the next minute time Δ
Wait for t to elapse.

【0082】このように構成された第5実施形態の話速
変換装置においては、図9に示すように、録音バッファ
11から解析済みのデジタルの音声信号a2が信号合成
部12及び話速算出部19aへ入力開始されると、出力
端子15から出力される音声信号a4の話速倍率Yは、
有音期間5(T1)が開始される毎に、通常話速に近い
話し開始話速倍率Bから、規定時間TB内に、基準話速
倍率M近傍の目標話速倍率Nまで増加し、該当有音期間
5(T1)が継続する限りは、目標話速倍率Nを維持す
る。
In the speech speed converter according to the fifth embodiment thus configured, as shown in FIG. 9, the analyzed digital audio signal a 2 is recorded from the recording buffer 11 by the signal synthesizer 12 and the speech speed calculator. If the input starts to section 19a, speech speed ratio Y of the audio signal a 4 output from the output terminal 15,
Each time the sound period 5 (T 1) is started, an increase from the start speech speed ratio B talk close to normal speech speed, a specified time T in B, until the target speech speed magnification N of the reference speech rate ratio M vicinity As long as the corresponding sound period 5 (T 1 ) continues, the target speech speed magnification N is maintained.

【0083】したがって、この第5実施形態の話速変換
装置を採用することによって、先に説明した第1実施形
態の話速変換装置と同様に、希望再生時間R1を指定す
ると、この希望再生時間R1を有する音声信号a4を再生
するこことができる。
Therefore, when the desired reproduction time R 1 is designated by adopting the speech speed conversion device of the fifth embodiment, similarly to the speech speed conversion device of the first embodiment described above, the desired reproduction time is designated. can child playing audio signal a 4 having a time R 1.

【0084】さらに、演説やナレーションにおける音声
が一定のしきい値時間TSHを超えると、話速倍率Yがほ
ぼ通常の値Bにも戻るので、次の話し始めは通常の話速
となるので、非常に聞き易くなる。
Further, when the speech in the speech or narration exceeds a certain threshold time T SH , the speech speed magnification Y returns to almost the normal value B, so that the next speech starts at the normal speech speed. , Very easy to hear.

【0085】[0085]

【発明の効果】以上説明したように、本発明の話速変換
装置においては、希望再生時間を与えるのみで任意時間
長を有した音声信号を、違和感なく与えられた希望再生
時間で正確に再生できる。したがって、使い勝手を大幅
に向上できる。
As described above, in the speech speed converter according to the present invention, an audio signal having an arbitrary time length can be accurately reproduced at a given desired reproduction time without giving a sense of incongruity only by giving a desired reproduction time. it can. Therefore, usability can be greatly improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の第1実施形態に係わる話速変換装置の
概略構成を示すブロック図
FIG. 1 is a block diagram showing a schematic configuration of a speech speed conversion device according to a first embodiment of the present invention;

【図2】録音及び再生する音声信号の信号構成を示す模
式図
FIG. 2 is a schematic diagram showing a signal configuration of an audio signal to be recorded and reproduced;

【図3】本発明の第2実施形態に係わる話速変換装置の
概略構成を示すブロック図
FIG. 3 is a block diagram showing a schematic configuration of a speech speed conversion device according to a second embodiment of the present invention.

【図4】同第2実施形態に係わる話速変換装置に組込ま
れた話速算出部の話速倍率の算出処理を示す流れ図
FIG. 4 is a flowchart showing a speech speed multiplication calculation process of a speech speed calculation unit incorporated in the speech speed conversion device according to the second embodiment;

【図5】本発明の第3実施形態に係わる話速変換装置に
組込まれた話速算出部の話速倍率の算出処理を示す流れ
FIG. 5 is a flowchart showing a process of calculating a speech speed magnification of a speech speed calculation unit incorporated in a speech speed conversion device according to a third embodiment of the present invention.

【図6】本発明の第4実施形態に係わる話速変換装置に
組込まれた話速算出部から出力された話速倍率の変化を
示す図
FIG. 6 is a diagram showing a change in a speech speed magnification output from a speech speed calculation unit incorporated in a speech speed conversion device according to a fourth embodiment of the present invention.

【図7】同第4実施形態に係わる話速変換装置に組込ま
れた話速算出部の話速倍率の算出処理を示す流れ図
FIG. 7 is a flowchart showing a speech speed multiplication calculation process of a speech speed calculation unit incorporated in the speech speed conversion device according to the fourth embodiment;

【図8】本発明の第5実施形態に係わる話速変換装置に
組込まれた話速算出部から出力された話速倍率の変化を
示す図
FIG. 8 is a diagram showing a change in a speech speed magnification output from a speech speed calculation unit incorporated in a speech speed conversion device according to a fifth embodiment of the present invention.

【図9】同じく第5実施形態に係わる話速変換装置に組
込まれた話速算出部から出力された話速倍率の変化を示
す図
FIG. 9 is a diagram showing a change in a speech speed magnification output from a speech speed calculator incorporated in the speech speed converter according to the fifth embodiment.

【図10】同第5実施形態に係わる話速変換装置に組込
まれた話速算出部の話速倍率の算出処理を示す流れ図
FIG. 10 is a flowchart showing a speech speed magnification calculation process of a speech speed calculation unit incorporated in the speech speed conversion device according to the fifth embodiment.

【図11】一般的な音声信号波形を示す図FIG. 11 is a diagram showing a general audio signal waveform.

【図12】一般的な音声信号の詳細を示す図FIG. 12 is a diagram showing details of a general audio signal.

【符号の説明】[Explanation of symbols]

2…無声音 3…有声音 4…無音 5…有音期間 5…無音期間 8…A/D変換器 9…音声信号メモリ 10…音声解析部 11…録音バッファ 12…信号合成部 13…出力バッファ 14…D/A変換器 16…録音時間検出部 17…希望再生時間入力部 18…基準話速倍率算出部 19,18a…話速算出部 20…累積有音期間算出部 21…累積無音期間算出部 2 ... unvoiced sound 3 ... voiced sound 4 ... silence 5 ... voiced period 5 ... silence period 8 ... A / D converter 9 ... audio signal memory 10 ... audio analysis unit 11 ... recording buffer 12 ... signal synthesis unit 13 ... output buffer 14 ... D / A converter 16 ... Recording time detection unit 17 ... Requested reproduction time input unit 18 ... Reference speech speed magnification calculation unit 19,18a ... Speech speed calculation unit 20 ... Cumulative sound period calculation unit 21 ... Cumulative silence period calculation unit

【手続補正書】[Procedure amendment]

【提出日】平成12年1月7日(2000.1.7)[Submission date] January 7, 2000 (2000.1.7)

【手続補正1】[Procedure amendment 1]

【補正対象書類名】図面[Document name to be amended] Drawing

【補正対象項目名】全図[Correction target item name] All figures

【補正方法】変更[Correction method] Change

【補正内容】[Correction contents]

【図1】 FIG.

【図2】 FIG. 2

【図4】 FIG. 4

【図6】 FIG. 6

【図9】 FIG. 9

【図3】 FIG. 3

【図5】 FIG. 5

【図7】 FIG. 7

【図11】 FIG. 11

【図8】 FIG. 8

【図10】 FIG. 10

【図12】 FIG.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 勝木 陽一 東京都港区南麻布五丁目10番27号 アンリ ツ株式会社内 Fターム(参考) 5D045 AA07 BA02 5D080 AA05 BA01 DA02 FA31 FA39 GA02 GA16  ────────────────────────────────────────────────── ─── Continuing on the front page (72) Inventor Yoichi Katsuki 5-10-27 Minamiazabu, Minato-ku, Tokyo Anritsu Corporation F-term (reference) 5D045 AA07 BA02 5D080 AA05 BA01 DA02 FA31 FA39 GA02 GA16

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 連続した音声信号をデジタル的に解析す
る音声解析部(10)と、 この音声解析部で解析されたデジタル信号を記憶する録
音バッファ(11)と、 前記連続した音声信号の原音録音時間を検出する原音録
音時間検出手段(16)と、 この検出された原音録音時間(R0)と希望再生時間
(R1)との比で示される基準話速倍率(M)を算出す
る基準話速倍率算出手段(18)と、 再生指示に応動して、前記録音バッファから出力される
デジタル信号を合成して前記算出された基準話速倍率
(M)に対応した話速倍率(Y)で新たなデジタル信号
を再生する信号合成部(12)とを備えたことを特徴と
する話速変換装置。
An audio analysis unit for digitally analyzing a continuous audio signal; a recording buffer for storing a digital signal analyzed by the audio analysis unit; an original sound of the continuous audio signal; the original sound recording time detecting means for detecting the recording time (16), and calculates the detected original sound recording time (R 0) and the desired playback time reference speech speed ratio represented by the ratio of (R 1) (M) A reference voice speed magnification calculating means (18); and a voice speed ratio (Y) corresponding to the calculated reference voice speed ratio (M) by synthesizing a digital signal output from the recording buffer in response to a reproduction instruction. And a signal synthesizing section (12) for reproducing a new digital signal.
【請求項2】 連続した音声信号をデジタル的に解析す
る音声解析部(10)と、 この音声解析部で解析されたデジタル信号を記憶する録
音バッファ(11)と、 前記連続した音声信号の原音録音時間を検出する原音録
音時間検出手段(16)と、 この検出された原音録音時間(R0)と希望再生時間
(R1)との比で示される基準話速倍率(M)を算出す
る基準話速倍率算出手段(18)と、 再生指示に応動して、前記録音バッファから出力される
デジタル信号を合成して指定された話速倍率(Y)で新
たなデジタル信号を再生する信号合成部(12)と、 前記算出された基準話速倍率(M)に対応した話速倍率
(Y)を算出して前記信号合成部へ送出する話速算出部
(19)とを備えたことを特徴とする話速変換装置。
2. An audio analysis unit (10) for digitally analyzing a continuous audio signal, a recording buffer (11) for storing a digital signal analyzed by the audio analysis unit, and an original sound of the continuous audio signal. the original sound recording time detecting means for detecting the recording time (16), and calculates the detected original sound recording time (R 0) and the desired playback time reference speech speed ratio represented by the ratio of (R 1) (M) Reference speech speed magnification calculating means (18), and signal synthesis for reproducing a new digital signal at a specified speech speed magnification (Y) by synthesizing digital signals output from the recording buffer in response to a reproduction instruction. Unit (12); and a speech speed calculation unit (19) that calculates a speech speed ratio (Y) corresponding to the calculated reference speech speed ratio (M) and sends the result to the signal synthesis unit. Characteristic speech speed converter.
【請求項3】 前記連続した音声信号の累積有音期間を
算出する累積有音期間算出手段(20)と、前記連続し
た音声信号の累積無音期間を算出する累積無音期間算出
手段(21)とを備え、 前記話速算出部(19a)は、前記算出された累積有音
期間と累積無音期間とから、前記有音期間の話速倍率を
変更することによって前記基準話速倍率(M)が得られ
る有音目標話速倍率(N1)を算出して、前記デジタル
信号の有音期間に前記有音目標話速倍率の話速倍率を前
記信号合成部へ送出し、前記デジタル信号の無音期間に
期間変更無しを前記信号合成部へ送出することを特徴と
する請求項2記載の話速変換装置。
3. A cumulative sound period calculating means (20) for calculating a cumulative sound period of the continuous audio signal, and a cumulative silent period calculating means (21) for calculating a cumulative silent period of the continuous audio signal. The speech speed calculation unit (19a) is configured to change the speech speed ratio of the speech period from the calculated accumulated speech period and the accumulated silence period so that the reference speech speed ratio (M) is Calculate the obtained sound target speech speed magnification (N 1 ) and send the speech speed magnification of the sound target speech speed magnification to the signal synthesizing section during the sound period of the digital signal. 3. The speech speed conversion device according to claim 2, wherein no change in period is sent to the signal synthesis unit during a period.
【請求項4】 前記連続した音声信号の累積有音期間を
算出する累積有音期間算出手段(20)と、前記連続し
た音声信号の累積無音期間を算出する累積無音期間算出
手段(21)とを備え、 前記話速算出部(19a)は、前記算出された累積有音
期間と累積無音期間とから、前記無音期間を変更するこ
とによって前記基準話速倍率(M)が得られる無音目標
期間(M0)を算出して、前記デジタル信号の有音期間
に前記無音目標期間(N0)の話速倍率を前記信号合成
部へ送出し、前記デジタル信号の有音期間に1の話速倍
率を前記信号合成部へ送出することを特徴とする請求項
2記載の話速変換装置。
4. A cumulative sound period calculating means (20) for calculating a cumulative sound period of the continuous audio signal, and a cumulative silent period calculating means (21) for calculating a cumulative silent period of the continuous audio signal. The speech speed calculation unit (19a) includes: a silence target period in which the reference speech speed magnification (M) is obtained by changing the silence period from the calculated accumulated speech period and accumulated silence period. (M 0 ) is calculated, and the speech rate magnification of the target silence period (N 0 ) is sent to the signal synthesizing section during the sound period of the digital signal, and the speech speed of 1 is output during the sound period of the digital signal. 3. The speech speed conversion device according to claim 2, wherein a magnification is transmitted to the signal synthesis unit.
【請求項5】 前記話速算出部(19a)は、前記連続
した音声信号の開始時刻から規定時間経過するまでの期
間内に、時間経過に伴って予め設定された初期話速倍率
から前記基準話速倍率近傍の目標話速倍率まで変化さ
せ、かつ前記規定時間経過後に、前記目標話速倍率を維
持する話速倍率を順次算出して前記信号合成部へ送出す
ることを特徴とする請求項2記載の話速変換装置。
5. The speech speed calculation unit (19a), based on an initial speech speed magnification set in advance as time elapses, within a period from the start time of the continuous audio signal until a specified time elapses, sets the reference value. The method according to claim 1, further comprising: changing a speech speed ratio to a target speech speed ratio in the vicinity of the speech speed ratio, and after the lapse of the prescribed time, sequentially calculating a speech speed ratio for maintaining the target speech speed ratio, and transmitting the calculated speech speed ratio to the signal synthesis unit. 2. The speech speed converter according to 2.
JP36768299A 1999-12-24 1999-12-24 Speaking speed converting device Withdrawn JP2001184100A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36768299A JP2001184100A (en) 1999-12-24 1999-12-24 Speaking speed converting device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36768299A JP2001184100A (en) 1999-12-24 1999-12-24 Speaking speed converting device

Publications (1)

Publication Number Publication Date
JP2001184100A true JP2001184100A (en) 2001-07-06

Family

ID=18489934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36768299A Withdrawn JP2001184100A (en) 1999-12-24 1999-12-24 Speaking speed converting device

Country Status (1)

Country Link
JP (1) JP2001184100A (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003200507B2 (en) * 2002-02-15 2004-04-22 Yoshikazu Kasahara Method and apparatus for rapid language acquisition
WO2006008810A1 (en) * 2004-07-21 2006-01-26 Fujitsu Limited Speed converter, speed converting method and program
JP2007298621A (en) * 2006-04-28 2007-11-15 Nippon Hoso Kyokai <Nhk> Voice data time length adjusting device and its program
JP2008058956A (en) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd Speech reproduction device
JP2008107706A (en) * 2006-10-27 2008-05-08 Yamaha Corp Speech speed conversion apparatus and program
JP2008107381A (en) * 2006-10-23 2008-05-08 Mitsubishi Electric Corp Speaking speed converting device and speaking speed converting control method
JP2010164785A (en) * 2009-01-16 2010-07-29 Konami Digital Entertainment Co Ltd Fixed time notification device, fixed time notification method, and program
CN112565880A (en) * 2020-12-28 2021-03-26 北京五街科技有限公司 Method for playing explanation videos
CN112565881A (en) * 2020-12-28 2021-03-26 北京五街科技有限公司 Self-adaptive video playing method
CN114067787A (en) * 2021-12-17 2022-02-18 广东讯飞启明科技发展有限公司 Voice speech rate self-adaptive recognition system

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2003200507B2 (en) * 2002-02-15 2004-04-22 Yoshikazu Kasahara Method and apparatus for rapid language acquisition
US7672840B2 (en) 2004-07-21 2010-03-02 Fujitsu Limited Voice speed control apparatus
WO2006008810A1 (en) * 2004-07-21 2006-01-26 Fujitsu Limited Speed converter, speed converting method and program
JP2007298621A (en) * 2006-04-28 2007-11-15 Nippon Hoso Kyokai <Nhk> Voice data time length adjusting device and its program
JP4740790B2 (en) * 2006-04-28 2011-08-03 日本放送協会 Audio data time length adjusting device and program thereof
JP2008058956A (en) * 2006-07-31 2008-03-13 Matsushita Electric Ind Co Ltd Speech reproduction device
JP2008107381A (en) * 2006-10-23 2008-05-08 Mitsubishi Electric Corp Speaking speed converting device and speaking speed converting control method
JP2008107706A (en) * 2006-10-27 2008-05-08 Yamaha Corp Speech speed conversion apparatus and program
JP2010164785A (en) * 2009-01-16 2010-07-29 Konami Digital Entertainment Co Ltd Fixed time notification device, fixed time notification method, and program
CN112565880A (en) * 2020-12-28 2021-03-26 北京五街科技有限公司 Method for playing explanation videos
CN112565881A (en) * 2020-12-28 2021-03-26 北京五街科技有限公司 Self-adaptive video playing method
CN112565881B (en) * 2020-12-28 2023-03-24 北京五街科技有限公司 Self-adaptive video playing method and system
CN112565880B (en) * 2020-12-28 2023-03-24 北京五街科技有限公司 Method and system for playing explanation videos
CN114067787A (en) * 2021-12-17 2022-02-18 广东讯飞启明科技发展有限公司 Voice speech rate self-adaptive recognition system

Similar Documents

Publication Publication Date Title
JP2955247B2 (en) Speech speed conversion method and apparatus
KR101334366B1 (en) Method and apparatus for varying audio playback speed
JP2007086316A (en) Speech synthesizer, speech synthesizing method, speech synthesizing program, and computer readable recording medium with speech synthesizing program stored therein
JP2001184100A (en) Speaking speed converting device
KR20050010927A (en) Audio signal processing apparatus
JP2008116643A (en) Audio generation apparatus
JP3378672B2 (en) Speech speed converter
JP4778402B2 (en) Pause time length calculation device, program thereof, and speech synthesizer
US7092884B2 (en) Method of nonvisual enrollment for speech recognition
JP3373933B2 (en) Speech speed converter
JP3081469B2 (en) Speech speed converter
JP2001154684A (en) Speech speed converter
JP2734028B2 (en) Audio recording device
JP4381108B2 (en) Time signal processor in speech speed converter
JP2007256815A (en) Voice-reproducing apparatus, voice-reproducing method, and voice reproduction program
KR100359988B1 (en) real-time speaking rate conversion system
JPH09146587A (en) Speech speed changer
JP3201327B2 (en) Recording and playback device
JP2007248750A (en) Speech reproduction device
JP2000162954A (en) Device for learning language and electronic apparatus provided therewith
KR20010029111A (en) Apparatus For Foreign Language Listening Aid
JPH11143496A (en) Sound recording and reproducing device
JPH04176244A (en) Sound information processor
JP2962777B2 (en) Audio signal time-base expansion / compression device
JPH08202391A (en) Speaking speed changing device

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20041214